diff --git a/.github/workflows/checks.yml b/.github/workflows/checks.yml
index e04e2803..b2a295dc 100644
--- a/.github/workflows/checks.yml
+++ b/.github/workflows/checks.yml
@@ -1,6 +1,10 @@
 on:
   workflow_call:
 
+env:
+  HF_HUB_DOWNLOAD_TIMEOUT: "60"
+  HF_HUB_ETAG_TIMEOUT: "60"
+
 jobs:
   run-checks:
     runs-on: ubuntu-latest
@@ -14,6 +18,11 @@ jobs:
       - name: Set TESSDATA_PREFIX
         run: |
           echo "TESSDATA_PREFIX=$(dpkg -L tesseract-ocr-eng | grep tessdata$)" >> "$GITHUB_ENV"
+      - name: Cache Hugging Face models
+        uses: actions/cache@v4
+        with:
+          path: ~/.cache/huggingface
+          key: huggingface-cache-py${{ matrix.python-version }}
       - uses: ./.github/actions/setup-poetry
         with:
           python-version: ${{ matrix.python-version }}
@@ -28,7 +37,7 @@ jobs:
         run: |
           for file in docs/examples/*.py; do
             # Skip batch_convert.py
-            if [[ "$(basename "$file")" =~ ^(batch_convert|minimal|export_multimodal|custom_convert|develop_picture_enrichment).py ]]; then
+            if [[ "$(basename "$file")" =~ ^(batch_convert|minimal_vlm_pipeline|minimal|export_multimodal|custom_convert|develop_picture_enrichment|rapidocr_with_custom_models|offline_convert|pictures_description|pictures_description_api).py ]]; then
                 echo "Skipping $file"
                 continue
             fi
diff --git a/.github/workflows/docs.yml b/.github/workflows/docs.yml
index 0fc3ac7a..dd976ea3 100644
--- a/.github/workflows/docs.yml
+++ b/.github/workflows/docs.yml
@@ -14,10 +14,6 @@ jobs:
         - uses: ./.github/actions/setup-poetry
         - name: Build docs
           run: poetry run mkdocs build --verbose --clean
-        - name: Make docs LLM ready
-          if: inputs.deploy
-          uses: demodrive-ai/llms-txt-action@ad720693843126e6a73910a667d0eba37c1dea4b
         - name: Build and push docs
           if: inputs.deploy
-          run: poetry run mkdocs gh-deploy --force --dirty
- 
+          run: poetry run mkdocs gh-deploy --force
diff --git a/CHANGELOG.md b/CHANGELOG.md
index 597dde6e..917b3be0 100644
--- a/CHANGELOG.md
+++ b/CHANGELOG.md
@@ -1,3 +1,134 @@
+## [v2.25.1](https://github.com/DS4SD/docling/releases/tag/v2.25.1) - 2025-03-03
+
+### Fix
+
+* Enable locks for threadsafe pdfium ([#1052](https://github.com/DS4SD/docling/issues/1052)) ([`8dc0562`](https://github.com/DS4SD/docling/commit/8dc0562542299cf972d14eeeb4393e50b589c8ad))
+* **html:** Use 'start' attribute when parsing ordered lists from HTML docs ([#1062](https://github.com/DS4SD/docling/issues/1062)) ([`de7b963`](https://github.com/DS4SD/docling/commit/de7b963b09a34916f0a8d99649269aeb37db1408))
+
+### Documentation
+
+* Improve docs on token limit warning triggered by HybridChunker ([#1077](https://github.com/DS4SD/docling/issues/1077)) ([`db3ceef`](https://github.com/DS4SD/docling/commit/db3ceefd4ae6251a97e333bcb03051698b3fa71a))
+
+## [v2.25.0](https://github.com/DS4SD/docling/releases/tag/v2.25.0) - 2025-02-26
+
+### Feature
+
+* [Experimental] Introduce VLM pipeline using HF AutoModelForVision2Seq, featuring SmolDocling model ([#1054](https://github.com/DS4SD/docling/issues/1054)) ([`3c9fe76`](https://github.com/DS4SD/docling/commit/3c9fe76b706b7714b25d49cb09050c42e3b8c849))
+* **cli:** Add option for downloading all models, refine help messages ([#1061](https://github.com/DS4SD/docling/issues/1061)) ([`ab683e4`](https://github.com/DS4SD/docling/commit/ab683e4fb6df4973d2efda04f00c269a2dc95f5b))
+
+### Fix
+
+* Vlm using artifacts path ([#1057](https://github.com/DS4SD/docling/issues/1057)) ([`e197225`](https://github.com/DS4SD/docling/commit/e1972257399151503d60b4806976c8b9b6911aa8))
+* **html:** Parse text in div elements as TextItem ([#1041](https://github.com/DS4SD/docling/issues/1041)) ([`1b0ead6`](https://github.com/DS4SD/docling/commit/1b0ead69078030a0e4d25b51450ef2aa4a2e79fc))
+
+### Documentation
+
+* Extend chunking docs, add FAQ on token limit ([#1053](https://github.com/DS4SD/docling/issues/1053)) ([`c84b973`](https://github.com/DS4SD/docling/commit/c84b973959a254db22ac9a7dc8810628e4808a2d))
+
+## [v2.24.0](https://github.com/DS4SD/docling/releases/tag/v2.24.0) - 2025-02-20
+
+### Feature
+
+* Implement new reading-order model ([#916](https://github.com/DS4SD/docling/issues/916)) ([`c93e369`](https://github.com/DS4SD/docling/commit/c93e36988f1e1e461477223143c2c1fb2162d11f))
+
+## [v2.23.1](https://github.com/DS4SD/docling/releases/tag/v2.23.1) - 2025-02-20
+
+### Fix
+
+* Runtime error when Pandas Series is not always of string type ([#1024](https://github.com/DS4SD/docling/issues/1024)) ([`6796f0a`](https://github.com/DS4SD/docling/commit/6796f0a13263281cd48712b3c71579bfd81bb0d1))
+
+### Documentation
+
+* Revamp picture description example ([#1015](https://github.com/DS4SD/docling/issues/1015)) ([`27c0400`](https://github.com/DS4SD/docling/commit/27c04007bc1be7a6f6c90aaf04ea9f4ff8eb1f3d))
+
+## [v2.23.0](https://github.com/DS4SD/docling/releases/tag/v2.23.0) - 2025-02-17
+
+### Feature
+
+* Support cuda:n GPU device allocation ([#694](https://github.com/DS4SD/docling/issues/694)) ([`77eb77b`](https://github.com/DS4SD/docling/commit/77eb77bdc2c07b632a1d171826d1855a5218399e))
+* **xml-jats:** Parse XML JATS documents ([#967](https://github.com/DS4SD/docling/issues/967)) ([`428b656`](https://github.com/DS4SD/docling/commit/428b656793cb75d108c69f20c254be7c198cee5c))
+
+### Fix
+
+* Revise DocTags, fix iterate_items to output content_layer in items ([#965](https://github.com/DS4SD/docling/issues/965)) ([`6e75f0b`](https://github.com/DS4SD/docling/commit/6e75f0b5d3ee42738a80049d4cf2fa6d34e8ab97))
+
+## [v2.22.0](https://github.com/DS4SD/docling/releases/tag/v2.22.0) - 2025-02-14
+
+### Feature
+
+* Add support for CSV input with new backend to transform CSV files to DoclingDocument ([#945](https://github.com/DS4SD/docling/issues/945)) ([`00d9405`](https://github.com/DS4SD/docling/commit/00d9405b0ac519d321ae54e8150f5facbaabbe14))
+* Introduce the enable_remote_services option to allow remote connections while processing ([#941](https://github.com/DS4SD/docling/issues/941)) ([`2716c7d`](https://github.com/DS4SD/docling/commit/2716c7d4ffb836664178178d3f8d01b7f9112595))
+* Allow artifacts_path to be defined as ENV ([#940](https://github.com/DS4SD/docling/issues/940)) ([`5101e25`](https://github.com/DS4SD/docling/commit/5101e2519e7a5bb727531b1412b1131a7cfbda52))
+
+### Fix
+
+* Update Pillow constraints ([#958](https://github.com/DS4SD/docling/issues/958)) ([`af19c03`](https://github.com/DS4SD/docling/commit/af19c03f6e5e0b24e12d6a3baac6c46a4c8b10d1))
+* Fix the initialization of the TesseractOcrModel ([#935](https://github.com/DS4SD/docling/issues/935)) ([`c47ae70`](https://github.com/DS4SD/docling/commit/c47ae700ece2ea4efee17f82e4667c1ce9a0ed2a))
+
+### Documentation
+
+* Update example Dockerfile with download CLI ([#929](https://github.com/DS4SD/docling/issues/929)) ([`7493d5b`](https://github.com/DS4SD/docling/commit/7493d5b01f8be60294afeffdfb54a62bb74bcc92))
+* Examples for picture descriptions ([#951](https://github.com/DS4SD/docling/issues/951)) ([`2d66e99`](https://github.com/DS4SD/docling/commit/2d66e99b69f39a282109c366fae3679f41c6e081))
+
+## [v2.21.0](https://github.com/DS4SD/docling/releases/tag/v2.21.0) - 2025-02-10
+
+### Feature
+
+* Add content_layer property to items to address body, furniture and other roles ([#735](https://github.com/DS4SD/docling/issues/735)) ([`cf78d5b`](https://github.com/DS4SD/docling/commit/cf78d5b7b9f12728270e673857fd299efc01a7db))
+
+## [v2.20.0](https://github.com/DS4SD/docling/releases/tag/v2.20.0) - 2025-02-07
+
+### Feature
+
+* Describe pictures using vision models ([#259](https://github.com/DS4SD/docling/issues/259)) ([`4cc6e3e`](https://github.com/DS4SD/docling/commit/4cc6e3ea5e858b367136acc729b723ea0552d22a))
+
+### Fix
+
+* Remove unused httpx ([#919](https://github.com/DS4SD/docling/issues/919)) ([`c18f47c`](https://github.com/DS4SD/docling/commit/c18f47c5c032c49bf3175aecd2236df37c0e9ae1))
+
+## [v2.19.0](https://github.com/DS4SD/docling/releases/tag/v2.19.0) - 2025-02-07
+
+### Feature
+
+* New artifacts path and CLI utility ([#876](https://github.com/DS4SD/docling/issues/876)) ([`ed74fe2`](https://github.com/DS4SD/docling/commit/ed74fe2ec0a702834f0deacfdb5717c8c587dab1))
+
+### Fix
+
+* **markdown:** Handle nested lists ([#910](https://github.com/DS4SD/docling/issues/910)) ([`90b766e`](https://github.com/DS4SD/docling/commit/90b766e2ae1695a759191df37c272efc09be5ee3))
+* Test cases for RTL programmatic PDFs and fixes for the formula model ([#903](https://github.com/DS4SD/docling/issues/903)) ([`9114ada`](https://github.com/DS4SD/docling/commit/9114ada7bc4dd45ce0046de2f9d00a80ccb25c79))
+* **msword_backend:** Handle conversion error in label parsing ([#896](https://github.com/DS4SD/docling/issues/896)) ([`722a6eb`](https://github.com/DS4SD/docling/commit/722a6eb7b994a0261312a356df80b2fced121812))
+* Enrichment models batch size and expose picture classifier ([#878](https://github.com/DS4SD/docling/issues/878)) ([`5ad6de0`](https://github.com/DS4SD/docling/commit/5ad6de05600315617b574bd12af553e00b4d316e))
+
+### Documentation
+
+* Introduce example with custom models for RapidOCR ([#874](https://github.com/DS4SD/docling/issues/874)) ([`6d3fea0`](https://github.com/DS4SD/docling/commit/6d3fea019635bd6ca94bd36c3928b28c245d638d))
+
+## [v2.18.0](https://github.com/DS4SD/docling/releases/tag/v2.18.0) - 2025-02-03
+
+### Feature
+
+* Expose equation exports ([#869](https://github.com/DS4SD/docling/issues/869)) ([`6a76b49`](https://github.com/DS4SD/docling/commit/6a76b49a4756fd00503d0baec5db8d23be8207e8))
+* Add option to define page range ([#852](https://github.com/DS4SD/docling/issues/852)) ([`70d68b6`](https://github.com/DS4SD/docling/commit/70d68b6164c6c7029b39dd65c5a278278768c381))
+* **docx:** Support of SDTs in docx backend ([#853](https://github.com/DS4SD/docling/issues/853)) ([`d727b04`](https://github.com/DS4SD/docling/commit/d727b04ad080df0b3811902059e0fe0539f7037e))
+* Python 3.13 support ([#841](https://github.com/DS4SD/docling/issues/841)) ([`4df085a`](https://github.com/DS4SD/docling/commit/4df085aa6c6f5cc043f4f7a9f0c1b4af43f95e8f))
+
+### Fix
+
+* **markdown:** Fix parsing if doc ending with table ([#873](https://github.com/DS4SD/docling/issues/873)) ([`5ac2887`](https://github.com/DS4SD/docling/commit/5ac2887e4ad52ed6e7147e3af1e3ee5eb0006a70))
+* **markdown:** Add support for HTML content ([#855](https://github.com/DS4SD/docling/issues/855)) ([`94751a7`](https://github.com/DS4SD/docling/commit/94751a78f4f61b78f64952190717440ec6d84c62))
+* **docx:** Merged table cells not properly converted ([#857](https://github.com/DS4SD/docling/issues/857)) ([`0cd81a8`](https://github.com/DS4SD/docling/commit/0cd81a81226c0d4aa4f20e4e58c3b33e4fe50ce0))
+* Processing of placeholder shapes in pptx that have text but no bbox ([#868](https://github.com/DS4SD/docling/issues/868)) ([`eff16b6`](https://github.com/DS4SD/docling/commit/eff16b62ccdb0eb764eeacee550563898784dd6a))
+* KeyError in tableformer prediction ([#854](https://github.com/DS4SD/docling/issues/854)) ([`b1cf796`](https://github.com/DS4SD/docling/commit/b1cf796730901222ad0882ff44efa0ef43a743ee))
+* Fixed docx import with headers that are also lists ([#842](https://github.com/DS4SD/docling/issues/842)) ([`2c037ae`](https://github.com/DS4SD/docling/commit/2c037ae62e123967eddf065ccb2abbaf78cdcab3))
+* Use new add_code in html backend and add more typing hints ([#850](https://github.com/DS4SD/docling/issues/850)) ([`2a1f8af`](https://github.com/DS4SD/docling/commit/2a1f8afe7e8d9d508aebcfd3998ee1625c938933))
+* **markdown:** Fix empty block handling ([#843](https://github.com/DS4SD/docling/issues/843)) ([`bccb022`](https://github.com/DS4SD/docling/commit/bccb022fc82d4d0ef2ed2d8bea5f5d8e6400c1d9))
+* Fix for the crash when encountering WMF images in pptx and docx ([#837](https://github.com/DS4SD/docling/issues/837)) ([`fea0a99`](https://github.com/DS4SD/docling/commit/fea0a99a95d97e72687f48f8174d31102655483e))
+
+### Documentation
+
+* Updated the readme with upcoming features ([#831](https://github.com/DS4SD/docling/issues/831)) ([`d7c0828`](https://github.com/DS4SD/docling/commit/d7c082894e3ef85881665d20167198adcbc1becd))
+* Add example for inspection of picture content ([#624](https://github.com/DS4SD/docling/issues/624)) ([`f9144f2`](https://github.com/DS4SD/docling/commit/f9144f2bb6b322244c9d37683dca1e537ec6d781))
+
 ## [v2.17.0](https://github.com/DS4SD/docling/releases/tag/v2.17.0) - 2025-01-28
 
 ### Feature
diff --git a/Dockerfile b/Dockerfile
index c863f1c2..d210b5ad 100644
--- a/Dockerfile
+++ b/Dockerfile
@@ -16,8 +16,7 @@ ENV TORCH_HOME=/tmp/
 
 COPY docs/examples/minimal.py /root/minimal.py
 
-RUN python -c 'from deepsearch_glm.utils.load_pretrained_models import load_pretrained_nlp_models; load_pretrained_nlp_models(verbose=True);'
-RUN python -c 'from docling.pipeline.standard_pdf_pipeline import StandardPdfPipeline; StandardPdfPipeline.download_models_hf(force=True);'
+RUN docling-tools models download
 
 # On container environments, always set a thread budget to avoid undesired thread congestion.
 ENV OMP_NUM_THREADS=4
@@ -25,3 +24,6 @@ ENV OMP_NUM_THREADS=4
 # On container shell:
 # > cd /root/
 # > python minimal.py
+
+# Running as `docker run -e DOCLING_ARTIFACTS_PATH=/root/.cache/docling/models` will use the
+# model weights included in the container image.
diff --git a/README.md b/README.md
index 5a957d60..842253e9 100644
--- a/README.md
+++ b/README.md
@@ -123,6 +123,6 @@ For individual model usage, please refer to the model licenses found in the orig
 
 Docling has been brought to you by IBM.
 
-[supported_formats]: https://ds4sd.github.io/docling/supported_formats/
+[supported_formats]: https://ds4sd.github.io/docling/usage/supported_formats/
 [docling_document]: https://ds4sd.github.io/docling/concepts/docling_document/
 [integrations]: https://ds4sd.github.io/docling/integrations/
diff --git a/docling/backend/csv_backend.py b/docling/backend/csv_backend.py
new file mode 100644
index 00000000..9097acf8
--- /dev/null
+++ b/docling/backend/csv_backend.py
@@ -0,0 +1,125 @@
+import csv
+import logging
+import warnings
+from io import BytesIO, StringIO
+from pathlib import Path
+from typing import Set, Union
+
+from docling_core.types.doc import DoclingDocument, DocumentOrigin, TableCell, TableData
+
+from docling.backend.abstract_backend import DeclarativeDocumentBackend
+from docling.datamodel.base_models import InputFormat
+from docling.datamodel.document import InputDocument
+
+_log = logging.getLogger(__name__)
+
+
+class CsvDocumentBackend(DeclarativeDocumentBackend):
+    content: StringIO
+
+    def __init__(self, in_doc: "InputDocument", path_or_stream: Union[BytesIO, Path]):
+        super().__init__(in_doc, path_or_stream)
+
+        # Load content
+        try:
+            if isinstance(self.path_or_stream, BytesIO):
+                self.content = StringIO(self.path_or_stream.getvalue().decode("utf-8"))
+            elif isinstance(self.path_or_stream, Path):
+                self.content = StringIO(self.path_or_stream.read_text("utf-8"))
+            self.valid = True
+        except Exception as e:
+            raise RuntimeError(
+                f"CsvDocumentBackend could not load document with hash {self.document_hash}"
+            ) from e
+        return
+
+    def is_valid(self) -> bool:
+        return self.valid
+
+    @classmethod
+    def supports_pagination(cls) -> bool:
+        return False
+
+    def unload(self):
+        if isinstance(self.path_or_stream, BytesIO):
+            self.path_or_stream.close()
+        self.path_or_stream = None
+
+    @classmethod
+    def supported_formats(cls) -> Set[InputFormat]:
+        return {InputFormat.CSV}
+
+    def convert(self) -> DoclingDocument:
+        """
+        Parses the CSV data into a structured document model.
+        """
+
+        # Detect CSV dialect
+        head = self.content.readline()
+        dialect = csv.Sniffer().sniff(head, ",;\t|:")
+        _log.info(f'Parsing CSV with delimiter: "{dialect.delimiter}"')
+        if not dialect.delimiter in {",", ";", "\t", "|", ":"}:
+            raise RuntimeError(
+                f"Cannot convert csv with unknown delimiter {dialect.delimiter}."
+            )
+
+        # Parce CSV
+        self.content.seek(0)
+        result = csv.reader(self.content, dialect=dialect, strict=True)
+        self.csv_data = list(result)
+        _log.info(f"Detected {len(self.csv_data)} lines")
+
+        # Ensure uniform column length
+        expected_length = len(self.csv_data[0])
+        is_uniform = all(len(row) == expected_length for row in self.csv_data)
+        if not is_uniform:
+            warnings.warn(
+                f"Inconsistent column lengths detected in CSV data. "
+                f"Expected {expected_length} columns, but found rows with varying lengths. "
+                f"Ensure all rows have the same number of columns."
+            )
+
+        # Parse the CSV into a structured document model
+        origin = DocumentOrigin(
+            filename=self.file.name or "file.csv",
+            mimetype="text/csv",
+            binary_hash=self.document_hash,
+        )
+
+        doc = DoclingDocument(name=self.file.stem or "file.csv", origin=origin)
+
+        if self.is_valid():
+            # Convert CSV data to table
+            if self.csv_data:
+                num_rows = len(self.csv_data)
+                num_cols = max(len(row) for row in self.csv_data)
+
+                table_data = TableData(
+                    num_rows=num_rows,
+                    num_cols=num_cols,
+                    table_cells=[],
+                )
+
+                # Convert each cell to TableCell
+                for row_idx, row in enumerate(self.csv_data):
+                    for col_idx, cell_value in enumerate(row):
+                        cell = TableCell(
+                            text=str(cell_value),
+                            row_span=1,  # CSV doesn't support merged cells
+                            col_span=1,
+                            start_row_offset_idx=row_idx,
+                            end_row_offset_idx=row_idx + 1,
+                            start_col_offset_idx=col_idx,
+                            end_col_offset_idx=col_idx + 1,
+                            col_header=row_idx == 0,  # First row as header
+                            row_header=False,
+                        )
+                        table_data.table_cells.append(cell)
+
+                doc.add_table(data=table_data)
+        else:
+            raise RuntimeError(
+                f"Cannot convert doc with {self.document_hash} because the backend failed to init."
+            )
+
+        return doc
diff --git a/docling/backend/docling_parse_v2_backend.py b/docling/backend/docling_parse_v2_backend.py
index 27a368f9..9178883f 100644
--- a/docling/backend/docling_parse_v2_backend.py
+++ b/docling/backend/docling_parse_v2_backend.py
@@ -12,6 +12,7 @@ from pypdfium2 import PdfPage
 
 from docling.backend.pdf_backend import PdfDocumentBackend, PdfPageBackend
 from docling.datamodel.base_models import Cell, Size
+from docling.utils.locks import pypdfium2_lock
 
 if TYPE_CHECKING:
     from docling.datamodel.document import InputDocument
@@ -182,20 +183,24 @@ class DoclingParseV2PageBackend(PdfPageBackend):
             padbox.r = page_size.width - padbox.r
             padbox.t = page_size.height - padbox.t
 
-        image = (
-            self._ppage.render(
-                scale=scale * 1.5,
-                rotation=0,  # no additional rotation
-                crop=padbox.as_tuple(),
-            )
-            .to_pil()
-            .resize(size=(round(cropbox.width * scale), round(cropbox.height * scale)))
-        )  # We resize the image from 1.5x the given scale to make it sharper.
+        with pypdfium2_lock:
+            image = (
+                self._ppage.render(
+                    scale=scale * 1.5,
+                    rotation=0,  # no additional rotation
+                    crop=padbox.as_tuple(),
+                )
+                .to_pil()
+                .resize(
+                    size=(round(cropbox.width * scale), round(cropbox.height * scale))
+                )
+            )  # We resize the image from 1.5x the given scale to make it sharper.
 
         return image
 
     def get_size(self) -> Size:
-        return Size(width=self._ppage.get_width(), height=self._ppage.get_height())
+        with pypdfium2_lock:
+            return Size(width=self._ppage.get_width(), height=self._ppage.get_height())
 
     def unload(self):
         self._ppage = None
@@ -206,23 +211,24 @@ class DoclingParseV2DocumentBackend(PdfDocumentBackend):
     def __init__(self, in_doc: "InputDocument", path_or_stream: Union[BytesIO, Path]):
         super().__init__(in_doc, path_or_stream)
 
-        self._pdoc = pdfium.PdfDocument(self.path_or_stream)
-        self.parser = pdf_parser_v2("fatal")
+        with pypdfium2_lock:
+            self._pdoc = pdfium.PdfDocument(self.path_or_stream)
+            self.parser = pdf_parser_v2("fatal")
 
-        success = False
-        if isinstance(self.path_or_stream, BytesIO):
-            success = self.parser.load_document_from_bytesio(
-                self.document_hash, self.path_or_stream
-            )
-        elif isinstance(self.path_or_stream, Path):
-            success = self.parser.load_document(
-                self.document_hash, str(self.path_or_stream)
-            )
+            success = False
+            if isinstance(self.path_or_stream, BytesIO):
+                success = self.parser.load_document_from_bytesio(
+                    self.document_hash, self.path_or_stream
+                )
+            elif isinstance(self.path_or_stream, Path):
+                success = self.parser.load_document(
+                    self.document_hash, str(self.path_or_stream)
+                )
 
-        if not success:
-            raise RuntimeError(
-                f"docling-parse v2 could not load document {self.document_hash}."
-            )
+            if not success:
+                raise RuntimeError(
+                    f"docling-parse v2 could not load document {self.document_hash}."
+                )
 
     def page_count(self) -> int:
         # return len(self._pdoc)  # To be replaced with docling-parse API
@@ -236,9 +242,10 @@ class DoclingParseV2DocumentBackend(PdfDocumentBackend):
         return len_2
 
     def load_page(self, page_no: int) -> DoclingParseV2PageBackend:
-        return DoclingParseV2PageBackend(
-            self.parser, self.document_hash, page_no, self._pdoc[page_no]
-        )
+        with pypdfium2_lock:
+            return DoclingParseV2PageBackend(
+                self.parser, self.document_hash, page_no, self._pdoc[page_no]
+            )
 
     def is_valid(self) -> bool:
         return self.page_count() > 0
@@ -246,5 +253,6 @@ class DoclingParseV2DocumentBackend(PdfDocumentBackend):
     def unload(self):
         super().unload()
         self.parser.unload_document(self.document_hash)
-        self._pdoc.close()
-        self._pdoc = None
+        with pypdfium2_lock:
+            self._pdoc.close()
+            self._pdoc = None
diff --git a/docling/backend/html_backend.py b/docling/backend/html_backend.py
index 286dfbfa..d14b422f 100644
--- a/docling/backend/html_backend.py
+++ b/docling/backend/html_backend.py
@@ -1,17 +1,22 @@
 import logging
 from io import BytesIO
 from pathlib import Path
-from typing import Optional, Set, Union
+from typing import Final, Optional, Union, cast
 
-from bs4 import BeautifulSoup, Tag
+from bs4 import BeautifulSoup, NavigableString, PageElement, Tag
+from bs4.element import PreformattedString
 from docling_core.types.doc import (
+    DocItem,
     DocItemLabel,
     DoclingDocument,
     DocumentOrigin,
+    GroupItem,
     GroupLabel,
     TableCell,
     TableData,
 )
+from docling_core.types.doc.document import ContentLayer
+from typing_extensions import override
 
 from docling.backend.abstract_backend import DeclarativeDocumentBackend
 from docling.datamodel.base_models import InputFormat
@@ -19,21 +24,38 @@ from docling.datamodel.document import InputDocument
 
 _log = logging.getLogger(__name__)
 
+# tags that generate NodeItem elements
+TAGS_FOR_NODE_ITEMS: Final = [
+    "h1",
+    "h2",
+    "h3",
+    "h4",
+    "h5",
+    "h6",
+    "p",
+    "pre",
+    "ul",
+    "ol",
+    "li",
+    "table",
+    "figure",
+    "img",
+]
+
 
 class HTMLDocumentBackend(DeclarativeDocumentBackend):
+    @override
     def __init__(self, in_doc: "InputDocument", path_or_stream: Union[BytesIO, Path]):
         super().__init__(in_doc, path_or_stream)
-        _log.debug("About to init HTML backend...")
         self.soup: Optional[Tag] = None
         # HTML file:
         self.path_or_stream = path_or_stream
         # Initialise the parents for the hierarchy
         self.max_levels = 10
         self.level = 0
-        self.parents = {}  # type: ignore
+        self.parents: dict[int, Optional[Union[DocItem, GroupItem]]] = {}
         for i in range(0, self.max_levels):
             self.parents[i] = None
-        self.labels = {}  # type: ignore
 
         try:
             if isinstance(self.path_or_stream, BytesIO):
@@ -45,16 +67,20 @@ class HTMLDocumentBackend(DeclarativeDocumentBackend):
                     self.soup = BeautifulSoup(html_content, "html.parser")
         except Exception as e:
             raise RuntimeError(
-                f"Could not initialize HTML backend for file with hash {self.document_hash}."
+                "Could not initialize HTML backend for file with "
+                f"hash {self.document_hash}."
             ) from e
 
+    @override
     def is_valid(self) -> bool:
         return self.soup is not None
 
     @classmethod
+    @override
     def supports_pagination(cls) -> bool:
         return False
 
+    @override
     def unload(self):
         if isinstance(self.path_or_stream, BytesIO):
             self.path_or_stream.close()
@@ -62,9 +88,11 @@ class HTMLDocumentBackend(DeclarativeDocumentBackend):
         self.path_or_stream = None
 
     @classmethod
-    def supported_formats(cls) -> Set[InputFormat]:
+    @override
+    def supported_formats(cls) -> set[InputFormat]:
         return {InputFormat.HTML}
 
+    @override
     def convert(self) -> DoclingDocument:
         # access self.path_or_stream to load stuff
         origin = DocumentOrigin(
@@ -80,107 +108,116 @@ class HTMLDocumentBackend(DeclarativeDocumentBackend):
             assert self.soup is not None
             content = self.soup.body or self.soup
             # Replace <br> tags with newline characters
-            for br in content.find_all("br"):
-                br.replace_with("\n")
-            doc = self.walk(content, doc)
+            # TODO: remove style to avoid losing text from tags like i, b, span, ...
+            for br in content("br"):
+                br.replace_with(NavigableString("\n"))
+
+            headers = content.find(["h1", "h2", "h3", "h4", "h5", "h6"])
+            self.content_layer = (
+                ContentLayer.BODY if headers is None else ContentLayer.FURNITURE
+            )
+            self.walk(content, doc)
         else:
             raise RuntimeError(
-                f"Cannot convert doc with {self.document_hash} because the backend failed to init."
+                f"Cannot convert doc with {self.document_hash} because the backend "
+                "failed to init."
             )
         return doc
 
-    def walk(self, element: Tag, doc: DoclingDocument):
-        try:
-            # Iterate over elements in the body of the document
-            for idx, element in enumerate(element.children):
+    def walk(self, tag: Tag, doc: DoclingDocument) -> None:
+
+        # Iterate over elements in the body of the document
+        text: str = ""
+        for element in tag.children:
+            if isinstance(element, Tag):
                 try:
-                    self.analyse_element(element, idx, doc)
+                    self.analyze_tag(cast(Tag, element), doc)
                 except Exception as exc_child:
-
-                    _log.error(" -> error treating child: ", exc_child)
-                    _log.error(" => element: ", element, "\n")
+                    _log.error(
+                        f"Error processing child from tag{tag.name}: {exc_child}"
+                    )
                     raise exc_child
+            elif isinstance(element, NavigableString) and not isinstance(
+                element, PreformattedString
+            ):
+                # Floating text outside paragraphs or analyzed tags
+                text += element
+                siblings: list[Tag] = [
+                    item for item in element.next_siblings if isinstance(item, Tag)
+                ]
+                if element.next_sibling is None or any(
+                    [item.name in TAGS_FOR_NODE_ITEMS for item in siblings]
+                ):
+                    text = text.strip()
+                    if text and tag.name in ["div"]:
+                        doc.add_text(
+                            parent=self.parents[self.level],
+                            label=DocItemLabel.TEXT,
+                            text=text,
+                            content_layer=self.content_layer,
+                        )
+                    text = ""
 
-        except Exception as exc:
-            pass
+        return
 
-        return doc
-
-    def analyse_element(self, element: Tag, idx: int, doc: DoclingDocument):
-        """
-        if element.name!=None:
-            _log.debug("\t"*self.level, idx, "\t", f"{element.name} ({self.level})")
-        """
-
-        if element.name in self.labels:
-            self.labels[element.name] += 1
+    def analyze_tag(self, tag: Tag, doc: DoclingDocument) -> None:
+        if tag.name in ["h1", "h2", "h3", "h4", "h5", "h6"]:
+            self.handle_header(tag, doc)
+        elif tag.name in ["p"]:
+            self.handle_paragraph(tag, doc)
+        elif tag.name in ["pre"]:
+            self.handle_code(tag, doc)
+        elif tag.name in ["ul", "ol"]:
+            self.handle_list(tag, doc)
+        elif tag.name in ["li"]:
+            self.handle_list_item(tag, doc)
+        elif tag.name == "table":
+            self.handle_table(tag, doc)
+        elif tag.name == "figure":
+            self.handle_figure(tag, doc)
+        elif tag.name == "img":
+            self.handle_image(tag, doc)
         else:
-            self.labels[element.name] = 1
+            self.walk(tag, doc)
 
-        if element.name in ["h1", "h2", "h3", "h4", "h5", "h6"]:
-            self.handle_header(element, idx, doc)
-        elif element.name in ["p"]:
-            self.handle_paragraph(element, idx, doc)
-        elif element.name in ["pre"]:
-            self.handle_code(element, idx, doc)
-        elif element.name in ["ul", "ol"]:
-            self.handle_list(element, idx, doc)
-        elif element.name in ["li"]:
-            self.handle_listitem(element, idx, doc)
-        elif element.name == "table":
-            self.handle_table(element, idx, doc)
-        elif element.name == "figure":
-            self.handle_figure(element, idx, doc)
-        elif element.name == "img":
-            self.handle_image(element, idx, doc)
-        else:
-            self.walk(element, doc)
+    def get_text(self, item: PageElement) -> str:
+        """Get the text content of a tag."""
+        parts: list[str] = self.extract_text_recursively(item)
 
-    def get_direct_text(self, item: Tag):
-        """Get the direct text of the <li> element (ignoring nested lists)."""
-        text = item.find(string=True, recursive=False)
-        if isinstance(text, str):
-            return text.strip()
-
-        return ""
+        return "".join(parts) + " "
 
     # Function to recursively extract text from all child nodes
-    def extract_text_recursively(self, item: Tag):
-        result = []
+    def extract_text_recursively(self, item: PageElement) -> list[str]:
+        result: list[str] = []
 
-        if isinstance(item, str):
+        if isinstance(item, NavigableString):
             return [item]
 
-        if item.name not in ["ul", "ol"]:
-            try:
-                # Iterate over the children (and their text and tails)
-                for child in item:
-                    try:
-                        # Recursively get the child's text content
-                        result.extend(self.extract_text_recursively(child))
-                    except:
-                        pass
-            except:
-                _log.warn("item has no children")
-                pass
+        tag = cast(Tag, item)
+        if tag.name not in ["ul", "ol"]:
+            for child in tag:
+                # Recursively get the child's text content
+                result.extend(self.extract_text_recursively(child))
 
-        return "".join(result) + " "
+        return ["".join(result) + " "]
 
-    def handle_header(self, element: Tag, idx: int, doc: DoclingDocument):
+    def handle_header(self, element: Tag, doc: DoclingDocument) -> None:
         """Handles header tags (h1, h2, etc.)."""
         hlevel = int(element.name.replace("h", ""))
-        slevel = hlevel - 1
-
-        label = DocItemLabel.SECTION_HEADER
         text = element.text.strip()
 
         if hlevel == 1:
-            for key, val in self.parents.items():
+            self.content_layer = ContentLayer.BODY
+
+            for key in self.parents.keys():
                 self.parents[key] = None
 
             self.level = 1
             self.parents[self.level] = doc.add_text(
-                parent=self.parents[0], label=DocItemLabel.TITLE, text=text
+                parent=self.parents[0],
+                label=DocItemLabel.TITLE,
+                text=text,
+                content_layer=self.content_layer,
             )
         else:
             if hlevel > self.level:
@@ -191,13 +228,14 @@ class HTMLDocumentBackend(DeclarativeDocumentBackend):
                         name=f"header-{i}",
                         label=GroupLabel.SECTION,
                         parent=self.parents[i - 1],
+                        content_layer=self.content_layer,
                     )
                 self.level = hlevel
 
             elif hlevel < self.level:
 
                 # remove the tail
-                for key, val in self.parents.items():
+                for key in self.parents.keys():
                     if key > hlevel:
                         self.parents[key] = None
                 self.level = hlevel
@@ -206,42 +244,58 @@ class HTMLDocumentBackend(DeclarativeDocumentBackend):
                 parent=self.parents[hlevel - 1],
                 text=text,
                 level=hlevel,
+                content_layer=self.content_layer,
             )
 
-    def handle_code(self, element: Tag, idx: int, doc: DoclingDocument):
+    def handle_code(self, element: Tag, doc: DoclingDocument) -> None:
         """Handles monospace code snippets (pre)."""
         if element.text is None:
             return
         text = element.text.strip()
-        label = DocItemLabel.CODE
-        if len(text) == 0:
-            return
-        doc.add_code(parent=self.parents[self.level], text=text)
+        if text:
+            doc.add_code(
+                parent=self.parents[self.level],
+                text=text,
+                content_layer=self.content_layer,
+            )
 
-    def handle_paragraph(self, element: Tag, idx: int, doc: DoclingDocument):
+    def handle_paragraph(self, element: Tag, doc: DoclingDocument) -> None:
         """Handles paragraph tags (p)."""
         if element.text is None:
             return
         text = element.text.strip()
-        label = DocItemLabel.PARAGRAPH
-        if len(text) == 0:
-            return
-        doc.add_text(parent=self.parents[self.level], label=label, text=text)
+        if text:
+            doc.add_text(
+                parent=self.parents[self.level],
+                label=DocItemLabel.TEXT,
+                text=text,
+                content_layer=self.content_layer,
+            )
 
-    def handle_list(self, element: Tag, idx: int, doc: DoclingDocument):
+    def handle_list(self, element: Tag, doc: DoclingDocument) -> None:
         """Handles list tags (ul, ol) and their list items."""
 
         if element.name == "ul":
             # create a list group
             self.parents[self.level + 1] = doc.add_group(
-                parent=self.parents[self.level], name="list", label=GroupLabel.LIST
+                parent=self.parents[self.level],
+                name="list",
+                label=GroupLabel.LIST,
+                content_layer=self.content_layer,
             )
         elif element.name == "ol":
+            start_attr = element.get("start")
+            start: int = (
+                int(start_attr)
+                if isinstance(start_attr, str) and start_attr.isnumeric()
+                else 1
+            )
             # create a list group
             self.parents[self.level + 1] = doc.add_group(
                 parent=self.parents[self.level],
-                name="ordered list",
+                name="ordered list" + (f" start {start}" if start != 1 else ""),
                 label=GroupLabel.ORDERED_LIST,
+                content_layer=self.content_layer,
             )
         self.level += 1
 
@@ -250,25 +304,36 @@ class HTMLDocumentBackend(DeclarativeDocumentBackend):
         self.parents[self.level + 1] = None
         self.level -= 1
 
-    def handle_listitem(self, element: Tag, idx: int, doc: DoclingDocument):
-        """Handles listitem tags (li)."""
-        nested_lists = element.find(["ul", "ol"])
+    def handle_list_item(self, element: Tag, doc: DoclingDocument) -> None:
+        """Handles list item tags (li)."""
+        nested_list = element.find(["ul", "ol"])
 
-        parent_list_label = self.parents[self.level].label
-        index_in_list = len(self.parents[self.level].children) + 1
+        parent = self.parents[self.level]
+        if parent is None:
+            _log.debug(f"list-item has no parent in DoclingDocument: {element}")
+            return
+        parent_label: str = parent.label
+        index_in_list = len(parent.children) + 1
+        if (
+            parent_label == GroupLabel.ORDERED_LIST
+            and isinstance(parent, GroupItem)
+            and parent.name
+        ):
+            start_in_list: str = parent.name.split(" ")[-1]
+            start: int = int(start_in_list) if start_in_list.isnumeric() else 1
+            index_in_list += start - 1
 
-        if nested_lists:
-            name = element.name
+        if nested_list:
             # Text in list item can be hidden within hierarchy, hence
             # we need to extract it recursively
-            text = self.extract_text_recursively(element)
+            text: str = self.get_text(element)
             # Flatten text, remove break lines:
             text = text.replace("\n", "").replace("\r", "")
             text = " ".join(text.split()).strip()
 
             marker = ""
             enumerated = False
-            if parent_list_label == GroupLabel.ORDERED_LIST:
+            if parent_label == GroupLabel.ORDERED_LIST:
                 marker = str(index_in_list)
                 enumerated = True
 
@@ -278,7 +343,8 @@ class HTMLDocumentBackend(DeclarativeDocumentBackend):
                     text=text,
                     enumerated=enumerated,
                     marker=marker,
-                    parent=self.parents[self.level],
+                    parent=parent,
+                    content_layer=self.content_layer,
                 )
                 self.level += 1
 
@@ -287,74 +353,95 @@ class HTMLDocumentBackend(DeclarativeDocumentBackend):
             self.parents[self.level + 1] = None
             self.level -= 1
 
-        elif isinstance(element.text, str):
+        elif element.text.strip():
             text = element.text.strip()
 
             marker = ""
             enumerated = False
-            if parent_list_label == GroupLabel.ORDERED_LIST:
+            if parent_label == GroupLabel.ORDERED_LIST:
                 marker = f"{str(index_in_list)}."
                 enumerated = True
             doc.add_list_item(
                 text=text,
                 enumerated=enumerated,
                 marker=marker,
-                parent=self.parents[self.level],
+                parent=parent,
+                content_layer=self.content_layer,
             )
         else:
-            _log.warn("list-item has no text: ", element)
-
-    def handle_table(self, element: Tag, idx: int, doc: DoclingDocument):
-        """Handles table tags."""
+            _log.debug(f"list-item has no text: {element}")
 
+    @staticmethod
+    def parse_table_data(element: Tag) -> Optional[TableData]:
         nested_tables = element.find("table")
         if nested_tables is not None:
-            _log.warn("detected nested tables: skipping for now")
-            return
+            _log.debug("Skipping nested table.")
+            return None
 
         # Count the number of rows (number of <tr> elements)
-        num_rows = len(element.find_all("tr"))
+        num_rows = len(element("tr"))
 
         # Find the number of columns (taking into account colspan)
         num_cols = 0
-        for row in element.find_all("tr"):
+        for row in element("tr"):
             col_count = 0
-            for cell in row.find_all(["td", "th"]):
-                colspan = int(cell.get("colspan", 1))
+            if not isinstance(row, Tag):
+                continue
+            for cell in row(["td", "th"]):
+                if not isinstance(row, Tag):
+                    continue
+                val = cast(Tag, cell).get("colspan", "1")
+                colspan = int(val) if (isinstance(val, str) and val.isnumeric()) else 1
                 col_count += colspan
             num_cols = max(num_cols, col_count)
 
-        grid = [[None for _ in range(num_cols)] for _ in range(num_rows)]
+        grid: list = [[None for _ in range(num_cols)] for _ in range(num_rows)]
 
         data = TableData(num_rows=num_rows, num_cols=num_cols, table_cells=[])
 
         # Iterate over the rows in the table
-        for row_idx, row in enumerate(element.find_all("tr")):
+        for row_idx, row in enumerate(element("tr")):
+            if not isinstance(row, Tag):
+                continue
 
             # For each row, find all the column cells (both <td> and <th>)
-            cells = row.find_all(["td", "th"])
+            cells = row(["td", "th"])
 
             # Check if each cell in the row is a header -> means it is a column header
             col_header = True
-            for j, html_cell in enumerate(cells):
-                if html_cell.name == "td":
+            for html_cell in cells:
+                if isinstance(html_cell, Tag) and html_cell.name == "td":
                     col_header = False
 
+            # Extract the text content of each cell
             col_idx = 0
-            # Extract and print the text content of each cell
-            for _, html_cell in enumerate(cells):
+            for html_cell in cells:
+                if not isinstance(html_cell, Tag):
+                    continue
 
+                # extract inline formulas
+                for formula in html_cell("inline-formula"):
+                    math_parts = formula.text.split("$$")
+                    if len(math_parts) == 3:
+                        math_formula = f"$${math_parts[1]}$$"
+                        formula.replace_with(NavigableString(math_formula))
+
+                # TODO: extract content correctly from table-cells with lists
                 text = html_cell.text
-                try:
-                    text = self.extract_table_cell_text(html_cell)
-                except Exception as exc:
-                    _log.warn("exception: ", exc)
-                    exit(-1)
 
                 # label = html_cell.name
-
-                col_span = int(html_cell.get("colspan", 1))
-                row_span = int(html_cell.get("rowspan", 1))
+                col_val = html_cell.get("colspan", "1")
+                col_span = (
+                    int(col_val)
+                    if isinstance(col_val, str) and col_val.isnumeric()
+                    else 1
+                )
+                row_val = html_cell.get("rowspan", "1")
+                row_span = (
+                    int(row_val)
+                    if isinstance(row_val, str) and row_val.isnumeric()
+                    else 1
+                )
 
                 while grid[row_idx][col_idx] is not None:
                     col_idx += 1
@@ -362,7 +449,7 @@ class HTMLDocumentBackend(DeclarativeDocumentBackend):
                     for c in range(col_span):
                         grid[row_idx + r][col_idx + c] = text
 
-                cell = TableCell(
+                table_cell = TableCell(
                     text=text,
                     row_span=row_span,
                     col_span=col_span,
@@ -373,70 +460,87 @@ class HTMLDocumentBackend(DeclarativeDocumentBackend):
                     col_header=col_header,
                     row_header=((not col_header) and html_cell.name == "th"),
                 )
-                data.table_cells.append(cell)
+                data.table_cells.append(table_cell)
 
-        doc.add_table(data=data, parent=self.parents[self.level])
+        return data
 
-    def get_list_text(self, list_element: Tag, level=0):
+    def handle_table(self, element: Tag, doc: DoclingDocument) -> None:
+        """Handles table tags."""
+
+        table_data = HTMLDocumentBackend.parse_table_data(element)
+
+        if table_data is not None:
+            doc.add_table(
+                data=table_data,
+                parent=self.parents[self.level],
+                content_layer=self.content_layer,
+            )
+
+    def get_list_text(self, list_element: Tag, level: int = 0) -> list[str]:
         """Recursively extract text from <ul> or <ol> with proper indentation."""
         result = []
         bullet_char = "*"  # Default bullet character for unordered lists
 
         if list_element.name == "ol":  # For ordered lists, use numbers
-            for i, li in enumerate(list_element.find_all("li", recursive=False), 1):
+            for i, li in enumerate(list_element("li", recursive=False), 1):
+                if not isinstance(li, Tag):
+                    continue
                 # Add numbering for ordered lists
                 result.append(f"{'    ' * level}{i}. {li.get_text(strip=True)}")
                 # Handle nested lists
                 nested_list = li.find(["ul", "ol"])
-                if nested_list:
+                if isinstance(nested_list, Tag):
                     result.extend(self.get_list_text(nested_list, level + 1))
         elif list_element.name == "ul":  # For unordered lists, use bullet points
-            for li in list_element.find_all("li", recursive=False):
+            for li in list_element("li", recursive=False):
+                if not isinstance(li, Tag):
+                    continue
                 # Add bullet points for unordered lists
                 result.append(
                     f"{'    ' * level}{bullet_char} {li.get_text(strip=True)}"
                 )
                 # Handle nested lists
                 nested_list = li.find(["ul", "ol"])
-                if nested_list:
+                if isinstance(nested_list, Tag):
                     result.extend(self.get_list_text(nested_list, level + 1))
 
         return result
 
-    def extract_table_cell_text(self, cell: Tag):
-        """Extract text from a table cell, including lists with indents."""
-        contains_lists = cell.find(["ul", "ol"])
-        if contains_lists is None:
-            return cell.text
-        else:
-            _log.debug(
-                "should extract the content correctly for table-cells with lists ..."
-            )
-            return cell.text
-
-    def handle_figure(self, element: Tag, idx: int, doc: DoclingDocument):
+    def handle_figure(self, element: Tag, doc: DoclingDocument) -> None:
         """Handles image tags (img)."""
 
         # Extract the image URI from the <img> tag
         # image_uri = root.xpath('//figure//img/@src')[0]
 
         contains_captions = element.find(["figcaption"])
-        if contains_captions is None:
-            doc.add_picture(parent=self.parents[self.level], caption=None)
-
+        if not isinstance(contains_captions, Tag):
+            doc.add_picture(
+                parent=self.parents[self.level],
+                caption=None,
+                content_layer=self.content_layer,
+            )
         else:
             texts = []
             for item in contains_captions:
                 texts.append(item.text)
 
             fig_caption = doc.add_text(
-                label=DocItemLabel.CAPTION, text=("".join(texts)).strip()
+                label=DocItemLabel.CAPTION,
+                text=("".join(texts)).strip(),
+                content_layer=self.content_layer,
             )
             doc.add_picture(
                 parent=self.parents[self.level],
                 caption=fig_caption,
+                content_layer=self.content_layer,
             )
 
-    def handle_image(self, element: Tag, idx, doc: DoclingDocument):
+    def handle_image(self, element: Tag, doc: DoclingDocument) -> None:
         """Handles image tags (img)."""
-        doc.add_picture(parent=self.parents[self.level], caption=None)
+        _log.debug(f"ignoring <img> tags at the moment: {element}")
+
+        doc.add_picture(
+            parent=self.parents[self.level],
+            caption=None,
+            content_layer=self.content_layer,
+        )
diff --git a/docling/backend/md_backend.py b/docling/backend/md_backend.py
index 3e23f073..19a21c19 100644
--- a/docling/backend/md_backend.py
+++ b/docling/backend/md_backend.py
@@ -24,14 +24,19 @@ from docling_core.types.doc import (
 from marko import Markdown
 
 from docling.backend.abstract_backend import DeclarativeDocumentBackend
+from docling.backend.html_backend import HTMLDocumentBackend
 from docling.datamodel.base_models import InputFormat
 from docling.datamodel.document import InputDocument
 
 _log = logging.getLogger(__name__)
 
+_MARKER_BODY = "DOCLING_DOC_MD_HTML_EXPORT"
+_START_MARKER = f"#_#_{_MARKER_BODY}_START_#_#"
+_STOP_MARKER = f"#_#_{_MARKER_BODY}_STOP_#_#"
+
 
 class MarkdownDocumentBackend(DeclarativeDocumentBackend):
-    def shorten_underscore_sequences(self, markdown_text: str, max_length: int = 10):
+    def _shorten_underscore_sequences(self, markdown_text: str, max_length: int = 10):
         # This regex will match any sequence of underscores
         pattern = r"_+"
 
@@ -67,6 +72,7 @@ class MarkdownDocumentBackend(DeclarativeDocumentBackend):
         self.in_table = False
         self.md_table_buffer: list[str] = []
         self.inline_texts: list[str] = []
+        self._html_blocks: int = 0
 
         try:
             if isinstance(self.path_or_stream, BytesIO):
@@ -75,7 +81,7 @@ class MarkdownDocumentBackend(DeclarativeDocumentBackend):
                 # very long sequences of underscores will lead to unnecessary long processing times.
                 # In any proper Markdown files, underscores have to be escaped,
                 # otherwise they represent emphasis (bold or italic)
-                self.markdown = self.shorten_underscore_sequences(text_stream)
+                self.markdown = self._shorten_underscore_sequences(text_stream)
             if isinstance(self.path_or_stream, Path):
                 with open(self.path_or_stream, "r", encoding="utf-8") as f:
                     md_content = f.read()
@@ -83,7 +89,7 @@ class MarkdownDocumentBackend(DeclarativeDocumentBackend):
                     # very long sequences of underscores will lead to unnecessary long processing times.
                     # In any proper Markdown files, underscores have to be escaped,
                     # otherwise they represent emphasis (bold or italic)
-                    self.markdown = self.shorten_underscore_sequences(md_content)
+                    self.markdown = self._shorten_underscore_sequences(md_content)
             self.valid = True
 
             _log.debug(self.markdown)
@@ -93,7 +99,7 @@ class MarkdownDocumentBackend(DeclarativeDocumentBackend):
             ) from e
         return
 
-    def close_table(self, doc: DoclingDocument):
+    def _close_table(self, doc: DoclingDocument):
         if self.in_table:
             _log.debug("=== TABLE START ===")
             for md_table_row in self.md_table_buffer:
@@ -150,30 +156,35 @@ class MarkdownDocumentBackend(DeclarativeDocumentBackend):
                 doc.add_table(data=table_data)
         return
 
-    def process_inline_text(
-        self, parent_element: Optional[NodeItem], doc: DoclingDocument
+    def _process_inline_text(
+        self, parent_item: Optional[NodeItem], doc: DoclingDocument
     ):
         txt = " ".join(self.inline_texts)
         if len(txt) > 0:
             doc.add_text(
                 label=DocItemLabel.PARAGRAPH,
-                parent=parent_element,
+                parent=parent_item,
                 text=txt,
             )
         self.inline_texts = []
 
-    def iterate_elements(
+    def _iterate_elements(
         self,
         element: marko.element.Element,
         depth: int,
         doc: DoclingDocument,
-        parent_element: Optional[NodeItem] = None,
+        visited: Set[marko.element.Element],
+        parent_item: Optional[NodeItem] = None,
     ):
+
+        if element in visited:
+            return
+
         # Iterates over all elements in the AST
         # Check for different element types and process relevant details
         if isinstance(element, marko.block.Heading) and len(element.children) > 0:
-            self.close_table(doc)
-            self.process_inline_text(parent_element, doc)
+            self._close_table(doc)
+            self._process_inline_text(parent_item, doc)
             _log.debug(
                 f" - Heading level {element.level}, content: {element.children[0].children}"  # type: ignore
             )
@@ -201,8 +212,8 @@ class MarkdownDocumentBackend(DeclarativeDocumentBackend):
             traverse(element)
             snippet_text = "".join(strings)
             if len(snippet_text) > 0:
-                parent_element = doc.add_text(
-                    label=doc_label, parent=parent_element, text=snippet_text
+                parent_item = doc.add_text(
+                    label=doc_label, parent=parent_item, text=snippet_text
                 )
 
         elif isinstance(element, marko.block.List):
@@ -212,35 +223,37 @@ class MarkdownDocumentBackend(DeclarativeDocumentBackend):
                     has_non_empty_list_items = True
                     break
 
-            self.close_table(doc)
-            self.process_inline_text(parent_element, doc)
+            self._close_table(doc)
+            self._process_inline_text(parent_item, doc)
             _log.debug(f" - List {'ordered' if element.ordered else 'unordered'}")
             if has_non_empty_list_items:
                 label = GroupLabel.ORDERED_LIST if element.ordered else GroupLabel.LIST
-                parent_element = doc.add_group(
-                    label=label, name=f"list", parent=parent_element
+                parent_item = doc.add_group(
+                    label=label, name=f"list", parent=parent_item
                 )
 
         elif isinstance(element, marko.block.ListItem) and len(element.children) > 0:
-            self.close_table(doc)
-            self.process_inline_text(parent_element, doc)
+            self._close_table(doc)
+            self._process_inline_text(parent_item, doc)
             _log.debug(" - List item")
 
-            snippet_text = str(element.children[0].children[0].children)  # type: ignore
+            first_child = element.children[0]
+            snippet_text = str(first_child.children[0].children)  # type: ignore
             is_numbered = False
             if (
-                parent_element is not None
-                and isinstance(parent_element, DocItem)
-                and parent_element.label == GroupLabel.ORDERED_LIST
+                parent_item is not None
+                and isinstance(parent_item, DocItem)
+                and parent_item.label == GroupLabel.ORDERED_LIST
             ):
                 is_numbered = True
             doc.add_list_item(
-                enumerated=is_numbered, parent=parent_element, text=snippet_text
+                enumerated=is_numbered, parent=parent_item, text=snippet_text
             )
+            visited.add(first_child)
 
         elif isinstance(element, marko.inline.Image):
-            self.close_table(doc)
-            self.process_inline_text(parent_element, doc)
+            self._close_table(doc)
+            self._process_inline_text(parent_item, doc)
             _log.debug(f" - Image with alt: {element.title}, url: {element.dest}")
 
             fig_caption: Optional[TextItem] = None
@@ -249,10 +262,10 @@ class MarkdownDocumentBackend(DeclarativeDocumentBackend):
                     label=DocItemLabel.CAPTION, text=element.title
                 )
 
-            doc.add_picture(parent=parent_element, caption=fig_caption)
+            doc.add_picture(parent=parent_item, caption=fig_caption)
 
         elif isinstance(element, marko.block.Paragraph) and len(element.children) > 0:
-            self.process_inline_text(parent_element, doc)
+            self._process_inline_text(parent_item, doc)
 
         elif isinstance(element, marko.inline.RawText):
             _log.debug(f" - Paragraph (raw text): {element.children}")
@@ -266,17 +279,16 @@ class MarkdownDocumentBackend(DeclarativeDocumentBackend):
                 else:
                     self.md_table_buffer.append(snippet_text)
             else:
-                self.close_table(doc)
-                self.in_table = False
+                self._close_table(doc)
                 # most likely just inline text
                 self.inline_texts.append(str(element.children))
 
         elif isinstance(element, marko.inline.CodeSpan):
-            self.close_table(doc)
-            self.process_inline_text(parent_element, doc)
+            self._close_table(doc)
+            self._process_inline_text(parent_item, doc)
             _log.debug(f" - Code Span: {element.children}")
             snippet_text = str(element.children).strip()
-            doc.add_code(parent=parent_element, text=snippet_text)
+            doc.add_code(parent=parent_item, text=snippet_text)
 
         elif (
             isinstance(element, (marko.block.CodeBlock, marko.block.FencedCode))
@@ -284,10 +296,10 @@ class MarkdownDocumentBackend(DeclarativeDocumentBackend):
             and isinstance((first_child := element.children[0]), marko.inline.RawText)
             and len(snippet_text := (first_child.children.strip())) > 0
         ):
-            self.close_table(doc)
-            self.process_inline_text(parent_element, doc)
+            self._close_table(doc)
+            self._process_inline_text(parent_item, doc)
             _log.debug(f" - Code Block: {element.children}")
-            doc.add_code(parent=parent_element, text=snippet_text)
+            doc.add_code(parent=parent_item, text=snippet_text)
 
         elif isinstance(element, marko.inline.LineBreak):
             if self.in_table:
@@ -295,27 +307,27 @@ class MarkdownDocumentBackend(DeclarativeDocumentBackend):
                 self.md_table_buffer.append("")
 
         elif isinstance(element, marko.block.HTMLBlock):
-            self.process_inline_text(parent_element, doc)
-            self.close_table(doc)
+            self._html_blocks += 1
+            self._process_inline_text(parent_item, doc)
+            self._close_table(doc)
             _log.debug("HTML Block: {}".format(element))
             if (
-                len(element.children) > 0
+                len(element.body) > 0
             ):  # If Marko doesn't return any content for HTML block, skip it
-                snippet_text = str(element.children).strip()
-                doc.add_text(
-                    label=DocItemLabel.CODE, parent=parent_element, text=snippet_text
-                )
+                html_block = element.body.strip()
+
+                # wrap in markers to enable post-processing in convert()
+                text_to_add = f"{_START_MARKER}{html_block}{_STOP_MARKER}"
+                doc.add_code(parent=parent_item, text=text_to_add)
         else:
             if not isinstance(element, str):
-                self.close_table(doc)
+                self._close_table(doc)
                 _log.debug("Some other element: {}".format(element))
 
         processed_block_types = (
-            marko.block.ListItem,
             marko.block.Heading,
             marko.block.CodeBlock,
             marko.block.FencedCode,
-            # marko.block.Paragraph,
             marko.inline.RawText,
         )
 
@@ -324,7 +336,13 @@ class MarkdownDocumentBackend(DeclarativeDocumentBackend):
             element, processed_block_types
         ):
             for child in element.children:
-                self.iterate_elements(child, depth + 1, doc, parent_element)
+                self._iterate_elements(
+                    element=child,
+                    depth=depth + 1,
+                    doc=doc,
+                    visited=visited,
+                    parent_item=parent_item,
+                )
 
     def is_valid(self) -> bool:
         return self.valid
@@ -358,8 +376,51 @@ class MarkdownDocumentBackend(DeclarativeDocumentBackend):
             marko_parser = Markdown()
             parsed_ast = marko_parser.parse(self.markdown)
             # Start iterating from the root of the AST
-            self.iterate_elements(parsed_ast, 0, doc, None)
-            self.process_inline_text(None, doc)  # handle last hanging inline text
+            self._iterate_elements(
+                element=parsed_ast,
+                depth=0,
+                doc=doc,
+                parent_item=None,
+                visited=set(),
+            )
+            self._process_inline_text(None, doc)  # handle last hanging inline text
+            self._close_table(doc=doc)  # handle any last hanging table
+
+            # if HTML blocks were detected, export to HTML and delegate to HTML backend
+            if self._html_blocks > 0:
+
+                # export to HTML
+                html_backend_cls = HTMLDocumentBackend
+                html_str = doc.export_to_html()
+
+                def _restore_original_html(txt, regex):
+                    _txt, count = re.subn(regex, "", txt)
+                    if count != self._html_blocks:
+                        raise RuntimeError(
+                            "An internal error has occurred during Markdown conversion."
+                        )
+                    return _txt
+
+                # restore original HTML by removing previouly added markers
+                for regex in [
+                    rf"<pre>\s*<code>\s*{_START_MARKER}",
+                    rf"{_STOP_MARKER}\s*</code>\s*</pre>",
+                ]:
+                    html_str = _restore_original_html(txt=html_str, regex=regex)
+                self._html_blocks = 0
+
+                # delegate to HTML backend
+                stream = BytesIO(bytes(html_str, encoding="utf-8"))
+                in_doc = InputDocument(
+                    path_or_stream=stream,
+                    format=InputFormat.HTML,
+                    backend=html_backend_cls,
+                    filename=self.file.name,
+                )
+                html_backend_obj = html_backend_cls(
+                    in_doc=in_doc, path_or_stream=stream
+                )
+                doc = html_backend_obj.convert()
         else:
             raise RuntimeError(
                 f"Cannot convert md with {self.document_hash} because the backend failed to init."
diff --git a/docling/backend/mspowerpoint_backend.py b/docling/backend/mspowerpoint_backend.py
index aecebdc0..8b86008b 100644
--- a/docling/backend/mspowerpoint_backend.py
+++ b/docling/backend/mspowerpoint_backend.py
@@ -98,21 +98,28 @@ class MsPowerpointDocumentBackend(DeclarativeDocumentBackend, PaginatedDocumentB
 
         return doc
 
-    def generate_prov(self, shape, slide_ind, text=""):
-        left = shape.left
-        top = shape.top
-        width = shape.width
-        height = shape.height
+    def generate_prov(
+        self, shape, slide_ind, text="", slide_size=Size(width=1, height=1)
+    ):
+        if shape.left:
+            left = shape.left
+            top = shape.top
+            width = shape.width
+            height = shape.height
+        else:
+            left = 0
+            top = 0
+            width = slide_size.width
+            height = slide_size.height
         shape_bbox = [left, top, left + width, top + height]
         shape_bbox = BoundingBox.from_tuple(shape_bbox, origin=CoordOrigin.BOTTOMLEFT)
-        # prov = [{"bbox": shape_bbox, "page": parent_slide, "span": [0, len(text)]}]
         prov = ProvenanceItem(
             page_no=slide_ind + 1, charspan=[0, len(text)], bbox=shape_bbox
         )
 
         return prov
 
-    def handle_text_elements(self, shape, parent_slide, slide_ind, doc):
+    def handle_text_elements(self, shape, parent_slide, slide_ind, doc, slide_size):
         is_a_list = False
         is_list_group_created = False
         enum_list_item_value = 0
@@ -121,7 +128,7 @@ class MsPowerpointDocumentBackend(DeclarativeDocumentBackend, PaginatedDocumentB
         list_text = ""
         list_label = GroupLabel.LIST
         doc_label = DocItemLabel.LIST_ITEM
-        prov = self.generate_prov(shape, slide_ind, shape.text.strip())
+        prov = self.generate_prov(shape, slide_ind, shape.text.strip(), slide_size)
 
         # Identify if shape contains lists
         for paragraph in shape.text_frame.paragraphs:
@@ -270,7 +277,7 @@ class MsPowerpointDocumentBackend(DeclarativeDocumentBackend, PaginatedDocumentB
                 )
         return
 
-    def handle_pictures(self, shape, parent_slide, slide_ind, doc):
+    def handle_pictures(self, shape, parent_slide, slide_ind, doc, slide_size):
         # Open it with PIL
         try:
             # Get the image bytes
@@ -280,7 +287,7 @@ class MsPowerpointDocumentBackend(DeclarativeDocumentBackend, PaginatedDocumentB
             pil_image = Image.open(BytesIO(image_bytes))
 
             # shape has picture
-            prov = self.generate_prov(shape, slide_ind, "")
+            prov = self.generate_prov(shape, slide_ind, "", slide_size)
             doc.add_picture(
                 parent=parent_slide,
                 image=ImageRef.from_pil(image=pil_image, dpi=im_dpi),
@@ -291,13 +298,13 @@ class MsPowerpointDocumentBackend(DeclarativeDocumentBackend, PaginatedDocumentB
             _log.warning(f"Warning: image cannot be loaded by Pillow: {e}")
         return
 
-    def handle_tables(self, shape, parent_slide, slide_ind, doc):
+    def handle_tables(self, shape, parent_slide, slide_ind, doc, slide_size):
         # Handling tables, images, charts
         if shape.has_table:
             table = shape.table
             table_xml = shape._element
 
-            prov = self.generate_prov(shape, slide_ind, "")
+            prov = self.generate_prov(shape, slide_ind, "", slide_size)
 
             num_cols = 0
             num_rows = len(table.rows)
@@ -374,17 +381,19 @@ class MsPowerpointDocumentBackend(DeclarativeDocumentBackend, PaginatedDocumentB
                 name=f"slide-{slide_ind}", label=GroupLabel.CHAPTER, parent=parents[0]
             )
 
-            size = Size(width=slide_width, height=slide_height)
-            parent_page = doc.add_page(page_no=slide_ind + 1, size=size)
+            slide_size = Size(width=slide_width, height=slide_height)
+            parent_page = doc.add_page(page_no=slide_ind + 1, size=slide_size)
 
-            def handle_shapes(shape, parent_slide, slide_ind, doc):
-                handle_groups(shape, parent_slide, slide_ind, doc)
+            def handle_shapes(shape, parent_slide, slide_ind, doc, slide_size):
+                handle_groups(shape, parent_slide, slide_ind, doc, slide_size)
                 if shape.has_table:
                     # Handle Tables
-                    self.handle_tables(shape, parent_slide, slide_ind, doc)
+                    self.handle_tables(shape, parent_slide, slide_ind, doc, slide_size)
                 if shape.shape_type == MSO_SHAPE_TYPE.PICTURE:
                     # Handle Pictures
-                    self.handle_pictures(shape, parent_slide, slide_ind, doc)
+                    self.handle_pictures(
+                        shape, parent_slide, slide_ind, doc, slide_size
+                    )
                 # If shape doesn't have any text, move on to the next shape
                 if not hasattr(shape, "text"):
                     return
@@ -396,16 +405,20 @@ class MsPowerpointDocumentBackend(DeclarativeDocumentBackend, PaginatedDocumentB
                     _log.warning("Warning: shape has text but not text_frame")
                     return
                 # Handle other text elements, including lists (bullet lists, numbered lists)
-                self.handle_text_elements(shape, parent_slide, slide_ind, doc)
+                self.handle_text_elements(
+                    shape, parent_slide, slide_ind, doc, slide_size
+                )
                 return
 
-            def handle_groups(shape, parent_slide, slide_ind, doc):
+            def handle_groups(shape, parent_slide, slide_ind, doc, slide_size):
                 if shape.shape_type == MSO_SHAPE_TYPE.GROUP:
                     for groupedshape in shape.shapes:
-                        handle_shapes(groupedshape, parent_slide, slide_ind, doc)
+                        handle_shapes(
+                            groupedshape, parent_slide, slide_ind, doc, slide_size
+                        )
 
             # Loop through each shape in the slide
             for shape in slide.shapes:
-                handle_shapes(shape, parent_slide, slide_ind, doc)
+                handle_shapes(shape, parent_slide, slide_ind, doc, slide_size)
 
         return doc
diff --git a/docling/backend/msword_backend.py b/docling/backend/msword_backend.py
index d0f563f6..01aeaa82 100644
--- a/docling/backend/msword_backend.py
+++ b/docling/backend/msword_backend.py
@@ -2,21 +2,28 @@ import logging
 import re
 from io import BytesIO
 from pathlib import Path
-from typing import Set, Union
+from typing import Any, Optional, Union
 
-import docx
 from docling_core.types.doc import (
     DocItemLabel,
     DoclingDocument,
     DocumentOrigin,
     GroupLabel,
     ImageRef,
+    NodeItem,
     TableCell,
     TableData,
 )
+from docx import Document
+from docx.document import Document as DocxDocument
+from docx.oxml.table import CT_Tc
+from docx.oxml.xmlchemy import BaseOxmlElement
+from docx.table import Table, _Cell
+from docx.text.paragraph import Paragraph
 from lxml import etree
 from lxml.etree import XPath
 from PIL import Image, UnidentifiedImageError
+from typing_extensions import override
 
 from docling.backend.abstract_backend import DeclarativeDocumentBackend
 from docling.backend.docx_latex.omml import oMath2Latex
@@ -27,7 +34,10 @@ _log = logging.getLogger(__name__)
 
 
 class MsWordDocumentBackend(DeclarativeDocumentBackend):
-    def __init__(self, in_doc: "InputDocument", path_or_stream: Union[BytesIO, Path]):
+    @override
+    def __init__(
+        self, in_doc: "InputDocument", path_or_stream: Union[BytesIO, Path]
+    ) -> None:
         super().__init__(in_doc, path_or_stream)
         self.XML_KEY = (
             "{http://schemas.openxmlformats.org/wordprocessingml/2006/main}val"
@@ -37,19 +47,19 @@ class MsWordDocumentBackend(DeclarativeDocumentBackend):
         }
         # self.initialise(path_or_stream)
         # Word file:
-        self.path_or_stream = path_or_stream
-        self.valid = False
+        self.path_or_stream: Union[BytesIO, Path] = path_or_stream
+        self.valid: bool = False
         # Initialise the parents for the hierarchy
-        self.max_levels = 10
-        self.level_at_new_list = None
-        self.parents = {}  # type: ignore
+        self.max_levels: int = 10
+        self.level_at_new_list: Optional[int] = None
+        self.parents: dict[int, Optional[NodeItem]] = {}
         for i in range(-1, self.max_levels):
             self.parents[i] = None
 
         self.level = 0
         self.listIter = 0
 
-        self.history = {
+        self.history: dict[str, Any] = {
             "names": [None],
             "levels": [None],
             "numids": [None],
@@ -59,9 +69,9 @@ class MsWordDocumentBackend(DeclarativeDocumentBackend):
         self.docx_obj = None
         try:
             if isinstance(self.path_or_stream, BytesIO):
-                self.docx_obj = docx.Document(self.path_or_stream)
+                self.docx_obj = Document(self.path_or_stream)
             elif isinstance(self.path_or_stream, Path):
-                self.docx_obj = docx.Document(str(self.path_or_stream))
+                self.docx_obj = Document(str(self.path_or_stream))
 
             self.valid = True
         except Exception as e:
@@ -69,13 +79,16 @@ class MsWordDocumentBackend(DeclarativeDocumentBackend):
                 f"MsPowerpointDocumentBackend could not load document with hash {self.document_hash}"
             ) from e
 
+    @override
     def is_valid(self) -> bool:
         return self.valid
 
     @classmethod
+    @override
     def supports_pagination(cls) -> bool:
         return False
 
+    @override
     def unload(self):
         if isinstance(self.path_or_stream, BytesIO):
             self.path_or_stream.close()
@@ -83,11 +96,17 @@ class MsWordDocumentBackend(DeclarativeDocumentBackend):
         self.path_or_stream = None
 
     @classmethod
-    def supported_formats(cls) -> Set[InputFormat]:
+    @override
+    def supported_formats(cls) -> set[InputFormat]:
         return {InputFormat.DOCX}
 
+    @override
     def convert(self) -> DoclingDocument:
-        # Parses the DOCX into a structured document model.
+        """Parses the DOCX into a structured document model.
+
+        Returns:
+            The parsed document.
+        """
 
         origin = DocumentOrigin(
             filename=self.file.name or "file",
@@ -105,23 +124,29 @@ class MsWordDocumentBackend(DeclarativeDocumentBackend):
                 f"Cannot convert doc with {self.document_hash} because the backend failed to init."
             )
 
-    def update_history(self, name, level, numid, ilevel):
+    def update_history(
+        self,
+        name: str,
+        level: Optional[int],
+        numid: Optional[int],
+        ilevel: Optional[int],
+    ):
         self.history["names"].append(name)
         self.history["levels"].append(level)
 
         self.history["numids"].append(numid)
         self.history["indents"].append(ilevel)
 
-    def prev_name(self):
+    def prev_name(self) -> Optional[str]:
         return self.history["names"][-1]
 
-    def prev_level(self):
+    def prev_level(self) -> Optional[int]:
         return self.history["levels"][-1]
 
-    def prev_numid(self):
+    def prev_numid(self) -> Optional[int]:
         return self.history["numids"][-1]
 
-    def prev_indent(self):
+    def prev_indent(self) -> Optional[int]:
         return self.history["indents"][-1]
 
     def get_level(self) -> int:
@@ -131,7 +156,12 @@ class MsWordDocumentBackend(DeclarativeDocumentBackend):
                 return k
         return 0
 
-    def walk_linear(self, body, docx_obj, doc) -> DoclingDocument:
+    def walk_linear(
+        self,
+        body: BaseOxmlElement,
+        docx_obj: DocxDocument,
+        doc: DoclingDocument,
+    ) -> DoclingDocument:
         for element in body:
             tag_name = etree.QName(element).localname
 
@@ -139,6 +169,7 @@ class MsWordDocumentBackend(DeclarativeDocumentBackend):
             namespaces = {
                 "a": "http://schemas.openxmlformats.org/drawingml/2006/main",
                 "r": "http://schemas.openxmlformats.org/officeDocument/2006/relationships",
+                "w": "http://schemas.openxmlformats.org/wordprocessingml/2006/main",
             }
             xpath_expr = XPath(".//a:blip", namespaces=namespaces)
             drawing_blip = xpath_expr(element)
@@ -151,7 +182,15 @@ class MsWordDocumentBackend(DeclarativeDocumentBackend):
                     _log.debug("could not parse a table, broken docx table")
 
             elif drawing_blip:
-                self.handle_pictures(element, docx_obj, drawing_blip, doc)
+                self.handle_pictures(docx_obj, drawing_blip, doc)
+            # Check for the sdt containers, like table of contents
+            elif tag_name in ["sdt"]:
+                sdt_content = element.find(".//w:sdtContent", namespaces=namespaces)
+                if sdt_content is not None:
+                    # Iterate paragraphs, runs, or text inside <w:sdtContent>.
+                    paragraphs = sdt_content.findall(".//w:p", namespaces=namespaces)
+                    for p in paragraphs:
+                        self.handle_text_elements(p, docx_obj, doc)
             # Check for Text
             elif tag_name in ["p"]:
                 # "tcPr", "sectPr"
@@ -160,7 +199,7 @@ class MsWordDocumentBackend(DeclarativeDocumentBackend):
                 _log.debug(f"Ignoring element in DOCX with tag: {tag_name}")
         return doc
 
-    def str_to_int(self, s, default=0):
+    def str_to_int(self, s: Optional[str], default: Optional[int] = 0) -> Optional[int]:
         if s is None:
             return None
         try:
@@ -168,7 +207,7 @@ class MsWordDocumentBackend(DeclarativeDocumentBackend):
         except ValueError:
             return default
 
-    def split_text_and_number(self, input_string):
+    def split_text_and_number(self, input_string: str) -> list[str]:
         match = re.match(r"(\D+)(\d+)$|^(\d+)(\D+)", input_string)
         if match:
             parts = list(filter(None, match.groups()))
@@ -176,7 +215,9 @@ class MsWordDocumentBackend(DeclarativeDocumentBackend):
         else:
             return [input_string]
 
-    def get_numId_and_ilvl(self, paragraph):
+    def get_numId_and_ilvl(
+        self, paragraph: Paragraph
+    ) -> tuple[Optional[int], Optional[int]]:
         # Access the XML element of the paragraph
         numPr = paragraph._element.find(
             ".//w:numPr", namespaces=paragraph._element.nsmap
@@ -189,13 +230,11 @@ class MsWordDocumentBackend(DeclarativeDocumentBackend):
             numId = numId_elem.get(self.XML_KEY) if numId_elem is not None else None
             ilvl = ilvl_elem.get(self.XML_KEY) if ilvl_elem is not None else None
 
-            return self.str_to_int(numId, default=None), self.str_to_int(
-                ilvl, default=None
-            )
+            return self.str_to_int(numId, None), self.str_to_int(ilvl, None)
 
         return None, None  # If the paragraph is not part of a list
 
-    def get_label_and_level(self, paragraph):
+    def get_label_and_level(self, paragraph: Paragraph) -> tuple[str, Optional[int]]:
         if paragraph.style is None:
             return "Normal", None
         label = paragraph.style.style_id
@@ -205,42 +244,32 @@ class MsWordDocumentBackend(DeclarativeDocumentBackend):
             parts = label.split(":")
 
             if len(parts) == 2:
-                return parts[0], int(parts[1])
+                return parts[0], self.str_to_int(parts[1], None)
 
         parts = self.split_text_and_number(label)
 
         if "Heading" in label and len(parts) == 2:
             parts.sort()
-            label_str = ""
-            label_level = 0
+            label_str: str = ""
+            label_level: Optional[int] = 0
             if parts[0] == "Heading":
                 label_str = parts[0]
-                label_level = self.str_to_int(parts[1], default=None)
+                label_level = self.str_to_int(parts[1], None)
             if parts[1] == "Heading":
                 label_str = parts[1]
-                label_level = self.str_to_int(parts[0], default=None)
+                label_level = self.str_to_int(parts[0], None)
             return label_str, label_level
         else:
             return label, None
 
-    def handle_equations_in_text(self, element, text):
-        only_texts = []
-        texts_and_equations = []
-        for subt in element.iter():
-            tag_name = etree.QName(subt).localname
-            if tag_name == "t" and "math" not in subt.tag:
-                only_texts.append(subt.text)
-                texts_and_equations.append(subt.text)
-            elif "oMath" in subt.tag and "oMathPara" not in subt.tag:
-                texts_and_equations.append(f"${str(oMath2Latex(subt))}$")
 
-        if "".join(only_texts) != text:
-            return text
-
-        return "".join(texts_and_equations)
-
-    def handle_text_elements(self, element, docx_obj, doc):
-        paragraph = docx.text.paragraph.Paragraph(element, docx_obj)
+    def handle_text_elements(
+        self,
+        element: BaseOxmlElement,
+        docx_obj: DocxDocument,
+        doc: DoclingDocument,
+    ) -> None:
+        paragraph = Paragraph(element, docx_obj)
 
         raw_text = paragraph.text
         text = self.handle_equations_in_text(element=element, text=raw_text)
@@ -267,11 +296,7 @@ class MsWordDocumentBackend(DeclarativeDocumentBackend):
             and p_style_id not in ["Title", "Heading"]
         ):
             self.add_listitem(
-                element,
-                docx_obj,
                 doc,
-                p_style_id,
-                p_level,
                 numid,
                 ilevel,
                 text,
@@ -296,14 +321,14 @@ class MsWordDocumentBackend(DeclarativeDocumentBackend):
                 self.level = 0
 
         if p_style_id in ["Title"]:
-            for key, val in self.parents.items():
+            for key in range(len(self.parents)):
                 self.parents[key] = None
             self.parents[0] = doc.add_text(
                 parent=None, label=DocItemLabel.TITLE, text=text
             )
 
         elif "Heading" in p_style_id:
-            self.add_header(element, docx_obj, doc, p_style_id, p_level, text)
+            self.add_header(doc, p_level, text)
 
         elif p_style_id in [
             "Subtitle",
@@ -347,7 +372,9 @@ class MsWordDocumentBackend(DeclarativeDocumentBackend):
         self.update_history(p_style_id, p_level, numid, ilevel)
         return
 
-    def add_header(self, element, docx_obj, doc, curr_name, curr_level, text: str):
+    def add_header(
+        self, doc: DoclingDocument, curr_level: Optional[int], text: str
+    ) -> None:
         level = self.get_level()
         if isinstance(curr_level, int):
             if curr_level > level:
@@ -360,7 +387,7 @@ class MsWordDocumentBackend(DeclarativeDocumentBackend):
                     )
             elif curr_level < level:
                 # remove the tail
-                for key, val in self.parents.items():
+                for key in range(len(self.parents)):
                     if key >= curr_level:
                         self.parents[key] = None
 
@@ -379,22 +406,18 @@ class MsWordDocumentBackend(DeclarativeDocumentBackend):
 
     def add_listitem(
         self,
-        element,
-        docx_obj,
-        doc,
-        p_style_id,
-        p_level,
-        numid,
-        ilevel,
+        doc: DoclingDocument,
+        numid: int,
+        ilevel: int,
         text: str,
-        is_numbered=False,
-    ):
-        # is_numbered = is_numbered
+        is_numbered: bool = False,
+    ) -> None:
         enum_marker = ""
 
         level = self.get_level()
+        prev_indent = self.prev_indent()
         if self.prev_numid() is None:  # Open new list
-            self.level_at_new_list = level  # type: ignore
+            self.level_at_new_list = level
 
             self.parents[level] = doc.add_group(
                 label=GroupLabel.LIST, name="list", parent=self.parents[level - 1]
@@ -413,10 +436,13 @@ class MsWordDocumentBackend(DeclarativeDocumentBackend):
             )
 
         elif (
-            self.prev_numid() == numid and self.prev_indent() < ilevel
+            self.prev_numid() == numid
+            and self.level_at_new_list is not None
+            and prev_indent is not None
+            and prev_indent < ilevel
         ):  # Open indented list
             for i in range(
-                self.level_at_new_list + self.prev_indent() + 1,
+                self.level_at_new_list + prev_indent + 1,
                 self.level_at_new_list + ilevel + 1,
             ):
                 # Determine if this is an unordered list or an ordered list.
@@ -445,7 +471,12 @@ class MsWordDocumentBackend(DeclarativeDocumentBackend):
                 text=text,
             )
 
-        elif self.prev_numid() == numid and ilevel < self.prev_indent():  # Close list
+        elif (
+            self.prev_numid() == numid
+            and self.level_at_new_list is not None
+            and prev_indent is not None
+            and ilevel < prev_indent
+        ):  # Close list
             for k, v in self.parents.items():
                 if k > self.level_at_new_list + ilevel:
                     self.parents[k] = None
@@ -463,7 +494,7 @@ class MsWordDocumentBackend(DeclarativeDocumentBackend):
             )
             self.listIter = 0
 
-        elif self.prev_numid() == numid or self.prev_indent() == ilevel:
+        elif self.prev_numid() == numid or prev_indent == ilevel:
             # TODO: Set marker and enumerated arguments if this is an enumeration element.
             self.listIter += 1
             if is_numbered:
@@ -477,31 +508,16 @@ class MsWordDocumentBackend(DeclarativeDocumentBackend):
             )
         return
 
-    def handle_tables(self, element, docx_obj, doc):
-
-        # Function to check if a cell has a colspan (gridSpan)
-        def get_colspan(cell):
-            grid_span = cell._element.xpath("@w:gridSpan")
-            if grid_span:
-                return int(grid_span[0])  # Return the number of columns spanned
-            return 1  # Default is 1 (no colspan)
-
-        # Function to check if a cell has a rowspan (vMerge)
-        def get_rowspan(cell):
-            v_merge = cell._element.xpath("@w:vMerge")
-            if v_merge:
-                return v_merge[
-                    0
-                ]  # 'restart' indicates the beginning of a rowspan, others are continuation
-            return 1
-
-        table = docx.table.Table(element, docx_obj)
-
+    def handle_tables(
+        self,
+        element: BaseOxmlElement,
+        docx_obj: DocxDocument,
+        doc: DoclingDocument,
+    ) -> None:
+        table: Table = Table(element, docx_obj)
         num_rows = len(table.rows)
-        num_cols = 0
-        for row in table.rows:
-            # Calculate the max number of columns
-            num_cols = max(num_cols, sum(get_colspan(cell) for cell in row.cells))
+        num_cols = len(table.columns)
+        _log.debug(f"Table grid with {num_rows} rows and {num_cols} columns")
 
         if num_rows == 1 and num_cols == 1:
             cell_element = table.rows[0].cells[0]
@@ -510,59 +526,56 @@ class MsWordDocumentBackend(DeclarativeDocumentBackend):
             self.walk_linear(cell_element._element, docx_obj, doc)
             return
 
-        # Initialize the table grid
-        table_grid = [[None for _ in range(num_cols)] for _ in range(num_rows)]
-
-        data = TableData(num_rows=num_rows, num_cols=num_cols, table_cells=[])
-
+        data = TableData(num_rows=num_rows, num_cols=num_cols)
+        cell_set: set[CT_Tc] = set()
         for row_idx, row in enumerate(table.rows):
+            _log.debug(f"Row index {row_idx} with {len(row.cells)} populated cells")
             col_idx = 0
-            for c, cell in enumerate(row.cells):
-                row_span = get_rowspan(cell)
-                col_span = get_colspan(cell)
+            while col_idx < num_cols:
+                cell: _Cell = row.cells[col_idx]
+                _log.debug(
+                    f" col {col_idx} grid_span {cell.grid_span} grid_cols_before {row.grid_cols_before}"
+                )
+                if cell is None or cell._tc in cell_set:
+                    _log.debug(f"  skipped since repeated content")
+                    col_idx += cell.grid_span
+                    continue
+                else:
+                    cell_set.add(cell._tc)
 
-                cell_text = cell.text
-                # In case cell doesn't return text via docx library:
-                if len(cell_text) == 0:
-                    cell_xml = cell._element
+                spanned_idx = row_idx
+                spanned_tc: Optional[CT_Tc] = cell._tc
+                while spanned_tc == cell._tc:
+                    spanned_idx += 1
+                    spanned_tc = (
+                        table.rows[spanned_idx].cells[col_idx]._tc
+                        if spanned_idx < num_rows
+                        else None
+                    )
+                _log.debug(f"  spanned before row {spanned_idx}")
 
-                    texts = [""]
-                    for elem in cell_xml.iter():
-                        if elem.tag.endswith("t"):  # <w:t> tags that contain text
-                            if elem.text:
-                                texts.append(elem.text)
-                    # Join the collected text
-                    cell_text = " ".join(texts).strip()
-
-                # Find the next available column in the grid
-                while table_grid[row_idx][col_idx] is not None:
-                    col_idx += 1
-
-                # Fill the grid with the cell value, considering rowspan and colspan
-                for i in range(row_span if row_span == "restart" else 1):
-                    for j in range(col_span):
-                        table_grid[row_idx + i][col_idx + j] = ""
-
-                cell = TableCell(
-                    text=cell_text,
-                    row_span=row_span,
-                    col_span=col_span,
-                    start_row_offset_idx=row_idx,
-                    end_row_offset_idx=row_idx + row_span,
+                table_cell = TableCell(
+                    text=cell.text,
+                    row_span=spanned_idx - row_idx,
+                    col_span=cell.grid_span,
+                    start_row_offset_idx=row.grid_cols_before + row_idx,
+                    end_row_offset_idx=row.grid_cols_before + spanned_idx,
                     start_col_offset_idx=col_idx,
-                    end_col_offset_idx=col_idx + col_span,
+                    end_col_offset_idx=col_idx + cell.grid_span,
                     col_header=False,
                     row_header=False,
                 )
-
-                data.table_cells.append(cell)
+                data.table_cells.append(table_cell)
+                col_idx += cell.grid_span
 
         level = self.get_level()
         doc.add_table(data=data, parent=self.parents[level - 1])
         return
 
-    def handle_pictures(self, element, docx_obj, drawing_blip, doc):
-        def get_docx_image(element, drawing_blip):
+    def handle_pictures(
+        self, docx_obj: DocxDocument, drawing_blip: Any, doc: DoclingDocument
+    ) -> None:
+        def get_docx_image(drawing_blip):
             rId = drawing_blip[0].get(
                 "{http://schemas.openxmlformats.org/officeDocument/2006/relationships}embed"
             )
@@ -575,7 +588,7 @@ class MsWordDocumentBackend(DeclarativeDocumentBackend):
         level = self.get_level()
         # Open the BytesIO object with PIL to create an Image
         try:
-            image_data = get_docx_image(element, drawing_blip)
+            image_data = get_docx_image(drawing_blip)
             image_bytes = BytesIO(image_data)
             pil_image = Image.open(image_bytes)
             doc.add_picture(
diff --git a/docling/backend/pypdfium2_backend.py b/docling/backend/pypdfium2_backend.py
index 5b627da7..b585e2d5 100644
--- a/docling/backend/pypdfium2_backend.py
+++ b/docling/backend/pypdfium2_backend.py
@@ -13,6 +13,7 @@ from pypdfium2._helpers.misc import PdfiumError
 
 from docling.backend.pdf_backend import PdfDocumentBackend, PdfPageBackend
 from docling.datamodel.base_models import Cell
+from docling.utils.locks import pypdfium2_lock
 
 if TYPE_CHECKING:
     from docling.datamodel.document import InputDocument
@@ -24,6 +25,7 @@ class PyPdfiumPageBackend(PdfPageBackend):
     def __init__(
         self, pdfium_doc: pdfium.PdfDocument, document_hash: str, page_no: int
     ):
+        # Note: lock applied by the caller
         self.valid = True  # No better way to tell from pypdfium.
         try:
             self._ppage: pdfium.PdfPage = pdfium_doc[page_no]
@@ -40,51 +42,57 @@ class PyPdfiumPageBackend(PdfPageBackend):
 
     def get_bitmap_rects(self, scale: float = 1) -> Iterable[BoundingBox]:
         AREA_THRESHOLD = 0  # 32 * 32
-        for obj in self._ppage.get_objects(filter=[pdfium_c.FPDF_PAGEOBJ_IMAGE]):
-            pos = obj.get_pos()
-            cropbox = BoundingBox.from_tuple(
-                pos, origin=CoordOrigin.BOTTOMLEFT
-            ).to_top_left_origin(page_height=self.get_size().height)
+        page_size = self.get_size()
+        with pypdfium2_lock:
+            for obj in self._ppage.get_objects(filter=[pdfium_c.FPDF_PAGEOBJ_IMAGE]):
+                pos = obj.get_pos()
+                cropbox = BoundingBox.from_tuple(
+                    pos, origin=CoordOrigin.BOTTOMLEFT
+                ).to_top_left_origin(page_height=page_size.height)
 
-            if cropbox.area() > AREA_THRESHOLD:
-                cropbox = cropbox.scaled(scale=scale)
+                if cropbox.area() > AREA_THRESHOLD:
+                    cropbox = cropbox.scaled(scale=scale)
 
-                yield cropbox
+                    yield cropbox
 
     def get_text_in_rect(self, bbox: BoundingBox) -> str:
-        if not self.text_page:
-            self.text_page = self._ppage.get_textpage()
+        with pypdfium2_lock:
+            if not self.text_page:
+                self.text_page = self._ppage.get_textpage()
 
         if bbox.coord_origin != CoordOrigin.BOTTOMLEFT:
             bbox = bbox.to_bottom_left_origin(self.get_size().height)
 
-        text_piece = self.text_page.get_text_bounded(*bbox.as_tuple())
+        with pypdfium2_lock:
+            text_piece = self.text_page.get_text_bounded(*bbox.as_tuple())
 
         return text_piece
 
     def get_text_cells(self) -> Iterable[Cell]:
-        if not self.text_page:
-            self.text_page = self._ppage.get_textpage()
+        with pypdfium2_lock:
+            if not self.text_page:
+                self.text_page = self._ppage.get_textpage()
 
         cells = []
         cell_counter = 0
 
         page_size = self.get_size()
 
-        for i in range(self.text_page.count_rects()):
-            rect = self.text_page.get_rect(i)
-            text_piece = self.text_page.get_text_bounded(*rect)
-            x0, y0, x1, y1 = rect
-            cells.append(
-                Cell(
-                    id=cell_counter,
-                    text=text_piece,
-                    bbox=BoundingBox(
-                        l=x0, b=y0, r=x1, t=y1, coord_origin=CoordOrigin.BOTTOMLEFT
-                    ).to_top_left_origin(page_size.height),
+        with pypdfium2_lock:
+            for i in range(self.text_page.count_rects()):
+                rect = self.text_page.get_rect(i)
+                text_piece = self.text_page.get_text_bounded(*rect)
+                x0, y0, x1, y1 = rect
+                cells.append(
+                    Cell(
+                        id=cell_counter,
+                        text=text_piece,
+                        bbox=BoundingBox(
+                            l=x0, b=y0, r=x1, t=y1, coord_origin=CoordOrigin.BOTTOMLEFT
+                        ).to_top_left_origin(page_size.height),
+                    )
                 )
-            )
-            cell_counter += 1
+                cell_counter += 1
 
         # PyPdfium2 produces very fragmented cells, with sub-word level boundaries, in many PDFs.
         # The cell merging code below is to clean this up.
@@ -214,20 +222,24 @@ class PyPdfiumPageBackend(PdfPageBackend):
             padbox.r = page_size.width - padbox.r
             padbox.t = page_size.height - padbox.t
 
-        image = (
-            self._ppage.render(
-                scale=scale * 1.5,
-                rotation=0,  # no additional rotation
-                crop=padbox.as_tuple(),
-            )
-            .to_pil()
-            .resize(size=(round(cropbox.width * scale), round(cropbox.height * scale)))
-        )  # We resize the image from 1.5x the given scale to make it sharper.
+        with pypdfium2_lock:
+            image = (
+                self._ppage.render(
+                    scale=scale * 1.5,
+                    rotation=0,  # no additional rotation
+                    crop=padbox.as_tuple(),
+                )
+                .to_pil()
+                .resize(
+                    size=(round(cropbox.width * scale), round(cropbox.height * scale))
+                )
+            )  # We resize the image from 1.5x the given scale to make it sharper.
 
         return image
 
     def get_size(self) -> Size:
-        return Size(width=self._ppage.get_width(), height=self._ppage.get_height())
+        with pypdfium2_lock:
+            return Size(width=self._ppage.get_width(), height=self._ppage.get_height())
 
     def unload(self):
         self._ppage = None
@@ -239,22 +251,26 @@ class PyPdfiumDocumentBackend(PdfDocumentBackend):
         super().__init__(in_doc, path_or_stream)
 
         try:
-            self._pdoc = pdfium.PdfDocument(self.path_or_stream)
+            with pypdfium2_lock:
+                self._pdoc = pdfium.PdfDocument(self.path_or_stream)
         except PdfiumError as e:
             raise RuntimeError(
                 f"pypdfium could not load document with hash {self.document_hash}"
             ) from e
 
     def page_count(self) -> int:
-        return len(self._pdoc)
+        with pypdfium2_lock:
+            return len(self._pdoc)
 
     def load_page(self, page_no: int) -> PyPdfiumPageBackend:
-        return PyPdfiumPageBackend(self._pdoc, self.document_hash, page_no)
+        with pypdfium2_lock:
+            return PyPdfiumPageBackend(self._pdoc, self.document_hash, page_no)
 
     def is_valid(self) -> bool:
         return self.page_count() > 0
 
     def unload(self):
         super().unload()
-        self._pdoc.close()
-        self._pdoc = None
+        with pypdfium2_lock:
+            self._pdoc.close()
+            self._pdoc = None
diff --git a/docling/backend/xml/jats_backend.py b/docling/backend/xml/jats_backend.py
new file mode 100755
index 00000000..2409961f
--- /dev/null
+++ b/docling/backend/xml/jats_backend.py
@@ -0,0 +1,710 @@
+import logging
+import traceback
+from io import BytesIO
+from pathlib import Path
+from typing import Final, Optional, Union
+
+from bs4 import BeautifulSoup, Tag
+from docling_core.types.doc import (
+    DocItemLabel,
+    DoclingDocument,
+    DocumentOrigin,
+    GroupItem,
+    GroupLabel,
+    NodeItem,
+    TextItem,
+)
+from lxml import etree
+from typing_extensions import TypedDict, override
+
+from docling.backend.abstract_backend import DeclarativeDocumentBackend
+from docling.backend.html_backend import HTMLDocumentBackend
+from docling.datamodel.base_models import InputFormat
+from docling.datamodel.document import InputDocument
+
+_log = logging.getLogger(__name__)
+
+JATS_DTD_URL: Final = ["JATS-journalpublishing", "JATS-archive"]
+DEFAULT_HEADER_ACKNOWLEDGMENTS: Final = "Acknowledgments"
+DEFAULT_HEADER_ABSTRACT: Final = "Abstract"
+DEFAULT_HEADER_REFERENCES: Final = "References"
+DEFAULT_TEXT_ETAL: Final = "et al."
+
+
+class Abstract(TypedDict):
+    label: str
+    content: str
+
+
+class Author(TypedDict):
+    name: str
+    affiliation_names: list[str]
+
+
+class Citation(TypedDict):
+    author_names: str
+    title: str
+    source: str
+    year: str
+    volume: str
+    page: str
+    pub_id: str
+    publisher_name: str
+    publisher_loc: str
+
+
+class Table(TypedDict):
+    label: str
+    caption: str
+    content: str
+
+
+class XMLComponents(TypedDict):
+    title: str
+    authors: list[Author]
+    abstract: list[Abstract]
+
+
+class JatsDocumentBackend(DeclarativeDocumentBackend):
+    """Backend to parse articles in XML format tagged according to JATS definition.
+
+    The Journal Article Tag Suite (JATS) is an definition standard for the
+    representation of journal articles in XML format. Several publishers and journal
+    archives provide content in JATS format, including PubMed Central® (PMC), bioRxiv,
+    medRxiv, or Springer Nature.
+
+    Refer to https://jats.nlm.nih.gov for more details on JATS.
+
+    The code from this document backend has been developed by modifying parts of the
+    PubMed Parser library (version 0.5.0, released on 12.08.2024):
+    Achakulvisut et al., (2020).
+    Pubmed Parser: A Python Parser for PubMed Open-Access XML Subset and MEDLINE XML
+      Dataset XML Dataset.
+    Journal of Open Source Software, 5(46), 1979,
+    https://doi.org/10.21105/joss.01979
+    """
+
+    @override
+    def __init__(
+        self, in_doc: "InputDocument", path_or_stream: Union[BytesIO, Path]
+    ) -> None:
+        super().__init__(in_doc, path_or_stream)
+        self.path_or_stream = path_or_stream
+
+        # Initialize the root of the document hiearchy
+        self.root: Optional[NodeItem] = None
+
+        self.valid = False
+        try:
+            if isinstance(self.path_or_stream, BytesIO):
+                self.path_or_stream.seek(0)
+            self.tree: etree._ElementTree = etree.parse(self.path_or_stream)
+
+            doc_info: etree.DocInfo = self.tree.docinfo
+            if doc_info.system_url and any(
+                [kwd in doc_info.system_url for kwd in JATS_DTD_URL]
+            ):
+                self.valid = True
+                return
+            for ent in doc_info.internalDTD.iterentities():
+                if ent.system_url and any(
+                    [kwd in ent.system_url for kwd in JATS_DTD_URL]
+                ):
+                    self.valid = True
+                    return
+        except Exception as exc:
+            raise RuntimeError(
+                f"Could not initialize JATS backend for file with hash {self.document_hash}."
+            ) from exc
+
+    @override
+    def is_valid(self) -> bool:
+        return self.valid
+
+    @classmethod
+    @override
+    def supports_pagination(cls) -> bool:
+        return False
+
+    @override
+    def unload(self):
+        if isinstance(self.path_or_stream, BytesIO):
+            self.path_or_stream.close()
+        self.path_or_stream = None
+
+    @classmethod
+    @override
+    def supported_formats(cls) -> set[InputFormat]:
+        return {InputFormat.XML_JATS}
+
+    @override
+    def convert(self) -> DoclingDocument:
+        try:
+            # Create empty document
+            origin = DocumentOrigin(
+                filename=self.file.name or "file",
+                mimetype="application/xml",
+                binary_hash=self.document_hash,
+            )
+            doc = DoclingDocument(name=self.file.stem or "file", origin=origin)
+
+            # Get metadata XML components
+            xml_components: XMLComponents = self._parse_metadata()
+
+            # Add metadata to the document
+            self._add_metadata(doc, xml_components)
+
+            # walk over the XML body
+            body = self.tree.xpath("//body")
+            if self.root and len(body) > 0:
+                self._walk_linear(doc, self.root, body[0])
+
+            # walk over the XML back matter
+            back = self.tree.xpath("//back")
+            if self.root and len(back) > 0:
+                self._walk_linear(doc, self.root, back[0])
+        except Exception:
+            _log.error(traceback.format_exc())
+
+        return doc
+
+    @staticmethod
+    def _get_text(node: etree._Element, sep: Optional[str] = None) -> str:
+        skip_tags = ["term", "disp-formula", "inline-formula"]
+        text: str = (
+            node.text.replace("\n", " ")
+            if (node.tag not in skip_tags and node.text)
+            else ""
+        )
+        for child in list(node):
+            if child.tag not in skip_tags:
+                # TODO: apply styling according to child.tag when supported by docling-core
+                text += JatsDocumentBackend._get_text(child, sep)
+            if sep:
+                text = text.rstrip(sep) + sep
+            text += child.tail.replace("\n", " ") if child.tail else ""
+
+        return text
+
+    def _find_metadata(self) -> Optional[etree._Element]:
+        meta_names: list[str] = ["article-meta", "book-part-meta"]
+        meta: Optional[etree._Element] = None
+        for name in meta_names:
+            node = self.tree.xpath(f".//{name}")
+            if len(node) > 0:
+                meta = node[0]
+                break
+
+        return meta
+
+    def _parse_abstract(self) -> list[Abstract]:
+        # TODO: address cases with multiple sections
+        abs_list: list[Abstract] = []
+
+        for abs_node in self.tree.xpath(".//abstract"):
+            abstract: Abstract = dict(label="", content="")
+            texts = []
+            for abs_par in abs_node.xpath("p"):
+                texts.append(JatsDocumentBackend._get_text(abs_par).strip())
+            abstract["content"] = " ".join(texts)
+
+            label_node = abs_node.xpath("title|label")
+            if len(label_node) > 0:
+                abstract["label"] = label_node[0].text.strip()
+
+            abs_list.append(abstract)
+
+        return abs_list
+
+    def _parse_authors(self) -> list[Author]:
+        # Get mapping between affiliation ids and names
+        authors: list[Author] = []
+        meta: Optional[etree._Element] = self._find_metadata()
+        if meta is None:
+            return authors
+
+        affiliation_names = []
+        for affiliation_node in meta.xpath(".//aff[@id]"):
+            aff = ", ".join([t for t in affiliation_node.itertext() if t.strip()])
+            aff = aff.replace("\n", " ")
+            label = affiliation_node.xpath("label")
+            if label:
+                # TODO: once superscript is supported, add label with formatting
+                aff = aff.removeprefix(f"{label[0].text}, ")
+            affiliation_names.append(aff)
+        affiliation_ids_names = {
+            id: name
+            for id, name in zip(meta.xpath(".//aff[@id]/@id"), affiliation_names)
+        }
+
+        # Get author names and affiliation names
+        for author_node in meta.xpath(
+            './/contrib-group/contrib[@contrib-type="author"]'
+        ):
+            author: Author = {
+                "name": "",
+                "affiliation_names": [],
+            }
+
+            # Affiliation names
+            affiliation_ids = [
+                a.attrib["rid"] for a in author_node.xpath('xref[@ref-type="aff"]')
+            ]
+            for id in affiliation_ids:
+                if id in affiliation_ids_names:
+                    author["affiliation_names"].append(affiliation_ids_names[id])
+
+            # Name
+            author["name"] = (
+                author_node.xpath("name/given-names")[0].text
+                + " "
+                + author_node.xpath("name/surname")[0].text
+            )
+
+            authors.append(author)
+
+        return authors
+
+    def _parse_title(self) -> str:
+        meta_names: list[str] = [
+            "article-meta",
+            "collection-meta",
+            "book-meta",
+            "book-part-meta",
+        ]
+        title_names: list[str] = ["article-title", "subtitle", "title", "label"]
+        titles: list[str] = [
+            " ".join(
+                elem.text.replace("\n", " ").strip()
+                for elem in list(title_node)
+                if elem.tag in title_names
+            ).strip()
+            for title_node in self.tree.xpath(
+                "|".join([f".//{item}/title-group" for item in meta_names])
+            )
+        ]
+
+        text = " - ".join(titles)
+
+        return text
+
+    def _parse_metadata(self) -> XMLComponents:
+        """Parsing JATS document metadata."""
+        xml_components: XMLComponents = {
+            "title": self._parse_title(),
+            "authors": self._parse_authors(),
+            "abstract": self._parse_abstract(),
+        }
+        return xml_components
+
+    def _add_abstract(
+        self, doc: DoclingDocument, xml_components: XMLComponents
+    ) -> None:
+
+        for abstract in xml_components["abstract"]:
+            text: str = abstract["content"]
+            title: str = abstract["label"] or DEFAULT_HEADER_ABSTRACT
+            if not text:
+                continue
+            parent = doc.add_heading(parent=self.root, text=title)
+            doc.add_text(
+                parent=parent,
+                text=text,
+                label=DocItemLabel.TEXT,
+            )
+
+        return
+
+    def _add_authors(self, doc: DoclingDocument, xml_components: XMLComponents) -> None:
+        # TODO: once docling supports text formatting, add affiliation reference to
+        # author names through superscripts
+        authors: list = [item["name"] for item in xml_components["authors"]]
+        authors_str = ", ".join(authors)
+        affiliations: list = [
+            item
+            for author in xml_components["authors"]
+            for item in author["affiliation_names"]
+        ]
+        affiliations_str = "; ".join(list(dict.fromkeys(affiliations)))
+        if authors_str:
+            doc.add_text(
+                parent=self.root,
+                text=authors_str,
+                label=DocItemLabel.PARAGRAPH,
+            )
+        if affiliations_str:
+            doc.add_text(
+                parent=self.root,
+                text=affiliations_str,
+                label=DocItemLabel.PARAGRAPH,
+            )
+
+        return
+
+    def _add_citation(self, doc: DoclingDocument, parent: NodeItem, text: str) -> None:
+        if isinstance(parent, GroupItem) and parent.label == GroupLabel.LIST:
+            doc.add_list_item(text=text, enumerated=False, parent=parent)
+        else:
+            doc.add_text(text=text, label=DocItemLabel.TEXT, parent=parent)
+
+        return
+
+    def _parse_element_citation(self, node: etree._Element) -> str:
+        citation: Citation = {
+            "author_names": "",
+            "title": "",
+            "source": "",
+            "year": "",
+            "volume": "",
+            "page": "",
+            "pub_id": "",
+            "publisher_name": "",
+            "publisher_loc": "",
+        }
+
+        _log.debug("Citation parsing started")
+
+        # Author names
+        names = []
+        for name_node in node.xpath(".//name"):
+            name_str = (
+                name_node.xpath("surname")[0].text.replace("\n", " ").strip()
+                + " "
+                + name_node.xpath("given-names")[0].text.replace("\n", " ").strip()
+            )
+            names.append(name_str)
+        etal_node = node.xpath(".//etal")
+        if len(etal_node) > 0:
+            etal_text = etal_node[0].text or DEFAULT_TEXT_ETAL
+            names.append(etal_text)
+        citation["author_names"] = ", ".join(names)
+
+        titles: list[str] = [
+            "article-title",
+            "chapter-title",
+            "data-title",
+            "issue-title",
+            "part-title",
+            "trans-title",
+        ]
+        title_node: Optional[etree._Element] = None
+        for name in titles:
+            name_node = node.xpath(name)
+            if len(name_node) > 0:
+                title_node = name_node[0]
+                break
+        citation["title"] = (
+            JatsDocumentBackend._get_text(title_node)
+            if title_node is not None
+            else node.text.replace("\n", " ").strip()
+        )
+
+        # Journal, year, publisher name, publisher location, volume, elocation
+        fields: list[str] = [
+            "source",
+            "year",
+            "publisher-name",
+            "publisher-loc",
+            "volume",
+        ]
+        for item in fields:
+            item_node = node.xpath(item)
+            if len(item_node) > 0:
+                citation[item.replace("-", "_")] = (  # type: ignore[literal-required]
+                    item_node[0].text.replace("\n", " ").strip()
+                )
+
+        # Publication identifier
+        if len(node.xpath("pub-id")) > 0:
+            pub_id: list[str] = []
+            for id_node in node.xpath("pub-id"):
+                id_type = id_node.get("assigning-authority") or id_node.get(
+                    "pub-id-type"
+                )
+                id_text = id_node.text
+                if id_type and id_text:
+                    pub_id.append(
+                        id_type.replace("\n", " ").strip().upper()
+                        + ": "
+                        + id_text.replace("\n", " ").strip()
+                    )
+            if pub_id:
+                citation["pub_id"] = ", ".join(pub_id)
+
+        # Pages
+        if len(node.xpath("elocation-id")) > 0:
+            citation["page"] = (
+                node.xpath("elocation-id")[0].text.replace("\n", " ").strip()
+            )
+        elif len(node.xpath("fpage")) > 0:
+            citation["page"] = node.xpath("fpage")[0].text.replace("\n", " ").strip()
+            if len(node.xpath("lpage")) > 0:
+                citation["page"] += (
+                    "–" + node.xpath("lpage")[0].text.replace("\n", " ").strip()
+                )
+
+        # Flatten the citation to string
+
+        text = ""
+        if citation["author_names"]:
+            text += citation["author_names"].rstrip(".") + ". "
+        if citation["title"]:
+            text += citation["title"] + ". "
+        if citation["source"]:
+            text += citation["source"] + ". "
+        if citation["publisher_name"]:
+            if citation["publisher_loc"]:
+                text += f"{citation['publisher_loc']}: "
+            text += citation["publisher_name"] + ". "
+        if citation["volume"]:
+            text = text.rstrip(". ")
+            text += f" {citation['volume']}. "
+        if citation["page"]:
+            text = text.rstrip(". ")
+            if citation["volume"]:
+                text += ":"
+            text += citation["page"] + ". "
+        if citation["year"]:
+            text = text.rstrip(". ")
+            text += f" ({citation['year']})."
+        if citation["pub_id"]:
+            text = text.rstrip(".") + ". "
+            text += citation["pub_id"]
+
+        _log.debug("Citation flattened")
+
+        return text
+
+    def _add_equation(
+        self, doc: DoclingDocument, parent: NodeItem, node: etree._Element
+    ) -> None:
+        math_text = node.text
+        math_parts = math_text.split("$$")
+        if len(math_parts) == 3:
+            math_formula = math_parts[1]
+            doc.add_text(label=DocItemLabel.FORMULA, text=math_formula, parent=parent)
+
+        return
+
+    def _add_figure_captions(
+        self, doc: DoclingDocument, parent: NodeItem, node: etree._Element
+    ) -> None:
+        label_node = node.xpath("label")
+        label: Optional[str] = (
+            JatsDocumentBackend._get_text(label_node[0]).strip() if label_node else ""
+        )
+
+        caption_node = node.xpath("caption")
+        caption: Optional[str]
+        if len(caption_node) > 0:
+            caption = ""
+            for caption_par in list(caption_node[0]):
+                if caption_par.xpath(".//supplementary-material"):
+                    continue
+                caption += JatsDocumentBackend._get_text(caption_par).strip() + " "
+            caption = caption.strip()
+        else:
+            caption = None
+
+        # TODO: format label vs caption once styling is supported
+        fig_text: str = f"{label}{' ' if label and caption else ''}{caption}"
+        fig_caption: Optional[TextItem] = (
+            doc.add_text(label=DocItemLabel.CAPTION, text=fig_text)
+            if fig_text
+            else None
+        )
+
+        doc.add_picture(parent=parent, caption=fig_caption)
+
+        return
+
+    # TODO: add footnotes when DocItemLabel.FOOTNOTE and styling are supported
+    # def _add_footnote_group(self, doc: DoclingDocument, parent: NodeItem, node: etree._Element) -> None:
+    #     new_parent = doc.add_group(label=GroupLabel.LIST, name="footnotes", parent=parent)
+    #     for child in node.iterchildren(tag="fn"):
+    #         text = JatsDocumentBackend._get_text(child)
+    #         doc.add_list_item(text=text, parent=new_parent)
+
+    def _add_metadata(
+        self, doc: DoclingDocument, xml_components: XMLComponents
+    ) -> None:
+        self._add_title(doc, xml_components)
+        self._add_authors(doc, xml_components)
+        self._add_abstract(doc, xml_components)
+
+        return
+
+    def _add_table(
+        self, doc: DoclingDocument, parent: NodeItem, table_xml_component: Table
+    ) -> None:
+        soup = BeautifulSoup(table_xml_component["content"], "html.parser")
+        table_tag = soup.find("table")
+        if not isinstance(table_tag, Tag):
+            return
+
+        data = HTMLDocumentBackend.parse_table_data(table_tag)
+
+        # TODO: format label vs caption once styling is supported
+        label = table_xml_component["label"]
+        caption = table_xml_component["caption"]
+        table_text: str = f"{label}{' ' if label and caption else ''}{caption}"
+        table_caption: Optional[TextItem] = (
+            doc.add_text(label=DocItemLabel.CAPTION, text=table_text)
+            if table_text
+            else None
+        )
+
+        if data is not None:
+            doc.add_table(data=data, parent=parent, caption=table_caption)
+
+        return
+
+    def _add_tables(
+        self, doc: DoclingDocument, parent: NodeItem, node: etree._Element
+    ) -> None:
+        table: Table = {"label": "", "caption": "", "content": ""}
+
+        # Content
+        if len(node.xpath("table")) > 0:
+            table_content_node = node.xpath("table")[0]
+        elif len(node.xpath("alternatives/table")) > 0:
+            table_content_node = node.xpath("alternatives/table")[0]
+        else:
+            table_content_node = None
+        if table_content_node is not None:
+            table["content"] = etree.tostring(table_content_node).decode("utf-8")
+
+        # Caption
+        caption_node = node.xpath("caption")
+        caption: Optional[str]
+        if caption_node:
+            caption = ""
+            for caption_par in list(caption_node[0]):
+                if caption_par.xpath(".//supplementary-material"):
+                    continue
+                caption += JatsDocumentBackend._get_text(caption_par).strip() + " "
+            caption = caption.strip()
+        else:
+            caption = None
+        if caption is not None:
+            table["caption"] = caption
+
+        # Label
+        if len(node.xpath("label")) > 0:
+            table["label"] = node.xpath("label")[0].text
+
+        try:
+            self._add_table(doc, parent, table)
+        except Exception as e:
+            _log.warning(f"Skipping unsupported table in {str(self.file)}")
+            pass
+
+        return
+
+    def _add_title(self, doc: DoclingDocument, xml_components: XMLComponents) -> None:
+        self.root = doc.add_text(
+            parent=None,
+            text=xml_components["title"],
+            label=DocItemLabel.TITLE,
+        )
+        return
+
+    def _walk_linear(
+        self, doc: DoclingDocument, parent: NodeItem, node: etree._Element
+    ) -> str:
+        skip_tags = ["term"]
+        flush_tags = ["ack", "sec", "list", "boxed-text", "disp-formula", "fig"]
+        new_parent: NodeItem = parent
+        node_text: str = (
+            node.text.replace("\n", " ")
+            if (node.tag not in skip_tags and node.text)
+            else ""
+        )
+
+        for child in list(node):
+            stop_walk: bool = False
+
+            # flush text into TextItem for some tags in paragraph nodes
+            if node.tag == "p" and node_text.strip() and child.tag in flush_tags:
+                doc.add_text(
+                    label=DocItemLabel.TEXT, text=node_text.strip(), parent=parent
+                )
+                node_text = ""
+
+            # add elements and decide whether to stop walking
+            if child.tag in ("sec", "ack"):
+                header = child.xpath("title|label")
+                text: Optional[str] = None
+                if len(header) > 0:
+                    text = JatsDocumentBackend._get_text(header[0])
+                elif child.tag == "ack":
+                    text = DEFAULT_HEADER_ACKNOWLEDGMENTS
+                if text:
+                    new_parent = doc.add_heading(text=text, parent=parent)
+            elif child.tag == "list":
+                new_parent = doc.add_group(
+                    label=GroupLabel.LIST, name="list", parent=parent
+                )
+            elif child.tag == "list-item":
+                # TODO: address any type of content (another list, formula,...)
+                # TODO: address list type and item label
+                text = JatsDocumentBackend._get_text(child).strip()
+                new_parent = doc.add_list_item(text=text, parent=parent)
+                stop_walk = True
+            elif child.tag == "fig":
+                self._add_figure_captions(doc, parent, child)
+                stop_walk = True
+            elif child.tag == "table-wrap":
+                self._add_tables(doc, parent, child)
+                stop_walk = True
+            elif child.tag == "suplementary-material":
+                stop_walk = True
+            elif child.tag == "fn-group":
+                # header = child.xpath(".//title") or child.xpath(".//label")
+                # if header:
+                #     text = JatsDocumentBackend._get_text(header[0])
+                #     fn_parent = doc.add_heading(text=text, parent=new_parent)
+                # self._add_footnote_group(doc, fn_parent, child)
+                stop_walk = True
+            elif child.tag == "ref-list" and node.tag != "ref-list":
+                header = child.xpath("title|label")
+                text = (
+                    JatsDocumentBackend._get_text(header[0])
+                    if len(header) > 0
+                    else DEFAULT_HEADER_REFERENCES
+                )
+                new_parent = doc.add_heading(text=text, parent=parent)
+                new_parent = doc.add_group(
+                    parent=new_parent, label=GroupLabel.LIST, name="list"
+                )
+            elif child.tag == "element-citation":
+                text = self._parse_element_citation(child)
+                self._add_citation(doc, parent, text)
+                stop_walk = True
+            elif child.tag == "mixed-citation":
+                text = JatsDocumentBackend._get_text(child).strip()
+                self._add_citation(doc, parent, text)
+                stop_walk = True
+            elif child.tag == "tex-math":
+                self._add_equation(doc, parent, child)
+                stop_walk = True
+            elif child.tag == "inline-formula":
+                # TODO: address inline formulas when supported by docling-core
+                stop_walk = True
+
+            # step into child
+            if not stop_walk:
+                new_text = self._walk_linear(doc, new_parent, child)
+                if not (node.getparent().tag == "p" and node.tag in flush_tags):
+                    node_text += new_text
+
+            # pick up the tail text
+            node_text += child.tail.replace("\n", " ") if child.tail else ""
+
+        # create paragraph
+        if node.tag == "p" and node_text.strip():
+            doc.add_text(label=DocItemLabel.TEXT, text=node_text.strip(), parent=parent)
+            return ""
+        else:
+            # backpropagate the text
+            return node_text
diff --git a/docling/backend/xml/pubmed_backend.py b/docling/backend/xml/pubmed_backend.py
deleted file mode 100755
index acbcd4e1..00000000
--- a/docling/backend/xml/pubmed_backend.py
+++ /dev/null
@@ -1,592 +0,0 @@
-import logging
-from io import BytesIO
-from pathlib import Path
-from typing import Any, Set, Union
-
-import lxml
-from bs4 import BeautifulSoup
-from docling_core.types.doc import (
-    DocItemLabel,
-    DoclingDocument,
-    DocumentOrigin,
-    GroupLabel,
-    TableCell,
-    TableData,
-)
-from lxml import etree
-from typing_extensions import TypedDict, override
-
-from docling.backend.abstract_backend import DeclarativeDocumentBackend
-from docling.datamodel.base_models import InputFormat
-from docling.datamodel.document import InputDocument
-
-_log = logging.getLogger(__name__)
-
-
-class Paragraph(TypedDict):
-    text: str
-    headers: list[str]
-
-
-class Author(TypedDict):
-    name: str
-    affiliation_names: list[str]
-
-
-class Table(TypedDict):
-    label: str
-    caption: str
-    content: str
-
-
-class FigureCaption(TypedDict):
-    label: str
-    caption: str
-
-
-class Reference(TypedDict):
-    author_names: str
-    title: str
-    journal: str
-    year: str
-
-
-class XMLComponents(TypedDict):
-    title: str
-    authors: list[Author]
-    abstract: str
-    paragraphs: list[Paragraph]
-    tables: list[Table]
-    figure_captions: list[FigureCaption]
-    references: list[Reference]
-
-
-class PubMedDocumentBackend(DeclarativeDocumentBackend):
-    """
-    The code from this document backend has been developed by modifying parts of the PubMed Parser library (version 0.5.0, released on 12.08.2024):
-    Achakulvisut et al., (2020).
-    Pubmed Parser: A Python Parser for PubMed Open-Access XML Subset and MEDLINE XML Dataset XML Dataset.
-    Journal of Open Source Software, 5(46), 1979,
-    https://doi.org/10.21105/joss.01979
-    """
-
-    @override
-    def __init__(self, in_doc: "InputDocument", path_or_stream: Union[BytesIO, Path]):
-        super().__init__(in_doc, path_or_stream)
-        self.path_or_stream = path_or_stream
-
-        # Initialize parents for the document hierarchy
-        self.parents: dict = {}
-
-        self.valid = False
-        try:
-            if isinstance(self.path_or_stream, BytesIO):
-                self.path_or_stream.seek(0)
-            self.tree: lxml.etree._ElementTree = etree.parse(self.path_or_stream)
-            if "/NLM//DTD JATS" in self.tree.docinfo.public_id:
-                self.valid = True
-        except Exception as exc:
-            raise RuntimeError(
-                f"Could not initialize PubMed backend for file with hash {self.document_hash}."
-            ) from exc
-
-    @override
-    def is_valid(self) -> bool:
-        return self.valid
-
-    @classmethod
-    @override
-    def supports_pagination(cls) -> bool:
-        return False
-
-    @override
-    def unload(self):
-        if isinstance(self.path_or_stream, BytesIO):
-            self.path_or_stream.close()
-        self.path_or_stream = None
-
-    @classmethod
-    @override
-    def supported_formats(cls) -> Set[InputFormat]:
-        return {InputFormat.XML_PUBMED}
-
-    @override
-    def convert(self) -> DoclingDocument:
-        # Create empty document
-        origin = DocumentOrigin(
-            filename=self.file.name or "file",
-            mimetype="application/xml",
-            binary_hash=self.document_hash,
-        )
-        doc = DoclingDocument(name=self.file.stem or "file", origin=origin)
-
-        _log.debug("Trying to convert PubMed XML document...")
-
-        # Get parsed XML components
-        xml_components: XMLComponents = self._parse()
-
-        # Add XML components to the document
-        doc = self._populate_document(doc, xml_components)
-        return doc
-
-    def _parse_title(self) -> str:
-        title: str = " ".join(
-            [
-                t.replace("\n", "")
-                for t in self.tree.xpath(".//title-group/article-title")[0].itertext()
-            ]
-        )
-        return title
-
-    def _parse_authors(self) -> list[Author]:
-        # Get mapping between affiliation ids and names
-        affiliation_names = []
-        for affiliation_node in self.tree.xpath(".//aff[@id]"):
-            affiliation_names.append(
-                ": ".join([t for t in affiliation_node.itertext() if t != "\n"])
-            )
-        affiliation_ids_names = {
-            id: name
-            for id, name in zip(self.tree.xpath(".//aff[@id]/@id"), affiliation_names)
-        }
-
-        # Get author names and affiliation names
-        authors: list[Author] = []
-        for author_node in self.tree.xpath(
-            './/contrib-group/contrib[@contrib-type="author"]'
-        ):
-            author: Author = {
-                "name": "",
-                "affiliation_names": [],
-            }
-
-            # Affiliation names
-            affiliation_ids = [
-                a.attrib["rid"] for a in author_node.xpath('xref[@ref-type="aff"]')
-            ]
-            for id in affiliation_ids:
-                if id in affiliation_ids_names:
-                    author["affiliation_names"].append(affiliation_ids_names[id])
-
-            # Name
-            author["name"] = (
-                author_node.xpath("name/surname")[0].text
-                + " "
-                + author_node.xpath("name/given-names")[0].text
-            )
-
-            authors.append(author)
-        return authors
-
-    def _parse_abstract(self) -> str:
-        texts = []
-        for abstract_node in self.tree.xpath(".//abstract"):
-            for text in abstract_node.itertext():
-                texts.append(text.replace("\n", ""))
-        abstract: str = "".join(texts)
-        return abstract
-
-    def _parse_main_text(self) -> list[Paragraph]:
-        paragraphs: list[Paragraph] = []
-        for paragraph_node in self.tree.xpath("//body//p"):
-            # Skip captions
-            if "/caption" in paragraph_node.getroottree().getpath(paragraph_node):
-                continue
-
-            paragraph: Paragraph = {"text": "", "headers": []}
-
-            # Text
-            paragraph["text"] = "".join(
-                [t.replace("\n", "") for t in paragraph_node.itertext()]
-            )
-
-            # Header
-            path = "../title"
-            while len(paragraph_node.xpath(path)) > 0:
-                paragraph["headers"].append(
-                    "".join(
-                        [
-                            t.replace("\n", "")
-                            for t in paragraph_node.xpath(path)[0].itertext()
-                        ]
-                    )
-                )
-                path = "../" + path
-
-            paragraphs.append(paragraph)
-
-        return paragraphs
-
-    def _parse_tables(self) -> list[Table]:
-        tables: list[Table] = []
-        for table_node in self.tree.xpath(".//body//table-wrap"):
-            table: Table = {"label": "", "caption": "", "content": ""}
-
-            # Content
-            if len(table_node.xpath("table")) > 0:
-                table_content_node = table_node.xpath("table")[0]
-            elif len(table_node.xpath("alternatives/table")) > 0:
-                table_content_node = table_node.xpath("alternatives/table")[0]
-            else:
-                table_content_node = None
-            if table_content_node != None:
-                table["content"] = etree.tostring(table_content_node).decode("utf-8")
-
-            # Caption
-            if len(table_node.xpath("caption/p")) > 0:
-                caption_node = table_node.xpath("caption/p")[0]
-            elif len(table_node.xpath("caption/title")) > 0:
-                caption_node = table_node.xpath("caption/title")[0]
-            else:
-                caption_node = None
-            if caption_node != None:
-                table["caption"] = "".join(
-                    [t.replace("\n", "") for t in caption_node.itertext()]
-                )
-
-            # Label
-            if len(table_node.xpath("label")) > 0:
-                table["label"] = table_node.xpath("label")[0].text
-
-            tables.append(table)
-        return tables
-
-    def _parse_figure_captions(self) -> list[FigureCaption]:
-        figure_captions: list[FigureCaption] = []
-
-        if not (self.tree.xpath(".//fig")):
-            return figure_captions
-
-        for figure_node in self.tree.xpath(".//fig"):
-            figure_caption: FigureCaption = {
-                "caption": "",
-                "label": "",
-            }
-
-            # Label
-            if figure_node.xpath("label"):
-                figure_caption["label"] = "".join(
-                    [
-                        t.replace("\n", "")
-                        for t in figure_node.xpath("label")[0].itertext()
-                    ]
-                )
-
-            # Caption
-            if figure_node.xpath("caption"):
-                caption = ""
-                for caption_node in figure_node.xpath("caption")[0].getchildren():
-                    caption += (
-                        "".join([t.replace("\n", "") for t in caption_node.itertext()])
-                        + "\n"
-                    )
-                figure_caption["caption"] = caption
-
-            figure_captions.append(figure_caption)
-
-        return figure_captions
-
-    def _parse_references(self) -> list[Reference]:
-        references: list[Reference] = []
-        for reference_node_abs in self.tree.xpath(".//ref-list/ref"):
-            reference: Reference = {
-                "author_names": "",
-                "title": "",
-                "journal": "",
-                "year": "",
-            }
-            reference_node: Any = None
-            for tag in ["mixed-citation", "element-citation", "citation"]:
-                if len(reference_node_abs.xpath(tag)) > 0:
-                    reference_node = reference_node_abs.xpath(tag)[0]
-                    break
-
-            if reference_node is None:
-                continue
-
-            if all(
-                not (ref_type in ["citation-type", "publication-type"])
-                for ref_type in reference_node.attrib.keys()
-            ):
-                continue
-
-            # Author names
-            names = []
-            if len(reference_node.xpath("name")) > 0:
-                for name_node in reference_node.xpath("name"):
-                    name_str = " ".join(
-                        [t.text for t in name_node.getchildren() if (t.text != None)]
-                    )
-                    names.append(name_str)
-            elif len(reference_node.xpath("person-group")) > 0:
-                for name_node in reference_node.xpath("person-group")[0]:
-                    name_str = (
-                        name_node.xpath("given-names")[0].text
-                        + " "
-                        + name_node.xpath("surname")[0].text
-                    )
-                    names.append(name_str)
-            reference["author_names"] = "; ".join(names)
-
-            # Title
-            if len(reference_node.xpath("article-title")) > 0:
-                reference["title"] = " ".join(
-                    [
-                        t.replace("\n", " ")
-                        for t in reference_node.xpath("article-title")[0].itertext()
-                    ]
-                )
-
-            # Journal
-            if len(reference_node.xpath("source")) > 0:
-                reference["journal"] = reference_node.xpath("source")[0].text
-
-            # Year
-            if len(reference_node.xpath("year")) > 0:
-                reference["year"] = reference_node.xpath("year")[0].text
-
-            if (
-                not (reference_node.xpath("article-title"))
-                and not (reference_node.xpath("journal"))
-                and not (reference_node.xpath("year"))
-            ):
-                reference["title"] = reference_node.text
-
-            references.append(reference)
-        return references
-
-    def _parse(self) -> XMLComponents:
-        """Parsing PubMed document."""
-        xml_components: XMLComponents = {
-            "title": self._parse_title(),
-            "authors": self._parse_authors(),
-            "abstract": self._parse_abstract(),
-            "paragraphs": self._parse_main_text(),
-            "tables": self._parse_tables(),
-            "figure_captions": self._parse_figure_captions(),
-            "references": self._parse_references(),
-        }
-        return xml_components
-
-    def _populate_document(
-        self, doc: DoclingDocument, xml_components: XMLComponents
-    ) -> DoclingDocument:
-        self._add_title(doc, xml_components)
-        self._add_authors(doc, xml_components)
-        self._add_abstract(doc, xml_components)
-        self._add_main_text(doc, xml_components)
-
-        if xml_components["tables"]:
-            self._add_tables(doc, xml_components)
-
-        if xml_components["figure_captions"]:
-            self._add_figure_captions(doc, xml_components)
-
-        self._add_references(doc, xml_components)
-        return doc
-
-    def _add_figure_captions(
-        self, doc: DoclingDocument, xml_components: XMLComponents
-    ) -> None:
-        self.parents["Figures"] = doc.add_heading(
-            parent=self.parents["Title"], text="Figures"
-        )
-        for figure_caption_xml_component in xml_components["figure_captions"]:
-            figure_caption_text = (
-                figure_caption_xml_component["label"]
-                + ": "
-                + figure_caption_xml_component["caption"].strip()
-            )
-            fig_caption = doc.add_text(
-                label=DocItemLabel.CAPTION, text=figure_caption_text
-            )
-            doc.add_picture(
-                parent=self.parents["Figures"],
-                caption=fig_caption,
-            )
-        return
-
-    def _add_title(self, doc: DoclingDocument, xml_components: XMLComponents) -> None:
-        self.parents["Title"] = doc.add_text(
-            parent=None,
-            text=xml_components["title"],
-            label=DocItemLabel.TITLE,
-        )
-        return
-
-    def _add_authors(self, doc: DoclingDocument, xml_components: XMLComponents) -> None:
-        authors_affiliations: list = []
-        for author in xml_components["authors"]:
-            authors_affiliations.append(author["name"])
-            authors_affiliations.append(", ".join(author["affiliation_names"]))
-        authors_affiliations_str = "; ".join(authors_affiliations)
-
-        doc.add_text(
-            parent=self.parents["Title"],
-            text=authors_affiliations_str,
-            label=DocItemLabel.PARAGRAPH,
-        )
-        return
-
-    def _add_abstract(
-        self, doc: DoclingDocument, xml_components: XMLComponents
-    ) -> None:
-        abstract_text: str = xml_components["abstract"]
-        self.parents["Abstract"] = doc.add_heading(
-            parent=self.parents["Title"], text="Abstract"
-        )
-        doc.add_text(
-            parent=self.parents["Abstract"],
-            text=abstract_text,
-            label=DocItemLabel.TEXT,
-        )
-        return
-
-    def _add_main_text(
-        self, doc: DoclingDocument, xml_components: XMLComponents
-    ) -> None:
-        added_headers: list = []
-        for paragraph in xml_components["paragraphs"]:
-            if not (paragraph["headers"]):
-                continue
-
-            # Header
-            for i, header in enumerate(reversed(paragraph["headers"])):
-                if header in added_headers:
-                    continue
-                added_headers.append(header)
-
-                if ((i - 1) >= 0) and list(reversed(paragraph["headers"]))[
-                    i - 1
-                ] in self.parents:
-                    parent = self.parents[list(reversed(paragraph["headers"]))[i - 1]]
-                else:
-                    parent = self.parents["Title"]
-
-                self.parents[header] = doc.add_heading(parent=parent, text=header)
-
-            # Paragraph text
-            if paragraph["headers"][0] in self.parents:
-                parent = self.parents[paragraph["headers"][0]]
-            else:
-                parent = self.parents["Title"]
-
-            doc.add_text(parent=parent, label=DocItemLabel.TEXT, text=paragraph["text"])
-        return
-
-    def _add_references(
-        self, doc: DoclingDocument, xml_components: XMLComponents
-    ) -> None:
-        self.parents["References"] = doc.add_heading(
-            parent=self.parents["Title"], text="References"
-        )
-        current_list = doc.add_group(
-            parent=self.parents["References"], label=GroupLabel.LIST, name="list"
-        )
-        for reference in xml_components["references"]:
-            reference_text: str = ""
-            if reference["author_names"]:
-                reference_text += reference["author_names"] + ". "
-
-            if reference["title"]:
-                reference_text += reference["title"]
-                if reference["title"][-1] != ".":
-                    reference_text += "."
-                reference_text += " "
-
-            if reference["journal"]:
-                reference_text += reference["journal"]
-
-            if reference["year"]:
-                reference_text += " (" + reference["year"] + ")"
-
-            if not (reference_text):
-                _log.debug(f"Skipping reference for: {str(self.file)}")
-                continue
-
-            doc.add_list_item(
-                text=reference_text, enumerated=False, parent=current_list
-            )
-        return
-
-    def _add_tables(self, doc: DoclingDocument, xml_components: XMLComponents) -> None:
-        self.parents["Tables"] = doc.add_heading(
-            parent=self.parents["Title"], text="Tables"
-        )
-        for table_xml_component in xml_components["tables"]:
-            try:
-                self._add_table(doc, table_xml_component)
-            except Exception as e:
-                _log.debug(f"Skipping unsupported table for: {str(self.file)}")
-                pass
-        return
-
-    def _add_table(self, doc: DoclingDocument, table_xml_component: Table) -> None:
-        soup = BeautifulSoup(table_xml_component["content"], "html.parser")
-        table_tag = soup.find("table")
-
-        nested_tables = table_tag.find("table")
-        if nested_tables:
-            _log.debug(f"Skipping nested table for: {str(self.file)}")
-            return
-
-        # Count the number of rows (number of <tr> elements)
-        num_rows = len(table_tag.find_all("tr"))
-
-        # Find the number of columns (taking into account colspan)
-        num_cols = 0
-        for row in table_tag.find_all("tr"):
-            col_count = 0
-            for cell in row.find_all(["td", "th"]):
-                colspan = int(cell.get("colspan", 1))
-                col_count += colspan
-            num_cols = max(num_cols, col_count)
-
-        grid = [[None for _ in range(num_cols)] for _ in range(num_rows)]
-
-        data = TableData(num_rows=num_rows, num_cols=num_cols, table_cells=[])
-
-        # Iterate over the rows in the table
-        for row_idx, row in enumerate(table_tag.find_all("tr")):
-            # For each row, find all the column cells (both <td> and <th>)
-            cells = row.find_all(["td", "th"])
-
-            # Check if each cell in the row is a header -> means it is a column header
-            col_header = True
-            for j, html_cell in enumerate(cells):
-                if html_cell.name == "td":
-                    col_header = False
-
-            # Extract and print the text content of each cell
-            col_idx = 0
-            for _, html_cell in enumerate(cells):
-                text = html_cell.text
-
-                col_span = int(html_cell.get("colspan", 1))
-                row_span = int(html_cell.get("rowspan", 1))
-
-                while grid[row_idx][col_idx] != None:
-                    col_idx += 1
-                for r in range(row_span):
-                    for c in range(col_span):
-                        grid[row_idx + r][col_idx + c] = text
-
-                cell = TableCell(
-                    text=text,
-                    row_span=row_span,
-                    col_span=col_span,
-                    start_row_offset_idx=row_idx,
-                    end_row_offset_idx=row_idx + row_span,
-                    start_col_offset_idx=col_idx,
-                    end_col_offset_idx=col_idx + col_span,
-                    col_header=col_header,
-                    row_header=((not col_header) and html_cell.name == "th"),
-                )
-                data.table_cells.append(cell)
-
-        table_caption = doc.add_text(
-            label=DocItemLabel.CAPTION,
-            text=table_xml_component["label"] + ": " + table_xml_component["caption"],
-        )
-        doc.add_table(data=data, parent=self.parents["Tables"], caption=table_caption)
-        return
diff --git a/docling/backend/xml/uspto_backend.py b/docling/backend/xml/uspto_backend.py
index 21001ab7..cf23e04f 100644
--- a/docling/backend/xml/uspto_backend.py
+++ b/docling/backend/xml/uspto_backend.py
@@ -14,7 +14,7 @@ from abc import ABC, abstractmethod
 from enum import Enum, unique
 from io import BytesIO
 from pathlib import Path
-from typing import Any, Final, Optional, Union
+from typing import Final, Optional, Union
 
 from bs4 import BeautifulSoup, Tag
 from docling_core.types.doc import (
@@ -1406,6 +1406,10 @@ class XmlTable:
     http://oasis-open.org/specs/soextblx.dtd
     """
 
+    class ColInfo(TypedDict):
+        ncols: int
+        colinfo: list[dict]
+
     class MinColInfoType(TypedDict):
         offset: list[int]
         colwidth: list[int]
@@ -1425,7 +1429,7 @@ class XmlTable:
         self.empty_text = ""
         self._soup = BeautifulSoup(input, features="xml")
 
-    def _create_tg_range(self, tgs: list[dict[str, Any]]) -> dict[int, ColInfoType]:
+    def _create_tg_range(self, tgs: list[ColInfo]) -> dict[int, ColInfoType]:
         """Create a unified range along the table groups.
 
         Args:
@@ -1532,19 +1536,26 @@ class XmlTable:
         Returns:
             A docling table object.
         """
-        tgs_align = []
-        tg_secs = table.find_all("tgroup")
+        tgs_align: list[XmlTable.ColInfo] = []
+        tg_secs = table("tgroup")
         if tg_secs:
             for tg_sec in tg_secs:
-                ncols = tg_sec.get("cols", None)
-                if ncols:
-                    ncols = int(ncols)
-                tg_align = {"ncols": ncols, "colinfo": []}
-                cs_secs = tg_sec.find_all("colspec")
+                if not isinstance(tg_sec, Tag):
+                    continue
+                col_val = tg_sec.get("cols")
+                ncols = (
+                    int(col_val)
+                    if isinstance(col_val, str) and col_val.isnumeric()
+                    else 1
+                )
+                tg_align: XmlTable.ColInfo = {"ncols": ncols, "colinfo": []}
+                cs_secs = tg_sec("colspec")
                 if cs_secs:
                     for cs_sec in cs_secs:
-                        colname = cs_sec.get("colname", None)
-                        colwidth = cs_sec.get("colwidth", None)
+                        if not isinstance(cs_sec, Tag):
+                            continue
+                        colname = cs_sec.get("colname")
+                        colwidth = cs_sec.get("colwidth")
                         tg_align["colinfo"].append(
                             {"colname": colname, "colwidth": colwidth}
                         )
@@ -1565,16 +1576,23 @@ class XmlTable:
         table_data: list[TableCell] = []
         i_row_global = 0
         is_row_empty: bool = True
-        tg_secs = table.find_all("tgroup")
+        tg_secs = table("tgroup")
         if tg_secs:
             for itg, tg_sec in enumerate(tg_secs):
+                if not isinstance(tg_sec, Tag):
+                    continue
                 tg_range = tgs_range[itg]
-                row_secs = tg_sec.find_all(["row", "tr"])
+                row_secs = tg_sec(["row", "tr"])
 
                 if row_secs:
                     for row_sec in row_secs:
-                        entry_secs = row_sec.find_all(["entry", "td"])
-                        is_header: bool = row_sec.parent.name in ["thead"]
+                        if not isinstance(row_sec, Tag):
+                            continue
+                        entry_secs = row_sec(["entry", "td"])
+                        is_header: bool = (
+                            row_sec.parent is not None
+                            and row_sec.parent.name == "thead"
+                        )
 
                         ncols = 0
                         local_row: list[TableCell] = []
@@ -1582,23 +1600,26 @@ class XmlTable:
                         if entry_secs:
                             wrong_nbr_cols = False
                             for ientry, entry_sec in enumerate(entry_secs):
+                                if not isinstance(entry_sec, Tag):
+                                    continue
                                 text = entry_sec.get_text().strip()
 
                                 # start-end
-                                namest = entry_sec.attrs.get("namest", None)
-                                nameend = entry_sec.attrs.get("nameend", None)
-                                if isinstance(namest, str) and namest.isnumeric():
-                                    namest = int(namest)
-                                else:
-                                    namest = ientry + 1
+                                namest = entry_sec.get("namest")
+                                nameend = entry_sec.get("nameend")
+                                start = (
+                                    int(namest)
+                                    if isinstance(namest, str) and namest.isnumeric()
+                                    else ientry + 1
+                                )
                                 if isinstance(nameend, str) and nameend.isnumeric():
-                                    nameend = int(nameend)
+                                    end = int(nameend)
                                     shift = 0
                                 else:
-                                    nameend = ientry + 2
+                                    end = ientry + 2
                                     shift = 1
 
-                                if nameend > len(tg_range["cell_offst"]):
+                                if end > len(tg_range["cell_offst"]):
                                     wrong_nbr_cols = True
                                     self.nbr_messages += 1
                                     if self.nbr_messages <= self.max_nbr_messages:
@@ -1608,8 +1629,8 @@ class XmlTable:
                                     break
 
                                 range_ = [
-                                    tg_range["cell_offst"][namest - 1],
-                                    tg_range["cell_offst"][nameend - 1] - shift,
+                                    tg_range["cell_offst"][start - 1],
+                                    tg_range["cell_offst"][end - 1] - shift,
                                 ]
 
                                 # add row and replicate cell if needed
@@ -1668,7 +1689,7 @@ class XmlTable:
             A docling table data.
         """
         section = self._soup.find("table")
-        if section is not None:
+        if isinstance(section, Tag):
             table = self._parse_table(section)
             if table.num_rows == 0 or table.num_cols == 0:
                 _log.warning("The parsed USPTO table is empty")
diff --git a/docling/cli/main.py b/docling/cli/main.py
index 7d31221d..6686da9a 100644
--- a/docling/cli/main.py
+++ b/docling/cli/main.py
@@ -219,10 +219,27 @@ def convert(
         bool,
         typer.Option(..., help="Enable the formula enrichment model in the pipeline."),
     ] = False,
+    enrich_picture_classes: Annotated[
+        bool,
+        typer.Option(
+            ...,
+            help="Enable the picture classification enrichment model in the pipeline.",
+        ),
+    ] = False,
+    enrich_picture_description: Annotated[
+        bool,
+        typer.Option(..., help="Enable the picture description model in the pipeline."),
+    ] = False,
     artifacts_path: Annotated[
         Optional[Path],
         typer.Option(..., help="If provided, the location of the model artifacts."),
     ] = None,
+    enable_remote_services: Annotated[
+        bool,
+        typer.Option(
+            ..., help="Must be enabled when using models connecting to remote services."
+        ),
+    ] = False,
     abort_on_error: Annotated[
         bool,
         typer.Option(
@@ -369,12 +386,15 @@ def convert(
 
         accelerator_options = AcceleratorOptions(num_threads=num_threads, device=device)
         pipeline_options = PdfPipelineOptions(
+            enable_remote_services=enable_remote_services,
             accelerator_options=accelerator_options,
             do_ocr=ocr,
             ocr_options=ocr_options,
             do_table_structure=True,
             do_code_enrichment=enrich_code,
             do_formula_enrichment=enrich_formula,
+            do_picture_description=enrich_picture_description,
+            do_picture_classification=enrich_picture_classes,
             document_timeout=document_timeout,
         )
         pipeline_options.table_structure_options.do_cell_matching = (
diff --git a/docling/cli/models.py b/docling/cli/models.py
new file mode 100644
index 00000000..cc4a43ac
--- /dev/null
+++ b/docling/cli/models.py
@@ -0,0 +1,131 @@
+import logging
+import warnings
+from enum import Enum
+from pathlib import Path
+from typing import Annotated, Optional
+
+import typer
+from rich.console import Console
+from rich.logging import RichHandler
+
+from docling.datamodel.settings import settings
+from docling.utils.model_downloader import download_models
+
+warnings.filterwarnings(action="ignore", category=UserWarning, module="pydantic|torch")
+warnings.filterwarnings(action="ignore", category=FutureWarning, module="easyocr")
+
+console = Console()
+err_console = Console(stderr=True)
+
+
+app = typer.Typer(
+    name="Docling models helper",
+    no_args_is_help=True,
+    add_completion=False,
+    pretty_exceptions_enable=False,
+)
+
+
+class _AvailableModels(str, Enum):
+    LAYOUT = "layout"
+    TABLEFORMER = "tableformer"
+    CODE_FORMULA = "code_formula"
+    PICTURE_CLASSIFIER = "picture_classifier"
+    SMOLVLM = "smolvlm"
+    GRANITE_VISION = "granite_vision"
+    EASYOCR = "easyocr"
+
+
+_default_models = [
+    _AvailableModels.LAYOUT,
+    _AvailableModels.TABLEFORMER,
+    _AvailableModels.CODE_FORMULA,
+    _AvailableModels.PICTURE_CLASSIFIER,
+    _AvailableModels.EASYOCR,
+]
+
+
+@app.command("download")
+def download(
+    output_dir: Annotated[
+        Path,
+        typer.Option(
+            ...,
+            "-o",
+            "--output-dir",
+            help="The directory where to download the models.",
+        ),
+    ] = (settings.cache_dir / "models"),
+    force: Annotated[
+        bool, typer.Option(..., help="If true, the download will be forced.")
+    ] = False,
+    models: Annotated[
+        Optional[list[_AvailableModels]],
+        typer.Argument(
+            help=f"Models to download (default behavior: a predefined set of models will be downloaded).",
+        ),
+    ] = None,
+    all: Annotated[
+        bool,
+        typer.Option(
+            ...,
+            "--all",
+            help="If true, all available models will be downloaded (mutually exclusive with passing specific models).",
+            show_default=True,
+        ),
+    ] = False,
+    quiet: Annotated[
+        bool,
+        typer.Option(
+            ...,
+            "-q",
+            "--quiet",
+            help="No extra output is generated, the CLI prints only the directory with the cached models.",
+        ),
+    ] = False,
+):
+    if models and all:
+        raise typer.BadParameter(
+            "Cannot simultaneously set 'all' parameter and specify models to download."
+        )
+    if not quiet:
+        FORMAT = "%(message)s"
+        logging.basicConfig(
+            level=logging.INFO,
+            format="[blue]%(message)s[/blue]",
+            datefmt="[%X]",
+            handlers=[RichHandler(show_level=False, show_time=False, markup=True)],
+        )
+    to_download = models or ([m for m in _AvailableModels] if all else _default_models)
+    output_dir = download_models(
+        output_dir=output_dir,
+        force=force,
+        progress=(not quiet),
+        with_layout=_AvailableModels.LAYOUT in to_download,
+        with_tableformer=_AvailableModels.TABLEFORMER in to_download,
+        with_code_formula=_AvailableModels.CODE_FORMULA in to_download,
+        with_picture_classifier=_AvailableModels.PICTURE_CLASSIFIER in to_download,
+        with_smolvlm=_AvailableModels.SMOLVLM in to_download,
+        with_granite_vision=_AvailableModels.GRANITE_VISION in to_download,
+        with_easyocr=_AvailableModels.EASYOCR in to_download,
+    )
+
+    if quiet:
+        typer.echo(output_dir)
+    else:
+        typer.secho(f"\nModels downloaded into: {output_dir}.", fg="green")
+
+        console.print(
+            "\n",
+            "Docling can now be configured for running offline using the local artifacts.\n\n",
+            "Using the CLI:",
+            f"`docling --artifacts-path={output_dir} FILE`",
+            "\n",
+            "Using Python: see the documentation at <https://ds4sd.github.io/docling/usage>.",
+        )
+
+
+click_app = typer.main.get_command(app)
+
+if __name__ == "__main__":
+    app()
diff --git a/docling/cli/tools.py b/docling/cli/tools.py
new file mode 100644
index 00000000..8711013c
--- /dev/null
+++ b/docling/cli/tools.py
@@ -0,0 +1,17 @@
+import typer
+
+from docling.cli.models import app as models_app
+
+app = typer.Typer(
+    name="Docling helpers",
+    no_args_is_help=True,
+    add_completion=False,
+    pretty_exceptions_enable=False,
+)
+
+app.add_typer(models_app, name="models")
+
+click_app = typer.main.get_command(app)
+
+if __name__ == "__main__":
+    app()
diff --git a/docling/datamodel/base_models.py b/docling/datamodel/base_models.py
index d1e7ce3a..3297c9a5 100644
--- a/docling/datamodel/base_models.py
+++ b/docling/datamodel/base_models.py
@@ -34,13 +34,14 @@ class InputFormat(str, Enum):
     DOCX = "docx"
     PPTX = "pptx"
     HTML = "html"
-    XML_PUBMED = "xml_pubmed"
     IMAGE = "image"
     PDF = "pdf"
     ASCIIDOC = "asciidoc"
     MD = "md"
+    CSV = "csv"
     XLSX = "xlsx"
     XML_USPTO = "xml_uspto"
+    XML_JATS = "xml_jats"
     JSON_DOCLING = "json_docling"
 
 
@@ -58,9 +59,10 @@ FormatToExtensions: Dict[InputFormat, List[str]] = {
     InputFormat.PDF: ["pdf"],
     InputFormat.MD: ["md"],
     InputFormat.HTML: ["html", "htm", "xhtml"],
-    InputFormat.XML_PUBMED: ["xml", "nxml"],
+    InputFormat.XML_JATS: ["xml", "nxml"],
     InputFormat.IMAGE: ["jpg", "jpeg", "png", "tif", "tiff", "bmp"],
     InputFormat.ASCIIDOC: ["adoc", "asciidoc", "asc"],
+    InputFormat.CSV: ["csv"],
     InputFormat.XLSX: ["xlsx"],
     InputFormat.XML_USPTO: ["xml", "txt"],
     InputFormat.JSON_DOCLING: ["json"],
@@ -77,7 +79,7 @@ FormatToMimeType: Dict[InputFormat, List[str]] = {
         "application/vnd.openxmlformats-officedocument.presentationml.presentation",
     ],
     InputFormat.HTML: ["text/html", "application/xhtml+xml"],
-    InputFormat.XML_PUBMED: ["application/xml"],
+    InputFormat.XML_JATS: ["application/xml"],
     InputFormat.IMAGE: [
         "image/png",
         "image/jpeg",
@@ -88,6 +90,7 @@ FormatToMimeType: Dict[InputFormat, List[str]] = {
     InputFormat.PDF: ["application/pdf"],
     InputFormat.ASCIIDOC: ["text/asciidoc"],
     InputFormat.MD: ["text/markdown", "text/x-markdown"],
+    InputFormat.CSV: ["text/csv"],
     InputFormat.XLSX: [
         "application/vnd.openxmlformats-officedocument.spreadsheetml.sheet"
     ],
@@ -151,6 +154,10 @@ class LayoutPrediction(BaseModel):
     clusters: List[Cluster] = []
 
 
+class VlmPrediction(BaseModel):
+    text: str = ""
+
+
 class ContainerElement(
     BasePageElement
 ):  # Used for Form and Key-Value-Regions, only for typing.
@@ -194,6 +201,7 @@ class PagePredictions(BaseModel):
     tablestructure: Optional[TableStructurePrediction] = None
     figures_classification: Optional[FigureClassificationPrediction] = None
     equations_prediction: Optional[EquationPrediction] = None
+    vlm_response: Optional[VlmPrediction] = None
 
 
 PageElement = Union[TextElement, Table, FigureElement, ContainerElement]
diff --git a/docling/datamodel/document.py b/docling/datamodel/document.py
index e37541b7..43894b07 100644
--- a/docling/datamodel/document.py
+++ b/docling/datamodel/document.py
@@ -1,3 +1,4 @@
+import csv
 import logging
 import re
 from enum import Enum
@@ -157,6 +158,8 @@ class InputDocument(BaseModel):
                     self.page_count = self._backend.page_count()
                     if not self.page_count <= self.limits.max_num_pages:
                         self.valid = False
+                    elif self.page_count < self.limits.page_range[0]:
+                        self.valid = False
 
         except (FileNotFoundError, OSError) as e:
             self.valid = False
@@ -294,6 +297,7 @@ class _DocumentConversionInput(BaseModel):
                 mime = _DocumentConversionInput._mime_from_extension(ext)
 
         mime = mime or _DocumentConversionInput._detect_html_xhtml(content)
+        mime = mime or _DocumentConversionInput._detect_csv(content)
         mime = mime or "text/plain"
         formats = MimeTypeToFormat.get(mime, [])
         if formats:
@@ -329,11 +333,11 @@ class _DocumentConversionInput(BaseModel):
                 ):
                     input_format = InputFormat.XML_USPTO
 
-                if (
-                    InputFormat.XML_PUBMED in formats
-                    and "/NLM//DTD JATS" in xml_doctype
+                if InputFormat.XML_JATS in formats and (
+                    "JATS-journalpublishing" in xml_doctype
+                    or "JATS-archive" in xml_doctype
                 ):
-                    input_format = InputFormat.XML_PUBMED
+                    input_format = InputFormat.XML_JATS
 
         elif mime == "text/plain":
             if InputFormat.XML_USPTO in formats and content_str.startswith("PATN\r\n"):
@@ -350,6 +354,8 @@ class _DocumentConversionInput(BaseModel):
             mime = FormatToMimeType[InputFormat.HTML][0]
         elif ext in FormatToExtensions[InputFormat.MD]:
             mime = FormatToMimeType[InputFormat.MD][0]
+        elif ext in FormatToExtensions[InputFormat.CSV]:
+            mime = FormatToMimeType[InputFormat.CSV][0]
         elif ext in FormatToExtensions[InputFormat.JSON_DOCLING]:
             mime = FormatToMimeType[InputFormat.JSON_DOCLING][0]
         elif ext in FormatToExtensions[InputFormat.PDF]:
@@ -390,3 +396,32 @@ class _DocumentConversionInput(BaseModel):
             return "application/xml"
 
         return None
+
+    @staticmethod
+    def _detect_csv(
+        content: bytes,
+    ) -> Optional[Literal["text/csv"]]:
+        """Guess the mime type of a CSV file from its content.
+
+        Args:
+            content: A short piece of a document from its beginning.
+
+        Returns:
+            The mime type of a CSV file, or None if the content does
+              not match any of the format.
+        """
+        content_str = content.decode("ascii", errors="ignore").strip()
+
+        # Ensure there's at least one newline (CSV is usually multi-line)
+        if "\n" not in content_str:
+            return None
+
+        # Use csv.Sniffer to detect CSV characteristics
+        try:
+            dialect = csv.Sniffer().sniff(content_str)
+            if dialect.delimiter in {",", ";", "\t", "|"}:  # Common delimiters
+                return "text/csv"
+        except csv.Error:
+            return None
+
+        return None
diff --git a/docling/datamodel/pipeline_options.py b/docling/datamodel/pipeline_options.py
index 14ca75bf..3a55ecfc 100644
--- a/docling/datamodel/pipeline_options.py
+++ b/docling/datamodel/pipeline_options.py
@@ -1,11 +1,26 @@
 import logging
 import os
+import re
+import warnings
 from enum import Enum
 from pathlib import Path
-from typing import Any, List, Literal, Optional, Union
+from typing import Annotated, Any, Dict, List, Literal, Optional, Union
 
-from pydantic import BaseModel, ConfigDict, Field, model_validator
-from pydantic_settings import BaseSettings, SettingsConfigDict
+from pydantic import (
+    AnyUrl,
+    BaseModel,
+    ConfigDict,
+    Field,
+    field_validator,
+    model_validator,
+    validator,
+)
+from pydantic_settings import (
+    BaseSettings,
+    PydanticBaseSettingsSource,
+    SettingsConfigDict,
+)
+from typing_extensions import deprecated
 
 _log = logging.getLogger(__name__)
 
@@ -25,7 +40,19 @@ class AcceleratorOptions(BaseSettings):
     )
 
     num_threads: int = 4
-    device: AcceleratorDevice = AcceleratorDevice.AUTO
+    device: Union[str, AcceleratorDevice] = "auto"
+    cuda_use_flash_attention2: bool = False
+
+    @field_validator("device")
+    def validate_device(cls, value):
+        # "auto", "cpu", "cuda", "mps", or "cuda:N"
+        if value in {d.value for d in AcceleratorDevice} or re.match(
+            r"^cuda(:\d+)?$", value
+        ):
+            return value
+        raise ValueError(
+            "Invalid device option. Use 'auto', 'cpu', 'mps', 'cuda', or 'cuda:N'."
+        )
 
     @model_validator(mode="before")
     @classmethod
@@ -41,7 +68,6 @@ class AcceleratorOptions(BaseSettings):
         """
         if isinstance(data, dict):
             input_num_threads = data.get("num_threads")
-
             # Check if to set the num_threads from the alternative envvar
             if input_num_threads is None:
                 docling_num_threads = os.getenv("DOCLING_NUM_THREADS")
@@ -184,6 +210,90 @@ class OcrMacOptions(OcrOptions):
     )
 
 
+class PictureDescriptionBaseOptions(BaseModel):
+    kind: str
+    batch_size: int = 8
+    scale: float = 2
+
+    bitmap_area_threshold: float = (
+        0.2  # percentage of the area for a bitmap to processed with the models
+    )
+
+
+class PictureDescriptionApiOptions(PictureDescriptionBaseOptions):
+    kind: Literal["api"] = "api"
+
+    url: AnyUrl = AnyUrl("http://localhost:8000/v1/chat/completions")
+    headers: Dict[str, str] = {}
+    params: Dict[str, Any] = {}
+    timeout: float = 20
+
+    prompt: str = "Describe this image in a few sentences."
+    provenance: str = ""
+
+
+class PictureDescriptionVlmOptions(PictureDescriptionBaseOptions):
+    kind: Literal["vlm"] = "vlm"
+
+    repo_id: str
+    prompt: str = "Describe this image in a few sentences."
+    # Config from here https://huggingface.co/docs/transformers/en/main_classes/text_generation#transformers.GenerationConfig
+    generation_config: Dict[str, Any] = dict(max_new_tokens=200, do_sample=False)
+
+    @property
+    def repo_cache_folder(self) -> str:
+        return self.repo_id.replace("/", "--")
+
+
+smolvlm_picture_description = PictureDescriptionVlmOptions(
+    repo_id="HuggingFaceTB/SmolVLM-256M-Instruct"
+)
+# phi_picture_description = PictureDescriptionVlmOptions(repo_id="microsoft/Phi-3-vision-128k-instruct")
+granite_picture_description = PictureDescriptionVlmOptions(
+    repo_id="ibm-granite/granite-vision-3.1-2b-preview",
+    prompt="What is shown in this image?",
+)
+
+
+class BaseVlmOptions(BaseModel):
+    kind: str
+    prompt: str
+
+
+class ResponseFormat(str, Enum):
+    DOCTAGS = "doctags"
+    MARKDOWN = "markdown"
+
+
+class HuggingFaceVlmOptions(BaseVlmOptions):
+    kind: Literal["hf_model_options"] = "hf_model_options"
+
+    repo_id: str
+    load_in_8bit: bool = True
+    llm_int8_threshold: float = 6.0
+    quantized: bool = False
+
+    response_format: ResponseFormat
+
+    @property
+    def repo_cache_folder(self) -> str:
+        return self.repo_id.replace("/", "--")
+
+
+smoldocling_vlm_conversion_options = HuggingFaceVlmOptions(
+    repo_id="ds4sd/SmolDocling-256M-preview",
+    prompt="Convert this page to docling.",
+    response_format=ResponseFormat.DOCTAGS,
+)
+
+granite_vision_vlm_conversion_options = HuggingFaceVlmOptions(
+    repo_id="ibm-granite/granite-vision-3.1-2b-preview",
+    # prompt="OCR the full page to markdown.",
+    prompt="OCR this image.",
+    response_format=ResponseFormat.MARKDOWN,
+)
+
+
 # Define an enum for the backend options
 class PdfBackend(str, Enum):
     """Enum of valid PDF backends."""
@@ -212,9 +322,27 @@ class PipelineOptions(BaseModel):
     )
     document_timeout: Optional[float] = None
     accelerator_options: AcceleratorOptions = AcceleratorOptions()
+    enable_remote_services: bool = False
 
 
-class PdfPipelineOptions(PipelineOptions):
+class PaginatedPipelineOptions(PipelineOptions):
+    images_scale: float = 1.0
+    generate_page_images: bool = False
+    generate_picture_images: bool = False
+
+
+class VlmPipelineOptions(PaginatedPipelineOptions):
+    artifacts_path: Optional[Union[Path, str]] = None
+
+    generate_page_images: bool = True
+    force_backend_text: bool = (
+        False  # (To be used with vlms, or other generative models)
+    )
+    # If True, text from backend will be used instead of generated text
+    vlm_options: Union[HuggingFaceVlmOptions] = smoldocling_vlm_conversion_options
+
+
+class PdfPipelineOptions(PaginatedPipelineOptions):
     """Options for the PDF pipeline."""
 
     artifacts_path: Optional[Union[Path, str]] = None
@@ -223,6 +351,11 @@ class PdfPipelineOptions(PipelineOptions):
     do_code_enrichment: bool = False  # True: perform code OCR
     do_formula_enrichment: bool = False  # True: perform formula OCR, return Latex code
     do_picture_classification: bool = False  # True: classify pictures in documents
+    do_picture_description: bool = False  # True: run describe pictures in documents
+    force_backend_text: bool = (
+        False  # (To be used with vlms, or other generative models)
+    )
+    # If True, text from backend will be used instead of generated text
 
     table_structure_options: TableStructureOptions = TableStructureOptions()
     ocr_options: Union[
@@ -232,6 +365,10 @@ class PdfPipelineOptions(PipelineOptions):
         OcrMacOptions,
         RapidOcrOptions,
     ] = Field(EasyOcrOptions(), discriminator="kind")
+    picture_description_options: Annotated[
+        Union[PictureDescriptionApiOptions, PictureDescriptionVlmOptions],
+        Field(discriminator="kind"),
+    ] = smolvlm_picture_description
 
     images_scale: float = 1.0
     generate_page_images: bool = False
diff --git a/docling/datamodel/settings.py b/docling/datamodel/settings.py
index 46bab75c..fee871a2 100644
--- a/docling/datamodel/settings.py
+++ b/docling/datamodel/settings.py
@@ -1,13 +1,28 @@
 import sys
 from pathlib import Path
+from typing import Annotated, Optional, Tuple
 
-from pydantic import BaseModel
+from pydantic import BaseModel, PlainValidator
 from pydantic_settings import BaseSettings, SettingsConfigDict
 
 
+def _validate_page_range(v: Tuple[int, int]) -> Tuple[int, int]:
+    if v[0] < 1 or v[1] < v[0]:
+        raise ValueError(
+            "Invalid page range: start must be ≥ 1 and end must be ≥ start."
+        )
+    return v
+
+
+PageRange = Annotated[Tuple[int, int], PlainValidator(_validate_page_range)]
+
+DEFAULT_PAGE_RANGE: PageRange = (1, sys.maxsize)
+
+
 class DocumentLimits(BaseModel):
     max_num_pages: int = sys.maxsize
     max_file_size: int = sys.maxsize
+    page_range: PageRange = DEFAULT_PAGE_RANGE
 
 
 class BatchConcurrencySettings(BaseModel):
@@ -46,5 +61,8 @@ class AppSettings(BaseSettings):
     perf: BatchConcurrencySettings
     debug: DebugSettings
 
+    cache_dir: Path = Path.home() / ".cache" / "docling"
+    artifacts_path: Optional[Path] = None
+
 
 settings = AppSettings(perf=BatchConcurrencySettings(), debug=DebugSettings())
diff --git a/docling/document_converter.py b/docling/document_converter.py
index 13203ea7..d52efcea 100644
--- a/docling/document_converter.py
+++ b/docling/document_converter.py
@@ -1,14 +1,16 @@
 import logging
+import math
 import sys
 import time
 from functools import partial
 from pathlib import Path
-from typing import Dict, Iterable, Iterator, List, Optional, Type, Union
+from typing import Dict, Iterable, Iterator, List, Optional, Tuple, Type, Union
 
 from pydantic import BaseModel, ConfigDict, model_validator, validate_call
 
 from docling.backend.abstract_backend import AbstractDocumentBackend
 from docling.backend.asciidoc_backend import AsciiDocBackend
+from docling.backend.csv_backend import CsvDocumentBackend
 from docling.backend.docling_parse_v2_backend import DoclingParseV2DocumentBackend
 from docling.backend.html_backend import HTMLDocumentBackend
 from docling.backend.json.docling_json_backend import DoclingJSONBackend
@@ -16,7 +18,7 @@ from docling.backend.md_backend import MarkdownDocumentBackend
 from docling.backend.msexcel_backend import MsExcelDocumentBackend
 from docling.backend.mspowerpoint_backend import MsPowerpointDocumentBackend
 from docling.backend.msword_backend import MsWordDocumentBackend
-from docling.backend.xml.pubmed_backend import PubMedDocumentBackend
+from docling.backend.xml.jats_backend import JatsDocumentBackend
 from docling.backend.xml.uspto_backend import PatentUsptoDocumentBackend
 from docling.datamodel.base_models import (
     ConversionStatus,
@@ -31,7 +33,12 @@ from docling.datamodel.document import (
     _DocumentConversionInput,
 )
 from docling.datamodel.pipeline_options import PipelineOptions
-from docling.datamodel.settings import DocumentLimits, settings
+from docling.datamodel.settings import (
+    DEFAULT_PAGE_RANGE,
+    DocumentLimits,
+    PageRange,
+    settings,
+)
 from docling.exceptions import ConversionError
 from docling.pipeline.base_pipeline import BasePipeline
 from docling.pipeline.simple_pipeline import SimplePipeline
@@ -55,6 +62,11 @@ class FormatOption(BaseModel):
         return self
 
 
+class CsvFormatOption(FormatOption):
+    pipeline_cls: Type = SimplePipeline
+    backend: Type[AbstractDocumentBackend] = CsvDocumentBackend
+
+
 class ExcelFormatOption(FormatOption):
     pipeline_cls: Type = SimplePipeline
     backend: Type[AbstractDocumentBackend] = MsExcelDocumentBackend
@@ -90,9 +102,9 @@ class PatentUsptoFormatOption(FormatOption):
     backend: Type[PatentUsptoDocumentBackend] = PatentUsptoDocumentBackend
 
 
-class XMLPubMedFormatOption(FormatOption):
+class XMLJatsFormatOption(FormatOption):
     pipeline_cls: Type = SimplePipeline
-    backend: Type[AbstractDocumentBackend] = PubMedDocumentBackend
+    backend: Type[AbstractDocumentBackend] = JatsDocumentBackend
 
 
 class ImageFormatOption(FormatOption):
@@ -107,6 +119,9 @@ class PdfFormatOption(FormatOption):
 
 def _get_default_option(format: InputFormat) -> FormatOption:
     format_to_default_options = {
+        InputFormat.CSV: FormatOption(
+            pipeline_cls=SimplePipeline, backend=CsvDocumentBackend
+        ),
         InputFormat.XLSX: FormatOption(
             pipeline_cls=SimplePipeline, backend=MsExcelDocumentBackend
         ),
@@ -128,8 +143,8 @@ def _get_default_option(format: InputFormat) -> FormatOption:
         InputFormat.XML_USPTO: FormatOption(
             pipeline_cls=SimplePipeline, backend=PatentUsptoDocumentBackend
         ),
-        InputFormat.XML_PUBMED: FormatOption(
-            pipeline_cls=SimplePipeline, backend=PubMedDocumentBackend
+        InputFormat.XML_JATS: FormatOption(
+            pipeline_cls=SimplePipeline, backend=JatsDocumentBackend
         ),
         InputFormat.IMAGE: FormatOption(
             pipeline_cls=StandardPdfPipeline, backend=DoclingParseV2DocumentBackend
@@ -184,6 +199,7 @@ class DocumentConverter:
         raises_on_error: bool = True,
         max_num_pages: int = sys.maxsize,
         max_file_size: int = sys.maxsize,
+        page_range: PageRange = DEFAULT_PAGE_RANGE,
     ) -> ConversionResult:
         all_res = self.convert_all(
             source=[source],
@@ -191,6 +207,7 @@ class DocumentConverter:
             max_num_pages=max_num_pages,
             max_file_size=max_file_size,
             headers=headers,
+            page_range=page_range,
         )
         return next(all_res)
 
@@ -202,10 +219,12 @@ class DocumentConverter:
         raises_on_error: bool = True,  # True: raises on first conversion error; False: does not raise on conv error
         max_num_pages: int = sys.maxsize,
         max_file_size: int = sys.maxsize,
+        page_range: PageRange = DEFAULT_PAGE_RANGE,
     ) -> Iterator[ConversionResult]:
         limits = DocumentLimits(
             max_num_pages=max_num_pages,
             max_file_size=max_file_size,
+            page_range=page_range,
         )
         conv_input = _DocumentConversionInput(
             path_or_stream_iterator=source, limits=limits, headers=headers
diff --git a/docling/exceptions.py b/docling/exceptions.py
index 13145b9c..30c32066 100644
--- a/docling/exceptions.py
+++ b/docling/exceptions.py
@@ -4,3 +4,7 @@ class BaseError(RuntimeError):
 
 class ConversionError(BaseError):
     pass
+
+
+class OperationNotAllowed(BaseError):
+    pass
diff --git a/docling/models/base_model.py b/docling/models/base_model.py
index 08d728cc..9cdc0ecb 100644
--- a/docling/models/base_model.py
+++ b/docling/models/base_model.py
@@ -1,11 +1,12 @@
 from abc import ABC, abstractmethod
 from typing import Any, Generic, Iterable, Optional
 
-from docling_core.types.doc import BoundingBox, DoclingDocument, NodeItem, TextItem
+from docling_core.types.doc import BoundingBox, DocItem, DoclingDocument, NodeItem
 from typing_extensions import TypeVar
 
 from docling.datamodel.base_models import ItemAndImageEnrichmentElement, Page
 from docling.datamodel.document import ConversionResult
+from docling.datamodel.settings import settings
 
 
 class BasePageModel(ABC):
@@ -21,6 +22,8 @@ EnrichElementT = TypeVar("EnrichElementT", default=NodeItem)
 
 class GenericEnrichmentModel(ABC, Generic[EnrichElementT]):
 
+    elements_batch_size: int = settings.perf.elements_batch_size
+
     @abstractmethod
     def is_processable(self, doc: DoclingDocument, element: NodeItem) -> bool:
         pass
@@ -61,7 +64,7 @@ class BaseItemAndImageEnrichmentModel(
         if not self.is_processable(doc=conv_res.document, element=element):
             return None
 
-        assert isinstance(element, TextItem)
+        assert isinstance(element, DocItem)
         element_prov = element.prov[0]
 
         bbox = element_prov.bbox
diff --git a/docling/models/code_formula_model.py b/docling/models/code_formula_model.py
index e4d56945..1a0f0bf0 100644
--- a/docling/models/code_formula_model.py
+++ b/docling/models/code_formula_model.py
@@ -2,6 +2,7 @@ import re
 from pathlib import Path
 from typing import Iterable, List, Literal, Optional, Tuple, Union
 
+import numpy as np
 from docling_core.types.doc import (
     CodeItem,
     DocItemLabel,
@@ -61,13 +62,15 @@ class CodeFormulaModel(BaseItemAndImageEnrichmentModel):
         Processes the given batch of elements and enriches them with predictions.
     """
 
+    _model_repo_folder = "ds4sd--CodeFormula"
+    elements_batch_size = 5
     images_scale = 1.66  # = 120 dpi, aligned with training data resolution
     expansion_factor = 0.03
 
     def __init__(
         self,
         enabled: bool,
-        artifacts_path: Optional[Union[Path, str]],
+        artifacts_path: Optional[Path],
         options: CodeFormulaModelOptions,
         accelerator_options: AcceleratorOptions,
     ):
@@ -96,29 +99,32 @@ class CodeFormulaModel(BaseItemAndImageEnrichmentModel):
             )
 
             if artifacts_path is None:
-                artifacts_path = self.download_models_hf()
+                artifacts_path = self.download_models()
             else:
-                artifacts_path = Path(artifacts_path)
+                artifacts_path = artifacts_path / self._model_repo_folder
 
             self.code_formula_model = CodeFormulaPredictor(
-                artifacts_path=artifacts_path,
+                artifacts_path=str(artifacts_path),
                 device=device,
                 num_threads=accelerator_options.num_threads,
             )
 
     @staticmethod
-    def download_models_hf(
-        local_dir: Optional[Path] = None, force: bool = False
+    def download_models(
+        local_dir: Optional[Path] = None,
+        force: bool = False,
+        progress: bool = False,
     ) -> Path:
         from huggingface_hub import snapshot_download
         from huggingface_hub.utils import disable_progress_bars
 
-        disable_progress_bars()
+        if not progress:
+            disable_progress_bars()
         download_path = snapshot_download(
             repo_id="ds4sd/CodeFormula",
             force_download=force,
             local_dir=local_dir,
-            revision="v1.0.0",
+            revision="v1.0.1",
         )
 
         return Path(download_path)
@@ -226,7 +232,7 @@ class CodeFormulaModel(BaseItemAndImageEnrichmentModel):
             return
 
         labels: List[str] = []
-        images: List[Image.Image] = []
+        images: List[Union[Image.Image, np.ndarray]] = []
         elements: List[TextItem] = []
         for el in element_batch:
             assert isinstance(el.item, TextItem)
diff --git a/docling/models/document_picture_classifier.py b/docling/models/document_picture_classifier.py
index 6e2d90b4..6e71246b 100644
--- a/docling/models/document_picture_classifier.py
+++ b/docling/models/document_picture_classifier.py
@@ -1,6 +1,7 @@
 from pathlib import Path
 from typing import Iterable, List, Literal, Optional, Tuple, Union
 
+import numpy as np
 from docling_core.types.doc import (
     DoclingDocument,
     NodeItem,
@@ -55,12 +56,13 @@ class DocumentPictureClassifier(BaseEnrichmentModel):
         Processes a batch of elements and adds classification annotations.
     """
 
+    _model_repo_folder = "ds4sd--DocumentFigureClassifier"
     images_scale = 2
 
     def __init__(
         self,
         enabled: bool,
-        artifacts_path: Optional[Union[Path, str]],
+        artifacts_path: Optional[Path],
         options: DocumentPictureClassifierOptions,
         accelerator_options: AcceleratorOptions,
     ):
@@ -88,24 +90,25 @@ class DocumentPictureClassifier(BaseEnrichmentModel):
             )
 
             if artifacts_path is None:
-                artifacts_path = self.download_models_hf()
+                artifacts_path = self.download_models()
             else:
-                artifacts_path = Path(artifacts_path)
+                artifacts_path = artifacts_path / self._model_repo_folder
 
             self.document_picture_classifier = DocumentFigureClassifierPredictor(
-                artifacts_path=artifacts_path,
+                artifacts_path=str(artifacts_path),
                 device=device,
                 num_threads=accelerator_options.num_threads,
             )
 
     @staticmethod
-    def download_models_hf(
-        local_dir: Optional[Path] = None, force: bool = False
+    def download_models(
+        local_dir: Optional[Path] = None, force: bool = False, progress: bool = False
     ) -> Path:
         from huggingface_hub import snapshot_download
         from huggingface_hub.utils import disable_progress_bars
 
-        disable_progress_bars()
+        if not progress:
+            disable_progress_bars()
         download_path = snapshot_download(
             repo_id="ds4sd/DocumentFigureClassifier",
             force_download=force,
@@ -159,7 +162,7 @@ class DocumentPictureClassifier(BaseEnrichmentModel):
                 yield element
             return
 
-        images: List[Image.Image] = []
+        images: List[Union[Image.Image, np.ndarray]] = []
         elements: List[PictureItem] = []
         for el in element_batch:
             assert isinstance(el, PictureItem)
diff --git a/docling/models/ds_glm_model.py b/docling/models/ds_glm_model.py
deleted file mode 100644
index 6f7de07a..00000000
--- a/docling/models/ds_glm_model.py
+++ /dev/null
@@ -1,328 +0,0 @@
-import copy
-import random
-from pathlib import Path
-from typing import List, Union
-
-from deepsearch_glm.andromeda_nlp import nlp_model
-from docling_core.types.doc import BoundingBox, CoordOrigin, DoclingDocument
-from docling_core.types.legacy_doc.base import BoundingBox as DsBoundingBox
-from docling_core.types.legacy_doc.base import (
-    Figure,
-    PageDimensions,
-    PageReference,
-    Prov,
-    Ref,
-)
-from docling_core.types.legacy_doc.base import Table as DsSchemaTable
-from docling_core.types.legacy_doc.base import TableCell
-from docling_core.types.legacy_doc.document import BaseText
-from docling_core.types.legacy_doc.document import (
-    CCSDocumentDescription as DsDocumentDescription,
-)
-from docling_core.types.legacy_doc.document import CCSFileInfoObject as DsFileInfoObject
-from docling_core.types.legacy_doc.document import ExportedCCSDocument as DsDocument
-from PIL import ImageDraw
-from pydantic import BaseModel, ConfigDict, TypeAdapter
-
-from docling.datamodel.base_models import (
-    Cluster,
-    ContainerElement,
-    FigureElement,
-    Table,
-    TextElement,
-)
-from docling.datamodel.document import ConversionResult, layout_label_to_ds_type
-from docling.datamodel.settings import settings
-from docling.utils.glm_utils import to_docling_document
-from docling.utils.profiling import ProfilingScope, TimeRecorder
-from docling.utils.utils import create_hash
-
-
-class GlmOptions(BaseModel):
-    model_config = ConfigDict(protected_namespaces=())
-
-    model_names: str = ""  # e.g. "language;term;reference"
-
-
-class GlmModel:
-    def __init__(self, options: GlmOptions):
-        self.options = options
-
-        self.model = nlp_model(loglevel="error", text_ordering=True)
-
-    def _to_legacy_document(self, conv_res) -> DsDocument:
-        title = ""
-        desc: DsDocumentDescription = DsDocumentDescription(logs=[])
-
-        page_hashes = [
-            PageReference(
-                hash=create_hash(conv_res.input.document_hash + ":" + str(p.page_no)),
-                page=p.page_no + 1,
-                model="default",
-            )
-            for p in conv_res.pages
-        ]
-
-        file_info = DsFileInfoObject(
-            filename=conv_res.input.file.name,
-            document_hash=conv_res.input.document_hash,
-            num_pages=conv_res.input.page_count,
-            page_hashes=page_hashes,
-        )
-
-        main_text: List[Union[Ref, BaseText]] = []
-        tables: List[DsSchemaTable] = []
-        figures: List[Figure] = []
-
-        page_no_to_page = {p.page_no: p for p in conv_res.pages}
-
-        for element in conv_res.assembled.elements:
-            # Convert bboxes to lower-left origin.
-            target_bbox = DsBoundingBox(
-                element.cluster.bbox.to_bottom_left_origin(
-                    page_no_to_page[element.page_no].size.height
-                ).as_tuple()
-            )
-
-            if isinstance(element, TextElement):
-                main_text.append(
-                    BaseText(
-                        text=element.text,
-                        obj_type=layout_label_to_ds_type.get(element.label),
-                        name=element.label,
-                        prov=[
-                            Prov(
-                                bbox=target_bbox,
-                                page=element.page_no + 1,
-                                span=[0, len(element.text)],
-                            )
-                        ],
-                    )
-                )
-            elif isinstance(element, Table):
-                index = len(tables)
-                ref_str = f"#/tables/{index}"
-                main_text.append(
-                    Ref(
-                        name=element.label,
-                        obj_type=layout_label_to_ds_type.get(element.label),
-                        ref=ref_str,
-                    ),
-                )
-
-                # Initialise empty table data grid (only empty cells)
-                table_data = [
-                    [
-                        TableCell(
-                            text="",
-                            # bbox=[0,0,0,0],
-                            spans=[[i, j]],
-                            obj_type="body",
-                        )
-                        for j in range(element.num_cols)
-                    ]
-                    for i in range(element.num_rows)
-                ]
-
-                # Overwrite cells in table data for which there is actual cell content.
-                for cell in element.table_cells:
-                    for i in range(
-                        min(cell.start_row_offset_idx, element.num_rows),
-                        min(cell.end_row_offset_idx, element.num_rows),
-                    ):
-                        for j in range(
-                            min(cell.start_col_offset_idx, element.num_cols),
-                            min(cell.end_col_offset_idx, element.num_cols),
-                        ):
-                            celltype = "body"
-                            if cell.column_header:
-                                celltype = "col_header"
-                            elif cell.row_header:
-                                celltype = "row_header"
-                            elif cell.row_section:
-                                celltype = "row_section"
-
-                            def make_spans(cell):
-                                for rspan in range(
-                                    min(cell.start_row_offset_idx, element.num_rows),
-                                    min(cell.end_row_offset_idx, element.num_rows),
-                                ):
-                                    for cspan in range(
-                                        min(
-                                            cell.start_col_offset_idx, element.num_cols
-                                        ),
-                                        min(cell.end_col_offset_idx, element.num_cols),
-                                    ):
-                                        yield [rspan, cspan]
-
-                            spans = list(make_spans(cell))
-                            if cell.bbox is not None:
-                                bbox = cell.bbox.to_bottom_left_origin(
-                                    page_no_to_page[element.page_no].size.height
-                                ).as_tuple()
-                            else:
-                                bbox = None
-
-                            table_data[i][j] = TableCell(
-                                text=cell.text,
-                                bbox=bbox,
-                                # col=j,
-                                # row=i,
-                                spans=spans,
-                                obj_type=celltype,
-                                # col_span=[cell.start_col_offset_idx, cell.end_col_offset_idx],
-                                # row_span=[cell.start_row_offset_idx, cell.end_row_offset_idx]
-                            )
-
-                tables.append(
-                    DsSchemaTable(
-                        num_cols=element.num_cols,
-                        num_rows=element.num_rows,
-                        obj_type=layout_label_to_ds_type.get(element.label),
-                        data=table_data,
-                        prov=[
-                            Prov(
-                                bbox=target_bbox,
-                                page=element.page_no + 1,
-                                span=[0, 0],
-                            )
-                        ],
-                    )
-                )
-
-            elif isinstance(element, FigureElement):
-                index = len(figures)
-                ref_str = f"#/figures/{index}"
-                main_text.append(
-                    Ref(
-                        name=element.label,
-                        obj_type=layout_label_to_ds_type.get(element.label),
-                        ref=ref_str,
-                    ),
-                )
-                figures.append(
-                    Figure(
-                        prov=[
-                            Prov(
-                                bbox=target_bbox,
-                                page=element.page_no + 1,
-                                span=[0, 0],
-                            )
-                        ],
-                        obj_type=layout_label_to_ds_type.get(element.label),
-                        payload={
-                            "children": TypeAdapter(List[Cluster]).dump_python(
-                                element.cluster.children
-                            )
-                        },  # hack to channel child clusters through GLM
-                    )
-                )
-            elif isinstance(element, ContainerElement):
-                main_text.append(
-                    BaseText(
-                        text="",
-                        payload={
-                            "children": TypeAdapter(List[Cluster]).dump_python(
-                                element.cluster.children
-                            )
-                        },  # hack to channel child clusters through GLM
-                        obj_type=layout_label_to_ds_type.get(element.label),
-                        name=element.label,
-                        prov=[
-                            Prov(
-                                bbox=target_bbox,
-                                page=element.page_no + 1,
-                                span=[0, 0],
-                            )
-                        ],
-                    )
-                )
-
-        page_dimensions = [
-            PageDimensions(page=p.page_no + 1, height=p.size.height, width=p.size.width)
-            for p in conv_res.pages
-            if p.size is not None
-        ]
-
-        ds_doc: DsDocument = DsDocument(
-            name=title,
-            description=desc,
-            file_info=file_info,
-            main_text=main_text,
-            tables=tables,
-            figures=figures,
-            page_dimensions=page_dimensions,
-        )
-
-        return ds_doc
-
-    def __call__(self, conv_res: ConversionResult) -> DoclingDocument:
-        with TimeRecorder(conv_res, "glm", scope=ProfilingScope.DOCUMENT):
-            ds_doc = self._to_legacy_document(conv_res)
-            ds_doc_dict = ds_doc.model_dump(by_alias=True, exclude_none=True)
-
-            glm_doc = self.model.apply_on_doc(ds_doc_dict)
-
-            docling_doc: DoclingDocument = to_docling_document(glm_doc)  # Experimental
-
-        # DEBUG code:
-        def draw_clusters_and_cells(ds_document, page_no, show: bool = False):
-            clusters_to_draw = []
-            image = copy.deepcopy(conv_res.pages[page_no].image)
-            for ix, elem in enumerate(ds_document.main_text):
-                if isinstance(elem, BaseText):
-                    prov = elem.prov[0]  # type: ignore
-                elif isinstance(elem, Ref):
-                    _, arr, index = elem.ref.split("/")
-                    index = int(index)  # type: ignore
-                    if arr == "tables":
-                        prov = ds_document.tables[index].prov[0]
-                    elif arr == "figures":
-                        prov = ds_document.pictures[index].prov[0]
-                    else:
-                        prov = None
-
-                if prov and prov.page == page_no:
-                    clusters_to_draw.append(
-                        Cluster(
-                            id=ix,
-                            label=elem.name,
-                            bbox=BoundingBox.from_tuple(
-                                coord=prov.bbox,  # type: ignore
-                                origin=CoordOrigin.BOTTOMLEFT,
-                            ).to_top_left_origin(conv_res.pages[page_no].size.height),
-                        )
-                    )
-
-            draw = ImageDraw.Draw(image)
-            for c in clusters_to_draw:
-                x0, y0, x1, y1 = c.bbox.as_tuple()
-                draw.rectangle([(x0, y0), (x1, y1)], outline="red")
-                draw.text((x0 + 2, y0 + 2), f"{c.id}:{c.label}", fill=(255, 0, 0, 255))
-
-                cell_color = (
-                    random.randint(30, 140),
-                    random.randint(30, 140),
-                    random.randint(30, 140),
-                )
-                for tc in c.cells:  # [:1]:
-                    x0, y0, x1, y1 = tc.bbox.as_tuple()
-                    draw.rectangle([(x0, y0), (x1, y1)], outline=cell_color)
-
-            if show:
-                image.show()
-            else:
-                out_path: Path = (
-                    Path(settings.debug.debug_output_path)
-                    / f"debug_{conv_res.input.file.stem}"
-                )
-                out_path.mkdir(parents=True, exist_ok=True)
-
-                out_file = out_path / f"doc_page_{page_no:05}.png"
-                image.save(str(out_file), format="png")
-
-        # for item in ds_doc.page_dimensions:
-        #    page_no = item.page
-        #    draw_clusters_and_cells(ds_doc, page_no)
-
-        return docling_doc
diff --git a/docling/models/easyocr_model.py b/docling/models/easyocr_model.py
index bbe4fb05..0eccb988 100644
--- a/docling/models/easyocr_model.py
+++ b/docling/models/easyocr_model.py
@@ -1,9 +1,10 @@
 import logging
 import warnings
-from typing import Iterable
+import zipfile
+from pathlib import Path
+from typing import Iterable, List, Optional
 
 import numpy
-import torch
 from docling_core.types.doc import BoundingBox, CoordOrigin
 
 from docling.datamodel.base_models import Cell, OcrCell, Page
@@ -17,14 +18,18 @@ from docling.datamodel.settings import settings
 from docling.models.base_ocr_model import BaseOcrModel
 from docling.utils.accelerator_utils import decide_device
 from docling.utils.profiling import TimeRecorder
+from docling.utils.utils import download_url_with_progress
 
 _log = logging.getLogger(__name__)
 
 
 class EasyOcrModel(BaseOcrModel):
+    _model_repo_folder = "EasyOcr"
+
     def __init__(
         self,
         enabled: bool,
+        artifacts_path: Optional[Path],
         options: EasyOcrOptions,
         accelerator_options: AcceleratorOptions,
     ):
@@ -62,15 +67,55 @@ class EasyOcrModel(BaseOcrModel):
                 )
                 use_gpu = self.options.use_gpu
 
+            download_enabled = self.options.download_enabled
+            model_storage_directory = self.options.model_storage_directory
+            if artifacts_path is not None and model_storage_directory is None:
+                download_enabled = False
+                model_storage_directory = str(artifacts_path / self._model_repo_folder)
+
             self.reader = easyocr.Reader(
                 lang_list=self.options.lang,
                 gpu=use_gpu,
-                model_storage_directory=self.options.model_storage_directory,
+                model_storage_directory=model_storage_directory,
                 recog_network=self.options.recog_network,
-                download_enabled=self.options.download_enabled,
+                download_enabled=download_enabled,
                 verbose=False,
             )
 
+    @staticmethod
+    def download_models(
+        detection_models: List[str] = ["craft"],
+        recognition_models: List[str] = ["english_g2", "latin_g2"],
+        local_dir: Optional[Path] = None,
+        force: bool = False,
+        progress: bool = False,
+    ) -> Path:
+        # Models are located in https://github.com/JaidedAI/EasyOCR/blob/master/easyocr/config.py
+        from easyocr.config import detection_models as det_models_dict
+        from easyocr.config import recognition_models as rec_models_dict
+
+        if local_dir is None:
+            local_dir = settings.cache_dir / "models" / EasyOcrModel._model_repo_folder
+
+        local_dir.mkdir(parents=True, exist_ok=True)
+
+        # Collect models to download
+        download_list = []
+        for model_name in detection_models:
+            if model_name in det_models_dict:
+                download_list.append(det_models_dict[model_name])
+        for model_name in recognition_models:
+            if model_name in rec_models_dict["gen2"]:
+                download_list.append(rec_models_dict["gen2"][model_name])
+
+        # Download models
+        for model_details in download_list:
+            buf = download_url_with_progress(model_details["url"], progress=progress)
+            with zipfile.ZipFile(buf, "r") as zip_ref:
+                zip_ref.extractall(local_dir)
+
+        return local_dir
+
     def __call__(
         self, conv_res: ConversionResult, page_batch: Iterable[Page]
     ) -> Iterable[Page]:
diff --git a/docling/models/hf_vlm_model.py b/docling/models/hf_vlm_model.py
new file mode 100644
index 00000000..2acbe290
--- /dev/null
+++ b/docling/models/hf_vlm_model.py
@@ -0,0 +1,180 @@
+import logging
+import time
+from pathlib import Path
+from typing import Iterable, List, Optional
+
+from docling.datamodel.base_models import Page, VlmPrediction
+from docling.datamodel.document import ConversionResult
+from docling.datamodel.pipeline_options import (
+    AcceleratorDevice,
+    AcceleratorOptions,
+    HuggingFaceVlmOptions,
+)
+from docling.datamodel.settings import settings
+from docling.models.base_model import BasePageModel
+from docling.utils.accelerator_utils import decide_device
+from docling.utils.profiling import TimeRecorder
+
+_log = logging.getLogger(__name__)
+
+
+class HuggingFaceVlmModel(BasePageModel):
+
+    def __init__(
+        self,
+        enabled: bool,
+        artifacts_path: Optional[Path],
+        accelerator_options: AcceleratorOptions,
+        vlm_options: HuggingFaceVlmOptions,
+    ):
+        self.enabled = enabled
+
+        self.vlm_options = vlm_options
+
+        if self.enabled:
+            import torch
+            from transformers import (  # type: ignore
+                AutoModelForVision2Seq,
+                AutoProcessor,
+                BitsAndBytesConfig,
+            )
+
+            device = decide_device(accelerator_options.device)
+            self.device = device
+
+            _log.debug("Available device for HuggingFace VLM: {}".format(device))
+
+            repo_cache_folder = vlm_options.repo_id.replace("/", "--")
+
+            # PARAMETERS:
+            if artifacts_path is None:
+                artifacts_path = self.download_models(self.vlm_options.repo_id)
+            elif (artifacts_path / repo_cache_folder).exists():
+                artifacts_path = artifacts_path / repo_cache_folder
+
+            self.param_question = vlm_options.prompt  # "Perform Layout Analysis."
+            self.param_quantization_config = BitsAndBytesConfig(
+                load_in_8bit=vlm_options.load_in_8bit,  # True,
+                llm_int8_threshold=vlm_options.llm_int8_threshold,  # 6.0
+            )
+            self.param_quantized = vlm_options.quantized  # False
+
+            self.processor = AutoProcessor.from_pretrained(artifacts_path)
+            if not self.param_quantized:
+                self.vlm_model = AutoModelForVision2Seq.from_pretrained(
+                    artifacts_path,
+                    device_map=device,
+                    torch_dtype=torch.bfloat16,
+                    _attn_implementation=(
+                        "flash_attention_2"
+                        if self.device.startswith("cuda")
+                        and accelerator_options.cuda_use_flash_attention2
+                        else "eager"
+                    ),
+                )  # .to(self.device)
+
+            else:
+                self.vlm_model = AutoModelForVision2Seq.from_pretrained(
+                    artifacts_path,
+                    device_map=device,
+                    torch_dtype="auto",
+                    quantization_config=self.param_quantization_config,
+                    _attn_implementation=(
+                        "flash_attention_2"
+                        if self.device.startswith("cuda")
+                        and accelerator_options.cuda_use_flash_attention2
+                        else "eager"
+                    ),
+                )  # .to(self.device)
+
+    @staticmethod
+    def download_models(
+        repo_id: str,
+        local_dir: Optional[Path] = None,
+        force: bool = False,
+        progress: bool = False,
+    ) -> Path:
+        from huggingface_hub import snapshot_download
+        from huggingface_hub.utils import disable_progress_bars
+
+        if not progress:
+            disable_progress_bars()
+        download_path = snapshot_download(
+            repo_id=repo_id,
+            force_download=force,
+            local_dir=local_dir,
+            # revision="v0.0.1",
+        )
+
+        return Path(download_path)
+
+    def __call__(
+        self, conv_res: ConversionResult, page_batch: Iterable[Page]
+    ) -> Iterable[Page]:
+        for page in page_batch:
+            assert page._backend is not None
+            if not page._backend.is_valid():
+                yield page
+            else:
+                with TimeRecorder(conv_res, "vlm"):
+                    assert page.size is not None
+
+                    hi_res_image = page.get_image(scale=2.0)  # 144dpi
+                    # hi_res_image = page.get_image(scale=1.0)  # 72dpi
+
+                    if hi_res_image is not None:
+                        im_width, im_height = hi_res_image.size
+
+                    # populate page_tags with predicted doc tags
+                    page_tags = ""
+
+                    if hi_res_image:
+                        if hi_res_image.mode != "RGB":
+                            hi_res_image = hi_res_image.convert("RGB")
+
+                    messages = [
+                        {
+                            "role": "user",
+                            "content": [
+                                {
+                                    "type": "text",
+                                    "text": "This is a page from a document.",
+                                },
+                                {"type": "image"},
+                                {"type": "text", "text": self.param_question},
+                            ],
+                        }
+                    ]
+                    prompt = self.processor.apply_chat_template(
+                        messages, add_generation_prompt=False
+                    )
+                    inputs = self.processor(
+                        text=prompt, images=[hi_res_image], return_tensors="pt"
+                    )
+                    inputs = {k: v.to(self.device) for k, v in inputs.items()}
+
+                    start_time = time.time()
+                    # Call model to generate:
+                    generated_ids = self.vlm_model.generate(
+                        **inputs, max_new_tokens=4096, use_cache=True
+                    )
+
+                    generation_time = time.time() - start_time
+                    generated_texts = self.processor.batch_decode(
+                        generated_ids[:, inputs["input_ids"].shape[1] :],
+                        skip_special_tokens=False,
+                    )[0]
+
+                    num_tokens = len(generated_ids[0])
+                    page_tags = generated_texts
+
+                    # inference_time = time.time() - start_time
+                    # tokens_per_second = num_tokens / generation_time
+                    # print("")
+                    # print(f"Page Inference Time: {inference_time:.2f} seconds")
+                    # print(f"Total tokens on page: {num_tokens:.2f}")
+                    # print(f"Tokens/sec: {tokens_per_second:.2f}")
+                    # print("")
+                    page.predictions.vlm_response = VlmPrediction(text=page_tags)
+
+                yield page
diff --git a/docling/models/layout_model.py b/docling/models/layout_model.py
index 69193c94..b3cbd954 100644
--- a/docling/models/layout_model.py
+++ b/docling/models/layout_model.py
@@ -1,7 +1,8 @@
 import copy
 import logging
+import warnings
 from pathlib import Path
-from typing import Iterable
+from typing import Iterable, Optional, Union
 
 from docling_core.types.doc import DocItemLabel
 from docling_ibm_models.layoutmodel.layout_predictor import LayoutPredictor
@@ -21,6 +22,8 @@ _log = logging.getLogger(__name__)
 
 
 class LayoutModel(BasePageModel):
+    _model_repo_folder = "ds4sd--docling-models"
+    _model_path = "model_artifacts/layout"
 
     TEXT_ELEM_LABELS = [
         DocItemLabel.TEXT,
@@ -42,15 +45,56 @@ class LayoutModel(BasePageModel):
     FORMULA_LABEL = DocItemLabel.FORMULA
     CONTAINER_LABELS = [DocItemLabel.FORM, DocItemLabel.KEY_VALUE_REGION]
 
-    def __init__(self, artifacts_path: Path, accelerator_options: AcceleratorOptions):
+    def __init__(
+        self, artifacts_path: Optional[Path], accelerator_options: AcceleratorOptions
+    ):
         device = decide_device(accelerator_options.device)
 
+        if artifacts_path is None:
+            artifacts_path = self.download_models() / self._model_path
+        else:
+            # will become the default in the future
+            if (artifacts_path / self._model_repo_folder).exists():
+                artifacts_path = (
+                    artifacts_path / self._model_repo_folder / self._model_path
+                )
+            elif (artifacts_path / self._model_path).exists():
+                warnings.warn(
+                    "The usage of artifacts_path containing directly "
+                    f"{self._model_path} is deprecated. Please point "
+                    "the artifacts_path to the parent containing "
+                    f"the {self._model_repo_folder} folder.",
+                    DeprecationWarning,
+                    stacklevel=3,
+                )
+                artifacts_path = artifacts_path / self._model_path
+
         self.layout_predictor = LayoutPredictor(
             artifact_path=str(artifacts_path),
             device=device,
             num_threads=accelerator_options.num_threads,
         )
 
+    @staticmethod
+    def download_models(
+        local_dir: Optional[Path] = None,
+        force: bool = False,
+        progress: bool = False,
+    ) -> Path:
+        from huggingface_hub import snapshot_download
+        from huggingface_hub.utils import disable_progress_bars
+
+        if not progress:
+            disable_progress_bars()
+        download_path = snapshot_download(
+            repo_id="ds4sd/docling-models",
+            force_download=force,
+            local_dir=local_dir,
+            revision="v2.1.0",
+        )
+
+        return Path(download_path)
+
     def draw_clusters_and_cells_side_by_side(
         self, conv_res, page, clusters, mode_prefix: str, show: bool = False
     ):
@@ -106,10 +150,12 @@ class LayoutModel(BasePageModel):
             else:
                 with TimeRecorder(conv_res, "layout"):
                     assert page.size is not None
+                    page_image = page.get_image(scale=1.0)
+                    assert page_image is not None
 
                     clusters = []
                     for ix, pred_item in enumerate(
-                        self.layout_predictor.predict(page.get_image(scale=1.0))
+                        self.layout_predictor.predict(page_image)
                     ):
                         label = DocItemLabel(
                             pred_item["label"]
diff --git a/docling/models/page_assemble_model.py b/docling/models/page_assemble_model.py
index 4acf8c95..4712abdc 100644
--- a/docling/models/page_assemble_model.py
+++ b/docling/models/page_assemble_model.py
@@ -52,6 +52,14 @@ class PageAssembleModel(BasePageModel):
 
         sanitized_text = "".join(lines)
 
+        # Text normalization
+        sanitized_text = sanitized_text.replace("⁄", "/")
+        sanitized_text = sanitized_text.replace("’", "'")
+        sanitized_text = sanitized_text.replace("‘", "'")
+        sanitized_text = sanitized_text.replace("“", '"')
+        sanitized_text = sanitized_text.replace("”", '"')
+        sanitized_text = sanitized_text.replace("•", "·")
+
         return sanitized_text.strip()  # Strip any leading or trailing whitespace
 
     def __call__(
diff --git a/docling/models/picture_description_api_model.py b/docling/models/picture_description_api_model.py
new file mode 100644
index 00000000..c64f1bfe
--- /dev/null
+++ b/docling/models/picture_description_api_model.py
@@ -0,0 +1,108 @@
+import base64
+import io
+import logging
+from typing import Iterable, List, Optional
+
+import requests
+from PIL import Image
+from pydantic import BaseModel, ConfigDict
+
+from docling.datamodel.pipeline_options import PictureDescriptionApiOptions
+from docling.exceptions import OperationNotAllowed
+from docling.models.picture_description_base_model import PictureDescriptionBaseModel
+
+_log = logging.getLogger(__name__)
+
+
+class ChatMessage(BaseModel):
+    role: str
+    content: str
+
+
+class ResponseChoice(BaseModel):
+    index: int
+    message: ChatMessage
+    finish_reason: str
+
+
+class ResponseUsage(BaseModel):
+    prompt_tokens: int
+    completion_tokens: int
+    total_tokens: int
+
+
+class ApiResponse(BaseModel):
+    model_config = ConfigDict(
+        protected_namespaces=(),
+    )
+
+    id: str
+    model: Optional[str] = None  # returned by openai
+    choices: List[ResponseChoice]
+    created: int
+    usage: ResponseUsage
+
+
+class PictureDescriptionApiModel(PictureDescriptionBaseModel):
+    # elements_batch_size = 4
+
+    def __init__(
+        self,
+        enabled: bool,
+        enable_remote_services: bool,
+        options: PictureDescriptionApiOptions,
+    ):
+        super().__init__(enabled=enabled, options=options)
+        self.options: PictureDescriptionApiOptions
+
+        if self.enabled:
+            if not enable_remote_services:
+                raise OperationNotAllowed(
+                    "Connections to remote services is only allowed when set explicitly. "
+                    "pipeline_options.enable_remote_services=True."
+                )
+
+    def _annotate_images(self, images: Iterable[Image.Image]) -> Iterable[str]:
+        # Note: technically we could make a batch request here,
+        # but not all APIs will allow for it. For example, vllm won't allow more than 1.
+        for image in images:
+            img_io = io.BytesIO()
+            image.save(img_io, "PNG")
+            image_base64 = base64.b64encode(img_io.getvalue()).decode("utf-8")
+
+            messages = [
+                {
+                    "role": "user",
+                    "content": [
+                        {
+                            "type": "text",
+                            "text": self.options.prompt,
+                        },
+                        {
+                            "type": "image_url",
+                            "image_url": {
+                                "url": f"data:image/png;base64,{image_base64}"
+                            },
+                        },
+                    ],
+                }
+            ]
+
+            payload = {
+                "messages": messages,
+                **self.options.params,
+            }
+
+            r = requests.post(
+                str(self.options.url),
+                headers=self.options.headers,
+                json=payload,
+                timeout=self.options.timeout,
+            )
+            if not r.ok:
+                _log.error(f"Error calling the API. Reponse was {r.text}")
+            r.raise_for_status()
+
+            api_resp = ApiResponse.model_validate_json(r.text)
+            generated_text = api_resp.choices[0].message.content.strip()
+            yield generated_text
diff --git a/docling/models/picture_description_base_model.py b/docling/models/picture_description_base_model.py
new file mode 100644
index 00000000..b653e0e3
--- /dev/null
+++ b/docling/models/picture_description_base_model.py
@@ -0,0 +1,64 @@
+import logging
+from pathlib import Path
+from typing import Any, Iterable, List, Optional, Union
+
+from docling_core.types.doc import (
+    DoclingDocument,
+    NodeItem,
+    PictureClassificationClass,
+    PictureItem,
+)
+from docling_core.types.doc.document import (  # TODO: move import to docling_core.types.doc
+    PictureDescriptionData,
+)
+from PIL import Image
+
+from docling.datamodel.pipeline_options import PictureDescriptionBaseOptions
+from docling.models.base_model import (
+    BaseItemAndImageEnrichmentModel,
+    ItemAndImageEnrichmentElement,
+)
+
+
+class PictureDescriptionBaseModel(BaseItemAndImageEnrichmentModel):
+    images_scale: float = 2.0
+
+    def __init__(
+        self,
+        enabled: bool,
+        options: PictureDescriptionBaseOptions,
+    ):
+        self.enabled = enabled
+        self.options = options
+        self.provenance = "not-implemented"
+
+    def is_processable(self, doc: DoclingDocument, element: NodeItem) -> bool:
+        return self.enabled and isinstance(element, PictureItem)
+
+    def _annotate_images(self, images: Iterable[Image.Image]) -> Iterable[str]:
+        raise NotImplementedError
+
+    def __call__(
+        self,
+        doc: DoclingDocument,
+        element_batch: Iterable[ItemAndImageEnrichmentElement],
+    ) -> Iterable[NodeItem]:
+        if not self.enabled:
+            for element in element_batch:
+                yield element.item
+            return
+
+        images: List[Image.Image] = []
+        elements: List[PictureItem] = []
+        for el in element_batch:
+            assert isinstance(el.item, PictureItem)
+            elements.append(el.item)
+            images.append(el.image)
+
+        outputs = self._annotate_images(images)
+
+        for item, output in zip(elements, outputs):
+            item.annotations.append(
+                PictureDescriptionData(text=output, provenance=self.provenance)
+            )
+            yield item
diff --git a/docling/models/picture_description_vlm_model.py b/docling/models/picture_description_vlm_model.py
new file mode 100644
index 00000000..69d185b0
--- /dev/null
+++ b/docling/models/picture_description_vlm_model.py
@@ -0,0 +1,109 @@
+from pathlib import Path
+from typing import Iterable, Optional, Union
+
+from PIL import Image
+
+from docling.datamodel.pipeline_options import (
+    AcceleratorOptions,
+    PictureDescriptionVlmOptions,
+)
+from docling.models.picture_description_base_model import PictureDescriptionBaseModel
+from docling.utils.accelerator_utils import decide_device
+
+
+class PictureDescriptionVlmModel(PictureDescriptionBaseModel):
+
+    def __init__(
+        self,
+        enabled: bool,
+        artifacts_path: Optional[Union[Path, str]],
+        options: PictureDescriptionVlmOptions,
+        accelerator_options: AcceleratorOptions,
+    ):
+        super().__init__(enabled=enabled, options=options)
+        self.options: PictureDescriptionVlmOptions
+
+        if self.enabled:
+
+            if artifacts_path is None:
+                artifacts_path = self.download_models(repo_id=self.options.repo_id)
+            else:
+                artifacts_path = Path(artifacts_path) / self.options.repo_cache_folder
+
+            self.device = decide_device(accelerator_options.device)
+
+            try:
+                import torch
+                from transformers import AutoModelForVision2Seq, AutoProcessor
+            except ImportError:
+                raise ImportError(
+                    "transformers >=4.46 is not installed. Please install Docling with the required extras `pip install docling[vlm]`."
+                )
+
+            # Initialize processor and model
+            self.processor = AutoProcessor.from_pretrained(artifacts_path)
+            self.model = AutoModelForVision2Seq.from_pretrained(
+                artifacts_path,
+                torch_dtype=torch.bfloat16,
+                _attn_implementation=(
+                    "flash_attention_2" if self.device.startswith("cuda") else "eager"
+                ),
+            ).to(self.device)
+
+            self.provenance = f"{self.options.repo_id}"
+
+    @staticmethod
+    def download_models(
+        repo_id: str,
+        local_dir: Optional[Path] = None,
+        force: bool = False,
+        progress: bool = False,
+    ) -> Path:
+        from huggingface_hub import snapshot_download
+        from huggingface_hub.utils import disable_progress_bars
+
+        if not progress:
+            disable_progress_bars()
+        download_path = snapshot_download(
+            repo_id=repo_id,
+            force_download=force,
+            local_dir=local_dir,
+        )
+
+        return Path(download_path)
+
+    def _annotate_images(self, images: Iterable[Image.Image]) -> Iterable[str]:
+        from transformers import GenerationConfig
+
+        # Create input messages
+        messages = [
+            {
+                "role": "user",
+                "content": [
+                    {"type": "image"},
+                    {"type": "text", "text": self.options.prompt},
+                ],
+            },
+        ]
+
+        # TODO: do batch generation
+
+        for image in images:
+            # Prepare inputs
+            prompt = self.processor.apply_chat_template(
+                messages, add_generation_prompt=True
+            )
+            inputs = self.processor(text=prompt, images=[image], return_tensors="pt")
+            inputs = inputs.to(self.device)
+
+            # Generate outputs
+            generated_ids = self.model.generate(
+                **inputs,
+                generation_config=GenerationConfig(**self.options.generation_config),
+            )
+            generated_texts = self.processor.batch_decode(
+                generated_ids[:, inputs["input_ids"].shape[1] :],
+                skip_special_tokens=True,
+            )
+
+            yield generated_texts[0].strip()
diff --git a/docling/models/readingorder_model.py b/docling/models/readingorder_model.py
new file mode 100644
index 00000000..e7bdd1a1
--- /dev/null
+++ b/docling/models/readingorder_model.py
@@ -0,0 +1,389 @@
+import copy
+import random
+from pathlib import Path
+from typing import Dict, List
+
+from docling_core.types.doc import (
+    BoundingBox,
+    CoordOrigin,
+    DocItem,
+    DocItemLabel,
+    DoclingDocument,
+    DocumentOrigin,
+    GroupLabel,
+    NodeItem,
+    ProvenanceItem,
+    RefItem,
+    TableData,
+)
+from docling_core.types.doc.document import ContentLayer
+from docling_core.types.legacy_doc.base import Ref
+from docling_core.types.legacy_doc.document import BaseText
+from docling_ibm_models.reading_order.reading_order_rb import (
+    PageElement as ReadingOrderPageElement,
+)
+from docling_ibm_models.reading_order.reading_order_rb import ReadingOrderPredictor
+from PIL import ImageDraw
+from pydantic import BaseModel, ConfigDict
+
+from docling.datamodel.base_models import (
+    BasePageElement,
+    Cluster,
+    ContainerElement,
+    FigureElement,
+    Table,
+    TextElement,
+)
+from docling.datamodel.document import ConversionResult
+from docling.datamodel.settings import settings
+from docling.utils.profiling import ProfilingScope, TimeRecorder
+
+
+class ReadingOrderOptions(BaseModel):
+    model_config = ConfigDict(protected_namespaces=())
+
+    model_names: str = ""  # e.g. "language;term;reference"
+
+
+class ReadingOrderModel:
+    def __init__(self, options: ReadingOrderOptions):
+        self.options = options
+        self.ro_model = ReadingOrderPredictor()
+
+    def _assembled_to_readingorder_elements(
+        self, conv_res: ConversionResult
+    ) -> List[ReadingOrderPageElement]:
+
+        elements: List[ReadingOrderPageElement] = []
+        page_no_to_pages = {p.page_no: p for p in conv_res.pages}
+
+        for element in conv_res.assembled.elements:
+
+            page_height = page_no_to_pages[element.page_no].size.height  # type: ignore
+            bbox = element.cluster.bbox.to_bottom_left_origin(page_height)
+            text = element.text or ""
+
+            elements.append(
+                ReadingOrderPageElement(
+                    cid=len(elements),
+                    ref=RefItem(cref=f"#/{element.page_no}/{element.cluster.id}"),
+                    text=text,
+                    page_no=element.page_no,
+                    page_size=page_no_to_pages[element.page_no].size,
+                    label=element.label,
+                    l=bbox.l,
+                    r=bbox.r,
+                    b=bbox.b,
+                    t=bbox.t,
+                    coord_origin=bbox.coord_origin,
+                )
+            )
+
+        return elements
+
+    def _add_child_elements(
+        self, element: BasePageElement, doc_item: NodeItem, doc: DoclingDocument
+    ):
+
+        child: Cluster
+        for child in element.cluster.children:
+            c_label = child.label
+            c_bbox = child.bbox.to_bottom_left_origin(
+                doc.pages[element.page_no + 1].size.height
+            )
+            c_text = " ".join(
+                [
+                    cell.text.replace("\x02", "-").strip()
+                    for cell in child.cells
+                    if len(cell.text.strip()) > 0
+                ]
+            )
+
+            c_prov = ProvenanceItem(
+                page_no=element.page_no + 1, charspan=(0, len(c_text)), bbox=c_bbox
+            )
+            if c_label == DocItemLabel.LIST_ITEM:
+                # TODO: Infer if this is a numbered or a bullet list item
+                doc.add_list_item(parent=doc_item, text=c_text, prov=c_prov)
+            elif c_label == DocItemLabel.SECTION_HEADER:
+                doc.add_heading(parent=doc_item, text=c_text, prov=c_prov)
+            else:
+                doc.add_text(parent=doc_item, label=c_label, text=c_text, prov=c_prov)
+
+    def _readingorder_elements_to_docling_doc(
+        self,
+        conv_res: ConversionResult,
+        ro_elements: List[ReadingOrderPageElement],
+        el_to_captions_mapping: Dict[int, List[int]],
+        el_to_footnotes_mapping: Dict[int, List[int]],
+        el_merges_mapping: Dict[int, List[int]],
+    ) -> DoclingDocument:
+
+        id_to_elem = {
+            RefItem(cref=f"#/{elem.page_no}/{elem.cluster.id}").cref: elem
+            for elem in conv_res.assembled.elements
+        }
+        cid_to_rels = {rel.cid: rel for rel in ro_elements}
+
+        origin = DocumentOrigin(
+            mimetype="application/pdf",
+            filename=conv_res.input.file.name,
+            binary_hash=conv_res.input.document_hash,
+        )
+        doc_name = Path(origin.filename).stem
+        out_doc: DoclingDocument = DoclingDocument(name=doc_name, origin=origin)
+
+        for page in conv_res.pages:
+            page_no = page.page_no + 1
+            size = page.size
+
+            assert size is not None
+
+            out_doc.add_page(page_no=page_no, size=size)
+
+        current_list = None
+        skippable_cids = {
+            cid
+            for mapping in (
+                el_to_captions_mapping,
+                el_to_footnotes_mapping,
+                el_merges_mapping,
+            )
+            for lst in mapping.values()
+            for cid in lst
+        }
+
+        page_no_to_pages = {p.page_no: p for p in conv_res.pages}
+
+        for rel in ro_elements:
+            if rel.cid in skippable_cids:
+                continue
+            element = id_to_elem[rel.ref.cref]
+
+            page_height = page_no_to_pages[element.page_no].size.height  # type: ignore
+
+            if isinstance(element, TextElement):
+                if element.label == DocItemLabel.CODE:
+                    cap_text = element.text
+                    prov = ProvenanceItem(
+                        page_no=element.page_no + 1,
+                        charspan=(0, len(cap_text)),
+                        bbox=element.cluster.bbox.to_bottom_left_origin(page_height),
+                    )
+                    code_item = out_doc.add_code(text=cap_text, prov=prov)
+
+                    if rel.cid in el_to_captions_mapping.keys():
+                        for caption_cid in el_to_captions_mapping[rel.cid]:
+                            caption_elem = id_to_elem[cid_to_rels[caption_cid].ref.cref]
+                            new_cap_item = self._add_caption_or_footnote(
+                                caption_elem, out_doc, code_item, page_height
+                            )
+
+                            code_item.captions.append(new_cap_item.get_ref())
+
+                    if rel.cid in el_to_footnotes_mapping.keys():
+                        for footnote_cid in el_to_footnotes_mapping[rel.cid]:
+                            footnote_elem = id_to_elem[
+                                cid_to_rels[footnote_cid].ref.cref
+                            ]
+                            new_footnote_item = self._add_caption_or_footnote(
+                                footnote_elem, out_doc, code_item, page_height
+                            )
+
+                            code_item.footnotes.append(new_footnote_item.get_ref())
+                else:
+
+                    new_item, current_list = self._handle_text_element(
+                        element, out_doc, current_list, page_height
+                    )
+
+                    if rel.cid in el_merges_mapping.keys():
+                        for merged_cid in el_merges_mapping[rel.cid]:
+                            merged_elem = id_to_elem[cid_to_rels[merged_cid].ref.cref]
+
+                            self._merge_elements(
+                                element, merged_elem, new_item, page_height
+                            )
+
+            elif isinstance(element, Table):
+
+                tbl_data = TableData(
+                    num_rows=element.num_rows,
+                    num_cols=element.num_cols,
+                    table_cells=element.table_cells,
+                )
+
+                prov = ProvenanceItem(
+                    page_no=element.page_no + 1,
+                    charspan=(0, 0),
+                    bbox=element.cluster.bbox.to_bottom_left_origin(page_height),
+                )
+
+                tbl = out_doc.add_table(
+                    data=tbl_data, prov=prov, label=element.cluster.label
+                )
+
+                if rel.cid in el_to_captions_mapping.keys():
+                    for caption_cid in el_to_captions_mapping[rel.cid]:
+                        caption_elem = id_to_elem[cid_to_rels[caption_cid].ref.cref]
+                        new_cap_item = self._add_caption_or_footnote(
+                            caption_elem, out_doc, tbl, page_height
+                        )
+
+                        tbl.captions.append(new_cap_item.get_ref())
+
+                if rel.cid in el_to_footnotes_mapping.keys():
+                    for footnote_cid in el_to_footnotes_mapping[rel.cid]:
+                        footnote_elem = id_to_elem[cid_to_rels[footnote_cid].ref.cref]
+                        new_footnote_item = self._add_caption_or_footnote(
+                            footnote_elem, out_doc, tbl, page_height
+                        )
+
+                        tbl.footnotes.append(new_footnote_item.get_ref())
+
+                # TODO: Consider adding children of Table.
+
+            elif isinstance(element, FigureElement):
+                cap_text = ""
+                prov = ProvenanceItem(
+                    page_no=element.page_no + 1,
+                    charspan=(0, len(cap_text)),
+                    bbox=element.cluster.bbox.to_bottom_left_origin(page_height),
+                )
+                pic = out_doc.add_picture(prov=prov)
+
+                if rel.cid in el_to_captions_mapping.keys():
+                    for caption_cid in el_to_captions_mapping[rel.cid]:
+                        caption_elem = id_to_elem[cid_to_rels[caption_cid].ref.cref]
+                        new_cap_item = self._add_caption_or_footnote(
+                            caption_elem, out_doc, pic, page_height
+                        )
+
+                        pic.captions.append(new_cap_item.get_ref())
+
+                if rel.cid in el_to_footnotes_mapping.keys():
+                    for footnote_cid in el_to_footnotes_mapping[rel.cid]:
+                        footnote_elem = id_to_elem[cid_to_rels[footnote_cid].ref.cref]
+                        new_footnote_item = self._add_caption_or_footnote(
+                            footnote_elem, out_doc, pic, page_height
+                        )
+
+                        pic.footnotes.append(new_footnote_item.get_ref())
+
+                self._add_child_elements(element, pic, out_doc)
+
+            elif isinstance(element, ContainerElement):  # Form, KV region
+                label = element.label
+                group_label = GroupLabel.UNSPECIFIED
+                if label == DocItemLabel.FORM:
+                    group_label = GroupLabel.FORM_AREA
+                elif label == DocItemLabel.KEY_VALUE_REGION:
+                    group_label = GroupLabel.KEY_VALUE_AREA
+
+                container_el = out_doc.add_group(label=group_label)
+
+                self._add_child_elements(element, container_el, out_doc)
+
+        return out_doc
+
+    def _add_caption_or_footnote(self, elem, out_doc, parent, page_height):
+        assert isinstance(elem, TextElement)
+        text = elem.text
+        prov = ProvenanceItem(
+            page_no=elem.page_no + 1,
+            charspan=(0, len(text)),
+            bbox=elem.cluster.bbox.to_bottom_left_origin(page_height),
+        )
+        new_item = out_doc.add_text(
+            label=elem.label, text=text, prov=prov, parent=parent
+        )
+        return new_item
+
+    def _handle_text_element(self, element, out_doc, current_list, page_height):
+        cap_text = element.text
+
+        prov = ProvenanceItem(
+            page_no=element.page_no + 1,
+            charspan=(0, len(cap_text)),
+            bbox=element.cluster.bbox.to_bottom_left_origin(page_height),
+        )
+        label = element.label
+        if label == DocItemLabel.LIST_ITEM:
+            if current_list is None:
+                current_list = out_doc.add_group(label=GroupLabel.LIST, name="list")
+
+            # TODO: Infer if this is a numbered or a bullet list item
+            new_item = out_doc.add_list_item(
+                text=cap_text, enumerated=False, prov=prov, parent=current_list
+            )
+        elif label == DocItemLabel.SECTION_HEADER:
+            current_list = None
+
+            new_item = out_doc.add_heading(text=cap_text, prov=prov)
+        elif label == DocItemLabel.FORMULA:
+            current_list = None
+
+            new_item = out_doc.add_text(
+                label=DocItemLabel.FORMULA, text="", orig=cap_text, prov=prov
+            )
+        else:
+            current_list = None
+
+            content_layer = ContentLayer.BODY
+            if element.label in [DocItemLabel.PAGE_HEADER, DocItemLabel.PAGE_FOOTER]:
+                content_layer = ContentLayer.FURNITURE
+
+            new_item = out_doc.add_text(
+                label=element.label,
+                text=cap_text,
+                prov=prov,
+                content_layer=content_layer,
+            )
+        return new_item, current_list
+
+    def _merge_elements(self, element, merged_elem, new_item, page_height):
+        assert isinstance(
+            merged_elem, type(element)
+        ), "Merged element must be of same type as element."
+        assert (
+            merged_elem.label == new_item.label
+        ), "Labels of merged elements must match."
+        prov = ProvenanceItem(
+            page_no=element.page_no + 1,
+            charspan=(
+                len(new_item.text) + 1,
+                len(new_item.text) + 1 + len(merged_elem.text),
+            ),
+            bbox=element.cluster.bbox.to_bottom_left_origin(page_height),
+        )
+        new_item.text += f" {merged_elem.text}"
+        new_item.orig += f" {merged_elem.text}"  # TODO: This is incomplete, we don't have the `orig` field of the merged element.
+        new_item.prov.append(prov)
+
+    def __call__(self, conv_res: ConversionResult) -> DoclingDocument:
+        with TimeRecorder(conv_res, "glm", scope=ProfilingScope.DOCUMENT):
+            page_elements = self._assembled_to_readingorder_elements(conv_res)
+
+            # Apply reading order
+            sorted_elements = self.ro_model.predict_reading_order(
+                page_elements=page_elements
+            )
+            el_to_captions_mapping = self.ro_model.predict_to_captions(
+                sorted_elements=sorted_elements
+            )
+            el_to_footnotes_mapping = self.ro_model.predict_to_footnotes(
+                sorted_elements=sorted_elements
+            )
+            el_merges_mapping = self.ro_model.predict_merges(
+                sorted_elements=sorted_elements
+            )
+
+            docling_doc: DoclingDocument = self._readingorder_elements_to_docling_doc(
+                conv_res,
+                sorted_elements,
+                el_to_captions_mapping,
+                el_to_footnotes_mapping,
+                el_merges_mapping,
+            )
+
+        return docling_doc
diff --git a/docling/models/table_structure_model.py b/docling/models/table_structure_model.py
index 1f4fbc7e..64979157 100644
--- a/docling/models/table_structure_model.py
+++ b/docling/models/table_structure_model.py
@@ -1,6 +1,7 @@
 import copy
+import warnings
 from pathlib import Path
-from typing import Iterable
+from typing import Iterable, Optional, Union
 
 import numpy
 from docling_core.types.doc import BoundingBox, DocItemLabel, TableCell
@@ -22,10 +23,13 @@ from docling.utils.profiling import TimeRecorder
 
 
 class TableStructureModel(BasePageModel):
+    _model_repo_folder = "ds4sd--docling-models"
+    _model_path = "model_artifacts/tableformer"
+
     def __init__(
         self,
         enabled: bool,
-        artifacts_path: Path,
+        artifacts_path: Optional[Path],
         options: TableStructureOptions,
         accelerator_options: AcceleratorOptions,
     ):
@@ -35,6 +39,26 @@ class TableStructureModel(BasePageModel):
 
         self.enabled = enabled
         if self.enabled:
+
+            if artifacts_path is None:
+                artifacts_path = self.download_models() / self._model_path
+            else:
+                # will become the default in the future
+                if (artifacts_path / self._model_repo_folder).exists():
+                    artifacts_path = (
+                        artifacts_path / self._model_repo_folder / self._model_path
+                    )
+                elif (artifacts_path / self._model_path).exists():
+                    warnings.warn(
+                        "The usage of artifacts_path containing directly "
+                        f"{self._model_path} is deprecated. Please point "
+                        "the artifacts_path to the parent containing "
+                        f"the {self._model_repo_folder} folder.",
+                        DeprecationWarning,
+                        stacklevel=3,
+                    )
+                    artifacts_path = artifacts_path / self._model_path
+
             if self.mode == TableFormerMode.ACCURATE:
                 artifacts_path = artifacts_path / "accurate"
             else:
@@ -58,6 +82,24 @@ class TableStructureModel(BasePageModel):
             )
             self.scale = 2.0  # Scale up table input images to 144 dpi
 
+    @staticmethod
+    def download_models(
+        local_dir: Optional[Path] = None, force: bool = False, progress: bool = False
+    ) -> Path:
+        from huggingface_hub import snapshot_download
+        from huggingface_hub.utils import disable_progress_bars
+
+        if not progress:
+            disable_progress_bars()
+        download_path = snapshot_download(
+            repo_id="ds4sd/docling-models",
+            force_download=force,
+            local_dir=local_dir,
+            revision="v2.1.0",
+        )
+
+        return Path(download_path)
+
     def draw_table_and_cells(
         self,
         conv_res: ConversionResult,
@@ -209,12 +251,16 @@ class TableStructureModel(BasePageModel):
                                     tc.bbox = tc.bbox.scaled(1 / self.scale)
                                 table_cells.append(tc)
 
+                            assert "predict_details" in table_out
+
                             # Retrieving cols/rows, after post processing:
-                            num_rows = table_out["predict_details"]["num_rows"]
-                            num_cols = table_out["predict_details"]["num_cols"]
-                            otsl_seq = table_out["predict_details"]["prediction"][
-                                "rs_seq"
-                            ]
+                            num_rows = table_out["predict_details"].get("num_rows", 0)
+                            num_cols = table_out["predict_details"].get("num_cols", 0)
+                            otsl_seq = (
+                                table_out["predict_details"]
+                                .get("prediction", {})
+                                .get("rs_seq", [])
+                            )
 
                             tbl = Table(
                                 otsl_seq=otsl_seq,
diff --git a/docling/models/tesseract_ocr_cli_model.py b/docling/models/tesseract_ocr_cli_model.py
index cdc5671d..ac8dd51f 100644
--- a/docling/models/tesseract_ocr_cli_model.py
+++ b/docling/models/tesseract_ocr_cli_model.py
@@ -114,7 +114,9 @@ class TesseractOcrCliModel(BaseOcrModel):
         # _log.info("df: ", df.head())
 
         # Filter rows that contain actual text (ignore header or empty rows)
-        df_filtered = df[df["text"].notnull() & (df["text"].str.strip() != "")]
+        df_filtered = df[
+            df["text"].notnull() & (df["text"].apply(str).str.strip() != "")
+        ]
 
         return df_filtered
 
diff --git a/docling/models/tesseract_ocr_model.py b/docling/models/tesseract_ocr_model.py
index 5b70155e..c41806f5 100644
--- a/docling/models/tesseract_ocr_model.py
+++ b/docling/models/tesseract_ocr_model.py
@@ -22,6 +22,7 @@ class TesseractOcrModel(BaseOcrModel):
         self.scale = 3  # multiplier for 72 dpi == 216 dpi.
         self.reader = None
         self.osd_reader = None
+        self.script_readers: dict[str, tesserocr.PyTessBaseAPI] = {}
 
         if self.enabled:
             install_errmsg = (
@@ -57,8 +58,6 @@ class TesseractOcrModel(BaseOcrModel):
             _log.debug("Initializing TesserOCR: %s", tesseract_version)
             lang = "+".join(self.options.lang)
 
-            self.script_readers: dict[str, tesserocr.PyTessBaseAPI] = {}
-
             if any([l.startswith("script/") for l in self._tesserocr_languages]):
                 self.script_prefix = "script/"
             else:
diff --git a/docling/pipeline/base_pipeline.py b/docling/pipeline/base_pipeline.py
index 75a08e76..1bf48ef0 100644
--- a/docling/pipeline/base_pipeline.py
+++ b/docling/pipeline/base_pipeline.py
@@ -79,7 +79,7 @@ class BasePipeline(ABC):
             for model in self.enrichment_pipe:
                 for element_batch in chunkify(
                     _prepare_elements(conv_res, model),
-                    settings.perf.elements_batch_size,
+                    model.elements_batch_size,
                 ):
                     for element in model(
                         doc=conv_res.document, element_batch=element_batch
@@ -141,7 +141,9 @@ class PaginatedPipeline(BasePipeline):  # TODO this is a bad name.
         with TimeRecorder(conv_res, "doc_build", scope=ProfilingScope.DOCUMENT):
 
             for i in range(0, conv_res.input.page_count):
-                conv_res.pages.append(Page(page_no=i))
+                start_page, end_page = conv_res.input.limits.page_range
+                if (start_page - 1) <= i <= (end_page - 1):
+                    conv_res.pages.append(Page(page_no=i))
 
             try:
                 # Iterate batches of pages (page_batch_size) in the doc
diff --git a/docling/pipeline/standard_pdf_pipeline.py b/docling/pipeline/standard_pdf_pipeline.py
index fe2201d6..7df8f15b 100644
--- a/docling/pipeline/standard_pdf_pipeline.py
+++ b/docling/pipeline/standard_pdf_pipeline.py
@@ -1,5 +1,6 @@
 import logging
 import sys
+import warnings
 from pathlib import Path
 from typing import Optional
 
@@ -13,17 +14,19 @@ from docling.datamodel.pipeline_options import (
     EasyOcrOptions,
     OcrMacOptions,
     PdfPipelineOptions,
+    PictureDescriptionApiOptions,
+    PictureDescriptionVlmOptions,
     RapidOcrOptions,
     TesseractCliOcrOptions,
     TesseractOcrOptions,
 )
+from docling.datamodel.settings import settings
 from docling.models.base_ocr_model import BaseOcrModel
 from docling.models.code_formula_model import CodeFormulaModel, CodeFormulaModelOptions
 from docling.models.document_picture_classifier import (
     DocumentPictureClassifier,
     DocumentPictureClassifierOptions,
 )
-from docling.models.ds_glm_model import GlmModel, GlmOptions
 from docling.models.easyocr_model import EasyOcrModel
 from docling.models.layout_model import LayoutModel
 from docling.models.ocr_mac_model import OcrMacModel
@@ -32,28 +35,40 @@ from docling.models.page_preprocessing_model import (
     PagePreprocessingModel,
     PagePreprocessingOptions,
 )
+from docling.models.picture_description_api_model import PictureDescriptionApiModel
+from docling.models.picture_description_base_model import PictureDescriptionBaseModel
+from docling.models.picture_description_vlm_model import PictureDescriptionVlmModel
 from docling.models.rapid_ocr_model import RapidOcrModel
+from docling.models.readingorder_model import ReadingOrderModel, ReadingOrderOptions
 from docling.models.table_structure_model import TableStructureModel
 from docling.models.tesseract_ocr_cli_model import TesseractOcrCliModel
 from docling.models.tesseract_ocr_model import TesseractOcrModel
 from docling.pipeline.base_pipeline import PaginatedPipeline
+from docling.utils.model_downloader import download_models
 from docling.utils.profiling import ProfilingScope, TimeRecorder
 
 _log = logging.getLogger(__name__)
 
 
 class StandardPdfPipeline(PaginatedPipeline):
-    _layout_model_path = "model_artifacts/layout"
-    _table_model_path = "model_artifacts/tableformer"
+    _layout_model_path = LayoutModel._model_path
+    _table_model_path = TableStructureModel._model_path
 
     def __init__(self, pipeline_options: PdfPipelineOptions):
         super().__init__(pipeline_options)
         self.pipeline_options: PdfPipelineOptions
 
-        if pipeline_options.artifacts_path is None:
-            self.artifacts_path = self.download_models_hf()
-        else:
-            self.artifacts_path = Path(pipeline_options.artifacts_path)
+        artifacts_path: Optional[Path] = None
+        if pipeline_options.artifacts_path is not None:
+            artifacts_path = Path(pipeline_options.artifacts_path).expanduser()
+        elif settings.artifacts_path is not None:
+            artifacts_path = Path(settings.artifacts_path).expanduser()
+
+        if artifacts_path is not None and not artifacts_path.is_dir():
+            raise RuntimeError(
+                f"The value of {artifacts_path=} is not valid. "
+                "When defined, it must point to a folder containing all models required by the pipeline."
+            )
 
         self.keep_images = (
             self.pipeline_options.generate_page_images
@@ -61,9 +76,9 @@ class StandardPdfPipeline(PaginatedPipeline):
             or self.pipeline_options.generate_table_images
         )
 
-        self.glm_model = GlmModel(options=GlmOptions())
+        self.glm_model = ReadingOrderModel(options=ReadingOrderOptions())
 
-        if (ocr_model := self.get_ocr_model()) is None:
+        if (ocr_model := self.get_ocr_model(artifacts_path=artifacts_path)) is None:
             raise RuntimeError(
                 f"The specified OCR kind is not supported: {pipeline_options.ocr_options.kind}."
             )
@@ -79,15 +94,13 @@ class StandardPdfPipeline(PaginatedPipeline):
             ocr_model,
             # Layout model
             LayoutModel(
-                artifacts_path=self.artifacts_path
-                / StandardPdfPipeline._layout_model_path,
+                artifacts_path=artifacts_path,
                 accelerator_options=pipeline_options.accelerator_options,
             ),
             # Table structure model
             TableStructureModel(
                 enabled=pipeline_options.do_table_structure,
-                artifacts_path=self.artifacts_path
-                / StandardPdfPipeline._table_model_path,
+                artifacts_path=artifacts_path,
                 options=pipeline_options.table_structure_options,
                 accelerator_options=pipeline_options.accelerator_options,
             ),
@@ -95,13 +108,22 @@ class StandardPdfPipeline(PaginatedPipeline):
             PageAssembleModel(options=PageAssembleOptions()),
         ]
 
+        # Picture description model
+        if (
+            picture_description_model := self.get_picture_description_model(
+                artifacts_path=artifacts_path
+            )
+        ) is None:
+            raise RuntimeError(
+                f"The specified picture description kind is not supported: {pipeline_options.picture_description_options.kind}."
+            )
+
         self.enrichment_pipe = [
-            # Other models working on `NodeItem` elements in the DoclingDocument
             # Code Formula Enrichment Model
             CodeFormulaModel(
                 enabled=pipeline_options.do_code_enrichment
                 or pipeline_options.do_formula_enrichment,
-                artifacts_path=pipeline_options.artifacts_path,
+                artifacts_path=artifacts_path,
                 options=CodeFormulaModelOptions(
                     do_code_enrichment=pipeline_options.do_code_enrichment,
                     do_formula_enrichment=pipeline_options.do_formula_enrichment,
@@ -111,15 +133,18 @@ class StandardPdfPipeline(PaginatedPipeline):
             # Document Picture Classifier
             DocumentPictureClassifier(
                 enabled=pipeline_options.do_picture_classification,
-                artifacts_path=pipeline_options.artifacts_path,
+                artifacts_path=artifacts_path,
                 options=DocumentPictureClassifierOptions(),
                 accelerator_options=pipeline_options.accelerator_options,
             ),
+            # Document Picture description
+            picture_description_model,
         ]
 
         if (
             self.pipeline_options.do_formula_enrichment
             or self.pipeline_options.do_code_enrichment
+            or self.pipeline_options.do_picture_description
         ):
             self.keep_backend = True
 
@@ -127,23 +152,24 @@ class StandardPdfPipeline(PaginatedPipeline):
     def download_models_hf(
         local_dir: Optional[Path] = None, force: bool = False
     ) -> Path:
-        from huggingface_hub import snapshot_download
-        from huggingface_hub.utils import disable_progress_bars
-
-        disable_progress_bars()
-        download_path = snapshot_download(
-            repo_id="ds4sd/docling-models",
-            force_download=force,
-            local_dir=local_dir,
-            revision="v2.1.0",
+        warnings.warn(
+            "The usage of StandardPdfPipeline.download_models_hf() is deprecated "
+            "use instead the utility `docling-tools models download`, or "
+            "the upstream method docling.utils.models_downloader.download_all()",
+            DeprecationWarning,
+            stacklevel=3,
         )
 
-        return Path(download_path)
+        output_dir = download_models(output_dir=local_dir, force=force, progress=False)
+        return output_dir
 
-    def get_ocr_model(self) -> Optional[BaseOcrModel]:
+    def get_ocr_model(
+        self, artifacts_path: Optional[Path] = None
+    ) -> Optional[BaseOcrModel]:
         if isinstance(self.pipeline_options.ocr_options, EasyOcrOptions):
             return EasyOcrModel(
                 enabled=self.pipeline_options.do_ocr,
+                artifacts_path=artifacts_path,
                 options=self.pipeline_options.ocr_options,
                 accelerator_options=self.pipeline_options.accelerator_options,
             )
@@ -174,6 +200,30 @@ class StandardPdfPipeline(PaginatedPipeline):
             )
         return None
 
+    def get_picture_description_model(
+        self, artifacts_path: Optional[Path] = None
+    ) -> Optional[PictureDescriptionBaseModel]:
+        if isinstance(
+            self.pipeline_options.picture_description_options,
+            PictureDescriptionApiOptions,
+        ):
+            return PictureDescriptionApiModel(
+                enabled=self.pipeline_options.do_picture_description,
+                enable_remote_services=self.pipeline_options.enable_remote_services,
+                options=self.pipeline_options.picture_description_options,
+            )
+        elif isinstance(
+            self.pipeline_options.picture_description_options,
+            PictureDescriptionVlmOptions,
+        ):
+            return PictureDescriptionVlmModel(
+                enabled=self.pipeline_options.do_picture_description,
+                artifacts_path=artifacts_path,
+                options=self.pipeline_options.picture_description_options,
+                accelerator_options=self.pipeline_options.accelerator_options,
+            )
+        return None
+
     def initialize_page(self, conv_res: ConversionResult, page: Page) -> Page:
         with TimeRecorder(conv_res, "page_init"):
             page._backend = conv_res.input._backend.load_page(page.page_no)  # type: ignore
diff --git a/docling/pipeline/vlm_pipeline.py b/docling/pipeline/vlm_pipeline.py
new file mode 100644
index 00000000..c6920b65
--- /dev/null
+++ b/docling/pipeline/vlm_pipeline.py
@@ -0,0 +1,534 @@
+import itertools
+import logging
+import re
+import warnings
+from io import BytesIO
+
+# from io import BytesIO
+from pathlib import Path
+from typing import Optional
+
+from docling_core.types import DoclingDocument
+from docling_core.types.doc import (
+    BoundingBox,
+    DocItem,
+    DocItemLabel,
+    DoclingDocument,
+    GroupLabel,
+    ImageRef,
+    ImageRefMode,
+    PictureItem,
+    ProvenanceItem,
+    Size,
+    TableCell,
+    TableData,
+    TableItem,
+)
+from docling_core.types.doc.tokens import DocumentToken, TableToken
+
+from docling.backend.abstract_backend import AbstractDocumentBackend
+from docling.backend.md_backend import MarkdownDocumentBackend
+from docling.backend.pdf_backend import PdfDocumentBackend
+from docling.datamodel.base_models import InputFormat, Page
+from docling.datamodel.document import ConversionResult, InputDocument
+from docling.datamodel.pipeline_options import (
+    PdfPipelineOptions,
+    ResponseFormat,
+    VlmPipelineOptions,
+)
+from docling.datamodel.settings import settings
+from docling.models.hf_vlm_model import HuggingFaceVlmModel
+from docling.pipeline.base_pipeline import PaginatedPipeline
+from docling.utils.profiling import ProfilingScope, TimeRecorder
+
+_log = logging.getLogger(__name__)
+
+
+class VlmPipeline(PaginatedPipeline):
+
+    def __init__(self, pipeline_options: VlmPipelineOptions):
+        super().__init__(pipeline_options)
+        self.keep_backend = True
+
+        warnings.warn(
+            "The VlmPipeline is currently experimental and may change in upcoming versions without notice.",
+            category=UserWarning,
+            stacklevel=2,
+        )
+
+        self.pipeline_options: VlmPipelineOptions
+
+        artifacts_path: Optional[Path] = None
+        if pipeline_options.artifacts_path is not None:
+            artifacts_path = Path(pipeline_options.artifacts_path).expanduser()
+        elif settings.artifacts_path is not None:
+            artifacts_path = Path(settings.artifacts_path).expanduser()
+
+        if artifacts_path is not None and not artifacts_path.is_dir():
+            raise RuntimeError(
+                f"The value of {artifacts_path=} is not valid. "
+                "When defined, it must point to a folder containing all models required by the pipeline."
+            )
+
+        # force_backend_text = False - use text that is coming from VLM response
+        # force_backend_text = True - get text from backend using bounding boxes predicted by SmolDocling doctags
+        self.force_backend_text = (
+            pipeline_options.force_backend_text
+            and pipeline_options.vlm_options.response_format == ResponseFormat.DOCTAGS
+        )
+
+        self.keep_images = self.pipeline_options.generate_page_images
+
+        self.build_pipe = [
+            HuggingFaceVlmModel(
+                enabled=True,  # must be always enabled for this pipeline to make sense.
+                artifacts_path=artifacts_path,
+                accelerator_options=pipeline_options.accelerator_options,
+                vlm_options=self.pipeline_options.vlm_options,
+            ),
+        ]
+
+        self.enrichment_pipe = [
+            # Other models working on `NodeItem` elements in the DoclingDocument
+        ]
+
+    def initialize_page(self, conv_res: ConversionResult, page: Page) -> Page:
+        with TimeRecorder(conv_res, "page_init"):
+            page._backend = conv_res.input._backend.load_page(page.page_no)  # type: ignore
+            if page._backend is not None and page._backend.is_valid():
+                page.size = page._backend.get_size()
+
+        return page
+
+    def _assemble_document(self, conv_res: ConversionResult) -> ConversionResult:
+        with TimeRecorder(conv_res, "doc_assemble", scope=ProfilingScope.DOCUMENT):
+
+            if (
+                self.pipeline_options.vlm_options.response_format
+                == ResponseFormat.DOCTAGS
+            ):
+                conv_res.document = self._turn_tags_into_doc(conv_res.pages)
+            elif (
+                self.pipeline_options.vlm_options.response_format
+                == ResponseFormat.MARKDOWN
+            ):
+                conv_res.document = self._turn_md_into_doc(conv_res)
+
+            else:
+                raise RuntimeError(
+                    f"Unsupported VLM response format {self.pipeline_options.vlm_options.response_format}"
+                )
+
+            # Generate images of the requested element types
+            if self.pipeline_options.generate_picture_images:
+                scale = self.pipeline_options.images_scale
+                for element, _level in conv_res.document.iterate_items():
+                    if not isinstance(element, DocItem) or len(element.prov) == 0:
+                        continue
+                    if (
+                        isinstance(element, PictureItem)
+                        and self.pipeline_options.generate_picture_images
+                    ):
+                        page_ix = element.prov[0].page_no - 1
+                        page = conv_res.pages[page_ix]
+                        assert page.size is not None
+                        assert page.image is not None
+
+                        crop_bbox = (
+                            element.prov[0]
+                            .bbox.scaled(scale=scale)
+                            .to_top_left_origin(page_height=page.size.height * scale)
+                        )
+
+                        cropped_im = page.image.crop(crop_bbox.as_tuple())
+                        element.image = ImageRef.from_pil(
+                            cropped_im, dpi=int(72 * scale)
+                        )
+
+        return conv_res
+
+    def _turn_md_into_doc(self, conv_res):
+        predicted_text = ""
+        for pg_idx, page in enumerate(conv_res.pages):
+            if page.predictions.vlm_response:
+                predicted_text += page.predictions.vlm_response.text + "\n\n"
+        response_bytes = BytesIO(predicted_text.encode("utf8"))
+        out_doc = InputDocument(
+            path_or_stream=response_bytes,
+            filename=conv_res.input.file.name,
+            format=InputFormat.MD,
+            backend=MarkdownDocumentBackend,
+        )
+        backend = MarkdownDocumentBackend(
+            in_doc=out_doc,
+            path_or_stream=response_bytes,
+        )
+        return backend.convert()
+
+    def _turn_tags_into_doc(self, pages: list[Page]) -> DoclingDocument:
+        ###############################################
+        # Tag definitions and color mappings
+        ###############################################
+
+        # Maps the recognized tag to a Docling label.
+        # Code items will be given DocItemLabel.CODE
+        tag_to_doclabel = {
+            "title": DocItemLabel.TITLE,
+            "document_index": DocItemLabel.DOCUMENT_INDEX,
+            "otsl": DocItemLabel.TABLE,
+            "section_header_level_1": DocItemLabel.SECTION_HEADER,
+            "checkbox_selected": DocItemLabel.CHECKBOX_SELECTED,
+            "checkbox_unselected": DocItemLabel.CHECKBOX_UNSELECTED,
+            "text": DocItemLabel.TEXT,
+            "page_header": DocItemLabel.PAGE_HEADER,
+            "page_footer": DocItemLabel.PAGE_FOOTER,
+            "formula": DocItemLabel.FORMULA,
+            "caption": DocItemLabel.CAPTION,
+            "picture": DocItemLabel.PICTURE,
+            "list_item": DocItemLabel.LIST_ITEM,
+            "footnote": DocItemLabel.FOOTNOTE,
+            "code": DocItemLabel.CODE,
+        }
+
+        # Maps each tag to an associated bounding box color.
+        tag_to_color = {
+            "title": "blue",
+            "document_index": "darkblue",
+            "otsl": "green",
+            "section_header_level_1": "purple",
+            "checkbox_selected": "black",
+            "checkbox_unselected": "gray",
+            "text": "red",
+            "page_header": "orange",
+            "page_footer": "cyan",
+            "formula": "pink",
+            "caption": "magenta",
+            "picture": "yellow",
+            "list_item": "brown",
+            "footnote": "darkred",
+            "code": "lightblue",
+        }
+
+        def extract_bounding_box(text_chunk: str) -> Optional[BoundingBox]:
+            """Extracts <loc_...> bounding box coords from the chunk, normalized by / 500."""
+            coords = re.findall(r"<loc_(\d+)>", text_chunk)
+            if len(coords) == 4:
+                l, t, r, b = map(float, coords)
+                return BoundingBox(l=l / 500, t=t / 500, r=r / 500, b=b / 500)
+            return None
+
+        def extract_inner_text(text_chunk: str) -> str:
+            """Strips all <...> tags inside the chunk to get the raw text content."""
+            return re.sub(r"<.*?>", "", text_chunk, flags=re.DOTALL).strip()
+
+        def extract_text_from_backend(page: Page, bbox: BoundingBox | None) -> str:
+            # Convert bounding box normalized to 0-100 into page coordinates for cropping
+            text = ""
+            if bbox:
+                if page.size:
+                    bbox.l = bbox.l * page.size.width
+                    bbox.t = bbox.t * page.size.height
+                    bbox.r = bbox.r * page.size.width
+                    bbox.b = bbox.b * page.size.height
+                    if page._backend:
+                        text = page._backend.get_text_in_rect(bbox)
+            return text
+
+        def otsl_parse_texts(texts, tokens):
+            split_word = TableToken.OTSL_NL.value
+            split_row_tokens = [
+                list(y)
+                for x, y in itertools.groupby(tokens, lambda z: z == split_word)
+                if not x
+            ]
+            table_cells = []
+            r_idx = 0
+            c_idx = 0
+
+            def count_right(tokens, c_idx, r_idx, which_tokens):
+                span = 0
+                c_idx_iter = c_idx
+                while tokens[r_idx][c_idx_iter] in which_tokens:
+                    c_idx_iter += 1
+                    span += 1
+                    if c_idx_iter >= len(tokens[r_idx]):
+                        return span
+                return span
+
+            def count_down(tokens, c_idx, r_idx, which_tokens):
+                span = 0
+                r_idx_iter = r_idx
+                while tokens[r_idx_iter][c_idx] in which_tokens:
+                    r_idx_iter += 1
+                    span += 1
+                    if r_idx_iter >= len(tokens):
+                        return span
+                return span
+
+            for i, text in enumerate(texts):
+                cell_text = ""
+                if text in [
+                    TableToken.OTSL_FCEL.value,
+                    TableToken.OTSL_ECEL.value,
+                    TableToken.OTSL_CHED.value,
+                    TableToken.OTSL_RHED.value,
+                    TableToken.OTSL_SROW.value,
+                ]:
+                    row_span = 1
+                    col_span = 1
+                    right_offset = 1
+                    if text != TableToken.OTSL_ECEL.value:
+                        cell_text = texts[i + 1]
+                        right_offset = 2
+
+                    # Check next element(s) for lcel / ucel / xcel, set properly row_span, col_span
+                    next_right_cell = ""
+                    if i + right_offset < len(texts):
+                        next_right_cell = texts[i + right_offset]
+
+                    next_bottom_cell = ""
+                    if r_idx + 1 < len(split_row_tokens):
+                        if c_idx < len(split_row_tokens[r_idx + 1]):
+                            next_bottom_cell = split_row_tokens[r_idx + 1][c_idx]
+
+                    if next_right_cell in [
+                        TableToken.OTSL_LCEL.value,
+                        TableToken.OTSL_XCEL.value,
+                    ]:
+                        # we have horisontal spanning cell or 2d spanning cell
+                        col_span += count_right(
+                            split_row_tokens,
+                            c_idx + 1,
+                            r_idx,
+                            [TableToken.OTSL_LCEL.value, TableToken.OTSL_XCEL.value],
+                        )
+                    if next_bottom_cell in [
+                        TableToken.OTSL_UCEL.value,
+                        TableToken.OTSL_XCEL.value,
+                    ]:
+                        # we have a vertical spanning cell or 2d spanning cell
+                        row_span += count_down(
+                            split_row_tokens,
+                            c_idx,
+                            r_idx + 1,
+                            [TableToken.OTSL_UCEL.value, TableToken.OTSL_XCEL.value],
+                        )
+
+                    table_cells.append(
+                        TableCell(
+                            text=cell_text.strip(),
+                            row_span=row_span,
+                            col_span=col_span,
+                            start_row_offset_idx=r_idx,
+                            end_row_offset_idx=r_idx + row_span,
+                            start_col_offset_idx=c_idx,
+                            end_col_offset_idx=c_idx + col_span,
+                        )
+                    )
+                if text in [
+                    TableToken.OTSL_FCEL.value,
+                    TableToken.OTSL_ECEL.value,
+                    TableToken.OTSL_CHED.value,
+                    TableToken.OTSL_RHED.value,
+                    TableToken.OTSL_SROW.value,
+                    TableToken.OTSL_LCEL.value,
+                    TableToken.OTSL_UCEL.value,
+                    TableToken.OTSL_XCEL.value,
+                ]:
+                    c_idx += 1
+                if text == TableToken.OTSL_NL.value:
+                    r_idx += 1
+                    c_idx = 0
+            return table_cells, split_row_tokens
+
+        def otsl_extract_tokens_and_text(s: str):
+            # Pattern to match anything enclosed by < > (including the angle brackets themselves)
+            pattern = r"(<[^>]+>)"
+            # Find all tokens (e.g. "<otsl>", "<loc_140>", etc.)
+            tokens = re.findall(pattern, s)
+            # Remove any tokens that start with "<loc_"
+            tokens = [
+                token
+                for token in tokens
+                if not (
+                    token.startswith(rf"<{DocumentToken.LOC.value}")
+                    or token
+                    in [
+                        rf"<{DocumentToken.OTSL.value}>",
+                        rf"</{DocumentToken.OTSL.value}>",
+                    ]
+                )
+            ]
+            # Split the string by those tokens to get the in-between text
+            text_parts = re.split(pattern, s)
+            text_parts = [
+                token
+                for token in text_parts
+                if not (
+                    token.startswith(rf"<{DocumentToken.LOC.value}")
+                    or token
+                    in [
+                        rf"<{DocumentToken.OTSL.value}>",
+                        rf"</{DocumentToken.OTSL.value}>",
+                    ]
+                )
+            ]
+            # Remove any empty or purely whitespace strings from text_parts
+            text_parts = [part for part in text_parts if part.strip()]
+
+            return tokens, text_parts
+
+        def parse_table_content(otsl_content: str) -> TableData:
+            tokens, mixed_texts = otsl_extract_tokens_and_text(otsl_content)
+            table_cells, split_row_tokens = otsl_parse_texts(mixed_texts, tokens)
+
+            return TableData(
+                num_rows=len(split_row_tokens),
+                num_cols=(
+                    max(len(row) for row in split_row_tokens) if split_row_tokens else 0
+                ),
+                table_cells=table_cells,
+            )
+
+        doc = DoclingDocument(name="Document")
+        for pg_idx, page in enumerate(pages):
+            xml_content = ""
+            predicted_text = ""
+            if page.predictions.vlm_response:
+                predicted_text = page.predictions.vlm_response.text
+            image = page.image
+
+            page_no = pg_idx + 1
+            bounding_boxes = []
+
+            if page.size:
+                pg_width = page.size.width
+                pg_height = page.size.height
+                size = Size(width=pg_width, height=pg_height)
+                parent_page = doc.add_page(page_no=page_no, size=size)
+
+            """
+            1. Finds all <tag>...</tag> blocks in the entire string (multi-line friendly) in the order they appear.
+            2. For each chunk, extracts bounding box (if any) and inner text.
+            3. Adds the item to a DoclingDocument structure with the right label.
+            4. Tracks bounding boxes + color in a separate list for later visualization.
+            """
+
+            # Regex for all recognized tags
+            tag_pattern = (
+                rf"<(?P<tag>{DocItemLabel.TITLE}|{DocItemLabel.DOCUMENT_INDEX}|"
+                rf"{DocItemLabel.CHECKBOX_UNSELECTED}|{DocItemLabel.CHECKBOX_SELECTED}|"
+                rf"{DocItemLabel.TEXT}|{DocItemLabel.PAGE_HEADER}|"
+                rf"{DocItemLabel.PAGE_FOOTER}|{DocItemLabel.FORMULA}|"
+                rf"{DocItemLabel.CAPTION}|{DocItemLabel.PICTURE}|"
+                rf"{DocItemLabel.LIST_ITEM}|{DocItemLabel.FOOTNOTE}|{DocItemLabel.CODE}|"
+                rf"{DocItemLabel.SECTION_HEADER}_level_1|{DocumentToken.OTSL.value})>.*?</(?P=tag)>"
+            )
+
+            # DocumentToken.OTSL
+            pattern = re.compile(tag_pattern, re.DOTALL)
+
+            # Go through each match in order
+            for match in pattern.finditer(predicted_text):
+                full_chunk = match.group(0)
+                tag_name = match.group("tag")
+
+                bbox = extract_bounding_box(full_chunk)
+                doc_label = tag_to_doclabel.get(tag_name, DocItemLabel.PARAGRAPH)
+                color = tag_to_color.get(tag_name, "white")
+
+                # Store bounding box + color
+                if bbox:
+                    bounding_boxes.append((bbox, color))
+
+                if tag_name == DocumentToken.OTSL.value:
+                    table_data = parse_table_content(full_chunk)
+                    bbox = extract_bounding_box(full_chunk)
+
+                    if bbox:
+                        prov = ProvenanceItem(
+                            bbox=bbox.resize_by_scale(pg_width, pg_height),
+                            charspan=(0, 0),
+                            page_no=page_no,
+                        )
+                        doc.add_table(data=table_data, prov=prov)
+                    else:
+                        doc.add_table(data=table_data)
+
+                elif tag_name == DocItemLabel.PICTURE:
+                    text_caption_content = extract_inner_text(full_chunk)
+                    if image:
+                        if bbox:
+                            im_width, im_height = image.size
+
+                            crop_box = (
+                                int(bbox.l * im_width),
+                                int(bbox.t * im_height),
+                                int(bbox.r * im_width),
+                                int(bbox.b * im_height),
+                            )
+                            cropped_image = image.crop(crop_box)
+                            pic = doc.add_picture(
+                                parent=None,
+                                image=ImageRef.from_pil(image=cropped_image, dpi=72),
+                                prov=(
+                                    ProvenanceItem(
+                                        bbox=bbox.resize_by_scale(pg_width, pg_height),
+                                        charspan=(0, 0),
+                                        page_no=page_no,
+                                    )
+                                ),
+                            )
+                            # If there is a caption to an image, add it as well
+                            if len(text_caption_content) > 0:
+                                caption_item = doc.add_text(
+                                    label=DocItemLabel.CAPTION,
+                                    text=text_caption_content,
+                                    parent=None,
+                                )
+                                pic.captions.append(caption_item.get_ref())
+                    else:
+                        if bbox:
+                            # In case we don't have access to an binary of an image
+                            doc.add_picture(
+                                parent=None,
+                                prov=ProvenanceItem(
+                                    bbox=bbox, charspan=(0, 0), page_no=page_no
+                                ),
+                            )
+                            # If there is a caption to an image, add it as well
+                            if len(text_caption_content) > 0:
+                                caption_item = doc.add_text(
+                                    label=DocItemLabel.CAPTION,
+                                    text=text_caption_content,
+                                    parent=None,
+                                )
+                                pic.captions.append(caption_item.get_ref())
+                else:
+                    # For everything else, treat as text
+                    if self.force_backend_text:
+                        text_content = extract_text_from_backend(page, bbox)
+                    else:
+                        text_content = extract_inner_text(full_chunk)
+                    doc.add_text(
+                        label=doc_label,
+                        text=text_content,
+                        prov=(
+                            ProvenanceItem(
+                                bbox=bbox.resize_by_scale(pg_width, pg_height),
+                                charspan=(0, len(text_content)),
+                                page_no=page_no,
+                            )
+                            if bbox
+                            else None
+                        ),
+                    )
+        return doc
+
+    @classmethod
+    def get_default_options(cls) -> VlmPipelineOptions:
+        return VlmPipelineOptions()
+
+    @classmethod
+    def is_backend_supported(cls, backend: AbstractDocumentBackend):
+        return isinstance(backend, PdfDocumentBackend)
diff --git a/docling/utils/accelerator_utils.py b/docling/utils/accelerator_utils.py
index 59b04796..8c930250 100644
--- a/docling/utils/accelerator_utils.py
+++ b/docling/utils/accelerator_utils.py
@@ -7,36 +7,62 @@ from docling.datamodel.pipeline_options import AcceleratorDevice
 _log = logging.getLogger(__name__)
 
 
-def decide_device(accelerator_device: AcceleratorDevice) -> str:
+def decide_device(accelerator_device: str) -> str:
     r"""
-    Resolve the device based on the acceleration options and the available devices in the system
+    Resolve the device based on the acceleration options and the available devices in the system.
+
     Rules:
     1. AUTO: Check for the best available device on the system.
     2. User-defined: Check if the device actually exists, otherwise fall-back to CPU
     """
-    cuda_index = 0
     device = "cpu"
 
     has_cuda = torch.backends.cuda.is_built() and torch.cuda.is_available()
     has_mps = torch.backends.mps.is_built() and torch.backends.mps.is_available()
 
-    if accelerator_device == AcceleratorDevice.AUTO:
+    if accelerator_device == AcceleratorDevice.AUTO.value:  # Handle 'auto'
         if has_cuda:
-            device = f"cuda:{cuda_index}"
+            device = "cuda:0"
         elif has_mps:
             device = "mps"
 
+    elif accelerator_device.startswith("cuda"):
+        if has_cuda:
+            # if cuda device index specified extract device id
+            parts = accelerator_device.split(":")
+            if len(parts) == 2 and parts[1].isdigit():
+                # select cuda device's id
+                cuda_index = int(parts[1])
+                if cuda_index < torch.cuda.device_count():
+                    device = f"cuda:{cuda_index}"
+                else:
+                    _log.warning(
+                        "CUDA device 'cuda:%d' is not available. Fall back to 'CPU'.",
+                        cuda_index,
+                    )
+            elif len(parts) == 1:  # just "cuda"
+                device = "cuda:0"
+            else:
+                _log.warning(
+                    "Invalid CUDA device format '%s'. Fall back to 'CPU'",
+                    accelerator_device,
+                )
+        else:
+            _log.warning("CUDA is not available in the system. Fall back to 'CPU'")
+
+    elif accelerator_device == AcceleratorDevice.MPS.value:
+        if has_mps:
+            device = "mps"
+        else:
+            _log.warning("MPS is not available in the system. Fall back to 'CPU'")
+
+    elif accelerator_device == AcceleratorDevice.CPU.value:
+        device = "cpu"
+
     else:
-        if accelerator_device == AcceleratorDevice.CUDA:
-            if has_cuda:
-                device = f"cuda:{cuda_index}"
-            else:
-                _log.warning("CUDA is not available in the system. Fall back to 'CPU'")
-        elif accelerator_device == AcceleratorDevice.MPS:
-            if has_mps:
-                device = "mps"
-            else:
-                _log.warning("MPS is not available in the system. Fall back to 'CPU'")
+        _log.warning(
+            "Unknown device option '%s'. Fall back to 'CPU'", accelerator_device
+        )
 
     _log.info("Accelerator device: '%s'", device)
     return device
diff --git a/docling/utils/glm_utils.py b/docling/utils/glm_utils.py
index da29cdd1..c3c43536 100644
--- a/docling/utils/glm_utils.py
+++ b/docling/utils/glm_utils.py
@@ -15,6 +15,7 @@ from docling_core.types.doc import (
     TableCell,
     TableData,
 )
+from docling_core.types.doc.document import ContentLayer
 
 
 def resolve_item(paths, obj):
@@ -307,6 +308,19 @@ def to_docling_document(doc_glm, update_name_label=False) -> DoclingDocument:
                 current_list = None
 
                 doc.add_code(text=text, prov=prov)
+            elif label == DocItemLabel.FORMULA:
+                current_list = None
+
+                doc.add_text(label=DocItemLabel.FORMULA, text="", orig=text, prov=prov)
+            elif label in [DocItemLabel.PAGE_HEADER, DocItemLabel.PAGE_FOOTER]:
+                current_list = None
+
+                doc.add_text(
+                    label=DocItemLabel(name_label),
+                    text=text,
+                    prov=prov,
+                    content_layer=ContentLayer.FURNITURE,
+                )
             else:
                 current_list = None
 
diff --git a/docling/utils/locks.py b/docling/utils/locks.py
new file mode 100644
index 00000000..558644da
--- /dev/null
+++ b/docling/utils/locks.py
@@ -0,0 +1,3 @@
+import threading
+
+pypdfium2_lock = threading.Lock()
diff --git a/docling/utils/model_downloader.py b/docling/utils/model_downloader.py
new file mode 100644
index 00000000..694fe042
--- /dev/null
+++ b/docling/utils/model_downloader.py
@@ -0,0 +1,97 @@
+import logging
+from pathlib import Path
+from typing import Optional
+
+from docling.datamodel.pipeline_options import (
+    granite_picture_description,
+    smolvlm_picture_description,
+)
+from docling.datamodel.settings import settings
+from docling.models.code_formula_model import CodeFormulaModel
+from docling.models.document_picture_classifier import DocumentPictureClassifier
+from docling.models.easyocr_model import EasyOcrModel
+from docling.models.layout_model import LayoutModel
+from docling.models.picture_description_vlm_model import PictureDescriptionVlmModel
+from docling.models.table_structure_model import TableStructureModel
+
+_log = logging.getLogger(__name__)
+
+
+def download_models(
+    output_dir: Optional[Path] = None,
+    *,
+    force: bool = False,
+    progress: bool = False,
+    with_layout: bool = True,
+    with_tableformer: bool = True,
+    with_code_formula: bool = True,
+    with_picture_classifier: bool = True,
+    with_smolvlm: bool = False,
+    with_granite_vision: bool = False,
+    with_easyocr: bool = True,
+):
+    if output_dir is None:
+        output_dir = settings.cache_dir / "models"
+
+    # Make sure the folder exists
+    output_dir.mkdir(exist_ok=True, parents=True)
+
+    if with_layout:
+        _log.info(f"Downloading layout model...")
+        LayoutModel.download_models(
+            local_dir=output_dir / LayoutModel._model_repo_folder,
+            force=force,
+            progress=progress,
+        )
+
+    if with_tableformer:
+        _log.info(f"Downloading tableformer model...")
+        TableStructureModel.download_models(
+            local_dir=output_dir / TableStructureModel._model_repo_folder,
+            force=force,
+            progress=progress,
+        )
+
+    if with_picture_classifier:
+        _log.info(f"Downloading picture classifier model...")
+        DocumentPictureClassifier.download_models(
+            local_dir=output_dir / DocumentPictureClassifier._model_repo_folder,
+            force=force,
+            progress=progress,
+        )
+
+    if with_code_formula:
+        _log.info(f"Downloading code formula model...")
+        CodeFormulaModel.download_models(
+            local_dir=output_dir / CodeFormulaModel._model_repo_folder,
+            force=force,
+            progress=progress,
+        )
+
+    if with_smolvlm:
+        _log.info(f"Downloading SmolVlm model...")
+        PictureDescriptionVlmModel.download_models(
+            repo_id=smolvlm_picture_description.repo_id,
+            local_dir=output_dir / smolvlm_picture_description.repo_cache_folder,
+            force=force,
+            progress=progress,
+        )
+
+    if with_granite_vision:
+        _log.info(f"Downloading Granite Vision model...")
+        PictureDescriptionVlmModel.download_models(
+            repo_id=granite_picture_description.repo_id,
+            local_dir=output_dir / granite_picture_description.repo_cache_folder,
+            force=force,
+            progress=progress,
+        )
+
+    if with_easyocr:
+        _log.info(f"Downloading easyocr models...")
+        EasyOcrModel.download_models(
+            local_dir=output_dir / EasyOcrModel._model_repo_folder,
+            force=force,
+            progress=progress,
+        )
+
+    return output_dir
diff --git a/docling/utils/utils.py b/docling/utils/utils.py
index 24b69423..1261f860 100644
--- a/docling/utils/utils.py
+++ b/docling/utils/utils.py
@@ -4,6 +4,9 @@ from itertools import islice
 from pathlib import Path
 from typing import List, Union
 
+import requests
+from tqdm import tqdm
+
 
 def chunkify(iterator, chunk_size):
     """Yield successive chunks of chunk_size from the iterable."""
@@ -39,3 +42,24 @@ def create_hash(string: str):
     hasher.update(string.encode("utf-8"))
 
     return hasher.hexdigest()
+
+
+def download_url_with_progress(url: str, progress: bool = False) -> BytesIO:
+    buf = BytesIO()
+    with requests.get(url, stream=True, allow_redirects=True) as response:
+        total_size = int(response.headers.get("content-length", 0))
+        progress_bar = tqdm(
+            total=total_size,
+            unit="B",
+            unit_scale=True,
+            unit_divisor=1024,
+            disable=(not progress),
+        )
+
+        for chunk in response.iter_content(10 * 1024):
+            buf.write(chunk)
+            progress_bar.update(len(chunk))
+        progress_bar.close()
+
+    buf.seek(0)
+    return buf
diff --git a/docling/utils/visualization.py b/docling/utils/visualization.py
index 465b7749..e7ea24a5 100644
--- a/docling/utils/visualization.py
+++ b/docling/utils/visualization.py
@@ -43,6 +43,11 @@ def draw_clusters(
             y0 *= scale_x
             y1 *= scale_y
 
+            if y1 <= y0:
+                y1, y0 = y0, y1
+            if x1 <= x0:
+                x1, x0 = x0, x1
+
             cluster_fill_color = (*list(DocItemLabel.get_color(c.label)), 70)
             cluster_outline_color = (
                 *list(DocItemLabel.get_color(c.label)),
diff --git a/docs/concepts/chunking.md b/docs/concepts/chunking.md
index 94ae387e..c552f3aa 100644
--- a/docs/concepts/chunking.md
+++ b/docs/concepts/chunking.md
@@ -1,5 +1,18 @@
 ## Introduction
 
+!!! note "Chunking approaches"
+
+    Starting from a `DoclingDocument`, there are in principle two possible chunking
+    approaches:
+
+    1. exporting the `DoclingDocument` to Markdown (or similar format) and then
+      performing user-defined chunking as a post-processing step, or
+    2. using native Docling chunkers, i.e. operating directly on the `DoclingDocument`
+
+    This page is about the latter, i.e. using native Docling chunkers.
+    For an example of using approach (1) check out e.g.
+    [this recipe](../examples/rag_langchain.ipynb) looking at the Markdown export mode.
+
 A *chunker* is a Docling abstraction that, given a
 [`DoclingDocument`](./docling_document.md), returns a stream of chunks, each of which
 captures some part of the document as a string accompanied by respective metadata.
diff --git a/docs/examples/backend_csv.ipynb b/docs/examples/backend_csv.ipynb
new file mode 100644
index 00000000..c0143abb
--- /dev/null
+++ b/docs/examples/backend_csv.ipynb
@@ -0,0 +1,80 @@
+{
+ "cells": [
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "# Conversion of CSV files\n",
+    "\n",
+    "This example shows how to convert CSV files to a structured Docling Document.\n",
+    "\n",
+    "* Multiple delimiters are supported: `,` `;` `|` `[tab]`\n",
+    "* Additional CSV dialect settings are detected automatically (e.g. quotes, line separator, escape character)"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "## Example Code"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 59,
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "from pathlib import Path\n",
+    "\n",
+    "from docling.document_converter import DocumentConverter\n",
+    "\n",
+    "# Convert CSV to Docling document\n",
+    "converter = DocumentConverter()\n",
+    "result = converter.convert(Path(\"../../tests/data/csv/csv-comma.csv\"))\n",
+    "output = result.document.export_to_markdown()"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "This code generates the following output:"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "|   Index | Customer Id     | First Name   | Last Name   | Company                         | City              | Country                    | Phone 1                | Phone 2               | Email                       | Subscription Date   | Website                     |\n",
+    "|---------|-----------------|--------------|-------------|---------------------------------|-------------------|----------------------------|------------------------|-----------------------|-----------------------------|---------------------|-----------------------------|\n",
+    "|       1 | DD37Cf93aecA6Dc | Sheryl       | Baxter      | Rasmussen Group                 | East Leonard      | Chile                      | 229.077.5154           | 397.884.0519x718      | zunigavanessa@smith.info    | 2020-08-24          | http://www.stephenson.com/  |\n",
+    "|       2 | 1Ef7b82A4CAAD10 | Preston      | Lozano, Dr  | Vega-Gentry                     | East Jimmychester | Djibouti                   | 5153435776             | 686-620-1820x944      | vmata@colon.com             | 2021-04-23          | http://www.hobbs.com/       |\n",
+    "|       3 | 6F94879bDAfE5a6 | Roy          | Berry       | Murillo-Perry                   | Isabelborough     | Antigua and Barbuda        | +1-539-402-0259        | (496)978-3969x58947   | beckycarr@hogan.com         | 2020-03-25          | http://www.lawrence.com/    |\n",
+    "|       4 | 5Cef8BFA16c5e3c | Linda        | Olsen       | Dominguez, Mcmillan and Donovan | Bensonview        | Dominican Republic         | 001-808-617-6467x12895 | +1-813-324-8756       | stanleyblackwell@benson.org | 2020-06-02          | http://www.good-lyons.com/  |\n",
+    "|       5 | 053d585Ab6b3159 | Joanna       | Bender      | Martin, Lang and Andrade        | West Priscilla    | Slovakia (Slovak Republic) | 001-234-203-0635x76146 | 001-199-446-3860x3486 | colinalvarado@miles.net     | 2021-04-17          | https://goodwin-ingram.com/ |"
+   ]
+  }
+ ],
+ "metadata": {
+  "kernelspec": {
+   "display_name": "docling-TtEIaPrw-py3.12",
+   "language": "python",
+   "name": "python3"
+  },
+  "language_info": {
+   "codemirror_mode": {
+    "name": "ipython",
+    "version": 3
+   },
+   "file_extension": ".py",
+   "mimetype": "text/x-python",
+   "name": "python",
+   "nbconvert_exporter": "python",
+   "pygments_lexer": "ipython3",
+   "version": "3.12.8"
+  }
+ },
+ "nbformat": 4,
+ "nbformat_minor": 2
+}
diff --git a/docs/examples/backend_xml_rag.ipynb b/docs/examples/backend_xml_rag.ipynb
index 78c603c8..0b2227f4 100644
--- a/docs/examples/backend_xml_rag.ipynb
+++ b/docs/examples/backend_xml_rag.ipynb
@@ -82,7 +82,7 @@
     "from docling.document_converter import DocumentConverter\n",
     "\n",
     "# a sample PMC article:\n",
-    "source = \"../../tests/data/pubmed/elife-56337.nxml\"\n",
+    "source = \"../../tests/data/jats/elife-56337.nxml\"\n",
     "converter = DocumentConverter()\n",
     "result = converter.convert(source)\n",
     "print(result.status)"
@@ -97,7 +97,7 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 29,
+   "execution_count": 2,
    "metadata": {},
    "outputs": [
     {
@@ -106,11 +106,11 @@
      "text": [
       "# KRAB-zinc finger protein gene expansion in response to active retrotransposons in the murine lineage\n",
       "\n",
-      "Wolf Gernot; 1: The Eunice Kennedy Shriver National Institute of Child Health and Human Development, The National Institutes of Health: Bethesda: United States; de Iaco Alberto; 2: School of Life Sciences, École Polytechnique Fédérale de Lausanne (EPFL): Lausanne: Switzerland; Sun Ming-An; 1: The Eunice Kennedy Shriver National Institute of Child Health and Human Development, The National Institutes of Health: Bethesda: United States; Bruno Melania; 1: The Eunice Kennedy Shriver National Institute of Child Health and Human Development, The National Institutes of Health: Bethesda: United States; Tinkham Matthew; 1: The Eunice Kennedy Shriver National Institute of Child Health and Human Development, The National Institutes of Health: Bethesda: United States; Hoang Don; 1: The Eunice Kennedy Shriver National Institute of Child Health and Human Development, The National Institutes of Health: Bethesda: United States; Mitra Apratim; 1: The Eunice Kennedy Shriver National Institute of Child Health and Human Development, The National Institutes of Health: Bethesda: United States; Ralls Sherry; 1: The Eunice Kennedy Shriver National Institute of Child Health and Human Development, The National Institutes of Health: Bethesda: United States; Trono Didier; 2: School of Life Sciences, École Polytechnique Fédérale de Lausanne (EPFL): Lausanne: Switzerland; Macfarlan Todd S; 1: The Eunice Kennedy Shriver National Institute of Child Health and Human Development, The National Institutes of Health: Bethesda: United States\n",
+      "Gernot Wolf, Alberto de Iaco, Ming-An Sun, Melania Bruno, Matthew Tinkham, Don Hoang, Apratim Mitra, Sherry Ralls, Didier Trono, Todd S Macfarlan\n",
+      "\n",
+      "The Eunice Kennedy Shriver National Institute of Child Health and Human Development, The National Institutes of Health, Bethesda, United States; School of Life Sciences, École Polytechnique Fédérale de Lausanne (EPFL), Lausanne, Switzerland\n",
       "\n",
       "## Abstract\n",
-      "\n",
-      "The Krüppel-associated box zinc finger protein (KRAB-ZFP) family diversified in mammals. The majority of human KRAB-ZFPs bind transposable elements (TEs), however, since most TEs are inactive in humans it is unclear whether KRAB-ZFPs emerged to suppress TEs. We demonstrate that many recently emerged murine KRAB-ZFPs also bind to TEs, including the active ETn, IAP, and L1 families. Using a CRISPR/Cas9-based engineering approach, we genetically deleted five large clusters of KRAB-ZFPs and demonstrate that target TEs are de-repressed, unleashing TE-encoded enhancers. Homozygous knockout mice lacking one of two KRAB-ZFP gene clusters on chromosome 2 and chromosome 4 were nonetheless viable. In pedigrees of chromosome 4 cluster KRAB-ZFP mutants, we identified numerous novel ETn insertions with a modest increase in mutants. Our data strongly support the current model that recent waves of retrotransposon activity drove the expansion of KRAB-ZFP genes in mice and that many KRAB-ZFPs play a redundant role restricting TE activity.\n",
       "\n"
      ]
     }
@@ -131,7 +131,7 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 2,
+   "execution_count": 3,
    "metadata": {},
    "outputs": [
     {
@@ -198,7 +198,7 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 3,
+   "execution_count": 4,
    "metadata": {},
    "outputs": [
     {
@@ -224,7 +224,7 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 4,
+   "execution_count": 5,
    "metadata": {},
    "outputs": [],
    "source": [
@@ -261,7 +261,7 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 5,
+   "execution_count": 6,
    "metadata": {},
    "outputs": [],
    "source": [
@@ -313,7 +313,7 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 6,
+   "execution_count": 7,
    "metadata": {},
    "outputs": [
     {
@@ -359,9 +359,18 @@
   },
   {
    "cell_type": "code",
-   "execution_count": null,
+   "execution_count": 8,
    "metadata": {},
-   "outputs": [],
+   "outputs": [
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "Downloading https://bulkdata.uspto.gov/data/patent/grant/redbook/fulltext/2024/ipg241217.zip...\n",
+      "Parsing zip file, splitting into XML sections, and exporting to files...\n"
+     ]
+    }
+   ],
    "source": [
     "import zipfile\n",
     "\n",
@@ -407,7 +416,7 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 8,
+   "execution_count": 9,
    "metadata": {},
    "outputs": [
     {
@@ -435,7 +444,7 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 9,
+   "execution_count": 11,
    "metadata": {},
    "outputs": [
     {
@@ -449,7 +458,7 @@
     {
      "data": {
       "application/vnd.jupyter.widget-view+json": {
-       "model_id": "3964d1ff30f74588a2f6b53ca8865a9f",
+       "model_id": "316241ca89a843bda3170f2a5c76c639",
        "version_major": 2,
        "version_minor": 0
       },
@@ -471,7 +480,7 @@
    "source": [
     "from tqdm.notebook import tqdm\n",
     "\n",
-    "from docling.backend.xml.pubmed_backend import PubMedDocumentBackend\n",
+    "from docling.backend.xml.jats_backend import JatsDocumentBackend\n",
     "from docling.backend.xml.uspto_backend import PatentUsptoDocumentBackend\n",
     "from docling.datamodel.base_models import InputFormat\n",
     "from docling.datamodel.document import InputDocument\n",
@@ -479,10 +488,10 @@
     "# check PMC\n",
     "in_doc = InputDocument(\n",
     "    path_or_stream=TEMP_DIR / \"nihpp-2024.12.26.630351v1.nxml\",\n",
-    "    format=InputFormat.XML_PUBMED,\n",
-    "    backend=PubMedDocumentBackend,\n",
+    "    format=InputFormat.XML_JATS,\n",
+    "    backend=JatsDocumentBackend,\n",
     ")\n",
-    "backend = PubMedDocumentBackend(\n",
+    "backend = JatsDocumentBackend(\n",
     "    in_doc=in_doc, path_or_stream=TEMP_DIR / \"nihpp-2024.12.26.630351v1.nxml\"\n",
     ")\n",
     "print(f\"Document {in_doc.file.name} is a valid PMC article? {backend.is_valid()}\")\n",
@@ -521,7 +530,7 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 10,
+   "execution_count": 12,
    "metadata": {},
    "outputs": [
     {
@@ -543,7 +552,7 @@
    "cell_type": "markdown",
    "metadata": {},
    "source": [
-    "✏️ **Tip**: in general, there is no need to use the backend converters to parse USPTO or PubMed XML files. The generic `DocumentConverter` object tries to guess the input document format and applies the corresponding backend parser. The conversion shown in [Simple Conversion](#simple-conversion) is the recommended usage for the supported XML files."
+    "✏️ **Tip**: in general, there is no need to use the backend converters to parse USPTO or JATS (PubMed) XML files. The generic `DocumentConverter` object tries to guess the input document format and applies the corresponding backend parser. The conversion shown in [Simple Conversion](#simple-conversion) is the recommended usage for the supported XML files."
    ]
   },
   {
@@ -579,7 +588,7 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 11,
+   "execution_count": 13,
    "metadata": {},
    "outputs": [],
    "source": [
@@ -607,7 +616,7 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 12,
+   "execution_count": 14,
    "metadata": {},
    "outputs": [],
    "source": [
@@ -625,144 +634,9 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 13,
+   "execution_count": null,
    "metadata": {},
-   "outputs": [
-    {
-     "name": "stderr",
-     "output_type": "stream",
-     "text": [
-      "2025-01-24 16:49:57,108 [DEBUG][_create_connection]: Created new connection using: 2d58fad6c63448a486c0c0ffe3b7b28c (async_milvus_client.py:600)\n",
-      "Loading files:  51%|█████     | 51/100 [00:00<00:00, 67.88file/s]Input document ipg241217-1050.xml does not match any allowed format.\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Failed to load file /var/folders/2r/b2sdj1512g1_0m7wzzy7sftr0000gn/T/tmp11rjcdj8/ipg241217-1050.xml with error: File format not allowed: /var/folders/2r/b2sdj1512g1_0m7wzzy7sftr0000gn/T/tmp11rjcdj8/ipg241217-1050.xml. Skipping...\n"
-     ]
-    },
-    {
-     "name": "stderr",
-     "output_type": "stream",
-     "text": [
-      "Loading files: 100%|██████████| 100/100 [00:01<00:00, 58.05file/s]\n"
-     ]
-    },
-    {
-     "data": {
-      "application/vnd.jupyter.widget-view+json": {
-       "model_id": "e9208639f1a4418d97267a28305d18fa",
-       "version_major": 2,
-       "version_minor": 0
-      },
-      "text/plain": [
-       "Parsing nodes:   0%|          | 0/99 [00:00<?, ?it/s]"
-      ]
-     },
-     "metadata": {},
-     "output_type": "display_data"
-    },
-    {
-     "data": {
-      "application/vnd.jupyter.widget-view+json": {
-       "model_id": "88026613f6f44f0c8476dceaa1cb78cd",
-       "version_major": 2,
-       "version_minor": 0
-      },
-      "text/plain": [
-       "Generating embeddings:   0%|          | 0/2048 [00:00<?, ?it/s]"
-      ]
-     },
-     "metadata": {},
-     "output_type": "display_data"
-    },
-    {
-     "data": {
-      "application/vnd.jupyter.widget-view+json": {
-       "model_id": "7522b8b434b54616b4cfc3d71e9556d7",
-       "version_major": 2,
-       "version_minor": 0
-      },
-      "text/plain": [
-       "Generating embeddings:   0%|          | 0/2048 [00:00<?, ?it/s]"
-      ]
-     },
-     "metadata": {},
-     "output_type": "display_data"
-    },
-    {
-     "data": {
-      "application/vnd.jupyter.widget-view+json": {
-       "model_id": "5879d8161c2041f5b100959e69ff9017",
-       "version_major": 2,
-       "version_minor": 0
-      },
-      "text/plain": [
-       "Generating embeddings:   0%|          | 0/2048 [00:00<?, ?it/s]"
-      ]
-     },
-     "metadata": {},
-     "output_type": "display_data"
-    },
-    {
-     "data": {
-      "application/vnd.jupyter.widget-view+json": {
-       "model_id": "557912b5e3c741f3a06127156bc46379",
-       "version_major": 2,
-       "version_minor": 0
-      },
-      "text/plain": [
-       "Generating embeddings:   0%|          | 0/2048 [00:00<?, ?it/s]"
-      ]
-     },
-     "metadata": {},
-     "output_type": "display_data"
-    },
-    {
-     "data": {
-      "application/vnd.jupyter.widget-view+json": {
-       "model_id": "843bb145942b449aa55fc5b8208da734",
-       "version_major": 2,
-       "version_minor": 0
-      },
-      "text/plain": [
-       "Generating embeddings:   0%|          | 0/2048 [00:00<?, ?it/s]"
-      ]
-     },
-     "metadata": {},
-     "output_type": "display_data"
-    },
-    {
-     "data": {
-      "application/vnd.jupyter.widget-view+json": {
-       "model_id": "c7dba09a4aed422998e9b9c2c3a70317",
-       "version_major": 2,
-       "version_minor": 0
-      },
-      "text/plain": [
-       "Generating embeddings:   0%|          | 0/2048 [00:00<?, ?it/s]"
-      ]
-     },
-     "metadata": {},
-     "output_type": "display_data"
-    },
-    {
-     "data": {
-      "application/vnd.jupyter.widget-view+json": {
-       "model_id": "0bd031356c7e4e879dcbe1d04e6c4a4e",
-       "version_major": 2,
-       "version_minor": 0
-      },
-      "text/plain": [
-       "Generating embeddings:   0%|          | 0/425 [00:00<?, ?it/s]"
-      ]
-     },
-     "metadata": {},
-     "output_type": "display_data"
-    }
-   ],
+   "outputs": [],
    "source": [
     "from llama_index.core import StorageContext, VectorStoreIndex\n",
     "from llama_index.vector_stores.milvus import MilvusVectorStore\n",
diff --git a/docs/examples/batch_convert.py b/docs/examples/batch_convert.py
index f6ad92bd..c21a4645 100644
--- a/docs/examples/batch_convert.py
+++ b/docs/examples/batch_convert.py
@@ -5,16 +5,18 @@ from pathlib import Path
 from typing import Iterable
 
 import yaml
+from docling_core.types.doc import ImageRefMode
 
-from docling.datamodel.base_models import ConversionStatus
+from docling.datamodel.base_models import ConversionStatus, InputFormat
 from docling.datamodel.document import ConversionResult
+from docling.datamodel.pipeline_options import PdfPipelineOptions
 from docling.datamodel.settings import settings
-from docling.document_converter import DocumentConverter
+from docling.document_converter import DocumentConverter, PdfFormatOption
 
 _log = logging.getLogger(__name__)
 
 USE_V2 = True
-USE_LEGACY = True
+USE_LEGACY = False
 
 
 def export_documents(
@@ -33,26 +35,31 @@ def export_documents(
             doc_filename = conv_res.input.file.stem
 
             if USE_V2:
-                # Export Docling document format to JSON:
-                with (output_dir / f"{doc_filename}.json").open("w") as fp:
-                    fp.write(json.dumps(conv_res.document.export_to_dict()))
+                conv_res.document.save_as_json(
+                    output_dir / f"{doc_filename}.json",
+                    image_mode=ImageRefMode.PLACEHOLDER,
+                )
+                conv_res.document.save_as_html(
+                    output_dir / f"{doc_filename}.html",
+                    image_mode=ImageRefMode.EMBEDDED,
+                )
+                conv_res.document.save_as_document_tokens(
+                    output_dir / f"{doc_filename}.doctags.txt"
+                )
+                conv_res.document.save_as_markdown(
+                    output_dir / f"{doc_filename}.md",
+                    image_mode=ImageRefMode.PLACEHOLDER,
+                )
+                conv_res.document.save_as_markdown(
+                    output_dir / f"{doc_filename}.txt",
+                    image_mode=ImageRefMode.PLACEHOLDER,
+                    strict_text=True,
+                )
 
                 # Export Docling document format to YAML:
                 with (output_dir / f"{doc_filename}.yaml").open("w") as fp:
                     fp.write(yaml.safe_dump(conv_res.document.export_to_dict()))
 
-                # Export Docling document format to doctags:
-                with (output_dir / f"{doc_filename}.doctags.txt").open("w") as fp:
-                    fp.write(conv_res.document.export_to_document_tokens())
-
-                # Export Docling document format to markdown:
-                with (output_dir / f"{doc_filename}.md").open("w") as fp:
-                    fp.write(conv_res.document.export_to_markdown())
-
-                # Export Docling document format to text:
-                with (output_dir / f"{doc_filename}.txt").open("w") as fp:
-                    fp.write(conv_res.document.export_to_markdown(strict_text=True))
-
             if USE_LEGACY:
                 # Export Deep Search document JSON format:
                 with (output_dir / f"{doc_filename}.legacy.json").open(
@@ -103,10 +110,10 @@ def main():
     logging.basicConfig(level=logging.INFO)
 
     input_doc_paths = [
-        Path("./tests/data/2206.01062.pdf"),
-        Path("./tests/data/2203.01017v2.pdf"),
-        Path("./tests/data/2305.03393v1.pdf"),
-        Path("./tests/data/redp5110_sampled.pdf"),
+        Path("./tests/data/pdf/2206.01062.pdf"),
+        Path("./tests/data/pdf/2203.01017v2.pdf"),
+        Path("./tests/data/pdf/2305.03393v1.pdf"),
+        Path("./tests/data/pdf/redp5110_sampled.pdf"),
     ]
 
     # buf = BytesIO(Path("./test/data/2206.01062.pdf").open("rb").read())
@@ -119,13 +126,20 @@ def main():
     # settings.debug.visualize_tables = True
     # settings.debug.visualize_cells = True
 
-    doc_converter = DocumentConverter()
+    pipeline_options = PdfPipelineOptions()
+    pipeline_options.generate_page_images = True
+
+    doc_converter = DocumentConverter(
+        format_options={
+            InputFormat.PDF: PdfFormatOption(pipeline_options=pipeline_options)
+        }
+    )
 
     start_time = time.time()
 
     conv_results = doc_converter.convert_all(
         input_doc_paths,
-        raises_on_error=False,  # to let conversion run through all and examine results at the end
+        raises_on_error=True,  # to let conversion run through all and examine results at the end
     )
     success_count, partial_success_count, failure_count = export_documents(
         conv_results, output_dir=Path("scratch")
diff --git a/docs/examples/custom_convert.py b/docs/examples/custom_convert.py
index 49ab739a..ddc19217 100644
--- a/docs/examples/custom_convert.py
+++ b/docs/examples/custom_convert.py
@@ -21,7 +21,7 @@ _log = logging.getLogger(__name__)
 def main():
     logging.basicConfig(level=logging.INFO)
 
-    input_doc_path = Path("./tests/data/2206.01062.pdf")
+    input_doc_path = Path("./tests/data/pdf/2206.01062.pdf")
 
     ###########################################################################
 
diff --git a/docs/examples/develop_formula_understanding.py b/docs/examples/develop_formula_understanding.py
index e2e508c3..ca24d95d 100644
--- a/docs/examples/develop_formula_understanding.py
+++ b/docs/examples/develop_formula_understanding.py
@@ -1,3 +1,7 @@
+# WARNING
+# This example demonstrates only how to develop a new enrichment model.
+# It does not run the actual formula understanding model.
+
 import logging
 from pathlib import Path
 from typing import Iterable
@@ -68,7 +72,7 @@ class ExampleFormulaUnderstandingPipeline(StandardPdfPipeline):
 def main():
     logging.basicConfig(level=logging.INFO)
 
-    input_doc_path = Path("./tests/data/2203.01017v2.pdf")
+    input_doc_path = Path("./tests/data/pdf/2203.01017v2.pdf")
 
     pipeline_options = ExampleFormulaUnderstandingPipelineOptions()
     pipeline_options.do_formula_understanding = True
diff --git a/docs/examples/develop_picture_enrichment.py b/docs/examples/develop_picture_enrichment.py
index 81009fe8..9991afe9 100644
--- a/docs/examples/develop_picture_enrichment.py
+++ b/docs/examples/develop_picture_enrichment.py
@@ -1,3 +1,7 @@
+# WARNING
+# This example demonstrates only how to develop a new enrichment model.
+# It does not run the actual picture classifier model.
+
 import logging
 from pathlib import Path
 from typing import Any, Iterable
@@ -71,7 +75,7 @@ class ExamplePictureClassifierPipeline(StandardPdfPipeline):
 def main():
     logging.basicConfig(level=logging.INFO)
 
-    input_doc_path = Path("./tests/data/2206.01062.pdf")
+    input_doc_path = Path("./tests/data/pdf/2206.01062.pdf")
 
     pipeline_options = ExamplePictureClassifierPipelineOptions()
     pipeline_options.images_scale = 2.0
diff --git a/docs/examples/export_figures.py b/docs/examples/export_figures.py
index b2ecc43f..c2186661 100644
--- a/docs/examples/export_figures.py
+++ b/docs/examples/export_figures.py
@@ -16,7 +16,7 @@ IMAGE_RESOLUTION_SCALE = 2.0
 def main():
     logging.basicConfig(level=logging.INFO)
 
-    input_doc_path = Path("./tests/data/2206.01062.pdf")
+    input_doc_path = Path("./tests/data/pdf/2206.01062.pdf")
     output_dir = Path("scratch")
 
     # Important: For operating with page images, we must keep them, otherwise the DocumentConverter
diff --git a/docs/examples/export_multimodal.py b/docs/examples/export_multimodal.py
index 09885bd3..e7ea3df2 100644
--- a/docs/examples/export_multimodal.py
+++ b/docs/examples/export_multimodal.py
@@ -19,7 +19,7 @@ IMAGE_RESOLUTION_SCALE = 2.0
 def main():
     logging.basicConfig(level=logging.INFO)
 
-    input_doc_path = Path("./tests/data/2206.01062.pdf")
+    input_doc_path = Path("./tests/data/pdf/2206.01062.pdf")
     output_dir = Path("scratch")
 
     # Important: For operating with page images, we must keep them, otherwise the DocumentConverter
diff --git a/docs/examples/export_tables.py b/docs/examples/export_tables.py
index 68b9ce47..2985127b 100644
--- a/docs/examples/export_tables.py
+++ b/docs/examples/export_tables.py
@@ -12,7 +12,7 @@ _log = logging.getLogger(__name__)
 def main():
     logging.basicConfig(level=logging.INFO)
 
-    input_doc_path = Path("./tests/data/2206.01062.pdf")
+    input_doc_path = Path("./tests/data/pdf/2206.01062.pdf")
     output_dir = Path("scratch")
 
     doc_converter = DocumentConverter()
diff --git a/docs/examples/full_page_ocr.py b/docs/examples/full_page_ocr.py
index 967910dc..8390d5fc 100644
--- a/docs/examples/full_page_ocr.py
+++ b/docs/examples/full_page_ocr.py
@@ -14,7 +14,7 @@ from docling.document_converter import DocumentConverter, PdfFormatOption
 
 
 def main():
-    input_doc = Path("./tests/data/2206.01062.pdf")
+    input_doc = Path("./tests/data/pdf/2206.01062.pdf")
 
     pipeline_options = PdfPipelineOptions()
     pipeline_options.do_ocr = True
diff --git a/docs/examples/hybrid_chunking.ipynb b/docs/examples/hybrid_chunking.ipynb
index 2b7861aa..6a5f5882 100644
--- a/docs/examples/hybrid_chunking.ipynb
+++ b/docs/examples/hybrid_chunking.ipynb
@@ -83,7 +83,15 @@
    "cell_type": "code",
    "execution_count": 3,
    "metadata": {},
-   "outputs": [],
+   "outputs": [
+    {
+     "name": "stderr",
+     "output_type": "stream",
+     "text": [
+      "Token indices sequence length is longer than the specified maximum sequence length for this model (531 > 512). Running this sequence through the model will result in indexing errors\n"
+     ]
+    }
+   ],
    "source": [
     "from docling.chunking import HybridChunker\n",
     "\n",
@@ -91,6 +99,13 @@
     "chunk_iter = chunker.chunk(dl_doc=doc)"
    ]
   },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "> 👉 **NOTE**: As you see above, using the `HybridChunker` can sometimes lead to a warning from the transformers library, however this is a \"false alarm\" — for details check [here](https://ds4sd.github.io/docling/faq/#hybridchunker-triggers-warning-token-indices-sequence-length-is-longer-than-the-specified-maximum-sequence-length-for-this-model)."
+   ]
+  },
   {
    "cell_type": "markdown",
    "metadata": {},
@@ -337,11 +352,11 @@
    "source": [
     "for i, chunk in enumerate(chunks):\n",
     "    print(f\"=== {i} ===\")\n",
-    "    txt_tokens = len(tokenizer.tokenize(chunk.text, max_length=None))\n",
+    "    txt_tokens = len(tokenizer.tokenize(chunk.text))\n",
     "    print(f\"chunk.text ({txt_tokens} tokens):\\n{repr(chunk.text)}\")\n",
     "\n",
     "    ser_txt = chunker.serialize(chunk=chunk)\n",
-    "    ser_tokens = len(tokenizer.tokenize(ser_txt, max_length=None))\n",
+    "    ser_tokens = len(tokenizer.tokenize(ser_txt))\n",
     "    print(f\"chunker.serialize(chunk) ({ser_tokens} tokens):\\n{repr(ser_txt)}\")\n",
     "\n",
     "    print()"
diff --git a/docs/examples/inspect_picture_content.py b/docs/examples/inspect_picture_content.py
index 7930acf5..3a3f6657 100644
--- a/docs/examples/inspect_picture_content.py
+++ b/docs/examples/inspect_picture_content.py
@@ -4,7 +4,7 @@ from docling.datamodel.base_models import InputFormat
 from docling.datamodel.pipeline_options import PdfPipelineOptions
 from docling.document_converter import DocumentConverter, PdfFormatOption
 
-source = "tests/data/amt_handbook_sample.pdf"
+source = "tests/data/pdf/amt_handbook_sample.pdf"
 
 pipeline_options = PdfPipelineOptions()
 pipeline_options.images_scale = 2
diff --git a/docs/examples/minimal_vlm_pipeline.py b/docs/examples/minimal_vlm_pipeline.py
new file mode 100644
index 00000000..948ecc64
--- /dev/null
+++ b/docs/examples/minimal_vlm_pipeline.py
@@ -0,0 +1,96 @@
+import json
+import time
+from pathlib import Path
+
+import yaml
+
+from docling.datamodel.base_models import InputFormat
+from docling.datamodel.pipeline_options import (
+    AcceleratorDevice,
+    VlmPipelineOptions,
+    granite_vision_vlm_conversion_options,
+    smoldocling_vlm_conversion_options,
+)
+from docling.datamodel.settings import settings
+from docling.document_converter import DocumentConverter, PdfFormatOption
+from docling.pipeline.vlm_pipeline import VlmPipeline
+
+sources = [
+    "tests/data/2305.03393v1-pg9-img.png",
+]
+
+## Use experimental VlmPipeline
+pipeline_options = VlmPipelineOptions()
+# If force_backend_text = True, text from backend will be used instead of generated text
+pipeline_options.force_backend_text = False
+
+## On GPU systems, enable flash_attention_2 with CUDA:
+# pipeline_options.accelerator_options.device = AcceleratorDevice.CUDA
+# pipeline_options.accelerator_options.cuda_use_flash_attention2 = True
+
+## Pick a VLM model. We choose SmolDocling-256M by default
+pipeline_options.vlm_options = smoldocling_vlm_conversion_options
+
+## Alternative VLM models:
+# pipeline_options.vlm_options = granite_vision_vlm_conversion_options
+
+from docling_core.types.doc import DocItemLabel, ImageRefMode
+from docling_core.types.doc.document import DEFAULT_EXPORT_LABELS
+
+## Set up pipeline for PDF or image inputs
+converter = DocumentConverter(
+    format_options={
+        InputFormat.PDF: PdfFormatOption(
+            pipeline_cls=VlmPipeline,
+            pipeline_options=pipeline_options,
+        ),
+        InputFormat.IMAGE: PdfFormatOption(
+            pipeline_cls=VlmPipeline,
+            pipeline_options=pipeline_options,
+        ),
+    }
+)
+
+out_path = Path("scratch")
+out_path.mkdir(parents=True, exist_ok=True)
+
+for source in sources:
+    start_time = time.time()
+    print("================================================")
+    print("Processing... {}".format(source))
+    print("================================================")
+    print("")
+
+    res = converter.convert(source)
+
+    print("------------------------------------------------")
+    print("MD:")
+    print("------------------------------------------------")
+    print("")
+    print(res.document.export_to_markdown())
+
+    for page in res.pages:
+        print("")
+        print("Predicted page in DOCTAGS:")
+        print(page.predictions.vlm_response.text)
+
+    res.document.save_as_html(
+        filename=Path("{}/{}.html".format(out_path, res.input.file.stem)),
+        image_mode=ImageRefMode.REFERENCED,
+        labels=[*DEFAULT_EXPORT_LABELS, DocItemLabel.FOOTNOTE],
+    )
+
+    with (out_path / f"{res.input.file.stem}.json").open("w") as fp:
+        fp.write(json.dumps(res.document.export_to_dict()))
+
+    pg_num = res.document.num_pages()
+
+    print("")
+    inference_time = time.time() - start_time
+    print(
+        f"Total document prediction time: {inference_time:.2f} seconds, pages: {pg_num}"
+    )
+
+print("================================================")
+print("done!")
+print("================================================")
diff --git a/docs/examples/pictures_description.ipynb b/docs/examples/pictures_description.ipynb
new file mode 100644
index 00000000..f50860db
--- /dev/null
+++ b/docs/examples/pictures_description.ipynb
@@ -0,0 +1,343 @@
+{
+ "cells": [
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "<a href=\"https://colab.research.google.com/github/DS4SD/docling/blob/main/docs/examples/pictures_description.ipynb\" target=\"_parent\"><img src=\"https://colab.research.google.com/assets/colab-badge.svg\" alt=\"Open In Colab\"/></a>"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "metadata": {},
+   "outputs": [
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "Note: you may need to restart the kernel to use updated packages.\n"
+     ]
+    }
+   ],
+   "source": [
+    "%pip install -q docling[vlm] ipython"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 1,
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "from docling.datamodel.base_models import InputFormat\n",
+    "from docling.datamodel.pipeline_options import PdfPipelineOptions\n",
+    "from docling.document_converter import DocumentConverter, PdfFormatOption"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 2,
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "# The source document\n",
+    "DOC_SOURCE = \"https://arxiv.org/pdf/2501.17887\""
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "---"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "## Describe pictures with Granite Vision\n",
+    "\n",
+    "This section will run locally the [ibm-granite/granite-vision-3.1-2b-preview](https://huggingface.co/ibm-granite/granite-vision-3.1-2b-preview) model to describe the pictures of the document."
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 3,
+   "metadata": {},
+   "outputs": [
+    {
+     "name": "stderr",
+     "output_type": "stream",
+     "text": [
+      "Using a slow image processor as `use_fast` is unset and a slow processor was saved with this model. `use_fast=True` will be the default behavior in v4.48, even if the model was saved with a slow processor. This will result in minor differences in outputs. You'll still be able to use a slow processor with `use_fast=False`.\n"
+     ]
+    },
+    {
+     "data": {
+      "application/vnd.jupyter.widget-view+json": {
+       "model_id": "93a634699bf1434c9bc8e384d6db1a28",
+       "version_major": 2,
+       "version_minor": 0
+      },
+      "text/plain": [
+       "Loading checkpoint shards:   0%|          | 0/2 [00:00<?, ?it/s]"
+      ]
+     },
+     "metadata": {},
+     "output_type": "display_data"
+    }
+   ],
+   "source": [
+    "from docling.datamodel.pipeline_options import granite_picture_description\n",
+    "\n",
+    "pipeline_options = PdfPipelineOptions()\n",
+    "pipeline_options.do_picture_description = True\n",
+    "pipeline_options.picture_description_options = (\n",
+    "    granite_picture_description  # <-- the model choice\n",
+    ")\n",
+    "pipeline_options.picture_description_options.prompt = (\n",
+    "    \"Describe the image in three sentences. Be consise and accurate.\"\n",
+    ")\n",
+    "pipeline_options.images_scale = 2.0\n",
+    "pipeline_options.generate_picture_images = True\n",
+    "\n",
+    "converter = DocumentConverter(\n",
+    "    format_options={\n",
+    "        InputFormat.PDF: PdfFormatOption(\n",
+    "            pipeline_options=pipeline_options,\n",
+    "        )\n",
+    "    }\n",
+    ")\n",
+    "doc = converter.convert(DOC_SOURCE).document"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 4,
+   "metadata": {},
+   "outputs": [
+    {
+     "data": {
+      "text/html": [
+       "<h3>Picture <code>#/pictures/0</code></h3><img src=\"data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAA0oAAAGOCAIAAAAmXmQxAAEAAElEQVR4nOydBXxV1R/Azzk3Xq+7WcDo7i4BCQUEBRMFuxVUFP3bBRY2omInKgYWId1dAzbW3Xt545z/59y7PR7bgA22sbhfH/O9+26ed+49v/NLSAgBGhoaGhoaGhoarQUWtEoIvtRnoKGhoaHRkiAQAED/aTQgigZJa9WmA8LK5m6N4h3Bsv2oJuFpaGhoaNQRCIgDeQlIB4Fm0WowEAQZToRhAIKahNcUYAJ8OBhpQK1ae6eJdxoaGhoadYUQOjgSoIl3DQehAoc2GDcdag9WoSKehoaGhoaGhoZGq0ET7zQ0NDQ0NDQ0WhWaeKehoaGhoaGh0arQxDsNDQ0NDQ0NjVaFJt5paGhoaGhoaLQqNPFOQ0NDQ0NDQ6NV0UoTo9SJqtx/avT2GcHwHl/V8m1t65xtNc9kP9VWgGp+pYsJwoe1nLZWhkRDQ0NDQ6Nt02bFO0KIDKqy8UCIEMPTpEdYVr6TafaYyu8AhAz9lsjqt1XbS+7NPdesfhD3JpX74QiWlTRABEsuCBmILvwnoOcAEKySIDEWACGI4S94hxoaGhoaGhqtgLYo3kHIWEtSkra+KTrLiCKj8Tpv37DeYe0n6M0hhMgZh3/MPfkPwRIBhEGczhTsF947KGa4zhRIsAQR4yjPPr59qaMix52vkRBi9ArrNPRRTu9dWYQFsYVpG1P2rsBYJARDAHWmoMDowSGxYzi9t7UkZc8fDwS3G9Fh8INYcl3AJTgqco5vXxrUbnho/HhFiMSH/3vBWnRiwLRPIMNrOjwNDQ0NDY02S1sU7wCEklBRlLHFJ7SXb0h3QLCjIvvkzveKMrd1HfWMwRxcUXi8LO9QWIeJHG+WJEdF4YnD/63OPPpTp2ELvYM6QwAl0VacuZM3BgREDQSYSngEEN7ohxDrNpZCCB0VOcVZO0MTJhi9IwmRKgpOHF73THnBscRBD/B6n/DEKRb/eKCo9yBENNc0IRAxAECqPjxTPoMQAYioGEkPRwCEsmQrzt5l8U9QtpUAgIFRg70COgCqQYQQQipTqlsRRVVZrQkQUsrwaBnFNTQ0NDQ0WhttUryjQAjZ4HYj2vW4AWMJABB4fPX+fxfmn1oX3W02gEBnDozrPdfoE0VkkWC5OHvX/jVPHNnwQu+JS3XGQMXUigIiByQOfogom1OoeCZX865jOGNE52mBUUMw3Y94fNvStEPfBMeOCogcEN1lJkQMPToholiBGB3DGly2fFlyGczBkJpxK/eMGE4S7C57AUK83hykyHmqiMZSAa6KoHYjAMYQMlhyYixxOi9ZtLtsBSxv5o1+bjOxIvNBpzUfS07eGMDpzFgWm67hNTQ0NDQ0NBqZNiveUQjB1AKr2Ft9QrqzvNlenqGIaNSbTXG2w4QQAFFg9JCEvrcf/u+FwvQtEZ2meuwDqisr1K4Go8529Cgiw+j8wvuk7v/CZSsQHKWHN7zgG9orpvu1rorco1sWW/zbE1nMO/WfLDrM/nEJ/W43+8URLEOI8lM3ntq7QnQUA8h4BSXG97nN6BN15kGoA17a/i+tJSldRz+Tffz34qw9AVEDck6sdlTkIoaP7jo7ouMUQgiE0GUvSt69rCR7PwFUBIzuOis4drR6po3UzhoaGhoaGhpNSZtOjEK1XwyPWB1idNbiZFm064yB8Iw2UctLU5Oob2gvnTGgJGcvFbmU7yTB5rTmul+SaPcQ9U6DEAepZk4HICgvTAIQ8QY/LAtleYcc5VlU2YaF8vwjybuX2cszEvrdFtt7Tlnu/iMbXpJcFYjhS3L2Hl7/rNEnqsuo/yX0v6u8MOnwhudFZ1mVDu809tK0svwjAACnNT8r6df0g98FRA3pMPA+3uB7fNub1tJUxLCy5Di2ZUlx1q64vnO7jnrGO7DzkY0vFKRtRNQorKGhoaGhodEaaMPaOwiL0rcSyUUAcVrzc5P/NvnGBMYMp1/ViEsgALO8mdOZBUcJtZlC6ruWe/Kf0rz96soEgHY9bwrvMNEzuhYAiLGYc+KP8oKjGIu20lM5J9cERg32Ce4miTbEcIqnXWVUrX9Yn47DFnK8BSIkS65jmxeXFxzzjxyQfeJP3uCXOPBBVm9GkAUIHfp3UVn+Yb05pPoFIRYxnLo/nSkwccjD/hH9FfmS3/v3fFvJKa+AxPKCpKLMHZ2GPhqWcDnGktkvrjT/YM7JvwJjhtRIs6KhoaGhoaHRImmz4h1Vs5UVHHHacmlAA8MHRQ+P7nGd2bedkm2kNrCMqRmXrVSbEeIVmBgSP7YyaoEAL//4GvEQNP1JUeaOsvzDVMxi9e26Xxvd9RpO7yUJFdXOx+QXx/FmLLsQ4C0BCYjR2crSfcN6W4uTXfbCg2sX0dgLAKnK0FHorMjRm0NqURUqEEI4vZfBHIJlAULE8EaEOFlyAgBsZRmiszzj8A85J/4kgEAA7aXpWBKILEGG06Q7DQ0NDQ2NVkCbFe9oHERU15lRnWdgLLGsgdVZFCc52TMPsRsIGZe9QLCXGL0jaO46Ba/AjtHdZrsDIJSEdmcEqBJCGFbffuD9/hF9iSyxvJnhjITmSakWx1q5MvXzU94ixCKEsCyo6fH0pmD/iH7qOQPIRCRO8g3tLUuOcwlj1aJlqy6KYBExjE9IN50xQNXVBUYPNVhCaMY+LZeKhoaGhoZGq6DNincUljPpDP5K5CxRZCkPOUhVvtEEI1Bxj5Oyjv+OsRAYNdgtBhEiY1k4HTlbO5DTWXSGAGX/GMs0xV317MeVu6NRFEQ5qGAvkiWnzugPEaMzBUqCNarL1Yil+YolV0VB2iY1N8rp86wzOpq9hfeP6B8QMwzIIoCwJHuP4Cyr+x40NDQ0NDQ0Wrx4J8uyzWaTpHMLMedHkiSDwWCxWECzipwl1VVup7+TXLLoIFi2l6VlHP4h48hP0V2v8Q7pdqZ33cUdxYOCtE2hCRO8AxNFZ1lm0q8sb/YK7AgRGxg9+NjmJXkpa4NjRwIIc06sPrT+uV6Xv2Hxbw8hcpRny6JTSWJXp1OxBCTqzEHph771CujA6iwuW8H+fx83+8YGRAzQfO80NDQ0NDTainhndziKiotZ9uL0fITY7HZ7VlZQYGBwcDDHKREAlw5aLIyKbmeTWUlFYfq2H69X9HYiwZg3Bib0uzO622wEGWoiJViWnOdNF0ewRI9Sa95gQjz3gBAjy+Lh9c+xnNFpyxecJR0G3m/0iiCyGBo/vqzg2KH1T2cc+ZH6C+Yfiu56tV94bwjZoOhh6Ye/c1hzeo5bDBkOy4LqYIexSN+c1jJiasmltmPJYA5t3//uoxtf3vbTHLNvbHnhMYbRx/W+GSL2rE6HGhoaGhoaGi0KSP29zul0VV5eXlBczPN8lWdYHXaq/K22NsG4pKTEZrX6+PjExcXp9XrQSBAs2w6DcxRjgFB0lpVk7zH7xZl8ompeV0Vhkq00HSh1Z2nuYN5s8ok2ekdTAYh6v0HJZS3J2as3h1gCEs7WehAie3lGReEJn5DuOqP/GUIehFh0Fufs0ZuCvAI7Osqzdv56Z2D0kLCECUVZOwEgviE9vIM6q2UqIESy5CzK3l1RmAQA8Aro4BfWh2F1BBDJVVGaewAA4B85AEKmvOCo6Crzj+hvLUlxWvN8Q3synAECKDhKSnL3ewV0MFhCaSkLxFiLThbn7HHZi/TmYP/wflSOPJ9yUUNDQ6MVAwGxM14C0kPNiNFwIAjSHQjDQFQfJyKNCwYT4MvDKAM16EGptNTxyitSSgp2V6av+kvfQOhyueyiCBFSimEBtYgVfaOIHthjibqQviCkNVCVl1rGgX4kxHfgQOPIkQQAjmXbtWvn6+sLLol4p9bkYnis5DSu+a2SsuR0eTGqDlNSE3tsTp3iCI2lPZcCDyIGIapUq02BBxmWpxo1QJwVuTt/vT0wZninoY+6j6Io9irPAEIEEVf1ESrBGeqPg2icBwBq1VqaFQUiLLkQYiFVBwqV1W8rL5aW36i8QETXpL8PRGrW5fM0qYaGhkarRhPvGgNNvLuE4h0r2+22VavgoUNslfhQmcnXQzjjlTdQ+euW/CS3MKe8lz2WSFXvZVWwU/6WASAbjR0nT3bY7QzDJCUlxcXFBQYGNvXVq9eoWFfP9i0Vrc5peKVRqWff/PRqWJbP6qhHZEUmU1Pf0WALCNXCZbWeLVFiMmq7itPL3aZeGiziIbHVvNhzS6UaGhoaGhoaLRqWWip53giABUJPwY6KaITAuDhm2DDAsrLDYd++3XHiBN+zJ9+nD8ZYyM+v2LbNWVBAeD5w/Hg2OJiKcZKUv3q1IzfXrb1zv0oAEFjWZDLZbTaTyYQQSkpKcrlcERERoA1DCOb03p2GPcYb/IDm/aahoaGhoaFx0bDkTN2b+kbVukkA6Pv29X7zTbmsDOl0+rS0tOnTTePHB//vf1JxMeI4++HDx265xZGd3eHRR81duohlZbLdXnjokDM3122ZdYt3NgCchCCEDEajLMve3t4Y47S0NEJIZGQkaLMQghjeL7wvoAG25zIoa2hoaGhoaGjUBRoPKwLgAoA5U7aTleUMyxKnM2fBAmAyhS9Zwo8eLXGcWFR07Lbb+IiI+JdeCnnggaNPPAENhvw1aw4//TTG2JacTDO8eYh3qjrQrhyFpl7jeUmSLBYLxhhCmJ6eDgCIiIiAbdg2r3m/aWhoaGhoaDSk9k71w4Iesp3bf85A3fYlW1YW4DiauU6vpx54LlfJgQO2X3+1DB1q6dcPBgfLgmCMjg694gpXSUlZZqbTZquMvaj6SwBwACBUKqsYQPekxxirpRpSU1MBAG1ah6ehoaGhoaGh0YDaO5ci4anxraqE57bSGjFmvLxiP/mEsViE8vLc9etDZs6k4bQcZwfAnp9v6dpV1utlSTK3bx9xzTW2zMzjv/wiFBeDGuKdO8RA1dFxHGexWFSNHSEkLS0NQtjG/fA0NDQ0NDQ0NBpGe+euxuXpgacaZ6mZVZKKd+2qOHKkcOPGwqNHg1gWE+IUBJnnjbGxrooKm9WK9PrMf/7Z8eijsijacnJokS+PKA33m0oUkU4QBIZhdDqd2WxWF6elpen1+oCAgAa4LA0NDQ0NDQ2Ntqy9Ezyy07mTm6jvJZbFDkfyO+/kbNjgXpOzWEKnTzfHxISPG7fnhRfK8/Igx7kqKgpSUlTNnFtv505u7JlHiEEIY3z8+HFCCMMwSCmoxXGcwWA4fvw4x3He3t6XpC00NDQ0NDQ0NFoBLAbAqUhywC3eKQGcWNXeCYJotQqEqBo+FwBOmw1xXNfHHpOczmNffHHg7bclWRasVtHlcstz7pf7o6eEBxEym81uxztRFAVBcDgcoigSQpKTkzt37qzT6S5Fa2hoaGhoaGhotArtnUOR5BAAat17dyoTGYDMf/4pOn687ORJdwzsic8/z1y/HmPsKisrT00VXC7IMGtuv12wWqup62rq7dxACBmGUR3veJ43mUxeXl52u71UIS0tLT4+XtXqNXMaPNq37pXfNDQ0NDQ0NDTOqr1ziGI5ALYq2c5toqVhFkVFclFRZVUx9W9WFs7K8hTdiCxnHDgAFe89T71dNZzKmmcTZRBCFovFYDCUlpaWlJRUVFS0CBOtLMvKVTSMkAch4HheltpEkpSGFWSVyUArl40b9vKgQitvsiq0ptPQ0GhrsJBl+Y4dZUmysWy1SmJqFK0gy6IsY6Xm7Nm0cWptU/dbVJALnE4cEEhMZoArYypMkuQVFnaOU1Fd8QICApxOZ/MX7xiWycrKe/qF97Ky8yCt39oA6HTc/PvmDBjcU3a15qJhEMKKCuuBwydJVd+4SAgAIcH+8bFRrXXQhRBabfb9B483VIspWnOuY4dYLy/qJgFaLwjCsnLrkWMpoig2lK6dZdnOneK9LKbW3XQaGhotGtbo6zt8yRLB6QRKUTI37mr2FeXlNrvdaDCoA2elco6Qyhlx1UL1DeY4dssG/UdvuWbegHKynFddRziu8iuMDVWZUMA5h2GGYQRBIIQ060THyoj795qtaenZDbjXffuTvvj4pYFD+8iO89e0baFAAARRys7Oa6jRkRCQm1eIMUlMiKGFwVuhgAckSc7OzpMxbqhbghBSUWEb0K+b2dyaxRQIIe1sOfmCIDTU84QQYrPZ+/ft6uVlluVW23QaGhotGhYxjN85s81ZbRST2axqDqqEOvf/KsdS9Q3meP0vX/McKr/2Jv7HrwSjDscmAMWCScFYVuyzquh2DglPXb1Zi3fKyMFx1HmxAUlJzZx10/yvP3114OBesksNaGmdNKxvJcH4wMEkCGD7hOhWKuDRFmswPwCFgsKSrTsO9O/brdUropBCAz5PlKbbP7B/D0urFo41NDRaLucfYmVJwrKM1b8eL6L+xVRkO/0SRVBSLBuMmOWF3gMww7g3JEqorPqQ9fzbzGW4uqNeUX2peflp6TnX3/zo1s17GIMetA0Ux01Yr5eaPfH0HpTZwoHDx08kp8OWEJRzsdB+U89XjZ7GMKioqGTHzgNWq61FRDI1FEpb1LO/nQnDoOLisu07DlRUWBmmDTWdhkYLgmUZlmPUfB0cz9CKWVVAeHoJo6zWakQRN3VVPlVTtqkfa2rg6MjK66AkAlnEMbGAYTw1KWfT2LUCl6nAwMCFCxdGRUXVayqPEDp+/PiiRYukM8MpktuMDo8Q4u1l6ZgYW99biwCQdPxUSUmZe0MIIZblfQeOQQjiY6Naeo86G4QQg0HfrUsHRao4d6OdVq4r+SaZgqLio0kpjIckhxBqOzo8QojZbOrYIZbj2Hp1DwRRQVHxiZNpZyysbDpNh6eh0RwhhPy76ufCvNxJs66rKCn586fvevQd2L3/QIwxQig/J+fPld927tG716AhG/78Izs99bIrr/INCGxNN3I9xDtqG6pVpPMQ9SCDcGAgKC9DggvYHTggACkufZ5bnbH+mXtruUOyyWSaNGlSfHx8fTfcu3fvU089pb73bA1Vh/d5a/fDIwTo9XxkZCiqr3hHSEZGTnFxqVu8q+xOGO8/kAQhjI+tn6jdgmBZNjIylGUgll1niXWi7QERBxGnZLGkQIbBNKnlGbebkqKoUofX6v3wCCE8z4aHB+t1fL0eNRAhmTZjpXgHIcC4sulUHZ7mh6eh0axACEmSuOLt13IzMydefe3xQwdefezhBS++1nvIIMEFWA6mJB195dEH733qud5Dhn370XtH9+8dPHZCQHBQa3r+1Um8q4cJFUIS1Q7a7SgrAxYVkYDAakY096BSc1N1eQtVkKr5mS9gQ8+tOnXq1Ldv3xUrVqhjTxvR4RFCw25q9pPzbXVaNcUwTEx0eEZWrsvpghDKkrx331EIQWy7SIJb6oThnEBZcpUmfVye/gek0e213k2Ys7QL6PoIb2kHaMojwHhMHjDGQYF+BoMhNT2L1o1pSzo8rFA/7Z3HzJMQEhQYgBiUnZ2PEJ30ajo8DY3mhigIRQV5FaVlAcEhsihlZaSxLGu2eDnsToRYu9Wel5XBsKyPn39RXl5ZSYlfQBAgRBAkJQ9GKxk16uQ14pa6qv2tZTkBJDyKGAzstg2ouAAySF3Pc/2aW9Vc3kKFvItEp9O9+eabt912W5v1w0MIMSxTHWXJObbCGEeEB/fp2ZllGYwxRBBjvG9/0qnUrFbpUgYRK1acKjv1vWhNx85s4qrxErJlR7Yta7Mtd22tWXsIITqdrk+vThHhwbIikbRZP7wLUQHquL69O4eHBauBYpofnoZGM0JRq//6zRd3XjU5LfnEySOH5k4evXzJy7Isf/Dq828//7/S4sLHbp3z7otPY1le/tort1057tjBfaknjz9w3VV7t21mubrewm5f+2Yrrpxfe1dN9jqPHo5gEBJOwiO5n78Vr7oOcrw779159XaeR2y5VlpJkn777bdqvnRuWJadNGkSy9be7LIsm0ympUuXEkI++OADdWEb0eGpv3tBYbHN7qxmqFUjcsJCA89xFxFCIiNDZVnevfeImuFMFKU9e49ACNpFheMW253OhlImUCYAiCgYsvrq000CISiAsg1g4eypKgmv0/Xt1QVClJGRoxR/bkM6vIuBYKLX6fr37QIAycrOUx/xmg5PQ6OZQABgOQ4hJAouH39/vckk5uawLOfl46Pj9QAinV4vCC6GYb18fSGEkiB6+/qZLV4MYuqiukMMw/PAZnW5nC4AiMFo0htYmsytmd349fC9c6vWavWcq1xCCPHzx7HtuR++EPUGyHJQFNy+d3XxwGvpqjuHwzFt2rSziacQwrKyMovFcrbNJUnS6XRLliwBALglvDbih4cYdORoyqm0LPZMXR0hhOPYaVeMObdHPMFyVGQoAWTX7sOSJCMEZVnes+8oBLBddLiqo2pF0NtEkMDxU7lOV3XLNsagQwzrazzPLgjGOh3fp2cngnFmdh6DUNvxw7tIMMY8z/ft3QUAkJmVqyiZNT88DY1mgCJlXXXTDVFx8bdMHD1jzq13Lly0YM61u7dsWrzi23YJCYSAlz5asejOeRv+/H3Jp9+4XM45E0aOv+rqx159Q5ZkSTzXnUs9blmUnZ6xcsVHe7ZtHj5+cn52ZtKhA5dfNeuyqVeZLWZJOqM0V8swztbVREsIMBhI997EaAJ+lY535zfp1ra8LaPq8DyttKoOb+vGXYyOv6Sn1qwhhMREhffu2VkVBKkOT5B27T2cmpFd39CNFgGVdWl+8VpedXQfIYTo9bq+vbtERoSqEolbh1deoVlpzwXGWK/X9evTNSI8RJWD3To8rek0NC4ZEEqieGjvvt2bN4qCaLOW79ywIT35JMMwp44fKy8rLSrI37Hhv9TjSQzLpBw/tmvTBofd5rDZUpIOn8dsCCHLoR9XfDJrxIB3X3xm27o1uRlpKUnHtqz5+4k75tw4btjOzRt53WndBMMyRtPpl8HE1NfFvIm0dwihOk3laYooBIxG6HAw2zfiiVcShOqbZbZFK/AMBsPKlSvPYZw1GAx12Q/HcW1Nh4dl3KljbHR0WK3GWYahgdvn3wnG7aLDCCC79x6WJUx1eBK12EIAo6MqJZjWkyFFz/XtHU+Ns9VaBiLJniZYi+qyH6zp8C5Kh8dpOjwNjeYDgtBaXrbojluPHzqAsfzle0u/+fA9weUkhDxyy3Wvf/F9aXHRU3fPcznpkodvvIYQ7HI6f/lyRWbaqbe//UVvNJ7NxsqyaNXXX7348D12m01dwrAsy3Hq+6P79z469/olK77tOaC/KMi8Du3atHnF0tfdm+v0+qeWfqDXVxYAa47G2fOth2BFKbNmNTCZmb9+lWfNwZ27A7F+HmMtV7ZTBbgrr7zygjf3vHaTyfT2229DCD/44IO2EEtLYxKDA6rlSnRT9+slgMTGRBAC9u4/IksyNWK6hJ27D0EIIiNCcKuJpSWA45joqFBgtHh6uFIYtuBkQWFFncQ7tw6vX58uaC9Kz8hpa7G0F4PadP37dgUAZOfQ8tOaHx5siMjDBtmJRhu9JQ3GmTfPW/X1Fwd3bb/y2ptMFsuPK5YHh0eMnzYzIiY2KDT06lvu+PmLT/yDgi6/ata+HVs3//vX5TNnDRg+imHZs2mjeJ7Zt2PnywsecMt2NclJT3tpwX3v/fi7j58fw8Ds9LR/fvnRc4UnXnsbGowtQ7yrJQZCx8PNu9GBveJDi5iP32E/eVd8/g3A8UAJMav7sUCLxel0zps3z+msXbum1+uXLVum1581DLZae7Isu3jxYkLIhx9+qH7locPrLTtcoJX53h0+WVBYXNOwxTCoT68uLMvU5cZQTZOxMeGEkH37j2KZJrGUJGnXnsMQQsUK2YzcIy4YCKHDIWzdcUDGLIDVQyt8jdY6R4C5dXi63j06ERln5uSjtpQPr4F0eF137gHZ2fnV8+FZzK3O7/Nc0NjhhjJMQ0gkqfXMxzSazKxhNM66dd7Jo0dSko7ecPcDHM//9u2XPQcMvnvRE5IAWA4YjHf+/fP3XXr1u/d/i5Y+/dzOjeuuvf2e3oP62G20gGrNfdLwCxmv/uHr4sL8cx/9yL49W9f9O+nqq6lEqNcbTWb3VwaTqcFujbrBXrDU5RkMcXqp04G+/5wkdCQ33Iqdduatl/Dgkfiq2TQN6JmBFNWz0Xr8bdHinSiKX3311dnGQoTQu+++ezbxLiMj4/bbb6+WBIRhGIfDYTAY7Ha7usStwxswoAc+ixW45UbOpqRmseyZoRWYZqPt3bPzObY9fiI1IzP3jPm+UklKr+dtNodaksvlEnbsOgQhDcJtuaHZp4FAFHFGZmGtoRWJsYzf2UMrEEKlZRU7dx+qpiGBiDYVyzCyTLWeZ+jwzMbWF4B8AUAIS8vK9+w9Wn05zYFH9Z5q11KbbtuOAwP6dzebmm6+fmlBCP27btvmrXtrTcdTLwjBYSGB182abDDoW8d8TKMpsVmFjFPJCCFer8vJSC/MzzN7eWGJpqdgGCY/J7sgN8fs5SUJID3lJJaJwWRyncPjCUK71frPLz/V/KaaI5Ykiqu//2bsFdMRQqMmXrEtu7Ta+k05T77wtMa1lJ3gOLBpHdqxGS98HhpN+Ibb0NaN3GvPCnEJoGdfSOOGzx5y6yHztXQJ74IpLi7+9NNP67JmWnrOsk9+GDi8L2hF4t0FQwjJzimo1ZgD4emkRAghp9N1MiU9LDQAtHhoVmeeBeGBwCVUF+9oLRBOEcbOHsFts9mTU2q1MkC1FrT6gWFQQUFRTk6+V/t29XWibZVACK1We0VF7QYaT8UzVX8Wl2Zk5nbuGCfTJDatHPW5/cdfm15f+llD7XPvgWMvPfuAl4+XLFxI0niNNguEcM598x02q39gMM/rXvv8u7jETqovrCThqLj4Vz/9Oia+vSzjmbfcPmbKtJDwyHMIXgjC0qKiovzc6ssR03fIcEDL4VSGPGJCYuLbU2OIgdm1advnb7/hXpnX6Z98671m6nunntNZS4oxDFXdffo+iWxHRk8Aogi9ffELbzD3zeUevkNa8j7u1Q+6XB4XptSFV2oPUDeL1jJycBw3e/bscxhnuSpPTDcXdu1Sq5vREkICA/yqjZEqDHOe1JEIwfMVYKWo+2j5fY0g1oJYE8uWhgSc7XJot+LMwYjXAaxcNsMgjoUsAxX1MCQ0MUpd2qJF56FsDOo+/2yDTcdx9bAInZf3ln2XlV3w/ltPhEaEtj5vY41GQo3G6z98KERAcOKAkNCJM6dLIpBEOmhiTPwDgy6fMU1d0mvgAMQAl/M8lWwwrsVuu3/ntufe/5hh2Oz0U0g1uxHgHxysOFbB7LTUv3763nP9x5e81Ux979x2h2rPrEpRj+PBhjVw20a86CXoFwCcDiBj0q69/NJS9MQD7CN3yQ8+jkeOBxwHRdqoRJKo1Y1AyLKE5+leRNFtnG25z0S9Xv/55583wYFan4JTjZwFMK7Wb2WplrtLSQxyPkgTR6M3OgRLvFeMOerOE6u/F13i2S4O8d5Wu8zu/E0tO8swqLCo1HYylaHB7AAa9cb4SMBztG4bbP2NdvHU9ZGkNV2Dsur3dWXlFR+8/VSHTvGtzNtYo1ERXJUaECLLzkrPpkowxu4lgnB+RQkmxMfP39vXryA3x3P5zo3rX5x//+hJU/744eui/Eq3vEGjL5t9610AtxzfO09hopbiEwiBijLwyXukS3cw4QooiVSZh2hFMtCtN37pbbTwPvaeOfjyqSQ2ARQVwrIS4LDTeAvEYKORhEbKo8fTGFuAW5/Ucm5iYmKWLl1aF+cShNCGDRu+/vpr0HqpmUhCrfLkuZwuUTpJXGxkcJD/eTsMRLC83Jackt5y5wzVgAgKVvu2D5KO/V4KULWoCmpHUJ9HEDgI+QwQ6kWnttJp64MyhQob1b/PQzdSf7saDQMRysjMyc8vaq33I6ShPDVSSOpZIMpKNRAPeAZAEOUfoOvVXV1AALDJZ9ckQZCdXZCTW6BolNs0PXr06N+/f93vOwjhli1bDh48WG35fxt3Tbv6/k8+eLbfgO5YEFvLfazRciDEZDYPGDnm16+r627W/7GKYZgFL73+2qJH8rIyIUTjps3QG3m7XW4Zvncqbr1aLZ5zLIvX/gX27YSvLwN+/tQyW5BPUk7AIwfAiSRQmA95A+g3GJ04BlZ+DcwWPON6PHYS8POjOryyEnjiBLfyK9HHB0fHQlluzkXcLiaWdsCAAQ899JB7+QsvvAAAWLhwoWf64nPD83zrFu+qgRh06PBJAEDnzvFYTbqrVLYoKCzmOLZfn67hYcHnNy+yKC+nMOVURquJ/UQsW5Kanb5tD8FikL+fUce7gwsRBIUlZQCAAF8f1fkOQVhcWm53OBmEgkKDVEHP4XQVFJcW7TwUGxHCmQygZnAiy1RU2PLyClvTnegGQmiXxduOrHTKYpWqDQJBAm/sBlPiQZcAIFV1FY4BX9MoCji7I5SUViJAz7AfJk7RM1ztfQ9Bh92VnZNfF2+B1s3kyZOfeeaZem2yYMGCmuIdDUg8lnzVtQ8te/vJcRNGYMWNu+FOU0PjPCglHNkrrr1hza8/2a3Wat+u+fUnCOGDz7y0+PH5eqNp4MgxGAOa927z1pbhe1eT00Iew4DiQvDJe2DQcBAdB3//iezfDdJS6bMtJIx07wViE3BoOPH1AzYbXP0z/OtXuGU9KszDI8aRbr3oa8zlMOUEMBgrH7Sta0Rxx9K6XC5P8e7ff/9Vxbt67Qq0JSCEeQU0eVsXmHBGdO2pTINB17tnZ4TO4zBBu6fcpBOmpoFgmi/Cy2wcNaCnn4/FfYEsy6xZvwMAMHpEP7U8Dssy/23anZqaqee5cUP6qK5RJWXWH/78j2Aiy5jBmNpnz4SRW7CDxHmBAIgEf517EEtVUccQAocAfv4XxBSA4GjgrNKmG1jw13r6ZowIHEoYEyGI1b2VcLkOMrWGEkOlNGOTXk9z5QKeV56b9OvX7+TJk8XFxerHjMycq29Y8PbrC6+7ZhKhhada202t0ZwRBTxw5Jg59z78zgv/q/ntv6tWSpJ49xPP+AcHRcTESKJsMDItxvfOTfXKs8pn+efvwIHdYNR48Pky4OWF2nciU68BEdHEYqFhE5IEMaYaAqOJ3HwXufJquGsr2LiW+exDxuUkgcHAOwB37yZPnwUEF+T4VibemRQqKipMJlO15ZfupJopVHHraStkGV711GYZRl3IMhzH8jzHcRzLMIhlKjVPkLrutbVhlYb9cyzHcRhXiiMsy6rGWY7j1PvIvUR1e1fFu8pWbcNAAIxGvVWiiWCUzxBAxTPaqKcv5BbvOGBUyswYDQAqkgchRlbXqp5QFwTDc9V9DCGkkYRn5nW6GKZOnRoVFXXHHXeUl5erS8rKK+6499mCguIH7rmBUdL3NNSxNDTODZ1RyHje/EclSfrs7dcd9uqx8wd2bp/38MJ+Qwc47JXdssX43tWEynYAQFnCqSnk7VfgZZPRg4+TsEhiNAKGqZTq1GQoqrueksAMCi7i5U3GTiSjxgOHExTkgpxs+kVYBNq6CWCZjLgMcrqWK+FJkvTbb7955sJxOBzqlDQ1NfW7775zL8/MzAQAeC5hWXbKlCks20aHXlUzZ7M73eIIw6Cc3EI6cU/NkhVdFMMyOTkFBYUlOh1/Ki1LrS1bFXXrazQ2nd77kgNp3jspIyu3pKTMfdUIQYdSsC45JV11WGQYZLM71PlYalqWOvpa7bQgD2jLyARsyAQuZ5V4B4DqYX2I9jfgLivOI1DkoG/+OVW5kNpp9KAXuYhnZ4sHY3xw7xFBEM94UEOAIMrOzmuoowiCMHv2bAjhbbfdVlFRoS602uwPPvpqTl7hU4/fZTLq1MeChkYTQAhhWf6+p54dPOayHz5ZdvzwwZLCAsQwQSFhA0eNnTzruqjYeLds57DLw8dNXHuCjvIqEECDwdhMfe+qQVxOsHs75njywxeAYdEDC2GHTgATqJh8oOLc7Z7eqVG3lRdGNXk0VQM06OXIaBDdjkbu2azQbAEE0wGqpYp2FIfDMW3atFrHzm3btl2tJLP2xHOJ2WzOyckxm0/L+20K1a/uVFoWW6UAYFnmaFKK+t4trBw9lpJfUMLzrMVsUgMvFKlaHjakt9lsajsTeupA5nDt3HVQyd9ciTsj9MbNezxXVlQdeNuOA+pHGoRca8BsGxKNZfDiduARIaEDgH5YdYq+PCCAIAD453e5b2k9ZwR3y0APW0GKnQtAmUKI1978aH5Bcc1sqDbrmTGKF4H6FJ01a5bT6bz33nutHj5Pr77xaUFB8ZtLHvPysshtzGVF4xKCKbDvkKF9hgzNy8ouKSyADAoKCQ8M9hMlmt7Bc2VqWKnKh+fevCnP9gLFO5KeKn+zAkbHAgjxqh/QgqdRolpUgIp06j2PICJVZjaXiwa0e6Z8k2VZcDo5jqNJzggBPE8G0fSANHOK0ILzG0EITSaT55Po/fffX7RoUUFBwZVXXumZM2X69OkAgB9/PF2TDkJoNJ691EAbgJpbWUYV7yRZjo4KCwsNlCR5+LC+bu3dps27U9Oz9Trd5MtHuLV36rZtR7ZTgZDKbep8iBDCceyVk0dv3rqXEDJiWB9JiQ9gWbRpy97UtCy9XjdpAm0xAEBphXXlXxvbelFPPQtspx81L0RFv5Ce5hw61RjbjciVEgNk+IK1K3oU8fe0u1PA9CFGMOBMrB7pCGi7vl+EkPz8osKi6lGBjcScOXM4jrvjjjtOP1cJ+fSLX/ILit9f+mRkVJiW9FijCSGiSNMRBIWFhUSEKSm9gNPtreu5ngK4dFyIJRjv2S4+ejeMjEJDRuC3X4W9BzDX3KhmlVXT4+3YvuPRRxYePHiQjj2KN8ayDz967933qT8QLd2DOI5LSkpa8PAjOdk5PM+robKQ4yDPtz6Fgre3t5qnV6/Xmz3QKXguMZlMLdcq3Vi+ZRSO1et0yovV69QFPM/q9TxftVyn19VMhtwG0SvtgBAy6PV6vU6v1xn0enfL6PW8ulCvq5ETpM3jxbCIJgvUI6MFGcyVL6MFIJYDrA/r7c16Vb0sl/pkLz0N6GNXF6677rrXX3+9mr/yH39tnHndQ0nHUhitP2s0LYQQWZJFgb6arVqh3to7vHu7/Ni9zIxr0aTp8oI7CZHZhc9Cg+J9XBVysebfNZ8s/zguLrZHzx4MQ8vAJx1LElwuhBALWEmSGIYpLyvfsWOHw+FgWVamJXuU/whRKyKBlkw1BeyGDRvUIhbVfO8yMjI037tzzHggADabvaS0AmM5IzXTw/cuP79A8b1LbdO+dypEvXMUMMYppzLsDicg5KTme3c+qinftlZUOAEQc07RpsGVvrMQscBWXiiz60s2iURZiIFO5CaQbhx9eLb1NlTnYB06dNDr9WqwXVZWVn5VfteGZe7cuSzL3n333Tbbaa/2bTsOTLvmvveXPjl0eH9MqyI1xpE1NFok9ZMkSFmpvPgZ0KETum6u/PoLeM2fzNJPUKdunus4nc709PQuXbuknqIuLFu3bv1l5S8nTpxITEyUJOmjDz9KOpY099a5HM8ziFnx6WchwcFz5s4RXMLHyz92ulzz5s31Dzh/rtpmC4QwODjY8wH08ccfq7ZpzffuvHAcazDoWVXbBGF5hfXAoST1K833riYQQr2Op42g+LkSQrZs26d+pfnenRsIQBDL2uhUqrIVviwqoHfpkS3OI1uqrZwMwJvpH7o/mk3Gp8iNBqBzC9ZtGY7jli1bFh8fr4p3zz333Ntvv90ge6450b3pppsAAA8++GBJSYl74ZFjKbNuWPDB209OnDwau7SUeBoaFybeJR0hmRnM7JulJx8mf//GvPgWGje52jqFhYX5+fkjRo44dvRYfn7+Ky++QggpLytnGGbVL6u+/ea70NCQ5555/robr3U4HXl5eWvWrAkJC0k+mZycnGy32b/4/IsHH34QtFh0Ot2zzz7rmb2pa9euo0ePLisr03zvzg3GODoqzN/fx113wcvL7O1lIYRovnc1IYTodFxiYjuTQdVZEghRVFTIho27AQCa7905IIDwED0WGi7aHWr4FwSgo8FwxbEjeOj0mr53vTTfu/NNaIOVOpvUxu3l1VB7TklJ2bx5c7UCmB06dJg6deonn3ziuTwrJ//amx975bkH5t58FZQ1+U6jTlSWWqXOc3UaOKgpUsk52lKmEPUT72CHTswdD+CNa4HNyr77GRo0ouY62dk5JSWl3t7eRYVFhw4eKiou/t/TT/380y8ul2vH9p09evW46qppD97/cHZWjq+P7/0P3vf2m+/s27f/4IGDUVFRTofz6NGjnllFWhxOp/PGG2/0lDOWL1+u1+vLyso4jvPUzKlz07asq6sGQuj4iVR35Kwoy+3jonU6XhJFlqtM3oaUwAuGOnQiNYub+05rKbdcQ0bOOoU9e4+qta/U0Ip2MWFqlLqS964yrTGskfeOqwqwbZtAAF0E35l2SlaSyKi8Fd1OD4CD4SCvA1KlVhiyPC3QBpAB6ZGi5yMAcKhNt15NPB93Fxkb6Lmrzz77zNN3RQVCWKvbX1lZxf3zX/bx9po5c4IWaaFxXhiWcdodRfl5hJDgsHDEsucKhIdQEoSMlGSDyeQbEMjr+BaRkaee4p23DzN7Dpo0HRqN4CwuYulp6RlpGat+XlVUWJR6Ko1BjNFo5DjW5XKKksixrF5vUKKLZYZBeoOe1/FYlgWXq7ysrEvXLh0SO7hLZGpoaGhotHokSYKQztkCAwMjI6NkWXIoeKYgOC8Op+tY0qkmzhyr0QKBCMEta/5565knDu/d3XPAoDe/WunrH3AO4w+DUHZ21o3jh5cWFQ4cNfa+p57v2KNn85fwLsSLH55T/b53z56Bgwfce9+9i554srCwQK/Xf/ftdwf2H0hon9C+fcIvP6+C330fEhoSGBhYUFD4/bffJx1Luunmm6wVVkEUhg4fFh8f16JDIPV6/YoVK6oZZ9XQClEUPZ9WqpLSc4lqnG2zoi3GuH1CTFhYkKdx9vDhk4QQSZQqjbOESLIsYyzLWBRpA3oaZ9tU0xFCDHq+V+cET+OsrMyc1M6mGmepk11VE6ktRt80+wdTo0IA0UH0bnS7asZZJwBEFongchtnaU0UQhN1OrDTbZyVcZsOfmpwHA5H6qlTOoPBz8dn5syZI0YMLywsPHTo8CGF9PT0ugt57ryPGhpng2FRdnrakicWHDuwb+yUaSMmTtGdrw4sIcTL1++mex/avObvjX+vhggt+ew7vcFAnw3NmAZ+TmGMLV5ek6dM6de/35gxYyIiw6+74dpffvolMTExsVPHq66afuTwkRPHT9z/4P1BgYGjx47OSM/s1af3FVde0adPn6VvvvX2m0tvu+O2kaNGghaLy+V68MEHPUMrnE6nOi34+eefLZbqKRV8fHzcQokaWqHX68+2c0/Bl26FGKbG46zl1uZCCKWcykzPzGFV4xctcQT37DsKACwqLnWHVhw6fDIvv5jnWVov9czQiqiosFq8KGAt1HoCLavdIIROl3jsWArj0St27zksKS3w40//qBdDawbKmManS/Lvq9efDq2QMS3EpbZGzfaordFqtlvLarFqxtknMtNtttM5eF2E0Ibb+KNt42l3WJU9ANx8+F53IIXZaLyKrNFBM4a1PNyrNZfSvK2n6RoQjLEoiqUlJVu3rFu7+gcZMyGBFiy5HLIhIrbzwEGDRo0a7XDY09PTd+3adezYsfLy8lr9djIzM4uKaGVqDY26wCCQfOzIyaOHR1w++YVlK8wWsyjSefHpFRiGYYEsnXYVoIKNt/ctDz48edb1t0wcfXDn9vyszJiE9s18ltzA4h1C6L777+U4moXo3vvvoUV9eH7KFVP0er0sy3q9/pXFrzidTm9vb1mWl7y2WJZlhmH0er2fn++bS990OB1ms7lFO8jrdLr33nuv2mPILZZ59iGEkCiKqampTqfTXR70+PHjZ0uMwjBMVlaW+2NJaXnSwSTBw3lILfzQISGGYZiWWG8byzg+LiosNNA9FkII28fHKP7a5spsKRB2SoxzuQQlT+IZjncsg0o9ynO5YRhUXm612R1U44eJzWovK6sscOQJQtBkMqqOa6C5owS9YixjbBUlmjby9BeAFu0FQMC0DKDHEkgIKK/qlqKMBSzzslRWXsHLEo2iPROGYSqsNrvdgRANWKmosJWVVXh2KkLL/yKz2dQSmqs27R1Cr3VoL9qd7shZqnoH+JOA2D0mP77qSjEgJiN3V3zkka9ToZKUnQCgM3COCifGuGa7qV1UbTqGoX2posJWXlahTk7cMAxjNjddZfFmCCGkpKRk3fr1v//2+7GD24clWEVRTowJcdgcn67J++anvwICgiPCwwcMHDh8xHA1Ck0QhFrFu4ULF3766aeX4iI0WiQEALvVKktSaGSUwWRWrRxuEELJSUf3bNnYo//guI6d3Po5xYiEvbx9A0NCstJT7TZr8888UCfxLiUl5eDBg3XcozpAEkLcI6X7DcZYzWAsyzTps3sUV4cN91cIofDw8BZqaGNZdtq0aXVcuaSk5Iorrjh8+LB7yfPPP3+2hz6E0PPp9vvq//7+Z3O1VSEA9999/VOL7tJxXB2jgc4PwQA2hbmcEBIU6EdlEc+rUkUXz3EU0dqWQJJX/73Z4aAZ3dTFJ5PTaR28GjAIFZeWH0tKIZiWxcvKybfZlSqiNUiIj+7aOUFNEXcxl6GIX43YYljG3mFBgYmxpf9utUpyXZ4yEAAXxicFgVYDrDxHEpYQ9d/WPRDRzJTV1mcQOnkqMycnHyGIZWy1OdMzcs5sXoIYpkvHuPYJ7S52LkGwolBDTZZGjmDCGfTX/Xk614mbaQznUgXkKhgGYZt9Q49dDqfL3dk2btt9tnOFEKal52Rm5iBFvCstt2Vn58tnNhGEsHvX9nGxUY0i4TXVDXthYIyLioo2btz4yy+/HNi/NzM91dfg6jgiqneiV3SklyRZwgOZjfuK/tt/ZP+OwwcP7P79t1V9+/W/+uqru3fvXqtlQ4tO06gXsNIdQ5nnnXkDQoTKS0qevHPuvu1beg4Y9Nrn3weFhXn62GH1YXV6Py1cvDMYDN7e3p7OZI2a8RwhpNPp/Pz8Wqh4Vy9sNluxwgVsK8s0IqXm8sVvfgogeP5/9ympzhpCwiMSIDKAOgCZxh6AqaBQTVSoeQUyva8kSRYE0eU6s6h5bRCiFgqkUw5MCx+TaqoU94rHklIQRJ07xV20hCfSoyKdUhWm4VuMyNgY6DvmmbtihvWWHK46iXc0zNbFHj8lKeWeAQG8UR/SrT0GkNTmh1fZaPR/1AkSYyydafSHEMiyuP/gCYSY+Lioi5XwsIvuEembMlGwrK9R6gACjgD+zHOAiBRJLpEXRZnqjKtO+KxhdhDCqqZTupzSdDXah+w9kEQATLj4pqsJkWiZJKRvSom57uTm5n777bdfffnVyeOHOoSB+dMC2sf5d4/3jg5gkMkEIDPaR9+9c+j4MVJObtnho3m/b9n9yceHDh85MnPGjGnTpvn6+qoJ9tw7bImWCo1LBVQyoRTm5RBCjGYzg2A17R0m1GeAmjgEoWbXYhAyWiwOm60gJwehyjoOoOWKdxzHdVBokvNpczS4FCtJ8kuLlwMCGlKHh12A2AFroUJecxowFL8m+uac9xiphucleLQ/NV8eOXYSE9wAOjzZTl+sF6AmvYZvMSzKfu3C+82bQehs8vxAiKxWW+m/mySJutypqNLuWbbwaKzTjVZpH6/aJ8RY3nfgGMbyxerwIABSBUAu2mJNRs3fV3Gvq7YUqat5fHHejlFbfzuj6QCAWJb37j8KAWkEHR4ExAWk5njDHj9x4qsvv/p0xacGMWvBFb4DE019OljM3gYAReC0A1lUvA5IgJ4L6GAAnSNG9Q0c0KPw+79O/bB5TUZGZl5e3g033BAREXGpr0OjRYIQ2r154x/ff71+9W/R8e2HT5hU7e4gGPv4+T/15vvb/1vTd+iIoLBwT9UdTTjF8+Omzji4a8crCx/a+t+/M266NS4x8Sz6gktPSw8BU57HrULPxzBMWFiYTqer74aCIGRkZFQbIRpah6cMGC4b4PwBY6lRz6nBoAb6asbZ2tcDLKETqcpqxQAYTYZqAdc0eEC56xBCgigZDHqqSMHYaNCbzZWVKzHGTqfL3XQQ0hG/gXR4EGAbEGyACwTI2BgthiUZMQDWsdomhHqB51kWgcqICovF7HnbEEAcjtNNgRAyGg0GvQ5BhLFsMhqURiOSJFMb5em9Um+KhtHh0RiQEoCdtMWapdpJBSGk1+vOMStT4t8NaqlfQojadDQRlCw7nS7P1QjGjabDg3RKRm9YP8B4Nd4NWy+OHj26fPny77773ixn3TUp8NrhPj4WlpqS7Val7AoAgks5VWXSZucAb/Q2GEcNCo8MMQT4Jn/y1/GPPvqI47jrr78+JCSkmg5PQ+O8IAQP7tn57fL3AQCjJ12Z0LFLzdsOY9ytT6++Q3q5nEAQqg+dEILErj2Cw8IP7tqReSp5wPDRCZ06NttggZYu3im2OlkAiAewZV+Lv7//d99916NHj/puePTo0UGDBqm5VxpThwcBEYAzFfAhVMijD+MGHoAhhAWFxTa7U02Mcm5kWc4rKFauGjIMHJIYZzLSqpfqt1TxbjQEBPgSTBgG5eQVciytyoUxDgsLGjKwlzpOFxWXbNm2Tw3UULU5ikjXUDo8BLAVOFKALhywPup5gYYDMkx6eo67zth5VobA6RT2HzxGyzsDwvN8t64JjGKnUGEZduKEoRzLqpfLMExggO/xE6kIQVnGPbsndmgfSyuKZudt2bbXPaFSW6zBdHgAAbGQisW6CAD5ZijhYYy9vMyDBvQwViajqQUI4cFDx494m9XQii6dEzp3jCcEZOfkbdtxoFoNhkbW4QnAlQ7YQMAHKUsuTXuq15Wdnf3ll19+/Mmn4ebyBTNDJvf18jEzp8XOyh5FJ+vqNkAUgOgCTisyWDpEGu6dnQgA/PD3tA+XfeTn53fVVVd5e3tfksvRaLnIMp4x59bBo8Yuff6ptb/98scPX8++7Q58posTRKgwvzAjJTk6vr2Xj4/nA02ZzeJvP3rv0O6dNz+wYObNtwaGhIln2nabFZdGJFJjLBpoZxAAEYhWwJgBY2zZ9UMV6ruh5yZms5ll2dLS0sbS4QEMnKeAXA70MQ3uWIYYdORoirtqxbnBGB8+ctIlUMkMIcSyrEGvO53gTZZjo8NDw4KwJCEGsYqeT/lWXZn2PWVZZSckhPA8DYx0uQRlzYbT4QEJOI4DPoyKLA0qE0Mdv2nL3mtvfqRh9gZhSfZmo8GAMe0nSFWNIqVojxImRRtNaWrPFiOECIKkiIANpcNDQCwGsg0Y4gAy1+Z6eelhlNY4h3intp276RgWAXI6fJ4QQGuxSDSBY6Pr8IhMp2TYBvTRjeQJWkfWr1v/5x+/c1LJlf19r+xrsRiQItudeT7V53WQZqewFgNBH+TjP+uyiOPp1i1H0775+su4uLjhw4dr2juNekEIMZpMnXt3Gz9t5tpff045noRlqgP2MOBA0eV6/clH1/z682VXTn/ohcUmk9nzrhQEIfVEEq/Xj582M6Z9nOhq1mnImiLAKj8/f9GiRUeOHAEA7N+//84773zhhRc8M8NdNJA6swvZQGzZ2Y8urKN4bhUeHr5ixYrQ0FBPHd7jT73pFEVUB5mpzhJeGqjYR+1ozSFAr2q27/lSQqJUH6hKA74np1c7vYRYzKaePTqajAaMVaMPPHLs5MHDJy7aBqQMsY7jwHaYinrNocVqA0KW6r8ho/ytfE8AQ6oeEWe6LAKMSYC/T88eHdX0NG4d3vETpy525gYRkIpBxR4gFTXb5qrW36p3v+prV+9sfr5evXp0ZN1Np+jwTianNYK8ohg6naeA9cClumExxmlpab/+9uvRo0fGdDZP7ma2cBCIst0qlpSKkkCDd4Bc9cLKS+ltGOPiCim3WBLsTlhRFB+Erh0T1D6c37Fty99//52Zmdn016LR0iGEyBJNcEHvO0mqltoIQii4XCcOHyotLvpz5fcnDx9iWHgW5RSUpeaevbIptHd2u/2XX34ZOXJkp06dnn32WZ7nb775Zp6vm89QHaFuUxg4M+i8XxemiK3NV2XaeEiSNGnSpM8++2z27NkFBQWNpcODCArZQC4llj6A8WkoFQvBpFuXhLjYyPMOcjRsU6KVwx1OB8aAZdGQgT1NptP2Mkx9nvS4Ph6vmJDQkECdjt+x86Dd4WQaUodHx1ToTAFSCfHqA6CxQVqMuIThQ3v/9uPbdVsdOp2uPfuOyDJ2CQLP8T17dAKyTahIpoGWAFKNqfWAzVlZeJFq7xypFpCNgdkGAmo9PiGgXXQEIWDvvqOi2KA6PICgbAXl24ipB9CHK5lTmvVjtJ7QaUdMdDhEcPeeI5IkI9SoOjylPYVMIJUScw/qWUF/8abD6XSuXr360IG9JkbsF+PVM4yzlgpJ+XhfFskrsUf4MQMTDDGBHEd16tTYTydsCJTY5MNZeOcpsajEFh/KD+1kjArS9Y/TBfsw/iaybeO/vXr1joiIaOahixrNE6yIdWp2Ns/+Q70vfLyuu/O+p++9TRQFl8NRXZ98emxqAb3uYsW7ffv26XQ6u92+e/fu4ODgUaNGuQsznDp1atOmTRzHhYaGGo1Gp9P5559/Hjhw4LLLLhOEWjJ6NAAQUEuEWKj4BPFtU8ITBGHMmDFffvnlDTfckJub21ixtNSIVghL1hJLb6CLUeSVi+ruEEKbzW610Ty6ddyE0DJcMDDAm2WZqMhQk9l4WklCpX06+6/XOWAZh4UG9e/bVZHwXHTQbTA/PGXIcmXCklJiGQD44CYeYt0wCA0e0NNisYwb07v0wFPW7P8gpBdFAMnf9pWnotNISHsq7HEpYBoBXWvuiihPw7h2ERCCPXuPKmVDGzCWFgHZCsv/I6Q30Cc0hq/npYUQEhsTAQjYs6+q6RrRD4/+8kAsgCVriNcAoItUno1N1J5Z2dl//LG6Ij+tbztDhwCGFfG2ZNfvWeFFhq4b924qyU2Z1d94/2W+MUFK2mhFvJMw2J4k/psVkyeHb9i5yV6cecto7wcn+fubUUIw63Ryh5IP7ty1a+zYMd7e3pqJVqO+GIwmhmHysrNkSdIbWJerMtERYhi9ESR07qIzGLx9/cJj2rmfYRBCnQFZyx1F+Xk8rzMYjK1fvFu6dOm2bdu6d+/u4+OzcePGESNGvPbaaxzHHTp0aN68eRaLJTY2Ni0tLS8vT5KkPXv2lJaW7tmzJzIysnv37hyn3M8NC0TUSuvKA4YOij97c/TdaVTUgWHs2LGfffbZtdde22g6POrbD+RyWLoGmPsQc7eLVLEgBhUWla77b2cdq0ZijA8cOi5jPKBPF7WyApZpqS137C2EsDK9IosYhrqS1eWqsYxDQ4L69O6yc/ehhtbhUR0ZlYmL/yJeg4Ah/iJlYqjj/9u4u76+dxCAjz94Vqc3VRQmF2fuEO0VOoMeIfoc0OnPiNqmhX1FJ8AuL5jkNtHWRJZxu+gIjMm+/ccaXIcHiAxLNxJTGbD0aX0qeaXpwmkpub1NpMMDsg2W/E28+gNj50pHi8ZEnart37cvLe0UD8QEPz7MAEtKhI3HXdn68GmTpuQVFPx56tTKndaR8bpQo0nHK90MwvxSafMx2RGUMGHYyIzMrA1pab/tKr+ip6lnjD7al80rYRgoJZ88kZqa2r17d02806gXhIB27TuEx8Ru+Ov3J26fM/SyCaMmXamjoe7wxJFDv37z+ca/Vjvstvv+90J4dLSafgFCaC0r+/rDL7b/t/b44YN9hg4PCgtXVYCt3Djr7+//xhtvBAUFrVu37tZbb73xxhv79OmzfPlyb2/vlStXGo3GX3755e677/bx8XnsscfWrFlzyy233HTTTaARYaBUTMq3AHMP6tLehPPUBkGSpN9++63W8jtqVYxJkyadrXCZJ2PHjm10HR4NDnWA0jVAKgDew6j4Urc0bLWiCGTIXUb2fCvTcgJ1ib1FCOUXFBcWlnh5VeZDOTeyLDeaDk9RosjlsPh34tUXeA1QOuaF762ObeWJGkHiEQXAEF0koTFJ1X446LA5ZCnPgMo9y3bVCsY4PjaSFghucB2eKuGVbwZSMfEZQVP1KoVhWw2YkHYxNItbE+nwIL1hYck/RMgH3oNpwoGLuGHPi/qYOnLooLOsUMdAHx74MaC0TMosknYXHs4teffggf2iIJRCmFUgCTaZE7FMAMeh8lLpRFrpnoPrkk6mHDywn1Bdt7GgSBYDJZ4QA4IBZj43Ky09Pb2x1AQarRdJwlGxcQ8+/dJ7Lz/zzy8rC/PzBo8ZZzAaIQLZGenb1q+Njm//0POvDh59WVXeSjqIlJeWrHj79ZLCwr5Dht+z6Dmzt5dnSrzWKd4RQvr37x8URAPvO3Xq5Ofnd+LEiT59+iQlJQ0ePNhopArM7t27h4SEqGFijZHIt5azAghiKyjfRIxdgTGxclkLweFwTJs27RxxeWVlZW4L+LlpCh2e6lhWthmIRcR3HNWYXqjZUS0jW3ftHRVuyPljbxFCJaXlJ1PS+vXuUscUiRg3qg6PAdgJS/6hvlA+o2hxiwsVWTiONZvqaiMggMiyrPPweYUQugT54N4TdmftDRMeCKLUlBrnozF1eIpd27obSkUkYCpNItjKJDzc5Do8AGD5FiDkkIAracKBRvMTMJvNhID0tFNeuMLXjIiEXQ5s0oEoPwtTgg4cPGS12XV6Q5BZDjfCkjIhHfMugMyMhGQ52hv9fTwzN7+QEBwYEhYX4xtisrOiLAsykEiwGWVbCwuLaCxdA7txa7R6CE3oPvbKqd37D8hMPaU3Go1mJTxWBn2HDPvgpz/9Avyp85FH0juMsX9w8CvLv4QQRse39/X3k5q9bNeIoRWeJWXdqINiE3nCUt8dJyzfTKQiYOkHENeo89TmQzXftbFjx37zzTfXX399dnZ2o+nwIK3NYN0DXTkkcDrQRdFA5noiS3JYaOC0K8bU6XhKUTKO4x1OB0INViqtWh3k8LBghkHbdx50OJwNmg+vqtpG2Xoo5BD/KwAXcAFDLLY7Jo4flnny37odENqsjjXrt8ky1uloQpMLOu9adut+TwiJj41iENqz74goNqwOT5HwbAehWESCrgHcJfNcbEA8OxsBILYdjSjaQ4NUxMb3w1PzBh+AuYUk4Crqilf/G7YumEwmQkiFtUJHBB8O2hy4tEIM4ZkEC+kf42ONiykqLmQFa09LsQ+P12VhKcBPZzaU5OZFAWf/CC7faUh2+Vl8/EL8vMJBpi8jQxcpq5AhAf68nF5aaq2o0MQ7jQtDkuTA0NCQiFAlx2JlfhO9wWg0mWUZE+nMahaE6PSG3oMHKhvSbUFL4GLFOwjhsWPHbDabyWQ6dOhQcXFxQkICACAuLm7Hjh2iKHIcd/To0YKCgoZLdFePs6P/KnYDIZ/4jQOMqUXM+w0Gw8qVK89hnDUYDGfbVpbl/Px8o9HoHk0hhH369Fm8ePHtt99eXl7uqcN75sl7mAaMO4MscJ1C2e+RoNnE1FUZgMkFaO/qtmaVJffMToVl3KljbHR0WE3jLMcy55bJCCFKfuMzph9+vl7duiTsO5Ckpj526/A6dYxVjbYXAQSQhdb9UMjBQbOBIYGWGagnHMeeYWw9x8EgRBAZDDqaCqBqnkOfWTqmd68ExBqq5/OAwGZ1SM5cQsrOtkuMsctZveJtWGigwxF7+Giyqq136/DiYiMvtqdBHjhPouz3cfD1QB/XSBJJkwAxJi6X68wJMAwNCejUMe7goeNESc3j1uHFX3zT1XYOSnumoJz3SeBMYup+ATfseWFZFhNss9l1RIq36ArscnK+1NsXjQlwRXCn9pZwIJjzYxz+OumklcR09u/Y0WgwooIy74OHJSRYb+oCkiusTuwKMWb0DpbDDMDpJEk5Lj8jYzICp93qcDjcJmANjfoiS7J85jCr1DqqXUigOT5dLUB+8ORibwyWZQ8dOnTrrbcGBASsXbt24sSJat2FG264Ye7cuTNnzoyMjExKSrLZbKrA4XA4zia4NA7KPNVxFOYXEr9JtH5Ao837Kx3567lJTR0ny7JXXnnlhZ1DWlpaYmJirfu0Wq3uj6oOz8fL8sijt8kehZIuFjV0IOt1EDiL+IykCtS6VkStRddb563U/1eGuAeFBIJqEwlaqdyQkZnjWX+sGtS1otz677pt1U9CkSMl6bRfgarD4zi2Q/uYBhgOEQucp1Dmqzj4ZmDpq0w/6rTPquuthy7cM3VnZdMRwLIwKjIEmbxBNe0ahNbissLsctFWu3jHMKiwsOSPvzaecYjKxLRU8nO3GMby3gNHeZ6Nigy7WFMj5IGQgbLewIGzgNegC5NI6tvZTnevqis69x7Ou3OEYGFRyR9/bTqzKJwaM6rMQJQv3Do8Hc9FRYY2gpUWUKW7mA+z3gEBU4jf5YqI35BHcTqdCCKTweSETKQBFNnJoVxhRBAKMoFeJhAGHScrYEqZVMKCbu2NssPBl5T4skx+qRDhi6xAl5zsNAOhuzeM90bePCM5QVK+VGbHHfxYlwgMvF6nZHRXC8BraGg0sHgnSdLkyZOnTJly+PDhMWPGjBw5Up1L9enT5+uvv163bp1er7/zzjvz8vI6duzIcdzixYtjYmJAEwM54MqAeZ8B/8kXplg6L5IkZWZmms3muju0IYSysrJq5ohxOp3z5s2rVmTMjV6vX7Zs2dmKWxBC7HZ7HU9g6479oGFyHXsAWWoTz/0IuNJJ0LWKY9k55WlIIzTtdkc9R1w68XJRBJpeUkZ0DzRkFiYdSCosKvZUFSOEikvLjyWl0DwUZz8KIbSgam0d44xTg5DmTCopLWtIradUhjJfI0Gz6AyEysTn6ULKr+ygNa/qfhAI7XaHyyVItIQOQazLoXQwl1PevvOgjLma9QMEQTRxNv+zh6MQQsTapmrVfkqaCF4Qy8qtDdNikAdiEcp+h0ilxG+i0rvqk90Q06aTlSDrOm6CEO1dLiftbIQQp0uw251qzuzaT5DOB6Rzh6Mona1OTYdlubikLDoqDDQS9IatgLmfAKGABM06/w1bH8rLyxGCfgH++YyBw65EC9yYJ/2c5LwlkedYKDrx7gyhSwCKCmDDvL1lr0CDPlQihhDv8mBDkcDn+YnCwWTXngzSzUsPRDm3HH+8w+7NomgjPFQgG03eFrNZTQXVUCesodGauFjxTvUUGaNQ7auOCur7xEQ1vgGMGDECXBLoIFoI8z4mvuOB79gGn6dmZ2dPnDixqvJV3c6IKjZwzWeTKIpfffXV2SbrCKF33323mnh3YTP7OgYx1BsqoEiw4DvgTCPh9yhpVM8qryAIS0rK/v5383nDM6tBdUL7K22mCCFMiFLEHR48fCIvv8hTvFPtrQyD2kVH1DyIOzbq7FR+7zn0NnB4EGQBtsKc94HzFAm5BSDTORL6qAkC/1m7pV4tBiF0OJ37DxzHmHqZ8DqDTrLEMy6CSU52ke3soRUBZrefg/qqvlvPj1W+tafVhO43DdpiDE2Jl70UCLkk+Ia6p8RTdbTr/tte36az2mxHj50SBKolMhoNdptdpztdAa/2uJ/afFHO29lqNl1TxKJBWm4OFnxFp2ShtwM+sKGcWFTjaUBgkJ01I9kxxAdllII1GaIfC8aGMbxEEAZ/Z7NBNhOf5+L4fMCWuQhkkQyBKBGp1KErKxYH+8miXc524u9PivkV+LIYJlwPNtpkaPD2UsrOauKdhkajiHf9+/c3meqUb+LSQ+epVpT/NRGLSMC0hp2n0mn9WfRtjQ3DMN7e3g5HnRRgoig2yXkigDhY+i8UMnHsq4D1rq1Uk6cmo956HVyFetWShCVJZhgqMVcbRM8xnireflxVFbLzHZGQBopEqfVUGGWI/Q4603G756m++Zwii6KEq8/uqUqpssUIoQmfZSwThDkWtAujWWRrXj8BQM+rracmSMNKGmk6KzhLc1F/SALkyhOH1BWyUUyKanMRQgVi7CCht9VdwruAzubZdGrHkyTMMOfS/9XaPGpnq+P0j+bkrk/NlYsGAqSDJX9BVyaOfpLWR26IZ6PaYqFh4VZkKLPJ/r5wTABcXwA+Py4mlchTI2B3Hy5Fbif2HM4YDKLoKispKSgq8fbxCggIgiyXn55elr8FSkXrUlyrMqRSJxkawiZagAnLOWWyITYqPJxGHGvGWQ2NRhHv7rzzTtCSUHypClfSeWrIzYALukgH7cYYvTiOmz179jmMs9XyPCUkJJw6daqOw8a33347d+5c0AQQCbA+xGcMQJZaR946qM3OcwB3fU9VaaQUqQReFqpuqil/IASrHRRj7ONtuWzMoLoIBgihU2mZe/cdBY0HkQAXQGOAzlJwpaFaTK3nKRKLA0UCg53z1p0t8pCWfSOEJ3qp9MfUI0ZAy4GS7u1q7fMEQtY7qI+Xfze1yi/DMAcOJyUlXXQJ2rNejUTjUSz96mjOvuimq9xBZRnjytfZ1j69mfoGYxwc5D9x/LC6HAwhePRYyqEjJy7Anffiblhv4jNcKanSkNOYPn37+oWE7kpO6e8tJeoh9AVAJpvzcaaIAi2QCfLqPXx0ek5Bfn4ep/cLCZZ1Or1PQEB+TpbsyIuNArtLmGPJDiMAw4JQV28QxJCUYjm9gvRonxgfF9eA56mh0cpogMhZ0MKAVLFUtgEKWTjsbmBIBOQCdfsMwwQG+JaVVVzwU1jGclmZtVqUtV6v//zzz+u+E4RQ3RWo54i6bUiICFhfHHavkrm3ukOb4kUO9XrdhQvHimaI52lcHlUZIaSnbtbUXhYfF3WWPkloGQa6FXeGQoVaqM/fh5ECaDyISPhoEn4vMHWrtUNeZIvROAyaQoKVFe0dx7Oc3iyZ40W2UPHkP1cL8AAT55ESB1E9/s+yLhUbnfaTRlOA0RJDiEzzUzdeixEXMXQiEQ8Afbtzz9CIIi3p9TrEqNVM6w1CUJJlnufVTszrOL1ep9PxdZEXCSDuFIx1DwynhVeaOM8AFgAXhENuBt4jlfZsSNfk+Li4Hj16bD556FhZWVQArbgcaELtQw2d2xly81x2QfDy8gbZeS6HQ6/XW3xokTFRcMklqYl88rBEVCr4+KcaclNsPBRZmXAS3pCFBa+IHt26+Pv7N+B5ami0MtpqSDnige0QSn4ARz0JvPpfgCVCFqXoyNB/f/+I2gcvaNhgWCYjI3varAePHEsGTUVTJB0kItC3x6FzaULp2pJ9EEJ8vC3jxw6+4COoee8gRIpzD2RZNHbUILPZeObVQRpCy7BAlpW8aQyQJUCNudVOpk4prxu33bBAzP1I8Bygjzhbi1nMxotrMWi12hFtNxpaYTCZRwyMzjmxUXDBwKC+Op0foYKykj8FIcXkrfqGqlqr8147xFgoKtzjdBQIziKjJZYQ6VxG8YuCljAg5r7UrZP1Pa/2XdXRjh014IKPR0NzSsqMBr3D4aRd18dryMCeRqOhjl0CQqTWNap7L2qaxKAexxOBoT0Oux0Y4gBuYNlOTW48dsxl2zdv+S19b4SOpDlBobdh+gBLnAn+XuzYU+KSCejTu3evnj2pZaWwMC0tDWOCADK6XJ10On0QNyCCX+vHrNtcEgjErDKyLot0vXL0oIEDL0WyLQ2NFkNbFe8U2wrhAmiZowsFQmgy6OtYCKGWzVnWZDKoRsPWAgFEIJa+JHA2NfGcPZEbhFAJ7LjQpoOeGjUqkbAsw7Js1fBJAGKIJIlpScKRXYxfMOA4OTtV120QGxUPWZbUcKGDLEvlvyqnMYBl0kTpezAVVnwvI4Ezaf2ARmwxunmVCpIwCLEMDQNiObN/QE+DKYResyTn5hVm5+QHBfrb7Q6nU2gXE+7jYwE0B1tltg4KAbSq7xkjK8SSq8Ka6rTnX/AZ1r30BvEZRoKuU9JY1smz4iKbTu1damdTixqf2dnOd8ZNLazVC6JMLXqT4JtoCBSV7RoejuMGDOg/eOjQP79N+yW32NvMBAZwPX1QeprtVCFjCg63O5wGkxkhJIqiv78/z/PUDTXj1LokIRy6hsXqfAP4QcHMPh/uUK6wu4RUWEKGjxiuJljV0NA4G21TvCMAi8RnLAmdC/jQC0gn6wa7/b/qD6O4uYNWg5qEzXcC8Z+o1AY9z1BRR7XZOTevfvDKoZRlpZwM+1/fismHidOm6zUM8jrnlr+dezZx7RKNl81kI9rR1ONuEBJPJcllRVCVfTBmvP3Z6ITqqeAaHJoUkCUBM4jvZUp8r9SkLeZeTK3nckF+4X6aU6ZUECSOpWXcsrLyk5NTQ8MCu3ftYDafkSjbZnUUFJaquaMJIAgxISG+ja50os2FiN/lSvoYpl7+YRfTdDXVl2d0tpYLbU9IfMcQ/6kNG2dWDYRQcHDwddddl52T/efqX7pz5Do9cOY5dp6wp4OYkeMnyrJ85MiRgvx8hmESEhJ0Oj0hOCgi2h7Y9cNdu6UycXo8Z2BQCEO+KyDJ2Oeq2dcOHzpUK1bRFjhb7atLeBrE4wTU5bWe0tm+qpld/6LrmJ+VtifeEQwIJgHTKrOyXYRsp3EaIgPEE98x1HdHMZ9dsjNhGCkvy/rDB3LGScBykGErXxwHZElM2mstKzJfdTsX0c6tw4MsZ9/wm2vvBshRVS4Rnbqew7znLCBCY/YNIgHGgn0vq8xmfOkq5iEGFeaXbNm+z1phZyjIjShJqanZDodrQP9uJpOB6vBo0CoqLCxd/99ONbEO9eTjuCuvGN7IWmgMEEt8LqeuFHWIpdA4D0QGkCF+VwKvgWomo8Y+YI+ePa+5+ppTp9L2p+zrm+k0lsOdZT7RQ0f3GzI8Ly9XlqSwsLCQkJDc3FxRpJVkS0qKjT7+u2z8N0fKY4mAOGZXqnzUwY+4fOx1s2dfguSpGpeCphTmoFIJSZJxzZlqzdNgWOpyLwrU+ZvjkSTSXF3qV1TBz0FJopoCnmcwPqOImWoB8JwfNt41tjXxTgZITwKvIX6XqYaeS30+rQMZsD7AdzQwdqp73YVGAULisNtWLpMzkwFXY3JPs3rwcm6GdeVH3nMXQv3pSlyK/KeDlZsQyDTyfUEkwIfSOgG0Pu+lbDEIgM1q37YzzWZ11IwQUp53MC+vcPeeI0MH9XT7IVRWhGMUZaeSU7DxJw9G4je+soO1jeLRjRwk60V8xgFTxyZrT5Zlx4wda7Xbly9f/uPRHSd82bD+Q2fNmRefkGA0Gk0mc0hIcEFBwaaNG0xGk16vT09LKykpsWO0o5i8fEgyIGm77DNozMi777m3S5cuTXDCGpcWlmWOHzr0xftLK0pLaCg+oGX6eg0aOvvWOxHDNLhIBCF02u3FhQVBoWGsRwIjhFBRfv47zz9VWlxE3Tw4bvz0mWOvuCI3M/ffX1ce3Lmd5fh+w0aMmDDZZLFgjBGDnHbHhp//2Llxvc1Wkdi1x5jJ08Kjo2VZppV+8vI/fWtxTEKHqTfcrDg6w8K8vK+XvXvZldM7dOnmdtJtKNqSeEcEQhNPXAksfRqjcEUbhUoqIcR7FNCFXfJC75BhXEf3SOlUb3fWlVhOzksXju7S9xnhdrCDHA91hkrxDqEqOa8xIEroSSxNGcP5XPIWQwilpGZWVNjO4aXOMExubmFBUWlwkL9qolWDQD20d436GJGpLOI3FuiiL3lztQpkwAVRRXtjVmisFbPZPH3aNJPB8P67S/MI6d9roMNuO7x/t8PuwLKcdKRg3fr/0tJSTQaDt6+fb0CgMS+/wmYvcJIiAURGx4weN/6WufM6d+lSLTOURqsEIpCblbHu918mzpzt4+un+kGFRUYqmjNECC1cVDnVZBGWaS5PlmUI9bumxZhkGUgiDQ1zq9MQosF1olhltKnakFYPp6UrQVLyiU/eXLJw8Zt+gf6iULkaAYDj+dgOHW3WckmUfvv2y8i4+IEjRz5z/+05GelDL5tgt1nfef6p7f+te/SVN0wWk91qe/3Jx9at/nXImHGBwaG/ffPl6h++eXrpssRu3ZRC3hV/rvxOcLo6du/ZtU9vQuiSf1et7Nanf2K37mdPZn+BtBnxjkhAF0MCZigPNS0NZoOgVP7QtyM+IwBjbA5DL5Fl1+EdRJYgOlM+I4Q60sGqAEZJdO3bwncdAFlOrRRtnj7PPH3eGVs0imWWzkGBqQvxGqR4O11q5TEEsoyLikpJjbzOlRGzVTMgSZJTUjKDgmgeCizJ4eFBM68a57kjTOqfmbruak7vIYALbA4drIVDqGynjydeA5RM403dnmoKpw6JicNGjaX1jg2m5e+/eyLpaElxCQ0w1um9fP1DwyPNPr46gzEvL+/48eNOlyswKCgxMXHKFVfMuuaasLBGK86m0RyBvgEB1995X1R8tGr5JBiIopR8LMlgNIaER1DHYUlKSTrhHxTs5eOblpxsslgK83Kz01LDomMSOnVRUwHYrBVH9u2pKCuLjouPS+yk+ryLgpB2Mi0oLLy0uAjLstnLsn/HtpPHDh3cvbNTz16+/gGqLwrB2OLtfcM99zEMcNjFYwf3sQy7f8euU8ePvf7FD517dpEkMP2GWw7v3aNq4/5a+f3mf/96/fPvuvfrBwAoKy594o6bP3jluZc++lxv1AEA/AKCAACfv/vG029/ZDDqlKky30gx4GxbeagZO9EKlfShpsl2DQLVlxNjR2DuCRB36SUVZfTAZSW4vESNkDgNRNDszQSGuc21RJYhrycOG/SiAQGK793vUloSzaJCtRsSG93BOGwikRq2q9AUbMTcG5gSm4n3GARQlCTqF3JmkQwIodGo9/amwYzqEoxlSOe+1L4AECzMLzmalKLW3VJSu7E9e7ZvBN87meijgLkPYC2abNcwuQKMnYG5B/25L117EkJCgoN9fHwgAP5hEScysp1lDqvNKpRZSXbekaPHeL3eYvFiOU6v148bN27o0KGXX355bGysWakwq9HWoGHqLMDK80UUAcOg7evXrPtj1fPvfxIWHbrqq59+/mLFk2++a7Z4vf/SMy6Xqzg/v6ggz+V0zHv4sRm3zCvMyX9xwX1H9u3meB3B8i0PPDJ51g0IwZLCgpceuT8mvv3+HVt79B/csUfPd198uqKs7Nn777x1/sKr584VXFUKPEIkUcYyEgVBFQ0honWlbVYrxlRT2KlXt47du0kScTnF//78bdj4y7v16SdJtDqQb4DP1XPveHH+vekpyYndOtF63wyaOHP2r19/sf6PXydfc1WjNt35xTuM8cmTJ8vKyhokgzHLsp06dWrCoCcabQfM/YnP0Ev7UGtdKCGflp5Ar2SNby6+UBDI4hkhsYqoIhfnGkZPYyPa4bISqoKnThwE6I2Q01X63tHI2aOuPRsgT2dXRHDpMAYjJjfouWEaemLuScs9KRmAQfNA1dF53tgQgooKW68eHfODigRBojlQlNUMep1avRdBZLc7UlIyPIyzfI8eDZ2lgsg0DZuxM63h0QxE4RYOAZAl5l60SSn4Ena2Dh06xMfHq+kVLxs3Ljcv78D+/cnJydnZ2Tk5OU6Hw2yxBAQEREdH9+jRo2vXrmaz2WAwtMD8+RoXC0TQYbX+8f3XfkHBhOaXBZ179Uno3HnCVTM3/rP64zdfnXbdzZ8tfX3WbXdFtotx2Jz52VkWH99XP/3Ky8f7u0+WrVj6ep8hw3/9+vPSosIPf/krKDTk759XLn/tlYTO3br17YkxTks+EREd88KHKwJDw/QGPULos3fefOGDT6Li4t2yXU2wJHXv269Lz74PXT9j+IRJPQYM6tZ7QExCAoDAbq3ITk/rN2wkfVSqNQxlEBAcSgjIzkjr2KOTYgmR4jt2vnzG1Z+/80bfocMZthFVbOfftcvlmj9//vbt22ne9osbltRilzNnznz11VebxH8C0+gw7xHA1ElJPKENEg0CBpAnls6ACz53aaamhmCoN0EdTW58eihAjHgqyfH3t2xMB9sfXxN7OXXNkEQ2Mo6LSoAGoyppIb0RWXxUlzsiCkhvbNAzkwEyEWMi4HybjSisQmO41DAu9+iJEErPyNbreb1et+9AEpZlWnRVliPCgkNDA9zr6PU6z8jZhj0r+s+QoMgiarlbjYuAYBpPpu9Ik0A1bWNWMzlBBc+5vcFg8PLyahcT43K5qB6Zajxon2QYhlO0d3UpCKQlN26tQAAdDsefK7/T6fXKgxrqjcaEzp19AwLuXfTs0/fdvm3dv8PHT7r8qmtkWgKaMBzXa9CQ4PAQQsC4qTP//P7bTf/+tX/HtnHTZrRLaCcIYMzkaT98vGzPlo3d+vYkhJjMXmOvnNGha0eXE3McMlm8WJb18fPXG/RSlYteTTAhFm/TE2+8s+HP3/9b/dvSZ57keP6WBxZcddMtsiRLkuTZIVVVn6L/EysfsfRM8bQbbvn7l5U/ffbJhBlXN97UpU7au9zc3KFDhy5cuPBiijdDCO12+7hx4958883S0tI333zT29sbNB4EA8ZMbWH6SCUZSrORQlr8UGEG+hjAeFGppVlBCDJ5MaGRYuoZlWEhg5x7N+khNE+5yf73N7iihECejenAePsTmar6iOAyXTnHNOXG09sg1GC+dwQD1h/oowAyNjPZjj56eI7V6/iy6j8lTDqemtihXe+enQ4cTJIkmYMwNDQQMSwt6ybJYWGB06eO8VwfUl/nhjopBPTxQBda9VHjYqCPQeWGNTe9oFxcXJyamnreSnqq2FdtkKvy/jx/BygtLb3oM9VojmBq3Ax4ednnEXHxWMljhRCigheEnXr06NSj1w+ffvTMO8t1Bk4Uqvyq6VbKQ5dheIO+ICfbbrOZLF4yDRCnYa16o7G4qEDtkkphHrpjtaOpnY2aX8/sdAzDVMtQSwjw9febev31k66+1umwr1j6+kevvdRv6IjA0FCT2eKw291rQkid/CCEFi9v924xxoEhvjfe8+AHLz8Xm9iRabREDXWsgYgiIiJ69ux5kQdzOp0AgDlz5vzzzz833njjihUrGknCgwAT1pd6mVB9STOTQlowhDov8qFKqY/m2KqEyPoeg4W9G4koUP+2Smg4u3PPRgCRcdzVtj++Ak67vscQJdi+cU+HPga4QFrAA7LNUQulRHqERwQXFOXWPL1jSac6JsZ279phz/6jPMtFR4aq5obGPB9CPSj0IVQgbobN1VJv2HDFt/IStOd33323fv36Cy8tXTfy8/Mbdf8alxBaa5smzmGwTPW4SjyszHFox4aNSQf29xs64ov33ozt8J7ZYqlcnyhZEzCt5+50OILDI4wmk7WsTDEwIFEkDrvdLyDobApfJYkdT2Nsq5ZgWU47eSIwJNQ3wNvlYrAkIQgddqG8pDQwNIhhkV+geewV0/74/svC/Nzo+Nj2Xbru275FFGVOyXjHcuDovj0cz0fFxZ++Dwj1IRo+fuL6P3774dNlsiypcxuOYwigF9hQrVdXsbFBblFJkgRBmDx58u233z516tQZM2Z89tlnISEhoGEhMuHDqWWn+elLWiyKLMT60VwegGm+Q6+M2ah4/eAJjnW/KP5Gp/UBkGWdu/8DGBvHTCe2cjYyzl2UAvI669fLXAe3uY2zuq4DLLPuvjgFniI7ckFKi8Fmq4XCmMREhJSWouSUdIROa1DUN0ePpXRoH9O9a3sGMSazQZ3CIpbJSMvZvHWvp3F2/LiBF21gIDRGhw0EyNR8O1jLgvUFnB/Vhl6i7lescEkOrdE6cDmdh/fuLizIwzImBPv6BUTFxWempi19btH4q64ZN23G/ddO/+qDd26d/4ha+2H3lo2Dx1xm9rL88uXntvLyoWMnlJeUrP7xm659+gWGBK/9/VdrRVnfoSNURRqh4sEZt4atovzwnl1d+/Tz8vGlfgIMspaXv/LYg/Gdusy5974j+w+lnjwx7cZbNv61+t0Xn543f2HPAYMkQfjp808MBlN4dDuE4JRZNzw67/r3XnrmitnX8zrD4T07l7/+8pXX3hQUFq4KI/Sg1EsNGIyGm+554N5ZU4tovRYWY/znD9+xHD9q0hUtOHLW4XD069dv1apVM2bMmDp16vfffx8REdEwu1ZLhNHC2ILmtdOgQKoGYEzNy9muFggg0DBsEhGczi1/E0mkUbSqGk/pG679m7n4zoaxM2hUrIcKHjvtuKLUHVqBnae16xcIRHRkRcZm3mLUFIpQzx4dZVlMy8jFMnYLeTRnFMYnk9OHD+0THBzgOcHDGDudLrd4J8ukIfR2PE2ODXnttr1o1KmFt9L9mnpq0di6uvMdvfneaxr1heN5wel66ZH7EVIfNXjUpCsefOalrz54OyQ8cvqNt1i8jTffN//9V54bNGps+y7dGKUa9KsL5xfm5ZSVFN/+6JPRcbFXz7099eTxh2+6xmzxttusdzz2ZELnzpJEZ7AGo8ltGMUExMS353jdsw/cOf/FJeOmThMFGcvY29d39q13v/r4w9vXry0vKxkwfNSQMeMlWRq4fezihfN9AwKoUx2E9zz5XFBomCDgbn37z39hydJnF/37y0pery8pLLh8xqxZt91Fa2UBBCGiB1XCKSRR7tCt29Trb/7s7ddZjnU6XB+9/jLDsMPGXc5ddJzDJU6M0rt371WrVs2aNWvy5Mlff/11YmJig0SHAWMCtYVZD2s22YYDUsGOmhdbwqOTYMjpTBNms1EJrl3/ybkZ2FZBC1GYLHxEHN+ln65L32qyHcCYa5dIRRpGCRGQRTYm8eIKziLAWFpKixEMdEbdwP49goIy09Kzyytsgkuk6fkM+gB/33Yx4QEBfsqzpko9R4DJZIhtF3m6agXLengTw9Nr1h3EAqBXtK0toMWaOxBRTzuoBiU0dXtaLBZ/f/+GDXdQfaSKiorUMQ9C6OfrVfMQhBCz2aD1oNaBKMi9Bg35ZddhLEvupzXHc4hhb5v/hE6vZ3ne5ZRHTpzSb/gonudlScKy3Gvg4LFXTEs+djQ6LiEsKloUZR//gGffXX7yyKGSwsL4zp2DQsOwTD3ugsLCP/j5T47n1QzGsiS3a9/hs783CIJLbzC40xrLsjx8wuWJ3XucOHLILzAovmNnmqYFgIeefXnWrXelHDtiMJoSunT18vFR0ywDAEZPntJ36PCTRw7bbdbYDh1DIiIVdR09aFhU1Ac//8XxvGqBxTKZ+9Cj1915r05vYFm296BhgsvF8VxryHvXpUuXVatWXXPNNZMnT165cmXXrl0vfF80WTVP3bEZL8Ugq93iDQcdeltUVgJFCa7rNpBv30MuyCa2cprczmRhQ6Mgp6OVKs6cGBFJNA6bBEZcUdVtIL3tLibpHVLvz5bQCalPsShLAgByfFxYZERgeYVVFe8Mer2PjwUhiGWpqjwvBWPg52ceNrSHx16gKLpUh2Si1IOBpx0f6wJUnMM0Ggg6r7hkzJkzZ9y4cQ0u3lmt1gkTJtgVp3Wdjvt8+YtBgX5ytTkYAeFhwfgi4v80mhUMw7qd6lTUaBuTslB1BVY/QsWMKwqCILhCo8KDw8MxppKZ6jzHMEzHHj2h8lx3C2Gq9k6ZMJyu/ao3GA1GmnvBU3kmSXJgSGhweBjNjk9Fw8q4jNDIqPDoKEBT5p/erZokz2Tx6jVwEB1JaJxHZfEMNQaNHrQqN5YaJ24yWyCEqSePO+y22bfdjRjGvbeWnda4Xbt2K1euvOGGGyZNmvTll18OGTLkQi1MOsAEVQ2rGg1Li5Lt3Egi5DguIhaoIw3B1Ih4FqFNWd5Ao0KLSdBFk6wLrorU5B+UIh+KXgTQxOvUiwUAaynJz66jrQsSLItiBWL0OadWWkuOBsdM0Rl8634iF3MZGpccz6DXcIUGP4TL5XKLjAihPr06B4YHg5o1OiVZHdQ1WgVUNKplabX5Oa1IRJ9mnXv2CYuKkSUiS2d0DKW4RS29QvG9q76kVqOoonursaosq7U0aj3vM0/hrAd1i5KhkdELX31LbzA0lGx36cU79XHw7bffzpkzZ8aMGV9++eWoUaPquQPVa8eseBBraFS/rZtljG8zgY7KgmBtCEVjZW4L0VVUmL3O5NNeZxyiSW1thCbIOSydma5cEETgEhq8BLtGC4UQwrLs3U88DRGqJtu1FFiWhRzXsK6rl168AwAEBAR8+eWXd91117Rp05YvXz59+vT6bM1U1pLS0NCoB9RAgBAIDJL0+gZw5EWQsBzJzeHKyiCWnS3DNq1x0Yii+OKLL/r7+zeIM3itQAhdLpcgCI20f43WAUdj4+qUK7F50uBn3lwEIy8vrw8++ECv1998882CIMyaNatu28EWajk8B06nc968eWqOwAZhwIABDz30UEPtTaMVAQkRK6zpNoergYQx4nRFQ6gGbGq0CWRZ/uSTTy71WWho1GJsPS+qI8q5qx6oKVdAC4RtPpp8o9H4wQcf+Pv733LLLcXFxXfddRdok4ii+MUXXzTgDp1OpybeadQKDUgsLse4weYSel5Emi9dG+ASjnctc6jVaEgYhkEMkCUakXp6IcsgBCTxdChDnaQRJdLhfCs1vGqtdYp3LpfL4XDU+hWE8IknnpAk6eGHHxZF8d57722D9QQRQsHBwTabraF26OPj01C70mh9KHH+qGG0d1ApANryHoMa9Qafzau8VR9aozkAITyyb2/GqeS+Q4f7BgRgxQUTIebY/n3pySf7jxhl8fY5rzSmZttZsfQ1Lx+/aTfcVKsfJ0TIYbN+9NrLPQcMGj5+giS2MK++JhXv1Ba/4447FixYcLbWVxWhTqfzgQceCAsLmzlzJmhjmEym3NzcS30WGq0fQgjP8x3j4w2G2uPF6guEJCXFWFzUwh6CGvWCVtrj2UWP3lZRYaNpw5v88BzHWcwmLYNxGwVCxKA/V367/LWX7170zB2PLlJ1IiVFBU/ePS89+eSnf6739vNT409phiZV83Y6NQmkOdRhpRXx0O6dgSFh6nv1r+eaiIGyJO3ZsikoJBQhj4o+qs6vKqmKp/W21veqCVg9hufJtCrxzmAw/Pjjjy6X69yXR8sGS9Ldd9+dmZkJ2h5Op/O2225rWN+7Bx54oKH2ptFqoIGukpSWnoMYZ0Np71yOaAgNDbEvjWYKLUPHsvfee+MlzGiDXUJLNJZpNBiEBIWFr/315wnTrm7Xvj2A4M+V35cUFvj4+6vmWqRkeLLbbFiW9UYjy7GqwCcrafBUGUMtjMGq9WgRIoQILhfLcYh+jxw2O/Xth1CnN6h1JlT7ryzJDpsNIWQ00bR56n5UM6OqEXS7n2El4526kGVZh90OCDGYTHQe3CTFXeon3qmxS2oGhNO5EKo+nv9gLDt16tQ6HmvBggVNEG/fbH3vGjBA2uFwaOKdRq1gjItLyghpsLmEjhMQDa3QaOXILi2OVeOSIcu414DBGONvl7//2KtL0pJT//zx24nXXLvln78IFbCAzWr95qP3V339mehytu/S7Y7Hnkrs2s3pdC1b/GJQaFh68omykuKFi5eqUxTEgoriio+WvBQcFnHVnFtkCX//2cdfffAOwzJDxox3Oe2qKMIwTPrJk++99OyhPTt4nX7C9KtvuPu+tJMnV37x6Zz7Hg4OC81Jz3z3xaen3zS354D+Tofw8esvd+s3MDIm9ov33gyLivlr5felRYWTr7nupvvn63S6Jpif1FW8U9WM06dPt9vttYp37oVuMbbWb9U3qmStvlHfq3/VENpXX31VlmVtcqah0QRQZ7mGu9Xa5IxMQ0OjScFYNphMl181a/ET84/sPbDx7z8CgoOHjB6/YfXviiIJHDt0YOfG9bfOX+gXEPjpW0veef5/i1d8DQDYt31LRWnpyMun9Bo0lGEZQABiGEnE7zz/1PHDB6ffeIvBqPtr5c/LX3v52jvu6dC164GduzJTTylyCiguKXn18fksyz726lvFhQWfvrlYZzCMmTxt79bNI8ZPjGoXemjvrpWfLQ+Liuo1oH9xQf7Gv//qP3y0zVqxZtXPY6+Yds+ip5KPJn38xqsduvcYM2mKqNQla0bi3Z9//lktvWSDYzKZXnzxxTYYUeGG47jZs2c3rHG2oXal0bogdEaK/AlxNdQeIdRrkY0aGhqNjSRJ/YaN6Na3/5JFCyrKyh567lWzxUs1eooi6NKrz9vf/eLlTSUca3nZR0tespaVmb19EIQjJ02554knAAQOmwQhkEThg5dfSDp44Om3P4xJiHM55X9/XTl4zLib73+Q40DnHn23rP2bmnRZsG/71szUlKXf/hLXIQbSEF3xx08/GnfljJj4hGMH9g0aPXL/jq0DRo5JOnTAbnMmHz1sNJniEjtlpqWYvb2uuPbGngN79B06euu6f47t33vZFVMaqkxSwxhnaUU2vd5qtXbt2nXo0KGiKCqVOqh1WUV9717o/srz49n+AgCSkpJycnIMhrbuuKPX6z///PNLfRYarRqa0JiHiKXZ3mFUA2apU6r6yIg10KR6DbZXDY2WgduV/lKfSNvwAeW5GTffdvvU8cPHT+o7dNCh3XvVr5T0KOLPX3yyc+N/kiDm5WRRtZQS1gCVGq+SBGSZ/lKIYf9dtdJptw8cOSYkIlKWqQdafnZ2/xGjMAZOhztbMp0L52Sk6fR6L29fp4MgBoaER5SXldqsFV169z12YF9OZm568slp19/885efpqecTDp0MCo2zsffJy1FZhgWMQzdGyFGs0UN9W0C6ifeqX137NixS5YsqXUFT1Vf9cJwZ/+ouh/efvvty5cvb7N6O+rCqVO6UWPC8zxojVBfWKZBrYzVUJwIQGuBEGwwBYfFXlGSt62B94yxwRzlG9AVoNMuxq0M6pnduJ0NarkDWyJKoXiaWpfV0no3CZIodezW455Fz3Xr04/nmcq0xjQ9E/j2o/f+Wvn9LQ8sCIuO2rlxw58rvye1yR6SJAaFhd++YNEb/3vs5y9WXDNvHkKI5ThZkhVnsjP8TXjFYY4Q+mSDSI3SQCzPde7ZZ+M/f+7ZshEiOGDkmK3r/t2+fu2p40d7DRrKVVbzrjxoNSmISjsQ4karklwP8c7t7F9NAtu6davL5Ro+fLj7ae50OvV6fX0f7p7OeaDtYbVa33777bCwsMZzOkQI7du3D7Qu1EjzpJOpPM815lFgcUkZaBVACCVJOnz0JMP4ETj+AlK9nwsE7E62MCkTQlhYWNLK7mWlOpZw7HgqxzVuzoGCgtbWdK0eRZ9BqEkLYJZpnbPo5gYhBEE4/YZbIIIeXmNQlsDxQwcTOnedMPMqBoHDe/eKLletUhQEoNegoaMnX5ZxKvmL997qM2R4fMf2CZ277N22ubyswtvXUlxYUFyYr2Y2Sejc1eV0Ht2/d9DoUZKId236LywyOjA41GAwMgzz988/xCR0CAoN6Nqn35pVKyGEHbv3PFeKRgjzs7NEUQyNjGoW2ruqszr93Nm1a9ekSZNsNtvq1atHjhwJAFi7du2tt9767LPP1rmw2Bn7b7MPNavV+t57713qs2iRYEyOn0htggO1ms4pSdKRoyeVt41xRe75CWyV4l3S8VNNcKw2a8douXo7kchOLBIA9AzXCstlNidEQRBcrkrTH6pML4cxdjrsGFM/uf4jRr35v4Xzb7yeYVmMscvp+PStxXc+9j/B5ZLE015vgsvlsjtEEVx53Q3b/1u75In5L3/82dTr5jxyy3W3XjGufZeuTputtKgYYyxLoFP3nhOmX/3M/bf3HjS0uLAw81Ty46+9bTQZeB0fGBy66uvPFq/4FiHQo//A1598JLFrz6jYeELUs3K4tWOCyykKAkL0zXMP3Z2fnfX2d6sCQ0LlRtDhXax4FxgYGBUVZbPZQkJCVBnlscceS05OfvbZZwcPHhwVVQ+x1J2upj7nr6FBaWViRAtvsVb+W2idTaOm3k7C2EUkJ5YIIBaiZ9ViphoNDiFYxtNvvEUQXJ45hGUJR8XGP/7aO5ExsaKIx0+/2uLtvXvzxtDIyHFTZ2Snp0uSyPHcXY8/7R8UJMs0kTuE8MZ7HuT1elHEeoPx4edfPX74oCTg+I6dXlr+xT8//+h02KdeN2fGLbcFhoSKAoYMc9N9D8d36rJn66bQyKg7Fz7VuUcvUZQRgjfcff+w8Zf3HjzU5cJRcfEvL//Sx89fbzCIAj2rhYvfCouKlmUMEZpz/3yjySK4sF6vi0/sXFJYqCbeu/TG2ZoKtujo6C1btmCMTUqKv5deemnHjh2DBw/esmXL888//8EHH9R9/21Qe0cIcV269FGCxySmJSJjTG+YJu8wavAQaIHIstpil+C4LTrPESGXtLO15KZrO3o7KtvJoksWMSASwSxkPNTYGg0JIaRzr56QJuI9rfHCmPj4+Y+YME4UqPyn0+nHTZ06ZspUhADGICwqQtGcyf2HD8UykJQUxwCAngP6EwJEUZYBiYiJiU6IEVxEkuSETp3ad+pES00oJSpkGShZkQnH85ddecXoyVdQT2wIROUEMCbxnTolduskuOiheV43evLlGNPDEQJ8/PyGj7+MnpWS8bj3oIHUfi+TivLy4qKCK6+7yTcgQE25fIkTo6jvqynY3LGumzdvfuONNwYNGvTjjz/OnTv3o48+mjZt2rhx4+p4iLamvSMYWyzm22+ZmZ1X0PSe1DLG3bt2oBHkLRB14tU+PkoSpabXFRGCfX29QcurP8Ymdogll6KUEyY4IMCvhY52hBCDnm8fH32pOltQoF+LFo7bjN5OVF6SRCQJy5DhtB+t8VDlqmooRtjK94RgwUWHCVmiP4Nc5ZknuM7Y0FNAlCTZ7cAnVSaloxXNPNcnmO4WQEgFNw8kUZaqxlJaVdUh13pW7hOgAhXGV157U8fuPRovkPZCQitqncKWl5c/+OCDGOMlS5YEBwc/99xzmzZtmj9/fq9evQIDA+ulvWsjCjyMsbeX+cF7b1DDc5r8+LS9ZaFFinfqNKBTYtwlPIEWN+JyHNe1c8KlO36LazDPhFC6S9rZ6Lz/0h1do056OycWXbLkwoJdFgXSuNlhNZrqoUPOtt+LPzGLj2+fIYNEoREtG/VQlZ1Ne6fyxhtv7Ny5c8GCBWoS3e7duz/xxBMHDx58/fXXPVdLTk5+9dVX1eJmbVx7p4KVxH/4EtDixwxySQEtEK3BLhit6TQ8UX8YqrfDlXo75Y3gxJJTFkQsa6EVGudGUQQ2bnWu+ol3Z3OP27Bhw5IlS0aPHj1v3rzi4mI1N8q11147duzY1157bfPmzepqkiQ9+uijCxYs+PDDD2vdf1vzvVOnAdqgoaGhodHy4mSJSPV21OWOSnVOWXLJogOLEmn0elMadQfWECo8l5yjgGpNq9qZC5u7pRFdfN47h8Px+OOPC4IwePDgefPmzZo1a/v27ffcc89VV12VmJjI8/zjjz9eWloKAFixYsWPP/4IAHj55ZePHj1a6/7bmvZOQ0NDQ6MV6O1clR/pX9IyPU1bJaSGLqNaVYVadR80qR46Q4CrEk48EyQ361+5AXzvXnvttU2bNvE8//LLL7uUVDQbNmxQS6Zu376dEPLff/+9//77jz76qPoRAJCZmfnYY4/98MMPLMu2ce2dhoaGhkbL9bejsp3sIdvJol0SNemuOQAhdNjtK95a0nfoiL7DhtNaFBDardYVS18fMGJU/xFD/1v91w8rPgIEsCzLsKzgcmGMYxI6TJwx65uP3ovr2Onqm29X8+oxLHPyyOHP33mz//BRl8+4GgDw23dfV5SWzpgzDzFM85TzLtb3bseOHap3nZJlsLIwuSrbqdZYNVnf4sWLDx8+vGjRovDwcPWrVatWffbZZ7Vq7zQJT0NDQ0OjZentqOOd8rJJTqzJd80ACKEoCGt++yn1RJIqtkAIBafz319XpiWfgBB4+/l36NytY/eedrtt67p/YxLad+jaPSahvbWi/Ldvv3jn+aeOHz7AsFQmwRh/s+zdHz5ddmjPTtWAe2DHtm3r/22egt2F15x1i192u/2RRx4pKio677ZFRUWPPPLITz/99Pzzz996662CIBBCnnnmmYEDB3bs2LH5a+8YlqV17KruWCLJjR2XQIvaeRY+IgRLlW6YDMsAVJVUiRZwV1I01roVgADLjZRTR6PZ4pnGSENDo8n0di4sClgsFm0EEC26opnAcTximNOfIaRLEJJl0Llnn259+3A8+Or95cUF+XMffszL2wQgOLBjb1hktN5o/Hb5+wsXL9Ub+Z0bNh7avatzz97uXTEsy7KNWAnzEtecfffdd9evX1/Hzf/+++9PP/10zpw5q1atWrlyJQAgLS3t6aef/uqrr9QdqgNSc/O9Uwp0ypu27DyVlqm0APS2mAYN7BkaEtgYVUTcBy0rq1j7347yCistugJgdFRY/37dTEa9LONt2w8knTgly5hBKCY6rHevzmazSZakalsBQCccCfHRQwb2bKTz1GieNL1sxzCIlnpstDtC45JDZ5WEllFv4uNSew7L0HAFj15dOY+VZbnRcoZ5UjO/XU29nbKk8m+BUIEJ0QpXNB84njfoaR9GCOgNBreYgbGMaRoPRpZoBxMFQRSMijUWMyw79fo533/84b5tW/oMHfr9Jx/2HjS0pLhQpvkvWwYXXpRs+/btixcvrvvmoig++eSTl1122csvv7xp06b8/HwAwHfffTdhwoQbb7zRvVpz095RXa4gLH7zk8NHk2OjIzAgFRU2UZLff/OJAf27q7Z8par9GWOqqj5xK1Fo5mvlv5qrqZdbbTliUFpGzr3zXwwNDvTxsmCAs7Lye3ZPfH/pk95elveXf7tm3faE+GhCSH5+sa+v95uvPNK7dycqMVdt5e1lpio9AsaOHjhkYE9NndNGoJ4ldseStz4bMbTP8GF9m0ZxCyHMyy+SZRwc5N8Eh9NoYiCkefkzM3IRi4IDm/QnhghmZuXu3ntk5LB+FgstjFTpUOV0rf1zQ8cO7eLiohovK2x99XbKclHAUqFglRXxroWm8m5lEAJ2bvwPQiTLVAlis1pLiwohPI8iCctyl159s9JSf/h0WVlJcdrJE7cvWLRsyYstKGjmQrR3DMMIgrBw4cK8vLx6HSw3N3fhwoVffvnlwoULH3jgAdXa+9xzzw0cOLB9+/bNU3tXWZJIlq+9euLjj92BRbGs3Dr3rqc+/PiHvr27MBwrOF0Op4vjWKPRgJXiS4QQjAnHc2rpYsRQd0KrjRYVNhkNDMuogy7DIEKAzeYggJhNRkVXfEaqay+z6dUXHhw4oBfBeOeug7fc9dTf/26ZOWOCIEiTxg977eUFMsY5OQXPvPj+w48v+WbFy8FhwZ5bSTRlMVGDVzTZro2gzEbEn35dExocMHxEfwDOEO8YjgUsSzu0SJ1iqQqEZahxv6qUBcOyag7GSm2NGvmkrKze+ACqxXkU9QnLYEkGhCAd/+2Pf5WVVSx64i4iSi0xnyJVEVEF5JkQcjb5mN7SLEdEsWbFMNrIBJzOf9/yQQyTlp455/ZFPt6WZe/8LyDAt7ElKs9DHzx88sln3/7pmze9fbzUVkUIlVdYn3np/Xtvvza+fTvQmCdTT72dIuQpZWcxaXl3QasEKgqU3Vs2pKecoDV76BNMKisthueTNFQFzfSb5j50w9WLH3/46rl3xCS0b1meThdSlEyn061bt27Hjh1ms9kdQlxraLH6oPfMsvbVV1/NnTv3qquuWrJkSUZGBgDg5MmTy5Yte/XVV90HapaqJqjT8XqLEbhEo4+lR9cO23YclGR5+86Dz7zwXvKpTC+Lcd7NM265cSqn49eu3br6n82dOsT+/NvauTdNGzdu2OtvfPLV96sddme/Pp0XPXp7+4QYAkBxSdlLiz/+4++NBONxYwcvnD/X38/Xc2iEEBoNenpQGXfr2iEo0D81LUtNtcNxrMFoAIQkdIx77sm7L59218ZNe66aNbFqK4PeYgJKRQr3aK3RduA5TrGWngHDMCdPpB5NOsVxbPeuHUJDAx12Z+qJ7IiwIJPJqPQUkpycZrGYAgJ8EUIZmbkHDx1nENOze2JQsD+WcVZ2nihKkREhEEKn05WemRMZHmLQ61KOp+7cfcjlEg7uP9ouJsJo0De/+/dcQAiKikqLSkqVe0vVslOMRkNocEBNewJiUH5+8aate0cM7e3r413tYtev324w6Pv16dp67juE/tu4q7S0oqCgeOfuQ5dfPsItUdFuxnEAQSBjKuxiQgVljgUMAlit5Vm1JkKAV9bEhAiiWn+TGlgxAdSZGAJRwpKMeA4wDK1SLIiVrsYM0ut1dJpq0DOSBCQJYDruKguZ6lMXtbZUA5nP6qu3o2+UNQkgApYMDN8gp6Fx0RUswZz75l8152ZRkBFCpYWFd86YjN11ys6OJEnxiXFjr5i+9tefJ8+6XumQLenJVj/tnXq/SZLUp0+fP//80zNDzHnFOxVZlhMTE/38/FasWFFWVqZ4tkkJCQnNP++dKIqC3YEFyV7s3HcgqV10mCzjz7/+tXv3xAUL5u3aeeDlJR937hg3dNTArOyCz7/6ddoVYyaOH9apc8L6ddu+/Pb3x+bPCwrw/fLb37ftPNAhMVYWpZcWL9+0de9zT97DsOjlJR+/8OpHLz37IEtVelUBHDQGWRDsToLJsaSUvLzCmJgIulTNhKz+HC4hKMg/MND32IlT9EGpxFoUl5SV5BWKggghNFuMPNes3T81mgDEMqv/3PDoU2/JouQUhIiwkA/feTIiLPip5965YuLIa2dPBgRkZmXd/8jL8++bMyw8ZP2/Wx598o2KCqss4/DwoCUvzO/Rr9sXX/+akZn3+isLOJ5LS8+5/5GXX3vx4Q7tY195/eOfVq1hGSY9I/fDt5/q1j2xBRW7g5A+c75b+dd7y76lFSqVQCWOZQkhA/p1f+f1hazy/oxNGCY1NfPx/731zYqX/f183Up3NbzuvWXfhYUG9u/XnVYybx2xh07hn3Vbr5kxIS09+5+1WyeMG6bOwOmE4WTaii9/ScvI6dalw43XTQkM9CssLPnsq1X7DiSFhwXdfP3UuNhIJakEm5mZ89mXvyadSO3UMXbO9VODgvxtVttfv20J8PPZsGlXWkbO9CvHDhnU64vl32/Zvr9nj8S5N04zm43qOTAMs2ff0aXvfWWzO2bNmDBsWN8zohYgQBD9/c/mn39bi2U8ZeLICZcNps/Ci5tjXJjezknoRwywA4s+ijeORnOAYRiWZQiGCCEaKFlXCMZg6vVzBgwfFRgcoprjPEEI8TzPcPSHxjKdWTAMgxggS82iKNSF+N6xLOvv7z948OCLOfDIkSOrLfFIFd3MUAaA95d9//ufm4Die+fj6/XUwtsNRv2SFx8y+voAhu3TLfHPfzYfOZYydMwgAEBkRPDTj98ZGBkCCNm0aTfPc50SY7t3Txx92RDJQbPGpKRkrP1vx8vPPjB6wjDFwwQ9/r+30tKyEtrHqFNPhFBZmfXWu5+hHicYF5eWDx3Ua9yYwbim0QcClmXKK2yAEJZhSksrbr37aYNehwnR6/jXX14wduzgFuQNqtHgqOWrS8us8++7acb0cUWFJbPmLPjsy1XPPf9gp45xv/y2bsa0cbxRv2HT7vIyW7fOCcV5hU89/87okf0fmz9XFKXHFr3+zEvvf/PFkvIKe2ERzU8OIBRFMTev0OEUWT3/yvMPiqIECHn1xYfMJlMLku3UyT3G5IpJI/v27sLx3NvvfXk0KfXV5x/Q6XjVZYKODTxHNUzktGYIIWTQ6ziOBXodgzGQZLnq0a/T8TxfOaGiAwnHUlFEkqsFB7QUEIOOn0hNScmcf/+cjIycFxZ/lJdXGBzsDwksKCi+4/7nOI5NaN/up1/X5BcUP7PorieffXv3vqODBvTYt//Yoyfe+OCtJwOC/TPSsm649XGASdduib/+/t+Wrfs//uAZQsjrSz8zGgztE2JKy6x33Pfc2FEDREkyGnSvv/V5aWnFk4/fwUDIMCgvv+jLb34PDQvMLyiac/uid994om/vLqfPEDGfffHzc68sGzKwJ8My9y94KTv35ptvnA5wtbLvja+3qxIBJYLLJUcY8GlZyp7WClFsWGcWiKpe6VVdeMYSRT7DGAQEBQeGhKgOCdUKPhUXFuzbsQ0xDMayt69fVGzCyaOHt61fM/bK6YEhodQW3OJ877Zs2eLtTU0SVLuupKnz/Ku+qbbEc2GtW7EsW1hY2Ey1d0q3GDG87zVXT8SipNPxXTvHR0eFEUwOHj756ee/FBQWO13C0WMpLKuEAANiMOh5niNUkoOjRwz45rvVV81+ICI8pHevzg/cfV14THhBYXFuXuHLr3289P2vIIBlFdYKq728wqqkX1GOSYjBoLvpuimJHeOwJPv6evXu0cnby1wzcg0CasowmQwAQhljLy/TwvnzenTvKIkSQjAmOpw6SLUWaIdRzI6qm2PNFai1CCJPkzT1GENVcwZCzrZhK0ZRQ4BZsye7bI6C/CKHS4iKCCkpKQeYTBg75PfVG04mp3XsGPfXmi3Dh/bxCfZf9++WktLy62dNNntZAIQ3zJ5y2z3PnErOYFk6NVX3Cem4y6hzMS+LWa/XQQD8/Hyx3LhVFBsDQkhYaFB4eDDQ8RGrQvLyS3r37KQzGuh9hYkoiN9/+/va/3bo9bqpU0aPGUlragNIe9qx46lffbu6oLB4ysSRE8cPPWOnygpbt+39+rvVdrtj3GWDr5g4iuoPWlrjAITWbdgRERHSvVtiRHgwx7Hbduy/8sqxAONTaVm5eYVff/pKl769rfk5uXlF5eUVO3cfmn//nJnXzwC28iPHUuhziYCvv19t1Ou//2KJMSC0MOPUxGl3rv5r4+Xjh8kynnDZkPsX3CqWVUybdX9Rcdl3ny9mLOZXnn/n9z833FtyrX9wACaAY9kFD87pN6w/sNvvuO/Zj1f81LVzPFI7H8PkZuV9/NnPCx+eO+f26wGAH7376aef/zJx3LALS24AL05vp34rEqlEtGmJUZoDEEKD0cR5mLBqLlGTpxiMJrd2ic7fTGZVGqFDCa5UPOn0el6nU9cxmszHDuxbcPO16sAyePRlj7/2zs5N/704/76wqJgxU6aIgtySxDt1yPxOoS6bVKvsdu6vpGbsjEwI6dGtw9QZk4AkUPlNlAEEScdS7n7whXFjB187a6LgEp545m0sV9lVPczTEVGhP3/31sbNu3fsOfz9j3+VlpV/8M7/eI7zspjmXH9lu3YRWJY5jrNYTBHhQbhK80EU3du4MYN6De4LaA70SocV9VvqIqQqOxkmLzO3oKC4Y4d2QEmuzTFM545xPfp1q/S9a/wUfU0Gw3GSIGRm5SKEwkKDGI711Eoq3u5scWFxaWlFgL+vl68XVtz8s3PyrVa7+qTV63QR4cEMg5omn0IzQe0qK1f+tfS9LxFidDx35FjyFRNHAknu2jkhMiLk37XbdHo+6XjqHXOvBogpLi5DEOl4nrpYIWjQ6zEmJaXlZ6uweNpJo8X2NPUJzjD0ZqGpayWZV24chmWWffrjsk9XDhnYs6iodN5d/3vn9ccnXjkGAlhhtX/+1W/hYUE2m+PO+5974el7r5s95bSbP8us+mntI4ve6Nmtg7e35cln3jlxMu3Rh+cq0gNoKSCE7BX2f9Zus5iN6zbulAVRp+NX/7Vp8uUjGIaJjgr19/e95Y4nx48b0qdn51HD+3E6vke3jouefWf7roO9enQcPWKAwWgQXa59+48Jorh8xUpJok9Oq82+72DS+LFDWJYNDQkEgsBxTEx0GMGYDqguIa5dpCjJQpX3sI+PJSjQDzgdgGWGDu715ttflJRUVPrMMygtPTsrO/9Ecvobr74HAUxNzz6VlpWVnRcaEQLqLd7Bi9HbOdTlWLTLYq6rTAucveRgjE0Wyzs//M5ynCpsYYwtPj7vrfzDvYR6XgnyxGtmj5s+U0efdfRREN+py0e//cPr9O51qD4LocdefUvNlQYAmPfwYzfe+6A7zIjlWI5nO3Tt0aVXn4jods3hWVgP8Q5CaLFYXC6X29/O/VVNPWd9vyKkMsaT5/nmaJ+lvncSEJyyiybJUew1fEZmTmlpxQ2zJrfvnphxPFUQaYThmQ9viBDctnVvfkHRlImjxkwa7W0x/fzbWqfNER0dHhjgV1JWPmtQTwDgjq179u0/Ftcu0vOIhBCnSwAup9va5W4ZWSb0fAAoLS59/tVl3l7mwQN6qkMLqTxVsWXZyM4LwzD/bdjx2lsrMrPyVK3k/Pvn9OvbVQ1louOQw/nG28v/+PM/u8NpMZvm3jT9ulmTRFF85oX3/tu8m1N6F8ey/ft1W/TobSEhAU0W/XdJoF7nOr5SvUZATlbuK699PGPaZfNunqnn2XsfUsL7ITRazKNH9l+/YZdTEEJDA7t0jgeS5OfnLcuySxCoLzwEDqcLQuDv50XzQinOJXTvSty3J1SZx3OgyiO+dYAledjg3lMmjojq0BFI9tnXPvjPmi0Tp4xWrpDcMXfGuCvGAFH83/+WfvL5L5MmDPeymNXe6KywffjxDzfMmvTYU/cBwK36/uennnvnmqsmxLaLaEFTC8gyJ06m7T+YBCHcs/8ohLC0tKKwsDQjKzcmOjw4OPDjd5/+/Jvftm7fv+zjH66YNGrxS/NfeeHBL7/+fe1/21f+8u9nX/760btPh4UGSjKV1YpLyiVRovrgWVMG9e8u0wGw0kVJNZypeQdU/Vm1MaCyUxHCIKQqGqpWoO6SkixXWG0sy2BMfLwtj8+fFxYaROpvtVAM9US+cL0dzYqiVq3IcBQjWhSq9VhOWihQ0dV51oetuUTV3nGczm2fVbV3NeerOr3e3Rt5nU796EYUxb1bNl4+Y3Z8x07N4Tavq3gnSVJ0dHRycrJ6a1Wl/6h87/nX86N7Sa0La24ry7KXlxfLss1Nk+d0uoQz3SoJlju0jwkJCbj+loW9e3a02R0+3paPPv1x5PC+CEKHo1IIhhAWFpU+vPC1Dz76ITwieMPGXfNumm40Gkxm0123XvPY/95au367yWjcvG3vHbfMZJjTzzSMsd3hVJ6A1ZEJ/ur71fsOJGGCi4rL/P19Xn/pYWpaoraks27VomE4dt367bfe/fSo4f3uvfNaSZQ/+2rVTbc+sWLZ8337dsXUIUp65sX3flq15sF7bujeNXHTlj3/e/5dSZJmzZxwKi1r6KBed942S5bknNyCRxa97vO+5fmn7gWtF0LwieT03Vv3qtrNdjERWMYulyjLxCUIJ0+mnkjO8PPzKigoCgwKGDd68Bdf/37gUNJ9d13v5eNFRKl71w4hIQHLPvnh3ruul0Tpw09+6NwpoV1sVFRU6Lc//rlh8+74hJh/122rqLCenokRkJmdd3Df0bjYSL2Obz0SHoSJibFbt+1b/fdmp8uVlZXn7+ulTuFMRkNERDCwOwGDhg3u/eOqf3NzC318vFTlekFB8cnk9HYx4W8tWUYwycsvzM4tOJmcHhsX1aiJPBoYQv5dvy08LOj7L5aYTEYIQUZm7vTZD27Zui8mNqq0qAQi+NT/7gWA/PvnxgcfffXkyVQvb6+775h1973Xp59Mnzzj7j37jkTGjouJCjMa9E89eTedMIjS0UPHI8ND7A5HXXqJEqYtiJIMeB4Qknwqk+rmvcw0+ZTi1xgc5B8U6Ddl0sixE0cDgMtzC3PzCoOD/HE9VXeqfCkB2UXEC9XbKR9l0Y6FAqHC7RKicWkhNZLU1LakelRsrbaIajqp6g86Aq+59S69gTpKNQctfT20dwghHx8f0CQ0n+GBEKLTcf97/E5/P2/sYQrEkhwZHvrB0id/+Okfm80+++qJkREh+w4c8/P1Hja4d1hYkNGoV6RWMGnCsOAgv99Wb6iosD276O6JE4YpIcTSjGmXhYQE/LVmiyhKb77yyJhRA6lpQDXpyjg2JuL9Nxcltm/n6Tmnfvvg3TdcOXEUdSuB0NfHq2f3jqFhgbJIEzbWulVLR6kS6Hr3w2+GDu713puLaDIFCEcM63PNjQs+/Pj7Xj06Mjx3+GDSz7+uffHp+6fPvBxI0sBBPaOjwvR6XsY0vi8qMrRH367UWs0wGzfv2rn7kEDtQVzz6WYNCETIaNB//NnPX39PY9sBAE8/fufs66ZcP2vSa0s///Hnv4OD/MeMGvDF17/9u3brrGsmt4uJSEyI/u2vtNHD+6seGH5+Pk8vvPOhxxavXb9DluXgIP83XnmE5djJE4b/9Mua/7N3FvBRXFsYv3dkfbNxJ0YSQkgIGtzdKe5OKU6RUqFAKe7SUqRQoFDcW9ytuFuAGHHdZLNZGbvvNzuQBmkfEtmE+b88upmdmZ3dzM5899xzvjNw2PduLo4Vypd1dnLAMf4qBjFYvVqFKT+sGD1h9vpfZvj5eZUO1ze+aJRmfpy3+vTZKzWqh6lVCpPZ/GJO0MILv0CEMN7vA+QbVkGW5ViOy801ZmZmMwwrlUonjx8cUNYblRxth2EwR6c/+NeZRvXDXSzBMAhBoL9P5bCgvQdPdu/WKuJp7Kjxs1o1q1ujesWDh87w9RYQjhjzo6enS/vWje7efwIA9HB3BgB07dR84LDvx0+Y07hh+N9X7p46e3XdLz+4ODuYTGZ+xsMClS/5hGVZk+nlNBFAiclpP6/a2qB+tedxSb9u2D1p3EDetp3j/thxKCjILyiobJOGNb6esjQuLlmhkG/YvC+4nN/8WeMx7B8XgnftJ4s4k6DtWL63mNGi2N4nbvdiclbQfB9e2SFSMoF8XJAv97aSO8t7yLtPE6H+v35D/s73Wv0px3HBwf5TgwN4nW7xc/L290ZmCkLoVdaL42ex+dVYlqseHla9ekXB4ekf31cI6jcIr1+/Oj9mwLE8nyfhRe3sNC3bNMqfb5dHeI2w8DpV8w6Cd521HNh/b1VywSBMSEx5+ChqzoyxmIQU5selSkWHto2Wr9ySkZHl7OFy++5juUxWv05VZKaE996tcwuAwZxs/Yt6C4wEJAIcytTm5FVElj74zBKV4q89K2mGyavbksllkGHHjerbslnd+MSU0GB/N1enkcN6kATBsQwuk7q7uzZpWNOPTwPlPzqWYWrXrnxk/6pbdx8TBF4lrLxCKWcp2tnJftumBbfuPJaQeMWQchxCEpIQcgD69mzXqX1TDiGVUl46tJ3gqZsUl3Tgz9PTvxvRqWd7wDFJyem8uLM0naQo2mymgJT3NouKSVAq5Q52GmF+EccxFyd7N1fHxg1q9BncAwDGmJEV+zzR05M3HgclBn4qtmJoYKcOTfNqlTCCGNi3419Hzumy9VUqB08Y03/dhj3HTl5ydXacMWVkSGi57yYNWfzT5lnzVyuV8u++Glo5rDxnMlevFrp43lcrVv7x95U7tnY23301tFw5vxxdToumdXz4GjX+UwuvFiLIZcRxXmXcWjarK5NJEcu5ODkM7t/Jx8tt1doduQbjF0O6D+jTQSqVfD6oy4G/zqSnZRIhgd9OGiqRkL9t2sshVKVS8Pgx/XAcyzPr/r8IfQgQRBzvK8VnHQjpdyaWNrBUXtwub+6VYmkzYv8J7+VpPksMz8jRFMsYGDPNMdCSzFfIfyYRKwJZh7ATEOXdO5GXcvf6couu4gOxwh0t78b26ryAcAvkVzO/Eor7Z/kbN0T+Ymoyv/1FKVoom3iT/9iqBIPBjMxsM0XZqJX/XCoR0tio9LlGXU6uM0IpqZlyuUQmk+QF2FmWxRDGm9RCePDQ2WxdLgQgKzvn7Plr078bQUolpdUsBkKoVFhmB16NTEAIgsuXDa7gz+cWIV4FQgCzsnP+OnroryNnJ47tT8okefmaLMPa2Cgb1g8XmvMICY58gbZcVo8fWvAFyPmvZRiG2dioBG9kUJKhaYYXbQIIqVQKOzvNHzsOkVIyJjr+UUSUmaLu3byPYTArW7/q1x0tYhK1mVlLfv69a6cWTi6OfG0TSRw5frFp41qftWsyb/E6XY7e1dVxy7Y/lUrFmhXTcLzEFM/yZWEezsuXT+UTeV/OBnAM06RxrSbN63GW6FqP7m06tG2Una13tLclJCTLMHXrVatZIyw9I8tGrVSoeZccy1wF27xZ3Ub1q2dmZtvZ2UjkMpaibdSqmT9+mec1M2Rwd76jgJlCDFOrZqVa9apxJoqj6UoVgypVCwV836C2LMvaOtgKFjP9+nbsN6gLMFMsRatUih+mjf5yVF+W4xwc7PjT832ipIKXNQFwOSbBMKmakLGIpTmWQgzNsQxizRxjYCk9Y8ykDOl0TjpiEcsfAwc4GnE0YgysOZc1Gy1a0MQyOtqYQemNLK0gJCXkr12q4POAsXy/832n+CEEQfLu2pSZT/oEnwCivCsA3vEL/G+rid///8+/lNvAlz1n3vwQheJi4UmdTp+QkvE8Ou7mnUdrf5rerUvL0jR5/SaCxdNbe+vlpXpbzGaxrOycPw+fa1i/eusW9dCrYxJeqHHMW/b8tuDcW9JQSiCI48JCy6nVKkvhCB+xcnCwmzFl5JxFv86Z/2uNaiGzpo3evO2v1JT0sr5lendvHVTOd9MfBzIyszq2bzpxbH/+hoLBfr3a/bx6W+zzxBGfd8cwuG3XYYZhg8uXnTR2gFQmfd+EsOKFPwcsPp354dXYy6ERS9EyqVTuwtcbClFblvdjwlwtSjd/dRdL0ziOu7g4Io4TlvMr5BuLstQ/Q2heTb78hvInrZF/rFLxyX//jEDyjXL5YS3FF9haRiPMx5yJkHchBQQkpRj5oodJXniP13N8fJa1xBtpjjVwVA5jzKRzk03Z8SZtKpVDcbSeoTIpvZtMY+ZoJZB+IkrCeuBbsScl5ur1L/u5I1IicXJ1k0gkEffuadPTKtesQ5TSzJzXEOWdiLWDOOToYCeVSrOyc/5xkoKYVqtTqRQaizebk6OdyUSbzLRKxRfeCbouz8qyT4+2X0+dkPDsScfuYzO12RiBl7Ky4g+DZVhPD5f1q2bI5XJey5SctLBCgqOZHj3aAAxjXyZ+cSzboEH1GtVDdTm5Tg62kMDrN6nFVwdzaN78yYBlu3VuaTab7R3s+JioZfqyYYMaDZvX5Vts0czYsf0H9vvMbKacnOwtIYSSpO3ekTenm4UiuTfX/LflH/xCr1GAtYov9ZxgRfAPEEACQgLys/NyHGig3B3YWhThC68qQfYJBRkqQip2ni1i+KJ1g2HlnBnXL5zls6stf0V3L5/vFv/k4+99dO/O25cvLtmyWy2V5o1mX/aZ4NOvwKcp74o4V0kwSREReek66xQaErBjz7E2LeuTfF0SyM3W7dp3vEZ4RXsHDeC4ymHlDQbjhUs3Puvamm9MCeHqNVsZmunfuwOfJkXTgNJ7eLr17Nr61417Wreo5+PjWWpSxD4GvnenVPKRAY/SxJu6n+WdzElnmT0v3/IFroSwlkIuUypk+Sf6+fPq5anFmmm1SmmjVn2CZtqlFaGa5sXjPP2X728LAZTjEgUuZYu9a8EnCcdxCTHR1erU6/n5CJqikcXNxN7JyWzmBo2bRJnHKFVqjmVxAue7JePg6YPIo3t2Vq1Tv2qd2hAChuHj9hYfO5yf8WBYgrR0rOFVEKBpyyQvgRMk/5dmGcBYlggvTZCWhmcQsDRgmOL/yr+TiuI4Likp6eHDh/QbPdcKA0slvMloNBb7pyNiDSCEJBLJ6C96Dh4xrd/Q7zq1b8owzLZdRxISU+f+OA7DMI5mQkICPmvfZPKUJZHR8eXL+f595c62nUemfvMFhmNm3tPGUnrCcT26ttzw+971v++bPmWE0DcTlCL4BjA4ZqnYe4/3lZct96LFO8u3XX2/F5WQpaya520f0dtH9v/3XZfij0XkrVgmDF4P+4kUJTiBu5Xxqli9El/p/iIvhYMQxjx9kp6SXKtxM4lEcv/69QPbfjcZczPT0s0mY1ClSjlZWWePHKper5GzmyvLchdPHpdK5ZVr1r544rhUJgcARD560KT9Z06uzjf//vvQjq1Gg6FusxaN23TACQJZMoUunTxxbN8uhmYatmpTt1krUlLMFlH/X95hGObs7HzixInz58+DokL4UFQq3iP0k4L3jAXIGhwRrQq+lrNW5d/XzVm64velP/8OIQws6z1r2uiQkAAh6ZskiGnffuHsbP/noXO79x63tbVZOGdCx3ZNjEZT4wY1AgK8+WwZjnN3c/560tCbtx/m6nKVLxuWlw4gBrN1OZmZOjdXR+n7O89BCI0m86kj58qX8y1b1usdJ2ohhqWlZV69ca9meJi9Hd+o8EMPX8RaL0eWK1Le3GqJKJ0pfSM3kfcFwzCL/zr/mGP5RgB8k8DTJ25fvli7cbO7169MHTHEr1yQvZNLzNOIjn0GNGjR8umDh+sWz/P08XMr48ay8K/tW+0cHarUqnNox9anj+47ubraOTo3bN3u9KFDC7+dEBRaWa3RrPhxauyzp0Mmfk0S2Pljx+Z/PT60Wg0cx1fNnQkAbNqhI0OzVi3vpFLp/Pnzs7Kyinh+luM4Pz8/UALh47MIARzjr4zsK63EcQLnW4zzFXpMXjGaJWpC8uszzJOIKJZFAf7ekO9Z+XJl5p+VcZLgz1mEAE1/UiqQZdhqVUM2b5iXnpaJQcze0RZYKvKEZzmOk0ql478cNHxI92yd3sFeQ8qkLEVLJOR3U0YAlhM6vrMs26tn21592nMmqjTdAIRWzivXbN+45cC8H7/s2KFpXof7dwTDMF2OfsbcVWO+6O0f6PuO1rsYgT9+Ev3lV/N/XzenZo1K4nx3aQJCePvO47sPntA0g2OYu7tzjeqhGo2Nlf+VX9aJi57CnyqWtvb7t/5+78Z1SyU/qte8ddeBQ18U20EMAXDp1HF7Z+eFG3fYqOGvy1Yd2LKxx+cj4KsKR7io8rdflnHz9Jq+fLWTm4Mu27Btzcp2PfqNm/6NBIA9Ow78PGtaqy49fAL87t+46uHt++Mv61RK8PRRLEGSLFPMN+h3it6VL1++SA6mNIAQioyMVauVycnpMc8TfbzcQyoECKNJHMfj4pLu3HsCIQytEODFDxFYCPmmOjduPUxOSdfp9ItXbAqvFrp0/ldSuSw5MfXO/Sccy1UMDfTwdOVoBmLY06cxjx5HyWTSapWD7e1tS2Wy9r8hWDc7OtjxE618isQrz/LBBTMlk0nlcksdX16F3atOMaWyqALDscSk1JNnLisVsn0HT7ZpVR9/6enKjygsFzZA4Hzi98tZ1BfjBMhfvQS/bj4PTyblu5m93CovpYwfaWD8ry8mcAlLMgpfPUDXqF7x4qnfbTVqlmF4f0E+nwUClkM0bZ2RHuGSXZrEfWEAIX9Sbd15aOOWA+WD/CAAmVodQWDzfhzfpHHN/ENTwZ//tc/zteWvfeb5o2sveme/uvJr+3x5n339hSxLkVDeKpxsOEkcPXbhcUT0yGE93svWWKQUwf/RXdw8wsJr8IkmHOfh7fPPkxaRp7bRGPT6xLhY2sUpKe65RCYjcF4LvXVUAAH09g90cHGgaZCenPw86qmnj++ahcsRQhkpKWlJic8jn/kF+VWoXH3PpvXj+3QNC69ZvV6DoIqVQXEjVjAUvM39jDmrzWYqNS0jJTXDaDR/M2nI0IGdEcQvXrox6dtFWdk5NMPa22mWLZhco2YllqIXLN2wftNepUKemprZqGH4NxOHSOXyW7cejJk4Ny1dCyGwrPx1tZphJ46cn/z9EoqijUZTSHDAkvmTfXw8SpbVwkfyf4vvPtFUJwy7ceMBjuHfTByyYMlvsc8T/P28hcHD+Ys3DAZzZmbW0RMXA/19hgzo5OzswLLs8RMX9+w/SVFUo/rhXTs1/6d5IuTdPS5cuKnXG5o3qQ0AwjD8zr2ImNiEVs3rcgjt2nHo5OkrSqWsV7fWNWpUysrSnjl/rXHDGk7ODs+exGzcsj82LqliSLn+fdo72Nta1f0VwyAkST7nmUO4hOSjv3n6lcARP3v/sSdPQe3HSqBppm7tyut/+ZEgsLTM7EVLN0z4ZuG+7cu8vdwRQhiBGw1GmmLkcikpkeRF9XCCYGjaYDThOK5UyPmxFh8MRnnzP5YzE7NoOB4Mw3JzjRiOKRR8hlNurpFjOaVSzqfVcpzQ3Tg314gAEgzJhSuA0EOMwPltea9HpZzPv0Do4ePIS3/fHjqwi1RKFuuHJ1JM8GMArkbDxqOnTBbMdvgCiJc9RATDo+Ydu1w4fnR0tw4ae/uM1JRRU35Qqnn3gPwKL7/U489gVuhJzHIsazTkZmkzWYYhZdLB4yd7lQ2gzVztJs1+/GX9kd3bj+7dtennpWOnze7Qu68lelhsplGl07u/WEEJiSksy/6xYf71SzvHje67ePmmiCcxEIParJx+vdtfv7j9+vltLs4O6zbuhQg9ehy9YfP+uTPGXbm8c+PamfcfPk1P15qMxhlzVoWFBF4598fV89sqhwX9OHd1dnrW5m1/1q5Z+faV3RdP/t6qRd3ifqciVgEfC2GYIycuVq4U1LxJbVtb9akzVwHOezVgGG/p/NV3i0+fvapSKdb/vvfrqUtZxJ29cH3C1wtNZgrH8Skzflr+yx+Iv9sKERK+cD0xKfXHuavT0jIhhrMM89OqrRcu3SRl0rXrd81duE6tUqSnZ3313ZKnT2ISk9PmLFyXkpKRmZE1fNzMG7cf2TnY7T14cv6S3wR9CayntR1F7993fNT42f2GfDtvwdqoyDg+3GghLi4pU5v98UdbUPuxHgiCUCjkCoXC27fM95M/l8kkfx05C0mC47htOw41bjWkev0eHbuPvXDhBh/xtQR6Hz561nvQ1+H1etZu1Gf5ys0sQlt3HFry0+8Wq0U8Lj5p/NcLomPicZn07v2nE75ZOHPemnrN+tdp3HfHriMH/jzdvO3QsBqdv566JDs7ByOITG325ClLajbqXbNBrwnfLEjPyLSkVWF37z+d9O2iuYvWN2gxsGqd7r+s2c6w7JKlGxYt3Xj24o12XUfduPVQOCSRTxCWYcxmYDaxZhPL5HM55a1SAchIS3Ur49V3xJjeX4xes/9Y625dOZYfllA0ZTDkkhKAE5jJaHhtnwgBGzt7J1f3GvUbfz1r+uS5MweP+6pe89Zunp4cB1ISEgIrVJy56pdtZ/9u3aXH6UMHWIZl+EkMLr/JfFEiyrsCBiFAkkTd2lVcPVzkClm3z5rb2Kiu3XwAAGjbtvHg/p202pz0jCw/X8+sbB3HcnqDge8V6+spU6rL+pWhKDpblxMdHf8sKq5JwxqpqRkpyem1alR69DjyeVySo6PdjVsP/jx0xmSmhg3t4ct3kfqEQncibwVCmJSUfv/Bs5bN6mrc3BvWDz919qrJEtIQqj493J1/WvLdT6tmz5o+5vK1u4nxKf5+XpvXz/lt0+I16xcPG9z15OnLxpxcvnGqAIdq16iEQfj3lTtQKomOTbj34EnrFvUAh85futmuTYPlv8zYtn3Zul9+8CjjKszTYTgWHRufnJI+f+b4ZStmHt2/auiAztaT4S58FCtWbf3yq/ksy/n6eBz483TPAV/duRuBkySGYQuXbjh5+jIml/HSgST4EmSSwC0S2fLri+skjuP5FQOOYbhMistlwjr59yO86L9tyzttEfxT/Ktbph5xiYTfj4S0NmkoRDt4zJStrY2Pt/uDR1EAguMn//5h9i/du7RcuWJauUDfL7+e/+xpLCYh09K1E75ZgGPYiqXfjRnRa+MfBy9evPEsKvbGzYf8yQChTpd75sL1bJ0e4Fh6pnbH7qMsy86f91WLprXHTpp36Mj5KV8P+/6bYdt2Hj14+CyAYO7CdRf+vjlz6ui5M7+8ev3+7AW/0gwLcNyy7RGDwTR39sQ+PdvOXbL+6rV79RvVCK8W4uvt0a93ew9351ITRhV5LyizmXlb8jFD05SZwnD82cMHN/++kJyYEBv59MjubRePn2QY1snVzdnVbd2iuX9t37PllxUPbl0Xzh+KMtM0HwZEiLOzt2/ctuO6xXPXLl355/Y9kwf3WbtoNt8hCceO7N0xsmu7bWvWH92z+87Vy2WDyuuytNNHf75+yfziSgYVJ2cLCT6MCziEE4RMJs3K0gGCOHH43MLlv5lNtFwujYyKqxRWnuO4CuX9q1Yq//X3Sxs1CD919oqvt0fFsKCnEdEZGVnLftkil0mFdJMKwf5SqWTs8N6ZGVlTZvyUkaGtX6fqvFkTvMq4iQrvEwcS+MXLtzK12ampmSePnSZJ4s69iKfPYkLDyvMFYwi5uTqSBA4ok7eXO0kSeoOxfLB/5s3s9as2GwzGu/efcBxn6ez+8gLEsh4erjXDw/46eq79Z03PXbxho1ZVq1IBYrB2zUpLVmzKyMiqXKl804Y11bZq4crFsZx3GXcHB7vBw6e2bFG3WuUKjepXx3HcSu6vGIYlJaft2H1k0pcDh4/sA1h2Qkb2rn3HlEq52Wx+9Cjy5p1HSqWicuVIe406U5vt4e4cF59so1bZ29vERMa6ODvYqPkq/oTEFJpmyni6CnItK1t38/Yjvd5QLsDHz6/Mg4fPhP1UqvTMx9MVARTzLNbF5fVtIYTJKRkmk9nRwTY2LqmMp5tCLr1+5XZScpqHu3PlsPLWI4vfBMfxXIORNpg27/irZdM6474cADC8drXQz3qO233gxOTvRly+dicxKW3Nimll/H0ATTduWNPF2fHE6ctCTqegekmCeJmNB9xcHQf06eAbHBgS6Hvw0LkmjWq06tgCmE1HT1x68PBZ1LPYU2evzvvxyyat6luqw7Hvpi+PjU0IqOCPEHB1cRzYr4NfcLk61UP/OnLu4ePIz0cNqlrlvPRhZP++HfmJtFLdnEbkTYQc9xoNGvv4B7yW+8txyL98BcFS19HV1dnN/fHd2xACmqJ3rFvVb/T4PsNHjPth7qp5P65bsrByrTqd+w1x9uCTECrXrGOj4fNMhKKdHkOHYzh2eOc2hmH8g4MHjJnEd6PhUMfe/Q05OXs2rUcIhVYL7z1sNJ+I/+ihXpfNT/sKBZHWJu+ePHmyf//+gQMHOjo6FskhlRZIAnCI5Vij0eTgYEvlGuYtWVelUvA3k4YoFfIf56yKeBqLYZhSKa9Tq/LhYxceRUTVr1O1X6/2Ds6O8c+TnJ3sZk0bXb1aKMvwyaE0zSiUcgLH16+dFReXFB0d/+VX8/fsO/7l2P7/Ysgl8kkAIWQo+uSZK4nJ6bMWrOGTjwBKTEq78PctXt6BvO4diM9C53jzJxzHNm85sOznzVWrVHBzcdTrDa/PHSAEMdiqed3vZ6x49jj65OkrDetXV9uoOZb7Ykg3dzeng4fO/rxq68pV235b8yNhKe7mEOfo6rh+5Q+/b/vz7yt31q7f1b5No4VzJioVMispsBAy+HU5uYimIUHYOtsPGdodcFxcbOLkKUuuXr8f8TQ2MjquR5dWa9bv9PfzOn/p5hdDu3Vo02jC1wu+HN2vSaNaAIANm/enpWsXzp5AkER8fPLoCXMfPHxK8P6o5NCBnQ8dPS/sJ+JpzNqfppkpevzXC8aPeX1bXCLZd/DU4aPnHRxsb915tHT+5JNnrmzdcUgml5mM5oH9Ok4Y258kCav0xOV1vEIto2nmeWxS9coV+PGDiZJISFdn+6joeEAziYmpcplUrVYho4njOF9v9xfuFG/F4hDL3/Yos9C2mCAsPUFpxsZGxXEoLV2bkpo+b/H6Fav+gABm5+hz9AZdjh5ATNgWIgDMJkvunYKmWYBommZYlqWMJtEb/xOEb0EmlY787juO5b0l8j/FMlzTDh0JAmRl5GxYtrBDr/69B/ZkAaARmDPxm2vnznQZMDSsevUlv+/U63S2Do5SGWRZQFNs/9GjeacKit8bx3ESqXTgmHGd+g2izGZ7J6e8bjS29g6jp07vM3Isx7B2To4QgqwMrbuXd91mrSQSMv8EcZHx/78AOp3u2bNnJtPrnQdF3oqQL3z+4s3mTeuobVS/b95vMJjCq4UyfD2EmWMRRTPJUXH3HjzV6XKTktMoit6649DwoT2CgnxxjE+WAhRV1t+7XIDPrxv2uro5SSSSLVv/zM01fDNxyA+zVjo62vXo2rqMp6uNjeqf2TSRTxWMwKOexl69fn/lkm/btW3MMnzHz+9/WHHw0NmBfTvKLLOEr6wPodFo2rHnaLMmtWbP/xoA/Oclaw/8dZogcLOZd3gnSQLgODJT1atUsLO1Wf/73ti4pC9H9wMY5CgmISGlfZtG3Xq0M+n0HbuPPXnmiqX8gleZOVodxOC06WMAQCeOnP/y6wVxccnlg8u+2bi26OE4ztnJoV+vdrMW/Hrh0o3mTWpXrVyhapVgqYR0c3X8bfWP3ftO7NSx6dChPS5duH7n3pPGDcL371zu4uKYkpwuRNqEL3ZWtk5IrWM5bsmK341G04lDvzo62G/cvD8uIemXpVP6Dvn2sw5NhgzorFIpnj9PSkl9fVv+aCDIycm99+DJ7B/Gzps1/vCR838ePrt53Zwq1UPPn702avzsKpXKt2xZ33pKvAWHCEjgGRnpsfFJdWpVlkokEglB87UUL8pcGZazkUoAhkl4K1f+GvjCV4J3zuMrWHnfV0sFN1/g8ur+81pAvJKDbnlEELharRzYt6OQiEKSpFqt9PRwBi+n3oTVX5bcvnLMoOSDYRgpKaACEYRomrGSaHphYza9XUsxNMsyECcIqVT2+8qlyfHPJRJpakrS2cN/dR8yjCRJmuEIicTeyYnjOJPxxWdFmV/ZG0KIolilSq1S2+TvRsMnMFDAxtYOWvrj4RhMeB5TvX7DVl26F5eF2f+Xd1WrVq1UqRJB8Lm0NE1LJJLMzEyj0ejm5objuE6ny87OdnJykuVV3lnef1pamtlsfm15Tk4Oy7Lx8fE//fTTZ5991qJFC5Zlk5KS+BbUrq55SSo0TScnJ0MIhZcAJQqE+GRkgsAnfbsoKTktU6ub+s0Xfr6eAIDB/T/7Yfaqs+ev2tqqGzessWPPsV17jw8d3NXR0W7iNwtVKjkCQKmQ9+/d/ssx/b7/+osRX87q0GU0SfJf73k/jpPKZRVDyv04d9XvWw7SDOPj7dGxbWOrHOKLFCXw9LmrDMM0qFddIZchjoWkpGWLunsOnLz74Gl4jUoURZvzdV43WqIanm4uJ09f2fXHgZyc3NPnrj2Nen7i1OU6NSsDjvtjx6Ggcr4VggPUGnWjBuGz5q9t2rhWcJAfYDmG5eYuWpecnN6vT4ecHH1CIp/DhxAymswYhBFPYoaP+7FVs7o1qlc8eOiMs5O9vb2m6Ocj3oqgNoYN6RYcVPbAX6fX/rZ71vy1XT5rNuP7kfb2tvZ2apIkVEqlyk6NEPBwd+7WuYW3bxkgeG3geJ5W4LPlLDl2GZlZ124+6NernZefFzJTnw/qjBBieGsYXKVUqu1sgMXy6s1t844nJCSwU4dmEpnk3MXroSEBDg520c+eu7o6Ojranrtwo2XzeoI5SLGDEOJlHEQmvWHJT5t02fqWzeviEqJK5eBLf9/O1emVGnX0k+gnT2PHjugDMBgU6JOjz71z93HDRjVpM/Xb+l2hIYH2dpqzF25qs3RObs4JSakGo/ld5BfLcl5l3J0cHbTZup61KwMAr/598/adx2V9y/zHVkKiIGMZ54CSDIZhz2Pjjh46wXHci7KnD4VDnEqtatWmmYurCyVUk36qIISkctnE2QsP79z64NYNmqacXNxGfje9Qcs2vPa1jDDeJc72b0I5L1eKZVH5sMqhVSvTVLF1J/v/8u7ixYtTp07dsmVLbm7ukCFDypcvHxUVFRcXV6VKlYYNG+7fvz8hIUGlUq1evVqwx0tLS5s6dert27dVKpXZbJ46dWrTpk0pivr5559PnDhBkuSjR4+6desWGhoaHR397bffJiYmAgB8fX1nzpzp6ekZGRn59ddfZ2RkUBTl4+OzYMECNzc3UKJgWbZOrSqdOjZ99DgyoKy3t5c7azlvBvTpUL9utWdRcYH+Xr7eHqOG9SQk5M5dR12cHO5c3c2n2UGwZ+/xxSs2derQNCQs6K89P9+5F0HTTMWQQAcHW47lundt1ahB9dt3I1RKeaWKQQqF7JPyvRN5DT7pjWEYhh0yoLOzkz1nybTDGLpapeDunVtoM3UIoaqVg/X6XKEnm6ODXeuWDezsbCaO6//9jJ8WLdvg6+05ZnjPPw+fS0pOs7VVfz6o64G/zqSnawV7lEYNwhev2NS0UU2FWslStFQqmTRu0KLlGxYv30gSRP8+Hdq1bhAXn9y2ZX2VSlkuyG/CmP7rNuw5dvKSq7PjzKmjeAcWq0l+4mdtCKJx09qNG9YwU9SFS7cGj5hapVL5QQO7Wr6dlgiQRc9BaGlOn2/A/ZoUsXRNNOfmGlRKBb/qiylvXLhx5u3nrdv+sxzwhpe0mcrW6e/cjRgzaa7lxgAlJOnp4WLpd85Pp4NihUPcoaPnm7QeAgDIytLJ5bJ5M8f7l/VGAAwd2OXzUdNbfza8QnDApcu3K4YGtm/bEJnMVSsHd2zbeMio6Y3qVY+PT0lMTtuwZmar5vVWr9/Vtc+EQH+fzMwsk8nMIY5vzcnyuSsvenghZDSa8+awzHxZt9HZ1Wnk592/mbb81JkrSoXi4uVbwwd3w3H+M82/raUDsNnSexB5uLv8vGZb+65jli/6pnw535Lr/Y7j+JPHT7/68nuECuYtNGpSf8XqRb5+3mbzJ63wOJbz8vP74uvvaJq/YOI4QZCApl+0mi3QF2ItM7rFxv+Xd2azOSMjQ7AHfPr0aWho6E8//ZSWlta9e3ej0Thz5kyFQjFgwIBdu3Z9//33AIC//vrrzp07W7Zs8fDwmDZt2vLly5s0aXLu3Llt27YtW7bM29v766+/Rgi5urqOGjVKo9GsWbOGZdlRo0YtW7ZswYIF27ZtS0tL2717N8uyAwYM2LNnz8iRI0GJwhIvoTy83Dw8XPj03pcKjONQWd8yZct68crfYuwECeLR46jb9x5HPI12c3EymEyPn0QrFXJe6tGMSimvW7uqcGMWbpMswzg52jdvVoev3HjP3qAipQ/h3jb8i568BfHLSzbHcra2NvPmT+Y7o1D0gP6fCc8imgkM8Fm06BtkMkMM2/Tr7IzMLFtbG4lUUr9xbf5uSdH9+nbsN6gLMFMsw+ISTKfTu7s7N2pQHVnONI7jAgO8V/80LTU1UyohNfYajmb8fMssXPQNMlMcx/Xo3qZD20bZ2XpHe1tCSua5ylkDLMulpGa4ujhiJCGVy5o0rlm+nF9sXFJeiIxP1cJeux4iPoTGf4URn0r7svwNIU4ukymVipycXEASOMffGAwGo7Anfj8kAcz0W7d9Ze8AEQRha6Nu1rjWkvmTBR8Zk8kskZB8CmWxwmtUlhvY97Oa4WH8xQdCtUpRqWKQl5e74G8X6O+9YfXMPftPPI9PHjeqT/s2jVQqBcdyJElOmfx55bCgy1fv1q7p1qFdo4qh5RCHNv06++BfZ6RScviQrplZOX7eHpyJqhxWfsm8yfzIxJJst2juxHIB3kKbn1Ff9CJwjKPprp81d3VxPHryEk0zy+ZPbtq4Fp8CyDD/bMuwJEnMmjbaw82ZM5q7fNbMxdmBoignRzsryfv8GAowiHv65LkBvYYtX7WwUuWKn3i2FWO5nwr5AwhxlLnEnycfKO8s7ll8lJvjOEdHx4EDBwYEBHh7e/v6+rZp0yYsLAwAULFixaSkJGH9Jk2a+Pn5paSkPHz40GAwZGRk0DQdHx/v4OBQvTpfTFeuXLn79++npaVduXKlTp06+/fvF6pdLly4wDBMSEjIxo0b582b16JFiyVLlpS40B2GwWpVKvh4ufPZKG+ELnip93IZ4hDGsoMGfBYblzBu0jwzRUtI0t3N8YfvRzq7OLxo+vlG3hIfE/408idE3pE3k7T4+QWj6c1n+ZNHWG5REs5ODvxAg2bASx3Gr2xZH4Nw46a9C5b81rBedT9fz7xxrSBBnJ3seU9gy5q8xMz3WjKpVO5i6RpiTdoOJ/DY54n9h37XpGHNPr3bqeSy85duPnkaM2xQF77HBgAsxz15GhP5JJK1RECFrRCHNDYqjUZ94M/TFcOCdFrdrduP3VwdEEL2DrZ1a1X+Y+eh8OohDo72O3cfffgocs4MPu/wydOYp48i/bzcNTbqN7fN698g5JlBkmjRrM6P81afPHO5apUKjx5Frvlt99fjB4WGliv23l8IobCw8mHVQvN+55PVXx4Vy7I+Pp7jvxzIhzkJnL9hvhwDyOWyrt1ad+3cgi+AAC+8o2vWrFQzPMwyxwj5bDyK5hjWzdXRrYwbZ6YQx8lk0qbN6/JjEst4uHp4xRcnJIT1G4TXr1+dD2XiGEfR/AdnKbnN2xbDsIaNavK9BxnG3k7TkX9pgEz8kAOUcAo2ifD61Zu9uwz8+del9RvUofmAVemUNe8IKu1v//1qi4QOWsJ3+99avkRFRS1YsMDZ2dnPzy81NZWv7GOY+vXrr1q1aurUqb6+vn/99dfw4cMtoXijVquNjOQvqQEBAc2bNwcAdOjQQa1Wb926ddy4cXZ2dvPnz69ZsyYoISC+mIv4YcpI3m/9HaalOJbz9/PauHZ2QmKqwWCUSqUe7k5Sufx9G4aKiBRs/w8EgIuT/bAh3Tq0bcR3acx3m/zvDa3zhsqxnKen6+jhvWfM+WX3/uMKuSwtI2tQ347Nm9RGDCOVSmqGh27YvC8jU9uuTUOVUvnSMpDTaGyGD+0+/usF127e9/bykEpJlUrJN73A4ejhvZ48i+ned5JSKTeZqdnTxtja2Vavxu8nKSXtp0XfaOw1b24rXDMlElJuqXpBDNO2dYPb9yJGjZ/jYK/JyMzu1KEJ73bEe+QXP/yF6N+vRYLU4+Mfr+ae8+eAmbKEnf5ZzlL0P5PNL3dpmQQ3/3Ne5esfmDcs4ZdbHvM7zKd482/L/5oXvc4bw5QuHBwcGjZs+O7J6BiGJSYmnjt37rXl0VGxA3sNW7xibsfO7SiqVLXeFnmNAi4dZ1l2yZIlgYGBixYtghCuWbNm48aNEMKMjAwbGxuaplNSUmbOnNmoUSO9Xi+cr4MHDwYA3Lt378qVKxzHHThwwNXVde3atTk5OYMHD169enUJkncCUgmJ3nlkIAhlb28PIdMGcayo7USKHYRQy+b1WvJRGT4JAJRw+HEXjnfr2rJ5k1r3Hjw1GExB5Xy9y7hZvnAchGDm1DHfTByKY5hUKmlcP1wmkwrahWXZTh2aVKlU/smz2HKBvq6Wfm5CyqObq+OW9XPvP3yWmZkdUiHAzc2JY7mZU0d/M3EIjmFyuYyl6bduy5qp4UO7fz6oi0wq4VhOKiF//H5Uv57tIqPjfL09AgN8+P1bpUp+K/92oXtz8UfqiE9chwQEBGzZskUikbz7JkePHj1//vybf6CU5NSh/UempWUMGNy7ZJ1sIgUs7ywZrEbBu9xoNOadCiaTiXkZqKcoShjvYhhma2v77Nmza9euPXv2bO3atULesdFoTElJiYuL0+v1f/31l8lkatmyZadOnX755RdnZ2dbW9sffvghMDBw4MCBt2/fPnTo0Pz58+VyeVZWVlBQEChpvG/eDD88Le6JGBGRtyUSlHhh98q3jGY0GnW9utX4oZSlvvJlG0regMNWo34RWiOJ/F9hluV8vN19fD2RxQSBd6SzPMta8syqVqkAIOT9LS3R+rz9CBOI/7athHe7IIXHHMdn+AUG+ASW8+VrGSwU5yclUhzwTU1ejcyRGPmadR/Gm8q8x1xt/tphDw8PDMPi4uKEXw0G49cTvk9LTZv09TiCwIvFlU2k+OWdm5tbu3btFAq+l3O7du0cHByEc7FFixYBAQHCOnkBNgjht99+u2jRojlz5oSGhk6cODEiIgLDsLS0NI1GU6FCBS8vr2fPno0bN27ZsmVjx45VKBTr1q1DCNWvX3/kyJE4jo8fP14qlS5duhQhVKdOnTFjxhTyJyAiIvKp8G+pq/kt194cnL1WSJt/q9dKg1+1bvvXbV9b58V8t3iH/YRJTEjKSM+E+axMCYKIiorJf6q870Rq/vWDgoKmTJkyePDgqKgoYYnJaJo1fX5aStq0Wd+p1aq8YI1IqaGwut+81mStf//+Go1m+fLlAICkpKQ2bdpMmjSpZ8+ewrOcJTf2v/fwPq/NsbkPQAEVk4uIiIiIlHogQAbchsJksGj9aAT755nT52/ZuD2/vIMAmkymjPRM4deaNWuePXv2fSdnW7VqJdzi69evf/r06cuXL/fp0yc6Ojr/ap91abfkp/kOjvZ0IeQFYRA8N2IcdHrDzVqkUOAQsJNALzkvqAqrbctrymzQoEGzZ8/u0qWLWq1OTk5u1qxZq1at8p59q//kx1UMwX8aaIqIiIiIiFgxmRnapMTkQn0Jk8lUu3btLVu29OjR4/nz53nL9+46mJGuXb5qgX9gWerTtsQrZRRRV74GDRqEhIQ8e/aMoihnZ+dy5coV7utxZjF6JyIiIiLyznAAUxbXa2N4EfXYqFWr1qZNm/r37x8bG5u38NyZC/26D1m1fnlYlYrmfPXLIiWaomu67GChCF4IIcoUOx9xRjGAJyIiIiLyTnAUW2YktKnJRweKFVsLgndYampqge+/QYMGW7Zs6dmzZ16lBQDg7p0HvbsOWrxiXovWTc1m86dpmIJZilcErwAcx4WKUsH611KJVcI+k6KTd0UKZ7Z8RUV5JyIiIiJSkuZ8+vXrJ1jDXrhwYfjw4YXhTFSnTp2NGzcOGDAg/yxtdFTs5wNGLVwxu0u3jpRgH/0pASHMSE3V67I9ff0AADHPnirVakdnZ4M+Nzkhzq2Mt0wuL1mfScluuvz/cu/EH/FH/BF/xB/x5x1/rAI3N7egoKDy5cv7+fkVVNcKoS1y/iWNGjX6448/vLy88i9MS0sfPnjc8iWrMAvgkwFaPucVP34/oFXD9OSk9JTkga0aLf9hCkFixw/s6V6/+qVTxwmyhH0gpTR6JyIiIiIiUgLJC9cVoFmJ2WyOj4+Xvxp/CgoKmj59+qRJkzIyMvIWGnINU7/5MTtLN/6rURKJ5BNxYUQIYRjWuF1H38ByaltbCOCAMeO9/QM5FgRXqjpkwjcB5Svw/aNLFKK8ExERERERKYXkibmrV6+Ghoa+GQvEcdxgMLy2kKbouT8upMzmqTO+AZ8MHMc1aNG6YcvWQvfkAWPGI8T3Ug4IDikXEsJxfIcbUKIQ5Z2IiIiIiEhpA0IolUqF0J3QdOq9Nr929QZN08TLViufAmy+NMe8Th4cx5bQCKYo70REREREREoJKSkpNMO4uriUKxe0YsUKmmEinz2LiIiIjIyMjo42m9+1Lvi1lmgiJQ7x7yciIiIiIlKCEQJsEMKY6MjjRw48j41zcXWxURJyDFdp7FpZSE9Pf/z48Z07d+7du5eWlvbWglyGYd5d/4lYOaK8ExERERERKcFACJOTky9cuHDo0J/m5GtypIWJKtKRPH9HezVWEhhcyc/Xx8/Pt2nTpmPHjpVKpTRNvynvCILYvXv34MGDP53Z2NKNKO9EREoyiOXd9l8AAcTe2e2IAxwDIGHZBFn2g1kev21NxAGIW49zhIiIiADLspGRkbdv37x69frJk6cSYh71amjTsa6zp6vK3lbiZg9trmdGxBzfe9HEkI6Vq1avU6d2k8aNw8LC5HL5m3uzsbGBsLA60YsUMaK8ExEpuWBQ6gpxJa/PeBlGc3QaYHMAJP/fhggSGkzuzxljEJ0BMCkmdUVsNmKy39BwCOJqSDogKgVxJlHhiYhYDzRNX7hwYfPmzcePHVWg9Gr+8u5dXOuGOVQLUMqUciCRtW+qalHP89Fz441HWRGxutuPzi2cc/z48ZOdO3Vs3769t7f3azv8RGxQPhFEeSciUjJBHMTlUrcBuDoE8bE3BBDH0ZlMxiEm85RF8P27FEMMpign8/nGHL+KTj+Ikx5S73F0xjEm/S8+nvfKmiymCJZ4DDA/X4JyIywxPBERkeInJyfn9OnTa9auvXbpTDVf0L66fatwuzLuNgAnIW0EBgawDGBpKUZW8lNWDNDQJur6g/TtJxL/vHxp0aJnyckpvXv3Kleu3Gt2xyKlBlHeiYiUXCCUOHBUOpX4GwAMwG0lTq2lZUYhWsvqrlmEGgcQyqfJeAnIz8BCgtPfNz77DpnjIcQBxCHpADH5iyjgizWF1BwWYlJIOr5DRFBERKTQQQhBCLVa7cGDB37+6afoJ/daVpZ909k5yFMCMQjM+pdfYiMw6l6M8TAMkyulhKROVdewcnaBZWJ+/TNhw7rVaWmpo0ePDgkJKajeGCJWhSjvRERKMgghNovV3wPIDBBjppJl/nNwRSCbfRVABCWuEJNx5gSAePt7iMmg1ANR6YjJ4gUcP9n6Us8J8b+8x7gCVwQCQs3pHyHAvPKsiIhI8QEhzM3NPXHixNKly+IiH7SvrviyvUOgh0XbveU7KqRtsCA3B2AQsIxKKh/Y3ketJJfufL5v316NRjNixAgfHx9R4ZU+SlgPNRERkddBlkgb/4MwiQuAkDMnAggBQqRTR6nXOIir+KAdYqCsjMxvKq6pijgTJvOVlZ2BqypaJnbzw0KZt6zsLJnPZIlzV5nv96RtA1HbiYhYD48fP96yZXNM5MPwssRXHRxCykhxvj4KWYLub/zkj9wbskF2qlKKujZ171DbnmS0B/bt3rV7t2iGUioRo3ciIiUZxGJyb4nHYD4Vj9TgqjA28zSTfYmfgeWz7/BXc+mgZY4Vy/f41SE7QgCTSlx7YaSDKWYhZ3wGZd5Szy8gJst3nxARESk2tFrt2bNnL54/W84FG9TAtowGBxSXoadzzUAqwe3VOElgAFq+rf98uSHDcWlZtJFGCinuSKcqVIp2NWwTUw27LsSeOnGsUcOGlSpVEn2MSxnin1NEpESDIK7kJ1IBB6CEv5BLXDGZN2d8arm6Wwb0r67/L4+F31lM4oIpg2ntSVZ3BUAC5dyg0/ZLPYaKNbMiIsUOx3GXLl069Od+ROUGOMqaBUglDPs0lbkWL7kXp5dCc+NgWWVfuVqO8d9XCC3/AhPNRSRz55/iD59n2SuYFpWUVcuyYZ5kOU+ZUgoTou8f2L/P3z/A1lYjWqKUJsTJWRGRkgwk2NzHxsjvjc++NT6bbIqaBjBS4jkSEg5vzLq+AwhhuBpiEmRKsFRg8FUXgDXwuxLVnYhIsSJUVJy/cOHRvZuh7mQld1LGoagE0+qLRKZH9+dEtXUX6G+3pR6/qWONDDCxlh+OMzKPok3rLispr66xTPDaE4bvN6deuJ9DsLSPLazqJyfpjL8vX4mLjxNeorjfpUiBIco7EZFSALIUyTKc4QmTeRqTe2NSVwDelHfvMjQXpnXEK4OIiBUBIcQwLDo6+t7du4zJ4KIA5R0Icy5zM5J6mC539ApxdvczspK/n5rPPzJkpFOAYoGZBRSjz6ZuPDNFaRUuXuXtnT1zzNjVSNPtZ8bcLNpZAf2cCBsZTElOvHf3jlBi+2GHx3CAFQN/VoY4OSsiUsJBHOBogCjL/CkOpc4AcchSKmuxQSEtRbIUX0iLKd/0N/lnBpf/P8sx2YAzYnIfSy42zRdkEBoICbG4QkSkGJFIJJaWstEZ8ZGOSkyOAVscsSYmxwBS0rNmzPghMyMtS5vBAZCTy+bmMCYcURwgcEDRwJBD3bx5527EN/ocnclocHKwRUhG59IEy5EQOShJnT7n4f37HEJSqfTDAngIADMHSAiklqRfEWtAlHciIiUbKHHAbWsCREOAY8rypFNHNvsqMsVDgHHGGNKhJWHfjNPfgVJP0qkDxBX5YnjCdRzyjS5YA25TGdff4UzPWd0twq4RZ4jgjNGYPIBw7iK6GYuIFC8KhQJCmJ6RYdaluisgxqEsHYPbYZ4q0t/d4dzDBK02k8AxT1syyIE0mLhzsTCJxpU456tgfTSYi4x+EB+LIGFrq6kU5OPrZCYZPW1gWQrZkECOchKTEjmWk8vlHzw/yyGQwwIaAypxMGgdiPJORKQkw+ZiygCZ91fCb4jV0RmH6NQ9iDUAjGCzLzE2VSSuvQH3GUelMdmXCVzOh/R4OMAZeTsViCMmi07dK3HvK/EYYor8nkreKiHtJZ4jAaNHVBqbdR7Y1hG9UUREihGVSgUhNBoNrNHgaAdxDiRrGZkHEaqiK8oyyMr+6bkMYdY1dNT62ZiuZuDuFcs3qVIuOT7+zqVr9ogbU1t1LMkjhdE42CorqtOCFHoFxNKzmGw9Zy/HZMiUk6XlOO6Do3fCYJFDIJOGFAJ2JBKmBUSKEVHeiYiUTCCGOIMxdg4EOF8iJ1gcAwawZv66aom3IVZnjplPSZwBlCA6BbBGOm0fP9+KK1jDU8PjEfz0K++cghjtCSb7giUZFyE6zRwzE5IuACMRlQw4M0jZallTjOGJiBQPQjdYvgcNh8rIAYToZgL9mTfpKgG9PXQmMkHPYhRFpRvMesip5LQ7nujJUVK5IdEJM2XiNiw3IsQsIbNV0lw1zHGSsbQei0qlGIrzccHvxjEURRfUoaaagZGFrlKEi3UaxYoo70RESjKc+fUh8itVERgALDInWgQfxv/wnSpejLT56F3e/CyAvIwTHvOeeSwyJ7zYin8Vk2iMIiJSjOTm5iKEFEqlRK6SQb29FFxIZv9+bm7sSfjIIOIyjyQxiUZkb0uEuErsbZHclA4iM1UAr+ImM7moo6KznifqJZSusQfpoMQBBy9Gmp6l0O5KTM3bpxBKlQJAYDabP94bBfIKDxpZ4CVHcnFIWHyI8k5EpETzf1UXfBHbe8v6r2376lOiRYKIiNWQk5PDcZytrS2pss8159RzAEkK8EeE2YFAle1xBMGjZOa+lgtzBXYQA3qZXCVhtKSJQ9kUY6BNiSnmq7G0EnDV1NAOQzHZaM8DI2VGNX3IdCMLCIWjkwsGMZPJVCDWdxgEaRTUM6CcCuH8UFKkGBDlnYiIiIiIiFXDsrzPkUajgSq7rIxYbxKEa+BfyWjtQ6qNB9bQBa/vANORbbxtOQMhx7L0IMPMMhTEMJyUsRKFgVRQysQGsudqjrkYzeyNYlINXC03wlcOErSMFtl5eJbBcaxAoncCGARZDLyVDW1IaCsV8/CKAVHeiYiIiIiIWDsIIT9fX0+/gNiYm6k6FCSHwBFcyeT2xXDX01hnJZFDKLzDm2BK24SYSClJGgwGXXa2jY2NjYNTWlJioin+Sg59LYHKNnESDDR0wUNtIaCYhEwGKZ3CKleGEAoisqDAIchhYaQBK6/h3KT4my10RAoV0bxURERERETE2uE4ztvbu3LlSmmE5u90oAHIV4oq28BsgOudVdBdQeOsh5ubj7ePvYu7h2+Af3BF36AQVx9/O41SY3raomyWX5DC7KJIw3BPBfSXA0eMS8jmbmXhZby9g8sHF8YxYwDQHLqu5aINnCXDV6ToKK3RO3GcICIiIiLy7pSAW4ZMJqtWtcrJ8pWO3TpVXQ0RBiIYvG4Vm/aVlJievp9kImTKqtWqubg4Z2VlJSQk2NioSVJizkpWG5O6VgfuLjZJevbsI+nV2zlRWZQthGees8ky34FNmjo5OxfSMUMAGISuZzE5DF7BBscgX/8rUgSUTnkHMbk4ThAREREReWcsHZatGMGRrmJoaJOmzTbev7k9ObuyBqTLyI5BMi/A/vnMmEHbMgACxNvXYRhmb29vZ2enUCifP3t08ID53I2cViFKNw3Rxl8Wl0zFRlFpeuZ0OunbsErLli0lJFmIR27RzneyWR2DatrhBAY5UeEVPqVQ3kFMJq/wm+V0EhWeiIiIiMi7gAyM3syZeJ8Qq0QoenB2du7Qvn3E40fH9+/MBqYKrrgzRd+NMR16CgPqNpVKpRcuXMzISJdIJD4+Po6OjjpdDiLlWoXvH/fucPrstv4StYqsoEB7KHg5HmmCwzp36uTn5/vBbsbviLD3hzpWR6OGjoSSgGKP2sKmFMo7QeEV9yGIiIiIiJQooBGUBAICAvr1H5CYkHj+8mmXbDY90XQlmgEuFeu2aEvKlcnPnmo0Gg8PDw6h27dvsyybpdVqHF3vREVvfpDizjIhjkRiEnclhaYcvbv36t2sWbOiOWxLS2wQmcvpGLqlC2lPQkZUeIVJ6ZR3IiIiIiIipRKCJMPDa4waM3YJw5x+fF1hMnE2ni269a1crXqmVsshzsPDQ61SnT17NjY2JrRCBV2WlqMZCiPupIGNj6kADX0qFVD2vr37D+jarZuDg0NRHjwOQZwJ7UigWzoTPkqMET3xCg1R3omIiIiIiJQkFAp5kyaN1SrlT0uXHHvysH6Fhl6Bwbm6LNqgt1XI9dqM61d4zBSVlpwkUyhVDg5mmk02MNsNwD5HXrZ8yLi+/du2b+/q6lr0B09AkGpGOxPpVi5EqBpnUEmoaimBiPJORERERESkJAEhVCgUlSpXbtG23dVrbqG1al25/PedWzfi4+JNBoOJZjBS4uru4VqmjNrWnmHo2NjYtPR0qVzu4uJSo2atAQP6N2zQQCYrtiwmAoJsGm2PpzOdUX0HghUVXiEgyjsREREREZGSB8MwEMKwiqE4jmfqDak6Q3xmdk5ODkNRHMtExcRKZFJbB0eZTGYymYODg8PCwlq1ahVeo4aLs3MxajsBHAIjC/YkMjkMaulM4hCIxRYFiyjvREREREREShgIIVtb2549ewrBPLPZnJWVdePmzYjHj9PS09PT0rSZmbw9ioO9i4trcHBwlSpVPD091Wo1WZgeKB/QVmFfEpNBgS7upBwXFV5BIso7ERERERGREgaEkLAg/KpQKDQajYuLS5PGjRmGYS3wQTIcJwhCKpUqFAoctzpjP2iZqD2eymgprk8ZiaMU0mKxRQEhyjsRERERERFrB8P+TxNRDMMUFj74JQrb/e7tLwqABAMXM9kks3m4j8RXgVFiDK8gEOWdiIiIlYDEdkUixQmy3sARx3EGg0EikRTqq1AUBYoJCQYe5XCznpjHlpWE2eAm6/1TlBhEeSciImIVcMbniMkC8P+EKERECgMIIMvkAKmHdbYmu3v3bvXq1Qs7upaTk8NxxSasSAw8N6IpD82TAiR1HAiGE8tpPwpR3omIiFgJyJrDJyKlHb5bK7BWTCbTkydPQGmHhEDHoB8izCN8UWtnsjjmiksP4kBZRERERETEevvMflIvTUCQy4CZEeZLmQwpKpSPQIzeiYiIiIiIWB0QQolEwjBMYeycZdm8eVgcxzAM58PnL0EA5NXkFjEc4n86u5OVNLjYsuxjEOWdiIiIiIiI1REeHn7s2LECj6JBCBFCs2bNOnr0qLBkyBcDu3TvSFF03joIcXZ2thiOFXEMjwUAg+ALH0mfMvzMrGiD9zGI8k5ERERERMTqsLW1rVu3biHt3M3NLe+xf0DZBvXqmVlTvuchhziW4Z3zigyGAwoc9PWRdHQjGY6P4Yl8DKK8ExERERERsRaKpqtEfhc9lmVpQNN0ocwCvyM0Ak5SOMiLrGNP0GLNbEEgyjsRkVICTdMURX2MrwGO4x/jiSoiIvLxHDhwIC0trbANSi5fvgysBjMHvOTYIG9JsBoTtV1BIco7EesiOzvbaDR+zB7s7OykUikoHFiWzcjI+EgJ5eTkBAqBFStWzJ07Vy6Xf9jmCCGKoiZMmDB+/HgrbF6UD8j73Avp36/cCCzLCz5ViN/pe2+SZ+jw2kEKTg8fdZD/vPlCe8sixclFC+CTgUagvBob6k06y3htJ1JQiPJOxIpACM2bN+/o0aMfLC84jgsJCVm4cKGjoyMoBJ4/f96rVy+GYT7MX1TIUx47dmyfPn0K/NjS09N9fHzmzp37AdnQEMLc3NxJkyZNmTKFoqjvvvsOWCUYRnKI4VgKIIBhBEZIEMcii10Z4miEOAwvWFt/hBBn+VvD99okT3JBiGG4BCE+kYk/Pxm+KwCGf/jsG0IsfygW82fEMQixlr2J/mAiJQ9k0XaVNXhvT9KGhGKdbMEiyjsR6+LBgwcBAQH9+vUT+mG/FziOb926dePGjenp6Rs3bnRwcCjww8vJyYmJiZkyZYqvr+/7HiGGYZmZmd9+++3AgQONRuPQoUML9tgQQm5ubo0bN/6wzc1m85IlS6pWrbp69WqKoqZMmVI0OUDvA6ZNvhP3YFd26n3EMQqNt2tAc1ffJjgpRxzz8NwcvTYqvMMaiEsKJKAFMUKbdDv27payVYaoHQMR+v9/bghxfVb008s/UaZsSxUgJGUae7eqbgEtZSpn2qS7e/I7xKGwZrMJiVJQpe9xPBAytPHZtdVShYNPWB+I4U+v/JwWe75Sy4VKWx/EFWfilMhHUrx5b0VcQiEgfEfrOeAd3QgJBsUi2QJHlHci1gWGYWFhYa1bt/6wzW/fvl21alW9Xt+vX7+NGzcWRgzPzs6uefPmAQEBH7BtZmbm6tWrw8PDp0+fThDEwIEDC/bYPkAT52EymSiKat269bBhw7p160bT9OzZs4HVgGFEVsr9O8e+wnCpR1B7QqJMj796/9Q0faWowBojAYT2HtWUdr58RymELK3RIa+fIISWJS/FGR9Ns8S9uLw5UyhEwvgoHcZHxRAnCC8IIWVIT3t+wSu4Cz+p+vL2w++Q//XFaq8AIWPSpcaes3MN07hUAhxnzEl8cnlZRtzlkCY/SGQaRy++EBJiJMp3kJb/4m/b4cujfREOhIhjtUm35DYe/JMI2bqG4aSckKot7Rb4t2rZw1ve4z/vNN8bFLEGLLF22LxFIxu1SvjDFfkRgKrhlT7m0vEBcPzpD5o5E/UdCUI0QCkcRHknYnV8zIXGbDZ7eXmtWbOmbdu2ffr02bJlS4HH8BBCNP2PQdR7wRenMczQoUO7dOkyduxYiqKGDRsGrAmKourXr79169Y+ffqwLPvjjz8WdhfzdwQBkPb8gtmYVeOz9XauYQigMhW63D/zY/zD3Z7lOyhtvV3KNgOCROPnQGnEUYREzbGUyZCEk0qJ3E6YzTTlJEOMkCocLElx/D8MbYAQEhIVbcqmzTqJ3EEIB/Kvyisl4kXC3Et5ZM5N4xizROFAkAqOe+NMsGziWrapd1hfy05QwuOD905NS40+7RXSzSOoHT+tzE+nIo6hEMcRUiXLmClDMiFVS6QazrKJEDtEHGvKSUYAyZTOECOEllkQIyDvQMsfu6NXLQfP8LzJX5Y14xIlQMiYk4Tx79Ex7z3y2+EEZcyizTpSqpHINRz74oVEih2EUJv2rdp2+MAx7cfDcRxThOFDDgEJDlo5klVsccHEWKQwEOWdSGmDpmlHR8fdu3d36dKl8GJ4H4xQwdCzZ8/c3Nxvv/1WIpEUeAzv42nUqNHWrVt79OjBMMzChQsLu5H5uyFE4DiOoyzdaRGGk/5Vh7r5N5PI7ABCsXf+0GdFhTT4HidkqdFnEiIOugW0THp61JD1HBIS37A+aoeAqFsbcjKeAYTcApr7VuqP4QTHMpHX1yCOVdr5JT75kzJly5TOZasOtveo/lpCG4SY2ZgZdX2tNukuQgwp03iH9nT2bSgc2xvHyvGJcRwDMcLOvTIpURp0CRxLP7v6C+K4gJqjCFIe93CvNvmWs1edxKeHjbpkgpSVCenmUa4tH9fD8JyMp5HXVudmPwcAyNXuZasNsXWpmP8lMIx4/mB3Rvy18nUnylSuGUlXo29vdPNvkfb8ovAeXco2LVtlALTk+SGGiry9MSXqFMeYMULmFtiyTHBn3KILi+AvJ/J/4TghxbN4KErvYhYBBQ5bOBNllRiHxBFGISLKO5HSiYeHx549ez777LNCiuF9/MV0yJAhEolk4sSJVhjDAwDUr19/x44dQh3JvHnzZDJZ8R4PBNCxTO34B3tuH5lYpkIXB49qSltfpb2f0t6PZUwAIENWTHbKfV5pQWgypCdHnjTqk938m3uUa/v8/o77Z2cqbb0dy9RyK9s8Oepk5I1fNc4hTt51AUvnZEalx15w9K5TpkIXDJdG3Vx/79S06u1XKe38/nl1iDG0IeLSouzUR/7Vh8nU7slPDz84NwsjJM7e9Swht1ePFiP4oBqGQ4jnZkbTtFGq4M9AXcZTvsbCouBM+uTEx38asmI9yrVTaDzjH+57eG6OVOHo5FPfkP38/unpBKksV3ssBonoO5vvnZxapdViiSJfzTWEhuyErJR7HGuGEKPN2anRZ3K10a4BLd38m6dEn42++autc7CzbwPEsdF3t8Tc/cOv8kA7t0qZiTcjr69FLONbqV/R/f1ErLi9bJHBIuBAwsbOpLsMMqX/7RYzorwTKbW4ublZbQxPoF+/fhRFWW0Mr27dutu3b+/evTvDMMuXLy9etxSOY21dK1ZqMT/69qbI679G3Vwvt/F09mngVaELn4uGOIuielELAiFGSpTlaoxy9mtkiXNJMw+Ncw9sVbbKEAAxha13RsKV7NQHzt71hJWVtt7B9Sar7PwAxCRSzc3DY9NiL6jsA/ICeBDDdekR6fFXy9ed7BHYBiHGxiEwO/VB0rOjjl613zRPyYi7zLEUQsicm5L09KjKzsfJi38tDMNRXlAQYqRUE1BjlLNPfYCA0s5PlxGR+PSwk1edjLjLppyU6u1X2TgFAYBkarer+wanxf3tUa59/ggPxPB8ZbMYTsp9qwzyDukGIFTa+WbE/Z2d9tClbFNjTlLSsyOeQR38qgxAiLN1CTPo4pOeHvYM7khK1GIAT6RoYABwlWH1HAh7SVFoOwzDSEmBBURpPpOihH1TRHknUpqx5hiegJXH8GrVqrVz586ePXuOHDly8eLFxWp6jCDA7D2q27qGmXNT0+OvpMaci7nzR1rs+SotFytsvV5bGSPkchtPjqH5UghSiUsUMrWbMGeKE1KckPMxvxcXf06u8ZQpXXi/FV78lZEqnfXaKPBqqWxu9nPalJ3waG9KpNAGFOZmxSPE59BZEuPyVuRdVLJS7ht1Ccji5OLsU987rI/KzpdlXjV0RJxEYa+y9eFYGiBOqnBQ2vkadfE0laPXRjNU7tOrPwsGKACxptx0Q/ZzIf3uX+AwXKbUeAl5eDguxUk5y5gtYcIUU25aRsK1m4fHCxUkOZmRVG46bcohJeqC+NOIiPwfWATKKrAqtriKKIoiWQihLkv7+O5tjkMfOemNECJIskLlagqlsogLUD4SUd6JlHLEGN5HUqNGjZ07d3bt2nXMmDG//PJLMbql0CYdxHBeqKlcywR3LhPc6fmDnQ/Pzk6LPe9j9+Y8Y1617Mvfeec54cby4vbyz12Gz+UTlBOCEIMYwbG8i94rm7MUhuE2TsF8WYZlHs2xTC252g0C7FUfFgQA8g7t7hncmZeSpJyU2iDEIvTW1PUXB2nJQcIwTML/yrEcSxESpa1rGJ85h/hDcvRuqHEqx1cA/9cnhAR3vVeAkOPt8TiVfVkbpyChnNbeI1wqt5XIbT+FCUGR4gVZaikCVXioDUYWlQEKTmBRjx+O6t6BoeiPNIVECJEk2apLj6/nLVHZqGm6xCg8Ud6JlH7EGN6789b87qpVq+7Zs6dHjx6ff/75ihUrVCpV0R8Wx5hvHhmP42SV1isgQXIsjRNSO9dKpFRDmbM++gr+wrsYQpym9LQpW6pw4GNyL18eACiRO2C41NGrtqN3XcTSEIDMxJs0lfPWlyYkSqnSka+c5RUX9W8frOBjYnkOZxkDZUgnJTY4qbS8Ou5erp1c7Q4Qizg2NeacRQK+NHN59zeMOIlUQxAKtYO/b5VB/JFDTJ/xLCf9idjuQqSw4aPcAASr8XJqPrWjKItkOZY1GY1cQcTbaIravXFdRlrq1GW/uHl60FTJUHjF4bIjIlKYvPU+6ubmtm/fPr1eP2DAgPT0dFCs5G/mnUe/fv3mzZs3ffr0DRs2gGICIWQymQxvIzg4eMOGDadPnx41apTBYCj6I8MIqca5Qkb81aRnR1nahBBLmbQJj/fTlE7jFPwRSoWXdNmp99LiLvFOcYw5+dlR2pRt716NV2mknGNZoz4JcbSNY5BE4Rh3bzuVm4pY2qCLv3Pi2/iHeyy2Ka+fcsIMaV5Hjbe/MIabdEnJkcc52gQQlx73ty7tob1HNVwit3OvwjLG+Id7WDoXcUxm0q1bRyZkxF3mXe4IqTk3lab07/r+OE5u427jHJzw+KCeL+xgaFP247+XRFxeyleEWENJtEgphUOAgKicCgSqLUaMRfzyEL71SvvBnDl0cELfbjFPnkqk1tyz8R/E6J1IacNsNmdnZ7+ZBqtUKn/99deuXbv2799/w4YNhdT49f+CEMrOzs7KynpzXqxz587Z2dnjx4+nabrAe1r8X3hXXAi/+eabhQsXvnUFkiRzcnI2btzo4+Mzffr0oj48gPmE9THlpj448+PTqz9J5Q7GnCSO4/yqDHL0qoM4vlOZpYSWB3EMyxjzPmE+gsYY/5m4RIhlTC8t6/j4Ak7Io26sj7n9O0ebc7TPvCv2sPeoxrFmlb2/nVulB2dm6LVR5WqNLVdzzMPzcy/vGaiy9dVlPCJIhV/lgRAS+Sde+deijf/WQ4JjzZbp0Rer4lJlcuTJlKiTECN1qQ/sy9TyCGrPsZSda5hf1UHRN35Lj7tIyuyyUu44lKnpHtgax2XOfk0iLi2+un9o5ZaLEOD4t2x5mwix/OvmqUnhPbI0ABxOygPCh987OfXa/qEapwoGXTxlzAyqPYGfnH1zMlekuAelHzxjLnyFhUtf/sfFAkJAhgF/JWfm+M5jWLEOJORyefny5d9d7WEYlp2d/fTp09c+wFuXL43u8dm0FavD69YxU//0HrRORHknUqqQyWTXr19v27btW69rBEFQFHXo0KFp06atXLmyuC7is2bNWr169ZtHyMeRcNxkMk2YMCEkJKRWrVpFeWwKhWLx4sVpaWn/4b+F4/iCBQsiIyNBkYMQK1M6hzScmlW+Y25mJE3lSOQOGqdgG6dyEOIIcV6hPdwCW/GPOcbRq65M5SZTOQtyR2XnW6nZPBvHID6cBhAptwtp+L1M6SyIMIQYjVP5wJqjMpNu0qZcf+eR9m5VMIursEThENLw+6zU+1K5A+JYZ98GchsPfjVDpqNXLXuPcIWNR34lhxCrtPWu3HKRyqHs65l/fAod7l/tC/4BJjTS4Mspytf7ypD13KhL9Arp5uBZQyLjJReEmE/FPrbOFbNS77G00T2ghb1HuERmx3G0R1B7lZ0vZdSSUrV7QGt7tyqk3I5jaVvn0Eot5qkd/Hm/PYBImaZCg+9kSmchiVDtEFil1ZLMxGuG7ARb98r2blVtHAP+EZoixU2epMMJnMBxiqLfV+RBCPU5eoqi7Ox5B2+apk1Gk1KphMUhrDje3A75KJAdCWJeLSgqFry9vQ8cOCCVSt9xfQzDzp8/3717d7PZ/NpTzx49mNivxw8/rW3UpiVl5qw5e1WUdyKlii5dugQEBPxHVwmJRLJ3796nT5+C4kCj0cybNy8lJeXfLgoYhlEUNXPmzKioqCKWdwRBhIeH/9/Vdu/ebTK9CJIVMQixBCl38qrr5FWHHzdjfE1DXg2ErWsogBjHmBHilLZeavuyLGvmV0NAKrdz829hWZOXXDgpd/FtaJk5ZfPqG5R2vjZOwcKueIUkhMEQJ1O7umvKIMTxRicca+MQaOMYBAAHIGaZfn01SoeQRGbrFtCSr2Z4M4DHd06rbonhUXmvK1M42btXQ7xXM2Z5XUulhaUy196jmr1HNYuTH4bYF09hOOngWZMPzLBmicxW4xTE8g4srEzlqtCUsbix8EeOETLhPQqefIhjZGo3j/KfWWpvMYvPzAd2XhEpWHAc37PzwKGDRyiKxjDMzd21eavGdevXJgice59UNZIkN/229dqVG7+sW2pjY3Pkr+Ozps//7Y/V5YMD36WhLYZhEIMcWwB6BQGgJlAZOZJhwEoGECRJurq6vpe1k729fd5A19bWlmXZnJwc4deUxPjJg3pNmLWg66DBDK/DreRdvo4o70RKFQEW/nudmJiY48ePg+JAKpU2atTov9cxGAxr1qwB1grDFGfvcz6njX05nn71oppfr/AduvJNO1omZ/NJUn7ikt+JcPnme8haBBA/c/rGve21Xb2lC9kbR/jKa73KS2FnAWKWuCNrmbF981N9UZPxthd48Qnwk8IvN+QnZ19pDP/iPebb3dsUp0ixIkyhXr18/c7t+126dYQYiHoWM3Lo+KHDB4ydMNLSRBhBDEpICQYhy7E0zeQ/RUmSJHAcAURR/GlJ07QQbWJZNjSswldTxru4OnEcX/jJcRxBEhBAmqbzu3uQJEHgBAIgIT4xKSm5bFlfhVLxMQoPAWBDAGcpIiD/BbWS7H6EEMMw7yXv8n9KwcHBQ4YMmTBhglarFZZkZ2lnTxyTk53df/SXGIZbp2GKKO9EPjms86uYB0XxdrjFfRSfBJYYGV626lBLAh5RlJ864hiPgNbCbOxrBnsinxoQwtCKFSZPGU8QBEJo57Y9P0yZXbtuzZp1whHHmUzU1b+vZ6RnevmUqRASBDGILFE9HMcfP3oS+TRSoVBUqlrRydFJEIuCmrF3sK9cJUyhUOTqc5MSk23t7R7ee2g2U2GVQ51dnIRrIEEQz55GP414hgD6Y9OOjPSMhcvnVAgp/8E9tQEAahzYSdDrNt8lHI7jevTo4eTk1L9//8zMTGGhyWhY8O2E1KT4sdNmSmUKK7ytiPJORETkkwVBCDUuIa+64hXJCyNOaeejtPezzBGXpluhyIfAt1KmKI7jMAxr3qrJ779tPXPyfN36tdMz03+cNu/EsdMKuYyi6AFD+gwfMxRaakJ3bd+3YPYSCKHJaKpYOWTpT/PzSgdwHL99887ShT//tGaRNiNr8oTvvby8Htx/mJSYHBIa/NOaxS6uzhiGnTl1/ruvpvMxP5NZKpMt/2VBWX/fjwnPKwk+5a6UaTtgkctms7lt27Zr164dMGBA3iwtAGDjiiU52bqJsxbYOdpZm2GKlYRORURERIoHwcGkGF7X0kKj1N0KRT4KjuNkMpmDo33c83iWZbZu3nnz2q1tuzeevXJ89oLpmzduv3D2b5lU9iTi6dKFP38+YtC5K0f3Hdlua2v75MmzPHkHITCZzKkpaRzL0TQTFRlTvWaVo6f37zywOTY27vBfx6QSSa4+95cVa2vUqnb2yrG/Tuxxdna6evm6XC7/sMEGBECGA4Vl8rNUntDI8rF06tTpt99+s7Pji1fy2LNp3aRBvRJi46zNMEWM3olYLzt27Dhy5AjDMP9Ry/mOIIRwHK9Xr97AgQM/fm+lG4SQwWCQSCR5DSpMJhPHccXakUxE5FOBz7cDkGVZg8F4+uS5lm2ah4QFswzbuFmDLZu2nz5xtnnzJndv3ScIrGOXdlKZzNvHa+Hy2QqF/PKla6+V4Qv7s7XVhNeoqlDKg8oHBlcISkpIhgCjaVqv13t7ezmo7CQkaWtrk5SY8sFGKjj2qVgodu7cmeO4QYMG6fX/eE9ePH5kYv/uP/y0JqhiiNlkLTE8Ud6JWCkHDx4cPHhwYGCgjY3Nx7s38VMYJtOOHTsoinr38vhPk5SUlObNmw8aNGjcuHHCknHjxiUkJGzfvl1UeCIihQvkA3hGk9HbjW+jrM3Uqm1UfJs6lrfLUSgUmRlaBjE6nQ7HCYIgOAuWkdh/6SthNUu+naWQCHAajU37jm1+37A1J0eflpb+8GHE0BGDPnjo+4loO4GuXbsihIYNG5aVlfViEQC3r/w9ukenWavWV69bl6atwjBFlHciVsqFCxd8fX0PHTrk4uJSIPLOaDQ2atToxIkTjRs3BsWExfwMFmW+CH8HIP75mrMsS1EUX3CXbyHDMCzL5qletVr91VdfhYSE5O2na9euubm5xdhtVkSkdMP3G+bj5QQBiNsR955GRHXq2kEildra2WVn6wicgBBSFJ2bayjr70tCQqPR0DTNMAxfjQGQ0fDCxBvDMIL8/7d1flUIK1WpeOrE2aioGCcnx+W/LKhTr9bHFFWUYuA/odAXdOvWDUI4ZMgQnU6Xt/B55NPxfbtNXbaqWYf2NFX8Ck+UdyJWCsuySqVSrVb/Wxev90WhUKhUquKycd+5c2dsbOyYMWMkEkkRvFxiYuK8efMSEhIQQl26dOnevTuGYUeOHNmyZYtlRsb7hx9+0Gg0FEXt2LFjz549EML27dv379//2rVra9aswXHcy4sPHmRlZc2ZMyctLa1mzZpFcNgiIp8m6ekZ167cwAk8LTVj2aKfvX3LNG3emCSI5q0ab96wvWGT+mXL+pw9feHZk2fDRw/hEFe5ahgA8Pf1f/To0zU1NX3xvGXde3clSSIjPePJ42dhlUL4YdlL27y8B8JoTZj8pWl6/ZpNgUEBnbq0562/1UqT0SSVSznWSl3cihGGYTIzM1+7d7Rq1WrOnDnffPNNfoWXlpw0eVAv7fyln/XlQ6HFq/BEeSdipQjfDeEbdfv27QMHDrAsW7Fixc6dO+etk5aW9uuvv5pMJk9Pz969e+dNHcbHx2/cuNFkMlWpUuWzzz4rluBZfjIyMmbMmNG4ceMiC4CRJNm6dWtnZ+e7d+8uXry4Ro0aKpVq+vTpffv2rVOnjsFgEGJ1u3btWrp06aRJk1xcXGQyGULI3d29TZs2y5Ytu3r1av369WUyWZMmTf7888+DBw/26dNHDOCJiBQ4SpXi3p37Q/qPtCSxYQ0a1/ty0igbjZplmW49Oj17EjV80Bg7e1tdds7QEQPDa1U3UWZff58Jk8fMnD537+6DOTn6sEoh4TWqKpXy1T+tW7Zo5er1ywmSUCjlQo2tQqnIGyHLZDKpVML3NSHJipVC5s9esn/PnxBAgiSq16g6dcbXbu6uVujxUbw8fvy4a9eu+Wc88u5Qb65syM19aYk3/mNazH08orwTKQHcuHFj2rRpAAAbGxsIYadOnQAAer1++PDhu3fvBgBUqlSpY8eO+eXd1KlTBbOi/PKuuDh8+HBWVlafPn1e6yxZeFrTycmpbNmyjx49oiiKYZj09HQHBwc7O7urV69WrFixRo0aEomEYZjdu3f36tWre/fueRt6WDh27JhwbDKZrHnz5rm5uQkJCYV0qCIinyyC3e6EyWNGj/uC5Tho8aJTqpU4hjEWk2q1jXr2gun9B/VKTEgKDAoo4+35orEEBzp2blurTviD+w81Gk2F0PJSqbROvVoXb5xElt3WqlNjx/7NMpnU0clx76GtUqmUphkMwxYunw0hxrLso4cRf1+8svfQ1sDAAI7jnj+P/2LQ2LOnz/fu10OUd6+h1+uvX78O3hmT0Xh4946en48ki2Su5t8Q5Z1ICSBv6KnT6caNG1euXLkKFSrMmTNnz549wvLXEiOEVAmO497LpvxjYBhm9uzZHMdNmzbtNdFmNBq3b99es2bNsLCwvIV//PHHmTNnfvjhBzc3t8I4nr/++mvx4sXVqlXD+PsE73Sv0WhWrVq1cePGr7/+2sXFZenSpe7u7rm5ua6urm9uzrJs/glxmqbfzD4REXkNXEICS+Z+AcAhzvyp+HtLpVKZTPaq5nshsDiOgxCWrxBUITSY4/5pTCLoQidnxybNGiLEf2EFTaZSq4TpV5zAFSSBOH4MyTeieDk/K7wQhDA1Je3OrXuPHjxRq9Uchx49eExTlI2NTXF8AFYK9xGZPNZwtRTlnUgJIy4ubsSIEW3atJk/f/6/Xf3z3NuLhrS0tEmTJu3fv3/GjBlvvu61a9du3LixcuXK/Fl3Li4uJ06cuHfv3tq1a/OKGAqQAwcO+Pv7z5s378SJE3/++acg0ZycnKZOnTpgwICOHTteuXKla9euZcuWPXToULt27VQqVVZWlq2trdFo1Ov1BoNBp9NlZmbK5XKDwZCVlWU0GpOTk93c3ERbGZG3AnH8yuVbUdEFE+V1cXZoUK86hmHFlSxblAiC7D+ezVNv/1YPm3/Jy83+mRZ8LfeOH47STNXqlfsO7LVu1YYVS36BEFPbqPoN6t2oSf3i7TpoPUAISZJ8d1suvg30G3+O4kWUdyIlBgiho6NjWlraOQsAAI1GwzBMbm5u3josy+I4/tq1UvjKFUh9xps8efJk2LBh0dHRv//+e9u2bd9cYdeuXZ6enq+V6zZp0mT//v3Dhw/v2LHjypUrmzdvXrBH1bhx49mzZ3fs2BHHcY1GI5VKExISxo8fj2GY0WgMDAysVasWAGDEiBFffvllp06dVCpVnTp1JkyYsGvXrvXr1z9//vzGjRsPHz7s0aPHxo0bo6OjtVptv379vvrqK4lEIpbXibwJJpWsWLV1y7a/CmRvcrls+rfDJ305ECfwV3vpihQAHOIUCvlX333Zf1CvrKxsDMMcHB0cHR1omrYqgVKMVKxYcf/+/RY/Gvhvlc4sy+ZdDCGE165dmzJlivV8gKK8EykxIIQGDRoUExOzfft2fhpCpVqyZMns2bOfPXuWN3jatGnT2bNnMzMzhTHo5cuXhw0bJpPJJk6cWKZMmQI/pFOnTo0ePdrW1nb//v35517ziImJ+fPPP0ePHv3mrEdoaOi+ffvGjh3bp0+fWbNm9e/fvwCLart3716tWrW0tLQKFSpIpVKhl+X8+fOfP39uY2MTEhIizNFUqFBh//799+/fRwgFBQVBCLt27dqmTRthfYSQXC5v0KCBMDNL07RSqcybEBcReQ2ptMBOYKPRNPn7JQlJqT9OG22jVrFiSKmg4ad3acbZxdnVzTWvKxr4ZIiPj4+NjQ0LC1OpVG9dwc7OrkmTJv+2Ocuyd+7c8fb2dnBwyFuIYZhVTW6ITclEShKOjo5Lly4NCgoCAHz99de9e/fOm0pACGEYVqNGjUuXLh08eFAYQkVGRq5Zs8bb2/utGWYfyc2bN3v37o1h2I4dO96q7QAAe/fuJQiiTZs2//Z21q9f36JFi5EjR27btq1gD69s2bI1a9ZUq9USiQTDMBzH/f39GzduXK1atfyJPnK5vHr16uHh4YIAlcvlDg4OGo3G1tbWzs5OJpPZ29vb2dnZ2Ng4ODgI1bUFe5wiIv/G8pVbhgyfmp6h5bP6RAoBIf5E0/QnVU5x7ty5Tp06NW/e/NixYx+2h/3799erV69Vq1bCPJKAteljMXonUpKgadrV1XXlypUHDx6cPHkyy77ejj04OHjXrl3dunWLiIgQ/EGmT58+fjxfoF7gBAUFjRw5csWKFUuXLp0yZYpGo3lthczMzF27djVr1iwgIOCte0AIbd269cyZM7169SpGs2URAZwkQME6v3Dcp1Mf8BoVK1YMDAx89/cOIbx161ZkZORry3fuOZaalrl6xbRy5f04M11yP0qCIDAcExqycojvQpE/Jc5qKXbztgJHq9V+++23Dx8+7N27d/ny5T9sJ+XLl+/du/cff/zx7bffHjx48LUutFaCKO9ESgB52QzCELORBUHtCQMmmqbzrkEVK1bcsGFDp06dkpKSxo4dO3HixEI6KoVC8d1335UtW3bcuHFPnjxZuXKlh4dH/hXOnz8fFRU1d+7ct0bsTSbTnDlzli1bNmLEiClTpoj9vooXDMd37T66dcehAtxn9WohE8cNJHD8kwqNCAwZMmT06NHvtcn47bIGVgAAiqJJREFU8eOXLFny5vKz56937jlu/aofw2tW5qiSKpevXr7+NOIZy3EYhnn7eFWuUlFlo2Joq550Rnx9Bl+6C0oRWq320aNHTZs2XblyJUEQd+7cOXLkSGhoaPPmzfOc7a5fv37ixIkqVarkz4qOjIw8cuSI4BVVvnz5lStXpqamnj9/XqvVivJOROQDcXBwCA0NRQi9NscKIaxYsaKDg0P58uXzO+7WrFlz3bp1Z86cmTlzZqE68UIIe/bs6enpOXz48Hbt2q1YsaJOnTrCUyzLbtmypVKlSuHh4W9u+Pz580mTJp06dWrJkiUDBw4svCMUeUcgBu8/fLbnwMkC3OeeAyezs/XTvh8pJUmuFCk8DINv6TL6auLRB0xU5c9Sr1ixYkxMTHZ2trDkwaPIzj2/XLbom06dm/MxvBKl8IQA2Po1m86ePl/W3w8hkJaaZmtvO2/Rj5WrhuWllwj1/m9W0b5YzpfC/mOWmbdO/ujaa7aab98ntCwEr7+QsC2EgqTjlxMEcfXy9bOnL4wa94VEQpasz/w/4DjeOFClUglibv/+/dOmTatSpUqlSpXc3d2FFXbu3Dl//vwqVao0bNhQSIm+fft2r169Hj16JNxftm/f7uXlpVLxNjTWU0vxGmLunUgJoFmzZoct5DfgFfyiNmzYcPjw4eXLl782N9qqVat58+YVTZeFevXq7du3z8bGZtWqVXkXwfv371+6dKlnz555vVzzs2/fvrt3727evFnUdtYD+Q7NOt+Xhcs2/DDzZ96HzAp8sAoEjkN6vVGXo3/tR6/TUwVUUo0Q6t69+08//ZT/uxOfmDJ4+Pdr12zn00jxknfnoii6RaumO/b/vn3fpj92/+blXWbK5B9SUlJxHIeQbxpB03ROjp6maZLkO8wKW+EWH0G9PteYa8QwvgVFfpMUwTPllceQN9o0GU04jhMEQZkpvV7P5yVbPjE+BxfDjQaTXs+7DeSdk3kaJVdvMJvMwiFBAKOjYs+duUBR5lKj7fLIU7fdunWrWLGiyWTK+yQxDBs6dGiZMmXMZnOedNuyZcuzZ8++//77UaNGXbt2be/evcXbkeJdEKN3IlaK4OcpjJyUFt5cB0L4XjUTQnUtKAT8/f0PHDhgNpuF6zLHcb///ruTk9O/OZ4MGDCgR48ezs7OhXEwItYDw7BzF64DCJSOGB5OElFPY7r0Gh8VHf/6cxCYTQWZWt6nTx+KosaNG5eTkyMsycrKGTF2Zlxc8nffDJOSZMma8oaQTwVWKBR8lXr5clN+mNy1fZ9L56907taBb2xz8NhPy1YlJSS7urmOmzSySbOGAAIcw2Ojny+au/zvi1cgBrv16DRs1JCtv+8gSGLgkL44jt++eXfzpm0TJ491c3d9/OjJr7/85ubhdmDvXwaDcejwgQGBfgvnLouJfl6/Yd1pM79xdnLS6XRrf/lt5/a9NEXXrldz4tfjvLw9IYRnT50/cui4ja1m/+6DEMKxE0b06NN1w6+/L5q3Qpup7dah34/zptaqVd1sZaUDBYK7u7uTk1NSUlL+hT4+PhqNJk+9cRyXkJBgb2/fr1+/lJSUjRs3Cu28gXUjyjsRK8XV1TUiIuLnn392c3P7eE2GYVh2dvbdu3e7du1aSF/L/NYnWq02ISGhb9++/6Y+bSwUxmGIFAht2rQZMGDA+1q8EgSxYMGCq1evvrZ84bINAIJZ08fiJT8PzxK9M+hzDYX8KvxXftCgQRiGDR8+3GQyCcsZlv1x3uoMbfbsH8Zo7DQsVZIsGIUgGULIbDY7Ozs6OTk+iXiGY9iVy9enT5ndsXPbuvVrXzp/edo3s+zsNDVqV9fn5P4wZbZOp5+7aEZWVvbK5WvKeHs+uP9IQkoA5K9p6akZl85fNo0ZhmFYji7nzwNHOnZuO23mN9cu35j746ImzRoMGzHYZDLNmr5g+x+7J0wcs37Npj27D0z8eqydnd3K5atnTJ3z0+pFKpUqISFpz459I8Z+MX/xrMN/HZs7c3G16lWq16xWt0Gta5dv9O7XzcPDjSnh5+2/wbLsm/cXodPPW9e3flWXhyjvRKyUPn36XLp0adOmTQW1Q4RQlSpVxo8ff+DAAVDI2NnZbdiwoQB97ESKmJCQkC5dunzAhjt37nxT3pWyGJ4l966IGDBgAIZho0eP1ul0eQtXrtn2PC7pl2VTPL09WHOJDClBAAkCz9XrGY7dtX1vSGjw5O8myCXSeg1qRTx+unvnwZq1wx89iHj0IOKXdUvr1KhFAapm7XC5QnbpwhVhplVIGCWIvJlcZKNR9+jdpVa1mmGVKx47cjKsSsVunTszgL56+XrUs2htlvbPA4dHj/uiT+8eEEC1RjVy6PjHj56Gh1flm02X8RgwuI+bo6ufv8/5sxcjHj/t3qlznXo1454n9BnYE4N8b0PwKXUNQfmWYBjm4eGRmZm5ceNGrVabm5vr4eFh/RUnorwTsVLc3Nx27dqVmpoqzNJ+5N6ElGRHR0eJRFIE1ykMw96acidSUmAsZGdn37t3LzIy0mzmE5KcnJyE/Ov8xoGvkT84N3jwoKNHj8XHx5e+GJ6AkD4h9IOBEJrN5sJ4X/369cMw7PPPPzcajXkL/zx8VqvV/bJiamilINZoBiUNCPlTRalUUmYq/nmCr58PjmMGsxHHMc8y7k+fRDIMk5SYjBO4rZ2tgTUyNONZxkMI/r11hwjxuXQ4jhs5I4RArVZJJBITZwIAKVXKLG12VrYuOSl1w69bDuw9hBAyGIy6LF1WphazpOCTJMkBzsgacRyXy+U0y9KAoSi+iYXRYPyPE76kg+M4SZIEQeTPjsUwTMjbzut11KtXr0OHDs2cOVMorfjss8+A1SPKOxHrBcdxNze34j4KkU+RM2fOtGjR4saNGwaDIa+iU1DtHh4ezZs379SpU926df9bxLdp07Z//wHdunVNTk4pfTE8AICzs/Nvv/0WHBzMsqxEIpk4caLQUabA6dOnD4ZhI0eOzMrKylt48fKtz7qPWffLjAYNwjn6X2fTrAe+WsEyUsVxPCE+IT0tPTDInyQJUsL3NhVqWgGADM3IpFKLdCYRL+f4oSmEfF0FxF7UyeYtee0lhGct1a+W/+RbSBC4UqXs1LV91eqVKYov4FAoFfysK3o53EX/hLLyj6etP0z1MdjY2Hz//fe5ubkuLi55CyUSyYIFC4QHwpLKlSsfPHjw2LFjUqm0efPmHh4e1n++ifJOREREhL+JEZYqRYEbN268uQofyTAan1n47bff6tWrN378+BYtWvzbLk0mU7169TZt+r13715paemlL4ZHEIS3BeHXAkwnfbPmvVevXiqVasiQIWlpaXkLI6PiuveduGLRN127tkYMzVm3UTDLIppmIG94rl04Z7mNxqZGrWoEQVauGnb88MnkxBR3D9eU5LRbN++2bteCIIiyAX4cQrdu3AkI9AcA/PH7Dltbvp1MxKMnJqOJUBFJScmUiXoX+cVxnKOTo5eXZ3paevUaVXEMv33rzq0bd339fP57K47jGIYp3XkmdevWFZoe5V/4ZkcyPz+/L774ApQcRHknIiLyqcN7g3FczPPE15Z7e3v7+Ph4eHgoFAqaplNTU58/f/7s2TOz2Ww0Go8dO3bmzJlx48ZNnDjRycnp33berFmzP/74o2/fvqUyhpdfoRZgPOPu3btv5sjiON6yZcvff/89/8KU1Ix+Q75NTE77fHA3qYSw2lYQHIt27dh79+59xCFtptbe3m7WgunuHm4URfXo3eXC2Us9OvWvXCXs5s3bbm6uXXt0ZBjG18+nV99uP0yZc/zIKZ0uJyLi6aKlc1q3a7535/6+3Ye4e7glxCVSNMUb4r0cewhVAgghk8mU55lMUZTJZFZLVMNHD/lq/Pe3bt51cXG+dOFymw6thCENwzAmo+ll5A8ZjSahya+Ts2PEoyfd2vedu/jHKtUqWVvTrQJh//79mzZtoiiqa9euvXr1IgiCYRhhoZAY0KFDB2HhH3/8sXPnTolEIiwEVo8o70RERD5pLHNe2OJlGzZt/kdPlC9f/ptvvqlWrZqzs7O9vb2wMCcnJy4uLiIi4o8//vjzzz/NZjNFUfPnz799+/amTZvyT+68RtOmzSwxvN55kafSFMMrDLZYeMeVTWZq0reLyni4durcwgorLQTZNHLc5206tGAZFkBoa6cJqxTq5u4qzPs7OzstX7Xwz/2Hnz6J6t23e7uOrV1cnRmG5TMORwwMKh9w7uxFd0/38V+NrlKtEsdxv6xffvzISQdH+8HD+mszs+zs7Wia9vP3XbBkVhkvT4ZhFAr5d9O+cnV3FfKMe/bpRlGUgTY0bFJv7cafDh88lpOjnzbzmybNGuE4TtN0/YZ1vL3LKBRylmVtbTWz5k0tG+hnok0NGtb9Zd0yXbbO1c2FZUtJaQVpCQwLKd2XLl0aPnx4Tk4OSZLnz59XKpWdO3c+derU559/LnwrL1y4oFarmzdvvn///jFjxmAYRtP033//7eTkVLt2bUFMF4276gcgyjsREZFPO26HwXkLf53yw4r8MqtVq1Z9+/YFAPTv33/Pnj15Kwsp2CaTCULYpEmTU6dOIYSOHTvWq1evzZs3/0eqaL4YXnLpi+F9GCzLZmRkSqUSlUqN41j37t3t7e2fWoiKisrMzHz3XdE0k5ySzme3WSvhNavVrl3T8hBxANEMnZfTybKsm5vLFyMHMwxLEDjDsrwKtEgQkiRbtW3evFVTS64d740MIWzYuF79hnWEJRiGmc0Uy7L29nYtWjejKErYqkHjevxuLPKuYlgIhFCIvVWtVqlK1UoIcTjOGykLAsXH18s/wM9s5reVyWVNWzSiaf4o1DbqNu1aYgCaaDPLWmlvhvciJiZmx44dOp1OaFBx7NixtLS0n376ycnJqV+/focPH+7cufOJEycyMzOFLNLu3bufOHGiefPmhw8fZhhm06ZNaWlpo0aNOnbsWO3atd3d3XU63fbt27t16+bj81/T3MWCKO9EREoPRdAaQZinAKUFTCrZ9sfBaTN//rcQWmZmpl6vf3M5QRBbt25dvXr11KlTEUKnTp0aPXr0rl273sx2z6Np06abNm0SY3hCrQDD0A/v3zl57C8MlzraaziOIUhZjfCqDRo0yM7WxcRE37t37/Lly0+fPn3H883KW1lQvLz618giw7AMw1qqj185DSwmeXx2Xd7EN0KIol5ZIsBxXJ47oGCtl/dUno4UmmcIAxWGMb/26nnbmkzmN/dZ0oEQsiw7evToP//8UyaTCal1BoNBqVSGhIS4uLio1WqDgXdzzM3lW3pUqVJF2FD41WAwqNXqihUrpqSkKJVKYc0mTZqsXLly8uTJ58+fP3DggLXVoIjyTsTq+I8bpDXsXwjhgEIjn5HV+wEhTEhIOH78eOGVdEEIIyMjPTw8QKkAJ4mIh8+mzFgh3PMcHWzTM/4pzBRo2LDhW10hZDKZnZ3dlClTCIL44YcfTCbT7t27N2zYkP/ceLOutlmzZvv27evbt29UVNRrMTwJQSBrbV5ZsNA0zbfsu3jp6t8nFYZ7BhMbVs7RmKs/fkvPKnxDQkJ9vL0CywVWrx7esWPH+/fvR0REaLXaN71n+aaoV6++1m+gRPPuVrof+R23/qrPAgdZGgMOHjwYAHDo0KH79++3bt2aIPgQplarlUgkNE0LX17h34yMDGHDvIXCmlqtNm/N+/fvUxTVtm3bwYMHvym4ix1R3olYFxzHRUZGXr16tZCCGQRBPHv27GPiTzk5OdevX8/KyiqMI8QwTKfTvde0VB4uLi6JiYmff/55oQ4ic3Nzq1blfVBLOnyHOpads/DXyKg4AECliuUa1qu+9OfNr602YcKE/97PxIkTo6Oj16xZAwCYM2dO/gDqypUr31TbJEmq1er8SxYu2wAh+GHqaPxj7xAWPwyIWW3EzmQyRUZGXrhw4eSp0xcuXOSMKd/19PB2kYWVl1FmQgINp27dPrLrYi6r8PGvULtWzYYNGwwdOvQ/ylZ69OhRSFYsIqWSjh07li9f/uzZs3fv3hXcyymKmjFjhlKpzMzMDAkJERYCACZNmiRskrdw8+bNX331VW5uLkVRwsK7d+8qlcqFCxeWK1cOWB+ivBOxLvz9/Q8dOnTt2rVCGgkJOSj16tX7sM2VSqW9vf3s2bMxDCuMIxSGgAghR0fH9912xIgRQ4cOLRAX6P++SVttKvF7geHY3XtPtu88DABQq5RzZ4x78DjyzdUuX76c50ucH4Ig2rZtS1iYOXPmhQsXHj58+OTJk/zrnLTwf4+EYdhFyzf1690+KNDv48YMECCKL6PEJID3qrWiWAKEUK/XnzlzZsuWP06cOKbCc2oHKAN83KuFOFXxV0rVCgCxcR6qdg0Mfz/OjYjVPYl8cnDbzb1793bt1vWzjh3Dw8Pf6s1hJfES+PIf4ZsHAUSAd6wr7uMSeQsEQZAkKZw5nTp1unfv3pYtWxiG+fzzz4XYXteuXSMiIrZu3SqM7rp27WqxKB8cFRV14MABgiAmTpzYqVMn4fQTLJGBVWKlhyXyaQIhnDx58vDhwws1/sRx3Gvhk3fHy8tr3759LMtnyYDCQXBg+o8yzH+DtACsHeGeZwVJKjixcct+k6XQslmTWk1b1r9x59Gba82aNevPP/98czmEMDs7WziRnJycxo0b9/nnn3/wsUA+v54rmE+FzQWcCRAay16LX2EIQwKtVnvixImfV658eu9KbT+8Yah9x3qObm62EgmBMRSgSQChBENBvjYBAc4szcTGaQ+eS951Ovm3X1dHRDz5YtjnDRs2VKlUxfUuBNnG+xJbzIkxy9efD5byriSIRRyLWAZxLMfSiNMzfOWNp8yOs4LPX+TfWpAhhGQy2Y8//jhw4ECz2ezn56dUKgEAtra2s2fPHjx4MELI399fGFc4ODgsXbp07NixAICyZctKJJK8nVjJGONNRHknYl04WwDWCkmSvr6+xX0UJRnEAc4MMCmAhV4F8h/gBJ4Yl3ji1GVhQnxQv464pUPAm2v+W18KuVyeX+K3adMmODj44cOHH3Y8BTpagIDVA84ISCcAiWJXeBDC9PT0PXv3rl2zNubxje71NOM7OHo7SXASAHM2MFtc20y5/Ilh6cNASGSETB1Y1n64p12lANWS7dEXzhxLT0+jabp58+bCDbhwD/jlPy/FHOAQYgHHcKyZo40sncOaDIzZjBgzS+sYUxZtSKV0CaasyNzUFLPOzFGZtKGFc8j6sMFG1upcWkReIzc312g0uri45D+18nqU5Y/M5ebmmkwmb2/vkmLyLMo7ERGRogQCwABaDwgbgBVfI0uCiH2e+DyOz8ov4+Fav0418NID9jXkcvlbg0ZKpTK/JnN3d69Ro4Yg7+rUqdOnT5//9oAVkgTmzJmTl8FdoEDA6gBrAFJPy4dcnBUbOTk5+/fvX7ZsmTbx6YCmtp+3cPBxkfDRL4v/7ouVOMuUNEKA4/joozEXSGQKlX29cA8HjXTGb09P3bn1008/q1Tq+vXrSSSSwoid8028LHE4CiGKY8wcrWfMOYzRyFJmjjFxtIGlchiTjjFmUoYsxmDgl9NmljEh/l+KV3sMizi+ORpCKlxsOW3tQMtZtHr16vnz59etW3fdunUODg4AAK1WO3369DxjlGnTptnb2yOEZs6cuXHjxm7dui1evFihUACrR5R3IiIiRQ6igTkBkA6AsC2eA4AgKjo+KzuHd0CoHCyXy/IadL7G2rVrf/nll7fsAMLXLvHVqlX77bffhMmdd2lexHHcypUrC0fevVR4hsdA7gtwTTEqvKtXr27fti3q6YM+9TXj2jm625P/iLO3TtQLfwizEVCJErkyJMhxTGdzcnrEzWsXt2ze5OrqGhrKZ7UXLBzijCyjpU05IJvikJGjTBxtZCgjRxlZxsxRJv5f2sTRFMfgEKpwGYkRfDAPo6UcYYS0maMJiOEcBlnIAVRW6Szm3lk5yJI2ULFiRRzHnzx5YjAYBHm3Z8+e5cuX16pVCwCwfPny0NDQIUOGQAirVq26Zs2aiIgIs9ksyjsRERGRt8JPeQFTLCBz+AhT0abi8eqC4aJiXhRMhASXJST/eiV8qyvKWwkJCSFJkqbpxMTE1NTU/5tjYDabCzdrB2KA0YPce0AeCCQuABWpr56g4XQ63cGDB2/ful47QNE6TOWuxiGLWL6RKSBJy8wnX+r7siTh5ZYAIIpGLAdkIJeAMMxf3aOx85YTGceOHqpSrbqXVxmNRlOwR4tBTIoREgyXYiQvvAWNiQMMQgxgJIQ4wAgIcYjhEBPS7yB/4HygzvLvP7uyLAFlZPZcsQZNRd6R2rVrh4aG5rfXuXXrllD2DgCoXLny7du3heVNmjTx8/OzNnO7/0CUdyKljdTU1BUrVvTs2TM4OLi4j0XkP4B8upUxBtBaoAiyFHsW4UtzXK7BKPxia2sDMOzfonfvjq2trWCpaDabrcUMFmKA1UP9dSQLBHL/FzOQRYJcLuc47vTp05cuXcjNzmpQ36FJoIw1MRm5KDqdy9TT7vaErxOpVmD8RC2vlSx3TQxQLJecxT1OpLP0VFk3SYAba6MgW1W1OXVLF5Wcffr4kZAKIY0aNXyzB/xHQmK4DCMYXsvxsozXnP+UVAD++ARFZ4G/x7OAV3b4i+X/RCQRICDmKtWIwbsSAcvyw43XlgjZF/l/FTrzvmm+aM2I8k6ktGEwGPbv39+gQYMikHd///23RCL5eB+4e/fuabXaevXqfcDQECH0999/azSaChUqvMv6HMcdOHDAx8enUqVKR48etbGxKVu27MWLFw0GA47jAQEBYWFhRVXqb4mDmOIAowXq6kVYbMHfpvn/5V2+C+JWzLKsEMaxdIuymiE+xAFrhPrrgMtFyjDLokLXHSRJOjo6ZmVlHThwIPX504plpMEuhA0OHsWa/nymvJnh8PDxMzlIH1BX3bWG2kGNvzgTIC+Y7sVSfz1W3Uy0fRzx1FaS8Xkzu661NR4q6O2I6bwlT+5dvnrtau3atWWygk9usyg8EvI9w/LpYMt/Ub5Y3YvFwt/6jRie5RfCjlRaakZESh5Ki7CLiIgQ/qJFUM1TSIjyTsTaMRqNN2/edHd3v3//flJSUpUqVSpVqnTx4sVHjx75+fk1bNhQqGOKjo6+cOECSZJubm5yubywW18IrF271tbW9jV5p9Vq9+/f36pVq3c3N9m7d+/du3fr1KnzAV3FoqOjhw0bVq5cuc2bN7/LTCLHcWlpaUKWiZD4de3atcmTJ9evXx8htGrVKkdHx4ULFxZdC0WIAyoZaE8A0hlgiiIQH/xFG8Ps7GyEX+MTUhDLwo/u5xYXFycM9FUq1Qc77xQOGB8o1V0BbDZQ1wIYyf9amKhUKjs7u7sWCCY31E3hpYK52fTZx1Q0Ht6pf+/sDRtOHj9iPKENcsTrlpMT+IsomTaXO/cI6TS1PmtUb+2vv/594SyJZVb3kZZzlwQ6kzo98zw95+GDh/Hxcf7+/gV+2LyNGYZjwHIm8AL9pUZ/nxieoOrUhEyUdyUFxkLery1btlyzZo1gd6dWq1u2bPlva1o5orwTsXZSU1OHDx9ua2vr7e2dnZ29ePHievXq6fV6DMPmzJkze/bs3r17379/f+jQoWq12s/PLzY2Njk5uQi6r+Y1ujGbzampqcItjWXZJ0+ezJo1y93dvU6dOkqlUugRKZVKs7KycnJyXFxcJBKJwWBIT0+3t7fPq8r84DSs06dPlytXzmg03rt3r3r16gCAGzdu3Lx508PDo1GjRnK5XIhonjp1Kjk5uUaNGqGhoTVq1BDkXeXKlZVK5c2bN/39/X/99VcAQHp6+ldffTVjxoyVK1fKZDKdTnfs2LHs7Ox69eoFBgZyHHfx4sXHjx+XK1eubt26BaahIQ5oLcx9BOT+SF7OUgdQyLdGHA/09xYe3r7zmKEZ8qMDlnfu3BHknaura4Enh30sEOPN2vQ3AaNDto0ArgaoEO9SNjY2arX6+rWrWRmpGAAucuAiAWmZ9L1Y4y1zDGl3Li42iqKZmDQUEU9Vc5eoZJYTCYep6fTNJ/oY/KGRwZMS4ziE4rUgOtHsq8FVBFRJoEYhiY+LiYmJKQx5J1jZ4ZCQYUId7YfE8ISKChlGipOzVguyIITYVSpV+/btMzMz7ezshGcbNGjw22+/bdq0CQDQr1+/Bg0aCMvt7Ow6d+6cd9HOs6AH1ooo70SsHeFL2KZNm4kTJxoMhrZt25pMpnXr1ikUihEjRhw5cqRXr17r16/XaDR79uxRKBT79+8fNWpU0XzrCIK4e/fuoEGDoqOjMzMzZ8+eHRISMmXKlMTExAkTJnTu3Hn69OlJSUmDBg3y9fWNjY2Nj4/38vLq1q3bgQMHYmJiEEK//PJLeHj4BzufmUymU6dO9evX786dO0ePHq1evfqxY8cWLlzYunXrTZs2nT59et68eSaTaezYsQaDITAwcMSIEV9++eXhw4fr16/ft2/fdevWeXp6li1bFiFkMBgUCoWjo+Po0aOHDRsWFxfn7Ow8YsQItVrt7u4+cuTIr7/++vbt2ydPnqxVq9bu3bsbNmz41VdfFZzCwwAyg6xzgMkE6nBL04XCjDBxnLeXu6uLY3JK+t37T1JSMzx9PD9mfzRNX7t2TXgcFBRkRZOz/wD5C37uXUinIof2gHTh65cLBycnJ4lU+jTikZLOslFhOD/EQQTOOahVWSlZ27dvz87OghDISEyNIcbIpOZiJg5opFDCskpI371z83HEY51OJ1cofcq42klYzMwgisVY4KomMrTJycnJoBBBBIbLhejd+8fwOARwCPEimT0Q+QCUSqWTk9PVq1d37NjRvHlzW1vbiRMn5qk9IbWgc+fOn3322WsNylUq1axZs4TVsrKyjh07dvXqVScnJ6udvRXlnYi1gxCSSqVVq1bFcVwulzs7OwcFBQl16c7OzhkZGWaz+cmTJ3Xq1BEWhoWFubq6FlkObFxc3MSJE4ODgxctWrRy5cp9+/Z99913I0aMmDFjRt26dYV4flxcnIODw4IFCyiK6tev36ZNm2bOnOnq6jp69OiNGzeGh4d/sBp48OCBVqsNDw9XqVTLli0zGAxpaWlC17W2bdsKNmxXr16NjIzctm2bs7NznTp1jEYjx3GC/OVLGN/4oBwcHDAMMxgMp0+f1ul0v/32m0QiWb58+eLFi3NycubPn1+zZs2HDx9evXqVYZgCdfjkSyah7jJgspCmPsBVhRdhQgxT1q+Mv1+Z5JT0rOycHXuOjZ887GN2eO/evUuXLlnCgnirVq2A1QJJYIyGyZuQUxcg8+ObmBUCTk5OJEFotZlyZLYlodnM5eYyHmpYRk34ujs6IWlGRgZnNlSyyfZSYaejzTqFIyGXG+Mz/CR0DU/JvTSQyKg8PT0d7e28ZZm2hBajkdnEARY5SFGaVpuTwzvaFCo4xGQY8QExPBbjNKQcs8rOvyLActcYOXLkd99917dv382bNwuTsG9egd86cM1b7fjx43379iVJctasWVbrwy/KO5GSgTDtJQTD80qZ8ofoiiVewrJsy5YtmzVrJpjZXrx4keM4T09PqVTq7e0ttEJHCMnl8gEDBlSoUAEhVK5cuYoVK9asWRMAULVqVUGBffDBHzp06MmTJ5MmTTIajbdv3/7777979uyp1Wq///57juMGDx6MYVhiYqKTk5Mw9dC0aVMAwK5du4TN8xcB5D3QarUcxymVyufPn3t6egoCrly5cuvWrdNoNJ6efJQr2AIoeCDfaEF/i8/Gs28NJG6FFGHiWM7G3rZTx6YX/uZNEDZvPTio32cfU1CyadMmIZExODhY+ONaLxgBqASY+DNy6QuUYRYNXcChbpVKBSGWk5MrBbSXSpKVyz5Pp4NUksaOZg2ZHmFQ0bbAGUc+cvx5Lqv0tg/xd5ApyYwMLjmas1caJ9aSPMjBzZB1V6eHanK85QxnApHJZhmEznJ0O16nz80Fhc+HxfAYnCsjsyesoyOciACEMK/9DI7jY8eODQkJuXz5sjAC/wDq1q07derUmjVrNmnSJG+htXWzEOWdSMkGISSRSMqWLXv16lWapkmSfPToUVpaWtGUVuSH4zgMwziOEyoo82fg8lM2liDZa2m5HzmDnJ6efunSpdGjR4eGhkIId+3adejQIYqiatSoMWrUqG3bti1fvrxZs2aurq7p6enZ2dmOjo779u3TarVvXoYs7aD4T8xgMGzYsMHf39/Ly8vR0TE5OZllWRzHY2JinJ2djUZjcnKyp6fn7du3jxw5MnbsWCG3r4CBBDRFg+QNyLET75nCK7yCv1Mimu7eueW8RetTUjNu34v4edUfEukHXp3PnTu3bt064fHQoUP/rY+ZFQEJyObAxJXIqSeybWCptCjIaLdg6YdhGA5AWRW4m8E9SqYbu+BlJayjTbo/SMtkyZRcSmtANk6khmT8pFo7GzzSZKYcMAODMenmYAXtLM/2UHDe9gREWJyWTdAyIS4ShAAuFNkWCR8Qw2MQ6yRVY5BP3xOxEmJjYzt06IDjfJqAcLkjSRLH8VGjRn3YPA+GYVKp9O7duz///LOwTwzDkpOTrco5RZR3ItYOQshoNOZF7EwmU167J4qiTCYThmH9+/cfNGhQt27dypQpExERkZubW4xfM0HMvW9th1Cl8V6bnDp1ymAwDB48WEj1ValU48ePd3JyunDhQqdOnZ48eVK2bFmSJMPDw728vCZOnBgaGvrXX38NHz7cZDIJQtNsNtM0Hx67f//+l19+CSGMiooiCGLhwoUSiaRRo0YHDhyYNGlSmTJlDh8+PG7cuLt3786YMaNp06bHjh2rVavWu1v+vjeQAHQalrSKc+rKp+IJ/rcFCuKQu4frmBG9p/ywAnFo/tIN9et+iMFNfHz8l19+qdfrAQDh4eE9e/YEJQKIAyYHJv0C6FTk2IGftC043+OUlBSGZRydnDIwmQowZWTwZjJ9Sg1aeZMaCF1wdDcxVyMDdkoitIytUWYr5RwBK7PB9WFuOqNK+4TLTks2p2WBmg5SjOayTOy2WyYpgGWUIC4bqVQ2avVb2sRZSQyPRqwdqcT4JDxR4FkLOp3uwIED4BNDlHci1o6zs/OyZctCQvhORDiOf/fdd7a2LzpZ9e3bV6fTIYSqVKmydevW06dPy2SyESNGpKSklC9fvgiOzWw252lNhmFMJhPHcXZ2dgRB/PbbbzRNC/N0JpMpT57mKSohH99sNgMAvLy8Nm7cuGfPnrZt2757hL9ixYoLFy7Mq70NDQ2dMWNGhQoV6tSpc/v27aCgoNGjRwtpvwsXLjx+/HhqauqsWbNq1qzp4+Mj5It8/vnncrlcrVYvWbLEaDRCCDt27Fi9enXhE3Zzc1u0aNHRo0dzcnJmz55drVq1Jk2ahIWFPXnyZMSIEU2aNCncCXHesE2PpfyGzPHI8TP+1wLtu8AHXjhu5LAex0/9febcNZ1O/9fhc++7k+Tk5P79+9+8eRMAIJVKp0+f7ujoCEoKEAccB1M3ASoRuX4OMGlBxfDS0tIYmnZwcDQTSozNqmUHo7LQnmeUOwkqOuCUkYvLYrMVOMDh5ceURG0GSQaWYDBgRLSBMZuz9CAqHbnhHDKxBgROxdLnY6jaHqSXHD5IYjGZuoh9Z94rhkdhhJqQWuKLorwTKU5EeSdi7SgUirz8BgzDhFaAAvnTv8pbEB4HBQUVzbEJ1ifCYx8fn1atWpEkaW9vP3PmzN9///3SpUs1atRQqVRt2rRxd3cXjr9hw4ZeXl7CJmFhYYJBSYcOHWJiYq5evdq4ceN3l3evvU2ZTNaoUSNBENerVy//Uw4ODj169Mj7VfBPEQSi8KBz585vfQkPD49Bgwblf4nWFkDR6Q8jTN8JzM+R6xBAaAq22IJjWY2dZtGciR26jY5PSH3fVM4LFy5MnjxZqKgQMm+KPiWgIAqWEf8JU2nI6xuAyQtE4en1eoPB4OzqloMpzOaMQDu8iSM4l45+vk+19MSr24MwW3xfrutzZbCclGC5jCFVr9XplEqFjU1ZQErjtVpT+sMw95xHydTpJPZ6Chtii1W2g/YYl6JjSSfXd3eULPoYHo2zckxihYXTnxocxzEvB9JFj9kK+taI8k5E5MMZMWJE3uNaFoTH+TWQg4PD3Llzhcc4jk+YMCFvk+7duwsPNBrN1KlTi/DASxAYgDjMOg3N8ZznJCB1L1iFx1J0lWqhv/4yY+jwaXEJKXnLs7OzhaTDt24VFxe3bt26n3/+OT09PW9hTk5Ov379Nm7c2Lx585Kk8xAHMBmQ+RZgtMlgMGRlZVWoUIFQ20VkxNbWgOpqSHDgSAq36Sn33A1XK0l7V/dqbbvnmKjsrCw8Vw9y9DZqtYurqz4nJ/3BVblJej8352isOTYHhdph9Z2gu4TT6VFcNutWPdDX1xcUOe8Yw6MRKeVXEylOWJbz9g/84ae1HFekrZZfgIC9s0teql9xIZ6FIiIiVg7kM8P0t2DUWFTmW6CqVLCztKyZatGywaZfZw/4fEps3IvO4hs3boyLi+vYsaO/v7+7u7tUKmVZNj09PSYm5syZM3v27BHqZAXJnlfZnZqa2qtXr8aNG/v6+rZr165+/frAykEMwJTIbRyya16ABRa5ubmZmZm1a9cODg6+euxRvWxzTVvMTwqq28PrLBljI0U0Z6JZDw+POw8fp6amSqVSJ2dnDMMois6Ii9BkXQ+vyCVlqZ4grKyMDlNz9jhSc+hEIpeBaZqHVhDKt4ue/xvDAxAyiLfNK5bDE8kDccjJ1a3H0CHFdQAcB2iqOJRlPkR5JyIiUlIgC6kvLWcyN2xSu1/v9j/OXS0soWn6qAWCIPLLO51Ol3/DwMDAH3/88eHDhz/88IOwRKvV7t69GwCwevXqBQsWDBv2UXZ6hQtiAKHh3EYAdbWCtUdBCGVnZ2s0mvr169+7fvV82jM/GYo3gBSJtFVFdR1vyelbOce1JoBhfn5+jg4OJElSFJWVlcUwrBIze2rMTb0kRHlVi1DlX1d1d57o7ABL/6+98wCPqljD8Mycsn03vfdKCCF0AqF3BEVRgatewYZYrnpFsCGKV0VEQFGxgKjYsSIKSg9NWqT3kkZ6z262nXNm7jO7IYQqQsoC8z48unv2tGw73/7l+x3K6pMktF1a546dWtCB4uIxPAAIJ0A1ElnZXYuDMXa0fIK0JWHyjsFgeDiEeqMYupCwSUD0bwqvY3oxVhTN+abUy7Kcm5t77vLk5OQ77rhj/Pjx9b0UM2fOtFqt9SuYzWa37cKECRM8cYgFloAqHAfeC3SJANP+nsZFURRBEPr167d69eqVf+QFqBwKj1TRqiFxqooCW36pYhW0dqccExOjUatlWa6oqMjOzoYQlmSZth6sbadxxIeo4r2FkW21b+fZj9VYD1fjIw7dQwMHduzYoeGMAY+K4RFAtFDUcAIbOMtocZi8YzAYngymiRafISRwbFNPSm3oZDFixIj09PQNGzbs2rWrrKzMrSfUanVcXFz79u0HDx7cuXPn8PDw+vX/+9///vrrr5mZmQ13KMvypEmTAAAPPfQQ8CiIRLSJJOBfQAxtCm1XbwIXHRU9etSo4oL8n/f+mRKI+hmgWO3IzrPmOHy69Oltt9l279pVUVGBMU5MTIyMjCSEnAyJ3CwFfbAp9/5kqWOYYEIozgjX54JMs6ZN7wE909ObuW32H8XwMCEix4uIZ6YojBaHyTsGg+GpEAVAkQTcQnyGuXo8m1DbnUViYuKkSZOefPJJh8NRXl5ut9s5jvPx8dFqtefNDGq12vPOJqqtrX3ssccAAB4TwyM0bmfoTJ9S3qvpxs664QV+8JAheSdPzs07+VdNQU+zfCRL/j0Lgbj2vYcMt1hrS0pLMcZeXl4lJSU5ObmEYCQIQQmpa9YUcvbaMAcvC1xBsfxnJQxJbjv+wQnt27cHnsF5Y3gYEA0n8nQiGdN3jBaGyTsGg+GREIVwWuI/Bug7uq6bzVqn7LZ95jhO6+Jv1xcE4eabb161alW9qaFHxvAIfVaN3YH3AIDE5pHLer3+lltuKS4u/u6brxbvLczx43BYh9vG3d8qKSk7J9tus0VERGi12jVr1mi1Wp4Td+3YVlRYaAHCxhL84X6HngPLS0VjeMKEhx7u3q3blQyOa4YYHiZYjXg2soLhCXjQR4XBYDDqIDJQhVA3Y3VcEw0lu0S2bNly8uTJS1lTq9WGh4efOHHiQjG8srKylJSU4cOHt4xGoRIEAq++wJDmUiTNN9YlLCzs0Ucf9fcP+GLB++sxGtF9YEJSa6LIft7eRq1WUuRfly7dvm2LWhRNXt6iVqc3eZntjopa8qEd6A2GqLadxj/8aP/+/UwmE/AwzorhYUBUSGCxu5bCHSCvtyOBLhphghGE6Hz7gYjaRras+8lFYPKOwWB4XCMF0SQAnyFA8AekbihIS/Hqq6/++uuvV74fWZanTp0KITSbzS0g74gCkEgMaUCX4hJ2zXpB4jguNDS0X7++RcWFsiQZA4K//GRBSWF+VWUVjXhxgpMALx9ff39/vcFQWVlVXFpqNls4xCleft1vuOH+++7r0KFDk0w3buwYHgFYpLfZyIrmhuc5iIAs0cHfHAckCRMAbDarrbbWy8f3Suoi6KA5p7OmqtLo7XPWJ9dqMXMcL3rqjGkm7xgMhufgiirpOwNTL8Cpm7PYrnkQBOHw4cMdOnRo3sMqgNMTfXugjnLluFtGeRBC/P38jUYjhuhEbt6WrVsryitkWQEI6jRarV6v1uq0Wq3d4SgqKoqOjk5PTx8+fHiHDh2io6M9Kid7kRgeAUBgpnfNDsdzBbm5K37+/tCeXQaTd+8hw9L69RdFbvl3S376/JM5X/5gMBovO4bHC+jg7v2vPPnotPfmJ7Ru43a4hBDZrLWPjrqpe//BD056lr6N/w4IIeIQwaTZ5qF79GeGwWBcT2AAETGmA0NHeq95i+0uxMsvv9xwNskl8t13333xxRfn1uE5nc6ffvqpWeWdy9yO6NoCwa+l5LI7exUVFTVy5EiVSoUVpWOnTjccO757z56sE1lFxYUlRcV2uw1AqNPpElu1uvPOO1NTU8PDwyMiItRqNbgaqIvhEcLRgSUsdNd8cDyXdeTwi488YLPWdu8/uKy44MX/PDDusYl3P/qooigOuw0hpFJDjDnJWSetIIQcj7BSd5c6k0OgyK4pNa5pwbzg9iXG7reuy0LPRk5ty/NIwUAQxXGPPRUYEoox4XiOulojwPNAUWjs0O2C6B5EyQs0i2u3KYf37DaYvIPCwponn8vkHYPB8ABo9lBLTKlAE+eanXB1XyD79eu3bt26rKyscx+qrq5uvvMgBAg+RJsMkLaZ5XLDdJj7trcL95KIyMiUlLY9e/asrKysdSHLsiAIGo3GaDT6+/vXr3kVURfDY5Z3zQiEUFGURe/O4Xj+oyW/+wb4EwJ+W/zN+j+WVVfWcBS+vKR415aNokqd3KGTVqcnhEhOZ87xHN+AQL3BCAAoLsiXZTkoNKy44CQhxGF3HD90wD8wKLFtu/qwsfs9DBFQnPLxQ0e8fP18/QMSU1I1Wi3BpCAvVxAEc011ztEjweERiSmphL4TCOKQ1VJ7YOcOm632xKFDPyz6eNQ9D971MG2lbwaFx+Qdg8FoaYgMBD+iSwZI5SFBu3qmTp3aKLV39dQPJm5yCAaCL1DH0CbZRpo2dunIsixJUsNr2Ln1T76+vn5+fu76d/cSV506jam4A58XvwQ2TtV8o8JBRDzB/ea6AUJUXly4a9ufYx990i/I3+nAEICBI27tMWCIyceLEGKuqXnv1RePH9xfWlQ0eOTtE195Q6PTlBSWvfHMk2P/82S3vv0BAD9/8WllednTr89e8uVne//ajhWSd+KYubrqgaee+9f4h+vftjS5yoFvFry/afWK52bOVbyVOVOf6dKr723j7v/y/bn5OVmyJGUdPeJ02J/834yht40BhFhqamY8/WTmpgy1VldaVPCv8Y/edMe/WXKWwWBcJ2BqrmvsDJylwFlGfyB7EqpGrZu+8cYbR4wYAZoHMQCIwQCg5td2AIB58+b9/PPPTRqiQAgdPnwYeBhM3TUnEIKykmK71RoUFu4K+tM3HMdxBpOJBlEJsJhrbr/3wfZpndct+33GM/8dNuqOTj26YUUpKyl22O2uEBswV1dVV9IR0jVVVSX5+W988nVIROjCt2YtXvjhoJtvDQoLqqucQ/CHzxb98tWiSdNnR8XHWi22yrJSq8UMISgvLrJZrS+/t8DLx2f21GcXf/xh+oDBvv7eG1f8vmf7ltmff5fQJunL9z9YvfSn0fdP4HhOuYRavSuHyTuGZ+H68X6FlwRCP4geYSHLuDguwzB1JNAmACh4WtzOjUaj0ev1jbKrtLS0hQsXXoqLXiMg+FPX4pZr4cxx0SKHZlxHQOB0ODDGXIOOFncMmAMcJjgwOCQptZ1arWnbpatvQFBpcaH7ysBxXP01AlHcm5P45JSI2DhBBF169lv+/WJzVVVwOJV3CKEVP/+w9KtFT7/xVrc+vSWZfqwQx0FEPQ4Rx7dKaRcaEQYR6NZ3wO5tf1otFr9A75qqSr3RGBweYTSqw6JjqisrrBYLDAxsnueGyTuGp0DnEeXlHTy4X5bkKxFnCEG9wZjcJsXLywtcT2CMT+bl1dZariSCAKmBF/LxpS4VoGlxlSJrYoEqBHgw8+fPf//99xtlVyqVShAE0NRACARvgNw2Is2q7VrWAMxT3ccYTYtOr+c43ul01L/+Lm8UWH8NwYorHUoAx6GGH4jzXmXctQEEI4ggotKNbgARKi8tXvXLj7wo5hw7quDzZOBdG9JvXoRcxyYEKyCtb/9l33/96sT/xCa1XvnzD5179gkMCVEUlpxlXGeYzeYd27d5+3j7+wdcyVXp2LGjubm5lZUVPXr28vJqzAJth8ORlXXCYjZfoX4SBTE8IsKrsYvHDx7cv33bNi+TyeWwelnnBoAkSaWlpRqNpnefftExMaCpoCkUoI4GPC1t9kBoD52LpuvcFAShCWLMCCA9oNZrLQDP802hXwkhiqK4tSPteeTOF5t3X7wZ1xkYE/+gEKOX15H9e/reMAhj+sEtKy7bviGj99BhiHYxnw9atUnfVLxAfxX87ceQEKzW6J783wxZkmY9P6lt566denZ32C+0ct3Vi2DgHxiS0rFr9rHDeceP337PAzeMulNUqVntHeO6w2G3OxyOjp06G1zdTJdNVXVlQGCgLMsZ69b27TfAaGwcAUEI2bN7Z3ZW1pXIMgioq21JaYnf0cO9e/fx8z/PlNLL5mReXnx8Qvf0HlcQs4FVVZUrV/wREhKyPmMtACQ6JrYRz7DBcUSg8qONFJ5KWVnZ0aNHm+6LGEJot9udzsY2bUZNHx28MBMnTrzjjjsaV7NyHHfs2LGnnnqqtLQUABAS5D/jlf9GRoYqrqlx9WCME+KjibNpR+gyPA5CTD7eQ0aO+vbjDyLjEtp06FxbU7PwrZkFeTlpffoCCBtGlGndDw2yAb3RZDSZ1v72S1Jq2+rKmgO7d/oHB9dndU+vX//xJ0ClVgeHhce1br1x5fJ3X5k654vv1Bpt/fpnbOg+BnVsATs2rd+zY+uEp583efvygiA57AA23+QVJu8YHgRC9EfVFe4EY6zXG1Lats1Yt3b9unW9+vRpFIWnKEpRUVF8Yqt27dpfdhIKQnj0yJFdu/7y8fFZn7GuZ+++jZgDhQCeKii5Iot2Qkjr5BRvH5+MdWsBgI0dw6POr0DQAejR7q8//vjj+vXrm1TeYYyLiorANUS8i0bfrY+PT30MVaNRp3VpG5sUC6SzPfwIzcF5ViMto6lx51JvG/dAZXn59Kce9/Hzt9ZafAMCn359tm+AD4JQrdXWeZrQ2zpeEDAGRpNp9P0PvfHsk/v+2h4SESmqVDqdgTYjqVSqU+80hJBGp6OGde7bWi3GGCEw9j8Tn7n/riVffT76vgc1Wq0girTuQq2un13B8bxGq3N9wEFkbJy5uuqFh+4XVCIA0OTtPX7S8/2H39Q8+Vkm7xjXIBhjtVrTq1efdWtXb1yf0at3H72BfnqvEASRwNPoyJXFJ4goiN269di+fVvG2jW9+vQNCGjMGF4jQDvOSHJyCsEkY92aRo7hQUTHUXh8f2G1i5Y+CwZFluXTCS9C6IQASVbOkXeM6xOCic5geOKl126/d3z2kcNGL6/45BStTmu3KQNG3Nr3hptEtVqSFG8//3e/WUJDaBJt4RowYmTrdh2yjx2JTkj0CwhSFPrj4MHJL9B3GiFOh5KU2mH+LytVKpXdpiS0afvRkhWiSuV0KKFR0QuWrlQUzPH89Pmfcxxtg33mjbcghO7ZFV379OvQvYdao3HYpF++WjT01tF3PvQfQnPB8oJZM75d8H76gMGiKDLfOwbj8tFotT379M1Ys3p9xro+fftpdbor32ejfCZpVxfPpaWlbd26ZUPG2p69+wQENFMv1T/6M9uktAUANHYMz3OFXQvGfiTptIK5inA5+Df5RYTnedYIz7gIGGMIYWhkVHh0FJ37q2C30hJc1FdtqrU6d+rU1W+hhERGhUVHYVrVSXjXau4InHsFd/TOnZ9teJtgrFLTviVCiNo1B5kQ4o75uTfkeFqDCiGwOx2H9+1WqTV5WcfVGp25uqIgN9vk7d1sRaJM3jGuZfQ6fZ9+/detWZORsa5nr156fSPE8BoF+lUiil3Tum35c/OGjHU9evUODKTt957GKYXX2DE8D4QQXx9TVGQoQs2uJAhQqQSVKFx14w5qamo++OCDENoM2FSmNhzHFRQUsEgq4+JQjaYo+My3ITnzJ5O7JK4e/LfrN/i9d8btBrHk82zoDgASoNZoxj3+1Eczpz83fpyiKCq1Oiah1X1PPiMIAkvOMhiNgE6n79mrd8a6tX9u2pTes1czuY5dGoIgdOuevnnTxg3rM3r36Utbhj2PponheRxYwaNGDu7Ts8sFu+2aEAIRDAsNuupKx2pqaubOndvSZ8FgeCJYwZ179mrToXNJYb4kSVqtLjA0jOOQO7LYDDB5x7j2MZpMffr1W7tmdca6tf36D2jcOQRXCM/z3dN7bNmyee2a1X379fdshXctx/AIIX6+3n4Bfi3hA0zNh7Fc5/3BYDCuDWSJBu0i4+Lcvoz1WePmgck7xnWBwWDs2avP+ox1GzdkdE/vodF4UAyP5/kuXdK2bf0zY926Xr17e1od3vUTw1MwBldb/Kz5oTPXHY3t53LJOBxOJoIZf4uo4iAEskQdD/7ptq4ZFqcqNAi11jsrrM7xHCDn3zOdXeYqrcMKNWFx1wW21JcKk3eMaw1CyHkLsb29vfv1H7B65YptW7akde+uUjWVXe1lIIpit+49Nm3csCEjw9Vp0cIxvPMmKNuktIUIrs9YCwGIukYVHuPiEExMRv0do4cVFJXyp5yfmw1ZUYKD/E0mwxXPLWRcu0BIMN6asf74oQPtunRLTGn7jwrdIIQ11VVV5WX0PQZp6adfYLBWr5Vd/bbunRedPIkQ8j3ndzgvcLKkFObmAggDgkN5nmvOWN25MHnHuNZQqdVFhQUnjh87t0kTcSgsPHzP7t1GL6/27Tu0yOnVdVedc2nkOK5Hz17btvy5eeOG9B49/VtI4XEcRwgpLCygvzvPrEQGAAYHh8TGxq1bt2aYwdD0U8sYHgdWlKAA39dnTAYItkwSGxNid+Am6+RgXO1wHDqwd/fLj0/w8vH3DwpJSk39R28WxKF1v/0yf9Z0V/crhAj5BQY99PQL7bt3V2TMcSgvN+eFh+4xmLymvTvfx8+vXjtyHJe5adOnc98szMsFAIZFxzzw1DOt23VQWk7hMXnHuNZISkrevm3LX39lInieEJRrHCGqKC8HLYRarbHZrIcOHtBotO6BhqfPDSJvH9/s7OwtW/4cPGSo6DLMbGYMBmOrpKQ9e3bv3bPn3EddlsnQarVWlJczeXd9ggkBtgvMY2IwWhqBB8UF+TqDac6X3/kHBUhOheM4XqCGm1gBkrMuZ0ovBDzECuA4oGBQL8IgBGUlRSq1Zsrs96hhnsP2xfvvznnx2dlffOcXEIgQ2LEho6aqqqK0dF/m9j433ODWjrzAbc3IePHRBzql9/zX+EcIIb98tejZ++9+9YNPUjp3rov8NTtM3jGuNfz8/AYOGuxwOM/vbwHhnl07LRYLaCGCQ0JiYmL379t33gyyKytKaqqrnE5ni8g7AEC79h1i4+Lo9935nkFCyOqVK88J7DEYDEYLgxDavf2vP35cXFZU+MW8tweOuLVt5w77d+359ZsvK0pLU7uk3Tj6TrXLPKEgL2dv5vbE5LY7Nq2PSUzq0C29vkQOQmT08kru0EmlFnmBlnu++OgDRfknA0MCHTbpz3Urb7htTEFuzuY1K3sOHur+GnfYnV9/9G77tO7T3vmIF2lmpn1a+jfz5yGOa8FvSibvGJ4ChFRONIp9Kc8LvGu8xHlpKdnkRhCErt26d+zc5byPQgiLi4o2bdxwGfXjVzSM7EwuPvZXuAod2hgMxjWPK/ZWnHPsSK3FfGDXX5179Ny9LXPKQ/dGxMQFhoZ8t/CDQ7t3PvXaLINJm3Ps6NsvPReX1AYrssHomgMLIe1urdsP5HlBEOjc2JqqKo7jVGo1hCDnxPG8EyfufXxSQV7e/DdfKysu9gsMBAQWF+QfP3jgv9OmCyrO6aDxQr1RO37SUwqNF7LkLOM6Q1HOqI6GEMkKUQik/60Ln58HDl3hQDDK5XXe0eGDEIFGMkW7iNc/L1zJp7LJLXnPmrrNYDAYHoKi4P7DhxKM58987Y1PvvLy9n7m/rvbde029a15Gh3au2Pf0/fe9dfm9f1uHOL+Kht174N9bhiCMXUwqd8JQlzO8WMzn5vICyIAeMva1V179YuIpoZQ2zesDQoLS2ybGhgaJojC7m1bBt18M8aguqLc6XDoTv0q3pu5Pff4MV4QwiKjW6W2a6lng8k7RnOTX27/el3R8ULLmToNOhz24iLj6qIsUVSdVZTmhhBg0KCbuwV1b+3d1Cep2G20UqOBWpKxDGQ7sVsVW+0FYlcEII5zzas578wc4ArTQ/Q3/YYXF08yVlYd3bbq6DZFURoqXYRQTk62IKqCy7aedw/E9es0NTjh9tQBWsGDnP8YDAajsVBkIDmdGGPJ6SwtLsk6evjOhx7jBWS14Ki4BN+AgP07M/sOG0II9vLxjW3dmpyp7dxRPKfDUVZcJEvShhXLbxxz11OvzVRr1OZq6+Y1K3V6w/YNa2VJEVWqjSuW973hRl7gGqZOIITbNqxd99vSwpO5Hbv3fPXDTxFCLfKTmMk7RrNid+IZi7O+Xl94rhcQbVOCGpxTcRFfWYzBxv1Vi55qGxfSCANkz4tsMRf9sKBq1xasyGcEwwjRV1bUqtQH9brzf1QJARCZ2nULGXUfr6fRfofdXlVdZTGbHQ5HSGiYwVosFWUhrQn5hHC+IZC7YPr4IvxxeMu/v55a67Rx5zSOICocCT5xwVoP4tKOxeaKyX3/fRmHZjAYjKsFSK8XiqIoLnVFlxAAEM9JkuRegY4xk+Vzv8wVRYlPbjPz068EHkx5eEJFaSnH84gDOcePHt67G0F4cNdfbv+UyrKyovy8iJgob19/lUpdXVXpSvCSOx54ZPS9E9577cXi/HzQcjB5x2hWqq3Sn4eqASEif4EsJ534ecEMIyEgq9i6N8vSdPKuZNk3uR+/qZz6CmgIj5BCSOVFfocRUv3XJl6v97/lnpKS4pLiIqfDjmmumfj6B+itZlyUhTkenDyMvAL52Pa8d+A/Taf+fvhPq9OmFS5s2nfR7LFdcqw8uvXh9Nv04nmijAwGg3FtgDE2mLz8A4Pyso5zPM1vVFfVVJVXRMbFn89T4cxtFcVmtXIG7a1jH5h877/W/75s2OiRW9auDgwJnf35d1qtDkJYmJ/33ztv3bVlc0RMVEBISKvU9it+XNx7yDCtTlRrdA4HOZmdJdD0bovB5B2jWaGDWYgrU3m5QAilpjQ1rT22H8sSEi+Yvrz4NwOWnBX7dta0Sa+sqnR1ikCEYJ3TMkS0UhdxgCi4PM9ZWwUSu3JBMf/ouZCxjODp9C4hRFJkd+KVRzxq8MTKdGI2BoDwHF8f6nPliInEbMMYDMY1iqIoDrtdURS9UXPDqDs+euMVtVoTERu3/PtvDCZTWq9+WAFYpuucN2cqS5LDbqdzKWSSlJqa1mfAlx/MTe7QMeP337r07BsQHOj+xo2KS2iV2n7V0p8G3XybSiPe8eAjUybc8/S9dw66+VbIcZkbMw7s+iu1UxpoOZi8Y7QYhLjqzCCkAbvTS1wT1imnFrq88k+vRkBJUcGJY1Wycskij9AxMqFhEWr1pUyqoB/ds04UOx1np4whosKN48/q9UUQ1VRXwcpyxPH1fVjnAAHigd0iHfoTCBreN/hS/xC65enDEUC0orp1QDRxyb4jZblWp8Ot8Agh4abAEJMfgii7srDYXOFeDiG0223Hjx7yN/iGhIVWlJdXVVbWP9eEEI1WGxoaVlhYUGux1C/HhBgM+pDQ8Cvva2EwGIymA2MSFBbec9AQtUYjS2ToraMlh2PpN1847LaI2PjnZ73rHxIsS8QvKLjXoKFane4shUcwiU1q7XTYEUIYE47n73jw0S8/mHvswP5Wqe0GjBhZP6OM59Etd92T8ftv1tpanhdSu6RNn//FZ+/M+uL9uRzHd+7V55HnXqo1m1vumWDyjtEy0M+UWuREHkkytjnrugQgBHoNhyC0ORVJIXTQOiE8h7RqHgNidSj0kwiBKKq0Gq106fLOVZd23kFbl3KiSFT59R7KaRqkgwlQbFZHUZ4t+4hsrUXCmVV0EDSMol34nDjiqJWzd3NGH3h5vQ6EHmjKwPvbhcQ7Fen55fO+/Ot3FS9iQtS8+N7Iye1CEyutNfct/l9+dYl4qtQPIU6vN+h0OgiRWq02GI1nu8ZAqNFoz3i6CFFrWDKXwWB4OoqCUzt37ZTe1WGn+QsA4K3j7hly62hbba23vz+EdQ7GSant23Zuf2qdMzYfcNPNg2+52WFXXMV5SlxS61c++EB2gv433iA5TxsgyzLu1q9/z0H9XQU4GMggpVPHmZ9+Vemq1fPy8XanTJz0stUyVgNM3jFaBgWT+waFTRgWvuNozYR39jkkLCskNcaw8L9t1SL6NqPw5a+P8RxSMLmzT+Dk22N3ZdU8/O7+GquCEPTx9Q8Kba6ZXRjzOmP0Iy+qg8LOekSqqareteXk53MtB3fSMN5lADlcUSBXFAiB0ZezNYQV1pqF25YsGDXFizM83mPM8kN/mh1WpyKN6zy8b1wnAMBnO37dcfKgcErbEUJUKlVoWITBVXtn8vI2eZ2nDdnXz+9y/hwGg8FoaWg/ha3+HpGcilqj0Wi1GNNC6POtcwaypMgNSq/pmlbXcvlv1pQlGqfw9vMnAEgtNKmiIUzeMVoEqGCSX273N6lSo43+JjG3xI4J6RBrjAygsqNLopdBw9faFQ6hlGhjoLfKelCprpU5DgECLJaamir+TOO8vzseQgaD8dxJr5e8PY3GydZaR0EuwTLkBHVwmGD08us1RB0cfvD5ex0FefAydg4hwAquKCABUZeX9xQ54deDG5fsy7g9dUCb4Lhb2vT5YMsPMd6hD3S9GQBwqCR77sZvYYP8Ma1clKTSkiKi99YbjTab1Wa11iejCSCiIBpNJovZbHfY6xPBBBC1SlVn/slgMBhXFfgco4Ymggb8PKaymck7RsuAENx1wmy2yd56PjpQe6LIpuJRSrRBdkWyowLUkf7qPdkWvQa5m2T/OlojycTt+FtZUV6Qb/kHv44I4Tg+OjZOc9kZRtdvvtqj+45Me0S2VAPEaaPiY/4zzZDcQR+f7NfrhpOfvwO5v9s5oaMNz3Z9wQoxV9LlFx6zcREghE5ZmrF2UZ+4Tv46r/FpN/+yP+OODkPaBMXaJMerqz8prC5VN8z8UnnnLC0pBnZZpdFUVVWeXXun0Wp1uoryMkvt6do7QgjN5+oNl5fgZjAYDEYzw+Qdo2XgECwot+eW2JIjDfEh2pU7y7z0YkKoLqfEarXj1pH6uFDdzhNmo5aPCdLYncr+XDPPQ5e1HAgOCYtLDPhH9QwQAO7CgyIuFawoVrNiNUPIVe/YWLLyJ0NyBwCAJiqB/F3sDQLC+wSTuA70D2gIIVCtv5JZbALHHyjOmrf5uxcHPpAcFPufnmPGpA4EAPxyYP1vBzeK/Bmd+QRjjUYbn9jaR2sAEIaGhgcHh55xni4ioqLPqhdxL7/sk2QwGAxGc8LkHaNlgBBYHXjniZrkSENimA5BGOgtxgbrth2uzC62p0QbUqIM328oCvNVB3ipckpsWcU27lSHLe1YRdw/q1dtNHXisuVzzcd1tdO6uITIf011NTR5Ee+Ycx4hPM+bTncPXw48Qp9sWzoooWu3yLZP9roDQVRQXfr66k+dsiScUxToSh/IiqJwPI+xIsvK6SZlAjiEXMupH+gZy11cwTkyGAwGo/lg8o7RMtCuWAD2nDCDviAhTKdRwQh/ta9ROFpg3XqoasKwiLZRBlGAcaFanoMnCmvLaqQ6w2MCCgvyjx0pl84pdL0QxOX9FhEVffnJWfd+qKIk1KUFYE1Ugm/voe7l5sN74IUnbbi1ZVlpSVlp6bkexgRjo9FkMBrR3xjqXQwOcQU1pV/t/CMtIgW5ooOLd686VJqjPjN0555dZrPZjh45HGDwDo+KKi0pqayoqNeWBBOtThsRGXUyL9dittQvxxgbDcaIqGiWnGUwGIyrAibvGC0IOZJfW2OVIvzVgV6qpAgDgvBQbu3BPEthhSMpQh/opUoM1QMAdp0wW+2KINC+CgCB3mD09vXC/6S1AiEknGVf8s/RRsbFPTkdSw4oqvXxbbRR8XQOx64tFZtWXJqzyXlG6RJCBFHg/m4Q7cVRCPbRGm9olV4foRzSqtu8zd8VmSu4MwUZdnXOhoWH++m8BUH08/c3GAwNa+x4QeB5ISgoxOnjaLAcCKLItB2DwWBcLTB5x2gxEIS5pfb8MntciC4hTNcmyiDJeH+upbRaOlFs7ZHk3TbaEOpLZdOBPItCiOh2FobAy8vbz7+5jFEaIPoG+g8aWX+XKEpV5oasea9IJYXwcrUjhFCvPy2wLgPqaazId6eNHJjQVcLy55nLxrQb1Cog6vGeY57+7V3kTiSfXptwHOfl5aNVaQEAarVGrT5PRFOj1Wq0dAUGg8FgXI0wecdoMRAChRX244XWpAhD9yTvpDBdXqk9t8xmd+Jdx2p6JfsM7uAfFagtq3EeK7CiBsVplZXlZcXyP7A1JgBxnI+v7xUG8JwlhRV/rsayk871qq4w799Zs2crtlkvW9sRQkRR5XU+57lLR1bktsFxT/e9m0fciiNbn/3tXY2g/le7Qf/uOGzFka0rj25VcadTtBBCh8ORk3XC3+DtGxBQU1NtrqlpGL1TqVUBAUFlZaU2q/X0clfS1j8gkHVXMBgMxlUBk3eMFoNOp3Ao+3Mtw7sG9mrjE+yjWrWz3ObACiH7ss2EkPRkLx+9eKTAUlzp4N3yzlV7Z62trarCp8zD/x5C6GwZLy8vcGXyznryRNa8l6kxCuSo+x2AkOfhFTTkEkL8/P2vpCIQE6wRVM/3v9dX5yUp8jsbvy23Vn+8dcnghK4+WtOz/cZtzd1nk5xnTtGgQ3XcqW33rYbyzt2wQlyDdxrKu2YzjmIw3EBIhzVfykIGg3EuTN4xWhIEqfudpODkSD3PoV0najAmCMIjBdbSaikmSAsh3J9tqbEpdQKFAECNUULjEoP+6Zf8lUeeXN23iP5DCHAXLLZzi6S/PRjGisnkFRwcciWuKBJW7usy4sbkXgCA7/esXn/iL72o3ZKz94e9ax7oektaZMqEbrfOXPeFeKp/1jW1Qh0VE2tSUzdBP/+A86a5g4L/wRhcxrUKfbsLPMBEOdewv+kPfa6Sg65xf9g905DBYFwUVivNaEl4Dh4rqK00SwKPJAUfya8l1OYDFlTY80ptbkF2KK9WkvFpCUTo1D9FliTJecn/KI1zSaCVbA3HQJwNAdQZWFSpsKK4zZDPsw4hGCsGo1dkdIwgnt3ceukoWEnyj5rc924AQJG54oMtP8rUzYQyb/P3ZbVVAICHu9/eIbSVUzl1eYZQURSzucZutWGCnQ6HuabGYja7/5nNNTablRBit9nqF7qWm222C0zwYVyjQAhtNvtPP634c8vOZk7KI55bu37b5CmzbTZ7/aERgqWllY9Pen33nkPoyj0sGYxrHfYhYbQkCMGSKufHK04mhOpKq5wH82o5RONj5lrly3UFWSU2q13efKiSq7+6uP5fVJR/9HC5fMm1d4QAnuejYmI0mstqF4AACVSEwUsZLEGI3mAIjE0oKCyorq4krhSn+xLl1pcYY1EQvHwCwiMiVCo1uDJMat3bG74BgBwvz9+Vf1h0nSGHuBPl+Q9+/1qcXziHkMBx/KmmV+SqvcvNzrIbfcIi3cYo5Q2Ts1qdNjIquqAg32I21y/HBBsNpshoZoxyHYF4fsu2PfdMmNq6Vcyv37/r7W1qmKB3v6ldRkHkQksusqYrDu9eTheftQ5EKDevMGPDdnnSA4iDRKEd3xBCq82+at3WYUN61lv21NtZniorYDAYdTB5x2hJIAQOmbz5fZbr6xsIPKr3Lv5sVf4nK05CSD17Oa7eYJeKLW9v37AwX+nSjVGIyxjl8uJkEGK7rXjZN6KXnzXnKJGli0cyXJVrxORl0hkMFeXllRVlFovFPYUQQigIotFo8vHzNXl5n1kPdzlwiNtx8tCW3H0EAA6iegdj6g8I0R+Htyw/tNlleszVG69gjNVqdWx8oo/OKAhCSGhoQEDA6WAkIYjjBEGIiIyi+bgGyzmO80xthxBsOO2XKLSasOkPSp21sXuC3kUXXhzqFM0hxdlgLLlnACHEivLH6k19enQqKavYlrlvyOBebvtumrFFyGq1ybKi1ap5gVdkheM5u83hcDrVKlGlVmNFdos2xHE2m01yyhqNShBFd5JXURSe5202OmZap9UgHtmtdqdTonvjOUWhR+E4Tq1W0QPV2giAOq3G5SYO1arTBj0cx2GMLRYbRFCv0xDSfKNFGQzPh8k7RnNz1rUPAiAK59ENIn9BMaHVG/SmK+o2vRhnxR4QUqyWnA9fr7979lSxC8DzfEBgYEBgoCzLktOJCeY4ThTpFevKT7H+Fh0ygc4vW8+dV1EnjxHSajTuJuILzaLgXQCPB0JotlhLSirodZ0WZqGAAB+jyaBcuuf1ZR20qqqmorI6JDhApRLdYg4haDbXlpVXBvj7arXqS1F4iENHjmYfPpI1sH93UeQ9KviEOC4vr3Dbjn3PTLzvt+Xrl/2xYdCAOldFWVYWffnjvAWLLeba5OS4KZPGd+yYvGLV5ldnzC8sKgkK8pv42NjhQ3tDBBUFf/3d8nfe/7KyqqZVQvTzk8d36ZpaXFD6+uwFwUH+y35fX1hcdv/YkT26d3ztjfn7Dh7r2inltZcfj44Kc4eZZUmZ+fany5avd0rSvWNveXTCHQ1/WdEzPFn0+qyP12Rs5Th+9K2DHnvoToNR53IdZzAYTN4xmheVgLz1YnaxFZ5PJLlzNhcqWXP59xK1gHz0Tfi+RYKKRinOEXmnbv1dyA1jCeNq6jaC6jJQdRsCrGDJKZEL+BurNRrxEuKLKcFxElaA7DzDzc7dc0JPkmB8wa4OAoBTluJ8w7TClSaFPQTEcxs2ZU56fjaHaAIfQujrY5r4+NhhQ3q5g0BNclAO/fLb2ldnLnjq8XHj77sd07pGiDF5ffbHS39b9/7bL/To0fFS9CXkuI1/7nx//jc9undUqQTPSi4iuD1zPyCge9dUq9U+a+5nhQXFoWHBAIG/duyd+8FXjz18Z2xMxPc//rF5667QkIBXZnzYu0engYN6rFu7dW3G9oH9ummN+mW/r/nf6x8+/MCoNm1bLV687InJb/zw9RxZkn5dtr5nj/bPPf3gsWM5r77x0aYtu8bedZNKJT4/be68D7+ZOX2iK+eKcvIKVAL/+vSJhw4cm/Pu56Ehgelp7U6dHnJYbVOmzS0qKZ8zY7LFYn115nyO456ddD+d7uxRzySD0UIwecdoVrz1woNDw2b+qJRU2c9UIRAT95xTeOGOH6ITuJHdA9NaeTXdGXql9a/c9Iezoqyu0O9MMFbcCeLznx/GvI+/FJOSe/IkcCVkLxFCcHBwqH/A33s139VhaFFN+boTmWedAoSwurqa4zi9Xn+Ry1u8X/gLA+87a5TFVQyEZeVVAJM3X58YEODjlJVFn//87ItvpyQnhIcHUQUs8lRgK5hIktsLhhP4Om2NEJZoVpQ2h/IcXSjJ9S2iCEIoCoBDVOg76Yjesw6ak1vw0cLvBvTrGhMdARDcvOmvb75bXlZebbHUuiU9DYte9OgAAp6nKUj3LwB3oha7dCESeCLLDTYhNAEquL6uab0CR4vRnFIT5SIhhIokr1i9uXfPTsagwAF9u855Z9GW7XtujQhxuU5WKzJObhXbtXPbvgO6A6d09Eh2jbk2Pi6yS/vWvfp0xVY7IEC2O775bvlNw/o89vg4wHHJCVEjbn9s9dot/Xp30ek0Y24dMmj4gIG15l+WrUtOirvtXzcCBA8cOrFm3VbJKYmuachhIYGPTrjDK8hv4MAeWdn5Py5Z1T61VV0AD6F9B47t3ntk4Qcvd+jeHhBYXWNe8MkPTzxyl1p9KfNjGIxrHybvGM3NrT0CU2MMpTVO2FCEQFhdWblrV2anzl21FxYoGpFLDNXq1E04294nfSCneceyP9MdlalfTjA+dvy40WgKDAwgpK4I6UyhRyDi9Mkd9alpAHEXiUGeC+0XvrRkqEGlnTZ4fKWtRsZKwwAehHDN6lUGo6FT5y7nnX9Lw3sQ+mpN4NoCQmg06tu3TQwICwSIUwv8H6v/PHo8NyI6bM/OA59//WtJaXlqSuK4f4/w8TbJMl65cpNGrQIQ7D94YuSI/iajfvHiZavXbtXp1HeMuqFr57ZupVVjtnz96fItW3cHBvjec/ctiQlRSgOjRQJA184poiB88fWvU6c8Ijuc8z/9oUuntkeOZrtaA2h12p69hy9y9AMHT9x+2+B6nQ0F4fD+Y+v/zBwxrK8g8MtXbOzbs3NQcABWlJWr6Cbd09qvWrUZQphfWLxu/fa42Mj7x90a4O9zhu5svKe0uKh0w+bM0OCAJ/7zkiLLeSeLVq7ZMnLEQABh544p7dom/mvc0xHhQW3bJDz28J1RMeE3D+/7/Etvvz//25iosAn3396zRyd7rSPvZNGBQ8dH3vYoxlhRcH5hSXl5latUElEt67RLkuxl1KtUAnA4AYIGvdbVXOGK4AOgUgvUG8XmgAIXHha0Z/+R2lpbXcUqgoWFpfmFJc+/NFetovq4pKzSUmujoWtXiwaDwWDyjtHccAgmhukSAfVda0hNpeQocPRq46XWGkDLATnOq3Nvr869z1ouY7x3+bLAqOiI5GT3khqL2Wa1nRVFkyCsrKpuWB53KRACDEaDVnv2c3IhvDXGcxf6iHqjyuinbcLQpmdC41kCD2hwC5nNtRgrep0mLzv/oSdeCQr0CwkJ+Pizn/YdODbvredFUfxq8bL9B48HBfkF+PkMH9prwac/zvvo2369u5SUVkx+fs68t6a0TW1lrbX+d/KMv3Yd6pHe4cDB43fd88yCedNSU1vVx/YIxl4mw11jbpz+5oI7xwzPySk4cPD4S88/PPV/77p1dFbO3x/9xuF93bEoQeCPHj7xwKMv9e3d1cfX++jR7BmzF8ZEhQWHB0NF+Xrxcl9fr/Ru7b/8dtlfu/Z37pii1WkX//BH5s4D8997ydvbiBs7DQ15LmNTptVqDwsNpO9whNokx2/esju/oDg0JNAvwOeLhdPXb/wrc/eBH35aOem5Wd8uevOllx6/5cb+f+7Yu2Llpv88OX3Jd3ODg/xFUejbq/OY22+QJAkhpNNqgoP9rbXUYaf+91vDjtezf9TRZllXJBQhWZEFnudddaJ1TxrPBfh5P3jf7cFBAYoii6JoMOhUKuEfjaJmMK5hmLxjeAoOiUgKdEjYQ+vCMIEYu5sH3dSazRXlp11FrghCeIG/dHl3XhSCFVdY8bqC51BefskLL79rMOgkWd6wMbNNcnzrVrGSJM2a/lRaekcgGP5Y8uvTL8zOyyuKT4hSFCUiLOjDd170DfZTbI51G7bfOKz39JnPAkU5vPdwQIAvgCBjw/bde498+9nMhHbtgL169J0TF3215M2UhIZGu5KkDBrQ7edfV8+Z+1lJWeWNN/RukxQruSN8GBgNur85epAfAERWFIHns3Pzn536dtfOKc9MvI/n+fMZi7h7GuSU5ISP3p2K9LoDmftvv2viuvXbR44cBBpV3kEIJYfz9xUbhwxMf//9aTSJjLjcw8dvvO0/Gzb99a+7btqTuf/w0eyRNw3oPbh3ZFjwzLc+OXI0e8/+o8OH9EpN69ire4cxd08qLq6IjI5ol9oqKzs/JTlObTQWnyz8+dc1t9088BLFF3RlwIuKy43eXuaKmi1b98THRhj0WkmWZVkhspIQH6VWqyRZ6dqjA1Dw6pWbCgtL42MjmOcxg+GGyTsG4xI5+6IRFBwSFNRo0x3YONfLBTolqaikvMZcSwC5aVifcf++xWDQAQgDqs1ffbGkvLI6KztfVohUF3uDCfGRvoG+2O7kOK57Wrs57ywqL69q3y5pQJ80by8DgGDX7kOSJC1dnoH+WM9xqNpsKdldIUlSwwQ6xtig1z7+0F3DbnskIjz43VnPOhxSXV6QYD8/n5oay8WO7nAigUcIlVdUPfzEa8UlZQvem6bRqevNR879OxGCIcGBiBdIrTUuNiI8LGj/weMjGztYhXjuwL7jW7btmfHKk9Q42+aAEIaEBLZLbfX9zytuvXWQ2WJ9dcZH789f3CohasPmnTcN660z6L745tdZcz/r1iV1155DMdFhCfGRBJD7x468/5EX+w97oG2bhK3b90ZGBI+6dQghxGaz1+eU7Q6n85QvjCTJdrvDfVuRsdlS+/LrH+i0mgOHjldU1Lz4/ENGk14UxKeem/WJr3enLm3v/fctT0+ZvWTpGgXj7Zn7pkwejxCi1bEMBoPJOwbjsqFXYKbJWhpZUWKjwha895J3aBBtZ8GYOCUC4Z9/7nzquTdjo8NjosNqaixUnZ96sWhTrYLp7BBCJtw/KiTYf+myjPc++HreB998+O7U7n3TJFmWJKWyqsZtttsrvWNcTMS5M7IkSencMfnfY26Mj4sICA3KPpZT9wDPb87YdvGju28jCLNzCu/q3kFRlM+++mXSf++pL6esV3gNpR49Afc5QMJxSKaSkTZKN6LEwwr29THNeePp7mnt3H0ehBCE0LMT78svLMFOOb1b+68+nfHDL6vLyiom/3fcjcP6eHmbFr7/8g8/rzxyLGf0rUNoRaOXATulxIToRfNf+2HJqry8oofuH3XTsL5eXgaeQ2/PfCYlOR5LMkLo6SfvMxp1dMQLhsOG9Gqf2oq62Uly756dvvh4ularXvLrugF9A26+sV/blERFVt576/ljJ3JDgvyxrIy/97b4+MjVa7dwHJpw3+3p3drTUcosdMdguGDyjsFgXN1gjG02u7fNVt/9wPHckl/X+Pt5fzb/VaQ3bl6zMXPnAZ4/uyMHK3J+fvFNw/qOGnOjvcZy8+jHV6/b2r1319jocD8/74mP3e0dGgyIkn3ohEolchx3lryjk4URemnKQzzHA1k+/SiCl3J0t8Fv66TYN155cg2Vg7O6dWnbo0+awPNOp1RrtVFDSEWx2uw+gDbEEELoQo6DAm+prCkpLY+MCAYQEdCY8SqCcXCQf3B4CHE66+vYCMatkmJbtYnHDomec3J86zYJVKTyHPXBk+SQkID/PHo3ldccB7DifiEURYmODn/qyXtPrUmX67SagUN6UWms0IEu3Xt0pO3okgwIiY+Pim8VozicBOPo6NDo+Eig4M602YUKXMXV5typc0qnbu2Aw6ko1Et50OCegwaku15yhJ2NNHiQwbgmYPKO4Vk0Q47ySg7hyafnUhvNdXoecx2VZcVud5x7XQ8PC/r+51ULF/1kNOnXrt1aXl718y9r/vuffzuddAixO9fpcODXZ31cVFR2910jzGZLfkFxXEw4wLh/37T5n/zw4GMv3zF6WG5u4aKvfnl+8vhbbh7oVhh1aUSH0/2cG/U6t1kjTTvaHYoru/q3R6/bj6xQLxZZuWFI799+Xz/l5XcXx0cHB/uHBPu//ubCqhpLfn7xjr/2hQT7u3p+uD+37po374uQkIBvv/+dENC7R6emeCFc8UXH2QslGZw6cberHw1nOuqUpUvPUVcjcmYnr7sZpeGahBDlVAaWruB6Gk+vfMoukO6wQavy6XWcEjiVzKW7cjjdE85IE/pYMxhXJUzeMTwGOu0eOxx2RbmiDoO/xeE8fUX5R2CCJanuog6aBkjN+uXL8zNTqVQlxcW5uadShE0DVrDFYhFUlzXhrbEhGMdEhw0d3FOjOWNQBJaVO8cMy84tWPjZTyaTfsL9oxITootLyyVJ7tG9vclInXcwJiqVOOmJe2fN/XT23M8Enh9714ibhvfDTikoyP+9Oc+9PvuTGbM+VonifWNHDh6Q7jLKcR+UtE6KVTB2DyBxpwMJATqdZvjQ3iFB/sQp/e3R609+cP/udHKIwD078b4ZsxfuP3C0b//ur730+CszPnpzzifpae3vH3trSEidF0+7tol5eUVffvObt7fpnTefjY2NqG/mbYEn/5xPwYU+F00aVPOYHxoMhmdxdjUJg9FS2O22DRkZVVWVKrX6rJEMjQgBpNZSm9quXevkNv9sQ0J2bNuWnXPCy6vJ5qG55J3FbFGr1f0HDnLPDbt0ysvLN21Yb6m1NGmIEWMcGhqa1q1Ho/vHYls2kSovceZbPRzPAUHA5wTw6ARYBMvKKjUalU6vc9kIQ8Xu4FQidQk+FQGiBmwQlJRUqETB5GPCUl2OleM5gklJWYVOq9Eb9fXL67YSeMBxDaNQdcNY1SrgpOnLSz06PXke252EEOqBpxJp1pKOcOUddkdNjcXP1wuqRYCJbHfcO2FqaEjA9FefLC0u8zIZBJXYpLPXrjcggBbZLKvDIWxCW83rDQRBrg1h6H/lI7YZlwImwFuEERr6LcrkHcODsFgsJ/NyJUluum8Cmk0zGcPCw7nzjWS9OA6HIyvrhMVsvuDYiiuGAKISxcioKJPpcuzrsAvQxDTRONrLk3cXgeothFyBOvy3q1HVdeZql7j5FR79QiA6NwO5egWo/xvG+K57nw0J9p898xn3y8y+uhsXJu+aAibvWlDeseQsw4PQ6/WtkloDT0WlUrVqlQQ8GOSipc/CU6C1WZcw1OFCq13i5ld49Avhams4Xa8GIfz3HTfqdRqiKM2g4Km0dMU1XYenzRJMTTIYVxdM3jEYDMZVwLChvQCh7ahNfSAIgdMpFRQVuIxXgCgIISEBolpVn1P2WGjS3DUAraVPhMFoeZi8YzAYjKuAhkNvmxSEUHZuwT0PTjGbaxGHeI4PDfF/9MF/DR7Uo9nO4Z8CIY13rl79Z0iwf6vEmGYIcDKuJSCEHE99BzCu+wVFnYxc0WtZoncRQhxHa8Jl6aqpi2B5HIan43Q6Z82atXz5cnCV43Q63eGQFuTYsWNTpkzJz89v2dPwHOA5tPQZeQAQ1tZai4rLnnzs7s8XTJ/zxuSoiNCHnnhlxapNNDzmghN4TqOm/wSh4ZPGcYhTqzitmlOrXOWDkBMFdMqvh251yv+P4zl6VxToyioRIcjxp/bpmi3rtn3mVCJdQaOqX3j2tvRACELEc9zHn/24ZdseqFWz15Fx6UBq2iCv/mXJhzOn5xw/ijha4rLvr8wPXn91W8Y6dyFseWnJJ2/P/uGzTx12+9Xy7mLRO4anAyFcsWIFIWTo0KHgamb69OlJSUmjRo1qwXMoLi7++eefx4wZExoa2oKn4Tm04A9xl16hpXTA84AQatSq5KS41E5tgKz0TO/ocDo/+vj7Ht07aDRqQMCq1X/+9MsqWVJuGNJr+NBe7pEeHM9nZ+ct+nLp8ay8pFYxD9xzG0Jo+R8b+vbqHBQcgBVl5apNarUqPa09AGDjpszaWntxSdna9ds7tk8ee+dNW3fs+fb7301Gw/3jRrZKjAEA1JgtX3+6fMvW3YEBvvfcfUtiQpQiU3e9DZsyrVZHRUXVH6s2JcRFjb/3NpVK+PzrX7f/tc9mdyCev+XGfga9lsXwGJcCx6PigqI3p0zKOXbU6XQ++vyLiqR8Pu/tpV9/ntan39tf/+zlY9iydtUbz05UqdVJbdsnpabKnhrGbgiTdwwPpby8fN26ddXV1SkpKSrVGb/dd+/evX37dgBAWlpamzZ1/iZFRUXr16+vrKxMTEzs3r27KIpbt27V6XTuFbZt26bRaFJSUhrr9DDGmZmZJpOpvLx8z549kZGRffv2VamoV0h+fn5eXl5AQMDmzZtlWe7Tp09UVNSKFSt++umnvXv3arXaqKio8vLyHj16cByXk5OTlZWVnp7+T21Q/pby8vKdO3d27drVYDBUVlbu2LEjLS2N4zhRFN2/PgsKCtatW1dVVdW6dWv3CRQWFh48eLBbt24ajaaoqOjAgQNpaWlarRZci0AIbTb7zLc+OXQkm05QcDnYxUSHvfD0eJ1O2wyyr6CwhOc4Pz9vj8310CyVrChOiVOJQwb2eOm1eQWFpXGJMZ9/9uMrMz7qntZOFIVnXpiTnZP/6MN3II7Pysr79/3PadSqpNaxS35du3vv4ccfvuvNtz+NiQ4LDg+GivL14uU+Pqae6R0BAb8sy/h9xcZuXVPVatWcdz9ft2G7XqfWGw0ZGzN37Nz/49dztBrNfyfP+GvXoR7pHQ4cPH7XPc8smDcttV0rgPHSZRl/rNzctVMbvV678POfsnPyX3r+of0Hj1dW1mTnFOzff+TGob2arLudca2BFaLVGzp06yGKqrhWrekEQYSS23c8sDOzbZc0URSxQsKiYpJS2/sEBHr5+tZPc/FwmLxjeCJlZWUPPfRQTk5Ohw4dli1btnv37oEDB7ofWrJkybRp01JTUzHGH3zwwbRp04YNG3bs2LGHH34YQhgbGztv3rybbrpp2rRpmZmZ33777Q8//FBcXPzQQw/973//a0R5J0nSK6+8kpubm5qaqlar58yZc9dddz333HMIoc2bNz/xxBNdunQJDg4+cuTIwoUL58+fv2vXroqKihMnTqxfv57n+RdeeOF///vfgAEDJk6cGBUVlZ7uGqzUqMiy/MYbbwwcOHDSpElz5szZtWtXWlqaW9jxPF9cXPzwww+r1eqoqKgFCxaMGTNm0qRJDofj+eefnzBhwtixY6dNm2a329PS0sA1CoTQ4XD+vHRtZERI184piqwQQIID/et/SHAcAoJAVYKkuN2DaQ6Q44iiQDp6i5qTIJ6jVgSulCWddUsIEgXqcuca1VV/LJrT5HnqwCvJikLjT0jgP1r4vb+f1yOP36PUWoGHg7Fer7XbHVarraK47KOF3z/+8J0PPzYWIPj9V0unz/r4hsE941vHfbV4mU6rXvz5m6bgwJNHszI2Zrreb6d1VsP0N8YkPCzovTnP80bju7MXzHzr01W/zo9vm5y5ceud9z5z5GiOpda6e++Rbz+bmdCuHbBXj75z4qKvlrzZNsFlE0NCQwLenfO86OX17ec/THv1fYzJe3OeO3Q46993DB83fgy2WLFHhkUZHgjG2Gjyevr12ZaaGr+gYHdAfdS9D/YbNsLH358XBEnCbTt3fe+7paKoMlF5d3W8tZi8Y3giy5Yt279///LlyyMjI/fu3Tt69Gj3J6q8vHz27NljxoyZPHkyAOC11157880309PTP/30U0LIjz/+qNfr//jjj0WLFlVVVd1///2bN29+5ZVXysrKhg4desMNNzTuSRJCYmNj3377bZPJ9P3330+dOvX2229PTEyk9UYc98gjjwwYMMBsNg8dOvSnn36aPHnyli1bOnXq9NxzzwEA8vLy3nrrra1bt9rt9smTJzd66A4AEBgY+OKLLz799NMIoYyMjDlz5hgMBvfTyHHcyZMn9+7du3Dhwt69e/fr12/NmjWyLEdFRT399NNvv/12SUnJoUOHPvnkk2s1dFePKAojb+o39oHRdaOuCFFcDsYcz1VWVGfuPGB3OFq3io2JDscY19TUFpeUh4UG5p0sMhr1RoMuv6DEZDLs3X8UANK5QxutVrN1U2ZpWWVyUmxsTLj7OsFx3LGj2QcPZwkCn5qSGBzsL0ny4f1HM3ceCAn2P7D3cHxUWH11msfiNmfhBf5Edn55ZXV69w5AkgDGXTunOJ3Ow0ez4+Mj9+w7kpKcYPLxwmZLWGjgnXfdfHDfYeyat3HeHQYF+lEx7XREhAWHBPsbjTrgsPr7+5hMBovFumvPIUmSli7PQH+s5zhUbbaU7K6QJEkURUJIcJCfwHPAaY+MCBFE3mK1ORxOjLHTKQMHtYlu9meIcRWDMdYbTUYvL0Wp65wQRDEsKorec31nEkICQ0Obp3W9sWDyjuGJHDx4MCkpKSIiAgCQkJAQFxfn1iX5+fnl5eW9evVyr9anT5+vv/46Ozv7wIEDPXv21Ov1AIBBgwb16tVLpaIF108//fTw4cNDQkLmzJnTuGdIFQDHde3a1WSi4947duyIEMrLy0tMTFQUJSoqqn17WmBkMBjat29/6NAhWZYbFuSOGzfujz/+eOONN5YuXRoQEACahvT09IEDB06ePHn27NkdOnSoXy7LcqtWrQYOHPjwww+3bdt20KBBzz77rFti3njjjStWrHjhhRc+/vjjqKgocB1AnQIhD3iXIHANhOV47tixnCefefPwEarJBEF46fmHRtwyaPfmnf+b8UGr+OgNm/96ePyY7l3bPjH5jbDQgH0HjxcVl/fr1aVd28TFP/xRXFLu5W1c+P7L7dpRl8Tlv69/5sW5iiTbnc6wkKD5770YEhIwZdo7q9dt1ahVx47nLv3+XY1G5dEZH44rKSk36LV+3l7HK/MIxvTNfEpCQQAlSQaEhiypTiWAuIJz9Zq1/p1/Vk16nWmzKy1e7//svrhCCCVZliSlsqrGfaxe6R3jYiIQRHTvDbalJ8MSsYwrBp9pCU8IOavAzmPbxi8Ek3cMD+W83Un1Jv7uu3VDP13UL5Qkqbi4ODg4WKVS5efni6LodDqLi4v9/f1By+G6fp0+86qqqpqaGqPRmJPThCNinU5nYWFhYGDgyZMnJUkSBKF+BIJWq50zZ87u3buXL1/+zjvvrF69esGCBWq12mq1lpaW+vr6NumJeRCEZGzIRAi5v8rbpbZq2yZBkuTXZ30sisL6lZ8ZjfoPFyx+ZcZHnTq0kWRl//5jg/p1W/Ld3KCggD17Dh47nnvHqBvmvTdtx9Y9Y8ZNMhp0v//yod1mv+Oep7/9bnn7zm2xw1FVbZn0+Ljbbx1cXlb5r3smf/blL/+b9tgH70x94JFpreIjn3vmQVEleqC2gxCKogBUKk7gy/NLvvjmty4d2/oH+NZYarU6TU5eYdtOKYCQwqIyAEBEWBAQ+cjw4Lz8YizLnFolWW07NmVyHCdLcq3VBkQBKYrVZvf2Nl5qaDw63M/Pe+Jjd3uHBgOiZB86oVKJ7n6Ui2wlCDwQhbpYLINxHcOMURieSHx8/OHDhwsLCwEA2dnZOTk5bmEUEhLi7e29ZcsW92qbN2/29vaOiopq1arV5s2bbTYbAGDt2rXjx4+vrq4uKyubOXPm5MmThw4d+tprrzkcZ0wIvULcIunQoUNOp9PdukEIcYcbEUKFhYXZ2dm09a+mJjMzs1WrVoLLP8JisbgvQrNmzQoLC5s3b95HH320b98+0DQsXrz46NGjn3/++datW5cuXerKRYoOBx3PunHjxieeeKJjx47TXGRmZpaV0ev0hx9+KEnSp59++ssvv2zcuBFc27jeVOs3Z370yfcff/bjgk9/2LX7IORQcVHZjp37//2v4YGhgRqtZvStgxFCW7fvRgiGhgaOunVwZHS4SqMCBHh7m7p0TtFqNW1T4lu3immTHO/l5x0UFtS5U5vKajN9rTH51x033j5yUGlJea3NHhEWVFlZDTHx9jKqVKJWqzH6eHlm6KmsvOr9BYtfmTb32adn3jzmseoa8+OP3AkgjIoMHTKgx/+mf/DZx4u//nLJ5Cmz07u1S24dBxR86y0Dd+46+NyLby/9ZdUTk2c8M/UtrVYVFhr0+psLf/z2t3fe/2rHX/vqIyROp+Q4JcIURbGfmhpMCLHbHQ6n1L9vGoLwwcde/nnxr3NnLbztziep6Qn1VYENt8UY2+wOjOnvFoTgN9///tWin52SxKZgMa5zWPSO4YkMGTLku+++Gz16dKdOnfLy8goLC91XhYCAgMcee2z69OlHjx4lhGzZsmXKlCk+Pj733nvvhAkTRo8enZCQsGbNmmHDhhmNxsmTJwcEBIwbN66iouL2229///33H3vssUac2cXz/MaNG8ePH6/T6VavXj127Ni4uDi3vDObzVOnTo2Li9u/f79KpRo1ahRCKD09/cMPP7TZbImJiatWrfr888+TkpI2btw4ZcqURYsWGY2XFNW4dHbv3j1nzpwXXnihf//+J0+enD59ert27WJiYvz9/SdOnPjII48cP3583LhxHTt2XLlyZd++fQMDAzds2PDFF1/MnTu3V69eu3btmjp16hdffBESEgKuVQgBEE56fOy9997mHslA3x6YmGutdrtTr9PStgmMeYFXqYSSskpvbxOEgFbUKZhO03RB35k0qAwEjqMCxfVGpZ6o7rQlhD/++Mc773+JEKcShQOHjo8Y1rc+mlu/vkdBCPHxNt0wuGdlZU1FxT6e54cM7DH2jpvCwoMVWeYQfPap+1Qq4eNPf8SEdO+a+szE+9QqUXFK6Wnt33xt4rwF32Zs3BHo7/PK1EdbtY5/eeojr7z+0ZtzPklPa3//2FuDg/3pX01Ax/atLZZalwLGYaFBQwf1VKtVhMaVNUMH9QwK9PMN8H1vznOvz/5kxqyPVaJ439iRgwekY1mBgDTc1s/Xe/jQ3kaDVlCJE+4f9c33vx85moWV3i39LDIYLQyTdwxPJCQk5OOPP165cqXFYhk3bpzNZvP19XU/NGrUqOjo6D///BMhdN9997lLyhISEhYtWrRmzZqKioo33njDXZw3YsSIuLg4QRACAwPnzZtXVVXViGfovjaPHj26R48ehw4dGjFiRJ8+fdzaUZbl+Pj4iRMnHjlypF27dv3793dH9R588MHWrVtbrdbAwMD33nsvKYkWZj377LNuk5dGx2g0zpgxo0+fPgCA0aNHBwcHC4Lg4+Mzf/783bt3d+nS5dNPP121alVpaekDDzzQr18/QRB8fX3feecddxvvhAkTUlJSeP7a/4rgOI7jeViXHqUvq0GvVatUllorbYlFUJZlu90R6Odz8f00TBnWlaUhrrik/I3ZC28fOeiBe0epRf6xidOptOEQcMWeeI6jzbkOGgD2HLCCIyNCPvn0jfqZs1SDOiV3+zDGRKfTTp3yyGMP34Ux9vH1prN1XSJVUZThN/YbNCC9sqrax9tLEAXFKXXp1Pa7L2bV1Fj8fL2gWgQKdivpcWNvARAqDieR5K6dU7qmd8B2B5YVP1+v12dMoodzOJOT4xfNf7WkrEKn1eiNeizJxJXGbrhtQnzUrFnPEgfddtSoG0bdeRNQMHY4qOJmMK5jrv3vbsZVSkhIyNixY8/7UGcXZy0MCwu7++67Gy7p379//e16e7xGRJIkjUYzyEXD5a72PWf79u379evXcLlOpxsyZMhZO/Hz82siu+ZoF+7barW6/iTjXLhvjxs3ruEmrVu3rr9tMBjOPdtrD1djHHar9VPLSFCQf/e0dp98/lNiQrTeoP9s0c88x3fv1n7PviNniYaGNXN10biGtyGUZcXhkBSFOJzOY8eyjx7P8/ExlpWUe5kMBJOs3IKDew7FR4d5mg8+fU6stos96sReRj2AQHE1o9SjOCWB5wID/DDGbjmoyLIo8v7+PrRC1na6QKLhBFvajWirq1snhCg2e91yl4lxoL8vXdhw/Qa36cnUr++UWNUdg+GG1d4xGJcDx3E9evRITEw896GIiIgBAwY0YhaY0URACHVazVmuNIQQnuMmPXEPhGjkmCduvv3R75esnPLMg4FhQe71G3b26HQa9wtNxzxo1LQXwYVKJarVKqDIwcH+d/1r+Nx5Xw6/5aGXXp03oF/agYMnVq7+k1eLaV1Sli7PmPzMm7JLxICrDQXj847cwISG8xpak2B89pJLhwo7Ghz0uBQ2g+Hh0EkyLX0ODMZVSb2Dw7nLqb0tk3f/EGzLJlIlgM33vLmr+AWBPzcHzXHI4XDu2nvEYqlNTUn08/NWFBqOcjoltVrlftExzQE6VXReKiKEOBxOjuNo56arb4AQolLVDQg5dDjrZEFxSuu44CD/GkutwPO0W1ZRamttAEKD/ho3F7wqgABaZLOsDofw9IAcxhWCIMi1IQz9WadL84AJ8BZhhMb1m5PJOwaDcX3KO/fQenKBybO0E5NDAEJCg0c0egSpwRpsmJ9FiE5QqF//LNF/6jZAiAOI7ocQ6uBDWwtcDjWu1dzlZIwWhsm7poDJuxaUd6z2jsFgXL9cpACfpgXPNDJ1dXxerPbuArddtWWn9nR2fR6DwWA0ASx/xGAwGAwGg3FNweQdg8FgMBgMxjUFk3cMBoPBYDAY1xRM3jEYDAaDwWBcUzB5x2AwGAwGg3FNwTpnGQyGZwB5gFTNbIzCYJwCIuTgoMCMURoRhCC1RIFAZB/rZgEToDr1VDN5x2AwPAK5YqVcvR0isaVPhHE9wgFwDHClmmjm0NaIIECqFC9BdduGCsCz57XpIQBoOBCoQvdEikzeMRgMjwDbcxXLLog0LX0ijOsRCHAF0hQCiQNMhjQaBBA9rzGJI4/VQhViLo/NAQbgRC0eG8HkHYPB8KjkLIveMVoGgqDAQYHJu0aEAMJBnnclZ1l+tnkgoO6pZs83g8FgMBgMxjUFk3cMBoPBYDAY1xRM3jEYDAaDwWBcUzB5x2AwGAwGg3FNweQdg8FgMBgMxjUFk3cMBoPBYDAY1xTMGIXBYDA8k4Y+YfCfbwjPuX3eNZkPSEtxXh+4f/xyEEDoXIhLOhx7resgAMiExre4M58ShdCHrg0HZibvGAwGwwOBp+ezEQKITP1KoXBpm7pWo5u4UzTQ5XV6XjjXlY75zbYAsO6lOQNywVfqgvBQwAT/3YZ0NJhLujAAAUDHwTRvlGsjR2tx/c8gBEAHL06LQGaV4iBXvRZm8o7BYDA8DcL7DuG9erjmn0JCnNiWI1dtxtYDfxeAIQBp1BETAUD23JlAqeX9RyAxyFn0JcDWM7ela4rBd2FHgVy65FKFI6NxIAJSp/jdYBT84SkRDwGUiHNv2e+V9txLnHtLAPZShfQIHnekasPhyvXoAlsRgoN1SZGGDrvLf7PJ1ZcW6ruWIQToeTAyWFhTphyx4IZT6Hr6cP4quM+M7RKpX36RsKcnR0SZvGMwGAyPgoZYkDaW0yXJlWuIbIGcjvfqxvsMdOS+qVRvBXVXcey6stRfXE4FZrAkm3fQ5a7oHdJEc5o4CHlCCI3guNckGBACOZ7TtaFjQgj23GvUtQgNFEE+WJuAiVJoPVy/XCGSrDgArAuzueNthBAIaeztrGys+yGHbMkx/1XlKKiXiW7Z53q167YigOh47xBdq/0Vq+jQeVcu1xU7vK4h54taN1xIXLlaRF8smsmFDTK57ofo5/CchzwHJu8YDAbDEyFSmbPoa+IoAgAiTbQ69hXeu69Sk+nK0nIAagBxAqLUrY1UrrmpDgBkuWK1e3uXyMOn13FnbJEKCj5ErqG3iUJXYLQEBIAye/bOkiUNF7o0GeJoMJVI2CEirchrHIpFwk7kEnAQIB7yMnEgwKl4g0OpPVixBhPllP4jmCgipxeR2qlYndjqDulRRU8UQmQIkEbwUrBkV8wXivYxgOvVESBob+JSjJyOByeteGuVUuwg6NRDnby4FAMnInDcindUKpUSQR6m8Ji8YzAYDI+lTpwR2UywHQDFfaWGqnBV6ANS6RKlZpsrmIfEgFGA1znzFwIiC0H/hhA6Cz8jxNlgVwQQhTN0EAJug6IvkWtoIPC6D+F4UgCJRulcFWCwtc8ABKHZWR5l7CByWptcvb98ZaktiwDirQpK9h1UUHsgVJ+MiXywfE0b30FZ5sw88x4IgQBVcd7pYfoUDvEydhZYDhyp2qAQu/vl99fEpOqHGUR/QsiJmq3Hq7ZiUK8LGWe+LgT09uVvCuZ3Vil5VtLJi+voxb2f7Sy0Uxl3UxDf05ffUaVUOkFfP76Difsw21nlYQqPyTsGg8HwQAhAaqRLAkIgQCLv1RMALJctd6s9iDScLlmuWl8vD5A6Eggm2o1Ba+qiXam6sy41GGniVJFPEWeRs/ALgATRZxDSxivW/S3y5zFohSUUtbzJfQcCqBDJ4SqRNImBIfqkwtrDJ6q3YaCk+A5O8RuyPn+hE9sEpA7WJXqrQkttx09a9rtFW7H1mEu/oSTf/nFe3Q9XZpTZsvy1sa19+kPI7S1bTgBR8/p47x4nzXuya3ZEGTul+A6ptOeX2rIusc7v+oIAAYF2JnTShj/Nk6wK2V6lPBStitSgkzYlVod6+vJf50sZZQoGYGuF/GSsqrsP91uxu5nJU2DyjsFgMDwPoiDBTx3+GE2eIhFwerl6C3YU1z9Mc68N86o003rq6kJvnBWWo3VanFcPAKEjbx62HgIAOGy56thppyr5GM0NJkqwLtEkBrrvQgCLbcd2lf1G6MtKqhwF24u/t8jlgBAt75Xo3UvN6R1KrTvNeqJ6y/6KlQRgkxiMaRkY7ZzVC37Rpo4nqrfuLf8DAlBsO85DUc0bOCTSwj4s7S1bnm/ZDwCxyjWBmgSjGFhqy2rpp8ETgRBIBJyoxYMD+fsixe2VcpYVv3vCYVXob6YYLeIg9BNRP3/6MePpTyoQTRd6VqcFk3cMBoPhgfDYWWzPnU2cpRDySBXGB96minrWmTMDOwsuY3cQCkgdQewFxFkMIL3eE6mEOEs96Xp0fQEBqnGWZNNiyrq7tXIFIW6fDmiVaxzYwkGeAOxUaEgPQXq9piY3RKlxUqHvXuKGEGIQ/TioogG5Uw/tKVsGIcK05A7KRLI4yxGial7GDgxkrsHm1yfwnLvwVMYcAvBbsWxTQGdv7oFIFQBkdam8olQmgHbdCgi0NiAJI/cuChzkhMtgxaOMZ673V5fBYDA8EXqtkImjkDiKCOSw7TjGdk3Mi0ifisvzL2uHEEKOEIkapNVdiFjhXUsCIap2Fh2t2njGMohgXUdmw27ZsyX4+ZLvbklHFNpSUwcGZ7TONOyuva6BwIGJkwCTCOvFHCFA4ICeh3YZSJjQTlgIlpXIa8vlEDVKNaIbggQbBkuLZDsGFpl8luvMtxO3AbKao58ljwrdsY83g8FgeDD0Eu/6BxDtk6UXaLXrgfpLievyRC/hf+eHR2QimyHvRffgSv/Rf9d9/KZlgQBByDX4d0VXZIdiAQBqeCP1TKGvMQ7Xp7by6sXTYK1HxZVaGAhAjQSOWnA7I4rVQScGTkyzsW1NXKQWHa7FFhkYeTgpTnVzMF8tgQNm/EuRXOogQSrIQXC8Fqs5mGRAGNCtNBz4b6xqdCh1jvSoZ5l9thkMBsMzgTSLSh1PENSEioG3u/yNj1OjY8VMgIK08YB2VwDOqzsytMW2E2dvTxSgWGnLBW8CUqVSu5f37s0ZOsqVqwDgee++SB2h1LLWihbD5XJCE+WnIEp9AeU/BEFU4yipcZbEGLsU1h6yK2Y9753sM6BWqjxctaGxTvjaALomkv1RIkfpxP/EqPeblRon8VPDZAPtpcgokxEEZplk1eK+fjwhoMBOEvTIwMPDFhoKzaqlTii3hAjeAixxkBQTF6yGy4oxdcLzpPAdk3cMBoPhgUCkDtMmvkWjboCDUCBylbNgoWI9BJBAnKVy5TrBfwRvbE9NbOUqoNScnjyBxFMDzaBSs4336aOJne7Ie1uuXM8ZOqrCHxV8BxIoACwBbKMrM1oA6m8Xbewcokuquw+AhB1bir4utWVxkG/Y0IogxyPRnauFANLbDWZd8Eh0OdhBJ7buKfutY8CtA8P/U+MsMYoBEnbsr1glU888vn4PZ251ncJBcKwWzz7m6O8nRGhhsAo5CV5RImeUUQc7DlLT8B8LpUqJJBm4JCOwy+Tzk1JmpcK5fIy/zncWOvgUI9fKAGokMj/bubcGe5S2c/26Ix4VTWQwGNcp9qxXpYpVp5KP1ztIE4NUIS6VBmnZPLZiez5xnKxbAgjkdEjfHqlDibNcseykWVdOq9QeAAQjXRJ12ag96M7AIk0sUoUo1qPEkQ95o3sr7CzFlt1IDCLYjq3HTs+3vV7hAdkCVfnaOK5ZCqgQ5AM0MQKnaWg7hwkus52wK2Y/dTSAoNyW406z6gVfkxhUYjsuKTY1r/dVR1U6TlrpeDHAI1WAJrbGWWKWyugoC4L1oq+/JlbDG61SVZnthFmqgBDW70Gm7olnb9V0fyY9eV7t5/X83BNQhTxObGBCtZqIaKuEQ3ENokCnS9YI7UEBPAQiB+wKveuutKt/SEB0W6vLNbz+oRaHAKBGYG5bLZN3DAbDI2Dy7gyITE7l6dytlK5JFQ3yLXQchewyunMNsaDhBuJuiXXNqwCng3luCxXI09XqtqKS0bWV4rLRZWmc5pZ37hFkZ11/aYkl4iFA7hRtfWcrIRgDBUHePYsMExnRgC7VIe67EHDumRZuvxUCsHtNCFDd1IoGezjvVtenvHNTf1rwwo/+04c8Qd6xTzWDwWB4HjQ9d9HvZ4jqxFzd5aVBoq1e2NXfhZewFaN5oZPHLiANzrIsgRC5WjNdtwF0jSwD573rzuSe+7I23MN5t7qegZf7qKcJu7O43gPyDAaDwWAwGNcYTN4xGAwGg8FgXFOw5CyDwfAQ3A6jHlqgw7g+5sizavTGxN0aUv/ZZjQD9U81k3cMBsMzQCqItJDavDEYLQAHRQGpWTViI0IAEJCKg0DjajJlNFtrBTNGYTAYHgN2EtrI6eH1yoxrEwiIQrtN3XNHGY0FHa8CoSi5nllGs6FCTN4xGAwGg8FggGuK/wO4KQoM7h2q3wAAAABJRU5ErkJggg==\" /><br /><h4>Caption</h4>Figure 1: Sketch of Docling's pipelines and usage model. Both PDF pipeline and simple pipeline build up a DoclingDocument representation, which can be further enriched. Downstream applications can utilize Docling's API to inspect, export, or chunk the document for various purposes.<br /><h4>Annotations (ibm-granite/granite-vision-3.1-2b-preview)</h4>In this image we can see a poster with some text and images.<br />\n",
+       "<hr /><h3>Picture <code>#/pictures/1</code></h3><img src=\"data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAAZ8AAAJDCAIAAABblI4KAAEAAElEQVR4nOydB1wUxxfHd7Zc4Rq9967YUcQCioJYiN1Yo4lJTKzRJGqaKZrEqIlRE02xJDHN2GLvvYEgdpr03uGAq9vm/7nb/C8EERFBEPcbPobb252dXW5/9+a9N/MAhBDh4eHhaXfgrd2BtkhNTc3JkycrKipYlgUAiMXiDkbMzMyQdgdJkhBCoVCItGFKSkr2799/48YNhmFcXV2HDRvWtWtXDMPax9XxtBCAt93uJzMzMzIysrCw0MXFhWVZiqIKCwstLCxeeeWVOXPm2NnZIe2IWbNmFRcX79ixQywWI20PnU63bt261atXoyjq6+uL43hFRcW9e/emT5/+zTffPLTPc+fOzc7O3rFjh1QqfVJd5mkr8LZb/ej1+n79+v3www8Mw5AkmZmZuW/fvuXLl1+5cmXv3r0ymQxpL5SUlOTl5YlEIqRN8vXXX7///vvTpk2bN29e586dcRwvKSk5ffr04cOHy8rKXFxcGj68tLQ0Pz+ft92eTXh1qx8IoUKhcHNz4176+/sPGzbMycnpo48++v777xcvXsxtr66uPnXq1KVLlyCEwcHBkZGR5ubmpkYoirpy5cqZM2fKysocHByCgoIGDx6MYVh8fHxmZubo0aNx/J/7f+PGjdTU1LFjx3K2yZkzZ7p06aLRaHbv3q3RaPr27Tty5EiBQHDy5MnTp09DCJ977rl+/foBAEznunv37smTJ9PS0mxsbIYOHdq7d2/u3crKytOnT3fu3JlhmF27dlVUVPTo0WPUqFHm5uYQwgsXLmRnZ1dWVv7www8ikcjc3HzkyJEoil69evXcuXPZ2dlmZma+vr7h4eGenp7336W4uLji4uKePXseO3YsPj7exsbmueee6969e+19kpKSjh07lpaWZmdnFx4e3rdvX267RqPZs2dP//79KysrDx48WFNTM3fuXA8Pj9rH5uXlrVixYvDgwVu2bBEIBNxGJyen6dOnjxs3jrt7+fn5V65cuXPnTllZmaOj4+DBg3v37o2iKITw0qVLmZmZFRUVmzdvNjMzk8vlo0aN4sazN2/ePHbsWE5OjrOz89ChQ3v06GE6KUmSx48fP3fuHIqiw4YN8/PzO3/+/MCBAx0dHbkdsrOzDx8+nJiYaGFhMWjQoNDQUK5NCOHJkydFIpGnp+fevXtTU1Ofe+45lUrl4ODQp08fU/tqtfr48eP29vamW8HTUkCe+8jIyHBxcRk/fnyd7enp6fb29iEhIWq1GkJYVlY2YsQIHMcHDBgwaNAggiDCw8OLioq4nXU63axZs6RSaYcOHcaNGxcYGOjo6FheXg4hnDdvnkwm02g0ppbffPNNgUDANRsfH29paRkeHt6xY8ewsLBOnToBANasWfPVV1+5ublFRka6uLgoFIpDhw6ZDv/tt9+cnJxcXFzGjBnTqVMnKyur9evXc2/duHHD2to6IiKic+fO/fv37927N4IgU6dOpSiKZdm33npLJpNJJJLAwMCePXtOnTqVYZh9+/ZZWlr6+vpOmDAhKirKyspq5cqV9d6o2bNnW1tbDxw40N/ff/z48Q4ODra2tvv37zft8Ouvv7q6ujo7O48ePbpTp07m5uamjuXm5iIIEhUV5efn17179wEDBkRHR9dpf9OmTQiC/P777w38sZYtW2Zubj548OCxY8d6e3tbWFhs2LABQsiy7NKlSxUKhZmZGXd1EydO5Nxw69ats7e39/b25g6xtbU1nYJhGO5vERgYOGbMGG9v71GjRiEIYrrb0dHRPj4+MplsxIgRXbt2lUgk77zzDkVREEKKovr06dOpU6egoCAfH58+ffps2rRpxIgRHh4eWq3W1OETJ04gCPL99983cFE8zQKvbo+gbhDCIUOGODg4pKamQggXL15MEMRvv/1GG9m3b59IJJozZw635+rVqzEMW7NmjV6vZ1mWJMnk5GSdTsdpmZ2dXW11e+eddywsLDh1u3HjhpWVlaOj45UrV2ia1mg0zz//PIZhYWFhqampDMOUlJT4+flFRkbSNM3tb2FhMWPGjKqqKgghSZJLliwRCoXJyckQwlu3btna2trY2Jw5c4aiKJIkP/nkEwRBYmNjIYQ0TUdFRfXo0aOqqookSZqmGYYZOHBgnz59ampqOI1QKpVFRUUsy95/N95++20EQcaMGVNZWQkhzM/P79Onj5+fX35+PoQwKSnJzMxsxowZ1dXVXMcWL16sUCji4+MhhNxwWKFQHDt2jCRJiqIYhqnT/oQJExQKxc2bNxv4Y929e7e0tJTrnl6vnzt3rkwmKy4u5q5u7Nix3bp1Ky8v507Bmas4ji9evJj7W6jV6qlTp7q5uaWnp0MIjx49CgD4+OOPSZJkWfbu3bsdOnRAEOTYsWNc+4GBgc7OzklJSQzD6PX69957D0GQffv2ceoWHh6OIMgnn3yi1WopiqJp+uDBgziOcztwvPjiiw4ODtwfi6dFQVvMKGyfSCQSvV5P07RKpTp+/Hi/fv0mTZqEGRk1alRERMTJkydLS0u1Wu2uXbt69eq1YMECgUAAACAIws/Pr5EOIJZlx44d26dPHwzDxGLxqFGjGIaZMWOGt7c3iqI2NjZRUVFXr14lSRJBkBMnTqjV6uXLl8vlcgRBCIJ46aWXrKys9u3bx7XGMMzYsWPDwsJwHCcIYsSIEebm5jExMQiCYBiGoijXPYIgMAzjREGn06lUKkPUCQCFQmFnZ1d7FFy7n0KhcMGCBdx43NHR8Y033khLS7t+/TqCIDt37pRIJEuWLOHclARBLFq0SKvVXrx4kTucJMnx48dHRkYSBIHjOIrW/TRqNBozIw3cq4CAAGtra41Gk5+fX15eHhYWxjBMdHT0/VfHjWS3b9/u5ua2cOFC7m9hZma2ePHivLy8a9euIQiyZ88eZ2fnF198kSAIAEBAQMDkyZNN50pMTIyPj1+4cKG/vz+KogKB4O233zY3Nz948CB3r1iWdXR0fOutt0QiEY7jGIaFhIQEBAT8/PPPXAuFhYW7du168cUXuT8WT4vC+90eDb1eTxCESCQqKCgoKiqKiIionZcQFBR04cKF/Px8hUKRm5s7YcIEk7eo8UAICYLw8fExbeHifbW3WFhYqFQqLt4dGxvLBQcBMETAAQA6na64uDg1NZXbuU5rYrFYKpVy4lX7pNwvGIbNnj17/vz5HTt2HDRoUP/+/cPDwzt16lRvV2madnR0dHd3N20JDg5mGIY79bVr19RqNTfQ4zrG2bBpaWnczizL1nHS1QHHcb1ez4n4g0hMTPz8889PnTqF47hIJNLpdHq9vry8vN6r0+l0ycnJ5eXlr732mul2cWZjdnY2giCpqakuLi5OTk6mY3v06IHjONfCjRs3MAzr0qWL6V2FQtGzZ89r167RNI2iKMMwnTp1qh3JVSgUEydO/Oqrr27fvt2lS5dff/0VRdExY8Y0cEU8zQWvbo9ASUlJamqqo6OjnZ0dN5CpI17cY8wauf/d2gAjDbxb+2W9WTumfUiSNDc379OnT23bJzIyslu3bvU2yBntDZx9ypQpnp6eJ0+ePHPmzDvvvGNlZfX555/PmDGj3p05+8j0krOPGIbhgioKhaJv375CodB0CWFhYYGBgbUPb9guO3DgQE5OTkBAQL07KJXK2bNnFxcXb9iwwdXVVSgU3rlzZ968eVwH7ofL77GysgoJCWFZ1rQ9PDx84MCByMOgaRrDMFMsiEMgEHBj6tp3oDYvvPDCihUrjh8/7u3tvWfPnuDg4K5duz70XDyPD69uj8ChQ4dSU1OXLl0qFoutra3Nzc2Tk5Nr75CQkKBQKKytrRUKhZWV1d27d1mWvX/AheO4RqOp/XQVFBTcv9tD4Z4oHx+fs2fPzp4928LCosmXVkfsgo289957+fn548eP//jjjydOnHh/1giGYcVGXF1duS1JSUkoinKJGu7u7rdu3ZoxY4Yp9PyojB49+osvvtizZ8+wYcPufxdCeOfOnbi4uB9//PH555/nNhYXF2s0mjo303R1ZmZm9vb2VVVVr7/+er1jQ29v75MnT+bn55v6fOPGDZqmuRZ8fX1JkszJyTHtT1HUnTt3evXqheN47T9obZydnSdPnvzLL794eXndvHnz559/boJFz9MEeL/bA+EiaAzDUBRVUlLyww8/vPXWW15eXnPmzEEQxN7evk+fPmfOnImPj+f2T0hIOHz4cFBQkLOzs0KhiIyMPH/+PBcg49BqtdwD4OvrW11dzY0ouWSOQ4cOEQTRtH6OGDFCq9WuWrWqtsFSVVWlVCobc7i5ublKpTLtrNfrOSc9J16urq5dunThwgL3H4thWE1Nza5du7iXNE1v27bNxsaGMxunTJlSWFi4adOm2h2rqKioqalp5KX16NFj8uTJP/300/fff6/X67mNEMKUlJRPP/20srKSu2llZWXcWxqNZuPGjQzDmNTN3Ny8pqam9q2YNGlSSkrK5s2ba19RRUUFN1QfO3ZsTk7Ozz//zIUgEhIS/vzzT9NugYGBLi4uW7duNY3rd+/enZubGxUVxY1zH3QhkydPzsrKevfdd+3t7UeMGNHIy+d5THjbrR64j+mJEyeGDRtGUZRarU5ISOA8xJ999pnJTnn//fevXLkyfPjwV199FcfxLVu2SCSSjz76iHu0li5dGhcXN3r06GnTpgUEBOTl5Z09e/bYsWO2trZhYWG+vr6TJk16+eWXdTrd2bNnHRwc8vLyuGZZltXr9bUVgdOa2qYBTdMURXG/h4WFLVu27PPPP79y5cqwYcNwHE9OTj579uyWLVsGDRrERfpomq59dbW3jB8/fseOHSNHjvT29vby8po/f/7zzz8vEokGDBggk8lu3bq1ffv2ZcuW1TsrgGEYS0tLbvDYt2/fEydOHD16dPXq1X5+fgiChISELFu2bM2aNXFxceHh4QRBpKSknD59+scff4yIiOBu8oOGkBwYhq1du5Zl2blz565fv37o0KEikejevXuHDh0KCwubP39+p06dQkND33///YKCAltb24MHD5aXl4tEIpOrbuzYsb/99tvo0aN9fX2dnZ1Xrlw5bty4WbNmvfPOO+fOnevfvz+CIHfu3Ll+/fr27dt79uwZGRm5YMGCzz777NChQy4uLpyzLDMzk2tNKpWuWbPm1VdfDQ8PHzt2bEZGxtatW8eMGcNljXBegnq/pfoYOXXq1EcffcTHE54YvLrVg0KheP311wsLCzkrQCwWv/zyy506derVq1ftMYWvr++RI0d+++23kydPQghnzJgxbdo0LoEAQRA7O7vdRvbt23fjxg07O7upU6dysUVPT8+//vpr06ZNx48fd3V1/eyzzxAEuXjxIueysbOzmzt3bm3nlLe39xtvvFHb1d2nT59FixZxDxIAYNmyZb179963b9/ff/8NAPD09Fy8eDHnsLexsZk7d26vXr1Mx1pbW8+ZMyc4OJh7OWLEiH379l26dKmsrEwsFisUijfeeOPQoUNHjhzRarWenp7btm0bO3ZsvTeKpmkHB4dvv/3277///vXXX+3t7f/444/x48ebdvjwww/79+/P3QQURd3d3ZcuXcqlzkql0jfeeKO2c7BebG1tt23bNmnSpEOHDl29epWbZ7phw4bhw4crFAoEQb777ruNGzdevHhRIBBERUVFRETs3r3b5PiPjIzcv3//hQsXSktLpVIpF7FZt27dsGHD9uzZs3v3boIgvL2933nnHV9fX05P16xZEx4efvbsWRRFFy1alJeXd+rUKdOofOLEiU5OTr/88stff/1lZWW1bt26iRMnWlpaGsZBKDp58mQuRF7nKiQSSefOnWNjY3nD7UnCzzNtBjg76H53MgfDMCzL1vG+c1AUheN4Aw7+R4WiKADAg3rySHDJdA13b8GCBcePH79w4YKdnR1FUfVeYzN2rIEuca6xxsyrb7hX98dbJkyYcOfOnfPnz9eZX0xRFIqijTyjSqUKDQ11cHA4cODAo3aSp8nwtlsz0PBDy2XD1ftWk31tD6IZG2yMEnFOSW4Y2PCpm6VjDXSpabp5f68ghJ9++qlGowkODtZoNHv37t23b9+HH354/9IJjbyi0tLS6OjoAwcO3L59m0vwbkI/eZoGr248TcfBwcHPz6/ZNboVQVFUJpMdO3bsyJEjLMuam5t//fXXs2fPbnKDaWlp77//Po7jK1eu5GYy8Dwx+JEpT9MpLy/X6XR2dnbNMhZuO2g0mtLSUi4y/pjri2i12sLCQqlUamtr23wd5GkUvLrx8PC0T/h8Nx4envYJr248PDztE17deHh42ie8uvHw8LRPeHXj4eFpn/DqxsPD0z7h1Y2Hh6d9wqsbDw9P+4RXNx4envYJr248PDztE17deHh42ie8uvHw8LRP2tXSDjxPNVytaEORXWOp0NbuDs9TD2+7tUVUKhVXTR15lvj444/79es3YsSIiIiIuXPn3rt370F73r17988//2y4JsODyM/P/+mnn6qrqx+vszxPAby6PTkKCgreeeedUaNGjRkzZtasWRcuXHjQnidOnFi6dKmpLswzQkJCglwu/+CDD5YsWXL79u25c+eaNKjOrYiLi9u4cWPtUjj17maitg7m5OR89dVXdQqGcQWbm+9SeNoE/Mj0CVFZWTlt2jSBQDB16lSCIOLi4hISEkJDQ+vd2dfXd/jw4c/aKtUAAC8vr7CwMARB5HL5hAkTUlJSiouLd+/eXVlZaWVl9eqrr/bp0ycvL2/fvn2ZmZnz58+3tbWdO3eug4PDyZMnt2/fXl1d3bVr19mzZzs4OOh0unXr1gUEBBw7diwjIyMqKmrmzJkURf3++++FhYUffPCBlZXV3Llz5XL5unXruDKsPXv2nD9/vlQqbe07wdM88Or2hLhlJCkpiVujddKkSaYKfgzDcAWfRCJReHh43759pVJp7YX8z549e/r0abFYPG7cOH9/fwRB7t27l5eXZ25ufuDAAYlEMn36dNP+WVlZu3fvLisr8/b2Hjt2LFeuKTo6+tixYxiGjRw58qFlqFoR0z0pLi7m6lEUFRUNHTrU1tY2Jibm9ddf3717t7W1tbe3d3p6+oABA8zNzSUSycGDB996661Fixa5u7v/8ssvc+bM2b17N8Mwq1atCggIeP3114ODg9955x0rK6vRo0f7+/vL5fI+ffrY2dkpFIply5aVlZXNnj1br9eXlJRotVpe3doN/Mj0CSGXyzEM27lzp6mSOVc+qqam5uWXX16+fDkAoLq6+siRIwiCnD9/fsWKFQzD0DS9fPnyRYsWMQxTVFQ0bty4y5cvc+UBZ8yY8dlnn+l0usOHD0+ePJkr3XLq1KnIyMjbt29LJJJz586lpqYiCPLNN9+8/PLLWq22qqpq8uTJhw8fRtokGIbduHHjyy+/XLp06YIFC0aOHNmlS5dXXnklIiLC2to6PDycZdlLly5ZWFj06tXL0dFx6tSpI0aMkEqlX3311YwZM1577bXIyMhly5YlJSXdvXuXs3znz58/bdq0F154YerUqceOHROJRP369bO2th4/fvzYsWNtbGySk5P9/PxCQkKee+65l19+2cbGprVvA0+zwdtuT4hOnTq9/fbby5cv37x5s62t7dChQ1977TWpVHrmzJlTp05dvHjRw8PD5CFiWZarvHn37t3t27fv3r2bM7iWLFny7bff9uvXD0Ko0Wg2bNjg5OSUlpY2fPjwO3fu9OjRY/ny5aNGjVq9ejV3UoZhMjIyNm3a9O233w4ePJgrlrpx48YhQ4a0wVIvAACtVltcXIzjOFdyFMfxVatWHTp0yN7eXiAQlJWVcXXsSZJkGEan04lEIp1Ol5ycrNVqY2JiuO8DtVpdWFjo5+dnZWVlKq1tbW2dkZHBHcuyrFar5ba//fbbixcvvnjxopub28yZM7lxMU/7gFe3J4RAIFiyZMnUqVOvXLly8eLFr7/++tatW1u2bImJiQkKCuKkjbNfuF+Akbt37xYXF2/bto3Lk0hISNBoNJwCdu3alavfbGlpaWNjU1RUVFNTk5KSsnLlStNJMQxLSkrKzc3lKtcBALKzs/Py8kpLSx0dHZE2Bk3Tffr0WbNmjWnLzZs3N2/e/MsvvwQGBgIAhgwZwl07F03mjF8AgEgkeuWVV0aOHEmSJPdSoVBw+lU77swVKq19LIIgUVFRAwcOjI2NPXDgwIsvvrhr166goKDWuHqe5odXtyeKk5PTBCN9+vRZunRpVlYWjuMNRA8YhpHL5SEhIQAY6vuEhIQ4OTmhKMqVf2ZZFkVR7nHlHl1OE+u0IBKJQkJCcByHEIaGhtrZ2XHOuLYGy7J1Apfl5eUCgcDR0VEkEsXFxV29enXs2LHcMF+pVJaWllpbWwuFwoiIiAMHDkyaNMnOzo5l2cLCQu6WctlzXFMQQs6pJ5fLq6urS0tLbWxsUBQtKSmxs7MbNGhQcHDw7t27CwsLW+nqeZofXt2eEEqlUq1Wc9aWqQq9mZlZcHDw9u3b8/PzTW9xQCMdO3bEMMzf379z587cdpZlOaWrbZVwL2UymZeX19GjR/v27Wva7u/vb25ubmdnZxpz3V9uvY0gk8nqePT79Onj4eExZcoUHx8fpVLZpUsXrv5eaGiotbX15MmTfXx8li9f/tFHH82fP3/YsGEeHh4ajaa6uvrAgQMoilpaWpoG4GKxWCaTIQji7e3dq1ev+fPnOzg4LF269Pvvv8/Ly3NwcMjPzw8JCQkODm6lq+dpfnh1e0IkJSW9/fbbHTp0cHNzKy4uPnTo0KRJk5ycnBQKRb9+/SZMmDBs2DCSJHEc/+ijjzj1oSiqc+fOM2bMmDx58siRI62srBITEzt27PjWW2/d3z6nWcuWLVuwYEFxcbGfn19KSsrLL78cFBQ0Z86c119/fdSoUfb29snJyQ4ODp988gnS9li2bFkdM9bMzOy33367cuUKRVGBgYEkSZqZmSEIYmVltWPHjpSUFAAAFzb9448/YmNjS0pKpFKpr6+vWCxmGGbr1q1eXl5cU+PHjx82bBjnItiyZUtiYqJOp/P29l62bFlycnJVVZWVlVVQUBCngDztA76e6ROCoqjLRioqKszMzEJDQwcPHsx5f0iS3Lt377Vr18Ri8eDBgwcOHHjv3r3U1NShQ4dyT/sZIxRFOTk5RUVFeXp6JiUlZWZmDhs2DACg0+lOnDjRrVs3zoOekpKyc+dOpVLp4eExceJELgjIZYRoNBoHB4ehQ4d27Nixte8HD0+Lw6sbT3MAIdImR7s8zzL8yJTnIbA1NWx1NayqYrmfsnJWpYJ6PdSTiF4LdXrj73oERYFACERCUe8ggYsLgmMIIUAEBBCKEJEIEQmBSMwrIM+ThFc3nv8ASZKtqaGSk6mERCo5mS0tY6ur2KpqtqoKVlex1TUITRtE6h+dAsg//zf+j2UNSSh6HeHtBbnoJwCIUIiIRMDwrxgRixCpDMikQGGOWFgAgQD5f2YGD0+zw6sbD0Jn59BZmXRqGpWURN5NoLOyoFaLUBQkScOQE0UNdhkARutMgDSwNhGECI4DMwmCYf+aaRSFkKTBAcL5QFAUGhtEcNwgcNbWwMYWKOSIXAFEoid1xTzPBLy6PaNAnY66d0937jx14yaVmmpQNLUGwTCAGaXHaJ01RW4AAMR/P1T/Gnq1YBjDT2EhzM+HACBiMZArEIUCODoCZ2cgkfBjWJ7Hh1e3ZwumtJS8fkN/5Yru3DkmK9vgMqMog6gZbC5xs5wC4PjDA1WceBntQcMvej0sLkKKCmF6GkIIgIM9cHEFtrbA0pIfuvI0GV7dngkgRVF372r+3q+PvkIlJEK9HhDEP0POZh0PGqZK4Pg/g9BHOcwwmOUg9TArC2ZkIDIZsLQEjk7AzQ2Ym/PWHM+jwqtbO4e6m6CLjtbu208l3GXVGoOSEESLergMY9vHOt44kkVRRK2GNTUwLw+5Hm/QOG9v4OhgcOrx8DQOXt3aKQyjuxKj/vMP/aXLTEE+wHDD8POJFCsAzTWW5IIPxun1MCsTZmdh9g5n3UhXj0AvhSfSfLAsm5KSIhAITBMbuIWUlUqlu7s7NzuihaAoavv27T179uzatWvLneWZhVe39gZbXaO7cF7z2x+6y5ehVgswzJBx9sQAoNnUrVabhkQTiGZVpn9Z87cyUT/YNXyU99gedoaFQx6/ea1WGxoaCiG8fv06N99Dr9ePHj367t27J0+e7NevH9JiUBT1yy+/CIVCXt1aAl7d2g9QpVLv+Vvz999kXBwkScMI1Djn/ImCYQC0SBwAoNhVcXGWtlSIYH/f2306+2SIU+jkjtO62Hb7f9JdE2FZViAQoCi6d+/ehQsXIghy5cqVgoICGxsbrlADhFCr1SqVShzHbWxsTCspkSQpFAqrq6u1Wq21tTU3bY5lWZqmCYLgdiNJkltkmJNRpVKJoqiVlRWO//Po4ThuWo5Jp9OVlZUJBAK5XC7i82OeHXWrqqoqKSkRCoWOjo6mT0aLotFobt++3alTp7a/FDVbU6PZf0D142Y6JQUyDBAInswgtC4QGgKvaPO7/wGCaHB6D3NdYMxYEWJCLaU5nHHwQu65UNewSR2mdrPt3uTGubXzJk6ceOLEiVmzZpmZmf31118RERGJiYncokkXL15ctmwZV6vMz89v9erVzs7OGo1m/PjxXbp0uXv3bl5enqur63fffefs7Hz+/Pkffvjh+++/Nzc3Z1l21qxZQ4cOnTRp0vXr199//321Wq3T6ezt7b/66isfH5/a3Thx4sTy5ctRFCVJsmvXrmvWrJHL5c1x855dnoJwO8uy33777ciRIydOnDh+/PiRI0fevn37CZy3oKBg9uzZpoXCm0Z5efm6detKSkqQFgJC7cmT5S+9rHz7bTolxWA6CYWtGF5ERaKWODsG0XhxeSZdjP7fTEOBQeP0jP5I+oEFJ19//8LSexUPrBD4UGiaHjBggE6nu3HjRklJya1btyZMmMAt5o4giJub25o1aw4ePLhv3z6SJDds2MANwWNjY9PS0lavXr1r167S0tLt27cjCKJWq7OyskwL1eXk5HD1t2xsbFasWHHgwIF9+/bZ2tquWLHCNMWbW9JqxYoVI0aMOHjw4N69e19//XW+ouszYbsdPnx4+fLl33333aBBg6qqqs6ePdtIb0sTFjLj1oM0HU5RlOll09pXqVTffffdyJEjuWIxzQsZH1/94xbd4cNQpzMYa62eMwGhYUppc3cDIAgjIPYy8TpIipD/LJgOABBgQhVVcyBt75X8S8/7TZrgP8na7JFrI0AILSwsIiIi9u/f36FDBxcXF39/f1MJGzc3N6VSuWvXLpZlZTLZpUuXOPESiUSzZs0KCAhAEGTMmDFXr17lulR7HSfMMFQ33BAXF5fq6ur9+/drNBqhUHj79m2lUmkKWQAApFIpVxGiQ4cO3bs33RTleZrU7dq1az4+PuPGjUMQxMLC4qWXXuK2nz17Nj4+niCIc+fOiUSiN954w7T04O7du//66y+9Xt+jR48FCxZwS9EWFBRs3Ljxzp07KIpGRES8/vrrtT+FeXl5X331VXp6OoZhPXv2fOutt1AUJQji2rVrX331VWFh4YABA958803ukHv37m3YsCE3N1ehUMyePbtPnz6cMu7YsWPPnj0URQUHBy9YsADDsI0bNxYWFi5dulQuly9atMjV1XXVqlV3794FAAQEBCxatMja2roJ94QpKqr57nv1zl1saalhHPrk/WsPAAhFzb40JoZgt7HiGzCXQOpfxBgFmBDDqvTK725+eyn/wvROLw1xN6wN1fhTcF9Uzz333LRp0y5cuLBo0SKRSGSyrbZs2bJp06bQ0FAHBweKokjjxDIIocQIt49AIODqq9ZZdMfUjd27d3/22Wf9+vVzcnLiajuQJMkdzh2yxsjrr79uZmb2/PPPL1iwoA3Wvni6eApGpl26dLl169aaNWsuXbpUVFRk2p6cnLx48eLU1NT58+c7OTnNmDGDKwvyww8/fPLJJyNGjJg3b97169cXLlwIIVSpVJMmTbp79+6sWbOmT58uFApN4w5OmN599928vLw333xz1qxZ9vb2JEmiKKpSqX766acBAwaMGzfuu++++/PPPxEESU9PnzhxokgkWrhwoZ+f3yuvvJKSkoIgyNdff71mzZoxY8bMmTPn/PnzS5cuFQgE3bp1k8lkISEhUVFRtra2n3/+eWxs7Pz58+fOnevu7t6EesyQpDT795eOG1+zcROsrGzdcWg9DiyuP826rBYE4IIor4xSYg1+XFGACjDB3bI7711YuuTcoqTyxEc6C0mSnTp18vb2pihq0KBBnHXGjRm//fbbhQsXrlu3bunSpf3796/9yam9sjknZJzMmZaDLyoq4sz/rVu3jhkz5ttvv3333XfDwsJMhqGJTp06/fLLL1evXn3//fdXrVrFWYI87dx2GzZs2KpVq9atW/fVV185ODgMHjz4448/lkqlAAB7e/uVK1fKZLLQ0NDr16/v3Llz6dKl33333fz586dOnQohNDc3nzRpUn5+fnR0dHl5+c6dO+3t7e8/BcuymZmZQ4YM6devn+kLkyupOXfuXG4t/7i4uNOnT0+bNm3v3r0KhWLFihUoigYHB8fExPz5558ffPDBli1bPvjgg+effx5CKBaLX3rppcrKyv79+5ubmw8fPtzb2xtBkLS0NF9f39DQ0KZ5VaBOWf31hupvNiMM3XbstdoAoaB51Q2FSLWIPag3xBMasz+BEhCBxzKP3Cy5Mavr7LF+E7BGHKjX6zk5++qrr3Q6nY2NTXp6ul6v5zTIwsLi5s2bI0eOTE1NXb9+velvZ9qB89xxqtepU6f8/PyDBw+OGjVqz549d+7c4XaQyWRJSUlKpTI7O3v9+vVqtZrbztlxLMtyBWusrKxsbGxEItGzVqv7GVU3MzOzuXPnvvLKK/n5+YcPH16xYgWGYatWrWJZtnPnzlxAE8dxHx+f5ORknU6XmZm5Y8eOU6dOcca/XC7XaDTx8fFeXl71Sht3+NKlS1esWLF3797OnTu/9NJLgwYN4r6HuerICIIoFIrKykoEQe7cuZOXlzdjxgyuxEF+fn5gYGBpaWlhYeHPP/+8f/9+lmX1er1MJqupqeGGMCYbbcGCBUuXLg0MDOzQocP06dOHDh3a6PgvhCU3kNxjAlkmKiSgro2uOQqI5lY3gB8n7pWQSlM84eF9QIAQE5ZpSj6PWR5beHVB4CIX+T91/+oFw7ABAwZw7gs3Nzduo1gs7tOnj4WFBQDg448//uijj6KiohwdHadNm5abm8tV1erXr5+5uTm3v5ubG1eV0dHR8aOPPvrhhx82b97cq1ev119/nfvUvfvuu0uWLImKirKwsBg1alReXh6XNRIYGOjg4AAAOHv27DfffIPjOABg6dKlvXv3fuyb96zzFKgbh1Ao9PT0nD9/flpa2qVLl7iPl1KpNPk11Gq1XC5HUVQoFL7wwgt9+/alaRpFUZFI5OzsLJVKNRpNA3GA5557Ljg4+NatW2fOnHnxxRePHDnCLbF//9BDJBJ17tz5s88+476rCYKwsrLS6/VCoXDmzJk9evSofd6srKzadfxCQ0OPHj1648aN6OjoV155ZceOHQMHDnz4xVNqNusYkn8ZgZSou41ZVDfVjhggaHvf7RAaFghpvpEygIhWhJxik2iWEYJH+6xiKA4ReDzzcGplyuzu8yM9DEUV6kUikfz5559cPRoTDg4O3333HWemDRgw4NChQ0VFRY6OjmZmZlqtlqtktnXrVpMdN3bs2FGjRnG/v/rqq6NGjdLpdK6urlwRQgRBunfvfuDAgfz8fFtbW7lcrtVqRSKDj3LVqlWcon3//feFhYUqlcra2trCwqJJN4znqfK7QQhv374dExPDSUl+fv7NmzddXFw4yYiPj+eULiEhIS4uLjIyUigUhoWFnTlzxtnZOSAgoEOHDlxxPG5YsXfvXq7ZoqIizgfMwTBMSkqKlZVVeHj4kiVLIIQFBQWG9Pj/1p3ihiEjRoy4ceOGVqsNMGJhYQEhtLW1DQwMPH/+vJubG3deCCGGYRKJRKPR5ObmarVaiqLS0tLEYnFYWNjixYsVCkVj0k2gqoC9uwXJPYtABgEYpEnZaB9BBxdI/6c4XluhzvJHjweG4vFo/k0mu5HD0joAxBBRzazKeO/Cki9iPq3UGUzvejEzM6szEgQAiMVi00apVOrt7c2FOMVi8f07EARRO//W1taWm/YgEAhq1+Xy9vbmstjEYrHpy9Jkvzs4OPj4+PDS9qzYbgCA+Pj4Tz/91NfX18zMLDc3l6v8xEmSr6/vypUr5XJ5cnJySEjI0KFDEQRZsWLF3Llzo6Ki7Ozs1Go1QRB//vlnly5dFi1a9OGHH/7xxx8QQi6d0vSpYhjmgw8+UKvV5ubmxcXF/fr16927d0VFBfftyu1DEAT3RR0RETF9+vRp06b5+voCAEpKSpYtWxYeHr5q1ar58+ePGDHCxsampqbG3Nz8l19+sbe3HzJkyOLFi+3t7d97773du3cnJiZaW1tXVFR4e3uHh4c3fPmw5CZM34doyxD0/38piGAiWj6te8UX5VCjRR5zynpzg+LNZrsZEkEAPCPI1mr0j2q41YZACRayfyb9lqFMezd4mYf5v5NJedo3T0HVGIZhiouL79y5U1VV5ebm1rVrV+5LctOmTUeOHNm8eXNsbKytrW1wcLBJiWiavnbtWnZ2tr29fefOnU3FifPy8mJjY4VCYc+ePe3s7Gqfpby8/Pbt26WlpW5uboGBgTiOkyRZUFDg4ODAjVlKS0tpmnZwcOD2z8zMvHHjBkEQAQEBbm5u3Hc4SZKxsbEFBQWOjo6dO3dWKBRcyIJL6fT09AQA3Lp1Kz8/39HRsXfv3g3FFhg9zDkDs08gkEbqWi4QCERVf6XV/BkNiDY0PoUUJRs/Vtqrp2F18scGg0ihDD5P/6hl9Y8514pDz+jc5O5v9353oIvBqcrT7nkK1O1BbNiwYd++fWfOnEHaHZBUwXs7kdKbxtFVfQ82QCAlKFt+nkzOqbsWbusBSVIxcYKkZ6BhRczHBgeCjZK4H6lzBGw2+5RmaZlANj9w0fP+k5urTZ42S9sa1zwSfn5+4eHhT686PxBNMby7FSmJr3/Nbg6IoGaMfHogKpMYarW0HZppgRAMgjKB/hKSAZv16nAUV1GqVTGffRW7Sk/rmrFlnjbIU2y7tUtgTS5M+hVR5SPoQ/PUISCEVTvTa/4wjk/bQEovJEnzqZPNunV9fNsNB8RxSdZSao9xFfNmvjYIIc1SEztMWdhzsRnRgsu38bQuT7Ht1v6AFckGq61R0mb8ZqJJ2SgvQSfXthI/NdZnePxmAIJQKLsfJECWaXZp40JVOEb8mfT7J5c/qNIbprjztEt4dWsrwPK7MPk3RFfeOGnjjkFQIa2Y2gOVSxCGbQPJbgJDuYbHHg1gEKSZqa+RqXiTEkEanSwiOJJx8JPLy8o0pS10Fp7WhVe3NgEsuwuT/kB0yvvCow87kGKEAVLJyG6wtcXNgIBonnXlCMEu9poOks0SKm14SsPJrOPvnn+7SF3YcifiaS14dWt9YOU9mLIDoWr+TWp7BAAkSdkIT8P4lGqGPIymA6FhWNqEglj/BYNoDl51DeSh8Am4Eg0CF1MY/fGlD0o1LbYGH08rwatba1N5Dyb9hugf2Wr7F4igYlr+QndUIWvd+KlhrfPHTk8BKHZFUJhOFrTcsLQOQkx4Of/iiisfVeurn8wZeZ4MvLq1JrA6i03+A9FXNMlqq9UOSYv8pNKRXSEDEdiatltTipnWAkWAFmf3MtcED1jKrYUQYsKz2adXX/1cQ/2zdAdPO4BXt9ajJh8m/opoS5HHmGb0fwCkSGmUp6CzO2yOeQJNxDAyJeov4WyiwQZQCGLFxem1Vhh/YghwwYG0vV/GrtIz+id8ap4Wgle3VkJfyd7bgWiKHyFC2jAQQQWUYppxfPp48VOAIAIAxAAIHmV9W8MaKigKUKyO9chCSNK0nvuhaObBlh2ACCsgDjG3SUi1aDyh/rMjgMAEe1L++vHmd0/41DwtRFuZxPNMoWcgnXlOokxlseas6maIn/pLJKO71fxyuck+K2D8uUnqcxnGAcO6EgIUQdhHsN3Q2uKGY9ihW7e+On4CGpuFEC4IHzw2MJD+f1GV2mAAu4uXXIPZOHzyppsBgAAMxX+5u9VOYsdP1WoH8OrWCtwprCrWdgiSFdmoE1lD9c/mepSN8dNh7vqb+eStjCY4+A0ChCDf1FTv1WqcMKyUZQcKhUvl5qhx+8MPN9hu/x0NAJBVWlqhVi8fNRKgKMvCzs5OTH2hD8OpAbgkyCvRVIhBq5WDQgHKQGbT9Q2eCu+eDr1aqxs8zQKvbk+a1FLVvdIaFpFfEg7vBsw9tLGQZWBzuQiM+b3yad0qskthtfpR10cSAHBZr9usVm20sBwoFN2myNcqKnoKtMPEZtRDYwUQGk5333rZLERcLS1HBQX985ZeX6/hBhBQJWT2knFC0MqlUjCAVegqPo/+5Ovwb93k7q3bGZ7Hgfe7PVGKavS3CqoRCDCE1bL4VSI0UTIIwUQANttUKkgxIl+JdHR3Q37vI0YvUQS5R1EyAPoKhCyC9BQIvXD8hE7XyO/Af2y3/+ogjqFxWVkj13495qu1m0+c0FNUvd48FKJniMwytqZ1BqX/RYAJ0pSpq2I+01Ca1u4LT9Ph1e3JoaWY+NxKPcNyTzdAIAuR62jPONlISmCBNpvAGcan0mHugq6PHD+FCGKGoloE0RvtOB2EVZDNomk9bFxmLUDrKBeEsIODw8KI8Am9enZycvxo/4EVBw+iGFanNRQiOhF6HCZSbDMsndQsCDDBpbwL315fR7OtmiPN8xjwI9MnBrxTWFWppTD030cbIBBDmHvQWycx6wFOSPV5bDNkh/w/fvpC9/KcMlilavz4lIYwUCCUAfBJlXKSRHJOq0umqG4CAW3o58P1DaDAsAJSrYEnwzBh/v5hAQEGgw7H7RWKb8+cfTU01NXKqrb3DQX4DbTgJp0taJbLbyZwFN+TsrOLTbehnsNbuy88TYG33Z4QmRWa9HINWkvaTGAInQMdzpuNKzfzRwHbLAWlDPFTbzPp6Eebf0ojiAeOb7CwVEH2y+rqasgGG8QOFTZutAgM8lYXFkKGpg319BgmwNFJT5GVGk2d4AMD2BOCdA2jffKJIA2AAlTH6NbGrc6tfnj5C542CK9uTwIVSd8uqGbhA59dDGGUUHJeMDxP0gs1eJ7Y5snvHeou7OEJyUcYW9EQ9hEIt1pa/2ZlvUxhXgXZ7gIBCsDDFRcAQzHT/8JCWKBUao3F29Va7S9XLtvK5e7W1rVrFaMQlJgxp/V3iLZkuBk0F7I4IJzkVunVMSx8isenWq22do2kJwBN01qttvH76/X62jWwm4u29Xlql9AsvJGnrNHTtcek94MirBYRXsIHdZeZ+6guAEYPDckijzs+lU/pWpFZwjZufAoQRA9hnF4vQVEBAL+oVDUQjm9MwNSoboixWFStDYasuw/37b+Tn28vl+crlRTDfPX8BHMzs9phUxQl9oNrVVCDt6XvWpplrMVWg9wDO9u71NDZ2TW3POSBjTmQYZg1a9b07NnzoSWBngw0TQ8dOnTevHkTJkyovf348eO7d+/WarUYhnXo0GHs2LG+vr7NddIdO3b8+uuvR44ceVDN6Xv37lVVVfXq9U/OzZw5cxwdHVesWIE0K7y6tTjpZeo8pa5haeNADXEGcB0NrJHJu6mO40wN+3jTLf8Zn47rUbX1AoCwkdWq/tZqYkg9RBA/nPjG3NIBwxr1vQ8AKhbVHlYbZi8gyNJhQxMLC2t0OrlY3N3Fxc3a+j/SBkGliORWGAcNqLkh0dYQsYAQaem5tKxhMI8GWPtEeAbayaS0IV+HTa2KsRa5yQTWDz0cQvjXX39hGNZG1A3HcY1GY6oXbuLKlStnzpxZsmQJwzB//vnnHiNclcLHh6IojaahcPOuXbvi4uL27dvHvXz55Ze5OorNC69uLUuVjr5bVMVl6jcGw/MLYQrip5JKeutOivX57GP9jQzjU8kQF911D/319Ifm90JjqPQThbnWuCC9HEUJBNCN0xLDHFJh3akXBol0cPBzdv7nNcPUSXZDUfwqlnmHzGogngBQwFKsOkPLqBnCAhc7i/5JO24BaJaRCaQD3Xr2cvLEUUAbFgdGAIJq6OoU5eUeNiPQRgyfBQJBHZuFpulLRsrLyzt16jRq1Chra2utVnvkyJGwsDBLS8uMjIyYmJiIiAgbG5ucnJyEhITw8HBTIVQEQXJzc48ePXrv3j2pVDps2DCuUr1Opzt+/Linp+epU6eKi4uHDRsWGhrKha0zMjL++usvtVodHh6OYcZvhv8CAPD09HzttdcQBBk/fryzs/O1a9c4dUtMTDx06FBJSUmvXr1GjhzJ6U55efmuXbvS0tJCQ0MtLS1RFO3bt29ubu6NGzdGjBjBXe/JkyednZ07dOhQe0rxuXPnrly5Ulpa2qFDh1GjRtnZ2RUUFMTExOTk5GzZskUmk0VFRREEYSq/mZub+/fff2dlZXXp0mX06NHm5uYIgpw5c0Yul2dkZMTGxnbu3HnChAlcbdnr168fPny4vLzczc1tzJgx7u7/yU9sQ2OB9geEMLGoWkv9kwLSSIDhr0LnIU7nxaOUYl9jpkhTHmUUx1AhbmiNoA3zTy3NYePmnwoAMEdRC9Tg+W+ktBn2AgCIhPeHRGiGoUnyn5//ShtAAI0yh7GkhloGCK1hsjbn5/ycX3S0LGNTbsHfxQbzrbnDDyxkGZbxsnCf1jmyr4s3ikKmVkQGBViRNq1Yk9G0xpVK5YEDB1iW9fb23rFjx+uvv07TNMuyS5YsiY6ORhDkl19+mTp1Kld6fPv27evWraujR9euXbty5YqXl5dWq50+ffrp06cN/lyV6oUXXpg3b155eTlFURMnTuRaKCgoeP7552/evGltbb127dqUlBSTdtSLXq+HEHL7REdHT5kyJT093cnJae3atR9++CGCIGq1ev78+du3b3d3dz906NC4ceM2b96MIEh8fPzixYtNhuHKlSuPHDliahYAQJLkrl27KIry9vb++++/582bV11dTdO0SqXS6/UFBQVlZWUsy27YsOHXX3/lyqhPmDDh5MmTrq6uP/zww5w5c2pqahAEWbVq1eTJk8+fP29lZfXxxx9/+eWXhjk/d+68+OKLNTU1/v7+qampSUl1P0i87daCFNbocpQatEnVizGEKYMW50XP9UAvumjiWYNqPEI7KAoS0ktzSmoGdHUSI7jAUyQd261664XGHAuboqbQYGLdF1V4SCchTDHTxpFpDXjcAAYqY5TqDI3XQlexk6j6ripjU648QCbrKIFUs9lvDGTEmLiPc9d+rh3EBMqZbP/pBgIYlrpXddla5Eo8+uxgKyurtWvXGmz5qqqePXu++OKLt2/f7tGjR2hoaExMTGRkZGJiYlhY2OXLl0eNGhUfHz9gwIA6ejTGiFqt1ul0Go3ml19+GTx4MIZhDMPMnDlzxowZhs9bYeGBAwdCQkK2bdsmk8l+/fVXgUAwdOjQzp07398lHMczMzO/+OILlmUPHz48YcKEvn37UhS1atWqESNGfPbZZ5xNN2TIkFdffbWwsPDixYtXr151dHRUqVS3bt3iGsEwrPaIUiQS1bY3IYQCgWDjxo3chQ8ePPi5556Lj48PCwuLiIiIj4/npLN2KfRt27YhCPL777/L5fIJEyYEBQVdvHhx+HBDRk7Xrl2//fZbAIC9vf2WLVvee++95ORkvV7/8ccfc3bc/QWweHVrKRgIE4traKbpNfAwhFGxwhhikFYi8dVEQ1YPG+eGQzFQWKYet+xQTklN8q/TXe3kLEVJI13JWz662BQgaJk/OgCAMJS1biwQAbhoDxutgfoGVnMDAKFqGFyOiR1FuBgz8xAbrCw9CwxLijRH6gw02GhOMochnj29rewgwtAPWAEUBZhSX5xZc93XvG8TzvLjjz8eOHBAp9MBAMrKynJzczl1+/3331NTU5VK5ezZs3/++efMzMycnJylS5fWaSEpKWnVqlW5ubkEQeTl5Tk6OkIIWZa1tbXt1KkTt4+np2d+fj6CIDdu3OjevTunFz4+Pn5+foaMnP8CANDpdPn5+TU1NcnJyePHj7e2ts7Pz8/IyFCpVK+88grXfmlpaWFhYUZGhru7u729PYIgUqm0e/fuen1j14natm3bnj17dDodjuPFxcUVFRVc7KV23NxEfHx8jx495HI5giBOTk4BAQG3bt0aPny4QCAICgri7Fl3d3eKopRKZVBQkLm5+YgRIwICAkaNGnW/o5NXt5Yis1xdUqOvN8Gt8aAIS0FwDeurklp00ZzGqGrDJK4GMQwHGPjp9qu+LuZaw5xOowRABMUp+eROVEYRW1FjWMmj2QEACB6hZAyGoNlE1VUkC7ANWaWQRqz7m6vTNPm7iszcxVW3aiyCzaU+ZpBuBmljIEOggiD7jmEeXWRC4n6T7T5AZs0NO7GXQmj3kP3+a7CfPHly9erVmzdv7tatm1KpnDx5Mpei0a1bt/Xr1588edLa2nrAgAFbt249dOgQRVFdunSpfThN04sWLfLy8vr111/FYvFPP/20f/9+TjTr+NTu969BI/f3kKIof3//b775BkGQQ4cOzZ49e/DgwQ4ODgCAYCOc+kyePLl79+5paWlUrSl0puwNrnHT9jonwjDsypUrK1euXLt2bb9+/RiGCQkJ4ZqtfVQD9602Rk/Jv7tRFOXm5nbs2LGjR49euXLl9ddfnz179ttvv/2fQx7UFs/joCaZlBIV2xzOIWCwUJhE0DFWOkorsEUflngFBNj+86n5pap5Y7vVXkwN0ozAy0w6LtDgsmqJIrYG2+0RJsADFI0V5GeQhUSDeg0RiEkwTIxVxlWXXVTWJKgEFjgqQB/TcIMIpFnGUmQ5vsPg4b6BEgH+IJOtNihAtXR1Zs31h+7Jsiz35HMPc2Zmpq2t7aBBgywtLXNyctLT07mBp4+Pj5WV1ZdfftmrVy9bW1sXF5d169Z17969TgCRJMnk5ORRo0Y5OjoqFIrLly837EcLDAyMj4/nMs5SjNSbmWHqXlRUVJcuXdavX29jY+Ph4VFRUREVFTXSSEREhEwm69ChQ25u7vXrhgvPzs7mfIUIgsjl8moj3IlSU1PrdOz27duOjo5RUVGWlpacDcj1hCCIehPievXqdf369aqqKgRBcnJy7t6927179wddJk3T5ubmU6ZM+fbbb6dPn3748OE69iBvu7UIqaWqOpOuHgdgnM+QAV1rJOOD0GMW+kyjbtY3Fx1F8wuq1u2+sXZuKI6hhomstZqBJCmJcNLd8NTHprbE+BTgxtrKjdkTQbQ4u4e9STwspw8lQP7uUrKc9P/IC5dh+kIy5YsMsbPIsreCbarfzZjzAXrYBwxy72olMWNY5j/3qeH+ACxfneQm7Wohcnxg+yy7adOm8+fPs0Z69OgxZsyYL7/8cs6cOba2tnFxcQzDcLabVCr18fE5c+ZMz549EQQJCgrasmXLsmXL6pgwIpFo+PDh77zzzs2bNzMyMpKSkqysrDh50mg0pkeaJEluwDhz5sxDhw5NmTIlKCiIk8L7s3lJktRqudi4gbfffnv06NFz5sxZtmzZrFmzxo8f37t378LCwoqKihUrVvTp02fGjBnTpk3r0aMHwzA4jguFBi9E586dO3ToMH78+LCwsLS0tIqKCm4IzGXzQgjDw8PXrl378ssve3p6RkdHYxjGhSDCw8N///33sWPHdunSZeHChRRFcfbgzJkzjx49Onny5P79+x84cCAyMjI0NJSLDptiFwzDaLVagUBw7NixDRs2DBo0iKKoffv2vfbaa7XtO74WfYug0tPHU0oMs+Wbu2UWwaRA3Zs6b6+5xRqSyf5zBkM6GIIs+ua8QiJYvnDQtbjsUe8fiPt+sqOdjKX/eQAAgZI5TPmnJ5nyKvCI6yM1BIRAILCcN5uwsGhM5RocotGKivn63yA0eNAa2BMVoikrMwk55r3QjdGxCEQSP0i1CFI4jLZtQlTBkC3HMuYi8wGuPXo6ehlXnHvkRhhIu0g69bCJqncYBSG8cOFCUVERTdPcDjY2NuHh4devXz9+/DhBEJGRkVVVVR4eHs7GRJlUIyEhITKZrKys7MKFC/3797e1ta3TbEVFxf79+7Ozs7t27dqxY8eioqIBAwbo9fqzZ88GBwdzaRMJCQlarZYTylxjXoVKpRo8eLBWq/Xy8nJxcandYGJiYllZWUhICNdJkiTPnz/v5ubm6+ublZV16tSpnJwcKyurwMDA3r17c7GCmJiY3Nzcbt26LVu2zN3d/YsvvuAsrH379tXU1AwbNkyn09na2np7e2cZGTBgAADg+vXrJ06cAABERkYqlUpvb2/uwuPj45OTk+Vy+eDBg5OSkkQiUUBAAIIgxcXFBw8ezM3NDQgIGDZsmEwmQxDk8uXLNjY2XL5xaWnpnTt3QkJCKioqjh8/npmZieN4cHBwaGho7ZgGr24two18ZWJRzWN63B4Eaygww/aCVz1qLiMsXXs+A0pgV+/kP/fuwTmju9haiO/lVP50LPGN8d2mRXTwcbMwOaqAkKg+klf9wwVANLO6Wb0xD5fJHjrsNdwXQrREcOgEdVuIPGQwixJo/p6i8stKj1kuQjuBKlWT+WOu12wX80AFSz3afDXWoKSol6XrMK9ge5mEgQ2sgt4QEGFxIAiyHWctbp7c16eCs2fPCoVCGxubs2fPfvHFF3/++SeXc9eW4UemzYyKpPOqtI2cFdAEUIRlEBCLBqvk8gDVKZTR/BtIZaGFTDQl3C+nuCavVFVYrqZoNiGjQlmjBwCFyD8uc0hSsgg38pavLib58Qv01abuwrwPAEOwBLT4JszDGxECZmnWNtyKLKOytuXhUoxWMfYjbGQdpSZrtJHQLCPCRAPde/Vy8hLjWCMCCA8EICjJ6rJVN63FLs23rnJbJzU1dc+ePRBCgiBWrVrV9qWNt92an6Timvg8ZXN53B4ERAAEmDvMCtScEJGlbC3H/D/pdQLs8vXc0e8fjP1+koejgv2vYwnggMyhyz89xZZXN0/8FEIgFNq8+QYqFj/UdsNQ/EfZ7W80x0SNW4YXoACykK6maR1LyDBMgj1SSp5hNMqwnhaugz0CPS2tWcg0YTR6f5sYwPraT7YQPtD71v7Q6XQ0TYtEooZjGm0HPmbanFAMTC9Tt9CYtDYAgSikMxG3i2ajVWI3YyD1nycWGudiIgy0lItG9vM0ExH3CwGkWYGHWPp8T8hN3WyePoHG2G4oRFQCdj8ZL2h0YRtDbAQguAIX2wsxM8ywfkqju0xDBgN4f9fAyZ3CPCwtaZZ+fGnjknsplsquuYM8S4hEIqlU+rRIG69uzUxWhaZaTz2xsQqGMMWIzTnx6CJJV/T/D71B2yDC0oyvi8UPbw+2MRfX9zwb46dhDqIgL0g1z9o4QCxqzHgcBfgpIrOQrXy0pdyMxppB5h5Bmgw5Hw4Su8kBkcN8upsJsHqr1TQZFEFKtZkqypCbytM24dWt2SAZNrtS3ZwPUCPAEKaKNbsijMyU9EUNRiP7nzySBqxIiKAYrZjaHbO3auT804aAEIjED52WASCiE4ATbCLN0i26UKVhiihEAx06T+sc4W9j1yyj0ToAgKlpZbEmvXmb5WlGeHVrNkpq9KVqsmmzSh8Hw8JwLHaVGHBHGgkxce0CNA0/0ZBmCVdCNrZbM8xoMqjbw203DOA3sILrTHbDGbyPCc0yFiLzMf6DxvgHmYuFjxNAaBgUAbmqu0ybqQXBUwde3ZqNvCotY0xCe/IYF4aDt9Cu8bLnSIHlQ+czmIB6ShLuIurr//jjUyASNVy6HiAIi8JzwmwNo0Fb5oNnXOeDDbDxfaFzRA9HV0Ne7SOtvP6IAIDWUGWl2uyWOwXP48CrW/OgpZj8at2TN9z+U4AGMinQ+7J0fLXQBTXkfzRyXTa9fGIAZmuBPGKORd12REJjPvEDT4pCpERMH9bGt9AK4zTLSAnpcJ+QiQEhdlKZcdXJFoeBdK76botqKE+T4dWteSio1ukfcR23lgBD6ALW+qLZ6DJxB1OcoWEM8VM3kWxiL0NicFOdUxBCVCBoeGQKUOIAcleF6Ju9YikLWZplvcxdp3SK7OfqiwKWBVAoJogWWg2lFihAK/UFKqq8pU/E0wR4dWsGWAjzlNpm91s3DWMBGvlZYVSOrA9qTBV72BHG+OkAO1Gw9yPVl6nbCiFoILUVhaBCQF0A6Wxze8EYyAhx0WD33lO7DHIzVzAsA1BUq9JdPHQ78VoW1oyzzeoDIKiWVlboc1v0LDxNg1e3ZqBaR1VoWiGe8CBQhCEhFo2FJsvCISoA/5+l8EAggqC0YmpXzNEaNm18CiFCEA3YZCjArxOFCXROM8YTIDTkfDhK7Sd1jBjk2UmAAxoalhfAcfTEX3GfvvLT3h/OEcKWM98girIC3HBpmRW5beKbjee/8OrWDBTV6NUk02bEzQBqKK4CrqM9rslGUrj5wwvd0yzhRMjGd2vy1CLD8kcPuAUAQWiMOYgmMAzTXIkgLGQNswWcuk/vMsTX2pb9/6RRHMeSbmRfP5fSqbdnC6VVAwAxlBURhLJGcSPNYef5Dm/+SmSUqFriXDyPw1OTdtxmYRGYq9Q2HC5sFYwFaJhU1EctkQbrjot1BbUnbN0PJClJmLP+dgft+btNWB8JJfAHqRsGQaqZ9qr+XrMYbtzSbLZm1oPde3a2c0EAa8r5QDFUq9b/teFU+PM970SnV5U3o+JAFIU4itIMoChpaoH5tTRhbpk4p8wwqR4AePZeiZettPlOx9MM8Or2uKj0TIWWanviZsCwRhJk8hDHs+IxwdhZS3WCUeAe2FcA9LIJHciUArZE+cjzTx9QudIALtjJXtZAsoEVxhsJC1kU4N1sfYd49bQ0EzHsf9b5wDD08PZogZAYPL7X9fP3kOYAAIgCKMCIsmqznBJJSp55bDqq0qF6CqKAxY0XpKOYi6mlM/q4Ey3s5uN5JHh1e1xKa3StlebWSHCEroDyC8JhgYiZi/a6cSFq8MD4qatIPqlX5benG1//1HgkBMYlsO93P2EQzSNqroE89IGnfbRyfOGewd3sXU3l+P49EYam382LOXFn/hcTxBKBYS4oCnCiaXpqUDQcAwyDUrRZepHF1VRhbplZVomxQD2GAGDwuJnAUTSlWJVZpva1MyxGxtNG4NXtcSlVkSwLW3pRkMcEQ1g1K4gWhNdgFh00FwH9oEL3hvipWYiNNt5HdyERCB9tJfEHbMeiBfmpurxGrgjy4FUn2Y7WPoM9ujnKzRnDzKq60Q9CiB346ZK6Whdz/G70sTsZd/Mpkt616eyQiUEYgTZyPgZnqREYoVSZZZeI0wosou9hNVqDpQaMllq9YomhILdCk1ai4tWtTcGr22Ohp1mlvo0OS+uAGte6vIH10kukXTRnMErJ1ptVCxEEYxRTutIZpXRhOeCGXk1VN4AAHcb8zd4gHmNMSrOMGWHWz61rX5cOQhzQbP1pKzTFdg/1k8jFlWU1GI5RJE1TjLq6nsX76+knYAkMMCxKUeLsUsvoe4K8MklGCUIz/1hqDa+DBwDCsPB2ftXwzg5NvEieFoBXt8eiWkdV61p2QngzYliZHDIJoINKpghUHTOjCusvdE+zhCMuG9+98htDSeBGgaL16iAGQYy47B5Z0LQMXuOyINBN4TTUK9jN3AIibO0KynV7TTEhI7qERHUFCCI0E3z26s8alW7GkmHqGt2DDDcAIDD41PAajTSlWJxZaHk5BavSoHrDOsYGXWt8cAVHQWxmOdPmrfhnCl7dHguljiJp9in6QBsL0DDZrKNWOqaX9oSFLp01ZAXdVyaOpM0GOupvB2jO3nl4/BRCQBCGjJD/5jMbnHACwUH2th5Swkf/pNGQJVC8n3O3/q4dGleOzzCt1HhWhNLTnXp7knqaqi8/mbPUWBYlaVFRueXlZGFemVlGCdDTLMFZao9uaKIouFeiKlfrbWWPXMuZp4Xg1a3pQAQpriGfimFpHTCEKWUtzopG9cHOOmhuGwyk+y4DIHrp8x3I5AKmuPLh8VMBYfipcxaAJWKlcTALh49suhnTdO3CPXr52dgblx9vdI6xUWApko6YGGRYlkpP32epYRqt/F6eMLfY8mIyXqHCjJYaxFH4OJm/AAFqPX09Rzk0wFDSmKctwKtb02FZtkytb4OZbo0BRRgtFF4iwnvILDxrLgBDURmsbvzUSSCbGlS5/uRD4qcQApwA+H2lmgG4LMwv0pSLgaEoeiNhIIsihqXZBnl0tRSLmr5+EddfQ8dZHAMQohQlKFNaXUwyWGppRaiOMnjTANIUS62eswGDEzY+u5JXt7YDr25NR0Uy+sdbV6N1MRa6x2LR4Gq5vJPqFM6o/itwxvhpXyvtNT/d2bsNx0//GZn+p3FQJWD2knHCR1kRhGYZK7FlmHtgN3s3AAxZu024rn+6hBgtNRzV6WXJ+cK8UquLSXhZDaqnADRkdbCPEhBuFCwLEwuqKYbls97aCLy6NZ1qHQ1hm850a9x8BjYJdFRJpUHaY0J92X/mM0CAAEYxuQudVkoXlD4wfgohgmOGn1q2GwrRC4KsErIKNG62H1dBuaO1T4RnD3uZcf2iJk3dBIY8NUO+GkkRldVWl5KEOWWS9CJUrYcEDgECcaylpoRiKCis1hZV6VwszVroFDyPBK9uTadaRxm82E+1vP0/kJqFuGnNxvXGTik0af+Zz0CzhD0um9it8uuG4qeGkSn272cJQEQvwo7CuyRLChuR5sal6Q5wDezl7CW4L023UVdhiFuzBA4oUnqvUFBQankxWVCkNFhqLGSJFrDU7gcFoExFlqlIXt3aCLy6NZ1qnaHAEva0y5sRHKFLoNUF0XNB4Iyd5nbtQKohfhrioL/VSXP6NqjPR2WY+4ChoFapJAzg8WjBdTr7oQtVstBQDd7Twm2IZ09XhQWLMPQj2WwAEqghQ4+kseoaq0vJouwSs/RirEYLCcwwMm05S+1+UBSUq/Tlat0TOyNPw/Dq1kRoFmqaqZpUGwFDmGpWfFE4tCtq4aO5Apl/C90DqJdN8CeT85mCcsMI9D4MhhuGmWrjsoA9KchUazQNG24MZESYuI9zl/6uHcUE2niTzfiFYszqoCVpBYLCMstLKaL8cqCnAcM+IUutnl4hCM3A3MpG5Q/zPAF4dWsiOprV0a2/GG/zgiIsyaLX8L46qSRAfR7QKmg0viANCQdCPiWo4uuThuUw708fwVDTXAUUIqVm7En9rQYMN8PqJZB1lNkP8ezla2XPInTjcj4MthgKMD2JqjU2V1LMMorEGcVEpYYlDNshhsLWdeijKMgu17RmD3hqwatbE9FRtJZsttXK2licAbkFuqtlFt3Ux0XkP3EGSJLiYEuzUD/NqbugTmKYYfFLFPm/rqAocQC9qWTU2APiCYwhTZfoad9xsHsXmUjwoJlVtbpkHIFiEDKSzCJhYbnFlRRRVilKUoBmWRxjRK1hqdULCpCMUhXTXvwVTzu8ujURHc3qafYJlJ1vnQI0CJ0G3TXS0T01J+T6bBbBuPipbFIXKrWUyiv5b/wUAtRou0GIQqAUMhdhGsuy+H0T9bnJ8FZiiyGevTvaOqO1lmZryFKjUK3G4uo9s9RCcUaxoELFGrcbFlwTtLHUCxSArHINzbBYo+fn8rQcvLo1EdI4lGpjD1dzgiF0IWt7Tjw2GD1pq0syTHKiWcIWl07qrlx7su7eKGr4YRgUxWPxrFv1xRO4nI/udgGDPLpaS8wYlmHhAy01HIMAmmWXCAvKzGNTzVKLUD0NaAbiGNMqPrVGAoChrG21hrKR8+rW+vDq1kT0DNsOzbb/giJMDRRfEA7rhZu7qaIhZA3x0752+ltdNCdu1o6fGmw3w6QNQAHmKJYCKRb8JzEYUixjLjQf4Na9l6M3itZrsv1jqZEU0OnMr6VJkvLE2SXCkur/W2qG1FykjQMQwLKwTE3ayPnZpq1Pm/+8tFXIp3mWQuNBEVYP8StYqFou96s5h7I6BOpl43zJxDwmv8wUPzUsAgwACpEMiS5Gn0LUMmo5k83X0nO4d297mdS4NFtdS80QDUDEuWWi/DJFfJokqQDoKZRiII62aUutXlgEVuv46vRtAl7dmkj7C5g+CPSfOEO3Gpm8h+Y4QVYSdmL5tKDKr04ikDHm0QJuGhbABXvYGDWiN60wTrOMCBMNdO/Zy8lbjGO1TDYuvomSNErqFDcypHezxTllwkIli2EQA3UXv32KYFlDImRr94LHwNP5CWptIIKQTIvYbiiG4TjBeegZhqZp2jS9CcNxHDeIiHEz9cQDqTAV8VZJpL2xk1JdtjjIQjewg+b4rX/ip2ZmKAS5RE0MyAIGW80YQGBYDwuXcI+enpbWLGS4pdmMBaUgDsR55cK8UvntTNmtHGDQOBpiT6Gldj8shNVa3nZre+qmUqnS09O9vb0lEskTOPetW7euXLkyc+ZMoVBo2kjTdEZGhlKpZFlWoVB4enrWfrd5MRTEpGkcxx91nQ8IYUvMnwcomp5wK+bkwdK8XIFQGDgwstegYcbRG8Rw/E7MxQsHd7Es02/o6O6h4SzTzGWPH9I3Ls4A7S6IR/YGp6zIFPnzHcl7xXROMYKiqEgEABZHFKbrC4QApyEjQAV9XDuFunWWCnGapTAUCjCUYlC9XnY3W34zU2RQt/L/Z6g9tZZaXYBR3XjbrW3wn6Df5s2be/TosXnz5idz7qSkpN9++40kydoby8vLp0+fPnPmzA8++GDy5Mn9+/e/evVqC3UgIyNj6tSpZWVlj3ogNKw53szJbpzCnt//V2l+rnfn7jJLq20r3z3251acIHBCcO3ciU0fvGHj4Ozk4bv503cuH/0bFzzCskLNBYYwFaz8gmhElqg3YQvkk7ohqGEQiopEepzZC29giGGWqL3EdlLAkOE+3aVCFABahAvLq8yvpTj9ccbvvd+cfj6juJoqKFKyQsIw4904RbT9wEKkSvOfjzRPa/HvNyZJkjt37uzXr9/x48dfeeUVqdRQnJFlWZqmBQJBUVERy7KOjo7czoYRk/GBLCgoEIvF1tbWpkZQFMWNUw5ZliVJUiQyBI9omq6urlYqlRZGuJ1RFCX+u2wOZxaRJDlv3rypU6eWlJS89tprn3zyyYEDB7g2SZIsKioSCoV2dnamngAAGIYpKiqSSqWWlpa1m8rPzwcAODo6ctrBXQ5BEKWlpSiKlpSUxMXFlZaWCgQCMzMzgiD0en1RUREAwMrKqgEDFkKEYpp5AqPBucWyY2cttLCxwzAcw3EMw6OP7x88dqpIIjm1a3vPgUOmvrkMAFSv157Z80fQoOE4QZgmPz0xMITRsMRVYqAWSDv0vaaPCFAfu00IxbdFlYnqHBRi3R38B3t2sZNKdBTU62WGEnmpwsJKUXYpVxK0HVlq9wGM6yDxtlsb4d9P2blz57Ra7aZNmyZPnhwbGzto0CAEQWJiYt57770+ffpER0cXFRWFhYWtW7dOKBT++eefu3btcnBwSEhIKCkpmT179qJFiyCEr7322sCBA2fMmIEgyNWrVz/44IODBw+KxeLPP//8xIkTAoGgoqJi8uTJb7zxBqd69QIAUCgUMiODBw/etWuXWq1WKBQXL178+OOP9Ub69Onz2WefyWSyn3/++eDBgzKZLD8/v6ys7LXXXps3bx6CIJmZmUuWLMnIyAAAeHl5rV692s3NLSUl5Y033vD29r5586a3tzdJksXFxfPnz5dIJO+8845CoZg/fz5FURiGEQSxY8cOKyurB3XSoCrNbnIAYG5tyzAGh5sQNUMBwAkBLhCUFeaXFxUMGPk8TVEIhJ169bt68lBJXrazjz9DUa1W6B4L0ggsAyYiVGIeFJntoGLMhOIoz+CeTt7lVWZXk8UpeeZX04CeNpb+RFtn7ueTByJQXd9y5zytqW5//vlnYGBg9+7de/fuvXfvXk7ddDpdbGzswIEDt2/fnpWVNXPmzAsXLkRERNTU1Bw+fPjXX3/9+OOPT5w48eGHH06ePNne3r6wsLC6upprUKvV5uTksMb5g1FRUTNnzjQ3N09ISHjxxReDg4MHDBjQQLc4Q6+4uPjYsWMBAQFSqTQnJ2fhwoUzZ86cMmWKUqmcOXPm5s2b33zzTZVKdeDAgd9++y0yMvLMmTNLliwJDg7u2bPnu+++q9Ppdu3ahSDI/Pnz33///d9++41l2bNnz/r5+f38888ymSwhISE2Nvazzz5zcHCws7N79dVX3d3dv/76awhhenq6mVlD69jARpaQe0Q4b5pAJEq7c+PK8QOjX1lgJpHlpafotBpza1tDxhmEFjZ2OrVaXVOFAvSJ+t7qrA2JMEmMt9ZD3nkmklZWQltLpto8r69x//4oVlgpziwxLtHRri21BwDQZySa/rT43TIzM+Pi4l555RUEQV588cVjx46Vl5dzwyUrK6tFixa5urqGhoZ27NgxLi6OG+L16tVrypQpDg4Ow4cPt7W1TUpK4gabJg89AAAz1icHAPj7+9+8eXPr1q3R0dFcPOFBHTJU/IVwxYoV4eHhffr0KSsr+/LLLzEMu3LlSnFxcceOHRMSEgoLC319fY8cOcL1sGfPnlOnTrW2tn7++ec7d+584MABjUZz/vz5RYsWeRpZtGjR6dOnq6urIYROTk6zZs3y9fV1MCIQCNzd3d3c3EQikbm5eUpKSmxsbE1NTWBgoFgsRloDghDkpd/7/sOFvQYNDRszmabvd+JwZY8N0QakVcEQJoe0vRI87ZRzr+LCqE37O204Kr2SIsouZQU4JNqdT62R4O1xft7TyD/fqhcvXkxKStq5c+e+ffsqKytLSkqOHTs2depUCKFcLjd5xzAMY4zGBYTQ2tqaZVkURSGEOI5znjjDWrW11I37V6/XT5s2Ta1Wh4aGCozo9foHdYhrYd68eaNHj05OTv7ggw9Onjw5bdq0kpISjUazfft2bje1Wt2vXz9OZ11cXEyHW1lZFRcXV1dXCwQCk4PP0tKSIIiqqioIobm5OedSNKRWMAwXNuVevv/++6tXr3733Xdpmg4JCVm5cqVpzycGIRAWZqdvfH++d5fAyQveM/pxWKncXGwmqSwtBgAFCKwoKRaZSSQKBfvEnW51wFBA0fQfd6rP3nOGLIOjLAIeoUpeuwTw6tZm+Mf9v3379vDwcIFAwLKspaVljx49du7cOXnyZE686nVd17uRIAid7p/V+6qqqjQaDUEQcXFx9+7dO3LkiKurK4Igu3bteqgv3N3d3d9Idnb2ypUrn3vuOWdnZ0tLy/Xr10ulUgghZxVy6pmWZpizjaIoy7LFxcV9+/ZVKBQMw5SUlHD7cCERS0vLysrKOj2v3ZS9vf3atWv1ev3t27enTJnSo0ePl1566UE9bFqBzoZBMawgK+27D9/0Cuj+ygdfYDhOUxRNkVYOzlYOTnevXgx9bgKKondizlvZOtg5ubL/1+VWAUNBjZbafz0/PqsCR9HaK5Y/0wAEw3h1azPqdv369du3bx89ejQwMJDbeuvWraFDhyYkJGAYVtvOIkmSs3RomjZlchiSv/R6zqbr1avXH3/8MXr0aK1W++2332q1hpX8LC0tlUrlrVu3ZDLZH3/8ERcXN378eM50qpMOYmrNdNKXXnpp48aNW7ZsefHFFy0sLD744IMlS5ZIpdI7d+7o9frw8HAMw5KSkrZs2TJ+/Pi///47MTFxzZo1YrF46NChq1at8vLyYln2iy++GDFihEQiYRhGr9eb1M3CwkIkEu3evXvAgAEuLi7nzp1zdXX19vYWi8UikaiBkSkwThs3jAub72MMAGAZZseGL5KvX7W2d/zhk7cpvd7W2SVy0ktyS+vIiS/9+MlbP6/6gBAILx/ZN33xxwKRGU21WuYBgaFFSu3+63lJBdV8kZT7bDf+hrQZdbt79+7EiRMDAgJMWwMCAiIiIrKystzd3fv372+ybnr06OHl5YUgiJubW2BgIDf2FAgEffr04cKLL7/8cmpq6uTJk+3s7CIiIlxdXVmW7dChw4IFC1auXCkQCDp16vTmm29yRpyDg0NQUJCpcQ6hUNi3b19T6olcLv/444+PHz9uYWGxffv2FStWTJo0CQAgkUg4LyHDMKGhofHx8b/99huCIKtXr+7UqROCIJ999tny5cunT5+OIEjPnj2XLVuGIIhMJuvXr58pXODi4rJ06dI///zzyJEj7733Xlpa2vr16zkzcKyRBm5cSxT6Y1m2e+hgZy9fiEDIsizDSM0tAcBokurWP+yN1T9cOrJXq1bN/WxDQFC/VpQ2HAOZJaqdV3MKq3U4L23/hR+Zth0MLny9Xn9/6hlN0wzDEARBUZRptgBFUQAAzsvGsqzAmFAKIaQoCsdx9P9fWTk5OZaWllKpVK/Xm44tKSmhKMrJyYnzduE4bkh9MJ6itlJw+W64IdvrX9XTaDQikYhrv6CggKIoW1tbzrb68ssvr169unPnzry8PLlcrlAoal9FQUEBgiAmrTTlu9XRJo1GIxQKMQyrqKioqqpSKBS18+buh4XweHJJpZZqdonDCYHBG2AMFxgXnGAZmuKMTUMGnCHpDzA0xbTSmBQAw4A0Mbdqz7XcSg2F8Y/xfdAsfDvCb2G4T2t3hMdou9U71ckwqRGv+65JAbm3OAAAnMyZ4EyzOsfa2tpyv5hkCzNS57wAgPv7Uzs5wyRVHBRFaTQaAEDt2MKDdkZRtE5X67RvaQRpBEIChVrDio5Is9KARcbQdGuJWu1wdkxq2f74fD3D8tJ2P4ZVihFEIuB9kG2Cpz6+NXbs2NDQ0Cd8UhQAkSGV6xkCBYaCLGcSis4kldIsL20PABpKK/CLu7URnnp18zPy5M8rMqzz3wLTFdokGArUevrwjfzYjArDOm58tuqDwVFgJ2uFKcA87VDdWotnx3bDUVCloXbG5iQVGGZH8MrWMLzt1nbg1e0xbDek/YNjIL9Cu+tqTlaZmnhmBL3JQAQSGGojbak1u3geCV7dmojQMOkMaccYFnRDQVqhaldcTnG1jpe2xgAhYmkmENWqOMHTivDq1kQIDCVQlIawXUocAIYwQmx6+eHbBdVais/XbSQQQWzlQn6qQhuBV7cmIsBRAY5SpGF1OaR9YXStwfNJxcfuFFEMy2feNx6WhbZSg1nf2h3hMcCrWxMRE5iYQNXtbhFW1DAxnj16s+BiaingF/N5RFgE8bSRtG+XxVMEr25NRIijYry9JYXgKKjWUoduFMRmlhsmxrejS3tCQOhrJ2vtTvD8A69uTUchJkCVYZmA9gGOgmKldve1vLRiFe9oawIshNZSobNFQ4ue8jxJeHVrOgoR0W7MGwJDM4pr9lzLza/U4bxXvEkwLLSXi+wVfLJbW4FXt6ZjITaoG/OUh00NE+MBuJOr3BWbW6OjeGlrMgxE7BUiWxmf7NZW4NWt6UgEmAADWopbB/ypxDitCkanlh28WaCjGH726OMAEMTNyowf1LcdeHVrOhgKzMWEhtI9pcUDUAAohj2bUHw6qZiBkJe2xwEiiABDO9jLW7sjPP/Cf880HQCApZmgtWsbNBEMBXqK+fta7umkYsPy6+3FgdhqQITA0QDH/ywvyNO68LbbY2FjSN18+nQBR0GFmtwTm5tYUI1hoP0lJD95WAgdFaIODnw6SBuCV7fHQiHC5UK8Skc9RcFTHAOFldodMdk55Vo+htBc0Czs42Ul5GeYtiV4dXssJAJcISaUWuqp8LxxE+OT8qv+js8vqdbx/u/mgsvp7utp9TR8Cp4h+M/342Jj9nQMTg0T41EQn1G+IyanrEbPS1szwrDQxcLMjw8ptDF42+1xsZcLsULQ6oWTGwY1lkQ4lVB0OqGY5EsiNDc0A33spB7WktbuCM9/4L/AHxe5CJcJMbYNi5uxYjx7+Gb+sTuFNMtnfjQz0HCHkW7O5kJ+Cbw2Bv/3eFxQABzkojZru3EV4/+6mn0mqQS0SBXWZx5oWKh5gJ9Na/eDpy68ujUD9jIRgYE2qG8EhpYodX9EZ93IriSwpyiu+zTBQOhuZdaJz3Rre/B+t2bASiKwMhOUqPRtatICjoH04pqdV3OLa7R8xfiWg2bYEV0cxXwN07YH/6FvBgQYam+YO91WpA0AQ77u3Rzlr1eySmp0/OK6LQcLoaVEEOrDD0vbIvznvnlwt5AIMNAWxqbGivFIdGrZb1eyqzQUH0NoUSgGdnMxD3Dkc0HaIry6NQ8yEW4rFcLW9r1hALAMPHmncN/1fIqvGN/CQGgI2kR0sBPzUxTaJLy6NRtuluK2UDF+T1zOyYRihoV8EKGlYRFoJxNGdXFo7Y7w1A8fVWg2bCQihYhorTmnOIoqNeTOq9nJhTUoPy/+iUDR7JCO9jYyfjHeNgqvbs2GRIA5KkStMucUx0BeuXpXbE52uYafYvVkYFmoMCNGdXNs7Y7wPBD+SWhOfKylIgJ9kr43YFzO6F5B9a+XsnJ4aXuCUCwb4m3T3dWitTvC80D4h6E5kQlxd0uzJzZvgasYfzWt7Lfo7BKVjk9qe2JAiJgJ8Bf7uvOzr9oy/N+mmfG0lIgJ7AkETznv3tnEor/j89V6mk9qe5JQDNvH06qPp1Vrd4SnIfhHopmxNBM4K0QtPakeRQFJM/uv5R2+ZZgY/9SHR4Gh7L3xB9S/vc1kSnOGm5jAXuzrzifctHF4dWt+fKylBNaC3jccRas11O7Y3Iv3Sg3R0af9EYMQklqmupSpLoUMjaD/zx1DMYRlmZoypqbc8NKgcW0CkmZ7e1j287Ju7Y7wPAQ+Ztr8WJoJXC3E6WXqlvhu59YN3xOXm16iageONoDhmpToynM/AYyADIWKpBYDpovcukIEocvzKs5uo5VFAEEEjn4WA6ajEguEZVq/9hWOvhDsxk8sbfsYFjVs7T60Q0pU+vPpZRQDm9ewIjA0vbhmT1xugbK9VIwHKFWZz1QV43I7BIFVMXv0eQkOM78FGFG6byWkdJYRr0OWLj/6rdDB1yL8FcQw5m/NTyzJsH09rX5/pbcQ59WtrfPUf/m3TWylQi8rSTN+cwAAMBTcyan8+WJmYVV7kTaDLcQSls5iryDC1l3o1EHSMZRRVUCGgpRWm3ld1mOEwNZT6OAn6zFcnXSeJbWt639jIJSLiIXhvry0PRXwI9OWwt9OllulVeuZxzffON9adGrZoZv5OqrdzR6FLKNR6XPvsnqt6tYJabdhqFAC9ep/3v3n9gFGVcHWVKBWzghstcEpzbCjuzoG86HSpwRe3VoKMwILsJPF5iibo2I8c+Zu8ZnkErZ9VowHrE5Vc+s4q61hVEpZr1EAoIhALHLvXn3tIGbugLC06uYxAFCW1IDWG5dypWHmDfLG2+GfoH3Cq1sL4m4hya7UFlbrmixJGAq0JL0/Pj8+q8KU49begCwut7EZ8x7C0DU3j1Wc+E5g50mY21sMfFF57ueyfStRoRRT2KJmCkAIYSuJGzQu5fZqiKezhVmrdICnCfDq1oLgGOjsIC9Xk0yTHHA4Cspr9LvjcpMLawwV45F2ijHVAwAUFZiZ+QTXXDtAlecSCjuBlYvN2PdYnQoIxOq7Z6iiVEPkoZWCYBTD9vO0nhDo0ipn52kafFShZbGVCj2szJhHz+7FMVBQqfnlUmZSYQ3efqUNQpYqzWLVSkjrGW2NOukCS+sJa1cIWVpdwWprUEJMVeRXx+yVdA5HBaJWUTcIERGOzg3zMjcjnvzZeZoMb7u1OB3t5CUqvVJLN3J4ylWMT8yt2nc9v6SmfVeMBwCg6qSLmnsxqEhqcKuhqOWgV3C5DQBAl3G9KmYXKpSwerXYJ0jec2RrZS/RLDujr8dAP9tWOTtPk+Hz3Z4EBVXaCxnlbCPmExkmxiPgWmbZwZuFKh3dHmMIdQCsXk1XFrDaGgQnCCtnTGplSNkFgNWpqfJcqFdjMhvC1h2BbKsYbnqa7eVu8dOMICup4Mmfnedx4NXtCXGroCqhqLrhaVNcxfjTCUVnEkueoYrxAAUoxmV+QJb5dzaCwbDDDdsha5ih1RqwLKIww39+KSiQX+noKYQfmT4hOtrJytRkA/FTDAV6ij12u+BCSilqzN1FnhEM4sXWtx1ChmqF/vx7fsPa4nMHevPS9pTSjn06bQsCQwOdzSUCvF5bGUNBlYb8KybrXHIpalg4vBV6yFMHkmGjOju82NejtTvC00R4dXtymIuJzo5yY0G+/0BgaJFS+8eV7Bs5SqL9hkefLijGUGH+naH+IoJ/Rp5W+JHpE8XLSlKpJlNKVaaBJ46CtKLqnbG5JTX6dh0efZqgWSgX4Z+MDHC3lrR2X3iaDq9uTxSAIF2dFNV6qqhGj6EAA+B2jnLPtdwaHc3P72kjsBBBAbIk0m9IR/vW7gvPY8EbC08aAYYGuVhaiAmagZfvlf4enV2jfxYyP54ODJEECF8L8XypH+9ue+rh1a0VkInwIFeLmNSyvfF5NMvyrra2g55mRnV1XBju29od4WkGeHVrHawlwqhODhIh3tIVGHgaD0mz/b2tPx3dSSLkPTbtAV7dWo2hnew/igrAUdCEWag8zY6OYv3sZV+M7WJhxs9JaCfw6taaTOrlsnSoPy9wrQ5Js142kq8ndvO2lbZ2X3iaDV7dWplX+3sujvQDwLA4Ymv35RlFRzNettL1k7p3czZv7b7wNCf8PNM2weaL6V8cSyHpZ2ZuaZuBpFlvW+nGKT06Oylauy88zQxvu7UJXu7v+cGIDvwQ9QmjoxlfO9mGSd15aWuX8LZbG+L3q9nLDyWqSYbP7H0CkLQhjLBpSo8ODvLW7gtPi8Dbbm2Iqb3dlo8KEBEYzfBfOS0INERImc5Oim8nd+elrR3D225tjqN3Cz8+kJir1Aj4aactgGFdJRYO8rddObaLk7m4tbvD04Lw6tYWuZ2nXLLn9q28KgHWPstgtRacW3N6sNviSH++SEK7h1e3NkqhUrv8cNL+m/k4BniFaxZolpUKiTfDfWaFerV2X3ieBLy6tV3UJP31yXtbLmXSDMQxXuAeCz3NOihEn4/pPDSAX/njWYFXt7bOzmu5nx1NKq3WC3DeDdcUWIhQDNPXy3rZiI7dXPh83WcIXt2eAuKyKr44lhydXm5YEo5PFnkUSJqVCPFpwa5zB/pY80WtnjF4dXs60JDMpnNpP13OrNRSfCy1MUCIkCwbYC9/d5j/4A52rd0dnlaAV7eniSvp5Z8dSbyeU4mjKG/ENQDFsDiKPt/TeeFgXycLPu3jGYVXt6cMpYbadC715+hslY4m+DkN98FChGQYH1vpwsF+43o4tXZ3eFoTXt2eSs4kl3x7Ni02qwJCyNea+XcoyrAyET6mm9PrA7w8+IIvzzy8uj2tkDT717Xc7dFZdwqqBShAn20zjmYgCkA/b8v5g3z6elm3dnd42gS8uj3dFFRpf4/J+T02u7hKh2PPojOOMs4/8LeTvT7Aa3hnBym/aDjP/+HVrT2QVqL6/nz64TuFxojqMzG3ASIIyxpmjHraSCb3cp3S27WBFcNZlq2srBSJRBJJ3eGqSqXS6/WWlpag0TetqqqqqKjIy8sLxw1Kmp+fn5ub6+Dg4ObmVns3kiQzMjJ8fHwwDHtomyzLJiUlOTs7KxSNXYupuLiYoihnZ+dG7v8Mwqtb+yE2s+LPuJyTiUUVagoAQ4l7pP3613AUeFhLpgS5RgbYN+BiYxhm27ZtBw4cqK6uJgjC19d3wYIF/v7+hq+EtLSNGzfeunWLYRiZTDZkyJA5c+ZQFDV9+nSSJFEUJQhi1KhRkyZNqiNPJ0+eXLdu3W+//WZhYXH27NkPPvhAKBROmTLllVdeqb3bzp07z5w5s3Hjxsaom1arHTZs2Icffjho0KBG3ocrV66sW7du27ZtUim/Wnr98GZ8+yHIwzLIwzK1pOaPqzknk4rTSlQEhqLtyJCDEKFYlkDR3u6W4wOdn+vqoBA3lKCr1WoXL1584sSJOXPmhIaGKpXKP//88/Dhw/7+/nfv3p0wYYK/v/9bb73l5OR0/fr1ffv2DRs2zN7e/sCBA2+++WZgYOCdO3fmz5+vUqlee+212s1SFFVeXs6yLIIg27Zt69Gjx7p16+4/9fr165cuXdoYaTNUuRUIPvroo4CAgMbfjaCgIJ1O9/vvv9fpHo8JXt3aGz62so+eC5jex/1YQuGOuNyMUjXFsMTT7JKDRucaAhGxAAv2tH4h2D3Ex1ohfvgKH9HR0du3bz9x4kRwcDC3ZdCgQZWVlQiCfP75505OTjt27BAKhQiCdOvWbeLEiSiKkiQplUojIyMHDhw4fvz4oqKiXbt2vfrqqwCAbdu2nTlzxs/Pz8HBQSgUQgh37twZHR3t4uKycuXKyZMne3n9Ozn/8uXLNE337duXU8Nt27YFBAScPn06OTn5ueeemzhx4q+//nrq1Clvb+833njDwsKCZdm0tDRXV1dbW9vi4uLvvvsuPT1dJBKFhIS88MILAAClUrl9+/a4uDihUDh8+PCxY8fiOB4ZGXno0KGZM2cSBL/eST3w6tY+8bCWzB7gPa2326HbhaeSim/kKguUWgxFcbTx/qVWBhrXYqMYiKMgwEHey91yZFfHnu6WjU/yO3bsWKdOnUzSxmFhYZGdnX3jxo3Fixdz0sbBueT0er3BX/P/e0SSJI7jKIp++umnf/zxx5w5c2pqatavXy+VSlEUNTc3F4vFZmZmtra2dfTl4MGD3t7e1taG6C1N0+vWrTMzM5s4cWKnTp3ef//9ffv2OTs79+3bd+vWrVVVVV9//TVN02vXrnVxcXFzc1uwYAFFUWPHjq2pqSksLGQYRqfTTZw4kaKoiRMnajSazMxMmqZxHA8PD//mm2/u3bv3SEbfswOvbu0ZmYiYHOQ6qZdrQkFVbFbFoduFd/Or1CTNQoRoq8EHaFyFjWZYAY6ZiwUD/WwiO9r1cLN0UIgerR0IMzMzORdbHcrKylQqla9vPQXnAQAMw+zatSsxMTE5OfnAgQMbNmwoLy/ftWvXihUrxo0bxx1+7tw5BEGGDBni6+sbGBg4a9asOu1kZmZ26NDB1KZOp5s1a9aiRYsQBLl3715KSspff/0FAHBycvrggw9IkgQA4DiOYRhJkqmpqW+//faUKVNMre3bty83N/fMmTP29v8scMK5y52cnDQaTX5+Pq9u9cKrW/sHAKSTk6KTk+KFYLd7xTWH7hTGZJTfK1aVqfQYMEzLN8ic4b9Ww/CkQoSBkFvrydXSzMdWOriDbUQHO3uFuGkdAwCIxWKVSnX/WwRBYBhW71tc+DIxMVGpVJqZmf3222/Dhg27evVqZWXlgAEDuB1CQkKio6NNO9M0fX8jNE2LRP/IMYRQIpGYxM7W1lYikXDmoVwuJ0mSpmkUNYSAGIYxMzObOnXqRx99tHXr1rCwsOeff97X1/fKlSsBAQEmaTNZl6gRiqKadIfaP7y6PUMQGBrgqAhwVNTo6JSi6pTimpjMimtZFSU1epJmKcZQb/AfsWt5oFHOGBZCCAU4ZkagnjaSft7WPVwtvG2lXjbSx+9G7969V65cqdPpTELD4enpaWdnd+HChaFDh97XK0gQxPLly/v372/aiGGG6IxOp+Ne6vX6h2YaCIXC2uoJwL/JCbWPhRDe7yl46623Bg8efPfu3b/++mvXrl2XLl0Si8UkSd5/FsaIWMxPpK0fXt2eRWQivKe7ZU93yylBblqKSSqsismouJ5TmV2hKazSVahJCCFqlDnUZNX9+09T7LL//26QMxYaUtUkQtxRLrKVCT2tpb08LPp4WjmZmzXvGnbDhg1bv379hx9++N5775mbG1Z2u3XrVkVFRVhY2JQpU7788svw8HAuA0Ov1x8/frxnz55SqRRCaBIyDi8vLwcHh927dy9cuJBl2X379pl2MGhzfUrXtWvX27dvsyzLGWV1FK3OS9MvAACKoqqrq7sZCQoKGjx4cHZ29nPPPTdz5szY2NigoCDDsqZqtVgsRlE0OTnZ0tLS09OzGW9ae4JXt2caABAzARboZhnoZmmY+aDUFlRpi6r0qcU1aaWq9FJVvlKro1ijJHHCZLS2jDIHalkddZ5v7vFFAcAAQFHEYBIafgEWZgIfW6mPndTXVuZkIbaXi+zkosZEP5uGp6fnjz/+uHDhwpiYGA8PD71en5CQMG/evLCwsNmzZxcUFMyePbtjx47m5uYFBQXV1dV79+4FABAEUceesrCweOONN95///2kpCS1Wp2TkyOXy7l9OGfZ/aceOXLkvn378vPzXVxcuN1MbWJGuN85dxv3O26kurp6/vz5KIra2dndvn07KCjI29vb398/Kirq5Zdf7t+/v0ajsbOz+/zzz1EUPXHiRMeOHV1dXVvoBj7t8Nm8PA9OLmNYLcXkVmgKqnSVGn2lmqpQkxUaslpLaUhGQ9I0C8H/A4z/PLsAwQAQCzCpkDA3I6ylQisJYSURWkoEDuYGORPiTzo3Ra1Wnz17NjU1VSaThYSE+Pj4cPYU5/s/efKkRqPx8vIKCQkxNzenafry5cudO3e2tDTIfW3u3Llz9uxZLy+v7t27FxYWdunShSCI27dvy2QyDw+POjszDDN+/Pjhw4e/+uqrLMvGxsb6+PhYWVkhCJKamsqyrJ+fH4IglZWVycnJvXv3NiRjG/extLS8c+dOXFycSqXy8vIaNGiQmZkZ1+bVq1djYmLEYnFoaKi/v391dfXo0aPfeuutESNGPJEb+fTBqxtPU6BZqCFpxqBu//i4TeqGAmBmSCNuiwHZJ8nFixf37NmzevVqgaBF1gQ+d+7c/v37v/zyy0YmDD+D8OrGw9NS6PV6gUDQQhmGFEVx4Y6WaLx9wKsbDw9P+4QXfh4envYJr248PDztE17deHh42ie8uvHw8LRPeHXj4eFpn/DqxsPD0z7h1Y2Hh6d9wqsbDw9P+4RXNx4envYJr248PDztE17deHh42ie8uvHw8LRPeHXj4eFpn/DqxsPD0z7h1Y2Hh6d9wqsbDw9P+4RXN54nAUmSVVVVXKV3Hp4nA18Tq6U4cuTI9u3b9Xo9y7IAAF9f39GjR/ft2xd5xrh79+7WrVvj4uJIkhQIBP7+/i+++GLfvn0fumR2RUVFYmJip06duGJ9PDyPCm+7tRR37tz566+/cnJyaJrWaDR//fVXaGjo2rVrn52l3iGEK1euDAwMPHjwoKen5+DBgzt16nTjxo3IyMgTJ0489PDY2NghQ4bcvHnziXSWpx3C224tBYZhBEF88803nL127969CRMmrF69+rnnnvPx8TGUlaJphmEAAA+qmaTX61EUJQii3qLlEEKSJB90ODcGxDDMVC7zfkxtkqShPLNQKHxQN7ji6g9qRK/Xc7U467y1c+fOZcuWjRw5cu3ate7u7tzGqqqqXbt21TbcGIahafr+UzAMQ5IkwzD1Xn4DvaKNCIXCB5VredCxprNwdx5F0XrLTTEMw5ehejrgKmPzNDtr1qwhCOLMmTOmLStWrEAQ5OjRo6WlpR9++GFISIi7u3vHjh0XLFiQmJhY+9jbt2/PnDnT3d29e/fumzZtOnr06AsvvFBRUWHa4dChQxMmTOAO/+CDD3JyckxvnT17duLEiV5eXu7u7v3791+7dq1er7+/eykpKa+//vrRo0dXr17dsWNHLy+vRYsWZWZm1t4nOjp6zpw53t7eXl5ec+bMuXnzpumt1atXr1ix4uLFi6NHj3Zzc/v888/rtK/VakNCQlxdXWv3zQTDMBDC0tLSzz//PCwszN3d3c/P7/XXX79x4wa3w8WLF/v16wcACAkJGTdu3NixY69fv869dfr06enTp3t6evr5+S1evDg1NdXULEmSP/30U79+/VxdXceOHXv+/PkPP/zwm2++qX3VS5Ys8fPz8/DweOmlly5evGh66+TJk/Pnz79y5cqiRYu8vb2nTJmyZcuWefPm5eXl1e75d999N3/+/HpvKU9bg1e3llW3c+fOmba8//77CIKcPXv2woULQUFBn3zyyU8//fTpp5+6uroGBARkZGRwuyUlJXl6erq6un755ZcbN27kCgwjCJKbm8vtsGHDBqFQGBUV9eOPP3766ad2dnbBwcGc9t26dcvOzm7AgAHff//9zz///O6777700kulpaX3d+/ixYtSqdTDw6N///6bN29evny5QqHo2bNneXk5t8OxY8esrKx69eq1fv36DRs2dOnSxcnJKSEhgXt32LBhUqm0Y8eOr7zyyqpVq3bv3l2n/WvXrkml0qlTpzZwi86fP9+vX79ly5Zt27btiy++8PX1dXV1TUpKghAmJiZOmzYNRdEZM2asWLHik08+4VTs119/lUgkgwYN+u6779asWePh4dGxY0eTAK1evRpBkHHjxm3fvv3NN9/s2LGjRCKZOHEi9256erq3t7e1tfWnn3767bffdunSRaFQHD9+nHv3m2++EYlE3t7ew4YN++KLL7Zs2XLkyBEEQX766SdThysqKszNzV966SVOnXnaOLy6tRRr1qzBcfzQoUNqtVqpVJ4/f97b29vDw4PzxHGDQY6MjAyxWPztt99yLxcvXiwUCm/fvs29LCoq8vDwEAgE3DOckJBga2s7e/Zs0+GXLl2Sy+UbN26EEG7atAlBkKKiItO7FEWxLHt/9y5fviwUCrt27VpQUMBtOXDgAEEQX375JYSwqqoqMDBwwIAB1dXV3Lu5ubleXl4zZ87kXo4ePRpF0Z9//vlBl79v3z4EQTg/44MgSbK2EVRcXKxQKD799FPu5fHjx3EcP3/+vGmHnJwcT0/P559/nqIobsudO3dsbW2XLVvGiZezs/PEiRNN0rNx40YEQV544QXu5bx580Qiken7Jicnx8fHp3///jqdDkL4/fffIwjy0ksvmRqnaTo0NLRfv340TXNbfvjhB4FAcPbs2QYuiqftwEcVWgoURRmGWbx4cYSRsWPHlpWVLV++3MXFhSuyGxcXt3Xr1k2bNh05ckQmk924cYMrwXvixImwsLDOnTtz7djZ2Y0dO5aiKO5ldHR0aWnptGnTampqqo34+/v7+voePXoUQRBbW1sEQb755pvc3FySJA2OVRyv1/1k+NujaFRUlIODA7eFOynn779161ZSUtKECRMAANxZLCwsevXqdfXq1crKSq6fnp6ew4YNe9Dlc640kUjUwC0iCALH8Rs3bvz000+bNm3avXu3lZVVfHw8F3jhWuD+5YiLi8vOzp48ebJWq+V6xZm9p0+fRhAkKSmpsLBw8uTJJqdeZGSkvb0914JSqbx48WKfPn369+/Pvevi4jJ69OiEhITExEQEQViWFQqFU6dONTkQMQx76aWXoqOjr1+/zjnj/vjjj8DAwN69ez/iZ4GndeCjCi0F56Lu0qWLm5sbAGDWrFlDhgxxdXVFECQlJeXVV19NT093cXGRSCScl0qr1XIPc05OTkhISO2mPD09TQ5vzjU2ceJE07sAAKVS6eTkhCDIkCFD5s+f/8MPP6xcuTIgIGDUqFHTpk3z8/Ort4cCgcDX19f0UiqV2tnZFRYWMgxTWlqq0WhWrFjxxRdfmHZQq9VeXl5qtdrCwoJlWWtr6wZyNcRiMYIgpaWlDdyirKysWbNm3b59283NTSqVQgiVSqVOp2NZtl63fW5uLsMwc+bMqf1uTU1Nz549GYYpLy9nGMbT09P0lpWVlZ2dHcuyXH6JUqns2bNn7WM7duxYU1NTVlbGqZtcLq9zRZGRkZ6enlu2bOnVq1eckS+//JK7NJ62D69uLQWEEMOwBQsW1MlxY1n2008/zczM/OuvvzjHEE3TQUFB3EMIABCLxSqVqvYhtV9yhsnGjRtrP4cQQmtrawRBZDLZhg0bXnzxxYSEhPPnz3/11VeHDh3au3evh4dHvT2sk17LMAwXK+SUdPHixb169aq9v0wms7Gx4X7nevugy/f09LS2to6Ojr4/3Gniq6++unbt2p49ezp37iyTyViWjYiI4IKk9cIJ0xdffGGKwHI9sbCwMEWHa98rvV6v1Wq5s2MYBgCoc716vR4AYNI7YKT2Dg4ODsOHDz948GBBQcGhQ4cEAsH48eMf1D2etgavbi3L/dn5JEmeO3cuKirKNEQqKSlJT0/v1q0bl6bQr1+/s2fPqtVqiUTC7XDq1CkcxzlB6datG4qiEMLQ0NAHnbSHkRdeeCEqKmrMmDHXrl27X924Rz0uLu7VV1/lthQWFqalpQUHBwMAPDw8LCwslEplA2dpGD8/v0GDBh05cuT8+fMDBw6s/RZFUdXV1QqF4vz58+Hh4WFhYdz2ioqKhISEPn36PKjNjh07EgSh1Wrr7ZW3t7dcLj916pSphaSkpOzs7KCgIE6n3NzcEhISNBqNmZkZt8Ply5ft7e3rlX4Ts2bN+vHHH3/55Zft27e/8MILnLjzPBXwfrcWpN7EXQzDXF1dL1++XFJSwo2n3nvvPc6I4MyciRMnZmdnL168uLCwsKKiYuXKlVeuXDE5g0JCQrp27frWW2/FxcVRFMUwjF6vj4+Pj42NRRDk6tWrN27cIEmSZVmapouKihAEUSgU9XYPw7C///779OnTXJTju+++y8jI4Ma8AQEBERER69evP3jwIJd0RpJkcnJy7SzchtOSAQAffPCBTCabPn36rl27ampqSJLU6XSXLl2aNGnSuXPnuPsQGxubl5fHMEx1dfWyZcuUSqXJerK2thaJRJcvX1ar1RqNhmGYoKCg/v37f/TRR+fPn+d6pdfrb926deHCBQRBOnfuHBISsnbt2r///lutVsfHxy9fvpwkSc7aFQgE48aNu3Xr1vfff0+SJE3TR48e3bNnz6BBg9zc3Bq4oo4dO0ZERKxataq6upo33J4yWjus0W7hPFanTp26/629e/daWVk5ODgMHjzY09Nz5MiRPj4+48eP54KbDMOsXLnSyclJLBbb2dkNHTp00aJFAIDCwkLu8Pj4+KCgIDMzsx49eoSFhXl4eFhZWf32228QwnXr1gmFQn9//8jIyO7du5uZmc2bN0+j0dzfh0uXLllbW48dO5aLG3bo0EEikSxZssQUcCwoKBg1apRcLvf39x88eDA3iH7nnXe4d8PDwwMDA2tHfuslOjp64MCBZmZmtra2nTt35vyMwcHBd+7cgRCeOHHCzs7O2tp68ODBPj4+ERER3bt3Hzx4MBejVKvVs2bNsrS0VCgUNjY2p0+f5hLWwsLCzMzMunTpMmjQIB8fH4VCsW7dOu50aWlp4eHhEolEoVC4u7u/+eabnTt3njx5MveuTqd77bXXZDJZQEBA7969hULhkCFD8vPzuXc3bNhgbm5+7dq1+6/i77//RlE0PDy83jvJ02Yx2AutLbDtk7S0tKSkpD59+nAesTpcu3bt/PnzWq22Q4cOERERt2/fFolEPXv2NO2QmJiYmpoqkUj69+//8ccfb9myJTs72zRWraiouHLlyu3btymKcnJy8vPz69Gjh0QiKSkpuXbtWnp6emlpqbm5edeuXUNCQuqdzHD58uWoqKiNGzd27Njx5MmTJEkGBwcPHDiwttNdp9PFxMTExcWpVCobGxtfX98ePXpwlxMTE0NRVL9+/R46XVSlUsXExCQkJCiVSoVCERAQEBQUZDInb926dfbs2ZqaGl9f3yFDhty7d49lWW50jCCIRqO5efNmSUkJhLBv3752dnZcGIGLY+r1ejs7O19f3549e8rlcq5BvV5/5cqVqqoqT09Pc3Pz0NDQSZMmmWIjFEVduXIlOjqaYZjOnTsPHDjQdGBmZua9e/eCg4PvN3W5EfSGDRtmz57diL88T5uhteWVpy56vb52fvzdu3ft7e2nT59eb9pak7l06ZJCoeAsvnZDWVmZUqk0vfzkk08QBLl06dJjNjtjxgw7O7vac0V4ngr4qEKbQ61Wv/HGG0ql0sPDo6qq6urVq1Kp9I033mggQNkEWJbVaDSmNLr2wcWLFz/77DNvb2+JRJKWlhYbG/vKK69wUYUmQNP0F198cfXq1WPHjq1Zs8bCwqK5+8vTsvBRhTaHXC6fMmWKq6trcXGxXq+fPXv22bNne/To0bxnsbGxmThxYsPhwqeOoKCg5557jmGY4uJiV1fXnTt3btq0iVuGoAlACLlB8fr16+fMmdPcneVpcXi/Gw8PT/uEt914eHjaJ7y68fDwtE94dePh4Wmf8OrGw8PTPuHVjYeHp33CqxsPD0/7hFc3Hh6e9gmvbjw8PO0TXt14eHjaJ7y68fDwtE94dePh4Wmf8OrGw8PTPuHVjYeHp33CqxsPD0/7hFc3Hh6e9gmvbjw8PO0TXt14eHjaJ7y68fA8MvyK1k8FvLrxPJUUFhbu3r07Pj7etEWj0Rw7duzUqVN6vb5FT52bm/v2228XFha26Fl4Hh9e3XieSq5evTphwoT58+fX1NRwW2JiYoYNGzZ//vzKysoWPXVVVdWRI0dM5+Vps/AV/3ieSgAAtra2er0+JiYmIiICQZC9e/d27dpVIpFwpRGrqqoSExPLysqsrKwCAwOFQiGCINXV1cXFxQ4ODrGxsVwNLalUiiBIQUEBy7LOzs5cjeqsrCwPDw+hUKhSqZKSkoqLi+VyeWBgIFctGwBAEAR3Fr1eHx8fX1ZWplAoOnbsaGNj09o3hudfeHXjeSqBECoUisjIyH379kVERJSVlcXHxw8fPvzChQucU+yrr766dOmSlZVVdna2r6/vDz/8IJFIrl279u677/r6+iqVyuzsbH9//+3bt4tEos2bN2u1Wq5kfV5e3muvvbZt2zYvL6/t27fv2rXLxsYmNzfXycnpm2++cXBw4DqAoihFUW+//XZcXJy7u3t5efmwYcPefPPN1r4xPP/Cj0x5nkoghACAqKiouLi46urq/fv3u7m59ejRgyRJboc5c+acOHFi165dx48fz87O3rt3L2eXXbt2LSoqavfu3Tt37rx9+/a5c+c4Q0+pVHIHUhRVXFzM1bGeMGHC8ePHd+7cef78+aqqql27dpk6QBBEQkLC/v37d+/evWPHjsOHD8+cOZOPNrQpeNvt0SBJkqIolmVRFOXGKTytBUmS3bp1c3Z23rVr14kTJ6KiokQikUlfMAzbsGFDeno6giBFRUV3797lNNHDw2PUqFFCodDf39/T0zMlJWXo0KGoEe5AAACGYdzAkyCIbdu23blzB0JYWlqakJBgOjvDMLa2tlZWVu++++6oUaMGDBjAD0vbGrzt9mjMmTOnS5cuQ4cOHTBgwJQpU2p/3Otw4cKFH3/8sWlnSU5OXrdunVqtfoyetn8ghGKxePz48Z988klWVtbo0aM5ww3DsJqamqlTp16/fj04ODgyMtLR0dFk00mlUpMCAvBvtXJOzrhfOBiGefnll48cORIUFBQREeHt7W1qBEEQmqYdHR1/+eUXuVz+448/9unT57vvvuNttzYFr26PRl5eXmBg4LfffvvVV18VFhYuXLiQ0yCKojQaDcuy3G4QwtjY2J07dzJGTB96iqK0Wm3tBrm3aJo25TFACNPS0n799dfq6urax2o0Gp1Oh7QBGMhQLEUyZK0fPfejN/xL0iz9ZJ5zkiSHDx8ul8sHDRokk8m4+08QRFJSUkpKyg8//PDCCy+MHDkSRdHaf5r72xEKhaaRaakRHMcrKytjY2NXrlw5Y8aMMWPG1NuBLl26bNy48cSJEwsXLly1alUb+QPxcPAj00cDAODm5ta9e3cEQZYuXTpr1qz09PTo6Ohjx46p1WqZTDZv3rywsLCMjIwDBw5kZGS8/PLLDg4Ob731lkKh+OOPP3bu3EmSZMeOHRcvXuzs7KxUKj/99NOAgICTJ09mZ2dHRUW98cYbarX6jz/+yM7Ofuutt6ysrN58802apj///PPCwkIAQK9evd59912xWPwELrZCV6HUVagolYpU1ZA1FdryMm1Zua6sTFNWqSunWINnCnJqYfjX8H8WYQmUUAjNrURWlmIrC5GlpcjSQmRhRkgkhNRCaG4nsScwweP3jWVZkiRZljU3N4+Pj8dx3LSRpml7e3uxWPzNN9/06dPnzJkzV69e7datm2kHUyMURTEMgyBI//79t27d+scff5ibm//444/V1dUQQolEYm5u/vPPP3PevVOnTnEaByEkSRLH8Xv37h04cKBbt24ikSgpKcnb2xvDsMe/NJ7mgle3R4Z7Hrjxo0AgEIlEcrl8/vz5FhYWly5dWrhw4d69e62srLp27arT6aZMmSKRSKRS6datW7///vvly5fb2Nj88MMP8+fP37NnD03TmzZtCgsLW7BggVarnTt3ro+PT1RUVK9evW7cuDFmzBhra2uFQjFz5kxHR8dPP/1UrVZXVlbSNN0S18VClmKpEnXxvcqU5PLEzKqMQlWhUl+pIlVqSqWltYAbtCEANf6L/H8odz9GyTP8AxGWhRBFgBg3kwgk5kILWzM7J5mTt4Wvj4Wvl7m3VCATNEnsPDw8XnjhBU7UuGwPBEG8vLwmTJggEAisra3Xrl37/fffx8TEhISErFy50t7eHkEQNze3iRMnckchCDJixIiOHTsiCBIWFvbRRx9t3brVzs5u3Lhx3bp1k0gkYrF406ZN69evX7t2bffu3b/++mvuKAsLi4kTJ8rlcr1en5WVdfHiRQCAi4vLpk2bBIJmEG6e5uJfvwNPY4iKisrJyQkPDy8sLDx79uycOXM+/PBDBEHu3btXUFBAkuTs2bNXrlz5/PPPb9y48dixYwcPHuQGUIGBga+88sr06dMhhAkJCTNmzDh+/LiVlZW3t/fOnTvDw8MRBJk7dy6Kot98882ZM2c+/PDDo0ePymQyhmFCQkIGDx48b948Ozu7Zr+inOrsdGV6RmVqckVyamVKiaaYYimKoWhIowiKAsMPJ2qPcxYIIYuwEEIGGr4bCJQgUEKIi5xkzn4W/j6Wfh2tOnqYe5kLzZv3e4imaZP2PRSKolAUrWN/sSxLUVQDjXAmpEgkeuz+8jQzvO32aEAI5XK5s7Ozh4fHrFmzQkNDKYpauHBhQkKCm5sbQRBVVVWc84WmaZOvR6PRZGdn//XXXydPnuTGNQKBQKlUWlpaWllZWVtbc7spFIqSkhLuMWNZVqfTyWQyDMM++uij99577+jRo05OTq+++uqIESNMLvCmQbN0viovOv9ybGFMemVqdnU2zVIYihu0DEERgOAojjfrZ8MQiEQwQ8vGZiECaUhTZE1yWWJC6R0WMuZCSw9zz45WAb0dg3vY9ZIL5Sh4XKcwZqTx+xMEcf9GFEUb1kfeXmuz8Or2aLAsGxwcXDtp88yZMxcuXNi7d6+XlxfLsjExMZyo1TaKcRyXyWRvvvlmREQEhJB7YAiCKC0trb0nl8Nl2mLKUYiMjAwLC0tJSdm1a9fcuXMdHBwCAwOb0PlKXUW6Mv1m8fUr+ZeSKxJ1tI5iKQxgGIrh6BP9JHCWIGcRGlQPQTS0+lbJjVslN/bc22kuNO9q26OfU38/K39fS38CrUd0eHgeCq9ujwbDMFyepwmtVgshJAiCpumjR48mJCRwCmVpaVlaWlpQUKBQKMRi8ZAhQ37++edBgwYpFAqKotLS0vz9/TkTz6RuLMtyTj0LC4vy8vLc3FxOBNPS0jw9PTt16mRtbb1ly5aqqqpH6zNkUitSjmYculZ0LVOZXk1W4yiOAUNKlxBr7KitpUEByjngIAIrdBWnso+dyDpqI7bpaB0Q6hIW7jbEUmzV2n3kecrg1e3RcHBwsLL6z2M2aNAgHx+fyZMnOzg4YBgWFhbGZfkOHTp09+7d48aN8/PzW7Vq1eeff/7WW2+NGDHCycmpurpaJpPt2LEDwzBXV1fTwMfS0pJTxm7dugUHB8+ePdve3v6jjz5as2ZNYWGhra1tfn7+888/37t370b2llJXHy04fTzzyPXieA2tgRDiKC7C27SHiItdoMCgdJX6yvO55y7nX9p86/sBLgMj3Id1te3WxvvP03bgowqPRk5OjlAorOPdV6vV169fZ1m2e/fu1dXVUqnU3NzgHddqtZmZmSiKclOyGYa5detWWVmZXC738fGxsrKiaTorK8vZ2ZnzSZeUlDAMw81kpGk6PT2dpmkPDw+VSpWWlqZSqWxsbLp06dIYXxKsrIQpKVRezjzy9yu6BBEqekxXXSvChV8plpIQ0i42XYd6Dh/sFqFo1vgDT7uEV7f2BltcDJMSYVYWotPhQHBUlv0OvYeAwGAVPeWwkKVZCkcJR4njaN9xQz1HOMtcWrtTPG0XXt3aCxDCkhI24S7MyUV0WgRFEQAwCMr+x95ZQEdxdXF83si6xd09ECBCcIfi7m6FAqV4cae4Q3Epbi1SXANBE7QQnBB3T9Z35H1nM/22aZAigYRkfu3hZGdnZ2ZnZv9z331XBPRPxLGn+ngeKCdeCIhABhpdlG4Kj47eXdp7dSrZOBKOckMFVbfMzMz79+8rlUqFQuHt7e3k5PTWgZvBYNi4cWPbtm3d3NyQMgyTkQEfPYQJCYjBwOqa6S0c8NeIbm2jrhGwvGXdkQwJEMRN7t7Lv28T1+bmAvPSPiKOskVFVLe7d+/++OOPGIZZWFhkZGQ4Ojpu3LjxrQUeNBpN27Ztf/nll1q1aiFlElhQwDx6BF9HI9q/7bViK2AQSZTRPcgtesbwmRG5ZROKoQBA/C0Cuvn2bO7Wkptz4Ki46kbTdOfOnXk83q5duwiC0Ov1SUlJ9vb2bI1WBEFev36t0WgcHBzMzc0hhGlpaebm5qZpzYSEhPz8fA8PD5FIxG6toKDAzMwsJSUlNzfXy8uraGxnQUFBXFycWCx2cXExZf+kpKRkZWW5urrKZLLP+SJQp2OeP4OPHyNKJYKhyDtiXwGCQBSbIQ0/pblTbganxYAIJGkSQ7HKllWGVh1ez6lBaR8RR5mgwqmbTqdrVMiCBQuKvZWSkjJlypRXr17hOC4UCjdt2mRnZ9enT59JkyaFhIRoNJqZM2fevHkTRVGBQDB37tzatWsnJCRMmjTJz8/v2rVr2dnZ7u7umzZtYkNG9uzZs3nzZmPuEU136NBh4sSJFEX98ssv58+fxzAMRdEpU6a0aNHi074FTEpk7t+HKSlvtdeKgQM8TJAwnjmMQlguzTcWY/4DQ4lxUTuvTt9XHWYp/DsDhKPCUj4f5u9BIBC0b99+4cKFaWlpDRo08PPzq169OgDAYDCMHTs2Ly9v7969FhYWsbGxEomEoqh79+6x0bPz58+/c+fOrl277O3tN27cOGHChHPnzlEUde3aNYZhdu7cqdfru3btunXr1kmTJoWHh0+cOHHp0qVt27ZVq9VsTsLatWtPnTq1bds2Nrd06tSp/v7+zs7OH3X8UKVioh7Bp08RikI+LM2IYagQxqkq4XJPH80H5TbuHyCAQAkdrd/7dNed1Mhh1X5s6vod+Ox0Lo5vl4p47ceOHbt582adTjdr1qx27dr99NNPOp0uJibm7t278+fPd3Nzk8lkVatWtbS0hBDyeDyCIFQq1cWLFxs3bqxWq58/fx4cHBwXF/fo0SOCIGQy2ahRo+zt7d3c3OrXrx8VFYUgyIkTJ2rWrNm7d2+ZTGZnZ1elShWtVnvq1KnatWuzxUV8fX0zMjIePHjwUUcOY2PpM6fho0cITRuttg+DAYjMgNZHPDEUY+sUlWNQgPIx/uu86GnXJv1yc3aqKqW0j4ij1KhwthtbMKd7ITqd7sKFC127dm3WrJm9vb1Go/Hw8HhzfRRF8wu5evXq48ePGYZh66zJ5XKapjEMMzMzY9fk8XjsSD8hIYFNtDKhVCrz8vLu3r2bmprKplsFBgYWS3t4H3o9fec2fP78w022ojAM2Ybx3wVuFkBNuR2aFgFHcYqhfn9x8HZq5PDAkd+5tfzKibQcZYEKfckFAkHbtm3d3d1jYmICAgJEItHLly/fzHOCECoUCqlU2q9fv/79+xd96+XLl8US5tm/XV1dixUll8vlEomkZcuWkyZN+tjj1N2KoG7dFEglRufSJ9VHZABiqUWbyqoe1Fwrx4PTNxNXE5UJs65Pu5t2Z0zIBBn/s6ZxOL45Kpy66fX6X3/91dnZ2d/fHwBw+fLl5ORkf39/d3f3hg0bTp48eenSpZaWlgkJCf7+/kKhkKIokiTFYnH79u2XL1/u5OTk5eWVm5ubmJhYr149FEWLpsGzdcYRBOnSpUvHjh03bdrUtGlTtVqt0+lCQ0N79OixatWqypUrBwQEqFSq169fV69ena2q+C4gSWr278/7ZQFCUej3g/g2NpD5u3bmx4JCtKnB9SR2tzBMrCIYcEZwFKch/fuLA/EFsZNqTPc29yntI+KokOqm1+sPHTp06dIliqJsbGxatWrVpEmTEt8LQRAoii5fvpydzZRIJKGhoQ8ePGjevPmiRYvmzZs3YsQIPp+vUCjWrVsnlUqDgoLkcjmCIOPHj2dLrbFj1cDAwPr16wuFwsDAQLFYnJiYyOPx3Nzc2IzR0NDQjRs3rly5cseOHQRBdOrUKTQ09PvvvydJcsmSJWxLLR8fn5CQkPccKpObmzd/vmb/QVhYjFd54RLerQvGI+D/y8Z9FAykqjH2VQnXm/pnFcR8K+qJu5MaOS7sp4k1ptZ3aljaR8RRwSJCGIYZNWrU5cuXe/fuLZfLnzx5olAo5s2b9+UK1Wu1WpIkhULh9OnTs7Ozt27dyi5XqVTs8rdWW9VoNHq9vui7JEkSBPH999/b2NjMnz//zfUZhhGJRKZibTqdTqvVYhgmFovf8+3Ily9zJ0zU37gBeDx2AgGSlKhJI3mzJsYphU8Ch9gfsuiFhpOgTFzzrw3JkBKe9PsqP/Sp1J+rGVcRKCu2W0FBwb59+3bv3t26dWt2iV6vR1GUpumIiAg3N7dbt27Fx8e3atWqqLf++vXrkZGRdnZ27du3N3UXzcnJOXPmTGpqqoeHR/PmzdmwWxPJycnnzp3Lz8+3s7Nr1qwZG1LL4/GioqIuXbrk7Ozctm1bU2RvUlLSqVOn9Hp98+bNfXyMgxpRIeHh4Xfv3nVycmrbtq1QKExMTHz+/HlGRsaff/5pbW1dq1at7Ozs06dPZ2ZmWllZNWnSxLRB1tn3n1Wq9bfv5I4bRz5/AYqsCXBMe/MW39VF6O3FWnMfCwOYJqT7BlSSSyuNFXgrGARKaEnNmnsrkpVJI4PHcNmp5Z6yEhGCYRiO43fu3GFDw9iZTQCATqcbOnRo586dT58+/ejRo7Zt2x4/fpy1mH788cexY8fGxMTs27evXbt2qampbJZVo0aN9u/fHx8fv3fv3lu3bhXdS0JCQocOHc6dO5eUlHTs2DG2DzmO49euXZs9e/aTJ09mzZo1ZswY1p49efJk69atr1+/HhUV1bVr18OHD7OW1+DBgydNmhQbG7t9+/YuXbrk5OTExsYmJSXFxsYePXo0MjIyOzu7c+fOf/zxR0pKyunTp0+dOvVRp0Jz7M/s74cYpa1YwWsAoF6vPHOWzM79tLkFiECFHuvIr26AX6TvTNmHLa1+8Pm+cZd+is+PK+3D4agYtptEIpk9e/acOXNOnTpla2vbvHnzfv36yWQyAEBaWlrTpk1Xr16NIMjcuXMXLlzYtm3bS5cuhYeHnzx50tXVla3N/fvvv//000+//PJLtWrVtm7dytbI12g0RfcSHh4OANi1axebWcW2FoUQajSadevW2draXrx4cfDgwXPnzpVKpbNnz/7hhx9GjBiBIMjWrVuXL1/esWPHkydP3r9//+zZszY2NhRFNWrU6OjRo4MHD27UqJGNjc2iRYsQBLl8+XJGRsbBgwfZMnDFGpi+H9WePfmz5zBKVXFpKwRgGJWaprxw0axLR2OKwkd6FWChJ6KO3uEQIVeRqs9vXPAtwlYkvpsWOTl8/Nx6C73MvEv7iDjKu7oBAEaMGNGqVasLFy5ERkauWrXqzz//PHnyJIIgUqm0TZs27GotW7bcsmVLQUHBxYsXKYras2ePXq9no21v374dFxcXHR29du1aU/uPYsPS0NBQtVrduXPn1q1bh4aGst0JaJpu2LChqSOcRCLJycnJyMiIjY19/Pjx7Nmz2fHso0ePtFrthQsXaJreunWrTqfDcVyj0URERAwePJhtv8Tuxc/PTygU9uzZs3379tWrV2cjeP8bhilYt065dDnU68H/k1LfcqIwTPcoSuXiLKlVwxj79pHQkA6gbQMJpzDwmF9mLPevDw/jP8l6POnKuEUNlnmb/ysykaPcULbub1dX1yFDhmzdunXTpk0PHjy4ffs2O2I1ed9xHGeDMLRarUwmc3JycnR0tLa2Hjx48KhRo9hWUu/xavn4+Bw6dKhJkyanTp3q2rXrjh07WNvNpIZsSxfW6OPz+fb29o6Ojra2tqGhoZs3b+bz+RqNRiaTOTg4sMtHjhz5/fffF234giCIra3toUOHOnfufPXq1Z49e7Lzs+//4pBhClasKli4GJIk8m5pMwIAgIz60mV9XPx7RPCdOwIIridbYpV5gCj3eQvvh4fxonNfTbn685Osx6V9LBzl2najaTo7O9va2pp9aW5ujuM4hBDDsLy8vPv37zdu3BhBkEePHrEdwkNCQm7dutWtW7eiXdk1Go2Njc3Zs2ffVbCIoqhKhYwdO3bSpEm7d+8eMGCAUS7+rT4Mw3h5eQkEgkqVKrHtx00EBwe/evWqX79+pjlQFgCAqZsMRVEeHh4/FrJmzZq9e/f+8MMPRScWigFJKn/+fNWGjca50Q/Jr8IwqFIqz57H+/TCRELkIwNEGISpp3e0xyySqExjDz6kogvcpCvjFjZYFmBVpbQPh6OcqptOp+vSpUtAQEClSpXy8/OPHj3q7+9fo0YNkiTlcvnOnTvZNrrr168fMWIEhmFdunQ5ePBg+/btO3bsyOfzIyMjO3bs2KJFi59++mn8+PF6vd7f3//169fNmzcvOjA8c+bM+fPng4KCaJq+du0a2yOZpmlT41E2CI5hGDZ7dOrUqVFRUe7u7rGxsQaDYfbs2f369Tt+/Hjbtm3btWuH4/jNmzf79evXoEGDGjVqrF+/fvLkyUFBQXZ2dvv37w8MDCQI4vjx48HBwUUl+E2Ua9YoN2wEGPaf1T7+AcfJuDjllXBFqxaFRY4+4lQzABGRaEdB8AryFFYhXW9FIVAisSB+6tWf59VdWM0mqLQPh6M8xrtBCE+dOnXt2rX09HQURUNCQnr06GFubq5SqUJDQydNmhQTExMXF9e6desuXbqwdlN+fv6BAwciIyMxDPPw8OjVqxdbbyMiIuLAgQN5eXlOTk5Dhw51cvqn9H50dPSePXuSkpJQFK1Vq1afPn0Igrh06ZJOp2MjUbKzs//4449OnTqxxSzDwsKOHj3Ktmv57rvvWDXMycnZu3fv/fv3CYLw8vLq3bu3vb09SZJHjx59+PChv79/gwYNdu/eHRMTAyEMDAwcOHBgMfffPzCwYN2vBYsWIwz88Kx40ylDUFTasYMkqNrHBojgCPpckD8KO5pJ5mJlzDtRKpAMaSuyXdRweaDNpzSK5SiblBV1excqlapq1arbtm1r2LAchphrzx7PHjoK0RsQ/JOClhkGmJmZD+jHs7SAHxPia2whQ/AnEafPUo/4ZcZ+L11IhvSQeyxtvMZD8ZZKChzfImX9uc22y/vP8NdvEZh+l8e7KWrqj+CE0Xb7BFCUycoqOHmK1ukQ9CM8aBBBUAPZBQ8RAF4Fn1swQaBEdH70Lzdn5mhzSvtYOCqGugkEgq1bt1apUu48vnkv4asjANMo+lWS9qhhjM6lPyV7FOC44VW0KiLSGKb6MdCAqaI18yBsGeRT9lsu4aG8u2l3lt9ZpKM+IkSRo8xS1tUNRVFXV9d3+q2+TfJ0dGLCM5RUGvM9ASnt6Cz/oREQ8OEnCJyxcTvQXA7Xvoz+j1CSfwMRREihndBAEn4tdXuXcVmWpm15GO/E6z/X31/LlG2PDUd5ULfyh4Fm7ibm3KCDnkmbAowPGBqhKXEjK8WYpiifj1AfnyEPAEKSyrPnqZxc48TrBwMZprrBzpVnS8FPTMv/QAAKAG7UMIADgP0jZgD7//L///H3cnY1YPzjK2sfW75877Ndv7848FV3zFEBZxXKGTQD7yblvspUoygKEdQHeVVVc4Ew5DEAA3ye7pEqd1UYnVMAPn6SAVKUIChI0an9R7nfcFwwR3DpMHmHh3ypWiwABVQBmRNRoI7V8Kx5FnUUAhs+pCFAgS5dnxuRr03V8y0IRXWZyEVY6BFE1DHavDsFVAEl9RebVZcBAv3KvkEa0mJCPLvu/KYu333VHXOUKJzt9lV5naOOydagqDFHFEXo54h3pLiDmmeHQgrq9YIqEvPJTXE7c4T8aGMK4LjuwQP1nXsfMT4FCKT0HbBA4ZebWwAIQzKxm5NzIvMkPiJ9qj5uc5I+kwQ4oFTU6zUJqtcamb+YLKBi1iZoEnQYH6ijNbHrEikNLXIXpp3OSj2WWWjdIV8TDGAqg2r57UWxea+/6o45ShRO3b4e2WrDo5R8o6vt/0swhIqD9uHiztlCbxSBUK/newvMpzQmfJ0Q8qNzSAEA6stX9PGJAMeMY0Ecx3kEThQZ8hWmsuE8Hk4QhW8RDED81JIAniuNQpQAKA8tOnL8fAAKlC/U2mSd8wB7mxZWrkMcGQOTezsPxYHypZrWMU697aybW7oMcAAYUD5TIxiaeSlH6MB3/d7BpqWlcz/77Fv5mkRdyR7Vh4CjeJIyccWdJRryX4UYOL4huFinr4Seoh+k5OkoBvt3QgKG0LlQelXQpgZ2zV5zH+oMhCNhPrZW7iae/t5rQHxMrhSKMgUFBWfO8Pv3TdFqr754EZWU7GRm1r9ObSGPh0CIArDj2vW/EhMwFIUQ4eP45JYt5SJpa9o/LPYB9ZIkc0lZZYksQArpEjLlAKJPNxBynDAjGD2D8lCho1D1Ss3oGZ4FD6AImUsydnxDHolAyLfAIQ0NuaTIRYhiKK2nRc4CMp/UpenF7qKvH7nCw/jXk68der5/QMDgr7xrjhKBU7evxJM0ZVqBHntbVBqKMBoouEo0DZHK3VXXgcGAW2Pmo0Lzdom1lx4CAv9wgQM4TsXF68KvH8XB0fv3MwuUQh7RPbS6mM9nIAQoeuDO7Vy1pr6PN03/LWAQoSsVmAnCsMSsbF2cDsGAvJqsxNQNIkJHvj7boE/V8614ZA6pidOiBGAoKHEXWjUxj1mXKHQSaJN1ZtXlimA5AhGeJU8Tr6V1NCbCCh6pIAWpPPpjaz2VCMA4XwO2PdoUaBNU1Trw6x8Ax2fCqdvXIDlP+zJL/VZpY0ERhoHgLhpaIJFVVV9ASRUmwcyGVEGFhPrEXcD7iBRUgGH5t261b9F88Pjx+65f337tepE3IYaifWvVGtm+nbF6Ek3TOh3D0B6YeY+edQ8L7sWvSPjEuOJ3ABko8RRJfcTxO1PklST6DAOtY1AeBgDQZxoKolRmoXKZv1iTqC94rNTEaiQ+EptmFjHrE16vjudb81TRGlyElmK8MQrQfH3+mnsrlzdarRD83deR41uB87t9cVQG6kFyPvVflTyAUQqYZ8D/hqSTjmcLGAoQBsXgytJetYyW1IcbLwBAg4F/7bq4QEm9oQuQgeceP1506NCuS2EpmZnGIWqhtvY1qynCeEyJSlvh/owK4faDk107K8BDzeuYyatI+FY8lA+yb+TRKsqxm615bYV9J2tcimeG50IKityEXj+7Sf3FuBR37G6LCjGeOfER9QVKGh7Gu5MauePxttI6AI5PhlO3L86zdGWejizmbnsrwHg9qATE8aqwQ4HQA6UphNLIevhK+9VB0I9JZsAwMicn//wFWmcomqHFQMTbxkYmFMZnZS88c6bjr+visrMxABgAHVX8mjwf8ksEvkFj2JplPTPnvnZSH1H+Q6W8mhTwUEhDiPy/fU2heQaNA1AIKci35tl1sHHsYWvIIlE+KnIVlthI+ZPAMfzQ8/23kotawRzfANzI9MuSptS9zlKjH5MEiiF0JmIeLmgfBK46aO4zpEre2R2T8fK330K0OgRDPyhJHscNUY91MqkpQ8soDwyzuGsX3FhKCkvOz2uzavXaS5eW9+wJSZJg0Na032b0RImrCKRh2pksjG9sU5N9I0/iLVIEyxg9YxaqyLqaF/9bsiJQqo7Rqp6r3X90QglUG6/NDM8V2vN1aYbcO/l2Haz41jxIlaa6oQiqMihX3VvhZe5rKbQsxSPh+Cg42+0LYqCZJ2lKGsKPHVZhCF3ACG7xm0RL6qGAQHRqSVN7xYh6qJncFAqHIogAAB4A2L+jwQjEWLONNfNgcooxu6swWwsnCAAAZiyTZxQaByurUFfXqKQk9tMQUlUoKz/CqcTNN2OcsiWhjtOqozVWjcxd+jtgAgxSUGjP9/jJiWdG5N7OhxT0GOUs85cwFINJMcADeVFKxsC4DHawqGdWutLGQmD851lPjr36o7QPhOMj4Gy3L0hMtjpNqTeG7n48KMIYGPQ2XlclMQvQhKH6AnEdS0zRMG/9TSopHeXhuQxz26B/RRrVrqtI7IBhdOHlvKrXndJpUmnGCkXzKRLJz+erNYxEcuz2nQtPn2Yole5Wll2CQwKcnJ6kpPjb2bGjQ0Bg1kBgRwpe4xDlFw4bS24waFHHzLyWgh2iIozR98d6AMUeImOoR2HeAoIhkIQIgxjdbV1t/16IImVB2lhzGEPx/U/3NHdt5SQzlhHkKPtwmVhfCpWeuvAyU0vRn+MPhwhgENQLxFVVnxcYMhmCb4in8n69Dl+lXEfoeQV5EoA+o8g9FpbVeXwDhHwANiuVuZDJpun9GrUeQSwQpJm3t7mzc1JmplwoPP7wocZgMBeJ/B0cknJzfx/2QxVnJwQi68LC7sXFn3/yNE2qtPCSywNlisCSi3ozJRu8dXtvrS38kQWHvw4G2tDDr/fUWjNL+0A4PghO3b4IDETuJOS8ylZ/yGTCf0IjmA2aE6o5K9fHMThO5xK5y8PVj+MBD4+hqH45WZvNLUIK1e3v4h8AvKLIi1pdmF77kqI6YrhPSHD/Pr0RBh66c+dxSvKBiEgPa+vdQ4e4W1rSNI2i6P7IyCcpqWKBIIKXGqF5YV5JLvUTl64vvwzCMIyYJ1nddH0QV8L3W4AbmX4RcjSGxHztp41J3wRD6AzG/KqwXSh22UbzGJhBs0kN0bU34b2Yv3t5FQFFEDWENijWWyL+izQ05uNz5QomO5fIzOI7O33fqCHCMPfi4pv4+bnb2lJ6fWFuP9OrZk1j6XOA3xAmjGXUDElz0vYmKIrm6XP3PN5RzTqwYnaD/bbgrtAX4VWWSkcyJRijhSJ0ARSHEy3jpHURGhBy0uLnOhnVnBIpBoGwaH0PHgB39fruWZkN0tNekORoqcwAUF1ubt6Zc5TamDK58ty51Py8PjVrGLsL/h+KpimSpPXaajq7AMZZT//zFkdReCgvPOnylYRLpX0gHP8Np24lT7bGkJinfU9mwqeBIgyFoJFYnVdmrSIfZ3aYfmBwYtJsgyqLYeIoyrQzEsIAHs8Fx9JpOpmmtquMMb0Ax+mYGPL6jX23bq29FLa8WzdPGxv6jQBjCBCxHmmIeuMozlUkfyvG1o40uffprnx9/oesX1BQkJmZiZQZbt68efz48WILSZJMSkqKjY2NiYnJzs4u2T1mZmayHdbftQKE0NSUzhgf+uzZli1b6I/pE/IuOHUrYRgIX6QrDZ9URvw/AcboMeQhWvUSbOzn7bFtUoNff2nN8PClyoIMmmavJQ5ADEUm0TQPgO8Ewit6fRxF4QDwcXzn+fPTDh5a1r1b++DgN6Xt/8dPtaJ8LID0Sxx/+YDAiHtpd68khH3Iyps2berdu3eJ/FZLhIsXL+7du7fYwhcvXgQFBXXs2LFPnz61a9ceOHBgCSpyamrqkiVL8vPf+TCIi4sbNWpUWloa+zIxMfHcuXNF9e6T4dSthMnWGJILdCXlcXsTgECSNLjWaNFmwirvgBB3a7FMSGTiIB4yxqQqBMmj6fVKZVehMUYkhaYJYJxkwBDkhE67NC/3Z5Gkk5vHe24dBiBmOrQ5v6oefnQJpgoCWy/4yMvfSea/x+8Gg0Gn0725XK1W5+TkqNXqomuapviK/f3m9SJJMi8vLzc3t6husv3CDQZDbm6uqXe4aSO5ubkGg4HH44E3bk6SJPl8/qJFi/7444+tW7eePn36t99+K/rZnJwcrfZfvSYYhsnLy9NojL4Odl8QQpIkTYdN0zRV2IgSAFC0tblGo8nJyVGpVOxLCGFGRsbFixczMjLUajVN03Xq1Fm5ciX+/zKFNE3n5uYWPVGmBsSmAzCh1WpzcnIKCgrYXXOzCiXMqwy1ni5e5qhkMaYiABiVgS5Zf5PIilKqdQYa2SMX2BQYpAz8KT/3gcHgTRBZNJNM0xOkMjccf0ySk/JyUQBu5mRf/3Ut7uTUwMN9cP367E1QDBSChgaXo5hYx+iNgb8cb4AB7ElW1PXE8EYuxha376Ewkrr4OdyyZcv+/fv1ej1Jkm3btp00aRJBEFOnTg0MDOzdu3dmZmarVq2GDRs2ePDg3NzcwYMHz5s3r1KlSqaPx8bGzpo1KzY2VqvV2tvbz5kzJzAwkGGYn3/+WaFQxMTEREVFSaXSVatWBQUZ+09fv3592rRpOp3O29vbaHsSb85FGRc6OjraF9KgQYOHDx+yy48cObJhw4aCggIcx4cOHdqnTx8Mw2JjY8ePHx8bG+vs7Fy1atWUlJQVK1bo9fqxY8dOmjQpICAAQZDffvvt+fPny5YtY08Cu7X9+/dv3bpVp9Pp9fo2bdpMmDCBYZjNmzcnJiZOnDhRJpPNnTs3Ozt7SyEEQURGRs6dOzcjIwNBkF69eg0bNkwoFO7fv//ixYvOzs4XLlxQKpXjx48fMGAAAODAgQNr1qxhT3iLFi2mTp3K2W4liVJHfVHD7R8g5OOotW91jVNjGsGGtPL7rpuPw9imCWJ+Kkn1FUuyGEaLwDFS2UipTA+hHEWnSOWjJFJPHt8rI9M7J8fRwuJdjVFoSFVl7AIxFxLhzLd3ABA1qfnz1THyk6ZfKlWqtHz58mPHjv36669Hjhw5deoUAMDCwuKPP4y5EDdv3nz8+PGFCxfY1uOJiYnW1tZFPy4UCgcMGLB///5jx475+/tPnTqVoigAwKtXr/bv39+/f//9+/e7uLjMmzcPQqhUKn/44Yf69esfOHCge/fuZ86cMZlFRWEYJj8/X6VSPX369Pbt24GBxopPd+7cmTFjxoABA44cOTJr1qyFCxfevn0bQZApU6ZACPft2zdz5sxLly5FRETQNE2SZFRUlMkoS05OfvnyZbG9eHt7L1my5M8//9yyZcuff/556tQpiUTSqVMnBweHUaNGzZw508XFJTU19cGDB8ZSrGr1wIEDvby89u/fv2DBAvaMIQiSkZFx+PBhGxubHTt2jBw5cuHChYmJiRkZGQsWLBg5cuSRI0c2b97cokULbmRawrzOURuokpwqfRcQQqmZRUiDZrGP77foOfin2YsGtA22qWm+zklUUyTqJRQPEIklAAgByKaNLkBLFO0jkQyVSH+USkcqzIZpdA1F4ncdKAQIT0e3QCvxjBXJOf4FRCDFUCjAfS08rCRErj71EzZSu3ZtkiQvXrwYGxtrZmYWFmZ04dWqVev58+ckSV67dq1Xr16ZmZkqlery5cu+vr5WVlZFP25ra1upUqX79+9fv35dIpE8evQoLy8PAEDTdK9evZo0aeLr69uvX78nT55QFBUeHs7j8caMGePm5tamTZu2bdsWG7QWVl3AcnJyRowY0aRJk8BChg8fjiDInj17rK2tq1SpkpWVxZp1Fy9ejImJefDgwfTp0/38/IKDgwcOHGhqN4zjuMlMQ405f8WbdQQHBwMALl68+OLFCzs7u6tXr7INi0UiUaVKlSpXriwUCtntYBgWHh4OAJg4caKnp2ezZs369Omzf/9+VoiDg4N/+OEHHx+fgQMHQgijo6NRYzl/EBcXl5WV5efnFxISgqIoNzItMXQknZKvK0xs+uL6hhFEdmryip+HuHj59xk74ynBp2iFu/L0s5iEZwSIVOVRWkMuZDaolAUM87NMroOQjfX9G42GPH3GvHcvXC57axN7BjD1Dc7WqCydzjXmQ3EUtpKBEBHggkqWbtVs3dwUNgQO07QvrEUfl5jFMMy0adOuXLkSHBwsl8vz8/P1hVGH3t7eEokkLCzs+fPnU6dOXbly5aVLl549e9ayZctiW7h79+6PP/7o6enp6OiYlZVF07TBYGCfeba2tuw6aCHsD97CwkImk7HLPTw8njx58uYhSaXSCRMmeHl5Xb58+cCBA/Hx8f7+/omJifHx8UuWLGE9GBiG2dnZ5eTk6PV6Jycn9rNOTk44jpvcbSZ1KzYeZ1+ytl61atWkUmlBQQHry6MoivXZFVs/Li7OysrKzOzvsno+Pj5nz55lv6ZcLmctUJqm+Xy+wWCwtLRctGjR4sWL9+3bZ2NjM3LkyI4dO3LqVmKkKnW5WsNXGJaiGJaRFL920gi5uWWHIaNUBUbX8kOpS75Fj4tb+EIqWZ+Hpe+Kan7+5iiJrJtIpH9zBIphVGJSwaUwRYd2bz1ciEC5Ae8oC1mtOSMEPKRiw0CGhoyNyMrT3CnY3sdaLMJRlIY0A5EU9XMveU0h/r4pZmPxgiJWzPPnzw8ePHjixAnWlRYdHc3+sO3t7X19fVevXk3TdI0aNYKCgjZv3pyWltakSZNiG9y+fXtAQMDWrVvZoevJkydNbxVNPQLAmInk6OiYn59fUFBgYWGBIEh8fHxRH7/pU3w+PygoqFKlSjVr1rxz586cOXMOHjxobW0dFBS0bds2drMEQaAo+vr1a5FI9PLlS3a8/PLlS5Ik2akDY7jM/0UqJyen6IwHACA3N3fHjh27d+9u0KABgiBDhw5lRZmlmKHHHnlubm5+fj5r0MXGxjo4OLBvvTXDqmXLls2bN8/Kylq3bt2oUaMaNWrEPZZLBojAuBwt/Co+eBTD/roWFv3kr+z0lF+njFw2ZtCqn39IfP4oFbV/YtsTtapm78r3GRYksZSbMVBWWJ/y7T207j3Q3Lv/1h5ahSldsJbBwZowp79aO+cyhrHWHGPM2LAVW7fxbNi36ndtvUNsJSJje0WmsDodAgy0NlVT3LtUFIZhsrKybt++fa+Qhw8fUhSFYdirV6+USuXJkyfPnj1rMnNCQ0PPnDnj7OyMYVi9evXOnDnDDtyKbVMikSQmJubm5qampq5evTojI4PdAkmSJkFhGMZgMFAU1aBBg7y8vB07dhQUFNy4cePw4cNvznJAY8MiI+zLsWPHhoWF3b59u1+/frdv3/79998NhVy/fv3169cuLi6hoaEzZsx4+PDh5cuXd+3axTAMTdMWFhZmZmYHDhzIz8+PjIw8cuQIa/FBCNlpXwwz1mSOj49XKpVhYWG///47uzsrK6vc3Nw7d+6kpaWxs64Gg4Gm6fr162u12o0bNxYUFNy/f3/Xrl2dO3dmbb2ihp7BYAAA5OTkhIWF5eXlSSQSf39/DMMYhuFst5IhR01mqPQlHcD7dmiSDG3S0qtqMPP/qXEAgI2TK2AMWVB2idemJrjqYHHv1PJOovOp2nMPEQJ9a21bgEBV2BXczl7gaP/m+JSGdCXKOpjvfA48wirY4LTQuUaLcJGrwr6qjZe3ha3A+AxgqDeiZBiESdO8cpFWxcDbf0ouLi4ikWjcuHGsJSUQCHbu3DlmzJh58+atXbvW0dGxe/fu7u7u7MpNmzYNCQlp1aoVgiBBQUF169Zt1aoVj1fcdh40aND48ePbtm0rlUr9/f27dOnCGj6VKlUyjUwVCgU7YWpmZrZ27dr58+efOHHC2tq6b9++CoWi2AbFYnFISIhYLGZf1qtXr2fPnmfPnp05c+bixYu3bNmyefNmoxsLxxcuXOjh4bF06dLp06ePGTPG1ta2WbNm169fxzCMIIhp06ZNmTLlu+++c3V1bdeuHbtBkUgUFBTE4/FkMtnUqVPXrFmzc+dOa2vrAQMGsKNOOzu7UaNGbd68ef369atXr7a3t69WrRqEUKFQbNy4ceHChZcuXaIoauDAgX369EEQxMHBwc/Pjz1UFEUDAwMtLCx0Ot2GDRvS0tKEQqHBYFiwYIG5uTmXRV8yPEjOf5pe8DVmSwspHAcUVRxjtDd7KRljnSEmkHngrb2K0GjugZeqP+4YO+a9TXohRRHu7mZ9e2GFTbOKvYtD9LI8bYL+EAKZr90UvpSgGRoBQIgLqlr7+ls5uSisCGNR5HdWZIcIxAGvpk1Xc4Fx0PQmWq22aGwXOzeKomhCQoJSqfT09GRtLolEwq6Qk5Mjk8nYoI28vDxBIW9uVqPRxMTEmJmZOTg45ObmyuVyFEULCgp4PB67PkmSKpVKoVCwllpubm5ycrKrqyuPx9Pr9VLpv4bSFEUplUqpVGqaTtUWYm5uzobmxcbG4jju5OTEChbDMCiKKpVKkUg0efLk169f//7776zC5uTkpKSkuLi4CAQCrVYrk8nYjbNHiCBIUlJSXl6eh4cHhmFFj0SlUmk0GjMzMwihRqMxSbBWq339+rVcLjd5+rRaLUmSrCcRQpifny8SiXg8nkajSUpK0uv1jo6OrG5y6lYCGCjmyuusDNXbW159fQrHTKg386Kq7iKBGPL/jFfujkAgZcyTf3NlihI1qC//rlnhT/VfNwOKAB0P9MH3x1Jp5dt8g8ZfLA0Aaiu29rN0qWbnaS4UoADQhSPT90NDykdRx8+sPlJhuHDhwrZt27y9vZ8/f/706dNff/21YcOGSNmDU7cSIF2lD3+dRTEfXYP3y2FsWQBQB5hcU3dWgOQVnE5W7rkNNToEf0OkGAYhCFm3LuLKlYrm1bPgKLFH+myh9rgQeUsIaDmAgUajF0dxJ5l9sK23h7mtQihgF37gFiDCSAnL+vb93zU4LX9kZWWFhYWlpKRIpdLatWubxollDU7dSoBHKfmPUgvKiOFWFArBrUBuDcNFMypWfSs3f2sEnZMP8OJRSAhNA3Mz8wH9eZYWxRxwOESjhcpR2NEUMgtH3vjgt0xhgxpazpe5yu1C7P2d5WZ8HPsoXfu7KCdgcAytZdNDTvw9dOIoI5Tn4cbXgYHwK+UnfDw4QmVB+TV+6xQ8QFzbTPFTXdzeChreyEDAMCY7R3nxEk1RxeYfaMB4UBZVoQNdXkqGsOG4DIQyvrShc43eAc26VarvaWGBowjF0B8sbRDHGB4OGIjqdRbXohx/v533pY+c42PhbLfPJUulvxSd9QmtYb4aDILyUCaAvONL3jLE6nLW3iCjUwCv+DAK0rT4u2byhvXfNN/uy/N/0O9iIF325xYAaqwZYLypGWgKZWH7NiDQGPwJGMxRZlPJyqOqjauET6DgfZMGxTcOIDDqGmBocVwGkZGruP9a9CwFKHWwppvFnsGhYn65Mm+/dSqKp+DLkVKgoximbNpuLCjCkAy4j9fQoZIq7uGWP9fLXn3T8CQB8P/lSgMoqr12ne/iInB3hUWy62nA+GvkfgKnR4aYMj04BcbIGHWsVvlCjfJQmZ+Yb8szWpwAUcdr8p4VQIAE1qncsHo1DzNbEYHTxkHoBwkbAAyBAQZiBhIrUJnfesFPyBTFZRLZSgbDIAaMzszXWcpXGcpqTsWDLThKEU7dPgvjFL6mMMep7IqbEVAY4P0YBKgFimCH81ZT62etvKW/FwuKhsIBwGg0BafPYH164TKpcbahEIggAhrrAKo+QF6X3dulsPRd8tH0vLsFAgc+pKAh22Df0QbgMONids5ZZZVQT4Rm7i14GDLTVdLa0WD474JrAEAUQB6GKzWSF+n81GzzG8/xzAJUTwGaYXCMNj0dMAAyCnTPUws4dStTlN3b9ZtAbaBVBroM223/7lmHULHQUcNvX938gtW4mtmbeNprL40TfabcQBynkpJUYZcV7dsaF/7fawEZKoS0c+fZxenTCGOxuDIHioHsyPycW3meY1ykPmLaQGtzDQiKyID86dmYroMa9Z3QgqHotZP/OLotPLiJD4Zh7/DJQAyFGIpSNKBIcUyGIvIVLz1X9Dod6EhIYBAAdoXiHwMA3InP7RHKNQMsQ3Dq9lkU6Cil3lh8BvlGMDaggRZXiPY1LS7bjsZyJHzNhadGM+3/E74Aw7T37hPOzpKQINP4lEagMymrgbnGomllcXYBGNMIciLzzGsoAA9kReYqHOSVvTyrWHm7SSxjFDFCEQ/HAAVRHp/g8f+pY1FkA0YXNIZCHAhScgQp2eKXyYq7MUCtQ/WkMboGR+G/x/HFwVFwOzZbS9JCoiyqf8WEU7fPIk9HUgzEy14syHtAEVoNBdewZiEyhetAiClEyj/uITSFsAaJsZIOo7pwkbC14Ts6/C1wAIGUrhMW+Cf9gIJkGZxbYEioTdKTGlofZxDhwpj8hDojK4cEutCQGTi1zf7V5xNephn0dFpc1qDpbQkCoyh23A1xDKIAM5CoQS9/ECN+kshPyREkZUOjEYcVetw+7CeCApCar4vOUAU4yL/wd+X4UDh1+3QggmSodN+UshWZZ4BYBKitUsj8e1zF5IL8nRGMXg9YgcNQmJ9fcPa8eZ+eKI8wNmc11kQCHmpBsNjjhu4pUcbmFhjIUDTNGBiZVjRl2yAXd8szO2/uXnQiuL6Hlb1Zdno+ZfQeGC02vY7My1RCiKAoQ6CApkWxqYL0HPnd16JXqYiBRg0UxNAPVbR/ARADzdyNy+HUrezAqdunQ9JMjsZY+wX5BimcZ2CiQGWlQBLS6qK5jJ+99gqi0yNsrC+Ok9HRyvCr8mbNjAPTwjAxgiFa037XkOLVwUoLY8gHZHAUd5DaVXHxyLHIqdHY38vXBgEgqLHvyd03Yp+m4gS+Z9nZobPbf9cjFAXw0K+Xtsz9s3Itfz1tf/2ZIClTEJtB5KgZwmjBGeNy34iT+VBAYULes7R3dn7i+Ppw6vbpFOhIA1UGvVAfCjBKFv0acdMI2tdsetVSjGevCmfy1KAwWwtgmObGLcLeQRxQiR2fQoaqSTtW5rk+0cfxSjXriK3hIcbFbmYOgTbeHhbWQgK/E+Sal61CADDOCegpvY4SSgRqpZYmKRsnBYagBSoJLXbNSr+w8KCLipHoDMZINxyjBSWUYwYRJD5boyNpAed6Kxtw6vbp5OsoaCzT/W2DI1QatAoHzUNriywFWPbycCYz32jBFZYiVJ2/wHN0wBXywkBYaGHg18Ccn4L40jpaqjDXXYwLqtr7+Vs7OcssMaywGyaG1G1ddf20wxcO3vEMcDi47qKltahSoIOBwiwcLPetvn7tmXNmluHO/jDcMSBbJwTo26c+PwcMRdMKdGn5OlfLv0sJcZQuXK7Cp3M/Oe9ZurIsx/F+OAyCClGqGnrX6cmVnDXXyeg0pNAAgSTJqxJg3rkTIHAEQhSCJCnZk9qqYwxfc24BFpZ4AgC1l9j4WblVs3FTCIWFaQb/r+FhrPAErp96eP5ABENTdvZ2dXu1Qs08XyTLw67GpocfJguyAEAEVg6K2t0JhQ1kSr7BKISQwNCdA0PreFqW+MY5PgFO3T6dazFZ8bkl33O+tICFCUsBaJRXbFj+2qu6RwmAMOY0QQAkLZrL6taGhR3vIYpOk4af0dz9OoNTNq2dQAlnuUOwnZeHua2MLyhscVC0xLYxYgMAjEHwvFzRzSg8RWuZmiOITadQFBJE4dynOg8BKCaSG3Xti1Ub1hrodb2CugQ7fqHtc3wU3Mj0EzFQjJYsVyW5AQIZCB7QVdWeioCJYmzzVXX4U8DDAYTqi5cIBzuBqyukaZzBWpFeF7GHkPmyJS3Zwt8KgcLNzK66nb+jXM7DjDU8KIb6J+sTGM0lkpS8SsEzc8zvvBbEZKAkjekMNIaSf0eoFZppqLCw2OEnNej7cABAEnL+6SvMUbpw6vaJ6ChGRzHf6ITpuwAIxBD6pcFFa9+h2iiZTIgXnHkEeBii06nOXiB698SlEoYiA2n7AML5vv71lzDfjDMdxrxdVMGXVbPx87d2sJOYAZRhGIYy6pQxO8qYx86gBoqXm29x4wUvOUsUk4HlaYy5BCiACKDeMvX5VbpDoCiIz9EaWy6Uq/viW4VTt09ER9JakiqXNzGG0ImktVLRpuYouVwhzD8YCXCMjI839tBq3xYARKbH6hEef6FxJZu3wOoajhJucocAG4/K1s4SHg8BkGYoYz11ADFj1ieRqxLFZ/CTMs1vvMByVKieBMa4EIwpqanPzwFFQFyWmmIggZXHO+Nbg1O3T0RHMSQNy43TrRgYQufT4qu8RqHfmyl4eMG+CASgurt3NU5ObIZWG6bSb8gNDaJDS2JwSkMagYCHE/6W7lWsXT3MbYWFNTxoSBkVDUdJClAGaXSq/N5rXmquKDYDISkGx43GJo6VIccxiiJJuVqKZog3GhVzfH04dftEdNS3HOr2AaAIo2V419HQwMFSO7lEtf0Ko9arL4URdrZ8B3srHWwtC96nDucD4rNbhUJLobmXhWOIra+NVIKjKANpGlLGHCkoTMoSpOZKniXI7scBnYHN+mRwDOGVAUvtraj1VL6WFPI4dSt9OHX7RIxON6ScgxrjMMB9g59n52E+QqFm60VDRqbyzDm8T08eIWygdzqGiahPCg2BENKQxgBuJbIMtvPztrC3lkgRhEJR41klSUyvU9x9LX6exE/OFiTnMigKjSHGH5z1WVoABNAQZqv1tvK3NLLi+MqU7ZulDKMj6bKXS/6FEraQl6SruuWwAAtrsPp3/fMXyqvXFU0aBzIO1Qjnm/rnH2W+FTrXaAEudJfZBtv6eVlYi/nGVqEoSpEG8asUXkauIuKlIDbTOBotHPv/U0btm4CBMFP1T4t1jlKEU7dPAUJEXwFsNxZj/iWkkihrXc3egRIzwdJtmrCrhJOjzC+gKc/3NvraGBL3AUrPtgoV4UI/G88qNs6uZlZiHmqgEJ2ByMk3v/Gcn5orfJ2G52vZrE9jtMcnZ32WGgBhGJit+rupO0fp8s3dPmUE+E1nmH4CGKSz9JKIyh0D5ltLZi1RHT3Ot7L+zsF7C3oti857j7oVdjgwdpK2k9j4WDgH23laSvhCXJBZwHsWL0jJMr/2HC3QoLq/pz5LLOuztKAhzNVwtluZgFO3T4FBjOVuymCZsy8KhjAqPX7PoaHfXKHV/IUFp89a9OrR2ixoi+qCAKDvaRXqLLMPcfD0t3IW4yKdQfgkRhYZTWTmiaLTjesYU1rL2NTnJwOM6oZoDOUqzPvbhVO3TwIaH9FIxQNFIGlAHtnV9pi3yHnJAt3V6/VbVvoDl6lpNVqke2Rhq1BKypN6mNmH2Ht7mDll5olfxIofJ0ruxQCSQnUkLGzFgpQ/IIS6N3sqcpQGnLp9IhVR20x1k0jylbySfuI8j50b/KO1gT6ul+lHfARlw3ExFMiFokCbSh4KZ0ue170YwcVIXlIWPyWX+bssx2eUUSv7QGicTy/to+AwUn7vsi9MBa8+gNFkotxN9f2EoDNHW6tcbvJe0LQBRzE3c3sveYAE8dJr7Y895MdmQsO3OfX5yUAE0ZKc7VYm4NTtE6nY4mYEpalckVVEix4er27aIZFAonAS1MjKco9KMnuVhhRojdlRqLHH6Dc49fkZGEfl/y/LxFG6VKT7rkTh7t9CgaM1IumzgMb+0ZYnnzDPKYHOYMx1JzCkglhqbwKAMZe+tI+Cw0iJFietMBg7JpX5Ds1fB8AwACN00CVHiekpY7IBD6/gFTIAVrG/f9mBU7dPBHLW2/8BCCITocYakaV9JGUEnCsQUjbg1O1TAMbuvCinbywMhGZivkJEMIW9ASs4wNhggVO3MgGnbp8CAAiPez7/HwgRhZCQCwkuDoK9N7ieWGUETt0+BYAgBGoM7yrtAykTMBCK+LiQj1fwKBnWIYsCIBNwk3VlAk7dPg1A4Jzt9g84hsoEBHdGjL8oAOTCijphXMbg1O1TAAAhSrYX5jcOhNDBXIihFf6cQGN5Xtm3XgmgvFDhb8dPhYehFX0YVgSIIHZyIW5s2VLR4Wy3sgOnbp8ID+PmTP+BgYhCTBjDvCr8OUFRYCHhl/ZRcBjh1O0TEfM4260oUMjDRcYquxUaiEACBbYyrux4mYBTt09ESODcQOwfIELgqKOZkKnY06YQImYinpjPRYSUCTh1+0T4OMrHucHp30AEwQBiKxNw6uZoJuKiecsInLp9lrpxIW8mUBRViHkVW9yMoX8OZgJu7riMwF2GT0SAY3ysXFTLLslsU4IwKn7FhWagl5WEs9zKCJy6fSIYCriRafFsUxHPTFhxs02Nw3MMuFmKS/tAOP6GU7dPR8rHuVI3JiA02m5yIQErsL5bSfhcn+ayA6dun465iODqFP4r25TABXyswmabMgy0lvKtpZy6lRU4dft0zEU8DOGCQv4Bx4BCVBjTWyGhIWIrF1hJuVDesgKnbp+OiIcZI5s4efs/DISOZiLcWD2lIoIiiJeVlEtALjtU9ODyzwEAYCHi5WnJEmzbDFAjAKAMTTHM3wXTAAAY/k/qIsPQDE2zQRgo9s8VLPoRFgzHAQAURX2dJjcQQWzlQgwFVMWbWIAIwifQYBez0j4Qjn/g1O3TAYWD01dZ6pJzvkFVfm7Cq+d5WekelarZOLlChkFRLC8r49m9WzqtBhQ2eHfxruTuXxUAkJYY++rhXZqmEQgZhvYPqW3r4s4KX6H2YY8jr+m02krVa/MFwq/gDmMgIhcRxrPxJZpOAAAAavwW8N9VMo0PAwyBDGTof62NYQgCjAv/vT5AjX0f3lz+mUAI+The1Ulegtvk+Ew4dfssZAKch4ESsVQwHM9IStg0Z3xBTk5WWlKvMdMd3LxIgx4niMToZ9vmT/GqEoTiOAIhhhHulariBPH49o1D6xZ7BQQV/lyhjZObvbsXq24Ej/fk9s21U0ZKFeaTf90tFElo+is02YQCHiYTEJkqQ8mKG8AJxqCj1LkoIUQF/4RcAIyg1TlkbiomscAVtghNFi5FEQQaMuOhXoNbOGECCWQKvzsACEAN2QlQryEsnQFPhLDLSwIGIu7WYhsuw7QswanbZyHjExIenqcj0c/2pTM0LVGY9R0/GwCwec4EijT88xbDyC2tJhpFSkQaSJoi2REoTZLuvgFTN+xHMYw0GGiKpAzGTwGAqpXKk7s2eVcNyU5L+WqTmBAaSxY7mgnTlfrPPyF/AwDCMHnX9+vi/mI0+SK/+vLa3QsH2hCguOb1nfxre41fkKGlwa0lVb8zGlGkPvfydn3SU4DjCM43azBA4OQPGRoyTP713droOwiKoQKpedOhPCvnf1t8nw5FM9VdzTmnW5mCuxifhYiHmYuIElEPCKFAKPKoVM3a3qmoN41Fr9FEXjx169yJjKR4YEr0QUFedubNs3/evXw2PzvT9CkMx0/v2WxmZV2nZYevYrL9A4YCa7mgZPUUIgzKE4m8a6MCCZWX/vdSgFLq3Jxz64XuwbZ9Fstqdsm7ukuf/BLliZT3T2pf37VoPdqm1yKBvU/Opc20Og/gPM3TcNXjMPPmI2x7LkCF0tywrZAylFR3QgJDa7mbl8imOEoKTt0+FxupoKSypo1tzElDoR79Sx0wDMN5vEt/7Nm3esHin/pFXDiJ40Yh4/H4qoL8C7/v3L5w2pJR/V5F3cdwnODxXz68e//qxY7fjwJooaPqK4KiQF5Ccv83EAKAyap3kFXvgMmtTWIEUFSf9ARghKRKM5QQiH3rYFIrfWIUhIw2/qHAtZrAsTJKCGShHamcFEN6DMAIzctbQpdqAteqqFAir9GRzE4wZCca3XCfDUUzrpZiHxvZ52+KowThRqafi61UQGCogWa+UJgXadB7BgT/svskXySCDPxj4/LdS2f5B9eUKixqNG0d2qQVXyDU6zQbZo7du2Le9M0HSYPq2NbVzXsMcPGtHPP0EQAoweMbzb2SGYH9N3Ihj0+gDCzJeQXIOtSKqiZADWmvMbEcFZsZR5cA5du4G9KiEZoCAEUY2ljgAADjdItWSeWl0ZoCWpXDd/Q3Bt0yNG5mT+u1dEEGYufz+YdHMdDXVupiIfr8TXGUIJzt9rkIjYNT3pczkYyTcUKhWK7AcUIkkdRv0wUBIOn1K4ACoVgiksowHDeztGnapV/ss0ekQf/k9s0XD+/FPovavmBq+InfczJSj21bk54Qi36VwhWFvU155iLel882BQypQVACGGNljEIGeCLGoDXW0XQP1sbe17yKoFU5+TcPIQBhKD2k9AhDozwBK5EAxQCKQYr8fA2GhcPS6q7mJeZq5CghONvtcwEIYi/jp+RrS8RWwQnCaGoBlB1j0hRJ0zSKGcemDENjBFGQm6XXaUVSKQIhWhjOhjAQYFhOegpfKAIAmFvb1m/ThaYpraqANOghw+i1WtroO/8avz0IEamQkAqJ9AL9l94VigsRhoI0aRxdQsgYdIAQQJqWBLak1bn5V3cjEBLWbpjMGiUEKM5DUIwx6P7+NEMDhgYYUTJfWYA387P5/E1xlCycupUAlmK+AEcNNPych7cx7JY0XLt4OiX2VXpS3F/XLtEkWTm0roOHd/jxQwU5WU5efrkZaWf2bvMOCHb09CEN+tN7topkMitbx6SYV6f3bm7UoQdfIHT3D/CqGowgECd4V//8PTMlsfvIiebWdmSRSdgvBwOhkMAEBFv5ruT0tDDCmQ3pABgOjSF+DM/aVRMdwWiUuNwK0iSZFS90DwIYjkBg1uR7Oj/TOCw16LSv7xIWTqhQiorkZE4yghk7E5IFWQjBQ6UWyL/jnz8BimGCnC1dLLjSIGUOTt1KADMhYSnmJeXrsM8bmzAQJr1+nhj93C+4JoTw+YM7zt7+LhjO4wue3YuIirgKABrapOV33ftjGE5DBGDYvSsXKNKA40S7QSMbtusOCyNLaFrLxosorG2C638HUMwY8fu1wDBgIRGgIL8Et0krsxmtktGpAGYwpMegQikmNuM7VYZ6rfpJmDSknS72AZWdKGg4AAGA0ahoVTYmtYR6VW7YVr69N8/WA9K00LNGQcTv+sTHhLlDwZ1jPAtnnoXT36FwnwGESKsAO66cQhkEVNiKDiXLq0zV7cS8z7/FCT4fRU1V+SFlMNA0jRPGWUidWoXzeHyBkCQNsNDiIHh8iiL1Wg1fKMJxgiINxa4mimE4QZB6/de8yhgK7sVkH7ydWELGmzHPLf/mIfWTK4y2wBjLJ5BKqjaVhXYGAKifX8+7theTmNHKHElgS1lIGwRgZGZc1skVKCFgdErc3NGs8fe4wsY4z0BTuZe26JOfoXwxZGjzZj/w7H2Qz4uYoWhorxDsHVzDy0ZaAt+Vo0Th1K1k0FH06WfpOupLzZwW5iEB4xTDv6+XceHblpciKAqSs9Trw6JJBpbU2WBIHaQMxowr41dlAM5DicKsABSj1blUTgoms8LlVkY7qjDQl1Ll0vkZqEBCmDsgGI6wIbuFljWZncToNTzjWFUCPzsYUE/SnYIcf+0ZaLwQHGUMbmRaMghwzFEufJmp+lIdQ96hX4V5l2VF11gghDJjb1Oj5paU5w3lCRFe0XiL/39rhsZEClxsVpiuYPKgAVxqScisjL4/xpjGYDoyBAGEpRMwPtSZz5c2CBE+gbWras9JW9mEiwgpMZwUQhzjyr0Z4ROYmYgoyZY6bPL8P/8X2TKbP18sJZ5daNS7YsdgFMHC9Uvg2GgG+thIG/pYff6mOL4EnLqVGJZfKc6rrAMhgqOoo7nws2cjyzokw3QMdODjXPfSMgqnbiUGgaGuZiJujGKcWADAWiYo3+0QKRq6WYibcmFuZRhO3UoSFzORVICXMT9YKYCiQCYs0WzTsgcNYSNfK3crLsyt7MKpW0nCx1EvC0n5tlk+BIggchFPbOwgg5RLIETMRES/mq5c9lVZhlO3EsZJIZTxcaa8/qw/ItuUUIh45fU8GGjmO39bPzuuKEiZhlO3EkbCx13MKnqtCGPqJZ8nFZTPwSnDQIWI6BXqVNoHwvEfcOpW8nhYioU4Wi5/2B9RiZNA/59tWt4gGdjY17qaM9cgpqzDqVvJI+bhHpYSpjz+sD8cgBqnTcufW4op9LgNr+/B44qMl3k+8QrpdLqvlvqTk5MTHh5ubFv3bwwGg0ajUavVWq0xabxM4WEhlgsqtPetsLepEEfLW3gzSdEdqjlUduB6X5VTdbt69WrlypW3bt2KfBWePn06bNiwYhJGUdTgwYPr1KnTokWLhg0bDhs27OXLl1/oAAwGw4oVK2JjYz/8IxI+7m1ZodOqIYJYSvlfKi+tlCBpxslcNKiOW2kfCMcXU7f9+/drNJodO3YYCjswFYWmaZIsLBL9b0jSWIXxQzYOIdTpdEVXNnYbeMNwgxA+e/asXr16y5Yt++WXX6KiosaMGVN0NYPB8NYjMRRW3Si2kKKoN78L24zKYDDodLrVq1fHxMQU5nr+bYuwy9/zRdwtRBbld9LwP4EQSoUEioJyM0A3ZudD2C3EydNa8tV2StN00UHSu25UCOGHF7liCvnwY/iojX/bWfQxMTE3b95csWLFkiVLrl271qRJEwRBMjMz165d6+vre/r06aSkpK5duw4aNEgoFEZGRoaFhdna2v75559arXbEiBHt27dHEOS3337j8Xi9e/dGECQ7O3v58uUjRoxwdHQ8derUnj17lEoljuO9evXq1q0bu9O3ZikDAHx8fGrUqIEgiFKp7NGjh16vx3E8Ozt78+bN165dAwC0a9euX79+QqHwxo0b4eHhCoXi/PnzNE2PHDmyefPmrOzu2rXrzz//NBgMtWvX/umnn8zMzNLS0jZu3Ojn53f48GGFQmFlZZWTk7Nq1ar9+/f37ds3MDBw7dq1N2/eRFHU1tZ22rRprq6ubx4egaGV7WQ3YrONhdiQigifwKwk/MRcjbGG0bcPRTOV7OVD6rm/a4WCgoKwsLB79+4ZDAYfH58mTZq4uLiwbz179iwsLCw2NlYul9esWbNOnToikejGjRsvX74kSZLH43l5edWsWRMzdpj+B7VaPXPmzI4dO9atW1ev1+/Zs+fPP/+0trZev349j8czrUaS5OzZszt37hwUFPQhX2Tz5s1ZWVnTp0//wC+u1Wpnz579/fffe3t7I+XbdgsLC+PxeF27dg0MDNy/fz+7UKPRLFu2bP/+/T179vz+++/nzp17+fJlBEHi4+PnzZt3586dYcOGNWzYcOzYsS9evEAQ5MqVKzdu3GA/q1KpDhw4kJOTw/7dqVOnGTNmdOzYce7cueHh4e8/GIPBwDAMSZL37t1zdHTEcRxCOHr06Js3b44bN27EiBFbtmzZvn07giCxsbFz5859+PDhTz/91KhRo0GDBt29exdBkE2bNs2bN69Hjx5jx449ceLElClT2Nt027Ztv/76a8eOHfv379+gQQOpVFqnTp327du7ubnt2bPn5MmTEyZM+Pnnn+vXr/+ex6CdTOCoEFbMzNPCbFPgaFZOsk0ZCHk4+lNjL7nw7cXK4+LiunfvPnPmTI1GIxKJDhw4MHr06OzsbARB9u7d27Zt21OnTsnl8uzs7LFjx+7evRtBkNWrV0+ZMiUiIuLw4cPdu3efO3duMV82hPDWrVupqakIgjx+/HjhwoWDBg364Ycf2I5oJv7888/bt297eXl94HexsLCwtbX98O8uFAoFAsGqVauQ8m27MQyze/fuvn37YhjWv3//ESNGxMXFubq6QgjFYvH48eMbNmyIIMj58+evXbvWqlUrBEHc3NymTJni5OTUvHnzffv2PXr0yMfHBy+E3aax3QePx1pn3bt3T09Pj4+P9/LysrOzO378eIMGDd51MAKBYNOmTeHh4cmFbNu2jc/nP378+MaNG7t27QoKCgIAxMfH79ixY8SIEcY0KReXKVOmuLq6NmnS5MaNG0eOHKlcufKhQ4eGDx/eq1cvBEGkUmnfvn2jo6N5PJ5QKBwzZkznzp3ZZ6NcLm/QoEGtWrUQBElJSRGLxV5eXo6Oju8/XRgAAbbyDJVBQ9IVcIINRYGljF/CJchLCZJmOlRzahVg99Z3IYQTJ07UaDSXL1+2sLBgh5APHz7EMOyvv/4aO3bs3LlzhwwZwppmKSkpGRkZhecHbdq06fbt2yGEv/3224wZM7p161apUiWlUnn9+nWDwVCpUiWBQIBhWFZW1unTp1lhsra2LtoAiCTJPXv2tGrVSio1+nkTEhJomgYA3L1719raun79+iqV6urVqwzD1KlTx8zMGMUSGhpqctrExcU9ePCAoih7e/vAwECRyBiqmZmZeefOHbVa7eTkFBwcTBBEp06d+vXrl5yc7ODggJRXdYuKinr8+HGbNm3OnDmjVquTk5OvXr3q6urKMIyVlZWNzd8ZxWZmZhqNhvUaWFtbs9ebpmmRSPSm14DVNfbf9evX796929nZWSqVJiQkuLu/cxTA3kA1atRo06ZNXFzcli1b2IVPnjzJz8+fNWsWQRAoiubk5BgMxoq1NE07OjqaHllBQUEPHjxITU0tKCgw2fMBAQFqtTo1NdXFxYXH4/n7+7PL9Xo9wzB6/d9tUPr37x8REdG6dWsHB4e2bdsOHjy46DChGDIBXtlGeicx79v/gX80KACSchHQSzHQXi4c3cQLf8ckSVJS0oULF3bv3s3e6sbfFY4HBwcjCHL69GlLS8vvv//eNOq0L4TVRHYhAKB69eo6na6goCAvL+/7779PSEjw9PTUaDQJCQkCgSAxMTEsLCw7O3vdunXNmjUbPHiwadfR0dEvXrxYuHAh+5J1s3h7eyuVyqioqIEDB+bn58fExLx69apq1aobNmyQyWTbt29PS0vbtGnTvXv3hg8fbm9vL5FIsrOz58yZExoaGhkZOXr0aLFYbG1tnZ2dvWbNGl9fX39/f2tr67NnzxbddXlTt3379olEovDw8LCwMAzDnJ2d9+/f369fP1abTHY1hLDo46WovW3yoJkGdBqNBkJIEER8fPzq1as3bNhQr149giD69Onz1mmBYurWtWtX9uWYMWPq168vk8ns7Ox+/fVXOzs79u7hG2t5G5sWazQanU4nEBhruubk5MjlcplMxuPx2EExOyDFcVwoFEJjh+B/3cdFv5GXl9f58+ejo6MvXrz4yy+/8Pn8QYMGvec4PSzFGSpDbI66nE0g/icQQczEPKkA15HMtxv3xg6xJ3zn42H1zsmEv/76y8zMzMPD443Pwtu3b9epU6fYWJIFAJCVlfXy5UuVSrV8+XJHR0cfH589e/a8evUqPDxcJpMdOHCAdRNXq1ZtxIgRCxYs2Lp1q1AoLLqR6OhokiRNnl+VSpWdnT19+nQfHx921LJp06bFixenpqbWr1///v37DRs2VKvVSqUSQZBjx445OjoeOXKEda7hOK7RaCZNmlS9evXly5cTBKFWq//fF5zn6Oh469atb0vdPmLAlJ6efvbs2WnTph0/fvzPQjZs2PDo0aMnT56gKFp0csc0KVNstsW0jpub2+PHj/Pz87Va7b59+woKClgTSa/XKxQKDMOioqJYz9275kzZrZlmLQcMGEAQxObNmxs0aEBR1OnTp8VisZmZGYZh6enp7OWJioq6cOECSZJJSUlHjx5t2LChhYWFr6/vnj17VCqVwWDYuHGjk5OTn58fO69q+joYhqEompSUpFarDQZDQkKCSqXy9vYePnx4QEBAfHz8f5xiAKrYySS8Clc7xJixJCQUYuKbnjjWU0ybKnYdA983IqNpmr1J3voWQbzdVcfj8a5fv967d++BAwempaWtWbPG3Nz83Llz3bp1UygUKIo2btzYz8+PJEkAAEEYyx3zeLw3Zx5wHDctZBgmJCTEz88PRdEqVap4eHiw2mpvb29mZmYaEbOHWrly5Xv37k2YMOHkyZMMwxAE8ezZs9jY2FGjRrHOIolEwloDxiAniSQ/vyQ7AZUt2+2vv/6CEHbt2hVFUXYsFhISUqtWrVOnTvXv39/W1tZ0FdlrgyCISCSytrY22UE2NjbswL5fv35nzpxp1aoV60dgH3peXl6dO3fu379/pUqVSJL09fVlh7p8Pt/Ozq6YMQUAsLGxYX0NCIJYWVkNGzbsxIkTQ4YMWb9+/axZs86dO2dpaZmamtqsWbNp06YxDOPg4HDo0KE//vjj5cuXTZs27dixI4Igs2fP/uGHH9q1a8fn87OzsxctWiQWi9nJUNPXEQqFQ4cOXbVq1datW8eOHfvq1as//vjD1dVVqVRCCHv06PGfp04qwKvayyIScsuDC+qDgQiUCAkpn4BQ+41+b4pmPK3EU1r6CYj3laj09vbOzs5OSUnx8flXZ3sAgJ+f39WrV9/6KYPB0Lx5882bN6MoKhKJcBxnGEalUsnlf4cK8/l8diRhGgC9GUJPEATDMEWXm/wkAAA+n88aXwzDvCm+3bt3F4vFR44cWbp06dSpU/fv389GdLHuueKngqLeJdPlQd0CAwMPHTpk8iyw53HFihUURVlYWGzatMnZ2ZldPnz4cPaPBg0aBAQEsPKPYdiqVausrIxlmp2dnY8ePfrgwQOZTFatWrXExEQnJycAwMKFCzt16pSfn1+1alUMw9iRaeXKlbdt28bKogkMw9asWaNQKExLBg8e3LBhQwBAkyZNAgMDHzx4oNPprK2tfX19Weeru7v7mjVroqKihEJhzZo12Uvl7u5+5MiRu3fvGgyGgIAA1iHi6Oi4YcMG09dBEGTcuHHt27fPzs52c3OrX79+nTp1srKyhEJhtWrVzM3NP+TsOZuL0pT619kVaHxa2HYAFRDYN2q5MRDycWxiCx8Hxb8Gg2/i4+Pj6+u7c+fOBg0amEQkIyNDLpe3atVq06ZNYWFhjRs3ZpcbDIacnBxbW1sIIZ/PL3oPoyjq7+9/584d9mViYmJCQkIxY60YNjY2NE2rVCo+n88uKap08L/aCbUpRK/Xt27deu/evSNHjjQzM7t+/XqHDh2KrZmRkVGpUiWkvKqbdSHFFpokgBURFtPEilkh7N8AgKKT1tbW1mzEGfvoY//g8Xh16tQptguxWFx042/dGmthVa5cmf3b3NycDcQzQdO0RqOxtrb+7rvvim1KKpU2atSo6BI+n1/sIWx0nxXC/s0G2X0UGADVHOV5OjJbY/jMtqffEAABdgrBo6Rv8vuSNBzZyL1d1f+eJWSf3P369evcuXOXLl3YSM8XL16wrpIxY8YMKCQwMFCtVu/du7dly5ajRo16q1u5T58+Xbt2Xb58uY+Pz759+zIzM9lRC03Tpnmtovj7+9va2t64caNdu3ashWXaLFM4FWZSN71ez7qJTOvs3r07KyvL399fpVJlZGR4e3vb29v36tVr4sSJeXl5NjY20dHRbdq0cXNzS05Ojo+PnzhxIvJNUVF6Yvn7+3fq1Kl02+IJcSzEUXE9NtsYIFIxBI6BxtlGHEVpWGLd/74OBopp6mc9stGHBpGFhoaeOHHi0KFDBw8eZBjG29t70qRJlpaWAIBZs2bVrFnz6NGjW7ZsEYlELVu27NKlC4IgHTp0eNMuq1Wr1s6dO7ds2XL//v1WrVrVrFmTjRzw8fEZNGjQm+ubm5s3bNjw+PHjrLo1atTI5B2ztbUdNGgQaxuiKDpw4EA/Pz92HdbT7eTkFBYWdvPmTYIgxo4d2717dwRBJk6c6OzsfOrUKZIkXVxcZDJjDbtbt25JpdIPjBYuO3D9TL82cTmaiPjcclka6E1QADLytavPvyRp+A3puYFivG2k2/uHuL97nvRdsF6wtw4nKYrCMOxD2gMam7YyzPvHpCaSk5MHDx68bNky09jloyBJ8s0pEXY+kPXZGQyGAQMGdOnSpVOnTsg3BadupcBfKflP0goqgvkGAKLV04tOPtOR9LfydSkGSvn4xj7BDby/mVZ+T58+tbCwMAWcliwGg+Hx48eVKlUyufa+FTh1KwUoBkbE58Tlasq9Aw4AhKbhlsvRMVnqb0LNaQh5GLqgY0D3EK707jdPBUwQKn1wFAQ7KqzEfLq8P1ogRDAU2BuTbZFvpAoIMrKRZ5eg/8ix4/gm4NStdBASWC0Xcwth+e/ujKHAQsov+5WKYWGL0l6hTqMae1WcqJ3yDadupYZMgNd0NZMaS/gi5RhjyLsQL/tqYaDotlXtprfy56St3MCpW2liJuTVdrGQ8LBvOlfp/UAEmov5cmGZzscyUEzLyrZLOleRvaPAEce3CKdupYylhBfqYsbH0fJqwTEMIhcSheqGlE10JN3Ix3ppl6oyASdt5QpO3UofO6mglou5kEDLsnXzWdmmfFwiMBYWRcoeBppp5GO9qns1C/E3Fu7A8Z9w6lYmcJAL67iai3nl0AcHIcIjMCHvgwJTvyawsP5Hc3+bNT0DraSctJVDOHUrK9hIBXXdLBTCcihwRvk2E5Upb31hLD7sGGi/pnuglYSTtvIJp25lCEsxr66rhbmIKGdxcKZs0zLyrWgIKQb2CHVa1KmqlJtGKL9w6la2kAuJum4W9lIBXY5MOAgRcwnPaLqVge9EM5CPoeOaei/uVEUmqChVJComnLqVOaR8vLarubuF2JiNXQbk4POBCBQLcAIv/ZuNpBmpAJ/fMWBcM58yNVLm+BKU/g3H8SYCYyaDWZCDAsdAeZhIhQiBow4KYel+Fz3FeFhJNvYJ7h7i9C3kvHJ8Lpy6lVGMRattpLVczCU8/FsfpUJjai1qJy81dWMg1FNMY1/r7f2r1/f6Zip/cHwmnN+hTOOkEMoE+N3E3DSlAXzLLd1RYHS9lYq4UQwU4OhPjTxGNPIQ87gbvgLBXeyyjlxA1HWzfJJW8DJLRTPwm6gj9CYAAKkA/8oVnyBE9BTtZime3MK3fbVvqc0wR4nAqds3AB9HgxwVtlLBo9T8rG+zLYMx21TCV4iJfC35dQSaYiAGkA7V7Ce39HO1EH+FPXKUNTh1+2awlwvMRMTjtILXWWoKwm9L4xgGkQkJmZDI1ZBfeq6SgZCkGXu5cExT767Bju9v1sdRjuHU7VtCSGDVnczsZYKHKfm5WmMTX/ANBYXwcTEfKwxy+YJHTdIMD0fbVXEc3cTLy+bvdrccFRNO3b49HORCMyHxKkv9MkulpxjU6NRCvoVsU1TM/4KJARQDGQYGOMhHNvZsWckOx8r8SeH4wnDq9k0i4uFV7eUuZqJn6cqEPC3JMGV/oMpAxMlMeP8LjEsZCA0U42gm7BXq8n1dN65GGwcLp27fMAohUcvV3CVf+zRdmaEyQKRMz6hCCG3lAqxEe5sadY1mzEW8ttXtB9Zx9bU1Nt/k4GDh1O2bx14utJUKYnI0r7NV2WoDREDZTDGCEFFI+CiK0FQJeN4Kpw6gXIi387MfWs+9iqOxJzEHR1E4dSsPoCjwtBQ7KYRJ+dpXmepcrcEYGVfGDDl2YkFIYAaK/JzAZNa/JhcSTXyte9d0qelm/g34HTlKA07dyg98HPWwELuaixLzNLHZ2nSVnqKZMqRxECEw4GgmytPkf4K4Qfj3ONTVXNzEz7p3DWd/O3mZ+W4cZRFO3cobGACuZmInuShDpU/I1Sbla/U0wxQmOZSuFkBj9z/UVi54lJSHfYy8UQw0li3CUR8baYdq9s38bH1suVAPjv+GU7fyCYYCO5nATiYIMMgS8zVJebocjcEYPlKqGocCRCH+oGzTwsbJRlFjIOKgEIS6WbStYt/Qx0rIheZyfDCcupVzRDzMx0rqaSnJURuS8nVJeRq1gaYLK8d9faVjs01xDLwrohciCE1DimFwDJUK8EAnRavKdkHOZv723GQox0fDqVuFAAPASsK3kvAD7KTZakNagT5LY8jXkRoDbSw98rVUjoHGbFNzES9HYzDtkzXl2PQpHENdLEReNpIabhYtKtk4mYvxsjkBzPEtwKlbxQJHURupwKawsnm+jszWGNKU+iyV3kBDpnAkWGhhGc26L7F3BiIyAS4VEhlKPQDG3aEA8HGUh6MuFuJaHhY13cy9rKUeVmJuGpTj8+HUrYKCocBcxDMX8TwtJRTNKPVUtsaQqyEL9JTGQKkNNMUYY24LRYb95xODOExONqONBhk+geEYEPMxRzORg0LoZS0JdDar4ii3lwt5ZaA0OUd5ApST0v0cJQTFQHWhumlJ2viHnlLpaRVJk7SxsC7b6cF4x0Djf8XvnSIKCABAC3WxcOBrtBnFPEzKx+VCIkepJzBgJxM6mAm55gYcXw5O3Tj+AwYaJy51JK0haQPNUDQ00DRJG91kJMNQjHEmtNDKM0qZ8e9CLePjqADHBATg45gARzEURb/YgJeD461w6sbBwVE+4TwdHBwc5ZOvN6vAGYkcHBUEUDZcEF9D3XQ6XU5Ojk6nYxjmK+yOg4OjFAEACIVCc3NzgUBQzv1uJEkmJCRACKVSKYpyA2EOjnIOhLCgoABBEFdXVxwvzZizL75vlUpFkqS7uzuPx/vS++Lg4CgLSKXSxMREpVJpZmZWiofxxY0pkiQJguCkjYOj4sDj8QiCMBgMpXsYX2moyE0pcHBwfGU4RxhHWYQppLSPguPbhsszraCQJHnnzp3IyEiVSmVra1u9evVq1aq9Z32DwZCdnW1lZfUV/MQQwqlTp/r4+AwcOPBL74ujHMPZbhWRjIyMPn36dO7c+cSJEy9evNi+fXuHDh127tz5no+8ePGiT58+qampX+cI8/Ly1Gr119kXR3mFs90qHDqd7qeffrp9+/aRI0dCQ0MxDCNJ8vr16yblIkkyOTmZoigXFxeC+Ls3aHp6+sOHDzMzMxUKBUEQplCm9PT0goICR0dHoVBYdC+pqakajcbNzY21+4qGPiUnJ2u1Wjc3Nwz7u9AuSZI0TQsEgrS0NK1W6+LismzZMtO7LElJSXq93s3NrWhckUajSU5OxnHc1ta22AFwcHDqVuF4+PDhuXPn1q5dW6tWLXYJQRCNGjVi/7569eovv/ySk5NDUZS1tfXPP//crFkzlUo1d+5clUr1008/iUSiZs2aTZw4MT8/f9GiRZcvX9bpdObm5mPGjGnXrh0rVStXrjx06BCEMDg42MbGRqvVLlmyBEXRrKysGTNm3L17lyRJOzu76dOn16lTB0GQI0eOhIWFOTs7nzhxQiAQnD59evbs2T4+PkOGDEEQJD4+ftasWU+ePKEoytHRcfbs2cHBwQiCHD9+fMWKFfn5+SiKWlparlmzxsfHp1RPLUcZA35h0tPTo6OjjW1LOMoGq1at4vF4WVlZb3331q1b27dvj4+Pf/369ahRo9zc3DIzM2ma3rFjh6Wl5eHDh+/evRsbG8swzIABA6pUqXLx4sWkpKR58+Y5ODhERUVBCLdv3y6Xy/fs2ZOSkrJ69WqxWNygQQOGYQwGQ58+fby8vC5evPjy5cs+ffq4ubm9evUKQrh8+XIEQXr06HH9+vUHDx4YDIZ69er9/PPPEMK8vLyGDRu2aNHi7t270dHR33//fVBQUFZWVlpaWkBAwJQpU5KSkmJjYw8dOhQbG/vVzyXH26EoKiYmJi0tDZYqnLpVOKZNm2ZnZ6fT6d6zTmZmZkJCwq1bt7y9vY8cOQIhjIyMtLe3j46OZleIiYmxtLQ8deoUwzAURWm12vr160+ZMgVC2KRJk+HDh5s21apVq3r16kEInz596uTktG/fPnZ5Xl6elZXV+vXrIYQrVqxwcHB4/vw5+xZN002aNGG3dvz4cQsLi9jYWLqQrKwsW1vbEydOxMXFOTk57dmzh6KoL3m2OL5hdeNGphUOsVisVqspiuLz+W++++jRo6lTpyYnJ0ulUoZh0tLSsrKyEGMzF9r0Lzu81Wq1y5Yt27x5M8MwOI6/evXKy8sLQZDHjx/36dPHtMGAgIDbt28jCJKYmJibm8sORREEkclkgYGBjx49Yjfr4uLi4ODw5vE8ffq0oKBg9OjR7EsIoVKpTElJad26df/+/ceOHbts2bJmzZq1atWqYcOGX+aEcXyrcOpW4QgICNDpdA8fPqxdu3axt0iSHDt2rJWV1b59+8zNzXNycnr06EFRlGmFIq1eoFgs7t27t5OTExuqPXz4cCcnJ4qiBAKBVqs1fUSj0bArGOtXAlB0ayRJmuJLjMUv31ZYAkJoYWExbNgwdjIBADBq1Cg/Pz8AwNy5c1u1ahUVFXXixInt27fv2LGjTZs2JX22OL5hOHWrcNSoUaNy5cqLFi3at2+fRCJhF+bm5qakpHh6et6/f3/btm1+fn4Igrx8+TIhIYEVIFZcTLZbjRo1SJIUCATfffdd0Y1DCBs2bHjkyJFhw4YBAJRKZXh4uEKhQBDEw8PD0tLy3Llzw4cPRxAkLS3t3r17bETbe1JZgoKCNBqNo6NjQEBA0eUMw6AoWquQoUOH1q9f/48//uDUjaMonLpVOKysrJYuXdqvX78WLVp07NjRwcEhOjr61KlTrVq1mjFjRu3atRcsWIBhWE5Ozu7du9VqNZsz4OTkZGNjM3Xq1Jo1a1apUqVFixYjR46cPHlybGxscHBwXl7erVu32rZt26xZs6FDh3bt2rVz587Vq1e/d+9efn6+nZ0dhNDFxaVLly7z58+nadrW1nbdunV+fn6sOFIUpdfrix6kXq8nSRJBkDp16rRp06Zbt27Dhg3z9fVNSkp68ODBqFGjAAArV64MCQlxcXF5+vRpbGzsoEGDSu+kcpRFOHWriDRu3Dg8PPy33347d+4cwzAikahz585Dhw5FEGTNmjXz5s379ddfFQrF8OHDGzRo4OHhgSCIvb39+vXrd+3aFRkZKZMZeyfPnj3bz8/v0KFD4eHhfD7fxcWFjW6rXbv2mTNnNmzY8OzZs969e1tZWcXHx7MDz/nz59vb2586dYqm6YCAgPHjx9vY2CAIUqVKFYPBUHSU2rJlS3a/YrF4y5YtGzduvHDhwsmTJwUCQWBgoJWVFUVRQqHw8OHDBoNBKBTOnj17wIABpX1eOcoWX7y+W0ZGhlKpdHd3LyPlOjmKQtM0qw7Flmu12g8PjtVoNEKh0HR92UlMNgw4IyOjadOmHTp0mDt3rml9hmFIknzrnMZ/7kgkEn3IQo7ShabphIQEkUjEPr1KC852q9BgGPZWFfuouP9i4hIfHz969GiFQiEWi8PDw62srIYNG1Z0BRRFP0Ha3tzRexZycHDqxlHyODo6jhs3LioqSqvVNmnSpHHjxpaWlqV9UBwVEW5kysHBUT5HplyNEA4OjvIJp24cHBzlE07dODg4yiecunFwcJRPOHX7ekAIuV4BHBzlOSJEQ9KZKj1aQlOoEEFQgDjIhB+4veTk5MjIyNDQUEdHR+Trcvfu3d27d0+dOtXW1rbocp1Od+nSJb1ezwbBurm5Va5c+StMMev1+oKCAjMzs9JtqftFgRkZiFJpvEVKBAYiUimwtn7/WgaDISIigq2gh2GYs7NztWrV3tOqnKbpnJwcqVT6Oc3b8/LyIISl2z+0rFEKt3WWyhAWnYWX0A0HEYRAQdeqDviHycHSpUtXr149ZsyYlStXIl+XlJSUs2fPjho1qtjy7Ozs9u3bOzg4WFtb5+fn6/X6Hj16LFq06EsL3P3795csWbJ27dqvL/RfDebBA/jiOVJS8k1RwMcXa978/Wvl5eWNHDkyMTHR09NTqVQWFBR07tx54cKFppoFxcjIyPipkAYNGnzyoa1YsUKlUq1YseKTt1D+KIWRKQAIjoKS/f8Dd52dnf3nn382a9bs6tWrycnJpuUGg4GtzJOcnJyUlFT0Izqdjs0uio2Nzc/PNy0vlvjNvjQFDxoMhvhCim4KRVGCIN6lWcuWLbtx48bDhw+HDx++dOlStiYaC4QwLi6uaMcWCCG7d/bA8vLyim3NYDDExMRkZma++V0YhomLi8vJyWFbJWRnZ2u1WjZlHUGQnJyc6Ojor9Yd5ouDYQhBlOT//+728C5QFB05cuSNGzf++uuvxYsX//rrr2fOnGHfSklJef36ddEiUXl5eQ8fPkxNTdVqtUVvqoKCgtevXyuVStMShmHYi5ifnx8TE2MqJ8UwzPPnz589e6bX6zUajamUS1JS0uvXr9+8PSoI5XZI8lb+/PNPkUi0ePHitm3bXrt2rUePHuzyZcuW5eTkmJubHz9+XK/XN2/efObMmSKRSKfT9e7du0WLFuHh4U+fPuXz+ePHj+/SpQuCIOfOnTtw4MD27dvZhMqTJ0+eP39+0aJFMpnsjz/+2Lx5c25uLsMwTk5Os2fPfn8zPTZvnFcIgiDt2rVbsWLFX3/9VaNGDQRBrl+/vmTJErY3SkhIyLx588zNzZVK5bRp05ycnB48ePDy5Usejzdy5MjevXuzWztz5szKlSuzsrJ4PF7z5s1//vlniURCkuTgwYNr1aoVERHx9OnTunXrvnjxIiMjY+TIkWKxuE+fPr169VqxYsXRo0e1Wi2fz69cufK6devYQ+L4BAiCYM9ez549x44d++zZsxcvXkybNi05OVmn08nl8mHDhrHl8+bPn5+amrp48eKdO3dWrVp1wYIFEMJff/318OHDSqVSKpUOGDCArYASGRm5aNGiLl26/Pbbb9nZ2Y6OjsuWLfPz8zt69Oj169dpmu7UqROO44sXL5bL5RMnTnzx4gVFURKJZMiQIX379kUqGBVI3QwGw8GDB2vVqhUYGNiyZcudO3d2796dtaSePXt24MCBCRMmbN269fHjx4MHD65cuXKfPn1omr506dLDhw/nzZs3bdq0tWvXjhgxokGDBlZWVklJSdeuXTPNEiQmJt66dYu1gHAcHzx4cGhoaEFBwbx580aNGnXy5Em2rsZ7MKVe3rx5My8vj62w9vDhw969e3fp0mXJkiXZ2dljx479+eeft2zZQpJkeHh4SkrKwoUL2UptP/74o52dXePGjR89etSvX7+uXbuuW7fuyZMnw4cPJ0lywYIFDMNERERcvHhxxowZ48ePxzDs+vXrL168GDVqlLOzs6ura1hY2MKFCzdv3lyrVq309HS2ai7HJ2Pq6RUTE5OXl2dd6K1r1KhR48aNBQLB3r17x40b5+/vHxAQ0Lt375s3b/bs2bNhw4ZSqRQAsHz58rVr1y5ZsqRWrVrnzp2bNm2ajY1N69ats7Kyjh8/DiGcOXOmUCgcPnz4tGnTDh06VL9+/apVq2o0mrlz57LP1GnTpr18+XLTpk1WVlZRUVGfltj7rVOB1O1xIdOnT0cQpHv37j179oyOjmaLZTMMExQUNGfOHB6PV7ly5UOHDl29erVPnz4oijIMM3To0J49eyIIMm7cuHPnzt2+fbt169YYhhW9Y9iXrFZ26NCBHeIJBIIJEyZ06NDh8ePHbxbCNQEAwHF8zpw5mNy5VgAALpJJREFU27Zty8/Pf/z48bhx49iGVYcOHbKzs1u0aBGO4wCA2bNnjxo1Ki4uztLSEgDQunVrtmvUlClTLly48McffzRu3Hj37t1OTk5LliyRSCReXl4JCQm//PLLtGnTeDweiqKdO3ceOXIku9/09HSRSBQSEsJWLrp8+TJFUdWrV7cvJDAw8KtclvIJiqJnz56laTo/P//cuXOenp5NmjTx8vLy8fFRKpUqlapv376nTp06ceJElSpVKlWqJBaL/f39Q0NDEQRRq9Xr1q2bOHFijx492NsvPDx8165drVu3Zp0bc+fOZUcDo0ePXrZsWVpamqOjo62tbX5+PtstDEGQuLg4d3f3SpUq8Xi8cuxXfT8VSN1OnToFIVQoFC9evBCLxWZmZrt372Yr80AInZ2dTaMwOzs7tpkAO4np6+vLLhcKhTKZrKj37a1cu3Zt9uzZeXl5bKWN3NxclUr1/o9ACB0dHf39/RMSEh4+fOjq6koQBE3T9+7dS0tL69atG+vRU6vVBQUFWVlZ1tbWPB6vevXqpi3Ur1//7NmzrIh7eXmZHNjVqlVjnYDe3t40TRf9CE3TbIMP9mWdOnXq1q1bvXr1wMDAZs2adejQga2wxvFpZGVlPXz4EEXRTp06DRw40M3NLTk5edq0aQ8fPhQKhQRBvHjxom7duqYLYXKWJSQkpKenHzx4MCwsjC1B/OjRI/ZaAADEYrG3tze7ppWVFU3TrAuPbcxk2vuwYcNGjRrl7+9ft27dFi1atG7dWiqVIhWMiqJuer3+4MGDGo2GtcIAAGlpaRcuXBg/frxcLi9W1B9CaHoJQPFCA+xbbNOdon0GjD14cDwnJ2fChAlBQUGjR4+Wy+V5eXmhoaHvL1XA3tkDBw5s1aoVgiCrV6+ePHlyw4YNfX19aZquXLnysGHD2FsfACAUCn19fdkhcNEeBRRFsUMhAIDpd8Le9AzDsG9BCIvGJRQ7KrbFVERExP3797dv3/7bb79dunSpdLOgv10YhunXr9+UKVOKLly4cOGLFy+2bt1qa2tLEESXLl0MBoPp3aJ3IIZhbdq0qVKlCnuNAABsFBHDMAAAkz/E9O6bV7NFixanTp26c+fOzZs3hw8f3r9//xUrVrwnKqVcUlHU7eLFi5mZmTt27KhUqRJJkhiGxcfHd+3a9datWy1atPiEDcpksuzsbIPBwFp8d+7cYTebkJCQmpo6YMAA1uK7detWsZra78J0ow8cOHDPnj2LFi3asWNHvXr1Dhw40KRJk2Ihaeyub9y4MWbMGPamP3/+fL169RAEqV69+pEjR3Jzc9nQpxs3bigUCldX1zcVliAIiqKK3vFmZmYtC+nUqVOTJk1u3rzZsWPHTzg5HEUvKAtFUbdv3+7QoQM7eIwrJCQk5M2eFa6urra2tgaDoWXLlh++OwzDij7VEATxKqRXr14BAQGTJk1auHDhR5XtKweUgrpBiFBMiZVdggjyn/EgDMNs3rzZy8urdevW7BQngiDehezevbtFixaGQkzrGwwGkyQVnV+HEOp0OtZiqlq1qlQqHTlyZJcuXSIiIi5dumRhYUHTtLOzs729/cyZMydMmBATE7Nnzx6SJNmHLTuIeFNl2OGhaS8ymezHH38cOXLkiBEjBg0adODAgXbt2vXv39/CwuLx48fZ2dmTJk1CUVQgENy4cWPGjBkNGjQ4cuRIYmJi9+7dEQTp37//nj17Bg8ePGTIkGfPnrGWIJ/P1+v1Wq22qLnn5+enUql++eWXqlWr1qtXLz09/fTp082bN5dIJMePH8cwrEqVKsi3Dk0jRb7y50JRxg3+F+x9YgqyYcEwrG7dups3b/b29kZR9MCBA4mJieyNYWtr6+DgsHLlypiYGHd3944dO04tRKVSNWrUiCTJW7du+fr69uvXj6ZpU48x0x3FbiQ0NHTBggVz5syxtbVt0aLFzp07BQJBSEiIWq3et29fo0aNKuD0dymom5iHeViISyp63HjfvL1X3D/k5+e7ubn16tXLJG2sPT9t2rRTp06xTquiP/uaNWuynjIMw3r27Ons7MwuF4lEbdu2ZX3wvr6+GzZsWL169apVq0JDQxcuXPjy5UsMw8Ri8a+//rpgwYLFixdbWlrOnDnz4MGD9vb27NCvQ4cOb7o/RCJRjx49THthYwhu3LgRExMTGhp66tSp1atXb9u2jW2A0KpVK5FIlJeXh2HY4MGDNRrN4sWLBQLBvn37WJ+0u7v7kSNHVqxYsXz5cjY4oF+/fqyB0KVLF09PT9NeHBwcfvvtt0OHDl2/ft3FxcXJySkjI+PXX3+ladrS0nLXrl3lwO8G7OyMTz/0g4LU/huGBrZ2/7mWQCBo165d1apV/3UkAEyePJmm6Q0bNggEgh49elSpUoX19/P5/JUrV27atOnWrVsajaZ9+/aDBg2ytrbeuXPn3bt3CYKwtrZm2305OTkVvY0dHR07duzITscPGjRIp9NFRES8fv26fv36dnZ2x48fP3/+PIZhwcHBP//8s2kOt+LAVa/8XN5V11+lUr0rNv0TMBgMJEmKxWL2ZVZWVqtWrYYOHfr999+/6wDUarVQKPxYVwvbjKoEj5yjGBqNhs/nf6DWqFQqUyDkJ6BSqQiC+PrhIGWkemVF8bt9Od5V179kBaLYLc6Ofdjh87sOwCSFHwW/kM84Uo7/4KMaQXzmXSSp2E8pTt2+ScRi8fjx44uNfTg4OIrCqds3iUgk6t+/f2kfBQdHmaZixb9wcHBUHDh14+DgKJ9w6sbBwVE+4dSNg4OjfMKpW4nBppoWXVIssfkD33rP9j/hkIpl53B8KzcPxzc5Z5pWoLsTl4OVVLICRHAMNPG1+cANPnz48M6dO3l5eebm5sHBwVWqVDGFGefl5d24cePVq1cAAHd391q1allaWjIMc/v27bS0NDbc397evmrVqkVzHv4+CggXLFjg6urKlpDMyMhgQ8+9vLzYnIGiKz979mzHjh0zZ8788JC0qKiojRs3Tpky5aOq2dA0PX/+/KZNm9apUwepkBju3aeSkgBeMmH6kKJxR0decNB/rskwzM2bNx8+fKjVam1sbNg6bu8KyqUoas6cOZUrV2Zz6Ti+YXW7E5fTY3OEmF8yu2YgI+ETT+e0EPH+4w5Wq9XTp08/cuSIhYUFW44mLS1t/PjxP/30E4IgV65cmTx5cnJycuXKlXEcf/r0qYuLy+bNm93d3SdNmnT37l1fX1+2AFHz5s2XLVtmYWFRdOMQwsuXLwcFBbHqtmbNmiNHjkyZMsXGxqZYtgCEcP78+dbW1h8V1anRaF6/fv2BCfkmcByXSqUzZ848e/bsm4pcEShYs1az/wAQlUz2ONRoRT17WO787f2rkSQ5c+bMrVu3+vn52djYvHr1CsOw/fv3myoXFd8shAkJCcV6CXF8k+qGoUDMx/9TjD4QBqIfsikI4ezZs3cV0qxZMx6PR5LkjRs3YmNjEQR5/fp1r1696tSpc/ToURsbGwBAfn7+7t27Tb0LunXrtnHjRoZhLl261L59+9DQ0OHDh7NbTk1NxTCMLbjGptfodLrw8PDOnTu/tdbzs2fPrl+/fuTIEdZmZEeOGIalp6czDGNn93caY1JSklAoNGloSEjI4cOHTTUeIIRJSUkQQisrq6KFHyCEiYmJGIY5ODiwS7p27bpt27awsLDm/9XrpFwC+HwgFpeUuiEABR+QyBEREbF69eodO3Z07twZwzCDwcAWHC26TkJCguky4Ti+YcOGYrlZaWlpJEk6OTmZlrAFXVAUTU1NNdVEKkpGRoZGo7GxsSl6SxgMhpSUFLlcXgHbZVWUaN7MzMz169fPnDmzdevW7BKCIBoWgiDIb7/9RhDEsmXLTOKiUChYm06v1wMATMl6bdq08ff3v3379vDhwzUazbRp065fv87n89laDjiOK5XKSZMmPX78OCMj4/79+3379jV1b2A5dOiQi4tLpUqV2Jfbt2+Pjo4WCAQXL17U6XQdOnQYMmTIwoULIyIiIIQ//vgjG7UbFRW1atWquXPnOjs7379/f/bs2exgWSaTTZ8+nf0Wly5dWrlyZVpaGttlbtOmTebm5k5OTv7+/gcPHqyY6lYqsP1f6tevzwoWj8crarWFhYWtWrUqJSUFwzAfH5/58+c7OTnNmDGjWrVq7OMwISFh3rx5jx8/pijKzc1t9uzZ/v7+CIIsWLBAq9WKxeJTp04ZDIZ27dqx1V/YbkcLFy68e/cuRVFyuXzy5MnNmjVDEOTgwYPbtm1jy0R36NBh9OjRFcqEryizCpcuXeLxeI0aNXrzLYPBEBYWFhQU5OLi8q6Pm56rmZmZaWlp7GNz+vTpx44dmz179saNG1NTU8PCwlAUFYvFgwcPdnZ2rl+//tSpU4s5vCiKunHjRuXKlU25nK9evVqyZIlKpVq7du3gwYNXrVrVr18/c3PzrVu3fvfdd9OmTXv8+DFb0O3y5ctqtZokySlTpuA4/ttvv+3du/eHH35gR7g3btxgy5ls2bJl06ZNDRo0MNU4rFWrVlRUVE5OTomeUY534uvra2lpOXTo0BMnTjx69Kho+6vbt2/37NnTxsbGdJnYHt4REREvX75knb/9+/dPTExcvnz5tm3bUBQdOnQoe+0ePny4fPlyjUazcePGH3/8cdGiRSdPnmTHCj179rx9+/asWbP2798/YMAA1nY7fPjw6NGjmzdvvn///rFjx65atWrLli1IRaKi2G6pqalmZmYKheLNtwoKCtRq9bu89QAADMNu3bq1YMEClUp15coVgiC6deuWmZl59uzZCRMmsMbg0qVLjx49ytaJDg4OVigUbm5ub/ry8/Pzc3NzXV1dTUtQFPXw8FiwYAGfzw8MDNy3bx+EcNasWQiCeHh4bNiw4cWLF5UrV0ZRlC0sodfrMzIyOnbs6Ofnh6Io2xcCQZBdu3Z5eXmtW7eOHfAW7cLl5uaWl5eXkZFhbm5eQqeT430EBARs27Zt7ty5Xbp0sba2dnJyGjlyZK9evRAEWb9+vaenp6nZGHuZ2Bqo7NTTlStXHj9+/ODBA/aGXLVqVbVq1SIiIlq1agUhrF69+pw5cwiCqFq16oEDB65fv965c+crV648e/bs9OnTbFl59pagKGrz5s3t2rUbP348hNDLy+vVq1fbt28fMmRIxTHfKoq6CQQCfSFvvsX6y4p2jSwGiqJ5eXn37t2jabpGjRobN26sUqXKrVu3cnJyTPqlUCiqVq3KOtHYMvkm06koJEnSNF107oxhGF9fX3YJAEAmk7m7u7NvYRgmkUjUarVpZZqmJRLJgAEDFi1adOTIkSZNmjRv3rxp06bsw79z585vLTPF4/EoiipWTJHjywEAaNeuXcuWLePj4yMiIvbv39+nTx+xWNy2bdtXr17VrFnzrZOn7LWLiopSKpWmlt4QQrbzLPvS3d3dpE0ODg5si4+bN296eHiYun+wpKamJiYmpqamdunShaZpDMOSkpJSUlJIkuTUrbxRs2bN9PT0169fBwQEFHtLKpV6eXk9ffpUq9W+WZoZQkiSZMuWLTds2FDsrWIdDD4ksozP5+M4XnSo8tZODqaFxcrts4wePbp27dp//fXX2bNnu3Xrtnjx4qFDh7Ltu966U61WWypFvio4BEF4FtKlS5dq1aqdPHmyVatWKIq+/z5hGMba2nrgwIGm6z5kyBBTMZhi3T/Y6Xj20r/16tetW7d169ZsMB2KohKJRCAQIBWGiuJ3q1KlSo0aNVatWlVQUGBaqNVqnz17BgDo37//kydPDh48WPQjr1+/zsrKYj1uRSv3sri5uVlYWFy5coV9mZmZ+ddff/1nSUKFQmFnZ/fixYvP/DrVq1cfMmTI4cOHW7duvW/fPgBAw4YNjx8//lYD7cmTJ9bW1qZZVI4vjVKpLPoAY7s1YhhGEERAQMD169fffLyZHmZBQUH5+fmVKlVq839atWr1/mvXqFGj6OjoYv1n7ezsXFxccnNzW7du3aZNm7Zt27Zu3bpBgwYVqnFMKdhuNAM1BrqkCvUyEH5IHC+O4ytXruzRo0fz5s27du3q6emZmJh4+PDh4ODgpUuXfvfdd0OHDp00adLNmzcbN26M4/jNmzdv3Lixdu3a0NBQnU5XrAMIWwu/c+fOK1euVCgUjo6O27ZtUyqVJnF5s6w+CwCgcePGBw4cKCgoYAtGF+3hwE7RFt2XqRMCW0EfAJCTk7NkyRJPT08/P7/k5OT79++3a9cOQZABAwYcOXKkbyEYhkVERIwYMcLa2hpCeOfOnZCQkE8rZvmtAw0GqNGU2NY0GvjGnfAmERERc+bMad26deXKlVUq1dGjRxMTEzt16oQgyMiRI1u3bt23b9+BAweiKBoVFdW1a1cXFxfTDdOwYcNGjRp17Njxp59+8vHxSUxMvH///vfff+/r66vX64sOKvV6Peuqq127dr169YYPHz5u3DhPT8/IyMjAwMCmTZuOGzeub9++Q4cO7dy5M47jkZGRUqn0xx9/rDgCVwrq5qAQdg9x4uMlc4oZBApw7EMELjQ09MqVK5s2bTp16hRJkkKhsFatWmzYGo7jK1asaNKkya5du9jIIwsLi8mTJ4eEhFAU1bx587fOOcyYMUMoFO7du5fH47Vo0aJy5cqmppPNmzd/cwjM0q1btzVr1ty/f58N4wgODra2tjaNOBo3bmyKY8IwrFOnTqwbztbWtkOHDjKZTCAQ8Pn8w4cP63Q6Pp/fo0ePn3/+me1ic+zYsVWrVi1fvhzDMFdXV3Yo+uzZs5cvX86ZMwepkPBr1TSe2ZJqmGIw8GrV/M+1/Pz8atSocfXq1XPnzgEArK2tjx49yoZo+Pv7Hzt2bOXKlcuWLcMwzNfXVyQSoSj63XffsUFCUql0165dq1atOnToEHuXBgYGsmGPDRo0KOo5qVOnDqtTBEHs3Llz7dq1+/btYxhGIpHUrGk8yGbNmv3xxx+bNm1avHgxiqJyubxv374VR9oqaF8FkiQ1Go1UKn3rlVYqlWxgxwduTavVshOaH34AkydPTk1N3b59+yc38mAYpqCgQCwWv+khViqVGIaxYSIQwhkzZsTGxu7evbtC3dZlhIKCAraR0CfcZu+/S98KO2/GjgmKolQqAQBfswo511eh1CAIQi6Xv+vdj23Z/Qk9IseNG3fkyBGdTvfJo0UURd8a3VLs+GmadnV1HTRoECdtpcKbQvPht9n779KP6okhrXhd6Cuu7cbBwVERbDfukc7BwVE+4dSNg4OjfMKpGwcHR/mEUzcODo7yCaduHBwc5RNO3coKpV5Z/9P2znUDKMvAin11SiHeTUepsvVJaAkJK0QgClAbkQd47wYZhrlx44atra2pZFBZY8+ePUlJSVOmTCm2PCkpKSoqiq07IhKJ/P39TSU2SxCKoqZOndqskA8PTw0PDz99+vSUKVPeFXxX+hTEQV0uAkroKQ4ZIDBDZK7/vSKEERERjx490ul01tbWfn5+lSpV+srFOcLDw8+dOzdp0qSPjZt7EwhhQUEBn8//tpLwS0HdcnRJN9MP4GjJJMdABPIAr4XLGPy9dzBFUUOHDu3Spcu8efOQMsnt27efPHnyprqdO3duxIgRbm5uAoEgJyfHzMxs/vz5bdq0Kdm9Mwxz7NgxJyen96vbvHnzHBwcxowZw77Mzs5+/vx5Wa6tBOMvwNQIBCuhTCzagNjVBAFD3r8W2wVm06ZNnp6e1tbWr1+/FggEe/fufVdfhS9EdHT0yZMnf/rpp89XN5VKNWbMmNatW3fp0gX5digFdQMAxVEeDkrmOQYRiH3wpt5lqGdlZWk0Gjs7O9PTlaIoDMNMEchsWUrT32y2wJvbSU9PJ0nSwcGhaBUjhmEwDCNJMi0tzcbGplhtr9zcXK1Wa29vz+fz3/pspyjKycnp8OHDHh4eeXl5ffv2HT9+fJMmTUw5Enq9Pj093cLColjmg06ny8zMtLW1JQiCrfD15sEXfWnqC8GiVCpzc3MVCoUp4J6iqMePH5sS+zEMY6uYFX2eFxQU5OXl2dvbm9qAmc6AVqvNzs62t7cveuoYhklJSUFR1MbG5pPz0t4HiiMYv8TUDQHGDf4XERERK1as2LZtW5cuXdi+CjExMWyuqKkYUV5enlqtfrP4h0ajycrKsra2ftNKSk1NZYt/vGu/KSkpbAEl9h7DCquS8Pl8tVqdl5f3UftKTk7m8/mmXhA6ne6vv/6qUqUKO4ZgfxoQwuTkZACAjY1Nsa5vZYSyeExfCFBIsYUxMTHTp09PSkrSarUymWz48OHs02n9+vXp6enz589HEGT37t179uxZsmRJ1apVNRpNv379xo8fX6tWraLbuXPnzsKFC1l1s7Cw+Pnnnxs3bowgSGJi4rRp0xo3bnzy5Mn4+HgzM7N58+axSc4Mw2zYsGHPnj0AgHr16rHdZ9565CiKCgqxtbXtV0h+fj6rbrt3796xY0dBQYFIJOrdu/fQoUPZj5w9e3bx4sVqtdrFxaVZs2b37t2bMWOGo6PjkiVLDAbDzJkz2dXWrVuXn58/ffr0omeGJMmff/45KiqqoKBAIBC0atVq3LhxfD5/06ZN9+/ff/78eVxcHI/H2759+717944ePTpv3jwzMzOapletWnXs2DGdTmdmZjZ69Gi2avGDBw82bNgQGhp67Nix9PR0BweHBQsWsBnjV69eXbx4cVZWFgDAwsJi4cKFVapUQb59UlJSNBpNo0aN2N88n8/38/Nj3zp//vyJEyfc3d1PnDihUqkqV648b948tkYDTdObN28+dOiQWq2WSqVDhgwxdeSIjIxcunRpUlISAMDe3n716tXFyjpERUXNmTMnKSmJzbuaMWNG/fr12Ttnz549J06cyM3N9fb2XrhwIVten63c+/vvv7P7Gjp0qKnZILuvxMREHMdr1qw5e/ZsiUSydOnS2NjYbdu2Xb582d3dfcGCBQ8fPpw/f35mZiYAQKFQLFy4MDAwECljVPRZBa1WGxISsnz58h07djRs2HDUqFGRkZEIgkgkkmPHjrFPyyNHjpw/f/7q1asIgty7dy8iIuLN/FCtVtusWbN169Zt3rzZ09Nz+PDhr1+/Zh+PBw4cWLduXY8ePX799VeCIIYPH87WONq7d+/06dMHDhzIptMfO3bsXdmgrLqxP4Dw8HBbW1s2c3DHjh2TJk3q1KnTrl27+vbtO2fOnAMHDrCCMnDgwGrVqu3YsaNjx45Lly49efKkprAQ0P379+/evWvaclRU1L1794rtjqZpa2vradOm7dmzZ/jw4WvXrt2xYweCIE2bNvX09AwJCZkwYcLo0aOlUmlCQsKVK1d0Oh2CICtWrFi4cGHfvn23bdtWpUqV/v37X79+nTVOt2/fvn///h9++GHlypXp6ekTJ05kGEav1w8fPtzR0XH79u1btmzp2LHju9p9fnP4+PhYWFgMHz789OnTjx8/LlrhKi0tbd26dRcuXJg7d+6yZcseP348dOhQ1oJmT+CAAQN27drVpk2bcePGXbp0CUGQR48edenSRSAQrFy5cv369Y0aNSpW/5Km6Z9//pmm6Y0bN+7YsaNXr15sDQUejxcVFXX58uUJEyYsWrTo7t27CxYsYIcvK1asWLRoEbuvVq1ajR07NiwsjN1Xjx49bG1tN23aNGvWrLCwsEmTJiEI0q5dOzs7uyZNmowfP75v374Mw4wYMcLGxmb79u2siVo2a6NWINvtrVQqRKfT6fX6ESNGHD9+PDw8vEaNGs2aNZs8eXJMTAxBEOnp6QMHDrx8+fJPP/0UFhbm6elZrMozgiD1C9FoNAaDYfLkyX/++eedO3c8PDzYFm0TJkzo2rUrgiBTpkxp3759UlKSm5vbjh07evTowVpbc+bMMclEMTAMS0lJGTFihEQiSUxMjImJWb16tVgsJklyzZo1Q4YM+fHHH9mqOw8ePNizZ0/37t1Pnz5tZma2dOlSHMf9/f2fP3++a9cu1jrj8XhFi7gSBPGmpggEgqlTp1IUpVar27Vrd//+/aNHjw4ZMsTHx8fGxsbFxYWt3cTKLtvtQaVSHTx4sF+/fuzXWbp06bVr1w4dOlS3bl22JOzUqVObNm3K1kcZMGCARqMBAMTFxU2ePJm1495VMOpbJCAgYMuWLXPmzOnUqZONjY2jo+Po0aO7detmKn8wderUevXqIQiyePHizp07P3/+3MPDY926dZMmTWJboPn6+kZEROzYsaNJkyb79++XyWTbtm1jFeRNE4mm6ZcvX/7www9Vq1YFAJhuTpqm5XL5jBkzgoKM7aXHjx+/cOFCkiQpilq/fv3UqVOL7atx48YHDx60sbFZtWoVa3Xq9foJEyYkJCSwrUL8/PwaNGjAtgaOiYkZNWoUe+1MDd7KGhVd3TIzM2fPnh0ZGYmiKIZhMTEx2dnZCILY29u7uLg8ePCAtbP69u07ZsyY/Pz827dvV61a9U1FiImJmTVr1pMnTwiCAABkZWWxNe8ZhrG0tDS1SpBIJDKZLD8/n6Iotiohu5wgiGrVqkVHR7/1IDEMs7KyksvlycnJQqGQ7f+Wl5f39OlToVD47NkzmqZRFH369KlcLlcqlY8fP65Ro4bJFVKjRo1Dhw59eHAARVErV648fPgwSZICgSAtLc3S0pL1PL61wjWGYcnJyTk5OexoiHUCNGrUKDw8nD0DNjY2pr6ccrkcRVGtVmtlZTVq1Khx48Zt3ry5UaNGrVu3Dg0NLR+lFlAU7dixY+vWrWNiYm7dunXgwIFevXrx+fz27dtTFOXi4sLWAUQQxNPT08HB4f79+zweLz09/ffffw8PD2edpHfu3PHy8qIoKjIyslmzZu8xjng83rhx4xYsWPD77783atSoZcuW9evXx3GcpmlHR0eTu83Kyort0RETE5ORkXHgwIGwsDB2X3fv3vX29qZp+u7duxkZGT179mQYBgBQUFCQlZWVnp5uZWUFITTZjCKRaPTo0RMnTty6dWujRo1atWpVq1atMnjtKrq6LVq06Pr16xs2bLC3t8cwrE+fPiaXeZMmTc6fP5+dnV25cuXAwEAzM7NDhw4lJSUNGVJ8yoxhmClTpmRlZW3atMna2pphGNPwgW2YYFKWoq0SAABFleJd6sOOE2fPnu3o6GgwGNq3b//jjz9evnyZ3Ujjxo1DQkJMK7OdenEcL2oG6vV608aLadNbd3rq1Kk1a9YsWbIkNDRUIBBs2rTpxIkTpvXfehOzC4t9HXagXewjRU/IvHnzWrduffv27XPnzm3YsOG3334r8bngUoTH4/kW0r1792rVqh0/frx9+/ZFb4aiJ4RhGBzHmzdvzj66EATp06ePvb09+/e7OmaY+PHHH2vWrBkZGRkWFtahQ4dly5aZPLBF7z32QrDTAi1atDB5A9l9sS1E/P39+/bta/qUSCTy9vZmp8WLtv6YOXNm8+bN79y5c+7cuY0bN7K+BaSMUbHU7c2Znbt37zZt2rR27drsfN+LFy9q1KjBvlWvXr0tW7YkJib+/PPPCoXC399/7dq1+fn5devWLbaRvLw8dmjAtlyLiYlJTk5+f0k1giBCQkLCwsJ69+7N1h+/f//+u+pwQQhZteLxeLNmzWrevPmRI0c6d+5cqVIlrVbbvn37YuvXrFlzwYIFOTk5bIu/s2fP6nQ69tZUKBRs30xWN+/du2eyI0zcuHHD09OzZ8+e7MuoqCjTd8Fx/M34D9ZGsLKyCg8PZ+tr0zR94cKFt3aPLQqO43ULGTdu3HfffffHH3+UD3VTqVRF2/SwrYLYew/H8bi4uBcvXrDK9fz58+Tk5JCQEBcXF3Nzc4Ig3rya9erVO3DggEajYb1pbwUAEFLIjz/+OGLEiN27dw8dOvStzyGGYTw8PMzMzN66r9q1a584cYKtZV8UdiBS1N+H43idQsaMGdO2bdvff/+dUzcjEGFoSJaUFWuM5kU+aGMURZ0+fbro06xr165BQUFHjx6tV6+eWCzetm1bZmamqUGMj48PQRCvX7+uXLky2/N4w4YNTZs2fbMrqFQqdXd337x5s4eHh0aj2bBhA0VR7K3AMIxWqzU9e9mX7FuDBw8ePny4r69vnTp1fv/997/++ss0sit22Fqt1nTMISEh33333aJFi1q0aDFp0qSRI0diGNayZUsI4c2bNy0tLX/44Yd27dpt2bKlU6dOHTp0iI2NjYyM5PP57BZatWq1f//+X375JTQ09MyZM0+ePDH1qNbpdOx3r1GjxrZt29asWRMSEnL69Onw8HAnJyf244GBgVu2bPH09JRKpb169WIYRqfT0TQtEon69es3a9YsZ2fn6tWr79+/PzU1lZ3yY4/fdAZommadbpmZmbNmzWrYsKGbm1t0dPTTp0/f/FGVAAxlDFIrKWiDcYP/xa1bt+bNm9euXbtKlSqp1erDhw/Hx8evWLGClSGSJNneuBDC6dOnN27c2MvLC0XRiRMnzp07V6PRNGzYUK/X37x508vLq1che/fu7dOnz/fffy8UCiMjI7t37+7m5mbanVarnTRpUnBwsJ+fX1pa2pUrV9q2bcueeZ1OZ7pz2NYcDMOIRKKJEyf+8ssvarXatC8fH58ePXr06dPn4MGDnTp1GjhwoLm5+ePHj9PT08eOHSuVSp2cnHbu3AkAcHJyCgkJWbBgQf369d3d3WNjY//666/x48cjZY9SUDchLnOWBKCgxIKbMAR/f6IC6wpp27ZtdHR00SnC+vXrz549W6PRrFy5UigUtmzZMiAgwDQccHNzGzRokFar9fT0ZMeAHTp06Nat25tGGUEQixcvnjFjxrx586RSac+ePX18fFhfm1wu79ixIxvrhCCIubl5+/btzczMEATp3r07SZLbt28/e/Zs3bp158+f/9ZZBU9Pz7Zt25rKRuM4PnXq1EWLFsXFxXXr1k0ikWzbtm3WrFk4jisUCtaR5+TkdPz48RUrVly7di0oKGjYsGGbNm1iZ11bt249a9aso0ePXrlypVGjRosWLWJn9FAUbdWqFZvI0bFjx1evXh09evT48ePBwcGrV6/+66+/2G89bNgwiqKuXLnC4/HYng8tWrRgY1N+/PFHPp//+++/Hz9+3NLS8tChQ6wla2dn17ZtW1PQnK2tbdeuXfl8PgCAoqht27bpdLr/tXdnMU28WwDAO53pXuHvQkXMRcANAwYIUI1Gbyyi1JhSqcHIPxrTGIqxxIAPigVFHwhBSN2iKLgkENCIiWI1uSyJ8abEEOofX1weCLg8ADa2hWaKTGfmRr9k0itQQBGwPb8nyzJTZ4bTb+Y73zkSiaSgoIB7CjmT/lr17aNvCklqU8J4eX99uxj8W7t2bVJSUltbW3NzM4ZhYWFhTU1NGRkZaJAeHx+v0Wiqq6uHh4dVKpXJZELH9ujRowqFoq6urr29XSAQLFmyJC0tDW3t0aNHlZWVFRUVfD5/+fLlP5SDRuPExsZGj8cjEol0Oh2KNdHR0dzZQVeFTqdDWUdGo1GhUNTX16N9hYWFoTmf2NjYx48fm79jGEYmk2VkZIjFYj6fX15efunSJTSrplQqWZa9desWOnf5+fkGg4E3/0Bt3m9cLteMrDJxOBxyuXxaC24mqoU/3f0SBMHd2KIHwNxt+IEDBwYHBy0WC/fGSJJkWdZ/3XOSJGmanm7Raoqi3G43Ct9TMTo6Ojw8HBISEngthFmWdTqdOI77ntzbt2+jjBC5XE6S5LirCBwOh0AgGNsGATWrnOhSoWna5XJJpdJpXcYOh0MoFI69EtxuN0VR/s+jn3M3T2rzBtdzt4n8+lIVZOp/1ZPWwv+V/dI0feTIEZIko6KiOjo6ent7a2pqfC9BP09wpvUzYwkEgmkdBKFQyA1sAwyGYWMPBU3T6PNs4cKFE111Ex1A/x+BOI6PfWYyqYn2NZUWM/P/3EF0C0AEQej1eqvVarfbtVqtSqUKpGyyP1pycrLRaAzaNi6zDO5MAQAzbJ7cmQb7SiwAQKCC6AYACEwQ3QAAgQmiGwAgMEF0AwAEpjnICBkkB7oHXuIzlD7OsizBJ7b869+438UPDMN0dnYODQ2lpKRwaUEMw9hsNrvdnpqaypUh/d36+/vLysry8/PnbYcHAALDHES37sF/DP/RSwU/kyw6Fs0ycsGC//79QkL426DX6zUajTabraqqqrCwEH2xp6cnOzu7r6/v6dOnarWaNyuGhoYaGhqys7MhugEQaNENx3CpQOo/GE0dwzIS4v+W3U2EoqiVK1daLJbc3FyUit3S0iIQCHAc960w43a7XS7XokWLfFfzcdVjBgcHxWKxb9b4REWBELvdTlGUby18DMOEQqHvYtXPnz+jeuXzs8ApAH+oIHru5vV6NRrNwMBAZ2cnenn37t39+/cvWLAApTSTJJmXl5eZmZmVlbVr165r166hqOf1eo8dO1ZTU1NQULBnzx61Wl1bW4u2abPZ9u7d6/F40Mvu7u7Dhw9//PgR1afX6XR7vtNoNFardexbev/+/cGDB7VarU6n271798OHD2f3kAAQyIIourEsu2zZMpVK1dTUhALTly9f0tPTuYEbRVHh4eEmk+nmzZv79u07c+YMCjcsy1qtVpPJFB4ebjabt2zZcvz48VevXqEmWBaLhSuaZLfbW1tb0WpnVF7GbDZfvnx56dKlBoPhw4cP3JtBw72SkpKenp6Kioqamhq9Xv9zSzsBAMG+zvTb/ANB6HQ6g8EwMjLS2NiYlJS0bt06rhxjaGhoaWkpqkeG1p83NzdnZWVhGIbj+M6dO1EHjdjY2La2tvb29oSEBBzHfW9gUXsXdNep+g71xzt79qxSqezq6oqMjPSNbn19fQkJCZs2bcIwDFWRAwDMlCCKbqhmi1KpjIiIMJvNL168KCkp8a0EPTIyUllZ+eTJE4qiCIL49OlTYmIi+i5N08nJyejHpFJpSEiI0+n0v6+enp7S0tI3b95gGMbn87lOCwgaMOr1+qKioo6OjvT0dJVKtX379sArBATAXAmu6IYKk6anp5eWlsbFxaWlpaG7SKShoaG2tvbChQtxcXEikaisrKy3t5f77ri9EXz/zfXiRRHz5MmTTqfz6tWrqOXK1q1bf2jUxuPxDh06FB8f39XV1draeuPGjRMnThQVFUG5AQBmRBA9d+Pk5ORs3LgxNzdXLBb7lkh59uzZ+vXrtVrt6tWrIyMjX79+PWl3dKlUShBEf38/evny5cuvX78SBOFyud69e5eTk6NUKmNiYliWHRgYGLfTQkpKSl5e3oMHDwwGQ1NTE+paBAD4I8duNEt7vB7e1JohTIphGRyb0v9iZGQEPWKLiopqaWlBXfu4zgCon8C5c+fq6+tXrVp1//59m822efNm7ne5qQNUUBdtKjY2NjIysrCwsKCg4O3bt3V1daOjo16vVyaTrVixorq6OiYmZnh4+MqVKwzDcF2y0BwrRVHl5eURERGJiYkOh+P58+dxcXG/Xh8YADBn0W2ZLCJzdZaQPzONx1keK8LF/hcqoOf9arWaa6fGZZaJxWKdTod6KaBkjuvXr4tEog0bNlRVVaFBGYZhO3bsWLNmDbepbdu2oU0pFIqLFy+WlZWdPn06Jibm1KlTVqsVFR8/f/58cXGxyWRCnRaio6NRfxa5XJ6Zmbl48WKCIHAcv3fv3p07d4RCYWpqanFx8diuXQCAnwPVK3nTql4/LoZhHA7HuFWY7XZ7SEjI2O7OHIqinE6nRCKZSq1nAP4I9PyoXgkjhR/9RAMXPp8/UYH5SZevoo5E090jAGBSwTirAAAIBhDdAACBCaIbACAwzUZ0+90TFwAAMAfRTSQSURTFVdEAAAQ8j8czOjo658mbv33OVCaTSaVSND08brI+ACCQMAxDkqRYLJ7zJKffnu+G6qO5XC4YvgEQJCQSSWho6Jynps9GdAMAAN6s+x+jVDopF0ieHgAAAABJRU5ErkJggg==\" /><br /><h4>Caption</h4>Figure 2: Dataset categories and sample counts for documents and pages.<br /><h4>Annotations (ibm-granite/granite-vision-3.1-2b-preview)</h4>In this image we can see a pie chart. In the pie chart we can see the categories and the number of documents in each category.<br />\n",
+       "<hr /><h3>Picture <code>#/pictures/2</code></h3><img src=\"data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAAUgAAAFLCAIAAAA74oLKAACuJklEQVR4nOydBXQUVxfH78hq3F0ISSAkuLuX4u5QpEJLW1raUv2ou1CBtrSlLVC0QClQ3D0EAiSBuAtxz/ruzHfu7Gaz2WxCEgKx/Z09HDKZnZndzJ333pX/JViWBTNmzLQtyOa+ANBwNPdVmDHTFlCpVFprIpp9xH777bdv374tEAjqvhKWZQmCeITX1aLRflfmL0SL+dvQI5PJFi5c+MQTT9DQfERGRp49e3b//v3Tpk0bP368SqWqbU+WZcvLy0UiEY/He7TX2BIhCKKsrIzH44lEomZ/Ljc7BEFIpVKGYSwtLdv5t0FR1IYNGzIyMgCgOQ1bIBA4ODg4OTn16tVr2LBhde9cVlZmZWVlfiprkUgkfD7f/JjTolAoGIYRiUTNfSHNz6lTpwQCQTMbdieO8+fPK5XKuvdkWVatVqtUKj6f/6iurkWjUqkIgjAbthaVSmU2bC0Mw7QU55larb7vPkQlj+SKzJhp9TTniF0HLMsqlUrDJZNSqZTL5e3Nf04QBJ/PNz/RzLQFw1Yqlbm5uUaGrVKpysrK2uEtLhQKXVxczLNuM63esPPy8hiGcXNzoyhKv1GtVpMc0J7QaDS5ubn5+fnu7u7NfS1mWhMtzrAZhpHL5S4uLmKx2HA7TdMkSbbDEdve3j4/P98cxjfTug27tlwUlqMd3tzt83FmphqMGvKSQKMEex8QWUMrNWwzZsxUkX4Lzm+E3FjQqMHOE/rOg57T4X6YDbsurly5snfv3oKCgq5duy5evNjV1VW7/ebNmzt37szMzOzSpcvq1astLS2N3piQkLB///6IiAihUDho0KApU6Y4OTnt27fvzp07KpXK1tZ2+PDhffv2VSgUf//9d69evYKDg7VvPHPmjEQimTx58iP/rGZaJPeiYc8rUJgKNB+AgLJcuHcHB/Des+t+X+v3RakVUJAKxVnANHEk7M6dO0uXLhWJRBMnTjx69Oirr76qUCi0trd06VKSJCdOnKhUKsvLy43eePHixSlTpkRGRj7++OODBg06ePDgX3/9BQA///zz5cuXbW1tExISpk6devjwYY1G88MPP9y8eVP/3oMHD+7YsQPaObnxcG07XN8NRWl4E7dbWBbC9+CXwBcDSQNJAU+AX8jlP0EpbdMjdsRBuLoZ8pOBIMCnDwx9Gnz7NeIwt2/fvnfv3oQJEwAgNTX1xo0bM2fOPHXqlLu7+yeffAIAfn5+ixYtysrK8vT0/PTTT5csWfLqq6+aPJRSqXzppZemT5/+6aefarc88cQTeXl5LMuSJDlp0qRVq1ZpA9SbNm0aNGiQUCg0dP7zeLx2nV2nlMLJdXDrH1DKgADgW4BbEHQeDUFjcBba3tCoIDUMqOr3A0FBSSYUJIN7SBsdsSMOwr/vQNYdUCtBpYDYs7D3Nbh3txFHkkqlr7zyypkzZ9Rq9VNPPRUaGgoAAwcOlMvlly9fLi4uPnHiRPfu3d3c3OLj4zMyMpydnVeuXPnCCy9o9zQkMjKysLBw3rx5+i08Hs/Dw8OoAkkgENQn5a7dEfoXXPkTVDIgCXxYK6WQcg0OfwTbn4OcWGhvEIADtYntBJC8NjpiS0vh2jZQSYEW6rbwBFCcCVe3wvRPcdLSEAYNGvTOO++sXbs2ICDAxsbmww8/JAiif//+gwcPnjt3rqura0FBwZ9//ikSiQoKCjIzM3/77bf58+dnZGQsXLhwx44d/fv31x8qKSnJ0dHRycmp5llomr548aKVlVViYuLOnTt//PHH+xarti/K8yDqCBAkvrQQABQPX1l34NS3MPd74FX+udsDFB86DYesKOAbpMFrVODRFRw7NJthJyUlnT17VqVSjRkzJiAgoImPXpQKRen4JzeEpCA/AWTFYOHY0OMtXrz4n3/+2bJlS2JiojaEvm/fvkuXLv31119eXl7//PPPBx98EBISwufzSZJ86aWXZs6cCQCJiYmbN282NGyRSCSXy7WrcSNIkszIyLh+/bqVldWOHTtGjhxZUVFR07Dbr6mX54GkwPRDmSeAzEjIS8B7ul3RezbEX4TMCPxaCAIX2JZOMOxZzpcGzTMVz83NtbS0FAqFb7zxRlpaWhMfnaTwVdME8HnfmKfVzZs309LSAgMDDx8+rN1y8ODBoKCgkSNH+vv7v/TSS3FxcbGxsd7e3l5eXm5ubtp9HB0di4qKDI/Tv3//oqKiO3fu1DyFUqmcM2fOjz/++Pnnn48ZM4aiKG3pZUFBgX6f3NxcOzs7aJ8IbUBgCayuPqkaBAnKCpAb+ynbPnZesGADDF4Gnt3AtTN0nQTz1kPnkfd9X8NsgGXZ1NTUq1ev5uXlTZgwITAwUP+rW7dubdu2TSAQLF++3N/fXzu/7du3b0FBwaVLlyoqKqBpceoITv5Qkl1tlsJowLM7iGwaerDs7OzVq1cvWbJk+PDh8+bNCwoKGjt2bFBQ0J49e9LS0pydnQ8dOqStHnd3dw8JCdm5c2f37t1zc3NDQ0OffPJJw0M5OzsvXLjwnXfecXJyCgkJYVn24sWLJSUl8+bNU6vVRkUsIpGod+/ee/bsmTFjhr29fWxs7JkzZ3788Udon9h5QIf+kBsHFM3Nwg1g1GDjiq92iK0HTFwLkkJQq+r/DTTMsCUSyaeffpqcnBwREeHk5KQ37NOnT7/wwguzZ8+uqKiYMWPG9u3bu3bFKdO+ffv++uuvDhzQtPBE6APPjYOKfJ3bUKUA92AYuARnLA2BZdk9e/b4+/u/8MILFEW9+eabmzZtGjJkyIoVK+7cubNo0SJra+v8/Py33nqrS5cuAPDJJ5+88sorM2bMkMlkAwcOXL58ueHRCIL46KOPrKysXnnlFW2FMMuyr732GkEQfn5+jo7Ga4S33nrr1VdfnTdvnpWVVUlJyTPPPKN1zrdHCBJGPA+F6ZB8GX8kad2fkmUxN6PLOHD0g3aLhUODdm+Y5plGoyksLOTxeDNnzly8ePGyZcu0N+78+fO9vb2//PJLAJg7d26HDh0+//xz7VvKy8tXr169YMGCUaNGmTzmsmXLxowZs3DhQu2PDMMkJSW5ubkZZX2YLgJJvQ7Xd0LKdVxydB4J/Rbe16lQE5ZlMzIynJyctHao0WiysrKcnZ2FQiHDMDExMeXl5V5eXh4eHvq3yGSyO3fuiMVifWJJTXJyctLS0vh8vr+/v5WVlXaaLRKJrK1NpATGxMSUlJS4u7v7+PgY/aq8vDwvL8/Pz88wsbSkpITP5xul07cRJMWQcB5iTkFaOMjL0Kp5QggZD+PeqC2bsqKigmEYk19se+Ptt9+2t7d/7bXXGjZiUxTl7Owsk8kYhtHfZ3K5/ObNm4sWLdL+OGbMmM2bNzMMc+fOHYIgVCqVVq6sjmMa/tiwvGjfvuDbB1RynLk11l9KEIS3t7fh9eh/JEnSpOmKRKK+ffvWfVhXDsMtLi4ute0cFBR034u875Y2goUd9JgGPaZCRRGkhIGqApdXzlWLPjP1gX4Q+RUtKpVKJpNpByUAcHBwKCgoYFk2LS0tNDSUZdk5c+YYmUFqaur27du16oWhoaFDhgxRKpVaT7JWBUmj0bAsa3gibRGICaEFggCKM2mGwad724IkSY1GU7MWXSsG1JYj4QQBhBD8uVkew0BFRR1/XG3pfs0UwPYGTdN6lTG6qcqP9CanUqlomlar1ZMnTx43bhxJkjRd61maYNjBv3dbs2cz+GdlWWDuI4ZnpjYaY9g0TRMEoZ9C8/l8bc2w9se0tLQOHTpoFT9qy4709fV95513tP/Pzs7W5lFqd2ZZlqZpiqIMT6Gv5WxvQgvapQGPxzNaQGo0GoFAYJbvM1xj6+eM7Rm9xTXYToqKilJTU2UyWX5+fnZ2tlKp5PP548aN27p1q9bNs3fv3gkTJtTHAjMyMk6ePJmUlGS4c/tNz6gTcx6LmQbRYMP++uuvFy9enJKS8uuvv86fPz8+Ph4AVq1aRdP09OnTZ86c2bVr1wULFtTnUDk5OdeuXcvNzW2zfiAzZlrLVPzVV19duXIlj8djOLSBWQ8Pj7179968eVMgEHTv3r2ehtqXIzk5ub1pj5ox0+IM28HBdKCcx+MZpkzXn5Ywpbx3797mzZt9fX31c4309PTNmzeHhITMmDGjqKho27ZtkZGRKpWqV69eS5YssbW1NXy7VCr95ptvvL29lyxZot1SWFi4YcOGLl26zJo1yzwfMfPoaU5fVFhY2AcffHDjxo063Ob3pVxVHl4YHlEUoX6AivysrKzPOPQ57Xv27Hnvvff++ecfrVshKysrODi4d+/eu3fvfuaZZ4ymGBUVFV988cWrr76amZmp3bJ3794PPvhg586dLeGxZaYd0pxlm+7u7sOGDbty5YpRYLz+bEvatjF2Y3x5PE3QPR16vhHyxjDX+/QAqw0HBwdvb++zZ88uXbpUoVCcPXu2d+/e2ieOv7//F198od2td+/eU6ZMkUgkhm5qjUbj7e1tZWX177//vvDCC3K5/OTJk6NHj9am8bAse+jQoVu3bikUiiFDhmgzRuPi4m7fvj1nzhyCIIqKio4ePTpu3LiaCadmzLS+EdvT03PkyJFeXl6NM+y/kv5adnHZ5ZzL+bL8bEn2kdQjs87OCi8Ib9zFiMXi6dOnHzx4UKttJBAIBg8erG8AyrJsUlJSRETEoUOHRowYIRSayHKbM2fOiRMnVCrVzZs3KyoqRo0apdFotL0gDx8+bG1tbWtr+/777//000+YXmVhsX79+l9//VWbLq7dAVomCgnqeMSfw6pJM62E5hdaaJxVFyoK18esV2vUQOm1JiBfkv9DzA+bh24mjGqD7gfLsiqVatiwYTt27EhMTNy/f/+oUaPyOLQ7qFSq99577/bt23l5edu2basZn1er1YMGDTp9+nR4ePjx48eHDx9ua2urTZ6zsLD45ZdfpFKpUqm0tbX9+++/ly1b5unp+dlnn2mrQe/evbtr164WqoiUEgZnN2Ctv0oG1q4QNBrGrMbiSjMtm+Y0bK0NhIeHjxs3rqHvTShLiC+NN55wEBBRHJEnz3MR1pqVXRtqtdrb23vQoEHvvfdednb2e++9t27dOv1v+Xz+xo0bVSrVli1b3njjjZ49expppLAsa2NjM3bs2I0bN6alpW3YsOHixYvapJqysrK1a9fevXvXwsKitLRUJpNJJBKRSDR06NAJEyZ88sknR44c8fRskYJehSmwbw3q0tB8IEkoy0YZPYaBCe9wlZVmWi7NORV3dHTs3r27o6NjIwZtiqBM5sCQeAM28kOpVKp58+bt27evQ4cOzs7ORn4vS0tLOzu7+fPnKxSK6Ojomm8nCGL8+PGnT5+2sLDo3LmzdhpPEMSOHTsiIyP//PPPffv2vfbaa/p0ury8vEuXLgUEBJw+fRpaJuH7oOQeVtegVhGBdZQ0D2JOQB4mL5h5lEjV0gpVhYbVtALD9vHxmThxop+fXyMMu7NN52623aDGxxzoNNBR2BgXFMMwGo0mJCRky5Yta9as0W7RXlhWVtatW7dKS0vz8vJ2794tl8trKj0xDKNQKDp37vzzzz9/8MEHFEVpNBrt24uLi8VisaOjY3l5+fbt22UyGUVRcrn85Zdf7tKly5kzZ86fP//LL79ACyQnzljPhKTR1It1zn8zj4DYkthnLj/jt8/Pfbf75JOTj2cdr8+7mn9C1bjsFCue1Rtd37hVeKtMXoZPJ64SJMA+4OXglxu6wNZmv+sFiebOnav9j4WFhTb9ODo6es2aNY6OjgqOzz//3KhFHkEQdnZ22hnEpEmTtBtFIpGNDWq5LFy48MSJE1OnThWJRFoNFoqi9u/fn5ubu379egcHh08//fT9998fNWpU0yvDPSA1K2GxOloEQnNW9iMivix+9rnZdwruaH1JRzOOXsq9tGXYluk+05tSaKFpUSgUMpls5cqVkyZN0meGNEho4VzOufUx62NLYmmS7u/U/7Xg1wJtAhvdCVAkEhkmk2iLAQUCAcMwpaWlWVlZNE37+PjULL1gWVYulwsEAsPLU6lUGo1G6z+XSqUpKSnW1tYeHh5KpVIgEMjlcpIkBQKBdmeJRKLVP6t5bc0ptBD5H+x9tZpsqEYFLp1QpqYsGwWuffuCd6+GasI2OW1VaIFl2Vevv/ptxLdgeF9ooLtj9ysTr4hpcZMJLTQtly9f3rFjx9WrV6dNm9a4I4xwHTHCdUS6JJ0maHdx4xvNkiRZ00iqCmVI0o6jtrcTBFHT2nkc2v8baq1oTd1ofwsLC2iBBI2B7lPh9gEsn8QCaQIEVqgoePgjUHDFzyJb6DsXxr5qWv7azIOhZJQn7p0wnlWTEF0SnVCa0N2hex3vbc6/x+DBg3v16vX888/rw8WNw9uiSv/ETFPCE8KUj1BgMPoEytQ4+mEDipRraOE87sGklMLl38HeG/rOb+5rbZtoTHnLWPR83Mct1ZyGLaikGa/BzH3gCaDXTHyplVBRAFufwptK34aCpECthrvHcWDnt0UBtmaFR/JGuo6MLYytZqYM+Nv6+1ujEHAdNP8MypxN3Tqg+VCWg7ZttKImSJAW4/y8iQybYZmwgrCIogiaoEPsQoJsg6x5bW3xXE9Ignyu83NHso6klaTpErFYENLCt7u9bcWzaumG/SAVIGYeKRb2qNkuKwHKwIXJaEBsB+Jq5W6NRq6Wr7mxZnvS9mJZMQqNi+2CbIJ6OfRa0WlFiF1dPejaKl3tuu4bue+T25+cyjml1qi72XV7pesrM32wC03dNKdRxcXFXb9+PTY2dvTo0c14GWbqi4MvBA7D5LMqxW8GU9C6TQa6adZTn0d9vuHOBhyduBuzWFF8JefKlZwre1P37hi+Y6Tb/TtgtD16O/TeO2pvvjxfySidhc4CStDSE1TkcnlRUZHJNldmWijDV0Lw4/gfjQpfFA8GLkXDbgqypdn70vZhFoI+rodN+fCVU5HzYcSHZaoyaJeQBOkicvGy8KqnVTfziN2dIzIystkVVHJycg4ePLhgwQKj4Lk2fr5p0yZHR8cZM2bUTGItKCg4evTo5cuXZTJZYGDg2LFje/fuTVHU8ePHb968qVQqLS0t+/btO2zYMJZld+/e3alTp549e2rfGxoampWVpW3u12qwdIB530PyVSwOofkQOBI8m6xLXpY0K0eWY3qsoeBGwY2o4qjBzoOb6nRtm+YX/XxAq1ZoILUEsspA8wA+uLS0tLVr15aVmRgQdu/evXr16p9//rmmky81NXX+/Pl//vlnSEjI2LFj8/Pz33777YQErG3csmXLzp07BQJBQkLCokWLfv/9d4Igvv/++/Pnz+vffvz48VbZpoviQcAweOw1GLWqCa0ae1TxbdEnVMvfUa6Ry9SyJjxd26Z1O6523oXvrkFUHq74RvnCG4NgiFdjjkOSpFHamZbY2Nhdu3Y9//zzt2/fNvoVy7JffPEFSZIHDx7UZpssWrQoOztbG72jKGro0KFvvvkmALz55pubN2+eP3++SCQy9BTyeDxzqM+QjtYdH3N/7JeSX0wMNwz4WvveN8ZjpgWN2I1m+x1YdhDCMkGmBqkK/ouBOf/AzZwmO75Go/n888/nzJkTFBRUc1pRUVHx33//Pf3004Y5ZG5ubvb29tr/6+ftlpaWGg5oMzycCCUBxP+6/2+ox1ActNWYO6kbvblcjPl+830tfR/GedskzT9iG/XuqidFcvg+DBRKg0/Ag+wiHMD/nFwtHNNotm/frlQqFy9erC29Mlpgl5SUqFQqbac+lmUPHjwYFxcnFAonTZrk5+dHkuTdu3e3bduWmZm5cePGVatWWVlZNVoB6uGiUUN6OGTcQivy6gE+vXGyXRu5cRB9EgpTwcYdOo3ARPEmxdPC8/CYw/vS9h3POp5SnnKz6KZKo+po3XGe37z/dftf056rbdOchn316tVDhw5duXJl7NixDX1vfCEkFHMuU0MoiMyHQhk4P3DmdVJS0s8///zFF1+UlJRUVFSo1erS0lJra2u9efN4PLVarW+VJJFI8vLyNm7c6OrqqjXsrKysCxcuiMXi7777bvLkyQzDaHUXWlZyjkoORz+DiAPY1xKTAa3QxT3hbdPZJnePw5GPoSQLc1QYBsJ2wGNrMFe8SbHiWS31X7rUf2mxovhm0U2FRhFgHRBg3cLq3lo8zWnYPj4+48aNCw8Pb5TQApCmqjPJWrbXB8MxOScnp6Ki4u2339Y2IcrNzX3xxRfXrVunF05xdHT09/e/evXq8OHDCYJYwHHixAmt6arV6tGjR2vlzbQwDGNjY1NQUKDfUlBQYFI77ZFyZTNc2w40rcv91iiwLbGNK4x8wXjP8jw48gmU5uj2pACfBafWgXsX8GisC00phXt3UFPN2hXcjPuN2gnsRruZExxap0qpu7v71q1bG2HYQU4Q7AgXk3EGXgUD/d3BoeENrViWVSqVRUVF2oougiC6dev277//amVGt27d+t9//3344YeGBV40TT///PNr164NCQkZOXIkRVFFHNrfqjkMT0GS5NixY3/++eelS5e6uLikpaWdPn1a22C82ZAWQ+xpLm5cOfMhKCDUEHsGizosqwvIx5+HinxUUNFD8TDDNOFSIw07/SacWY9LAKUUrJyh00gMkucn4svGDfyHNLGyGsuV7OvrT9s6zb/GbtzK05IHbw6CqFwokVZOyNUQ6AKv9NflRDUIsVjs4+OzcOFCHo/Hsiyfz//jjz8CA3Wl3cHBwdpOg0bvWrx4sVwu/+qrr9atW2dhYVFWVjZ69Oh+/fppBVhrVmI+8cQTcXFxc+fOdXR0LCwsHDZs2DPPPAPNiKQIu8wb5X6TFBq8pNDYsMtyMc+MqH7DEARU6PQeG0bxPdj3OhSkYDCcovEBEf43rt5VUsx7AQKcOsCEteA3AB4caQnEnISky6BWoQchZDw+ONo6zW/YjWaCP+ydBT+Hw5k0EFAwPRBe6AcBOp90wwgICNi1a5dSqdTKgJMkaaguOH78+GHDTMuVP/3003PmzImPj1cqlS4uLv7+unjMmjVramaz2NjYbNiwIS4uLi8vz9nZuVOnTtC8iG1BbA1FTLXYCMNgQri4RvG5cyAOdyxb7cHJsuDUsTGnjtgPRWlVCi3ah4u8lHONc8fPiYcD/4OndoJVNdHIBlNRAIfegzvHOLkIAu4cxdeMzxt52a2HVmzYADC6A4z0xXAXASCu3ZV7XwQCgY+PT22/teao7bc2NjZ9+/Y12ujs7Fzb/p04oCVg4QBdxkFGZJW5YldqDXQeY8KcAoeBewjOn3mVsXeVElw7Q+CIxpz6XjRWjxj5Pg3nyTQfitJRwmXwg61Wru+GqCPAF+nyVCkepIXD2R9hzjcGmattkFa/5CAJsOA9kFW3U1gGF7c9Z0CvGUDxdbnfBAE9psOgJ0zszxPCjK/AbxDag9aZ79YZJr8Pdo0STkav+/3sitE8qByqWgnRx/AZYXgungCn5ZIidNrFnoWowxi9a3M0/4ht7lnXDCRdhtDtkH4DzdV/GGobVeRhQDtgGHQcaLRvRFHEmewzxcriLvZdx8z70jE7BfITwNYDF8CN9m+FjEeLwkW7fmhhjU2dpNBb/iCwGjRgY4cZgY+w0L8weleUjuflW0KPKTD65bbUCKE5DVulUik5mvEa2iNx59BxJS3Ceam8HONbbsGw+DewccG7PPEyZEWimFmnkWDjuiHmx09vf5ItycY3kjDIdfCmoZuD/Ac96DUEDIXes+HGblDLuVUAoVtm6z15GjUILdH+HwSKj4uF+AvcoF0JQeBIfvE3nBFo/SCKcrj8B04ixrwCbYXmNOwrV67s3bs3NDR08uSquj+CICiKUigURoVWNSVK2wlaPdMmO5xCApc2gaRAF47WzrGz78DlTTBoGRxYCymhgH1LCTi38VyfIa/c+1allOlvkytZl1+++vz+UftNSmQ2AIoHE9eiyOmdo2hXjn44BQjbgUMoSaIDz8IBxr4CLo3RnK2CpKDvAhRp06jw/7o5AaFTq9Y/RAiuF0LUEVyYOLSRrNXmNOxevXr5+vpmZ2cb5lETBGFra1tYWGh0Q2s0GpIk29u8XaPRyGQyJyenJvvgBcmQn2Ssi0DSkBkBhz/EYDV286Hxvq/I33JnvcpaVs0PQ8OFnAthBWEjXBvlMzMEFRom4Uut1I2oAUNx0VuUyjUJG9P4vBdDAodjQ6JzP+GcnCQwUK9rt2w07acxA6fkntmwmwArDhsbG6PMSjs7O5qmtWLR+o1yuZzP5zcusbz1QpKkq6urtm9B04CdPWrksZIUFKahD4nmVUazCJaETB6jG970ECBXyPNl+U12PVoHuBbXzvhqWigak22CxkLaTfwkd45g6Ktm4zGWwSkMv0WKQAOoGYguAKUG/O3AVthqE1QIgqgZYSouLraysjILpD0oDh3A3gfdZrTBDUIQODeWlRj6mQiWcNfQxg8BFoQCoZPwwWLLTQ7FQ+XzOrB0hODH8D+ZEcZNi7So5OA/GFxbRhiyOlcy4eNLEJHLGbYtrOgNS+sSFNfROlatLEcLrY5qXYissY8H3xI0Si5qzeA9be8Dw57FIav6N7ys3Fagr53UooFR7qOGuAyB5kWjgvxk7NedFQUp14jcuPrmigYOxwlCNdtmQaXAxfzol020NGpububA/H1wNAbulUGBBEIz4Kn/4Ldb93+jeQBsf3SdgGYQuhWyY9BT1Xk0DH0G58BxZyHudNV0lFUPV9l+6D3q44L95bISNG8S+rn0WxW06pu731zKvUQR1GSvyfP85lnQj3YGG38erm7FxDXtU0kpFQmtNf7DYexLODLXjU8f6Dkds1a0eeOokU5B98kw6kV04LUwWBZ+vQXpxQB6pz4JGga+DoX5wWBZZz91s2G3S0Iexxb2FYW42rSw1w13417HLPGsKK7VBAsiG2Lw8tdHPD+x9LW9qXsKFYX9HPt1tOq4MnTl7fzb2mH8QNqBf9L/2TZsmx2/1v5HTUzMKfjnDbxOXdE4pqCS5bnkje0gK4IFnNSUWlGraipJwcT/Yfuxu8dAVob58F3GYeVpiywOUWjgbGqN2mQCkksgthD61Jnwbjbs9grFw/JMQ1w7wcKfMOqbE4P9NAOGoY4CQQTbdgnu8Z52l3nn593Ou2141xxJO/JT7E/vdHunHt74ZKzicguqS8ihbjQqDDjLyqpidVoIEi028SJ6vwtToTQbU2J7TEc3e01oIQxYjL1NZCUgtm+B02892EnJ1AOHAKDv9yAyG7YZA6xdoc+c2n4ZVRR1Pud8TbfMoYxDL3R+wYaPPYNNUJ6PZdt3j2FxFUmBRwg8/hb+2whKc3D5YPq5QGDCydn1XHEY4Iwj5hSMfBGGPm36UHxxy+9JJKBgUgDcvWcwFdd223SDoOqldzVpiTMQMy2TMnWZRC0xTvEmQKKS4HaTMBqUZ7jxNy6GWQatLjkU/n0bijMbfHq1ApPb647nEwROwmkBjsOYXvYrThNaM0/3gm4eAEpOAU4DoAI7C/jfEBDcb0Q2j9hm6ouvpa+HhVesIrqabbPga9XBUViL1yorCrUcaEGVQfKEkHUHYk/CwHqXbZXnY95r5GGQFWN6SV22bfArkkSNl9hT4NSsRe8PRkdb+HcOfHUVQjNBwWBV8qq+KMh7X5rfsNtnomhrxEPsMc9p1PuFnGFXxsAoknzSezafrMVFmxVlwhQpCrKijUu7a0Negd6y+PM4A8ce3fW/Wwg8hYzr490g1AousF+n0/kR0sEWfhoPuRJQqMG7luVOyzLsW7dunT59+ubNm40QMzTTDKjlb6YqK0osd9jK79FqYKGTiv9ysfW01HyoTWtQbGOiPBO1HKzrq3QTeRASL1Ub8+sLi0t6r3okc+hJvYF1KVmRILDAovTes9Db1zJwsWhVKaW+vr51aBiYaVnkpwiyYr4q91isUMXylBQLvZTCDnLAKgt5GQhN/R07DMKQUllulceL0eBsPMC0Io0JUs4DIwOqHkm12jU8SevKSNRK6DgItdPqSewZnBpIuKI3YCH9FqoyT/+s5dh2g2jOabC/v/+sWbMCAwPblJh+G0atQBlTkuimEM2psJ0pse2g4gZSjQKTt0xi5YgSxUIrdJ4xajQ2lsHUt473b8GVXQH/JcK+0p4RpHbUrZ53yKirJZCxDCo9dR6Fok4aNao79ZgK0z+tbzRLIYXT32EAjCfEcZ6k0WceewYiD0HrpPnX2EZqnmZaLnaeYOsOWYVcFLVykc2oMSO1pkaanu5TsCQz4gDkJWJ4ucs46DLGRBlGdXbdhc8vQQQKJT7rJpg5hz32qeZbMci43CsV2HujzEPUYYxpA8HSfEJoCSNewMlzQQqU5WCA2j3YWKexDnLj8Y1k9UAazcOo/sAlXLlbK6P1XbEZ0xQkowAgrsYCwanB2ZHlqnKWZa35dS6LLB1RHSE7BqfTWieWRgUWjtB/0X0M1ac3vrTz5Hoslc+nwfL/QCbX3Z7Z4PQ9sZgPqi/UnxMsg4NzzxkwYiUEczIs5fls6T2GZ0HdPQYZt7EONLDhJaWm2/0RoJI9pH5GDxuzYbd+WBYu/QbXd2HSFcu1p+87F9O/6+dtSi5P3hCzISw/jAW2r2PfF4JeqKv3Xd/5eM+E/gXlucCoMMN8+ErUS6gP9Us4YwF+uVVl1Xr2EOOeoff728ih70KUT8C13GB8he8hTnxNShPRScdocPI8YiWO3g2KtjgH4qQDfQEGZ1WrwLtnaxyuzYbdJrjxN5z8Bs1bm2hZkomZXkJr6Df/vm+NKYmZdmZafFG81nV9JefKf5n//Tvq3xA705lhUkYe6uOSazHRvrSwv+tQW5/BGLtqUkrlkFhcYysLGaR7yqQ//LuIwbDmpOQenFxHSEt0BknSuDS49Dv49muYJrmlAwx8Ak58zQXnuE+kUYCjL/Sa1Rid+haAOYbcypGXQ8RBTsqXZ1CcrMEoEcp01wUL7OdRn6NV01ylAfdKKk76LPIz1lSX6piSmDlnZ48/Pm7B1efGJ304KX5tWPHNJv9AIh7Kzta8VgseYenoVM2qASDhAnq8DB8uJI1aS0lXGnziAYvg8TfRj0DRnMbjUJj1DTi31p5h5hG7lVOWh76imt08ynKhLB+EdSU0pFakXs2/avxsJyE0PzS5LLmjdTVJfSVT8eTlJVezr6P908CqlZczLiyVLTk29pi3pTfuoVGh/4llcaCjBegqy4xAB7VLAHh2r78fS0DBtEA4l1xdtlQDAzygW019B6wnrdG4h6B0PQYbBC2EQUtx9V6UDgIx+uda5yRcSyu+dDOIwALV8I0cPCxbnyIHpUap1JgQHlEySgVTFb5SaiAqD45lxF3Nzq26XwjsmhZTFPNf5uGVnZ+DpKtw+Xdsu8UCOPuj8zzxErfmZ1GWMGQ8DoYC4xwLNauOLIzMl+d3sunka1WVJ/l0T7iWBTvvcF2yuXP5OMD7I7mRvKIAY2YWDrq+BV49UThBUz25jWXArUvND8WyrICqpZxTj8i6kQUqLQyzYbdybFzBbyA21qhyOLN4o3cYgNZVJ54Wnv7W/mmladVb/EBHq45eFl7any6mw9tnIeweKJnuQNwG8V9g/R6QJfrd75TFQkoY7H0VJw64HCBwkY9ywqRuza+ogLDtGMoe97rh2cPyw94Jf+dC3gUNq7HiWc3rMG9eh3lX8q7Elsb6WXmvGDD1sQ59/k0AhQp6usKTvaGjKg72/oa5pRo1OggHLMTSS7WyllIQvv6n1IrU3xN+P5p5VMEoRriMeKbTM13tmkImsWVjNuzWz5CnMASVGoZLa8yjpFH0f8hT932fBW2xKmjVhZwLKiyo5DYx2EX0uU7PWfEw0yupGBYdgPQibvlN0MDaQfkq3M32ZV0cmwVH2hrCdqLEp75Guua6gKUx2aPfAn3bkExp5sILCxOLE7kjQ4miZGPMxi2JW2RKXdjJSbzuq36f/Dv7Jd10vDQLdr2CHxMVFAjIvgv/fYgZoGk3UONJ3y1UB4E56j2m4UcoT1pwfkFYTpj2A97Jv3Mg48CeEXv6O/WHNo3Zedb6sXaBBT/BpPcwrhs8Hia+Cwt+NhZRMEQlg8JMVXFGfGlcN/tufw75c6DLQBEtEtLC3k69fx3861w/XS/7X29CeiH38NfPcwkA2UJQ9eBiS2Alsp7kPBINrO5QFknhFLosV7/hj4Q/EksSq45M4J0oU8t0Pjymd37htOdORp9M4xoVAMC1nZAdi88ObW89iofj9q19WP5pbNWVKxHu2fNjzI9h2WF4IpJ70ZBRmvHerfeyZdnxpfElyqqpRxvDPGI3B5IiuLUfMm+jw6bTcEzGarSoiBaRNfRfiK/7Er4XIv87rE7aYFMST0p4pGCw86BPen1CU7SG1QTbBusVSFkWblVZYiUEgMYB5B5A3eJRvHd7vNvLeQCw98sdZBnsnmOQTH694LoJvzsWjQmg7FOQLgaNk4yFBfvkrwyEN/sqiayoGnXgtRRgYdhPgM+RiEMKr5CDmYeM73EazuScmXByQpmyzFnoPN1n+otdXhRRDW+q3rIxG/YjJzce9r6Ok0lWg/dy1CEIOYvd7YRNJx5uEpbBHiAnvv1HVLjIOV9WodscVxx7LvfcycdO+llVy1cjCFNyeSxQJPRz7xfiZju/w/KRbiNxY8BQuLm3mlyR1pmnX/OrVdChHzhXudmtaVMpbgRA+RoofwX/w70KKoRvnwZXASzjkaYCcKbQNgyKOAQRBzViq3KnjJrVZSpGdbvgNibnlCaH5obuSd3zbvd3J3tXtaNpAzzEqfjdu3d/4EhJSXl4Z2llsJx8z70o9O7wRFyJAol51JEHH/qpC5Lh2o4SUvWNQ4WMVzk1JXHqm1yc/HnU5zVj15MDuImx4WY1BDnCvnFrfx30l86qAWDgYvRmKbme9RoV1opQXDt7lZyr/dBgatqIFwyDUtO8pxkfmQBQu4KsujAThWf8K45f4dybs0+DN7BMZU+PmrDal0hSOlDKM93Vs/KzAwU38m/MOz9vV8ouaEM8RMOOjIx0dna2tLRcs2ZNfn6T9o5ovRRlYdc7ox5xBAkR/+nEuh4e96KhKCNOwETTSmMTJuBGYVihvMDoHfODYX537h7R7s+CrQ28PwzcjJpSuneFBRuwAMO1M2aqd5sCT2yC+Rsws7XndJjyIXb8c+Bi3ZVM85m2PHA5HlbDVW1pQ9YaD9C4GdshCZmlkNdlLvj24vSVNGjSaiXKJDt30qmjay3ZuBMAQQL1UrmDtYYb7fWvmpAgVUq/jPoyT45FJ+1xKs6ybHR09OXLl/Py8mbMmNGlS1W08PLly3/99ZdAIHj66adDQjASOH8+pjSq1eqjR48WFBQ4ObWw9hHNgpQT9zG6eQkSJIWmO1Q0IVg+Yeq+5q6F0VhUKMGxeo2jkIaNfZJGJfy3t6JXAWXfVx250EszpPP8Goq4AK5dYOZXKDYIDNhUhtlqL7rmkbzv+30/1GXo7pTduYqCXuXM8Iy09RbK60Q5sI5G0ktWPLB2coLZ38KVbdjvWiHBjJd+CzET5vDHkHqNK0qhwMIGpKXVbJdgR8rEWyqCPvAmo8viAViCIBQaUxWmJMSUxkSXRDu7tsrq6wc1bIlEsmHDhpSUlPDwcF9fX71hHzt27OWXX166dGlFRcW8efO2bt3aq1cv7a9+/vnnzp07d+rUEpunNAN2nlgqXFFQzbYZNUr/3q+S8UFxDQRbt0BpXmc1P5SWVd3/ir5Q8cKd/El9ku3G+8HzfTHHS0d5vvXBV58qu7OUEDNqkg8KuKMBxzIY/pzpDOo6XPE1sORZLvVfurjjYjWrEdw9CXdfnS6TPU3d2EV0qNqJG2MnBYCjAEDgCePfhDEv4xOKFuiCaot/hdTrivQo1spZ6OYPm5dhPilhMA9lNNMs+jw2fkNMRRLLahLKEhZc4ApIaoBa6q2zkKsJpuIikeizzz77559/unXrplLppo4sy27atGnWrFlvvvnmxx9/3KNHjx07dmh/9ddff2VkZKxdu9YsbKbD0gHjq2oFF3Pm0Chxsd1jhomwTdPiHAg9p9upYXWRpUBdOS9V9oGi/SB9QqOxL5QS2yJg+l74Lym/SME5xG8fhKy7QPBpUPNRKZPAmfPNfZhS1kRQBCUg+ZhO4xliKVd8od44kI3AX6AiJ0swMDEI5fuq4AkxlKUPlZMU+A1QDX5aETwJC7A7Dqr6YqFSUyXkcbHAurdDzz6OfWb5zprqNRUT2oxMmIEAq4BONm1n+GmYvVEUZWtrq23vqm/sKpfLIyIiBg4cqP1xxIgRly9fBoCtW7euX79+6NCht2/frqiodMLWoD599rTnaiM9dIevwOwRsQ3nbVJil7yJa6FzpSOq3jT42yBpHO7GvzHHbthORY8xfF8viw586bug8qgKJtOQUwrTDoT67Q1aemV5TNw+YCs91NoXxUOrzk+CpsXSASa/B779vZnUo7IlGxX/m+WUMLc7bJsBe2aCQ41QVIWq4lbhrajiqFJlqUQl4WdFWV7+DafltACs3XDFgT48JZpv/4XQEzNVtPBI3h9D/ljTYw22LtG2JWPRqnk0b1WXVe7i++TqtSIaM/0zmrGoVCqZTKbvU29vb19UVKS1/PHjx8fGxqalpfn4+Bg2sk9KSvr9999VKhVBEBcuXBg0aJCCo46TqtVqiUTSFkZ+goRBz4PvcKIgGWgB6xqEcaCyhhUtqFQqhmH0k6Z6n5qAXouJjmPGl+aN4LGnZdTLOcFZRvtQoFEGl0odtsT9eUPDOy7w9dAYttJFaVGpVKaSyIim9fbZdITJXxCpYfyyrGVi6yd9ygmnMjVLqGRQVnlybG9NUPvu7fs16deEsgSapL0tvGmSds7PXp5eNkFuhbMeoZXKravGxp2l+WrvfmzAMOyUY1ATwif4Hwd9PMx62O8pv5/IO8GwTKBl4DN+z8xznVfWwL9CS4Omab0RNcG6juTQKxypVCqaptVq9eLFi2t7C5/Pd3JyUqlUJEmKRCLtEe5rtARBtAXD5v4C0KEv+GFWI8FoOGmRhn0ugqMx3wajAhsXtZ27BQFdCkm+6QImGl8k3BWqfrUq/qDYxaDKSs06diTcgiiCywZvShhMbu81k2EZDbbL02BuGWfNpF6SnOTtTN35bNizCoyo4UMmq5x7LpFw0AM+LoHXS5xALuGV3iPHvK707Ip9vTQqnJBXn92oWNU4r3EjPEbkK/KVGqWT0MmStlQxqta+xiZJUj+Pa4xh83g8giD0Pei1VpqTk6P9MTk52d/fn8erK5XKy8tr9erV2v8nJibSNM3jqOMtSqVSLBbXvU/rhAa4X8lRDdRqNZ/PF4sfqElNRxfo7AgpBdUXZCwAHQt0mjYEdUUg0zBKSqsBzjDA4xMDl4jca5dYaTJM/KFZYH9M/hErz7S3rYG1qgj41KZgnMwyi1LHwZ3A9F2j/UIsUe281huGBzxLi6pZJL9aH53WCp/Pb6Rh53JIJJJ79+6lpKS4ubkJhcLx48dv3rx53LhxUql0z549zz33XH0Gk5SUlDt37sTHxw8fPrzuPbWP0tb+QG1pCCh4tT/2VS+VaMs8OKsmy8DyGyA5t7kGKI9uEDgHEi6CUoYjas/p0HVis1xtcnlydEl0ZFGk6YQTFspIZrRLWgmFkrdU6je9D1/YMGBDX6f6yTa1ORps2OvWrTtx4kROTs7vv/9+6NChjRs3hoSEvPjii0lJSTNnzlQqlYMHD547V1dFUDdFRUXR0dFFRUVtZILdChndAXZOg29C4WoWSNVS4F8F629BeEKfkTKiwzSq68vYnlIpQ4VtLrVGyUC+BKVKncRV8+S60KghJRT71Fu5oONajP7X+pNcnvxp5KcXcy4WKYtUjMq0YXMPpUJK5xLXkGxYXtjyy8svT7h8H4XGNkqDDXvt2rVvvvkmTdMMh5UVZji7uLhs27YtNjaWz+cHBNRXTaY3R3x8vFmBuBkZ7w9j/aBAAn8lHXrn9jIVUxni1sAAtwFPBSzH/1s4QKVKwt5Y+C4U60MIAsZ1gDUDYYCuFtMAjRpFF9RKcPABSTEceg9Sw7kMHALs3GHCO9CpvkKi+fL8OefmhOeG43pB65uvJxTcKb7zb/q/T/g/Ae2PBhu2oXPbEIqigoODG3QolmUZhjF3C2h2aBJcrWBNj1k+tuwvsb+GFVy34dvM7zD/xS4vGnXb+zsalh4EmVK3LP/nLoRlw39zobuLwU7pt+H8T5ATxwXzfEEpU+fcuShWRfEVnhp6VLHM9tAHYO8FTtWkl2pja9LW8PzwRjp5WYgsjmzQO3JluTElMdY862C74PvLrbRgmrO669q1a//999/169fHjx/fjJdhphJqju+8Gd6z5IycBFJMG3vmSuSw7hrIFAZ3DQ8yi+DbMPh9ElDasTQ7Gvasxlg3KiKgklE8X/WCe+FZkUQNLAngb8f/IadiXPRJGF4vwz6bfRaTyRu7VvMQ69Po7kOFqmLd3XU/xf5UqCgkCbKXXa9P+nwyym0UtE6ac3Hr6+s7ceJEHx8fhnnIadLtDY0Sk9vqhmVx2aySG22mSdqStqxp1QAQXwgJWjUVQ0iIyIVCqe6gmJdWlKZLDiMpFc1/1qngpLgCW/hx5R7xfOXTzgWxRVH1LMMka2uved9bhgFboe10n+n6DXWf8Js737x3871cWa6aVSs1ytC80Pnn598uxOrO1khzjtiuHO7u7mbDbjJKsyF8D8SdA7UcvHtBn7ngYUrfKyUUwnZAynV0hnUejelZ9ZgYKxi5giFqBudYltGgndFYd516vUr/gCUuiCrOiSTVTIqFDCG7N+Pf//1jDYOfANeguk/6mPtjh1KrN9BioINNB28L7/NZ53ULbw6SIBltIQ2LDgJnsfPX/b/2tfQtU8B/CXAmFdvQDvKG6YHgWmM1mSPN2RC3Af+nT8KjIK8ib1PCpvX261tjymPzCy2Y19hNRmke7HkDki4BRvsJyImFuLMw+xvMxDYk4QLsXQOSAp0FXtmM7TIX/oyCu3XC8uNYWgPyXsYeLP4NIF0BvDGpDivMq+w4ii83OU7eJcvZ8N1ERjiKOjnXFRVf5LdoT9qeC5kXdJ4z1BomVgWtmtth7ldRX+1O2Z0ty9ZWkuut2k3stsx/2Uzfmb0cehXK4IVjsCtKd1HbbsMuP1w4+NtXO0tUSVSRosikErOKUfFbTK/s1jEVv379+gcffHDjxg19rouZRhNXGrc37OM9uUdiLUlsLkdSWFtSlgtnfsCZuR6lFC7+BuX5qMqE+mEkqhfnxMCVLfdtUiUuvinmfQRkRfVslruE1TcUwY0QBAmOHQzrT93VpkcOd4ZH8EXoOb+6pe56VVuB7a7hu17p9kp3h+4dbTqOcB/x+5DfX+7yspvIbV2/dUfGHLHgWRhNsitUFY95PNbLAesLf70Ju27r1M7wxYMLSfDBRePPasWzIkw53K14Vq00FtucI7abm9vQoUMvX75szjx5ELQNPX6L+S2lPAU8wVdV9lS53duljnifUnzUVyhMrxoV85PwpfVs6SEp7PYuK60rwiwr4p85w5dM1uWxaBHtB4vXujr1dxC4YGLsmR9QjVTfs5Jgx8gtfZVkKo8xtBoRQ06UWmF5CUmhs01aAha6ATS1BFJLwd0SAuyr0kDdRG7f9PsmW5ZdoarwEHsYrv+vFlytUFZUM0kCyuXlRzOPDncdrtTAzrvVxRg5h99/iZBTAW4GUlRd7bqG2IVE5EdU8yBoYIrXFFr7zGptNOfTyNPTc9SoUd7e3uY19oPwa9yvb994O6UiRZs+ncpT/c8ub6NVEVeYxZUuqg08ZAzDyRLUOIq2i2XtqOKuvFnwVLZqObCVK1Rcyjr6WPJWd3mZIiiI/A/Ob8SWQ3qLZBl7sduP3T/zsvLWS/+LWOLdEoeRcgsgtALGWAeNq9wK7LDZYxM8th26b4J5/6CvzhA3kVuAdYCRV69QUWhSFLFYie2/1AxklZsIfUuUUFzdaWhBW3zR+wsnkRNeJ8O9VDDZb/LCjvXQh2yRNP/TyGzVD0KJsmRr4la8EfVDDZfj/Zdl6TyJrZ2KQWkHe5+qNzj6Ymw5/QZOxfVoNChpJKorIexcrtVRdqDR2AjyQU+JN/R06I0Pi6jDOE4QPK7njr57tnJCl2VHO03cl7L3TsRmz6KiiQq70fLKZBeNBtWUxHYSJbx0Ev6+rcvsVjHwdxSklsHJBWBdZyx5oNNAmqLV2EnPYCsLvR1649qfgq7OcD6luiefBWcL8KyRjTbOY9zhxw5vitsUWhBqw7eZ4jXlCf8nnIWtVVClOQ1bKpWWlZVJJJLW6HVsIWRLszOlmTUHpQxKdY+Q2hGWMHhpNf1TkQ12n8uJBpVC15tKrUC32YAn6q7WusIEm1BEAqqA6MvN+4h75al3xVKWkgcpBV5qPmfbBNZLFmcGe/cM7hnM8PuT+98GeQVQXBm0WolPGWwrT17KgH9jOKvWfxAawjIxy21596qTxZfGX867LFVLg2yChroOlWvkRzKPaNgaExACtHLCNAnP9oIrafik0M1NuTOv6osCrLkSrPSmDT50X8e+fR37KjQKkiB5+gVF66Q5DTssLGz37t03btyYMWNGM15GqwZjzpSJmLOFBizt/KDvM9gHx4huk/E2v7oZk7cJEgKHwZCnwe0+YSdrO3sTls+A2Bb7/v2ZuOk7UfhdUQlLQJBK8Fy57fPlDmhFPCuw1aWIkMGP4/I7dCu26SAp6DIYBi9HTSiAqHxQKrDAqgrUNoRLGVWG/UvcL19GfJlcloxibHzhFO8pFrTFn/F/mlxNhhaELvbHquHpneHj0fDZJSjh4vpiHizuCiIaxu+EfCm4WML8LvBEt2rvbdUJZy3CsAcNGtS7d+/y8nJzrnij8bL0Gu0+OrYottr9rYJRnRZ4D/ypZh88Hd0mQpexXJ93Hlg7G3erNMWUTuQHl6BUZuCWYUAoZCf5E4cy9z4b+rySUGpHzrsCxYv8XB5LDpMKVAEDO4otqx48QaOxQYK0FJ8RIlv9ahy77dWctBFgXWnqp+6dejH0RWxFxN2wco387+S/tf1DTMACHws2EQEFrw+E2UFwNhUFF4Z6wa+3YPVxXARovYDHEiGpBP43BHit0vldK835afh8vpWVlb6C1EzjeLPrmwPdBuIyW829GCzeeKvvJ0RtVq2F5mPCto0rWrW8HBvrJV8DWXltu3e0g/8NBj6NMgXaExEEvNyf6O2m+u7uT0qVzqoRFt12/7PLG++eNV59ZMKpibtTdlcdiKRRCElsZyh+MNADHK2rJ5NxPcimBuqO90fCHygXo18KaE26lvpNAU8w3KVaIXAHW1jeA57rDeVK+PkmaiLpWoLTuP8PYXC7Zs+TVk7zO8/Msa4HxNPC87+x/21P2n4y6yQAjHEfs6jjIntB9QyM2mBZbOJx8TdMWdPKjA55ClPW0m9CcRbOov0H6zvpvTYQgp3hjwgipwwcLHAYXBACUpX8al6o8QDBQj6lySc0IMvJqsi5kntZzajr8DD3cIV3hsD/ToOkciAVkvB8PxjBef2kammaJK3+dV22QtttydsOZx4e4z5mkuckDHRXsieGk0IzvOtJKKmAS+nQ1w3aEs1v2PURM2xjKDSKA+kHLuVeEvPEkz0nD3YZ/IAHtOfbvxj04otBLzb4nXePw+EP8WbXaqQWZcCRT8HSEZu/o6IQoCj/+LewiQ/H+I74qlAadv+hrPnW2E+vJto2ADSo1KofYn543PNxB4FDbRfSy/0E6bgNSqeBpguQaWD1d88O4wliFq6oKaE939RziisDNdZoJ4hcWe6+lH3AwqbYTUsCl/zQ/wd9Sba8ljWfrM2tBZtzKh4dHf3nn3/GxMS0q8yzdEn6hJMT5p2bt/7u+i8ivhh5bOQr11+pUNeq4voQUSvg+k5QSHW9tVHGjMI8k5JMrgOREENiufFw8F1OCL0Kw55eYp54lt88bnZbOyTElsbGl8bX9vt7uRGrLj5VTv8FjrPBuSc4TZQL/3gp7JnkcnSVUQS1wG9BVUMSLSy4WbphWFsvNsoCTdC6RkUkN9MmYUvcli1JW/RvGu5T45Zngc/HFtxtjOY0bG0xdruairPAvnfrvTOZZ1iC1d55Kkb1fdT3+1L3PZoLUDLK0/dOr7u7bmfq38V50VCaa9yoAM3bYAuPj7P0mNMmjqWSQ8IF4sael4UDezn1wC2aypY9tagvmr4mhj136+eoCm33PAYIOXcUKJQV70zeqd1lhs+M54OexyQwjc6PEGwXvH/U/l3Dd03ymeQqdPUSew1yGUQbaTMS+A3vStmFuisckwJgmC+gRLq2rxCXiDKpEwzzgjZGc06DQziuXbvWfupAMioy9qburRYPJrB6YUviloV+C43vywdHreDayupyURLLEp+6/NTl3MtqVk2QhJ/Q/WvCetp97gEC5+TFmcab027A0c+wzgRYf0rwn6v3z77dLrPZJMvmyfOMlckYCLbv0dm2qiFUNRTF2UlHmJqePgbisS8PIqAE6/uvn+49fXfq7nJV+UCngfP95ms7/na177rqyqqj2UfzlflyjXEVKhAY6lezah6X+2LBg61T4P3zcCoFihTgYQGP+8MHw8GizTlwm399265iXVmyLJM3X0pFiopV0U345yjLhRu7IY0TJPLsBv0WlVvbvhz2MpY6crnTLMsmSbNWWOR0Ke8QqOLX6ppiQUPRiQJVccGNjpY+uu7Z5QWw/x0oSMJcdOySqXBLi/5QNE45Yx0ptEkpT3n81OPJxcm6+TCAmKReFfS3VTFGkqElcjiRAkV5VJqiH4izgah+J5Bg2NmXIIjR7qNHu4823EXFqFZeXXk04yhQoNbKFRvBYB64gKwKTfvYwJ9TILYQ4gohqQh8baFUDnbVm5a1AZrfsNsVnmJPS55liaKk2lYGAqwDmjLVqTgTdq3Cug4tyVch4Uro4LEns08bTRbyeJo/LEs+z7fTCaAwnAQ3Sem6TAPcEMo+sC04lfYek/aeg8DhycAn3+j2tmXUYSjEbgf64+B8PvEMP3M2BA4PsAk4NPrQl3e+Csu7qipOC1RQL5Q7jM84DjevYTPdntO1DXoOxMFrpyCpGFiwoWEXoTnD2q0AXqpeR9GRb73Qz3SfLT3ncs4dyzpW64KSAREteqbTMzXVGqLz4f0LkFiEwW0rPiztDh+NwP+0GcyG/UjxtPCc5TNrU8wmndxvpet4ScclTVdFxMLlPyDzNjcDrzxHbnz6+Uiljdw42VsDMX6doNcyiD+NuwUMQ5f4uZ9wXc0y6QKY75iVyFdqV6TZ0uyPwz9WUPSXOXLjukeCxILQgmQIxAByF9sum4f8mXbqY9XdP301ApolgVBCyT30wFs5QeDw2EJ45gjkleuGdDXQIH+MKP2WtV8EhAQ04KKBr7uv9be+jzBmWH4Yy7AmDJvFEd5R5Ph+z/fHuY8z+uWldFh2CMq0yTYElCrg+yuYlPZpg/sstVya37Dbfrgr+y7e0zwxeIQQIpsPen5QoizZn7Zfo0bPgq3QdlUwygY02enK8nAGjqOi3ojR422vUFEEqdGWcBEADA/UHUCj9HHrBX2fRDETdEBzs4aA4RBzAorv/VpxPLEiQTeEag9GwuaEPxaphnWjqgkqcAklFKad6JGX+URdACUf5wLavHGKj8Z/fRcEDvn9NpVXZhxPFskfn5s3zJJ/ytM2ZE7X53x7PX3fz+ossjexiNDAeO/xC/0WjnAd4WFhrHmmYTFHpUxi0EqA87HtuAvLumO5aNugOY3q4sWLe/fuPX/+/JgxY6BNIiuFE19jiXJZNsoeeHSFkS+4+w/5c8ifT/g/EVEYIaJFA50HDnIe1JQn1Sg5ZYXq9zurGUB7BtNMpCILhynpRJC+AKpAYJW348WRPtDN2WAhYO0M/RexADdOX4ASY/PLL01P6NSxW3ISyAur/OdY0eEH3j2r9izJgvIcnew4SyhJRg4aHk2JcuOBZaILqZrlllK1cGyPL+b75WLw3KGanzoiFwVS82XQxw2mBUJMAUodCWno7DLBQeiAxZtVnxREPOHrXV8f4Wpa4bhCAYnFNbLWSMgsw1Jws2E3AZ06dVq8eHFiYmLb9IprVGjV17bhWpQnwrlr2nXY9wYs22Lp7D/Za/Jkr8kP5bxWzmDnhfFn7fCrhVG52QZ+PeDVp2+vSsvtByXbgdFlcF9MginFcGQedKkmNIx3vtDU7UECKfDtB3RnOPEFFm+RFPb3tnKBMaur1YcKrDEYrlHLCXa7ZfHP1sVxPKWTipgP7CvKPA/LGuKhLBZaWXTuCh2ribQxLHxxBT69hAYJLPxGwxunQaIGbT9CC4GPpeV+gA0guAhUNrAgpok3ur06wnVYbV8Pn64Wh9ef3YJvanurpTkN25nD1dW11Yey1UqIPgkpV3Gp2XEwygNSNJpW7Gm8ubXNnAkC8z3Kc1HH8/E3HuLF0ALoMwcdZmqlLkbNqNHIe0wZ23HGdouARfsdUtXiKi8aBWmF8F0Y/DLBeBgb7zn+QNqBaps0EGAf0M2uG3h4grMfRB9H97ujH5aUGKkm2rpBh4Fw5+gXTmUf2Oaj6AMLFXz4lE1IDH1xdsffN0fYqdQGiRRqCPGE/ob65BwX0uH9i6BUVdWMlmijCtwbJUqQFA0FGErwb/l6rLMTWBYUT7oWPe7FHPKJrtDXVFdcEQ0TOsKZpMrEuMqz93WD7q21+NoEzb++bfVCCxWF8O/bEH8e7Qf9yHugyxiY+gmU5qALil+9ppJlsVjyYRM0BqZ9gkJFJffwR2tXGPYs9MLaWDF0q5DVmIgScP0eNgNxqh5MXtRx0ZHMIwdTD+oyNxkQ88XvdHvHW8xlj3fohy/MPDXllSZIGL0qoSL5S/II13it6lx/J+2f7Dn9w2GLP7zAqZRzKWVeDvDVKKyjNGJLBCjl1VvrGfn/OFhlz7LcrbkqQqaG9CzcvjUSvhgFz6LggjEremHHsn+iK39moIMTfDwC/WdthuY37FbPlT8h5hSOk9rwD8vCnSPg1QOFdbUzcKOMK36dRVdNhbysmuNaVqa1QKUGBYPqiQVt8fvg37e6bt2dsrtIUdTbofeygGXjPKo7meso+XTseNbDScpVl1SDhfM5534ZtKifB/FvHAoedHOGaZ0gmIuRG5Etqd+1ElAordQj5OE/ZXJ4+xw85gd+Bh49LZZ8+GMSZqEdjMd6r8GeMC8YgqqvRFo7ZsN+MBQVEHkIJ7p668U4MA/H7aV/gkcIOqgrE7/QtCgehDz+kK6ljNMSQC2hiP1w5BMMSmun4mU5cOob4Ath4JJAe2ydG5pm3Dq3tys4mnrgOAodXwl+5YWgFxiWEVACk1KetXJpM3v3KJgyVxWjIQkY5Yuvmo8+Q3xt6t2vq4Y/rFgC+2Kxu1hNbIToA1/SDdfwhiIqbYa2+JkeJQopur6NRi2CwLW0yBZGvoCuLLUC06pVXOy310zo3PRdY5KKYfVJVAUZvxNePskmXr0AjKwqCZyk8ZkSeRikxXYiWN0fBHzMkcbotAb/42kHL/Wry3z4JF9ICetv1RpWk1mckHzrzz4KoTVj4h4bhs4t3dHq1sVa2g2EAm3yOIc2wbve5NU54JNENatOLoG3z8LEnTBrH2yOBFVrduk2/4jdugXPRFZg4wYFKbqyRy0sg/5hksJ8j2WbIXwvZm7wxRD8OHR5rJqzuimIzodpeyAhX/fjlXTiMPnSv3RyMBtb9fclafRyleaA2G5OENAE/BQO8UXAI6C3G7wxCEX/moqwgrCPbn10NucMYyXtLBT6qHnRfKVGv8hmYJzXuPpHBAZ4wvrH4eMLkFbEfQ4+juGppTjS3h+yAWVblzJgyQFILtQ51fZFw4lk+Hk82LROoaTmNGylUimXyxWK+3WZasnwRDgIH/0UBbu03m9GjZKdvWdpW0mDSyfsGlubh+mBYQE+vwoJedXcS4ms72fkU39pXif0nl+WxSdLpSdvRmeY6I/hXB4FgTUitxq2ssNew4kquTP77Oz00nRt7dotoZxmiEEyURGtSaFVlmp2Nq/TmwM36nLO68dTPXAZfD4NJCpcMAc5wI/h8OM1YOso9mXR0d3dAxfS9UGpgbfOclatNwgWdkbAKB94yiA234poTsO+fPny7t27r169OnXqVGi99F+I5crhe0FSiFZk5Qh95kHv2dX2eRhWTVLAalIT066mugPmgRmeDkKhRwrh48emVP6JWZyZG0wWBLQJZ9XdfNQYuZEN9kKUJZoYgEkgNZGr8aFAk9C5um4CIynceOc7tGoD81ATbAGlPp3jywAjVqrsxrwEVr4N/axBjugaOJyAEmUH4oCmQCQAqarW5beAhiEd4KvR91Ev1hOZB6FZ1VVYuUDA7mhMI2+Ni/DmNOz+/ft36dKluLi4dRd48UQw7nXoMg41fYEA92DwNJDMfUiQNIayrvyoiM9Sqr4C0rj3vBJoBap+Vk5YUdisBGQlYGsqtstxPh2eOADphbr407YoeLoXbBiHo7oB7N4YHDATiwiahF6u8MZA6OcBkJ8MV7ZosqMu8k7VvKcSeMostqKP0gICR0Of6o+8+qHUwIvHYdMtLqTImRxFoSAihkpNpZRO6ASbJ9fXqrnab1Nze6KW7a2B5jRsMYeFhUWrT1AhSMymNEyofNgnZJS8ox9D4mlPysafn5kO1Q2bBX9I92Izq8YghkFnXmUnHQy3F96IKY6hSKqPY59A68BSObx5hrPqykGdZeHXcBjihXq9WkqU+e9ejv/xSl9Gzdd6XVML4GoOHB0a1/3CKshOLOOxZZ5SE+rjAFTAcPAdj7H0uiUWa2HbHbwYrdCSFo0GgpzAWYwZLNqWJ4Yf38uqAVatnRHYCKDYSN9Jg0+u1jhctwiveKu36uaAdy+STr0KPLElKV3J7OKxOoUQRANiCl7S7LFky3R/X2yjo4aOQzBTBfW9ZC+Gvjj++Pgnzj6x8MzC8cfH/5bww80cuJld/TnPZaTsj9MN+gyoXr326fprKobh424k9+JBdil8dzQF8pJKhLyXnIoyeDVcyRoItu8WOHsTDFzcOKtWM7A/tlLhzIA8KcwIAmtT1Sj96tvuXoeXNff80kYKdGcFWwt4oqsu273V0fyGbaYR8PJiKltt8WYyxzZp1vZh74hYuTXB9HRRrOh73b1DXBFfBBpG19q+62QY/qz2vR9FfrTh7oYCeQEOzjQklyW/HLZ6U9w+jO7UGPqK5XgMALiWf3lLbBgw3WreMrdV3sWUx3aLwu1WpcahKBbbZb7f4wOL6j23GoRSA0Vy0/NkJ3GNkZnF5XeHuroVmYAA+HA4vDgIpwBa4aSurvDLJBhmkPzeumj+cJeZRsAKrAxrKZ9g901QX4yGwIsWyoOOOftLY7cKVB1dVSv4PZa7TMI1gt8ArUs8vSJdp6+mt08KpCrmav42V4uZ2RXVH/Ukuqy0c9GzOWc0DFfOXWOCRQBICc1uyzLjX6F3nfqm3zfTfKZV38w2KNFFSIOfLVypcXAfG7iciYlr1Q5GgkQGVzNhkLHb4T7YCOCHcRg2TyrBfPKeruBh0Bmp1WE27FaJwnsAJbKjZEVc4SQBwHdki+wFJzbb3Uss00ViCym4AaHqDoueCahKiUmXpN+T3jMedQmwkB0PVOzKhXlVQy4L9jzJ09j5B+fPFNZ6xQF9FxRDjayyL53kJr93jzSxpCJIort9lSsxW5qt1V0W0ILH3B+b6DnRklcjO7wGJAHP9MRFgURe6TTgNEkFNOy+C0qtO80QFpWPGkcvN3y1AfAvnJeXFxMTo9+Uk5Nj+KOZFojG2lU5ZAUILHVyhVjyTK63kibyqnXJYFTyb6K+rFBVaRvb8G3QlmqMfkm0LN7uVVq8gwY5jQKqTACb+qvi7V65/2h3Gec+gceXgsVXQEr0cr+gBh97dvVoZ1Lk0N1Ujpcd387LQldZnVSeNP3M9OcuP7c9cfsfsX/MOzfvyctPlqtq7T1iyFBv9M972nKSDVhxDZM7YZp3gdFwXflxfLChWLsGDfuHH344ceKEflNJScnrr79eWlrarBdmpk4YDdtnPizcCF0nAI2daxUEe1bImZwhBCSXJ8eVxuk3BNsGowKB0VKYBRkBKcJ7SodFYodBL1Ov7le9dF0zd6bqX0i4rN2lh0OPVUGvgdURsJ8JosPASwR+zLBO9/ZNV3fu1x+mfbXC8XGxVtO38pjAwFMBTzmLMKlNzajW3nznWvY1HHK1Lyzz+nt9zPp6fuKl3eHmU7B9OmycANeWwaKu2FLbhFUz4GqLPbpkBv7EdgjJsmx6erq/v79+k5eXl0qlys+vzFE00wJBR7cGfPvCuDfA0hkYDU7HWROuUOwIa5CXQhLk+z3e7+7UXZcorkWvvgZsmehWttVPk+G4DZQBLYKMSDj9nbYB0IfCET8VuPYkTlraTQ+ymvoJLN7f4XBvV+7gnUeMnrXth37fu4vdSW60ENGi54Off73r69ozJFckXswNrVJ6q+RwxuFSZX2HECcxzA/GosuuzlAg42YqNQybInFN/tYZTJt/9xzk17M4rM1Bo+abo+P169cnTpyo3RQTEyOXy+3salS7mWmBWDqDSwAUJAtYerLM8q5AUW3QZqC7U/fONp0N39HJptPJcSe3JW07knnkct5l7M5T3TyuCDRJNNtRRXFusWI4uwFlJMa9IT71/XNFVsvLrFWEhgaFUK2A81vAezC4oWA4JbR+MmTVFP+553MulKsqBjgNCLLVtea9lQMbbjplZfwMZAaIDoLwqC6sRECpqrRcVW7Dt1Ewigs5F24W3KQIqp9TvyEuQ2pKixrS0wW9eliCWv3iNYCZ5KncGvt8CpxOhT0zwb01u8Ea7zybM2fO8uXLi4qK+vbtm5mZuWvXrgULFjg41NpmqWlp3UUgzQ7Ng6HPQMZtqCh8usz2qLAigsfZNheFthfZr+2+Vt9TVo+T0Gl18OqZvjNHHBuRUppiZBsMAcWkJp9Si1jCkqBwEMxLgCMfcW13SQELApbGO4cgoCQbEi9pDVvbAcuadpnlWy237J84WHkYcssdgRqPP0uXgfWnYPUhXh8L7mJ3J6FTsaJ4zY012xO3y7ngnJXA6unOT3/c82MRjf3rTdLPA8b7w6G73C2s7f7DGOSE0ty/LFxJhU234V1d67F2BH4BAwYM+OWXXzZu3Lh161aBQLBy5cpnnnnmEZw7PDz8xIkT4eHh48YZC8S2eaILIKEI+BTK8TRiPGF5IuBzAdycWKwJH7AYYk77Fab9W2LxdYB9qFipkJd3sg58ocsLtWn6oTSV0LmTdaeUkpTqh4ZygpnhlFlIa5zV1PIK2xfKHOwIPmqVVx9CwwXSQzalGRk/B90t6iKe/2+0z7EkHDDH+MKqvlg0hv1CyqQvHBfmlpMG4RcelL0J/EsgOEVR5NOBTwsowUcRH/0e87uury1Aubp8XcQ6X0vfOtoMUgT89Dgqgf8Xj5KjlBA6OmIDAI3hhIVAU/8nFsvXBO2oPRyi+76HDh06ZMiQkpKSRzkDd3Bw6Nq168mTJ1u9OlJDkKvh08uo+JNegrddNyd4czAuHev9/nKIPGSRFEryRMAoIO0mlqBYOYLYAQjwVfM2FLjm95ms6DzCU1xrWrgWISV8oeur5/KvyJVl+HOlSRSRmiIK19+pPOZd+/xEWvlHoQfaBaPRVbAB8atl0f/s8vJpDSiL4KIMSmaDQjdgbr0JJ1Pg4Gzwdkh95sy57NKFxmmZrAAkc20tI9b2fHWmz8wyVdmWxC265bd27sD9+0fCHys6rag53dDjaQ1bpkDYPUjKl9sJGIFIPHE3YDsQotpuEpWxCHp7MWyZTLZp06Zt27YJhcIzZ86EhoaGh4evWrXqYZ/bl+PAgQPtyrC/vAofna1sB8lC5D1Y8R84imFsh3q8uSAFdU4zb/PZyjQxbJRJopZ4aa7O6tJvOOXGg6UXBN7HsEEln1gu3EaN+k52PFqoIcV2Ig2TqeCEB/WwsM2qdFmFzQjCE8TWkJcIFD+SL3vZIUdGajtbkiD9H6g7Vo3JPMgugQ8uMi5e755IEwK51Pi8uHRf7iWdEyK0JgkokBfkyvO4tYMtKIeA2gPIAhBcSiiPVjLKOgwbb18SE1EGOKlYhpHR4G4JaUbSwhpMd+dT7TLctX///r17965cuVIkEslkMg8PjwMHDhQVcYXtD5/WXdrVQApl8MvNyniP9hbnQbkMfr9djyoilkE/Vno4Vl/SQp3KmrYdD0lhVaa2FS7Nx0Ku0C3c4FU78grsj7t9xcw7MUfzvI/meh2V9p3pNKrm4MYAnBSUQb+FMPMrlCJlYae4REbo+tUCIwLFeGPvNA3HUhTbE06BMLqW7ptkVLb1/H+xWNJZZOcgsAJlCBQegMKDULIRivZCwUFPcjm/fhnPUhUhURGWPFjVh5t3aCrD7CpwsoIne7TWfO8HDXedOHHi5Zdfnjt3rpWVFcMwLi4uAoHgkRl2uyKxCEsXjM2Aghv3MCP6PpTcg/hzOv2GuqFoKEyPSzv9d/o/u1J23Sm+Y2Kfy7/Dzb2cDBtlydL9ZMI+aRk26XdMVA9ogAwcAcOeRgm3J7fD3O/TvToa+N5JYE1cklrDyFVqEFwFwfGaWajaT11UBt9eAwvK9okOa6BoPcg5vSTthFzZryT3h3xJw4pGXuoHX4/DOnM+DVYCGNQBNk/FEbsdgvMnoVBYVFTEMAxJkmKxOCUlRSaT2di0++Sdh4CNEL0+NUdSW2E9RhVpMTYhqE+WNUF9ScdtDFuaIskBFjytPJcELHm/x/tVbXorClEvmaAq/WEa7HTJKAaWMDwnnr6btBaSgMeySyA/Cdw6A18EwWO6MDcg7Lpu0kFKgX8R5NVFyRno58WmCJl8BQN2y6DkZ5BPqq4hrH0vxBZAqYLoY7Ual+jVW47kVvB23YVXB0D9oUh4tT/MCULHpIDCcHeDijfbEiRBEHPmzPnxxx/Xr1+fm5u7e/fu5cuXDx8+3MmpAeI1ZuqJvx0M9zHIDKnM0JrTpR7rQHtvsHAwUYRhBEv8aVX6hlV6iixH62fOlGR+cvuT72O+r9pHWoQajKTWqpUyEN0ketwkuvbnhTztNLKavCAByyS2g9My4NQ6dJ5xLO6wwM3KrfJTaMDyK4CCqgmwBgsqHvcT+8A6KH0NVCHgsBDs5wLBueiqQ3PRtIxSvolhXwNRjUqS8rJG8dPBXu3XqnUj9ogRI9auXbthw4aUlJSvv/56+vTpr7zySnNfWGuCYZmTWSdPZZ8iCfIx98dGuY3SB+crVBWHMw9fL7juIHCY4TOjk02nD4dDchEk5ld5gMcFwvK6NVeKM7F/SG6ccVMuRo0LaVxgVzWYKyc1WyxLjAqeQAM7knY80fEJndiYhQM20CtKB1J9iBi7jloaDf5AMSHyvKX2Qu+c6b+rou/xGA81/WSF7YoyO5IiIC0MitKw6QeAt6X3bwN/ezns5cSyRDy88HyXgC8sZZ9F5OLt1NUJzXXjDTJP8gQ3r1aBaA9l+yoruMZIxlaTYWBwnmzFB1uT4WoCnWH1gSaBxCRyM1XgX4IkyenTp0+ZMkWtVms0GqFQSOqe5WbuT6Gi8PnQ5/em7NVwA9q6O+sW+i/8rt93tnzb6JLopReX3ii4oRWT+CLqi3d7vPtK8OrjC4lfwjEfi0ejov2T3evsGpUSBv++BYVpGLSh+brJM6NCURR7H3AJhIp8jGZrvV4s5NLqTKrGZJ+ALGlWliSr0rDtIXgcZIQdJx6bT30jIXSGdUbpGHYO9sGEKFm5lOQLWVKEni+VBgQyRmSpjYpxTPSaONB54JHMI+mS9GDbLqPdh/EJKrMMJwHHE2HVCa7oSncT8aBiQUc722dG8TZehcSCynwSNXTzhFf64R4jfcDfmXvY6WfjDFiJ6hsFzJGQp1LIPBW4WuCEqKM5Z1L7RV66dKmkpGTSpEmpqamvvPKKVCp99913hw5tf9k6jeL76O93J+7WKYoAqFn1lrgtIbYhKzuvfP3G69dzr+N3zI2fpcrSd26+08ex9zCX4V+MRgED6r7PT7UCTn6FVq3vMs+1+5MFPkYFjeJ7dwXnADj5LWRF6RpfEmDJkhamksYteBZWfINUmP4LFAXpP0SN0Vu19u0VKljHThrGHrHDlTYjJSy3EpP/IcfKCLHfZf9nBuAUV4u9wH5Rx0WGp/Czw2fA/nhQKo0XzOn5Qw7Hxwe75HdxcIovxsn+1ADUVPPhFBE62MJnozDsVyTVKaVYilD5oD6iyNey4IVjohtZujcGOMLXY2FKILRz8OvfsWNHv3745Pzss88EAsHQoUO/+OKLvn37CoXVtS/N1KBCVfFn4p/6MkmEc+puTdra1a7r2eyzRsKXcoX8j/g/h7lgd/j7WzUAZEZCdix2ljaCpDTdpuK6vKIQEi/i6K07Guuq5j0us4jkV9ccYWG062g/K5xI6+BbpA37KDqTwUa5hldCQDSvSwr4BaluS0m7ZdRHf5NcKijApRj4JwV+n4QegdoolAGqNdToDSZXWp+N7UnywFkEn47CodhI/3RWZwhxhK1REF+ImSeLu+py1+qmTAFPHoa72QTeyNxXnZAPK4/hoG2yYVD7gWQYRiqVenp6KpXK2NjYt9566+WXX2ZZ9t49rp+bmTopU5blyfNMznvTJelSubSmDztTmtkAmTdJYaUEkuHxCUqSDypOek9abOAG0/6WfbXUoYdSWHVqFvxs/d7u/raRbglFAUWRxs44DVBWdtTQJ8HefS/5uN6quTdAhQw+vsyZbi3YCsHOSIRMd1XoKGNYKqccVRPjTcVSOzvCpyNh7yz47rF6WTUAHE9GyeRqswMeZBXDYVz7t2tIkiRdXV2PHj36119/KRSKLl26lJaWqlQqPr8NNQt+aFjzrd2EJu5Bb7G3l4WXSCiqWSDtKfZsQN2LcwDX+qv6UTRqtYOfzmFm6YAL5kp/tfYcsTxFKq00fFOONCeyKNLo2B1ssGWXcf4IA72coeOISbDiwD8+r1dz4HO2HZUD4TX77FUipGF+CGfGtT27KMgrRfXyJgGVUkzlvyS0+yQMfNIvW7YsOjr622+/femllwQCwbVr12xsbFxcarQqNlMDS57lEv8lukiPFi7es7DjwqEuQ4e4DKkWs2aApunFHRc34AROfhA0FgUJdabLgloO1i7Kzo+x2qZCYjtsmotxJp0JqlnNOuvCEsrgfidAqpR+G/1thbraUEsS8PpAcLfj1Dk13EuNKgVvDOJmtSJHmcDW2GwI3EdeZy7NE11hRR8uPdxQd6HaidHwmiR/28fa1EOEBe92n4SBht2pU6eDBw9eu3Zt0SL0hYwePXrbtm08XhtqFvwweTn45Sc7PykgBWjDahCRomeDn13RaYUFbfFtv2/7u/XH+5v7lbPQ+cs+X452H92QwxPw2GvQdz4K9yokGN9yC4YpH4J3Ly70xTFsBQx9FgTWODlXKjKERLS4Mt/T4DBxpXHJ5clGR+/tBofnwuKe0M0FurrAoh5weB70q8wx7+lcY7XMgJMt+NepASqiUeTk5EI2yOso8Hea2IPB/ltNUq07JRA62lcftDXgaA1T6tfZpw2jW53wOLT/FwiaJq6v0WhkMhlFUSJRrVW1bQA7vt2PA3+c3WH29YLrBBD9nPqNcB3BI/HLDLYNPjD6wMmsk3dK7tgJ7Ma6j+3l0KvBJ7B0hKkfYc+g4kwQiME9BKxdiNJSHi2ILY39M+HPxPJkFyv7BWPmD1HZAkFS9va8mDegOMYoOZRH8aoyzwzo4Qpbp8K9cnwUGOlyPtUDlfqziqrKm0EDs4Mg2JSz+lbhrVPZpxiWGek6Er8EH+LH8epFZ16/l+wPTN+qi9GAjUWTGZ6tELXQnj3CphXr+pTZiLCzT7em6zHYSnmIKqXh4eHff/+9VCrdtWtXUz0sWiYCSjDOY5xxR3gOF5HLIv9qMaHGQFJGnUZ4BL0rbdea22tyJbl4Q5Pwh8Dqk14fvxS0ygvAO+Pn6MLqhs2Cj4WPv5VPXCEcikeHk4slTA7E0ijtwGmyJtzfHnZOg/cvYkhJokKFwOmd4aPhwKv+yKhQVbx7692fYn9SaLC/Ip+CpQFLvuzzzUiXyf8+Zv/9rfDTdzvkFDvgGM2CoxV8MgoGNV3+9uMd4dRc2e67RLJE5GODHvvOj0gipG0ZttaLLpfLraysDM1VrVbfunWLz+d369ZN6xzy9/d//vnnf/jhB6VS2bYNu+lRVEDkf5jOrVGDVzfoOdOo51aOIvfN22/mSnP14TSFovz98HeGOQ3yt+qYI8uuKTBcoMjefCf7m0v+8do8TRY23oB3hsGaOpOxh3rDoTnoLdMadpCjiX22JG757s53LMFyK3BPpWTUr9f5TsS5jwfM6OsweNuYQbe7lV7OgLgCcLOEsX7Qp6n1fT0smDX9Gb64LU8MH65hy2Syt99++8SJEzk5ORs3bpw9WyeCk52dvXLlytLSUqVSGRQU9PXXX9vY2Njb23t7e9N0U00K2k3pnawU9q2B2HM6f1j8OexZP+dbcNNJiAHAybyTxvLgJFTIK45lHn0y8EmJuoaEHwGFEtHac+K84qq/eakC+7wPdIch3sa7Z1dgy3hnCzRFMQ/NuzYUjOKX+F9wTU/QIHkWyt4DxhFY+PS04l4B8fVosBcRPZxtezzMubGGxcQYcxTHkIaljpIkOXHixK+//rpDhw5SqVS//YcffpDL5fv379+3b9/t27d37tzZxLXWWGnMiQq0B8J2QuxpLL3kCfFF8yEvHs7/xJV26chT5Jn8Y+5M2Xkp75Kn2LOm86yg3L+owt0oIUythO13qzbINZICmeLNMzB+B4zfhUKfH1zAJJA6UGgUCWUJeB/JxkHJV6DhxnQCWFbwZzhqxZhpBYYtEAjGjBnz2GOPWVlZ6bMslErlsWPHnnjiCW2QbNasWYcPH9b+Vjtc1+1gv/+QXpYDN/4Wn11HXfwZM7HaNkoJJFzgypINZigUD9JvYeFkJcHWwSZmMCTElMQsPD83oTxCLDSY4rAg5JHDnWeaeMyycI8LgYUX3nj2yrNd9w/o/Mf5Ly5BRA5kl0FENrx/Bp47Vl1IrDoCSuBl4YF+ackzwBpkxXB6Y39Gci14HjJmPcyaNGYMlMvlhrlTSqWysLDQ2Vk32fL19d26dSvDMLGxsR9//HFkZOSLL774xhtvGEqXJyQk/PTTT0qlkiCIM2fODB48WC6XKxTGQwNL0vycO6JTXxCZkUJ0vTBwdYtyyApZj9laEWxoYxAkUVFgoZBRRsq7BMkqZZLCXLWFF8GoCSD6Wvbtbds7vDDcWKmbALW8X2bJRGvaQ8Q7rRL8SxJKB57z6sBn/XhTLsUwKpY02j/AUnMh48y8q0uyy7NB8RgUD6uWBkvBzjuwKFA63FPJApZq3y27myRJ8hJ5dbPpJqbEDMvMdJv5eeGXoA6q+awplUNERsUgd00dj4YHR6VSsSxrbnFB07RCodA+5ppgcstw6AdePp+vVqtVKlVAQMD69et5PJ5KpTKSbRCLxZ07d1ar1QRBhIaGEgRB07RGUz3vgSBAJeef/IK4F8FlX3HIS3lnv9c4dGT8BnJN0NsWBAkCAUHzTD2zWJqiCB4PNRGAsOZb/9Tnp3dj3z1z7wzqIugU/8VQ9j5IXgKGX4Y2u9zHIeHNwfGTvLu7ilwKZMzIDnAinvuba/dnwNUG5oVI1979MrssG7erhwMYFwiwDJzPFIzzI++WJLx96+3jOcdVrIom6H72/b7u9XUfxz7PB72YpsjeWZwJ6gAj2xbQ4GZN0zyCeJiqdkZ3YLuFpmmSRE2kpjFsHo8nEonKy3VNmAoLCx0cHGgOR0dTXlQADw+PFStWaP8fGRmp3dnEHyY5EvLjgTLwqJM0oZKI0i5B8AiAtuhpZyXYy7oGBEEKxUIQ8oFzEpWoS3o69dzrtvfvlL/XXF9TpCjCRZV0BlS8goMsZ10sEKl5gRFZgSu64Y8uXDfJp1QoM4ZrYAZsxRjyFVunRJVHVI7SpgZWhkmSJUopp9W3V5/OOq2dI6hBfSXvyqpbq/4d/a+nreevQ37yIUo+P8sCbZCQrobRgRDiLnzYE2WWZRmGsbBoTPPtNoZ+2duYumuRSESSpD6ZXCgU9urV6+LFi9ofT506NXTo0Po8PhMTE/fs2RMTE0NRtaiHFGfiDWhcKkRBcZaJ0oi2gcAKLByxWssQRoNpKlYGSb4sqBiVJW0523c21mxh8iaNWvxs9W+SwgyTjMoy6k4OcGohHJmH9c+OYihRwKun4Ln/7MoquBU7dgm6AERlQpsemtmf+/TyS8sv5l6sNkun4UbejSMZRzCJhrZcO8hzeR8uS4RLswMV9PWGz0a2n2BGy6LBI/Yff/xx5cqV2NjYP/74Izw8/MUXX/T19X3qqadWrVolFosrKiqio6Pfeuut+hyqvLw8PT29rMyEYo4OR1+cnTLVbZvRoMBAW/WX0ALoNgkrMTVqdIxrp8K4FB4Klk7oGOdqP3gkT5vcZsWzmukz80beDezfoe5Q04xkasgqR7UgLQIat4RnQ5EMj5ongbwkL+D/AQ6TgB8Nwksg3gGS6oLBFls19KV/0giNqYfpraJb2v+IebB+HIzvCCeTsah7gAdM61R1XjMt3bDt7Ow6dOiwZs0a7QpZO/SPHTv2r7/+2rlzJ5/P37dvX0BAvTIGe3LExMQYr671eHbHvnPxF4An0CX7a9RYzNR1QlsOa3ebDCVZEPoXlObgp7RwACtn3PLLLBBaQ5fHlV1GRkvyLPiiLkIsjH4l5JV7sqwt8X+VwV1gjW3bkl8tUbREAZ9egaKKyr8857vGJ0LFarBbASAFm5VApaD2IOMEVD4I94Dlj0CwGsOiDX0TPxYcBFV5XmIezArCl6lueWZatmFP56i5vQ9Hgw7FMIxGo1Gpau93SvFg/P9A+T/IvI3ZGgSBVj3uDVS3bsMQBAx/DgKHY4iLZVA+5fZ+7J6Fkxf2QP6ZDVmO8SARkLy+Tn1fD3m9q13X7/v9sNT/iU231T9fYYEldAssTlh7Rg/ULdATVwBxhQY9rvSoeoPGHqgCIGVg8yEaM+MEZD5Qhfp1t4jmydRqUAWDOhCodKBv24j4Y9zHmPgED+27MVNPmtORGBoaeuDAgbCwsAkTJtS6k3NHWLYZ4s7JUm7x7d2oLmPA1gPaA25d8KWSw69zUNyf4gFL7LYufdIpT1Keq90loSTh5L2TvR16B1gFzO4w66fRwzz48G0oFHKhY4KGqV3hg2E15UxqwKLOESuwL1YXaH8EslBn0lqr1sBIz6FDHJZ+dFYIqpnA8lCumDo7s3/McNdhD/+7MNOqDDsgIGD+/PnR0dG1TsW10AI2eJzUawhlaVEvOaG2RNpNKEjW9u6Rk5pPbfMlusY6OvJl+ccyjh1jjv2W8Nt076l+lh1XDx9HKocqNUR3V1ThNZLg7eyILrTQtOp/eRb6upGUnc+R9PiqwdygwryDte9bIe9vuDwKZJWjPcsHxbj4tHHazFMzLY3mNGwnDhcXl/tLBbEsoVaAmgftTddFX3QNRBytjOFV00XhNnMvEuRq+c7E3SgDyP9qTod564dsEFMmPFc2Aqz6eCIXJMrKkAgLwE85Wz6th5jq7tg9oihCd9iqMxBvdn+VVo46mFA9ikLBpTT4/josCjFdHGKmGWnOEZBlWY1G0656dzUAaQnEnYHCVGzTxbXJkxGmxEf1aN1gJFSoVH/E/LXuzg+17TijM+yaAQHOqcCWAVkK4r/AYaaSigzLuzXEZci6futQzNTg8cECu+7u1+tuh+PZazQn+vQSJpavOAKFVaUDZtr3iH3t2rXDhw9fv359/HgDxTwzANge4NxPmCRPUsAy58XSTZbFYQKpuj5ZtNwYvjdt79OBT7uITOtbDfTOtnCbDWQcChqSXHcBbjl9Oe/yhz0/zJXlfhHxRdWcnIC4krR7yn8Aeps8XVop/HoNa8X+mISOcTPtfcT29fUdP368t7d3a2+jK1HBb7dg3j8w/1/YHIGB4gci4SIc/hhKMlEWTKPZIyqZ6py+zao0nqfSGNR11GXjBK69c2U6H1tNcmRFhYpsoMrRqvXLaQKbH6RVpF3Jv1KznLuC2kWQEpPKgbgzDQfiuJw2My2D5jRsV1fXQYMGeXh4tGrDziyHSbvhmUOwOxJ23YZlB2H6ngcoaWLUELYL5KVc42uihNK8ZZdfSjJGZmzNt7bkWRpLiGoc9FWTSkapZGrkkFXiInRxFrrW1ADE7SLnAgXnG6+OQJi2om8qdixRmXqmkCCXQWStTxIzj5rm9zI3QGS7CclPhtv/QvRxXMo+GF9fhXOJ3BfJ414EHI+DH8Iae7jSXChK1VWes0SYQJbMq2GfLHS1CNo9eNd47/G0djGl6gpFv0PhUXwV/QHKLiKaENO19ntwFDrO8pmlPZT+mAAw02emh9ijj30f40cGA44C1w+Guh6aB0/2Bjcr08rhRj0AzDQjzfmnKCsrKyoqKi0tfaT1tIoKOPkNRBzEJpMEgLUrjHwReppIuakPpQrYedegXqrSifXXHXhnSKMWnBoF5o1WfiHltVRF8SryxriMHOf7+Pmcsy9e2B6d9RGwnrrfKfuAdHRHt/UeYveYAmBYCLA30cpzdfDqe7J7WxK2lMkxpddaaP1EwBMvB78MAM92evZQxqESeYlumc1gwfOqoJccBQ4jfGCED8r0j9/J6QfrP7UGXGxNKLGYaY+Gffv27b1790ZEROgllh4F53+BK5uxDlRrPCWZuKC1cQO/hjRirkSiRNs2hoB8CTayb4xh88X40s5iCLa3UmTJkOVkdfMmYICEItVKihCPchvTkRgZraaq/SUZ79ycz575j76WhYYd5AQv9YUJVeXwiIASfNfvu3kd5l3Pvw4AfZ36DnAaQHJ14INcBv017K+1N9dGl0QzwDiKHVd1WfV85+f17x3jC0/3hF/DK/sBs0Dy4LUB0MUg6IVOALYeTb/NtD3DHjhwYO/evYuLix9dxKsgBe4cwSwuvZIByQNZCdzYhUnpXB5Ig7ATgq8txOl74mphMK7bSP8wqW9Gj/iq+M+V231pW5XXCQR0lJEL6C7a+rk9MXApnTJOESUhJo+OydattDKK4HI67JkJ46vbNkmQg5wHDXIeVPMqJnlNGuk2Mqo4SqKShNiFGHnXKRLrPfq7w85oKJXhzHxxN2y+paVcCf/GwfEkLAUZ6IFyxX7m9pftyrC1YuaPtDNBURoO0dqqKT0kiZ2ipSXYLqeBiHiwoie8clR7HO5fbnB9pqdu9suyEJELt3PBQQQjfLEX9H0Q2mBzD0bDVXGxQLD/K3ESsuQvVkVFJEMCDJIJP8+z6TxscpJM+PEZOBQHxXJTaaLYK0v/AUEig2/DsMVs/R83FrTFAKdaZzF8Cpb3gCe6oUaKvbjq/KVyeOE4bIvghmwCDtzButGtU6Cna33Pa6ZJoNuX84zRcI0pjT41gUVjVTleDeO53jjx3nQL8jmlCRdreLYPPMlJgOdJ4KUTOHzJ1UARuNb9fDRMrbvDK82HHlMh+TKAHIDPAmXFyj8osnm+2CJOoLFTE50UBK/X7MKg8SuPEyiHwiWl3B8KtcSTiuvVmLb+0CQ4iKtt2RIJ224ZOB0ouHMP3jwLR+eZp+XtzLBrVVl4GIjtQWSD/jPDWTejwaIxi0bKzAtp7As7Mwgi8/Bm7u4KPbl5q5qBN87ArgjdXa4BiM2Dpw6Dn+39rKvr+LLs9O3XCv8jR2iA6sNEPO13z8eRdM64CyJb7NTVfdK1NMGJZAKd8DXRhrhrWnt1fcSHgYqBPbHcs8bwRDRcSIebOdhOqI7zVyjRDXk6BWgKi7pnB5lw+JlpHYYdGRl5/vz5qKioMWNMlP49FNyCwKcPxJwAslJcnmVxTdt5NA6VD0BvN+POrzdzYH9c9buchoIyTGX5wUTLkCqKlLwFJS8cJ3XGeZwYslsKf/eFnuOVqB7DPZJu5igxz7SmoWjASoQJ4Zmc6FkVDHa96VjnWje+EKILcP3cw6WRAgkaBnJrdtglQK6CUdtgQkds92dyTp5WCosPwMU0nTduRyTsjsY8Nsfq0wEzrSOOzefzra2tH2m/Xp4QRjwPTv4oqK2S67pYdp0IPWc0+anSy6C0vMYXzEJM4X0aTf50AyPhVW8kIDEPPrgICoKvn2hYm/zONPCYP056d0/nZsgGMWoLETbWFNXyGNcwePzxO2D6LpiyC8Zvx6ePQg3R+XDjHpTI6/uR+RR0d6l0lRtCQLkCE3hm7IWomoLoLHxxBS4mV+UCsAQcioafw+t7XjMta8TuzHHp0qX7lG02LZ5dYclmuL0Psu7gKN15NAQ/XqWC2nRY8YDHB1UNMRH7ykCbScoUppq2U3A5A6Lzqoa7sd4KZwsqT6rTLURYsBTAm4NhsBfczqnx7ODa79TGd2Hw/tmq2+FuPmqJfxcGySXokfC0htX9Mb4luN/cmCRgRS84Go85tsaOegItNrUANtyAjeOrfQOFMvg7pvqdyOUCbI2CNYNAaJ6Qt9I1djNUd9m5Y1LKQ6a3G3R3gxvp3CikhcXve2ZlWMgkMjV62mpqI8hVnLVU4mnFDPNU7401CHRpIMQT22KxAJ9fhaJyg/MSIJHDl1dRh6xmcliuBNNptNemgwKNBp8j2stILoLVx3CHF/re/1OP8oX1E+Ddc5BVYSqZnYZTKTgXEBp4B8qUOJ4bQ0C2BC/DhNiLmVaRUtpWcRTD56PAw76yrbwav+vn+2LVZF3vEoGHtcrYJhhc9HrZVM1r0srJM+m0UXV0ZA62xcytgFs5Nf6wJPr2EotNnDGtlJMxrVH1gVsqi73VDHx9rV5zcpKAZd3h5tOw4XHT91ZNa3cUc6psNT5yiCPwzFbdtg2bIAgxJeZTrUxlYbQvrnjXjoQJneCJHrB3Nnw9GkNEdcAQckb8MxBlRlncSsFWJcRoNyg0sC9eWCQz7ukhlcOJZHRNm4RlTa/tLXm1rr2rINEbh2Jp9cNJjJH8Hq6cDrEhahjTAfjVT2fFx3k+Pvv0V849wZ6uzAUw0yqn4vdVIGdYJiw/LDYv1snKaYDrAENZzJZPV2d81X9GmVaREa9YB3ahIH0L1F3Rqql0sNqWxL6fWP6Pv1XIX1GwLhTu5PNMBrSK5djpupszxBv5qDTQxcm0V7yzIy7L/y66z0OeJBuWS0eT8O4QeOo/KOB0jhEGOrnAi31MBLRf6ocr7c23obAcd3a1gZV9YQnX58BM6zPsM2fO7Ny58+zZs3WEu3JkOW+Fv3Ug7UCxrJigiT6OfT7r9dlo99HQimDUlEqBlsG7fwNnDcNgmyvLnSC+AKqeKBtIxwEvGhi0h7+jsT5UUftzoo8bZsK80h/OpHLLbO1uGvSKv9LPtGWSBFpgVC7E5HFjpnYSbjSZ00BPd0ywqY0SOfwRgSdlWey5+1QPnGBP8If+nnBYG/Pjph4zOpuO4Yt58PUY7FkflYfX09MVQ25mWqth9+zZ083NLS8vrzavOMMyL1176e/Ev/HOoDFH7XrO9WWXlh0ZeyTELgRaPgwDUf/Bjd2QHYOJMSHjYcBiLDipHR8LH3/rgNTSNKCz8KVFA97WXna0/2uXarFqrv/GAF+YxAm6D/SE/bPh61AskNYXgRglihsS7AQnFsLvt+FqBuaH9HFDF9fllKrngqMVfDyy1qrMjDJYsB/1z7Rz6SNx8E8s/D0TDsXDiUSDqyXhl5uY1jrOz/Rx+rnjy0yrN2w7DgcHh9qySiOKI/5N/7fqGrn854yyjD2pe1qHYYftgKOfYKicpEElhQsbsQ3w/B9BXK1FoSFCWrjQb+GprFM4fdeLDTIw23e6Ldk5zuSEmcWU9TEB8OWYqt4Aw7xhiBeuimsr2zTC0wreG8pl63Dz5Cd7wK+34FAClq8N9YQVvaF/7aLP34fBpRTOCV95lusZ8PYZuHaPW/AbBOSLKuDXm7jMpszppe05V/xm4U0TMiAkbmdYRltj2HIpSofQraiIovP5URgtT70Gt/+BQcvqeN+SjkvSJek/Rv+YJ8GFskggmh8wf2Wn58OyIwFqrDsZ8LOHf2fjEtrIWkiiweKh+vCylzV8NBz+NwRNvW75BKkKa7yMJxE05paq9c8mPRTKJyk19XDXmXkwWvQX7CgwdWNy6vatoNd5fiJWiVbLVCVwcp4SVrdhEwTxbvd3J3lOupJ3RaVRBdsFRxRFzD83N6k8Q00fBE31Kks11ks2bWmHntoyUhiDQms1Y7q8DK26JizYCs19QqC9G/ZIt5EB1gEJxQmGKvY0Rc/wmWEqT7qFwdQSX2KZqilv7fRy6NXLoRcAfBX1xevhb4LSDZggEBwBVWdg7fUdfHp4cbGiR8XNHNgbDbFF4GsDUwJRTUVEQw9nuJpefdBmcGHvbgWnEw1uMRaX67ODzApKj4IW/R1b86y/7P3liisrcFLKGQJBEs8FPWeyX1SLw8kPHHygOEPbH5ODs2ef3vUvs8pX5H4RtR5K3wbZYmB8gCgBQg7UTR54eVo4TQnEbDD/ppMxKJGj3yvsHo6rs4OMy1p23IHVJyBPm83CwG/h8PEojFSt7A2hmdhbTe9sQ+ml/uiEm1sMCQVV4/lQP4xvm2kXhl33pHqazzQ/a79N8ZuiC6LtxHazfWfP7jC7xQ3XigpIuAQZN9FivfuA/2CUN3LsAH3nw4mvcJlNUGjVagV494KeM+tzSDWjjimNPnnvWGH+i1D+Bm5C9W8Rl69S1i/ww/1jP3CytjdOQeGW1o3jTh4sOoCyEGiZBPxwHXuGvDtMt3TPKoNVJ6CwojJTlcJCy/fOo1NtUVcMVv8YBolcBouvHTzTG/PPaBKOLISfb2AmHE1itumKXmB3/5CfmVZu2AqFQiaTyeX3yVTsZtfth/4/FJZJ7K0tmsegi9Lh1n7IjQOBNXbwDRhabcitKIAjH0PUUW7MYoHcgn1wJ7wDYlsYtBSElnB9Jyq30CLoMhYGP1kfnZaLORe/uPPF7aJbpTI7kF4yyjADdWepZKyQrprn50owWHUhDQ17mDf6tF0tG/YRK5RYPR6Rxdktd1PIVPDJZRx1J3PKEIcSuV5/hvNtCkolKGw4wANe7geT/OFOPj5cgpygc+VH9LeDb8ZiiI4msCDUTLsw7EuXLu3YsePKlSvTpk27z67ZMYJ7SRobB9qrGwgebQ+45FDY9waU3cOoFRAYl+6/AB5bUznBZlEa8fYBTD4hKvvU39yLw/WIlajB1Hce9JgOsmLs1CO2rc8JbxXemnVuVl5FHlqRrB8wJt5FKIYzrG6Gn1ICs/bBzUxd8umJRNgXC3tnNkxpLDofzqVVt1sCazBeOo5j7BAvyOH0YWpcR1UBtr89vkxy37IwM23KsIcOHdqnT5+VK1fWVeAlLYEz30P0ScvyPJZvAR4hMGY1TmgfDdJiPHtJJkaqdOlTGri2DToMgM6j8EeFBKIOAy2oGsMJEn+MOABDnsT/YBG4AHgNkPz6Pvp7tGqtuhCp0KmHGcKCo1BME/ilsQCfXYGbGQa1XAC3MnHjrxPvs2LJl2LfkrNpaHgEAVJ9mz49JKQUoerL9eXQ0027Fqh+LSwmt5hpgTSnYfM5BAJBraFsloVjn2PmFs0HiibUcki8hB2tFv0CjrWkL9WDe9J7hzIOhRWEWVAWj3k+NtZ9rIAU1LLrXciM0NmnFoJEeYao/yoNW4rGbxRRJwgoy8MVteEb631tNwpv6IwH+2BeBjoFVH7VzYkZ4VUupLCGPL0UzqeZMMjz6ZBWggqqtZFWCrP3wfXMytKL2rTTKNRg3RuDC+l+HhCm7b+rtXANdHGDibUntJlpRsgWLWaYGw93j+NoifKDBNoPXwz5SbixscSWxk47Pe3ZS8/+EfvH+rvrp5+a/vK1l2vthqOoQNOt6d6Tocg+IrLClgO4ujb8SAzYe+Hcu+EUK4vLVGVVZkyVgdV7QJbrlMy0L9H+XOIHDdeCU6oyXb8tU1er3zZCO85f18aotA1MarsROBu+kwc8En6fBCP8uOo0Fj1q3d1xUlDHs8NMu/aK10X2XRz3jOyKpFH8hGWMx8l6oNAo3rrx1vWc6/qJq5pVb4zZ2MOux4rOK0y8wcYNrJ3RjA3FDwmyar7AE0GfWXDsC+56iKryyD5zGyeiJqJEIsrAccwCiLcBlQ0Vz4KmAxASEJ4A8bc3SrsqmFf5gDmkPjaQbpRqyuBGj9p1yzJK4Vyq6exU7gNW30iAN5cCG+IEJxehiy62CDrYwjAvsGhldbTtiJZt2EIrtBZM5zDYyDIgsGyc4ubdkruX8i8Zq/Aw8E/6P0sClmgnt9VwDYKAYRC+F/gi7jnColiahQP0MtBI6zMPiu+hw0zNDfu0AAbMh573cwfWgpASCqgaE3jhaRCcBo0TkBIgpcCAXKPWznSsBbC8O1xKB1Zd+cdUo8Uu7w62ta8DKlQgrTnOs2AjxLSacrmBzWvAwbJKHAKjVh3wZaaF07IN23cA2Hpg83d9jgfLqYIHjTalkX9/ihRFJQoTXfiKlEVStdSEYdN8ePxNzANNOA+SQsz6dg+BkS+Aq4EMisASJr2L3b9SwvBx4zcA3LpAY3EQOHhaeEYVRJkYSKl8/f8N8+SXdsc2Q7/cQJlEYKGzEzzTBw27DtytwNsaO4QY12a6wrwu8O4FyCvVndfDFtY91kjRUjPNSMs2bJEVjH4ZDn8I5fm6IZqkcIT0H9K443mIPVxELlkVWUaPBU+RpzWvlpvX0hFmfQU5sVCcDnxLNGwLU3Ekj674emAElGBJxyXHMo6xmJBdy04M2PHtKEx60fFSP5jWCYuZWYCuTvdf99oKMIHkcjo3vGtvAa5gY2EIllL3dYcjiahk6G+LQeyHlIhuph0bNkqQTAA7Twjfo8pLoizsSJTLn9KIJltagmyDpntP33B3g+FGIV/4VOBTtHF7EAMYNbbmxO6cFHbDfMjM7TA3XZL+w90fMssz8We99pgWLuA03mW80fzCxwZf9efJHlDCjfOY8gkQ4IjpYk/1wP/3csWXmVZNizdsHE+7sZ7dyvNzLW3t+Q/c6Oud7u+czD4ZVxKn1+tZ1mnZRK+Jtb6hNBsOf4RhNnk5PlCc/VHhtGvt+zcFa0LWjPccfy3vGp5fWfpJ1CdF0iL9b2f5z5rpPVPNqGs042sYr/aHaYE6oe+u92snYKZ10RoMW+tqbnhM2CQ7k3emlKUYtrM+mHHwmU7P9LDnRisj1Ao4+jmmoGi722I/rkQ4+B7Y+2CqzMMkxDYkxFZ3igHOA36J+yWxLFHME0/0mLii8wqNRKMxirE1io52Zntum7QSw9ZXOz4YWdJ7v8X/plQrq4Y6ArLKsn6M3vDbkE0m3nAvGpKvAE9cFVqjBZgMd+ufh23Yhmib3ZapysSUWLtkKGFK+GCONZlpkQkq169f/+ijj8LDwx9ZX7644rtJJQk1NbQjS6JKTXnLoTwXazzIGn16irnV76PFmmddlyOgBrkSlC47kQxZJtO8zbRpmnPEdnV1HThw4MWLFx9ZJ12+SsFTqZVGQx0BPJWCVspAUMObTNKm02BavML55kj44RpEFWBcOtgeA2Av9GnuazLTTkZsLy+vMWPGeHt7M0wtIvdNTQhj04OtURzGwmiVvQVVqQNoCMPgEsDE9kY203407I+Dp/+DW/dQnwiFUnPhxWMoD2ym/dD8ueKPsiOfrV3Ht8ietsrKABL3GiijVgr7gMhUy1aBGHPOak4oBA0sd36EyNSo8qtWVVZrcNKuoMEGmihOVm9SSlBRdN01bBv0qGZUZtqd84zr2v7gAoZ27hM7Lzl8IfUn69JYvooPxCiJ4AXo5NJ7iekpt3sweHbHlDJ9O06WwTLMrpOgpXKvnOvRZfRVkZBagqVgdvWoTFFp4Mdw+OCCrlkXn4TZXeC7x8zdqlsTrcWwuSRtjRoeOI4Ng5cOKsoYdGtfPqniM2DDt8OEUI9g0zuL7WDUS/DPG1CSzWVjEziA91uAIir1I6U8ZWvS1ojCCGuB9fwO88e5j3vYsk5CylTrWRaLruupIngsCd48xXUm4J51Sga2R6BVf/dY01+tmXZs2Kk34OZe66xo0toJgsdhcsiDiKik3oCEcwCMk4aH97uiDCL2g/9AtGGT+A2A5dvgtlYayQoz4fyrSyPVzvmc84svLM6oyNC2ztmWuO2FoBe+6vsVj7z/46lMARF5uEju5ICp3fXH3Rqb7NzNNpYNHehZV48ePRoWfrsNCu1M3qBb9ZYoeH0QuLfcJYiZ1mXYkf/BwfcIWQlN8SAvFuLPYTONCe/gyNkIFBVw/mcMVvGEQFTWKMadhRt/wzBTZZta7L1g1KqGnqpQUfj2zbczyjLwO+aGPg2r+T7m+5FuI6d6T637vYcS4PMrqCuoZqCTHSztgaKf9YQAeH0AXM3iBMwq8XeCtwfXS+dQpUGZpJq+l3IFpBSbDbvV0PzOs7qQFsPJdaAo57QWKKzxovkQ/jfEnWnkAfMSIDvaQA+4ksRLmArepIQXhoflhRmpiIEGdiTvqPuNlzJg4b9wJRXb6yjU2PX6lROoGVp/OtjBkbnwvxGoizC8A6wZgq256lnLQZGmulVj7yFwebRic2ba7oidGo4pIpTBRRIkrnUTLkDIhMb40tQK0Kgq36htLcm9NEpgVABNKY1bpixTq9SGUmRaipRFLLC1KSizAD/egHKpwV+Gxhqs329jM0rXepuWuxX26JGr0aEtaohfgkfC/GC4kFxZfKJFBWM7N0wd0Uzz0rJHbAWXM8US+NL/hyBALmnkAe19scCbUQAoFSDkCiMVOIw6+aOoQ5PiaeFpLbauOfQFWgfWoYueJ+XKqo1+T2ERZWJVGUh9EdINs2oti7vCs/25qYaKq+tUwSA/+GxE4xXLzTx6WvaI7RECtDgSCjdZlybwlNYMOVNiPbtMQHh2b2Toy8YVek6KOQkbyXlRRCAf1BOZs09YX7TpN7cO5QaZRnYy6+T1wuuOAsep3lN9LX3rc6qe9j3He4zfnbBbF0/map4thZZPBjxZx7v4JOe7NnocsCCmwb4xGmqNwYIP346Fx/3gdApqrfT3wG4+bubVdauiZRu2U8CBkKBn8rblCXR3+h5R2SX7jp8FDm70cu+i1zPzxIvuqay0xnYcBh9xLN1hb1PbNDO+LH7ZpWWheaGYHkfAxxEff9jzw+c6P2e0W6GiMLY0lgCii20XWz6mpgoowbf9v1Wz6qOZR6VyKZAQYh/ybs93tR25asNOiLXQ19Kqb2XBXgQ3siG1FNvuPIK1rpCGqZ3wZaaV0qINu0xdtoYIz+NxrWs4WAJ+5t8brUqcCo2RHypXwgeXqXtyq6rPTcKxTJtNt2DNQBP7S9SSNdfXXLl3Re/ZLpAVrLmxpod9j4HOVW/YnrT9++jvY8s4w7bpsjp49ZwOcwDATeS2Y9iOq/lXU8pTLGiLgc4DPS08675CFtBnZgwFsYWwZD/+p6crfDgCRrk04tObaUe06DX22eyzCcXRRg1u1CrZ/tR/qmy9IdzJg+v3anxoFv5LxI42NQkvDMce9IaebRIkcskfiX/oN+xJ3fPk5Sev510vV5aXKctCc0KXX1p+KP2Q9rd8ij/cdfjSgKWzO8y+r1Xjg0OKjXJMLwu4h9GtTHj6EFzJNLfXMNNMhs0wzJYtW954443r1xsSqzGgQMHJ9hhB4Ly3cQVhUjVnwDVlwlUgN5WxniPLkaKuuPH21IpU7ZNFySi/i/5OoVag8VcmZkuUkvUx69WYqdZgSOCa4NX24QjUAM8phT3xPLXWoWjGzCM27O3bt9+6dWvKlCnfffddYmJiI47Qy6EXX1sgaVCzAQxuN5TprD8dbVEQW9f7woDOjtg4tiYOfAeBQGBsZgS4i9y1nu0iedHNwps1E7Mv512WqBrjuncQQxfH++1EQVQhT/noamfMtD4aZh4Mw5w/f/6DDz5YtWpVeHi44a8OHDgwe/bshQsXnj9/Xrvl3Llz8+fPHzx4sJ+f382bNxtxcd3tus/ymUpqLKFiORSvh9L/gSKwo53PnA6zGylnbAuDPauPhyymq8zrYnry28+p30CngRjy0cMARVOLOi7S/kSTNI8wEVAS0kJDFdH6w3LNPe6zzmDBTsCYg09mmsywZTLZv//+GxERsWfPnrt37+q379u37/XXXx8/fny/fv1WrFhx+fJlVOErLbWywuCwQCAoLdUKVTcMkiAXeW2wLLkNxb9DxQtQ9hHkXXvM5khn60bKEpUpalQ+cT0lw+6Z3t+KZ7Wu37oezj1wkNfgy45v90mvT8a6j9XuYCewe9zzcW2r9yo0MNVrqgXdGOd1nhQSiuv8s7Ao6DKlg8Kwja4ZMw/kFReJRF9++SVJkmPHjtWrIzAMs3nz5iVLlixfvhwAoqKidu3aNXjwYGtr64oKbLKqVCptbBoijVuJQg2fXnAuq3CuukzGdvst2wWdsLFrI4jKh9u5NcxGA6dTscm7yYY1PR16Hht36FjW0fD8KGeRwyTvcT3sqvK2KYJ6I+SNmwU3k0qS9J30Otl3Wh28mmhUpJ1PAo8yNWJrnyxc/7Ine8PUQFaleTCNUjNtmoYZNskhkUgMNU/kcnl0dPTKlSu1Pw4ePPinn35iWXbs2LFbtmwpLCxMSkpaunRprVdA13oNlzPhclb1KiUSyiSwO7qRhq1isAjRGAI0DFY11YZc7ikpfro8D7UYJPbYr9pwGtzbsfehsYd+iP7hVtEtAoi+jn1XdVnlb9XIJpR2Qhjpw7XLM4QBbzvo4QxCHgoGzwsGSRlgVN0MR+OeoW37q2iCOLZarVYoFBYWupmnra1tWVmZUqmcOXMmy7IREREvvfSSn1+1rrexsbHffvutUqkkCOLs2bODBg2SyWQKRTUtfh7JRmUJWFZcM78yNk9VWCyhiYaFvGiSBTltSVsolKTRMW14KlIuKalRBsIj2dAc/srT4vg8zlnGwPob8FIf1et9JFwjLx1ehNfXwV/nynIJgnARumgYTUmJKWnEekAQsCQAziZb3Mjh6dzeLLhZan4cIRnlwwDLtegtBYVCSSrVyurfWLtFpcJYZaO/8zYDTdNSqdTe3r5pDJskSYqitF8uzp8VCj6fTxAEn89fsGCBybfY2toOGTJErVYTBBETE0OSZM0u2XwKNCRds+s7F2QieTw+j2qYZI+AgjJGVaJQACGqET9jyxjKXkgxBgckCSiWs29d5MfngE7ql8LA2OehVA9n3vRAQm0w+BME4cnHMLWG1VAs9SBS/kEuMLszE1XAytXc04RgR/kyIzrwSBI/LssCnybUag1FUXx+S9dUfDQwDMOyrPnboDm0dtQYwxYIBCRJ6qfQAoHAzc0tM1OnyBsXF9e5c2denVInrq6uixcv1v4/NDSUpmmSJMViY+kdO7GpVA0WbESUpYW4EW5hDVWsUcvAsE8tR4mqQk4xQpFxoCkym4nIYYFncCYSQEX+myya2418SPfRqRT48Kph12tixx1eVxfeG4Oq9tE+PWt+Y+0ThsP8bQCA3u4aHA1OTk6+evVqcXFxQkLC7du3JRIJj8ebOnXqr7/+mpSUFBUV9ffff0+dOrU+y57Y2NitW7fevXu3Nl1xC1EaSWhqVkSIBCkEUXtb99qxEWfwxfeM49gsOFklOotNXHCpnFQqqZr9onMlrOrhCJWqGNQbq5BUe6KxLMoJZ5Q9jBOaaZs02LD//PPP1157Ta1WHzlyZM2aNWlpWK/w7LPP9uzZc968eU8++eScOXOmT59en0MplcqSkhKjpbUhEjjH8I8ZhZ2Buifjb2WqBZfrS29n194+F4Ep0x2T5bzNVORI/zuWtEPN/Uk6Gyiut1U1WJpOJRv1ZLkvhTJIrhnuItGqU9v7EtJMA2jwVPydd955/fXXaZrWLmxEIpzW2tnZbdiwIT8/n6Io7dq9PnTjiIqKqk2B2EFkCbbPA6EExUTQ8LmEyhiwWGNvZUOygkZ4hW14zmsHei0qfa2oYAqwXQDkQF0YGHj9xW7vm9yf5V0DQRGolldrdknmEhZ/UITptzwgYhosOC226teBGy3b+xLSzMM0bCGHyV85OTk16FAajUalUtUxYg91HtXBVpMC80A9DDS+QJQB7yrQGZO99hKNSikFgPGekw5MEf4Rt/di1q9iHjW9Y8hTgWtdhKajZ7YCPs/hI1WxByhH674rKhMsXnaw4pK2HwLWAhjTAa4alW1qYIg31nWZMdMKyjavXr36zz//XLt2beJE011p7QR26/quf+bKU/nSUyDQjWMvdnlxkucDyXoPcR4zxHmMBmQEJnHV1cSzj+PAAZ5uF+Fx0IwAZR8g80FwmOQVLO54BB4aL/VDKcJTCZXLbBY6OsFwL9gZBXwe9HFrWB9sM+2T5jTs4OBgR0fH5OTkOpqBTPOZ5mXh9VfSX2F5YZ4WnjN8Z0zzmSagHrSlbo4sJ6o4yoKy6OnQU0TXKnVmx7f7vNfXT0gWJ5WdA/ocyorT1KvBb+pTSh8GDiLYMQ3+job/4kHFYpvbu/nw/nkoLsc/V5AzfDgcxt+/ANRMu6Y5DduOw9HRse4azN6OvXs79s4rzLOxshHwH9SkZRrZ55Gfb4zbWKQo0gqefNjzwyneU2rbf5DzoIsTLm1P2h5eGO4gcJjXYd4QlyFG+7AshN6D2zk4xPZ0RS2hB8RJDM/3gWd7oWvvqf/gcho3enMfPSYXnj0C2x6HsY3MbTPTLmhOw2YYRrvMvv+uGEvmkU1RZPrNnW8+vPmhXoIzojBi6aWlR8YcGeA8oLa3uIncXgt5rbbfSlWw9hz8cRtKuDJNe0t4pje8N7S+bTfqgCIhLh/2xFYXDKWhsBz2xvNHdmxU+ZiZ9kFzKqiEhoauXbs2LCysjnRxLSwOivh6wDOmlKdsTtyM/9PbCQnF0uIfY3/UsI2sb95wA9Zd5tpc8fBVJIPPL2AHvCbhTj7Iaz73KLhbRJvrsc20UMMOCAiYM2eOv7//I2u4mVyenC5Jr9n4Pq4srlzVmPbwUhVnw5TBF0nia9NtaBLDc7ME2lQjLlcRg0IrZsy0wKm4E4eLi8sja3wvpsUiSqTSGA+CYkrMb1SGaIkc0stq5L0SEFeENs9/4LmykxiVkmqO2bZCs9CCmZYtZvjIrBpTYuy79bTvWTNpbazHWDHdmExjS74puW8WW3Y8uFVrC8ix66URBMSX0CrGbNlmWqRhFxcXx8TEFBYWPrJ6Wgva4sNeH7pbu6NtMzr1grFeY1d21hWTNxRrASwK4dpl6J9OLB5zSVcQN0UCi5PIVH4dC7YC81TcTEudit+9e3f//v0xMTG1FYEY0lS38TCXYYfHHv4r8a+LeRctaItp3tMW+C2w4ze+LdWrAyAyH04mgtb7RpAwqQu82LdprravO2ob3sk2+ENxdawTfBWCmq0FzZhpCYY9cODAPn365Ofnq9X3qeggCKBJ4DfRxfaw79GjXw8loySBpMkHPairJRycDXtj4EQKBqjGdYDpnavNw8uVkFGKk3bvhmeMWfDhmzGw7CDcK6mcXbHwTD+Y2YlVMWZpJDMt0rCpSureLa4Qfr9NRN2zdLCk5gbD5MCmOXvjvGUmEdCwsCu+arLpFmyO4gybB8N94M1BDTbvx/zg6ALYHoUtfhxF+PFndAZGBoaaEGbMtKYWPwBwNAme/g+ysGIR7XDXXXhlIHwwrDFNJB89X4fCmpPcSp4TUorOgfAc+G8u+robRDdn6DYa1Ax6yLXuiBKJTtPFjJkW6hUnyVqvQaKCV05xVk3rXhoWvguFM0bFTy2SpGLsdI1LYm3fLwrTV8IyYEtkIw9Ik41sMWqmHdKchn379u1169bdunWrttn42VSILTBWKVWpYF/sA+egPXwi8yC1sPrFc3qjZ1JbwcWbae00p2FbWFh4eHhYWtbaeTlX2ySnRgOdfGnDZAzNmGlvNOcaO4Dj1KlTtaWUdnNB9XxVlawfBwPdnaspe7dMujmBrwOkFhnPOEb6mAXBzbSDNXYdsa7erjCxI2BGpX58VoG7LcwKgpZPR3tY2Zt7JGmTYTQASujjCUu6NfeVmWkHtGivOEnA+nFY/3goHiRSvNgeHvDJSOjxwG3fZWrUDBTSKGPw8FgzEGwE6C3LKAcLmgt3DQbnxrT0MmOmDRk2AHhaw5YpcC2LjcmSOtkKBnrRrrUuyevLrrvwyy30WgtJ6OeBseUQZ3hIPNMLO/JklGGqia9Z0shM+zHs+xZj8ykY6g19bOUiS96DLx02R8LTh0Ct4pa+LCTko/jJsXngX19t1QZjLYDghqk8mjHTmtfYJ06cWLp06dmzZ+tuG6LVHpKpCWVjpMSrkSeB78MAF/W8qthyUj5sqNbq24yZVk8z54p37tz51VdfvW+ueFMRUwCxNWPLANeysHW29YPqqZkx01JoTsO2quRRlmSbMdMeaP5w16O06i6OEOTIRZ6qM9DjPsO1moH0Uuy/Y8ZMq6D5nWePEicLWN0PnswFlVLnPAMG/F3ghT51vWtvLPx+G9JL0LM9zg9W9WtwFYcZM4+Y9mXYALC4K4ho2HgTw10CEvp7YrjLr/Zo9s/h8OIxQJU0rkLrejp60ffOxAC1GTMtlnZn2ACYuDY5AFJKQUBBB9u69kwrhXXXABNeDdz2pxJh+x0uq8yMmZZK86+xH5ngmSECGjo73MeqAeBWDiTmm6jQOpL4MC/OjJlWPWLL5XKJRCKTyZrFtuuDhq3R0ZbDrF5ipoXTnCP2xYsXV69efeXKlfsmnzUXXRzB3a6GF52AQeaeeGZaNs1p2KNGjdq0adPw4cPr1b6rOejkAMu76xSFdXLFKujiym00Y6YF0/xihi12uNaWl70/DKNcu+9CWhkKEg7ygneHgrtVc1+ZGTN10vxG1cLTzigS42ErekFmGVjw6gqMmTHTcmh+r3ir4F45ZHGvMkVzX4oZM61ixG7hlMjhjTNwKA6yy4HHg37uKH48ukNzX5YZM3ViHrHrQqmB107Dr9cguwKj2SoNXE6FBQewh4EZMy0Zs2HXRVQe7I+rFAbX6qXSkFeK7a/NmGnJmA27LlJKoKi0xpfEQmRuc12RGTP1wmzYdSHiAUGbSD6zNPfXMdOyMRt2XfRxg+5u1TPPWFxsz24N+sdm2jPNadgsyzIM05Lj2C4W8P5QsLPgtMG1Lxae6A7TOjX3lZkx02LDXWFhYYcPH75x48b48eOhpTK1E5yygV9vQmIRzsznBMGcLlgcZsZMS6Y571Bvb+9x48Zdv36dYRhowfRyhY0TMNbFM3eaN9NKaE7DduPw8PBo4YatxWzVZloRze88q60jnxkzZlqxYZsxY6bJMRu2GTNtELNhmzHTBjEbthkzbZDmD8gSBMHn3ydFkyAIkUh0393aD+ZvwxCRSNQqAiuPAL0eUTMbNsMwBQUFmzZtunHjBsthKEjMsqz+/zKZjMfjNaGOkuHBm+qADVJTrrm/yS2G34b+t3K5nCTJJrTtRlx83TvXcUCT732Qb0OpVLIsKxA0ZQ8HtiG3R32+vdoOWNt7jfavaRo1fyRJ8tixY7NmzWp+wyYIYurUqWlpaba2qPF97tw5CwuLfv36MQyjVCr37t07depUCwsL9f/bO/Ogpq7vgb+8bERBJESpUAOoQEBEIEEsGqqC4FZUFK0zdStWK+PSgLW1U5VSu7jUZcRqK9ZRpNLRUSzUyD4KyC67hBCWhIQ1EEJYsr287+j9TX4ZxH4ZB7/E8D5/vXtz7nsn9+W8e9/NOedqtXFxccHBwe+///6YPJtxOFxGRoadnZ2bm9toTqjT6R49euTu7u7g4DCiPAzDubm5JBIJKP9f28IwzOVyHR0dGQwGqIRhOD09fcaMGe7u7jqdDobhysrKrq6ugIAAnU6Hx+MTExP9/f1tbGxgGE5ISHBwcPDz8xuT3sDj8U+fPkUQhM1mj+bfRxiGMzMzra2tvby8RpSHYZjP59fX169evXqYhjAMZ2VlWVlZeXt769vCMFxSUjI0NMRms/W9UV5eLpPJli5dCnpDJBJVVFSsWLECj8cDBWg02vz5L9JKZmRkDAwMrF27dkx6A4ZhHo8nFAqXL18+Gnk8Hl9SUqJQKJYsWTKiAjgcTi6XP3jwYPv27cMERmyLw+FEIlFpaWloaCioxOFwra2tubm5H3/8MYIgOBxOoVBwudyQkBAzMzMcDldVVdXR0bF8+fIVK1YsXLjQKAw7PDxcX7SwsKBSqRs2bAD20NLScujQoUmTXuyUlZub++mnn3p7e4/VpWEY9vT0XLp06Sjl1Wr12rVr582b9zoBGo1GoVDCwsJGbBsSEuLh4WFYqdFoFi1atHjxYkOV5s2bFxAQAIqPHj2qr6/fv38/KAqFwr17986aNQuCoLq6Oj8/v23btkFjhI2NjVqt3rFjxyjlzczM7O3tV69e/TqB/Pz8rKysyMjIEdvS6fQ1a9YYVt6/f7+3t3fnzp36mocPH4KvDIrPnz+/e/fuV199BYpkMnn27NkrVqwAxe7u7hGv9Wbk5OQUFRVFRUWNUj4pKamjo2PPnj2vE+jp6RGLxSNqOGLbmpqaW7duGcoLBAKdTsfhcECxr69PLpcfOnQIzFPS09Nra2sPHDjw/6dAjYnm5maJRAKOEQSprKwEsyyVSrVy5cr8/PwxvFZDQ0NnZ+cohXU6HZ/P7+3t/RcZkUgkFotf11Ymkw2rr6+vl0ql/6JSe3t7Y2OjvlhVVaVQKMBxeHj41atX0bGjpaVFKBSOXr6pqamtre1fBLq7u/l8/ujbtra2DlOgvb29qalJX5TL5XV1dSBqCEXRxsbG9vZ2cPzzzz8fPnwYHTu6uroEAsHo5VtbWw1VfRWlUlleXv66ts3NzcMq5XL58+fPDWv6+vqqq6v1RZVKVV1drdFoQLGjo8Pwp/JiGm/MwVV61Gr1li1bvv76ax8fn/HWxSjYt2/fggULxnDEfqc5d+6cTCaLiYkZb0WMiHfDsMHiGYlEwuMxj+0XqFQqGIaJRIO9AicwYODC/iZ4Jw0bAwNjQjioKBSKjIyM+vr68VbEKBAKhdnZ2W1tbeOtiFEgFArT0tJKS0uhicq7atgKhSI6Ojo/P/+nn36ayPcPoFarHz58GBMTk5KSMt66jD+9vb2JiYmlpaWXXwJNSMbf88wQtVotFoslEom1tbWbm5u+XqvVPnnypL293cvLy9X1RcKxgoICtVp99OjR5OTk+Ph4JtME96FXKpUCgaClpYVCofj7+8Pw/z2FtVptRkYGj8dzc3MLCAjA4/FEIjE8PFylUg0MDEAmCvBlEgqFKpVqwYIFhm/UPB6vtLTU1tbW398fj8dPmTLl4MGDZmZmPB4vMjJy9+7dE3BpxrgM+969e6dOnWprawsICIiPjweONQiCREVFFRcX0+n0s2fPxsTErFq1SiKRTJs2DYIgJyenmzdvQqZIUVHRvn37FAoFiUSqqKgwMzMD9SdOnEhJSQkICLh161ZoaOiRI0eAWy6BQDDh4Pb6+noOh8Pj8YaGhsrLy21sbEB9cnLyt99+6+7uLhAIlixZ8uOPP+LxeNBXKSkpixYtmoBW/QLUmGhqahIIBDExMcBjCVRmZmYyGAwej4ei6Llz59hstkqlSkhIOH78OIqi1dXVmzdvRk2R3t7erq6uO3fuMBiMwcFBUNnQ0GBvb5+bm4uiaGFhoZOTU01NDfjo4sWLFy5cQE2Unp6eqqqqrKwse3v7lpYWUKlUKj08PC5fvqzvmezsbPDR1atXDxw4MDQ0hE5IjOsd28HBYfbs2RQKxbAyKyuLwWC4uLzIDLphwwaJRCIQCJydnUUikUKhyM/PBx+ZHpaWljQabZgL9NOnT2fOnAlcKb28vAgEAo/HA4sOspcoFArIFLGysnJ3d7eysjIcgRsbG5VK5YcffghB0KxZs9zc3EpKSnQ63fXr17OzszkcjpGnwX17GJdhA4bdCZFINH36dHBMpVIRBBGLxUwm093d/ZtvvikrK9u1axdkurzaGxYWFubm5sAFlUajdXS82JckPj6+oqKiqqrKVF9MAMN8rRsbG6dMmQICDSAIcnR0bG5u7uvry8nJIRAIZ8+ejYuL02g00MTDuN6xR8QwzAX3ElATGRkJ3rQnlGcC+Pr6Iph3QRAU8RLj3298bBkW5ATDsEajsbS0vHjxIvBaIRAIE9ONxxhHbHCf9HfL1tZWKpWCY7lcjsPhqFQqKNrZ2Zm8VQ/rjVmzZoEAALCs2NXVZWdn96r8BOkNOp3e39/f19cHiiKRiE6n43C4yZMnT5061crKysLCwrQ75N0wbBAygSAICAIBz2M2m11XVycWiyEI4nK5NjY2c+bMgSYAOp1O9RIEQZRKJZhS+vn5SSSSwsJCEIQEQRD4/28iYPjbAHPyOXPmgEVECII6OjoqKytZLNZ4q2kcoMZEQUFBSEjI3Llzp0+fvmbNmps3b4JAlk8++WTZsmUcDmf+/Pl//vknOjHg8XibNm1iMpk0Gm3ZsmXHjh0DS0Hnz5/39PTcunWrt7d3bGwsOjHo6uricDhsNptMJgcFBX3++ecg8i8+Pt7d3f3QoUNLlizZvXv3hF0GH4Zx+Yq3trbm5eWRSCQYhpVKpaurq7u7OwRB/f39XC63o6ODxWKBOPKJQF9fX3l5OYIgeDxeo9HQaDQPDw8wsSwuLq6vr3d2dp44A9Tg4ODTp0/lcjmZTFar1ZMmTVq+fDlYIS8oKCguLrazswsODp48efJ4a2oUGJdhY2BgmOA7NgYGxpiAGTYGhgmCGTYGhgmCGTYGhgmCGTYGhgmCGTYGhgmCGbYxMjQ0VFRUJBAIQBHkHgbBHm8GgiAXLlyorq6G3gJDQ0N//PHH3r1709PT38b5Md4AzLCNEZFItPEl3d3dwJXyiy++4HK5b3xCBEESExMbGxuht8Dt27evXLnCYrFmzJjxNs6P8QZghm2M6HQ6Mpnc19d369YtUKPRaEB2lJ6eHmDtwBmrvb0dpJRqa2sbGBh4/PhxQUEBSJ+Um5ubl5enz6kCgpyqq6tTU1P7+/v119JqtUVFRVwut7OzE9QMDAx0dXVJpdL09PTm5uZhuonF4pSUlMrKSlDs7OzMysry9vYOCAgw9OHX6XStra39/f05OTlPnjzRarWgXqVSVVVVJScnl5WVGTpHyWQyLpdbXV2t/1IAPp+fnJxsmLKyr68vMzPz4cOHDQ0NJpwxxvTDNicgKIqam5vv3LkzLi5uy5Yt06ZNA/GqEASdPn1arVb/8ssvEARlZ2dfvnz577//rq2tBa7jQ0NDdXV1gYGBRCJRIBAIhUIWi3Xp0iUcDkcgEGJjY6lUan9//4kTJ+Li4lxcXDo6Ovbv3y+TyahUanR09A8//BAYGJienn7s2DEHBwcCgbB9+3YHBwe9YtevXz937pybm1tTU5Ovr++ZM2fS0tIKCwuJRKJCoThy5AhwAQZewEFBQQ4ODubm5p2dnVQq9ffff6dSqTdu3Hjw4IGlpWVLSwuDwbh06RKJRCopKYmIiLCzs6NQKL29vSQS6d69ezqdLjo6Ojs7m06nNzY2bt68OTIyks/nf/bZZ9bW1mQyGYfDff/997Nnzx6/G2XEDHcexzACampq3Nzc6urqQkNDQQYof3//a9euoSgaGRm5b98+IJaUlBQQEIAgSFlZ2XvvvRcfH4+iaEZGBo1GO3v2LIqipaWlLi4uQqEQQZAFCxZs3rxZrVZrtdqtW7dGRESgKHrkyJFNmzapVCoURa9duxYUFKTRaO7du0ckEvPy8lAU1Wq1eq2am5tdXV3v3LkDAlRcXV3/+ecfFEUPHjx49OjRYV9BoVCQyeTvvvsO5Hjy9fW9cuUKiqJSqRRcrqmpydvbG2Qy2rhxI4fDAamOPvroo8DAQBRFHz16xGQywfY3tbW1np6eAoEgLi5u2bJl4BIDAwNYyMfrwKbiRgrYF/bw4cN3796tra3Vh53rh27DYxRFrays1q1bB9JL2drarl27FoIge3t7Go0mkUiAZFhYGJFIxOPxmzZtKigokMvlBQUFSqXy5MmTx48fr6qqqq2tbW9vx+FwTCbTz88PbAepV6mmpkan04WEhEAQ5OLiwmKx9Ktlr0YcIAhia2sLdt6ztLRcv359dnY2iKg/evTojh07Tp48KZPJ+Hy+VqutqakBypPJ5I0bN4J5e2pqqlarTUhIOHbs2O3btyUSSU1NDYvFam1tDQ8Pv3HjhlQq1Sd4xBgGNhU3XjQaja+vr4eHx2+//aZPIzMsn4xemEAggBDlF09rGAYGaWhvhlsCEYlEFEXB6E2n0x0dHcFWtcHBwVQqVavVgq2Lh+1GjiAIgUDQX5REIunfnEcEPETAMZlMRhCkv7+fw+E4OTnt2rVr8uTJPB7vX/IWKZVKa2tre3t7sHHsr7/+6uPjM2PGjMTExIyMjL/++is2Nvb69ev6yT+GIZhhGylgQgVB0JdffhkWFgY26wI5/SoqKoDMkydPlEqlXv7Vtob1arU6MzMTjLcZGRmurq40Go3BYIBwdyADzFv3kldVcnJyUqlU5eXlPj4+vb29ZWVlYKNZw8vpgWFYLBYXFRWBvIupqalBQUEKhaKxsfHUqVMuLi5isbi1tRW8/Lu6uiYnJ/v7+6vV6vv374MH0OLFi8Ee0frkllqtdnBwcP5LoqKimExmYWEhZtgjghm2MQJ+7uDY09Nz1apVsbGxYPQLDQ1NSEgIDw+nUChVVVVg83BDeTB664/xeDxIkzZ16tS8vDwOh6NSqXJycq5cuYLD4aKiosLDw8PCwubOnSsWi62srE6fPo1/yataOTk5bdu2bc+ePYGBgRUVFXQ6HTwmRpRHUdTa2jo+Pr6hoUEkEslkso0bN06bNs3LyysiIuKDDz4QCoVKpRI0PHz4cERExPr16ydNmjQ4OIjH41EUXbduHZfLDQ4OZrPZSqWyu7s7Ojq6tLQ0ISHBw8NDKpUSiURfX9+3dhPebbB4bGOkv7//2bNnLBYL2K1UKi0sLPT09ATpzWpra9PS0uh0upeXl1QqZTKZCoWisrJy4cKFBAJhcHDw2bNnTCaTQqGo1epnz54xGAxLS8vi4mIbG5vi4uK2trZVq1bpF5PlcnlaWppYLLa2tmaz2Y6Oju3t7SKRyMfHZ8RsYbm5uUVFRY6OjitXrgSvuM+fPycQCM7OzoZivb29bDb7/PnzEolEqVRu2LDB2toafLWkpCSZTBYYGKhSqaZOnQpW3RUKRW5urrOzc2JiIp/Pv3HjBpj8P378uLKykkKhsFgsLy+vnp6e7OxsiURiYWERFBQ0c+bM/9U9ecfADBvjrSCTyZhMZlJSkoeHx38V5vP5qampDAaDz+dfvHjxzJkzYNUN443BpuIYbwUSibRu3TpLS8vRCJubm3d1dRUWFlIolAsXLgQHB799BU0cbMTGwIBMj/8A/lFtGlM5Qu4AAAAASUVORK5CYII=\" /><br /><h4>Caption</h4>Figure 3: Distribution of conversion times for all documents, ordered by number of pages in a document, on all system configurations. Every dot represents one document. Log/log scale is used to even the spacing, since both number of pages and conversion times have long-tail distributions.<br /><h4>Annotations (ibm-granite/granite-vision-3.1-2b-preview)</h4>In this image we can see a graph. On the x-axis we can see the number of pages. On the y-axis we can see the seconds.<br />\n",
+       "<hr /><h3>Picture <code>#/pictures/3</code></h3><img src=\"data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAAyIAAAGPCAIAAAAvMvMQAAC0hUlEQVR4nOzdB1xTV9sA8HNvbjZ7yhAURFQEwYELte69tSp1b+ves+5RR63WVbfWrVXrqHvVvRVwAAoyZYeVkHXH+0tu3zQCKiiYBJ7/x9eX3FxuTmJy89xznvMcjGEYBAAAAAAAShpe4kcEAAAAAAAQZgEAAAAAlBYCmayEhIRdu3aZmZnx+XwY+gSgzMMwTKFQZGdnz5o1SyQSIRNx7ty5e/fuOTo6GrohAIBvAcOwtLQ0Hx+f3r17a26aboBy9+7dtm3b+vn5mZubm+6zAAAUEYfDycjIePnyZXR0tIODAzIREyZMOHToUO3atTHMhM+3AICiwDAMIRQaGtq0adNDhw5hGGbCvVnW1taurq7bt2+vXr06nLwAKPNwHH/48GGfPn3YE5mpsLGxadWq1YEDBwzdEADAt4Bh2Lhx43AcZ89UhKk/GQ6Hg2kZui0AgFLHft6RqeFwODgOibAAlBccDkf3u8l/8qEfC4Dyw0Q/7ybabADA13/kTT7MAgAAAAAwThBmAQAAAACUCgizAAAAAABKBYRZAAAAAAClAsIsAAAAAIBSAWEWAAAAAECpgDALAAAAAKBUQJgFAAAAAFAqIMwCAAAAACgVJrzYDo/HM8VlN0rK5s2bHzx4wDAMSZICgcDOzm7ixIkuLi6GbhcAAAAATDnMkkgkYWFhMTExcrm83EZasbGx4eHhb968ycrK8vPzq1ixokKhMHSjAAAAgK+Wk4LiniL8v5UBP4OmkFttZOGIjI9Jhlnv378/cOBARkaGVCott2HWokWLKIqaOXPmzZs3//rrLwcHB4FAYOhGAQAAAF8t7inaMxjxREXdX5WHBu9BNdsj42OSYZaPj8+mTZvCw8O///57mqZRucQGVTwej8PhWFpaikRFfjsCAAAAxgznaGKsoodZ7J8YJZNMgccwjKtVbruydBgtiqIM3RAAAAAAlIneLBbDMIZuAgCgjMjKyoqKikpNTaVpumLFir6+vp+4iouLiwsNDRWLxQ0bNoTBegBA2QyzgObfjyAwDOPz+YZuCACmbePGjTt27GAYRq1Wc7ncDh06rF27VigUFtzz6NGjixcvJklSLpfXqlVr/fr1lStXNkSTAQAmAMIsE0NR1MuXL7OysjAcxzAsNjYuVyr95+ZNK0srBjEcHK9Ro4aVlZWhmwmAKWEYpk2bNt27d69UqRIbSI0dO7ZOnTrDhw/Pt2d0dPSYMWOGDh26ePHipKSkLl26zJs3b9++fThukgkYAIDSBmGWicnLy5syZeq9e3f5XA5CmEwuJ0mqf7++OI5TNM0huCdOnPjuu+8M3UxQZrMAGYYhCM15oywFFhiGBQYG6m7269fvt99+e/r0acE9z549a2VlNX78eKFQ6OHhMX369NGjR//222+2trafOHipNRwAYOwgzDIxDMNIcnJrW8oXtXYlSSZdbiYnGSczDo+DPYiXLbqdrVaThm4jKIOWLFny4MEDiUSiUqkcHR1dXV0XLlzo7OyMyhC1Wp2ZmalSqS5fvpyZmdm1a9eC+9y/f9/Z2dnJyYm9WaVKFYFA8OzZs1atWhWaOYphWAnOhqYoSiaTKRQKyEz9MjiOi7Qg9gXfDIRZpgfHcT9HYYvqVkitPX1jCDEI4ZgVn7P8vlRzE4CShmEYh8NJSEjIysqyt7cvS11ZOm/fvh05cmRubm5UVNS8efPatm1bcJ/U1FSxWMzlctmb5ubmZmZmiYmJ+vuQJDllypSIiAgMw3Acj4yMDAwMlEgkGIZ9TXjEMExOTo5UKiUIoky+/t8ASZIMw1hZWUEFHGPGEHxebq55sUJhDMvNzVXlyDBSWYotK1JDNJ96uVwuFovZLRBmmSSK0f6/5n/+j0FqGi5wQWmZN28ewzAjR44MCQk5cuSIhYVF2esPcHJymj17dm5u7vnz57dv316vXr0WLVoU3E3/iWNa+YInHMcbN27s4eGBaxMo2XorfD7/a8IsDMOkUqlMJnN2dra0tCx7L/63wTBMSkpKdna2WCzm8/nQKWikCB7B4xX3j3g8Hs7nIUMXz2LPCWxmBQvCLABAUc8d7Lc7h8Mpk1/zVlZWHTp0QAj17NmzVatWv/zyS8Ewy9bWNikpiSRJ9jQq1dKNIbJwHO/Tp4/uZnZ29uvXr3WXtl9MJpPx+XwbG5sy+eJ/M7a2tjk5OVwuFzq0jBqfj4oVBDMMX4OL+P/2NBsWl8vVBfHQ8wwAKJ4y3wdAEISdnV12dnbBtKrAwMDk5OSkpCT2ZlRUVF5eXu3atT9xNJIsmXRJmqZhrPDrsa9hmX8PA+MBH1qThGMIcbB8P1zNVgBAsalUqnPnzqWnpyuVyry8vJMnT165cqVVq1bsV/LWrVvnz58vl8sRQp06dUpNTd25c6dSqUxMTFy3bl3Hjh0/Mc0QAFDOwaCh6eFg6Emyau31VP1kLA6GvctU0gwDoRYAxcUwzJo1a968eSMWi/Py8jAM69Gjx+TJk9l7Hz169OrVq2nTpgmFQm9v73Xr1i1fvvzkyZO5ubmenp4rVqwwSCcTTdNhYWFKlQor0WkvNE1VqlTJ0dHxaw6Sm5ubnJwsEolcXFwK3puampqdnW1jY/PZ8DQuLk6pVOrvSZKkSqVi+6IEAgGH828mDsMwcrmcz+frtrDRM03TUKYfGBaEWaaHg2MPk8m32en6GxmESIqmGE1ReMM1DQCTxOfz9+7d+/btW4lEQhBE5cqV9RfbmT17tv68ocGDBzdu3JhdbCcoKMjMzMwgbVYqlT/88ENycjKnRLuxVSS1Yvny0aNHf/ERNmzYcOTIkezsbB6P5+/vv2jRIldXV/YuiUTy888/X7t2TaFQmJmZjRkzZtCgQYUe5PTp09u2bUtISKAoyszMzM/Pb/r06VWqVLl8+fLPP//MpgniOF6/fv3x48c7OTmlp6f36tVr0aJF+lUDV69enZaWtnbtWhhsBQYEYZbpUVHMIF/Rhh6V/i3owMKxB7GyTkeTacg5AKD4KmoVepenp2e+LV5ayKAYhklITm1lK+vnZ10ik4wxDCnU9KBT6VKp7IsPcuLEiRkzZkyePLl///5v3rwZO3asTCY7cOAAh8PJzs4eNGhQVFTU1KlTq1evHhERYWFhUehBVq5cuWTJkh49evz4448VKlQIDw/fsWPHsWPHZs+eHR8f//Tp05kzZ7q7u0dHR2/duvXhw4cXLlxQqVQ3b95MSUnRP05YWFhCQgKkYQHDgjDLJPFwJOLhH4wV4JiQC/1YAJQnGB7kbt4zwPaD2i5ffjREqujxZ1I0AdcnpaSk3L9/PygoiB3Lo2n6woULlStXrl69+sWLF2vUqPHTTz8JhcIaNWq8efNm8eLFSqVSJBKdO3fu6tWroaGhVapUQQg1atSo0INHREQsWrRoypQpS5cuZbfUrl27R48ebAiFYZidnV3fvn3Zg7i4uIwYMeLly5cVKlRg58DqH4rL5fKKXxcAgJIFXakmSXNOZfL/wDUbAOUNSWvr55XQj4oq0lmEw+GsX79+zJgxCoUCIbR27doxY8ao1WqEUM2aNdPT0+Pi4tg9w8LCatasyePxGIY5c+ZMq1ataJo+dOjQ8ePHY2NjCz344cOHra2t8w0mCgQCd3d39nd2eW/2dzc3NxzH2dKvX/lKAlBKoDcLAABAMdjZ2a1du7ZNmzbbt2+vXbv28uXL165d6+fnhxAaNmzY69ev+/XrV6tWrffv30ul0s2bNxMEoVKpXr58KRKJ+vTpw+FwMjMzeTze5s2bmzdvnu/gDx8+rFixoi6oKohhGKWWVCrdsWOHubl5zZo1S6pqBgBlPMwKDQ3dv39/amrqtGnTatasaejmAAAAKIS/v/8vv/wyZcoUoVDYv3//wYMHs9uzsrJSUlIoisK1cnJyEhIS/P39GYYhSfLRo0dHjx7t3LmzVCrt27fvzJkzr1y5ki9DS6VS8bQKfVyCIJKSknr27CkUCiUSiaWl5a+//mpvb5+QkPBNnjcAJh5mZWZmVq5c+dq1a9HR0RBmAQCA0erUqdOyZctiYmJGjBih27hgwYLXr19fv36dLQkxd+7cIUOGREREWFpaCoXCmjVrduvWDcdxa2vrkSNHjh49Ojw8PDAwUP+wtra2r1+/zsrKsrKyKvigNE1bWVlNmDChYsWKAoHAx8eH7ff62KAh5L+DspybFRcXd/PmzUOHDp06dYpd1UuHpunLly/PmTNnyZIlT58+1W1v1qzZmDFjKlWqBJ8NAAAwZmvWrFGpVN7e3qtWrWLP8CqVKiQkpHbt2rqyW23atMnJyYmIiOBwOAEBAfp9VAKBgKIoXZaVTpcuXd6+fRsaGlrog9I0LRaLO3fu3KNHjw4dOujGFsVisUAg0FXnZ8XFxTk4OEA1B2BYpfX+UyqVQ4cO7dWrV3BwsC47ksUwzOrVq4ODg2NiYu7du9e5c+fTp0/r/22+mAwAAECheBwMcfGS+hEVeSmJs2fPbtmy5bffftu9e/fFixd///13dmZfxYoVX758mZ7+b1W/W7du4TjOVspo2bLlCy32W+DUqVPOzs7shEF9bPA0Z86c+Ph4dgtN03fv3mW/Jtjlt9nUe30WFhYtWrQ4cOBATk4Ou+XJkyd3795t3bo1ZMeDsjloiOP4pEmTqlWrdujQIfYTqBMSErJq1arFixePHTuWpunhw4cvWLAgKCjIxsamlBoDAABlD46YR4ny488zUYkUzkJISTKK/Ks4FiI0NHTkyJFjxozp1KkTQmjZsmXTp0/38vJq06bN1KlT+/bt26pVq7Zt20ZHR587d27GjBlsedLOnTv36dOnW7duXbp0effu3d27d9euXVuw3LyVldWBAwfGjh0bGBjYtGlTtm5WSEgIW99BrVbn5eUVXGsSx/H58+cPGDCgUaNGzZs3z8nJuXDhQteuXbt3714irwwARhdmcblc9hNYMJPx2bNncrn8hx9+YD8bgwYNOnXq1KtXr4KCgtgdOBwOn8//7EPw+Xy2FjAqTz77fMvbCwK+PQO+x+Dtrc/KXHzwTc7+iLQSPKZAKOTzuJ/eh8PhLF++/Pvvv2dvDhs2zMzMjM1kb9So0blz565cufL27dtq1aqNGjWqadOm7G5isXjDhg1nz569e/du7dq1Z82a1bBhw0KPHxAQcPbs2X/++efhw4dSqbR169aLFi2qU6cOQqhFixa2tra6svL66tevf+HChYsXL7569crJyWnLli2tWrX6WAVUAMpOCnzBLKvnz59XqVJFt3KFj49PZmZmdHR0UFBQXFzcP//8ExERce7cOYZh2rZtm29YPSUl5cWLF2wNutjY2Ly8PJVWOcnlwjBMqVQWvJLTp1KpSJKEgVdQ4giCoCiKnU7PVkL6xg3Acbz8fNg/SygU3rhxo8Q/6QzDfHapQR8t3U0cx/v166e7WVOr0D80MzPrq/XZZtjY2HTXyrfdW+tjf+Xh4TFmzJjPHhyAMj7TMDs729raWndVKhKJ+Hy+VCplFxx98+ZN37591Wp1XFxcwfPpgwcPRo8eLRKJ2PSvrKwsmUyWm5tbTqIKdsEKkiQLv6bXbGOkUlleXl7B3AUAvpJQKGSD+OzsbIPkUPJ4vNzcXJqmoU+Lvehyc3MzdCsAAMYXZrGl6nQ3aZomSZIgNC3x8fFZvHjxJ/62Q4cOERER7O8RERH9+/e3tLQsV0ldBEFoOhIUhV3Qa7ZhVlaW5loGaBwo64RCIZfLtbOzM9QbzNramsPhQIcWAMBUGCDMqly58rlz5yiKYkOr9+/f4zjOrkj1WQRB6M7vNjY2HA6nvKVnFSU3q1y9IODbM+B7DN7bAADTUuoFRQiCwDBMP6W9du3aGRkZuk6pGzduODo6Vq1atejHzM7OfqKlUCjgtAsAAACA8tWbxTDM1atX4+Pj79y5I5FItm3bJhQKO3bsaGtr26BBg8DAwNGjR2/YsCE9PX358uXt2rXz9PQs+sFjYmLWr18vkUhycnKg9NynKRQK/dW+MAwTiUQQmwIAAACmHWZdvnz5zp07bPfVvn37eDxegwYNbG1tra2tt2/fPm/evMGDBxME0aVLl8WLF3O5n5lCrM/X13fbtm3h4eH9+vUrJ8nv+WiiJIz9n/82FYydGIYZNmzYoUOHeDweQRByuVwsFr9586ZgrRoAAAAAmFJ50gULFqjVajaNg01Z1RVxqFat2tGjR6Oiovh8/hdMlsFxXKBVbntl1DRSkQwiGZpBNMMQOIZwpFDnzwvGMGzw4MFNmzY9efLkgwcPVqxYIRKJIDseAAAAMPkUeLbswsfgOO7l5fU1x2fLk6LyhybVf4TlPX7/kmFQLomraGTFpQkci85k8mhNF5b+zq1bt0YIJSUlhYeHjx8/3nCtBgAAAModA8w0/HqhoaG//vprZmZmWloaW6q0/ODxeIMHDogKakwjjCCIa9oEuPY9e4pE4mYMzeMSlSpVKvhXJEmyC4EJBAJDtBoAUMLUavWCBQuyJFkYXXJXmxhSM+q+ffu2aNHi0zs+evQoNja2Tp06lStX1m189+7dkydP3N3d69Wrx17d3b59OzIyUqVSBQQEtGnTptBr79TU1Lt371pbWzdq1EiXPUKS5MWLF2mabt68uZmZWYk9QQC+OZMMs5ycnIKDg9+9e/f8+fNPl0QvewQCwYQJE3Q3p0yZcu3atZUrlper4mEAALVavfX3rRKVBNmxNfO+GoYQhVACqupV9bNh1urVq48dO9avX7+DBw/qNs6aNevo0aO9e/c+evQoQmjdunWXL192dHSkaXrPnj3u7u4HDx4suE5OSEhIr169rKysLly4ULduXXbj1atXu3btKhAInj179pXjHgAYlkmGWfb29q1bt37z5s369evLeaFC9umX8xcBgPKJj/NRK4Q6IfTfZOKvgCOkQGgK4uCfHyJQqVTW1tahoaHv3r1jO7SioqJevHhhbW2tVqvZfcaMGTNx4kRnZ2d2AY8WLVrs379/1qxZ+Q5F0zSXy7W0tDx//rwuzDp27FiFChVkMpn+yU2pVJIkyePxdJ1eFEWxf65/NIqiijWnCoBSZcLVENjl1QzdCqMArwMA5RQfIVEJ/Qi1/y3ad4Jara5Tp46Xl5euN2v//v3e3t516tTRhVmVKlViYyx2XWcXF5eMjIxCjyYWi3/44Ydjx47l5eUhhN68efP48eNBgwbpzmwpKSkTJ05s2rRpgwYNmjZtum3bNrZOTXp6+pgxY/bs2cPulpycHBwcfObMma99VQEoOSYcZkFsAQAo7xiE6BL9KeLDMoy5uXnHjh0vXbokl8tlMtmVK1c6depkZmamn8ghl8ujoqLCwsJ+/vlnhFC3bt0KPRRJks2aNeNwOP/88w9C6Nq1a2ZmZvXr19fV/MvMzHRwcJg/f/7mzZv79OmzYMGCP//8EyHk6Ojo6+s7bdq0x48fs0kUb968ady4ccm8tgCU20HDV69ebd26NS0tLSMjo7ylwH8ZdlUiHo9n6IYAAMoIlUrVu3fvZcuWhYSEkCQZHx/fq1ev48eP6+8TGRk5cuTI5OTkuLi45cuXN2jQoNBDqdXqKlWqNGrU6ODBg23btt2/f/8PP/xgbm6uu5auVq3a3LlzEUI5OTm+vr537949fPhwnz59MAybMGHC06dPx44d265du+vXr1+8eBHqAgKjYpJhlp2dXcuWLePi4u7evVveUuCLiKbp69evZ2Zm4gyO4djLsJcymezo4aOaZacZBifwJk2a2NnZGbqZAABTRdO0paVl48aNjx07plarmzZtamFhQdO0fp2dqlWr7t27VyaT3bt3b8GCBc7OzoMGDSr0aCRJ9uvX78cffzx+/HhaWlqbNm1iY2N196rV6i1btpw7d04qlXI4nOjo6KpVq7IL42IY9ssvv7Ro0WLx4sW7du3y8/P7Js8egDIdZjk4OHTp0uXdu3dbtmyBocNCqdXq6dOmhzwPQRaaCUSMgmFUzA9jftBMJlIhLsm9ePlis2bNDN1MUNYkJyfLZDKpVKpSqdjF3d3c3GBFrDIsODh46NChDMPoEqT0CYXCatWqIYTq1Klz79697du3//DDDwRRyPcORVGNGjWysLCYPHly06ZNPT093759q7t3165dS5cu/fnnnwMDA83MzJYuXfr27VvdNXZ2drZMJuNwOHDVDYyQSYZZLIVCATHWJ1AqivajEZsLodTMRaLFtOYfPAJRx6iSmQEOgB6aphcsWHD16lWZTKZWq62trcVi8d27dz9dqRh8FXbRrRKpnPVFx2nQoIGnpyeGYR8bENRhZwV+7KSt6WXH8eDg4JkzZ/bs2VOXfcv2jV2+fLlDhw5Dhw5ld05JSWGXGGHHLn/88ceqVasOHz587ty5devWrVWrVrGfBgClxoTDrPJZAr7oMAZDLghV09bCYU+gNEI8hOQII+ClAyUPw7A2bdpUrlz59OnTb968GTx4sEgkgqn1pYvUfsCpkqubVbT+IF2/kY2NzbVr19hlOdjt7Jk5MzPzr7/+cnV1rVChgkKh+Oeff/7888+NGzcWfD8wDKObNj569OhBgwaxcbn+9kqVKp0+ffrp06fW1tanT5++du1aYGAghmE0TS9evDgiIuLKlStVqlQJCQkZPnz4+fPnISMCGA+TDLMoilIqlXK5HHqzPoNCSP3heZM9kwJQCjAMY/sh0tPTc3Jy2JxlUHoUpAJdQuh5yZUnpTXnB5L+fBkuBwcH3e9sgKXbzoZZBEFcv3798uXLFhYWCoWCy+UuW7bshx9+KHgooVDo5ubGjiTiOK5b+lZ/+48//hgSEvL9999bWlpWrVq1X79+7Cjho0ePTpw4sXbt2ipVqiCE1q5d26NHj507d86cObMkXhEAymuYFRYWtmbNGolEkp6eDjMNATA27OJOKpUKJreWHoIg+g/sL0mT4ExJpr6p6qt8fX0/u9v27dsL3b5jxw72F3Nz8127duXm5qampvJ4vAoVKgiFwkL/pEmTJiEhIQXXAdPf7uHhcf78+bi4OAzD3NzcMAxjBw39/f0fPXqki8ycnZ1v3rypKwMBgDEwyTDLw8Nj+vTpUVFRkZGRkPMIACiHeDzeb7/9ZqhH1+/B+th2giCstT59KA6HU2gElm87QRAeHh75Hoinpf9XBbcAYFgmGWZZWFjUqlVLLBbz+XwYNwQAAACAcTLhidZqtRpiLAAAAAAYLRMOswAAAAAAjJlJDhqy2Pq/hm6FqdXUKakSOwCUOQqFIiUlBcOwChUqfCy/h2EY/Yp9DMMIBAKYiAMAKFNhlkKhSE9Pj4+P1y0FDwpHaWq+f1DQgdGWeAAA6KEoat68eYcPH6ZpWq1WV6hQYe7cuWxxinzevn3bqVMnpVKJYRi75vGePXtatWpliFYDAEyASYZZL1++XLp0aVZWlkQigevIj+Ii9Aihdx9uxBDK05Y0hD4tAP5PqVQmJSX99NNPNWvWZJfPGzp0aI0aNapXr55vT7lcnpaWNnv27Bo1arDVOItS/gAAUG6ZZJhVq1atPXv2REREDBw4kKKg2uZHMAgJELL/cCOGUCZC6YZqEwDGSCgU7tq1S7f2YoUKFf7555/Tp08XDLPYndu3b1+zZs1v3kwAgOkxyTCLIAhLS0sLCwtYkpZNUCu8hg2JUG2EBn04aMjV1oz+tYTKRgNQJmBaupsqlYqiKCsrq0L3lMlk27Zts7W1rV69evv27c3NzT97cFQ6MjMzS6NwoFgsLlgsNB/2cT99BiZJksPhfPrps0t6sPWu9JeUprXYv9UfsmAYhqbpfIMYFEXhOA6pusA4mWSYxSrn1RwuXboUFxf35MmT1NTU33//3cXFpV27djY2Nh/sRGkXjdY/D9OQmwXApzAMs379ei6X26NHj4L3EgTh7u4eGRnJMMyePXuWLVv2xx9/5FurmKKoVatWvXv3DsMwHMcfPnzo7e2dnZ3NpnN9ccMUCgWlxR5WKpXWrVs35X08okr0I80TLVu2fOLEiZ8YKOBwOAsXLlSr1StWrCh0Nw6Hs2HDhtOnT//444/du3cvuA+Hw8nKyjp+/PihQ4eio6MxDHNycurQoUNwcLC7uzuGYT///PO1a9fYeu7u7u7dunXr0KEDn88/ffr0qVOnFi5c6Obmxr4UCoVigFa3bt0+O7iBYRj7GkqlUkbrS18mUIoYgs+VycTFipu11z9qmQIjNVG7AbEfT6VSqbtWMeEwq5zbtm3biRMn+Hw+juOzZs1ydXWtVatW/jALAFBMq1evPnr06L59++zt8424a7i7u58+fZpd7yU0NLRv377z588/ceJEvv4VkUjE9nJxOBx20mK+DrMSIc2WyDy7o+pdEF1Ca0eTcnT6R5Xq819U9+/fVygU7PPKF6xwOJz79+///PPP6enprVu3LuRhMEwikYwYMeLatWujRo2aNGkShmHh4eE7duzIzc1dsWIFQuj27dvR0dEzZswgSfL27dt9+vTZsGHDqFGj3r17d+XKlenTp+sORVHUmTNnGjduXLynWgr/HKCkYJpABS/ekAuj6VvFMRwZ+p+14FsLwixTtX//fv2lu3Ac/2w/PwDg01atWrVy5cpt27Z17Nix0B1EIpG7uzv7u5+f37hx48aPH5+bm6s/wsjhcCZOnKi7uXjx4oiICAsLi69sm1wu1x+G42h+Y5BbI9Tgh5JZDx5DSMWgszMI7VDgp2cXEQTBho8Fxw1zc3N/+umnvn37Xrlyhd1S8FA7d+48f/78lStXGjVqxG7p2LHjiBEjoqKi/m0Lhnl6eo4ePRohNGbMmC5dumzatGnUqFFcLfaAuv/y+Xx2wLEoM6I0rxuHIxaLPzvaCwxJKCxmagsjFAqFIh5CRrHU0gerThm0JeDLQVBlEqsU6IZ42JO7oRsFPmXTpk2rV69ev359r169ivgnHA7ns9lRpbvuKqXWpAGUVJilln/9YTZs2MDj8caMGXPhwoVCd1CpVAcOHOjatasuxmJZWFgEBATobuo6yTgcTo0aNR49egRjfMAUmXCYxefzodcXGCeJRNKlS5e8vLy0tDShUCgWi9u1a7d8+XJ4xxonmqY3b948e/bsJUuWdO7cWSKRMIzm4lgkEiGELl68mJGR0bNnTz6f/+bNGzMzMycnJ4RQeHj45s2bi5IFX348efJkz549x44dMzc3/1h8mZaWFhISMnbsWPYmwzBSqVSlUmEYxuPxxGIx+zGhKIpNhI+MjDx9+nRgYCB8fIApMskwKyIiYteuXWlpaRkZGTDZEBghgiDq1KmTl5d38ODBqlWr1q9f39PTE74kjJZCoVi2bBlJkn/++efRo0fZ7/5Bgwaxg1Z79uwJCwvr1KkTn8/fsWPH5cuXnZ2dGYZ58+YNQRCLFy+GfkpWbm7uggULBg8eXKtWreTkZAzD9CcP6rBJXWKxmL2pVCpnzZr1/PlziqJq167966+/8rXu3r3boUMHiqLi4uJomp43bx7MfAKmyCTDLDMzM19f3/j4+I8tiAGKKzw8PC0tTaFQkCRpZmYmEolq1Kgh1IyOgy9hYWGxfv16lUp1+fLljh07Ll261NAtAp/C4/G2bt2qVqtVKhW7hWEYHx8f9vepU6fm5OSwH4fx48fXqFEjOjqaJMlBgwa1a9fu65OuyoyDBw8+f/58xowZT58+TU5OlsvlMTExr1+/9vb21r8eNjc353K5KSkp7E0ul/v999+3bNly3bp1jx8/ZmcLUhRlY2PTqVMnhmHc3d2bNWtmaWlZ6INiGFa6w7IAlMMwy8XFpX///m/fvt2/fz98wErE8uXLz5w5o5kQq1ZbWlq6u7sfOXKkWrVqhm6XaWOvvOH62/gRBNGlS5eP3Vu3bl3d766uroMGDfpW7TIx0dHRcrl86NChDMOo1erk5OT9+/dHRkaeOnVKPyPY1tY2KCjo3LlzkydPZlOvmjVrhhC6cuXKs2fP2H1IkvTw8Bg3bly+h7CyssrJyZHJZLot2dnZCoUCgl1gtHBTTzE2dCvKiAkTJuzfv79du3aVKlXatGnTr7/+6uLiYuhGmTx4f4JSh3MQB5XcD7fo63AVHASfM2fO8+fPr169+s8//xw5csTNzW3UqFH79u3LN+zA4XBGjhx548aN33//XX9dWplMpj97utBL6GbNmkml0kuXLum2HDp0yNra2t/fv8gvGQDflEn2ZoESx16vX7t2LT4+vnPnznBpCIDxoxkMJT5Dr66gEunUxzDNTEM6tygXBwRB3Lt3r2vXrrpgqEmTJjNmzNAf2sNx3NrautDyY927d//pp59mz5599OjRWrVqcbnchISEmzdvdu7cme33YouIFvxDV1fX6dOnr1mz5tmzZx4eHrGxsZcuXRo5cqRuhBcAYwNhFvgPRVFsb7+hGwIA+AwMw8yt7aTRJ1HMmRJaPAtDiKEEXB7/88ViBg4cWKtWLV3nE0VRFStWZBhG18Vlbm4+efLkfPXxdfh8/vz583v37n3w4MHIyEgMw1xdXffu3dusWTN2PsHgwYP1e7b+ayKGLVq0qFmzZseOHYuMjLS1tf3jjz/at2//dU8cgFIEYRYAAJgePp9/4MABpUJR5FG+IqEo2svL67O79dL6xA6WlpZjxoz59EGqV6++ZMmSQu/q27fvx/4Kw7CWWp9tJADGAMIsAAAwPTiOBwYGGroVAICymwIPAAAAAGDMTLg3C4o9fh6u/RemdXkX2ptQSREAAAD4JkwyzGKXioOCDp9GIxpFI/RQG13JEFIiZI0QF6FIRMkppmRyZgEAAABQtsKsly9fbtiwIT09HRbb+QQLGwuLMAvsDwzDMLlMrlapza20K68xiGujWeXe0A0EABQDhmFwYfn14DUE35hJhlnOzs79+vWLiYl59uwZfGYKxeVyN2/eLJVKMc3JGft96+8XLlw4cvgIWycQw7EaNWoYuo0AgGLg8/kqlUomk+kWVwbFxTBMTk4Oh8OB60zwzZhkmGVjY/Pdd99FR0cLhUIIswqF47ifn5/u5oWLFwQCQdNmTeHsDICJEovFZmZm8fHxQqEQevG/DEmSCoXCzs5Of/EfAEqVSYZZLKVSCTFWEZEkyTCMUqkUCD5feBAAYIQIgnB2ds7JyZHL5XDq+zJCodDW1tbCwgIuOME3Y8JhFgAAlCsEQdjY2Bi6FQCAYoCeZwAAAACAUgFhFgAAAABAqYAwCwBQVDiOYxhGEJBsAAAARQKnSwDAR9E0nZGRoVQqMQzDcTw3V6pUKuPi4szMzRHD4Dhua2vLVgkBAABQEIRZAICPys7OHj9+fGjYSzbMehcblyeXd+3eg8PhUDRjaSbasmVL7dq1Dd1MAAAwUhBmAQA+Sq1Wh716jSe86FXLiqEZSVWkpgV2gkSCg92NlV5/g+Xm5hq6jQAAYLwgzAKgtLA1JE26Qg+bidWhusXCTm5IRSH2uWjXIL8Vnv3wRCaGQX4nAAB8FIRZIH+CMyxD8fXrmrO/q1Qq9iZFUYwWjuMcDgeZGjXNIDWNSEYbYWkxmEJzEwAAwKdAmFWukSQZGhqalZWJI0RwuXGxMbm5udevXbWysqQZhOMcPz8/a2trQzfTlLx48WL69Ol5Sk1kQtF0XGLy7v2Hbj94TNM0gWPVvDw3btwIgezLly8lWiqVysHBQSwW16xZE5YoAACUPSYcZvF4PJMejjEGMpls4sSJ9+/dQzwzDEOUIpeh6V79BmI4h1Hmcnm8s2f/btGihaGbaUrS0zMuXrwY5IS5WPAQgypW5SM6DSUmIQy7H698nxBP07Sh22h48+fPP3/+PEmSNE3zeDwvL6+TJ096eHgYul0AAFDCTDLMio6O/uuvv5KSkrKysmAJ1a/DkMo80q0Naj0TkQiRckSrSZ4ZwnEU+wDdmM8wEBMUE4ZZCHmr2js19LbQjrL9H47NORt/PBMWrNWYP3/+6NGj165dGx0dvWbNGjs7OycnJ0M3CgAASp5JhlmgBGn6A209kXczpGZvaNNvNIOIYuzWYkO3zlRp8pZUbDLT/+GYmoJkpn/VqlULIfTnn39KJJL27dtDvVMAQFllkmc3Dw+PKVOmREVFnTt3DoZgSgBNaruy9LbgCJFKA7YIlAcURdE0rVAozMzMDN0WAAAoFSY84sZO4zJ0KwAAAAAAylyYBQAAAABgzCDMAgAAAAAoFRBmAWB4NE3DCDgAAJQ9JpkCD0DZkJSUtGXLlvT09OTkZIFAYGNj4+/vP3z4cEO3CwAAQMmAMAsAg8nLy3vw4EFcXNybN2/Mzc1dXFx4PJ6hGwUAAKDEQJgFgMF4eHicPXs2LS2tffv2zZo1W7NmDZTbBQCAsgTCrHKBw+FgGMbnQwly48Iu1M3n8zEMIwgCurIAAKCMgTCrjIuOjs7IyIiPj1coFHfv3hUKhb6+vrB0sVFhk98hBd4YpKSkYBjm4ODw2T3ZdDorK6tv0i4AgKmCMKssYxhm5cqVJ0+elEqlcrm8e/fuYrH4wYMHRfkWAaD8YBhm48aNf//9t0QiYRimUqVKM2bMqFevXqE7R0VFLV68ODw8nMPh9O3bd/To0dANCQD4GAizyjIMw4YMGdKiRQuJRCKVSitWrMjj8SwsLAzdLgCMi0KhuHjxopeX13fffZeXl7d58+Zu3brdu3fPzc0t3545OTl9+/YlCGLRokXR0dHz589XKBQzZswwUMMBAMYOwqwyroGWoVsBgFHj8Xh//PGHjY0NezMgIKBly5Z//fXXhAkT8u158eLFmJiYS5cuBQQEIIQyMjLWrl07fvx4oVBoiIYDAIwdTGsCoOThGEIFfjDM0M0CH8HhcHQxFkJIoFXosvTXrl3z9PT09vZmbzZu3Dg3N/fly5efODhBwNUsAMX0BadLYz3DwucfIIRxNG8E/QxsHCEOpJt8IQahbCUtzaPU1L+vqSbKwjG5GpLcTcPhw4dzcnI6d+5c8K7o6GgLCwuRSMTetLa2trKyioyMrFu3rm4fiqL27duXkJCA4ziGYVevXnVycpJKpRiGwUQHAD6L4fC4crmgWGEThinkcrVchVEqZFCYlkqlEggE7BYIs8o5DOEclPQc/fM7otR6m3GU8RYxlCGbZpo4OKYgma6HEwq918/PSK+3gM6RI0dWrly5fv16T0/PgvdSFKWf8M7lcjkcjkr1wZmdYZjQ0NA3b95oLlhw/P37905OTiqVCsIsAIqEwDCSRMVEkqRarUak4cMsHMcp6r9vT2MMsxiGwYy1968Mwjko4S5KfpJ/O00hgh3uAsVAMwyXg02uZ+vrKFDTer1ZCB0Ky4z7f/8WME4nT54cPXr0woULBw8eXOgOfD5foVDobioUCpVKJRaL9fchCGLt2rW6m0uWLAkPD9cflAQAfIaZGSrWNQnDmJmZIQsxQh98GA1FKBTqrqmMK8wiSfLgwYOPHj3y8PAYMmQI1KQpfYwm9vcfinquR+oPBw1j7qHD3T4cSgSfxzCa6LSrt1kjbwtE6iX3YFh4Wt67LEO2DXza6dOnhw0bNmvWrKlTp35sHz8/vwsXLkgkEjZsSk5OzszMZNPhP0b/uhYAUN4YVwr8wYMHDxw40KFDhxcvXqxevdrQzSk3cB7ii/P/cP/NPgFfQEkxSE0jNfPfD8mQ/+/cAkbo/Pnzw4cPnzhx4pQpUxiGoWladzH69OnTf/75h9SOYrRu3frNmzd3795l7zp58mSVKlXc3d0N2nYAgPHK35uVkJDw4MGD3NzcHj16WFhYhIaGuru7W1pafsGhZTJZfHx8YmKiQCBo2LBhvsXaQkNDHz16xOfzmzZtyhanoWn61KlTo0aNat++vaur6/jx43Nzc83Nzb/uCYKiYDSdVvoxgOYmxATAhEVGRj59+pQgiPbt2xME8ebNGw8PD13qej55eXkDBgzIyMi4f/9+t27d2Birb9++7NDh6tWrX7x4cefOHQsLi2bNmvXt23fEiBHDhw+Pjo6+cuXKzp07YVkFAECRwqwLFy5Mnz49Pj5eLpc3atTIwsLit99+q169+ie60D9GpVINGDDgxYsX79+/d3FxCQkJ0WXdI4T27t07b948Z2dnuVy+YsWK7du3N2rUKDc3NzMz08PDAyFka2urUqkyMzMhzAIAFNe+ffsWLVqUmppqZ2dXr169ChUqLFiwoFu3bgMGDCh0fy6Xu3DhQqVSSZKkbu2jypUrs/cOHDgwPT2dXRKUw+GsW7euSZMm165ds7OzO3v27MeKxQMAwAdhVnZ29rRp0zp37jxy5MhBgwZpMvYRql+//okTJyZPnpyvL6ooWrRoMXLkyCtXrhw6dEh/e3h4+Ny5cwcPHsye1/r27TtjxoxLly7hOJ4v+b3QujUAAPAJr1+/XrRo0eTJkzt16tS7d2+apvl8fqVKlW7evPmJMGvcuHEfO2D79u31b5qZmQ3SKoW2AwDKmv+CpxcvXvD5/GnTptna2uo2Ojs7Z2dns0kJxcLj8caNG9euXbuCy+c9efIkLS1t4sSJBEGIxeKxY8dGRka+ePFCLBZbWFgkJiayK1oQBGFtbf11zw4AUO6EhoZaW1uPHTvW3Nxcl1/l6uoqkUgM3TQAQDkOs9huJEZLdzM5OVkoFHI4nC9+gII9Us+ePfPw8NCFUP7+/hkZGVFRUTiOt2nT5vfff3/48OHWrVtr1ar16dX3+Hw+Wwfsi9sGPvvqwcv7DV5SY36Rv+wdQhAEhmFFXFC5WE+/KDuz/eLs2Uz3J+/fv4f1cAAAhhw0rFmzpkql2rNnz6BBg9gTU2Ji4rp16/r37/81YVZBGRkZ9vb2upsWFhYEQWRlaWa6Dx06VKVSbd261cXFZezYsQVPqSEhIQcPHuRyuRiGpaWlSSQSmRYML34BHMdzcnI0s80/+tXFyGQyhULBjiCDz+JwODKZjPlotTGMoqmcnBw2yyffv4JKpVIqlfkKXeb/+/9fC6FvQtu2XIqiEbfwJ8Qw/75D5HL5X3/9lZ2VjTGaPR8/eJyRlrF21VoOwWEQw+FyOnXqZG9vr99yPp+vVqtpms7JySlihgBBEFKplKbpTwdbvr6+WVlZhw8fbtmyJfuihYWFnTx5csGCBV/0MgAAQEmEWRYWFgsXLhw/fvyePXuSkpLGjh37/PnzgICA/v37oxKFYZj+KZXtP2PPm0KhcPLkyUqlUv97SF92dnZkZCT7e25urkqlommaJEkIs74AW6n2U9/YDKIpitT6hu0yYQzDaMLWT7ymjKaKkuZl/3/AoasXzL6TP/ZSs+viKZVKHMcJgvj3gUqZtm0kYrSh00ewT0ehUCxevDgmPgZZaWNMBUIUmrpqquZ3OSIUhI+Pj42Njf7nFMdxdkIfW7u5iLFjUZ51tWrVJk+ePGbMGE9Pz+jo6IEDBz558qR9+/a9evUq4hMHXyUnBcU91dQ9LiKaQm61kYVj6bYKAGOYadizZ8/KlSufOnXq1atXBEEsX768e/fuFSpUKNmHdHV1vX79uu6Em5aWxjCMfv/Wx2IshFBTLfb3mJiYjh07mpubf1m9CcAutUlwOOhjsRaGmVtYaErrgiKzsLDAsI8FWgyHw7G2ts43mkaSJIfDEQqFYq2Cf5aZmdm3b1+lUsnhcNiSTs2bN587dy4qfWq1WtMj9ZEYCMMwCwsLsVhMEASH4aCGCHVGiNaGWSRCZghxEQpD2EHM0sKy4OeUz+ezazYX+qwLZWlpqRsT/ISxY8fWrFnz3LlzlSpVEgqFI0aM6NKlCwwafiNxT9GewYhX5MJ7qjw0eA+q+cE8AwDKbN2s2lol+ADs4qn6dWVq1669YsWK+Ph4dsmwe/fu2dvbe3l5FffI7HUtrBH2NT776sHL+w1eUv1Eoo/h8XgkSV66dMnNza1mzZpsh9Y3SOoq4tPRNIbBkB1CFbUBFru6EI0QH6EUzbLZnzhOsd5jRd+5mVbRjwxKDM7RxFhFD7PYPwGgzIdZKpXq6tWr7ImMzX5ge/XFYnFAQEBxe4wYhnn9+nVWVtabN29yc3Nv3LghFApr1aolFovr169frVq1adOmbd26VSKRrFixomHDhlWrVi36wePj4y9fvpyQkJCTk/MFlSYAMCoCgYAdCvzYDtbW1idPnkQIVapUaejQofPnz0fGidbGWPrDevlufhMSieThw4e6Su4YhnE4HJIk7ezsfH19i95zBgAAX++/M7tcLp81a1ZoaKi5uXmFChVkMtn79+8dHBzMzc1zc3Nnz549ceLEol89MwyzZcsWdnDQyclp4sSJfD5///791atXd3Jy2rJly8yZMxs1asTmq65du1a/eOlnyeXymJiY1NRUWCwMmCiJRPL06VOa0lzPZGdnZ2dlR0dFX750WdNNS1M2tja1A2rnC7wUCgXDMDAd4bNiY2OnT5/+4sULa2tre3v77OzslJSUihUrYpimU23NmjXff/+9odsIACiXKfB169atWrXq2LFjK1SokJeX988//xw6dGjhwoWvXr1avnx5kyZN6tSpU8Tj4jg+Z86cCRMmsIOGbPeYq6sre29QUND58+dfvHjB4/H8/f0/cR1fqKpVqy5evDg6OvrWrVuQ/A5M0fPnzzt37qwiVRhHk8lFkdS7uHenzp3ShFlKKigo6O+///50QRPwMZ6enlWqVGnUqNGAAQPYMOvUqVM3b95cvnz52bNnZ82aFRAQ8AVZCgAA8AX+i2/evn378uXLQ4cO6ZaYqF27dlRUVEhIyOzZs+/cufPXX38VPcxCCDk5OX3iXgsLC7Y364upVCrIHALGSdPty/78t+mDWwzNqGk1/T2NvLQjazmI4TKUiNLkjB9AlMK4umk1LS/4dIy12tejR4/S0tIOHz6sm0wTGBjYs2fPmJiYlStXXrx48dGjRxBmAQC+dZgVFxdH03S+wusODg6vXr1CCHl4eEilUmQcSJKUSqU5OTnQlQWMEIOQgmQUagaRDKWthoBjGMKR6sMZnZpyCR4UqqrNXmJDFgYhHkJOCMv76GRFgyBpRkVqns5/mxik/mQxEANKSkqiKCrfhGWxWPzixQuEUJUqVYznVAYAKEdhVvXq1d+/f79p06ZRo0bZ2dmp1erHjx/v2rVrypQpCKF3794VqyurVIWEhCxZsiQ7Ozs9Pb1kS6eWV1jBvgrj7awwbhhicuWqfofjzfmIYZCMwbiI4WOa7PBEOapaVfnB3rQ2xtLvuqK0G40JgWN7X0hvJETRep3HGIayFRTF8I3wbeLl5RUVFbV3797u3btbWFjI5fLLly9fvXp106ZNFEW9e/fOxsbG0G0EAJS/MMvZ2XnevHlz5849fvy4nZ2dQqGIjIysU6fOgAEDpFJpjRo1OnTogIyDj4/Pxo0bIyMjR48eDVnwJYAmEUVqv+ApTTcFTmi6UsgPA4JSFhYW9ueff5IkmZ6ebmdnJxAIOnXqFBAQgEyNh4fH0qVL1aSmq4dUkxs2/lbD16916zY0Q+MIVajgaHIXBgyD3MyJZpVEJP1fmIVjWEyW8sZ7o+p0+1ft2rXHjx8/bty4zZs3W1paymSyiIiIDh06dOzYMTMzs2nTpqb4vgIAmKgPcs9Hjx7duHHjEydOvH371sLCYuLEiZ06deLz+TRNL1682HhKJwgEAldXV7lcrl+OC3wRTDOS9fwgyojUfJ0qJYhSIqGDJtJKf6NWyGi9b9ZSFRsbe/ToUalUmpCQ4OrqamFhUb16dVP8OnRzc9MVDqUo6uCBfc2/a7Zg/jxksiiGaVNZuLqLM1Lr9bNxsKsR2TdPZRlhnMXlcn/66adWrVqdPn06Pj7ezs5u0aJFzZs3Z0uhrl271pgXkQQAlDH5p/j5auXbaDwBlj7dKtfgi/F4vB49e/n6RuCI5nCIu/eSk5JS2jXxFwqENHLn8jThbGm3ga1v1KxZs/Pnz9+5c2fkyJGrV69u2LChtbU1RVHsTFVkmkiSZJ8dMnHaCqTs//y3ycg/fA21TOJUBgAoR2FWREREWFiYUqlkSzBgGObh4VHwbGVYKpUqOzsb6mZ9PaFQOGfOHN3NSZMm3bhx47eNW2xtbb9ZGw4ePHjg4EEG43C5vJSU5DyFct2GTQcOH6UoCqPJXr16DRkyBJmmMnMZQOAY4mCI/v9sSUbTm0VwjDr8ffbs2du3b5VKpa5cvo+Pjyn2jwIAyk6YtXv37uXLlyclJclkMgsLi5ycHITQzJkzjS3MCg0NXbBgQU5ODqTAl4Zv3Hv04uXL8+fO9fYW8jgYh2QaOnOd0p+IsjCJnLrwTlnFqxjLA4DSQFH0vXjpubBMkqJTZbSSQi5mOEFg197mqjQLXRtjKLly5coNGzakp6er1WozMzN2uYjVq1dDmAUAMFiYlZGRsWjRomnTpnl4eKxfv/7IkSOPHz9esGBBy5YtkZGpVavWvn37IiMjBw8eDB1apt4Hg+GcCnw0o0kFPhejaU3tAALHcA6WlUe9kcQxGIzyGBKO4/Y2Vk9jzAZdkGkK1ufKSJK0sjTHcZykcBsbWyPMj3z69OmGDRs2btz4/v37mzdv7tq168yZM+vXr2/VqpWhmwYAKMdh1suXL+3s7AYOHPjkyROGYczMzFq1avX27dsdO3a0bNnSqHIauFyujY2NtbW1UbUKfBkOhlKUqPvReBxhjLaUBPtfimFSpDTXuEemyjxLS8sNGzbk5OZqFjnF8GXLl72JjNy4aZNYJGYQQ3A41apVQ0YmIiKiQoUK3bp12759O0JIJBL16dPnyZMnu3btWrdunaFbBwAox4OG7BK2AoEgOzubJEmCIFxdXWNjY0mS5PF4yMiUgcxioJ3Ihqy5aF4Tey5HE2axMAxJldTqW6kkdFYaFEEQNWvW1N10dnJKSU5uEhRkhCcEHRzHzczM2BgxJyeHzc2yt7e/c+eOoZsGACjHYVbVqlXT09PfvHnj7e2tUqmWLVvWqlWrNWvWeHh4FHfNwW+Dx+OZ7hw0oMMwyFqARtWxRjy90uc4licl9z5N1y+JCQyOoiiappVKpTGHWa6urqmpqVlZWY0aNZo+ffr69eurV6/+xx9/tG3b1tBNAwCUO//FTw4ODqNHjyZJ0sbGZs6cOYsXL969e7e7u/v06dONbWwuOzv7zZs30dHRCoUCIq0yQFOxi2L4+unUuGYLhFjgC/j6+g4fPjw1NbVq1aozZ87cuHFjbm5u9erVJ0yYYOimAQDKcZiF4/ikSZPY33v37t2yZcuEhAQ3NzcrKytkZGJjYzds2CCRSNgJRIZuDgDAiFhYWLBLhCGEfvzxxx49eqSlpXl4eIjFYkM3DQBQ7uQfDZTL5aGhoSkpKSKRyMvLywhjLIRQzZo1t27dGh4e3q9fP5hpCMA3w1aLNeYRQ52cnJzQ0FCJRGJmZlajRg2IsQAAhg+znj9/Pn369LCwsMzMTC6XW6FChZ49ey5YsEAkEiFjwubpCwQCGDEsGzBMWwAT1+ZmsVMNcYww4fLvRYZphkc/qDxlrJ2zd+/eTU1NjYqKysjIOHbsmKOjY8OGDdlMcyN048aNmTNnRkdH5+Tk8Hg8V1fXQYMGzZo1y9DtAgCU4zBLJpONGDHCzMzs4MGDfn5+Mpns0qVL8+fPt7e3nzZtGjI+kLlTNmAI5apRklQt5OIqks5W0pZ8Dp+Lp0nVeSqmLAdaNEIXEHpYIMx6g1AlZGw2btx46dKl3NxckiQnTpzo6el5+PBh4wyzoqOjR44cWatWrXXr1nl7e2dmZv7555+rVq1yd3fv16+foVsHACivYVZISEhubu7Ro0crV66MELKzsxsxYgRJkgcOHJg4caIRFiEEZQRDpSpQx/0xAj5XSdLZCspKQPAJLFeuCs+i22JltGwHGz/GIZT6YZiFIZSJUOX/72A0FixYMH78+Ly8PJIkzc3NxWKxs7MzMkqPHz/mcDj79u0TCAQIIRsbm5kzZyYnJ584cQLCLACAwcIsLpdrbW1tYWGhf7ejo6NYLDbONHOCIMrBqFLZ17x5c5IkQ168unT+7/9vUyOEWrRu2zGgVvPvvkNlkmZgFKGhCHkjpJ9eyENoG0Iqo1vDxtvbG5kIgiAcHBzYGEvHwcFBIpEYrlEAAFTew6xatWo5Oztv2bJl2rRpPB6PpunExMQdO3b06tULx3HdStLICKSlpT1//vzdu3cymWYBEEM3B3yV1lqvXr3aU7OGQqFITk52cnISCoV9+/b19/dHZRuBEPfDfKx8N0HxBQUFbd68ec+ePf369eNyuRRFvX79+ty5c3PmzGFrGhvPqQwAUI7CLLVanZGR8dNPP23fvr169ep5eXmPHj3icDg4jp86dYqm6d69ew8ZMgQZgaSkpIMHD2ZmZubl5RlnTxsorho1aqxatYot7l+O/k2Z///obwFfJzMzUy6XDxkyZNmyZV5eXhKJ5NGjR3Z2dlu2bNm0aRNFUVOmTGndurWhmwkAKH8zDRs0aFC3bl1aCyEUGBiIECJJktGytbVFxsHPz2/37t3v3r3r1KkTFHQoY8pSjMVOhi2pvEb2aMa5JMOXYbuUSvxfnMvlNm3atGHDhuypDMOwoKAg3amMpmlzc/OSfUQAAPgYzSk7Pj7ewsLC0tLy559/RqZDoVDAZENgnJRK5bVr1+RyuUwme/Xq1enTp11dXWvXrl3c42RmZj55+pTRXkuo1Cp5Xl5kZMSVy5cYRjPT1sLSMjAw0LQCU5VKxV7FcTgcNu7Jy8vjcDjsyoNcLveLnw7DMPHx8XZ2dh4eHitWrCjphgMAwJeGWdu2bbt27Vrt2rW7detWv35945ykDYAJycrK6tevn0wmQwidPHny+PHjffr0OXDgQHFTgkJDQzt17EhSDMIJzZxMtfLQkT+PHj+l6V4mVQEB/nfu3OHz+chEZGVlzZw5MzL8JaIpDofz6uULqVTao0sHgiAYBonMrX5eudLX1/fLDk7T9MqVK1+8eNGwYcPOnTvXrVvXhF4ZAEBZDrPGjx/v7u5+5cqVadOm5ebmtmzZsnXr1rVr1/bw8DB08wAwSba2trdv36YoKi0tTSgUmpubW1lZfUHaNUPTahVJt/kZebZApBLlJjM8ESnQrs1wfQWpiEQmRalU3rl962WMDHk2RRSDHF1RBeZWNldTmTbtLSG5MjMz84sPzuFwZsyYcerUqWvXrv39998URbXR8vPzc3V1LdHnAQAAxQmzHBwchmvFxcWFhIRcvHhx3rx5PB6vSpUqrVq16tChg6ura1nKCAGgtBEEUbNmzRI4EEPjAjO6YgNUqTYi/19Miy0GEVYVywlHJgXDMD6XQLV/QD2Xa6t2/B8HoZf/CP7shuNfNQHQ3d19gtbbt2+fPHly6dKlCRMmWFpaent7t2nTpl27dvb29hwO5+ufCAAAFNEHwZObVufOneVy+cOHD8+ePXvs2LGff/65WbNmGzdutLS0RMYEpmSD8oFBNKkpGZ+vUCtjspM/KLWmMFi+MItUlOAjVNHq06dPbm7u3bt3T506tWvXrp9++qlHjx6//vproelfiYmJDx48ePnyZXp6er9+/Ro0aFDokZOTk9esWZOXl8cm19M0PXbsWD8/vxJsPACgLMnfR8UmogqFwmZaeXl5YWFhsbGxyJhQFKVUKvPy8iAFHgBQKPZUZm5u3lYrNzf32bNnqampH6sYcvr06WnTprm7u0dGRlavXv1jYVZaWtrGjRvbtWvn6uoK05wBAMUIs0iSXLNmTYcOHXRXZgzD/Pnnn+7u7t9//z0yJmFhYatXr87MzExPT4chAACAvtTU1F27dvXv31+XkqVWqw8ePBgYGNi0adOP/dX333/fr1+/9+/fd+7c+RMHZxjGxsZm7ty59erVK4W2AwDKmv+u6t69e7dr1y796zwMw9LT09esWcNOwDYenp6es2bNGjlypKWlpbG1DQBgWM+ePduzZ49+cSwul/v06dNt27Z94q9sbW2trKyKUuSMYZj379+/efMms2gJ++VuQdgvSOeADBBQdt9F//VmxcTEVKhQId+UnGrVqv35558kSfJ4PGQ0zM3NfX19hUIhn8+HcUMAgL60tDQnJ6d8y7NWq1bt1q1bn/3bz55PMAyTSCQTJ07EcVwqlQ4aNGj27Nk2Njb6+9A0fffu3czMTDZ/NCwsjMPhKJVKVA4wGM5RqYobV6pVKkqlxhi4ZgZl4V2EYRhJkrrrq//CLAcHh2QtKyvtdHGtiIgIkUhknANzarUaYiwAQD4WFhYJCQlyuVwkEuk2RkREiMXirz94hQoVDh8+7O7ujhC6f//+lClTCILIVw2VoqiNGzc+e/aMXd4+ISGhQ4cOOTk5GIaV+VMWQwgEcjm3WP0KGCaXyxUyBVai0yCA6WJM+V2EYRiO4yqVStc59V+YVaNGjQoVKsyZM2f+/Pnu7u4KheLRo0dr1qyZP3++cYZZAJQdukoN4KsFBgaKRKLJkyePHz/e1dVVKpVeunTp1KlTO3bs+PqD29vbd+/enf29du3aiYmJW7ZsmTdvnn4Mx+Vy9+7dq8tnWLp0aUxMjJ2dHSonzM1RsaJJhjHXVJYzQwgqY4My8i4SiUS6a6r/wiwul7tmzZqBAwd26tSpQoUKKpUqJiamV69effv2NVxTASjrcG2lBlobaeHaHwi2vk6FChVWrFgxdOjQCxcuODg45OXlxcXFjRkzpm3btiX+WDVr1szMzFQoFPm6yvQL0LMXteWoAE3xn6nmxSk/rw8oZ++iDwo6BAYGPnr06MKFC6GhoSKRqGXLluzq0QCAksUghlSS6C+EHiBEIZSDEBchsbaCVCgivch/+7dMCwchHtKUUdXhFSwa8y106NAhLCzs3LlzkZGRlpaWHTt29PHxKfr63PlSUd+9eyeXy729vTkcjkKhEAgE7HaGYU6cOFG1atVPL1BW5gcKAQCfkP8UaG5u3rNnzx49erADhRSlWXrsUwcAABSfpaVlw4YN1Qo1JtEkS4ZHhJubm1d2r0zTNOlB+gX4md7nTlPJHaEjH5ZR5SD0XvvLN48a7e3t+/fvz+ZJsGnpn16U+uXLl5s2bZJIJPHx8Tt37rx//37jxo0HDRqEEFq+fPnr16/PnTtnYWGxcePG0NDQunXr0jR9/fr1y5cvb9q0CRZPBAAUKcxKTk5evXr1oUOHlErlo0ePKleuPH/+/KCgoPbt23/0AACA4qtTp87169fZ3zMyMtq1a9esWbM1a9awWzAMM70qADhCiQjlfrgRQ0hugGHQqKioZcuWnTp1yt3d/cyZM9bW1gsXLuzRo8fHio6yU2oyMjIwDPv+++8pikpPT2dX/mZzsBwcHNh/EW9v79u3b58+fZqmaQcHh+PHj8PpEQBQpDCLoqgJEyZER0fPmjVrx44dSqWSPdfv37/fOM8j7CweQ7cCfFO0FsMwJEmy62ya6NsAx3HdyBSPx8MwjCCIj5ZNIfiaIUX9Z6nJ4jKyZUZJhBoi1Ek7BqrDRSgMoT++aaQlkUhGjRqFEFq2bNnWrVvVarVIJEpKSjpx4sQnwix/f/8jR44UeteYMWN0v3fWUqvVNE1DJxYA4LP+O1OHh4c/e/bs9OnTHh4eJ06cYKfJBAQEXL16VX9qojHIy8tLSkqKiopSqVSm+BULvti5c+dWrlypUCjS09Pt7OwIgli0aFGbNm2QKWNzdwrP4MEwzdqF0deRMuOD8AVHKC0c8Y1pYJHRTvFx0MZbug8lD6H4b92Qe/fuxcbGPnnyhMPh7Nq1i31hfX19nzx5UlIPYXp9jQAAg4dZycnJDg4Orq6u7Kqo7EaGYYxw3a7w8PAVK1Zkan063wKUMdbW1tWqVUtMTHzy5Im3t7eLi4t+mbcyCMMRqURX5yOMk79HiCaRfy1kVEikWROanTjJaBOzsA8z4r+JzMzMChUqWFhYpKen64JXTdIb+c2bAgAo9/4Ls7y8vFJSUp4/fx4YGKgb0Th+/Livr69RdWUhhPz8/Hbt2hUREdG/f38jjAJNF9s1aJwdhDk5OVKp1KOyx5IlS+7dvXfz5s1hw4Y1bdKUpunExEQLCwv9xVXKDoZGhAB1Xo/cGyJKL0rAcHRjJaIeI6OhYlToCkLvtKGVDCE1QpbaXrcMpFKqmG84auju7p6YmBgbG2tvb49hmEAgUKlUV65cCQoK+mZtAACA/GGWm5tbhw4dhg0b1rdv39TU1FOnToWEhFy8ePHEiRPIyBAEYW5ubmZmBl1ZJYVNeNKlPRnhDNMdO3fs3b1XUxcFx6S5UrlMPnvmbAtLCzZba9ToUWPHjkVlD8NoIipbL+Rc/YNuIRwhM0eUY/hlJVgcDqdb927vE9/jjOYj+ez5s5TMlNZ1W3NwDuPFEAIi33I0paquVpcuXfr27ZuZmXn48OErV65ERUVt3br1m7UBAABYH2TRrlixwtLS8uzZs1lZWRs2bHBzc9u5c6fRXgJCNZoStHjx4ps3b0ZEREgkkp49e1asWHH58uWVKlVCRiM+Nj70RSgKRMgKIRuE7FGUKErz/qUQuoYS4xNRGUZT/47E6TOCpbt0uFzuunXrGIZhr3wmTZp0+fLlg0cO8ng89nP6LbtIhUIhW5n90KFDMpnst99+q1at2v79+z09Pb9ZGwAAoJAwSywWL1myZMKECYmJiWKx2MvLS/9eUIaZm5vb2dnhOK5QKBwdHW1sbNh5fMaD4BCIj5AUIYU274etFMBmXnMRhzCuvrdyCNNSKpUURZEkSdN0Xl4eRVFCofDbN8bW1nbLli3v379PTU21sLDw8PD49m0AAIAPwiyGYaKiouzs7Oy17t69e+nSpVq1ajVu3Ng4k3VACZo6dSo73YFhGOMskaBJ7lEg9KpAoUuGvQ+6Ng2Poqjg4OAzZ86o1Wp20Rtzc/OYmJgSWbO56NRqdVxcXIUKFZy1rl+/fuHChfr169epU+dbNgMAAD4Is7KysoYOHbp27dq6deveuHGjR48efD6fJMk//vjDOOtmgZLFlm5CxsrM3MzKykrTp4WQmlTnZOeYW5jzuJrJGWpS/Y2/yEGhcBwfPHjwd999l5eXp1arLSwseFrfuBkvXryYPHnykSNHxGLx4cOHhw0bZmFhwefz//rrL39//2/cGABAOfff12pEREReXp6LiwtCaPv27Y0aNTp27NiKFSt2797dtm1bSDYHhjVnzpzp06dzOBwul3vr1q3OnTsfP368efPmarWaoihjmwxbPmEY1rlzZ0O3QlMCXqlU2traMgyzadOm4cOH//zzzyNHjtyzZ8+6desM3ToAQPnyX/CUk5MjFoutrKxkMtmbN286d+4sFAobNmyYmJjIDgEAYEA8Hk8sFsfExGzduvXkyZNKpfL06dObN2+Oj48Xi8VQLhLoKBQKkUhEEER2dnZERESnTp2EQmG9evXi4795pVQAQLn3X29W5cqVExISHjx4kJWVFRsb+9133yGEcnNzuVwudGUBIxESErJmzRp2WYLjx49zudyKFSua+lwNPp+PYZixVdAwXQ4ODnFxceHh4VevXrWxsalWrRpbsxTWxgEAGDLM8vT0DAoKGjp0KEmSrVq1qlq1KkLon3/+qVKlCnQVACPRrl07f39/lUqVlZWlSdUiCHaY20RlZWVdunTp/fv36enpISEhu3btcnd3b9mypaHbZdoaNGjg7e3dpUsXiUQycuRIV1dXiqKePHlSq5aRFc0HAJSrMAvH8W3btl2+fFmtVrdp0wbDMJqmGzRoAEmjwHhYaqGyIjU19ZdffomPj8/Kynr48OGrV686dOgAYdZXsrCwOHz48Llz58zNzVu3bo1hmEwm69OnT/369Q3dNABAufPBzDI+n9+pUyfdTRzHBwwYYIhWAVAuuLm57d27V6FQZGVlsclnZXyJxm/FzMzs+++/1920sLD44YcfDNoiAEA5ZbwT+D/LCGs7AVAsAoGAzRwCAABQJplkmMWuu6dWq2G9HVAOYIjD1XxSGe3MYG05VsRBCDfJDy8AAJQrJnmmfvHixW+//ZahBbMgQZmGMZQSJYchoRkiaSSXIIKPeGaaBQ7TIhgevPkBAABprj45AmSUTDLMcnFx6d+/f2xs7PPnz6FDC5RlOI7TavrybMQTI4ZmZOmIK8D45pp1o3OT8YAAQ7cPAACMAEf4S8iy+0kbiro/gwQcwfbG2wWlH5yZZJhlY2PTrFmzqKgooVAIYRYow2rUqLFv/wGaVGMYUqlUU6ZOa9qkSZ/ve9MMw2AcW1tbKLYCAAAI5/6T/M+ZXGVRl7dlEM7FNzfaLEAQZn2cSqUqeoylVCoXLFigm9IlFAp9fX2HDRv2lXn0JEniWl9zEAA+xsHBoU+fPuzvNE3PX7jYzz+gT3B/Q7cLAACMCsPn8BFRjDBLRIgw9C0m0plwmFUsFEXdvHlTKpWGhYVZWlq6u7vTtLZH4IvCLIVCMWXKFIVCkZiYKBAIbG1t/f39x40bB/EWKO3rCoqiDN0QAAAARVVewiyhUHjmzBmlUtmyZcumTZsuW7aMx+N9cVRE03R4eLhUKn327Jm1tXXlypVtbW1LuskAAAAAMG3lJczCMMzW1pamaYIgxGKxnZ3d1xxNJBJdunRJqVTWq1evdevWa9asgaFDAAAAAJTTMItFkiTDMDRNf/2hCIJgxxw5HA6kIQMAAACgIOiA+XJsAj5MdQQAAABAoSDMAgAAAAAoFRBmAQAAAACUCgizAAAAAABKBYRZAAAAAAClAsIsAAAAAIBSAWEWAKZBIBBgGAbVQwAAwISUr7pZAJiirKysiRMn5uXlJSYmHjx4MCwsrGnTpuPGjfvKFTkBAACUNgizADB2NE3Hx8crFAp/f38cxxMSEtLT0w3dKAAAAJ8HYRYAxs7GxubChQsIodzcXB6Px+fzcRyHriwAADB+EGYBYAJ4PB5CCFYoBwAA02JcYZZMJouKipJIJI0aNWK/VwAAZQ3GQRyE9FcW5SCEG/hcpFKpoqKiHj16lJGR0aZNGx8fn4/tyTDM8ePH//77bysrq5EjR1avXv3bthQAYEqMK8zasmXL+fPn3759e+/ePWdnZ0M3BwBQ0jAMydJQyltE6i0GimMoKwYhQy4Pum3btkWLFllZWcXFxZmZmX0szKJp+scff/z77787duwYFRXVokWL3bt3t2vX7pu3FwBQnsIstRZXK99dWVlZqampDg4OVlZWnz3O0KFDe/bsOXDgQLVaXSINAwAYF5xAL/5E8TcRo9edhWFIJdN2cBks4axdu3Z+fn4URQ0ZMoSiqI/tdu/evQMHDmzbtq1fv340TQcHB//0008tW7aEQhsAgFIJs169evXrr78+efIkMTFx7ty5EyZM0N2lVqt37ty5atUqoVCoUqmmTp06atSoT+ft2tjYqNVqhjHkRS0AoBTRFHL0R7V6Iv1QBsdQymsUcdiA7aqiFR0dzeFwPrHb+fPnPT092e4rHMf79+/fvXv3hISEypUrf+xPcBzKEwJQfn1tmBUfH5+Tk9O9e/f169dLJBL9u86fPz9p0qRffvmlRYsW586dmzVrVsWKFTt27Hj79u3ly5fnO86cOXOCgoLYPvmvbBIAwHgxNHJrhJpPQPod1hyEXl1HkUcNO26IECJJ8tM7hIaG2tjYWFpasjcdHR1tbGyePXumH2YxDJOQkKBQKDRnWIJIS0tjGIYkSQzDyv41JIeDUdSnAtXCUBSleWU+3okIyhfOl7yLvgBJkhSmfe+VHEyLpmndBdvXhlmtW7du27YtTdO7d+/W384wzL59+7777ruxY8cihKpXr37+/PkdO3Z07Njx0wdkr/yKcv1XGhPa1Wp1UlKSQqHIysoiCMLc3NzMzMzJyanEHwiA8osmEYk0PzoMQpQKmQKZTCYQCHQnKKFQyOfzs7Oz9fchSXLKlCmhoaFs3Y2UlJS2bdtmZmaWhzCL4QoEMplFsU7OGCaTyRTZUkytCUwBYL7gXfQFj8IwWZlZFJei9RMYvhqGYTiOKxQKMzOzkgmz2NONSqXKd/pQKpX37t0bM2aMbktAQMDly5clEklQUNC5c+cKPZpSqczKymKjHDs7O6FQmG8HhmEoimIDrM9ed36BxMTEYcOGvXv3Ljs7myAIMzOzFi1abN++vcQfCABgijgcjn7mFkmSNE3nS8wiCGLlypV5eXnsde2GDRtycnKsra1ROcBgOC4Wo2JFkwwjFouF5mKMyX/CB+UT8wXvouLDMMzK2sqMMCuNIwsEAl1QVFozDRUKRWJiYsWKFXVb3N3dc3Nz09PTbWxsPvZXp06dOnDgAEEQs2bN6tKly6hRo/LtcPXq1UWLFhEEgWGYVCpNSkrKycnJysr6RMqqDoZhSqWSJEm5XJ6Zmclo6e+A4zhFUZ06dUpKStq3b5+jo2P37t3d3NwkEknBa1Dd0digkKbpMn+dCsDX4HA4EolEe3VU+EUqwzDZWVlSqVSpVBa6A4/HYz9rBizNWrly5ZCQkLy8PJFIhBDK1PL29tbfB8MwDw8P3U1nZ+ecnByCMK5p3aXok8ltH/kLDoeDwxq74GveRV+Ay+USnFL5YOqPyJXWJ5+NOfQfCcdxWusTf9W2bduGDRuy14tisbjgDpUqVerfvz+GYRwOJyEhYceOHTweTyAQFCWji+3Kw3GcIAihUFgwzGJPiJMmTcrJybl+/bqfn9+CBQvYSZSfPhobt0KYBcAn4DguFLLDbYV/UjAM4wsEPB7vYzkDHA6Hz+d/g/W58xXtU6lUNE3z+XwMw4KCgk6dOvX27Vs/Pz+E0KNHjwQCwadLZxXlIhAA8O19m2/t0gqzeDyeWCzOzMzUbZFIJAKBoNDgScdS67Ozgdjf3717d/ToUaFQKBAIitgqgiBwHOdyuZ/+EzZzjT3XF1qlQv9obJhVxAYAUJ6JROJPp10KhUKe1sePIMJxvDROjgkJCdeuXUtISJBIJNeuXSMIolKlSk2bNkUITZo0KTw8/NSpU+bm5l26dFm5cuW0adPmzZsXFxe3atWqSZMm6ZIwAACgVMIs/biEJRAIateuHRoaqtvy8uVLBweHkkonZxhGLpcXtw+piDuX7G4AgCJ+ZL5+hy8WGxu7bt06HMd9fHzevn0bFhbWrVs3NsxycnJSKBTs+c3S0vLo0aMLFy4cPHgwQRDTp0//8ccfS6lJAIAy4GvDLIqisrKy5HI5RVG5ubkZGRlcLtfCwoLD4XTq1Onnn3+eNGmSj4/PkydP/vnnn4kTJ5ZIgsLLly+3bNmSnp6ekZHx6SI3AABQFI0aNXrw4IH+Ft1145w5cxiG0Z27atSoceTIEalUyuFw2AwtAAD4mK8NeuLi4gYNGqRQKNLT048cOXL79u369ev/8ssvHA5n2LBh169f79WrV82aNV+8eBEQEKA/8fBrODg4dOjQIS4u7v79+1BnCwDw9TAM+1h6QMFrOQzDzM3Nv0m7AADlO8yytbWdMGECRVF8Pp+iKLVa7ezszF4F2tranj59+vjx4y9evOjbt2/nzp1LajVoe3v7Dh06REdHb9iwAUbuAAAAAFA2wywLC4tevXp97F4ul9u3b9+vfAgAAAAAAFNkkqVc0tPTnzx5EhcXxxYANHRzAAAAAADKSpiVnJx86tSpjIwMCLMAAAAAYLRMMszy8fHZuHHj69evw8LCIAUeAFODaerA618faW7C9RIAoAwyyTCLXSkMSjkAYJJoElEUorS/IAbhhCbOIgtfYAcAAEyaSYZZLA6HAyOGAJgQhmFUJIke7kBJzzXrwioyEK1EQkfE4aKkUCWdS9MwcRgAUKaYZJglkUhev34dHR0tl8sh0gLAVIhEol69+9SJjsIRTRDEjX9iMzMz2zXx53J5DOYqEIlLapUIAAAwEiYZZsXFxW3ZsiUzMzMnJ+fTS6QBAIyHubn5ggULdDeHDx8eEhKyZdtOWBMQAFBWmWSY5e/vv3///ujo6M6dO1MUZejmAAC+HHRIAwDKMBPuClIqlVACHgBTB59iAEAZZsJhFgAAAACAMTPhMIvH48FwAwAAAACMlknmZsXHx1+4cCExMbG4KfBcLhfDMMiaBwAAAMA3YJJhlkKhSExMTElJIUnyszsnJyfv2bNHRWoy5UmSTE5JvXPv/pKlyxnEYIixtbEZOXIkQRBf3J0GVVIB+DIEQeA4LhQKDd0QAAAoLSYZZnl5eS1cuDA6OvrmzZufXWwnPj5+9uzZFhgy42sKIpIIi3qWuuXZPQahZCVycXEdOnRo0cOstLS0s2fPUqQKQwypJiUZ6SHPnu7cvhUxDI3h1tY23bt3h8DLSDAMQ5IkQRAwuGxs9uzZ8+rVqzt37qSkpEydOtXFxWXo0KG2traGbhcAAJQwkwyzijfTEMMFfP7+7vatvS0YUlNl+t/10zBs6fXkPQm8Yj1oTEzMqJEj1FwrxDdHDIXypEn3nl95Gq2J4HKTvDzcO3XqBGGWwd25c2fz5s0KhSI5OdnJyUkoFA4fPrxZs2aGbhf418OHD2/evJmXlycUCi9fvlypUqU+ffpAmFV+wYUQKLtMOMwqFj6BCXj4B6vV4hifU/zPNkMjDEetliCv5khNIbkEcXiakAtj0I3VTPa1Em01+EIymSwuLi47OzssLMzPz8/a2loqlRq6UeA/y5YtUyqVOTk5JElaWVnxeDxra2tDNwoYCqYg5SRZjE8ohjARIdKuQA6AsSsvYZam24v9+W/TB7eKDsMJZOeNnKshtebjzh5KM2XTxhPLvlpC7QVfpXXr1i1atLh27VrPnj3Xr18fFBQEXYxGhQ2qKlSoYOiGACPAFY24M+Kv0LyinpEZJOaKo3pFiQlxaTcNgHIdZhky54ZWIwppfnQYhOjP5+ODbwPDMEKLfZ982RQHAMA3gclJuVQtLXqYRSP6Sy+TAfjWTPLrJzIyct++fampqRKJBKozgI9hU/egyDgARk5zwVycS2Ycg9M+MBkmGWaJRCIvLy+BQEAQBHyJAgAAAMA4meQ1gaur68CBA4ODgy0sLCDMAgAAAIBxMskwi6VQKCDGAgAAAIDRMuEwCwAAAADAmEGYBQAAAABQKkwyBf4LEDiGOBii9Waz4NgXVCcFJoStlQXVHAAAxZMQgrLeI7yIxfYYhBOo6ndF3h+ULyb8DcSu3PzZ3TBtIdKn7+V8Hk6R/+VyYTj2NlONf1nlLQ5P88rpJ4bhSPNJA4YWHx+fkJCAIYYgiBdhoRRFhYQ85+AYTWvy+FxcXNzc3AzdRgCAcbu5FT07gbhFW9ScoTULgcx5iHiiUm8YMEEmGRlkZWVFRka+e/dOoVB8NtLCME0J+Pk30nmcjHwJ8wqSdvdwLOaDa8O2908Rj/tBeVIMIUmUZh0eYFDbt2//+ecVGIeHMJxWK0lSPX78JJzgIUrJMPSUqdN+/vlnQ7cRAGDcCL4mZip6mMUr2p6gXDLJMCs2NnbTpk0SiSQnJ+ez5UkZRlP7buF3doHuYubD3qw9T9Kv59LFe2xN1EajqwsRwfuwOwshVR7yqFi8o4GSRqpVao4N6rVb8w9Ek4iUk4QQcQgkk6DzM0iVwtANBAAAUI6YZJjl6+u7bdu28PDwvn37UpR+n1IhGG1PU6CLsHlVC81izzo4djcm90pOMR9bE7XhqMks5F4fkXqr6+A4erIXyW4X83CghGGIQXxL5NMB6YfBOEK5JLq5GkPFjKoBAACA8hZm4TjO1yr6moYqikEkjfR6sxCOSPoLym5pwza3BqhGS83S0XpHQzH3Ue7N4h8QlCgMQ4psFHpckz+nK6um2ZiD8jJgVBcAAMC3ZJJhFsuQtUlpspClo5nP9KuBbwHjIGUqOjVK24mph6GRPAumKQAAAPiW4FsHlC0MhYSOKPioNjeL0QTEOIE4OJJloVNjNTcBAACAbwXCLFCmUDSD5Cno6QHNXCG1DMmSkdgJcUUoT4KyEyhIzQIfJ5PJLl++nJCQ4Onp2aJFCz6fX3AfqVR69+5dtfrfjAGapgMDAx0dizthGQBQXkCYVQiBQIDjOFvcEpiWKlW8GjduxMVCORxOhlwSFvnaz6+GjYU1xaPJoLpVvasZuoHASKWmpo4ZM+bBgwd+fn4hISGtWrXaunWrQCDIt1tsbGz37t3Nzc2FQiFN0yRJ7t27F8IsAMDHQJj1r+Tk5AsXLpBqEsMwuVyempL68sXLP/b8oVKrGMTY29u3a9eu4DkXGJuhQ4cOGjRIrVbL5fJ//vln4MCBi5b+3KhRI4FAwOPxIHQGH7N9+/br16/fu3fPy8vr3r173bp1271795gxY/LtRlGUubn5oUOHGjRowGjBaQEA8AkQZv0rPDx86NCh/6XVc1FMQsztO/8WaKhRowb7VW3IJoIiwLWuXLkyf/78zMxMmUw2ZcoUa2vrefPmdenSxdCtA0aKJMnTp08HBwd7e3sjhBo3bly/fv0zZ84UDLPY95hAIODz+Z8t2qfbvxSaDAAwDSYcZnG53KIXdOBy/r+mIfsXjKZulmahw//jcDgic5FskAz5fTiFkIvQASSUCIv+WMDgbGxsatWqhWFYYGCgWCwmCMLOzs7QjQLGSyqVPn/+fMSIEbotNWvWPHfuXGpqqoODg/6eOI5nZmZOmDCBw+FUr169f//+LVq0yHdyYBgmIyNDpVKx+2dlZbHdYBiGGXJ+9LeBczCa/gZxJU3RNE6XyuuJc3CGKe7pnqJpRNP/FZExuGIXr2GMqPG4Cb+L2LMBwzC604JJhlkpKSkPHjyIjY2VSqWfX2wHMQqV+mx4VnqeWk0yCbmUkMDsRZp/wX+iczBk9sHePIQEH4ZZvIIvkrZCqWYRQ6SpdolpfzTHgzjMWNTXMnQrgMmQyWQqlcra2lq3xc7OTqFQSKXSfGGWSCQaOHBgzZo1cRz/+++/u3btumPHjr59++rvQ5Lk1KlTX716hWnFx8d/9913mZmZ5SHMYrhCvlRqUcoXpQzDZGZlkgRJMyU/q4XhiizVal4xnoLmnzUrM5PhKY0nUsHU8mLszTAMTmimDeVb2sRAGFN+F2EYhuO4XC43MzMz4TArPT39woULEolEoVB8tkOey+W6uDgfiFEdjtUsH5ySLhHweVYWFpqp/7SVh0eFDwI1TfmrD99pH95kEEYqFejeZhRzB1FqlJeCOHwksNbEWBHnKSGMDgBgetjTCE3/d7ZlO58Knl4qV668detW9veRI0f27dt3yZIl3bt315+WyOFwxo0bl52dzR5h165dbEZXeQizEIfHEYlK/csaQ+Zm5uZc89IIsxDBIwiiOAETg2HIzMwc8UVGEWZhGFLmcXf1Q0pZUfu01HLapwPVcxUi9Ytul/l3EWNpXrx3UVEqmrMXV3w+X/dhN8kwy8fHZ/Pmze/evevUqdNnF9vx8vI6e+YMRWvGC1Vq1Q/BwYH160+fNp3R9JEigYDP5XKL/tAikcjH11clD8HinzEM8y42TiwSOmqvd2lzTuUqNWBsEQCTY25ubmlpmZSUpNuSmJhoZmam37/F0v+Ac7nc7t27DxgwQCqV6odZOI7Xq1dPd/P27dvh4eGFlocomwiitDtFMITx+DwuUYxTd/EUO50O4/N5iMdDxoJEagVSy4scZuXhiCQ4uKbXoNy8ixAjVGJ8LuIWfSBKXOR/Yf3pViYZZrEUCkVRLg1FIpG/v7/+TWcnp9q1A77sQWvUqPHw4UP2d5VK1aBBg5YtW65evZrdwsawX3ZkAIChiESiBg0a3Lp1a8KECeyoX0hISJUqVSwtLdmerXznTZ3IyEhLS8tPf+o/eykIQMnDsH9/irQzXu6SXnCUl77ec4OoqB0jjCbGivqxGJFWWQizvoBKpWIY5mvOeuwkI/Z3giAwDONyuTADEQCThuN4cHDwqFGjDh482KlTp927dz979uzo0aPsvT///HNMTMy6devEYvHx48d5PF69evUYhvn7779/++23IUOGiMViQz8DAEDxMIxApvz/rLjP763JxP6y7rXyFWaVLDaTo+wnWwBQDvTr1y8hIWHJkiXz588Xi8UrVqxo164de5dEIklJSWE/6bGxsTt27JDJZBRFWVlZDR48eP78+ZAqAIAJYv6dwVY0epUJigfCLAAA0CRazZkzp0+fPikpKRW1dHfNmTNHrVaLRCKE0Pjx47t06ZKRkUHTtIuLi5ubm0FbDQAwdhBmAQDAvzy18m20tbXV/c7lcqtoffOmAQBMEoRZH+Jof/QRbE0sAAAAAIDigTDrQ2kIJRaoAp9jwAYBAAAAwFSVrzCLXZ/noxVNaYROIPR3ge05CPmUfuMAAAAAULaUlzCLpumYmBiFlkQiefPmjZmZmZOT0wc7YQgFIOSqjbd0OAjdL3weJ0wvAgAAAMAnlJcwS6FQdOvWTSqVvnv3Likp6datWy1atNi6desHPVsYQvW1kVa+NQ3TEErJf0CGYXQFHdiZ3hB1AQAAAKA8hllcLnfEiBFKpfL9+/dCodDa2rpKlSqFBEYkQuoPwyzsw84tLblcPmLECKlUGhMTc+bMmbi4uMDAwBkzZnx2gUUAAAAAlB8mHGaxRdiLuDOXyx0/fnwJPnpeXp5cLvf09BQKhTKZTKFQlODBAQAAAFAGmGSYJZPJkpKS3r59q1KpDDJUJxQK//zzT4ZhSJLEtT6VWQ8AAACAcskkw6zIyMgVK1ZkahkquGEft9DVZAEAAAAATDXM8vX13blzZ0RERP/+/b9mHWgAAAAAgNJjkuNcBEGYm5ubmZnBOB0AAAAAjJZJ9max2DIKJYzQln3H/79qN6O9CQODAAAAAChXYVbJYhhGrVSjqwglaQs6ZGtfG3NtyPUCkVakoRsIAAAAABMDYda/hEJhFY8qeal5KENTMj4lMYXL5zpUcKBpmsEYt8pukO0OAACgMBgiRIZuAzBSEGb9y8fH5+RfJ2mKRpimYMTgwYOrVau2bOkyTZjFMEKR0NLS0tBtBAAAYGQwTEHJR1zvqeAUOVeYQg0qNJjqM7V0GwaMA4RZ/xKJRFWrVmV/VygUQqHQxsamqve/WwAAAIDCYGpafTD6BF30Go4kUiIlhFnlBIRZhVCr1bolCwEAABgVDFOKiFKYAvWlMISJCFyKFeMrg8/hl2aLgBGBMAsAAIDpwJBa0fjgS66giOmyDCI4qFMVRED9H2AIEGYBAAAwHRhSZE0ZcETwb9mdz2IQJkDZ05A5r7RbBkAhIMwCAABgUjAl4v2/uuFnMUjMLeq+5Ri8QqUFwiwAAACgPMNIRq0gpcX4CwYJCAGBQQjxefAaAQAAAOUYITwbf3bAkT2ahU+KiEL7vtvXzb1bqbarbIAwCwAAACjPMDWjlqqlxQizSKRm1KXapjIDwqxCYBim+y8AAABQtmHa/yvNPyi/YIZrgZUN1WqlUskwDEVRKpWKJGE1QwAAAAB8CQizPhAfH9+tW7egoKCQkJBjx44FBARMmjTJ0I0CAAAAgEkyrkHDnJycly9fqtXqunXrikQGWIlTKBQ2aNCgUqVKPj4+PB7Pzs7Ox8fn2zcDAAAAAGWAEYVZ6enpc+bMyczMxDAsMzNzy5YtVapU+cZtsLe3/+mnnxBCNE1jWt+4AQAAAIDxwzAjWu+oXIRZarWaw+HgeP5RSLVarVAoBAIBl8v99BHEYvG8efPc3NwQQsOGDTty5MjcuXORgRR8IgAAAADQIuRqrlRVjD8QEOV0vaOvDbPi4uIOHTr09OnThISE0aNHDxgwQHcXwzDnzp1bunRpcnKyi4vL7NmzO3bs+IlDCYVCNsZCCKlUKisrq69sGwAAAABKGIaQutOIPzuNKeKykgghFdrXG3Wrisqhrw2zHj58ePToUV9f35CQkKioKP27bt++3bdv3zFjxnTs2PGvv/4aOHDg2bNnGzZsePv27eXLl+c7zpw5c4KCgtjft2/fnpWV1bdv369sGwAAAABKAVehJlDRJ+KrkJpG5dPXhlndunXr2rUrTdM3b97U384wzI4dO/z8/FauXIlhWKNGjR4+fLhhw4aGDRt++oC7d+8+ceLE1q1bbW1tv7JtAABgYmgKRd5ANFnUNeZoClk5I9dapd4wAD7AaN6hRc9exspvla2vDbMIQnMEttCU/naVSnXnzp3g4GA2i5zL5datW/fOnTs5OTlBQUHnzp0reCiapo8cObJnz56NGzc6OTmRJMke/GO4XC6kqANQrpT9jzypRIcnImUuwoqWxqKWo4AeKHhz0R/hfiL65XZxzv0kmhqEGrgU/REAACWdAp8vxmIDr6ioqMqVK+u2eHp6nj17NiUlxcLCotCDpKSkbN++ncPhbNq0KS8vr0uXLr169cq3T05OTkJCAo7jGIa9fftWpVJRWgUbAAAoY3AcV6vVZf/DzhMihipqmIVhiOAX6/Ax2ejPEIR4Rf4DFerpC2EWAEZW0IGiKLbDSbeFy+XSNM1uL5SNjc3mzZvlcjmt5ezsXHCfmzdvTp8+HdeSy+WpqalSqTQ7O/sThwUAlA18Pj8nJ4cttlJKD/HixYu3b9/WqFGjatVPJeumpaU9ePDAysqqQYMGn+50/xaw4jVAzEWI/SkippxOECtVBK40dBPAN1JaJwgul8vn83Nzc3VbcnJyeDyeQCD42J/w+fxq1ap9+rBNmjQ5duwYhmEcDufNmzeTJ08Wi8WWlpY0XV6T6wAoNwiCsLCwKKViK7m5uT/99NOxY8c8PDzi4uIGDBiwaNEiDqeQmVRHjx6dOXOmo6NjZmamp6fnli1b3N3dkaFgRIIs5n7sn0Vd9BdD95NdEd6gtNsFPgUjYtIa/xle5P1p5GoJHYrlO8wquNayQCDw9fV9/fq1bsvr16/t7OwK7aMqOkst/UiOIAiO1tccFgBgEgiCwDCsNMYNDxw4sGPHjuPHj9evX//06dMTJ04MCAjo2bNnvt3evXs3duzYQYMGzZgxIy0tLTg4eO7cufv27TNY0hhHcDv1dr8rxQizkLwT4pwp7XaBT8GF919N6R1a5P3VqFMtdKZPqbYJlJYSuy5ktHQ3CYJo167diRMnkpKSEEKxsbG3bt1q2rQpj1f0jICPUiqVycnJCQkJJEmW/ZRYAMD/ldLnnaKow4cP9+rVq23btlZWVgMHDqxXr97+/fsL7nn69GlLS8uJEyc6ODj4+PhMnTr1+PHjEomkxNqMaWdkFeOH4eLEv4OARfwhBMV8CE2jSvMpfMEPZlRPQXPwYv6rIUKF+KjoPwJu6f4TFP8pFPsHK0/vIv1P/df2ZsXGxo4fP16hUCQlJe3bt+/Bgwe1a9devHgxh8MZPnz4mTNnunbt2qhRo1u3bllZWU2YMAGVhLCwsMWLF2dnZ6elpTEMA4lZAJQTJFn0Qj3FIJPJHj9+/P333+u2+Pj43LhxIzMz09raWn/PBw8eOGmxNz08PAQCwbNnz1q1aqW/Gzsvhz3Vsr8XteVqNUYxiGI038RFoTkBIkRpMqiKBEOag1OU5pciohBJMsV44UkS0zSpyD2OmpN4cZ8CVYynwGgOrlYzZDGeMqV5CnhRnwKJMZr2F/34miaRmokORW0PYor1TwDvIkO/iyiK0g2yfW2YJRKJGjVqRJJk27ZtKYpSKBReXl7sycXd3f3q1au///57eHh4nz59hg0bVlKlsGrVqrV379579+5169atX79+5ubmJT6IIBAIKIpSq9WoTCC0FAoFKhMwDBMKhQqFoszk5JWx9xuXy+VwOCX+fsNxXCKRJCYmlvjnXSqVymQyBwcH3RZnZ+e8vLysrKx8YVZqaqqZmZku7d3CwsLc3DwxMVF/H7VaPXbs2JcvX7JzosPDwxUKRZMmTYrQEAwxFBH/DBX5jY0zWBLBaDo8Cr4kQs0kQc0XTz70RaRqocn3KSIGzTlNbRAzRfrKw3BMms5JiSn6SAnOYE/5jOa7KN/xOdqOnLzC/kY9D1Gbiv4UpDhqc5IksKJ9BWM4JzUck0qK+AWMacIsJOUXFmbxtBsLSXaXImV7xBR8zh/BoAti5rt1VNGiDngXFXgXyQt7aqX2LsIw7NWrVy1btmSvtb42zLK3t581a9bH7rW1tS2NdQm5XK61tXWdOnW2bt1aGtOOCIJYvXp15cqVe/fuXQa++bhc7uXLl2/fvj1nzpwysFYjjuOpqakrV64cP368h4dHKXVvfGOrV6/29fXt1KlTGXg6BEGcPXv2xYsXU6ZMKfH3G8MwOI6bm5uX+GG/7A8LPflwOJxOnTo1aPBvmjmb21CM/FHO2GJ1jOAMlu/QOIYrlIr58+f369uvXmA9lSrfynMMwor3NqNoRBf9FcIwhBfrm4UZxuR/Hblc7vNnz/fu3btk6RKhQEgz+b4LKYQV5xKLKWYJcpxT1IIa/zemwOvD4/F27twpl8vHjxuvVBUItbDifbMwDCKL9RS++l2EYZhapZ4/f36vXr0aNGxgou+i0NDQnTt3Ll26VCQUfct3EU3TuoJWhp6K/BUcHR2HDBlSSgc/efJkgwYN9JdoNGkMw8THxw8fPhyVCSkpKTt37uzXr5+3tzcqE06cONGsWbOBAweiMiE3N1ehUJjQ+83MzEwoFKanp+u2JCcnC4XCgkX+bG1tk5KSdMWTc3NzpVJphQoV9PfBcbxLly7I0H797dd2ndrlG800IS5uLn+d/WvoiKGme3H44PGD7Ozs74P/G4w2Oes2rmvToU379u2RaXL3cD924tjQEUMNOE/OVN++pa0sjeCwRfk/XbTMtCgUCoZhyswYaNl7v6nVaoqiTGhI18zMrHbt2k+ePNFtefnyZcWKFQvmOQQGBiYnJ6emprI3Y2JiZDJZQEAAMjJyuZxhGKXShIszsYuLyOVyZLJIkjTpsy6bmFGgH8uUKI3gXQRhVtn8eORD03RZ+hZnGKaMVQMvY+83iqJMa/STw+H07t376NGjt27dUiqVf/7558OHD/v168feu2fPnuXLl7NhfefOndPT03///ffc3Nx3796tW7euc+fOdnZ2yPio1WoTinTL5FmL1EKmDN5FX8+EBw1LVVBQkJeXFyorPDw8WrRoUWaKX4jF4g4dOlhZWaGyomnTpmVmABQh5O3trVAoTOv9Nnjw4NDQ0ODg4GrVqkVGRg4YMKB3797sXdeuXXv58uW4ceMEAkHVqlXXrFmzYMGCmzdvSiQSa2vrFStWGOGoFofDad++/VfWKTQsR0fHDh06GL7I/leoXbu2SffGcTicdu3aubq6IpPl4ODQsWNHw76LSqXQXxnAviym9T3x2apmRvhl8MVomi5jTwfTQmWCiX58GIZ5+PDhmzdvfH19a9WqpduemJioVCrd3d116R1xcXF37961srJq0aJFidQCLA2m/qYqA2ctE/0g6IN30deDMAsAAAAAoFSY8IUCAAAAAIAxgzALAAAAAKBUQJgFAAAAAFAqIMwCABRbWlrajh07THoWFQCgDCBJcs+ePXFxcchYQZhVdph0dRNgWhITE2fPnr1w4cKyVO4LfHumXlYKGJxEItm2bduQIUOys7ORUYIwqyy4cOFC586dW7RoceDAAVQmrF+/ftu2bQihmzdvTpkypSwVfC8b/P39f9PatWuXodsCTNLjx49/+OGH5s2b//LLLyb6AY+Ojh4zZgy7lvn8+fPPnj1r6BaVRw4ODlu2bHn58uW0adOMs3KCCVd++3rPnj27evUqwzBt27b18/NDJkihUCxYsODAgQP16tUjSbJ///5SqXTUqFHIxCmVyqVLl7579+7ChQujR4/m8/nI9D179uzu3bsCgaBNmzYVK1ZEJq5fv37v3r2bPHmyu7t7mzZtDN2ccur27ds3b940MzPr1q2bm5sbMhFbtmxZtmxZzZo1zczMZs6c+f79+zVr1phccSaCIB48eDB8+HB7e/vU1FTTXQP34cOH9+/ft7a2bt++vXEuafBptWrV2rNnT69evTw9PWfOnGl0bySmvDpw4EDlypXbtGnToEEDDw+PXbt2seu3mJDk5OSBAwd6e3tfunSJYZi8vLzOnTtXrlyZXfLPpMnl8tq1ayOENm/ezJQJ27dv9/DwCAoKqlq1qr+//+XLlymKYkycXC4fMmSIi4tLaGioodtSHi1ZsqRSpUpdu3atUaNGrVq1Lly4QNM0Y9ykUum8efMqVqy4e/dudsvUqVP5fH5sbCxjgo4fP65Zn9jdPS0tjTFNy5cvr1Sp0nfffefm5hYUFHT37l3GNG3ZskUgEBw5coQxMuU0zAoJCfH09Dx06BBN00qlsmXLltWrV2f7fk3Ijh07EEJr1qzRbdm+fbubmxtJkoyJS09P//HHHxs2bBgYGGhy/y4F3bx5093d/fTp0xRFpaenV6tWrUmTJtnZ2YxpUqvVulA+Nze3efPm/v7+ycnJhm5X+XLu3LlKlSqxX4qpqalsn6JKpWKM2/Xr17lc7pAhQ3Rbrl27ZmNjEx8fz5igQ4cO/fDDD46Ojr/88gtjgk6fPl2pUqVbt27RNB0XF2dvb9+9e3fT+gaRSqW636dPn25lZXXnzh3GmJTTMGvVqlXNmjVjGIYkyalTpzZo0OD+/fuMqcnJyenTp4+1tfXt27cZhsnMzGzcuLGNjU27du0WLFgQExPDmKDY2NgVK1bk5OQwDJOQkFCtWrUOHTrI5XLGlE2aNKlPnz4MwyiVynHjxjVt2vTJkyeMadq6dWurVq2aNm26bds2dsu7d++qVq3arVs3mUxm6NaVI3369BkxYgQbYwUHB7dv3/7t27eM0VOpVPPmzRMKhfv372fPwIMHD+bxeK1bt540aVJoaKip9PIePHjw9OnT7O8bN24UCoXHjx9nTE2PHj3Gjx/PXtkOGjSoXbt2ERERjIm4dOlS165dg4KC5syZk5uby4ZcPXr08PLyevPmDWM0ymkKvEorISGhb9++r1+/PnjwYP369SUSydatW5VKJTJiarX63LlzI0aM2LJli7m5+ZYtW6pWrTpw4MALFy706NFDqVROnjzZ1dX18OHDNWvWHDp0KBuBIdORnZ29du3aOXPmMAzj4uKyf//+x48fT5kyhWGYtLS0GTNmGPPE3XzCwsLGjh2bmJioUCi4XG5CQkLPnj0TExMPHjxYu3bt9+/fs/3byEQoFIrJkyf/+uuvzZo1a9GixRwtkiQrVap06NCh27dvz5w5U6VSGbqZ5YVCoVCr1REREb169eLxeEePHvX09AwJCfnzzz+N8E11586dyZMnL1iwgKKohQsXdu/effTo0SdOnBg2bNitW7dmz55do0aN69ev169fv1u3bn///bfxJ8U/e/ZsyJAh9+/fRwiNHTt2zJgxw4cPZ28ePnz4999/N8J/BZ07d+6MHz9eJpPJ5XIcx6Oionr16kVR1JEjR6pWrRoWFnbhwgVk3Pbu3Tts2DAPD48ePXocO3bs+++/z8rKEovF27dvt7S0HDJkSHp6OjISTLkRGho6atQoNonkxo0b1tbWfn5+P/74I9txwqYItG7d2pgTmzIyMoKDg52dnYcMGfLHH3+wAwSvXr2qUqUKj8fr1atXSkoKu2dsbOymTZvq1q27ceNG40/XyOfo0aMikWj9+vXszVOnTllaWnbs2LFevXrdunXTPUcjJ5PJ2rZtGxwcnJqaeuTIEXNz87p1606ePFnXxT1s2LDvv//ehP51Nm7cWKNGjfDwcIZhLl++7OrqyufzdX1ahw8fdnNze/HihaGbWZZduXJl/Pjx7Pja9u3bbWxsatSosXr1ajavVK1Wd+7ceezYsUb1plKpVDNmzKhQoULPnj03bNjAjpVnZGQ0a9YMw7BGjRpFRkaye6alpR08eLB58+ZTpkwx/g5smUzWuXPnqlWrsv8cubm5PXv2dHV17d27d9WqVXft2mVU/wr6pFJpQEDAmDFj8vLyVq1aZW9vHxAQsGzZMva7T61Wd+zYcfLkyYwRu3Pnjpub25kzZxiGiYqKql+/PoZhI0eOZLtCX7x44eXltWfPHsY4oHKV8D5s2LBXr16xPdVDhw4lCOLw4cNyuTwhIWHmzJnVqlUz5kxeqVTapUuXBg0avHz5Mt9dN2/etLS0HDBgQL7+duNP1GBJpdJ79+7pt3bdunVisVjXCX/x4sWuXbtu2LDBmINgfXfv3p02bVq7du3YoEoikTRr1szOzu7WrVsMwyQlJU2ePLlmzZpG1bOdj/6XBPu+WrNmzdmzZxmG+eOPP7y8vE6ePDlv3jw+n3/x4kV2t9jYWKVSabgml2UURS1YsICdSPX+/Xv2U9OwYcMKFSrcv39fqVRGRET079+/adOmCQkJjNEgSXLKlCmenp43btzIF3ZER0d7eHg0bNhQd6Gr+xOjDVAiIiLYywxWYmJinTp1WrRokZmZyf6LzJo1Kzg4+PHjx4yx+vvvv2fOnNm1a1c2NE9NTfX29vbw8GC/VqKjowcPHtykSRNjS5Uj9dLFSJI8efLkr7/+yjDMo0ePfHx8Vq1adfToUS6Xu3z5cvZkFR8fbzw5DOUizLp+/bq7u/vRo0f1N+bk5AQHB1tZWQUFBdWuXbthw4bG/NlgGGbfvn2Ojo4fS7/YtWsXhmGLFi1iTFBoaKidnd3WrVt1WyiKGjFihKOj4/PnzxkT9OuvvyKEunfvrtsSFRXVtGlTJyen1q1b161bt3HjxsYc07OpJyNHjiRJMiwsrH///pGRkTRNUxT14MGDKlWqXL58mWGYp0+fWltbOzs7QydWadu+fbu3tzebA6ATHR3dunVrR0fHZs2aVa9evXPnzsY2X+/OnTv29vbsVOiCrl+/bmlp+cMPP5jK5dO4ceP8/f31A1n23KXrRzF+s2fPRggNHTpUt+XJkyd169Zlp1D4+vq2a9fO2PJ6nz171qtXr7i4uOzs7CFDhly4cIGiKJqmExMTGzduvGrVKvYLvW7dunw+nx00NyplPMxSa40YMSI4OJiNgs+dOzdy5MhRo0axiX43btxYvXr133//beRX4RRFtWvXbtiwYZ/YZ8mSJWwFBKO9FvwYkiSXLFkiFot1/SIMw4SFhVlbW1evXj06OpoxETk5OeyYplqtHjZsGI/He/r0qe7evLy8I0eOzJ079+TJk0b+fmO7SJ2cnPr27dugQYPly5fr+honT57cq1cv9vdbt261a9du9uzZxvbtXpbk5eVRFNW0adOFCxey77HDhw//8MMP06dPT01NValUf/311+rVq+/cuWOE3/TTp0+vX7/+J85IBw8eJAhi6tSpxv+JYBgmJiaGnZSj31Myc+ZMhNDSpUuNeYKe7tSUlZXVtWtXZ2dn/W653NzcnTt3zps37/Lly0ZY2Cg2NrZevXrNmjVr27bt4MGDU1NT2e3Hjx93cXFh3/ZpaWlNmzZdsGDBzZs3GSNTlsOs9+/fd+3a9eTJk2vXrnV2dl6wYEH79u0dHR07d+7s5+cXGBhoEh9slkqlCgwMZKeEFHov+9+BAweOHz/eVMKsrKysiIgINldDoVDkq8AUEhLSvn37AQMG6J8OjNymTZsaNGjAljbIzMxs3rx5vXr1kpKSGNM0fPhwhFC+4H716tVOTk6vX7+Oi4tr3rz50qVLDdfAsu/Zs2ft2rV7+vTpkCFD/Pz85s2b17BhQycnpz59+jg6Og4ePJgxbsOGDWvatGmhZyS2mA5bP71z585G26HFVjp49+4d+3X+4MEDe3v7CRMm6Hb46aefOnTo8MsvvxhzmDVv3ry2bduyg5uJiYm+vr6tW7c2nmG1z2JXm/Dx8dFP2rt69aq5uflff/2Vm5v7448/6o8eGJWyHGaNHTu2devWiYmJ2dnZbBGm4cOHh4WF0TR948YNS0tL0/r+GzNmjLu7OzttNZ/Dhw9v2LCB7UQxidhRqVRu2LChSpUqjo6Ozs7OmzdvJkmSrcBUo0aNO3fuhIeH9+jRY+bMmYxJiYyMrFGjRocOHdh0k7i4OC8vr65du+bl5TGmRq1Wr1mzZvjw4XZ2dhcuXNBtT0xMbN++PZfLtbe3HzFihOlW/zIJbdu2HT58uFQqjYuL69GjR+PGjWfOnBkXF8fOSKhdu3ZWVhZjxH777Tcej6dLctf3/Pnz6dOnK5VKiqKMNsZ68+ZN9+7dnZyczM3NO3fuHBYWxtaaEovFM2fOfPv27cmTJ/38/NjtxiwkJMTJyWnQoEFsZ9WzZ8+cnJxGjhxptK98PocOHZo0aZKjo+OKFSt0UbtKpZoyZYpAILC0tGzVqpXRXpCXzTDrxYsXY8aMqVevnv7HWz9AYScVGmHvqI5arX7x4sWpU6devnzJvqsuX76MYdjy5cvz7UmSZLt27dgKOqZVEv3w4cO3b9+eMmUKjuNLlixh8xbbtGnj4ODg5eXVsmVLNtXXtDx+/NjOzm7cuHHszTt37tjY2EyePNkIB3Q+hqIomUzGXpqrVKphw4Y5OzuHhITodkhPTz958uS1a9dMZY6FKbp48eLYsWObNGmiKy/O/ruwv0ul0q5du44dO9ao3lcURUVHR586derJkye6edD29vYDBw4s2KE1bty4Vq1aGfNlYW5ubsOGDX/44Ydbt26dOXPG39/f3d399evXbOeKvb19tWrVnJyctmzZYhIDCOfPnzc3N1+2bBl78++//xYKhStWrGCMW15enu5N8vvvvwuFwsOHD+vuVSgUly5dOn36dEZGBmOsymaYFRER4erqyuPx8n1PS6XSBw8eDBgwICAgwJivP+7evdugQQMXF5dKlSrxeLzvv/+ebe2YMWPyZV9RFDV//nxPT08TSmDKy8tzd3fXX0Vn7dq1PB7v2rVr7Mfm5MmTZ86cMZXLrPPnz48bN06/v+rUqVNmZmbsRBi2PsWoUaPyTacyKuHh4bt27WJf8GvXrrVt29bOzq5Vq1bnz59nPzUtW7b08/NLSkrKycmZNGnSxzKaQQm6dOmSSCTy9/dnB3p0MjMzr1+/3rp161atWqWnpzNGIzIysnPnzk5OTp6eniKRqGnTpuwnmp0OMnv2bP0hqt27d7u6ul6/fp0xYtu3b/fx8dFVkImLi/P19e3YsSP7SYmIiPjjjz+MefLHgQMHZs6cqR/I7tixQyQS7d27l725efPmKVOmGFWkLtFWr2QHmiIiIgYOHOjs7Ozn57dt2zb2ZZ85c6alpSWbgLVq1apNmzYxRq9shlkMw1y4cMHS0pJdsluHnSTVr18/Yw5Kbt++7eTkNGnSpPv374eFhe3cudNJ6+HDh7m5ud26dePxeH369Dl69OiuXbvat29fuXJldtqX8WO7D3NycgiCOHbsmG67SqWqU6fOqFGjGFOgK3xFkqRcLr927ZqFhcWsWbP095k8eTJbFZoNiI253/T27dtVq1bt06ePQqG4cuWKq6vrggULjh492qlTJzMzM7b2TGxsbEBAgK+vb6NGjZo3b17oGBAocdu2bSMIYufOnfobjxw54uLiMn36dKNaRC8yMtLX17d37943btx49eoVO5Rmbm5+7NgxkiQnTpyIYVirVq327t3L5u+7uLjozyw2KjRNs1258+bNq1evnv4F0qlTp2xtbY1zyRCapnWBLEmSMpns+PHjAoFg7dq1+rv179/fysrq5s2btBZjTOLi4tq3b+/r65uQkBAVFRUQEDBw4MCjR4+OHTuWIIhJkyaRJCmVSvv16+fs7Ny6deuaNWvqz5oyWmUnzGIHMg4cOKDrwdq1a5dIJNKvUaZQKIw5wGKTlho3bvzjjz/qb3z16pW3t3f16tXfv3+vVqt///13f39/T0/PgICAYcOGGe2AdD6JiYnBwcHJyckkSbZs2bJdu3b6V1EzZsxo1aqVUV1XFSozM7NNmzbbtm3LysoaPnw4W0Hj6NGjQqFw48aNut2uXr1qbW0dEBBg5KkzR48edXZ2Hjt2bF5eHkmS9erVmz9/PnuXWq2ePHmypaXlo0eP2AklU6ZM+eWXX0wxz8xUxMXFHT58+MSJE7qMt1mzZllbW+uv0ZaZmWlUlbHYL/gRI0a0aNFCv+MkJSWlXbt2NjY2Dx8+ZBjm5MmTDRo08PT0rFmzZu/evY1wOpjOjh07Vq5cyc5DF4lEf/31l+6u3NxcsVjMVsU0NsnJyY0aNTpx4kRqamqfPn3YbN3ffvtNIBCcOHFCt9uhQ4esrKzat29vbPnvT58+9ff3b9GiBTttedq0ac2bN9d9I/zxxx8EQbDf5kqlctWqVTNnzjS24l5lPMx6/PhxkyZNKlWq5OLiEhgYqDsrzZw508rKKl+xGWP2+PFjW1vbgmuk37t3D8MwtkAIW0P51atXppXCHxkZWbly5T/++INhmDNnznC53KVLl7KfIqlUWr9+fZOYs6ZQKBYuXOjo6Ni4ceNevXrpCswsWbLEzMzs77//Zm9OmzZt6tSpz549M+bJRytXriQI4ocffmAvanNzc7lcrv66bLm5uVWrVmVXOgKl7ezZszVr1vTw8HBycmrTps27d+/Yj0bPnj2rVKlizD2I2dnZFhYWhw4dyrc9Li7O2dl54MCB7E2ZTBYeHm5sNZkKWrp0qaenp0qlIkmyY8eO7u7uupHB48ePe3l5Gee/RV5e3pgxYypWrBgUFDRs2DB2vrNKpZowYYK9vT37nUJRVP/+/VevXh0aGmpUXVmnT5+2t7evWbMmO0ROkmSLFi0mTpyov8/AgQPr1KljivmgZSHMioyM9PHxmTFjhlQqff/+vaurq7OzM5uoqFQqg4OD3d3djbnctr6///7b3t6e7T/IJzg4uGbNmsacMfpZPXv27NGjB/vx/vXXX83MzDp06LB69eqgoKD27dubStQYHh4uEokwDNOviUWS5NixY83MzGbNmjVs2DBvb29jXsc3MzNzxIgRlStXDgwMdHNzY0/BbNEQtsKczpw5c5o0aWLMwWLZcOXKFQ8Pj82bN6tUqvv37/N4vAYNGrCpVxkZGfXq1WvYsGGhs4yNQWJiIkLo5MmTBe9avny5WCxmv/JNxcOHDytUqMBeq797965JkyY2NjazZs2aMWNGpUqVjHask+1E53A4dnZ2+oGgXC7v1auXjY3NokWL+vbtW79+faPqDVWr1evXr7e3t2/VqpW5ubnu5Z02bZqnp6f+iO3Zs2d5PJ4xJ7mWqTDr7du3c+fOHTVqFPtJmDRp0rBhw2iazsjI6N+/f6dOnerXrx8UFMR+baekpMyZM8dUyie+ffuWz+frsqf17dmzh8fj6RKDTEJubq7+hP+9e/d6e3vrLmfPnz/fu3fvpk2bLl261IRWKnz9+vXvv//eqlWr+vXr64eGCoXil19+8fX17dmzp3Fmb7DS09PbtGlTvXr1J0+epKen16lTx8vLi60R8Mcff3A4nH379ul27tatm7GtkVc2PH78ePz48ZMnT2a/Ebt168ZOIo6KimrevPmAAQMqVaoUHBzMZvU9f/580aJFRhtmyWSyihUrFjrZ+fr16yKRyMjXcmC/O3TdJHK5PCgoSLeoX2pq6pIlS4KCgvr27Xvu3DnGWLETvLZv3+7v79+2bVv9McHs7Oz58+fXrFmzX79+bAeEkSBJctq0aXZ2dgcPHlQoFCNGjBCLxWyq8ZMnT6ysrPTnaK9evdrf398UOxpML8zat28fOzLo6enJ4/EOHToUFRWVkpKSl5fXvXv33r17y+Xy27dvI4R69uxpckV9KIrq0aOHm5sb+7Wnb/Xq1d7e3qb1Jlu9erWrq+u6devYur0ZGRm2trZHjhwpmG1q/CQSyZw5c+rWrcuWNoiLi6tSpYp+TSz2F6VSaeRBSXZ29oIFC6KiotibL168cHFx+e677yQSCUVRkyZN4nK5U6dOPXXq1Lhx43x8fNhlQEFJUalUixYtcnZ2btiwobOzs6ur661btyIjI9mkq8DAwNmzZ9M0vWPHDnaCnvEvoswwzIIFC7hcbsGri7/++svGxsbIK7MkJyfXq1evffv27JKj7NMJDAzU7zgx5lksSUlJP/74Y6NGjRITEwuticVenBvhdwdFURs3btRN4crMzGzbtq2Liwsbl+/Zs0ckEvXs2ZNd56BixYqnT59mTJAphVlyuXzp0qVsNcvs7OyYmJjvvvuuatWqbI/C1q1b69Wrx8ZV2dnZlbR0HxsTcvfuXVtb21atWul37SYnJ1epUqXQXi5j9u7du1WrVrm4uNSqVWv37t0KhSI4OFiXq2FCFApF165dGzVqdPHiRV1W++3bt21sbCZNmiSXy3fu3NmjRw9jyyotoitXrvD5/CFDhrCFIjdt2uTl5WVvb9+zZ09jrntiitLS0kaPHu3p6Xny5Mm8vLzQ0NCqVau2aNGCDc2nTZvWs2dP9vebN296eXnVrFnTmEefdWJiYqpXr+7l5aVfX00ul7ds2XL48OFGfuGhVCqvX7/eq1cvOzu74ODgly9fvnr1ytHR0SS+PpKSklq1atW2bdtbt27pxjrYmljLly+Xy+WrVq0aPny4SQTrjHZSs7e3d0BAAHtlfvbs2SZNmrBLD+syX02OKYVZhw4dYpeO0m05c+aMUCi8evUqO4Vet6rDpk2bevbsmZiYaIrpcmyipY2NTZUqVfbs2XP79u1Dhw4FBAT06NEjXwUdoxUVFXXr1i1da5OSkubOnevh4REUFDRw4EB7e3tTeSI6Gzdu9PX1LTix5dSpU/b29m5ubj4+Pn/++aeRf518wq5du7hcLlsklg0rpVKp6T4dozV//nyEkP48A7asFBu7d+nSZeTIkez2CRMmTJ8+PSkpyVS6ex89euTm5mZlZfXrr7/evHnzzJkz7dq1q1+/vq7f1NjI5fIHDx7oVveiafrSpUtt27Z1cHD48ccfnZ2dFy9ezBg3mqYXLlxYr169ghd4O3bssLKyqlSpUu3ata9du2ZCn+WHDx/a2Nh06dKFHSVXq9VSqdSYexPLVJglkUjatGnj6uqqG8VYtmyZh4cHe7XHdgL16tVrzJgxXl5eV65cYUzZvXv3OnXqxOVyHRwcKlWqNHfuXCMvDcBSq9ULFizw8fFxdHRs2rSp/kT0169fT58+3cLCAiF06tQpxqS0a9duyJAhhd517969bdu2mcoci48hSXLu3Lk8Hm/Pnj0mdEY2ORERET4+Pg0aNNCNow0ZMqR27drsBeHevXvNzc1HjhwZHBzs7+9vVGk0RRERETF06FA+n29nZ+fi4jJixIiCyQ9G4vnz523atKlYsaKHh8e0adN0nT0qlerkyZNBQUE4jgcGBhr5t7tarQ4ICNDNQM/nxo0bO3bsMJWqB/pOnjzJ4XDGjx9vhAOdZTzMYgehatSoERAQEB8fv2PHDkdHR/2yWCdOnGjevHmnTp2MvLhwEVEUlZiYGBoaarSpr/koFIoJEyYEBAScP38+KSmpSZMmzs7O+WZNRkRE1K1b11TGDXWd8L169WrdunW+ztGwsDCTS/77BLVa3adPn0KvjEGJF23p0aNHUlLSTz/9pD84RZLkli1bmjZtGhwcbLopcampqSEhIRKJhDFWz58/r169+vjx4+Pi4o4cOYLj+IgRI/SXnVCr1Zs3b7axsXn27BljfNRqNXsuIkmyefPmBVcQf/r0qamsovExa9ascXFxMeYi+2UkzEpJSSk4usSuGVejRg1PT8/du3fnu9f461uWYSdPnvT29mb7dY4dO1anTh1/f38/P798CbCbN2+uU6eOUa0TUqiTJ092796dnYt+4sQJoVCon7z/5s2bgICABw8eMGVIampqRESEoVtRpsTGxhb8wjt8+LBIJKpVq1aNGjUKXhMaeQ+KqVOpVO3bt580aRKbxdu/f/+goCBzc3O2JKmOXC5v3LhxwTVkjcGOHTuCg4PZHritW7cKBIJ//vlHd+/du3dr1qxpVFUbvoBcLg8NDTWVEXNTDbNu3brl4+Nz4cKFgnedOnWKx+PpckWBkQgJCWG/M/bu3cuO2758+dLW1rZNmzb663r+9ttvtWrVYjMcjVlkZKSbm1uvXr0UCgVFUYMHDxaJRL/99ltISMipU6f8/f0nTZpkEsl/CoXi8OHD/f/X3p3HU7mujQN/ZJ4yTyHzmJmwTLXDiqKkaKUBtcu4q50UGlCh5DiRjNHkQyU0IcqQTDvURqZEiQyJZR7XWs/vc7rPb3286t3ve95zaj2L+/vXXo/nj6ud9XQ9933d17Vrl5ub27edb6Ef59atWxoaGt/tZnnp0iUEQU6dOkWLuJY0Mpn88OHD3t5ecK5t9+7dg4ODJ06cQBBk/kzikZERPT09bPZMrqqqAvPpZ2dnR0ZGNm3axM/Pn5KSUldXd/v2bUVFxZCQEMyuOJSWlnp6eu7cuTMjI4Munp+LNs3q7u7W09MLCQn5717soqKiWFhYoqKifnpo0D/qLv9inlpLS4uSkhKYOkwikSwsLFhYWKhnJDs6OnR1dePi4lB6UFxczMvLGxAQAA4bnzhxgoeHR1ZWVkZG5syZM3SxLE8mk728vBQUFPz8/BwdHcXFxePi4uD7yU/Q0NCgoKAwvwnZfCQSycPDg4uLC8utmOjd+Pj4X1RcBAYGWllZgS3y/Px8Xl7eVatWUbv6/e1vf8PhcJgtbLp//z47Ozt4rvb397u7u4NHk7y8/JUrVzCbvly9elVCQsLDw8Pb21tUVNTT05NejkAuwjSrpqZGVFS0srKyvb09JCTku41fDx48yMjIeO/ePVoEuKQ1NzcrKyvPr4qbLzs7W0hICHx52traDA0NCwsLqZWw09PTra2tmP1nvqGhITIycv7YvvT0dA4ODmpe2NPT8/LlSyzXnSxw7949RUXFxsZG8DhWV1e3srKiiwSR3mVnZ69cubKzs/PFixcxMTHfri6Mjo7a2NiABx2NYlzkgoODjY2Nv7twTiKRzMzMqGcJT58+/dtvv5WVlVFf7Lu7uzE1l6K8vDw2Nnb+k/PSpUvs7OzUkYudnZ01NTVYPinV3t4uIyOTkZEB3tV37dolJSUFhkotbthKs+Z3eiQQCMrKyoaGhqdOnfruG8no6OiGDRscHBwWx/YtHRkaGnJ0dFy+fPl35782NjZKSkru27fvzp07xsbGC+ZSYRaZTP748eOLFy84OTkXHOT28fHh4uKi9tCjLwQCYe/eveDwgaWl5e7du7G/XUu/KBQK9e2cSCTq6uoaGRnp6ekt+AeSqru7W1NTE24d/iBPnz7l5eXdsWPHd5dMAgMDRUVFr127dvbsWVVVVczWWU5PT/f19d27d4+FhSUxMZF6fWZmZseOHUJCQmA4N/bFxMSYmpqSyeSxsTF3d3dTU9Ml0pYPQ2nW1NTU1q1bqWdTL1++jCCIhobG/KWFBYaGhuYX/UA/zfDwsJGRkZSU1HfrTh48eKCpqammpgYGTaKYRyaTg4ODwRS5GzdusLKypqamUn9aVVXFz8+vqKiI2R2Eb1HfPVxcXGxsbJ4/f66pqXnixAmwplJWVhYZGYnZNUX69fnzZ1NT07t374JSa09PTwRBHBwc/uJ/9cDAAB0tjtKdO3fuMDMz+/r6fvujkZERd3d3RUVFY2NjzL5EkclkNzc3CwuL2dnZ8+fPz59PD+aVsbGx6enpYfkxS/n/v/wpKSnq6urPnz/ftGnTli1bQOVJX1+fv78/PU4qpMs0a25uLiIigoODA6yChoaGhoeHr1ix4siRI7QODfqO1tZW0HF0wepIX1/fy5cv+/r6qFUOGEcikaqrq9XV1QsKCigUCplMDggI4OXlLSkpATdcvXp1z549aWlp9NK+oaqqau/eveDvJS8vj5ubW1JSMi0tDfx0bGxszZo1hw8fhmnWf9zk5OT+/fuFhYXr6upmZmb8/PxCQ0N5eHjopRhxUTp37hwDA0NSUtKC6zU1NR0dHW1tbZjtmDM3N1dcXKyurg62lUkkkqurq5iYGLXNwfnz511cXB4+fIjZMoDBwUFnZ2ew3tbb2ysuLi4oKBgQEEBtiHXkyBFjY+O/WExZBDCUZgFHjx4VFhamroJmZ2dzcHDQ3ZCZJaK8vJyXl5dAIFC/M+/evTMyMsLj8XS0k3v69OlVq1bN39ycm5vbuXOnoKBgYmJiQkKCjIzMd0+8YtDY2Njdu3c9PDwQBNm1a9fMzAyZTN61axcHB0d6enpHR0d5ebmFhYWdnR1cQflBpqamtmzZoqamRq1HvHDhAgcHB/2OCqF3JBLJ3d2dlZX18ePH4AqFQomLi+Pn58/KykIxzN3dXV1dPTAwkHqFSCRaW1tLSUmlpqZevHhRQUGhtrYWxSTQVf/MmTPMzMxqampg3iLYpDpz5kxra+uff/7p5eWlpqa26LcOsZVmdXZ2JiUliYqKqqmpUSvjwsPDOTk5qd8QCFOuX7/OwMBw+vRpcFJXUVFx48aNWG7ZMjMzQ61sBRPHs7OzmZiYrKys5t9GJBJ9fHzY2dklJSWTk5PpopXR4ODg9u3b9fX1IyMjXV1dEQQJCgoC1w8ePMjNza2mpiYrK+vp6Yn9pmX0q7GxMTw8nJmZ2draGryjT09P79+/f8WKFWAgLvTzjY6Ompubi4qKNjc3k8nkY8eOgQ4ImPpeT01NUXcGwKMpLi4OQRBnZ+f5t/X19bm4uLCxsSkqKoLtaQyiUCjBwcGKiopBQUH+/v7c3Ny2trajo6Ozs7MxMTHCwsIKCgry8vLW1tZ0N+qAvtOsrKwsFRUVJycnZ2dnXl5eCwsL6n6tt7e3kJDQ/MktEHaEhoYyMTG5ublJSEj89ttvmF2+BsrLy+Xk5EpLS8vLy/X19UFNxpUrV1hYWL59Zg0PD2O56GGB+Ph4aWlp6pM6KSmJnZ2dWjPb0tKSm5uL2eEniwCJRIqOjlZQUDhw4IC9vT0TE5OHhwf4OkxMTFhaWs7vFwD9ZB0dHSoqKrq6unZ2dnJychicxgYOBdfX1+fl5enp6b169QrU6XNzcxcUFCy4eWhoCMutECorK0VERKhnpCorK4WFhT08PEChwqdPn548ebJouo/STZpFJBLl5OQiIiLAx4KCAhEREXd3d/DXMD4+bmVl5efnR+swoe+Ym5tzcXFhYGC4fPky9r82o6Ojjo6OUlJSGhoa8fHx4HV2dnb28OHDgoKC9HJm57vc3d3t7OzmX3FxceHm5qYWmUE/VG1traioKHVz8ObNm5ycnNRnWmdnp46OTnJyMk1jXNKqq6v5+fn19PSwuYLS399vYWEhKyurpaWVlZUFTquA44QrV64Eo3vpRVpaGg8Pz/zFwvj4eARBLl26hC49NEuzqqurExMTHz58CFLyqqqqBQOMMjMzEQQJCQkBHycmJuilAHkJ+vz5c01NDYpVk5OTKSkpJ06cAL9CMTExCIJoaWnN/42anp7evHmzgoJCR0cHSp+io6NFRETAdCDgyZMn3NzcsrKy9D7ZGoNIJFJJSUlCQkJRURF4R79165aQkND8/ljnzp1DECQzMxN8HBwcxPha76L3+vVrTJU0DA8Px8TEhISEgC6poBm9ubn5/PfVgYEBExMTAwOD/v5+lE6Ulpby8PDMX4Rrb29XVVVlY2N79OgRusTQIM2amZk5efLkihUrWFlZGRkZXVxcZmZmurq6uLm509PTqbfNzs7q6OgwMjKCbmYQ9H/T0dFha2srLi5+7NgxcKSosrIyIyNDTk7Oyclp/uPs8+fPWlpaYLoOSieam5srKirAEYT379/LyMjs2bOHGn9kZOSvv/6qo6MDJrhB/ylDQ0MuLi4CAgIsLCzs7Oznzp2jUCj5+flcXFzzC7Da2tokJCR4eXnpepUU+kEaGhpMTU2lpaUvXrwI0qzCwsLU1FQREZGjR4/Ov7O9vV1aWtrT0xOzI3RQFO3q6iotLQUtlqampmxtbTU0NKi75EVFRVu2bHFyctLT06OjByxdplm9vb0ODg6KiopPnjwZHx8HtaJgZo6zs7OSkhL1VWN2dtbe3p5AINDLIS8Igz5//qynp2djY/Nty6uSkhIeHp6TJ0+CJ9fk5OTQ0FBLSwt1cQLjent7wW6CjIyMhYVFU1MTiqI5OTl8fHzW1tbZ2dkRERFycnKvXr26ceOGmJgYlis56EtTU5ORkZGZmVl1dfXQ0JC3tzcDA8PTp0/Hx8dNTEwsLS2pRaUdHR3m5uZeXl6YPQ4G0Upra6uCggK18cp89+7d4+DgoO6vjYyMjI2N1dTUYHZawMTERFBQ0MqVK5WUlFRUVMB5tXfv3il/desrdXX1pKSk2tpaQUHBpXYW5KemWUQi0cbGRlhYmLo5SCaTjY2Nzc3NQcKuoqKira39/PlzIpEYGBj4yy+/gBwfgv5vjh8/rq2tvWAABbViAHQiTUxM/Pjxo4ODAzgvSReGh4fNzc03b95cU1NTV1en9BU4Ml1SUoLH4zk5OTU1NR88eACa66irq1ObbkD/jr6+PgUFBU1NTWpj5PHxcX5+/uPHj4OB9/z8/NbW1o2NjT09PXv27HFxcaF1yBDmkMnkffv2gaaj1IsUCoX6aAoLC+Pg4MjMzGxvb7ewsIiPj0exikwm+/j4aGpq5ufnv3v3bvv27RwcHKAetL293dXVlYeHR0pKKjw8nEwmFxYWCgsLt7e3o0vJT02zyGTylStXWFlZL1y4AK5MTU3p6uq6urqCj62trRs3bhQUFBQRETE0NMRyuQ9EF9asWePk5AT+e3p6Oisra/fu3SYmJmFhYaAwKyIigo+PT1RU1MnJCaQp2DQ4OJiRkZGYmAimE545cwaPx4+NjVEolJCQEH19fRkZGSsrK5BQkkiksbEx8MguKCiQkJCAO+//KXNzcwcPHmRnZwcpLEi8+Pn5L1++DD6WlJQYGRnx8/OLiYlt3rx5KYxsg/5VMzMzKioqwcHB4OPo6GhaWpqDg8OaNWtiY2MnJiYoFIq/vz8HB4eoqKi3tzdomI4RMzMzT58+jYuLAwcJS0pKlJSUwGp6dnb26tWr9fT05OXlqYsp4+Pj1BG3+vr6C/ZDl4KfvWlIoVCOHj3KwsKSkZExOzvr5ua2oD53enq6rKysqKgItvaB/n0+Pj58fHx3797NysrC4/EsLCw6Ojrm5uYIghw8eBBsF5aXlz979gyzM+1RFP3jjz8MDQ2XL1+OIIi4uHh+fn5NTU19fT2Kor6+voaGhh0dHYWFhQiC7N+/n7o5+OnTp/3798vKysbGxmKqPxC9Gxsbs7Oz4+Pjq6mpGRgYsLa2NjU1nf+8IhKJxcXFZWVldNQNBPqZyGSyi4vLihUrcnJy0tLScDgcIyMjDoczNTVlYGA4d+4c+LeysLCwtLQUUzUMvb29jo6OfHx8rKysXFxcf//73zs7O/Pz81EUTU9Pl5OTKygo6O/vFxAQMDAwoHYoJJFIwcHBysrK3t7eWB5uvXhK4KempggEgqCgoJmZma6uLiwOhX6c/v5+S0tLZmZmHh4eHA6XnZ09OztLIpFOnTolKCgIMhWMu337tqSkpKenZ39/f1NTk7a2toqKCqjnePz4saqqKnhLmZqakpaW5uHhAY888BIZHh4Oq4J+hIGBAV1dXQUFBUNDQwsLCzoadglhREtLi5GRESMjo4CAgKWlZX5+/txXnp6efHx82MxFamtrdXR01q9f39DQMDAwALqkgn6WXV1dioqK2dnZ4E4CgQCOhqBfUSiUGzduUH+61NCmocPAwIC+vj6CINT2ZRD0gxCJxPz8/BcvXsyv83vy5Ak/P39VVRWKbY8fP2ZjY5t/TjAnJ4eZmRmcCwkICFi7di24np+fb2lp+eLFC9j35Oeor6+XlJQUFBSkr4ZGEHZ8/vw5Nze3srJyft1kWloaAwMDBjdz3r9/LykpaWxsTF2j/fLlCysra1hYGIqiz549k5GRAd+Fnp6etWvXpqenY6p3Bg0tQ2hBUFAwJSVFRkYmODiYSCTSJAZoieDl5cXj8SYmJhwcHOAKmGJhYmKipqaGYJuOjo6GhkZBQcGHDx/AlZGREV5eXmFhYQRB8Hh8XV2dv79/cnLyoUOHCASCiYkJ2FuEfjR1dfVr165RKJQLFy6QSCRahwPRHyEhIWtra0NDQxYWFnBldHQ0NjbWxcWFj48PwRgxMTHwwKmoqABXxsbGmJiYxMXFQRtCCoUSEBCQkZGxffv2VatWEQgE8COIll3gi4qKWFlZ9+zZs7inc0PYQaFQ2tvbt27dqqGh0draitKDN2/erFy5ct26dUNDQ2VlZVJSUgEBAaDdF4VCiY2NXbFihbS0dEJCAqZqOJYIMHUuJCQEVr9B/w4ymVxXV4fH43E4XE9PD4pJw8PDlpaWoqKiDQ0N3d3dpqam1tbW1OXz4uJiLS0tAQEBX19fak8TiPbDdq5du7Z8+fLc3FzahgEtBd3d3QQCQVhYeOvWrfS10VNcXLx8+XIwiMPPz2/BRKPJyUnYE4uG/P39BQUFGxoaaB0IRK/evHmzefNmISEhZ2fnb9toYcqnT59UVVXV1NS0tbU3bdq0INqZmRnYg+lbDP9ItWiHRCJVVlZqamrCnQ7o39Tb2xsbG/v69WtJScnjx49LS0svuGFkZOTKlSvKysq2trbMzMwIXUlOTv711183bNiQk5ND61ig/2JycrKmpmb+1g8Ezffhw4eoqKi2tjYVFZUjR46IiYktuKG3tzcpKcnAwACPxzMwMCDY9vLlSxsbG3Z29qqqqm//LNC3aJxmQdB/RGdnJ4FAWL58+erVq6uqqt6/fx8fH29paYksIsHBwWFhYfHx8S4uLrSOBYKg/5X6+nonJydFRUVVVdVnz56NjY3dvHlTV1cXoWePHj3atWuXq6trZGTksmW0qfCmI0y0DgCC/mWg352QkBD4iKJoaGiosLDwnTt32NjYiouLraysmpubF1ma5e/v//bt28OHD0tJSa1duxb7b70QtNSAw3fc3NzgI5lMPn36tJGRUWJiIoIgSkpKbm5ubW1t9J5m2draBgYG+vj4SEtLe3t7MzHBROIvfWcjEYKw7fTp04aGhtSygP7+fm1t7Xv37oHj0GB4FplMplAoC8qY6N3AwICpqamlpSU8NQJBGOTp6WllZUVteTA4OCgkJFRRUYGiaHx8vKqqalZWFpjYi9K/gwcPSkpKzu8uDn0X3DSE6E9LS4u1tbWurm56ejozM/Pw8DAej9+yZQsPD09cXFxoaKitrS2CIImJiby8vI6Ojsgi0tHRMT4+rqGhQetAIAhaqKKiws7OjkAgREdHg3pQeXn5yMjI9+/fZ2dnx8bG4nA4cDTV2Nh47dq1CD0bHR1taGgwMDCAq1n/g+9nXxCEbeXl5Xx8fMeOHQPrVSdPnkQQBIfDNTc3gxsqKiokJCTy8vJoHSkEQUvIo0ePODk5w8PDwUc3NzdGRkY8Hv/hwwdwJTMzU0ZGprq6mqZhQj8PLF6D6JKRkVFsbGxUVFRKSgqCIF5eXlpaWkQisaenZ3h4ODk5effu3YcOHcLj8bSOFIKgJcTGxubMmTNBQUEPHjxAEOTQoUPS0tJEIrGvr+/Lly/R0dHHjh3z9/fX09OjdaTQTwI3DSE6FhYWFhISkpmZuX79+ra2Nj8/v/LycgYGBmlp6QMHDri6utI6QAiClqLff/89NTX18ePHBgYGr1+/PnbsWH19PTMzs7S09NGjR+3s7GgdIPTzwDQLwrSurq729nZqEcP9+/czMzPZ2dn37dtnYGAwMzPj6emZn5+fl5enrq5OIpFevXo1PT2tpqbGz89P69ghCFq0Ojo6uru7zczMEAShUCipqal5eXlCQkIHDhxQU1ObmppycHB49+5dYWGhuLj41NTUn3/+iaKouro69RwitETATUMI0168eGFra5ubm4sgSERExPHjx6enp5ubm/F4/MWLF1lZWaOiopSUlHbv3t3b28vExKSvr29mZgZzLAiCfqisrKxt27aBAX8nT54MCwujUCgVFRVmZmY3b95kZ2dPSEjg5OR0dnYmEons7Ow4HM7IyAjmWEvRT6wDg6B/2eTk5IEDB8TFxYuLi3E4XFFREYqi09PTZ8+eZWNjS09PR1H0w4cPioqK27dvhzNnIAj6OcbHxzdt2rRq1aqcnBxjY+PGxkYw9e/333/n4uIqLCxEUbS+vl5ERMTb25tMJtM6Xohm4KYhhHWTk5P29vYNDQ3q6uq5ubnUpsOurq51dXWFhYV8fHy1tbWtra07duyATTshCPo5ent7HRwcmpub7e3tk5KSwEUKhbJp06bx8fHCwkJGRsaioqKJiQnQYgZammCaBdGBrq6ujRs3fvnypaysTFZWFlysr6//5ZdfsrKy1qxZQ+sAIQhaipqamtavX8/CwlJfX8/JyQku5ubmEgiExsZGSUlJWgcI0R6szYLogKSkZGpqKoVCCQ0NpVAo4CIHBwfzV7SODoKgJUpVVfX69esDAwNhYWHUi2xfwWF/EAB/DyAMKSoqamhoAAvviYmJGzdu3LZtW3l5OYIgGhoasbGxt2/f9vb2/vjxY0dHh4+Pj4GBgZaWFq2jhiBokXvw4EFXVxeoYYiOjraysnJycmpsbEQQxNzc/NKlSxEREQEBAf39/U1NTUFBQdbW1mJiYrSOGsIEmGZBmEAmk6OiorZu3drU1DQxMbF///7o6GhVVVUWFhZ7e/vMzEwEQezt7S9cuBAXF2diYuLq6iooKJiQkMDBwUHr2CEIWrRmZ2cDAgLc3NxaWlpGRkZ27tx5/fp1HR2d6enp9evXFxUVIQiyd+9eX1/fsLAwHA7n5eWlp6cXFRUFV7Ogf6Jd9T0E/dPMzIyPj4+IiEhaWhqYDG1gYNDZ2Ymi6N27dzk5OQUFBSsrK1EUJZPJ3t7ecnJyb9++pXXUEAQtckNDQ/v27Vu5cuWjR49QFHV3dzc3N+/v7wejoBEEoT6LJiYmHB0dcThcR0cHraOGsAWmWRCN9fT02NraLlu27OHDhyiKzs3NeXl5lZeXoyh65coVFRWV+/fvW1lZKSgotLe3gyPTb968oXXUEAQtcu/evTMzM2NiYqqtrQUpl6urK3gKBQQE6OrqPnr0aPXq1fr6+iDxIhKJ9fX1tI4awhyYZkG09ObNG21tbQ0NDW5ubm9vbwqFAha3SCRSbm6ukpJSRUUFiqLZ2dmgBmJgYIDWIUMQtPiVlpau+oqbm/vs2bPg4tjYGIqiKSkpGhoaTU1NKIpGR0cjCLJt27aZmRlahwxhFNw8hmimqKgIj8erqamVlJRERkbGx8eHh4cjCMLCwsLIyBgTE+Pg4IDD4RAEmZubA3fC/iMQBP1oGRkZ9vb25ubm1dXVfn5+p06dunr1KoIgXFxc09PTKSkprq6uKioqCIIwMjJaWFgoKyuTyWRaRw1hFBOtA4CWrrGxMQ8PD19fX1ZWVhcXl7dv3wYGBsrKyjo4OKAoysvLW1VVNTo6Ojg4GBkZ6e7u7uzsTOuQIQha/MbHx0+dOuXl5cXIyOjr69va2nrkyBF5efm1a9cuW7aMhYXljz/+mJ6ebmlpSUpKCgsLs7KyonXIEHbB9qQQVszOzu7cuTP/KxwOV11dTSAQxsbGmJmZHRwczp8/z8bGRusYIQhacoaGhsAc6Nzc3FWrVhUUFOzZs4fxq7179wYFBdE6QAjTYJoFYcjAwICNjc3Q0FBeXp68vHxLS0tpaamEhAQej2digiuvEATRxvv37y0tLfn5+fPy8gQEBGpqampra5WVlU1NTWHjBuivwTQLwpa2trZ169bJyspmZWUJCAjQOhwIgqB/qKys3LBhw7p165KTk3l5eWkdDkQ3YBoOYYuCgkJycnJ9ff2tW7doHQsEQdA/4XC4hISEnJycgoICWscC0RO4mgVhUVVVlYKCAlzNgiAIO1AUffnypYqKyvLly2kdC0Q3YJoFQRAEQRD0Q8BNQwiCIAiCoB8CplkQBEEQBEE/BEyzIAiCIAiCkB/h/wGFqxOmuXFlswAAAABJRU5ErkJggg==\" /><br /><h4>Caption</h4>Figure 4: Contributions of PDF backend and AI models to the conversion time of a page (in seconds per page). Lower is better. Left: Ranges of time contributions for each model to pages it was applied on (i.e., OCR was applied only on pages with bitmaps, table structure was applied only on pages with tables). Right: Average time contribution to a page in the benchmark dataset (factoring in zero-time contribution for OCR and table structure models on pages without bitmaps or tables) .<br /><h4>Annotations (ibm-granite/granite-vision-3.1-2b-preview)</h4>In this image we can see a bar chart and a line chart. In the bar chart we can see the values of Pdf Parse, OCR, Layout, Table Structure, Page Total and Page. In the line chart we can see the values of Pdf Parse, OCR, Layout, Table Structure, Page Total and Page.<br />\n",
+       "<hr /><h3>Picture <code>#/pictures/4</code></h3><img src=\"data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAAXkAAAF4CAIAAAA+PR7PAABKO0lEQVR4nO3dB1gU19oH8DOzld4FKyAqqKBgARQRbEFEDaKiGFEBFVGjqLEllmBI7MaCFY1dVOyxIqixEGyoEAsgKL33he0z3wPjtxcRUZdlYZf3d31y2dkpZ7b895wzM2cwkiQRAAA0MryxNwAAAAghelMXAPF4PJFI1NSlAADIHo7jqqqq1N9Yk7ehfHx8rl692rZtW4IgmrYkAABZwXG8vLycRqPFxsZScdP09Ro+n+/i4jJjxoymLggAQJYePnx48OBBDMOoh02fNTQarUuXLo6Ojk1dEACALInF4tOnTzevvmHorwFA+QgEgppdNM0iawAASg+yBgAgD03fXwNAc0MQRGVlpVAobPKjtAoBx3EWi6WiolL/bJA1AHyEIIjc3NzS0lKsWlMXRwFQiaxXrZ5XDLIGgI9wOJySkpK2bduqq6tD1nwNkiSLiooKCwvV1NTqqd1A1gDwET6fz2QyNTU1m7ogCgPDMB0dnfz8fKFQWE/WQN8wAB8hSZJGo0FPzTeh2pv1v2iQNQAAeYA2FACKRCwWv3jxIjc3V0dHx9rams1m13z27du3ycnJbDa7S5curVu3/txKXr16lZ6eTqfTO3To0LlzZ6rlmJqayuPxEEJMJtPU1JTFYiGEKioq0tLSTE1NJRvicrlpaWlUf9Y3lRyyBoAvyXiB7u5F9KrvngyI+GigP2rXU4pFi4uLlyxZcuvWLT09veLi4q5du+7Zs6dNmzZUBgUFBZ05c4YkSS6XO3z48F27duF47YZLcnLy6tWrHz16xGQycRwnCMLV1fW3337Lzs728fHJzc1lMBg4jrdq1WrlypWDBw+Oj4+fMWPGqVOnunXrRq3h7du3Pj4+W7duHTBgwDcVHrKmeSvLRWmxCKd984KEGGm3ke4DDWoryUKx5xDrw9gIDcWvRD1GSffWXLhw4fjx43fu3OnRo0dKSoqbm9uWLVs2bdqEENq0adPhw4f37Nnj7OzM4/GysrI+7T0pLCycMGECg8E4dOiQtbU1SZLPnj27cOFCaWmpWCzOzMz8+eefPT09MzIyAgMDf/zxx3/++UckEqWlpQkEgv8Vn89PT0+nakDyyxqhUCgQCHAcZ7PZtY4OisXixMREHo9nbGysra39ab6Cr5IWiw5NQ8xv/5QLucjGA03a1SilamlwGmKqIMYXzlX7WiT5xR+P/fv3p6SkBAcH4zjO5XJXr15taWk5ZcqU9PR0Y2NjW1tbhFC3aomJiVSIhIWFBQYGurq6isViFRUVHR2dT1d78uTJjIyMqKio7t27U1MGDBjg4OBAEERJSQmdTtf+f6tXr3Z1dU1MTGQwGHQ6vea3G8OwWlO+kvQRsHXrVgcHhzZt2owaNaq0tLTmU0+ePBk+fPjo0aN9fX2dnJyePn0q9VZauqpPuaqU/2RV5wdy17t372PHju3YsQMhtH79+rNnzzo4OCCEXFxcxGLx4cOHX758efbs2aysrClTpiCEXr58mZmZqaam5uXl5ezsvGzZstTU1FrrJAji77//7tWrlyRoKBiGSY670ekfKh85OTl0Ol1FRUWGx+OkrNcQBIFh2JQpU+7fv5+cnFyzQJmZmT/88IOTk9OWLVvU1dUzMjI6dOggq+IC0BLY2Nhs3rx50aJFZWVlR44cCQkJMTMzQwjZ2dn5+PjMmjWrY8eO6enpnp6e48aNq2pql5UVFRVt27bNx8dnzJgx69ati42NDQsL09PTk6yTz+cXFxf37PnZthtJkpcvXy4oKMjMzDx06JCDg0PXrl0fP37cxFmD4/j8+fOpburk5OSaT+3fv19NTS0kJITJZCKETE1N618VnJoJwKfGjx9/7969VatW/frrryNGjKAmnjp1KjQ09ODBg4MGDYqNjV2yZMnatWuXL19O9fJOmjTpp59+oppXffv2ffTokaurq2SFNBoNx/HKysp6vobPnz8vLCxECPn5+c2ePZvNZn9utEwp6jsN7RsWCoU1H4pEoujo6C5duuzdu/f27dsaGhozZ86kqn818fl8kUhE7R61Bjh1qm4k2ZAkhldVcV+0ioqKhIQEOp2ek5NDEASVJsePH7e3t584cSJCyNXV9Z9//jlz5sz8+fMNDAz09fWtrKyoZbt06YLjeE5OTs0VMplMCwuLly9fVlZWSsYAliBJEsOwZcuWeXp61pyO4ziGYTUTSigU8ng86oj4pyup+erVeiVlfByqsrKSw+HExMTweLyhQ4c+evTI3d395MmTQ4YMqTnb0qVLb968SfUoJycnd+rUicPhSNGzrdxIBptdXq4pXb0Pw/h8fmlpBSbkyr5kSo3D4ZAkKRQKP9S4GQxcLP72A4H1EYvFVbWFj3+nJXAcJ0ny559/LikpuXr16syZM3fs2DF//nyxWEyn00tKSqhcoA6BUxlkZmbWvn37J0+ejB49GiH0+vVrkiQNDAxq1gbodPoPP/zg4eFx4sSJ6dOnSzb333//dejQgSAIkiTFYjFVY5B037Rv315XVzcyMrJfv37U/A8fPhSJRF26dCEIgpqf6lQRi8WlpaWSZdlsdq1uXBlnDYZhAoHA0NAwNDSU2tVBgwYdPHhw8ODBNdtKvr6+I0eOpNGq3sE//vgDx3EVFRWqzQX+B6fRVFSrDltIgSQZDIaWGhsRDNkXTKkJhUI+n//xoRYSCbhIVo19ARdHZNVBmf/viP3UkSNHTpw4cfHixf79+69Zs2bx4sW9evVydHT08vLy9fUNDAx0dnaOjY09ffr00qVLqXPqZsyY8ccff2hoaBgaGoaEhDg5OVHj6kq6exFCzs7O8+bNW7FixYMHDxwdHQmCuHv3bk5OzsGDB+l0Op/Pp1pM1BeTYmxsPGnSpJCQED6fb2Vl9fLlywMHDsydO9fAwIA6IEXNRtW81NTUNDU1qayh0WhqamqNmDUaGhra2tr6+vpU0FAH1S5fviwSiRiM/33oe/ToIfn78OHDVKFrvijgAyajQaOKMOhwCtW3YjAYAoHgowEldNqiXh4yPJcP02lb9cdnwksgECQkJGzbtq1///4IIW9v79zc3GfPnjk6Oo4fP55Opx8/fnzfvn1sNnvTpk0+Pj7UUgEBATo6OidPnhQIBIMHD16wYIGWllat/lA6nR4cHDxkyJAjR46Eh4fjOG5sbPz777+3adMmJydn8uTJXbp0+bQLddWqVR07drx48eKTJ09UVFTWrl3r5eVV6ywW6uViVpNMrFV7aOgHkU6nUyPlSKbY2treuHFD0iZ89eqViYlJzaSsRVINA3VoHn0HLb2/pl1PeZ6pxGQy//jjj5pTqB5fyphqIpHo09/midUkLazPGVSNqolIJrZu3XrdunV1zo/j+JRqdW60npdOZv01t2/ffvny5Z07d9LS0rZu3dquXbvRo0dra2vPnDnz9OnTCxcu9PDwePr0aURExKlTp+BcPgBkqJ7v/Fce2JXiK9nAlof0EZCYmHj9+nV1dXUnJ6eYmJjo6Ggut6ob0tjY+PTp0xwOZ+XKlXfv3j169Ojw4cMbUkQAgBKQPqhmVqszUG1sbI4dO8blcplMZj2tJwBAyyF91nyxqvbFsY4BAC0HdKMAAOQBsgYAIA+QNQAAeYCsAUCBiUQiRTlDDU4qBeALMioyYvJikKzGIyCRfSv7dmrt6pklKSlp69atbdq0mT9/vmRY38jIyPDw8H79+k2bNo0kSeoihtTUVDabPWzYMD8/v08HGE5NTd22bZu6unpgYKCuri41MSYm5tChQ1ZWVgEBAfI88Q2yBoAvuJ933+u6F5LVhWVCFDY8bKJp1bXan5OZmbl7924VFRVHR8eBAwdSp9eHhIRcvHixrKxs2rRpBEGkpKRYWVmNGTOmuLh406ZNT58+PX36dM0rgRBCubm5+/fv53A4dnZ2bm5u1MTdu3cfOXJk2LBhs2bNQnIEWQPAF9AxelXQ0GW6wnphGGZgYGBjY3P27Fkqa168eJGQkODs7Eyda0Kj0VauXCmZv02bNuPGjcvJyWnfvn3N9eA4rqen169fv1OnTo0YMQLDsMTExOfPnw8bNkxSo8nJyXnx4kVWVhabzbazs+vYsSNCiMfjPXjwoGfPnvr6+tQAF48fP+7evbvkOkcpQH8NAM0OWX2Z/pgxY27fvk2NzHDt2jVLS0tTU9NPB68Si8XUTVQ+vVcnSZI4jo8cOTI2NjYrK4tqiBkZGVlZWYnFYiq29uzZs2bNmuvXr+/cudPNze327dvUsnv37p05cybVGbRu3brFixc3sGMIsgaA5kggEPTr18/AwODvv/8mCOLs2bNeXl5sNrvmBY1RUVHjx48fNmzY5s2bQ0NDqQu7P11Pnz59zMzMwsPDEUJhYWGTJk1SVVWlxrUiSXLOnDn37t07derU/fv3x4wZs3btWrFYzGaz//jjj5cvX27evPnixYv79u3bsGGDkZFRQ/YI2lAANEcEQejp6Q0ZMuTy5ctGRkY0Gs3BweHatWs15zE0NHRwcMjJySkpKYmMjBw8ePCnl0eSJKmqqurm5nbp0iU7O7uysjJnZ+eEhATqWQzDNDQ0zp8///TpU7FY/Pbt21evXvH5fFVV1U6dOm3btm369OkCgWDFihWDBg1q4B5B1gDQTAkEgh9++CE8PHzx4sXDhg0zNDSs1YqxrIYQGjJkiKen56hRo6jxsT5dz/jx4/fs2fPjjz/279/f2NiYGqwPwzCRSOTt7Z2Wlvbdd9/p6+sXFRVJBtZDCPXr14/JZBYUFIwZM6bhuwNtKACaKYIgjI2Nzc3N4+Pjvby86pnTzMxMS0srPT39c+vR0dGxt7ePjY0dP368ZDqO42/evImOjt6zZ89vv/22cOFCJycnPp8vudTx559/pqpOS5YsqTWyuBQgawD4ArL6fzL8R1b93xdQAwAjhLZs2fLgwQMbG5uag4dXVlZeu3bt3bt3hYWFSUlJ27dv53A4dVZqJH3Jv/766/37952dnWuuh8FgCIXC5ORkoVD45s2b7du3S45P/fXXXxcuXAgNDT18+HBMTMzmzZsb+DJCGwqAL2BgDHWmOpLV4Ch41Qrrn4UarJeqX7SpRk1nsVhUM0ogECxZsoROp6upqZWUlIhEot27d9c64E3VXNTU1Kj4aFVNsh4VFRWCIDp37jxhwoTFixf/9ddfAoHAwsKitLQUx/G3b99u2LBh1apVVBtt06ZNS5cuHTx4MHXLTelA1gDwBSM7jMyelC3D84bZdHb9s9jZ2T19+lRypq/Ehg0bqPqItrZ2dHR0cnJybm6uvr5+9+7d2ew61tmjR4/o6Ghtbe1a05ctWyYSiagM2rFjh7+/f3Z2drdu3YyMjIqKithsduvWrf/55x9DQ0Nq/rFjxzo6Ota5ia8HWQPAF9Axujrjw4UC8sFkMiV1kJpqnkGjoaFhbW1d/3oYDEadZ99paGjU2ceMEKLmV6tWc546y/NNoL8GACAPkDUAAHmArAEAyANkDQBAHiBrAADyAFkDAJCHBh3zzsrKyszMVFVVNTc3//SiLw6HEx8f37Zt2w4dOjSskACAlpo1JEn+8ssvN27cyMrKsrS0DA8P//R8oXXr1oWEhAQGBv7666+yKCoATUNEIJ5Ilitk0xG93hZFeXl5UlKShYWFqqpqnTNkZGRkZ2ebm5t/OmYNhSCIN2/ePHz4UCQSde7cuXfv3tQ5NUKhMCkpqaSkRCwWq6qqmpmZUd9cLpebmJjYoUMHHR0dag0CgSAhIcHIyKgh42PJpl7TtWtXGxub27dvP3r06NPbrUdGRl6/fl1XV7ekpKTBhQSgKV1+i7zDEWLKaHUCdHQ8cu9S3yzPnj3z9PSMjIyUnGJXU35+voeHR1xc3PXr16nrm2p5+/ZtYGDgq1evzMzMGAxGfn5+aWnptm3bXF1dS0tL/fz8srOz27VrV1FRUVhYuGzZslmzZr179278+PGbNm0aPXo0tZLs7OzJkyfPmzfPz8+vKbMGwzBvb29qEObHjx/XeragoCA4OHjBggVHjhz5dBixWuQ5ujIAUhASiMOvvmxSJgRVK6wfQRB8Pv/Tn3DKhg0bdHR02Gx2nQPl5eXl+fj4IIROnTrVs2dPJpOZlZV1/fr13NxcqkXC4/F++OGHBQsWlJeX79q1a8WKFc7OznQ6XSAQ1Py2kiRZa0oDNfQahTqLsmHDBmNj4wkTJoSGhta5VHp6OnWJF4ZhRUVFJiYmRLUGFkbJkBiOi8VSX/FHEIRYTGKkYtzQo/kQi8WSy6Crf1arUwbDZHY9FFb1Pa7+Mn/meQwjSZL6L/Wdr/lURETE/fv3165dO27cOOorU2uGqKioR48excfHd+nyoe7Upk0bX19fycwYhmlpaelXW7x48aZNm16/fm1tbV1zi/WUoU7UKyYWi0WiD61NvOrDK27c66Hu3bt369at06dPU73Fdd72e926dbdu3cJxnEajpaWlWVtbV1RU8Hg8mRdGoZEMNruiQvNL902vG4YJhcLS8gpMyJV9yZRaZWUl9bWhPrp0OiIIDGGyusobIYz6hSY/N3ovnU6ncoFKPck3lkaj5ebmrlmzZt68eSYmJkKhUDJbzcUjIiJ69uxpbGxMLU61G6h9odZWM0nj4uJwHFdXV6eGyJKskE6nU3PWuYlPUXWF8vJyyVAYbDa7vLz8o/1CMlVSUrJy5UovLy8jI6Pi4mKRSMTn87lcroqKSs3ZgoODeTwehmFMJtPf35/a2891g7VcOI6pq3/2569+JMlkMvW01BDx0SsP6odhmFgs5nK5NBpN8jNJw2XXgEJVq6JVf/9pn48vKiCoMtD+fz4MwzZv3mxiYuLl5ZWSkkLNIPmvpPC5ubkmJiYMBoNayZ49e+Li4phMZo8ePXx9fWk0Go7jkZGRVF/H4cOHhw8fbmtrm52djWGYZLuS/9acUg9qWU1NTS0tLSprcByvdYWnjLMmISHh1atXQqHwypUrYrH4v//+e/fuXWVlZWhoKIvFkswm6etGCKmoqGDVvrg/LVEDOrOqXlIMq+8TDepCNe0pHybJqvUkUb3meiqs1KZr/pdqMVy9evXo0aNcLreyshIhxOfzBQIBk/m/Xmscx1VVVcvLyyVLqaqq6urqnj59Oj4+3tfXl9o7aoQtBoMRHBw8atQoHR2djIyMT7crWUmdrZNaBabipmb3a61vdEOzhopPSZXE3Nz8+PHjFRUVVG1t9erVxsbGU6dO/fTsG4kvNgUBaJmwj7/hDx48SE9P9/X1pfp3ORyOv79/QEDAL7/8UnMRR0fHoKCg0tJS6mD2lClTqFPhJCOEEgQxYcKEpUuX1lw5i8Wi0WjU/WEoVKJJ7rrZcNJnTVhY2M2bN589e/bu3TtfX19TU9N58+a1atVq2LBhknm2bt1qZmY2ZMgQGZUWgJbLy8urT58+VAdKVlbW3Llz58yZ4+7uXmu2oUOHrl27duPGjUFBQZLfeGG1elbevn17IyOjiIiIqVOnUlOePn2an59vb2/f9FlDp9NZLJaTk9PgwYO5XC6TyawVw2KxeNKkSZLhCwFQUCKi6kC1zAiqV1gvkiTLy8uXLVtmYGBAddCam5svXbrU2NiYmiEtLU0kEvXr169r1661lu3evfvOnTsXLVp09+5dNzc3NTW1t2/f3rp1a+LEqrv6UnUiydEiCRUVlYULF86ZM2fChAnOzs4pKSlHjx6dM2cOdRvMJs6a8dXqmYFGo82ePVvq9QPQTAxoj8K9ZXftIIHsa48LXJuZmdnatWs5HM6HJQiidevW1OEhaoqGhsYff/xhYmJS5+Jjx47t2rXrzZs3Hz16JBKJTE1NQ0NDqRs8qamp/fTTT58mFELIw8OjdevWf//9d1RUlL6+/t69e11cXJDswBigAHxBOw00rptct9ihQ4effvqpnhl0dHQWLlxYzwzdqn06XVVV1dfX93NL9auGGgecswsAkAfIGgCAPEDWAADkAbIGACAPkDUAfATDMJFI9MUzZUFN1GVQ9b9ocBwKgI+oqqoWFhbm5eWpq6tD4nwNkiSLi4vpdHr9N8aErAHgI6qqqgYGBgUFBTDM21eiajRGRkY1r8z6FGQNAB/BMExPT09LS0sgEMDFel8Dx3Emk/nFa6chawCoA71aU5dCqUDfMABAHiBrAADyAFkDAJAHyBoAgDxA1gAA5AGyBgAgD5A1AAB5gKwBAMgDZA0AQB4gawAA8gBZAwCQB8gaAIA8QNYAAORB+itZBQJBVlbW69ev1dXV7e3tGQwGNb2iouL+/fuxsbE4jg8aNMjW1lZ2pQUAtLCsIUly+vTpN2/eFIvFnTp1unLlio6ODjXdz8/v5cuXpqamIpFow4YNc+bMWbFiRf2D6AAAlJ709ZoZM2b4+/uHh4c/ePBAMpEgiNmzZ7dr1466NWdISMiqVatGjRrVt29fGRUYANCS+mswDHN0dHRwcDA0NKw5nUajDRw4UHIPYHd3dy6Xm5eXV18JcOgzAkD5NXTkMbFYXM+zZ86cMTIy6tKlS63pL1++LCgowHGcwWDk5OSYmJiQJCkUChtYGGVDY+AikdTvEEEQIoJEInhVQRNgMBi1vtGNOMphZGTk+vXrV69e3blz51pPHT58+N69eziO02i0N2/e2NraVlZWcrncxiuMQmKosLhcDemG8q++8UgZh4sElbIvGABfoqKiUllZKY+sefjwoV81f3//T5/95ZdfeDwehmE0Gm3WrFk0Gk1NTU1FRaWRCqOoMBypqSHphtcmSQaDoaupioj6bqMBQCPBcVxDQ0OWWUPdQKfWbXRiYmK8vLy8vb2Dg4PrXEqrGvW3JGKg46YODXhNMOpdgVcVNJFa32jpP4gkSRLVqF4b6g+EUGxs7OTJk0ePHr169WqSJMVicf03voDbYgDQEkhfr9m5c+elS5cSEhKys7M9PDzMzMz++OOPVq1aBQYGJicnx8XFjR49uqp7UiQKCgoaMGCATIsNAGgxWWNtbU3dQwfHcaFQqKmpqaqqihBaunTptGnTRCIRVWEhSbJt27YyLTMAoCVlzYBqn053c3NrWJEAAEoIOg4BAPIAWQMAkAfIGgCAPEDWAADkAbIGACAPkDUAAHmArAEAyANkDQBAHiBrAADyAFkDAJAHyBoAgDxA1gAA5AGyBgAgD5A1AAB5gKwBAMgDZA0AQB4gawAA8gBZAwCQB8gaAIA8QNYAAOQBsgYAIA+QNQAAeYCsAQDI/f5QKSkp6enpnTp1atu2bUFBgbq6Opv92TvPp6amvnnzJj09XVdX183NjcViSZ7KzMw8efJkYmJinz59xo8fr62t3ch7AQBQkKwRCAR//PHH2bNn09PT169f7+/vHxYWxuFwli9fXudiJEkGBQVdunSJy+V27tzZ2dlZkjX5+fljx46l0WguLi7btm27devWvn37NDQ05LhTAIDm2oY6efLk0aNHt27dOmnSpMrKSoSQsbHx9evXBQLB55ZcunRpcnLykiVLGAwGhmGS6bt27SotLQ0PD1+1atWFCxeuXLly48YNuewLAKB5Zw1JkleuXAkMDBwyZAh1T26EUJs2bYRC4eeyBsMwc3NzLS0tOv2jVhhJktHR0ba2tm3atEEIderUqW/fvvfv36+nBLXWAD5SI8QBUCw1qyAf9dfQaLSacxQXFxMEIZn4OSRJ1nxYXFxcUFDg6OgomWJhYfHff/+JxeKaq7p3715GRga1obdv37Zv314gEIjF4gbvnXLBaTQ+nynt0mKxWMAXIAJeVdAEaDQaj8ernTUYhg0fPnzLli2urq4IIYIgCgsLN2zY0L9//3r6huskFArFYnHNpdhsNo/HqxVJ165d++effxgMBo1GS0hIcHJyEgqFtUoGSDqbxeczpazaYGKxuIIvwoRcmRcMgC+ivvh11GvGjx9///59BwcHLperoaGxYcOGrl27zps3r1Yt6Gs2wGAwysvLJVPKy8vV1dVx/KOD68HBwQRBUCufOnUqnU5Xq/ZN22oRNDTQxzH91Ugmk6mvqYrQh0YxAHKmpaVVR9aoq6vv2rXrn3/+efbsWWVlZdeuXYcMGWJgYPDF1eE4jmGYpH2kqanZqlWrxMREyQz//fffwIEDa2UNXo36+1vjDACgiP7XX8Nisb6r9pVLVlZWCoXCiooKoVBYWFhIBRaO466urhs2bIiLi+vRo8e9e/fi4+NXr17daOUHAChU1lythmGYSCSijg3RaDQMw5ydnb/77jsVFZVPl9y7d+/58+fT09OLi4u9vLxMTU03bdrUtm3badOmRUVFTZ48uVu3bk+ePJk+fbqTk5Pc9wsA0CyzpqSk5NChQ4aGhhYWFhiGJSYmZmVlDRgw4OrVq3/99depU6c+7SQeOnSoqakpk8mkVR0t4aupqVHnB6urq58+ffratWsvX76cNWuWk5MTtJIAAB+yRlNT093dPTg42MTEBCGUnp6+atWq0aNHW1hYjB079saNG99//32tJa2q1blSBoMxulrjlx8AoBg+dNAeOnTIxcWFChqEUPv27d3c3A4ePEh1Ej958qRJCwkAUJasUVFRefbsWc0n4uLiqKNLBEEwGIwmKh4AQLnaUL6+vuPGjauoqBg0aBCO4/fu3Tt27NiJEycEAkFRUZGLi0tTlxMAoBRZ4+zsfOLEiZ07dwYGBpIk2atXL6pVJRKJgoKCOnTo0NTlBAAoRdZgGOZSTSgUkmTVKafUdCaT2aVLlyYtIQBAGXx0jXVBNbFYjGEYSZKqqqomJiZwxBoAIMvza1atWnX27NnKyko1NbWCggI6nT5p0qQ9e/ZA1gAAZHYc6vTp07du3QoJCbGwsNi+ffvJkye7du3at2/fWtcxAQCAdD5ESUREREBAwJgxYzQ0NCwtLd3d3VesWHH16lWhUCjligEA4NOsIQhCR0eHJEkMw7KysqjT+TIzM/l8fs25AQCgQVljaWl59+5dDMMsLS3Xr19/9erVLVu2aGtrf+tYWQAAUF/WTJ482cnJiSTJhQsXMhiMSZMmvXnzJigoCAYDBgDIxIco6VINIdS2bdtLly7x+XxqWAnZbAQA0OL9r9oiEonu3Lnz4MEDoVBobW09fPhwdXX1Ji0bAEDp2lAFBQVjxozx8fG5detWdHT0ypUr7e3t4+Limrp4AADlypp9+/alp6efP3/+xo0bERERly9ftrKyWrVqFdxHBQAgy3vRxcTEBAYG9unTh81m0+l0MzOzRYsWZWZmwn1UAAAyyxoMw3r27JmSklLzibS0NDMzM7iPCgBAln3DLi4uPj4+QqFw4MCBNBrt9evXu3fv9vb2vnXrFkmSHTt2NDU1lc0GAQAtOWsePXpUUFCwcePGkJAQOp1eXl6upqYWEhKydetWkiSXLl26ePHipi4qAEDxs2bevHn+/v7k/6MuuSQIgnqWxWI1aSEBAAqPPnfuXHNz89GjR7dv3x6u6gYANBK6sbHx1atX9+zZY2hoOHLkyH79+vXs2VNVFW4CDQCQJfrixYsXLVoUHx//+PHjy5cvh4aGtmnTxtra+vvvv+/du7d0x6EuXboUFhZWUVGhp6fn5+c3YMAAmZYZAKB4qhpNOI737Nlz+vTp58+fv3v3rp+fX1FR0ZIlS2xtbVesWFFeXv5Nazxz5oyPj4+urq67u7tIJPLw8IiOjm608gMAFMNHl3FjGGZgYDCpWk5OzvPnzxMTE3k8noaGxtev8cSJEzY2Njt37kQITZs2zczMLCoqqn///o1QeACAwvjQGfz8+fOjR4+SJCl54u3btzQabd68eQYGBt+0xg4dOpSXl1ODbBUXFwuFwtatW9czP1xNXh8Y7BkorFpDlX+o1+zfv19VVbXmczk5OTt27HB2dv7Wm17+/PPPs2fPdnV17dKlS3x8/KhRoyZMmFBrnmPHjsXHxzOZTBzHnzx50qFDBx6PB+ON1kLSGIzKShUp4wYTiUSVlXxMLJB5wQD4IgaDUVFRUTtrSJJ8//79pEmTaj5hYmIiEAj4fP63Zk1eXl5BQQGtGoZh2dnZpaWltVphhYWFGRkZTCYTw7DKykqSJAmCgOs8ayERjU78r6b5bTBEkISYEGPwqoKmQKPRJCfo/S9rMAxr27btkydPasZNcnIySZLfGjQikWjZsmWamprnzp2j0+kVFRWOjo6bNm3aunVrzdnmz58v+dvHx4dGo6lWa8CuKSl1NVSjYfsNSJLJYDLVVRGCVxU0jVo1jA9tqIkTJ3p6erZt29bJyYnJZL5582b58uVz58791jOGy8vLMzIyxowZQw0eqqam1rdv3/j4eIIgPneioEgkasDuKDvpggaAZqBm/+//+oYdHR1///33zZs3jxkz5vvvv581a5aHh8f06dO/de0aGhqmpqZXr17Nzs4WCoVJSUmXL1+2tbWFM5IBaOE+1GvodPrMmTOpIc05HI65uXn9B48+uzo6ffXq1QEBAYMHD27VqlVmZmavXr1mzZol62IDABT2/BqSJJOTk5OSkmxtbVu3bl1QUKCioiLFecPW1tZXr159/vx5aWmpgYGBjY0NdMQAAP53P+958+Y9ePCAy+X+8ssvc+bM2b17d15e3vbt26W4n7eOjs6gQYMaobQAAEX1oRvlxIkTr169On/+/JgxYwSCqjMy7Ozs4uPjqb8BAEA2WXPz5s2AgIAePXqoqKhQU3R1dQUCAZxfBwCQZdaoqakVFhZS12FSx4yysrKkOL8GAADqy5px48bt27fv9u3bpaWlZWVlDx8+DAoKcnNzgxH5AAAyHtv86dOnkyZNEovFTCZz9+7dDg4OAQEBstkIAKDF+5A1Kioqv/3227Rp06Kjo3k8Xp8+fWxsbJq6bAAApcsakiQFAoFZNbFYHBMT8/bt206dOjV18QAAytVfc+jQoVWrVpEkyeVyR44cOWHChCFDhly8eLGpiwcAUK6siYyMbNeuHYZht2/fTkxMPHny5Jw5c0JDQ+HCSACALO/nXVZW1qpVK4RQREREnz59BgwY4OLiUlhYCPfzBgDI8n7eJiYmd+7cSU9Pf/DggZ2dHTU6hORcGwAAaKAPUTJ16tR79+7Z2NjgOO7l5YUQevDggY6ODpvNbugWAABAchyqT58+Fy9eTEpKsrS0pEaTGDJkiJubG9RrAAAyHlOCOuAtedinTx/ZbAEAACRtKAAAaFSQNQAAeYCsAQDIA2QNAEAeIGsAAPIAWQMAkAfIGgCAPEDWAAAUPGv4fD6Xy611/3AAQMvUKFmTl5cXHBxsZ2dna2s7duzY5OTkxtgKAEAhr1GQlcrKyqlTp+bn5y9ZskRTU/Pt27dw4xcAgOyz5vjx44mJibdu3TI2Npb5ygEACkr2WXPt2jU7O7uioqJjx461a9duzJgxmpqaMt8KAKBFZ015eXl+fn5OTs7cuXM7dOhw6dKlP//8Mzw8vHPnzjVn27p169OnT2nVoqOjTUxMeNVkWxiFR2czKirUvv1+6tUwoVDIqeBjQq7MywXAF7HZbA6H04hZQ5Ikj8fjcDhhYWF9+vTJzc11cnLas2fP5s2ba87Wrl07LpeLYRiTyYyNjcUwDMdxOl32lSzFRsdpNBoiSakWJjEMY9AxRMKrCpoAjld/emuQ8QdRRUWFzWZbWVlRw98YGhp+//33t27dEolENaNk3Lhxkr9fvHiB4zizmmwLowwaMC4inU5XZzERC15V0DRUVFQa8Zg3g8Ho3r07n8+XTCktLVVXV8c+3xCAE3AAaAlkf36Nt7f327dvQ0NDs7KyIiMjz5w54+npWas2BQBoaWTfmHdwcFizZs22bdv++uuvgoICX1/fH374QeZbAQAolkbpOPTz8xs7dmx6enqrVq0MDQ0bYxMAAMXSWAcptKs10soBAAoHrvMGAMgDZA0AQB4gawAA8gBZAwCQB8gaAIA8QNYAAOQBsgYAIA+QNQAAeYCsAQDIA2QNAEAeIGsAAPIAWQMAkAfIGgCAPEDWAADkAbIGACAPkDUAAHmArAEAyANkDQBAHiBrAADyAFkDAJAHyBoAgDxA1gAAFDxrSJIsLS3lcrmNtwkAgKJoxKwJCwtzcXH566+/Gm8ToD5YY938C8gMIUaCSin/ifhIoTTWxzEpKWnTpk0JCQlJSUmNtAlQH4yeUfE+JvUMIr99WRK1U29nb2DfGOUCH0m8g07OQ0xV9K2EXGQ1EnmsQy08a0Qi0a+//jpy5EhdXV2CIOqfGcOwxihDS0dj38+77xUpVdYI0cguI/8e8ndjlAt8hBAjPgeRX/iO1EHIRUIeUiiNkjWHDx/OycnZs2fP6NGj65yBrFbVhMPxL4YRkApJx+hVb68UWYMQm8aWfYlAnTC86p80S0n/I51RhmIypOpBIVA7LWTftnlkTVpaWkhIyObNmzU0ND6XI0FBQQ8fPsQwjEajxcbGmpqaVlRU8PkK1v5sbCSdxeJw1OVf78OQgC/glnG5IujXb67vL4YJBILy8krs22s3bDp5/Q1rxgV1xPj27YrQdxaCC+7lXOEXis1iscrKyhoxayorK1esWDFy5MjBgwdT1RY6vY5NDBw40NjYmFatqKgIwzAWiwWNqdroTDqT2QTbJRGNTmOxWCRdqkoRkMP7SyIajabCYiHaNy/KoiNVNh0xkTRZgyE1Fo3FUiG/tF0mk8lisRoxa16/fn316lVnZ+eAgACxWJyQkJCbm6uurr5y5UoG4397RiURJSIigoqkOlOppWMyUXVjU85oNBrOwlXRt/dZAjm9vySNRlNl0qTpV67erHSN6w+fDaaq6leEZONmjb6+/uzZs8vKykiSJAgCx3EajcasN7yhvwaAlkDGWWNsbLxmzRrJw9jY2F69eq1YsUK2WwEAKJxGbLaIxeI+ffqYmZk13iYAAIqiEbOGRqNt3LgRenwBAI2bNVRfdKOuHwCgKOA6bwCAPEDWAADkAbIGACAPkDUAAHmAU3VBc0KIpR+WBach+kcnqoJmBbIGNCctaTyXlgayBjQnhKjljOfS0kDWgGYFa5LxXIAcKFrWZLxAd/dK0ywXC5BxX9R/WqOUCgCgbFlTkoVizyHWt7fnBdyqi+ghawBoIoqWNTgNMVUQQ0WaZelwwQQATQbOrwEAyANkDQBAHiBrAFBQmPRLNsUhO0XrrwEAVMFEpJAn4iCpcEV0hOR9Wx7IGgAUEF3lcvpl71OHpBmiHEOiCnfEOIrkC7IGAEWECUkhR8iRLmtQU9z5C7IGAIWEVf9PuiWbpMMG+oYBAPIAWQMAkAfIGgCAPEDWAAAUs2+YJMnS0tLk5GQ6nd6pUyc1NTWZbwIAoHBknzW//vrrgQMH9PX1BQKBWCxev369u7u7zLcCAGjRWUMQRKtWrXbu3GllZSUQCDZv3hwYGGhpadmpUyfZbggA0KKzBsfxOXPmSB6uXLnyyJEjCQkJ9WQN3IQXgJagcc/le/HihZaWlpGRUa3pPB5PJBJRKSMUCqlenq9aI0k2JJm+divNR8P2FyncawXvryL4yte51myNmDUZGRlLly6dOHFir169aj21dOnSiIgINpuNYdi7d+/MzMw4HA6P94WxqUkGm11erildPQjD+Hx+aWkFJmyCs7Ol06D9bQgM8Xl8bgm3QlQhz83C+6sAMMTn87mlpRXCLxSbzWaXlpbKI2sKCgomTpzYsWPH33777dNW0owZM9zd3Wk0GkIoODiYRqOpqKiwWF8YRZjEcJqqKpLut4skGQyGlpoKRirM6HwN2t8GbRgxmAyWOotOyvUSFnh/FQCJGAwGS02L/qUKGY7jtY5BN8qHKT8/39PTU1NT8/Dhw1paWp/OYGlpKfm7TZs2GIbR6V9XEgZD6lLhOM5i0BCqCjiF0YD9bQgcx2kMGk3+rxW8v81e9WeD9TWvMpPJbNysKSwsnDJlioqKyqlTpzQ0NL44v1gs/oa1K9aPQMPB/io3Upn3t3H7a0Qi0Y8//njjxo3AwMCDBw8KBAKSJN3d3Tt37izbDQEAFIuMs0YsFltYWEycODEjIyM1NZWa4ujoCFkDQAsn46xhsVirVq0iSVLSH1zzbwBAi9Uo117WDBcIGgAAXOcNAJATyBoAgDxA1gAA5AGyBgAgDy0na0iEwU0jAGgyLebrR2PH5N3ffGe8NMuKkb2R/aLui2RfKgBajBaTNRj9fcX7M8kx0ty7S4T4iA9ZA0BDtJisQYiO0at2V6oLUFi0L1yDDgCoX8vprwEANCXIGgCAPEDWgDrAdSVA5lpQfw34ekICcQRSLkvHERs+VuAT8KEAn2Cgy0mo9ROpqjdC5N4dHf2+MYoFFBtkDaiDiEAcvpRZw626LwYAtUHWgM/ApMoaDMEgIqBO0DcMAJAHyBoAgDxA1nwVOrxOADQM9Nd8BRy9L0VnXkvVf0GgdlrIvm1jFAsARQJZ8xVoKCYNjX8s5XGZkT3R3xMao1gAKBLImq+DI8SU8rgMnNgGAPTXAADkpFF+cwmCiI6OzszM7NSpU+/evRtjEwDUBr+bLS1rBAJBYGDgjRs3jIyMcnJypk+fvmzZMrhLFGhcNBSTjjaflWpZMbLvgBbZy7xMoJGz5vjx4+er9enT59q1a97e3v3793dycpL5hgCofawwXqplhYiPIGsUMGsuXbrk4OBgb1/11o0cOdLU1PT27dv1ZA2O4zQa7WvXzmAgGlb171uRGJ2GSTkuH1Z9gg1NymPeeENeY9jfr4WxcVpVmaVAQypNNewiQ5nfXwaDUbNBI+OsKSsry8zMdHFxoR5iGNarV6/Hjx8TBIHj/2tPp6amlpSU0Gg0DMMKCgrYbHZcXBxJfullwzAs+Q2ezUOMby4YRuIpqjxU+fn3Bq9+qs5nMYR4RajkJcK+/Y0VoUJVMj6OIKT5TMD+fvWiiJeC5SDay7p2ifxwmVbVB6z6bxmWuSGwRnt/qWvZmvT9xTDszZs3PB6vsbKGy+UKBAJtbW3JFG1t7YSEhFpZs379+qioKBqNhuN4bm5ubGzsP//88xVZg2NCLs6tRBj3WwuGk4iDE2o0tTpe/ep3hcfj0el0BoNRRzEwhIgXiJhQlerf7gWd9AyV7rvXiPvL5XKZTCadTleS/UUkB0WpoWd1f71IksvjslgsGo1W56dM+jI3BNYo7y+GYWKxmM/ns9lsHMeb6v3FcbyysrL6BScbJWuo+ODz+ZIpfD6fyWTW6htet26dQPBhLCaSJL+h5xjDECZdRbnqFa5zSQxhBEF4TvD8fvT306ZNE4lFdc1FVnUhSoUkkVjqD3Hj7C+PxxsxYsTyn5cPdxmuRPtL0Or68uAYVlJaOnTokNDQXb179xaJRDIuc0Ngsn9/aTjt+fPn8+fPP3bsWPv27cWEuKneXwzDcBxXUVFplKzR1tbW0tJ69+6dZEpycnLnzp1rVmoQQpqamqiZYbKZappq6lrqqAVQEajQWXRNbc0Wsr8YnUljsLV09NQ1/1fjVmJaulp0Fl1bT1tDWwMp6zkJdDrd3t7+8ePH5eXlCKGsrKxHjx45OTk182PexP9DLQNBECRJwv4qK6JZ7q/sz3/y9/fn8/mTJk3asmXLxIkTe/ToMXz4cNTssVgsOr0FXU3AYrFqVTaVG9V5gVoGHMdZLFZz+4HHvtwj++1SUlK2b9+enp5uaWk5f/58XV1d1Oylp6draGjU7NVWYiRJpqamGhgYqKmpoRZALBanpqa2adOGzWajFoDP52dnZ7dr165Z/Xw2StYAAEAtLaVWCQBoWpA1AAB5gKwBAMgDZA0ACun9+/dxcXFIcUDWKD8ej5eTk9PUpQAydv36dVdX1+fPnyMF0eKOQ4lEouzs7Pbt26OWgc/nz5s3D8OwkJCQZnUEtJEUFBRgGKanp4eUXXl5+cyZMxMTEy9cuKAQn+cWV6+JjIx0dna+c+cOagE4HM6VK1fi4+OXLVv2DQN3KLJDhw4NHz48Ly8PKTsNDY1t27aJxeKAgICKigrU7LWgrHn16pW3t/eGDRvy8vL8/PwSEhKQUhOJRL/88suiRYsmT55sYmLS3M4ibSReXl7U14/L/eaLpxXLgQMHfHx8GAzGlStXVq5ciZq9lpI1xcXF3t7ehoaGp0+fvnv3roGBga+vb1FREVJedDp96NChOTk5r1+/RkpNLBZL3sq2bduGhYU9evRo+fLlStw/EBYWtn79+nnz5kVEROzcufOvv/7auHEjaubIluHMmTPW1tb5+fnUw7S0NDMzs8mTJ/P5fFLpFBYWSvZ0+/btWlpakZGRpPK6f/++nZ3d69evJVOuXr2qq6u7a9cuUkl9//33CxYskDzcs2ePpqbmhQsXyGaspdRrmEwmh8MpKyujHrZv337u3LnHjh0LCgpSpl+/wsLCwMDAAQMG2NjYzJw5Mysr68cff5wxY8a0adPi46UbjLdZS0tLW7lypb6+fuvWrb29vSXdNK6urh4eHoGBgWfOnEHKCMfxwsJCycOpU6daWVlNnz797t27qLlS5qwRiUSZmZlUt9nAgQNJkty5c6fkWR0dHUdHx2PHjt2/fx8pBYIgli5dmpSUdODAgfDw8IcPH3p7e/P5/N9++613795TpkzJyspCymX58uUvX740NDTct2+fWCz29/cXCoXUUyYmJra2tqmpqUhZlJeXJyQkcDgchNCECROuXr3677//Uk+x2WxTU9Pu3bunpaWhZotUUsnJyS4uLvr6+hYWFjdv3iRJ8uLFixoaGosXL46Li4uKirK3t797966Xl5e3tzepFJ4+fdqtW7ekpCSSJCMjI62trfft20c9lZWV9d133x0/fpxUFi9evFi3bp2jo2Nubi41JS4urkOHDtOnT3/79m1kZGSfPn1ev34tFotJxUcQRGhoqLW1dffu3bt163bu3DmxWOzl5WVsbHzt2rW8vLwzZ87Y29vn5ORQI9c0T0qbNZMnT54xY8bt27fnzp2rr69/7949kiQvXLjQqVrHjh3Xrl1LkuSMGTPGjRtHKrg3b94IBILz58/37ds3Pz9/z5491tbWN27coFLm5cuXJEnm5+cLhUJSWURFRbFYLAcHh5o9bnfv3u3SpUvXrl3NzMw2b95MKosLFy507dr13LlzycnJQUFBLBbr7t27RUVFs2bN0tfXt7Oz69at28mTJ8nmTRmyhsfjHT9+PDk5mXr45MmTn376acSIEWVlZdSUgIAAExOTxMREkiTLysqePHmSk5NDkmRERIS5uXlUVBSpUPLy8h49eiR5+ObNGxcXl/Ly8oyMDGNj4+HDh7u5uVH3pSBJcsGCBbNmzWrOP3dS27dvn6qq6unTp2tOzMnJCQ8Pp+JVOQgEguHDh1PRmZGRMXr0aH9//8LCQurZFy9eXLx4MSMjg2z2lCFrKisr+/XrJ/kdi46O1tLS6tevH4/Ho6aUlpa6uLgMGDBA8pbk5ub+9NNPlpaWinio4vr164aGhpKIvHDhgrOzs0AgIEly8eLFCKFTp05REbx+/fqePXsqzRcvLy9v48aNP/zwQ0hICLW/P/30U9u2bZVmB2t59erV5s2b8/Ly+vfvf/To0adPn9rb269evZra9zt37nA4HFJxKHbWpKenUy93fn7+u3fv7t69S70NZ86c0dLSOnDggGTO7OzsHj16rFu3jnqYl5e3Zs2amrUDBSIQCH788ccOHTpQR3m3b98u6XIqKysLCAgwMDBwcnLq27evo6Pjs2fPSKWQnp7u5OQ0YsSI+fPn29jYuLq6ZmZm8vl8T0/PHj16KMQP+zcRCoXOzs5+fn5cLtff39/c3HzQoEHHjh2jnr1z5461tfXbt29JxaHAWcPn8ydOnDh37lzqYUpKSuvWrXfs2EE9XLt2rb6+fnR0tGT+9+/fp6WlkUqBw+G4ubn169cvLy9vwYIFVN+TxK1bt7Zt23bmzBlJTVvREQQxZ86cCRMmUL8lv//+u6Gh4ePHj6mfmb59+3p6eipTb9SDBw/WrFnj5ubG5XKphpKGhoaLi0tlZaVAIIiIiOjWrZuk419RKHDWEAQRFRWlp6e3YcMGSV+9pqbm5cuXqYcBAQGmpqZv3rwhlcvFixfXrVuXk5NjbW3t7u7u7Ow8duzYAwcOhIWFXbp0KTIy8v3796RyKSoqsrOz+/vvvwmCWL16tYODAxU0lZWVVFvj2rVrytQntXfvXhqNNmnSJMmUy5cv9+zZs23btn379rWystq/fz+paBQ4ayh//fWXtrY2dcakSCRavnx527ZtqYZDeXn5sGHDRo4cqUy/eG/fvrW0tNy7dy9BEC9evGjTpk27du2mTp3q6urq4OBgY2MzYMCABw8ekMqFy+UOGjRoyZIlCxcuHD58eEpKCkmSJSUlM2bMSE1NJZUFh8OhjmDweLy5c+caGBi8ePFC8mxaWtqJEyeOHz9O7b7CUfisIUkyKCjI0NAwJiaGauV6enpaWVllZmZSdwuIiYlRml+88PDwiRMnBgYGSqZcv35dX19/586d1L5zq5FKobCw8MyZM5cvX6YqL7t27UIIjRo1ivrl4HK5M2bM8PDwKC8vJ5VFZGSksbHxnTt3qB10c3Ozs7MrKCgglYKiZk1lZeXvv/++dOlSoVAoEAgmT55sbm5OdRAWFBTY2dm5ubmVlpaSyiU4OBghRF1XIbFjxw5dXd0rV66QSiQnJ2fo0KFt2rTR1NQcM2ZMcXFxZWWlu7u7ubn5pk2bjh49OnLkyCFDhihZlzCPx5s+fXrHjh3fvXtHkmRmZqaVldXEiRMrKipIxaeQWVNYWDhq1KihQ4deuHCBOjG0sLDQ2dl58ODBJSUlJEkmJCQsWrRIaX4QJIRC4bRp09q3b099FiWWLVv266+/ksqCz+evWLHCz8+Pw+G8ePGiW7du48aNq6ysrKioCA4OdnBwGDRoUFBQkHL0fBMEkZ2dLRKJqIdlZWXDhw93cHAoKioiSfK///4zNDQMDg4mFZ9CZs2vv/46aNAgyal6lJSUlE6dOk2bNk1pGhGUV69eBQcHh4aGUvtVVFQ0cODA7777jkpVilAolHxYFdGff/65detWqqmbnZ3t7u7etWtXyQHdFy9etG7deunSpdTD8vJy5fidp+Tn59va2p44caLm0X0LCwtvb2+qtXj79u3r16+Tik/xsobP53fp0kVyokFN9+/ft7GxiY2NJZXFrl27LCwsRo0aZWtr6+LiIumEMjMz8/HxoQ4AK4HQ0FB/f3+qiioUCgMCAhBCt27dksxw7do1LS2tkJAQhY5USm5u7rVr16hDGdevXy8sLPz999/19PRq9ugfPXoUIbRixQrJ+ahKQPGyRiAQ9OrVa9WqVTUn5ubmUp3zGRkZCv1xrHmt4NmzZ7t16xYRESH58I0aNYrqKL13756RkZHCnWHxKUmfGpfL3blz59OnT6mJbm5u9vb2eXl5kjlDQkI8PT2VYLyhf//9t127dnv37l22bNmIESMKCgoEAoGfn1+XLl2og1DUW+/o6BgYGAhZI28ikejp06d37tyhGrF//vmnnp5ezcOBs2fPXrx4ManIRCLR0aNHx44dm52dTU2ZN28edbFPaGho//79d+zYYWJiEhAQQH3+bt++LbkETBGJRKItW7b07NmTeh+FQuGUKVO6du1KnW+Zk5NjZWU1fvz4ml825Wgdi8Xi5cuXI4SGDBlSXFxMTeRwOEOHDu3bt++TJ0+ePn06YMCA8+fPK83xU4XJmpycnKlTp3bs2LFVq1b29vZRUVFU/5mJicnevXvv3Lnj6+trZ2dHjaWguCoqKjp27IgQmjRpEvWlKiwsJAiCGh2CqmD/9NNPCCHluIKZx+N169aNTqf379+fahsWFhY6ODgMGzaM6o6JjY1t06bNkiVLlKapKLF58+bevXt369at5q9FRkbGiBEj2rVrZ2xsvHDhQmXqk1KMrBGJRBMmTPDw8EhPT09JSfH09NTT0/v333/LysoWLVpkY2PTp08fHx8fJbj4QCwWT548+bvvvmvVqtXChQslv2nu7u4rVqyg/l69evWoUaNCQkJIpbBkyRIXFxdzc3NJ2zAxMbFz584zZ86kqjOXL1/u3bt3zcE9FZpIJDp37tymTZsKCgqKiopGjx5ta2srGa2VmuH27dtKcwmbgmVNQkJC+/btnzx5Qj2srKx0c3MbOnQo9VnMzs5WpjMsTp8+7eDgsH//fhUVlT179lATvb29XVxcioqKoqKievbsqUyXXERFRVlbW1+5ckVPT2/hwoXUxHv37unq6q5fv556mJqaqhzjXYlEogULFnTv3n337t1UnSUrK6tHjx5jx47l8/llZWWbNm1Sgp9MRcqauLi4q1evSo4lvXnzRk9PjzqTkvLo0SMjIyMFvUS7lidPnuzfv5/qhKI+fL169fr33383btyopqZ26dIlkiRfvnzZo0cPXV1dCwuLo0ePkgqLIIgbN24sX75cUk8pLS11dHQ8d+7c33//raKi8ueff1LTT5w4oamp+c8//5BKZO/evdbW1rVa+s+fPzczMxsxYsTAgQPHjx9PDaukrJpR1sTHx3t7e5uZmampqRkaGvr7+1PDO/bv33/MmDGSo0vZ2dmtW7emrkhQaK9evTIxMcFxfODAgWfPnqV+vf38/ObPn0+SpI+Pj5GR0X///UddCHPp0iVFr9EkJia2b9+eRqP16NEjODiYStjly5dTVxiuXbtWVVWVOvuZIIhLly7VOl9RoQkEgqFDh9Z5St7z588DAgJ27NihWIPRKHDWhIeHm5qaTpky5eHDh/n5+du3b2/VqtXAgQMLCgqio6O1tbVnzJiRmJj4/v37mTNnjh07VgkOSXA4HG9vb319/Tlz5vTq1cvNze3hw4c3b960t7cvLCwsLS0dOnSolZWVgl5o9ymBQBAUFKSlpbV48WI3N7eePXseP348JibGxsaGOm1v1qxZBgYGynfhKHVSmJOTU61DpXw+Pz09nWwxmj5rhELhunXrTExMajUQ7t69q66uPnPmTOoKQ3NzcwsLC2qQJIU+1ltTUVHRgGrx8fErVqzo3Lmzt7e3gYHBxYsXSZJ89+5dr169mv84sl9PIBBMmTLFxMTk+fPnJ0+etLa2HjRokLq6+qFDh6gm1YQJE8LDw0ll8e+///r7+1MHttesWdOhQ4eEhATJs1u2bJkzZw7ZYjR91mRkZBgaGrq4uHz61LZt21gsFvXDXlhYeOXKlQcPHijTABFU57eZmdmECRN4PN7Lly8nT57cqVOnc+fOUc+WlZUp09lc1Ps4aNCg3r17l1b77bff7O3t//77b+pZsVisTCeVvH//3szMbMqUKUKhsLi4uF+/flZWVtevX4+Pj1+/fn23bt3u379PthhNnzUkSZ47d05VVXXNmjW1piclJZmamlIDJiixe/fuaWlpLVmyhOqqSEpKUo4jL5+TkpLSsWPH0aNHUyfO1LywS/k8ePCgVatWVE9NWlra5MmT9fT0unTpMmjQICXr/FaMrKEGRmAwGDVHCKaOy1haWoaGhpLKLiwsjM1m7969m2wZ/v33X11d3cDAQOU7T6+srGzNmjWSqw2o0a91dHSOHDlCPUxNTU1ISFC+HVeYrBGLxT/++GOtI50HDx40MzNrCf1nBEEEBwerqqpSA5i2BKdPn2YymUpzXiLl5cuXSUlJjo6OgwcPrjmI16JFi7S1tamblLVYqFkdl3F3d5fcHuDevXsdOnRQ6DNKpBi+W3Knh5Zg27ZtypQ1N2/eNDU1pcZ7trCw8PPzk/S1RUZG6urqurq6Kt+VBwqZNdS5M9bW1g4ODgcOHDA2Nl6/fn2LqmoKqzV1KcA34/P5SUlJHh4eISEhVN92dHS0np7emjVrqIcLFixYs2ZNXFycMvV8fyusKm+ak/j4+BEjRvB4vC1btnh7ezd1cQD4sqSkJFdX1/Ly8qSkJE1NTWriuXPnZs2a5ejoiON4WlpaWFgYdW1ti4WjZsbKyurIkSNnzpyBoAHN1ps3b65du4YQKi4uPnnyZMeOHX19ffPy8m7fvi2Zx8PD49y5cxoaGu3atTt69GgLDxqEULOr1wDQ/IWHh8+ZM+f333+/fPmysbHxxo0bWSzW7Nmzb9y4ERERYWZm1tQFbI4gawD4ZgKBYObMmYcPH543b96WLVtoNBpCiDq4wefzr1y5ImlJgebbhgKg+WMyma1bt+7bt29MTEx+fj41UV1d/cCBAyUlJf7+/qWlpU1dxmYHsgaAb8Dlcnfv3h0REREUFHT16lUMw2bMmFFRUUE9a2xsvH//fgaDIRAImrqkzQ5kDQBfKzU11cPD4+TJkyKRiMlk6uvrHz9+PD4+ftGiRQihV69erVmzxtLS8tChQwYGBk1d2GYHsgaAr1JaWjp//nwTE5MrV66MGDECoapz08zMzA4ePHjlypXvvvvOy8uLOh0Mx+FrVQfoGwbgqzx48MDT0/PNmzcaGhpRUVFhYWElJSXz5s0bOHDg06dPDx06NHz4cDc3t6YuZvMFWQPAV3n//v2oUaM6duxIEERcXNzQoUOLi4vj4+NjY2M1NDSaunQKACp7AHxWWVnZyZMn9+zZk5qaamJisnv3bgzDzMzMIiIiDhw4sGbNGh6PV1RU1NTFVAxQrwGgbjweb/Lkyc+fPxcKhWw2+8SJE71796757OzZs4VC4cGDB+l0epOWVDFAvQaAOpSXl4eFhREE8ejRo/j4eFtb24kTJyYnJyOEKioqTpw44eLiUlJSsmHDBgiarwT1GgCqFBQUHDp0aNq0afr6+gKBYNq0aU+ePNm0adPo0aOpc4K///57oVB45coVHMfnzZvXvXv3mTNnqqurN3XBFQbUawCoUlBQsHHjxgULFgiFQiaT6erqmpqa+uLFC+pZdXX1/fv3FxcX+/v7i0Si/fv3L1y4EILmm0DWAFDFwsJi9+7d4eHh69atQwhNnjx59erVISEhMTEx1Aympqb79u3j8/mVlZUYhjV1eRUPtKEA+J8dO3YsXLhw3759Pj4+JElOnz793r17ERERJiYm1AwikQg6aKQDWQNaKLFY/Oeff3bv3t3V1VUykSCI+fPnHz169PLlywMGDCgpKfHw8CAI4uTJk0ZGRk1aXoUHbSjQQolEohcvXvj6+j579kwyEcfxdevWDRgwYObMmVlZWdra2ocPHyYIQtJxA6QG9RrQchUVFY0cOZLD4dy8edPQ0FAyPSUlpVevXuvXr/f396euhFJTU4OmUwNBvQa0XLq6ugcPHuRwOL6+vuXl5ZLpHTt2HDRokKQuo6WlBUHTcJA1oEUzNzc/fPjw3bt3f/75Z8nE0tLS169f1zxLGDQcpDVo6RwdHfft2+fn50fdoovD4axcudLS0tLT07Opi6ZUoL8GgConTpxYunQpm81GCA0ePDg4OBjGu5ItyBoAPsjLy4uLizM1NYUbITQGyBoAgDxA3zAAAMnB/wFclXXJqnkjIAAAAABJRU5ErkJggg==\" /><br /><h4>Caption</h4>Figure 5: Conversion time in seconds per page on our dataset in three scenarios, across all assets and system configurations. Lower bars are better. The configuration includes OCR and table structure recognition ( fast table option on Docling and MinerU, hi res in unstructured, as shown in table 1).<br /><h4>Annotations (ibm-granite/granite-vision-3.1-2b-preview)</h4>In this image we can see a bar chart. In the chart we can see the CPU, Max, GPU, and sec/page.<br />\n"
+      ],
+      "text/plain": [
+       "<IPython.core.display.HTML object>"
+      ]
+     },
+     "execution_count": 4,
+     "metadata": {},
+     "output_type": "execute_result"
+    }
+   ],
+   "source": [
+    "from docling_core.types.doc.document import PictureDescriptionData\n",
+    "from IPython import display\n",
+    "\n",
+    "html_buffer = []\n",
+    "# display the first 5 pictures and their captions and annotations:\n",
+    "for pic in doc.pictures[:5]:\n",
+    "    html_item = (\n",
+    "        f\"<h3>Picture <code>{pic.self_ref}</code></h3>\"\n",
+    "        f'<img src=\"{str(pic.image.uri)}\" /><br />'\n",
+    "        f\"<h4>Caption</h4>{pic.caption_text(doc=doc)}<br />\"\n",
+    "    )\n",
+    "    for annotation in pic.annotations:\n",
+    "        if not isinstance(annotation, PictureDescriptionData):\n",
+    "            continue\n",
+    "        html_item += (\n",
+    "            f\"<h4>Annotations ({annotation.provenance})</h4>{annotation.text}<br />\\n\"\n",
+    "        )\n",
+    "    html_buffer.append(html_item)\n",
+    "display.HTML(\"<hr />\".join(html_buffer))"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "---"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "## Describe pictures with SmolVLM\n",
+    "\n",
+    "This section will run locally the [HuggingFaceTB/SmolVLM-256M-Instruct](https://huggingface.co/HuggingFaceTB/SmolVLM-256M-Instruct) model to describe the pictures of the document."
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 7,
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "from docling.datamodel.pipeline_options import smolvlm_picture_description\n",
+    "\n",
+    "pipeline_options = PdfPipelineOptions()\n",
+    "pipeline_options.do_picture_description = True\n",
+    "pipeline_options.picture_description_options = (\n",
+    "    smolvlm_picture_description  # <-- the model choice\n",
+    ")\n",
+    "pipeline_options.picture_description_options.prompt = (\n",
+    "    \"Describe the image in three sentences. Be consise and accurate.\"\n",
+    ")\n",
+    "pipeline_options.images_scale = 2.0\n",
+    "pipeline_options.generate_picture_images = True\n",
+    "\n",
+    "converter = DocumentConverter(\n",
+    "    format_options={\n",
+    "        InputFormat.PDF: PdfFormatOption(\n",
+    "            pipeline_options=pipeline_options,\n",
+    "        )\n",
+    "    }\n",
+    ")\n",
+    "doc = converter.convert(DOC_SOURCE).document"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 6,
+   "metadata": {},
+   "outputs": [
+    {
+     "data": {
+      "text/html": [
+       "<h3>Picture <code>#/pictures/0</code></h3><img src=\"data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAA0oAAAGOCAIAAAAmXmQxAAEAAElEQVR4nOydBXxV1R/Azzk3Xq+7WcDo7i4BCQUEBRMFuxVUFP3bBRY2omInKgYWId1dAzbW3Xt545z/59y7PR7bgA22sbhfH/O9+26ed+49v/NLSAgBGhoaGhoaGhoarQUWtEoIvtRnoKGhoaHRkiAQAED/aTQgigZJa9WmA8LK5m6N4h3Bsv2oJuFpaGhoaNQRCIgDeQlIB4Fm0WowEAQZToRhAIKahNcUYAJ8OBhpQK1ae6eJdxoaGhoadYUQOjgSoIl3DQehAoc2GDcdag9WoSKehoaGhoaGhoZGq0ET7zQ0NDQ0NDQ0WhWaeKehoaGhoaGh0arQxDsNDQ0NDQ0NjVaFJt5paGhoaGhoaLQqNPFOQ0NDQ0NDQ6NV0UoTo9SJqtx/avT2GcHwHl/V8m1t65xtNc9kP9VWgGp+pYsJwoe1nLZWhkRDQ0NDQ6Nt02bFO0KIDKqy8UCIEMPTpEdYVr6TafaYyu8AhAz9lsjqt1XbS+7NPdesfhD3JpX74QiWlTRABEsuCBmILvwnoOcAEKySIDEWACGI4S94hxoaGhoaGhqtgLYo3kHIWEtSkra+KTrLiCKj8Tpv37DeYe0n6M0hhMgZh3/MPfkPwRIBhEGczhTsF947KGa4zhRIsAQR4yjPPr59qaMix52vkRBi9ArrNPRRTu9dWYQFsYVpG1P2rsBYJARDAHWmoMDowSGxYzi9t7UkZc8fDwS3G9Fh8INYcl3AJTgqco5vXxrUbnho/HhFiMSH/3vBWnRiwLRPIMNrOjwNDQ0NDY02S1sU7wCEklBRlLHFJ7SXb0h3QLCjIvvkzveKMrd1HfWMwRxcUXi8LO9QWIeJHG+WJEdF4YnD/63OPPpTp2ELvYM6QwAl0VacuZM3BgREDQSYSngEEN7ohxDrNpZCCB0VOcVZO0MTJhi9IwmRKgpOHF73THnBscRBD/B6n/DEKRb/eKCo9yBENNc0IRAxAECqPjxTPoMQAYioGEkPRwCEsmQrzt5l8U9QtpUAgIFRg70COgCqQYQQQipTqlsRRVVZrQkQUsrwaBnFNTQ0NDQ0WhttUryjQAjZ4HYj2vW4AWMJABB4fPX+fxfmn1oX3W02gEBnDozrPdfoE0VkkWC5OHvX/jVPHNnwQu+JS3XGQMXUigIiByQOfogom1OoeCZX865jOGNE52mBUUMw3Y94fNvStEPfBMeOCogcEN1lJkQMPToholiBGB3DGly2fFlyGczBkJpxK/eMGE4S7C57AUK83hykyHmqiMZSAa6KoHYjAMYQMlhyYixxOi9ZtLtsBSxv5o1+bjOxIvNBpzUfS07eGMDpzFgWm67hNTQ0NDQ0NBqZNiveUQjB1AKr2Ft9QrqzvNlenqGIaNSbTXG2w4QQAFFg9JCEvrcf/u+FwvQtEZ2meuwDqisr1K4Go8529Cgiw+j8wvuk7v/CZSsQHKWHN7zgG9orpvu1rorco1sWW/zbE1nMO/WfLDrM/nEJ/W43+8URLEOI8lM3ntq7QnQUA8h4BSXG97nN6BN15kGoA17a/i+tJSldRz+Tffz34qw9AVEDck6sdlTkIoaP7jo7ouMUQgiE0GUvSt69rCR7PwFUBIzuOis4drR6po3UzhoaGhoaGhpNSZtOjEK1XwyPWB1idNbiZFm064yB8Iw2UctLU5Oob2gvnTGgJGcvFbmU7yTB5rTmul+SaPcQ9U6DEAepZk4HICgvTAIQ8QY/LAtleYcc5VlU2YaF8vwjybuX2cszEvrdFtt7Tlnu/iMbXpJcFYjhS3L2Hl7/rNEnqsuo/yX0v6u8MOnwhudFZ1mVDu809tK0svwjAACnNT8r6df0g98FRA3pMPA+3uB7fNub1tJUxLCy5Di2ZUlx1q64vnO7jnrGO7DzkY0vFKRtRNQorKGhoaGhodEaaMPaOwiL0rcSyUUAcVrzc5P/NvnGBMYMp1/ViEsgALO8mdOZBUcJtZlC6ruWe/Kf0rz96soEgHY9bwrvMNEzuhYAiLGYc+KP8oKjGIu20lM5J9cERg32Ce4miTbEcIqnXWVUrX9Yn47DFnK8BSIkS65jmxeXFxzzjxyQfeJP3uCXOPBBVm9GkAUIHfp3UVn+Yb05pPoFIRYxnLo/nSkwccjD/hH9FfmS3/v3fFvJKa+AxPKCpKLMHZ2GPhqWcDnGktkvrjT/YM7JvwJjhtRIs6KhoaGhoaHRImmz4h1Vs5UVHHHacmlAA8MHRQ+P7nGd2bedkm2kNrCMqRmXrVSbEeIVmBgSP7YyaoEAL//4GvEQNP1JUeaOsvzDVMxi9e26Xxvd9RpO7yUJFdXOx+QXx/FmLLsQ4C0BCYjR2crSfcN6W4uTXfbCg2sX0dgLAKnK0FHorMjRm0NqURUqEEI4vZfBHIJlAULE8EaEOFlyAgBsZRmiszzj8A85J/4kgEAA7aXpWBKILEGG06Q7DQ0NDQ2NVkCbFe9oHERU15lRnWdgLLGsgdVZFCc52TMPsRsIGZe9QLCXGL0jaO46Ba/AjtHdZrsDIJSEdmcEqBJCGFbffuD9/hF9iSyxvJnhjITmSakWx1q5MvXzU94ixCKEsCyo6fH0pmD/iH7qOQPIRCRO8g3tLUuOcwlj1aJlqy6KYBExjE9IN50xQNXVBUYPNVhCaMY+LZeKhoaGhoZGq6DNincUljPpDP5K5CxRZCkPOUhVvtEEI1Bxj5Oyjv+OsRAYNdgtBhEiY1k4HTlbO5DTWXSGAGX/GMs0xV317MeVu6NRFEQ5qGAvkiWnzugPEaMzBUqCNarL1Yil+YolV0VB2iY1N8rp86wzOpq9hfeP6B8QMwzIIoCwJHuP4Cyr+x40NDQ0NDQ0Wrx4J8uyzWaTpHMLMedHkiSDwWCxWECzipwl1VVup7+TXLLoIFi2l6VlHP4h48hP0V2v8Q7pdqZ33cUdxYOCtE2hCRO8AxNFZ1lm0q8sb/YK7AgRGxg9+NjmJXkpa4NjRwIIc06sPrT+uV6Xv2Hxbw8hcpRny6JTSWJXp1OxBCTqzEHph771CujA6iwuW8H+fx83+8YGRAzQfO80NDQ0NDTainhndziKiotZ9uL0fITY7HZ7VlZQYGBwcDDHKREAlw5aLIyKbmeTWUlFYfq2H69X9HYiwZg3Bib0uzO622wEGWoiJViWnOdNF0ewRI9Sa95gQjz3gBAjy+Lh9c+xnNFpyxecJR0G3m/0iiCyGBo/vqzg2KH1T2cc+ZH6C+Yfiu56tV94bwjZoOhh6Ye/c1hzeo5bDBkOy4LqYIexSN+c1jJiasmltmPJYA5t3//uoxtf3vbTHLNvbHnhMYbRx/W+GSL2rE6HGhoaGhoaGi0KSP29zul0VV5eXlBczPN8lWdYHXaq/K22NsG4pKTEZrX6+PjExcXp9XrQSBAs2w6DcxRjgFB0lpVk7zH7xZl8ompeV0Vhkq00HSh1Z2nuYN5s8ok2ekdTAYh6v0HJZS3J2as3h1gCEs7WehAie3lGReEJn5DuOqP/GUIehFh0Fufs0ZuCvAI7Osqzdv56Z2D0kLCECUVZOwEgviE9vIM6q2UqIESy5CzK3l1RmAQA8Aro4BfWh2F1BBDJVVGaewAA4B85AEKmvOCo6Crzj+hvLUlxWvN8Q3synAECKDhKSnL3ewV0MFhCaSkLxFiLThbn7HHZi/TmYP/wflSOPJ9yUUNDQ6MVAwGxM14C0kPNiNFwIAjSHQjDQFQfJyKNCwYT4MvDKAM16EGptNTxyitSSgp2V6av+kvfQOhyueyiCBFSimEBtYgVfaOIHthjibqQviCkNVCVl1rGgX4kxHfgQOPIkQQAjmXbtWvn6+sLLol4p9bkYnis5DSu+a2SsuR0eTGqDlNSE3tsTp3iCI2lPZcCDyIGIapUq02BBxmWpxo1QJwVuTt/vT0wZninoY+6j6Io9irPAEIEEVf1ESrBGeqPg2icBwBq1VqaFQUiLLkQYiFVBwqV1W8rL5aW36i8QETXpL8PRGrW5fM0qYaGhkarRhPvGgNNvLuE4h0r2+22VavgoUNslfhQmcnXQzjjlTdQ+euW/CS3MKe8lz2WSFXvZVWwU/6WASAbjR0nT3bY7QzDJCUlxcXFBQYGNvXVq9eoWFfP9i0Vrc5peKVRqWff/PRqWJbP6qhHZEUmU1Pf0WALCNXCZbWeLVFiMmq7itPL3aZeGiziIbHVvNhzS6UaGhoaGhoaLRqWWip53giABUJPwY6KaITAuDhm2DDAsrLDYd++3XHiBN+zJ9+nD8ZYyM+v2LbNWVBAeD5w/Hg2OJiKcZKUv3q1IzfXrb1zv0oAEFjWZDLZbTaTyYQQSkpKcrlcERERoA1DCOb03p2GPcYb/IDm/aahoaGhoaFx0bDkTN2b+kbVukkA6Pv29X7zTbmsDOl0+rS0tOnTTePHB//vf1JxMeI4++HDx265xZGd3eHRR81duohlZbLdXnjokDM3122ZdYt3NgCchCCEDEajLMve3t4Y47S0NEJIZGQkaLMQghjeL7wvoAG25zIoa2hoaGhoaGjUBRoPKwLgAoA5U7aTleUMyxKnM2fBAmAyhS9Zwo8eLXGcWFR07Lbb+IiI+JdeCnnggaNPPAENhvw1aw4//TTG2JacTDO8eYh3qjrQrhyFpl7jeUmSLBYLxhhCmJ6eDgCIiIiAbdg2r3m/aWhoaGhoaDSk9k71w4Iesp3bf85A3fYlW1YW4DiauU6vpx54LlfJgQO2X3+1DB1q6dcPBgfLgmCMjg694gpXSUlZZqbTZquMvaj6SwBwACBUKqsYQPekxxirpRpSU1MBAG1ah6ehoaGhoaGh0YDaO5ci4anxraqE57bSGjFmvLxiP/mEsViE8vLc9etDZs6k4bQcZwfAnp9v6dpV1utlSTK3bx9xzTW2zMzjv/wiFBeDGuKdO8RA1dFxHGexWFSNHSEkLS0NQtjG/fA0NDQ0NDQ0NBpGe+euxuXpgacaZ6mZVZKKd+2qOHKkcOPGwqNHg1gWE+IUBJnnjbGxrooKm9WK9PrMf/7Z8eijsijacnJokS+PKA33m0oUkU4QBIZhdDqd2WxWF6elpen1+oCAgAa4LA0NDQ0NDQ2Ntqy9Ezyy07mTm6jvJZbFDkfyO+/kbNjgXpOzWEKnTzfHxISPG7fnhRfK8/Igx7kqKgpSUlTNnFtv505u7JlHiEEIY3z8+HFCCMMwSCmoxXGcwWA4fvw4x3He3t6XpC00NDQ0NDQ0NFoBLAbAqUhywC3eKQGcWNXeCYJotQqEqBo+FwBOmw1xXNfHHpOczmNffHHg7bclWRasVtHlcstz7pf7o6eEBxEym81uxztRFAVBcDgcoigSQpKTkzt37qzT6S5Fa2hoaGhoaGhotArtnUOR5BAAat17dyoTGYDMf/4pOn687ORJdwzsic8/z1y/HmPsKisrT00VXC7IMGtuv12wWqup62rq7dxACBmGUR3veJ43mUxeXl52u71UIS0tLT4+XtXqNXMaPNq37pXfNDQ0NDQ0NDTOqr1ziGI5ALYq2c5toqVhFkVFclFRZVUx9W9WFs7K8hTdiCxnHDgAFe89T71dNZzKmmcTZRBCFovFYDCUlpaWlJRUVFS0CBOtLMvKVTSMkAch4HheltpEkpSGFWSVyUArl40b9vKgQitvsiq0ptPQ0GhrsJBl+Y4dZUmysWy1SmJqFK0gy6IsY6Xm7Nm0cWptU/dbVJALnE4cEEhMZoArYypMkuQVFnaOU1Fd8QICApxOZ/MX7xiWycrKe/qF97Ky8yCt39oA6HTc/PvmDBjcU3a15qJhEMKKCuuBwydJVd+4SAgAIcH+8bFRrXXQhRBabfb9B483VIspWnOuY4dYLy/qJgFaLwjCsnLrkWMpoig2lK6dZdnOneK9LKbW3XQaGhotGtbo6zt8yRLB6QRKUTI37mr2FeXlNrvdaDCoA2elco6Qyhlx1UL1DeY4dssG/UdvuWbegHKynFddRziu8iuMDVWZUMA5h2GGYQRBIIQ060THyoj795qtaenZDbjXffuTvvj4pYFD+8iO89e0baFAAARRys7Oa6jRkRCQm1eIMUlMiKGFwVuhgAckSc7OzpMxbqhbghBSUWEb0K+b2dyaxRQIIe1sOfmCIDTU84QQYrPZ+/ft6uVlluVW23QaGhotGhYxjN85s81ZbRST2axqDqqEOvf/KsdS9Q3meP0vX/McKr/2Jv7HrwSjDscmAMWCScFYVuyzquh2DglPXb1Zi3fKyMFx1HmxAUlJzZx10/yvP3114OBesksNaGmdNKxvJcH4wMEkCGD7hOhWKuDRFmswPwCFgsKSrTsO9O/brdUropBCAz5PlKbbP7B/D0urFo41NDRaLucfYmVJwrKM1b8eL6L+xVRkO/0SRVBSLBuMmOWF3gMww7g3JEqorPqQ9fzbzGW4uqNeUX2peflp6TnX3/zo1s17GIMetA0Ux01Yr5eaPfH0HpTZwoHDx08kp8OWEJRzsdB+U89XjZ7GMKioqGTHzgNWq61FRDI1FEpb1LO/nQnDoOLisu07DlRUWBmmDTWdhkYLgmUZlmPUfB0cz9CKWVVAeHoJo6zWakQRN3VVPlVTtqkfa2rg6MjK66AkAlnEMbGAYTw1KWfT2LUCl6nAwMCFCxdGRUXVayqPEDp+/PiiRYukM8MpktuMDo8Q4u1l6ZgYW99biwCQdPxUSUmZe0MIIZblfQeOQQjiY6Naeo86G4QQg0HfrUsHRao4d6OdVq4r+SaZgqLio0kpjIckhxBqOzo8QojZbOrYIZbj2Hp1DwRRQVHxiZNpZyysbDpNh6eh0RwhhPy76ufCvNxJs66rKCn586fvevQd2L3/QIwxQig/J+fPld927tG716AhG/78Izs99bIrr/INCGxNN3I9xDtqG6pVpPMQ9SCDcGAgKC9DggvYHTggACkufZ5bnbH+mXtruUOyyWSaNGlSfHx8fTfcu3fvU089pb73bA1Vh/d5a/fDIwTo9XxkZCiqr3hHSEZGTnFxqVu8q+xOGO8/kAQhjI+tn6jdgmBZNjIylGUgll1niXWi7QERBxGnZLGkQIbBNKnlGbebkqKoUofX6v3wCCE8z4aHB+t1fL0eNRAhmTZjpXgHIcC4sulUHZ7mh6eh0axACEmSuOLt13IzMydefe3xQwdefezhBS++1nvIIMEFWA6mJB195dEH733qud5Dhn370XtH9+8dPHZCQHBQa3r+1Um8q4cJFUIS1Q7a7SgrAxYVkYDAakY096BSc1N1eQtVkKr5mS9gQ8+tOnXq1Ldv3xUrVqhjTxvR4RFCw25q9pPzbXVaNcUwTEx0eEZWrsvpghDKkrx331EIQWy7SIJb6oThnEBZcpUmfVye/gek0e213k2Ys7QL6PoIb2kHaMojwHhMHjDGQYF+BoMhNT2L1o1pSzo8rFA/7Z3HzJMQEhQYgBiUnZ2PEJ30ajo8DY3mhigIRQV5FaVlAcEhsihlZaSxLGu2eDnsToRYu9Wel5XBsKyPn39RXl5ZSYlfQBAgRBAkJQ9GKxk16uQ14pa6qv2tZTkBJDyKGAzstg2ouAAySF3Pc/2aW9Vc3kKFvItEp9O9+eabt912W5v1w0MIMSxTHWXJObbCGEeEB/fp2ZllGYwxRBBjvG9/0qnUrFbpUgYRK1acKjv1vWhNx85s4qrxErJlR7Yta7Mtd22tWXsIITqdrk+vThHhwbIikbRZP7wLUQHquL69O4eHBauBYpofnoZGM0JRq//6zRd3XjU5LfnEySOH5k4evXzJy7Isf/Dq828//7/S4sLHbp3z7otPY1le/tort1057tjBfaknjz9w3VV7t21mubrewm5f+2Yrrpxfe1dN9jqPHo5gEBJOwiO5n78Vr7oOcrw779159XaeR2y5VlpJkn777bdqvnRuWJadNGkSy9be7LIsm0ympUuXEkI++OADdWEb0eGpv3tBYbHN7qxmqFUjcsJCA89xFxFCIiNDZVnevfeImuFMFKU9e49ACNpFheMW253OhlImUCYAiCgYsvrq000CISiAsg1g4eypKgmv0/Xt1QVClJGRoxR/bkM6vIuBYKLX6fr37QIAycrOUx/xmg5PQ6OZQABgOQ4hJAouH39/vckk5uawLOfl46Pj9QAinV4vCC6GYb18fSGEkiB6+/qZLV4MYuqiukMMw/PAZnW5nC4AiMFo0htYmsytmd349fC9c6vWavWcq1xCCPHzx7HtuR++EPUGyHJQFNy+d3XxwGvpqjuHwzFt2rSziacQwrKyMovFcrbNJUnS6XRLliwBALglvDbih4cYdORoyqm0LPZMXR0hhOPYaVeMObdHPMFyVGQoAWTX7sOSJCMEZVnes+8oBLBddLiqo2pF0NtEkMDxU7lOV3XLNsagQwzrazzPLgjGOh3fp2cngnFmdh6DUNvxw7tIMMY8z/ft3QUAkJmVqyiZNT88DY1mgCJlXXXTDVFx8bdMHD1jzq13Lly0YM61u7dsWrzi23YJCYSAlz5asejOeRv+/H3Jp9+4XM45E0aOv+rqx159Q5ZkSTzXnUs9blmUnZ6xcsVHe7ZtHj5+cn52ZtKhA5dfNeuyqVeZLWZJOqM0V8swztbVREsIMBhI997EaAJ+lY535zfp1ra8LaPq8DyttKoOb+vGXYyOv6Sn1qwhhMREhffu2VkVBKkOT5B27T2cmpFd39CNFgGVdWl+8VpedXQfIYTo9bq+vbtERoSqEolbh1deoVlpzwXGWK/X9evTNSI8RJWD3To8rek0NC4ZEEqieGjvvt2bN4qCaLOW79ywIT35JMMwp44fKy8rLSrI37Hhv9TjSQzLpBw/tmvTBofd5rDZUpIOn8dsCCHLoR9XfDJrxIB3X3xm27o1uRlpKUnHtqz5+4k75tw4btjOzRt53WndBMMyRtPpl8HE1NfFvIm0dwihOk3laYooBIxG6HAw2zfiiVcShOqbZbZFK/AMBsPKlSvPYZw1GAx12Q/HcW1Nh4dl3KljbHR0WK3GWYahgdvn3wnG7aLDCCC79x6WJUx1eBK12EIAo6MqJZjWkyFFz/XtHU+Ns9VaBiLJniZYi+qyH6zp8C5Kh8dpOjwNjeYDgtBaXrbojluPHzqAsfzle0u/+fA9weUkhDxyy3Wvf/F9aXHRU3fPcznpkodvvIYQ7HI6f/lyRWbaqbe//UVvNJ7NxsqyaNXXX7348D12m01dwrAsy3Hq+6P79z469/olK77tOaC/KMi8Du3atHnF0tfdm+v0+qeWfqDXVxYAa47G2fOth2BFKbNmNTCZmb9+lWfNwZ27A7F+HmMtV7ZTBbgrr7zygjf3vHaTyfT2229DCD/44IO2EEtLYxKDA6rlSnRT9+slgMTGRBAC9u4/IksyNWK6hJ27D0EIIiNCcKuJpSWA45joqFBgtHh6uFIYtuBkQWFFncQ7tw6vX58uaC9Kz8hpa7G0F4PadP37dgUAZOfQ8tOaHx5siMjDBtmJRhu9JQ3GmTfPW/X1Fwd3bb/y2ptMFsuPK5YHh0eMnzYzIiY2KDT06lvu+PmLT/yDgi6/ata+HVs3//vX5TNnDRg+imHZs2mjeJ7Zt2PnywsecMt2NclJT3tpwX3v/fi7j58fw8Ds9LR/fvnRc4UnXnsbGowtQ7yrJQZCx8PNu9GBveJDi5iP32E/eVd8/g3A8UAJMav7sUCLxel0zps3z+msXbum1+uXLVum1581DLZae7Isu3jxYkLIhx9+qH7locPrLTtcoJX53h0+WVBYXNOwxTCoT68uLMvU5cZQTZOxMeGEkH37j2KZJrGUJGnXnsMQQsUK2YzcIy4YCKHDIWzdcUDGLIDVQyt8jdY6R4C5dXi63j06ERln5uSjtpQPr4F0eF137gHZ2fnV8+FZzK3O7/Nc0NjhhjJMQ0gkqfXMxzSazKxhNM66dd7Jo0dSko7ecPcDHM//9u2XPQcMvnvRE5IAWA4YjHf+/fP3XXr1u/d/i5Y+/dzOjeuuvf2e3oP62G20gGrNfdLwCxmv/uHr4sL8cx/9yL49W9f9O+nqq6lEqNcbTWb3VwaTqcFujbrBXrDU5RkMcXqp04G+/5wkdCQ33Iqdduatl/Dgkfiq2TQN6JmBFNWz0Xr8bdHinSiKX3311dnGQoTQu+++ezbxLiMj4/bbb6+WBIRhGIfDYTAY7Ha7usStwxswoAc+ixW45UbOpqRmseyZoRWYZqPt3bPzObY9fiI1IzP3jPm+UklKr+dtNodaksvlEnbsOgQhDcJtuaHZp4FAFHFGZmGtoRWJsYzf2UMrEEKlZRU7dx+qpiGBiDYVyzCyTLWeZ+jwzMbWF4B8AUAIS8vK9+w9Wn05zYFH9Z5q11KbbtuOAwP6dzebmm6+fmlBCP27btvmrXtrTcdTLwjBYSGB182abDDoW8d8TKMpsVmFjFPJCCFer8vJSC/MzzN7eWGJpqdgGCY/J7sgN8fs5SUJID3lJJaJwWRyncPjCUK71frPLz/V/KaaI5Ykiqu//2bsFdMRQqMmXrEtu7Ta+k05T77wtMa1lJ3gOLBpHdqxGS98HhpN+Ibb0NaN3GvPCnEJoGdfSOOGzx5y6yHztXQJ74IpLi7+9NNP67JmWnrOsk9+GDi8L2hF4t0FQwjJzimo1ZgD4emkRAghp9N1MiU9LDQAtHhoVmeeBeGBwCVUF+9oLRBOEcbOHsFts9mTU2q1MkC1FrT6gWFQQUFRTk6+V/t29XWibZVACK1We0VF7QYaT8UzVX8Wl2Zk5nbuGCfTJDatHPW5/cdfm15f+llD7XPvgWMvPfuAl4+XLFxI0niNNguEcM598x02q39gMM/rXvv8u7jETqovrCThqLj4Vz/9Oia+vSzjmbfcPmbKtJDwyHMIXgjC0qKiovzc6ssR03fIcEDL4VSGPGJCYuLbU2OIgdm1advnb7/hXpnX6Z98671m6nunntNZS4oxDFXdffo+iWxHRk8Aogi9ffELbzD3zeUevkNa8j7u1Q+6XB4XptSFV2oPUDeL1jJycBw3e/bscxhnuSpPTDcXdu1Sq5vREkICA/yqjZEqDHOe1JEIwfMVYKWo+2j5fY0g1oJYE8uWhgSc7XJot+LMwYjXAaxcNsMgjoUsAxX1MCQ0MUpd2qJF56FsDOo+/2yDTcdx9bAInZf3ln2XlV3w/ltPhEaEtj5vY41GQo3G6z98KERAcOKAkNCJM6dLIpBEOmhiTPwDgy6fMU1d0mvgAMQAl/M8lWwwrsVuu3/ntufe/5hh2Oz0U0g1uxHgHxysOFbB7LTUv3763nP9x5e81Ux979x2h2rPrEpRj+PBhjVw20a86CXoFwCcDiBj0q69/NJS9MQD7CN3yQ8+jkeOBxwHRdqoRJKo1Y1AyLKE5+leRNFtnG25z0S9Xv/55583wYFan4JTjZwFMK7Wb2WplrtLSQxyPkgTR6M3OgRLvFeMOerOE6u/F13i2S4O8d5Wu8zu/E0tO8swqLCo1HYylaHB7AAa9cb4SMBztG4bbP2NdvHU9ZGkNV2Dsur3dWXlFR+8/VSHTvGtzNtYo1ERXJUaECLLzkrPpkowxu4lgnB+RQkmxMfP39vXryA3x3P5zo3rX5x//+hJU/744eui/Eq3vEGjL5t9610AtxzfO09hopbiEwiBijLwyXukS3cw4QooiVSZh2hFMtCtN37pbbTwPvaeOfjyqSQ2ARQVwrIS4LDTeAvEYKORhEbKo8fTGFuAW5/Ucm5iYmKWLl1aF+cShNCGDRu+/vpr0HqpmUhCrfLkuZwuUTpJXGxkcJD/eTsMRLC83Jackt5y5wzVgAgKVvu2D5KO/V4KULWoCmpHUJ9HEDgI+QwQ6kWnttJp64MyhQob1b/PQzdSf7saDQMRysjMyc8vaq33I6ShPDVSSOpZIMpKNRAPeAZAEOUfoOvVXV1AALDJZ9ckQZCdXZCTW6BolNs0PXr06N+/f93vOwjhli1bDh48WG35fxt3Tbv6/k8+eLbfgO5YEFvLfazRciDEZDYPGDnm16+r627W/7GKYZgFL73+2qJH8rIyIUTjps3QG3m7XW4Zvncqbr1aLZ5zLIvX/gX27YSvLwN+/tQyW5BPUk7AIwfAiSRQmA95A+g3GJ04BlZ+DcwWPON6PHYS8POjOryyEnjiBLfyK9HHB0fHQlluzkXcLiaWdsCAAQ899JB7+QsvvAAAWLhwoWf64nPD83zrFu+qgRh06PBJAEDnzvFYTbqrVLYoKCzmOLZfn67hYcHnNy+yKC+nMOVURquJ/UQsW5Kanb5tD8FikL+fUce7gwsRBIUlZQCAAF8f1fkOQVhcWm53OBmEgkKDVEHP4XQVFJcW7TwUGxHCmQygZnAiy1RU2PLyClvTnegGQmiXxduOrHTKYpWqDQJBAm/sBlPiQZcAIFV1FY4BX9MoCji7I5SUViJAz7AfJk7RM1ztfQ9Bh92VnZNfF2+B1s3kyZOfeeaZem2yYMGCmuIdDUg8lnzVtQ8te/vJcRNGYMWNu+FOU0PjPCglHNkrrr1hza8/2a3Wat+u+fUnCOGDz7y0+PH5eqNp4MgxGAOa927z1pbhe1eT00Iew4DiQvDJe2DQcBAdB3//iezfDdJS6bMtJIx07wViE3BoOPH1AzYbXP0z/OtXuGU9KszDI8aRbr3oa8zlMOUEMBgrH7Sta0Rxx9K6XC5P8e7ff/9Vxbt67Qq0JSCEeQU0eVsXmHBGdO2pTINB17tnZ4TO4zBBu6fcpBOmpoFgmi/Cy2wcNaCnn4/FfYEsy6xZvwMAMHpEP7U8Dssy/23anZqaqee5cUP6qK5RJWXWH/78j2Aiy5jBmNpnz4SRW7CDxHmBAIgEf517EEtVUccQAocAfv4XxBSA4GjgrNKmG1jw13r6ZowIHEoYEyGI1b2VcLkOMrWGEkOlNGOTXk9z5QKeV56b9OvX7+TJk8XFxerHjMycq29Y8PbrC6+7ZhKhhada202t0ZwRBTxw5Jg59z78zgv/q/ntv6tWSpJ49xPP+AcHRcTESKJsMDItxvfOTfXKs8pn+efvwIHdYNR48Pky4OWF2nciU68BEdHEYqFhE5IEMaYaAqOJ3HwXufJquGsr2LiW+exDxuUkgcHAOwB37yZPnwUEF+T4VibemRQqKipMJlO15ZfupJopVHHraStkGV711GYZRl3IMhzH8jzHcRzLMIhlKjVPkLrutbVhlYb9cyzHcRhXiiMsy6rGWY7j1PvIvUR1e1fFu8pWbcNAAIxGvVWiiWCUzxBAxTPaqKcv5BbvOGBUyswYDQAqkgchRlbXqp5QFwTDc9V9DCGkkYRn5nW6GKZOnRoVFXXHHXeUl5erS8rKK+6499mCguIH7rmBUdL3NNSxNDTODZ1RyHje/EclSfrs7dcd9uqx8wd2bp/38MJ+Qwc47JXdssX43tWEynYAQFnCqSnk7VfgZZPRg4+TsEhiNAKGqZTq1GQoqrueksAMCi7i5U3GTiSjxgOHExTkgpxs+kVYBNq6CWCZjLgMcrqWK+FJkvTbb7955sJxOBzqlDQ1NfW7775zL8/MzAQAeC5hWXbKlCks20aHXlUzZ7M73eIIw6Cc3EI6cU/NkhVdFMMyOTkFBYUlOh1/Ki1LrS1bFXXrazQ2nd77kgNp3jspIyu3pKTMfdUIQYdSsC45JV11WGQYZLM71PlYalqWOvpa7bQgD2jLyARsyAQuZ5V4B4DqYX2I9jfgLivOI1DkoG/+OVW5kNpp9KAXuYhnZ4sHY3xw7xFBEM94UEOAIMrOzmuoowiCMHv2bAjhbbfdVlFRoS602uwPPvpqTl7hU4/fZTLq1MeChkYTQAhhWf6+p54dPOayHz5ZdvzwwZLCAsQwQSFhA0eNnTzruqjYeLds57DLw8dNXHuCjvIqEECDwdhMfe+qQVxOsHs75njywxeAYdEDC2GHTgATqJh8oOLc7Z7eqVG3lRdGNXk0VQM06OXIaBDdjkbu2azQbAEE0wGqpYp2FIfDMW3atFrHzm3btl2tJLP2xHOJ2WzOyckxm0/L+20K1a/uVFoWW6UAYFnmaFKK+t4trBw9lpJfUMLzrMVsUgMvFKlaHjakt9lsajsTeupA5nDt3HVQyd9ciTsj9MbNezxXVlQdeNuOA+pHGoRca8BsGxKNZfDiduARIaEDgH5YdYq+PCCAIAD453e5b2k9ZwR3y0APW0GKnQtAmUKI1978aH5Bcc1sqDbrmTGKF4H6FJ01a5bT6bz33nutHj5Pr77xaUFB8ZtLHvPysshtzGVF4xKCKbDvkKF9hgzNy8ouKSyADAoKCQ8M9hMlmt7Bc2VqWKnKh+fevCnP9gLFO5KeKn+zAkbHAgjxqh/QgqdRolpUgIp06j2PICJVZjaXiwa0e6Z8k2VZcDo5jqNJzggBPE8G0fSANHOK0ILzG0EITSaT55Po/fffX7RoUUFBwZVXXumZM2X69OkAgB9/PF2TDkJoNJ691EAbgJpbWUYV7yRZjo4KCwsNlCR5+LC+bu3dps27U9Oz9Trd5MtHuLV36rZtR7ZTgZDKbep8iBDCceyVk0dv3rqXEDJiWB9JiQ9gWbRpy97UtCy9XjdpAm0xAEBphXXlXxvbelFPPQtspx81L0RFv5Ce5hw61RjbjciVEgNk+IK1K3oU8fe0u1PA9CFGMOBMrB7pCGi7vl+EkPz8osKi6lGBjcScOXM4jrvjjjtOP1cJ+fSLX/ILit9f+mRkVJiW9FijCSGiSNMRBIWFhUSEKSm9gNPtreu5ngK4dFyIJRjv2S4+ejeMjEJDRuC3X4W9BzDX3KhmlVXT4+3YvuPRRxYePHiQjj2KN8ayDz967933qT8QLd2DOI5LSkpa8PAjOdk5PM+robKQ4yDPtz6Fgre3t5qnV6/Xmz3QKXguMZlMLdcq3Vi+ZRSO1et0yovV69QFPM/q9TxftVyn19VMhtwG0SvtgBAy6PV6vU6v1xn0enfL6PW8ulCvq5ETpM3jxbCIJgvUI6MFGcyVL6MFIJYDrA/r7c16Vb0sl/pkLz0N6GNXF6677rrXX3+9mr/yH39tnHndQ0nHUhitP2s0LYQQWZJFgb6arVqh3to7vHu7/Ni9zIxr0aTp8oI7CZHZhc9Cg+J9XBVysebfNZ8s/zguLrZHzx4MQ8vAJx1LElwuhBALWEmSGIYpLyvfsWOHw+FgWVamJXuU/whRKyKBlkw1BeyGDRvUIhbVfO8yMjI037tzzHggADabvaS0AmM5IzXTw/cuP79A8b1LbdO+dypEvXMUMMYppzLsDicg5KTme3c+qinftlZUOAEQc07RpsGVvrMQscBWXiiz60s2iURZiIFO5CaQbhx9eLb1NlTnYB06dNDr9WqwXVZWVn5VfteGZe7cuSzL3n333Tbbaa/2bTsOTLvmvveXPjl0eH9MqyI1xpE1NFok9ZMkSFmpvPgZ0KETum6u/PoLeM2fzNJPUKdunus4nc709PQuXbuknqIuLFu3bv1l5S8nTpxITEyUJOmjDz9KOpY099a5HM8ziFnx6WchwcFz5s4RXMLHyz92ulzz5s31Dzh/rtpmC4QwODjY8wH08ccfq7ZpzffuvHAcazDoWVXbBGF5hfXAoST1K833riYQQr2Op42g+LkSQrZs26d+pfnenRsIQBDL2uhUqrIVviwqoHfpkS3OI1uqrZwMwJvpH7o/mk3Gp8iNBqBzC9ZtGY7jli1bFh8fr4p3zz333Ntvv90ge6450b3pppsAAA8++GBJSYl74ZFjKbNuWPDB209OnDwau7SUeBoaFybeJR0hmRnM7JulJx8mf//GvPgWGje52jqFhYX5+fkjRo44dvRYfn7+Ky++QggpLytnGGbVL6u+/ea70NCQ5555/robr3U4HXl5eWvWrAkJC0k+mZycnGy32b/4/IsHH34QtFh0Ot2zzz7rmb2pa9euo0ePLisr03zvzg3GODoqzN/fx113wcvL7O1lIYRovnc1IYTodFxiYjuTQdVZEghRVFTIho27AQCa7905IIDwED0WGi7aHWr4FwSgo8FwxbEjeOj0mr53vTTfu/NNaIOVOpvUxu3l1VB7TklJ2bx5c7UCmB06dJg6deonn3ziuTwrJ//amx975bkH5t58FZQ1+U6jTlSWWqXOc3UaOKgpUsk52lKmEPUT72CHTswdD+CNa4HNyr77GRo0ouY62dk5JSWl3t7eRYVFhw4eKiou/t/TT/380y8ul2vH9p09evW46qppD97/cHZWjq+P7/0P3vf2m+/s27f/4IGDUVFRTofz6NGjnllFWhxOp/PGG2/0lDOWL1+u1+vLyso4jvPUzKlz07asq6sGQuj4iVR35Kwoy+3jonU6XhJFlqtM3oaUwAuGOnQiNYub+05rKbdcQ0bOOoU9e4+qta/U0Ip2MWFqlLqS964yrTGskfeOqwqwbZtAAF0E35l2SlaSyKi8Fd1OD4CD4SCvA1KlVhiyPC3QBpAB6ZGi5yMAcKhNt15NPB93Fxkb6Lmrzz77zNN3RQVCWKvbX1lZxf3zX/bx9po5c4IWaaFxXhiWcdodRfl5hJDgsHDEsucKhIdQEoSMlGSDyeQbEMjr+BaRkaee4p23DzN7Dpo0HRqN4CwuYulp6RlpGat+XlVUWJR6Ko1BjNFo5DjW5XKKksixrF5vUKKLZYZBeoOe1/FYlgWXq7ysrEvXLh0SO7hLZGpoaGhotHokSYKQztkCAwMjI6NkWXIoeKYgOC8Op+tY0qkmzhyr0QKBCMEta/5565knDu/d3XPAoDe/WunrH3AO4w+DUHZ21o3jh5cWFQ4cNfa+p57v2KNn85fwLsSLH55T/b53z56Bgwfce9+9i554srCwQK/Xf/ftdwf2H0hon9C+fcIvP6+C330fEhoSGBhYUFD4/bffJx1Luunmm6wVVkEUhg4fFh8f16JDIPV6/YoVK6oZZ9XQClEUPZ9WqpLSc4lqnG2zoi3GuH1CTFhYkKdx9vDhk4QQSZQqjbOESLIsYyzLWBRpA3oaZ9tU0xFCDHq+V+cET+OsrMyc1M6mGmepk11VE6ktRt80+wdTo0IA0UH0bnS7asZZJwBEFongchtnaU0UQhN1OrDTbZyVcZsOfmpwHA5H6qlTOoPBz8dn5syZI0YMLywsPHTo8CGF9PT0ugt57ryPGhpng2FRdnrakicWHDuwb+yUaSMmTtGdrw4sIcTL1++mex/avObvjX+vhggt+ew7vcFAnw3NmAZ+TmGMLV5ek6dM6de/35gxYyIiw6+74dpffvolMTExsVPHq66afuTwkRPHT9z/4P1BgYGjx47OSM/s1af3FVde0adPn6VvvvX2m0tvu+O2kaNGghaLy+V68MEHPUMrnE6nOi34+eefLZbqKRV8fHzcQokaWqHX68+2c0/Bl26FGKbG46zl1uZCCKWcykzPzGFV4xctcQT37DsKACwqLnWHVhw6fDIvv5jnWVov9czQiqiosFq8KGAt1HoCLavdIIROl3jsWArj0St27zksKS3w40//qBdDawbKmManS/Lvq9efDq2QMS3EpbZGzfaordFqtlvLarFqxtknMtNtttM5eF2E0Ibb+KNt42l3WJU9ANx8+F53IIXZaLyKrNFBM4a1PNyrNZfSvK2n6RoQjLEoiqUlJVu3rFu7+gcZMyGBFiy5HLIhIrbzwEGDRo0a7XDY09PTd+3adezYsfLy8lr9djIzM4uKaGVqDY26wCCQfOzIyaOHR1w++YVlK8wWsyjSefHpFRiGYYEsnXYVoIKNt/ctDz48edb1t0wcfXDn9vyszJiE9s18ltzA4h1C6L777+U4moXo3vvvoUV9eH7KFVP0er0sy3q9/pXFrzidTm9vb1mWl7y2WJZlhmH0er2fn++bS990OB1ms7lFO8jrdLr33nuv2mPILZZ59iGEkCiKqampTqfTXR70+PHjZ0uMwjBMVlaW+2NJaXnSwSTBw3lILfzQISGGYZiWWG8byzg+LiosNNA9FkII28fHKP7a5spsKRB2SoxzuQQlT+IZjncsg0o9ynO5YRhUXm612R1U44eJzWovK6sscOQJQtBkMqqOa6C5owS9YixjbBUlmjby9BeAFu0FQMC0DKDHEkgIKK/qlqKMBSzzslRWXsHLEo2iPROGYSqsNrvdgRANWKmosJWVVXh2KkLL/yKz2dQSmqs27R1Cr3VoL9qd7shZqnoH+JOA2D0mP77qSjEgJiN3V3zkka9ToZKUnQCgM3COCifGuGa7qV1UbTqGoX2posJWXlahTk7cMAxjNjddZfFmCCGkpKRk3fr1v//2+7GD24clWEVRTowJcdgcn67J++anvwICgiPCwwcMHDh8xHA1Ck0QhFrFu4ULF3766aeX4iI0WiQEALvVKktSaGSUwWRWrRxuEELJSUf3bNnYo//guI6d3Po5xYiEvbx9A0NCstJT7TZr8888UCfxLiUl5eDBg3XcozpAEkLcI6X7DcZYzWAsyzTps3sUV4cN91cIofDw8BZqaGNZdtq0aXVcuaSk5Iorrjh8+LB7yfPPP3+2hz6E0PPp9vvq//7+Z3O1VSEA9999/VOL7tJxXB2jgc4PwQA2hbmcEBIU6EdlEc+rUkUXz3EU0dqWQJJX/73Z4aAZ3dTFJ5PTaR28GjAIFZeWH0tKIZiWxcvKybfZlSqiNUiIj+7aOUFNEXcxl6GIX43YYljG3mFBgYmxpf9utUpyXZ4yEAAXxicFgVYDrDxHEpYQ9d/WPRDRzJTV1mcQOnkqMycnHyGIZWy1OdMzcs5sXoIYpkvHuPYJ7S52LkGwolBDTZZGjmDCGfTX/Xk614mbaQznUgXkKhgGYZt9Q49dDqfL3dk2btt9tnOFEKal52Rm5iBFvCstt2Vn58tnNhGEsHvX9nGxUY0i4TXVDXthYIyLioo2btz4yy+/HNi/NzM91dfg6jgiqneiV3SklyRZwgOZjfuK/tt/ZP+OwwcP7P79t1V9+/W/+uqru3fvXqtlQ4tO06gXsNIdQ5nnnXkDQoTKS0qevHPuvu1beg4Y9Nrn3weFhXn62GH1YXV6Py1cvDMYDN7e3p7OZI2a8RwhpNPp/Pz8Wqh4Vy9sNluxwgVsK8s0IqXm8sVvfgogeP5/9ympzhpCwiMSIDKAOgCZxh6AqaBQTVSoeQUyva8kSRYE0eU6s6h5bRCiFgqkUw5MCx+TaqoU94rHklIQRJ07xV20hCfSoyKdUhWm4VuMyNgY6DvmmbtihvWWHK46iXc0zNbFHj8lKeWeAQG8UR/SrT0GkNTmh1fZaPR/1AkSYyydafSHEMiyuP/gCYSY+Lioi5XwsIvuEembMlGwrK9R6gACjgD+zHOAiBRJLpEXRZnqjKtO+KxhdhDCqqZTupzSdDXah+w9kEQATLj4pqsJkWiZJKRvSom57uTm5n777bdfffnVyeOHOoSB+dMC2sf5d4/3jg5gkMkEIDPaR9+9c+j4MVJObtnho3m/b9n9yceHDh85MnPGjGnTpvn6+qoJ9tw7bImWCo1LBVQyoRTm5RBCjGYzg2A17R0m1GeAmjgEoWbXYhAyWiwOm60gJwehyjoOoOWKdxzHdVBokvNpczS4FCtJ8kuLlwMCGlKHh12A2AFroUJecxowFL8m+uac9xiphucleLQ/NV8eOXYSE9wAOjzZTl+sF6AmvYZvMSzKfu3C+82bQehs8vxAiKxWW+m/mySJutypqNLuWbbwaKzTjVZpH6/aJ8RY3nfgGMbyxerwIABSBUAu2mJNRs3fV3Gvq7YUqat5fHHejlFbfzuj6QCAWJb37j8KAWkEHR4ExAWk5njDHj9x4qsvv/p0xacGMWvBFb4DE019OljM3gYAReC0A1lUvA5IgJ4L6GAAnSNG9Q0c0KPw+79O/bB5TUZGZl5e3g033BAREXGpr0OjRYIQ2r154x/ff71+9W/R8e2HT5hU7e4gGPv4+T/15vvb/1vTd+iIoLBwT9UdTTjF8+Omzji4a8crCx/a+t+/M266NS4x8Sz6gktPSw8BU57HrULPxzBMWFiYTqer74aCIGRkZFQbIRpah6cMGC4b4PwBY6lRz6nBoAb6asbZ2tcDLKETqcpqxQAYTYZqAdc0eEC56xBCgigZDHqqSMHYaNCbzZWVKzHGTqfL3XQQ0hG/gXR4EGAbEGyACwTI2BgthiUZMQDWsdomhHqB51kWgcqICovF7HnbEEAcjtNNgRAyGg0GvQ5BhLFsMhqURiOSJFMb5em9Um+KhtHh0RiQEoCdtMWapdpJBSGk1+vOMStT4t8NaqlfQojadDQRlCw7nS7P1QjGjabDg3RKRm9YP8B4Nd4NWy+OHj26fPny77773ixn3TUp8NrhPj4WlpqS7Val7AoAgks5VWXSZucAb/Q2GEcNCo8MMQT4Jn/y1/GPPvqI47jrr78+JCSkmg5PQ+O8IAQP7tn57fL3AQCjJ12Z0LFLzdsOY9ytT6++Q3q5nEAQqg+dEILErj2Cw8IP7tqReSp5wPDRCZ06NttggZYu3im2OlkAiAewZV+Lv7//d99916NHj/puePTo0UGDBqm5VxpThwcBEYAzFfAhVMijD+MGHoAhhAWFxTa7U02Mcm5kWc4rKFauGjIMHJIYZzLSqpfqt1TxbjQEBPgSTBgG5eQVciytyoUxDgsLGjKwlzpOFxWXbNm2Tw3UULU5ikjXUDo8BLAVOFKALhywPup5gYYDMkx6eo67zth5VobA6RT2HzxGyzsDwvN8t64JjGKnUGEZduKEoRzLqpfLMExggO/xE6kIQVnGPbsndmgfSyuKZudt2bbXPaFSW6zBdHgAAbGQisW6CAD5ZijhYYy9vMyDBvQwViajqQUI4cFDx494m9XQii6dEzp3jCcEZOfkbdtxoFoNhkbW4QnAlQ7YQMAHKUsuTXuq15Wdnf3ll19+/Mmn4ebyBTNDJvf18jEzp8XOyh5FJ+vqNkAUgOgCTisyWDpEGu6dnQgA/PD3tA+XfeTn53fVVVd5e3tfksvRaLnIMp4x59bBo8Yuff6ptb/98scPX8++7Q58posTRKgwvzAjJTk6vr2Xj4/nA02ZzeJvP3rv0O6dNz+wYObNtwaGhIln2nabFZdGJFJjLBpoZxAAEYhWwJgBY2zZ9UMV6ruh5yZms5ll2dLS0sbS4QEMnKeAXA70MQ3uWIYYdORoirtqxbnBGB8+ctIlUMkMIcSyrEGvO53gTZZjo8NDw4KwJCEGsYqeT/lWXZn2PWVZZSckhPA8DYx0uQRlzYbT4QEJOI4DPoyKLA0qE0Mdv2nL3mtvfqRh9gZhSfZmo8GAMe0nSFWNIqVojxImRRtNaWrPFiOECIKkiIANpcNDQCwGsg0Y4gAy1+Z6eelhlNY4h3intp276RgWAXI6fJ4QQGuxSDSBY6Pr8IhMp2TYBvTRjeQJWkfWr1v/5x+/c1LJlf19r+xrsRiQItudeT7V53WQZqewFgNBH+TjP+uyiOPp1i1H0775+su4uLjhw4dr2juNekEIMZpMnXt3Gz9t5tpff045noRlqgP2MOBA0eV6/clH1/z682VXTn/ohcUmk9nzrhQEIfVEEq/Xj582M6Z9nOhq1mnImiLAKj8/f9GiRUeOHAEA7N+//84773zhhRc8M8NdNJA6swvZQGzZ2Y8urKN4bhUeHr5ixYrQ0FBPHd7jT73pFEVUB5mpzhJeGqjYR+1ozSFAr2q27/lSQqJUH6hKA74np1c7vYRYzKaePTqajAaMVaMPPHLs5MHDJy7aBqQMsY7jwHaYinrNocVqA0KW6r8ho/ytfE8AQ6oeEWe6LAKMSYC/T88eHdX0NG4d3vETpy525gYRkIpBxR4gFTXb5qrW36p3v+prV+9sfr5evXp0ZN1Np+jwTianNYK8ohg6naeA9cClumExxmlpab/+9uvRo0fGdDZP7ma2cBCIst0qlpSKkkCDd4Bc9cLKS+ltGOPiCim3WBLsTlhRFB+Erh0T1D6c37Fty99//52Zmdn016LR0iGEyBJNcEHvO0mqltoIQii4XCcOHyotLvpz5fcnDx9iWHgW5RSUpeaevbIptHd2u/2XX34ZOXJkp06dnn32WZ7nb775Zp6vm89QHaFuUxg4M+i8XxemiK3NV2XaeEiSNGnSpM8++2z27NkFBQWNpcODCArZQC4llj6A8WkoFQvBpFuXhLjYyPMOcjRsU6KVwx1OB8aAZdGQgT1NptP2Mkx9nvS4Ph6vmJDQkECdjt+x86Dd4WQaUodHx1ToTAFSCfHqA6CxQVqMuIThQ3v/9uPbdVsdOp2uPfuOyDJ2CQLP8T17dAKyTahIpoGWAFKNqfWAzVlZeJFq7xypFpCNgdkGAmo9PiGgXXQEIWDvvqOi2KA6PICgbAXl24ipB9CHK5lTmvVjtJ7QaUdMdDhEcPeeI5IkI9SoOjylPYVMIJUScw/qWUF/8abD6XSuXr360IG9JkbsF+PVM4yzlgpJ+XhfFskrsUf4MQMTDDGBHEd16tTYTydsCJTY5MNZeOcpsajEFh/KD+1kjArS9Y/TBfsw/iaybeO/vXr1joiIaOahixrNE6yIdWp2Ns/+Q70vfLyuu/O+p++9TRQFl8NRXZ98emxqAb3uYsW7ffv26XQ6u92+e/fu4ODgUaNGuQsznDp1atOmTRzHhYaGGo1Gp9P5559/Hjhw4LLLLhOEWjJ6NAAQUEuEWKj4BPFtU8ITBGHMmDFffvnlDTfckJub21ixtNSIVghL1hJLb6CLUeSVi+ruEEKbzW610Ty6ddyE0DJcMDDAm2WZqMhQk9l4WklCpX06+6/XOWAZh4UG9e/bVZHwXHTQbTA/PGXIcmXCklJiGQD44CYeYt0wCA0e0NNisYwb07v0wFPW7P8gpBdFAMnf9pWnotNISHsq7HEpYBoBXWvuiihPw7h2ERCCPXuPKmVDGzCWFgHZCsv/I6Q30Cc0hq/npYUQEhsTAQjYs6+q6RrRD4/+8kAsgCVriNcAoItUno1N1J5Z2dl//LG6Ij+tbztDhwCGFfG2ZNfvWeFFhq4b924qyU2Z1d94/2W+MUFK2mhFvJMw2J4k/psVkyeHb9i5yV6cecto7wcn+fubUUIw63Ryh5IP7ty1a+zYMd7e3pqJVqO+GIwmhmHysrNkSdIbWJerMtERYhi9ESR07qIzGLx9/cJj2rmfYRBCnQFZyx1F+Xk8rzMYjK1fvFu6dOm2bdu6d+/u4+OzcePGESNGvPbaaxzHHTp0aN68eRaLJTY2Ni0tLS8vT5KkPXv2lJaW7tmzJzIysnv37hyn3M8NC0TUSuvKA4YOij97c/TdaVTUgWHs2LGfffbZtdde22g6POrbD+RyWLoGmPsQc7eLVLEgBhUWla77b2cdq0ZijA8cOi5jPKBPF7WyApZpqS137C2EsDK9IosYhrqS1eWqsYxDQ4L69O6yc/ehhtbhUR0ZlYmL/yJeg4Ah/iJlYqjj/9u4u76+dxCAjz94Vqc3VRQmF2fuEO0VOoMeIfoc0OnPiNqmhX1FJ8AuL5jkNtHWRJZxu+gIjMm+/ccaXIcHiAxLNxJTGbD0aX0qeaXpwmkpub1NpMMDsg2W/E28+gNj50pHi8ZEnart37cvLe0UD8QEPz7MAEtKhI3HXdn68GmTpuQVFPx56tTKndaR8bpQo0nHK90MwvxSafMx2RGUMGHYyIzMrA1pab/tKr+ip6lnjD7al80rYRgoJZ88kZqa2r17d02806gXhIB27TuEx8Ru+Ov3J26fM/SyCaMmXamjoe7wxJFDv37z+ca/Vjvstvv+90J4dLSafgFCaC0r+/rDL7b/t/b44YN9hg4PCgtXVYCt3Djr7+//xhtvBAUFrVu37tZbb73xxhv79OmzfPlyb2/vlStXGo3GX3755e677/bx8XnsscfWrFlzyy233HTTTaARYaBUTMq3AHMP6tLehPPUBkGSpN9++63W8jtqVYxJkyadrXCZJ2PHjm10HR4NDnWA0jVAKgDew6j4Urc0bLWiCGTIXUb2fCvTcgJ1ib1FCOUXFBcWlnh5VeZDOTeyLDeaDk9RosjlsPh34tUXeA1QOuaF762ObeWJGkHiEQXAEF0koTFJ1X446LA5ZCnPgMo9y3bVCsY4PjaSFghucB2eKuGVbwZSMfEZQVP1KoVhWw2YkHYxNItbE+nwIL1hYck/RMgH3oNpwoGLuGHPi/qYOnLooLOsUMdAHx74MaC0TMosknYXHs4teffggf2iIJRCmFUgCTaZE7FMAMeh8lLpRFrpnoPrkk6mHDywn1Bdt7GgSBYDJZ4QA4IBZj43Ky09Pb2x1AQarRdJwlGxcQ8+/dJ7Lz/zzy8rC/PzBo8ZZzAaIQLZGenb1q+Njm//0POvDh59WVXeSjqIlJeWrHj79ZLCwr5Dht+z6Dmzt5dnSrzWKd4RQvr37x8URAPvO3Xq5Ofnd+LEiT59+iQlJQ0ePNhopArM7t27h4SEqGFijZHIt5azAghiKyjfRIxdgTGxclkLweFwTJs27RxxeWVlZW4L+LlpCh2e6lhWthmIRcR3HNWYXqjZUS0jW3ftHRVuyPljbxFCJaXlJ1PS+vXuUscUiRg3qg6PAdgJS/6hvlA+o2hxiwsVWTiONZvqaiMggMiyrPPweYUQugT54N4TdmftDRMeCKLUlBrnozF1eIpd27obSkUkYCpNItjKJDzc5Do8AGD5FiDkkIAracKBRvMTMJvNhID0tFNeuMLXjIiEXQ5s0oEoPwtTgg4cPGS12XV6Q5BZDjfCkjIhHfMugMyMhGQ52hv9fTwzN7+QEBwYEhYX4xtisrOiLAsykEiwGWVbCwuLaCxdA7txa7R6CE3oPvbKqd37D8hMPaU3Go1mJTxWBn2HDPvgpz/9Avyp85FH0juMsX9w8CvLv4QQRse39/X3k5q9bNeIoRWeJWXdqINiE3nCUt8dJyzfTKQiYOkHENeo89TmQzXftbFjx37zzTfXX399dnZ2o+nwIK3NYN0DXTkkcDrQRdFA5noiS3JYaOC0K8bU6XhKUTKO4x1OB0INViqtWh3k8LBghkHbdx50OJwNmg+vqtpG2Xoo5BD/KwAXcAFDLLY7Jo4flnny37odENqsjjXrt8ky1uloQpMLOu9adut+TwiJj41iENqz74goNqwOT5HwbAehWESCrgHcJfNcbEA8OxsBILYdjSjaQ4NUxMb3w1PzBh+AuYUk4Crqilf/G7YumEwmQkiFtUJHBB8O2hy4tEIM4ZkEC+kf42ONiykqLmQFa09LsQ+P12VhKcBPZzaU5OZFAWf/CC7faUh2+Vl8/EL8vMJBpi8jQxcpq5AhAf68nF5aaq2o0MQ7jQtDkuTA0NCQiFAlx2JlfhO9wWg0mWUZE+nMahaE6PSG3oMHKhvSbUFL4GLFOwjhsWPHbDabyWQ6dOhQcXFxQkICACAuLm7Hjh2iKHIcd/To0YKCgoZLdFePs6P/KnYDIZ/4jQOMqUXM+w0Gw8qVK89hnDUYDGfbVpbl/Px8o9HoHk0hhH369Fm8ePHtt99eXl7uqcN75sl7mAaMO4MscJ1C2e+RoNnE1FUZgMkFaO/qtmaVJffMToVl3KljbHR0WE3jLMcy55bJCCFKfuMzph9+vl7duiTsO5Ckpj526/A6dYxVjbYXAQSQhdb9UMjBQbOBIYGWGagnHMeeYWw9x8EgRBAZDDqaCqBqnkOfWTqmd68ExBqq5/OAwGZ1SM5cQsrOtkuMsctZveJtWGigwxF7+Giyqq136/DiYiMvtqdBHjhPouz3cfD1QB/XSBJJkwAxJi6X68wJMAwNCejUMe7goeNESc3j1uHFX3zT1XYOSnumoJz3SeBMYup+ATfseWFZFhNss9l1RIq36ArscnK+1NsXjQlwRXCn9pZwIJjzYxz+OumklcR09u/Y0WgwooIy74OHJSRYb+oCkiusTuwKMWb0DpbDDMDpJEk5Lj8jYzICp93qcDjcJmANjfoiS7J85jCr1DqqXUigOT5dLUB+8ORibwyWZQ8dOnTrrbcGBASsXbt24sSJat2FG264Ye7cuTNnzoyMjExKSrLZbKrA4XA4zia4NA7KPNVxFOYXEr9JtH5Ao837Kx3567lJTR0ny7JXXnnlhZ1DWlpaYmJirfu0Wq3uj6oOz8fL8sijt8kehZIuFjV0IOt1EDiL+IykCtS6VkStRddb563U/1eGuAeFBIJqEwlaqdyQkZnjWX+sGtS1otz677pt1U9CkSMl6bRfgarD4zi2Q/uYBhgOEQucp1Dmqzj4ZmDpq0w/6rTPquuthy7cM3VnZdMRwLIwKjIEmbxBNe0ahNbissLsctFWu3jHMKiwsOSPvzaecYjKxLRU8nO3GMby3gNHeZ6Nigy7WFMj5IGQgbLewIGzgNegC5NI6tvZTnevqis69x7Ou3OEYGFRyR9/bTqzKJwaM6rMQJQv3Do8Hc9FRYY2gpUWUKW7mA+z3gEBU4jf5YqI35BHcTqdCCKTweSETKQBFNnJoVxhRBAKMoFeJhAGHScrYEqZVMKCbu2NssPBl5T4skx+qRDhi6xAl5zsNAOhuzeM90bePCM5QVK+VGbHHfxYlwgMvF6nZHRXC8BraGg0sHgnSdLkyZOnTJly+PDhMWPGjBw5Up1L9enT5+uvv163bp1er7/zzjvz8vI6duzIcdzixYtjYmJAEwM54MqAeZ8B/8kXplg6L5IkZWZmms3muju0IYSysrJq5ohxOp3z5s2rVmTMjV6vX7Zs2dmKWxBC7HZ7HU9g6479oGFyHXsAWWoTz/0IuNJJ0LWKY9k55WlIIzTtdkc9R1w68XJRBJpeUkZ0DzRkFiYdSCosKvZUFSOEikvLjyWl0DwUZz8KIbSgam0d44xTg5DmTCopLWtIradUhjJfI0Gz6AyEysTn6ULKr+ygNa/qfhAI7XaHyyVItIQOQazLoXQwl1PevvOgjLma9QMEQTRxNv+zh6MQQsTapmrVfkqaCF4Qy8qtDdNikAdiEcp+h0ilxG+i0rvqk90Q06aTlSDrOm6CEO1dLiftbIQQp0uw251qzuzaT5DOB6Rzh6Mona1OTYdlubikLDoqDDQS9IatgLmfAKGABM06/w1bH8rLyxGCfgH++YyBw65EC9yYJ/2c5LwlkedYKDrx7gyhSwCKCmDDvL1lr0CDPlQihhDv8mBDkcDn+YnCwWTXngzSzUsPRDm3HH+8w+7NomgjPFQgG03eFrNZTQXVUCesodGauFjxTvUUGaNQ7auOCur7xEQ1vgGMGDECXBLoIFoI8z4mvuOB79gGn6dmZ2dPnDixqvJV3c6IKjZwzWeTKIpfffXV2SbrCKF33323mnh3YTP7OgYx1BsqoEiw4DvgTCPh9yhpVM8qryAIS0rK/v5383nDM6tBdUL7K22mCCFMiFLEHR48fCIvv8hTvFPtrQyD2kVH1DyIOzbq7FR+7zn0NnB4EGQBtsKc94HzFAm5BSDTORL6qAkC/1m7pV4tBiF0OJ37DxzHmHqZ8DqDTrLEMy6CSU52ke3soRUBZrefg/qqvlvPj1W+tafVhO43DdpiDE2Jl70UCLkk+Ia6p8RTdbTr/tte36az2mxHj50SBKolMhoNdptdpztdAa/2uJ/afFHO29lqNl1TxKJBWm4OFnxFp2ShtwM+sKGcWFTjaUBgkJ01I9kxxAdllII1GaIfC8aGMbxEEAZ/Z7NBNhOf5+L4fMCWuQhkkQyBKBGp1KErKxYH+8miXc524u9PivkV+LIYJlwPNtpkaPD2UsrOauKdhkajiHf9+/c3meqUb+LSQ+epVpT/NRGLSMC0hp2n0mn9WfRtjQ3DMN7e3g5HnRRgoig2yXkigDhY+i8UMnHsq4D1rq1Uk6cmo956HVyFetWShCVJZhgqMVcbRM8xnireflxVFbLzHZGQBopEqfVUGGWI/Q4603G756m++Zwii6KEq8/uqUqpssUIoQmfZSwThDkWtAujWWRrXj8BQM+rracmSMNKGmk6KzhLc1F/SALkyhOH1BWyUUyKanMRQgVi7CCht9VdwruAzubZdGrHkyTMMOfS/9XaPGpnq+P0j+bkrk/NlYsGAqSDJX9BVyaOfpLWR26IZ6PaYqFh4VZkKLPJ/r5wTABcXwA+Py4mlchTI2B3Hy5Fbif2HM4YDKLoKispKSgq8fbxCggIgiyXn55elr8FSkXrUlyrMqRSJxkawiZagAnLOWWyITYqPJxGHGvGWQ2NRhHv7rzzTtCSUHypClfSeWrIzYALukgH7cYYvTiOmz179jmMs9XyPCUkJJw6daqOw8a33347d+5c0AQQCbA+xGcMQJZaR946qM3OcwB3fU9VaaQUqQReFqpuqil/IASrHRRj7ONtuWzMoLoIBgihU2mZe/cdBY0HkQAXQGOAzlJwpaFaTK3nKRKLA0UCg53z1p0t8pCWfSOEJ3qp9MfUI0ZAy4GS7u1q7fMEQtY7qI+Xfze1yi/DMAcOJyUlXXQJ2rNejUTjUSz96mjOvuimq9xBZRnjytfZ1j69mfoGYxwc5D9x/LC6HAwhePRYyqEjJy7Anffiblhv4jNcKanSkNOYPn37+oWE7kpO6e8tJeoh9AVAJpvzcaaIAi2QCfLqPXx0ek5Bfn4ep/cLCZZ1Or1PQEB+TpbsyIuNArtLmGPJDiMAw4JQV28QxJCUYjm9gvRonxgfF9eA56mh0cpogMhZ0MKAVLFUtgEKWTjsbmBIBOQCdfsMwwQG+JaVVVzwU1jGclmZtVqUtV6v//zzz+u+E4RQ3RWo54i6bUiICFhfHHavkrm3ukOb4kUO9XrdhQvHimaI52lcHlUZIaSnbtbUXhYfF3WWPkloGQa6FXeGQoVaqM/fh5ECaDyISPhoEn4vMHWrtUNeZIvROAyaQoKVFe0dx7Oc3iyZ40W2UPHkP1cL8AAT55ESB1E9/s+yLhUbnfaTRlOA0RJDiEzzUzdeixEXMXQiEQ8Afbtzz9CIIi3p9TrEqNVM6w1CUJJlnufVTszrOL1ep9PxdZEXCSDuFIx1DwynhVeaOM8AFgAXhENuBt4jlfZsSNfk+Li4Hj16bD556FhZWVQArbgcaELtQw2d2xly81x2QfDy8gbZeS6HQ6/XW3xokTFRcMklqYl88rBEVCr4+KcaclNsPBRZmXAS3pCFBa+IHt26+Pv7N+B5ami0MtpqSDnige0QSn4ARz0JvPpfgCVCFqXoyNB/f/+I2gcvaNhgWCYjI3varAePHEsGTUVTJB0kItC3x6FzaULp2pJ9EEJ8vC3jxw6+4COoee8gRIpzD2RZNHbUILPZeObVQRpCy7BAlpW8aQyQJUCNudVOpk4prxu33bBAzP1I8Bygjzhbi1nMxotrMWi12hFtNxpaYTCZRwyMzjmxUXDBwKC+Op0foYKykj8FIcXkrfqGqlqr8147xFgoKtzjdBQIziKjJZYQ6VxG8YuCljAg5r7UrZP1Pa/2XdXRjh014IKPR0NzSsqMBr3D4aRd18dryMCeRqOhjl0CQqTWNap7L2qaxKAexxOBoT0Oux0Y4gBuYNlOTW48dsxl2zdv+S19b4SOpDlBobdh+gBLnAn+XuzYU+KSCejTu3evnj2pZaWwMC0tDWOCADK6XJ10On0QNyCCX+vHrNtcEgjErDKyLot0vXL0oIEDL0WyLQ2NFkNbFe8U2wrhAmiZowsFQmgy6OtYCKGWzVnWZDKoRsPWAgFEIJa+JHA2NfGcPZEbhFAJ7LjQpoOeGjUqkbAsw7Js1fBJAGKIJIlpScKRXYxfMOA4OTtV120QGxUPWZbUcKGDLEvlvyqnMYBl0kTpezAVVnwvI4Ezaf2ARmwxunmVCpIwCLEMDQNiObN/QE+DKYResyTn5hVm5+QHBfrb7Q6nU2gXE+7jYwE0B1tltg4KAbSq7xkjK8SSq8Ka6rTnX/AZ1r30BvEZRoKuU9JY1smz4iKbTu1damdTixqf2dnOd8ZNLazVC6JMLXqT4JtoCBSV7RoejuMGDOg/eOjQP79N+yW32NvMBAZwPX1QeprtVCFjCg63O5wGkxkhJIqiv78/z/PUDTXj1LokIRy6hsXqfAP4QcHMPh/uUK6wu4RUWEKGjxiuJljV0NA4G21TvCMAi8RnLAmdC/jQC0gn6wa7/b/qD6O4uYNWg5qEzXcC8Z+o1AY9z1BRR7XZOTevfvDKoZRlpZwM+1/fismHidOm6zUM8jrnlr+dezZx7RKNl81kI9rR1ONuEBJPJcllRVCVfTBmvP3Z6ITqqeAaHJoUkCUBM4jvZUp8r9SkLeZeTK3nckF+4X6aU6ZUECSOpWXcsrLyk5NTQ8MCu3ftYDafkSjbZnUUFJaquaMJIAgxISG+ja50os2FiN/lSvoYpl7+YRfTdDXVl2d0tpYLbU9IfMcQ/6kNG2dWDYRQcHDwddddl52T/efqX7pz5Do9cOY5dp6wp4OYkeMnyrJ85MiRgvx8hmESEhJ0Oj0hOCgi2h7Y9cNdu6UycXo8Z2BQCEO+KyDJ2Oeq2dcOHzpUK1bRFjhb7atLeBrE4wTU5bWe0tm+qpld/6LrmJ+VtifeEQwIJgHTKrOyXYRsp3EaIgPEE98x1HdHMZ9dsjNhGCkvy/rDB3LGScBykGErXxwHZElM2mstKzJfdTsX0c6tw4MsZ9/wm2vvBshRVS4Rnbqew7znLCBCY/YNIgHGgn0vq8xmfOkq5iEGFeaXbNm+z1phZyjIjShJqanZDodrQP9uJpOB6vBo0CoqLCxd/99ONbEO9eTjuCuvGN7IWmgMEEt8LqeuFHWIpdA4D0QGkCF+VwKvgWomo8Y+YI+ePa+5+ppTp9L2p+zrm+k0lsOdZT7RQ0f3GzI8Ly9XlqSwsLCQkJDc3FxRpJVkS0qKjT7+u2z8N0fKY4mAOGZXqnzUwY+4fOx1s2dfguSpGpeCphTmoFIJSZJxzZlqzdNgWOpyLwrU+ZvjkSTSXF3qV1TBz0FJopoCnmcwPqOImWoB8JwfNt41tjXxTgZITwKvIX6XqYaeS30+rQMZsD7AdzQwdqp73YVGAULisNtWLpMzkwFXY3JPs3rwcm6GdeVH3nMXQv3pSlyK/KeDlZsQyDTyfUEkwIfSOgG0Pu+lbDEIgM1q37YzzWZ11IwQUp53MC+vcPeeI0MH9XT7IVRWhGMUZaeSU7DxJw9G4je+soO1jeLRjRwk60V8xgFTxyZrT5Zlx4wda7Xbly9f/uPRHSd82bD+Q2fNmRefkGA0Gk0mc0hIcEFBwaaNG0xGk16vT09LKykpsWO0o5i8fEgyIGm77DNozMi777m3S5cuTXDCGpcWlmWOHzr0xftLK0pLaCg+oGX6eg0aOvvWOxHDNLhIBCF02u3FhQVBoWGsRwIjhFBRfv47zz9VWlxE3Tw4bvz0mWOvuCI3M/ffX1ce3Lmd5fh+w0aMmDDZZLFgjBGDnHbHhp//2Llxvc1Wkdi1x5jJ08Kjo2VZppV+8vI/fWtxTEKHqTfcrDg6w8K8vK+XvXvZldM7dOnmdtJtKNqSeEcEQhNPXAksfRqjcEUbhUoqIcR7FNCFXfJC75BhXEf3SOlUb3fWlVhOzksXju7S9xnhdrCDHA91hkrxDqEqOa8xIEroSSxNGcP5XPIWQwilpGZWVNjO4aXOMExubmFBUWlwkL9qolWDQD20d436GJGpLOI3FuiiL3lztQpkwAVRRXtjVmisFbPZPH3aNJPB8P67S/MI6d9roMNuO7x/t8PuwLKcdKRg3fr/0tJSTQaDt6+fb0CgMS+/wmYvcJIiAURGx4weN/6WufM6d+lSLTOURqsEIpCblbHu918mzpzt4+un+kGFRUYqmjNECC1cVDnVZBGWaS5PlmUI9bumxZhkGUgiDQ1zq9MQosF1olhltKnakFYPp6UrQVLyiU/eXLJw8Zt+gf6iULkaAYDj+dgOHW3WckmUfvv2y8i4+IEjRz5z/+05GelDL5tgt1nfef6p7f+te/SVN0wWk91qe/3Jx9at/nXImHGBwaG/ffPl6h++eXrpssRu3ZRC3hV/rvxOcLo6du/ZtU9vQuiSf1et7Nanf2K37mdPZn+BtBnxjkhAF0MCZigPNS0NZoOgVP7QtyM+IwBjbA5DL5Fl1+EdRJYgOlM+I4Q60sGqAEZJdO3bwncdAFlOrRRtnj7PPH3eGVs0imWWzkGBqQvxGqR4O11q5TEEsoyLikpJjbzOlRGzVTMgSZJTUjKDgmgeCizJ4eFBM68a57kjTOqfmbruak7vIYALbA4drIVDqGynjydeA5RM403dnmoKpw6JicNGjaX1jg2m5e+/eyLpaElxCQ0w1um9fP1DwyPNPr46gzEvL+/48eNOlyswKCgxMXHKFVfMuuaasLBGK86m0RyBvgEB1995X1R8tGr5JBiIopR8LMlgNIaER1DHYUlKSTrhHxTs5eOblpxsslgK83Kz01LDomMSOnVRUwHYrBVH9u2pKCuLjouPS+yk+ryLgpB2Mi0oLLy0uAjLstnLsn/HtpPHDh3cvbNTz16+/gGqLwrB2OLtfcM99zEMcNjFYwf3sQy7f8euU8ePvf7FD517dpEkMP2GWw7v3aNq4/5a+f3mf/96/fPvuvfrBwAoKy594o6bP3jluZc++lxv1AEA/AKCAACfv/vG029/ZDDqlKky30gx4GxbeagZO9EKlfShpsl2DQLVlxNjR2DuCRB36SUVZfTAZSW4vESNkDgNRNDszQSGuc21RJYhrycOG/SiAQGK793vUloSzaJCtRsSG93BOGwikRq2q9AUbMTcG5gSm4n3GARQlCTqF3JmkQwIodGo9/amwYzqEoxlSOe+1L4AECzMLzmalKLW3VJSu7E9e7ZvBN87meijgLkPYC2abNcwuQKMnYG5B/25L117EkJCgoN9fHwgAP5hEScysp1lDqvNKpRZSXbekaPHeL3eYvFiOU6v148bN27o0KGXX355bGysWakwq9HWoGHqLMDK80UUAcOg7evXrPtj1fPvfxIWHbrqq59+/mLFk2++a7Z4vf/SMy6Xqzg/v6ggz+V0zHv4sRm3zCvMyX9xwX1H9u3meB3B8i0PPDJ51g0IwZLCgpceuT8mvv3+HVt79B/csUfPd198uqKs7Nn777x1/sKr584VXFUKPEIkUcYyEgVBFQ0honWlbVYrxlRT2KlXt47du0kScTnF//78bdj4y7v16SdJtDqQb4DP1XPveHH+vekpyYndOtF63wyaOHP2r19/sf6PXydfc1WjNt35xTuM8cmTJ8vKyhokgzHLsp06dWrCoCcabQfM/YnP0Ev7UGtdKCGflp5Ar2SNby6+UBDI4hkhsYqoIhfnGkZPYyPa4bISqoKnThwE6I2Q01X63tHI2aOuPRsgT2dXRHDpMAYjJjfouWEaemLuScs9KRmAQfNA1dF53tgQgooKW68eHfODigRBojlQlNUMep1avRdBZLc7UlIyPIyzfI8eDZ2lgsg0DZuxM63h0QxE4RYOAZAl5l60SSn4Ena2Dh06xMfHq+kVLxs3Ljcv78D+/cnJydnZ2Tk5OU6Hw2yxBAQEREdH9+jRo2vXrmaz2WAwtMD8+RoXC0TQYbX+8f3XfkHBhOaXBZ179Uno3HnCVTM3/rP64zdfnXbdzZ8tfX3WbXdFtotx2Jz52VkWH99XP/3Ky8f7u0+WrVj6ep8hw3/9+vPSosIPf/krKDTk759XLn/tlYTO3br17YkxTks+EREd88KHKwJDw/QGPULos3fefOGDT6Li4t2yXU2wJHXv269Lz74PXT9j+IRJPQYM6tZ7QExCAoDAbq3ITk/rN2wkfVSqNQxlEBAcSgjIzkjr2KOTYgmR4jt2vnzG1Z+/80bfocMZthFVbOfftcvlmj9//vbt22ne9osbltRilzNnznz11VebxH8C0+gw7xHA1ElJPKENEg0CBpAnls6ACz53aaamhmCoN0EdTW58eihAjHgqyfH3t2xMB9sfXxN7OXXNkEQ2Mo6LSoAGoyppIb0RWXxUlzsiCkhvbNAzkwEyEWMi4HybjSisQmO41DAu9+iJEErPyNbreb1et+9AEpZlWnRVliPCgkNDA9zr6PU6z8jZhj0r+s+QoMgiarlbjYuAYBpPpu9Ik0A1bWNWMzlBBc+5vcFg8PLyahcT43K5qB6Zajxon2QYhlO0d3UpCKQlN26tQAAdDsefK7/T6fXKgxrqjcaEzp19AwLuXfTs0/fdvm3dv8PHT7r8qmtkWgKaMBzXa9CQ4PAQQsC4qTP//P7bTf/+tX/HtnHTZrRLaCcIYMzkaT98vGzPlo3d+vYkhJjMXmOvnNGha0eXE3McMlm8WJb18fPXG/RSlYteTTAhFm/TE2+8s+HP3/9b/dvSZ57keP6WBxZcddMtsiRLkuTZIVVVn6L/EysfsfRM8bQbbvn7l5U/ffbJhBlXN97UpU7au9zc3KFDhy5cuPBiijdDCO12+7hx4958883S0tI333zT29sbNB4EA8ZMbWH6SCUZSrORQlr8UGEG+hjAeFGppVlBCDJ5MaGRYuoZlWEhg5x7N+khNE+5yf73N7iihECejenAePsTmar6iOAyXTnHNOXG09sg1GC+dwQD1h/oowAyNjPZjj56eI7V6/iy6j8lTDqemtihXe+enQ4cTJIkmYMwNDQQMSwt6ybJYWGB06eO8VwfUl/nhjopBPTxQBda9VHjYqCPQeWGNTe9oFxcXJyamnreSnqq2FdtkKvy/jx/BygtLb3oM9VojmBq3Ax4ednnEXHxWMljhRCigheEnXr06NSj1w+ffvTMO8t1Bk4Uqvyq6VbKQ5dheIO+ICfbbrOZLF4yDRCnYa16o7G4qEDtkkphHrpjtaOpnY2aX8/sdAzDVMtQSwjw9febev31k66+1umwr1j6+kevvdRv6IjA0FCT2eKw291rQkid/CCEFi9v924xxoEhvjfe8+AHLz8Xm9iRabREDXWsgYgiIiJ69ux5kQdzOp0AgDlz5vzzzz833njjihUrGknCgwAT1pd6mVB9STOTQlowhDov8qFKqY/m2KqEyPoeg4W9G4koUP+2Smg4u3PPRgCRcdzVtj++Ak67vscQJdi+cU+HPga4QFrAA7LNUQulRHqERwQXFOXWPL1jSac6JsZ279phz/6jPMtFR4aq5obGPB9CPSj0IVQgbobN1VJv2HDFt/IStOd33323fv36Cy8tXTfy8/Mbdf8alxBaa5smzmGwTPW4SjyszHFox4aNSQf29xs64ov33ozt8J7ZYqlcnyhZEzCt5+50OILDI4wmk7WsTDEwIFEkDrvdLyDobApfJYkdT2Nsq5ZgWU47eSIwJNQ3wNvlYrAkIQgddqG8pDQwNIhhkV+geewV0/74/svC/Nzo+Nj2Xbru275FFGVOyXjHcuDovj0cz0fFxZ++Dwj1IRo+fuL6P3774dNlsiypcxuOYwigF9hQrVdXsbFBblFJkgRBmDx58u233z516tQZM2Z89tlnISEhoGEhMuHDqWWn+elLWiyKLMT60VwegGm+Q6+M2ah4/eAJjnW/KP5Gp/UBkGWdu/8DGBvHTCe2cjYyzl2UAvI669fLXAe3uY2zuq4DLLPuvjgFniI7ckFKi8Fmq4XCmMREhJSWouSUdIROa1DUN0ePpXRoH9O9a3sGMSazQZ3CIpbJSMvZvHWvp3F2/LiBF21gIDRGhw0EyNR8O1jLgvUFnB/Vhl6i7lescEkOrdE6cDmdh/fuLizIwzImBPv6BUTFxWempi19btH4q64ZN23G/ddO/+qDd26d/4ha+2H3lo2Dx1xm9rL88uXntvLyoWMnlJeUrP7xm659+gWGBK/9/VdrRVnfoSNURRqh4sEZt4atovzwnl1d+/Tz8vGlfgIMspaXv/LYg/Gdusy5974j+w+lnjwx7cZbNv61+t0Xn543f2HPAYMkQfjp808MBlN4dDuE4JRZNzw67/r3XnrmitnX8zrD4T07l7/+8pXX3hQUFq4KI/Sg1EsNGIyGm+554N5ZU4tovRYWY/znD9+xHD9q0hUtOHLW4XD069dv1apVM2bMmDp16vfffx8REdEwu1ZLhNHC2ILmtdOgQKoGYEzNy9muFggg0DBsEhGczi1/E0mkUbSqGk/pG679m7n4zoaxM2hUrIcKHjvtuKLUHVqBnae16xcIRHRkRcZm3mLUFIpQzx4dZVlMy8jFMnYLeTRnFMYnk9OHD+0THBzgOcHDGDudLrd4J8ukIfR2PE2ODXnttr1o1KmFt9L9mnpq0di6uvMdvfneaxr1heN5wel66ZH7EVIfNXjUpCsefOalrz54OyQ8cvqNt1i8jTffN//9V54bNGps+y7dGKUa9KsL5xfm5ZSVFN/+6JPRcbFXz7099eTxh2+6xmzxttusdzz2ZELnzpJEZ7AGo8ltGMUExMS353jdsw/cOf/FJeOmThMFGcvY29d39q13v/r4w9vXry0vKxkwfNSQMeMlWRq4fezihfN9AwKoUx2E9zz5XFBomCDgbn37z39hydJnF/37y0pery8pLLh8xqxZt91Fa2UBBCGiB1XCKSRR7tCt29Trb/7s7ddZjnU6XB+9/jLDsMPGXc5ddJzDJU6M0rt371WrVs2aNWvy5Mlff/11YmJig0SHAWMCtYVZD2s22YYDUsGOmhdbwqOTYMjpTBNms1EJrl3/ybkZ2FZBC1GYLHxEHN+ln65L32qyHcCYa5dIRRpGCRGQRTYm8eIKziLAWFpKixEMdEbdwP49goIy09Kzyytsgkuk6fkM+gB/33Yx4QEBfsqzpko9R4DJZIhtF3m6agXLengTw9Nr1h3EAqBXtK0toMWaOxBRTzuoBiU0dXtaLBZ/f/+GDXdQfaSKiorUMQ9C6OfrVfMQhBCz2aD1oNaBKMi9Bg35ZddhLEvupzXHc4hhb5v/hE6vZ3ne5ZRHTpzSb/gonudlScKy3Gvg4LFXTEs+djQ6LiEsKloUZR//gGffXX7yyKGSwsL4zp2DQsOwTD3ugsLCP/j5T47n1QzGsiS3a9/hs783CIJLbzC40xrLsjx8wuWJ3XucOHLILzAovmNnmqYFgIeefXnWrXelHDtiMJoSunT18vFR0ywDAEZPntJ36PCTRw7bbdbYDh1DIiIVdR09aFhU1Ac//8XxvGqBxTKZ+9Cj1915r05vYFm296BhgsvF8VxryHvXpUuXVatWXXPNNZMnT165cmXXrl0vfF80WTVP3bEZL8Ugq93iDQcdeltUVgJFCa7rNpBv30MuyCa2cprczmRhQ6Mgp6OVKs6cGBFJNA6bBEZcUdVtIL3tLibpHVLvz5bQCalPsShLAgByfFxYZERgeYVVFe8Mer2PjwUhiGWpqjwvBWPg52ceNrSHx16gKLpUh2Si1IOBpx0f6wJUnMM0Ggg6r7hkzJkzZ9y4cQ0u3lmt1gkTJtgVp3Wdjvt8+YtBgX5ytTkYAeFhwfgi4v80mhUMw7qd6lTUaBuTslB1BVY/QsWMKwqCILhCo8KDw8MxppKZ6jzHMEzHHj2h8lx3C2Gq9k6ZMJyu/ao3GA1GmnvBU3kmSXJgSGhweBjNjk9Fw8q4jNDIqPDoKEBT5p/erZokz2Tx6jVwEB1JaJxHZfEMNQaNHrQqN5YaJ24yWyCEqSePO+y22bfdjRjGvbeWnda4Xbt2K1euvOGGGyZNmvTll18OGTLkQi1MOsAEVQ2rGg1Li5Lt3Egi5DguIhaoIw3B1Ih4FqFNWd5Ao0KLSdBFk6wLrorU5B+UIh+KXgTQxOvUiwUAaynJz66jrQsSLItiBWL0OadWWkuOBsdM0Rl8634iF3MZGpccz6DXcIUGP4TL5XKLjAihPr06B4YHg5o1OiVZHdQ1WgVUNKplabX5Oa1IRJ9mnXv2CYuKkSUiS2d0DKW4RS29QvG9q76kVqOoonursaosq7U0aj3vM0/hrAd1i5KhkdELX31LbzA0lGx36cU79XHw7bffzpkzZ8aMGV9++eWoUaPquQPVa8eseBBraFS/rZtljG8zgY7KgmBtCEVjZW4L0VVUmL3O5NNeZxyiSW1thCbIOSydma5cEETgEhq8BLtGC4UQwrLs3U88DRGqJtu1FFiWhRzXsK6rl168AwAEBAR8+eWXd91117Rp05YvXz59+vT6bM1U1pLS0NCoB9RAgBAIDJL0+gZw5EWQsBzJzeHKyiCWnS3DNq1x0Yii+OKLL/r7+zeIM3itQAhdLpcgCI20f43WAUdj4+qUK7F50uBn3lwEIy8vrw8++ECv1998882CIMyaNatu28EWajk8B06nc968eWqOwAZhwIABDz30UEPtTaMVAQkRK6zpNoergYQx4nRFQ6gGbGq0CWRZ/uSTTy71WWho1GJsPS+qI8q5qx6oKVdAC4RtPpp8o9H4wQcf+Pv733LLLcXFxXfddRdok4ii+MUXXzTgDp1OpybeadQKDUgsLse4weYSel5Emi9dG+ASjnctc6jVaEgYhkEMkCUakXp6IcsgBCTxdChDnaQRJdLhfCs1vGqtdYp3LpfL4XDU+hWE8IknnpAk6eGHHxZF8d57722D9QQRQsHBwTabraF26OPj01C70mh9KHH+qGG0d1ApANryHoMa9Qafzau8VR9aozkAITyyb2/GqeS+Q4f7BgRgxQUTIebY/n3pySf7jxhl8fY5rzSmZttZsfQ1Lx+/aTfcVKsfJ0TIYbN+9NrLPQcMGj5+giS2MK++JhXv1Ba/4447FixYcLbWVxWhTqfzgQceCAsLmzlzJmhjmEym3NzcS30WGq0fQgjP8x3j4w2G2uPF6guEJCXFWFzUwh6CGvWCVtrj2UWP3lZRYaNpw5v88BzHWcwmLYNxGwVCxKA/V367/LWX7170zB2PLlJ1IiVFBU/ePS89+eSnf6739vNT409phiZV83Y6NQmkOdRhpRXx0O6dgSFh6nv1r+eaiIGyJO3ZsikoJBQhj4o+qs6vKqmKp/W21veqCVg9hufJtCrxzmAw/Pjjjy6X69yXR8sGS9Ldd9+dmZkJ2h5Op/O2225rWN+7Bx54oKH2ptFqoIGukpSWnoMYZ0Np71yOaAgNDbEvjWYKLUPHsvfee+MlzGiDXUJLNJZpNBiEBIWFr/315wnTrm7Xvj2A4M+V35cUFvj4+6vmWqRkeLLbbFiW9UYjy7GqwCcrafBUGUMtjMGq9WgRIoQILhfLcYh+jxw2O/Xth1CnN6h1JlT7ryzJDpsNIWQ00bR56n5UM6OqEXS7n2El4526kGVZh90OCDGYTHQe3CTFXeon3qmxS2oGhNO5EKo+nv9gLDt16tQ6HmvBggVNEG/fbH3vGjBA2uFwaOKdRq1gjItLyghpsLmEjhMQDa3QaOXILi2OVeOSIcu414DBGONvl7//2KtL0pJT//zx24nXXLvln78IFbCAzWr95qP3V339mehytu/S7Y7Hnkrs2s3pdC1b/GJQaFh68omykuKFi5eqUxTEgoriio+WvBQcFnHVnFtkCX//2cdfffAOwzJDxox3Oe2qKMIwTPrJk++99OyhPTt4nX7C9KtvuPu+tJMnV37x6Zz7Hg4OC81Jz3z3xaen3zS354D+Tofw8esvd+s3MDIm9ov33gyLivlr5felRYWTr7nupvvn63S6Jpif1FW8U9WM06dPt9vttYp37oVuMbbWb9U3qmStvlHfq3/VENpXX31VlmVtcqah0QRQZ7mGu9Xa5IxMQ0OjScFYNphMl181a/ET84/sPbDx7z8CgoOHjB6/YfXviiIJHDt0YOfG9bfOX+gXEPjpW0veef5/i1d8DQDYt31LRWnpyMun9Bo0lGEZQABiGEnE7zz/1PHDB6ffeIvBqPtr5c/LX3v52jvu6dC164GduzJTTylyCiguKXn18fksyz726lvFhQWfvrlYZzCMmTxt79bNI8ZPjGoXemjvrpWfLQ+Liuo1oH9xQf7Gv//qP3y0zVqxZtXPY6+Yds+ip5KPJn38xqsduvcYM2mKqNQla0bi3Z9//lktvWSDYzKZXnzxxTYYUeGG47jZs2c3rHG2oXal0bogdEaK/AlxNdQeIdRrkY0aGhqNjSRJ/YaN6Na3/5JFCyrKyh567lWzxUs1eooi6NKrz9vf/eLlTSUca3nZR0tespaVmb19EIQjJ02554knAAQOmwQhkEThg5dfSDp44Om3P4xJiHM55X9/XTl4zLib73+Q40DnHn23rP2bmnRZsG/71szUlKXf/hLXIQbSEF3xx08/GnfljJj4hGMH9g0aPXL/jq0DRo5JOnTAbnMmHz1sNJniEjtlpqWYvb2uuPbGngN79B06euu6f47t33vZFVMaqkxSwxhnaUU2vd5qtXbt2nXo0KGiKCqVOqh1WUV9717o/srz49n+AgCSkpJycnIMhrbuuKPX6z///PNLfRYarRqa0JiHiKXZ3mFUA2apU6r6yIg10KR6DbZXDY2WgduV/lKfSNvwAeW5GTffdvvU8cPHT+o7dNCh3XvVr5T0KOLPX3yyc+N/kiDm5WRRtZQS1gCVGq+SBGSZ/lKIYf9dtdJptw8cOSYkIlKWqQdafnZ2/xGjMAZOhztbMp0L52Sk6fR6L29fp4MgBoaER5SXldqsFV169z12YF9OZm568slp19/885efpqecTDp0MCo2zsffJy1FZhgWMQzdGyFGs0UN9W0C6ifeqX137NixS5YsqXUFT1Vf9cJwZ/+ouh/efvvty5cvb7N6O+rCqVO6UWPC8zxojVBfWKZBrYzVUJwIQGuBEGwwBYfFXlGSt62B94yxwRzlG9AVoNMuxq0M6pnduJ0NarkDWyJKoXiaWpfV0no3CZIodezW455Fz3Xr04/nmcq0xjQ9E/j2o/f+Wvn9LQ8sCIuO2rlxw58rvye1yR6SJAaFhd++YNEb/3vs5y9WXDNvHkKI5ThZkhVnsjP8TXjFYY4Q+mSDSI3SQCzPde7ZZ+M/f+7ZshEiOGDkmK3r/t2+fu2p40d7DRrKVVbzrjxoNSmISjsQ4karklwP8c7t7F9NAtu6davL5Ro+fLj7ae50OvV6fX0f7p7OeaDtYbVa33777bCwsMZzOkQI7du3D7Qu1EjzpJOpPM815lFgcUkZaBVACCVJOnz0JMP4ETj+AlK9nwsE7E62MCkTQlhYWNLK7mWlOpZw7HgqxzVuzoGCgtbWdK0eRZ9BqEkLYJZpnbPo5gYhBEE4/YZbIIIeXmNQlsDxQwcTOnedMPMqBoHDe/eKLletUhQEoNegoaMnX5ZxKvmL997qM2R4fMf2CZ277N22ubyswtvXUlxYUFyYr2Y2Sejc1eV0Ht2/d9DoUZKId236LywyOjA41GAwMgzz988/xCR0CAoN6Nqn35pVKyGEHbv3PFeKRgjzs7NEUQyNjGoW2ruqszr93Nm1a9ekSZNsNtvq1atHjhwJAFi7du2tt9767LPP1rmw2Bn7b7MPNavV+t57713qs2iRYEyOn0htggO1ms4pSdKRoyeVt41xRe75CWyV4l3S8VNNcKw2a8douXo7kchOLBIA9AzXCstlNidEQRBcrkrTH6pML4cxdjrsGFM/uf4jRr35v4Xzb7yeYVmMscvp+PStxXc+9j/B5ZLE015vgsvlsjtEEVx53Q3b/1u75In5L3/82dTr5jxyy3W3XjGufZeuTputtKgYYyxLoFP3nhOmX/3M/bf3HjS0uLAw81Ty46+9bTQZeB0fGBy66uvPFq/4FiHQo//A1598JLFrz6jYeELUs3K4tWOCyykKAkL0zXMP3Z2fnfX2d6sCQ0LlRtDhXax4FxgYGBUVZbPZQkJCVBnlscceS05OfvbZZwcPHhwVVQ+x1J2upj7nr6FBaWViRAtvsVb+W2idTaOm3k7C2EUkJ5YIIBaiZ9ViphoNDiFYxtNvvEUQXJ45hGUJR8XGP/7aO5ExsaKIx0+/2uLtvXvzxtDIyHFTZ2Snp0uSyPHcXY8/7R8UJMs0kTuE8MZ7HuT1elHEeoPx4edfPX74oCTg+I6dXlr+xT8//+h02KdeN2fGLbcFhoSKAoYMc9N9D8d36rJn66bQyKg7Fz7VuUcvUZQRgjfcff+w8Zf3HjzU5cJRcfEvL//Sx89fbzCIAj2rhYvfCouKlmUMEZpz/3yjySK4sF6vi0/sXFJYqCbeu/TG2ZoKtujo6C1btmCMTUqKv5deemnHjh2DBw/esmXL888//8EHH9R9/21Qe0cIcV269FGCxySmJSJjTG+YJu8wavAQaIHIstpil+C4LTrPESGXtLO15KZrO3o7KtvJoksWMSASwSxkPNTYGg0JIaRzr56QJuI9rfHCmPj4+Y+YME4UqPyn0+nHTZ06ZspUhADGICwqQtGcyf2HD8UykJQUxwCAngP6EwJEUZYBiYiJiU6IEVxEkuSETp3ad+pES00oJSpkGShZkQnH85ddecXoyVdQT2wIROUEMCbxnTolduskuOiheV43evLlGNPDEQJ8/PyGj7+MnpWS8bj3oIHUfi+TivLy4qKCK6+7yTcgQE25fIkTo6jvqynY3LGumzdvfuONNwYNGvTjjz/OnTv3o48+mjZt2rhx4+p4iLamvSMYWyzm22+ZmZ1X0PSe1DLG3bt2oBHkLRB14tU+PkoSpabXFRGCfX29QcurP8Ymdogll6KUEyY4IMCvhY52hBCDnm8fH32pOltQoF+LFo7bjN5OVF6SRCQJy5DhtB+t8VDlqmooRtjK94RgwUWHCVmiP4Nc5ZknuM7Y0FNAlCTZ7cAnVSaloxXNPNcnmO4WQEgFNw8kUZaqxlJaVdUh13pW7hOgAhXGV157U8fuPRovkPZCQitqncKWl5c/+OCDGOMlS5YEBwc/99xzmzZtmj9/fq9evQIDA+ulvWsjCjyMsbeX+cF7b1DDc5r8+LS9ZaFFinfqNKBTYtwlPIEWN+JyHNe1c8KlO36LazDPhFC6S9rZ6Lz/0h1do056OycWXbLkwoJdFgXSuNlhNZrqoUPOtt+LPzGLj2+fIYNEoREtG/VQlZ1Ne6fyxhtv7Ny5c8GCBWoS3e7duz/xxBMHDx58/fXXPVdLTk5+9dVX1eJmbVx7p4KVxH/4EtDixwxySQEtEK3BLhit6TQ8UX8YqrfDlXo75Y3gxJJTFkQsa6EVGudGUQQ2bnWu+ol3Z3OP27Bhw5IlS0aPHj1v3rzi4mI1N8q11147duzY1157bfPmzepqkiQ9+uijCxYs+PDDD2vdf1vzvVOnAdqgoaGhodHy4mSJSPV21OWOSnVOWXLJogOLEmn0elMadQfWECo8l5yjgGpNq9qZC5u7pRFdfN47h8Px+OOPC4IwePDgefPmzZo1a/v27ffcc89VV12VmJjI8/zjjz9eWloKAFixYsWPP/4IAHj55ZePHj1a6/7bmvZOQ0NDQ6MV6O1clR/pX9IyPU1bJaSGLqNaVYVadR80qR46Q4CrEk48EyQ361+5AXzvXnvttU2bNvE8//LLL7uUVDQbNmxQS6Zu376dEPLff/+9//77jz76qPoRAJCZmfnYY4/98MMPLMu2ce2dhoaGhkbL9bejsp3sIdvJol0SNemuOQAhdNjtK95a0nfoiL7DhtNaFBDardYVS18fMGJU/xFD/1v91w8rPgIEsCzLsKzgcmGMYxI6TJwx65uP3ovr2Onqm29X8+oxLHPyyOHP33mz//BRl8+4GgDw23dfV5SWzpgzDzFM85TzLtb3bseOHap3nZJlsLIwuSrbqdZYNVnf4sWLDx8+vGjRovDwcPWrVatWffbZZ7Vq7zQJT0NDQ0OjZentqOOd8rJJTqzJd80ACKEoCGt++yn1RJIqtkAIBafz319XpiWfgBB4+/l36NytY/eedrtt67p/YxLad+jaPSahvbWi/Ldvv3jn+aeOHz7AsFQmwRh/s+zdHz5ddmjPTtWAe2DHtm3r/22egt2F15x1i192u/2RRx4pKio677ZFRUWPPPLITz/99Pzzz996662CIBBCnnnmmYEDB3bs2LH5a+8YlqV17KruWCLJjR2XQIvaeRY+IgRLlW6YDMsAVJVUiRZwV1I01roVgADLjZRTR6PZ4pnGSENDo8n0di4sClgsFm0EEC26opnAcTximNOfIaRLEJJl0Llnn259+3A8+Or95cUF+XMffszL2wQgOLBjb1hktN5o/Hb5+wsXL9Ub+Z0bNh7avatzz97uXTEsy7KNWAnzEtecfffdd9evX1/Hzf/+++9PP/10zpw5q1atWrlyJQAgLS3t6aef/uqrr9QdqgNSc/O9Uwp0ypu27DyVlqm0APS2mAYN7BkaEtgYVUTcBy0rq1j7347yCistugJgdFRY/37dTEa9LONt2w8knTgly5hBKCY6rHevzmazSZakalsBQCccCfHRQwb2bKTz1GieNL1sxzCIlnpstDtC45JDZ5WEllFv4uNSew7L0HAFj15dOY+VZbnRcoZ5UjO/XU29nbKk8m+BUIEJ0QpXNB84njfoaR9GCOgNBreYgbGMaRoPRpZoBxMFQRSMijUWMyw79fo533/84b5tW/oMHfr9Jx/2HjS0pLhQpvkvWwYXXpRs+/btixcvrvvmoig++eSTl1122csvv7xp06b8/HwAwHfffTdhwoQbb7zRvVpz095RXa4gLH7zk8NHk2OjIzAgFRU2UZLff/OJAf27q7Z8par9GWOqqj5xK1Fo5mvlv5qrqZdbbTliUFpGzr3zXwwNDvTxsmCAs7Lye3ZPfH/pk95elveXf7tm3faE+GhCSH5+sa+v95uvPNK7dycqMVdt5e1lpio9AsaOHjhkYE9NndNGoJ4ldseStz4bMbTP8GF9m0ZxCyHMyy+SZRwc5N8Eh9NoYiCkefkzM3IRi4IDm/QnhghmZuXu3ntk5LB+FgstjFTpUOV0rf1zQ8cO7eLiohovK2x99XbKclHAUqFglRXxroWm8m5lEAJ2bvwPQiTLVAlis1pLiwohPI8iCctyl159s9JSf/h0WVlJcdrJE7cvWLRsyYstKGjmQrR3DMMIgrBw4cK8vLx6HSw3N3fhwoVffvnlwoULH3jgAdXa+9xzzw0cOLB9+/bNU3tXWZJIlq+9euLjj92BRbGs3Dr3rqc+/PiHvr27MBwrOF0Op4vjWKPRgJXiS4QQjAnHc2rpYsRQd0KrjRYVNhkNDMuogy7DIEKAzeYggJhNRkVXfEaqay+z6dUXHhw4oBfBeOeug7fc9dTf/26ZOWOCIEiTxg977eUFMsY5OQXPvPj+w48v+WbFy8FhwZ5bSTRlMVGDVzTZro2gzEbEn35dExocMHxEfwDOEO8YjgUsSzu0SJ1iqQqEZahxv6qUBcOyag7GSm2NGvmkrKze+ACqxXkU9QnLYEkGhCAd/+2Pf5WVVSx64i4iSi0xnyJVEVEF5JkQcjb5mN7SLEdEsWbFMNrIBJzOf9/yQQyTlp455/ZFPt6WZe/8LyDAt7ElKs9DHzx88sln3/7pmze9fbzUVkUIlVdYn3np/Xtvvza+fTvQmCdTT72dIuQpZWcxaXl3QasEKgqU3Vs2pKecoDV76BNMKisthueTNFQFzfSb5j50w9WLH3/46rl3xCS0b1meThdSlEyn061bt27Hjh1ms9kdQlxraLH6oPfMsvbVV1/NnTv3qquuWrJkSUZGBgDg5MmTy5Yte/XVV90HapaqJqjT8XqLEbhEo4+lR9cO23YclGR5+86Dz7zwXvKpTC+Lcd7NM265cSqn49eu3br6n82dOsT+/NvauTdNGzdu2OtvfPLV96sddme/Pp0XPXp7+4QYAkBxSdlLiz/+4++NBONxYwcvnD/X38/Xc2iEEBoNenpQGXfr2iEo0D81LUtNtcNxrMFoAIQkdIx77sm7L59218ZNe66aNbFqK4PeYgJKRQr3aK3RduA5TrGWngHDMCdPpB5NOsVxbPeuHUJDAx12Z+qJ7IiwIJPJqPQUkpycZrGYAgJ8EUIZmbkHDx1nENOze2JQsD+WcVZ2nihKkREhEEKn05WemRMZHmLQ61KOp+7cfcjlEg7uP9ouJsJo0De/+/dcQAiKikqLSkqVe0vVslOMRkNocEBNewJiUH5+8aate0cM7e3r413tYtev324w6Pv16dp67juE/tu4q7S0oqCgeOfuQ5dfPsItUdFuxnEAQSBjKuxiQgVljgUMAlit5Vm1JkKAV9bEhAiiWn+TGlgxAdSZGAJRwpKMeA4wDK1SLIiVrsYM0ut1dJpq0DOSBCQJYDruKguZ6lMXtbZUA5nP6qu3o2+UNQkgApYMDN8gp6Fx0RUswZz75l8152ZRkBFCpYWFd86YjN11ys6OJEnxiXFjr5i+9tefJ8+6XumQLenJVj/tnXq/SZLUp0+fP//80zNDzHnFOxVZlhMTE/38/FasWFFWVqZ4tkkJCQnNP++dKIqC3YEFyV7s3HcgqV10mCzjz7/+tXv3xAUL5u3aeeDlJR937hg3dNTArOyCz7/6ddoVYyaOH9apc8L6ddu+/Pb3x+bPCwrw/fLb37ftPNAhMVYWpZcWL9+0de9zT97DsOjlJR+/8OpHLz37IEtVelUBHDQGWRDsToLJsaSUvLzCmJgIulTNhKz+HC4hKMg/MND32IlT9EGpxFoUl5SV5BWKggghNFuMPNes3T81mgDEMqv/3PDoU2/JouQUhIiwkA/feTIiLPip5965YuLIa2dPBgRkZmXd/8jL8++bMyw8ZP2/Wx598o2KCqss4/DwoCUvzO/Rr9sXX/+akZn3+isLOJ5LS8+5/5GXX3vx4Q7tY195/eOfVq1hGSY9I/fDt5/q1j2xBRW7g5A+c75b+dd7y76lFSqVQCWOZQkhA/p1f+f1hazy/oxNGCY1NfPx/731zYqX/f183Up3NbzuvWXfhYUG9u/XnVYybx2xh07hn3Vbr5kxIS09+5+1WyeMG6bOwOmE4WTaii9/ScvI6dalw43XTQkM9CssLPnsq1X7DiSFhwXdfP3UuNhIJakEm5mZ89mXvyadSO3UMXbO9VODgvxtVttfv20J8PPZsGlXWkbO9CvHDhnU64vl32/Zvr9nj8S5N04zm43qOTAMs2ff0aXvfWWzO2bNmDBsWN8zohYgQBD9/c/mn39bi2U8ZeLICZcNps/Ci5tjXJjezknoRwywA4s+ijeORnOAYRiWZQiGCCEaKFlXCMZg6vVzBgwfFRgcoprjPEEI8TzPcPSHxjKdWTAMgxggS82iKNSF+N6xLOvv7z948OCLOfDIkSOrLfFIFd3MUAaA95d9//ufm4Die+fj6/XUwtsNRv2SFx8y+voAhu3TLfHPfzYfOZYydMwgAEBkRPDTj98ZGBkCCNm0aTfPc50SY7t3Txx92RDJQbPGpKRkrP1vx8vPPjB6wjDFwwQ9/r+30tKyEtrHqFNPhFBZmfXWu5+hHicYF5eWDx3Ua9yYwbim0QcClmXKK2yAEJZhSksrbr37aYNehwnR6/jXX14wduzgFuQNqtHgqOWrS8us8++7acb0cUWFJbPmLPjsy1XPPf9gp45xv/y2bsa0cbxRv2HT7vIyW7fOCcV5hU89/87okf0fmz9XFKXHFr3+zEvvf/PFkvIKe2ERzU8OIBRFMTev0OEUWT3/yvMPiqIECHn1xYfMJlMLku3UyT3G5IpJI/v27sLx3NvvfXk0KfXV5x/Q6XjVZYKODTxHNUzktGYIIWTQ6ziOBXodgzGQZLnq0a/T8TxfOaGiAwnHUlFEkqsFB7QUEIOOn0hNScmcf/+cjIycFxZ/lJdXGBzsDwksKCi+4/7nOI5NaN/up1/X5BcUP7PorieffXv3vqODBvTYt//Yoyfe+OCtJwOC/TPSsm649XGASdduib/+/t+Wrfs//uAZQsjrSz8zGgztE2JKy6x33Pfc2FEDREkyGnSvv/V5aWnFk4/fwUDIMCgvv+jLb34PDQvMLyiac/uid994om/vLqfPEDGfffHzc68sGzKwJ8My9y94KTv35ptvnA5wtbLvja+3qxIBJYLLJUcY8GlZyp7WClFsWGcWiKpe6VVdeMYSRT7DGAQEBQeGhKgOCdUKPhUXFuzbsQ0xDMayt69fVGzCyaOHt61fM/bK6YEhodQW3OJ877Zs2eLtTU0SVLuupKnz/Ku+qbbEc2GtW7EsW1hY2Ey1d0q3GDG87zVXT8SipNPxXTvHR0eFEUwOHj756ee/FBQWO13C0WMpLKuEAANiMOh5niNUkoOjRwz45rvVV81+ICI8pHevzg/cfV14THhBYXFuXuHLr3289P2vIIBlFdYKq728wqqkX1GOSYjBoLvpuimJHeOwJPv6evXu0cnby1wzcg0CasowmQwAQhljLy/TwvnzenTvKIkSQjAmOpw6SLUWaIdRzI6qm2PNFai1CCJPkzT1GENVcwZCzrZhK0ZRQ4BZsye7bI6C/CKHS4iKCCkpKQeYTBg75PfVG04mp3XsGPfXmi3Dh/bxCfZf9++WktLy62dNNntZAIQ3zJ5y2z3PnErOYFk6NVX3Cem4y6hzMS+LWa/XQQD8/Hyx3LhVFBsDQkhYaFB4eDDQ8RGrQvLyS3r37KQzGuh9hYkoiN9/+/va/3bo9bqpU0aPGUlragNIe9qx46lffbu6oLB4ysSRE8cPPWOnygpbt+39+rvVdrtj3GWDr5g4iuoPWlrjAITWbdgRERHSvVtiRHgwx7Hbduy/8sqxAONTaVm5eYVff/pKl769rfk5uXlF5eUVO3cfmn//nJnXzwC28iPHUuhziYCvv19t1Ou//2KJMSC0MOPUxGl3rv5r4+Xjh8kynnDZkPsX3CqWVUybdX9Rcdl3ny9mLOZXnn/n9z833FtyrX9wACaAY9kFD87pN6w/sNvvuO/Zj1f81LVzPFI7H8PkZuV9/NnPCx+eO+f26wGAH7376aef/zJx3LALS24AL05vp34rEqlEtGmJUZoDEEKD0cR5mLBqLlGTpxiMJrd2ic7fTGZVGqFDCa5UPOn0el6nU9cxmszHDuxbcPO16sAyePRlj7/2zs5N/704/76wqJgxU6aIgtySxDt1yPxOoS6bVKvsdu6vpGbsjEwI6dGtw9QZk4AkUPlNlAEEScdS7n7whXFjB187a6LgEp545m0sV9lVPczTEVGhP3/31sbNu3fsOfz9j3+VlpV/8M7/eI7zspjmXH9lu3YRWJY5jrNYTBHhQbhK80EU3du4MYN6De4LaA70SocV9VvqIqQqOxkmLzO3oKC4Y4d2QEmuzTFM545xPfp1q/S9a/wUfU0Gw3GSIGRm5SKEwkKDGI711Eoq3u5scWFxaWlFgL+vl68XVtz8s3PyrVa7+qTV63QR4cEMg5omn0IzQe0qK1f+tfS9LxFidDx35FjyFRNHAknu2jkhMiLk37XbdHo+6XjqHXOvBogpLi5DEOl4nrpYIWjQ6zEmJaXlZ6uweNpJo8X2NPUJzjD0ZqGpayWZV24chmWWffrjsk9XDhnYs6iodN5d/3vn9ccnXjkGAlhhtX/+1W/hYUE2m+PO+5974el7r5s95bSbP8us+mntI4ve6Nmtg7e35cln3jlxMu3Rh+cq0gNoKSCE7BX2f9Zus5iN6zbulAVRp+NX/7Vp8uUjGIaJjgr19/e95Y4nx48b0qdn51HD+3E6vke3jouefWf7roO9enQcPWKAwWgQXa59+48Jorh8xUpJok9Oq82+72DS+LFDWJYNDQkEgsBxTEx0GMGYDqguIa5dpCjJQpX3sI+PJSjQDzgdgGWGDu715ttflJRUVPrMMygtPTsrO/9Ecvobr74HAUxNzz6VlpWVnRcaEQLqLd7Bi9HbOdTlWLTLYq6rTAucveRgjE0Wyzs//M5ynCpsYYwtPj7vrfzDvYR6XgnyxGtmj5s+U0efdfRREN+py0e//cPr9O51qD4LocdefUvNlQYAmPfwYzfe+6A7zIjlWI5nO3Tt0aVXn4jods3hWVgP8Q5CaLFYXC6X29/O/VVNPWd9vyKkMsaT5/nmaJ+lvncSEJyyiybJUew1fEZmTmlpxQ2zJrfvnphxPFUQaYThmQ9viBDctnVvfkHRlImjxkwa7W0x/fzbWqfNER0dHhjgV1JWPmtQTwDgjq179u0/Ftcu0vOIhBCnSwAup9va5W4ZWSb0fAAoLS59/tVl3l7mwQN6qkMLqTxVsWXZyM4LwzD/bdjx2lsrMrPyVK3k/Pvn9OvbVQ1louOQw/nG28v/+PM/u8NpMZvm3jT9ulmTRFF85oX3/tu8m1N6F8ey/ft1W/TobSEhAU0W/XdJoF7nOr5SvUZATlbuK699PGPaZfNunqnn2XsfUsL7ITRazKNH9l+/YZdTEEJDA7t0jgeS5OfnLcuySxCoLzwEDqcLQuDv50XzQinOJXTvSty3J1SZx3OgyiO+dYAledjg3lMmjojq0BFI9tnXPvjPmi0Tp4xWrpDcMXfGuCvGAFH83/+WfvL5L5MmDPeymNXe6KywffjxDzfMmvTYU/cBwK36/uennnvnmqsmxLaLaEFTC8gyJ06m7T+YBCHcs/8ohLC0tKKwsDQjKzcmOjw4OPDjd5/+/Jvftm7fv+zjH66YNGrxS/NfeeHBL7/+fe1/21f+8u9nX/760btPh4UGSjKV1YpLyiVRovrgWVMG9e8u0wGw0kVJNZypeQdU/Vm1MaCyUxHCIKQqGqpWoO6SkixXWG0sy2BMfLwtj8+fFxYaROpvtVAM9US+cL0dzYqiVq3IcBQjWhSq9VhOWihQ0dV51oetuUTV3nGczm2fVbV3NeerOr3e3Rt5nU796EYUxb1bNl4+Y3Z8x07N4Tavq3gnSVJ0dHRycrJ6a1Wl/6h87/nX86N7Sa0La24ry7KXlxfLss1Nk+d0uoQz3SoJlju0jwkJCbj+loW9e3a02R0+3paPPv1x5PC+CEKHo1IIhhAWFpU+vPC1Dz76ITwieMPGXfNumm40Gkxm0123XvPY/95au367yWjcvG3vHbfMZJjTzzSMsd3hVJ6A1ZEJ/ur71fsOJGGCi4rL/P19Xn/pYWpaoraks27VomE4dt367bfe/fSo4f3uvfNaSZQ/+2rVTbc+sWLZ8337dsXUIUp65sX3flq15sF7bujeNXHTlj3/e/5dSZJmzZxwKi1r6KBed942S5bknNyCRxa97vO+5fmn7gWtF0LwieT03Vv3qtrNdjERWMYulyjLxCUIJ0+mnkjO8PPzKigoCgwKGDd68Bdf/37gUNJ9d13v5eNFRKl71w4hIQHLPvnh3ruul0Tpw09+6NwpoV1sVFRU6Lc//rlh8+74hJh/122rqLCenokRkJmdd3Df0bjYSL2Obz0SHoSJibFbt+1b/fdmp8uVlZXn7+ulTuFMRkNERDCwOwGDhg3u/eOqf3NzC318vFTlekFB8cnk9HYx4W8tWUYwycsvzM4tOJmcHhsX1aiJPBoYQv5dvy08LOj7L5aYTEYIQUZm7vTZD27Zui8mNqq0qAQi+NT/7gWA/PvnxgcfffXkyVQvb6+775h1973Xp59Mnzzj7j37jkTGjouJCjMa9E89eTedMIjS0UPHI8ND7A5HXXqJEqYtiJIMeB4Qknwqk+rmvcw0+ZTi1xgc5B8U6Ddl0sixE0cDgMtzC3PzCoOD/HE9VXeqfCkB2UXEC9XbKR9l0Y6FAqHC7RKicWkhNZLU1LakelRsrbaIajqp6g86Aq+59S69gTpKNQctfT20dwghHx8f0CQ0n+GBEKLTcf97/E5/P2/sYQrEkhwZHvrB0id/+Okfm80+++qJkREh+w4c8/P1Hja4d1hYkNGoV6RWMGnCsOAgv99Wb6iosD276O6JE4YpIcTSjGmXhYQE/LVmiyhKb77yyJhRA6lpQDXpyjg2JuL9Nxcltm/n6Tmnfvvg3TdcOXEUdSuB0NfHq2f3jqFhgbJIEzbWulVLR6kS6Hr3w2+GDu713puLaDIFCEcM63PNjQs+/Pj7Xj06Mjx3+GDSz7+uffHp+6fPvBxI0sBBPaOjwvR6XsY0vi8qMrRH367UWs0wGzfv2rn7kEDtQVzz6WYNCETIaNB//NnPX39PY9sBAE8/fufs66ZcP2vSa0s///Hnv4OD/MeMGvDF17/9u3brrGsmt4uJSEyI/u2vtNHD+6seGH5+Pk8vvPOhxxavXb9DluXgIP83XnmE5djJE4b/9Mua/7N3FvBRXFsYv3dkfbNxJ0YSQkgIGtzdKe5OKU6RUqFAKe7SUqRQoFDcW9ytuFuAGHHdZLNZGbvvNzuQBmkfEtmE+b88upmdmZ3dzM5899xzvjNw2PduLo4Vypd1dnLAMf4qBjFYvVqFKT+sGD1h9vpfZvj5eZUO1ze+aJRmfpy3+vTZKzWqh6lVCpPZ/GJO0MILv0CEMN7vA+QbVkGW5ViOy801ZmZmMwwrlUonjx8cUNYblRxth2EwR6c/+NeZRvXDXSzBMAhBoL9P5bCgvQdPdu/WKuJp7Kjxs1o1q1ujesWDh87w9RYQjhjzo6enS/vWje7efwIA9HB3BgB07dR84LDvx0+Y07hh+N9X7p46e3XdLz+4ODuYTGZ+xsMClS/5hGVZk+nlNBFAiclpP6/a2qB+tedxSb9u2D1p3EDetp3j/thxKCjILyiobJOGNb6esjQuLlmhkG/YvC+4nN/8WeMx7B8XgnftJ4s4k6DtWL63mNGi2N4nbvdiclbQfB9e2SFSMoF8XJAv97aSO8t7yLtPE6H+v35D/s73Wv0px3HBwf5TgwN4nW7xc/L290ZmCkLoVdaL42ex+dVYlqseHla9ekXB4ekf31cI6jcIr1+/Oj9mwLE8nyfhRe3sNC3bNMqfb5dHeI2w8DpV8w6Cd521HNh/b1VywSBMSEx5+ChqzoyxmIQU5selSkWHto2Wr9ySkZHl7OFy++5juUxWv05VZKaE996tcwuAwZxs/Yt6C4wEJAIcytTm5FVElj74zBKV4q89K2mGyavbksllkGHHjerbslnd+MSU0GB/N1enkcN6kATBsQwuk7q7uzZpWNOPTwPlPzqWYWrXrnxk/6pbdx8TBF4lrLxCKWcp2tnJftumBbfuPJaQeMWQchxCEpIQcgD69mzXqX1TDiGVUl46tJ3gqZsUl3Tgz9PTvxvRqWd7wDFJyem8uLM0naQo2mymgJT3NouKSVAq5Q52GmF+EccxFyd7N1fHxg1q9BncAwDGmJEV+zzR05M3HgclBn4qtmJoYKcOTfNqlTCCGNi3419Hzumy9VUqB08Y03/dhj3HTl5ydXacMWVkSGi57yYNWfzT5lnzVyuV8u++Glo5rDxnMlevFrp43lcrVv7x95U7tnY23301tFw5vxxdToumdXz4GjX+UwuvFiLIZcRxXmXcWjarK5NJEcu5ODkM7t/Jx8tt1doduQbjF0O6D+jTQSqVfD6oy4G/zqSnZRIhgd9OGiqRkL9t2sshVKVS8Pgx/XAcyzPr/r8IfQgQRBzvK8VnHQjpdyaWNrBUXtwub+6VYmkzYv8J7+VpPksMz8jRFMsYGDPNMdCSzFfIfyYRKwJZh7ATEOXdO5GXcvf6couu4gOxwh0t78b26ryAcAvkVzO/Eor7Z/kbN0T+Ymoyv/1FKVoom3iT/9iqBIPBjMxsM0XZqJX/XCoR0tio9LlGXU6uM0IpqZlyuUQmk+QF2FmWxRDGm9RCePDQ2WxdLgQgKzvn7Plr078bQUolpdUsBkKoVFhmB16NTEAIgsuXDa7gz+cWIV4FQgCzsnP+OnroryNnJ47tT8okefmaLMPa2Cgb1g8XmvMICY58gbZcVo8fWvAFyPmvZRiG2dioBG9kUJKhaYYXbQIIqVQKOzvNHzsOkVIyJjr+UUSUmaLu3byPYTArW7/q1x0tYhK1mVlLfv69a6cWTi6OfG0TSRw5frFp41qftWsyb/E6XY7e1dVxy7Y/lUrFmhXTcLzEFM/yZWEezsuXT+UTeV/OBnAM06RxrSbN63GW6FqP7m06tG2Una13tLclJCTLMHXrVatZIyw9I8tGrVSoeZccy1wF27xZ3Ub1q2dmZtvZ2UjkMpaibdSqmT9+mec1M2Rwd76jgJlCDFOrZqVa9apxJoqj6UoVgypVCwV836C2LMvaOtgKFjP9+nbsN6gLMFMsRatUih+mjf5yVF+W4xwc7PjT832ipIKXNQFwOSbBMKmakLGIpTmWQgzNsQxizRxjYCk9Y8ykDOl0TjpiEcsfAwc4GnE0YgysOZc1Gy1a0MQyOtqYQemNLK0gJCXkr12q4POAsXy/832n+CEEQfLu2pSZT/oEnwCivCsA3vEL/G+rid///8+/lNvAlz1n3vwQheJi4UmdTp+QkvE8Ou7mnUdrf5rerUvL0jR5/SaCxdNbe+vlpXpbzGaxrOycPw+fa1i/eusW9dCrYxJeqHHMW/b8tuDcW9JQSiCI48JCy6nVKkvhCB+xcnCwmzFl5JxFv86Z/2uNaiGzpo3evO2v1JT0sr5lendvHVTOd9MfBzIyszq2bzpxbH/+hoLBfr3a/bx6W+zzxBGfd8cwuG3XYYZhg8uXnTR2gFQmfd+EsOKFPwcsPp354dXYy6ERS9EyqVTuwtcbClFblvdjwlwtSjd/dRdL0ziOu7g4Io4TlvMr5BuLstQ/Q2heTb78hvInrZF/rFLxyX//jEDyjXL5YS3FF9haRiPMx5yJkHchBQQkpRj5oodJXniP13N8fJa1xBtpjjVwVA5jzKRzk03Z8SZtKpVDcbSeoTIpvZtMY+ZoJZB+IkrCeuBbsScl5ur1L/u5I1IicXJ1k0gkEffuadPTKtesQ5TSzJzXEOWdiLWDOOToYCeVSrOyc/5xkoKYVqtTqRQaizebk6OdyUSbzLRKxRfeCbouz8qyT4+2X0+dkPDsScfuYzO12RiBl7Ky4g+DZVhPD5f1q2bI5XJey5SctLBCgqOZHj3aAAxjXyZ+cSzboEH1GtVDdTm5Tg62kMDrN6nFVwdzaN78yYBlu3VuaTab7R3s+JioZfqyYYMaDZvX5Vts0czYsf0H9vvMbKacnOwtIYSSpO3ekTenm4UiuTfX/LflH/xCr1GAtYov9ZxgRfAPEEACQgLys/NyHGig3B3YWhThC68qQfYJBRkqQip2ni1i+KJ1g2HlnBnXL5zls6stf0V3L5/vFv/k4+99dO/O25cvLtmyWy2V5o1mX/aZ4NOvwKcp74o4V0kwSREReek66xQaErBjz7E2LeuTfF0SyM3W7dp3vEZ4RXsHDeC4ymHlDQbjhUs3Puvamm9MCeHqNVsZmunfuwOfJkXTgNJ7eLr17Nr61417Wreo5+PjWWpSxD4GvnenVPKRAY/SxJu6n+WdzElnmT0v3/IFroSwlkIuUypk+Sf6+fPq5anFmmm1SmmjVn2CZtqlFaGa5sXjPP2X728LAZTjEgUuZYu9a8EnCcdxCTHR1erU6/n5CJqikcXNxN7JyWzmBo2bRJnHKFVqjmVxAue7JePg6YPIo3t2Vq1Tv2qd2hAChuHj9hYfO5yf8WBYgrR0rOFVEKBpyyQvgRMk/5dmGcBYlggvTZCWhmcQsDRgmOL/yr+TiuI4Likp6eHDh/QbPdcKA0slvMloNBb7pyNiDSCEJBLJ6C96Dh4xrd/Q7zq1b8owzLZdRxISU+f+OA7DMI5mQkICPmvfZPKUJZHR8eXL+f595c62nUemfvMFhmNm3tPGUnrCcT26ttzw+971v++bPmWE0DcTlCL4BjA4ZqnYe4/3lZct96LFO8u3XX2/F5WQpaya520f0dtH9v/3XZfij0XkrVgmDF4P+4kUJTiBu5Xxqli9El/p/iIvhYMQxjx9kp6SXKtxM4lEcv/69QPbfjcZczPT0s0mY1ClSjlZWWePHKper5GzmyvLchdPHpdK5ZVr1r544rhUJgcARD560KT9Z06uzjf//vvQjq1Gg6FusxaN23TACQJZMoUunTxxbN8uhmYatmpTt1krUlLMFlH/X95hGObs7HzixInz58+DokL4UFQq3iP0k4L3jAXIGhwRrQq+lrNW5d/XzVm64velP/8OIQws6z1r2uiQkAAh6ZskiGnffuHsbP/noXO79x63tbVZOGdCx3ZNjEZT4wY1AgK8+WwZjnN3c/560tCbtx/m6nKVLxuWlw4gBrN1OZmZOjdXR+n7O89BCI0m86kj58qX8y1b1usdJ2ohhqWlZV69ca9meJi9Hd+o8EMPX8RaL0eWK1Le3GqJKJ0pfSM3kfcFwzCL/zr/mGP5RgB8k8DTJ25fvli7cbO7169MHTHEr1yQvZNLzNOIjn0GNGjR8umDh+sWz/P08XMr48ay8K/tW+0cHarUqnNox9anj+47ubraOTo3bN3u9KFDC7+dEBRaWa3RrPhxauyzp0Mmfk0S2Pljx+Z/PT60Wg0cx1fNnQkAbNqhI0OzVi3vpFLp/Pnzs7Kyinh+luM4Pz8/UALh47MIARzjr4zsK63EcQLnW4zzFXpMXjGaJWpC8uszzJOIKJZFAf7ekO9Z+XJl5p+VcZLgz1mEAE1/UiqQZdhqVUM2b5iXnpaJQcze0RZYKvKEZzmOk0ql478cNHxI92yd3sFeQ8qkLEVLJOR3U0YAlhM6vrMs26tn21592nMmqjTdAIRWzivXbN+45cC8H7/s2KFpXof7dwTDMF2OfsbcVWO+6O0f6PuO1rsYgT9+Ev3lV/N/XzenZo1K4nx3aQJCePvO47sPntA0g2OYu7tzjeqhGo2Nlf+VX9aJi57CnyqWtvb7t/5+78Z1SyU/qte8ddeBQ18U20EMAXDp1HF7Z+eFG3fYqOGvy1Yd2LKxx+cj4KsKR7io8rdflnHz9Jq+fLWTm4Mu27Btzcp2PfqNm/6NBIA9Ow78PGtaqy49fAL87t+46uHt++Mv61RK8PRRLEGSLFPMN+h3it6VL1++SA6mNIAQioyMVauVycnpMc8TfbzcQyoECKNJHMfj4pLu3HsCIQytEODFDxFYCPmmOjduPUxOSdfp9ItXbAqvFrp0/ldSuSw5MfXO/Sccy1UMDfTwdOVoBmLY06cxjx5HyWTSapWD7e1tS2Wy9r8hWDc7OtjxE618isQrz/LBBTMlk0nlcksdX16F3atOMaWyqALDscSk1JNnLisVsn0HT7ZpVR9/6enKjygsFzZA4Hzi98tZ1BfjBMhfvQS/bj4PTyblu5m93CovpYwfaWD8ry8mcAlLMgpfPUDXqF7x4qnfbTVqlmF4f0E+nwUClkM0bZ2RHuGSXZrEfWEAIX9Sbd15aOOWA+WD/CAAmVodQWDzfhzfpHHN/ENTwZ//tc/zteWvfeb5o2sveme/uvJr+3x5n339hSxLkVDeKpxsOEkcPXbhcUT0yGE93svWWKQUwf/RXdw8wsJr8IkmHOfh7fPPkxaRp7bRGPT6xLhY2sUpKe65RCYjcF4LvXVUAAH09g90cHGgaZCenPw86qmnj++ahcsRQhkpKWlJic8jn/kF+VWoXH3PpvXj+3QNC69ZvV6DoIqVQXEjVjAUvM39jDmrzWYqNS0jJTXDaDR/M2nI0IGdEcQvXrox6dtFWdk5NMPa22mWLZhco2YllqIXLN2wftNepUKemprZqGH4NxOHSOXyW7cejJk4Ny1dCyGwrPx1tZphJ46cn/z9EoqijUZTSHDAkvmTfXw8SpbVwkfyf4vvPtFUJwy7ceMBjuHfTByyYMlvsc8T/P28hcHD+Ys3DAZzZmbW0RMXA/19hgzo5OzswLLs8RMX9+w/SVFUo/rhXTs1/6d5IuTdPS5cuKnXG5o3qQ0AwjD8zr2ImNiEVs3rcgjt2nHo5OkrSqWsV7fWNWpUysrSnjl/rXHDGk7ODs+exGzcsj82LqliSLn+fdo72Nta1f0VwyAkST7nmUO4hOSjv3n6lcARP3v/sSdPQe3HSqBppm7tyut/+ZEgsLTM7EVLN0z4ZuG+7cu8vdwRQhiBGw1GmmLkcikpkeRF9XCCYGjaYDThOK5UyPmxFh8MRnnzP5YzE7NoOB4Mw3JzjRiOKRR8hlNurpFjOaVSzqfVcpzQ3Tg314gAEgzJhSuA0EOMwPltea9HpZzPv0Do4ePIS3/fHjqwi1RKFuuHJ1JM8GMArkbDxqOnTBbMdvgCiJc9RATDo+Ydu1w4fnR0tw4ae/uM1JRRU35Qqnn3gPwKL7/U489gVuhJzHIsazTkZmkzWYYhZdLB4yd7lQ2gzVztJs1+/GX9kd3bj+7dtennpWOnze7Qu68lelhsplGl07u/WEEJiSksy/6xYf71SzvHje67ePmmiCcxEIParJx+vdtfv7j9+vltLs4O6zbuhQg9ehy9YfP+uTPGXbm8c+PamfcfPk1P15qMxhlzVoWFBF4598fV89sqhwX9OHd1dnrW5m1/1q5Z+faV3RdP/t6qRd3ifqciVgEfC2GYIycuVq4U1LxJbVtb9akzVwHOezVgGG/p/NV3i0+fvapSKdb/vvfrqUtZxJ29cH3C1wtNZgrH8Skzflr+yx+Iv9sKERK+cD0xKfXHuavT0jIhhrMM89OqrRcu3SRl0rXrd81duE6tUqSnZ3313ZKnT2ISk9PmLFyXkpKRmZE1fNzMG7cf2TnY7T14cv6S3wR9CayntR1F7993fNT42f2GfDtvwdqoyDg+3GghLi4pU5v98UdbUPuxHgiCUCjkCoXC27fM95M/l8kkfx05C0mC47htOw41bjWkev0eHbuPvXDhBh/xtQR6Hz561nvQ1+H1etZu1Gf5ys0sQlt3HFry0+8Wq0U8Lj5p/NcLomPicZn07v2nE75ZOHPemnrN+tdp3HfHriMH/jzdvO3QsBqdv566JDs7ByOITG325ClLajbqXbNBrwnfLEjPyLSkVWF37z+d9O2iuYvWN2gxsGqd7r+s2c6w7JKlGxYt3Xj24o12XUfduPVQOCSRTxCWYcxmYDaxZhPL5HM55a1SAchIS3Ur49V3xJjeX4xes/9Y625dOZYfllA0ZTDkkhKAE5jJaHhtnwgBGzt7J1f3GvUbfz1r+uS5MweP+6pe89Zunp4cB1ISEgIrVJy56pdtZ/9u3aXH6UMHWIZl+EkMLr/JfFEiyrsCBiFAkkTd2lVcPVzkClm3z5rb2Kiu3XwAAGjbtvHg/p202pz0jCw/X8+sbB3HcnqDge8V6+spU6rL+pWhKDpblxMdHf8sKq5JwxqpqRkpyem1alR69DjyeVySo6PdjVsP/jx0xmSmhg3t4ct3kfqEQncibwVCmJSUfv/Bs5bN6mrc3BvWDz919qrJEtIQqj493J1/WvLdT6tmz5o+5vK1u4nxKf5+XpvXz/lt0+I16xcPG9z15OnLxpxcvnGqAIdq16iEQfj3lTtQKomOTbj34EnrFvUAh85futmuTYPlv8zYtn3Zul9+8CjjKszTYTgWHRufnJI+f+b4ZStmHt2/auiAztaT4S58FCtWbf3yq/ksy/n6eBz483TPAV/duRuBkySGYQuXbjh5+jIml/HSgST4EmSSwC0S2fLri+skjuP5FQOOYbhMistlwjr59yO86L9tyzttEfxT/Ktbph5xiYTfj4S0NmkoRDt4zJStrY2Pt/uDR1EAguMn//5h9i/du7RcuWJauUDfL7+e/+xpLCYh09K1E75ZgGPYiqXfjRnRa+MfBy9evPEsKvbGzYf8yQChTpd75sL1bJ0e4Fh6pnbH7qMsy86f91WLprXHTpp36Mj5KV8P+/6bYdt2Hj14+CyAYO7CdRf+vjlz6ui5M7+8ev3+7AW/0gwLcNyy7RGDwTR39sQ+PdvOXbL+6rV79RvVCK8W4uvt0a93ew9351ITRhV5LyizmXlb8jFD05SZwnD82cMHN/++kJyYEBv59MjubRePn2QY1snVzdnVbd2iuX9t37PllxUPbl0Xzh+KMtM0HwZEiLOzt2/ctuO6xXPXLl355/Y9kwf3WbtoNt8hCceO7N0xsmu7bWvWH92z+87Vy2WDyuuytNNHf75+yfziSgYVJ2cLCT6MCziEE4RMJs3K0gGCOHH43MLlv5lNtFwujYyKqxRWnuO4CuX9q1Yq//X3Sxs1CD919oqvt0fFsKCnEdEZGVnLftkil0mFdJMKwf5SqWTs8N6ZGVlTZvyUkaGtX6fqvFkTvMq4iQrvEwcS+MXLtzK12ampmSePnSZJ4s69iKfPYkLDyvMFYwi5uTqSBA4ok7eXO0kSeoOxfLB/5s3s9as2GwzGu/efcBxn6ez+8gLEsh4erjXDw/46eq79Z03PXbxho1ZVq1IBYrB2zUpLVmzKyMiqXKl804Y11bZq4crFsZx3GXcHB7vBw6e2bFG3WuUKjepXx3HcSu6vGIYlJaft2H1k0pcDh4/sA1h2Qkb2rn3HlEq52Wx+9Cjy5p1HSqWicuVIe406U5vt4e4cF59so1bZ29vERMa6ODvYqPkq/oTEFJpmyni6CnItK1t38/Yjvd5QLsDHz6/Mg4fPhP1UqvTMx9MVARTzLNbF5fVtIYTJKRkmk9nRwTY2LqmMp5tCLr1+5XZScpqHu3PlsPLWI4vfBMfxXIORNpg27/irZdM6474cADC8drXQz3qO233gxOTvRly+dicxKW3Nimll/H0ATTduWNPF2fHE6ctCTqegekmCeJmNB9xcHQf06eAbHBgS6Hvw0LkmjWq06tgCmE1HT1x68PBZ1LPYU2evzvvxyyat6luqw7Hvpi+PjU0IqOCPEHB1cRzYr4NfcLk61UP/OnLu4ePIz0cNqlrlvPRhZP++HfmJtFLdnEbkTYQc9xoNGvv4B7yW+8txyL98BcFS19HV1dnN/fHd2xACmqJ3rFvVb/T4PsNHjPth7qp5P65bsrByrTqd+w1x9uCTECrXrGOj4fNMhKKdHkOHYzh2eOc2hmH8g4MHjJnEd6PhUMfe/Q05OXs2rUcIhVYL7z1sNJ+I/+ihXpfNT/sKBZHWJu+ePHmyf//+gQMHOjo6FskhlRZIAnCI5Vij0eTgYEvlGuYtWVelUvA3k4YoFfIf56yKeBqLYZhSKa9Tq/LhYxceRUTVr1O1X6/2Ds6O8c+TnJ3sZk0bXb1aKMvwyaE0zSiUcgLH16+dFReXFB0d/+VX8/fsO/7l2P7/Ysgl8kkAIWQo+uSZK4nJ6bMWrOGTjwBKTEq78PctXt6BvO4diM9C53jzJxzHNm85sOznzVWrVHBzcdTrDa/PHSAEMdiqed3vZ6x49jj65OkrDetXV9uoOZb7Ykg3dzeng4fO/rxq68pV235b8yNhKe7mEOfo6rh+5Q+/b/vz7yt31q7f1b5No4VzJioVMispsBAy+HU5uYimIUHYOtsPGdodcFxcbOLkKUuuXr8f8TQ2MjquR5dWa9bv9PfzOn/p5hdDu3Vo02jC1wu+HN2vSaNaAIANm/enpWsXzp5AkER8fPLoCXMfPHxK8P6o5NCBnQ8dPS/sJ+JpzNqfppkpevzXC8aPeX1bXCLZd/DU4aPnHRxsb915tHT+5JNnrmzdcUgml5mM5oH9Ok4Y258kCav0xOV1vEIto2nmeWxS9coV+PGDiZJISFdn+6joeEAziYmpcplUrVYho4njOF9v9xfuFG/F4hDL3/Yos9C2mCAsPUFpxsZGxXEoLV2bkpo+b/H6Fav+gABm5+hz9AZdjh5ATNgWIgDMJkvunYKmWYBommZYlqWMJtEb/xOEb0EmlY787juO5b0l8j/FMlzTDh0JAmRl5GxYtrBDr/69B/ZkAaARmDPxm2vnznQZMDSsevUlv+/U63S2Do5SGWRZQFNs/9GjeacKit8bx3ESqXTgmHGd+g2izGZ7J6e8bjS29g6jp07vM3Isx7B2To4QgqwMrbuXd91mrSQSMv8EcZHx/78AOp3u2bNnJtPrnQdF3oqQL3z+4s3mTeuobVS/b95vMJjCq4UyfD2EmWMRRTPJUXH3HjzV6XKTktMoit6649DwoT2CgnxxjE+WAhRV1t+7XIDPrxv2uro5SSSSLVv/zM01fDNxyA+zVjo62vXo2rqMp6uNjeqf2TSRTxWMwKOexl69fn/lkm/btW3MMnzHz+9/WHHw0NmBfTvKLLOEr6wPodFo2rHnaLMmtWbP/xoA/Oclaw/8dZogcLOZd3gnSQLgODJT1atUsLO1Wf/73ti4pC9H9wMY5CgmISGlfZtG3Xq0M+n0HbuPPXnmiqX8gleZOVodxOC06WMAQCeOnP/y6wVxccnlg8u+2bi26OE4ztnJoV+vdrMW/Hrh0o3mTWpXrVyhapVgqYR0c3X8bfWP3ftO7NSx6dChPS5duH7n3pPGDcL371zu4uKYkpwuRNqEL3ZWtk5IrWM5bsmK341G04lDvzo62G/cvD8uIemXpVP6Dvn2sw5NhgzorFIpnj9PSkl9fVv+aCDIycm99+DJ7B/Gzps1/vCR838ePrt53Zwq1UPPn702avzsKpXKt2xZ33pKvAWHCEjgGRnpsfFJdWpVlkokEglB87UUL8pcGZazkUoAhkl4K1f+GvjCV4J3zuMrWHnfV0sFN1/g8ur+81pAvJKDbnlEELharRzYt6OQiEKSpFqt9PRwBi+n3oTVX5bcvnLMoOSDYRgpKaACEYRomrGSaHphYza9XUsxNMsyECcIqVT2+8qlyfHPJRJpakrS2cN/dR8yjCRJmuEIicTeyYnjOJPxxWdFmV/ZG0KIolilSq1S2+TvRsMnMFDAxtYOWvrj4RhMeB5TvX7DVl26F5eF2f+Xd1WrVq1UqRJB8Lm0NE1LJJLMzEyj0ejm5objuE6ny87OdnJykuVV3lnef1pamtlsfm15Tk4Oy7Lx8fE//fTTZ5991qJFC5Zlk5KS+BbUrq55SSo0TScnJ0MIhZcAJQqE+GRkgsAnfbsoKTktU6ub+s0Xfr6eAIDB/T/7Yfaqs+ev2tqqGzessWPPsV17jw8d3NXR0W7iNwtVKjkCQKmQ9+/d/ssx/b7/+osRX87q0GU0SfJf73k/jpPKZRVDyv04d9XvWw7SDOPj7dGxbWOrHOKLFCXw9LmrDMM0qFddIZchjoWkpGWLunsOnLz74Gl4jUoURZvzdV43WqIanm4uJ09f2fXHgZyc3NPnrj2Nen7i1OU6NSsDjvtjx6Ggcr4VggPUGnWjBuGz5q9t2rhWcJAfYDmG5eYuWpecnN6vT4ecHH1CIp/DhxAymswYhBFPYoaP+7FVs7o1qlc8eOiMs5O9vb2m6Ocj3oqgNoYN6RYcVPbAX6fX/rZ71vy1XT5rNuP7kfb2tvZ2apIkVEqlyk6NEPBwd+7WuYW3bxkgeG3geJ5W4LPlLDl2GZlZ124+6NernZefFzJTnw/qjBBieGsYXKVUqu1sgMXy6s1t844nJCSwU4dmEpnk3MXroSEBDg520c+eu7o6Ojranrtwo2XzeoI5SLGDEOJlHEQmvWHJT5t02fqWzeviEqJK5eBLf9/O1emVGnX0k+gnT2PHjugDMBgU6JOjz71z93HDRjVpM/Xb+l2hIYH2dpqzF25qs3RObs4JSakGo/ld5BfLcl5l3J0cHbTZup61KwMAr/598/adx2V9y/zHVkKiIGMZ54CSDIZhz2Pjjh46wXHci7KnD4VDnEqtatWmmYurCyVUk36qIISkctnE2QsP79z64NYNmqacXNxGfje9Qcs2vPa1jDDeJc72b0I5L1eKZVH5sMqhVSvTVLF1J/v/8u7ixYtTp07dsmVLbm7ukCFDypcvHxUVFRcXV6VKlYYNG+7fvz8hIUGlUq1evVqwx0tLS5s6dert27dVKpXZbJ46dWrTpk0pivr5559PnDhBkuSjR4+6desWGhoaHR397bffJiYmAgB8fX1nzpzp6ekZGRn59ddfZ2RkUBTl4+OzYMECNzc3UKJgWbZOrSqdOjZ99DgyoKy3t5c7azlvBvTpUL9utWdRcYH+Xr7eHqOG9SQk5M5dR12cHO5c3c2n2UGwZ+/xxSs2derQNCQs6K89P9+5F0HTTMWQQAcHW47lundt1ahB9dt3I1RKeaWKQQqF7JPyvRN5DT7pjWEYhh0yoLOzkz1nybTDGLpapeDunVtoM3UIoaqVg/X6XKEnm6ODXeuWDezsbCaO6//9jJ8WLdvg6+05ZnjPPw+fS0pOs7VVfz6o64G/zqSnawV7lEYNwhev2NS0UU2FWslStFQqmTRu0KLlGxYv30gSRP8+Hdq1bhAXn9y2ZX2VSlkuyG/CmP7rNuw5dvKSq7PjzKmjeAcWq0l+4mdtCKJx09qNG9YwU9SFS7cGj5hapVL5QQO7Wr6dlgiQRc9BaGlOn2/A/ZoUsXRNNOfmGlRKBb/qiylvXLhx5u3nrdv+sxzwhpe0mcrW6e/cjRgzaa7lxgAlJOnp4WLpd85Pp4NihUPcoaPnm7QeAgDIytLJ5bJ5M8f7l/VGAAwd2OXzUdNbfza8QnDApcu3K4YGtm/bEJnMVSsHd2zbeMio6Y3qVY+PT0lMTtuwZmar5vVWr9/Vtc+EQH+fzMwsk8nMIY5vzcnyuSsvenghZDSa8+awzHxZt9HZ1Wnk592/mbb81JkrSoXi4uVbwwd3w3H+M82/raUDsNnSexB5uLv8vGZb+65jli/6pnw535Lr/Y7j+JPHT7/68nuECuYtNGpSf8XqRb5+3mbzJ63wOJbz8vP74uvvaJq/YOI4QZCApl+0mi3QF2ItM7rFxv+Xd2azOSMjQ7AHfPr0aWho6E8//ZSWlta9e3ej0Thz5kyFQjFgwIBdu3Z9//33AIC//vrrzp07W7Zs8fDwmDZt2vLly5s0aXLu3Llt27YtW7bM29v766+/Rgi5urqOGjVKo9GsWbOGZdlRo0YtW7ZswYIF27ZtS0tL2717N8uyAwYM2LNnz8iRI0GJwhIvoTy83Dw8XPj03pcKjONQWd8yZct68crfYuwECeLR46jb9x5HPI12c3EymEyPn0QrFXJe6tGMSimvW7uqcGMWbpMswzg52jdvVoev3HjP3qAipQ/h3jb8i568BfHLSzbHcra2NvPmT+Y7o1D0gP6fCc8imgkM8Fm06BtkMkMM2/Tr7IzMLFtbG4lUUr9xbf5uSdH9+nbsN6gLMFMsw+ISTKfTu7s7N2pQHVnONI7jAgO8V/80LTU1UyohNfYajmb8fMssXPQNMlMcx/Xo3qZD20bZ2XpHe1tCSua5ylkDLMulpGa4ujhiJCGVy5o0rlm+nF9sXFJeiIxP1cJeux4iPoTGf4URn0r7svwNIU4ukymVipycXEASOMffGAwGo7Anfj8kAcz0W7d9Ze8AEQRha6Nu1rjWkvmTBR8Zk8kskZB8CmWxwmtUlhvY97Oa4WH8xQdCtUpRqWKQl5e74G8X6O+9YfXMPftPPI9PHjeqT/s2jVQqBcdyJElOmfx55bCgy1fv1q7p1qFdo4qh5RCHNv06++BfZ6RScviQrplZOX7eHpyJqhxWfsm8yfzIxJJst2juxHIB3kKbn1Ff9CJwjKPprp81d3VxPHryEk0zy+ZPbtq4Fp8CyDD/bMuwJEnMmjbaw82ZM5q7fNbMxdmBoignRzsryfv8GAowiHv65LkBvYYtX7WwUuWKn3i2FWO5nwr5AwhxlLnEnycfKO8s7ll8lJvjOEdHx4EDBwYEBHh7e/v6+rZp0yYsLAwAULFixaSkJGH9Jk2a+Pn5paSkPHz40GAwZGRk0DQdHx/v4OBQvTpfTFeuXLn79++npaVduXKlTp06+/fvF6pdLly4wDBMSEjIxo0b582b16JFiyVLlpS40B2GwWpVKvh4ufPZKG+ELnip93IZ4hDGsoMGfBYblzBu0jwzRUtI0t3N8YfvRzq7OLxo+vlG3hIfE/408idE3pE3k7T4+QWj6c1n+ZNHWG5REs5ODvxAg2bASx3Gr2xZH4Nw46a9C5b81rBedT9fz7xxrSBBnJ3seU9gy5q8xMz3WjKpVO5i6RpiTdoOJ/DY54n9h37XpGHNPr3bqeSy85duPnkaM2xQF77HBgAsxz15GhP5JJK1RECFrRCHNDYqjUZ94M/TFcOCdFrdrduP3VwdEEL2DrZ1a1X+Y+eh8OohDo72O3cfffgocs4MPu/wydOYp48i/bzcNTbqN7fN698g5JlBkmjRrM6P81afPHO5apUKjx5Frvlt99fjB4WGliv23l8IobCw8mHVQvN+55PVXx4Vy7I+Pp7jvxzIhzkJnL9hvhwDyOWyrt1ad+3cgi+AAC+8o2vWrFQzPMwyxwj5bDyK5hjWzdXRrYwbZ6YQx8lk0qbN6/JjEst4uHp4xRcnJIT1G4TXr1+dD2XiGEfR/AdnKbnN2xbDsIaNavK9BxnG3k7TkX9pgEz8kAOUcAo2ifD61Zu9uwz8+del9RvUofmAVemUNe8IKu1v//1qi4QOWsJ3+99avkRFRS1YsMDZ2dnPzy81NZWv7GOY+vXrr1q1aurUqb6+vn/99dfw4cMtoXijVquNjOQvqQEBAc2bNwcAdOjQQa1Wb926ddy4cXZ2dvPnz69ZsyYoISC+mIv4YcpI3m/9HaalOJbz9/PauHZ2QmKqwWCUSqUe7k5Sufx9G4aKiBRs/w8EgIuT/bAh3Tq0bcR3acx3m/zvDa3zhsqxnKen6+jhvWfM+WX3/uMKuSwtI2tQ347Nm9RGDCOVSmqGh27YvC8jU9uuTUOVUvnSMpDTaGyGD+0+/usF127e9/bykEpJlUrJN73A4ejhvZ48i+ned5JSKTeZqdnTxtja2Vavxu8nKSXtp0XfaOw1b24rXDMlElJuqXpBDNO2dYPb9yJGjZ/jYK/JyMzu1KEJ73bEe+QXP/yF6N+vRYLU4+Mfr+ae8+eAmbKEnf5ZzlL0P5PNL3dpmQQ3/3Ne5esfmDcs4ZdbHvM7zKd482/L/5oXvc4bw5QuHBwcGjZs+O7J6BiGJSYmnjt37rXl0VGxA3sNW7xibsfO7SiqVLXeFnmNAi4dZ1l2yZIlgYGBixYtghCuWbNm48aNEMKMjAwbGxuaplNSUmbOnNmoUSO9Xi+cr4MHDwYA3Lt378qVKxzHHThwwNXVde3atTk5OYMHD169enUJkncCUgmJ3nlkIAhlb28PIdMGcayo7USKHYRQy+b1WvJRGT4JAJRw+HEXjnfr2rJ5k1r3Hjw1GExB5Xy9y7hZvnAchGDm1DHfTByKY5hUKmlcP1wmkwrahWXZTh2aVKlU/smz2HKBvq6Wfm5CyqObq+OW9XPvP3yWmZkdUiHAzc2JY7mZU0d/M3EIjmFyuYyl6bduy5qp4UO7fz6oi0wq4VhOKiF//H5Uv57tIqPjfL09AgN8+P1bpUp+K/92oXtz8UfqiE9chwQEBGzZskUikbz7JkePHj1//vybf6CU5NSh/UempWUMGNy7ZJ1sIgUs7ywZrEbBu9xoNOadCiaTiXkZqKcoShjvYhhma2v77Nmza9euPXv2bO3atULesdFoTElJiYuL0+v1f/31l8lkatmyZadOnX755RdnZ2dbW9sffvghMDBw4MCBt2/fPnTo0Pz58+VyeVZWVlBQEChpvG/eDD88Le6JGBGRtyUSlHhh98q3jGY0GnW9utX4oZSlvvJlG0regMNWo34RWiOJ/F9hluV8vN19fD2RxQSBd6SzPMta8syqVqkAIOT9LS3R+rz9CBOI/7athHe7IIXHHMdn+AUG+ASW8+VrGSwU5yclUhzwTU1ejcyRGPmadR/Gm8q8x1xt/tphDw8PDMPi4uKEXw0G49cTvk9LTZv09TiCwIvFlU2k+OWdm5tbu3btFAq+l3O7du0cHByEc7FFixYBAQHCOnkBNgjht99+u2jRojlz5oSGhk6cODEiIgLDsLS0NI1GU6FCBS8vr2fPno0bN27ZsmVjx45VKBTr1q1DCNWvX3/kyJE4jo8fP14qlS5duhQhVKdOnTFjxhTyJyAiIvKp8G+pq/kt194cnL1WSJt/q9dKg1+1bvvXbV9b58V8t3iH/YRJTEjKSM+E+axMCYKIiorJf6q870Rq/vWDgoKmTJkyePDgqKgoYYnJaJo1fX5aStq0Wd+p1aq8YI1IqaGwut+81mStf//+Go1m+fLlAICkpKQ2bdpMmjSpZ8+ewrOcJTf2v/fwPq/NsbkPQAEVk4uIiIiIlHogQAbchsJksGj9aAT755nT52/ZuD2/vIMAmkymjPRM4deaNWuePXv2fSdnW7VqJdzi69evf/r06cuXL/fp0yc6Ojr/ap91abfkp/kOjvZ0IeQFYRA8N2IcdHrDzVqkUOAQsJNALzkvqAqrbctrymzQoEGzZ8/u0qWLWq1OTk5u1qxZq1at8p59q//kx1UMwX8aaIqIiIiIiFgxmRnapMTkQn0Jk8lUu3btLVu29OjR4/nz53nL9+46mJGuXb5qgX9gWerTtsQrZRRRV74GDRqEhIQ8e/aMoihnZ+dy5coV7utxZjF6JyIiIiLyznAAUxbXa2N4EfXYqFWr1qZNm/r37x8bG5u38NyZC/26D1m1fnlYlYrmfPXLIiWaomu67GChCF4IIcoUOx9xRjGAJyIiIiLyTnAUW2YktKnJRweKFVsLgndYampqge+/QYMGW7Zs6dmzZ16lBQDg7p0HvbsOWrxiXovWTc1m86dpmIJZilcErwAcx4WKUsH611KJVcI+k6KTd0UKZ7Z8RUV5JyIiIiJSkuZ8+vXrJ1jDXrhwYfjw4YXhTFSnTp2NGzcOGDAg/yxtdFTs5wNGLVwxu0u3jpRgH/0pASHMSE3V67I9ff0AADHPnirVakdnZ4M+Nzkhzq2Mt0wuL1mfScluuvz/cu/EH/FH/BF/xB/x5x1/rAI3N7egoKDy5cv7+fkVVNcKoS1y/iWNGjX6448/vLy88i9MS0sfPnjc8iWrMAvgkwFaPucVP34/oFXD9OSk9JTkga0aLf9hCkFixw/s6V6/+qVTxwmyhH0gpTR6JyIiIiIiUgLJC9cVoFmJ2WyOj4+Xvxp/CgoKmj59+qRJkzIyMvIWGnINU7/5MTtLN/6rURKJ5BNxYUQIYRjWuF1H38ByaltbCOCAMeO9/QM5FgRXqjpkwjcB5Svw/aNLFKK8ExERERERKYXkibmrV6+Ghoa+GQvEcdxgMLy2kKbouT8upMzmqTO+AZ8MHMc1aNG6YcvWQvfkAWPGI8T3Ug4IDikXEsJxfIcbUKIQ5Z2IiIiIiEhpA0IolUqF0J3QdOq9Nr929QZN08TLViufAmy+NMe8Th4cx5bQCKYo70REREREREoJKSkpNMO4uriUKxe0YsUKmmEinz2LiIiIjIyMjo42m9+1Lvi1lmgiJQ7x7yciIiIiIlKCEQJsEMKY6MjjRw48j41zcXWxURJyDFdp7FpZSE9Pf/z48Z07d+7du5eWlvbWglyGYd5d/4lYOaK8ExERERERKcFACJOTky9cuHDo0J/m5GtypIWJKtKRPH9HezVWEhhcyc/Xx8/Pt2nTpmPHjpVKpTRNvynvCILYvXv34MGDP53Z2NKNKO9EREoyiOXd9l8AAcTe2e2IAxwDIGHZBFn2g1kev21NxAGIW49zhIiIiADLspGRkbdv37x69frJk6cSYh71amjTsa6zp6vK3lbiZg9trmdGxBzfe9HEkI6Vq1avU6d2k8aNw8LC5HL5m3uzsbGBsLA60YsUMaK8ExEpuWBQ6gpxJa/PeBlGc3QaYHMAJP/fhggSGkzuzxljEJ0BMCkmdUVsNmKy39BwCOJqSDogKgVxJlHhiYhYDzRNX7hwYfPmzcePHVWg9Gr+8u5dXOuGOVQLUMqUciCRtW+qalHP89Fz441HWRGxutuPzi2cc/z48ZOdO3Vs3769t7f3azv8RGxQPhFEeSciUjJBHMTlUrcBuDoE8bE3BBDH0ZlMxiEm85RF8P27FEMMpign8/nGHL+KTj+Ikx5S73F0xjEm/S8+nvfKmiymCJZ4DDA/X4JyIywxPBERkeInJyfn9OnTa9auvXbpTDVf0L66fatwuzLuNgAnIW0EBgawDGBpKUZW8lNWDNDQJur6g/TtJxL/vHxp0aJnyckpvXv3Kleu3Gt2xyKlBlHeiYiUXCCUOHBUOpX4GwAMwG0lTq2lZUYhWsvqrlmEGgcQyqfJeAnIz8BCgtPfNz77DpnjIcQBxCHpADH5iyjgizWF1BwWYlJIOr5DRFBERKTQQQhBCLVa7cGDB37+6afoJ/daVpZ909k5yFMCMQjM+pdfYiMw6l6M8TAMkyulhKROVdewcnaBZWJ+/TNhw7rVaWmpo0ePDgkJKajeGCJWhSjvRERKMgghNovV3wPIDBBjppJl/nNwRSCbfRVABCWuEJNx5gSAePt7iMmg1ANR6YjJ4gUcP9n6Us8J8b+8x7gCVwQCQs3pHyHAvPKsiIhI8QEhzM3NPXHixNKly+IiH7SvrviyvUOgh0XbveU7KqRtsCA3B2AQsIxKKh/Y3ketJJfufL5v316NRjNixAgfHx9R4ZU+SlgPNRERkddBlkgb/4MwiQuAkDMnAggBQqRTR6nXOIir+KAdYqCsjMxvKq6pijgTJvOVlZ2BqypaJnbzw0KZt6zsLJnPZIlzV5nv96RtA1HbiYhYD48fP96yZXNM5MPwssRXHRxCykhxvj4KWYLub/zkj9wbskF2qlKKujZ171DbnmS0B/bt3rV7t2iGUioRo3ciIiUZxGJyb4nHYD4Vj9TgqjA28zSTfYmfgeWz7/BXc+mgZY4Vy/f41SE7QgCTSlx7YaSDKWYhZ3wGZd5Szy8gJst3nxARESk2tFrt2bNnL54/W84FG9TAtowGBxSXoadzzUAqwe3VOElgAFq+rf98uSHDcWlZtJFGCinuSKcqVIp2NWwTUw27LsSeOnGsUcOGlSpVEn2MSxnin1NEpESDIK7kJ1IBB6CEv5BLXDGZN2d8arm6Wwb0r67/L4+F31lM4oIpg2ntSVZ3BUAC5dyg0/ZLPYaKNbMiIsUOx3GXLl069Od+ROUGOMqaBUglDPs0lbkWL7kXp5dCc+NgWWVfuVqO8d9XCC3/AhPNRSRz55/iD59n2SuYFpWUVcuyYZ5kOU+ZUgoTou8f2L/P3z/A1lYjWqKUJsTJWRGRkgwk2NzHxsjvjc++NT6bbIqaBjBS4jkSEg5vzLq+AwhhuBpiEmRKsFRg8FUXgDXwuxLVnYhIsSJUVJy/cOHRvZuh7mQld1LGoagE0+qLRKZH9+dEtXUX6G+3pR6/qWONDDCxlh+OMzKPok3rLispr66xTPDaE4bvN6deuJ9DsLSPLazqJyfpjL8vX4mLjxNeorjfpUiBIco7EZFSALIUyTKc4QmTeRqTe2NSVwDelHfvMjQXpnXEK4OIiBUBIcQwLDo6+t7du4zJ4KIA5R0Icy5zM5J6mC539ApxdvczspK/n5rPPzJkpFOAYoGZBRSjz6ZuPDNFaRUuXuXtnT1zzNjVSNPtZ8bcLNpZAf2cCBsZTElOvHf3jlBi+2GHx3CAFQN/VoY4OSsiUsJBHOBogCjL/CkOpc4AcchSKmuxQSEtRbIUX0iLKd/0N/lnBpf/P8sx2YAzYnIfSy42zRdkEBoICbG4QkSkGJFIJJaWstEZ8ZGOSkyOAVscsSYmxwBS0rNmzPghMyMtS5vBAZCTy+bmMCYcURwgcEDRwJBD3bx5527EN/ocnclocHKwRUhG59IEy5EQOShJnT7n4f37HEJSqfTDAngIADMHSAiklqRfEWtAlHciIiUbKHHAbWsCREOAY8rypFNHNvsqMsVDgHHGGNKhJWHfjNPfgVJP0qkDxBX5YnjCdRzyjS5YA25TGdff4UzPWd0twq4RZ4jgjNGYPIBw7iK6GYuIFC8KhQJCmJ6RYdaluisgxqEsHYPbYZ4q0t/d4dzDBK02k8AxT1syyIE0mLhzsTCJxpU456tgfTSYi4x+EB+LIGFrq6kU5OPrZCYZPW1gWQrZkECOchKTEjmWk8vlHzw/yyGQwwIaAypxMGgdiPJORKQkw+ZiygCZ91fCb4jV0RmH6NQ9iDUAjGCzLzE2VSSuvQH3GUelMdmXCVzOh/R4OMAZeTsViCMmi07dK3HvK/EYYor8nkreKiHtJZ4jAaNHVBqbdR7Y1hG9UUREihGVSgUhNBoNrNHgaAdxDiRrGZkHEaqiK8oyyMr+6bkMYdY1dNT62ZiuZuDuFcs3qVIuOT7+zqVr9ogbU1t1LMkjhdE42CorqtOCFHoFxNKzmGw9Zy/HZMiUk6XlOO6Do3fCYJFDIJOGFAJ2JBKmBUSKEVHeiYiUTCCGOIMxdg4EOF8iJ1gcAwawZv66aom3IVZnjplPSZwBlCA6BbBGOm0fP9+KK1jDU8PjEfz0K++cghjtCSb7giUZFyE6zRwzE5IuACMRlQw4M0jZallTjOGJiBQPQjdYvgcNh8rIAYToZgL9mTfpKgG9PXQmMkHPYhRFpRvMesip5LQ7nujJUVK5IdEJM2XiNiw3IsQsIbNV0lw1zHGSsbQei0qlGIrzccHvxjEURRfUoaaagZGFrlKEi3UaxYoo70RESjKc+fUh8itVERgALDInWgQfxv/wnSpejLT56F3e/CyAvIwTHvOeeSwyJ7zYin8Vk2iMIiJSjOTm5iKEFEqlRK6SQb29FFxIZv9+bm7sSfjIIOIyjyQxiUZkb0uEuErsbZHclA4iM1UAr+ImM7moo6KznifqJZSusQfpoMQBBy9Gmp6l0O5KTM3bpxBKlQJAYDabP94bBfIKDxpZ4CVHcnFIWHyI8k5EpETzf1UXfBHbe8v6r2376lOiRYKIiNWQk5PDcZytrS2pss8159RzAEkK8EeE2YFAle1xBMGjZOa+lgtzBXYQA3qZXCVhtKSJQ9kUY6BNiSnmq7G0EnDV1NAOQzHZaM8DI2VGNX3IdCMLCIWjkwsGMZPJVCDWdxgEaRTUM6CcCuH8UFKkGBDlnYiIiIiIiFXDsrzPkUajgSq7rIxYbxKEa+BfyWjtQ6qNB9bQBa/vANORbbxtOQMhx7L0IMPMMhTEMJyUsRKFgVRQysQGsudqjrkYzeyNYlINXC03wlcOErSMFtl5eJbBcaxAoncCGARZDLyVDW1IaCsV8/CKAVHeiYiIiIiIWDsIIT9fX0+/gNiYm6k6FCSHwBFcyeT2xXDX01hnJZFDKLzDm2BK24SYSClJGgwGXXa2jY2NjYNTWlJioin+Sg59LYHKNnESDDR0wUNtIaCYhEwGKZ3CKleGEAoisqDAIchhYaQBK6/h3KT4my10RAoV0bxURERERETE2uE4ztvbu3LlSmmE5u90oAHIV4oq28BsgOudVdBdQeOsh5ubj7ePvYu7h2+Af3BF36AQVx9/O41SY3raomyWX5DC7KJIw3BPBfSXA0eMS8jmbmXhZby9g8sHF8YxYwDQHLqu5aINnCXDV6ToKK3RO3GcICIiIiLy7pSAW4ZMJqtWtcrJ8pWO3TpVXQ0RBiIYvG4Vm/aVlJievp9kImTKqtWqubg4Z2VlJSQk2NioSVJizkpWG5O6VgfuLjZJevbsI+nV2zlRWZQthGees8ky34FNmjo5OxfSMUMAGISuZzE5DF7BBscgX/8rUgSUTnkHMbk4ThAREREReWcsHZatGMGRrmJoaJOmzTbev7k9ObuyBqTLyI5BMi/A/vnMmEHbMgACxNvXYRhmb29vZ2enUCifP3t08ID53I2cViFKNw3Rxl8Wl0zFRlFpeuZ0OunbsErLli0lJFmIR27RzneyWR2DatrhBAY5UeEVPqVQ3kFMJq/wm+V0EhWeiIiIiMi7gAyM3syZeJ8Qq0QoenB2du7Qvn3E40fH9+/MBqYKrrgzRd+NMR16CgPqNpVKpRcuXMzISJdIJD4+Po6OjjpdDiLlWoXvH/fucPrstv4StYqsoEB7KHg5HmmCwzp36uTn5/vBbsbviLD3hzpWR6OGjoSSgGKP2sKmFMo7QeEV9yGIiIiIiJQooBGUBAICAvr1H5CYkHj+8mmXbDY90XQlmgEuFeu2aEvKlcnPnmo0Gg8PDw6h27dvsyybpdVqHF3vREVvfpDizjIhjkRiEnclhaYcvbv36t2sWbOiOWxLS2wQmcvpGLqlC2lPQkZUeIVJ6ZR3IiIiIiIipRKCJMPDa4waM3YJw5x+fF1hMnE2ni269a1crXqmVsshzsPDQ61SnT17NjY2JrRCBV2WlqMZCiPupIGNj6kADX0qFVD2vr37D+jarZuDg0NRHjwOQZwJ7UigWzoTPkqMET3xCg1R3omIiIiIiJQkFAp5kyaN1SrlT0uXHHvysH6Fhl6Bwbm6LNqgt1XI9dqM61d4zBSVlpwkUyhVDg5mmk02MNsNwD5HXrZ8yLi+/du2b+/q6lr0B09AkGpGOxPpVi5EqBpnUEmoaimBiPJORERERESkJAEhVCgUlSpXbtG23dVrbqG1al25/PedWzfi4+JNBoOJZjBS4uru4VqmjNrWnmHo2NjYtPR0qVzu4uJSo2atAQP6N2zQQCYrtiwmAoJsGm2PpzOdUX0HghUVXiEgyjsREREREZGSB8MwEMKwiqE4jmfqDak6Q3xmdk5ODkNRHMtExcRKZFJbB0eZTGYymYODg8PCwlq1ahVeo4aLs3MxajsBHAIjC/YkMjkMaulM4hCIxRYFiyjvREREREREShgIIVtb2549ewrBPLPZnJWVdePmzYjHj9PS09PT0rSZmbw9ioO9i4trcHBwlSpVPD091Wo1WZgeKB/QVmFfEpNBgS7upBwXFV5BIso7ERERERGREgaEkLAg/KpQKDQajYuLS5PGjRmGYS3wQTIcJwhCKpUqFAoctzpjP2iZqD2eymgprk8ZiaMU0mKxRQEhyjsRERERERFrB8P+TxNRDMMUFj74JQrb/e7tLwqABAMXM9kks3m4j8RXgVFiDK8gEOWdiIiIlYDEdkUixQmy3sARx3EGg0EikRTqq1AUBYoJCQYe5XCznpjHlpWE2eAm6/1TlBhEeSciImIVcMbniMkC8P+EKERECgMIIMvkAKmHdbYmu3v3bvXq1Qs7upaTk8NxxSasSAw8N6IpD82TAiR1HAiGE8tpPwpR3omIiFgJyJrDJyKlHb5bK7BWTCbTkydPQGmHhEDHoB8izCN8UWtnsjjmiksP4kBZRERERETEevvMflIvTUCQy4CZEeZLmQwpKpSPQIzeiYiIiIiIWB0QQolEwjBMYeycZdm8eVgcxzAM58PnL0EA5NXkFjEc4n86u5OVNLjYsuxjEOWdiIiIiIiI1REeHn7s2LECj6JBCBFCs2bNOnr0qLBkyBcDu3TvSFF03joIcXZ2thiOFXEMjwUAg+ALH0mfMvzMrGiD9zGI8k5ERERERMTqsLW1rVu3biHt3M3NLe+xf0DZBvXqmVlTvuchhziW4Z3zigyGAwoc9PWRdHQjGY6P4Yl8DKK8ExERERERsRaKpqtEfhc9lmVpQNN0ocwCvyM0Ak5SOMiLrGNP0GLNbEEgyjsRkVICTdMURX2MrwGO4x/jiSoiIvLxHDhwIC0trbANSi5fvgysBjMHvOTYIG9JsBoTtV1BIco7EesiOzvbaDR+zB7s7OykUikoHFiWzcjI+EgJ5eTkBAqBFStWzJ07Vy6Xf9jmCCGKoiZMmDB+/HgrbF6UD8j73Avp36/cCCzLCz5ViN/pe2+SZ+jw2kEKTg8fdZD/vPlCe8sixclFC+CTgUagvBob6k06y3htJ1JQiPJOxIpACM2bN+/o0aMfLC84jgsJCVm4cKGjoyMoBJ4/f96rVy+GYT7MX1TIUx47dmyfPn0K/NjS09N9fHzmzp37AdnQEMLc3NxJkyZNmTKFoqjvvvsOWCUYRnKI4VgKIIBhBEZIEMcii10Z4miEOAwvWFt/hBBn+VvD99okT3JBiGG4BCE+kYk/Pxm+KwCGf/jsG0IsfygW82fEMQixlr2J/mAiJQ9k0XaVNXhvT9KGhGKdbMEiyjsR6+LBgwcBAQH9+vUT+mG/FziOb926dePGjenp6Rs3bnRwcCjww8vJyYmJiZkyZYqvr+/7HiGGYZmZmd9+++3AgQONRuPQoUML9tgQQm5ubo0bN/6wzc1m85IlS6pWrbp69WqKoqZMmVI0OUDvA6ZNvhP3YFd26n3EMQqNt2tAc1ffJjgpRxzz8NwcvTYqvMMaiEsKJKAFMUKbdDv27payVYaoHQMR+v9/bghxfVb008s/UaZsSxUgJGUae7eqbgEtZSpn2qS7e/I7xKGwZrMJiVJQpe9xPBAytPHZtdVShYNPWB+I4U+v/JwWe75Sy4VKWx/EFWfilMhHUrx5b0VcQiEgfEfrOeAd3QgJBsUi2QJHlHci1gWGYWFhYa1bt/6wzW/fvl21alW9Xt+vX7+NGzcWRgzPzs6uefPmAQEBH7BtZmbm6tWrw8PDp0+fThDEwIEDC/bYPkAT52EymSiKat269bBhw7p160bT9OzZs4HVgGFEVsr9O8e+wnCpR1B7QqJMj796/9Q0faWowBojAYT2HtWUdr58RymELK3RIa+fIISWJS/FGR9Ns8S9uLw5UyhEwvgoHcZHxRAnCC8IIWVIT3t+wSu4Cz+p+vL2w++Q//XFaq8AIWPSpcaes3MN07hUAhxnzEl8cnlZRtzlkCY/SGQaRy++EBJiJMp3kJb/4m/b4cujfREOhIhjtUm35DYe/JMI2bqG4aSckKot7Rb4t2rZw1ve4z/vNN8bFLEGLLF22LxFIxu1SvjDFfkRgKrhlT7m0vEBcPzpD5o5E/UdCUI0QCkcRHknYnV8zIXGbDZ7eXmtWbOmbdu2ffr02bJlS4HH8BBCNP2PQdR7wRenMczQoUO7dOkyduxYiqKGDRsGrAmKourXr79169Y+ffqwLPvjjz8WdhfzdwQBkPb8gtmYVeOz9XauYQigMhW63D/zY/zD3Z7lOyhtvV3KNgOCROPnQGnEUYREzbGUyZCEk0qJ3E6YzTTlJEOMkCocLElx/D8MbYAQEhIVbcqmzTqJ3EEIB/Kvyisl4kXC3Et5ZM5N4xizROFAkAqOe+NMsGziWrapd1hfy05QwuOD905NS40+7RXSzSOoHT+tzE+nIo6hEMcRUiXLmClDMiFVS6QazrKJEDtEHGvKSUYAyZTOECOEllkQIyDvQMsfu6NXLQfP8LzJX5Y14xIlQMiYk4Tx79Ex7z3y2+EEZcyizTpSqpHINRz74oVEih2EUJv2rdp2+MAx7cfDcRxThOFDDgEJDlo5klVsccHEWKQwEOWdSGmDpmlHR8fdu3d36dKl8GJ4H4xQwdCzZ8/c3Nxvv/1WIpEUeAzv42nUqNHWrVt79OjBMMzChQsLu5H5uyFE4DiOoyzdaRGGk/5Vh7r5N5PI7ABCsXf+0GdFhTT4HidkqdFnEiIOugW0THp61JD1HBIS37A+aoeAqFsbcjKeAYTcApr7VuqP4QTHMpHX1yCOVdr5JT75kzJly5TOZasOtveo/lpCG4SY2ZgZdX2tNukuQgwp03iH9nT2bSgc2xvHyvGJcRwDMcLOvTIpURp0CRxLP7v6C+K4gJqjCFIe93CvNvmWs1edxKeHjbpkgpSVCenmUa4tH9fD8JyMp5HXVudmPwcAyNXuZasNsXWpmP8lMIx4/mB3Rvy18nUnylSuGUlXo29vdPNvkfb8ovAeXco2LVtlALTk+SGGiry9MSXqFMeYMULmFtiyTHBn3KILi+AvJ/J/4TghxbN4KErvYhYBBQ5bOBNllRiHxBFGISLKO5HSiYeHx549ez777LNCiuF9/MV0yJAhEolk4sSJVhjDAwDUr19/x44dQh3JvHnzZDJZ8R4PBNCxTO34B3tuH5lYpkIXB49qSltfpb2f0t6PZUwAIENWTHbKfV5pQWgypCdHnjTqk938m3uUa/v8/o77Z2cqbb0dy9RyK9s8Oepk5I1fNc4hTt51AUvnZEalx15w9K5TpkIXDJdG3Vx/79S06u1XKe38/nl1iDG0IeLSouzUR/7Vh8nU7slPDz84NwsjJM7e9Swht1ePFiP4oBqGQ4jnZkbTtFGq4M9AXcZTvsbCouBM+uTEx38asmI9yrVTaDzjH+57eG6OVOHo5FPfkP38/unpBKksV3ssBonoO5vvnZxapdViiSJfzTWEhuyErJR7HGuGEKPN2anRZ3K10a4BLd38m6dEn42++autc7CzbwPEsdF3t8Tc/cOv8kA7t0qZiTcjr69FLONbqV/R/f1ErLi9bJHBIuBAwsbOpLsMMqX/7RYzorwTKbW4ublZbQxPoF+/fhRFWW0Mr27dutu3b+/evTvDMMuXLy9etxSOY21dK1ZqMT/69qbI679G3Vwvt/F09mngVaELn4uGOIuielELAiFGSpTlaoxy9mtkiXNJMw+Ncw9sVbbKEAAxha13RsKV7NQHzt71hJWVtt7B9Sar7PwAxCRSzc3DY9NiL6jsA/ICeBDDdekR6fFXy9ed7BHYBiHGxiEwO/VB0rOjjl613zRPyYi7zLEUQsicm5L09KjKzsfJi38tDMNRXlAQYqRUE1BjlLNPfYCA0s5PlxGR+PSwk1edjLjLppyU6u1X2TgFAYBkarer+wanxf3tUa59/ggPxPB8ZbMYTsp9qwzyDukGIFTa+WbE/Z2d9tClbFNjTlLSsyOeQR38qgxAiLN1CTPo4pOeHvYM7khK1GIAT6RoYABwlWH1HAh7SVFoOwzDSEmBBURpPpOihH1TRHknUpqx5hiegJXH8GrVqrVz586ePXuOHDly8eLFxWp6jCDA7D2q27qGmXNT0+OvpMaci7nzR1rs+SotFytsvV5bGSPkchtPjqH5UghSiUsUMrWbMGeKE1KckPMxvxcXf06u8ZQpXXi/FV78lZEqnfXaKPBqqWxu9nPalJ3waG9KpNAGFOZmxSPE59BZEuPyVuRdVLJS7ht1Ccji5OLsU987rI/KzpdlXjV0RJxEYa+y9eFYGiBOqnBQ2vkadfE0laPXRjNU7tOrPwsGKACxptx0Q/ZzIf3uX+AwXKbUeAl5eDguxUk5y5gtYcIUU25aRsK1m4fHCxUkOZmRVG46bcohJeqC+NOIiPwfWATKKrAqtriKKIoiWQihLkv7+O5tjkMfOemNECJIskLlagqlsogLUD4SUd6JlHLEGN5HUqNGjZ07d3bt2nXMmDG//PJLMbql0CYdxHBeqKlcywR3LhPc6fmDnQ/Pzk6LPe9j9+Y8Y1617Mvfeec54cby4vbyz12Gz+UTlBOCEIMYwbG8i94rm7MUhuE2TsF8WYZlHs2xTC252g0C7FUfFgQA8g7t7hncmZeSpJyU2iDEIvTW1PUXB2nJQcIwTML/yrEcSxESpa1rGJ85h/hDcvRuqHEqx1cA/9cnhAR3vVeAkOPt8TiVfVkbpyChnNbeI1wqt5XIbT+FCUGR4gVZaikCVXioDUYWlQEKTmBRjx+O6t6BoeiPNIVECJEk2apLj6/nLVHZqGm6xCg8Ud6JlH7EGN6789b87qpVq+7Zs6dHjx6ff/75ihUrVCpV0R8Wx5hvHhmP42SV1isgQXIsjRNSO9dKpFRDmbM++gr+wrsYQpym9LQpW6pw4GNyL18eACiRO2C41NGrtqN3XcTSEIDMxJs0lfPWlyYkSqnSka+c5RUX9W8frOBjYnkOZxkDZUgnJTY4qbS8Ou5erp1c7Q4Qizg2NeacRQK+NHN59zeMOIlUQxAKtYO/b5VB/JFDTJ/xLCf9idjuQqSw4aPcAASr8XJqPrWjKItkOZY1GY1cQcTbaIravXFdRlrq1GW/uHl60FTJUHjF4bIjIlKYvPU+6ubmtm/fPr1eP2DAgPT0dFCs5G/mnUe/fv3mzZs3ffr0DRs2gGICIWQymQxvIzg4eMOGDadPnx41apTBYCj6I8MIqca5Qkb81aRnR1nahBBLmbQJj/fTlE7jFPwRSoWXdNmp99LiLvFOcYw5+dlR2pRt716NV2mknGNZoz4JcbSNY5BE4Rh3bzuVm4pY2qCLv3Pi2/iHeyy2Ka+fcsIMaV5Hjbe/MIabdEnJkcc52gQQlx73ty7tob1HNVwit3OvwjLG+Id7WDoXcUxm0q1bRyZkxF3mXe4IqTk3lab07/r+OE5u427jHJzw+KCeL+xgaFP247+XRFxeyleEWENJtEgphUOAgKicCgSqLUaMRfzyEL71SvvBnDl0cELfbjFPnkqk1tyz8R/E6J1IacNsNmdnZ7+ZBqtUKn/99deuXbv2799/w4YNhdT49f+CEMrOzs7KynpzXqxz587Z2dnjx4+nabrAe1r8X3hXXAi/+eabhQsXvnUFkiRzcnI2btzo4+Mzffr0oj48gPmE9THlpj448+PTqz9J5Q7GnCSO4/yqDHL0qoM4vlOZpYSWB3EMyxjzPmE+gsYY/5m4RIhlTC8t6/j4Ak7Io26sj7n9O0ebc7TPvCv2sPeoxrFmlb2/nVulB2dm6LVR5WqNLVdzzMPzcy/vGaiy9dVlPCJIhV/lgRAS+Sde+deijf/WQ4JjzZbp0Rer4lJlcuTJlKiTECN1qQ/sy9TyCGrPsZSda5hf1UHRN35Lj7tIyuyyUu44lKnpHtgax2XOfk0iLi2+un9o5ZaLEOD4t2x5mwix/OvmqUnhPbI0ABxOygPCh987OfXa/qEapwoGXTxlzAyqPYGfnH1zMlekuAelHzxjLnyFhUtf/sfFAkJAhgF/JWfm+M5jWLEOJORyefny5d9d7WEYlp2d/fTp09c+wFuXL43u8dm0FavD69YxU//0HrRORHknUqqQyWTXr19v27btW69rBEFQFHXo0KFp06atXLmyuC7is2bNWr169ZtHyMeRcNxkMk2YMCEkJKRWrVpFeWwKhWLx4sVpaWn/4b+F4/iCBQsiIyNBkYMQK1M6hzScmlW+Y25mJE3lSOQOGqdgG6dyEOIIcV6hPdwCW/GPOcbRq65M5SZTOQtyR2XnW6nZPBvHID6cBhAptwtp+L1M6SyIMIQYjVP5wJqjMpNu0qZcf+eR9m5VMIursEThENLw+6zU+1K5A+JYZ98GchsPfjVDpqNXLXuPcIWNR34lhxCrtPWu3HKRyqHs65l/fAod7l/tC/4BJjTS4Mspytf7ypD13KhL9Arp5uBZQyLjJReEmE/FPrbOFbNS77G00T2ghb1HuERmx3G0R1B7lZ0vZdSSUrV7QGt7tyqk3I5jaVvn0Eot5qkd/Hm/PYBImaZCg+9kSmchiVDtEFil1ZLMxGuG7ARb98r2blVtHAP+EZoixU2epMMJnMBxiqLfV+RBCPU5eoqi7Ox5B2+apk1Gk1KphMUhrDje3A75KJAdCWJeLSgqFry9vQ8cOCCVSt9xfQzDzp8/3717d7PZ/NpTzx49mNivxw8/rW3UpiVl5qw5e1WUdyKlii5dugQEBPxHVwmJRLJ3796nT5+C4kCj0cybNy8lJeXfLgoYhlEUNXPmzKioqCKWdwRBhIeH/9/Vdu/ebTK9CJIVMQixBCl38qrr5FWHHzdjfE1DXg2ErWsogBjHmBHilLZeavuyLGvmV0NAKrdz829hWZOXXDgpd/FtaJk5ZfPqG5R2vjZOwcKueIUkhMEQJ1O7umvKIMTxRicca+MQaOMYBAAHIGaZfn01SoeQRGbrFtCSr2Z4M4DHd06rbonhUXmvK1M42btXQ7xXM2Z5XUulhaUy196jmr1HNYuTH4bYF09hOOngWZMPzLBmicxW4xTE8g4srEzlqtCUsbix8EeOETLhPQqefIhjZGo3j/KfWWpvMYvPzAd2XhEpWHAc37PzwKGDRyiKxjDMzd21eavGdevXJgice59UNZIkN/229dqVG7+sW2pjY3Pkr+Ozps//7Y/V5YMD36WhLYZhEIMcWwB6BQGgJlAZOZJhwEoGECRJurq6vpe1k729fd5A19bWlmXZnJwc4deUxPjJg3pNmLWg66DBDK/DreRdvo4o70RKFQEW/nudmJiY48ePg+JAKpU2atTov9cxGAxr1qwB1grDFGfvcz6njX05nn71oppfr/AduvJNO1omZ/NJUn7ikt+JcPnme8haBBA/c/rGve21Xb2lC9kbR/jKa73KS2FnAWKWuCNrmbF981N9UZPxthd48Qnwk8IvN+QnZ19pDP/iPebb3dsUp0ixIkyhXr18/c7t+126dYQYiHoWM3Lo+KHDB4ydMNLSRBhBDEpICQYhy7E0zeQ/RUmSJHAcAURR/GlJ07QQbWJZNjSswldTxru4OnEcX/jJcRxBEhBAmqbzu3uQJEHgBAIgIT4xKSm5bFlfhVLxMQoPAWBDAGcpIiD/BbWS7H6EEMMw7yXv8n9KwcHBQ4YMmTBhglarFZZkZ2lnTxyTk53df/SXGIZbp2GKKO9EPjms86uYB0XxdrjFfRSfBJYYGV626lBLAh5RlJ864hiPgNbCbOxrBnsinxoQwtCKFSZPGU8QBEJo57Y9P0yZXbtuzZp1whHHmUzU1b+vZ6RnevmUqRASBDGILFE9HMcfP3oS+TRSoVBUqlrRydFJEIuCmrF3sK9cJUyhUOTqc5MSk23t7R7ee2g2U2GVQ51dnIRrIEEQz55GP414hgD6Y9OOjPSMhcvnVAgp/8E9tQEAahzYSdDrNt8lHI7jevTo4eTk1L9//8zMTGGhyWhY8O2E1KT4sdNmSmUKK7ytiPJORETkkwVBCDUuIa+64hXJCyNOaeejtPezzBGXpluhyIfAt1KmKI7jMAxr3qrJ779tPXPyfN36tdMz03+cNu/EsdMKuYyi6AFD+gwfMxRaakJ3bd+3YPYSCKHJaKpYOWTpT/PzSgdwHL99887ShT//tGaRNiNr8oTvvby8Htx/mJSYHBIa/NOaxS6uzhiGnTl1/ruvpvMxP5NZKpMt/2VBWX/fjwnPKwk+5a6UaTtgkctms7lt27Zr164dMGBA3iwtAGDjiiU52bqJsxbYOdpZm2GKlYRORURERIoHwcGkGF7X0kKj1N0KRT4KjuNkMpmDo33c83iWZbZu3nnz2q1tuzeevXJ89oLpmzduv3D2b5lU9iTi6dKFP38+YtC5K0f3Hdlua2v75MmzPHkHITCZzKkpaRzL0TQTFRlTvWaVo6f37zywOTY27vBfx6QSSa4+95cVa2vUqnb2yrG/Tuxxdna6evm6XC7/sMEGBECGA4Vl8rNUntDI8rF06tTpt99+s7Pji1fy2LNp3aRBvRJi46zNMEWM3olYLzt27Dhy5AjDMP9Ry/mOIIRwHK9Xr97AgQM/fm+lG4SQwWCQSCR5DSpMJhPHccXakUxE5FOBz7cDkGVZg8F4+uS5lm2ah4QFswzbuFmDLZu2nz5xtnnzJndv3ScIrGOXdlKZzNvHa+Hy2QqF/PKla6+V4Qv7s7XVhNeoqlDKg8oHBlcISkpIhgCjaVqv13t7ezmo7CQkaWtrk5SY8sFGKjj2qVgodu7cmeO4QYMG6fX/eE9ePH5kYv/uP/y0JqhiiNlkLTE8Ud6JWCkHDx4cPHhwYGCgjY3Nx7s38VMYJtOOHTsoinr38vhPk5SUlObNmw8aNGjcuHHCknHjxiUkJGzfvl1UeCIihQvkA3hGk9HbjW+jrM3Uqm1UfJs6lrfLUSgUmRlaBjE6nQ7HCYIgOAuWkdh/6SthNUu+naWQCHAajU37jm1+37A1J0eflpb+8GHE0BGDPnjo+4loO4GuXbsihIYNG5aVlfViEQC3r/w9ukenWavWV69bl6atwjBFlHciVsqFCxd8fX0PHTrk4uJSIPLOaDQ2atToxIkTjRs3BsWExfwMFmW+CH8HIP75mrMsS1EUX3CXbyHDMCzL5qletVr91VdfhYSE5O2na9euubm5xdhtVkSkdMP3G+bj5QQBiNsR955GRHXq2kEildra2WVn6wicgBBSFJ2bayjr70tCQqPR0DTNMAxfjQGQ0fDCxBvDMIL8/7d1flUIK1WpeOrE2aioGCcnx+W/LKhTr9bHFFWUYuA/odAXdOvWDUI4ZMgQnU6Xt/B55NPxfbtNXbaqWYf2NFX8Ck+UdyJWCsuySqVSrVb/Wxev90WhUKhUquKycd+5c2dsbOyYMWMkEkkRvFxiYuK8efMSEhIQQl26dOnevTuGYUeOHNmyZYtlRsb7hx9+0Gg0FEXt2LFjz549EML27dv379//2rVra9aswXHcy4sPHmRlZc2ZMyctLa1mzZpFcNgiIp8m6ekZ167cwAk8LTVj2aKfvX3LNG3emCSI5q0ab96wvWGT+mXL+pw9feHZk2fDRw/hEFe5ahgA8Pf1f/To0zU1NX3xvGXde3clSSIjPePJ42dhlUL4YdlL27y8B8JoTZj8pWl6/ZpNgUEBnbq0562/1UqT0SSVSznWSl3cihGGYTIzM1+7d7Rq1WrOnDnffPNNfoWXlpw0eVAv7fyln/XlQ6HFq/BEeSdipQjfDeEbdfv27QMHDrAsW7Fixc6dO+etk5aW9uuvv5pMJk9Pz969e+dNHcbHx2/cuNFkMlWpUuWzzz4rluBZfjIyMmbMmNG4ceMiC4CRJNm6dWtnZ+e7d+8uXry4Ro0aKpVq+vTpffv2rVOnjsFgEGJ1u3btWrp06aRJk1xcXGQyGULI3d29TZs2y5Ytu3r1av369WUyWZMmTf7888+DBw/26dNHDOCJiBQ4SpXi3p37Q/qPtCSxYQ0a1/ty0igbjZplmW49Oj17EjV80Bg7e1tdds7QEQPDa1U3UWZff58Jk8fMnD537+6DOTn6sEoh4TWqKpXy1T+tW7Zo5er1ywmSUCjlQo2tQqnIGyHLZDKpVML3NSHJipVC5s9esn/PnxBAgiSq16g6dcbXbu6uVujxUbw8fvy4a9eu+Wc88u5Qb65syM19aYk3/mNazH08orwTKQHcuHFj2rRpAAAbGxsIYadOnQAAer1++PDhu3fvBgBUqlSpY8eO+eXd1KlTBbOi/PKuuDh8+HBWVlafPn1e6yxZeFrTycmpbNmyjx49oiiKYZj09HQHBwc7O7urV69WrFixRo0aEomEYZjdu3f36tWre/fueRt6WDh27JhwbDKZrHnz5rm5uQkJCYV0qCIinyyC3e6EyWNGj/uC5Tho8aJTqpU4hjEWk2q1jXr2gun9B/VKTEgKDAoo4+35orEEBzp2blurTviD+w81Gk2F0PJSqbROvVoXb5xElt3WqlNjx/7NMpnU0clx76GtUqmUphkMwxYunw0hxrLso4cRf1+8svfQ1sDAAI7jnj+P/2LQ2LOnz/fu10OUd6+h1+uvX78O3hmT0Xh4946en48ki2Su5t8Q5Z1ICSBv6KnT6caNG1euXLkKFSrMmTNnz549wvLXEiOEVAmO497LpvxjYBhm9uzZHMdNmzbtNdFmNBq3b99es2bNsLCwvIV//PHHmTNnfvjhBzc3t8I4nr/++mvx4sXVqlXD+PsE73Sv0WhWrVq1cePGr7/+2sXFZenSpe7u7rm5ua6urm9uzrJs/glxmqbfzD4REXkNXEICS+Z+AcAhzvyp+HtLpVKZTPaq5nshsDiOgxCWrxBUITSY4/5pTCLoQidnxybNGiLEf2EFTaZSq4TpV5zAFSSBOH4MyTeieDk/K7wQhDA1Je3OrXuPHjxRq9Uchx49eExTlI2NTXF8AFYK9xGZPNZwtRTlnUgJIy4ubsSIEW3atJk/f/6/Xf3z3NuLhrS0tEmTJu3fv3/GjBlvvu61a9du3LixcuXK/Fl3Li4uJ06cuHfv3tq1a/OKGAqQAwcO+Pv7z5s378SJE3/++acg0ZycnKZOnTpgwICOHTteuXKla9euZcuWPXToULt27VQqVVZWlq2trdFo1Ov1BoNBp9NlZmbK5XKDwZCVlWU0GpOTk93c3ERbGZG3AnH8yuVbUdEFE+V1cXZoUK86hmHFlSxblAiC7D+ezVNv/1YPm3/Jy83+mRZ8LfeOH47STNXqlfsO7LVu1YYVS36BEFPbqPoN6t2oSf3i7TpoPUAISZJ8d1suvg30G3+O4kWUdyIlBgiho6NjWlraOQsAAI1GwzBMbm5u3josy+I4/tq1UvjKFUh9xps8efJk2LBh0dHRv//+e9u2bd9cYdeuXZ6enq+V6zZp0mT//v3Dhw/v2LHjypUrmzdvXrBH1bhx49mzZ3fs2BHHcY1GI5VKExISxo8fj2GY0WgMDAysVasWAGDEiBFffvllp06dVCpVnTp1JkyYsGvXrvXr1z9//vzGjRsPHz7s0aPHxo0bo6OjtVptv379vvrqK4lEIpbXibwJJpWsWLV1y7a/CmRvcrls+rfDJ305ECfwV3vpihQAHOIUCvlX333Zf1CvrKxsDMMcHB0cHR1omrYqgVKMVKxYcf/+/RY/Gvhvlc4sy+ZdDCGE165dmzJlivV8gKK8EykxIIQGDRoUExOzfft2fhpCpVqyZMns2bOfPXuWN3jatGnT2bNnMzMzhTHo5cuXhw0bJpPJJk6cWKZMmQI/pFOnTo0ePdrW1nb//v35517ziImJ+fPPP0ePHv3mrEdoaOi+ffvGjh3bp0+fWbNm9e/fvwCLart3716tWrW0tLQKFSpIpVKhl+X8+fOfP39uY2MTEhIizNFUqFBh//799+/fRwgFBQVBCLt27dqmTRthfYSQXC5v0KCBMDNL07RSqcybEBcReQ2ptMBOYKPRNPn7JQlJqT9OG22jVrFiSKmg4ad3acbZxdnVzTWvKxr4ZIiPj4+NjQ0LC1OpVG9dwc7OrkmTJv+2Ocuyd+7c8fb2dnBwyFuIYZhVTW6ITclEShKOjo5Lly4NCgoCAHz99de9e/fOm0pACGEYVqNGjUuXLh08eFAYQkVGRq5Zs8bb2/utGWYfyc2bN3v37o1h2I4dO96q7QAAe/fuJQiiTZs2//Z21q9f36JFi5EjR27btq1gD69s2bI1a9ZUq9USiQTDMBzH/f39GzduXK1atfyJPnK5vHr16uHh4YIAlcvlDg4OGo3G1tbWzs5OJpPZ29vb2dnZ2Ng4ODgI1bUFe5wiIv/G8pVbhgyfmp6h5bP6RAoBIf5E0/QnVU5x7ty5Tp06NW/e/NixYx+2h/3799erV69Vq1bCPJKAteljMXonUpKgadrV1XXlypUHDx6cPHkyy77ejj04OHjXrl3dunWLiIgQ/EGmT58+fjxfoF7gBAUFjRw5csWKFUuXLp0yZYpGo3lthczMzF27djVr1iwgIOCte0AIbd269cyZM7169SpGs2URAZwkQME6v3Dcp1Mf8BoVK1YMDAx89/cOIbx161ZkZORry3fuOZaalrl6xbRy5f04M11yP0qCIDAcExqycojvQpE/Jc5qKXbztgJHq9V+++23Dx8+7N27d/ny5T9sJ+XLl+/du/cff/zx7bffHjx48LUutFaCKO9ESgB52QzCELORBUHtCQMmmqbzrkEVK1bcsGFDp06dkpKSxo4dO3HixEI6KoVC8d1335UtW3bcuHFPnjxZuXKlh4dH/hXOnz8fFRU1d+7ct0bsTSbTnDlzli1bNmLEiClTpoj9vooXDMd37T66dcehAtxn9WohE8cNJHD8kwqNCAwZMmT06NHvtcn47bIGVgAAiqJJREFU8eOXLFny5vKz56937jlu/aofw2tW5qiSKpevXr7+NOIZy3EYhnn7eFWuUlFlo2Joq550Rnx9Bl+6C0oRWq320aNHTZs2XblyJUEQd+7cOXLkSGhoaPPmzfOc7a5fv37ixIkqVarkz4qOjIw8cuSI4BVVvnz5lStXpqamnj9/XqvVivJOROQDcXBwCA0NRQi9NscKIaxYsaKDg0P58uXzO+7WrFlz3bp1Z86cmTlzZqE68UIIe/bs6enpOXz48Hbt2q1YsaJOnTrCUyzLbtmypVKlSuHh4W9u+Pz580mTJp06dWrJkiUDBw4svCMUeUcgBu8/fLbnwMkC3OeeAyezs/XTvh8pJUmuFCk8DINv6TL6auLRB0xU5c9Sr1ixYkxMTHZ2trDkwaPIzj2/XLbom06dm/MxvBKl8IQA2Po1m86ePl/W3w8hkJaaZmtvO2/Rj5WrhuWllwj1/m9W0b5YzpfC/mOWmbdO/ujaa7aab98ntCwEr7+QsC2EgqTjlxMEcfXy9bOnL4wa94VEQpasz/w/4DjeOFClUglibv/+/dOmTatSpUqlSpXc3d2FFXbu3Dl//vwqVao0bNhQSIm+fft2r169Hj16JNxftm/f7uXlpVLxNjTWU0vxGmLunUgJoFmzZoct5DfgFfyiNmzYcPjw4eXLl782N9qqVat58+YVTZeFevXq7du3z8bGZtWqVXkXwfv371+6dKlnz555vVzzs2/fvrt3727evFnUdtYD+Q7NOt+Xhcs2/DDzZ96HzAp8sAoEjkN6vVGXo3/tR6/TUwVUUo0Q6t69+08//ZT/uxOfmDJ4+Pdr12zn00jxknfnoii6RaumO/b/vn3fpj92/+blXWbK5B9SUlJxHIeQbxpB03ROjp6maZLkO8wKW+EWH0G9PteYa8QwvgVFfpMUwTPllceQN9o0GU04jhMEQZkpvV7P5yVbPjE+BxfDjQaTXs+7DeSdk3kaJVdvMJvMwiFBAKOjYs+duUBR5lKj7fLIU7fdunWrWLGiyWTK+yQxDBs6dGiZMmXMZnOedNuyZcuzZ8++//77UaNGXbt2be/evcXbkeJdEKN3IlaK4OcpjJyUFt5cB0L4XjUTQnUtKAT8/f0PHDhgNpuF6zLHcb///ruTk9O/OZ4MGDCgR48ezs7OhXEwItYDw7BzF64DCJSOGB5OElFPY7r0Gh8VHf/6cxCYTQWZWt6nTx+KosaNG5eTkyMsycrKGTF2Zlxc8nffDJOSZMma8oaQTwVWKBR8lXr5clN+mNy1fZ9L56907taBb2xz8NhPy1YlJSS7urmOmzSySbOGAAIcw2Ojny+au/zvi1cgBrv16DRs1JCtv+8gSGLgkL44jt++eXfzpm0TJ491c3d9/OjJr7/85ubhdmDvXwaDcejwgQGBfgvnLouJfl6/Yd1pM79xdnLS6XRrf/lt5/a9NEXXrldz4tfjvLw9IYRnT50/cui4ja1m/+6DEMKxE0b06NN1w6+/L5q3Qpup7dah34/zptaqVd1sZaUDBYK7u7uTk1NSUlL+hT4+PhqNJk+9cRyXkJBgb2/fr1+/lJSUjRs3Cu28gXUjyjsRK8XV1TUiIuLnn392c3P7eE2GYVh2dvbdu3e7du1aSF/L/NYnWq02ISGhb9++/6Y+bSwUxmGIFAht2rQZMGDA+1q8EgSxYMGCq1evvrZ84bINAIJZ08fiJT8PzxK9M+hzDYX8KvxXftCgQRiGDR8+3GQyCcsZlv1x3uoMbfbsH8Zo7DQsVZIsGIUgGULIbDY7Ozs6OTk+iXiGY9iVy9enT5ndsXPbuvVrXzp/edo3s+zsNDVqV9fn5P4wZbZOp5+7aEZWVvbK5WvKeHs+uP9IQkoA5K9p6akZl85fNo0ZhmFYji7nzwNHOnZuO23mN9cu35j746ImzRoMGzHYZDLNmr5g+x+7J0wcs37Npj27D0z8eqydnd3K5atnTJ3z0+pFKpUqISFpz459I8Z+MX/xrMN/HZs7c3G16lWq16xWt0Gta5dv9O7XzcPDjSnh5+2/wbLsm/cXodPPW9e3flWXhyjvRKyUPn36XLp0adOmTQW1Q4RQlSpVxo8ff+DAAVDI2NnZbdiwoQB97ESKmJCQkC5dunzAhjt37nxT3pWyGJ4l966IGDBgAIZho0eP1ul0eQtXrtn2PC7pl2VTPL09WHOJDClBAAkCz9XrGY7dtX1vSGjw5O8myCXSeg1qRTx+unvnwZq1wx89iHj0IOKXdUvr1KhFAapm7XC5QnbpwhVhplVIGCWIvJlcZKNR9+jdpVa1mmGVKx47cjKsSsVunTszgL56+XrUs2htlvbPA4dHj/uiT+8eEEC1RjVy6PjHj56Gh1flm02X8RgwuI+bo6ufv8/5sxcjHj/t3qlznXo1454n9BnYE4N8b0PwKXUNQfmWYBjm4eGRmZm5ceNGrVabm5vr4eFh/RUnorwTsVLc3Nx27dqVmpoqzNJ+5N6ElGRHR0eJRFIE1ykMw96acidSUmAsZGdn37t3LzIy0mzmE5KcnJyE/Ov8xoGvkT84N3jwoKNHj8XHx5e+GJ6AkD4h9IOBEJrN5sJ4X/369cMw7PPPPzcajXkL/zx8VqvV/bJiamilINZoBiUNCPlTRalUUmYq/nmCr58PjmMGsxHHMc8y7k+fRDIMk5SYjBO4rZ2tgTUyNONZxkMI/r11hwjxuXQ4jhs5I4RArVZJJBITZwIAKVXKLG12VrYuOSl1w69bDuw9hBAyGIy6LF1WphazpOCTJMkBzsgacRyXy+U0y9KAoSi+iYXRYPyPE76kg+M4SZIEQeTPjsUwTMjbzut11KtXr0OHDs2cOVMorfjss8+A1SPKOxHrBcdxNze34j4KkU+RM2fOtGjR4saNGwaDIa+iU1DtHh4ezZs379SpU926df9bxLdp07Z//wHdunVNTk4pfTE8AICzs/Nvv/0WHBzMsqxEIpk4caLQUabA6dOnD4ZhI0eOzMrKylt48fKtz7qPWffLjAYNwjn6X2fTrAe+WsEyUsVxPCE+IT0tPTDInyQJUsL3NhVqWgGADM3IpFKLdCYRL+f4oSmEfF0FxF7UyeYtee0lhGct1a+W/+RbSBC4UqXs1LV91eqVKYov4FAoFfysK3o53EX/hLLyj6etP0z1MdjY2Hz//fe5ubkuLi55CyUSyYIFC4QHwpLKlSsfPHjw2LFjUqm0efPmHh4e1n++ifJOREREhL+JEZYqRYEbN268uQofyTAan1n47bff6tWrN378+BYtWvzbLk0mU7169TZt+r13715paemlL4ZHEIS3BeHXAkwnfbPmvVevXiqVasiQIWlpaXkLI6PiuveduGLRN127tkYMzVm3UTDLIppmIG94rl04Z7mNxqZGrWoEQVauGnb88MnkxBR3D9eU5LRbN++2bteCIIiyAX4cQrdu3AkI9AcA/PH7Dltbvp1MxKMnJqOJUBFJScmUiXoX+cVxnKOTo5eXZ3paevUaVXEMv33rzq0bd339fP57K47jGIYp3XkmdevWFZoe5V/4ZkcyPz+/L774ApQcRHknIiLyqcN7g3FczPPE15Z7e3v7+Ph4eHgoFAqaplNTU58/f/7s2TOz2Ww0Go8dO3bmzJlx48ZNnDjRycnp33berFmzP/74o2/fvqUyhpdfoRZgPOPu3btv5sjiON6yZcvff/89/8KU1Ix+Q75NTE77fHA3qYSw2lYQHIt27dh79+59xCFtptbe3m7WgunuHm4URfXo3eXC2Us9OvWvXCXs5s3bbm6uXXt0ZBjG18+nV99uP0yZc/zIKZ0uJyLi6aKlc1q3a7535/6+3Ye4e7glxCVSNMUb4r0cewhVAgghk8mU55lMUZTJZFZLVMNHD/lq/Pe3bt51cXG+dOFymw6thCENwzAmo+ll5A8ZjSahya+Ts2PEoyfd2vedu/jHKtUqWVvTrQJh//79mzZtoiiqa9euvXr1IgiCYRhhoZAY0KFDB2HhH3/8sXPnTolEIiwEVo8o70RERD5pLHNe2OJlGzZt/kdPlC9f/ptvvqlWrZqzs7O9vb2wMCcnJy4uLiIi4o8//vjzzz/NZjNFUfPnz799+/amTZvyT+68RtOmzSwxvN55kafSFMMrDLZYeMeVTWZq0reLyni4durcwgorLQTZNHLc5206tGAZFkBoa6cJqxTq5u4qzPs7OzstX7Xwz/2Hnz6J6t23e7uOrV1cnRmG5TMORwwMKh9w7uxFd0/38V+NrlKtEsdxv6xffvzISQdH+8HD+mszs+zs7Wia9vP3XbBkVhkvT4ZhFAr5d9O+cnV3FfKMe/bpRlGUgTY0bFJv7cafDh88lpOjnzbzmybNGuE4TtN0/YZ1vL3LKBRylmVtbTWz5k0tG+hnok0NGtb9Zd0yXbbO1c2FZUtJaQVpCQwLKd2XLl0aPnx4Tk4OSZLnz59XKpWdO3c+derU559/LnwrL1y4oFarmzdvvn///jFjxmAYRtP033//7eTkVLt2bUFMF4276gcgyjsREZFPO26HwXkLf53yw4r8MqtVq1Z9+/YFAPTv33/Pnj15Kwsp2CaTCULYpEmTU6dOIYSOHTvWq1evzZs3/0eqaL4YXnLpi+F9GCzLZmRkSqUSlUqN41j37t3t7e2fWoiKisrMzHz3XdE0k5ySzme3WSvhNavVrl3T8hBxANEMnZfTybKsm5vLFyMHMwxLEDjDsrwKtEgQkiRbtW3evFVTS64d740MIWzYuF79hnWEJRiGmc0Uy7L29nYtWjejKErYqkHjevxuLPKuYlgIhFCIvVWtVqlK1UoIcTjOGykLAsXH18s/wM9s5reVyWVNWzSiaf4o1DbqNu1aYgCaaDPLWmlvhvciJiZmx44dOp1OaFBx7NixtLS0n376ycnJqV+/focPH+7cufOJEycyMzOFLNLu3bufOHGiefPmhw8fZhhm06ZNaWlpo0aNOnbsWO3atd3d3XU63fbt27t16+bj81/T3MWCKO9EREoPRdAaQZinAKUFTCrZ9sfBaTN//rcQWmZmpl6vf3M5QRBbt25dvXr11KlTEUKnTp0aPXr0rl273sx2z6Np06abNm0SY3hCrQDD0A/v3zl57C8MlzraaziOIUhZjfCqDRo0yM7WxcRE37t37/Lly0+fPn3H883KW1lQvLz618giw7AMw1qqj185DSwmeXx2Xd7EN0KIol5ZIsBxXJ47oGCtl/dUno4UmmcIAxWGMb/26nnbmkzmN/dZ0oEQsiw7evToP//8UyaTCal1BoNBqVSGhIS4uLio1WqDgXdzzM3lW3pUqVJF2FD41WAwqNXqihUrpqSkKJVKYc0mTZqsXLly8uTJ58+fP3DggLXVoIjyTsTq+I8bpDXsXwjhgEIjn5HV+wEhTEhIOH78eOGVdEEIIyMjPTw8QKkAJ4mIh8+mzFgh3PMcHWzTM/4pzBRo2LDhW10hZDKZnZ3dlClTCIL44YcfTCbT7t27N2zYkP/ceLOutlmzZvv27evbt29UVNRrMTwJQSBrbV5ZsNA0zbfsu3jp6t8nFYZ7BhMbVs7RmKs/fkvPKnxDQkJ9vL0CywVWrx7esWPH+/fvR0REaLXaN71n+aaoV6++1m+gRPPuVrof+R23/qrPAgdZGgMOHjwYAHDo0KH79++3bt2aIPgQplarlUgkNE0LX17h34yMDGHDvIXCmlqtNm/N+/fvUxTVtm3bwYMHvym4ix1R3olYFxzHRUZGXr16tZCCGQRBPHv27GPiTzk5OdevX8/KyiqMI8QwTKfTvde0VB4uLi6JiYmff/55oQ4ic3Nzq1blfVBLOnyHOpads/DXyKg4AECliuUa1qu+9OfNr602YcKE/97PxIkTo6Oj16xZAwCYM2dO/gDqypUr31TbJEmq1er8SxYu2wAh+GHqaPxj7xAWPwyIWW3EzmQyRUZGXrhw4eSp0xcuXOSMKd/19PB2kYWVl1FmQgINp27dPrLrYi6r8PGvULtWzYYNGwwdOvQ/ylZ69OhRSFYsIqWSjh07li9f/uzZs3fv3hXcyymKmjFjhlKpzMzMDAkJERYCACZNmiRskrdw8+bNX331VW5uLkVRwsK7d+8qlcqFCxeWK1cOWB+ivBOxLvz9/Q8dOnTt2rVCGgkJOSj16tX7sM2VSqW9vf3s2bMxDCuMIxSGgAghR0fH9912xIgRQ4cOLRAX6P++SVttKvF7geHY3XtPtu88DABQq5RzZ4x78DjyzdUuX76c50ucH4Ig2rZtS1iYOXPmhQsXHj58+OTJk/zrnLTwf4+EYdhFyzf1690+KNDv48YMECCKL6PEJID3qrWiWAKEUK/XnzlzZsuWP06cOKbCc2oHKAN83KuFOFXxV0rVCgCxcR6qdg0Mfz/OjYjVPYl8cnDbzb1793bt1vWzjh3Dw8Pf6s1hJfES+PIf4ZsHAUSAd6wr7uMSeQsEQZAkKZw5nTp1unfv3pYtWxiG+fzzz4XYXteuXSMiIrZu3SqM7rp27WqxKB8cFRV14MABgiAmTpzYqVMn4fQTLJGBVWKlhyXyaQIhnDx58vDhwws1/sRx3Gvhk3fHy8tr3759LMtnyYDCQXBg+o8yzH+DtACsHeGeZwVJKjixcct+k6XQslmTWk1b1r9x59Gba82aNevPP/98czmEMDs7WziRnJycxo0b9/nnn3/wsUA+v54rmE+FzQWcCRAay16LX2EIQwKtVnvixImfV658eu9KbT+8Yah9x3qObm62EgmBMRSgSQChBENBvjYBAc4szcTGaQ+eS951Ovm3X1dHRDz5YtjnDRs2VKlUxfUuBNnG+xJbzIkxy9efD5byriSIRRyLWAZxLMfSiNMzfOWNp8yOs4LPX+TfWpAhhGQy2Y8//jhw4ECz2ezn56dUKgEAtra2s2fPHjx4MELI399fGFc4ODgsXbp07NixAICyZctKJJK8nVjJGONNRHknYl04WwDWCkmSvr6+xX0UJRnEAc4MMCmAhV4F8h/gBJ4Yl3ji1GVhQnxQv464pUPAm2v+W18KuVyeX+K3adMmODj44cOHH3Y8BTpagIDVA84ISCcAiWJXeBDC9PT0PXv3rl2zNubxje71NOM7OHo7SXASAHM2MFtc20y5/Ilh6cNASGSETB1Y1n64p12lANWS7dEXzhxLT0+jabp58+bCDbhwD/jlPy/FHOAQYgHHcKyZo40sncOaDIzZjBgzS+sYUxZtSKV0CaasyNzUFLPOzFGZtKGFc8j6sMFG1upcWkReIzc312g0uri45D+18nqU5Y/M5ebmmkwmb2/vkmLyLMo7ERGRogQCwABaDwgbgBVfI0uCiH2e+DyOz8ov4+Fav0418NID9jXkcvlbg0ZKpTK/JnN3d69Ro4Yg7+rUqdOnT5//9oAVkgTmzJmTl8FdoEDA6gBrAFJPy4dcnBUbOTk5+/fvX7ZsmTbx6YCmtp+3cPBxkfDRL4v/7ouVOMuUNEKA4/joozEXSGQKlX29cA8HjXTGb09P3bn1008/q1Tq+vXrSSSSwoid8028LHE4CiGKY8wcrWfMOYzRyFJmjjFxtIGlchiTjjFmUoYsxmDgl9NmljEh/l+KV3sMizi+ORpCKlxsOW3tQMtZtHr16vnz59etW3fdunUODg4AAK1WO3369DxjlGnTptnb2yOEZs6cuXHjxm7dui1evFihUACrR5R3IiIiRQ6igTkBkA6AsC2eA4AgKjo+KzuHd0CoHCyXy/IadL7G2rVrf/nll7fsAMLXLvHVqlX77bffhMmdd2lexHHcypUrC0fevVR4hsdA7gtwTTEqvKtXr27fti3q6YM+9TXj2jm625P/iLO3TtQLfwizEVCJErkyJMhxTGdzcnrEzWsXt2ze5OrqGhrKZ7UXLBzijCyjpU05IJvikJGjTBxtZCgjRxlZxsxRJv5f2sTRFMfgEKpwGYkRfDAPo6UcYYS0maMJiOEcBlnIAVRW6Szm3lk5yJI2ULFiRRzHnzx5YjAYBHm3Z8+e5cuX16pVCwCwfPny0NDQIUOGQAirVq26Zs2aiIgIs9ksyjsRERGRt8JPeQFTLCBz+AhT0abi8eqC4aJiXhRMhASXJST/eiV8qyvKWwkJCSFJkqbpxMTE1NTU/5tjYDabCzdrB2KA0YPce0AeCCQuABWpr56g4XQ63cGDB2/ful47QNE6TOWuxiGLWL6RKSBJy8wnX+r7siTh5ZYAIIpGLAdkIJeAMMxf3aOx85YTGceOHqpSrbqXVxmNRlOwR4tBTIoREgyXYiQvvAWNiQMMQgxgJIQ4wAgIcYjhEBPS7yB/4HygzvLvP7uyLAFlZPZcsQZNRd6R2rVrh4aG5rfXuXXrllD2DgCoXLny7du3heVNmjTx8/OzNnO7/0CUdyKljdTU1BUrVvTs2TM4OLi4j0XkP4B8upUxBtBaoAiyFHsW4UtzXK7BKPxia2sDMOzfonfvjq2trWCpaDabrcUMFmKA1UP9dSQLBHL/FzOQRYJcLuc47vTp05cuXcjNzmpQ36FJoIw1MRm5KDqdy9TT7vaErxOpVmD8RC2vlSx3TQxQLJecxT1OpLP0VFk3SYAba6MgW1W1OXVLF5Wcffr4kZAKIY0aNXyzB/xHQmK4DCMYXsvxsozXnP+UVAD++ARFZ4G/x7OAV3b4i+X/RCQRICDmKtWIwbsSAcvyw43XlgjZF/l/FTrzvmm+aM2I8k6ktGEwGPbv39+gQYMikHd///23RCL5eB+4e/fuabXaevXqfcDQECH0999/azSaChUqvMv6HMcdOHDAx8enUqVKR48etbGxKVu27MWLFw0GA47jAQEBYWFhRVXqb4mDmOIAowXq6kVYbMHfpvn/5V2+C+JWzLKsEMaxdIuymiE+xAFrhPrrgMtFyjDLokLXHSRJOjo6ZmVlHThwIPX504plpMEuhA0OHsWa/nymvJnh8PDxMzlIH1BX3bWG2kGNvzgTIC+Y7sVSfz1W3Uy0fRzx1FaS8Xkzu661NR4q6O2I6bwlT+5dvnrtau3atWWygk9usyg8EvI9w/LpYMt/Ub5Y3YvFwt/6jRie5RfCjlRaakZESh5Ki7CLiIgQ/qJFUM1TSIjyTsTaMRqNN2/edHd3v3//flJSUpUqVSpVqnTx4sVHjx75+fk1bNhQqGOKjo6+cOECSZJubm5yubywW18IrF271tbW9jV5p9Vq9+/f36pVq3c3N9m7d+/du3fr1KnzAV3FoqOjhw0bVq5cuc2bN7/LTCLHcWlpaUKWiZD4de3atcmTJ9evXx8htGrVKkdHx4ULFxZdC0WIAyoZaE8A0hlgiiIQH/xFG8Ps7GyEX+MTUhDLwo/u5xYXFycM9FUq1Qc77xQOGB8o1V0BbDZQ1wIYyf9amKhUKjs7u7sWCCY31E3hpYK52fTZx1Q0Ht6pf+/sDRtOHj9iPKENcsTrlpMT+IsomTaXO/cI6TS1PmtUb+2vv/594SyJZVb3kZZzlwQ6kzo98zw95+GDh/Hxcf7+/gV+2LyNGYZjwHIm8AL9pUZ/nxieoOrUhEyUdyUFxkLery1btlyzZo1gd6dWq1u2bPlva1o5orwTsXZSU1OHDx9ua2vr7e2dnZ29ePHievXq6fV6DMPmzJkze/bs3r17379/f+jQoWq12s/PLzY2Njk5uQi6r+Y1ujGbzampqcItjWXZJ0+ezJo1y93dvU6dOkqlUugRKZVKs7KycnJyXFxcJBKJwWBIT0+3t7fPq8r84DSs06dPlytXzmg03rt3r3r16gCAGzdu3Lx508PDo1GjRnK5XIhonjp1Kjk5uUaNGqGhoTVq1BDkXeXKlZVK5c2bN/39/X/99VcAQHp6+ldffTVjxoyVK1fKZDKdTnfs2LHs7Ox69eoFBgZyHHfx4sXHjx+XK1eubt26BaahIQ5oLcx9BOT+SF7OUgdQyLdGHA/09xYe3r7zmKEZ8qMDlnfu3BHknaura4Enh30sEOPN2vQ3AaNDto0ArgaoEO9SNjY2arX6+rWrWRmpGAAucuAiAWmZ9L1Y4y1zDGl3Li42iqKZmDQUEU9Vc5eoZJYTCYep6fTNJ/oY/KGRwZMS4ziE4rUgOtHsq8FVBFRJoEYhiY+LiYmJKQx5J1jZ4ZCQYUId7YfE8ISKChlGipOzVguyIITYVSpV+/btMzMz7ezshGcbNGjw22+/bdq0CQDQr1+/Bg0aCMvt7Ow6d+6cd9HOs6AH1ooo70SsHeFL2KZNm4kTJxoMhrZt25pMpnXr1ikUihEjRhw5cqRXr17r16/XaDR79uxRKBT79+8fNWpU0XzrCIK4e/fuoEGDoqOjMzMzZ8+eHRISMmXKlMTExAkTJnTu3Hn69OlJSUmDBg3y9fWNjY2Nj4/38vLq1q3bgQMHYmJiEEK//PJLeHj4BzufmUymU6dO9evX786dO0ePHq1evfqxY8cWLlzYunXrTZs2nT59et68eSaTaezYsQaDITAwcMSIEV9++eXhw4fr16/ft2/fdevWeXp6li1bFiFkMBgUCoWjo+Po0aOHDRsWFxfn7Ow8YsQItVrt7u4+cuTIr7/++vbt2ydPnqxVq9bu3bsbNmz41VdfFZzCwwAyg6xzgMkE6nBL04XCjDBxnLeXu6uLY3JK+t37T1JSMzx9PD9mfzRNX7t2TXgcFBRkRZOz/wD5C37uXUinIof2gHTh65cLBycnJ4lU+jTikZLOslFhOD/EQQTOOahVWSlZ27dvz87OghDISEyNIcbIpOZiJg5opFDCskpI371z83HEY51OJ1cofcq42klYzMwgisVY4KomMrTJycnJoBBBBIbLhejd+8fwOARwCPEimT0Q+QCUSqWTk9PVq1d37NjRvHlzW1vbiRMn5qk9IbWgc+fOn3322WsNylUq1axZs4TVsrKyjh07dvXqVScnJ6udvRXlnYi1gxCSSqVVq1bFcVwulzs7OwcFBQl16c7OzhkZGWaz+cmTJ3Xq1BEWhoWFubq6FlkObFxc3MSJE4ODgxctWrRy5cp9+/Z99913I0aMmDFjRt26dYV4flxcnIODw4IFCyiK6tev36ZNm2bOnOnq6jp69OiNGzeGh4d/sBp48OCBVqsNDw9XqVTLli0zGAxpaWlC17W2bdsKNmxXr16NjIzctm2bs7NznTp1jEYjx3GC/OVLGN/4oBwcHDAMMxgMp0+f1ul0v/32m0QiWb58+eLFi3NycubPn1+zZs2HDx9evXqVYZgCdfjkSyah7jJgspCmPsBVhRdhQgxT1q+Mv1+Z5JT0rOycHXuOjZ887GN2eO/evUuXLlnCgnirVq2A1QJJYIyGyZuQUxcg8+ObmBUCTk5OJEFotZlyZLYlodnM5eYyHmpYRk34ujs6IWlGRgZnNlSyyfZSYaejzTqFIyGXG+Mz/CR0DU/JvTSQyKg8PT0d7e28ZZm2hBajkdnEARY5SFGaVpuTwzvaFCo4xGQY8QExPBbjNKQcs8rOvyLActcYOXLkd99917dv382bNwuTsG9egd86cM1b7fjx43379iVJctasWVbrwy/KO5GSgTDtJQTD80qZ8ofoiiVewrJsy5YtmzVrJpjZXrx4keM4T09PqVTq7e0ttEJHCMnl8gEDBlSoUAEhVK5cuYoVK9asWRMAULVqVUGBffDBHzp06MmTJ5MmTTIajbdv3/7777979uyp1Wq///57juMGDx6MYVhiYqKTk5Mw9dC0aVMAwK5du4TN8xcB5D3QarUcxymVyufPn3t6egoCrly5cuvWrdNoNJ6efJQr2AIoeCDfaEF/i8/Gs28NJG6FFGHiWM7G3rZTx6YX/uZNEDZvPTio32cfU1CyadMmIZExODhY+ONaLxgBqASY+DNy6QuUYRYNXcChbpVKBSGWk5MrBbSXSpKVyz5Pp4NUksaOZg2ZHmFQ0bbAGUc+cvx5Lqv0tg/xd5ApyYwMLjmas1caJ9aSPMjBzZB1V6eHanK85QxnApHJZhmEznJ0O16nz80Fhc+HxfAYnCsjsyesoyOciACEMK/9DI7jY8eODQkJuXz5sjAC/wDq1q07derUmjVrNmnSJG+htXWzEOWdSMkGISSRSMqWLXv16lWapkmSfPToUVpaWtGUVuSH4zgMwziOEyoo82fg8lM2liDZa2m5HzmDnJ6efunSpdGjR4eGhkIId+3adejQIYqiatSoMWrUqG3bti1fvrxZs2aurq7p6enZ2dmOjo779u3TarVvXoYs7aD4T8xgMGzYsMHf39/Ly8vR0TE5OZllWRzHY2JinJ2djUZjcnKyp6fn7du3jxw5MnbsWCG3r4CBBDRFg+QNyLET75nCK7yCv1Mimu7eueW8RetTUjNu34v4edUfEukHXp3PnTu3bt064fHQoUP/rY+ZFQEJyObAxJXIqSeybWCptCjIaLdg6YdhGA5AWRW4m8E9SqYbu+BlJayjTbo/SMtkyZRcSmtANk6khmT8pFo7GzzSZKYcMAODMenmYAXtLM/2UHDe9gREWJyWTdAyIS4ShAAuFNkWCR8Qw2MQ6yRVY5BP3xOxEmJjYzt06IDjfJqAcLkjSRLH8VGjRn3YPA+GYVKp9O7duz///LOwTwzDkpOTrco5RZR3ItYOQshoNOZF7EwmU167J4qiTCYThmH9+/cfNGhQt27dypQpExERkZubW4xfM0HMvW9th1Cl8V6bnDp1ymAwDB48WEj1ValU48ePd3JyunDhQqdOnZ48eVK2bFmSJMPDw728vCZOnBgaGvrXX38NHz7cZDIJQtNsNtM0Hx67f//+l19+CSGMiooiCGLhwoUSiaRRo0YHDhyYNGlSmTJlDh8+PG7cuLt3786YMaNp06bHjh2rVavWu1v+vjeQAHQalrSKc+rKp+IJ/rcFCuKQu4frmBG9p/ywAnFo/tIN9et+iMFNfHz8l19+qdfrAQDh4eE9e/YEJQKIAyYHJv0C6FTk2IGftC043+OUlBSGZRydnDIwmQowZWTwZjJ9Sg1aeZMaCF1wdDcxVyMDdkoitIytUWYr5RwBK7PB9WFuOqNK+4TLTks2p2WBmg5SjOayTOy2WyYpgGWUIC4bqVQ2avVb2sRZSQyPRqwdqcT4JDxR4FkLOp3uwIED4BNDlHci1o6zs/OyZctCQvhORDiOf/fdd7a2LzpZ9e3bV6fTIYSqVKmydevW06dPy2SyESNGpKSklC9fvgiOzWw252lNhmFMJhPHcXZ2dgRB/PbbbzRNC/N0JpMpT57mKSohH99sNgMAvLy8Nm7cuGfPnrZt2757hL9ixYoLFy7Mq70NDQ2dMWNGhQoV6tSpc/v27aCgoNGjRwtpvwsXLjx+/HhqauqsWbNq1qzp4+Mj5It8/vnncrlcrVYvWbLEaDRCCDt27Fi9enXhE3Zzc1u0aNHRo0dzcnJmz55drVq1Jk2ahIWFPXnyZMSIEU2aNCncCXHesE2PpfyGzPHI8TP+1wLtu8AHXjhu5LAex0/9febcNZ1O/9fhc++7k+Tk5P79+9+8eRMAIJVKp0+f7ujoCEoKEAccB1M3ASoRuX4OMGlBxfDS0tIYmnZwcDQTSozNqmUHo7LQnmeUOwkqOuCUkYvLYrMVOMDh5ceURG0GSQaWYDBgRLSBMZuz9CAqHbnhHDKxBgROxdLnY6jaHqSXHD5IYjGZuoh9Z94rhkdhhJqQWuKLorwTKU5EeSdi7SgUirz8BgzDhFaAAvnTv8pbEB4HBQUVzbEJ1ifCYx8fn1atWpEkaW9vP3PmzN9///3SpUs1atRQqVRt2rRxd3cXjr9hw4ZeXl7CJmFhYYJBSYcOHWJiYq5evdq4ceN3l3evvU2ZTNaoUSNBENerVy//Uw4ODj169Mj7VfBPEQSi8KBz585vfQkPD49Bgwblf4nWFkDR6Q8jTN8JzM+R6xBAaAq22IJjWY2dZtGciR26jY5PSH3fVM4LFy5MnjxZqKgQMm+KPiWgIAqWEf8JU2nI6xuAyQtE4en1eoPB4OzqloMpzOaMQDu8iSM4l45+vk+19MSr24MwW3xfrutzZbCclGC5jCFVr9XplEqFjU1ZQErjtVpT+sMw95xHydTpJPZ6Chtii1W2g/YYl6JjSSfXd3eULPoYHo2zckxihYXTnxocxzEvB9JFj9kK+taI8k5E5MMZMWJE3uNaFoTH+TWQg4PD3Llzhcc4jk+YMCFvk+7duwsPNBrN1KlTi/DASxAYgDjMOg3N8ZznJCB1L1iFx1J0lWqhv/4yY+jwaXEJKXnLs7OzhaTDt24VFxe3bt26n3/+OT09PW9hTk5Ov379Nm7c2Lx585Kk8xAHMBmQ+RZgtMlgMGRlZVWoUIFQ20VkxNbWgOpqSHDgSAq36Sn33A1XK0l7V/dqbbvnmKjsrCw8Vw9y9DZqtYurqz4nJ/3BVblJej8352isOTYHhdph9Z2gu4TT6VFcNutWPdDX1xcUOe8Yw6MRKeVXEylOWJbz9g/84ae1HFekrZZfgIC9s0teql9xIZ6FIiIiVg7kM8P0t2DUWFTmW6CqVLCztKyZatGywaZfZw/4fEps3IvO4hs3boyLi+vYsaO/v7+7u7tUKmVZNj09PSYm5syZM3v27BHqZAXJnlfZnZqa2qtXr8aNG/v6+rZr165+/frAykEMwJTIbRyya16ABRa5ubmZmZm1a9cODg6+euxRvWxzTVvMTwqq28PrLBljI0U0Z6JZDw+POw8fp6amSqVSJ2dnDMMois6Ii9BkXQ+vyCVlqZ4grKyMDlNz9jhSc+hEIpeBaZqHVhDKt4ue/xvDAxAyiLfNK5bDE8kDccjJ1a3H0CHFdQAcB2iqOJRlPkR5JyIiUlIgC6kvLWcyN2xSu1/v9j/OXS0soWn6qAWCIPLLO51Ol3/DwMDAH3/88eHDhz/88IOwRKvV7t69GwCwevXqBQsWDBv2UXZ6hQtiAKHh3EYAdbWCtUdBCGVnZ2s0mvr169+7fvV82jM/GYo3gBSJtFVFdR1vyelbOce1JoBhfn5+jg4OJElSFJWVlcUwrBIze2rMTb0kRHlVi1DlX1d1d57o7ABL/6+98wCPqljD8Mycsn03vfdKCCF0AqF3BEVRgatewYZYrnpFsCGKV0VEQFGxgKjYsSIKSg9NWqT3kkZ6z262nXNm7jO7IYQqQsoC8z48unv2tGw73/7l+x3K6pMktF1a546dWtCB4uIxPAAIJ0A1ElnZXYuDMXa0fIK0JWHyjsFgeDiEeqMYupCwSUD0bwqvY3oxVhTN+abUy7Kcm5t77vLk5OQ77rhj/Pjx9b0UM2fOtFqt9SuYzWa37cKECRM8cYgFloAqHAfeC3SJANP+nsZFURRBEPr167d69eqVf+QFqBwKj1TRqiFxqooCW36pYhW0dqccExOjUatlWa6oqMjOzoYQlmSZth6sbadxxIeo4r2FkW21b+fZj9VYD1fjIw7dQwMHduzYoeGMAY+K4RFAtFDUcAIbOMtocZi8YzAYngymiRafISRwbFNPSm3oZDFixIj09PQNGzbs2rWrrKzMrSfUanVcXFz79u0HDx7cuXPn8PDw+vX/+9///vrrr5mZmQ13KMvypEmTAAAPPfQQ8CiIRLSJJOBfQAxtCm1XbwIXHRU9etSo4oL8n/f+mRKI+hmgWO3IzrPmOHy69Oltt9l279pVUVGBMU5MTIyMjCSEnAyJ3CwFfbAp9/5kqWOYYEIozgjX54JMs6ZN7wE909ObuW32H8XwMCEix4uIZ6YojBaHyTsGg+GpEAVAkQTcQnyGuXo8m1DbnUViYuKkSZOefPJJh8NRXl5ut9s5jvPx8dFqtefNDGq12vPOJqqtrX3ssccAAB4TwyM0bmfoTJ9S3qvpxs664QV+8JAheSdPzs07+VdNQU+zfCRL/j0Lgbj2vYcMt1hrS0pLMcZeXl4lJSU5ObmEYCQIQQmpa9YUcvbaMAcvC1xBsfxnJQxJbjv+wQnt27cHnsF5Y3gYEA0n8nQiGdN3jBaGyTsGg+GREIVwWuI/Bug7uq6bzVqn7LZ95jhO6+Jv1xcE4eabb161alW9qaFHxvAIfVaN3YH3AIDE5pHLer3+lltuKS4u/u6brxbvLczx43BYh9vG3d8qKSk7J9tus0VERGi12jVr1mi1Wp4Td+3YVlRYaAHCxhL84X6HngPLS0VjeMKEhx7u3q3blQyOa4YYHiZYjXg2soLhCXjQR4XBYDDqIDJQhVA3Y3VcEw0lu0S2bNly8uTJS1lTq9WGh4efOHHiQjG8srKylJSU4cOHt4xGoRIEAq++wJDmUiTNN9YlLCzs0Ucf9fcP+GLB++sxGtF9YEJSa6LIft7eRq1WUuRfly7dvm2LWhRNXt6iVqc3eZntjopa8qEd6A2GqLadxj/8aP/+/UwmE/AwzorhYUBUSGCxu5bCHSCvtyOBLhphghGE6Hz7gYjaRras+8lFYPKOwWB4XCMF0SQAnyFA8AekbihIS/Hqq6/++uuvV74fWZanTp0KITSbzS0g74gCkEgMaUCX4hJ2zXpB4jguNDS0X7++RcWFsiQZA4K//GRBSWF+VWUVjXhxgpMALx9ff39/vcFQWVlVXFpqNls4xCleft1vuOH+++7r0KFDk0w3buwYHgFYpLfZyIrmhuc5iIAs0cHfHAckCRMAbDarrbbWy8f3Suoi6KA5p7OmqtLo7XPWJ9dqMXMcL3rqjGkm7xgMhufgiirpOwNTL8Cpm7PYrnkQBOHw4cMdOnRo3sMqgNMTfXugjnLluFtGeRBC/P38jUYjhuhEbt6WrVsryitkWQEI6jRarV6v1uq0Wq3d4SgqKoqOjk5PTx8+fHiHDh2io6M9Kid7kRgeAUBgpnfNDsdzBbm5K37+/tCeXQaTd+8hw9L69RdFbvl3S376/JM5X/5gMBovO4bHC+jg7v2vPPnotPfmJ7Ru43a4hBDZrLWPjrqpe//BD056lr6N/w4IIeIQwaTZ5qF79GeGwWBcT2AAETGmA0NHeq95i+0uxMsvv9xwNskl8t13333xxRfn1uE5nc6ffvqpWeWdy9yO6NoCwa+l5LI7exUVFTVy5EiVSoUVpWOnTjccO757z56sE1lFxYUlRcV2uw1AqNPpElu1uvPOO1NTU8PDwyMiItRqNbgaqIvhEcLRgSUsdNd8cDyXdeTwi488YLPWdu8/uKy44MX/PDDusYl3P/qooigOuw0hpFJDjDnJWSetIIQcj7BSd5c6k0OgyK4pNa5pwbzg9iXG7reuy0LPRk5ty/NIwUAQxXGPPRUYEoox4XiOulojwPNAUWjs0O2C6B5EyQs0i2u3KYf37DaYvIPCwponn8vkHYPB8ABo9lBLTKlAE+eanXB1XyD79eu3bt26rKyscx+qrq5uvvMgBAg+RJsMkLaZ5XLDdJj7trcL95KIyMiUlLY9e/asrKysdSHLsiAIGo3GaDT6+/vXr3kVURfDY5Z3zQiEUFGURe/O4Xj+oyW/+wb4EwJ+W/zN+j+WVVfWcBS+vKR415aNokqd3KGTVqcnhEhOZ87xHN+AQL3BCAAoLsiXZTkoNKy44CQhxGF3HD90wD8wKLFtu/qwsfs9DBFQnPLxQ0e8fP18/QMSU1I1Wi3BpCAvVxAEc011ztEjweERiSmphL4TCOKQ1VJ7YOcOm632xKFDPyz6eNQ9D971MG2lbwaFx+Qdg8FoaYgMBD+iSwZI5SFBu3qmTp3aKLV39dQPJm5yCAaCL1DH0CbZRpo2dunIsixJUsNr2Ln1T76+vn5+fu76d/cSV506jam4A58XvwQ2TtV8o8JBRDzB/ea6AUJUXly4a9ufYx990i/I3+nAEICBI27tMWCIyceLEGKuqXnv1RePH9xfWlQ0eOTtE195Q6PTlBSWvfHMk2P/82S3vv0BAD9/8WllednTr89e8uVne//ajhWSd+KYubrqgaee+9f4h+vftjS5yoFvFry/afWK52bOVbyVOVOf6dKr723j7v/y/bn5OVmyJGUdPeJ02J/834yht40BhFhqamY8/WTmpgy1VldaVPCv8Y/edMe/WXKWwWBcJ2BqrmvsDJylwFlGfyB7EqpGrZu+8cYbR4wYAZoHMQCIwQCg5td2AIB58+b9/PPPTRqiQAgdPnwYeBhM3TUnEIKykmK71RoUFu4K+tM3HMdxBpOJBlEJsJhrbr/3wfZpndct+33GM/8dNuqOTj26YUUpKyl22O2uEBswV1dVV9IR0jVVVSX5+W988nVIROjCt2YtXvjhoJtvDQoLqqucQ/CHzxb98tWiSdNnR8XHWi22yrJSq8UMISgvLrJZrS+/t8DLx2f21GcXf/xh+oDBvv7eG1f8vmf7ltmff5fQJunL9z9YvfSn0fdP4HhOuYRavSuHyTuGZ+H68X6FlwRCP4geYSHLuDguwzB1JNAmACh4WtzOjUaj0ev1jbKrtLS0hQsXXoqLXiMg+FPX4pZr4cxx0SKHZlxHQOB0ODDGXIOOFncMmAMcJjgwOCQptZ1arWnbpatvQFBpcaH7ysBxXP01AlHcm5P45JSI2DhBBF169lv+/WJzVVVwOJV3CKEVP/+w9KtFT7/xVrc+vSWZfqwQx0FEPQ4Rx7dKaRcaEQYR6NZ3wO5tf1otFr9A75qqSr3RGBweYTSqw6JjqisrrBYLDAxsnueGyTuGp0DnEeXlHTy4X5bkKxFnCEG9wZjcJsXLywtcT2CMT+bl1dZariSCAKmBF/LxpS4VoGlxlSJrYoEqBHgw8+fPf//99xtlVyqVShAE0NRACARvgNw2Is2q7VrWAMxT3ccYTYtOr+c43ul01L/+Lm8UWH8NwYorHUoAx6GGH4jzXmXctQEEI4ggotKNbgARKi8tXvXLj7wo5hw7quDzZOBdG9JvXoRcxyYEKyCtb/9l33/96sT/xCa1XvnzD5179gkMCVEUlpxlXGeYzeYd27d5+3j7+wdcyVXp2LGjubm5lZUVPXr28vJqzAJth8ORlXXCYjZfoX4SBTE8IsKrsYvHDx7cv33bNi+TyeWwelnnBoAkSaWlpRqNpnefftExMaCpoCkUoI4GPC1t9kBoD52LpuvcFAShCWLMCCA9oNZrLQDP802hXwkhiqK4tSPteeTOF5t3X7wZ1xkYE/+gEKOX15H9e/reMAhj+sEtKy7bviGj99BhiHYxnw9atUnfVLxAfxX87ceQEKzW6J783wxZkmY9P6lt566denZ32C+0ct3Vi2DgHxiS0rFr9rHDeceP337PAzeMulNUqVntHeO6w2G3OxyOjp06G1zdTJdNVXVlQGCgLMsZ69b27TfAaGwcAUEI2bN7Z3ZW1pXIMgioq21JaYnf0cO9e/fx8z/PlNLL5mReXnx8Qvf0HlcQs4FVVZUrV/wREhKyPmMtACQ6JrYRz7DBcUSg8qONFJ5KWVnZ0aNHm+6LGEJot9udzsY2bUZNHx28MBMnTrzjjjsaV7NyHHfs2LGnnnqqtLQUABAS5D/jlf9GRoYqrqlx9WCME+KjibNpR+gyPA5CTD7eQ0aO+vbjDyLjEtp06FxbU7PwrZkFeTlpffoCCBtGlGndDw2yAb3RZDSZ1v72S1Jq2+rKmgO7d/oHB9dndU+vX//xJ0ClVgeHhce1br1x5fJ3X5k654vv1Bpt/fpnbOg+BnVsATs2rd+zY+uEp583efvygiA57AA23+QVJu8YHgRC9EfVFe4EY6zXG1Lats1Yt3b9unW9+vRpFIWnKEpRUVF8Yqt27dpfdhIKQnj0yJFdu/7y8fFZn7GuZ+++jZgDhQCeKii5Iot2Qkjr5BRvH5+MdWsBgI0dw6POr0DQAejR7q8//vjj+vXrm1TeYYyLiorANUS8i0bfrY+PT30MVaNRp3VpG5sUC6SzPfwIzcF5ViMto6lx51JvG/dAZXn59Kce9/Hzt9ZafAMCn359tm+AD4JQrdXWeZrQ2zpeEDAGRpNp9P0PvfHsk/v+2h4SESmqVDqdgTYjqVSqU+80hJBGp6OGde7bWi3GGCEw9j8Tn7n/riVffT76vgc1Wq0girTuQq2un13B8bxGq3N9wEFkbJy5uuqFh+4XVCIA0OTtPX7S8/2H39Q8+Vkm7xjXIBhjtVrTq1efdWtXb1yf0at3H72BfnqvEASRwNPoyJXFJ4goiN269di+fVvG2jW9+vQNCGjMGF4jQDvOSHJyCsEkY92aRo7hQUTHUXh8f2G1i5Y+CwZFluXTCS9C6IQASVbOkXeM6xOCic5geOKl126/d3z2kcNGL6/45BStTmu3KQNG3Nr3hptEtVqSFG8//3e/WUJDaBJt4RowYmTrdh2yjx2JTkj0CwhSFPrj4MHJL9B3GiFOh5KU2mH+LytVKpXdpiS0afvRkhWiSuV0KKFR0QuWrlQUzPH89Pmfcxxtg33mjbcghO7ZFV379OvQvYdao3HYpF++WjT01tF3PvQfQnPB8oJZM75d8H76gMGiKDLfOwbj8tFotT379M1Ys3p9xro+fftpdbor32ejfCZpVxfPpaWlbd26ZUPG2p69+wQENFMv1T/6M9uktAUANHYMz3OFXQvGfiTptIK5inA5+Df5RYTnedYIz7gIGGMIYWhkVHh0FJ37q2C30hJc1FdtqrU6d+rU1W+hhERGhUVHYVrVSXjXau4InHsFd/TOnZ9teJtgrFLTviVCiNo1B5kQ4o75uTfkeFqDCiGwOx2H9+1WqTV5WcfVGp25uqIgN9vk7d1sRaJM3jGuZfQ6fZ9+/detWZORsa5nr156fSPE8BoF+lUiil3Tum35c/OGjHU9evUODKTt957GKYXX2DE8D4QQXx9TVGQoQs2uJAhQqQSVKFx14w5qamo++OCDENoM2FSmNhzHFRQUsEgq4+JQjaYo+My3ITnzJ5O7JK4e/LfrN/i9d8btBrHk82zoDgASoNZoxj3+1Eczpz83fpyiKCq1Oiah1X1PPiMIAkvOMhiNgE6n79mrd8a6tX9u2pTes1czuY5dGoIgdOuevnnTxg3rM3r36Utbhj2PponheRxYwaNGDu7Ts8sFu+2aEAIRDAsNuupKx2pqaubOndvSZ8FgeCJYwZ179mrToXNJYb4kSVqtLjA0jOOQO7LYDDB5x7j2MZpMffr1W7tmdca6tf36D2jcOQRXCM/z3dN7bNmyee2a1X379fdshXctx/AIIX6+3n4Bfi3hA0zNh7Fc5/3BYDCuDWSJBu0i4+Lcvoz1WePmgck7xnWBwWDs2avP+ox1GzdkdE/vodF4UAyP5/kuXdK2bf0zY926Xr17e1od3vUTw1MwBldb/Kz5oTPXHY3t53LJOBxOJoIZf4uo4iAEskQdD/7ptq4ZFqcqNAi11jsrrM7xHCDn3zOdXeYqrcMKNWFx1wW21JcKk3eMaw1CyHkLsb29vfv1H7B65YptW7akde+uUjWVXe1lIIpit+49Nm3csCEjw9Vp0cIxvPMmKNuktIUIrs9YCwGIukYVHuPiEExMRv0do4cVFJXyp5yfmw1ZUYKD/E0mwxXPLWRcu0BIMN6asf74oQPtunRLTGn7jwrdIIQ11VVV5WX0PQZp6adfYLBWr5Vd/bbunRedPIkQ8j3ndzgvcLKkFObmAggDgkN5nmvOWN25MHnHuNZQqdVFhQUnjh87t0kTcSgsPHzP7t1GL6/27Tu0yOnVdVedc2nkOK5Hz17btvy5eeOG9B49/VtI4XEcRwgpLCygvzvPrEQGAAYHh8TGxq1bt2aYwdD0U8sYHgdWlKAA39dnTAYItkwSGxNid+Am6+RgXO1wHDqwd/fLj0/w8vH3DwpJSk39R28WxKF1v/0yf9Z0V/crhAj5BQY99PQL7bt3V2TMcSgvN+eFh+4xmLymvTvfx8+vXjtyHJe5adOnc98szMsFAIZFxzzw1DOt23VQWk7hMXnHuNZISkrevm3LX39lInieEJRrHCGqKC8HLYRarbHZrIcOHtBotO6BhqfPDSJvH9/s7OwtW/4cPGSo6DLMbGYMBmOrpKQ9e3bv3bPn3EddlsnQarVWlJczeXd9ggkBtgvMY2IwWhqBB8UF+TqDac6X3/kHBUhOheM4XqCGm1gBkrMuZ0ovBDzECuA4oGBQL8IgBGUlRSq1Zsrs96hhnsP2xfvvznnx2dlffOcXEIgQ2LEho6aqqqK0dF/m9j433ODWjrzAbc3IePHRBzql9/zX+EcIIb98tejZ++9+9YNPUjp3rov8NTtM3jGuNfz8/AYOGuxwOM/vbwHhnl07LRYLaCGCQ0JiYmL379t33gyyKytKaqqrnE5ni8g7AEC79h1i4+Lo9935nkFCyOqVK88J7DEYDEYLgxDavf2vP35cXFZU+MW8tweOuLVt5w77d+359ZsvK0pLU7uk3Tj6TrXLPKEgL2dv5vbE5LY7Nq2PSUzq0C29vkQOQmT08kru0EmlFnmBlnu++OgDRfknA0MCHTbpz3Urb7htTEFuzuY1K3sOHur+GnfYnV9/9G77tO7T3vmIF2lmpn1a+jfz5yGOa8FvSibvGJ4ChFRONIp9Kc8LvGu8xHlpKdnkRhCErt26d+zc5byPQgiLi4o2bdxwGfXjVzSM7EwuPvZXuAod2hgMxjWPK/ZWnHPsSK3FfGDXX5179Ny9LXPKQ/dGxMQFhoZ8t/CDQ7t3PvXaLINJm3Ps6NsvPReX1AYrssHomgMLIe1urdsP5HlBEOjc2JqqKo7jVGo1hCDnxPG8EyfufXxSQV7e/DdfKysu9gsMBAQWF+QfP3jgv9OmCyrO6aDxQr1RO37SUwqNF7LkLOM6Q1HOqI6GEMkKUQik/60Ln58HDl3hQDDK5XXe0eGDEIFGMkW7iNc/L1zJp7LJLXnPmrrNYDAYHoKi4P7DhxKM58987Y1PvvLy9n7m/rvbde029a15Gh3au2Pf0/fe9dfm9f1uHOL+Kht174N9bhiCMXUwqd8JQlzO8WMzn5vICyIAeMva1V179YuIpoZQ2zesDQoLS2ybGhgaJojC7m1bBt18M8aguqLc6XDoTv0q3pu5Pff4MV4QwiKjW6W2a6lng8k7RnOTX27/el3R8ULLmToNOhz24iLj6qIsUVSdVZTmhhBg0KCbuwV1b+3d1Cep2G20UqOBWpKxDGQ7sVsVW+0FYlcEII5zzas578wc4ArTQ/Q3/YYXF08yVlYd3bbq6DZFURoqXYRQTk62IKqCy7aedw/E9es0NTjh9tQBWsGDnP8YDAajsVBkIDmdGGPJ6SwtLsk6evjOhx7jBWS14Ki4BN+AgP07M/sOG0II9vLxjW3dmpyp7dxRPKfDUVZcJEvShhXLbxxz11OvzVRr1OZq6+Y1K3V6w/YNa2VJEVWqjSuW973hRl7gGqZOIITbNqxd99vSwpO5Hbv3fPXDTxFCLfKTmMk7RrNid+IZi7O+Xl94rhcQbVOCGpxTcRFfWYzBxv1Vi55qGxfSCANkz4tsMRf9sKBq1xasyGcEwwjRV1bUqtQH9brzf1QJARCZ2nULGXUfr6fRfofdXlVdZTGbHQ5HSGiYwVosFWUhrQn5hHC+IZC7YPr4IvxxeMu/v55a67Rx5zSOICocCT5xwVoP4tKOxeaKyX3/fRmHZjAYjKsFSK8XiqIoLnVFlxAAEM9JkuRegY4xk+Vzv8wVRYlPbjPz068EHkx5eEJFaSnH84gDOcePHt67G0F4cNdfbv+UyrKyovy8iJgob19/lUpdXVXpSvCSOx54ZPS9E9577cXi/HzQcjB5x2hWqq3Sn4eqASEif4EsJ534ecEMIyEgq9i6N8vSdPKuZNk3uR+/qZz6CmgIj5BCSOVFfocRUv3XJl6v97/lnpKS4pLiIqfDjmmumfj6B+itZlyUhTkenDyMvAL52Pa8d+A/Taf+fvhPq9OmFS5s2nfR7LFdcqw8uvXh9Nv04nmijAwGg3FtgDE2mLz8A4Pyso5zPM1vVFfVVJVXRMbFn89T4cxtFcVmtXIG7a1jH5h877/W/75s2OiRW9auDgwJnf35d1qtDkJYmJ/33ztv3bVlc0RMVEBISKvU9it+XNx7yDCtTlRrdA4HOZmdJdD0bovB5B2jWaGDWYgrU3m5QAilpjQ1rT22H8sSEi+Yvrz4NwOWnBX7dta0Sa+sqnR1ikCEYJ3TMkS0UhdxgCi4PM9ZWwUSu3JBMf/ouZCxjODp9C4hRFJkd+KVRzxq8MTKdGI2BoDwHF8f6nPliInEbMMYDMY1iqIoDrtdURS9UXPDqDs+euMVtVoTERu3/PtvDCZTWq9+WAFYpuucN2cqS5LDbqdzKWSSlJqa1mfAlx/MTe7QMeP337r07BsQHOj+xo2KS2iV2n7V0p8G3XybSiPe8eAjUybc8/S9dw66+VbIcZkbMw7s+iu1UxpoOZi8Y7QYhLjqzCCkAbvTS1wT1imnFrq88k+vRkBJUcGJY1Wycskij9AxMqFhEWr1pUyqoB/ds04UOx1np4whosKN48/q9UUQ1VRXwcpyxPH1fVjnAAHigd0iHfoTCBreN/hS/xC65enDEUC0orp1QDRxyb4jZblWp8Ot8Agh4abAEJMfgii7srDYXOFeDiG0223Hjx7yN/iGhIVWlJdXVVbWP9eEEI1WGxoaVlhYUGux1C/HhBgM+pDQ8Cvva2EwGIymA2MSFBbec9AQtUYjS2ToraMlh2PpN1847LaI2PjnZ73rHxIsS8QvKLjXoKFane4shUcwiU1q7XTYEUIYE47n73jw0S8/mHvswP5Wqe0GjBhZP6OM59Etd92T8ftv1tpanhdSu6RNn//FZ+/M+uL9uRzHd+7V55HnXqo1m1vumWDyjtEy0M+UWuREHkkytjnrugQgBHoNhyC0ORVJIXTQOiE8h7RqHgNidSj0kwiBKKq0Gq106fLOVZd23kFbl3KiSFT59R7KaRqkgwlQbFZHUZ4t+4hsrUXCmVV0EDSMol34nDjiqJWzd3NGH3h5vQ6EHmjKwPvbhcQ7Fen55fO+/Ot3FS9iQtS8+N7Iye1CEyutNfct/l9+dYl4qtQPIU6vN+h0OgiRWq02GI1nu8ZAqNFoz3i6CFFrWDKXwWB4OoqCUzt37ZTe1WGn+QsA4K3j7hly62hbba23vz+EdQ7GSant23Zuf2qdMzYfcNPNg2+52WFXXMV5SlxS61c++EB2gv433iA5TxsgyzLu1q9/z0H9XQU4GMggpVPHmZ9+Vemq1fPy8XanTJz0stUyVgNM3jFaBgWT+waFTRgWvuNozYR39jkkLCskNcaw8L9t1SL6NqPw5a+P8RxSMLmzT+Dk22N3ZdU8/O7+GquCEPTx9Q8Kba6ZXRjzOmP0Iy+qg8LOekSqqareteXk53MtB3fSMN5lADlcUSBXFAiB0ZezNYQV1pqF25YsGDXFizM83mPM8kN/mh1WpyKN6zy8b1wnAMBnO37dcfKgcErbEUJUKlVoWITBVXtn8vI2eZ2nDdnXz+9y/hwGg8FoaWg/ha3+HpGcilqj0Wi1GNNC6POtcwaypMgNSq/pmlbXcvlv1pQlGqfw9vMnAEgtNKmiIUzeMVoEqGCSX273N6lSo43+JjG3xI4J6RBrjAygsqNLopdBw9faFQ6hlGhjoLfKelCprpU5DgECLJaamir+TOO8vzseQgaD8dxJr5e8PY3GydZaR0EuwTLkBHVwmGD08us1RB0cfvD5ex0FefAydg4hwAquKCABUZeX9xQ54deDG5fsy7g9dUCb4Lhb2vT5YMsPMd6hD3S9GQBwqCR77sZvYYP8Ma1clKTSkiKi99YbjTab1Wa11iejCSCiIBpNJovZbHfY6xPBBBC1SlVn/slgMBhXFfgco4Ymggb8PKaymck7RsuAENx1wmy2yd56PjpQe6LIpuJRSrRBdkWyowLUkf7qPdkWvQa5m2T/OlojycTt+FtZUV6Qb/kHv44I4Tg+OjZOc9kZRtdvvtqj+45Me0S2VAPEaaPiY/4zzZDcQR+f7NfrhpOfvwO5v9s5oaMNz3Z9wQoxV9LlFx6zcREghE5ZmrF2UZ+4Tv46r/FpN/+yP+OODkPaBMXaJMerqz8prC5VN8z8UnnnLC0pBnZZpdFUVVWeXXun0Wp1uoryMkvt6do7QgjN5+oNl5fgZjAYDEYzw+Qdo2XgECwot+eW2JIjDfEh2pU7y7z0YkKoLqfEarXj1pH6uFDdzhNmo5aPCdLYncr+XDPPQ5e1HAgOCYtLDPhH9QwQAO7CgyIuFawoVrNiNUPIVe/YWLLyJ0NyBwCAJiqB/F3sDQLC+wSTuA70D2gIIVCtv5JZbALHHyjOmrf5uxcHPpAcFPufnmPGpA4EAPxyYP1vBzeK/Bmd+QRjjUYbn9jaR2sAEIaGhgcHh55xni4ioqLPqhdxL7/sk2QwGAxGc8LkHaNlgBBYHXjniZrkSENimA5BGOgtxgbrth2uzC62p0QbUqIM328oCvNVB3ipckpsWcU27lSHLe1YRdw/q1dtNHXisuVzzcd1tdO6uITIf011NTR5Ee+Ycx4hPM+bTncPXw48Qp9sWzoooWu3yLZP9roDQVRQXfr66k+dsiScUxToSh/IiqJwPI+xIsvK6SZlAjiEXMupH+gZy11cwTkyGAwGo/lg8o7RMtCuWAD2nDCDviAhTKdRwQh/ta9ROFpg3XqoasKwiLZRBlGAcaFanoMnCmvLaqQ6w2MCCgvyjx0pl84pdL0QxOX9FhEVffnJWfd+qKIk1KUFYE1Ugm/voe7l5sN74IUnbbi1ZVlpSVlp6bkexgRjo9FkMBrR3xjqXQwOcQU1pV/t/CMtIgW5ooOLd686VJqjPjN0555dZrPZjh45HGDwDo+KKi0pqayoqNeWBBOtThsRGXUyL9dittQvxxgbDcaIqGiWnGUwGIyrAibvGC0IOZJfW2OVIvzVgV6qpAgDgvBQbu3BPEthhSMpQh/opUoM1QMAdp0wW+2KINC+CgCB3mD09vXC/6S1AiEknGVf8s/RRsbFPTkdSw4oqvXxbbRR8XQOx64tFZtWXJqzyXlG6RJCBFHg/m4Q7cVRCPbRGm9olV4foRzSqtu8zd8VmSu4MwUZdnXOhoWH++m8BUH08/c3GAwNa+x4QeB5ISgoxOnjaLAcCKLItB2DwWBcLTB5x2gxEIS5pfb8MntciC4hTNcmyiDJeH+upbRaOlFs7ZHk3TbaEOpLZdOBPItCiOh2FobAy8vbz7+5jFEaIPoG+g8aWX+XKEpV5oasea9IJYXwcrUjhFCvPy2wLgPqaazId6eNHJjQVcLy55nLxrQb1Cog6vGeY57+7V3kTiSfXptwHOfl5aNVaQEAarVGrT5PRFOj1Wq0dAUGg8FgXI0wecdoMRAChRX244XWpAhD9yTvpDBdXqk9t8xmd+Jdx2p6JfsM7uAfFagtq3EeK7CiBsVplZXlZcXyP7A1JgBxnI+v7xUG8JwlhRV/rsayk871qq4w799Zs2crtlkvW9sRQkRR5XU+57lLR1bktsFxT/e9m0fciiNbn/3tXY2g/le7Qf/uOGzFka0rj25VcadTtBBCh8ORk3XC3+DtGxBQU1NtrqlpGL1TqVUBAUFlZaU2q/X0clfS1j8gkHVXMBgMxlUBk3eMFoNOp3Ao+3Mtw7sG9mrjE+yjWrWz3ObACiH7ss2EkPRkLx+9eKTAUlzp4N3yzlV7Z62trarCp8zD/x5C6GwZLy8vcGXyznryRNa8l6kxCuSo+x2AkOfhFTTkEkL8/P2vpCIQE6wRVM/3v9dX5yUp8jsbvy23Vn+8dcnghK4+WtOz/cZtzd1nk5xnTtGgQ3XcqW33rYbyzt2wQlyDdxrKu2YzjmIw3EBIhzVfykIGg3EuTN4xWhIEqfudpODkSD3PoV0najAmCMIjBdbSaikmSAsh3J9tqbEpdQKFAECNUULjEoP+6Zf8lUeeXN23iP5DCHAXLLZzi6S/PRjGisnkFRwcciWuKBJW7usy4sbkXgCA7/esXn/iL72o3ZKz94e9ax7oektaZMqEbrfOXPeFeKp/1jW1Qh0VE2tSUzdBP/+A86a5g4L/wRhcxrUKfbsLPMBEOdewv+kPfa6Sg65xf9g905DBYFwUVivNaEl4Dh4rqK00SwKPJAUfya8l1OYDFlTY80ptbkF2KK9WkvFpCUTo1D9FliTJecn/KI1zSaCVbA3HQJwNAdQZWFSpsKK4zZDPsw4hGCsGo1dkdIwgnt3ceukoWEnyj5rc924AQJG54oMtP8rUzYQyb/P3ZbVVAICHu9/eIbSVUzl1eYZQURSzucZutWGCnQ6HuabGYja7/5nNNTablRBit9nqF7qWm222C0zwYVyjQAhtNvtPP634c8vOZk7KI55bu37b5CmzbTZ7/aERgqWllY9Pen33nkPoyj0sGYxrHfYhYbQkCMGSKufHK04mhOpKq5wH82o5RONj5lrly3UFWSU2q13efKiSq7+6uP5fVJR/9HC5fMm1d4QAnuejYmI0mstqF4AACVSEwUsZLEGI3mAIjE0oKCyorq4krhSn+xLl1pcYY1EQvHwCwiMiVCo1uDJMat3bG74BgBwvz9+Vf1h0nSGHuBPl+Q9+/1qcXziHkMBx/KmmV+SqvcvNzrIbfcIi3cYo5Q2Ts1qdNjIquqAg32I21y/HBBsNpshoZoxyHYF4fsu2PfdMmNq6Vcyv37/r7W1qmKB3v6ldRkHkQksusqYrDu9eTheftQ5EKDevMGPDdnnSA4iDRKEd3xBCq82+at3WYUN61lv21NtZniorYDAYdTB5x2hJIAQOmbz5fZbr6xsIPKr3Lv5sVf4nK05CSD17Oa7eYJeKLW9v37AwX+nSjVGIyxjl8uJkEGK7rXjZN6KXnzXnKJGli0cyXJVrxORl0hkMFeXllRVlFovFPYUQQigIotFo8vHzNXl5n1kPdzlwiNtx8tCW3H0EAA6iegdj6g8I0R+Htyw/tNlleszVG69gjNVqdWx8oo/OKAhCSGhoQEDA6WAkIYjjBEGIiIyi+bgGyzmO80xthxBsOO2XKLSasOkPSp21sXuC3kUXXhzqFM0hxdlgLLlnACHEivLH6k19enQqKavYlrlvyOBebvtumrFFyGq1ybKi1ap5gVdkheM5u83hcDrVKlGlVmNFdos2xHE2m01yyhqNShBFd5JXURSe5202OmZap9UgHtmtdqdTonvjOUWhR+E4Tq1W0QPV2giAOq3G5SYO1arTBj0cx2GMLRYbRFCv0xDSfKNFGQzPh8k7RnNz1rUPAiAK59ENIn9BMaHVG/SmK+o2vRhnxR4QUqyWnA9fr7979lSxC8DzfEBgYEBgoCzLktOJCeY4ThTpFevKT7H+Fh0ygc4vW8+dV1EnjxHSajTuJuILzaLgXQCPB0JotlhLSirodZ0WZqGAAB+jyaBcuuf1ZR20qqqmorI6JDhApRLdYg4haDbXlpVXBvj7arXqS1F4iENHjmYfPpI1sH93UeQ9KviEOC4vr3Dbjn3PTLzvt+Xrl/2xYdCAOldFWVYWffnjvAWLLeba5OS4KZPGd+yYvGLV5ldnzC8sKgkK8pv42NjhQ3tDBBUFf/3d8nfe/7KyqqZVQvTzk8d36ZpaXFD6+uwFwUH+y35fX1hcdv/YkT26d3ztjfn7Dh7r2inltZcfj44Kc4eZZUmZ+fany5avd0rSvWNveXTCHQ1/WdEzPFn0+qyP12Rs5Th+9K2DHnvoToNR53IdZzAYTN4xmheVgLz1YnaxFZ5PJLlzNhcqWXP59xK1gHz0Tfi+RYKKRinOEXmnbv1dyA1jCeNq6jaC6jJQdRsCrGDJKZEL+BurNRrxEuKLKcFxElaA7DzDzc7dc0JPkmB8wa4OAoBTluJ8w7TClSaFPQTEcxs2ZU56fjaHaAIfQujrY5r4+NhhQ3q5g0BNclAO/fLb2ldnLnjq8XHj77sd07pGiDF5ffbHS39b9/7bL/To0fFS9CXkuI1/7nx//jc9undUqQTPSi4iuD1zPyCge9dUq9U+a+5nhQXFoWHBAIG/duyd+8FXjz18Z2xMxPc//rF5667QkIBXZnzYu0engYN6rFu7dW3G9oH9ummN+mW/r/nf6x8+/MCoNm1bLV687InJb/zw9RxZkn5dtr5nj/bPPf3gsWM5r77x0aYtu8bedZNKJT4/be68D7+ZOX2iK+eKcvIKVAL/+vSJhw4cm/Pu56Ehgelp7U6dHnJYbVOmzS0qKZ8zY7LFYn115nyO456ddD+d7uxRzySD0UIwecdoVrz1woNDw2b+qJRU2c9UIRAT95xTeOGOH6ITuJHdA9NaeTXdGXql9a/c9Iezoqyu0O9MMFbcCeLznx/GvI+/FJOSe/IkcCVkLxFCcHBwqH/A33s139VhaFFN+boTmWedAoSwurqa4zi9Xn+Ry1u8X/gLA+87a5TFVQyEZeVVAJM3X58YEODjlJVFn//87ItvpyQnhIcHUQUs8lRgK5hIktsLhhP4Om2NEJZoVpQ2h/IcXSjJ9S2iCEIoCoBDVOg76Yjesw6ak1vw0cLvBvTrGhMdARDcvOmvb75bXlZebbHUuiU9DYte9OgAAp6nKUj3LwB3oha7dCESeCLLDTYhNAEquL6uab0CR4vRnFIT5SIhhIokr1i9uXfPTsagwAF9u855Z9GW7XtujQhxuU5WKzJObhXbtXPbvgO6A6d09Eh2jbk2Pi6yS/vWvfp0xVY7IEC2O775bvlNw/o89vg4wHHJCVEjbn9s9dot/Xp30ek0Y24dMmj4gIG15l+WrUtOirvtXzcCBA8cOrFm3VbJKYmuachhIYGPTrjDK8hv4MAeWdn5Py5Z1T61VV0AD6F9B47t3ntk4Qcvd+jeHhBYXWNe8MkPTzxyl1p9KfNjGIxrHybvGM3NrT0CU2MMpTVO2FCEQFhdWblrV2anzl21FxYoGpFLDNXq1E04294nfSCneceyP9MdlalfTjA+dvy40WgKDAwgpK4I6UyhRyDi9Mkd9alpAHEXiUGeC+0XvrRkqEGlnTZ4fKWtRsZKwwAehHDN6lUGo6FT5y7nnX9Lw3sQ+mpN4NoCQmg06tu3TQwICwSIUwv8H6v/PHo8NyI6bM/OA59//WtJaXlqSuK4f4/w8TbJMl65cpNGrQIQ7D94YuSI/iajfvHiZavXbtXp1HeMuqFr57ZupVVjtnz96fItW3cHBvjec/ctiQlRSgOjRQJA184poiB88fWvU6c8Ijuc8z/9oUuntkeOZrtaA2h12p69hy9y9AMHT9x+2+B6nQ0F4fD+Y+v/zBwxrK8g8MtXbOzbs3NQcABWlJWr6Cbd09qvWrUZQphfWLxu/fa42Mj7x90a4O9zhu5svKe0uKh0w+bM0OCAJ/7zkiLLeSeLVq7ZMnLEQABh544p7dom/mvc0xHhQW3bJDz28J1RMeE3D+/7/Etvvz//25iosAn3396zRyd7rSPvZNGBQ8dH3vYoxlhRcH5hSXl5latUElEt67RLkuxl1KtUAnA4AYIGvdbVXOGK4AOgUgvUG8XmgAIXHha0Z/+R2lpbXcUqgoWFpfmFJc+/NFetovq4pKzSUmujoWtXiwaDwWDyjtHccAgmhukSAfVda0hNpeQocPRq46XWGkDLATnOq3Nvr869z1ouY7x3+bLAqOiI5GT3khqL2Wa1nRVFkyCsrKpuWB53KRACDEaDVnv2c3IhvDXGcxf6iHqjyuinbcLQpmdC41kCD2hwC5nNtRgrep0mLzv/oSdeCQr0CwkJ+Pizn/YdODbvredFUfxq8bL9B48HBfkF+PkMH9prwac/zvvo2369u5SUVkx+fs68t6a0TW1lrbX+d/KMv3Yd6pHe4cDB43fd88yCedNSU1vVx/YIxl4mw11jbpz+5oI7xwzPySk4cPD4S88/PPV/77p1dFbO3x/9xuF93bEoQeCPHj7xwKMv9e3d1cfX++jR7BmzF8ZEhQWHB0NF+Xrxcl9fr/Ru7b/8dtlfu/Z37pii1WkX//BH5s4D8997ydvbiBs7DQ15LmNTptVqDwsNpO9whNokx2/esju/oDg0JNAvwOeLhdPXb/wrc/eBH35aOem5Wd8uevOllx6/5cb+f+7Yu2Llpv88OX3Jd3ODg/xFUejbq/OY22+QJAkhpNNqgoP9rbXUYaf+91vDjtezf9TRZllXJBQhWZEFnudddaJ1TxrPBfh5P3jf7cFBAYoii6JoMOhUKuEfjaJmMK5hmLxjeAoOiUgKdEjYQ+vCMIEYu5sH3dSazRXlp11FrghCeIG/dHl3XhSCFVdY8bqC51BefskLL79rMOgkWd6wMbNNcnzrVrGSJM2a/lRaekcgGP5Y8uvTL8zOyyuKT4hSFCUiLOjDd170DfZTbI51G7bfOKz39JnPAkU5vPdwQIAvgCBjw/bde498+9nMhHbtgL169J0TF3215M2UhIZGu5KkDBrQ7edfV8+Z+1lJWeWNN/RukxQruSN8GBgNur85epAfAERWFIHns3Pzn536dtfOKc9MvI/n+fMZi7h7GuSU5ISP3p2K9LoDmftvv2viuvXbR44cBBpV3kEIJYfz9xUbhwxMf//9aTSJjLjcw8dvvO0/Gzb99a+7btqTuf/w0eyRNw3oPbh3ZFjwzLc+OXI0e8/+o8OH9EpN69ire4cxd08qLq6IjI5ol9oqKzs/JTlObTQWnyz8+dc1t9088BLFF3RlwIuKy43eXuaKmi1b98THRhj0WkmWZVkhspIQH6VWqyRZ6dqjA1Dw6pWbCgtL42MjmOcxg+GGyTsG4xI5+6IRFBwSFNRo0x3YONfLBTolqaikvMZcSwC5aVifcf++xWDQAQgDqs1ffbGkvLI6KztfVohUF3uDCfGRvoG+2O7kOK57Wrs57ywqL69q3y5pQJ80by8DgGDX7kOSJC1dnoH+WM9xqNpsKdldIUlSwwQ6xtig1z7+0F3DbnskIjz43VnPOhxSXV6QYD8/n5oay8WO7nAigUcIlVdUPfzEa8UlZQvem6bRqevNR879OxGCIcGBiBdIrTUuNiI8LGj/weMjGztYhXjuwL7jW7btmfHKk9Q42+aAEIaEBLZLbfX9zytuvXWQ2WJ9dcZH789f3CohasPmnTcN660z6L745tdZcz/r1iV1155DMdFhCfGRBJD7x468/5EX+w97oG2bhK3b90ZGBI+6dQghxGaz1+eU7Q6n85QvjCTJdrvDfVuRsdlS+/LrH+i0mgOHjldU1Lz4/ENGk14UxKeem/WJr3enLm3v/fctT0+ZvWTpGgXj7Zn7pkwejxCi1bEMBoPJOwbjsqFXYKbJWhpZUWKjwha895J3aBBtZ8GYOCUC4Z9/7nzquTdjo8NjosNqaixUnZ96sWhTrYLp7BBCJtw/KiTYf+myjPc++HreB998+O7U7n3TJFmWJKWyqsZtttsrvWNcTMS5M7IkSencMfnfY26Mj4sICA3KPpZT9wDPb87YdvGju28jCLNzCu/q3kFRlM+++mXSf++pL6esV3gNpR49Afc5QMJxSKaSkTZKN6LEwwr29THNeePp7mnt3H0ehBCE0LMT78svLMFOOb1b+68+nfHDL6vLyiom/3fcjcP6eHmbFr7/8g8/rzxyLGf0rUNoRaOXATulxIToRfNf+2HJqry8oofuH3XTsL5eXgaeQ2/PfCYlOR5LMkLo6SfvMxp1dMQLhsOG9Gqf2oq62Uly756dvvh4ularXvLrugF9A26+sV/blERFVt576/ljJ3JDgvyxrIy/97b4+MjVa7dwHJpw3+3p3drTUcosdMdguGDyjsFgXN1gjG02u7fNVt/9wPHckl/X+Pt5fzb/VaQ3bl6zMXPnAZ4/uyMHK3J+fvFNw/qOGnOjvcZy8+jHV6/b2r1319jocD8/74mP3e0dGgyIkn3ohEolchx3lryjk4URemnKQzzHA1k+/SiCl3J0t8Fv66TYN155cg2Vg7O6dWnbo0+awPNOp1RrtVFDSEWx2uw+gDbEEELoQo6DAm+prCkpLY+MCAYQEdCY8SqCcXCQf3B4CHE66+vYCMatkmJbtYnHDomec3J86zYJVKTyHPXBk+SQkID/PHo3ldccB7DifiEURYmODn/qyXtPrUmX67SagUN6UWms0IEu3Xt0pO3okgwIiY+Pim8VozicBOPo6NDo+Eig4M602YUKXMXV5typc0qnbu2Aw6ko1Et50OCegwaku15yhJ2NNHiQwbgmYPKO4Vk0Q47ySg7hyafnUhvNdXoecx2VZcVud5x7XQ8PC/r+51ULF/1kNOnXrt1aXl718y9r/vuffzuddAixO9fpcODXZ31cVFR2910jzGZLfkFxXEw4wLh/37T5n/zw4GMv3zF6WG5u4aKvfnl+8vhbbh7oVhh1aUSH0/2cG/U6t1kjTTvaHYoru/q3R6/bj6xQLxZZuWFI799+Xz/l5XcXx0cHB/uHBPu//ubCqhpLfn7xjr/2hQT7u3p+uD+37po374uQkIBvv/+dENC7R6emeCFc8UXH2QslGZw6cberHw1nOuqUpUvPUVcjcmYnr7sZpeGahBDlVAaWruB6Gk+vfMoukO6wQavy6XWcEjiVzKW7cjjdE85IE/pYMxhXJUzeMTwGOu0eOxx2RbmiDoO/xeE8fUX5R2CCJanuog6aBkjN+uXL8zNTqVQlxcW5uadShE0DVrDFYhFUlzXhrbEhGMdEhw0d3FOjOWNQBJaVO8cMy84tWPjZTyaTfsL9oxITootLyyVJ7tG9vclInXcwJiqVOOmJe2fN/XT23M8Enh9714ibhvfDTikoyP+9Oc+9PvuTGbM+VonifWNHDh6Q7jLKcR+UtE6KVTB2DyBxpwMJATqdZvjQ3iFB/sQp/e3R609+cP/udHKIwD078b4ZsxfuP3C0b//ur730+CszPnpzzifpae3vH3trSEidF0+7tol5eUVffvObt7fpnTefjY2NqG/mbYEn/5xPwYU+F00aVPOYHxoMhmdxdjUJg9FS2O22DRkZVVWVKrX6rJEMjQgBpNZSm9quXevkNv9sQ0J2bNuWnXPCy6vJ5qG55J3FbFGr1f0HDnLPDbt0ysvLN21Yb6m1NGmIEWMcGhqa1q1Ho/vHYls2kSovceZbPRzPAUHA5wTw6ARYBMvKKjUalU6vc9kIQ8Xu4FQidQk+FQGiBmwQlJRUqETB5GPCUl2OleM5gklJWYVOq9Eb9fXL67YSeMBxDaNQdcNY1SrgpOnLSz06PXke252EEOqBpxJp1pKOcOUddkdNjcXP1wuqRYCJbHfcO2FqaEjA9FefLC0u8zIZBJXYpLPXrjcggBbZLKvDIWxCW83rDQRBrg1h6H/lI7YZlwImwFuEERr6LcrkHcODsFgsJ/NyJUluum8Cmk0zGcPCw7nzjWS9OA6HIyvrhMVsvuDYiiuGAKISxcioKJPpcuzrsAvQxDTRONrLk3cXgeothFyBOvy3q1HVdeZql7j5FR79QiA6NwO5egWo/xvG+K57nw0J9p898xn3y8y+uhsXJu+aAibvWlDeseQsw4PQ6/WtkloDT0WlUrVqlQQ8GOSipc/CU6C1WZcw1OFCq13i5ld49Avhams4Xa8GIfz3HTfqdRqiKM2g4Km0dMU1XYenzRJMTTIYVxdM3jEYDMZVwLChvQCh7ahNfSAIgdMpFRQVuIxXgCgIISEBolpVn1P2WGjS3DUAraVPhMFoeZi8YzAYjKuAhkNvmxSEUHZuwT0PTjGbaxGHeI4PDfF/9MF/DR7Uo9nO4Z8CIY13rl79Z0iwf6vEmGYIcDKuJSCEHE99BzCu+wVFnYxc0WtZoncRQhxHa8Jl6aqpi2B5HIan43Q6Z82atXz5cnCV43Q63eGQFuTYsWNTpkzJz89v2dPwHOA5tPQZeQAQ1tZai4rLnnzs7s8XTJ/zxuSoiNCHnnhlxapNNDzmghN4TqOm/wSh4ZPGcYhTqzitmlOrXOWDkBMFdMqvh251yv+P4zl6VxToyioRIcjxp/bpmi3rtn3mVCJdQaOqX3j2tvRACELEc9zHn/24ZdseqFWz15Fx6UBq2iCv/mXJhzOn5xw/ijha4rLvr8wPXn91W8Y6dyFseWnJJ2/P/uGzTx12+9Xy7mLRO4anAyFcsWIFIWTo0KHgamb69OlJSUmjRo1qwXMoLi7++eefx4wZExoa2oKn4Tm04A9xl16hpXTA84AQatSq5KS41E5tgKz0TO/ocDo/+vj7Ht07aDRqQMCq1X/+9MsqWVJuGNJr+NBe7pEeHM9nZ+ct+nLp8ay8pFYxD9xzG0Jo+R8b+vbqHBQcgBVl5apNarUqPa09AGDjpszaWntxSdna9ds7tk8ee+dNW3fs+fb7301Gw/3jRrZKjAEA1JgtX3+6fMvW3YEBvvfcfUtiQpQiU3e9DZsyrVZHRUXVH6s2JcRFjb/3NpVK+PzrX7f/tc9mdyCev+XGfga9lsXwGJcCx6PigqI3p0zKOXbU6XQ++vyLiqR8Pu/tpV9/ntan39tf/+zlY9iydtUbz05UqdVJbdsnpabKnhrGbgiTdwwPpby8fN26ddXV1SkpKSrVGb/dd+/evX37dgBAWlpamzZ1/iZFRUXr16+vrKxMTEzs3r27KIpbt27V6XTuFbZt26bRaFJSUhrr9DDGmZmZJpOpvLx8z549kZGRffv2VamoV0h+fn5eXl5AQMDmzZtlWe7Tp09UVNSKFSt++umnvXv3arXaqKio8vLyHj16cByXk5OTlZWVnp7+T21Q/pby8vKdO3d27drVYDBUVlbu2LEjLS2N4zhRFN2/PgsKCtatW1dVVdW6dWv3CRQWFh48eLBbt24ajaaoqOjAgQNpaWlarRZci0AIbTb7zLc+OXQkm05QcDnYxUSHvfD0eJ1O2wyyr6CwhOc4Pz9vj8310CyVrChOiVOJQwb2eOm1eQWFpXGJMZ9/9uMrMz7qntZOFIVnXpiTnZP/6MN3II7Pysr79/3PadSqpNaxS35du3vv4ccfvuvNtz+NiQ4LDg+GivL14uU+Pqae6R0BAb8sy/h9xcZuXVPVatWcdz9ft2G7XqfWGw0ZGzN37Nz/49dztBrNfyfP+GvXoR7pHQ4cPH7XPc8smDcttV0rgPHSZRl/rNzctVMbvV678POfsnPyX3r+of0Hj1dW1mTnFOzff+TGob2arLudca2BFaLVGzp06yGKqrhWrekEQYSS23c8sDOzbZc0URSxQsKiYpJS2/sEBHr5+tZPc/FwmLxjeCJlZWUPPfRQTk5Ohw4dli1btnv37oEDB7ofWrJkybRp01JTUzHGH3zwwbRp04YNG3bs2LGHH34YQhgbGztv3rybbrpp2rRpmZmZ33777Q8//FBcXPzQQw/973//a0R5J0nSK6+8kpubm5qaqlar58yZc9dddz333HMIoc2bNz/xxBNdunQJDg4+cuTIwoUL58+fv2vXroqKihMnTqxfv57n+RdeeOF///vfgAEDJk6cGBUVlZ7uGqzUqMiy/MYbbwwcOHDSpElz5szZtWtXWlqaW9jxPF9cXPzwww+r1eqoqKgFCxaMGTNm0qRJDofj+eefnzBhwtixY6dNm2a329PS0sA1CoTQ4XD+vHRtZERI184piqwQQIID/et/SHAcAoJAVYKkuN2DaQ6Q44iiQDp6i5qTIJ6jVgSulCWddUsIEgXqcuca1VV/LJrT5HnqwCvJikLjT0jgP1r4vb+f1yOP36PUWoGHg7Fer7XbHVarraK47KOF3z/+8J0PPzYWIPj9V0unz/r4hsE941vHfbV4mU6rXvz5m6bgwJNHszI2Zrreb6d1VsP0N8YkPCzovTnP80bju7MXzHzr01W/zo9vm5y5ceud9z5z5GiOpda6e++Rbz+bmdCuHbBXj75z4qKvlrzZNsFlE0NCQwLenfO86OX17ec/THv1fYzJe3OeO3Q46993DB83fgy2WLFHhkUZHgjG2Gjyevr12ZaaGr+gYHdAfdS9D/YbNsLH358XBEnCbTt3fe+7paKoMlF5d3W8tZi8Y3giy5Yt279///LlyyMjI/fu3Tt69Gj3J6q8vHz27NljxoyZPHkyAOC11157880309PTP/30U0LIjz/+qNfr//jjj0WLFlVVVd1///2bN29+5ZVXysrKhg4desMNNzTuSRJCYmNj3377bZPJ9P3330+dOvX2229PTEyk9UYc98gjjwwYMMBsNg8dOvSnn36aPHnyli1bOnXq9NxzzwEA8vLy3nrrra1bt9rt9smTJzd66A4AEBgY+OKLLz799NMIoYyMjDlz5hgMBvfTyHHcyZMn9+7du3Dhwt69e/fr12/NmjWyLEdFRT399NNvv/12SUnJoUOHPvnkk2s1dFePKAojb+o39oHRdaOuCFFcDsYcz1VWVGfuPGB3OFq3io2JDscY19TUFpeUh4UG5p0sMhr1RoMuv6DEZDLs3X8UANK5QxutVrN1U2ZpWWVyUmxsTLj7OsFx3LGj2QcPZwkCn5qSGBzsL0ny4f1HM3ceCAn2P7D3cHxUWH11msfiNmfhBf5Edn55ZXV69w5AkgDGXTunOJ3Ow0ez4+Mj9+w7kpKcYPLxwmZLWGjgnXfdfHDfYeyat3HeHQYF+lEx7XREhAWHBPsbjTrgsPr7+5hMBovFumvPIUmSli7PQH+s5zhUbbaU7K6QJEkURUJIcJCfwHPAaY+MCBFE3mK1ORxOjLHTKQMHtYlu9meIcRWDMdYbTUYvL0Wp65wQRDEsKorec31nEkICQ0Obp3W9sWDyjuGJHDx4MCkpKSIiAgCQkJAQFxfn1iX5+fnl5eW9evVyr9anT5+vv/46Ozv7wIEDPXv21Ov1AIBBgwb16tVLpaIF108//fTw4cNDQkLmzJnTuGdIFQDHde3a1WSi4947duyIEMrLy0tMTFQUJSoqqn17WmBkMBjat29/6NAhWZYbFuSOGzfujz/+eOONN5YuXRoQEACahvT09IEDB06ePHn27NkdOnSoXy7LcqtWrQYOHPjwww+3bdt20KBBzz77rFti3njjjStWrHjhhRc+/vjjqKgocB1AnQIhD3iXIHANhOV47tixnCefefPwEarJBEF46fmHRtwyaPfmnf+b8UGr+OgNm/96ePyY7l3bPjH5jbDQgH0HjxcVl/fr1aVd28TFP/xRXFLu5W1c+P7L7dpRl8Tlv69/5sW5iiTbnc6wkKD5770YEhIwZdo7q9dt1ahVx47nLv3+XY1G5dEZH44rKSk36LV+3l7HK/MIxvTNfEpCQQAlSQaEhiypTiWAuIJz9Zq1/p1/Vk16nWmzKy1e7//svrhCCCVZliSlsqrGfaxe6R3jYiIQRHTvDbalJ8MSsYwrBp9pCU8IOavAzmPbxi8Ek3cMD+W83Un1Jv7uu3VDP13UL5Qkqbi4ODg4WKVS5efni6LodDqLi4v9/f1By+G6fp0+86qqqpqaGqPRmJPThCNinU5nYWFhYGDgyZMnJUkSBKF+BIJWq50zZ87u3buXL1/+zjvvrF69esGCBWq12mq1lpaW+vr6NumJeRCEZGzIRAi5v8rbpbZq2yZBkuTXZ30sisL6lZ8ZjfoPFyx+ZcZHnTq0kWRl//5jg/p1W/Ld3KCggD17Dh47nnvHqBvmvTdtx9Y9Y8ZNMhp0v//yod1mv+Oep7/9bnn7zm2xw1FVbZn0+Ljbbx1cXlb5r3smf/blL/+b9tgH70x94JFpreIjn3vmQVEleqC2gxCKogBUKk7gy/NLvvjmty4d2/oH+NZYarU6TU5eYdtOKYCQwqIyAEBEWBAQ+cjw4Lz8YizLnFolWW07NmVyHCdLcq3VBkQBKYrVZvf2Nl5qaDw63M/Pe+Jjd3uHBgOiZB86oVKJ7n6Ui2wlCDwQhbpYLINxHcOMURieSHx8/OHDhwsLCwEA2dnZOTk5bmEUEhLi7e29ZcsW92qbN2/29vaOiopq1arV5s2bbTYbAGDt2rXjx4+vrq4uKyubOXPm5MmThw4d+tprrzkcZ0wIvULcIunQoUNOp9PdukEIcYcbEUKFhYXZ2dm09a+mJjMzs1WrVoLLP8JisbgvQrNmzQoLC5s3b95HH320b98+0DQsXrz46NGjn3/++datW5cuXerKRYoOBx3PunHjxieeeKJjx47TXGRmZpaV0ev0hx9+KEnSp59++ssvv2zcuBFc27jeVOs3Z370yfcff/bjgk9/2LX7IORQcVHZjp37//2v4YGhgRqtZvStgxFCW7fvRgiGhgaOunVwZHS4SqMCBHh7m7p0TtFqNW1T4lu3immTHO/l5x0UFtS5U5vKajN9rTH51x033j5yUGlJea3NHhEWVFlZDTHx9jKqVKJWqzH6eHlm6KmsvOr9BYtfmTb32adn3jzmseoa8+OP3AkgjIoMHTKgx/+mf/DZx4u//nLJ5Cmz07u1S24dBxR86y0Dd+46+NyLby/9ZdUTk2c8M/UtrVYVFhr0+psLf/z2t3fe/2rHX/vqIyROp+Q4JcIURbGfmhpMCLHbHQ6n1L9vGoLwwcde/nnxr3NnLbztziep6Qn1VYENt8UY2+wOjOnvFoTgN9///tWin52SxKZgMa5zWPSO4YkMGTLku+++Gz16dKdOnfLy8goLC91XhYCAgMcee2z69OlHjx4lhGzZsmXKlCk+Pj733nvvhAkTRo8enZCQsGbNmmHDhhmNxsmTJwcEBIwbN66iouL2229///33H3vssUac2cXz/MaNG8ePH6/T6VavXj127Ni4uDi3vDObzVOnTo2Li9u/f79KpRo1ahRCKD09/cMPP7TZbImJiatWrfr888+TkpI2btw4ZcqURYsWGY2XFNW4dHbv3j1nzpwXXnihf//+J0+enD59ert27WJiYvz9/SdOnPjII48cP3583LhxHTt2XLlyZd++fQMDAzds2PDFF1/MnTu3V69eu3btmjp16hdffBESEgKuVQgBEE56fOy9997mHslA3x6YmGutdrtTr9PStgmMeYFXqYSSskpvbxOEgFbUKZhO03RB35k0qAwEjqMCxfVGpZ6o7rQlhD/++Mc773+JEKcShQOHjo8Y1rc+mlu/vkdBCPHxNt0wuGdlZU1FxT6e54cM7DH2jpvCwoMVWeYQfPap+1Qq4eNPf8SEdO+a+szE+9QqUXFK6Wnt33xt4rwF32Zs3BHo7/PK1EdbtY5/eeojr7z+0ZtzPklPa3//2FuDg/3pX01Ax/atLZZalwLGYaFBQwf1VKtVhMaVNUMH9QwK9PMN8H1vznOvz/5kxqyPVaJ439iRgwekY1mBgDTc1s/Xe/jQ3kaDVlCJE+4f9c33vx85moWV3i39LDIYLQyTdwxPJCQk5OOPP165cqXFYhk3bpzNZvP19XU/NGrUqOjo6D///BMhdN9997lLyhISEhYtWrRmzZqKioo33njDXZw3YsSIuLg4QRACAwPnzZtXVVXViGfovjaPHj26R48ehw4dGjFiRJ8+fdzaUZbl+Pj4iRMnHjlypF27dv3793dH9R588MHWrVtbrdbAwMD33nsvKYkWZj377LNuk5dGx2g0zpgxo0+fPgCA0aNHBwcHC4Lg4+Mzf/783bt3d+nS5dNPP121alVpaekDDzzQr18/QRB8fX3feecddxvvhAkTUlJSeP7a/4rgOI7jeViXHqUvq0GvVatUllorbYlFUJZlu90R6Odz8f00TBnWlaUhrrik/I3ZC28fOeiBe0epRf6xidOptOEQcMWeeI6jzbkOGgD2HLCCIyNCPvn0jfqZs1SDOiV3+zDGRKfTTp3yyGMP34Ux9vH1prN1XSJVUZThN/YbNCC9sqrax9tLEAXFKXXp1Pa7L2bV1Fj8fL2gWgQKdivpcWNvARAqDieR5K6dU7qmd8B2B5YVP1+v12dMoodzOJOT4xfNf7WkrEKn1eiNeizJxJXGbrhtQnzUrFnPEgfddtSoG0bdeRNQMHY4qOJmMK5jrv3vbsZVSkhIyNixY8/7UGcXZy0MCwu7++67Gy7p379//e16e7xGRJIkjUYzyEXD5a72PWf79u379evXcLlOpxsyZMhZO/Hz82siu+ZoF+7barW6/iTjXLhvjxs3ruEmrVu3rr9tMBjOPdtrD1djHHar9VPLSFCQf/e0dp98/lNiQrTeoP9s0c88x3fv1n7PviNniYaGNXN10biGtyGUZcXhkBSFOJzOY8eyjx7P8/ExlpWUe5kMBJOs3IKDew7FR4d5mg8+fU6stos96sReRj2AQHE1o9SjOCWB5wID/DDGbjmoyLIo8v7+PrRC1na6QKLhBFvajWirq1snhCg2e91yl4lxoL8vXdhw/Qa36cnUr++UWNUdg+GG1d4xGJcDx3E9evRITEw896GIiIgBAwY0YhaY0URACHVazVmuNIQQnuMmPXEPhGjkmCduvv3R75esnPLMg4FhQe71G3b26HQa9wtNxzxo1LQXwYVKJarVKqDIwcH+d/1r+Nx5Xw6/5aGXXp03oF/agYMnVq7+k1eLaV1Sli7PmPzMm7JLxICrDQXj847cwISG8xpak2B89pJLhwo7Ghz0uBQ2g+Hh0EkyLX0ODMZVSb2Dw7nLqb0tk3f/EGzLJlIlgM33vLmr+AWBPzcHzXHI4XDu2nvEYqlNTUn08/NWFBqOcjoltVrlftExzQE6VXReKiKEOBxOjuNo56arb4AQolLVDQg5dDjrZEFxSuu44CD/GkutwPO0W1ZRamttAEKD/ho3F7wqgABaZLOsDofw9IAcxhWCIMi1IQz9WadL84AJ8BZhhMb1m5PJOwaDcX3KO/fQenKBybO0E5NDAEJCg0c0egSpwRpsmJ9FiE5QqF//LNF/6jZAiAOI7ocQ6uBDWwtcDjWu1dzlZIwWhsm7poDJuxaUd6z2jsFgXL9cpACfpgXPNDJ1dXxerPbuArddtWWn9nR2fR6DwWA0ASx/xGAwGAwGg3FNweQdg8FgMBgMxjUFk3cMBoPBYDAY1xRM3jEYDAaDwWBcUzB5x2AwGAwGg3FNwTpnGQyGZwB5gFTNbIzCYJwCIuTgoMCMURoRhCC1RIFAZB/rZgEToDr1VDN5x2AwPAK5YqVcvR0isaVPhHE9wgFwDHClmmjm0NaIIECqFC9BdduGCsCz57XpIQBoOBCoQvdEikzeMRgMjwDbcxXLLog0LX0ijOsRCHAF0hQCiQNMhjQaBBA9rzGJI4/VQhViLo/NAQbgRC0eG8HkHYPB8KjkLIveMVoGgqDAQYHJu0aEAMJBnnclZ1l+tnkgoO6pZs83g8FgMBgMxjUFk3cMBoPBYDAY1xRM3jEYDAaDwWBcUzB5x2AwGAwGg3FNweQdg8FgMBgMxjUFk3cMBoPBYDAY1xTMGIXBYDA8k4Y+YfCfbwjPuX3eNZkPSEtxXh+4f/xyEEDoXIhLOhx7resgAMiExre4M58ShdCHrg0HZibvGAwGwwOBp+ezEQKITP1KoXBpm7pWo5u4UzTQ5XV6XjjXlY75zbYAsO6lOQNywVfqgvBQwAT/3YZ0NJhLujAAAUDHwTRvlGsjR2tx/c8gBEAHL06LQGaV4iBXvRZm8o7BYDA8DcL7DuG9erjmn0JCnNiWI1dtxtYDfxeAIQBp1BETAUD23JlAqeX9RyAxyFn0JcDWM7ela4rBd2FHgVy65FKFI6NxIAJSp/jdYBT84SkRDwGUiHNv2e+V9txLnHtLAPZShfQIHnekasPhyvXoAlsRgoN1SZGGDrvLf7PJ1ZcW6ruWIQToeTAyWFhTphyx4IZT6Hr6cP4quM+M7RKpX36RsKcnR0SZvGMwGAyPgoZYkDaW0yXJlWuIbIGcjvfqxvsMdOS+qVRvBXVXcey6stRfXE4FZrAkm3fQ5a7oHdJEc5o4CHlCCI3guNckGBACOZ7TtaFjQgj23GvUtQgNFEE+WJuAiVJoPVy/XCGSrDgArAuzueNthBAIaeztrGys+yGHbMkx/1XlKKiXiW7Z53q167YigOh47xBdq/0Vq+jQeVcu1xU7vK4h54taN1xIXLlaRF8smsmFDTK57ofo5/CchzwHJu8YDAbDEyFSmbPoa+IoAgAiTbQ69hXeu69Sk+nK0nIAagBxAqLUrY1UrrmpDgBkuWK1e3uXyMOn13FnbJEKCj5ErqG3iUJXYLQEBIAye/bOkiUNF7o0GeJoMJVI2CEirchrHIpFwk7kEnAQIB7yMnEgwKl4g0OpPVixBhPllP4jmCgipxeR2qlYndjqDulRRU8UQmQIkEbwUrBkV8wXivYxgOvVESBob+JSjJyOByeteGuVUuwg6NRDnby4FAMnInDcindUKpUSQR6m8Ji8YzAYDI+lTpwR2UywHQDFfaWGqnBV6ANS6RKlZpsrmIfEgFGA1znzFwIiC0H/hhA6Cz8jxNlgVwQQhTN0EAJug6IvkWtoIPC6D+F4UgCJRulcFWCwtc8ABKHZWR5l7CByWptcvb98ZaktiwDirQpK9h1UUHsgVJ+MiXywfE0b30FZ5sw88x4IgQBVcd7pYfoUDvEydhZYDhyp2qAQu/vl99fEpOqHGUR/QsiJmq3Hq7ZiUK8LGWe+LgT09uVvCuZ3Vil5VtLJi+voxb2f7Sy0Uxl3UxDf05ffUaVUOkFfP76Difsw21nlYQqPyTsGg8HwQAhAaqRLAkIgQCLv1RMALJctd6s9iDScLlmuWl8vD5A6Eggm2o1Ba+qiXam6sy41GGniVJFPEWeRs/ALgATRZxDSxivW/S3y5zFohSUUtbzJfQcCqBDJ4SqRNImBIfqkwtrDJ6q3YaCk+A5O8RuyPn+hE9sEpA7WJXqrQkttx09a9rtFW7H1mEu/oSTf/nFe3Q9XZpTZsvy1sa19+kPI7S1bTgBR8/p47x4nzXuya3ZEGTul+A6ptOeX2rIusc7v+oIAAYF2JnTShj/Nk6wK2V6lPBStitSgkzYlVod6+vJf50sZZQoGYGuF/GSsqrsP91uxu5nJU2DyjsFgMDwPoiDBTx3+GE2eIhFwerl6C3YU1z9Mc68N86o003rq6kJvnBWWo3VanFcPAKEjbx62HgIAOGy56thppyr5GM0NJkqwLtEkBrrvQgCLbcd2lf1G6MtKqhwF24u/t8jlgBAt75Xo3UvN6R1KrTvNeqJ6y/6KlQRgkxiMaRkY7ZzVC37Rpo4nqrfuLf8DAlBsO85DUc0bOCTSwj4s7S1bnm/ZDwCxyjWBmgSjGFhqy2rpp8ETgRBIBJyoxYMD+fsixe2VcpYVv3vCYVXob6YYLeIg9BNRP3/6MePpTyoQTRd6VqcFk3cMBoPhgfDYWWzPnU2cpRDySBXGB96minrWmTMDOwsuY3cQCkgdQewFxFkMIL3eE6mEOEs96Xp0fQEBqnGWZNNiyrq7tXIFIW6fDmiVaxzYwkGeAOxUaEgPQXq9piY3RKlxUqHvXuKGEGIQ/TioogG5Uw/tKVsGIcK05A7KRLI4yxGial7GDgxkrsHm1yfwnLvwVMYcAvBbsWxTQGdv7oFIFQBkdam8olQmgHbdCgi0NiAJI/cuChzkhMtgxaOMZ673V5fBYDA8EXqtkImjkDiKCOSw7TjGdk3Mi0ifisvzL2uHEEKOEIkapNVdiFjhXUsCIap2Fh2t2njGMohgXUdmw27ZsyX4+ZLvbklHFNpSUwcGZ7TONOyuva6BwIGJkwCTCOvFHCFA4ICeh3YZSJjQTlgIlpXIa8vlEDVKNaIbggQbBkuLZDsGFpl8luvMtxO3AbKao58ljwrdsY83g8FgeDD0Eu/6BxDtk6UXaLXrgfpLievyRC/hf+eHR2QimyHvRffgSv/Rf9d9/KZlgQBByDX4d0VXZIdiAQBqeCP1TKGvMQ7Xp7by6sXTYK1HxZVaGAhAjQSOWnA7I4rVQScGTkyzsW1NXKQWHa7FFhkYeTgpTnVzMF8tgQNm/EuRXOogQSrIQXC8Fqs5mGRAGNCtNBz4b6xqdCh1jvSoZ5l9thkMBsMzgTSLSh1PENSEioG3u/yNj1OjY8VMgIK08YB2VwDOqzsytMW2E2dvTxSgWGnLBW8CUqVSu5f37s0ZOsqVqwDgee++SB2h1LLWihbD5XJCE+WnIEp9AeU/BEFU4yipcZbEGLsU1h6yK2Y9753sM6BWqjxctaGxTvjaALomkv1RIkfpxP/EqPeblRon8VPDZAPtpcgokxEEZplk1eK+fjwhoMBOEvTIwMPDFhoKzaqlTii3hAjeAixxkBQTF6yGy4oxdcLzpPAdk3cMBoPhgUCkDtMmvkWjboCDUCBylbNgoWI9BJBAnKVy5TrBfwRvbE9NbOUqoNScnjyBxFMDzaBSs4336aOJne7Ie1uuXM8ZOqrCHxV8BxIoACwBbKMrM1oA6m8Xbewcokuquw+AhB1bir4utWVxkG/Y0IogxyPRnauFANLbDWZd8Eh0OdhBJ7buKfutY8CtA8P/U+MsMYoBEnbsr1glU888vn4PZ251ncJBcKwWzz7m6O8nRGhhsAo5CV5RImeUUQc7DlLT8B8LpUqJJBm4JCOwy+Tzk1JmpcK5fIy/zncWOvgUI9fKAGokMj/bubcGe5S2c/26Ix4VTWQwGNcp9qxXpYpVp5KP1ztIE4NUIS6VBmnZPLZiez5xnKxbAgjkdEjfHqlDibNcseykWVdOq9QeAAQjXRJ12ag96M7AIk0sUoUo1qPEkQ95o3sr7CzFlt1IDCLYjq3HTs+3vV7hAdkCVfnaOK5ZCqgQ5AM0MQKnaWg7hwkus52wK2Y/dTSAoNyW406z6gVfkxhUYjsuKTY1r/dVR1U6TlrpeDHAI1WAJrbGWWKWyugoC4L1oq+/JlbDG61SVZnthFmqgBDW70Gm7olnb9V0fyY9eV7t5/X83BNQhTxObGBCtZqIaKuEQ3ENokCnS9YI7UEBPAQiB+wKveuutKt/SEB0W6vLNbz+oRaHAKBGYG5bLZN3DAbDI2Dy7gyITE7l6dytlK5JFQ3yLXQchewyunMNsaDhBuJuiXXNqwCng3luCxXI09XqtqKS0bWV4rLRZWmc5pZ37hFkZ11/aYkl4iFA7hRtfWcrIRgDBUHePYsMExnRgC7VIe67EHDumRZuvxUCsHtNCFDd1IoGezjvVtenvHNTf1rwwo/+04c8Qd6xTzWDwWB4HjQ9d9HvZ4jqxFzd5aVBoq1e2NXfhZewFaN5oZPHLiANzrIsgRC5WjNdtwF0jSwD573rzuSe+7I23MN5t7qegZf7qKcJu7O43gPyDAaDwWAwGNcYTN4xGAwGg8FgXFOw5CyDwfAQ3A6jHlqgw7g+5sizavTGxN0aUv/ZZjQD9U81k3cMBsMzQCqItJDavDEYLQAHRQGpWTViI0IAEJCKg0DjajJlNFtrBTNGYTAYHgN2EtrI6eH1yoxrEwiIQrtN3XNHGY0FHa8CoSi5nllGs6FCTN4xGAwGg8FggGuK/wO4KQoM7h2q3wAAAABJRU5ErkJggg==\" /><br /><h4>Caption</h4>Figure 1: Sketch of Docling's pipelines and usage model. Both PDF pipeline and simple pipeline build up a DoclingDocument representation, which can be further enriched. Downstream applications can utilize Docling's API to inspect, export, or chunk the document for various purposes.<br /><h4>Annotations (HuggingFaceTB/SmolVLM-256M-Instruct)</h4>This is a page that has different types of documents on it.<br />\n",
+       "<hr /><h3>Picture <code>#/pictures/1</code></h3><img src=\"data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAAZ8AAAJDCAIAAABblI4KAAEAAElEQVR4nOydB1wUxxfHd7Zc4Rq9967YUcQCioJYiN1Yo4lJTKzRJGqaKZrEqIlRE02xJDHN2GLvvYEgdpr03uGAq9vm/7nb/C8EERFBEPcbPobb252dXW5/9+a9N/MAhBDh4eHhaXfgrd2BtkhNTc3JkycrKipYlgUAiMXiDkbMzMyQdgdJkhBCoVCItGFKSkr2799/48YNhmFcXV2HDRvWtWtXDMPax9XxtBCAt93uJzMzMzIysrCw0MXFhWVZiqIKCwstLCxeeeWVOXPm2NnZIe2IWbNmFRcX79ixQywWI20PnU63bt261atXoyjq6+uL43hFRcW9e/emT5/+zTffPLTPc+fOzc7O3rFjh1QqfVJd5mkr8LZb/ej1+n79+v3www8Mw5AkmZmZuW/fvuXLl1+5cmXv3r0ymQxpL5SUlOTl5YlEIqRN8vXXX7///vvTpk2bN29e586dcRwvKSk5ffr04cOHy8rKXFxcGj68tLQ0Pz+ft92eTXh1qx8IoUKhcHNz4176+/sPGzbMycnpo48++v777xcvXsxtr66uPnXq1KVLlyCEwcHBkZGR5ubmpkYoirpy5cqZM2fKysocHByCgoIGDx6MYVh8fHxmZubo0aNx/J/7f+PGjdTU1LFjx3K2yZkzZ7p06aLRaHbv3q3RaPr27Tty5EiBQHDy5MnTp09DCJ977rl+/foBAEznunv37smTJ9PS0mxsbIYOHdq7d2/u3crKytOnT3fu3JlhmF27dlVUVPTo0WPUqFHm5uYQwgsXLmRnZ1dWVv7www8ikcjc3HzkyJEoil69evXcuXPZ2dlmZma+vr7h4eGenp7336W4uLji4uKePXseO3YsPj7exsbmueee6969e+19kpKSjh07lpaWZmdnFx4e3rdvX267RqPZs2dP//79KysrDx48WFNTM3fuXA8Pj9rH5uXlrVixYvDgwVu2bBEIBNxGJyen6dOnjxs3jrt7+fn5V65cuXPnTllZmaOj4+DBg3v37o2iKITw0qVLmZmZFRUVmzdvNjMzk8vlo0aN4sazN2/ePHbsWE5OjrOz89ChQ3v06GE6KUmSx48fP3fuHIqiw4YN8/PzO3/+/MCBAx0dHbkdsrOzDx8+nJiYaGFhMWjQoNDQUK5NCOHJkydFIpGnp+fevXtTU1Ofe+45lUrl4ODQp08fU/tqtfr48eP29vamW8HTUkCe+8jIyHBxcRk/fnyd7enp6fb29iEhIWq1GkJYVlY2YsQIHMcHDBgwaNAggiDCw8OLioq4nXU63axZs6RSaYcOHcaNGxcYGOjo6FheXg4hnDdvnkwm02g0ppbffPNNgUDANRsfH29paRkeHt6xY8ewsLBOnToBANasWfPVV1+5ublFRka6uLgoFIpDhw6ZDv/tt9+cnJxcXFzGjBnTqVMnKyur9evXc2/duHHD2to6IiKic+fO/fv37927N4IgU6dOpSiKZdm33npLJpNJJJLAwMCePXtOnTqVYZh9+/ZZWlr6+vpOmDAhKirKyspq5cqV9d6o2bNnW1tbDxw40N/ff/z48Q4ODra2tvv37zft8Ouvv7q6ujo7O48ePbpTp07m5uamjuXm5iIIEhUV5efn17179wEDBkRHR9dpf9OmTQiC/P777w38sZYtW2Zubj548OCxY8d6e3tbWFhs2LABQsiy7NKlSxUKhZmZGXd1EydO5Nxw69ats7e39/b25g6xtbU1nYJhGO5vERgYOGbMGG9v71GjRiEIYrrb0dHRPj4+MplsxIgRXbt2lUgk77zzDkVREEKKovr06dOpU6egoCAfH58+ffps2rRpxIgRHh4eWq3W1OETJ04gCPL99983cFE8zQKvbo+gbhDCIUOGODg4pKamQggXL15MEMRvv/1GG9m3b59IJJozZw635+rVqzEMW7NmjV6vZ1mWJMnk5GSdTsdpmZ2dXW11e+eddywsLDh1u3HjhpWVlaOj45UrV2ia1mg0zz//PIZhYWFhqampDMOUlJT4+flFRkbSNM3tb2FhMWPGjKqqKgghSZJLliwRCoXJyckQwlu3btna2trY2Jw5c4aiKJIkP/nkEwRBYmNjIYQ0TUdFRfXo0aOqqookSZqmGYYZOHBgnz59ampqOI1QKpVFRUUsy95/N95++20EQcaMGVNZWQkhzM/P79Onj5+fX35+PoQwKSnJzMxsxowZ1dXVXMcWL16sUCji4+MhhNxwWKFQHDt2jCRJiqIYhqnT/oQJExQKxc2bNxv4Y929e7e0tJTrnl6vnzt3rkwmKy4u5q5u7Nix3bp1Ky8v507Bmas4ji9evJj7W6jV6qlTp7q5uaWnp0MIjx49CgD4+OOPSZJkWfbu3bsdOnRAEOTYsWNc+4GBgc7OzklJSQzD6PX69957D0GQffv2ceoWHh6OIMgnn3yi1WopiqJp+uDBgziOcztwvPjiiw4ODtwfi6dFQVvMKGyfSCQSvV5P07RKpTp+/Hi/fv0mTZqEGRk1alRERMTJkydLS0u1Wu2uXbt69eq1YMECgUAAACAIws/Pr5EOIJZlx44d26dPHwzDxGLxqFGjGIaZMWOGt7c3iqI2NjZRUVFXr14lSRJBkBMnTqjV6uXLl8vlcgRBCIJ46aWXrKys9u3bx7XGMMzYsWPDwsJwHCcIYsSIEebm5jExMQiCYBiGoijXPYIgMAzjREGn06lUKkPUCQCFQmFnZ1d7FFy7n0KhcMGCBdx43NHR8Y033khLS7t+/TqCIDt37pRIJEuWLOHclARBLFq0SKvVXrx4kTucJMnx48dHRkYSBIHjOIrW/TRqNBozIw3cq4CAAGtra41Gk5+fX15eHhYWxjBMdHT0/VfHjWS3b9/u5ua2cOFC7m9hZma2ePHivLy8a9euIQiyZ88eZ2fnF198kSAIAEBAQMDkyZNN50pMTIyPj1+4cKG/vz+KogKB4O233zY3Nz948CB3r1iWdXR0fOutt0QiEY7jGIaFhIQEBAT8/PPPXAuFhYW7du168cUXuT8WT4vC+90eDb1eTxCESCQqKCgoKiqKiIionZcQFBR04cKF/Px8hUKRm5s7YcIEk7eo8UAICYLw8fExbeHifbW3WFhYqFQqLt4dGxvLBQcBMETAAQA6na64uDg1NZXbuU5rYrFYKpVy4lX7pNwvGIbNnj17/vz5HTt2HDRoUP/+/cPDwzt16lRvV2madnR0dHd3N20JDg5mGIY79bVr19RqNTfQ4zrG2bBpaWnczizL1nHS1QHHcb1ez4n4g0hMTPz8889PnTqF47hIJNLpdHq9vry8vN6r0+l0ycnJ5eXlr732mul2cWZjdnY2giCpqakuLi5OTk6mY3v06IHjONfCjRs3MAzr0qWL6V2FQtGzZ89r167RNI2iKMMwnTp1qh3JVSgUEydO/Oqrr27fvt2lS5dff/0VRdExY8Y0cEU8zQWvbo9ASUlJamqqo6OjnZ0dN5CpI17cY8wauf/d2gAjDbxb+2W9WTumfUiSNDc379OnT23bJzIyslu3bvU2yBntDZx9ypQpnp6eJ0+ePHPmzDvvvGNlZfX555/PmDGj3p05+8j0krOPGIbhgioKhaJv375CodB0CWFhYYGBgbUPb9guO3DgQE5OTkBAQL07KJXK2bNnFxcXb9iwwdXVVSgU3rlzZ968eVwH7ofL77GysgoJCWFZ1rQ9PDx84MCByMOgaRrDMFMsiEMgEHBj6tp3oDYvvPDCihUrjh8/7u3tvWfPnuDg4K5duz70XDyPD69uj8ChQ4dSU1OXLl0qFoutra3Nzc2Tk5Nr75CQkKBQKKytrRUKhZWV1d27d1mWvX/AheO4RqOp/XQVFBTcv9tD4Z4oHx+fs2fPzp4928LCosmXVkfsgo289957+fn548eP//jjjydOnHh/1giGYcVGXF1duS1JSUkoinKJGu7u7rdu3ZoxY4Yp9PyojB49+osvvtizZ8+wYcPufxdCeOfOnbi4uB9//PH555/nNhYXF2s0mjo303R1ZmZm9vb2VVVVr7/+er1jQ29v75MnT+bn55v6fOPGDZqmuRZ8fX1JkszJyTHtT1HUnTt3evXqheN47T9obZydnSdPnvzLL794eXndvHnz559/boJFz9MEeL/bA+EiaAzDUBRVUlLyww8/vPXWW15eXnPmzEEQxN7evk+fPmfOnImPj+f2T0hIOHz4cFBQkLOzs0KhiIyMPH/+PBcg49BqtdwD4OvrW11dzY0ouWSOQ4cOEQTRtH6OGDFCq9WuWrWqtsFSVVWlVCobc7i5ublKpTLtrNfrOSc9J16urq5dunThwgL3H4thWE1Nza5du7iXNE1v27bNxsaGMxunTJlSWFi4adOm2h2rqKioqalp5KX16NFj8uTJP/300/fff6/X67mNEMKUlJRPP/20srKSu2llZWXcWxqNZuPGjQzDmNTN3Ny8pqam9q2YNGlSSkrK5s2ba19RRUUFN1QfO3ZsTk7Ozz//zIUgEhIS/vzzT9NugYGBLi4uW7duNY3rd+/enZubGxUVxY1zH3QhkydPzsrKevfdd+3t7UeMGNHIy+d5THjbrR64j+mJEyeGDRtGUZRarU5ISOA8xJ999pnJTnn//fevXLkyfPjwV199FcfxLVu2SCSSjz76iHu0li5dGhcXN3r06GnTpgUEBOTl5Z09e/bYsWO2trZhYWG+vr6TJk16+eWXdTrd2bNnHRwc8vLyuGZZltXr9bUVgdOa2qYBTdMURXG/h4WFLVu27PPPP79y5cqwYcNwHE9OTj579uyWLVsGDRrERfpomq59dbW3jB8/fseOHSNHjvT29vby8po/f/7zzz8vEokGDBggk8lu3bq1ffv2ZcuW1TsrgGEYS0tLbvDYt2/fEydOHD16dPXq1X5+fgiChISELFu2bM2aNXFxceHh4QRBpKSknD59+scff4yIiOBu8oOGkBwYhq1du5Zl2blz565fv37o0KEikejevXuHDh0KCwubP39+p06dQkND33///YKCAltb24MHD5aXl4tEIpOrbuzYsb/99tvo0aN9fX2dnZ1Xrlw5bty4WbNmvfPOO+fOnevfvz+CIHfu3Ll+/fr27dt79uwZGRm5YMGCzz777NChQy4uLpyzLDMzk2tNKpWuWbPm1VdfDQ8PHzt2bEZGxtatW8eMGcNljXBegnq/pfoYOXXq1EcffcTHE54YvLrVg0KheP311wsLCzkrQCwWv/zyy506derVq1ftMYWvr++RI0d+++23kydPQghnzJgxbdo0LoEAQRA7O7vdRvbt23fjxg07O7upU6dysUVPT8+//vpr06ZNx48fd3V1/eyzzxAEuXjxIueysbOzmzt3bm3nlLe39xtvvFHb1d2nT59FixZxDxIAYNmyZb179963b9/ff/8NAPD09Fy8eDHnsLexsZk7d26vXr1Mx1pbW8+ZMyc4OJh7OWLEiH379l26dKmsrEwsFisUijfeeOPQoUNHjhzRarWenp7btm0bO3ZsvTeKpmkHB4dvv/3277///vXXX+3t7f/444/x48ebdvjwww/79+/P3QQURd3d3ZcuXcqlzkql0jfeeKO2c7BebG1tt23bNmnSpEOHDl29epWbZ7phw4bhw4crFAoEQb777ruNGzdevHhRIBBERUVFRETs3r3b5PiPjIzcv3//hQsXSktLpVIpF7FZt27dsGHD9uzZs3v3boIgvL2933nnHV9fX05P16xZEx4efvbsWRRFFy1alJeXd+rUKdOofOLEiU5OTr/88stff/1lZWW1bt26iRMnWlpaGsZBKDp58mQuRF7nKiQSSefOnWNjY3nD7UnCzzNtBjg76H53MgfDMCzL1vG+c1AUheN4Aw7+R4WiKADAg3rySHDJdA13b8GCBcePH79w4YKdnR1FUfVeYzN2rIEuca6xxsyrb7hX98dbJkyYcOfOnfPnz9eZX0xRFIqijTyjSqUKDQ11cHA4cODAo3aSp8nwtlsz0PBDy2XD1ftWk31tD6IZG2yMEnFOSW4Y2PCpm6VjDXSpabp5f68ghJ9++qlGowkODtZoNHv37t23b9+HH354/9IJjbyi0tLS6OjoAwcO3L59m0vwbkI/eZoGr248TcfBwcHPz6/ZNboVQVFUJpMdO3bsyJEjLMuam5t//fXXs2fPbnKDaWlp77//Po7jK1eu5GYy8Dwx+JEpT9MpLy/X6XR2dnbNMhZuO2g0mtLSUi4y/pjri2i12sLCQqlUamtr23wd5GkUvLrx8PC0T/h8Nx4envYJr248PDztE17deHh42ie8uvHw8LRPeHXj4eFpn/DqxsPD0z7h1Y2Hh6d9wqsbDw9P+4RXNx4envYJr248PDztE17deHh42ie8uvHw8LRP2tXSDjxPNVytaEORXWOp0NbuDs9TD2+7tUVUKhVXTR15lvj444/79es3YsSIiIiIuXPn3rt370F73r17988//2y4JsODyM/P/+mnn6qrqx+vszxPAby6PTkKCgreeeedUaNGjRkzZtasWRcuXHjQnidOnFi6dKmpLswzQkJCglwu/+CDD5YsWXL79u25c+eaNKjOrYiLi9u4cWPtUjj17maitg7m5OR89dVXdQqGcQWbm+9SeNoE/Mj0CVFZWTlt2jSBQDB16lSCIOLi4hISEkJDQ+vd2dfXd/jw4c/aKtUAAC8vr7CwMARB5HL5hAkTUlJSiouLd+/eXVlZaWVl9eqrr/bp0ycvL2/fvn2ZmZnz58+3tbWdO3eug4PDyZMnt2/fXl1d3bVr19mzZzs4OOh0unXr1gUEBBw7diwjIyMqKmrmzJkURf3++++FhYUffPCBlZXV3Llz5XL5unXruDKsPXv2nD9/vlQqbe07wdM88Or2hLhlJCkpiVujddKkSaYKfgzDcAWfRCJReHh43759pVJp7YX8z549e/r0abFYPG7cOH9/fwRB7t27l5eXZ25ufuDAAYlEMn36dNP+WVlZu3fvLisr8/b2Hjt2LFeuKTo6+tixYxiGjRw58qFlqFoR0z0pLi7m6lEUFRUNHTrU1tY2Jibm9ddf3717t7W1tbe3d3p6+oABA8zNzSUSycGDB996661Fixa5u7v/8ssvc+bM2b17N8Mwq1atCggIeP3114ODg9955x0rK6vRo0f7+/vL5fI+ffrY2dkpFIply5aVlZXNnj1br9eXlJRotVpe3doN/Mj0CSGXyzEM27lzp6mSOVc+qqam5uWXX16+fDkAoLq6+siRIwiCnD9/fsWKFQzD0DS9fPnyRYsWMQxTVFQ0bty4y5cvc+UBZ8yY8dlnn+l0usOHD0+ePJkr3XLq1KnIyMjbt29LJJJz586lpqYiCPLNN9+8/PLLWq22qqpq8uTJhw8fRtokGIbduHHjyy+/XLp06YIFC0aOHNmlS5dXXnklIiLC2to6PDycZdlLly5ZWFj06tXL0dFx6tSpI0aMkEqlX3311YwZM1577bXIyMhly5YlJSXdvXuXs3znz58/bdq0F154YerUqceOHROJRP369bO2th4/fvzYsWNtbGySk5P9/PxCQkKee+65l19+2cbGprVvA0+zwdtuT4hOnTq9/fbby5cv37x5s62t7dChQ1977TWpVHrmzJlTp05dvHjRw8PD5CFiWZarvHn37t3t27fv3r2bM7iWLFny7bff9uvXD0Ko0Wg2bNjg5OSUlpY2fPjwO3fu9OjRY/ny5aNGjVq9ejV3UoZhMjIyNm3a9O233w4ePJgrlrpx48YhQ4a0wVIvAACtVltcXIzjOFdyFMfxVatWHTp0yN7eXiAQlJWVcXXsSZJkGEan04lEIp1Ol5ycrNVqY2JiuO8DtVpdWFjo5+dnZWVlKq1tbW2dkZHBHcuyrFar5ba//fbbixcvvnjxopub28yZM7lxMU/7gFe3J4RAIFiyZMnUqVOvXLly8eLFr7/++tatW1u2bImJiQkKCuKkjbNfuF+Akbt37xYXF2/bto3Lk0hISNBoNJwCdu3alavfbGlpaWNjU1RUVFNTk5KSsnLlStNJMQxLSkrKzc3lKtcBALKzs/Py8kpLSx0dHZE2Bk3Tffr0WbNmjWnLzZs3N2/e/MsvvwQGBgIAhgwZwl07F03mjF8AgEgkeuWVV0aOHEmSJPdSoVBw+lU77swVKq19LIIgUVFRAwcOjI2NPXDgwIsvvrhr166goKDWuHqe5odXtyeKk5PTBCN9+vRZunRpVlYWjuMNRA8YhpHL5SEhIQAY6vuEhIQ4OTmhKMqVf2ZZFkVR7nHlHl1OE+u0IBKJQkJCcByHEIaGhtrZ2XHOuLYGy7J1Apfl5eUCgcDR0VEkEsXFxV29enXs2LHcMF+pVJaWllpbWwuFwoiIiAMHDkyaNMnOzo5l2cLCQu6WctlzXFMQQs6pJ5fLq6urS0tLbWxsUBQtKSmxs7MbNGhQcHDw7t27CwsLW+nqeZofXt2eEEqlUq1Wc9aWqQq9mZlZcHDw9u3b8/PzTW9xQCMdO3bEMMzf379z587cdpZlOaWrbZVwL2UymZeX19GjR/v27Wva7u/vb25ubmdnZxpz3V9uvY0gk8nqePT79Onj4eExZcoUHx8fpVLZpUsXrv5eaGiotbX15MmTfXx8li9f/tFHH82fP3/YsGEeHh4ajaa6uvrAgQMoilpaWpoG4GKxWCaTIQji7e3dq1ev+fPnOzg4LF269Pvvv8/Ly3NwcMjPzw8JCQkODm6lq+dpfnh1e0IkJSW9/fbbHTp0cHNzKy4uPnTo0KRJk5ycnBQKRb9+/SZMmDBs2DCSJHEc/+ijjzj1oSiqc+fOM2bMmDx58siRI62srBITEzt27PjWW2/d3z6nWcuWLVuwYEFxcbGfn19KSsrLL78cFBQ0Z86c119/fdSoUfb29snJyQ4ODp988gnS9li2bFkdM9bMzOy33367cuUKRVGBgYEkSZqZmSEIYmVltWPHjpSUFAAAFzb9448/YmNjS0pKpFKpr6+vWCxmGGbr1q1eXl5cU+PHjx82bBjnItiyZUtiYqJOp/P29l62bFlycnJVVZWVlVVQUBCngDztA76e6ROCoqjLRioqKszMzEJDQwcPHsx5f0iS3Lt377Vr18Ri8eDBgwcOHHjv3r3U1NShQ4dyT/sZIxRFOTk5RUVFeXp6JiUlZWZmDhs2DACg0+lOnDjRrVs3zoOekpKyc+dOpVLp4eExceJELgjIZYRoNBoHB4ehQ4d27Nixte8HD0+Lw6sbT3MAIdImR7s8zzL8yJTnIbA1NWx1NayqYrmfsnJWpYJ6PdSTiF4LdXrj73oERYFACERCUe8ggYsLgmMIIUAEBBCKEJEIEQmBSMwrIM+ThFc3nv8ASZKtqaGSk6mERCo5mS0tY6ur2KpqtqoKVlex1TUITRtE6h+dAsg//zf+j2UNSSh6HeHtBbnoJwCIUIiIRMDwrxgRixCpDMikQGGOWFgAgQD5f2YGD0+zw6sbD0Jn59BZmXRqGpWURN5NoLOyoFaLUBQkScOQE0UNdhkARutMgDSwNhGECI4DMwmCYf+aaRSFkKTBAcL5QFAUGhtEcNwgcNbWwMYWKOSIXAFEoid1xTzPBLy6PaNAnY66d0937jx14yaVmmpQNLUGwTCAGaXHaJ01RW4AAMR/P1T/Gnq1YBjDT2EhzM+HACBiMZArEIUCODoCZ2cgkfBjWJ7Hh1e3ZwumtJS8fkN/5Yru3DkmK9vgMqMog6gZbC5xs5wC4PjDA1WceBntQcMvej0sLkKKCmF6GkIIgIM9cHEFtrbA0pIfuvI0GV7dngkgRVF372r+3q+PvkIlJEK9HhDEP0POZh0PGqZK4Pg/g9BHOcwwmOUg9TArC2ZkIDIZsLQEjk7AzQ2Ym/PWHM+jwqtbO4e6m6CLjtbu208l3GXVGoOSEESLergMY9vHOt44kkVRRK2GNTUwLw+5Hm/QOG9v4OhgcOrx8DQOXt3aKQyjuxKj/vMP/aXLTEE+wHDD8POJFCsAzTWW5IIPxun1MCsTZmdh9g5n3UhXj0AvhSfSfLAsm5KSIhAITBMbuIWUlUqlu7s7NzuihaAoavv27T179uzatWvLneWZhVe39gZbXaO7cF7z2x+6y5ehVgswzJBx9sQAoNnUrVabhkQTiGZVpn9Z87cyUT/YNXyU99gedoaFQx6/ea1WGxoaCiG8fv06N99Dr9ePHj367t27J0+e7NevH9JiUBT1yy+/CIVCXt1aAl7d2g9QpVLv+Vvz999kXBwkScMI1Djn/ImCYQC0SBwAoNhVcXGWtlSIYH/f2306+2SIU+jkjtO62Hb7f9JdE2FZViAQoCi6d+/ehQsXIghy5cqVgoICGxsbrlADhFCr1SqVShzHbWxsTCspkSQpFAqrq6u1Wq21tTU3bY5lWZqmCYLgdiNJkltkmJNRpVKJoqiVlRWO//Po4ThuWo5Jp9OVlZUJBAK5XC7i82OeHXWrqqoqKSkRCoWOjo6mT0aLotFobt++3alTp7a/FDVbU6PZf0D142Y6JQUyDBAInswgtC4QGgKvaPO7/wGCaHB6D3NdYMxYEWJCLaU5nHHwQu65UNewSR2mdrPt3uTGubXzJk6ceOLEiVmzZpmZmf31118RERGJiYncokkXL15ctmwZV6vMz89v9erVzs7OGo1m/PjxXbp0uXv3bl5enqur63fffefs7Hz+/Pkffvjh+++/Nzc3Z1l21qxZQ4cOnTRp0vXr199//321Wq3T6ezt7b/66isfH5/a3Thx4sTy5ctRFCVJsmvXrmvWrJHL5c1x855dnoJwO8uy33777ciRIydOnDh+/PiRI0fevn37CZy3oKBg9uzZpoXCm0Z5efm6detKSkqQFgJC7cmT5S+9rHz7bTolxWA6CYWtGF5ERaKWODsG0XhxeSZdjP7fTEOBQeP0jP5I+oEFJ19//8LSexUPrBD4UGiaHjBggE6nu3HjRklJya1btyZMmMAt5o4giJub25o1aw4ePLhv3z6SJDds2MANwWNjY9PS0lavXr1r167S0tLt27cjCKJWq7OyskwL1eXk5HD1t2xsbFasWHHgwIF9+/bZ2tquWLHCNMWbW9JqxYoVI0aMOHjw4N69e19//XW+ouszYbsdPnx4+fLl33333aBBg6qqqs6ePdtIb0sTFjLj1oM0HU5RlOll09pXqVTffffdyJEjuWIxzQsZH1/94xbd4cNQpzMYa62eMwGhYUppc3cDIAgjIPYy8TpIipD/LJgOABBgQhVVcyBt75X8S8/7TZrgP8na7JFrI0AILSwsIiIi9u/f36FDBxcXF39/f1MJGzc3N6VSuWvXLpZlZTLZpUuXOPESiUSzZs0KCAhAEGTMmDFXr17lulR7HSfMMFQ33BAXF5fq6ur9+/drNBqhUHj79m2lUmkKWQAApFIpVxGiQ4cO3bs33RTleZrU7dq1az4+PuPGjUMQxMLC4qWXXuK2nz17Nj4+niCIc+fOiUSiN954w7T04O7du//66y+9Xt+jR48FCxZwS9EWFBRs3Ljxzp07KIpGRES8/vrrtT+FeXl5X331VXp6OoZhPXv2fOutt1AUJQji2rVrX331VWFh4YABA958803ukHv37m3YsCE3N1ehUMyePbtPnz6cMu7YsWPPnj0URQUHBy9YsADDsI0bNxYWFi5dulQuly9atMjV1XXVqlV3794FAAQEBCxatMja2roJ94QpKqr57nv1zl1saalhHPrk/WsPAAhFzb40JoZgt7HiGzCXQOpfxBgFmBDDqvTK725+eyn/wvROLw1xN6wN1fhTcF9Uzz333LRp0y5cuLBo0SKRSGSyrbZs2bJp06bQ0FAHBweKokjjxDIIocQIt49AIODqq9ZZdMfUjd27d3/22Wf9+vVzcnLiajuQJMkdzh2yxsjrr79uZmb2/PPPL1iwoA3Wvni6eApGpl26dLl169aaNWsuXbpUVFRk2p6cnLx48eLU1NT58+c7OTnNmDGDKwvyww8/fPLJJyNGjJg3b97169cXLlwIIVSpVJMmTbp79+6sWbOmT58uFApN4w5OmN599928vLw333xz1qxZ9vb2JEmiKKpSqX766acBAwaMGzfuu++++/PPPxEESU9PnzhxokgkWrhwoZ+f3yuvvJKSkoIgyNdff71mzZoxY8bMmTPn/PnzS5cuFQgE3bp1k8lkISEhUVFRtra2n3/+eWxs7Pz58+fOnevu7t6EesyQpDT795eOG1+zcROsrGzdcWg9DiyuP826rBYE4IIor4xSYg1+XFGACjDB3bI7711YuuTcoqTyxEc6C0mSnTp18vb2pihq0KBBnHXGjRm//fbbhQsXrlu3bunSpf3796/9yam9sjknZJzMmZaDLyoq4sz/rVu3jhkz5ttvv3333XfDwsJMhqGJTp06/fLLL1evXn3//fdXrVrFWYI87dx2GzZs2KpVq9atW/fVV185ODgMHjz4448/lkqlAAB7e/uVK1fKZLLQ0NDr16/v3Llz6dKl33333fz586dOnQohNDc3nzRpUn5+fnR0dHl5+c6dO+3t7e8/BcuymZmZQ4YM6devn+kLkyupOXfuXG4t/7i4uNOnT0+bNm3v3r0KhWLFihUoigYHB8fExPz5558ffPDBli1bPvjgg+effx5CKBaLX3rppcrKyv79+5ubmw8fPtzb2xtBkLS0NF9f39DQ0KZ5VaBOWf31hupvNiMM3XbstdoAoaB51Q2FSLWIPag3xBMasz+BEhCBxzKP3Cy5Mavr7LF+E7BGHKjX6zk5++qrr3Q6nY2NTXp6ul6v5zTIwsLi5s2bI0eOTE1NXb9+velvZ9qB89xxqtepU6f8/PyDBw+OGjVqz549d+7c4XaQyWRJSUlKpTI7O3v9+vVqtZrbztlxLMtyBWusrKxsbGxEItGzVqv7GVU3MzOzuXPnvvLKK/n5+YcPH16xYgWGYatWrWJZtnPnzlxAE8dxHx+f5ORknU6XmZm5Y8eOU6dOcca/XC7XaDTx8fFeXl71Sht3+NKlS1esWLF3797OnTu/9NJLgwYN4r6HuerICIIoFIrKykoEQe7cuZOXlzdjxgyuxEF+fn5gYGBpaWlhYeHPP/+8f/9+lmX1er1MJqupqeGGMCYbbcGCBUuXLg0MDOzQocP06dOHDh3a6PgvhCU3kNxjAlkmKiSgro2uOQqI5lY3gB8n7pWQSlM84eF9QIAQE5ZpSj6PWR5beHVB4CIX+T91/+oFw7ABAwZw7gs3Nzduo1gs7tOnj4WFBQDg448//uijj6KiohwdHadNm5abm8tV1erXr5+5uTm3v5ubG1eV0dHR8aOPPvrhhx82b97cq1ev119/nfvUvfvuu0uWLImKirKwsBg1alReXh6XNRIYGOjg4AAAOHv27DfffIPjOABg6dKlvXv3fuyb96zzFKgbh1Ao9PT0nD9/flpa2qVLl7iPl1KpNPk11Gq1XC5HUVQoFL7wwgt9+/alaRpFUZFI5OzsLJVKNRpNA3GA5557Ljg4+NatW2fOnHnxxRePHDnCLbF//9BDJBJ17tz5s88+476rCYKwsrLS6/VCoXDmzJk9evSofd6srKzadfxCQ0OPHj1648aN6OjoV155ZceOHQMHDnz4xVNqNusYkn8ZgZSou41ZVDfVjhggaHvf7RAaFghpvpEygIhWhJxik2iWEYJH+6xiKA4ReDzzcGplyuzu8yM9DEUV6kUikfz5559cPRoTDg4O3333HWemDRgw4NChQ0VFRY6OjmZmZlqtlqtktnXrVpMdN3bs2FGjRnG/v/rqq6NGjdLpdK6urlwRQgRBunfvfuDAgfz8fFtbW7lcrtVqRSKDj3LVqlWcon3//feFhYUqlcra2trCwqJJN4znqfK7QQhv374dExPDSUl+fv7NmzddXFw4yYiPj+eULiEhIS4uLjIyUigUhoWFnTlzxtnZOSAgoEOHDlxxPG5YsXfvXq7ZoqIizgfMwTBMSkqKlZVVeHj4kiVLIIQFBQWG9Pj/1p3ihiEjRoy4ceOGVqsNMGJhYQEhtLW1DQwMPH/+vJubG3deCCGGYRKJRKPR5ObmarVaiqLS0tLEYnFYWNjixYsVCkVj0k2gqoC9uwXJPYtABgEYpEnZaB9BBxdI/6c4XluhzvJHjweG4vFo/k0mu5HD0joAxBBRzazKeO/Cki9iPq3UGUzvejEzM6szEgQAiMVi00apVOrt7c2FOMVi8f07EARRO//W1taWm/YgEAhq1+Xy9vbmstjEYrHpy9Jkvzs4OPj4+PDS9qzYbgCA+Pj4Tz/91NfX18zMLDc3l6v8xEmSr6/vypUr5XJ5cnJySEjI0KFDEQRZsWLF3Llzo6Ki7Ozs1Go1QRB//vlnly5dFi1a9OGHH/7xxx8QQi6d0vSpYhjmgw8+UKvV5ubmxcXF/fr16927d0VFBfftyu1DEAT3RR0RETF9+vRp06b5+voCAEpKSpYtWxYeHr5q1ar58+ePGDHCxsampqbG3Nz8l19+sbe3HzJkyOLFi+3t7d97773du3cnJiZaW1tXVFR4e3uHh4c3fPmw5CZM34doyxD0/38piGAiWj6te8UX5VCjRR5zynpzg+LNZrsZEkEAPCPI1mr0j2q41YZACRayfyb9lqFMezd4mYf5v5NJedo3T0HVGIZhiouL79y5U1VV5ebm1rVrV+5LctOmTUeOHNm8eXNsbKytrW1wcLBJiWiavnbtWnZ2tr29fefOnU3FifPy8mJjY4VCYc+ePe3s7Gqfpby8/Pbt26WlpW5uboGBgTiOkyRZUFDg4ODAjVlKS0tpmnZwcOD2z8zMvHHjBkEQAQEBbm5u3Hc4SZKxsbEFBQWOjo6dO3dWKBRcyIJL6fT09AQA3Lp1Kz8/39HRsXfv3g3FFhg9zDkDs08gkEbqWi4QCERVf6XV/BkNiDY0PoUUJRs/Vtqrp2F18scGg0ihDD5P/6hl9Y8514pDz+jc5O5v9353oIvBqcrT7nkK1O1BbNiwYd++fWfOnEHaHZBUwXs7kdKbxtFVfQ82QCAlKFt+nkzOqbsWbusBSVIxcYKkZ6BhRczHBgeCjZK4H6lzBGw2+5RmaZlANj9w0fP+k5urTZ42S9sa1zwSfn5+4eHhT686PxBNMby7FSmJr3/Nbg6IoGaMfHogKpMYarW0HZppgRAMgjKB/hKSAZv16nAUV1GqVTGffRW7Sk/rmrFlnjbIU2y7tUtgTS5M+hVR5SPoQ/PUISCEVTvTa/4wjk/bQEovJEnzqZPNunV9fNsNB8RxSdZSao9xFfNmvjYIIc1SEztMWdhzsRnRgsu38bQuT7Ht1v6AFckGq61R0mb8ZqJJ2SgvQSfXthI/NdZnePxmAIJQKLsfJECWaXZp40JVOEb8mfT7J5c/qNIbprjztEt4dWsrwPK7MPk3RFfeOGnjjkFQIa2Y2gOVSxCGbQPJbgJDuYbHHg1gEKSZqa+RqXiTEkEanSwiOJJx8JPLy8o0pS10Fp7WhVe3NgEsuwuT/kB0yvvCow87kGKEAVLJyG6wtcXNgIBonnXlCMEu9poOks0SKm14SsPJrOPvnn+7SF3YcifiaS14dWt9YOU9mLIDoWr+TWp7BAAkSdkIT8P4lGqGPIymA6FhWNqEglj/BYNoDl51DeSh8Am4Eg0CF1MY/fGlD0o1LbYGH08rwatba1N5Dyb9hugf2Wr7F4igYlr+QndUIWvd+KlhrfPHTk8BKHZFUJhOFrTcsLQOQkx4Of/iiisfVeurn8wZeZ4MvLq1JrA6i03+A9FXNMlqq9UOSYv8pNKRXSEDEdiatltTipnWAkWAFmf3MtcED1jKrYUQYsKz2adXX/1cQ/2zdAdPO4BXt9ajJh8m/opoS5HHmGb0fwCkSGmUp6CzO2yOeQJNxDAyJeov4WyiwQZQCGLFxem1Vhh/YghwwYG0vV/GrtIz+id8ap4Wgle3VkJfyd7bgWiKHyFC2jAQQQWUYppxfPp48VOAIAIAxAAIHmV9W8MaKigKUKyO9chCSNK0nvuhaObBlh2ACCsgDjG3SUi1aDyh/rMjgMAEe1L++vHmd0/41DwtRFuZxPNMoWcgnXlOokxlseas6maIn/pLJKO71fxyuck+K2D8uUnqcxnGAcO6EgIUQdhHsN3Q2uKGY9ihW7e+On4CGpuFEC4IHzw2MJD+f1GV2mAAu4uXXIPZOHzyppsBgAAMxX+5u9VOYsdP1WoH8OrWCtwprCrWdgiSFdmoE1lD9c/mepSN8dNh7vqb+eStjCY4+A0ChCDf1FTv1WqcMKyUZQcKhUvl5qhx+8MPN9hu/x0NAJBVWlqhVi8fNRKgKMvCzs5OTH2hD8OpAbgkyCvRVIhBq5WDQgHKQGbT9Q2eCu+eDr1aqxs8zQKvbk+a1FLVvdIaFpFfEg7vBsw9tLGQZWBzuQiM+b3yad0qskthtfpR10cSAHBZr9usVm20sBwoFN2myNcqKnoKtMPEZtRDYwUQGk5333rZLERcLS1HBQX985ZeX6/hBhBQJWT2knFC0MqlUjCAVegqPo/+5Ovwb93k7q3bGZ7Hgfe7PVGKavS3CqoRCDCE1bL4VSI0UTIIwUQANttUKkgxIl+JdHR3Q37vI0YvUQS5R1EyAPoKhCyC9BQIvXD8hE7XyO/Af2y3/+ogjqFxWVkj13495qu1m0+c0FNUvd48FKJniMwytqZ1BqX/RYAJ0pSpq2I+01Ca1u4LT9Ph1e3JoaWY+NxKPcNyTzdAIAuR62jPONlISmCBNpvAGcan0mHugq6PHD+FCGKGoloE0RvtOB2EVZDNomk9bFxmLUDrKBeEsIODw8KI8Am9enZycvxo/4EVBw+iGFanNRQiOhF6HCZSbDMsndQsCDDBpbwL315fR7OtmiPN8xjwI9MnBrxTWFWppTD030cbIBBDmHvQWycx6wFOSPV5bDNkh/w/fvpC9/KcMlilavz4lIYwUCCUAfBJlXKSRHJOq0umqG4CAW3o58P1DaDAsAJSrYEnwzBh/v5hAQEGgw7H7RWKb8+cfTU01NXKqrb3DQX4DbTgJp0taJbLbyZwFN+TsrOLTbehnsNbuy88TYG33Z4QmRWa9HINWkvaTGAInQMdzpuNKzfzRwHbLAWlDPFTbzPp6Eebf0ojiAeOb7CwVEH2y+rqasgGG8QOFTZutAgM8lYXFkKGpg319BgmwNFJT5GVGk2d4AMD2BOCdA2jffKJIA2AAlTH6NbGrc6tfnj5C542CK9uTwIVSd8uqGbhA59dDGGUUHJeMDxP0gs1eJ7Y5snvHeou7OEJyUcYW9EQ9hEIt1pa/2ZlvUxhXgXZ7gIBCsDDFRcAQzHT/8JCWKBUao3F29Va7S9XLtvK5e7W1rVrFaMQlJgxp/V3iLZkuBk0F7I4IJzkVunVMSx8isenWq22do2kJwBN01qttvH76/X62jWwm4u29Xlql9AsvJGnrNHTtcek94MirBYRXsIHdZeZ+6guAEYPDckijzs+lU/pWpFZwjZufAoQRA9hnF4vQVEBAL+oVDUQjm9MwNSoboixWFStDYasuw/37b+Tn28vl+crlRTDfPX8BHMzs9phUxQl9oNrVVCDt6XvWpplrMVWg9wDO9u71NDZ2TW3POSBjTmQYZg1a9b07NnzoSWBngw0TQ8dOnTevHkTJkyovf348eO7d+/WarUYhnXo0GHs2LG+vr7NddIdO3b8+uuvR44ceVDN6Xv37lVVVfXq9U/OzZw5cxwdHVesWIE0K7y6tTjpZeo8pa5haeNADXEGcB0NrJHJu6mO40wN+3jTLf8Zn47rUbX1AoCwkdWq/tZqYkg9RBA/nPjG3NIBwxr1vQ8AKhbVHlYbZi8gyNJhQxMLC2t0OrlY3N3Fxc3a+j/SBkGliORWGAcNqLkh0dYQsYAQaem5tKxhMI8GWPtEeAbayaS0IV+HTa2KsRa5yQTWDz0cQvjXX39hGNZG1A3HcY1GY6oXbuLKlStnzpxZsmQJwzB//vnnHiNclcLHh6IojaahcPOuXbvi4uL27dvHvXz55Ze5OorNC69uLUuVjr5bVMVl6jcGw/MLYQrip5JKeutOivX57GP9jQzjU8kQF911D/319Ifm90JjqPQThbnWuCC9HEUJBNCN0xLDHFJh3akXBol0cPBzdv7nNcPUSXZDUfwqlnmHzGogngBQwFKsOkPLqBnCAhc7i/5JO24BaJaRCaQD3Xr2cvLEUUAbFgdGAIJq6OoU5eUeNiPQRgyfBQJBHZuFpulLRsrLyzt16jRq1Chra2utVnvkyJGwsDBLS8uMjIyYmJiIiAgbG5ucnJyEhITw8HBTIVQEQXJzc48ePXrv3j2pVDps2DCuUr1Opzt+/Linp+epU6eKi4uHDRsWGhrKha0zMjL++usvtVodHh6OYcZvhv8CAPD09HzttdcQBBk/fryzs/O1a9c4dUtMTDx06FBJSUmvXr1GjhzJ6U55efmuXbvS0tJCQ0MtLS1RFO3bt29ubu6NGzdGjBjBXe/JkyednZ07dOhQe0rxuXPnrly5Ulpa2qFDh1GjRtnZ2RUUFMTExOTk5GzZskUmk0VFRREEYSq/mZub+/fff2dlZXXp0mX06NHm5uYIgpw5c0Yul2dkZMTGxnbu3HnChAlcbdnr168fPny4vLzczc1tzJgx7u7/yU9sQ2OB9geEMLGoWkv9kwLSSIDhr0LnIU7nxaOUYl9jpkhTHmUUx1AhbmiNoA3zTy3NYePmnwoAMEdRC9Tg+W+ktBn2AgCIhPeHRGiGoUnyn5//ShtAAI0yh7GkhloGCK1hsjbn5/ycX3S0LGNTbsHfxQbzrbnDDyxkGZbxsnCf1jmyr4s3ikKmVkQGBViRNq1Yk9G0xpVK5YEDB1iW9fb23rFjx+uvv07TNMuyS5YsiY6ORhDkl19+mTp1Kld6fPv27evWraujR9euXbty5YqXl5dWq50+ffrp06cN/lyV6oUXXpg3b155eTlFURMnTuRaKCgoeP7552/evGltbb127dqUlBSTdtSLXq+HEHL7REdHT5kyJT093cnJae3atR9++CGCIGq1ev78+du3b3d3dz906NC4ceM2b96MIEh8fPzixYtNhuHKlSuPHDliahYAQJLkrl27KIry9vb++++/582bV11dTdO0SqXS6/UFBQVlZWUsy27YsOHXX3/lyqhPmDDh5MmTrq6uP/zww5w5c2pqahAEWbVq1eTJk8+fP29lZfXxxx9/+eWXhjk/d+68+OKLNTU1/v7+qampSUl1P0i87daCFNbocpQatEnVizGEKYMW50XP9UAvumjiWYNqPEI7KAoS0ktzSmoGdHUSI7jAUyQd261664XGHAuboqbQYGLdF1V4SCchTDHTxpFpDXjcAAYqY5TqDI3XQlexk6j6ripjU648QCbrKIFUs9lvDGTEmLiPc9d+rh3EBMqZbP/pBgIYlrpXddla5Eo8+uxgKyurtWvXGmz5qqqePXu++OKLt2/f7tGjR2hoaExMTGRkZGJiYlhY2OXLl0eNGhUfHz9gwIA6ejTGiFqt1ul0Go3ml19+GTx4MIZhDMPMnDlzxowZhs9bYeGBAwdCQkK2bdsmk8l+/fVXgUAwdOjQzp07398lHMczMzO/+OILlmUPHz48YcKEvn37UhS1atWqESNGfPbZZ5xNN2TIkFdffbWwsPDixYtXr151dHRUqVS3bt3iGsEwrPaIUiQS1bY3IYQCgWDjxo3chQ8ePPi5556Lj48PCwuLiIiIj4/npLN2KfRt27YhCPL777/L5fIJEyYEBQVdvHhx+HBDRk7Xrl2//fZbAIC9vf2WLVvee++95ORkvV7/8ccfc3bc/QWweHVrKRgIE4traKbpNfAwhFGxwhhikFYi8dVEQ1YPG+eGQzFQWKYet+xQTklN8q/TXe3kLEVJI13JWz662BQgaJk/OgCAMJS1biwQAbhoDxutgfoGVnMDAKFqGFyOiR1FuBgz8xAbrCw9CwxLijRH6gw02GhOMochnj29rewgwtAPWAEUBZhSX5xZc93XvG8TzvLjjz8eOHBAp9MBAMrKynJzczl1+/3331NTU5VK5ezZs3/++efMzMycnJylS5fWaSEpKWnVqlW5ubkEQeTl5Tk6OkIIWZa1tbXt1KkTt4+np2d+fj6CIDdu3OjevTunFz4+Pn5+foaMnP8CANDpdPn5+TU1NcnJyePHj7e2ts7Pz8/IyFCpVK+88grXfmlpaWFhYUZGhru7u729PYIgUqm0e/fuen1j14natm3bnj17dDodjuPFxcUVFRVc7KV23NxEfHx8jx495HI5giBOTk4BAQG3bt0aPny4QCAICgri7Fl3d3eKopRKZVBQkLm5+YgRIwICAkaNGnW/o5NXt5Yis1xdUqOvN8Gt8aAIS0FwDeurklp00ZzGqGrDJK4GMQwHGPjp9qu+LuZaw5xOowRABMUp+eROVEYRW1FjWMmj2QEACB6hZAyGoNlE1VUkC7ANWaWQRqz7m6vTNPm7iszcxVW3aiyCzaU+ZpBuBmljIEOggiD7jmEeXWRC4n6T7T5AZs0NO7GXQmj3kP3+a7CfPHly9erVmzdv7tatm1KpnDx5Mpei0a1bt/Xr1588edLa2nrAgAFbt249dOgQRVFdunSpfThN04sWLfLy8vr111/FYvFPP/20f/9+TjTr+NTu969BI/f3kKIof3//b775BkGQQ4cOzZ49e/DgwQ4ODgCAYCOc+kyePLl79+5paWlUrSl0puwNrnHT9jonwjDsypUrK1euXLt2bb9+/RiGCQkJ4ZqtfVQD9602Rk/Jv7tRFOXm5nbs2LGjR49euXLl9ddfnz179ttvv/2fQx7UFs/joCaZlBIV2xzOIWCwUJhE0DFWOkorsEUflngFBNj+86n5pap5Y7vVXkwN0ozAy0w6LtDgsmqJIrYG2+0RJsADFI0V5GeQhUSDeg0RiEkwTIxVxlWXXVTWJKgEFjgqQB/TcIMIpFnGUmQ5vsPg4b6BEgH+IJOtNihAtXR1Zs31h+7Jsiz35HMPc2Zmpq2t7aBBgywtLXNyctLT07mBp4+Pj5WV1ZdfftmrVy9bW1sXF5d169Z17969TgCRJMnk5ORRo0Y5OjoqFIrLly837EcLDAyMj4/nMs5SjNSbmWHqXlRUVJcuXdavX29jY+Ph4VFRUREVFTXSSEREhEwm69ChQ25u7vXrhgvPzs7mfIUIgsjl8moj3IlSU1PrdOz27duOjo5RUVGWlpacDcj1hCCIehPievXqdf369aqqKgRBcnJy7t6927179wddJk3T5ubmU6ZM+fbbb6dPn3748OE69iBvu7UIqaWqOpOuHgdgnM+QAV1rJOOD0GMW+kyjbtY3Fx1F8wuq1u2+sXZuKI6hhomstZqBJCmJcNLd8NTHprbE+BTgxtrKjdkTQbQ4u4e9STwspw8lQP7uUrKc9P/IC5dh+kIy5YsMsbPIsreCbarfzZjzAXrYBwxy72olMWNY5j/3qeH+ACxfneQm7Wohcnxg+yy7adOm8+fPs0Z69OgxZsyYL7/8cs6cOba2tnFxcQzDcLabVCr18fE5c+ZMz549EQQJCgrasmXLsmXL6pgwIpFo+PDh77zzzs2bNzMyMpKSkqysrDh50mg0pkeaJEluwDhz5sxDhw5NmTIlKCiIk8L7s3lJktRqudi4gbfffnv06NFz5sxZtmzZrFmzxo8f37t378LCwoqKihUrVvTp02fGjBnTpk3r0aMHwzA4jguFBi9E586dO3ToMH78+LCwsLS0tIqKCm4IzGXzQgjDw8PXrl378ssve3p6RkdHYxjGhSDCw8N///33sWPHdunSZeHChRRFcfbgzJkzjx49Onny5P79+x84cCAyMjI0NJSLDptiFwzDaLVagUBw7NixDRs2DBo0iKKoffv2vfbaa7XtO74WfYug0tPHU0oMs+Wbu2UWwaRA3Zs6b6+5xRqSyf5zBkM6GIIs+ua8QiJYvnDQtbjsUe8fiPt+sqOdjKX/eQAAgZI5TPmnJ5nyKvCI6yM1BIRAILCcN5uwsGhM5RocotGKivn63yA0eNAa2BMVoikrMwk55r3QjdGxCEQSP0i1CFI4jLZtQlTBkC3HMuYi8wGuPXo6ehlXnHvkRhhIu0g69bCJqncYBSG8cOFCUVERTdPcDjY2NuHh4devXz9+/DhBEJGRkVVVVR4eHs7GRJlUIyEhITKZrKys7MKFC/3797e1ta3TbEVFxf79+7Ozs7t27dqxY8eioqIBAwbo9fqzZ88GBwdzaRMJCQlarZYTylxjXoVKpRo8eLBWq/Xy8nJxcandYGJiYllZWUhICNdJkiTPnz/v5ubm6+ublZV16tSpnJwcKyurwMDA3r17c7GCmJiY3Nzcbt26LVu2zN3d/YsvvuAsrH379tXU1AwbNkyn09na2np7e2cZGTBgAADg+vXrJ06cAABERkYqlUpvb2/uwuPj45OTk+Vy+eDBg5OSkkQiUUBAAIIgxcXFBw8ezM3NDQgIGDZsmEwmQxDk8uXLNjY2XL5xaWnpnTt3QkJCKioqjh8/npmZieN4cHBwaGho7ZgGr24two18ZWJRzWN63B4Eaygww/aCVz1qLiMsXXs+A0pgV+/kP/fuwTmju9haiO/lVP50LPGN8d2mRXTwcbMwOaqAkKg+klf9wwVANLO6Wb0xD5fJHjrsNdwXQrREcOgEdVuIPGQwixJo/p6i8stKj1kuQjuBKlWT+WOu12wX80AFSz3afDXWoKSol6XrMK9ge5mEgQ2sgt4QEGFxIAiyHWctbp7c16eCs2fPCoVCGxubs2fPfvHFF3/++SeXc9eW4UemzYyKpPOqtI2cFdAEUIRlEBCLBqvk8gDVKZTR/BtIZaGFTDQl3C+nuCavVFVYrqZoNiGjQlmjBwCFyD8uc0hSsgg38pavLib58Qv01abuwrwPAEOwBLT4JszDGxECZmnWNtyKLKOytuXhUoxWMfYjbGQdpSZrtJHQLCPCRAPde/Vy8hLjWCMCCA8EICjJ6rJVN63FLs23rnJbJzU1dc+ePRBCgiBWrVrV9qWNt92an6Timvg8ZXN53B4ERAAEmDvMCtScEJGlbC3H/D/pdQLs8vXc0e8fjP1+koejgv2vYwnggMyhyz89xZZXN0/8FEIgFNq8+QYqFj/UdsNQ/EfZ7W80x0SNW4YXoACykK6maR1LyDBMgj1SSp5hNMqwnhaugz0CPS2tWcg0YTR6f5sYwPraT7YQPtD71v7Q6XQ0TYtEooZjGm0HPmbanFAMTC9Tt9CYtDYAgSikMxG3i2ajVWI3YyD1nycWGudiIgy0lItG9vM0ExH3CwGkWYGHWPp8T8hN3WyePoHG2G4oRFQCdj8ZL2h0YRtDbAQguAIX2wsxM8ywfkqju0xDBgN4f9fAyZ3CPCwtaZZ+fGnjknsplsquuYM8S4hEIqlU+rRIG69uzUxWhaZaTz2xsQqGMMWIzTnx6CJJV/T/D71B2yDC0oyvi8UPbw+2MRfX9zwb46dhDqIgL0g1z9o4QCxqzHgcBfgpIrOQrXy0pdyMxppB5h5Bmgw5Hw4Su8kBkcN8upsJsHqr1TQZFEFKtZkqypCbytM24dWt2SAZNrtS3ZwPUCPAEKaKNbsijMyU9EUNRiP7nzySBqxIiKAYrZjaHbO3auT804aAEIjED52WASCiE4ATbCLN0i26UKVhiihEAx06T+sc4W9j1yyj0ToAgKlpZbEmvXmb5WlGeHVrNkpq9KVqsmmzSh8Hw8JwLHaVGHBHGgkxce0CNA0/0ZBmCVdCNrZbM8xoMqjbw203DOA3sILrTHbDGbyPCc0yFiLzMf6DxvgHmYuFjxNAaBgUAbmqu0ybqQXBUwde3ZqNvCotY0xCe/IYF4aDt9Cu8bLnSIHlQ+czmIB6ShLuIurr//jjUyASNVy6HiAIi8JzwmwNo0Fb5oNnXOeDDbDxfaFzRA9HV0Ne7SOtvP6IAIDWUGWl2uyWOwXP48CrW/OgpZj8at2TN9z+U4AGMinQ+7J0fLXQBTXkfzRyXTa9fGIAZmuBPGKORd12REJjPvEDT4pCpERMH9bGt9AK4zTLSAnpcJ+QiQEhdlKZcdXJFoeBdK76botqKE+T4dWteSio1ukfcR23lgBD6ALW+qLZ6DJxB1OcoWEM8VM3kWxiL0NicFOdUxBCVCBoeGQKUOIAcleF6Ju9YikLWZplvcxdp3SK7OfqiwKWBVAoJogWWg2lFihAK/UFKqq8pU/E0wR4dWsGWAjzlNpm91s3DWMBGvlZYVSOrA9qTBV72BHG+OkAO1Gw9yPVl6nbCiFoILUVhaBCQF0A6Wxze8EYyAhx0WD33lO7DHIzVzAsA1BUq9JdPHQ78VoW1oyzzeoDIKiWVlboc1v0LDxNg1e3ZqBaR1VoWiGe8CBQhCEhFo2FJsvCISoA/5+l8EAggqC0YmpXzNEaNm18CiFCEA3YZCjArxOFCXROM8YTIDTkfDhK7Sd1jBjk2UmAAxoalhfAcfTEX3GfvvLT3h/OEcKWM98girIC3HBpmRW5beKbjee/8OrWDBTV6NUk02bEzQBqKK4CrqM9rslGUrj5wwvd0yzhRMjGd2vy1CLD8kcPuAUAQWiMOYgmMAzTXIkgLGQNswWcuk/vMsTX2pb9/6RRHMeSbmRfP5fSqbdnC6VVAwAxlBURhLJGcSPNYef5Dm/+SmSUqFriXDyPw1OTdtxmYRGYq9Q2HC5sFYwFaJhU1EctkQbrjot1BbUnbN0PJClJmLP+dgft+btNWB8JJfAHqRsGQaqZ9qr+XrMYbtzSbLZm1oPde3a2c0EAa8r5QDFUq9b/teFU+PM970SnV5U3o+JAFIU4itIMoChpaoH5tTRhbpk4p8wwqR4AePZeiZettPlOx9MM8Or2uKj0TIWWanviZsCwRhJk8hDHs+IxwdhZS3WCUeAe2FcA9LIJHciUArZE+cjzTx9QudIALtjJXtZAsoEVxhsJC1kU4N1sfYd49bQ0EzHsf9b5wDD08PZogZAYPL7X9fP3kOYAAIgCKMCIsmqznBJJSp55bDqq0qF6CqKAxY0XpKOYi6mlM/q4Ey3s5uN5JHh1e1xKa3StlebWSHCEroDyC8JhgYiZi/a6cSFq8MD4qatIPqlX5benG1//1HgkBMYlsO93P2EQzSNqroE89IGnfbRyfOGewd3sXU3l+P49EYam382LOXFn/hcTxBKBYS4oCnCiaXpqUDQcAwyDUrRZepHF1VRhbplZVomxQD2GAGDwuJnAUTSlWJVZpva1MyxGxtNG4NXtcSlVkSwLW3pRkMcEQ1g1K4gWhNdgFh00FwH9oEL3hvipWYiNNt5HdyERCB9tJfEHbMeiBfmpurxGrgjy4FUn2Y7WPoM9ujnKzRnDzKq60Q9CiB346ZK6Whdz/G70sTsZd/Mpkt616eyQiUEYgTZyPgZnqREYoVSZZZeI0wosou9hNVqDpQaMllq9YomhILdCk1ai4tWtTcGr22Ohp1mlvo0OS+uAGte6vIH10kukXTRnMErJ1ptVCxEEYxRTutIZpXRhOeCGXk1VN4AAHcb8zd4gHmNMSrOMGWHWz61rX5cOQhzQbP1pKzTFdg/1k8jFlWU1GI5RJE1TjLq6nsX76+knYAkMMCxKUeLsUsvoe4K8MklGCUIz/1hqDa+DBwDCsPB2ftXwzg5NvEieFoBXt8eiWkdV61p2QngzYliZHDIJoINKpghUHTOjCusvdE+zhCMuG9+98htDSeBGgaL16iAGQYy47B5Z0LQMXuOyINBN4TTUK9jN3AIibO0KynV7TTEhI7qERHUFCCI0E3z26s8alW7GkmHqGt2DDDcAIDD41PAajTSlWJxZaHk5BavSoHrDOsYGXWt8cAVHQWxmOdPmrfhnCl7dHguljiJp9in6QBsL0DDZrKNWOqaX9oSFLp01ZAXdVyaOpM0GOupvB2jO3nl4/BRCQBCGjJD/5jMbnHACwUH2th5Swkf/pNGQJVC8n3O3/q4dGleOzzCt1HhWhNLTnXp7knqaqi8/mbPUWBYlaVFRueXlZGFemVlGCdDTLMFZao9uaKIouFeiKlfrbWWPXMuZp4Xg1a3pQAQpriGfimFpHTCEKWUtzopG9cHOOmhuGwyk+y4DIHrp8x3I5AKmuPLh8VMBYfipcxaAJWKlcTALh49suhnTdO3CPXr52dgblx9vdI6xUWApko6YGGRYlkpP32epYRqt/F6eMLfY8mIyXqHCjJYaxFH4OJm/AAFqPX09Rzk0wFDSmKctwKtb02FZtkytb4OZbo0BRRgtFF4iwnvILDxrLgBDURmsbvzUSSCbGlS5/uRD4qcQApwA+H2lmgG4LMwv0pSLgaEoeiNhIIsihqXZBnl0tRSLmr5+EddfQ8dZHAMQohQlKFNaXUwyWGppRaiOMnjTANIUS62eswGDEzY+u5JXt7YDr25NR0Uy+sdbV6N1MRa6x2LR4Gq5vJPqFM6o/itwxvhpXyvtNT/d2bsNx0//GZn+p3FQJWD2knHCR1kRhGYZK7FlmHtgN3s3AAxZu024rn+6hBgtNRzV6WXJ+cK8UquLSXhZDaqnADRkdbCPEhBuFCwLEwuqKYbls97aCLy6NZ1qHQ1hm850a9x8BjYJdFRJpUHaY0J92X/mM0CAAEYxuQudVkoXlD4wfgohgmOGn1q2GwrRC4KsErIKNG62H1dBuaO1T4RnD3uZcf2iJk3dBIY8NUO+GkkRldVWl5KEOWWS9CJUrYcEDgECcaylpoRiKCis1hZV6VwszVroFDyPBK9uTadaRxm82E+1vP0/kJqFuGnNxvXGTik0af+Zz0CzhD0um9it8uuG4qeGkSn272cJQEQvwo7CuyRLChuR5sal6Q5wDezl7CW4L023UVdhiFuzBA4oUnqvUFBQankxWVCkNFhqLGSJFrDU7gcFoExFlqlIXt3aCLy6NZ1qnaHAEva0y5sRHKFLoNUF0XNB4Iyd5nbtQKohfhrioL/VSXP6NqjPR2WY+4ChoFapJAzg8WjBdTr7oQtVstBQDd7Twm2IZ09XhQWLMPQj2WwAEqghQ4+kseoaq0vJouwSs/RirEYLCcwwMm05S+1+UBSUq/Tlat0TOyNPw/Dq1kRoFmqaqZpUGwFDmGpWfFE4tCtq4aO5Apl/C90DqJdN8CeT85mCcsMI9D4MhhuGmWrjsoA9KchUazQNG24MZESYuI9zl/6uHcUE2niTzfiFYszqoCVpBYLCMstLKaL8cqCnAcM+IUutnl4hCM3A3MpG5Q/zPAF4dWsiOprV0a2/GG/zgiIsyaLX8L46qSRAfR7QKmg0viANCQdCPiWo4uuThuUw708fwVDTXAUUIqVm7En9rQYMN8PqJZB1lNkP8ezla2XPInTjcj4MthgKMD2JqjU2V1LMMorEGcVEpYYlDNshhsLWdeijKMgu17RmD3hqwatbE9FRtJZsttXK2licAbkFuqtlFt3Ux0XkP3EGSJLiYEuzUD/NqbugTmKYYfFLFPm/rqAocQC9qWTU2APiCYwhTZfoad9xsHsXmUjwoJlVtbpkHIFiEDKSzCJhYbnFlRRRVilKUoBmWRxjRK1hqdULCpCMUhXTXvwVTzu8ujURHc3qafYJlJ1vnQI0CJ0G3TXS0T01J+T6bBbBuPipbFIXKrWUyiv5b/wUAtRou0GIQqAUMhdhGsuy+H0T9bnJ8FZiiyGevTvaOqO1lmZryFKjUK3G4uo9s9RCcUaxoELFGrcbFlwTtLHUCxSArHINzbBYo+fn8rQcvLo1EdI4lGpjD1dzgiF0IWt7Tjw2GD1pq0syTHKiWcIWl07qrlx7su7eKGr4YRgUxWPxrFv1xRO4nI/udgGDPLpaS8wYlmHhAy01HIMAmmWXCAvKzGNTzVKLUD0NaAbiGNMqPrVGAoChrG21hrKR8+rW+vDq1kT0DNsOzbb/giJMDRRfEA7rhZu7qaIhZA3x0752+ltdNCdu1o6fGmw3w6QNQAHmKJYCKRb8JzEYUixjLjQf4Na9l6M3itZrsv1jqZEU0OnMr6VJkvLE2SXCkur/W2qG1FykjQMQwLKwTE3ayPnZpq1Pm/+8tFXIp3mWQuNBEVYP8StYqFou96s5h7I6BOpl43zJxDwmv8wUPzUsAgwACpEMiS5Gn0LUMmo5k83X0nO4d297mdS4NFtdS80QDUDEuWWi/DJFfJokqQDoKZRiII62aUutXlgEVuv46vRtAl7dmkj7C5g+CPSfOEO3Gpm8h+Y4QVYSdmL5tKDKr04ikDHm0QJuGhbABXvYGDWiN60wTrOMCBMNdO/Zy8lbjGO1TDYuvomSNErqFDcypHezxTllwkIli2EQA3UXv32KYFlDImRr94LHwNP5CWptIIKQTIvYbiiG4TjBeegZhqZp2jS9CcNxHDeIiHEz9cQDqTAV8VZJpL2xk1JdtjjIQjewg+b4rX/ip2ZmKAS5RE0MyAIGW80YQGBYDwuXcI+enpbWLGS4pdmMBaUgDsR55cK8UvntTNmtHGDQOBpiT6Gldj8shNVa3nZre+qmUqnS09O9vb0lEskTOPetW7euXLkyc+ZMoVBo2kjTdEZGhlKpZFlWoVB4enrWfrd5MRTEpGkcxx91nQ8IYUvMnwcomp5wK+bkwdK8XIFQGDgwstegYcbRG8Rw/E7MxQsHd7Es02/o6O6h4SzTzGWPH9I3Ls4A7S6IR/YGp6zIFPnzHcl7xXROMYKiqEgEABZHFKbrC4QApyEjQAV9XDuFunWWCnGapTAUCjCUYlC9XnY3W34zU2RQt/L/Z6g9tZZaXYBR3XjbrW3wn6Df5s2be/TosXnz5idz7qSkpN9++40kydoby8vLp0+fPnPmzA8++GDy5Mn9+/e/evVqC3UgIyNj6tSpZWVlj3ogNKw53szJbpzCnt//V2l+rnfn7jJLq20r3z3251acIHBCcO3ciU0fvGHj4Ozk4bv503cuH/0bFzzCskLNBYYwFaz8gmhElqg3YQvkk7ohqGEQiopEepzZC29giGGWqL3EdlLAkOE+3aVCFABahAvLq8yvpTj9ccbvvd+cfj6juJoqKFKyQsIw4904RbT9wEKkSvOfjzRPa/HvNyZJkjt37uzXr9/x48dfeeUVqdRQnJFlWZqmBQJBUVERy7KOjo7czoYRk/GBLCgoEIvF1tbWpkZQFMWNUw5ZliVJUiQyBI9omq6urlYqlRZGuJ1RFCX+u2wOZxaRJDlv3rypU6eWlJS89tprn3zyyYEDB7g2SZIsKioSCoV2dnamngAAGIYpKiqSSqWWlpa1m8rPzwcAODo6ctrBXQ5BEKWlpSiKlpSUxMXFlZaWCgQCMzMzgiD0en1RUREAwMrKqgEDFkKEYpp5AqPBucWyY2cttLCxwzAcw3EMw6OP7x88dqpIIjm1a3vPgUOmvrkMAFSv157Z80fQoOE4QZgmPz0xMITRsMRVYqAWSDv0vaaPCFAfu00IxbdFlYnqHBRi3R38B3t2sZNKdBTU62WGEnmpwsJKUXYpVxK0HVlq9wGM6yDxtlsb4d9P2blz57Ra7aZNmyZPnhwbGzto0CAEQWJiYt57770+ffpER0cXFRWFhYWtW7dOKBT++eefu3btcnBwSEhIKCkpmT179qJFiyCEr7322sCBA2fMmIEgyNWrVz/44IODBw+KxeLPP//8xIkTAoGgoqJi8uTJb7zxBqd69QIAUCgUMiODBw/etWuXWq1WKBQXL178+OOP9Ub69Onz2WefyWSyn3/++eDBgzKZLD8/v6ys7LXXXps3bx6CIJmZmUuWLMnIyAAAeHl5rV692s3NLSUl5Y033vD29r5586a3tzdJksXFxfPnz5dIJO+8845CoZg/fz5FURiGEQSxY8cOKyurB3XSoCrNbnIAYG5tyzAGh5sQNUMBwAkBLhCUFeaXFxUMGPk8TVEIhJ169bt68lBJXrazjz9DUa1W6B4L0ggsAyYiVGIeFJntoGLMhOIoz+CeTt7lVWZXk8UpeeZX04CeNpb+RFtn7ueTByJQXd9y5zytqW5//vlnYGBg9+7de/fuvXfvXk7ddDpdbGzswIEDt2/fnpWVNXPmzAsXLkRERNTU1Bw+fPjXX3/9+OOPT5w48eGHH06ePNne3r6wsLC6upprUKvV5uTksMb5g1FRUTNnzjQ3N09ISHjxxReDg4MHDBjQQLc4Q6+4uPjYsWMBAQFSqTQnJ2fhwoUzZ86cMmWKUqmcOXPm5s2b33zzTZVKdeDAgd9++y0yMvLMmTNLliwJDg7u2bPnu+++q9Ppdu3ahSDI/Pnz33///d9++41l2bNnz/r5+f38888ymSwhISE2Nvazzz5zcHCws7N79dVX3d3dv/76awhhenq6mVlD69jARpaQe0Q4b5pAJEq7c+PK8QOjX1lgJpHlpafotBpza1tDxhmEFjZ2OrVaXVOFAvSJ+t7qrA2JMEmMt9ZD3nkmklZWQltLpto8r69x//4oVlgpziwxLtHRri21BwDQZySa/rT43TIzM+Pi4l555RUEQV588cVjx46Vl5dzwyUrK6tFixa5urqGhoZ27NgxLi6OG+L16tVrypQpDg4Ow4cPt7W1TUpK4gabJg89AAAz1icHAPj7+9+8eXPr1q3R0dFcPOFBHTJU/IVwxYoV4eHhffr0KSsr+/LLLzEMu3LlSnFxcceOHRMSEgoLC319fY8cOcL1sGfPnlOnTrW2tn7++ec7d+584MABjUZz/vz5RYsWeRpZtGjR6dOnq6urIYROTk6zZs3y9fV1MCIQCNzd3d3c3EQikbm5eUpKSmxsbE1NTWBgoFgsRloDghDkpd/7/sOFvQYNDRszmabvd+JwZY8N0QakVcEQJoe0vRI87ZRzr+LCqE37O204Kr2SIsouZQU4JNqdT62R4O1xft7TyD/fqhcvXkxKStq5c+e+ffsqKytLSkqOHTs2depUCKFcLjd5xzAMY4zGBYTQ2tqaZVkURSGEOI5znjjDWrW11I37V6/XT5s2Ta1Wh4aGCozo9foHdYhrYd68eaNHj05OTv7ggw9Onjw5bdq0kpISjUazfft2bje1Wt2vXz9OZ11cXEyHW1lZFRcXV1dXCwQCk4PP0tKSIIiqqioIobm5OedSNKRWMAwXNuVevv/++6tXr3733Xdpmg4JCVm5cqVpzycGIRAWZqdvfH++d5fAyQveM/pxWKncXGwmqSwtBgAFCKwoKRaZSSQKBfvEnW51wFBA0fQfd6rP3nOGLIOjLAIeoUpeuwTw6tZm+Mf9v3379vDwcIFAwLKspaVljx49du7cOXnyZE686nVd17uRIAid7p/V+6qqqjQaDUEQcXFx9+7dO3LkiKurK4Igu3bteqgv3N3d3d9Idnb2ypUrn3vuOWdnZ0tLy/Xr10ulUgghZxVy6pmWZpizjaIoy7LFxcV9+/ZVKBQMw5SUlHD7cCERS0vLysrKOj2v3ZS9vf3atWv1ev3t27enTJnSo0ePl1566UE9bFqBzoZBMawgK+27D9/0Cuj+ygdfYDhOUxRNkVYOzlYOTnevXgx9bgKKondizlvZOtg5ubL/1+VWAUNBjZbafz0/PqsCR9HaK5Y/0wAEw3h1azPqdv369du3bx89ejQwMJDbeuvWraFDhyYkJGAYVtvOIkmSs3RomjZlchiSv/R6zqbr1avXH3/8MXr0aK1W++2332q1hpX8LC0tlUrlrVu3ZDLZH3/8ERcXN378eM50qpMOYmrNdNKXXnpp48aNW7ZsefHFFy0sLD744IMlS5ZIpdI7d+7o9frw8HAMw5KSkrZs2TJ+/Pi///47MTFxzZo1YrF46NChq1at8vLyYln2iy++GDFihEQiYRhGr9eb1M3CwkIkEu3evXvAgAEuLi7nzp1zdXX19vYWi8UikaiBkSkwThs3jAub72MMAGAZZseGL5KvX7W2d/zhk7cpvd7W2SVy0ktyS+vIiS/9+MlbP6/6gBAILx/ZN33xxwKRGU21WuYBgaFFSu3+63lJBdV8kZT7bDf+hrQZdbt79+7EiRMDAgJMWwMCAiIiIrKystzd3fv372+ybnr06OHl5YUgiJubW2BgIDf2FAgEffr04cKLL7/8cmpq6uTJk+3s7CIiIlxdXVmW7dChw4IFC1auXCkQCDp16vTmm29yRpyDg0NQUJCpcQ6hUNi3b19T6olcLv/444+PHz9uYWGxffv2FStWTJo0CQAgkUg4LyHDMKGhofHx8b/99huCIKtXr+7UqROCIJ999tny5cunT5+OIEjPnj2XLVuGIIhMJuvXr58pXODi4rJ06dI///zzyJEj7733Xlpa2vr16zkzcKyRBm5cSxT6Y1m2e+hgZy9fiEDIsizDSM0tAcBokurWP+yN1T9cOrJXq1bN/WxDQFC/VpQ2HAOZJaqdV3MKq3U4L23/hR+Zth0MLny9Xn9/6hlN0wzDEARBUZRptgBFUQAAzsvGsqzAmFAKIaQoCsdx9P9fWTk5OZaWllKpVK/Xm44tKSmhKMrJyYnzduE4bkh9MJ6itlJw+W64IdvrX9XTaDQikYhrv6CggKIoW1tbzrb68ssvr169unPnzry8PLlcrlAoal9FQUEBgiAmrTTlu9XRJo1GIxQKMQyrqKioqqpSKBS18+buh4XweHJJpZZqdonDCYHBG2AMFxgXnGAZmuKMTUMGnCHpDzA0xbTSmBQAw4A0Mbdqz7XcSg2F8Y/xfdAsfDvCb2G4T2t3hMdou9U71ckwqRGv+65JAbm3OAAAnMyZ4EyzOsfa2tpyv5hkCzNS57wAgPv7Uzs5wyRVHBRFaTQaAEDt2MKDdkZRtE5X67RvaQRpBEIChVrDio5Is9KARcbQdGuJWu1wdkxq2f74fD3D8tJ2P4ZVihFEIuB9kG2Cpz6+NXbs2NDQ0Cd8UhQAkSGV6xkCBYaCLGcSis4kldIsL20PABpKK/CLu7URnnp18zPy5M8rMqzz3wLTFdokGArUevrwjfzYjArDOm58tuqDwVFgJ2uFKcA87VDdWotnx3bDUVCloXbG5iQVGGZH8MrWMLzt1nbg1e0xbDek/YNjIL9Cu+tqTlaZmnhmBL3JQAQSGGojbak1u3geCV7dmojQMOkMaccYFnRDQVqhaldcTnG1jpe2xgAhYmkmENWqOMHTivDq1kQIDCVQlIawXUocAIYwQmx6+eHbBdVais/XbSQQQWzlQn6qQhuBV7cmIsBRAY5SpGF1OaR9YXStwfNJxcfuFFEMy2feNx6WhbZSg1nf2h3hMcCrWxMRE5iYQNXtbhFW1DAxnj16s+BiaingF/N5RFgE8bSRtG+XxVMEr25NRIijYry9JYXgKKjWUoduFMRmlhsmxrejS3tCQOhrJ2vtTvD8A69uTUchJkCVYZmA9gGOgmKldve1vLRiFe9oawIshNZSobNFQ4ue8jxJeHVrOgoR0W7MGwJDM4pr9lzLza/U4bxXvEkwLLSXi+wVfLJbW4FXt6ZjITaoG/OUh00NE+MBuJOr3BWbW6OjeGlrMgxE7BUiWxmf7NZW4NWt6UgEmAADWopbB/ypxDitCkanlh28WaCjGH726OMAEMTNyowf1LcdeHVrOhgKzMWEhtI9pcUDUAAohj2bUHw6qZiBkJe2xwEiiABDO9jLW7sjPP/Cf880HQCApZmgtWsbNBEMBXqK+fta7umkYsPy6+3FgdhqQITA0QDH/ywvyNO68LbbY2FjSN18+nQBR0GFmtwTm5tYUI1hoP0lJD95WAgdFaIODnw6SBuCV7fHQiHC5UK8Skc9RcFTHAOFldodMdk55Vo+htBc0Czs42Ul5GeYtiV4dXssJAJcISaUWuqp8LxxE+OT8qv+js8vqdbx/u/mgsvp7utp9TR8Cp4h+M/342Jj9nQMTg0T41EQn1G+IyanrEbPS1szwrDQxcLMjw8ptDF42+1xsZcLsULQ6oWTGwY1lkQ4lVB0OqGY5EsiNDc0A33spB7WktbuCM9/4L/AHxe5CJcJMbYNi5uxYjx7+Gb+sTuFNMtnfjQz0HCHkW7O5kJ+Cbw2Bv/3eFxQABzkojZru3EV4/+6mn0mqQS0SBXWZx5oWKh5gJ9Na/eDpy68ujUD9jIRgYE2qG8EhpYodX9EZ93IriSwpyiu+zTBQOhuZdaJz3Rre/B+t2bASiKwMhOUqPRtatICjoH04pqdV3OLa7R8xfiWg2bYEV0cxXwN07YH/6FvBgQYam+YO91WpA0AQ77u3Rzlr1eySmp0/OK6LQcLoaVEEOrDD0vbIvznvnlwt5AIMNAWxqbGivFIdGrZb1eyqzQUH0NoUSgGdnMxD3Dkc0HaIry6NQ8yEW4rFcLW9r1hALAMPHmncN/1fIqvGN/CQGgI2kR0sBPzUxTaJLy6NRtuluK2UDF+T1zOyYRihoV8EKGlYRFoJxNGdXFo7Y7w1A8fVWg2bCQihYhorTmnOIoqNeTOq9nJhTUoPy/+iUDR7JCO9jYyfjHeNgqvbs2GRIA5KkStMucUx0BeuXpXbE52uYafYvVkYFmoMCNGdXNs7Y7wPBD+SWhOfKylIgJ9kr43YFzO6F5B9a+XsnJ4aXuCUCwb4m3T3dWitTvC80D4h6E5kQlxd0uzJzZvgasYfzWt7Lfo7BKVjk9qe2JAiJgJ8Bf7uvOzr9oy/N+mmfG0lIgJ7AkETznv3tnEor/j89V6mk9qe5JQDNvH06qPp1Vrd4SnIfhHopmxNBM4K0QtPakeRQFJM/uv5R2+ZZgY/9SHR4Gh7L3xB9S/vc1kSnOGm5jAXuzrzifctHF4dWt+fKylBNaC3jccRas11O7Y3Iv3Sg3R0af9EYMQklqmupSpLoUMjaD/zx1DMYRlmZoypqbc8NKgcW0CkmZ7e1j287Ju7Y7wPAQ+Ztr8WJoJXC3E6WXqlvhu59YN3xOXm16iageONoDhmpToynM/AYyADIWKpBYDpovcukIEocvzKs5uo5VFAEEEjn4WA6ajEguEZVq/9hWOvhDsxk8sbfsYFjVs7T60Q0pU+vPpZRQDm9ewIjA0vbhmT1xugbK9VIwHKFWZz1QV43I7BIFVMXv0eQkOM78FGFG6byWkdJYRr0OWLj/6rdDB1yL8FcQw5m/NTyzJsH09rX5/pbcQ59WtrfPUf/m3TWylQi8rSTN+cwAAMBTcyan8+WJmYVV7kTaDLcQSls5iryDC1l3o1EHSMZRRVUCGgpRWm3ld1mOEwNZT6OAn6zFcnXSeJbWt639jIJSLiIXhvry0PRXwI9OWwt9OllulVeuZxzffON9adGrZoZv5OqrdzR6FLKNR6XPvsnqt6tYJabdhqFAC9ep/3v3n9gFGVcHWVKBWzghstcEpzbCjuzoG86HSpwRe3VoKMwILsJPF5iibo2I8c+Zu8ZnkErZ9VowHrE5Vc+s4q61hVEpZr1EAoIhALHLvXn3tIGbugLC06uYxAFCW1IDWG5dypWHmDfLG2+GfoH3Cq1sL4m4hya7UFlbrmixJGAq0JL0/Pj8+q8KU49begCwut7EZ8x7C0DU3j1Wc+E5g50mY21sMfFF57ueyfStRoRRT2KJmCkAIYSuJGzQu5fZqiKezhVmrdICnCfDq1oLgGOjsIC9Xk0yTHHA4Cspr9LvjcpMLawwV45F2ijHVAwAUFZiZ+QTXXDtAlecSCjuBlYvN2PdYnQoIxOq7Z6iiVEPkoZWCYBTD9vO0nhDo0ipn52kafFShZbGVCj2szJhHz+7FMVBQqfnlUmZSYQ3efqUNQpYqzWLVSkjrGW2NOukCS+sJa1cIWVpdwWprUEJMVeRXx+yVdA5HBaJWUTcIERGOzg3zMjcjnvzZeZoMb7u1OB3t5CUqvVJLN3J4ylWMT8yt2nc9v6SmfVeMBwCg6qSLmnsxqEhqcKuhqOWgV3C5DQBAl3G9KmYXKpSwerXYJ0jec2RrZS/RLDujr8dAP9tWOTtPk+Hz3Z4EBVXaCxnlbCPmExkmxiPgWmbZwZuFKh3dHmMIdQCsXk1XFrDaGgQnCCtnTGplSNkFgNWpqfJcqFdjMhvC1h2BbKsYbnqa7eVu8dOMICup4Mmfnedx4NXtCXGroCqhqLrhaVNcxfjTCUVnEkueoYrxAAUoxmV+QJb5dzaCwbDDDdsha5ih1RqwLKIww39+KSiQX+noKYQfmT4hOtrJytRkA/FTDAV6ij12u+BCSilqzN1FnhEM4sXWtx1ChmqF/vx7fsPa4nMHevPS9pTSjn06bQsCQwOdzSUCvF5bGUNBlYb8KybrXHIpalg4vBV6yFMHkmGjOju82NejtTvC00R4dXtymIuJzo5yY0G+/0BgaJFS+8eV7Bs5SqL9hkefLijGUGH+naH+IoJ/Rp5W+JHpE8XLSlKpJlNKVaaBJ46CtKLqnbG5JTX6dh0efZqgWSgX4Z+MDHC3lrR2X3iaDq9uTxSAIF2dFNV6qqhGj6EAA+B2jnLPtdwaHc3P72kjsBBBAbIk0m9IR/vW7gvPY8EbC08aAYYGuVhaiAmagZfvlf4enV2jfxYyP54ODJEECF8L8XypH+9ue+rh1a0VkInwIFeLmNSyvfF5NMvyrra2g55mRnV1XBju29od4WkGeHVrHawlwqhODhIh3tIVGHgaD0mz/b2tPx3dSSLkPTbtAV7dWo2hnew/igrAUdCEWag8zY6OYv3sZV+M7WJhxs9JaCfw6taaTOrlsnSoPy9wrQ5Js142kq8ndvO2lbZ2X3iaDV7dWplX+3sujvQDwLA4Ymv35RlFRzNettL1k7p3czZv7b7wNCf8PNM2weaL6V8cSyHpZ2ZuaZuBpFlvW+nGKT06Oylauy88zQxvu7UJXu7v+cGIDvwQ9QmjoxlfO9mGSd15aWuX8LZbG+L3q9nLDyWqSYbP7H0CkLQhjLBpSo8ODvLW7gtPi8Dbbm2Iqb3dlo8KEBEYzfBfOS0INERImc5Oim8nd+elrR3D225tjqN3Cz8+kJir1Aj4aactgGFdJRYO8rddObaLk7m4tbvD04Lw6tYWuZ2nXLLn9q28KgHWPstgtRacW3N6sNviSH++SEK7h1e3NkqhUrv8cNL+m/k4BniFaxZolpUKiTfDfWaFerV2X3ieBLy6tV3UJP31yXtbLmXSDMQxXuAeCz3NOihEn4/pPDSAX/njWYFXt7bOzmu5nx1NKq3WC3DeDdcUWIhQDNPXy3rZiI7dXPh83WcIXt2eAuKyKr44lhydXm5YEo5PFnkUSJqVCPFpwa5zB/pY80WtnjF4dXs60JDMpnNpP13OrNRSfCy1MUCIkCwbYC9/d5j/4A52rd0dnlaAV7eniSvp5Z8dSbyeU4mjKG/ENQDFsDiKPt/TeeFgXycLPu3jGYVXt6cMpYbadC715+hslY4m+DkN98FChGQYH1vpwsF+43o4tXZ3eFoTXt2eSs4kl3x7Ni02qwJCyNea+XcoyrAyET6mm9PrA7w8+IIvzzy8uj2tkDT717Xc7dFZdwqqBShAn20zjmYgCkA/b8v5g3z6elm3dnd42gS8uj3dFFRpf4/J+T02u7hKh2PPojOOMs4/8LeTvT7Aa3hnBym/aDjP/+HVrT2QVqL6/nz64TuFxojqMzG3ASIIyxpmjHraSCb3cp3S27WBFcNZlq2srBSJRBJJ3eGqSqXS6/WWlpag0TetqqqqqKjIy8sLxw1Kmp+fn5ub6+Dg4ObmVns3kiQzMjJ8fHwwDHtomyzLJiUlOTs7KxSNXYupuLiYoihnZ+dG7v8Mwqtb+yE2s+LPuJyTiUUVagoAQ4l7pP3613AUeFhLpgS5RgbYN+BiYxhm27ZtBw4cqK6uJgjC19d3wYIF/v7+hq+EtLSNGzfeunWLYRiZTDZkyJA5c+ZQFDV9+nSSJFEUJQhi1KhRkyZNqiNPJ0+eXLdu3W+//WZhYXH27NkPPvhAKBROmTLllVdeqb3bzp07z5w5s3Hjxsaom1arHTZs2Icffjho0KBG3ocrV66sW7du27ZtUim/Wnr98GZ8+yHIwzLIwzK1pOaPqzknk4rTSlQEhqLtyJCDEKFYlkDR3u6W4wOdn+vqoBA3lKCr1WoXL1584sSJOXPmhIaGKpXKP//88/Dhw/7+/nfv3p0wYYK/v/9bb73l5OR0/fr1ffv2DRs2zN7e/sCBA2+++WZgYOCdO3fmz5+vUqlee+212s1SFFVeXs6yLIIg27Zt69Gjx7p16+4/9fr165cuXdoYaTNUuRUIPvroo4CAgMbfjaCgIJ1O9/vvv9fpHo8JXt3aGz62so+eC5jex/1YQuGOuNyMUjXFsMTT7JKDRucaAhGxAAv2tH4h2D3Ex1ohfvgKH9HR0du3bz9x4kRwcDC3ZdCgQZWVlQiCfP75505OTjt27BAKhQiCdOvWbeLEiSiKkiQplUojIyMHDhw4fvz4oqKiXbt2vfrqqwCAbdu2nTlzxs/Pz8HBQSgUQgh37twZHR3t4uKycuXKyZMne3n9Ozn/8uXLNE337duXU8Nt27YFBAScPn06OTn5ueeemzhx4q+//nrq1Clvb+833njDwsKCZdm0tDRXV1dbW9vi4uLvvvsuPT1dJBKFhIS88MILAAClUrl9+/a4uDihUDh8+PCxY8fiOB4ZGXno0KGZM2cSBL/eST3w6tY+8bCWzB7gPa2326HbhaeSim/kKguUWgxFcbTx/qVWBhrXYqMYiKMgwEHey91yZFfHnu6WjU/yO3bsWKdOnUzSxmFhYZGdnX3jxo3Fixdz0sbBueT0er3BX/P/e0SSJI7jKIp++umnf/zxx5w5c2pqatavXy+VSlEUNTc3F4vFZmZmtra2dfTl4MGD3t7e1taG6C1N0+vWrTMzM5s4cWKnTp3ef//9ffv2OTs79+3bd+vWrVVVVV9//TVN02vXrnVxcXFzc1uwYAFFUWPHjq2pqSksLGQYRqfTTZw4kaKoiRMnajSazMxMmqZxHA8PD//mm2/u3bv3SEbfswOvbu0ZmYiYHOQ6qZdrQkFVbFbFoduFd/Or1CTNQoRoq8EHaFyFjWZYAY6ZiwUD/WwiO9r1cLN0UIgerR0IMzMzORdbHcrKylQqla9vPQXnAQAMw+zatSsxMTE5OfnAgQMbNmwoLy/ftWvXihUrxo0bxx1+7tw5BEGGDBni6+sbGBg4a9asOu1kZmZ26NDB1KZOp5s1a9aiRYsQBLl3715KSspff/0FAHBycvrggw9IkgQA4DiOYRhJkqmpqW+//faUKVNMre3bty83N/fMmTP29v8scMK5y52cnDQaTX5+Pq9u9cKrW/sHAKSTk6KTk+KFYLd7xTWH7hTGZJTfK1aVqfQYMEzLN8ic4b9Ww/CkQoSBkFvrydXSzMdWOriDbUQHO3uFuGkdAwCIxWKVSnX/WwRBYBhW71tc+DIxMVGpVJqZmf3222/Dhg27evVqZWXlgAEDuB1CQkKio6NNO9M0fX8jNE2LRP/IMYRQIpGYxM7W1lYikXDmoVwuJ0mSpmkUNYSAGIYxMzObOnXqRx99tHXr1rCwsOeff97X1/fKlSsBAQEmaTNZl6gRiqKadIfaP7y6PUMQGBrgqAhwVNTo6JSi6pTimpjMimtZFSU1epJmKcZQb/AfsWt5oFHOGBZCCAU4ZkagnjaSft7WPVwtvG2lXjbSx+9G7969V65cqdPpTELD4enpaWdnd+HChaFDh97XK0gQxPLly/v372/aiGGG6IxOp+Ne6vX6h2YaCIXC2uoJwL/JCbWPhRDe7yl46623Bg8efPfu3b/++mvXrl2XLl0Si8UkSd5/FsaIWMxPpK0fXt2eRWQivKe7ZU93yylBblqKSSqsismouJ5TmV2hKazSVahJCCFqlDnUZNX9+09T7LL//26QMxYaUtUkQtxRLrKVCT2tpb08LPp4WjmZmzXvGnbDhg1bv379hx9++N5775mbG1Z2u3XrVkVFRVhY2JQpU7788svw8HAuA0Ov1x8/frxnz55SqRRCaBIyDi8vLwcHh927dy9cuJBl2X379pl2MGhzfUrXtWvX27dvsyzLGWV1FK3OS9MvAACKoqqrq7sZCQoKGjx4cHZ29nPPPTdz5szY2NigoCDDsqZqtVgsRlE0OTnZ0tLS09OzGW9ae4JXt2caABAzARboZhnoZmmY+aDUFlRpi6r0qcU1aaWq9FJVvlKro1ijJHHCZLS2jDIHalkddZ5v7vFFAcAAQFHEYBIafgEWZgIfW6mPndTXVuZkIbaXi+zkosZEP5uGp6fnjz/+uHDhwpiYGA8PD71en5CQMG/evLCwsNmzZxcUFMyePbtjx47m5uYFBQXV1dV79+4FABAEUceesrCweOONN95///2kpCS1Wp2TkyOXy7l9OGfZ/aceOXLkvn378vPzXVxcuN1MbWJGuN85dxv3O26kurp6/vz5KIra2dndvn07KCjI29vb398/Kirq5Zdf7t+/v0ajsbOz+/zzz1EUPXHiRMeOHV1dXVvoBj7t8Nm8PA9OLmNYLcXkVmgKqnSVGn2lmqpQkxUaslpLaUhGQ9I0C8H/A4z/PLsAwQAQCzCpkDA3I6ylQisJYSURWkoEDuYGORPiTzo3Ra1Wnz17NjU1VSaThYSE+Pj4cPYU5/s/efKkRqPx8vIKCQkxNzenafry5cudO3e2tDTIfW3u3Llz9uxZLy+v7t27FxYWdunShSCI27dvy2QyDw+POjszDDN+/Pjhw4e/+uqrLMvGxsb6+PhYWVkhCJKamsqyrJ+fH4IglZWVycnJvXv3NiRjG/extLS8c+dOXFycSqXy8vIaNGiQmZkZ1+bVq1djYmLEYnFoaKi/v391dfXo0aPfeuutESNGPJEb+fTBqxtPU6BZqCFpxqBu//i4TeqGAmBmSCNuiwHZJ8nFixf37NmzevVqgaBF1gQ+d+7c/v37v/zyy0YmDD+D8OrGw9NS6PV6gUDQQhmGFEVx4Y6WaLx9wKsbDw9P+4QXfh4envYJr248PDztE17deHh42ie8uvHw8LRPeHXj4eFpn/DqxsPD0z7h1Y2Hh6d9wqsbDw9P+4RXNx4envYJr248PDztE17deHh42ie8uvHw8LRPeHXj4eFpn/DqxsPD0z7h1Y2Hh6d9wqsbDw9P+4RXN54nAUmSVVVVXKV3Hp4nA18Tq6U4cuTI9u3b9Xo9y7IAAF9f39GjR/ft2xd5xrh79+7WrVvj4uJIkhQIBP7+/i+++GLfvn0fumR2RUVFYmJip06duGJ9PDyPCm+7tRR37tz566+/cnJyaJrWaDR//fVXaGjo2rVrn52l3iGEK1euDAwMPHjwoKen5+DBgzt16nTjxo3IyMgTJ0489PDY2NghQ4bcvHnziXSWpx3C224tBYZhBEF88803nL127969CRMmrF69+rnnnvPx8TGUlaJphmEAAA+qmaTX61EUJQii3qLlEEKSJB90ODcGxDDMVC7zfkxtkqShPLNQKHxQN7ji6g9qRK/Xc7U467y1c+fOZcuWjRw5cu3ate7u7tzGqqqqXbt21TbcGIahafr+UzAMQ5IkwzD1Xn4DvaKNCIXCB5VredCxprNwdx5F0XrLTTEMw5ehejrgKmPzNDtr1qwhCOLMmTOmLStWrEAQ5OjRo6WlpR9++GFISIi7u3vHjh0XLFiQmJhY+9jbt2/PnDnT3d29e/fumzZtOnr06AsvvFBRUWHa4dChQxMmTOAO/+CDD3JyckxvnT17duLEiV5eXu7u7v3791+7dq1er7+/eykpKa+//vrRo0dXr17dsWNHLy+vRYsWZWZm1t4nOjp6zpw53t7eXl5ec+bMuXnzpumt1atXr1ix4uLFi6NHj3Zzc/v888/rtK/VakNCQlxdXWv3zQTDMBDC0tLSzz//PCwszN3d3c/P7/XXX79x4wa3w8WLF/v16wcACAkJGTdu3NixY69fv869dfr06enTp3t6evr5+S1evDg1NdXULEmSP/30U79+/VxdXceOHXv+/PkPP/zwm2++qX3VS5Ys8fPz8/DweOmlly5evGh66+TJk/Pnz79y5cqiRYu8vb2nTJmyZcuWefPm5eXl1e75d999N3/+/HpvKU9bg1e3llW3c+fOmba8//77CIKcPXv2woULQUFBn3zyyU8//fTpp5+6uroGBARkZGRwuyUlJXl6erq6un755ZcbN27kCgwjCJKbm8vtsGHDBqFQGBUV9eOPP3766ad2dnbBwcGc9t26dcvOzm7AgAHff//9zz///O6777700kulpaX3d+/ixYtSqdTDw6N///6bN29evny5QqHo2bNneXk5t8OxY8esrKx69eq1fv36DRs2dOnSxcnJKSEhgXt32LBhUqm0Y8eOr7zyyqpVq3bv3l2n/WvXrkml0qlTpzZwi86fP9+vX79ly5Zt27btiy++8PX1dXV1TUpKghAmJiZOmzYNRdEZM2asWLHik08+4VTs119/lUgkgwYN+u6779asWePh4dGxY0eTAK1evRpBkHHjxm3fvv3NN9/s2LGjRCKZOHEi9256erq3t7e1tfWnn3767bffdunSRaFQHD9+nHv3m2++EYlE3t7ew4YN++KLL7Zs2XLkyBEEQX766SdThysqKszNzV966SVOnXnaOLy6tRRr1qzBcfzQoUNqtVqpVJ4/f97b29vDw4PzxHGDQY6MjAyxWPztt99yLxcvXiwUCm/fvs29LCoq8vDwEAgE3DOckJBga2s7e/Zs0+GXLl2Sy+UbN26EEG7atAlBkKKiItO7FEWxLHt/9y5fviwUCrt27VpQUMBtOXDgAEEQX375JYSwqqoqMDBwwIAB1dXV3Lu5ubleXl4zZ87kXo4ePRpF0Z9//vlBl79v3z4EQTg/44MgSbK2EVRcXKxQKD799FPu5fHjx3EcP3/+vGmHnJwcT0/P559/nqIobsudO3dsbW2XLVvGiZezs/PEiRNN0rNx40YEQV544QXu5bx580Qiken7Jicnx8fHp3///jqdDkL4/fffIwjy0ksvmRqnaTo0NLRfv340TXNbfvjhB4FAcPbs2QYuiqftwEcVWgoURRmGWbx4cYSRsWPHlpWVLV++3MXFhSuyGxcXt3Xr1k2bNh05ckQmk924cYMrwXvixImwsLDOnTtz7djZ2Y0dO5aiKO5ldHR0aWnptGnTampqqo34+/v7+voePXoUQRBbW1sEQb755pvc3FySJA2OVRyv1/1k+NujaFRUlIODA7eFOynn779161ZSUtKECRMAANxZLCwsevXqdfXq1crKSq6fnp6ew4YNe9Dlc640kUjUwC0iCALH8Rs3bvz000+bNm3avXu3lZVVfHw8F3jhWuD+5YiLi8vOzp48ebJWq+V6xZm9p0+fRhAkKSmpsLBw8uTJJqdeZGSkvb0914JSqbx48WKfPn369+/Pvevi4jJ69OiEhITExEQEQViWFQqFU6dONTkQMQx76aWXoqOjr1+/zjnj/vjjj8DAwN69ez/iZ4GndeCjCi0F56Lu0qWLm5sbAGDWrFlDhgxxdXVFECQlJeXVV19NT093cXGRSCScl0qr1XIPc05OTkhISO2mPD09TQ5vzjU2ceJE07sAAKVS6eTkhCDIkCFD5s+f/8MPP6xcuTIgIGDUqFHTpk3z8/Ort4cCgcDX19f0UiqV2tnZFRYWMgxTWlqq0WhWrFjxxRdfmHZQq9VeXl5qtdrCwoJlWWtr6wZyNcRiMYIgpaWlDdyirKysWbNm3b59283NTSqVQgiVSqVOp2NZtl63fW5uLsMwc+bMqf1uTU1Nz549GYYpLy9nGMbT09P0lpWVlZ2dHcuyXH6JUqns2bNn7WM7duxYU1NTVlbGqZtcLq9zRZGRkZ6enlu2bOnVq1eckS+//JK7NJ62D69uLQWEEMOwBQsW1MlxY1n2008/zczM/OuvvzjHEE3TQUFB3EMIABCLxSqVqvYhtV9yhsnGjRtrP4cQQmtrawRBZDLZhg0bXnzxxYSEhPPnz3/11VeHDh3au3evh4dHvT2sk17LMAwXK+SUdPHixb169aq9v0wms7Gx4X7nevugy/f09LS2to6Ojr4/3Gniq6++unbt2p49ezp37iyTyViWjYiI4IKk9cIJ0xdffGGKwHI9sbCwMEWHa98rvV6v1Wq5s2MYBgCoc716vR4AYNI7YKT2Dg4ODsOHDz948GBBQcGhQ4cEAsH48eMf1D2etgavbi3L/dn5JEmeO3cuKirKNEQqKSlJT0/v1q0bl6bQr1+/s2fPqtVqiUTC7XDq1CkcxzlB6datG4qiEMLQ0NAHnbSHkRdeeCEqKmrMmDHXrl27X924Rz0uLu7VV1/lthQWFqalpQUHBwMAPDw8LCwslEplA2dpGD8/v0GDBh05cuT8+fMDBw6s/RZFUdXV1QqF4vz58+Hh4WFhYdz2ioqKhISEPn36PKjNjh07EgSh1Wrr7ZW3t7dcLj916pSphaSkpOzs7KCgIE6n3NzcEhISNBqNmZkZt8Ply5ft7e3rlX4Ts2bN+vHHH3/55Zft27e/8MILnLjzPBXwfrcWpN7EXQzDXF1dL1++XFJSwo2n3nvvPc6I4MyciRMnZmdnL168uLCwsKKiYuXKlVeuXDE5g0JCQrp27frWW2/FxcVRFMUwjF6vj4+Pj42NRRDk6tWrN27cIEmSZVmapouKihAEUSgU9XYPw7C///779OnTXJTju+++y8jI4Ma8AQEBERER69evP3jwIJd0RpJkcnJy7SzchtOSAQAffPCBTCabPn36rl27ampqSJLU6XSXLl2aNGnSuXPnuPsQGxubl5fHMEx1dfWyZcuUSqXJerK2thaJRJcvX1ar1RqNhmGYoKCg/v37f/TRR+fPn+d6pdfrb926deHCBQRBOnfuHBISsnbt2r///lutVsfHxy9fvpwkSc7aFQgE48aNu3Xr1vfff0+SJE3TR48e3bNnz6BBg9zc3Bq4oo4dO0ZERKxataq6upo33J4yWjus0W7hPFanTp26/629e/daWVk5ODgMHjzY09Nz5MiRPj4+48eP54KbDMOsXLnSyclJLBbb2dkNHTp00aJFAIDCwkLu8Pj4+KCgIDMzsx49eoSFhXl4eFhZWf32228QwnXr1gmFQn9//8jIyO7du5uZmc2bN0+j0dzfh0uXLllbW48dO5aLG3bo0EEikSxZssQUcCwoKBg1apRcLvf39x88eDA3iH7nnXe4d8PDwwMDA2tHfuslOjp64MCBZmZmtra2nTt35vyMwcHBd+7cgRCeOHHCzs7O2tp68ODBPj4+ERER3bt3Hzx4MBejVKvVs2bNsrS0VCgUNjY2p0+f5hLWwsLCzMzMunTpMmjQIB8fH4VCsW7dOu50aWlp4eHhEolEoVC4u7u/+eabnTt3njx5MveuTqd77bXXZDJZQEBA7969hULhkCFD8vPzuXc3bNhgbm5+7dq1+6/i77//RlE0PDy83jvJ02Yx2AutLbDtk7S0tKSkpD59+nAesTpcu3bt/PnzWq22Q4cOERERt2/fFolEPXv2NO2QmJiYmpoqkUj69+//8ccfb9myJTs72zRWraiouHLlyu3btymKcnJy8vPz69Gjh0QiKSkpuXbtWnp6emlpqbm5edeuXUNCQuqdzHD58uWoqKiNGzd27Njx5MmTJEkGBwcPHDiwttNdp9PFxMTExcWpVCobGxtfX98ePXpwlxMTE0NRVL9+/R46XVSlUsXExCQkJCiVSoVCERAQEBQUZDInb926dfbs2ZqaGl9f3yFDhty7d49lWW50jCCIRqO5efNmSUkJhLBv3752dnZcGIGLY+r1ejs7O19f3549e8rlcq5BvV5/5cqVqqoqT09Pc3Pz0NDQSZMmmWIjFEVduXIlOjqaYZjOnTsPHDjQdGBmZua9e/eCg4PvN3W5EfSGDRtmz57diL88T5uhteWVpy56vb52fvzdu3ft7e2nT59eb9pak7l06ZJCoeAsvnZDWVmZUqk0vfzkk08QBLl06dJjNjtjxgw7O7vac0V4ngr4qEKbQ61Wv/HGG0ql0sPDo6qq6urVq1Kp9I033mggQNkEWJbVaDSmNLr2wcWLFz/77DNvb2+JRJKWlhYbG/vKK69wUYUmQNP0F198cfXq1WPHjq1Zs8bCwqK5+8vTsvBRhTaHXC6fMmWKq6trcXGxXq+fPXv22bNne/To0bxnsbGxmThxYsPhwqeOoKCg5557jmGY4uJiV1fXnTt3btq0iVuGoAlACLlB8fr16+fMmdPcneVpcXi/Gw8PT/uEt914eHjaJ7y68fDwtE94dePh4Wmf8OrGw8PTPuHVjYeHp33CqxsPD0/7hFc3Hh6e9gmvbjw8PO0TXt14eHjaJ7y68fDwtE94dePh4Wmf8OrGw8PTPuHVjYeHp33CqxsPD0/7hFc3Hh6e9gmvbjw8PO0TXt14eHjaJ7y68fA8MvyK1k8FvLrxPJUUFhbu3r07Pj7etEWj0Rw7duzUqVN6vb5FT52bm/v2228XFha26Fl4Hh9e3XieSq5evTphwoT58+fX1NRwW2JiYoYNGzZ//vzKysoWPXVVVdWRI0dM5+Vps/AV/3ieSgAAtra2er0+JiYmIiICQZC9e/d27dpVIpFwpRGrqqoSExPLysqsrKwCAwOFQiGCINXV1cXFxQ4ODrGxsVwNLalUiiBIQUEBy7LOzs5cjeqsrCwPDw+hUKhSqZKSkoqLi+VyeWBgIFctGwBAEAR3Fr1eHx8fX1ZWplAoOnbsaGNj09o3hudfeHXjeSqBECoUisjIyH379kVERJSVlcXHxw8fPvzChQucU+yrr766dOmSlZVVdna2r6/vDz/8IJFIrl279u677/r6+iqVyuzsbH9//+3bt4tEos2bN2u1Wq5kfV5e3muvvbZt2zYvL6/t27fv2rXLxsYmNzfXycnpm2++cXBw4DqAoihFUW+//XZcXJy7u3t5efmwYcPefPPN1r4xPP/Cj0x5nkoghACAqKiouLi46urq/fv3u7m59ejRgyRJboc5c+acOHFi165dx48fz87O3rt3L2eXXbt2LSoqavfu3Tt37rx9+/a5c+c4Q0+pVHIHUhRVXFzM1bGeMGHC8ePHd+7cef78+aqqql27dpk6QBBEQkLC/v37d+/evWPHjsOHD8+cOZOPNrQpeNvt0SBJkqIolmVRFOXGKTytBUmS3bp1c3Z23rVr14kTJ6KiokQikUlfMAzbsGFDeno6giBFRUV3797lNNHDw2PUqFFCodDf39/T0zMlJWXo0KGoEe5AAACGYdzAkyCIbdu23blzB0JYWlqakJBgOjvDMLa2tlZWVu++++6oUaMGDBjAD0vbGrzt9mjMmTOnS5cuQ4cOHTBgwJQpU2p/3Otw4cKFH3/8sWlnSU5OXrdunVqtfoyetn8ghGKxePz48Z988klWVtbo0aM5ww3DsJqamqlTp16/fj04ODgyMtLR0dFk00mlUpMCAvBvtXJOzrhfOBiGefnll48cORIUFBQREeHt7W1qBEEQmqYdHR1/+eUXuVz+448/9unT57vvvuNttzYFr26PRl5eXmBg4LfffvvVV18VFhYuXLiQ0yCKojQaDcuy3G4QwtjY2J07dzJGTB96iqK0Wm3tBrm3aJo25TFACNPS0n799dfq6urax2o0Gp1Oh7QBGMhQLEUyZK0fPfejN/xL0iz9ZJ5zkiSHDx8ul8sHDRokk8m4+08QRFJSUkpKyg8//PDCCy+MHDkSRdHaf5r72xEKhaaRaakRHMcrKytjY2NXrlw5Y8aMMWPG1NuBLl26bNy48cSJEwsXLly1alUb+QPxcPAj00cDAODm5ta9e3cEQZYuXTpr1qz09PTo6Ohjx46p1WqZTDZv3rywsLCMjIwDBw5kZGS8/PLLDg4Ob731lkKh+OOPP3bu3EmSZMeOHRcvXuzs7KxUKj/99NOAgICTJ09mZ2dHRUW98cYbarX6jz/+yM7Ofuutt6ysrN58802apj///PPCwkIAQK9evd59912xWPwELrZCV6HUVagolYpU1ZA1FdryMm1Zua6sTFNWqSunWINnCnJqYfjX8H8WYQmUUAjNrURWlmIrC5GlpcjSQmRhRkgkhNRCaG4nsScwweP3jWVZkiRZljU3N4+Pj8dx3LSRpml7e3uxWPzNN9/06dPnzJkzV69e7datm2kHUyMURTEMgyBI//79t27d+scff5ibm//444/V1dUQQolEYm5u/vPPP3PevVOnTnEaByEkSRLH8Xv37h04cKBbt24ikSgpKcnb2xvDsMe/NJ7mgle3R4Z7Hrjxo0AgEIlEcrl8/vz5FhYWly5dWrhw4d69e62srLp27arT6aZMmSKRSKRS6datW7///vvly5fb2Nj88MMP8+fP37NnD03TmzZtCgsLW7BggVarnTt3ro+PT1RUVK9evW7cuDFmzBhra2uFQjFz5kxHR8dPP/1UrVZXVlbSNN0S18VClmKpEnXxvcqU5PLEzKqMQlWhUl+pIlVqSqWltYAbtCEANf6L/H8odz9GyTP8AxGWhRBFgBg3kwgk5kILWzM7J5mTt4Wvj4Wvl7m3VCATNEnsPDw8XnjhBU7UuGwPBEG8vLwmTJggEAisra3Xrl37/fffx8TEhISErFy50t7eHkEQNze3iRMnckchCDJixIiOHTsiCBIWFvbRRx9t3brVzs5u3Lhx3bp1k0gkYrF406ZN69evX7t2bffu3b/++mvuKAsLi4kTJ8rlcr1en5WVdfHiRQCAi4vLpk2bBIJmEG6e5uJfvwNPY4iKisrJyQkPDy8sLDx79uycOXM+/PBDBEHu3btXUFBAkuTs2bNXrlz5/PPPb9y48dixYwcPHuQGUIGBga+88sr06dMhhAkJCTNmzDh+/LiVlZW3t/fOnTvDw8MRBJk7dy6Kot98882ZM2c+/PDDo0ePymQyhmFCQkIGDx48b948Ozu7Zr+inOrsdGV6RmVqckVyamVKiaaYYimKoWhIowiKAsMPJ2qPcxYIIYuwEEIGGr4bCJQgUEKIi5xkzn4W/j6Wfh2tOnqYe5kLzZv3e4imaZP2PRSKolAUrWN/sSxLUVQDjXAmpEgkeuz+8jQzvO32aEAI5XK5s7Ozh4fHrFmzQkNDKYpauHBhQkKCm5sbQRBVVVWc84WmaZOvR6PRZGdn//XXXydPnuTGNQKBQKlUWlpaWllZWVtbc7spFIqSkhLuMWNZVqfTyWQyDMM++uij99577+jRo05OTq+++uqIESNMLvCmQbN0viovOv9ybGFMemVqdnU2zVIYihu0DEERgOAojjfrZ8MQiEQwQ8vGZiECaUhTZE1yWWJC6R0WMuZCSw9zz45WAb0dg3vY9ZIL5Sh4XKcwZqTx+xMEcf9GFEUb1kfeXmuz8Or2aLAsGxwcXDtp88yZMxcuXNi7d6+XlxfLsjExMZyo1TaKcRyXyWRvvvlmREQEhJB7YAiCKC0trb0nl8Nl2mLKUYiMjAwLC0tJSdm1a9fcuXMdHBwCAwOb0PlKXUW6Mv1m8fUr+ZeSKxJ1tI5iKQxgGIrh6BP9JHCWIGcRGlQPQTS0+lbJjVslN/bc22kuNO9q26OfU38/K39fS38CrUd0eHgeCq9ujwbDMFyepwmtVgshJAiCpumjR48mJCRwCmVpaVlaWlpQUKBQKMRi8ZAhQ37++edBgwYpFAqKotLS0vz9/TkTz6RuLMtyTj0LC4vy8vLc3FxOBNPS0jw9PTt16mRtbb1ly5aqqqpH6zNkUitSjmYculZ0LVOZXk1W4yiOAUNKlxBr7KitpUEByjngIAIrdBWnso+dyDpqI7bpaB0Q6hIW7jbEUmzV2n3kecrg1e3RcHBwsLL6z2M2aNAgHx+fyZMnOzg4YBgWFhbGZfkOHTp09+7d48aN8/PzW7Vq1eeff/7WW2+NGDHCycmpurpaJpPt2LEDwzBXV1fTwMfS0pJTxm7dugUHB8+ePdve3v6jjz5as2ZNYWGhra1tfn7+888/37t370b2llJXHy04fTzzyPXieA2tgRDiKC7C27SHiItdoMCgdJX6yvO55y7nX9p86/sBLgMj3Id1te3WxvvP03bgowqPRk5OjlAorOPdV6vV169fZ1m2e/fu1dXVUqnU3NzgHddqtZmZmSiKclOyGYa5detWWVmZXC738fGxsrKiaTorK8vZ2ZnzSZeUlDAMw81kpGk6PT2dpmkPDw+VSpWWlqZSqWxsbLp06dIYXxKsrIQpKVRezjzy9yu6BBEqekxXXSvChV8plpIQ0i42XYd6Dh/sFqFo1vgDT7uEV7f2BltcDJMSYVYWotPhQHBUlv0OvYeAwGAVPeWwkKVZCkcJR4njaN9xQz1HOMtcWrtTPG0XXt3aCxDCkhI24S7MyUV0WgRFEQAwCMr+x95ZQEdxdXF83si6xd09ECBCcIfi7m6FAqV4cae4Q3Epbi1SXANBE7QQnBB3T9Z35H1nM/22aZAigYRkfu3hZGdnZ2ZnZv9z331XBPRPxLGn+ngeKCdeCIhABhpdlG4Kj47eXdp7dSrZOBKOckMFVbfMzMz79+8rlUqFQuHt7e3k5PTWgZvBYNi4cWPbtm3d3NyQMgyTkQEfPYQJCYjBwOqa6S0c8NeIbm2jrhGwvGXdkQwJEMRN7t7Lv28T1+bmAvPSPiKOskVFVLe7d+/++OOPGIZZWFhkZGQ4Ojpu3LjxrQUeNBpN27Ztf/nll1q1aiFlElhQwDx6BF9HI9q/7bViK2AQSZTRPcgtesbwmRG5ZROKoQBA/C0Cuvn2bO7Wkptz4Ki46kbTdOfOnXk83q5duwiC0Ov1SUlJ9vb2bI1WBEFev36t0WgcHBzMzc0hhGlpaebm5qZpzYSEhPz8fA8PD5FIxG6toKDAzMwsJSUlNzfXy8uraGxnQUFBXFycWCx2cXExZf+kpKRkZWW5urrKZLLP+SJQp2OeP4OPHyNKJYKhyDtiXwGCQBSbIQ0/pblTbganxYAIJGkSQ7HKllWGVh1ez6lBaR8RR5mgwqmbTqdrVMiCBQuKvZWSkjJlypRXr17hOC4UCjdt2mRnZ9enT59JkyaFhIRoNJqZM2fevHkTRVGBQDB37tzatWsnJCRMmjTJz8/v2rVr2dnZ7u7umzZtYkNG9uzZs3nzZmPuEU136NBh4sSJFEX98ssv58+fxzAMRdEpU6a0aNHi074FTEpk7t+HKSlvtdeKgQM8TJAwnjmMQlguzTcWY/4DQ4lxUTuvTt9XHWYp/DsDhKPCUj4f5u9BIBC0b99+4cKFaWlpDRo08PPzq169OgDAYDCMHTs2Ly9v7969FhYWsbGxEomEoqh79+6x0bPz58+/c+fOrl277O3tN27cOGHChHPnzlEUde3aNYZhdu7cqdfru3btunXr1kmTJoWHh0+cOHHp0qVt27ZVq9VsTsLatWtPnTq1bds2Nrd06tSp/v7+zs7OH3X8UKVioh7Bp08RikI+LM2IYagQxqkq4XJPH80H5TbuHyCAQAkdrd/7dNed1Mhh1X5s6vod+Ox0Lo5vl4p47ceOHbt582adTjdr1qx27dr99NNPOp0uJibm7t278+fPd3Nzk8lkVatWtbS0hBDyeDyCIFQq1cWLFxs3bqxWq58/fx4cHBwXF/fo0SOCIGQy2ahRo+zt7d3c3OrXrx8VFYUgyIkTJ2rWrNm7d2+ZTGZnZ1elShWtVnvq1KnatWuzxUV8fX0zMjIePHjwUUcOY2PpM6fho0cITRuttg+DAYjMgNZHPDEUY+sUlWNQgPIx/uu86GnXJv1yc3aqKqW0j4ij1KhwthtbMKd7ITqd7sKFC127dm3WrJm9vb1Go/Hw8HhzfRRF8wu5evXq48ePGYZh66zJ5XKapjEMMzMzY9fk8XjsSD8hIYFNtDKhVCrz8vLu3r2bmprKplsFBgYWS3t4H3o9fec2fP78w022ojAM2Ybx3wVuFkBNuR2aFgFHcYqhfn9x8HZq5PDAkd+5tfzKibQcZYEKfckFAkHbtm3d3d1jYmICAgJEItHLly/fzHOCECoUCqlU2q9fv/79+xd96+XLl8US5tm/XV1dixUll8vlEomkZcuWkyZN+tjj1N2KoG7dFEglRufSJ9VHZABiqUWbyqoe1Fwrx4PTNxNXE5UJs65Pu5t2Z0zIBBn/s6ZxOL45Kpy66fX6X3/91dnZ2d/fHwBw+fLl5ORkf39/d3f3hg0bTp48eenSpZaWlgkJCf7+/kKhkKIokiTFYnH79u2XL1/u5OTk5eWVm5ubmJhYr149FEWLpsGzdcYRBOnSpUvHjh03bdrUtGlTtVqt0+lCQ0N79OixatWqypUrBwQEqFSq169fV69ena2q+C4gSWr278/7ZQFCUej3g/g2NpD5u3bmx4JCtKnB9SR2tzBMrCIYcEZwFKch/fuLA/EFsZNqTPc29yntI+KokOqm1+sPHTp06dIliqJsbGxatWrVpEmTEt8LQRAoii5fvpydzZRIJKGhoQ8ePGjevPmiRYvmzZs3YsQIPp+vUCjWrVsnlUqDgoLkcjmCIOPHj2dLrbFj1cDAwPr16wuFwsDAQLFYnJiYyOPx3Nzc2IzR0NDQjRs3rly5cseOHQRBdOrUKTQ09PvvvydJcsmSJWxLLR8fn5CQkPccKpObmzd/vmb/QVhYjFd54RLerQvGI+D/y8Z9FAykqjH2VQnXm/pnFcR8K+qJu5MaOS7sp4k1ptZ3aljaR8RRwSJCGIYZNWrU5cuXe/fuLZfLnzx5olAo5s2b9+UK1Wu1WpIkhULh9OnTs7Ozt27dyi5XqVTs8rdWW9VoNHq9vui7JEkSBPH999/b2NjMnz//zfUZhhGJRKZibTqdTqvVYhgmFovf8+3Ily9zJ0zU37gBeDx2AgGSlKhJI3mzJsYphU8Ch9gfsuiFhpOgTFzzrw3JkBKe9PsqP/Sp1J+rGVcRKCu2W0FBwb59+3bv3t26dWt2iV6vR1GUpumIiAg3N7dbt27Fx8e3atWqqLf++vXrkZGRdnZ27du3N3UXzcnJOXPmTGpqqoeHR/PmzdmwWxPJycnnzp3Lz8+3s7Nr1qwZG1LL4/GioqIuXbrk7Ozctm1bU2RvUlLSqVOn9Hp98+bNfXyMgxpRIeHh4Xfv3nVycmrbtq1QKExMTHz+/HlGRsaff/5pbW1dq1at7Ozs06dPZ2ZmWllZNWnSxLRB1tn3n1Wq9bfv5I4bRz5/AYqsCXBMe/MW39VF6O3FWnMfCwOYJqT7BlSSSyuNFXgrGARKaEnNmnsrkpVJI4PHcNmp5Z6yEhGCYRiO43fu3GFDw9iZTQCATqcbOnRo586dT58+/ejRo7Zt2x4/fpy1mH788cexY8fGxMTs27evXbt2qampbJZVo0aN9u/fHx8fv3fv3lu3bhXdS0JCQocOHc6dO5eUlHTs2DG2DzmO49euXZs9e/aTJ09mzZo1ZswY1p49efJk69atr1+/HhUV1bVr18OHD7OW1+DBgydNmhQbG7t9+/YuXbrk5OTExsYmJSXFxsYePXo0MjIyOzu7c+fOf/zxR0pKyunTp0+dOvVRp0Jz7M/s74cYpa1YwWsAoF6vPHOWzM79tLkFiECFHuvIr26AX6TvTNmHLa1+8Pm+cZd+is+PK+3D4agYtptEIpk9e/acOXNOnTpla2vbvHnzfv36yWQyAEBaWlrTpk1Xr16NIMjcuXMXLlzYtm3bS5cuhYeHnzx50tXVla3N/fvvv//000+//PJLtWrVtm7dytbI12g0RfcSHh4OANi1axebWcW2FoUQajSadevW2draXrx4cfDgwXPnzpVKpbNnz/7hhx9GjBiBIMjWrVuXL1/esWPHkydP3r9//+zZszY2NhRFNWrU6OjRo4MHD27UqJGNjc2iRYsQBLl8+XJGRsbBgwfZMnDFGpi+H9WePfmz5zBKVXFpKwRgGJWaprxw0axLR2OKwkd6FWChJ6KO3uEQIVeRqs9vXPAtwlYkvpsWOTl8/Nx6C73MvEv7iDjKu7oBAEaMGNGqVasLFy5ERkauWrXqzz//PHnyJIIgUqm0TZs27GotW7bcsmVLQUHBxYsXKYras2ePXq9no21v374dFxcXHR29du1aU/uPYsPS0NBQtVrduXPn1q1bh4aGst0JaJpu2LChqSOcRCLJycnJyMiIjY19/Pjx7Nmz2fHso0ePtFrthQsXaJreunWrTqfDcVyj0URERAwePJhtv8Tuxc/PTygU9uzZs3379tWrV2cjeP8bhilYt065dDnU68H/k1LfcqIwTPcoSuXiLKlVwxj79pHQkA6gbQMJpzDwmF9mLPevDw/jP8l6POnKuEUNlnmb/ysykaPcULbub1dX1yFDhmzdunXTpk0PHjy4ffs2O2I1ed9xHGeDMLRarUwmc3JycnR0tLa2Hjx48KhRo9hWUu/xavn4+Bw6dKhJkyanTp3q2rXrjh07WNvNpIZsSxfW6OPz+fb29o6Ojra2tqGhoZs3b+bz+RqNRiaTOTg4sMtHjhz5/fffF234giCIra3toUOHOnfufPXq1Z49e7Lzs+//4pBhClasKli4GJIk8m5pMwIAgIz60mV9XPx7RPCdOwIIridbYpV5gCj3eQvvh4fxonNfTbn685Osx6V9LBzl2najaTo7O9va2pp9aW5ujuM4hBDDsLy8vPv37zdu3BhBkEePHrEdwkNCQm7dutWtW7eiXdk1Go2Njc3Zs2ffVbCIoqhKhYwdO3bSpEm7d+8eMGCAUS7+rT4Mw3h5eQkEgkqVKrHtx00EBwe/evWqX79+pjlQFgCAqZsMRVEeHh4/FrJmzZq9e/f+8MMPRScWigFJKn/+fNWGjca50Q/Jr8IwqFIqz57H+/TCRELkIwNEGISpp3e0xyySqExjDz6kogvcpCvjFjZYFmBVpbQPh6OcqptOp+vSpUtAQEClSpXy8/OPHj3q7+9fo0YNkiTlcvnOnTvZNrrr168fMWIEhmFdunQ5ePBg+/btO3bsyOfzIyMjO3bs2KJFi59++mn8+PF6vd7f3//169fNmzcvOjA8c+bM+fPng4KCaJq+du0a2yOZpmlT41E2CI5hGDZ7dOrUqVFRUe7u7rGxsQaDYfbs2f369Tt+/Hjbtm3btWuH4/jNmzf79evXoEGDGjVqrF+/fvLkyUFBQXZ2dvv37w8MDCQI4vjx48HBwUUl+E2Ua9YoN2wEGPaf1T7+AcfJuDjllXBFqxaFRY4+4lQzABGRaEdB8AryFFYhXW9FIVAisSB+6tWf59VdWM0mqLQPh6M8xrtBCE+dOnXt2rX09HQURUNCQnr06GFubq5SqUJDQydNmhQTExMXF9e6desuXbqwdlN+fv6BAwciIyMxDPPw8OjVqxdbbyMiIuLAgQN5eXlOTk5Dhw51cvqn9H50dPSePXuSkpJQFK1Vq1afPn0Igrh06ZJOp2MjUbKzs//4449OnTqxxSzDwsKOHj3Ktmv57rvvWDXMycnZu3fv/fv3CYLw8vLq3bu3vb09SZJHjx59+PChv79/gwYNdu/eHRMTAyEMDAwcOHBgMfffPzCwYN2vBYsWIwz88Kx40ylDUFTasYMkqNrHBojgCPpckD8KO5pJ5mJlzDtRKpAMaSuyXdRweaDNpzSK5SiblBV1excqlapq1arbtm1r2LAchphrzx7PHjoK0RsQ/JOClhkGmJmZD+jHs7SAHxPia2whQ/AnEafPUo/4ZcZ+L11IhvSQeyxtvMZD8ZZKChzfImX9uc22y/vP8NdvEZh+l8e7KWrqj+CE0Xb7BFCUycoqOHmK1ukQ9CM8aBBBUAPZBQ8RAF4Fn1swQaBEdH70Lzdn5mhzSvtYOCqGugkEgq1bt1apUu48vnkv4asjANMo+lWS9qhhjM6lPyV7FOC44VW0KiLSGKb6MdCAqaI18yBsGeRT9lsu4aG8u2l3lt9ZpKM+IkSRo8xS1tUNRVFXV9d3+q2+TfJ0dGLCM5RUGvM9ASnt6Cz/oREQ8OEnCJyxcTvQXA7Xvoz+j1CSfwMRREihndBAEn4tdXuXcVmWpm15GO/E6z/X31/LlG2PDUd5ULfyh4Fm7ibm3KCDnkmbAowPGBqhKXEjK8WYpiifj1AfnyEPAEKSyrPnqZxc48TrBwMZprrBzpVnS8FPTMv/QAAKAG7UMIADgP0jZgD7//L///H3cnY1YPzjK2sfW75877Ndv7848FV3zFEBZxXKGTQD7yblvspUoygKEdQHeVVVc4Ew5DEAA3ye7pEqd1UYnVMAPn6SAVKUIChI0an9R7nfcFwwR3DpMHmHh3ypWiwABVQBmRNRoI7V8Kx5FnUUAhs+pCFAgS5dnxuRr03V8y0IRXWZyEVY6BFE1DHavDsFVAEl9RebVZcBAv3KvkEa0mJCPLvu/KYu333VHXOUKJzt9lV5naOOydagqDFHFEXo54h3pLiDmmeHQgrq9YIqEvPJTXE7c4T8aGMK4LjuwQP1nXsfMT4FCKT0HbBA4ZebWwAIQzKxm5NzIvMkPiJ9qj5uc5I+kwQ4oFTU6zUJqtcamb+YLKBi1iZoEnQYH6ijNbHrEikNLXIXpp3OSj2WWWjdIV8TDGAqg2r57UWxea+/6o45ShRO3b4e2WrDo5R8o6vt/0swhIqD9uHiztlCbxSBUK/newvMpzQmfJ0Q8qNzSAEA6stX9PGJAMeMY0Ecx3kEThQZ8hWmsuE8Hk4QhW8RDED81JIAniuNQpQAKA8tOnL8fAAKlC/U2mSd8wB7mxZWrkMcGQOTezsPxYHypZrWMU697aybW7oMcAAYUD5TIxiaeSlH6MB3/d7BpqWlcz/77Fv5mkRdyR7Vh4CjeJIyccWdJRryX4UYOL4huFinr4Seoh+k5OkoBvt3QgKG0LlQelXQpgZ2zV5zH+oMhCNhPrZW7iae/t5rQHxMrhSKMgUFBWfO8Pv3TdFqr754EZWU7GRm1r9ObSGPh0CIArDj2vW/EhMwFIUQ4eP45JYt5SJpa9o/LPYB9ZIkc0lZZYksQArpEjLlAKJPNxBynDAjGD2D8lCho1D1Ss3oGZ4FD6AImUsydnxDHolAyLfAIQ0NuaTIRYhiKK2nRc4CMp/UpenF7qKvH7nCw/jXk68der5/QMDgr7xrjhKBU7evxJM0ZVqBHntbVBqKMBoouEo0DZHK3VXXgcGAW2Pmo0Lzdom1lx4CAv9wgQM4TsXF68KvH8XB0fv3MwuUQh7RPbS6mM9nIAQoeuDO7Vy1pr6PN03/LWAQoSsVmAnCsMSsbF2cDsGAvJqsxNQNIkJHvj7boE/V8614ZA6pidOiBGAoKHEXWjUxj1mXKHQSaJN1ZtXlimA5AhGeJU8Tr6V1NCbCCh6pIAWpPPpjaz2VCMA4XwO2PdoUaBNU1Trw6x8Ax2fCqdvXIDlP+zJL/VZpY0ERhoHgLhpaIJFVVV9ASRUmwcyGVEGFhPrEXcD7iBRUgGH5t261b9F88Pjx+65f337tepE3IYaifWvVGtm+nbF6Ek3TOh3D0B6YeY+edQ8L7sWvSPjEuOJ3ABko8RRJfcTxO1PklST6DAOtY1AeBgDQZxoKolRmoXKZv1iTqC94rNTEaiQ+EptmFjHrE16vjudb81TRGlyElmK8MQrQfH3+mnsrlzdarRD83deR41uB87t9cVQG6kFyPvVflTyAUQqYZ8D/hqSTjmcLGAoQBsXgytJetYyW1IcbLwBAg4F/7bq4QEm9oQuQgeceP1506NCuS2EpmZnGIWqhtvY1qynCeEyJSlvh/owK4faDk107K8BDzeuYyatI+FY8lA+yb+TRKsqxm615bYV9J2tcimeG50IKityEXj+7Sf3FuBR37G6LCjGeOfER9QVKGh7Gu5MauePxttI6AI5PhlO3L86zdGWejizmbnsrwHg9qATE8aqwQ4HQA6UphNLIevhK+9VB0I9JZsAwMicn//wFWmcomqHFQMTbxkYmFMZnZS88c6bjr+visrMxABgAHVX8mjwf8ksEvkFj2JplPTPnvnZSH1H+Q6W8mhTwUEhDiPy/fU2heQaNA1AIKci35tl1sHHsYWvIIlE+KnIVlthI+ZPAMfzQ8/23kotawRzfANzI9MuSptS9zlKjH5MEiiF0JmIeLmgfBK46aO4zpEre2R2T8fK330K0OgRDPyhJHscNUY91MqkpQ8soDwyzuGsX3FhKCkvOz2uzavXaS5eW9+wJSZJg0Na032b0RImrCKRh2pksjG9sU5N9I0/iLVIEyxg9YxaqyLqaF/9bsiJQqo7Rqp6r3X90QglUG6/NDM8V2vN1aYbcO/l2Haz41jxIlaa6oQiqMihX3VvhZe5rKbQsxSPh+Cg42+0LYqCZJ2lKGsKPHVZhCF3ACG7xm0RL6qGAQHRqSVN7xYh6qJncFAqHIogAAB4A2L+jwQjEWLONNfNgcooxu6swWwsnCAAAZiyTZxQaByurUFfXqKQk9tMQUlUoKz/CqcTNN2OcsiWhjtOqozVWjcxd+jtgAgxSUGjP9/jJiWdG5N7OhxT0GOUs85cwFINJMcADeVFKxsC4DHawqGdWutLGQmD851lPjr36o7QPhOMj4Gy3L0hMtjpNqTeG7n48KMIYGPQ2XlclMQvQhKH6AnEdS0zRMG/9TSopHeXhuQxz26B/RRrVrqtI7IBhdOHlvKrXndJpUmnGCkXzKRLJz+erNYxEcuz2nQtPn2Yole5Wll2CQwKcnJ6kpPjb2bGjQ0Bg1kBgRwpe4xDlFw4bS24waFHHzLyWgh2iIozR98d6AMUeImOoR2HeAoIhkIQIgxjdbV1t/16IImVB2lhzGEPx/U/3NHdt5SQzlhHkKPtwmVhfCpWeuvAyU0vRn+MPhwhgENQLxFVVnxcYMhmCb4in8n69Dl+lXEfoeQV5EoA+o8g9FpbVeXwDhHwANiuVuZDJpun9GrUeQSwQpJm3t7mzc1JmplwoPP7wocZgMBeJ/B0cknJzfx/2QxVnJwQi68LC7sXFn3/yNE2qtPCSywNlisCSi3ozJRu8dXtvrS38kQWHvw4G2tDDr/fUWjNL+0A4PghO3b4IDETuJOS8ylZ/yGTCf0IjmA2aE6o5K9fHMThO5xK5y8PVj+MBD4+hqH45WZvNLUIK1e3v4h8AvKLIi1pdmF77kqI6YrhPSHD/Pr0RBh66c+dxSvKBiEgPa+vdQ4e4W1rSNI2i6P7IyCcpqWKBIIKXGqF5YV5JLvUTl64vvwzCMIyYJ1nddH0QV8L3W4AbmX4RcjSGxHztp41J3wRD6AzG/KqwXSh22UbzGJhBs0kN0bU34b2Yv3t5FQFFEDWENijWWyL+izQ05uNz5QomO5fIzOI7O33fqCHCMPfi4pv4+bnb2lJ6fWFuP9OrZk1j6XOA3xAmjGXUDElz0vYmKIrm6XP3PN5RzTqwYnaD/bbgrtAX4VWWSkcyJRijhSJ0ARSHEy3jpHURGhBy0uLnOhnVnBIpBoGwaH0PHgB39fruWZkN0tNekORoqcwAUF1ubt6Zc5TamDK58ty51Py8PjVrGLsL/h+KpimSpPXaajq7AMZZT//zFkdReCgvPOnylYRLpX0gHP8Np24lT7bGkJinfU9mwqeBIgyFoJFYnVdmrSIfZ3aYfmBwYtJsgyqLYeIoyrQzEsIAHs8Fx9JpOpmmtquMMb0Ax+mYGPL6jX23bq29FLa8WzdPGxv6jQBjCBCxHmmIeuMozlUkfyvG1o40uffprnx9/oesX1BQkJmZiZQZbt68efz48WILSZJMSkqKjY2NiYnJzs4u2T1mZmayHdbftQKE0NSUzhgf+uzZli1b6I/pE/IuOHUrYRgIX6QrDZ9URvw/AcboMeQhWvUSbOzn7bFtUoNff2nN8PClyoIMmmavJQ5ADEUm0TQPgO8Ewit6fRxF4QDwcXzn+fPTDh5a1r1b++DgN6Xt/8dPtaJ8LID0Sxx/+YDAiHtpd68khH3Iyps2berdu3eJ/FZLhIsXL+7du7fYwhcvXgQFBXXs2LFPnz61a9ceOHBgCSpyamrqkiVL8vPf+TCIi4sbNWpUWloa+zIxMfHcuXNF9e6T4dSthMnWGJILdCXlcXsTgECSNLjWaNFmwirvgBB3a7FMSGTiIB4yxqQqBMmj6fVKZVehMUYkhaYJYJxkwBDkhE67NC/3Z5Gkk5vHe24dBiBmOrQ5v6oefnQJpgoCWy/4yMvfSea/x+8Gg0Gn0725XK1W5+TkqNXqomuapviK/f3m9SJJMi8vLzc3t6husv3CDQZDbm6uqXe4aSO5ubkGg4HH44E3bk6SJPl8/qJFi/7444+tW7eePn36t99+K/rZnJwcrfZfvSYYhsnLy9NojL4Odl8QQpIkTYdN0zRV2IgSAFC0tblGo8nJyVGpVOxLCGFGRsbFixczMjLUajVN03Xq1Fm5ciX+/zKFNE3n5uYWPVGmBsSmAzCh1WpzcnIKCgrYXXOzCiXMqwy1ni5e5qhkMaYiABiVgS5Zf5PIilKqdQYa2SMX2BQYpAz8KT/3gcHgTRBZNJNM0xOkMjccf0ySk/JyUQBu5mRf/3Ut7uTUwMN9cP367E1QDBSChgaXo5hYx+iNgb8cb4AB7ElW1PXE8EYuxha376Ewkrr4OdyyZcv+/fv1ej1Jkm3btp00aRJBEFOnTg0MDOzdu3dmZmarVq2GDRs2ePDg3NzcwYMHz5s3r1KlSqaPx8bGzpo1KzY2VqvV2tvbz5kzJzAwkGGYn3/+WaFQxMTEREVFSaXSVatWBQUZ+09fv3592rRpOp3O29vbaHsSb85FGRc6OjraF9KgQYOHDx+yy48cObJhw4aCggIcx4cOHdqnTx8Mw2JjY8ePHx8bG+vs7Fy1atWUlJQVK1bo9fqxY8dOmjQpICAAQZDffvvt+fPny5YtY08Cu7X9+/dv3bpVp9Pp9fo2bdpMmDCBYZjNmzcnJiZOnDhRJpPNnTs3Ozt7SyEEQURGRs6dOzcjIwNBkF69eg0bNkwoFO7fv//ixYvOzs4XLlxQKpXjx48fMGAAAODAgQNr1qxhT3iLFi2mTp3K2W4liVJHfVHD7R8g5OOotW91jVNjGsGGtPL7rpuPw9imCWJ+Kkn1FUuyGEaLwDFS2UipTA+hHEWnSOWjJFJPHt8rI9M7J8fRwuJdjVFoSFVl7AIxFxLhzLd3ABA1qfnz1THyk6ZfKlWqtHz58mPHjv36669Hjhw5deoUAMDCwuKPP4y5EDdv3nz8+PGFCxfY1uOJiYnW1tZFPy4UCgcMGLB///5jx475+/tPnTqVoigAwKtXr/bv39+/f//9+/e7uLjMmzcPQqhUKn/44Yf69esfOHCge/fuZ86cMZlFRWEYJj8/X6VSPX369Pbt24GBxopPd+7cmTFjxoABA44cOTJr1qyFCxfevn0bQZApU6ZACPft2zdz5sxLly5FRETQNE2SZFRUlMkoS05OfvnyZbG9eHt7L1my5M8//9yyZcuff/556tQpiUTSqVMnBweHUaNGzZw508XFJTU19cGDB8ZSrGr1wIEDvby89u/fv2DBAvaMIQiSkZFx+PBhGxubHTt2jBw5cuHChYmJiRkZGQsWLBg5cuSRI0c2b97cokULbmRawrzOURuokpwqfRcQQqmZRUiDZrGP77foOfin2YsGtA22qWm+zklUUyTqJRQPEIklAAgByKaNLkBLFO0jkQyVSH+USkcqzIZpdA1F4ncdKAQIT0e3QCvxjBXJOf4FRCDFUCjAfS08rCRErj71EzZSu3ZtkiQvXrwYGxtrZmYWFmZ04dWqVev58+ckSV67dq1Xr16ZmZkqlery5cu+vr5WVlZFP25ra1upUqX79+9fv35dIpE8evQoLy8PAEDTdK9evZo0aeLr69uvX78nT55QFBUeHs7j8caMGePm5tamTZu2bdsWG7QWVl3AcnJyRowY0aRJk8BChg8fjiDInj17rK2tq1SpkpWVxZp1Fy9ejImJefDgwfTp0/38/IKDgwcOHGhqN4zjuMlMQ405f8WbdQQHBwMALl68+OLFCzs7u6tXr7INi0UiUaVKlSpXriwUCtntYBgWHh4OAJg4caKnp2ezZs369Omzf/9+VoiDg4N/+OEHHx+fgQMHQgijo6NRYzl/EBcXl5WV5efnFxISgqIoNzItMXQknZKvK0xs+uL6hhFEdmryip+HuHj59xk74ynBp2iFu/L0s5iEZwSIVOVRWkMuZDaolAUM87NMroOQjfX9G42GPH3GvHcvXC57axN7BjD1Dc7WqCydzjXmQ3EUtpKBEBHggkqWbtVs3dwUNgQO07QvrEUfl5jFMMy0adOuXLkSHBwsl8vz8/P1hVGH3t7eEokkLCzs+fPnU6dOXbly5aVLl549e9ayZctiW7h79+6PP/7o6enp6OiYlZVF07TBYGCfeba2tuw6aCHsD97CwkImk7HLPTw8njx58uYhSaXSCRMmeHl5Xb58+cCBA/Hx8f7+/omJifHx8UuWLGE9GBiG2dnZ5eTk6PV6Jycn9rNOTk44jpvcbSZ1KzYeZ1+ytl61atWkUmlBQQHry6MoivXZFVs/Li7OysrKzOzvsno+Pj5nz55lv6ZcLmctUJqm+Xy+wWCwtLRctGjR4sWL9+3bZ2NjM3LkyI4dO3LqVmKkKnW5WsNXGJaiGJaRFL920gi5uWWHIaNUBUbX8kOpS75Fj4tb+EIqWZ+Hpe+Kan7+5iiJrJtIpH9zBIphVGJSwaUwRYd2bz1ciEC5Ae8oC1mtOSMEPKRiw0CGhoyNyMrT3CnY3sdaLMJRlIY0A5EU9XMveU0h/r4pZmPxgiJWzPPnzw8ePHjixAnWlRYdHc3+sO3t7X19fVevXk3TdI0aNYKCgjZv3pyWltakSZNiG9y+fXtAQMDWrVvZoevJkydNbxVNPQLAmInk6OiYn59fUFBgYWGBIEh8fHxRH7/pU3w+PygoqFKlSjVr1rxz586cOXMOHjxobW0dFBS0bds2drMEQaAo+vr1a5FI9PLlS3a8/PLlS5Ik2akDY7jM/0UqJyen6IwHACA3N3fHjh27d+9u0KABgiBDhw5lRZmlmKHHHnlubm5+fj5r0MXGxjo4OLBvvTXDqmXLls2bN8/Kylq3bt2oUaMaNWrEPZZLBojAuBwt/Co+eBTD/roWFv3kr+z0lF+njFw2ZtCqn39IfP4oFbV/YtsTtapm78r3GRYksZSbMVBWWJ/y7T207j3Q3Lv/1h5ahSldsJbBwZowp79aO+cyhrHWHGPM2LAVW7fxbNi36ndtvUNsJSJje0WmsDodAgy0NlVT3LtUFIZhsrKybt++fa+Qhw8fUhSFYdirV6+USuXJkyfPnj1rMnNCQ0PPnDnj7OyMYVi9evXOnDnDDtyKbVMikSQmJubm5qampq5evTojI4PdAkmSJkFhGMZgMFAU1aBBg7y8vB07dhQUFNy4cePw4cNvznJAY8MiI+zLsWPHhoWF3b59u1+/frdv3/79998NhVy/fv3169cuLi6hoaEzZsx4+PDh5cuXd+3axTAMTdMWFhZmZmYHDhzIz8+PjIw8cuQIa/FBCNlpXwwz1mSOj49XKpVhYWG///47uzsrK6vc3Nw7d+6kpaWxs64Gg4Gm6fr162u12o0bNxYUFNy/f3/Xrl2dO3dmbb2ihp7BYAAA5OTkhIWF5eXlSSQSf39/DMMYhuFst5IhR01mqPQlHcD7dmiSDG3S0qtqMPP/qXEAgI2TK2AMWVB2idemJrjqYHHv1PJOovOp2nMPEQJ9a21bgEBV2BXczl7gaP/m+JSGdCXKOpjvfA48wirY4LTQuUaLcJGrwr6qjZe3ha3A+AxgqDeiZBiESdO8cpFWxcDbf0ouLi4ikWjcuHGsJSUQCHbu3DlmzJh58+atXbvW0dGxe/fu7u7u7MpNmzYNCQlp1aoVgiBBQUF169Zt1aoVj1fcdh40aND48ePbtm0rlUr9/f27dOnCGj6VKlUyjUwVCgU7YWpmZrZ27dr58+efOHHC2tq6b9++CoWi2AbFYnFISIhYLGZf1qtXr2fPnmfPnp05c+bixYu3bNmyefNmoxsLxxcuXOjh4bF06dLp06ePGTPG1ta2WbNm169fxzCMIIhp06ZNmTLlu+++c3V1bdeuHbtBkUgUFBTE4/FkMtnUqVPXrFmzc+dOa2vrAQMGsKNOOzu7UaNGbd68ef369atXr7a3t69WrRqEUKFQbNy4ceHChZcuXaIoauDAgX369EEQxMHBwc/Pjz1UFEUDAwMtLCx0Ot2GDRvS0tKEQqHBYFiwYIG5uTmXRV8yPEjOf5pe8DVmSwspHAcUVRxjtDd7KRljnSEmkHngrb2K0GjugZeqP+4YO+a9TXohRRHu7mZ9e2GFTbOKvYtD9LI8bYL+EAKZr90UvpSgGRoBQIgLqlr7+ls5uSisCGNR5HdWZIcIxAGvpk1Xc4Fx0PQmWq22aGwXOzeKomhCQoJSqfT09GRtLolEwq6Qk5Mjk8nYoI28vDxBIW9uVqPRxMTEmJmZOTg45ObmyuVyFEULCgp4PB67PkmSKpVKoVCwllpubm5ycrKrqyuPx9Pr9VLpv4bSFEUplUqpVGqaTtUWYm5uzobmxcbG4jju5OTEChbDMCiKKpVKkUg0efLk169f//7776zC5uTkpKSkuLi4CAQCrVYrk8nYjbNHiCBIUlJSXl6eh4cHhmFFj0SlUmk0GjMzMwihRqMxSbBWq339+rVcLjd5+rRaLUmSrCcRQpifny8SiXg8nkajSUpK0uv1jo6OrG5y6lYCGCjmyuusDNXbW159fQrHTKg386Kq7iKBGPL/jFfujkAgZcyTf3NlihI1qC//rlnhT/VfNwOKAB0P9MH3x1Jp5dt8g8ZfLA0Aaiu29rN0qWbnaS4UoADQhSPT90NDykdRx8+sPlJhuHDhwrZt27y9vZ8/f/706dNff/21YcOGSNmDU7cSIF2lD3+dRTEfXYP3y2FsWQBQB5hcU3dWgOQVnE5W7rkNNToEf0OkGAYhCFm3LuLKlYrm1bPgKLFH+myh9rgQeUsIaDmAgUajF0dxJ5l9sK23h7mtQihgF37gFiDCSAnL+vb93zU4LX9kZWWFhYWlpKRIpdLatWubxollDU7dSoBHKfmPUgvKiOFWFArBrUBuDcNFMypWfSs3f2sEnZMP8OJRSAhNA3Mz8wH9eZYWxRxwOESjhcpR2NEUMgtH3vjgt0xhgxpazpe5yu1C7P2d5WZ8HPsoXfu7KCdgcAytZdNDTvw9dOIoI5Tn4cbXgYHwK+UnfDw4QmVB+TV+6xQ8QFzbTPFTXdzeChreyEDAMCY7R3nxEk1RxeYfaMB4UBZVoQNdXkqGsOG4DIQyvrShc43eAc26VarvaWGBowjF0B8sbRDHGB4OGIjqdRbXohx/v533pY+c42PhbLfPJUulvxSd9QmtYb4aDILyUCaAvONL3jLE6nLW3iCjUwCv+DAK0rT4u2byhvXfNN/uy/N/0O9iIF325xYAaqwZYLypGWgKZWH7NiDQGPwJGMxRZlPJyqOqjauET6DgfZMGxTcOIDDqGmBocVwGkZGruP9a9CwFKHWwppvFnsGhYn65Mm+/dSqKp+DLkVKgoximbNpuLCjCkAy4j9fQoZIq7uGWP9fLXn3T8CQB8P/lSgMoqr12ne/iInB3hUWy62nA+GvkfgKnR4aYMj04BcbIGHWsVvlCjfJQmZ+Yb8szWpwAUcdr8p4VQIAE1qncsHo1DzNbEYHTxkHoBwkbAAyBAQZiBhIrUJnfesFPyBTFZRLZSgbDIAaMzszXWcpXGcpqTsWDLThKEU7dPgvjFL6mMMep7IqbEVAY4P0YBKgFimCH81ZT62etvKW/FwuKhsIBwGg0BafPYH164TKpcbahEIggAhrrAKo+QF6X3dulsPRd8tH0vLsFAgc+pKAh22Df0QbgMONids5ZZZVQT4Rm7i14GDLTVdLa0WD474JrAEAUQB6GKzWSF+n81GzzG8/xzAJUTwGaYXCMNj0dMAAyCnTPUws4dStTlN3b9ZtAbaBVBroM223/7lmHULHQUcNvX938gtW4mtmbeNprL40TfabcQBynkpJUYZcV7dsaF/7fawEZKoS0c+fZxenTCGOxuDIHioHsyPycW3meY1ykPmLaQGtzDQiKyID86dmYroMa9Z3QgqHotZP/OLotPLiJD4Zh7/DJQAyFGIpSNKBIcUyGIvIVLz1X9Dod6EhIYBAAdoXiHwMA3InP7RHKNQMsQ3Dq9lkU6Cil3lh8BvlGMDaggRZXiPY1LS7bjsZyJHzNhadGM+3/E74Aw7T37hPOzpKQINP4lEagMymrgbnGomllcXYBGNMIciLzzGsoAA9kReYqHOSVvTyrWHm7SSxjFDFCEQ/HAAVRHp/g8f+pY1FkA0YXNIZCHAhScgQp2eKXyYq7MUCtQ/WkMboGR+G/x/HFwVFwOzZbS9JCoiyqf8WEU7fPIk9HUgzEy14syHtAEVoNBdewZiEyhetAiClEyj/uITSFsAaJsZIOo7pwkbC14Ts6/C1wAIGUrhMW+Cf9gIJkGZxbYEioTdKTGlofZxDhwpj8hDojK4cEutCQGTi1zf7V5xNephn0dFpc1qDpbQkCoyh23A1xDKIAM5CoQS9/ECN+kshPyREkZUOjEYcVetw+7CeCApCar4vOUAU4yL/wd+X4UDh1+3QggmSodN+UshWZZ4BYBKitUsj8e1zF5IL8nRGMXg9YgcNQmJ9fcPa8eZ+eKI8wNmc11kQCHmpBsNjjhu4pUcbmFhjIUDTNGBiZVjRl2yAXd8szO2/uXnQiuL6Hlb1Zdno+ZfQeGC02vY7My1RCiKAoQ6CApkWxqYL0HPnd16JXqYiBRg0UxNAPVbR/ARADzdyNy+HUrezAqdunQ9JMjsZY+wX5BimcZ2CiQGWlQBLS6qK5jJ+99gqi0yNsrC+Ok9HRyvCr8mbNjAPTwjAxgiFa037XkOLVwUoLY8gHZHAUd5DaVXHxyLHIqdHY38vXBgEgqLHvyd03Yp+m4gS+Z9nZobPbf9cjFAXw0K+Xtsz9s3Itfz1tf/2ZIClTEJtB5KgZwmjBGeNy34iT+VBAYULes7R3dn7i+Ppw6vbpFOhIA1UGvVAfCjBKFv0acdMI2tdsetVSjGevCmfy1KAwWwtgmObGLcLeQRxQiR2fQoaqSTtW5rk+0cfxSjXriK3hIcbFbmYOgTbeHhbWQgK/E+Sal61CADDOCegpvY4SSgRqpZYmKRsnBYagBSoJLXbNSr+w8KCLipHoDMZINxyjBSWUYwYRJD5boyNpAed6Kxtw6vbp5OsoaCzT/W2DI1QatAoHzUNriywFWPbycCYz32jBFZYiVJ2/wHN0wBXywkBYaGHg18Ccn4L40jpaqjDXXYwLqtr7+Vs7OcssMaywGyaG1G1ddf20wxcO3vEMcDi47qKltahSoIOBwiwcLPetvn7tmXNmluHO/jDcMSBbJwTo26c+PwcMRdMKdGn5OlfLv0sJcZQuXK7Cp3M/Oe9ZurIsx/F+OAyCClGqGnrX6cmVnDXXyeg0pNAAgSTJqxJg3rkTIHAEQhSCJCnZk9qqYwxfc24BFpZ4AgC1l9j4WblVs3FTCIWFaQb/r+FhrPAErp96eP5ABENTdvZ2dXu1Qs08XyTLw67GpocfJguyAEAEVg6K2t0JhQ1kSr7BKISQwNCdA0PreFqW+MY5PgFO3T6dazFZ8bkl33O+tICFCUsBaJRXbFj+2qu6RwmAMOY0QQAkLZrL6taGhR3vIYpOk4af0dz9OoNTNq2dQAlnuUOwnZeHua2MLyhscVC0xLYxYgMAjEHwvFzRzSg8RWuZmiOITadQFBJE4dynOg8BKCaSG3Xti1Ub1hrodb2CugQ7fqHtc3wU3Mj0EzFQjJYsVyW5AQIZCB7QVdWeioCJYmzzVXX4U8DDAYTqi5cIBzuBqyukaZzBWpFeF7GHkPmyJS3Zwt8KgcLNzK66nb+jXM7DjDU8KIb6J+sTGM0lkpS8SsEzc8zvvBbEZKAkjekMNIaSf0eoFZppqLCw2OEnNej7cABAEnL+6SvMUbpw6vaJ6ChGRzHf6ITpuwAIxBD6pcFFa9+h2iiZTIgXnHkEeBii06nOXiB698SlEoYiA2n7AML5vv71lzDfjDMdxrxdVMGXVbPx87d2sJOYAZRhGIYy6pQxO8qYx86gBoqXm29x4wUvOUsUk4HlaYy5BCiACKDeMvX5VbpDoCiIz9EaWy6Uq/viW4VTt09ER9JakiqXNzGG0ImktVLRpuYouVwhzD8YCXCMjI839tBq3xYARKbH6hEef6FxJZu3wOoajhJucocAG4/K1s4SHg8BkGYoYz11ADFj1ieRqxLFZ/CTMs1vvMByVKieBMa4EIwpqanPzwFFQFyWmmIggZXHO+Nbg1O3T0RHMSQNy43TrRgYQufT4qu8RqHfmyl4eMG+CASgurt3NU5ObIZWG6bSb8gNDaJDS2JwSkMagYCHE/6W7lWsXT3MbYWFNTxoSBkVDUdJClAGaXSq/N5rXmquKDYDISkGx43GJo6VIccxiiJJuVqKZog3GhVzfH04dftEdNS3HOr2AaAIo2V419HQwMFSO7lEtf0Ko9arL4URdrZ8B3srHWwtC96nDucD4rNbhUJLobmXhWOIra+NVIKjKANpGlLGHCkoTMoSpOZKniXI7scBnYHN+mRwDOGVAUvtraj1VL6WFPI4dSt9OHX7RIxON6ScgxrjMMB9g59n52E+QqFm60VDRqbyzDm8T08eIWygdzqGiahPCg2BENKQxgBuJbIMtvPztrC3lkgRhEJR41klSUyvU9x9LX6exE/OFiTnMigKjSHGH5z1WVoABNAQZqv1tvK3NLLi+MqU7ZulDKMj6bKXS/6FEraQl6SruuWwAAtrsPp3/fMXyqvXFU0aBzIO1Qjnm/rnH2W+FTrXaAEudJfZBtv6eVlYi/nGVqEoSpEG8asUXkauIuKlIDbTOBotHPv/U0btm4CBMFP1T4t1jlKEU7dPAUJEXwFsNxZj/iWkkihrXc3egRIzwdJtmrCrhJOjzC+gKc/3NvraGBL3AUrPtgoV4UI/G88qNs6uZlZiHmqgEJ2ByMk3v/Gcn5orfJ2G52vZrE9jtMcnZ32WGgBhGJit+rupO0fp8s3dPmUE+E1nmH4CGKSz9JKIyh0D5ltLZi1RHT3Ot7L+zsF7C3oti857j7oVdjgwdpK2k9j4WDgH23laSvhCXJBZwHsWL0jJMr/2HC3QoLq/pz5LLOuztKAhzNVwtluZgFO3T4FBjOVuymCZsy8KhjAqPX7PoaHfXKHV/IUFp89a9OrR2ixoi+qCAKDvaRXqLLMPcfD0t3IW4yKdQfgkRhYZTWTmiaLTjesYU1rL2NTnJwOM6oZoDOUqzPvbhVO3TwIaH9FIxQNFIGlAHtnV9pi3yHnJAt3V6/VbVvoDl6lpNVqke2Rhq1BKypN6mNmH2Ht7mDll5olfxIofJ0ruxQCSQnUkLGzFgpQ/IIS6N3sqcpQGnLp9IhVR20x1k0jylbySfuI8j50b/KO1gT6ul+lHfARlw3ExFMiFokCbSh4KZ0ue170YwcVIXlIWPyWX+bssx2eUUSv7QGicTy/to+AwUn7vsi9MBa8+gNFkotxN9f2EoDNHW6tcbvJe0LQBRzE3c3sveYAE8dJr7Y895MdmQsO3OfX5yUAE0ZKc7VYm4NTtE6nY4mYEpalckVVEix4er27aIZFAonAS1MjKco9KMnuVhhRojdlRqLHH6Dc49fkZGEfl/y/LxFG6VKT7rkTh7t9CgaM1IumzgMb+0ZYnnzDPKYHOYMx1JzCkglhqbwKAMZe+tI+Cw0iJFietMBg7JpX5Ds1fB8AwACN00CVHiekpY7IBD6/gFTIAVrG/f9mBU7dPBHLW2/8BCCITocYakaV9JGUEnCsQUjbg1O1TAMbuvCinbywMhGZivkJEMIW9ASs4wNhggVO3MgGnbp8CAAiPez7/HwgRhZCQCwkuDoK9N7ieWGUETt0+BYAgBGoM7yrtAykTMBCK+LiQj1fwKBnWIYsCIBNwk3VlAk7dPg1A4Jzt9g84hsoEBHdGjL8oAOTCijphXMbg1O1TAAAhSrYX5jcOhNDBXIihFf6cQGN5Xtm3XgmgvFDhb8dPhYehFX0YVgSIIHZyIW5s2VLR4Wy3sgOnbp8ID+PmTP+BgYhCTBjDvCr8OUFRYCHhl/ZRcBjh1O0TEfM4260oUMjDRcYquxUaiEACBbYyrux4mYBTt09ESODcQOwfIELgqKOZkKnY06YQImYinpjPRYSUCTh1+0T4OMrHucHp30AEwQBiKxNw6uZoJuKiecsInLp9lrpxIW8mUBRViHkVW9yMoX8OZgJu7riMwF2GT0SAY3ysXFTLLslsU4IwKn7FhWagl5WEs9zKCJy6fSIYCriRafFsUxHPTFhxs02Nw3MMuFmKS/tAOP6GU7dPR8rHuVI3JiA02m5yIQErsL5bSfhcn+ayA6dun465iODqFP4r25TABXyswmabMgy0lvKtpZy6lRU4dft0zEU8DOGCQv4Bx4BCVBjTWyGhIWIrF1hJuVDesgKnbp+OiIcZI5s4efs/DISOZiLcWD2lIoIiiJeVlEtALjtU9ODyzwEAYCHi5WnJEmzbDFAjAKAMTTHM3wXTAAAY/k/qIsPQDE2zQRgo9s8VLPoRFgzHAQAURX2dJjcQQWzlQgwFVMWbWIAIwifQYBez0j4Qjn/g1O3TAYWD01dZ6pJzvkFVfm7Cq+d5WekelarZOLlChkFRLC8r49m9WzqtBhQ2eHfxruTuXxUAkJYY++rhXZqmEQgZhvYPqW3r4s4KX6H2YY8jr+m02krVa/MFwq/gDmMgIhcRxrPxJZpOAAAAavwW8N9VMo0PAwyBDGTof62NYQgCjAv/vT5AjX0f3lz+mUAI+The1Ulegtvk+Ew4dfssZAKch4ESsVQwHM9IStg0Z3xBTk5WWlKvMdMd3LxIgx4niMToZ9vmT/GqEoTiOAIhhhHulariBPH49o1D6xZ7BQQV/lyhjZObvbsXq24Ej/fk9s21U0ZKFeaTf90tFElo+is02YQCHiYTEJkqQ8mKG8AJxqCj1LkoIUQF/4RcAIyg1TlkbiomscAVtghNFi5FEQQaMuOhXoNbOGECCWQKvzsACEAN2QlQryEsnQFPhLDLSwIGIu7WYhsuw7QswanbZyHjExIenqcj0c/2pTM0LVGY9R0/GwCwec4EijT88xbDyC2tJhpFSkQaSJoi2REoTZLuvgFTN+xHMYw0GGiKpAzGTwGAqpXKk7s2eVcNyU5L+WqTmBAaSxY7mgnTlfrPPyF/AwDCMHnX9+vi/mI0+SK/+vLa3QsH2hCguOb1nfxre41fkKGlwa0lVb8zGlGkPvfydn3SU4DjCM43azBA4OQPGRoyTP713droOwiKoQKpedOhPCvnf1t8nw5FM9VdzTmnW5mCuxifhYiHmYuIElEPCKFAKPKoVM3a3qmoN41Fr9FEXjx169yJjKR4YEr0QUFedubNs3/evXw2PzvT9CkMx0/v2WxmZV2nZYevYrL9A4YCa7mgZPUUIgzKE4m8a6MCCZWX/vdSgFLq3Jxz64XuwbZ9Fstqdsm7ukuf/BLliZT3T2pf37VoPdqm1yKBvU/Opc20Og/gPM3TcNXjMPPmI2x7LkCF0tywrZAylFR3QgJDa7mbl8imOEoKTt0+FxupoKSypo1tzElDoR79Sx0wDMN5vEt/7Nm3esHin/pFXDiJ40Yh4/H4qoL8C7/v3L5w2pJR/V5F3cdwnODxXz68e//qxY7fjwJooaPqK4KiQF5Ccv83EAKAyap3kFXvgMmtTWIEUFSf9ARghKRKM5QQiH3rYFIrfWIUhIw2/qHAtZrAsTJKCGShHamcFEN6DMAIzctbQpdqAteqqFAir9GRzE4wZCca3XCfDUUzrpZiHxvZ52+KowThRqafi61UQGCogWa+UJgXadB7BgT/svskXySCDPxj4/LdS2f5B9eUKixqNG0d2qQVXyDU6zQbZo7du2Le9M0HSYPq2NbVzXsMcPGtHPP0EQAoweMbzb2SGYH9N3Ihj0+gDCzJeQXIOtSKqiZADWmvMbEcFZsZR5cA5du4G9KiEZoCAEUY2ljgAADjdItWSeWl0ZoCWpXDd/Q3Bt0yNG5mT+u1dEEGYufz+YdHMdDXVupiIfr8TXGUIJzt9rkIjYNT3pczkYyTcUKhWK7AcUIkkdRv0wUBIOn1K4ACoVgiksowHDeztGnapV/ss0ekQf/k9s0XD+/FPovavmBq+InfczJSj21bk54Qi36VwhWFvU155iLel882BQypQVACGGNljEIGeCLGoDXW0XQP1sbe17yKoFU5+TcPIQBhKD2k9AhDozwBK5EAxQCKQYr8fA2GhcPS6q7mJeZq5CghONvtcwEIYi/jp+RrS8RWwQnCaGoBlB1j0hRJ0zSKGcemDENjBFGQm6XXaUVSKQIhWhjOhjAQYFhOegpfKAIAmFvb1m/ThaYpraqANOghw+i1WtroO/8avz0IEamQkAqJ9AL9l94VigsRhoI0aRxdQsgYdIAQQJqWBLak1bn5V3cjEBLWbpjMGiUEKM5DUIwx6P7+NEMDhgYYUTJfWYA387P5/E1xlCycupUAlmK+AEcNNPych7cx7JY0XLt4OiX2VXpS3F/XLtEkWTm0roOHd/jxQwU5WU5efrkZaWf2bvMOCHb09CEN+tN7topkMitbx6SYV6f3bm7UoQdfIHT3D/CqGowgECd4V//8PTMlsfvIiebWdmSRSdgvBwOhkMAEBFv5ruT0tDDCmQ3pABgOjSF+DM/aVRMdwWiUuNwK0iSZFS90DwIYjkBg1uR7Oj/TOCw16LSv7xIWTqhQiorkZE4yghk7E5IFWQjBQ6UWyL/jnz8BimGCnC1dLLjSIGUOTt1KADMhYSnmJeXrsM8bmzAQJr1+nhj93C+4JoTw+YM7zt7+LhjO4wue3YuIirgKABrapOV33ftjGE5DBGDYvSsXKNKA40S7QSMbtusOCyNLaFrLxosorG2C638HUMwY8fu1wDBgIRGgIL8Et0krsxmtktGpAGYwpMegQikmNuM7VYZ6rfpJmDSknS72AZWdKGg4AAGA0ahoVTYmtYR6VW7YVr69N8/WA9K00LNGQcTv+sTHhLlDwZ1jPAtnnoXT36FwnwGESKsAO66cQhkEVNiKDiXLq0zV7cS8z7/FCT4fRU1V+SFlMNA0jRPGWUidWoXzeHyBkCQNsNDiIHh8iiL1Wg1fKMJxgiINxa4mimE4QZB6/de8yhgK7sVkH7ydWELGmzHPLf/mIfWTK4y2wBjLJ5BKqjaVhXYGAKifX8+7theTmNHKHElgS1lIGwRgZGZc1skVKCFgdErc3NGs8fe4wsY4z0BTuZe26JOfoXwxZGjzZj/w7H2Qz4uYoWhorxDsHVzDy0ZaAt+Vo0Th1K1k0FH06WfpOupLzZwW5iEB4xTDv6+XceHblpciKAqSs9Trw6JJBpbU2WBIHaQMxowr41dlAM5DicKsABSj1blUTgoms8LlVkY7qjDQl1Ll0vkZqEBCmDsgGI6wIbuFljWZncToNTzjWFUCPzsYUE/SnYIcf+0ZaLwQHGUMbmRaMghwzFEufJmp+lIdQ96hX4V5l2VF11gghDJjb1Oj5paU5w3lCRFe0XiL/39rhsZEClxsVpiuYPKgAVxqScisjL4/xpjGYDoyBAGEpRMwPtSZz5c2CBE+gbWras9JW9mEiwgpMZwUQhzjyr0Z4ROYmYgoyZY6bPL8P/8X2TKbP18sJZ5daNS7YsdgFMHC9Uvg2GgG+thIG/pYff6mOL4EnLqVGJZfKc6rrAMhgqOoo7nws2cjyzokw3QMdODjXPfSMgqnbiUGgaGuZiJujGKcWADAWiYo3+0QKRq6WYibcmFuZRhO3UoSFzORVICXMT9YKYCiQCYs0WzTsgcNYSNfK3crLsyt7MKpW0nCx1EvC0n5tlk+BIggchFPbOwgg5RLIETMRES/mq5c9lVZhlO3EsZJIZTxcaa8/qw/ItuUUIh45fU8GGjmO39bPzuuKEiZhlO3EkbCx13MKnqtCGPqJZ8nFZTPwSnDQIWI6BXqVNoHwvEfcOpW8nhYioU4Wi5/2B9RiZNA/59tWt4gGdjY17qaM9cgpqzDqVvJI+bhHpYSpjz+sD8cgBqnTcufW4op9LgNr+/B44qMl3k+8QrpdLqvlvqTk5MTHh5ubFv3bwwGg0ajUavVWq0xabxM4WEhlgsqtPetsLepEEfLW3gzSdEdqjlUduB6X5VTdbt69WrlypW3bt2KfBWePn06bNiwYhJGUdTgwYPr1KnTokWLhg0bDhs27OXLl1/oAAwGw4oVK2JjYz/8IxI+7m1ZodOqIYJYSvlfKi+tlCBpxslcNKiOW2kfCMcXU7f9+/drNJodO3YYCjswFYWmaZIsLBL9b0jSWIXxQzYOIdTpdEVXNnYbeMNwgxA+e/asXr16y5Yt++WXX6KiosaMGVN0NYPB8NYjMRRW3Si2kKKoN78L24zKYDDodLrVq1fHxMQU5nr+bYuwy9/zRdwtRBbld9LwP4EQSoUEioJyM0A3ZudD2C3EydNa8tV2StN00UHSu25UCOGHF7liCvnwY/iojX/bWfQxMTE3b95csWLFkiVLrl271qRJEwRBMjMz165d6+vre/r06aSkpK5duw4aNEgoFEZGRoaFhdna2v75559arXbEiBHt27dHEOS3337j8Xi9e/dGECQ7O3v58uUjRoxwdHQ8derUnj17lEoljuO9evXq1q0bu9O3ZikDAHx8fGrUqIEgiFKp7NGjh16vx3E8Ozt78+bN165dAwC0a9euX79+QqHwxo0b4eHhCoXi/PnzNE2PHDmyefPmrOzu2rXrzz//NBgMtWvX/umnn8zMzNLS0jZu3Ojn53f48GGFQmFlZZWTk7Nq1ar9+/f37ds3MDBw7dq1N2/eRFHU1tZ22rRprq6ubx4egaGV7WQ3YrONhdiQigifwKwk/MRcjbGG0bcPRTOV7OVD6rm/a4WCgoKwsLB79+4ZDAYfH58mTZq4uLiwbz179iwsLCw2NlYul9esWbNOnToikejGjRsvX74kSZLH43l5edWsWRMzdpj+B7VaPXPmzI4dO9atW1ev1+/Zs+fPP/+0trZev349j8czrUaS5OzZszt37hwUFPQhX2Tz5s1ZWVnTp0//wC+u1Wpnz579/fffe3t7I+XbdgsLC+PxeF27dg0MDNy/fz+7UKPRLFu2bP/+/T179vz+++/nzp17+fJlBEHi4+PnzZt3586dYcOGNWzYcOzYsS9evEAQ5MqVKzdu3GA/q1KpDhw4kJOTw/7dqVOnGTNmdOzYce7cueHh4e8/GIPBwDAMSZL37t1zdHTEcRxCOHr06Js3b44bN27EiBFbtmzZvn07giCxsbFz5859+PDhTz/91KhRo0GDBt29exdBkE2bNs2bN69Hjx5jx449ceLElClT2Nt027Ztv/76a8eOHfv379+gQQOpVFqnTp327du7ubnt2bPn5MmTEyZM+Pnnn+vXr/+ex6CdTOCoEFbMzNPCbFPgaFZOsk0ZCHk4+lNjL7nw7cXK4+LiunfvPnPmTI1GIxKJDhw4MHr06OzsbARB9u7d27Zt21OnTsnl8uzs7LFjx+7evRtBkNWrV0+ZMiUiIuLw4cPdu3efO3duMV82hPDWrVupqakIgjx+/HjhwoWDBg364Ycf2I5oJv7888/bt297eXl94HexsLCwtbX98O8uFAoFAsGqVauQ8m27MQyze/fuvn37YhjWv3//ESNGxMXFubq6QgjFYvH48eMbNmyIIMj58+evXbvWqlUrBEHc3NymTJni5OTUvHnzffv2PXr0yMfHBy+E3aax3QePx1pn3bt3T09Pj4+P9/LysrOzO378eIMGDd51MAKBYNOmTeHh4cmFbNu2jc/nP378+MaNG7t27QoKCgIAxMfH79ixY8SIEcY0KReXKVOmuLq6NmnS5MaNG0eOHKlcufKhQ4eGDx/eq1cvBEGkUmnfvn2jo6N5PJ5QKBwzZkznzp3ZZ6NcLm/QoEGtWrUQBElJSRGLxV5eXo6Oju8/XRgAAbbyDJVBQ9IVcIINRYGljF/CJchLCZJmOlRzahVg99Z3IYQTJ07UaDSXL1+2sLBgh5APHz7EMOyvv/4aO3bs3LlzhwwZwppmKSkpGRkZhecHbdq06fbt2yGEv/3224wZM7p161apUiWlUnn9+nWDwVCpUiWBQIBhWFZW1unTp1lhsra2LtoAiCTJPXv2tGrVSio1+nkTEhJomgYA3L1719raun79+iqV6urVqwzD1KlTx8zMGMUSGhpqctrExcU9ePCAoih7e/vAwECRyBiqmZmZeefOHbVa7eTkFBwcTBBEp06d+vXrl5yc7ODggJRXdYuKinr8+HGbNm3OnDmjVquTk5OvXr3q6urKMIyVlZWNzd8ZxWZmZhqNhvUaWFtbs9ebpmmRSPSm14DVNfbf9evX796929nZWSqVJiQkuLu/cxTA3kA1atRo06ZNXFzcli1b2IVPnjzJz8+fNWsWQRAoiubk5BgMxoq1NE07OjqaHllBQUEPHjxITU0tKCgw2fMBAQFqtTo1NdXFxYXH4/n7+7PL9Xo9wzB6/d9tUPr37x8REdG6dWsHB4e2bdsOHjy46DChGDIBXtlGeicx79v/gX80KACSchHQSzHQXi4c3cQLf8ckSVJS0oULF3bv3s3e6sbfFY4HBwcjCHL69GlLS8vvv//eNOq0L4TVRHYhAKB69eo6na6goCAvL+/7779PSEjw9PTUaDQJCQkCgSAxMTEsLCw7O3vdunXNmjUbPHiwadfR0dEvXrxYuHAh+5J1s3h7eyuVyqioqIEDB+bn58fExLx69apq1aobNmyQyWTbt29PS0vbtGnTvXv3hg8fbm9vL5FIsrOz58yZExoaGhkZOXr0aLFYbG1tnZ2dvWbNGl9fX39/f2tr67NnzxbddXlTt3379olEovDw8LCwMAzDnJ2d9+/f369fP1abTHY1hLDo46WovW3yoJkGdBqNBkJIEER8fPzq1as3bNhQr149giD69Onz1mmBYurWtWtX9uWYMWPq168vk8ns7Ox+/fVXOzs79u7hG2t5G5sWazQanU4nEBhruubk5MjlcplMxuPx2EExOyDFcVwoFEJjh+B/3cdFv5GXl9f58+ejo6MvXrz4yy+/8Pn8QYMGvec4PSzFGSpDbI66nE0g/icQQczEPKkA15HMtxv3xg6xJ3zn42H1zsmEv/76y8zMzMPD443Pwtu3b9epU6fYWJIFAJCVlfXy5UuVSrV8+XJHR0cfH589e/a8evUqPDxcJpMdOHCAdRNXq1ZtxIgRCxYs2Lp1q1AoLLqR6OhokiRNnl+VSpWdnT19+nQfHx921LJp06bFixenpqbWr1///v37DRs2VKvVSqUSQZBjx445OjoeOXKEda7hOK7RaCZNmlS9evXly5cTBKFWq//fF5zn6Oh469atb0vdPmLAlJ6efvbs2WnTph0/fvzPQjZs2PDo0aMnT56gKFp0csc0KVNstsW0jpub2+PHj/Pz87Va7b59+woKClgTSa/XKxQKDMOioqJYz9275kzZrZlmLQcMGEAQxObNmxs0aEBR1OnTp8VisZmZGYZh6enp7OWJioq6cOECSZJJSUlHjx5t2LChhYWFr6/vnj17VCqVwWDYuHGjk5OTn58fO69q+joYhqEompSUpFarDQZDQkKCSqXy9vYePnx4QEBAfHz8f5xiAKrYySS8Clc7xJixJCQUYuKbnjjWU0ybKnYdA983IqNpmr1J3voWQbzdVcfj8a5fv967d++BAwempaWtWbPG3Nz83Llz3bp1UygUKIo2btzYz8+PJEkAAEEYyx3zeLw3Zx5wHDctZBgmJCTEz88PRdEqVap4eHiw2mpvb29mZmYaEbOHWrly5Xv37k2YMOHkyZMMwxAE8ezZs9jY2FGjRrHOIolEwloDxiAniSQ/vyQ7AZUt2+2vv/6CEHbt2hVFUXYsFhISUqtWrVOnTvXv39/W1tZ0FdlrgyCISCSytrY22UE2NjbswL5fv35nzpxp1aoV60dgH3peXl6dO3fu379/pUqVSJL09fVlh7p8Pt/Ozq6YMQUAsLGxYX0NCIJYWVkNGzbsxIkTQ4YMWb9+/axZs86dO2dpaZmamtqsWbNp06YxDOPg4HDo0KE//vjj5cuXTZs27dixI4Igs2fP/uGHH9q1a8fn87OzsxctWiQWi9nJUNPXEQqFQ4cOXbVq1datW8eOHfvq1as//vjD1dVVqVRCCHv06PGfp04qwKvayyIScsuDC+qDgQiUCAkpn4BQ+41+b4pmPK3EU1r6CYj3laj09vbOzs5OSUnx8flXZ3sAgJ+f39WrV9/6KYPB0Lx5882bN6MoKhKJcBxnGEalUsnlf4cK8/l8diRhGgC9GUJPEATDMEWXm/wkAAA+n88aXwzDvCm+3bt3F4vFR44cWbp06dSpU/fv389GdLHuueKngqLeJdPlQd0CAwMPHTpk8iyw53HFihUURVlYWGzatMnZ2ZldPnz4cPaPBg0aBAQEsPKPYdiqVausrIxlmp2dnY8ePfrgwQOZTFatWrXExEQnJycAwMKFCzt16pSfn1+1alUMw9iRaeXKlbdt28bKogkMw9asWaNQKExLBg8e3LBhQwBAkyZNAgMDHzx4oNPprK2tfX19Weeru7v7mjVroqKihEJhzZo12Uvl7u5+5MiRu3fvGgyGgIAA1iHi6Oi4YcMG09dBEGTcuHHt27fPzs52c3OrX79+nTp1srKyhEJhtWrVzM3NP+TsOZuL0pT619kVaHxa2HYAFRDYN2q5MRDycWxiCx8Hxb8Gg2/i4+Pj6+u7c+fOBg0amEQkIyNDLpe3atVq06ZNYWFhjRs3ZpcbDIacnBxbW1sIIZ/PL3oPoyjq7+9/584d9mViYmJCQkIxY60YNjY2NE2rVCo+n88uKap08L/aCbUpRK/Xt27deu/evSNHjjQzM7t+/XqHDh2KrZmRkVGpUiWkvKqbdSHFFpokgBURFtPEilkh7N8AgKKT1tbW1mzEGfvoY//g8Xh16tQptguxWFx042/dGmthVa5cmf3b3NycDcQzQdO0RqOxtrb+7rvvim1KKpU2atSo6BI+n1/sIWx0nxXC/s0G2X0UGADVHOV5OjJbY/jMtqffEAABdgrBo6Rv8vuSNBzZyL1d1f+eJWSf3P369evcuXOXLl3YSM8XL16wrpIxY8YMKCQwMFCtVu/du7dly5ajRo16q1u5T58+Xbt2Xb58uY+Pz759+zIzM9lRC03Tpnmtovj7+9va2t64caNdu3ashWXaLFM4FWZSN71ez7qJTOvs3r07KyvL399fpVJlZGR4e3vb29v36tVr4sSJeXl5NjY20dHRbdq0cXNzS05Ojo+PnzhxIvJNUVF6Yvn7+3fq1Kl02+IJcSzEUXE9NtsYIFIxBI6BxtlGHEVpWGLd/74OBopp6mc9stGHBpGFhoaeOHHi0KFDBw8eZBjG29t70qRJlpaWAIBZs2bVrFnz6NGjW7ZsEYlELVu27NKlC4IgHTp0eNMuq1Wr1s6dO7ds2XL//v1WrVrVrFmTjRzw8fEZNGjQm+ubm5s3bNjw+PHjrLo1atTI5B2ztbUdNGgQaxuiKDpw4EA/Pz92HdbT7eTkFBYWdvPmTYIgxo4d2717dwRBJk6c6OzsfOrUKZIkXVxcZDJjDbtbt25JpdIPjBYuO3D9TL82cTmaiPjcclka6E1QADLytavPvyRp+A3puYFivG2k2/uHuL97nvRdsF6wtw4nKYrCMOxD2gMam7YyzPvHpCaSk5MHDx68bNky09jloyBJ8s0pEXY+kPXZGQyGAQMGdOnSpVOnTsg3BadupcBfKflP0goqgvkGAKLV04tOPtOR9LfydSkGSvn4xj7BDby/mVZ+T58+tbCwMAWcliwGg+Hx48eVKlUyufa+FTh1KwUoBkbE58Tlasq9Aw4AhKbhlsvRMVnqb0LNaQh5GLqgY0D3EK707jdPBUwQKn1wFAQ7KqzEfLq8P1ogRDAU2BuTbZFvpAoIMrKRZ5eg/8ix4/gm4NStdBASWC0Xcwth+e/ujKHAQsov+5WKYWGL0l6hTqMae1WcqJ3yDadupYZMgNd0NZMaS/gi5RhjyLsQL/tqYaDotlXtprfy56St3MCpW2liJuTVdrGQ8LBvOlfp/UAEmov5cmGZzscyUEzLyrZLOleRvaPAEce3CKdupYylhBfqYsbH0fJqwTEMIhcSheqGlE10JN3Ix3ppl6oyASdt5QpO3UofO6mglou5kEDLsnXzWdmmfFwiMBYWRcoeBppp5GO9qns1C/E3Fu7A8Z9w6lYmcJAL67iai3nl0AcHIcIjMCHvgwJTvyawsP5Hc3+bNT0DraSctJVDOHUrK9hIBXXdLBTCcihwRvk2E5Upb31hLD7sGGi/pnuglYSTtvIJp25lCEsxr66rhbmIKGdxcKZs0zLyrWgIKQb2CHVa1KmqlJtGKL9w6la2kAuJum4W9lIBXY5MOAgRcwnPaLqVge9EM5CPoeOaei/uVEUmqChVJComnLqVOaR8vLarubuF2JiNXQbk4POBCBQLcAIv/ZuNpBmpAJ/fMWBcM58yNVLm+BKU/g3H8SYCYyaDWZCDAsdAeZhIhQiBow4KYel+Fz3FeFhJNvYJ7h7i9C3kvHJ8Lpy6lVGMRattpLVczCU8/FsfpUJjai1qJy81dWMg1FNMY1/r7f2r1/f6Zip/cHwmnN+hTOOkEMoE+N3E3DSlAXzLLd1RYHS9lYq4UQwU4OhPjTxGNPIQ87gbvgLBXeyyjlxA1HWzfJJW8DJLRTPwm6gj9CYAAKkA/8oVnyBE9BTtZime3MK3fbVvqc0wR4nAqds3AB9HgxwVtlLBo9T8rG+zLYMx21TCV4iJfC35dQSaYiAGkA7V7Ce39HO1EH+FPXKUNTh1+2awlwvMRMTjtILXWWoKwm9L4xgGkQkJmZDI1ZBfeq6SgZCkGXu5cExT767Bju9v1sdRjuHU7VtCSGDVnczsZYKHKfm5WmMTX/ANBYXwcTEfKwxy+YJHTdIMD0fbVXEc3cTLy+bvdrccFRNO3b49HORCMyHxKkv9MkulpxjU6NRCvoVsU1TM/4KJARQDGQYGOMhHNvZsWckOx8r8SeH4wnDq9k0i4uFV7eUuZqJn6cqEPC3JMGV/oMpAxMlMeP8LjEsZCA0U42gm7BXq8n1dN65GGwcLp27fMAohUcvV3CVf+zRdmaEyQKRMz6hCCG3lAqxEe5sadY1mzEW8ttXtB9Zx9bU1Nt/k4GDh1O2bx14utJUKYnI0r7NV2WoDREDZTDGCEFFI+CiK0FQJeN4Kpw6gXIi387MfWs+9iqOxJzEHR1E4dSsPoCjwtBQ7KYRJ+dpXmepcrcEYGVfGDDl2YkFIYAaK/JzAZNa/JhcSTXyte9d0qelm/g34HTlKA07dyg98HPWwELuaixLzNLHZ2nSVnqKZMqRxECEw4GgmytPkf4K4Qfj3ONTVXNzEz7p3DWd/O3mZ+W4cZRFO3cobGACuZmInuShDpU/I1Sbla/U0wxQmOZSuFkBj9z/UVi54lJSHfYy8UQw0li3CUR8baYdq9s38bH1suVAPjv+GU7fyCYYCO5nATiYIMMgS8zVJebocjcEYPlKqGocCRCH+oGzTwsbJRlFjIOKgEIS6WbStYt/Qx0rIheZyfDCcupVzRDzMx0rqaSnJURuS8nVJeRq1gaYLK8d9faVjs01xDLwrohciCE1DimFwDJUK8EAnRavKdkHOZv723GQox0fDqVuFAAPASsK3kvAD7KTZakNagT5LY8jXkRoDbSw98rVUjoHGbFNzES9HYzDtkzXl2PQpHENdLEReNpIabhYtKtk4mYvxsjkBzPEtwKlbxQJHURupwKawsnm+jszWGNKU+iyV3kBDpnAkWGhhGc26L7F3BiIyAS4VEhlKPQDG3aEA8HGUh6MuFuJaHhY13cy9rKUeVmJuGpTj8+HUrYKCocBcxDMX8TwtJRTNKPVUtsaQqyEL9JTGQKkNNMUYY24LRYb95xODOExONqONBhk+geEYEPMxRzORg0LoZS0JdDar4ii3lwt5ZaA0OUd5ApST0v0cJQTFQHWhumlJ2viHnlLpaRVJk7SxsC7b6cF4x0Djf8XvnSIKCABAC3WxcOBrtBnFPEzKx+VCIkepJzBgJxM6mAm55gYcXw5O3Tj+AwYaJy51JK0haQPNUDQ00DRJG91kJMNQjHEmtNDKM0qZ8e9CLePjqADHBATg45gARzEURb/YgJeD461w6sbBwVE+4TwdHBwc5ZOvN6vAGYkcHBUEUDZcEF9D3XQ6XU5Ojk6nYxjmK+yOg4OjFAEACIVCc3NzgUBQzv1uJEkmJCRACKVSKYpyA2EOjnIOhLCgoABBEFdXVxwvzZizL75vlUpFkqS7uzuPx/vS++Lg4CgLSKXSxMREpVJpZmZWiofxxY0pkiQJguCkjYOj4sDj8QiCMBgMpXsYX2moyE0pcHBwfGU4RxhHWYQppLSPguPbhsszraCQJHnnzp3IyEiVSmVra1u9evVq1aq9Z32DwZCdnW1lZfUV/MQQwqlTp/r4+AwcOPBL74ujHMPZbhWRjIyMPn36dO7c+cSJEy9evNi+fXuHDh127tz5no+8ePGiT58+qampX+cI8/Ly1Gr119kXR3mFs90qHDqd7qeffrp9+/aRI0dCQ0MxDCNJ8vr16yblIkkyOTmZoigXFxeC+Ls3aHp6+sOHDzMzMxUKBUEQplCm9PT0goICR0dHoVBYdC+pqakajcbNzY21+4qGPiUnJ2u1Wjc3Nwz7u9AuSZI0TQsEgrS0NK1W6+LismzZMtO7LElJSXq93s3NrWhckUajSU5OxnHc1ta22AFwcHDqVuF4+PDhuXPn1q5dW6tWLXYJQRCNGjVi/7569eovv/ySk5NDUZS1tfXPP//crFkzlUo1d+5clUr1008/iUSiZs2aTZw4MT8/f9GiRZcvX9bpdObm5mPGjGnXrh0rVStXrjx06BCEMDg42MbGRqvVLlmyBEXRrKysGTNm3L17lyRJOzu76dOn16lTB0GQI0eOhIWFOTs7nzhxQiAQnD59evbs2T4+PkOGDEEQJD4+ftasWU+ePKEoytHRcfbs2cHBwQiCHD9+fMWKFfn5+SiKWlparlmzxsfHp1RPLUcZA35h0tPTo6OjjW1LOMoGq1at4vF4WVlZb3331q1b27dvj4+Pf/369ahRo9zc3DIzM2ma3rFjh6Wl5eHDh+/evRsbG8swzIABA6pUqXLx4sWkpKR58+Y5ODhERUVBCLdv3y6Xy/fs2ZOSkrJ69WqxWNygQQOGYQwGQ58+fby8vC5evPjy5cs+ffq4ubm9evUKQrh8+XIEQXr06HH9+vUHDx4YDIZ69er9/PPPEMK8vLyGDRu2aNHi7t270dHR33//fVBQUFZWVlpaWkBAwJQpU5KSkmJjYw8dOhQbG/vVzyXH26EoKiYmJi0tDZYqnLpVOKZNm2ZnZ6fT6d6zTmZmZkJCwq1bt7y9vY8cOQIhjIyMtLe3j46OZleIiYmxtLQ8deoUwzAURWm12vr160+ZMgVC2KRJk+HDh5s21apVq3r16kEInz596uTktG/fPnZ5Xl6elZXV+vXrIYQrVqxwcHB4/vw5+xZN002aNGG3dvz4cQsLi9jYWLqQrKwsW1vbEydOxMXFOTk57dmzh6KoL3m2OL5hdeNGphUOsVisVqspiuLz+W++++jRo6lTpyYnJ0ulUoZh0tLSsrKyEGMzF9r0Lzu81Wq1y5Yt27x5M8MwOI6/evXKy8sLQZDHjx/36dPHtMGAgIDbt28jCJKYmJibm8sORREEkclkgYGBjx49Yjfr4uLi4ODw5vE8ffq0oKBg9OjR7EsIoVKpTElJad26df/+/ceOHbts2bJmzZq1atWqYcOGX+aEcXyrcOpW4QgICNDpdA8fPqxdu3axt0iSHDt2rJWV1b59+8zNzXNycnr06EFRlGmFIq1eoFgs7t27t5OTExuqPXz4cCcnJ4qiBAKBVqs1fUSj0bArGOtXAlB0ayRJmuJLjMUv31ZYAkJoYWExbNgwdjIBADBq1Cg/Pz8AwNy5c1u1ahUVFXXixInt27fv2LGjTZs2JX22OL5hOHWrcNSoUaNy5cqLFi3at2+fRCJhF+bm5qakpHh6et6/f3/btm1+fn4Igrx8+TIhIYEVIFZcTLZbjRo1SJIUCATfffdd0Y1DCBs2bHjkyJFhw4YBAJRKZXh4uEKhQBDEw8PD0tLy3Llzw4cPRxAkLS3t3r17bETbe1JZgoKCNBqNo6NjQEBA0eUMw6AoWquQoUOH1q9f/48//uDUjaMonLpVOKysrJYuXdqvX78WLVp07NjRwcEhOjr61KlTrVq1mjFjRu3atRcsWIBhWE5Ozu7du9VqNZsz4OTkZGNjM3Xq1Jo1a1apUqVFixYjR46cPHlybGxscHBwXl7erVu32rZt26xZs6FDh3bt2rVz587Vq1e/d+9efn6+nZ0dhNDFxaVLly7z58+nadrW1nbdunV+fn6sOFIUpdfrix6kXq8nSRJBkDp16rRp06Zbt27Dhg3z9fVNSkp68ODBqFGjAAArV64MCQlxcXF5+vRpbGzsoEGDSu+kcpRFOHWriDRu3Dg8PPy33347d+4cwzAikahz585Dhw5FEGTNmjXz5s379ddfFQrF8OHDGzRo4OHhgSCIvb39+vXrd+3aFRkZKZMZeyfPnj3bz8/v0KFD4eHhfD7fxcWFjW6rXbv2mTNnNmzY8OzZs969e1tZWcXHx7MDz/nz59vb2586dYqm6YCAgPHjx9vY2CAIUqVKFYPBUHSU2rJlS3a/YrF4y5YtGzduvHDhwsmTJwUCQWBgoJWVFUVRQqHw8OHDBoNBKBTOnj17wIABpX1eOcoWX7y+W0ZGhlKpdHd3LyPlOjmKQtM0qw7Flmu12g8PjtVoNEKh0HR92UlMNgw4IyOjadOmHTp0mDt3rml9hmFIknzrnMZ/7kgkEn3IQo7ShabphIQEkUjEPr1KC852q9BgGPZWFfuouP9i4hIfHz969GiFQiEWi8PDw62srIYNG1Z0BRRFP0Ha3tzRexZycHDqxlHyODo6jhs3LioqSqvVNmnSpHHjxpaWlqV9UBwVEW5kysHBUT5HplyNEA4OjvIJp24cHBzlE07dODg4yiecunFwcJRPOHX7ekAIuV4BHBzlOSJEQ9KZKj1aQlOoEEFQgDjIhB+4veTk5MjIyNDQUEdHR+Trcvfu3d27d0+dOtXW1rbocp1Od+nSJb1ezwbBurm5Va5c+StMMev1+oKCAjMzs9JtqftFgRkZiFJpvEVKBAYiUimwtn7/WgaDISIigq2gh2GYs7NztWrV3tOqnKbpnJwcqVT6Oc3b8/LyIISl2z+0rFEKt3WWyhAWnYWX0A0HEYRAQdeqDviHycHSpUtXr149ZsyYlStXIl+XlJSUs2fPjho1qtjy7Ozs9u3bOzg4WFtb5+fn6/X6Hj16LFq06EsL3P3795csWbJ27dqvL/RfDebBA/jiOVJS8k1RwMcXa978/Wvl5eWNHDkyMTHR09NTqVQWFBR07tx54cKFppoFxcjIyPipkAYNGnzyoa1YsUKlUq1YseKTt1D+KIWRKQAIjoKS/f8Dd52dnf3nn382a9bs6tWrycnJpuUGg4GtzJOcnJyUlFT0Izqdjs0uio2Nzc/PNy0vlvjNvjQFDxoMhvhCim4KRVGCIN6lWcuWLbtx48bDhw+HDx++dOlStiYaC4QwLi6uaMcWCCG7d/bA8vLyim3NYDDExMRkZma++V0YhomLi8vJyWFbJWRnZ2u1WjZlHUGQnJyc6Ojor9Yd5ouDYQhBlOT//+728C5QFB05cuSNGzf++uuvxYsX//rrr2fOnGHfSklJef36ddEiUXl5eQ8fPkxNTdVqtUVvqoKCgtevXyuVStMShmHYi5ifnx8TE2MqJ8UwzPPnz589e6bX6zUajamUS1JS0uvXr9+8PSoI5XZI8lb+/PNPkUi0ePHitm3bXrt2rUePHuzyZcuW5eTkmJubHz9+XK/XN2/efObMmSKRSKfT9e7du0WLFuHh4U+fPuXz+ePHj+/SpQuCIOfOnTtw4MD27dvZhMqTJ0+eP39+0aJFMpnsjz/+2Lx5c25uLsMwTk5Os2fPfn8zPTZvnFcIgiDt2rVbsWLFX3/9VaNGDQRBrl+/vmTJErY3SkhIyLx588zNzZVK5bRp05ycnB48ePDy5Usejzdy5MjevXuzWztz5szKlSuzsrJ4PF7z5s1//vlniURCkuTgwYNr1aoVERHx9OnTunXrvnjxIiMjY+TIkWKxuE+fPr169VqxYsXRo0e1Wi2fz69cufK6devYQ+L4BAiCYM9ez549x44d++zZsxcvXkybNi05OVmn08nl8mHDhrHl8+bPn5+amrp48eKdO3dWrVp1wYIFEMJff/318OHDSqVSKpUOGDCArYASGRm5aNGiLl26/Pbbb9nZ2Y6OjsuWLfPz8zt69Oj169dpmu7UqROO44sXL5bL5RMnTnzx4gVFURKJZMiQIX379kUqGBVI3QwGw8GDB2vVqhUYGNiyZcudO3d2796dtaSePXt24MCBCRMmbN269fHjx4MHD65cuXKfPn1omr506dLDhw/nzZs3bdq0tWvXjhgxokGDBlZWVklJSdeuXTPNEiQmJt66dYu1gHAcHzx4cGhoaEFBwbx580aNGnXy5Em2rsZ7MKVe3rx5My8vj62w9vDhw969e3fp0mXJkiXZ2dljx479+eeft2zZQpJkeHh4SkrKwoUL2UptP/74o52dXePGjR89etSvX7+uXbuuW7fuyZMnw4cPJ0lywYIFDMNERERcvHhxxowZ48ePxzDs+vXrL168GDVqlLOzs6ura1hY2MKFCzdv3lyrVq309HS2ai7HJ2Pq6RUTE5OXl2dd6K1r1KhR48aNBQLB3r17x40b5+/vHxAQ0Lt375s3b/bs2bNhw4ZSqRQAsHz58rVr1y5ZsqRWrVrnzp2bNm2ajY1N69ats7Kyjh8/DiGcOXOmUCgcPnz4tGnTDh06VL9+/apVq2o0mrlz57LP1GnTpr18+XLTpk1WVlZRUVGfltj7rVOB1O1xIdOnT0cQpHv37j179oyOjmaLZTMMExQUNGfOHB6PV7ly5UOHDl29erVPnz4oijIMM3To0J49eyIIMm7cuHPnzt2+fbt169YYhhW9Y9iXrFZ26NCBHeIJBIIJEyZ06NDh8ePHbxbCNQEAwHF8zpw5mNy5VgAALpJJREFU27Zty8/Pf/z48bhx49iGVYcOHbKzs1u0aBGO4wCA2bNnjxo1Ki4uztLSEgDQunVrtmvUlClTLly48McffzRu3Hj37t1OTk5LliyRSCReXl4JCQm//PLLtGnTeDweiqKdO3ceOXIku9/09HSRSBQSEsJWLrp8+TJFUdWrV7cvJDAw8KtclvIJiqJnz56laTo/P//cuXOenp5NmjTx8vLy8fFRKpUqlapv376nTp06ceJElSpVKlWqJBaL/f39Q0NDEQRRq9Xr1q2bOHFijx492NsvPDx8165drVu3Zp0bc+fOZUcDo0ePXrZsWVpamqOjo62tbX5+PtstDEGQuLg4d3f3SpUq8Xi8cuxXfT8VSN1OnToFIVQoFC9evBCLxWZmZrt372Yr80AInZ2dTaMwOzs7tpkAO4np6+vLLhcKhTKZrKj37a1cu3Zt9uzZeXl5bKWN3NxclUr1/o9ACB0dHf39/RMSEh4+fOjq6koQBE3T9+7dS0tL69atG+vRU6vVBQUFWVlZ1tbWPB6vevXqpi3Ur1//7NmzrIh7eXmZHNjVqlVjnYDe3t40TRf9CE3TbIMP9mWdOnXq1q1bvXr1wMDAZs2adejQga2wxvFpZGVlPXz4EEXRTp06DRw40M3NLTk5edq0aQ8fPhQKhQRBvHjxom7duqYLYXKWJSQkpKenHzx4MCwsjC1B/OjRI/ZaAADEYrG3tze7ppWVFU3TrAuPbcxk2vuwYcNGjRrl7+9ft27dFi1atG7dWiqVIhWMiqJuer3+4MGDGo2GtcIAAGlpaRcuXBg/frxcLi9W1B9CaHoJQPFCA+xbbNOdon0GjD14cDwnJ2fChAlBQUGjR4+Wy+V5eXmhoaHvL1XA3tkDBw5s1aoVgiCrV6+ePHlyw4YNfX19aZquXLnysGHD2FsfACAUCn19fdkhcNEeBRRFsUMhAIDpd8Le9AzDsG9BCIvGJRQ7KrbFVERExP3797dv3/7bb79dunSpdLOgv10YhunXr9+UKVOKLly4cOGLFy+2bt1qa2tLEESXLl0MBoPp3aJ3IIZhbdq0qVKlCnuNAABsFBHDMAAAkz/E9O6bV7NFixanTp26c+fOzZs3hw8f3r9//xUrVrwnKqVcUlHU7eLFi5mZmTt27KhUqRJJkhiGxcfHd+3a9datWy1atPiEDcpksuzsbIPBwFp8d+7cYTebkJCQmpo6YMAA1uK7detWsZra78J0ow8cOHDPnj2LFi3asWNHvXr1Dhw40KRJk2Ihaeyub9y4MWbMGPamP3/+fL169RAEqV69+pEjR3Jzc9nQpxs3bigUCldX1zcVliAIiqKK3vFmZmYtC+nUqVOTJk1u3rzZsWPHTzg5HEUvKAtFUbdv3+7QoQM7eIwrJCQk5M2eFa6urra2tgaDoWXLlh++OwzDij7VEATxKqRXr14BAQGTJk1auHDhR5XtKweUgrpBiFBMiZVdggjyn/EgDMNs3rzZy8urdevW7BQngiDehezevbtFixaGQkzrGwwGkyQVnV+HEOp0OtZiqlq1qlQqHTlyZJcuXSIiIi5dumRhYUHTtLOzs729/cyZMydMmBATE7Nnzx6SJNmHLTuIeFNl2OGhaS8ymezHH38cOXLkiBEjBg0adODAgXbt2vXv39/CwuLx48fZ2dmTJk1CUVQgENy4cWPGjBkNGjQ4cuRIYmJi9+7dEQTp37//nj17Bg8ePGTIkGfPnrGWIJ/P1+v1Wq22qLnn5+enUql++eWXqlWr1qtXLz09/fTp082bN5dIJMePH8cwrEqVKsi3Dk0jRb7y50JRxg3+F+x9YgqyYcEwrG7dups3b/b29kZR9MCBA4mJieyNYWtr6+DgsHLlypiYGHd3944dO04tRKVSNWrUiCTJW7du+fr69uvXj6ZpU48x0x3FbiQ0NHTBggVz5syxtbVt0aLFzp07BQJBSEiIWq3et29fo0aNKuD0dymom5iHeViISyp63HjfvL1X3D/k5+e7ubn16tXLJG2sPT9t2rRTp06xTquiP/uaNWuynjIMw3r27Ons7MwuF4lEbdu2ZX3wvr6+GzZsWL169apVq0JDQxcuXPjy5UsMw8Ri8a+//rpgwYLFixdbWlrOnDnz4MGD9vb27NCvQ4cOb7o/RCJRjx49THthYwhu3LgRExMTGhp66tSp1atXb9u2jW2A0KpVK5FIlJeXh2HY4MGDNRrN4sWLBQLBvn37WJ+0u7v7kSNHVqxYsXz5cjY4oF+/fqyB0KVLF09PT9NeHBwcfvvtt0OHDl2/ft3FxcXJySkjI+PXX3+ladrS0nLXrl3lwO8G7OyMTz/0g4LU/huGBrZ2/7mWQCBo165d1apV/3UkAEyePJmm6Q0bNggEgh49elSpUoX19/P5/JUrV27atOnWrVsajaZ9+/aDBg2ytrbeuXPn3bt3CYKwtrZm2305OTkVvY0dHR07duzITscPGjRIp9NFRES8fv26fv36dnZ2x48fP3/+PIZhwcHBP//8s2kOt+LAVa/8XN5V11+lUr0rNv0TMBgMJEmKxWL2ZVZWVqtWrYYOHfr999+/6wDUarVQKPxYVwvbjKoEj5yjGBqNhs/nf6DWqFQqUyDkJ6BSqQiC+PrhIGWkemVF8bt9Od5V179kBaLYLc6Ofdjh87sOwCSFHwW/kM84Uo7/4KMaQXzmXSSp2E8pTt2+ScRi8fjx44uNfTg4OIrCqds3iUgk6t+/f2kfBQdHmaZixb9wcHBUHDh14+DgKJ9w6sbBwVE+4dSNg4OjfMKpW4nBppoWXVIssfkD33rP9j/hkIpl53B8KzcPxzc5Z5pWoLsTl4OVVLICRHAMNPG1+cANPnz48M6dO3l5eebm5sHBwVWqVDGFGefl5d24cePVq1cAAHd391q1allaWjIMc/v27bS0NDbc397evmrVqkVzHv4+CggXLFjg6urKlpDMyMhgQ8+9vLzYnIGiKz979mzHjh0zZ8788JC0qKiojRs3Tpky5aOq2dA0PX/+/KZNm9apUwepkBju3aeSkgBeMmH6kKJxR0decNB/rskwzM2bNx8+fKjVam1sbNg6bu8KyqUoas6cOZUrV2Zz6Ti+YXW7E5fTY3OEmF8yu2YgI+ETT+e0EPH+4w5Wq9XTp08/cuSIhYUFW44mLS1t/PjxP/30E4IgV65cmTx5cnJycuXKlXEcf/r0qYuLy+bNm93d3SdNmnT37l1fX1+2AFHz5s2XLVtmYWFRdOMQwsuXLwcFBbHqtmbNmiNHjkyZMsXGxqZYtgCEcP78+dbW1h8V1anRaF6/fv2BCfkmcByXSqUzZ848e/bsm4pcEShYs1az/wAQlUz2ONRoRT17WO787f2rkSQ5c+bMrVu3+vn52djYvHr1CsOw/fv3myoXFd8shAkJCcV6CXF8k+qGoUDMx/9TjD4QBqIfsikI4ezZs3cV0qxZMx6PR5LkjRs3YmNjEQR5/fp1r1696tSpc/ToURsbGwBAfn7+7t27Tb0LunXrtnHjRoZhLl261L59+9DQ0OHDh7NbTk1NxTCMLbjGptfodLrw8PDOnTu/tdbzs2fPrl+/fuTIEdZmZEeOGIalp6czDGNn93caY1JSklAoNGloSEjI4cOHTTUeIIRJSUkQQisrq6KFHyCEiYmJGIY5ODiwS7p27bpt27awsLDm/9XrpFwC+HwgFpeUuiEABR+QyBEREbF69eodO3Z07twZwzCDwcAWHC26TkJCguky4Ti+YcOGYrlZaWlpJEk6OTmZlrAFXVAUTU1NNdVEKkpGRoZGo7GxsSl6SxgMhpSUFLlcXgHbZVWUaN7MzMz169fPnDmzdevW7BKCIBoWgiDIb7/9RhDEsmXLTOKiUChYm06v1wMATMl6bdq08ff3v3379vDhwzUazbRp065fv87n89laDjiOK5XKSZMmPX78OCMj4/79+3379jV1b2A5dOiQi4tLpUqV2Jfbt2+Pjo4WCAQXL17U6XQdOnQYMmTIwoULIyIiIIQ//vgjG7UbFRW1atWquXPnOjs7379/f/bs2exgWSaTTZ8+nf0Wly5dWrlyZVpaGttlbtOmTebm5k5OTv7+/gcPHqyY6lYqsP1f6tevzwoWj8crarWFhYWtWrUqJSUFwzAfH5/58+c7OTnNmDGjWrVq7OMwISFh3rx5jx8/pijKzc1t9uzZ/v7+CIIsWLBAq9WKxeJTp04ZDIZ27dqx1V/YbkcLFy68e/cuRVFyuXzy5MnNmjVDEOTgwYPbtm1jy0R36NBh9OjRFcqEryizCpcuXeLxeI0aNXrzLYPBEBYWFhQU5OLi8q6Pm56rmZmZaWlp7GNz+vTpx44dmz179saNG1NTU8PCwlAUFYvFgwcPdnZ2rl+//tSpU4s5vCiKunHjRuXKlU25nK9evVqyZIlKpVq7du3gwYNXrVrVr18/c3PzrVu3fvfdd9OmTXv8+DFb0O3y5ctqtZokySlTpuA4/ttvv+3du/eHH35gR7g3btxgy5ls2bJl06ZNDRo0MNU4rFWrVlRUVE5OTomeUY534uvra2lpOXTo0BMnTjx69Kho+6vbt2/37NnTxsbGdJnYHt4REREvX75knb/9+/dPTExcvnz5tm3bUBQdOnQoe+0ePny4fPlyjUazcePGH3/8cdGiRSdPnmTHCj179rx9+/asWbP2798/YMAA1nY7fPjw6NGjmzdvvn///rFjx65atWrLli1IRaKi2G6pqalmZmYKheLNtwoKCtRq9bu89QAADMNu3bq1YMEClUp15coVgiC6deuWmZl59uzZCRMmsMbg0qVLjx49ytaJDg4OVigUbm5ub/ry8/Pzc3NzXV1dTUtQFPXw8FiwYAGfzw8MDNy3bx+EcNasWQiCeHh4bNiw4cWLF5UrV0ZRlC0sodfrMzIyOnbs6Ofnh6Io2xcCQZBdu3Z5eXmtW7eOHfAW7cLl5uaWl5eXkZFhbm5eQqeT430EBARs27Zt7ty5Xbp0sba2dnJyGjlyZK9evRAEWb9+vaenp6nZGHuZ2Bqo7NTTlStXHj9+/ODBA/aGXLVqVbVq1SIiIlq1agUhrF69+pw5cwiCqFq16oEDB65fv965c+crV648e/bs9OnTbFl59pagKGrz5s3t2rUbP348hNDLy+vVq1fbt28fMmRIxTHfKoq6CQQCfSFvvsX6y4p2jSwGiqJ5eXn37t2jabpGjRobN26sUqXKrVu3cnJyTPqlUCiqVq3KOtHYMvkm06koJEnSNF107oxhGF9fX3YJAEAmk7m7u7NvYRgmkUjUarVpZZqmJRLJgAEDFi1adOTIkSZNmjRv3rxp06bsw79z585vLTPF4/EoiipWTJHjywEAaNeuXcuWLePj4yMiIvbv39+nTx+xWNy2bdtXr17VrFnzrZOn7LWLiopSKpWmlt4QQrbzLPvS3d3dpE0ODg5si4+bN296eHiYun+wpKamJiYmpqamdunShaZpDMOSkpJSUlJIkuTUrbxRs2bN9PT0169fBwQEFHtLKpV6eXk9ffpUq9W+WZoZQkiSZMuWLTds2FDsrWIdDD4ksozP5+M4XnSo8tZODqaFxcrts4wePbp27dp//fXX2bNnu3Xrtnjx4qFDh7Ltu966U61WWypFvio4BEF4FtKlS5dq1aqdPHmyVatWKIq+/z5hGMba2nrgwIGm6z5kyBBTMZhi3T/Y6Xj20r/16tetW7d169ZsMB2KohKJRCAQIBWGiuJ3q1KlSo0aNVatWlVQUGBaqNVqnz17BgDo37//kydPDh48WPQjr1+/zsrKYj1uRSv3sri5uVlYWFy5coV9mZmZ+ddff/1nSUKFQmFnZ/fixYvP/DrVq1cfMmTI4cOHW7duvW/fPgBAw4YNjx8//lYD7cmTJ9bW1qZZVI4vjVKpLPoAY7s1YhhGEERAQMD169fffLyZHmZBQUH5+fmVKlVq839atWr1/mvXqFGj6OjoYv1n7ezsXFxccnNzW7du3aZNm7Zt27Zu3bpBgwYVqnFMKdhuNAM1BrqkCvUyEH5IHC+O4ytXruzRo0fz5s27du3q6emZmJh4+PDh4ODgpUuXfvfdd0OHDp00adLNmzcbN26M4/jNmzdv3Lixdu3a0NBQnU5XrAMIWwu/c+fOK1euVCgUjo6O27ZtUyqVJnF5s6w+CwCgcePGBw4cKCgoYAtGF+3hwE7RFt2XqRMCW0EfAJCTk7NkyRJPT08/P7/k5OT79++3a9cOQZABAwYcOXKkbyEYhkVERIwYMcLa2hpCeOfOnZCQkE8rZvmtAw0GqNGU2NY0GvjGnfAmERERc+bMad26deXKlVUq1dGjRxMTEzt16oQgyMiRI1u3bt23b9+BAweiKBoVFdW1a1cXFxfTDdOwYcNGjRp17Njxp59+8vHxSUxMvH///vfff+/r66vX64sOKvV6Peuqq127dr169YYPHz5u3DhPT8/IyMjAwMCmTZuOGzeub9++Q4cO7dy5M47jkZGRUqn0xx9/rDgCVwrq5qAQdg9x4uMlc4oZBApw7EMELjQ09MqVK5s2bTp16hRJkkKhsFatWmzYGo7jK1asaNKkya5du9jIIwsLi8mTJ4eEhFAU1bx587fOOcyYMUMoFO7du5fH47Vo0aJy5cqmppPNmzd/cwjM0q1btzVr1ty/f58N4wgODra2tjaNOBo3bmyKY8IwrFOnTqwbztbWtkOHDjKZTCAQ8Pn8w4cP63Q6Pp/fo0ePn3/+me1ic+zYsVWrVi1fvhzDMFdXV3Yo+uzZs5cvX86ZMwepkPBr1TSe2ZJqmGIw8GrV/M+1/Pz8atSocfXq1XPnzgEArK2tjx49yoZo+Pv7Hzt2bOXKlcuWLcMwzNfXVyQSoSj63XffsUFCUql0165dq1atOnToEHuXBgYGsmGPDRo0KOo5qVOnDqtTBEHs3Llz7dq1+/btYxhGIpHUrGk8yGbNmv3xxx+bNm1avHgxiqJyubxv374VR9oqaF8FkiQ1Go1UKn3rlVYqlWxgxwduTavVshOaH34AkydPTk1N3b59+yc38mAYpqCgQCwWv+khViqVGIaxYSIQwhkzZsTGxu7evbtC3dZlhIKCAraR0CfcZu+/S98KO2/GjgmKolQqAQBfswo511eh1CAIQi6Xv+vdj23Z/Qk9IseNG3fkyBGdTvfJo0UURd8a3VLs+GmadnV1HTRoECdtpcKbQvPht9n779KP6okhrXhd6Cuu7cbBwVERbDfukc7BwVE+4dSNg4OjfMKpGwcHR/mEUzcODo7yCaduHBwc5RNO3coKpV5Z/9P2znUDKMvAin11SiHeTUepsvVJaAkJK0QgClAbkQd47wYZhrlx44atra2pZFBZY8+ePUlJSVOmTCm2PCkpKSoqiq07IhKJ/P39TSU2SxCKoqZOndqskA8PTw0PDz99+vSUKVPeFXxX+hTEQV0uAkroKQ4ZIDBDZK7/vSKEERERjx490ul01tbWfn5+lSpV+srFOcLDw8+dOzdp0qSPjZt7EwhhQUEBn8//tpLwS0HdcnRJN9MP4GjJJMdABPIAr4XLGPy9dzBFUUOHDu3Spcu8efOQMsnt27efPHnyprqdO3duxIgRbm5uAoEgJyfHzMxs/vz5bdq0Kdm9Mwxz7NgxJyen96vbvHnzHBwcxowZw77Mzs5+/vx5Wa6tBOMvwNQIBCuhTCzagNjVBAFD3r8W2wVm06ZNnp6e1tbWr1+/FggEe/fufVdfhS9EdHT0yZMnf/rpp89XN5VKNWbMmNatW3fp0gX5digFdQMAxVEeDkrmOQYRiH3wpt5lqGdlZWk0Gjs7O9PTlaIoDMNMEchsWUrT32y2wJvbSU9PJ0nSwcGhaBUjhmEwDCNJMi0tzcbGplhtr9zcXK1Wa29vz+fz3/pspyjKycnp8OHDHh4eeXl5ffv2HT9+fJMmTUw5Enq9Pj093cLColjmg06ny8zMtLW1JQiCrfD15sEXfWnqC8GiVCpzc3MVCoUp4J6iqMePH5sS+zEMY6uYFX2eFxQU5OXl2dvbm9qAmc6AVqvNzs62t7cveuoYhklJSUFR1MbG5pPz0t4HiiMYv8TUDQHGDf4XERERK1as2LZtW5cuXdi+CjExMWyuqKkYUV5enlqtfrP4h0ajycrKsra2ftNKSk1NZYt/vGu/KSkpbAEl9h7DCquS8Pl8tVqdl5f3UftKTk7m8/mmXhA6ne6vv/6qUqUKO4ZgfxoQwuTkZACAjY1Nsa5vZYSyeExfCFBIsYUxMTHTp09PSkrSarUymWz48OHs02n9+vXp6enz589HEGT37t179uxZsmRJ1apVNRpNv379xo8fX6tWraLbuXPnzsKFC1l1s7Cw+Pnnnxs3bowgSGJi4rRp0xo3bnzy5Mn4+HgzM7N58+axSc4Mw2zYsGHPnj0AgHr16rHdZ9565CiKCgqxtbXtV0h+fj6rbrt3796xY0dBQYFIJOrdu/fQoUPZj5w9e3bx4sVqtdrFxaVZs2b37t2bMWOGo6PjkiVLDAbDzJkz2dXWrVuXn58/ffr0omeGJMmff/45KiqqoKBAIBC0atVq3LhxfD5/06ZN9+/ff/78eVxcHI/H2759+717944ePTpv3jwzMzOapletWnXs2DGdTmdmZjZ69Gi2avGDBw82bNgQGhp67Nix9PR0BweHBQsWsBnjV69eXbx4cVZWFgDAwsJi4cKFVapUQb59UlJSNBpNo0aN2N88n8/38/Nj3zp//vyJEyfc3d1PnDihUqkqV648b948tkYDTdObN28+dOiQWq2WSqVDhgwxdeSIjIxcunRpUlISAMDe3n716tXFyjpERUXNmTMnKSmJzbuaMWNG/fr12Ttnz549J06cyM3N9fb2XrhwIVten63c+/vvv7P7Gjp0qKnZILuvxMREHMdr1qw5e/ZsiUSydOnS2NjYbdu2Xb582d3dfcGCBQ8fPpw/f35mZiYAQKFQLFy4MDAwECljVPRZBa1WGxISsnz58h07djRs2HDUqFGRkZEIgkgkkmPHjrFPyyNHjpw/f/7q1asIgty7dy8iIuLN/FCtVtusWbN169Zt3rzZ09Nz+PDhr1+/Zh+PBw4cWLduXY8ePX799VeCIIYPH87WONq7d+/06dMHDhzIptMfO3bsXdmgrLqxP4Dw8HBbW1s2c3DHjh2TJk3q1KnTrl27+vbtO2fOnAMHDrCCMnDgwGrVqu3YsaNjx45Lly49efKkprAQ0P379+/evWvaclRU1L1794rtjqZpa2vradOm7dmzZ/jw4WvXrt2xYweCIE2bNvX09AwJCZkwYcLo0aOlUmlCQsKVK1d0Oh2CICtWrFi4cGHfvn23bdtWpUqV/v37X79+nTVOt2/fvn///h9++GHlypXp6ekTJ05kGEav1w8fPtzR0XH79u1btmzp2LHju9p9fnP4+PhYWFgMHz789OnTjx8/LlrhKi0tbd26dRcuXJg7d+6yZcseP348dOhQ1oJmT+CAAQN27drVpk2bcePGXbp0CUGQR48edenSRSAQrFy5cv369Y0aNSpW/5Km6Z9//pmm6Y0bN+7YsaNXr15sDQUejxcVFXX58uUJEyYsWrTo7t27CxYsYIcvK1asWLRoEbuvVq1ajR07NiwsjN1Xjx49bG1tN23aNGvWrLCwsEmTJiEI0q5dOzs7uyZNmowfP75v374Mw4wYMcLGxmb79u2siVo2a6NWINvtrVQqRKfT6fX6ESNGHD9+PDw8vEaNGs2aNZs8eXJMTAxBEOnp6QMHDrx8+fJPP/0UFhbm6elZrMozgiD1C9FoNAaDYfLkyX/++eedO3c8PDzYFm0TJkzo2rUrgiBTpkxp3759UlKSm5vbjh07evTowVpbc+bMMclEMTAMS0lJGTFihEQiSUxMjImJWb16tVgsJklyzZo1Q4YM+fHHH9mqOw8ePNizZ0/37t1Pnz5tZma2dOlSHMf9/f2fP3++a9cu1jrj8XhFi7gSBPGmpggEgqlTp1IUpVar27Vrd//+/aNHjw4ZMsTHx8fGxsbFxYWt3cTKLtvtQaVSHTx4sF+/fuzXWbp06bVr1w4dOlS3bl22JOzUqVObNm3K1kcZMGCARqMBAMTFxU2ePJm1495VMOpbJCAgYMuWLXPmzOnUqZONjY2jo+Po0aO7detmKn8wderUevXqIQiyePHizp07P3/+3MPDY926dZMmTWJboPn6+kZEROzYsaNJkyb79++XyWTbtm1jFeRNE4mm6ZcvX/7www9Vq1YFAJhuTpqm5XL5jBkzgoKM7aXHjx+/cOFCkiQpilq/fv3UqVOL7atx48YHDx60sbFZtWoVa3Xq9foJEyYkJCSwrUL8/PwaNGjAtgaOiYkZNWoUe+1MDd7KGhVd3TIzM2fPnh0ZGYmiKIZhMTEx2dnZCILY29u7uLg8ePCAtbP69u07ZsyY/Pz827dvV61a9U1FiImJmTVr1pMnTwiCAABkZWWxNe8ZhrG0tDS1SpBIJDKZLD8/n6Iotiohu5wgiGrVqkVHR7/1IDEMs7KyksvlycnJQqGQ7f+Wl5f39OlToVD47NkzmqZRFH369KlcLlcqlY8fP65Ro4bJFVKjRo1Dhw59eHAARVErV648fPgwSZICgSAtLc3S0pL1PL61wjWGYcnJyTk5OexoiHUCNGrUKDw8nD0DNjY2pr6ccrkcRVGtVmtlZTVq1Khx48Zt3ry5UaNGrVu3Dg0NLR+lFlAU7dixY+vWrWNiYm7dunXgwIFevXrx+fz27dtTFOXi4sLWAUQQxNPT08HB4f79+zweLz09/ffffw8PD2edpHfu3PHy8qIoKjIyslmzZu8xjng83rhx4xYsWPD77783atSoZcuW9evXx3GcpmlHR0eTu83Kyort0RETE5ORkXHgwIGwsDB2X3fv3vX29qZp+u7duxkZGT179mQYBgBQUFCQlZWVnp5uZWUFITTZjCKRaPTo0RMnTty6dWujRo1atWpVq1atMnjtKrq6LVq06Pr16xs2bLC3t8cwrE+fPiaXeZMmTc6fP5+dnV25cuXAwEAzM7NDhw4lJSUNGVJ8yoxhmClTpmRlZW3atMna2pphGNPwgW2YYFKWoq0SAABFleJd6sOOE2fPnu3o6GgwGNq3b//jjz9evnyZ3Ujjxo1DQkJMK7OdenEcL2oG6vV608aLadNbd3rq1Kk1a9YsWbIkNDRUIBBs2rTpxIkTpvXfehOzC4t9HXagXewjRU/IvHnzWrduffv27XPnzm3YsOG3334r8bngUoTH4/kW0r1792rVqh0/frx9+/ZFb4aiJ4RhGBzHmzdvzj66EATp06ePvb09+/e7OmaY+PHHH2vWrBkZGRkWFtahQ4dly5aZPLBF7z32QrDTAi1atDB5A9l9sS1E/P39+/bta/qUSCTy9vZmp8WLtv6YOXNm8+bN79y5c+7cuY0bN7K+BaSMUbHU7c2Znbt37zZt2rR27drsfN+LFy9q1KjBvlWvXr0tW7YkJib+/PPPCoXC399/7dq1+fn5devWLbaRvLw8dmjAtlyLiYlJTk5+f0k1giBCQkLCwsJ69+7N1h+/f//+u+pwQQhZteLxeLNmzWrevPmRI0c6d+5cqVIlrVbbvn37YuvXrFlzwYIFOTk5bIu/s2fP6nQ69tZUKBRs30xWN+/du2eyI0zcuHHD09OzZ8+e7MuoqCjTd8Fx/M34D9ZGsLKyCg8PZ+tr0zR94cKFt3aPLQqO43ULGTdu3HfffffHH3+UD3VTqVRF2/SwrYLYew/H8bi4uBcvXrDK9fz58+Tk5JCQEBcXF3Nzc4Ig3rya9erVO3DggEajYb1pbwUAEFLIjz/+OGLEiN27dw8dOvStzyGGYTw8PMzMzN66r9q1a584cYKtZV8UdiBS1N+H43idQsaMGdO2bdvff/+dUzcjEGFoSJaUFWuM5kU+aGMURZ0+fbro06xr165BQUFHjx6tV6+eWCzetm1bZmamqUGMj48PQRCvX7+uXLky2/N4w4YNTZs2fbMrqFQqdXd337x5s4eHh0aj2bBhA0VR7K3AMIxWqzU9e9mX7FuDBw8ePny4r69vnTp1fv/997/++ss0sit22Fqt1nTMISEh33333aJFi1q0aDFp0qSRI0diGNayZUsI4c2bNy0tLX/44Yd27dpt2bKlU6dOHTp0iI2NjYyM5PP57BZatWq1f//+X375JTQ09MyZM0+ePDH1qNbpdOx3r1GjxrZt29asWRMSEnL69Onw8HAnJyf244GBgVu2bPH09JRKpb169WIYRqfT0TQtEon69es3a9YsZ2fn6tWr79+/PzU1lZ3yY4/fdAZommadbpmZmbNmzWrYsKGbm1t0dPTTp0/f/FGVAAxlDFIrKWiDcYP/xa1bt+bNm9euXbtKlSqp1erDhw/Hx8evWLGClSGSJNneuBDC6dOnN27c2MvLC0XRiRMnzp07V6PRNGzYUK/X37x508vLq1che/fu7dOnz/fffy8UCiMjI7t37+7m5mbanVarnTRpUnBwsJ+fX1pa2pUrV9q2bcueeZ1OZ7pz2NYcDMOIRKKJEyf+8ssvarXatC8fH58ePXr06dPn4MGDnTp1GjhwoLm5+ePHj9PT08eOHSuVSp2cnHbu3AkAcHJyCgkJWbBgQf369d3d3WNjY//666/x48cjZY9SUDchLnOWBKCgxIKbMAR/f6IC6wpp27ZtdHR00SnC+vXrz549W6PRrFy5UigUtmzZMiAgwDQccHNzGzRokFar9fT0ZMeAHTp06Nat25tGGUEQixcvnjFjxrx586RSac+ePX18fFhfm1wu79ixIxvrhCCIubl5+/btzczMEATp3r07SZLbt28/e/Zs3bp158+f/9ZZBU9Pz7Zt25rKRuM4PnXq1EWLFsXFxXXr1k0ikWzbtm3WrFk4jisUCtaR5+TkdPz48RUrVly7di0oKGjYsGGbNm1iZ11bt249a9aso0ePXrlypVGjRosWLWJn9FAUbdWqFZvI0bFjx1evXh09evT48ePBwcGrV6/+66+/2G89bNgwiqKuXLnC4/HYng8tWrRgY1N+/PFHPp//+++/Hz9+3NLS8tChQ6wla2dn17ZtW1PQnK2tbdeuXfl8PgCAoqht27bpdLr/tXdnMU28WwDAO53pXuHvQkXMRcANAwYIUI1Gbyyi1JhSqcHIPxrTGIqxxIAPigVFHwhBSN2iKLgkENCIiWI1uSyJ8abEEOofX1weCLg8ADa2hWaKTGfmRr9k0itQQBGwPb8nyzJTZ4bTb+Y73zkSiaSgoIB7CjmT/lr17aNvCklqU8J4eX99uxj8W7t2bVJSUltbW3NzM4ZhYWFhTU1NGRkZaJAeHx+v0Wiqq6uHh4dVKpXJZELH9ujRowqFoq6urr29XSAQLFmyJC0tDW3t0aNHlZWVFRUVfD5/+fLlP5SDRuPExsZGj8cjEol0Oh2KNdHR0dzZQVeFTqdDWUdGo1GhUNTX16N9hYWFoTmf2NjYx48fm79jGEYmk2VkZIjFYj6fX15efunSJTSrplQqWZa9desWOnf5+fkGg4E3/0Bt3m9cLteMrDJxOBxyuXxaC24mqoU/3f0SBMHd2KIHwNxt+IEDBwYHBy0WC/fGSJJkWdZ/3XOSJGmanm7Raoqi3G43Ct9TMTo6Ojw8HBISEngthFmWdTqdOI77ntzbt2+jjBC5XE6S5LirCBwOh0AgGNsGATWrnOhSoWna5XJJpdJpXcYOh0MoFI69EtxuN0VR/s+jn3M3T2rzBtdzt4n8+lIVZOp/1ZPWwv+V/dI0feTIEZIko6KiOjo6ent7a2pqfC9BP09wpvUzYwkEgmkdBKFQyA1sAwyGYWMPBU3T6PNs4cKFE111Ex1A/x+BOI6PfWYyqYn2NZUWM/P/3EF0C0AEQej1eqvVarfbtVqtSqUKpGyyP1pycrLRaAzaNi6zDO5MAQAzbJ7cmQb7SiwAQKCC6AYACEwQ3QAAgQmiGwAgMEF0AwAEpjnICBkkB7oHXuIzlD7OsizBJ7b869+438UPDMN0dnYODQ2lpKRwaUEMw9hsNrvdnpqaypUh/d36+/vLysry8/PnbYcHAALDHES37sF/DP/RSwU/kyw6Fs0ycsGC//79QkL426DX6zUajTabraqqqrCwEH2xp6cnOzu7r6/v6dOnarWaNyuGhoYaGhqys7MhugEQaNENx3CpQOo/GE0dwzIS4v+W3U2EoqiVK1daLJbc3FyUit3S0iIQCHAc960w43a7XS7XokWLfFfzcdVjBgcHxWKxb9b4REWBELvdTlGUby18DMOEQqHvYtXPnz+jeuXzs8ApAH+oIHru5vV6NRrNwMBAZ2cnenn37t39+/cvWLAApTSTJJmXl5eZmZmVlbVr165r166hqOf1eo8dO1ZTU1NQULBnzx61Wl1bW4u2abPZ9u7d6/F40Mvu7u7Dhw9//PgR1afX6XR7vtNoNFardexbev/+/cGDB7VarU6n271798OHD2f3kAAQyIIourEsu2zZMpVK1dTUhALTly9f0tPTuYEbRVHh4eEmk+nmzZv79u07c+YMCjcsy1qtVpPJFB4ebjabt2zZcvz48VevXqEmWBaLhSuaZLfbW1tb0WpnVF7GbDZfvnx56dKlBoPhw4cP3JtBw72SkpKenp6Kioqamhq9Xv9zSzsBAMG+zvTb/ANB6HQ6g8EwMjLS2NiYlJS0bt06rhxjaGhoaWkpqkeG1p83NzdnZWVhGIbj+M6dO1EHjdjY2La2tvb29oSEBBzHfW9gUXsXdNep+g71xzt79qxSqezq6oqMjPSNbn19fQkJCZs2bcIwDFWRAwDMlCCKbqhmi1KpjIiIMJvNL168KCkp8a0EPTIyUllZ+eTJE4qiCIL49OlTYmIi+i5N08nJyejHpFJpSEiI0+n0v6+enp7S0tI3b95gGMbn87lOCwgaMOr1+qKioo6OjvT0dJVKtX379sArBATAXAmu6IYKk6anp5eWlsbFxaWlpaG7SKShoaG2tvbChQtxcXEikaisrKy3t5f77ri9EXz/zfXiRRHz5MmTTqfz6tWrqOXK1q1bf2jUxuPxDh06FB8f39XV1draeuPGjRMnThQVFUG5AQBmRBA9d+Pk5ORs3LgxNzdXLBb7lkh59uzZ+vXrtVrt6tWrIyMjX79+PWl3dKlUShBEf38/evny5cuvX78SBOFyud69e5eTk6NUKmNiYliWHRgYGLfTQkpKSl5e3oMHDwwGQ1NTE+paBAD4I8duNEt7vB7e1JohTIphGRyb0v9iZGQEPWKLiopqaWlBXfu4zgCon8C5c+fq6+tXrVp1//59m822efNm7ne5qQNUUBdtKjY2NjIysrCwsKCg4O3bt3V1daOjo16vVyaTrVixorq6OiYmZnh4+MqVKwzDcF2y0BwrRVHl5eURERGJiYkOh+P58+dxcXG/Xh8YADBn0W2ZLCJzdZaQPzONx1keK8LF/hcqoOf9arWaa6fGZZaJxWKdTod6KaBkjuvXr4tEog0bNlRVVaFBGYZhO3bsWLNmDbepbdu2oU0pFIqLFy+WlZWdPn06Jibm1KlTVqsVFR8/f/58cXGxyWRCnRaio6NRfxa5XJ6Zmbl48WKCIHAcv3fv3p07d4RCYWpqanFx8diuXQCAnwPVK3nTql4/LoZhHA7HuFWY7XZ7SEjI2O7OHIqinE6nRCKZSq1nAP4I9PyoXgkjhR/9RAMXPp8/UYH5SZevoo5E090jAGBSwTirAAAIBhDdAACBCaIbACAwzUZ0+90TFwAAMAfRTSQSURTFVdEAAAQ8j8czOjo658mbv33OVCaTSaVSND08brI+ACCQMAxDkqRYLJ7zJKffnu+G6qO5XC4YvgEQJCQSSWho6Jynps9GdAMAAN6s+x+jVDopF0ieHgAAAABJRU5ErkJggg==\" /><br /><h4>Caption</h4>Figure 2: Dataset categories and sample counts for documents and pages.<br /><h4>Annotations (HuggingFaceTB/SmolVLM-256M-Instruct)</h4>Here is a page-by-page list of documents per category:\n",
+       "- Science\n",
+       "- Articles\n",
+       "- Law and Regulations\n",
+       "- Articles\n",
+       "- Misc.<br />\n",
+       "<hr /><h3>Picture <code>#/pictures/2</code></h3><img src=\"data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAAUgAAAFLCAIAAAA74oLKAACuJklEQVR4nOydBXQUVxfH78hq3F0ISSAkuLuX4u5QpEJLW1raUv2ou1CBtrSlLVC0QClQ3D0EAiSBuAtxz/ruzHfu7Gaz2WxCEgKx/Z09HDKZnZndzJ333pX/JViWBTNmzLQtyOa+ANBwNPdVmDHTFlCpVFprIpp9xH777bdv374tEAjqvhKWZQmCeITX1aLRflfmL0SL+dvQI5PJFi5c+MQTT9DQfERGRp49e3b//v3Tpk0bP368SqWqbU+WZcvLy0UiEY/He7TX2BIhCKKsrIzH44lEomZ/Ljc7BEFIpVKGYSwtLdv5t0FR1IYNGzIyMgCgOQ1bIBA4ODg4OTn16tVr2LBhde9cVlZmZWVlfiprkUgkfD7f/JjTolAoGIYRiUTNfSHNz6lTpwQCQTMbdieO8+fPK5XKuvdkWVatVqtUKj6f/6iurkWjUqkIgjAbthaVSmU2bC0Mw7QU55larb7vPkQlj+SKzJhp9TTniF0HLMsqlUrDJZNSqZTL5e3Nf04QBJ/PNz/RzLQFw1Yqlbm5uUaGrVKpysrK2uEtLhQKXVxczLNuM63esPPy8hiGcXNzoyhKv1GtVpMc0J7QaDS5ubn5+fnu7u7NfS1mWhMtzrAZhpHL5S4uLmKx2HA7TdMkSbbDEdve3j4/P98cxjfTug27tlwUlqMd3tzt83FmphqMGvKSQKMEex8QWUMrNWwzZsxUkX4Lzm+E3FjQqMHOE/rOg57T4X6YDbsurly5snfv3oKCgq5duy5evNjV1VW7/ebNmzt37szMzOzSpcvq1astLS2N3piQkLB///6IiAihUDho0KApU6Y4OTnt27fvzp07KpXK1tZ2+PDhffv2VSgUf//9d69evYKDg7VvPHPmjEQimTx58iP/rGZaJPeiYc8rUJgKNB+AgLJcuHcHB/Des+t+X+v3RakVUJAKxVnANHEk7M6dO0uXLhWJRBMnTjx69Oirr76qUCi0trd06VKSJCdOnKhUKsvLy43eePHixSlTpkRGRj7++OODBg06ePDgX3/9BQA///zz5cuXbW1tExISpk6devjwYY1G88MPP9y8eVP/3oMHD+7YsQPaObnxcG07XN8NRWl4E7dbWBbC9+CXwBcDSQNJAU+AX8jlP0EpbdMjdsRBuLoZ8pOBIMCnDwx9Gnz7NeIwt2/fvnfv3oQJEwAgNTX1xo0bM2fOPHXqlLu7+yeffAIAfn5+ixYtysrK8vT0/PTTT5csWfLqq6+aPJRSqXzppZemT5/+6aefarc88cQTeXl5LMuSJDlp0qRVq1ZpA9SbNm0aNGiQUCg0dP7zeLx2nV2nlMLJdXDrH1DKgADgW4BbEHQeDUFjcBba3tCoIDUMqOr3A0FBSSYUJIN7SBsdsSMOwr/vQNYdUCtBpYDYs7D3Nbh3txFHkkqlr7zyypkzZ9Rq9VNPPRUaGgoAAwcOlMvlly9fLi4uPnHiRPfu3d3c3OLj4zMyMpydnVeuXPnCCy9o9zQkMjKysLBw3rx5+i08Hs/Dw8OoAkkgENQn5a7dEfoXXPkTVDIgCXxYK6WQcg0OfwTbn4OcWGhvEIADtYntBJC8NjpiS0vh2jZQSYEW6rbwBFCcCVe3wvRPcdLSEAYNGvTOO++sXbs2ICDAxsbmww8/JAiif//+gwcPnjt3rqura0FBwZ9//ikSiQoKCjIzM3/77bf58+dnZGQsXLhwx44d/fv31x8qKSnJ0dHRycmp5llomr548aKVlVViYuLOnTt//PHH+xarti/K8yDqCBAkvrQQABQPX1l34NS3MPd74FX+udsDFB86DYesKOAbpMFrVODRFRw7NJthJyUlnT17VqVSjRkzJiAgoImPXpQKRen4JzeEpCA/AWTFYOHY0OMtXrz4n3/+2bJlS2JiojaEvm/fvkuXLv31119eXl7//PPPBx98EBISwufzSZJ86aWXZs6cCQCJiYmbN282NGyRSCSXy7WrcSNIkszIyLh+/bqVldWOHTtGjhxZUVFR07Dbr6mX54GkwPRDmSeAzEjIS8B7ul3RezbEX4TMCPxaCAIX2JZOMOxZzpcGzTMVz83NtbS0FAqFb7zxRlpaWhMfnaTwVdME8HnfmKfVzZs309LSAgMDDx8+rN1y8ODBoKCgkSNH+vv7v/TSS3FxcbGxsd7e3l5eXm5ubtp9HB0di4qKDI/Tv3//oqKiO3fu1DyFUqmcM2fOjz/++Pnnn48ZM4aiKG3pZUFBgX6f3NxcOzs7aJ8IbUBgCayuPqkaBAnKCpAb+ynbPnZesGADDF4Gnt3AtTN0nQTz1kPnkfd9X8NsgGXZ1NTUq1ev5uXlTZgwITAwUP+rW7dubdu2TSAQLF++3N/fXzu/7du3b0FBwaVLlyoqKqBpceoITv5Qkl1tlsJowLM7iGwaerDs7OzVq1cvWbJk+PDh8+bNCwoKGjt2bFBQ0J49e9LS0pydnQ8dOqStHnd3dw8JCdm5c2f37t1zc3NDQ0OffPJJw0M5OzsvXLjwnXfecXJyCgkJYVn24sWLJSUl8+bNU6vVRkUsIpGod+/ee/bsmTFjhr29fWxs7JkzZ3788Udon9h5QIf+kBsHFM3Nwg1g1GDjiq92iK0HTFwLkkJQq+r/DTTMsCUSyaeffpqcnBwREeHk5KQ37NOnT7/wwguzZ8+uqKiYMWPG9u3bu3bFKdO+ffv++uuvDhzQtPBE6APPjYOKfJ3bUKUA92AYuARnLA2BZdk9e/b4+/u/8MILFEW9+eabmzZtGjJkyIoVK+7cubNo0SJra+v8/Py33nqrS5cuAPDJJ5+88sorM2bMkMlkAwcOXL58ueHRCIL46KOPrKysXnnlFW2FMMuyr732GkEQfn5+jo7Ga4S33nrr1VdfnTdvnpWVVUlJyTPPPKN1zrdHCBJGPA+F6ZB8GX8kad2fkmUxN6PLOHD0g3aLhUODdm+Y5plGoyksLOTxeDNnzly8ePGyZcu0N+78+fO9vb2//PJLAJg7d26HDh0+//xz7VvKy8tXr169YMGCUaNGmTzmsmXLxowZs3DhQu2PDMMkJSW5ubkZZX2YLgJJvQ7Xd0LKdVxydB4J/Rbe16lQE5ZlMzIynJyctHao0WiysrKcnZ2FQiHDMDExMeXl5V5eXh4eHvq3yGSyO3fuiMVifWJJTXJyctLS0vh8vr+/v5WVlXaaLRKJrK1NpATGxMSUlJS4u7v7+PgY/aq8vDwvL8/Pz88wsbSkpITP5xul07cRJMWQcB5iTkFaOMjL0Kp5QggZD+PeqC2bsqKigmEYk19se+Ptt9+2t7d/7bXXGjZiUxTl7Owsk8kYhtHfZ3K5/ObNm4sWLdL+OGbMmM2bNzMMc+fOHYIgVCqVVq6sjmMa/tiwvGjfvuDbB1RynLk11l9KEIS3t7fh9eh/JEnSpOmKRKK+ffvWfVhXDsMtLi4ute0cFBR034u875Y2goUd9JgGPaZCRRGkhIGqApdXzlWLPjP1gX4Q+RUtKpVKJpNpByUAcHBwKCgoYFk2LS0tNDSUZdk5c+YYmUFqaur27du16oWhoaFDhgxRKpVaT7JWBUmj0bAsa3gibRGICaEFggCKM2mGwad724IkSY1GU7MWXSsG1JYj4QQBhBD8uVkew0BFRR1/XG3pfs0UwPYGTdN6lTG6qcqP9CanUqlomlar1ZMnTx43bhxJkjRd61maYNjBv3dbs2cz+GdlWWDuI4ZnpjYaY9g0TRMEoZ9C8/l8bc2w9se0tLQOHTpoFT9qy4709fV95513tP/Pzs7W5lFqd2ZZlqZpiqIMT6Gv5WxvQgvapQGPxzNaQGo0GoFAYJbvM1xj6+eM7Rm9xTXYToqKilJTU2UyWX5+fnZ2tlKp5PP548aN27p1q9bNs3fv3gkTJtTHAjMyMk6ePJmUlGS4c/tNz6gTcx6LmQbRYMP++uuvFy9enJKS8uuvv86fPz8+Ph4AVq1aRdP09OnTZ86c2bVr1wULFtTnUDk5OdeuXcvNzW2zfiAzZlrLVPzVV19duXIlj8djOLSBWQ8Pj7179968eVMgEHTv3r2ehtqXIzk5ub1pj5ox0+IM28HBdKCcx+MZpkzXn5Ywpbx3797mzZt9fX31c4309PTNmzeHhITMmDGjqKho27ZtkZGRKpWqV69eS5YssbW1NXy7VCr95ptvvL29lyxZot1SWFi4YcOGLl26zJo1yzwfMfPoaU5fVFhY2AcffHDjxo063Ob3pVxVHl4YHlEUoX6AivysrKzPOPQ57Xv27Hnvvff++ecfrVshKysrODi4d+/eu3fvfuaZZ4ymGBUVFV988cWrr76amZmp3bJ3794PPvhg586dLeGxZaYd0pxlm+7u7sOGDbty5YpRYLz+bEvatjF2Y3x5PE3QPR16vhHyxjDX+/QAqw0HBwdvb++zZ88uXbpUoVCcPXu2d+/e2ieOv7//F198od2td+/eU6ZMkUgkhm5qjUbj7e1tZWX177//vvDCC3K5/OTJk6NHj9am8bAse+jQoVu3bikUiiFDhmgzRuPi4m7fvj1nzhyCIIqKio4ePTpu3LiaCadmzLS+EdvT03PkyJFeXl6NM+y/kv5adnHZ5ZzL+bL8bEn2kdQjs87OCi8Ib9zFiMXi6dOnHzx4UKttJBAIBg8erG8AyrJsUlJSRETEoUOHRowYIRSayHKbM2fOiRMnVCrVzZs3KyoqRo0apdFotL0gDx8+bG1tbWtr+/777//000+YXmVhsX79+l9//VWbLq7dAVomCgnqeMSfw6pJM62E5hdaaJxVFyoK18esV2vUQOm1JiBfkv9DzA+bh24mjGqD7gfLsiqVatiwYTt27EhMTNy/f/+oUaPyOLQ7qFSq99577/bt23l5edu2basZn1er1YMGDTp9+nR4ePjx48eHDx9ua2urTZ6zsLD45ZdfpFKpUqm0tbX9+++/ly1b5unp+dlnn2mrQe/evbtr164WqoiUEgZnN2Ctv0oG1q4QNBrGrMbiSjMtm+Y0bK0NhIeHjxs3rqHvTShLiC+NN55wEBBRHJEnz3MR1pqVXRtqtdrb23vQoEHvvfdednb2e++9t27dOv1v+Xz+xo0bVSrVli1b3njjjZ49expppLAsa2NjM3bs2I0bN6alpW3YsOHixYvapJqysrK1a9fevXvXwsKitLRUJpNJJBKRSDR06NAJEyZ88sknR44c8fRskYJehSmwbw3q0tB8IEkoy0YZPYaBCe9wlZVmWi7NORV3dHTs3r27o6NjIwZtiqBM5sCQeAM28kOpVKp58+bt27evQ4cOzs7ORn4vS0tLOzu7+fPnKxSK6Ojomm8nCGL8+PGnT5+2sLDo3LmzdhpPEMSOHTsiIyP//PPPffv2vfbaa/p0ury8vEuXLgUEBJw+fRpaJuH7oOQeVtegVhGBdZQ0D2JOQB4mL5h5lEjV0gpVhYbVtALD9vHxmThxop+fXyMMu7NN52623aDGxxzoNNBR2BgXFMMwGo0mJCRky5Yta9as0W7RXlhWVtatW7dKS0vz8vJ2794tl8trKj0xDKNQKDp37vzzzz9/8MEHFEVpNBrt24uLi8VisaOjY3l5+fbt22UyGUVRcrn85Zdf7tKly5kzZ86fP//LL79ACyQnzljPhKTR1It1zn8zj4DYkthnLj/jt8/Pfbf75JOTj2cdr8+7mn9C1bjsFCue1Rtd37hVeKtMXoZPJ64SJMA+4OXglxu6wNZmv+sFiebOnav9j4WFhTb9ODo6es2aNY6OjgqOzz//3KhFHkEQdnZ22hnEpEmTtBtFIpGNDWq5LFy48MSJE1OnThWJRFoNFoqi9u/fn5ubu379egcHh08//fT9998fNWpU0yvDPSA1K2GxOloEQnNW9iMivix+9rnZdwruaH1JRzOOXsq9tGXYluk+05tSaKFpUSgUMpls5cqVkyZN0meGNEho4VzOufUx62NLYmmS7u/U/7Xg1wJtAhvdCVAkEhkmk2iLAQUCAcMwpaWlWVlZNE37+PjULL1gWVYulwsEAsPLU6lUGo1G6z+XSqUpKSnW1tYeHh5KpVIgEMjlcpIkBQKBdmeJRKLVP6t5bc0ptBD5H+x9tZpsqEYFLp1QpqYsGwWuffuCd6+GasI2OW1VaIFl2Vevv/ptxLdgeF9ooLtj9ysTr4hpcZMJLTQtly9f3rFjx9WrV6dNm9a4I4xwHTHCdUS6JJ0maHdx4xvNkiRZ00iqCmVI0o6jtrcTBFHT2nkc2v8baq1oTd1ofwsLC2iBBI2B7lPh9gEsn8QCaQIEVqgoePgjUHDFzyJb6DsXxr5qWv7azIOhZJQn7p0wnlWTEF0SnVCa0N2hex3vbc6/x+DBg3v16vX888/rw8WNw9uiSv/ETFPCE8KUj1BgMPoEytQ4+mEDipRraOE87sGklMLl38HeG/rOb+5rbZtoTHnLWPR83Mct1ZyGLaikGa/BzH3gCaDXTHyplVBRAFufwptK34aCpECthrvHcWDnt0UBtmaFR/JGuo6MLYytZqYM+Nv6+1ujEHAdNP8MypxN3Tqg+VCWg7ZttKImSJAW4/y8iQybYZmwgrCIogiaoEPsQoJsg6x5bW3xXE9Ignyu83NHso6klaTpErFYENLCt7u9bcWzaumG/SAVIGYeKRb2qNkuKwHKwIXJaEBsB+Jq5W6NRq6Wr7mxZnvS9mJZMQqNi+2CbIJ6OfRa0WlFiF1dPejaKl3tuu4bue+T25+cyjml1qi72XV7pesrM32wC03dNKdRxcXFXb9+PTY2dvTo0c14GWbqi4MvBA7D5LMqxW8GU9C6TQa6adZTn0d9vuHOBhyduBuzWFF8JefKlZwre1P37hi+Y6Tb/TtgtD16O/TeO2pvvjxfySidhc4CStDSE1TkcnlRUZHJNldmWijDV0Lw4/gfjQpfFA8GLkXDbgqypdn70vZhFoI+rodN+fCVU5HzYcSHZaoyaJeQBOkicvGy8KqnVTfziN2dIzIystkVVHJycg4ePLhgwQKj4Lk2fr5p0yZHR8cZM2bUTGItKCg4evTo5cuXZTJZYGDg2LFje/fuTVHU8ePHb968qVQqLS0t+/btO2zYMJZld+/e3alTp549e2rfGxoampWVpW3u12qwdIB530PyVSwOofkQOBI8m6xLXpY0K0eWY3qsoeBGwY2o4qjBzoOb6nRtm+YX/XxAq1ZoILUEsspA8wA+uLS0tLVr15aVmRgQdu/evXr16p9//rmmky81NXX+/Pl//vlnSEjI2LFj8/Pz33777YQErG3csmXLzp07BQJBQkLCokWLfv/9d4Igvv/++/Pnz+vffvz48VbZpoviQcAweOw1GLWqCa0ae1TxbdEnVMvfUa6Ry9SyJjxd26Z1O6523oXvrkFUHq74RvnCG4NgiFdjjkOSpFHamZbY2Nhdu3Y9//zzt2/fNvoVy7JffPEFSZIHDx7UZpssWrQoOztbG72jKGro0KFvvvkmALz55pubN2+eP3++SCQy9BTyeDxzqM+QjtYdH3N/7JeSX0wMNwz4WvveN8ZjpgWN2I1m+x1YdhDCMkGmBqkK/ouBOf/AzZwmO75Go/n888/nzJkTFBRUc1pRUVHx33//Pf3004Y5ZG5ubvb29tr/6+ftlpaWGg5oMzycCCUBxP+6/2+ox1ActNWYO6kbvblcjPl+830tfR/GedskzT9iG/XuqidFcvg+DBRKg0/Ag+wiHMD/nFwtHNNotm/frlQqFy9erC29Mlpgl5SUqFQqbac+lmUPHjwYFxcnFAonTZrk5+dHkuTdu3e3bduWmZm5cePGVatWWVlZNVoB6uGiUUN6OGTcQivy6gE+vXGyXRu5cRB9EgpTwcYdOo3ARPEmxdPC8/CYw/vS9h3POp5SnnKz6KZKo+po3XGe37z/dftf056rbdOchn316tVDhw5duXJl7NixDX1vfCEkFHMuU0MoiMyHQhk4P3DmdVJS0s8///zFF1+UlJRUVFSo1erS0lJra2u9efN4PLVarW+VJJFI8vLyNm7c6OrqqjXsrKysCxcuiMXi7777bvLkyQzDaHUXWlZyjkoORz+DiAPY1xKTAa3QxT3hbdPZJnePw5GPoSQLc1QYBsJ2wGNrMFe8SbHiWS31X7rUf2mxovhm0U2FRhFgHRBg3cLq3lo8zWnYPj4+48aNCw8Pb5TQApCmqjPJWrbXB8MxOScnp6Ki4u2339Y2IcrNzX3xxRfXrVunF05xdHT09/e/evXq8OHDCYJYwHHixAmt6arV6tGjR2vlzbQwDGNjY1NQUKDfUlBQYFI77ZFyZTNc2w40rcv91iiwLbGNK4x8wXjP8jw48gmU5uj2pACfBafWgXsX8GisC00phXt3UFPN2hXcjPuN2gnsRruZExxap0qpu7v71q1bG2HYQU4Q7AgXk3EGXgUD/d3BoeENrViWVSqVRUVF2oougiC6dev277//amVGt27d+t9//3344YeGBV40TT///PNr164NCQkZOXIkRVFFHNrfqjkMT0GS5NixY3/++eelS5e6uLikpaWdPn1a22C82ZAWQ+xpLm5cOfMhKCDUEHsGizosqwvIx5+HinxUUNFD8TDDNOFSIw07/SacWY9LAKUUrJyh00gMkucn4svGDfyHNLGyGsuV7OvrT9s6zb/GbtzK05IHbw6CqFwokVZOyNUQ6AKv9NflRDUIsVjs4+OzcOFCHo/Hsiyfz//jjz8CA3Wl3cHBwdpOg0bvWrx4sVwu/+qrr9atW2dhYVFWVjZ69Oh+/fppBVhrVmI+8cQTcXFxc+fOdXR0LCwsHDZs2DPPPAPNiKQIu8wb5X6TFBq8pNDYsMtyMc+MqH7DEARU6PQeG0bxPdj3OhSkYDCcovEBEf43rt5VUsx7AQKcOsCEteA3AB4caQnEnISky6BWoQchZDw+ONo6zW/YjWaCP+ydBT+Hw5k0EFAwPRBe6AcBOp90wwgICNi1a5dSqdTKgJMkaaguOH78+GHDTMuVP/3003PmzImPj1cqlS4uLv7+unjMmjVramaz2NjYbNiwIS4uLi8vz9nZuVOnTtC8iG1BbA1FTLXYCMNgQri4RvG5cyAOdyxb7cHJsuDUsTGnjtgPRWlVCi3ah4u8lHONc8fPiYcD/4OndoJVNdHIBlNRAIfegzvHOLkIAu4cxdeMzxt52a2HVmzYADC6A4z0xXAXASCu3ZV7XwQCgY+PT22/teao7bc2NjZ9+/Y12ujs7Fzb/p04oCVg4QBdxkFGZJW5YldqDXQeY8KcAoeBewjOn3mVsXeVElw7Q+CIxpz6XjRWjxj5Pg3nyTQfitJRwmXwg61Wru+GqCPAF+nyVCkepIXD2R9hzjcGmattkFa/5CAJsOA9kFW3U1gGF7c9Z0CvGUDxdbnfBAE9psOgJ0zszxPCjK/AbxDag9aZ79YZJr8Pdo0STkav+/3sitE8qByqWgnRx/AZYXgungCn5ZIidNrFnoWowxi9a3M0/4ht7lnXDCRdhtDtkH4DzdV/GGobVeRhQDtgGHQcaLRvRFHEmewzxcriLvZdx8z70jE7BfITwNYDF8CN9m+FjEeLwkW7fmhhjU2dpNBb/iCwGjRgY4cZgY+w0L8weleUjuflW0KPKTD65bbUCKE5DVulUik5mvEa2iNx59BxJS3Ceam8HONbbsGw+DewccG7PPEyZEWimFmnkWDjuiHmx09vf5ItycY3kjDIdfCmoZuD/Ac96DUEDIXes+HGblDLuVUAoVtm6z15GjUILdH+HwSKj4uF+AvcoF0JQeBIfvE3nBFo/SCKcrj8B04ixrwCbYXmNOwrV67s3bs3NDR08uSquj+CICiKUigURoVWNSVK2wlaPdMmO5xCApc2gaRAF47WzrGz78DlTTBoGRxYCymhgH1LCTi38VyfIa/c+1allOlvkytZl1+++vz+UftNSmQ2AIoHE9eiyOmdo2hXjn44BQjbgUMoSaIDz8IBxr4CLo3RnK2CpKDvAhRp06jw/7o5AaFTq9Y/RAiuF0LUEVyYOLSRrNXmNOxevXr5+vpmZ2cb5lETBGFra1tYWGh0Q2s0GpIk29u8XaPRyGQyJyenJvvgBcmQn2Ssi0DSkBkBhz/EYDV286Hxvq/I33JnvcpaVs0PQ8OFnAthBWEjXBvlMzMEFRom4Uut1I2oAUNx0VuUyjUJG9P4vBdDAodjQ6JzP+GcnCQwUK9rt2w07acxA6fkntmwmwArDhsbG6PMSjs7O5qmtWLR+o1yuZzP5zcusbz1QpKkq6urtm9B04CdPWrksZIUFKahD4nmVUazCJaETB6jG970ECBXyPNl+U12PVoHuBbXzvhqWigak22CxkLaTfwkd45g6Ktm4zGWwSkMv0WKQAOoGYguAKUG/O3AVthqE1QIgqgZYSouLraysjILpD0oDh3A3gfdZrTBDUIQODeWlRj6mQiWcNfQxg8BFoQCoZPwwWLLTQ7FQ+XzOrB0hODH8D+ZEcZNi7So5OA/GFxbRhiyOlcy4eNLEJHLGbYtrOgNS+sSFNfROlatLEcLrY5qXYissY8H3xI0Si5qzeA9be8Dw57FIav6N7ys3Fagr53UooFR7qOGuAyB5kWjgvxk7NedFQUp14jcuPrmigYOxwlCNdtmQaXAxfzol020NGpububA/H1wNAbulUGBBEIz4Kn/4Ldb93+jeQBsf3SdgGYQuhWyY9BT1Xk0DH0G58BxZyHudNV0lFUPV9l+6D3q44L95bISNG8S+rn0WxW06pu731zKvUQR1GSvyfP85lnQj3YGG38erm7FxDXtU0kpFQmtNf7DYexLODLXjU8f6Dkds1a0eeOokU5B98kw6kV04LUwWBZ+vQXpxQB6pz4JGga+DoX5wWBZZz91s2G3S0Iexxb2FYW42rSw1w13417HLPGsKK7VBAsiG2Lw8tdHPD+x9LW9qXsKFYX9HPt1tOq4MnTl7fzb2mH8QNqBf9L/2TZsmx2/1v5HTUzMKfjnDbxOXdE4pqCS5bnkje0gK4IFnNSUWlGraipJwcT/Yfuxu8dAVob58F3GYeVpiywOUWjgbGqN2mQCkksgthD61Jnwbjbs9grFw/JMQ1w7wcKfMOqbE4P9NAOGoY4CQQTbdgnu8Z52l3nn593Ou2141xxJO/JT7E/vdHunHt74ZKzicguqS8ihbjQqDDjLyqpidVoIEi028SJ6vwtToTQbU2J7TEc3e01oIQxYjL1NZCUgtm+B02892EnJ1AOHAKDv9yAyG7YZA6xdoc+c2n4ZVRR1Pud8TbfMoYxDL3R+wYaPPYNNUJ6PZdt3j2FxFUmBRwg8/hb+2whKc3D5YPq5QGDCydn1XHEY4Iwj5hSMfBGGPm36UHxxy+9JJKBgUgDcvWcwFdd223SDoOqldzVpiTMQMy2TMnWZRC0xTvEmQKKS4HaTMBqUZ7jxNy6GWQatLjkU/n0bijMbfHq1ApPb647nEwROwmkBjsOYXvYrThNaM0/3gm4eAEpOAU4DoAI7C/jfEBDcb0Q2j9hm6ouvpa+HhVesIrqabbPga9XBUViL1yorCrUcaEGVQfKEkHUHYk/CwHqXbZXnY95r5GGQFWN6SV22bfArkkSNl9hT4NSsRe8PRkdb+HcOfHUVQjNBwWBV8qq+KMh7X5rfsNtnomhrxEPsMc9p1PuFnGFXxsAoknzSezafrMVFmxVlwhQpCrKijUu7a0Negd6y+PM4A8ce3fW/Wwg8hYzr490g1AousF+n0/kR0sEWfhoPuRJQqMG7luVOyzLsW7dunT59+ubNm40QMzTTDKjlb6YqK0osd9jK79FqYKGTiv9ysfW01HyoTWtQbGOiPBO1HKzrq3QTeRASL1Ub8+sLi0t6r3okc+hJvYF1KVmRILDAovTes9Db1zJwsWhVKaW+vr51aBiYaVnkpwiyYr4q91isUMXylBQLvZTCDnLAKgt5GQhN/R07DMKQUllulceL0eBsPMC0Io0JUs4DIwOqHkm12jU8SevKSNRK6DgItdPqSewZnBpIuKI3YCH9FqoyT/+s5dh2g2jOabC/v/+sWbMCAwPblJh+G0atQBlTkuimEM2psJ0pse2g4gZSjQKTt0xi5YgSxUIrdJ4xajQ2lsHUt473b8GVXQH/JcK+0p4RpHbUrZ53yKirJZCxDCo9dR6Fok4aNao79ZgK0z+tbzRLIYXT32EAjCfEcZ6k0WceewYiD0HrpPnX2EZqnmZaLnaeYOsOWYVcFLVykc2oMSO1pkaanu5TsCQz4gDkJWJ4ucs46DLGRBlGdXbdhc8vQQQKJT7rJpg5hz32qeZbMci43CsV2HujzEPUYYxpA8HSfEJoCSNewMlzQQqU5WCA2j3YWKexDnLj8Y1k9UAazcOo/sAlXLlbK6P1XbEZ0xQkowAgrsYCwanB2ZHlqnKWZa35dS6LLB1RHSE7BqfTWieWRgUWjtB/0X0M1ac3vrTz5Hoslc+nwfL/QCbX3Z7Z4PQ9sZgPqi/UnxMsg4NzzxkwYiUEczIs5fls6T2GZ0HdPQYZt7EONLDhJaWm2/0RoJI9pH5GDxuzYbd+WBYu/QbXd2HSFcu1p+87F9O/6+dtSi5P3hCzISw/jAW2r2PfF4JeqKv3Xd/5eM+E/gXlucCoMMN8+ErUS6gP9Us4YwF+uVVl1Xr2EOOeoff728ih70KUT8C13GB8he8hTnxNShPRScdocPI8YiWO3g2KtjgH4qQDfQEGZ1WrwLtnaxyuzYbdJrjxN5z8Bs1bm2hZkomZXkJr6Df/vm+NKYmZdmZafFG81nV9JefKf5n//Tvq3xA705lhUkYe6uOSazHRvrSwv+tQW5/BGLtqUkrlkFhcYysLGaR7yqQ//LuIwbDmpOQenFxHSEt0BknSuDS49Dv49muYJrmlAwx8Ak58zQXnuE+kUYCjL/Sa1Rid+haAOYbcypGXQ8RBTsqXZ1CcrMEoEcp01wUL7OdRn6NV01ylAfdKKk76LPIz1lSX6piSmDlnZ48/Pm7B1efGJ304KX5tWPHNJv9AIh7Kzta8VgseYenoVM2qASDhAnq8DB8uJI1aS0lXGnziAYvg8TfRj0DRnMbjUJj1DTi31p5h5hG7lVOWh76imt08ynKhLB+EdSU0pFakXs2/avxsJyE0PzS5LLmjdTVJfSVT8eTlJVezr6P908CqlZczLiyVLTk29pi3pTfuoVGh/4llcaCjBegqy4xAB7VLAHh2r78fS0DBtEA4l1xdtlQDAzygW019B6wnrdG4h6B0PQYbBC2EQUtx9V6UDgIx+uda5yRcSyu+dDOIwALV8I0cPCxbnyIHpUap1JgQHlEySgVTFb5SaiAqD45lxF3Nzq26XwjsmhZTFPNf5uGVnZ+DpKtw+Xdsu8UCOPuj8zzxErfmZ1GWMGQ8DoYC4xwLNauOLIzMl+d3sunka1WVJ/l0T7iWBTvvcF2yuXP5OMD7I7mRvKIAY2YWDrq+BV49UThBUz25jWXArUvND8WyrICqpZxTj8i6kQUqLQyzYbdybFzBbyA21qhyOLN4o3cYgNZVJ54Wnv7W/mmladVb/EBHq45eFl7any6mw9tnIeweKJnuQNwG8V9g/R6QJfrd75TFQkoY7H0VJw64HCBwkY9ywqRuza+ogLDtGMoe97rh2cPyw94Jf+dC3gUNq7HiWc3rMG9eh3lX8q7Elsb6WXmvGDD1sQ59/k0AhQp6usKTvaGjKg72/oa5pRo1OggHLMTSS7WyllIQvv6n1IrU3xN+P5p5VMEoRriMeKbTM13tmkImsWVjNuzWz5CnMASVGoZLa8yjpFH0f8hT932fBW2xKmjVhZwLKiyo5DYx2EX0uU7PWfEw0yupGBYdgPQibvlN0MDaQfkq3M32ZV0cmwVH2hrCdqLEp75Guua6gKUx2aPfAn3bkExp5sILCxOLE7kjQ4miZGPMxi2JW2RKXdjJSbzuq36f/Dv7Jd10vDQLdr2CHxMVFAjIvgv/fYgZoGk3UONJ3y1UB4E56j2m4UcoT1pwfkFYTpj2A97Jv3Mg48CeEXv6O/WHNo3Zedb6sXaBBT/BpPcwrhs8Hia+Cwt+NhZRMEQlg8JMVXFGfGlcN/tufw75c6DLQBEtEtLC3k69fx3861w/XS/7X29CeiH38NfPcwkA2UJQ9eBiS2Alsp7kPBINrO5QFknhFLosV7/hj4Q/EksSq45M4J0oU8t0Pjymd37htOdORp9M4xoVAMC1nZAdi88ObW89iofj9q19WP5pbNWVKxHu2fNjzI9h2WF4IpJ70ZBRmvHerfeyZdnxpfElyqqpRxvDPGI3B5IiuLUfMm+jw6bTcEzGarSoiBaRNfRfiK/7Er4XIv87rE7aYFMST0p4pGCw86BPen1CU7SG1QTbBusVSFkWblVZYiUEgMYB5B5A3eJRvHd7vNvLeQCw98sdZBnsnmOQTH694LoJvzsWjQmg7FOQLgaNk4yFBfvkrwyEN/sqiayoGnXgtRRgYdhPgM+RiEMKr5CDmYeM73EazuScmXByQpmyzFnoPN1n+otdXhRRDW+q3rIxG/YjJzce9r6Ok0lWg/dy1CEIOYvd7YRNJx5uEpbBHiAnvv1HVLjIOV9WodscVxx7LvfcycdO+llVy1cjCFNyeSxQJPRz7xfiZju/w/KRbiNxY8BQuLm3mlyR1pmnX/OrVdChHzhXudmtaVMpbgRA+RoofwX/w70KKoRvnwZXASzjkaYCcKbQNgyKOAQRBzViq3KnjJrVZSpGdbvgNibnlCaH5obuSd3zbvd3J3tXtaNpAzzEqfjdu3d/4EhJSXl4Z2llsJx8z70o9O7wRFyJAol51JEHH/qpC5Lh2o4SUvWNQ4WMVzk1JXHqm1yc/HnU5zVj15MDuImx4WY1BDnCvnFrfx30l86qAWDgYvRmKbme9RoV1opQXDt7lZyr/dBgatqIFwyDUtO8pxkfmQBQu4KsujAThWf8K45f4dybs0+DN7BMZU+PmrDal0hSOlDKM93Vs/KzAwU38m/MOz9vV8ouaEM8RMOOjIx0dna2tLRcs2ZNfn6T9o5ovRRlYdc7ox5xBAkR/+nEuh4e96KhKCNOwETTSmMTJuBGYVihvMDoHfODYX537h7R7s+CrQ28PwzcjJpSuneFBRuwAMO1M2aqd5sCT2yC+Rsws7XndJjyIXb8c+Bi3ZVM85m2PHA5HlbDVW1pQ9YaD9C4GdshCZmlkNdlLvj24vSVNGjSaiXKJDt30qmjay3ZuBMAQQL1UrmDtYYb7fWvmpAgVUq/jPoyT45FJ+1xKs6ybHR09OXLl/Py8mbMmNGlS1W08PLly3/99ZdAIHj66adDQjASOH8+pjSq1eqjR48WFBQ4ObWw9hHNgpQT9zG6eQkSJIWmO1Q0IVg+Yeq+5q6F0VhUKMGxeo2jkIaNfZJGJfy3t6JXAWXfVx250EszpPP8Goq4AK5dYOZXKDYIDNhUhtlqL7rmkbzv+30/1GXo7pTduYqCXuXM8Iy09RbK60Q5sI5G0ktWPLB2coLZ38KVbdjvWiHBjJd+CzET5vDHkHqNK0qhwMIGpKXVbJdgR8rEWyqCPvAmo8viAViCIBQaUxWmJMSUxkSXRDu7tsrq6wc1bIlEsmHDhpSUlPDwcF9fX71hHzt27OWXX166dGlFRcW8efO2bt3aq1cv7a9+/vnnzp07d+rUEpunNAN2nlgqXFFQzbYZNUr/3q+S8UFxDQRbt0BpXmc1P5SWVd3/ir5Q8cKd/El9ku3G+8HzfTHHS0d5vvXBV58qu7OUEDNqkg8KuKMBxzIY/pzpDOo6XPE1sORZLvVfurjjYjWrEdw9CXdfnS6TPU3d2EV0qNqJG2MnBYCjAEDgCePfhDEv4xOKFuiCaot/hdTrivQo1spZ6OYPm5dhPilhMA9lNNMs+jw2fkNMRRLLahLKEhZc4ApIaoBa6q2zkKsJpuIikeizzz77559/unXrplLppo4sy27atGnWrFlvvvnmxx9/3KNHjx07dmh/9ddff2VkZKxdu9YsbKbD0gHjq2oFF3Pm0Chxsd1jhomwTdPiHAg9p9upYXWRpUBdOS9V9oGi/SB9QqOxL5QS2yJg+l74Lym/SME5xG8fhKy7QPBpUPNRKZPAmfPNfZhS1kRQBCUg+ZhO4xliKVd8od44kI3AX6AiJ0swMDEI5fuq4AkxlKUPlZMU+A1QDX5aETwJC7A7Dqr6YqFSUyXkcbHAurdDzz6OfWb5zprqNRUT2oxMmIEAq4BONm1n+GmYvVEUZWtrq23vqm/sKpfLIyIiBg4cqP1xxIgRly9fBoCtW7euX79+6NCht2/frqiodMLWoD599rTnaiM9dIevwOwRsQ3nbVJil7yJa6FzpSOq3jT42yBpHO7GvzHHbthORY8xfF8viw586bug8qgKJtOQUwrTDoT67Q1aemV5TNw+YCs91NoXxUOrzk+CpsXSASa/B779vZnUo7IlGxX/m+WUMLc7bJsBe2aCQ41QVIWq4lbhrajiqFJlqUQl4WdFWV7+DafltACs3XDFgT48JZpv/4XQEzNVtPBI3h9D/ljTYw22LtG2JWPRqnk0b1WXVe7i++TqtSIaM/0zmrGoVCqZTKbvU29vb19UVKS1/PHjx8fGxqalpfn4+Bg2sk9KSvr9999VKhVBEBcuXBg0aJCCo46TqtVqiUTSFkZ+goRBz4PvcKIgGWgB6xqEcaCyhhUtqFQqhmH0k6Z6n5qAXouJjmPGl+aN4LGnZdTLOcFZRvtQoFEGl0odtsT9eUPDOy7w9dAYttJFaVGpVKaSyIim9fbZdITJXxCpYfyyrGVi6yd9ygmnMjVLqGRQVnlybG9NUPvu7fs16deEsgSapL0tvGmSds7PXp5eNkFuhbMeoZXKravGxp2l+WrvfmzAMOyUY1ATwif4Hwd9PMx62O8pv5/IO8GwTKBl4DN+z8xznVfWwL9CS4Omab0RNcG6juTQKxypVCqaptVq9eLFi2t7C5/Pd3JyUqlUJEmKRCLtEe5rtARBtAXD5v4C0KEv+GFWI8FoOGmRhn0ugqMx3wajAhsXtZ27BQFdCkm+6QImGl8k3BWqfrUq/qDYxaDKSs06diTcgiiCywZvShhMbu81k2EZDbbL02BuGWfNpF6SnOTtTN35bNizCoyo4UMmq5x7LpFw0AM+LoHXS5xALuGV3iPHvK707Ip9vTQqnJBXn92oWNU4r3EjPEbkK/KVGqWT0MmStlQxqta+xiZJUj+Pa4xh83g8giD0Pei1VpqTk6P9MTk52d/fn8erK5XKy8tr9erV2v8nJibSNM3jqOMtSqVSLBbXvU/rhAa4X8lRDdRqNZ/PF4sfqElNRxfo7AgpBdUXZCwAHQt0mjYEdUUg0zBKSqsBzjDA4xMDl4jca5dYaTJM/KFZYH9M/hErz7S3rYG1qgj41KZgnMwyi1LHwZ3A9F2j/UIsUe281huGBzxLi6pZJL9aH53WCp/Pb6Rh53JIJJJ79+6lpKS4ubkJhcLx48dv3rx53LhxUql0z549zz33XH0Gk5SUlDt37sTHxw8fPrzuPbWP0tb+QG1pCCh4tT/2VS+VaMs8OKsmy8DyGyA5t7kGKI9uEDgHEi6CUoYjas/p0HVis1xtcnlydEl0ZFGk6YQTFspIZrRLWgmFkrdU6je9D1/YMGBDX6f6yTa1ORps2OvWrTtx4kROTs7vv/9+6NChjRs3hoSEvPjii0lJSTNnzlQqlYMHD547V1dFUDdFRUXR0dFFRUVtZILdChndAXZOg29C4WoWSNVS4F8F629BeEKfkTKiwzSq68vYnlIpQ4VtLrVGyUC+BKVKncRV8+S60KghJRT71Fu5oONajP7X+pNcnvxp5KcXcy4WKYtUjMq0YXMPpUJK5xLXkGxYXtjyy8svT7h8H4XGNkqDDXvt2rVvvvkmTdMMh5UVZji7uLhs27YtNjaWz+cHBNRXTaY3R3x8vFmBuBkZ7w9j/aBAAn8lHXrn9jIVUxni1sAAtwFPBSzH/1s4QKVKwt5Y+C4U60MIAsZ1gDUDYYCuFtMAjRpFF9RKcPABSTEceg9Sw7kMHALs3GHCO9CpvkKi+fL8OefmhOeG43pB65uvJxTcKb7zb/q/T/g/Ae2PBhu2oXPbEIqigoODG3QolmUZhjF3C2h2aBJcrWBNj1k+tuwvsb+GFVy34dvM7zD/xS4vGnXb+zsalh4EmVK3LP/nLoRlw39zobuLwU7pt+H8T5ATxwXzfEEpU+fcuShWRfEVnhp6VLHM9tAHYO8FTtWkl2pja9LW8PzwRjp5WYgsjmzQO3JluTElMdY862C74PvLrbRgmrO669q1a//999/169fHjx/fjJdhphJqju+8Gd6z5IycBFJMG3vmSuSw7hrIFAZ3DQ8yi+DbMPh9ElDasTQ7Gvasxlg3KiKgklE8X/WCe+FZkUQNLAngb8f/IadiXPRJGF4vwz6bfRaTyRu7VvMQ69Po7kOFqmLd3XU/xf5UqCgkCbKXXa9P+nwyym0UtE6ac3Hr6+s7ceJEHx8fhnnIadLtDY0Sk9vqhmVx2aySG22mSdqStqxp1QAQXwgJWjUVQ0iIyIVCqe6gmJdWlKZLDiMpFc1/1qngpLgCW/hx5R7xfOXTzgWxRVH1LMMka2uved9bhgFboe10n+n6DXWf8Js737x3871cWa6aVSs1ytC80Pnn598uxOrO1khzjtiuHO7u7mbDbjJKsyF8D8SdA7UcvHtBn7ngYUrfKyUUwnZAynV0hnUejelZ9ZgYKxi5giFqBudYltGgndFYd516vUr/gCUuiCrOiSTVTIqFDCG7N+Pf//1jDYOfANeguk/6mPtjh1KrN9BioINNB28L7/NZ53ULbw6SIBltIQ2LDgJnsfPX/b/2tfQtU8B/CXAmFdvQDvKG6YHgWmM1mSPN2RC3Af+nT8KjIK8ib1PCpvX261tjymPzCy2Y19hNRmke7HkDki4BRvsJyImFuLMw+xvMxDYk4QLsXQOSAp0FXtmM7TIX/oyCu3XC8uNYWgPyXsYeLP4NIF0BvDGpDivMq+w4ii83OU7eJcvZ8N1ERjiKOjnXFRVf5LdoT9qeC5kXdJ4z1BomVgWtmtth7ldRX+1O2Z0ty9ZWkuut2k3stsx/2Uzfmb0cehXK4IVjsCtKd1HbbsMuP1w4+NtXO0tUSVSRosikErOKUfFbTK/s1jEVv379+gcffHDjxg19rouZRhNXGrc37OM9uUdiLUlsLkdSWFtSlgtnfsCZuR6lFC7+BuX5qMqE+mEkqhfnxMCVLfdtUiUuvinmfQRkRfVslruE1TcUwY0QBAmOHQzrT93VpkcOd4ZH8EXoOb+6pe56VVuB7a7hu17p9kp3h+4dbTqOcB/x+5DfX+7yspvIbV2/dUfGHLHgWRhNsitUFY95PNbLAesLf70Ju27r1M7wxYMLSfDBRePPasWzIkw53K14Vq00FtucI7abm9vQoUMvX75szjx5ELQNPX6L+S2lPAU8wVdV9lS53duljnifUnzUVyhMrxoV85PwpfVs6SEp7PYuK60rwiwr4p85w5dM1uWxaBHtB4vXujr1dxC4YGLsmR9QjVTfs5Jgx8gtfZVkKo8xtBoRQ06UWmF5CUmhs01aAha6ATS1BFJLwd0SAuyr0kDdRG7f9PsmW5ZdoarwEHsYrv+vFlytUFZUM0kCyuXlRzOPDncdrtTAzrvVxRg5h99/iZBTAW4GUlRd7bqG2IVE5EdU8yBoYIrXFFr7zGptNOfTyNPTc9SoUd7e3uY19oPwa9yvb994O6UiRZs+ncpT/c8ub6NVEVeYxZUuqg08ZAzDyRLUOIq2i2XtqOKuvFnwVLZqObCVK1Rcyjr6WPJWd3mZIiiI/A/Ob8SWQ3qLZBl7sduP3T/zsvLWS/+LWOLdEoeRcgsgtALGWAeNq9wK7LDZYxM8th26b4J5/6CvzhA3kVuAdYCRV69QUWhSFLFYie2/1AxklZsIfUuUUFzdaWhBW3zR+wsnkRNeJ8O9VDDZb/LCjvXQh2yRNP/TyGzVD0KJsmRr4la8EfVDDZfj/Zdl6TyJrZ2KQWkHe5+qNzj6Ymw5/QZOxfVoNChpJKorIexcrtVRdqDR2AjyQU+JN/R06I0Pi6jDOE4QPK7njr57tnJCl2VHO03cl7L3TsRmz6KiiQq70fLKZBeNBtWUxHYSJbx0Ev6+rcvsVjHwdxSklsHJBWBdZyx5oNNAmqLV2EnPYCsLvR1649qfgq7OcD6luiefBWcL8KyRjTbOY9zhxw5vitsUWhBqw7eZ4jXlCf8nnIWtVVClOQ1bKpWWlZVJJJLW6HVsIWRLszOlmTUHpQxKdY+Q2hGWMHhpNf1TkQ12n8uJBpVC15tKrUC32YAn6q7WusIEm1BEAqqA6MvN+4h75al3xVKWkgcpBV5qPmfbBNZLFmcGe/cM7hnM8PuT+98GeQVQXBm0WolPGWwrT17KgH9jOKvWfxAawjIxy21596qTxZfGX867LFVLg2yChroOlWvkRzKPaNgaExACtHLCNAnP9oIrafik0M1NuTOv6osCrLkSrPSmDT50X8e+fR37KjQKkiB5+gVF66Q5DTssLGz37t03btyYMWNGM15GqwZjzpSJmLOFBizt/KDvM9gHx4huk/E2v7oZk7cJEgKHwZCnwe0+YSdrO3sTls+A2Bb7/v2ZuOk7UfhdUQlLQJBK8Fy57fPlDmhFPCuw1aWIkMGP4/I7dCu26SAp6DIYBi9HTSiAqHxQKrDAqgrUNoRLGVWG/UvcL19GfJlcloxibHzhFO8pFrTFn/F/mlxNhhaELvbHquHpneHj0fDZJSjh4vpiHizuCiIaxu+EfCm4WML8LvBEt2rvbdUJZy3CsAcNGtS7d+/y8nJzrnij8bL0Gu0+OrYottr9rYJRnRZ4D/ypZh88Hd0mQpexXJ93Hlg7G3erNMWUTuQHl6BUZuCWYUAoZCf5E4cy9z4b+rySUGpHzrsCxYv8XB5LDpMKVAEDO4otqx48QaOxQYK0FJ8RIlv9ahy77dWctBFgXWnqp+6dejH0RWxFxN2wco387+S/tf1DTMACHws2EQEFrw+E2UFwNhUFF4Z6wa+3YPVxXARovYDHEiGpBP43BHit0vldK835afh8vpWVlb6C1EzjeLPrmwPdBuIyW829GCzeeKvvJ0RtVq2F5mPCto0rWrW8HBvrJV8DWXltu3e0g/8NBj6NMgXaExEEvNyf6O2m+u7uT0qVzqoRFt12/7PLG++eNV59ZMKpibtTdlcdiKRRCElsZyh+MNADHK2rJ5NxPcimBuqO90fCHygXo18KaE26lvpNAU8w3KVaIXAHW1jeA57rDeVK+PkmaiLpWoLTuP8PYXC7Zs+TVk7zO8/Msa4HxNPC87+x/21P2n4y6yQAjHEfs6jjIntB9QyM2mBZbOJx8TdMWdPKjA55ClPW0m9CcRbOov0H6zvpvTYQgp3hjwgipwwcLHAYXBACUpX8al6o8QDBQj6lySc0IMvJqsi5kntZzajr8DD3cIV3hsD/ToOkciAVkvB8PxjBef2kammaJK3+dV22QtttydsOZx4e4z5mkuckDHRXsieGk0IzvOtJKKmAS+nQ1w3aEs1v2PURM2xjKDSKA+kHLuVeEvPEkz0nD3YZ/IAHtOfbvxj04otBLzb4nXePw+EP8WbXaqQWZcCRT8HSEZu/o6IQoCj/+LewiQ/H+I74qlAadv+hrPnW2E+vJto2ADSo1KofYn543PNxB4FDbRfSy/0E6bgNSqeBpguQaWD1d88O4wliFq6oKaE939RziisDNdZoJ4hcWe6+lH3AwqbYTUsCl/zQ/wd9Sba8ljWfrM2tBZtzKh4dHf3nn3/GxMS0q8yzdEn6hJMT5p2bt/7u+i8ivhh5bOQr11+pUNeq4voQUSvg+k5QSHW9tVHGjMI8k5JMrgOREENiufFw8F1OCL0Kw55eYp54lt88bnZbOyTElsbGl8bX9vt7uRGrLj5VTv8FjrPBuSc4TZQL/3gp7JnkcnSVUQS1wG9BVUMSLSy4WbphWFsvNsoCTdC6RkUkN9MmYUvcli1JW/RvGu5T45Zngc/HFtxtjOY0bG0xdruairPAvnfrvTOZZ1iC1d55Kkb1fdT3+1L3PZoLUDLK0/dOr7u7bmfq38V50VCaa9yoAM3bYAuPj7P0mNMmjqWSQ8IF4sael4UDezn1wC2aypY9tagvmr4mhj136+eoCm33PAYIOXcUKJQV70zeqd1lhs+M54OexyQwjc6PEGwXvH/U/l3Dd03ymeQqdPUSew1yGUQbaTMS+A3vStmFuisckwJgmC+gRLq2rxCXiDKpEwzzgjZGc06DQziuXbvWfupAMioy9qburRYPJrB6YUviloV+C43vywdHreDayupyURLLEp+6/NTl3MtqVk2QhJ/Q/WvCetp97gEC5+TFmcab027A0c+wzgRYf0rwn6v3z77dLrPZJMvmyfOMlckYCLbv0dm2qiFUNRTF2UlHmJqePgbisS8PIqAE6/uvn+49fXfq7nJV+UCngfP95ms7/na177rqyqqj2UfzlflyjXEVKhAY6lezah6X+2LBg61T4P3zcCoFihTgYQGP+8MHw8GizTlwm399265iXVmyLJM3X0pFiopV0U345yjLhRu7IY0TJPLsBv0WlVvbvhz2MpY6crnTLMsmSbNWWOR0Ke8QqOLX6ppiQUPRiQJVccGNjpY+uu7Z5QWw/x0oSMJcdOySqXBLi/5QNE45Yx0ptEkpT3n81OPJxcm6+TCAmKReFfS3VTFGkqElcjiRAkV5VJqiH4izgah+J5Bg2NmXIIjR7qNHu4823EXFqFZeXXk04yhQoNbKFRvBYB64gKwKTfvYwJ9TILYQ4gohqQh8baFUDnbVm5a1AZrfsNsVnmJPS55liaKk2lYGAqwDmjLVqTgTdq3Cug4tyVch4Uro4LEns08bTRbyeJo/LEs+z7fTCaAwnAQ3Sem6TAPcEMo+sC04lfYek/aeg8DhycAn3+j2tmXUYSjEbgf64+B8PvEMP3M2BA4PsAk4NPrQl3e+Csu7qipOC1RQL5Q7jM84DjevYTPdntO1DXoOxMFrpyCpGFiwoWEXoTnD2q0AXqpeR9GRb73Qz3SfLT3ncs4dyzpW64KSAREteqbTMzXVGqLz4f0LkFiEwW0rPiztDh+NwP+0GcyG/UjxtPCc5TNrU8wmndxvpet4ScclTVdFxMLlPyDzNjcDrzxHbnz6+Uiljdw42VsDMX6doNcyiD+NuwUMQ5f4uZ9wXc0y6QKY75iVyFdqV6TZ0uyPwz9WUPSXOXLjukeCxILQgmQIxAByF9sum4f8mXbqY9XdP301ApolgVBCyT30wFs5QeDw2EJ45gjkleuGdDXQIH+MKP2WtV8EhAQ04KKBr7uv9be+jzBmWH4Yy7AmDJvFEd5R5Ph+z/fHuY8z+uWldFh2CMq0yTYElCrg+yuYlPZpg/sstVya37Dbfrgr+y7e0zwxeIQQIpsPen5QoizZn7Zfo0bPgq3QdlUwygY02enK8nAGjqOi3ojR422vUFEEqdGWcBEADA/UHUCj9HHrBX2fRDETdEBzs4aA4RBzAorv/VpxPLEiQTeEag9GwuaEPxaphnWjqgkqcAklFKad6JGX+URdACUf5wLavHGKj8Z/fRcEDvn9NpVXZhxPFskfn5s3zJJ/ytM2ZE7X53x7PX3fz+ossjexiNDAeO/xC/0WjnAd4WFhrHmmYTFHpUxi0EqA87HtuAvLumO5aNugOY3q4sWLe/fuPX/+/JgxY6BNIiuFE19jiXJZNsoeeHSFkS+4+w/5c8ifT/g/EVEYIaJFA50HDnIe1JQn1Sg5ZYXq9zurGUB7BtNMpCILhynpRJC+AKpAYJW348WRPtDN2WAhYO0M/RexADdOX4ASY/PLL01P6NSxW3ISyAur/OdY0eEH3j2r9izJgvIcnew4SyhJRg4aHk2JcuOBZaILqZrlllK1cGyPL+b75WLw3KGanzoiFwVS82XQxw2mBUJMAUodCWno7DLBQeiAxZtVnxREPOHrXV8f4Wpa4bhCAYnFNbLWSMgsw1Jws2E3AZ06dVq8eHFiYmLb9IprVGjV17bhWpQnwrlr2nXY9wYs22Lp7D/Za/Jkr8kP5bxWzmDnhfFn7fCrhVG52QZ+PeDVp2+vSsvtByXbgdFlcF9MginFcGQedKkmNIx3vtDU7UECKfDtB3RnOPEFFm+RFPb3tnKBMaur1YcKrDEYrlHLCXa7ZfHP1sVxPKWTipgP7CvKPA/LGuKhLBZaWXTuCh2ribQxLHxxBT69hAYJLPxGwxunQaIGbT9CC4GPpeV+gA0guAhUNrAgpok3ur06wnVYbV8Pn64Wh9ef3YJvanurpTkN25nD1dW11Yey1UqIPgkpV3Gp2XEwygNSNJpW7Gm8ubXNnAkC8z3Kc1HH8/E3HuLF0ALoMwcdZmqlLkbNqNHIe0wZ23HGdouARfsdUtXiKi8aBWmF8F0Y/DLBeBgb7zn+QNqBaps0EGAf0M2uG3h4grMfRB9H97ujH5aUGKkm2rpBh4Fw5+gXTmUf2Oaj6AMLFXz4lE1IDH1xdsffN0fYqdQGiRRqCPGE/ob65BwX0uH9i6BUVdWMlmijCtwbJUqQFA0FGErwb/l6rLMTWBYUT7oWPe7FHPKJrtDXVFdcEQ0TOsKZpMrEuMqz93WD7q21+NoEzb++bfVCCxWF8O/bEH8e7Qf9yHugyxiY+gmU5qALil+9ppJlsVjyYRM0BqZ9gkJFJffwR2tXGPYs9MLaWDF0q5DVmIgScP0eNgNxqh5MXtRx0ZHMIwdTD+oyNxkQ88XvdHvHW8xlj3fohy/MPDXllSZIGL0qoSL5S/II13it6lx/J+2f7Dn9w2GLP7zAqZRzKWVeDvDVKKyjNGJLBCjl1VvrGfn/OFhlz7LcrbkqQqaG9CzcvjUSvhgFz6LggjEremHHsn+iK39moIMTfDwC/WdthuY37FbPlT8h5hSOk9rwD8vCnSPg1QOFdbUzcKOMK36dRVdNhbysmuNaVqa1QKUGBYPqiQVt8fvg37e6bt2dsrtIUdTbofeygGXjPKo7meso+XTseNbDScpVl1SDhfM5534ZtKifB/FvHAoedHOGaZ0gmIuRG5Etqd+1ElAordQj5OE/ZXJ4+xw85gd+Bh49LZZ8+GMSZqEdjMd6r8GeMC8YgqqvRFo7ZsN+MBQVEHkIJ7p668U4MA/H7aV/gkcIOqgrE7/QtCgehDz+kK6ljNMSQC2hiP1w5BMMSmun4mU5cOob4Ath4JJAe2ydG5pm3Dq3tys4mnrgOAodXwl+5YWgFxiWEVACk1KetXJpM3v3KJgyVxWjIQkY5Yuvmo8+Q3xt6t2vq4Y/rFgC+2Kxu1hNbIToA1/SDdfwhiIqbYa2+JkeJQopur6NRi2CwLW0yBZGvoCuLLUC06pVXOy310zo3PRdY5KKYfVJVAUZvxNePskmXr0AjKwqCZyk8ZkSeRikxXYiWN0fBHzMkcbotAb/42kHL/Wry3z4JF9ICetv1RpWk1mckHzrzz4KoTVj4h4bhs4t3dHq1sVa2g2EAm3yOIc2wbve5NU54JNENatOLoG3z8LEnTBrH2yOBFVrduk2/4jdugXPRFZg4wYFKbqyRy0sg/5hksJ8j2WbIXwvZm7wxRD8OHR5rJqzuimIzodpeyAhX/fjlXTiMPnSv3RyMBtb9fclafRyleaA2G5OENAE/BQO8UXAI6C3G7wxCEX/moqwgrCPbn10NucMYyXtLBT6qHnRfKVGv8hmYJzXuPpHBAZ4wvrH4eMLkFbEfQ4+juGppTjS3h+yAWVblzJgyQFILtQ51fZFw4lk+Hk82LROoaTmNGylUimXyxWK+3WZasnwRDgIH/0UBbu03m9GjZKdvWdpW0mDSyfsGlubh+mBYQE+vwoJedXcS4ms72fkU39pXif0nl+WxSdLpSdvRmeY6I/hXB4FgTUitxq2ssNew4kquTP77Oz00nRt7dotoZxmiEEyURGtSaFVlmp2Nq/TmwM36nLO68dTPXAZfD4NJCpcMAc5wI/h8OM1YOso9mXR0d3dAxfS9UGpgbfOclatNwgWdkbAKB94yiA234poTsO+fPny7t27r169OnXqVGi99F+I5crhe0FSiFZk5Qh95kHv2dX2eRhWTVLAalIT066mugPmgRmeDkKhRwrh48emVP6JWZyZG0wWBLQJZ9XdfNQYuZEN9kKUJZoYgEkgNZGr8aFAk9C5um4CIynceOc7tGoD81ATbAGlPp3jywAjVqrsxrwEVr4N/axBjugaOJyAEmUH4oCmQCQAqarW5beAhiEd4KvR91Ev1hOZB6FZ1VVYuUDA7mhMI2+Ni/DmNOz+/ft36dKluLi4dRd48UQw7nXoMg41fYEA92DwNJDMfUiQNIayrvyoiM9Sqr4C0rj3vBJoBap+Vk5YUdisBGQlYGsqtstxPh2eOADphbr407YoeLoXbBiHo7oB7N4YHDATiwiahF6u8MZA6OcBkJ8MV7ZosqMu8k7VvKcSeMostqKP0gICR0Of6o+8+qHUwIvHYdMtLqTImRxFoSAihkpNpZRO6ASbJ9fXqrnab1Nze6KW7a2B5jRsMYeFhUWrT1AhSMymNEyofNgnZJS8ox9D4mlPysafn5kO1Q2bBX9I92Izq8YghkFnXmUnHQy3F96IKY6hSKqPY59A68BSObx5hrPqykGdZeHXcBjihXq9WkqU+e9ejv/xSl9Gzdd6XVML4GoOHB0a1/3CKshOLOOxZZ5SE+rjAFTAcPAdj7H0uiUWa2HbHbwYrdCSFo0GgpzAWYwZLNqWJ4Yf38uqAVatnRHYCKDYSN9Jg0+u1jhctwiveKu36uaAdy+STr0KPLElKV3J7OKxOoUQRANiCl7S7LFky3R/X2yjo4aOQzBTBfW9ZC+Gvjj++Pgnzj6x8MzC8cfH/5bww80cuJld/TnPZaTsj9MN+gyoXr326fprKobh424k9+JBdil8dzQF8pJKhLyXnIoyeDVcyRoItu8WOHsTDFzcOKtWM7A/tlLhzIA8KcwIAmtT1Sj96tvuXoeXNff80kYKdGcFWwt4oqsu273V0fyGbaYR8PJiKltt8WYyxzZp1vZh74hYuTXB9HRRrOh73b1DXBFfBBpG19q+62QY/qz2vR9FfrTh7oYCeQEOzjQklyW/HLZ6U9w+jO7UGPqK5XgMALiWf3lLbBgw3WreMrdV3sWUx3aLwu1WpcahKBbbZb7f4wOL6j23GoRSA0Vy0/NkJ3GNkZnF5XeHuroVmYAA+HA4vDgIpwBa4aSurvDLJBhmkPzeumj+cJeZRsAKrAxrKZ9g901QX4yGwIsWyoOOOftLY7cKVB1dVSv4PZa7TMI1gt8ArUs8vSJdp6+mt08KpCrmav42V4uZ2RXVH/Ukuqy0c9GzOWc0DFfOXWOCRQBICc1uyzLjX6F3nfqm3zfTfKZV38w2KNFFSIOfLVypcXAfG7iciYlr1Q5GgkQGVzNhkLHb4T7YCOCHcRg2TyrBfPKeruBh0Bmp1WE27FaJwnsAJbKjZEVc4SQBwHdki+wFJzbb3Uss00ViCym4AaHqDoueCahKiUmXpN+T3jMedQmwkB0PVOzKhXlVQy4L9jzJ09j5B+fPFNZ6xQF9FxRDjayyL53kJr93jzSxpCJIort9lSsxW5qt1V0W0ILH3B+b6DnRklcjO7wGJAHP9MRFgURe6TTgNEkFNOy+C0qtO80QFpWPGkcvN3y1AfAvnJeXFxMTo9+Uk5Nj+KOZFojG2lU5ZAUILHVyhVjyTK63kibyqnXJYFTyb6K+rFBVaRvb8G3QlmqMfkm0LN7uVVq8gwY5jQKqTACb+qvi7V65/2h3Gec+gceXgsVXQEr0cr+gBh97dvVoZ1Lk0N1Ujpcd387LQldZnVSeNP3M9OcuP7c9cfsfsX/MOzfvyctPlqtq7T1iyFBv9M972nKSDVhxDZM7YZp3gdFwXflxfLChWLsGDfuHH344ceKEflNJScnrr79eWlrarBdmpk4YDdtnPizcCF0nAI2daxUEe1bImZwhBCSXJ8eVxuk3BNsGowKB0VKYBRkBKcJ7SodFYodBL1Ov7le9dF0zd6bqX0i4rN2lh0OPVUGvgdURsJ8JosPASwR+zLBO9/ZNV3fu1x+mfbXC8XGxVtO38pjAwFMBTzmLMKlNzajW3nznWvY1HHK1Lyzz+nt9zPp6fuKl3eHmU7B9OmycANeWwaKu2FLbhFUz4GqLPbpkBv7EdgjJsmx6erq/v79+k5eXl0qlys+vzFE00wJBR7cGfPvCuDfA0hkYDU7HWROuUOwIa5CXQhLk+z3e7+7UXZcorkWvvgZsmehWttVPk+G4DZQBLYKMSDj9nbYB0IfCET8VuPYkTlraTQ+ymvoJLN7f4XBvV+7gnUeMnrXth37fu4vdSW60ENGi54Off73r69ozJFckXswNrVJ6q+RwxuFSZX2HECcxzA/GosuuzlAg42YqNQybInFN/tYZTJt/9xzk17M4rM1Bo+abo+P169cnTpyo3RQTEyOXy+3salS7mWmBWDqDSwAUJAtYerLM8q5AUW3QZqC7U/fONp0N39HJptPJcSe3JW07knnkct5l7M5T3TyuCDRJNNtRRXFusWI4uwFlJMa9IT71/XNFVsvLrFWEhgaFUK2A81vAezC4oWA4JbR+MmTVFP+553MulKsqBjgNCLLVtea9lQMbbjplZfwMZAaIDoLwqC6sRECpqrRcVW7Dt1Ewigs5F24W3KQIqp9TvyEuQ2pKixrS0wW9eliCWv3iNYCZ5KncGvt8CpxOhT0zwb01u8Ea7zybM2fO8uXLi4qK+vbtm5mZuWvXrgULFjg41NpmqWlp3UUgzQ7Ng6HPQMZtqCh8usz2qLAigsfZNheFthfZr+2+Vt9TVo+T0Gl18OqZvjNHHBuRUppiZBsMAcWkJp9Si1jCkqBwEMxLgCMfcW13SQELApbGO4cgoCQbEi9pDVvbAcuadpnlWy237J84WHkYcssdgRqPP0uXgfWnYPUhXh8L7mJ3J6FTsaJ4zY012xO3y7ngnJXA6unOT3/c82MRjf3rTdLPA8b7w6G73C2s7f7DGOSE0ty/LFxJhU234V1d67F2BH4BAwYM+OWXXzZu3Lh161aBQLBy5cpnnnnmEZw7PDz8xIkT4eHh48YZC8S2eaILIKEI+BTK8TRiPGF5IuBzAdycWKwJH7AYYk77Fab9W2LxdYB9qFipkJd3sg58ocsLtWn6oTSV0LmTdaeUkpTqh4ZygpnhlFlIa5zV1PIK2xfKHOwIPmqVVx9CwwXSQzalGRk/B90t6iKe/2+0z7EkHDDH+MKqvlg0hv1CyqQvHBfmlpMG4RcelL0J/EsgOEVR5NOBTwsowUcRH/0e87uury1Aubp8XcQ6X0vfOtoMUgT89Dgqgf8Xj5KjlBA6OmIDAI3hhIVAU/8nFsvXBO2oPRyi+76HDh06ZMiQkpKSRzkDd3Bw6Nq168mTJ1u9OlJDkKvh08uo+JNegrddNyd4czAuHev9/nKIPGSRFEryRMAoIO0mlqBYOYLYAQjwVfM2FLjm95ms6DzCU1xrWrgWISV8oeur5/KvyJVl+HOlSRSRmiIK19+pPOZd+/xEWvlHoQfaBaPRVbAB8atl0f/s8vJpDSiL4KIMSmaDQjdgbr0JJ1Pg4Gzwdkh95sy57NKFxmmZrAAkc20tI9b2fHWmz8wyVdmWxC265bd27sD9+0fCHys6rag53dDjaQ1bpkDYPUjKl9sJGIFIPHE3YDsQotpuEpWxCHp7MWyZTLZp06Zt27YJhcIzZ86EhoaGh4evWrXqYZ/bl+PAgQPtyrC/vAofna1sB8lC5D1Y8R84imFsh3q8uSAFdU4zb/PZyjQxbJRJopZ4aa7O6tJvOOXGg6UXBN7HsEEln1gu3EaN+k52PFqoIcV2Ig2TqeCEB/WwsM2qdFmFzQjCE8TWkJcIFD+SL3vZIUdGajtbkiD9H6g7Vo3JPMgugQ8uMi5e755IEwK51Pi8uHRf7iWdEyK0JgkokBfkyvO4tYMtKIeA2gPIAhBcSiiPVjLKOgwbb18SE1EGOKlYhpHR4G4JaUbSwhpMd+dT7TLctX///r17965cuVIkEslkMg8PjwMHDhQVcYXtD5/WXdrVQApl8MvNyniP9hbnQbkMfr9djyoilkE/Vno4Vl/SQp3KmrYdD0lhVaa2FS7Nx0Ku0C3c4FU78grsj7t9xcw7MUfzvI/meh2V9p3pNKrm4MYAnBSUQb+FMPMrlCJlYae4REbo+tUCIwLFeGPvNA3HUhTbE06BMLqW7ptkVLb1/H+xWNJZZOcgsAJlCBQegMKDULIRivZCwUFPcjm/fhnPUhUhURGWPFjVh5t3aCrD7CpwsoIne7TWfO8HDXedOHHi5Zdfnjt3rpWVFcMwLi4uAoHgkRl2uyKxCEsXjM2Aghv3MCP6PpTcg/hzOv2GuqFoKEyPSzv9d/o/u1J23Sm+Y2Kfy7/Dzb2cDBtlydL9ZMI+aRk26XdMVA9ogAwcAcOeRgm3J7fD3O/TvToa+N5JYE1cklrDyFVqEFwFwfGaWajaT11UBt9eAwvK9okOa6BoPcg5vSTthFzZryT3h3xJw4pGXuoHX4/DOnM+DVYCGNQBNk/FEbsdgvMnoVBYVFTEMAxJkmKxOCUlRSaT2di0++Sdh4CNEL0+NUdSW2E9RhVpMTYhqE+WNUF9ScdtDFuaIskBFjytPJcELHm/x/tVbXorClEvmaAq/WEa7HTJKAaWMDwnnr6btBaSgMeySyA/Cdw6A18EwWO6MDcg7Lpu0kFKgX8R5NVFyRno58WmCJl8BQN2y6DkZ5BPqq4hrH0vxBZAqYLoY7Ual+jVW47kVvB23YVXB0D9oUh4tT/MCULHpIDCcHeDijfbEiRBEHPmzPnxxx/Xr1+fm5u7e/fu5cuXDx8+3MmpAeI1ZuqJvx0M9zHIDKnM0JrTpR7rQHtvsHAwUYRhBEv8aVX6hlV6iixH62fOlGR+cvuT72O+r9pHWoQajKTWqpUyEN0ketwkuvbnhTztNLKavCAByyS2g9My4NQ6dJ5xLO6wwM3KrfJTaMDyK4CCqgmwBgsqHvcT+8A6KH0NVCHgsBDs5wLBueiqQ3PRtIxSvolhXwNRjUqS8rJG8dPBXu3XqnUj9ogRI9auXbthw4aUlJSvv/56+vTpr7zySnNfWGuCYZmTWSdPZZ8iCfIx98dGuY3SB+crVBWHMw9fL7juIHCY4TOjk02nD4dDchEk5ld5gMcFwvK6NVeKM7F/SG6ccVMuRo0LaVxgVzWYKyc1WyxLjAqeQAM7knY80fEJndiYhQM20CtKB1J9iBi7jloaDf5AMSHyvKX2Qu+c6b+rou/xGA81/WSF7YoyO5IiIC0MitKw6QeAt6X3bwN/ezns5cSyRDy88HyXgC8sZZ9F5OLt1NUJzXXjDTJP8gQ3r1aBaA9l+yoruMZIxlaTYWBwnmzFB1uT4WoCnWH1gSaBxCRyM1XgX4IkyenTp0+ZMkWtVms0GqFQSOqe5WbuT6Gi8PnQ5/em7NVwA9q6O+sW+i/8rt93tnzb6JLopReX3ii4oRWT+CLqi3d7vPtK8OrjC4lfwjEfi0ejov2T3evsGpUSBv++BYVpGLSh+brJM6NCURR7H3AJhIp8jGZrvV4s5NLqTKrGZJ+ALGlWliSr0rDtIXgcZIQdJx6bT30jIXSGdUbpGHYO9sGEKFm5lOQLWVKEni+VBgQyRmSpjYpxTPSaONB54JHMI+mS9GDbLqPdh/EJKrMMJwHHE2HVCa7oSncT8aBiQUc722dG8TZehcSCynwSNXTzhFf64R4jfcDfmXvY6WfjDFiJ6hsFzJGQp1LIPBW4WuCEqKM5Z1L7RV66dKmkpGTSpEmpqamvvPKKVCp99913hw5tf9k6jeL76O93J+7WKYoAqFn1lrgtIbYhKzuvfP3G69dzr+N3zI2fpcrSd26+08ex9zCX4V+MRgED6r7PT7UCTn6FVq3vMs+1+5MFPkYFjeJ7dwXnADj5LWRF6RpfEmDJkhamksYteBZWfINUmP4LFAXpP0SN0Vu19u0VKljHThrGHrHDlTYjJSy3EpP/IcfKCLHfZf9nBuAUV4u9wH5Rx0WGp/Czw2fA/nhQKo0XzOn5Qw7Hxwe75HdxcIovxsn+1ADUVPPhFBE62MJnozDsVyTVKaVYilD5oD6iyNey4IVjohtZujcGOMLXY2FKILRz8OvfsWNHv3745Pzss88EAsHQoUO/+OKLvn37CoXVtS/N1KBCVfFn4p/6MkmEc+puTdra1a7r2eyzRsKXcoX8j/g/h7lgd/j7WzUAZEZCdix2ljaCpDTdpuK6vKIQEi/i6K07Guuq5j0us4jkV9ccYWG062g/K5xI6+BbpA37KDqTwUa5hldCQDSvSwr4BaluS0m7ZdRHf5NcKijApRj4JwV+n4QegdoolAGqNdToDSZXWp+N7UnywFkEn47CodhI/3RWZwhxhK1REF+ImSeLu+py1+qmTAFPHoa72QTeyNxXnZAPK4/hoG2yYVD7gWQYRiqVenp6KpXK2NjYt9566+WXX2ZZ9t49rp+bmTopU5blyfNMznvTJelSubSmDztTmtkAmTdJYaUEkuHxCUqSDypOek9abOAG0/6WfbXUoYdSWHVqFvxs/d7u/raRbglFAUWRxs44DVBWdtTQJ8HefS/5uN6quTdAhQw+vsyZbi3YCsHOSIRMd1XoKGNYKqccVRPjTcVSOzvCpyNh7yz47rF6WTUAHE9GyeRqswMeZBXDYVz7t2tIkiRdXV2PHj36119/KRSKLl26lJaWqlQqPr8NNQt+aFjzrd2EJu5Bb7G3l4WXSCiqWSDtKfZsQN2LcwDX+qv6UTRqtYOfzmFm6YAL5kp/tfYcsTxFKq00fFOONCeyKNLo2B1ssGWXcf4IA72coeOISbDiwD8+r1dz4HO2HZUD4TX77FUipGF+CGfGtT27KMgrRfXyJgGVUkzlvyS0+yQMfNIvW7YsOjr622+/femllwQCwbVr12xsbFxcarQqNlMDS57lEv8lukiPFi7es7DjwqEuQ4e4DKkWs2aApunFHRc34AROfhA0FgUJdabLgloO1i7Kzo+x2qZCYjtsmotxJp0JqlnNOuvCEsrgfidAqpR+G/1thbraUEsS8PpAcLfj1Dk13EuNKgVvDOJmtSJHmcDW2GwI3EdeZy7NE11hRR8uPdxQd6HaidHwmiR/28fa1EOEBe92n4SBht2pU6eDBw9eu3Zt0SL0hYwePXrbtm08XhtqFvwweTn45Sc7PykgBWjDahCRomeDn13RaYUFbfFtv2/7u/XH+5v7lbPQ+cs+X452H92QwxPw2GvQdz4K9yokGN9yC4YpH4J3Ly70xTFsBQx9FgTWODlXKjKERLS4Mt/T4DBxpXHJ5clGR+/tBofnwuKe0M0FurrAoh5weB70q8wx7+lcY7XMgJMt+NepASqiUeTk5EI2yOso8Hea2IPB/ltNUq07JRA62lcftDXgaA1T6tfZpw2jW53wOLT/FwiaJq6v0WhkMhlFUSJRrVW1bQA7vt2PA3+c3WH29YLrBBD9nPqNcB3BI/HLDLYNPjD6wMmsk3dK7tgJ7Ma6j+3l0KvBJ7B0hKkfYc+g4kwQiME9BKxdiNJSHi2ILY39M+HPxPJkFyv7BWPmD1HZAkFS9va8mDegOMYoOZRH8aoyzwzo4Qpbp8K9cnwUGOlyPtUDlfqziqrKm0EDs4Mg2JSz+lbhrVPZpxiWGek6Er8EH+LH8epFZ16/l+wPTN+qi9GAjUWTGZ6tELXQnj3CphXr+pTZiLCzT7em6zHYSnmIKqXh4eHff/+9VCrdtWtXUz0sWiYCSjDOY5xxR3gOF5HLIv9qMaHGQFJGnUZ4BL0rbdea22tyJbl4Q5Pwh8Dqk14fvxS0ygvAO+Pn6MLqhs2Cj4WPv5VPXCEcikeHk4slTA7E0ijtwGmyJtzfHnZOg/cvYkhJokKFwOmd4aPhwKv+yKhQVbx7692fYn9SaLC/Ip+CpQFLvuzzzUiXyf8+Zv/9rfDTdzvkFDvgGM2CoxV8MgoGNV3+9uMd4dRc2e67RLJE5GODHvvOj0gipG0ZttaLLpfLraysDM1VrVbfunWLz+d369ZN6xzy9/d//vnnf/jhB6VS2bYNu+lRVEDkf5jOrVGDVzfoOdOo51aOIvfN22/mSnP14TSFovz98HeGOQ3yt+qYI8uuKTBcoMjefCf7m0v+8do8TRY23oB3hsGaOpOxh3rDoTnoLdMadpCjiX22JG757s53LMFyK3BPpWTUr9f5TsS5jwfM6OsweNuYQbe7lV7OgLgCcLOEsX7Qp6n1fT0smDX9Gb64LU8MH65hy2Syt99++8SJEzk5ORs3bpw9WyeCk52dvXLlytLSUqVSGRQU9PXXX9vY2Njb23t7e9N0U00K2k3pnawU9q2B2HM6f1j8OexZP+dbcNNJiAHAybyTxvLgJFTIK45lHn0y8EmJuoaEHwGFEtHac+K84qq/eakC+7wPdIch3sa7Z1dgy3hnCzRFMQ/NuzYUjOKX+F9wTU/QIHkWyt4DxhFY+PS04l4B8fVosBcRPZxtezzMubGGxcQYcxTHkIaljpIkOXHixK+//rpDhw5SqVS//YcffpDL5fv379+3b9/t27d37tzZxLXWWGnMiQq0B8J2QuxpLL3kCfFF8yEvHs7/xJV26chT5Jn8Y+5M2Xkp75Kn2LOm86yg3L+owt0oIUythO13qzbINZICmeLNMzB+B4zfhUKfH1zAJJA6UGgUCWUJeB/JxkHJV6DhxnQCWFbwZzhqxZhpBYYtEAjGjBnz2GOPWVlZ6bMslErlsWPHnnjiCW2QbNasWYcPH9b+Vjtc1+1gv/+QXpYDN/4Wn11HXfwZM7HaNkoJJFzgypINZigUD9JvYeFkJcHWwSZmMCTElMQsPD83oTxCLDSY4rAg5JHDnWeaeMyycI8LgYUX3nj2yrNd9w/o/Mf5Ly5BRA5kl0FENrx/Bp47Vl1IrDoCSuBl4YF+ackzwBpkxXB6Y39Gci14HjJmPcyaNGYMlMvlhrlTSqWysLDQ2Vk32fL19d26dSvDMLGxsR9//HFkZOSLL774xhtvGEqXJyQk/PTTT0qlkiCIM2fODB48WC6XKxTGQwNL0vycO6JTXxCZkUJ0vTBwdYtyyApZj9laEWxoYxAkUVFgoZBRRsq7BMkqZZLCXLWFF8GoCSD6Wvbtbds7vDDcWKmbALW8X2bJRGvaQ8Q7rRL8SxJKB57z6sBn/XhTLsUwKpY02j/AUnMh48y8q0uyy7NB8RgUD6uWBkvBzjuwKFA63FPJApZq3y27myRJ8hJ5dbPpJqbEDMvMdJv5eeGXoA6q+awplUNERsUgd00dj4YHR6VSsSxrbnFB07RCodA+5ppgcstw6AdePp+vVqtVKlVAQMD69et5PJ5KpTKSbRCLxZ07d1ar1QRBhIaGEgRB07RGUz3vgSBAJeef/IK4F8FlX3HIS3lnv9c4dGT8BnJN0NsWBAkCAUHzTD2zWJqiCB4PNRGAsOZb/9Tnp3dj3z1z7wzqIugU/8VQ9j5IXgKGX4Y2u9zHIeHNwfGTvLu7ilwKZMzIDnAinvuba/dnwNUG5oVI1979MrssG7erhwMYFwiwDJzPFIzzI++WJLx96+3jOcdVrIom6H72/b7u9XUfxz7PB72YpsjeWZwJ6gAj2xbQ4GZN0zyCeJiqdkZ3YLuFpmmSRE2kpjFsHo8nEonKy3VNmAoLCx0cHGgOR0dTXlQADw+PFStWaP8fGRmp3dnEHyY5EvLjgTLwqJM0oZKI0i5B8AiAtuhpZyXYy7oGBEEKxUIQ8oFzEpWoS3o69dzrtvfvlL/XXF9TpCjCRZV0BlS8goMsZ10sEKl5gRFZgSu64Y8uXDfJp1QoM4ZrYAZsxRjyFVunRJVHVI7SpgZWhkmSJUopp9W3V5/OOq2dI6hBfSXvyqpbq/4d/a+nreevQ37yIUo+P8sCbZCQrobRgRDiLnzYE2WWZRmGsbBoTPPtNoZ+2duYumuRSESSpD6ZXCgU9urV6+LFi9ofT506NXTo0Po8PhMTE/fs2RMTE0NRtaiHFGfiDWhcKkRBcZaJ0oi2gcAKLByxWssQRoNpKlYGSb4sqBiVJW0523c21mxh8iaNWvxs9W+SwgyTjMoy6k4OcGohHJmH9c+OYihRwKun4Ln/7MoquBU7dgm6AERlQpsemtmf+/TyS8sv5l6sNkun4UbejSMZRzCJhrZcO8hzeR8uS4RLswMV9PWGz0a2n2BGy6LBI/Yff/xx5cqV2NjYP/74Izw8/MUXX/T19X3qqadWrVolFosrKiqio6Pfeuut+hyqvLw8PT29rMyEYo4OR1+cnTLVbZvRoMBAW/WX0ALoNgkrMTVqdIxrp8K4FB4Klk7oGOdqP3gkT5vcZsWzmukz80beDezfoe5Q04xkasgqR7UgLQIat4RnQ5EMj5ongbwkL+D/AQ6TgB8Nwksg3gGS6oLBFls19KV/0giNqYfpraJb2v+IebB+HIzvCCeTsah7gAdM61R1XjMt3bDt7Ow6dOiwZs0a7QpZO/SPHTv2r7/+2rlzJ5/P37dvX0BAvTIGe3LExMQYr671eHbHvnPxF4An0CX7a9RYzNR1QlsOa3ebDCVZEPoXlObgp7RwACtn3PLLLBBaQ5fHlV1GRkvyLPiiLkIsjH4l5JV7sqwt8X+VwV1gjW3bkl8tUbREAZ9egaKKyr8857vGJ0LFarBbASAFm5VApaD2IOMEVD4I94Dlj0CwGsOiDX0TPxYcBFV5XmIezArCl6lueWZatmFP56i5vQ9Hgw7FMIxGo1Gpau93SvFg/P9A+T/IvI3ZGgSBVj3uDVS3bsMQBAx/DgKHY4iLZVA+5fZ+7J6Fkxf2QP6ZDVmO8SARkLy+Tn1fD3m9q13X7/v9sNT/iU231T9fYYEldAssTlh7Rg/ULdATVwBxhQY9rvSoeoPGHqgCIGVg8yEaM+MEZD5Qhfp1t4jmydRqUAWDOhCodKBv24j4Y9zHmPgED+27MVNPmtORGBoaeuDAgbCwsAkTJtS6k3NHWLYZ4s7JUm7x7d2oLmPA1gPaA25d8KWSw69zUNyf4gFL7LYufdIpT1Keq90loSTh5L2TvR16B1gFzO4w66fRwzz48G0oFHKhY4KGqV3hg2E15UxqwKLOESuwL1YXaH8EslBn0lqr1sBIz6FDHJZ+dFYIqpnA8lCumDo7s3/McNdhD/+7MNOqDDsgIGD+/PnR0dG1TsW10AI2eJzUawhlaVEvOaG2RNpNKEjW9u6Rk5pPbfMlusY6OvJl+ccyjh1jjv2W8Nt076l+lh1XDx9HKocqNUR3V1ThNZLg7eyILrTQtOp/eRb6upGUnc+R9PiqwdygwryDte9bIe9vuDwKZJWjPcsHxbj4tHHazFMzLY3mNGwnDhcXl/tLBbEsoVaAmgftTddFX3QNRBytjOFV00XhNnMvEuRq+c7E3SgDyP9qTod564dsEFMmPFc2Aqz6eCIXJMrKkAgLwE85Wz6th5jq7tg9oihCd9iqMxBvdn+VVo46mFA9ikLBpTT4/josCjFdHGKmGWnOEZBlWY1G0656dzUAaQnEnYHCVGzTxbXJkxGmxEf1aN1gJFSoVH/E/LXuzg+17TijM+yaAQHOqcCWAVkK4r/AYaaSigzLuzXEZci6futQzNTg8cECu+7u1+tuh+PZazQn+vQSJpavOAKFVaUDZtr3iH3t2rXDhw9fv359/HgDxTwzANge4NxPmCRPUsAy58XSTZbFYQKpuj5ZtNwYvjdt79OBT7uITOtbDfTOtnCbDWQcChqSXHcBbjl9Oe/yhz0/zJXlfhHxRdWcnIC4krR7yn8Aeps8XVop/HoNa8X+mISOcTPtfcT29fUdP368t7d3a2+jK1HBb7dg3j8w/1/YHIGB4gci4SIc/hhKMlEWTKPZIyqZ6py+zao0nqfSGNR11GXjBK69c2U6H1tNcmRFhYpsoMrRqvXLaQKbH6RVpF3Jv1KznLuC2kWQEpPKgbgzDQfiuJw2My2D5jRsV1fXQYMGeXh4tGrDziyHSbvhmUOwOxJ23YZlB2H6ngcoaWLUELYL5KVc42uihNK8ZZdfSjJGZmzNt7bkWRpLiGoc9FWTSkapZGrkkFXiInRxFrrW1ADE7SLnAgXnG6+OQJi2om8qdixRmXqmkCCXQWStTxIzj5rm9zI3QGS7CclPhtv/QvRxXMo+GF9fhXOJ3BfJ414EHI+DH8Iae7jSXChK1VWes0SYQJbMq2GfLHS1CNo9eNd47/G0djGl6gpFv0PhUXwV/QHKLiKaENO19ntwFDrO8pmlPZT+mAAw02emh9ijj30f40cGA44C1w+Guh6aB0/2Bjcr08rhRj0AzDQjzfmnKCsrKyoqKi0tfaT1tIoKOPkNRBzEJpMEgLUrjHwReppIuakPpQrYedegXqrSifXXHXhnSKMWnBoF5o1WfiHltVRF8SryxriMHOf7+Pmcsy9e2B6d9RGwnrrfKfuAdHRHt/UeYveYAmBYCLA30cpzdfDqe7J7WxK2lMkxpddaaP1EwBMvB78MAM92evZQxqESeYlumc1gwfOqoJccBQ4jfGCED8r0j9/J6QfrP7UGXGxNKLGYaY+Gffv27b1790ZEROgllh4F53+BK5uxDlRrPCWZuKC1cQO/hjRirkSiRNs2hoB8CTayb4xh88X40s5iCLa3UmTJkOVkdfMmYICEItVKihCPchvTkRgZraaq/SUZ79ycz575j76WhYYd5AQv9YUJVeXwiIASfNfvu3kd5l3Pvw4AfZ36DnAaQHJ14INcBv017K+1N9dGl0QzwDiKHVd1WfV85+f17x3jC0/3hF/DK/sBs0Dy4LUB0MUg6IVOALYeTb/NtD3DHjhwYO/evYuLix9dxKsgBe4cwSwuvZIByQNZCdzYhUnpXB5Ig7ATgq8txOl74mphMK7bSP8wqW9Gj/iq+M+V231pW5XXCQR0lJEL6C7a+rk9MXApnTJOESUhJo+OydattDKK4HI67JkJ46vbNkmQg5wHDXIeVPMqJnlNGuk2Mqo4SqKShNiFGHnXKRLrPfq7w85oKJXhzHxxN2y+paVcCf/GwfEkLAUZ6IFyxX7m9pftyrC1YuaPtDNBURoO0dqqKT0kiZ2ipSXYLqeBiHiwoie8clR7HO5fbnB9pqdu9suyEJELt3PBQQQjfLEX9H0Q2mBzD0bDVXGxQLD/K3ESsuQvVkVFJEMCDJIJP8+z6TxscpJM+PEZOBQHxXJTaaLYK0v/AUEig2/DsMVs/R83FrTFAKdaZzF8Cpb3gCe6oUaKvbjq/KVyeOE4bIvghmwCDtzButGtU6Cna33Pa6ZJoNuX84zRcI0pjT41gUVjVTleDeO53jjx3nQL8jmlCRdreLYPPMlJgOdJ4KUTOHzJ1UARuNb9fDRMrbvDK82HHlMh+TKAHIDPAmXFyj8osnm+2CJOoLFTE50UBK/X7MKg8SuPEyiHwiWl3B8KtcSTiuvVmLb+0CQ4iKtt2RIJ224ZOB0ouHMP3jwLR+eZp+XtzLBrVVl4GIjtQWSD/jPDWTejwaIxi0bKzAtp7As7Mwgi8/Bm7u4KPbl5q5qBN87ArgjdXa4BiM2Dpw6Dn+39rKvr+LLs9O3XCv8jR2iA6sNEPO13z8eRdM64CyJb7NTVfdK1NMGJZAKd8DXRhrhrWnt1fcSHgYqBPbHcs8bwRDRcSIebOdhOqI7zVyjRDXk6BWgKi7pnB5lw+JlpHYYdGRl5/vz5qKioMWNMlP49FNyCwKcPxJwAslJcnmVxTdt5NA6VD0BvN+POrzdzYH9c9buchoIyTGX5wUTLkCqKlLwFJS8cJ3XGeZwYslsKf/eFnuOVqB7DPZJu5igxz7SmoWjASoQJ4Zmc6FkVDHa96VjnWje+EKILcP3cw6WRAgkaBnJrdtglQK6CUdtgQkds92dyTp5WCosPwMU0nTduRyTsjsY8Nsfq0wEzrSOOzefzra2tH2m/Xp4QRjwPTv4oqK2S67pYdp0IPWc0+anSy6C0vMYXzEJM4X0aTf50AyPhVW8kIDEPPrgICoKvn2hYm/zONPCYP056d0/nZsgGMWoLETbWFNXyGNcwePzxO2D6LpiyC8Zvx6ePQg3R+XDjHpTI6/uR+RR0d6l0lRtCQLkCE3hm7IWomoLoLHxxBS4mV+UCsAQcioafw+t7XjMta8TuzHHp0qX7lG02LZ5dYclmuL0Psu7gKN15NAQ/XqWC2nRY8YDHB1UNMRH7ykCbScoUppq2U3A5A6Lzqoa7sd4KZwsqT6rTLURYsBTAm4NhsBfczqnx7ODa79TGd2Hw/tmq2+FuPmqJfxcGySXokfC0htX9Mb4luN/cmCRgRS84Go85tsaOegItNrUANtyAjeOrfQOFMvg7pvqdyOUCbI2CNYNAaJ6Qt9I1djNUd9m5Y1LKQ6a3G3R3gxvp3CikhcXve2ZlWMgkMjV62mpqI8hVnLVU4mnFDPNU7401CHRpIMQT22KxAJ9fhaJyg/MSIJHDl1dRh6xmcliuBNNptNemgwKNBp8j2stILoLVx3CHF/re/1OP8oX1E+Ddc5BVYSqZnYZTKTgXEBp4B8qUOJ4bQ0C2BC/DhNiLmVaRUtpWcRTD56PAw76yrbwav+vn+2LVZF3vEoGHtcrYJhhc9HrZVM1r0srJM+m0UXV0ZA62xcytgFs5Nf6wJPr2EotNnDGtlJMxrVH1gVsqi73VDHx9rV5zcpKAZd3h5tOw4XHT91ZNa3cUc6psNT5yiCPwzFbdtg2bIAgxJeZTrUxlYbQvrnjXjoQJneCJHrB3Nnw9GkNEdcAQckb8MxBlRlncSsFWJcRoNyg0sC9eWCQz7ukhlcOJZHRNm4RlTa/tLXm1rr2rINEbh2Jp9cNJjJH8Hq6cDrEhahjTAfjVT2fFx3k+Pvv0V849wZ6uzAUw0yqn4vdVIGdYJiw/LDYv1snKaYDrAENZzJZPV2d81X9GmVaREa9YB3ahIH0L1F3Rqql0sNqWxL6fWP6Pv1XIX1GwLhTu5PNMBrSK5djpupszxBv5qDTQxcm0V7yzIy7L/y66z0OeJBuWS0eT8O4QeOo/KOB0jhEGOrnAi31MBLRf6ocr7c23obAcd3a1gZV9YQnX58BM6zPsM2fO7Ny58+zZs3WEu3JkOW+Fv3Ug7UCxrJigiT6OfT7r9dlo99HQimDUlEqBlsG7fwNnDcNgmyvLnSC+AKqeKBtIxwEvGhi0h7+jsT5UUftzoo8bZsK80h/OpHLLbO1uGvSKv9LPtGWSBFpgVC7E5HFjpnYSbjSZ00BPd0ywqY0SOfwRgSdlWey5+1QPnGBP8If+nnBYG/Pjph4zOpuO4Yt58PUY7FkflYfX09MVQ25mWqth9+zZ083NLS8vrzavOMMyL1176e/Ev/HOoDFH7XrO9WWXlh0ZeyTELgRaPgwDUf/Bjd2QHYOJMSHjYcBiLDipHR8LH3/rgNTSNKCz8KVFA97WXna0/2uXarFqrv/GAF+YxAm6D/SE/bPh61AskNYXgRglihsS7AQnFsLvt+FqBuaH9HFDF9fllKrngqMVfDyy1qrMjDJYsB/1z7Rz6SNx8E8s/D0TDsXDiUSDqyXhl5uY1jrOz/Rx+rnjy0yrN2w7DgcHh9qySiOKI/5N/7fqGrn854yyjD2pe1qHYYftgKOfYKicpEElhQsbsQ3w/B9BXK1FoSFCWrjQb+GprFM4fdeLDTIw23e6Ldk5zuSEmcWU9TEB8OWYqt4Aw7xhiBeuimsr2zTC0wreG8pl63Dz5Cd7wK+34FAClq8N9YQVvaF/7aLP34fBpRTOCV95lusZ8PYZuHaPW/AbBOSLKuDXm7jMpszppe05V/xm4U0TMiAkbmdYRltj2HIpSofQraiIovP5URgtT70Gt/+BQcvqeN+SjkvSJek/Rv+YJ8GFskggmh8wf2Wn58OyIwFqrDsZ8LOHf2fjEtrIWkiiweKh+vCylzV8NBz+NwRNvW75BKkKa7yMJxE05paq9c8mPRTKJyk19XDXmXkwWvQX7CgwdWNy6vatoNd5fiJWiVbLVCVwcp4SVrdhEwTxbvd3J3lOupJ3RaVRBdsFRxRFzD83N6k8Q00fBE31Kks11ks2bWmHntoyUhiDQms1Y7q8DK26JizYCs19QqC9G/ZIt5EB1gEJxQmGKvY0Rc/wmWEqT7qFwdQSX2KZqilv7fRy6NXLoRcAfBX1xevhb4LSDZggEBwBVWdg7fUdfHp4cbGiR8XNHNgbDbFF4GsDUwJRTUVEQw9nuJpefdBmcGHvbgWnEw1uMRaX67ODzApKj4IW/R1b86y/7P3liisrcFLKGQJBEs8FPWeyX1SLw8kPHHygOEPbH5ODs2ef3vUvs8pX5H4RtR5K3wbZYmB8gCgBQg7UTR54eVo4TQnEbDD/ppMxKJGj3yvsHo6rs4OMy1p23IHVJyBPm83CwG/h8PEojFSt7A2hmdhbTe9sQ+ml/uiEm1sMCQVV4/lQP4xvm2kXhl33pHqazzQ/a79N8ZuiC6LtxHazfWfP7jC7xQ3XigpIuAQZN9FivfuA/2CUN3LsAH3nw4mvcJlNUGjVagV494KeM+tzSDWjjimNPnnvWGH+i1D+Bm5C9W8Rl69S1i/ww/1jP3CytjdOQeGW1o3jTh4sOoCyEGiZBPxwHXuGvDtMt3TPKoNVJ6CwojJTlcJCy/fOo1NtUVcMVv8YBolcBouvHTzTG/PPaBKOLISfb2AmHE1itumKXmB3/5CfmVZu2AqFQiaTyeX3yVTsZtfth/4/FJZJ7K0tmsegi9Lh1n7IjQOBNXbwDRhabcitKIAjH0PUUW7MYoHcgn1wJ7wDYlsYtBSElnB9Jyq30CLoMhYGP1kfnZaLORe/uPPF7aJbpTI7kF4yyjADdWepZKyQrprn50owWHUhDQ17mDf6tF0tG/YRK5RYPR6Rxdktd1PIVPDJZRx1J3PKEIcSuV5/hvNtCkolKGw4wANe7geT/OFOPj5cgpygc+VH9LeDb8ZiiI4msCDUTLsw7EuXLu3YsePKlSvTpk27z67ZMYJ7SRobB9qrGwgebQ+45FDY9waU3cOoFRAYl+6/AB5bUznBZlEa8fYBTD4hKvvU39yLw/WIlajB1Hce9JgOsmLs1CO2rc8JbxXemnVuVl5FHlqRrB8wJt5FKIYzrG6Gn1ICs/bBzUxd8umJRNgXC3tnNkxpLDofzqVVt1sCazBeOo5j7BAvyOH0YWpcR1UBtr89vkxy37IwM23KsIcOHdqnT5+VK1fWVeAlLYEz30P0ScvyPJZvAR4hMGY1TmgfDdJiPHtJJkaqdOlTGri2DToMgM6j8EeFBKIOAy2oGsMJEn+MOABDnsT/YBG4AHgNkPz6Pvp7tGqtuhCp0KmHGcKCo1BME/ilsQCfXYGbGQa1XAC3MnHjrxPvs2LJl2LfkrNpaHgEAVJ9mz49JKQUoerL9eXQ0027Fqh+LSwmt5hpgTSnYfM5BAJBraFsloVjn2PmFs0HiibUcki8hB2tFv0CjrWkL9WDe9J7hzIOhRWEWVAWj3k+NtZ9rIAU1LLrXciM0NmnFoJEeYao/yoNW4rGbxRRJwgoy8MVteEb631tNwpv6IwH+2BeBjoFVH7VzYkZ4VUupLCGPL0UzqeZMMjz6ZBWggqqtZFWCrP3wfXMytKL2rTTKNRg3RuDC+l+HhCm7b+rtXANdHGDibUntJlpRsgWLWaYGw93j+NoifKDBNoPXwz5SbixscSWxk47Pe3ZS8/+EfvH+rvrp5+a/vK1l2vthqOoQNOt6d6Tocg+IrLClgO4ujb8SAzYe+Hcu+EUK4vLVGVVZkyVgdV7QJbrlMy0L9H+XOIHDdeCU6oyXb8tU1er3zZCO85f18aotA1MarsROBu+kwc8En6fBCP8uOo0Fj1q3d1xUlDHs8NMu/aK10X2XRz3jOyKpFH8hGWMx8l6oNAo3rrx1vWc6/qJq5pVb4zZ2MOux4rOK0y8wcYNrJ3RjA3FDwmyar7AE0GfWXDsC+56iKryyD5zGyeiJqJEIsrAccwCiLcBlQ0Vz4KmAxASEJ4A8bc3SrsqmFf5gDmkPjaQbpRqyuBGj9p1yzJK4Vyq6exU7gNW30iAN5cCG+IEJxehiy62CDrYwjAvsGhldbTtiJZt2EIrtBZM5zDYyDIgsGyc4ubdkruX8i8Zq/Aw8E/6P0sClmgnt9VwDYKAYRC+F/gi7jnColiahQP0MtBI6zMPiu+hw0zNDfu0AAbMh573cwfWgpASCqgaE3jhaRCcBo0TkBIgpcCAXKPWznSsBbC8O1xKB1Zd+cdUo8Uu7w62ta8DKlQgrTnOs2AjxLSacrmBzWvAwbJKHAKjVh3wZaaF07IN23cA2Hpg83d9jgfLqYIHjTalkX9/ihRFJQoTXfiKlEVStdSEYdN8ePxNzANNOA+SQsz6dg+BkS+Aq4EMisASJr2L3b9SwvBx4zcA3LpAY3EQOHhaeEYVRJkYSKl8/f8N8+SXdsc2Q7/cQJlEYKGzEzzTBw27DtytwNsaO4QY12a6wrwu8O4FyCvVndfDFtY91kjRUjPNSMs2bJEVjH4ZDn8I5fm6IZqkcIT0H9K443mIPVxELlkVWUaPBU+RpzWvlpvX0hFmfQU5sVCcDnxLNGwLU3Ekj674emAElGBJxyXHMo6xmJBdy04M2PHtKEx60fFSP5jWCYuZWYCuTvdf99oKMIHkcjo3vGtvAa5gY2EIllL3dYcjiahk6G+LQeyHlIhuph0bNkqQTAA7Twjfo8pLoizsSJTLn9KIJltagmyDpntP33B3g+FGIV/4VOBTtHF7EAMYNbbmxO6cFHbDfMjM7TA3XZL+w90fMssz8We99pgWLuA03mW80fzCxwZf9efJHlDCjfOY8gkQ4IjpYk/1wP/3csWXmVZNizdsHE+7sZ7dyvNzLW3t+Q/c6Oud7u+czD4ZVxKn1+tZ1mnZRK+Jtb6hNBsOf4RhNnk5PlCc/VHhtGvt+zcFa0LWjPccfy3vGp5fWfpJ1CdF0iL9b2f5z5rpPVPNqGs042sYr/aHaYE6oe+u92snYKZ10RoMW+tqbnhM2CQ7k3emlKUYtrM+mHHwmU7P9LDnRisj1Ao4+jmmoGi722I/rkQ4+B7Y+2CqzMMkxDYkxFZ3igHOA36J+yWxLFHME0/0mLii8wqNRKMxirE1io52Zntum7QSw9ZXOz4YWdJ7v8X/plQrq4Y6ArLKsn6M3vDbkE0m3nAvGpKvAE9cFVqjBZgMd+ufh23Yhmib3ZapysSUWLtkKGFK+GCONZlpkQkq169f/+ijj8LDwx9ZX7644rtJJQk1NbQjS6JKTXnLoTwXazzIGn16irnV76PFmmddlyOgBrkSlC47kQxZJtO8zbRpmnPEdnV1HThw4MWLFx9ZJ12+SsFTqZVGQx0BPJWCVspAUMObTNKm02BavML55kj44RpEFWBcOtgeA2Av9GnuazLTTkZsLy+vMWPGeHt7M0wtIvdNTQhj04OtURzGwmiVvQVVqQNoCMPgEsDE9kY203407I+Dp/+DW/dQnwiFUnPhxWMoD2ym/dD8ueKPsiOfrV3Ht8ietsrKABL3GiijVgr7gMhUy1aBGHPOak4oBA0sd36EyNSo8qtWVVZrcNKuoMEGmihOVm9SSlBRdN01bBv0qGZUZtqd84zr2v7gAoZ27hM7Lzl8IfUn69JYvooPxCiJ4AXo5NJ7iekpt3sweHbHlDJ9O06WwTLMrpOgpXKvnOvRZfRVkZBagqVgdvWoTFFp4Mdw+OCCrlkXn4TZXeC7x8zdqlsTrcWwuSRtjRoeOI4Ng5cOKsoYdGtfPqniM2DDt8OEUI9g0zuL7WDUS/DPG1CSzWVjEziA91uAIir1I6U8ZWvS1ojCCGuB9fwO88e5j3vYsk5CylTrWRaLruupIngsCd48xXUm4J51Sga2R6BVf/dY01+tmXZs2Kk34OZe66xo0toJgsdhcsiDiKik3oCEcwCMk4aH97uiDCL2g/9AtGGT+A2A5dvgtlYayQoz4fyrSyPVzvmc84svLM6oyNC2ztmWuO2FoBe+6vsVj7z/46lMARF5uEju5ICp3fXH3Rqb7NzNNpYNHehZV48ePRoWfrsNCu1M3qBb9ZYoeH0QuLfcJYiZ1mXYkf/BwfcIWQlN8SAvFuLPYTONCe/gyNkIFBVw/mcMVvGEQFTWKMadhRt/wzBTZZta7L1g1KqGnqpQUfj2zbczyjLwO+aGPg2r+T7m+5FuI6d6T637vYcS4PMrqCuoZqCTHSztgaKf9YQAeH0AXM3iBMwq8XeCtwfXS+dQpUGZpJq+l3IFpBSbDbvV0PzOs7qQFsPJdaAo57QWKKzxovkQ/jfEnWnkAfMSIDvaQA+4ksRLmArepIQXhoflhRmpiIEGdiTvqPuNlzJg4b9wJRXb6yjU2PX6lROoGVp/OtjBkbnwvxGoizC8A6wZgq256lnLQZGmulVj7yFwebRic2ba7oidGo4pIpTBRRIkrnUTLkDIhMb40tQK0Kgq36htLcm9NEpgVABNKY1bpixTq9SGUmRaipRFLLC1KSizAD/egHKpwV+Gxhqs329jM0rXepuWuxX26JGr0aEtaohfgkfC/GC4kFxZfKJFBWM7N0wd0Uzz0rJHbAWXM8US+NL/hyBALmnkAe19scCbUQAoFSDkCiMVOIw6+aOoQ5PiaeFpLbauOfQFWgfWoYueJ+XKqo1+T2ERZWJVGUh9EdINs2oti7vCs/25qYaKq+tUwSA/+GxE4xXLzTx6WvaI7RECtDgSCjdZlybwlNYMOVNiPbtMQHh2b2Toy8YVek6KOQkbyXlRRCAf1BOZs09YX7TpN7cO5QaZRnYy6+T1wuuOAsep3lN9LX3rc6qe9j3He4zfnbBbF0/map4thZZPBjxZx7v4JOe7NnocsCCmwb4xGmqNwYIP346Fx/3gdApqrfT3wG4+bubVdauiZRu2U8CBkKBn8rblCXR3+h5R2SX7jp8FDm70cu+i1zPzxIvuqay0xnYcBh9xLN1hb1PbNDO+LH7ZpWWheaGYHkfAxxEff9jzw+c6P2e0W6GiMLY0lgCii20XWz6mpgoowbf9v1Wz6qOZR6VyKZAQYh/ybs93tR25asNOiLXQ19Kqb2XBXgQ3siG1FNvuPIK1rpCGqZ3wZaaV0qINu0xdtoYIz+NxrWs4WAJ+5t8brUqcCo2RHypXwgeXqXtyq6rPTcKxTJtNt2DNQBP7S9SSNdfXXLl3Re/ZLpAVrLmxpod9j4HOVW/YnrT9++jvY8s4w7bpsjp49ZwOcwDATeS2Y9iOq/lXU8pTLGiLgc4DPS08675CFtBnZgwFsYWwZD/+p6crfDgCRrk04tObaUe06DX22eyzCcXRRg1u1CrZ/tR/qmy9IdzJg+v3anxoFv5LxI42NQkvDMce9IaebRIkcskfiX/oN+xJ3fPk5Sev510vV5aXKctCc0KXX1p+KP2Q9rd8ij/cdfjSgKWzO8y+r1Xjg0OKjXJMLwu4h9GtTHj6EFzJNLfXMNNMhs0wzJYtW954443r1xsSqzGgQMHJ9hhB4Ly3cQVhUjVnwDVlwlUgN5WxniPLkaKuuPH21IpU7ZNFySi/i/5OoVag8VcmZkuUkvUx69WYqdZgSOCa4NX24QjUAM8phT3xPLXWoWjGzCM27O3bt9+6dWvKlCnfffddYmJiI47Qy6EXX1sgaVCzAQxuN5TprD8dbVEQW9f7woDOjtg4tiYOfAeBQGBsZgS4i9y1nu0iedHNwps1E7Mv512WqBrjuncQQxfH++1EQVQhT/noamfMtD4aZh4Mw5w/f/6DDz5YtWpVeHi44a8OHDgwe/bshQsXnj9/Xrvl3Llz8+fPHzx4sJ+f382bNxtxcd3tus/ymUpqLKFiORSvh9L/gSKwo53PnA6zGylnbAuDPauPhyymq8zrYnry28+p30CngRjy0cMARVOLOi7S/kSTNI8wEVAS0kJDFdH6w3LNPe6zzmDBTsCYg09mmsywZTLZv//+GxERsWfPnrt37+q379u37/XXXx8/fny/fv1WrFhx+fJlVOErLbWywuCwQCAoLdUKVTcMkiAXeW2wLLkNxb9DxQtQ9hHkXXvM5khn60bKEpUpalQ+cT0lw+6Z3t+KZ7Wu37oezj1wkNfgy45v90mvT8a6j9XuYCewe9zzcW2r9yo0MNVrqgXdGOd1nhQSiuv8s7Ao6DKlg8Kwja4ZMw/kFReJRF9++SVJkmPHjtWrIzAMs3nz5iVLlixfvhwAoqKidu3aNXjwYGtr64oKbLKqVCptbBoijVuJQg2fXnAuq3CuukzGdvst2wWdsLFrI4jKh9u5NcxGA6dTscm7yYY1PR16Hht36FjW0fD8KGeRwyTvcT3sqvK2KYJ6I+SNmwU3k0qS9J30Otl3Wh28mmhUpJ1PAo8yNWJrnyxc/7Ine8PUQFaleTCNUjNtmoYZNskhkUgMNU/kcnl0dPTKlSu1Pw4ePPinn35iWXbs2LFbtmwpLCxMSkpaunRprVdA13oNlzPhclb1KiUSyiSwO7qRhq1isAjRGAI0DFY11YZc7ikpfro8D7UYJPbYr9pwGtzbsfehsYd+iP7hVtEtAoi+jn1XdVnlb9XIJpR2Qhjpw7XLM4QBbzvo4QxCHgoGzwsGSRlgVN0MR+OeoW37q2iCOLZarVYoFBYWupmnra1tWVmZUqmcOXMmy7IREREvvfSSn1+1rrexsbHffvutUqkkCOLs2bODBg2SyWQKRTUtfh7JRmUJWFZcM78yNk9VWCyhiYaFvGiSBTltSVsolKTRMW14KlIuKalRBsIj2dAc/srT4vg8zlnGwPob8FIf1et9JFwjLx1ehNfXwV/nynIJgnARumgYTUmJKWnEekAQsCQAziZb3Mjh6dzeLLhZan4cIRnlwwDLtegtBYVCSSrVyurfWLtFpcJYZaO/8zYDTdNSqdTe3r5pDJskSYqitF8uzp8VCj6fTxAEn89fsGCBybfY2toOGTJErVYTBBETE0OSZM0u2XwKNCRds+s7F2QieTw+j2qYZI+AgjJGVaJQACGqET9jyxjKXkgxBgckCSiWs29d5MfngE7ql8LA2OehVA9n3vRAQm0w+BME4cnHMLWG1VAs9SBS/kEuMLszE1XAytXc04RgR/kyIzrwSBI/LssCnybUag1FUXx+S9dUfDQwDMOyrPnboDm0dtQYwxYIBCRJ6qfQAoHAzc0tM1OnyBsXF9e5c2denVInrq6uixcv1v4/NDSUpmmSJMViY+kdO7GpVA0WbESUpYW4EW5hDVWsUcvAsE8tR4mqQk4xQpFxoCkym4nIYYFncCYSQEX+myya2418SPfRqRT48Kph12tixx1eVxfeG4Oq9tE+PWt+Y+0ThsP8bQCA3u4aHA1OTk6+evVqcXFxQkLC7du3JRIJj8ebOnXqr7/+mpSUFBUV9ffff0+dOrU+y57Y2NitW7fevXu3Nl1xC1EaSWhqVkSIBCkEUXtb99qxEWfwxfeM49gsOFklOotNXHCpnFQqqZr9onMlrOrhCJWqGNQbq5BUe6KxLMoJZ5Q9jBOaaZs02LD//PPP1157Ta1WHzlyZM2aNWlpWK/w7LPP9uzZc968eU8++eScOXOmT59en0MplcqSkhKjpbUhEjjH8I8ZhZ2Buifjb2WqBZfrS29n194+F4Ep0x2T5bzNVORI/zuWtEPN/Uk6Gyiut1U1WJpOJRv1ZLkvhTJIrhnuItGqU9v7EtJMA2jwVPydd955/fXXaZrWLmxEIpzW2tnZbdiwIT8/n6Io7dq9PnTjiIqKqk2B2EFkCbbPA6EExUTQ8LmEyhiwWGNvZUOygkZ4hW14zmsHei0qfa2oYAqwXQDkQF0YGHj9xW7vm9yf5V0DQRGolldrdknmEhZ/UITptzwgYhosOC226teBGy3b+xLSzMM0bCGHyV85OTk16FAajUalUtUxYg91HtXBVpMC80A9DDS+QJQB7yrQGZO99hKNSikFgPGekw5MEf4Rt/di1q9iHjW9Y8hTgWtdhKajZ7YCPs/hI1WxByhH674rKhMsXnaw4pK2HwLWAhjTAa4alW1qYIg31nWZMdMKyjavXr36zz//XLt2beJE011p7QR26/quf+bKU/nSUyDQjWMvdnlxkucDyXoPcR4zxHmMBmQEJnHV1cSzj+PAAZ5uF+Fx0IwAZR8g80FwmOQVLO54BB4aL/VDKcJTCZXLbBY6OsFwL9gZBXwe9HFrWB9sM+2T5jTs4OBgR0fH5OTkOpqBTPOZ5mXh9VfSX2F5YZ4WnjN8Z0zzmSagHrSlbo4sJ6o4yoKy6OnQU0TXKnVmx7f7vNfXT0gWJ5WdA/ocyorT1KvBb+pTSh8GDiLYMQ3+job/4kHFYpvbu/nw/nkoLsc/V5AzfDgcxt+/ANRMu6Y5DduOw9HRse4azN6OvXs79s4rzLOxshHwH9SkZRrZ55Gfb4zbWKQo0gqefNjzwyneU2rbf5DzoIsTLm1P2h5eGO4gcJjXYd4QlyFG+7AshN6D2zk4xPZ0RS2hB8RJDM/3gWd7oWvvqf/gcho3enMfPSYXnj0C2x6HsY3MbTPTLmhOw2YYRrvMvv+uGEvmkU1RZPrNnW8+vPmhXoIzojBi6aWlR8YcGeA8oLa3uIncXgt5rbbfSlWw9hz8cRtKuDJNe0t4pje8N7S+bTfqgCIhLh/2xFYXDKWhsBz2xvNHdmxU+ZiZ9kFzKqiEhoauXbs2LCysjnRxLSwOivh6wDOmlKdsTtyM/9PbCQnF0uIfY3/UsI2sb95wA9Zd5tpc8fBVJIPPL2AHvCbhTj7Iaz73KLhbRJvrsc20UMMOCAiYM2eOv7//I2u4mVyenC5Jr9n4Pq4srlzVmPbwUhVnw5TBF0nia9NtaBLDc7ME2lQjLlcRg0IrZsy0wKm4E4eLi8sja3wvpsUiSqTSGA+CYkrMb1SGaIkc0stq5L0SEFeENs9/4LmykxiVkmqO2bZCs9CCmZYtZvjIrBpTYuy79bTvWTNpbazHWDHdmExjS74puW8WW3Y8uFVrC8ix66URBMSX0CrGbNlmWqRhFxcXx8TEFBYWPrJ6Wgva4sNeH7pbu6NtMzr1grFeY1d21hWTNxRrASwK4dpl6J9OLB5zSVcQN0UCi5PIVH4dC7YC81TcTEudit+9e3f//v0xMTG1FYEY0lS38TCXYYfHHv4r8a+LeRctaItp3tMW+C2w4ze+LdWrAyAyH04mgtb7RpAwqQu82LdprravO2ob3sk2+ENxdawTfBWCmq0FzZhpCYY9cODAPn365Ofnq9X3qeggCKBJ4DfRxfaw79GjXw8loySBpMkHPairJRycDXtj4EQKBqjGdYDpnavNw8uVkFGKk3bvhmeMWfDhmzGw7CDcK6mcXbHwTD+Y2YlVMWZpJDMt0rCpSureLa4Qfr9NRN2zdLCk5gbD5MCmOXvjvGUmEdCwsCu+arLpFmyO4gybB8N94M1BDTbvx/zg6ALYHoUtfhxF+PFndAZGBoaaEGbMtKYWPwBwNAme/g+ysGIR7XDXXXhlIHwwrDFNJB89X4fCmpPcSp4TUorOgfAc+G8u+robRDdn6DYa1Ax6yLXuiBKJTtPFjJkW6hUnyVqvQaKCV05xVk3rXhoWvguFM0bFTy2SpGLsdI1LYm3fLwrTV8IyYEtkIw9Ik41sMWqmHdKchn379u1169bdunWrttn42VSILTBWKVWpYF/sA+egPXwi8yC1sPrFc3qjZ1JbwcWbae00p2FbWFh4eHhYWtbaeTlX2ySnRgOdfGnDZAzNmGlvNOcaO4Dj1KlTtaWUdnNB9XxVlawfBwPdnaspe7dMujmBrwOkFhnPOEb6mAXBzbSDNXYdsa7erjCxI2BGpX58VoG7LcwKgpZPR3tY2Zt7JGmTYTQASujjCUu6NfeVmWkHtGivOEnA+nFY/3goHiRSvNgeHvDJSOjxwG3fZWrUDBTSKGPw8FgzEGwE6C3LKAcLmgt3DQbnxrT0MmOmDRk2AHhaw5YpcC2LjcmSOtkKBnrRrrUuyevLrrvwyy30WgtJ6OeBseUQZ3hIPNMLO/JklGGqia9Z0shM+zHs+xZj8ykY6g19bOUiS96DLx02R8LTh0Ct4pa+LCTko/jJsXngX19t1QZjLYDghqk8mjHTmtfYJ06cWLp06dmzZ+tuG6LVHpKpCWVjpMSrkSeB78MAF/W8qthyUj5sqNbq24yZVk8z54p37tz51VdfvW+ueFMRUwCxNWPLANeysHW29YPqqZkx01JoTsO2quRRlmSbMdMeaP5w16O06i6OEOTIRZ6qM9DjPsO1moH0Uuy/Y8ZMq6D5nWePEicLWN0PnswFlVLnPAMG/F3ghT51vWtvLPx+G9JL0LM9zg9W9WtwFYcZM4+Y9mXYALC4K4ho2HgTw10CEvp7YrjLr/Zo9s/h8OIxQJU0rkLrejp60ffOxAC1GTMtlnZn2ACYuDY5AFJKQUBBB9u69kwrhXXXABNeDdz2pxJh+x0uq8yMmZZK86+xH5ngmSECGjo73MeqAeBWDiTmm6jQOpL4MC/OjJlWPWLL5XKJRCKTyZrFtuuDhq3R0ZbDrF5ipoXTnCP2xYsXV69efeXKlfsmnzUXXRzB3a6GF52AQeaeeGZaNs1p2KNGjdq0adPw4cPr1b6rOejkAMu76xSFdXLFKujiym00Y6YF0/xihi12uNaWl70/DKNcu+9CWhkKEg7ygneHgrtVc1+ZGTN10vxG1cLTzigS42ErekFmGVjw6gqMmTHTcmh+r3ir4F45ZHGvMkVzX4oZM61ixG7hlMjhjTNwKA6yy4HHg37uKH48ukNzX5YZM3ViHrHrQqmB107Dr9cguwKj2SoNXE6FBQewh4EZMy0Zs2HXRVQe7I+rFAbX6qXSkFeK7a/NmGnJmA27LlJKoKi0xpfEQmRuc12RGTP1wmzYdSHiAUGbSD6zNPfXMdOyMRt2XfRxg+5u1TPPWFxsz24N+sdm2jPNadgsyzIM05Lj2C4W8P5QsLPgtMG1Lxae6A7TOjX3lZkx02LDXWFhYYcPH75x48b48eOhpTK1E5yygV9vQmIRzsznBMGcLlgcZsZMS6Y571Bvb+9x48Zdv36dYRhowfRyhY0TMNbFM3eaN9NKaE7DduPw8PBo4YatxWzVZloRze88q60jnxkzZlqxYZsxY6bJMRu2GTNtELNhmzHTBjEbthkzbZDmD8gSBMHn3ydFkyAIkUh0393aD+ZvwxCRSNQqAiuPAL0eUTMbNsMwBQUFmzZtunHjBsthKEjMsqz+/zKZjMfjNaGOkuHBm+qADVJTrrm/yS2G34b+t3K5nCTJJrTtRlx83TvXcUCT732Qb0OpVLIsKxA0ZQ8HtiG3R32+vdoOWNt7jfavaRo1fyRJ8tixY7NmzWp+wyYIYurUqWlpaba2qPF97tw5CwuLfv36MQyjVCr37t07depUCwsL9f/bO/Ogpq7vgb+8bERBJESpUAOoQEBEIEEsGqqC4FZUFK0zdStWK+PSgLW1U5VSu7jUZcRqK9ZRpNLRUSzUyD4KyC67hBCWhIQ1EEJYsr287+j9TX4ZxH4ZB7/E8D5/vXtz7nsn9+W8e9/NOedqtXFxccHBwe+///6YPJtxOFxGRoadnZ2bm9toTqjT6R49euTu7u7g4DCiPAzDubm5JBIJKP9f28IwzOVyHR0dGQwGqIRhOD09fcaMGe7u7jqdDobhysrKrq6ugIAAnU6Hx+MTExP9/f1tbGxgGE5ISHBwcPDz8xuT3sDj8U+fPkUQhM1mj+bfRxiGMzMzra2tvby8RpSHYZjP59fX169evXqYhjAMZ2VlWVlZeXt769vCMFxSUjI0NMRms/W9UV5eLpPJli5dCnpDJBJVVFSsWLECj8cDBWg02vz5L9JKZmRkDAwMrF27dkx6A4ZhHo8nFAqXL18+Gnk8Hl9SUqJQKJYsWTKiAjgcTi6XP3jwYPv27cMERmyLw+FEIlFpaWloaCioxOFwra2tubm5H3/8MYIgOBxOoVBwudyQkBAzMzMcDldVVdXR0bF8+fIVK1YsXLjQKAw7PDxcX7SwsKBSqRs2bAD20NLScujQoUmTXuyUlZub++mnn3p7e4/VpWEY9vT0XLp06Sjl1Wr12rVr582b9zoBGo1GoVDCwsJGbBsSEuLh4WFYqdFoFi1atHjxYkOV5s2bFxAQAIqPHj2qr6/fv38/KAqFwr17986aNQuCoLq6Oj8/v23btkFjhI2NjVqt3rFjxyjlzczM7O3tV69e/TqB/Pz8rKysyMjIEdvS6fQ1a9YYVt6/f7+3t3fnzp36mocPH4KvDIrPnz+/e/fuV199BYpkMnn27NkrVqwAxe7u7hGv9Wbk5OQUFRVFRUWNUj4pKamjo2PPnj2vE+jp6RGLxSNqOGLbmpqaW7duGcoLBAKdTsfhcECxr69PLpcfOnQIzFPS09Nra2sPHDjw/6dAjYnm5maJRAKOEQSprKwEsyyVSrVy5cr8/PwxvFZDQ0NnZ+cohXU6HZ/P7+3t/RcZkUgkFotf11Ymkw2rr6+vl0ql/6JSe3t7Y2OjvlhVVaVQKMBxeHj41atX0bGjpaVFKBSOXr6pqamtre1fBLq7u/l8/ujbtra2DlOgvb29qalJX5TL5XV1dSBqCEXRxsbG9vZ2cPzzzz8fPnwYHTu6uroEAsHo5VtbWw1VfRWlUlleXv66ts3NzcMq5XL58+fPDWv6+vqqq6v1RZVKVV1drdFoQLGjo8Pwp/JiGm/MwVV61Gr1li1bvv76ax8fn/HWxSjYt2/fggULxnDEfqc5d+6cTCaLiYkZb0WMiHfDsMHiGYlEwuMxj+0XqFQqGIaJRIO9AicwYODC/iZ4Jw0bAwNjQjioKBSKjIyM+vr68VbEKBAKhdnZ2W1tbeOtiFEgFArT0tJKS0uhicq7atgKhSI6Ojo/P/+nn36ayPcPoFarHz58GBMTk5KSMt66jD+9vb2JiYmlpaWXXwJNSMbf88wQtVotFoslEom1tbWbm5u+XqvVPnnypL293cvLy9X1RcKxgoICtVp99OjR5OTk+Ph4JtME96FXKpUCgaClpYVCofj7+8Pw/z2FtVptRkYGj8dzc3MLCAjA4/FEIjE8PFylUg0MDEAmCvBlEgqFKpVqwYIFhm/UPB6vtLTU1tbW398fj8dPmTLl4MGDZmZmPB4vMjJy9+7dE3BpxrgM+969e6dOnWprawsICIiPjweONQiCREVFFRcX0+n0s2fPxsTErFq1SiKRTJs2DYIgJyenmzdvQqZIUVHRvn37FAoFiUSqqKgwMzMD9SdOnEhJSQkICLh161ZoaOiRI0eAWy6BQDDh4Pb6+noOh8Pj8YaGhsrLy21sbEB9cnLyt99+6+7uLhAIlixZ8uOPP+LxeNBXKSkpixYtmoBW/QLUmGhqahIIBDExMcBjCVRmZmYyGAwej4ei6Llz59hstkqlSkhIOH78OIqi1dXVmzdvRk2R3t7erq6uO3fuMBiMwcFBUNnQ0GBvb5+bm4uiaGFhoZOTU01NDfjo4sWLFy5cQE2Unp6eqqqqrKwse3v7lpYWUKlUKj08PC5fvqzvmezsbPDR1atXDxw4MDQ0hE5IjOsd28HBYfbs2RQKxbAyKyuLwWC4uLzIDLphwwaJRCIQCJydnUUikUKhyM/PBx+ZHpaWljQabZgL9NOnT2fOnAlcKb28vAgEAo/HA4sOspcoFArIFLGysnJ3d7eysjIcgRsbG5VK5YcffghB0KxZs9zc3EpKSnQ63fXr17OzszkcjpGnwX17GJdhA4bdCZFINH36dHBMpVIRBBGLxUwm093d/ZtvvikrK9u1axdkurzaGxYWFubm5sAFlUajdXS82JckPj6+oqKiqqrKVF9MAMN8rRsbG6dMmQICDSAIcnR0bG5u7uvry8nJIRAIZ8+ejYuL02g00MTDuN6xR8QwzAX3ElATGRkJ3rQnlGcC+Pr6Iph3QRAU8RLj3298bBkW5ATDsEajsbS0vHjxIvBaIRAIE9ONxxhHbHCf9HfL1tZWKpWCY7lcjsPhqFQqKNrZ2Zm8VQ/rjVmzZoEAALCs2NXVZWdn96r8BOkNOp3e39/f19cHiiKRiE6n43C4yZMnT5061crKysLCwrQ75N0wbBAygSAICAIBz2M2m11XVycWiyEI4nK5NjY2c+bMgSYAOp1O9RIEQZRKJZhS+vn5SSSSwsJCEIQEQRD4/28iYPjbAHPyOXPmgEVECII6OjoqKytZLNZ4q2kcoMZEQUFBSEjI3Llzp0+fvmbNmps3b4JAlk8++WTZsmUcDmf+/Pl//vknOjHg8XibNm1iMpk0Gm3ZsmXHjh0DS0Hnz5/39PTcunWrt7d3bGwsOjHo6uricDhsNptMJgcFBX3++ecg8i8+Pt7d3f3QoUNLlizZvXv3hF0GH4Zx+Yq3trbm5eWRSCQYhpVKpaurq7u7OwRB/f39XC63o6ODxWKBOPKJQF9fX3l5OYIgeDxeo9HQaDQPDw8wsSwuLq6vr3d2dp44A9Tg4ODTp0/lcjmZTFar1ZMmTVq+fDlYIS8oKCguLrazswsODp48efJ4a2oUGJdhY2BgmOA7NgYGxpiAGTYGhgmCGTYGhgmCGTYGhgmCGTYGhgmCGTYGhgmCGbYxMjQ0VFRUJBAIQBHkHgbBHm8GgiAXLlyorq6G3gJDQ0N//PHH3r1709PT38b5Md4AzLCNEZFItPEl3d3dwJXyiy++4HK5b3xCBEESExMbGxuht8Dt27evXLnCYrFmzJjxNs6P8QZghm2M6HQ6Mpnc19d369YtUKPRaEB2lJ6eHmDtwBmrvb0dpJRqa2sbGBh4/PhxQUEBSJ+Um5ubl5enz6kCgpyqq6tTU1P7+/v119JqtUVFRVwut7OzE9QMDAx0dXVJpdL09PTm5uZhuonF4pSUlMrKSlDs7OzMysry9vYOCAgw9OHX6XStra39/f05OTlPnjzRarWgXqVSVVVVJScnl5WVGTpHyWQyLpdbXV2t/1IAPp+fnJxsmLKyr68vMzPz4cOHDQ0NJpwxxvTDNicgKIqam5vv3LkzLi5uy5Yt06ZNA/GqEASdPn1arVb/8ssvEARlZ2dfvnz577//rq2tBa7jQ0NDdXV1gYGBRCJRIBAIhUIWi3Xp0iUcDkcgEGJjY6lUan9//4kTJ+Li4lxcXDo6Ovbv3y+TyahUanR09A8//BAYGJienn7s2DEHBwcCgbB9+3YHBwe9YtevXz937pybm1tTU5Ovr++ZM2fS0tIKCwuJRKJCoThy5AhwAQZewEFBQQ4ODubm5p2dnVQq9ffff6dSqTdu3Hjw4IGlpWVLSwuDwbh06RKJRCopKYmIiLCzs6NQKL29vSQS6d69ezqdLjo6Ojs7m06nNzY2bt68OTIyks/nf/bZZ9bW1mQyGYfDff/997Nnzx6/G2XEDHcexzACampq3Nzc6urqQkNDQQYof3//a9euoSgaGRm5b98+IJaUlBQQEIAgSFlZ2XvvvRcfH4+iaEZGBo1GO3v2LIqipaWlLi4uQqEQQZAFCxZs3rxZrVZrtdqtW7dGRESgKHrkyJFNmzapVCoURa9duxYUFKTRaO7du0ckEvPy8lAU1Wq1eq2am5tdXV3v3LkDAlRcXV3/+ecfFEUPHjx49OjRYV9BoVCQyeTvvvsO5Hjy9fW9cuUKiqJSqRRcrqmpydvbG2Qy2rhxI4fDAamOPvroo8DAQBRFHz16xGQywfY3tbW1np6eAoEgLi5u2bJl4BIDAwNYyMfrwKbiRgrYF/bw4cN3796tra3Vh53rh27DYxRFrays1q1bB9JL2drarl27FoIge3t7Go0mkUiAZFhYGJFIxOPxmzZtKigokMvlBQUFSqXy5MmTx48fr6qqqq2tbW9vx+FwTCbTz88PbAepV6mmpkan04WEhEAQ5OLiwmKx9Ktlr0YcIAhia2sLdt6ztLRcv359dnY2iKg/evTojh07Tp48KZPJ+Hy+VqutqakBypPJ5I0bN4J5e2pqqlarTUhIOHbs2O3btyUSSU1NDYvFam1tDQ8Pv3HjhlQq1Sd4xBgGNhU3XjQaja+vr4eHx2+//aZPIzMsn4xemEAggBDlF09rGAYGaWhvhlsCEYlEFEXB6E2n0x0dHcFWtcHBwVQqVavVgq2Lh+1GjiAIgUDQX5REIunfnEcEPETAMZlMRhCkv7+fw+E4OTnt2rVr8uTJPB7vX/IWKZVKa2tre3t7sHHsr7/+6uPjM2PGjMTExIyMjL/++is2Nvb69ev6yT+GIZhhGylgQgVB0JdffhkWFgY26wI5/SoqKoDMkydPlEqlXv7Vtob1arU6MzMTjLcZGRmurq40Go3BYIBwdyADzFv3kldVcnJyUqlU5eXlPj4+vb29ZWVlYKNZw8vpgWFYLBYXFRWBvIupqalBQUEKhaKxsfHUqVMuLi5isbi1tRW8/Lu6uiYnJ/v7+6vV6vv374MH0OLFi8Ee0frkllqtdnBwcP5LoqKimExmYWEhZtgjghm2MQJ+7uDY09Nz1apVsbGxYPQLDQ1NSEgIDw+nUChVVVVg83BDeTB664/xeDxIkzZ16tS8vDwOh6NSqXJycq5cuYLD4aKiosLDw8PCwubOnSsWi62srE6fPo1/yataOTk5bdu2bc+ePYGBgRUVFXQ6HTwmRpRHUdTa2jo+Pr6hoUEkEslkso0bN06bNs3LyysiIuKDDz4QCoVKpRI0PHz4cERExPr16ydNmjQ4OIjH41EUXbduHZfLDQ4OZrPZSqWyu7s7Ojq6tLQ0ISHBw8NDKpUSiURfX9+3dhPebbB4bGOkv7//2bNnLBYL2K1UKi0sLPT09ATpzWpra9PS0uh0upeXl1QqZTKZCoWisrJy4cKFBAJhcHDw2bNnTCaTQqGo1epnz54xGAxLS8vi4mIbG5vi4uK2trZVq1bpF5PlcnlaWppYLLa2tmaz2Y6Oju3t7SKRyMfHZ8RsYbm5uUVFRY6OjitXrgSvuM+fPycQCM7OzoZivb29bDb7/PnzEolEqVRu2LDB2toafLWkpCSZTBYYGKhSqaZOnQpW3RUKRW5urrOzc2JiIp/Pv3HjBpj8P378uLKykkKhsFgsLy+vnp6e7OxsiURiYWERFBQ0c+bM/9U9ecfADBvjrSCTyZhMZlJSkoeHx38V5vP5qampDAaDz+dfvHjxzJkzYNUN443BpuIYbwUSibRu3TpLS8vRCJubm3d1dRUWFlIolAsXLgQHB799BU0cbMTGwIBMj/8A/lFtGlM5Qu4AAAAASUVORK5CYII=\" /><br /><h4>Caption</h4>Figure 3: Distribution of conversion times for all documents, ordered by number of pages in a document, on all system configurations. Every dot represents one document. Log/log scale is used to even the spacing, since both number of pages and conversion times have long-tail distributions.<br /><h4>Annotations (HuggingFaceTB/SmolVLM-256M-Instruct)</h4>The image is a bar chart that shows the number of pages of a website as a function of the number of pages of the website. The x-axis represents the number of pages, ranging from 100 to 10,000. The y-axis represents the number of pages, ranging from 100 to 10,000. The chart is labeled \"Number of pages\" and has a legend at the top of the chart that indicates the number of pages.\n",
+       "\n",
+       "The chart shows a clear trend: as the number of pages increases, the number of pages decreases. This is evident from the following points:\n",
+       "\n",
+       "- The number of pages increases from 100 to 1000.\n",
+       "- The number of pages decreases from 1000 to 10,000.\n",
+       "- The number of pages increases from 10,000 to 10,000.<br />\n",
+       "<hr /><h3>Picture <code>#/pictures/3</code></h3><img src=\"data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAAyIAAAGPCAIAAAAvMvMQAAC0hUlEQVR4nOzdB1xTV9sA8HNvbjZ7yhAURFQEwYELte69tSp1b+ves+5RR63WVbfWrVXrqHvVvRVwAAoyZYeVkHXH+0tu3zQCKiiYBJ7/x9eX3FxuTmJy89xznvMcjGEYBAAAAAAAShpe4kcEAAAAAAAQZgEAAAAAlBYCmayEhIRdu3aZmZnx+XwY+gSgzMMwTKFQZGdnz5o1SyQSIRNx7ty5e/fuOTo6GrohAIBvAcOwtLQ0Hx+f3r17a26aboBy9+7dtm3b+vn5mZubm+6zAAAUEYfDycjIePnyZXR0tIODAzIREyZMOHToUO3atTHMhM+3AICiwDAMIRQaGtq0adNDhw5hGGbCvVnW1taurq7bt2+vXr06nLwAKPNwHH/48GGfPn3YE5mpsLGxadWq1YEDBwzdEADAt4Bh2Lhx43AcZ89UhKk/GQ6Hg2kZui0AgFLHft6RqeFwODgOibAAlBccDkf3u8l/8qEfC4Dyw0Q/7ybabADA13/kTT7MAgAAAAAwThBmAQAAAACUCgizAAAAAABKBYRZAAAAAAClAsIsAAAAAIBSAWEWAAAAAECpgDALAAAAAKBUQJgFAAAAAFAqIMwCAAAAACgVJrzYDo/HM8VlN0rK5s2bHzx4wDAMSZICgcDOzm7ixIkuLi6GbhcAAAAATDnMkkgkYWFhMTExcrm83EZasbGx4eHhb968ycrK8vPzq1ixokKhMHSjAAAAgK+Wk4LiniL8v5UBP4OmkFttZOGIjI9Jhlnv378/cOBARkaGVCott2HWokWLKIqaOXPmzZs3//rrLwcHB4FAYOhGAQAAAF8t7inaMxjxREXdX5WHBu9BNdsj42OSYZaPj8+mTZvCw8O///57mqZRucQGVTwej8PhWFpaikRFfjsCAAAAxgznaGKsoodZ7J8YJZNMgccwjKtVbruydBgtiqIM3RAAAAAAlIneLBbDMIZuAgCgjMjKyoqKikpNTaVpumLFir6+vp+4iouLiwsNDRWLxQ0bNoTBegBA2QyzgObfjyAwDOPz+YZuCACmbePGjTt27GAYRq1Wc7ncDh06rF27VigUFtzz6NGjixcvJklSLpfXqlVr/fr1lStXNkSTAQAmAMIsE0NR1MuXL7OysjAcxzAsNjYuVyr95+ZNK0srBjEcHK9Ro4aVlZWhmwmAKWEYpk2bNt27d69UqRIbSI0dO7ZOnTrDhw/Pt2d0dPSYMWOGDh26ePHipKSkLl26zJs3b9++fThukgkYAIDSBmGWicnLy5syZeq9e3f5XA5CmEwuJ0mqf7++OI5TNM0huCdOnPjuu+8M3UxQZrMAGYYhCM15oywFFhiGBQYG6m7269fvt99+e/r0acE9z549a2VlNX78eKFQ6OHhMX369NGjR//222+2trafOHipNRwAYOwgzDIxDMNIcnJrW8oXtXYlSSZdbiYnGSczDo+DPYiXLbqdrVaThm4jKIOWLFny4MEDiUSiUqkcHR1dXV0XLlzo7OyMyhC1Wp2ZmalSqS5fvpyZmdm1a9eC+9y/f9/Z2dnJyYm9WaVKFYFA8OzZs1atWhWaOYphWAnOhqYoSiaTKRQKyEz9MjiOi7Qg9gXfDIRZpgfHcT9HYYvqVkitPX1jCDEI4ZgVn7P8vlRzE4CShmEYh8NJSEjIysqyt7cvS11ZOm/fvh05cmRubm5UVNS8efPatm1bcJ/U1FSxWMzlctmb5ubmZmZmiYmJ+vuQJDllypSIiAgMw3Acj4yMDAwMlEgkGIZ9TXjEMExOTo5UKiUIoky+/t8ASZIMw1hZWUEFHGPGEHxebq55sUJhDMvNzVXlyDBSWYotK1JDNJ96uVwuFovZLRBmmSSK0f6/5n/+j0FqGi5wQWmZN28ewzAjR44MCQk5cuSIhYVF2esPcHJymj17dm5u7vnz57dv316vXr0WLVoU3E3/iWNa+YInHMcbN27s4eGBaxMo2XorfD7/a8IsDMOkUqlMJnN2dra0tCx7L/63wTBMSkpKdna2WCzm8/nQKWikCB7B4xX3j3g8Hs7nIUMXz2LPCWxmBQvCLABAUc8d7Lc7h8Mpk1/zVlZWHTp0QAj17NmzVatWv/zyS8Ewy9bWNikpiSRJ9jQq1dKNIbJwHO/Tp4/uZnZ29uvXr3WXtl9MJpPx+XwbG5sy+eJ/M7a2tjk5OVwuFzq0jBqfj4oVBDMMX4OL+P/2NBsWl8vVBfHQ8wwAKJ4y3wdAEISdnV12dnbBtKrAwMDk5OSkpCT2ZlRUVF5eXu3atT9xNJIsmXRJmqZhrPDrsa9hmX8PA+MBH1qThGMIcbB8P1zNVgBAsalUqnPnzqWnpyuVyry8vJMnT165cqVVq1bsV/LWrVvnz58vl8sRQp06dUpNTd25c6dSqUxMTFy3bl3Hjh0/Mc0QAFDOwaCh6eFg6Emyau31VP1kLA6GvctU0gwDoRYAxcUwzJo1a968eSMWi/Py8jAM69Gjx+TJk9l7Hz169OrVq2nTpgmFQm9v73Xr1i1fvvzkyZO5ubmenp4rVqwwSCcTTdNhYWFKlQor0WkvNE1VqlTJ0dHxaw6Sm5ubnJwsEolcXFwK3puampqdnW1jY/PZ8DQuLk6pVOrvSZKkSqVi+6IEAgGH828mDsMwcrmcz+frtrDRM03TUKYfGBaEWaaHg2MPk8m32en6GxmESIqmGE1ReMM1DQCTxOfz9+7d+/btW4lEQhBE5cqV9RfbmT17tv68ocGDBzdu3JhdbCcoKMjMzMwgbVYqlT/88ENycjKnRLuxVSS1Yvny0aNHf/ERNmzYcOTIkezsbB6P5+/vv2jRIldXV/YuiUTy888/X7t2TaFQmJmZjRkzZtCgQYUe5PTp09u2bUtISKAoyszMzM/Pb/r06VWqVLl8+fLPP//MpgniOF6/fv3x48c7OTmlp6f36tVr0aJF+lUDV69enZaWtnbtWhhsBQYEYZbpUVHMIF/Rhh6V/i3owMKxB7GyTkeTacg5AKD4KmoVepenp2e+LV5ayKAYhklITm1lK+vnZ10ik4wxDCnU9KBT6VKp7IsPcuLEiRkzZkyePLl///5v3rwZO3asTCY7cOAAh8PJzs4eNGhQVFTU1KlTq1evHhERYWFhUehBVq5cuWTJkh49evz4448VKlQIDw/fsWPHsWPHZs+eHR8f//Tp05kzZ7q7u0dHR2/duvXhw4cXLlxQqVQ3b95MSUnRP05YWFhCQgKkYQHDgjDLJPFwJOLhH4wV4JiQC/1YAJQnGB7kbt4zwPaD2i5ffjREqujxZ1I0AdcnpaSk3L9/PygoiB3Lo2n6woULlStXrl69+sWLF2vUqPHTTz8JhcIaNWq8efNm8eLFSqVSJBKdO3fu6tWroaGhVapUQQg1atSo0INHREQsWrRoypQpS5cuZbfUrl27R48ebAiFYZidnV3fvn3Zg7i4uIwYMeLly5cVKlRg58DqH4rL5fKKXxcAgJIFXakmSXNOZfL/wDUbAOUNSWvr55XQj4oq0lmEw+GsX79+zJgxCoUCIbR27doxY8ao1WqEUM2aNdPT0+Pi4tg9w8LCatasyePxGIY5c+ZMq1ataJo+dOjQ8ePHY2NjCz344cOHra2t8w0mCgQCd3d39nd2eW/2dzc3NxzH2dKvX/lKAlBKoDcLAABAMdjZ2a1du7ZNmzbbt2+vXbv28uXL165d6+fnhxAaNmzY69ev+/XrV6tWrffv30ul0s2bNxMEoVKpXr58KRKJ+vTpw+FwMjMzeTze5s2bmzdvnu/gDx8+rFixoi6oKohhGKWWVCrdsWOHubl5zZo1S6pqBgBlPMwKDQ3dv39/amrqtGnTatasaejmAAAAKIS/v/8vv/wyZcoUoVDYv3//wYMHs9uzsrJSUlIoisK1cnJyEhIS/P39GYYhSfLRo0dHjx7t3LmzVCrt27fvzJkzr1y5ki9DS6VS8bQKfVyCIJKSknr27CkUCiUSiaWl5a+//mpvb5+QkPBNnjcAJh5mZWZmVq5c+dq1a9HR0RBmAQCA0erUqdOyZctiYmJGjBih27hgwYLXr19fv36dLQkxd+7cIUOGREREWFpaCoXCmjVrduvWDcdxa2vrkSNHjh49Ojw8PDAwUP+wtra2r1+/zsrKsrKyKvigNE1bWVlNmDChYsWKAoHAx8eH7ff62KAh5L+DspybFRcXd/PmzUOHDp06dYpd1UuHpunLly/PmTNnyZIlT58+1W1v1qzZmDFjKlWqBJ8NAAAwZmvWrFGpVN7e3qtWrWLP8CqVKiQkpHbt2rqyW23atMnJyYmIiOBwOAEBAfp9VAKBgKIoXZaVTpcuXd6+fRsaGlrog9I0LRaLO3fu3KNHjw4dOujGFsVisUAg0FXnZ8XFxTk4OEA1B2BYpfX+UyqVQ4cO7dWrV3BwsC47ksUwzOrVq4ODg2NiYu7du9e5c+fTp0/r/22+mAwAAECheBwMcfGS+hEVeSmJs2fPbtmy5bffftu9e/fFixd///13dmZfxYoVX758mZ7+b1W/W7du4TjOVspo2bLlCy32W+DUqVPOzs7shEF9bPA0Z86c+Ph4dgtN03fv3mW/Jtjlt9nUe30WFhYtWrQ4cOBATk4Ou+XJkyd3795t3bo1ZMeDsjloiOP4pEmTqlWrdujQIfYTqBMSErJq1arFixePHTuWpunhw4cvWLAgKCjIxsamlBoDAABlD46YR4ny488zUYkUzkJISTKK/Ks4FiI0NHTkyJFjxozp1KkTQmjZsmXTp0/38vJq06bN1KlT+/bt26pVq7Zt20ZHR587d27GjBlsedLOnTv36dOnW7duXbp0effu3d27d9euXVuw3LyVldWBAwfGjh0bGBjYtGlTtm5WSEgIW99BrVbn5eUVXGsSx/H58+cPGDCgUaNGzZs3z8nJuXDhQteuXbt3714irwwARhdmcblc9hNYMJPx2bNncrn8hx9+YD8bgwYNOnXq1KtXr4KCgtgdOBwOn8//7EPw+Xy2FjAqTz77fMvbCwK+PQO+x+Dtrc/KXHzwTc7+iLQSPKZAKOTzuJ/eh8PhLF++/Pvvv2dvDhs2zMzMjM1kb9So0blz565cufL27dtq1aqNGjWqadOm7G5isXjDhg1nz569e/du7dq1Z82a1bBhw0KPHxAQcPbs2X/++efhw4dSqbR169aLFi2qU6cOQqhFixa2tra6svL66tevf+HChYsXL7569crJyWnLli2tWrX6WAVUAMpOCnzBLKvnz59XqVJFt3KFj49PZmZmdHR0UFBQXFzcP//8ExERce7cOYZh2rZtm29YPSUl5cWLF2wNutjY2Ly8PJVWOcnlwjBMqVQWvJLTp1KpSJKEgVdQ4giCoCiKnU7PVkL6xg3Acbz8fNg/SygU3rhxo8Q/6QzDfHapQR8t3U0cx/v166e7WVOr0D80MzPrq/XZZtjY2HTXyrfdW+tjf+Xh4TFmzJjPHhyAMj7TMDs729raWndVKhKJ+Hy+VCplFxx98+ZN37591Wp1XFxcwfPpgwcPRo8eLRKJ2PSvrKwsmUyWm5tbTqIKdsEKkiQLv6bXbGOkUlleXl7B3AUAvpJQKGSD+OzsbIPkUPJ4vNzcXJqmoU+Lvehyc3MzdCsAAMYXZrGl6nQ3aZomSZIgNC3x8fFZvHjxJ/62Q4cOERER7O8RERH9+/e3tLQsV0ldBEFoOhIUhV3Qa7ZhVlaW5loGaBwo64RCIZfLtbOzM9QbzNramsPhQIcWAMBUGCDMqly58rlz5yiKYkOr9+/f4zjOrkj1WQRB6M7vNjY2HA6nvKVnFSU3q1y9IODbM+B7DN7bAADTUuoFRQiCwDBMP6W9du3aGRkZuk6pGzduODo6Vq1atejHzM7OfqKlUCjgtAsAAACA8tWbxTDM1atX4+Pj79y5I5FItm3bJhQKO3bsaGtr26BBg8DAwNGjR2/YsCE9PX358uXt2rXz9PQs+sFjYmLWr18vkUhycnKg9NynKRQK/dW+MAwTiUQQmwIAAACmHWZdvnz5zp07bPfVvn37eDxegwYNbG1tra2tt2/fPm/evMGDBxME0aVLl8WLF3O5n5lCrM/X13fbtm3h4eH9+vUrJ8nv+WiiJIz9n/82FYydGIYZNmzYoUOHeDweQRByuVwsFr9586ZgrRoAAAAAmFJ50gULFqjVajaNg01Z1RVxqFat2tGjR6Oiovh8/hdMlsFxXKBVbntl1DRSkQwiGZpBNMMQOIZwpFDnzwvGMGzw4MFNmzY9efLkgwcPVqxYIRKJIDseAAAAMPkUeLbswsfgOO7l5fU1x2fLk6LyhybVf4TlPX7/kmFQLomraGTFpQkci85k8mhNF5b+zq1bt0YIJSUlhYeHjx8/3nCtBgAAAModA8w0/HqhoaG//vprZmZmWloaW6q0/ODxeIMHDogKakwjjCCIa9oEuPY9e4pE4mYMzeMSlSpVKvhXJEmyC4EJBAJDtBoAUMLUavWCBQuyJFkYXXJXmxhSM+q+ffu2aNHi0zs+evQoNja2Tp06lStX1m189+7dkydP3N3d69Wrx17d3b59OzIyUqVSBQQEtGnTptBr79TU1Lt371pbWzdq1EiXPUKS5MWLF2mabt68uZmZWYk9QQC+OZMMs5ycnIKDg9+9e/f8+fNPl0QvewQCwYQJE3Q3p0yZcu3atZUrlper4mEAALVavfX3rRKVBNmxNfO+GoYQhVACqupV9bNh1urVq48dO9avX7+DBw/qNs6aNevo0aO9e/c+evQoQmjdunWXL192dHSkaXrPnj3u7u4HDx4suE5OSEhIr169rKysLly4ULduXXbj1atXu3btKhAInj179pXjHgAYlkmGWfb29q1bt37z5s369evLeaFC9umX8xcBgPKJj/NRK4Q6IfTfZOKvgCOkQGgK4uCfHyJQqVTW1tahoaHv3r1jO7SioqJevHhhbW2tVqvZfcaMGTNx4kRnZ2d2AY8WLVrs379/1qxZ+Q5F0zSXy7W0tDx//rwuzDp27FiFChVkMpn+yU2pVJIkyePxdJ1eFEWxf65/NIqiijWnCoBSZcLVENjl1QzdCqMArwMA5RQfIVEJ/Qi1/y3ad4Jara5Tp46Xl5euN2v//v3e3t516tTRhVmVKlViYyx2XWcXF5eMjIxCjyYWi3/44Ydjx47l5eUhhN68efP48eNBgwbpzmwpKSkTJ05s2rRpgwYNmjZtum3bNrZOTXp6+pgxY/bs2cPulpycHBwcfObMma99VQEoOSYcZkFsAQAo7xiE6BL9KeLDMoy5uXnHjh0vXbokl8tlMtmVK1c6depkZmamn8ghl8ujoqLCwsJ+/vlnhFC3bt0KPRRJks2aNeNwOP/88w9C6Nq1a2ZmZvXr19fV/MvMzHRwcJg/f/7mzZv79OmzYMGCP//8EyHk6Ojo6+s7bdq0x48fs0kUb968ady4ccm8tgCU20HDV69ebd26NS0tLSMjo7ylwH8ZdlUiHo9n6IYAAMoIlUrVu3fvZcuWhYSEkCQZHx/fq1ev48eP6+8TGRk5cuTI5OTkuLi45cuXN2jQoNBDqdXqKlWqNGrU6ODBg23btt2/f/8PP/xgbm6uu5auVq3a3LlzEUI5OTm+vr537949fPhwnz59MAybMGHC06dPx44d265du+vXr1+8eBHqAgKjYpJhlp2dXcuWLePi4u7evVveUuCLiKbp69evZ2Zm4gyO4djLsJcymezo4aOaZacZBifwJk2a2NnZGbqZAABTRdO0paVl48aNjx07plarmzZtamFhQdO0fp2dqlWr7t27VyaT3bt3b8GCBc7OzoMGDSr0aCRJ9uvX78cffzx+/HhaWlqbNm1iY2N196rV6i1btpw7d04qlXI4nOjo6KpVq7IL42IY9ssvv7Ro0WLx4sW7du3y8/P7Js8egDIdZjk4OHTp0uXdu3dbtmyBocNCqdXq6dOmhzwPQRaaCUSMgmFUzA9jftBMJlIhLsm9ePlis2bNDN1MUNYkJyfLZDKpVKpSqdjF3d3c3GBFrDIsODh46NChDMPoEqT0CYXCatWqIYTq1Klz79697du3//DDDwRRyPcORVGNGjWysLCYPHly06ZNPT093759q7t3165dS5cu/fnnnwMDA83MzJYuXfr27VvdNXZ2drZMJuNwOHDVDYyQSYZZLIVCATHWJ1AqivajEZsLodTMRaLFtOYfPAJRx6iSmQEOgB6aphcsWHD16lWZTKZWq62trcVi8d27dz9dqRh8FXbRrRKpnPVFx2nQoIGnpyeGYR8bENRhZwV+7KSt6WXH8eDg4JkzZ/bs2VOXfcv2jV2+fLlDhw5Dhw5ld05JSWGXGGHHLn/88ceqVasOHz587ty5devWrVWrVrGfBgClxoTDrPJZAr7oMAZDLghV09bCYU+gNEI8hOQII+ClAyUPw7A2bdpUrlz59OnTb968GTx4sEgkgqn1pYvUfsCpkqubVbT+IF2/kY2NzbVr19hlOdjt7Jk5MzPzr7/+cnV1rVChgkKh+Oeff/7888+NGzcWfD8wDKObNj569OhBgwaxcbn+9kqVKp0+ffrp06fW1tanT5++du1aYGAghmE0TS9evDgiIuLKlStVqlQJCQkZPnz4+fPnISMCGA+TDLMoilIqlXK5HHqzPoNCSP3heZM9kwJQCjAMY/sh0tPTc3Jy2JxlUHoUpAJdQuh5yZUnpTXnB5L+fBkuBwcH3e9sgKXbzoZZBEFcv3798uXLFhYWCoWCy+UuW7bshx9+KHgooVDo5ubGjiTiOK5b+lZ/+48//hgSEvL9999bWlpWrVq1X79+7Cjho0ePTpw4sXbt2ipVqiCE1q5d26NHj507d86cObMkXhEAymuYFRYWtmbNGolEkp6eDjMNATA27OJOKpUKJreWHoIg+g/sL0mT4ExJpr6p6qt8fX0/u9v27dsL3b5jxw72F3Nz8127duXm5qampvJ4vAoVKgiFwkL/pEmTJiEhIQXXAdPf7uHhcf78+bi4OAzD3NzcMAxjBw39/f0fPXqki8ycnZ1v3rypKwMBgDEwyTDLw8Nj+vTpUVFRkZGRkPMIACiHeDzeb7/9ZqhH1+/B+th2giCstT59KA6HU2gElm87QRAeHh75Hoinpf9XBbcAYFgmGWZZWFjUqlVLLBbz+XwYNwQAAACAcTLhidZqtRpiLAAAAAAYLRMOswAAAAAAjJlJDhqy2Pq/hm6FqdXUKakSOwCUOQqFIiUlBcOwChUqfCy/h2EY/Yp9DMMIBAKYiAMAKFNhlkKhSE9Pj4+P1y0FDwpHaWq+f1DQgdGWeAAA6KEoat68eYcPH6ZpWq1WV6hQYe7cuWxxinzevn3bqVMnpVKJYRi75vGePXtatWpliFYDAEyASYZZL1++XLp0aVZWlkQigevIj+Ii9Aihdx9uxBDK05Y0hD4tAP5PqVQmJSX99NNPNWvWZJfPGzp0aI0aNapXr55vT7lcnpaWNnv27Bo1arDVOItS/gAAUG6ZZJhVq1atPXv2REREDBw4kKKg2uZHMAgJELL/cCOGUCZC6YZqEwDGSCgU7tq1S7f2YoUKFf7555/Tp08XDLPYndu3b1+zZs1v3kwAgOkxyTCLIAhLS0sLCwtYkpZNUCu8hg2JUG2EBn04aMjV1oz+tYTKRgNQJmBaupsqlYqiKCsrq0L3lMlk27Zts7W1rV69evv27c3NzT97cFQ6MjMzS6NwoFgsLlgsNB/2cT99BiZJksPhfPrps0t6sPWu9JeUprXYv9UfsmAYhqbpfIMYFEXhOA6pusA4mWSYxSrn1RwuXboUFxf35MmT1NTU33//3cXFpV27djY2Nh/sRGkXjdY/D9OQmwXApzAMs379ei6X26NHj4L3EgTh7u4eGRnJMMyePXuWLVv2xx9/5FurmKKoVatWvXv3DsMwHMcfPnzo7e2dnZ3NpnN9ccMUCgWlxR5WKpXWrVs35X08okr0I80TLVu2fOLEiZ8YKOBwOAsXLlSr1StWrCh0Nw6Hs2HDhtOnT//444/du3cvuA+Hw8nKyjp+/PihQ4eio6MxDHNycurQoUNwcLC7uzuGYT///PO1a9fYeu7u7u7dunXr0KEDn88/ffr0qVOnFi5c6Obmxr4UCoVigFa3bt0+O7iBYRj7GkqlUkbrS18mUIoYgs+VycTFipu11z9qmQIjNVG7AbEfT6VSqbtWMeEwq5zbtm3biRMn+Hw+juOzZs1ydXWtVatW/jALAFBMq1evPnr06L59++zt8424a7i7u58+fZpd7yU0NLRv377z588/ceJEvv4VkUjE9nJxOBx20mK+DrMSIc2WyDy7o+pdEF1Ca0eTcnT6R5Xq819U9+/fVygU7PPKF6xwOJz79+///PPP6enprVu3LuRhMEwikYwYMeLatWujRo2aNGkShmHh4eE7duzIzc1dsWIFQuj27dvR0dEzZswgSfL27dt9+vTZsGHDqFGj3r17d+XKlenTp+sORVHUmTNnGjduXLynWgr/HKCkYJpABS/ekAuj6VvFMRwZ+p+14FsLwixTtX//fv2lu3Ac/2w/PwDg01atWrVy5cpt27Z17Nix0B1EIpG7uzv7u5+f37hx48aPH5+bm6s/wsjhcCZOnKi7uXjx4oiICAsLi69sm1wu1x+G42h+Y5BbI9Tgh5JZDx5DSMWgszMI7VDgp2cXEQTBho8Fxw1zc3N/+umnvn37Xrlyhd1S8FA7d+48f/78lStXGjVqxG7p2LHjiBEjoqKi/m0Lhnl6eo4ePRohNGbMmC5dumzatGnUqFFcLfaAuv/y+Xx2wLEoM6I0rxuHIxaLPzvaCwxJKCxmagsjFAqFIh5CRrHU0gerThm0JeDLQVBlEqsU6IZ42JO7oRsFPmXTpk2rV69ev359r169ivgnHA7ns9lRpbvuKqXWpAGUVJilln/9YTZs2MDj8caMGXPhwoVCd1CpVAcOHOjatasuxmJZWFgEBATobuo6yTgcTo0aNR49egRjfMAUmXCYxefzodcXGCeJRNKlS5e8vLy0tDShUCgWi9u1a7d8+XJ4xxonmqY3b948e/bsJUuWdO7cWSKRMIzm4lgkEiGELl68mJGR0bNnTz6f/+bNGzMzMycnJ4RQeHj45s2bi5IFX348efJkz549x44dMzc3/1h8mZaWFhISMnbsWPYmwzBSqVSlUmEYxuPxxGIx+zGhKIpNhI+MjDx9+nRgYCB8fIApMskwKyIiYteuXWlpaRkZGTDZEBghgiDq1KmTl5d38ODBqlWr1q9f39PTE74kjJZCoVi2bBlJkn/++efRo0fZ7/5Bgwaxg1Z79uwJCwvr1KkTn8/fsWPH5cuXnZ2dGYZ58+YNQRCLFy+GfkpWbm7uggULBg8eXKtWreTkZAzD9CcP6rBJXWKxmL2pVCpnzZr1/PlziqJq167966+/8rXu3r3boUMHiqLi4uJomp43bx7MfAKmyCTDLDMzM19f3/j4+I8tiAGKKzw8PC0tTaFQkCRpZmYmEolq1Kgh1IyOgy9hYWGxfv16lUp1+fLljh07Ll261NAtAp/C4/G2bt2qVqtVKhW7hWEYHx8f9vepU6fm5OSwH4fx48fXqFEjOjqaJMlBgwa1a9fu65OuyoyDBw8+f/58xowZT58+TU5OlsvlMTExr1+/9vb21r8eNjc353K5KSkp7E0ul/v999+3bNly3bp1jx8/ZmcLUhRlY2PTqVMnhmHc3d2bNWtmaWlZ6INiGFa6w7IAlMMwy8XFpX///m/fvt2/fz98wErE8uXLz5w5o5kQq1ZbWlq6u7sfOXKkWrVqhm6XaWOvvOH62/gRBNGlS5eP3Vu3bl3d766uroMGDfpW7TIx0dHRcrl86NChDMOo1erk5OT9+/dHRkaeOnVKPyPY1tY2KCjo3LlzkydPZlOvmjVrhhC6cuXKs2fP2H1IkvTw8Bg3bly+h7CyssrJyZHJZLot2dnZCoUCgl1gtHBTTzE2dCvKiAkTJuzfv79du3aVKlXatGnTr7/+6uLiYuhGmTx4f4JSh3MQB5XcD7fo63AVHASfM2fO8+fPr169+s8//xw5csTNzW3UqFH79u3LN+zA4XBGjhx548aN33//XX9dWplMpj97utBL6GbNmkml0kuXLum2HDp0yNra2t/fv8gvGQDflEn2ZoESx16vX7t2LT4+vnPnznBpCIDxoxkMJT5Dr66gEunUxzDNTEM6tygXBwRB3Lt3r2vXrrpgqEmTJjNmzNAf2sNx3NrautDyY927d//pp59mz5599OjRWrVqcbnchISEmzdvdu7cme33YouIFvxDV1fX6dOnr1mz5tmzZx4eHrGxsZcuXRo5cqRuhBcAYwNhFvgPRVFsb7+hGwIA+AwMw8yt7aTRJ1HMmRJaPAtDiKEEXB7/88ViBg4cWKtWLV3nE0VRFStWZBhG18Vlbm4+efLkfPXxdfh8/vz583v37n3w4MHIyEgMw1xdXffu3dusWTN2PsHgwYP1e7b+ayKGLVq0qFmzZseOHYuMjLS1tf3jjz/at2//dU8cgFIEYRYAAJgePp9/4MABpUJR5FG+IqEo2svL67O79dL6xA6WlpZjxoz59EGqV6++ZMmSQu/q27fvx/4Kw7CWWp9tJADGAMIsAAAwPTiOBwYGGroVAICymwIPAAAAAGDMTLg3C4o9fh6u/RemdXkX2ptQSREAAAD4JkwyzGKXioOCDp9GIxpFI/RQG13JEFIiZI0QF6FIRMkppmRyZgEAAABQtsKsly9fbtiwIT09HRbb+QQLGwuLMAvsDwzDMLlMrlapza20K68xiGujWeXe0A0EABQDhmFwYfn14DUE35hJhlnOzs79+vWLiYl59uwZfGYKxeVyN2/eLJVKMc3JGft96+8XLlw4cvgIWycQw7EaNWoYuo0AgGLg8/kqlUomk+kWVwbFxTBMTk4Oh8OB60zwzZhkmGVjY/Pdd99FR0cLhUIIswqF47ifn5/u5oWLFwQCQdNmTeHsDICJEovFZmZm8fHxQqEQevG/DEmSCoXCzs5Of/EfAEqVSYZZLKVSCTFWEZEkyTCMUqkUCD5feBAAYIQIgnB2ds7JyZHL5XDq+zJCodDW1tbCwgIuOME3Y8JhFgAAlCsEQdjY2Bi6FQCAYoCeZwAAAACAUgFhFgAAAABAqYAwCwBQVDiOYxhGEJBsAAAARQKnSwDAR9E0nZGRoVQqMQzDcTw3V6pUKuPi4szMzRHD4Dhua2vLVgkBAABQEIRZAICPys7OHj9+fGjYSzbMehcblyeXd+3eg8PhUDRjaSbasmVL7dq1Dd1MAAAwUhBmAQA+Sq1Wh716jSe86FXLiqEZSVWkpgV2gkSCg92NlV5/g+Xm5hq6jQAAYLwgzAKgtLA1JE26Qg+bidWhusXCTm5IRSH2uWjXIL8Vnv3wRCaGQX4nAAB8FIRZIH+CMyxD8fXrmrO/q1Qq9iZFUYwWjuMcDgeZGjXNIDWNSEYbYWkxmEJzEwAAwKdAmFWukSQZGhqalZWJI0RwuXGxMbm5udevXbWysqQZhOMcPz8/a2trQzfTlLx48WL69Ol5Sk1kQtF0XGLy7v2Hbj94TNM0gWPVvDw3btwIgezLly8lWiqVysHBQSwW16xZE5YoAACUPSYcZvF4PJMejjEGMpls4sSJ9+/dQzwzDEOUIpeh6V79BmI4h1Hmcnm8s2f/btGihaGbaUrS0zMuXrwY5IS5WPAQgypW5SM6DSUmIQy7H698nxBP07Sh22h48+fPP3/+PEmSNE3zeDwvL6+TJ096eHgYul0AAFDCTDLMio6O/uuvv5KSkrKysmAJ1a/DkMo80q0Naj0TkQiRckSrSZ4ZwnEU+wDdmM8wEBMUE4ZZCHmr2js19LbQjrL9H47NORt/PBMWrNWYP3/+6NGj165dGx0dvWbNGjs7OycnJ0M3CgAASp5JhlmgBGn6A209kXczpGZvaNNvNIOIYuzWYkO3zlRp8pZUbDLT/+GYmoJkpn/VqlULIfTnn39KJJL27dtDvVMAQFllkmc3Dw+PKVOmREVFnTt3DoZgSgBNaruy9LbgCJFKA7YIlAcURdE0rVAozMzMDN0WAAAoFSY84sZO4zJ0KwAAAAAAylyYBQAAAABgzCDMAgAAAAAoFRBmAWB4NE3DCDgAAJQ9JpkCD0DZkJSUtGXLlvT09OTkZIFAYGNj4+/vP3z4cEO3CwAAQMmAMAsAg8nLy3vw4EFcXNybN2/Mzc1dXFx4PJ6hGwUAAKDEQJgFgMF4eHicPXs2LS2tffv2zZo1W7NmDZTbBQCAsgTCrHKBw+FgGMbnQwly48Iu1M3n8zEMIwgCurIAAKCMgTCrjIuOjs7IyIiPj1coFHfv3hUKhb6+vrB0sVFhk98hBd4YpKSkYBjm4ODw2T3ZdDorK6tv0i4AgKmCMKssYxhm5cqVJ0+elEqlcrm8e/fuYrH4wYMHRfkWAaD8YBhm48aNf//9t0QiYRimUqVKM2bMqFevXqE7R0VFLV68ODw8nMPh9O3bd/To0dANCQD4GAizyjIMw4YMGdKiRQuJRCKVSitWrMjj8SwsLAzdLgCMi0KhuHjxopeX13fffZeXl7d58+Zu3brdu3fPzc0t3545OTl9+/YlCGLRokXR0dHz589XKBQzZswwUMMBAMYOwqwyroGWoVsBgFHj8Xh//PGHjY0NezMgIKBly5Z//fXXhAkT8u158eLFmJiYS5cuBQQEIIQyMjLWrl07fvx4oVBoiIYDAIwdTGsCoOThGEIFfjDM0M0CH8HhcHQxFkJIoFXosvTXrl3z9PT09vZmbzZu3Dg3N/fly5efODhBwNUsAMX0BadLYz3DwucfIIRxNG8E/QxsHCEOpJt8IQahbCUtzaPU1L+vqSbKwjG5GpLcTcPhw4dzcnI6d+5c8K7o6GgLCwuRSMTetLa2trKyioyMrFu3rm4fiqL27duXkJCA4ziGYVevXnVycpJKpRiGwUQHAD6L4fC4crmgWGEThinkcrVchVEqZFCYlkqlEggE7BYIs8o5DOEclPQc/fM7otR6m3GU8RYxlCGbZpo4OKYgma6HEwq918/PSK+3gM6RI0dWrly5fv16T0/PgvdSFKWf8M7lcjkcjkr1wZmdYZjQ0NA3b95oLlhw/P37905OTiqVCsIsAIqEwDCSRMVEkqRarUak4cMsHMcp6r9vT2MMsxiGwYy1968Mwjko4S5KfpJ/O00hgh3uAsVAMwyXg02uZ+vrKFDTer1ZCB0Ky4z7f/8WME4nT54cPXr0woULBw8eXOgOfD5foVDobioUCpVKJRaL9fchCGLt2rW6m0uWLAkPD9cflAQAfIaZGSrWNQnDmJmZIQsxQh98GA1FKBTqrqmMK8wiSfLgwYOPHj3y8PAYMmQI1KQpfYwm9vcfinquR+oPBw1j7qHD3T4cSgSfxzCa6LSrt1kjbwtE6iX3YFh4Wt67LEO2DXza6dOnhw0bNmvWrKlTp35sHz8/vwsXLkgkEjZsSk5OzszMZNPhP0b/uhYAUN4YVwr8wYMHDxw40KFDhxcvXqxevdrQzSk3cB7ii/P/cP/NPgFfQEkxSE0jNfPfD8mQ/+/cAkbo/Pnzw4cPnzhx4pQpUxiGoWladzH69OnTf/75h9SOYrRu3frNmzd3795l7zp58mSVKlXc3d0N2nYAgPHK35uVkJDw4MGD3NzcHj16WFhYhIaGuru7W1pafsGhZTJZfHx8YmKiQCBo2LBhvsXaQkNDHz16xOfzmzZtyhanoWn61KlTo0aNat++vaur6/jx43Nzc83Nzb/uCYKiYDSdVvoxgOYmxATAhEVGRj59+pQgiPbt2xME8ebNGw8PD13qej55eXkDBgzIyMi4f/9+t27d2Birb9++7NDh6tWrX7x4cefOHQsLi2bNmvXt23fEiBHDhw+Pjo6+cuXKzp07YVkFAECRwqwLFy5Mnz49Pj5eLpc3atTIwsLit99+q169+ie60D9GpVINGDDgxYsX79+/d3FxCQkJ0WXdI4T27t07b948Z2dnuVy+YsWK7du3N2rUKDc3NzMz08PDAyFka2urUqkyMzMhzAIAFNe+ffsWLVqUmppqZ2dXr169ChUqLFiwoFu3bgMGDCh0fy6Xu3DhQqVSSZKkbu2jypUrs/cOHDgwPT2dXRKUw+GsW7euSZMm165ds7OzO3v27MeKxQMAwAdhVnZ29rRp0zp37jxy5MhBgwZpMvYRql+//okTJyZPnpyvL6ooWrRoMXLkyCtXrhw6dEh/e3h4+Ny5cwcPHsye1/r27TtjxoxLly7hOJ4v+b3QujUAAPAJr1+/XrRo0eTJkzt16tS7d2+apvl8fqVKlW7evPmJMGvcuHEfO2D79u31b5qZmQ3SKoW2AwDKmv+CpxcvXvD5/GnTptna2uo2Ojs7Z2dns0kJxcLj8caNG9euXbuCy+c9efIkLS1t4sSJBEGIxeKxY8dGRka+ePFCLBZbWFgkJiayK1oQBGFtbf11zw4AUO6EhoZaW1uPHTvW3Nxcl1/l6uoqkUgM3TQAQDkOs9huJEZLdzM5OVkoFHI4nC9+gII9Us+ePfPw8NCFUP7+/hkZGVFRUTiOt2nT5vfff3/48OHWrVtr1ar16dX3+Hw+Wwfsi9sGPvvqwcv7DV5SY36Rv+wdQhAEhmFFXFC5WE+/KDuz/eLs2Uz3J+/fv4f1cAAAhhw0rFmzpkql2rNnz6BBg9gTU2Ji4rp16/r37/81YVZBGRkZ9vb2upsWFhYEQWRlaWa6Dx06VKVSbd261cXFZezYsQVPqSEhIQcPHuRyuRiGpaWlSSQSmRYML34BHMdzcnI0s80/+tXFyGQyhULBjiCDz+JwODKZjPlotTGMoqmcnBw2yyffv4JKpVIqlfkKXeb/+/9fC6FvQtu2XIqiEbfwJ8Qw/75D5HL5X3/9lZ2VjTGaPR8/eJyRlrF21VoOwWEQw+FyOnXqZG9vr99yPp+vVqtpms7JySlihgBBEFKplKbpTwdbvr6+WVlZhw8fbtmyJfuihYWFnTx5csGCBV/0MgAAQEmEWRYWFgsXLhw/fvyePXuSkpLGjh37/PnzgICA/v37oxKFYZj+KZXtP2PPm0KhcPLkyUqlUv97SF92dnZkZCT7e25urkqlommaJEkIs74AW6n2U9/YDKIpitT6hu0yYQzDaMLWT7ymjKaKkuZl/3/AoasXzL6TP/ZSs+viKZVKHMcJgvj3gUqZtm0kYrSh00ewT0ehUCxevDgmPgZZaWNMBUIUmrpqquZ3OSIUhI+Pj42Njf7nFMdxdkIfW7u5iLFjUZ51tWrVJk+ePGbMGE9Pz+jo6IEDBz558qR9+/a9evUq4hMHXyUnBcU91dQ9LiKaQm61kYVj6bYKAGOYadizZ8/KlSufOnXq1atXBEEsX768e/fuFSpUKNmHdHV1vX79uu6Em5aWxjCMfv/Wx2IshFBTLfb3mJiYjh07mpubf1m9CcAutUlwOOhjsRaGmVtYaErrgiKzsLDAsI8FWgyHw7G2ts43mkaSJIfDEQqFYq2Cf5aZmdm3b1+lUsnhcNiSTs2bN587dy4qfWq1WtMj9ZEYCMMwCwsLsVhMEASH4aCGCHVGiNaGWSRCZghxEQpD2EHM0sKy4OeUz+ezazYX+qwLZWlpqRsT/ISxY8fWrFnz3LlzlSpVEgqFI0aM6NKlCwwafiNxT9GewYhX5MJ7qjw0eA+q+cE8AwDKbN2s2lol+ADs4qn6dWVq1669YsWK+Ph4dsmwe/fu2dvbe3l5FffI7HUtrBH2NT776sHL+w1eUv1Eoo/h8XgkSV66dMnNza1mzZpsh9Y3SOoq4tPRNIbBkB1CFbUBFru6EI0QH6EUzbLZnzhOsd5jRd+5mVbRjwxKDM7RxFhFD7PYPwGgzIdZKpXq6tWr7ImMzX5ge/XFYnFAQEBxe4wYhnn9+nVWVtabN29yc3Nv3LghFApr1aolFovr169frVq1adOmbd26VSKRrFixomHDhlWrVi36wePj4y9fvpyQkJCTk/MFlSYAMCoCgYAdCvzYDtbW1idPnkQIVapUaejQofPnz0fGidbGWPrDevlufhMSieThw4e6Su4YhnE4HJIk7ezsfH19i95zBgAAX++/M7tcLp81a1ZoaKi5uXmFChVkMtn79+8dHBzMzc1zc3Nnz549ceLEol89MwyzZcsWdnDQyclp4sSJfD5///791atXd3Jy2rJly8yZMxs1asTmq65du1a/eOlnyeXymJiY1NRUWCwMmCiJRPL06VOa0lzPZGdnZ2dlR0dFX750WdNNS1M2tja1A2rnC7wUCgXDMDAd4bNiY2OnT5/+4sULa2tre3v77OzslJSUihUrYpimU23NmjXff/+9odsIACiXKfB169atWrXq2LFjK1SokJeX988//xw6dGjhwoWvXr1avnx5kyZN6tSpU8Tj4jg+Z86cCRMmsIOGbPeYq6sre29QUND58+dfvHjB4/H8/f0/cR1fqKpVqy5evDg6OvrWrVuQ/A5M0fPnzzt37qwiVRhHk8lFkdS7uHenzp3ShFlKKigo6O+///50QRPwMZ6enlWqVGnUqNGAAQPYMOvUqVM3b95cvnz52bNnZ82aFRAQ8AVZCgAA8AX+i2/evn378uXLQ4cO6ZaYqF27dlRUVEhIyOzZs+/cufPXX38VPcxCCDk5OX3iXgsLC7Y364upVCrIHALGSdPty/78t+mDWwzNqGk1/T2NvLQjazmI4TKUiNLkjB9AlMK4umk1LS/4dIy12tejR4/S0tIOHz6sm0wTGBjYs2fPmJiYlStXXrx48dGjRxBmAQC+dZgVFxdH03S+wusODg6vXr1CCHl4eEilUmQcSJKUSqU5OTnQlQWMEIOQgmQUagaRDKWthoBjGMKR6sMZnZpyCR4UqqrNXmJDFgYhHkJOCMv76GRFgyBpRkVqns5/mxik/mQxEANKSkqiKCrfhGWxWPzixQuEUJUqVYznVAYAKEdhVvXq1d+/f79p06ZRo0bZ2dmp1erHjx/v2rVrypQpCKF3794VqyurVIWEhCxZsiQ7Ozs9Pb1kS6eWV1jBvgrj7awwbhhicuWqfofjzfmIYZCMwbiI4WOa7PBEOapaVfnB3rQ2xtLvuqK0G40JgWN7X0hvJETRep3HGIayFRTF8I3wbeLl5RUVFbV3797u3btbWFjI5fLLly9fvXp106ZNFEW9e/fOxsbG0G0EAJS/MMvZ2XnevHlz5849fvy4nZ2dQqGIjIysU6fOgAEDpFJpjRo1OnTogIyDj4/Pxo0bIyMjR48eDVnwJYAmEUVqv+ApTTcFTmi6UsgPA4JSFhYW9ueff5IkmZ6ebmdnJxAIOnXqFBAQgEyNh4fH0qVL1aSmq4dUkxs2/lbD16916zY0Q+MIVajgaHIXBgyD3MyJZpVEJP1fmIVjWEyW8sZ7o+p0+1ft2rXHjx8/bty4zZs3W1paymSyiIiIDh06dOzYMTMzs2nTpqb4vgIAmKgPcs9Hjx7duHHjEydOvH371sLCYuLEiZ06deLz+TRNL1682HhKJwgEAldXV7lcrl+OC3wRTDOS9fwgyojUfJ0qJYhSIqGDJtJKf6NWyGi9b9ZSFRsbe/ToUalUmpCQ4OrqamFhUb16dVP8OnRzc9MVDqUo6uCBfc2/a7Zg/jxksiiGaVNZuLqLM1Lr9bNxsKsR2TdPZRlhnMXlcn/66adWrVqdPn06Pj7ezs5u0aJFzZs3Z0uhrl271pgXkQQAlDH5p/j5auXbaDwBlj7dKtfgi/F4vB49e/n6RuCI5nCIu/eSk5JS2jXxFwqENHLn8jThbGm3ga1v1KxZs/Pnz9+5c2fkyJGrV69u2LChtbU1RVHsTFVkmkiSZJ8dMnHaCqTs//y3ycg/fA21TOJUBgAoR2FWREREWFiYUqlkSzBgGObh4VHwbGVYKpUqOzsb6mZ9PaFQOGfOHN3NSZMm3bhx47eNW2xtbb9ZGw4ePHjg4EEG43C5vJSU5DyFct2GTQcOH6UoCqPJXr16DRkyBJmmMnMZQOAY4mCI/v9sSUbTm0VwjDr8ffbs2du3b5VKpa5cvo+Pjyn2jwIAyk6YtXv37uXLlyclJclkMgsLi5ycHITQzJkzjS3MCg0NXbBgQU5ODqTAl4Zv3Hv04uXL8+fO9fYW8jgYh2QaOnOd0p+IsjCJnLrwTlnFqxjLA4DSQFH0vXjpubBMkqJTZbSSQi5mOEFg197mqjQLXRtjKLly5coNGzakp6er1WozMzN2uYjVq1dDmAUAMFiYlZGRsWjRomnTpnl4eKxfv/7IkSOPHz9esGBBy5YtkZGpVavWvn37IiMjBw8eDB1apt4Hg+GcCnw0o0kFPhejaU3tAALHcA6WlUe9kcQxGIzyGBKO4/Y2Vk9jzAZdkGkK1ufKSJK0sjTHcZykcBsbWyPMj3z69OmGDRs2btz4/v37mzdv7tq168yZM+vXr2/VqpWhmwYAKMdh1suXL+3s7AYOHPjkyROGYczMzFq1avX27dsdO3a0bNnSqHIauFyujY2NtbW1UbUKfBkOhlKUqPvReBxhjLaUBPtfimFSpDTXuEemyjxLS8sNGzbk5OZqFjnF8GXLl72JjNy4aZNYJGYQQ3A41apVQ0YmIiKiQoUK3bp12759O0JIJBL16dPnyZMnu3btWrdunaFbBwAox4OG7BK2AoEgOzubJEmCIFxdXWNjY0mS5PF4yMiUgcxioJ3Ihqy5aF4Tey5HE2axMAxJldTqW6kkdFYaFEEQNWvW1N10dnJKSU5uEhRkhCcEHRzHzczM2BgxJyeHzc2yt7e/c+eOoZsGACjHYVbVqlXT09PfvHnj7e2tUqmWLVvWqlWrNWvWeHh4FHfNwW+Dx+OZ7hw0oMMwyFqARtWxRjy90uc4licl9z5N1y+JCQyOoiiappVKpTGHWa6urqmpqVlZWY0aNZo+ffr69eurV6/+xx9/tG3b1tBNAwCUO//FTw4ODqNHjyZJ0sbGZs6cOYsXL969e7e7u/v06dONbWwuOzv7zZs30dHRCoUCIq0yQFOxi2L4+unUuGYLhFjgC/j6+g4fPjw1NbVq1aozZ87cuHFjbm5u9erVJ0yYYOimAQDKcZiF4/ikSZPY33v37t2yZcuEhAQ3NzcrKytkZGJjYzds2CCRSNgJRIZuDgDAiFhYWLBLhCGEfvzxxx49eqSlpXl4eIjFYkM3DQBQ7uQfDZTL5aGhoSkpKSKRyMvLywhjLIRQzZo1t27dGh4e3q9fP5hpCMA3w1aLNeYRQ52cnJzQ0FCJRGJmZlajRg2IsQAAhg+znj9/Pn369LCwsMzMTC6XW6FChZ49ey5YsEAkEiFjwubpCwQCGDEsGzBMWwAT1+ZmsVMNcYww4fLvRYZphkc/qDxlrJ2zd+/eTU1NjYqKysjIOHbsmKOjY8OGDdlMcyN048aNmTNnRkdH5+Tk8Hg8V1fXQYMGzZo1y9DtAgCU4zBLJpONGDHCzMzs4MGDfn5+Mpns0qVL8+fPt7e3nzZtGjI+kLlTNmAI5apRklQt5OIqks5W0pZ8Dp+Lp0nVeSqmLAdaNEIXEHpYIMx6g1AlZGw2btx46dKl3NxckiQnTpzo6el5+PBh4wyzoqOjR44cWatWrXXr1nl7e2dmZv7555+rVq1yd3fv16+foVsHACivYVZISEhubu7Ro0crV66MELKzsxsxYgRJkgcOHJg4caIRFiEEZQRDpSpQx/0xAj5XSdLZCspKQPAJLFeuCs+i22JltGwHGz/GIZT6YZiFIZSJUOX/72A0FixYMH78+Ly8PJIkzc3NxWKxs7MzMkqPHz/mcDj79u0TCAQIIRsbm5kzZyYnJ584cQLCLACAwcIsLpdrbW1tYWGhf7ejo6NYLDbONHOCIMrBqFLZ17x5c5IkQ168unT+7/9vUyOEWrRu2zGgVvPvvkNlkmZgFKGhCHkjpJ9eyENoG0Iqo1vDxtvbG5kIgiAcHBzYGEvHwcFBIpEYrlEAAFTew6xatWo5Oztv2bJl2rRpPB6PpunExMQdO3b06tULx3HdStLICKSlpT1//vzdu3cymWYBEEM3B3yV1lqvXr3aU7OGQqFITk52cnISCoV9+/b19/dHZRuBEPfDfKx8N0HxBQUFbd68ec+ePf369eNyuRRFvX79+ty5c3PmzGFrGhvPqQwAUI7CLLVanZGR8dNPP23fvr169ep5eXmPHj3icDg4jp86dYqm6d69ew8ZMgQZgaSkpIMHD2ZmZubl5RlnTxsorho1aqxatYot7l+O/k2Z///obwFfJzMzUy6XDxkyZNmyZV5eXhKJ5NGjR3Z2dlu2bNm0aRNFUVOmTGndurWhmwkAKH8zDRs0aFC3bl1aCyEUGBiIECJJktGytbVFxsHPz2/37t3v3r3r1KkTFHQoY8pSjMVOhi2pvEb2aMa5JMOXYbuUSvxfnMvlNm3atGHDhuypDMOwoKAg3amMpmlzc/OSfUQAAPgYzSk7Pj7ewsLC0tLy559/RqZDoVDAZENgnJRK5bVr1+RyuUwme/Xq1enTp11dXWvXrl3c42RmZj55+pTRXkuo1Cp5Xl5kZMSVy5cYRjPT1sLSMjAw0LQCU5VKxV7FcTgcNu7Jy8vjcDjsyoNcLveLnw7DMPHx8XZ2dh4eHitWrCjphgMAwJeGWdu2bbt27Vrt2rW7detWv35945ykDYAJycrK6tevn0wmQwidPHny+PHjffr0OXDgQHFTgkJDQzt17EhSDMIJzZxMtfLQkT+PHj+l6V4mVQEB/nfu3OHz+chEZGVlzZw5MzL8JaIpDofz6uULqVTao0sHgiAYBonMrX5eudLX1/fLDk7T9MqVK1+8eNGwYcPOnTvXrVvXhF4ZAEBZDrPGjx/v7u5+5cqVadOm5ebmtmzZsnXr1rVr1/bw8DB08wAwSba2trdv36YoKi0tTSgUmpubW1lZfUHaNUPTahVJt/kZebZApBLlJjM8ESnQrs1wfQWpiEQmRalU3rl962WMDHk2RRSDHF1RBeZWNldTmTbtLSG5MjMz84sPzuFwZsyYcerUqWvXrv39998URbXR8vPzc3V1LdHnAQAAxQmzHBwchmvFxcWFhIRcvHhx3rx5PB6vSpUqrVq16tChg6ura1nKCAGgtBEEUbNmzRI4EEPjAjO6YgNUqTYi/19Miy0GEVYVywlHJgXDMD6XQLV/QD2Xa6t2/B8HoZf/CP7shuNfNQHQ3d19gtbbt2+fPHly6dKlCRMmWFpaent7t2nTpl27dvb29hwO5+ufCAAAFNEHwZObVufOneVy+cOHD8+ePXvs2LGff/65WbNmGzdutLS0RMYEpmSD8oFBNKkpGZ+vUCtjspM/KLWmMFi+MItUlOAjVNHq06dPbm7u3bt3T506tWvXrp9++qlHjx6//vproelfiYmJDx48ePnyZXp6er9+/Ro0aFDokZOTk9esWZOXl8cm19M0PXbsWD8/vxJsPACgLMnfR8UmogqFwmZaeXl5YWFhsbGxyJhQFKVUKvPy8iAFHgBQKPZUZm5u3lYrNzf32bNnqampH6sYcvr06WnTprm7u0dGRlavXv1jYVZaWtrGjRvbtWvn6uoK05wBAMUIs0iSXLNmTYcOHXRXZgzD/Pnnn+7u7t9//z0yJmFhYatXr87MzExPT4chAACAvtTU1F27dvXv31+XkqVWqw8ePBgYGNi0adOP/dX333/fr1+/9+/fd+7c+RMHZxjGxsZm7ty59erVK4W2AwDKmv+u6t69e7dr1y796zwMw9LT09esWcNOwDYenp6es2bNGjlypKWlpbG1DQBgWM+ePduzZ49+cSwul/v06dNt27Z94q9sbW2trKyKUuSMYZj379+/efMms2gJ++VuQdgvSOeADBBQdt9F//VmxcTEVKhQId+UnGrVqv35558kSfJ4PGQ0zM3NfX19hUIhn8+HcUMAgL60tDQnJ6d8y7NWq1bt1q1bn/3bz55PMAyTSCQTJ07EcVwqlQ4aNGj27Nk2Njb6+9A0fffu3czMTDZ/NCwsjMPhKJVKVA4wGM5RqYobV6pVKkqlxhi4ZgZl4V2EYRhJkrrrq//CLAcHh2QtKyvtdHGtiIgIkUhknANzarUaYiwAQD4WFhYJCQlyuVwkEuk2RkREiMXirz94hQoVDh8+7O7ujhC6f//+lClTCILIVw2VoqiNGzc+e/aMXd4+ISGhQ4cOOTk5GIaV+VMWQwgEcjm3WP0KGCaXyxUyBVai0yCA6WJM+V2EYRiO4yqVStc59V+YVaNGjQoVKsyZM2f+/Pnu7u4KheLRo0dr1qyZP3++cYZZAJQdukoN4KsFBgaKRKLJkyePHz/e1dVVKpVeunTp1KlTO3bs+PqD29vbd+/enf29du3aiYmJW7ZsmTdvnn4Mx+Vy9+7dq8tnWLp0aUxMjJ2dHSonzM1RsaJJhjHXVJYzQwgqY4My8i4SiUS6a6r/wiwul7tmzZqBAwd26tSpQoUKKpUqJiamV69effv2NVxTASjrcG2lBlobaeHaHwi2vk6FChVWrFgxdOjQCxcuODg45OXlxcXFjRkzpm3btiX+WDVr1szMzFQoFPm6yvQL0LMXteWoAE3xn6nmxSk/rw8oZ++iDwo6BAYGPnr06MKFC6GhoSKRqGXLluzq0QCAksUghlSS6C+EHiBEIZSDEBchsbaCVCgivch/+7dMCwchHtKUUdXhFSwa8y106NAhLCzs3LlzkZGRlpaWHTt29PHxKfr63PlSUd+9eyeXy729vTkcjkKhEAgE7HaGYU6cOFG1atVPL1BW5gcKAQCfkP8UaG5u3rNnzx49erADhRSlWXrsUwcAABSfpaVlw4YN1Qo1JtEkS4ZHhJubm1d2r0zTNOlB+gX4md7nTlPJHaEjH5ZR5SD0XvvLN48a7e3t+/fvz+ZJsGnpn16U+uXLl5s2bZJIJPHx8Tt37rx//37jxo0HDRqEEFq+fPnr16/PnTtnYWGxcePG0NDQunXr0jR9/fr1y5cvb9q0CRZPBAAUKcxKTk5evXr1oUOHlErlo0ePKleuPH/+/KCgoPbt23/0AACA4qtTp87169fZ3zMyMtq1a9esWbM1a9awWzAMM70qADhCiQjlfrgRQ0hugGHQqKioZcuWnTp1yt3d/cyZM9bW1gsXLuzRo8fHio6yU2oyMjIwDPv+++8pikpPT2dX/mZzsBwcHNh/EW9v79u3b58+fZqmaQcHh+PHj8PpEQBQpDCLoqgJEyZER0fPmjVrx44dSqWSPdfv37/fOM8j7CweQ7cCfFO0FsMwJEmy62ya6NsAx3HdyBSPx8MwjCCIj5ZNIfiaIUX9Z6nJ4jKyZUZJhBoi1Ek7BqrDRSgMoT++aaQlkUhGjRqFEFq2bNnWrVvVarVIJEpKSjpx4sQnwix/f/8jR44UeteYMWN0v3fWUqvVNE1DJxYA4LP+O1OHh4c/e/bs9OnTHh4eJ06cYKfJBAQEXL16VX9qojHIy8tLSkqKiopSqVSm+BULvti5c+dWrlypUCjS09Pt7OwIgli0aFGbNm2QKWNzdwrP4MEwzdqF0deRMuOD8AVHKC0c8Y1pYJHRTvFx0MZbug8lD6H4b92Qe/fuxcbGPnnyhMPh7Nq1i31hfX19nzx5UlIPYXp9jQAAg4dZycnJDg4Orq6u7Kqo7EaGYYxw3a7w8PAVK1Zkan063wKUMdbW1tWqVUtMTHzy5Im3t7eLi4t+mbcyCMMRqURX5yOMk79HiCaRfy1kVEikWROanTjJaBOzsA8z4r+JzMzMChUqWFhYpKen64JXTdIb+c2bAgAo9/4Ls7y8vFJSUp4/fx4YGKgb0Th+/Livr69RdWUhhPz8/Hbt2hUREdG/f38jjAJNF9s1aJwdhDk5OVKp1KOyx5IlS+7dvXfz5s1hw4Y1bdKUpunExEQLCwv9xVXKDoZGhAB1Xo/cGyJKL0rAcHRjJaIeI6OhYlToCkLvtKGVDCE1QpbaXrcMpFKqmG84auju7p6YmBgbG2tvb49hmEAgUKlUV65cCQoK+mZtAACA/GGWm5tbhw4dhg0b1rdv39TU1FOnToWEhFy8ePHEiRPIyBAEYW5ubmZmBl1ZJYVNeNKlPRnhDNMdO3fs3b1XUxcFx6S5UrlMPnvmbAtLCzZba9ToUWPHjkVlD8NoIipbL+Rc/YNuIRwhM0eUY/hlJVgcDqdb927vE9/jjOYj+ez5s5TMlNZ1W3NwDuPFEAIi33I0paquVpcuXfr27ZuZmXn48OErV65ERUVt3br1m7UBAABYH2TRrlixwtLS8uzZs1lZWRs2bHBzc9u5c6fRXgJCNZoStHjx4ps3b0ZEREgkkp49e1asWHH58uWVKlVCRiM+Nj70RSgKRMgKIRuE7FGUKErz/qUQuoYS4xNRGUZT/47E6TOCpbt0uFzuunXrGIZhr3wmTZp0+fLlg0cO8ng89nP6LbtIhUIhW5n90KFDMpnst99+q1at2v79+z09Pb9ZGwAAoJAwSywWL1myZMKECYmJiWKx2MvLS/9eUIaZm5vb2dnhOK5QKBwdHW1sbNh5fMaD4BCIj5AUIYU274etFMBmXnMRhzCuvrdyCNNSKpUURZEkSdN0Xl4eRVFCofDbN8bW1nbLli3v379PTU21sLDw8PD49m0AAIAPwiyGYaKiouzs7Oy17t69e+nSpVq1ajVu3Ng4k3VACZo6dSo73YFhGOMskaBJ7lEg9KpAoUuGvQ+6Ng2Poqjg4OAzZ86o1Wp20Rtzc/OYmJgSWbO56NRqdVxcXIUKFZy1rl+/fuHChfr169epU+dbNgMAAD4Is7KysoYOHbp27dq6deveuHGjR48efD6fJMk//vjDOOtmgZLFlm5CxsrM3MzKykrTp4WQmlTnZOeYW5jzuJrJGWpS/Y2/yEGhcBwfPHjwd999l5eXp1arLSwseFrfuBkvXryYPHnykSNHxGLx4cOHhw0bZmFhwefz//rrL39//2/cGABAOfff12pEREReXp6LiwtCaPv27Y0aNTp27NiKFSt2797dtm1bSDYHhjVnzpzp06dzOBwul3vr1q3OnTsfP368efPmarWaoihjmwxbPmEY1rlzZ0O3QlMCXqlU2traMgyzadOm4cOH//zzzyNHjtyzZ8+6desM3ToAQPnyX/CUk5MjFoutrKxkMtmbN286d+4sFAobNmyYmJjIDgEAYEA8Hk8sFsfExGzduvXkyZNKpfL06dObN2+Oj48Xi8VQLhLoKBQKkUhEEER2dnZERESnTp2EQmG9evXi4795pVQAQLn3X29W5cqVExISHjx4kJWVFRsb+9133yGEcnNzuVwudGUBIxESErJmzRp2WYLjx49zudyKFSua+lwNPp+PYZixVdAwXQ4ODnFxceHh4VevXrWxsalWrRpbsxTWxgEAGDLM8vT0DAoKGjp0KEmSrVq1qlq1KkLon3/+qVKlCnQVACPRrl07f39/lUqVlZWlSdUiCHaY20RlZWVdunTp/fv36enpISEhu3btcnd3b9mypaHbZdoaNGjg7e3dpUsXiUQycuRIV1dXiqKePHlSq5aRFc0HAJSrMAvH8W3btl2+fFmtVrdp0wbDMJqmGzRoAEmjwHhYaqGyIjU19ZdffomPj8/Kynr48OGrV686dOgAYdZXsrCwOHz48Llz58zNzVu3bo1hmEwm69OnT/369Q3dNABAufPBzDI+n9+pUyfdTRzHBwwYYIhWAVAuuLm57d27V6FQZGVlsclnZXyJxm/FzMzs+++/1920sLD44YcfDNoiAEA5ZbwT+D/LCGs7AVAsAoGAzRwCAABQJplkmMWuu6dWq2G9HVAOYIjD1XxSGe3MYG05VsRBCDfJDy8AAJQrJnmmfvHixW+//ZahBbMgQZmGMZQSJYchoRkiaSSXIIKPeGaaBQ7TIhgevPkBAABprj45AmSUTDLMcnFx6d+/f2xs7PPnz6FDC5RlOI7TavrybMQTI4ZmZOmIK8D45pp1o3OT8YAAQ7cPAACMAEf4S8iy+0kbiro/gwQcwfbG2wWlH5yZZJhlY2PTrFmzqKgooVAIYRYow2rUqLFv/wGaVGMYUqlUU6ZOa9qkSZ/ve9MMw2AcW1tbKLYCAAAI5/6T/M+ZXGVRl7dlEM7FNzfaLEAQZn2cSqUqeoylVCoXLFigm9IlFAp9fX2HDRv2lXn0JEniWl9zEAA+xsHBoU+fPuzvNE3PX7jYzz+gT3B/Q7cLAACMCsPn8BFRjDBLRIgw9C0m0plwmFUsFEXdvHlTKpWGhYVZWlq6u7vTtLZH4IvCLIVCMWXKFIVCkZiYKBAIbG1t/f39x40bB/EWKO3rCoqiDN0QAAAARVVewiyhUHjmzBmlUtmyZcumTZsuW7aMx+N9cVRE03R4eLhUKn327Jm1tXXlypVtbW1LuskAAAAAMG3lJczCMMzW1pamaYIgxGKxnZ3d1xxNJBJdunRJqVTWq1evdevWa9asgaFDAAAAAJTTMItFkiTDMDRNf/2hCIJgxxw5HA6kIQMAAACgIOiA+XJsAj5MdQQAAABAoSDMAgAAAAAoFRBmAQAAAACUCgizAAAAAABKBYRZAAAAAAClAsIsAAAAAIBSAWEWAKZBIBBgGAbVQwAAwISUr7pZAJiirKysiRMn5uXlJSYmHjx4MCwsrGnTpuPGjfvKFTkBAACUNgizADB2NE3Hx8crFAp/f38cxxMSEtLT0w3dKAAAAJ8HYRYAxs7GxubChQsIodzcXB6Px+fzcRyHriwAADB+EGYBYAJ4PB5CCFYoBwAA02JcYZZMJouKipJIJI0aNWK/VwAAZQ3GQRyE9FcW5SCEG/hcpFKpoqKiHj16lJGR0aZNGx8fn4/tyTDM8ePH//77bysrq5EjR1avXv3bthQAYEqMK8zasmXL+fPn3759e+/ePWdnZ0M3BwBQ0jAMydJQyltE6i0GimMoKwYhQy4Pum3btkWLFllZWcXFxZmZmX0szKJp+scff/z77787duwYFRXVokWL3bt3t2vX7pu3FwBQnsIstRZXK99dWVlZqampDg4OVlZWnz3O0KFDe/bsOXDgQLVaXSINAwAYF5xAL/5E8TcRo9edhWFIJdN2cBks4axdu3Z+fn4URQ0ZMoSiqI/tdu/evQMHDmzbtq1fv340TQcHB//0008tW7aEQhsAgFIJs169evXrr78+efIkMTFx7ty5EyZM0N2lVqt37ty5atUqoVCoUqmmTp06atSoT+ft2tjYqNVqhjHkRS0AoBTRFHL0R7V6Iv1QBsdQymsUcdiA7aqiFR0dzeFwPrHb+fPnPT092e4rHMf79+/fvXv3hISEypUrf+xPcBzKEwJQfn1tmBUfH5+Tk9O9e/f169dLJBL9u86fPz9p0qRffvmlRYsW586dmzVrVsWKFTt27Hj79u3ly5fnO86cOXOCgoLYPvmvbBIAwHgxNHJrhJpPQPod1hyEXl1HkUcNO26IECJJ8tM7hIaG2tjYWFpasjcdHR1tbGyePXumH2YxDJOQkKBQKDRnWIJIS0tjGIYkSQzDyv41JIeDUdSnAtXCUBSleWU+3okIyhfOl7yLvgBJkhSmfe+VHEyLpmndBdvXhlmtW7du27YtTdO7d+/W384wzL59+7777ruxY8cihKpXr37+/PkdO3Z07Njx0wdkr/yKcv1XGhPa1Wp1UlKSQqHIysoiCMLc3NzMzMzJyanEHwiA8osmEYk0PzoMQpQKmQKZTCYQCHQnKKFQyOfzs7Oz9fchSXLKlCmhoaFs3Y2UlJS2bdtmZmaWhzCL4QoEMplFsU7OGCaTyRTZUkytCUwBYL7gXfQFj8IwWZlZFJei9RMYvhqGYTiOKxQKMzOzkgmz2NONSqXKd/pQKpX37t0bM2aMbktAQMDly5clEklQUNC5c+cKPZpSqczKymKjHDs7O6FQmG8HhmEoimIDrM9ed36BxMTEYcOGvXv3Ljs7myAIMzOzFi1abN++vcQfCABgijgcjn7mFkmSNE3nS8wiCGLlypV5eXnsde2GDRtycnKsra1ROcBgOC4Wo2JFkwwjFouF5mKMyX/CB+UT8wXvouLDMMzK2sqMMCuNIwsEAl1QVFozDRUKRWJiYsWKFXVb3N3dc3Nz09PTbWxsPvZXp06dOnDgAEEQs2bN6tKly6hRo/LtcPXq1UWLFhEEgWGYVCpNSkrKycnJysr6RMqqDoZhSqWSJEm5XJ6Zmclo6e+A4zhFUZ06dUpKStq3b5+jo2P37t3d3NwkEknBa1Dd0digkKbpMn+dCsDX4HA4EolEe3VU+EUqwzDZWVlSqVSpVBa6A4/HYz9rBizNWrly5ZCQkLy8PJFIhBDK1PL29tbfB8MwDw8P3U1nZ+ecnByCMK5p3aXok8ltH/kLDoeDwxq74GveRV+Ay+USnFL5YOqPyJXWJ5+NOfQfCcdxWusTf9W2bduGDRuy14tisbjgDpUqVerfvz+GYRwOJyEhYceOHTweTyAQFCWji+3Kw3GcIAihUFgwzGJPiJMmTcrJybl+/bqfn9+CBQvYSZSfPhobt0KYBcAn4DguFLLDbYV/UjAM4wsEPB7vYzkDHA6Hz+d/g/W58xXtU6lUNE3z+XwMw4KCgk6dOvX27Vs/Pz+E0KNHjwQCwadLZxXlIhAA8O19m2/t0gqzeDyeWCzOzMzUbZFIJAKBoNDgScdS67Ozgdjf3717d/ToUaFQKBAIitgqgiBwHOdyuZ/+EzZzjT3XF1qlQv9obJhVxAYAUJ6JROJPp10KhUKe1sePIMJxvDROjgkJCdeuXUtISJBIJNeuXSMIolKlSk2bNkUITZo0KTw8/NSpU+bm5l26dFm5cuW0adPmzZsXFxe3atWqSZMm6ZIwAACgVMIs/biEJRAIateuHRoaqtvy8uVLBweHkkonZxhGLpcXtw+piDuX7G4AgCJ+ZL5+hy8WGxu7bt06HMd9fHzevn0bFhbWrVs3NsxycnJSKBTs+c3S0vLo0aMLFy4cPHgwQRDTp0//8ccfS6lJAIAy4GvDLIqisrKy5HI5RVG5ubkZGRlcLtfCwoLD4XTq1Onnn3+eNGmSj4/PkydP/vnnn4kTJ5ZIgsLLly+3bNmSnp6ekZHx6SI3AABQFI0aNXrw4IH+Ft1145w5cxiG0Z27atSoceTIEalUyuFw2AwtAAD4mK8NeuLi4gYNGqRQKNLT048cOXL79u369ev/8ssvHA5n2LBh169f79WrV82aNV+8eBEQEKA/8fBrODg4dOjQIS4u7v79+1BnCwDw9TAM+1h6QMFrOQzDzM3Nv0m7AADlO8yytbWdMGECRVF8Pp+iKLVa7ezszF4F2tranj59+vjx4y9evOjbt2/nzp1LajVoe3v7Dh06REdHb9iwAUbuAAAAAFA2wywLC4tevXp97F4ul9u3b9+vfAgAAAAAAFNkkqVc0tPTnzx5EhcXxxYANHRzAAAAAADKSpiVnJx86tSpjIwMCLMAAAAAYLRMMszy8fHZuHHj69evw8LCIAUeAFODaerA618faW7C9RIAoAwyyTCLXSkMSjkAYJJoElEUorS/IAbhhCbOIgtfYAcAAEyaSYZZLA6HAyOGAJgQhmFUJIke7kBJzzXrwioyEK1EQkfE4aKkUCWdS9MwcRgAUKaYZJglkUhev34dHR0tl8sh0gLAVIhEol69+9SJjsIRTRDEjX9iMzMz2zXx53J5DOYqEIlLapUIAAAwEiYZZsXFxW3ZsiUzMzMnJ+fTS6QBAIyHubn5ggULdDeHDx8eEhKyZdtOWBMQAFBWmWSY5e/vv3///ujo6M6dO1MUZejmAAC+HHRIAwDKMBPuClIqlVACHgBTB59iAEAZZsJhFgAAAACAMTPhMIvH48FwAwAAAACMlknmZsXHx1+4cCExMbG4KfBcLhfDMMiaBwAAAMA3YJJhlkKhSExMTElJIUnyszsnJyfv2bNHRWoy5UmSTE5JvXPv/pKlyxnEYIixtbEZOXIkQRBf3J0GVVIB+DIEQeA4LhQKDd0QAAAoLSYZZnl5eS1cuDA6OvrmzZufXWwnPj5+9uzZFhgy42sKIpIIi3qWuuXZPQahZCVycXEdOnRo0cOstLS0s2fPUqQKQwypJiUZ6SHPnu7cvhUxDI3h1tY23bt3h8DLSDAMQ5IkQRAwuGxs9uzZ8+rVqzt37qSkpEydOtXFxWXo0KG2traGbhcAAJQwkwyzijfTEMMFfP7+7vatvS0YUlNl+t/10zBs6fXkPQm8Yj1oTEzMqJEj1FwrxDdHDIXypEn3nl95Gq2J4HKTvDzcO3XqBGGWwd25c2fz5s0KhSI5OdnJyUkoFA4fPrxZs2aGbhf418OHD2/evJmXlycUCi9fvlypUqU+ffpAmFV+wYUQKLtMOMwqFj6BCXj4B6vV4hifU/zPNkMjDEetliCv5khNIbkEcXiakAtj0I3VTPa1Em01+EIymSwuLi47OzssLMzPz8/a2loqlRq6UeA/y5YtUyqVOTk5JElaWVnxeDxra2tDNwoYCqYg5SRZjE8ohjARIdKuQA6AsSsvYZam24v9+W/TB7eKDsMJZOeNnKshtebjzh5KM2XTxhPLvlpC7QVfpXXr1i1atLh27VrPnj3Xr18fFBQEXYxGhQ2qKlSoYOiGACPAFY24M+Kv0LyinpEZJOaKo3pFiQlxaTcNgHIdZhky54ZWIwppfnQYhOjP5+ODbwPDMEKLfZ982RQHAMA3gclJuVQtLXqYRSP6Sy+TAfjWTPLrJzIyct++fampqRKJBKozgI9hU/egyDgARk5zwVycS2Ycg9M+MBkmGWaJRCIvLy+BQEAQBHyJAgAAAMA4meQ1gaur68CBA4ODgy0sLCDMAgAAAIBxMskwi6VQKCDGAgAAAIDRMuEwCwAAAADAmEGYBQAAAABQKkwyBf4LEDiGOBii9Waz4NgXVCcFJoStlQXVHAAAxZMQgrLeI7yIxfYYhBOo6ndF3h+ULyb8DcSu3PzZ3TBtIdKn7+V8Hk6R/+VyYTj2NlONf1nlLQ5P88rpJ4bhSPNJA4YWHx+fkJCAIYYgiBdhoRRFhYQ85+AYTWvy+FxcXNzc3AzdRgCAcbu5FT07gbhFW9ScoTULgcx5iHiiUm8YMEEmGRlkZWVFRka+e/dOoVB8NtLCME0J+Pk30nmcjHwJ8wqSdvdwLOaDa8O2908Rj/tBeVIMIUmUZh0eYFDbt2//+ecVGIeHMJxWK0lSPX78JJzgIUrJMPSUqdN+/vlnQ7cRAGDcCL4mZip6mMUr2p6gXDLJMCs2NnbTpk0SiSQnJ+ez5UkZRlP7buF3doHuYubD3qw9T9Kv59LFe2xN1EajqwsRwfuwOwshVR7yqFi8o4GSRqpVao4N6rVb8w9Ek4iUk4QQcQgkk6DzM0iVwtANBAAAUI6YZJjl6+u7bdu28PDwvn37UpR+n1IhGG1PU6CLsHlVC81izzo4djcm90pOMR9bE7XhqMks5F4fkXqr6+A4erIXyW4X83CghGGIQXxL5NMB6YfBOEK5JLq5GkPFjKoBAACA8hZm4TjO1yr6moYqikEkjfR6sxCOSPoLym5pwza3BqhGS83S0XpHQzH3Ue7N4h8QlCgMQ4psFHpckz+nK6um2ZiD8jJgVBcAAMC3ZJJhFsuQtUlpspClo5nP9KuBbwHjIGUqOjVK24mph6GRPAumKQAAAPiW4FsHlC0MhYSOKPioNjeL0QTEOIE4OJJloVNjNTcBAACAbwXCLFCmUDSD5Cno6QHNXCG1DMmSkdgJcUUoT4KyEyhIzQIfJ5PJLl++nJCQ4Onp2aJFCz6fX3AfqVR69+5dtfrfjAGapgMDAx0dizthGQBQXkCYVQiBQIDjOFvcEpiWKlW8GjduxMVCORxOhlwSFvnaz6+GjYU1xaPJoLpVvasZuoHASKWmpo4ZM+bBgwd+fn4hISGtWrXaunWrQCDIt1tsbGz37t3Nzc2FQiFN0yRJ7t27F8IsAMDHQJj1r+Tk5AsXLpBqEsMwuVyempL68sXLP/b8oVKrGMTY29u3a9eu4DkXGJuhQ4cOGjRIrVbL5fJ//vln4MCBi5b+3KhRI4FAwOPxIHQGH7N9+/br16/fu3fPy8vr3r173bp1271795gxY/LtRlGUubn5oUOHGjRowGjBaQEA8AkQZv0rPDx86NCh/6XVc1FMQsztO/8WaKhRowb7VW3IJoIiwLWuXLkyf/78zMxMmUw2ZcoUa2vrefPmdenSxdCtA0aKJMnTp08HBwd7e3sjhBo3bly/fv0zZ84UDLPY95hAIODz+Z8t2qfbvxSaDAAwDSYcZnG53KIXdOBy/r+mIfsXjKZulmahw//jcDgic5FskAz5fTiFkIvQASSUCIv+WMDgbGxsatWqhWFYYGCgWCwmCMLOzs7QjQLGSyqVPn/+fMSIEbotNWvWPHfuXGpqqoODg/6eOI5nZmZOmDCBw+FUr169f//+LVq0yHdyYBgmIyNDpVKx+2dlZbHdYBiGGXJ+9LeBczCa/gZxJU3RNE6XyuuJc3CGKe7pnqJpRNP/FZExuGIXr2GMqPG4Cb+L2LMBwzC604JJhlkpKSkPHjyIjY2VSqWfX2wHMQqV+mx4VnqeWk0yCbmUkMDsRZp/wX+iczBk9sHePIQEH4ZZvIIvkrZCqWYRQ6SpdolpfzTHgzjMWNTXMnQrgMmQyWQqlcra2lq3xc7OTqFQSKXSfGGWSCQaOHBgzZo1cRz/+++/u3btumPHjr59++rvQ5Lk1KlTX716hWnFx8d/9913mZmZ5SHMYrhCvlRqUcoXpQzDZGZlkgRJMyU/q4XhiizVal4xnoLmnzUrM5PhKY0nUsHU8mLszTAMTmimDeVb2sRAGFN+F2EYhuO4XC43MzMz4TArPT39woULEolEoVB8tkOey+W6uDgfiFEdjtUsH5ySLhHweVYWFpqp/7SVh0eFDwI1TfmrD99pH95kEEYqFejeZhRzB1FqlJeCOHwksNbEWBHnKSGMDgBgetjTCE3/d7ZlO58Knl4qV668detW9veRI0f27dt3yZIl3bt315+WyOFwxo0bl52dzR5h165dbEZXeQizEIfHEYlK/csaQ+Zm5uZc89IIsxDBIwiiOAETg2HIzMwc8UVGEWZhGFLmcXf1Q0pZUfu01HLapwPVcxUi9Ytul/l3EWNpXrx3UVEqmrMXV3w+X/dhN8kwy8fHZ/Pmze/evevUqdNnF9vx8vI6e+YMRWvGC1Vq1Q/BwYH160+fNp3R9JEigYDP5XKL/tAikcjH11clD8HinzEM8y42TiwSOmqvd2lzTuUqNWBsEQCTY25ubmlpmZSUpNuSmJhoZmam37/F0v+Ac7nc7t27DxgwQCqV6odZOI7Xq1dPd/P27dvh4eGFlocomwiitDtFMITx+DwuUYxTd/EUO50O4/N5iMdDxoJEagVSy4scZuXhiCQ4uKbXoNy8ixAjVGJ8LuIWfSBKXOR/Yf3pViYZZrEUCkVRLg1FIpG/v7/+TWcnp9q1A77sQWvUqPHw4UP2d5VK1aBBg5YtW65evZrdwsawX3ZkAIChiESiBg0a3Lp1a8KECeyoX0hISJUqVSwtLdmerXznTZ3IyEhLS8tPf+o/eykIQMnDsH9/irQzXu6SXnCUl77ec4OoqB0jjCbGivqxGJFWWQizvoBKpWIY5mvOeuwkI/Z3giAwDONyuTADEQCThuN4cHDwqFGjDh482KlTp927dz979uzo0aPsvT///HNMTMy6devEYvHx48d5PF69evUYhvn7779/++23IUOGiMViQz8DAEDxMIxApvz/rLjP763JxP6y7rXyFWaVLDaTo+wnWwBQDvTr1y8hIWHJkiXz588Xi8UrVqxo164de5dEIklJSWE/6bGxsTt27JDJZBRFWVlZDR48eP78+ZAqAIAJYv6dwVY0epUJigfCLAAA0CRazZkzp0+fPikpKRW1dHfNmTNHrVaLRCKE0Pjx47t06ZKRkUHTtIuLi5ubm0FbDQAwdhBmAQDAvzy18m20tbXV/c7lcqtoffOmAQBMEoRZH+Jof/QRbE0sAAAAAIDigTDrQ2kIJRaoAp9jwAYBAAAAwFSVrzCLXZ/noxVNaYROIPR3ge05CPmUfuMAAAAAULaUlzCLpumYmBiFlkQiefPmjZmZmZOT0wc7YQgFIOSqjbd0OAjdL3weJ0wvAgAAAMAnlJcwS6FQdOvWTSqVvnv3Likp6datWy1atNi6desHPVsYQvW1kVa+NQ3TEErJf0CGYXQFHdiZ3hB1AQAAAKA8hllcLnfEiBFKpfL9+/dCodDa2rpKlSqFBEYkQuoPwyzsw84tLblcPmLECKlUGhMTc+bMmbi4uMDAwBkzZnx2gUUAAAAAlB8mHGaxRdiLuDOXyx0/fnwJPnpeXp5cLvf09BQKhTKZTKFQlODBAQAAAFAGmGSYJZPJkpKS3r59q1KpDDJUJxQK//zzT4ZhSJLEtT6VWQ8AAACAcskkw6zIyMgVK1ZkahkquGEft9DVZAEAAAAATDXM8vX13blzZ0RERP/+/b9mHWgAAAAAgNJjkuNcBEGYm5ubmZnBOB0AAAAAjJZJ9max2DIKJYzQln3H/79qN6O9CQODAAAAAChXYVbJYhhGrVSjqwglaQs6ZGtfG3NtyPUCkVakoRsIAAAAABMDYda/hEJhFY8qeal5KENTMj4lMYXL5zpUcKBpmsEYt8pukO0OAACgMBgiRIZuAzBSEGb9y8fH5+RfJ2mKRpimYMTgwYOrVau2bOkyTZjFMEKR0NLS0tBtBAAAYGQwTEHJR1zvqeAUOVeYQg0qNJjqM7V0GwaMA4RZ/xKJRFWrVmV/VygUQqHQxsamqve/WwAAAIDCYGpafTD6BF30Go4kUiIlhFnlBIRZhVCr1bolCwEAABgVDFOKiFKYAvWlMISJCFyKFeMrg8/hl2aLgBGBMAsAAIDpwJBa0fjgS66giOmyDCI4qFMVRED9H2AIEGYBAAAwHRhSZE0ZcETwb9mdz2IQJkDZ05A5r7RbBkAhIMwCAABgUjAl4v2/uuFnMUjMLeq+5Ri8QqUFwiwAAACgPMNIRq0gpcX4CwYJCAGBQQjxefAaAQAAAOUYITwbf3bAkT2ahU+KiEL7vtvXzb1bqbarbIAwCwAAACjPMDWjlqqlxQizSKRm1KXapjIDwqxCYBim+y8AAABQtmHa/yvNPyi/YIZrgZUN1WqlUskwDEVRKpWKJGE1QwAAAAB8CQizPhAfH9+tW7egoKCQkJBjx44FBARMmjTJ0I0CAAAAgEkyrkHDnJycly9fqtXqunXrikQGWIlTKBQ2aNCgUqVKPj4+PB7Pzs7Ox8fn2zcDAAAAAGWAEYVZ6enpc+bMyczMxDAsMzNzy5YtVapU+cZtsLe3/+mnnxBCNE1jWt+4AQAAAIDxwzAjWu+oXIRZarWaw+HgeP5RSLVarVAoBAIBl8v99BHEYvG8efPc3NwQQsOGDTty5MjcuXORgRR8IgAAAADQIuRqrlRVjD8QEOV0vaOvDbPi4uIOHTr09OnThISE0aNHDxgwQHcXwzDnzp1bunRpcnKyi4vL7NmzO3bs+IlDCYVCNsZCCKlUKisrq69sGwAAAABKGIaQutOIPzuNKeKykgghFdrXG3Wrisqhrw2zHj58ePToUV9f35CQkKioKP27bt++3bdv3zFjxnTs2PGvv/4aOHDg2bNnGzZsePv27eXLl+c7zpw5c4KCgtjft2/fnpWV1bdv369sGwAAAABKAVehJlDRJ+KrkJpG5dPXhlndunXr2rUrTdM3b97U384wzI4dO/z8/FauXIlhWKNGjR4+fLhhw4aGDRt++oC7d+8+ceLE1q1bbW1tv7JtAABgYmgKRd5ANFnUNeZoClk5I9dapd4wAD7AaN6hRc9exspvla2vDbMIQnMEttCU/naVSnXnzp3g4GA2i5zL5datW/fOnTs5OTlBQUHnzp0reCiapo8cObJnz56NGzc6OTmRJMke/GO4XC6kqANQrpT9jzypRIcnImUuwoqWxqKWo4AeKHhz0R/hfiL65XZxzv0kmhqEGrgU/REAACWdAp8vxmIDr6ioqMqVK+u2eHp6nj17NiUlxcLCotCDpKSkbN++ncPhbNq0KS8vr0uXLr169cq3T05OTkJCAo7jGIa9fftWpVJRWgUbAAAoY3AcV6vVZf/DzhMihipqmIVhiOAX6/Ax2ejPEIR4Rf4DFerpC2EWAEZW0IGiKLbDSbeFy+XSNM1uL5SNjc3mzZvlcjmt5ezsXHCfmzdvTp8+HdeSy+WpqalSqTQ7O/sThwUAlA18Pj8nJ4cttlJKD/HixYu3b9/WqFGjatVPJeumpaU9ePDAysqqQYMGn+50/xaw4jVAzEWI/SkippxOECtVBK40dBPAN1JaJwgul8vn83Nzc3VbcnJyeDyeQCD42J/w+fxq1ap9+rBNmjQ5duwYhmEcDufNmzeTJ08Wi8WWlpY0XV6T6wAoNwiCsLCwKKViK7m5uT/99NOxY8c8PDzi4uIGDBiwaNEiDqeQmVRHjx6dOXOmo6NjZmamp6fnli1b3N3dkaFgRIIs5n7sn0Vd9BdD95NdEd6gtNsFPgUjYtIa/xle5P1p5GoJHYrlO8wquNayQCDw9fV9/fq1bsvr16/t7OwK7aMqOkst/UiOIAiO1tccFgBgEgiCwDCsNMYNDxw4sGPHjuPHj9evX//06dMTJ04MCAjo2bNnvt3evXs3duzYQYMGzZgxIy0tLTg4eO7cufv27TNY0hhHcDv1dr8rxQizkLwT4pwp7XaBT8GF919N6R1a5P3VqFMtdKZPqbYJlJYSuy5ktHQ3CYJo167diRMnkpKSEEKxsbG3bt1q2rQpj1f0jICPUiqVycnJCQkJJEmW/ZRYAMD/ldLnnaKow4cP9+rVq23btlZWVgMHDqxXr97+/fsL7nn69GlLS8uJEyc6ODj4+PhMnTr1+PHjEomkxNqMaWdkFeOH4eLEv4OARfwhBMV8CE2jSvMpfMEPZlRPQXPwYv6rIUKF+KjoPwJu6f4TFP8pFPsHK0/vIv1P/df2ZsXGxo4fP16hUCQlJe3bt+/Bgwe1a9devHgxh8MZPnz4mTNnunbt2qhRo1u3bllZWU2YMAGVhLCwsMWLF2dnZ6elpTEMA4lZAJQTJFn0Qj3FIJPJHj9+/P333+u2+Pj43LhxIzMz09raWn/PBw8eOGmxNz08PAQCwbNnz1q1aqW/Gzsvhz3Vsr8XteVqNUYxiGI038RFoTkBIkRpMqiKBEOag1OU5pciohBJMsV44UkS0zSpyD2OmpN4cZ8CVYynwGgOrlYzZDGeMqV5CnhRnwKJMZr2F/34miaRmokORW0PYor1TwDvIkO/iyiK0g2yfW2YJRKJGjVqRJJk27ZtKYpSKBReXl7sycXd3f3q1au///57eHh4nz59hg0bVlKlsGrVqrV379579+5169atX79+5ubmJT6IIBAIKIpSq9WoTCC0FAoFKhMwDBMKhQqFoszk5JWx9xuXy+VwOCX+fsNxXCKRJCYmlvjnXSqVymQyBwcH3RZnZ+e8vLysrKx8YVZqaqqZmZku7d3CwsLc3DwxMVF/H7VaPXbs2JcvX7JzosPDwxUKRZMmTYrQEAwxFBH/DBX5jY0zWBLBaDo8Cr4kQs0kQc0XTz70RaRqocn3KSIGzTlNbRAzRfrKw3BMms5JiSn6SAnOYE/5jOa7KN/xOdqOnLzC/kY9D1Gbiv4UpDhqc5IksKJ9BWM4JzUck0qK+AWMacIsJOUXFmbxtBsLSXaXImV7xBR8zh/BoAti5rt1VNGiDngXFXgXyQt7aqX2LsIw7NWrVy1btmSvtb42zLK3t581a9bH7rW1tS2NdQm5XK61tXWdOnW2bt1aGtOOCIJYvXp15cqVe/fuXQa++bhc7uXLl2/fvj1nzpwysFYjjuOpqakrV64cP368h4dHKXVvfGOrV6/29fXt1KlTGXg6BEGcPXv2xYsXU6ZMKfH3G8MwOI6bm5uX+GG/7A8LPflwOJxOnTo1aPBvmjmb21CM/FHO2GJ1jOAMlu/QOIYrlIr58+f369uvXmA9lSrfynMMwor3NqNoRBf9FcIwhBfrm4UZxuR/Hblc7vNnz/fu3btk6RKhQEgz+b4LKYQV5xKLKWYJcpxT1IIa/zemwOvD4/F27twpl8vHjxuvVBUItbDifbMwDCKL9RS++l2EYZhapZ4/f36vXr0aNGxgou+i0NDQnTt3Ll26VCQUfct3EU3TuoJWhp6K/BUcHR2HDBlSSgc/efJkgwYN9JdoNGkMw8THxw8fPhyVCSkpKTt37uzXr5+3tzcqE06cONGsWbOBAweiMiE3N1ehUJjQ+83MzEwoFKanp+u2JCcnC4XCgkX+bG1tk5KSdMWTc3NzpVJphQoV9PfBcbxLly7I0H797dd2ndrlG800IS5uLn+d/WvoiKGme3H44PGD7Ozs74P/G4w2Oes2rmvToU379u2RaXL3cD924tjQEUMNOE/OVN++pa0sjeCwRfk/XbTMtCgUCoZhyswYaNl7v6nVaoqiTGhI18zMrHbt2k+ePNFtefnyZcWKFQvmOQQGBiYnJ6emprI3Y2JiZDJZQEAAMjJyuZxhGKXShIszsYuLyOVyZLJIkjTpsy6bmFGgH8uUKI3gXQRhVtn8eORD03RZ+hZnGKaMVQMvY+83iqJMa/STw+H07t376NGjt27dUiqVf/7558OHD/v168feu2fPnuXLl7NhfefOndPT03///ffc3Nx3796tW7euc+fOdnZ2yPio1WoTinTL5FmL1EKmDN5FX8+EBw1LVVBQkJeXFyorPDw8WrRoUWaKX4jF4g4dOlhZWaGyomnTpmVmABQh5O3trVAoTOv9Nnjw4NDQ0ODg4GrVqkVGRg4YMKB3797sXdeuXXv58uW4ceMEAkHVqlXXrFmzYMGCmzdvSiQSa2vrFStWGOGoFofDad++/VfWKTQsR0fHDh06GL7I/leoXbu2SffGcTicdu3aubq6IpPl4ODQsWNHw76LSqXQXxnAviym9T3x2apmRvhl8MVomi5jTwfTQmWCiX58GIZ5+PDhmzdvfH19a9WqpduemJioVCrd3d116R1xcXF37961srJq0aJFidQCLA2m/qYqA2ctE/0g6IN30deDMAsAAAAAoFSY8IUCAAAAAIAxgzALAAAAAKBUQJgFAAAAAFAqIMwCABRbWlrajh07THoWFQCgDCBJcs+ePXFxcchYQZhVdph0dRNgWhITE2fPnr1w4cKyVO4LfHumXlYKGJxEItm2bduQIUOys7ORUYIwqyy4cOFC586dW7RoceDAAVQmrF+/ftu2bQihmzdvTpkypSwVfC8b/P39f9PatWuXodsCTNLjx49/+OGH5s2b//LLLyb6AY+Ojh4zZgy7lvn8+fPPnj1r6BaVRw4ODlu2bHn58uW0adOMs3KCCVd++3rPnj27evUqwzBt27b18/NDJkihUCxYsODAgQP16tUjSbJ///5SqXTUqFHIxCmVyqVLl7579+7ChQujR4/m8/nI9D179uzu3bsCgaBNmzYVK1ZEJq5fv37v3r2bPHmyu7t7mzZtDN2ccur27ds3b940MzPr1q2bm5sbMhFbtmxZtmxZzZo1zczMZs6c+f79+zVr1phccSaCIB48eDB8+HB7e/vU1FTTXQP34cOH9+/ft7a2bt++vXEuafBptWrV2rNnT69evTw9PWfOnGl0bySmvDpw4EDlypXbtGnToEEDDw+PXbt2seu3mJDk5OSBAwd6e3tfunSJYZi8vLzOnTtXrlyZXfLPpMnl8tq1ayOENm/ezJQJ27dv9/DwCAoKqlq1qr+//+XLlymKYkycXC4fMmSIi4tLaGioodtSHi1ZsqRSpUpdu3atUaNGrVq1Lly4QNM0Y9ykUum8efMqVqy4e/dudsvUqVP5fH5sbCxjgo4fP65Zn9jdPS0tjTFNy5cvr1Sp0nfffefm5hYUFHT37l3GNG3ZskUgEBw5coQxMuU0zAoJCfH09Dx06BBN00qlsmXLltWrV2f7fk3Ijh07EEJr1qzRbdm+fbubmxtJkoyJS09P//HHHxs2bBgYGGhy/y4F3bx5093d/fTp0xRFpaenV6tWrUmTJtnZ2YxpUqvVulA+Nze3efPm/v7+ycnJhm5X+XLu3LlKlSqxX4qpqalsn6JKpWKM2/Xr17lc7pAhQ3Rbrl27ZmNjEx8fz5igQ4cO/fDDD46Ojr/88gtjgk6fPl2pUqVbt27RNB0XF2dvb9+9e3fT+gaRSqW636dPn25lZXXnzh3GmJTTMGvVqlXNmjVjGIYkyalTpzZo0OD+/fuMqcnJyenTp4+1tfXt27cZhsnMzGzcuLGNjU27du0WLFgQExPDmKDY2NgVK1bk5OQwDJOQkFCtWrUOHTrI5XLGlE2aNKlPnz4MwyiVynHjxjVt2vTJkyeMadq6dWurVq2aNm26bds2dsu7d++qVq3arVs3mUxm6NaVI3369BkxYgQbYwUHB7dv3/7t27eM0VOpVPPmzRMKhfv372fPwIMHD+bxeK1bt540aVJoaKip9PIePHjw9OnT7O8bN24UCoXHjx9nTE2PHj3Gjx/PXtkOGjSoXbt2ERERjIm4dOlS165dg4KC5syZk5uby4ZcPXr08PLyevPmDWM0ymkKvEorISGhb9++r1+/PnjwYP369SUSydatW5VKJTJiarX63LlzI0aM2LJli7m5+ZYtW6pWrTpw4MALFy706NFDqVROnjzZ1dX18OHDNWvWHDp0KBuBIdORnZ29du3aOXPmMAzj4uKyf//+x48fT5kyhWGYtLS0GTNmGPPE3XzCwsLGjh2bmJioUCi4XG5CQkLPnj0TExMPHjxYu3bt9+/fs/3byEQoFIrJkyf/+uuvzZo1a9GixRwtkiQrVap06NCh27dvz5w5U6VSGbqZ5YVCoVCr1REREb169eLxeEePHvX09AwJCfnzzz+N8E11586dyZMnL1iwgKKohQsXdu/effTo0SdOnBg2bNitW7dmz55do0aN69ev169fv1u3bn///bfxJ8U/e/ZsyJAh9+/fRwiNHTt2zJgxw4cPZ28ePnz4999/N8J/BZ07d+6MHz9eJpPJ5XIcx6Oionr16kVR1JEjR6pWrRoWFnbhwgVk3Pbu3Tts2DAPD48ePXocO3bs+++/z8rKEovF27dvt7S0HDJkSHp6OjISTLkRGho6atQoNonkxo0b1tbWfn5+P/74I9txwqYItG7d2pgTmzIyMoKDg52dnYcMGfLHH3+wAwSvXr2qUqUKj8fr1atXSkoKu2dsbOymTZvq1q27ceNG40/XyOfo0aMikWj9+vXszVOnTllaWnbs2LFevXrdunXTPUcjJ5PJ2rZtGxwcnJqaeuTIEXNz87p1606ePFnXxT1s2LDvv//ehP51Nm7cWKNGjfDwcIZhLl++7OrqyufzdX1ahw8fdnNze/HihaGbWZZduXJl/Pjx7Pja9u3bbWxsatSosXr1ajavVK1Wd+7ceezYsUb1plKpVDNmzKhQoULPnj03bNjAjpVnZGQ0a9YMw7BGjRpFRkaye6alpR08eLB58+ZTpkwx/g5smUzWuXPnqlWrsv8cubm5PXv2dHV17d27d9WqVXft2mVU/wr6pFJpQEDAmDFj8vLyVq1aZW9vHxAQsGzZMva7T61Wd+zYcfLkyYwRu3Pnjpub25kzZxiGiYqKql+/PoZhI0eOZLtCX7x44eXltWfPHsY4oHKV8D5s2LBXr16xPdVDhw4lCOLw4cNyuTwhIWHmzJnVqlUz5kxeqVTapUuXBg0avHz5Mt9dN2/etLS0HDBgQL7+duNP1GBJpdJ79+7pt3bdunVisVjXCX/x4sWuXbtu2LDBmINgfXfv3p02bVq7du3YoEoikTRr1szOzu7WrVsMwyQlJU2ePLlmzZpG1bOdj/6XBPu+WrNmzdmzZxmG+eOPP7y8vE6ePDlv3jw+n3/x4kV2t9jYWKVSabgml2UURS1YsICdSPX+/Xv2U9OwYcMKFSrcv39fqVRGRET079+/adOmCQkJjNEgSXLKlCmenp43btzIF3ZER0d7eHg0bNhQd6Gr+xOjDVAiIiLYywxWYmJinTp1WrRokZmZyf6LzJo1Kzg4+PHjx4yx+vvvv2fOnNm1a1c2NE9NTfX29vbw8GC/VqKjowcPHtykSRNjS5Uj9dLFSJI8efLkr7/+yjDMo0ePfHx8Vq1adfToUS6Xu3z5cvZkFR8fbzw5DOUizLp+/bq7u/vRo0f1N+bk5AQHB1tZWQUFBdWuXbthw4bG/NlgGGbfvn2Ojo4fS7/YtWsXhmGLFi1iTFBoaKidnd3WrVt1WyiKGjFihKOj4/PnzxkT9OuvvyKEunfvrtsSFRXVtGlTJyen1q1b161bt3HjxsYc07OpJyNHjiRJMiwsrH///pGRkTRNUxT14MGDKlWqXL58mWGYp0+fWltbOzs7QydWadu+fbu3tzebA6ATHR3dunVrR0fHZs2aVa9evXPnzsY2X+/OnTv29vbsVOiCrl+/bmlp+cMPP5jK5dO4ceP8/f31A1n23KXrRzF+s2fPRggNHTpUt+XJkyd169Zlp1D4+vq2a9fO2PJ6nz171qtXr7i4uOzs7CFDhly4cIGiKJqmExMTGzduvGrVKvYLvW7dunw+nx00NyplPMxSa40YMSI4OJiNgs+dOzdy5MhRo0axiX43btxYvXr133//beRX4RRFtWvXbtiwYZ/YZ8mSJWwFBKO9FvwYkiSXLFkiFot1/SIMw4SFhVlbW1evXj06OpoxETk5OeyYplqtHjZsGI/He/r0qe7evLy8I0eOzJ079+TJk0b+fmO7SJ2cnPr27dugQYPly5fr+honT57cq1cv9vdbt261a9du9uzZxvbtXpbk5eVRFNW0adOFCxey77HDhw//8MMP06dPT01NValUf/311+rVq+/cuWOE3/TTp0+vX7/+J85IBw8eJAhi6tSpxv+JYBgmJiaGnZSj31Myc+ZMhNDSpUuNeYKe7tSUlZXVtWtXZ2dn/W653NzcnTt3zps37/Lly0ZY2Cg2NrZevXrNmjVr27bt4MGDU1NT2e3Hjx93cXFh3/ZpaWlNmzZdsGDBzZs3GSNTlsOs9+/fd+3a9eTJk2vXrnV2dl6wYEH79u0dHR07d+7s5+cXGBhoEh9slkqlCgwMZKeEFHov+9+BAweOHz/eVMKsrKysiIgINldDoVDkq8AUEhLSvn37AQMG6J8OjNymTZsaNGjAljbIzMxs3rx5vXr1kpKSGNM0fPhwhFC+4H716tVOTk6vX7+Oi4tr3rz50qVLDdfAsu/Zs2ft2rV7+vTpkCFD/Pz85s2b17BhQycnpz59+jg6Og4ePJgxbsOGDWvatGmhZyS2mA5bP71z585G26HFVjp49+4d+3X+4MEDe3v7CRMm6Hb46aefOnTo8MsvvxhzmDVv3ry2bduyg5uJiYm+vr6tW7c2nmG1z2JXm/Dx8dFP2rt69aq5uflff/2Vm5v7448/6o8eGJWyHGaNHTu2devWiYmJ2dnZbBGm4cOHh4WF0TR948YNS0tL0/r+GzNmjLu7OzttNZ/Dhw9v2LCB7UQxidhRqVRu2LChSpUqjo6Ozs7OmzdvJkmSrcBUo0aNO3fuhIeH9+jRY+bMmYxJiYyMrFGjRocOHdh0k7i4OC8vr65du+bl5TGmRq1Wr1mzZvjw4XZ2dhcuXNBtT0xMbN++PZfLtbe3HzFihOlW/zIJbdu2HT58uFQqjYuL69GjR+PGjWfOnBkXF8fOSKhdu3ZWVhZjxH777Tcej6dLctf3/Pnz6dOnK5VKiqKMNsZ68+ZN9+7dnZyczM3NO3fuHBYWxtaaEovFM2fOfPv27cmTJ/38/NjtxiwkJMTJyWnQoEFsZ9WzZ8+cnJxGjhxptK98PocOHZo0aZKjo+OKFSt0UbtKpZoyZYpAILC0tGzVqpXRXpCXzTDrxYsXY8aMqVevnv7HWz9AYScVGmHvqI5arX7x4sWpU6devnzJvqsuX76MYdjy5cvz7UmSZLt27dgKOqZVEv3w4cO3b9+eMmUKjuNLlixh8xbbtGnj4ODg5eXVsmVLNtXXtDx+/NjOzm7cuHHszTt37tjY2EyePNkIB3Q+hqIomUzGXpqrVKphw4Y5OzuHhITodkhPTz958uS1a9dMZY6FKbp48eLYsWObNGmiKy/O/ruwv0ul0q5du44dO9ao3lcURUVHR586derJkye6edD29vYDBw4s2KE1bty4Vq1aGfNlYW5ubsOGDX/44Ydbt26dOXPG39/f3d399evXbOeKvb19tWrVnJyctmzZYhIDCOfPnzc3N1+2bBl78++//xYKhStWrGCMW15enu5N8vvvvwuFwsOHD+vuVSgUly5dOn36dEZGBmOsymaYFRER4erqyuPx8n1PS6XSBw8eDBgwICAgwJivP+7evdugQQMXF5dKlSrxeLzvv/+ebe2YMWPyZV9RFDV//nxPT08TSmDKy8tzd3fXX0Vn7dq1PB7v2rVr7Mfm5MmTZ86cMZXLrPPnz48bN06/v+rUqVNmZmbsRBi2PsWoUaPyTacyKuHh4bt27WJf8GvXrrVt29bOzq5Vq1bnz59nPzUtW7b08/NLSkrKycmZNGnSxzKaQQm6dOmSSCTy9/dnB3p0MjMzr1+/3rp161atWqWnpzNGIzIysnPnzk5OTp6eniKRqGnTpuwnmp0OMnv2bP0hqt27d7u6ul6/fp0xYtu3b/fx8dFVkImLi/P19e3YsSP7SYmIiPjjjz+MefLHgQMHZs6cqR/I7tixQyQS7d27l725efPmKVOmGFWkLtFWr2QHmiIiIgYOHOjs7Ozn57dt2zb2ZZ85c6alpSWbgLVq1apNmzYxRq9shlkMw1y4cMHS0pJdsluHnSTVr18/Yw5Kbt++7eTkNGnSpPv374eFhe3cudNJ6+HDh7m5ud26dePxeH369Dl69OiuXbvat29fuXJldtqX8WO7D3NycgiCOHbsmG67SqWqU6fOqFGjGFOgK3xFkqRcLr927ZqFhcWsWbP095k8eTJbFZoNiI253/T27dtVq1bt06ePQqG4cuWKq6vrggULjh492qlTJzMzM7b2TGxsbEBAgK+vb6NGjZo3b17oGBAocdu2bSMIYufOnfobjxw54uLiMn36dKNaRC8yMtLX17d37943btx49eoVO5Rmbm5+7NgxkiQnTpyIYVirVq327t3L5u+7uLjozyw2KjRNs1258+bNq1evnv4F0qlTp2xtbY1zyRCapnWBLEmSMpns+PHjAoFg7dq1+rv179/fysrq5s2btBZjTOLi4tq3b+/r65uQkBAVFRUQEDBw4MCjR4+OHTuWIIhJkyaRJCmVSvv16+fs7Ny6deuaNWvqz5oyWmUnzGIHMg4cOKDrwdq1a5dIJNKvUaZQKIw5wGKTlho3bvzjjz/qb3z16pW3t3f16tXfv3+vVqt///13f39/T0/PgICAYcOGGe2AdD6JiYnBwcHJyckkSbZs2bJdu3b6V1EzZsxo1aqVUV1XFSozM7NNmzbbtm3LysoaPnw4W0Hj6NGjQqFw48aNut2uXr1qbW0dEBBg5KkzR48edXZ2Hjt2bF5eHkmS9erVmz9/PnuXWq2ePHmypaXlo0eP2AklU6ZM+eWXX0wxz8xUxMXFHT58+MSJE7qMt1mzZllbW+uv0ZaZmWlUlbHYL/gRI0a0aNFCv+MkJSWlXbt2NjY2Dx8+ZBjm5MmTDRo08PT0rFmzZu/evY1wOpjOjh07Vq5cyc5DF4lEf/31l+6u3NxcsVjMVsU0NsnJyY0aNTpx4kRqamqfPn3YbN3ffvtNIBCcOHFCt9uhQ4esrKzat29vbPnvT58+9ff3b9GiBTttedq0ac2bN9d9I/zxxx8EQbDf5kqlctWqVTNnzjS24l5lPMx6/PhxkyZNKlWq5OLiEhgYqDsrzZw508rKKl+xGWP2+PFjW1vbgmuk37t3D8MwtkAIW0P51atXppXCHxkZWbly5T/++INhmDNnznC53KVLl7KfIqlUWr9+fZOYs6ZQKBYuXOjo6Ni4ceNevXrpCswsWbLEzMzs77//Zm9OmzZt6tSpz549M+bJRytXriQI4ocffmAvanNzc7lcrv66bLm5uVWrVmVXOgKl7ezZszVr1vTw8HBycmrTps27d+/Yj0bPnj2rVKlizD2I2dnZFhYWhw4dyrc9Li7O2dl54MCB7E2ZTBYeHm5sNZkKWrp0qaenp0qlIkmyY8eO7u7uupHB48ePe3l5Gee/RV5e3pgxYypWrBgUFDRs2DB2vrNKpZowYYK9vT37nUJRVP/+/VevXh0aGmpUXVmnT5+2t7evWbMmO0ROkmSLFi0mTpyov8/AgQPr1KljivmgZSHMioyM9PHxmTFjhlQqff/+vaurq7OzM5uoqFQqg4OD3d3djbnctr6///7b3t6e7T/IJzg4uGbNmsacMfpZPXv27NGjB/vx/vXXX83MzDp06LB69eqgoKD27dubStQYHh4uEokwDNOviUWS5NixY83MzGbNmjVs2DBvb29jXsc3MzNzxIgRlStXDgwMdHNzY0/BbNEQtsKczpw5c5o0aWLMwWLZcOXKFQ8Pj82bN6tUqvv37/N4vAYNGrCpVxkZGfXq1WvYsGGhs4yNQWJiIkLo5MmTBe9avny5WCxmv/JNxcOHDytUqMBeq797965JkyY2NjazZs2aMWNGpUqVjHask+1E53A4dnZ2+oGgXC7v1auXjY3NokWL+vbtW79+faPqDVWr1evXr7e3t2/VqpW5ubnu5Z02bZqnp6f+iO3Zs2d5PJ4xJ7mWqTDr7du3c+fOHTVqFPtJmDRp0rBhw2iazsjI6N+/f6dOnerXrx8UFMR+baekpMyZM8dUyie+ffuWz+frsqf17dmzh8fj6RKDTEJubq7+hP+9e/d6e3vrLmfPnz/fu3fvpk2bLl261IRWKnz9+vXvv//eqlWr+vXr64eGCoXil19+8fX17dmzp3Fmb7DS09PbtGlTvXr1J0+epKen16lTx8vLi60R8Mcff3A4nH379ul27tatm7GtkVc2PH78ePz48ZMnT2a/Ebt168ZOIo6KimrevPmAAQMqVaoUHBzMZvU9f/580aJFRhtmyWSyihUrFjrZ+fr16yKRyMjXcmC/O3TdJHK5PCgoSLeoX2pq6pIlS4KCgvr27Xvu3DnGWLETvLZv3+7v79+2bVv9McHs7Oz58+fXrFmzX79+bAeEkSBJctq0aXZ2dgcPHlQoFCNGjBCLxWyq8ZMnT6ysrPTnaK9evdrf398UOxpML8zat28fOzLo6enJ4/EOHToUFRWVkpKSl5fXvXv33r17y+Xy27dvI4R69uxpckV9KIrq0aOHm5sb+7Wnb/Xq1d7e3qb1Jlu9erWrq+u6devYur0ZGRm2trZHjhwpmG1q/CQSyZw5c+rWrcuWNoiLi6tSpYp+TSz2F6VSaeRBSXZ29oIFC6KiotibL168cHFx+e677yQSCUVRkyZN4nK5U6dOPXXq1Lhx43x8fNhlQEFJUalUixYtcnZ2btiwobOzs6ur661btyIjI9mkq8DAwNmzZ9M0vWPHDnaCnvEvoswwzIIFC7hcbsGri7/++svGxsbIK7MkJyfXq1evffv27JKj7NMJDAzU7zgx5lksSUlJP/74Y6NGjRITEwuticVenBvhdwdFURs3btRN4crMzGzbtq2Liwsbl+/Zs0ckEvXs2ZNd56BixYqnT59mTJAphVlyuXzp0qVsNcvs7OyYmJjvvvuuatWqbI/C1q1b69Wrx8ZV2dnZlbR0HxsTcvfuXVtb21atWul37SYnJ1epUqXQXi5j9u7du1WrVrm4uNSqVWv37t0KhSI4OFiXq2FCFApF165dGzVqdPHiRV1W++3bt21sbCZNmiSXy3fu3NmjRw9jyyotoitXrvD5/CFDhrCFIjdt2uTl5WVvb9+zZ09jrntiitLS0kaPHu3p6Xny5Mm8vLzQ0NCqVau2aNGCDc2nTZvWs2dP9vebN296eXnVrFnTmEefdWJiYqpXr+7l5aVfX00ul7ds2XL48OFGfuGhVCqvX7/eq1cvOzu74ODgly9fvnr1ytHR0SS+PpKSklq1atW2bdtbt27pxjrYmljLly+Xy+WrVq0aPny4SQTrjHZSs7e3d0BAAHtlfvbs2SZNmrBLD+syX02OKYVZhw4dYpeO0m05c+aMUCi8evUqO4Vet6rDpk2bevbsmZiYaIrpcmyipY2NTZUqVfbs2XP79u1Dhw4FBAT06NEjXwUdoxUVFXXr1i1da5OSkubOnevh4REUFDRw4EB7e3tTeSI6Gzdu9PX1LTix5dSpU/b29m5ubj4+Pn/++aeRf518wq5du7hcLlsklg0rpVKp6T4dozV//nyEkP48A7asFBu7d+nSZeTIkez2CRMmTJ8+PSkpyVS6ex89euTm5mZlZfXrr7/evHnzzJkz7dq1q1+/vq7f1NjI5fIHDx7oVveiafrSpUtt27Z1cHD48ccfnZ2dFy9ezBg3mqYXLlxYr169ghd4O3bssLKyqlSpUu3ata9du2ZCn+WHDx/a2Nh06dKFHSVXq9VSqdSYexPLVJglkUjatGnj6uqqG8VYtmyZh4cHe7XHdgL16tVrzJgxXl5eV65cYUzZvXv3OnXqxOVyHRwcKlWqNHfuXCMvDcBSq9ULFizw8fFxdHRs2rSp/kT0169fT58+3cLCAiF06tQpxqS0a9duyJAhhd517969bdu2mcoci48hSXLu3Lk8Hm/Pnj0mdEY2ORERET4+Pg0aNNCNow0ZMqR27drsBeHevXvNzc1HjhwZHBzs7+9vVGk0RRERETF06FA+n29nZ+fi4jJixIiCyQ9G4vnz523atKlYsaKHh8e0adN0nT0qlerkyZNBQUE4jgcGBhr5t7tarQ4ICNDNQM/nxo0bO3bsMJWqB/pOnjzJ4XDGjx9vhAOdZTzMYgehatSoERAQEB8fv2PHDkdHR/2yWCdOnGjevHmnTp2MvLhwEVEUlZiYGBoaarSpr/koFIoJEyYEBAScP38+KSmpSZMmzs7O+WZNRkRE1K1b11TGDXWd8L169WrdunW+ztGwsDCTS/77BLVa3adPn0KvjEGJF23p0aNHUlLSTz/9pD84RZLkli1bmjZtGhwcbLopcampqSEhIRKJhDFWz58/r169+vjx4+Pi4o4cOYLj+IgRI/SXnVCr1Zs3b7axsXn27BljfNRqNXsuIkmyefPmBVcQf/r0qamsovExa9ascXFxMeYi+2UkzEpJSSk4usSuGVejRg1PT8/du3fnu9f461uWYSdPnvT29mb7dY4dO1anTh1/f38/P798CbCbN2+uU6eOUa0TUqiTJ092796dnYt+4sQJoVCon7z/5s2bgICABw8eMGVIampqRESEoVtRpsTGxhb8wjt8+LBIJKpVq1aNGjUKXhMaeQ+KqVOpVO3bt580aRKbxdu/f/+goCBzc3O2JKmOXC5v3LhxwTVkjcGOHTuCg4PZHritW7cKBIJ//vlHd+/du3dr1qxpVFUbvoBcLg8NDTWVEXNTDbNu3brl4+Nz4cKFgnedOnWKx+PpckWBkQgJCWG/M/bu3cuO2758+dLW1rZNmzb663r+9ttvtWrVYjMcjVlkZKSbm1uvXr0UCgVFUYMHDxaJRL/99ltISMipU6f8/f0nTZpkEsl/CoXi8OHD/f/X3p3HU7mujQN/ZJ4yTyHzmJmwTLXDiqKkaKUBtcu4q50UGlCh5DiRjNHkQyU0IcqQTDvURqZEiQyJZR7XWs/vc7rPb3286t3ve95zaj2L+/vXXo/nj6ud9XQ9933d17Vrl5ub27edb6Ef59atWxoaGt/tZnnp0iUEQU6dOkWLuJY0Mpn88OHD3t5ecK5t9+7dg4ODJ06cQBBk/kzikZERPT09bPZMrqqqAvPpZ2dnR0ZGNm3axM/Pn5KSUldXd/v2bUVFxZCQEMyuOJSWlnp6eu7cuTMjI4Munp+LNs3q7u7W09MLCQn5717soqKiWFhYoqKifnpo0D/qLv9inlpLS4uSkhKYOkwikSwsLFhYWKhnJDs6OnR1dePi4lB6UFxczMvLGxAQAA4bnzhxgoeHR1ZWVkZG5syZM3SxLE8mk728vBQUFPz8/BwdHcXFxePi4uD7yU/Q0NCgoKAwvwnZfCQSycPDg4uLC8utmOjd+Pj4X1RcBAYGWllZgS3y/Px8Xl7eVatWUbv6/e1vf8PhcJgtbLp//z47Ozt4rvb397u7u4NHk7y8/JUrVzCbvly9elVCQsLDw8Pb21tUVNTT05NejkAuwjSrpqZGVFS0srKyvb09JCTku41fDx48yMjIeO/ePVoEuKQ1NzcrKyvPr4qbLzs7W0hICHx52traDA0NCwsLqZWw09PTra2tmP1nvqGhITIycv7YvvT0dA4ODmpe2NPT8/LlSyzXnSxw7949RUXFxsZG8DhWV1e3srKiiwSR3mVnZ69cubKzs/PFixcxMTHfri6Mjo7a2NiABx2NYlzkgoODjY2Nv7twTiKRzMzMqGcJT58+/dtvv5WVlVFf7Lu7uzE1l6K8vDw2Nnb+k/PSpUvs7OzUkYudnZ01NTVYPinV3t4uIyOTkZEB3tV37dolJSUFhkotbthKs+Z3eiQQCMrKyoaGhqdOnfruG8no6OiGDRscHBwWx/YtHRkaGnJ0dFy+fPl35782NjZKSkru27fvzp07xsbGC+ZSYRaZTP748eOLFy84OTkXHOT28fHh4uKi9tCjLwQCYe/eveDwgaWl5e7du7G/XUu/KBQK9e2cSCTq6uoaGRnp6ekt+AeSqru7W1NTE24d/iBPnz7l5eXdsWPHd5dMAgMDRUVFr127dvbsWVVVVczWWU5PT/f19d27d4+FhSUxMZF6fWZmZseOHUJCQmA4N/bFxMSYmpqSyeSxsTF3d3dTU9Ml0pYPQ2nW1NTU1q1bqWdTL1++jCCIhobG/KWFBYaGhuYX/UA/zfDwsJGRkZSU1HfrTh48eKCpqammpgYGTaKYRyaTg4ODwRS5GzdusLKypqamUn9aVVXFz8+vqKiI2R2Eb1HfPVxcXGxsbJ4/f66pqXnixAmwplJWVhYZGYnZNUX69fnzZ1NT07t374JSa09PTwRBHBwc/uJ/9cDAAB0tjtKdO3fuMDMz+/r6fvujkZERd3d3RUVFY2NjzL5EkclkNzc3CwuL2dnZ8+fPz59PD+aVsbGx6enpYfkxS/n/v/wpKSnq6urPnz/ftGnTli1bQOVJX1+fv78/PU4qpMs0a25uLiIigoODA6yChoaGhoeHr1ix4siRI7QODfqO1tZW0HF0wepIX1/fy5cv+/r6qFUOGEcikaqrq9XV1QsKCigUCplMDggI4OXlLSkpATdcvXp1z549aWlp9NK+oaqqau/eveDvJS8vj5ubW1JSMi0tDfx0bGxszZo1hw8fhmnWf9zk5OT+/fuFhYXr6upmZmb8/PxCQ0N5eHjopRhxUTp37hwDA0NSUtKC6zU1NR0dHW1tbZjtmDM3N1dcXKyurg62lUkkkqurq5iYGLXNwfnz511cXB4+fIjZMoDBwUFnZ2ew3tbb2ysuLi4oKBgQEEBtiHXkyBFjY+O/WExZBDCUZgFHjx4VFhamroJmZ2dzcHDQ3ZCZJaK8vJyXl5dAIFC/M+/evTMyMsLj8XS0k3v69OlVq1bN39ycm5vbuXOnoKBgYmJiQkKCjIzMd0+8YtDY2Njdu3c9PDwQBNm1a9fMzAyZTN61axcHB0d6enpHR0d5ebmFhYWdnR1cQflBpqamtmzZoqamRq1HvHDhAgcHB/2OCqF3JBLJ3d2dlZX18ePH4AqFQomLi+Pn58/KykIxzN3dXV1dPTAwkHqFSCRaW1tLSUmlpqZevHhRQUGhtrYWxSTQVf/MmTPMzMxqampg3iLYpDpz5kxra+uff/7p5eWlpqa26LcOsZVmdXZ2JiUliYqKqqmpUSvjwsPDOTk5qd8QCFOuX7/OwMBw+vRpcFJXUVFx48aNWG7ZMjMzQ61sBRPHs7OzmZiYrKys5t9GJBJ9fHzY2dklJSWTk5PpopXR4ODg9u3b9fX1IyMjXV1dEQQJCgoC1w8ePMjNza2mpiYrK+vp6Yn9pmX0q7GxMTw8nJmZ2draGryjT09P79+/f8WKFWAgLvTzjY6Ompubi4qKNjc3k8nkY8eOgQ4ImPpeT01NUXcGwKMpLi4OQRBnZ+f5t/X19bm4uLCxsSkqKoLtaQyiUCjBwcGKiopBQUH+/v7c3Ny2trajo6Ozs7MxMTHCwsIKCgry8vLW1tZ0N+qAvtOsrKwsFRUVJycnZ2dnXl5eCwsL6n6tt7e3kJDQ/MktEHaEhoYyMTG5ublJSEj89ttvmF2+BsrLy+Xk5EpLS8vLy/X19UFNxpUrV1hYWL59Zg0PD2O56GGB+Ph4aWlp6pM6KSmJnZ2dWjPb0tKSm5uL2eEniwCJRIqOjlZQUDhw4IC9vT0TE5OHhwf4OkxMTFhaWs7vFwD9ZB0dHSoqKrq6unZ2dnJychicxgYOBdfX1+fl5enp6b169QrU6XNzcxcUFCy4eWhoCMutECorK0VERKhnpCorK4WFhT08PEChwqdPn548ebJouo/STZpFJBLl5OQiIiLAx4KCAhEREXd3d/DXMD4+bmVl5efnR+swoe+Ym5tzcXFhYGC4fPky9r82o6Ojjo6OUlJSGhoa8fHx4HV2dnb28OHDgoKC9HJm57vc3d3t7OzmX3FxceHm5qYWmUE/VG1traioKHVz8ObNm5ycnNRnWmdnp46OTnJyMk1jXNKqq6v5+fn19PSwuYLS399vYWEhKyurpaWVlZUFTquA44QrV64Eo3vpRVpaGg8Pz/zFwvj4eARBLl26hC49NEuzqqurExMTHz58CFLyqqqqBQOMMjMzEQQJCQkBHycmJuilAHkJ+vz5c01NDYpVk5OTKSkpJ06cAL9CMTExCIJoaWnN/42anp7evHmzgoJCR0cHSp+io6NFRETAdCDgyZMn3NzcsrKy9D7ZGoNIJFJJSUlCQkJRURF4R79165aQkND8/ljnzp1DECQzMxN8HBwcxPha76L3+vVrTJU0DA8Px8TEhISEgC6poBm9ubn5/PfVgYEBExMTAwOD/v5+lE6Ulpby8PDMX4Rrb29XVVVlY2N79OgRusTQIM2amZk5efLkihUrWFlZGRkZXVxcZmZmurq6uLm509PTqbfNzs7q6OgwMjKCbmYQ9H/T0dFha2srLi5+7NgxcKSosrIyIyNDTk7Oyclp/uPs8+fPWlpaYLoOSieam5srKirAEYT379/LyMjs2bOHGn9kZOSvv/6qo6MDJrhB/ylDQ0MuLi4CAgIsLCzs7Oznzp2jUCj5+flcXFzzC7Da2tokJCR4eXnpepUU+kEaGhpMTU2lpaUvXrwI0qzCwsLU1FQREZGjR4/Ov7O9vV1aWtrT0xOzI3RQFO3q6iotLQUtlqampmxtbTU0NKi75EVFRVu2bHFyctLT06OjByxdplm9vb0ODg6KiopPnjwZHx8HtaJgZo6zs7OSkhL1VWN2dtbe3p5AINDLIS8Igz5//qynp2djY/Nty6uSkhIeHp6TJ0+CJ9fk5OTQ0FBLSwt1cQLjent7wW6CjIyMhYVFU1MTiqI5OTl8fHzW1tbZ2dkRERFycnKvXr26ceOGmJgYlis56EtTU5ORkZGZmVl1dfXQ0JC3tzcDA8PTp0/Hx8dNTEwsLS2pRaUdHR3m5uZeXl6YPQ4G0Upra6uCggK18cp89+7d4+DgoO6vjYyMjI2N1dTUYHZawMTERFBQ0MqVK5WUlFRUVMB5tXfv3il/desrdXX1pKSk2tpaQUHBpXYW5KemWUQi0cbGRlhYmLo5SCaTjY2Nzc3NQcKuoqKira39/PlzIpEYGBj4yy+/gBwfgv5vjh8/rq2tvWAABbViAHQiTUxM/Pjxo4ODAzgvSReGh4fNzc03b95cU1NTV1en9BU4Ml1SUoLH4zk5OTU1NR88eACa66irq1ObbkD/jr6+PgUFBU1NTWpj5PHxcX5+/uPHj4OB9/z8/NbW1o2NjT09PXv27HFxcaF1yBDmkMnkffv2gaaj1IsUCoX6aAoLC+Pg4MjMzGxvb7ewsIiPj0exikwm+/j4aGpq5ufnv3v3bvv27RwcHKAetL293dXVlYeHR0pKKjw8nEwmFxYWCgsLt7e3o0vJT02zyGTylStXWFlZL1y4AK5MTU3p6uq6urqCj62trRs3bhQUFBQRETE0NMRyuQ9EF9asWePk5AT+e3p6Oisra/fu3SYmJmFhYaAwKyIigo+PT1RU1MnJCaQp2DQ4OJiRkZGYmAimE545cwaPx4+NjVEolJCQEH19fRkZGSsrK5BQkkiksbEx8MguKCiQkJCAO+//KXNzcwcPHmRnZwcpLEi8+Pn5L1++DD6WlJQYGRnx8/OLiYlt3rx5KYxsg/5VMzMzKioqwcHB4OPo6GhaWpqDg8OaNWtiY2MnJiYoFIq/vz8HB4eoqKi3tzdomI4RMzMzT58+jYuLAwcJS0pKlJSUwGp6dnb26tWr9fT05OXlqYsp4+Pj1BG3+vr6C/ZDl4KfvWlIoVCOHj3KwsKSkZExOzvr5ua2oD53enq6rKysqKgItvaB/n0+Pj58fHx3797NysrC4/EsLCw6Ojrm5uYIghw8eBBsF5aXlz979gyzM+1RFP3jjz8MDQ2XL1+OIIi4uHh+fn5NTU19fT2Kor6+voaGhh0dHYWFhQiC7N+/n7o5+OnTp/3798vKysbGxmKqPxC9Gxsbs7Oz4+Pjq6mpGRgYsLa2NjU1nf+8IhKJxcXFZWVldNQNBPqZyGSyi4vLihUrcnJy0tLScDgcIyMjDoczNTVlYGA4d+4c+LeysLCwtLQUUzUMvb29jo6OfHx8rKysXFxcf//73zs7O/Pz81EUTU9Pl5OTKygo6O/vFxAQMDAwoHYoJJFIwcHBysrK3t7eWB5uvXhK4KempggEgqCgoJmZma6uLiwOhX6c/v5+S0tLZmZmHh4eHA6XnZ09OztLIpFOnTolKCgIMhWMu337tqSkpKenZ39/f1NTk7a2toqKCqjnePz4saqqKnhLmZqakpaW5uHhAY888BIZHh4Oq4J+hIGBAV1dXQUFBUNDQwsLCzoadglhREtLi5GRESMjo4CAgKWlZX5+/txXnp6efHx82MxFamtrdXR01q9f39DQMDAwALqkgn6WXV1dioqK2dnZ4E4CgQCOhqBfUSiUGzduUH+61NCmocPAwIC+vj6CINT2ZRD0gxCJxPz8/BcvXsyv83vy5Ak/P39VVRWKbY8fP2ZjY5t/TjAnJ4eZmRmcCwkICFi7di24np+fb2lp+eLFC9j35Oeor6+XlJQUFBSkr4ZGEHZ8/vw5Nze3srJyft1kWloaAwMDBjdz3r9/LykpaWxsTF2j/fLlCysra1hYGIqiz549k5GRAd+Fnp6etWvXpqenY6p3Bg0tQ2hBUFAwJSVFRkYmODiYSCTSJAZoieDl5cXj8SYmJhwcHOAKmGJhYmKipqaGYJuOjo6GhkZBQcGHDx/AlZGREV5eXmFhYQRB8Hh8XV2dv79/cnLyoUOHCASCiYkJ2FuEfjR1dfVr165RKJQLFy6QSCRahwPRHyEhIWtra0NDQxYWFnBldHQ0NjbWxcWFj48PwRgxMTHwwKmoqABXxsbGmJiYxMXFQRtCCoUSEBCQkZGxffv2VatWEQgE8COIll3gi4qKWFlZ9+zZs7inc0PYQaFQ2tvbt27dqqGh0draitKDN2/erFy5ct26dUNDQ2VlZVJSUgEBAaDdF4VCiY2NXbFihbS0dEJCAqZqOJYIMHUuJCQEVr9B/w4ymVxXV4fH43E4XE9PD4pJw8PDlpaWoqKiDQ0N3d3dpqam1tbW1OXz4uJiLS0tAQEBX19fak8TiPbDdq5du7Z8+fLc3FzahgEtBd3d3QQCQVhYeOvWrfS10VNcXLx8+XIwiMPPz2/BRKPJyUnYE4uG/P39BQUFGxoaaB0IRK/evHmzefNmISEhZ2fnb9toYcqnT59UVVXV1NS0tbU3bdq0INqZmRnYg+lbDP9ItWiHRCJVVlZqamrCnQ7o39Tb2xsbG/v69WtJScnjx49LS0svuGFkZOTKlSvKysq2trbMzMwIXUlOTv711183bNiQk5ND61ig/2JycrKmpmb+1g8Ezffhw4eoqKi2tjYVFZUjR46IiYktuKG3tzcpKcnAwACPxzMwMCDY9vLlSxsbG3Z29qqqqm//LNC3aJxmQdB/RGdnJ4FAWL58+erVq6uqqt6/fx8fH29paYksIsHBwWFhYfHx8S4uLrSOBYKg/5X6+nonJydFRUVVVdVnz56NjY3dvHlTV1cXoWePHj3atWuXq6trZGTksmW0qfCmI0y0DgCC/mWg352QkBD4iKJoaGiosLDwnTt32NjYiouLraysmpubF1ma5e/v//bt28OHD0tJSa1duxb7b70QtNSAw3fc3NzgI5lMPn36tJGRUWJiIoIgSkpKbm5ubW1t9J5m2draBgYG+vj4SEtLe3t7MzHBROIvfWcjEYKw7fTp04aGhtSygP7+fm1t7Xv37oHj0GB4FplMplAoC8qY6N3AwICpqamlpSU8NQJBGOTp6WllZUVteTA4OCgkJFRRUYGiaHx8vKqqalZWFpjYi9K/gwcPSkpKzu8uDn0X3DSE6E9LS4u1tbWurm56ejozM/Pw8DAej9+yZQsPD09cXFxoaKitrS2CIImJiby8vI6Ojsgi0tHRMT4+rqGhQetAIAhaqKKiws7OjkAgREdHg3pQeXn5yMjI9+/fZ2dnx8bG4nA4cDTV2Nh47dq1CD0bHR1taGgwMDCAq1n/g+9nXxCEbeXl5Xx8fMeOHQPrVSdPnkQQBIfDNTc3gxsqKiokJCTy8vJoHSkEQUvIo0ePODk5w8PDwUc3NzdGRkY8Hv/hwwdwJTMzU0ZGprq6mqZhQj8PLF6D6JKRkVFsbGxUVFRKSgqCIF5eXlpaWkQisaenZ3h4ODk5effu3YcOHcLj8bSOFIKgJcTGxubMmTNBQUEPHjxAEOTQoUPS0tJEIrGvr+/Lly/R0dHHjh3z9/fX09OjdaTQTwI3DSE6FhYWFhISkpmZuX79+ra2Nj8/v/LycgYGBmlp6QMHDri6utI6QAiClqLff/89NTX18ePHBgYGr1+/PnbsWH19PTMzs7S09NGjR+3s7GgdIPTzwDQLwrSurq729nZqEcP9+/czMzPZ2dn37dtnYGAwMzPj6emZn5+fl5enrq5OIpFevXo1PT2tpqbGz89P69ghCFq0Ojo6uru7zczMEAShUCipqal5eXlCQkIHDhxQU1ObmppycHB49+5dYWGhuLj41NTUn3/+iaKouro69RwitETATUMI0168eGFra5ubm4sgSERExPHjx6enp5ubm/F4/MWLF1lZWaOiopSUlHbv3t3b28vExKSvr29mZgZzLAiCfqisrKxt27aBAX8nT54MCwujUCgVFRVmZmY3b95kZ2dPSEjg5OR0dnYmEons7Ow4HM7IyAjmWEvRT6wDg6B/2eTk5IEDB8TFxYuLi3E4XFFREYqi09PTZ8+eZWNjS09PR1H0w4cPioqK27dvhzNnIAj6OcbHxzdt2rRq1aqcnBxjY+PGxkYw9e/333/n4uIqLCxEUbS+vl5ERMTb25tMJtM6Xohm4KYhhHWTk5P29vYNDQ3q6uq5ubnUpsOurq51dXWFhYV8fHy1tbWtra07duyATTshCPo5ent7HRwcmpub7e3tk5KSwEUKhbJp06bx8fHCwkJGRsaioqKJiQnQYgZammCaBdGBrq6ujRs3fvnypaysTFZWFlysr6//5ZdfsrKy1qxZQ+sAIQhaipqamtavX8/CwlJfX8/JyQku5ubmEgiExsZGSUlJWgcI0R6szYLogKSkZGpqKoVCCQ0NpVAo4CIHBwfzV7SODoKgJUpVVfX69esDAwNhYWHUi2xfwWF/EAB/DyAMKSoqamhoAAvviYmJGzdu3LZtW3l5OYIgGhoasbGxt2/f9vb2/vjxY0dHh4+Pj4GBgZaWFq2jhiBokXvw4EFXVxeoYYiOjraysnJycmpsbEQQxNzc/NKlSxEREQEBAf39/U1NTUFBQdbW1mJiYrSOGsIEmGZBmEAmk6OiorZu3drU1DQxMbF///7o6GhVVVUWFhZ7e/vMzEwEQezt7S9cuBAXF2diYuLq6iooKJiQkMDBwUHr2CEIWrRmZ2cDAgLc3NxaWlpGRkZ27tx5/fp1HR2d6enp9evXFxUVIQiyd+9eX1/fsLAwHA7n5eWlp6cXFRUFV7Ogf6Jd9T0E/dPMzIyPj4+IiEhaWhqYDG1gYNDZ2Ymi6N27dzk5OQUFBSsrK1EUJZPJ3t7ecnJyb9++pXXUEAQtckNDQ/v27Vu5cuWjR49QFHV3dzc3N+/v7wejoBEEoT6LJiYmHB0dcThcR0cHraOGsAWmWRCN9fT02NraLlu27OHDhyiKzs3NeXl5lZeXoyh65coVFRWV+/fvW1lZKSgotLe3gyPTb968oXXUEAQtcu/evTMzM2NiYqqtrQUpl6urK3gKBQQE6OrqPnr0aPXq1fr6+iDxIhKJ9fX1tI4awhyYZkG09ObNG21tbQ0NDW5ubm9vbwqFAha3SCRSbm6ukpJSRUUFiqLZ2dmgBmJgYIDWIUMQtPiVlpau+oqbm/vs2bPg4tjYGIqiKSkpGhoaTU1NKIpGR0cjCLJt27aZmRlahwxhFNw8hmimqKgIj8erqamVlJRERkbGx8eHh4cjCMLCwsLIyBgTE+Pg4IDD4RAEmZubA3fC/iMQBP1oGRkZ9vb25ubm1dXVfn5+p06dunr1KoIgXFxc09PTKSkprq6uKioqCIIwMjJaWFgoKyuTyWRaRw1hFBOtA4CWrrGxMQ8PD19fX1ZWVhcXl7dv3wYGBsrKyjo4OKAoysvLW1VVNTo6Ojg4GBkZ6e7u7uzsTOuQIQha/MbHx0+dOuXl5cXIyOjr69va2nrkyBF5efm1a9cuW7aMhYXljz/+mJ6ebmlpSUpKCgsLs7KyonXIEHbB9qQQVszOzu7cuTP/KxwOV11dTSAQxsbGmJmZHRwczp8/z8bGRusYIQhacoaGhsAc6Nzc3FWrVhUUFOzZs4fxq7179wYFBdE6QAjTYJoFYcjAwICNjc3Q0FBeXp68vHxLS0tpaamEhAQej2digiuvEATRxvv37y0tLfn5+fPy8gQEBGpqampra5WVlU1NTWHjBuivwTQLwpa2trZ169bJyspmZWUJCAjQOhwIgqB/qKys3LBhw7p165KTk3l5eWkdDkQ3YBoOYYuCgkJycnJ9ff2tW7doHQsEQdA/4XC4hISEnJycgoICWscC0RO4mgVhUVVVlYKCAlzNgiAIO1AUffnypYqKyvLly2kdC0Q3YJoFQRAEQRD0Q8BNQwiCIAiCoB8CplkQBEEQBEE/BEyzIAiCIAiCkB/h/wGFqxOmuXFlswAAAABJRU5ErkJggg==\" /><br /><h4>Caption</h4>Figure 4: Contributions of PDF backend and AI models to the conversion time of a page (in seconds per page). Lower is better. Left: Ranges of time contributions for each model to pages it was applied on (i.e., OCR was applied only on pages with bitmaps, table structure was applied only on pages with tables). Right: Average time contribution to a page in the benchmark dataset (factoring in zero-time contribution for OCR and table structure models on pages without bitmaps or tables) .<br /><h4>Annotations (HuggingFaceTB/SmolVLM-256M-Instruct)</h4>bar chart with different colored bars representing different data points.<br />\n",
+       "<hr /><h3>Picture <code>#/pictures/4</code></h3><img src=\"data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAAXkAAAF4CAIAAAA+PR7PAABKO0lEQVR4nO3dB1gU19oH8DOzld4FKyAqqKBgARQRbEFEDaKiGFEBFVGjqLEllmBI7MaCFY1dVOyxIqixEGyoEAsgKL33he0z3wPjtxcRUZdlYZf3d31y2dkpZ7b895wzM2cwkiQRAAA0MryxNwAAAAghelMXAPF4PJFI1NSlAADIHo7jqqqq1N9Yk7ehfHx8rl692rZtW4IgmrYkAABZwXG8vLycRqPFxsZScdP09Ro+n+/i4jJjxoymLggAQJYePnx48OBBDMOoh02fNTQarUuXLo6Ojk1dEACALInF4tOnTzevvmHorwFA+QgEgppdNM0iawAASg+yBgAgD03fXwNAc0MQRGVlpVAobPKjtAoBx3EWi6WiolL/bJA1AHyEIIjc3NzS0lKsWlMXRwFQiaxXrZ5XDLIGgI9wOJySkpK2bduqq6tD1nwNkiSLiooKCwvV1NTqqd1A1gDwET6fz2QyNTU1m7ogCgPDMB0dnfz8fKFQWE/WQN8wAB8hSZJGo0FPzTeh2pv1v2iQNQAAeYA2FACKRCwWv3jxIjc3V0dHx9rams1m13z27du3ycnJbDa7S5curVu3/txKXr16lZ6eTqfTO3To0LlzZ6rlmJqayuPxEEJMJtPU1JTFYiGEKioq0tLSTE1NJRvicrlpaWlUf9Y3lRyyBoAvyXiB7u5F9KrvngyI+GigP2rXU4pFi4uLlyxZcuvWLT09veLi4q5du+7Zs6dNmzZUBgUFBZ05c4YkSS6XO3z48F27duF47YZLcnLy6tWrHz16xGQycRwnCMLV1fW3337Lzs728fHJzc1lMBg4jrdq1WrlypWDBw+Oj4+fMWPGqVOnunXrRq3h7du3Pj4+W7duHTBgwDcVHrKmeSvLRWmxCKd984KEGGm3ke4DDWoryUKx5xDrw9gIDcWvRD1GSffWXLhw4fjx43fu3OnRo0dKSoqbm9uWLVs2bdqEENq0adPhw4f37Nnj7OzM4/GysrI+7T0pLCycMGECg8E4dOiQtbU1SZLPnj27cOFCaWmpWCzOzMz8+eefPT09MzIyAgMDf/zxx3/++UckEqWlpQkEgv8Vn89PT0+nakDyyxqhUCgQCHAcZ7PZtY4OisXixMREHo9nbGysra39ab6Cr5IWiw5NQ8xv/5QLucjGA03a1SilamlwGmKqIMYXzlX7WiT5xR+P/fv3p6SkBAcH4zjO5XJXr15taWk5ZcqU9PR0Y2NjW1tbhFC3aomJiVSIhIWFBQYGurq6isViFRUVHR2dT1d78uTJjIyMqKio7t27U1MGDBjg4OBAEERJSQmdTtf+f6tXr3Z1dU1MTGQwGHQ6vea3G8OwWlO+kvQRsHXrVgcHhzZt2owaNaq0tLTmU0+ePBk+fPjo0aN9fX2dnJyePn0q9VZauqpPuaqU/2RV5wdy17t372PHju3YsQMhtH79+rNnzzo4OCCEXFxcxGLx4cOHX758efbs2aysrClTpiCEXr58mZmZqaam5uXl5ezsvGzZstTU1FrrJAji77//7tWrlyRoKBiGSY670ekfKh85OTl0Ol1FRUWGx+OkrNcQBIFh2JQpU+7fv5+cnFyzQJmZmT/88IOTk9OWLVvU1dUzMjI6dOggq+IC0BLY2Nhs3rx50aJFZWVlR44cCQkJMTMzQwjZ2dn5+PjMmjWrY8eO6enpnp6e48aNq2pql5UVFRVt27bNx8dnzJgx69ati42NDQsL09PTk6yTz+cXFxf37PnZthtJkpcvXy4oKMjMzDx06JCDg0PXrl0fP37cxFmD4/j8+fOpburk5OSaT+3fv19NTS0kJITJZCKETE1N618VnJoJwKfGjx9/7969VatW/frrryNGjKAmnjp1KjQ09ODBg4MGDYqNjV2yZMnatWuXL19O9fJOmjTpp59+oppXffv2ffTokaurq2SFNBoNx/HKysp6vobPnz8vLCxECPn5+c2ePZvNZn9utEwp6jsN7RsWCoU1H4pEoujo6C5duuzdu/f27dsaGhozZ86kqn818fl8kUhE7R61Bjh1qm4k2ZAkhldVcV+0ioqKhIQEOp2ek5NDEASVJsePH7e3t584cSJCyNXV9Z9//jlz5sz8+fMNDAz09fWtrKyoZbt06YLjeE5OTs0VMplMCwuLly9fVlZWSsYAliBJEsOwZcuWeXp61pyO4ziGYTUTSigU8ng86oj4pyup+erVeiVlfByqsrKSw+HExMTweLyhQ4c+evTI3d395MmTQ4YMqTnb0qVLb968SfUoJycnd+rUicPhSNGzrdxIBptdXq4pXb0Pw/h8fmlpBSbkyr5kSo3D4ZAkKRQKP9S4GQxcLP72A4H1EYvFVbWFj3+nJXAcJ0ny559/LikpuXr16syZM3fs2DF//nyxWEyn00tKSqhcoA6BUxlkZmbWvn37J0+ejB49GiH0+vVrkiQNDAxq1gbodPoPP/zg4eFx4sSJ6dOnSzb333//dejQgSAIkiTFYjFVY5B037Rv315XVzcyMrJfv37U/A8fPhSJRF26dCEIgpqf6lQRi8WlpaWSZdlsdq1uXBlnDYZhAoHA0NAwNDSU2tVBgwYdPHhw8ODBNdtKvr6+I0eOpNGq3sE//vgDx3EVFRWqzQX+B6fRVFSrDltIgSQZDIaWGhsRDNkXTKkJhUI+n//xoRYSCbhIVo19ARdHZNVBmf/viP3UkSNHTpw4cfHixf79+69Zs2bx4sW9evVydHT08vLy9fUNDAx0dnaOjY09ffr00qVLqXPqZsyY8ccff2hoaBgaGoaEhDg5OVHj6kq6exFCzs7O8+bNW7FixYMHDxwdHQmCuHv3bk5OzsGDB+l0Op/Pp1pM1BeTYmxsPGnSpJCQED6fb2Vl9fLlywMHDsydO9fAwIA6IEXNRtW81NTUNDU1qayh0WhqamqNmDUaGhra2tr6+vpU0FAH1S5fviwSiRiM/33oe/ToIfn78OHDVKFrvijgAyajQaOKMOhwCtW3YjAYAoHgowEldNqiXh4yPJcP02lb9cdnwksgECQkJGzbtq1///4IIW9v79zc3GfPnjk6Oo4fP55Opx8/fnzfvn1sNnvTpk0+Pj7UUgEBATo6OidPnhQIBIMHD16wYIGWllat/lA6nR4cHDxkyJAjR46Eh4fjOG5sbPz777+3adMmJydn8uTJXbp0+bQLddWqVR07drx48eKTJ09UVFTWrl3r5eVV6ywW6uViVpNMrFV7aOgHkU6nUyPlSKbY2treuHFD0iZ89eqViYlJzaSsRVINA3VoHn0HLb2/pl1PeZ6pxGQy//jjj5pTqB5fyphqIpHo09/midUkLazPGVSNqolIJrZu3XrdunV1zo/j+JRqdW60npdOZv01t2/ffvny5Z07d9LS0rZu3dquXbvRo0dra2vPnDnz9OnTCxcu9PDwePr0aURExKlTp+BcPgBkqJ7v/Fce2JXiK9nAlof0EZCYmHj9+nV1dXUnJ6eYmJjo6Ggut6ob0tjY+PTp0xwOZ+XKlXfv3j169Ojw4cMbUkQAgBKQPqhmVqszUG1sbI4dO8blcplMZj2tJwBAyyF91nyxqvbFsY4BAC0HdKMAAOQBsgYAIA+QNQAAeYCsAUCBiUQiRTlDDU4qBeALMioyYvJikKzGIyCRfSv7dmrt6pklKSlp69atbdq0mT9/vmRY38jIyPDw8H79+k2bNo0kSeoihtTUVDabPWzYMD8/v08HGE5NTd22bZu6unpgYKCuri41MSYm5tChQ1ZWVgEBAfI88Q2yBoAvuJ933+u6F5LVhWVCFDY8bKJp1bXan5OZmbl7924VFRVHR8eBAwdSp9eHhIRcvHixrKxs2rRpBEGkpKRYWVmNGTOmuLh406ZNT58+PX36dM0rgRBCubm5+/fv53A4dnZ2bm5u1MTdu3cfOXJk2LBhs2bNQnIEWQPAF9AxelXQ0GW6wnphGGZgYGBjY3P27Fkqa168eJGQkODs7Eyda0Kj0VauXCmZv02bNuPGjcvJyWnfvn3N9eA4rqen169fv1OnTo0YMQLDsMTExOfPnw8bNkxSo8nJyXnx4kVWVhabzbazs+vYsSNCiMfjPXjwoGfPnvr6+tQAF48fP+7evbvkOkcpQH8NAM0OWX2Z/pgxY27fvk2NzHDt2jVLS0tTU9NPB68Si8XUTVQ+vVcnSZI4jo8cOTI2NjYrK4tqiBkZGVlZWYnFYiq29uzZs2bNmuvXr+/cudPNze327dvUsnv37p05cybVGbRu3brFixc3sGMIsgaA5kggEPTr18/AwODvv/8mCOLs2bNeXl5sNrvmBY1RUVHjx48fNmzY5s2bQ0NDqQu7P11Pnz59zMzMwsPDEUJhYWGTJk1SVVWlxrUiSXLOnDn37t07derU/fv3x4wZs3btWrFYzGaz//jjj5cvX27evPnixYv79u3bsGGDkZFRQ/YI2lAANEcEQejp6Q0ZMuTy5ctGRkY0Gs3BweHatWs15zE0NHRwcMjJySkpKYmMjBw8ePCnl0eSJKmqqurm5nbp0iU7O7uysjJnZ+eEhATqWQzDNDQ0zp8///TpU7FY/Pbt21evXvH5fFVV1U6dOm3btm369OkCgWDFihWDBg1q4B5B1gDQTAkEgh9++CE8PHzx4sXDhg0zNDSs1YqxrIYQGjJkiKen56hRo6jxsT5dz/jx4/fs2fPjjz/279/f2NiYGqwPwzCRSOTt7Z2Wlvbdd9/p6+sXFRVJBtZDCPXr14/JZBYUFIwZM6bhuwNtKACaKYIgjI2Nzc3N4+Pjvby86pnTzMxMS0srPT39c+vR0dGxt7ePjY0dP368ZDqO42/evImOjt6zZ89vv/22cOFCJycnPp8vudTx559/pqpOS5YsqTWyuBQgawD4ArL6fzL8R1b93xdQAwAjhLZs2fLgwQMbG5uag4dXVlZeu3bt3bt3hYWFSUlJ27dv53A4dVZqJH3Jv/766/37952dnWuuh8FgCIXC5ORkoVD45s2b7du3S45P/fXXXxcuXAgNDT18+HBMTMzmzZsb+DJCGwqAL2BgDHWmOpLV4Ch41Qrrn4UarJeqX7SpRk1nsVhUM0ogECxZsoROp6upqZWUlIhEot27d9c64E3VXNTU1Kj4aFVNsh4VFRWCIDp37jxhwoTFixf/9ddfAoHAwsKitLQUx/G3b99u2LBh1apVVBtt06ZNS5cuHTx4MHXLTelA1gDwBSM7jMyelC3D84bZdHb9s9jZ2T19+lRypq/Ehg0bqPqItrZ2dHR0cnJybm6uvr5+9+7d2ew61tmjR4/o6Ghtbe1a05ctWyYSiagM2rFjh7+/f3Z2drdu3YyMjIqKithsduvWrf/55x9DQ0Nq/rFjxzo6Ota5ia8HWQPAF9Axujrjw4UC8sFkMiV1kJpqnkGjoaFhbW1d/3oYDEadZ99paGjU2ceMEKLmV6tWc546y/NNoL8GACAPkDUAAHmArAEAyANkDQBAHiBrAADyAFkDAJCHBh3zzsrKyszMVFVVNTc3//SiLw6HEx8f37Zt2w4dOjSskACAlpo1JEn+8ssvN27cyMrKsrS0DA8P//R8oXXr1oWEhAQGBv7666+yKCoATUNEIJ5Ilitk0xG93hZFeXl5UlKShYWFqqpqnTNkZGRkZ2ebm5t/OmYNhSCIN2/ePHz4UCQSde7cuXfv3tQ5NUKhMCkpqaSkRCwWq6qqmpmZUd9cLpebmJjYoUMHHR0dag0CgSAhIcHIyKgh42PJpl7TtWtXGxub27dvP3r06NPbrUdGRl6/fl1XV7ekpKTBhQSgKV1+i7zDEWLKaHUCdHQ8cu9S3yzPnj3z9PSMjIyUnGJXU35+voeHR1xc3PXr16nrm2p5+/ZtYGDgq1evzMzMGAxGfn5+aWnptm3bXF1dS0tL/fz8srOz27VrV1FRUVhYuGzZslmzZr179278+PGbNm0aPXo0tZLs7OzJkyfPmzfPz8+vKbMGwzBvb29qEObHjx/XeragoCA4OHjBggVHjhz5dBixWuQ5ujIAUhASiMOvvmxSJgRVK6wfQRB8Pv/Tn3DKhg0bdHR02Gx2nQPl5eXl+fj4IIROnTrVs2dPJpOZlZV1/fr13NxcqkXC4/F++OGHBQsWlJeX79q1a8WKFc7OznQ6XSAQ1Py2kiRZa0oDNfQahTqLsmHDBmNj4wkTJoSGhta5VHp6OnWJF4ZhRUVFJiYmRLUGFkbJkBiOi8VSX/FHEIRYTGKkYtzQo/kQi8WSy6Crf1arUwbDZHY9FFb1Pa7+Mn/meQwjSZL6L/Wdr/lURETE/fv3165dO27cOOorU2uGqKioR48excfHd+nyoe7Upk0bX19fycwYhmlpaelXW7x48aZNm16/fm1tbV1zi/WUoU7UKyYWi0WiD61NvOrDK27c66Hu3bt369at06dPU73Fdd72e926dbdu3cJxnEajpaWlWVtbV1RU8Hg8mRdGoZEMNruiQvNL902vG4YJhcLS8gpMyJV9yZRaZWUl9bWhPrp0OiIIDGGyusobIYz6hSY/N3ovnU6ncoFKPck3lkaj5ebmrlmzZt68eSYmJkKhUDJbzcUjIiJ69uxpbGxMLU61G6h9odZWM0nj4uJwHFdXV6eGyJKskE6nU3PWuYlPUXWF8vJyyVAYbDa7vLz8o/1CMlVSUrJy5UovLy8jI6Pi4mKRSMTn87lcroqKSs3ZgoODeTwehmFMJtPf35/a2891g7VcOI6pq3/2569+JMlkMvW01BDx0SsP6odhmFgs5nK5NBpN8jNJw2XXgEJVq6JVf/9pn48vKiCoMtD+fz4MwzZv3mxiYuLl5ZWSkkLNIPmvpPC5ubkmJiYMBoNayZ49e+Li4phMZo8ePXx9fWk0Go7jkZGRVF/H4cOHhw8fbmtrm52djWGYZLuS/9acUg9qWU1NTS0tLSprcByvdYWnjLMmISHh1atXQqHwypUrYrH4v//+e/fuXWVlZWhoKIvFkswm6etGCKmoqGDVvrg/LVEDOrOqXlIMq+8TDepCNe0pHybJqvUkUb3meiqs1KZr/pdqMVy9evXo0aNcLreyshIhxOfzBQIBk/m/Xmscx1VVVcvLyyVLqaqq6urqnj59Oj4+3tfXl9o7aoQtBoMRHBw8atQoHR2djIyMT7crWUmdrZNaBabipmb3a61vdEOzhopPSZXE3Nz8+PHjFRUVVG1t9erVxsbGU6dO/fTsG4kvNgUBaJmwj7/hDx48SE9P9/X1pfp3ORyOv79/QEDAL7/8UnMRR0fHoKCg0tJS6mD2lClTqFPhJCOEEgQxYcKEpUuX1lw5i8Wi0WjU/WEoVKJJ7rrZcNJnTVhY2M2bN589e/bu3TtfX19TU9N58+a1atVq2LBhknm2bt1qZmY2ZMgQGZUWgJbLy8urT58+VAdKVlbW3Llz58yZ4+7uXmu2oUOHrl27duPGjUFBQZLfeGG1elbevn17IyOjiIiIqVOnUlOePn2an59vb2/f9FlDp9NZLJaTk9PgwYO5XC6TyawVw2KxeNKkSZLhCwFQUCKi6kC1zAiqV1gvkiTLy8uXLVtmYGBAddCam5svXbrU2NiYmiEtLU0kEvXr169r1661lu3evfvOnTsXLVp09+5dNzc3NTW1t2/f3rp1a+LEqrv6UnUiydEiCRUVlYULF86ZM2fChAnOzs4pKSlHjx6dM2cOdRvMJs6a8dXqmYFGo82ePVvq9QPQTAxoj8K9ZXftIIHsa48LXJuZmdnatWs5HM6HJQiidevW1OEhaoqGhsYff/xhYmJS5+Jjx47t2rXrzZs3Hz16JBKJTE1NQ0NDqRs8qamp/fTTT58mFELIw8OjdevWf//9d1RUlL6+/t69e11cXJDswBigAHxBOw00rptct9ihQ4effvqpnhl0dHQWLlxYzwzdqn06XVVV1dfX93NL9auGGgecswsAkAfIGgCAPEDWAADkAbIGACAPkDUAfATDMJFI9MUzZUFN1GVQ9b9ocBwKgI+oqqoWFhbm5eWpq6tD4nwNkiSLi4vpdHr9N8aErAHgI6qqqgYGBgUFBTDM21eiajRGRkY1r8z6FGQNAB/BMExPT09LS0sgEMDFel8Dx3Emk/nFa6chawCoA71aU5dCqUDfMABAHiBrAADyAFkDAJAHyBoAgDxA1gAA5AGyBgAgD5A1AAB5gKwBAMgDZA0AQB4gawAA8gBZAwCQB8gaAIA8QNYAAORB+itZBQJBVlbW69ev1dXV7e3tGQwGNb2iouL+/fuxsbE4jg8aNMjW1lZ2pQUAtLCsIUly+vTpN2/eFIvFnTp1unLlio6ODjXdz8/v5cuXpqamIpFow4YNc+bMWbFiRf2D6AAAlJ709ZoZM2b4+/uHh4c/ePBAMpEgiNmzZ7dr1466NWdISMiqVatGjRrVt29fGRUYANCS+mswDHN0dHRwcDA0NKw5nUajDRw4UHIPYHd3dy6Xm5eXV18JcOgzAkD5NXTkMbFYXM+zZ86cMTIy6tKlS63pL1++LCgowHGcwWDk5OSYmJiQJCkUChtYGGVDY+AikdTvEEEQIoJEInhVQRNgMBi1vtGNOMphZGTk+vXrV69e3blz51pPHT58+N69eziO02i0N2/e2NraVlZWcrncxiuMQmKosLhcDemG8q++8UgZh4sElbIvGABfoqKiUllZKY+sefjwoV81f3//T5/95ZdfeDwehmE0Gm3WrFk0Gk1NTU1FRaWRCqOoMBypqSHphtcmSQaDoaupioj6bqMBQCPBcVxDQ0OWWUPdQKfWbXRiYmK8vLy8vb2Dg4PrXEqrGvW3JGKg46YODXhNMOpdgVcVNJFa32jpP4gkSRLVqF4b6g+EUGxs7OTJk0ePHr169WqSJMVicf03voDbYgDQEkhfr9m5c+elS5cSEhKys7M9PDzMzMz++OOPVq1aBQYGJicnx8XFjR49uqp7UiQKCgoaMGCATIsNAGgxWWNtbU3dQwfHcaFQqKmpqaqqihBaunTptGnTRCIRVWEhSbJt27YyLTMAoCVlzYBqn053c3NrWJEAAEoIOg4BAPIAWQMAkAfIGgCAPEDWAADkAbIGACAPkDUAAHmArAEAyANkDQBAHiBrAADyAFkDAJAHyBoAgDxA1gAA5AGyBgAgD5A1AAB5gKwBAMgDZA0AQB4gawAA8gBZAwCQB8gaAIA8QNYAAOQBsgYAIA+QNQAAeYCsAQDI/f5QKSkp6enpnTp1atu2bUFBgbq6Opv92TvPp6amvnnzJj09XVdX183NjcViSZ7KzMw8efJkYmJinz59xo8fr62t3ch7AQBQkKwRCAR//PHH2bNn09PT169f7+/vHxYWxuFwli9fXudiJEkGBQVdunSJy+V27tzZ2dlZkjX5+fljx46l0WguLi7btm27devWvn37NDQ05LhTAIDm2oY6efLk0aNHt27dOmnSpMrKSoSQsbHx9evXBQLB55ZcunRpcnLykiVLGAwGhmGS6bt27SotLQ0PD1+1atWFCxeuXLly48YNuewLAKB5Zw1JkleuXAkMDBwyZAh1T26EUJs2bYRC4eeyBsMwc3NzLS0tOv2jVhhJktHR0ba2tm3atEEIderUqW/fvvfv36+nBLXWAD5SI8QBUCw1qyAf9dfQaLSacxQXFxMEIZn4OSRJ1nxYXFxcUFDg6OgomWJhYfHff/+JxeKaq7p3715GRga1obdv37Zv314gEIjF4gbvnXLBaTQ+nynt0mKxWMAXIAJeVdAEaDQaj8ernTUYhg0fPnzLli2urq4IIYIgCgsLN2zY0L9//3r6huskFArFYnHNpdhsNo/HqxVJ165d++effxgMBo1GS0hIcHJyEgqFtUoGSDqbxeczpazaYGKxuIIvwoRcmRcMgC+ivvh11GvGjx9///59BwcHLperoaGxYcOGrl27zps3r1Yt6Gs2wGAwysvLJVPKy8vV1dVx/KOD68HBwQRBUCufOnUqnU5Xq/ZN22oRNDTQxzH91Ugmk6mvqYrQh0YxAHKmpaVVR9aoq6vv2rXrn3/+efbsWWVlZdeuXYcMGWJgYPDF1eE4jmGYpH2kqanZqlWrxMREyQz//fffwIEDa2UNXo36+1vjDACgiP7XX8Nisb6r9pVLVlZWCoXCiooKoVBYWFhIBRaO466urhs2bIiLi+vRo8e9e/fi4+NXr17daOUHAChU1lythmGYSCSijg3RaDQMw5ydnb/77jsVFZVPl9y7d+/58+fT09OLi4u9vLxMTU03bdrUtm3badOmRUVFTZ48uVu3bk+ePJk+fbqTk5Pc9wsA0CyzpqSk5NChQ4aGhhYWFhiGJSYmZmVlDRgw4OrVq3/99depU6c+7SQeOnSoqakpk8mkVR0t4aupqVHnB6urq58+ffratWsvX76cNWuWk5MTtJIAAB+yRlNT093dPTg42MTEBCGUnp6+atWq0aNHW1hYjB079saNG99//32tJa2q1blSBoMxulrjlx8AoBg+dNAeOnTIxcWFChqEUPv27d3c3A4ePEh1Ej958qRJCwkAUJasUVFRefbsWc0n4uLiqKNLBEEwGIwmKh4AQLnaUL6+vuPGjauoqBg0aBCO4/fu3Tt27NiJEycEAkFRUZGLi0tTlxMAoBRZ4+zsfOLEiZ07dwYGBpIk2atXL6pVJRKJgoKCOnTo0NTlBAAoRdZgGOZSTSgUkmTVKafUdCaT2aVLlyYtIQBAGXx0jXVBNbFYjGEYSZKqqqomJiZwxBoAIMvza1atWnX27NnKyko1NbWCggI6nT5p0qQ9e/ZA1gAAZHYc6vTp07du3QoJCbGwsNi+ffvJkye7du3at2/fWtcxAQCAdD5ESUREREBAwJgxYzQ0NCwtLd3d3VesWHH16lWhUCjligEA4NOsIQhCR0eHJEkMw7KysqjT+TIzM/l8fs25AQCgQVljaWl59+5dDMMsLS3Xr19/9erVLVu2aGtrf+tYWQAAUF/WTJ482cnJiSTJhQsXMhiMSZMmvXnzJigoCAYDBgDIxIco6VINIdS2bdtLly7x+XxqWAnZbAQA0OL9r9oiEonu3Lnz4MEDoVBobW09fPhwdXX1Ji0bAEDp2lAFBQVjxozx8fG5detWdHT0ypUr7e3t4+Limrp4AADlypp9+/alp6efP3/+xo0bERERly9ftrKyWrVqFdxHBQAgy3vRxcTEBAYG9unTh81m0+l0MzOzRYsWZWZmwn1UAAAyyxoMw3r27JmSklLzibS0NDMzM7iPCgBAln3DLi4uPj4+QqFw4MCBNBrt9evXu3fv9vb2vnXrFkmSHTt2NDU1lc0GAQAtOWsePXpUUFCwcePGkJAQOp1eXl6upqYWEhKydetWkiSXLl26ePHipi4qAEDxs2bevHn+/v7k/6MuuSQIgnqWxWI1aSEBAAqPPnfuXHNz89GjR7dv3x6u6gYANBK6sbHx1atX9+zZY2hoOHLkyH79+vXs2VNVFW4CDQCQJfrixYsXLVoUHx//+PHjy5cvh4aGtmnTxtra+vvvv+/du7d0x6EuXboUFhZWUVGhp6fn5+c3YMAAmZYZAKB4qhpNOI737Nlz+vTp58+fv3v3rp+fX1FR0ZIlS2xtbVesWFFeXv5Nazxz5oyPj4+urq67u7tIJPLw8IiOjm608gMAFMNHl3FjGGZgYDCpWk5OzvPnzxMTE3k8noaGxtev8cSJEzY2Njt37kQITZs2zczMLCoqqn///o1QeACAwvjQGfz8+fOjR4+SJCl54u3btzQabd68eQYGBt+0xg4dOpSXl1ODbBUXFwuFwtatW9czP1xNXh8Y7BkorFpDlX+o1+zfv19VVbXmczk5OTt27HB2dv7Wm17+/PPPs2fPdnV17dKlS3x8/KhRoyZMmFBrnmPHjsXHxzOZTBzHnzx50qFDBx6PB+ON1kLSGIzKShUp4wYTiUSVlXxMLJB5wQD4IgaDUVFRUTtrSJJ8//79pEmTaj5hYmIiEAj4fP63Zk1eXl5BQQGtGoZh2dnZpaWltVphhYWFGRkZTCYTw7DKykqSJAmCgOs8ayERjU78r6b5bTBEkISYEGPwqoKmQKPRJCfo/S9rMAxr27btkydPasZNcnIySZLfGjQikWjZsmWamprnzp2j0+kVFRWOjo6bNm3aunVrzdnmz58v+dvHx4dGo6lWa8CuKSl1NVSjYfsNSJLJYDLVVRGCVxU0jVo1jA9tqIkTJ3p6erZt29bJyYnJZL5582b58uVz58791jOGy8vLMzIyxowZQw0eqqam1rdv3/j4eIIgPneioEgkasDuKDvpggaAZqBm/+//+oYdHR1///33zZs3jxkz5vvvv581a5aHh8f06dO/de0aGhqmpqZXr17Nzs4WCoVJSUmXL1+2tbWFM5IBaOE+1GvodPrMmTOpIc05HI65uXn9B48+uzo6ffXq1QEBAYMHD27VqlVmZmavXr1mzZol62IDABT2/BqSJJOTk5OSkmxtbVu3bl1QUKCioiLFecPW1tZXr159/vx5aWmpgYGBjY0NdMQAAP53P+958+Y9ePCAy+X+8ssvc+bM2b17d15e3vbt26W4n7eOjs6gQYMaobQAAEX1oRvlxIkTr169On/+/JgxYwSCqjMy7Ozs4uPjqb8BAEA2WXPz5s2AgIAePXqoqKhQU3R1dQUCAZxfBwCQZdaoqakVFhZS12FSx4yysrKkOL8GAADqy5px48bt27fv9u3bpaWlZWVlDx8+DAoKcnNzgxH5AAAyHtv86dOnkyZNEovFTCZz9+7dDg4OAQEBstkIAKDF+5A1Kioqv/3227Rp06Kjo3k8Xp8+fWxsbJq6bAAApcsakiQFAoFZNbFYHBMT8/bt206dOjV18QAAytVfc+jQoVWrVpEkyeVyR44cOWHChCFDhly8eLGpiwcAUK6siYyMbNeuHYZht2/fTkxMPHny5Jw5c0JDQ+HCSACALO/nXVZW1qpVK4RQREREnz59BgwY4OLiUlhYCPfzBgDI8n7eJiYmd+7cSU9Pf/DggZ2dHTU6hORcGwAAaKAPUTJ16tR79+7Z2NjgOO7l5YUQevDggY6ODpvNbugWAABAchyqT58+Fy9eTEpKsrS0pEaTGDJkiJubG9RrAAAyHlOCOuAtedinTx/ZbAEAACRtKAAAaFSQNQAAeYCsAQDIA2QNAEAeIGsAAPIAWQMAkAfIGgCAPEDWAAAUPGv4fD6Xy611/3AAQMvUKFmTl5cXHBxsZ2dna2s7duzY5OTkxtgKAEAhr1GQlcrKyqlTp+bn5y9ZskRTU/Pt27dw4xcAgOyz5vjx44mJibdu3TI2Npb5ygEACkr2WXPt2jU7O7uioqJjx461a9duzJgxmpqaMt8KAKBFZ015eXl+fn5OTs7cuXM7dOhw6dKlP//8Mzw8vHPnzjVn27p169OnT2nVoqOjTUxMeNVkWxiFR2czKirUvv1+6tUwoVDIqeBjQq7MywXAF7HZbA6H04hZQ5Ikj8fjcDhhYWF9+vTJzc11cnLas2fP5s2ba87Wrl07LpeLYRiTyYyNjcUwDMdxOl32lSzFRsdpNBoiSakWJjEMY9AxRMKrCpoAjld/emuQ8QdRRUWFzWZbWVlRw98YGhp+//33t27dEolENaNk3Lhxkr9fvHiB4zizmmwLowwaMC4inU5XZzERC15V0DRUVFQa8Zg3g8Ho3r07n8+XTCktLVVXV8c+3xCAE3AAaAlkf36Nt7f327dvQ0NDs7KyIiMjz5w54+npWas2BQBoaWTfmHdwcFizZs22bdv++uuvgoICX1/fH374QeZbAQAolkbpOPTz8xs7dmx6enqrVq0MDQ0bYxMAAMXSWAcptKs10soBAAoHrvMGAMgDZA0AQB4gawAA8gBZAwCQB8gaAIA8QNYAAOQBsgYAIA+QNQAAeYCsAQDIA2QNAEAeIGsAAPIAWQMAkAfIGgCAPEDWAADkAbIGACAPkDUAAHmArAEAyANkDQBAHiBrAADyAFkDAJAHyBoAgDxA1gAAFDxrSJIsLS3lcrmNtwkAgKJoxKwJCwtzcXH566+/Gm8ToD5YY938C8gMIUaCSin/ifhIoTTWxzEpKWnTpk0JCQlJSUmNtAlQH4yeUfE+JvUMIr99WRK1U29nb2DfGOUCH0m8g07OQ0xV9K2EXGQ1EnmsQy08a0Qi0a+//jpy5EhdXV2CIOqfGcOwxihDS0dj38+77xUpVdYI0cguI/8e8ndjlAt8hBAjPgeRX/iO1EHIRUIeUiiNkjWHDx/OycnZs2fP6NGj65yBrFbVhMPxL4YRkApJx+hVb68UWYMQm8aWfYlAnTC86p80S0n/I51RhmIypOpBIVA7LWTftnlkTVpaWkhIyObNmzU0ND6XI0FBQQ8fPsQwjEajxcbGmpqaVlRU8PkK1v5sbCSdxeJw1OVf78OQgC/glnG5IujXb67vL4YJBILy8krs22s3bDp5/Q1rxgV1xPj27YrQdxaCC+7lXOEXis1iscrKyhoxayorK1esWDFy5MjBgwdT1RY6vY5NDBw40NjYmFatqKgIwzAWiwWNqdroTDqT2QTbJRGNTmOxWCRdqkoRkMP7SyIajabCYiHaNy/KoiNVNh0xkTRZgyE1Fo3FUiG/tF0mk8lisRoxa16/fn316lVnZ+eAgACxWJyQkJCbm6uurr5y5UoG4397RiURJSIigoqkOlOppWMyUXVjU85oNBrOwlXRt/dZAjm9vySNRlNl0qTpV67erHSN6w+fDaaq6leEZONmjb6+/uzZs8vKykiSJAgCx3EajcasN7yhvwaAlkDGWWNsbLxmzRrJw9jY2F69eq1YsUK2WwEAKJxGbLaIxeI+ffqYmZk13iYAAIqiEbOGRqNt3LgRenwBAI2bNVRfdKOuHwCgKOA6bwCAPEDWAADkAbIGACAPkDUAAHmAU3VBc0KIpR+WBach+kcnqoJmBbIGNCctaTyXlgayBjQnhKjljOfS0kDWgGYFa5LxXIAcKFrWZLxAd/dK0ywXC5BxX9R/WqOUCgCgbFlTkoVizyHWt7fnBdyqi+ghawBoIoqWNTgNMVUQQ0WaZelwwQQATQbOrwEAyANkDQBAHiBrAFBQmPRLNsUhO0XrrwEAVMFEpJAn4iCpcEV0hOR9Wx7IGgAUEF3lcvpl71OHpBmiHEOiCnfEOIrkC7IGAEWECUkhR8iRLmtQU9z5C7IGAIWEVf9PuiWbpMMG+oYBAPIAWQMAkAfIGgCAPEDWAAAUs2+YJMnS0tLk5GQ6nd6pUyc1NTWZbwIAoHBknzW//vrrgQMH9PX1BQKBWCxev369u7u7zLcCAGjRWUMQRKtWrXbu3GllZSUQCDZv3hwYGGhpadmpUyfZbggA0KKzBsfxOXPmSB6uXLnyyJEjCQkJ9WQN3IQXgJagcc/le/HihZaWlpGRUa3pPB5PJBJRKSMUCqlenq9aI0k2JJm+divNR8P2FyncawXvryL4yte51myNmDUZGRlLly6dOHFir169aj21dOnSiIgINpuNYdi7d+/MzMw4HA6P94WxqUkGm11erildPQjD+Hx+aWkFJmyCs7Ol06D9bQgM8Xl8bgm3QlQhz83C+6sAMMTn87mlpRXCLxSbzWaXlpbKI2sKCgomTpzYsWPH33777dNW0owZM9zd3Wk0GkIoODiYRqOpqKiwWF8YRZjEcJqqKpLut4skGQyGlpoKRirM6HwN2t8GbRgxmAyWOotOyvUSFnh/FQCJGAwGS02L/qUKGY7jtY5BN8qHKT8/39PTU1NT8/Dhw1paWp/OYGlpKfm7TZs2GIbR6V9XEgZD6lLhOM5i0BCqCjiF0YD9bQgcx2kMGk3+rxW8v81e9WeD9TWvMpPJbNysKSwsnDJlioqKyqlTpzQ0NL44v1gs/oa1K9aPQMPB/io3Upn3t3H7a0Qi0Y8//njjxo3AwMCDBw8KBAKSJN3d3Tt37izbDQEAFIuMs0YsFltYWEycODEjIyM1NZWa4ujoCFkDQAsn46xhsVirVq0iSVLSH1zzbwBAi9Uo117WDBcIGgAAXOcNAJATyBoAgDxA1gAA5AGyBgAgDy0na0iEwU0jAGgyLebrR2PH5N3ffGe8NMuKkb2R/aLui2RfKgBajBaTNRj9fcX7M8kx0ty7S4T4iA9ZA0BDtJisQYiO0at2V6oLUFi0L1yDDgCoX8vprwEANCXIGgCAPEDWgDrAdSVA5lpQfw34ekICcQRSLkvHERs+VuAT8KEAn2Cgy0mo9ROpqjdC5N4dHf2+MYoFFBtkDaiDiEAcvpRZw626LwYAtUHWgM/ApMoaDMEgIqBO0DcMAJAHyBoAgDxA1nwVOrxOADQM9Nd8BRy9L0VnXkvVf0GgdlrIvm1jFAsARQJZ8xVoKCYNjX8s5XGZkT3R3xMao1gAKBLImq+DI8SU8rgMnNgGAPTXAADkpFF+cwmCiI6OzszM7NSpU+/evRtjEwDUBr+bLS1rBAJBYGDgjRs3jIyMcnJypk+fvmzZMrhLFGhcNBSTjjaflWpZMbLvgBbZy7xMoJGz5vjx4+er9enT59q1a97e3v3793dycpL5hgCofawwXqplhYiPIGsUMGsuXbrk4OBgb1/11o0cOdLU1PT27dv1ZA2O4zQa7WvXzmAgGlb171uRGJ2GSTkuH1Z9gg1NymPeeENeY9jfr4WxcVpVmaVAQypNNewiQ5nfXwaDUbNBI+OsKSsry8zMdHFxoR5iGNarV6/Hjx8TBIHj/2tPp6amlpSU0Gg0DMMKCgrYbHZcXBxJfullwzAs+Q2ezUOMby4YRuIpqjxU+fn3Bq9+qs5nMYR4RajkJcK+/Y0VoUJVMj6OIKT5TMD+fvWiiJeC5SDay7p2ifxwmVbVB6z6bxmWuSGwRnt/qWvZmvT9xTDszZs3PB6vsbKGy+UKBAJtbW3JFG1t7YSEhFpZs379+qioKBqNhuN4bm5ubGzsP//88xVZg2NCLs6tRBj3WwuGk4iDE2o0tTpe/ep3hcfj0el0BoNRRzEwhIgXiJhQlerf7gWd9AyV7rvXiPvL5XKZTCadTleS/UUkB0WpoWd1f71IksvjslgsGo1W56dM+jI3BNYo7y+GYWKxmM/ns9lsHMeb6v3FcbyysrL6BScbJWuo+ODz+ZIpfD6fyWTW6htet26dQPBhLCaSJL+h5xjDECZdRbnqFa5zSQxhBEF4TvD8fvT306ZNE4lFdc1FVnUhSoUkkVjqD3Hj7C+PxxsxYsTyn5cPdxmuRPtL0Or68uAYVlJaOnTokNDQXb179xaJRDIuc0Ngsn9/aTjt+fPn8+fPP3bsWPv27cWEuKneXwzDcBxXUVFplKzR1tbW0tJ69+6dZEpycnLnzp1rVmoQQpqamqiZYbKZappq6lrqqAVQEajQWXRNbc0Wsr8YnUljsLV09NQ1/1fjVmJaulp0Fl1bT1tDWwMp6zkJdDrd3t7+8ePH5eXlCKGsrKxHjx45OTk182PexP9DLQNBECRJwv4qK6JZ7q/sz3/y9/fn8/mTJk3asmXLxIkTe/ToMXz4cNTssVgsOr0FXU3AYrFqVTaVG9V5gVoGHMdZLFZz+4HHvtwj++1SUlK2b9+enp5uaWk5f/58XV1d1Oylp6draGjU7NVWYiRJpqamGhgYqKmpoRZALBanpqa2adOGzWajFoDP52dnZ7dr165Z/Xw2StYAAEAtLaVWCQBoWpA1AAB5gKwBAMgDZA0ACun9+/dxcXFIcUDWKD8ej5eTk9PUpQAydv36dVdX1+fPnyMF0eKOQ4lEouzs7Pbt26OWgc/nz5s3D8OwkJCQZnUEtJEUFBRgGKanp4eUXXl5+cyZMxMTEy9cuKAQn+cWV6+JjIx0dna+c+cOagE4HM6VK1fi4+OXLVv2DQN3KLJDhw4NHz48Ly8PKTsNDY1t27aJxeKAgICKigrU7LWgrHn16pW3t/eGDRvy8vL8/PwSEhKQUhOJRL/88suiRYsmT55sYmLS3M4ibSReXl7U14/L/eaLpxXLgQMHfHx8GAzGlStXVq5ciZq9lpI1xcXF3t7ehoaGp0+fvnv3roGBga+vb1FREVJedDp96NChOTk5r1+/RkpNLBZL3sq2bduGhYU9evRo+fLlStw/EBYWtn79+nnz5kVEROzcufOvv/7auHEjaubIluHMmTPW1tb5+fnUw7S0NDMzs8mTJ/P5fFLpFBYWSvZ0+/btWlpakZGRpPK6f/++nZ3d69evJVOuXr2qq6u7a9cuUkl9//33CxYskDzcs2ePpqbmhQsXyGaspdRrmEwmh8MpKyujHrZv337u3LnHjh0LCgpSpl+/wsLCwMDAAQMG2NjYzJw5Mysr68cff5wxY8a0adPi46UbjLdZS0tLW7lypb6+fuvWrb29vSXdNK6urh4eHoGBgWfOnEHKCMfxwsJCycOpU6daWVlNnz797t27qLlS5qwRiUSZmZlUt9nAgQNJkty5c6fkWR0dHUdHx2PHjt2/fx8pBYIgli5dmpSUdODAgfDw8IcPH3p7e/P5/N9++613795TpkzJyspCymX58uUvX740NDTct2+fWCz29/cXCoXUUyYmJra2tqmpqUhZlJeXJyQkcDgchNCECROuXr3677//Uk+x2WxTU9Pu3bunpaWhZotUUsnJyS4uLvr6+hYWFjdv3iRJ8uLFixoaGosXL46Li4uKirK3t797966Xl5e3tzepFJ4+fdqtW7ekpCSSJCMjI62trfft20c9lZWV9d133x0/fpxUFi9evFi3bp2jo2Nubi41JS4urkOHDtOnT3/79m1kZGSfPn1ev34tFotJxUcQRGhoqLW1dffu3bt163bu3DmxWOzl5WVsbHzt2rW8vLwzZ87Y29vn5ORQI9c0T0qbNZMnT54xY8bt27fnzp2rr69/7949kiQvXLjQqVrHjh3Xrl1LkuSMGTPGjRtHKrg3b94IBILz58/37ds3Pz9/z5491tbWN27coFLm5cuXJEnm5+cLhUJSWURFRbFYLAcHh5o9bnfv3u3SpUvXrl3NzMw2b95MKosLFy507dr13LlzycnJQUFBLBbr7t27RUVFs2bN0tfXt7Oz69at28mTJ8nmTRmyhsfjHT9+PDk5mXr45MmTn376acSIEWVlZdSUgIAAExOTxMREkiTLysqePHmSk5NDkmRERIS5uXlUVBSpUPLy8h49eiR5+ObNGxcXl/Ly8oyMDGNj4+HDh7u5uVH3pSBJcsGCBbNmzWrOP3dS27dvn6qq6unTp2tOzMnJCQ8Pp+JVOQgEguHDh1PRmZGRMXr0aH9//8LCQurZFy9eXLx4MSMjg2z2lCFrKisr+/XrJ/kdi46O1tLS6tevH4/Ho6aUlpa6uLgMGDBA8pbk5ub+9NNPlpaWinio4vr164aGhpKIvHDhgrOzs0AgIEly8eLFCKFTp05REbx+/fqePXsqzRcvLy9v48aNP/zwQ0hICLW/P/30U9u2bZVmB2t59erV5s2b8/Ly+vfvf/To0adPn9rb269evZra9zt37nA4HFJxKHbWpKenUy93fn7+u3fv7t69S70NZ86c0dLSOnDggGTO7OzsHj16rFu3jnqYl5e3Zs2amrUDBSIQCH788ccOHTpQR3m3b98u6XIqKysLCAgwMDBwcnLq27evo6Pjs2fPSKWQnp7u5OQ0YsSI+fPn29jYuLq6ZmZm8vl8T0/PHj16KMQP+zcRCoXOzs5+fn5cLtff39/c3HzQoEHHjh2jnr1z5461tfXbt29JxaHAWcPn8ydOnDh37lzqYUpKSuvWrXfs2EE9XLt2rb6+fnR0tGT+9+/fp6WlkUqBw+G4ubn169cvLy9vwYIFVN+TxK1bt7Zt23bmzBlJTVvREQQxZ86cCRMmUL8lv//+u6Gh4ePHj6mfmb59+3p6eipTb9SDBw/WrFnj5ubG5XKphpKGhoaLi0tlZaVAIIiIiOjWrZuk419RKHDWEAQRFRWlp6e3YcMGSV+9pqbm5cuXqYcBAQGmpqZv3rwhlcvFixfXrVuXk5NjbW3t7u7u7Ow8duzYAwcOhIWFXbp0KTIy8v3796RyKSoqsrOz+/vvvwmCWL16tYODAxU0lZWVVFvj2rVrytQntXfvXhqNNmnSJMmUy5cv9+zZs23btn379rWystq/fz+paBQ4ayh//fWXtrY2dcakSCRavnx527ZtqYZDeXn5sGHDRo4cqUy/eG/fvrW0tNy7dy9BEC9evGjTpk27du2mTp3q6urq4OBgY2MzYMCABw8ekMqFy+UOGjRoyZIlCxcuHD58eEpKCkmSJSUlM2bMSE1NJZUFh8OhjmDweLy5c+caGBi8ePFC8mxaWtqJEyeOHz9O7b7CUfisIUkyKCjI0NAwJiaGauV6enpaWVllZmZSdwuIiYlRml+88PDwiRMnBgYGSqZcv35dX19/586d1L5zq5FKobCw8MyZM5cvX6YqL7t27UIIjRo1ivrl4HK5M2bM8PDwKC8vJ5VFZGSksbHxnTt3qB10c3Ozs7MrKCgglYKiZk1lZeXvv/++dOlSoVAoEAgmT55sbm5OdRAWFBTY2dm5ubmVlpaSyiU4OBghRF1XIbFjxw5dXd0rV66QSiQnJ2fo0KFt2rTR1NQcM2ZMcXFxZWWlu7u7ubn5pk2bjh49OnLkyCFDhihZlzCPx5s+fXrHjh3fvXtHkmRmZqaVldXEiRMrKipIxaeQWVNYWDhq1KihQ4deuHCBOjG0sLDQ2dl58ODBJSUlJEkmJCQsWrRIaX4QJIRC4bRp09q3b099FiWWLVv266+/ksqCz+evWLHCz8+Pw+G8ePGiW7du48aNq6ysrKioCA4OdnBwGDRoUFBQkHL0fBMEkZ2dLRKJqIdlZWXDhw93cHAoKioiSfK///4zNDQMDg4mFZ9CZs2vv/46aNAgyal6lJSUlE6dOk2bNk1pGhGUV69eBQcHh4aGUvtVVFQ0cODA7777jkpVilAolHxYFdGff/65detWqqmbnZ3t7u7etWtXyQHdFy9etG7deunSpdTD8vJy5fidp+Tn59va2p44caLm0X0LCwtvb2+qtXj79u3r16+Tik/xsobP53fp0kVyokFN9+/ft7GxiY2NJZXFrl27LCwsRo0aZWtr6+LiIumEMjMz8/HxoQ4AK4HQ0FB/f3+qiioUCgMCAhBCt27dksxw7do1LS2tkJAQhY5USm5u7rVr16hDGdevXy8sLPz999/19PRq9ugfPXoUIbRixQrJ+ahKQPGyRiAQ9OrVa9WqVTUn5ubmUp3zGRkZCv1xrHmt4NmzZ7t16xYRESH58I0aNYrqKL13756RkZHCnWHxKUmfGpfL3blz59OnT6mJbm5u9vb2eXl5kjlDQkI8PT2VYLyhf//9t127dnv37l22bNmIESMKCgoEAoGfn1+XLl2og1DUW+/o6BgYGAhZI28ikejp06d37tyhGrF//vmnnp5ezcOBs2fPXrx4ManIRCLR0aNHx44dm52dTU2ZN28edbFPaGho//79d+zYYWJiEhAQQH3+bt++LbkETBGJRKItW7b07NmTeh+FQuGUKVO6du1KnW+Zk5NjZWU1fvz4ml825Wgdi8Xi5cuXI4SGDBlSXFxMTeRwOEOHDu3bt++TJ0+ePn06YMCA8+fPK83xU4XJmpycnKlTp3bs2LFVq1b29vZRUVFU/5mJicnevXvv3Lnj6+trZ2dHjaWguCoqKjp27IgQmjRpEvWlKiwsJAiCGh2CqmD/9NNPCCHluIKZx+N169aNTqf379+fahsWFhY6ODgMGzaM6o6JjY1t06bNkiVLlKapKLF58+bevXt369at5q9FRkbGiBEj2rVrZ2xsvHDhQmXqk1KMrBGJRBMmTPDw8EhPT09JSfH09NTT0/v333/LysoWLVpkY2PTp08fHx8fJbj4QCwWT548+bvvvmvVqtXChQslv2nu7u4rVqyg/l69evWoUaNCQkJIpbBkyRIXFxdzc3NJ2zAxMbFz584zZ86kqjOXL1/u3bt3zcE9FZpIJDp37tymTZsKCgqKiopGjx5ta2srGa2VmuH27dtKcwmbgmVNQkJC+/btnzx5Qj2srKx0c3MbOnQo9VnMzs5WpjMsTp8+7eDgsH//fhUVlT179lATvb29XVxcioqKoqKievbsqUyXXERFRVlbW1+5ckVPT2/hwoXUxHv37unq6q5fv556mJqaqhzjXYlEogULFnTv3n337t1UnSUrK6tHjx5jx47l8/llZWWbNm1Sgp9MRcqauLi4q1evSo4lvXnzRk9PjzqTkvLo0SMjIyMFvUS7lidPnuzfv5/qhKI+fL169fr33383btyopqZ26dIlkiRfvnzZo0cPXV1dCwuLo0ePkgqLIIgbN24sX75cUk8pLS11dHQ8d+7c33//raKi8ueff1LTT5w4oamp+c8//5BKZO/evdbW1rVa+s+fPzczMxsxYsTAgQPHjx9PDaukrJpR1sTHx3t7e5uZmampqRkaGvr7+1PDO/bv33/MmDGSo0vZ2dmtW7emrkhQaK9evTIxMcFxfODAgWfPnqV+vf38/ObPn0+SpI+Pj5GR0X///UddCHPp0iVFr9EkJia2b9+eRqP16NEjODiYStjly5dTVxiuXbtWVVWVOvuZIIhLly7VOl9RoQkEgqFDh9Z5St7z588DAgJ27NihWIPRKHDWhIeHm5qaTpky5eHDh/n5+du3b2/VqtXAgQMLCgqio6O1tbVnzJiRmJj4/v37mTNnjh07VgkOSXA4HG9vb319/Tlz5vTq1cvNze3hw4c3b960t7cvLCwsLS0dOnSolZWVgl5o9ymBQBAUFKSlpbV48WI3N7eePXseP348JibGxsaGOm1v1qxZBgYGynfhKHVSmJOTU61DpXw+Pz09nWwxmj5rhELhunXrTExMajUQ7t69q66uPnPmTOoKQ3NzcwsLC2qQJIU+1ltTUVHRgGrx8fErVqzo3Lmzt7e3gYHBxYsXSZJ89+5dr169mv84sl9PIBBMmTLFxMTk+fPnJ0+etLa2HjRokLq6+qFDh6gm1YQJE8LDw0ll8e+///r7+1MHttesWdOhQ4eEhATJs1u2bJkzZw7ZYjR91mRkZBgaGrq4uHz61LZt21gsFvXDXlhYeOXKlQcPHijTABFU57eZmdmECRN4PN7Lly8nT57cqVOnc+fOUc+WlZUp09lc1Ps4aNCg3r17l1b77bff7O3t//77b+pZsVisTCeVvH//3szMbMqUKUKhsLi4uF+/flZWVtevX4+Pj1+/fn23bt3u379PthhNnzUkSZ47d05VVXXNmjW1piclJZmamlIDJiixe/fuaWlpLVmyhOqqSEpKUo4jL5+TkpLSsWPH0aNHUyfO1LywS/k8ePCgVatWVE9NWlra5MmT9fT0unTpMmjQICXr/FaMrKEGRmAwGDVHCKaOy1haWoaGhpLKLiwsjM1m7969m2wZ/v33X11d3cDAQOU7T6+srGzNmjWSqw2o0a91dHSOHDlCPUxNTU1ISFC+HVeYrBGLxT/++GOtI50HDx40MzNrCf1nBEEEBwerqqpSA5i2BKdPn2YymUpzXiLl5cuXSUlJjo6OgwcPrjmI16JFi7S1tamblLVYqFkdl3F3d5fcHuDevXsdOnRQ6DNKpBi+W3Knh5Zg27ZtypQ1N2/eNDU1pcZ7trCw8PPzk/S1RUZG6urqurq6Kt+VBwqZNdS5M9bW1g4ODgcOHDA2Nl6/fn2LqmoKqzV1KcA34/P5SUlJHh4eISEhVN92dHS0np7emjVrqIcLFixYs2ZNXFycMvV8fyusKm+ak/j4+BEjRvB4vC1btnh7ezd1cQD4sqSkJFdX1/Ly8qSkJE1NTWriuXPnZs2a5ejoiON4WlpaWFgYdW1ti4WjZsbKyurIkSNnzpyBoAHN1ps3b65du4YQKi4uPnnyZMeOHX19ffPy8m7fvi2Zx8PD49y5cxoaGu3atTt69GgLDxqEULOr1wDQ/IWHh8+ZM+f333+/fPmysbHxxo0bWSzW7Nmzb9y4ERERYWZm1tQFbI4gawD4ZgKBYObMmYcPH543b96WLVtoNBpCiDq4wefzr1y5ImlJgebbhgKg+WMyma1bt+7bt29MTEx+fj41UV1d/cCBAyUlJf7+/qWlpU1dxmYHsgaAb8Dlcnfv3h0REREUFHT16lUMw2bMmFFRUUE9a2xsvH//fgaDIRAImrqkzQ5kDQBfKzU11cPD4+TJkyKRiMlk6uvrHz9+PD4+ftGiRQihV69erVmzxtLS8tChQwYGBk1d2GYHsgaAr1JaWjp//nwTE5MrV66MGDECoapz08zMzA4ePHjlypXvvvvOy8uLOh0Mx+FrVQfoGwbgqzx48MDT0/PNmzcaGhpRUVFhYWElJSXz5s0bOHDg06dPDx06NHz4cDc3t6YuZvMFWQPAV3n//v2oUaM6duxIEERcXNzQoUOLi4vj4+NjY2M1NDSaunQKACp7AHxWWVnZyZMn9+zZk5qaamJisnv3bgzDzMzMIiIiDhw4sGbNGh6PV1RU1NTFVAxQrwGgbjweb/Lkyc+fPxcKhWw2+8SJE71796757OzZs4VC4cGDB+l0epOWVDFAvQaAOpSXl4eFhREE8ejRo/j4eFtb24kTJyYnJyOEKioqTpw44eLiUlJSsmHDBgiarwT1GgCqFBQUHDp0aNq0afr6+gKBYNq0aU+ePNm0adPo0aOpc4K///57oVB45coVHMfnzZvXvXv3mTNnqqurN3XBFQbUawCoUlBQsHHjxgULFgiFQiaT6erqmpqa+uLFC+pZdXX1/fv3FxcX+/v7i0Si/fv3L1y4EILmm0DWAFDFwsJi9+7d4eHh69atQwhNnjx59erVISEhMTEx1Aympqb79u3j8/mVlZUYhjV1eRUPtKEA+J8dO3YsXLhw3759Pj4+JElOnz793r17ERERJiYm1AwikQg6aKQDWQNaKLFY/Oeff3bv3t3V1VUykSCI+fPnHz169PLlywMGDCgpKfHw8CAI4uTJk0ZGRk1aXoUHbSjQQolEohcvXvj6+j579kwyEcfxdevWDRgwYObMmVlZWdra2ocPHyYIQtJxA6QG9RrQchUVFY0cOZLD4dy8edPQ0FAyPSUlpVevXuvXr/f396euhFJTU4OmUwNBvQa0XLq6ugcPHuRwOL6+vuXl5ZLpHTt2HDRokKQuo6WlBUHTcJA1oEUzNzc/fPjw3bt3f/75Z8nE0tLS169f1zxLGDQcpDVo6RwdHfft2+fn50fdoovD4axcudLS0tLT07Opi6ZUoL8GgConTpxYunQpm81GCA0ePDg4OBjGu5ItyBoAPsjLy4uLizM1NYUbITQGyBoAgDxA3zAAAMnB/wFclXXJqnkjIAAAAABJRU5ErkJggg==\" /><br /><h4>Caption</h4>Figure 5: Conversion time in seconds per page on our dataset in three scenarios, across all assets and system configurations. Lower bars are better. The configuration includes OCR and table structure recognition ( fast table option on Docling and MinerU, hi res in unstructured, as shown in table 1).<br /><h4>Annotations (HuggingFaceTB/SmolVLM-256M-Instruct)</h4>A bar chart with the following information:\n",
+       "\n",
+       "- The x-axis represents the number of pages, ranging from 0 to 14.\n",
+       "- The y-axis represents the page count, ranging from 0 to 14.\n",
+       "- The chart has three categories: Marker, Unstructured, and Detailed.\n",
+       "- The x-axis is labeled \"see/page.\"\n",
+       "- The y-axis is labeled \"Page Count.\"\n",
+       "- The chart shows that the Marker category has the highest number of pages, followed by the Unstructured category, and then the Detailed category.<br />\n"
+      ],
+      "text/plain": [
+       "<IPython.core.display.HTML object>"
+      ]
+     },
+     "execution_count": 6,
+     "metadata": {},
+     "output_type": "execute_result"
+    }
+   ],
+   "source": [
+    "from docling_core.types.doc.document import PictureDescriptionData\n",
+    "from IPython import display\n",
+    "\n",
+    "html_buffer = []\n",
+    "# display the first 5 pictures and their captions and annotations:\n",
+    "for pic in doc.pictures[:5]:\n",
+    "    html_item = (\n",
+    "        f\"<h3>Picture <code>{pic.self_ref}</code></h3>\"\n",
+    "        f'<img src=\"{str(pic.image.uri)}\" /><br />'\n",
+    "        f\"<h4>Caption</h4>{pic.caption_text(doc=doc)}<br />\"\n",
+    "    )\n",
+    "    for annotation in pic.annotations:\n",
+    "        if not isinstance(annotation, PictureDescriptionData):\n",
+    "            continue\n",
+    "        html_item += (\n",
+    "            f\"<h4>Annotations ({annotation.provenance})</h4>{annotation.text}<br />\\n\"\n",
+    "        )\n",
+    "    html_buffer.append(html_item)\n",
+    "display.HTML(\"<hr />\".join(html_buffer))"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "---"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "## Use other vision models\n",
+    "\n",
+    "The examples above can also be reproduced using other vision model.\n",
+    "The Docling options `PictureDescriptionVlmOptions` allows to speficy your favorite vision model from the Hugging Face Hub."
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 8,
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "from docling.datamodel.pipeline_options import PictureDescriptionVlmOptions\n",
+    "\n",
+    "pipeline_options = PdfPipelineOptions()\n",
+    "pipeline_options.do_picture_description = True\n",
+    "pipeline_options.picture_description_options = PictureDescriptionVlmOptions(\n",
+    "    repo_id=\"\",  # <-- add here the Hugging Face repo_id of your favorite VLM\n",
+    "    prompt=\"Describe the image in three sentences. Be consise and accurate.\",\n",
+    ")\n",
+    "pipeline_options.images_scale = 2.0\n",
+    "pipeline_options.generate_picture_images = True\n",
+    "\n",
+    "converter = DocumentConverter(\n",
+    "    format_options={\n",
+    "        InputFormat.PDF: PdfFormatOption(\n",
+    "            pipeline_options=pipeline_options,\n",
+    "        )\n",
+    "    }\n",
+    ")\n",
+    "\n",
+    "# Uncomment to run:\n",
+    "# doc = converter.convert(DOC_SOURCE).document"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "metadata": {},
+   "outputs": [],
+   "source": []
+  }
+ ],
+ "metadata": {
+  "kernelspec": {
+   "display_name": "docling-aMWN2FRM-py3.12",
+   "language": "python",
+   "name": "python3"
+  },
+  "language_info": {
+   "codemirror_mode": {
+    "name": "ipython",
+    "version": 3
+   },
+   "file_extension": ".py",
+   "mimetype": "text/x-python",
+   "name": "python",
+   "nbconvert_exporter": "python",
+   "pygments_lexer": "ipython3",
+   "version": "3.12.7"
+  }
+ },
+ "nbformat": 4,
+ "nbformat_minor": 2
+}
diff --git a/docs/examples/pictures_description_api.py b/docs/examples/pictures_description_api.py
new file mode 100644
index 00000000..8e105d24
--- /dev/null
+++ b/docs/examples/pictures_description_api.py
@@ -0,0 +1,118 @@
+import logging
+import os
+from pathlib import Path
+
+import requests
+from docling_core.types.doc import PictureItem
+from dotenv import load_dotenv
+
+from docling.datamodel.base_models import InputFormat
+from docling.datamodel.pipeline_options import (
+    PdfPipelineOptions,
+    PictureDescriptionApiOptions,
+)
+from docling.document_converter import DocumentConverter, PdfFormatOption
+
+
+def vllm_local_options(model: str):
+    options = PictureDescriptionApiOptions(
+        url="http://localhost:8000/v1/chat/completions",
+        params=dict(
+            model=model,
+            seed=42,
+            max_completion_tokens=200,
+        ),
+        prompt="Describe the image in three sentences. Be consise and accurate.",
+        timeout=90,
+    )
+    return options
+
+
+def watsonx_vlm_options():
+    load_dotenv()
+    api_key = os.environ.get("WX_API_KEY")
+    project_id = os.environ.get("WX_PROJECT_ID")
+
+    def _get_iam_access_token(api_key: str) -> str:
+        res = requests.post(
+            url="https://iam.cloud.ibm.com/identity/token",
+            headers={
+                "Content-Type": "application/x-www-form-urlencoded",
+            },
+            data=f"grant_type=urn:ibm:params:oauth:grant-type:apikey&apikey={api_key}",
+        )
+        res.raise_for_status()
+        api_out = res.json()
+        print(f"{api_out=}")
+        return api_out["access_token"]
+
+    options = PictureDescriptionApiOptions(
+        url="https://us-south.ml.cloud.ibm.com/ml/v1/text/chat?version=2023-05-29",
+        params=dict(
+            model_id="meta-llama/llama-3-2-11b-vision-instruct",
+            project_id=project_id,
+            parameters=dict(
+                max_new_tokens=400,
+            ),
+        ),
+        headers={
+            "Authorization": "Bearer " + _get_iam_access_token(api_key=api_key),
+        },
+        prompt="Describe the image in three sentences. Be consise and accurate.",
+        timeout=60,
+    )
+    return options
+
+
+def main():
+    logging.basicConfig(level=logging.INFO)
+
+    input_doc_path = Path("./tests/data/pdf/2206.01062.pdf")
+
+    pipeline_options = PdfPipelineOptions(
+        enable_remote_services=True  # <-- this is required!
+    )
+    pipeline_options.do_picture_description = True
+
+    # The PictureDescriptionApiOptions() allows to interface with APIs supporting
+    # the multi-modal chat interface. Here follow a few example on how to configure those.
+    #
+    # One possibility is self-hosting model, e.g. via VLLM.
+    # $ vllm serve MODEL_NAME
+    # Then PictureDescriptionApiOptions can point to the localhost endpoint.
+    #
+    # Example for the Granite Vision model: (uncomment the following lines)
+    # pipeline_options.picture_description_options = vllm_local_options(
+    #     model="ibm-granite/granite-vision-3.1-2b-preview"
+    # )
+    #
+    # Example for the SmolVLM model: (uncomment the following lines)
+    pipeline_options.picture_description_options = vllm_local_options(
+        model="HuggingFaceTB/SmolVLM-256M-Instruct"
+    )
+    #
+    # Another possibility is using online services, e.g. watsonx.ai.
+    # Using requires setting the env variables WX_API_KEY and WX_PROJECT_ID.
+    # Uncomment the following line for this option:
+    # pipeline_options.picture_description_options = watsonx_vlm_options()
+
+    doc_converter = DocumentConverter(
+        format_options={
+            InputFormat.PDF: PdfFormatOption(
+                pipeline_options=pipeline_options,
+            )
+        }
+    )
+    result = doc_converter.convert(input_doc_path)
+
+    for element, _level in result.document.iterate_items():
+        if isinstance(element, PictureItem):
+            print(
+                f"Picture {element.self_ref}\n"
+                f"Caption: {element.caption_text(doc=result.document)}\n"
+                f"Annotations: {element.annotations}"
+            )
+
+
+if __name__ == "__main__":
+    main()
diff --git a/docs/examples/rapidocr_with_custom_models.py b/docs/examples/rapidocr_with_custom_models.py
new file mode 100644
index 00000000..e6dd3963
--- /dev/null
+++ b/docs/examples/rapidocr_with_custom_models.py
@@ -0,0 +1,58 @@
+import os
+
+from huggingface_hub import snapshot_download
+
+from docling.datamodel.pipeline_options import PdfPipelineOptions, RapidOcrOptions
+from docling.document_converter import (
+    ConversionResult,
+    DocumentConverter,
+    InputFormat,
+    PdfFormatOption,
+)
+
+
+def main():
+    # Source document to convert
+    source = "https://arxiv.org/pdf/2408.09869v4"
+
+    # Download RappidOCR models from HuggingFace
+    print("Downloading RapidOCR models")
+    download_path = snapshot_download(repo_id="SWHL/RapidOCR")
+
+    # Setup RapidOcrOptions for english detection
+    det_model_path = os.path.join(
+        download_path, "PP-OCRv4", "en_PP-OCRv3_det_infer.onnx"
+    )
+    rec_model_path = os.path.join(
+        download_path, "PP-OCRv4", "ch_PP-OCRv4_rec_server_infer.onnx"
+    )
+    cls_model_path = os.path.join(
+        download_path, "PP-OCRv3", "ch_ppocr_mobile_v2.0_cls_train.onnx"
+    )
+    ocr_options = RapidOcrOptions(
+        det_model_path=det_model_path,
+        rec_model_path=rec_model_path,
+        cls_model_path=cls_model_path,
+    )
+
+    pipeline_options = PdfPipelineOptions(
+        ocr_options=ocr_options,
+    )
+
+    # Convert the document
+    converter = DocumentConverter(
+        format_options={
+            InputFormat.PDF: PdfFormatOption(
+                pipeline_options=pipeline_options,
+            ),
+        },
+    )
+
+    conversion_result: ConversionResult = converter.convert(source=source)
+    doc = conversion_result.document
+    md = doc.export_to_markdown()
+    print(md)
+
+
+if __name__ == "__main__":
+    main()
diff --git a/docs/examples/run_with_accelerator.py b/docs/examples/run_with_accelerator.py
index 5985401d..6e81e853 100644
--- a/docs/examples/run_with_accelerator.py
+++ b/docs/examples/run_with_accelerator.py
@@ -14,7 +14,7 @@ from docling.document_converter import DocumentConverter, PdfFormatOption
 
 
 def main():
-    input_doc = Path("./tests/data/2206.01062.pdf")
+    input_doc = Path("./tests/data/pdf/2206.01062.pdf")
 
     # Explicitly set the accelerator
     # accelerator_options = AcceleratorOptions(
@@ -30,6 +30,9 @@ def main():
     #     num_threads=8, device=AcceleratorDevice.CUDA
     # )
 
+    # easyocr doesnt support cuda:N allocation, defaults to cuda:0
+    # accelerator_options = AcceleratorOptions(num_threads=8, device="cuda:1")
+
     pipeline_options = PdfPipelineOptions()
     pipeline_options.accelerator_options = accelerator_options
     pipeline_options.do_ocr = True
diff --git a/docs/examples/run_with_formats.py b/docs/examples/run_with_formats.py
index 7bd27de5..0eff248b 100644
--- a/docs/examples/run_with_formats.py
+++ b/docs/examples/run_with_formats.py
@@ -25,9 +25,8 @@ def main():
         Path("tests/data/docx/lorem_ipsum.docx"),
         Path("tests/data/pptx/powerpoint_sample.pptx"),
         Path("tests/data/2305.03393v1-pg9-img.png"),
-        Path("tests/data/2206.01062.pdf"),
-        Path("tests/data/test_01.asciidoc"),
-        Path("tests/data/test_01.asciidoc"),
+        Path("tests/data/pdf/2206.01062.pdf"),
+        Path("tests/data/asciidoc/test_01.asciidoc"),
     ]
 
     ## for defaults use:
@@ -44,6 +43,7 @@ def main():
                 InputFormat.HTML,
                 InputFormat.PPTX,
                 InputFormat.ASCIIDOC,
+                InputFormat.CSV,
                 InputFormat.MD,
             ],  # whitelist formats, non-matching files are ignored.
             format_options={
diff --git a/docs/examples/tesseract_lang_detection.py b/docs/examples/tesseract_lang_detection.py
index b75e4707..0de0dd6b 100644
--- a/docs/examples/tesseract_lang_detection.py
+++ b/docs/examples/tesseract_lang_detection.py
@@ -10,7 +10,7 @@ from docling.document_converter import DocumentConverter, PdfFormatOption
 
 
 def main():
-    input_doc = Path("./tests/data/2206.01062.pdf")
+    input_doc = Path("./tests/data/pdf/2206.01062.pdf")
 
     # Set lang=["auto"] with a tesseract OCR engine: TesseractOcrOptions, TesseractCliOcrOptions
     # ocr_options = TesseractOcrOptions(lang=["auto"])
diff --git a/docs/examples/translate.py b/docs/examples/translate.py
index a36c6f71..fa39b6d3 100644
--- a/docs/examples/translate.py
+++ b/docs/examples/translate.py
@@ -32,7 +32,7 @@ def translate(text: str, src: str = "en", dest: str = "de"):
 def main():
     logging.basicConfig(level=logging.INFO)
 
-    input_doc_path = Path("./tests/data/2206.01062.pdf")
+    input_doc_path = Path("./tests/data/pdf/2206.01062.pdf")
     output_dir = Path("scratch")
 
     # Important: For operating with page images, we must keep them, otherwise the DocumentConverter
diff --git a/docs/faq.md b/docs/faq/index.md
similarity index 71%
rename from docs/faq.md
rename to docs/faq/index.md
index 9daccae6..d1d05a8f 100644
--- a/docs/faq.md
+++ b/docs/faq/index.md
@@ -132,9 +132,48 @@ This is a collection of FAQ collected from the user questions on <https://github
     ```
 
 
-??? Some images are missing from MS Word and Powerpoint"
+??? question "Some images are missing from MS Word and Powerpoint"
 
     ### Some images are missing from MS Word and Powerpoint
 
     The image processing library used by Docling is able to handle embedded WMF images only on Windows platform.
     If you are on other operaring systems, these images will be ignored.
+
+
+??? question "`HybridChunker` triggers warning: 'Token indices sequence length is longer than the specified maximum sequence length for this model'"
+
+    ### `HybridChunker` triggers warning: 'Token indices sequence length is longer than the specified maximum sequence length for this model'
+
+    **TLDR**:
+    In the context of the `HybridChunker`, this is a known & ancitipated "false alarm".
+
+    **Details**:
+
+    Using the [`HybridChunker`](../concepts/chunking.md#hybrid-chunker) often triggers a warning like this:
+    > Token indices sequence length is longer than the specified maximum sequence length for this model (531 > 512). Running this sequence through the model will result in indexing errors
+
+    This is a warning that is emitted by transformers, saying that actually *running this sequence through the model* will result in indexing errors, i.e. the problematic case is only if one indeed passes the particular sequence through the (embedding) model.
+
+    In our case though, this occurs as a "false alarm", since what happens is the following:
+
+    - the chunker invokes the tokenizer on a potentially long sequence (e.g. 530 tokens as mentioned in the warning) in order to count its tokens, i.e. to assess if it is short enough. At this point transformers already emits the warning above!
+    - whenever the sequence at hand is oversized, the chunker proceeds to split it (but the transformers warning has already been shown nonetheless)
+
+    What is important is the actual token length of the produced chunks.
+    The snippet below can be used for getting the actual maximum chunk size (for users wanting to confirm that this does not exceed the model limit):
+
+    ```python
+    chunk_max_len = 0
+    for i, chunk in enumerate(chunks):
+        ser_txt = chunker.serialize(chunk=chunk)
+        ser_tokens = len(tokenizer.tokenize(ser_txt))
+        if ser_tokens > chunk_max_len:
+            chunk_max_len = ser_tokens
+        print(f"{i}\t{ser_tokens}\t{repr(ser_txt[:100])}...")
+    print(f"Longest chunk yielded: {chunk_max_len} tokens")
+    print(f"Model max length: {tokenizer.model_max_length}")
+    ```
+
+    Also see [docling#725](https://github.com/DS4SD/docling/issues/725).
+
+    Source: Issue [docling-core#119](https://github.com/DS4SD/docling-core/issues/119)
diff --git a/docs/index.md b/docs/index.md
index 18c12352..a0a1bb16 100644
--- a/docs/index.md
+++ b/docs/index.md
@@ -47,6 +47,6 @@ Docling simplifies document processing, parsing diverse formats — including ad
 
 Docling has been brought to you by IBM.
 
-[supported_formats]: ./supported_formats.md
+[supported_formats]: ./usage/supported_formats.md
 [docling_document]: ./concepts/docling_document.md
 [integrations]: ./integrations/index.md
diff --git a/docs/installation.md b/docs/installation/index.md
similarity index 100%
rename from docs/installation.md
rename to docs/installation/index.md
diff --git a/docs/usage/enrichments.md b/docs/usage/enrichments.md
new file mode 100644
index 00000000..96e10f16
--- /dev/null
+++ b/docs/usage/enrichments.md
@@ -0,0 +1,216 @@
+Docling allows to enrich the conversion pipeline with additional steps which process specific document components,
+e.g. code blocks, pictures, etc. The extra steps usually require extra models executions which may increase
+the processing time consistently. For this reason most enrichment models are disabled by default.
+
+The following table provides an overview of the default enrichment models available in Docling.
+
+| Feature | Parameter | Processed item | Description |
+| ------- | --------- | ---------------| ----------- |
+| Code understanding | `do_code_enrichment` | `CodeItem` | See [docs below](#code-understanding). |
+| Formula understanding | `do_formula_enrichment` | `TextItem` with label `FORMULA` | See [docs below](#formula-understanding). |
+| Picrure classification | `do_picture_classification` | `PictureItem` | See [docs below](#picture-classification). |
+| Picture description | `do_picture_description` | `PictureItem` | See [docs below](#picture-description). |
+
+
+## Enrichments details
+
+### Code understanding
+
+The code understanding step allows to use advance parsing for code blocks found in the document.
+This enrichment model also set the `code_language` property of the `CodeItem`.
+
+Model specs: see the [`CodeFormula` model card](https://huggingface.co/ds4sd/CodeFormula).
+
+Example command line:
+
+```sh
+docling --enrich-code FILE
+```
+
+Example code:
+
+```py
+from docling.document_converter import DocumentConverter, PdfFormatOption
+from docling.datamodel.pipeline_options import PdfPipelineOptions
+from docling.datamodel.base_models import InputFormat
+
+pipeline_options = PdfPipelineOptions()
+pipeline_options.do_code_enrichment = True
+
+converter = DocumentConverter(format_options={
+    InputFormat.PDF: PdfFormatOption(pipeline_options=pipeline_options)
+})
+
+result = converter.convert("https://arxiv.org/pdf/2501.17887")
+doc = result.document
+```
+
+### Formula understanding
+
+The formula understanding step will analize the equation formulas in documents and extract their LaTeX representation.
+The HTML export functions in the DoclingDocument will leverage the formula and visualize the result using the mathml html syntax.
+
+Model specs: see the [`CodeFormula` model card](https://huggingface.co/ds4sd/CodeFormula).
+
+Example command line:
+
+```sh
+docling --enrich-formula FILE
+```
+
+Example code:
+
+```py
+from docling.document_converter import DocumentConverter, PdfFormatOption
+from docling.datamodel.pipeline_options import PdfPipelineOptions
+from docling.datamodel.base_models import InputFormat
+
+pipeline_options = PdfPipelineOptions()
+pipeline_options.do_formula_enrichment = True
+
+converter = DocumentConverter(format_options={
+    InputFormat.PDF: PdfFormatOption(pipeline_options=pipeline_options)
+})
+
+result = converter.convert("https://arxiv.org/pdf/2501.17887")
+doc = result.document
+```
+
+### Picture classification
+
+The picture classification step classifies the `PictureItem` elements in the document with the `DocumentFigureClassifier` model.
+This model is specialized to understand the classes of pictures found in documents, e.g. different chart types, flow diagrams,
+logos, signatures, etc.
+
+Model specs: see the [`DocumentFigureClassifier` model card](https://huggingface.co/ds4sd/DocumentFigureClassifier).
+
+Example command line:
+
+```sh
+docling --enrich-picture-classes FILE
+```
+
+Example code:
+
+```py
+from docling.document_converter import DocumentConverter, PdfFormatOption
+from docling.datamodel.pipeline_options import PdfPipelineOptions
+from docling.datamodel.base_models import InputFormat
+
+pipeline_options = PdfPipelineOptions()
+pipeline_options.generate_picture_images = True
+pipeline_options.images_scale = 2
+pipeline_options.do_picture_classification = True
+
+converter = DocumentConverter(format_options={
+    InputFormat.PDF: PdfFormatOption(pipeline_options=pipeline_options)
+})
+
+result = converter.convert("https://arxiv.org/pdf/2501.17887")
+doc = result.document
+```
+
+
+### Picture description
+
+The picture description step allows to annotate a picture with a vision model. This is also known as a "captioning" task.
+The Docling pipeline allows to load and run models completely locally as well as connecting to remote API which support the chat template.
+Below follow a few examples on how to use some common vision model and remote services.
+
+
+```py
+from docling.document_converter import DocumentConverter, PdfFormatOption
+from docling.datamodel.pipeline_options import PdfPipelineOptions
+from docling.datamodel.base_models import InputFormat
+
+pipeline_options = PdfPipelineOptions()
+pipeline_options.do_picture_description = True
+
+converter = DocumentConverter(format_options={
+    InputFormat.PDF: PdfFormatOption(pipeline_options=pipeline_options)
+})
+
+result = converter.convert("https://arxiv.org/pdf/2501.17887")
+doc = result.document
+
+```
+
+#### Granite Vision model
+
+Model specs: see the [`ibm-granite/granite-vision-3.1-2b-preview` model card](https://huggingface.co/ibm-granite/granite-vision-3.1-2b-preview).
+
+Usage in Docling:
+
+```py
+from docling.datamodel.pipeline_options import granite_picture_description
+
+pipeline_options.picture_description_options = granite_picture_description
+```
+
+#### SmolVLM model
+
+Model specs: see the [`HuggingFaceTB/SmolVLM-256M-Instruct` model card](https://huggingface.co/HuggingFaceTB/SmolVLM-256M-Instruct).
+
+Usage in Docling:
+
+```py
+from docling.datamodel.pipeline_options import smolvlm_picture_description
+
+pipeline_options.picture_description_options = smolvlm_picture_description
+```
+
+#### Other vision models
+
+The option class `PictureDescriptionVlmOptions` allows to use any another model from the Hugging Face Hub.
+
+```py
+from docling.datamodel.pipeline_options import PictureDescriptionVlmOptions
+
+pipeline_options.picture_description_options = PictureDescriptionVlmOptions(
+    repo_id="",  # <-- add here the Hugging Face repo_id of your favorite VLM
+    prompt="Describe the image in three sentences. Be consise and accurate.",
+)
+```
+
+#### Remote vision model
+
+The option class `PictureDescriptionApiOptions` allows to use models hosted on remote platforms, e.g.
+on local endpoints served by [VLLM](https://docs.vllm.ai), [Ollama](https://ollama.com/) and others,
+or cloud providers like [IBM watsonx.ai](https://www.ibm.com/products/watsonx-ai), etc.
+
+_Note: in most cases this option will send your data to the remote service provider._
+
+Usage in Docling:
+
+```py
+from docling.datamodel.pipeline_options import PictureDescriptionApiOptions
+
+# Enable connections to remote services
+pipeline_options.enable_remote_services=True  # <-- this is required!
+
+# Example using a model running locally, e.g. via VLLM
+# $ vllm serve MODEL_NAME
+pipeline_options.picture_description_options = PictureDescriptionApiOptions(
+    url="http://localhost:8000/v1/chat/completions",
+    params=dict(
+        model="MODEL NAME",
+        seed=42,
+        max_completion_tokens=200,
+    ),
+    prompt="Describe the image in three sentences. Be consise and accurate.",
+    timeout=90,
+)
+```
+
+End-to-end code snippets for cloud providers are available in the examples section:
+
+- [IBM watsonx.ai](../examples/pictures_description_api.py)
+
+
+## Develop new enrichment models
+
+Beside looking at the implementation of all the models listed above, the Docling documentation has a few examples
+dedicated to the implementation of enrichment models.
+
+- [Develop picture enrichment](../examples/develop_picture_enrichment.py)
+- [Develop formula enrichment](../examples/develop_formula_understanding.py)
diff --git a/docs/usage.md b/docs/usage/index.md
similarity index 67%
rename from docs/usage.md
rename to docs/usage/index.md
index a577a3e3..033821b8 100644
--- a/docs/usage.md
+++ b/docs/usage/index.md
@@ -22,16 +22,91 @@ A simple example would look like this:
 docling https://arxiv.org/pdf/2206.01062
 ```
 
-To see all available options (export formats etc.) run `docling --help`. More details in the [CLI reference page](./reference/cli.md).
+To see all available options (export formats etc.) run `docling --help`. More details in the [CLI reference page](../reference/cli.md).
 
 ### Advanced options
 
+#### Model prefetching and offline usage
+
+By default, models are downloaded automatically upon first usage. If you would prefer
+to explicitly prefetch them for offline use (e.g. in air-gapped environments) you can do
+that as follows:
+
+**Step 1: Prefetch the models**
+
+Use the `docling-tools models download` utility:
+
+```sh
+$ docling-tools models download
+Downloading layout model...
+Downloading tableformer model...
+Downloading picture classifier model...
+Downloading code formula model...
+Downloading easyocr models...
+Models downloaded into $HOME/.cache/docling/models.
+```
+
+Alternatively, models can be programmatically downloaded using `docling.utils.model_downloader.download_models()`.
+
+**Step 2: Use the prefetched models**
+
+```python
+from docling.datamodel.base_models import InputFormat
+from docling.datamodel.pipeline_options import EasyOcrOptions, PdfPipelineOptions
+from docling.document_converter import DocumentConverter, PdfFormatOption
+
+artifacts_path = "/local/path/to/models"
+
+pipeline_options = PdfPipelineOptions(artifacts_path=artifacts_path)
+doc_converter = DocumentConverter(
+    format_options={
+        InputFormat.PDF: PdfFormatOption(pipeline_options=pipeline_options)
+    }
+)
+```
+
+Or using the CLI:
+
+```sh
+docling --artifacts-path="/local/path/to/models" FILE
+```
+
+#### Using remote services
+
+The main purpose of Docling is to run local models which are not sharing any user data with remote services.
+Anyhow, there are valid use cases for processing part of the pipeline using remote services, for example invoking OCR engines from cloud vendors or the usage of hosted LLMs.
+
+In Docling we decided to allow such models, but we require the user to explicitly opt-in in communicating with external services.
+
+```py
+from docling.datamodel.base_models import InputFormat
+from docling.datamodel.pipeline_options import PdfPipelineOptions
+from docling.document_converter import DocumentConverter, PdfFormatOption
+
+pipeline_options = PdfPipelineOptions(enable_remote_services=True)
+doc_converter = DocumentConverter(
+    format_options={
+        InputFormat.PDF: PdfFormatOption(pipeline_options=pipeline_options)
+    }
+)
+```
+
+When the value `enable_remote_services=True` is not set, the system will raise an exception `OperationNotAllowed()`.
+
+_Note: This option is only related to the system sending user data to remote services. Control of pulling data (e.g. model weights) follows the logic described in [Model prefetching and offline usage](#model-prefetching-and-offline-usage)._
+
+##### List of remote model services
+
+The options in this list require the explicit `enable_remote_services=True` when processing the documents.
+
+- `PictureDescriptionApiOptions`: Using vision models via API calls.
+
+
 #### Adjust pipeline features
 
-The example file [custom_convert.py](./examples/custom_convert.py) contains multiple ways
+The example file [custom_convert.py](../examples/custom_convert.py) contains multiple ways
 one can adjust the conversion pipeline and features.
 
-
 ##### Control PDF table extraction options
 
 You can control if table structure recognition should map the recognized structure back to PDF cells (default) or use text cells from the structure prediction itself.
@@ -70,28 +145,6 @@ doc_converter = DocumentConverter(
 )
 ```
 
-##### Provide specific artifacts path
-
-By default, artifacts such as models are downloaded automatically upon first usage. If you would prefer to use a local path where the artifacts have been explicitly prefetched, you can do that as follows:
-
-```python
-from docling.datamodel.base_models import InputFormat
-from docling.datamodel.pipeline_options import PdfPipelineOptions
-from docling.document_converter import DocumentConverter, PdfFormatOption
-from docling.pipeline.standard_pdf_pipeline import StandardPdfPipeline
-
-# # to explicitly prefetch:
-# artifacts_path = StandardPdfPipeline.download_models_hf()
-
-artifacts_path = "/local/path/to/artifacts"
-
-pipeline_options = PdfPipelineOptions(artifacts_path=artifacts_path)
-doc_converter = DocumentConverter(
-    format_options={
-        InputFormat.PDF: PdfFormatOption(pipeline_options=pipeline_options)
-    }
-)
-```
 
 #### Impose limits on the document size
 
@@ -130,13 +183,13 @@ You can limit the CPU threads used by Docling by setting the environment variabl
 
 !!! note
 
-    This section discusses directly invoking a [backend](./concepts/architecture.md),
+    This section discusses directly invoking a [backend](../concepts/architecture.md),
     i.e. using a low-level API. This should only be done when necessary. For most cases,
     using a `DocumentConverter` (high-level API) as discussed in the sections above
     should suffice — and is the recommended way.
 
-By default, Docling will try to identify the document format to apply the appropriate conversion backend (see the list of [supported formats](./supported_formats.md)).
-You can restrict the `DocumentConverter` to a set of allowed document formats, as shown in the [Multi-format conversion](./examples/run_with_formats.py) example.
+By default, Docling will try to identify the document format to apply the appropriate conversion backend (see the list of [supported formats](../supported_formats.md)).
+You can restrict the `DocumentConverter` to a set of allowed document formats, as shown in the [Multi-format conversion](../examples/run_with_formats.py) example.
 Alternatively, you can also use the specific backend that matches your document content. For instance, you can use `HTMLDocumentBackend` for HTML pages:
 
 ```python
@@ -161,9 +214,9 @@ print(dl_doc.export_to_markdown())
 
 ## Chunking
 
-You can chunk a Docling document using a [chunker](concepts/chunking.md), such as a
+You can chunk a Docling document using a [chunker](../concepts/chunking.md), such as a
 `HybridChunker`, as shown below (for more details check out
-[this example](examples/hybrid_chunking.ipynb)):
+[this example](../examples/hybrid_chunking.ipynb)):
 
 ```python
 from docling.document_converter import DocumentConverter
diff --git a/docs/supported_formats.md b/docs/usage/supported_formats.md
similarity index 79%
rename from docs/supported_formats.md
rename to docs/usage/supported_formats.md
index e217bb19..4d1ca4f9 100644
--- a/docs/supported_formats.md
+++ b/docs/usage/supported_formats.md
@@ -1,6 +1,6 @@
 Docling can parse various documents formats into a unified representation (Docling
 Document), which it can export to different formats too — check out
-[Architecture](./concepts/architecture.md) for more details.
+[Architecture](../concepts/architecture.md) for more details.
 
 Below you can find a listing of all supported input and output formats.
 
@@ -13,6 +13,7 @@ Below you can find a listing of all supported input and output formats.
 | Markdown | |
 | AsciiDoc | |
 | HTML, XHTML | |
+| CSV | |
 | PNG, JPEG, TIFF, BMP | Image formats |
 
 Schema-specific support:
@@ -20,8 +21,8 @@ Schema-specific support:
 | Format | Description |
 |--------|-------------|
 | USPTO XML | XML format followed by [USPTO](https://www.uspto.gov/patents) patents |
-| PMC XML | XML format followed by [PubMed Central®](https://pmc.ncbi.nlm.nih.gov/) articles |
-| Docling JSON | JSON-serialized [Docling Document](./concepts/docling_document.md) |
+| JATS XML | XML format followed by [JATS](https://jats.nlm.nih.gov/) articles |
+| Docling JSON | JSON-serialized [Docling Document](../concepts/docling_document.md) |
 
 ## Supported output formats
 
diff --git a/docs/v2.md b/docs/v2.md
index bf1de1c8..df1c8233 100644
--- a/docs/v2.md
+++ b/docs/v2.md
@@ -117,12 +117,12 @@ conv_result: ConversionResult = doc_converter.convert("https://arxiv.org/pdf/240
 ## Convert several files at once:
 
 input_files = [
-    "tests/data/wiki_duck.html",
-    "tests/data/word_sample.docx",
-    "tests/data/lorem_ipsum.docx",
-    "tests/data/powerpoint_sample.pptx",
+    "tests/data/html/wiki_duck.html",
+    "tests/data/docx/word_sample.docx",
+    "tests/data/docx/lorem_ipsum.docx",
+    "tests/data/pptx/powerpoint_sample.pptx",
     "tests/data/2305.03393v1-pg9-img.png",
-    "tests/data/2206.01062.pdf",
+    "tests/data/pdf/2206.01062.pdf",
 ]
 
 # Directly pass list of files or streams to `convert_all`
diff --git a/mkdocs.yml b/mkdocs.yml
index 0fcc2ca4..b0c01c5e 100644
--- a/mkdocs.yml
+++ b/mkdocs.yml
@@ -54,11 +54,14 @@ theme:
 nav:
   - Home:
     - "Docling": index.md
-    - Installation: installation.md
-    - Usage: usage.md
-    - Supported formats: supported_formats.md
-    - FAQ: faq.md
-    - Docling v2: v2.md
+    - Installation:
+      - Installation: installation/index.md
+    - Usage:
+      - Usage: usage/index.md
+      - Supported formats: usage/supported_formats.md
+      - Enrichment features: usage/enrichments.md
+    - FAQ:
+      - FAQ: faq/index.md
   - Concepts:
     - Concepts: concepts/index.md
     - Architecture: concepts/architecture.md
@@ -72,13 +75,14 @@ nav:
       - "Batch conversion": examples/batch_convert.py
       - "Multi-format conversion": examples/run_with_formats.py
       - "Figure export": examples/export_figures.py
-      - "Figure enrichment": examples/develop_picture_enrichment.py
       - "Table export": examples/export_tables.py
       - "Multimodal export": examples/export_multimodal.py
       - "Force full page OCR": examples/full_page_ocr.py
       - "Automatic OCR language detection with tesseract": examples/tesseract_lang_detection.py
+      - "RapidOCR with custom OCR models": examples/rapidocr_with_custom_models.py
       - "Accelerator options": examples/run_with_accelerator.py
       - "Simple translation": examples/translate.py
+      - examples/backend_csv.ipynb
       - examples/backend_xml_rag.ipynb
     - ✂️ Chunking:
       - examples/hybrid_chunking.ipynb
@@ -86,6 +90,12 @@ nav:
       - examples/rag_haystack.ipynb
       - examples/rag_langchain.ipynb
       - examples/rag_llamaindex.ipynb
+    - 🖼️ Picture annotation:
+      - "Annotate picture with local VLM": examples/pictures_description.ipynb
+      - "Annotate picture with remote VLM": examples/pictures_description_api.py
+    - ✨ Enrichment development:
+      - "Figure enrichment": examples/develop_picture_enrichment.py
+      - "Formula enrichment": examples/develop_formula_understanding.py
     - 🗂️ More examples:
       - examples/rag_weaviate.ipynb
       - RAG with Granite [↗]: https://github.com/ibm-granite-community/granite-snack-cookbook/blob/main/recipes/RAG/Granite_Docling_RAG.ipynb
diff --git a/poetry.lock b/poetry.lock
index 69d41482..404e8262 100644
--- a/poetry.lock
+++ b/poetry.lock
@@ -1,99 +1,135 @@
-# This file is automatically @generated by Poetry 1.8.5 and should not be changed by hand.
+# This file is automatically @generated by Poetry 1.8.4 and should not be changed by hand.
+
+[[package]]
+name = "accelerate"
+version = "1.4.0"
+description = "Accelerate"
+optional = true
+python-versions = ">=3.9.0"
+files = [
+    {file = "accelerate-1.4.0-py3-none-any.whl", hash = "sha256:f6e1e7dfaf9d799a20a1dc45efbf4b1546163eac133faa5acd0d89177c896e55"},
+    {file = "accelerate-1.4.0.tar.gz", hash = "sha256:37d413e1b64cb8681ccd2908ae211cf73e13e6e636a2f598a96eccaa538773a5"},
+]
+
+[package.dependencies]
+huggingface-hub = ">=0.21.0"
+numpy = ">=1.17,<3.0.0"
+packaging = ">=20.0"
+psutil = "*"
+pyyaml = "*"
+safetensors = ">=0.4.3"
+torch = ">=2.0.0"
+
+[package.extras]
+deepspeed = ["deepspeed"]
+dev = ["bitsandbytes", "black (>=23.1,<24.0)", "datasets", "diffusers", "evaluate", "hf-doc-builder (>=0.3.0)", "parameterized", "pytest (>=7.2.0,<=8.0.0)", "pytest-subtests", "pytest-xdist", "rich", "ruff (>=0.6.4,<0.7.0)", "scikit-learn", "scipy", "timm", "torchdata (>=0.8.0)", "torchpippy (>=0.2.0)", "tqdm", "transformers"]
+quality = ["black (>=23.1,<24.0)", "hf-doc-builder (>=0.3.0)", "ruff (>=0.6.4,<0.7.0)"]
+rich = ["rich"]
+sagemaker = ["sagemaker"]
+test-dev = ["bitsandbytes", "datasets", "diffusers", "evaluate", "scikit-learn", "scipy", "timm", "torchdata (>=0.8.0)", "torchpippy (>=0.2.0)", "tqdm", "transformers"]
+test-prod = ["parameterized", "pytest (>=7.2.0,<=8.0.0)", "pytest-subtests", "pytest-xdist"]
+test-trackers = ["comet-ml", "dvclive", "tensorboard", "wandb"]
+testing = ["bitsandbytes", "datasets", "diffusers", "evaluate", "parameterized", "pytest (>=7.2.0,<=8.0.0)", "pytest-subtests", "pytest-xdist", "scikit-learn", "scipy", "timm", "torchdata (>=0.8.0)", "torchpippy (>=0.2.0)", "tqdm", "transformers"]
 
 [[package]]
 name = "aiohappyeyeballs"
-version = "2.4.4"
+version = "2.4.6"
 description = "Happy Eyeballs for asyncio"
 optional = false
-python-versions = ">=3.8"
+python-versions = ">=3.9"
 files = [
-    {file = "aiohappyeyeballs-2.4.4-py3-none-any.whl", hash = "sha256:a980909d50efcd44795c4afeca523296716d50cd756ddca6af8c65b996e27de8"},
-    {file = "aiohappyeyeballs-2.4.4.tar.gz", hash = "sha256:5fdd7d87889c63183afc18ce9271f9b0a7d32c2303e394468dd45d514a757745"},
+    {file = "aiohappyeyeballs-2.4.6-py3-none-any.whl", hash = "sha256:147ec992cf873d74f5062644332c539fcd42956dc69453fe5204195e560517e1"},
+    {file = "aiohappyeyeballs-2.4.6.tar.gz", hash = "sha256:9b05052f9042985d32ecbe4b59a77ae19c006a78f1344d7fdad69d28ded3d0b0"},
 ]
 
 [[package]]
 name = "aiohttp"
-version = "3.11.11"
+version = "3.11.13"
 description = "Async http client/server framework (asyncio)"
 optional = false
 python-versions = ">=3.9"
 files = [
-    {file = "aiohttp-3.11.11-cp310-cp310-macosx_10_9_universal2.whl", hash = "sha256:a60804bff28662cbcf340a4d61598891f12eea3a66af48ecfdc975ceec21e3c8"},
-    {file = "aiohttp-3.11.11-cp310-cp310-macosx_10_9_x86_64.whl", hash = "sha256:4b4fa1cb5f270fb3eab079536b764ad740bb749ce69a94d4ec30ceee1b5940d5"},
-    {file = "aiohttp-3.11.11-cp310-cp310-macosx_11_0_arm64.whl", hash = "sha256:731468f555656767cda219ab42e033355fe48c85fbe3ba83a349631541715ba2"},
-    {file = "aiohttp-3.11.11-cp310-cp310-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:cb23d8bb86282b342481cad4370ea0853a39e4a32a0042bb52ca6bdde132df43"},
-    {file = "aiohttp-3.11.11-cp310-cp310-manylinux_2_17_ppc64le.manylinux2014_ppc64le.whl", hash = "sha256:f047569d655f81cb70ea5be942ee5d4421b6219c3f05d131f64088c73bb0917f"},
-    {file = "aiohttp-3.11.11-cp310-cp310-manylinux_2_17_s390x.manylinux2014_s390x.whl", hash = "sha256:dd7659baae9ccf94ae5fe8bfaa2c7bc2e94d24611528395ce88d009107e00c6d"},
-    {file = "aiohttp-3.11.11-cp310-cp310-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:af01e42ad87ae24932138f154105e88da13ce7d202a6de93fafdafb2883a00ef"},
-    {file = "aiohttp-3.11.11-cp310-cp310-manylinux_2_5_i686.manylinux1_i686.manylinux_2_17_i686.manylinux2014_i686.whl", hash = "sha256:5854be2f3e5a729800bac57a8d76af464e160f19676ab6aea74bde18ad19d438"},
-    {file = "aiohttp-3.11.11-cp310-cp310-musllinux_1_2_aarch64.whl", hash = "sha256:6526e5fb4e14f4bbf30411216780c9967c20c5a55f2f51d3abd6de68320cc2f3"},
-    {file = "aiohttp-3.11.11-cp310-cp310-musllinux_1_2_i686.whl", hash = "sha256:85992ee30a31835fc482468637b3e5bd085fa8fe9392ba0bdcbdc1ef5e9e3c55"},
-    {file = "aiohttp-3.11.11-cp310-cp310-musllinux_1_2_ppc64le.whl", hash = "sha256:88a12ad8ccf325a8a5ed80e6d7c3bdc247d66175afedbe104ee2aaca72960d8e"},
-    {file = "aiohttp-3.11.11-cp310-cp310-musllinux_1_2_s390x.whl", hash = "sha256:0a6d3fbf2232e3a08c41eca81ae4f1dff3d8f1a30bae415ebe0af2d2458b8a33"},
-    {file = "aiohttp-3.11.11-cp310-cp310-musllinux_1_2_x86_64.whl", hash = "sha256:84a585799c58b795573c7fa9b84c455adf3e1d72f19a2bf498b54a95ae0d194c"},
-    {file = "aiohttp-3.11.11-cp310-cp310-win32.whl", hash = "sha256:bfde76a8f430cf5c5584553adf9926534352251d379dcb266ad2b93c54a29745"},
-    {file = "aiohttp-3.11.11-cp310-cp310-win_amd64.whl", hash = "sha256:0fd82b8e9c383af11d2b26f27a478640b6b83d669440c0a71481f7c865a51da9"},
-    {file = "aiohttp-3.11.11-cp311-cp311-macosx_10_9_universal2.whl", hash = "sha256:ba74ec819177af1ef7f59063c6d35a214a8fde6f987f7661f4f0eecc468a8f76"},
-    {file = "aiohttp-3.11.11-cp311-cp311-macosx_10_9_x86_64.whl", hash = "sha256:4af57160800b7a815f3fe0eba9b46bf28aafc195555f1824555fa2cfab6c1538"},
-    {file = "aiohttp-3.11.11-cp311-cp311-macosx_11_0_arm64.whl", hash = "sha256:ffa336210cf9cd8ed117011085817d00abe4c08f99968deef0013ea283547204"},
-    {file = "aiohttp-3.11.11-cp311-cp311-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:81b8fe282183e4a3c7a1b72f5ade1094ed1c6345a8f153506d114af5bf8accd9"},
-    {file = "aiohttp-3.11.11-cp311-cp311-manylinux_2_17_ppc64le.manylinux2014_ppc64le.whl", hash = "sha256:3af41686ccec6a0f2bdc66686dc0f403c41ac2089f80e2214a0f82d001052c03"},
-    {file = "aiohttp-3.11.11-cp311-cp311-manylinux_2_17_s390x.manylinux2014_s390x.whl", hash = "sha256:70d1f9dde0e5dd9e292a6d4d00058737052b01f3532f69c0c65818dac26dc287"},
-    {file = "aiohttp-3.11.11-cp311-cp311-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:249cc6912405917344192b9f9ea5cd5b139d49e0d2f5c7f70bdfaf6b4dbf3a2e"},
-    {file = "aiohttp-3.11.11-cp311-cp311-manylinux_2_5_i686.manylinux1_i686.manylinux_2_17_i686.manylinux2014_i686.whl", hash = "sha256:0eb98d90b6690827dcc84c246811feeb4e1eea683c0eac6caed7549be9c84665"},
-    {file = "aiohttp-3.11.11-cp311-cp311-musllinux_1_2_aarch64.whl", hash = "sha256:ec82bf1fda6cecce7f7b915f9196601a1bd1a3079796b76d16ae4cce6d0ef89b"},
-    {file = "aiohttp-3.11.11-cp311-cp311-musllinux_1_2_i686.whl", hash = "sha256:9fd46ce0845cfe28f108888b3ab17abff84ff695e01e73657eec3f96d72eef34"},
-    {file = "aiohttp-3.11.11-cp311-cp311-musllinux_1_2_ppc64le.whl", hash = "sha256:bd176afcf8f5d2aed50c3647d4925d0db0579d96f75a31e77cbaf67d8a87742d"},
-    {file = "aiohttp-3.11.11-cp311-cp311-musllinux_1_2_s390x.whl", hash = "sha256:ec2aa89305006fba9ffb98970db6c8221541be7bee4c1d027421d6f6df7d1ce2"},
-    {file = "aiohttp-3.11.11-cp311-cp311-musllinux_1_2_x86_64.whl", hash = "sha256:92cde43018a2e17d48bb09c79e4d4cb0e236de5063ce897a5e40ac7cb4878773"},
-    {file = "aiohttp-3.11.11-cp311-cp311-win32.whl", hash = "sha256:aba807f9569455cba566882c8938f1a549f205ee43c27b126e5450dc9f83cc62"},
-    {file = "aiohttp-3.11.11-cp311-cp311-win_amd64.whl", hash = "sha256:ae545f31489548c87b0cced5755cfe5a5308d00407000e72c4fa30b19c3220ac"},
-    {file = "aiohttp-3.11.11-cp312-cp312-macosx_10_13_universal2.whl", hash = "sha256:e595c591a48bbc295ebf47cb91aebf9bd32f3ff76749ecf282ea7f9f6bb73886"},
-    {file = "aiohttp-3.11.11-cp312-cp312-macosx_10_13_x86_64.whl", hash = "sha256:3ea1b59dc06396b0b424740a10a0a63974c725b1c64736ff788a3689d36c02d2"},
-    {file = "aiohttp-3.11.11-cp312-cp312-macosx_11_0_arm64.whl", hash = "sha256:8811f3f098a78ffa16e0ea36dffd577eb031aea797cbdba81be039a4169e242c"},
-    {file = "aiohttp-3.11.11-cp312-cp312-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:bd7227b87a355ce1f4bf83bfae4399b1f5bb42e0259cb9405824bd03d2f4336a"},
-    {file = "aiohttp-3.11.11-cp312-cp312-manylinux_2_17_ppc64le.manylinux2014_ppc64le.whl", hash = "sha256:d40f9da8cabbf295d3a9dae1295c69975b86d941bc20f0a087f0477fa0a66231"},
-    {file = "aiohttp-3.11.11-cp312-cp312-manylinux_2_17_s390x.manylinux2014_s390x.whl", hash = "sha256:ffb3dc385f6bb1568aa974fe65da84723210e5d9707e360e9ecb51f59406cd2e"},
-    {file = "aiohttp-3.11.11-cp312-cp312-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:a8f5f7515f3552d899c61202d99dcb17d6e3b0de777900405611cd747cecd1b8"},
-    {file = "aiohttp-3.11.11-cp312-cp312-manylinux_2_5_i686.manylinux1_i686.manylinux_2_17_i686.manylinux2014_i686.whl", hash = "sha256:3499c7ffbfd9c6a3d8d6a2b01c26639da7e43d47c7b4f788016226b1e711caa8"},
-    {file = "aiohttp-3.11.11-cp312-cp312-musllinux_1_2_aarch64.whl", hash = "sha256:8e2bf8029dbf0810c7bfbc3e594b51c4cc9101fbffb583a3923aea184724203c"},
-    {file = "aiohttp-3.11.11-cp312-cp312-musllinux_1_2_i686.whl", hash = "sha256:b6212a60e5c482ef90f2d788835387070a88d52cf6241d3916733c9176d39eab"},
-    {file = "aiohttp-3.11.11-cp312-cp312-musllinux_1_2_ppc64le.whl", hash = "sha256:d119fafe7b634dbfa25a8c597718e69a930e4847f0b88e172744be24515140da"},
-    {file = "aiohttp-3.11.11-cp312-cp312-musllinux_1_2_s390x.whl", hash = "sha256:6fba278063559acc730abf49845d0e9a9e1ba74f85f0ee6efd5803f08b285853"},
-    {file = "aiohttp-3.11.11-cp312-cp312-musllinux_1_2_x86_64.whl", hash = "sha256:92fc484e34b733704ad77210c7957679c5c3877bd1e6b6d74b185e9320cc716e"},
-    {file = "aiohttp-3.11.11-cp312-cp312-win32.whl", hash = "sha256:9f5b3c1ed63c8fa937a920b6c1bec78b74ee09593b3f5b979ab2ae5ef60d7600"},
-    {file = "aiohttp-3.11.11-cp312-cp312-win_amd64.whl", hash = "sha256:1e69966ea6ef0c14ee53ef7a3d68b564cc408121ea56c0caa2dc918c1b2f553d"},
-    {file = "aiohttp-3.11.11-cp313-cp313-macosx_10_13_universal2.whl", hash = "sha256:541d823548ab69d13d23730a06f97460f4238ad2e5ed966aaf850d7c369782d9"},
-    {file = "aiohttp-3.11.11-cp313-cp313-macosx_10_13_x86_64.whl", hash = "sha256:929f3ed33743a49ab127c58c3e0a827de0664bfcda566108989a14068f820194"},
-    {file = "aiohttp-3.11.11-cp313-cp313-macosx_11_0_arm64.whl", hash = "sha256:0882c2820fd0132240edbb4a51eb8ceb6eef8181db9ad5291ab3332e0d71df5f"},
-    {file = "aiohttp-3.11.11-cp313-cp313-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:b63de12e44935d5aca7ed7ed98a255a11e5cb47f83a9fded7a5e41c40277d104"},
-    {file = "aiohttp-3.11.11-cp313-cp313-manylinux_2_17_ppc64le.manylinux2014_ppc64le.whl", hash = "sha256:aa54f8ef31d23c506910c21163f22b124facb573bff73930735cf9fe38bf7dff"},
-    {file = "aiohttp-3.11.11-cp313-cp313-manylinux_2_17_s390x.manylinux2014_s390x.whl", hash = "sha256:a344d5dc18074e3872777b62f5f7d584ae4344cd6006c17ba12103759d407af3"},
-    {file = "aiohttp-3.11.11-cp313-cp313-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:0b7fb429ab1aafa1f48578eb315ca45bd46e9c37de11fe45c7f5f4138091e2f1"},
-    {file = "aiohttp-3.11.11-cp313-cp313-manylinux_2_5_i686.manylinux1_i686.manylinux_2_17_i686.manylinux2014_i686.whl", hash = "sha256:c341c7d868750e31961d6d8e60ff040fb9d3d3a46d77fd85e1ab8e76c3e9a5c4"},
-    {file = "aiohttp-3.11.11-cp313-cp313-musllinux_1_2_aarch64.whl", hash = "sha256:ed9ee95614a71e87f1a70bc81603f6c6760128b140bc4030abe6abaa988f1c3d"},
-    {file = "aiohttp-3.11.11-cp313-cp313-musllinux_1_2_i686.whl", hash = "sha256:de8d38f1c2810fa2a4f1d995a2e9c70bb8737b18da04ac2afbf3971f65781d87"},
-    {file = "aiohttp-3.11.11-cp313-cp313-musllinux_1_2_ppc64le.whl", hash = "sha256:a9b7371665d4f00deb8f32208c7c5e652059b0fda41cf6dbcac6114a041f1cc2"},
-    {file = "aiohttp-3.11.11-cp313-cp313-musllinux_1_2_s390x.whl", hash = "sha256:620598717fce1b3bd14dd09947ea53e1ad510317c85dda2c9c65b622edc96b12"},
-    {file = "aiohttp-3.11.11-cp313-cp313-musllinux_1_2_x86_64.whl", hash = "sha256:bf8d9bfee991d8acc72d060d53860f356e07a50f0e0d09a8dfedea1c554dd0d5"},
-    {file = "aiohttp-3.11.11-cp313-cp313-win32.whl", hash = "sha256:9d73ee3725b7a737ad86c2eac5c57a4a97793d9f442599bea5ec67ac9f4bdc3d"},
-    {file = "aiohttp-3.11.11-cp313-cp313-win_amd64.whl", hash = "sha256:c7a06301c2fb096bdb0bd25fe2011531c1453b9f2c163c8031600ec73af1cc99"},
-    {file = "aiohttp-3.11.11-cp39-cp39-macosx_10_9_universal2.whl", hash = "sha256:3e23419d832d969f659c208557de4a123e30a10d26e1e14b73431d3c13444c2e"},
-    {file = "aiohttp-3.11.11-cp39-cp39-macosx_10_9_x86_64.whl", hash = "sha256:21fef42317cf02e05d3b09c028712e1d73a9606f02467fd803f7c1f39cc59add"},
-    {file = "aiohttp-3.11.11-cp39-cp39-macosx_11_0_arm64.whl", hash = "sha256:1f21bb8d0235fc10c09ce1d11ffbd40fc50d3f08a89e4cf3a0c503dc2562247a"},
-    {file = "aiohttp-3.11.11-cp39-cp39-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:1642eceeaa5ab6c9b6dfeaaa626ae314d808188ab23ae196a34c9d97efb68350"},
-    {file = "aiohttp-3.11.11-cp39-cp39-manylinux_2_17_ppc64le.manylinux2014_ppc64le.whl", hash = "sha256:2170816e34e10f2fd120f603e951630f8a112e1be3b60963a1f159f5699059a6"},
-    {file = "aiohttp-3.11.11-cp39-cp39-manylinux_2_17_s390x.manylinux2014_s390x.whl", hash = "sha256:8be8508d110d93061197fd2d6a74f7401f73b6d12f8822bbcd6d74f2b55d71b1"},
-    {file = "aiohttp-3.11.11-cp39-cp39-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:4eed954b161e6b9b65f6be446ed448ed3921763cc432053ceb606f89d793927e"},
-    {file = "aiohttp-3.11.11-cp39-cp39-manylinux_2_5_i686.manylinux1_i686.manylinux_2_17_i686.manylinux2014_i686.whl", hash = "sha256:d6c9af134da4bc9b3bd3e6a70072509f295d10ee60c697826225b60b9959acdd"},
-    {file = "aiohttp-3.11.11-cp39-cp39-musllinux_1_2_aarch64.whl", hash = "sha256:44167fc6a763d534a6908bdb2592269b4bf30a03239bcb1654781adf5e49caf1"},
-    {file = "aiohttp-3.11.11-cp39-cp39-musllinux_1_2_i686.whl", hash = "sha256:479b8c6ebd12aedfe64563b85920525d05d394b85f166b7873c8bde6da612f9c"},
-    {file = "aiohttp-3.11.11-cp39-cp39-musllinux_1_2_ppc64le.whl", hash = "sha256:10b4ff0ad793d98605958089fabfa350e8e62bd5d40aa65cdc69d6785859f94e"},
-    {file = "aiohttp-3.11.11-cp39-cp39-musllinux_1_2_s390x.whl", hash = "sha256:b540bd67cfb54e6f0865ceccd9979687210d7ed1a1cc8c01f8e67e2f1e883d28"},
-    {file = "aiohttp-3.11.11-cp39-cp39-musllinux_1_2_x86_64.whl", hash = "sha256:1dac54e8ce2ed83b1f6b1a54005c87dfed139cf3f777fdc8afc76e7841101226"},
-    {file = "aiohttp-3.11.11-cp39-cp39-win32.whl", hash = "sha256:568c1236b2fde93b7720f95a890741854c1200fba4a3471ff48b2934d2d93fd3"},
-    {file = "aiohttp-3.11.11-cp39-cp39-win_amd64.whl", hash = "sha256:943a8b052e54dfd6439fd7989f67fc6a7f2138d0a2cf0a7de5f18aa4fe7eb3b1"},
-    {file = "aiohttp-3.11.11.tar.gz", hash = "sha256:bb49c7f1e6ebf3821a42d81d494f538107610c3a705987f53068546b0e90303e"},
+    {file = "aiohttp-3.11.13-cp310-cp310-macosx_10_9_universal2.whl", hash = "sha256:a4fe27dbbeec445e6e1291e61d61eb212ee9fed6e47998b27de71d70d3e8777d"},
+    {file = "aiohttp-3.11.13-cp310-cp310-macosx_10_9_x86_64.whl", hash = "sha256:9e64ca2dbea28807f8484c13f684a2f761e69ba2640ec49dacd342763cc265ef"},
+    {file = "aiohttp-3.11.13-cp310-cp310-macosx_11_0_arm64.whl", hash = "sha256:9840be675de208d1f68f84d578eaa4d1a36eee70b16ae31ab933520c49ba1325"},
+    {file = "aiohttp-3.11.13-cp310-cp310-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:28a772757c9067e2aee8a6b2b425d0efaa628c264d6416d283694c3d86da7689"},
+    {file = "aiohttp-3.11.13-cp310-cp310-manylinux_2_17_ppc64le.manylinux2014_ppc64le.whl", hash = "sha256:b88aca5adbf4625e11118df45acac29616b425833c3be7a05ef63a6a4017bfdb"},
+    {file = "aiohttp-3.11.13-cp310-cp310-manylinux_2_17_s390x.manylinux2014_s390x.whl", hash = "sha256:ce10ddfbe26ed5856d6902162f71b8fe08545380570a885b4ab56aecfdcb07f4"},
+    {file = "aiohttp-3.11.13-cp310-cp310-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:fa48dac27f41b36735c807d1ab093a8386701bbf00eb6b89a0f69d9fa26b3671"},
+    {file = "aiohttp-3.11.13-cp310-cp310-manylinux_2_5_i686.manylinux1_i686.manylinux_2_17_i686.manylinux2014_i686.whl", hash = "sha256:89ce611b1eac93ce2ade68f1470889e0173d606de20c85a012bfa24be96cf867"},
+    {file = "aiohttp-3.11.13-cp310-cp310-musllinux_1_2_aarch64.whl", hash = "sha256:78e4dd9c34ec7b8b121854eb5342bac8b02aa03075ae8618b6210a06bbb8a115"},
+    {file = "aiohttp-3.11.13-cp310-cp310-musllinux_1_2_armv7l.whl", hash = "sha256:66047eacbc73e6fe2462b77ce39fc170ab51235caf331e735eae91c95e6a11e4"},
+    {file = "aiohttp-3.11.13-cp310-cp310-musllinux_1_2_i686.whl", hash = "sha256:5ad8f1c19fe277eeb8bc45741c6d60ddd11d705c12a4d8ee17546acff98e0802"},
+    {file = "aiohttp-3.11.13-cp310-cp310-musllinux_1_2_ppc64le.whl", hash = "sha256:64815c6f02e8506b10113ddbc6b196f58dbef135751cc7c32136df27b736db09"},
+    {file = "aiohttp-3.11.13-cp310-cp310-musllinux_1_2_s390x.whl", hash = "sha256:967b93f21b426f23ca37329230d5bd122f25516ae2f24a9cea95a30023ff8283"},
+    {file = "aiohttp-3.11.13-cp310-cp310-musllinux_1_2_x86_64.whl", hash = "sha256:cf1f31f83d16ec344136359001c5e871915c6ab685a3d8dee38e2961b4c81730"},
+    {file = "aiohttp-3.11.13-cp310-cp310-win32.whl", hash = "sha256:00c8ac69e259c60976aa2edae3f13d9991cf079aaa4d3cd5a49168ae3748dee3"},
+    {file = "aiohttp-3.11.13-cp310-cp310-win_amd64.whl", hash = "sha256:90d571c98d19a8b6e793b34aa4df4cee1e8fe2862d65cc49185a3a3d0a1a3996"},
+    {file = "aiohttp-3.11.13-cp311-cp311-macosx_10_9_universal2.whl", hash = "sha256:6b35aab22419ba45f8fc290d0010898de7a6ad131e468ffa3922b1b0b24e9d2e"},
+    {file = "aiohttp-3.11.13-cp311-cp311-macosx_10_9_x86_64.whl", hash = "sha256:f81cba651db8795f688c589dd11a4fbb834f2e59bbf9bb50908be36e416dc760"},
+    {file = "aiohttp-3.11.13-cp311-cp311-macosx_11_0_arm64.whl", hash = "sha256:f55d0f242c2d1fcdf802c8fabcff25a9d85550a4cf3a9cf5f2a6b5742c992839"},
+    {file = "aiohttp-3.11.13-cp311-cp311-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:c4bea08a6aad9195ac9b1be6b0c7e8a702a9cec57ce6b713698b4a5afa9c2e33"},
+    {file = "aiohttp-3.11.13-cp311-cp311-manylinux_2_17_ppc64le.manylinux2014_ppc64le.whl", hash = "sha256:c6070bcf2173a7146bb9e4735b3c62b2accba459a6eae44deea0eb23e0035a23"},
+    {file = "aiohttp-3.11.13-cp311-cp311-manylinux_2_17_s390x.manylinux2014_s390x.whl", hash = "sha256:718d5deb678bc4b9d575bfe83a59270861417da071ab44542d0fcb6faa686636"},
+    {file = "aiohttp-3.11.13-cp311-cp311-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:0f6b2c5b4a4d22b8fb2c92ac98e0747f5f195e8e9448bfb7404cd77e7bfa243f"},
+    {file = "aiohttp-3.11.13-cp311-cp311-manylinux_2_5_i686.manylinux1_i686.manylinux_2_17_i686.manylinux2014_i686.whl", hash = "sha256:747ec46290107a490d21fe1ff4183bef8022b848cf9516970cb31de6d9460088"},
+    {file = "aiohttp-3.11.13-cp311-cp311-musllinux_1_2_aarch64.whl", hash = "sha256:01816f07c9cc9d80f858615b1365f8319d6a5fd079cd668cc58e15aafbc76a54"},
+    {file = "aiohttp-3.11.13-cp311-cp311-musllinux_1_2_armv7l.whl", hash = "sha256:a08ad95fcbd595803e0c4280671d808eb170a64ca3f2980dd38e7a72ed8d1fea"},
+    {file = "aiohttp-3.11.13-cp311-cp311-musllinux_1_2_i686.whl", hash = "sha256:c97be90d70f7db3aa041d720bfb95f4869d6063fcdf2bb8333764d97e319b7d0"},
+    {file = "aiohttp-3.11.13-cp311-cp311-musllinux_1_2_ppc64le.whl", hash = "sha256:ab915a57c65f7a29353c8014ac4be685c8e4a19e792a79fe133a8e101111438e"},
+    {file = "aiohttp-3.11.13-cp311-cp311-musllinux_1_2_s390x.whl", hash = "sha256:35cda4e07f5e058a723436c4d2b7ba2124ab4e0aa49e6325aed5896507a8a42e"},
+    {file = "aiohttp-3.11.13-cp311-cp311-musllinux_1_2_x86_64.whl", hash = "sha256:af55314407714fe77a68a9ccaab90fdb5deb57342585fd4a3a8102b6d4370080"},
+    {file = "aiohttp-3.11.13-cp311-cp311-win32.whl", hash = "sha256:42d689a5c0a0c357018993e471893e939f555e302313d5c61dfc566c2cad6185"},
+    {file = "aiohttp-3.11.13-cp311-cp311-win_amd64.whl", hash = "sha256:b73a2b139782a07658fbf170fe4bcdf70fc597fae5ffe75e5b67674c27434a9f"},
+    {file = "aiohttp-3.11.13-cp312-cp312-macosx_10_13_universal2.whl", hash = "sha256:2eabb269dc3852537d57589b36d7f7362e57d1ece308842ef44d9830d2dc3c90"},
+    {file = "aiohttp-3.11.13-cp312-cp312-macosx_10_13_x86_64.whl", hash = "sha256:7b77ee42addbb1c36d35aca55e8cc6d0958f8419e458bb70888d8c69a4ca833d"},
+    {file = "aiohttp-3.11.13-cp312-cp312-macosx_11_0_arm64.whl", hash = "sha256:55789e93c5ed71832e7fac868167276beadf9877b85697020c46e9a75471f55f"},
+    {file = "aiohttp-3.11.13-cp312-cp312-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:c929f9a7249a11e4aa5c157091cfad7f49cc6b13f4eecf9b747104befd9f56f2"},
+    {file = "aiohttp-3.11.13-cp312-cp312-manylinux_2_17_ppc64le.manylinux2014_ppc64le.whl", hash = "sha256:d33851d85537bbf0f6291ddc97926a754c8f041af759e0aa0230fe939168852b"},
+    {file = "aiohttp-3.11.13-cp312-cp312-manylinux_2_17_s390x.manylinux2014_s390x.whl", hash = "sha256:9229d8613bd8401182868fe95688f7581673e1c18ff78855671a4b8284f47bcb"},
+    {file = "aiohttp-3.11.13-cp312-cp312-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:669dd33f028e54fe4c96576f406ebb242ba534dd3a981ce009961bf49960f117"},
+    {file = "aiohttp-3.11.13-cp312-cp312-manylinux_2_5_i686.manylinux1_i686.manylinux_2_17_i686.manylinux2014_i686.whl", hash = "sha256:7c1b20a1ace54af7db1f95af85da530fe97407d9063b7aaf9ce6a32f44730778"},
+    {file = "aiohttp-3.11.13-cp312-cp312-musllinux_1_2_aarch64.whl", hash = "sha256:5724cc77f4e648362ebbb49bdecb9e2b86d9b172c68a295263fa072e679ee69d"},
+    {file = "aiohttp-3.11.13-cp312-cp312-musllinux_1_2_armv7l.whl", hash = "sha256:aa36c35e94ecdb478246dd60db12aba57cfcd0abcad43c927a8876f25734d496"},
+    {file = "aiohttp-3.11.13-cp312-cp312-musllinux_1_2_i686.whl", hash = "sha256:9b5b37c863ad5b0892cc7a4ceb1e435e5e6acd3f2f8d3e11fa56f08d3c67b820"},
+    {file = "aiohttp-3.11.13-cp312-cp312-musllinux_1_2_ppc64le.whl", hash = "sha256:e06cf4852ce8c4442a59bae5a3ea01162b8fcb49ab438d8548b8dc79375dad8a"},
+    {file = "aiohttp-3.11.13-cp312-cp312-musllinux_1_2_s390x.whl", hash = "sha256:5194143927e494616e335d074e77a5dac7cd353a04755330c9adc984ac5a628e"},
+    {file = "aiohttp-3.11.13-cp312-cp312-musllinux_1_2_x86_64.whl", hash = "sha256:afcb6b275c2d2ba5d8418bf30a9654fa978b4f819c2e8db6311b3525c86fe637"},
+    {file = "aiohttp-3.11.13-cp312-cp312-win32.whl", hash = "sha256:7104d5b3943c6351d1ad7027d90bdd0ea002903e9f610735ac99df3b81f102ee"},
+    {file = "aiohttp-3.11.13-cp312-cp312-win_amd64.whl", hash = "sha256:47dc018b1b220c48089b5b9382fbab94db35bef2fa192995be22cbad3c5730c8"},
+    {file = "aiohttp-3.11.13-cp313-cp313-macosx_10_13_universal2.whl", hash = "sha256:9862d077b9ffa015dbe3ce6c081bdf35135948cb89116e26667dd183550833d1"},
+    {file = "aiohttp-3.11.13-cp313-cp313-macosx_10_13_x86_64.whl", hash = "sha256:fbfef0666ae9e07abfa2c54c212ac18a1f63e13e0760a769f70b5717742f3ece"},
+    {file = "aiohttp-3.11.13-cp313-cp313-macosx_11_0_arm64.whl", hash = "sha256:93a1f7d857c4fcf7cabb1178058182c789b30d85de379e04f64c15b7e88d66fb"},
+    {file = "aiohttp-3.11.13-cp313-cp313-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:ba40b7ae0f81c7029583a338853f6607b6d83a341a3dcde8bed1ea58a3af1df9"},
+    {file = "aiohttp-3.11.13-cp313-cp313-manylinux_2_17_ppc64le.manylinux2014_ppc64le.whl", hash = "sha256:b5b95787335c483cd5f29577f42bbe027a412c5431f2f80a749c80d040f7ca9f"},
+    {file = "aiohttp-3.11.13-cp313-cp313-manylinux_2_17_s390x.manylinux2014_s390x.whl", hash = "sha256:a7d474c5c1f0b9405c1565fafdc4429fa7d986ccbec7ce55bc6a330f36409cad"},
+    {file = "aiohttp-3.11.13-cp313-cp313-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:1e83fb1991e9d8982b3b36aea1e7ad27ea0ce18c14d054c7a404d68b0319eebb"},
+    {file = "aiohttp-3.11.13-cp313-cp313-manylinux_2_5_i686.manylinux1_i686.manylinux_2_17_i686.manylinux2014_i686.whl", hash = "sha256:4586a68730bd2f2b04a83e83f79d271d8ed13763f64b75920f18a3a677b9a7f0"},
+    {file = "aiohttp-3.11.13-cp313-cp313-musllinux_1_2_aarch64.whl", hash = "sha256:9fe4eb0e7f50cdb99b26250d9328faef30b1175a5dbcfd6d0578d18456bac567"},
+    {file = "aiohttp-3.11.13-cp313-cp313-musllinux_1_2_armv7l.whl", hash = "sha256:2a8a6bc19818ac3e5596310ace5aa50d918e1ebdcc204dc96e2f4d505d51740c"},
+    {file = "aiohttp-3.11.13-cp313-cp313-musllinux_1_2_i686.whl", hash = "sha256:7f27eec42f6c3c1df09cfc1f6786308f8b525b8efaaf6d6bd76c1f52c6511f6a"},
+    {file = "aiohttp-3.11.13-cp313-cp313-musllinux_1_2_ppc64le.whl", hash = "sha256:2a4a13dfbb23977a51853b419141cd0a9b9573ab8d3a1455c6e63561387b52ff"},
+    {file = "aiohttp-3.11.13-cp313-cp313-musllinux_1_2_s390x.whl", hash = "sha256:02876bf2f69b062584965507b07bc06903c2dc93c57a554b64e012d636952654"},
+    {file = "aiohttp-3.11.13-cp313-cp313-musllinux_1_2_x86_64.whl", hash = "sha256:b992778d95b60a21c4d8d4a5f15aaab2bd3c3e16466a72d7f9bfd86e8cea0d4b"},
+    {file = "aiohttp-3.11.13-cp313-cp313-win32.whl", hash = "sha256:507ab05d90586dacb4f26a001c3abf912eb719d05635cbfad930bdbeb469b36c"},
+    {file = "aiohttp-3.11.13-cp313-cp313-win_amd64.whl", hash = "sha256:5ceb81a4db2decdfa087381b5fc5847aa448244f973e5da232610304e199e7b2"},
+    {file = "aiohttp-3.11.13-cp39-cp39-macosx_10_9_universal2.whl", hash = "sha256:51c3ff9c7a25f3cad5c09d9aacbc5aefb9267167c4652c1eb737989b554fe278"},
+    {file = "aiohttp-3.11.13-cp39-cp39-macosx_10_9_x86_64.whl", hash = "sha256:e271beb2b1dabec5cd84eb488bdabf9758d22ad13471e9c356be07ad139b3012"},
+    {file = "aiohttp-3.11.13-cp39-cp39-macosx_11_0_arm64.whl", hash = "sha256:0e9eb7e5764abcb49f0e2bd8f5731849b8728efbf26d0cac8e81384c95acec3f"},
+    {file = "aiohttp-3.11.13-cp39-cp39-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:baae005092e3f200de02699314ac8933ec20abf998ec0be39448f6605bce93df"},
+    {file = "aiohttp-3.11.13-cp39-cp39-manylinux_2_17_ppc64le.manylinux2014_ppc64le.whl", hash = "sha256:1982c98ac62c132d2b773d50e2fcc941eb0b8bad3ec078ce7e7877c4d5a2dce7"},
+    {file = "aiohttp-3.11.13-cp39-cp39-manylinux_2_17_s390x.manylinux2014_s390x.whl", hash = "sha256:d2b25b2eeb35707113b2d570cadc7c612a57f1c5d3e7bb2b13870fe284e08fc0"},
+    {file = "aiohttp-3.11.13-cp39-cp39-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:b27961d65639128336b7a7c3f0046dcc62a9443d5ef962e3c84170ac620cec47"},
+    {file = "aiohttp-3.11.13-cp39-cp39-manylinux_2_5_i686.manylinux1_i686.manylinux_2_17_i686.manylinux2014_i686.whl", hash = "sha256:a01fe9f1e05025eacdd97590895e2737b9f851d0eb2e017ae9574d9a4f0b6252"},
+    {file = "aiohttp-3.11.13-cp39-cp39-musllinux_1_2_aarch64.whl", hash = "sha256:fa1fb1b61881c8405829c50e9cc5c875bfdbf685edf57a76817dfb50643e4a1a"},
+    {file = "aiohttp-3.11.13-cp39-cp39-musllinux_1_2_armv7l.whl", hash = "sha256:25de43bb3cf83ad83efc8295af7310219af6dbe4c543c2e74988d8e9c8a2a917"},
+    {file = "aiohttp-3.11.13-cp39-cp39-musllinux_1_2_i686.whl", hash = "sha256:fe7065e2215e4bba63dc00db9ae654c1ba3950a5fff691475a32f511142fcddb"},
+    {file = "aiohttp-3.11.13-cp39-cp39-musllinux_1_2_ppc64le.whl", hash = "sha256:7836587eef675a17d835ec3d98a8c9acdbeb2c1d72b0556f0edf4e855a25e9c1"},
+    {file = "aiohttp-3.11.13-cp39-cp39-musllinux_1_2_s390x.whl", hash = "sha256:85fa0b18558eb1427090912bd456a01f71edab0872f4e0f9e4285571941e4090"},
+    {file = "aiohttp-3.11.13-cp39-cp39-musllinux_1_2_x86_64.whl", hash = "sha256:a86dc177eb4c286c19d1823ac296299f59ed8106c9536d2b559f65836e0fb2c6"},
+    {file = "aiohttp-3.11.13-cp39-cp39-win32.whl", hash = "sha256:684eea71ab6e8ade86b9021bb62af4bf0881f6be4e926b6b5455de74e420783a"},
+    {file = "aiohttp-3.11.13-cp39-cp39-win_amd64.whl", hash = "sha256:82c249f2bfa5ecbe4a1a7902c81c0fba52ed9ebd0176ab3047395d02ad96cfcb"},
+    {file = "aiohttp-3.11.13.tar.gz", hash = "sha256:8ce789231404ca8fff7f693cdce398abf6d90fd5dae2b1847477196c243b1fbb"},
 ]
 
 [package.dependencies]
@@ -248,17 +284,17 @@ tomli = {version = "*", markers = "python_version < \"3.11\""}
 
 [[package]]
 name = "babel"
-version = "2.16.0"
+version = "2.17.0"
 description = "Internationalization utilities"
 optional = false
 python-versions = ">=3.8"
 files = [
-    {file = "babel-2.16.0-py3-none-any.whl", hash = "sha256:368b5b98b37c06b7daf6696391c3240c938b37767d4584413e8438c5c435fa8b"},
-    {file = "babel-2.16.0.tar.gz", hash = "sha256:d1f3554ca26605fe173f3de0c65f750f5a42f924499bf134de6423582298e316"},
+    {file = "babel-2.17.0-py3-none-any.whl", hash = "sha256:4d0b53093fdfb4b21c92b5213dba5a1b23885afa8383709427046b21c366e5f2"},
+    {file = "babel-2.17.0.tar.gz", hash = "sha256:0c54cffb19f690cdcc52a3b50bcbf71e07a808d1c80d549f2459b9d2cf0afb9d"},
 ]
 
 [package.extras]
-dev = ["freezegun (>=1.0,<2.0)", "pytest (>=6.0)", "pytest-cov"]
+dev = ["backports.zoneinfo", "freezegun (>=1.0,<2.0)", "jinja2 (>=3.0)", "pytest (>=6.0)", "pytest-cov", "pytz", "setuptools", "tzdata"]
 
 [[package]]
 name = "backports-tarfile"
@@ -277,17 +313,18 @@ testing = ["jaraco.test", "pytest (!=8.0.*)", "pytest (>=6,!=8.1.*)", "pytest-ch
 
 [[package]]
 name = "beautifulsoup4"
-version = "4.12.3"
+version = "4.13.3"
 description = "Screen-scraping library"
 optional = false
-python-versions = ">=3.6.0"
+python-versions = ">=3.7.0"
 files = [
-    {file = "beautifulsoup4-4.12.3-py3-none-any.whl", hash = "sha256:b80878c9f40111313e55da8ba20bdba06d8fa3969fc68304167741bbf9e082ed"},
-    {file = "beautifulsoup4-4.12.3.tar.gz", hash = "sha256:74e3d1928edc070d21748185c46e3fb33490f22f52a3addee9aee0f4f7781051"},
+    {file = "beautifulsoup4-4.13.3-py3-none-any.whl", hash = "sha256:99045d7d3f08f91f0d656bc9b7efbae189426cd913d830294a15eefa0ea4df16"},
+    {file = "beautifulsoup4-4.13.3.tar.gz", hash = "sha256:1bd32405dacc920b42b83ba01644747ed77456a65760e285fbc47633ceddaf8b"},
 ]
 
 [package.dependencies]
 soupsieve = ">1.2"
+typing-extensions = ">=4.0.0"
 
 [package.extras]
 cchardet = ["cchardet"]
@@ -364,13 +401,13 @@ css = ["tinycss2 (>=1.1.0,<1.5)"]
 
 [[package]]
 name = "certifi"
-version = "2024.12.14"
+version = "2025.1.31"
 description = "Python package for providing Mozilla's CA Bundle."
 optional = false
 python-versions = ">=3.6"
 files = [
-    {file = "certifi-2024.12.14-py3-none-any.whl", hash = "sha256:1275f7a45be9464efc1173084eaa30f866fe2e47d389406136d332ed4967ec56"},
-    {file = "certifi-2024.12.14.tar.gz", hash = "sha256:b650d30f370c2b724812bee08008be0c4163b163ddaec3f2546c1caf65f191db"},
+    {file = "certifi-2025.1.31-py3-none-any.whl", hash = "sha256:ca78db4565a652026a4db2bcdf68f2fb589ea80d0be70e03929ed730746b84fe"},
+    {file = "certifi-2025.1.31.tar.gz", hash = "sha256:3d5da6925056f6f18f119200434a4780a94263f10d1c21d032a6f6b2baa20651"},
 ]
 
 [[package]]
@@ -767,61 +804,15 @@ files = [
 
 [[package]]
 name = "decorator"
-version = "5.1.1"
+version = "5.2.1"
 description = "Decorators for Humans"
 optional = false
-python-versions = ">=3.5"
+python-versions = ">=3.8"
 files = [
-    {file = "decorator-5.1.1-py3-none-any.whl", hash = "sha256:b8c3f85900b9dc423225913c5aace94729fe1fa9763b38939a95226f02d37186"},
-    {file = "decorator-5.1.1.tar.gz", hash = "sha256:637996211036b6385ef91435e4fae22989472f9d571faba8927ba8253acbc330"},
+    {file = "decorator-5.2.1-py3-none-any.whl", hash = "sha256:d316bb415a2d9e2d2b3abcc4084c6502fc09240e292cd76a76afc106a1c8e04a"},
+    {file = "decorator-5.2.1.tar.gz", hash = "sha256:65f266143752f734b0a7cc83c46f4618af75b8c5911b00ccb61d0ac9b6da0360"},
 ]
 
-[[package]]
-name = "deepsearch-glm"
-version = "1.0.0"
-description = "Graph Language Models"
-optional = false
-python-versions = "<4.0,>=3.9"
-files = [
-    {file = "deepsearch_glm-1.0.0-cp310-cp310-macosx_13_0_x86_64.whl", hash = "sha256:94792b57df7a1c4ba8b47ebd8f36ea0a090d4f27a4fba39bd7b166b6b537260a"},
-    {file = "deepsearch_glm-1.0.0-cp310-cp310-macosx_14_0_arm64.whl", hash = "sha256:ff46e352e96a2f56ce7ae4fdf04b271ee841c29ff159b1dec0e5ecaaadba8d4d"},
-    {file = "deepsearch_glm-1.0.0-cp310-cp310-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:9d77d3d94d49641888aa15f3ad23e81158e791aa9d9608dd8168dc71788e56f3"},
-    {file = "deepsearch_glm-1.0.0-cp310-cp310-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:143de0fd111a570be12935d8799a2715fe1775d4dc4e256337860b429cee5d36"},
-    {file = "deepsearch_glm-1.0.0-cp310-cp310-win_amd64.whl", hash = "sha256:9f2872dd573cd2206ce7f9e2e6016c38b66d9ecbd983283ff5e8c6023813c311"},
-    {file = "deepsearch_glm-1.0.0-cp311-cp311-macosx_13_0_x86_64.whl", hash = "sha256:e64d94ff5209f0a11e8c75c6b28b033ef27b95a22c2fbcbd945e7fe8cc421545"},
-    {file = "deepsearch_glm-1.0.0-cp311-cp311-macosx_14_0_arm64.whl", hash = "sha256:a5702205677b768b51f881d15d933370f6ef3c826dfac3b9aa0b904d2e6c495a"},
-    {file = "deepsearch_glm-1.0.0-cp311-cp311-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:0417a2ae998e1709f03458cfb9adb55423bb1328224eb055300796baa757879f"},
-    {file = "deepsearch_glm-1.0.0-cp311-cp311-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:6f0e1efe9af0d28e9b473fe599246deb3a0be7c3d546a478da284747144d086a"},
-    {file = "deepsearch_glm-1.0.0-cp311-cp311-win_amd64.whl", hash = "sha256:807faf13eb0deea55a1951d479a85d5e20de0ff8b2e0b57b2f7939552759a426"},
-    {file = "deepsearch_glm-1.0.0-cp312-cp312-macosx_13_0_x86_64.whl", hash = "sha256:56d9575df9eceb8c2ae33e3d15e133924cc195714c3d268599b6f8414c1f6bb8"},
-    {file = "deepsearch_glm-1.0.0-cp312-cp312-macosx_14_0_arm64.whl", hash = "sha256:51f5c6522f60ba73eb12eeb7217bd98d871ba7c078337a4059d05878d8baf2d6"},
-    {file = "deepsearch_glm-1.0.0-cp312-cp312-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:c6211eaf497ad7cfcb68f80f9b5387940be0204fe149a9fc03988a95145f410a"},
-    {file = "deepsearch_glm-1.0.0-cp312-cp312-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:1b003bf457fce61ea4de79e2d7d0228a1ae349f677eb6570e745f79d4429804f"},
-    {file = "deepsearch_glm-1.0.0-cp312-cp312-win_amd64.whl", hash = "sha256:9d61f66048e6ab60fe9f84c823fd593bf8517755833bd9efb59156d77a2b42d0"},
-    {file = "deepsearch_glm-1.0.0-cp313-cp313-macosx_13_0_x86_64.whl", hash = "sha256:7d558e8b365c27ee665d0589165fd074fb252c73715f9cc6aeb4304a63683f37"},
-    {file = "deepsearch_glm-1.0.0-cp313-cp313-macosx_14_0_arm64.whl", hash = "sha256:3199093a9472e5756214b9b6563f827c19c001c7dd8ae00e03eed1140c12930d"},
-    {file = "deepsearch_glm-1.0.0-cp313-cp313-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:7f18d1ee68a0479592e0c714e6cbf9e2d0fa8edd692d580da64431c84cbef5c2"},
-    {file = "deepsearch_glm-1.0.0-cp313-cp313-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:62c1c0ea0a544219da15c017632f9e0be116ecdc335b865c6c5760429557fe23"},
-    {file = "deepsearch_glm-1.0.0-cp313-cp313-win_amd64.whl", hash = "sha256:962f393dcec2204de1a5cb0f635c65258bde2424ad2d4e0f5df770139c3958de"},
-    {file = "deepsearch_glm-1.0.0-cp39-cp39-macosx_13_0_x86_64.whl", hash = "sha256:4d328336950975c583d318a70e3511075d1ac1c599c2090a2a7928a4662fe8f2"},
-    {file = "deepsearch_glm-1.0.0-cp39-cp39-macosx_14_0_arm64.whl", hash = "sha256:748d077a4cacd714ff23a095c873549c176fa5ffe1a656be1bd11873148e58db"},
-    {file = "deepsearch_glm-1.0.0-cp39-cp39-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:1c0953d1983e902327f0cc152ff8267056ec2699106eefc70a41eec6eebdbe1b"},
-    {file = "deepsearch_glm-1.0.0-cp39-cp39-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:105c50b2e5b8f9a6ea5fb0b755a9cd38a1fb12ecb07f1a13d1290ad3cdfeaa90"},
-    {file = "deepsearch_glm-1.0.0-cp39-cp39-win_amd64.whl", hash = "sha256:25bb899317f6af062083daa578f343c93a2b12755c174549fb58596de0bc7b9d"},
-    {file = "deepsearch_glm-1.0.0-pp310-pypy310_pp73-win_amd64.whl", hash = "sha256:e2315cc4ffe7032dada294a0cd72a47dbc6c0121fd07d4b5719f9a9e9519d091"},
-    {file = "deepsearch_glm-1.0.0-pp39-pypy39_pp73-win_amd64.whl", hash = "sha256:707b92f51bacbd0f799ee3351474766bf916ef82f97c1bcc0e7696532ba03535"},
-    {file = "deepsearch_glm-1.0.0.tar.gz", hash = "sha256:e8dce88ac519a693c260f28bd3c4ec409811e65ade84fb508f6c6e37ca065e62"},
-]
-
-[package.dependencies]
-pywin32 = {version = ">=307,<308", markers = "sys_platform == \"win32\""}
-
-[package.extras]
-docling = ["docling-core (>=2.0,<3.0)", "pandas (>=1.5.1,<3.0.0)"]
-pyplot = ["matplotlib (>=3.7.1,<4.0.0)"]
-toolkit = ["deepsearch-toolkit (>=1.1.0,<2.0.0)", "python-dotenv (>=1.0.0,<2.0.0)"]
-utils = ["pandas (>=1.5.1,<3.0.0)", "python-dotenv (>=1.0.0,<2.0.0)", "requests (>=2.32.3,<3.0.0)", "rich (>=13.7.0,<14.0.0)", "tabulate (>=0.8.9)", "tqdm (>=4.64.0,<5.0.0)"]
-
 [[package]]
 name = "defusedxml"
 version = "0.7.1"
@@ -861,20 +852,21 @@ files = [
 
 [[package]]
 name = "docling-core"
-version = "2.16.1"
+version = "2.20.0"
 description = "A python library to define and validate data types in Docling."
 optional = false
 python-versions = "<4.0,>=3.9"
 files = [
-    {file = "docling_core-2.16.1-py3-none-any.whl", hash = "sha256:d26af2f49e9f1f65ae5dfca972e206860339c1f91adfe427fa67d1cf95cce241"},
-    {file = "docling_core-2.16.1.tar.gz", hash = "sha256:676f51fa5797c91a86ccbc1fdaa020effcde4cc86aa9b094a0d5d775636871ba"},
+    {file = "docling_core-2.20.0-py3-none-any.whl", hash = "sha256:72f50fce277b7bb51f4134f443240c041582184305c3bcaabdea13fc5550f160"},
+    {file = "docling_core-2.20.0.tar.gz", hash = "sha256:9733581c15f5a9b5e3a6cb74fa995cc4078ff16668007f86c5f75d1ea9180d7f"},
 ]
 
 [package.dependencies]
 jsonref = ">=1.1.0,<2.0.0"
 jsonschema = ">=4.16.0,<5.0.0"
+latex2mathml = ">=3.77.0,<4.0.0"
 pandas = ">=2.1.4,<3.0.0"
-pillow = ">=10.3.0,<11.0.0"
+pillow = ">=10.0.0,<12.0.0"
 pydantic = ">=2.6.0,<2.10.0 || >2.10.0,<2.10.1 || >2.10.1,<2.10.2 || >2.10.2,<3.0.0"
 pyyaml = ">=5.1,<7.0.0"
 semchunk = {version = ">=2.2.0,<3.0.0", optional = true, markers = "extra == \"chunking\""}
@@ -888,16 +880,17 @@ chunking = ["semchunk (>=2.2.0,<3.0.0)", "transformers (>=4.34.0,<5.0.0)"]
 
 [[package]]
 name = "docling-ibm-models"
-version = "3.3.0"
+version = "3.4.0"
 description = "This package contains the AI models used by the Docling PDF conversion package"
 optional = false
 python-versions = "<4.0,>=3.9"
 files = [
-    {file = "docling_ibm_models-3.3.0-py3-none-any.whl", hash = "sha256:f1c99d345cb524239c7a2090969920e4311fd2fe22dad9bd609bc38039ec56eb"},
-    {file = "docling_ibm_models-3.3.0.tar.gz", hash = "sha256:5a7497053871179d59870c830945aa8664a34aac48b7e68edf602720ee7f6c49"},
+    {file = "docling_ibm_models-3.4.0-py3-none-any.whl", hash = "sha256:186517ff1f76e76113600fa1e5a699927325081a8013fdd5d0551121c2e34190"},
+    {file = "docling_ibm_models-3.4.0.tar.gz", hash = "sha256:fb79beeb07d1bb9bc8acf9d0a44643cd7ce1910aa418cd685e2e477b13eeafee"},
 ]
 
 [package.dependencies]
+docling-core = ">=2.19.0,<3.0.0"
 huggingface_hub = ">=0.23,<1"
 jsonlines = ">=3.1.0,<4.0.0"
 numpy = [
@@ -905,7 +898,8 @@ numpy = [
     {version = ">=1.24.4,<2.0.0", markers = "sys_platform == \"darwin\" and platform_machine == \"x86_64\""},
 ]
 opencv-python-headless = ">=4.6.0.66,<5.0.0.0"
-Pillow = ">=10.0.0,<11.0.0"
+Pillow = ">=10.0.0,<12.0.0"
+pydantic = ">=2.0.0,<3.0.0"
 safetensors = {version = ">=0.4.3,<1", extras = ["torch"]}
 torch = ">=2.2.2,<3.0.0"
 torchvision = ">=0,<1"
@@ -917,45 +911,45 @@ transformers = [
 
 [[package]]
 name = "docling-parse"
-version = "3.1.2"
+version = "3.4.0"
 description = "Simple package to extract text with coordinates from programmatic PDFs"
 optional = false
 python-versions = "<4.0,>=3.9"
 files = [
-    {file = "docling_parse-3.1.2-cp310-cp310-macosx_13_0_x86_64.whl", hash = "sha256:da15cf948bad8421c6269f99ab23a41728862ca47c864bc949acfc76194387e7"},
-    {file = "docling_parse-3.1.2-cp310-cp310-macosx_14_0_arm64.whl", hash = "sha256:96f440bddb3aa31e2c485a66acf3f0f8425a291221058f27c57a2297add47864"},
-    {file = "docling_parse-3.1.2-cp310-cp310-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:fa2e167e808967946273765d56705cd5cf8ae0269e1b4f53840eafe6f791ebd6"},
-    {file = "docling_parse-3.1.2-cp310-cp310-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:3d1e62878150497a01b325f694f6c630699946e9ea150b8952fe28ab25482430"},
-    {file = "docling_parse-3.1.2-cp310-cp310-win_amd64.whl", hash = "sha256:602af17a842fd53cb27493b49de92d378e9eec17b4a5e240fee5a8d9d70c79bd"},
-    {file = "docling_parse-3.1.2-cp311-cp311-macosx_13_0_x86_64.whl", hash = "sha256:fd934888c69eb380c4ef4df3e78fcdd7699c151005292eae69f3dacbe39b7c19"},
-    {file = "docling_parse-3.1.2-cp311-cp311-macosx_14_0_arm64.whl", hash = "sha256:628f9d296bd5db503c7d5cf5523dff620008d32eeba4fbd245af8b8758eaa7fa"},
-    {file = "docling_parse-3.1.2-cp311-cp311-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:a3a8f4199a99611a7239f078aa1590acf5695d90eb168e5b1be54c84fc45efd0"},
-    {file = "docling_parse-3.1.2-cp311-cp311-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:f634811c547e9cbcef1ac5f027ac855c75fbd89159e6c2b32ee4a83f22d79c73"},
-    {file = "docling_parse-3.1.2-cp311-cp311-win_amd64.whl", hash = "sha256:8d9bacc45d3ad9d25c49c768029277009948bb9e4a193e9bc4c5a319d9592427"},
-    {file = "docling_parse-3.1.2-cp312-cp312-macosx_13_0_x86_64.whl", hash = "sha256:8556b21a0e5f725a598b478e53f222032ca661d581dcfc0805617be44c022b41"},
-    {file = "docling_parse-3.1.2-cp312-cp312-macosx_14_0_arm64.whl", hash = "sha256:2026c312982749ea09ee137715f95dbd3939a78792d32e66e91965dc6280db29"},
-    {file = "docling_parse-3.1.2-cp312-cp312-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:74780285314eb0847b1779ee2587347c19881d148ff41b90f49ae8bc0685828c"},
-    {file = "docling_parse-3.1.2-cp312-cp312-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:b47be7156775831036800bdea6c6db97c51685f8f7582924f7bff1b75a63e650"},
-    {file = "docling_parse-3.1.2-cp312-cp312-win_amd64.whl", hash = "sha256:43077e58e73711198b2f58ea43e58847b93451335b345b587c785867d5ba6a67"},
-    {file = "docling_parse-3.1.2-cp313-cp313-macosx_13_0_x86_64.whl", hash = "sha256:1d4917459410d7275246c29396ef7055af990185e0cd95b8df3c1dcbacc3db5d"},
-    {file = "docling_parse-3.1.2-cp313-cp313-macosx_14_0_arm64.whl", hash = "sha256:f41d5c34b98774d8015eb84295388ccc3cc0ce05f052829e7e09c3ffd46541d2"},
-    {file = "docling_parse-3.1.2-cp313-cp313-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:d12df0b24026b454c1741dd2c4ea6be607e96b9f821778bfeee13b1bb5915a95"},
-    {file = "docling_parse-3.1.2-cp313-cp313-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:fd341164248d20ec71b4711c33052be653f5f0972c81feb7a1c66ecc075a3140"},
-    {file = "docling_parse-3.1.2-cp313-cp313-win_amd64.whl", hash = "sha256:c4015a0bcfab6a294ae78e9b789b081d342216b6349a6832c9b6e515603f2481"},
-    {file = "docling_parse-3.1.2-cp39-cp39-macosx_13_0_x86_64.whl", hash = "sha256:a66da9e89cbde676c0fe7041b97701890eb107624a1fe8be8e4d5fecb0bc89dc"},
-    {file = "docling_parse-3.1.2-cp39-cp39-macosx_14_0_arm64.whl", hash = "sha256:cad2ab8169110f39dc4d4f92e0eec523e85a378df3f84466c6d651c353ac009a"},
-    {file = "docling_parse-3.1.2-cp39-cp39-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:23bd70576497ef01add1498dd0c79686d4cf6b8044f91d6d201cb123ab742d3b"},
-    {file = "docling_parse-3.1.2-cp39-cp39-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:38c605927a7798613f0fcfee2cbd37ad1fb13f7e4a261f5ac575784e022339c4"},
-    {file = "docling_parse-3.1.2-cp39-cp39-win_amd64.whl", hash = "sha256:cb4bdbdbfead3411531ab5a416ea7a1bbe46ac49e48e9b59c3c3ba7f5bf05564"},
-    {file = "docling_parse-3.1.2-pp310-pypy310_pp73-win_amd64.whl", hash = "sha256:2b76c552e98f6d7df7eb00c4e123eb16fde80578dfadf577cedb98e772be263e"},
-    {file = "docling_parse-3.1.2-pp39-pypy39_pp73-win_amd64.whl", hash = "sha256:5c8c182af4a4374dfa7a06c60d7e4d3b329a93faee485f47a8844e2fb3185f57"},
-    {file = "docling_parse-3.1.2.tar.gz", hash = "sha256:f024d4eb82b9ab48eeb19700e63d3ba7c07e5255b239a4a0f7fcd823427a106e"},
+    {file = "docling_parse-3.4.0-cp310-cp310-macosx_13_0_x86_64.whl", hash = "sha256:96e95e63ab722dfe5340fcb04d0e07bd1c0a0ba2f62e93c91ac26dda0a312a44"},
+    {file = "docling_parse-3.4.0-cp310-cp310-macosx_14_0_arm64.whl", hash = "sha256:f9e14a7a0b92526d4dfd3f390f3d7e075f59d14d6b8a0a564fbc26299e56cd47"},
+    {file = "docling_parse-3.4.0-cp310-cp310-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:fdef1d51291e841e5b6a32689a39a9f35986389f863b415eaa1790b29d021101"},
+    {file = "docling_parse-3.4.0-cp310-cp310-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:68652610d6c34adc684dbaa77b5d596b25d004912a78e85ec4ae57910bf7086f"},
+    {file = "docling_parse-3.4.0-cp310-cp310-win_amd64.whl", hash = "sha256:daad07fe93f306d8e2378acb24ef2fa68535ccdb960a1b99d6b36ab8c299fef1"},
+    {file = "docling_parse-3.4.0-cp311-cp311-macosx_13_0_x86_64.whl", hash = "sha256:6f30c5fd3c04bd3d1a7d06baeae2e5c3adbebc284071a9a52b0150bcd4917a3d"},
+    {file = "docling_parse-3.4.0-cp311-cp311-macosx_14_0_arm64.whl", hash = "sha256:2c3664e4c8980dc44e0d026b1b01fbc94f0dac9adf7be835071d4a761977c36d"},
+    {file = "docling_parse-3.4.0-cp311-cp311-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:3febf7515453d18df03c275356db2bb5b0618ba9fc033aba05d58318a9846b1a"},
+    {file = "docling_parse-3.4.0-cp311-cp311-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:75aeb038bb7f6400ecde99cf6c4ef35867c528ac21676071a822ed72d0653149"},
+    {file = "docling_parse-3.4.0-cp311-cp311-win_amd64.whl", hash = "sha256:8d20e3584022542448c21ed0ac868b2457ae35211cea63ed20142e375549e633"},
+    {file = "docling_parse-3.4.0-cp312-cp312-macosx_13_0_x86_64.whl", hash = "sha256:ddfe2bd730ed08363f25954a0480da021e6e6bdb175276643cc2913a6bbd98e2"},
+    {file = "docling_parse-3.4.0-cp312-cp312-macosx_14_0_arm64.whl", hash = "sha256:faf8ba9eaab8c17ea72516be5d440f754fcca27f37488dcf126a0f3ac3a63058"},
+    {file = "docling_parse-3.4.0-cp312-cp312-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:9eb5e7e50b3057690d0d4fa651363cafd7735bb952378dd8a4ca6c7d359507db"},
+    {file = "docling_parse-3.4.0-cp312-cp312-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:452334b387e2c699f69acf37a4ea4ae7097d062a2dd1980c573b73051c031158"},
+    {file = "docling_parse-3.4.0-cp312-cp312-win_amd64.whl", hash = "sha256:1ba00147ccb0a1dc10cdf58645e67f4ee895c6920bc583bc6f25d27cd562bfed"},
+    {file = "docling_parse-3.4.0-cp313-cp313-macosx_13_0_x86_64.whl", hash = "sha256:2b22a33a2d2f3616a7ac0f4b2f2ba6099f8a5dc6fa328be0f17c9c506455d7c1"},
+    {file = "docling_parse-3.4.0-cp313-cp313-macosx_14_0_arm64.whl", hash = "sha256:0dd2440a94d555f98b702e88bfe7cc5a585d9191f4ea93884b02e286e7af3a06"},
+    {file = "docling_parse-3.4.0-cp313-cp313-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:5f5828744a0e33136e09e8c61ca0b2c0ead8f76595f2e0955beaac16adce51f5"},
+    {file = "docling_parse-3.4.0-cp313-cp313-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:26fff6e36809d17ff855532f985df3738ada8d86a9fc746049ea6e6524d5e0a2"},
+    {file = "docling_parse-3.4.0-cp313-cp313-win_amd64.whl", hash = "sha256:13fc442f64171280db98dc4507274ffa0a65bac94eecbcc60c3cbf41f433b556"},
+    {file = "docling_parse-3.4.0-cp39-cp39-macosx_13_0_x86_64.whl", hash = "sha256:16d570ab655ea5a25d9cd1e27bc4d6905372784907d679cde4cef2fb22df61c7"},
+    {file = "docling_parse-3.4.0-cp39-cp39-macosx_14_0_arm64.whl", hash = "sha256:05bd405635be2379ef6cb0c7c39dc08edf3ba93788eb0fca7426b2218538bce1"},
+    {file = "docling_parse-3.4.0-cp39-cp39-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:f6c92f0353bbae7ca9b39553cc4d03f5fefdab33ecd26809ab710cc752fac03c"},
+    {file = "docling_parse-3.4.0-cp39-cp39-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:8e883326ec4121891c48d365d064e5ae30c5b90a2dac44ed61ac02e7da41345d"},
+    {file = "docling_parse-3.4.0-cp39-cp39-win_amd64.whl", hash = "sha256:b2a0fe1e1d88c3814553137daa597ee34dc310f50fe415e1f8a1c6e611d95e42"},
+    {file = "docling_parse-3.4.0-pp310-pypy310_pp73-win_amd64.whl", hash = "sha256:930f5a5d78404de573c0ba302d313b6647f1e86714766e5a1cdc09af014ca111"},
+    {file = "docling_parse-3.4.0-pp39-pypy39_pp73-win_amd64.whl", hash = "sha256:328fd72f274b939d454e3ff20a73074d99664cb4a51e6ccdaf195a6626691b95"},
+    {file = "docling_parse-3.4.0.tar.gz", hash = "sha256:36cdd17bcc4a833b5c9af9ae3dc461ed18a975c1b084ccfd19a9d9cde4f66e14"},
 ]
 
 [package.dependencies]
 docling-core = ">=2.14.0,<3.0.0"
-pillow = ">=10.4.0,<11.0.0"
-pydantic = ">=2.10.5,<3.0.0"
+pillow = ">=10.0.0,<12.0.0"
+pydantic = ">=2.0.0,<3.0.0"
 pywin32 = {version = ">=305", markers = "sys_platform == \"win32\""}
 tabulate = ">=0.9.0,<1.0.0"
 
@@ -1134,13 +1128,13 @@ dev = ["pyTest", "pyTest-cov"]
 
 [[package]]
 name = "flatbuffers"
-version = "25.1.24"
+version = "25.2.10"
 description = "The FlatBuffers serialization format for Python"
 optional = true
 python-versions = "*"
 files = [
-    {file = "flatbuffers-25.1.24-py2.py3-none-any.whl", hash = "sha256:1abfebaf4083117225d0723087ea909896a34e3fec933beedb490d595ba24145"},
-    {file = "flatbuffers-25.1.24.tar.gz", hash = "sha256:e0f7b7d806c0abdf166275492663130af40c11f89445045fbef0aa3c9a8643ad"},
+    {file = "flatbuffers-25.2.10-py2.py3-none-any.whl", hash = "sha256:ebba5f4d5ea615af3f7fd70fc310636fbb2bbd1f566ac0a23d98dd412de50051"},
+    {file = "flatbuffers-25.2.10.tar.gz", hash = "sha256:97e451377a41262f8d9bd4295cc836133415cc03d8cb966410a4af92eb00d26e"},
 ]
 
 [[package]]
@@ -1337,13 +1331,13 @@ test = ["coverage[toml]", "ddt (>=1.1.1,!=1.4.3)", "mock", "mypy", "pre-commit",
 
 [[package]]
 name = "griffe"
-version = "1.5.5"
+version = "1.5.7"
 description = "Signatures for entire Python programs. Extract the structure, the frame, the skeleton of your project, to generate API documentation or find breaking changes in your API."
 optional = false
 python-versions = ">=3.9"
 files = [
-    {file = "griffe-1.5.5-py3-none-any.whl", hash = "sha256:2761b1e8876c6f1f9ab1af274df93ea6bbadd65090de5f38f4cb5cc84897c7dd"},
-    {file = "griffe-1.5.5.tar.gz", hash = "sha256:35ee5b38b93d6a839098aad0f92207e6ad6b70c3e8866c08ca669275b8cba585"},
+    {file = "griffe-1.5.7-py3-none-any.whl", hash = "sha256:4af8ec834b64de954d447c7b6672426bb145e71605c74a4e22d510cc79fe7d8b"},
+    {file = "griffe-1.5.7.tar.gz", hash = "sha256:465238c86deaf1137761f700fb343edd8ffc846d72f6de43c3c345ccdfbebe92"},
 ]
 
 [package.dependencies]
@@ -1351,13 +1345,13 @@ colorama = ">=0.4"
 
 [[package]]
 name = "griffe-pydantic"
-version = "1.1.0"
+version = "1.1.2"
 description = "Griffe extension for Pydantic."
 optional = false
 python-versions = ">=3.9"
 files = [
-    {file = "griffe_pydantic-1.1.0-py3-none-any.whl", hash = "sha256:ac9cc2d9b016cf302d8d9f577c9b3ca2793d88060f500d0b2a65f33a4a785cf1"},
-    {file = "griffe_pydantic-1.1.0.tar.gz", hash = "sha256:9c5a701cc485dab087857c1ac960b44671acee5008aaae0752f610b2aa82b068"},
+    {file = "griffe_pydantic-1.1.2-py3-none-any.whl", hash = "sha256:8ad53218ca6e9c24ccec83588eb435f562b30355f641fe336e81b1e00ea05f3c"},
+    {file = "griffe_pydantic-1.1.2.tar.gz", hash = "sha256:381eacd8854a85811522b4f6dc9a1ef0fb5931825081379d70ff3a425b0d4ea1"},
 ]
 
 [package.dependencies]
@@ -1488,13 +1482,13 @@ zstd = ["zstandard (>=0.18.0)"]
 
 [[package]]
 name = "huggingface-hub"
-version = "0.28.0"
+version = "0.29.1"
 description = "Client library to download and publish models, datasets and other repos on the huggingface.co hub"
 optional = false
 python-versions = ">=3.8.0"
 files = [
-    {file = "huggingface_hub-0.28.0-py3-none-any.whl", hash = "sha256:71cff4e500efe68061d94b7f6d3114e183715088be7a90bf4dd84af83b5f5cdb"},
-    {file = "huggingface_hub-0.28.0.tar.gz", hash = "sha256:c2b18c02a47d4384763caddb4d0ab2a8fc6c16e0800d6de4d55d0a896244aba3"},
+    {file = "huggingface_hub-0.29.1-py3-none-any.whl", hash = "sha256:352f69caf16566c7b6de84b54a822f6238e17ddd8ae3da4f8f2272aea5b198d5"},
+    {file = "huggingface_hub-0.29.1.tar.gz", hash = "sha256:9524eae42077b8ff4fc459ceb7a514eca1c1232b775276b009709fe2a084f250"},
 ]
 
 [package.dependencies]
@@ -1536,13 +1530,13 @@ pyreadline3 = {version = "*", markers = "sys_platform == \"win32\" and python_ve
 
 [[package]]
 name = "identify"
-version = "2.6.6"
+version = "2.6.8"
 description = "File identification library for Python"
 optional = false
 python-versions = ">=3.9"
 files = [
-    {file = "identify-2.6.6-py2.py3-none-any.whl", hash = "sha256:cbd1810bce79f8b671ecb20f53ee0ae8e86ae84b557de31d89709dc2a48ba881"},
-    {file = "identify-2.6.6.tar.gz", hash = "sha256:7bec12768ed44ea4761efb47806f0a41f86e7c0a5fdf5950d4648c90eca7e251"},
+    {file = "identify-2.6.8-py2.py3-none-any.whl", hash = "sha256:83657f0f766a3c8d0eaea16d4ef42494b39b34629a4b3192a9d020d349b3e255"},
+    {file = "identify-2.6.8.tar.gz", hash = "sha256:61491417ea2c0c5c670484fd8abbb34de34cdae1e5f39a73ee65e48e4bb663fc"},
 ]
 
 [package.extras]
@@ -2017,13 +2011,13 @@ files = [
 
 [[package]]
 name = "jupytext"
-version = "1.16.6"
+version = "1.16.7"
 description = "Jupyter notebooks as Markdown documents, Julia, Python or R scripts"
 optional = false
 python-versions = ">=3.8"
 files = [
-    {file = "jupytext-1.16.6-py3-none-any.whl", hash = "sha256:900132031f73fee15a1c9ebd862e05eb5f51e1ad6ab3a2c6fdd97ce2f9c913b4"},
-    {file = "jupytext-1.16.6.tar.gz", hash = "sha256:dbd03f9263c34b737003f388fc069e9030834fb7136879c4c32c32473557baa0"},
+    {file = "jupytext-1.16.7-py3-none-any.whl", hash = "sha256:912f9d9af7bd3f15470105e5c5dddf1669b2d8c17f0c55772687fc5a4a73fe69"},
+    {file = "jupytext-1.16.7.tar.gz", hash = "sha256:fc4e97f0890e22062c4ef10313c7ca960b07b3767246a1fef7585888cc2afe5d"},
 ]
 
 [package.dependencies]
@@ -2167,6 +2161,17 @@ requests-toolbelt = ">=1.0.0,<2.0.0"
 [package.extras]
 langsmith-pyo3 = ["langsmith-pyo3 (>=0.1.0rc2,<0.2.0)"]
 
+[[package]]
+name = "latex2mathml"
+version = "3.77.0"
+description = "Pure Python library for LaTeX to MathML conversion"
+optional = false
+python-versions = ">=3.8.1,<4.0.0"
+files = [
+    {file = "latex2mathml-3.77.0-py3-none-any.whl", hash = "sha256:5531e18a2a9eae7c24e257118b6a444cbba253cd27ff3e81f1bd6c41e88e786e"},
+    {file = "latex2mathml-3.77.0.tar.gz", hash = "sha256:e2f501d1878f2e489c3f6f12786bef74c62f712d2770f7f3c837eb20a55d0a1e"},
+]
+
 [[package]]
 name = "lazy-loader"
 version = "0.4"
@@ -2234,157 +2239,157 @@ files = [
 
 [[package]]
 name = "lxml"
-version = "5.3.0"
+version = "5.3.1"
 description = "Powerful and Pythonic XML processing library combining libxml2/libxslt with the ElementTree API."
 optional = false
 python-versions = ">=3.6"
 files = [
-    {file = "lxml-5.3.0-cp310-cp310-macosx_10_9_universal2.whl", hash = "sha256:dd36439be765e2dde7660212b5275641edbc813e7b24668831a5c8ac91180656"},
-    {file = "lxml-5.3.0-cp310-cp310-macosx_10_9_x86_64.whl", hash = "sha256:ae5fe5c4b525aa82b8076c1a59d642c17b6e8739ecf852522c6321852178119d"},
-    {file = "lxml-5.3.0-cp310-cp310-manylinux_2_12_i686.manylinux2010_i686.manylinux_2_17_i686.manylinux2014_i686.whl", hash = "sha256:501d0d7e26b4d261fca8132854d845e4988097611ba2531408ec91cf3fd9d20a"},
-    {file = "lxml-5.3.0-cp310-cp310-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:fb66442c2546446944437df74379e9cf9e9db353e61301d1a0e26482f43f0dd8"},
-    {file = "lxml-5.3.0-cp310-cp310-manylinux_2_17_ppc64le.manylinux2014_ppc64le.whl", hash = "sha256:9e41506fec7a7f9405b14aa2d5c8abbb4dbbd09d88f9496958b6d00cb4d45330"},
-    {file = "lxml-5.3.0-cp310-cp310-manylinux_2_17_s390x.manylinux2014_s390x.whl", hash = "sha256:f7d4a670107d75dfe5ad080bed6c341d18c4442f9378c9f58e5851e86eb79965"},
-    {file = "lxml-5.3.0-cp310-cp310-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:41ce1f1e2c7755abfc7e759dc34d7d05fd221723ff822947132dc934d122fe22"},
-    {file = "lxml-5.3.0-cp310-cp310-manylinux_2_28_aarch64.whl", hash = "sha256:44264ecae91b30e5633013fb66f6ddd05c006d3e0e884f75ce0b4755b3e3847b"},
-    {file = "lxml-5.3.0-cp310-cp310-manylinux_2_28_ppc64le.whl", hash = "sha256:3c174dc350d3ec52deb77f2faf05c439331d6ed5e702fc247ccb4e6b62d884b7"},
-    {file = "lxml-5.3.0-cp310-cp310-manylinux_2_28_s390x.whl", hash = "sha256:2dfab5fa6a28a0b60a20638dc48e6343c02ea9933e3279ccb132f555a62323d8"},
-    {file = "lxml-5.3.0-cp310-cp310-manylinux_2_28_x86_64.whl", hash = "sha256:b1c8c20847b9f34e98080da785bb2336ea982e7f913eed5809e5a3c872900f32"},
-    {file = "lxml-5.3.0-cp310-cp310-musllinux_1_2_aarch64.whl", hash = "sha256:2c86bf781b12ba417f64f3422cfc302523ac9cd1d8ae8c0f92a1c66e56ef2e86"},
-    {file = "lxml-5.3.0-cp310-cp310-musllinux_1_2_ppc64le.whl", hash = "sha256:c162b216070f280fa7da844531169be0baf9ccb17263cf5a8bf876fcd3117fa5"},
-    {file = "lxml-5.3.0-cp310-cp310-musllinux_1_2_s390x.whl", hash = "sha256:36aef61a1678cb778097b4a6eeae96a69875d51d1e8f4d4b491ab3cfb54b5a03"},
-    {file = "lxml-5.3.0-cp310-cp310-musllinux_1_2_x86_64.whl", hash = "sha256:f65e5120863c2b266dbcc927b306c5b78e502c71edf3295dfcb9501ec96e5fc7"},
-    {file = "lxml-5.3.0-cp310-cp310-win32.whl", hash = "sha256:ef0c1fe22171dd7c7c27147f2e9c3e86f8bdf473fed75f16b0c2e84a5030ce80"},
-    {file = "lxml-5.3.0-cp310-cp310-win_amd64.whl", hash = "sha256:052d99051e77a4f3e8482c65014cf6372e61b0a6f4fe9edb98503bb5364cfee3"},
-    {file = "lxml-5.3.0-cp311-cp311-macosx_10_9_universal2.whl", hash = "sha256:74bcb423462233bc5d6066e4e98b0264e7c1bed7541fff2f4e34fe6b21563c8b"},
-    {file = "lxml-5.3.0-cp311-cp311-macosx_10_9_x86_64.whl", hash = "sha256:a3d819eb6f9b8677f57f9664265d0a10dd6551d227afb4af2b9cd7bdc2ccbf18"},
-    {file = "lxml-5.3.0-cp311-cp311-manylinux_2_12_i686.manylinux2010_i686.manylinux_2_17_i686.manylinux2014_i686.whl", hash = "sha256:5b8f5db71b28b8c404956ddf79575ea77aa8b1538e8b2ef9ec877945b3f46442"},
-    {file = "lxml-5.3.0-cp311-cp311-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:2c3406b63232fc7e9b8783ab0b765d7c59e7c59ff96759d8ef9632fca27c7ee4"},
-    {file = "lxml-5.3.0-cp311-cp311-manylinux_2_17_ppc64le.manylinux2014_ppc64le.whl", hash = "sha256:2ecdd78ab768f844c7a1d4a03595038c166b609f6395e25af9b0f3f26ae1230f"},
-    {file = "lxml-5.3.0-cp311-cp311-manylinux_2_17_s390x.manylinux2014_s390x.whl", hash = "sha256:168f2dfcfdedf611eb285efac1516c8454c8c99caf271dccda8943576b67552e"},
-    {file = "lxml-5.3.0-cp311-cp311-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:aa617107a410245b8660028a7483b68e7914304a6d4882b5ff3d2d3eb5948d8c"},
-    {file = "lxml-5.3.0-cp311-cp311-manylinux_2_28_aarch64.whl", hash = "sha256:69959bd3167b993e6e710b99051265654133a98f20cec1d9b493b931942e9c16"},
-    {file = "lxml-5.3.0-cp311-cp311-manylinux_2_28_ppc64le.whl", hash = "sha256:bd96517ef76c8654446fc3db9242d019a1bb5fe8b751ba414765d59f99210b79"},
-    {file = "lxml-5.3.0-cp311-cp311-manylinux_2_28_s390x.whl", hash = "sha256:ab6dd83b970dc97c2d10bc71aa925b84788c7c05de30241b9e96f9b6d9ea3080"},
-    {file = "lxml-5.3.0-cp311-cp311-manylinux_2_28_x86_64.whl", hash = "sha256:eec1bb8cdbba2925bedc887bc0609a80e599c75b12d87ae42ac23fd199445654"},
-    {file = "lxml-5.3.0-cp311-cp311-musllinux_1_2_aarch64.whl", hash = "sha256:6a7095eeec6f89111d03dabfe5883a1fd54da319c94e0fb104ee8f23616b572d"},
-    {file = "lxml-5.3.0-cp311-cp311-musllinux_1_2_ppc64le.whl", hash = "sha256:6f651ebd0b21ec65dfca93aa629610a0dbc13dbc13554f19b0113da2e61a4763"},
-    {file = "lxml-5.3.0-cp311-cp311-musllinux_1_2_s390x.whl", hash = "sha256:f422a209d2455c56849442ae42f25dbaaba1c6c3f501d58761c619c7836642ec"},
-    {file = "lxml-5.3.0-cp311-cp311-musllinux_1_2_x86_64.whl", hash = "sha256:62f7fdb0d1ed2065451f086519865b4c90aa19aed51081979ecd05a21eb4d1be"},
-    {file = "lxml-5.3.0-cp311-cp311-win32.whl", hash = "sha256:c6379f35350b655fd817cd0d6cbeef7f265f3ae5fedb1caae2eb442bbeae9ab9"},
-    {file = "lxml-5.3.0-cp311-cp311-win_amd64.whl", hash = "sha256:9c52100e2c2dbb0649b90467935c4b0de5528833c76a35ea1a2691ec9f1ee7a1"},
-    {file = "lxml-5.3.0-cp312-cp312-macosx_10_9_universal2.whl", hash = "sha256:e99f5507401436fdcc85036a2e7dc2e28d962550afe1cbfc07c40e454256a859"},
-    {file = "lxml-5.3.0-cp312-cp312-macosx_10_9_x86_64.whl", hash = "sha256:384aacddf2e5813a36495233b64cb96b1949da72bef933918ba5c84e06af8f0e"},
-    {file = "lxml-5.3.0-cp312-cp312-manylinux_2_12_i686.manylinux2010_i686.manylinux_2_17_i686.manylinux2014_i686.whl", hash = "sha256:874a216bf6afaf97c263b56371434e47e2c652d215788396f60477540298218f"},
-    {file = "lxml-5.3.0-cp312-cp312-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:65ab5685d56914b9a2a34d67dd5488b83213d680b0c5d10b47f81da5a16b0b0e"},
-    {file = "lxml-5.3.0-cp312-cp312-manylinux_2_17_ppc64le.manylinux2014_ppc64le.whl", hash = "sha256:aac0bbd3e8dd2d9c45ceb82249e8bdd3ac99131a32b4d35c8af3cc9db1657179"},
-    {file = "lxml-5.3.0-cp312-cp312-manylinux_2_17_s390x.manylinux2014_s390x.whl", hash = "sha256:b369d3db3c22ed14c75ccd5af429086f166a19627e84a8fdade3f8f31426e52a"},
-    {file = "lxml-5.3.0-cp312-cp312-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:c24037349665434f375645fa9d1f5304800cec574d0310f618490c871fd902b3"},
-    {file = "lxml-5.3.0-cp312-cp312-manylinux_2_28_aarch64.whl", hash = "sha256:62d172f358f33a26d6b41b28c170c63886742f5b6772a42b59b4f0fa10526cb1"},
-    {file = "lxml-5.3.0-cp312-cp312-manylinux_2_28_ppc64le.whl", hash = "sha256:c1f794c02903c2824fccce5b20c339a1a14b114e83b306ff11b597c5f71a1c8d"},
-    {file = "lxml-5.3.0-cp312-cp312-manylinux_2_28_s390x.whl", hash = "sha256:5d6a6972b93c426ace71e0be9a6f4b2cfae9b1baed2eed2006076a746692288c"},
-    {file = "lxml-5.3.0-cp312-cp312-manylinux_2_28_x86_64.whl", hash = "sha256:3879cc6ce938ff4eb4900d901ed63555c778731a96365e53fadb36437a131a99"},
-    {file = "lxml-5.3.0-cp312-cp312-musllinux_1_2_aarch64.whl", hash = "sha256:74068c601baff6ff021c70f0935b0c7bc528baa8ea210c202e03757c68c5a4ff"},
-    {file = "lxml-5.3.0-cp312-cp312-musllinux_1_2_ppc64le.whl", hash = "sha256:ecd4ad8453ac17bc7ba3868371bffb46f628161ad0eefbd0a855d2c8c32dd81a"},
-    {file = "lxml-5.3.0-cp312-cp312-musllinux_1_2_s390x.whl", hash = "sha256:7e2f58095acc211eb9d8b5771bf04df9ff37d6b87618d1cbf85f92399c98dae8"},
-    {file = "lxml-5.3.0-cp312-cp312-musllinux_1_2_x86_64.whl", hash = "sha256:e63601ad5cd8f860aa99d109889b5ac34de571c7ee902d6812d5d9ddcc77fa7d"},
-    {file = "lxml-5.3.0-cp312-cp312-win32.whl", hash = "sha256:17e8d968d04a37c50ad9c456a286b525d78c4a1c15dd53aa46c1d8e06bf6fa30"},
-    {file = "lxml-5.3.0-cp312-cp312-win_amd64.whl", hash = "sha256:c1a69e58a6bb2de65902051d57fde951febad631a20a64572677a1052690482f"},
-    {file = "lxml-5.3.0-cp313-cp313-macosx_10_13_universal2.whl", hash = "sha256:8c72e9563347c7395910de6a3100a4840a75a6f60e05af5e58566868d5eb2d6a"},
-    {file = "lxml-5.3.0-cp313-cp313-macosx_10_13_x86_64.whl", hash = "sha256:e92ce66cd919d18d14b3856906a61d3f6b6a8500e0794142338da644260595cd"},
-    {file = "lxml-5.3.0-cp313-cp313-manylinux_2_12_i686.manylinux2010_i686.manylinux_2_17_i686.manylinux2014_i686.whl", hash = "sha256:1d04f064bebdfef9240478f7a779e8c5dc32b8b7b0b2fc6a62e39b928d428e51"},
-    {file = "lxml-5.3.0-cp313-cp313-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:5c2fb570d7823c2bbaf8b419ba6e5662137f8166e364a8b2b91051a1fb40ab8b"},
-    {file = "lxml-5.3.0-cp313-cp313-manylinux_2_17_ppc64le.manylinux2014_ppc64le.whl", hash = "sha256:0c120f43553ec759f8de1fee2f4794452b0946773299d44c36bfe18e83caf002"},
-    {file = "lxml-5.3.0-cp313-cp313-manylinux_2_17_s390x.manylinux2014_s390x.whl", hash = "sha256:562e7494778a69086f0312ec9689f6b6ac1c6b65670ed7d0267e49f57ffa08c4"},
-    {file = "lxml-5.3.0-cp313-cp313-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:423b121f7e6fa514ba0c7918e56955a1d4470ed35faa03e3d9f0e3baa4c7e492"},
-    {file = "lxml-5.3.0-cp313-cp313-manylinux_2_28_aarch64.whl", hash = "sha256:c00f323cc00576df6165cc9d21a4c21285fa6b9989c5c39830c3903dc4303ef3"},
-    {file = "lxml-5.3.0-cp313-cp313-manylinux_2_28_ppc64le.whl", hash = "sha256:1fdc9fae8dd4c763e8a31e7630afef517eab9f5d5d31a278df087f307bf601f4"},
-    {file = "lxml-5.3.0-cp313-cp313-manylinux_2_28_s390x.whl", hash = "sha256:658f2aa69d31e09699705949b5fc4719cbecbd4a97f9656a232e7d6c7be1a367"},
-    {file = "lxml-5.3.0-cp313-cp313-manylinux_2_28_x86_64.whl", hash = "sha256:1473427aff3d66a3fa2199004c3e601e6c4500ab86696edffdbc84954c72d832"},
-    {file = "lxml-5.3.0-cp313-cp313-musllinux_1_2_aarch64.whl", hash = "sha256:a87de7dd873bf9a792bf1e58b1c3887b9264036629a5bf2d2e6579fe8e73edff"},
-    {file = "lxml-5.3.0-cp313-cp313-musllinux_1_2_ppc64le.whl", hash = "sha256:0d7b36afa46c97875303a94e8f3ad932bf78bace9e18e603f2085b652422edcd"},
-    {file = "lxml-5.3.0-cp313-cp313-musllinux_1_2_s390x.whl", hash = "sha256:cf120cce539453ae086eacc0130a324e7026113510efa83ab42ef3fcfccac7fb"},
-    {file = "lxml-5.3.0-cp313-cp313-musllinux_1_2_x86_64.whl", hash = "sha256:df5c7333167b9674aa8ae1d4008fa4bc17a313cc490b2cca27838bbdcc6bb15b"},
-    {file = "lxml-5.3.0-cp313-cp313-win32.whl", hash = "sha256:c802e1c2ed9f0c06a65bc4ed0189d000ada8049312cfeab6ca635e39c9608957"},
-    {file = "lxml-5.3.0-cp313-cp313-win_amd64.whl", hash = "sha256:406246b96d552e0503e17a1006fd27edac678b3fcc9f1be71a2f94b4ff61528d"},
-    {file = "lxml-5.3.0-cp36-cp36m-macosx_10_9_x86_64.whl", hash = "sha256:8f0de2d390af441fe8b2c12626d103540b5d850d585b18fcada58d972b74a74e"},
-    {file = "lxml-5.3.0-cp36-cp36m-manylinux_2_12_i686.manylinux2010_i686.manylinux_2_17_i686.manylinux2014_i686.whl", hash = "sha256:1afe0a8c353746e610bd9031a630a95bcfb1a720684c3f2b36c4710a0a96528f"},
-    {file = "lxml-5.3.0-cp36-cp36m-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:56b9861a71575f5795bde89256e7467ece3d339c9b43141dbdd54544566b3b94"},
-    {file = "lxml-5.3.0-cp36-cp36m-manylinux_2_28_x86_64.whl", hash = "sha256:9fb81d2824dff4f2e297a276297e9031f46d2682cafc484f49de182aa5e5df99"},
-    {file = "lxml-5.3.0-cp36-cp36m-manylinux_2_5_x86_64.manylinux1_x86_64.whl", hash = "sha256:2c226a06ecb8cdef28845ae976da407917542c5e6e75dcac7cc33eb04aaeb237"},
-    {file = "lxml-5.3.0-cp36-cp36m-musllinux_1_2_x86_64.whl", hash = "sha256:7d3d1ca42870cdb6d0d29939630dbe48fa511c203724820fc0fd507b2fb46577"},
-    {file = "lxml-5.3.0-cp36-cp36m-win32.whl", hash = "sha256:094cb601ba9f55296774c2d57ad68730daa0b13dc260e1f941b4d13678239e70"},
-    {file = "lxml-5.3.0-cp36-cp36m-win_amd64.whl", hash = "sha256:eafa2c8658f4e560b098fe9fc54539f86528651f61849b22111a9b107d18910c"},
-    {file = "lxml-5.3.0-cp37-cp37m-macosx_10_9_x86_64.whl", hash = "sha256:cb83f8a875b3d9b458cada4f880fa498646874ba4011dc974e071a0a84a1b033"},
-    {file = "lxml-5.3.0-cp37-cp37m-manylinux_2_12_i686.manylinux2010_i686.manylinux_2_17_i686.manylinux2014_i686.whl", hash = "sha256:25f1b69d41656b05885aa185f5fdf822cb01a586d1b32739633679699f220391"},
-    {file = "lxml-5.3.0-cp37-cp37m-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:23e0553b8055600b3bf4a00b255ec5c92e1e4aebf8c2c09334f8368e8bd174d6"},
-    {file = "lxml-5.3.0-cp37-cp37m-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:9ada35dd21dc6c039259596b358caab6b13f4db4d4a7f8665764d616daf9cc1d"},
-    {file = "lxml-5.3.0-cp37-cp37m-manylinux_2_28_aarch64.whl", hash = "sha256:81b4e48da4c69313192d8c8d4311e5d818b8be1afe68ee20f6385d0e96fc9512"},
-    {file = "lxml-5.3.0-cp37-cp37m-manylinux_2_28_x86_64.whl", hash = "sha256:2bc9fd5ca4729af796f9f59cd8ff160fe06a474da40aca03fcc79655ddee1a8b"},
-    {file = "lxml-5.3.0-cp37-cp37m-musllinux_1_2_aarch64.whl", hash = "sha256:07da23d7ee08577760f0a71d67a861019103e4812c87e2fab26b039054594cc5"},
-    {file = "lxml-5.3.0-cp37-cp37m-musllinux_1_2_x86_64.whl", hash = "sha256:ea2e2f6f801696ad7de8aec061044d6c8c0dd4037608c7cab38a9a4d316bfb11"},
-    {file = "lxml-5.3.0-cp37-cp37m-win32.whl", hash = "sha256:5c54afdcbb0182d06836cc3d1be921e540be3ebdf8b8a51ee3ef987537455f84"},
-    {file = "lxml-5.3.0-cp37-cp37m-win_amd64.whl", hash = "sha256:f2901429da1e645ce548bf9171784c0f74f0718c3f6150ce166be39e4dd66c3e"},
-    {file = "lxml-5.3.0-cp38-cp38-macosx_10_9_x86_64.whl", hash = "sha256:c56a1d43b2f9ee4786e4658c7903f05da35b923fb53c11025712562d5cc02753"},
-    {file = "lxml-5.3.0-cp38-cp38-manylinux_2_12_i686.manylinux2010_i686.manylinux_2_17_i686.manylinux2014_i686.whl", hash = "sha256:6ee8c39582d2652dcd516d1b879451500f8db3fe3607ce45d7c5957ab2596040"},
-    {file = "lxml-5.3.0-cp38-cp38-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:0fdf3a3059611f7585a78ee10399a15566356116a4288380921a4b598d807a22"},
-    {file = "lxml-5.3.0-cp38-cp38-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:146173654d79eb1fc97498b4280c1d3e1e5d58c398fa530905c9ea50ea849b22"},
-    {file = "lxml-5.3.0-cp38-cp38-manylinux_2_28_aarch64.whl", hash = "sha256:0a7056921edbdd7560746f4221dca89bb7a3fe457d3d74267995253f46343f15"},
-    {file = "lxml-5.3.0-cp38-cp38-manylinux_2_28_x86_64.whl", hash = "sha256:9e4b47ac0f5e749cfc618efdf4726269441014ae1d5583e047b452a32e221920"},
-    {file = "lxml-5.3.0-cp38-cp38-musllinux_1_2_aarch64.whl", hash = "sha256:f914c03e6a31deb632e2daa881fe198461f4d06e57ac3d0e05bbcab8eae01945"},
-    {file = "lxml-5.3.0-cp38-cp38-musllinux_1_2_x86_64.whl", hash = "sha256:213261f168c5e1d9b7535a67e68b1f59f92398dd17a56d934550837143f79c42"},
-    {file = "lxml-5.3.0-cp38-cp38-win32.whl", hash = "sha256:218c1b2e17a710e363855594230f44060e2025b05c80d1f0661258142b2add2e"},
-    {file = "lxml-5.3.0-cp38-cp38-win_amd64.whl", hash = "sha256:315f9542011b2c4e1d280e4a20ddcca1761993dda3afc7a73b01235f8641e903"},
-    {file = "lxml-5.3.0-cp39-cp39-macosx_10_9_universal2.whl", hash = "sha256:1ffc23010330c2ab67fac02781df60998ca8fe759e8efde6f8b756a20599c5de"},
-    {file = "lxml-5.3.0-cp39-cp39-macosx_10_9_x86_64.whl", hash = "sha256:2b3778cb38212f52fac9fe913017deea2fdf4eb1a4f8e4cfc6b009a13a6d3fcc"},
-    {file = "lxml-5.3.0-cp39-cp39-manylinux_2_12_i686.manylinux2010_i686.manylinux_2_17_i686.manylinux2014_i686.whl", hash = "sha256:4b0c7a688944891086ba192e21c5229dea54382f4836a209ff8d0a660fac06be"},
-    {file = "lxml-5.3.0-cp39-cp39-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:747a3d3e98e24597981ca0be0fd922aebd471fa99d0043a3842d00cdcad7ad6a"},
-    {file = "lxml-5.3.0-cp39-cp39-manylinux_2_17_ppc64le.manylinux2014_ppc64le.whl", hash = "sha256:86a6b24b19eaebc448dc56b87c4865527855145d851f9fc3891673ff97950540"},
-    {file = "lxml-5.3.0-cp39-cp39-manylinux_2_17_s390x.manylinux2014_s390x.whl", hash = "sha256:b11a5d918a6216e521c715b02749240fb07ae5a1fefd4b7bf12f833bc8b4fe70"},
-    {file = "lxml-5.3.0-cp39-cp39-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:68b87753c784d6acb8a25b05cb526c3406913c9d988d51f80adecc2b0775d6aa"},
-    {file = "lxml-5.3.0-cp39-cp39-manylinux_2_28_aarch64.whl", hash = "sha256:109fa6fede314cc50eed29e6e56c540075e63d922455346f11e4d7a036d2b8cf"},
-    {file = "lxml-5.3.0-cp39-cp39-manylinux_2_28_ppc64le.whl", hash = "sha256:02ced472497b8362c8e902ade23e3300479f4f43e45f4105c85ef43b8db85229"},
-    {file = "lxml-5.3.0-cp39-cp39-manylinux_2_28_s390x.whl", hash = "sha256:6b038cc86b285e4f9fea2ba5ee76e89f21ed1ea898e287dc277a25884f3a7dfe"},
-    {file = "lxml-5.3.0-cp39-cp39-manylinux_2_28_x86_64.whl", hash = "sha256:7437237c6a66b7ca341e868cda48be24b8701862757426852c9b3186de1da8a2"},
-    {file = "lxml-5.3.0-cp39-cp39-musllinux_1_2_aarch64.whl", hash = "sha256:7f41026c1d64043a36fda21d64c5026762d53a77043e73e94b71f0521939cc71"},
-    {file = "lxml-5.3.0-cp39-cp39-musllinux_1_2_ppc64le.whl", hash = "sha256:482c2f67761868f0108b1743098640fbb2a28a8e15bf3f47ada9fa59d9fe08c3"},
-    {file = "lxml-5.3.0-cp39-cp39-musllinux_1_2_s390x.whl", hash = "sha256:1483fd3358963cc5c1c9b122c80606a3a79ee0875bcac0204149fa09d6ff2727"},
-    {file = "lxml-5.3.0-cp39-cp39-musllinux_1_2_x86_64.whl", hash = "sha256:2dec2d1130a9cda5b904696cec33b2cfb451304ba9081eeda7f90f724097300a"},
-    {file = "lxml-5.3.0-cp39-cp39-win32.whl", hash = "sha256:a0eabd0a81625049c5df745209dc7fcef6e2aea7793e5f003ba363610aa0a3ff"},
-    {file = "lxml-5.3.0-cp39-cp39-win_amd64.whl", hash = "sha256:89e043f1d9d341c52bf2af6d02e6adde62e0a46e6755d5eb60dc6e4f0b8aeca2"},
-    {file = "lxml-5.3.0-pp310-pypy310_pp73-macosx_10_15_x86_64.whl", hash = "sha256:7b1cd427cb0d5f7393c31b7496419da594fe600e6fdc4b105a54f82405e6626c"},
-    {file = "lxml-5.3.0-pp310-pypy310_pp73-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:51806cfe0279e06ed8500ce19479d757db42a30fd509940b1701be9c86a5ff9a"},
-    {file = "lxml-5.3.0-pp310-pypy310_pp73-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:ee70d08fd60c9565ba8190f41a46a54096afa0eeb8f76bd66f2c25d3b1b83005"},
-    {file = "lxml-5.3.0-pp310-pypy310_pp73-manylinux_2_28_aarch64.whl", hash = "sha256:8dc2c0395bea8254d8daebc76dcf8eb3a95ec2a46fa6fae5eaccee366bfe02ce"},
-    {file = "lxml-5.3.0-pp310-pypy310_pp73-manylinux_2_28_x86_64.whl", hash = "sha256:6ba0d3dcac281aad8a0e5b14c7ed6f9fa89c8612b47939fc94f80b16e2e9bc83"},
-    {file = "lxml-5.3.0-pp310-pypy310_pp73-win_amd64.whl", hash = "sha256:6e91cf736959057f7aac7adfc83481e03615a8e8dd5758aa1d95ea69e8931dba"},
-    {file = "lxml-5.3.0-pp37-pypy37_pp73-macosx_10_9_x86_64.whl", hash = "sha256:94d6c3782907b5e40e21cadf94b13b0842ac421192f26b84c45f13f3c9d5dc27"},
-    {file = "lxml-5.3.0-pp37-pypy37_pp73-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:c300306673aa0f3ed5ed9372b21867690a17dba38c68c44b287437c362ce486b"},
-    {file = "lxml-5.3.0-pp37-pypy37_pp73-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:78d9b952e07aed35fe2e1a7ad26e929595412db48535921c5013edc8aa4a35ce"},
-    {file = "lxml-5.3.0-pp37-pypy37_pp73-manylinux_2_28_aarch64.whl", hash = "sha256:01220dca0d066d1349bd6a1726856a78f7929f3878f7e2ee83c296c69495309e"},
-    {file = "lxml-5.3.0-pp37-pypy37_pp73-manylinux_2_28_x86_64.whl", hash = "sha256:2d9b8d9177afaef80c53c0a9e30fa252ff3036fb1c6494d427c066a4ce6a282f"},
-    {file = "lxml-5.3.0-pp37-pypy37_pp73-win_amd64.whl", hash = "sha256:20094fc3f21ea0a8669dc4c61ed7fa8263bd37d97d93b90f28fc613371e7a875"},
-    {file = "lxml-5.3.0-pp38-pypy38_pp73-macosx_10_9_x86_64.whl", hash = "sha256:ace2c2326a319a0bb8a8b0e5b570c764962e95818de9f259ce814ee666603f19"},
-    {file = "lxml-5.3.0-pp38-pypy38_pp73-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:92e67a0be1639c251d21e35fe74df6bcc40cba445c2cda7c4a967656733249e2"},
-    {file = "lxml-5.3.0-pp38-pypy38_pp73-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:dd5350b55f9fecddc51385463a4f67a5da829bc741e38cf689f38ec9023f54ab"},
-    {file = "lxml-5.3.0-pp38-pypy38_pp73-manylinux_2_28_aarch64.whl", hash = "sha256:4c1fefd7e3d00921c44dc9ca80a775af49698bbfd92ea84498e56acffd4c5469"},
-    {file = "lxml-5.3.0-pp38-pypy38_pp73-manylinux_2_28_x86_64.whl", hash = "sha256:71a8dd38fbd2f2319136d4ae855a7078c69c9a38ae06e0c17c73fd70fc6caad8"},
-    {file = "lxml-5.3.0-pp38-pypy38_pp73-win_amd64.whl", hash = "sha256:97acf1e1fd66ab53dacd2c35b319d7e548380c2e9e8c54525c6e76d21b1ae3b1"},
-    {file = "lxml-5.3.0-pp39-pypy39_pp73-macosx_10_15_x86_64.whl", hash = "sha256:68934b242c51eb02907c5b81d138cb977b2129a0a75a8f8b60b01cb8586c7b21"},
-    {file = "lxml-5.3.0-pp39-pypy39_pp73-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:b710bc2b8292966b23a6a0121f7a6c51d45d2347edcc75f016ac123b8054d3f2"},
-    {file = "lxml-5.3.0-pp39-pypy39_pp73-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:18feb4b93302091b1541221196a2155aa296c363fd233814fa11e181adebc52f"},
-    {file = "lxml-5.3.0-pp39-pypy39_pp73-manylinux_2_28_aarch64.whl", hash = "sha256:3eb44520c4724c2e1a57c0af33a379eee41792595023f367ba3952a2d96c2aab"},
-    {file = "lxml-5.3.0-pp39-pypy39_pp73-manylinux_2_28_x86_64.whl", hash = "sha256:609251a0ca4770e5a8768ff902aa02bf636339c5a93f9349b48eb1f606f7f3e9"},
-    {file = "lxml-5.3.0-pp39-pypy39_pp73-win_amd64.whl", hash = "sha256:516f491c834eb320d6c843156440fe7fc0d50b33e44387fcec5b02f0bc118a4c"},
-    {file = "lxml-5.3.0.tar.gz", hash = "sha256:4e109ca30d1edec1ac60cdbe341905dc3b8f55b16855e03a54aaf59e51ec8c6f"},
+    {file = "lxml-5.3.1-cp310-cp310-macosx_10_9_universal2.whl", hash = "sha256:a4058f16cee694577f7e4dd410263cd0ef75644b43802a689c2b3c2a7e69453b"},
+    {file = "lxml-5.3.1-cp310-cp310-macosx_10_9_x86_64.whl", hash = "sha256:364de8f57d6eda0c16dcfb999af902da31396949efa0e583e12675d09709881b"},
+    {file = "lxml-5.3.1-cp310-cp310-manylinux_2_12_i686.manylinux2010_i686.manylinux_2_17_i686.manylinux2014_i686.whl", hash = "sha256:528f3a0498a8edc69af0559bdcf8a9f5a8bf7c00051a6ef3141fdcf27017bbf5"},
+    {file = "lxml-5.3.1-cp310-cp310-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:db4743e30d6f5f92b6d2b7c86b3ad250e0bad8dee4b7ad8a0c44bfb276af89a3"},
+    {file = "lxml-5.3.1-cp310-cp310-manylinux_2_17_ppc64le.manylinux2014_ppc64le.whl", hash = "sha256:17b5d7f8acf809465086d498d62a981fa6a56d2718135bb0e4aa48c502055f5c"},
+    {file = "lxml-5.3.1-cp310-cp310-manylinux_2_17_s390x.manylinux2014_s390x.whl", hash = "sha256:928e75a7200a4c09e6efc7482a1337919cc61fe1ba289f297827a5b76d8969c2"},
+    {file = "lxml-5.3.1-cp310-cp310-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:5a997b784a639e05b9d4053ef3b20c7e447ea80814a762f25b8ed5a89d261eac"},
+    {file = "lxml-5.3.1-cp310-cp310-manylinux_2_28_aarch64.whl", hash = "sha256:7b82e67c5feb682dbb559c3e6b78355f234943053af61606af126df2183b9ef9"},
+    {file = "lxml-5.3.1-cp310-cp310-manylinux_2_28_ppc64le.whl", hash = "sha256:f1de541a9893cf8a1b1db9bf0bf670a2decab42e3e82233d36a74eda7822b4c9"},
+    {file = "lxml-5.3.1-cp310-cp310-manylinux_2_28_s390x.whl", hash = "sha256:de1fc314c3ad6bc2f6bd5b5a5b9357b8c6896333d27fdbb7049aea8bd5af2d79"},
+    {file = "lxml-5.3.1-cp310-cp310-manylinux_2_28_x86_64.whl", hash = "sha256:7c0536bd9178f754b277a3e53f90f9c9454a3bd108b1531ffff720e082d824f2"},
+    {file = "lxml-5.3.1-cp310-cp310-musllinux_1_2_aarch64.whl", hash = "sha256:68018c4c67d7e89951a91fbd371e2e34cd8cfc71f0bb43b5332db38497025d51"},
+    {file = "lxml-5.3.1-cp310-cp310-musllinux_1_2_ppc64le.whl", hash = "sha256:aa826340a609d0c954ba52fd831f0fba2a4165659ab0ee1a15e4aac21f302406"},
+    {file = "lxml-5.3.1-cp310-cp310-musllinux_1_2_s390x.whl", hash = "sha256:796520afa499732191e39fc95b56a3b07f95256f2d22b1c26e217fb69a9db5b5"},
+    {file = "lxml-5.3.1-cp310-cp310-musllinux_1_2_x86_64.whl", hash = "sha256:3effe081b3135237da6e4c4530ff2a868d3f80be0bda027e118a5971285d42d0"},
+    {file = "lxml-5.3.1-cp310-cp310-win32.whl", hash = "sha256:a22f66270bd6d0804b02cd49dae2b33d4341015545d17f8426f2c4e22f557a23"},
+    {file = "lxml-5.3.1-cp310-cp310-win_amd64.whl", hash = "sha256:0bcfadea3cdc68e678d2b20cb16a16716887dd00a881e16f7d806c2138b8ff0c"},
+    {file = "lxml-5.3.1-cp311-cp311-macosx_10_9_universal2.whl", hash = "sha256:e220f7b3e8656ab063d2eb0cd536fafef396829cafe04cb314e734f87649058f"},
+    {file = "lxml-5.3.1-cp311-cp311-macosx_10_9_x86_64.whl", hash = "sha256:0f2cfae0688fd01f7056a17367e3b84f37c545fb447d7282cf2c242b16262607"},
+    {file = "lxml-5.3.1-cp311-cp311-manylinux_2_12_i686.manylinux2010_i686.manylinux_2_17_i686.manylinux2014_i686.whl", hash = "sha256:67d2f8ad9dcc3a9e826bdc7802ed541a44e124c29b7d95a679eeb58c1c14ade8"},
+    {file = "lxml-5.3.1-cp311-cp311-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:db0c742aad702fd5d0c6611a73f9602f20aec2007c102630c06d7633d9c8f09a"},
+    {file = "lxml-5.3.1-cp311-cp311-manylinux_2_17_ppc64le.manylinux2014_ppc64le.whl", hash = "sha256:198bb4b4dd888e8390afa4f170d4fa28467a7eaf857f1952589f16cfbb67af27"},
+    {file = "lxml-5.3.1-cp311-cp311-manylinux_2_17_s390x.manylinux2014_s390x.whl", hash = "sha256:d2a3e412ce1849be34b45922bfef03df32d1410a06d1cdeb793a343c2f1fd666"},
+    {file = "lxml-5.3.1-cp311-cp311-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:2b8969dbc8d09d9cd2ae06362c3bad27d03f433252601ef658a49bd9f2b22d79"},
+    {file = "lxml-5.3.1-cp311-cp311-manylinux_2_28_aarch64.whl", hash = "sha256:5be8f5e4044146a69c96077c7e08f0709c13a314aa5315981185c1f00235fe65"},
+    {file = "lxml-5.3.1-cp311-cp311-manylinux_2_28_ppc64le.whl", hash = "sha256:133f3493253a00db2c870d3740bc458ebb7d937bd0a6a4f9328373e0db305709"},
+    {file = "lxml-5.3.1-cp311-cp311-manylinux_2_28_s390x.whl", hash = "sha256:52d82b0d436edd6a1d22d94a344b9a58abd6c68c357ed44f22d4ba8179b37629"},
+    {file = "lxml-5.3.1-cp311-cp311-manylinux_2_28_x86_64.whl", hash = "sha256:1b6f92e35e2658a5ed51c6634ceb5ddae32053182851d8cad2a5bc102a359b33"},
+    {file = "lxml-5.3.1-cp311-cp311-musllinux_1_2_aarch64.whl", hash = "sha256:203b1d3eaebd34277be06a3eb880050f18a4e4d60861efba4fb946e31071a295"},
+    {file = "lxml-5.3.1-cp311-cp311-musllinux_1_2_ppc64le.whl", hash = "sha256:155e1a5693cf4b55af652f5c0f78ef36596c7f680ff3ec6eb4d7d85367259b2c"},
+    {file = "lxml-5.3.1-cp311-cp311-musllinux_1_2_s390x.whl", hash = "sha256:22ec2b3c191f43ed21f9545e9df94c37c6b49a5af0a874008ddc9132d49a2d9c"},
+    {file = "lxml-5.3.1-cp311-cp311-musllinux_1_2_x86_64.whl", hash = "sha256:7eda194dd46e40ec745bf76795a7cccb02a6a41f445ad49d3cf66518b0bd9cff"},
+    {file = "lxml-5.3.1-cp311-cp311-win32.whl", hash = "sha256:fb7c61d4be18e930f75948705e9718618862e6fc2ed0d7159b2262be73f167a2"},
+    {file = "lxml-5.3.1-cp311-cp311-win_amd64.whl", hash = "sha256:c809eef167bf4a57af4b03007004896f5c60bd38dc3852fcd97a26eae3d4c9e6"},
+    {file = "lxml-5.3.1-cp312-cp312-macosx_10_9_universal2.whl", hash = "sha256:e69add9b6b7b08c60d7ff0152c7c9a6c45b4a71a919be5abde6f98f1ea16421c"},
+    {file = "lxml-5.3.1-cp312-cp312-macosx_10_9_x86_64.whl", hash = "sha256:4e52e1b148867b01c05e21837586ee307a01e793b94072d7c7b91d2c2da02ffe"},
+    {file = "lxml-5.3.1-cp312-cp312-manylinux_2_12_i686.manylinux2010_i686.manylinux_2_17_i686.manylinux2014_i686.whl", hash = "sha256:a4b382e0e636ed54cd278791d93fe2c4f370772743f02bcbe431a160089025c9"},
+    {file = "lxml-5.3.1-cp312-cp312-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:c2e49dc23a10a1296b04ca9db200c44d3eb32c8d8ec532e8c1fd24792276522a"},
+    {file = "lxml-5.3.1-cp312-cp312-manylinux_2_17_ppc64le.manylinux2014_ppc64le.whl", hash = "sha256:4399b4226c4785575fb20998dc571bc48125dc92c367ce2602d0d70e0c455eb0"},
+    {file = "lxml-5.3.1-cp312-cp312-manylinux_2_17_s390x.manylinux2014_s390x.whl", hash = "sha256:5412500e0dc5481b1ee9cf6b38bb3b473f6e411eb62b83dc9b62699c3b7b79f7"},
+    {file = "lxml-5.3.1-cp312-cp312-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:1c93ed3c998ea8472be98fb55aed65b5198740bfceaec07b2eba551e55b7b9ae"},
+    {file = "lxml-5.3.1-cp312-cp312-manylinux_2_28_aarch64.whl", hash = "sha256:63d57fc94eb0bbb4735e45517afc21ef262991d8758a8f2f05dd6e4174944519"},
+    {file = "lxml-5.3.1-cp312-cp312-manylinux_2_28_ppc64le.whl", hash = "sha256:b450d7cabcd49aa7ab46a3c6aa3ac7e1593600a1a0605ba536ec0f1b99a04322"},
+    {file = "lxml-5.3.1-cp312-cp312-manylinux_2_28_s390x.whl", hash = "sha256:4df0ec814b50275ad6a99bc82a38b59f90e10e47714ac9871e1b223895825468"},
+    {file = "lxml-5.3.1-cp312-cp312-manylinux_2_28_x86_64.whl", hash = "sha256:d184f85ad2bb1f261eac55cddfcf62a70dee89982c978e92b9a74a1bfef2e367"},
+    {file = "lxml-5.3.1-cp312-cp312-musllinux_1_2_aarch64.whl", hash = "sha256:b725e70d15906d24615201e650d5b0388b08a5187a55f119f25874d0103f90dd"},
+    {file = "lxml-5.3.1-cp312-cp312-musllinux_1_2_ppc64le.whl", hash = "sha256:a31fa7536ec1fb7155a0cd3a4e3d956c835ad0a43e3610ca32384d01f079ea1c"},
+    {file = "lxml-5.3.1-cp312-cp312-musllinux_1_2_s390x.whl", hash = "sha256:3c3c8b55c7fc7b7e8877b9366568cc73d68b82da7fe33d8b98527b73857a225f"},
+    {file = "lxml-5.3.1-cp312-cp312-musllinux_1_2_x86_64.whl", hash = "sha256:d61ec60945d694df806a9aec88e8f29a27293c6e424f8ff91c80416e3c617645"},
+    {file = "lxml-5.3.1-cp312-cp312-win32.whl", hash = "sha256:f4eac0584cdc3285ef2e74eee1513a6001681fd9753b259e8159421ed28a72e5"},
+    {file = "lxml-5.3.1-cp312-cp312-win_amd64.whl", hash = "sha256:29bfc8d3d88e56ea0a27e7c4897b642706840247f59f4377d81be8f32aa0cfbf"},
+    {file = "lxml-5.3.1-cp313-cp313-macosx_10_13_universal2.whl", hash = "sha256:c093c7088b40d8266f57ed71d93112bd64c6724d31f0794c1e52cc4857c28e0e"},
+    {file = "lxml-5.3.1-cp313-cp313-macosx_10_13_x86_64.whl", hash = "sha256:b0884e3f22d87c30694e625b1e62e6f30d39782c806287450d9dc2fdf07692fd"},
+    {file = "lxml-5.3.1-cp313-cp313-manylinux_2_12_i686.manylinux2010_i686.manylinux_2_17_i686.manylinux2014_i686.whl", hash = "sha256:1637fa31ec682cd5760092adfabe86d9b718a75d43e65e211d5931809bc111e7"},
+    {file = "lxml-5.3.1-cp313-cp313-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:a364e8e944d92dcbf33b6b494d4e0fb3499dcc3bd9485beb701aa4b4201fa414"},
+    {file = "lxml-5.3.1-cp313-cp313-manylinux_2_17_ppc64le.manylinux2014_ppc64le.whl", hash = "sha256:779e851fd0e19795ccc8a9bb4d705d6baa0ef475329fe44a13cf1e962f18ff1e"},
+    {file = "lxml-5.3.1-cp313-cp313-manylinux_2_17_s390x.manylinux2014_s390x.whl", hash = "sha256:c4393600915c308e546dc7003d74371744234e8444a28622d76fe19b98fa59d1"},
+    {file = "lxml-5.3.1-cp313-cp313-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:673b9d8e780f455091200bba8534d5f4f465944cbdd61f31dc832d70e29064a5"},
+    {file = "lxml-5.3.1-cp313-cp313-manylinux_2_28_aarch64.whl", hash = "sha256:2e4a570f6a99e96c457f7bec5ad459c9c420ee80b99eb04cbfcfe3fc18ec6423"},
+    {file = "lxml-5.3.1-cp313-cp313-manylinux_2_28_ppc64le.whl", hash = "sha256:71f31eda4e370f46af42fc9f264fafa1b09f46ba07bdbee98f25689a04b81c20"},
+    {file = "lxml-5.3.1-cp313-cp313-manylinux_2_28_s390x.whl", hash = "sha256:42978a68d3825eaac55399eb37a4d52012a205c0c6262199b8b44fcc6fd686e8"},
+    {file = "lxml-5.3.1-cp313-cp313-manylinux_2_28_x86_64.whl", hash = "sha256:8b1942b3e4ed9ed551ed3083a2e6e0772de1e5e3aca872d955e2e86385fb7ff9"},
+    {file = "lxml-5.3.1-cp313-cp313-musllinux_1_2_aarch64.whl", hash = "sha256:85c4f11be9cf08917ac2a5a8b6e1ef63b2f8e3799cec194417e76826e5f1de9c"},
+    {file = "lxml-5.3.1-cp313-cp313-musllinux_1_2_ppc64le.whl", hash = "sha256:231cf4d140b22a923b1d0a0a4e0b4f972e5893efcdec188934cc65888fd0227b"},
+    {file = "lxml-5.3.1-cp313-cp313-musllinux_1_2_s390x.whl", hash = "sha256:5865b270b420eda7b68928d70bb517ccbe045e53b1a428129bb44372bf3d7dd5"},
+    {file = "lxml-5.3.1-cp313-cp313-musllinux_1_2_x86_64.whl", hash = "sha256:dbf7bebc2275016cddf3c997bf8a0f7044160714c64a9b83975670a04e6d2252"},
+    {file = "lxml-5.3.1-cp313-cp313-win32.whl", hash = "sha256:d0751528b97d2b19a388b302be2a0ee05817097bab46ff0ed76feeec24951f78"},
+    {file = "lxml-5.3.1-cp313-cp313-win_amd64.whl", hash = "sha256:91fb6a43d72b4f8863d21f347a9163eecbf36e76e2f51068d59cd004c506f332"},
+    {file = "lxml-5.3.1-cp36-cp36m-macosx_10_9_x86_64.whl", hash = "sha256:016b96c58e9a4528219bb563acf1aaaa8bc5452e7651004894a973f03b84ba81"},
+    {file = "lxml-5.3.1-cp36-cp36m-manylinux_2_12_i686.manylinux2010_i686.manylinux_2_17_i686.manylinux2014_i686.whl", hash = "sha256:82a4bb10b0beef1434fb23a09f001ab5ca87895596b4581fd53f1e5145a8934a"},
+    {file = "lxml-5.3.1-cp36-cp36m-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:3d68eeef7b4d08a25e51897dac29bcb62aba830e9ac6c4e3297ee7c6a0cf6439"},
+    {file = "lxml-5.3.1-cp36-cp36m-manylinux_2_28_x86_64.whl", hash = "sha256:f12582b8d3b4c6be1d298c49cb7ae64a3a73efaf4c2ab4e37db182e3545815ac"},
+    {file = "lxml-5.3.1-cp36-cp36m-manylinux_2_5_x86_64.manylinux1_x86_64.whl", hash = "sha256:2df7ed5edeb6bd5590914cd61df76eb6cce9d590ed04ec7c183cf5509f73530d"},
+    {file = "lxml-5.3.1-cp36-cp36m-musllinux_1_2_x86_64.whl", hash = "sha256:585c4dc429deebc4307187d2b71ebe914843185ae16a4d582ee030e6cfbb4d8a"},
+    {file = "lxml-5.3.1-cp36-cp36m-win32.whl", hash = "sha256:06a20d607a86fccab2fc15a77aa445f2bdef7b49ec0520a842c5c5afd8381576"},
+    {file = "lxml-5.3.1-cp36-cp36m-win_amd64.whl", hash = "sha256:057e30d0012439bc54ca427a83d458752ccda725c1c161cc283db07bcad43cf9"},
+    {file = "lxml-5.3.1-cp37-cp37m-macosx_10_9_x86_64.whl", hash = "sha256:4867361c049761a56bd21de507cab2c2a608c55102311d142ade7dab67b34f32"},
+    {file = "lxml-5.3.1-cp37-cp37m-manylinux_2_12_i686.manylinux2010_i686.manylinux_2_17_i686.manylinux2014_i686.whl", hash = "sha256:3dddf0fb832486cc1ea71d189cb92eb887826e8deebe128884e15020bb6e3f61"},
+    {file = "lxml-5.3.1-cp37-cp37m-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:1bcc211542f7af6f2dfb705f5f8b74e865592778e6cafdfd19c792c244ccce19"},
+    {file = "lxml-5.3.1-cp37-cp37m-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:aaca5a812f050ab55426c32177091130b1e49329b3f002a32934cd0245571307"},
+    {file = "lxml-5.3.1-cp37-cp37m-manylinux_2_28_aarch64.whl", hash = "sha256:236610b77589faf462337b3305a1be91756c8abc5a45ff7ca8f245a71c5dab70"},
+    {file = "lxml-5.3.1-cp37-cp37m-manylinux_2_28_x86_64.whl", hash = "sha256:aed57b541b589fa05ac248f4cb1c46cbb432ab82cbd467d1c4f6a2bdc18aecf9"},
+    {file = "lxml-5.3.1-cp37-cp37m-musllinux_1_2_aarch64.whl", hash = "sha256:75fa3d6946d317ffc7016a6fcc44f42db6d514b7fdb8b4b28cbe058303cb6e53"},
+    {file = "lxml-5.3.1-cp37-cp37m-musllinux_1_2_x86_64.whl", hash = "sha256:96eef5b9f336f623ffc555ab47a775495e7e8846dde88de5f941e2906453a1ce"},
+    {file = "lxml-5.3.1-cp37-cp37m-win32.whl", hash = "sha256:ef45f31aec9be01379fc6c10f1d9c677f032f2bac9383c827d44f620e8a88407"},
+    {file = "lxml-5.3.1-cp37-cp37m-win_amd64.whl", hash = "sha256:a0611da6b07dd3720f492db1b463a4d1175b096b49438761cc9f35f0d9eaaef5"},
+    {file = "lxml-5.3.1-cp38-cp38-macosx_10_9_x86_64.whl", hash = "sha256:b2aca14c235c7a08558fe0a4786a1a05873a01e86b474dfa8f6df49101853a4e"},
+    {file = "lxml-5.3.1-cp38-cp38-manylinux_2_12_i686.manylinux2010_i686.manylinux_2_17_i686.manylinux2014_i686.whl", hash = "sha256:ae82fce1d964f065c32c9517309f0c7be588772352d2f40b1574a214bd6e6098"},
+    {file = "lxml-5.3.1-cp38-cp38-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:7aae7a3d63b935babfdc6864b31196afd5145878ddd22f5200729006366bc4d5"},
+    {file = "lxml-5.3.1-cp38-cp38-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:e8e0d177b1fe251c3b1b914ab64135475c5273c8cfd2857964b2e3bb0fe196a7"},
+    {file = "lxml-5.3.1-cp38-cp38-manylinux_2_28_aarch64.whl", hash = "sha256:6c4dd3bfd0c82400060896717dd261137398edb7e524527438c54a8c34f736bf"},
+    {file = "lxml-5.3.1-cp38-cp38-manylinux_2_28_x86_64.whl", hash = "sha256:f1208c1c67ec9e151d78aa3435aa9b08a488b53d9cfac9b699f15255a3461ef2"},
+    {file = "lxml-5.3.1-cp38-cp38-musllinux_1_2_aarch64.whl", hash = "sha256:c6aacf00d05b38a5069826e50ae72751cb5bc27bdc4d5746203988e429b385bb"},
+    {file = "lxml-5.3.1-cp38-cp38-musllinux_1_2_x86_64.whl", hash = "sha256:5881aaa4bf3a2d086c5f20371d3a5856199a0d8ac72dd8d0dbd7a2ecfc26ab73"},
+    {file = "lxml-5.3.1-cp38-cp38-win32.whl", hash = "sha256:45fbb70ccbc8683f2fb58bea89498a7274af1d9ec7995e9f4af5604e028233fc"},
+    {file = "lxml-5.3.1-cp38-cp38-win_amd64.whl", hash = "sha256:7512b4d0fc5339d5abbb14d1843f70499cab90d0b864f790e73f780f041615d7"},
+    {file = "lxml-5.3.1-cp39-cp39-macosx_10_9_universal2.whl", hash = "sha256:5885bc586f1edb48e5d68e7a4b4757b5feb2a496b64f462b4d65950f5af3364f"},
+    {file = "lxml-5.3.1-cp39-cp39-macosx_10_9_x86_64.whl", hash = "sha256:1b92fe86e04f680b848fff594a908edfa72b31bfc3499ef7433790c11d4c8cd8"},
+    {file = "lxml-5.3.1-cp39-cp39-manylinux_2_12_i686.manylinux2010_i686.manylinux_2_17_i686.manylinux2014_i686.whl", hash = "sha256:a091026c3bf7519ab1e64655a3f52a59ad4a4e019a6f830c24d6430695b1cf6a"},
+    {file = "lxml-5.3.1-cp39-cp39-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:8ffb141361108e864ab5f1813f66e4e1164181227f9b1f105b042729b6c15125"},
+    {file = "lxml-5.3.1-cp39-cp39-manylinux_2_17_ppc64le.manylinux2014_ppc64le.whl", hash = "sha256:3715cdf0dd31b836433af9ee9197af10e3df41d273c19bb249230043667a5dfd"},
+    {file = "lxml-5.3.1-cp39-cp39-manylinux_2_17_s390x.manylinux2014_s390x.whl", hash = "sha256:88b72eb7222d918c967202024812c2bfb4048deeb69ca328363fb8e15254c549"},
+    {file = "lxml-5.3.1-cp39-cp39-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:aa59974880ab5ad8ef3afaa26f9bda148c5f39e06b11a8ada4660ecc9fb2feb3"},
+    {file = "lxml-5.3.1-cp39-cp39-manylinux_2_28_aarch64.whl", hash = "sha256:3bb8149840daf2c3f97cebf00e4ed4a65a0baff888bf2605a8d0135ff5cf764e"},
+    {file = "lxml-5.3.1-cp39-cp39-manylinux_2_28_ppc64le.whl", hash = "sha256:0d6b2fa86becfa81f0a0271ccb9eb127ad45fb597733a77b92e8a35e53414914"},
+    {file = "lxml-5.3.1-cp39-cp39-manylinux_2_28_s390x.whl", hash = "sha256:136bf638d92848a939fd8f0e06fcf92d9f2e4b57969d94faae27c55f3d85c05b"},
+    {file = "lxml-5.3.1-cp39-cp39-manylinux_2_28_x86_64.whl", hash = "sha256:89934f9f791566e54c1d92cdc8f8fd0009447a5ecdb1ec6b810d5f8c4955f6be"},
+    {file = "lxml-5.3.1-cp39-cp39-musllinux_1_2_aarch64.whl", hash = "sha256:a8ade0363f776f87f982572c2860cc43c65ace208db49c76df0a21dde4ddd16e"},
+    {file = "lxml-5.3.1-cp39-cp39-musllinux_1_2_ppc64le.whl", hash = "sha256:bfbbab9316330cf81656fed435311386610f78b6c93cc5db4bebbce8dd146675"},
+    {file = "lxml-5.3.1-cp39-cp39-musllinux_1_2_s390x.whl", hash = "sha256:172d65f7c72a35a6879217bcdb4bb11bc88d55fb4879e7569f55616062d387c2"},
+    {file = "lxml-5.3.1-cp39-cp39-musllinux_1_2_x86_64.whl", hash = "sha256:e3c623923967f3e5961d272718655946e5322b8d058e094764180cdee7bab1af"},
+    {file = "lxml-5.3.1-cp39-cp39-win32.whl", hash = "sha256:ce0930a963ff593e8bb6fda49a503911accc67dee7e5445eec972668e672a0f0"},
+    {file = "lxml-5.3.1-cp39-cp39-win_amd64.whl", hash = "sha256:f7b64fcd670bca8800bc10ced36620c6bbb321e7bc1214b9c0c0df269c1dddc2"},
+    {file = "lxml-5.3.1-pp310-pypy310_pp73-macosx_10_15_x86_64.whl", hash = "sha256:afa578b6524ff85fb365f454cf61683771d0170470c48ad9d170c48075f86725"},
+    {file = "lxml-5.3.1-pp310-pypy310_pp73-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:67f5e80adf0aafc7b5454f2c1cb0cde920c9b1f2cbd0485f07cc1d0497c35c5d"},
+    {file = "lxml-5.3.1-pp310-pypy310_pp73-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:2dd0b80ac2d8f13ffc906123a6f20b459cb50a99222d0da492360512f3e50f84"},
+    {file = "lxml-5.3.1-pp310-pypy310_pp73-manylinux_2_28_aarch64.whl", hash = "sha256:422c179022ecdedbe58b0e242607198580804253da220e9454ffe848daa1cfd2"},
+    {file = "lxml-5.3.1-pp310-pypy310_pp73-manylinux_2_28_x86_64.whl", hash = "sha256:524ccfded8989a6595dbdda80d779fb977dbc9a7bc458864fc9a0c2fc15dc877"},
+    {file = "lxml-5.3.1-pp310-pypy310_pp73-win_amd64.whl", hash = "sha256:48fd46bf7155def2e15287c6f2b133a2f78e2d22cdf55647269977b873c65499"},
+    {file = "lxml-5.3.1-pp37-pypy37_pp73-macosx_10_9_x86_64.whl", hash = "sha256:05123fad495a429f123307ac6d8fd6f977b71e9a0b6d9aeeb8f80c017cb17131"},
+    {file = "lxml-5.3.1-pp37-pypy37_pp73-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:a243132767150a44e6a93cd1dde41010036e1cbc63cc3e9fe1712b277d926ce3"},
+    {file = "lxml-5.3.1-pp37-pypy37_pp73-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:c92ea6d9dd84a750b2bae72ff5e8cf5fdd13e58dda79c33e057862c29a8d5b50"},
+    {file = "lxml-5.3.1-pp37-pypy37_pp73-manylinux_2_28_aarch64.whl", hash = "sha256:2f1be45d4c15f237209bbf123a0e05b5d630c8717c42f59f31ea9eae2ad89394"},
+    {file = "lxml-5.3.1-pp37-pypy37_pp73-manylinux_2_28_x86_64.whl", hash = "sha256:a83d3adea1e0ee36dac34627f78ddd7f093bb9cfc0a8e97f1572a949b695cb98"},
+    {file = "lxml-5.3.1-pp37-pypy37_pp73-win_amd64.whl", hash = "sha256:3edbb9c9130bac05d8c3fe150c51c337a471cc7fdb6d2a0a7d3a88e88a829314"},
+    {file = "lxml-5.3.1-pp38-pypy38_pp73-macosx_10_9_x86_64.whl", hash = "sha256:2f23cf50eccb3255b6e913188291af0150d89dab44137a69e14e4dcb7be981f1"},
+    {file = "lxml-5.3.1-pp38-pypy38_pp73-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:df7e5edac4778127f2bf452e0721a58a1cfa4d1d9eac63bdd650535eb8543615"},
+    {file = "lxml-5.3.1-pp38-pypy38_pp73-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:094b28ed8a8a072b9e9e2113a81fda668d2053f2ca9f2d202c2c8c7c2d6516b1"},
+    {file = "lxml-5.3.1-pp38-pypy38_pp73-manylinux_2_28_aarch64.whl", hash = "sha256:514fe78fc4b87e7a7601c92492210b20a1b0c6ab20e71e81307d9c2e377c64de"},
+    {file = "lxml-5.3.1-pp38-pypy38_pp73-manylinux_2_28_x86_64.whl", hash = "sha256:8fffc08de02071c37865a155e5ea5fce0282e1546fd5bde7f6149fcaa32558ac"},
+    {file = "lxml-5.3.1-pp38-pypy38_pp73-win_amd64.whl", hash = "sha256:4b0d5cdba1b655d5b18042ac9c9ff50bda33568eb80feaaca4fc237b9c4fbfde"},
+    {file = "lxml-5.3.1-pp39-pypy39_pp73-macosx_10_15_x86_64.whl", hash = "sha256:3031e4c16b59424e8d78522c69b062d301d951dc55ad8685736c3335a97fc270"},
+    {file = "lxml-5.3.1-pp39-pypy39_pp73-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:cb659702a45136c743bc130760c6f137870d4df3a9e14386478b8a0511abcfca"},
+    {file = "lxml-5.3.1-pp39-pypy39_pp73-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:5a11b16a33656ffc43c92a5343a28dc71eefe460bcc2a4923a96f292692709f6"},
+    {file = "lxml-5.3.1-pp39-pypy39_pp73-manylinux_2_28_aarch64.whl", hash = "sha256:c5ae125276f254b01daa73e2c103363d3e99e3e10505686ac7d9d2442dd4627a"},
+    {file = "lxml-5.3.1-pp39-pypy39_pp73-manylinux_2_28_x86_64.whl", hash = "sha256:c76722b5ed4a31ba103e0dc77ab869222ec36efe1a614e42e9bcea88a36186fe"},
+    {file = "lxml-5.3.1-pp39-pypy39_pp73-win_amd64.whl", hash = "sha256:33e06717c00c788ab4e79bc4726ecc50c54b9bfb55355eae21473c145d83c2d2"},
+    {file = "lxml-5.3.1.tar.gz", hash = "sha256:106b7b5d2977b339f1e97efe2778e2ab20e99994cbb0ec5e55771ed0795920c8"},
 ]
 
 [package.extras]
 cssselect = ["cssselect (>=0.7)"]
-html-clean = ["lxml-html-clean"]
+html-clean = ["lxml_html_clean"]
 html5 = ["html5lib"]
 htmlsoup = ["BeautifulSoup4"]
-source = ["Cython (>=3.0.11)"]
+source = ["Cython (>=3.0.11,<3.1.0)"]
 
 [[package]]
 name = "markdown"
@@ -2598,13 +2603,13 @@ tqdm = "*"
 
 [[package]]
 name = "mistune"
-version = "3.1.1"
+version = "3.1.2"
 description = "A sane and fast Markdown parser with useful plugins and renderers"
 optional = false
 python-versions = ">=3.8"
 files = [
-    {file = "mistune-3.1.1-py3-none-any.whl", hash = "sha256:02106ac2aa4f66e769debbfa028509a275069dcffce0dfa578edd7b991ee700a"},
-    {file = "mistune-3.1.1.tar.gz", hash = "sha256:e0740d635f515119f7d1feb6f9b192ee60f0cc649f80a8f944f905706a21654c"},
+    {file = "mistune-3.1.2-py3-none-any.whl", hash = "sha256:4b47731332315cdca99e0ded46fc0004001c1299ff773dfb48fbe1fd226de319"},
+    {file = "mistune-3.1.2.tar.gz", hash = "sha256:733bf018ba007e8b5f2d3a9eb624034f6ee26c4ea769a98ec533ee111d504dff"},
 ]
 
 [package.dependencies]
@@ -2643,13 +2648,13 @@ min-versions = ["babel (==2.9.0)", "click (==7.0)", "colorama (==0.4)", "ghp-imp
 
 [[package]]
 name = "mkdocs-autorefs"
-version = "1.3.0"
+version = "1.4.0"
 description = "Automatically link across pages in MkDocs."
 optional = false
 python-versions = ">=3.9"
 files = [
-    {file = "mkdocs_autorefs-1.3.0-py3-none-any.whl", hash = "sha256:d180f9778a04e78b7134e31418f238bba56f56d6a8af97873946ff661befffb3"},
-    {file = "mkdocs_autorefs-1.3.0.tar.gz", hash = "sha256:6867764c099ace9025d6ac24fd07b85a98335fbd30107ef01053697c8f46db61"},
+    {file = "mkdocs_autorefs-1.4.0-py3-none-any.whl", hash = "sha256:bad19f69655878d20194acd0162e29a89c3f7e6365ffe54e72aa3fd1072f240d"},
+    {file = "mkdocs_autorefs-1.4.0.tar.gz", hash = "sha256:a9c0aa9c90edbce302c09d050a3c4cb7c76f8b7b2c98f84a7a05f53d00392156"},
 ]
 
 [package.dependencies]
@@ -2710,13 +2715,13 @@ pygments = ">2.12.0"
 
 [[package]]
 name = "mkdocs-material"
-version = "9.5.50"
+version = "9.6.5"
 description = "Documentation that simply works"
 optional = false
 python-versions = ">=3.8"
 files = [
-    {file = "mkdocs_material-9.5.50-py3-none-any.whl", hash = "sha256:f24100f234741f4d423a9d672a909d859668a4f404796be3cf035f10d6050385"},
-    {file = "mkdocs_material-9.5.50.tar.gz", hash = "sha256:ae5fe16f3d7c9ccd05bb6916a7da7420cf99a9ce5e33debd9d40403a090d5825"},
+    {file = "mkdocs_material-9.6.5-py3-none-any.whl", hash = "sha256:aad3e6fb860c20870f75fb2a69ef901f1be727891e41adb60b753efcae19453b"},
+    {file = "mkdocs_material-9.6.5.tar.gz", hash = "sha256:b714679a8c91b0ffe2188e11ed58c44d2523e9c2ae26a29cc652fa7478faa21f"},
 ]
 
 [package.dependencies]
@@ -2977,49 +2982,43 @@ dill = ">=0.3.8"
 
 [[package]]
 name = "mypy"
-version = "1.14.1"
+version = "1.15.0"
 description = "Optional static typing for Python"
 optional = false
-python-versions = ">=3.8"
+python-versions = ">=3.9"
 files = [
-    {file = "mypy-1.14.1-cp310-cp310-macosx_10_9_x86_64.whl", hash = "sha256:52686e37cf13d559f668aa398dd7ddf1f92c5d613e4f8cb262be2fb4fedb0fcb"},
-    {file = "mypy-1.14.1-cp310-cp310-macosx_11_0_arm64.whl", hash = "sha256:1fb545ca340537d4b45d3eecdb3def05e913299ca72c290326be19b3804b39c0"},
-    {file = "mypy-1.14.1-cp310-cp310-manylinux_2_17_aarch64.manylinux2014_aarch64.manylinux_2_28_aarch64.whl", hash = "sha256:90716d8b2d1f4cd503309788e51366f07c56635a3309b0f6a32547eaaa36a64d"},
-    {file = "mypy-1.14.1-cp310-cp310-manylinux_2_17_x86_64.manylinux2014_x86_64.manylinux_2_28_x86_64.whl", hash = "sha256:2ae753f5c9fef278bcf12e1a564351764f2a6da579d4a81347e1d5a15819997b"},
-    {file = "mypy-1.14.1-cp310-cp310-musllinux_1_2_x86_64.whl", hash = "sha256:e0fe0f5feaafcb04505bcf439e991c6d8f1bf8b15f12b05feeed96e9e7bf1427"},
-    {file = "mypy-1.14.1-cp310-cp310-win_amd64.whl", hash = "sha256:7d54bd85b925e501c555a3227f3ec0cfc54ee8b6930bd6141ec872d1c572f81f"},
-    {file = "mypy-1.14.1-cp311-cp311-macosx_10_9_x86_64.whl", hash = "sha256:f995e511de847791c3b11ed90084a7a0aafdc074ab88c5a9711622fe4751138c"},
-    {file = "mypy-1.14.1-cp311-cp311-macosx_11_0_arm64.whl", hash = "sha256:d64169ec3b8461311f8ce2fd2eb5d33e2d0f2c7b49116259c51d0d96edee48d1"},
-    {file = "mypy-1.14.1-cp311-cp311-manylinux_2_17_aarch64.manylinux2014_aarch64.manylinux_2_28_aarch64.whl", hash = "sha256:ba24549de7b89b6381b91fbc068d798192b1b5201987070319889e93038967a8"},
-    {file = "mypy-1.14.1-cp311-cp311-manylinux_2_17_x86_64.manylinux2014_x86_64.manylinux_2_28_x86_64.whl", hash = "sha256:183cf0a45457d28ff9d758730cd0210419ac27d4d3f285beda038c9083363b1f"},
-    {file = "mypy-1.14.1-cp311-cp311-musllinux_1_2_x86_64.whl", hash = "sha256:f2a0ecc86378f45347f586e4163d1769dd81c5a223d577fe351f26b179e148b1"},
-    {file = "mypy-1.14.1-cp311-cp311-win_amd64.whl", hash = "sha256:ad3301ebebec9e8ee7135d8e3109ca76c23752bac1e717bc84cd3836b4bf3eae"},
-    {file = "mypy-1.14.1-cp312-cp312-macosx_10_13_x86_64.whl", hash = "sha256:30ff5ef8519bbc2e18b3b54521ec319513a26f1bba19a7582e7b1f58a6e69f14"},
-    {file = "mypy-1.14.1-cp312-cp312-macosx_11_0_arm64.whl", hash = "sha256:cb9f255c18052343c70234907e2e532bc7e55a62565d64536dbc7706a20b78b9"},
-    {file = "mypy-1.14.1-cp312-cp312-manylinux_2_17_aarch64.manylinux2014_aarch64.manylinux_2_28_aarch64.whl", hash = "sha256:8b4e3413e0bddea671012b063e27591b953d653209e7a4fa5e48759cda77ca11"},
-    {file = "mypy-1.14.1-cp312-cp312-manylinux_2_17_x86_64.manylinux2014_x86_64.manylinux_2_28_x86_64.whl", hash = "sha256:553c293b1fbdebb6c3c4030589dab9fafb6dfa768995a453d8a5d3b23784af2e"},
-    {file = "mypy-1.14.1-cp312-cp312-musllinux_1_2_x86_64.whl", hash = "sha256:fad79bfe3b65fe6a1efaed97b445c3d37f7be9fdc348bdb2d7cac75579607c89"},
-    {file = "mypy-1.14.1-cp312-cp312-win_amd64.whl", hash = "sha256:8fa2220e54d2946e94ab6dbb3ba0a992795bd68b16dc852db33028df2b00191b"},
-    {file = "mypy-1.14.1-cp313-cp313-macosx_10_13_x86_64.whl", hash = "sha256:92c3ed5afb06c3a8e188cb5da4984cab9ec9a77ba956ee419c68a388b4595255"},
-    {file = "mypy-1.14.1-cp313-cp313-macosx_11_0_arm64.whl", hash = "sha256:dbec574648b3e25f43d23577309b16534431db4ddc09fda50841f1e34e64ed34"},
-    {file = "mypy-1.14.1-cp313-cp313-manylinux_2_17_aarch64.manylinux2014_aarch64.manylinux_2_28_aarch64.whl", hash = "sha256:8c6d94b16d62eb3e947281aa7347d78236688e21081f11de976376cf010eb31a"},
-    {file = "mypy-1.14.1-cp313-cp313-manylinux_2_17_x86_64.manylinux2014_x86_64.manylinux_2_28_x86_64.whl", hash = "sha256:d4b19b03fdf54f3c5b2fa474c56b4c13c9dbfb9a2db4370ede7ec11a2c5927d9"},
-    {file = "mypy-1.14.1-cp313-cp313-musllinux_1_2_x86_64.whl", hash = "sha256:0c911fde686394753fff899c409fd4e16e9b294c24bfd5e1ea4675deae1ac6fd"},
-    {file = "mypy-1.14.1-cp313-cp313-win_amd64.whl", hash = "sha256:8b21525cb51671219f5307be85f7e646a153e5acc656e5cebf64bfa076c50107"},
-    {file = "mypy-1.14.1-cp38-cp38-macosx_10_9_x86_64.whl", hash = "sha256:7084fb8f1128c76cd9cf68fe5971b37072598e7c31b2f9f95586b65c741a9d31"},
-    {file = "mypy-1.14.1-cp38-cp38-macosx_11_0_arm64.whl", hash = "sha256:8f845a00b4f420f693f870eaee5f3e2692fa84cc8514496114649cfa8fd5e2c6"},
-    {file = "mypy-1.14.1-cp38-cp38-manylinux_2_17_aarch64.manylinux2014_aarch64.manylinux_2_28_aarch64.whl", hash = "sha256:44bf464499f0e3a2d14d58b54674dee25c031703b2ffc35064bd0df2e0fac319"},
-    {file = "mypy-1.14.1-cp38-cp38-manylinux_2_17_x86_64.manylinux2014_x86_64.manylinux_2_28_x86_64.whl", hash = "sha256:c99f27732c0b7dc847adb21c9d47ce57eb48fa33a17bc6d7d5c5e9f9e7ae5bac"},
-    {file = "mypy-1.14.1-cp38-cp38-musllinux_1_2_x86_64.whl", hash = "sha256:bce23c7377b43602baa0bd22ea3265c49b9ff0b76eb315d6c34721af4cdf1d9b"},
-    {file = "mypy-1.14.1-cp38-cp38-win_amd64.whl", hash = "sha256:8edc07eeade7ebc771ff9cf6b211b9a7d93687ff892150cb5692e4f4272b0837"},
-    {file = "mypy-1.14.1-cp39-cp39-macosx_10_9_x86_64.whl", hash = "sha256:3888a1816d69f7ab92092f785a462944b3ca16d7c470d564165fe703b0970c35"},
-    {file = "mypy-1.14.1-cp39-cp39-macosx_11_0_arm64.whl", hash = "sha256:46c756a444117c43ee984bd055db99e498bc613a70bbbc120272bd13ca579fbc"},
-    {file = "mypy-1.14.1-cp39-cp39-manylinux_2_17_aarch64.manylinux2014_aarch64.manylinux_2_28_aarch64.whl", hash = "sha256:27fc248022907e72abfd8e22ab1f10e903915ff69961174784a3900a8cba9ad9"},
-    {file = "mypy-1.14.1-cp39-cp39-manylinux_2_17_x86_64.manylinux2014_x86_64.manylinux_2_28_x86_64.whl", hash = "sha256:499d6a72fb7e5de92218db961f1a66d5f11783f9ae549d214617edab5d4dbdbb"},
-    {file = "mypy-1.14.1-cp39-cp39-musllinux_1_2_x86_64.whl", hash = "sha256:57961db9795eb566dc1d1b4e9139ebc4c6b0cb6e7254ecde69d1552bf7613f60"},
-    {file = "mypy-1.14.1-cp39-cp39-win_amd64.whl", hash = "sha256:07ba89fdcc9451f2ebb02853deb6aaaa3d2239a236669a63ab3801bbf923ef5c"},
-    {file = "mypy-1.14.1-py3-none-any.whl", hash = "sha256:b66a60cc4073aeb8ae00057f9c1f64d49e90f918fbcef9a977eb121da8b8f1d1"},
-    {file = "mypy-1.14.1.tar.gz", hash = "sha256:7ec88144fe9b510e8475ec2f5f251992690fcf89ccb4500b214b4226abcd32d6"},
+    {file = "mypy-1.15.0-cp310-cp310-macosx_10_9_x86_64.whl", hash = "sha256:979e4e1a006511dacf628e36fadfecbcc0160a8af6ca7dad2f5025529e082c13"},
+    {file = "mypy-1.15.0-cp310-cp310-macosx_11_0_arm64.whl", hash = "sha256:c4bb0e1bd29f7d34efcccd71cf733580191e9a264a2202b0239da95984c5b559"},
+    {file = "mypy-1.15.0-cp310-cp310-manylinux_2_17_aarch64.manylinux2014_aarch64.manylinux_2_28_aarch64.whl", hash = "sha256:be68172e9fd9ad8fb876c6389f16d1c1b5f100ffa779f77b1fb2176fcc9ab95b"},
+    {file = "mypy-1.15.0-cp310-cp310-manylinux_2_17_x86_64.manylinux2014_x86_64.manylinux_2_28_x86_64.whl", hash = "sha256:c7be1e46525adfa0d97681432ee9fcd61a3964c2446795714699a998d193f1a3"},
+    {file = "mypy-1.15.0-cp310-cp310-musllinux_1_2_x86_64.whl", hash = "sha256:2e2c2e6d3593f6451b18588848e66260ff62ccca522dd231cd4dd59b0160668b"},
+    {file = "mypy-1.15.0-cp310-cp310-win_amd64.whl", hash = "sha256:6983aae8b2f653e098edb77f893f7b6aca69f6cffb19b2cc7443f23cce5f4828"},
+    {file = "mypy-1.15.0-cp311-cp311-macosx_10_9_x86_64.whl", hash = "sha256:2922d42e16d6de288022e5ca321cd0618b238cfc5570e0263e5ba0a77dbef56f"},
+    {file = "mypy-1.15.0-cp311-cp311-macosx_11_0_arm64.whl", hash = "sha256:2ee2d57e01a7c35de00f4634ba1bbf015185b219e4dc5909e281016df43f5ee5"},
+    {file = "mypy-1.15.0-cp311-cp311-manylinux_2_17_aarch64.manylinux2014_aarch64.manylinux_2_28_aarch64.whl", hash = "sha256:973500e0774b85d9689715feeffcc980193086551110fd678ebe1f4342fb7c5e"},
+    {file = "mypy-1.15.0-cp311-cp311-manylinux_2_17_x86_64.manylinux2014_x86_64.manylinux_2_28_x86_64.whl", hash = "sha256:5a95fb17c13e29d2d5195869262f8125dfdb5c134dc8d9a9d0aecf7525b10c2c"},
+    {file = "mypy-1.15.0-cp311-cp311-musllinux_1_2_x86_64.whl", hash = "sha256:1905f494bfd7d85a23a88c5d97840888a7bd516545fc5aaedff0267e0bb54e2f"},
+    {file = "mypy-1.15.0-cp311-cp311-win_amd64.whl", hash = "sha256:c9817fa23833ff189db061e6d2eff49b2f3b6ed9856b4a0a73046e41932d744f"},
+    {file = "mypy-1.15.0-cp312-cp312-macosx_10_13_x86_64.whl", hash = "sha256:aea39e0583d05124836ea645f412e88a5c7d0fd77a6d694b60d9b6b2d9f184fd"},
+    {file = "mypy-1.15.0-cp312-cp312-macosx_11_0_arm64.whl", hash = "sha256:2f2147ab812b75e5b5499b01ade1f4a81489a147c01585cda36019102538615f"},
+    {file = "mypy-1.15.0-cp312-cp312-manylinux_2_17_aarch64.manylinux2014_aarch64.manylinux_2_28_aarch64.whl", hash = "sha256:ce436f4c6d218a070048ed6a44c0bbb10cd2cc5e272b29e7845f6a2f57ee4464"},
+    {file = "mypy-1.15.0-cp312-cp312-manylinux_2_17_x86_64.manylinux2014_x86_64.manylinux_2_28_x86_64.whl", hash = "sha256:8023ff13985661b50a5928fc7a5ca15f3d1affb41e5f0a9952cb68ef090b31ee"},
+    {file = "mypy-1.15.0-cp312-cp312-musllinux_1_2_x86_64.whl", hash = "sha256:1124a18bc11a6a62887e3e137f37f53fbae476dc36c185d549d4f837a2a6a14e"},
+    {file = "mypy-1.15.0-cp312-cp312-win_amd64.whl", hash = "sha256:171a9ca9a40cd1843abeca0e405bc1940cd9b305eaeea2dda769ba096932bb22"},
+    {file = "mypy-1.15.0-cp313-cp313-macosx_10_13_x86_64.whl", hash = "sha256:93faf3fdb04768d44bf28693293f3904bbb555d076b781ad2530214ee53e3445"},
+    {file = "mypy-1.15.0-cp313-cp313-macosx_11_0_arm64.whl", hash = "sha256:811aeccadfb730024c5d3e326b2fbe9249bb7413553f15499a4050f7c30e801d"},
+    {file = "mypy-1.15.0-cp313-cp313-manylinux_2_17_aarch64.manylinux2014_aarch64.manylinux_2_28_aarch64.whl", hash = "sha256:98b7b9b9aedb65fe628c62a6dc57f6d5088ef2dfca37903a7d9ee374d03acca5"},
+    {file = "mypy-1.15.0-cp313-cp313-manylinux_2_17_x86_64.manylinux2014_x86_64.manylinux_2_28_x86_64.whl", hash = "sha256:c43a7682e24b4f576d93072216bf56eeff70d9140241f9edec0c104d0c515036"},
+    {file = "mypy-1.15.0-cp313-cp313-musllinux_1_2_x86_64.whl", hash = "sha256:baefc32840a9f00babd83251560e0ae1573e2f9d1b067719479bfb0e987c6357"},
+    {file = "mypy-1.15.0-cp313-cp313-win_amd64.whl", hash = "sha256:b9378e2c00146c44793c98b8d5a61039a048e31f429fb0eb546d93f4b000bedf"},
+    {file = "mypy-1.15.0-cp39-cp39-macosx_10_9_x86_64.whl", hash = "sha256:e601a7fa172c2131bff456bb3ee08a88360760d0d2f8cbd7a75a65497e2df078"},
+    {file = "mypy-1.15.0-cp39-cp39-macosx_11_0_arm64.whl", hash = "sha256:712e962a6357634fef20412699a3655c610110e01cdaa6180acec7fc9f8513ba"},
+    {file = "mypy-1.15.0-cp39-cp39-manylinux_2_17_aarch64.manylinux2014_aarch64.manylinux_2_28_aarch64.whl", hash = "sha256:f95579473af29ab73a10bada2f9722856792a36ec5af5399b653aa28360290a5"},
+    {file = "mypy-1.15.0-cp39-cp39-manylinux_2_17_x86_64.manylinux2014_x86_64.manylinux_2_28_x86_64.whl", hash = "sha256:8f8722560a14cde92fdb1e31597760dc35f9f5524cce17836c0d22841830fd5b"},
+    {file = "mypy-1.15.0-cp39-cp39-musllinux_1_2_x86_64.whl", hash = "sha256:1fbb8da62dc352133d7d7ca90ed2fb0e9d42bb1a32724c287d3c76c58cbaa9c2"},
+    {file = "mypy-1.15.0-cp39-cp39-win_amd64.whl", hash = "sha256:d10d994b41fb3497719bbf866f227b3489048ea4bbbb5015357db306249f7980"},
+    {file = "mypy-1.15.0-py3-none-any.whl", hash = "sha256:5469affef548bd1895d86d3bf10ce2b44e33d86923c29e4d675b3e323437ea3e"},
+    {file = "mypy-1.15.0.tar.gz", hash = "sha256:404534629d51d3efea5c800ee7c42b72a6554d6c400e6a79eafe15d11341fd43"},
 ]
 
 [package.dependencies]
@@ -3176,35 +3175,35 @@ test = ["pytest (>=7.2)", "pytest-cov (>=4.0)"]
 
 [[package]]
 name = "nh3"
-version = "0.2.20"
+version = "0.2.21"
 description = "Python binding to Ammonia HTML sanitizer Rust crate"
 optional = false
 python-versions = ">=3.8"
 files = [
-    {file = "nh3-0.2.20-cp313-cp313t-macosx_10_12_x86_64.macosx_11_0_arm64.macosx_10_12_universal2.whl", hash = "sha256:e1061a4ab6681f6bdf72b110eea0c4e1379d57c9de937db3be4202f7ad6043db"},
-    {file = "nh3-0.2.20-cp313-cp313t-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:eb4254b1dac4a1ee49919a5b3f1caf9803ea8dada1816d9e8289e63d3cd0dd9a"},
-    {file = "nh3-0.2.20-cp313-cp313t-manylinux_2_5_i686.manylinux1_i686.whl", hash = "sha256:0ae9cbd713524cdb81e64663d0d6aae26f678db9f2cd9db0bf162606f1f9f20c"},
-    {file = "nh3-0.2.20-cp313-cp313t-musllinux_1_2_aarch64.whl", hash = "sha256:e1f7370b4e14cc03f5ae141ef30a1caf81fa5787711f80be9081418dd9eb79d2"},
-    {file = "nh3-0.2.20-cp313-cp313t-musllinux_1_2_armv7l.whl", hash = "sha256:ac4d27dc836a476efffc6eb661994426b8b805c951b29c9cf2ff36bc9ad58bc5"},
-    {file = "nh3-0.2.20-cp313-cp313t-musllinux_1_2_i686.whl", hash = "sha256:4fd2e9248725ebcedac3997a8d3da0d90a12a28c9179c6ba51f1658938ac30d0"},
-    {file = "nh3-0.2.20-cp313-cp313t-musllinux_1_2_x86_64.whl", hash = "sha256:f7d564871833ddbe54df3aa59053b1110729d3a800cb7628ae8f42adb3d75208"},
-    {file = "nh3-0.2.20-cp313-cp313t-win32.whl", hash = "sha256:d2a176fd4306b6f0f178a3f67fac91bd97a3a8d8fafb771c9b9ef675ba5c8886"},
-    {file = "nh3-0.2.20-cp313-cp313t-win_amd64.whl", hash = "sha256:6ed834c68452a600f517dd3e1534dbfaff1f67f98899fecf139a055a25d99150"},
-    {file = "nh3-0.2.20-cp38-abi3-macosx_10_12_x86_64.macosx_11_0_arm64.macosx_10_12_universal2.whl", hash = "sha256:76e2f603b30c02ff6456b233a83fc377dedab6a50947b04e960a6b905637b776"},
-    {file = "nh3-0.2.20-cp38-abi3-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:181063c581defe683bd4bb78188ac9936d208aebbc74c7f7c16b6a32ae2ebb38"},
-    {file = "nh3-0.2.20-cp38-abi3-manylinux_2_17_armv7l.manylinux2014_armv7l.whl", hash = "sha256:231addb7643c952cd6d71f1c8702d703f8fe34afcb20becb3efb319a501a12d7"},
-    {file = "nh3-0.2.20-cp38-abi3-manylinux_2_17_ppc64.manylinux2014_ppc64.whl", hash = "sha256:1b9a8340a0aab991c68a5ca938d35ef4a8a3f4bf1b455da8855a40bee1fa0ace"},
-    {file = "nh3-0.2.20-cp38-abi3-manylinux_2_17_ppc64le.manylinux2014_ppc64le.whl", hash = "sha256:10317cd96fe4bbd4eb6b95f3920b71c902157ad44fed103fdcde43e3b8ee8be6"},
-    {file = "nh3-0.2.20-cp38-abi3-manylinux_2_17_s390x.manylinux2014_s390x.whl", hash = "sha256:8698db4c04b140800d1a1cd3067fda399e36e1e2b8fc1fe04292a907350a3e9b"},
-    {file = "nh3-0.2.20-cp38-abi3-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:3eb04b9c3deb13c3a375ea39fd4a3c00d1f92e8fb2349f25f1e3e4506751774b"},
-    {file = "nh3-0.2.20-cp38-abi3-manylinux_2_5_i686.manylinux1_i686.whl", hash = "sha256:92f3f1c4f47a2c6f3ca7317b1d5ced05bd29556a75d3a4e2715652ae9d15c05d"},
-    {file = "nh3-0.2.20-cp38-abi3-musllinux_1_2_aarch64.whl", hash = "sha256:ddefa9fd6794a87e37d05827d299d4b53a3ec6f23258101907b96029bfef138a"},
-    {file = "nh3-0.2.20-cp38-abi3-musllinux_1_2_armv7l.whl", hash = "sha256:ce3731c8f217685d33d9268362e5b4f770914e922bba94d368ab244a59a6c397"},
-    {file = "nh3-0.2.20-cp38-abi3-musllinux_1_2_i686.whl", hash = "sha256:09f037c02fc2c43b211ff1523de32801dcfb0918648d8e651c36ef890f1731ec"},
-    {file = "nh3-0.2.20-cp38-abi3-musllinux_1_2_x86_64.whl", hash = "sha256:813f1c8012dd64c990514b795508abb90789334f76a561fa0fd4ca32d2275330"},
-    {file = "nh3-0.2.20-cp38-abi3-win32.whl", hash = "sha256:47b2946c0e13057855209daeffb45dc910bd0c55daf10190bb0b4b60e2999784"},
-    {file = "nh3-0.2.20-cp38-abi3-win_amd64.whl", hash = "sha256:da87573f03084edae8eb87cfe811ec338606288f81d333c07d2a9a0b9b976c0b"},
-    {file = "nh3-0.2.20.tar.gz", hash = "sha256:9705c42d7ff88a0bea546c82d7fe5e59135e3d3f057e485394f491248a1f8ed5"},
+    {file = "nh3-0.2.21-cp313-cp313t-macosx_10_12_x86_64.macosx_11_0_arm64.macosx_10_12_universal2.whl", hash = "sha256:fcff321bd60c6c5c9cb4ddf2554e22772bb41ebd93ad88171bbbb6f271255286"},
+    {file = "nh3-0.2.21-cp313-cp313t-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:31eedcd7d08b0eae28ba47f43fd33a653b4cdb271d64f1aeda47001618348fde"},
+    {file = "nh3-0.2.21-cp313-cp313t-manylinux_2_5_i686.manylinux1_i686.whl", hash = "sha256:d426d7be1a2f3d896950fe263332ed1662f6c78525b4520c8e9861f8d7f0d243"},
+    {file = "nh3-0.2.21-cp313-cp313t-musllinux_1_2_aarch64.whl", hash = "sha256:9d67709bc0d7d1f5797b21db26e7a8b3d15d21c9c5f58ccfe48b5328483b685b"},
+    {file = "nh3-0.2.21-cp313-cp313t-musllinux_1_2_armv7l.whl", hash = "sha256:55823c5ea1f6b267a4fad5de39bc0524d49a47783e1fe094bcf9c537a37df251"},
+    {file = "nh3-0.2.21-cp313-cp313t-musllinux_1_2_i686.whl", hash = "sha256:818f2b6df3763e058efa9e69677b5a92f9bc0acff3295af5ed013da544250d5b"},
+    {file = "nh3-0.2.21-cp313-cp313t-musllinux_1_2_x86_64.whl", hash = "sha256:b3b5c58161e08549904ac4abd450dacd94ff648916f7c376ae4b2c0652b98ff9"},
+    {file = "nh3-0.2.21-cp313-cp313t-win32.whl", hash = "sha256:637d4a10c834e1b7d9548592c7aad760611415fcd5bd346f77fd8a064309ae6d"},
+    {file = "nh3-0.2.21-cp313-cp313t-win_amd64.whl", hash = "sha256:713d16686596e556b65e7f8c58328c2df63f1a7abe1277d87625dcbbc012ef82"},
+    {file = "nh3-0.2.21-cp38-abi3-macosx_10_12_x86_64.macosx_11_0_arm64.macosx_10_12_universal2.whl", hash = "sha256:a772dec5b7b7325780922dd904709f0f5f3a79fbf756de5291c01370f6df0967"},
+    {file = "nh3-0.2.21-cp38-abi3-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:d002b648592bf3033adfd875a48f09b8ecc000abd7f6a8769ed86b6ccc70c759"},
+    {file = "nh3-0.2.21-cp38-abi3-manylinux_2_17_armv7l.manylinux2014_armv7l.whl", hash = "sha256:2a5174551f95f2836f2ad6a8074560f261cf9740a48437d6151fd2d4d7d617ab"},
+    {file = "nh3-0.2.21-cp38-abi3-manylinux_2_17_ppc64.manylinux2014_ppc64.whl", hash = "sha256:b8d55ea1fc7ae3633d758a92aafa3505cd3cc5a6e40470c9164d54dff6f96d42"},
+    {file = "nh3-0.2.21-cp38-abi3-manylinux_2_17_ppc64le.manylinux2014_ppc64le.whl", hash = "sha256:6ae319f17cd8960d0612f0f0ddff5a90700fa71926ca800e9028e7851ce44a6f"},
+    {file = "nh3-0.2.21-cp38-abi3-manylinux_2_17_s390x.manylinux2014_s390x.whl", hash = "sha256:63ca02ac6f27fc80f9894409eb61de2cb20ef0a23740c7e29f9ec827139fa578"},
+    {file = "nh3-0.2.21-cp38-abi3-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:a5f77e62aed5c4acad635239ac1290404c7e940c81abe561fd2af011ff59f585"},
+    {file = "nh3-0.2.21-cp38-abi3-manylinux_2_5_i686.manylinux1_i686.whl", hash = "sha256:087ffadfdcd497658c3adc797258ce0f06be8a537786a7217649fc1c0c60c293"},
+    {file = "nh3-0.2.21-cp38-abi3-musllinux_1_2_aarch64.whl", hash = "sha256:ac7006c3abd097790e611fe4646ecb19a8d7f2184b882f6093293b8d9b887431"},
+    {file = "nh3-0.2.21-cp38-abi3-musllinux_1_2_armv7l.whl", hash = "sha256:6141caabe00bbddc869665b35fc56a478eb774a8c1dfd6fba9fe1dfdf29e6efa"},
+    {file = "nh3-0.2.21-cp38-abi3-musllinux_1_2_i686.whl", hash = "sha256:20979783526641c81d2f5bfa6ca5ccca3d1e4472474b162c6256745fbfe31cd1"},
+    {file = "nh3-0.2.21-cp38-abi3-musllinux_1_2_x86_64.whl", hash = "sha256:a7ea28cd49293749d67e4fcf326c554c83ec912cd09cd94aa7ec3ab1921c8283"},
+    {file = "nh3-0.2.21-cp38-abi3-win32.whl", hash = "sha256:6c9c30b8b0d291a7c5ab0967ab200598ba33208f754f2f4920e9343bdd88f79a"},
+    {file = "nh3-0.2.21-cp38-abi3-win_amd64.whl", hash = "sha256:bb0014948f04d7976aabae43fcd4cb7f551f9f8ce785a4c9ef66e6c2590f8629"},
+    {file = "nh3-0.2.21.tar.gz", hash = "sha256:4990e7ee6a55490dbf00d61a6f476c9a3258e31e711e13713b2ea7d6616f670e"},
 ]
 
 [[package]]
@@ -3348,66 +3347,66 @@ files = [
 
 [[package]]
 name = "numpy"
-version = "2.2.2"
+version = "2.2.3"
 description = "Fundamental package for array computing in Python"
 optional = false
 python-versions = ">=3.10"
 files = [
-    {file = "numpy-2.2.2-cp310-cp310-macosx_10_9_x86_64.whl", hash = "sha256:7079129b64cb78bdc8d611d1fd7e8002c0a2565da6a47c4df8062349fee90e3e"},
-    {file = "numpy-2.2.2-cp310-cp310-macosx_11_0_arm64.whl", hash = "sha256:2ec6c689c61df613b783aeb21f945c4cbe6c51c28cb70aae8430577ab39f163e"},
-    {file = "numpy-2.2.2-cp310-cp310-macosx_14_0_arm64.whl", hash = "sha256:40c7ff5da22cd391944a28c6a9c638a5eef77fcf71d6e3a79e1d9d9e82752715"},
-    {file = "numpy-2.2.2-cp310-cp310-macosx_14_0_x86_64.whl", hash = "sha256:995f9e8181723852ca458e22de5d9b7d3ba4da3f11cc1cb113f093b271d7965a"},
-    {file = "numpy-2.2.2-cp310-cp310-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:b78ea78450fd96a498f50ee096f69c75379af5138f7881a51355ab0e11286c97"},
-    {file = "numpy-2.2.2-cp310-cp310-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:3fbe72d347fbc59f94124125e73fc4976a06927ebc503ec5afbfb35f193cd957"},
-    {file = "numpy-2.2.2-cp310-cp310-musllinux_1_2_aarch64.whl", hash = "sha256:8e6da5cffbbe571f93588f562ed130ea63ee206d12851b60819512dd3e1ba50d"},
-    {file = "numpy-2.2.2-cp310-cp310-musllinux_1_2_x86_64.whl", hash = "sha256:09d6a2032faf25e8d0cadde7fd6145118ac55d2740132c1d845f98721b5ebcfd"},
-    {file = "numpy-2.2.2-cp310-cp310-win32.whl", hash = "sha256:159ff6ee4c4a36a23fe01b7c3d07bd8c14cc433d9720f977fcd52c13c0098160"},
-    {file = "numpy-2.2.2-cp310-cp310-win_amd64.whl", hash = "sha256:64bd6e1762cd7f0986a740fee4dff927b9ec2c5e4d9a28d056eb17d332158014"},
-    {file = "numpy-2.2.2-cp311-cp311-macosx_10_9_x86_64.whl", hash = "sha256:642199e98af1bd2b6aeb8ecf726972d238c9877b0f6e8221ee5ab945ec8a2189"},
-    {file = "numpy-2.2.2-cp311-cp311-macosx_11_0_arm64.whl", hash = "sha256:6d9fc9d812c81e6168b6d405bf00b8d6739a7f72ef22a9214c4241e0dc70b323"},
-    {file = "numpy-2.2.2-cp311-cp311-macosx_14_0_arm64.whl", hash = "sha256:c7d1fd447e33ee20c1f33f2c8e6634211124a9aabde3c617687d8b739aa69eac"},
-    {file = "numpy-2.2.2-cp311-cp311-macosx_14_0_x86_64.whl", hash = "sha256:451e854cfae0febe723077bd0cf0a4302a5d84ff25f0bfece8f29206c7bed02e"},
-    {file = "numpy-2.2.2-cp311-cp311-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:bd249bc894af67cbd8bad2c22e7cbcd46cf87ddfca1f1289d1e7e54868cc785c"},
-    {file = "numpy-2.2.2-cp311-cp311-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:02935e2c3c0c6cbe9c7955a8efa8908dd4221d7755644c59d1bba28b94fd334f"},
-    {file = "numpy-2.2.2-cp311-cp311-musllinux_1_2_aarch64.whl", hash = "sha256:a972cec723e0563aa0823ee2ab1df0cb196ed0778f173b381c871a03719d4826"},
-    {file = "numpy-2.2.2-cp311-cp311-musllinux_1_2_x86_64.whl", hash = "sha256:d6d6a0910c3b4368d89dde073e630882cdb266755565155bc33520283b2d9df8"},
-    {file = "numpy-2.2.2-cp311-cp311-win32.whl", hash = "sha256:860fd59990c37c3ef913c3ae390b3929d005243acca1a86facb0773e2d8d9e50"},
-    {file = "numpy-2.2.2-cp311-cp311-win_amd64.whl", hash = "sha256:da1eeb460ecce8d5b8608826595c777728cdf28ce7b5a5a8c8ac8d949beadcf2"},
-    {file = "numpy-2.2.2-cp312-cp312-macosx_10_13_x86_64.whl", hash = "sha256:ac9bea18d6d58a995fac1b2cb4488e17eceeac413af014b1dd26170b766d8467"},
-    {file = "numpy-2.2.2-cp312-cp312-macosx_11_0_arm64.whl", hash = "sha256:23ae9f0c2d889b7b2d88a3791f6c09e2ef827c2446f1c4a3e3e76328ee4afd9a"},
-    {file = "numpy-2.2.2-cp312-cp312-macosx_14_0_arm64.whl", hash = "sha256:3074634ea4d6df66be04f6728ee1d173cfded75d002c75fac79503a880bf3825"},
-    {file = "numpy-2.2.2-cp312-cp312-macosx_14_0_x86_64.whl", hash = "sha256:8ec0636d3f7d68520afc6ac2dc4b8341ddb725039de042faf0e311599f54eb37"},
-    {file = "numpy-2.2.2-cp312-cp312-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:2ffbb1acd69fdf8e89dd60ef6182ca90a743620957afb7066385a7bbe88dc748"},
-    {file = "numpy-2.2.2-cp312-cp312-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:0349b025e15ea9d05c3d63f9657707a4e1d471128a3b1d876c095f328f8ff7f0"},
-    {file = "numpy-2.2.2-cp312-cp312-musllinux_1_2_aarch64.whl", hash = "sha256:463247edcee4a5537841d5350bc87fe8e92d7dd0e8c71c995d2c6eecb8208278"},
-    {file = "numpy-2.2.2-cp312-cp312-musllinux_1_2_x86_64.whl", hash = "sha256:9dd47ff0cb2a656ad69c38da850df3454da88ee9a6fde0ba79acceee0e79daba"},
-    {file = "numpy-2.2.2-cp312-cp312-win32.whl", hash = "sha256:4525b88c11906d5ab1b0ec1f290996c0020dd318af8b49acaa46f198b1ffc283"},
-    {file = "numpy-2.2.2-cp312-cp312-win_amd64.whl", hash = "sha256:5acea83b801e98541619af398cc0109ff48016955cc0818f478ee9ef1c5c3dcb"},
-    {file = "numpy-2.2.2-cp313-cp313-macosx_10_13_x86_64.whl", hash = "sha256:b208cfd4f5fe34e1535c08983a1a6803fdbc7a1e86cf13dd0c61de0b51a0aadc"},
-    {file = "numpy-2.2.2-cp313-cp313-macosx_11_0_arm64.whl", hash = "sha256:d0bbe7dd86dca64854f4b6ce2ea5c60b51e36dfd597300057cf473d3615f2369"},
-    {file = "numpy-2.2.2-cp313-cp313-macosx_14_0_arm64.whl", hash = "sha256:22ea3bb552ade325530e72a0c557cdf2dea8914d3a5e1fecf58fa5dbcc6f43cd"},
-    {file = "numpy-2.2.2-cp313-cp313-macosx_14_0_x86_64.whl", hash = "sha256:128c41c085cab8a85dc29e66ed88c05613dccf6bc28b3866cd16050a2f5448be"},
-    {file = "numpy-2.2.2-cp313-cp313-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:250c16b277e3b809ac20d1f590716597481061b514223c7badb7a0f9993c7f84"},
-    {file = "numpy-2.2.2-cp313-cp313-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:e0c8854b09bc4de7b041148d8550d3bd712b5c21ff6a8ed308085f190235d7ff"},
-    {file = "numpy-2.2.2-cp313-cp313-musllinux_1_2_aarch64.whl", hash = "sha256:b6fb9c32a91ec32a689ec6410def76443e3c750e7cfc3fb2206b985ffb2b85f0"},
-    {file = "numpy-2.2.2-cp313-cp313-musllinux_1_2_x86_64.whl", hash = "sha256:57b4012e04cc12b78590a334907e01b3a85efb2107df2b8733ff1ed05fce71de"},
-    {file = "numpy-2.2.2-cp313-cp313-win32.whl", hash = "sha256:4dbd80e453bd34bd003b16bd802fac70ad76bd463f81f0c518d1245b1c55e3d9"},
-    {file = "numpy-2.2.2-cp313-cp313-win_amd64.whl", hash = "sha256:5a8c863ceacae696aff37d1fd636121f1a512117652e5dfb86031c8d84836369"},
-    {file = "numpy-2.2.2-cp313-cp313t-macosx_10_13_x86_64.whl", hash = "sha256:b3482cb7b3325faa5f6bc179649406058253d91ceda359c104dac0ad320e1391"},
-    {file = "numpy-2.2.2-cp313-cp313t-macosx_11_0_arm64.whl", hash = "sha256:9491100aba630910489c1d0158034e1c9a6546f0b1340f716d522dc103788e39"},
-    {file = "numpy-2.2.2-cp313-cp313t-macosx_14_0_arm64.whl", hash = "sha256:41184c416143defa34cc8eb9d070b0a5ba4f13a0fa96a709e20584638254b317"},
-    {file = "numpy-2.2.2-cp313-cp313t-macosx_14_0_x86_64.whl", hash = "sha256:7dca87ca328f5ea7dafc907c5ec100d187911f94825f8700caac0b3f4c384b49"},
-    {file = "numpy-2.2.2-cp313-cp313t-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:0bc61b307655d1a7f9f4b043628b9f2b721e80839914ede634e3d485913e1fb2"},
-    {file = "numpy-2.2.2-cp313-cp313t-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:9fad446ad0bc886855ddf5909cbf8cb5d0faa637aaa6277fb4b19ade134ab3c7"},
-    {file = "numpy-2.2.2-cp313-cp313t-musllinux_1_2_aarch64.whl", hash = "sha256:149d1113ac15005652e8d0d3f6fd599360e1a708a4f98e43c9c77834a28238cb"},
-    {file = "numpy-2.2.2-cp313-cp313t-musllinux_1_2_x86_64.whl", hash = "sha256:106397dbbb1896f99e044efc90360d098b3335060375c26aa89c0d8a97c5f648"},
-    {file = "numpy-2.2.2-cp313-cp313t-win32.whl", hash = "sha256:0eec19f8af947a61e968d5429f0bd92fec46d92b0008d0a6685b40d6adf8a4f4"},
-    {file = "numpy-2.2.2-cp313-cp313t-win_amd64.whl", hash = "sha256:97b974d3ba0fb4612b77ed35d7627490e8e3dff56ab41454d9e8b23448940576"},
-    {file = "numpy-2.2.2-pp310-pypy310_pp73-macosx_10_15_x86_64.whl", hash = "sha256:b0531f0b0e07643eb089df4c509d30d72c9ef40defa53e41363eca8a8cc61495"},
-    {file = "numpy-2.2.2-pp310-pypy310_pp73-macosx_14_0_x86_64.whl", hash = "sha256:e9e82dcb3f2ebbc8cb5ce1102d5f1c5ed236bf8a11730fb45ba82e2841ec21df"},
-    {file = "numpy-2.2.2-pp310-pypy310_pp73-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:e0d4142eb40ca6f94539e4db929410f2a46052a0fe7a2c1c59f6179c39938d2a"},
-    {file = "numpy-2.2.2-pp310-pypy310_pp73-win_amd64.whl", hash = "sha256:356ca982c188acbfa6af0d694284d8cf20e95b1c3d0aefa8929376fea9146f60"},
-    {file = "numpy-2.2.2.tar.gz", hash = "sha256:ed6906f61834d687738d25988ae117683705636936cc605be0bb208b23df4d8f"},
+    {file = "numpy-2.2.3-cp310-cp310-macosx_10_9_x86_64.whl", hash = "sha256:cbc6472e01952d3d1b2772b720428f8b90e2deea8344e854df22b0618e9cce71"},
+    {file = "numpy-2.2.3-cp310-cp310-macosx_11_0_arm64.whl", hash = "sha256:cdfe0c22692a30cd830c0755746473ae66c4a8f2e7bd508b35fb3b6a0813d787"},
+    {file = "numpy-2.2.3-cp310-cp310-macosx_14_0_arm64.whl", hash = "sha256:e37242f5324ffd9f7ba5acf96d774f9276aa62a966c0bad8dae692deebec7716"},
+    {file = "numpy-2.2.3-cp310-cp310-macosx_14_0_x86_64.whl", hash = "sha256:95172a21038c9b423e68be78fd0be6e1b97674cde269b76fe269a5dfa6fadf0b"},
+    {file = "numpy-2.2.3-cp310-cp310-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:d5b47c440210c5d1d67e1cf434124e0b5c395eee1f5806fdd89b553ed1acd0a3"},
+    {file = "numpy-2.2.3-cp310-cp310-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:0391ea3622f5c51a2e29708877d56e3d276827ac5447d7f45e9bc4ade8923c52"},
+    {file = "numpy-2.2.3-cp310-cp310-musllinux_1_2_aarch64.whl", hash = "sha256:f6b3dfc7661f8842babd8ea07e9897fe3d9b69a1d7e5fbb743e4160f9387833b"},
+    {file = "numpy-2.2.3-cp310-cp310-musllinux_1_2_x86_64.whl", hash = "sha256:1ad78ce7f18ce4e7df1b2ea4019b5817a2f6a8a16e34ff2775f646adce0a5027"},
+    {file = "numpy-2.2.3-cp310-cp310-win32.whl", hash = "sha256:5ebeb7ef54a7be11044c33a17b2624abe4307a75893c001a4800857956b41094"},
+    {file = "numpy-2.2.3-cp310-cp310-win_amd64.whl", hash = "sha256:596140185c7fa113563c67c2e894eabe0daea18cf8e33851738c19f70ce86aeb"},
+    {file = "numpy-2.2.3-cp311-cp311-macosx_10_9_x86_64.whl", hash = "sha256:16372619ee728ed67a2a606a614f56d3eabc5b86f8b615c79d01957062826ca8"},
+    {file = "numpy-2.2.3-cp311-cp311-macosx_11_0_arm64.whl", hash = "sha256:5521a06a3148686d9269c53b09f7d399a5725c47bbb5b35747e1cb76326b714b"},
+    {file = "numpy-2.2.3-cp311-cp311-macosx_14_0_arm64.whl", hash = "sha256:7c8dde0ca2f77828815fd1aedfdf52e59071a5bae30dac3b4da2a335c672149a"},
+    {file = "numpy-2.2.3-cp311-cp311-macosx_14_0_x86_64.whl", hash = "sha256:77974aba6c1bc26e3c205c2214f0d5b4305bdc719268b93e768ddb17e3fdd636"},
+    {file = "numpy-2.2.3-cp311-cp311-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:d42f9c36d06440e34226e8bd65ff065ca0963aeecada587b937011efa02cdc9d"},
+    {file = "numpy-2.2.3-cp311-cp311-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:f2712c5179f40af9ddc8f6727f2bd910ea0eb50206daea75f58ddd9fa3f715bb"},
+    {file = "numpy-2.2.3-cp311-cp311-musllinux_1_2_aarch64.whl", hash = "sha256:c8b0451d2ec95010d1db8ca733afc41f659f425b7f608af569711097fd6014e2"},
+    {file = "numpy-2.2.3-cp311-cp311-musllinux_1_2_x86_64.whl", hash = "sha256:d9b4a8148c57ecac25a16b0e11798cbe88edf5237b0df99973687dd866f05e1b"},
+    {file = "numpy-2.2.3-cp311-cp311-win32.whl", hash = "sha256:1f45315b2dc58d8a3e7754fe4e38b6fce132dab284a92851e41b2b344f6441c5"},
+    {file = "numpy-2.2.3-cp311-cp311-win_amd64.whl", hash = "sha256:9f48ba6f6c13e5e49f3d3efb1b51c8193215c42ac82610a04624906a9270be6f"},
+    {file = "numpy-2.2.3-cp312-cp312-macosx_10_13_x86_64.whl", hash = "sha256:12c045f43b1d2915eca6b880a7f4a256f59d62df4f044788c8ba67709412128d"},
+    {file = "numpy-2.2.3-cp312-cp312-macosx_11_0_arm64.whl", hash = "sha256:87eed225fd415bbae787f93a457af7f5990b92a334e346f72070bf569b9c9c95"},
+    {file = "numpy-2.2.3-cp312-cp312-macosx_14_0_arm64.whl", hash = "sha256:712a64103d97c404e87d4d7c47fb0c7ff9acccc625ca2002848e0d53288b90ea"},
+    {file = "numpy-2.2.3-cp312-cp312-macosx_14_0_x86_64.whl", hash = "sha256:a5ae282abe60a2db0fd407072aff4599c279bcd6e9a2475500fc35b00a57c532"},
+    {file = "numpy-2.2.3-cp312-cp312-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:5266de33d4c3420973cf9ae3b98b54a2a6d53a559310e3236c4b2b06b9c07d4e"},
+    {file = "numpy-2.2.3-cp312-cp312-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:3b787adbf04b0db1967798dba8da1af07e387908ed1553a0d6e74c084d1ceafe"},
+    {file = "numpy-2.2.3-cp312-cp312-musllinux_1_2_aarch64.whl", hash = "sha256:34c1b7e83f94f3b564b35f480f5652a47007dd91f7c839f404d03279cc8dd021"},
+    {file = "numpy-2.2.3-cp312-cp312-musllinux_1_2_x86_64.whl", hash = "sha256:4d8335b5f1b6e2bce120d55fb17064b0262ff29b459e8493d1785c18ae2553b8"},
+    {file = "numpy-2.2.3-cp312-cp312-win32.whl", hash = "sha256:4d9828d25fb246bedd31e04c9e75714a4087211ac348cb39c8c5f99dbb6683fe"},
+    {file = "numpy-2.2.3-cp312-cp312-win_amd64.whl", hash = "sha256:83807d445817326b4bcdaaaf8e8e9f1753da04341eceec705c001ff342002e5d"},
+    {file = "numpy-2.2.3-cp313-cp313-macosx_10_13_x86_64.whl", hash = "sha256:7bfdb06b395385ea9b91bf55c1adf1b297c9fdb531552845ff1d3ea6e40d5aba"},
+    {file = "numpy-2.2.3-cp313-cp313-macosx_11_0_arm64.whl", hash = "sha256:23c9f4edbf4c065fddb10a4f6e8b6a244342d95966a48820c614891e5059bb50"},
+    {file = "numpy-2.2.3-cp313-cp313-macosx_14_0_arm64.whl", hash = "sha256:a0c03b6be48aaf92525cccf393265e02773be8fd9551a2f9adbe7db1fa2b60f1"},
+    {file = "numpy-2.2.3-cp313-cp313-macosx_14_0_x86_64.whl", hash = "sha256:2376e317111daa0a6739e50f7ee2a6353f768489102308b0d98fcf4a04f7f3b5"},
+    {file = "numpy-2.2.3-cp313-cp313-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:8fb62fe3d206d72fe1cfe31c4a1106ad2b136fcc1606093aeab314f02930fdf2"},
+    {file = "numpy-2.2.3-cp313-cp313-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:52659ad2534427dffcc36aac76bebdd02b67e3b7a619ac67543bc9bfe6b7cdb1"},
+    {file = "numpy-2.2.3-cp313-cp313-musllinux_1_2_aarch64.whl", hash = "sha256:1b416af7d0ed3271cad0f0a0d0bee0911ed7eba23e66f8424d9f3dfcdcae1304"},
+    {file = "numpy-2.2.3-cp313-cp313-musllinux_1_2_x86_64.whl", hash = "sha256:1402da8e0f435991983d0a9708b779f95a8c98c6b18a171b9f1be09005e64d9d"},
+    {file = "numpy-2.2.3-cp313-cp313-win32.whl", hash = "sha256:136553f123ee2951bfcfbc264acd34a2fc2f29d7cdf610ce7daf672b6fbaa693"},
+    {file = "numpy-2.2.3-cp313-cp313-win_amd64.whl", hash = "sha256:5b732c8beef1d7bc2d9e476dbba20aaff6167bf205ad9aa8d30913859e82884b"},
+    {file = "numpy-2.2.3-cp313-cp313t-macosx_10_13_x86_64.whl", hash = "sha256:435e7a933b9fda8126130b046975a968cc2d833b505475e588339e09f7672890"},
+    {file = "numpy-2.2.3-cp313-cp313t-macosx_11_0_arm64.whl", hash = "sha256:7678556eeb0152cbd1522b684dcd215250885993dd00adb93679ec3c0e6e091c"},
+    {file = "numpy-2.2.3-cp313-cp313t-macosx_14_0_arm64.whl", hash = "sha256:2e8da03bd561504d9b20e7a12340870dfc206c64ea59b4cfee9fceb95070ee94"},
+    {file = "numpy-2.2.3-cp313-cp313t-macosx_14_0_x86_64.whl", hash = "sha256:c9aa4496fd0e17e3843399f533d62857cef5900facf93e735ef65aa4bbc90ef0"},
+    {file = "numpy-2.2.3-cp313-cp313t-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:f4ca91d61a4bf61b0f2228f24bbfa6a9facd5f8af03759fe2a655c50ae2c6610"},
+    {file = "numpy-2.2.3-cp313-cp313t-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:deaa09cd492e24fd9b15296844c0ad1b3c976da7907e1c1ed3a0ad21dded6f76"},
+    {file = "numpy-2.2.3-cp313-cp313t-musllinux_1_2_aarch64.whl", hash = "sha256:246535e2f7496b7ac85deffe932896a3577be7af8fb7eebe7146444680297e9a"},
+    {file = "numpy-2.2.3-cp313-cp313t-musllinux_1_2_x86_64.whl", hash = "sha256:daf43a3d1ea699402c5a850e5313680ac355b4adc9770cd5cfc2940e7861f1bf"},
+    {file = "numpy-2.2.3-cp313-cp313t-win32.whl", hash = "sha256:cf802eef1f0134afb81fef94020351be4fe1d6681aadf9c5e862af6602af64ef"},
+    {file = "numpy-2.2.3-cp313-cp313t-win_amd64.whl", hash = "sha256:aee2512827ceb6d7f517c8b85aa5d3923afe8fc7a57d028cffcd522f1c6fd082"},
+    {file = "numpy-2.2.3-pp310-pypy310_pp73-macosx_10_15_x86_64.whl", hash = "sha256:3c2ec8a0f51d60f1e9c0c5ab116b7fc104b165ada3f6c58abf881cb2eb16044d"},
+    {file = "numpy-2.2.3-pp310-pypy310_pp73-macosx_14_0_x86_64.whl", hash = "sha256:ed2cf9ed4e8ebc3b754d398cba12f24359f018b416c380f577bbae112ca52fc9"},
+    {file = "numpy-2.2.3-pp310-pypy310_pp73-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:39261798d208c3095ae4f7bc8eaeb3481ea8c6e03dc48028057d3cbdbdb8937e"},
+    {file = "numpy-2.2.3-pp310-pypy310_pp73-win_amd64.whl", hash = "sha256:783145835458e60fa97afac25d511d00a1eca94d4a8f3ace9fe2043003c678e4"},
+    {file = "numpy-2.2.3.tar.gz", hash = "sha256:dbdc15f0c81611925f382dfa97b3bd0bc2c1ce19d4fe50482cb0ddc12ba30020"},
 ]
 
 [[package]]
@@ -4149,110 +4148,101 @@ ptyprocess = ">=0.5"
 
 [[package]]
 name = "pillow"
-version = "10.4.0"
+version = "11.1.0"
 description = "Python Imaging Library (Fork)"
 optional = false
-python-versions = ">=3.8"
+python-versions = ">=3.9"
 files = [
-    {file = "pillow-10.4.0-cp310-cp310-macosx_10_10_x86_64.whl", hash = "sha256:4d9667937cfa347525b319ae34375c37b9ee6b525440f3ef48542fcf66f2731e"},
-    {file = "pillow-10.4.0-cp310-cp310-macosx_11_0_arm64.whl", hash = "sha256:543f3dc61c18dafb755773efc89aae60d06b6596a63914107f75459cf984164d"},
-    {file = "pillow-10.4.0-cp310-cp310-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:7928ecbf1ece13956b95d9cbcfc77137652b02763ba384d9ab508099a2eca856"},
-    {file = "pillow-10.4.0-cp310-cp310-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:e4d49b85c4348ea0b31ea63bc75a9f3857869174e2bf17e7aba02945cd218e6f"},
-    {file = "pillow-10.4.0-cp310-cp310-manylinux_2_28_aarch64.whl", hash = "sha256:6c762a5b0997f5659a5ef2266abc1d8851ad7749ad9a6a5506eb23d314e4f46b"},
-    {file = "pillow-10.4.0-cp310-cp310-manylinux_2_28_x86_64.whl", hash = "sha256:a985e028fc183bf12a77a8bbf36318db4238a3ded7fa9df1b9a133f1cb79f8fc"},
-    {file = "pillow-10.4.0-cp310-cp310-musllinux_1_2_aarch64.whl", hash = "sha256:812f7342b0eee081eaec84d91423d1b4650bb9828eb53d8511bcef8ce5aecf1e"},
-    {file = "pillow-10.4.0-cp310-cp310-musllinux_1_2_x86_64.whl", hash = "sha256:ac1452d2fbe4978c2eec89fb5a23b8387aba707ac72810d9490118817d9c0b46"},
-    {file = "pillow-10.4.0-cp310-cp310-win32.whl", hash = "sha256:bcd5e41a859bf2e84fdc42f4edb7d9aba0a13d29a2abadccafad99de3feff984"},
-    {file = "pillow-10.4.0-cp310-cp310-win_amd64.whl", hash = "sha256:ecd85a8d3e79cd7158dec1c9e5808e821feea088e2f69a974db5edf84dc53141"},
-    {file = "pillow-10.4.0-cp310-cp310-win_arm64.whl", hash = "sha256:ff337c552345e95702c5fde3158acb0625111017d0e5f24bf3acdb9cc16b90d1"},
-    {file = "pillow-10.4.0-cp311-cp311-macosx_10_10_x86_64.whl", hash = "sha256:0a9ec697746f268507404647e531e92889890a087e03681a3606d9b920fbee3c"},
-    {file = "pillow-10.4.0-cp311-cp311-macosx_11_0_arm64.whl", hash = "sha256:dfe91cb65544a1321e631e696759491ae04a2ea11d36715eca01ce07284738be"},
-    {file = "pillow-10.4.0-cp311-cp311-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:5dc6761a6efc781e6a1544206f22c80c3af4c8cf461206d46a1e6006e4429ff3"},
-    {file = "pillow-10.4.0-cp311-cp311-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:5e84b6cc6a4a3d76c153a6b19270b3526a5a8ed6b09501d3af891daa2a9de7d6"},
-    {file = "pillow-10.4.0-cp311-cp311-manylinux_2_28_aarch64.whl", hash = "sha256:bbc527b519bd3aa9d7f429d152fea69f9ad37c95f0b02aebddff592688998abe"},
-    {file = "pillow-10.4.0-cp311-cp311-manylinux_2_28_x86_64.whl", hash = "sha256:76a911dfe51a36041f2e756b00f96ed84677cdeb75d25c767f296c1c1eda1319"},
-    {file = "pillow-10.4.0-cp311-cp311-musllinux_1_2_aarch64.whl", hash = "sha256:59291fb29317122398786c2d44427bbd1a6d7ff54017075b22be9d21aa59bd8d"},
-    {file = "pillow-10.4.0-cp311-cp311-musllinux_1_2_x86_64.whl", hash = "sha256:416d3a5d0e8cfe4f27f574362435bc9bae57f679a7158e0096ad2beb427b8696"},
-    {file = "pillow-10.4.0-cp311-cp311-win32.whl", hash = "sha256:7086cc1d5eebb91ad24ded9f58bec6c688e9f0ed7eb3dbbf1e4800280a896496"},
-    {file = "pillow-10.4.0-cp311-cp311-win_amd64.whl", hash = "sha256:cbed61494057c0f83b83eb3a310f0bf774b09513307c434d4366ed64f4128a91"},
-    {file = "pillow-10.4.0-cp311-cp311-win_arm64.whl", hash = "sha256:f5f0c3e969c8f12dd2bb7e0b15d5c468b51e5017e01e2e867335c81903046a22"},
-    {file = "pillow-10.4.0-cp312-cp312-macosx_10_10_x86_64.whl", hash = "sha256:673655af3eadf4df6b5457033f086e90299fdd7a47983a13827acf7459c15d94"},
-    {file = "pillow-10.4.0-cp312-cp312-macosx_11_0_arm64.whl", hash = "sha256:866b6942a92f56300012f5fbac71f2d610312ee65e22f1aa2609e491284e5597"},
-    {file = "pillow-10.4.0-cp312-cp312-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:29dbdc4207642ea6aad70fbde1a9338753d33fb23ed6956e706936706f52dd80"},
-    {file = "pillow-10.4.0-cp312-cp312-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:bf2342ac639c4cf38799a44950bbc2dfcb685f052b9e262f446482afaf4bffca"},
-    {file = "pillow-10.4.0-cp312-cp312-manylinux_2_28_aarch64.whl", hash = "sha256:f5b92f4d70791b4a67157321c4e8225d60b119c5cc9aee8ecf153aace4aad4ef"},
-    {file = "pillow-10.4.0-cp312-cp312-manylinux_2_28_x86_64.whl", hash = "sha256:86dcb5a1eb778d8b25659d5e4341269e8590ad6b4e8b44d9f4b07f8d136c414a"},
-    {file = "pillow-10.4.0-cp312-cp312-musllinux_1_2_aarch64.whl", hash = "sha256:780c072c2e11c9b2c7ca37f9a2ee8ba66f44367ac3e5c7832afcfe5104fd6d1b"},
-    {file = "pillow-10.4.0-cp312-cp312-musllinux_1_2_x86_64.whl", hash = "sha256:37fb69d905be665f68f28a8bba3c6d3223c8efe1edf14cc4cfa06c241f8c81d9"},
-    {file = "pillow-10.4.0-cp312-cp312-win32.whl", hash = "sha256:7dfecdbad5c301d7b5bde160150b4db4c659cee2b69589705b6f8a0c509d9f42"},
-    {file = "pillow-10.4.0-cp312-cp312-win_amd64.whl", hash = "sha256:1d846aea995ad352d4bdcc847535bd56e0fd88d36829d2c90be880ef1ee4668a"},
-    {file = "pillow-10.4.0-cp312-cp312-win_arm64.whl", hash = "sha256:e553cad5179a66ba15bb18b353a19020e73a7921296a7979c4a2b7f6a5cd57f9"},
-    {file = "pillow-10.4.0-cp313-cp313-macosx_10_13_x86_64.whl", hash = "sha256:8bc1a764ed8c957a2e9cacf97c8b2b053b70307cf2996aafd70e91a082e70df3"},
-    {file = "pillow-10.4.0-cp313-cp313-macosx_11_0_arm64.whl", hash = "sha256:6209bb41dc692ddfee4942517c19ee81b86c864b626dbfca272ec0f7cff5d9fb"},
-    {file = "pillow-10.4.0-cp313-cp313-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:bee197b30783295d2eb680b311af15a20a8b24024a19c3a26431ff83eb8d1f70"},
-    {file = "pillow-10.4.0-cp313-cp313-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:1ef61f5dd14c300786318482456481463b9d6b91ebe5ef12f405afbba77ed0be"},
-    {file = "pillow-10.4.0-cp313-cp313-manylinux_2_28_aarch64.whl", hash = "sha256:297e388da6e248c98bc4a02e018966af0c5f92dfacf5a5ca22fa01cb3179bca0"},
-    {file = "pillow-10.4.0-cp313-cp313-manylinux_2_28_x86_64.whl", hash = "sha256:e4db64794ccdf6cb83a59d73405f63adbe2a1887012e308828596100a0b2f6cc"},
-    {file = "pillow-10.4.0-cp313-cp313-musllinux_1_2_aarch64.whl", hash = "sha256:bd2880a07482090a3bcb01f4265f1936a903d70bc740bfcb1fd4e8a2ffe5cf5a"},
-    {file = "pillow-10.4.0-cp313-cp313-musllinux_1_2_x86_64.whl", hash = "sha256:4b35b21b819ac1dbd1233317adeecd63495f6babf21b7b2512d244ff6c6ce309"},
-    {file = "pillow-10.4.0-cp313-cp313-win32.whl", hash = "sha256:551d3fd6e9dc15e4c1eb6fc4ba2b39c0c7933fa113b220057a34f4bb3268a060"},
-    {file = "pillow-10.4.0-cp313-cp313-win_amd64.whl", hash = "sha256:030abdbe43ee02e0de642aee345efa443740aa4d828bfe8e2eb11922ea6a21ea"},
-    {file = "pillow-10.4.0-cp313-cp313-win_arm64.whl", hash = "sha256:5b001114dd152cfd6b23befeb28d7aee43553e2402c9f159807bf55f33af8a8d"},
-    {file = "pillow-10.4.0-cp38-cp38-macosx_10_10_x86_64.whl", hash = "sha256:8d4d5063501b6dd4024b8ac2f04962d661222d120381272deea52e3fc52d3736"},
-    {file = "pillow-10.4.0-cp38-cp38-macosx_11_0_arm64.whl", hash = "sha256:7c1ee6f42250df403c5f103cbd2768a28fe1a0ea1f0f03fe151c8741e1469c8b"},
-    {file = "pillow-10.4.0-cp38-cp38-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:b15e02e9bb4c21e39876698abf233c8c579127986f8207200bc8a8f6bb27acf2"},
-    {file = "pillow-10.4.0-cp38-cp38-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:7a8d4bade9952ea9a77d0c3e49cbd8b2890a399422258a77f357b9cc9be8d680"},
-    {file = "pillow-10.4.0-cp38-cp38-manylinux_2_28_aarch64.whl", hash = "sha256:43efea75eb06b95d1631cb784aa40156177bf9dd5b4b03ff38979e048258bc6b"},
-    {file = "pillow-10.4.0-cp38-cp38-manylinux_2_28_x86_64.whl", hash = "sha256:950be4d8ba92aca4b2bb0741285a46bfae3ca699ef913ec8416c1b78eadd64cd"},
-    {file = "pillow-10.4.0-cp38-cp38-musllinux_1_2_aarch64.whl", hash = "sha256:d7480af14364494365e89d6fddc510a13e5a2c3584cb19ef65415ca57252fb84"},
-    {file = "pillow-10.4.0-cp38-cp38-musllinux_1_2_x86_64.whl", hash = "sha256:73664fe514b34c8f02452ffb73b7a92c6774e39a647087f83d67f010eb9a0cf0"},
-    {file = "pillow-10.4.0-cp38-cp38-win32.whl", hash = "sha256:e88d5e6ad0d026fba7bdab8c3f225a69f063f116462c49892b0149e21b6c0a0e"},
-    {file = "pillow-10.4.0-cp38-cp38-win_amd64.whl", hash = "sha256:5161eef006d335e46895297f642341111945e2c1c899eb406882a6c61a4357ab"},
-    {file = "pillow-10.4.0-cp39-cp39-macosx_10_10_x86_64.whl", hash = "sha256:0ae24a547e8b711ccaaf99c9ae3cd975470e1a30caa80a6aaee9a2f19c05701d"},
-    {file = "pillow-10.4.0-cp39-cp39-macosx_11_0_arm64.whl", hash = "sha256:298478fe4f77a4408895605f3482b6cc6222c018b2ce565c2b6b9c354ac3229b"},
-    {file = "pillow-10.4.0-cp39-cp39-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:134ace6dc392116566980ee7436477d844520a26a4b1bd4053f6f47d096997fd"},
-    {file = "pillow-10.4.0-cp39-cp39-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:930044bb7679ab003b14023138b50181899da3f25de50e9dbee23b61b4de2126"},
-    {file = "pillow-10.4.0-cp39-cp39-manylinux_2_28_aarch64.whl", hash = "sha256:c76e5786951e72ed3686e122d14c5d7012f16c8303a674d18cdcd6d89557fc5b"},
-    {file = "pillow-10.4.0-cp39-cp39-manylinux_2_28_x86_64.whl", hash = "sha256:b2724fdb354a868ddf9a880cb84d102da914e99119211ef7ecbdc613b8c96b3c"},
-    {file = "pillow-10.4.0-cp39-cp39-musllinux_1_2_aarch64.whl", hash = "sha256:dbc6ae66518ab3c5847659e9988c3b60dc94ffb48ef9168656e0019a93dbf8a1"},
-    {file = "pillow-10.4.0-cp39-cp39-musllinux_1_2_x86_64.whl", hash = "sha256:06b2f7898047ae93fad74467ec3d28fe84f7831370e3c258afa533f81ef7f3df"},
-    {file = "pillow-10.4.0-cp39-cp39-win32.whl", hash = "sha256:7970285ab628a3779aecc35823296a7869f889b8329c16ad5a71e4901a3dc4ef"},
-    {file = "pillow-10.4.0-cp39-cp39-win_amd64.whl", hash = "sha256:961a7293b2457b405967af9c77dcaa43cc1a8cd50d23c532e62d48ab6cdd56f5"},
-    {file = "pillow-10.4.0-cp39-cp39-win_arm64.whl", hash = "sha256:32cda9e3d601a52baccb2856b8ea1fc213c90b340c542dcef77140dfa3278a9e"},
-    {file = "pillow-10.4.0-pp310-pypy310_pp73-macosx_10_15_x86_64.whl", hash = "sha256:5b4815f2e65b30f5fbae9dfffa8636d992d49705723fe86a3661806e069352d4"},
-    {file = "pillow-10.4.0-pp310-pypy310_pp73-macosx_11_0_arm64.whl", hash = "sha256:8f0aef4ef59694b12cadee839e2ba6afeab89c0f39a3adc02ed51d109117b8da"},
-    {file = "pillow-10.4.0-pp310-pypy310_pp73-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:9f4727572e2918acaa9077c919cbbeb73bd2b3ebcfe033b72f858fc9fbef0026"},
-    {file = "pillow-10.4.0-pp310-pypy310_pp73-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:ff25afb18123cea58a591ea0244b92eb1e61a1fd497bf6d6384f09bc3262ec3e"},
-    {file = "pillow-10.4.0-pp310-pypy310_pp73-manylinux_2_28_aarch64.whl", hash = "sha256:dc3e2db6ba09ffd7d02ae9141cfa0ae23393ee7687248d46a7507b75d610f4f5"},
-    {file = "pillow-10.4.0-pp310-pypy310_pp73-manylinux_2_28_x86_64.whl", hash = "sha256:02a2be69f9c9b8c1e97cf2713e789d4e398c751ecfd9967c18d0ce304efbf885"},
-    {file = "pillow-10.4.0-pp310-pypy310_pp73-win_amd64.whl", hash = "sha256:0755ffd4a0c6f267cccbae2e9903d95477ca2f77c4fcf3a3a09570001856c8a5"},
-    {file = "pillow-10.4.0-pp39-pypy39_pp73-macosx_10_15_x86_64.whl", hash = "sha256:a02364621fe369e06200d4a16558e056fe2805d3468350df3aef21e00d26214b"},
-    {file = "pillow-10.4.0-pp39-pypy39_pp73-macosx_11_0_arm64.whl", hash = "sha256:1b5dea9831a90e9d0721ec417a80d4cbd7022093ac38a568db2dd78363b00908"},
-    {file = "pillow-10.4.0-pp39-pypy39_pp73-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:9b885f89040bb8c4a1573566bbb2f44f5c505ef6e74cec7ab9068c900047f04b"},
-    {file = "pillow-10.4.0-pp39-pypy39_pp73-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:87dd88ded2e6d74d31e1e0a99a726a6765cda32d00ba72dc37f0651f306daaa8"},
-    {file = "pillow-10.4.0-pp39-pypy39_pp73-manylinux_2_28_aarch64.whl", hash = "sha256:2db98790afc70118bd0255c2eeb465e9767ecf1f3c25f9a1abb8ffc8cfd1fe0a"},
-    {file = "pillow-10.4.0-pp39-pypy39_pp73-manylinux_2_28_x86_64.whl", hash = "sha256:f7baece4ce06bade126fb84b8af1c33439a76d8a6fd818970215e0560ca28c27"},
-    {file = "pillow-10.4.0-pp39-pypy39_pp73-win_amd64.whl", hash = "sha256:cfdd747216947628af7b259d274771d84db2268ca062dd5faf373639d00113a3"},
-    {file = "pillow-10.4.0.tar.gz", hash = "sha256:166c1cd4d24309b30d61f79f4a9114b7b2313d7450912277855ff5dfd7cd4a06"},
+    {file = "pillow-11.1.0-cp310-cp310-macosx_10_10_x86_64.whl", hash = "sha256:e1abe69aca89514737465752b4bcaf8016de61b3be1397a8fc260ba33321b3a8"},
+    {file = "pillow-11.1.0-cp310-cp310-macosx_11_0_arm64.whl", hash = "sha256:c640e5a06869c75994624551f45e5506e4256562ead981cce820d5ab39ae2192"},
+    {file = "pillow-11.1.0-cp310-cp310-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:a07dba04c5e22824816b2615ad7a7484432d7f540e6fa86af60d2de57b0fcee2"},
+    {file = "pillow-11.1.0-cp310-cp310-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:e267b0ed063341f3e60acd25c05200df4193e15a4a5807075cd71225a2386e26"},
+    {file = "pillow-11.1.0-cp310-cp310-manylinux_2_28_aarch64.whl", hash = "sha256:bd165131fd51697e22421d0e467997ad31621b74bfc0b75956608cb2906dda07"},
+    {file = "pillow-11.1.0-cp310-cp310-manylinux_2_28_x86_64.whl", hash = "sha256:abc56501c3fd148d60659aae0af6ddc149660469082859fa7b066a298bde9482"},
+    {file = "pillow-11.1.0-cp310-cp310-musllinux_1_2_aarch64.whl", hash = "sha256:54ce1c9a16a9561b6d6d8cb30089ab1e5eb66918cb47d457bd996ef34182922e"},
+    {file = "pillow-11.1.0-cp310-cp310-musllinux_1_2_x86_64.whl", hash = "sha256:73ddde795ee9b06257dac5ad42fcb07f3b9b813f8c1f7f870f402f4dc54b5269"},
+    {file = "pillow-11.1.0-cp310-cp310-win32.whl", hash = "sha256:3a5fe20a7b66e8135d7fd617b13272626a28278d0e578c98720d9ba4b2439d49"},
+    {file = "pillow-11.1.0-cp310-cp310-win_amd64.whl", hash = "sha256:b6123aa4a59d75f06e9dd3dac5bf8bc9aa383121bb3dd9a7a612e05eabc9961a"},
+    {file = "pillow-11.1.0-cp310-cp310-win_arm64.whl", hash = "sha256:a76da0a31da6fcae4210aa94fd779c65c75786bc9af06289cd1c184451ef7a65"},
+    {file = "pillow-11.1.0-cp311-cp311-macosx_10_10_x86_64.whl", hash = "sha256:e06695e0326d05b06833b40b7ef477e475d0b1ba3a6d27da1bb48c23209bf457"},
+    {file = "pillow-11.1.0-cp311-cp311-macosx_11_0_arm64.whl", hash = "sha256:96f82000e12f23e4f29346e42702b6ed9a2f2fea34a740dd5ffffcc8c539eb35"},
+    {file = "pillow-11.1.0-cp311-cp311-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:a3cd561ded2cf2bbae44d4605837221b987c216cff94f49dfeed63488bb228d2"},
+    {file = "pillow-11.1.0-cp311-cp311-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:f189805c8be5ca5add39e6f899e6ce2ed824e65fb45f3c28cb2841911da19070"},
+    {file = "pillow-11.1.0-cp311-cp311-manylinux_2_28_aarch64.whl", hash = "sha256:dd0052e9db3474df30433f83a71b9b23bd9e4ef1de13d92df21a52c0303b8ab6"},
+    {file = "pillow-11.1.0-cp311-cp311-manylinux_2_28_x86_64.whl", hash = "sha256:837060a8599b8f5d402e97197d4924f05a2e0d68756998345c829c33186217b1"},
+    {file = "pillow-11.1.0-cp311-cp311-musllinux_1_2_aarch64.whl", hash = "sha256:aa8dd43daa836b9a8128dbe7d923423e5ad86f50a7a14dc688194b7be5c0dea2"},
+    {file = "pillow-11.1.0-cp311-cp311-musllinux_1_2_x86_64.whl", hash = "sha256:0a2f91f8a8b367e7a57c6e91cd25af510168091fb89ec5146003e424e1558a96"},
+    {file = "pillow-11.1.0-cp311-cp311-win32.whl", hash = "sha256:c12fc111ef090845de2bb15009372175d76ac99969bdf31e2ce9b42e4b8cd88f"},
+    {file = "pillow-11.1.0-cp311-cp311-win_amd64.whl", hash = "sha256:fbd43429d0d7ed6533b25fc993861b8fd512c42d04514a0dd6337fb3ccf22761"},
+    {file = "pillow-11.1.0-cp311-cp311-win_arm64.whl", hash = "sha256:f7955ecf5609dee9442cbface754f2c6e541d9e6eda87fad7f7a989b0bdb9d71"},
+    {file = "pillow-11.1.0-cp312-cp312-macosx_10_13_x86_64.whl", hash = "sha256:2062ffb1d36544d42fcaa277b069c88b01bb7298f4efa06731a7fd6cc290b81a"},
+    {file = "pillow-11.1.0-cp312-cp312-macosx_11_0_arm64.whl", hash = "sha256:a85b653980faad27e88b141348707ceeef8a1186f75ecc600c395dcac19f385b"},
+    {file = "pillow-11.1.0-cp312-cp312-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:9409c080586d1f683df3f184f20e36fb647f2e0bc3988094d4fd8c9f4eb1b3b3"},
+    {file = "pillow-11.1.0-cp312-cp312-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:7fdadc077553621911f27ce206ffcbec7d3f8d7b50e0da39f10997e8e2bb7f6a"},
+    {file = "pillow-11.1.0-cp312-cp312-manylinux_2_28_aarch64.whl", hash = "sha256:93a18841d09bcdd774dcdc308e4537e1f867b3dec059c131fde0327899734aa1"},
+    {file = "pillow-11.1.0-cp312-cp312-manylinux_2_28_x86_64.whl", hash = "sha256:9aa9aeddeed452b2f616ff5507459e7bab436916ccb10961c4a382cd3e03f47f"},
+    {file = "pillow-11.1.0-cp312-cp312-musllinux_1_2_aarch64.whl", hash = "sha256:3cdcdb0b896e981678eee140d882b70092dac83ac1cdf6b3a60e2216a73f2b91"},
+    {file = "pillow-11.1.0-cp312-cp312-musllinux_1_2_x86_64.whl", hash = "sha256:36ba10b9cb413e7c7dfa3e189aba252deee0602c86c309799da5a74009ac7a1c"},
+    {file = "pillow-11.1.0-cp312-cp312-win32.whl", hash = "sha256:cfd5cd998c2e36a862d0e27b2df63237e67273f2fc78f47445b14e73a810e7e6"},
+    {file = "pillow-11.1.0-cp312-cp312-win_amd64.whl", hash = "sha256:a697cd8ba0383bba3d2d3ada02b34ed268cb548b369943cd349007730c92bddf"},
+    {file = "pillow-11.1.0-cp312-cp312-win_arm64.whl", hash = "sha256:4dd43a78897793f60766563969442020e90eb7847463eca901e41ba186a7d4a5"},
+    {file = "pillow-11.1.0-cp313-cp313-macosx_10_13_x86_64.whl", hash = "sha256:ae98e14432d458fc3de11a77ccb3ae65ddce70f730e7c76140653048c71bfcbc"},
+    {file = "pillow-11.1.0-cp313-cp313-macosx_11_0_arm64.whl", hash = "sha256:cc1331b6d5a6e144aeb5e626f4375f5b7ae9934ba620c0ac6b3e43d5e683a0f0"},
+    {file = "pillow-11.1.0-cp313-cp313-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:758e9d4ef15d3560214cddbc97b8ef3ef86ce04d62ddac17ad39ba87e89bd3b1"},
+    {file = "pillow-11.1.0-cp313-cp313-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:b523466b1a31d0dcef7c5be1f20b942919b62fd6e9a9be199d035509cbefc0ec"},
+    {file = "pillow-11.1.0-cp313-cp313-manylinux_2_28_aarch64.whl", hash = "sha256:9044b5e4f7083f209c4e35aa5dd54b1dd5b112b108648f5c902ad586d4f945c5"},
+    {file = "pillow-11.1.0-cp313-cp313-manylinux_2_28_x86_64.whl", hash = "sha256:3764d53e09cdedd91bee65c2527815d315c6b90d7b8b79759cc48d7bf5d4f114"},
+    {file = "pillow-11.1.0-cp313-cp313-musllinux_1_2_aarch64.whl", hash = "sha256:31eba6bbdd27dde97b0174ddf0297d7a9c3a507a8a1480e1e60ef914fe23d352"},
+    {file = "pillow-11.1.0-cp313-cp313-musllinux_1_2_x86_64.whl", hash = "sha256:b5d658fbd9f0d6eea113aea286b21d3cd4d3fd978157cbf2447a6035916506d3"},
+    {file = "pillow-11.1.0-cp313-cp313-win32.whl", hash = "sha256:f86d3a7a9af5d826744fabf4afd15b9dfef44fe69a98541f666f66fbb8d3fef9"},
+    {file = "pillow-11.1.0-cp313-cp313-win_amd64.whl", hash = "sha256:593c5fd6be85da83656b93ffcccc2312d2d149d251e98588b14fbc288fd8909c"},
+    {file = "pillow-11.1.0-cp313-cp313-win_arm64.whl", hash = "sha256:11633d58b6ee5733bde153a8dafd25e505ea3d32e261accd388827ee987baf65"},
+    {file = "pillow-11.1.0-cp313-cp313t-macosx_10_13_x86_64.whl", hash = "sha256:70ca5ef3b3b1c4a0812b5c63c57c23b63e53bc38e758b37a951e5bc466449861"},
+    {file = "pillow-11.1.0-cp313-cp313t-macosx_11_0_arm64.whl", hash = "sha256:8000376f139d4d38d6851eb149b321a52bb8893a88dae8ee7d95840431977081"},
+    {file = "pillow-11.1.0-cp313-cp313t-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:9ee85f0696a17dd28fbcfceb59f9510aa71934b483d1f5601d1030c3c8304f3c"},
+    {file = "pillow-11.1.0-cp313-cp313t-manylinux_2_28_x86_64.whl", hash = "sha256:dd0e081319328928531df7a0e63621caf67652c8464303fd102141b785ef9547"},
+    {file = "pillow-11.1.0-cp313-cp313t-musllinux_1_2_x86_64.whl", hash = "sha256:e63e4e5081de46517099dc30abe418122f54531a6ae2ebc8680bcd7096860eab"},
+    {file = "pillow-11.1.0-cp313-cp313t-win32.whl", hash = "sha256:dda60aa465b861324e65a78c9f5cf0f4bc713e4309f83bc387be158b077963d9"},
+    {file = "pillow-11.1.0-cp313-cp313t-win_amd64.whl", hash = "sha256:ad5db5781c774ab9a9b2c4302bbf0c1014960a0a7be63278d13ae6fdf88126fe"},
+    {file = "pillow-11.1.0-cp313-cp313t-win_arm64.whl", hash = "sha256:67cd427c68926108778a9005f2a04adbd5e67c442ed21d95389fe1d595458756"},
+    {file = "pillow-11.1.0-cp39-cp39-macosx_10_10_x86_64.whl", hash = "sha256:bf902d7413c82a1bfa08b06a070876132a5ae6b2388e2712aab3a7cbc02205c6"},
+    {file = "pillow-11.1.0-cp39-cp39-macosx_11_0_arm64.whl", hash = "sha256:c1eec9d950b6fe688edee07138993e54ee4ae634c51443cfb7c1e7613322718e"},
+    {file = "pillow-11.1.0-cp39-cp39-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:8e275ee4cb11c262bd108ab2081f750db2a1c0b8c12c1897f27b160c8bd57bbc"},
+    {file = "pillow-11.1.0-cp39-cp39-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:4db853948ce4e718f2fc775b75c37ba2efb6aaea41a1a5fc57f0af59eee774b2"},
+    {file = "pillow-11.1.0-cp39-cp39-manylinux_2_28_aarch64.whl", hash = "sha256:ab8a209b8485d3db694fa97a896d96dd6533d63c22829043fd9de627060beade"},
+    {file = "pillow-11.1.0-cp39-cp39-manylinux_2_28_x86_64.whl", hash = "sha256:54251ef02a2309b5eec99d151ebf5c9904b77976c8abdcbce7891ed22df53884"},
+    {file = "pillow-11.1.0-cp39-cp39-musllinux_1_2_aarch64.whl", hash = "sha256:5bb94705aea800051a743aa4874bb1397d4695fb0583ba5e425ee0328757f196"},
+    {file = "pillow-11.1.0-cp39-cp39-musllinux_1_2_x86_64.whl", hash = "sha256:89dbdb3e6e9594d512780a5a1c42801879628b38e3efc7038094430844e271d8"},
+    {file = "pillow-11.1.0-cp39-cp39-win32.whl", hash = "sha256:e5449ca63da169a2e6068dd0e2fcc8d91f9558aba89ff6d02121ca8ab11e79e5"},
+    {file = "pillow-11.1.0-cp39-cp39-win_amd64.whl", hash = "sha256:3362c6ca227e65c54bf71a5f88b3d4565ff1bcbc63ae72c34b07bbb1cc59a43f"},
+    {file = "pillow-11.1.0-cp39-cp39-win_arm64.whl", hash = "sha256:b20be51b37a75cc54c2c55def3fa2c65bb94ba859dde241cd0a4fd302de5ae0a"},
+    {file = "pillow-11.1.0-pp310-pypy310_pp73-macosx_10_15_x86_64.whl", hash = "sha256:8c730dc3a83e5ac137fbc92dfcfe1511ce3b2b5d7578315b63dbbb76f7f51d90"},
+    {file = "pillow-11.1.0-pp310-pypy310_pp73-macosx_11_0_arm64.whl", hash = "sha256:7d33d2fae0e8b170b6a6c57400e077412240f6f5bb2a342cf1ee512a787942bb"},
+    {file = "pillow-11.1.0-pp310-pypy310_pp73-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:a8d65b38173085f24bc07f8b6c505cbb7418009fa1a1fcb111b1f4961814a442"},
+    {file = "pillow-11.1.0-pp310-pypy310_pp73-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:015c6e863faa4779251436db398ae75051469f7c903b043a48f078e437656f83"},
+    {file = "pillow-11.1.0-pp310-pypy310_pp73-manylinux_2_28_aarch64.whl", hash = "sha256:d44ff19eea13ae4acdaaab0179fa68c0c6f2f45d66a4d8ec1eda7d6cecbcc15f"},
+    {file = "pillow-11.1.0-pp310-pypy310_pp73-manylinux_2_28_x86_64.whl", hash = "sha256:d3d8da4a631471dfaf94c10c85f5277b1f8e42ac42bade1ac67da4b4a7359b73"},
+    {file = "pillow-11.1.0-pp310-pypy310_pp73-win_amd64.whl", hash = "sha256:4637b88343166249fe8aa94e7c4a62a180c4b3898283bb5d3d2fd5fe10d8e4e0"},
+    {file = "pillow-11.1.0.tar.gz", hash = "sha256:368da70808b36d73b4b390a8ffac11069f8a5c85f29eff1f1b01bcf3ef5b2a20"},
 ]
 
 [package.extras]
-docs = ["furo", "olefile", "sphinx (>=7.3)", "sphinx-copybutton", "sphinx-inline-tabs", "sphinxext-opengraph"]
+docs = ["furo", "olefile", "sphinx (>=8.1)", "sphinx-copybutton", "sphinx-inline-tabs", "sphinxext-opengraph"]
 fpx = ["olefile"]
 mic = ["olefile"]
-tests = ["check-manifest", "coverage", "defusedxml", "markdown2", "olefile", "packaging", "pyroma", "pytest", "pytest-cov", "pytest-timeout"]
+tests = ["check-manifest", "coverage (>=7.4.2)", "defusedxml", "markdown2", "olefile", "packaging", "pyroma", "pytest", "pytest-cov", "pytest-timeout", "trove-classifiers (>=2024.10.12)"]
 typing = ["typing-extensions"]
 xmp = ["defusedxml"]
 
 [[package]]
 name = "pkginfo"
-version = "1.12.0"
+version = "1.12.1.2"
 description = "Query metadata from sdists / bdists / installed packages."
 optional = false
 python-versions = ">=3.8"
 files = [
-    {file = "pkginfo-1.12.0-py3-none-any.whl", hash = "sha256:dcd589c9be4da8973eceffa247733c144812759aa67eaf4bbf97016a02f39088"},
-    {file = "pkginfo-1.12.0.tar.gz", hash = "sha256:8ad91a0445a036782b9366ef8b8c2c50291f83a553478ba8580c73d3215700cf"},
+    {file = "pkginfo-1.12.1.2-py3-none-any.whl", hash = "sha256:c783ac885519cab2c34927ccfa6bf64b5a704d7c69afaea583dd9b7afe969343"},
+    {file = "pkginfo-1.12.1.2.tar.gz", hash = "sha256:5cd957824ac36f140260964eba3c6be6442a8359b8c48f4adf90210f33a04b7b"},
 ]
 
 [package.extras]
@@ -4323,93 +4313,109 @@ wcwidth = "*"
 
 [[package]]
 name = "propcache"
-version = "0.2.1"
+version = "0.3.0"
 description = "Accelerated property cache"
 optional = false
 python-versions = ">=3.9"
 files = [
-    {file = "propcache-0.2.1-cp310-cp310-macosx_10_9_universal2.whl", hash = "sha256:6b3f39a85d671436ee3d12c017f8fdea38509e4f25b28eb25877293c98c243f6"},
-    {file = "propcache-0.2.1-cp310-cp310-macosx_10_9_x86_64.whl", hash = "sha256:39d51fbe4285d5db5d92a929e3e21536ea3dd43732c5b177c7ef03f918dff9f2"},
-    {file = "propcache-0.2.1-cp310-cp310-macosx_11_0_arm64.whl", hash = "sha256:6445804cf4ec763dc70de65a3b0d9954e868609e83850a47ca4f0cb64bd79fea"},
-    {file = "propcache-0.2.1-cp310-cp310-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:f9479aa06a793c5aeba49ce5c5692ffb51fcd9a7016e017d555d5e2b0045d212"},
-    {file = "propcache-0.2.1-cp310-cp310-manylinux_2_17_ppc64le.manylinux2014_ppc64le.whl", hash = "sha256:d9631c5e8b5b3a0fda99cb0d29c18133bca1e18aea9effe55adb3da1adef80d3"},
-    {file = "propcache-0.2.1-cp310-cp310-manylinux_2_17_s390x.manylinux2014_s390x.whl", hash = "sha256:3156628250f46a0895f1f36e1d4fbe062a1af8718ec3ebeb746f1d23f0c5dc4d"},
-    {file = "propcache-0.2.1-cp310-cp310-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:6b6fb63ae352e13748289f04f37868099e69dba4c2b3e271c46061e82c745634"},
-    {file = "propcache-0.2.1-cp310-cp310-manylinux_2_5_i686.manylinux1_i686.manylinux_2_17_i686.manylinux2014_i686.whl", hash = "sha256:887d9b0a65404929641a9fabb6452b07fe4572b269d901d622d8a34a4e9043b2"},
-    {file = "propcache-0.2.1-cp310-cp310-musllinux_1_2_aarch64.whl", hash = "sha256:a96dc1fa45bd8c407a0af03b2d5218392729e1822b0c32e62c5bf7eeb5fb3958"},
-    {file = "propcache-0.2.1-cp310-cp310-musllinux_1_2_armv7l.whl", hash = "sha256:a7e65eb5c003a303b94aa2c3852ef130230ec79e349632d030e9571b87c4698c"},
-    {file = "propcache-0.2.1-cp310-cp310-musllinux_1_2_i686.whl", hash = "sha256:999779addc413181912e984b942fbcc951be1f5b3663cd80b2687758f434c583"},
-    {file = "propcache-0.2.1-cp310-cp310-musllinux_1_2_ppc64le.whl", hash = "sha256:19a0f89a7bb9d8048d9c4370c9c543c396e894c76be5525f5e1ad287f1750ddf"},
-    {file = "propcache-0.2.1-cp310-cp310-musllinux_1_2_s390x.whl", hash = "sha256:1ac2f5fe02fa75f56e1ad473f1175e11f475606ec9bd0be2e78e4734ad575034"},
-    {file = "propcache-0.2.1-cp310-cp310-musllinux_1_2_x86_64.whl", hash = "sha256:574faa3b79e8ebac7cb1d7930f51184ba1ccf69adfdec53a12f319a06030a68b"},
-    {file = "propcache-0.2.1-cp310-cp310-win32.whl", hash = "sha256:03ff9d3f665769b2a85e6157ac8b439644f2d7fd17615a82fa55739bc97863f4"},
-    {file = "propcache-0.2.1-cp310-cp310-win_amd64.whl", hash = "sha256:2d3af2e79991102678f53e0dbf4c35de99b6b8b58f29a27ca0325816364caaba"},
-    {file = "propcache-0.2.1-cp311-cp311-macosx_10_9_universal2.whl", hash = "sha256:1ffc3cca89bb438fb9c95c13fc874012f7b9466b89328c3c8b1aa93cdcfadd16"},
-    {file = "propcache-0.2.1-cp311-cp311-macosx_10_9_x86_64.whl", hash = "sha256:f174bbd484294ed9fdf09437f889f95807e5f229d5d93588d34e92106fbf6717"},
-    {file = "propcache-0.2.1-cp311-cp311-macosx_11_0_arm64.whl", hash = "sha256:70693319e0b8fd35dd863e3e29513875eb15c51945bf32519ef52927ca883bc3"},
-    {file = "propcache-0.2.1-cp311-cp311-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:b480c6a4e1138e1aa137c0079b9b6305ec6dcc1098a8ca5196283e8a49df95a9"},
-    {file = "propcache-0.2.1-cp311-cp311-manylinux_2_17_ppc64le.manylinux2014_ppc64le.whl", hash = "sha256:d27b84d5880f6d8aa9ae3edb253c59d9f6642ffbb2c889b78b60361eed449787"},
-    {file = "propcache-0.2.1-cp311-cp311-manylinux_2_17_s390x.manylinux2014_s390x.whl", hash = "sha256:857112b22acd417c40fa4595db2fe28ab900c8c5fe4670c7989b1c0230955465"},
-    {file = "propcache-0.2.1-cp311-cp311-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:cf6c4150f8c0e32d241436526f3c3f9cbd34429492abddbada2ffcff506c51af"},
-    {file = "propcache-0.2.1-cp311-cp311-manylinux_2_5_i686.manylinux1_i686.manylinux_2_17_i686.manylinux2014_i686.whl", hash = "sha256:66d4cfda1d8ed687daa4bc0274fcfd5267873db9a5bc0418c2da19273040eeb7"},
-    {file = "propcache-0.2.1-cp311-cp311-musllinux_1_2_aarch64.whl", hash = "sha256:c2f992c07c0fca81655066705beae35fc95a2fa7366467366db627d9f2ee097f"},
-    {file = "propcache-0.2.1-cp311-cp311-musllinux_1_2_armv7l.whl", hash = "sha256:4a571d97dbe66ef38e472703067021b1467025ec85707d57e78711c085984e54"},
-    {file = "propcache-0.2.1-cp311-cp311-musllinux_1_2_i686.whl", hash = "sha256:bb6178c241278d5fe853b3de743087be7f5f4c6f7d6d22a3b524d323eecec505"},
-    {file = "propcache-0.2.1-cp311-cp311-musllinux_1_2_ppc64le.whl", hash = "sha256:ad1af54a62ffe39cf34db1aa6ed1a1873bd548f6401db39d8e7cd060b9211f82"},
-    {file = "propcache-0.2.1-cp311-cp311-musllinux_1_2_s390x.whl", hash = "sha256:e7048abd75fe40712005bcfc06bb44b9dfcd8e101dda2ecf2f5aa46115ad07ca"},
-    {file = "propcache-0.2.1-cp311-cp311-musllinux_1_2_x86_64.whl", hash = "sha256:160291c60081f23ee43d44b08a7e5fb76681221a8e10b3139618c5a9a291b84e"},
-    {file = "propcache-0.2.1-cp311-cp311-win32.whl", hash = "sha256:819ce3b883b7576ca28da3861c7e1a88afd08cc8c96908e08a3f4dd64a228034"},
-    {file = "propcache-0.2.1-cp311-cp311-win_amd64.whl", hash = "sha256:edc9fc7051e3350643ad929df55c451899bb9ae6d24998a949d2e4c87fb596d3"},
-    {file = "propcache-0.2.1-cp312-cp312-macosx_10_13_universal2.whl", hash = "sha256:081a430aa8d5e8876c6909b67bd2d937bfd531b0382d3fdedb82612c618bc41a"},
-    {file = "propcache-0.2.1-cp312-cp312-macosx_10_13_x86_64.whl", hash = "sha256:d2ccec9ac47cf4e04897619c0e0c1a48c54a71bdf045117d3a26f80d38ab1fb0"},
-    {file = "propcache-0.2.1-cp312-cp312-macosx_11_0_arm64.whl", hash = "sha256:14d86fe14b7e04fa306e0c43cdbeebe6b2c2156a0c9ce56b815faacc193e320d"},
-    {file = "propcache-0.2.1-cp312-cp312-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:049324ee97bb67285b49632132db351b41e77833678432be52bdd0289c0e05e4"},
-    {file = "propcache-0.2.1-cp312-cp312-manylinux_2_17_ppc64le.manylinux2014_ppc64le.whl", hash = "sha256:1cd9a1d071158de1cc1c71a26014dcdfa7dd3d5f4f88c298c7f90ad6f27bb46d"},
-    {file = "propcache-0.2.1-cp312-cp312-manylinux_2_17_s390x.manylinux2014_s390x.whl", hash = "sha256:98110aa363f1bb4c073e8dcfaefd3a5cea0f0834c2aab23dda657e4dab2f53b5"},
-    {file = "propcache-0.2.1-cp312-cp312-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:647894f5ae99c4cf6bb82a1bb3a796f6e06af3caa3d32e26d2350d0e3e3faf24"},
-    {file = "propcache-0.2.1-cp312-cp312-manylinux_2_5_i686.manylinux1_i686.manylinux_2_17_i686.manylinux2014_i686.whl", hash = "sha256:bfd3223c15bebe26518d58ccf9a39b93948d3dcb3e57a20480dfdd315356baff"},
-    {file = "propcache-0.2.1-cp312-cp312-musllinux_1_2_aarch64.whl", hash = "sha256:d71264a80f3fcf512eb4f18f59423fe82d6e346ee97b90625f283df56aee103f"},
-    {file = "propcache-0.2.1-cp312-cp312-musllinux_1_2_armv7l.whl", hash = "sha256:e73091191e4280403bde6c9a52a6999d69cdfde498f1fdf629105247599b57ec"},
-    {file = "propcache-0.2.1-cp312-cp312-musllinux_1_2_i686.whl", hash = "sha256:3935bfa5fede35fb202c4b569bb9c042f337ca4ff7bd540a0aa5e37131659348"},
-    {file = "propcache-0.2.1-cp312-cp312-musllinux_1_2_ppc64le.whl", hash = "sha256:f508b0491767bb1f2b87fdfacaba5f7eddc2f867740ec69ece6d1946d29029a6"},
-    {file = "propcache-0.2.1-cp312-cp312-musllinux_1_2_s390x.whl", hash = "sha256:1672137af7c46662a1c2be1e8dc78cb6d224319aaa40271c9257d886be4363a6"},
-    {file = "propcache-0.2.1-cp312-cp312-musllinux_1_2_x86_64.whl", hash = "sha256:b74c261802d3d2b85c9df2dfb2fa81b6f90deeef63c2db9f0e029a3cac50b518"},
-    {file = "propcache-0.2.1-cp312-cp312-win32.whl", hash = "sha256:d09c333d36c1409d56a9d29b3a1b800a42c76a57a5a8907eacdbce3f18768246"},
-    {file = "propcache-0.2.1-cp312-cp312-win_amd64.whl", hash = "sha256:c214999039d4f2a5b2073ac506bba279945233da8c786e490d411dfc30f855c1"},
-    {file = "propcache-0.2.1-cp313-cp313-macosx_10_13_universal2.whl", hash = "sha256:aca405706e0b0a44cc6bfd41fbe89919a6a56999157f6de7e182a990c36e37bc"},
-    {file = "propcache-0.2.1-cp313-cp313-macosx_10_13_x86_64.whl", hash = "sha256:12d1083f001ace206fe34b6bdc2cb94be66d57a850866f0b908972f90996b3e9"},
-    {file = "propcache-0.2.1-cp313-cp313-macosx_11_0_arm64.whl", hash = "sha256:d93f3307ad32a27bda2e88ec81134b823c240aa3abb55821a8da553eed8d9439"},
-    {file = "propcache-0.2.1-cp313-cp313-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:ba278acf14471d36316159c94a802933d10b6a1e117b8554fe0d0d9b75c9d536"},
-    {file = "propcache-0.2.1-cp313-cp313-manylinux_2_17_ppc64le.manylinux2014_ppc64le.whl", hash = "sha256:4e6281aedfca15301c41f74d7005e6e3f4ca143584ba696ac69df4f02f40d629"},
-    {file = "propcache-0.2.1-cp313-cp313-manylinux_2_17_s390x.manylinux2014_s390x.whl", hash = "sha256:5b750a8e5a1262434fb1517ddf64b5de58327f1adc3524a5e44c2ca43305eb0b"},
-    {file = "propcache-0.2.1-cp313-cp313-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:bf72af5e0fb40e9babf594308911436c8efde3cb5e75b6f206c34ad18be5c052"},
-    {file = "propcache-0.2.1-cp313-cp313-manylinux_2_5_i686.manylinux1_i686.manylinux_2_17_i686.manylinux2014_i686.whl", hash = "sha256:b2d0a12018b04f4cb820781ec0dffb5f7c7c1d2a5cd22bff7fb055a2cb19ebce"},
-    {file = "propcache-0.2.1-cp313-cp313-musllinux_1_2_aarch64.whl", hash = "sha256:e800776a79a5aabdb17dcc2346a7d66d0777e942e4cd251defeb084762ecd17d"},
-    {file = "propcache-0.2.1-cp313-cp313-musllinux_1_2_armv7l.whl", hash = "sha256:4160d9283bd382fa6c0c2b5e017acc95bc183570cd70968b9202ad6d8fc48dce"},
-    {file = "propcache-0.2.1-cp313-cp313-musllinux_1_2_i686.whl", hash = "sha256:30b43e74f1359353341a7adb783c8f1b1c676367b011709f466f42fda2045e95"},
-    {file = "propcache-0.2.1-cp313-cp313-musllinux_1_2_ppc64le.whl", hash = "sha256:58791550b27d5488b1bb52bc96328456095d96206a250d28d874fafe11b3dfaf"},
-    {file = "propcache-0.2.1-cp313-cp313-musllinux_1_2_s390x.whl", hash = "sha256:0f022d381747f0dfe27e99d928e31bc51a18b65bb9e481ae0af1380a6725dd1f"},
-    {file = "propcache-0.2.1-cp313-cp313-musllinux_1_2_x86_64.whl", hash = "sha256:297878dc9d0a334358f9b608b56d02e72899f3b8499fc6044133f0d319e2ec30"},
-    {file = "propcache-0.2.1-cp313-cp313-win32.whl", hash = "sha256:ddfab44e4489bd79bda09d84c430677fc7f0a4939a73d2bba3073036f487a0a6"},
-    {file = "propcache-0.2.1-cp313-cp313-win_amd64.whl", hash = "sha256:556fc6c10989f19a179e4321e5d678db8eb2924131e64652a51fe83e4c3db0e1"},
-    {file = "propcache-0.2.1-cp39-cp39-macosx_10_9_universal2.whl", hash = "sha256:6a9a8c34fb7bb609419a211e59da8887eeca40d300b5ea8e56af98f6fbbb1541"},
-    {file = "propcache-0.2.1-cp39-cp39-macosx_10_9_x86_64.whl", hash = "sha256:ae1aa1cd222c6d205853b3013c69cd04515f9d6ab6de4b0603e2e1c33221303e"},
-    {file = "propcache-0.2.1-cp39-cp39-macosx_11_0_arm64.whl", hash = "sha256:accb6150ce61c9c4b7738d45550806aa2b71c7668c6942f17b0ac182b6142fd4"},
-    {file = "propcache-0.2.1-cp39-cp39-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:5eee736daafa7af6d0a2dc15cc75e05c64f37fc37bafef2e00d77c14171c2097"},
-    {file = "propcache-0.2.1-cp39-cp39-manylinux_2_17_ppc64le.manylinux2014_ppc64le.whl", hash = "sha256:f7a31fc1e1bd362874863fdeed71aed92d348f5336fd84f2197ba40c59f061bd"},
-    {file = "propcache-0.2.1-cp39-cp39-manylinux_2_17_s390x.manylinux2014_s390x.whl", hash = "sha256:cba4cfa1052819d16699e1d55d18c92b6e094d4517c41dd231a8b9f87b6fa681"},
-    {file = "propcache-0.2.1-cp39-cp39-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:f089118d584e859c62b3da0892b88a83d611c2033ac410e929cb6754eec0ed16"},
-    {file = "propcache-0.2.1-cp39-cp39-manylinux_2_5_i686.manylinux1_i686.manylinux_2_17_i686.manylinux2014_i686.whl", hash = "sha256:781e65134efaf88feb447e8c97a51772aa75e48b794352f94cb7ea717dedda0d"},
-    {file = "propcache-0.2.1-cp39-cp39-musllinux_1_2_aarch64.whl", hash = "sha256:31f5af773530fd3c658b32b6bdc2d0838543de70eb9a2156c03e410f7b0d3aae"},
-    {file = "propcache-0.2.1-cp39-cp39-musllinux_1_2_armv7l.whl", hash = "sha256:a7a078f5d37bee6690959c813977da5291b24286e7b962e62a94cec31aa5188b"},
-    {file = "propcache-0.2.1-cp39-cp39-musllinux_1_2_i686.whl", hash = "sha256:cea7daf9fc7ae6687cf1e2c049752f19f146fdc37c2cc376e7d0032cf4f25347"},
-    {file = "propcache-0.2.1-cp39-cp39-musllinux_1_2_ppc64le.whl", hash = "sha256:8b3489ff1ed1e8315674d0775dc7d2195fb13ca17b3808721b54dbe9fd020faf"},
-    {file = "propcache-0.2.1-cp39-cp39-musllinux_1_2_s390x.whl", hash = "sha256:9403db39be1393618dd80c746cb22ccda168efce239c73af13c3763ef56ffc04"},
-    {file = "propcache-0.2.1-cp39-cp39-musllinux_1_2_x86_64.whl", hash = "sha256:5d97151bc92d2b2578ff7ce779cdb9174337390a535953cbb9452fb65164c587"},
-    {file = "propcache-0.2.1-cp39-cp39-win32.whl", hash = "sha256:9caac6b54914bdf41bcc91e7eb9147d331d29235a7c967c150ef5df6464fd1bb"},
-    {file = "propcache-0.2.1-cp39-cp39-win_amd64.whl", hash = "sha256:92fc4500fcb33899b05ba73276dfb684a20d31caa567b7cb5252d48f896a91b1"},
-    {file = "propcache-0.2.1-py3-none-any.whl", hash = "sha256:52277518d6aae65536e9cea52d4e7fd2f7a66f4aa2d30ed3f2fcea620ace3c54"},
-    {file = "propcache-0.2.1.tar.gz", hash = "sha256:3f77ce728b19cb537714499928fe800c3dda29e8d9428778fc7c186da4c09a64"},
+    {file = "propcache-0.3.0-cp310-cp310-macosx_10_9_universal2.whl", hash = "sha256:efa44f64c37cc30c9f05932c740a8b40ce359f51882c70883cc95feac842da4d"},
+    {file = "propcache-0.3.0-cp310-cp310-macosx_10_9_x86_64.whl", hash = "sha256:2383a17385d9800b6eb5855c2f05ee550f803878f344f58b6e194de08b96352c"},
+    {file = "propcache-0.3.0-cp310-cp310-macosx_11_0_arm64.whl", hash = "sha256:d3e7420211f5a65a54675fd860ea04173cde60a7cc20ccfbafcccd155225f8bc"},
+    {file = "propcache-0.3.0-cp310-cp310-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:3302c5287e504d23bb0e64d2a921d1eb4a03fb93a0a0aa3b53de059f5a5d737d"},
+    {file = "propcache-0.3.0-cp310-cp310-manylinux_2_17_ppc64le.manylinux2014_ppc64le.whl", hash = "sha256:7e2e068a83552ddf7a39a99488bcba05ac13454fb205c847674da0352602082f"},
+    {file = "propcache-0.3.0-cp310-cp310-manylinux_2_17_s390x.manylinux2014_s390x.whl", hash = "sha256:2d913d36bdaf368637b4f88d554fb9cb9d53d6920b9c5563846555938d5450bf"},
+    {file = "propcache-0.3.0-cp310-cp310-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:8ee1983728964d6070ab443399c476de93d5d741f71e8f6e7880a065f878e0b9"},
+    {file = "propcache-0.3.0-cp310-cp310-manylinux_2_5_i686.manylinux1_i686.manylinux_2_17_i686.manylinux2014_i686.whl", hash = "sha256:36ca5e9a21822cc1746023e88f5c0af6fce3af3b85d4520efb1ce4221bed75cc"},
+    {file = "propcache-0.3.0-cp310-cp310-musllinux_1_2_aarch64.whl", hash = "sha256:9ecde3671e62eeb99e977f5221abcf40c208f69b5eb986b061ccec317c82ebd0"},
+    {file = "propcache-0.3.0-cp310-cp310-musllinux_1_2_armv7l.whl", hash = "sha256:d383bf5e045d7f9d239b38e6acadd7b7fdf6c0087259a84ae3475d18e9a2ae8b"},
+    {file = "propcache-0.3.0-cp310-cp310-musllinux_1_2_i686.whl", hash = "sha256:8cb625bcb5add899cb8ba7bf716ec1d3e8f7cdea9b0713fa99eadf73b6d4986f"},
+    {file = "propcache-0.3.0-cp310-cp310-musllinux_1_2_ppc64le.whl", hash = "sha256:5fa159dcee5dba00c1def3231c249cf261185189205073bde13797e57dd7540a"},
+    {file = "propcache-0.3.0-cp310-cp310-musllinux_1_2_s390x.whl", hash = "sha256:a7080b0159ce05f179cfac592cda1a82898ca9cd097dacf8ea20ae33474fbb25"},
+    {file = "propcache-0.3.0-cp310-cp310-musllinux_1_2_x86_64.whl", hash = "sha256:ed7161bccab7696a473fe7ddb619c1d75963732b37da4618ba12e60899fefe4f"},
+    {file = "propcache-0.3.0-cp310-cp310-win32.whl", hash = "sha256:bf0d9a171908f32d54f651648c7290397b8792f4303821c42a74e7805bfb813c"},
+    {file = "propcache-0.3.0-cp310-cp310-win_amd64.whl", hash = "sha256:42924dc0c9d73e49908e35bbdec87adedd651ea24c53c29cac103ede0ea1d340"},
+    {file = "propcache-0.3.0-cp311-cp311-macosx_10_9_universal2.whl", hash = "sha256:9ddd49258610499aab83b4f5b61b32e11fce873586282a0e972e5ab3bcadee51"},
+    {file = "propcache-0.3.0-cp311-cp311-macosx_10_9_x86_64.whl", hash = "sha256:2578541776769b500bada3f8a4eeaf944530516b6e90c089aa368266ed70c49e"},
+    {file = "propcache-0.3.0-cp311-cp311-macosx_11_0_arm64.whl", hash = "sha256:d8074c5dd61c8a3e915fa8fc04754fa55cfa5978200d2daa1e2d4294c1f136aa"},
+    {file = "propcache-0.3.0-cp311-cp311-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:b58229a844931bca61b3a20efd2be2a2acb4ad1622fc026504309a6883686fbf"},
+    {file = "propcache-0.3.0-cp311-cp311-manylinux_2_17_ppc64le.manylinux2014_ppc64le.whl", hash = "sha256:e45377d5d6fefe1677da2a2c07b024a6dac782088e37c0b1efea4cfe2b1be19b"},
+    {file = "propcache-0.3.0-cp311-cp311-manylinux_2_17_s390x.manylinux2014_s390x.whl", hash = "sha256:ec5060592d83454e8063e487696ac3783cc48c9a329498bafae0d972bc7816c9"},
+    {file = "propcache-0.3.0-cp311-cp311-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:15010f29fbed80e711db272909a074dc79858c6d28e2915704cfc487a8ac89c6"},
+    {file = "propcache-0.3.0-cp311-cp311-manylinux_2_5_i686.manylinux1_i686.manylinux_2_17_i686.manylinux2014_i686.whl", hash = "sha256:a254537b9b696ede293bfdbc0a65200e8e4507bc9f37831e2a0318a9b333c85c"},
+    {file = "propcache-0.3.0-cp311-cp311-musllinux_1_2_aarch64.whl", hash = "sha256:2b975528998de037dfbc10144b8aed9b8dd5a99ec547f14d1cb7c5665a43f075"},
+    {file = "propcache-0.3.0-cp311-cp311-musllinux_1_2_armv7l.whl", hash = "sha256:19d36bb351ad5554ff20f2ae75f88ce205b0748c38b146c75628577020351e3c"},
+    {file = "propcache-0.3.0-cp311-cp311-musllinux_1_2_i686.whl", hash = "sha256:6032231d4a5abd67c7f71168fd64a47b6b451fbcb91c8397c2f7610e67683810"},
+    {file = "propcache-0.3.0-cp311-cp311-musllinux_1_2_ppc64le.whl", hash = "sha256:6985a593417cdbc94c7f9c3403747335e450c1599da1647a5af76539672464d3"},
+    {file = "propcache-0.3.0-cp311-cp311-musllinux_1_2_s390x.whl", hash = "sha256:6a1948df1bb1d56b5e7b0553c0fa04fd0e320997ae99689488201f19fa90d2e7"},
+    {file = "propcache-0.3.0-cp311-cp311-musllinux_1_2_x86_64.whl", hash = "sha256:8319293e85feadbbfe2150a5659dbc2ebc4afdeaf7d98936fb9a2f2ba0d4c35c"},
+    {file = "propcache-0.3.0-cp311-cp311-win32.whl", hash = "sha256:63f26258a163c34542c24808f03d734b338da66ba91f410a703e505c8485791d"},
+    {file = "propcache-0.3.0-cp311-cp311-win_amd64.whl", hash = "sha256:cacea77ef7a2195f04f9279297684955e3d1ae4241092ff0cfcef532bb7a1c32"},
+    {file = "propcache-0.3.0-cp312-cp312-macosx_10_13_universal2.whl", hash = "sha256:e53d19c2bf7d0d1e6998a7e693c7e87300dd971808e6618964621ccd0e01fe4e"},
+    {file = "propcache-0.3.0-cp312-cp312-macosx_10_13_x86_64.whl", hash = "sha256:a61a68d630e812b67b5bf097ab84e2cd79b48c792857dc10ba8a223f5b06a2af"},
+    {file = "propcache-0.3.0-cp312-cp312-macosx_11_0_arm64.whl", hash = "sha256:fb91d20fa2d3b13deea98a690534697742029f4fb83673a3501ae6e3746508b5"},
+    {file = "propcache-0.3.0-cp312-cp312-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:67054e47c01b7b349b94ed0840ccae075449503cf1fdd0a1fdd98ab5ddc2667b"},
+    {file = "propcache-0.3.0-cp312-cp312-manylinux_2_17_ppc64le.manylinux2014_ppc64le.whl", hash = "sha256:997e7b8f173a391987df40f3b52c423e5850be6f6df0dcfb5376365440b56667"},
+    {file = "propcache-0.3.0-cp312-cp312-manylinux_2_17_s390x.manylinux2014_s390x.whl", hash = "sha256:8d663fd71491dde7dfdfc899d13a067a94198e90695b4321084c6e450743b8c7"},
+    {file = "propcache-0.3.0-cp312-cp312-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:8884ba1a0fe7210b775106b25850f5e5a9dc3c840d1ae9924ee6ea2eb3acbfe7"},
+    {file = "propcache-0.3.0-cp312-cp312-manylinux_2_5_i686.manylinux1_i686.manylinux_2_17_i686.manylinux2014_i686.whl", hash = "sha256:aa806bbc13eac1ab6291ed21ecd2dd426063ca5417dd507e6be58de20e58dfcf"},
+    {file = "propcache-0.3.0-cp312-cp312-musllinux_1_2_aarch64.whl", hash = "sha256:6f4d7a7c0aff92e8354cceca6fe223973ddf08401047920df0fcb24be2bd5138"},
+    {file = "propcache-0.3.0-cp312-cp312-musllinux_1_2_armv7l.whl", hash = "sha256:9be90eebc9842a93ef8335291f57b3b7488ac24f70df96a6034a13cb58e6ff86"},
+    {file = "propcache-0.3.0-cp312-cp312-musllinux_1_2_i686.whl", hash = "sha256:bf15fc0b45914d9d1b706f7c9c4f66f2b7b053e9517e40123e137e8ca8958b3d"},
+    {file = "propcache-0.3.0-cp312-cp312-musllinux_1_2_ppc64le.whl", hash = "sha256:5a16167118677d94bb48bfcd91e420088854eb0737b76ec374b91498fb77a70e"},
+    {file = "propcache-0.3.0-cp312-cp312-musllinux_1_2_s390x.whl", hash = "sha256:41de3da5458edd5678b0f6ff66691507f9885f5fe6a0fb99a5d10d10c0fd2d64"},
+    {file = "propcache-0.3.0-cp312-cp312-musllinux_1_2_x86_64.whl", hash = "sha256:728af36011bb5d344c4fe4af79cfe186729efb649d2f8b395d1572fb088a996c"},
+    {file = "propcache-0.3.0-cp312-cp312-win32.whl", hash = "sha256:6b5b7fd6ee7b54e01759f2044f936dcf7dea6e7585f35490f7ca0420fe723c0d"},
+    {file = "propcache-0.3.0-cp312-cp312-win_amd64.whl", hash = "sha256:2d15bc27163cd4df433e75f546b9ac31c1ba7b0b128bfb1b90df19082466ff57"},
+    {file = "propcache-0.3.0-cp313-cp313-macosx_10_13_universal2.whl", hash = "sha256:a2b9bf8c79b660d0ca1ad95e587818c30ccdb11f787657458d6f26a1ea18c568"},
+    {file = "propcache-0.3.0-cp313-cp313-macosx_10_13_x86_64.whl", hash = "sha256:b0c1a133d42c6fc1f5fbcf5c91331657a1ff822e87989bf4a6e2e39b818d0ee9"},
+    {file = "propcache-0.3.0-cp313-cp313-macosx_11_0_arm64.whl", hash = "sha256:bb2f144c6d98bb5cbc94adeb0447cfd4c0f991341baa68eee3f3b0c9c0e83767"},
+    {file = "propcache-0.3.0-cp313-cp313-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:d1323cd04d6e92150bcc79d0174ce347ed4b349d748b9358fd2e497b121e03c8"},
+    {file = "propcache-0.3.0-cp313-cp313-manylinux_2_17_ppc64le.manylinux2014_ppc64le.whl", hash = "sha256:3b812b3cb6caacd072276ac0492d249f210006c57726b6484a1e1805b3cfeea0"},
+    {file = "propcache-0.3.0-cp313-cp313-manylinux_2_17_s390x.manylinux2014_s390x.whl", hash = "sha256:742840d1d0438eb7ea4280f3347598f507a199a35a08294afdcc560c3739989d"},
+    {file = "propcache-0.3.0-cp313-cp313-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:7c6e7e4f9167fddc438cd653d826f2222222564daed4116a02a184b464d3ef05"},
+    {file = "propcache-0.3.0-cp313-cp313-manylinux_2_5_i686.manylinux1_i686.manylinux_2_17_i686.manylinux2014_i686.whl", hash = "sha256:a94ffc66738da99232ddffcf7910e0f69e2bbe3a0802e54426dbf0714e1c2ffe"},
+    {file = "propcache-0.3.0-cp313-cp313-musllinux_1_2_aarch64.whl", hash = "sha256:3c6ec957025bf32b15cbc6b67afe233c65b30005e4c55fe5768e4bb518d712f1"},
+    {file = "propcache-0.3.0-cp313-cp313-musllinux_1_2_armv7l.whl", hash = "sha256:549722908de62aa0b47a78b90531c022fa6e139f9166be634f667ff45632cc92"},
+    {file = "propcache-0.3.0-cp313-cp313-musllinux_1_2_i686.whl", hash = "sha256:5d62c4f6706bff5d8a52fd51fec6069bef69e7202ed481486c0bc3874912c787"},
+    {file = "propcache-0.3.0-cp313-cp313-musllinux_1_2_ppc64le.whl", hash = "sha256:24c04f8fbf60094c531667b8207acbae54146661657a1b1be6d3ca7773b7a545"},
+    {file = "propcache-0.3.0-cp313-cp313-musllinux_1_2_s390x.whl", hash = "sha256:7c5f5290799a3f6539cc5e6f474c3e5c5fbeba74a5e1e5be75587746a940d51e"},
+    {file = "propcache-0.3.0-cp313-cp313-musllinux_1_2_x86_64.whl", hash = "sha256:4fa0e7c9c3cf7c276d4f6ab9af8adddc127d04e0fcabede315904d2ff76db626"},
+    {file = "propcache-0.3.0-cp313-cp313-win32.whl", hash = "sha256:ee0bd3a7b2e184e88d25c9baa6a9dc609ba25b76daae942edfb14499ac7ec374"},
+    {file = "propcache-0.3.0-cp313-cp313-win_amd64.whl", hash = "sha256:1c8f7d896a16da9455f882870a507567d4f58c53504dc2d4b1e1d386dfe4588a"},
+    {file = "propcache-0.3.0-cp313-cp313t-macosx_10_13_universal2.whl", hash = "sha256:e560fd75aaf3e5693b91bcaddd8b314f4d57e99aef8a6c6dc692f935cc1e6bbf"},
+    {file = "propcache-0.3.0-cp313-cp313t-macosx_10_13_x86_64.whl", hash = "sha256:65a37714b8ad9aba5780325228598a5b16c47ba0f8aeb3dc0514701e4413d7c0"},
+    {file = "propcache-0.3.0-cp313-cp313t-macosx_11_0_arm64.whl", hash = "sha256:07700939b2cbd67bfb3b76a12e1412405d71019df00ca5697ce75e5ef789d829"},
+    {file = "propcache-0.3.0-cp313-cp313t-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:7c0fdbdf6983526e269e5a8d53b7ae3622dd6998468821d660d0daf72779aefa"},
+    {file = "propcache-0.3.0-cp313-cp313t-manylinux_2_17_ppc64le.manylinux2014_ppc64le.whl", hash = "sha256:794c3dd744fad478b6232289c866c25406ecdfc47e294618bdf1697e69bd64a6"},
+    {file = "propcache-0.3.0-cp313-cp313t-manylinux_2_17_s390x.manylinux2014_s390x.whl", hash = "sha256:4544699674faf66fb6b4473a1518ae4999c1b614f0b8297b1cef96bac25381db"},
+    {file = "propcache-0.3.0-cp313-cp313t-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:fddb8870bdb83456a489ab67c6b3040a8d5a55069aa6f72f9d872235fbc52f54"},
+    {file = "propcache-0.3.0-cp313-cp313t-manylinux_2_5_i686.manylinux1_i686.manylinux_2_17_i686.manylinux2014_i686.whl", hash = "sha256:f857034dc68d5ceb30fb60afb6ff2103087aea10a01b613985610e007053a121"},
+    {file = "propcache-0.3.0-cp313-cp313t-musllinux_1_2_aarch64.whl", hash = "sha256:02df07041e0820cacc8f739510078f2aadcfd3fc57eaeeb16d5ded85c872c89e"},
+    {file = "propcache-0.3.0-cp313-cp313t-musllinux_1_2_armv7l.whl", hash = "sha256:f47d52fd9b2ac418c4890aad2f6d21a6b96183c98021f0a48497a904199f006e"},
+    {file = "propcache-0.3.0-cp313-cp313t-musllinux_1_2_i686.whl", hash = "sha256:9ff4e9ecb6e4b363430edf2c6e50173a63e0820e549918adef70515f87ced19a"},
+    {file = "propcache-0.3.0-cp313-cp313t-musllinux_1_2_ppc64le.whl", hash = "sha256:ecc2920630283e0783c22e2ac94427f8cca29a04cfdf331467d4f661f4072dac"},
+    {file = "propcache-0.3.0-cp313-cp313t-musllinux_1_2_s390x.whl", hash = "sha256:c441c841e82c5ba7a85ad25986014be8d7849c3cfbdb6004541873505929a74e"},
+    {file = "propcache-0.3.0-cp313-cp313t-musllinux_1_2_x86_64.whl", hash = "sha256:6c929916cbdb540d3407c66f19f73387f43e7c12fa318a66f64ac99da601bcdf"},
+    {file = "propcache-0.3.0-cp313-cp313t-win32.whl", hash = "sha256:0c3e893c4464ebd751b44ae76c12c5f5c1e4f6cbd6fbf67e3783cd93ad221863"},
+    {file = "propcache-0.3.0-cp313-cp313t-win_amd64.whl", hash = "sha256:75e872573220d1ee2305b35c9813626e620768248425f58798413e9c39741f46"},
+    {file = "propcache-0.3.0-cp39-cp39-macosx_10_9_universal2.whl", hash = "sha256:03c091bb752349402f23ee43bb2bff6bd80ccab7c9df6b88ad4322258d6960fc"},
+    {file = "propcache-0.3.0-cp39-cp39-macosx_10_9_x86_64.whl", hash = "sha256:46ed02532cb66612d42ae5c3929b5e98ae330ea0f3900bc66ec5f4862069519b"},
+    {file = "propcache-0.3.0-cp39-cp39-macosx_11_0_arm64.whl", hash = "sha256:11ae6a8a01b8a4dc79093b5d3ca2c8a4436f5ee251a9840d7790dccbd96cb649"},
+    {file = "propcache-0.3.0-cp39-cp39-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:df03cd88f95b1b99052b52b1bb92173229d7a674df0ab06d2b25765ee8404bce"},
+    {file = "propcache-0.3.0-cp39-cp39-manylinux_2_17_ppc64le.manylinux2014_ppc64le.whl", hash = "sha256:03acd9ff19021bd0567582ac88f821b66883e158274183b9e5586f678984f8fe"},
+    {file = "propcache-0.3.0-cp39-cp39-manylinux_2_17_s390x.manylinux2014_s390x.whl", hash = "sha256:cd54895e4ae7d32f1e3dd91261df46ee7483a735017dc6f987904f194aa5fd14"},
+    {file = "propcache-0.3.0-cp39-cp39-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:26a67e5c04e3119594d8cfae517f4b9330c395df07ea65eab16f3d559b7068fe"},
+    {file = "propcache-0.3.0-cp39-cp39-manylinux_2_5_i686.manylinux1_i686.manylinux_2_17_i686.manylinux2014_i686.whl", hash = "sha256:ee25f1ac091def37c4b59d192bbe3a206298feeb89132a470325bf76ad122a1e"},
+    {file = "propcache-0.3.0-cp39-cp39-musllinux_1_2_aarch64.whl", hash = "sha256:58e6d2a5a7cb3e5f166fd58e71e9a4ff504be9dc61b88167e75f835da5764d07"},
+    {file = "propcache-0.3.0-cp39-cp39-musllinux_1_2_armv7l.whl", hash = "sha256:be90c94570840939fecedf99fa72839aed70b0ced449b415c85e01ae67422c90"},
+    {file = "propcache-0.3.0-cp39-cp39-musllinux_1_2_i686.whl", hash = "sha256:49ea05212a529c2caffe411e25a59308b07d6e10bf2505d77da72891f9a05641"},
+    {file = "propcache-0.3.0-cp39-cp39-musllinux_1_2_ppc64le.whl", hash = "sha256:119e244ab40f70a98c91906d4c1f4c5f2e68bd0b14e7ab0a06922038fae8a20f"},
+    {file = "propcache-0.3.0-cp39-cp39-musllinux_1_2_s390x.whl", hash = "sha256:507c5357a8d8b4593b97fb669c50598f4e6cccbbf77e22fa9598aba78292b4d7"},
+    {file = "propcache-0.3.0-cp39-cp39-musllinux_1_2_x86_64.whl", hash = "sha256:8526b0941ec5a40220fc4dfde76aed58808e2b309c03e9fa8e2260083ef7157f"},
+    {file = "propcache-0.3.0-cp39-cp39-win32.whl", hash = "sha256:7cedd25e5f678f7738da38037435b340694ab34d424938041aa630d8bac42663"},
+    {file = "propcache-0.3.0-cp39-cp39-win_amd64.whl", hash = "sha256:bf4298f366ca7e1ad1d21bbb58300a6985015909964077afd37559084590c929"},
+    {file = "propcache-0.3.0-py3-none-any.whl", hash = "sha256:67dda3c7325691c2081510e92c561f465ba61b975f481735aefdfc845d2cd043"},
+    {file = "propcache-0.3.0.tar.gz", hash = "sha256:a8fd93de4e1d278046345f49e2238cdb298589325849b2645d4a94c53faeffc5"},
 ]
 
 [[package]]
@@ -4434,32 +4440,25 @@ files = [
 
 [[package]]
 name = "psutil"
-version = "6.1.1"
-description = "Cross-platform lib for process and system monitoring in Python."
+version = "7.0.0"
+description = "Cross-platform lib for process and system monitoring in Python.  NOTE: the syntax of this script MUST be kept compatible with Python 2.7."
 optional = false
-python-versions = "!=3.0.*,!=3.1.*,!=3.2.*,!=3.3.*,!=3.4.*,!=3.5.*,>=2.7"
+python-versions = ">=3.6"
 files = [
-    {file = "psutil-6.1.1-cp27-cp27m-macosx_10_9_x86_64.whl", hash = "sha256:9ccc4316f24409159897799b83004cb1e24f9819b0dcf9c0b68bdcb6cefee6a8"},
-    {file = "psutil-6.1.1-cp27-cp27m-manylinux2010_i686.whl", hash = "sha256:ca9609c77ea3b8481ab005da74ed894035936223422dc591d6772b147421f777"},
-    {file = "psutil-6.1.1-cp27-cp27m-manylinux2010_x86_64.whl", hash = "sha256:8df0178ba8a9e5bc84fed9cfa61d54601b371fbec5c8eebad27575f1e105c0d4"},
-    {file = "psutil-6.1.1-cp27-cp27mu-manylinux2010_i686.whl", hash = "sha256:1924e659d6c19c647e763e78670a05dbb7feaf44a0e9c94bf9e14dfc6ba50468"},
-    {file = "psutil-6.1.1-cp27-cp27mu-manylinux2010_x86_64.whl", hash = "sha256:018aeae2af92d943fdf1da6b58665124897cfc94faa2ca92098838f83e1b1bca"},
-    {file = "psutil-6.1.1-cp27-none-win32.whl", hash = "sha256:6d4281f5bbca041e2292be3380ec56a9413b790579b8e593b1784499d0005dac"},
-    {file = "psutil-6.1.1-cp27-none-win_amd64.whl", hash = "sha256:c777eb75bb33c47377c9af68f30e9f11bc78e0f07fbf907be4a5d70b2fe5f030"},
-    {file = "psutil-6.1.1-cp36-abi3-macosx_10_9_x86_64.whl", hash = "sha256:fc0ed7fe2231a444fc219b9c42d0376e0a9a1a72f16c5cfa0f68d19f1a0663e8"},
-    {file = "psutil-6.1.1-cp36-abi3-macosx_11_0_arm64.whl", hash = "sha256:0bdd4eab935276290ad3cb718e9809412895ca6b5b334f5a9111ee6d9aff9377"},
-    {file = "psutil-6.1.1-cp36-abi3-manylinux_2_12_i686.manylinux2010_i686.manylinux_2_17_i686.manylinux2014_i686.whl", hash = "sha256:b6e06c20c05fe95a3d7302d74e7097756d4ba1247975ad6905441ae1b5b66003"},
-    {file = "psutil-6.1.1-cp36-abi3-manylinux_2_12_x86_64.manylinux2010_x86_64.manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:97f7cb9921fbec4904f522d972f0c0e1f4fabbdd4e0287813b21215074a0f160"},
-    {file = "psutil-6.1.1-cp36-abi3-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:33431e84fee02bc84ea36d9e2c4a6d395d479c9dd9bba2376c1f6ee8f3a4e0b3"},
-    {file = "psutil-6.1.1-cp36-cp36m-win32.whl", hash = "sha256:384636b1a64b47814437d1173be1427a7c83681b17a450bfc309a1953e329603"},
-    {file = "psutil-6.1.1-cp36-cp36m-win_amd64.whl", hash = "sha256:8be07491f6ebe1a693f17d4f11e69d0dc1811fa082736500f649f79df7735303"},
-    {file = "psutil-6.1.1-cp37-abi3-win32.whl", hash = "sha256:eaa912e0b11848c4d9279a93d7e2783df352b082f40111e078388701fd479e53"},
-    {file = "psutil-6.1.1-cp37-abi3-win_amd64.whl", hash = "sha256:f35cfccb065fff93529d2afb4a2e89e363fe63ca1e4a5da22b603a85833c2649"},
-    {file = "psutil-6.1.1.tar.gz", hash = "sha256:cf8496728c18f2d0b45198f06895be52f36611711746b7f30c464b422b50e2f5"},
+    {file = "psutil-7.0.0-cp36-abi3-macosx_10_9_x86_64.whl", hash = "sha256:101d71dc322e3cffd7cea0650b09b3d08b8e7c4109dd6809fe452dfd00e58b25"},
+    {file = "psutil-7.0.0-cp36-abi3-macosx_11_0_arm64.whl", hash = "sha256:39db632f6bb862eeccf56660871433e111b6ea58f2caea825571951d4b6aa3da"},
+    {file = "psutil-7.0.0-cp36-abi3-manylinux_2_12_i686.manylinux2010_i686.manylinux_2_17_i686.manylinux2014_i686.whl", hash = "sha256:1fcee592b4c6f146991ca55919ea3d1f8926497a713ed7faaf8225e174581e91"},
+    {file = "psutil-7.0.0-cp36-abi3-manylinux_2_12_x86_64.manylinux2010_x86_64.manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:4b1388a4f6875d7e2aff5c4ca1cc16c545ed41dd8bb596cefea80111db353a34"},
+    {file = "psutil-7.0.0-cp36-abi3-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:a5f098451abc2828f7dc6b58d44b532b22f2088f4999a937557b603ce72b1993"},
+    {file = "psutil-7.0.0-cp36-cp36m-win32.whl", hash = "sha256:84df4eb63e16849689f76b1ffcb36db7b8de703d1bc1fe41773db487621b6c17"},
+    {file = "psutil-7.0.0-cp36-cp36m-win_amd64.whl", hash = "sha256:1e744154a6580bc968a0195fd25e80432d3afec619daf145b9e5ba16cc1d688e"},
+    {file = "psutil-7.0.0-cp37-abi3-win32.whl", hash = "sha256:ba3fcef7523064a6c9da440fc4d6bd07da93ac726b5733c29027d7dc95b39d99"},
+    {file = "psutil-7.0.0-cp37-abi3-win_amd64.whl", hash = "sha256:4cf3d4eb1aa9b348dec30105c55cd9b7d4629285735a102beb4441e38db90553"},
+    {file = "psutil-7.0.0.tar.gz", hash = "sha256:7be9c3eba38beccb6495ea33afd982a44074b78f28c434a1f51cc07fd315c456"},
 ]
 
 [package.extras]
-dev = ["abi3audit", "black", "check-manifest", "coverage", "packaging", "pylint", "pyperf", "pypinfo", "pytest-cov", "requests", "rstcheck", "ruff", "sphinx", "sphinx_rtd_theme", "toml-sort", "twine", "virtualenv", "vulture", "wheel"]
+dev = ["abi3audit", "black (==24.10.0)", "check-manifest", "coverage", "packaging", "pylint", "pyperf", "pypinfo", "pytest", "pytest-cov", "pytest-xdist", "requests", "rstcheck", "ruff", "setuptools", "sphinx", "sphinx_rtd_theme", "toml-sort", "twine", "virtualenv", "vulture", "wheel"]
 test = ["pytest", "pytest-xdist", "setuptools"]
 
 [[package]]
@@ -4489,53 +4488,53 @@ tests = ["pytest"]
 
 [[package]]
 name = "pyarrow"
-version = "19.0.0"
+version = "19.0.1"
 description = "Python library for Apache Arrow"
 optional = false
 python-versions = ">=3.9"
 files = [
-    {file = "pyarrow-19.0.0-cp310-cp310-macosx_12_0_arm64.whl", hash = "sha256:c318eda14f6627966997a7d8c374a87d084a94e4e38e9abbe97395c215830e0c"},
-    {file = "pyarrow-19.0.0-cp310-cp310-macosx_12_0_x86_64.whl", hash = "sha256:62ef8360ff256e960f57ce0299090fb86423afed5e46f18f1225f960e05aae3d"},
-    {file = "pyarrow-19.0.0-cp310-cp310-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:2795064647add0f16563e57e3d294dbfc067b723f0fd82ecd80af56dad15f503"},
-    {file = "pyarrow-19.0.0-cp310-cp310-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:a218670b26fb1bc74796458d97bcab072765f9b524f95b2fccad70158feb8b17"},
-    {file = "pyarrow-19.0.0-cp310-cp310-manylinux_2_28_aarch64.whl", hash = "sha256:66732e39eaa2247996a6b04c8aa33e3503d351831424cdf8d2e9a0582ac54b34"},
-    {file = "pyarrow-19.0.0-cp310-cp310-manylinux_2_28_x86_64.whl", hash = "sha256:e675a3ad4732b92d72e4d24009707e923cab76b0d088e5054914f11a797ebe44"},
-    {file = "pyarrow-19.0.0-cp310-cp310-win_amd64.whl", hash = "sha256:f094742275586cdd6b1a03655ccff3b24b2610c3af76f810356c4c71d24a2a6c"},
-    {file = "pyarrow-19.0.0-cp311-cp311-macosx_12_0_arm64.whl", hash = "sha256:8e3a839bf36ec03b4315dc924d36dcde5444a50066f1c10f8290293c0427b46a"},
-    {file = "pyarrow-19.0.0-cp311-cp311-macosx_12_0_x86_64.whl", hash = "sha256:ce42275097512d9e4e4a39aade58ef2b3798a93aa3026566b7892177c266f735"},
-    {file = "pyarrow-19.0.0-cp311-cp311-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:9348a0137568c45601b031a8d118275069435f151cbb77e6a08a27e8125f59d4"},
-    {file = "pyarrow-19.0.0-cp311-cp311-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:2a0144a712d990d60f7f42b7a31f0acaccf4c1e43e957f7b1ad58150d6f639c1"},
-    {file = "pyarrow-19.0.0-cp311-cp311-manylinux_2_28_aarch64.whl", hash = "sha256:2a1a109dfda558eb011e5f6385837daffd920d54ca00669f7a11132d0b1e6042"},
-    {file = "pyarrow-19.0.0-cp311-cp311-manylinux_2_28_x86_64.whl", hash = "sha256:be686bf625aa7b9bada18defb3a3ea3981c1099697239788ff111d87f04cd263"},
-    {file = "pyarrow-19.0.0-cp311-cp311-win_amd64.whl", hash = "sha256:239ca66d9a05844bdf5af128861af525e14df3c9591bcc05bac25918e650d3a2"},
-    {file = "pyarrow-19.0.0-cp312-cp312-macosx_12_0_arm64.whl", hash = "sha256:a7bbe7109ab6198688b7079cbad5a8c22de4d47c4880d8e4847520a83b0d1b68"},
-    {file = "pyarrow-19.0.0-cp312-cp312-macosx_12_0_x86_64.whl", hash = "sha256:4624c89d6f777c580e8732c27bb8e77fd1433b89707f17c04af7635dd9638351"},
-    {file = "pyarrow-19.0.0-cp312-cp312-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:2b6d3ce4288793350dc2d08d1e184fd70631ea22a4ff9ea5c4ff182130249d9b"},
-    {file = "pyarrow-19.0.0-cp312-cp312-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:450a7d27e840e4d9a384b5c77199d489b401529e75a3b7a3799d4cd7957f2f9c"},
-    {file = "pyarrow-19.0.0-cp312-cp312-manylinux_2_28_aarch64.whl", hash = "sha256:a08e2a8a039a3f72afb67a6668180f09fddaa38fe0d21f13212b4aba4b5d2451"},
-    {file = "pyarrow-19.0.0-cp312-cp312-manylinux_2_28_x86_64.whl", hash = "sha256:f43f5aef2a13d4d56adadae5720d1fed4c1356c993eda8b59dace4b5983843c1"},
-    {file = "pyarrow-19.0.0-cp312-cp312-win_amd64.whl", hash = "sha256:2f672f5364b2d7829ef7c94be199bb88bf5661dd485e21d2d37de12ccb78a136"},
-    {file = "pyarrow-19.0.0-cp313-cp313-macosx_12_0_arm64.whl", hash = "sha256:cf3bf0ce511b833f7bc5f5bb3127ba731e97222023a444b7359f3a22e2a3b463"},
-    {file = "pyarrow-19.0.0-cp313-cp313-macosx_12_0_x86_64.whl", hash = "sha256:4d8b0c0de0a73df1f1bf439af1b60f273d719d70648e898bc077547649bb8352"},
-    {file = "pyarrow-19.0.0-cp313-cp313-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:a92aff08e23d281c69835e4a47b80569242a504095ef6a6223c1f6bb8883431d"},
-    {file = "pyarrow-19.0.0-cp313-cp313-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:c3b78eff5968a1889a0f3bc81ca57e1e19b75f664d9c61a42a604bf9d8402aae"},
-    {file = "pyarrow-19.0.0-cp313-cp313-manylinux_2_28_aarch64.whl", hash = "sha256:b34d3bde38eba66190b215bae441646330f8e9da05c29e4b5dd3e41bde701098"},
-    {file = "pyarrow-19.0.0-cp313-cp313-manylinux_2_28_x86_64.whl", hash = "sha256:5418d4d0fab3a0ed497bad21d17a7973aad336d66ad4932a3f5f7480d4ca0c04"},
-    {file = "pyarrow-19.0.0-cp313-cp313-win_amd64.whl", hash = "sha256:e82c3d5e44e969c217827b780ed8faf7ac4c53f934ae9238872e749fa531f7c9"},
-    {file = "pyarrow-19.0.0-cp313-cp313t-macosx_12_0_arm64.whl", hash = "sha256:f208c3b58a6df3b239e0bb130e13bc7487ed14f39a9ff357b6415e3f6339b560"},
-    {file = "pyarrow-19.0.0-cp313-cp313t-macosx_12_0_x86_64.whl", hash = "sha256:c751c1c93955b7a84c06794df46f1cec93e18610dcd5ab7d08e89a81df70a849"},
-    {file = "pyarrow-19.0.0-cp313-cp313t-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:b903afaa5df66d50fc38672ad095806443b05f202c792694f3a604ead7c6ea6e"},
-    {file = "pyarrow-19.0.0-cp313-cp313t-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:a22a4bc0937856263df8b94f2f2781b33dd7f876f787ed746608e06902d691a5"},
-    {file = "pyarrow-19.0.0-cp313-cp313t-manylinux_2_28_aarch64.whl", hash = "sha256:5e8a28b918e2e878c918f6d89137386c06fe577cd08d73a6be8dafb317dc2d73"},
-    {file = "pyarrow-19.0.0-cp313-cp313t-manylinux_2_28_x86_64.whl", hash = "sha256:29cd86c8001a94f768f79440bf83fee23963af5e7bc68ce3a7e5f120e17edf89"},
-    {file = "pyarrow-19.0.0-cp39-cp39-macosx_12_0_arm64.whl", hash = "sha256:c0423393e4a07ff6fea08feb44153302dd261d0551cc3b538ea7a5dc853af43a"},
-    {file = "pyarrow-19.0.0-cp39-cp39-macosx_12_0_x86_64.whl", hash = "sha256:718947fb6d82409013a74b176bf93e0f49ef952d8a2ecd068fecd192a97885b7"},
-    {file = "pyarrow-19.0.0-cp39-cp39-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:3c1c162c4660e0978411a4761f91113dde8da3433683efa473501254563dcbe8"},
-    {file = "pyarrow-19.0.0-cp39-cp39-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:c73268cf557e688efb60f1ccbc7376f7e18cd8e2acae9e663e98b194c40c1a2d"},
-    {file = "pyarrow-19.0.0-cp39-cp39-manylinux_2_28_aarch64.whl", hash = "sha256:edfe6d3916e915ada9acc4e48f6dafca7efdbad2e6283db6fd9385a1b23055f1"},
-    {file = "pyarrow-19.0.0-cp39-cp39-manylinux_2_28_x86_64.whl", hash = "sha256:da410b70a7ab8eb524112f037a7a35da7128b33d484f7671a264a4c224ac131d"},
-    {file = "pyarrow-19.0.0-cp39-cp39-win_amd64.whl", hash = "sha256:597360ffc71fc8cceea1aec1fb60cb510571a744fffc87db33d551d5de919bec"},
-    {file = "pyarrow-19.0.0.tar.gz", hash = "sha256:8d47c691765cf497aaeed4954d226568563f1b3b74ff61139f2d77876717084b"},
+    {file = "pyarrow-19.0.1-cp310-cp310-macosx_12_0_arm64.whl", hash = "sha256:fc28912a2dc924dddc2087679cc8b7263accc71b9ff025a1362b004711661a69"},
+    {file = "pyarrow-19.0.1-cp310-cp310-macosx_12_0_x86_64.whl", hash = "sha256:fca15aabbe9b8355800d923cc2e82c8ef514af321e18b437c3d782aa884eaeec"},
+    {file = "pyarrow-19.0.1-cp310-cp310-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:ad76aef7f5f7e4a757fddcdcf010a8290958f09e3470ea458c80d26f4316ae89"},
+    {file = "pyarrow-19.0.1-cp310-cp310-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:d03c9d6f2a3dffbd62671ca070f13fc527bb1867b4ec2b98c7eeed381d4f389a"},
+    {file = "pyarrow-19.0.1-cp310-cp310-manylinux_2_28_aarch64.whl", hash = "sha256:65cf9feebab489b19cdfcfe4aa82f62147218558d8d3f0fc1e9dea0ab8e7905a"},
+    {file = "pyarrow-19.0.1-cp310-cp310-manylinux_2_28_x86_64.whl", hash = "sha256:41f9706fbe505e0abc10e84bf3a906a1338905cbbcf1177b71486b03e6ea6608"},
+    {file = "pyarrow-19.0.1-cp310-cp310-win_amd64.whl", hash = "sha256:c6cb2335a411b713fdf1e82a752162f72d4a7b5dbc588e32aa18383318b05866"},
+    {file = "pyarrow-19.0.1-cp311-cp311-macosx_12_0_arm64.whl", hash = "sha256:cc55d71898ea30dc95900297d191377caba257612f384207fe9f8293b5850f90"},
+    {file = "pyarrow-19.0.1-cp311-cp311-macosx_12_0_x86_64.whl", hash = "sha256:7a544ec12de66769612b2d6988c36adc96fb9767ecc8ee0a4d270b10b1c51e00"},
+    {file = "pyarrow-19.0.1-cp311-cp311-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:0148bb4fc158bfbc3d6dfe5001d93ebeed253793fff4435167f6ce1dc4bddeae"},
+    {file = "pyarrow-19.0.1-cp311-cp311-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:f24faab6ed18f216a37870d8c5623f9c044566d75ec586ef884e13a02a9d62c5"},
+    {file = "pyarrow-19.0.1-cp311-cp311-manylinux_2_28_aarch64.whl", hash = "sha256:4982f8e2b7afd6dae8608d70ba5bd91699077323f812a0448d8b7abdff6cb5d3"},
+    {file = "pyarrow-19.0.1-cp311-cp311-manylinux_2_28_x86_64.whl", hash = "sha256:49a3aecb62c1be1d822f8bf629226d4a96418228a42f5b40835c1f10d42e4db6"},
+    {file = "pyarrow-19.0.1-cp311-cp311-win_amd64.whl", hash = "sha256:008a4009efdb4ea3d2e18f05cd31f9d43c388aad29c636112c2966605ba33466"},
+    {file = "pyarrow-19.0.1-cp312-cp312-macosx_12_0_arm64.whl", hash = "sha256:80b2ad2b193e7d19e81008a96e313fbd53157945c7be9ac65f44f8937a55427b"},
+    {file = "pyarrow-19.0.1-cp312-cp312-macosx_12_0_x86_64.whl", hash = "sha256:ee8dec072569f43835932a3b10c55973593abc00936c202707a4ad06af7cb294"},
+    {file = "pyarrow-19.0.1-cp312-cp312-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:4d5d1ec7ec5324b98887bdc006f4d2ce534e10e60f7ad995e7875ffa0ff9cb14"},
+    {file = "pyarrow-19.0.1-cp312-cp312-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:f3ad4c0eb4e2a9aeb990af6c09e6fa0b195c8c0e7b272ecc8d4d2b6574809d34"},
+    {file = "pyarrow-19.0.1-cp312-cp312-manylinux_2_28_aarch64.whl", hash = "sha256:d383591f3dcbe545f6cc62daaef9c7cdfe0dff0fb9e1c8121101cabe9098cfa6"},
+    {file = "pyarrow-19.0.1-cp312-cp312-manylinux_2_28_x86_64.whl", hash = "sha256:b4c4156a625f1e35d6c0b2132635a237708944eb41df5fbe7d50f20d20c17832"},
+    {file = "pyarrow-19.0.1-cp312-cp312-win_amd64.whl", hash = "sha256:5bd1618ae5e5476b7654c7b55a6364ae87686d4724538c24185bbb2952679960"},
+    {file = "pyarrow-19.0.1-cp313-cp313-macosx_12_0_arm64.whl", hash = "sha256:e45274b20e524ae5c39d7fc1ca2aa923aab494776d2d4b316b49ec7572ca324c"},
+    {file = "pyarrow-19.0.1-cp313-cp313-macosx_12_0_x86_64.whl", hash = "sha256:d9dedeaf19097a143ed6da37f04f4051aba353c95ef507764d344229b2b740ae"},
+    {file = "pyarrow-19.0.1-cp313-cp313-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:6ebfb5171bb5f4a52319344ebbbecc731af3f021e49318c74f33d520d31ae0c4"},
+    {file = "pyarrow-19.0.1-cp313-cp313-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:f2a21d39fbdb948857f67eacb5bbaaf36802de044ec36fbef7a1c8f0dd3a4ab2"},
+    {file = "pyarrow-19.0.1-cp313-cp313-manylinux_2_28_aarch64.whl", hash = "sha256:99bc1bec6d234359743b01e70d4310d0ab240c3d6b0da7e2a93663b0158616f6"},
+    {file = "pyarrow-19.0.1-cp313-cp313-manylinux_2_28_x86_64.whl", hash = "sha256:1b93ef2c93e77c442c979b0d596af45e4665d8b96da598db145b0fec014b9136"},
+    {file = "pyarrow-19.0.1-cp313-cp313-win_amd64.whl", hash = "sha256:d9d46e06846a41ba906ab25302cf0fd522f81aa2a85a71021826f34639ad31ef"},
+    {file = "pyarrow-19.0.1-cp313-cp313t-macosx_12_0_arm64.whl", hash = "sha256:c0fe3dbbf054a00d1f162fda94ce236a899ca01123a798c561ba307ca38af5f0"},
+    {file = "pyarrow-19.0.1-cp313-cp313t-macosx_12_0_x86_64.whl", hash = "sha256:96606c3ba57944d128e8a8399da4812f56c7f61de8c647e3470b417f795d0ef9"},
+    {file = "pyarrow-19.0.1-cp313-cp313t-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:8f04d49a6b64cf24719c080b3c2029a3a5b16417fd5fd7c4041f94233af732f3"},
+    {file = "pyarrow-19.0.1-cp313-cp313t-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:5a9137cf7e1640dce4c190551ee69d478f7121b5c6f323553b319cac936395f6"},
+    {file = "pyarrow-19.0.1-cp313-cp313t-manylinux_2_28_aarch64.whl", hash = "sha256:7c1bca1897c28013db5e4c83944a2ab53231f541b9e0c3f4791206d0c0de389a"},
+    {file = "pyarrow-19.0.1-cp313-cp313t-manylinux_2_28_x86_64.whl", hash = "sha256:58d9397b2e273ef76264b45531e9d552d8ec8a6688b7390b5be44c02a37aade8"},
+    {file = "pyarrow-19.0.1-cp39-cp39-macosx_12_0_arm64.whl", hash = "sha256:b9766a47a9cb56fefe95cb27f535038b5a195707a08bf61b180e642324963b46"},
+    {file = "pyarrow-19.0.1-cp39-cp39-macosx_12_0_x86_64.whl", hash = "sha256:6c5941c1aac89a6c2f2b16cd64fe76bcdb94b2b1e99ca6459de4e6f07638d755"},
+    {file = "pyarrow-19.0.1-cp39-cp39-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:fd44d66093a239358d07c42a91eebf5015aa54fccba959db899f932218ac9cc8"},
+    {file = "pyarrow-19.0.1-cp39-cp39-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:335d170e050bcc7da867a1ed8ffb8b44c57aaa6e0843b156a501298657b1e972"},
+    {file = "pyarrow-19.0.1-cp39-cp39-manylinux_2_28_aarch64.whl", hash = "sha256:1c7556165bd38cf0cd992df2636f8bcdd2d4b26916c6b7e646101aff3c16f76f"},
+    {file = "pyarrow-19.0.1-cp39-cp39-manylinux_2_28_x86_64.whl", hash = "sha256:699799f9c80bebcf1da0983ba86d7f289c5a2a5c04b945e2f2bcf7e874a91911"},
+    {file = "pyarrow-19.0.1-cp39-cp39-win_amd64.whl", hash = "sha256:8464c9fbe6d94a7fe1599e7e8965f350fd233532868232ab2596a71586c5a429"},
+    {file = "pyarrow-19.0.1.tar.gz", hash = "sha256:3bf266b485df66a400f282ac0b6d1b500b9d2ae73314a153dbe97d6d5cc8a99e"},
 ]
 
 [package.extras]
@@ -4756,13 +4755,13 @@ typing-extensions = ">=4.6.0,<4.7.0 || >4.7.0"
 
 [[package]]
 name = "pydantic-settings"
-version = "2.7.1"
+version = "2.8.0"
 description = "Settings management using Pydantic"
 optional = false
 python-versions = ">=3.8"
 files = [
-    {file = "pydantic_settings-2.7.1-py3-none-any.whl", hash = "sha256:590be9e6e24d06db33a4262829edef682500ef008565a969c73d39d5f8bfb3fd"},
-    {file = "pydantic_settings-2.7.1.tar.gz", hash = "sha256:10c9caad35e64bfb3c2fbf70a078c0e25cc92499782e5200747f942a065dec93"},
+    {file = "pydantic_settings-2.8.0-py3-none-any.whl", hash = "sha256:c782c7dc3fb40e97b238e713c25d26f64314aece2e91abcff592fcac15f71820"},
+    {file = "pydantic_settings-2.8.0.tar.gz", hash = "sha256:88e2ca28f6e68ea102c99c3c401d6c9078e68a5df600e97b43891c34e089500a"},
 ]
 
 [package.dependencies]
@@ -4840,13 +4839,13 @@ testutils = ["gitpython (>3)"]
 
 [[package]]
 name = "pymdown-extensions"
-version = "10.14.2"
+version = "10.14.3"
 description = "Extension pack for Python Markdown."
 optional = false
 python-versions = ">=3.8"
 files = [
-    {file = "pymdown_extensions-10.14.2-py3-none-any.whl", hash = "sha256:f45bc5892410e54fd738ab8ccd736098b7ff0cb27fdb4bf24d0a0c6584bc90e1"},
-    {file = "pymdown_extensions-10.14.2.tar.gz", hash = "sha256:7a77b8116dc04193f2c01143760a43387bd9dc4aa05efacb7d838885a7791253"},
+    {file = "pymdown_extensions-10.14.3-py3-none-any.whl", hash = "sha256:05e0bee73d64b9c71a4ae17c72abc2f700e8bc8403755a00580b49a4e9f189e9"},
+    {file = "pymdown_extensions-10.14.3.tar.gz", hash = "sha256:41e576ce3f5d650be59e900e4ceff231e0aed2a88cf30acaee41e02f063a061b"},
 ]
 
 [package.dependencies]
@@ -5073,132 +5072,120 @@ testing = ["filelock"]
 
 [[package]]
 name = "python-bidi"
-version = "0.6.3"
+version = "0.6.6"
 description = "Python Bidi layout wrapping the Rust crate unicode-bidi"
 optional = false
 python-versions = "*"
 files = [
-    {file = "python_bidi-0.6.3-cp310-cp310-macosx_10_12_x86_64.whl", hash = "sha256:7e2a62d7ebb4af9831c85921063154ab4067c73768ad04f466dff1359e6f2650"},
-    {file = "python_bidi-0.6.3-cp310-cp310-macosx_11_0_arm64.whl", hash = "sha256:6b8035f02c3fcb52d372bfe51db00a0c95a3fdd6f0504a32e70d4f799809070d"},
-    {file = "python_bidi-0.6.3-cp310-cp310-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:854edec3ef1ef50c49f689b44900fb6c51d35f277e10b4749755d053f405a44a"},
-    {file = "python_bidi-0.6.3-cp310-cp310-manylinux_2_17_armv7l.manylinux2014_armv7l.whl", hash = "sha256:fe4c4ab61701a5e3b916c6b63811c6fd708539a3f189ec6ca6bd22948a125af0"},
-    {file = "python_bidi-0.6.3-cp310-cp310-manylinux_2_17_ppc64le.manylinux2014_ppc64le.whl", hash = "sha256:855a4dc2d237587a734babc6179130f9e7b7c028651cdead6ec5b162115ac112"},
-    {file = "python_bidi-0.6.3-cp310-cp310-manylinux_2_17_s390x.manylinux2014_s390x.whl", hash = "sha256:3c0635bf46ddd56cf3f71d0711fbc160fd90c36fd3176b3e91b0bf7447e549f1"},
-    {file = "python_bidi-0.6.3-cp310-cp310-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:7a4b7b6e458173614348db8e4a4406e468338c13ecc7b74d1e208d38d0d1d264"},
-    {file = "python_bidi-0.6.3-cp310-cp310-manylinux_2_5_i686.manylinux1_i686.whl", hash = "sha256:25a39a3b61851506ed489867c69f3580ba75063195bf4b00f1983de88e02bf30"},
-    {file = "python_bidi-0.6.3-cp310-cp310-musllinux_1_2_aarch64.whl", hash = "sha256:24ea5c9f5cf9f3919d81669d24a1405709f4d66c82c3ffa7f982fcece856b325"},
-    {file = "python_bidi-0.6.3-cp310-cp310-musllinux_1_2_armv7l.whl", hash = "sha256:631d32fd1414d4795348122b820dadbff1ddaa6e53a70c1ee9d5a84911cc3c2d"},
-    {file = "python_bidi-0.6.3-cp310-cp310-musllinux_1_2_i686.whl", hash = "sha256:205aac547f8166005e041b33069da2c8a345171b0d7c8177c3d16408acde9acd"},
-    {file = "python_bidi-0.6.3-cp310-cp310-musllinux_1_2_x86_64.whl", hash = "sha256:a05249eac27e983a103babb9a2812726312bd8f685fdc3264f78b8ff8124d09a"},
-    {file = "python_bidi-0.6.3-cp310-none-win32.whl", hash = "sha256:44023d51ae78ae119ef11043b5fb8f3dfc5de5ec04d937d7c5abc4da8cba1770"},
-    {file = "python_bidi-0.6.3-cp310-none-win_amd64.whl", hash = "sha256:866865bbbc97a144e74508e2513373bb590d38fca3b6e52b6905de54b34ddbd9"},
-    {file = "python_bidi-0.6.3-cp311-cp311-macosx_10_12_x86_64.whl", hash = "sha256:a656b91c74b77a5b005e6dac092947f00d546cce5d0ca70b6b6741b93f7705bf"},
-    {file = "python_bidi-0.6.3-cp311-cp311-macosx_11_0_arm64.whl", hash = "sha256:4cb80856ce1e3f24c0d878fc85ab767c201ab8891a68f41d8da87eaf39c827de"},
-    {file = "python_bidi-0.6.3-cp311-cp311-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:9ad3f50925a5943d244c6ca05e0553922e917b3cc415580460d86af6a385ee23"},
-    {file = "python_bidi-0.6.3-cp311-cp311-manylinux_2_17_armv7l.manylinux2014_armv7l.whl", hash = "sha256:22f293338ec7d44e02991787d306d39e02f0b145810eef60802abd7833b6c2d0"},
-    {file = "python_bidi-0.6.3-cp311-cp311-manylinux_2_17_ppc64le.manylinux2014_ppc64le.whl", hash = "sha256:12b1d522cbd0af85094ccce8ae95c57a6a9d4f98e85f3e7c1ad1fb5d1c2cd09e"},
-    {file = "python_bidi-0.6.3-cp311-cp311-manylinux_2_17_s390x.manylinux2014_s390x.whl", hash = "sha256:da00726ebf17f857d458b310e868cae4b3bac668396cd5e874e17809894417e5"},
-    {file = "python_bidi-0.6.3-cp311-cp311-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:3b1204f2aa62ac6226f11dd1bee250d428abb128046cf1999317b3f303c70ea2"},
-    {file = "python_bidi-0.6.3-cp311-cp311-manylinux_2_5_i686.manylinux1_i686.whl", hash = "sha256:7c99881440b2a4d8de7c2d7f3ac23e5f0a0ee0c5ae652f53188a21e9b0911f2d"},
-    {file = "python_bidi-0.6.3-cp311-cp311-musllinux_1_2_aarch64.whl", hash = "sha256:10f7c23dbb23dd0d2b0f67f7d4c2ba59eb42f777e1749ed9e13dbc8c4d28ea75"},
-    {file = "python_bidi-0.6.3-cp311-cp311-musllinux_1_2_armv7l.whl", hash = "sha256:d7527247a9d8e0aa9d2d4ecd24cbd8216bc4e3e89e77f9c833eedf278d9761cc"},
-    {file = "python_bidi-0.6.3-cp311-cp311-musllinux_1_2_i686.whl", hash = "sha256:5d6829865ff94925280af066c8536ff9595a6e40d300f9fc0e6ca4ebbf3bc306"},
-    {file = "python_bidi-0.6.3-cp311-cp311-musllinux_1_2_x86_64.whl", hash = "sha256:0e0d574c22fbab1ea996ddb1ebb3eabae521f5d129d7c699445cad81e81bc351"},
-    {file = "python_bidi-0.6.3-cp311-none-win32.whl", hash = "sha256:8c5fc9f065c24bd8058d7e9a5d42415134de3cc1aa480eebc27e2ca132919dd8"},
-    {file = "python_bidi-0.6.3-cp311-none-win_amd64.whl", hash = "sha256:46ee694cf5a632a8d47cc35de6926581e586425b582216962d3e6d913aea0b88"},
-    {file = "python_bidi-0.6.3-cp312-cp312-macosx_10_12_x86_64.whl", hash = "sha256:4bdc9dc1143c558ca6931d6712339a30470959f2b7eecb3d0687db7075c20a87"},
-    {file = "python_bidi-0.6.3-cp312-cp312-macosx_11_0_arm64.whl", hash = "sha256:0775499b8037103278f05b2bf92d25bf04f40a9f77884ec3d42b01a1e52a40fe"},
-    {file = "python_bidi-0.6.3-cp312-cp312-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:eb3091aa5efbfc4da6fd52a2fccbf7853c6dc253ddaf9a189bcf3c4345865aa9"},
-    {file = "python_bidi-0.6.3-cp312-cp312-manylinux_2_17_armv7l.manylinux2014_armv7l.whl", hash = "sha256:c75a9b68b3f5a8da9a33fe37607d9b267a8a3c5806d283a4a47365256773dd1e"},
-    {file = "python_bidi-0.6.3-cp312-cp312-manylinux_2_17_ppc64le.manylinux2014_ppc64le.whl", hash = "sha256:208e09819ee0485c2ed4dc1932c39fc073dac3f2cb70b6d2ae0b7296e86831e6"},
-    {file = "python_bidi-0.6.3-cp312-cp312-manylinux_2_17_s390x.manylinux2014_s390x.whl", hash = "sha256:e17b67d86cd38f2bebc4a46090f83cabb0d1da3a3c920c68efe8093ae1a8d0d1"},
-    {file = "python_bidi-0.6.3-cp312-cp312-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:933a17938f767fa64a8365732eba787a81c26214d89e1b3abe87912325ba26a9"},
-    {file = "python_bidi-0.6.3-cp312-cp312-manylinux_2_5_i686.manylinux1_i686.whl", hash = "sha256:772efb3e0ef17396bfd9d47da4805c74ed6c04f27cac08d7757f76602837fb9d"},
-    {file = "python_bidi-0.6.3-cp312-cp312-musllinux_1_2_aarch64.whl", hash = "sha256:9a99114f33f8c0273a61b4afe7d4d715e098318ee4e5ce8f6bb5da8dcd3f95c7"},
-    {file = "python_bidi-0.6.3-cp312-cp312-musllinux_1_2_armv7l.whl", hash = "sha256:b30e620d39e85a30bb42f460fd8b5274caf261517edeb853b975d9ea1939b6bd"},
-    {file = "python_bidi-0.6.3-cp312-cp312-musllinux_1_2_i686.whl", hash = "sha256:bee94e3152a6c9ba731e086c9cc6203904290506ba52c505a2e59abab481eb13"},
-    {file = "python_bidi-0.6.3-cp312-cp312-musllinux_1_2_x86_64.whl", hash = "sha256:926164ec594e9ea9a64faf54273c711d5e3233bcc6ef8966c6eeaddfb3b3075f"},
-    {file = "python_bidi-0.6.3-cp312-none-win32.whl", hash = "sha256:cea395a7daee14c7d50a7e20890d12b9ff1938d81b23eb564f1707a175c37202"},
-    {file = "python_bidi-0.6.3-cp312-none-win_amd64.whl", hash = "sha256:350e6c76f942465871f2b473a2076f5002f1df06e4c7abee3029ccca5f006786"},
-    {file = "python_bidi-0.6.3-cp313-cp313-macosx_10_12_x86_64.whl", hash = "sha256:617d4391b19969de725922a256599e8218fc9c1ef0ff85884f1698fff482a977"},
-    {file = "python_bidi-0.6.3-cp313-cp313-macosx_11_0_arm64.whl", hash = "sha256:81f418d54948542b21c03cd8ce622a480ead85fc53175a124c4562bdf55cec49"},
-    {file = "python_bidi-0.6.3-cp313-cp313-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:0999b77af58396cfd789c8d068bac78d2d51363265aaf1369622099be9e0eb32"},
-    {file = "python_bidi-0.6.3-cp313-cp313-manylinux_2_17_armv7l.manylinux2014_armv7l.whl", hash = "sha256:f5a0e852e8451147d96876f8233a9db6ed28c914d9767a6696cbc899e7df00c2"},
-    {file = "python_bidi-0.6.3-cp313-cp313-manylinux_2_17_ppc64le.manylinux2014_ppc64le.whl", hash = "sha256:905e212b12c9edfaa3a916a3acd11426b89507ed0f31641257ad586467602e8d"},
-    {file = "python_bidi-0.6.3-cp313-cp313-manylinux_2_17_s390x.manylinux2014_s390x.whl", hash = "sha256:144adab8dc3a8560e294461114ce6dafec1a986cde6297994c1d31b3252f3298"},
-    {file = "python_bidi-0.6.3-cp313-cp313-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:abdbd5c265d64251798243d97228bb78441a1320fe3cf51c9a31191c56407839"},
-    {file = "python_bidi-0.6.3-cp313-cp313-manylinux_2_5_i686.manylinux1_i686.whl", hash = "sha256:65f824a878a593121570ce3da847d3b9ac50521782c433996d7f81f770d3ed00"},
-    {file = "python_bidi-0.6.3-cp313-cp313-musllinux_1_2_aarch64.whl", hash = "sha256:c7dcbc7eb70a0c7c66ed5219213ee2afcc815988cb9e4b134631579c4ae46980"},
-    {file = "python_bidi-0.6.3-cp313-cp313-musllinux_1_2_armv7l.whl", hash = "sha256:ccbf53bc71a0a1b7f77524d1c2e51b245ae23a4f16afb80728071e21c187a768"},
-    {file = "python_bidi-0.6.3-cp313-cp313-musllinux_1_2_i686.whl", hash = "sha256:702527506ca97bf549710ce03d89a2577ebe35e34c42eaecfbacb0862ba06dc6"},
-    {file = "python_bidi-0.6.3-cp313-cp313-musllinux_1_2_x86_64.whl", hash = "sha256:1563a8d9cfaeeeb5b4fc806f52a500b19893c63652bbd497dd6ed9def7b9ee8e"},
-    {file = "python_bidi-0.6.3-cp313-none-win32.whl", hash = "sha256:f9b8e024eeaddecb4ca189e3199181985fab20c224db9a1f08db48b905c9905a"},
-    {file = "python_bidi-0.6.3-cp313-none-win_amd64.whl", hash = "sha256:36b3fb05ef990613a81a23822246eaf6eef29af5182f8d8cdd174be13c92d1cc"},
-    {file = "python_bidi-0.6.3-cp38-cp38-macosx_10_12_x86_64.whl", hash = "sha256:3ef3c351c19348133e78aa4a05bc939f9f11d53c6733c5e8ec160a9fd78c902f"},
-    {file = "python_bidi-0.6.3-cp38-cp38-macosx_11_0_arm64.whl", hash = "sha256:f482f205a62c958273e40c20405141f18c2d0529abb22ba6aa440602655f43a7"},
-    {file = "python_bidi-0.6.3-cp38-cp38-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:982f805714a5ee83b034b8ad6a27f37db994483b72657c7898053333737a5fe3"},
-    {file = "python_bidi-0.6.3-cp38-cp38-manylinux_2_17_armv7l.manylinux2014_armv7l.whl", hash = "sha256:3ee410954d7dc7591106f9526c3ce9893a64345e69edf86d084fe8841e62bfa0"},
-    {file = "python_bidi-0.6.3-cp38-cp38-manylinux_2_17_ppc64le.manylinux2014_ppc64le.whl", hash = "sha256:b4d4a8917804a1c749e92aafb152d239cd25127cea0bb8710b99315266022009"},
-    {file = "python_bidi-0.6.3-cp38-cp38-manylinux_2_17_s390x.manylinux2014_s390x.whl", hash = "sha256:984cb68c5bc7980f9cc66ae2f9d06b7426445b7dfcce4d555ff04333c34d01a6"},
-    {file = "python_bidi-0.6.3-cp38-cp38-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:bedcbab3867227519e2dfee6c3ac26d7722ce6a048f5c72585cf83779b8e61f8"},
-    {file = "python_bidi-0.6.3-cp38-cp38-manylinux_2_5_i686.manylinux1_i686.whl", hash = "sha256:eda3e04c6f54e0e44e55433da0fabab6776c69bcfb1965f09e4bb5b5b4446846"},
-    {file = "python_bidi-0.6.3-cp38-cp38-musllinux_1_2_aarch64.whl", hash = "sha256:2825a720d9dbd8ff6158a458edfbdc55bfd3de3f8181a59c7126f78ef3e27b7b"},
-    {file = "python_bidi-0.6.3-cp38-cp38-musllinux_1_2_armv7l.whl", hash = "sha256:6b5f60865b4d10de024c35d9900efe371844da4a0cda1cb2a4bd35746ba69097"},
-    {file = "python_bidi-0.6.3-cp38-cp38-musllinux_1_2_i686.whl", hash = "sha256:9f859236e69250a0cc857968b8beef749ab4f7b29164cb9a8a3150d094c318fc"},
-    {file = "python_bidi-0.6.3-cp38-cp38-musllinux_1_2_x86_64.whl", hash = "sha256:282c60f86f30ba6263e10427fec528ab17dde97c7a6653c0187d8e2412dec6f4"},
-    {file = "python_bidi-0.6.3-cp38-none-win32.whl", hash = "sha256:5d33d011d334795ff4d5d0de57457a980f76055a338ebabe558e795f9e0fbe63"},
-    {file = "python_bidi-0.6.3-cp38-none-win_amd64.whl", hash = "sha256:535069329c12ea08ad6a3b38c48cba2d912a704dee25566e7a37f2b67be9fece"},
-    {file = "python_bidi-0.6.3-cp39-cp39-macosx_10_12_x86_64.whl", hash = "sha256:d0945a3f116700ebc791911797096afe3e24953927b335c9c818f56475915aef"},
-    {file = "python_bidi-0.6.3-cp39-cp39-macosx_11_0_arm64.whl", hash = "sha256:8eb231d9ab92bfd4a9b7e7282210f02d130d7935ec8cfb1d82d6d53fa858a3de"},
-    {file = "python_bidi-0.6.3-cp39-cp39-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:ce288cb2af08d5242b034ce4e6936e540046a4c5fbccda72610ac67d8b06b5cc"},
-    {file = "python_bidi-0.6.3-cp39-cp39-manylinux_2_17_armv7l.manylinux2014_armv7l.whl", hash = "sha256:304094c931a9ca45a347fa31db9e01b9cbefd48a194950b1441f20ba24ff0d17"},
-    {file = "python_bidi-0.6.3-cp39-cp39-manylinux_2_17_ppc64le.manylinux2014_ppc64le.whl", hash = "sha256:3df42de54d0f0daea931439abefc97da6c642d3665bcde510cd31689230777ff"},
-    {file = "python_bidi-0.6.3-cp39-cp39-manylinux_2_17_s390x.manylinux2014_s390x.whl", hash = "sha256:fc5a29d459deb7ce923cf33283de15776fa8008c55b42e1eed5ba76980cc01f3"},
-    {file = "python_bidi-0.6.3-cp39-cp39-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:ae862fc829ee747b30cce23353b2266c706376c9b1ebfea943d63731eb1a0cbd"},
-    {file = "python_bidi-0.6.3-cp39-cp39-manylinux_2_5_i686.manylinux1_i686.whl", hash = "sha256:a9419c87a7657b1b39497302461c7e501bbfd03442186083007e9a1627656871"},
-    {file = "python_bidi-0.6.3-cp39-cp39-musllinux_1_2_aarch64.whl", hash = "sha256:d352154a636a243235260ecd8dcbd2b73e3e7d1f42c280fdb6802876152f1435"},
-    {file = "python_bidi-0.6.3-cp39-cp39-musllinux_1_2_armv7l.whl", hash = "sha256:04448d5355db4233da49c9f656b43b34fa0467f6b0c8ff766c1543eaed52f974"},
-    {file = "python_bidi-0.6.3-cp39-cp39-musllinux_1_2_i686.whl", hash = "sha256:07eb504fcefc9e9f416f03c089dce23b1ba79d0dd38e976f6f00944d8c708461"},
-    {file = "python_bidi-0.6.3-cp39-cp39-musllinux_1_2_x86_64.whl", hash = "sha256:7e083f0e7391b5672f9e76393d8d111e1bf875f784ad3659776a4881440ebf1c"},
-    {file = "python_bidi-0.6.3-cp39-none-win32.whl", hash = "sha256:a153364706cacaea4f97a63b3d5db780d56b66c0a64f1d202065d3863f782075"},
-    {file = "python_bidi-0.6.3-cp39-none-win_amd64.whl", hash = "sha256:4be0d628b84c2a524d080c653726fba6e518432f33ac970db25c6366b9b71303"},
-    {file = "python_bidi-0.6.3-pp310-pypy310_pp73-macosx_10_12_x86_64.whl", hash = "sha256:28cd25ef6141a77e04a7fb6fef0a19cc307106f84a891777fcdd3306ae8cfc20"},
-    {file = "python_bidi-0.6.3-pp310-pypy310_pp73-macosx_11_0_arm64.whl", hash = "sha256:e4eab3736a14b8d9daea3e8e638ca5a24051497152ba32fb08db9259dd77b858"},
-    {file = "python_bidi-0.6.3-pp310-pypy310_pp73-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:78d12927cab0f6b8304f04c9ed72bc1a2880df8974d8596e40e7e596c6a98b2e"},
-    {file = "python_bidi-0.6.3-pp310-pypy310_pp73-manylinux_2_17_armv7l.manylinux2014_armv7l.whl", hash = "sha256:440be542b334da05673bd94d53ba4922482b06fa3f4daca6c8fa7434afb33e8a"},
-    {file = "python_bidi-0.6.3-pp310-pypy310_pp73-manylinux_2_17_ppc64le.manylinux2014_ppc64le.whl", hash = "sha256:a9635ae0c9ee71b69f11cb6ab9523165c79fdb82ca53afb5afb0d401616fef80"},
-    {file = "python_bidi-0.6.3-pp310-pypy310_pp73-manylinux_2_17_s390x.manylinux2014_s390x.whl", hash = "sha256:1ebac008620916b0c02623926fd80719f2e61e4fa9b626ed1e309a6818b57486"},
-    {file = "python_bidi-0.6.3-pp310-pypy310_pp73-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:57bb5fd4d9ccad52584ce8ad1468ec2e5b535519840ab1debe05c7fe4d32b800"},
-    {file = "python_bidi-0.6.3-pp310-pypy310_pp73-manylinux_2_5_i686.manylinux1_i686.whl", hash = "sha256:1caacb766872c54742cdb8a5c042bec1282c5a3144e4aeba6f8650ab8911d7f3"},
-    {file = "python_bidi-0.6.3-pp310-pypy310_pp73-musllinux_1_2_aarch64.whl", hash = "sha256:584dd7c4617ea0ef39900ef7b06b8c61e6ce3ccb4b90c28ed28fa3bf770c5124"},
-    {file = "python_bidi-0.6.3-pp310-pypy310_pp73-musllinux_1_2_armv7l.whl", hash = "sha256:a3bdc284cc4a1d70942ba0582b91853403c5ca7df79909b755be69089ecc5e17"},
-    {file = "python_bidi-0.6.3-pp310-pypy310_pp73-musllinux_1_2_i686.whl", hash = "sha256:995ed295f2d9095facbef3025d79e209ec7ae1be0d1f385a49818edb2cb4421e"},
-    {file = "python_bidi-0.6.3-pp310-pypy310_pp73-musllinux_1_2_x86_64.whl", hash = "sha256:a50d62f4f1e10682babd529d46e9e62236ff202d3025a223c17ead32035cb410"},
-    {file = "python_bidi-0.6.3-pp38-pypy38_pp73-macosx_10_12_x86_64.whl", hash = "sha256:ea2898279afde47dcfec7a821abb54f7476e5584b655389aa731a50b90f8ea52"},
-    {file = "python_bidi-0.6.3-pp38-pypy38_pp73-macosx_11_0_arm64.whl", hash = "sha256:fe9b6a33f281814dfbf12fe27f35b8780edd6da62ce2a034994f006d6d0184e7"},
-    {file = "python_bidi-0.6.3-pp38-pypy38_pp73-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:435579d0bf2a7e2f872bb5c7254fe89cddfdea6909ed6dc3e8af4ffe1f3f1f18"},
-    {file = "python_bidi-0.6.3-pp38-pypy38_pp73-manylinux_2_17_armv7l.manylinux2014_armv7l.whl", hash = "sha256:f8d76a8452c9fa1ece0a70a7be15a516861c3875bb621e125305d0141ceac8e3"},
-    {file = "python_bidi-0.6.3-pp38-pypy38_pp73-manylinux_2_17_ppc64le.manylinux2014_ppc64le.whl", hash = "sha256:fbf64f5e3f19913f63f34832c0ddef5ea6a772c5dda54907a949e804c20021e3"},
-    {file = "python_bidi-0.6.3-pp38-pypy38_pp73-manylinux_2_17_s390x.manylinux2014_s390x.whl", hash = "sha256:8e226a888e13c9cf1e9f0de0a2ff5c98a50561cada19c0b0c69c76343685ee54"},
-    {file = "python_bidi-0.6.3-pp38-pypy38_pp73-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:308ee73ffaa771048b1ccec37145a2735da9d67df55583c2fc2cb73d78e86a91"},
-    {file = "python_bidi-0.6.3-pp38-pypy38_pp73-manylinux_2_5_i686.manylinux1_i686.whl", hash = "sha256:d85744ddcfeb207bbf6774b7e1a29af6e5e208ed5dbecc5853ec60ed8bc8242f"},
-    {file = "python_bidi-0.6.3-pp38-pypy38_pp73-musllinux_1_2_aarch64.whl", hash = "sha256:40ab8bf2f528a28a70231ce4015d81aea6d8f0a0cdd2bdaf024e9e7849a5ee55"},
-    {file = "python_bidi-0.6.3-pp38-pypy38_pp73-musllinux_1_2_armv7l.whl", hash = "sha256:aa857199f9d797c615a92ae1dec90d443a50373caf7af2cf4e791714afc31b2a"},
-    {file = "python_bidi-0.6.3-pp38-pypy38_pp73-musllinux_1_2_i686.whl", hash = "sha256:197fcd6cb88f021333622f83d7d68e842ab9e2df492ab04e1e84b6de8f15c698"},
-    {file = "python_bidi-0.6.3-pp38-pypy38_pp73-musllinux_1_2_x86_64.whl", hash = "sha256:f832a45f05c15072edf473c6c3b9b164b25a2515f723d42c7400db848c299e59"},
-    {file = "python_bidi-0.6.3-pp39-pypy39_pp73-macosx_10_12_x86_64.whl", hash = "sha256:3b2ee6cf7cadb5d5cc05eca4b8b55a433dab922633faf85b0d19ec2aeed9ad5b"},
-    {file = "python_bidi-0.6.3-pp39-pypy39_pp73-macosx_11_0_arm64.whl", hash = "sha256:835b1d72364618fc8313bfdba2f65ce8e11bd9c1eab01fe9a3c3ec93063cb5b1"},
-    {file = "python_bidi-0.6.3-pp39-pypy39_pp73-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:5f92e0d6771d184bbb7b06645edb069c023f695de312bf78e35efe45e0da7f66"},
-    {file = "python_bidi-0.6.3-pp39-pypy39_pp73-manylinux_2_17_armv7l.manylinux2014_armv7l.whl", hash = "sha256:7a6a3e0e130a0db20c4808242470277045e921b414cd9f545cba67a8c17bb785"},
-    {file = "python_bidi-0.6.3-pp39-pypy39_pp73-manylinux_2_17_ppc64le.manylinux2014_ppc64le.whl", hash = "sha256:e2b2ee73e0f799ed234ed52af258f77a72aca216477d3ef072c59303f1a938c9"},
-    {file = "python_bidi-0.6.3-pp39-pypy39_pp73-manylinux_2_17_s390x.manylinux2014_s390x.whl", hash = "sha256:042d0ee4bb9286b605b252488501bdae6f5b249fe2422fb12e4884aa4dc316d1"},
-    {file = "python_bidi-0.6.3-pp39-pypy39_pp73-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:fa68ef8e955d0d63fe2d9aac4f8b8b9f47869bf98a8773c7322918312dbdd109"},
-    {file = "python_bidi-0.6.3-pp39-pypy39_pp73-manylinux_2_5_i686.manylinux1_i686.whl", hash = "sha256:d07c491c2cede5b022356003070bc8e452a0dcf1d884db4a384e9a3383b9efd3"},
-    {file = "python_bidi-0.6.3-pp39-pypy39_pp73-musllinux_1_2_aarch64.whl", hash = "sha256:6132d661a3bfac2b8cf0d301bcdd59c7cc3e2145ea090b75505816604d8118d5"},
-    {file = "python_bidi-0.6.3-pp39-pypy39_pp73-musllinux_1_2_armv7l.whl", hash = "sha256:61b8a3dc229617b2f8c15165001babf4a199af9001087cad10ded14ec0a028d4"},
-    {file = "python_bidi-0.6.3-pp39-pypy39_pp73-musllinux_1_2_i686.whl", hash = "sha256:5bcab7ac734c5102e90b0f41274b81bdcf55009b05aaa6a653320d63304f20a7"},
-    {file = "python_bidi-0.6.3-pp39-pypy39_pp73-musllinux_1_2_x86_64.whl", hash = "sha256:44560c6abcf3a512e618b52b33bce3d053eaf020c0677d3b4512167715900e66"},
-    {file = "python_bidi-0.6.3.tar.gz", hash = "sha256:e12114969001a328aea859f79efc30ab9c15241befb86e07029d8961d97fae36"},
+    {file = "python_bidi-0.6.6-cp310-cp310-macosx_10_12_x86_64.whl", hash = "sha256:09d4da6b5851d0df01d7313a11d22f308fdfb0e12461f7262e0f55c521ccc0f1"},
+    {file = "python_bidi-0.6.6-cp310-cp310-macosx_11_0_arm64.whl", hash = "sha256:493a844891e23264411b01df58ba77d5dbb0045da3787f4195f50a56bfb847d9"},
+    {file = "python_bidi-0.6.6-cp310-cp310-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:6a4f4c664b2594d2d6be6a31c9254e784d6d5c1b17edfdccb5f0fac317a1cd5e"},
+    {file = "python_bidi-0.6.6-cp310-cp310-manylinux_2_17_armv7l.manylinux2014_armv7l.whl", hash = "sha256:b53b8b061b67908b5b436abede8c450c8d2fa965cb713d541688f552b4cfa3d3"},
+    {file = "python_bidi-0.6.6-cp310-cp310-manylinux_2_17_ppc64le.manylinux2014_ppc64le.whl", hash = "sha256:b144a1b8766fa6a536cc0feb6fdd29d91af7a82a0c09d89db5fc0b79d5678d7d"},
+    {file = "python_bidi-0.6.6-cp310-cp310-manylinux_2_17_s390x.manylinux2014_s390x.whl", hash = "sha256:41fde9b4bb45c0e1b3283599e7539c82624ef8a8d3115da76b06160d923aab09"},
+    {file = "python_bidi-0.6.6-cp310-cp310-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:de020488c334c31916ee7526c1a867bf632516c1c2a0420d14d10b79f00761c7"},
+    {file = "python_bidi-0.6.6-cp310-cp310-manylinux_2_5_i686.manylinux1_i686.whl", hash = "sha256:27cf629a0ef983a25cfd62c6238ee1e742e35552409d5c1b43f6d22945adc4c2"},
+    {file = "python_bidi-0.6.6-cp310-cp310-musllinux_1_2_aarch64.whl", hash = "sha256:9a9de76229ac22cb6bd40b56a8f7f0c42cbdff985dbd14b65bac955acf070594"},
+    {file = "python_bidi-0.6.6-cp310-cp310-musllinux_1_2_armv7l.whl", hash = "sha256:2150ac84f7b15f00f8cd9e29fee7edb4639b7ed2cd9e3d23e2dfd83098f719b7"},
+    {file = "python_bidi-0.6.6-cp310-cp310-musllinux_1_2_i686.whl", hash = "sha256:dc8b0566cef5277f127a80e7546b52393050e5a572f08a352ca220e3f94807cf"},
+    {file = "python_bidi-0.6.6-cp310-cp310-musllinux_1_2_x86_64.whl", hash = "sha256:3564e574db1a0b3826ed6e646dc7206602189c31194d8da412007477ce653174"},
+    {file = "python_bidi-0.6.6-cp310-cp310-win32.whl", hash = "sha256:92eb89f9d8aa0c877cb49fc6356c7f5566e819ea29306992e26be59a5ce468d7"},
+    {file = "python_bidi-0.6.6-cp310-cp310-win_amd64.whl", hash = "sha256:1d627f8cfeba70fe4e0ec27b35615c938a483cbef2d9eb7e1e42400d2196019e"},
+    {file = "python_bidi-0.6.6-cp311-cp311-macosx_10_12_x86_64.whl", hash = "sha256:da4949496e563b51f53ff34aad5a9f4c3aaf06f4180cf3bcb42bec649486c8f1"},
+    {file = "python_bidi-0.6.6-cp311-cp311-macosx_11_0_arm64.whl", hash = "sha256:c48a755ca8ba3f2b242d6795d4a60e83ca580cc4fa270a3aaa8af05d93b7ba7f"},
+    {file = "python_bidi-0.6.6-cp311-cp311-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:76a1cd320993ba3e91a567e97f057a03f2c6b493096b3fff8b5630f51a38e7eb"},
+    {file = "python_bidi-0.6.6-cp311-cp311-manylinux_2_17_armv7l.manylinux2014_armv7l.whl", hash = "sha256:e8bf3e396f9ebe8f4f81e92fa4c98c50160d60c58964b89c8ff4ee0c482befaa"},
+    {file = "python_bidi-0.6.6-cp311-cp311-manylinux_2_17_ppc64le.manylinux2014_ppc64le.whl", hash = "sha256:a2a49b506ed21f762ebf332de6de689bc4912e24dcc3b85f120b34e5f01e541a"},
+    {file = "python_bidi-0.6.6-cp311-cp311-manylinux_2_17_s390x.manylinux2014_s390x.whl", hash = "sha256:3428331e7ce0d58c15b5a57e18a43a12e28f8733086066e6fd75b0ded80e1cae"},
+    {file = "python_bidi-0.6.6-cp311-cp311-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:35adfb9fed3e72b9043a5c00b6ab69e4b33d53d2d8f8b9f60d4df700f77bc2c0"},
+    {file = "python_bidi-0.6.6-cp311-cp311-manylinux_2_5_i686.manylinux1_i686.whl", hash = "sha256:589c5b24a8c4b5e07a1e97654020734bf16ed01a4353911ab663a37aaf1c281d"},
+    {file = "python_bidi-0.6.6-cp311-cp311-musllinux_1_2_aarch64.whl", hash = "sha256:994534e47260d712c3b3291a6ab55b46cdbfd78a879ef95d14b27bceebfd4049"},
+    {file = "python_bidi-0.6.6-cp311-cp311-musllinux_1_2_armv7l.whl", hash = "sha256:00622f54a80826a918b22a2d6d5481bb3f669147e17bac85c81136b6ffbe7c06"},
+    {file = "python_bidi-0.6.6-cp311-cp311-musllinux_1_2_i686.whl", hash = "sha256:965e6f2182e7b9352f2d79221f6c49502a307a9778d7d87d82dc36bb1ffecbab"},
+    {file = "python_bidi-0.6.6-cp311-cp311-musllinux_1_2_x86_64.whl", hash = "sha256:53d7d3a550d176df99dd0bb0cc2da16b40634f11c8b9f5715777441d679c0a62"},
+    {file = "python_bidi-0.6.6-cp311-cp311-win32.whl", hash = "sha256:b271cd05cb40f47eb4600de79a8e47f8579d81ce35f5650b39b7860d018c3ece"},
+    {file = "python_bidi-0.6.6-cp311-cp311-win_amd64.whl", hash = "sha256:4ff1eba0ff87e04bd35d7e164203ad6e5ce19f0bac0bdf673134c0b78d919608"},
+    {file = "python_bidi-0.6.6-cp312-cp312-macosx_10_12_x86_64.whl", hash = "sha256:166060a31c10aa3ffadd52cf10a3c9c2b8d78d844e0f2c5801e2ed511d3ec316"},
+    {file = "python_bidi-0.6.6-cp312-cp312-macosx_11_0_arm64.whl", hash = "sha256:8706addd827840c2c3b3a9963060d9b979b43801cc9be982efa9644facd3ed26"},
+    {file = "python_bidi-0.6.6-cp312-cp312-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:69c02316a4f72a168ea6f66b90d845086e2f2d2de6b08eb32c576db36582177c"},
+    {file = "python_bidi-0.6.6-cp312-cp312-manylinux_2_17_armv7l.manylinux2014_armv7l.whl", hash = "sha256:a525bcb77b8edbfdcf8b199dbed24556e6d1436af8f5fa392f6cdc93ed79b4af"},
+    {file = "python_bidi-0.6.6-cp312-cp312-manylinux_2_17_ppc64le.manylinux2014_ppc64le.whl", hash = "sha256:4bb186c8da4bdc953893504bba93f41d5b412fd767ba5661ff606f22950ec609"},
+    {file = "python_bidi-0.6.6-cp312-cp312-manylinux_2_17_s390x.manylinux2014_s390x.whl", hash = "sha256:25fa21b46dc80ac7099d2dee424b634eb1f76b2308d518e505a626c55cdbf7b1"},
+    {file = "python_bidi-0.6.6-cp312-cp312-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:b31f5562839e7ecea881ba337f9d39716e2e0e6b3ba395e824620ee5060050ff"},
+    {file = "python_bidi-0.6.6-cp312-cp312-manylinux_2_5_i686.manylinux1_i686.whl", hash = "sha256:fb750d3d5ac028e8afd62d000928a2110dbca012fee68b1a325a38caa03dc50b"},
+    {file = "python_bidi-0.6.6-cp312-cp312-musllinux_1_2_aarch64.whl", hash = "sha256:8b5f648ee8e9f4ac0400f71e671934b39837d7031496e0edde867a303344d758"},
+    {file = "python_bidi-0.6.6-cp312-cp312-musllinux_1_2_armv7l.whl", hash = "sha256:c4c0255940e6ff98fb05f9d5de3ffcaab7b60d821d4ca072b50c4f871b036562"},
+    {file = "python_bidi-0.6.6-cp312-cp312-musllinux_1_2_i686.whl", hash = "sha256:e7e36601edda15e67527560b1c00108b0d27831260b6b251cf7c6dd110645c03"},
+    {file = "python_bidi-0.6.6-cp312-cp312-musllinux_1_2_x86_64.whl", hash = "sha256:07c9f000671b187319bacebb9e98d8b75005ccd16aa41b9d4411e66813c467bb"},
+    {file = "python_bidi-0.6.6-cp312-cp312-win32.whl", hash = "sha256:57c0ca449a116c4f804422111b3345281c4e69c733c4556fa216644ec9907078"},
+    {file = "python_bidi-0.6.6-cp312-cp312-win_amd64.whl", hash = "sha256:f60afe457a37bd908fdc7b520c07620b1a7cc006e08b6e3e70474025b4f5e5c7"},
+    {file = "python_bidi-0.6.6-cp313-cp313-macosx_10_12_x86_64.whl", hash = "sha256:61cf12f6b7d0b9bb37838a5f045e6acbd91e838b57f0369c55319bb3969ffa4d"},
+    {file = "python_bidi-0.6.6-cp313-cp313-macosx_11_0_arm64.whl", hash = "sha256:33bd0ba5eedf18315a1475ac0f215b5134e48011b7320aedc2fb97df31d4e5bf"},
+    {file = "python_bidi-0.6.6-cp313-cp313-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:5c9f798dd49b24bb1a9d90f065ef25c7bffa94c04c554f1fc02d0aea0a9b10b0"},
+    {file = "python_bidi-0.6.6-cp313-cp313-manylinux_2_17_armv7l.manylinux2014_armv7l.whl", hash = "sha256:43a0409570c618d93706dc875b1d33b4adfe67144f6f2ebeb32d85d8bbdb85ed"},
+    {file = "python_bidi-0.6.6-cp313-cp313-manylinux_2_17_ppc64le.manylinux2014_ppc64le.whl", hash = "sha256:ada1aecd32773c61b16f7c9f74d9ec1b57ea433e2083e08ca387c5cd4b0ceaed"},
+    {file = "python_bidi-0.6.6-cp313-cp313-manylinux_2_17_s390x.manylinux2014_s390x.whl", hash = "sha256:125a815f2b20313a2f6d331aa84abdd07de7d270985b056e6729390a4cda90df"},
+    {file = "python_bidi-0.6.6-cp313-cp313-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:183fee39bd2de787f632376bd5ba0d5f1daf6a09d3ebfaa211df25d62223e531"},
+    {file = "python_bidi-0.6.6-cp313-cp313-manylinux_2_5_i686.manylinux1_i686.whl", hash = "sha256:c4e08753d32d633f5ecb5eb02624272eeffaa6d5c6f4f9ddf012637bcaabfc0a"},
+    {file = "python_bidi-0.6.6-cp313-cp313-musllinux_1_2_aarch64.whl", hash = "sha256:d1dcd7a82ae00b86821fce627e310791f56da90924f15877cfda844e340679de"},
+    {file = "python_bidi-0.6.6-cp313-cp313-musllinux_1_2_armv7l.whl", hash = "sha256:5506ba56380140b3cb3504029de014d21eb8874c5e081d88495f8775f6ed90bc"},
+    {file = "python_bidi-0.6.6-cp313-cp313-musllinux_1_2_i686.whl", hash = "sha256:207b0a7082ec38045910d37700a0dd73c10d4ffccb22a4fd0391d7e9ce241672"},
+    {file = "python_bidi-0.6.6-cp313-cp313-musllinux_1_2_x86_64.whl", hash = "sha256:686642a52acdeffb1d9a593a284d07b175c63877c596fa3ccceeb2649ced1dd8"},
+    {file = "python_bidi-0.6.6-cp313-cp313-win32.whl", hash = "sha256:485f2ee109e7aa73efc165b90a6d90da52546801413540c08b7133fe729d5e0a"},
+    {file = "python_bidi-0.6.6-cp313-cp313-win_amd64.whl", hash = "sha256:63f7a9eaec31078e7611ab958b6e18e796c05b63ca50c1f7298311dc1e15ac3e"},
+    {file = "python_bidi-0.6.6-cp38-cp38-macosx_10_12_x86_64.whl", hash = "sha256:fe31aa2d2be1c79300bda36b1a3daf8c2dda963539e0c6eedeb9882fc8c15491"},
+    {file = "python_bidi-0.6.6-cp38-cp38-macosx_11_0_arm64.whl", hash = "sha256:f1020fcd3c8f1b93091730e3e16810d3741cbf69c6bacaa9d6a95fb15032848f"},
+    {file = "python_bidi-0.6.6-cp38-cp38-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:bd5b3aa43d5222f1deef9894356a42f2443486501405977cda3aad0f23e20f9d"},
+    {file = "python_bidi-0.6.6-cp38-cp38-manylinux_2_17_armv7l.manylinux2014_armv7l.whl", hash = "sha256:6c84d901fad5fe3b58a329c0b4a5c9d93a2d5430d150ad41f0e1165fc75ff439"},
+    {file = "python_bidi-0.6.6-cp38-cp38-manylinux_2_17_ppc64le.manylinux2014_ppc64le.whl", hash = "sha256:0c298868017614d6b7e0e31293775ebe6622e87009d95e1ecd0abdc1fa5228a2"},
+    {file = "python_bidi-0.6.6-cp38-cp38-manylinux_2_17_s390x.manylinux2014_s390x.whl", hash = "sha256:02255a04e26520b19081f7d378881b39050f5893e2fb4d65da81b849f58f4f76"},
+    {file = "python_bidi-0.6.6-cp38-cp38-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:f1d3e139ca3963201994ee7f45d51dce6015166462cffa025daf95508547e503"},
+    {file = "python_bidi-0.6.6-cp38-cp38-manylinux_2_5_i686.manylinux1_i686.whl", hash = "sha256:e99e9ae745ba283f0230ac50af3f91657dd0b763778f88e4f0cbbc53b3e45d6e"},
+    {file = "python_bidi-0.6.6-cp38-cp38-musllinux_1_2_aarch64.whl", hash = "sha256:91c12d58cec15385817f8b2c7c56de8e37523f05926f2de0e59199d3e50e1516"},
+    {file = "python_bidi-0.6.6-cp38-cp38-musllinux_1_2_armv7l.whl", hash = "sha256:646e83862dadfee00b75c93a930015e9f1cb924b26c34319a75aef65fcb3ddfa"},
+    {file = "python_bidi-0.6.6-cp38-cp38-musllinux_1_2_i686.whl", hash = "sha256:fefea733a1acaaf0c0daba8ccd5e161b9419efb62d8f6f4c679c51ef754ee750"},
+    {file = "python_bidi-0.6.6-cp38-cp38-musllinux_1_2_x86_64.whl", hash = "sha256:b9498ead7f09eee272ff9c45900a8dcdc50a9558e126420a71d15774cc98bb44"},
+    {file = "python_bidi-0.6.6-cp38-cp38-win32.whl", hash = "sha256:e4a6251e212f828bb10ea69e0aa6b92b54f00bf56526b490fe890ca5f4333ec1"},
+    {file = "python_bidi-0.6.6-cp38-cp38-win_amd64.whl", hash = "sha256:53122c3492fe3df871eb682c17eb848e24aa702946622ab78141c7027775519f"},
+    {file = "python_bidi-0.6.6-cp39-cp39-macosx_10_12_x86_64.whl", hash = "sha256:5351efb4e86281eb26c420066fade935cd670c0c0960edc323b80d0b94a0bc19"},
+    {file = "python_bidi-0.6.6-cp39-cp39-macosx_11_0_arm64.whl", hash = "sha256:b8a83f28c104ef3b86ad60219d885b31728eb40c644f414f505068a6ecba3575"},
+    {file = "python_bidi-0.6.6-cp39-cp39-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:825d15e547a9a2da5501966db672d6c8a5a063c041b2741ba32cc9775694b0ff"},
+    {file = "python_bidi-0.6.6-cp39-cp39-manylinux_2_17_armv7l.manylinux2014_armv7l.whl", hash = "sha256:82c7f6bb3dfc4f61aecb2290f1ea24bb2450a5cbc94ee8abe5d6278b67859e0b"},
+    {file = "python_bidi-0.6.6-cp39-cp39-manylinux_2_17_ppc64le.manylinux2014_ppc64le.whl", hash = "sha256:e7edb0d1baf45c70384e700e10d723a13aabe116e14453cbf099eea4dd763e28"},
+    {file = "python_bidi-0.6.6-cp39-cp39-manylinux_2_17_s390x.manylinux2014_s390x.whl", hash = "sha256:4ecfd1d0f6d2927eb2114b55a63b298766b85fc9f0c9aaacb4e8df3e0468538a"},
+    {file = "python_bidi-0.6.6-cp39-cp39-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:534bc7c84159b6e4b777f5fb9122902d6e19223c4242f5b94417de1afcfe2fd9"},
+    {file = "python_bidi-0.6.6-cp39-cp39-manylinux_2_5_i686.manylinux1_i686.whl", hash = "sha256:490f8fe09ed423bfe00531f215e3b87e6000b8170408a0ead6ea5626f644b1d1"},
+    {file = "python_bidi-0.6.6-cp39-cp39-musllinux_1_2_aarch64.whl", hash = "sha256:7906229befa0cea2fe0278a934a27f657b68ce07a2606b1244f814a38b4ab42a"},
+    {file = "python_bidi-0.6.6-cp39-cp39-musllinux_1_2_armv7l.whl", hash = "sha256:2d139bab64962731b5288edb1b6db76060c5a5183187efa590499951cd230b02"},
+    {file = "python_bidi-0.6.6-cp39-cp39-musllinux_1_2_i686.whl", hash = "sha256:4eb3f28ca5e2f7238eaf67126c7634ec35603cbfbbe9b9b340ffee4a3314455f"},
+    {file = "python_bidi-0.6.6-cp39-cp39-musllinux_1_2_x86_64.whl", hash = "sha256:af828457e46b31542569b4391014e6645023f6144de1dabf9fce7e9683235c25"},
+    {file = "python_bidi-0.6.6-cp39-cp39-win32.whl", hash = "sha256:691822fac1d6f3caf12e667dd8b41956485c78b211032747c5f97822ba208726"},
+    {file = "python_bidi-0.6.6-cp39-cp39-win_amd64.whl", hash = "sha256:edae3dd8e595a40d3cdd6ff8b6d9f3860cd17f674792ea05bba5bf5f1b36e5ab"},
+    {file = "python_bidi-0.6.6-pp310-pypy310_pp73-macosx_10_12_x86_64.whl", hash = "sha256:fd9bf9736269ad5cb0d215308fd44e1e02fe591cb9fbb7927d83492358c7ed5f"},
+    {file = "python_bidi-0.6.6-pp310-pypy310_pp73-macosx_11_0_arm64.whl", hash = "sha256:d941a6a8a7159982d904982cfe0feb0a794913c5592d8137ccae0d518b2575e4"},
+    {file = "python_bidi-0.6.6-pp310-pypy310_pp73-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:c0e715b500b09cefccaddb7087978dcd755443b9620aa1cc7b441824253cf2b8"},
+    {file = "python_bidi-0.6.6-pp310-pypy310_pp73-manylinux_2_17_armv7l.manylinux2014_armv7l.whl", hash = "sha256:4142467ec0caa063aca894ca8f1e8a4d9ca6834093c06b0ad5e7aa98dc801079"},
+    {file = "python_bidi-0.6.6-pp310-pypy310_pp73-manylinux_2_17_ppc64le.manylinux2014_ppc64le.whl", hash = "sha256:e2f227ee564e0241e57269043bdfa13025d08d0919b349f5c686e8cfc0540dbf"},
+    {file = "python_bidi-0.6.6-pp310-pypy310_pp73-manylinux_2_17_s390x.manylinux2014_s390x.whl", hash = "sha256:00081439e969c9d9d2ede8eccef4e91397f601931c4f02864edccb760c8f1db5"},
+    {file = "python_bidi-0.6.6-pp310-pypy310_pp73-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:804c74d070f4e85c6976e55cdbb3f4ead5ec5d7ea0cfad8f18f5464be5174ec9"},
+    {file = "python_bidi-0.6.6-pp310-pypy310_pp73-manylinux_2_5_i686.manylinux1_i686.whl", hash = "sha256:0781c3c63b4bc3b37273de2076cb9b875436ae19be0ff04752914d02a4375790"},
+    {file = "python_bidi-0.6.6-pp310-pypy310_pp73-musllinux_1_2_aarch64.whl", hash = "sha256:39eed023add8c53684f1de96cb72b4309cc4d412745f59b5d0dab48e6b88317b"},
+    {file = "python_bidi-0.6.6-pp310-pypy310_pp73-musllinux_1_2_armv7l.whl", hash = "sha256:91a8cb8feac5d0042e2897042fe7bbbeab5dea1ab785f4b7d0c0bbbf6bc7aefd"},
+    {file = "python_bidi-0.6.6-pp310-pypy310_pp73-musllinux_1_2_i686.whl", hash = "sha256:a6ac2a3ec5ccc3736e29bb201f27bd33707bfde774d3d222826aa181552590b2"},
+    {file = "python_bidi-0.6.6-pp310-pypy310_pp73-musllinux_1_2_x86_64.whl", hash = "sha256:6dfa55611022f95058bb7deb2ac20755ae8abbe1104f87515f561e4a56944ba1"},
+    {file = "python_bidi-0.6.6-pp39-pypy39_pp73-macosx_10_12_x86_64.whl", hash = "sha256:a138a7607b459414431a5cdcf5834624d6f87911a8863b51dd363a1e2e5744ab"},
+    {file = "python_bidi-0.6.6-pp39-pypy39_pp73-macosx_11_0_arm64.whl", hash = "sha256:3e17441d31a8665a44f5f42dba7646bbcd3c51ae6657dd019f6a7bb12618b12f"},
+    {file = "python_bidi-0.6.6-pp39-pypy39_pp73-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:7d395e537a34d59e776fcdf50a50786d1a82084849d55cf644f4969ef8156643"},
+    {file = "python_bidi-0.6.6-pp39-pypy39_pp73-manylinux_2_17_armv7l.manylinux2014_armv7l.whl", hash = "sha256:471c1a5fcdbb3de47377d74a7f1017216d9464e5428ca4e66f863e49dca73393"},
+    {file = "python_bidi-0.6.6-pp39-pypy39_pp73-manylinux_2_17_ppc64le.manylinux2014_ppc64le.whl", hash = "sha256:6cc626d2f77cac470b3167a28d4975744f3d99f5eaf8f5c2048ac9c0b9cba9dc"},
+    {file = "python_bidi-0.6.6-pp39-pypy39_pp73-manylinux_2_17_s390x.manylinux2014_s390x.whl", hash = "sha256:87a5489189b0a852da0129df77f0cc8e874b7b1ab1f968a209d340477906f076"},
+    {file = "python_bidi-0.6.6-pp39-pypy39_pp73-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:0eb12b724cc99853e0e0425b54c1c2219492486afaca106c827204b4189504db"},
+    {file = "python_bidi-0.6.6-pp39-pypy39_pp73-manylinux_2_5_i686.manylinux1_i686.whl", hash = "sha256:82e0befbc1078a964c6b6f2f7a616ae8015b52fdcd2f03979abf0fb1f2f18b48"},
+    {file = "python_bidi-0.6.6-pp39-pypy39_pp73-musllinux_1_2_aarch64.whl", hash = "sha256:6255ad385bb90aa39f8340967eef35657e52f8ed011773d37113cafa0ed5eefd"},
+    {file = "python_bidi-0.6.6-pp39-pypy39_pp73-musllinux_1_2_armv7l.whl", hash = "sha256:c07e4d6d8c8f574aa135436207a37bba522443a8490b0ba720b54d343dfde1a7"},
+    {file = "python_bidi-0.6.6-pp39-pypy39_pp73-musllinux_1_2_i686.whl", hash = "sha256:bbbcb28474b71e3ad05d8bd483348efe41fb7dfef6bd3046f3072baa0954d746"},
+    {file = "python_bidi-0.6.6-pp39-pypy39_pp73-musllinux_1_2_x86_64.whl", hash = "sha256:b65b4105998436405a3e6bca60cbf9714f6a08099b16c0cf4752a4a3a70eb45b"},
+    {file = "python_bidi-0.6.6.tar.gz", hash = "sha256:07db4c7da502593bd6e39c07b3a38733704070de0cbf92a7b7277b7be8867dd9"},
 ]
 
 [package.extras]
@@ -5316,40 +5303,40 @@ test = ["coverage (>=5,<6)", "mock (==1.3.0)", "pytest (>=7,<8)", "pytest-mock (
 
 [[package]]
 name = "pytz"
-version = "2024.2"
+version = "2025.1"
 description = "World timezone definitions, modern and historical"
 optional = false
 python-versions = "*"
 files = [
-    {file = "pytz-2024.2-py2.py3-none-any.whl", hash = "sha256:31c7c1817eb7fae7ca4b8c7ee50c72f93aa2dd863de768e1ef4245d426aa0725"},
-    {file = "pytz-2024.2.tar.gz", hash = "sha256:2aa355083c50a0f93fa581709deac0c9ad65cca8a9e9beac660adcbd493c798a"},
+    {file = "pytz-2025.1-py2.py3-none-any.whl", hash = "sha256:89dd22dca55b46eac6eda23b2d72721bf1bdfef212645d81513ef5d03038de57"},
+    {file = "pytz-2025.1.tar.gz", hash = "sha256:c2db42be2a2518b28e65f9207c4d05e6ff547d1efa4086469ef855e4ab70178e"},
 ]
 
 [[package]]
 name = "pywin32"
-version = "307"
+version = "308"
 description = "Python for Window Extensions"
 optional = false
 python-versions = "*"
 files = [
-    {file = "pywin32-307-cp310-cp310-win32.whl", hash = "sha256:f8f25d893c1e1ce2d685ef6d0a481e87c6f510d0f3f117932781f412e0eba31b"},
-    {file = "pywin32-307-cp310-cp310-win_amd64.whl", hash = "sha256:36e650c5e5e6b29b5d317385b02d20803ddbac5d1031e1f88d20d76676dd103d"},
-    {file = "pywin32-307-cp310-cp310-win_arm64.whl", hash = "sha256:0c12d61e0274e0c62acee79e3e503c312426ddd0e8d4899c626cddc1cafe0ff4"},
-    {file = "pywin32-307-cp311-cp311-win32.whl", hash = "sha256:fec5d27cc893178fab299de911b8e4d12c5954e1baf83e8a664311e56a272b75"},
-    {file = "pywin32-307-cp311-cp311-win_amd64.whl", hash = "sha256:987a86971753ed7fdd52a7fb5747aba955b2c7fbbc3d8b76ec850358c1cc28c3"},
-    {file = "pywin32-307-cp311-cp311-win_arm64.whl", hash = "sha256:fd436897c186a2e693cd0437386ed79f989f4d13d6f353f8787ecbb0ae719398"},
-    {file = "pywin32-307-cp312-cp312-win32.whl", hash = "sha256:07649ec6b01712f36debf39fc94f3d696a46579e852f60157a729ac039df0815"},
-    {file = "pywin32-307-cp312-cp312-win_amd64.whl", hash = "sha256:00d047992bb5dcf79f8b9b7c81f72e0130f9fe4b22df613f755ab1cc021d8347"},
-    {file = "pywin32-307-cp312-cp312-win_arm64.whl", hash = "sha256:b53658acbfc6a8241d72cc09e9d1d666be4e6c99376bc59e26cdb6223c4554d2"},
-    {file = "pywin32-307-cp313-cp313-win32.whl", hash = "sha256:ea4d56e48dc1ab2aa0a5e3c0741ad6e926529510516db7a3b6981a1ae74405e5"},
-    {file = "pywin32-307-cp313-cp313-win_amd64.whl", hash = "sha256:576d09813eaf4c8168d0bfd66fb7cb3b15a61041cf41598c2db4a4583bf832d2"},
-    {file = "pywin32-307-cp313-cp313-win_arm64.whl", hash = "sha256:b30c9bdbffda6a260beb2919f918daced23d32c79109412c2085cbc513338a0a"},
-    {file = "pywin32-307-cp37-cp37m-win32.whl", hash = "sha256:5101472f5180c647d4525a0ed289ec723a26231550dbfd369ec19d5faf60e511"},
-    {file = "pywin32-307-cp37-cp37m-win_amd64.whl", hash = "sha256:05de55a7c110478dc4b202230e98af5e0720855360d2b31a44bb4e296d795fba"},
-    {file = "pywin32-307-cp38-cp38-win32.whl", hash = "sha256:13d059fb7f10792542082f5731d5d3d9645320fc38814759313e5ee97c3fac01"},
-    {file = "pywin32-307-cp38-cp38-win_amd64.whl", hash = "sha256:7e0b2f93769d450a98ac7a31a087e07b126b6d571e8b4386a5762eb85325270b"},
-    {file = "pywin32-307-cp39-cp39-win32.whl", hash = "sha256:55ee87f2f8c294e72ad9d4261ca423022310a6e79fb314a8ca76ab3f493854c6"},
-    {file = "pywin32-307-cp39-cp39-win_amd64.whl", hash = "sha256:e9d5202922e74985b037c9ef46778335c102b74b95cec70f629453dbe7235d87"},
+    {file = "pywin32-308-cp310-cp310-win32.whl", hash = "sha256:796ff4426437896550d2981b9c2ac0ffd75238ad9ea2d3bfa67a1abd546d262e"},
+    {file = "pywin32-308-cp310-cp310-win_amd64.whl", hash = "sha256:4fc888c59b3c0bef905ce7eb7e2106a07712015ea1c8234b703a088d46110e8e"},
+    {file = "pywin32-308-cp310-cp310-win_arm64.whl", hash = "sha256:a5ab5381813b40f264fa3495b98af850098f814a25a63589a8e9eb12560f450c"},
+    {file = "pywin32-308-cp311-cp311-win32.whl", hash = "sha256:5d8c8015b24a7d6855b1550d8e660d8daa09983c80e5daf89a273e5c6fb5095a"},
+    {file = "pywin32-308-cp311-cp311-win_amd64.whl", hash = "sha256:575621b90f0dc2695fec346b2d6302faebd4f0f45c05ea29404cefe35d89442b"},
+    {file = "pywin32-308-cp311-cp311-win_arm64.whl", hash = "sha256:100a5442b7332070983c4cd03f2e906a5648a5104b8a7f50175f7906efd16bb6"},
+    {file = "pywin32-308-cp312-cp312-win32.whl", hash = "sha256:587f3e19696f4bf96fde9d8a57cec74a57021ad5f204c9e627e15c33ff568897"},
+    {file = "pywin32-308-cp312-cp312-win_amd64.whl", hash = "sha256:00b3e11ef09ede56c6a43c71f2d31857cf7c54b0ab6e78ac659497abd2834f47"},
+    {file = "pywin32-308-cp312-cp312-win_arm64.whl", hash = "sha256:9b4de86c8d909aed15b7011182c8cab38c8850de36e6afb1f0db22b8959e3091"},
+    {file = "pywin32-308-cp313-cp313-win32.whl", hash = "sha256:1c44539a37a5b7b21d02ab34e6a4d314e0788f1690d65b48e9b0b89f31abbbed"},
+    {file = "pywin32-308-cp313-cp313-win_amd64.whl", hash = "sha256:fd380990e792eaf6827fcb7e187b2b4b1cede0585e3d0c9e84201ec27b9905e4"},
+    {file = "pywin32-308-cp313-cp313-win_arm64.whl", hash = "sha256:ef313c46d4c18dfb82a2431e3051ac8f112ccee1a34f29c263c583c568db63cd"},
+    {file = "pywin32-308-cp37-cp37m-win32.whl", hash = "sha256:1f696ab352a2ddd63bd07430080dd598e6369152ea13a25ebcdd2f503a38f1ff"},
+    {file = "pywin32-308-cp37-cp37m-win_amd64.whl", hash = "sha256:13dcb914ed4347019fbec6697a01a0aec61019c1046c2b905410d197856326a6"},
+    {file = "pywin32-308-cp38-cp38-win32.whl", hash = "sha256:5794e764ebcabf4ff08c555b31bd348c9025929371763b2183172ff4708152f0"},
+    {file = "pywin32-308-cp38-cp38-win_amd64.whl", hash = "sha256:3b92622e29d651c6b783e368ba7d6722b1634b8e70bd376fd7610fe1992e19de"},
+    {file = "pywin32-308-cp39-cp39-win32.whl", hash = "sha256:7873ca4dc60ab3287919881a7d4f88baee4a6e639aa6962de25a98ba6b193341"},
+    {file = "pywin32-308-cp39-cp39-win_amd64.whl", hash = "sha256:71b3322d949b4cc20776436a9c9ba0eeedcbc9c650daa536df63f0ff111bb920"},
 ]
 
 [[package]]
@@ -5789,114 +5776,114 @@ jupyter = ["ipywidgets (>=7.5.1,<9)"]
 
 [[package]]
 name = "rpds-py"
-version = "0.22.3"
+version = "0.23.1"
 description = "Python bindings to Rust's persistent data structures (rpds)"
 optional = false
 python-versions = ">=3.9"
 files = [
-    {file = "rpds_py-0.22.3-cp310-cp310-macosx_10_12_x86_64.whl", hash = "sha256:6c7b99ca52c2c1752b544e310101b98a659b720b21db00e65edca34483259967"},
-    {file = "rpds_py-0.22.3-cp310-cp310-macosx_11_0_arm64.whl", hash = "sha256:be2eb3f2495ba669d2a985f9b426c1797b7d48d6963899276d22f23e33d47e37"},
-    {file = "rpds_py-0.22.3-cp310-cp310-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:70eb60b3ae9245ddea20f8a4190bd79c705a22f8028aaf8bbdebe4716c3fab24"},
-    {file = "rpds_py-0.22.3-cp310-cp310-manylinux_2_17_armv7l.manylinux2014_armv7l.whl", hash = "sha256:4041711832360a9b75cfb11b25a6a97c8fb49c07b8bd43d0d02b45d0b499a4ff"},
-    {file = "rpds_py-0.22.3-cp310-cp310-manylinux_2_17_ppc64le.manylinux2014_ppc64le.whl", hash = "sha256:64607d4cbf1b7e3c3c8a14948b99345eda0e161b852e122c6bb71aab6d1d798c"},
-    {file = "rpds_py-0.22.3-cp310-cp310-manylinux_2_17_s390x.manylinux2014_s390x.whl", hash = "sha256:81e69b0a0e2537f26d73b4e43ad7bc8c8efb39621639b4434b76a3de50c6966e"},
-    {file = "rpds_py-0.22.3-cp310-cp310-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:bc27863442d388870c1809a87507727b799c8460573cfbb6dc0eeaef5a11b5ec"},
-    {file = "rpds_py-0.22.3-cp310-cp310-manylinux_2_5_i686.manylinux1_i686.whl", hash = "sha256:e79dd39f1e8c3504be0607e5fc6e86bb60fe3584bec8b782578c3b0fde8d932c"},
-    {file = "rpds_py-0.22.3-cp310-cp310-musllinux_1_2_aarch64.whl", hash = "sha256:e0fa2d4ec53dc51cf7d3bb22e0aa0143966119f42a0c3e4998293a3dd2856b09"},
-    {file = "rpds_py-0.22.3-cp310-cp310-musllinux_1_2_i686.whl", hash = "sha256:fda7cb070f442bf80b642cd56483b5548e43d366fe3f39b98e67cce780cded00"},
-    {file = "rpds_py-0.22.3-cp310-cp310-musllinux_1_2_x86_64.whl", hash = "sha256:cff63a0272fcd259dcc3be1657b07c929c466b067ceb1c20060e8d10af56f5bf"},
-    {file = "rpds_py-0.22.3-cp310-cp310-win32.whl", hash = "sha256:9bd7228827ec7bb817089e2eb301d907c0d9827a9e558f22f762bb690b131652"},
-    {file = "rpds_py-0.22.3-cp310-cp310-win_amd64.whl", hash = "sha256:9beeb01d8c190d7581a4d59522cd3d4b6887040dcfc744af99aa59fef3e041a8"},
-    {file = "rpds_py-0.22.3-cp311-cp311-macosx_10_12_x86_64.whl", hash = "sha256:d20cfb4e099748ea39e6f7b16c91ab057989712d31761d3300d43134e26e165f"},
-    {file = "rpds_py-0.22.3-cp311-cp311-macosx_11_0_arm64.whl", hash = "sha256:68049202f67380ff9aa52f12e92b1c30115f32e6895cd7198fa2a7961621fc5a"},
-    {file = "rpds_py-0.22.3-cp311-cp311-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:fb4f868f712b2dd4bcc538b0a0c1f63a2b1d584c925e69a224d759e7070a12d5"},
-    {file = "rpds_py-0.22.3-cp311-cp311-manylinux_2_17_armv7l.manylinux2014_armv7l.whl", hash = "sha256:bc51abd01f08117283c5ebf64844a35144a0843ff7b2983e0648e4d3d9f10dbb"},
-    {file = "rpds_py-0.22.3-cp311-cp311-manylinux_2_17_ppc64le.manylinux2014_ppc64le.whl", hash = "sha256:0f3cec041684de9a4684b1572fe28c7267410e02450f4561700ca5a3bc6695a2"},
-    {file = "rpds_py-0.22.3-cp311-cp311-manylinux_2_17_s390x.manylinux2014_s390x.whl", hash = "sha256:7ef9d9da710be50ff6809fed8f1963fecdfecc8b86656cadfca3bc24289414b0"},
-    {file = "rpds_py-0.22.3-cp311-cp311-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:59f4a79c19232a5774aee369a0c296712ad0e77f24e62cad53160312b1c1eaa1"},
-    {file = "rpds_py-0.22.3-cp311-cp311-manylinux_2_5_i686.manylinux1_i686.whl", hash = "sha256:1a60bce91f81ddaac922a40bbb571a12c1070cb20ebd6d49c48e0b101d87300d"},
-    {file = "rpds_py-0.22.3-cp311-cp311-musllinux_1_2_aarch64.whl", hash = "sha256:e89391e6d60251560f0a8f4bd32137b077a80d9b7dbe6d5cab1cd80d2746f648"},
-    {file = "rpds_py-0.22.3-cp311-cp311-musllinux_1_2_i686.whl", hash = "sha256:e3fb866d9932a3d7d0c82da76d816996d1667c44891bd861a0f97ba27e84fc74"},
-    {file = "rpds_py-0.22.3-cp311-cp311-musllinux_1_2_x86_64.whl", hash = "sha256:1352ae4f7c717ae8cba93421a63373e582d19d55d2ee2cbb184344c82d2ae55a"},
-    {file = "rpds_py-0.22.3-cp311-cp311-win32.whl", hash = "sha256:b0b4136a252cadfa1adb705bb81524eee47d9f6aab4f2ee4fa1e9d3cd4581f64"},
-    {file = "rpds_py-0.22.3-cp311-cp311-win_amd64.whl", hash = "sha256:8bd7c8cfc0b8247c8799080fbff54e0b9619e17cdfeb0478ba7295d43f635d7c"},
-    {file = "rpds_py-0.22.3-cp312-cp312-macosx_10_12_x86_64.whl", hash = "sha256:27e98004595899949bd7a7b34e91fa7c44d7a97c40fcaf1d874168bb652ec67e"},
-    {file = "rpds_py-0.22.3-cp312-cp312-macosx_11_0_arm64.whl", hash = "sha256:1978d0021e943aae58b9b0b196fb4895a25cc53d3956b8e35e0b7682eefb6d56"},
-    {file = "rpds_py-0.22.3-cp312-cp312-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:655ca44a831ecb238d124e0402d98f6212ac527a0ba6c55ca26f616604e60a45"},
-    {file = "rpds_py-0.22.3-cp312-cp312-manylinux_2_17_armv7l.manylinux2014_armv7l.whl", hash = "sha256:feea821ee2a9273771bae61194004ee2fc33f8ec7db08117ef9147d4bbcbca8e"},
-    {file = "rpds_py-0.22.3-cp312-cp312-manylinux_2_17_ppc64le.manylinux2014_ppc64le.whl", hash = "sha256:22bebe05a9ffc70ebfa127efbc429bc26ec9e9b4ee4d15a740033efda515cf3d"},
-    {file = "rpds_py-0.22.3-cp312-cp312-manylinux_2_17_s390x.manylinux2014_s390x.whl", hash = "sha256:3af6e48651c4e0d2d166dc1b033b7042ea3f871504b6805ba5f4fe31581d8d38"},
-    {file = "rpds_py-0.22.3-cp312-cp312-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:e67ba3c290821343c192f7eae1d8fd5999ca2dc99994114643e2f2d3e6138b15"},
-    {file = "rpds_py-0.22.3-cp312-cp312-manylinux_2_5_i686.manylinux1_i686.whl", hash = "sha256:02fbb9c288ae08bcb34fb41d516d5eeb0455ac35b5512d03181d755d80810059"},
-    {file = "rpds_py-0.22.3-cp312-cp312-musllinux_1_2_aarch64.whl", hash = "sha256:f56a6b404f74ab372da986d240e2e002769a7d7102cc73eb238a4f72eec5284e"},
-    {file = "rpds_py-0.22.3-cp312-cp312-musllinux_1_2_i686.whl", hash = "sha256:0a0461200769ab3b9ab7e513f6013b7a97fdeee41c29b9db343f3c5a8e2b9e61"},
-    {file = "rpds_py-0.22.3-cp312-cp312-musllinux_1_2_x86_64.whl", hash = "sha256:8633e471c6207a039eff6aa116e35f69f3156b3989ea3e2d755f7bc41754a4a7"},
-    {file = "rpds_py-0.22.3-cp312-cp312-win32.whl", hash = "sha256:593eba61ba0c3baae5bc9be2f5232430453fb4432048de28399ca7376de9c627"},
-    {file = "rpds_py-0.22.3-cp312-cp312-win_amd64.whl", hash = "sha256:d115bffdd417c6d806ea9069237a4ae02f513b778e3789a359bc5856e0404cc4"},
-    {file = "rpds_py-0.22.3-cp313-cp313-macosx_10_12_x86_64.whl", hash = "sha256:ea7433ce7e4bfc3a85654aeb6747babe3f66eaf9a1d0c1e7a4435bbdf27fea84"},
-    {file = "rpds_py-0.22.3-cp313-cp313-macosx_11_0_arm64.whl", hash = "sha256:6dd9412824c4ce1aca56c47b0991e65bebb7ac3f4edccfd3f156150c96a7bf25"},
-    {file = "rpds_py-0.22.3-cp313-cp313-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:20070c65396f7373f5df4005862fa162db5d25d56150bddd0b3e8214e8ef45b4"},
-    {file = "rpds_py-0.22.3-cp313-cp313-manylinux_2_17_armv7l.manylinux2014_armv7l.whl", hash = "sha256:0b09865a9abc0ddff4e50b5ef65467cd94176bf1e0004184eb915cbc10fc05c5"},
-    {file = "rpds_py-0.22.3-cp313-cp313-manylinux_2_17_ppc64le.manylinux2014_ppc64le.whl", hash = "sha256:3453e8d41fe5f17d1f8e9c383a7473cd46a63661628ec58e07777c2fff7196dc"},
-    {file = "rpds_py-0.22.3-cp313-cp313-manylinux_2_17_s390x.manylinux2014_s390x.whl", hash = "sha256:f5d36399a1b96e1a5fdc91e0522544580dbebeb1f77f27b2b0ab25559e103b8b"},
-    {file = "rpds_py-0.22.3-cp313-cp313-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:009de23c9c9ee54bf11303a966edf4d9087cd43a6003672e6aa7def643d06518"},
-    {file = "rpds_py-0.22.3-cp313-cp313-manylinux_2_5_i686.manylinux1_i686.whl", hash = "sha256:1aef18820ef3e4587ebe8b3bc9ba6e55892a6d7b93bac6d29d9f631a3b4befbd"},
-    {file = "rpds_py-0.22.3-cp313-cp313-musllinux_1_2_aarch64.whl", hash = "sha256:f60bd8423be1d9d833f230fdbccf8f57af322d96bcad6599e5a771b151398eb2"},
-    {file = "rpds_py-0.22.3-cp313-cp313-musllinux_1_2_i686.whl", hash = "sha256:62d9cfcf4948683a18a9aff0ab7e1474d407b7bab2ca03116109f8464698ab16"},
-    {file = "rpds_py-0.22.3-cp313-cp313-musllinux_1_2_x86_64.whl", hash = "sha256:9253fc214112405f0afa7db88739294295f0e08466987f1d70e29930262b4c8f"},
-    {file = "rpds_py-0.22.3-cp313-cp313-win32.whl", hash = "sha256:fb0ba113b4983beac1a2eb16faffd76cb41e176bf58c4afe3e14b9c681f702de"},
-    {file = "rpds_py-0.22.3-cp313-cp313-win_amd64.whl", hash = "sha256:c58e2339def52ef6b71b8f36d13c3688ea23fa093353f3a4fee2556e62086ec9"},
-    {file = "rpds_py-0.22.3-cp313-cp313t-macosx_10_12_x86_64.whl", hash = "sha256:f82a116a1d03628a8ace4859556fb39fd1424c933341a08ea3ed6de1edb0283b"},
-    {file = "rpds_py-0.22.3-cp313-cp313t-macosx_11_0_arm64.whl", hash = "sha256:3dfcbc95bd7992b16f3f7ba05af8a64ca694331bd24f9157b49dadeeb287493b"},
-    {file = "rpds_py-0.22.3-cp313-cp313t-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:59259dc58e57b10e7e18ce02c311804c10c5a793e6568f8af4dead03264584d1"},
-    {file = "rpds_py-0.22.3-cp313-cp313t-manylinux_2_17_armv7l.manylinux2014_armv7l.whl", hash = "sha256:5725dd9cc02068996d4438d397e255dcb1df776b7ceea3b9cb972bdb11260a83"},
-    {file = "rpds_py-0.22.3-cp313-cp313t-manylinux_2_17_ppc64le.manylinux2014_ppc64le.whl", hash = "sha256:99b37292234e61325e7a5bb9689e55e48c3f5f603af88b1642666277a81f1fbd"},
-    {file = "rpds_py-0.22.3-cp313-cp313t-manylinux_2_17_s390x.manylinux2014_s390x.whl", hash = "sha256:27b1d3b3915a99208fee9ab092b8184c420f2905b7d7feb4aeb5e4a9c509b8a1"},
-    {file = "rpds_py-0.22.3-cp313-cp313t-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:f612463ac081803f243ff13cccc648578e2279295048f2a8d5eb430af2bae6e3"},
-    {file = "rpds_py-0.22.3-cp313-cp313t-manylinux_2_5_i686.manylinux1_i686.whl", hash = "sha256:f73d3fef726b3243a811121de45193c0ca75f6407fe66f3f4e183c983573e130"},
-    {file = "rpds_py-0.22.3-cp313-cp313t-musllinux_1_2_aarch64.whl", hash = "sha256:3f21f0495edea7fdbaaa87e633a8689cd285f8f4af5c869f27bc8074638ad69c"},
-    {file = "rpds_py-0.22.3-cp313-cp313t-musllinux_1_2_i686.whl", hash = "sha256:1e9663daaf7a63ceccbbb8e3808fe90415b0757e2abddbfc2e06c857bf8c5e2b"},
-    {file = "rpds_py-0.22.3-cp313-cp313t-musllinux_1_2_x86_64.whl", hash = "sha256:a76e42402542b1fae59798fab64432b2d015ab9d0c8c47ba7addddbaf7952333"},
-    {file = "rpds_py-0.22.3-cp313-cp313t-win32.whl", hash = "sha256:69803198097467ee7282750acb507fba35ca22cc3b85f16cf45fb01cb9097730"},
-    {file = "rpds_py-0.22.3-cp313-cp313t-win_amd64.whl", hash = "sha256:f5cf2a0c2bdadf3791b5c205d55a37a54025c6e18a71c71f82bb536cf9a454bf"},
-    {file = "rpds_py-0.22.3-cp39-cp39-macosx_10_12_x86_64.whl", hash = "sha256:378753b4a4de2a7b34063d6f95ae81bfa7b15f2c1a04a9518e8644e81807ebea"},
-    {file = "rpds_py-0.22.3-cp39-cp39-macosx_11_0_arm64.whl", hash = "sha256:3445e07bf2e8ecfeef6ef67ac83de670358abf2996916039b16a218e3d95e97e"},
-    {file = "rpds_py-0.22.3-cp39-cp39-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:7b2513ba235829860b13faa931f3b6846548021846ac808455301c23a101689d"},
-    {file = "rpds_py-0.22.3-cp39-cp39-manylinux_2_17_armv7l.manylinux2014_armv7l.whl", hash = "sha256:eaf16ae9ae519a0e237a0f528fd9f0197b9bb70f40263ee57ae53c2b8d48aeb3"},
-    {file = "rpds_py-0.22.3-cp39-cp39-manylinux_2_17_ppc64le.manylinux2014_ppc64le.whl", hash = "sha256:583f6a1993ca3369e0f80ba99d796d8e6b1a3a2a442dd4e1a79e652116413091"},
-    {file = "rpds_py-0.22.3-cp39-cp39-manylinux_2_17_s390x.manylinux2014_s390x.whl", hash = "sha256:4617e1915a539a0d9a9567795023de41a87106522ff83fbfaf1f6baf8e85437e"},
-    {file = "rpds_py-0.22.3-cp39-cp39-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:0c150c7a61ed4a4f4955a96626574e9baf1adf772c2fb61ef6a5027e52803543"},
-    {file = "rpds_py-0.22.3-cp39-cp39-manylinux_2_5_i686.manylinux1_i686.whl", hash = "sha256:2fa4331c200c2521512595253f5bb70858b90f750d39b8cbfd67465f8d1b596d"},
-    {file = "rpds_py-0.22.3-cp39-cp39-musllinux_1_2_aarch64.whl", hash = "sha256:214b7a953d73b5e87f0ebece4a32a5bd83c60a3ecc9d4ec8f1dca968a2d91e99"},
-    {file = "rpds_py-0.22.3-cp39-cp39-musllinux_1_2_i686.whl", hash = "sha256:f47ad3d5f3258bd7058d2d506852217865afefe6153a36eb4b6928758041d831"},
-    {file = "rpds_py-0.22.3-cp39-cp39-musllinux_1_2_x86_64.whl", hash = "sha256:f276b245347e6e36526cbd4a266a417796fc531ddf391e43574cf6466c492520"},
-    {file = "rpds_py-0.22.3-cp39-cp39-win32.whl", hash = "sha256:bbb232860e3d03d544bc03ac57855cd82ddf19c7a07651a7c0fdb95e9efea8b9"},
-    {file = "rpds_py-0.22.3-cp39-cp39-win_amd64.whl", hash = "sha256:cfbc454a2880389dbb9b5b398e50d439e2e58669160f27b60e5eca11f68ae17c"},
-    {file = "rpds_py-0.22.3-pp310-pypy310_pp73-macosx_10_12_x86_64.whl", hash = "sha256:d48424e39c2611ee1b84ad0f44fb3b2b53d473e65de061e3f460fc0be5f1939d"},
-    {file = "rpds_py-0.22.3-pp310-pypy310_pp73-macosx_11_0_arm64.whl", hash = "sha256:24e8abb5878e250f2eb0d7859a8e561846f98910326d06c0d51381fed59357bd"},
-    {file = "rpds_py-0.22.3-pp310-pypy310_pp73-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:4b232061ca880db21fa14defe219840ad9b74b6158adb52ddf0e87bead9e8493"},
-    {file = "rpds_py-0.22.3-pp310-pypy310_pp73-manylinux_2_17_armv7l.manylinux2014_armv7l.whl", hash = "sha256:ac0a03221cdb5058ce0167ecc92a8c89e8d0decdc9e99a2ec23380793c4dcb96"},
-    {file = "rpds_py-0.22.3-pp310-pypy310_pp73-manylinux_2_17_ppc64le.manylinux2014_ppc64le.whl", hash = "sha256:eb0c341fa71df5a4595f9501df4ac5abfb5a09580081dffbd1ddd4654e6e9123"},
-    {file = "rpds_py-0.22.3-pp310-pypy310_pp73-manylinux_2_17_s390x.manylinux2014_s390x.whl", hash = "sha256:bf9db5488121b596dbfc6718c76092fda77b703c1f7533a226a5a9f65248f8ad"},
-    {file = "rpds_py-0.22.3-pp310-pypy310_pp73-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:0b8db6b5b2d4491ad5b6bdc2bc7c017eec108acbf4e6785f42a9eb0ba234f4c9"},
-    {file = "rpds_py-0.22.3-pp310-pypy310_pp73-manylinux_2_5_i686.manylinux1_i686.whl", hash = "sha256:b3d504047aba448d70cf6fa22e06cb09f7cbd761939fdd47604f5e007675c24e"},
-    {file = "rpds_py-0.22.3-pp310-pypy310_pp73-musllinux_1_2_aarch64.whl", hash = "sha256:e61b02c3f7a1e0b75e20c3978f7135fd13cb6cf551bf4a6d29b999a88830a338"},
-    {file = "rpds_py-0.22.3-pp310-pypy310_pp73-musllinux_1_2_i686.whl", hash = "sha256:e35ba67d65d49080e8e5a1dd40101fccdd9798adb9b050ff670b7d74fa41c566"},
-    {file = "rpds_py-0.22.3-pp310-pypy310_pp73-musllinux_1_2_x86_64.whl", hash = "sha256:26fd7cac7dd51011a245f29a2cc6489c4608b5a8ce8d75661bb4a1066c52dfbe"},
-    {file = "rpds_py-0.22.3-pp310-pypy310_pp73-win_amd64.whl", hash = "sha256:177c7c0fce2855833819c98e43c262007f42ce86651ffbb84f37883308cb0e7d"},
-    {file = "rpds_py-0.22.3-pp39-pypy39_pp73-macosx_10_12_x86_64.whl", hash = "sha256:bb47271f60660803ad11f4c61b42242b8c1312a31c98c578f79ef9387bbde21c"},
-    {file = "rpds_py-0.22.3-pp39-pypy39_pp73-macosx_11_0_arm64.whl", hash = "sha256:70fb28128acbfd264eda9bf47015537ba3fe86e40d046eb2963d75024be4d055"},
-    {file = "rpds_py-0.22.3-pp39-pypy39_pp73-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:44d61b4b7d0c2c9ac019c314e52d7cbda0ae31078aabd0f22e583af3e0d79723"},
-    {file = "rpds_py-0.22.3-pp39-pypy39_pp73-manylinux_2_17_armv7l.manylinux2014_armv7l.whl", hash = "sha256:5f0e260eaf54380380ac3808aa4ebe2d8ca28b9087cf411649f96bad6900c728"},
-    {file = "rpds_py-0.22.3-pp39-pypy39_pp73-manylinux_2_17_ppc64le.manylinux2014_ppc64le.whl", hash = "sha256:b25bc607423935079e05619d7de556c91fb6adeae9d5f80868dde3468657994b"},
-    {file = "rpds_py-0.22.3-pp39-pypy39_pp73-manylinux_2_17_s390x.manylinux2014_s390x.whl", hash = "sha256:fb6116dfb8d1925cbdb52595560584db42a7f664617a1f7d7f6e32f138cdf37d"},
-    {file = "rpds_py-0.22.3-pp39-pypy39_pp73-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:a63cbdd98acef6570c62b92a1e43266f9e8b21e699c363c0fef13bd530799c11"},
-    {file = "rpds_py-0.22.3-pp39-pypy39_pp73-manylinux_2_5_i686.manylinux1_i686.whl", hash = "sha256:2b8f60e1b739a74bab7e01fcbe3dddd4657ec685caa04681df9d562ef15b625f"},
-    {file = "rpds_py-0.22.3-pp39-pypy39_pp73-musllinux_1_2_aarch64.whl", hash = "sha256:2e8b55d8517a2fda8d95cb45d62a5a8bbf9dd0ad39c5b25c8833efea07b880ca"},
-    {file = "rpds_py-0.22.3-pp39-pypy39_pp73-musllinux_1_2_i686.whl", hash = "sha256:2de29005e11637e7a2361fa151f780ff8eb2543a0da1413bb951e9f14b699ef3"},
-    {file = "rpds_py-0.22.3-pp39-pypy39_pp73-musllinux_1_2_x86_64.whl", hash = "sha256:666ecce376999bf619756a24ce15bb14c5bfaf04bf00abc7e663ce17c3f34fe7"},
-    {file = "rpds_py-0.22.3-pp39-pypy39_pp73-win_amd64.whl", hash = "sha256:5246b14ca64a8675e0a7161f7af68fe3e910e6b90542b4bfb5439ba752191df6"},
-    {file = "rpds_py-0.22.3.tar.gz", hash = "sha256:e32fee8ab45d3c2db6da19a5323bc3362237c8b653c70194414b892fd06a080d"},
+    {file = "rpds_py-0.23.1-cp310-cp310-macosx_10_12_x86_64.whl", hash = "sha256:2a54027554ce9b129fc3d633c92fa33b30de9f08bc61b32c053dc9b537266fed"},
+    {file = "rpds_py-0.23.1-cp310-cp310-macosx_11_0_arm64.whl", hash = "sha256:b5ef909a37e9738d146519657a1aab4584018746a18f71c692f2f22168ece40c"},
+    {file = "rpds_py-0.23.1-cp310-cp310-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:3ee9d6f0b38efb22ad94c3b68ffebe4c47865cdf4b17f6806d6c674e1feb4246"},
+    {file = "rpds_py-0.23.1-cp310-cp310-manylinux_2_17_armv7l.manylinux2014_armv7l.whl", hash = "sha256:f7356a6da0562190558c4fcc14f0281db191cdf4cb96e7604c06acfcee96df15"},
+    {file = "rpds_py-0.23.1-cp310-cp310-manylinux_2_17_ppc64le.manylinux2014_ppc64le.whl", hash = "sha256:9441af1d25aed96901f97ad83d5c3e35e6cd21a25ca5e4916c82d7dd0490a4fa"},
+    {file = "rpds_py-0.23.1-cp310-cp310-manylinux_2_17_s390x.manylinux2014_s390x.whl", hash = "sha256:3d8abf7896a91fb97e7977d1aadfcc2c80415d6dc2f1d0fca5b8d0df247248f3"},
+    {file = "rpds_py-0.23.1-cp310-cp310-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:1b08027489ba8fedde72ddd233a5ea411b85a6ed78175f40285bd401bde7466d"},
+    {file = "rpds_py-0.23.1-cp310-cp310-manylinux_2_5_i686.manylinux1_i686.whl", hash = "sha256:fee513135b5a58f3bb6d89e48326cd5aa308e4bcdf2f7d59f67c861ada482bf8"},
+    {file = "rpds_py-0.23.1-cp310-cp310-musllinux_1_2_aarch64.whl", hash = "sha256:35d5631ce0af26318dba0ae0ac941c534453e42f569011585cb323b7774502a5"},
+    {file = "rpds_py-0.23.1-cp310-cp310-musllinux_1_2_i686.whl", hash = "sha256:a20cb698c4a59c534c6701b1c24a968ff2768b18ea2991f886bd8985ce17a89f"},
+    {file = "rpds_py-0.23.1-cp310-cp310-musllinux_1_2_x86_64.whl", hash = "sha256:5e9c206a1abc27e0588cf8b7c8246e51f1a16a103734f7750830a1ccb63f557a"},
+    {file = "rpds_py-0.23.1-cp310-cp310-win32.whl", hash = "sha256:d9f75a06ecc68f159d5d7603b734e1ff6daa9497a929150f794013aa9f6e3f12"},
+    {file = "rpds_py-0.23.1-cp310-cp310-win_amd64.whl", hash = "sha256:f35eff113ad430b5272bbfc18ba111c66ff525828f24898b4e146eb479a2cdda"},
+    {file = "rpds_py-0.23.1-cp311-cp311-macosx_10_12_x86_64.whl", hash = "sha256:b79f5ced71efd70414a9a80bbbfaa7160da307723166f09b69773153bf17c590"},
+    {file = "rpds_py-0.23.1-cp311-cp311-macosx_11_0_arm64.whl", hash = "sha256:c9e799dac1ffbe7b10c1fd42fe4cd51371a549c6e108249bde9cd1200e8f59b4"},
+    {file = "rpds_py-0.23.1-cp311-cp311-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:721f9c4011b443b6e84505fc00cc7aadc9d1743f1c988e4c89353e19c4a968ee"},
+    {file = "rpds_py-0.23.1-cp311-cp311-manylinux_2_17_armv7l.manylinux2014_armv7l.whl", hash = "sha256:f88626e3f5e57432e6191cd0c5d6d6b319b635e70b40be2ffba713053e5147dd"},
+    {file = "rpds_py-0.23.1-cp311-cp311-manylinux_2_17_ppc64le.manylinux2014_ppc64le.whl", hash = "sha256:285019078537949cecd0190f3690a0b0125ff743d6a53dfeb7a4e6787af154f5"},
+    {file = "rpds_py-0.23.1-cp311-cp311-manylinux_2_17_s390x.manylinux2014_s390x.whl", hash = "sha256:b92f5654157de1379c509b15acec9d12ecf6e3bc1996571b6cb82a4302060447"},
+    {file = "rpds_py-0.23.1-cp311-cp311-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:e768267cbe051dd8d1c5305ba690bb153204a09bf2e3de3ae530de955f5b5580"},
+    {file = "rpds_py-0.23.1-cp311-cp311-manylinux_2_5_i686.manylinux1_i686.whl", hash = "sha256:c5334a71f7dc1160382d45997e29f2637c02f8a26af41073189d79b95d3321f1"},
+    {file = "rpds_py-0.23.1-cp311-cp311-musllinux_1_2_aarch64.whl", hash = "sha256:d6adb81564af0cd428910f83fa7da46ce9ad47c56c0b22b50872bc4515d91966"},
+    {file = "rpds_py-0.23.1-cp311-cp311-musllinux_1_2_i686.whl", hash = "sha256:cafa48f2133d4daa028473ede7d81cd1b9f9e6925e9e4003ebdf77010ee02f35"},
+    {file = "rpds_py-0.23.1-cp311-cp311-musllinux_1_2_x86_64.whl", hash = "sha256:0fced9fd4a07a1ded1bac7e961ddd9753dd5d8b755ba8e05acba54a21f5f1522"},
+    {file = "rpds_py-0.23.1-cp311-cp311-win32.whl", hash = "sha256:243241c95174b5fb7204c04595852fe3943cc41f47aa14c3828bc18cd9d3b2d6"},
+    {file = "rpds_py-0.23.1-cp311-cp311-win_amd64.whl", hash = "sha256:11dd60b2ffddba85715d8a66bb39b95ddbe389ad2cfcf42c833f1bcde0878eaf"},
+    {file = "rpds_py-0.23.1-cp312-cp312-macosx_10_12_x86_64.whl", hash = "sha256:3902df19540e9af4cc0c3ae75974c65d2c156b9257e91f5101a51f99136d834c"},
+    {file = "rpds_py-0.23.1-cp312-cp312-macosx_11_0_arm64.whl", hash = "sha256:66f8d2a17e5838dd6fb9be6baaba8e75ae2f5fa6b6b755d597184bfcd3cb0eba"},
+    {file = "rpds_py-0.23.1-cp312-cp312-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:112b8774b0b4ee22368fec42749b94366bd9b536f8f74c3d4175d4395f5cbd31"},
+    {file = "rpds_py-0.23.1-cp312-cp312-manylinux_2_17_armv7l.manylinux2014_armv7l.whl", hash = "sha256:e0df046f2266e8586cf09d00588302a32923eb6386ced0ca5c9deade6af9a149"},
+    {file = "rpds_py-0.23.1-cp312-cp312-manylinux_2_17_ppc64le.manylinux2014_ppc64le.whl", hash = "sha256:0f3288930b947cbebe767f84cf618d2cbe0b13be476e749da0e6a009f986248c"},
+    {file = "rpds_py-0.23.1-cp312-cp312-manylinux_2_17_s390x.manylinux2014_s390x.whl", hash = "sha256:ce473a2351c018b06dd8d30d5da8ab5a0831056cc53b2006e2a8028172c37ce5"},
+    {file = "rpds_py-0.23.1-cp312-cp312-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:d550d7e9e7d8676b183b37d65b5cd8de13676a738973d330b59dc8312df9c5dc"},
+    {file = "rpds_py-0.23.1-cp312-cp312-manylinux_2_5_i686.manylinux1_i686.whl", hash = "sha256:e14f86b871ea74c3fddc9a40e947d6a5d09def5adc2076ee61fb910a9014fb35"},
+    {file = "rpds_py-0.23.1-cp312-cp312-musllinux_1_2_aarch64.whl", hash = "sha256:1bf5be5ba34e19be579ae873da515a2836a2166d8d7ee43be6ff909eda42b72b"},
+    {file = "rpds_py-0.23.1-cp312-cp312-musllinux_1_2_i686.whl", hash = "sha256:d7031d493c4465dbc8d40bd6cafefef4bd472b17db0ab94c53e7909ee781b9ef"},
+    {file = "rpds_py-0.23.1-cp312-cp312-musllinux_1_2_x86_64.whl", hash = "sha256:55ff4151cfd4bc635e51cfb1c59ac9f7196b256b12e3a57deb9e5742e65941ad"},
+    {file = "rpds_py-0.23.1-cp312-cp312-win32.whl", hash = "sha256:a9d3b728f5a5873d84cba997b9d617c6090ca5721caaa691f3b1a78c60adc057"},
+    {file = "rpds_py-0.23.1-cp312-cp312-win_amd64.whl", hash = "sha256:b03a8d50b137ee758e4c73638b10747b7c39988eb8e6cd11abb7084266455165"},
+    {file = "rpds_py-0.23.1-cp313-cp313-macosx_10_12_x86_64.whl", hash = "sha256:4caafd1a22e5eaa3732acb7672a497123354bef79a9d7ceed43387d25025e935"},
+    {file = "rpds_py-0.23.1-cp313-cp313-macosx_11_0_arm64.whl", hash = "sha256:178f8a60fc24511c0eb756af741c476b87b610dba83270fce1e5a430204566a4"},
+    {file = "rpds_py-0.23.1-cp313-cp313-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:c632419c3870507ca20a37c8f8f5352317aca097639e524ad129f58c125c61c6"},
+    {file = "rpds_py-0.23.1-cp313-cp313-manylinux_2_17_armv7l.manylinux2014_armv7l.whl", hash = "sha256:698a79d295626ee292d1730bc2ef6e70a3ab135b1d79ada8fde3ed0047b65a10"},
+    {file = "rpds_py-0.23.1-cp313-cp313-manylinux_2_17_ppc64le.manylinux2014_ppc64le.whl", hash = "sha256:271fa2184cf28bdded86bb6217c8e08d3a169fe0bbe9be5e8d96e8476b707122"},
+    {file = "rpds_py-0.23.1-cp313-cp313-manylinux_2_17_s390x.manylinux2014_s390x.whl", hash = "sha256:b91cceb5add79ee563bd1f70b30896bd63bc5f78a11c1f00a1e931729ca4f1f4"},
+    {file = "rpds_py-0.23.1-cp313-cp313-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:f3a6cb95074777f1ecda2ca4fa7717caa9ee6e534f42b7575a8f0d4cb0c24013"},
+    {file = "rpds_py-0.23.1-cp313-cp313-manylinux_2_5_i686.manylinux1_i686.whl", hash = "sha256:50fb62f8d8364978478b12d5f03bf028c6bc2af04082479299139dc26edf4c64"},
+    {file = "rpds_py-0.23.1-cp313-cp313-musllinux_1_2_aarch64.whl", hash = "sha256:c8f7e90b948dc9dcfff8003f1ea3af08b29c062f681c05fd798e36daa3f7e3e8"},
+    {file = "rpds_py-0.23.1-cp313-cp313-musllinux_1_2_i686.whl", hash = "sha256:5b98b6c953e5c2bda51ab4d5b4f172617d462eebc7f4bfdc7c7e6b423f6da957"},
+    {file = "rpds_py-0.23.1-cp313-cp313-musllinux_1_2_x86_64.whl", hash = "sha256:2893d778d4671ee627bac4037a075168b2673c57186fb1a57e993465dbd79a93"},
+    {file = "rpds_py-0.23.1-cp313-cp313-win32.whl", hash = "sha256:2cfa07c346a7ad07019c33fb9a63cf3acb1f5363c33bc73014e20d9fe8b01cdd"},
+    {file = "rpds_py-0.23.1-cp313-cp313-win_amd64.whl", hash = "sha256:3aaf141d39f45322e44fc2c742e4b8b4098ead5317e5f884770c8df0c332da70"},
+    {file = "rpds_py-0.23.1-cp313-cp313t-macosx_10_12_x86_64.whl", hash = "sha256:759462b2d0aa5a04be5b3e37fb8183615f47014ae6b116e17036b131985cb731"},
+    {file = "rpds_py-0.23.1-cp313-cp313t-macosx_11_0_arm64.whl", hash = "sha256:3e9212f52074fc9d72cf242a84063787ab8e21e0950d4d6709886fb62bcb91d5"},
+    {file = "rpds_py-0.23.1-cp313-cp313t-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:9e9f3a3ac919406bc0414bbbd76c6af99253c507150191ea79fab42fdb35982a"},
+    {file = "rpds_py-0.23.1-cp313-cp313t-manylinux_2_17_armv7l.manylinux2014_armv7l.whl", hash = "sha256:c04ca91dda8a61584165825907f5c967ca09e9c65fe8966ee753a3f2b019fe1e"},
+    {file = "rpds_py-0.23.1-cp313-cp313t-manylinux_2_17_ppc64le.manylinux2014_ppc64le.whl", hash = "sha256:4ab923167cfd945abb9b51a407407cf19f5bee35001221f2911dc85ffd35ff4f"},
+    {file = "rpds_py-0.23.1-cp313-cp313t-manylinux_2_17_s390x.manylinux2014_s390x.whl", hash = "sha256:ed6f011bedca8585787e5082cce081bac3d30f54520097b2411351b3574e1219"},
+    {file = "rpds_py-0.23.1-cp313-cp313t-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:6959bb9928c5c999aba4a3f5a6799d571ddc2c59ff49917ecf55be2bbb4e3722"},
+    {file = "rpds_py-0.23.1-cp313-cp313t-manylinux_2_5_i686.manylinux1_i686.whl", hash = "sha256:1ed7de3c86721b4e83ac440751329ec6a1102229aa18163f84c75b06b525ad7e"},
+    {file = "rpds_py-0.23.1-cp313-cp313t-musllinux_1_2_aarch64.whl", hash = "sha256:5fb89edee2fa237584e532fbf78f0ddd1e49a47c7c8cfa153ab4849dc72a35e6"},
+    {file = "rpds_py-0.23.1-cp313-cp313t-musllinux_1_2_i686.whl", hash = "sha256:7e5413d2e2d86025e73f05510ad23dad5950ab8417b7fc6beaad99be8077138b"},
+    {file = "rpds_py-0.23.1-cp313-cp313t-musllinux_1_2_x86_64.whl", hash = "sha256:d31ed4987d72aabdf521eddfb6a72988703c091cfc0064330b9e5f8d6a042ff5"},
+    {file = "rpds_py-0.23.1-cp313-cp313t-win32.whl", hash = "sha256:f3429fb8e15b20961efca8c8b21432623d85db2228cc73fe22756c6637aa39e7"},
+    {file = "rpds_py-0.23.1-cp313-cp313t-win_amd64.whl", hash = "sha256:d6f6512a90bd5cd9030a6237f5346f046c6f0e40af98657568fa45695d4de59d"},
+    {file = "rpds_py-0.23.1-cp39-cp39-macosx_10_12_x86_64.whl", hash = "sha256:09cd7dbcb673eb60518231e02874df66ec1296c01a4fcd733875755c02014b19"},
+    {file = "rpds_py-0.23.1-cp39-cp39-macosx_11_0_arm64.whl", hash = "sha256:c6760211eee3a76316cf328f5a8bd695b47b1626d21c8a27fb3b2473a884d597"},
+    {file = "rpds_py-0.23.1-cp39-cp39-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:72e680c1518733b73c994361e4b06441b92e973ef7d9449feec72e8ee4f713da"},
+    {file = "rpds_py-0.23.1-cp39-cp39-manylinux_2_17_armv7l.manylinux2014_armv7l.whl", hash = "sha256:ae28144c1daa61366205d32abd8c90372790ff79fc60c1a8ad7fd3c8553a600e"},
+    {file = "rpds_py-0.23.1-cp39-cp39-manylinux_2_17_ppc64le.manylinux2014_ppc64le.whl", hash = "sha256:c698d123ce5d8f2d0cd17f73336615f6a2e3bdcedac07a1291bb4d8e7d82a05a"},
+    {file = "rpds_py-0.23.1-cp39-cp39-manylinux_2_17_s390x.manylinux2014_s390x.whl", hash = "sha256:98b257ae1e83f81fb947a363a274c4eb66640212516becaff7bef09a5dceacaa"},
+    {file = "rpds_py-0.23.1-cp39-cp39-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:5c9ff044eb07c8468594d12602291c635da292308c8c619244e30698e7fc455a"},
+    {file = "rpds_py-0.23.1-cp39-cp39-manylinux_2_5_i686.manylinux1_i686.whl", hash = "sha256:7938c7b0599a05246d704b3f5e01be91a93b411d0d6cc62275f025293b8a11ce"},
+    {file = "rpds_py-0.23.1-cp39-cp39-musllinux_1_2_aarch64.whl", hash = "sha256:e9cb79ecedfc156c0692257ac7ed415243b6c35dd969baa461a6888fc79f2f07"},
+    {file = "rpds_py-0.23.1-cp39-cp39-musllinux_1_2_i686.whl", hash = "sha256:7b77e07233925bd33fc0022b8537774423e4c6680b6436316c5075e79b6384f4"},
+    {file = "rpds_py-0.23.1-cp39-cp39-musllinux_1_2_x86_64.whl", hash = "sha256:a970bfaf130c29a679b1d0a6e0f867483cea455ab1535fb427566a475078f27f"},
+    {file = "rpds_py-0.23.1-cp39-cp39-win32.whl", hash = "sha256:4233df01a250b3984465faed12ad472f035b7cd5240ea3f7c76b7a7016084495"},
+    {file = "rpds_py-0.23.1-cp39-cp39-win_amd64.whl", hash = "sha256:c617d7453a80e29d9973b926983b1e700a9377dbe021faa36041c78537d7b08c"},
+    {file = "rpds_py-0.23.1-pp310-pypy310_pp73-macosx_10_12_x86_64.whl", hash = "sha256:c1f8afa346ccd59e4e5630d5abb67aba6a9812fddf764fd7eb11f382a345f8cc"},
+    {file = "rpds_py-0.23.1-pp310-pypy310_pp73-macosx_11_0_arm64.whl", hash = "sha256:fad784a31869747df4ac968a351e070c06ca377549e4ace94775aaa3ab33ee06"},
+    {file = "rpds_py-0.23.1-pp310-pypy310_pp73-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:b5a96fcac2f18e5a0a23a75cd27ce2656c66c11c127b0318e508aab436b77428"},
+    {file = "rpds_py-0.23.1-pp310-pypy310_pp73-manylinux_2_17_armv7l.manylinux2014_armv7l.whl", hash = "sha256:3e77febf227a1dc3220159355dba68faa13f8dca9335d97504abf428469fb18b"},
+    {file = "rpds_py-0.23.1-pp310-pypy310_pp73-manylinux_2_17_ppc64le.manylinux2014_ppc64le.whl", hash = "sha256:26bb3e8de93443d55e2e748e9fd87deb5f8075ca7bc0502cfc8be8687d69a2ec"},
+    {file = "rpds_py-0.23.1-pp310-pypy310_pp73-manylinux_2_17_s390x.manylinux2014_s390x.whl", hash = "sha256:db7707dde9143a67b8812c7e66aeb2d843fe33cc8e374170f4d2c50bd8f2472d"},
+    {file = "rpds_py-0.23.1-pp310-pypy310_pp73-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:1eedaaccc9bb66581d4ae7c50e15856e335e57ef2734dbc5fd8ba3e2a4ab3cb6"},
+    {file = "rpds_py-0.23.1-pp310-pypy310_pp73-manylinux_2_5_i686.manylinux1_i686.whl", hash = "sha256:28358c54fffadf0ae893f6c1050e8f8853e45df22483b7fff2f6ab6152f5d8bf"},
+    {file = "rpds_py-0.23.1-pp310-pypy310_pp73-musllinux_1_2_aarch64.whl", hash = "sha256:633462ef7e61d839171bf206551d5ab42b30b71cac8f10a64a662536e057fdef"},
+    {file = "rpds_py-0.23.1-pp310-pypy310_pp73-musllinux_1_2_i686.whl", hash = "sha256:a98f510d86f689fcb486dc59e6e363af04151e5260ad1bdddb5625c10f1e95f8"},
+    {file = "rpds_py-0.23.1-pp310-pypy310_pp73-musllinux_1_2_x86_64.whl", hash = "sha256:e0397dd0b3955c61ef9b22838144aa4bef6f0796ba5cc8edfc64d468b93798b4"},
+    {file = "rpds_py-0.23.1-pp310-pypy310_pp73-win_amd64.whl", hash = "sha256:75307599f0d25bf6937248e5ac4e3bde5ea72ae6618623b86146ccc7845ed00b"},
+    {file = "rpds_py-0.23.1-pp39-pypy39_pp73-macosx_10_12_x86_64.whl", hash = "sha256:3614d280bf7aab0d3721b5ce0e73434acb90a2c993121b6e81a1c15c665298ac"},
+    {file = "rpds_py-0.23.1-pp39-pypy39_pp73-macosx_11_0_arm64.whl", hash = "sha256:e5963ea87f88bddf7edd59644a35a0feecf75f8985430124c253612d4f7d27ae"},
+    {file = "rpds_py-0.23.1-pp39-pypy39_pp73-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:ad76f44f70aac3a54ceb1813ca630c53415da3a24fd93c570b2dfb4856591017"},
+    {file = "rpds_py-0.23.1-pp39-pypy39_pp73-manylinux_2_17_armv7l.manylinux2014_armv7l.whl", hash = "sha256:2c6ae11e6e93728d86aafc51ced98b1658a0080a7dd9417d24bfb955bb09c3c2"},
+    {file = "rpds_py-0.23.1-pp39-pypy39_pp73-manylinux_2_17_ppc64le.manylinux2014_ppc64le.whl", hash = "sha256:fc869af5cba24d45fb0399b0cfdbcefcf6910bf4dee5d74036a57cf5264b3ff4"},
+    {file = "rpds_py-0.23.1-pp39-pypy39_pp73-manylinux_2_17_s390x.manylinux2014_s390x.whl", hash = "sha256:c76b32eb2ab650a29e423525e84eb197c45504b1c1e6e17b6cc91fcfeb1a4b1d"},
+    {file = "rpds_py-0.23.1-pp39-pypy39_pp73-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:4263320ed887ed843f85beba67f8b2d1483b5947f2dc73a8b068924558bfeace"},
+    {file = "rpds_py-0.23.1-pp39-pypy39_pp73-manylinux_2_5_i686.manylinux1_i686.whl", hash = "sha256:7f9682a8f71acdf59fd554b82b1c12f517118ee72c0f3944eda461606dfe7eb9"},
+    {file = "rpds_py-0.23.1-pp39-pypy39_pp73-musllinux_1_2_aarch64.whl", hash = "sha256:754fba3084b70162a6b91efceee8a3f06b19e43dac3f71841662053c0584209a"},
+    {file = "rpds_py-0.23.1-pp39-pypy39_pp73-musllinux_1_2_i686.whl", hash = "sha256:a1c66e71ecfd2a4acf0e4bd75e7a3605afa8f9b28a3b497e4ba962719df2be57"},
+    {file = "rpds_py-0.23.1-pp39-pypy39_pp73-musllinux_1_2_x86_64.whl", hash = "sha256:8d67beb6002441faef8251c45e24994de32c4c8686f7356a1f601ad7c466f7c3"},
+    {file = "rpds_py-0.23.1-pp39-pypy39_pp73-win_amd64.whl", hash = "sha256:a1e17d8dc8e57d8e0fd21f8f0f0a5211b3fa258b2e444c2053471ef93fe25a00"},
+    {file = "rpds_py-0.23.1.tar.gz", hash = "sha256:7f3240dcfa14d198dba24b8b9cb3b108c06b68d45b7babd9eefc1038fdf7e707"},
 ]
 
 [[package]]
@@ -6105,51 +6092,57 @@ test = ["array-api-strict", "asv", "gmpy2", "hypothesis (>=6.30)", "mpmath", "po
 
 [[package]]
 name = "scipy"
-version = "1.15.1"
+version = "1.15.2"
 description = "Fundamental algorithms for scientific computing in Python"
 optional = false
 python-versions = ">=3.10"
 files = [
-    {file = "scipy-1.15.1-cp310-cp310-macosx_10_13_x86_64.whl", hash = "sha256:c64ded12dcab08afff9e805a67ff4480f5e69993310e093434b10e85dc9d43e1"},
-    {file = "scipy-1.15.1-cp310-cp310-macosx_12_0_arm64.whl", hash = "sha256:5b190b935e7db569960b48840e5bef71dc513314cc4e79a1b7d14664f57fd4ff"},
-    {file = "scipy-1.15.1-cp310-cp310-macosx_14_0_arm64.whl", hash = "sha256:4b17d4220df99bacb63065c76b0d1126d82bbf00167d1730019d2a30d6ae01ea"},
-    {file = "scipy-1.15.1-cp310-cp310-macosx_14_0_x86_64.whl", hash = "sha256:63b9b6cd0333d0eb1a49de6f834e8aeaefe438df8f6372352084535ad095219e"},
-    {file = "scipy-1.15.1-cp310-cp310-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:9f151e9fb60fbf8e52426132f473221a49362091ce7a5e72f8aa41f8e0da4f25"},
-    {file = "scipy-1.15.1-cp310-cp310-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:21e10b1dd56ce92fba3e786007322542361984f8463c6d37f6f25935a5a6ef52"},
-    {file = "scipy-1.15.1-cp310-cp310-musllinux_1_2_x86_64.whl", hash = "sha256:5dff14e75cdbcf07cdaa1c7707db6017d130f0af9ac41f6ce443a93318d6c6e0"},
-    {file = "scipy-1.15.1-cp310-cp310-win_amd64.whl", hash = "sha256:f82fcf4e5b377f819542fbc8541f7b5fbcf1c0017d0df0bc22c781bf60abc4d8"},
-    {file = "scipy-1.15.1-cp311-cp311-macosx_10_13_x86_64.whl", hash = "sha256:5bd8d27d44e2c13d0c1124e6a556454f52cd3f704742985f6b09e75e163d20d2"},
-    {file = "scipy-1.15.1-cp311-cp311-macosx_12_0_arm64.whl", hash = "sha256:be3deeb32844c27599347faa077b359584ba96664c5c79d71a354b80a0ad0ce0"},
-    {file = "scipy-1.15.1-cp311-cp311-macosx_14_0_arm64.whl", hash = "sha256:5eb0ca35d4b08e95da99a9f9c400dc9f6c21c424298a0ba876fdc69c7afacedf"},
-    {file = "scipy-1.15.1-cp311-cp311-macosx_14_0_x86_64.whl", hash = "sha256:74bb864ff7640dea310a1377d8567dc2cb7599c26a79ca852fc184cc851954ac"},
-    {file = "scipy-1.15.1-cp311-cp311-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:667f950bf8b7c3a23b4199db24cb9bf7512e27e86d0e3813f015b74ec2c6e3df"},
-    {file = "scipy-1.15.1-cp311-cp311-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:395be70220d1189756068b3173853029a013d8c8dd5fd3d1361d505b2aa58fa7"},
-    {file = "scipy-1.15.1-cp311-cp311-musllinux_1_2_x86_64.whl", hash = "sha256:ce3a000cd28b4430426db2ca44d96636f701ed12e2b3ca1f2b1dd7abdd84b39a"},
-    {file = "scipy-1.15.1-cp311-cp311-win_amd64.whl", hash = "sha256:3fe1d95944f9cf6ba77aa28b82dd6bb2a5b52f2026beb39ecf05304b8392864b"},
-    {file = "scipy-1.15.1-cp312-cp312-macosx_10_13_x86_64.whl", hash = "sha256:c09aa9d90f3500ea4c9b393ee96f96b0ccb27f2f350d09a47f533293c78ea776"},
-    {file = "scipy-1.15.1-cp312-cp312-macosx_12_0_arm64.whl", hash = "sha256:0ac102ce99934b162914b1e4a6b94ca7da0f4058b6d6fd65b0cef330c0f3346f"},
-    {file = "scipy-1.15.1-cp312-cp312-macosx_14_0_arm64.whl", hash = "sha256:09c52320c42d7f5c7748b69e9f0389266fd4f82cf34c38485c14ee976cb8cb04"},
-    {file = "scipy-1.15.1-cp312-cp312-macosx_14_0_x86_64.whl", hash = "sha256:cdde8414154054763b42b74fe8ce89d7f3d17a7ac5dd77204f0e142cdc9239e9"},
-    {file = "scipy-1.15.1-cp312-cp312-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:4c9d8fc81d6a3b6844235e6fd175ee1d4c060163905a2becce8e74cb0d7554ce"},
-    {file = "scipy-1.15.1-cp312-cp312-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:0fb57b30f0017d4afa5fe5f5b150b8f807618819287c21cbe51130de7ccdaed2"},
-    {file = "scipy-1.15.1-cp312-cp312-musllinux_1_2_x86_64.whl", hash = "sha256:491d57fe89927fa1aafbe260f4cfa5ffa20ab9f1435025045a5315006a91b8f5"},
-    {file = "scipy-1.15.1-cp312-cp312-win_amd64.whl", hash = "sha256:900f3fa3db87257510f011c292a5779eb627043dd89731b9c461cd16ef76ab3d"},
-    {file = "scipy-1.15.1-cp313-cp313-macosx_10_13_x86_64.whl", hash = "sha256:100193bb72fbff37dbd0bf14322314fc7cbe08b7ff3137f11a34d06dc0ee6b85"},
-    {file = "scipy-1.15.1-cp313-cp313-macosx_12_0_arm64.whl", hash = "sha256:2114a08daec64980e4b4cbdf5bee90935af66d750146b1d2feb0d3ac30613692"},
-    {file = "scipy-1.15.1-cp313-cp313-macosx_14_0_arm64.whl", hash = "sha256:6b3e71893c6687fc5e29208d518900c24ea372a862854c9888368c0b267387ab"},
-    {file = "scipy-1.15.1-cp313-cp313-macosx_14_0_x86_64.whl", hash = "sha256:837299eec3d19b7e042923448d17d95a86e43941104d33f00da7e31a0f715d3c"},
-    {file = "scipy-1.15.1-cp313-cp313-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:82add84e8a9fb12af5c2c1a3a3f1cb51849d27a580cb9e6bd66226195142be6e"},
-    {file = "scipy-1.15.1-cp313-cp313-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:070d10654f0cb6abd295bc96c12656f948e623ec5f9a4eab0ddb1466c000716e"},
-    {file = "scipy-1.15.1-cp313-cp313-musllinux_1_2_x86_64.whl", hash = "sha256:55cc79ce4085c702ac31e49b1e69b27ef41111f22beafb9b49fea67142b696c4"},
-    {file = "scipy-1.15.1-cp313-cp313-win_amd64.whl", hash = "sha256:c352c1b6d7cac452534517e022f8f7b8d139cd9f27e6fbd9f3cbd0bfd39f5bef"},
-    {file = "scipy-1.15.1-cp313-cp313t-macosx_10_13_x86_64.whl", hash = "sha256:0458839c9f873062db69a03de9a9765ae2e694352c76a16be44f93ea45c28d2b"},
-    {file = "scipy-1.15.1-cp313-cp313t-macosx_12_0_arm64.whl", hash = "sha256:af0b61c1de46d0565b4b39c6417373304c1d4f5220004058bdad3061c9fa8a95"},
-    {file = "scipy-1.15.1-cp313-cp313t-macosx_14_0_arm64.whl", hash = "sha256:71ba9a76c2390eca6e359be81a3e879614af3a71dfdabb96d1d7ab33da6f2364"},
-    {file = "scipy-1.15.1-cp313-cp313t-macosx_14_0_x86_64.whl", hash = "sha256:14eaa373c89eaf553be73c3affb11ec6c37493b7eaaf31cf9ac5dffae700c2e0"},
-    {file = "scipy-1.15.1-cp313-cp313t-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:f735bc41bd1c792c96bc426dece66c8723283695f02df61dcc4d0a707a42fc54"},
-    {file = "scipy-1.15.1-cp313-cp313t-musllinux_1_2_x86_64.whl", hash = "sha256:2722a021a7929d21168830790202a75dbb20b468a8133c74a2c0230c72626b6c"},
-    {file = "scipy-1.15.1-cp313-cp313t-win_amd64.whl", hash = "sha256:bc7136626261ac1ed988dca56cfc4ab5180f75e0ee52e58f1e6aa74b5f3eacd5"},
-    {file = "scipy-1.15.1.tar.gz", hash = "sha256:033a75ddad1463970c96a88063a1df87ccfddd526437136b6ee81ff0312ebdf6"},
+    {file = "scipy-1.15.2-cp310-cp310-macosx_10_13_x86_64.whl", hash = "sha256:a2ec871edaa863e8213ea5df811cd600734f6400b4af272e1c011e69401218e9"},
+    {file = "scipy-1.15.2-cp310-cp310-macosx_12_0_arm64.whl", hash = "sha256:6f223753c6ea76983af380787611ae1291e3ceb23917393079dcc746ba60cfb5"},
+    {file = "scipy-1.15.2-cp310-cp310-macosx_14_0_arm64.whl", hash = "sha256:ecf797d2d798cf7c838c6d98321061eb3e72a74710e6c40540f0e8087e3b499e"},
+    {file = "scipy-1.15.2-cp310-cp310-macosx_14_0_x86_64.whl", hash = "sha256:9b18aa747da280664642997e65aab1dd19d0c3d17068a04b3fe34e2559196cb9"},
+    {file = "scipy-1.15.2-cp310-cp310-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:87994da02e73549dfecaed9e09a4f9d58a045a053865679aeb8d6d43747d4df3"},
+    {file = "scipy-1.15.2-cp310-cp310-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:69ea6e56d00977f355c0f84eba69877b6df084516c602d93a33812aa04d90a3d"},
+    {file = "scipy-1.15.2-cp310-cp310-musllinux_1_2_aarch64.whl", hash = "sha256:888307125ea0c4466287191e5606a2c910963405ce9671448ff9c81c53f85f58"},
+    {file = "scipy-1.15.2-cp310-cp310-musllinux_1_2_x86_64.whl", hash = "sha256:9412f5e408b397ff5641080ed1e798623dbe1ec0d78e72c9eca8992976fa65aa"},
+    {file = "scipy-1.15.2-cp310-cp310-win_amd64.whl", hash = "sha256:b5e025e903b4f166ea03b109bb241355b9c42c279ea694d8864d033727205e65"},
+    {file = "scipy-1.15.2-cp311-cp311-macosx_10_13_x86_64.whl", hash = "sha256:92233b2df6938147be6fa8824b8136f29a18f016ecde986666be5f4d686a91a4"},
+    {file = "scipy-1.15.2-cp311-cp311-macosx_12_0_arm64.whl", hash = "sha256:62ca1ff3eb513e09ed17a5736929429189adf16d2d740f44e53270cc800ecff1"},
+    {file = "scipy-1.15.2-cp311-cp311-macosx_14_0_arm64.whl", hash = "sha256:4c6676490ad76d1c2894d77f976144b41bd1a4052107902238047fb6a473e971"},
+    {file = "scipy-1.15.2-cp311-cp311-macosx_14_0_x86_64.whl", hash = "sha256:a8bf5cb4a25046ac61d38f8d3c3426ec11ebc350246a4642f2f315fe95bda655"},
+    {file = "scipy-1.15.2-cp311-cp311-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:6a8e34cf4c188b6dd004654f88586d78f95639e48a25dfae9c5e34a6dc34547e"},
+    {file = "scipy-1.15.2-cp311-cp311-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:28a0d2c2075946346e4408b211240764759e0fabaeb08d871639b5f3b1aca8a0"},
+    {file = "scipy-1.15.2-cp311-cp311-musllinux_1_2_aarch64.whl", hash = "sha256:42dabaaa798e987c425ed76062794e93a243be8f0f20fff6e7a89f4d61cb3d40"},
+    {file = "scipy-1.15.2-cp311-cp311-musllinux_1_2_x86_64.whl", hash = "sha256:6f5e296ec63c5da6ba6fa0343ea73fd51b8b3e1a300b0a8cae3ed4b1122c7462"},
+    {file = "scipy-1.15.2-cp311-cp311-win_amd64.whl", hash = "sha256:597a0c7008b21c035831c39927406c6181bcf8f60a73f36219b69d010aa04737"},
+    {file = "scipy-1.15.2-cp312-cp312-macosx_10_13_x86_64.whl", hash = "sha256:c4697a10da8f8765bb7c83e24a470da5797e37041edfd77fd95ba3811a47c4fd"},
+    {file = "scipy-1.15.2-cp312-cp312-macosx_12_0_arm64.whl", hash = "sha256:869269b767d5ee7ea6991ed7e22b3ca1f22de73ab9a49c44bad338b725603301"},
+    {file = "scipy-1.15.2-cp312-cp312-macosx_14_0_arm64.whl", hash = "sha256:bad78d580270a4d32470563ea86c6590b465cb98f83d760ff5b0990cb5518a93"},
+    {file = "scipy-1.15.2-cp312-cp312-macosx_14_0_x86_64.whl", hash = "sha256:b09ae80010f52efddb15551025f9016c910296cf70adbf03ce2a8704f3a5ad20"},
+    {file = "scipy-1.15.2-cp312-cp312-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:5a6fd6eac1ce74a9f77a7fc724080d507c5812d61e72bd5e4c489b042455865e"},
+    {file = "scipy-1.15.2-cp312-cp312-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:2b871df1fe1a3ba85d90e22742b93584f8d2b8e6124f8372ab15c71b73e428b8"},
+    {file = "scipy-1.15.2-cp312-cp312-musllinux_1_2_aarch64.whl", hash = "sha256:03205d57a28e18dfd39f0377d5002725bf1f19a46f444108c29bdb246b6c8a11"},
+    {file = "scipy-1.15.2-cp312-cp312-musllinux_1_2_x86_64.whl", hash = "sha256:601881dfb761311045b03114c5fe718a12634e5608c3b403737ae463c9885d53"},
+    {file = "scipy-1.15.2-cp312-cp312-win_amd64.whl", hash = "sha256:e7c68b6a43259ba0aab737237876e5c2c549a031ddb7abc28c7b47f22e202ded"},
+    {file = "scipy-1.15.2-cp313-cp313-macosx_10_13_x86_64.whl", hash = "sha256:01edfac9f0798ad6b46d9c4c9ca0e0ad23dbf0b1eb70e96adb9fa7f525eff0bf"},
+    {file = "scipy-1.15.2-cp313-cp313-macosx_12_0_arm64.whl", hash = "sha256:08b57a9336b8e79b305a143c3655cc5bdbe6d5ece3378578888d2afbb51c4e37"},
+    {file = "scipy-1.15.2-cp313-cp313-macosx_14_0_arm64.whl", hash = "sha256:54c462098484e7466362a9f1672d20888f724911a74c22ae35b61f9c5919183d"},
+    {file = "scipy-1.15.2-cp313-cp313-macosx_14_0_x86_64.whl", hash = "sha256:cf72ff559a53a6a6d77bd8eefd12a17995ffa44ad86c77a5df96f533d4e6c6bb"},
+    {file = "scipy-1.15.2-cp313-cp313-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:9de9d1416b3d9e7df9923ab23cd2fe714244af10b763975bea9e4f2e81cebd27"},
+    {file = "scipy-1.15.2-cp313-cp313-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:fb530e4794fc8ea76a4a21ccb67dea33e5e0e60f07fc38a49e821e1eae3b71a0"},
+    {file = "scipy-1.15.2-cp313-cp313-musllinux_1_2_aarch64.whl", hash = "sha256:5ea7ed46d437fc52350b028b1d44e002646e28f3e8ddc714011aaf87330f2f32"},
+    {file = "scipy-1.15.2-cp313-cp313-musllinux_1_2_x86_64.whl", hash = "sha256:11e7ad32cf184b74380f43d3c0a706f49358b904fa7d5345f16ddf993609184d"},
+    {file = "scipy-1.15.2-cp313-cp313-win_amd64.whl", hash = "sha256:a5080a79dfb9b78b768cebf3c9dcbc7b665c5875793569f48bf0e2b1d7f68f6f"},
+    {file = "scipy-1.15.2-cp313-cp313t-macosx_10_13_x86_64.whl", hash = "sha256:447ce30cee6a9d5d1379087c9e474628dab3db4a67484be1b7dc3196bfb2fac9"},
+    {file = "scipy-1.15.2-cp313-cp313t-macosx_12_0_arm64.whl", hash = "sha256:c90ebe8aaa4397eaefa8455a8182b164a6cc1d59ad53f79943f266d99f68687f"},
+    {file = "scipy-1.15.2-cp313-cp313t-macosx_14_0_arm64.whl", hash = "sha256:def751dd08243934c884a3221156d63e15234a3155cf25978b0a668409d45eb6"},
+    {file = "scipy-1.15.2-cp313-cp313t-macosx_14_0_x86_64.whl", hash = "sha256:302093e7dfb120e55515936cb55618ee0b895f8bcaf18ff81eca086c17bd80af"},
+    {file = "scipy-1.15.2-cp313-cp313t-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:7cd5b77413e1855351cdde594eca99c1f4a588c2d63711388b6a1f1c01f62274"},
+    {file = "scipy-1.15.2-cp313-cp313t-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:6d0194c37037707b2afa7a2f2a924cf7bac3dc292d51b6a925e5fcb89bc5c776"},
+    {file = "scipy-1.15.2-cp313-cp313t-musllinux_1_2_aarch64.whl", hash = "sha256:bae43364d600fdc3ac327db99659dcb79e6e7ecd279a75fe1266669d9a652828"},
+    {file = "scipy-1.15.2-cp313-cp313t-musllinux_1_2_x86_64.whl", hash = "sha256:f031846580d9acccd0044efd1a90e6f4df3a6e12b4b6bd694a7bc03a89892b28"},
+    {file = "scipy-1.15.2-cp313-cp313t-win_amd64.whl", hash = "sha256:fe8a9eb875d430d81755472c5ba75e84acc980e4a8f6204d402849234d3017db"},
+    {file = "scipy-1.15.2.tar.gz", hash = "sha256:cd58a314d92838f7e6f755c8a2167ead4f27e1fd5c1251fd54289569ef3495ec"},
 ]
 
 [package.dependencies]
@@ -6230,13 +6223,13 @@ train = ["accelerate (>=0.20.3)", "datasets"]
 
 [[package]]
 name = "setuptools"
-version = "75.8.0"
+version = "75.8.1"
 description = "Easily download, build, install, upgrade, and uninstall Python packages"
 optional = false
 python-versions = ">=3.9"
 files = [
-    {file = "setuptools-75.8.0-py3-none-any.whl", hash = "sha256:e3982f444617239225d675215d51f6ba05f845d4eec313da4418fdbb56fb27e3"},
-    {file = "setuptools-75.8.0.tar.gz", hash = "sha256:c5afc8f407c626b8313a86e10311dd3f661c6cd9c09d4bf8c15c0e11f9f2b0e6"},
+    {file = "setuptools-75.8.1-py3-none-any.whl", hash = "sha256:3bc32c0b84c643299ca94e77f834730f126efd621de0cc1de64119e0e17dab1f"},
+    {file = "setuptools-75.8.1.tar.gz", hash = "sha256:65fb779a8f28895242923582eadca2337285f0891c2c9e160754df917c3d2530"},
 ]
 
 [package.extras]
@@ -6250,53 +6243,53 @@ type = ["importlib_metadata (>=7.0.2)", "jaraco.develop (>=7.21)", "mypy (==1.14
 
 [[package]]
 name = "shapely"
-version = "2.0.6"
+version = "2.0.7"
 description = "Manipulation and analysis of geometric objects"
 optional = false
 python-versions = ">=3.7"
 files = [
-    {file = "shapely-2.0.6-cp310-cp310-macosx_10_9_x86_64.whl", hash = "sha256:29a34e068da2d321e926b5073539fd2a1d4429a2c656bd63f0bd4c8f5b236d0b"},
-    {file = "shapely-2.0.6-cp310-cp310-macosx_11_0_arm64.whl", hash = "sha256:e1c84c3f53144febf6af909d6b581bc05e8785d57e27f35ebaa5c1ab9baba13b"},
-    {file = "shapely-2.0.6-cp310-cp310-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:2ad2fae12dca8d2b727fa12b007e46fbc522148a584f5d6546c539f3464dccde"},
-    {file = "shapely-2.0.6-cp310-cp310-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:b3304883bd82d44be1b27a9d17f1167fda8c7f5a02a897958d86c59ec69b705e"},
-    {file = "shapely-2.0.6-cp310-cp310-win32.whl", hash = "sha256:3ec3a0eab496b5e04633a39fa3d5eb5454628228201fb24903d38174ee34565e"},
-    {file = "shapely-2.0.6-cp310-cp310-win_amd64.whl", hash = "sha256:28f87cdf5308a514763a5c38de295544cb27429cfa655d50ed8431a4796090c4"},
-    {file = "shapely-2.0.6-cp311-cp311-macosx_10_9_x86_64.whl", hash = "sha256:5aeb0f51a9db176da9a30cb2f4329b6fbd1e26d359012bb0ac3d3c7781667a9e"},
-    {file = "shapely-2.0.6-cp311-cp311-macosx_11_0_arm64.whl", hash = "sha256:9a7a78b0d51257a367ee115f4d41ca4d46edbd0dd280f697a8092dd3989867b2"},
-    {file = "shapely-2.0.6-cp311-cp311-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:f32c23d2f43d54029f986479f7c1f6e09c6b3a19353a3833c2ffb226fb63a855"},
-    {file = "shapely-2.0.6-cp311-cp311-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:b3dc9fb0eb56498912025f5eb352b5126f04801ed0e8bdbd867d21bdbfd7cbd0"},
-    {file = "shapely-2.0.6-cp311-cp311-win32.whl", hash = "sha256:d93b7e0e71c9f095e09454bf18dad5ea716fb6ced5df3cb044564a00723f339d"},
-    {file = "shapely-2.0.6-cp311-cp311-win_amd64.whl", hash = "sha256:c02eb6bf4cfb9fe6568502e85bb2647921ee49171bcd2d4116c7b3109724ef9b"},
-    {file = "shapely-2.0.6-cp312-cp312-macosx_10_9_x86_64.whl", hash = "sha256:cec9193519940e9d1b86a3b4f5af9eb6910197d24af02f247afbfb47bcb3fab0"},
-    {file = "shapely-2.0.6-cp312-cp312-macosx_11_0_arm64.whl", hash = "sha256:83b94a44ab04a90e88be69e7ddcc6f332da7c0a0ebb1156e1c4f568bbec983c3"},
-    {file = "shapely-2.0.6-cp312-cp312-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:537c4b2716d22c92036d00b34aac9d3775e3691f80c7aa517c2c290351f42cd8"},
-    {file = "shapely-2.0.6-cp312-cp312-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:98fea108334be345c283ce74bf064fa00cfdd718048a8af7343c59eb40f59726"},
-    {file = "shapely-2.0.6-cp312-cp312-win32.whl", hash = "sha256:42fd4cd4834747e4990227e4cbafb02242c0cffe9ce7ef9971f53ac52d80d55f"},
-    {file = "shapely-2.0.6-cp312-cp312-win_amd64.whl", hash = "sha256:665990c84aece05efb68a21b3523a6b2057e84a1afbef426ad287f0796ef8a48"},
-    {file = "shapely-2.0.6-cp313-cp313-macosx_10_13_x86_64.whl", hash = "sha256:42805ef90783ce689a4dde2b6b2f261e2c52609226a0438d882e3ced40bb3013"},
-    {file = "shapely-2.0.6-cp313-cp313-macosx_11_0_arm64.whl", hash = "sha256:6d2cb146191a47bd0cee8ff5f90b47547b82b6345c0d02dd8b25b88b68af62d7"},
-    {file = "shapely-2.0.6-cp313-cp313-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:e3fdef0a1794a8fe70dc1f514440aa34426cc0ae98d9a1027fb299d45741c381"},
-    {file = "shapely-2.0.6-cp313-cp313-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:2c665a0301c645615a107ff7f52adafa2153beab51daf34587170d85e8ba6805"},
-    {file = "shapely-2.0.6-cp313-cp313-win32.whl", hash = "sha256:0334bd51828f68cd54b87d80b3e7cee93f249d82ae55a0faf3ea21c9be7b323a"},
-    {file = "shapely-2.0.6-cp313-cp313-win_amd64.whl", hash = "sha256:d37d070da9e0e0f0a530a621e17c0b8c3c9d04105655132a87cfff8bd77cc4c2"},
-    {file = "shapely-2.0.6-cp37-cp37m-macosx_10_9_x86_64.whl", hash = "sha256:fa7468e4f5b92049c0f36d63c3e309f85f2775752e076378e36c6387245c5462"},
-    {file = "shapely-2.0.6-cp37-cp37m-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:ed5867e598a9e8ac3291da6cc9baa62ca25706eea186117034e8ec0ea4355653"},
-    {file = "shapely-2.0.6-cp37-cp37m-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:81d9dfe155f371f78c8d895a7b7f323bb241fb148d848a2bf2244f79213123fe"},
-    {file = "shapely-2.0.6-cp37-cp37m-win32.whl", hash = "sha256:fbb7bf02a7542dba55129062570211cfb0defa05386409b3e306c39612e7fbcc"},
-    {file = "shapely-2.0.6-cp37-cp37m-win_amd64.whl", hash = "sha256:837d395fac58aa01aa544495b97940995211e3e25f9aaf87bc3ba5b3a8cd1ac7"},
-    {file = "shapely-2.0.6-cp38-cp38-macosx_10_9_x86_64.whl", hash = "sha256:c6d88ade96bf02f6bfd667ddd3626913098e243e419a0325ebef2bbd481d1eb6"},
-    {file = "shapely-2.0.6-cp38-cp38-macosx_11_0_arm64.whl", hash = "sha256:8b3b818c4407eaa0b4cb376fd2305e20ff6df757bf1356651589eadc14aab41b"},
-    {file = "shapely-2.0.6-cp38-cp38-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:1bbc783529a21f2bd50c79cef90761f72d41c45622b3e57acf78d984c50a5d13"},
-    {file = "shapely-2.0.6-cp38-cp38-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:2423f6c0903ebe5df6d32e0066b3d94029aab18425ad4b07bf98c3972a6e25a1"},
-    {file = "shapely-2.0.6-cp38-cp38-win32.whl", hash = "sha256:2de00c3bfa80d6750832bde1d9487e302a6dd21d90cb2f210515cefdb616e5f5"},
-    {file = "shapely-2.0.6-cp38-cp38-win_amd64.whl", hash = "sha256:3a82d58a1134d5e975f19268710e53bddd9c473743356c90d97ce04b73e101ee"},
-    {file = "shapely-2.0.6-cp39-cp39-macosx_10_9_x86_64.whl", hash = "sha256:392f66f458a0a2c706254f473290418236e52aa4c9b476a072539d63a2460595"},
-    {file = "shapely-2.0.6-cp39-cp39-macosx_11_0_arm64.whl", hash = "sha256:eba5bae271d523c938274c61658ebc34de6c4b33fdf43ef7e938b5776388c1be"},
-    {file = "shapely-2.0.6-cp39-cp39-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:7060566bc4888b0c8ed14b5d57df8a0ead5c28f9b69fb6bed4476df31c51b0af"},
-    {file = "shapely-2.0.6-cp39-cp39-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:b02154b3e9d076a29a8513dffcb80f047a5ea63c897c0cd3d3679f29363cf7e5"},
-    {file = "shapely-2.0.6-cp39-cp39-win32.whl", hash = "sha256:44246d30124a4f1a638a7d5419149959532b99dfa25b54393512e6acc9c211ac"},
-    {file = "shapely-2.0.6-cp39-cp39-win_amd64.whl", hash = "sha256:2b542d7f1dbb89192d3512c52b679c822ba916f93479fa5d4fc2fe4fa0b3c9e8"},
-    {file = "shapely-2.0.6.tar.gz", hash = "sha256:997f6159b1484059ec239cacaa53467fd8b5564dabe186cd84ac2944663b0bf6"},
+    {file = "shapely-2.0.7-cp310-cp310-macosx_10_9_x86_64.whl", hash = "sha256:33fb10e50b16113714ae40adccf7670379e9ccf5b7a41d0002046ba2b8f0f691"},
+    {file = "shapely-2.0.7-cp310-cp310-macosx_11_0_arm64.whl", hash = "sha256:f44eda8bd7a4bccb0f281264b34bf3518d8c4c9a8ffe69a1a05dabf6e8461147"},
+    {file = "shapely-2.0.7-cp310-cp310-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:cf6c50cd879831955ac47af9c907ce0310245f9d162e298703f82e1785e38c98"},
+    {file = "shapely-2.0.7-cp310-cp310-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:04a65d882456e13c8b417562c36324c0cd1e5915f3c18ad516bb32ee3f5fc895"},
+    {file = "shapely-2.0.7-cp310-cp310-win32.whl", hash = "sha256:7e97104d28e60b69f9b6a957c4d3a2a893b27525bc1fc96b47b3ccef46726bf2"},
+    {file = "shapely-2.0.7-cp310-cp310-win_amd64.whl", hash = "sha256:35524cc8d40ee4752520819f9894b9f28ba339a42d4922e92c99b148bed3be39"},
+    {file = "shapely-2.0.7-cp311-cp311-macosx_10_9_x86_64.whl", hash = "sha256:5cf23400cb25deccf48c56a7cdda8197ae66c0e9097fcdd122ac2007e320bc34"},
+    {file = "shapely-2.0.7-cp311-cp311-macosx_11_0_arm64.whl", hash = "sha256:d8f1da01c04527f7da59ee3755d8ee112cd8967c15fab9e43bba936b81e2a013"},
+    {file = "shapely-2.0.7-cp311-cp311-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:8f623b64bb219d62014781120f47499a7adc30cf7787e24b659e56651ceebcb0"},
+    {file = "shapely-2.0.7-cp311-cp311-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:e6d95703efaa64aaabf278ced641b888fc23d9c6dd71f8215091afd8a26a66e3"},
+    {file = "shapely-2.0.7-cp311-cp311-win32.whl", hash = "sha256:2f6e4759cf680a0f00a54234902415f2fa5fe02f6b05546c662654001f0793a2"},
+    {file = "shapely-2.0.7-cp311-cp311-win_amd64.whl", hash = "sha256:b52f3ab845d32dfd20afba86675c91919a622f4627182daec64974db9b0b4608"},
+    {file = "shapely-2.0.7-cp312-cp312-macosx_10_13_x86_64.whl", hash = "sha256:4c2b9859424facbafa54f4a19b625a752ff958ab49e01bc695f254f7db1835fa"},
+    {file = "shapely-2.0.7-cp312-cp312-macosx_11_0_arm64.whl", hash = "sha256:5aed1c6764f51011d69a679fdf6b57e691371ae49ebe28c3edb5486537ffbd51"},
+    {file = "shapely-2.0.7-cp312-cp312-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:73c9ae8cf443187d784d57202199bf9fd2d4bb7d5521fe8926ba40db1bc33e8e"},
+    {file = "shapely-2.0.7-cp312-cp312-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:a9469f49ff873ef566864cb3516091881f217b5d231c8164f7883990eec88b73"},
+    {file = "shapely-2.0.7-cp312-cp312-win32.whl", hash = "sha256:6bca5095e86be9d4ef3cb52d56bdd66df63ff111d580855cb8546f06c3c907cd"},
+    {file = "shapely-2.0.7-cp312-cp312-win_amd64.whl", hash = "sha256:f86e2c0259fe598c4532acfcf638c1f520fa77c1275912bbc958faecbf00b108"},
+    {file = "shapely-2.0.7-cp313-cp313-macosx_10_13_x86_64.whl", hash = "sha256:a0c09e3e02f948631c7763b4fd3dd175bc45303a0ae04b000856dedebefe13cb"},
+    {file = "shapely-2.0.7-cp313-cp313-macosx_11_0_arm64.whl", hash = "sha256:06ff6020949b44baa8fc2e5e57e0f3d09486cd5c33b47d669f847c54136e7027"},
+    {file = "shapely-2.0.7-cp313-cp313-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:5d6dbf096f961ca6bec5640e22e65ccdec11e676344e8157fe7d636e7904fd36"},
+    {file = "shapely-2.0.7-cp313-cp313-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:adeddfb1e22c20548e840403e5e0b3d9dc3daf66f05fa59f1fcf5b5f664f0e98"},
+    {file = "shapely-2.0.7-cp313-cp313-win32.whl", hash = "sha256:a7f04691ce1c7ed974c2f8b34a1fe4c3c5dfe33128eae886aa32d730f1ec1913"},
+    {file = "shapely-2.0.7-cp313-cp313-win_amd64.whl", hash = "sha256:aaaf5f7e6cc234c1793f2a2760da464b604584fb58c6b6d7d94144fd2692d67e"},
+    {file = "shapely-2.0.7-cp37-cp37m-macosx_10_9_x86_64.whl", hash = "sha256:19cbc8808efe87a71150e785b71d8a0e614751464e21fb679d97e274eca7bd43"},
+    {file = "shapely-2.0.7-cp37-cp37m-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:fc19b78cc966db195024d8011649b4e22812f805dd49264323980715ab80accc"},
+    {file = "shapely-2.0.7-cp37-cp37m-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:dd37d65519b3f8ed8976fa4302a2827cbb96e0a461a2e504db583b08a22f0b98"},
+    {file = "shapely-2.0.7-cp37-cp37m-win32.whl", hash = "sha256:25085a30a2462cee4e850a6e3fb37431cbbe4ad51cbcc163af0cea1eaa9eb96d"},
+    {file = "shapely-2.0.7-cp37-cp37m-win_amd64.whl", hash = "sha256:1a2e03277128e62f9a49a58eb7eb813fa9b343925fca5e7d631d50f4c0e8e0b8"},
+    {file = "shapely-2.0.7-cp38-cp38-macosx_10_9_x86_64.whl", hash = "sha256:e1c4f1071fe9c09af077a69b6c75f17feb473caeea0c3579b3e94834efcbdc36"},
+    {file = "shapely-2.0.7-cp38-cp38-macosx_11_0_arm64.whl", hash = "sha256:3697bd078b4459f5a1781015854ef5ea5d824dbf95282d0b60bfad6ff83ec8dc"},
+    {file = "shapely-2.0.7-cp38-cp38-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:1e9fed9a7d6451979d914cb6ebbb218b4b4e77c0d50da23e23d8327948662611"},
+    {file = "shapely-2.0.7-cp38-cp38-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:2934834c7f417aeb7cba3b0d9b4441a76ebcecf9ea6e80b455c33c7c62d96a24"},
+    {file = "shapely-2.0.7-cp38-cp38-win32.whl", hash = "sha256:2e4a1749ad64bc6e7668c8f2f9479029f079991f4ae3cb9e6b25440e35a4b532"},
+    {file = "shapely-2.0.7-cp38-cp38-win_amd64.whl", hash = "sha256:8ae5cb6b645ac3fba34ad84b32fbdccb2ab321facb461954925bde807a0d3b74"},
+    {file = "shapely-2.0.7-cp39-cp39-macosx_10_9_x86_64.whl", hash = "sha256:4abeb44b3b946236e4e1a1b3d2a0987fb4d8a63bfb3fdefb8a19d142b72001e5"},
+    {file = "shapely-2.0.7-cp39-cp39-macosx_11_0_arm64.whl", hash = "sha256:cd0e75d9124b73e06a42bf1615ad3d7d805f66871aa94538c3a9b7871d620013"},
+    {file = "shapely-2.0.7-cp39-cp39-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:7977d8a39c4cf0e06247cd2dca695ad4e020b81981d4c82152c996346cf1094b"},
+    {file = "shapely-2.0.7-cp39-cp39-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:0145387565fcf8f7c028b073c802956431308da933ef41d08b1693de49990d27"},
+    {file = "shapely-2.0.7-cp39-cp39-win32.whl", hash = "sha256:98697c842d5c221408ba8aa573d4f49caef4831e9bc6b6e785ce38aca42d1999"},
+    {file = "shapely-2.0.7-cp39-cp39-win_amd64.whl", hash = "sha256:a3fb7fbae257e1b042f440289ee7235d03f433ea880e73e687f108d044b24db5"},
+    {file = "shapely-2.0.7.tar.gz", hash = "sha256:28fe2997aab9a9dc026dc6a355d04e85841546b2a5d232ed953e3321ab958ee5"},
 ]
 
 [package.dependencies]
@@ -6445,37 +6438,37 @@ test = ["pytest", "tornado (>=4.5)", "typeguard"]
 
 [[package]]
 name = "tesserocr"
-version = "2.7.1"
+version = "2.8.0"
 description = "A simple, Pillow-friendly, Python wrapper around tesseract-ocr API using Cython"
 optional = true
 python-versions = "*"
 files = [
-    {file = "tesserocr-2.7.1-cp310-cp310-macosx_10_9_x86_64.whl", hash = "sha256:1b8c4828f970af7bcfca83a1fb228aa68a2587299387bc875d0dfad8b6baf8ed"},
-    {file = "tesserocr-2.7.1-cp310-cp310-macosx_11_0_arm64.whl", hash = "sha256:3bb5d336ebf2cc47cd0d117cadc8b25b2e558f54fb9a2dedaa28a14cb5a6b437"},
-    {file = "tesserocr-2.7.1-cp310-cp310-manylinux_2_28_aarch64.whl", hash = "sha256:3ff7f6d6b5c12dd31b80842eb0892b661a41ca3edf0e6cc1e54ec2c14552ceef"},
-    {file = "tesserocr-2.7.1-cp310-cp310-manylinux_2_28_x86_64.whl", hash = "sha256:ae794c5434373f4afa4c7f8b59f19fde810f8caf096d8bb701a4b2f3a6739460"},
-    {file = "tesserocr-2.7.1-cp310-cp310-musllinux_1_1_x86_64.whl", hash = "sha256:0a0895a4d9ff6a34f5a6f203fe0c9899f31d6f2378ae99be80605637b622687b"},
-    {file = "tesserocr-2.7.1-cp311-cp311-macosx_10_9_x86_64.whl", hash = "sha256:4c3187d14b95c866aa1d34cc374a53d583e2168742eefe33347e4790af70338e"},
-    {file = "tesserocr-2.7.1-cp311-cp311-macosx_11_0_arm64.whl", hash = "sha256:ec52be3d82136430081427062ad0211a52fc38fa28fe58e216b89f840354f216"},
-    {file = "tesserocr-2.7.1-cp311-cp311-manylinux_2_28_aarch64.whl", hash = "sha256:44e71b3e8da36b2567760309398689ea9785ee62db3ff21140a9ea6941a233c4"},
-    {file = "tesserocr-2.7.1-cp311-cp311-manylinux_2_28_x86_64.whl", hash = "sha256:e31a49d7784e7e52fe656719145c3a872856d67daa9bfb340c2990db00e023e9"},
-    {file = "tesserocr-2.7.1-cp311-cp311-musllinux_1_1_x86_64.whl", hash = "sha256:37abde15c1c940d691305fd87836e4cad25a1434799729c324bbcd2277bcae44"},
-    {file = "tesserocr-2.7.1-cp312-cp312-macosx_10_9_x86_64.whl", hash = "sha256:1b6349d35d333d420d24acf1953ad6f1d5613ffcde462c62126b68bdfca12753"},
-    {file = "tesserocr-2.7.1-cp312-cp312-macosx_11_0_arm64.whl", hash = "sha256:42f009cde8479f3b339da12a8e419fd9559b64b13bc08a248bd0833c6ae94331"},
-    {file = "tesserocr-2.7.1-cp312-cp312-manylinux_2_28_aarch64.whl", hash = "sha256:6e13204b3b92fac76ece6e33f55eba6335b30e379f4a7b75e285c2ad05762027"},
-    {file = "tesserocr-2.7.1-cp312-cp312-manylinux_2_28_x86_64.whl", hash = "sha256:65afdec0c5dc09a4a23a62e65524989cd940af41be1603e251a64ac10de9babf"},
-    {file = "tesserocr-2.7.1-cp312-cp312-musllinux_1_1_x86_64.whl", hash = "sha256:4c5f59fb072c90bff8aa6a365fc82b747c2668b7b48233901728b155860d1ff9"},
-    {file = "tesserocr-2.7.1-cp38-cp38-macosx_10_9_x86_64.whl", hash = "sha256:f62d662e3002868384e14e8cd620bdedf34ab9f9fc3ebbce527cfe032a7485ee"},
-    {file = "tesserocr-2.7.1-cp38-cp38-macosx_11_0_arm64.whl", hash = "sha256:e80051812685bd521bc17cb70cf1480ffbb3e54ccc2883e90d5bcda15f8278ea"},
-    {file = "tesserocr-2.7.1-cp38-cp38-manylinux_2_28_aarch64.whl", hash = "sha256:2690cb2330fc9349d68ff027cbdac09693fdda36470836b196c04f16dcc99e9d"},
-    {file = "tesserocr-2.7.1-cp38-cp38-manylinux_2_28_x86_64.whl", hash = "sha256:d01ebd094103451ecb77b6510ade2f6bb064c51413ff35b135f649f3d6067a67"},
-    {file = "tesserocr-2.7.1-cp38-cp38-musllinux_1_1_x86_64.whl", hash = "sha256:f8069ae6cd9ea3c056b6a596bc99f501ee9f95d6fd2928fcaffb9777071c210d"},
-    {file = "tesserocr-2.7.1-cp39-cp39-macosx_10_9_x86_64.whl", hash = "sha256:b2d3d23223d0a448877fb91af83c46ce95ff0a497a82fa93e93068148c9712e5"},
-    {file = "tesserocr-2.7.1-cp39-cp39-macosx_11_0_arm64.whl", hash = "sha256:ef8a09a44c2e96bab0f40dbf0633767d063680d86b79365b43fc4e1234219694"},
-    {file = "tesserocr-2.7.1-cp39-cp39-manylinux_2_28_aarch64.whl", hash = "sha256:6e613213ea5b64db06f2cba0b93c3656b7e6aec2d9b2d2e929edf49da7143225"},
-    {file = "tesserocr-2.7.1-cp39-cp39-manylinux_2_28_x86_64.whl", hash = "sha256:4a8888b765e26680a6e34b8ec09b7bb85a17e08cea76f0661eafe2a84254562a"},
-    {file = "tesserocr-2.7.1-cp39-cp39-musllinux_1_1_x86_64.whl", hash = "sha256:64f25763e56c4c29b808e59b485c930cac46b6a1ac8eadd994086dc40a29d3a1"},
-    {file = "tesserocr-2.7.1.tar.gz", hash = "sha256:3744c5c8bbabf18172849c7731be00dc2e5e44f8c556d37c850e788794ae0af4"},
+    {file = "tesserocr-2.8.0-cp310-cp310-macosx_13_0_x86_64.whl", hash = "sha256:b5d5dcabe688bf7bb76f87eef05783aa1d305c9566b7f6f6735a12f224ca379b"},
+    {file = "tesserocr-2.8.0-cp310-cp310-macosx_15_0_arm64.whl", hash = "sha256:55d0e018d34054fa7f875cd126abaf423de4069fde49d638a399de530949055b"},
+    {file = "tesserocr-2.8.0-cp310-cp310-manylinux_2_28_aarch64.whl", hash = "sha256:ad52bb2b1d48b7db6fed379a6805c2437432374fab98b0ab5071ff3fc81efaf2"},
+    {file = "tesserocr-2.8.0-cp310-cp310-manylinux_2_28_x86_64.whl", hash = "sha256:4ac659c3207fd3c0e43081a51e486e3d42259abd20bbaed6cd2ee4cd332a78c0"},
+    {file = "tesserocr-2.8.0-cp310-cp310-musllinux_1_2_x86_64.whl", hash = "sha256:c47c69177e948f567f818dec308717a679bdd3941fd5d3fc6cd9ecf93fe165a4"},
+    {file = "tesserocr-2.8.0-cp311-cp311-macosx_13_0_x86_64.whl", hash = "sha256:88876546ddadc9590800df5dec7f2acbd35a423f0803ca2f17a93567aabbd877"},
+    {file = "tesserocr-2.8.0-cp311-cp311-macosx_15_0_arm64.whl", hash = "sha256:09d8c55838a0085662d2a07a40843a6bbbd6baf44b45eda01df307cdac17089c"},
+    {file = "tesserocr-2.8.0-cp311-cp311-manylinux_2_28_aarch64.whl", hash = "sha256:e89b4928eefcea953ad70ed03fb344568d1a574347d1f0d18699d01a020a7c7e"},
+    {file = "tesserocr-2.8.0-cp311-cp311-manylinux_2_28_x86_64.whl", hash = "sha256:4636a86269e97d60731a1edd16d29cb2c79a28cc91594d7f0af31ee65f72f4ae"},
+    {file = "tesserocr-2.8.0-cp311-cp311-musllinux_1_2_x86_64.whl", hash = "sha256:9dbe02605da205ce253524c4ca681a519a55258906ff8ca585f9df7bb1e78616"},
+    {file = "tesserocr-2.8.0-cp312-cp312-macosx_13_0_x86_64.whl", hash = "sha256:7a0b03d46a0ad2265b83f461ca305a6e5aaac2626853a82012c6198bb4105d66"},
+    {file = "tesserocr-2.8.0-cp312-cp312-macosx_15_0_arm64.whl", hash = "sha256:c9acde3d66d6ef40f95e4cef424b24acbf90e278396827fc064915c665c6548d"},
+    {file = "tesserocr-2.8.0-cp312-cp312-manylinux_2_28_aarch64.whl", hash = "sha256:426dfff81bae757faa25477feaf783f6f5bcdb94ae6a95f4fe24eda97f4825c0"},
+    {file = "tesserocr-2.8.0-cp312-cp312-manylinux_2_28_x86_64.whl", hash = "sha256:7cb74e1ce1bc038a5cc6db90e5a79cb55d6db1b7e6fe7a0d9eb30475fdfd9036"},
+    {file = "tesserocr-2.8.0-cp312-cp312-musllinux_1_2_x86_64.whl", hash = "sha256:9ad1a2900424994ca5caa2470be04bd1c6ee3f0674b0050a34b556f6ba7d2ed5"},
+    {file = "tesserocr-2.8.0-cp313-cp313-macosx_13_0_x86_64.whl", hash = "sha256:44b3396d52379155fd838931b78b044129c7c77a8f02a92574cde626cff9b4a8"},
+    {file = "tesserocr-2.8.0-cp313-cp313-macosx_15_0_arm64.whl", hash = "sha256:1edd2302f4a91b5491a4ce3f63e612441adf92fd81b339b85cbedb3b5b40f206"},
+    {file = "tesserocr-2.8.0-cp313-cp313-manylinux_2_28_aarch64.whl", hash = "sha256:b0dd849ce77373f9ac4b54d345b4d7115414e525e57a158e948887d744c6f909"},
+    {file = "tesserocr-2.8.0-cp313-cp313-manylinux_2_28_x86_64.whl", hash = "sha256:9ce710a73308964f2ac53f94b4980d2791bb67a82863bb7ef0ca445c1b325aa4"},
+    {file = "tesserocr-2.8.0-cp313-cp313-musllinux_1_2_x86_64.whl", hash = "sha256:a7a36af39aaf29a152c629cf62457192944f8854fbdd28395ef92d283e800662"},
+    {file = "tesserocr-2.8.0-cp39-cp39-macosx_13_0_x86_64.whl", hash = "sha256:f83344e350062d7db8625aa21695d34949a25e1f144788996a0e1e91dc53ca45"},
+    {file = "tesserocr-2.8.0-cp39-cp39-macosx_15_0_arm64.whl", hash = "sha256:10fa0125d57c9edc93a7f35673f6b977e0fc0deb123d62b158c93fd8ca4c1c2c"},
+    {file = "tesserocr-2.8.0-cp39-cp39-manylinux_2_28_aarch64.whl", hash = "sha256:efef77ed8702d56a3dc7ba5dba37ce13beecd24128042ad41cbc20c50bb5e23e"},
+    {file = "tesserocr-2.8.0-cp39-cp39-manylinux_2_28_x86_64.whl", hash = "sha256:b41a78eaa35c90d61facd07dca96443e7dc1f0604ae955843be916e2f9a225af"},
+    {file = "tesserocr-2.8.0-cp39-cp39-musllinux_1_2_x86_64.whl", hash = "sha256:317931096378a1dd056500d9c3a489aa0e4546e4d7792a6ffa1a31c0902ab365"},
+    {file = "tesserocr-2.8.0.tar.gz", hash = "sha256:be518d1b1b5ff54c11aada1e0fd12942509ea70581e0a8b39a2a473a0b2dbd36"},
 ]
 
 [[package]]
@@ -7061,18 +7054,18 @@ vision = ["Pillow (>=10.0.1,<=15.0)"]
 
 [[package]]
 name = "transformers"
-version = "4.48.1"
+version = "4.49.0"
 description = "State-of-the-art Machine Learning for JAX, PyTorch and TensorFlow"
 optional = false
 python-versions = ">=3.9.0"
 files = [
-    {file = "transformers-4.48.1-py3-none-any.whl", hash = "sha256:24be0564b0a36d9e433d9a65de248f1545b6f6edce1737669605eb6a8141bbbb"},
-    {file = "transformers-4.48.1.tar.gz", hash = "sha256:7c1931facc3ee8adcbf86fc7a87461d54c1e40eca3bb57fef1ee9f3ecd32187e"},
+    {file = "transformers-4.49.0-py3-none-any.whl", hash = "sha256:6b4fded1c5fee04d384b1014495b4235a2b53c87503d7d592423c06128cbbe03"},
+    {file = "transformers-4.49.0.tar.gz", hash = "sha256:7e40e640b5b8dc3f48743f5f5adbdce3660c82baafbd3afdfc04143cdbd2089e"},
 ]
 
 [package.dependencies]
 filelock = "*"
-huggingface-hub = ">=0.24.0,<1.0"
+huggingface-hub = ">=0.26.0,<1.0"
 numpy = ">=1.17"
 packaging = ">=20.0"
 pyyaml = ">=5.1"
@@ -7085,13 +7078,13 @@ tqdm = ">=4.27"
 [package.extras]
 accelerate = ["accelerate (>=0.26.0)"]
 agents = ["Pillow (>=10.0.1,<=15.0)", "accelerate (>=0.26.0)", "datasets (!=2.5.0)", "diffusers", "opencv-python", "sentencepiece (>=0.1.91,!=0.1.92)", "torch (>=2.0)"]
-all = ["Pillow (>=10.0.1,<=15.0)", "accelerate (>=0.26.0)", "av (==9.2.0)", "codecarbon (>=2.8.1)", "flax (>=0.4.1,<=0.7.0)", "jax (>=0.4.1,<=0.4.13)", "jaxlib (>=0.4.1,<=0.4.13)", "kenlm", "keras-nlp (>=0.3.1,<0.14.0)", "librosa", "onnxconverter-common", "optax (>=0.0.8,<=0.1.4)", "optuna", "phonemizer", "protobuf", "pyctcdecode (>=0.4.0)", "ray[tune] (>=2.7.0)", "scipy (<1.13.0)", "sentencepiece (>=0.1.91,!=0.1.92)", "sigopt", "tensorflow (>2.9,<2.16)", "tensorflow-text (<2.16)", "tf2onnx", "timm (<=1.0.11)", "tokenizers (>=0.21,<0.22)", "torch (>=2.0)", "torchaudio", "torchvision"]
+all = ["Pillow (>=10.0.1,<=15.0)", "accelerate (>=0.26.0)", "av", "codecarbon (>=2.8.1)", "flax (>=0.4.1,<=0.7.0)", "jax (>=0.4.1,<=0.4.13)", "jaxlib (>=0.4.1,<=0.4.13)", "kenlm", "keras-nlp (>=0.3.1,<0.14.0)", "librosa", "onnxconverter-common", "optax (>=0.0.8,<=0.1.4)", "optuna", "phonemizer", "protobuf", "pyctcdecode (>=0.4.0)", "ray[tune] (>=2.7.0)", "scipy (<1.13.0)", "sentencepiece (>=0.1.91,!=0.1.92)", "sigopt", "tensorflow (>2.9,<2.16)", "tensorflow-text (<2.16)", "tf2onnx", "timm (<=1.0.11)", "tokenizers (>=0.21,<0.22)", "torch (>=2.0)", "torchaudio", "torchvision"]
 audio = ["kenlm", "librosa", "phonemizer", "pyctcdecode (>=0.4.0)"]
 benchmark = ["optimum-benchmark (>=0.3.0)"]
 codecarbon = ["codecarbon (>=2.8.1)"]
 deepspeed = ["accelerate (>=0.26.0)", "deepspeed (>=0.9.3)"]
 deepspeed-testing = ["GitPython (<3.1.19)", "accelerate (>=0.26.0)", "beautifulsoup4", "cookiecutter (==1.7.3)", "datasets (!=2.5.0)", "deepspeed (>=0.9.3)", "dill (<0.3.5)", "evaluate (>=0.2.0)", "faiss-cpu", "nltk (<=3.8.1)", "optuna", "parameterized", "protobuf", "psutil", "pydantic", "pytest (>=7.2.0,<8.0.0)", "pytest-asyncio", "pytest-rich", "pytest-timeout", "pytest-xdist", "rjieba", "rouge-score (!=0.0.7,!=0.0.8,!=0.1,!=0.1.1)", "ruff (==0.5.1)", "sacrebleu (>=1.4.12,<2.0.0)", "sacremoses", "sentencepiece (>=0.1.91,!=0.1.92)", "tensorboard", "timeout-decorator"]
-dev = ["GitPython (<3.1.19)", "Pillow (>=10.0.1,<=15.0)", "accelerate (>=0.26.0)", "av (==9.2.0)", "beautifulsoup4", "codecarbon (>=2.8.1)", "cookiecutter (==1.7.3)", "datasets (!=2.5.0)", "dill (<0.3.5)", "evaluate (>=0.2.0)", "faiss-cpu", "flax (>=0.4.1,<=0.7.0)", "fugashi (>=1.0)", "ipadic (>=1.0.0,<2.0)", "isort (>=5.5.4)", "jax (>=0.4.1,<=0.4.13)", "jaxlib (>=0.4.1,<=0.4.13)", "kenlm", "keras-nlp (>=0.3.1,<0.14.0)", "libcst", "librosa", "nltk (<=3.8.1)", "onnxconverter-common", "optax (>=0.0.8,<=0.1.4)", "optuna", "parameterized", "phonemizer", "protobuf", "psutil", "pyctcdecode (>=0.4.0)", "pydantic", "pytest (>=7.2.0,<8.0.0)", "pytest-asyncio", "pytest-rich", "pytest-timeout", "pytest-xdist", "ray[tune] (>=2.7.0)", "rhoknp (>=1.1.0,<1.3.1)", "rich", "rjieba", "rouge-score (!=0.0.7,!=0.0.8,!=0.1,!=0.1.1)", "ruff (==0.5.1)", "sacrebleu (>=1.4.12,<2.0.0)", "sacremoses", "scikit-learn", "scipy (<1.13.0)", "sentencepiece (>=0.1.91,!=0.1.92)", "sigopt", "sudachidict-core (>=20220729)", "sudachipy (>=0.6.6)", "tensorboard", "tensorflow (>2.9,<2.16)", "tensorflow-text (<2.16)", "tf2onnx", "timeout-decorator", "timm (<=1.0.11)", "tokenizers (>=0.21,<0.22)", "torch (>=2.0)", "torchaudio", "torchvision", "unidic (>=1.0.2)", "unidic-lite (>=1.0.7)", "urllib3 (<2.0.0)"]
+dev = ["GitPython (<3.1.19)", "Pillow (>=10.0.1,<=15.0)", "accelerate (>=0.26.0)", "av", "beautifulsoup4", "codecarbon (>=2.8.1)", "cookiecutter (==1.7.3)", "datasets (!=2.5.0)", "dill (<0.3.5)", "evaluate (>=0.2.0)", "faiss-cpu", "flax (>=0.4.1,<=0.7.0)", "fugashi (>=1.0)", "ipadic (>=1.0.0,<2.0)", "isort (>=5.5.4)", "jax (>=0.4.1,<=0.4.13)", "jaxlib (>=0.4.1,<=0.4.13)", "kenlm", "keras-nlp (>=0.3.1,<0.14.0)", "libcst", "librosa", "nltk (<=3.8.1)", "onnxconverter-common", "optax (>=0.0.8,<=0.1.4)", "optuna", "parameterized", "phonemizer", "protobuf", "psutil", "pyctcdecode (>=0.4.0)", "pydantic", "pytest (>=7.2.0,<8.0.0)", "pytest-asyncio", "pytest-rich", "pytest-timeout", "pytest-xdist", "ray[tune] (>=2.7.0)", "rhoknp (>=1.1.0,<1.3.1)", "rich", "rjieba", "rouge-score (!=0.0.7,!=0.0.8,!=0.1,!=0.1.1)", "ruff (==0.5.1)", "sacrebleu (>=1.4.12,<2.0.0)", "sacremoses", "scikit-learn", "scipy (<1.13.0)", "sentencepiece (>=0.1.91,!=0.1.92)", "sigopt", "sudachidict-core (>=20220729)", "sudachipy (>=0.6.6)", "tensorboard", "tensorflow (>2.9,<2.16)", "tensorflow-text (<2.16)", "tf2onnx", "timeout-decorator", "timm (<=1.0.11)", "tokenizers (>=0.21,<0.22)", "torch (>=2.0)", "torchaudio", "torchvision", "unidic (>=1.0.2)", "unidic-lite (>=1.0.7)", "urllib3 (<2.0.0)"]
 dev-tensorflow = ["GitPython (<3.1.19)", "Pillow (>=10.0.1,<=15.0)", "beautifulsoup4", "cookiecutter (==1.7.3)", "datasets (!=2.5.0)", "dill (<0.3.5)", "evaluate (>=0.2.0)", "faiss-cpu", "isort (>=5.5.4)", "kenlm", "keras-nlp (>=0.3.1,<0.14.0)", "libcst", "librosa", "nltk (<=3.8.1)", "onnxconverter-common", "onnxruntime (>=1.4.0)", "onnxruntime-tools (>=1.4.2)", "parameterized", "phonemizer", "protobuf", "psutil", "pyctcdecode (>=0.4.0)", "pydantic", "pytest (>=7.2.0,<8.0.0)", "pytest-asyncio", "pytest-rich", "pytest-timeout", "pytest-xdist", "rich", "rjieba", "rouge-score (!=0.0.7,!=0.0.8,!=0.1,!=0.1.1)", "ruff (==0.5.1)", "sacrebleu (>=1.4.12,<2.0.0)", "sacremoses", "scikit-learn", "sentencepiece (>=0.1.91,!=0.1.92)", "tensorboard", "tensorflow (>2.9,<2.16)", "tensorflow-text (<2.16)", "tf2onnx", "timeout-decorator", "tokenizers (>=0.21,<0.22)", "urllib3 (<2.0.0)"]
 dev-torch = ["GitPython (<3.1.19)", "Pillow (>=10.0.1,<=15.0)", "accelerate (>=0.26.0)", "beautifulsoup4", "codecarbon (>=2.8.1)", "cookiecutter (==1.7.3)", "datasets (!=2.5.0)", "dill (<0.3.5)", "evaluate (>=0.2.0)", "faiss-cpu", "fugashi (>=1.0)", "ipadic (>=1.0.0,<2.0)", "isort (>=5.5.4)", "kenlm", "libcst", "librosa", "nltk (<=3.8.1)", "onnxruntime (>=1.4.0)", "onnxruntime-tools (>=1.4.2)", "optuna", "parameterized", "phonemizer", "protobuf", "psutil", "pyctcdecode (>=0.4.0)", "pydantic", "pytest (>=7.2.0,<8.0.0)", "pytest-asyncio", "pytest-rich", "pytest-timeout", "pytest-xdist", "ray[tune] (>=2.7.0)", "rhoknp (>=1.1.0,<1.3.1)", "rich", "rjieba", "rouge-score (!=0.0.7,!=0.0.8,!=0.1,!=0.1.1)", "ruff (==0.5.1)", "sacrebleu (>=1.4.12,<2.0.0)", "sacremoses", "scikit-learn", "sentencepiece (>=0.1.91,!=0.1.92)", "sigopt", "sudachidict-core (>=20220729)", "sudachipy (>=0.6.6)", "tensorboard", "timeout-decorator", "timm (<=1.0.11)", "tokenizers (>=0.21,<0.22)", "torch (>=2.0)", "torchaudio", "torchvision", "unidic (>=1.0.2)", "unidic-lite (>=1.0.7)", "urllib3 (<2.0.0)"]
 flax = ["flax (>=0.4.1,<=0.7.0)", "jax (>=0.4.1,<=0.4.13)", "jaxlib (>=0.4.1,<=0.4.13)", "optax (>=0.0.8,<=0.1.4)", "scipy (<1.13.0)"]
@@ -7124,8 +7117,8 @@ tokenizers = ["tokenizers (>=0.21,<0.22)"]
 torch = ["accelerate (>=0.26.0)", "torch (>=2.0)"]
 torch-speech = ["kenlm", "librosa", "phonemizer", "pyctcdecode (>=0.4.0)", "torchaudio"]
 torch-vision = ["Pillow (>=10.0.1,<=15.0)", "torchvision"]
-torchhub = ["filelock", "huggingface-hub (>=0.24.0,<1.0)", "importlib-metadata", "numpy (>=1.17)", "packaging (>=20.0)", "protobuf", "regex (!=2019.12.17)", "requests", "sentencepiece (>=0.1.91,!=0.1.92)", "tokenizers (>=0.21,<0.22)", "torch (>=2.0)", "tqdm (>=4.27)"]
-video = ["av (==9.2.0)"]
+torchhub = ["filelock", "huggingface-hub (>=0.26.0,<1.0)", "importlib-metadata", "numpy (>=1.17)", "packaging (>=20.0)", "protobuf", "regex (!=2019.12.17)", "requests", "sentencepiece (>=0.1.91,!=0.1.92)", "tokenizers (>=0.21,<0.22)", "torch (>=2.0)", "tqdm (>=4.27)"]
+video = ["av"]
 vision = ["Pillow (>=10.0.1,<=15.0)"]
 
 [[package]]
@@ -7223,13 +7216,13 @@ files = [
 
 [[package]]
 name = "types-pytz"
-version = "2024.2.0.20241221"
+version = "2025.1.0.20250204"
 description = "Typing stubs for pytz"
 optional = false
-python-versions = ">=3.8"
+python-versions = ">=3.9"
 files = [
-    {file = "types_pytz-2024.2.0.20241221-py3-none-any.whl", hash = "sha256:8fc03195329c43637ed4f593663df721fef919b60a969066e22606edf0b53ad5"},
-    {file = "types_pytz-2024.2.0.20241221.tar.gz", hash = "sha256:06d7cde9613e9f7504766a0554a270c369434b50e00975b3a4a0f6eed0f2c1a9"},
+    {file = "types_pytz-2025.1.0.20250204-py3-none-any.whl", hash = "sha256:32ca4a35430e8b94f6603b35beb7f56c32260ddddd4f4bb305fdf8f92358b87e"},
+    {file = "types_pytz-2025.1.0.20250204.tar.gz", hash = "sha256:00f750132769f1c65a4f7240bc84f13985b4da774bd17dfbe5d9cd442746bd49"},
 ]
 
 [[package]]
@@ -7246,6 +7239,20 @@ files = [
 [package.dependencies]
 urllib3 = ">=2"
 
+[[package]]
+name = "types-tqdm"
+version = "4.67.0.20241221"
+description = "Typing stubs for tqdm"
+optional = false
+python-versions = ">=3.8"
+files = [
+    {file = "types_tqdm-4.67.0.20241221-py3-none-any.whl", hash = "sha256:a1f1c9cda5c2d8482d2c73957a5398bfdedda10f6bc7b3b4e812d5c910486d29"},
+    {file = "types_tqdm-4.67.0.20241221.tar.gz", hash = "sha256:e56046631056922385abe89aeb18af5611f471eadd7918a0ad7f34d84cd4c8cc"},
+]
+
+[package.dependencies]
+types-requests = "*"
+
 [[package]]
 name = "typing-extensions"
 version = "4.12.2"
@@ -7374,13 +7381,13 @@ zstd = ["zstandard (>=0.18.0)"]
 
 [[package]]
 name = "virtualenv"
-version = "20.29.1"
+version = "20.29.2"
 description = "Virtual Python Environment builder"
 optional = false
 python-versions = ">=3.8"
 files = [
-    {file = "virtualenv-20.29.1-py3-none-any.whl", hash = "sha256:4e4cb403c0b0da39e13b46b1b2476e505cb0046b25f242bee80f62bf990b2779"},
-    {file = "virtualenv-20.29.1.tar.gz", hash = "sha256:b8b8970138d32fb606192cb97f6cd4bb644fa486be9308fb9b63f81091b5dc35"},
+    {file = "virtualenv-20.29.2-py3-none-any.whl", hash = "sha256:febddfc3d1ea571bdb1dc0f98d7b45d24def7428214d4fb73cc486c9568cce6a"},
+    {file = "virtualenv-20.29.2.tar.gz", hash = "sha256:fdaabebf6d03b5ba83ae0a02cfe96f48a716f4fae556461d180825866f75b728"},
 ]
 
 [package.dependencies]
@@ -7831,8 +7838,9 @@ type = ["pytest-mypy"]
 ocrmac = ["ocrmac"]
 rapidocr = ["onnxruntime", "onnxruntime", "rapidocr-onnxruntime"]
 tesserocr = ["tesserocr"]
+vlm = ["accelerate", "transformers", "transformers"]
 
 [metadata]
 lock-version = "2.0"
 python-versions = "^3.9"
-content-hash = "3e5f23bc034f4eb241532773cfa9ccc4f79780a1b59618a6ded18be5f927ce1d"
+content-hash = "1d4718b694098b0676f1ad1606d769887e51fc29f604e5f4c83dd5e1c90557e7"
diff --git a/pyproject.toml b/pyproject.toml
index c911a19a..131e93ef 100644
--- a/pyproject.toml
+++ b/pyproject.toml
@@ -1,6 +1,6 @@
 [tool.poetry]
 name = "docling"
-version = "2.17.0"  # DO NOT EDIT, updated automatically
+version = "2.25.1"  # DO NOT EDIT, updated automatically
 description = "SDK and CLI for parsing PDF, DOCX, HTML, and more, to a unified document representation for powering downstream workflows such as gen AI applications."
 authors = ["Christoph Auer <cau@zurich.ibm.com>", "Michele Dolfi <dol@zurich.ibm.com>", "Maxim Lysak <mly@zurich.ibm.com>", "Nikos Livathinos <nli@zurich.ibm.com>", "Ahmed Nassar <ahn@zurich.ibm.com>", "Panos Vagenas <pva@zurich.ibm.com>", "Peter Staar <taa@zurich.ibm.com>"]
 license = "MIT"
@@ -26,10 +26,9 @@ packages = [{include = "docling"}]
 ######################
 python = "^3.9"
 pydantic = "^2.0.0"
-docling-core = {version = "^2.16.1", extras = ["chunking"]}
-docling-ibm-models = "^3.3.0"
-deepsearch-glm = "^1.0.0"
-docling-parse = "^3.1.0"
+docling-core = {extras = ["chunking"], version = "^2.19.0"}
+docling-ibm-models = "^3.4.0"
+docling-parse = "^3.3.0"
 filetype = "^1.2.0"
 pypdfium2 = "^4.30.0"
 pydantic-settings = "^2.3.0"
@@ -59,8 +58,16 @@ onnxruntime = [
   { version = ">=1.7.0,<1.20.0", optional = true, markers = "python_version < '3.10'" },
   { version = "^1.7.0", optional = true, markers = "python_version >= '3.10'" }
 ]
-pillow = "^10.0.0"
-pylatexenc = "^2.10"
+
+transformers = [
+  {markers = "sys_platform != 'darwin' or platform_machine != 'x86_64'", version = "^4.46.0", optional = true },
+  {markers = "sys_platform == 'darwin' and platform_machine == 'x86_64'", version = "~4.42.0", optional = true }
+]
+accelerate = [
+  {markers = "sys_platform != 'darwin' or platform_machine != 'x86_64'", version = "^1.2.1", optional = true },
+]
+pillow = ">=10.0.0,<12.0.0"
+tqdm = "^4.65.0"
 
 [tool.poetry.group.dev.dependencies]
 black = {extras = ["jupyter"], version = "^24.4.2"}
@@ -80,6 +87,7 @@ ipykernel = "^6.29.5"
 ipywidgets = "^8.1.5"
 nbqa = "^1.9.0"
 types-openpyxl = "^3.1.5.20241114"
+types-tqdm = "^4.67.0.20241221"
 
 [tool.poetry.group.docs.dependencies]
 mkdocs-material = "^9.5.40"
@@ -120,10 +128,12 @@ torchvision = [
 [tool.poetry.extras]
 tesserocr = ["tesserocr"]
 ocrmac = ["ocrmac"]
+vlm = ["transformers", "accelerate"]
 rapidocr = ["rapidocr-onnxruntime", "onnxruntime"]
 
 [tool.poetry.scripts]
 docling = "docling.cli.main:app"
+docling-tools = "docling.cli.tools:app"
 
 [build-system]
 requires = ["poetry-core"]
@@ -157,11 +167,9 @@ module = [
     "docling_ibm_models.*",
     "easyocr.*",
     "ocrmac.*",
-    "deepsearch_glm.*",
     "lxml.*",
-    "bs4.*",
     "huggingface_hub.*",
-    "pylatexenc.*"
+    "transformers.*",
 ]
 ignore_missing_imports = true
 
diff --git a/tests/data/test_01.asciidoc b/tests/data/asciidoc/test_01.asciidoc
similarity index 100%
rename from tests/data/test_01.asciidoc
rename to tests/data/asciidoc/test_01.asciidoc
diff --git a/tests/data/test_02.asciidoc b/tests/data/asciidoc/test_02.asciidoc
similarity index 100%
rename from tests/data/test_02.asciidoc
rename to tests/data/asciidoc/test_02.asciidoc
diff --git a/tests/data/code_and_formula.pdf b/tests/data/code_and_formula.pdf
deleted file mode 100644
index 82cd8343..00000000
Binary files a/tests/data/code_and_formula.pdf and /dev/null differ
diff --git a/tests/data/csv/csv-comma-in-cell.csv b/tests/data/csv/csv-comma-in-cell.csv
new file mode 100644
index 00000000..3c9feb48
--- /dev/null
+++ b/tests/data/csv/csv-comma-in-cell.csv
@@ -0,0 +1,5 @@
+1,2,3,4
+a,b,c,d
+a,",",c,d
+a,b,c,d
+a,b,c,d
\ No newline at end of file
diff --git a/tests/data/csv/csv-comma.csv b/tests/data/csv/csv-comma.csv
new file mode 100644
index 00000000..bcdcc203
--- /dev/null
+++ b/tests/data/csv/csv-comma.csv
@@ -0,0 +1,6 @@
+Index,Customer Id,First Name,Last Name,Company,City,Country,Phone 1,Phone 2,Email,Subscription Date,Website
+1,DD37Cf93aecA6Dc,Sheryl,Baxter,Rasmussen Group,East Leonard,Chile,229.077.5154,397.884.0519x718,zunigavanessa@smith.info,2020-08-24,http://www.stephenson.com/
+2,1Ef7b82A4CAAD10,Preston,"Lozano, Dr",Vega-Gentry,East Jimmychester,Djibouti,5153435776,686-620-1820x944,vmata@colon.com,2021-04-23,http://www.hobbs.com/
+3,6F94879bDAfE5a6,Roy,Berry,Murillo-Perry,Isabelborough,Antigua and Barbuda,+1-539-402-0259,(496)978-3969x58947,beckycarr@hogan.com,2020-03-25,http://www.lawrence.com/
+4,5Cef8BFA16c5e3c,Linda,Olsen,"Dominguez, Mcmillan and Donovan",Bensonview,Dominican Republic,001-808-617-6467x12895,+1-813-324-8756,stanleyblackwell@benson.org,2020-06-02,http://www.good-lyons.com/
+5,053d585Ab6b3159,Joanna,Bender,"Martin, Lang and Andrade",West Priscilla,Slovakia (Slovak Republic),001-234-203-0635x76146,001-199-446-3860x3486,colinalvarado@miles.net,2021-04-17,https://goodwin-ingram.com/
diff --git a/tests/data/csv/csv-inconsistent-header.csv b/tests/data/csv/csv-inconsistent-header.csv
new file mode 100644
index 00000000..e7b73a72
--- /dev/null
+++ b/tests/data/csv/csv-inconsistent-header.csv
@@ -0,0 +1,5 @@
+1,2,3
+a,b,c,d
+a,b,c,d
+a,b,c,d
+a,b,c,d
\ No newline at end of file
diff --git a/tests/data/csv/csv-pipe.csv b/tests/data/csv/csv-pipe.csv
new file mode 100644
index 00000000..89da9aec
--- /dev/null
+++ b/tests/data/csv/csv-pipe.csv
@@ -0,0 +1,6 @@
+Index|Customer Id|First Name|Last Name|Company|City|Country|Phone 1|Phone 2|Email|Subscription Date|Website
+1|DD37Cf93aecA6Dc|Sheryl|Baxter|Rasmussen Group|East Leonard|Chile|229.077.5154|397.884.0519x718|zunigavanessa@smith.info|2020-08-24|http://www.stephenson.com/
+2|1Ef7b82A4CAAD10|Preston|Lozano|Vega-Gentry|East Jimmychester|Djibouti|5153435776|686-620-1820x944|vmata@colon.com|2021-04-23|http://www.hobbs.com/
+3|6F94879bDAfE5a6|Roy|Berry|Murillo-Perry|Isabelborough|Antigua and Barbuda|+1-539-402-0259|(496)978-3969x58947|beckycarr@hogan.com|2020-03-25|http://www.lawrence.com/
+4|5Cef8BFA16c5e3c|Linda|Olsen|"Dominguez|Mcmillan and Donovan"|Bensonview|Dominican Republic|001-808-617-6467x12895|+1-813-324-8756|stanleyblackwell@benson.org|2020-06-02|http://www.good-lyons.com/
+5|053d585Ab6b3159|Joanna|Bender|"Martin|Lang and Andrade"|West Priscilla|Slovakia (Slovak Republic)|001-234-203-0635x76146|001-199-446-3860x3486|colinalvarado@miles.net|2021-04-17|https://goodwin-ingram.com/
diff --git a/tests/data/csv/csv-semicolon.csv b/tests/data/csv/csv-semicolon.csv
new file mode 100644
index 00000000..eec59e90
--- /dev/null
+++ b/tests/data/csv/csv-semicolon.csv
@@ -0,0 +1,6 @@
+Index;Customer Id;First Name;Last Name;Company;City;Country;Phone 1;Phone 2;Email;Subscription Date;Website
+1;DD37Cf93aecA6Dc;Sheryl;Baxter;Rasmussen Group;East Leonard;Chile;229.077.5154;397.884.0519x718;zunigavanessa@smith.info;2020-08-24;http://www.stephenson.com/
+2;1Ef7b82A4CAAD10;Preston;Lozano;Vega-Gentry;East Jimmychester;Djibouti;5153435776;686-620-1820x944;vmata@colon.com;2021-04-23;http://www.hobbs.com/
+3;6F94879bDAfE5a6;Roy;Berry;Murillo-Perry;Isabelborough;Antigua and Barbuda;+1-539-402-0259;(496)978-3969x58947;beckycarr@hogan.com;2020-03-25;http://www.lawrence.com/
+4;5Cef8BFA16c5e3c;Linda;Olsen;"Dominguez;Mcmillan and Donovan";Bensonview;Dominican Republic;001-808-617-6467x12895;+1-813-324-8756;stanleyblackwell@benson.org;2020-06-02;http://www.good-lyons.com/
+5;053d585Ab6b3159;Joanna;Bender;"Martin;Lang and Andrade";West Priscilla;Slovakia (Slovak Republic);001-234-203-0635x76146;001-199-446-3860x3486;colinalvarado@miles.net;2021-04-17;https://goodwin-ingram.com/
diff --git a/tests/data/csv/csv-tab.csv b/tests/data/csv/csv-tab.csv
new file mode 100644
index 00000000..58aae6de
--- /dev/null
+++ b/tests/data/csv/csv-tab.csv
@@ -0,0 +1,6 @@
+Index	Customer Id	First Name	Last Name	Company	City	Country	Phone 1	Phone 2	Email	Subscription Date	Website
+1	DD37Cf93aecA6Dc	Sheryl	Baxter	Rasmussen Group	East Leonard	Chile	229.077.5154	397.884.0519x718	zunigavanessa@smith.info	2020-08-24	http://www.stephenson.com/
+2	1Ef7b82A4CAAD10	Preston	Lozano	Vega-Gentry	East Jimmychester	Djibouti	5153435776	686-620-1820x944	vmata@colon.com	2021-04-23	http://www.hobbs.com/
+3	6F94879bDAfE5a6	Roy	Berry	Murillo-Perry	Isabelborough	Antigua and Barbuda	+1-539-402-0259	(496)978-3969x58947	beckycarr@hogan.com	2020-03-25	http://www.lawrence.com/
+4	5Cef8BFA16c5e3c	Linda	Olsen	"Dominguez	Mcmillan and Donovan"	Bensonview	Dominican Republic	001-808-617-6467x12895	+1-813-324-8756	stanleyblackwell@benson.org	2020-06-02	http://www.good-lyons.com/
+5	053d585Ab6b3159	Joanna	Bender	"Martin	Lang and Andrade"	West Priscilla	Slovakia (Slovak Republic)	001-234-203-0635x76146	001-199-446-3860x3486	colinalvarado@miles.net	2021-04-17	https://goodwin-ingram.com/
diff --git a/tests/data/csv/csv-too-few-columns.csv b/tests/data/csv/csv-too-few-columns.csv
new file mode 100644
index 00000000..b6667626
--- /dev/null
+++ b/tests/data/csv/csv-too-few-columns.csv
@@ -0,0 +1,5 @@
+1,2,3,4
+a,'b',c,d
+a,b,c
+a,b,c,d
+a,b,c,d
\ No newline at end of file
diff --git a/tests/data/csv/csv-too-many-columns.csv b/tests/data/csv/csv-too-many-columns.csv
new file mode 100644
index 00000000..b9744ea0
--- /dev/null
+++ b/tests/data/csv/csv-too-many-columns.csv
@@ -0,0 +1,5 @@
+1,2,3,4
+a,b,c,d
+a,b,c,d,e
+a,b,c,d
+a,b,c,d
\ No newline at end of file
diff --git a/tests/data/docx/word_tables.docx b/tests/data/docx/word_tables.docx
new file mode 100644
index 00000000..1513796e
Binary files /dev/null and b/tests/data/docx/word_tables.docx differ
diff --git a/tests/data/groundtruth/docling_v1/2203.01017v2.doctags.txt b/tests/data/groundtruth/docling_v1/2203.01017v2.doctags.txt
index a33b3525..2d46c897 100644
--- a/tests/data/groundtruth/docling_v1/2203.01017v2.doctags.txt
+++ b/tests/data/groundtruth/docling_v1/2203.01017v2.doctags.txt
@@ -4,29 +4,27 @@
 <paragraph><location><page_1><loc_34><loc_77><loc_62><loc_78></location>{ ahn,nli,mly,taa } @zurich.ibm.com</paragraph>
 <subtitle-level-1><location><page_1><loc_24><loc_71><loc_31><loc_73></location>Abstract</subtitle-level-1>
 <subtitle-level-1><location><page_1><loc_52><loc_71><loc_67><loc_72></location>a. Picture of a table:</subtitle-level-1>
+<paragraph><location><page_1><loc_8><loc_35><loc_47><loc_70></location>Tables organize valuable content in a concise and compact representation. This content is extremely valuable for systems such as search engines, Knowledge Graph's, etc, since they enhance their predictive capabilities. Unfortunately, tables come in a large variety of shapes and sizes. Furthermore, they can have complex column/row-header configurations, multiline rows, different variety of separation lines, missing entries, etc. As such, the correct identification of the table-structure from an image is a nontrivial task. In this paper, we present a new table-structure identification model. The latter improves the latest end-toend deep learning model (i.e. encoder-dual-decoder from PubTabNet) in two significant ways. First, we introduce a new object detection decoder for table-cells. In this way, we can obtain the content of the table-cells from programmatic PDF's directly from the PDF source and avoid the training of the custom OCR decoders. This architectural change leads to more accurate table-content extraction and allows us to tackle non-english tables. Second, we replace the LSTM decoders with transformer based decoders. This upgrade improves significantly the previous state-of-the-art tree-editing-distance-score (TEDS) from 91% to 98.5% on simple tables and from 88.7% to 95% on complex tables.</paragraph>
 <subtitle-level-1><location><page_1><loc_8><loc_30><loc_21><loc_32></location>1. Introduction</subtitle-level-1>
 <paragraph><location><page_1><loc_8><loc_10><loc_47><loc_29></location>The occurrence of tables in documents is ubiquitous. They often summarise quantitative or factual data, which is cumbersome to describe in verbose text but nevertheless extremely valuable. Unfortunately, this compact representation is often not easy to parse by machines. There are many implicit conventions used to obtain a compact table representation. For example, tables often have complex columnand row-headers in order to reduce duplicated cell content. Lines of different shapes and sizes are leveraged to separate content or indicate a tree structure. Additionally, tables can also have empty/missing table-entries or multi-row textual table-entries. Fig. 1 shows a table which presents all these issues.</paragraph>
 <figure>
 <location><page_1><loc_52><loc_62><loc_88><loc_71></location>
 </figure>
-<caption><location><page_1><loc_8><loc_35><loc_47><loc_70></location>Tables organize valuable content in a concise and compact representation. This content is extremely valuable for systems such as search engines, Knowledge Graph's, etc, since they enhance their predictive capabilities. Unfortunately, tables come in a large variety of shapes and sizes. Furthermore, they can have complex column/row-header configurations, multiline rows, different variety of separation lines, missing entries, etc. As such, the correct identification of the table-structure from an image is a nontrivial task. In this paper, we present a new table-structure identification model. The latter improves the latest end-toend deep learning model (i.e. encoder-dual-decoder from PubTabNet) in two significant ways. First, we introduce a new object detection decoder for table-cells. In this way, we can obtain the content of the table-cells from programmatic PDF's directly from the PDF source and avoid the training of the custom OCR decoders. This architectural change leads to more accurate table-content extraction and allows us to tackle non-english tables. Second, we replace the LSTM decoders with transformer based decoders. This upgrade improves significantly the previous state-of-the-art tree-editing-distance-score (TEDS) from 91% to 98.5% on simple tables and from 88.7% to 95% on complex tables.</caption>
 <table>
 <location><page_1><loc_52><loc_62><loc_88><loc_71></location>
-<caption>Tables organize valuable content in a concise and compact representation. This content is extremely valuable for systems such as search engines, Knowledge Graph's, etc, since they enhance their predictive capabilities. Unfortunately, tables come in a large variety of shapes and sizes. Furthermore, they can have complex column/row-header configurations, multiline rows, different variety of separation lines, missing entries, etc. As such, the correct identification of the table-structure from an image is a nontrivial task. In this paper, we present a new table-structure identification model. The latter improves the latest end-toend deep learning model (i.e. encoder-dual-decoder from PubTabNet) in two significant ways. First, we introduce a new object detection decoder for table-cells. In this way, we can obtain the content of the table-cells from programmatic PDF's directly from the PDF source and avoid the training of the custom OCR decoders. This architectural change leads to more accurate table-content extraction and allows us to tackle non-english tables. Second, we replace the LSTM decoders with transformer based decoders. This upgrade improves significantly the previous state-of-the-art tree-editing-distance-score (TEDS) from 91% to 98.5% on simple tables and from 88.7% to 95% on complex tables.</caption>
 <row_0><col_0><col_header>3</col_0><col_1><col_header>1</col_1></row_0>
 </table>
 <paragraph><location><page_1><loc_52><loc_58><loc_79><loc_60></location>- b. Red-annotation of bounding boxes, Blue-predictions by TableFormer</paragraph>
+<paragraph><location><page_1><loc_52><loc_46><loc_80><loc_47></location>- c. Structure predicted by TableFormer:</paragraph>
 <figure>
 <location><page_1><loc_51><loc_48><loc_88><loc_57></location>
 </figure>
-<paragraph><location><page_1><loc_52><loc_46><loc_80><loc_47></location>- c. Structure predicted by TableFormer:</paragraph>
 <figure>
 <location><page_1><loc_52><loc_37><loc_88><loc_45></location>
+<caption>Figure 1: Picture of a table with subtle, complex features such as (1) multi-column headers, (2) cell with multi-row text and (3) cells with no content. Image from PubTabNet evaluation set, filename: 'PMC2944238 004 02'.</caption>
 </figure>
-<caption><location><page_1><loc_50><loc_29><loc_89><loc_35></location>Figure 1: Picture of a table with subtle, complex features such as (1) multi-column headers, (2) cell with multi-row text and (3) cells with no content. Image from PubTabNet evaluation set, filename: 'PMC2944238 004 02'.</caption>
 <table>
 <location><page_1><loc_52><loc_37><loc_88><loc_45></location>
-<caption>Figure 1: Picture of a table with subtle, complex features such as (1) multi-column headers, (2) cell with multi-row text and (3) cells with no content. Image from PubTabNet evaluation set, filename: 'PMC2944238 004 02'.</caption>
 <row_0><col_0><col_header>0</col_0><col_1><col_header>1</col_1><col_2><col_header>1</col_2><col_3><col_header>2 1</col_3><col_4><col_header>2 1</col_4><col_5><body></col_5></row_0>
 <row_1><col_0><body>3</col_0><col_1><body>4</col_1><col_2><body>5 3</col_2><col_3><body>6</col_3><col_4><body>7</col_4><col_5><body></col_5></row_1>
 <row_2><col_0><body>8</col_0><col_1><body>9</col_1><col_2><body>10</col_2><col_3><body>11</col_3><col_4><body>12</col_4><col_5><body>2</col_5></row_2>
@@ -55,7 +53,6 @@
 <paragraph><location><page_3><loc_8><loc_21><loc_47><loc_38></location>Hybrid Deep Learning-Rule-Based approach : A popular current model for table-structure identification is the use of a hybrid Deep Learning-Rule-Based approach similar to [27, 29]. In this approach, one first detects the position of the table-cells with object detection (e.g. YoloVx or MaskRCNN), then classifies the table into different types (from its images) and finally uses different rule-sets to obtain its table-structure. Currently, this approach achieves stateof-the-art results, but is not an end-to-end deep-learning method. As such, new rules need to be written if different types of tables are encountered.</paragraph>
 <subtitle-level-1><location><page_3><loc_8><loc_18><loc_17><loc_20></location>3. Datasets</subtitle-level-1>
 <paragraph><location><page_3><loc_8><loc_10><loc_47><loc_17></location>We rely on large-scale datasets such as PubTabNet [37], FinTabNet [36], and TableBank [17] datasets to train and evaluate our models. These datasets span over various appearance styles and content. We also introduce our own synthetically generated SynthTabNet dataset to fix an im-</paragraph>
-<caption><location><page_3><loc_50><loc_64><loc_89><loc_66></location>Figure 2: Distribution of the tables across different table dimensions in PubTabNet + FinTabNet datasets</caption>
 <figure>
 <location><page_3><loc_51><loc_68><loc_90><loc_90></location>
 <caption>Figure 2: Distribution of the tables across different table dimensions in PubTabNet + FinTabNet datasets</caption>
@@ -68,7 +65,6 @@
 <paragraph><location><page_4><loc_8><loc_45><loc_47><loc_60></location>As it is illustrated in Fig. 2, the table distributions from all datasets are skewed towards simpler structures with fewer number of rows/columns. Additionally, there is very limited variance in the table styles, which in case of PubTabNet and FinTabNet means one styling format for the majority of the tables. Similar limitations appear also in the type of table content, which in some cases (e.g. FinTabNet) is restricted to a certain domain. Ultimately, the lack of diversity in the training dataset damages the ability of the models to generalize well on unseen data.</paragraph>
 <paragraph><location><page_4><loc_8><loc_21><loc_47><loc_45></location>Motivated by those observations we aimed at generating a synthetic table dataset named SynthTabNet . This approach offers control over: 1) the size of the dataset, 2) the table structure, 3) the table style and 4) the type of content. The complexity of the table structure is described by the size of the table header and the table body, as well as the percentage of the table cells covered by row spans and column spans. A set of carefully designed styling templates provides the basis to build a wide range of table appearances. Lastly, the table content is generated out of a curated collection of text corpora. By controlling the size and scope of the synthetic datasets we are able to train and evaluate our models in a variety of different conditions. For example, we can first generate a highly diverse dataset to train our models and then evaluate their performance on other synthetic datasets which are focused on a specific domain.</paragraph>
 <paragraph><location><page_4><loc_8><loc_10><loc_47><loc_20></location>In this regard, we have prepared four synthetic datasets, each one containing 150k examples. The corpora to generate the table text consists of the most frequent terms appearing in PubTabNet and FinTabNet together with randomly generated text. The first two synthetic datasets have been fine-tuned to mimic the appearance of the original datasets but encompass more complicated table structures. The third</paragraph>
-<caption><location><page_4><loc_50><loc_72><loc_89><loc_79></location>Table 1: Both "Combined-Tabnet" and "CombinedTabnet" are variations of the following: (*) The CombinedTabnet dataset is the processed combination of PubTabNet and Fintabnet. (**) The combined dataset is the processed combination of PubTabNet, Fintabnet and TableBank.</caption>
 <table>
 <location><page_4><loc_51><loc_80><loc_89><loc_91></location>
 <caption>Table 1: Both "Combined-Tabnet" and "CombinedTabnet" are variations of the following: (*) The CombinedTabnet dataset is the processed combination of PubTabNet and Fintabnet. (**) The combined dataset is the processed combination of PubTabNet, Fintabnet and TableBank.</caption>
@@ -80,6 +76,7 @@
 <row_5><col_0><row_header>Combined(**)</col_0><col_1><body>3</col_1><col_2><body>3</col_2><col_3><body>500k</col_3><col_4><body>PNG</col_4></row_5>
 <row_6><col_0><row_header>SynthTabNet</col_0><col_1><body>3</col_1><col_2><body>3</col_2><col_3><body>600k</col_3><col_4><body>PNG</col_4></row_6>
 </table>
+<caption><location><page_4><loc_50><loc_72><loc_89><loc_79></location>Table 1: Both "Combined-Tabnet" and "CombinedTabnet" are variations of the following: (*) The CombinedTabnet dataset is the processed combination of PubTabNet and Fintabnet. (**) The combined dataset is the processed combination of PubTabNet, Fintabnet and TableBank.</caption>
 <paragraph><location><page_4><loc_50><loc_63><loc_89><loc_68></location>one adopts a colorful appearance with high contrast and the last one contains tables with sparse content. Lastly, we have combined all synthetic datasets into one big unified synthetic dataset of 600k examples.</paragraph>
 <paragraph><location><page_4><loc_52><loc_61><loc_89><loc_62></location>Tab. 1 summarizes the various attributes of the datasets.</paragraph>
 <subtitle-level-1><location><page_4><loc_50><loc_58><loc_73><loc_59></location>4. The TableFormer model</subtitle-level-1>
@@ -87,12 +84,10 @@
 <subtitle-level-1><location><page_4><loc_50><loc_41><loc_69><loc_42></location>4.1. Model architecture.</subtitle-level-1>
 <paragraph><location><page_4><loc_50><loc_16><loc_89><loc_40></location>We now describe in detail the proposed method, which is composed of three main components, see Fig. 4. Our CNN Backbone Network encodes the input as a feature vector of predefined length. The input feature vector of the encoded image is passed to the Structure Decoder to produce a sequence of HTML tags that represent the structure of the table. With each prediction of an HTML standard data cell (' < td > ') the hidden state of that cell is passed to the Cell BBox Decoder. As for spanning cells, such as row or column span, the tag is broken down to ' < ', 'rowspan=' or 'colspan=', with the number of spanning cells (attribute), and ' > '. The hidden state attached to ' < ' is passed to the Cell BBox Decoder. A shared feed forward network (FFN) receives the hidden states from the Structure Decoder, to provide the final detection predictions of the bounding box coordinates and their classification.</paragraph>
 <paragraph><location><page_4><loc_50><loc_10><loc_89><loc_16></location>CNN Backbone Network. A ResNet-18 CNN is the backbone that receives the table image and encodes it as a vector of predefined length. The network has been modified by removing the linear and pooling layer, as we are not per-</paragraph>
-<caption><location><page_5><loc_8><loc_72><loc_89><loc_74></location>Figure 3: TableFormer takes in an image of the PDF and creates bounding box and HTML structure predictions that are synchronized. The bounding boxes grabs the content from the PDF and inserts it in the structure.</caption>
 <figure>
 <location><page_5><loc_12><loc_77><loc_85><loc_90></location>
 <caption>Figure 3: TableFormer takes in an image of the PDF and creates bounding box and HTML structure predictions that are synchronized. The bounding boxes grabs the content from the PDF and inserts it in the structure.</caption>
 </figure>
-<caption><location><page_5><loc_8><loc_14><loc_47><loc_33></location>Figure 4: Given an input image of a table, the Encoder produces fixed-length features that represent the input image. The features are then passed to both the Structure Decoder and Cell BBox Decoder . During training, the Structure Decoder receives 'tokenized tags' of the HTML code that represent the table structure. Afterwards, a transformer encoder and decoder architecture is employed to produce features that are received by a linear layer, and the Cell BBox Decoder. The linear layer is applied to the features to predict the tags. Simultaneously, the Cell BBox Decoder selects features referring to the data cells (' < td > ', ' < ') and passes them through an attention network, an MLP, and a linear layer to predict the bounding boxes.</caption>
 <figure>
 <location><page_5><loc_9><loc_36><loc_47><loc_67></location>
 <caption>Figure 4: Given an input image of a table, the Encoder produces fixed-length features that represent the input image. The features are then passed to both the Structure Decoder and Cell BBox Decoder . During training, the Structure Decoder receives 'tokenized tags' of the HTML code that represent the table structure. Afterwards, a transformer encoder and decoder architecture is employed to produce features that are received by a linear layer, and the Cell BBox Decoder. The linear layer is applied to the features to predict the tags. Simultaneously, the Cell BBox Decoder selects features referring to the data cells (' < td > ', ' < ') and passes them through an attention network, an MLP, and a linear layer to predict the bounding boxes.</caption>
@@ -110,8 +105,7 @@
 <subtitle-level-1><location><page_6><loc_8><loc_28><loc_28><loc_30></location>5. Experimental Results</subtitle-level-1>
 <subtitle-level-1><location><page_6><loc_8><loc_26><loc_29><loc_27></location>5.1. Implementation Details</subtitle-level-1>
 <paragraph><location><page_6><loc_8><loc_19><loc_47><loc_25></location>TableFormer uses ResNet-18 as the CNN Backbone Network . The input images are resized to 448*448 pixels and the feature map has a dimension of 28*28. Additionally, we enforce the following input constraints:</paragraph>
-<paragraph><location><page_6><loc_8><loc_10><loc_47><loc_13></location>Although input constraints are used also by other methods, such as EDD, ours are less restrictive due to the improved</paragraph>
-<paragraph><location><page_6><loc_50><loc_86><loc_89><loc_91></location>runtime performance and lower memory footprint of TableFormer. This allows to utilize input samples with longer sequences and images with larger dimensions.</paragraph>
+<paragraph><location><page_6><loc_8><loc_10><loc_47><loc_13></location><location><page_6><loc_8><loc_10><loc_47><loc_13></location>Although input constraints are used also by other methods, such as EDD, ours are less restrictive due to the improved runtime performance and lower memory footprint of TableFormer. This allows to utilize input samples with longer sequences and images with larger dimensions.</paragraph>
 <paragraph><location><page_6><loc_50><loc_59><loc_89><loc_85></location>The Transformer Encoder consists of two "Transformer Encoder Layers", with an input feature size of 512, feed forward network of 1024, and 4 attention heads. As for the Transformer Decoder it is composed of four "Transformer Decoder Layers" with similar input and output dimensions as the "Transformer Encoder Layers". Even though our model uses fewer layers and heads than the default implementation parameters, our extensive experimentation has proved this setup to be more suitable for table images. We attribute this finding to the inherent design of table images, which contain mostly lines and text, unlike the more elaborate content present in other scopes (e.g. the COCO dataset). Moreover, we have added ResNet blocks to the inputs of the Structure Decoder and Cell BBox Decoder. This prevents a decoder having a stronger influence over the learned weights which would damage the other prediction task (structure vs bounding boxes), but learn task specific weights instead. Lastly our dropout layers are set to 0.5.</paragraph>
 <paragraph><location><page_6><loc_50><loc_46><loc_89><loc_58></location>For training, TableFormer is trained with 3 Adam optimizers, each one for the CNN Backbone Network , Structure Decoder , and Cell BBox Decoder . Taking the PubTabNet as an example for our parameter set up, the initializing learning rate is 0.001 for 12 epochs with a batch size of 24, and λ set to 0.5. Afterwards, we reduce the learning rate to 0.0001, the batch size to 18 and train for 12 more epochs or convergence.</paragraph>
 <paragraph><location><page_6><loc_50><loc_30><loc_89><loc_45></location>TableFormer is implemented with PyTorch and Torchvision libraries [22]. To speed up the inference, the image undergoes a single forward pass through the CNN Backbone Network and transformer encoder. This eliminates the overhead of generating the same features for each decoding step. Similarly, we employ a 'caching' technique to preform faster autoregressive decoding. This is achieved by storing the features of decoded tokens so we can reuse them for each time step. Therefore, we only compute the attention for each new tag.</paragraph>
@@ -123,10 +117,8 @@
 <paragraph><location><page_7><loc_8><loc_73><loc_47><loc_77></location>where T$_{a}$ and T$_{b}$ represent tables in tree structure HTML format. EditDist denotes the tree-edit distance, and | T | represents the number of nodes in T .</paragraph>
 <subtitle-level-1><location><page_7><loc_8><loc_70><loc_28><loc_72></location>5.4. Quantitative Analysis</subtitle-level-1>
 <paragraph><location><page_7><loc_8><loc_50><loc_47><loc_69></location>Structure. As shown in Tab. 2, TableFormer outperforms all SOTA methods across different datasets by a large margin for predicting the table structure from an image. All the more, our model outperforms pre-trained methods. During the evaluation we do not apply any table filtering. We also provide our baseline results on the SynthTabNet dataset. It has been observed that large tables (e.g. tables that occupy half of the page or more) yield poor predictions. We attribute this issue to the image resizing during the preprocessing step, that produces downsampled images with indistinguishable features. This problem can be addressed by treating such big tables with a separate model which accepts a large input image size.</paragraph>
-<caption><location><page_7><loc_8><loc_23><loc_47><loc_25></location>Table 2: Structure results on PubTabNet (PTN), FinTabNet (FTN), TableBank (TB) and SynthTabNet (STN).</caption>
 <table>
 <location><page_7><loc_9><loc_26><loc_46><loc_48></location>
-<caption>Table 2: Structure results on PubTabNet (PTN), FinTabNet (FTN), TableBank (TB) and SynthTabNet (STN).</caption>
 <row_0><col_0><col_header>Model</col_0><col_1><col_header>Dataset</col_1><col_2><col_header>Simple</col_2><col_3><col_header>TEDS Complex</col_3><col_4><col_header>All</col_4></row_0>
 <row_1><col_0><row_header>EDD</col_0><col_1><body>PTN</col_1><col_2><body>91.1</col_2><col_3><body>88.7</col_3><col_4><body>89.9</col_4></row_1>
 <row_2><col_0><row_header>GTE</col_0><col_1><body>PTN</col_1><col_2><body>-</col_2><col_3><body>-</col_3><col_4><body>93.01</col_4></row_2>
@@ -139,10 +131,9 @@
 <row_9><col_0><row_header>TableFormer</col_0><col_1><body>TB</col_1><col_2><body>89.6</col_2><col_3><body>-</col_3><col_4><body>89.6</col_4></row_9>
 <row_10><col_0><row_header>TableFormer</col_0><col_1><body>STN</col_1><col_2><body>96.9</col_2><col_3><body>95.7</col_3><col_4><body>96.7</col_4></row_10>
 </table>
+<paragraph><location><page_7><loc_8><loc_23><loc_47><loc_25></location>Table 2: Structure results on PubTabNet (PTN), FinTabNet (FTN), TableBank (TB) and SynthTabNet (STN).</paragraph>
 <paragraph><location><page_7><loc_8><loc_21><loc_43><loc_22></location>FT: Model was trained on PubTabNet then finetuned.</paragraph>
-<paragraph><location><page_7><loc_8><loc_10><loc_47><loc_19></location>Cell Detection. Like any object detector, our Cell BBox Detector provides bounding boxes that can be improved with post-processing during inference. We make use of the grid-like structure of tables to refine the predictions. A detailed explanation on the post-processing is available in the supplementary material. As shown in Tab. 3, we evaluate</paragraph>
-<paragraph><location><page_7><loc_50><loc_71><loc_89><loc_91></location>our Cell BBox Decoder accuracy for cells with a class label of 'content' only using the PASCAL VOC mAP metric for pre-processing and post-processing. Note that we do not have post-processing results for SynthTabNet as images are only provided. To compare the performance of our proposed approach, we've integrated TableFormer's Cell BBox Decoder into EDD architecture. As mentioned previously, the Structure Decoder provides the Cell BBox Decoder with the features needed to predict the bounding box predictions. Therefore, the accuracy of the Structure Decoder directly influences the accuracy of the Cell BBox Decoder . If the Structure Decoder predicts an extra column, this will result in an extra column of predicted bounding boxes.</paragraph>
-<caption><location><page_7><loc_50><loc_57><loc_89><loc_60></location>Table 3: Cell Bounding Box detection results on PubTabNet, and FinTabNet. PP: Post-processing.</caption>
+<paragraph><location><page_7><loc_8><loc_10><loc_47><loc_19></location><location><page_7><loc_8><loc_10><loc_47><loc_19></location>Cell Detection. Like any object detector, our Cell BBox Detector provides bounding boxes that can be improved with post-processing during inference. We make use of the grid-like structure of tables to refine the predictions. A detailed explanation on the post-processing is available in the supplementary material. As shown in Tab. 3, we evaluate our Cell BBox Decoder accuracy for cells with a class label of 'content' only using the PASCAL VOC mAP metric for pre-processing and post-processing. Note that we do not have post-processing results for SynthTabNet as images are only provided. To compare the performance of our proposed approach, we've integrated TableFormer's Cell BBox Decoder into EDD architecture. As mentioned previously, the Structure Decoder provides the Cell BBox Decoder with the features needed to predict the bounding box predictions. Therefore, the accuracy of the Structure Decoder directly influences the accuracy of the Cell BBox Decoder . If the Structure Decoder predicts an extra column, this will result in an extra column of predicted bounding boxes.</paragraph>
 <table>
 <location><page_7><loc_50><loc_62><loc_87><loc_69></location>
 <caption>Table 3: Cell Bounding Box detection results on PubTabNet, and FinTabNet. PP: Post-processing.</caption>
@@ -151,8 +142,8 @@
 <row_2><col_0><body>TableFormer</col_0><col_1><body>PubTabNet</col_1><col_2><body>82.1</col_2><col_3><body>86.8</col_3></row_2>
 <row_3><col_0><body>TableFormer</col_0><col_1><body>SynthTabNet</col_1><col_2><body>87.7</col_2><col_3><body>-</col_3></row_3>
 </table>
+<caption><location><page_7><loc_50><loc_57><loc_89><loc_60></location>Table 3: Cell Bounding Box detection results on PubTabNet, and FinTabNet. PP: Post-processing.</caption>
 <paragraph><location><page_7><loc_50><loc_34><loc_89><loc_54></location>Cell Content. In this section, we evaluate the entire pipeline of recovering a table with content. Here we put our approach to test by capitalizing on extracting content from the PDF cells rather than decoding from images. Tab. 4 shows the TEDs score of HTML code representing the structure of the table along with the content inserted in the data cell and compared with the ground-truth. Our method achieved a 5.3% increase over the state-of-the-art, and commercial solutions. We believe our scores would be higher if the HTML ground-truth matched the extracted PDF cell content. Unfortunately, there are small discrepancies such as spacings around words or special characters with various unicode representations.</paragraph>
-<caption><location><page_7><loc_50><loc_13><loc_89><loc_17></location>Table 4: Results of structure with content retrieved using cell detection on PubTabNet. In all cases the input is PDF documents with cropped tables.</caption>
 <table>
 <location><page_7><loc_54><loc_19><loc_85><loc_32></location>
 <caption>Table 4: Results of structure with content retrieved using cell detection on PubTabNet. In all cases the input is PDF documents with cropped tables.</caption>
@@ -164,6 +155,7 @@
 <row_5><col_0><row_header>EDD</col_0><col_1><body>91.2</col_1><col_2><body>85.4</col_2><col_3><body>88.3</col_3></row_5>
 <row_6><col_0><row_header>TableFormer</col_0><col_1><body>95.4</col_1><col_2><body>90.1</col_2><col_3><body>93.6</col_3></row_6>
 </table>
+<caption><location><page_7><loc_50><loc_13><loc_89><loc_17></location>Table 4: Results of structure with content retrieved using cell detection on PubTabNet. In all cases the input is PDF documents with cropped tables.</caption>
 <paragraph><location><page_8><loc_9><loc_89><loc_10><loc_90></location>- a.</paragraph>
 <paragraph><location><page_8><loc_11><loc_89><loc_82><loc_90></location>- Red - PDF cells, Green - predicted bounding boxes, Blue - post-processed predictions matched to PDF cells</paragraph>
 <subtitle-level-1><location><page_8><loc_9><loc_87><loc_46><loc_88></location>Japanese language (previously unseen by TableFormer):</subtitle-level-1>
@@ -171,13 +163,13 @@
 <figure>
 <location><page_8><loc_8><loc_76><loc_49><loc_87></location>
 </figure>
-<caption><location><page_8><loc_9><loc_73><loc_63><loc_74></location>b. Structure predicted by TableFormer, with superimposed matched PDF cell text:</caption>
 <figure>
 <location><page_8><loc_50><loc_77><loc_91><loc_88></location>
 <caption>b. Structure predicted by TableFormer, with superimposed matched PDF cell text:</caption>
 </figure>
 <table>
 <location><page_8><loc_9><loc_63><loc_49><loc_72></location>
+<caption>Text is aligned to match original for ease of viewing</caption>
 <row_0><col_0><body></col_0><col_1><body></col_1><col_2><col_header>論文ファイル</col_2><col_3><col_header>論文ファイル</col_3><col_4><col_header>参考文献</col_4><col_5><col_header>参考文献</col_5></row_0>
 <row_1><col_0><col_header>出典</col_0><col_1><col_header>ファイル 数</col_1><col_2><col_header>英語</col_2><col_3><col_header>日本語</col_3><col_4><col_header>英語</col_4><col_5><col_header>日本語</col_5></row_1>
 <row_2><col_0><row_header>Association for Computational Linguistics(ACL2003)</col_0><col_1><body>65</col_1><col_2><body>65</col_2><col_3><body>0</col_3><col_4><body>150</col_4><col_5><body>0</col_5></row_2>
@@ -192,7 +184,6 @@
 <caption><location><page_8><loc_62><loc_62><loc_90><loc_63></location>Text is aligned to match original for ease of viewing</caption>
 <table>
 <location><page_8><loc_50><loc_64><loc_90><loc_72></location>
-<caption>Text is aligned to match original for ease of viewing</caption>
 <row_0><col_0><body></col_0><col_1><col_header>Shares (in millions)</col_1><col_2><col_header>Shares (in millions)</col_2><col_3><col_header>Weighted Average Grant Date Fair Value</col_3><col_4><col_header>Weighted Average Grant Date Fair Value</col_4></row_0>
 <row_1><col_0><body></col_0><col_1><col_header>RS U s</col_1><col_2><col_header>PSUs</col_2><col_3><col_header>RSUs</col_3><col_4><col_header>PSUs</col_4></row_1>
 <row_2><col_0><row_header>Nonvested on Janua ry 1</col_0><col_1><body>1. 1</col_1><col_2><body>0.3</col_2><col_3><body>90.10 $</col_3><col_4><body>$ 91.19</col_4></row_2>
@@ -201,38 +192,36 @@
 <row_5><col_0><row_header>Canceled or forfeited</col_0><col_1><body>(0. 1 )</col_1><col_2><body>-</col_2><col_3><body>102.01</col_3><col_4><body>92.18</col_4></row_5>
 <row_6><col_0><row_header>Nonvested on December 31</col_0><col_1><body>1.0</col_1><col_2><body>0.3</col_2><col_3><body>104.85 $</col_3><col_4><body>$ 104.51</col_4></row_6>
 </table>
-<caption><location><page_8><loc_8><loc_54><loc_89><loc_59></location>Figure 5: One of the benefits of TableFormer is that it is language agnostic, as an example, the left part of the illustration demonstrates TableFormer predictions on previously unseen language (Japanese). Additionally, we see that TableFormer is robust to variability in style and content, right side of the illustration shows the example of the TableFormer prediction from the FinTabNet dataset.</caption>
 <figure>
 <location><page_8><loc_8><loc_44><loc_35><loc_52></location>
+<caption>Figure 6: An example of TableFormer predictions (bounding boxes and structure) from generated SynthTabNet table.</caption>
+</figure>
+<figure>
+<location><page_8><loc_35><loc_44><loc_61><loc_52></location>
 <caption>Figure 5: One of the benefits of TableFormer is that it is language agnostic, as an example, the left part of the illustration demonstrates TableFormer predictions on previously unseen language (Japanese). Additionally, we see that TableFormer is robust to variability in style and content, right side of the illustration shows the example of the TableFormer prediction from the FinTabNet dataset.</caption>
 </figure>
 <figure>
 <location><page_8><loc_63><loc_44><loc_89><loc_52></location>
 </figure>
-<caption><location><page_8><loc_10><loc_41><loc_87><loc_42></location>Figure 6: An example of TableFormer predictions (bounding boxes and structure) from generated SynthTabNet table.</caption>
-<figure>
-<location><page_8><loc_35><loc_44><loc_61><loc_52></location>
-<caption>Figure 6: An example of TableFormer predictions (bounding boxes and structure) from generated SynthTabNet table.</caption>
-</figure>
 <subtitle-level-1><location><page_8><loc_8><loc_37><loc_27><loc_38></location>5.5. Qualitative Analysis</subtitle-level-1>
-<paragraph><location><page_8><loc_8><loc_10><loc_47><loc_32></location>We showcase several visualizations for the different components of our network on various "complex" tables within datasets presented in this work in Fig. 5 and Fig. 6 As it is shown, our model is able to predict bounding boxes for all table cells, even for the empty ones. Additionally, our post-processing techniques can extract the cell content by matching the predicted bounding boxes to the PDF cells based on their overlap and spatial proximity. The left part of Fig. 5 demonstrates also the adaptability of our method to any language, as it can successfully extract Japanese text, although the training set contains only English content. We provide more visualizations including the intermediate steps in the supplementary material. Overall these illustrations justify the versatility of our method across a diverse range of table appearances and content type.</paragraph>
 <subtitle-level-1><location><page_8><loc_50><loc_37><loc_75><loc_38></location>6. Future Work & Conclusion</subtitle-level-1>
+<paragraph><location><page_8><loc_8><loc_10><loc_47><loc_32></location>We showcase several visualizations for the different components of our network on various "complex" tables within datasets presented in this work in Fig. 5 and Fig. 6 As it is shown, our model is able to predict bounding boxes for all table cells, even for the empty ones. Additionally, our post-processing techniques can extract the cell content by matching the predicted bounding boxes to the PDF cells based on their overlap and spatial proximity. The left part of Fig. 5 demonstrates also the adaptability of our method to any language, as it can successfully extract Japanese text, although the training set contains only English content. We provide more visualizations including the intermediate steps in the supplementary material. Overall these illustrations justify the versatility of our method across a diverse range of table appearances and content type.</paragraph>
 <paragraph><location><page_8><loc_50><loc_18><loc_89><loc_35></location>In this paper, we presented TableFormer an end-to-end transformer based approach to predict table structures and bounding boxes of cells from an image. This approach enables us to recreate the table structure, and extract the cell content from PDF or OCR by using bounding boxes. Additionally, it provides the versatility required in real-world scenarios when dealing with various types of PDF documents, and languages. Furthermore, our method outperforms all state-of-the-arts with a wide margin. Finally, we introduce "SynthTabNet" a challenging synthetically generated dataset that reinforces missing characteristics from other datasets.</paragraph>
 <subtitle-level-1><location><page_8><loc_50><loc_14><loc_60><loc_15></location>References</subtitle-level-1>
 <paragraph><location><page_8><loc_51><loc_10><loc_89><loc_12></location>- [1] Nicolas Carion, Francisco Massa, Gabriel Synnaeve, Nicolas Usunier, Alexander Kirillov, and Sergey Zagoruyko. End-to-</paragraph>
 <paragraph><location><page_9><loc_11><loc_85><loc_47><loc_90></location>- end object detection with transformers. In Andrea Vedaldi, Horst Bischof, Thomas Brox, and Jan-Michael Frahm, editors, Computer Vision - ECCV 2020 , pages 213-229, Cham, 2020. Springer International Publishing. 5</paragraph>
 <paragraph><location><page_9><loc_9><loc_81><loc_47><loc_85></location>- [2] Zewen Chi, Heyan Huang, Heng-Da Xu, Houjin Yu, Wanxuan Yin, and Xian-Ling Mao. Complicated table structure recognition. arXiv preprint arXiv:1908.04729 , 2019. 3</paragraph>
 <paragraph><location><page_9><loc_9><loc_77><loc_47><loc_81></location>- [3] Bertrand Couasnon and Aurelie Lemaitre. Recognition of Tables and Forms , pages 647-677. Springer London, London, 2014. 2</paragraph>
-<paragraph><location><page_9><loc_9><loc_71><loc_47><loc_76></location>- [4] Herv'e D'ejean, Jean-Luc Meunier, Liangcai Gao, Yilun Huang, Yu Fang, Florian Kleber, and Eva-Maria Lang. ICDAR 2019 Competition on Table Detection and Recognition (cTDaR), Apr. 2019. http://sac.founderit.com/. 2</paragraph>
+<paragraph><location><page_9><loc_9><loc_71><loc_47><loc_76></location>- [4] Herv´e D´ejean, Jean-Luc Meunier, Liangcai Gao, Yilun Huang, Yu Fang, Florian Kleber, and Eva-Maria Lang. ICDAR 2019 Competition on Table Detection and Recognition (cTDaR), Apr. 2019. http://sac.founderit.com/. 2</paragraph>
 <paragraph><location><page_9><loc_9><loc_66><loc_47><loc_71></location>- [5] Basilios Gatos, Dimitrios Danatsas, Ioannis Pratikakis, and Stavros J Perantonis. Automatic table detection in document images. In International Conference on Pattern Recognition and Image Analysis , pages 609-618. Springer, 2005. 2</paragraph>
-<paragraph><location><page_9><loc_9><loc_60><loc_47><loc_65></location>- [6] Max Gobel, Tamir Hassan, Ermelinda Oro, and Giorgio Orsi. Icdar 2013 table competition. In 2013 12th International Conference on Document Analysis and Recognition , pages 1449-1453, 2013. 2</paragraph>
+<paragraph><location><page_9><loc_9><loc_60><loc_47><loc_65></location>- [6] Max G¨obel, Tamir Hassan, Ermelinda Oro, and Giorgio Orsi. Icdar 2013 table competition. In 2013 12th International Conference on Document Analysis and Recognition , pages 1449-1453, 2013. 2</paragraph>
 <paragraph><location><page_9><loc_9><loc_56><loc_47><loc_60></location>- [7] EA Green and M Krishnamoorthy. Recognition of tables using table grammars. procs. In Symposium on Document Analysis and Recognition (SDAIR'95) , pages 261-277. 2</paragraph>
 <paragraph><location><page_9><loc_9><loc_49><loc_47><loc_56></location>- [8] Khurram Azeem Hashmi, Alain Pagani, Marcus Liwicki, Didier Stricker, and Muhammad Zeshan Afzal. Castabdetectors: Cascade network for table detection in document images with recursive feature pyramid and switchable atrous convolution. Journal of Imaging , 7(10), 2021. 1</paragraph>
 <paragraph><location><page_9><loc_9><loc_45><loc_47><loc_49></location>- [9] Kaiming He, Georgia Gkioxari, Piotr Dollar, and Ross Girshick. Mask r-cnn. In Proceedings of the IEEE International Conference on Computer Vision (ICCV) , Oct 2017. 1</paragraph>
 <paragraph><location><page_9><loc_8><loc_39><loc_47><loc_44></location>- [10] Yelin He, X. Qi, Jiaquan Ye, Peng Gao, Yihao Chen, Bingcong Li, Xin Tang, and Rong Xiao. Pingan-vcgroup's solution for icdar 2021 competition on scientific table image recognition to latex. ArXiv , abs/2105.01846, 2021. 2</paragraph>
 <paragraph><location><page_9><loc_8><loc_32><loc_47><loc_39></location>- [11] Jianying Hu, Ramanujan S Kashi, Daniel P Lopresti, and Gordon Wilfong. Medium-independent table detection. In Document Recognition and Retrieval VII , volume 3967, pages 291-302. International Society for Optics and Photonics, 1999. 2</paragraph>
 <paragraph><location><page_9><loc_8><loc_25><loc_47><loc_32></location>- [12] Matthew Hurst. A constraint-based approach to table structure derivation. In Proceedings of the Seventh International Conference on Document Analysis and Recognition - Volume 2 , ICDAR '03, page 911, USA, 2003. IEEE Computer Society. 2</paragraph>
-<paragraph><location><page_9><loc_8><loc_18><loc_47><loc_25></location>- [13] Thotreingam Kasar, Philippine Barlas, Sebastien Adam, Cl'ement Chatelain, and Thierry Paquet. Learning to detect tables in scanned document images using line information. In 2013 12th International Conference on Document Analysis and Recognition , pages 1185-1189. IEEE, 2013. 2</paragraph>
+<paragraph><location><page_9><loc_8><loc_18><loc_47><loc_25></location>- [13] Thotreingam Kasar, Philippine Barlas, Sebastien Adam, Cl´ement Chatelain, and Thierry Paquet. Learning to detect tables in scanned document images using line information. In 2013 12th International Conference on Document Analysis and Recognition , pages 1185-1189. IEEE, 2013. 2</paragraph>
 <paragraph><location><page_9><loc_8><loc_14><loc_47><loc_18></location>- [14] Pratik Kayal, Mrinal Anand, Harsh Desai, and Mayank Singh. Icdar 2021 competition on scientific table image recognition to latex, 2021. 2</paragraph>
 <paragraph><location><page_9><loc_8><loc_10><loc_47><loc_14></location>- [15] Harold W Kuhn. The hungarian method for the assignment problem. Naval research logistics quarterly , 2(1-2):83-97, 1955. 6</paragraph>
 <paragraph><location><page_9><loc_50><loc_82><loc_89><loc_90></location>- [16] Girish Kulkarni, Visruth Premraj, Vicente Ordonez, Sagnik Dhar, Siming Li, Yejin Choi, Alexander C. Berg, and Tamara L. Berg. Babytalk: Understanding and generating simple image descriptions. IEEE Transactions on Pattern Analysis and Machine Intelligence , 35(12):2891-2903, 2013. 4</paragraph>
@@ -241,7 +230,7 @@
 <paragraph><location><page_9><loc_50><loc_59><loc_89><loc_67></location>- [19] Nikolaos Livathinos, Cesar Berrospi, Maksym Lysak, Viktor Kuropiatnyk, Ahmed Nassar, Andre Carvalho, Michele Dolfi, Christoph Auer, Kasper Dinkla, and Peter Staar. Robust pdf document conversion using recurrent neural networks. Proceedings of the AAAI Conference on Artificial Intelligence , 35(17):15137-15145, May 2021. 1</paragraph>
 <paragraph><location><page_9><loc_50><loc_53><loc_89><loc_58></location>- [20] Rujiao Long, Wen Wang, Nan Xue, Feiyu Gao, Zhibo Yang, Yongpan Wang, and Gui-Song Xia. Parsing table structures in the wild. In Proceedings of the IEEE/CVF International Conference on Computer Vision , pages 944-952, 2021. 2</paragraph>
 <paragraph><location><page_9><loc_50><loc_45><loc_89><loc_53></location>- [21] Shubham Singh Paliwal, D Vishwanath, Rohit Rahul, Monika Sharma, and Lovekesh Vig. Tablenet: Deep learning model for end-to-end table detection and tabular data extraction from scanned document images. In 2019 International Conference on Document Analysis and Recognition (ICDAR) , pages 128-133. IEEE, 2019. 1</paragraph>
-<paragraph><location><page_9><loc_50><loc_30><loc_89><loc_44></location>- [22] Adam Paszke, Sam Gross, Francisco Massa, Adam Lerer, James Bradbury, Gregory Chanan, Trevor Killeen, Zeming Lin, Natalia Gimelshein, Luca Antiga, Alban Desmaison, Andreas Kopf, Edward Yang, Zachary DeVito, Martin Raison, Alykhan Tejani, Sasank Chilamkurthy, Benoit Steiner, Lu Fang, Junjie Bai, and Soumith Chintala. Pytorch: An imperative style, high-performance deep learning library. In H. Wallach, H. Larochelle, A. Beygelzimer, F. d'Alch'e-Buc, E. Fox, and R. Garnett, editors, Advances in Neural Information Processing Systems 32 , pages 8024-8035. Curran Associates, Inc., 2019. 6</paragraph>
+<paragraph><location><page_9><loc_50><loc_30><loc_89><loc_44></location>- [22] Adam Paszke, Sam Gross, Francisco Massa, Adam Lerer, James Bradbury, Gregory Chanan, Trevor Killeen, Zeming Lin, Natalia Gimelshein, Luca Antiga, Alban Desmaison, Andreas Kopf, Edward Yang, Zachary DeVito, Martin Raison, Alykhan Tejani, Sasank Chilamkurthy, Benoit Steiner, Lu Fang, Junjie Bai, and Soumith Chintala. Pytorch: An imperative style, high-performance deep learning library. In H. Wallach, H. Larochelle, A. Beygelzimer, F. d'Alch´e-Buc, E. Fox, and R. Garnett, editors, Advances in Neural Information Processing Systems 32 , pages 8024-8035. Curran Associates, Inc., 2019. 6</paragraph>
 <paragraph><location><page_9><loc_50><loc_21><loc_89><loc_29></location>- [23] Devashish Prasad, Ayan Gadpal, Kshitij Kapadni, Manish Visave, and Kavita Sultanpure. Cascadetabnet: An approach for end to end table detection and structure recognition from image-based documents. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition Workshops , pages 572-573, 2020. 1</paragraph>
 <paragraph><location><page_9><loc_50><loc_16><loc_89><loc_21></location>- [24] Shah Rukh Qasim, Hassan Mahmood, and Faisal Shafait. Rethinking table recognition using graph neural networks. In 2019 International Conference on Document Analysis and Recognition (ICDAR) , pages 142-147. IEEE, 2019. 3</paragraph>
 <paragraph><location><page_9><loc_50><loc_10><loc_89><loc_15></location>- [25] Hamid Rezatofighi, Nathan Tsoi, JunYoung Gwak, Amir Sadeghian, Ian Reid, and Silvio Savarese. Generalized intersection over union: A metric and a loss for bounding box regression. In Proceedings of the IEEE/CVF Conference on</paragraph>
@@ -267,8 +256,7 @@
 <paragraph><location><page_11><loc_8><loc_21><loc_47><loc_51></location>We have developed a technique that tries to derive a missing bounding box out of its neighbors. As a first step, we use the annotation data to generate the most fine-grained grid that covers the table structure. In case of strict HTML tables, all grid squares are associated with some table cell and in the presence of table spans a cell extends across multiple grid squares. When enough bounding boxes are known for a rectangular table, it is possible to compute the geometrical border lines between the grid rows and columns. Eventually this information is used to generate the missing bounding boxes. Additionally, the existence of unused grid squares indicates that the table rows have unequal number of columns and the overall structure is non-strict. The generation of missing bounding boxes for non-strict HTML tables is ambiguous and therefore quite challenging. Thus, we have decided to simply discard those tables. In case of PubTabNet we have computed missing bounding boxes for 48% of the simple and 69% of the complex tables. Regarding FinTabNet, 68% of the simple and 98% of the complex tables require the generation of bounding boxes.</paragraph>
 <paragraph><location><page_11><loc_8><loc_18><loc_47><loc_20></location>Figure 7 illustrates the distribution of the tables across different dimensions per dataset.</paragraph>
 <subtitle-level-1><location><page_11><loc_8><loc_15><loc_25><loc_16></location>1.2. Synthetic datasets</subtitle-level-1>
-<paragraph><location><page_11><loc_8><loc_10><loc_47><loc_14></location>Aiming to train and evaluate our models in a broader spectrum of table data we have synthesized four types of datasets. Each one contains tables with different appear-</paragraph>
-<paragraph><location><page_11><loc_50><loc_74><loc_89><loc_79></location>ances in regard to their size, structure, style and content. Every synthetic dataset contains 150k examples, summing up to 600k synthetic examples. All datasets are divided into Train, Test and Val splits (80%, 10%, 10%).</paragraph>
+<paragraph><location><page_11><loc_8><loc_10><loc_47><loc_14></location><location><page_11><loc_8><loc_10><loc_47><loc_14></location>Aiming to train and evaluate our models in a broader spectrum of table data we have synthesized four types of datasets. Each one contains tables with different appear- ances in regard to their size, structure, style and content. Every synthetic dataset contains 150k examples, summing up to 600k synthetic examples. All datasets are divided into Train, Test and Val splits (80%, 10%, 10%).</paragraph>
 <paragraph><location><page_11><loc_50><loc_71><loc_89><loc_73></location>The process of generating a synthetic dataset can be decomposed into the following steps:</paragraph>
 <paragraph><location><page_11><loc_50><loc_60><loc_89><loc_70></location>- 1. Prepare styling and content templates: The styling templates have been manually designed and organized into groups of scope specific appearances (e.g. financial data, marketing data, etc.) Additionally, we have prepared curated collections of content templates by extracting the most frequently used terms out of non-synthetic datasets (e.g. PubTabNet, FinTabNet, etc.).</paragraph>
 <paragraph><location><page_11><loc_50><loc_43><loc_89><loc_60></location>- 2. Generate table structures: The structure of each synthetic dataset assumes a horizontal table header which potentially spans over multiple rows and a table body that may contain a combination of row spans and column spans. However, spans are not allowed to cross the header - body boundary. The table structure is described by the parameters: Total number of table rows and columns, number of header rows, type of spans (header only spans, row only spans, column only spans, both row and column spans), maximum span size and the ratio of the table area covered by spans.</paragraph>
@@ -277,13 +265,13 @@
 <paragraph><location><page_11><loc_50><loc_23><loc_89><loc_31></location>- 5. Render the complete tables: The synthetic table is finally rendered by a web browser engine to generate the bounding boxes for each table cell. A batching technique is utilized to optimize the runtime overhead of the rendering process.</paragraph>
 <subtitle-level-1><location><page_11><loc_50><loc_18><loc_89><loc_21></location>2. Prediction post-processing for PDF documents</subtitle-level-1>
 <paragraph><location><page_11><loc_50><loc_10><loc_89><loc_17></location>Although TableFormer can predict the table structure and the bounding boxes for tables recognized inside PDF documents, this is not enough when a full reconstruction of the original table is required. This happens mainly due the following reasons:</paragraph>
-<caption><location><page_12><loc_8><loc_76><loc_89><loc_79></location>Figure 7: Distribution of the tables across different dimensions per dataset. Simple vs complex tables per dataset and split, strict vs non strict html structures per dataset and table complexity, missing bboxes per dataset and table complexity.</caption>
 <figure>
 <location><page_12><loc_9><loc_81><loc_89><loc_91></location>
 <caption>Figure 7: Distribution of the tables across different dimensions per dataset. Simple vs complex tables per dataset and split, strict vs non strict html structures per dataset and table complexity, missing bboxes per dataset and table complexity.</caption>
 </figure>
 <paragraph><location><page_12><loc_10><loc_71><loc_47><loc_73></location>- · TableFormer output does not include the table cell content.</paragraph>
 <paragraph><location><page_12><loc_10><loc_67><loc_47><loc_69></location>- · There are occasional inaccuracies in the predictions of the bounding boxes.</paragraph>
+<paragraph><location><page_12><loc_50><loc_68><loc_89><loc_73></location>dian cell size for all table cells. The usage of median during the computations, helps to eliminate outliers caused by occasional column spans which are usually wider than the normal.</paragraph>
 <paragraph><location><page_12><loc_8><loc_50><loc_47><loc_65></location>However, it is possible to mitigate those limitations by combining the TableFormer predictions with the information already present inside a programmatic PDF document. More specifically, PDF documents can be seen as a sequence of PDF cells where each cell is described by its content and bounding box. If we are able to associate the PDF cells with the predicted table cells, we can directly link the PDF cell content to the table cell structure and use the PDF bounding boxes to correct misalignments in the predicted table cell bounding boxes.</paragraph>
 <paragraph><location><page_12><loc_8><loc_47><loc_47><loc_50></location>Here is a step-by-step description of the prediction postprocessing:</paragraph>
 <paragraph><location><page_12><loc_8><loc_42><loc_47><loc_47></location>- 1. Get the minimal grid dimensions - number of rows and columns for the predicted table structure. This represents the most granular grid for the underlying table structure.</paragraph>
@@ -293,7 +281,6 @@
 <paragraph><location><page_12><loc_8><loc_24><loc_47><loc_28></location>- 4. Find the best-fitting content alignment for the predicted cells with good IOU per each column. The alignment of the column can be identified by the following formula:</paragraph>
 <paragraph><location><page_12><loc_8><loc_13><loc_47><loc_16></location>where c is one of { left, centroid, right } and x$_{c}$ is the xcoordinate for the corresponding point.</paragraph>
 <paragraph><location><page_12><loc_8><loc_10><loc_47><loc_13></location>- 5. Use the alignment computed in step 4, to compute the median x -coordinate for all table columns and the me-</paragraph>
-<paragraph><location><page_12><loc_50><loc_68><loc_89><loc_73></location>dian cell size for all table cells. The usage of median during the computations, helps to eliminate outliers caused by occasional column spans which are usually wider than the normal.</paragraph>
 <paragraph><location><page_12><loc_50><loc_65><loc_89><loc_67></location>- 6. Snap all cells with bad IOU to their corresponding median x -coordinates and cell sizes.</paragraph>
 <paragraph><location><page_12><loc_50><loc_51><loc_89><loc_64></location>- 7. Generate a new set of pair-wise matches between the corrected bounding boxes and PDF cells. This time use a modified version of the IOU metric, where the area of the intersection between the predicted and PDF cells is divided by the PDF cell area. In case there are multiple matches for the same PDF cell, the prediction with the higher score is preferred. This covers the cases where the PDF cells are smaller than the area of predicted or corrected prediction cells.</paragraph>
 <paragraph><location><page_12><loc_50><loc_42><loc_89><loc_51></location>- 8. In some rare occasions, we have noticed that TableFormer can confuse a single column as two. When the postprocessing steps are applied, this results with two predicted columns pointing to the same PDF column. In such case we must de-duplicate the columns according to highest total column intersection score.</paragraph>
@@ -315,14 +302,15 @@
 <table>
 <location><page_13><loc_14><loc_54><loc_39><loc_61></location>
 </table>
-<caption><location><page_13><loc_10><loc_35><loc_45><loc_37></location>Figure 8: Example of a table with multi-line header.</caption>
 <table>
 <location><page_13><loc_14><loc_38><loc_41><loc_50></location>
-<caption>Figure 8: Example of a table with multi-line header.</caption>
 </table>
+<caption><location><page_13><loc_10><loc_35><loc_45><loc_37></location>Figure 8: Example of a table with multi-line header.</caption>
 <table>
 <location><page_13><loc_51><loc_83><loc_91><loc_87></location>
+<caption>Figure 9: Example of a table with big empty distance between cells.</caption>
 </table>
+<caption><location><page_13><loc_50><loc_59><loc_89><loc_61></location>Figure 9: Example of a table with big empty distance between cells.</caption>
 <table>
 <location><page_13><loc_51><loc_77><loc_91><loc_80></location>
 </table>
@@ -332,14 +320,14 @@
 <figure>
 <location><page_13><loc_51><loc_63><loc_70><loc_68></location>
 </figure>
-<caption><location><page_13><loc_50><loc_59><loc_89><loc_61></location>Figure 9: Example of a table with big empty distance between cells.</caption>
 <table>
 <location><page_13><loc_51><loc_63><loc_70><loc_68></location>
-<caption>Figure 9: Example of a table with big empty distance between cells.</caption>
 </table>
 <table>
 <location><page_13><loc_55><loc_45><loc_80><loc_51></location>
+<caption>Figure 10: Example of a complex table with empty cells.</caption>
 </table>
+<caption><location><page_13><loc_51><loc_13><loc_89><loc_14></location>Figure 10: Example of a complex table with empty cells.</caption>
 <table>
 <location><page_13><loc_55><loc_37><loc_80><loc_43></location>
 </table>
@@ -349,19 +337,16 @@
 <figure>
 <location><page_13><loc_55><loc_16><loc_85><loc_25></location>
 </figure>
-<caption><location><page_13><loc_51><loc_13><loc_89><loc_14></location>Figure 10: Example of a complex table with empty cells.</caption>
 <table>
 <location><page_13><loc_55><loc_16><loc_85><loc_25></location>
-<caption>Figure 10: Example of a complex table with empty cells.</caption>
 </table>
 <table>
 <location><page_14><loc_8><loc_57><loc_46><loc_65></location>
 </table>
-<caption><location><page_14><loc_8><loc_52><loc_47><loc_55></location>Figure 11: Simple table with different style and empty cells.</caption>
 <figure>
 <location><page_14><loc_8><loc_56><loc_46><loc_87></location>
-<caption>Figure 11: Simple table with different style and empty cells.</caption>
 </figure>
+<caption><location><page_14><loc_8><loc_52><loc_47><loc_55></location>Figure 11: Simple table with different style and empty cells.</caption>
 <table>
 <location><page_14><loc_8><loc_38><loc_51><loc_43></location>
 </table>
@@ -371,11 +356,10 @@
 <table>
 <location><page_14><loc_8><loc_25><loc_51><loc_30></location>
 </table>
-<caption><location><page_14><loc_9><loc_14><loc_46><loc_15></location>Figure 12: Simple table predictions and post processing.</caption>
 <figure>
 <location><page_14><loc_8><loc_17><loc_29><loc_23></location>
-<caption>Figure 12: Simple table predictions and post processing.</caption>
 </figure>
+<caption><location><page_14><loc_9><loc_14><loc_46><loc_15></location>Figure 12: Simple table predictions and post processing.</caption>
 <table>
 <location><page_14><loc_52><loc_73><loc_87><loc_80></location>
 </table>
@@ -385,24 +369,23 @@
 <table>
 <location><page_14><loc_54><loc_55><loc_86><loc_64></location>
 </table>
-<caption><location><page_14><loc_52><loc_52><loc_88><loc_53></location>Figure 13: Table predictions example on colorful table.</caption>
 <figure>
 <location><page_14><loc_52><loc_55><loc_87><loc_89></location>
 <caption>Figure 13: Table predictions example on colorful table.</caption>
 </figure>
 <table>
 <location><page_14><loc_52><loc_40><loc_85><loc_46></location>
+<caption>Figure 14: Example with multi-line text.</caption>
 </table>
+<caption><location><page_14><loc_56><loc_13><loc_83><loc_14></location>Figure 14: Example with multi-line text.</caption>
 <table>
 <location><page_14><loc_52><loc_32><loc_85><loc_38></location>
 </table>
 <table>
 <location><page_14><loc_52><loc_25><loc_85><loc_31></location>
 </table>
-<caption><location><page_14><loc_56><loc_13><loc_83><loc_14></location>Figure 14: Example with multi-line text.</caption>
 <table>
 <location><page_14><loc_52><loc_16><loc_87><loc_23></location>
-<caption>Figure 14: Example with multi-line text.</caption>
 </table>
 <figure>
 <location><page_15><loc_9><loc_69><loc_46><loc_83></location>
@@ -422,14 +405,11 @@
 <figure>
 <location><page_15><loc_8><loc_20><loc_52><loc_36></location>
 </figure>
-<caption><location><page_15><loc_14><loc_18><loc_41><loc_19></location>Figure 15: Example with triangular table.</caption>
-<table>
-<location><page_15><loc_8><loc_20><loc_52><loc_36></location>
-<caption>Figure 15: Example with triangular table.</caption>
-</table>
 <table>
 <location><page_15><loc_53><loc_72><loc_86><loc_85></location>
+<caption>Figure 15: Example with triangular table.</caption>
 </table>
+<caption><location><page_15><loc_14><loc_18><loc_41><loc_19></location>Figure 15: Example with triangular table.</caption>
 <table>
 <location><page_15><loc_53><loc_57><loc_86><loc_69></location>
 </table>
@@ -442,12 +422,13 @@
 <figure>
 <location><page_15><loc_58><loc_20><loc_81><loc_38></location>
 </figure>
-<caption><location><page_15><loc_50><loc_15><loc_89><loc_18></location>Figure 16: Example of how post-processing helps to restore mis-aligned bounding boxes prediction artifact.</caption>
 <table>
 <location><page_15><loc_58><loc_20><loc_81><loc_38></location>
-<caption>Figure 16: Example of how post-processing helps to restore mis-aligned bounding boxes prediction artifact.</caption>
 </table>
-<caption><location><page_16><loc_8><loc_33><loc_89><loc_36></location>Figure 17: Example of long table. End-to-end example from initial PDF cells to prediction of bounding boxes, post processing and prediction of structure.</caption>
+<table>
+<location><page_15><loc_8><loc_20><loc_52><loc_36></location>
+</table>
+<caption><location><page_15><loc_50><loc_15><loc_89><loc_18></location>Figure 16: Example of how post-processing helps to restore mis-aligned bounding boxes prediction artifact.</caption>
 <figure>
 <location><page_16><loc_11><loc_37><loc_86><loc_68></location>
 <caption>Figure 17: Example of long table. End-to-end example from initial PDF cells to prediction of bounding boxes, post processing and prediction of structure.</caption>
diff --git a/tests/data/groundtruth/docling_v1/2203.01017v2.json b/tests/data/groundtruth/docling_v1/2203.01017v2.json
index 6a30a45d..0b4c5874 100644
--- a/tests/data/groundtruth/docling_v1/2203.01017v2.json
+++ b/tests/data/groundtruth/docling_v1/2203.01017v2.json
@@ -1 +1 @@
-{"_name": "", "type": "pdf-document", "description": {"title": null, "abstract": null, "authors": null, "affiliations": null, "subjects": null, "keywords": null, "publication_date": null, "languages": null, "license": null, "publishers": null, "url_refs": null, "references": null, "publication": null, "reference_count": null, "citation_count": null, "citation_date": null, "advanced": null, "analytics": null, "logs": [], "collection": null, "acquisition": null}, "file-info": {"filename": "2203.01017v2.pdf", "filename-prov": null, "document-hash": "00be757f6bc94e7f75134e02e196d1c73ff960d52abb081a93104bba5a6470ff", "#-pages": 16, "collection-name": null, "description": null, "page-hashes": [{"hash": "56046b8a75e14ce81bf22f568f726b2bd7b8f82a885dbff3260d8945699796e4", "model": "default", "page": 1}, {"hash": "80f9116b4f8c9b08dc9763877dabaf65affef9c4a9a0f91a3673e8360aa95713", "model": "default", "page": 2}, {"hash": "8b422eca6675fcaa4919295eb9af624e581041dad8a5903bec7cb26254f2b59b", "model": "default", "page": 3}, {"hash": "a7f7a5799d183e4f3d0d8e917c3df1acd344e0abfaedebb9ed04f2f67844ad95", "model": "default", "page": 4}, {"hash": "14036095ac3b7fb802ff5c061cf5584f482de800aff7ed4eccfb67e5a89e1ba2", "model": "default", "page": 5}, {"hash": "633c440068e406a17f913cac0c2e3f0606f66111994bd2940726a56ea37274a0", "model": "default", "page": 6}, {"hash": "fb67646dad9c7255e55f305b59fb6f697fcf26875e085b63ac0729916ce60b6c", "model": "default", "page": 7}, {"hash": "acc79b977714a917605f6530c1df05f73f4cc0aa5d73b506fffe6287ae19a807", "model": "default", "page": 8}, {"hash": "bdb376928a3150909023df34ff94cd1eb12e1f90ae03a72834b74433ef498205", "model": "default", "page": 9}, {"hash": "df60cff4949de8851338c4fd85ad43f534cee1da4772f36b74b2341cad6ec5c9", "model": "default", "page": 10}, {"hash": "3df470edc2c1a275cfa920f7487a89fcb1825a9b009e85386b199cbfe80aff73", "model": "default", "page": 11}, {"hash": "f986169f2c0ff7997ccec2d71833cea7c5df4a641b92996c3f8fba9563441ad1", "model": "default", "page": 12}, {"hash": "ba03af2311ea8d68bf53cccda386ebf4ed68f14943fc421417799401a2afe95a", "model": "default", "page": 13}, {"hash": "1d63990cced2905e29696a09ad1bca47fcd15d584be32b4c7ab76c2f47f75d92", "model": "default", "page": 14}, {"hash": "fc40b9fb3698f24af7beda03b7afac10c3fcc6c73e83b4c6159785ea2991e2c4", "model": "default", "page": 15}, {"hash": "96080fce6eb8572fe319782f353a67661947f48e67607b1ffd8c01d617d075a7", "model": "default", "page": 16}]}, "main-text": [{"prov": [{"bbox": [18.340221405029297, 231.99996948242188, 36.339778900146484, 584.1799926757812], "page": 1, "span": [0, 38], "__ref_s3_data": null}], "text": "arXiv:2203.01017v2 [cs.CV] 11 Mar 2022", "type": "page-header", "payload": null, "name": "Page-header", "font": null}, {"prov": [{"bbox": [96.3010025024414, 672.0686645507812, 498.9270935058594, 684.9658813476562], "page": 1, "span": [0, 61], "__ref_s3_data": null}], "text": "TableFormer: Table Structure Understanding with Transformers.", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [142.4770050048828, 620.6796264648438, 452.7502746582031, 645.3146362304688], "page": 1, "span": [0, 73], "__ref_s3_data": null}], "text": "Ahmed Nassar, Nikolaos Livathinos, Maksym Lysak, Peter Staar IBM Research", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [208.123, 607.57446, 378.73257, 616.03876], "page": 1, "span": [0, 35], "__ref_s3_data": null}], "text": "{ ahn,nli,mly,taa } @zurich.ibm.com", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [145.99497985839844, 565.769287109375, 190.48028564453125, 576.5170288085938], "page": 1, "span": [0, 8], "__ref_s3_data": null}], "text": "Abstract", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [315.5670166015625, 565.2451782226562, 408.4407043457031, 573.9931640625], "page": 1, "span": [0, 22], "__ref_s3_data": null}], "text": "a. Picture of a table:", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [50.111976623535156, 241.30950927734375, 126.94803619384766, 252.05723571777344], "page": 1, "span": [0, 15], "__ref_s3_data": null}], "text": "1. Introduction", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [50.111976623535156, 78.84822082519531, 286.3650817871094, 231.216796875], "page": 1, "span": [0, 712], "__ref_s3_data": null}], "text": "The occurrence of tables in documents is ubiquitous. They often summarise quantitative or factual data, which is cumbersome to describe in verbose text but nevertheless extremely valuable. Unfortunately, this compact representation is often not easy to parse by machines. There are many implicit conventions used to obtain a compact table representation. For example, tables often have complex columnand row-headers in order to reduce duplicated cell content. Lines of different shapes and sizes are leveraged to separate content or indicate a tree structure. Additionally, tables can also have empty/missing table-entries or multi-row textual table-entries. Fig. 1 shows a table which presents all these issues.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"name": "Picture", "type": "figure", "$ref": "#/figures/0"}, {"prov": [{"bbox": [50.111976623535156, 279.00335693359375, 286.3651123046875, 550.6049194335938], "page": 1, "span": [0, 1320], "__ref_s3_data": null}], "text": "Tables organize valuable content in a concise and compact representation. This content is extremely valuable for systems such as search engines, Knowledge Graph's, etc, since they enhance their predictive capabilities. Unfortunately, tables come in a large variety of shapes and sizes. Furthermore, they can have complex column/row-header configurations, multiline rows, different variety of separation lines, missing entries, etc. As such, the correct identification of the table-structure from an image is a nontrivial task. In this paper, we present a new table-structure identification model. The latter improves the latest end-toend deep learning model (i.e. encoder-dual-decoder from PubTabNet) in two significant ways. First, we introduce a new object detection decoder for table-cells. In this way, we can obtain the content of the table-cells from programmatic PDF's directly from the PDF source and avoid the training of the custom OCR decoders. This architectural change leads to more accurate table-content extraction and allows us to tackle non-english tables. Second, we replace the LSTM decoders with transformer based decoders. This upgrade improves significantly the previous state-of-the-art tree-editing-distance-score (TEDS) from 91% to 98.5% on simple tables and from 88.7% to 95% on complex tables.", "type": "caption", "payload": null, "name": "Caption", "font": null}, {"name": "Table", "type": "table", "$ref": "#/tables/0"}, {"prov": [{"bbox": [315.5670166015625, 458.7572021484375, 486.4019470214844, 478.3052062988281], "page": 1, "span": [0, 68], "__ref_s3_data": null}], "text": "- b. Red-annotation of bounding boxes, Blue-predictions by TableFormer", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"name": "Picture", "type": "figure", "$ref": "#/figures/1"}, {"prov": [{"bbox": [315.5670166015625, 363.0691833496094, 491.1912536621094, 371.81719970703125], "page": 1, "span": [0, 38], "__ref_s3_data": null}], "text": "- c. Structure predicted by TableFormer:", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"name": "Picture", "type": "figure", "$ref": "#/figures/2"}, {"prov": [{"bbox": [308.86199951171875, 232.7270965576172, 545.1151733398438, 277.4996337890625], "page": 1, "span": [0, 220], "__ref_s3_data": null}], "text": "Figure 1: Picture of a table with subtle, complex features such as (1) multi-column headers, (2) cell with multi-row text and (3) cells with no content. Image from PubTabNet evaluation set, filename: 'PMC2944238 004 02'.", "type": "caption", "payload": null, "name": "Caption", "font": null}, {"name": "Table", "type": "table", "$ref": "#/tables/1"}, {"prov": [{"bbox": [308.86199951171875, 126.95307159423828, 545.1151733398438, 207.59063720703125], "page": 1, "span": [0, 363], "__ref_s3_data": null}], "text": "Recently, significant progress has been made with vision based approaches to extract tables in documents. For the sake of completeness, the issue of table extraction from documents is typically decomposed into two separate challenges, i.e. (1) finding the location of the table(s) on a document-page and (2) finding the structure of a given table in the document.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [308.86199951171875, 78.84806823730469, 545.1151123046875, 123.61963653564453], "page": 1, "span": [0, 229], "__ref_s3_data": null}], "text": "The first problem is called table-location and has been previously addressed [30, 38, 19, 21, 23, 26, 8] with stateof-the-art object-detection networks (e.g. YOLO and later on Mask-RCNN [9]). For all practical purposes, it can be", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [295.1210021972656, 48.9600715637207, 300.102294921875, 57.866634368896484], "page": 1, "span": [0, 1], "__ref_s3_data": null}], "text": "1", "type": "page-footer", "payload": null, "name": "Page-footer", "font": null}, {"prov": [{"bbox": [50.11199951171875, 695.9300537109375, 286.36505126953125, 716.7916259765625], "page": 2, "span": [0, 75], "__ref_s3_data": null}], "text": "considered as a solved problem, given enough ground-truth data to train on.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [50.11199951171875, 563.9699096679688, 286.3651428222656, 692.4285888671875], "page": 2, "span": [0, 626], "__ref_s3_data": null}], "text": "The second problem is called table-structure decomposition. The latter is a long standing problem in the community of document understanding [6, 4, 14]. Contrary to the table-location problem, there are no commonly used approaches that can easily be re-purposed to solve this problem. Lately, a set of new model-architectures has been proposed by the community to address table-structure decomposition [37, 36, 18, 20]. All these models have some weaknesses (see Sec. 2). The common denominator here is the reliance on textual features and/or the inability to provide the bounding box of each table-cell in the original image.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [50.11199951171875, 420.054931640625, 286.3651123046875, 560.4684448242188], "page": 2, "span": [0, 643], "__ref_s3_data": null}], "text": "In this paper, we want to address these weaknesses and present a robust table-structure decomposition algorithm. The design criteria for our model are the following. First, we want our algorithm to be language agnostic. In this way, we can obtain the structure of any table, irregardless of the language. Second, we want our algorithm to leverage as much data as possible from the original PDF document. For programmatic PDF documents, the text-cells can often be extracted much faster and with higher accuracy compared to OCR methods. Last but not least, we want to have a direct link between the table-cell and its bounding box in the image.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [50.11199951171875, 359.8269958496094, 286.3665771484375, 416.5534973144531], "page": 2, "span": [0, 242], "__ref_s3_data": null}], "text": "To meet the design criteria listed above, we developed a new model called TableFormer and a synthetically generated table structure dataset called SynthTabNet $^{1}$. In particular, our contributions in this work can be summarised as follows:", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [61.56901550292969, 302.6770324707031, 286.3648986816406, 347.568115234375], "page": 2, "span": [0, 166], "__ref_s3_data": null}], "text": "- \u00b7 We propose TableFormer , a transformer based model that predicts tables structure and bounding boxes for the table content simultaneously in an end-to-end approach.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [61.56901550292969, 245.0740509033203, 286.3648986816406, 289.9661560058594], "page": 2, "span": [0, 181], "__ref_s3_data": null}], "text": "- \u00b7 Across all benchmark datasets TableFormer significantly outperforms existing state-of-the-art metrics, while being much more efficient in training and inference to existing works.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [61.569000244140625, 199.4270477294922, 286.36492919921875, 232.3631591796875], "page": 2, "span": [0, 106], "__ref_s3_data": null}], "text": "- \u00b7 We present SynthTabNet a synthetically generated dataset, with various appearance styles and complexity.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [61.569007873535156, 153.779052734375, 286.3650817871094, 186.5966033935547], "page": 2, "span": [0, 131], "__ref_s3_data": null}], "text": "- \u00b7 An augmented dataset based on PubTabNet [37], FinTabNet [36], and TableBank [17] with generated ground-truth for reproducibility.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [50.11200714111328, 96.63004302978516, 286.3651123046875, 141.401611328125], "page": 2, "span": [0, 231], "__ref_s3_data": null}], "text": "The paper is structured as follows. In Sec. 2, we give a brief overview of the current state-of-the-art. In Sec. 3, we describe the datasets on which we train. In Sec. 4, we introduce the TableFormer model-architecture and describe", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [60.97100067138672, 79.27845764160156, 183.7305450439453, 86.40372467041016], "page": 2, "span": [0, 40], "__ref_s3_data": null}], "text": "$^{1}$https://github.com/IBM/SynthTabNet", "type": "footnote", "payload": null, "name": "Footnote", "font": null}, {"prov": [{"bbox": [295.1210021972656, 48.96015548706055, 300.102294921875, 57.86671829223633], "page": 2, "span": [0, 1], "__ref_s3_data": null}], "text": "2", "type": "page-footer", "payload": null, "name": "Page-footer", "font": null}, {"prov": [{"bbox": [308.86199951171875, 683.9750366210938, 545.1151123046875, 716.7916259765625], "page": 2, "span": [0, 166], "__ref_s3_data": null}], "text": "its results & performance in Sec. 5. As a conclusion, we describe how this new model-architecture can be re-purposed for other tasks in the computer-vision community.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [308.86199951171875, 659.5203247070312, 498.28021240234375, 670.26806640625], "page": 2, "span": [0, 37], "__ref_s3_data": null}], "text": "2. Previous work and State of the Art", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [308.86199951171875, 461.54498291015625, 545.1151733398438, 649.7786254882812], "page": 2, "span": [0, 901], "__ref_s3_data": null}], "text": "Identifying the structure of a table has been an outstanding problem in the document-parsing community, that motivates many organised public challenges [6, 4, 14]. The difficulty of the problem can be attributed to a number of factors. First, there is a large variety in the shapes and sizes of tables. Such large variety requires a flexible method. This is especially true for complex column- and row headers, which can be extremely intricate and demanding. A second factor of complexity is the lack of data with regard to table-structure. Until the publication of PubTabNet [37], there were no large datasets (i.e. > 100 K tables) that provided structure information. This happens primarily due to the fact that tables are notoriously time-consuming to annotate by hand. However, this has definitely changed in recent years with the deliverance of PubTabNet [37], FinTabNet [36], TableBank [17] etc.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [308.86199951171875, 341.9270935058594, 545.115234375, 458.4305419921875], "page": 2, "span": [0, 552], "__ref_s3_data": null}], "text": "Before the rising popularity of deep neural networks, the community relied heavily on heuristic and/or statistical methods to do table structure identification [3, 7, 11, 5, 13, 28]. Although such methods work well on constrained tables [12], a more data-driven approach can be applied due to the advent of convolutional neural networks (CNNs) and the availability of large datasets. To the best-of-our knowledge, there are currently two different types of network architecture that are being pursued for state-of-the-art tablestructure identification.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [308.8619689941406, 78.84815216064453, 545.1168823242188, 338.9322204589844], "page": 2, "span": [0, 1262], "__ref_s3_data": null}], "text": "Image-to-Text networks : In this type of network, one predicts a sequence of tokens starting from an encoded image. Such sequences of tokens can be HTML table tags [37, 17] or LaTeX symbols[10]. The choice of symbols is ultimately not very important, since one can be transformed into the other. There are however subtle variations in the Image-to-Text networks. The easiest network architectures are \"image-encoder \u2192 text-decoder\" (IETD), similar to network architectures that try to provide captions to images [32]. In these IETD networks, one expects as output the LaTeX/HTML string of the entire table, i.e. the symbols necessary for creating the table with the content of the table. Another approach is the \"image-encoder \u2192 dual decoder\" (IEDD) networks. In these type of networks, one has two consecutive decoders with different purposes. The first decoder is the tag-decoder , i.e. it only produces the HTML/LaTeX tags which construct an empty table. The second content-decoder uses the encoding of the image in combination with the output encoding of each cell-tag (from the tag-decoder ) to generate the textual content of each table cell. The network architecture of IEDD is certainly more elaborate, but it has the advantage that one can pre-train the", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [50.11199951171875, 707.8850708007812, 250.15101623535156, 716.7916259765625], "page": 3, "span": [0, 51], "__ref_s3_data": null}], "text": "tag-decoder which is constrained to the table-tags.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [50.11199951171875, 516.5458984375, 286.3651428222656, 704.7806396484375], "page": 3, "span": [0, 864], "__ref_s3_data": null}], "text": "In practice, both network architectures (IETD and IEDD) require an implicit, custom trained object-characterrecognition (OCR) to obtain the content of the table-cells. In the case of IETD, this OCR engine is implicit in the decoder similar to [24]. For the IEDD, the OCR is solely embedded in the content-decoder. This reliance on a custom, implicit OCR decoder is of course problematic. OCR is a well known and extremely tough problem, that often needs custom training for each individual language. However, the limited availability for non-english content in the current datasets, makes it impractical to apply the IETD and IEDD methods on tables with other languages. Additionally, OCR can be completely omitted if the tables originate from programmatic PDF documents with known positions of each cell. The latter was the inspiration for the work of this paper.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [50.11199188232422, 301.297119140625, 286.3651123046875, 513.56103515625], "page": 3, "span": [0, 1007], "__ref_s3_data": null}], "text": "Graph Neural networks : Graph Neural networks (GNN's) take a radically different approach to tablestructure extraction. Note that one table cell can constitute out of multiple text-cells. To obtain the table-structure, one creates an initial graph, where each of the text-cells becomes a node in the graph similar to [33, 34, 2]. Each node is then associated with en embedding vector coming from the encoded image, its coordinates and the encoded text. Furthermore, nodes that represent adjacent text-cells are linked. Graph Convolutional Networks (GCN's) based methods take the image as an input, but also the position of the text-cells and their content [18]. The purpose of a GCN is to transform the input graph into a new graph, which replaces the old links with new ones. The new links then represent the table-structure. With this approach, one can avoid the need to build custom OCR decoders. However, the quality of the reconstructed structure is not comparable to the current state-of-the-art [18].", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [50.11198425292969, 169.733154296875, 286.36627197265625, 298.3112487792969], "page": 3, "span": [0, 619], "__ref_s3_data": null}], "text": "Hybrid Deep Learning-Rule-Based approach : A popular current model for table-structure identification is the use of a hybrid Deep Learning-Rule-Based approach similar to [27, 29]. In this approach, one first detects the position of the table-cells with object detection (e.g. YoloVx or MaskRCNN), then classifies the table into different types (from its images) and finally uses different rule-sets to obtain its table-structure. Currently, this approach achieves stateof-the-art results, but is not an end-to-end deep-learning method. As such, new rules need to be written if different types of tables are encountered.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [50.11198425292969, 145.30743408203125, 105.22545623779297, 156.05516052246094], "page": 3, "span": [0, 11], "__ref_s3_data": null}], "text": "3. Datasets", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [50.11198425292969, 78.84813690185547, 286.3650817871094, 135.57470703125], "page": 3, "span": [0, 281], "__ref_s3_data": null}], "text": "We rely on large-scale datasets such as PubTabNet [37], FinTabNet [36], and TableBank [17] datasets to train and evaluate our models. These datasets span over various appearance styles and content. We also introduce our own synthetically generated SynthTabNet dataset to fix an im-", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [295.1210021972656, 48.96023941040039, 300.102294921875, 57.86680221557617], "page": 3, "span": [0, 1], "__ref_s3_data": null}], "text": "3", "type": "page-footer", "payload": null, "name": "Page-footer", "font": null}, {"prov": [{"bbox": [308.86199951171875, 503.3020935058594, 545.1151123046875, 524.1636352539062], "page": 3, "span": [0, 104], "__ref_s3_data": null}], "text": "Figure 2: Distribution of the tables across different table dimensions in PubTabNet + FinTabNet datasets", "type": "caption", "payload": null, "name": "Caption", "font": null}, {"name": "Picture", "type": "figure", "$ref": "#/figures/3"}, {"prov": [{"bbox": [308.86199951171875, 465.6200866699219, 437.27001953125, 474.5266418457031], "page": 3, "span": [0, 33], "__ref_s3_data": null}], "text": "balance in the previous datasets.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [308.86199951171875, 164.6382598876953, 545.1151733398438, 460.4686279296875], "page": 3, "span": [0, 1400], "__ref_s3_data": null}], "text": "The PubTabNet dataset contains 509k tables delivered as annotated PNG images. The annotations consist of the table structure represented in HTML format, the tokenized text and its bounding boxes per table cell. Fig. 1 shows the appearance style of PubTabNet. Depending on its complexity, a table is characterized as \"simple\" when it does not contain row spans or column spans, otherwise it is \"complex\". The dataset is divided into Train and Val splits (roughly 98% and 2%). The Train split consists of 54% simple and 46% complex tables and the Val split of 51% and 49% respectively. The FinTabNet dataset contains 112k tables delivered as single-page PDF documents with mixed table structures and text content. Similarly to the PubTabNet, the annotations of FinTabNet include the table structure in HTML, the tokenized text and the bounding boxes on a table cell basis. The dataset is divided into Train, Test and Val splits (81%, 9.5%, 9.5%), and each one is almost equally divided into simple and complex tables (Train: 48% simple, 52% complex, Test: 48% simple, 52% complex, Test: 53% simple, 47% complex). Finally the TableBank dataset consists of 145k tables provided as JPEG images. The latter has annotations for the table structure, but only few with bounding boxes of the table cells. The entire dataset consists of simple tables and it is divided into 90% Train, 3% Test and 7% Val splits.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [308.86199951171875, 78.84823608398438, 545.1151123046875, 159.48580932617188], "page": 3, "span": [0, 406], "__ref_s3_data": null}], "text": "Due to the heterogeneity across the dataset formats, it was necessary to combine all available data into one homogenized dataset before we could train our models for practical purposes. Given the size of PubTabNet, we adopted its annotation format and we extracted and converted all tables as PNG images with a resolution of 72 dpi. Additionally, we have filtered out tables with extreme sizes due to small", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [50.11199951171875, 695.9300537109375, 286.3651123046875, 716.7916259765625], "page": 4, "span": [0, 93], "__ref_s3_data": null}], "text": "amount of such tables, and kept only those ones ranging between 1*1 and 20*10 (rows/columns).", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [50.11199951171875, 478.8949279785156, 286.3651428222656, 691.0396118164062], "page": 4, "span": [0, 983], "__ref_s3_data": null}], "text": "The availability of the bounding boxes for all table cells is essential to train our models. In order to distinguish between empty and non-empty bounding boxes, we have introduced a binary class in the annotation. Unfortunately, the original datasets either omit the bounding boxes for whole tables (e.g. TableBank) or they narrow their scope only to non-empty cells. Therefore, it was imperative to introduce a data pre-processing procedure that generates the missing bounding boxes out of the annotation information. This procedure first parses the provided table structure and calculates the dimensions of the most fine-grained grid that covers the table structure. Notice that each table cell may occupy multiple grid squares due to row or column spans. In case of PubTabNet we had to compute missing bounding boxes for 48% of the simple and 69% of the complex tables. Regarding FinTabNet, 68% of the simple and 98% of the complex tables require the generation of bounding boxes.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [50.11199951171875, 357.50103759765625, 286.3651123046875, 474.0044860839844], "page": 4, "span": [0, 571], "__ref_s3_data": null}], "text": "As it is illustrated in Fig. 2, the table distributions from all datasets are skewed towards simpler structures with fewer number of rows/columns. Additionally, there is very limited variance in the table styles, which in case of PubTabNet and FinTabNet means one styling format for the majority of the tables. Similar limitations appear also in the type of table content, which in some cases (e.g. FinTabNet) is restricted to a certain domain. Ultimately, the lack of diversity in the training dataset damages the ability of the models to generalize well on unseen data.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [50.11199951171875, 164.37611389160156, 286.3665466308594, 352.610595703125], "page": 4, "span": [0, 941], "__ref_s3_data": null}], "text": "Motivated by those observations we aimed at generating a synthetic table dataset named SynthTabNet . This approach offers control over: 1) the size of the dataset, 2) the table structure, 3) the table style and 4) the type of content. The complexity of the table structure is described by the size of the table header and the table body, as well as the percentage of the table cells covered by row spans and column spans. A set of carefully designed styling templates provides the basis to build a wide range of table appearances. Lastly, the table content is generated out of a curated collection of text corpora. By controlling the size and scope of the synthetic datasets we are able to train and evaluate our models in a variety of different conditions. For example, we can first generate a highly diverse dataset to train our models and then evaluate their performance on other synthetic datasets which are focused on a specific domain.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [50.11201477050781, 78.84810638427734, 286.3651123046875, 159.4856719970703], "page": 4, "span": [0, 405], "__ref_s3_data": null}], "text": "In this regard, we have prepared four synthetic datasets, each one containing 150k examples. The corpora to generate the table text consists of the most frequent terms appearing in PubTabNet and FinTabNet together with randomly generated text. The first two synthetic datasets have been fine-tuned to mimic the appearance of the original datasets but encompass more complicated table structures. The third", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [295.1209716796875, 48.96018600463867, 300.1022644042969, 57.86674880981445], "page": 4, "span": [0, 1], "__ref_s3_data": null}], "text": "4", "type": "page-footer", "payload": null, "name": "Page-footer", "font": null}, {"prov": [{"bbox": [308.86199951171875, 567.6110229492188, 545.1150512695312, 624.338623046875], "page": 4, "span": [0, 267], "__ref_s3_data": null}], "text": "Table 1: Both \"Combined-Tabnet\" and \"CombinedTabnet\" are variations of the following: (*) The CombinedTabnet dataset is the processed combination of PubTabNet and Fintabnet. (**) The combined dataset is the processed combination of PubTabNet, Fintabnet and TableBank.", "type": "caption", "payload": null, "name": "Caption", "font": null}, {"name": "Table", "type": "table", "$ref": "#/tables/2"}, {"prov": [{"bbox": [308.86199951171875, 497.6080322265625, 545.1151733398438, 542.3795776367188], "page": 4, "span": [0, 210], "__ref_s3_data": null}], "text": "one adopts a colorful appearance with high contrast and the last one contains tables with sparse content. Lastly, we have combined all synthetic datasets into one big unified synthetic dataset of 600k examples.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [320.8169860839844, 485.321044921875, 542.7439575195312, 494.22760009765625], "page": 4, "span": [0, 57], "__ref_s3_data": null}], "text": "Tab. 1 summarizes the various attributes of the datasets.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [308.86199951171875, 460.0683288574219, 444.9360656738281, 470.8160400390625], "page": 4, "span": [0, 24], "__ref_s3_data": null}], "text": "4. The TableFormer model", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [308.86199951171875, 345.5131530761719, 545.115234375, 450.06060791015625], "page": 4, "span": [0, 504], "__ref_s3_data": null}], "text": "Given the image of a table, TableFormer is able to predict: 1) a sequence of tokens that represent the structure of a table, and 2) a bounding box coupled to a subset of those tokens. The conversion of an image into a sequence of tokens is a well-known task [35, 16]. While attention is often used as an implicit method to associate each token of the sequence with a position in the original image, an explicit association between the individual table-cells and the image bounding boxes is also required.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [308.86199951171875, 324.45367431640625, 420.16058349609375, 334.30572509765625], "page": 4, "span": [0, 24], "__ref_s3_data": null}], "text": "4.1. Model architecture.", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [308.8619689941406, 127.00019073486328, 545.11572265625, 315.2347106933594], "page": 4, "span": [0, 907], "__ref_s3_data": null}], "text": "We now describe in detail the proposed method, which is composed of three main components, see Fig. 4. Our CNN Backbone Network encodes the input as a feature vector of predefined length. The input feature vector of the encoded image is passed to the Structure Decoder to produce a sequence of HTML tags that represent the structure of the table. With each prediction of an HTML standard data cell (' < td > ') the hidden state of that cell is passed to the Cell BBox Decoder. As for spanning cells, such as row or column span, the tag is broken down to ' < ', 'rowspan=' or 'colspan=', with the number of spanning cells (attribute), and ' > '. The hidden state attached to ' < ' is passed to the Cell BBox Decoder. A shared feed forward network (FFN) receives the hidden states from the Structure Decoder, to provide the final detection predictions of the bounding box coordinates and their classification.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [308.8619689941406, 78.84818267822266, 545.1151123046875, 123.73930358886719], "page": 4, "span": [0, 223], "__ref_s3_data": null}], "text": "CNN Backbone Network. A ResNet-18 CNN is the backbone that receives the table image and encodes it as a vector of predefined length. The network has been modified by removing the linear and pooling layer, as we are not per-", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [50.11199188232422, 567.0330810546875, 545.1084594726562, 588.0142211914062], "page": 5, "span": [0, 212], "__ref_s3_data": null}], "text": "Figure 3: TableFormer takes in an image of the PDF and creates bounding box and HTML structure predictions that are synchronized. The bounding boxes grabs the content from the PDF and inserts it in the structure.", "type": "caption", "payload": null, "name": "Caption", "font": null}, {"name": "Picture", "type": "figure", "$ref": "#/figures/4"}, {"prov": [{"bbox": [50.11199951171875, 111.72905731201172, 286.365966796875, 264.2171936035156], "page": 5, "span": [0, 745], "__ref_s3_data": null}], "text": "Figure 4: Given an input image of a table, the Encoder produces fixed-length features that represent the input image. The features are then passed to both the Structure Decoder and Cell BBox Decoder . During training, the Structure Decoder receives 'tokenized tags' of the HTML code that represent the table structure. Afterwards, a transformer encoder and decoder architecture is employed to produce features that are received by a linear layer, and the Cell BBox Decoder. The linear layer is applied to the features to predict the tags. Simultaneously, the Cell BBox Decoder selects features referring to the data cells (' < td > ', ' < ') and passes them through an attention network, an MLP, and a linear layer to predict the bounding boxes.", "type": "caption", "payload": null, "name": "Caption", "font": null}, {"name": "Picture", "type": "figure", "$ref": "#/figures/5"}, {"prov": [{"bbox": [308.86199951171875, 497.69305419921875, 545.1150512695312, 542.465576171875], "page": 5, "span": [0, 227], "__ref_s3_data": null}], "text": "forming classification, and adding an adaptive pooling layer of size 28*28. ResNet by default downsamples the image resolution by 32 and then the encoded image is provided to both the Structure Decoder , and Cell BBox Decoder .", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [308.8619384765625, 378.0381774902344, 545.1151123046875, 494.6601867675781], "page": 5, "span": [0, 563], "__ref_s3_data": null}], "text": "Structure Decoder. The transformer architecture of this component is based on the work proposed in [31]. After extensive experimentation, the Structure Decoder is modeled as a transformer encoder with two encoder layers and a transformer decoder made from a stack of 4 decoder layers that comprise mainly of multi-head attention and feed forward layers. This configuration uses fewer layers and heads in comparison to networks applied to other problems (e.g. \"Scene Understanding\", \"Image Captioning\"), something which we relate to the simplicity of table images.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [308.8619689941406, 246.4272918701172, 545.1151123046875, 374.8857421875], "page": 5, "span": [0, 592], "__ref_s3_data": null}], "text": "The transformer encoder receives an encoded image from the CNN Backbone Network and refines it through a multi-head dot-product attention layer, followed by a Feed Forward Network. During training, the transformer decoder receives as input the output feature produced by the transformer encoder, and the tokenized input of the HTML ground-truth tags. Using a stack of multi-head attention layers, different aspects of the tag sequence could be inferred. This is achieved by each attention head on a layer operating in a different subspace, and then combining altogether their attention score.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [308.8619384765625, 138.727294921875, 545.1151123046875, 243.39540100097656], "page": 5, "span": [0, 483], "__ref_s3_data": null}], "text": "Cell BBox Decoder. Our architecture allows to simultaneously predict HTML tags and bounding boxes for each table cell without the need of a separate object detector end to end. This approach is inspired by DETR [1] which employs a Transformer Encoder, and Decoder that looks for a specific number of object queries (potential object detections). As our model utilizes a transformer architecture, the hidden state of the < td > ' and ' < ' HTML structure tags become the object query.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [308.8619384765625, 78.84827423095703, 545.1150512695312, 135.57484436035156], "page": 5, "span": [0, 286], "__ref_s3_data": null}], "text": "The encoding generated by the CNN Backbone Network along with the features acquired for every data cell from the Transformer Decoder are then passed to the attention network. The attention network takes both inputs and learns to provide an attention weighted encoding. This weighted at-", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [295.1209411621094, 48.96027755737305, 300.10223388671875, 57.86684036254883], "page": 5, "span": [0, 1], "__ref_s3_data": null}], "text": "5", "type": "page-footer", "payload": null, "name": "Page-footer", "font": null}, {"prov": [{"bbox": [50.11199951171875, 636.1539916992188, 286.3651428222656, 716.7916259765625], "page": 6, "span": [0, 380], "__ref_s3_data": null}], "text": "tention encoding is then multiplied to the encoded image to produce a feature for each table cell. Notice that this is different than the typical object detection problem where imbalances between the number of detections and the amount of objects may exist. In our case, we know up front that the produced detections always match with the table cells in number and correspondence.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [50.11199951171875, 551.7369384765625, 286.3651123046875, 632.3755493164062], "page": 6, "span": [0, 371], "__ref_s3_data": null}], "text": "The output features for each table cell are then fed into the feed-forward network (FFN). The FFN consists of a Multi-Layer Perceptron (3 layers with ReLU activation function) that predicts the normalized coordinates for the bounding box of each table cell. Finally, the predicted bounding boxes are classified based on whether they are empty or not using a linear layer.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [50.11199951171875, 347.76910400390625, 286.36572265625, 548.0780639648438], "page": 6, "span": [0, 985], "__ref_s3_data": null}], "text": "Loss Functions. We formulate a multi-task loss Eq. 2 to train our network. The Cross-Entropy loss (denoted as l$_{s}$ ) is used to train the Structure Decoder which predicts the structure tokens. As for the Cell BBox Decoder it is trained with a combination of losses denoted as l$_{box}$ . l$_{box}$ consists of the generally used l$_{1}$ loss for object detection and the IoU loss ( l$_{iou}$ ) to be scale invariant as explained in [25]. In comparison to DETR, we do not use the Hungarian algorithm [15] to match the predicted bounding boxes with the ground-truth boxes, as we have already achieved a one-toone match through two steps: 1) Our token input sequence is naturally ordered, therefore the hidden states of the table data cells are also in order when they are provided as input to the Cell BBox Decoder , and 2) Our bounding boxes generation mechanism (see Sec. 3) ensures a one-to-one mapping between the cell content and its bounding box for all post-processed datasets.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [50.112022399902344, 323.12811279296875, 286.364990234375, 343.9896545410156], "page": 6, "span": [0, 67], "__ref_s3_data": null}], "text": "The loss used to train the TableFormer can be defined as following:", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [124.33001708984375, 274.92828369140625, 286.3624267578125, 298.71905517578125], "page": 6, "span": [0, 84], "__ref_s3_data": null}], "text": "l$_{box}$ = \u03bb$_{iou}$l$_{iou}$ + \u03bb$_{l}$$_{1}$ l = \u03bbl$_{s}$ + (1 - \u03bb ) l$_{box}$ (1)", "type": "equation", "payload": null, "name": "Formula", "font": null}, {"prov": [{"bbox": [50.112030029296875, 251.78411865234375, 281.596923828125, 261.4079895019531], "page": 6, "span": [0, 76], "__ref_s3_data": null}], "text": "where \u03bb \u2208 [0, 1], and \u03bb$_{iou}$, \u03bb$_{l}$$_{1}$ \u2208$_{R}$ are hyper-parameters.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [50.11204528808594, 225.33538818359375, 171.9833526611328, 236.08311462402344], "page": 6, "span": [0, 23], "__ref_s3_data": null}], "text": "5. Experimental Results", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [50.11204528808594, 205.8836212158203, 179.17501831054688, 215.7356719970703], "page": 6, "span": [0, 27], "__ref_s3_data": null}], "text": "5.1. Implementation Details", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [50.11204528808594, 151.4931182861328, 286.36517333984375, 196.2656707763672], "page": 6, "span": [0, 207], "__ref_s3_data": null}], "text": "TableFormer uses ResNet-18 as the CNN Backbone Network . The input images are resized to 448*448 pixels and the feature map has a dimension of 28*28. Additionally, we enforce the following input constraints:", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [91.66104888916016, 113.60411834716797, 286.3624572753906, 138.1719970703125], "page": 6, "span": [0, 77], "__ref_s3_data": null}], "text": "Image width and height \u2264 1024 pixels Structural tags length \u2264 512 tokens. (2)", "type": "equation", "payload": null, "name": "Formula", "font": null}, {"prov": [{"bbox": [50.112060546875, 78.8481216430664, 286.3651428222656, 99.70968627929688], "page": 6, "span": [0, 117], "__ref_s3_data": null}], "text": "Although input constraints are used also by other methods, such as EDD, ours are less restrictive due to the improved", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [295.12103271484375, 48.96010971069336, 300.1023254394531, 57.86667251586914], "page": 6, "span": [0, 1], "__ref_s3_data": null}], "text": "6", "type": "page-footer", "payload": null, "name": "Page-footer", "font": null}, {"prov": [{"bbox": [308.862060546875, 683.97509765625, 545.115234375, 716.7916870117188], "page": 6, "span": [0, 156], "__ref_s3_data": null}], "text": "runtime performance and lower memory footprint of TableFormer. This allows to utilize input samples with longer sequences and images with larger dimensions.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [308.862060546875, 463.6259460449219, 545.1152954101562, 675.7706298828125], "page": 6, "span": [0, 1024], "__ref_s3_data": null}], "text": "The Transformer Encoder consists of two \"Transformer Encoder Layers\", with an input feature size of 512, feed forward network of 1024, and 4 attention heads. As for the Transformer Decoder it is composed of four \"Transformer Decoder Layers\" with similar input and output dimensions as the \"Transformer Encoder Layers\". Even though our model uses fewer layers and heads than the default implementation parameters, our extensive experimentation has proved this setup to be more suitable for table images. We attribute this finding to the inherent design of table images, which contain mostly lines and text, unlike the more elaborate content present in other scopes (e.g. the COCO dataset). Moreover, we have added ResNet blocks to the inputs of the Structure Decoder and Cell BBox Decoder. This prevents a decoder having a stronger influence over the learned weights which would damage the other prediction task (structure vs bounding boxes), but learn task specific weights instead. Lastly our dropout layers are set to 0.5.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [308.8620300292969, 362.83001708984375, 545.1151733398438, 455.4224853515625], "page": 6, "span": [0, 419], "__ref_s3_data": null}], "text": "For training, TableFormer is trained with 3 Adam optimizers, each one for the CNN Backbone Network , Structure Decoder , and Cell BBox Decoder . Taking the PubTabNet as an example for our parameter set up, the initializing learning rate is 0.001 for 12 epochs with a batch size of 24, and \u03bb set to 0.5. Afterwards, we reduce the learning rate to 0.0001, the batch size to 18 and train for 12 more epochs or convergence.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [308.8620300292969, 238.12310791015625, 545.115234375, 354.6255798339844], "page": 6, "span": [0, 528], "__ref_s3_data": null}], "text": "TableFormer is implemented with PyTorch and Torchvision libraries [22]. To speed up the inference, the image undergoes a single forward pass through the CNN Backbone Network and transformer encoder. This eliminates the overhead of generating the same features for each decoding step. Similarly, we employ a 'caching' technique to preform faster autoregressive decoding. This is achieved by storing the features of decoded tokens so we can reuse them for each time step. Therefore, we only compute the attention for each new tag.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [308.8620300292969, 202.5936279296875, 397.44281005859375, 212.4456787109375], "page": 6, "span": [0, 19], "__ref_s3_data": null}], "text": "5.2. Generalization", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [308.8620300292969, 119.86811065673828, 545.1151733398438, 188.55067443847656], "page": 6, "span": [0, 299], "__ref_s3_data": null}], "text": "TableFormer is evaluated on three major publicly available datasets of different nature to prove the generalization and effectiveness of our model. The datasets used for evaluation are the PubTabNet, FinTabNet and TableBank which stem from the scientific, financial and general domains respectively.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [308.8620300292969, 78.84710693359375, 545.115234375, 111.6646728515625], "page": 6, "span": [0, 155], "__ref_s3_data": null}], "text": "We also share our baseline results on the challenging SynthTabNet dataset. Throughout our experiments, the same parameters stated in Sec. 5.1 are utilized.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [50.11199951171875, 707.74658203125, 167.89825439453125, 717.5986328125], "page": 7, "span": [0, 25], "__ref_s3_data": null}], "text": "5.3. Datasets and Metrics", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [50.11199951171875, 653.8770141601562, 286.3651123046875, 698.6495971679688], "page": 7, "span": [0, 192], "__ref_s3_data": null}], "text": "The Tree-Edit-Distance-Based Similarity (TEDS) metric was introduced in [37]. It represents the prediction, and ground-truth as a tree structure of HTML tags. This similarity is calculated as:", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [86.218994140625, 619.26123046875, 286.3623962402344, 641.6820068359375], "page": 7, "span": [0, 99], "__ref_s3_data": null}], "text": "TEDS ( T$_{a}$, T$_{b}$ ) = 1 - EditDist ( T$_{a}$, T$_{b}$ ) max ( | T$_{a}$ | , | T$_{b}$ | ) (3)", "type": "equation", "payload": null, "name": "Formula", "font": null}, {"prov": [{"bbox": [50.11198425292969, 578.02099609375, 286.36285400390625, 610.9970092773438], "page": 7, "span": [0, 162], "__ref_s3_data": null}], "text": "where T$_{a}$ and T$_{b}$ represent tables in tree structure HTML format. EditDist denotes the tree-edit distance, and | T | represents the number of nodes in T .", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [50.11199951171875, 557.3284912109375, 170.45169067382812, 567.1805419921875], "page": 7, "span": [0, 26], "__ref_s3_data": null}], "text": "5.4. Quantitative Analysis", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [50.11199951171875, 395.862060546875, 286.3651428222656, 548.35009765625], "page": 7, "span": [0, 723], "__ref_s3_data": null}], "text": "Structure. As shown in Tab. 2, TableFormer outperforms all SOTA methods across different datasets by a large margin for predicting the table structure from an image. All the more, our model outperforms pre-trained methods. During the evaluation we do not apply any table filtering. We also provide our baseline results on the SynthTabNet dataset. It has been observed that large tables (e.g. tables that occupy half of the page or more) yield poor predictions. We attribute this issue to the image resizing during the preprocessing step, that produces downsampled images with indistinguishable features. This problem can be addressed by treating such big tables with a separate model which accepts a large input image size.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [50.11199951171875, 178.705078125, 286.3651123046875, 199.56663513183594], "page": 7, "span": [0, 101], "__ref_s3_data": null}], "text": "Table 2: Structure results on PubTabNet (PTN), FinTabNet (FTN), TableBank (TB) and SynthTabNet (STN).", "type": "caption", "payload": null, "name": "Caption", "font": null}, {"name": "Table", "type": "table", "$ref": "#/tables/3"}, {"prov": [{"bbox": [50.11199951171875, 166.7500762939453, 261.7873229980469, 175.65663146972656], "page": 7, "span": [0, 50], "__ref_s3_data": null}], "text": "FT: Model was trained on PubTabNet then finetuned.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [50.11201477050781, 78.84806823730469, 286.3659973144531, 147.6501922607422], "page": 7, "span": [0, 346], "__ref_s3_data": null}], "text": "Cell Detection. Like any object detector, our Cell BBox Detector provides bounding boxes that can be improved with post-processing during inference. We make use of the grid-like structure of tables to refine the predictions. A detailed explanation on the post-processing is available in the supplementary material. As shown in Tab. 3, we evaluate", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [295.1210021972656, 48.960079193115234, 300.102294921875, 57.866641998291016], "page": 7, "span": [0, 1], "__ref_s3_data": null}], "text": "7", "type": "page-footer", "payload": null, "name": "Page-footer", "font": null}, {"prov": [{"bbox": [308.86199951171875, 564.4229125976562, 545.1151733398438, 716.7916259765625], "page": 7, "span": [0, 737], "__ref_s3_data": null}], "text": "our Cell BBox Decoder accuracy for cells with a class label of 'content' only using the PASCAL VOC mAP metric for pre-processing and post-processing. Note that we do not have post-processing results for SynthTabNet as images are only provided. To compare the performance of our proposed approach, we've integrated TableFormer's Cell BBox Decoder into EDD architecture. As mentioned previously, the Structure Decoder provides the Cell BBox Decoder with the features needed to predict the bounding box predictions. Therefore, the accuracy of the Structure Decoder directly influences the accuracy of the Cell BBox Decoder . If the Structure Decoder predicts an extra column, this will result in an extra column of predicted bounding boxes.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [308.86199951171875, 454.68914794921875, 545.1151733398438, 475.5506896972656], "page": 7, "span": [0, 94], "__ref_s3_data": null}], "text": "Table 3: Cell Bounding Box detection results on PubTabNet, and FinTabNet. PP: Post-processing.", "type": "caption", "payload": null, "name": "Caption", "font": null}, {"name": "Table", "type": "table", "$ref": "#/tables/4"}, {"prov": [{"bbox": [308.8619689941406, 271.8323059082031, 545.1156616210938, 424.3202819824219], "page": 7, "span": [0, 715], "__ref_s3_data": null}], "text": "Cell Content. In this section, we evaluate the entire pipeline of recovering a table with content. Here we put our approach to test by capitalizing on extracting content from the PDF cells rather than decoding from images. Tab. 4 shows the TEDs score of HTML code representing the structure of the table along with the content inserted in the data cell and compared with the ground-truth. Our method achieved a 5.3% increase over the state-of-the-art, and commercial solutions. We believe our scores would be higher if the HTML ground-truth matched the extracted PDF cell content. Unfortunately, there are small discrepancies such as spacings around words or special characters with various unicode representations.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [308.86199951171875, 102.32206726074219, 545.1151733398438, 135.13864135742188], "page": 7, "span": [0, 148], "__ref_s3_data": null}], "text": "Table 4: Results of structure with content retrieved using cell detection on PubTabNet. In all cases the input is PDF documents with cropped tables.", "type": "caption", "payload": null, "name": "Caption", "font": null}, {"name": "Table", "type": "table", "$ref": "#/tables/5"}, {"prov": [{"bbox": [53.28603744506836, 705.4392700195312, 61.550289154052734, 713.3124389648438], "page": 8, "span": [0, 2], "__ref_s3_data": null}], "text": "- a.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [65.68241882324219, 705.4392700195312, 499.5556335449219, 713.3124389648438], "page": 8, "span": [0, 105], "__ref_s3_data": null}], "text": "- Red - PDF cells, Green - predicted bounding boxes, Blue - post-processed predictions matched to PDF cells", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [53.81178283691406, 689.845703125, 284.3459167480469, 697.7188720703125], "page": 8, "span": [0, 53], "__ref_s3_data": null}], "text": "Japanese language (previously unseen by TableFormer):", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [304.830810546875, 689.845703125, 431.0911865234375, 697.7188720703125], "page": 8, "span": [0, 29], "__ref_s3_data": null}], "text": "Example table from FinTabNet:", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"name": "Picture", "type": "figure", "$ref": "#/figures/6"}, {"prov": [{"bbox": [53.81178283691406, 575.8935546875, 385.93450927734375, 583.7667236328125], "page": 8, "span": [0, 79], "__ref_s3_data": null}], "text": "b. Structure predicted by TableFormer, with superimposed matched PDF cell text:", "type": "caption", "payload": null, "name": "Caption", "font": null}, {"name": "Picture", "type": "figure", "$ref": "#/figures/7"}, {"name": "Table", "type": "table", "$ref": "#/tables/6"}, {"prov": [{"bbox": [380.42730712890625, 493.39715576171875, 549.4217529296875, 499.69573974609375], "page": 8, "span": [0, 53], "__ref_s3_data": null}], "text": "Text is aligned to match original for ease of viewing", "type": "caption", "payload": null, "name": "Caption", "font": null}, {"name": "Table", "type": "table", "$ref": "#/tables/7"}, {"prov": [{"bbox": [50.11199951171875, 426.3501281738281, 545.11376953125, 471.1226501464844], "page": 8, "span": [0, 397], "__ref_s3_data": null}], "text": "Figure 5: One of the benefits of TableFormer is that it is language agnostic, as an example, the left part of the illustration demonstrates TableFormer predictions on previously unseen language (Japanese). Additionally, we see that TableFormer is robust to variability in style and content, right side of the illustration shows the example of the TableFormer prediction from the FinTabNet dataset.", "type": "caption", "payload": null, "name": "Caption", "font": null}, {"name": "Picture", "type": "figure", "$ref": "#/figures/8"}, {"name": "Picture", "type": "figure", "$ref": "#/figures/9"}, {"prov": [{"bbox": [62.595001220703125, 324.3650817871094, 532.6304931640625, 333.2716369628906], "page": 8, "span": [0, 112], "__ref_s3_data": null}], "text": "Figure 6: An example of TableFormer predictions (bounding boxes and structure) from generated SynthTabNet table.", "type": "caption", "payload": null, "name": "Caption", "font": null}, {"name": "Picture", "type": "figure", "$ref": "#/figures/10"}, {"prov": [{"bbox": [50.11199951171875, 290.7525939941406, 163.75579833984375, 300.6046447753906], "page": 8, "span": [0, 25], "__ref_s3_data": null}], "text": "5.5. Qualitative Analysis", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [50.11199951171875, 78.84805297851562, 286.3651123046875, 255.1266326904297], "page": 8, "span": [0, 866], "__ref_s3_data": null}], "text": "We showcase several visualizations for the different components of our network on various \"complex\" tables within datasets presented in this work in Fig. 5 and Fig. 6 As it is shown, our model is able to predict bounding boxes for all table cells, even for the empty ones. Additionally, our post-processing techniques can extract the cell content by matching the predicted bounding boxes to the PDF cells based on their overlap and spatial proximity. The left part of Fig. 5 demonstrates also the adaptability of our method to any language, as it can successfully extract Japanese text, although the training set contains only English content. We provide more visualizations including the intermediate steps in the supplementary material. Overall these illustrations justify the versatility of our method across a diverse range of table appearances and content type.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [308.86199951171875, 290.5433654785156, 460.8484802246094, 301.29107666015625], "page": 8, "span": [0, 27], "__ref_s3_data": null}], "text": "6. Future Work & Conclusion", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [308.86199951171875, 138.69407653808594, 545.1151733398438, 279.10662841796875], "page": 8, "span": [0, 640], "__ref_s3_data": null}], "text": "In this paper, we presented TableFormer an end-to-end transformer based approach to predict table structures and bounding boxes of cells from an image. This approach enables us to recreate the table structure, and extract the cell content from PDF or OCR by using bounding boxes. Additionally, it provides the versatility required in real-world scenarios when dealing with various types of PDF documents, and languages. Furthermore, our method outperforms all state-of-the-arts with a wide margin. Finally, we introduce \"SynthTabNet\" a challenging synthetically generated dataset that reinforces missing characteristics from other datasets.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [308.86199951171875, 109.15335845947266, 364.4058532714844, 119.90107727050781], "page": 8, "span": [0, 10], "__ref_s3_data": null}], "text": "References", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [313.3450012207031, 79.06324768066406, 545.1134033203125, 98.0382080078125], "page": 8, "span": [0, 121], "__ref_s3_data": null}], "text": "- [1] Nicolas Carion, Francisco Massa, Gabriel Synnaeve, Nicolas Usunier, Alexander Kirillov, and Sergey Zagoruyko. End-to-", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [295.1210021972656, 48.9600715637207, 300.102294921875, 57.866634368896484], "page": 8, "span": [0, 1], "__ref_s3_data": null}], "text": "8", "type": "page-footer", "payload": null, "name": "Page-footer", "font": null}, {"prov": [{"bbox": [70.03099822998047, 675.2242431640625, 286.36334228515625, 716.1162109375], "page": 9, "span": [0, 212], "__ref_s3_data": null}], "text": "- end object detection with transformers. In Andrea Vedaldi, Horst Bischof, Thomas Brox, and Jan-Michael Frahm, editors, Computer Vision - ECCV 2020 , pages 213-229, Cham, 2020. Springer International Publishing. 5", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [54.59500503540039, 642.0343017578125, 286.36334228515625, 671.96826171875], "page": 9, "span": [0, 165], "__ref_s3_data": null}], "text": "- [2] Zewen Chi, Heyan Huang, Heng-Da Xu, Houjin Yu, Wanxuan Yin, and Xian-Ling Mao. Complicated table structure recognition. arXiv preprint arXiv:1908.04729 , 2019. 3", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [54.595001220703125, 608.8453369140625, 286.3630065917969, 638.7783203125], "page": 9, "span": [0, 125], "__ref_s3_data": null}], "text": "- [3] Bertrand Couasnon and Aurelie Lemaitre. Recognition of Tables and Forms , pages 647-677. Springer London, London, 2014. 2", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [54.59498977661133, 564.6964111328125, 286.364013671875, 605.58935546875], "page": 9, "span": [0, 216], "__ref_s3_data": null}], "text": "- [4] Herv'e D'ejean, Jean-Luc Meunier, Liangcai Gao, Yilun Huang, Yu Fang, Florian Kleber, and Eva-Maria Lang. ICDAR 2019 Competition on Table Detection and Recognition (cTDaR), Apr. 2019. http://sac.founderit.com/. 2", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [54.5949821472168, 520.5484619140625, 286.36334228515625, 561.4404296875], "page": 9, "span": [0, 236], "__ref_s3_data": null}], "text": "- [5] Basilios Gatos, Dimitrios Danatsas, Ioannis Pratikakis, and Stavros J Perantonis. Automatic table detection in document images. In International Conference on Pattern Recognition and Image Analysis , pages 609-618. Springer, 2005. 2", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [54.594970703125, 476.3995056152344, 286.36676025390625, 517.2924194335938], "page": 9, "span": [0, 193], "__ref_s3_data": null}], "text": "- [6] Max Gobel, Tamir Hassan, Ermelinda Oro, and Giorgio Orsi. Icdar 2013 table competition. In 2013 12th International Conference on Document Analysis and Recognition , pages 1449-1453, 2013. 2", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [54.59498977661133, 443.2104797363281, 286.3631896972656, 473.1434631347656], "page": 9, "span": [0, 165], "__ref_s3_data": null}], "text": "- [7] EA Green and M Krishnamoorthy. Recognition of tables using table grammars. procs. In Symposium on Document Analysis and Recognition (SDAIR'95) , pages 261-277. 2", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [54.59498596191406, 388.1025085449219, 286.3633117675781, 439.9544372558594], "page": 9, "span": [0, 273], "__ref_s3_data": null}], "text": "- [8] Khurram Azeem Hashmi, Alain Pagani, Marcus Liwicki, Didier Stricker, and Muhammad Zeshan Afzal. Castabdetectors: Cascade network for table detection in document images with recursive feature pyramid and switchable atrous convolution. Journal of Imaging , 7(10), 2021. 1", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [54.595001220703125, 354.9135437011719, 286.3598937988281, 384.84747314453125], "page": 9, "span": [0, 170], "__ref_s3_data": null}], "text": "- [9] Kaiming He, Georgia Gkioxari, Piotr Dollar, and Ross Girshick. Mask r-cnn. In Proceedings of the IEEE International Conference on Computer Vision (ICCV) , Oct 2017. 1", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [50.11199951171875, 310.7645568847656, 286.36334228515625, 351.6575012207031], "page": 9, "span": [0, 226], "__ref_s3_data": null}], "text": "- [10] Yelin He, X. Qi, Jiaquan Ye, Peng Gao, Yihao Chen, Bingcong Li, Xin Tang, and Rong Xiao. Pingan-vcgroup's solution for icdar 2021 competition on scientific table image recognition to latex. ArXiv , abs/2105.01846, 2021. 2", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [50.11199951171875, 255.65762329101562, 286.3633117675781, 307.509521484375], "page": 9, "span": [0, 239], "__ref_s3_data": null}], "text": "- [11] Jianying Hu, Ramanujan S Kashi, Daniel P Lopresti, and Gordon Wilfong. Medium-independent table detection. In Document Recognition and Retrieval VII , volume 3967, pages 291-302. International Society for Optics and Photonics, 1999. 2", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [50.11200714111328, 200.55062866210938, 286.36334228515625, 252.40158081054688], "page": 9, "span": [0, 240], "__ref_s3_data": null}], "text": "- [12] Matthew Hurst. A constraint-based approach to table structure derivation. In Proceedings of the Seventh International Conference on Document Analysis and Recognition - Volume 2 , ICDAR '03, page 911, USA, 2003. IEEE Computer Society. 2", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [50.11200714111328, 145.442626953125, 286.3633117675781, 197.29458618164062], "page": 9, "span": [0, 283], "__ref_s3_data": null}], "text": "- [13] Thotreingam Kasar, Philippine Barlas, Sebastien Adam, Cl'ement Chatelain, and Thierry Paquet. Learning to detect tables in scanned document images using line information. In 2013 12th International Conference on Document Analysis and Recognition , pages 1185-1189. IEEE, 2013. 2", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [50.11199188232422, 112.25361633300781, 286.36334228515625, 142.18658447265625], "page": 9, "span": [0, 142], "__ref_s3_data": null}], "text": "- [14] Pratik Kayal, Mrinal Anand, Harsh Desai, and Mayank Singh. Icdar 2021 competition on scientific table image recognition to latex, 2021. 2", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [50.11199188232422, 79.06361389160156, 286.35931396484375, 108.99756622314453], "page": 9, "span": [0, 127], "__ref_s3_data": null}], "text": "- [15] Harold W Kuhn. The hungarian method for the assignment problem. Naval research logistics quarterly , 2(1-2):83-97, 1955. 6", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [295.12103271484375, 48.96084976196289, 300.1023254394531, 57.86741256713867], "page": 9, "span": [0, 1], "__ref_s3_data": null}], "text": "9", "type": "page-footer", "payload": null, "name": "Page-footer", "font": null}, {"prov": [{"bbox": [308.8619689941406, 653.306640625, 545.11474609375, 716.1165771484375], "page": 9, "span": [0, 287], "__ref_s3_data": null}], "text": "- [16] Girish Kulkarni, Visruth Premraj, Vicente Ordonez, Sagnik Dhar, Siming Li, Yejin Choi, Alexander C. Berg, and Tamara L. Berg. Babytalk: Understanding and generating simple image descriptions. IEEE Transactions on Pattern Analysis and Machine Intelligence , 35(12):2891-2903, 2013. 4", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [308.86199951171875, 619.9436645507812, 545.1134033203125, 649.8766479492188], "page": 9, "span": [0, 156], "__ref_s3_data": null}], "text": "- [17] Minghao Li, Lei Cui, Shaohan Huang, Furu Wei, Ming Zhou, and Zhoujun Li. Tablebank: A benchmark dataset for table detection and recognition, 2019. 2, 3", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [308.86199951171875, 531.7857666015625, 545.113525390625, 616.513671875], "page": 9, "span": [0, 407], "__ref_s3_data": null}], "text": "- [18] Yiren Li, Zheng Huang, Junchi Yan, Yi Zhou, Fan Ye, and Xianhui Liu. Gfte: Graph-based financial table extraction. In Alberto Del Bimbo, Rita Cucchiara, Stan Sclaroff, Giovanni Maria Farinella, Tao Mei, Marco Bertini, Hugo Jair Escalante, and Roberto Vezzani, editors, Pattern Recognition. ICPR International Workshops and Challenges , pages 644-658, Cham, 2021. Springer International Publishing. 2, 3", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [308.86199951171875, 465.5458679199219, 545.1141967773438, 528.3557739257812], "page": 9, "span": [0, 328], "__ref_s3_data": null}], "text": "- [19] Nikolaos Livathinos, Cesar Berrospi, Maksym Lysak, Viktor Kuropiatnyk, Ahmed Nassar, Andre Carvalho, Michele Dolfi, Christoph Auer, Kasper Dinkla, and Peter Staar. Robust pdf document conversion using recurrent neural networks. Proceedings of the AAAI Conference on Artificial Intelligence , 35(17):15137-15145, May 2021. 1", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [308.86199951171875, 421.2228698730469, 545.1160888671875, 462.1158142089844], "page": 9, "span": [0, 229], "__ref_s3_data": null}], "text": "- [20] Rujiao Long, Wen Wang, Nan Xue, Feiyu Gao, Zhibo Yang, Yongpan Wang, and Gui-Song Xia. Parsing table structures in the wild. In Proceedings of the IEEE/CVF International Conference on Computer Vision , pages 944-952, 2021. 2", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [308.86199951171875, 354.9829406738281, 545.1134643554688, 417.7938232421875], "page": 9, "span": [0, 315], "__ref_s3_data": null}], "text": "- [21] Shubham Singh Paliwal, D Vishwanath, Rohit Rahul, Monika Sharma, and Lovekesh Vig. Tablenet: Deep learning model for end-to-end table detection and tabular data extraction from scanned document images. In 2019 International Conference on Document Analysis and Recognition (ICDAR) , pages 128-133. IEEE, 2019. 1", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [308.86199951171875, 233.94903564453125, 545.11474609375, 351.55389404296875], "page": 9, "span": [0, 592], "__ref_s3_data": null}], "text": "- [22] Adam Paszke, Sam Gross, Francisco Massa, Adam Lerer, James Bradbury, Gregory Chanan, Trevor Killeen, Zeming Lin, Natalia Gimelshein, Luca Antiga, Alban Desmaison, Andreas Kopf, Edward Yang, Zachary DeVito, Martin Raison, Alykhan Tejani, Sasank Chilamkurthy, Benoit Steiner, Lu Fang, Junjie Bai, and Soumith Chintala. Pytorch: An imperative style, high-performance deep learning library. In H. Wallach, H. Larochelle, A. Beygelzimer, F. d'Alch'e-Buc, E. Fox, and R. Garnett, editors, Advances in Neural Information Processing Systems 32 , pages 8024-8035. Curran Associates, Inc., 2019. 6", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [308.86199951171875, 167.7090301513672, 545.1134033203125, 230.5189971923828], "page": 9, "span": [0, 322], "__ref_s3_data": null}], "text": "- [23] Devashish Prasad, Ayan Gadpal, Kshitij Kapadni, Manish Visave, and Kavita Sultanpure. Cascadetabnet: An approach for end to end table detection and structure recognition from image-based documents. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition Workshops , pages 572-573, 2020. 1", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [308.86199951171875, 123.38601684570312, 545.1162109375, 164.27899169921875], "page": 9, "span": [0, 224], "__ref_s3_data": null}], "text": "- [24] Shah Rukh Qasim, Hassan Mahmood, and Faisal Shafait. Rethinking table recognition using graph neural networks. In 2019 International Conference on Document Analysis and Recognition (ICDAR) , pages 142-147. IEEE, 2019. 3", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [308.8620300292969, 79.06402587890625, 545.1134033203125, 119.95699310302734], "page": 9, "span": [0, 229], "__ref_s3_data": null}], "text": "- [25] Hamid Rezatofighi, Nathan Tsoi, JunYoung Gwak, Amir Sadeghian, Ian Reid, and Silvio Savarese. Generalized intersection over union: A metric and a loss for bounding box regression. In Proceedings of the IEEE/CVF Conference on", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [70.03099822998047, 697.1412353515625, 286.36175537109375, 716.1162109375], "page": 10, "span": [0, 64], "__ref_s3_data": null}], "text": "Computer Vision and Pattern Recognition , pages 658-666, 2019. 6", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [50.11200714111328, 631.0233154296875, 286.36578369140625, 693.834228515625], "page": 10, "span": [0, 302], "__ref_s3_data": null}], "text": "- [26] Sebastian Schreiber, Stefan Agne, Ivo Wolf, Andreas Dengel, and Sheraz Ahmed. Deepdesrt: Deep learning for detection and structure recognition of tables in document images. In 2017 14th IAPR International Conference on Document Analysis and Recognition (ICDAR) , volume 01, pages 11621167, 2017. 1", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [50.11200714111328, 564.9053955078125, 286.3633728027344, 627.71533203125], "page": 10, "span": [0, 308], "__ref_s3_data": null}], "text": "- [27] Sebastian Schreiber, Stefan Agne, Ivo Wolf, Andreas Dengel, and Sheraz Ahmed. Deepdesrt: Deep learning for detection and structure recognition of tables in document images. In 2017 14th IAPR international conference on document analysis and recognition (ICDAR) , volume 1, pages 1162-1167. IEEE, 2017. 3", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [50.11200714111328, 520.7044677734375, 286.36578369140625, 561.597412109375], "page": 10, "span": [0, 183], "__ref_s3_data": null}], "text": "- [28] Faisal Shafait and Ray Smith. Table detection in heterogeneous documents. In Proceedings of the 9th IAPR International Workshop on Document Analysis Systems , pages 6572, 2010. 2", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [50.11200714111328, 465.5455017089844, 286.36627197265625, 517.3964233398438], "page": 10, "span": [0, 275], "__ref_s3_data": null}], "text": "- [29] Shoaib Ahmed Siddiqui, Imran Ali Fateh, Syed Tahseen Raza Rizvi, Andreas Dengel, and Sheraz Ahmed. Deeptabstr: Deep learning based table structure recognition. In 2019 International Conference on Document Analysis and Recognition (ICDAR) , pages 1403-1409. IEEE, 2019. 3", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [50.11200714111328, 410.3855285644531, 286.36334228515625, 462.2374572753906], "page": 10, "span": [0, 251], "__ref_s3_data": null}], "text": "- [30] Peter W J Staar, Michele Dolfi, Christoph Auer, and Costas Bekas. Corpus conversion service: A machine learning platform to ingest documents at scale. In Proceedings of the 24th ACM SIGKDD , KDD '18, pages 774-782, New York, NY, USA, 2018. ACM. 1", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [50.11200714111328, 333.3085632324219, 286.3638916015625, 407.0774841308594], "page": 10, "span": [0, 366], "__ref_s3_data": null}], "text": "- [31] Ashish Vaswani, Noam Shazeer, Niki Parmar, Jakob Uszkoreit, Llion Jones, Aidan N Gomez, \u0141 ukasz Kaiser, and Illia Polosukhin. Attention is all you need. In I. Guyon, U. V. Luxburg, S. Bengio, H. Wallach, R. Fergus, S. Vishwanathan, and R. Garnett, editors, Advances in Neural Information Processing Systems 30 , pages 5998-6008. Curran Associates, Inc., 2017. 5", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [50.11200714111328, 289.1075744628906, 286.36334228515625, 330.0005187988281], "page": 10, "span": [0, 221], "__ref_s3_data": null}], "text": "- [32] Oriol Vinyals, Alexander Toshev, Samy Bengio, and Dumitru Erhan. Show and tell: A neural image caption generator. In Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR) , June 2015. 2", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [50.11201477050781, 244.90756225585938, 286.3633728027344, 285.7995300292969], "page": 10, "span": [0, 217], "__ref_s3_data": null}], "text": "- [33] Wenyuan Xue, Qingyong Li, and Dacheng Tao. Res2tim: reconstruct syntactic structures from table images. In 2019 International Conference on Document Analysis and Recognition (ICDAR) , pages 749-755. IEEE, 2019. 3", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [50.112022399902344, 200.70655822753906, 286.3633728027344, 241.59951782226562], "page": 10, "span": [0, 190], "__ref_s3_data": null}], "text": "- [34] Wenyuan Xue, Baosheng Yu, Wen Wang, Dacheng Tao, and Qingyong Li. Tgrnet: A table graph reconstruction network for table structure recognition. arXiv preprint arXiv:2106.10598 , 2021. 3", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [50.112030029296875, 156.50555419921875, 286.3634033203125, 197.3985137939453], "page": 10, "span": [0, 220], "__ref_s3_data": null}], "text": "- [35] Quanzeng You, Hailin Jin, Zhaowen Wang, Chen Fang, and Jiebo Luo. Image captioning with semantic attention. In Proceedings of the IEEE conference on computer vision and pattern recognition , pages 4651-4659, 2016. 4", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [50.112022399902344, 101.34652709960938, 286.3633728027344, 153.197509765625], "page": 10, "span": [0, 280], "__ref_s3_data": null}], "text": "- [36] Xinyi Zheng, Doug Burdick, Lucian Popa, Peter Zhong, and Nancy Xin Ru Wang. Global table extractor (gte): A framework for joint table identification and cell structure recognition using visual context. Winter Conference for Applications in Computer Vision (WACV) , 2021. 2, 3", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [50.11201477050781, 79.06353759765625, 286.36334228515625, 98.03849792480469], "page": 10, "span": [0, 106], "__ref_s3_data": null}], "text": "- [37] Xu Zhong, Elaheh ShafieiBavani, and Antonio Jimeno Yepes. Image-based table recognition: Data, model,", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [292.6300048828125, 48.960445404052734, 302.59259033203125, 57.867008209228516], "page": 10, "span": [0, 2], "__ref_s3_data": null}], "text": "10", "type": "page-footer", "payload": null, "name": "Page-footer", "font": null}, {"prov": [{"bbox": [328.781005859375, 675.2245483398438, 545.1145629882812, 716.1165161132812], "page": 10, "span": [0, 192], "__ref_s3_data": null}], "text": "- and evaluation. In Andrea Vedaldi, Horst Bischof, Thomas Brox, and Jan-Michael Frahm, editors, Computer Vision ECCV 2020 , pages 564-580, Cham, 2020. Springer International Publishing. 2, 3, 7", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [308.86199951171875, 630.392578125, 545.1133422851562, 671.2855224609375], "page": 10, "span": [0, 221], "__ref_s3_data": null}], "text": "- [38] Xu Zhong, Jianbin Tang, and Antonio Jimeno Yepes. Publaynet: Largest dataset ever for document layout analysis. In 2019 International Conference on Document Analysis and Recognition (ICDAR) , pages 1015-1022, 2019. 1", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [132.8419952392578, 656.4699096679688, 465.37591552734375, 681.4251098632812], "page": 11, "span": [0, 83], "__ref_s3_data": null}], "text": "TableFormer: Table Structure Understanding with Transformers Supplementary Material", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [50.11198425292969, 620.0913696289062, 175.96437072753906, 630.839111328125], "page": 11, "span": [0, 26], "__ref_s3_data": null}], "text": "1. Details on the datasets", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [50.11198425292969, 601.1686401367188, 150.364013671875, 611.0206909179688], "page": 11, "span": [0, 21], "__ref_s3_data": null}], "text": "1.1. Data preparation", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [50.11198425292969, 403.8451843261719, 286.3651428222656, 592.0797119140625], "page": 11, "span": [0, 931], "__ref_s3_data": null}], "text": "As a first step of our data preparation process, we have calculated statistics over the datasets across the following dimensions: (1) table size measured in the number of rows and columns, (2) complexity of the table, (3) strictness of the provided HTML structure and (4) completeness (i.e. no omitted bounding boxes). A table is considered to be simple if it does not contain row spans or column spans. Additionally, a table has a strict HTML structure if every row has the same number of columns after taking into account any row or column spans. Therefore a strict HTML structure looks always rectangular. However, HTML is a lenient encoding format, i.e. tables with rows of different sizes might still be regarded as correct due to implicit display rules. These implicit rules leave room for ambiguity, which we want to avoid. As such, we prefer to have \"strict\" tables, i.e. tables where every row has exactly the same length.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [50.11198425292969, 164.54029846191406, 286.3651123046875, 400.5947265625], "page": 11, "span": [0, 1149], "__ref_s3_data": null}], "text": "We have developed a technique that tries to derive a missing bounding box out of its neighbors. As a first step, we use the annotation data to generate the most fine-grained grid that covers the table structure. In case of strict HTML tables, all grid squares are associated with some table cell and in the presence of table spans a cell extends across multiple grid squares. When enough bounding boxes are known for a rectangular table, it is possible to compute the geometrical border lines between the grid rows and columns. Eventually this information is used to generate the missing bounding boxes. Additionally, the existence of unused grid squares indicates that the table rows have unequal number of columns and the overall structure is non-strict. The generation of missing bounding boxes for non-strict HTML tables is ambiguous and therefore quite challenging. Thus, we have decided to simply discard those tables. In case of PubTabNet we have computed missing bounding boxes for 48% of the simple and 69% of the complex tables. Regarding FinTabNet, 68% of the simple and 98% of the complex tables require the generation of bounding boxes.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [50.11198425292969, 140.42730712890625, 286.3649597167969, 161.28985595703125], "page": 11, "span": [0, 92], "__ref_s3_data": null}], "text": "Figure 7 illustrates the distribution of the tables across different dimensions per dataset.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [50.11198425292969, 119.7578125, 153.60784912109375, 129.60986328125], "page": 11, "span": [0, 23], "__ref_s3_data": null}], "text": "1.2. Synthetic datasets", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [50.11198425292969, 77.852294921875, 286.36505126953125, 110.66886901855469], "page": 11, "span": [0, 167], "__ref_s3_data": null}], "text": "Aiming to train and evaluate our models in a broader spectrum of table data we have synthesized four types of datasets. Each one contains tables with different appear-", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [308.86199951171875, 584.572265625, 545.1151123046875, 629.3448486328125], "page": 11, "span": [0, 221], "__ref_s3_data": null}], "text": "ances in regard to their size, structure, style and content. Every synthetic dataset contains 150k examples, summing up to 600k synthetic examples. All datasets are divided into Train, Test and Val splits (80%, 10%, 10%).", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [308.86199951171875, 559.9032592773438, 545.1150512695312, 580.7648315429688], "page": 11, "span": [0, 89], "__ref_s3_data": null}], "text": "The process of generating a synthetic dataset can be decomposed into the following steps:", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [308.86199951171875, 475.45721435546875, 545.1151123046875, 556.0947875976562], "page": 11, "span": [0, 373], "__ref_s3_data": null}], "text": "- 1. Prepare styling and content templates: The styling templates have been manually designed and organized into groups of scope specific appearances (e.g. financial data, marketing data, etc.) Additionally, we have prepared curated collections of content templates by extracting the most frequently used terms out of non-synthetic datasets (e.g. PubTabNet, FinTabNet, etc.).", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [308.86199951171875, 343.19134521484375, 545.1151733398438, 471.6497802734375], "page": 11, "span": [0, 573], "__ref_s3_data": null}], "text": "- 2. Generate table structures: The structure of each synthetic dataset assumes a horizontal table header which potentially spans over multiple rows and a table body that may contain a combination of row spans and column spans. However, spans are not allowed to cross the header - body boundary. The table structure is described by the parameters: Total number of table rows and columns, number of header rows, type of spans (header only spans, row only spans, column only spans, both row and column spans), maximum span size and the ratio of the table area covered by spans.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [308.86199951171875, 294.61138916015625, 545.1151733398438, 339.3839111328125], "page": 11, "span": [0, 195], "__ref_s3_data": null}], "text": "- 3. Generate content: Based on the dataset theme , a set of suitable content templates is chosen first. Then, this content can be combined with purely random text to produce the synthetic content.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [308.86199951171875, 246.0314178466797, 545.1152954101562, 290.803955078125], "page": 11, "span": [0, 218], "__ref_s3_data": null}], "text": "- 4. Apply styling templates: Depending on the domain of the synthetic dataset, a set of styling templates is first manually selected. Then, a style is randomly selected to format the appearance of the synthesized table.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [308.86199951171875, 185.4964141845703, 545.1151733398438, 242.22396850585938], "page": 11, "span": [0, 238], "__ref_s3_data": null}], "text": "- 5. Render the complete tables: The synthetic table is finally rendered by a web browser engine to generate the bounding boxes for each table cell. A batching technique is utilized to optimize the runtime overhead of the rendering process.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [308.86199951171875, 145.01368713378906, 545.1087646484375, 169.70941162109375], "page": 11, "span": [0, 47], "__ref_s3_data": null}], "text": "2. Prediction post-processing for PDF documents", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [308.8620300292969, 77.85139465332031, 545.1151733398438, 134.57896423339844], "page": 11, "span": [0, 247], "__ref_s3_data": null}], "text": "Although TableFormer can predict the table structure and the bounding boxes for tables recognized inside PDF documents, this is not enough when a full reconstruction of the original table is required. This happens mainly due the following reasons:", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [292.63104248046875, 48.96039962768555, 302.5936279296875, 57.86696243286133], "page": 11, "span": [0, 2], "__ref_s3_data": null}], "text": "11", "type": "page-footer", "payload": null, "name": "Page-footer", "font": null}, {"prov": [{"bbox": [50.11199951171875, 605.6360473632812, 545.1137084960938, 626.4976196289062], "page": 12, "span": [0, 245], "__ref_s3_data": null}], "text": "Figure 7: Distribution of the tables across different dimensions per dataset. Simple vs complex tables per dataset and split, strict vs non strict html structures per dataset and table complexity, missing bboxes per dataset and table complexity.", "type": "caption", "payload": null, "name": "Caption", "font": null}, {"name": "Picture", "type": "figure", "$ref": "#/figures/11"}, {"prov": [{"bbox": [61.569000244140625, 560.20703125, 286.3651123046875, 581.068603515625], "page": 12, "span": [0, 61], "__ref_s3_data": null}], "text": "- \u00b7 TableFormer output does not include the table cell content.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [61.569000244140625, 527.0670166015625, 286.3651428222656, 547.9285888671875], "page": 12, "span": [0, 77], "__ref_s3_data": null}], "text": "- \u00b7 There are occasional inaccuracies in the predictions of the bounding boxes.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [50.11199951171875, 396.2931213378906, 286.3651123046875, 512.7965698242188], "page": 12, "span": [0, 545], "__ref_s3_data": null}], "text": "However, it is possible to mitigate those limitations by combining the TableFormer predictions with the information already present inside a programmatic PDF document. More specifically, PDF documents can be seen as a sequence of PDF cells where each cell is described by its content and bounding box. If we are able to associate the PDF cells with the predicted table cells, we can directly link the PDF cell content to the table cell structure and use the PDF bounding boxes to correct misalignments in the predicted table cell bounding boxes.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [50.11199951171875, 372.068115234375, 286.3649597167969, 392.9306640625], "page": 12, "span": [0, 68], "__ref_s3_data": null}], "text": "Here is a step-by-step description of the prediction postprocessing:", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [50.11199951171875, 335.8881530761719, 286.3650817871094, 368.7046813964844], "page": 12, "span": [0, 173], "__ref_s3_data": null}], "text": "- 1. Get the minimal grid dimensions - number of rows and columns for the predicted table structure. This represents the most granular grid for the underlying table structure.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [50.11199951171875, 287.7532043457031, 286.36505126953125, 332.52471923828125], "page": 12, "span": [0, 187], "__ref_s3_data": null}], "text": "- 2. Generate pair-wise matches between the bounding boxes of the PDF cells and the predicted cells. The Intersection Over Union (IOU) metric is used to evaluate the quality of the matches.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [50.11199951171875, 263.5272216796875, 286.36492919921875, 284.3897705078125], "page": 12, "span": [0, 97], "__ref_s3_data": null}], "text": "- 3. Use a carefully selected IOU threshold to designate the matches as \"good\" ones and \"bad\" ones.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [50.11199951171875, 227.34722900390625, 286.3651123046875, 260.164794921875], "page": 12, "span": [0, 131], "__ref_s3_data": null}], "text": "- 3.a. If all IOU scores in a column are below the threshold, discard all predictions (structure and bounding boxes) for that column.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [50.11199951171875, 191.16722106933594, 286.3650817871094, 223.98377990722656], "page": 12, "span": [0, 169], "__ref_s3_data": null}], "text": "- 4. Find the best-fitting content alignment for the predicted cells with good IOU per each column. The alignment of the column can be identified by the following formula:", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [110.70498657226562, 137.89439392089844, 286.3623962402344, 168.5640869140625], "page": 12, "span": [0, 81], "__ref_s3_data": null}], "text": "alignment = arg min c { D$_{c}$ } D$_{c}$ = max { x$_{c}$ } - min { x$_{c}$ } (4)", "type": "equation", "payload": null, "name": "Formula", "font": null}, {"prov": [{"bbox": [50.11199951171875, 103.07321166992188, 286.36199951171875, 124.6520767211914], "page": 12, "span": [0, 103], "__ref_s3_data": null}], "text": "where c is one of { left, centroid, right } and x$_{c}$ is the xcoordinate for the corresponding point.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [50.11199951171875, 78.84821319580078, 286.3649597167969, 99.70977783203125], "page": 12, "span": [0, 110], "__ref_s3_data": null}], "text": "- 5. Use the alignment computed in step 4, to compute the median x -coordinate for all table columns and the me-", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [308.86199951171875, 536.2962036132812, 545.1151733398438, 581.0687866210938], "page": 12, "span": [0, 183], "__ref_s3_data": null}], "text": "dian cell size for all table cells. The usage of median during the computations, helps to eliminate outliers caused by occasional column spans which are usually wider than the normal.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [308.86199951171875, 512.0361938476562, 545.114990234375, 532.8977661132812], "page": 12, "span": [0, 91], "__ref_s3_data": null}], "text": "- 6. Snap all cells with bad IOU to their corresponding median x -coordinates and cell sizes.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [308.8620300292969, 404.08929443359375, 545.1151123046875, 508.6367492675781], "page": 12, "span": [0, 471], "__ref_s3_data": null}], "text": "- 7. Generate a new set of pair-wise matches between the corrected bounding boxes and PDF cells. This time use a modified version of the IOU metric, where the area of the intersection between the predicted and PDF cells is divided by the PDF cell area. In case there are multiple matches for the same PDF cell, the prediction with the higher score is preferred. This covers the cases where the PDF cells are smaller than the area of predicted or corrected prediction cells.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [308.8620300292969, 332.00836181640625, 545.1151733398438, 400.6898498535156], "page": 12, "span": [0, 311], "__ref_s3_data": null}], "text": "- 8. In some rare occasions, we have noticed that TableFormer can confuse a single column as two. When the postprocessing steps are applied, this results with two predicted columns pointing to the same PDF column. In such case we must de-duplicate the columns according to highest total column intersection score.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [308.8620300292969, 224.06141662597656, 545.1151733398438, 328.6089172363281], "page": 12, "span": [0, 503], "__ref_s3_data": null}], "text": "- 9. Pick up the remaining orphan cells. There could be cases, when after applying all the previous post-processing steps, some PDF cells could still remain without any match to predicted cells. However, it is still possible to deduce the correct matching for an orphan PDF cell by mapping its bounding box on the geometry of the grid. This mapping decides if the content of the orphan cell will be appended to an already matched table cell, or a new table cell should be created to match with the orphan.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [308.8620300292969, 187.8454132080078, 545.1168823242188, 220.66197204589844], "page": 12, "span": [0, 113], "__ref_s3_data": null}], "text": "9a. Compute the top and bottom boundary of the horizontal band for each grid row (min/max y coordinates per row).", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [308.862060546875, 163.58441162109375, 545.1150512695312, 184.44696044921875], "page": 12, "span": [0, 101], "__ref_s3_data": null}], "text": "- 9b. Intersect the orphan's bounding box with the row bands, and map the cell to the closest grid row.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [308.862060546875, 127.3694076538086, 545.1150512695312, 160.18597412109375], "page": 12, "span": [0, 117], "__ref_s3_data": null}], "text": "- 9c. Compute the left and right boundary of the vertical band for each grid column (min/max x coordinates per column).", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [308.862060546875, 103.10841369628906, 545.114990234375, 123.969970703125], "page": 12, "span": [0, 107], "__ref_s3_data": null}], "text": "- 9d. Intersect the orphan's bounding box with the column bands, and map the cell to the closest grid column.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [308.862060546875, 78.84840393066406, 545.1151733398438, 99.70997619628906], "page": 12, "span": [0, 118], "__ref_s3_data": null}], "text": "- 9e. If the table cell under the identified row and column is not empty, extend its content with the content of the or-", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [292.6310729980469, 48.96040725708008, 302.5936584472656, 57.86697006225586], "page": 12, "span": [0, 2], "__ref_s3_data": null}], "text": "12", "type": "page-footer", "payload": null, "name": "Page-footer", "font": null}, {"prov": [{"bbox": [50.11199951171875, 707.8850708007812, 88.84658813476562, 716.7916259765625], "page": 13, "span": [0, 10], "__ref_s3_data": null}], "text": "phan cell.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [50.11199951171875, 683.9750366210938, 286.3649597167969, 704.8366088867188], "page": 13, "span": [0, 76], "__ref_s3_data": null}], "text": "9f. Otherwise create a new structural cell and match it wit the orphan cell.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [50.11199951171875, 660.2941284179688, 286.364990234375, 680.8369140625], "page": 13, "span": [0, 97], "__ref_s3_data": null}], "text": "Aditional images with examples of TableFormer predictions and post-processing can be found below.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"name": "Table", "type": "table", "$ref": "#/tables/8"}, {"name": "Table", "type": "table", "$ref": "#/tables/9"}, {"name": "Table", "type": "table", "$ref": "#/tables/10"}, {"prov": [{"bbox": [63.340999603271484, 281.0370788574219, 273.1334228515625, 289.9436340332031], "page": 13, "span": [0, 52], "__ref_s3_data": null}], "text": "Figure 8: Example of a table with multi-line header.", "type": "caption", "payload": null, "name": "Caption", "font": null}, {"name": "Table", "type": "table", "$ref": "#/tables/11"}, {"prov": [{"bbox": [292.6309814453125, 48.960079193115234, 302.59356689453125, 57.866641998291016], "page": 13, "span": [0, 2], "__ref_s3_data": null}], "text": "13", "type": "page-footer", "payload": null, "name": "Page-footer", "font": null}, {"name": "Table", "type": "table", "$ref": "#/tables/12"}, {"name": "Table", "type": "table", "$ref": "#/tables/13"}, {"name": "Table", "type": "table", "$ref": "#/tables/14"}, {"name": "Picture", "type": "figure", "$ref": "#/figures/12"}, {"prov": [{"bbox": [308.86199951171875, 464.54010009765625, 545.1151123046875, 485.4016418457031], "page": 13, "span": [0, 67], "__ref_s3_data": null}], "text": "Figure 9: Example of a table with big empty distance between cells.", "type": "caption", "payload": null, "name": "Caption", "font": null}, {"name": "Table", "type": "table", "$ref": "#/tables/15"}, {"name": "Table", "type": "table", "$ref": "#/tables/16"}, {"name": "Table", "type": "table", "$ref": "#/tables/17"}, {"name": "Table", "type": "table", "$ref": "#/tables/18"}, {"name": "Picture", "type": "figure", "$ref": "#/figures/13"}, {"prov": [{"bbox": [312.3429870605469, 102.60006713867188, 541.63232421875, 111.50663757324219], "page": 13, "span": [0, 55], "__ref_s3_data": null}], "text": "Figure 10: Example of a complex table with empty cells.", "type": "caption", "payload": null, "name": "Caption", "font": null}, {"name": "Table", "type": "table", "$ref": "#/tables/19"}, {"name": "Table", "type": "table", "$ref": "#/tables/20"}, {"prov": [{"bbox": [50.11199951171875, 414.36810302734375, 286.3650817871094, 435.2296447753906], "page": 14, "span": [0, 61], "__ref_s3_data": null}], "text": "Figure 11: Simple table with different style and empty cells.", "type": "caption", "payload": null, "name": "Caption", "font": null}, {"name": "Picture", "type": "figure", "$ref": "#/figures/14"}, {"name": "Table", "type": "table", "$ref": "#/tables/21"}, {"name": "Table", "type": "table", "$ref": "#/tables/22"}, {"name": "Table", "type": "table", "$ref": "#/tables/23"}, {"prov": [{"bbox": [54.61899948120117, 111.27507781982422, 281.85589599609375, 120.181640625], "page": 14, "span": [0, 56], "__ref_s3_data": null}], "text": "Figure 12: Simple table predictions and post processing.", "type": "caption", "payload": null, "name": "Caption", "font": null}, {"name": "Picture", "type": "figure", "$ref": "#/figures/15"}, {"prov": [{"bbox": [292.6309814453125, 48.96007537841797, 302.59356689453125, 57.86663818359375], "page": 14, "span": [0, 2], "__ref_s3_data": null}], "text": "14", "type": "page-footer", "payload": null, "name": "Page-footer", "font": null}, {"name": "Table", "type": "table", "$ref": "#/tables/24"}, {"name": "Table", "type": "table", "$ref": "#/tables/25"}, {"name": "Table", "type": "table", "$ref": "#/tables/26"}, {"prov": [{"bbox": [315.7900085449219, 411.4090881347656, 538.1852416992188, 420.3156433105469], "page": 14, "span": [0, 55], "__ref_s3_data": null}], "text": "Figure 13: Table predictions example on colorful table.", "type": "caption", "payload": null, "name": "Caption", "font": null}, {"name": "Picture", "type": "figure", "$ref": "#/figures/16"}, {"name": "Table", "type": "table", "$ref": "#/tables/27"}, {"name": "Table", "type": "table", "$ref": "#/tables/28"}, {"name": "Table", "type": "table", "$ref": "#/tables/29"}, {"prov": [{"bbox": [344.9849853515625, 99.54707336425781, 508.9893493652344, 108.45364379882812], "page": 14, "span": [0, 40], "__ref_s3_data": null}], "text": "Figure 14: Example with multi-line text.", "type": "caption", "payload": null, "name": "Caption", "font": null}, {"name": "Table", "type": "table", "$ref": "#/tables/30"}, {"name": "Picture", "type": "figure", "$ref": "#/figures/17"}, {"name": "Table", "type": "table", "$ref": "#/tables/31"}, {"name": "Picture", "type": "figure", "$ref": "#/figures/18"}, {"name": "Table", "type": "table", "$ref": "#/tables/32"}, {"name": "Picture", "type": "figure", "$ref": "#/figures/19"}, {"name": "Picture", "type": "figure", "$ref": "#/figures/20"}, {"prov": [{"bbox": [84.23300170898438, 138.7420654296875, 252.24224853515625, 147.64862060546875], "page": 15, "span": [0, 41], "__ref_s3_data": null}], "text": "Figure 15: Example with triangular table.", "type": "caption", "payload": null, "name": "Caption", "font": null}, {"name": "Table", "type": "table", "$ref": "#/tables/33"}, {"prov": [{"bbox": [292.6309814453125, 48.9600944519043, 302.59356689453125, 57.86665725708008], "page": 15, "span": [0, 2], "__ref_s3_data": null}], "text": "15", "type": "page-footer", "payload": null, "name": "Page-footer", "font": null}, {"name": "Table", "type": "table", "$ref": "#/tables/34"}, {"name": "Table", "type": "table", "$ref": "#/tables/35"}, {"name": "Picture", "type": "figure", "$ref": "#/figures/21"}, {"name": "Table", "type": "table", "$ref": "#/tables/36"}, {"name": "Picture", "type": "figure", "$ref": "#/figures/22"}, {"prov": [{"bbox": [308.8619689941406, 118.20308685302734, 545.1151123046875, 139.0646514892578], "page": 15, "span": [0, 106], "__ref_s3_data": null}], "text": "Figure 16: Example of how post-processing helps to restore mis-aligned bounding boxes prediction artifact.", "type": "caption", "payload": null, "name": "Caption", "font": null}, {"name": "Table", "type": "table", "$ref": "#/tables/37"}, {"prov": [{"bbox": [50.11199951171875, 262.80108642578125, 545.1138305664062, 283.6626281738281], "page": 16, "span": [0, 153], "__ref_s3_data": null}], "text": "Figure 17: Example of long table. End-to-end example from initial PDF cells to prediction of bounding boxes, post processing and prediction of structure.", "type": "caption", "payload": null, "name": "Caption", "font": null}, {"name": "Picture", "type": "figure", "$ref": "#/figures/23"}, {"prov": [{"bbox": [292.6309814453125, 48.960079193115234, 302.59356689453125, 57.866641998291016], "page": 16, "span": [0, 2], "__ref_s3_data": null}], "text": "16", "type": "page-footer", "payload": null, "name": "Page-footer", "font": null}], "figures": [{"prov": [{"bbox": [315.65362548828125, 489.19854736328125, 537.1475219726562, 563.2765502929688], "page": 1, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "figure", "payload": null, "bounding-box": null}, {"prov": [{"bbox": [314.78173828125, 381.9505615234375, 539.1802978515625, 453.9347229003906], "page": 1, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "figure", "payload": null, "bounding-box": null}, {"prov": [{"bbox": [315.7172546386719, 295.9709777832031, 536.835693359375, 358.176513671875], "page": 1, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "figure", "payload": null, "bounding-box": null}, {"prov": [{"bbox": [312.10369873046875, 541.39013671875, 550.38916015625, 713.5591430664062], "page": 3, "span": [0, 104], "__ref_s3_data": null}], "text": "Figure 2: Distribution of the tables across different table dimensions in PubTabNet + FinTabNet datasets", "type": "figure", "payload": null, "bounding-box": null}, {"prov": [{"bbox": [74.30525970458984, 608.2984619140625, 519.9801025390625, 714.0887451171875], "page": 5, "span": [0, 212], "__ref_s3_data": null}], "text": "Figure 3: TableFormer takes in an image of the PDF and creates bounding box and HTML structure predictions that are synchronized. The bounding boxes grabs the content from the PDF and inserts it in the structure.", "type": "figure", "payload": null, "bounding-box": null}, {"prov": [{"bbox": [53.03325653076172, 284.3311462402344, 285.3731689453125, 534.3346557617188], "page": 5, "span": [0, 745], "__ref_s3_data": null}], "text": "Figure 4: Given an input image of a table, the Encoder produces fixed-length features that represent the input image. The features are then passed to both the Structure Decoder and Cell BBox Decoder . During training, the Structure Decoder receives 'tokenized tags' of the HTML code that represent the table structure. Afterwards, a transformer encoder and decoder architecture is employed to produce features that are received by a linear layer, and the Cell BBox Decoder. The linear layer is applied to the features to predict the tags. Simultaneously, the Cell BBox Decoder selects features referring to the data cells (' < td > ', ' < ') and passes them through an attention network, an MLP, and a linear layer to predict the bounding boxes.", "type": "figure", "payload": null, "bounding-box": null}, {"prov": [{"bbox": [49.97503662109375, 604.4210815429688, 301.6335754394531, 688.287353515625], "page": 8, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "figure", "payload": null, "bounding-box": null}, {"prov": [{"bbox": [305.58367919921875, 611.3732299804688, 554.8258666992188, 693.3458251953125], "page": 8, "span": [0, 79], "__ref_s3_data": null}], "text": "b. Structure predicted by TableFormer, with superimposed matched PDF cell text:", "type": "figure", "payload": null, "bounding-box": null}, {"prov": [{"bbox": [51.736167907714844, 348.3419189453125, 211.83778381347656, 411.51934814453125], "page": 8, "span": [0, 397], "__ref_s3_data": null}], "text": "Figure 5: One of the benefits of TableFormer is that it is language agnostic, as an example, the left part of the illustration demonstrates TableFormer predictions on previously unseen language (Japanese). Additionally, we see that TableFormer is robust to variability in style and content, right side of the illustration shows the example of the TableFormer prediction from the FinTabNet dataset.", "type": "figure", "payload": null, "bounding-box": null}, {"prov": [{"bbox": [383.1364440917969, 349.2250671386719, 542.1132202148438, 410.7687072753906], "page": 8, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "figure", "payload": null, "bounding-box": null}, {"prov": [{"bbox": [216.76925659179688, 348.6529541015625, 375.7829284667969, 411.5093994140625], "page": 8, "span": [0, 112], "__ref_s3_data": null}], "text": "Figure 6: An example of TableFormer predictions (bounding boxes and structure) from generated SynthTabNet table.", "type": "figure", "payload": null, "bounding-box": null}, {"prov": [{"bbox": [53.54228973388672, 644.4091186523438, 544.938232421875, 717.25146484375], "page": 12, "span": [0, 245], "__ref_s3_data": null}], "text": "Figure 7: Distribution of the tables across different dimensions per dataset. Simple vs complex tables per dataset and split, strict vs non strict html structures per dataset and table complexity, missing bboxes per dataset and table complexity.", "type": "figure", "payload": null, "bounding-box": null}, {"prov": [{"bbox": [309.79150390625, 499.60601806640625, 425.9603271484375, 538.0946044921875], "page": 13, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "figure", "payload": null, "bounding-box": null}, {"prov": [{"bbox": [333.9573669433594, 126.5096435546875, 518.4768676757812, 198.8865966796875], "page": 13, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "figure", "payload": null, "bounding-box": null}, {"prov": [{"bbox": [51.1537971496582, 447.0933532714844, 282.8598937988281, 687.6914672851562], "page": 14, "span": [0, 61], "__ref_s3_data": null}], "text": "Figure 11: Simple table with different style and empty cells.", "type": "figure", "payload": null, "bounding-box": null}, {"prov": [{"bbox": [50.404788970947266, 135.83905029296875, 177.05642700195312, 180.99615478515625], "page": 14, "span": [0, 56], "__ref_s3_data": null}], "text": "Figure 12: Simple table predictions and post processing.", "type": "figure", "payload": null, "bounding-box": null}, {"prov": [{"bbox": [318.6332092285156, 432.9424133300781, 534.73583984375, 701.1157836914062], "page": 14, "span": [0, 55], "__ref_s3_data": null}], "text": "Figure 13: Table predictions example on colorful table.", "type": "figure", "payload": null, "bounding-box": null}, {"prov": [{"bbox": [55.1163444519043, 542.66552734375, 279.370849609375, 655.7449951171875], "page": 15, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "figure", "payload": null, "bounding-box": null}, {"prov": [{"bbox": [54.28135299682617, 418.4728698730469, 279.2568359375, 531.7384033203125], "page": 15, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "figure", "payload": null, "bounding-box": null}, {"prov": [{"bbox": [55.423954010009766, 294.436279296875, 280.2310791015625, 407.4449462890625], "page": 15, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "figure", "payload": null, "bounding-box": null}, {"prov": [{"bbox": [50.64816665649414, 160.73651123046875, 319.91033935546875, 286.0196838378906], "page": 15, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "figure", "payload": null, "bounding-box": null}, {"prov": [{"bbox": [323.4686279296875, 327.739501953125, 525.9568481445312, 429.5491638183594], "page": 15, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "figure", "payload": null, "bounding-box": null}, {"prov": [{"bbox": [353.6920471191406, 156.22674560546875, 495.4288024902344, 304.594970703125], "page": 15, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "figure", "payload": null, "bounding-box": null}, {"prov": [{"bbox": [66.79946899414062, 293.8616027832031, 528.5564575195312, 538.3836669921875], "page": 16, "span": [0, 153], "__ref_s3_data": null}], "text": "Figure 17: Example of long table. End-to-end example from initial PDF cells to prediction of bounding boxes, post processing and prediction of structure.", "type": "figure", "payload": null, "bounding-box": null}], "tables": [{"prov": [{"bbox": [315.65362548828125, 489.19854736328125, 537.1475219726562, 563.2765502929688], "page": 1, "span": [0, 0], "__ref_s3_data": null}], "text": "Tables organize valuable content in a concise and compact representation. This content is extremely valuable for systems such as search engines, Knowledge Graph's, etc, since they enhance their predictive capabilities. Unfortunately, tables come in a large variety of shapes and sizes. Furthermore, they can have complex column/row-header configurations, multiline rows, different variety of separation lines, missing entries, etc. As such, the correct identification of the table-structure from an image is a nontrivial task. In this paper, we present a new table-structure identification model. The latter improves the latest end-toend deep learning model (i.e. encoder-dual-decoder from PubTabNet) in two significant ways. First, we introduce a new object detection decoder for table-cells. In this way, we can obtain the content of the table-cells from programmatic PDF's directly from the PDF source and avoid the training of the custom OCR decoders. This architectural change leads to more accurate table-content extraction and allows us to tackle non-english tables. Second, we replace the LSTM decoders with transformer based decoders. This upgrade improves significantly the previous state-of-the-art tree-editing-distance-score (TEDS) from 91% to 98.5% on simple tables and from 88.7% to 95% on complex tables.", "type": "table", "payload": null, "#-cols": 2, "#-rows": 1, "data": [[{"bbox": [384.03289794921875, 529.1906127929688, 390.0376892089844, 539.321044921875], "spans": [[0, 0]], "text": "3", "type": "col_header", "col": 0, "col-header": true, "col-span": [0, 1], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [451.9457092285156, 546.5225219726562, 457.95050048828125, 556.6529541015625], "spans": [[0, 1]], "text": "1", "type": "col_header", "col": 1, "col-header": true, "col-span": [1, 2], "row": 0, "row-header": false, "row-span": [0, 1]}]], "model": null, "bounding-box": null}, {"prov": [{"bbox": [315.7172546386719, 295.9709777832031, 536.835693359375, 358.176513671875], "page": 1, "span": [0, 0], "__ref_s3_data": null}], "text": "Figure 1: Picture of a table with subtle, complex features such as (1) multi-column headers, (2) cell with multi-row text and (3) cells with no content. Image from PubTabNet evaluation set, filename: 'PMC2944238 004 02'.", "type": "table", "payload": null, "#-cols": 6, "#-rows": 5, "data": [[{"bbox": [318.8807067871094, 345.5291748046875, 323.273193359375, 354.3141174316406], "spans": [[0, 0]], "text": "0", "type": "col_header", "col": 0, "col-header": true, "col-span": [0, 1], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [347.24871826171875, 345.5291748046875, 351.6412048339844, 354.3141174316406], "spans": [[0, 1], [0, 2]], "text": "1", "type": "col_header", "col": 1, "col-header": true, "col-span": [1, 3], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [347.24871826171875, 345.5291748046875, 351.6412048339844, 354.3141174316406], "spans": [[0, 1], [0, 2]], "text": "1", "type": "col_header", "col": 2, "col-header": true, "col-span": [1, 3], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [394.1042175292969, 344.2760009765625, 465.8810119628906, 354.4064025878906], "spans": [[0, 3], [0, 4]], "text": "2 1", "type": "col_header", "col": 3, "col-header": true, "col-span": [3, 5], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [394.1042175292969, 344.2760009765625, 465.8810119628906, 354.4064025878906], "spans": [[0, 3], [0, 4]], "text": "2 1", "type": "col_header", "col": 4, "col-header": true, "col-span": [3, 5], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": null, "spans": [[0, 5]], "text": "", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 0, "row-header": false, "row-span": [0, 1]}], [{"bbox": [318.7731628417969, 333.6695556640625, 323.1656494140625, 342.4544982910156], "spans": [[1, 0]], "text": "3", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [347.24871826171875, 333.6695556640625, 351.6412048339844, 342.4544982910156], "spans": [[1, 1]], "text": "4", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [366.7010192871094, 332.748779296875, 398.4967041015625, 342.8791809082031], "spans": [[1, 2]], "text": "5 3", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [440.95941162109375, 333.6695556640625, 445.3518981933594, 342.4544982910156], "spans": [[1, 3]], "text": "6", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [487.8149108886719, 333.6695556640625, 492.2073974609375, 342.4544982910156], "spans": [[1, 4]], "text": "7", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": null, "spans": [[1, 5]], "text": "", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 1, "row-header": false, "row-span": [1, 2]}], [{"bbox": [318.7731628417969, 309.51080322265625, 323.1656494140625, 318.2957458496094], "spans": [[2, 0]], "text": "8", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [347.24871826171875, 321.3704528808594, 351.6412048339844, 330.1553955078125], "spans": [[2, 1]], "text": "9", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [394.1042175292969, 321.3704528808594, 402.8883056640625, 330.1553955078125], "spans": [[2, 2]], "text": "10", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [440.95941162109375, 321.3704528808594, 449.4228515625, 330.1553955078125], "spans": [[2, 3]], "text": "11", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [487.8149108886719, 321.3704528808594, 496.5989990234375, 330.1553955078125], "spans": [[2, 4]], "text": "12", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [331.90423583984375, 308.54669189453125, 337.9090270996094, 318.6770935058594], "spans": [[2, 5], [3, 5], [4, 5]], "text": "2", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 2, "row-header": false, "row-span": [2, 5]}], [{"bbox": null, "spans": [[3, 0]], "text": "", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [347.24871826171875, 309.51080322265625, 356.0328063964844, 318.2957458496094], "spans": [[3, 1]], "text": "13", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [394.1042175292969, 309.51080322265625, 402.8883056640625, 318.2957458496094], "spans": [[3, 2]], "text": "14", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [440.95941162109375, 309.51080322265625, 449.7434997558594, 318.2957458496094], "spans": [[3, 3]], "text": "15", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [487.8149108886719, 309.51080322265625, 496.5989990234375, 318.2957458496094], "spans": [[3, 4]], "text": "16", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [331.90423583984375, 308.54669189453125, 337.9090270996094, 318.6770935058594], "spans": [[2, 5], [3, 5], [4, 5]], "text": "2", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 3, "row-header": false, "row-span": [2, 5]}], [{"bbox": null, "spans": [[4, 0]], "text": "", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [347.24871826171875, 298.0903625488281, 356.0328063964844, 306.87530517578125], "spans": [[4, 1]], "text": "17", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [394.1042175292969, 298.0903625488281, 402.8883056640625, 306.87530517578125], "spans": [[4, 2]], "text": "18", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [440.95941162109375, 298.0903625488281, 449.7434997558594, 306.87530517578125], "spans": [[4, 3]], "text": "19", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [487.8149108886719, 298.0903625488281, 496.5989990234375, 306.87530517578125], "spans": [[4, 4]], "text": "20", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [331.90423583984375, 308.54669189453125, 337.9090270996094, 318.6770935058594], "spans": [[2, 5], [3, 5], [4, 5]], "text": "2", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 4, "row-header": false, "row-span": [2, 5]}]], "model": null, "bounding-box": null}, {"prov": [{"bbox": [310.67584228515625, 636.7794799804688, 542.9547119140625, 718.80615234375], "page": 4, "span": [0, 0], "__ref_s3_data": null}], "text": "Table 1: Both \"Combined-Tabnet\" and \"CombinedTabnet\" are variations of the following: (*) The CombinedTabnet dataset is the processed combination of PubTabNet and Fintabnet. (**) The combined dataset is the processed combination of PubTabNet, Fintabnet and TableBank.", "type": "table", "payload": null, "#-cols": 5, "#-rows": 7, "data": [[{"bbox": null, "spans": [[0, 0]], "text": "", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [412.3320007324219, 709.4790649414062, 430.9023132324219, 718.3856201171875], "spans": [[0, 1]], "text": "Tags", "type": "col_header", "col": 1, "col-header": true, "col-span": [1, 2], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [442.857421875, 709.4790649414062, 464.4463806152344, 718.3856201171875], "spans": [[0, 2]], "text": "Bbox", "type": "col_header", "col": 2, "col-header": true, "col-span": [2, 3], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [477.78631591796875, 709.4790649414062, 494.9419250488281, 718.3856201171875], "spans": [[0, 3]], "text": "Size", "type": "col_header", "col": 3, "col-header": true, "col-span": [3, 4], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [508.2818603515625, 709.4790649414062, 536.9143676757812, 718.3856201171875], "spans": [[0, 4]], "text": "Format", "type": "col_header", "col": 4, "col-header": true, "col-span": [4, 5], "row": 0, "row-header": false, "row-span": [0, 1]}], [{"bbox": [317.05999755859375, 697.1260986328125, 361.64263916015625, 706.0326538085938], "spans": [[1, 0]], "text": "PubTabNet", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 1, "row-header": true, "row-span": [1, 2]}, {"bbox": [417.8559875488281, 697.1161499023438, 425.37774658203125, 706.33154296875], "spans": [[1, 1]], "text": "3", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [449.89569091796875, 697.1161499023438, 457.4174499511719, 706.33154296875], "spans": [[1, 2]], "text": "3", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [476.4010009765625, 697.1260986328125, 496.3262023925781, 706.0326538085938], "spans": [[1, 3]], "text": "509k", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [512.6349487304688, 697.1260986328125, 532.5601196289062, 706.0326538085938], "spans": [[1, 4]], "text": "PNG", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 1, "row-header": false, "row-span": [1, 2]}], [{"bbox": [317.05999755859375, 685.1710815429688, 359.4309387207031, 694.07763671875], "spans": [[2, 0]], "text": "FinTabNet", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 2, "row-header": true, "row-span": [2, 3]}, {"bbox": [417.8559875488281, 685.1611328125, 425.37774658203125, 694.3765258789062], "spans": [[2, 1]], "text": "3", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [449.89569091796875, 685.1611328125, 457.4174499511719, 694.3765258789062], "spans": [[2, 2]], "text": "3", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [476.4010009765625, 685.1710815429688, 496.3262023925781, 694.07763671875], "spans": [[2, 3]], "text": "112k", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [513.4618530273438, 685.1710815429688, 531.7332763671875, 694.07763671875], "spans": [[2, 4]], "text": "PDF", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 2, "row-header": false, "row-span": [2, 3]}], [{"bbox": [317.05999755859375, 673.215087890625, 359.9788818359375, 682.1216430664062], "spans": [[3, 0]], "text": "TableBank", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 3, "row-header": true, "row-span": [3, 4]}, {"bbox": [417.8559875488281, 673.2051391601562, 425.37774658203125, 682.4205322265625], "spans": [[3, 1]], "text": "3", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [450.812255859375, 673.2051391601562, 456.50091552734375, 682.4205322265625], "spans": [[3, 2]], "text": "7", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [476.4010009765625, 673.215087890625, 496.3262023925781, 682.1216430664062], "spans": [[3, 3]], "text": "145k", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [511.25018310546875, 673.215087890625, 533.9450073242188, 682.1216430664062], "spans": [[3, 4]], "text": "JPEG", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 3, "row-header": false, "row-span": [3, 4]}], [{"bbox": [317.05999755859375, 661.2600708007812, 400.3772277832031, 670.1666259765625], "spans": [[4, 0]], "text": "Combined-Tabnet(*)", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 4, "row-header": true, "row-span": [4, 5]}, {"bbox": [417.8559875488281, 661.2501220703125, 425.37774658203125, 670.4655151367188], "spans": [[4, 1]], "text": "3", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [449.89569091796875, 661.2501220703125, 457.4174499511719, 670.4655151367188], "spans": [[4, 2]], "text": "3", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [476.4010009765625, 661.2600708007812, 496.3262023925781, 670.1666259765625], "spans": [[4, 3]], "text": "400k", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [512.6349487304688, 661.2600708007812, 532.5601196289062, 670.1666259765625], "spans": [[4, 4]], "text": "PNG", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 4, "row-header": false, "row-span": [4, 5]}], [{"bbox": [317.05999755859375, 649.3050537109375, 375.1718444824219, 658.2116088867188], "spans": [[5, 0]], "text": "Combined(**)", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 5, "row-header": true, "row-span": [5, 6]}, {"bbox": [417.8559875488281, 649.2951049804688, 425.37774658203125, 658.510498046875], "spans": [[5, 1]], "text": "3", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [449.89569091796875, 649.2951049804688, 457.4174499511719, 658.510498046875], "spans": [[5, 2]], "text": "3", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [476.4010009765625, 649.3050537109375, 496.3262023925781, 658.2116088867188], "spans": [[5, 3]], "text": "500k", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [512.6349487304688, 649.3050537109375, 532.5601196289062, 658.2116088867188], "spans": [[5, 4]], "text": "PNG", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 5, "row-header": false, "row-span": [5, 6]}], [{"bbox": [317.05999755859375, 637.3500366210938, 369.3935241699219, 646.256591796875], "spans": [[6, 0]], "text": "SynthTabNet", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 6, "row-header": true, "row-span": [6, 7]}, {"bbox": [417.8559875488281, 637.3401489257812, 425.37774658203125, 646.5555419921875], "spans": [[6, 1]], "text": "3", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [449.89569091796875, 637.3401489257812, 457.4174499511719, 646.5555419921875], "spans": [[6, 2]], "text": "3", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [476.4010009765625, 637.35009765625, 496.3262023925781, 646.2566528320312], "spans": [[6, 3]], "text": "600k", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [512.6349487304688, 637.35009765625, 532.5601196289062, 646.2566528320312], "spans": [[6, 4]], "text": "PNG", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 6, "row-header": false, "row-span": [6, 7]}]], "model": null, "bounding-box": null}, {"prov": [{"bbox": [53.36848831176758, 209.60223388671875, 283.04437255859375, 382.8642272949219], "page": 7, "span": [0, 0], "__ref_s3_data": null}], "text": "Table 2: Structure results on PubTabNet (PTN), FinTabNet (FTN), TableBank (TB) and SynthTabNet (STN).", "type": "table", "payload": null, "#-cols": 5, "#-rows": 11, "data": [[{"bbox": [78.84300231933594, 362.403076171875, 104.8553466796875, 371.30963134765625], "spans": [[0, 0]], "text": "Model", "type": "col_header", "col": 0, "col-header": true, "col-span": [0, 1], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [129.33799743652344, 356.42608642578125, 159.21583557128906, 365.3326416015625], "spans": [[0, 1]], "text": "Dataset", "type": "col_header", "col": 1, "col-header": true, "col-span": [1, 2], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [171.17095947265625, 356.42608642578125, 199.40496826171875, 365.3326416015625], "spans": [[0, 2]], "text": "Simple", "type": "col_header", "col": 2, "col-header": true, "col-span": [2, 3], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [211.1999969482422, 356.42608642578125, 247.74349975585938, 377.2876281738281], "spans": [[0, 3]], "text": "TEDS Complex", "type": "col_header", "col": 3, "col-header": true, "col-span": [3, 4], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [264.5404357910156, 356.42608642578125, 277.27264404296875, 365.3326416015625], "spans": [[0, 4]], "text": "All", "type": "col_header", "col": 4, "col-header": true, "col-span": [4, 5], "row": 0, "row-header": false, "row-span": [0, 1]}], [{"bbox": [81.61199951171875, 339.4690856933594, 102.08513641357422, 348.3756408691406], "spans": [[1, 0]], "text": "EDD", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 1, "row-header": true, "row-span": [1, 2]}, {"bbox": [134.87205505371094, 339.4690856933594, 153.69140625, 348.3756408691406], "spans": [[1, 1]], "text": "PTN", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [176.56553649902344, 339.4690856933594, 194.00009155273438, 348.3756408691406], "spans": [[1, 2]], "text": "91.1", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [220.82937622070312, 339.4690856933594, 238.26393127441406, 348.3756408691406], "spans": [[1, 3]], "text": "88.7", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [262.18414306640625, 339.4690856933594, 279.6186828613281, 348.3756408691406], "spans": [[1, 4]], "text": "89.9", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 1, "row-header": false, "row-span": [1, 2]}], [{"bbox": [82.16500091552734, 327.5130920410156, 101.53230285644531, 336.4196472167969], "spans": [[2, 0]], "text": "GTE", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 2, "row-header": true, "row-span": [2, 3]}, {"bbox": [134.86715698242188, 327.5130920410156, 153.68650817871094, 336.4196472167969], "spans": [[2, 1]], "text": "PTN", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [183.62411499023438, 327.5130920410156, 186.94166564941406, 336.4196472167969], "spans": [[2, 2]], "text": "-", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [227.88795471191406, 327.5130920410156, 231.20550537109375, 336.4196472167969], "spans": [[2, 3]], "text": "-", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [259.69854736328125, 327.5130920410156, 282.1144104003906, 336.4196472167969], "spans": [[2, 4]], "text": "93.01", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 2, "row-header": false, "row-span": [2, 3]}], [{"bbox": [66.31500244140625, 314.9600830078125, 117.38329315185547, 323.86663818359375], "spans": [[3, 0]], "text": "TableFormer", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 3, "row-header": true, "row-span": [3, 4]}, {"bbox": [134.86766052246094, 314.9600830078125, 153.68701171875, 323.86663818359375], "spans": [[3, 1]], "text": "PTN", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [176.57110595703125, 314.9600830078125, 194.0056610107422, 323.86663818359375], "spans": [[3, 2]], "text": "98.5", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [220.83494567871094, 314.9600830078125, 238.26950073242188, 323.86663818359375], "spans": [[3, 3]], "text": "95.0", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [259.697998046875, 315.0298156738281, 282.1138610839844, 323.9862060546875], "spans": [[3, 4]], "text": "96.75", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 3, "row-header": false, "row-span": [3, 4]}], [{"bbox": [81.61199951171875, 299.76708984375, 102.08513641357422, 308.67364501953125], "spans": [[4, 0]], "text": "EDD", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 4, "row-header": true, "row-span": [4, 5]}, {"bbox": [134.87205505371094, 299.76708984375, 153.69140625, 308.67364501953125], "spans": [[4, 1]], "text": "FTN", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [176.56553649902344, 299.76708984375, 194.00009155273438, 308.67364501953125], "spans": [[4, 2]], "text": "88.4", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [218.33871459960938, 299.76708984375, 240.7545623779297, 308.67364501953125], "spans": [[4, 3]], "text": "92.08", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [262.1841125488281, 299.76708984375, 279.61865234375, 308.67364501953125], "spans": [[4, 4]], "text": "90.6", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 4, "row-header": false, "row-span": [4, 5]}], [{"bbox": [82.16500091552734, 287.8121032714844, 101.53230285644531, 296.7186584472656], "spans": [[5, 0]], "text": "GTE", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 5, "row-header": true, "row-span": [5, 6]}, {"bbox": [134.86715698242188, 287.8121032714844, 153.68650817871094, 296.7186584472656], "spans": [[5, 1]], "text": "FTN", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [183.62411499023438, 287.8121032714844, 186.94166564941406, 296.7186584472656], "spans": [[5, 2]], "text": "-", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [227.88795471191406, 287.8121032714844, 231.20550537109375, 296.7186584472656], "spans": [[5, 3]], "text": "-", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [259.69854736328125, 287.8121032714844, 282.1144104003906, 296.7186584472656], "spans": [[5, 4]], "text": "87.14", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 5, "row-header": false, "row-span": [5, 6]}], [{"bbox": [71.78900146484375, 275.85711669921875, 111.90838623046875, 284.763671875], "spans": [[6, 0]], "text": "GTE (FT)", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 6, "row-header": true, "row-span": [6, 7]}, {"bbox": [134.86221313476562, 275.85711669921875, 153.6815643310547, 284.763671875], "spans": [[6, 1]], "text": "FTN", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [183.62913513183594, 275.85711669921875, 186.94668579101562, 284.763671875], "spans": [[6, 2]], "text": "-", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [227.89297485351562, 275.85711669921875, 231.2105255126953, 284.763671875], "spans": [[6, 3]], "text": "-", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [259.693603515625, 275.85711669921875, 282.1094665527344, 284.763671875], "spans": [[6, 4]], "text": "91.02", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 6, "row-header": false, "row-span": [6, 7]}], [{"bbox": [66.31500244140625, 263.9021301269531, 117.38329315185547, 272.8086853027344], "spans": [[7, 0]], "text": "TableFormer", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 7, "row-header": true, "row-span": [7, 8]}, {"bbox": [134.86766052246094, 263.9021301269531, 153.68701171875, 272.8086853027344], "spans": [[7, 1]], "text": "FTN", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 7, "row-header": false, "row-span": [7, 8]}, {"bbox": [176.57110595703125, 263.9021301269531, 194.0056610107422, 272.8086853027344], "spans": [[7, 2]], "text": "97.5", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 7, "row-header": false, "row-span": [7, 8]}, {"bbox": [220.83494567871094, 263.9021301269531, 238.26950073242188, 272.8086853027344], "spans": [[7, 3]], "text": "96.0", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 7, "row-header": false, "row-span": [7, 8]}, {"bbox": [262.1889953613281, 263.97186279296875, 279.62353515625, 272.9282531738281], "spans": [[7, 4]], "text": "96.8", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 7, "row-header": false, "row-span": [7, 8]}], [{"bbox": [81.61199951171875, 246.59507751464844, 102.08513641357422, 255.5016326904297], "spans": [[8, 0]], "text": "EDD", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 8, "row-header": true, "row-span": [8, 9]}, {"bbox": [137.91064453125, 246.59507751464844, 150.64285278320312, 255.5016326904297], "spans": [[8, 1]], "text": "TB", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 8, "row-header": false, "row-span": [8, 9]}, {"bbox": [176.56553649902344, 246.59507751464844, 194.00009155273438, 255.5016326904297], "spans": [[8, 2]], "text": "86.0", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 8, "row-header": false, "row-span": [8, 9]}, {"bbox": [227.89285278320312, 246.59507751464844, 231.2104034423828, 255.5016326904297], "spans": [[8, 3]], "text": "-", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 8, "row-header": false, "row-span": [8, 9]}, {"bbox": [262.1841125488281, 246.59507751464844, 279.61865234375, 255.5016326904297], "spans": [[8, 4]], "text": "86.0", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 8, "row-header": false, "row-span": [8, 9]}], [{"bbox": [66.31500244140625, 234.6390838623047, 117.38329315185547, 243.54563903808594], "spans": [[9, 0]], "text": "TableFormer", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 9, "row-header": true, "row-span": [9, 10]}, {"bbox": [137.90625, 234.6390838623047, 150.63845825195312, 243.54563903808594], "spans": [[9, 1]], "text": "TB", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 9, "row-header": false, "row-span": [9, 10]}, {"bbox": [176.57110595703125, 234.6390838623047, 194.0056610107422, 243.54563903808594], "spans": [[9, 2]], "text": "89.6", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 9, "row-header": false, "row-span": [9, 10]}, {"bbox": [227.88845825195312, 234.6390838623047, 231.2060089111328, 243.54563903808594], "spans": [[9, 3]], "text": "-", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 9, "row-header": false, "row-span": [9, 10]}, {"bbox": [262.1889953613281, 234.7088165283203, 279.62353515625, 243.66519165039062], "spans": [[9, 4]], "text": "89.6", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 9, "row-header": false, "row-span": [9, 10]}], [{"bbox": [66.31500244140625, 215.09107971191406, 117.38329315185547, 223.9976348876953], "spans": [[10, 0]], "text": "TableFormer", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 10, "row-header": true, "row-span": [10, 11]}, {"bbox": [134.86766052246094, 215.09107971191406, 153.68701171875, 223.9976348876953], "spans": [[10, 1]], "text": "STN", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 10, "row-header": false, "row-span": [10, 11]}, {"bbox": [176.57110595703125, 215.09107971191406, 194.0056610107422, 223.9976348876953], "spans": [[10, 2]], "text": "96.9", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 10, "row-header": false, "row-span": [10, 11]}, {"bbox": [220.83494567871094, 215.09107971191406, 238.26950073242188, 223.9976348876953], "spans": [[10, 3]], "text": "95.7", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 10, "row-header": false, "row-span": [10, 11]}, {"bbox": [262.189697265625, 215.09107971191406, 279.6242370605469, 223.9976348876953], "spans": [[10, 4]], "text": "96.7", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 10, "row-header": false, "row-span": [10, 11]}]], "model": null, "bounding-box": null}, {"prov": [{"bbox": [308.4068908691406, 488.1943359375, 533.6420288085938, 544.1236572265625], "page": 7, "span": [0, 0], "__ref_s3_data": null}], "text": "Table 3: Cell Bounding Box detection results on PubTabNet, and FinTabNet. PP: Post-processing.", "type": "table", "payload": null, "#-cols": 4, "#-rows": 4, "data": [[{"bbox": [339.322998046875, 529.4290771484375, 365.3353576660156, 538.3356323242188], "spans": [[0, 0]], "text": "Model", "type": "col_header", "col": 0, "col-header": true, "col-span": [0, 1], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [401.04132080078125, 529.4290771484375, 430.9191589355469, 538.3356323242188], "spans": [[0, 1]], "text": "Dataset", "type": "col_header", "col": 1, "col-header": true, "col-span": [1, 2], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [454.1021423339844, 529.4290771484375, 474.5852355957031, 538.3356323242188], "spans": [[0, 2]], "text": "mAP", "type": "col_header", "col": 2, "col-header": true, "col-span": [2, 3], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [486.54034423828125, 529.4290771484375, 527.2276000976562, 538.3356323242188], "spans": [[0, 3]], "text": "mAP (PP)", "type": "col_header", "col": 3, "col-header": true, "col-span": [3, 4], "row": 0, "row-header": false, "row-span": [0, 1]}], [{"bbox": [327.656005859375, 512.4721069335938, 377.0007629394531, 521.378662109375], "spans": [[1, 0]], "text": "EDD+BBox", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [393.6980895996094, 512.4721069335938, 438.2807312011719, 521.378662109375], "spans": [[1, 1]], "text": "PubTabNet", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [455.6355895996094, 512.4721069335938, 473.07012939453125, 521.378662109375], "spans": [[1, 2]], "text": "79.2", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [498.1659240722656, 512.4721069335938, 515.6004638671875, 521.378662109375], "spans": [[1, 3]], "text": "82.7", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 1, "row-header": false, "row-span": [1, 2]}], [{"bbox": [326.7950134277344, 500.5171203613281, 377.8633117675781, 509.4236755371094], "spans": [[2, 0]], "text": "TableFormer", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [393.6938781738281, 500.5171203613281, 438.2765197753906, 509.4236755371094], "spans": [[2, 1]], "text": "PubTabNet", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [455.6310119628906, 500.58685302734375, 473.0655517578125, 509.5432434082031], "spans": [[2, 2]], "text": "82.1", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [498.1712951660156, 500.58685302734375, 515.6058349609375, 509.5432434082031], "spans": [[2, 3]], "text": "86.8", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 2, "row-header": false, "row-span": [2, 3]}], [{"bbox": [326.7950134277344, 488.5621337890625, 377.8633117675781, 497.46868896484375], "spans": [[3, 0]], "text": "TableFormer", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [389.81842041015625, 488.5621337890625, 442.1519470214844, 497.46868896484375], "spans": [[3, 1]], "text": "SynthTabNet", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [455.63134765625, 488.5621337890625, 473.0658874511719, 497.46868896484375], "spans": [[3, 2]], "text": "87.7", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [505.22515869140625, 488.5621337890625, 508.5426940917969, 497.46868896484375], "spans": [[3, 3]], "text": "-", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 3, "row-header": false, "row-span": [3, 4]}]], "model": null, "bounding-box": null}, {"prov": [{"bbox": [332.9688720703125, 148.73028564453125, 520.942138671875, 251.71649169921875], "page": 7, "span": [0, 0], "__ref_s3_data": null}], "text": "Table 4: Results of structure with content retrieved using cell detection on PubTabNet. In all cases the input is PDF documents with cropped tables.", "type": "table", "payload": null, "#-cols": 4, "#-rows": 7, "data": [[{"bbox": [358.010986328125, 230.86007690429688, 384.0233459472656, 239.76663208007812], "spans": [[0, 0]], "text": "Model", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [408.5059814453125, 224.88307189941406, 436.739990234375, 233.7896270751953], "spans": [[0, 1]], "text": "Simple", "type": "col_header", "col": 1, "col-header": true, "col-span": [1, 2], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [448.6950988769531, 224.88307189941406, 485.0784912109375, 245.74462890625], "spans": [[0, 2]], "text": "TEDS Complex", "type": "col_header", "col": 2, "col-header": true, "col-span": [2, 3], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [499.3847961425781, 224.88307189941406, 512.1170043945312, 233.7896270751953], "spans": [[0, 3]], "text": "All", "type": "col_header", "col": 3, "col-header": true, "col-span": [3, 4], "row": 0, "row-header": false, "row-span": [0, 1]}], [{"bbox": [357.6820068359375, 207.92608642578125, 384.3518981933594, 216.8326416015625], "spans": [[1, 0]], "text": "Tabula", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 1, "row-header": true, "row-span": [1, 2]}, {"bbox": [413.9009704589844, 207.92608642578125, 431.33551025390625, 216.8326416015625], "spans": [[1, 1]], "text": "78.0", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [458.164794921875, 207.92608642578125, 475.5993347167969, 216.8326416015625], "spans": [[1, 2]], "text": "57.8", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [497.0289001464844, 207.92608642578125, 514.4634399414062, 216.8326416015625], "spans": [[1, 3]], "text": "67.9", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 1, "row-header": false, "row-span": [1, 2]}], [{"bbox": [350.7229919433594, 195.97108459472656, 391.3106384277344, 204.8776397705078], "spans": [[2, 0]], "text": "Traprange", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 2, "row-header": true, "row-span": [2, 3]}, {"bbox": [413.90582275390625, 195.97108459472656, 431.3403625488281, 204.8776397705078], "spans": [[2, 1]], "text": "60.8", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [458.1696472167969, 195.97108459472656, 475.60418701171875, 204.8776397705078], "spans": [[2, 2]], "text": "49.9", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [497.03375244140625, 195.97108459472656, 514.4683227539062, 204.8776397705078], "spans": [[2, 3]], "text": "55.4", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 2, "row-header": false, "row-span": [2, 3]}], [{"bbox": [354.135986328125, 184.0150909423828, 387.89923095703125, 192.92164611816406], "spans": [[3, 0]], "text": "Camelot", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 3, "row-header": true, "row-span": [3, 4]}, {"bbox": [413.901611328125, 184.0150909423828, 431.3361511230469, 192.92164611816406], "spans": [[3, 1]], "text": "80.0", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [458.1654357910156, 184.0150909423828, 475.5999755859375, 192.92164611816406], "spans": [[3, 2]], "text": "66.0", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [497.029541015625, 184.0150909423828, 514.464111328125, 192.92164611816406], "spans": [[3, 3]], "text": "73.0", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 3, "row-header": false, "row-span": [3, 4]}], [{"bbox": [346.5589904785156, 172.06008911132812, 395.475341796875, 180.96664428710938], "spans": [[4, 0]], "text": "Acrobat Pro", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 4, "row-header": true, "row-span": [4, 5]}, {"bbox": [413.9061584472656, 172.06008911132812, 431.3406982421875, 180.96664428710938], "spans": [[4, 1]], "text": "68.9", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [458.16998291015625, 172.06008911132812, 475.6045227050781, 180.96664428710938], "spans": [[4, 2]], "text": "61.8", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [497.0340881347656, 172.06008911132812, 514.4686279296875, 180.96664428710938], "spans": [[4, 3]], "text": "65.3", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 4, "row-header": false, "row-span": [4, 5]}], [{"bbox": [360.781005859375, 160.10508728027344, 381.254150390625, 169.0116424560547], "spans": [[5, 0]], "text": "EDD", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 5, "row-header": true, "row-span": [5, 6]}, {"bbox": [413.9015808105469, 160.10508728027344, 431.33612060546875, 169.0116424560547], "spans": [[5, 1]], "text": "91.2", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [458.1654052734375, 160.10508728027344, 475.5999450683594, 169.0116424560547], "spans": [[5, 2]], "text": "85.4", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [497.0295104980469, 160.10508728027344, 514.4640502929688, 169.0116424560547], "spans": [[5, 3]], "text": "88.3", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 5, "row-header": false, "row-span": [5, 6]}], [{"bbox": [345.4830017089844, 148.15008544921875, 396.5513000488281, 157.056640625], "spans": [[6, 0]], "text": "TableFormer", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 6, "row-header": true, "row-span": [6, 7]}, {"bbox": [413.9061584472656, 148.15008544921875, 431.3406982421875, 157.056640625], "spans": [[6, 1]], "text": "95.4", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [458.16998291015625, 148.15008544921875, 475.6045227050781, 157.056640625], "spans": [[6, 2]], "text": "90.1", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [497.03399658203125, 148.21981811523438, 514.4685668945312, 157.1761932373047], "spans": [[6, 3]], "text": "93.6", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 6, "row-header": false, "row-span": [6, 7]}]], "model": null, "bounding-box": null}, {"prov": [{"bbox": [53.6285514831543, 499.6000061035156, 298.5574645996094, 573.0514526367188], "page": 8, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "table", "payload": null, "#-cols": 6, "#-rows": 10, "data": [[{"bbox": null, "spans": [[0, 0]], "text": "", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": null, "spans": [[0, 1]], "text": "", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [209.93284606933594, 565.6378784179688, 241.04458618164062, 569.8192749023438], "spans": [[0, 2], [0, 3]], "text": "\u8ad6\u6587\u30d5\u30a1\u30a4\u30eb", "type": "col_header", "col": 2, "col-header": true, "col-span": [2, 4], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [209.93284606933594, 565.6378784179688, 241.04458618164062, 569.8192749023438], "spans": [[0, 2], [0, 3]], "text": "\u8ad6\u6587\u30d5\u30a1\u30a4\u30eb", "type": "col_header", "col": 3, "col-header": true, "col-span": [2, 4], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [263.764892578125, 565.6378784179688, 284.5058898925781, 569.8192749023438], "spans": [[0, 4], [0, 5]], "text": "\u53c2\u8003\u6587\u732e", "type": "col_header", "col": 4, "col-header": true, "col-span": [4, 6], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [263.764892578125, 565.6378784179688, 284.5058898925781, 569.8192749023438], "spans": [[0, 4], [0, 5]], "text": "\u53c2\u8003\u6587\u732e", "type": "col_header", "col": 5, "col-header": true, "col-span": [4, 6], "row": 0, "row-header": false, "row-span": [0, 1]}], [{"bbox": [110.24990844726562, 558.1526489257812, 120.62017822265625, 562.3340454101562], "spans": [[1, 0]], "text": "\u51fa\u5178", "type": "col_header", "col": 0, "col-header": true, "col-span": [0, 1], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [175.3660888671875, 558.1526489257812, 201.29246520996094, 562.3340454101562], "spans": [[1, 1]], "text": "\u30d5\u30a1\u30a4\u30eb \u6570", "type": "col_header", "col": 1, "col-header": true, "col-span": [1, 2], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [209.62408447265625, 558.1526489257812, 219.99435424804688, 562.3340454101562], "spans": [[1, 2]], "text": "\u82f1\u8a9e", "type": "col_header", "col": 2, "col-header": true, "col-span": [2, 3], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [229.19813537597656, 558.1526489257812, 244.75376892089844, 562.3340454101562], "spans": [[1, 3]], "text": "\u65e5\u672c\u8a9e", "type": "col_header", "col": 3, "col-header": true, "col-span": [3, 4], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [256.11419677734375, 558.1526489257812, 266.4844665527344, 562.3340454101562], "spans": [[1, 4]], "text": "\u82f1\u8a9e", "type": "col_header", "col": 4, "col-header": true, "col-span": [4, 5], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [278.38433837890625, 558.1526489257812, 293.9399719238281, 562.3340454101562], "spans": [[1, 5]], "text": "\u65e5\u672c\u8a9e", "type": "col_header", "col": 5, "col-header": true, "col-span": [5, 6], "row": 1, "row-header": false, "row-span": [1, 2]}], [{"bbox": [55.530521392822266, 551.2162475585938, 162.71310424804688, 555.5741577148438], "spans": [[2, 0]], "text": "Association for Computational Linguistics(ACL2003)", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 2, "row-header": true, "row-span": [2, 3]}, {"bbox": [184.39730834960938, 551.2162475585938, 189.56455993652344, 555.5741577148438], "spans": [[2, 1]], "text": "65", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [208.99026489257812, 551.2162475585938, 214.1575164794922, 555.5741577148438], "spans": [[2, 2]], "text": "65", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [234.8751678466797, 551.2162475585938, 237.4583282470703, 555.5741577148438], "spans": [[2, 3]], "text": "0", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [256.88446044921875, 551.2162475585938, 264.63580322265625, 555.5741577148438], "spans": [[2, 4]], "text": "150", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [284.06134033203125, 551.2162475585938, 286.6445007324219, 555.5741577148438], "spans": [[2, 5]], "text": "0", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 2, "row-header": false, "row-span": [2, 3]}], [{"bbox": [55.530521392822266, 545.0216064453125, 139.7225341796875, 549.3795166015625], "spans": [[3, 0]], "text": "Computational Linguistics(COLING2002)", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 3, "row-header": true, "row-span": [3, 4]}, {"bbox": [183.10536193847656, 545.0216064453125, 190.85670471191406, 549.3795166015625], "spans": [[3, 1]], "text": "140", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [207.6983184814453, 545.0216064453125, 215.4496612548828, 549.3795166015625], "spans": [[3, 2]], "text": "140", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [234.8751678466797, 545.0216064453125, 237.4583282470703, 549.3795166015625], "spans": [[3, 3]], "text": "0", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [256.88446044921875, 545.0216064453125, 264.63580322265625, 549.3795166015625], "spans": [[3, 4]], "text": "150", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [284.06134033203125, 545.0216064453125, 286.6445007324219, 549.3795166015625], "spans": [[3, 5]], "text": "0", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 3, "row-header": false, "row-span": [3, 4]}], [{"bbox": [55.530521392822266, 538.0201416015625, 128.96026611328125, 542.4105834960938], "spans": [[4, 0]], "text": "\u96fb\u6c17\u60c5\u5831\u901a\u4fe1\u5b66\u4f1a 2003 \u5e74\u7dcf\u5408\u5927\u4f1a", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 4, "row-header": true, "row-span": [4, 5]}, {"bbox": [183.10536193847656, 538.8270263671875, 190.85670471191406, 543.1849365234375], "spans": [[4, 1]], "text": "150", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [210.2822265625, 538.8270263671875, 212.86538696289062, 543.1849365234375], "spans": [[4, 2]], "text": "8", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [232.29153442382812, 538.8270263671875, 240.04287719726562, 543.1849365234375], "spans": [[4, 3]], "text": "142", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [256.88446044921875, 538.8270263671875, 264.63580322265625, 543.1849365234375], "spans": [[4, 4]], "text": "223", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [281.4774169921875, 538.8270263671875, 289.228759765625, 543.1849365234375], "spans": [[4, 5]], "text": "147", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 4, "row-header": false, "row-span": [4, 5]}], [{"bbox": [55.530521392822266, 530.534912109375, 129.88177490234375, 534.9253540039062], "spans": [[5, 0]], "text": "\u60c5\u5831\u51e6\u7406\u5b66\u4f1a\u7b2c 65 \u56de\u5168\u56fd\u5927\u4f1a (2003)", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 5, "row-header": true, "row-span": [5, 6]}, {"bbox": [183.10536193847656, 531.341796875, 190.85670471191406, 535.69970703125], "spans": [[5, 1]], "text": "177", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [210.2822265625, 531.341796875, 212.86538696289062, 535.69970703125], "spans": [[5, 2]], "text": "1", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [232.29153442382812, 531.341796875, 240.04287719726562, 535.69970703125], "spans": [[5, 3]], "text": "176", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [256.88446044921875, 531.341796875, 264.63580322265625, 535.69970703125], "spans": [[5, 4]], "text": "150", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [281.4774169921875, 531.341796875, 289.228759765625, 535.69970703125], "spans": [[5, 5]], "text": "236", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 5, "row-header": false, "row-span": [5, 6]}], [{"bbox": [55.530521392822266, 523.3078002929688, 129.88177490234375, 527.6982421875], "spans": [[6, 0]], "text": "\u7b2c 17 \u56de\u4eba\u5de5\u77e5\u80fd\u5b66\u4f1a\u5168\u56fd\u5927\u4f1a (2003)", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 6, "row-header": true, "row-span": [6, 7]}, {"bbox": [183.10536193847656, 524.1146850585938, 190.85670471191406, 528.4725952148438], "spans": [[6, 1]], "text": "208", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [210.2822265625, 524.1146850585938, 212.86538696289062, 528.4725952148438], "spans": [[6, 2]], "text": "5", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [232.29153442382812, 524.1146850585938, 240.04287719726562, 528.4725952148438], "spans": [[6, 3]], "text": "203", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [256.88446044921875, 524.1146850585938, 264.63580322265625, 528.4725952148438], "spans": [[6, 4]], "text": "152", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [281.4774169921875, 524.1146850585938, 289.228759765625, 528.4725952148438], "spans": [[6, 5]], "text": "244", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 6, "row-header": false, "row-span": [6, 7]}], [{"bbox": [55.530521392822266, 516.0807495117188, 127.32453918457031, 520.47119140625], "spans": [[7, 0]], "text": "\u81ea\u7136\u8a00\u8a9e\u51e6\u7406\u7814\u7a76\u4f1a\u7b2c 146 \u301c 155 \u56de", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 7, "row-header": true, "row-span": [7, 8]}, {"bbox": [184.39730834960938, 516.8876342773438, 189.56455993652344, 521.2455444335938], "spans": [[7, 1]], "text": "98", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 7, "row-header": false, "row-span": [7, 8]}, {"bbox": [210.2822265625, 516.8876342773438, 212.86538696289062, 521.2455444335938], "spans": [[7, 2]], "text": "2", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 7, "row-header": false, "row-span": [7, 8]}, {"bbox": [233.58348083496094, 516.8876342773438, 238.750732421875, 521.2455444335938], "spans": [[7, 3]], "text": "96", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 7, "row-header": false, "row-span": [7, 8]}, {"bbox": [256.88446044921875, 516.8876342773438, 264.63580322265625, 521.2455444335938], "spans": [[7, 4]], "text": "150", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 7, "row-header": false, "row-span": [7, 8]}, {"bbox": [281.4774169921875, 516.8876342773438, 289.228759765625, 521.2455444335938], "spans": [[7, 5]], "text": "232", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 7, "row-header": false, "row-span": [7, 8]}], [{"bbox": [55.530521392822266, 508.59564208984375, 110.16829681396484, 512.986083984375], "spans": [[8, 0]], "text": "WWW \u304b\u3089\u53ce\u96c6\u3057\u305f\u8ad6\u6587", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 8, "row-header": true, "row-span": [8, 9]}, {"bbox": [183.10536193847656, 509.6605224609375, 190.85670471191406, 514.0184326171875], "spans": [[8, 1]], "text": "107", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 8, "row-header": false, "row-span": [8, 9]}, {"bbox": [208.99026489257812, 509.6605224609375, 214.1575164794922, 514.0184326171875], "spans": [[8, 2]], "text": "73", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 8, "row-header": false, "row-span": [8, 9]}, {"bbox": [233.58348083496094, 509.6605224609375, 238.750732421875, 514.0184326171875], "spans": [[8, 3]], "text": "34", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 8, "row-header": false, "row-span": [8, 9]}, {"bbox": [256.88446044921875, 509.6605224609375, 264.63580322265625, 514.0184326171875], "spans": [[8, 4]], "text": "147", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 8, "row-header": false, "row-span": [8, 9]}, {"bbox": [282.7693786621094, 509.6605224609375, 287.9366149902344, 514.0184326171875], "spans": [[8, 5]], "text": "96", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 8, "row-header": false, "row-span": [8, 9]}], [{"bbox": null, "spans": [[9, 0]], "text": "", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 9, "row-header": false, "row-span": [9, 10]}, {"bbox": [183.10536193847656, 502.1754150390625, 190.85670471191406, 506.5333251953125], "spans": [[9, 1]], "text": "945", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 9, "row-header": false, "row-span": [9, 10]}, {"bbox": [207.6983184814453, 502.1754150390625, 215.4496612548828, 506.5333251953125], "spans": [[9, 2]], "text": "294", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 9, "row-header": false, "row-span": [9, 10]}, {"bbox": [232.29153442382812, 502.1754150390625, 240.04287719726562, 506.5333251953125], "spans": [[9, 3]], "text": "651", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 9, "row-header": false, "row-span": [9, 10]}, {"bbox": [255.7650604248047, 502.1754150390625, 265.7520446777344, 506.5333251953125], "spans": [[9, 4]], "text": "1122", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 9, "row-header": false, "row-span": [9, 10]}, {"bbox": [281.4774169921875, 502.1754150390625, 289.228759765625, 506.5333251953125], "spans": [[9, 5]], "text": "955", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 9, "row-header": false, "row-span": [9, 10]}]], "model": null, "bounding-box": null}, {"prov": [{"bbox": [304.9219970703125, 504.09930419921875, 550.2321166992188, 573.485107421875], "page": 8, "span": [0, 0], "__ref_s3_data": null}], "text": "Text is aligned to match original for ease of viewing", "type": "table", "payload": null, "#-cols": 5, "#-rows": 7, "data": [[{"bbox": null, "spans": [[0, 0]], "text": "", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [392.0967102050781, 565.3603515625, 438.0144958496094, 570.425537109375], "spans": [[0, 1], [0, 2]], "text": "Shares (in millions)", "type": "col_header", "col": 1, "col-header": true, "col-span": [1, 3], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [392.0967102050781, 565.3603515625, 438.0144958496094, 570.425537109375], "spans": [[0, 1], [0, 2]], "text": "Shares (in millions)", "type": "col_header", "col": 2, "col-header": true, "col-span": [1, 3], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [459.0486145019531, 559.1006469726562, 542.0001831054688, 570.3758544921875], "spans": [[0, 3], [0, 4]], "text": "Weighted Average Grant Date Fair Value", "type": "col_header", "col": 3, "col-header": true, "col-span": [3, 5], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [459.0486145019531, 559.1006469726562, 542.0001831054688, 570.3758544921875], "spans": [[0, 3], [0, 4]], "text": "Weighted Average Grant Date Fair Value", "type": "col_header", "col": 4, "col-header": true, "col-span": [3, 5], "row": 0, "row-header": false, "row-span": [0, 1]}], [{"bbox": null, "spans": [[1, 0]], "text": "", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [393.24420166015625, 550.1876831054688, 407.3463134765625, 555.2528686523438], "spans": [[1, 1]], "text": "RS U s", "type": "col_header", "col": 1, "col-header": true, "col-span": [1, 2], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [427.1832275390625, 550.1876831054688, 440.98779296875, 555.2528686523438], "spans": [[1, 2]], "text": "PSUs", "type": "col_header", "col": 2, "col-header": true, "col-span": [2, 3], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [468.3825378417969, 550.1876831054688, 482.4846496582031, 555.2528686523438], "spans": [[1, 3]], "text": "RSUs", "type": "col_header", "col": 3, "col-header": true, "col-span": [3, 4], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [516.92578125, 550.1876831054688, 530.7303466796875, 555.2528686523438], "spans": [[1, 4]], "text": "PSUs", "type": "col_header", "col": 4, "col-header": true, "col-span": [4, 5], "row": 1, "row-header": false, "row-span": [1, 2]}], [{"bbox": [306.11492919921875, 542.323974609375, 364.65606689453125, 547.38916015625], "spans": [[2, 0]], "text": "Nonvested on Janua ry 1", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 2, "row-header": true, "row-span": [2, 3]}, {"bbox": [396.2466125488281, 542.0215454101562, 403.75531005859375, 547.0867309570312], "spans": [[2, 1]], "text": "1. 1", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [429.8183898925781, 542.0215454101562, 437.32708740234375, 547.0867309570312], "spans": [[2, 2]], "text": "0.3", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [465.5285949707031, 542.0215454101562, 483.5500183105469, 547.0867309570312], "spans": [[2, 3]], "text": "90.10 $", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [513.4482421875, 542.0215454101562, 531.4696655273438, 547.0867309570312], "spans": [[2, 4]], "text": "$ 91.19", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 2, "row-header": false, "row-span": [2, 3]}], [{"bbox": [306.11492919921875, 533.2503051757812, 325.6267395019531, 538.3154907226562], "spans": [[3, 0]], "text": "Granted", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 3, "row-header": true, "row-span": [3, 4]}, {"bbox": [396.2466125488281, 533.2503051757812, 403.75531005859375, 538.3154907226562], "spans": [[3, 1]], "text": "0. 5", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [429.8183898925781, 533.2503051757812, 437.32708740234375, 538.3154907226562], "spans": [[3, 2]], "text": "0.1", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [466.435791015625, 533.2503051757812, 482.5483093261719, 538.3154907226562], "spans": [[3, 3]], "text": "117.44", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [514.2906494140625, 533.2503051757812, 530.809814453125, 538.3154907226562], "spans": [[3, 4]], "text": "122.41", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 3, "row-header": false, "row-span": [3, 4]}], [{"bbox": [306.11492919921875, 525.3865966796875, 322.628662109375, 530.4517822265625], "spans": [[4, 0]], "text": "Vested", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 4, "row-header": true, "row-span": [4, 5]}, {"bbox": [394.4322204589844, 525.3865966796875, 405.5362548828125, 530.4517822265625], "spans": [[4, 1]], "text": "(0. 5 )", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [427.70159912109375, 525.3865966796875, 438.8056335449219, 530.4517822265625], "spans": [[4, 2]], "text": "(0.1)", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [468.5553283691406, 525.3865966796875, 482.0704345703125, 530.4517822265625], "spans": [[4, 3]], "text": "87.08", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [516.0186157226562, 525.3865966796875, 529.5337524414062, 530.4517822265625], "spans": [[4, 4]], "text": "81.14", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 4, "row-header": false, "row-span": [4, 5]}], [{"bbox": [306.11492919921875, 517.2933349609375, 356.2477111816406, 522.3585205078125], "spans": [[5, 0]], "text": "Canceled or forfeited", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 5, "row-header": true, "row-span": [5, 6]}, {"bbox": [394.4322204589844, 516.6153564453125, 405.5362548828125, 521.6805419921875], "spans": [[5, 1]], "text": "(0. 1 )", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [431.02801513671875, 516.6153564453125, 436.4280090332031, 521.6805419921875], "spans": [[5, 2]], "text": "-", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [465.83099365234375, 516.6153564453125, 482.3501281738281, 521.6805419921875], "spans": [[5, 3]], "text": "102.01", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [516.0186157226562, 516.6153564453125, 529.5337524414062, 521.6805419921875], "spans": [[5, 4]], "text": "92.18", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 5, "row-header": false, "row-span": [5, 6]}], [{"bbox": [306.11492919921875, 508.4490661621094, 373.3576354980469, 513.5142822265625], "spans": [[6, 0]], "text": "Nonvested on December 31", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 6, "row-header": true, "row-span": [6, 7]}, {"bbox": [396.2466125488281, 508.4490661621094, 403.75531005859375, 513.5142822265625], "spans": [[6, 1]], "text": "1.0", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [429.5159912109375, 508.4490661621094, 437.0246887207031, 513.5142822265625], "spans": [[6, 2]], "text": "0.3", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [463.7142028808594, 508.4490661621094, 484.7396545410156, 513.5142822265625], "spans": [[6, 3]], "text": "104.85 $", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [512.99462890625, 508.4490661621094, 534.0200805664062, 513.5142822265625], "spans": [[6, 4]], "text": "$ 104.51", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 6, "row-header": false, "row-span": [6, 7]}]], "model": null, "bounding-box": null}, {"prov": [{"bbox": [84.0283203125, 577.606689453125, 239.1690673828125, 635.6664428710938], "page": 13, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "table", "payload": null, "#-cols": 0, "#-rows": 0, "data": [], "model": null, "bounding-box": null}, {"prov": [{"bbox": [82.92001342773438, 500.716064453125, 239.1903533935547, 558.2236938476562], "page": 13, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "table", "payload": null, "#-cols": 0, "#-rows": 0, "data": [], "model": null, "bounding-box": null}, {"prov": [{"bbox": [83.94786071777344, 424.0904235839844, 239.17135620117188, 482.9522705078125], "page": 13, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "table", "payload": null, "#-cols": 0, "#-rows": 0, "data": [], "model": null, "bounding-box": null}, {"prov": [{"bbox": [83.31758117675781, 304.7430114746094, 248.87306213378906, 395.9864501953125], "page": 13, "span": [0, 0], "__ref_s3_data": null}], "text": "Figure 8: Example of a table with multi-line header.", "type": "table", "payload": null, "#-cols": 0, "#-rows": 0, "data": [], "model": null, "bounding-box": null}, {"prov": [{"bbox": [310.3294372558594, 655.8525390625, 555.8338623046875, 690.8223876953125], "page": 13, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "table", "payload": null, "#-cols": 0, "#-rows": 0, "data": [], "model": null, "bounding-box": null}, {"prov": [{"bbox": [309.9566345214844, 607.2774658203125, 555.7466430664062, 637.385498046875], "page": 13, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "table", "payload": null, "#-cols": 0, "#-rows": 0, "data": [], "model": null, "bounding-box": null}, {"prov": [{"bbox": [309.9635314941406, 558.448486328125, 555.7054443359375, 596.2946166992188], "page": 13, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "table", "payload": null, "#-cols": 0, "#-rows": 0, "data": [], "model": null, "bounding-box": null}, {"prov": [{"bbox": [309.79150390625, 499.60601806640625, 425.9603271484375, 538.0946044921875], "page": 13, "span": [0, 0], "__ref_s3_data": null}], "text": "Figure 9: Example of a table with big empty distance between cells.", "type": "table", "payload": null, "#-cols": 0, "#-rows": 0, "data": [], "model": null, "bounding-box": null}, {"prov": [{"bbox": [335.2694091796875, 354.97760009765625, 490.08184814453125, 403.53253173828125], "page": 13, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "table", "payload": null, "#-cols": 0, "#-rows": 0, "data": [], "model": null, "bounding-box": null}, {"prov": [{"bbox": [334.9334411621094, 289.2789001464844, 490.0914611816406, 338.0523681640625], "page": 13, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "table", "payload": null, "#-cols": 0, "#-rows": 0, "data": [], "model": null, "bounding-box": null}, {"prov": [{"bbox": [335.2545471191406, 224.31207275390625, 490.22369384765625, 272.92431640625], "page": 13, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "table", "payload": null, "#-cols": 0, "#-rows": 0, "data": [], "model": null, "bounding-box": null}, {"prov": [{"bbox": [333.9573669433594, 126.5096435546875, 518.4768676757812, 198.8865966796875], "page": 13, "span": [0, 0], "__ref_s3_data": null}], "text": "Figure 10: Example of a complex table with empty cells.", "type": "table", "payload": null, "#-cols": 0, "#-rows": 0, "data": [], "model": null, "bounding-box": null}, {"prov": [{"bbox": [51.72642135620117, 447.7555236816406, 283.114013671875, 518.3907470703125], "page": 14, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "table", "payload": null, "#-cols": 0, "#-rows": 0, "data": [], "model": null, "bounding-box": null}, {"prov": [{"bbox": [51.43488693237305, 300.17974853515625, 310.7267150878906, 338.51251220703125], "page": 14, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "table", "payload": null, "#-cols": 0, "#-rows": 0, "data": [], "model": null, "bounding-box": null}, {"prov": [{"bbox": [50.86823654174805, 249.55401611328125, 310.6080017089844, 287.90374755859375], "page": 14, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "table", "payload": null, "#-cols": 0, "#-rows": 0, "data": [], "model": null, "bounding-box": null}, {"prov": [{"bbox": [51.27280807495117, 200.086669921875, 311.0897216796875, 238.271484375], "page": 14, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "table", "payload": null, "#-cols": 0, "#-rows": 0, "data": [], "model": null, "bounding-box": null}, {"prov": [{"bbox": [318.98101806640625, 577.3739013671875, 534.6228637695312, 630.765380859375], "page": 14, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "table", "payload": null, "#-cols": 0, "#-rows": 0, "data": [], "model": null, "bounding-box": null}, {"prov": [{"bbox": [319.0057678222656, 512.142333984375, 534.408935546875, 565.8936767578125], "page": 14, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "table", "payload": null, "#-cols": 0, "#-rows": 0, "data": [], "model": null, "bounding-box": null}, {"prov": [{"bbox": [328.13812255859375, 433.7275695800781, 523.8915405273438, 503.3182067871094], "page": 14, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "table", "payload": null, "#-cols": 0, "#-rows": 0, "data": [], "model": null, "bounding-box": null}, {"prov": [{"bbox": [319.4707946777344, 314.05645751953125, 518.5693359375, 361.09698486328125], "page": 14, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "table", "payload": null, "#-cols": 0, "#-rows": 0, "data": [], "model": null, "bounding-box": null}, {"prov": [{"bbox": [319.982666015625, 256.30419921875, 519.0963745117188, 302.7562561035156], "page": 14, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "table", "payload": null, "#-cols": 0, "#-rows": 0, "data": [], "model": null, "bounding-box": null}, {"prov": [{"bbox": [319.82879638671875, 198.8935546875, 519.6065673828125, 245.5906982421875], "page": 14, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "table", "payload": null, "#-cols": 0, "#-rows": 0, "data": [], "model": null, "bounding-box": null}, {"prov": [{"bbox": [319.0649719238281, 122.80792236328125, 533.7738647460938, 182.1591796875], "page": 14, "span": [0, 0], "__ref_s3_data": null}], "text": "Figure 14: Example with multi-line text.", "type": "table", "payload": null, "#-cols": 0, "#-rows": 0, "data": [], "model": null, "bounding-box": null}, {"prov": [{"bbox": [55.1163444519043, 542.66552734375, 279.370849609375, 655.7449951171875], "page": 15, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "table", "payload": null, "#-cols": 0, "#-rows": 0, "data": [], "model": null, "bounding-box": null}, {"prov": [{"bbox": [54.28135299682617, 418.4728698730469, 279.2568359375, 531.7384033203125], "page": 15, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "table", "payload": null, "#-cols": 0, "#-rows": 0, "data": [], "model": null, "bounding-box": null}, {"prov": [{"bbox": [50.64816665649414, 160.73651123046875, 319.91033935546875, 286.0196838378906], "page": 15, "span": [0, 0], "__ref_s3_data": null}], "text": "Figure 15: Example with triangular table.", "type": "table", "payload": null, "#-cols": 0, "#-rows": 0, "data": [], "model": null, "bounding-box": null}, {"prov": [{"bbox": [323.0059814453125, 569.088623046875, 525.95166015625, 670.452880859375], "page": 15, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "table", "payload": null, "#-cols": 0, "#-rows": 0, "data": [], "model": null, "bounding-box": null}, {"prov": [{"bbox": [323.384765625, 447.9079284667969, 526.1268920898438, 550.027099609375], "page": 15, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "table", "payload": null, "#-cols": 0, "#-rows": 0, "data": [], "model": null, "bounding-box": null}, {"prov": [{"bbox": [323.4686279296875, 327.739501953125, 525.9568481445312, 429.5491638183594], "page": 15, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "table", "payload": null, "#-cols": 0, "#-rows": 0, "data": [], "model": null, "bounding-box": null}, {"prov": [{"bbox": [353.6920471191406, 156.22674560546875, 495.4288024902344, 304.594970703125], "page": 15, "span": [0, 0], "__ref_s3_data": null}], "text": "Figure 16: Example of how post-processing helps to restore mis-aligned bounding boxes prediction artifact.", "type": "table", "payload": null, "#-cols": 0, "#-rows": 0, "data": [], "model": null, "bounding-box": null}], "bitmaps": null, "equations": [], "footnotes": [], "page-dimensions": [{"height": 792.0, "page": 1, "width": 612.0}, {"height": 792.0, "page": 2, "width": 612.0}, {"height": 792.0, "page": 3, "width": 612.0}, {"height": 792.0, "page": 4, "width": 612.0}, {"height": 792.0, "page": 5, "width": 612.0}, {"height": 792.0, "page": 6, "width": 612.0}, {"height": 792.0, "page": 7, "width": 612.0}, {"height": 792.0, "page": 8, "width": 612.0}, {"height": 792.0, "page": 9, "width": 612.0}, {"height": 792.0, "page": 10, "width": 612.0}, {"height": 792.0, "page": 11, "width": 612.0}, {"height": 792.0, "page": 12, "width": 612.0}, {"height": 792.0, "page": 13, "width": 612.0}, {"height": 792.0, "page": 14, "width": 612.0}, {"height": 792.0, "page": 15, "width": 612.0}, {"height": 792.0, "page": 16, "width": 612.0}], "page-footers": [], "page-headers": [], "_s3_data": null, "identifiers": null}
\ No newline at end of file
+{"_name": "", "type": "pdf-document", "description": {"title": null, "abstract": null, "authors": null, "affiliations": null, "subjects": null, "keywords": null, "publication_date": null, "languages": null, "license": null, "publishers": null, "url_refs": null, "references": null, "publication": null, "reference_count": null, "citation_count": null, "citation_date": null, "advanced": null, "analytics": null, "logs": [], "collection": null, "acquisition": null}, "file-info": {"filename": "2203.01017v2.pdf", "filename-prov": null, "document-hash": "00be757f6bc94e7f75134e02e196d1c73ff960d52abb081a93104bba5a6470ff", "#-pages": 16, "collection-name": null, "description": null, "page-hashes": [{"hash": "56046b8a75e14ce81bf22f568f726b2bd7b8f82a885dbff3260d8945699796e4", "model": "default", "page": 1}, {"hash": "80f9116b4f8c9b08dc9763877dabaf65affef9c4a9a0f91a3673e8360aa95713", "model": "default", "page": 2}, {"hash": "8b422eca6675fcaa4919295eb9af624e581041dad8a5903bec7cb26254f2b59b", "model": "default", "page": 3}, {"hash": "a7f7a5799d183e4f3d0d8e917c3df1acd344e0abfaedebb9ed04f2f67844ad95", "model": "default", "page": 4}, {"hash": "14036095ac3b7fb802ff5c061cf5584f482de800aff7ed4eccfb67e5a89e1ba2", "model": "default", "page": 5}, {"hash": "633c440068e406a17f913cac0c2e3f0606f66111994bd2940726a56ea37274a0", "model": "default", "page": 6}, {"hash": "fb67646dad9c7255e55f305b59fb6f697fcf26875e085b63ac0729916ce60b6c", "model": "default", "page": 7}, {"hash": "acc79b977714a917605f6530c1df05f73f4cc0aa5d73b506fffe6287ae19a807", "model": "default", "page": 8}, {"hash": "bdb376928a3150909023df34ff94cd1eb12e1f90ae03a72834b74433ef498205", "model": "default", "page": 9}, {"hash": "df60cff4949de8851338c4fd85ad43f534cee1da4772f36b74b2341cad6ec5c9", "model": "default", "page": 10}, {"hash": "3df470edc2c1a275cfa920f7487a89fcb1825a9b009e85386b199cbfe80aff73", "model": "default", "page": 11}, {"hash": "f986169f2c0ff7997ccec2d71833cea7c5df4a641b92996c3f8fba9563441ad1", "model": "default", "page": 12}, {"hash": "ba03af2311ea8d68bf53cccda386ebf4ed68f14943fc421417799401a2afe95a", "model": "default", "page": 13}, {"hash": "1d63990cced2905e29696a09ad1bca47fcd15d584be32b4c7ab76c2f47f75d92", "model": "default", "page": 14}, {"hash": "fc40b9fb3698f24af7beda03b7afac10c3fcc6c73e83b4c6159785ea2991e2c4", "model": "default", "page": 15}, {"hash": "96080fce6eb8572fe319782f353a67661947f48e67607b1ffd8c01d617d075a7", "model": "default", "page": 16}]}, "main-text": [{"prov": [{"bbox": [96.301003, 672.06866, 498.92708999999996, 684.96588], "page": 1, "span": [0, 61], "__ref_s3_data": null}], "text": "TableFormer: Table Structure Understanding with Transformers.", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [142.47701, 620.67963, 452.75027, 645.31464], "page": 1, "span": [0, 73], "__ref_s3_data": null}], "text": "Ahmed Nassar, Nikolaos Livathinos, Maksym Lysak, Peter Staar IBM Research", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [208.123, 607.57446, 378.73257, 616.03876], "page": 1, "span": [0, 35], "__ref_s3_data": null}], "text": "{ ahn,nli,mly,taa } @zurich.ibm.com", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [145.99498, 565.76929, 190.48029, 576.51703], "page": 1, "span": [0, 8], "__ref_s3_data": null}], "text": "Abstract", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [315.56702, 565.24518, 408.4407, 573.99316], "page": 1, "span": [0, 22], "__ref_s3_data": null}], "text": "a. Picture of a table:", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [50.111977, 279.00335999999993, 286.36511, 550.60492], "page": 1, "span": [0, 1320], "__ref_s3_data": null}], "text": "Tables organize valuable content in a concise and compact representation. This content is extremely valuable for systems such as search engines, Knowledge Graph's, etc, since they enhance their predictive capabilities. Unfortunately, tables come in a large variety of shapes and sizes. Furthermore, they can have complex column/row-header configurations, multiline rows, different variety of separation lines, missing entries, etc. As such, the correct identification of the table-structure from an image is a nontrivial task. In this paper, we present a new table-structure identification model. The latter improves the latest end-toend deep learning model (i.e. encoder-dual-decoder from PubTabNet) in two significant ways. First, we introduce a new object detection decoder for table-cells. In this way, we can obtain the content of the table-cells from programmatic PDF's directly from the PDF source and avoid the training of the custom OCR decoders. This architectural change leads to more accurate table-content extraction and allows us to tackle non-english tables. Second, we replace the LSTM decoders with transformer based decoders. This upgrade improves significantly the previous state-of-the-art tree-editing-distance-score (TEDS) from 91% to 98.5% on simple tables and from 88.7% to 95% on complex tables.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [50.111977, 241.30951000000005, 126.94804, 252.05723999999998], "page": 1, "span": [0, 15], "__ref_s3_data": null}], "text": "1. Introduction", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [50.111977, 78.84822099999997, 286.36508, 231.21680000000003], "page": 1, "span": [0, 712], "__ref_s3_data": null}], "text": "The occurrence of tables in documents is ubiquitous. They often summarise quantitative or factual data, which is cumbersome to describe in verbose text but nevertheless extremely valuable. Unfortunately, this compact representation is often not easy to parse by machines. There are many implicit conventions used to obtain a compact table representation. For example, tables often have complex columnand row-headers in order to reduce duplicated cell content. Lines of different shapes and sizes are leveraged to separate content or indicate a tree structure. Additionally, tables can also have empty/missing table-entries or multi-row textual table-entries. Fig. 1 shows a table which presents all these issues.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"name": "Picture", "type": "figure", "$ref": "#/figures/0"}, {"name": "Table", "type": "table", "$ref": "#/tables/0"}, {"prov": [{"bbox": [315.56702, 458.7572, 486.40194999999994, 478.30521000000005], "page": 1, "span": [0, 68], "__ref_s3_data": null}], "text": "- b. Red-annotation of bounding boxes, Blue-predictions by TableFormer", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [315.56702, 363.06918, 491.1912500000001, 371.8172], "page": 1, "span": [0, 38], "__ref_s3_data": null}], "text": "- c. Structure predicted by TableFormer:", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"name": "Picture", "type": "figure", "$ref": "#/figures/1"}, {"name": "Picture", "type": "figure", "$ref": "#/figures/2"}, {"name": "Table", "type": "table", "$ref": "#/tables/1"}, {"prov": [{"bbox": [308.862, 126.95307000000003, 545.11517, 207.59064], "page": 1, "span": [0, 363], "__ref_s3_data": null}], "text": "Recently, significant progress has been made with vision based approaches to extract tables in documents. For the sake of completeness, the issue of table extraction from documents is typically decomposed into two separate challenges, i.e. (1) finding the location of the table(s) on a document-page and (2) finding the structure of a given table in the document.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [308.862, 78.84806800000001, 545.11511, 123.61964], "page": 1, "span": [0, 229], "__ref_s3_data": null}], "text": "The first problem is called table-location and has been previously addressed [30, 38, 19, 21, 23, 26, 8] with stateof-the-art object-detection networks (e.g. YOLO and later on Mask-RCNN [9]). For all practical purposes, it can be", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [50.112, 695.93005, 286.36505, 716.79163], "page": 2, "span": [0, 75], "__ref_s3_data": null}], "text": "considered as a solved problem, given enough ground-truth data to train on.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [50.112, 563.96991, 286.36514, 692.42859], "page": 2, "span": [0, 626], "__ref_s3_data": null}], "text": "The second problem is called table-structure decomposition. The latter is a long standing problem in the community of document understanding [6, 4, 14]. Contrary to the table-location problem, there are no commonly used approaches that can easily be re-purposed to solve this problem. Lately, a set of new model-architectures has been proposed by the community to address table-structure decomposition [37, 36, 18, 20]. All these models have some weaknesses (see Sec. 2). The common denominator here is the reliance on textual features and/or the inability to provide the bounding box of each table-cell in the original image.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [50.112, 420.05493, 286.36511, 560.46844], "page": 2, "span": [0, 643], "__ref_s3_data": null}], "text": "In this paper, we want to address these weaknesses and present a robust table-structure decomposition algorithm. The design criteria for our model are the following. First, we want our algorithm to be language agnostic. In this way, we can obtain the structure of any table, irregardless of the language. Second, we want our algorithm to leverage as much data as possible from the original PDF document. For programmatic PDF documents, the text-cells can often be extracted much faster and with higher accuracy compared to OCR methods. Last but not least, we want to have a direct link between the table-cell and its bounding box in the image.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [50.112, 359.827, 286.36658, 416.5535], "page": 2, "span": [0, 242], "__ref_s3_data": null}], "text": "To meet the design criteria listed above, we developed a new model called TableFormer and a synthetically generated table structure dataset called SynthTabNet $^{1}$. In particular, our contributions in this work can be summarised as follows:", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [61.569016, 302.67703, 286.3649, 347.56812], "page": 2, "span": [0, 166], "__ref_s3_data": null}], "text": "- \u00b7 We propose TableFormer , a transformer based model that predicts tables structure and bounding boxes for the table content simultaneously in an end-to-end approach.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [61.569016, 245.07404999999994, 286.3649, 289.96616], "page": 2, "span": [0, 181], "__ref_s3_data": null}], "text": "- \u00b7 Across all benchmark datasets TableFormer significantly outperforms existing state-of-the-art metrics, while being much more efficient in training and inference to existing works.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [61.569, 199.42705, 286.36493, 232.36316], "page": 2, "span": [0, 106], "__ref_s3_data": null}], "text": "- \u00b7 We present SynthTabNet a synthetically generated dataset, with various appearance styles and complexity.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [61.569008000000004, 153.77904999999998, 286.36508, 186.59659999999997], "page": 2, "span": [0, 131], "__ref_s3_data": null}], "text": "- \u00b7 An augmented dataset based on PubTabNet [37], FinTabNet [36], and TableBank [17] with generated ground-truth for reproducibility.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [50.112007, 96.630043, 286.36511, 141.40161], "page": 2, "span": [0, 231], "__ref_s3_data": null}], "text": "The paper is structured as follows. In Sec. 2, we give a brief overview of the current state-of-the-art. In Sec. 3, we describe the datasets on which we train. In Sec. 4, we introduce the TableFormer model-architecture and describe", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [60.97100100000001, 79.278458, 183.73055, 86.40372500000001], "page": 2, "span": [0, 40], "__ref_s3_data": null}], "text": "$^{1}$https://github.com/IBM/SynthTabNet", "type": "footnote", "payload": null, "name": "Footnote", "font": null}, {"prov": [{"bbox": [308.862, 683.9750400000001, 545.11511, 716.79163], "page": 2, "span": [0, 166], "__ref_s3_data": null}], "text": "its results & performance in Sec. 5. As a conclusion, we describe how this new model-architecture can be re-purposed for other tasks in the computer-vision community.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [308.862, 659.52032, 498.28021, 670.26807], "page": 2, "span": [0, 37], "__ref_s3_data": null}], "text": "2. Previous work and State of the Art", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [308.862, 461.54498, 545.11517, 649.77863], "page": 2, "span": [0, 901], "__ref_s3_data": null}], "text": "Identifying the structure of a table has been an outstanding problem in the document-parsing community, that motivates many organised public challenges [6, 4, 14]. The difficulty of the problem can be attributed to a number of factors. First, there is a large variety in the shapes and sizes of tables. Such large variety requires a flexible method. This is especially true for complex column- and row headers, which can be extremely intricate and demanding. A second factor of complexity is the lack of data with regard to table-structure. Until the publication of PubTabNet [37], there were no large datasets (i.e. > 100 K tables) that provided structure information. This happens primarily due to the fact that tables are notoriously time-consuming to annotate by hand. However, this has definitely changed in recent years with the deliverance of PubTabNet [37], FinTabNet [36], TableBank [17] etc.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [308.862, 341.9270900000001, 545.11523, 458.43054], "page": 2, "span": [0, 552], "__ref_s3_data": null}], "text": "Before the rising popularity of deep neural networks, the community relied heavily on heuristic and/or statistical methods to do table structure identification [3, 7, 11, 5, 13, 28]. Although such methods work well on constrained tables [12], a more data-driven approach can be applied due to the advent of convolutional neural networks (CNNs) and the availability of large datasets. To the best-of-our knowledge, there are currently two different types of network architecture that are being pursued for state-of-the-art tablestructure identification.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [308.86197, 78.84815200000003, 545.11688, 338.93222], "page": 2, "span": [0, 1262], "__ref_s3_data": null}], "text": "Image-to-Text networks : In this type of network, one predicts a sequence of tokens starting from an encoded image. Such sequences of tokens can be HTML table tags [37, 17] or LaTeX symbols[10]. The choice of symbols is ultimately not very important, since one can be transformed into the other. There are however subtle variations in the Image-to-Text networks. The easiest network architectures are \"image-encoder \u2192 text-decoder\" (IETD), similar to network architectures that try to provide captions to images [32]. In these IETD networks, one expects as output the LaTeX/HTML string of the entire table, i.e. the symbols necessary for creating the table with the content of the table. Another approach is the \"image-encoder \u2192 dual decoder\" (IEDD) networks. In these type of networks, one has two consecutive decoders with different purposes. The first decoder is the tag-decoder , i.e. it only produces the HTML/LaTeX tags which construct an empty table. The second content-decoder uses the encoding of the image in combination with the output encoding of each cell-tag (from the tag-decoder ) to generate the textual content of each table cell. The network architecture of IEDD is certainly more elaborate, but it has the advantage that one can pre-train the", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [50.112, 707.88507, 250.15102, 716.79163], "page": 3, "span": [0, 51], "__ref_s3_data": null}], "text": "tag-decoder which is constrained to the table-tags.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [50.112, 516.5459, 286.36514, 704.7806400000001], "page": 3, "span": [0, 864], "__ref_s3_data": null}], "text": "In practice, both network architectures (IETD and IEDD) require an implicit, custom trained object-characterrecognition (OCR) to obtain the content of the table-cells. In the case of IETD, this OCR engine is implicit in the decoder similar to [24]. For the IEDD, the OCR is solely embedded in the content-decoder. This reliance on a custom, implicit OCR decoder is of course problematic. OCR is a well known and extremely tough problem, that often needs custom training for each individual language. However, the limited availability for non-english content in the current datasets, makes it impractical to apply the IETD and IEDD methods on tables with other languages. Additionally, OCR can be completely omitted if the tables originate from programmatic PDF documents with known positions of each cell. The latter was the inspiration for the work of this paper.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [50.111992, 301.29712, 286.36511, 513.56104], "page": 3, "span": [0, 1007], "__ref_s3_data": null}], "text": "Graph Neural networks : Graph Neural networks (GNN's) take a radically different approach to tablestructure extraction. Note that one table cell can constitute out of multiple text-cells. To obtain the table-structure, one creates an initial graph, where each of the text-cells becomes a node in the graph similar to [33, 34, 2]. Each node is then associated with en embedding vector coming from the encoded image, its coordinates and the encoded text. Furthermore, nodes that represent adjacent text-cells are linked. Graph Convolutional Networks (GCN's) based methods take the image as an input, but also the position of the text-cells and their content [18]. The purpose of a GCN is to transform the input graph into a new graph, which replaces the old links with new ones. The new links then represent the table-structure. With this approach, one can avoid the need to build custom OCR decoders. However, the quality of the reconstructed structure is not comparable to the current state-of-the-art [18].", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [50.111984, 169.73315000000002, 286.36627, 298.31125], "page": 3, "span": [0, 619], "__ref_s3_data": null}], "text": "Hybrid Deep Learning-Rule-Based approach : A popular current model for table-structure identification is the use of a hybrid Deep Learning-Rule-Based approach similar to [27, 29]. In this approach, one first detects the position of the table-cells with object detection (e.g. YoloVx or MaskRCNN), then classifies the table into different types (from its images) and finally uses different rule-sets to obtain its table-structure. Currently, this approach achieves stateof-the-art results, but is not an end-to-end deep-learning method. As such, new rules need to be written if different types of tables are encountered.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [50.111984, 145.30743000000007, 105.22546, 156.05516], "page": 3, "span": [0, 11], "__ref_s3_data": null}], "text": "3. Datasets", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [50.111984, 78.84813699999995, 286.36508, 135.57470999999998], "page": 3, "span": [0, 281], "__ref_s3_data": null}], "text": "We rely on large-scale datasets such as PubTabNet [37], FinTabNet [36], and TableBank [17] datasets to train and evaluate our models. These datasets span over various appearance styles and content. We also introduce our own synthetically generated SynthTabNet dataset to fix an im-", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"name": "Picture", "type": "figure", "$ref": "#/figures/3"}, {"prov": [{"bbox": [308.862, 465.62009, 437.27002, 474.52664], "page": 3, "span": [0, 33], "__ref_s3_data": null}], "text": "balance in the previous datasets.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [308.862, 164.63825999999995, 545.11517, 460.46863], "page": 3, "span": [0, 1400], "__ref_s3_data": null}], "text": "The PubTabNet dataset contains 509k tables delivered as annotated PNG images. The annotations consist of the table structure represented in HTML format, the tokenized text and its bounding boxes per table cell. Fig. 1 shows the appearance style of PubTabNet. Depending on its complexity, a table is characterized as \"simple\" when it does not contain row spans or column spans, otherwise it is \"complex\". The dataset is divided into Train and Val splits (roughly 98% and 2%). The Train split consists of 54% simple and 46% complex tables and the Val split of 51% and 49% respectively. The FinTabNet dataset contains 112k tables delivered as single-page PDF documents with mixed table structures and text content. Similarly to the PubTabNet, the annotations of FinTabNet include the table structure in HTML, the tokenized text and the bounding boxes on a table cell basis. The dataset is divided into Train, Test and Val splits (81%, 9.5%, 9.5%), and each one is almost equally divided into simple and complex tables (Train: 48% simple, 52% complex, Test: 48% simple, 52% complex, Test: 53% simple, 47% complex). Finally the TableBank dataset consists of 145k tables provided as JPEG images. The latter has annotations for the table structure, but only few with bounding boxes of the table cells. The entire dataset consists of simple tables and it is divided into 90% Train, 3% Test and 7% Val splits.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [308.862, 78.84823600000004, 545.11511, 159.48581000000001], "page": 3, "span": [0, 406], "__ref_s3_data": null}], "text": "Due to the heterogeneity across the dataset formats, it was necessary to combine all available data into one homogenized dataset before we could train our models for practical purposes. Given the size of PubTabNet, we adopted its annotation format and we extracted and converted all tables as PNG images with a resolution of 72 dpi. Additionally, we have filtered out tables with extreme sizes due to small", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [50.112, 695.93005, 286.36511, 716.79163], "page": 4, "span": [0, 93], "__ref_s3_data": null}], "text": "amount of such tables, and kept only those ones ranging between 1*1 and 20*10 (rows/columns).", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [50.112, 478.89493, 286.36514, 691.03961], "page": 4, "span": [0, 983], "__ref_s3_data": null}], "text": "The availability of the bounding boxes for all table cells is essential to train our models. In order to distinguish between empty and non-empty bounding boxes, we have introduced a binary class in the annotation. Unfortunately, the original datasets either omit the bounding boxes for whole tables (e.g. TableBank) or they narrow their scope only to non-empty cells. Therefore, it was imperative to introduce a data pre-processing procedure that generates the missing bounding boxes out of the annotation information. This procedure first parses the provided table structure and calculates the dimensions of the most fine-grained grid that covers the table structure. Notice that each table cell may occupy multiple grid squares due to row or column spans. In case of PubTabNet we had to compute missing bounding boxes for 48% of the simple and 69% of the complex tables. Regarding FinTabNet, 68% of the simple and 98% of the complex tables require the generation of bounding boxes.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [50.112, 357.50104, 286.36511, 474.00449000000003], "page": 4, "span": [0, 571], "__ref_s3_data": null}], "text": "As it is illustrated in Fig. 2, the table distributions from all datasets are skewed towards simpler structures with fewer number of rows/columns. Additionally, there is very limited variance in the table styles, which in case of PubTabNet and FinTabNet means one styling format for the majority of the tables. Similar limitations appear also in the type of table content, which in some cases (e.g. FinTabNet) is restricted to a certain domain. Ultimately, the lack of diversity in the training dataset damages the ability of the models to generalize well on unseen data.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [50.112, 164.37611000000004, 286.36655, 352.6106], "page": 4, "span": [0, 941], "__ref_s3_data": null}], "text": "Motivated by those observations we aimed at generating a synthetic table dataset named SynthTabNet . This approach offers control over: 1) the size of the dataset, 2) the table structure, 3) the table style and 4) the type of content. The complexity of the table structure is described by the size of the table header and the table body, as well as the percentage of the table cells covered by row spans and column spans. A set of carefully designed styling templates provides the basis to build a wide range of table appearances. Lastly, the table content is generated out of a curated collection of text corpora. By controlling the size and scope of the synthetic datasets we are able to train and evaluate our models in a variety of different conditions. For example, we can first generate a highly diverse dataset to train our models and then evaluate their performance on other synthetic datasets which are focused on a specific domain.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [50.112015, 78.84810600000003, 286.36511, 159.48567000000003], "page": 4, "span": [0, 405], "__ref_s3_data": null}], "text": "In this regard, we have prepared four synthetic datasets, each one containing 150k examples. The corpora to generate the table text consists of the most frequent terms appearing in PubTabNet and FinTabNet together with randomly generated text. The first two synthetic datasets have been fine-tuned to mimic the appearance of the original datasets but encompass more complicated table structures. The third", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"name": "Table", "type": "table", "$ref": "#/tables/2"}, {"prov": [{"bbox": [308.862, 567.61102, 545.11505, 624.33862], "page": 4, "span": [0, 267], "__ref_s3_data": null}], "text": "Table 1: Both \"Combined-Tabnet\" and \"CombinedTabnet\" are variations of the following: (*) The CombinedTabnet dataset is the processed combination of PubTabNet and Fintabnet. (**) The combined dataset is the processed combination of PubTabNet, Fintabnet and TableBank.", "type": "caption", "payload": null, "name": "Caption", "font": null}, {"prov": [{"bbox": [308.862, 497.60803, 545.11517, 542.37958], "page": 4, "span": [0, 210], "__ref_s3_data": null}], "text": "one adopts a colorful appearance with high contrast and the last one contains tables with sparse content. Lastly, we have combined all synthetic datasets into one big unified synthetic dataset of 600k examples.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [320.81699, 485.32104, 542.74396, 494.22759999999994], "page": 4, "span": [0, 57], "__ref_s3_data": null}], "text": "Tab. 1 summarizes the various attributes of the datasets.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [308.862, 460.06832999999995, 444.93607000000003, 470.81604], "page": 4, "span": [0, 24], "__ref_s3_data": null}], "text": "4. The TableFormer model", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [308.862, 345.51314999999994, 545.11523, 450.06061], "page": 4, "span": [0, 504], "__ref_s3_data": null}], "text": "Given the image of a table, TableFormer is able to predict: 1) a sequence of tokens that represent the structure of a table, and 2) a bounding box coupled to a subset of those tokens. The conversion of an image into a sequence of tokens is a well-known task [35, 16]. While attention is often used as an implicit method to associate each token of the sequence with a position in the original image, an explicit association between the individual table-cells and the image bounding boxes is also required.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [308.862, 324.45367, 420.16058, 334.30573], "page": 4, "span": [0, 24], "__ref_s3_data": null}], "text": "4.1. Model architecture.", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [308.86197, 127.00018999999998, 545.11572, 315.23471], "page": 4, "span": [0, 907], "__ref_s3_data": null}], "text": "We now describe in detail the proposed method, which is composed of three main components, see Fig. 4. Our CNN Backbone Network encodes the input as a feature vector of predefined length. The input feature vector of the encoded image is passed to the Structure Decoder to produce a sequence of HTML tags that represent the structure of the table. With each prediction of an HTML standard data cell (' < td > ') the hidden state of that cell is passed to the Cell BBox Decoder. As for spanning cells, such as row or column span, the tag is broken down to ' < ', 'rowspan=' or 'colspan=', with the number of spanning cells (attribute), and ' > '. The hidden state attached to ' < ' is passed to the Cell BBox Decoder. A shared feed forward network (FFN) receives the hidden states from the Structure Decoder, to provide the final detection predictions of the bounding box coordinates and their classification.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [308.86197, 78.84818300000006, 545.11511, 123.73929999999996], "page": 4, "span": [0, 223], "__ref_s3_data": null}], "text": "CNN Backbone Network. A ResNet-18 CNN is the backbone that receives the table image and encodes it as a vector of predefined length. The network has been modified by removing the linear and pooling layer, as we are not per-", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"name": "Picture", "type": "figure", "$ref": "#/figures/4"}, {"name": "Picture", "type": "figure", "$ref": "#/figures/5"}, {"prov": [{"bbox": [308.862, 497.6930500000001, 545.11505, 542.46558], "page": 5, "span": [0, 227], "__ref_s3_data": null}], "text": "forming classification, and adding an adaptive pooling layer of size 28*28. ResNet by default downsamples the image resolution by 32 and then the encoded image is provided to both the Structure Decoder , and Cell BBox Decoder .", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [308.86194, 378.03818, 545.11511, 494.66019], "page": 5, "span": [0, 563], "__ref_s3_data": null}], "text": "Structure Decoder. The transformer architecture of this component is based on the work proposed in [31]. After extensive experimentation, the Structure Decoder is modeled as a transformer encoder with two encoder layers and a transformer decoder made from a stack of 4 decoder layers that comprise mainly of multi-head attention and feed forward layers. This configuration uses fewer layers and heads in comparison to networks applied to other problems (e.g. \"Scene Understanding\", \"Image Captioning\"), something which we relate to the simplicity of table images.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [308.86197, 246.42728999999997, 545.11511, 374.88574], "page": 5, "span": [0, 592], "__ref_s3_data": null}], "text": "The transformer encoder receives an encoded image from the CNN Backbone Network and refines it through a multi-head dot-product attention layer, followed by a Feed Forward Network. During training, the transformer decoder receives as input the output feature produced by the transformer encoder, and the tokenized input of the HTML ground-truth tags. Using a stack of multi-head attention layers, different aspects of the tag sequence could be inferred. This is achieved by each attention head on a layer operating in a different subspace, and then combining altogether their attention score.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [308.86194, 138.72729000000004, 545.11511, 243.3954], "page": 5, "span": [0, 483], "__ref_s3_data": null}], "text": "Cell BBox Decoder. Our architecture allows to simultaneously predict HTML tags and bounding boxes for each table cell without the need of a separate object detector end to end. This approach is inspired by DETR [1] which employs a Transformer Encoder, and Decoder that looks for a specific number of object queries (potential object detections). As our model utilizes a transformer architecture, the hidden state of the < td > ' and ' < ' HTML structure tags become the object query.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [308.86194, 78.84827399999995, 545.11505, 135.57484], "page": 5, "span": [0, 286], "__ref_s3_data": null}], "text": "The encoding generated by the CNN Backbone Network along with the features acquired for every data cell from the Transformer Decoder are then passed to the attention network. The attention network takes both inputs and learns to provide an attention weighted encoding. This weighted at-", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [50.112, 636.15399, 286.36514, 716.79163], "page": 6, "span": [0, 380], "__ref_s3_data": null}], "text": "tention encoding is then multiplied to the encoded image to produce a feature for each table cell. Notice that this is different than the typical object detection problem where imbalances between the number of detections and the amount of objects may exist. In our case, we know up front that the produced detections always match with the table cells in number and correspondence.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [50.112, 551.73694, 286.36511, 632.37555], "page": 6, "span": [0, 371], "__ref_s3_data": null}], "text": "The output features for each table cell are then fed into the feed-forward network (FFN). The FFN consists of a Multi-Layer Perceptron (3 layers with ReLU activation function) that predicts the normalized coordinates for the bounding box of each table cell. Finally, the predicted bounding boxes are classified based on whether they are empty or not using a linear layer.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [50.112, 347.7691, 286.36572, 548.07806], "page": 6, "span": [0, 985], "__ref_s3_data": null}], "text": "Loss Functions. We formulate a multi-task loss Eq. 2 to train our network. The Cross-Entropy loss (denoted as l$_{s}$ ) is used to train the Structure Decoder which predicts the structure tokens. As for the Cell BBox Decoder it is trained with a combination of losses denoted as l$_{box}$ . l$_{box}$ consists of the generally used l$_{1}$ loss for object detection and the IoU loss ( l$_{iou}$ ) to be scale invariant as explained in [25]. In comparison to DETR, we do not use the Hungarian algorithm [15] to match the predicted bounding boxes with the ground-truth boxes, as we have already achieved a one-toone match through two steps: 1) Our token input sequence is naturally ordered, therefore the hidden states of the table data cells are also in order when they are provided as input to the Cell BBox Decoder , and 2) Our bounding boxes generation mechanism (see Sec. 3) ensures a one-to-one mapping between the cell content and its bounding box for all post-processed datasets.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [50.112022, 323.12811, 286.36499, 343.98965], "page": 6, "span": [0, 67], "__ref_s3_data": null}], "text": "The loss used to train the TableFormer can be defined as following:", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [124.33002, 274.92828, 286.36243, 298.71906], "page": 6, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "equation", "payload": null, "name": "Formula", "font": null}, {"prov": [{"bbox": [50.11203, 251.78412000000003, 281.59692, 261.4079899999999], "page": 6, "span": [0, 76], "__ref_s3_data": null}], "text": "where \u03bb \u2208 [0, 1], and \u03bb$_{iou}$, \u03bb$_{l}$$_{1}$ \u2208$_{R}$ are hyper-parameters.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [50.112045, 225.33538999999996, 171.98335, 236.08311000000003], "page": 6, "span": [0, 23], "__ref_s3_data": null}], "text": "5. Experimental Results", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [50.112045, 205.88362000000006, 179.17502, 215.73567000000003], "page": 6, "span": [0, 27], "__ref_s3_data": null}], "text": "5.1. Implementation Details", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [50.112045, 151.49311999999998, 286.36517, 196.26567], "page": 6, "span": [0, 207], "__ref_s3_data": null}], "text": "TableFormer uses ResNet-18 as the CNN Backbone Network . The input images are resized to 448*448 pixels and the feature map has a dimension of 28*28. Additionally, we enforce the following input constraints:", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [91.661049, 113.60411999999997, 286.36246, 138.17200000000003], "page": 6, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "equation", "payload": null, "name": "Formula", "font": null}, {"prov": [{"bbox": [50.112061, 78.84812199999999, 286.36514, 99.70968600000003], "page": 6, "span": [0, 274], "__ref_s3_data": null}, {"bbox": [50.112061, 78.84812199999999, 286.36514, 99.70968600000003], "page": 6, "span": [0, 274], "__ref_s3_data": null}], "text": "Although input constraints are used also by other methods, such as EDD, ours are less restrictive due to the improved runtime performance and lower memory footprint of TableFormer. This allows to utilize input samples with longer sequences and images with larger dimensions.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [308.86206, 463.62595, 545.1153, 675.77063], "page": 6, "span": [0, 1024], "__ref_s3_data": null}], "text": "The Transformer Encoder consists of two \"Transformer Encoder Layers\", with an input feature size of 512, feed forward network of 1024, and 4 attention heads. As for the Transformer Decoder it is composed of four \"Transformer Decoder Layers\" with similar input and output dimensions as the \"Transformer Encoder Layers\". Even though our model uses fewer layers and heads than the default implementation parameters, our extensive experimentation has proved this setup to be more suitable for table images. We attribute this finding to the inherent design of table images, which contain mostly lines and text, unlike the more elaborate content present in other scopes (e.g. the COCO dataset). Moreover, we have added ResNet blocks to the inputs of the Structure Decoder and Cell BBox Decoder. This prevents a decoder having a stronger influence over the learned weights which would damage the other prediction task (structure vs bounding boxes), but learn task specific weights instead. Lastly our dropout layers are set to 0.5.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [308.86203, 362.83002, 545.11517, 455.42249], "page": 6, "span": [0, 419], "__ref_s3_data": null}], "text": "For training, TableFormer is trained with 3 Adam optimizers, each one for the CNN Backbone Network , Structure Decoder , and Cell BBox Decoder . Taking the PubTabNet as an example for our parameter set up, the initializing learning rate is 0.001 for 12 epochs with a batch size of 24, and \u03bb set to 0.5. Afterwards, we reduce the learning rate to 0.0001, the batch size to 18 and train for 12 more epochs or convergence.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [308.86203, 238.12311, 545.11523, 354.62558000000007], "page": 6, "span": [0, 528], "__ref_s3_data": null}], "text": "TableFormer is implemented with PyTorch and Torchvision libraries [22]. To speed up the inference, the image undergoes a single forward pass through the CNN Backbone Network and transformer encoder. This eliminates the overhead of generating the same features for each decoding step. Similarly, we employ a 'caching' technique to preform faster autoregressive decoding. This is achieved by storing the features of decoded tokens so we can reuse them for each time step. Therefore, we only compute the attention for each new tag.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [308.86203, 202.59362999999996, 397.44281, 212.44568000000004], "page": 6, "span": [0, 19], "__ref_s3_data": null}], "text": "5.2. Generalization", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [308.86203, 119.86811, 545.11517, 188.55066999999997], "page": 6, "span": [0, 299], "__ref_s3_data": null}], "text": "TableFormer is evaluated on three major publicly available datasets of different nature to prove the generalization and effectiveness of our model. The datasets used for evaluation are the PubTabNet, FinTabNet and TableBank which stem from the scientific, financial and general domains respectively.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [308.86203, 78.84710700000005, 545.11523, 111.66467], "page": 6, "span": [0, 155], "__ref_s3_data": null}], "text": "We also share our baseline results on the challenging SynthTabNet dataset. Throughout our experiments, the same parameters stated in Sec. 5.1 are utilized.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [50.112, 707.74658, 167.89825, 717.5986299999998], "page": 7, "span": [0, 25], "__ref_s3_data": null}], "text": "5.3. Datasets and Metrics", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [50.112, 653.87701, 286.36511, 698.6496000000001], "page": 7, "span": [0, 192], "__ref_s3_data": null}], "text": "The Tree-Edit-Distance-Based Similarity (TEDS) metric was introduced in [37]. It represents the prediction, and ground-truth as a tree structure of HTML tags. This similarity is calculated as:", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [86.218994, 619.26123, 286.3624, 641.68201], "page": 7, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "equation", "payload": null, "name": "Formula", "font": null}, {"prov": [{"bbox": [50.111984, 578.021, 286.36285, 610.99701], "page": 7, "span": [0, 162], "__ref_s3_data": null}], "text": "where T$_{a}$ and T$_{b}$ represent tables in tree structure HTML format. EditDist denotes the tree-edit distance, and | T | represents the number of nodes in T .", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [50.112, 557.32849, 170.45169, 567.18054], "page": 7, "span": [0, 26], "__ref_s3_data": null}], "text": "5.4. Quantitative Analysis", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [50.112, 395.86206, 286.36514, 548.3501], "page": 7, "span": [0, 723], "__ref_s3_data": null}], "text": "Structure. As shown in Tab. 2, TableFormer outperforms all SOTA methods across different datasets by a large margin for predicting the table structure from an image. All the more, our model outperforms pre-trained methods. During the evaluation we do not apply any table filtering. We also provide our baseline results on the SynthTabNet dataset. It has been observed that large tables (e.g. tables that occupy half of the page or more) yield poor predictions. We attribute this issue to the image resizing during the preprocessing step, that produces downsampled images with indistinguishable features. This problem can be addressed by treating such big tables with a separate model which accepts a large input image size.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"name": "Table", "type": "table", "$ref": "#/tables/3"}, {"prov": [{"bbox": [50.112, 178.70507999999995, 286.36511, 199.56664], "page": 7, "span": [0, 101], "__ref_s3_data": null}], "text": "Table 2: Structure results on PubTabNet (PTN), FinTabNet (FTN), TableBank (TB) and SynthTabNet (STN).", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [50.112, 166.75008000000003, 261.78732, 175.65662999999995], "page": 7, "span": [0, 50], "__ref_s3_data": null}], "text": "FT: Model was trained on PubTabNet then finetuned.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [50.112015, 78.84806800000001, 286.366, 147.65019000000007], "page": 7, "span": [0, 1084], "__ref_s3_data": null}, {"bbox": [50.112015, 78.84806800000001, 286.366, 147.65019000000007], "page": 7, "span": [0, 1084], "__ref_s3_data": null}], "text": "Cell Detection. Like any object detector, our Cell BBox Detector provides bounding boxes that can be improved with post-processing during inference. We make use of the grid-like structure of tables to refine the predictions. A detailed explanation on the post-processing is available in the supplementary material. As shown in Tab. 3, we evaluate our Cell BBox Decoder accuracy for cells with a class label of 'content' only using the PASCAL VOC mAP metric for pre-processing and post-processing. Note that we do not have post-processing results for SynthTabNet as images are only provided. To compare the performance of our proposed approach, we've integrated TableFormer's Cell BBox Decoder into EDD architecture. As mentioned previously, the Structure Decoder provides the Cell BBox Decoder with the features needed to predict the bounding box predictions. Therefore, the accuracy of the Structure Decoder directly influences the accuracy of the Cell BBox Decoder . If the Structure Decoder predicts an extra column, this will result in an extra column of predicted bounding boxes.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"name": "Table", "type": "table", "$ref": "#/tables/4"}, {"prov": [{"bbox": [308.862, 454.6891499999999, 545.11517, 475.55069], "page": 7, "span": [0, 94], "__ref_s3_data": null}], "text": "Table 3: Cell Bounding Box detection results on PubTabNet, and FinTabNet. PP: Post-processing.", "type": "caption", "payload": null, "name": "Caption", "font": null}, {"prov": [{"bbox": [308.86197, 271.83231, 545.11566, 424.3202800000001], "page": 7, "span": [0, 715], "__ref_s3_data": null}], "text": "Cell Content. In this section, we evaluate the entire pipeline of recovering a table with content. Here we put our approach to test by capitalizing on extracting content from the PDF cells rather than decoding from images. Tab. 4 shows the TEDs score of HTML code representing the structure of the table along with the content inserted in the data cell and compared with the ground-truth. Our method achieved a 5.3% increase over the state-of-the-art, and commercial solutions. We believe our scores would be higher if the HTML ground-truth matched the extracted PDF cell content. Unfortunately, there are small discrepancies such as spacings around words or special characters with various unicode representations.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"name": "Table", "type": "table", "$ref": "#/tables/5"}, {"prov": [{"bbox": [308.862, 102.32206999999994, 545.11517, 135.13864], "page": 7, "span": [0, 148], "__ref_s3_data": null}], "text": "Table 4: Results of structure with content retrieved using cell detection on PubTabNet. In all cases the input is PDF documents with cropped tables.", "type": "caption", "payload": null, "name": "Caption", "font": null}, {"prov": [{"bbox": [53.286037, 705.43927, 61.550289, 713.3124399999999], "page": 8, "span": [0, 2], "__ref_s3_data": null}], "text": "- a.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [65.682419, 705.43927, 499.55563, 713.3124399999999], "page": 8, "span": [0, 105], "__ref_s3_data": null}], "text": "- Red - PDF cells, Green - predicted bounding boxes, Blue - post-processed predictions matched to PDF cells", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [53.811783000000005, 689.8457, 284.34592, 697.71887], "page": 8, "span": [0, 53], "__ref_s3_data": null}], "text": "Japanese language (previously unseen by TableFormer):", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [304.83081, 689.8457, 431.09119, 697.71887], "page": 8, "span": [0, 29], "__ref_s3_data": null}], "text": "Example table from FinTabNet:", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"name": "Picture", "type": "figure", "$ref": "#/figures/6"}, {"name": "Picture", "type": "figure", "$ref": "#/figures/7"}, {"name": "Table", "type": "table", "$ref": "#/tables/6"}, {"prov": [{"bbox": [380.42731, 493.39716, 549.42175, 499.69574], "page": 8, "span": [0, 53], "__ref_s3_data": null}], "text": "Text is aligned to match original for ease of viewing", "type": "caption", "payload": null, "name": "Caption", "font": null}, {"name": "Table", "type": "table", "$ref": "#/tables/7"}, {"name": "Picture", "type": "figure", "$ref": "#/figures/8"}, {"name": "Picture", "type": "figure", "$ref": "#/figures/9"}, {"name": "Picture", "type": "figure", "$ref": "#/figures/10"}, {"prov": [{"bbox": [50.112, 290.75259, 163.7558, 300.60464], "page": 8, "span": [0, 25], "__ref_s3_data": null}], "text": "5.5. Qualitative Analysis", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [308.862, 290.54337, 460.84848, 301.29108], "page": 8, "span": [0, 27], "__ref_s3_data": null}], "text": "6. Future Work & Conclusion", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [50.112, 78.84805299999994, 286.36511, 255.12662999999998], "page": 8, "span": [0, 866], "__ref_s3_data": null}], "text": "We showcase several visualizations for the different components of our network on various \"complex\" tables within datasets presented in this work in Fig. 5 and Fig. 6 As it is shown, our model is able to predict bounding boxes for all table cells, even for the empty ones. Additionally, our post-processing techniques can extract the cell content by matching the predicted bounding boxes to the PDF cells based on their overlap and spatial proximity. The left part of Fig. 5 demonstrates also the adaptability of our method to any language, as it can successfully extract Japanese text, although the training set contains only English content. We provide more visualizations including the intermediate steps in the supplementary material. Overall these illustrations justify the versatility of our method across a diverse range of table appearances and content type.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [308.862, 138.69407999999999, 545.11517, 279.10663], "page": 8, "span": [0, 640], "__ref_s3_data": null}], "text": "In this paper, we presented TableFormer an end-to-end transformer based approach to predict table structures and bounding boxes of cells from an image. This approach enables us to recreate the table structure, and extract the cell content from PDF or OCR by using bounding boxes. Additionally, it provides the versatility required in real-world scenarios when dealing with various types of PDF documents, and languages. Furthermore, our method outperforms all state-of-the-arts with a wide margin. Finally, we introduce \"SynthTabNet\" a challenging synthetically generated dataset that reinforces missing characteristics from other datasets.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [308.862, 109.15336000000002, 364.40585, 119.90107999999998], "page": 8, "span": [0, 10], "__ref_s3_data": null}], "text": "References", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [313.345, 79.06324800000004, 545.1134, 98.03820799999994], "page": 8, "span": [0, 121], "__ref_s3_data": null}], "text": "- [1] Nicolas Carion, Francisco Massa, Gabriel Synnaeve, Nicolas Usunier, Alexander Kirillov, and Sergey Zagoruyko. End-to-", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [70.030998, 675.22424, 286.36334, 716.11621], "page": 9, "span": [0, 212], "__ref_s3_data": null}], "text": "- end object detection with transformers. In Andrea Vedaldi, Horst Bischof, Thomas Brox, and Jan-Michael Frahm, editors, Computer Vision - ECCV 2020 , pages 213-229, Cham, 2020. Springer International Publishing. 5", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [54.595005, 642.0343, 286.36334, 671.9682599999999], "page": 9, "span": [0, 165], "__ref_s3_data": null}], "text": "- [2] Zewen Chi, Heyan Huang, Heng-Da Xu, Houjin Yu, Wanxuan Yin, and Xian-Ling Mao. Complicated table structure recognition. arXiv preprint arXiv:1908.04729 , 2019. 3", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [54.595001, 608.84534, 286.36301, 638.77832], "page": 9, "span": [0, 125], "__ref_s3_data": null}], "text": "- [3] Bertrand Couasnon and Aurelie Lemaitre. Recognition of Tables and Forms , pages 647-677. Springer London, London, 2014. 2", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [54.59499, 564.69641, 286.36401, 605.58936], "page": 9, "span": [0, 216], "__ref_s3_data": null}], "text": "- [4] Herv\u00b4e D\u00b4ejean, Jean-Luc Meunier, Liangcai Gao, Yilun Huang, Yu Fang, Florian Kleber, and Eva-Maria Lang. ICDAR 2019 Competition on Table Detection and Recognition (cTDaR), Apr. 2019. http://sac.founderit.com/. 2", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [54.594982, 520.54846, 286.36334, 561.44043], "page": 9, "span": [0, 236], "__ref_s3_data": null}], "text": "- [5] Basilios Gatos, Dimitrios Danatsas, Ioannis Pratikakis, and Stavros J Perantonis. Automatic table detection in document images. In International Conference on Pattern Recognition and Image Analysis , pages 609-618. Springer, 2005. 2", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [54.594971, 476.3995100000001, 286.36676, 517.29242], "page": 9, "span": [0, 194], "__ref_s3_data": null}], "text": "- [6] Max G\u00a8obel, Tamir Hassan, Ermelinda Oro, and Giorgio Orsi. Icdar 2013 table competition. In 2013 12th International Conference on Document Analysis and Recognition , pages 1449-1453, 2013. 2", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [54.59499, 443.21048, 286.36319, 473.14346], "page": 9, "span": [0, 165], "__ref_s3_data": null}], "text": "- [7] EA Green and M Krishnamoorthy. Recognition of tables using table grammars. procs. In Symposium on Document Analysis and Recognition (SDAIR'95) , pages 261-277. 2", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [54.594986000000006, 388.10251, 286.36331, 439.9544399999999], "page": 9, "span": [0, 273], "__ref_s3_data": null}], "text": "- [8] Khurram Azeem Hashmi, Alain Pagani, Marcus Liwicki, Didier Stricker, and Muhammad Zeshan Afzal. Castabdetectors: Cascade network for table detection in document images with recursive feature pyramid and switchable atrous convolution. Journal of Imaging , 7(10), 2021. 1", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [54.595001, 354.91353999999995, 286.35989, 384.84746999999993], "page": 9, "span": [0, 170], "__ref_s3_data": null}], "text": "- [9] Kaiming He, Georgia Gkioxari, Piotr Dollar, and Ross Girshick. Mask r-cnn. In Proceedings of the IEEE International Conference on Computer Vision (ICCV) , Oct 2017. 1", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [50.112, 310.76456, 286.36334, 351.6575000000001], "page": 9, "span": [0, 226], "__ref_s3_data": null}], "text": "- [10] Yelin He, X. Qi, Jiaquan Ye, Peng Gao, Yihao Chen, Bingcong Li, Xin Tang, and Rong Xiao. Pingan-vcgroup's solution for icdar 2021 competition on scientific table image recognition to latex. ArXiv , abs/2105.01846, 2021. 2", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [50.112, 255.65761999999995, 286.36331, 307.50952], "page": 9, "span": [0, 239], "__ref_s3_data": null}], "text": "- [11] Jianying Hu, Ramanujan S Kashi, Daniel P Lopresti, and Gordon Wilfong. Medium-independent table detection. In Document Recognition and Retrieval VII , volume 3967, pages 291-302. International Society for Optics and Photonics, 1999. 2", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [50.112007, 200.55062999999996, 286.36334, 252.40157999999997], "page": 9, "span": [0, 240], "__ref_s3_data": null}], "text": "- [12] Matthew Hurst. A constraint-based approach to table structure derivation. In Proceedings of the Seventh International Conference on Document Analysis and Recognition - Volume 2 , ICDAR '03, page 911, USA, 2003. IEEE Computer Society. 2", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [50.112007, 145.44263, 286.36331, 197.29458999999997], "page": 9, "span": [0, 283], "__ref_s3_data": null}], "text": "- [13] Thotreingam Kasar, Philippine Barlas, Sebastien Adam, Cl\u00b4ement Chatelain, and Thierry Paquet. Learning to detect tables in scanned document images using line information. In 2013 12th International Conference on Document Analysis and Recognition , pages 1185-1189. IEEE, 2013. 2", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [50.111992, 112.25361999999996, 286.36334, 142.18658000000005], "page": 9, "span": [0, 142], "__ref_s3_data": null}], "text": "- [14] Pratik Kayal, Mrinal Anand, Harsh Desai, and Mayank Singh. Icdar 2021 competition on scientific table image recognition to latex, 2021. 2", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [50.111992, 79.06361400000003, 286.35931, 108.99757], "page": 9, "span": [0, 127], "__ref_s3_data": null}], "text": "- [15] Harold W Kuhn. The hungarian method for the assignment problem. Naval research logistics quarterly , 2(1-2):83-97, 1955. 6", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [308.86197, 653.30664, 545.11475, 716.1165799999999], "page": 9, "span": [0, 287], "__ref_s3_data": null}], "text": "- [16] Girish Kulkarni, Visruth Premraj, Vicente Ordonez, Sagnik Dhar, Siming Li, Yejin Choi, Alexander C. Berg, and Tamara L. Berg. Babytalk: Understanding and generating simple image descriptions. IEEE Transactions on Pattern Analysis and Machine Intelligence , 35(12):2891-2903, 2013. 4", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [308.862, 619.94366, 545.1134, 649.87665], "page": 9, "span": [0, 156], "__ref_s3_data": null}], "text": "- [17] Minghao Li, Lei Cui, Shaohan Huang, Furu Wei, Ming Zhou, and Zhoujun Li. Tablebank: A benchmark dataset for table detection and recognition, 2019. 2, 3", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [308.862, 531.78577, 545.11353, 616.51367], "page": 9, "span": [0, 407], "__ref_s3_data": null}], "text": "- [18] Yiren Li, Zheng Huang, Junchi Yan, Yi Zhou, Fan Ye, and Xianhui Liu. Gfte: Graph-based financial table extraction. In Alberto Del Bimbo, Rita Cucchiara, Stan Sclaroff, Giovanni Maria Farinella, Tao Mei, Marco Bertini, Hugo Jair Escalante, and Roberto Vezzani, editors, Pattern Recognition. ICPR International Workshops and Challenges , pages 644-658, Cham, 2021. Springer International Publishing. 2, 3", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [308.862, 465.54587, 545.1142, 528.35577], "page": 9, "span": [0, 328], "__ref_s3_data": null}], "text": "- [19] Nikolaos Livathinos, Cesar Berrospi, Maksym Lysak, Viktor Kuropiatnyk, Ahmed Nassar, Andre Carvalho, Michele Dolfi, Christoph Auer, Kasper Dinkla, and Peter Staar. Robust pdf document conversion using recurrent neural networks. Proceedings of the AAAI Conference on Artificial Intelligence , 35(17):15137-15145, May 2021. 1", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [308.862, 421.22287, 545.11609, 462.11581], "page": 9, "span": [0, 229], "__ref_s3_data": null}], "text": "- [20] Rujiao Long, Wen Wang, Nan Xue, Feiyu Gao, Zhibo Yang, Yongpan Wang, and Gui-Song Xia. Parsing table structures in the wild. In Proceedings of the IEEE/CVF International Conference on Computer Vision , pages 944-952, 2021. 2", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [308.862, 354.98294, 545.11346, 417.79382], "page": 9, "span": [0, 315], "__ref_s3_data": null}], "text": "- [21] Shubham Singh Paliwal, D Vishwanath, Rohit Rahul, Monika Sharma, and Lovekesh Vig. Tablenet: Deep learning model for end-to-end table detection and tabular data extraction from scanned document images. In 2019 International Conference on Document Analysis and Recognition (ICDAR) , pages 128-133. IEEE, 2019. 1", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [308.862, 233.94903999999997, 545.11475, 351.55389], "page": 9, "span": [0, 592], "__ref_s3_data": null}], "text": "- [22] Adam Paszke, Sam Gross, Francisco Massa, Adam Lerer, James Bradbury, Gregory Chanan, Trevor Killeen, Zeming Lin, Natalia Gimelshein, Luca Antiga, Alban Desmaison, Andreas Kopf, Edward Yang, Zachary DeVito, Martin Raison, Alykhan Tejani, Sasank Chilamkurthy, Benoit Steiner, Lu Fang, Junjie Bai, and Soumith Chintala. Pytorch: An imperative style, high-performance deep learning library. In H. Wallach, H. Larochelle, A. Beygelzimer, F. d'Alch\u00b4e-Buc, E. Fox, and R. Garnett, editors, Advances in Neural Information Processing Systems 32 , pages 8024-8035. Curran Associates, Inc., 2019. 6", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [308.862, 167.70902999999998, 545.1134, 230.519], "page": 9, "span": [0, 322], "__ref_s3_data": null}], "text": "- [23] Devashish Prasad, Ayan Gadpal, Kshitij Kapadni, Manish Visave, and Kavita Sultanpure. Cascadetabnet: An approach for end to end table detection and structure recognition from image-based documents. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition Workshops , pages 572-573, 2020. 1", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [308.862, 123.38602000000003, 545.11621, 164.27899000000002], "page": 9, "span": [0, 224], "__ref_s3_data": null}], "text": "- [24] Shah Rukh Qasim, Hassan Mahmood, and Faisal Shafait. Rethinking table recognition using graph neural networks. In 2019 International Conference on Document Analysis and Recognition (ICDAR) , pages 142-147. IEEE, 2019. 3", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [308.86203, 79.06402600000001, 545.1134, 119.95699000000002], "page": 9, "span": [0, 229], "__ref_s3_data": null}], "text": "- [25] Hamid Rezatofighi, Nathan Tsoi, JunYoung Gwak, Amir Sadeghian, Ian Reid, and Silvio Savarese. Generalized intersection over union: A metric and a loss for bounding box regression. In Proceedings of the IEEE/CVF Conference on", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [70.030998, 697.14124, 286.36176, 716.11621], "page": 10, "span": [0, 64], "__ref_s3_data": null}], "text": "Computer Vision and Pattern Recognition , pages 658-666, 2019. 6", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [50.112007, 631.02332, 286.36578, 693.83423], "page": 10, "span": [0, 302], "__ref_s3_data": null}], "text": "- [26] Sebastian Schreiber, Stefan Agne, Ivo Wolf, Andreas Dengel, and Sheraz Ahmed. Deepdesrt: Deep learning for detection and structure recognition of tables in document images. In 2017 14th IAPR International Conference on Document Analysis and Recognition (ICDAR) , volume 01, pages 11621167, 2017. 1", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [50.112007, 564.9054, 286.36337, 627.71533], "page": 10, "span": [0, 308], "__ref_s3_data": null}], "text": "- [27] Sebastian Schreiber, Stefan Agne, Ivo Wolf, Andreas Dengel, and Sheraz Ahmed. Deepdesrt: Deep learning for detection and structure recognition of tables in document images. In 2017 14th IAPR international conference on document analysis and recognition (ICDAR) , volume 1, pages 1162-1167. IEEE, 2017. 3", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [50.112007, 520.70447, 286.36578, 561.59741], "page": 10, "span": [0, 183], "__ref_s3_data": null}], "text": "- [28] Faisal Shafait and Ray Smith. Table detection in heterogeneous documents. In Proceedings of the 9th IAPR International Workshop on Document Analysis Systems , pages 6572, 2010. 2", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [50.112007, 465.5455, 286.36627, 517.39642], "page": 10, "span": [0, 275], "__ref_s3_data": null}], "text": "- [29] Shoaib Ahmed Siddiqui, Imran Ali Fateh, Syed Tahseen Raza Rizvi, Andreas Dengel, and Sheraz Ahmed. Deeptabstr: Deep learning based table structure recognition. In 2019 International Conference on Document Analysis and Recognition (ICDAR) , pages 1403-1409. IEEE, 2019. 3", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [50.112007, 410.38553, 286.36334, 462.23746], "page": 10, "span": [0, 251], "__ref_s3_data": null}], "text": "- [30] Peter W J Staar, Michele Dolfi, Christoph Auer, and Costas Bekas. Corpus conversion service: A machine learning platform to ingest documents at scale. In Proceedings of the 24th ACM SIGKDD , KDD '18, pages 774-782, New York, NY, USA, 2018. ACM. 1", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [50.112007, 333.30856, 286.36389, 407.07748], "page": 10, "span": [0, 366], "__ref_s3_data": null}], "text": "- [31] Ashish Vaswani, Noam Shazeer, Niki Parmar, Jakob Uszkoreit, Llion Jones, Aidan N Gomez, \u0141 ukasz Kaiser, and Illia Polosukhin. Attention is all you need. In I. Guyon, U. V. Luxburg, S. Bengio, H. Wallach, R. Fergus, S. Vishwanathan, and R. Garnett, editors, Advances in Neural Information Processing Systems 30 , pages 5998-6008. Curran Associates, Inc., 2017. 5", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [50.112007, 289.10757, 286.36334, 330.00052], "page": 10, "span": [0, 221], "__ref_s3_data": null}], "text": "- [32] Oriol Vinyals, Alexander Toshev, Samy Bengio, and Dumitru Erhan. Show and tell: A neural image caption generator. In Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR) , June 2015. 2", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [50.112015, 244.90756, 286.36337, 285.79953], "page": 10, "span": [0, 217], "__ref_s3_data": null}], "text": "- [33] Wenyuan Xue, Qingyong Li, and Dacheng Tao. Res2tim: reconstruct syntactic structures from table images. In 2019 International Conference on Document Analysis and Recognition (ICDAR) , pages 749-755. IEEE, 2019. 3", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [50.112022, 200.70655999999997, 286.36337, 241.59951999999998], "page": 10, "span": [0, 190], "__ref_s3_data": null}], "text": "- [34] Wenyuan Xue, Baosheng Yu, Wen Wang, Dacheng Tao, and Qingyong Li. Tgrnet: A table graph reconstruction network for table structure recognition. arXiv preprint arXiv:2106.10598 , 2021. 3", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [50.11203, 156.50554999999997, 286.3634, 197.39851], "page": 10, "span": [0, 220], "__ref_s3_data": null}], "text": "- [35] Quanzeng You, Hailin Jin, Zhaowen Wang, Chen Fang, and Jiebo Luo. Image captioning with semantic attention. In Proceedings of the IEEE conference on computer vision and pattern recognition , pages 4651-4659, 2016. 4", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [50.112022, 101.34653000000003, 286.36337, 153.19750999999997], "page": 10, "span": [0, 280], "__ref_s3_data": null}], "text": "- [36] Xinyi Zheng, Doug Burdick, Lucian Popa, Peter Zhong, and Nancy Xin Ru Wang. Global table extractor (gte): A framework for joint table identification and cell structure recognition using visual context. Winter Conference for Applications in Computer Vision (WACV) , 2021. 2, 3", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [50.112015, 79.063538, 286.36334, 98.038498], "page": 10, "span": [0, 106], "__ref_s3_data": null}], "text": "- [37] Xu Zhong, Elaheh ShafieiBavani, and Antonio Jimeno Yepes. Image-based table recognition: Data, model,", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [328.78101, 675.22455, 545.11456, 716.11652], "page": 10, "span": [0, 192], "__ref_s3_data": null}], "text": "- and evaluation. In Andrea Vedaldi, Horst Bischof, Thomas Brox, and Jan-Michael Frahm, editors, Computer Vision ECCV 2020 , pages 564-580, Cham, 2020. Springer International Publishing. 2, 3, 7", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [308.862, 630.39258, 545.11334, 671.28552], "page": 10, "span": [0, 221], "__ref_s3_data": null}], "text": "- [38] Xu Zhong, Jianbin Tang, and Antonio Jimeno Yepes. Publaynet: Largest dataset ever for document layout analysis. In 2019 International Conference on Document Analysis and Recognition (ICDAR) , pages 1015-1022, 2019. 1", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [132.842, 656.46991, 465.37591999999995, 681.42511], "page": 11, "span": [0, 83], "__ref_s3_data": null}], "text": "TableFormer: Table Structure Understanding with Transformers Supplementary Material", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [50.111984, 620.09137, 175.96437, 630.83911], "page": 11, "span": [0, 26], "__ref_s3_data": null}], "text": "1. Details on the datasets", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [50.111984, 601.16864, 150.36401, 611.02069], "page": 11, "span": [0, 21], "__ref_s3_data": null}], "text": "1.1. Data preparation", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [50.111984, 403.84517999999997, 286.36514, 592.07971], "page": 11, "span": [0, 931], "__ref_s3_data": null}], "text": "As a first step of our data preparation process, we have calculated statistics over the datasets across the following dimensions: (1) table size measured in the number of rows and columns, (2) complexity of the table, (3) strictness of the provided HTML structure and (4) completeness (i.e. no omitted bounding boxes). A table is considered to be simple if it does not contain row spans or column spans. Additionally, a table has a strict HTML structure if every row has the same number of columns after taking into account any row or column spans. Therefore a strict HTML structure looks always rectangular. However, HTML is a lenient encoding format, i.e. tables with rows of different sizes might still be regarded as correct due to implicit display rules. These implicit rules leave room for ambiguity, which we want to avoid. As such, we prefer to have \"strict\" tables, i.e. tables where every row has exactly the same length.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [50.111984, 164.5403, 286.36511, 400.59473], "page": 11, "span": [0, 1149], "__ref_s3_data": null}], "text": "We have developed a technique that tries to derive a missing bounding box out of its neighbors. As a first step, we use the annotation data to generate the most fine-grained grid that covers the table structure. In case of strict HTML tables, all grid squares are associated with some table cell and in the presence of table spans a cell extends across multiple grid squares. When enough bounding boxes are known for a rectangular table, it is possible to compute the geometrical border lines between the grid rows and columns. Eventually this information is used to generate the missing bounding boxes. Additionally, the existence of unused grid squares indicates that the table rows have unequal number of columns and the overall structure is non-strict. The generation of missing bounding boxes for non-strict HTML tables is ambiguous and therefore quite challenging. Thus, we have decided to simply discard those tables. In case of PubTabNet we have computed missing bounding boxes for 48% of the simple and 69% of the complex tables. Regarding FinTabNet, 68% of the simple and 98% of the complex tables require the generation of bounding boxes.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [50.111984, 140.42731000000003, 286.36496, 161.28985999999998], "page": 11, "span": [0, 92], "__ref_s3_data": null}], "text": "Figure 7 illustrates the distribution of the tables across different dimensions per dataset.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [50.111984, 119.75780999999995, 153.60785, 129.60986000000003], "page": 11, "span": [0, 23], "__ref_s3_data": null}], "text": "1.2. Synthetic datasets", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [50.111984, 77.85229500000003, 286.36505, 110.66886999999997], "page": 11, "span": [0, 389], "__ref_s3_data": null}, {"bbox": [50.111984, 77.85229500000003, 286.36505, 110.66886999999997], "page": 11, "span": [0, 389], "__ref_s3_data": null}], "text": "Aiming to train and evaluate our models in a broader spectrum of table data we have synthesized four types of datasets. Each one contains tables with different appear- ances in regard to their size, structure, style and content. Every synthetic dataset contains 150k examples, summing up to 600k synthetic examples. All datasets are divided into Train, Test and Val splits (80%, 10%, 10%).", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [308.862, 559.90326, 545.11505, 580.76483], "page": 11, "span": [0, 89], "__ref_s3_data": null}], "text": "The process of generating a synthetic dataset can be decomposed into the following steps:", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [308.862, 475.45721, 545.11511, 556.09479], "page": 11, "span": [0, 373], "__ref_s3_data": null}], "text": "- 1. Prepare styling and content templates: The styling templates have been manually designed and organized into groups of scope specific appearances (e.g. financial data, marketing data, etc.) Additionally, we have prepared curated collections of content templates by extracting the most frequently used terms out of non-synthetic datasets (e.g. PubTabNet, FinTabNet, etc.).", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [308.862, 343.19135, 545.11517, 471.64978], "page": 11, "span": [0, 573], "__ref_s3_data": null}], "text": "- 2. Generate table structures: The structure of each synthetic dataset assumes a horizontal table header which potentially spans over multiple rows and a table body that may contain a combination of row spans and column spans. However, spans are not allowed to cross the header - body boundary. The table structure is described by the parameters: Total number of table rows and columns, number of header rows, type of spans (header only spans, row only spans, column only spans, both row and column spans), maximum span size and the ratio of the table area covered by spans.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [308.862, 294.61139, 545.11517, 339.38391], "page": 11, "span": [0, 195], "__ref_s3_data": null}], "text": "- 3. Generate content: Based on the dataset theme , a set of suitable content templates is chosen first. Then, this content can be combined with purely random text to produce the synthetic content.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [308.862, 246.03142000000003, 545.1153, 290.80396], "page": 11, "span": [0, 218], "__ref_s3_data": null}], "text": "- 4. Apply styling templates: Depending on the domain of the synthetic dataset, a set of styling templates is first manually selected. Then, a style is randomly selected to format the appearance of the synthesized table.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [308.862, 185.49640999999997, 545.11517, 242.22397], "page": 11, "span": [0, 238], "__ref_s3_data": null}], "text": "- 5. Render the complete tables: The synthetic table is finally rendered by a web browser engine to generate the bounding boxes for each table cell. A batching technique is utilized to optimize the runtime overhead of the rendering process.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [308.862, 145.01369, 545.10876, 169.70940999999993], "page": 11, "span": [0, 47], "__ref_s3_data": null}], "text": "2. Prediction post-processing for PDF documents", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [308.86203, 77.85139500000002, 545.11517, 134.57896000000005], "page": 11, "span": [0, 247], "__ref_s3_data": null}], "text": "Although TableFormer can predict the table structure and the bounding boxes for tables recognized inside PDF documents, this is not enough when a full reconstruction of the original table is required. This happens mainly due the following reasons:", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"name": "Picture", "type": "figure", "$ref": "#/figures/11"}, {"prov": [{"bbox": [61.569, 560.20703, 286.36511, 581.0686], "page": 12, "span": [0, 61], "__ref_s3_data": null}], "text": "- \u00b7 TableFormer output does not include the table cell content.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [61.569, 527.06702, 286.36514, 547.92859], "page": 12, "span": [0, 77], "__ref_s3_data": null}], "text": "- \u00b7 There are occasional inaccuracies in the predictions of the bounding boxes.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [308.862, 536.2962, 545.11517, 581.06879], "page": 12, "span": [0, 183], "__ref_s3_data": null}], "text": "dian cell size for all table cells. The usage of median during the computations, helps to eliminate outliers caused by occasional column spans which are usually wider than the normal.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [50.112, 396.29312, 286.36511, 512.79657], "page": 12, "span": [0, 545], "__ref_s3_data": null}], "text": "However, it is possible to mitigate those limitations by combining the TableFormer predictions with the information already present inside a programmatic PDF document. More specifically, PDF documents can be seen as a sequence of PDF cells where each cell is described by its content and bounding box. If we are able to associate the PDF cells with the predicted table cells, we can directly link the PDF cell content to the table cell structure and use the PDF bounding boxes to correct misalignments in the predicted table cell bounding boxes.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [50.112, 372.06812, 286.36496, 392.93066], "page": 12, "span": [0, 68], "__ref_s3_data": null}], "text": "Here is a step-by-step description of the prediction postprocessing:", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [50.112, 335.88814999999994, 286.36508, 368.70468], "page": 12, "span": [0, 173], "__ref_s3_data": null}], "text": "- 1. Get the minimal grid dimensions - number of rows and columns for the predicted table structure. This represents the most granular grid for the underlying table structure.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [50.112, 287.7532, 286.36505, 332.52472], "page": 12, "span": [0, 187], "__ref_s3_data": null}], "text": "- 2. Generate pair-wise matches between the bounding boxes of the PDF cells and the predicted cells. The Intersection Over Union (IOU) metric is used to evaluate the quality of the matches.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [50.112, 263.52721999999994, 286.36493, 284.38977], "page": 12, "span": [0, 97], "__ref_s3_data": null}], "text": "- 3. Use a carefully selected IOU threshold to designate the matches as \"good\" ones and \"bad\" ones.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [50.112, 227.34722999999997, 286.36511, 260.16479000000004], "page": 12, "span": [0, 131], "__ref_s3_data": null}], "text": "- 3.a. If all IOU scores in a column are below the threshold, discard all predictions (structure and bounding boxes) for that column.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [50.112, 191.16722000000004, 286.36508, 223.98378000000002], "page": 12, "span": [0, 169], "__ref_s3_data": null}], "text": "- 4. Find the best-fitting content alignment for the predicted cells with good IOU per each column. The alignment of the column can be identified by the following formula:", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [110.70499, 137.89438999999993, 286.3624, 168.56408999999996], "page": 12, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "equation", "payload": null, "name": "Formula", "font": null}, {"prov": [{"bbox": [50.112, 103.07321000000002, 286.362, 124.65208000000007], "page": 12, "span": [0, 103], "__ref_s3_data": null}], "text": "where c is one of { left, centroid, right } and x$_{c}$ is the xcoordinate for the corresponding point.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [50.112, 78.84821299999999, 286.36496, 99.70977800000003], "page": 12, "span": [0, 110], "__ref_s3_data": null}], "text": "- 5. Use the alignment computed in step 4, to compute the median x -coordinate for all table columns and the me-", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [308.862, 512.03619, 545.11499, 532.89777], "page": 12, "span": [0, 91], "__ref_s3_data": null}], "text": "- 6. Snap all cells with bad IOU to their corresponding median x -coordinates and cell sizes.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [308.86203, 404.08929, 545.11511, 508.63674999999995], "page": 12, "span": [0, 471], "__ref_s3_data": null}], "text": "- 7. Generate a new set of pair-wise matches between the corrected bounding boxes and PDF cells. This time use a modified version of the IOU metric, where the area of the intersection between the predicted and PDF cells is divided by the PDF cell area. In case there are multiple matches for the same PDF cell, the prediction with the higher score is preferred. This covers the cases where the PDF cells are smaller than the area of predicted or corrected prediction cells.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [308.86203, 332.00836, 545.11517, 400.68985], "page": 12, "span": [0, 311], "__ref_s3_data": null}], "text": "- 8. In some rare occasions, we have noticed that TableFormer can confuse a single column as two. When the postprocessing steps are applied, this results with two predicted columns pointing to the same PDF column. In such case we must de-duplicate the columns according to highest total column intersection score.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [308.86203, 224.06142, 545.11517, 328.60892], "page": 12, "span": [0, 503], "__ref_s3_data": null}], "text": "- 9. Pick up the remaining orphan cells. There could be cases, when after applying all the previous post-processing steps, some PDF cells could still remain without any match to predicted cells. However, it is still possible to deduce the correct matching for an orphan PDF cell by mapping its bounding box on the geometry of the grid. This mapping decides if the content of the orphan cell will be appended to an already matched table cell, or a new table cell should be created to match with the orphan.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [308.86203, 187.84541000000002, 545.11688, 220.66197], "page": 12, "span": [0, 113], "__ref_s3_data": null}], "text": "9a. Compute the top and bottom boundary of the horizontal band for each grid row (min/max y coordinates per row).", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [308.86206, 163.58440999999993, 545.11505, 184.44696], "page": 12, "span": [0, 101], "__ref_s3_data": null}], "text": "- 9b. Intersect the orphan's bounding box with the row bands, and map the cell to the closest grid row.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [308.86206, 127.36941000000002, 545.11505, 160.18597], "page": 12, "span": [0, 117], "__ref_s3_data": null}], "text": "- 9c. Compute the left and right boundary of the vertical band for each grid column (min/max x coordinates per column).", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [308.86206, 103.10841000000005, 545.11499, 123.96996999999999], "page": 12, "span": [0, 107], "__ref_s3_data": null}], "text": "- 9d. Intersect the orphan's bounding box with the column bands, and map the cell to the closest grid column.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [308.86206, 78.84840399999996, 545.11517, 99.70997599999998], "page": 12, "span": [0, 118], "__ref_s3_data": null}], "text": "- 9e. If the table cell under the identified row and column is not empty, extend its content with the content of the or-", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [50.112, 707.88507, 88.846588, 716.79163], "page": 13, "span": [0, 10], "__ref_s3_data": null}], "text": "phan cell.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [50.112, 683.9750400000001, 286.36496, 704.83661], "page": 13, "span": [0, 76], "__ref_s3_data": null}], "text": "9f. Otherwise create a new structural cell and match it wit the orphan cell.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [50.112, 660.29413, 286.36499, 680.83691], "page": 13, "span": [0, 97], "__ref_s3_data": null}], "text": "Aditional images with examples of TableFormer predictions and post-processing can be found below.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"name": "Table", "type": "table", "$ref": "#/tables/8"}, {"name": "Table", "type": "table", "$ref": "#/tables/9"}, {"name": "Table", "type": "table", "$ref": "#/tables/10"}, {"name": "Table", "type": "table", "$ref": "#/tables/11"}, {"prov": [{"bbox": [63.341, 281.03708, 273.13342, 289.94363], "page": 13, "span": [0, 52], "__ref_s3_data": null}], "text": "Figure 8: Example of a table with multi-line header.", "type": "caption", "payload": null, "name": "Caption", "font": null}, {"name": "Table", "type": "table", "$ref": "#/tables/12"}, {"prov": [{"bbox": [308.862, 464.54009999999994, 545.11511, 485.40164], "page": 13, "span": [0, 67], "__ref_s3_data": null}], "text": "Figure 9: Example of a table with big empty distance between cells.", "type": "caption", "payload": null, "name": "Caption", "font": null}, {"name": "Table", "type": "table", "$ref": "#/tables/13"}, {"name": "Table", "type": "table", "$ref": "#/tables/14"}, {"name": "Picture", "type": "figure", "$ref": "#/figures/12"}, {"name": "Table", "type": "table", "$ref": "#/tables/15"}, {"name": "Table", "type": "table", "$ref": "#/tables/16"}, {"prov": [{"bbox": [312.34299, 102.60006999999996, 541.63232, 111.50664000000006], "page": 13, "span": [0, 55], "__ref_s3_data": null}], "text": "Figure 10: Example of a complex table with empty cells.", "type": "caption", "payload": null, "name": "Caption", "font": null}, {"name": "Table", "type": "table", "$ref": "#/tables/17"}, {"name": "Table", "type": "table", "$ref": "#/tables/18"}, {"name": "Picture", "type": "figure", "$ref": "#/figures/13"}, {"name": "Table", "type": "table", "$ref": "#/tables/19"}, {"name": "Table", "type": "table", "$ref": "#/tables/20"}, {"name": "Picture", "type": "figure", "$ref": "#/figures/14"}, {"prov": [{"bbox": [50.112, 414.3681, 286.36508, 435.22964], "page": 14, "span": [0, 61], "__ref_s3_data": null}], "text": "Figure 11: Simple table with different style and empty cells.", "type": "caption", "payload": null, "name": "Caption", "font": null}, {"name": "Table", "type": "table", "$ref": "#/tables/21"}, {"name": "Table", "type": "table", "$ref": "#/tables/22"}, {"name": "Table", "type": "table", "$ref": "#/tables/23"}, {"name": "Picture", "type": "figure", "$ref": "#/figures/15"}, {"prov": [{"bbox": [54.618998999999995, 111.27508, 281.8559, 120.18164000000002], "page": 14, "span": [0, 56], "__ref_s3_data": null}], "text": "Figure 12: Simple table predictions and post processing.", "type": "caption", "payload": null, "name": "Caption", "font": null}, {"name": "Table", "type": "table", "$ref": "#/tables/24"}, {"name": "Table", "type": "table", "$ref": "#/tables/25"}, {"name": "Table", "type": "table", "$ref": "#/tables/26"}, {"name": "Picture", "type": "figure", "$ref": "#/figures/16"}, {"name": "Table", "type": "table", "$ref": "#/tables/27"}, {"prov": [{"bbox": [344.98499, 99.54707299999995, 508.98935000000006, 108.45363999999995], "page": 14, "span": [0, 40], "__ref_s3_data": null}], "text": "Figure 14: Example with multi-line text.", "type": "caption", "payload": null, "name": "Caption", "font": null}, {"name": "Table", "type": "table", "$ref": "#/tables/28"}, {"name": "Table", "type": "table", "$ref": "#/tables/29"}, {"name": "Table", "type": "table", "$ref": "#/tables/30"}, {"name": "Picture", "type": "figure", "$ref": "#/figures/17"}, {"name": "Table", "type": "table", "$ref": "#/tables/31"}, {"name": "Picture", "type": "figure", "$ref": "#/figures/18"}, {"name": "Table", "type": "table", "$ref": "#/tables/32"}, {"name": "Picture", "type": "figure", "$ref": "#/figures/19"}, {"name": "Picture", "type": "figure", "$ref": "#/figures/20"}, {"name": "Table", "type": "table", "$ref": "#/tables/33"}, {"prov": [{"bbox": [84.233002, 138.74207, 252.24225, 147.64861999999994], "page": 15, "span": [0, 41], "__ref_s3_data": null}], "text": "Figure 15: Example with triangular table.", "type": "caption", "payload": null, "name": "Caption", "font": null}, {"name": "Table", "type": "table", "$ref": "#/tables/34"}, {"name": "Picture", "type": "figure", "$ref": "#/figures/21"}, {"name": "Table", "type": "table", "$ref": "#/tables/35"}, {"name": "Picture", "type": "figure", "$ref": "#/figures/22"}, {"name": "Table", "type": "table", "$ref": "#/tables/36"}, {"name": "Table", "type": "table", "$ref": "#/tables/37"}, {"prov": [{"bbox": [308.86197, 118.20308999999997, 545.11511, 139.06465000000003], "page": 15, "span": [0, 106], "__ref_s3_data": null}], "text": "Figure 16: Example of how post-processing helps to restore mis-aligned bounding boxes prediction artifact.", "type": "caption", "payload": null, "name": "Caption", "font": null}, {"name": "Picture", "type": "figure", "$ref": "#/figures/23"}], "figures": [{"prov": [{"bbox": [315.65362548828125, 489.1985778808594, 537.1475219726562, 563.276611328125], "page": 1, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "figure", "payload": null, "bounding-box": null}, {"prov": [{"bbox": [314.78173828125, 381.9505615234375, 539.1802978515625, 453.9347229003906], "page": 1, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "figure", "payload": null, "bounding-box": null}, {"prov": [{"bbox": [315.7172546386719, 295.9709777832031, 536.835693359375, 358.176513671875], "page": 1, "span": [0, 220], "__ref_s3_data": null}], "text": "Figure 1: Picture of a table with subtle, complex features such as (1) multi-column headers, (2) cell with multi-row text and (3) cells with no content. Image from PubTabNet evaluation set, filename: 'PMC2944238 004 02'.", "type": "figure", "payload": null, "bounding-box": null}, {"prov": [{"bbox": [312.10369873046875, 541.3901519775391, 550.38916015625, 713.5591354370117], "page": 3, "span": [0, 104], "__ref_s3_data": null}], "text": "Figure 2: Distribution of the tables across different table dimensions in PubTabNet + FinTabNet datasets", "type": "figure", "payload": null, "bounding-box": null}, {"prov": [{"bbox": [74.30525970458984, 608.2984924316406, 519.9801025390625, 714.0887985229492], "page": 5, "span": [0, 212], "__ref_s3_data": null}], "text": "Figure 3: TableFormer takes in an image of the PDF and creates bounding box and HTML structure predictions that are synchronized. The bounding boxes grabs the content from the PDF and inserts it in the structure.", "type": "figure", "payload": null, "bounding-box": null}, {"prov": [{"bbox": [53.03328323364258, 284.3311462402344, 285.3731689453125, 534.3346557617188], "page": 5, "span": [0, 745], "__ref_s3_data": null}], "text": "Figure 4: Given an input image of a table, the Encoder produces fixed-length features that represent the input image. The features are then passed to both the Structure Decoder and Cell BBox Decoder . During training, the Structure Decoder receives 'tokenized tags' of the HTML code that represent the table structure. Afterwards, a transformer encoder and decoder architecture is employed to produce features that are received by a linear layer, and the Cell BBox Decoder. The linear layer is applied to the features to predict the tags. Simultaneously, the Cell BBox Decoder selects features referring to the data cells (' < td > ', ' < ') and passes them through an attention network, an MLP, and a linear layer to predict the bounding boxes.", "type": "figure", "payload": null, "bounding-box": null}, {"prov": [{"bbox": [49.97503662109375, 604.4210662841797, 301.6335754394531, 688.2873382568359], "page": 8, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "figure", "payload": null, "bounding-box": null}, {"prov": [{"bbox": [305.5836486816406, 611.3732452392578, 554.8258666992188, 693.3458404541016], "page": 8, "span": [0, 79], "__ref_s3_data": null}], "text": "b. Structure predicted by TableFormer, with superimposed matched PDF cell text:", "type": "figure", "payload": null, "bounding-box": null}, {"prov": [{"bbox": [51.736167907714844, 348.3419189453125, 211.83778381347656, 411.51934814453125], "page": 8, "span": [0, 112], "__ref_s3_data": null}], "text": "Figure 6: An example of TableFormer predictions (bounding boxes and structure) from generated SynthTabNet table.", "type": "figure", "payload": null, "bounding-box": null}, {"prov": [{"bbox": [216.76925659179688, 348.65301513671875, 375.7829284667969, 411.5093688964844], "page": 8, "span": [0, 397], "__ref_s3_data": null}], "text": "Figure 5: One of the benefits of TableFormer is that it is language agnostic, as an example, the left part of the illustration demonstrates TableFormer predictions on previously unseen language (Japanese). Additionally, we see that TableFormer is robust to variability in style and content, right side of the illustration shows the example of the TableFormer prediction from the FinTabNet dataset.", "type": "figure", "payload": null, "bounding-box": null}, {"prov": [{"bbox": [383.1364440917969, 349.2250671386719, 542.1132202148438, 410.7686767578125], "page": 8, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "figure", "payload": null, "bounding-box": null}, {"prov": [{"bbox": [53.54227066040039, 644.4090881347656, 544.938232421875, 717.2514572143555], "page": 12, "span": [0, 245], "__ref_s3_data": null}], "text": "Figure 7: Distribution of the tables across different dimensions per dataset. Simple vs complex tables per dataset and split, strict vs non strict html structures per dataset and table complexity, missing bboxes per dataset and table complexity.", "type": "figure", "payload": null, "bounding-box": null}, {"prov": [{"bbox": [309.79150390625, 499.60601806640625, 425.9603271484375, 538.0946350097656], "page": 13, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "figure", "payload": null, "bounding-box": null}, {"prov": [{"bbox": [333.9573669433594, 126.5096435546875, 518.4768676757812, 198.8865966796875], "page": 13, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "figure", "payload": null, "bounding-box": null}, {"prov": [{"bbox": [51.15378952026367, 447.09332275390625, 282.8598937988281, 687.6914825439453], "page": 14, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "figure", "payload": null, "bounding-box": null}, {"prov": [{"bbox": [50.40477752685547, 135.83905029296875, 177.0564422607422, 180.99615478515625], "page": 14, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "figure", "payload": null, "bounding-box": null}, {"prov": [{"bbox": [318.6332092285156, 432.9424133300781, 534.73583984375, 701.1157684326172], "page": 14, "span": [0, 55], "__ref_s3_data": null}], "text": "Figure 13: Table predictions example on colorful table.", "type": "figure", "payload": null, "bounding-box": null}, {"prov": [{"bbox": [55.116363525390625, 542.6654510498047, 279.370849609375, 655.7449951171875], "page": 15, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "figure", "payload": null, "bounding-box": null}, {"prov": [{"bbox": [54.28135299682617, 418.4729309082031, 279.2568359375, 531.7384338378906], "page": 15, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "figure", "payload": null, "bounding-box": null}, {"prov": [{"bbox": [55.423954010009766, 294.436279296875, 280.2310791015625, 407.4449462890625], "page": 15, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "figure", "payload": null, "bounding-box": null}, {"prov": [{"bbox": [50.64818572998047, 160.736328125, 319.9103088378906, 286.01953125], "page": 15, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "figure", "payload": null, "bounding-box": null}, {"prov": [{"bbox": [323.46868896484375, 327.739501953125, 525.9569091796875, 429.5491638183594], "page": 15, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "figure", "payload": null, "bounding-box": null}, {"prov": [{"bbox": [353.6920471191406, 156.22674560546875, 495.4288024902344, 304.594970703125], "page": 15, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "figure", "payload": null, "bounding-box": null}, {"prov": [{"bbox": [66.79948425292969, 293.8616027832031, 528.5565795898438, 538.3836822509766], "page": 16, "span": [0, 153], "__ref_s3_data": null}], "text": "Figure 17: Example of long table. End-to-end example from initial PDF cells to prediction of bounding boxes, post processing and prediction of structure.", "type": "figure", "payload": null, "bounding-box": null}], "tables": [{"prov": [{"bbox": [315.65362548828125, 489.1985778808594, 537.1475219726562, 563.276611328125], "page": 1, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "table", "payload": null, "#-cols": 2, "#-rows": 1, "data": [[{"bbox": [384.0329, 252.67895999999996, 390.03769, 262.80939], "spans": [[0, 0]], "text": "3", "type": "col_header", "col": 0, "col-header": true, "col-span": [0, 1], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [451.9457100000001, 235.34704999999997, 457.95050000000003, 245.47748], "spans": [[0, 1]], "text": "1", "type": "col_header", "col": 1, "col-header": true, "col-span": [1, 2], "row": 0, "row-header": false, "row-span": [0, 1]}]], "model": null, "bounding-box": null}, {"prov": [{"bbox": [315.7172546386719, 295.9709777832031, 536.835693359375, 358.176513671875], "page": 1, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "table", "payload": null, "#-cols": 6, "#-rows": 5, "data": [[{"bbox": [318.88071, 437.68588, 323.27319, 446.47083], "spans": [[0, 0]], "text": "0", "type": "col_header", "col": 0, "col-header": true, "col-span": [0, 1], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [347.24872, 437.68588, 351.6412, 446.47083], "spans": [[0, 1], [0, 2]], "text": "1", "type": "col_header", "col": 1, "col-header": true, "col-span": [1, 3], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [347.24872, 437.68588, 351.6412, 446.47083], "spans": [[0, 1], [0, 2]], "text": "1", "type": "col_header", "col": 2, "col-header": true, "col-span": [1, 3], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [394.10422, 437.5936, 465.88101, 447.724], "spans": [[0, 3], [0, 4]], "text": "2 1", "type": "col_header", "col": 3, "col-header": true, "col-span": [3, 5], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [394.10422, 437.5936, 465.88101, 447.724], "spans": [[0, 3], [0, 4]], "text": "2 1", "type": "col_header", "col": 4, "col-header": true, "col-span": [3, 5], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": null, "spans": [[0, 5]], "text": "", "type": "body"}], [{"bbox": [318.77316, 449.5455, 323.16565, 458.33044], "spans": [[1, 0]], "text": "3", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [347.24872, 449.5455, 351.6412, 458.33044], "spans": [[1, 1]], "text": "4", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [366.70102, 449.12082, 398.4967, 459.25122], "spans": [[1, 2]], "text": "5 3", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [440.95941000000005, 449.5455, 445.3519, 458.33044], "spans": [[1, 3]], "text": "6", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [487.81491, 449.5455, 492.2074, 458.33044], "spans": [[1, 4]], "text": "7", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": null, "spans": [[1, 5]], "text": "", "type": "body"}], [{"bbox": [318.77316, 473.70425, 323.16565, 482.4892], "spans": [[2, 0]], "text": "8", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [347.24872, 461.8446, 351.6412, 470.62955], "spans": [[2, 1]], "text": "9", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [394.10422, 461.8446, 402.88831, 470.62955], "spans": [[2, 2]], "text": "10", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [440.95941000000005, 461.8446, 449.42285, 470.62955], "spans": [[2, 3]], "text": "11", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [487.81491, 461.8446, 496.599, 470.62955], "spans": [[2, 4]], "text": "12", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [331.90424, 473.32291, 337.90903, 483.45331], "spans": [[2, 5], [3, 5], [4, 5]], "text": "2", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 2, "row-header": false, "row-span": [2, 5]}], [{"bbox": null, "spans": [[3, 0]], "text": "", "type": "body"}, {"bbox": [347.24872, 473.70425, 356.03281, 482.4892], "spans": [[3, 1]], "text": "13", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [394.10422, 473.70425, 402.88831, 482.4892], "spans": [[3, 2]], "text": "14", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [440.95941000000005, 473.70425, 449.7435, 482.4892], "spans": [[3, 3]], "text": "15", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [487.81491, 473.70425, 496.599, 482.4892], "spans": [[3, 4]], "text": "16", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [331.90424, 473.32291, 337.90903, 483.45331], "spans": [[2, 5], [3, 5], [4, 5]], "text": "2", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 3, "row-header": false, "row-span": [2, 5]}], [{"bbox": null, "spans": [[4, 0]], "text": "", "type": "body"}, {"bbox": [347.24872, 485.12469, 356.03281, 493.90964], "spans": [[4, 1]], "text": "17", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [394.10422, 485.12469, 402.88831, 493.90964], "spans": [[4, 2]], "text": "18", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [440.95941000000005, 485.12469, 449.7435, 493.90964], "spans": [[4, 3]], "text": "19", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [487.81491, 485.12469, 496.599, 493.90964], "spans": [[4, 4]], "text": "20", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [331.90424, 473.32291, 337.90903, 483.45331], "spans": [[2, 5], [3, 5], [4, 5]], "text": "2", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 4, "row-header": false, "row-span": [2, 5]}]], "model": null, "bounding-box": null}, {"prov": [{"bbox": [310.67584228515625, 636.7794799804688, 542.9547119140625, 718.8061141967773], "page": 4, "span": [0, 0], "__ref_s3_data": null}], "text": "Table 1: Both \"Combined-Tabnet\" and \"CombinedTabnet\" are variations of the following: (*) The CombinedTabnet dataset is the processed combination of PubTabNet and Fintabnet. (**) The combined dataset is the processed combination of PubTabNet, Fintabnet and TableBank.", "type": "table", "payload": null, "#-cols": 5, "#-rows": 7, "data": [[{"bbox": null, "spans": [[0, 0]], "text": "", "type": "body"}, {"bbox": [412.332, 73.61437999999998, 430.90231, 82.52094], "spans": [[0, 1]], "text": "Tags", "type": "col_header", "col": 1, "col-header": true, "col-span": [1, 2], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [442.85742, 73.61437999999998, 464.4463799999999, 82.52094], "spans": [[0, 2]], "text": "Bbox", "type": "col_header", "col": 2, "col-header": true, "col-span": [2, 3], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [477.78632, 73.61437999999998, 494.94193, 82.52094], "spans": [[0, 3]], "text": "Size", "type": "col_header", "col": 3, "col-header": true, "col-span": [3, 4], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [508.28186, 73.61437999999998, 536.91437, 82.52094], "spans": [[0, 4]], "text": "Format", "type": "col_header", "col": 4, "col-header": true, "col-span": [4, 5], "row": 0, "row-header": false, "row-span": [0, 1]}], [{"bbox": [317.06, 85.9673499999999, 361.64264, 94.87390000000005], "spans": [[1, 0]], "text": "PubTabNet", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 1, "row-header": true, "row-span": [1, 2]}, {"bbox": [417.85599, 85.6684600000001, 425.37775, 94.88385000000017], "spans": [[1, 1]], "text": "3", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [449.89569, 85.6684600000001, 457.41745000000003, 94.88385000000017], "spans": [[1, 2]], "text": "3", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [476.401, 85.9673499999999, 496.3262, 94.87390000000005], "spans": [[1, 3]], "text": "509k", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [512.63495, 85.9673499999999, 532.56012, 94.87390000000005], "spans": [[1, 4]], "text": "PNG", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 1, "row-header": false, "row-span": [1, 2]}], [{"bbox": [317.06, 97.92236000000003, 359.43094, 106.82892000000004], "spans": [[2, 0]], "text": "FinTabNet", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 2, "row-header": true, "row-span": [2, 3]}, {"bbox": [417.85599, 97.62347, 425.37775, 106.83887000000016], "spans": [[2, 1]], "text": "3", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [449.89569, 97.62347, 457.41745000000003, 106.83887000000016], "spans": [[2, 2]], "text": "3", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [476.401, 97.92236000000003, 496.3262, 106.82892000000004], "spans": [[2, 3]], "text": "112k", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [513.46185, 97.92236000000003, 531.73328, 106.82892000000004], "spans": [[2, 4]], "text": "PDF", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 2, "row-header": false, "row-span": [2, 3]}], [{"bbox": [317.06, 109.87836000000004, 359.97888, 118.78490999999997], "spans": [[3, 0]], "text": "TableBank", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 3, "row-header": true, "row-span": [3, 4]}, {"bbox": [417.85599, 109.57947000000001, 425.37775, 118.79485999999997], "spans": [[3, 1]], "text": "3", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [450.81226, 109.57947000000001, 456.50091999999995, 118.79485999999997], "spans": [[3, 2]], "text": "7", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [476.401, 109.87836000000004, 496.3262, 118.78490999999997], "spans": [[3, 3]], "text": "145k", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [511.25017999999994, 109.87836000000004, 533.94501, 118.78490999999997], "spans": [[3, 4]], "text": "JPEG", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 3, "row-header": false, "row-span": [3, 4]}], [{"bbox": [317.06, 121.83336999999995, 400.37723, 130.73992999999996], "spans": [[4, 0]], "text": "Combined-Tabnet(*)", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 4, "row-header": true, "row-span": [4, 5]}, {"bbox": [417.85599, 121.53448000000003, 425.37775, 130.74987999999996], "spans": [[4, 1]], "text": "3", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [449.89569, 121.53448000000003, 457.41745000000003, 130.74987999999996], "spans": [[4, 2]], "text": "3", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [476.401, 121.83336999999995, 496.3262, 130.73992999999996], "spans": [[4, 3]], "text": "400k", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [512.63495, 121.83336999999995, 532.56012, 130.73992999999996], "spans": [[4, 4]], "text": "PNG", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 4, "row-header": false, "row-span": [4, 5]}], [{"bbox": [317.06, 133.78839000000005, 375.17184, 142.69494999999995], "spans": [[5, 0]], "text": "Combined(**)", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 5, "row-header": true, "row-span": [5, 6]}, {"bbox": [417.85599, 133.48950000000002, 425.37775, 142.70489999999995], "spans": [[5, 1]], "text": "3", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [449.89569, 133.48950000000002, 457.41745000000003, 142.70489999999995], "spans": [[5, 2]], "text": "3", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [476.401, 133.78839000000005, 496.3262, 142.69494999999995], "spans": [[5, 3]], "text": "500k", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [512.63495, 133.78839000000005, 532.56012, 142.69494999999995], "spans": [[5, 4]], "text": "PNG", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 5, "row-header": false, "row-span": [5, 6]}], [{"bbox": [317.06, 145.74341000000004, 369.39352, 154.64995999999996], "spans": [[6, 0]], "text": "SynthTabNet", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 6, "row-header": true, "row-span": [6, 7]}, {"bbox": [417.85599, 145.44446000000005, 425.37775, 154.65985], "spans": [[6, 1]], "text": "3", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [449.89569, 145.44446000000005, 457.41745000000003, 154.65985], "spans": [[6, 2]], "text": "3", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [476.401, 145.74334999999996, 496.3262, 154.6499], "spans": [[6, 3]], "text": "600k", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [512.63495, 145.74334999999996, 532.56012, 154.6499], "spans": [[6, 4]], "text": "PNG", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 6, "row-header": false, "row-span": [6, 7]}]], "model": null, "bounding-box": null}, {"prov": [{"bbox": [53.368526458740234, 209.60223388671875, 283.0443420410156, 382.8642272949219], "page": 7, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "table", "payload": null, "#-cols": 5, "#-rows": 11, "data": [[{"bbox": [78.843002, 420.69037, 104.85535, 429.59692], "spans": [[0, 0]], "text": "Model", "type": "col_header", "col": 0, "col-header": true, "col-span": [0, 1], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [129.338, 426.66736, 159.21584, 435.57391000000007], "spans": [[0, 1]], "text": "Dataset", "type": "col_header", "col": 1, "col-header": true, "col-span": [1, 2], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [171.17096, 426.66736, 199.40497, 435.57391000000007], "spans": [[0, 2]], "text": "Simple", "type": "col_header", "col": 2, "col-header": true, "col-span": [2, 3], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [211.2, 414.71237, 247.74349999999998, 435.57391000000007], "spans": [[0, 3]], "text": "TEDS Complex", "type": "col_header", "col": 3, "col-header": true, "col-span": [3, 4], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [264.54044, 426.66736, 277.27264, 435.57391000000007], "spans": [[0, 4]], "text": "All", "type": "col_header", "col": 4, "col-header": true, "col-span": [4, 5], "row": 0, "row-header": false, "row-span": [0, 1]}], [{"bbox": [81.612, 443.62436, 102.08514, 452.53091], "spans": [[1, 0]], "text": "EDD", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 1, "row-header": true, "row-span": [1, 2]}, {"bbox": [134.87206, 443.62436, 153.69141, 452.53091], "spans": [[1, 1]], "text": "PTN", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [176.56554, 443.62436, 194.00009, 452.53091], "spans": [[1, 2]], "text": "91.1", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [220.82938000000001, 443.62436, 238.26393, 452.53091], "spans": [[1, 3]], "text": "88.7", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [262.18414, 443.62436, 279.61868, 452.53091], "spans": [[1, 4]], "text": "89.9", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 1, "row-header": false, "row-span": [1, 2]}], [{"bbox": [82.165001, 455.58035, 101.5323, 464.48691], "spans": [[2, 0]], "text": "GTE", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 2, "row-header": true, "row-span": [2, 3]}, {"bbox": [134.86716, 455.58035, 153.68651, 464.48691], "spans": [[2, 1]], "text": "PTN", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [183.62411, 455.58035, 186.94167, 464.48691], "spans": [[2, 2]], "text": "-", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [227.88795000000002, 455.58035, 231.20551, 464.48691], "spans": [[2, 3]], "text": "-", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [259.69855, 455.58035, 282.11441, 464.48691], "spans": [[2, 4]], "text": "93.01", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 2, "row-header": false, "row-span": [2, 3]}], [{"bbox": [66.315002, 468.13336, 117.38329000000002, 477.03992], "spans": [[3, 0]], "text": "TableFormer", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 3, "row-header": true, "row-span": [3, 4]}, {"bbox": [134.86766, 468.13336, 153.68701, 477.03992], "spans": [[3, 1]], "text": "PTN", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [176.57111, 468.13336, 194.00566, 477.03992], "spans": [[3, 2]], "text": "98.5", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [220.83495, 468.13336, 238.26950000000002, 477.03992], "spans": [[3, 3]], "text": "95.0", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [259.698, 468.01379, 282.11386, 476.97018], "spans": [[3, 4]], "text": "96.75", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 3, "row-header": false, "row-span": [3, 4]}], [{"bbox": [81.612, 483.32635, 102.08514, 492.23291], "spans": [[4, 0]], "text": "EDD", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 4, "row-header": true, "row-span": [4, 5]}, {"bbox": [134.87206, 483.32635, 153.69141, 492.23291], "spans": [[4, 1]], "text": "FTN", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [176.56554, 483.32635, 194.00009, 492.23291], "spans": [[4, 2]], "text": "88.4", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [218.33870999999996, 483.32635, 240.75455999999997, 492.23291], "spans": [[4, 3]], "text": "92.08", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [262.18411, 483.32635, 279.61865, 492.23291], "spans": [[4, 4]], "text": "90.6", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 4, "row-header": false, "row-span": [4, 5]}], [{"bbox": [82.165001, 495.28134, 101.5323, 504.1879], "spans": [[5, 0]], "text": "GTE", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 5, "row-header": true, "row-span": [5, 6]}, {"bbox": [134.86716, 495.28134, 153.68651, 504.1879], "spans": [[5, 1]], "text": "FTN", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [183.62411, 495.28134, 186.94167, 504.1879], "spans": [[5, 2]], "text": "-", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [227.88795000000002, 495.28134, 231.20551, 504.1879], "spans": [[5, 3]], "text": "-", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [259.69855, 495.28134, 282.11441, 504.1879], "spans": [[5, 4]], "text": "87.14", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 5, "row-header": false, "row-span": [5, 6]}], [{"bbox": [71.789001, 507.23633, 111.90838999999998, 516.14288], "spans": [[6, 0]], "text": "GTE (FT)", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 6, "row-header": true, "row-span": [6, 7]}, {"bbox": [134.86221, 507.23633, 153.68156, 516.14288], "spans": [[6, 1]], "text": "FTN", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [183.62914, 507.23633, 186.94669, 516.14288], "spans": [[6, 2]], "text": "-", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [227.89297, 507.23633, 231.21053000000003, 516.14288], "spans": [[6, 3]], "text": "-", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [259.6936, 507.23633, 282.10947, 516.14288], "spans": [[6, 4]], "text": "91.02", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 6, "row-header": false, "row-span": [6, 7]}], [{"bbox": [66.315002, 519.1913099999999, 117.38329000000002, 528.0978700000001], "spans": [[7, 0]], "text": "TableFormer", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 7, "row-header": true, "row-span": [7, 8]}, {"bbox": [134.86766, 519.1913099999999, 153.68701, 528.0978700000001], "spans": [[7, 1]], "text": "FTN", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 7, "row-header": false, "row-span": [7, 8]}, {"bbox": [176.57111, 519.1913099999999, 194.00566, 528.0978700000001], "spans": [[7, 2]], "text": "97.5", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 7, "row-header": false, "row-span": [7, 8]}, {"bbox": [220.83495, 519.1913099999999, 238.26950000000002, 528.0978700000001], "spans": [[7, 3]], "text": "96.0", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 7, "row-header": false, "row-span": [7, 8]}, {"bbox": [262.189, 519.0717500000001, 279.62354, 528.02814], "spans": [[7, 4]], "text": "96.8", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 7, "row-header": false, "row-span": [7, 8]}], [{"bbox": [81.612, 536.49837, 102.08514, 545.40492], "spans": [[8, 0]], "text": "EDD", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 8, "row-header": true, "row-span": [8, 9]}, {"bbox": [137.91064, 536.49837, 150.64285, 545.40492], "spans": [[8, 1]], "text": "TB", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 8, "row-header": false, "row-span": [8, 9]}, {"bbox": [176.56554, 536.49837, 194.00009, 545.40492], "spans": [[8, 2]], "text": "86.0", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 8, "row-header": false, "row-span": [8, 9]}, {"bbox": [227.89285, 536.49837, 231.21040000000002, 545.40492], "spans": [[8, 3]], "text": "-", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 8, "row-header": false, "row-span": [8, 9]}, {"bbox": [262.18411, 536.49837, 279.61865, 545.40492], "spans": [[8, 4]], "text": "86.0", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 8, "row-header": false, "row-span": [8, 9]}], [{"bbox": [66.315002, 548.45436, 117.38329000000002, 557.36092], "spans": [[9, 0]], "text": "TableFormer", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 9, "row-header": true, "row-span": [9, 10]}, {"bbox": [137.90625, 548.45436, 150.63846, 557.36092], "spans": [[9, 1]], "text": "TB", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 9, "row-header": false, "row-span": [9, 10]}, {"bbox": [176.57111, 548.45436, 194.00566, 557.36092], "spans": [[9, 2]], "text": "89.6", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 9, "row-header": false, "row-span": [9, 10]}, {"bbox": [227.88845999999998, 548.45436, 231.20601, 557.36092], "spans": [[9, 3]], "text": "-", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 9, "row-header": false, "row-span": [9, 10]}, {"bbox": [262.189, 548.3348100000001, 279.62354, 557.2911799999999], "spans": [[9, 4]], "text": "89.6", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 9, "row-header": false, "row-span": [9, 10]}], [{"bbox": [66.315002, 568.00237, 117.38329000000002, 576.90892], "spans": [[10, 0]], "text": "TableFormer", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 10, "row-header": true, "row-span": [10, 11]}, {"bbox": [134.86766, 568.00237, 153.68701, 576.90892], "spans": [[10, 1]], "text": "STN", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 10, "row-header": false, "row-span": [10, 11]}, {"bbox": [176.57111, 568.00237, 194.00566, 576.90892], "spans": [[10, 2]], "text": "96.9", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 10, "row-header": false, "row-span": [10, 11]}, {"bbox": [220.83495, 568.00237, 238.26950000000002, 576.90892], "spans": [[10, 3]], "text": "95.7", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 10, "row-header": false, "row-span": [10, 11]}, {"bbox": [262.1897, 568.00237, 279.62424, 576.90892], "spans": [[10, 4]], "text": "96.7", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 10, "row-header": false, "row-span": [10, 11]}]], "model": null, "bounding-box": null}, {"prov": [{"bbox": [308.4068603515625, 488.1943359375, 533.6419677734375, 544.1236877441406], "page": 7, "span": [0, 0], "__ref_s3_data": null}], "text": "Table 3: Cell Bounding Box detection results on PubTabNet, and FinTabNet. PP: Post-processing.", "type": "table", "payload": null, "#-cols": 4, "#-rows": 4, "data": [[{"bbox": [339.323, 253.66436999999996, 365.33536, 262.57092], "spans": [[0, 0]], "text": "Model", "type": "col_header", "col": 0, "col-header": true, "col-span": [0, 1], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [401.04132, 253.66436999999996, 430.91916, 262.57092], "spans": [[0, 1]], "text": "Dataset", "type": "col_header", "col": 1, "col-header": true, "col-span": [1, 2], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [454.10214, 253.66436999999996, 474.58523999999994, 262.57092], "spans": [[0, 2]], "text": "mAP", "type": "col_header", "col": 2, "col-header": true, "col-span": [2, 3], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [486.54034, 253.66436999999996, 527.2276, 262.57092], "spans": [[0, 3]], "text": "mAP (PP)", "type": "col_header", "col": 3, "col-header": true, "col-span": [3, 4], "row": 0, "row-header": false, "row-span": [0, 1]}], [{"bbox": [327.65601, 270.62134000000003, 377.00076, 279.52788999999996], "spans": [[1, 0]], "text": "EDD+BBox", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [393.69809, 270.62134000000003, 438.28073, 279.52788999999996], "spans": [[1, 1]], "text": "PubTabNet", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [455.63559, 270.62134000000003, 473.07013, 279.52788999999996], "spans": [[1, 2]], "text": "79.2", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [498.16592, 270.62134000000003, 515.60046, 279.52788999999996], "spans": [[1, 3]], "text": "82.7", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 1, "row-header": false, "row-span": [1, 2]}], [{"bbox": [326.79501, 282.57631999999995, 377.86331, 291.48288], "spans": [[2, 0]], "text": "TableFormer", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [393.69388, 282.57631999999995, 438.27652, 291.48288], "spans": [[2, 1]], "text": "PubTabNet", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [455.63101, 282.45676, 473.06555000000003, 291.41315], "spans": [[2, 2]], "text": "82.1", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [498.1713, 282.45676, 515.60583, 291.41315], "spans": [[2, 3]], "text": "86.8", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 2, "row-header": false, "row-span": [2, 3]}], [{"bbox": [326.79501, 294.53131, 377.86331, 303.43787], "spans": [[3, 0]], "text": "TableFormer", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [389.81842, 294.53131, 442.15194999999994, 303.43787], "spans": [[3, 1]], "text": "SynthTabNet", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [455.63135, 294.53131, 473.06589, 303.43787], "spans": [[3, 2]], "text": "87.7", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [505.22515999999996, 294.53131, 508.54268999999994, 303.43787], "spans": [[3, 3]], "text": "-", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 3, "row-header": false, "row-span": [3, 4]}]], "model": null, "bounding-box": null}, {"prov": [{"bbox": [332.9688720703125, 148.73028564453125, 520.942138671875, 251.7164306640625], "page": 7, "span": [0, 0], "__ref_s3_data": null}], "text": "Table 4: Results of structure with content retrieved using cell detection on PubTabNet. In all cases the input is PDF documents with cropped tables.", "type": "table", "payload": null, "#-cols": 4, "#-rows": 7, "data": [[{"bbox": [358.01099, 552.23337, 384.02335, 561.1399200000001], "spans": [[0, 0]], "text": "Model", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [408.50598, 558.21037, 436.73999, 567.11693], "spans": [[0, 1]], "text": "Simple", "type": "col_header", "col": 1, "col-header": true, "col-span": [1, 2], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [448.6951, 546.25537, 485.07849, 567.11693], "spans": [[0, 2]], "text": "TEDS Complex", "type": "col_header", "col": 2, "col-header": true, "col-span": [2, 3], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [499.3848, 558.21037, 512.117, 567.11693], "spans": [[0, 3]], "text": "All", "type": "col_header", "col": 3, "col-header": true, "col-span": [3, 4], "row": 0, "row-header": false, "row-span": [0, 1]}], [{"bbox": [357.68201, 575.16736, 384.3519, 584.0739100000001], "spans": [[1, 0]], "text": "Tabula", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 1, "row-header": true, "row-span": [1, 2]}, {"bbox": [413.90097, 575.16736, 431.33550999999994, 584.0739100000001], "spans": [[1, 1]], "text": "78.0", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [458.16479000000004, 575.16736, 475.59933000000007, 584.0739100000001], "spans": [[1, 2]], "text": "57.8", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [497.0289, 575.16736, 514.46344, 584.0739100000001], "spans": [[1, 3]], "text": "67.9", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 1, "row-header": false, "row-span": [1, 2]}], [{"bbox": [350.72299, 587.12236, 391.31064, 596.02892], "spans": [[2, 0]], "text": "Traprange", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 2, "row-header": true, "row-span": [2, 3]}, {"bbox": [413.90582, 587.12236, 431.34036, 596.02892], "spans": [[2, 1]], "text": "60.8", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [458.16965, 587.12236, 475.60419, 596.02892], "spans": [[2, 2]], "text": "49.9", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [497.03374999999994, 587.12236, 514.46832, 596.02892], "spans": [[2, 3]], "text": "55.4", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 2, "row-header": false, "row-span": [2, 3]}], [{"bbox": [354.13599, 599.07835, 387.89923, 607.98491], "spans": [[3, 0]], "text": "Camelot", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 3, "row-header": true, "row-span": [3, 4]}, {"bbox": [413.90161, 599.07835, 431.33615, 607.98491], "spans": [[3, 1]], "text": "80.0", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [458.16544, 599.07835, 475.59998, 607.98491], "spans": [[3, 2]], "text": "66.0", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [497.02954000000005, 599.07835, 514.46411, 607.98491], "spans": [[3, 3]], "text": "73.0", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 3, "row-header": false, "row-span": [3, 4]}], [{"bbox": [346.55899, 611.03336, 395.47534, 619.93991], "spans": [[4, 0]], "text": "Acrobat Pro", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 4, "row-header": true, "row-span": [4, 5]}, {"bbox": [413.90616, 611.03336, 431.34069999999997, 619.93991], "spans": [[4, 1]], "text": "68.9", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [458.16998000000007, 611.03336, 475.60452, 619.93991], "spans": [[4, 2]], "text": "61.8", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [497.03409, 611.03336, 514.46863, 619.93991], "spans": [[4, 3]], "text": "65.3", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 4, "row-header": false, "row-span": [4, 5]}], [{"bbox": [360.78101, 622.9883600000001, 381.25415, 631.89491], "spans": [[5, 0]], "text": "EDD", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 5, "row-header": true, "row-span": [5, 6]}, {"bbox": [413.90158, 622.9883600000001, 431.33612, 631.89491], "spans": [[5, 1]], "text": "91.2", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [458.16541, 622.9883600000001, 475.59995000000004, 631.89491], "spans": [[5, 2]], "text": "85.4", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [497.0295100000001, 622.9883600000001, 514.46405, 631.89491], "spans": [[5, 3]], "text": "88.3", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 5, "row-header": false, "row-span": [5, 6]}], [{"bbox": [345.483, 634.94336, 396.5513, 643.84991], "spans": [[6, 0]], "text": "TableFormer", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 6, "row-header": true, "row-span": [6, 7]}, {"bbox": [413.90616, 634.94336, 431.34069999999997, 643.84991], "spans": [[6, 1]], "text": "95.4", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [458.16998000000007, 634.94336, 475.60452, 643.84991], "spans": [[6, 2]], "text": "90.1", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [497.03400000000005, 634.82381, 514.46857, 643.78018], "spans": [[6, 3]], "text": "93.6", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 6, "row-header": false, "row-span": [6, 7]}]], "model": null, "bounding-box": null}, {"prov": [{"bbox": [53.62853240966797, 499.60003662109375, 298.5574951171875, 573.0514221191406], "page": 8, "span": [0, 0], "__ref_s3_data": null}], "text": "Text is aligned to match original for ease of viewing", "type": "table", "payload": null, "#-cols": 6, "#-rows": 10, "data": [[{"bbox": null, "spans": [[0, 0]], "text": "", "type": "body"}, {"bbox": null, "spans": [[0, 1]], "text": "", "type": "body"}, {"bbox": [209.93285, 222.18073000000004, 241.04458999999997, 226.36212], "spans": [[0, 2], [0, 3]], "text": "\u8ad6\u6587\u30d5\u30a1\u30a4\u30eb", "type": "col_header", "col": 2, "col-header": true, "col-span": [2, 4], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [209.93285, 222.18073000000004, 241.04458999999997, 226.36212], "spans": [[0, 2], [0, 3]], "text": "\u8ad6\u6587\u30d5\u30a1\u30a4\u30eb", "type": "col_header", "col": 3, "col-header": true, "col-span": [2, 4], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [263.76489, 222.18073000000004, 284.50589, 226.36212], "spans": [[0, 4], [0, 5]], "text": "\u53c2\u8003\u6587\u732e", "type": "col_header", "col": 4, "col-header": true, "col-span": [4, 6], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [263.76489, 222.18073000000004, 284.50589, 226.36212], "spans": [[0, 4], [0, 5]], "text": "\u53c2\u8003\u6587\u732e", "type": "col_header", "col": 5, "col-header": true, "col-span": [4, 6], "row": 0, "row-header": false, "row-span": [0, 1]}], [{"bbox": [110.24990999999999, 229.66594999999995, 120.62018, 233.84735], "spans": [[1, 0]], "text": "\u51fa\u5178", "type": "col_header", "col": 0, "col-header": true, "col-span": [0, 1], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [175.36609, 229.66594999999995, 201.29247, 233.84735], "spans": [[1, 1]], "text": "\u30d5\u30a1\u30a4\u30eb \u6570", "type": "col_header", "col": 1, "col-header": true, "col-span": [1, 2], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [209.62408, 229.66594999999995, 219.99435, 233.84735], "spans": [[1, 2]], "text": "\u82f1\u8a9e", "type": "col_header", "col": 2, "col-header": true, "col-span": [2, 3], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [229.19814, 229.66594999999995, 244.75377, 233.84735], "spans": [[1, 3]], "text": "\u65e5\u672c\u8a9e", "type": "col_header", "col": 3, "col-header": true, "col-span": [3, 4], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [256.1142, 229.66594999999995, 266.48447, 233.84735], "spans": [[1, 4]], "text": "\u82f1\u8a9e", "type": "col_header", "col": 4, "col-header": true, "col-span": [4, 5], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [278.38434, 229.66594999999995, 293.93997, 233.84735], "spans": [[1, 5]], "text": "\u65e5\u672c\u8a9e", "type": "col_header", "col": 5, "col-header": true, "col-span": [5, 6], "row": 1, "row-header": false, "row-span": [1, 2]}], [{"bbox": [55.53052099999999, 236.42584, 162.7131, 240.78375000000005], "spans": [[2, 0]], "text": "Association for Computational Linguistics(ACL2003)", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 2, "row-header": true, "row-span": [2, 3]}, {"bbox": [184.39731, 236.42584, 189.56456, 240.78375000000005], "spans": [[2, 1]], "text": "65", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [208.99026, 236.42584, 214.15752, 240.78375000000005], "spans": [[2, 2]], "text": "65", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [234.87517, 236.42584, 237.45833000000002, 240.78375000000005], "spans": [[2, 3]], "text": "0", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [256.88446, 236.42584, 264.6358, 240.78375000000005], "spans": [[2, 4]], "text": "150", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [284.06134, 236.42584, 286.6445, 240.78375000000005], "spans": [[2, 5]], "text": "0", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 2, "row-header": false, "row-span": [2, 3]}], [{"bbox": [55.53052099999999, 242.62048000000004, 139.72253, 246.97839], "spans": [[3, 0]], "text": "Computational Linguistics(COLING2002)", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 3, "row-header": true, "row-span": [3, 4]}, {"bbox": [183.10536, 242.62048000000004, 190.8567, 246.97839], "spans": [[3, 1]], "text": "140", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [207.69832, 242.62048000000004, 215.44965999999997, 246.97839], "spans": [[3, 2]], "text": "140", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [234.87517, 242.62048000000004, 237.45833000000002, 246.97839], "spans": [[3, 3]], "text": "0", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [256.88446, 242.62048000000004, 264.6358, 246.97839], "spans": [[3, 4]], "text": "150", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [284.06134, 242.62048000000004, 286.6445, 246.97839], "spans": [[3, 5]], "text": "0", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 3, "row-header": false, "row-span": [3, 4]}], [{"bbox": [55.53052099999999, 249.58942000000002, 128.96027, 253.97986000000003], "spans": [[4, 0]], "text": "\u96fb\u6c17\u60c5\u5831\u901a\u4fe1\u5b66\u4f1a 2003 \u5e74\u7dcf\u5408\u5927\u4f1a", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 4, "row-header": true, "row-span": [4, 5]}, {"bbox": [183.10536, 248.81506000000002, 190.8567, 253.17296999999996], "spans": [[4, 1]], "text": "150", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [210.28223, 248.81506000000002, 212.86539, 253.17296999999996], "spans": [[4, 2]], "text": "8", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [232.29153, 248.81506000000002, 240.04287999999997, 253.17296999999996], "spans": [[4, 3]], "text": "142", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [256.88446, 248.81506000000002, 264.6358, 253.17296999999996], "spans": [[4, 4]], "text": "223", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [281.47742, 248.81506000000002, 289.22876, 253.17296999999996], "spans": [[4, 5]], "text": "147", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 4, "row-header": false, "row-span": [4, 5]}], [{"bbox": [55.53052099999999, 257.07465, 129.88177, 261.46509000000003], "spans": [[5, 0]], "text": "\u60c5\u5831\u51e6\u7406\u5b66\u4f1a\u7b2c 65 \u56de\u5168\u56fd\u5927\u4f1a (2003)", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 5, "row-header": true, "row-span": [5, 6]}, {"bbox": [183.10536, 256.30029, 190.8567, 260.65819999999997], "spans": [[5, 1]], "text": "177", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [210.28223, 256.30029, 212.86539, 260.65819999999997], "spans": [[5, 2]], "text": "1", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [232.29153, 256.30029, 240.04287999999997, 260.65819999999997], "spans": [[5, 3]], "text": "176", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [256.88446, 256.30029, 264.6358, 260.65819999999997], "spans": [[5, 4]], "text": "150", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [281.47742, 256.30029, 289.22876, 260.65819999999997], "spans": [[5, 5]], "text": "236", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 5, "row-header": false, "row-span": [5, 6]}], [{"bbox": [55.53052099999999, 264.30175999999994, 129.88177, 268.69219999999996], "spans": [[6, 0]], "text": "\u7b2c 17 \u56de\u4eba\u5de5\u77e5\u80fd\u5b66\u4f1a\u5168\u56fd\u5927\u4f1a (2003)", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 6, "row-header": true, "row-span": [6, 7]}, {"bbox": [183.10536, 263.52739999999994, 190.8567, 267.88531], "spans": [[6, 1]], "text": "208", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [210.28223, 263.52739999999994, 212.86539, 267.88531], "spans": [[6, 2]], "text": "5", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [232.29153, 263.52739999999994, 240.04287999999997, 267.88531], "spans": [[6, 3]], "text": "203", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [256.88446, 263.52739999999994, 264.6358, 267.88531], "spans": [[6, 4]], "text": "152", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [281.47742, 263.52739999999994, 289.22876, 267.88531], "spans": [[6, 5]], "text": "244", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 6, "row-header": false, "row-span": [6, 7]}], [{"bbox": [55.53052099999999, 271.52881, 127.32454000000001, 275.91925000000003], "spans": [[7, 0]], "text": "\u81ea\u7136\u8a00\u8a9e\u51e6\u7406\u7814\u7a76\u4f1a\u7b2c 146 \u301c 155 \u56de", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 7, "row-header": true, "row-span": [7, 8]}, {"bbox": [184.39731, 270.75446, 189.56456, 275.11237000000006], "spans": [[7, 1]], "text": "98", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 7, "row-header": false, "row-span": [7, 8]}, {"bbox": [210.28223, 270.75446, 212.86539, 275.11237000000006], "spans": [[7, 2]], "text": "2", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 7, "row-header": false, "row-span": [7, 8]}, {"bbox": [233.58348, 270.75446, 238.75072999999998, 275.11237000000006], "spans": [[7, 3]], "text": "96", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 7, "row-header": false, "row-span": [7, 8]}, {"bbox": [256.88446, 270.75446, 264.6358, 275.11237000000006], "spans": [[7, 4]], "text": "150", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 7, "row-header": false, "row-span": [7, 8]}, {"bbox": [281.47742, 270.75446, 289.22876, 275.11237000000006], "spans": [[7, 5]], "text": "232", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 7, "row-header": false, "row-span": [7, 8]}], [{"bbox": [55.53052099999999, 279.01392, 110.16829999999999, 283.40436], "spans": [[8, 0]], "text": "WWW \u304b\u3089\u53ce\u96c6\u3057\u305f\u8ad6\u6587", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 8, "row-header": true, "row-span": [8, 9]}, {"bbox": [183.10536, 277.98157000000003, 190.8567, 282.33948000000004], "spans": [[8, 1]], "text": "107", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 8, "row-header": false, "row-span": [8, 9]}, {"bbox": [208.99026, 277.98157000000003, 214.15752, 282.33948000000004], "spans": [[8, 2]], "text": "73", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 8, "row-header": false, "row-span": [8, 9]}, {"bbox": [233.58348, 277.98157000000003, 238.75072999999998, 282.33948000000004], "spans": [[8, 3]], "text": "34", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 8, "row-header": false, "row-span": [8, 9]}, {"bbox": [256.88446, 277.98157000000003, 264.6358, 282.33948000000004], "spans": [[8, 4]], "text": "147", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 8, "row-header": false, "row-span": [8, 9]}, {"bbox": [282.76938, 277.98157000000003, 287.93661, 282.33948000000004], "spans": [[8, 5]], "text": "96", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 8, "row-header": false, "row-span": [8, 9]}], [{"bbox": null, "spans": [[9, 0]], "text": "", "type": "body"}, {"bbox": [183.10536, 285.46667, 190.8567, 289.8245800000001], "spans": [[9, 1]], "text": "945", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 9, "row-header": false, "row-span": [9, 10]}, {"bbox": [207.69832, 285.46667, 215.44965999999997, 289.8245800000001], "spans": [[9, 2]], "text": "294", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 9, "row-header": false, "row-span": [9, 10]}, {"bbox": [232.29153, 285.46667, 240.04287999999997, 289.8245800000001], "spans": [[9, 3]], "text": "651", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 9, "row-header": false, "row-span": [9, 10]}, {"bbox": [255.76506, 285.46667, 265.75204, 289.8245800000001], "spans": [[9, 4]], "text": "1122", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 9, "row-header": false, "row-span": [9, 10]}, {"bbox": [281.47742, 285.46667, 289.22876, 289.8245800000001], "spans": [[9, 5]], "text": "955", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 9, "row-header": false, "row-span": [9, 10]}]], "model": null, "bounding-box": null}, {"prov": [{"bbox": [304.9219970703125, 504.09930419921875, 550.2321166992188, 573.4851379394531], "page": 8, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "table", "payload": null, "#-cols": 5, "#-rows": 7, "data": [[{"bbox": null, "spans": [[0, 0]], "text": "", "type": "body"}, {"bbox": [392.09671, 221.57446000000004, 438.0145, 226.63964999999996], "spans": [[0, 1], [0, 2]], "text": "Shares (in millions)", "type": "col_header", "col": 1, "col-header": true, "col-span": [1, 3], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [392.09671, 221.57446000000004, 438.0145, 226.63964999999996], "spans": [[0, 1], [0, 2]], "text": "Shares (in millions)", "type": "col_header", "col": 2, "col-header": true, "col-span": [1, 3], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [459.04861, 221.62415, 542.00018, 232.89935000000003], "spans": [[0, 3], [0, 4]], "text": "Weighted Average Grant Date Fair Value", "type": "col_header", "col": 3, "col-header": true, "col-span": [3, 5], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [459.04861, 221.62415, 542.00018, 232.89935000000003], "spans": [[0, 3], [0, 4]], "text": "Weighted Average Grant Date Fair Value", "type": "col_header", "col": 4, "col-header": true, "col-span": [3, 5], "row": 0, "row-header": false, "row-span": [0, 1]}], [{"bbox": null, "spans": [[1, 0]], "text": "", "type": "body"}, {"bbox": [393.2442, 236.74712999999997, 407.34631, 241.81232], "spans": [[1, 1]], "text": "RS U s", "type": "col_header", "col": 1, "col-header": true, "col-span": [1, 2], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [427.18323, 236.74712999999997, 440.98778999999996, 241.81232], "spans": [[1, 2]], "text": "PSUs", "type": "col_header", "col": 2, "col-header": true, "col-span": [2, 3], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [468.38254, 236.74712999999997, 482.48465000000004, 241.81232], "spans": [[1, 3]], "text": "RSUs", "type": "col_header", "col": 3, "col-header": true, "col-span": [3, 4], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [516.92578, 236.74712999999997, 530.73035, 241.81232], "spans": [[1, 4]], "text": "PSUs", "type": "col_header", "col": 4, "col-header": true, "col-span": [4, 5], "row": 1, "row-header": false, "row-span": [1, 2]}], [{"bbox": [306.11493, 244.61084000000005, 364.65607, 249.67602999999997], "spans": [[2, 0]], "text": "Nonvested on Janua ry 1", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 2, "row-header": true, "row-span": [2, 3]}, {"bbox": [396.24661, 244.91327, 403.75531, 249.97844999999995], "spans": [[2, 1]], "text": "1. 1", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [429.81838999999997, 244.91327, 437.32708999999994, 249.97844999999995], "spans": [[2, 2]], "text": "0.3", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [465.52859, 244.91327, 483.55001999999996, 249.97844999999995], "spans": [[2, 3]], "text": "90.10 $", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [513.44824, 244.91327, 531.46967, 249.97844999999995], "spans": [[2, 4]], "text": "$ 91.19", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 2, "row-header": false, "row-span": [2, 3]}], [{"bbox": [306.11493, 253.68451000000005, 325.62674, 258.74969], "spans": [[3, 0]], "text": "Granted", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 3, "row-header": true, "row-span": [3, 4]}, {"bbox": [396.24661, 253.68451000000005, 403.75531, 258.74969], "spans": [[3, 1]], "text": "0. 5", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [429.81838999999997, 253.68451000000005, 437.32708999999994, 258.74969], "spans": [[3, 2]], "text": "0.1", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [466.43579000000005, 253.68451000000005, 482.54831, 258.74969], "spans": [[3, 3]], "text": "117.44", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [514.29065, 253.68451000000005, 530.80981, 258.74969], "spans": [[3, 4]], "text": "122.41", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 3, "row-header": false, "row-span": [3, 4]}], [{"bbox": [306.11493, 261.54822, 322.62866, 266.61339999999996], "spans": [[4, 0]], "text": "Vested", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 4, "row-header": true, "row-span": [4, 5]}, {"bbox": [394.43222, 261.54822, 405.53625, 266.61339999999996], "spans": [[4, 1]], "text": "(0. 5 )", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [427.7016, 261.54822, 438.80563, 266.61339999999996], "spans": [[4, 2]], "text": "(0.1)", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [468.55533, 261.54822, 482.07043, 266.61339999999996], "spans": [[4, 3]], "text": "87.08", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [516.01862, 261.54822, 529.53375, 266.61339999999996], "spans": [[4, 4]], "text": "81.14", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 4, "row-header": false, "row-span": [4, 5]}], [{"bbox": [306.11493, 269.64148, 356.24771, 274.70667000000003], "spans": [[5, 0]], "text": "Canceled or forfeited", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 5, "row-header": true, "row-span": [5, 6]}, {"bbox": [394.43222, 270.31946000000005, 405.53625, 275.38464], "spans": [[5, 1]], "text": "(0. 1 )", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [431.02802, 270.31946000000005, 436.4280099999999, 275.38464], "spans": [[5, 2]], "text": "-", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [465.83099000000004, 270.31946000000005, 482.35013, 275.38464], "spans": [[5, 3]], "text": "102.01", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [516.01862, 270.31946000000005, 529.53375, 275.38464], "spans": [[5, 4]], "text": "92.18", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 5, "row-header": false, "row-span": [5, 6]}], [{"bbox": [306.11493, 278.48572, 373.35764, 283.55092999999994], "spans": [[6, 0]], "text": "Nonvested on December 31", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 6, "row-header": true, "row-span": [6, 7]}, {"bbox": [396.24661, 278.48572, 403.75531, 283.55092999999994], "spans": [[6, 1]], "text": "1.0", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [429.51599, 278.48572, 437.02469, 283.55092999999994], "spans": [[6, 2]], "text": "0.3", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [463.7142, 278.48572, 484.73965000000004, 283.55092999999994], "spans": [[6, 3]], "text": "104.85 $", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [512.99463, 278.48572, 534.02008, 283.55092999999994], "spans": [[6, 4]], "text": "$ 104.51", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 6, "row-header": false, "row-span": [6, 7]}]], "model": null, "bounding-box": null}, {"prov": [{"bbox": [84.0283203125, 577.6066589355469, 239.1690673828125, 635.6664581298828], "page": 13, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "table", "payload": null, "#-cols": 0, "#-rows": 0, "data": [], "model": null, "bounding-box": null}, {"prov": [{"bbox": [82.92001342773438, 500.716064453125, 239.1903533935547, 558.2236785888672], "page": 13, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "table", "payload": null, "#-cols": 0, "#-rows": 0, "data": [], "model": null, "bounding-box": null}, {"prov": [{"bbox": [83.94786071777344, 424.0904235839844, 239.17135620117188, 482.9522705078125], "page": 13, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "table", "payload": null, "#-cols": 0, "#-rows": 0, "data": [], "model": null, "bounding-box": null}, {"prov": [{"bbox": [83.31756591796875, 304.7430114746094, 248.873046875, 395.9864501953125], "page": 13, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "table", "payload": null, "#-cols": 0, "#-rows": 0, "data": [], "model": null, "bounding-box": null}, {"prov": [{"bbox": [310.3294372558594, 655.8524780273438, 555.8338623046875, 690.8223266601562], "page": 13, "span": [0, 0], "__ref_s3_data": null}], "text": "Figure 9: Example of a table with big empty distance between cells.", "type": "table", "payload": null, "#-cols": 0, "#-rows": 0, "data": [], "model": null, "bounding-box": null}, {"prov": [{"bbox": [309.9566345214844, 607.2774658203125, 555.7466430664062, 637.3855133056641], "page": 13, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "table", "payload": null, "#-cols": 0, "#-rows": 0, "data": [], "model": null, "bounding-box": null}, {"prov": [{"bbox": [309.9635314941406, 558.4485473632812, 555.7054443359375, 596.2945861816406], "page": 13, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "table", "payload": null, "#-cols": 0, "#-rows": 0, "data": [], "model": null, "bounding-box": null}, {"prov": [{"bbox": [309.79150390625, 499.60601806640625, 425.9603271484375, 538.0946350097656], "page": 13, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "table", "payload": null, "#-cols": 0, "#-rows": 0, "data": [], "model": null, "bounding-box": null}, {"prov": [{"bbox": [335.2694091796875, 354.97760009765625, 490.081787109375, 403.53253173828125], "page": 13, "span": [0, 0], "__ref_s3_data": null}], "text": "Figure 10: Example of a complex table with empty cells.", "type": "table", "payload": null, "#-cols": 0, "#-rows": 0, "data": [], "model": null, "bounding-box": null}, {"prov": [{"bbox": [334.9334716796875, 289.2789001464844, 490.0914306640625, 338.0523681640625], "page": 13, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "table", "payload": null, "#-cols": 0, "#-rows": 0, "data": [], "model": null, "bounding-box": null}, {"prov": [{"bbox": [335.2545471191406, 224.31207275390625, 490.22369384765625, 272.92431640625], "page": 13, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "table", "payload": null, "#-cols": 0, "#-rows": 0, "data": [], "model": null, "bounding-box": null}, {"prov": [{"bbox": [333.9573669433594, 126.5096435546875, 518.4768676757812, 198.8865966796875], "page": 13, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "table", "payload": null, "#-cols": 0, "#-rows": 0, "data": [], "model": null, "bounding-box": null}, {"prov": [{"bbox": [51.72642135620117, 447.7554931640625, 283.114013671875, 518.3907165527344], "page": 14, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "table", "payload": null, "#-cols": 0, "#-rows": 0, "data": [], "model": null, "bounding-box": null}, {"prov": [{"bbox": [51.434879302978516, 300.17974853515625, 310.7267150878906, 338.51251220703125], "page": 14, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "table", "payload": null, "#-cols": 0, "#-rows": 0, "data": [], "model": null, "bounding-box": null}, {"prov": [{"bbox": [50.86823654174805, 249.55401611328125, 310.6080017089844, 287.90374755859375], "page": 14, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "table", "payload": null, "#-cols": 0, "#-rows": 0, "data": [], "model": null, "bounding-box": null}, {"prov": [{"bbox": [51.27280807495117, 200.086669921875, 311.0897216796875, 238.271484375], "page": 14, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "table", "payload": null, "#-cols": 0, "#-rows": 0, "data": [], "model": null, "bounding-box": null}, {"prov": [{"bbox": [318.9809265136719, 577.3739471435547, 534.6229248046875, 630.7653961181641], "page": 14, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "table", "payload": null, "#-cols": 0, "#-rows": 0, "data": [], "model": null, "bounding-box": null}, {"prov": [{"bbox": [319.0057678222656, 512.1423034667969, 534.408935546875, 565.8936614990234], "page": 14, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "table", "payload": null, "#-cols": 0, "#-rows": 0, "data": [], "model": null, "bounding-box": null}, {"prov": [{"bbox": [328.1381530761719, 433.7275695800781, 523.8916015625, 503.3182067871094], "page": 14, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "table", "payload": null, "#-cols": 0, "#-rows": 0, "data": [], "model": null, "bounding-box": null}, {"prov": [{"bbox": [319.4707946777344, 314.05645751953125, 518.5693359375, 361.09698486328125], "page": 14, "span": [0, 0], "__ref_s3_data": null}], "text": "Figure 14: Example with multi-line text.", "type": "table", "payload": null, "#-cols": 0, "#-rows": 0, "data": [], "model": null, "bounding-box": null}, {"prov": [{"bbox": [319.982666015625, 256.30419921875, 519.0963745117188, 302.7562561035156], "page": 14, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "table", "payload": null, "#-cols": 0, "#-rows": 0, "data": [], "model": null, "bounding-box": null}, {"prov": [{"bbox": [319.8287658691406, 198.8935546875, 519.6065673828125, 245.5906982421875], "page": 14, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "table", "payload": null, "#-cols": 0, "#-rows": 0, "data": [], "model": null, "bounding-box": null}, {"prov": [{"bbox": [319.06494140625, 122.80792236328125, 533.77392578125, 182.1591796875], "page": 14, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "table", "payload": null, "#-cols": 0, "#-rows": 0, "data": [], "model": null, "bounding-box": null}, {"prov": [{"bbox": [55.116363525390625, 542.6654510498047, 279.370849609375, 655.7449951171875], "page": 15, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "table", "payload": null, "#-cols": 0, "#-rows": 0, "data": [], "model": null, "bounding-box": null}, {"prov": [{"bbox": [54.28135299682617, 418.4729309082031, 279.2568359375, 531.7384338378906], "page": 15, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "table", "payload": null, "#-cols": 0, "#-rows": 0, "data": [], "model": null, "bounding-box": null}, {"prov": [{"bbox": [323.0059509277344, 569.0885925292969, 525.95166015625, 670.4528503417969], "page": 15, "span": [0, 0], "__ref_s3_data": null}], "text": "Figure 15: Example with triangular table.", "type": "table", "payload": null, "#-cols": 0, "#-rows": 0, "data": [], "model": null, "bounding-box": null}, {"prov": [{"bbox": [323.384765625, 447.90789794921875, 526.1268920898438, 550.0270538330078], "page": 15, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "table", "payload": null, "#-cols": 0, "#-rows": 0, "data": [], "model": null, "bounding-box": null}, {"prov": [{"bbox": [323.46868896484375, 327.739501953125, 525.9569091796875, 429.5491638183594], "page": 15, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "table", "payload": null, "#-cols": 0, "#-rows": 0, "data": [], "model": null, "bounding-box": null}, {"prov": [{"bbox": [353.6920471191406, 156.22674560546875, 495.4288024902344, 304.594970703125], "page": 15, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "table", "payload": null, "#-cols": 0, "#-rows": 0, "data": [], "model": null, "bounding-box": null}, {"prov": [{"bbox": [50.64818572998047, 160.736328125, 319.9103088378906, 286.01953125], "page": 15, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "table", "payload": null, "#-cols": 0, "#-rows": 0, "data": [], "model": null, "bounding-box": null}], "bitmaps": null, "equations": [], "footnotes": [], "page-dimensions": [{"height": 792.0, "page": 1, "width": 612.0}, {"height": 792.0, "page": 2, "width": 612.0}, {"height": 792.0, "page": 3, "width": 612.0}, {"height": 792.0, "page": 4, "width": 612.0}, {"height": 792.0, "page": 5, "width": 612.0}, {"height": 792.0, "page": 6, "width": 612.0}, {"height": 792.0, "page": 7, "width": 612.0}, {"height": 792.0, "page": 8, "width": 612.0}, {"height": 792.0, "page": 9, "width": 612.0}, {"height": 792.0, "page": 10, "width": 612.0}, {"height": 792.0, "page": 11, "width": 612.0}, {"height": 792.0, "page": 12, "width": 612.0}, {"height": 792.0, "page": 13, "width": 612.0}, {"height": 792.0, "page": 14, "width": 612.0}, {"height": 792.0, "page": 15, "width": 612.0}, {"height": 792.0, "page": 16, "width": 612.0}], "page-footers": [], "page-headers": [], "_s3_data": null, "identifiers": null}
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v1/2203.01017v2.md b/tests/data/groundtruth/docling_v1/2203.01017v2.md
index 831a7b33..12d1363e 100644
--- a/tests/data/groundtruth/docling_v1/2203.01017v2.md
+++ b/tests/data/groundtruth/docling_v1/2203.01017v2.md
@@ -8,25 +8,22 @@
 
 ## a. Picture of a table:
 
+Tables organize valuable content in a concise and compact representation. This content is extremely valuable for systems such as search engines, Knowledge Graph's, etc, since they enhance their predictive capabilities. Unfortunately, tables come in a large variety of shapes and sizes. Furthermore, they can have complex column/row-header configurations, multiline rows, different variety of separation lines, missing entries, etc. As such, the correct identification of the table-structure from an image is a nontrivial task. In this paper, we present a new table-structure identification model. The latter improves the latest end-toend deep learning model (i.e. encoder-dual-decoder from PubTabNet) in two significant ways. First, we introduce a new object detection decoder for table-cells. In this way, we can obtain the content of the table-cells from programmatic PDF's directly from the PDF source and avoid the training of the custom OCR decoders. This architectural change leads to more accurate table-content extraction and allows us to tackle non-english tables. Second, we replace the LSTM decoders with transformer based decoders. This upgrade improves significantly the previous state-of-the-art tree-editing-distance-score (TEDS) from 91% to 98.5% on simple tables and from 88.7% to 95% on complex tables.
+
 ## 1. Introduction
 
 The occurrence of tables in documents is ubiquitous. They often summarise quantitative or factual data, which is cumbersome to describe in verbose text but nevertheless extremely valuable. Unfortunately, this compact representation is often not easy to parse by machines. There are many implicit conventions used to obtain a compact table representation. For example, tables often have complex columnand row-headers in order to reduce duplicated cell content. Lines of different shapes and sizes are leveraged to separate content or indicate a tree structure. Additionally, tables can also have empty/missing table-entries or multi-row textual table-entries. Fig. 1 shows a table which presents all these issues.
 
 <!-- image -->
 
-Tables organize valuable content in a concise and compact representation. This content is extremely valuable for systems such as search engines, Knowledge Graph's, etc, since they enhance their predictive capabilities. Unfortunately, tables come in a large variety of shapes and sizes. Furthermore, they can have complex column/row-header configurations, multiline rows, different variety of separation lines, missing entries, etc. As such, the correct identification of the table-structure from an image is a nontrivial task. In this paper, we present a new table-structure identification model. The latter improves the latest end-toend deep learning model (i.e. encoder-dual-decoder from PubTabNet) in two significant ways. First, we introduce a new object detection decoder for table-cells. In this way, we can obtain the content of the table-cells from programmatic PDF's directly from the PDF source and avoid the training of the custom OCR decoders. This architectural change leads to more accurate table-content extraction and allows us to tackle non-english tables. Second, we replace the LSTM decoders with transformer based decoders. This upgrade improves significantly the previous state-of-the-art tree-editing-distance-score (TEDS) from 91% to 98.5% on simple tables and from 88.7% to 95% on complex tables.
-
-
-
 - b. Red-annotation of bounding boxes, Blue-predictions by TableFormer
 
-<!-- image -->
-
 - c. Structure predicted by TableFormer:
 
 <!-- image -->
 
 Figure 1: Picture of a table with subtle, complex features such as (1) multi-column headers, (2) cell with multi-row text and (3) cells with no content. Image from PubTabNet evaluation set, filename: 'PMC2944238 004 02'.
+<!-- image -->
 
 | 0   |   1 | 1   |   2 1 |   2 1 |    |
 |-----|-----|-----|-------|-------|----|
@@ -155,9 +152,7 @@ where λ ∈ [0, 1], and λ$_{iou}$, λ$_{l}$$_{1}$ ∈$_{R}$ are hyper-paramete
 
 TableFormer uses ResNet-18 as the CNN Backbone Network . The input images are resized to 448*448 pixels and the feature map has a dimension of 28*28. Additionally, we enforce the following input constraints:
 
-Although input constraints are used also by other methods, such as EDD, ours are less restrictive due to the improved
-
-runtime performance and lower memory footprint of TableFormer. This allows to utilize input samples with longer sequences and images with larger dimensions.
+Although input constraints are used also by other methods, such as EDD, ours are less restrictive due to the improved runtime performance and lower memory footprint of TableFormer. This allows to utilize input samples with longer sequences and images with larger dimensions.
 
 The Transformer Encoder consists of two "Transformer Encoder Layers", with an input feature size of 512, feed forward network of 1024, and 4 attention heads. As for the Transformer Decoder it is composed of four "Transformer Decoder Layers" with similar input and output dimensions as the "Transformer Encoder Layers". Even though our model uses fewer layers and heads than the default implementation parameters, our extensive experimentation has proved this setup to be more suitable for table images. We attribute this finding to the inherent design of table images, which contain mostly lines and text, unlike the more elaborate content present in other scopes (e.g. the COCO dataset). Moreover, we have added ResNet blocks to the inputs of the Structure Decoder and Cell BBox Decoder. This prevents a decoder having a stronger influence over the learned weights which would damage the other prediction task (structure vs bounding boxes), but learn task specific weights instead. Lastly our dropout layers are set to 0.5.
 
@@ -181,8 +176,6 @@ where T$_{a}$ and T$_{b}$ represent tables in tree structure HTML format. EditDi
 
 Structure. As shown in Tab. 2, TableFormer outperforms all SOTA methods across different datasets by a large margin for predicting the table structure from an image. All the more, our model outperforms pre-trained methods. During the evaluation we do not apply any table filtering. We also provide our baseline results on the SynthTabNet dataset. It has been observed that large tables (e.g. tables that occupy half of the page or more) yield poor predictions. We attribute this issue to the image resizing during the preprocessing step, that produces downsampled images with indistinguishable features. This problem can be addressed by treating such big tables with a separate model which accepts a large input image size.
 
-Table 2: Structure results on PubTabNet (PTN), FinTabNet (FTN), TableBank (TB) and SynthTabNet (STN).
-
 | Model       | Dataset   | Simple   | TEDS Complex   |   All |
 |-------------|-----------|----------|----------------|-------|
 | EDD         | PTN       | 91.1     | 88.7           | 89.9  |
@@ -196,11 +189,11 @@ Table 2: Structure results on PubTabNet (PTN), FinTabNet (FTN), TableBank (TB) a
 | TableFormer | TB        | 89.6     | -              | 89.6  |
 | TableFormer | STN       | 96.9     | 95.7           | 96.7  |
 
+Table 2: Structure results on PubTabNet (PTN), FinTabNet (FTN), TableBank (TB) and SynthTabNet (STN).
+
 FT: Model was trained on PubTabNet then finetuned.
 
-Cell Detection. Like any object detector, our Cell BBox Detector provides bounding boxes that can be improved with post-processing during inference. We make use of the grid-like structure of tables to refine the predictions. A detailed explanation on the post-processing is available in the supplementary material. As shown in Tab. 3, we evaluate
-
-our Cell BBox Decoder accuracy for cells with a class label of 'content' only using the PASCAL VOC mAP metric for pre-processing and post-processing. Note that we do not have post-processing results for SynthTabNet as images are only provided. To compare the performance of our proposed approach, we've integrated TableFormer's Cell BBox Decoder into EDD architecture. As mentioned previously, the Structure Decoder provides the Cell BBox Decoder with the features needed to predict the bounding box predictions. Therefore, the accuracy of the Structure Decoder directly influences the accuracy of the Cell BBox Decoder . If the Structure Decoder predicts an extra column, this will result in an extra column of predicted bounding boxes.
+Cell Detection. Like any object detector, our Cell BBox Detector provides bounding boxes that can be improved with post-processing during inference. We make use of the grid-like structure of tables to refine the predictions. A detailed explanation on the post-processing is available in the supplementary material. As shown in Tab. 3, we evaluate our Cell BBox Decoder accuracy for cells with a class label of 'content' only using the PASCAL VOC mAP metric for pre-processing and post-processing. Note that we do not have post-processing results for SynthTabNet as images are only provided. To compare the performance of our proposed approach, we've integrated TableFormer's Cell BBox Decoder into EDD architecture. As mentioned previously, the Structure Decoder provides the Cell BBox Decoder with the features needed to predict the bounding box predictions. Therefore, the accuracy of the Structure Decoder directly influences the accuracy of the Cell BBox Decoder . If the Structure Decoder predicts an extra column, this will result in an extra column of predicted bounding boxes.
 
 Table 3: Cell Bounding Box detection results on PubTabNet, and FinTabNet. PP: Post-processing.
 
@@ -236,6 +229,8 @@ Table 4: Results of structure with content retrieved using cell detection on Pub
 b. Structure predicted by TableFormer, with superimposed matched PDF cell text:
 <!-- image -->
 
+Text is aligned to match original for ease of viewing
+
 |                                                    |             | 論文ファイル   | 論文ファイル   | 参考文献   | 参考文献   |
 |----------------------------------------------------|-------------|----------------|----------------|------------|------------|
 | 出典                                               | ファイル 数 | 英語           | 日本語         | 英語       | 日本語     |
@@ -248,8 +243,6 @@ b. Structure predicted by TableFormer, with superimposed matched PDF cell text:
 | WWW から収集した論文                               | 107         | 73             | 34             | 147        | 96         |
 |                                                    | 945         | 294            | 651            | 1122       | 955        |
 
-Text is aligned to match original for ease of viewing
-
 |                          | Shares (in millions)   | Shares (in millions)   | Weighted Average Grant Date Fair Value   | Weighted Average Grant Date Fair Value   |
 |--------------------------|------------------------|------------------------|------------------------------------------|------------------------------------------|
 |                          | RS U s                 | PSUs                   | RSUs                                     | PSUs                                     |
@@ -259,20 +252,20 @@ Text is aligned to match original for ease of viewing
 | Canceled or forfeited    | (0. 1 )                | -                      | 102.01                                   | 92.18                                    |
 | Nonvested on December 31 | 1.0                    | 0.3                    | 104.85 $                                 | $ 104.51                                 |
 
+Figure 6: An example of TableFormer predictions (bounding boxes and structure) from generated SynthTabNet table.
+<!-- image -->
+
 Figure 5: One of the benefits of TableFormer is that it is language agnostic, as an example, the left part of the illustration demonstrates TableFormer predictions on previously unseen language (Japanese). Additionally, we see that TableFormer is robust to variability in style and content, right side of the illustration shows the example of the TableFormer prediction from the FinTabNet dataset.
 <!-- image -->
 
 <!-- image -->
 
-Figure 6: An example of TableFormer predictions (bounding boxes and structure) from generated SynthTabNet table.
-<!-- image -->
-
 ## 5.5. Qualitative Analysis
 
-We showcase several visualizations for the different components of our network on various "complex" tables within datasets presented in this work in Fig. 5 and Fig. 6 As it is shown, our model is able to predict bounding boxes for all table cells, even for the empty ones. Additionally, our post-processing techniques can extract the cell content by matching the predicted bounding boxes to the PDF cells based on their overlap and spatial proximity. The left part of Fig. 5 demonstrates also the adaptability of our method to any language, as it can successfully extract Japanese text, although the training set contains only English content. We provide more visualizations including the intermediate steps in the supplementary material. Overall these illustrations justify the versatility of our method across a diverse range of table appearances and content type.
-
 ## 6. Future Work & Conclusion
 
+We showcase several visualizations for the different components of our network on various "complex" tables within datasets presented in this work in Fig. 5 and Fig. 6 As it is shown, our model is able to predict bounding boxes for all table cells, even for the empty ones. Additionally, our post-processing techniques can extract the cell content by matching the predicted bounding boxes to the PDF cells based on their overlap and spatial proximity. The left part of Fig. 5 demonstrates also the adaptability of our method to any language, as it can successfully extract Japanese text, although the training set contains only English content. We provide more visualizations including the intermediate steps in the supplementary material. Overall these illustrations justify the versatility of our method across a diverse range of table appearances and content type.
+
 In this paper, we presented TableFormer an end-to-end transformer based approach to predict table structures and bounding boxes of cells from an image. This approach enables us to recreate the table structure, and extract the cell content from PDF or OCR by using bounding boxes. Additionally, it provides the versatility required in real-world scenarios when dealing with various types of PDF documents, and languages. Furthermore, our method outperforms all state-of-the-arts with a wide margin. Finally, we introduce "SynthTabNet" a challenging synthetically generated dataset that reinforces missing characteristics from other datasets.
 
 ## References
@@ -285,11 +278,11 @@ In this paper, we presented TableFormer an end-to-end transformer based approach
 
 - [3] Bertrand Couasnon and Aurelie Lemaitre. Recognition of Tables and Forms , pages 647-677. Springer London, London, 2014. 2
 
-- [4] Herv'e D'ejean, Jean-Luc Meunier, Liangcai Gao, Yilun Huang, Yu Fang, Florian Kleber, and Eva-Maria Lang. ICDAR 2019 Competition on Table Detection and Recognition (cTDaR), Apr. 2019. http://sac.founderit.com/. 2
+- [4] Herv´e D´ejean, Jean-Luc Meunier, Liangcai Gao, Yilun Huang, Yu Fang, Florian Kleber, and Eva-Maria Lang. ICDAR 2019 Competition on Table Detection and Recognition (cTDaR), Apr. 2019. http://sac.founderit.com/. 2
 
 - [5] Basilios Gatos, Dimitrios Danatsas, Ioannis Pratikakis, and Stavros J Perantonis. Automatic table detection in document images. In International Conference on Pattern Recognition and Image Analysis , pages 609-618. Springer, 2005. 2
 
-- [6] Max Gobel, Tamir Hassan, Ermelinda Oro, and Giorgio Orsi. Icdar 2013 table competition. In 2013 12th International Conference on Document Analysis and Recognition , pages 1449-1453, 2013. 2
+- [6] Max G¨obel, Tamir Hassan, Ermelinda Oro, and Giorgio Orsi. Icdar 2013 table competition. In 2013 12th International Conference on Document Analysis and Recognition , pages 1449-1453, 2013. 2
 
 - [7] EA Green and M Krishnamoorthy. Recognition of tables using table grammars. procs. In Symposium on Document Analysis and Recognition (SDAIR'95) , pages 261-277. 2
 
@@ -303,7 +296,7 @@ In this paper, we presented TableFormer an end-to-end transformer based approach
 
 - [12] Matthew Hurst. A constraint-based approach to table structure derivation. In Proceedings of the Seventh International Conference on Document Analysis and Recognition - Volume 2 , ICDAR '03, page 911, USA, 2003. IEEE Computer Society. 2
 
-- [13] Thotreingam Kasar, Philippine Barlas, Sebastien Adam, Cl'ement Chatelain, and Thierry Paquet. Learning to detect tables in scanned document images using line information. In 2013 12th International Conference on Document Analysis and Recognition , pages 1185-1189. IEEE, 2013. 2
+- [13] Thotreingam Kasar, Philippine Barlas, Sebastien Adam, Cl´ement Chatelain, and Thierry Paquet. Learning to detect tables in scanned document images using line information. In 2013 12th International Conference on Document Analysis and Recognition , pages 1185-1189. IEEE, 2013. 2
 
 - [14] Pratik Kayal, Mrinal Anand, Harsh Desai, and Mayank Singh. Icdar 2021 competition on scientific table image recognition to latex, 2021. 2
 
@@ -321,7 +314,7 @@ In this paper, we presented TableFormer an end-to-end transformer based approach
 
 - [21] Shubham Singh Paliwal, D Vishwanath, Rohit Rahul, Monika Sharma, and Lovekesh Vig. Tablenet: Deep learning model for end-to-end table detection and tabular data extraction from scanned document images. In 2019 International Conference on Document Analysis and Recognition (ICDAR) , pages 128-133. IEEE, 2019. 1
 
-- [22] Adam Paszke, Sam Gross, Francisco Massa, Adam Lerer, James Bradbury, Gregory Chanan, Trevor Killeen, Zeming Lin, Natalia Gimelshein, Luca Antiga, Alban Desmaison, Andreas Kopf, Edward Yang, Zachary DeVito, Martin Raison, Alykhan Tejani, Sasank Chilamkurthy, Benoit Steiner, Lu Fang, Junjie Bai, and Soumith Chintala. Pytorch: An imperative style, high-performance deep learning library. In H. Wallach, H. Larochelle, A. Beygelzimer, F. d'Alch'e-Buc, E. Fox, and R. Garnett, editors, Advances in Neural Information Processing Systems 32 , pages 8024-8035. Curran Associates, Inc., 2019. 6
+- [22] Adam Paszke, Sam Gross, Francisco Massa, Adam Lerer, James Bradbury, Gregory Chanan, Trevor Killeen, Zeming Lin, Natalia Gimelshein, Luca Antiga, Alban Desmaison, Andreas Kopf, Edward Yang, Zachary DeVito, Martin Raison, Alykhan Tejani, Sasank Chilamkurthy, Benoit Steiner, Lu Fang, Junjie Bai, and Soumith Chintala. Pytorch: An imperative style, high-performance deep learning library. In H. Wallach, H. Larochelle, A. Beygelzimer, F. d'Alch´e-Buc, E. Fox, and R. Garnett, editors, Advances in Neural Information Processing Systems 32 , pages 8024-8035. Curran Associates, Inc., 2019. 6
 
 - [23] Devashish Prasad, Ayan Gadpal, Kshitij Kapadni, Manish Visave, and Kavita Sultanpure. Cascadetabnet: An approach for end to end table detection and structure recognition from image-based documents. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition Workshops , pages 572-573, 2020. 1
 
@@ -373,9 +366,7 @@ Figure 7 illustrates the distribution of the tables across different dimensions
 
 ## 1.2. Synthetic datasets
 
-Aiming to train and evaluate our models in a broader spectrum of table data we have synthesized four types of datasets. Each one contains tables with different appear-
-
-ances in regard to their size, structure, style and content. Every synthetic dataset contains 150k examples, summing up to 600k synthetic examples. All datasets are divided into Train, Test and Val splits (80%, 10%, 10%).
+Aiming to train and evaluate our models in a broader spectrum of table data we have synthesized four types of datasets. Each one contains tables with different appear- ances in regard to their size, structure, style and content. Every synthetic dataset contains 150k examples, summing up to 600k synthetic examples. All datasets are divided into Train, Test and Val splits (80%, 10%, 10%).
 
 The process of generating a synthetic dataset can be decomposed into the following steps:
 
@@ -400,6 +391,8 @@ Figure 7: Distribution of the tables across different dimensions per dataset. Si
 
 - · There are occasional inaccuracies in the predictions of the bounding boxes.
 
+dian cell size for all table cells. The usage of median during the computations, helps to eliminate outliers caused by occasional column spans which are usually wider than the normal.
+
 However, it is possible to mitigate those limitations by combining the TableFormer predictions with the information already present inside a programmatic PDF document. More specifically, PDF documents can be seen as a sequence of PDF cells where each cell is described by its content and bounding box. If we are able to associate the PDF cells with the predicted table cells, we can directly link the PDF cell content to the table cell structure and use the PDF bounding boxes to correct misalignments in the predicted table cell bounding boxes.
 
 Here is a step-by-step description of the prediction postprocessing:
@@ -418,8 +411,6 @@ where c is one of { left, centroid, right } and x$_{c}$ is the xcoordinate for t
 
 - 5. Use the alignment computed in step 4, to compute the median x -coordinate for all table columns and the me-
 
-dian cell size for all table cells. The usage of median during the computations, helps to eliminate outliers caused by occasional column spans which are usually wider than the normal.
-
 - 6. Snap all cells with bad IOU to their corresponding median x -coordinates and cell sizes.
 
 - 7. Generate a new set of pair-wise matches between the corrected bounding boxes and PDF cells. This time use a modified version of the IOU metric, where the area of the intersection between the predicted and PDF cells is divided by the PDF cell area. In case there are multiple matches for the same PDF cell, the prediction with the higher score is preferred. This covers the cases where the PDF cells are smaller than the area of predicted or corrected prediction cells.
@@ -446,10 +437,6 @@ Aditional images with examples of TableFormer predictions and post-processing ca
 
 Figure 8: Example of a table with multi-line header.
 
-
-
-<!-- image -->
-
 Figure 9: Example of a table with big empty distance between cells.
 
 
@@ -460,11 +447,15 @@ Figure 10: Example of a complex table with empty cells.
 
 
 
+<!-- image -->
+
+<!-- image -->
+
 Figure 11: Simple table with different style and empty cells.
+
 <!-- image -->
 
 Figure 12: Simple table predictions and post processing.
-<!-- image -->
 
 Figure 13: Table predictions example on colorful table.
 <!-- image -->
@@ -491,7 +482,5 @@ Figure 15: Example with triangular table.
 
 Figure 16: Example of how post-processing helps to restore mis-aligned bounding boxes prediction artifact.
 
-
-
 Figure 17: Example of long table. End-to-end example from initial PDF cells to prediction of bounding boxes, post processing and prediction of structure.
 <!-- image -->
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v1/2203.01017v2.pages.json b/tests/data/groundtruth/docling_v1/2203.01017v2.pages.json
index 1d446e1f..21d69253 100644
--- a/tests/data/groundtruth/docling_v1/2203.01017v2.pages.json
+++ b/tests/data/groundtruth/docling_v1/2203.01017v2.pages.json
@@ -1 +1 @@
-[{"page_no": 0, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "TableFormer: Table Structure Understanding with Transformers.", "bbox": {"l": 96.301003, "t": 107.03412000000003, "r": 498.92708999999996, "b": 119.93133999999998, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Ahmed Nassar, Nikolaos Livathinos, Maksym Lysak, Peter Staar", "bbox": {"l": 142.47701, "t": 146.68535999999995, "r": 452.75027, "b": 157.37334999999996, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "IBM Research", "bbox": {"l": 262.918, "t": 160.63239, "r": 332.30597, "b": 171.32037000000003, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "{", "bbox": {"l": 208.123, "t": 175.96123999999998, "r": 212.73083, "b": 184.42553999999996, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "ahn,nli,mly,taa", "bbox": {"l": 212.73, "t": 177.08203000000003, "r": 293.42761, "b": 184.00409000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "}", "bbox": {"l": 293.42798, "t": 175.96123999999998, "r": 298.0358, "b": 184.42553999999996, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "@zurich.ibm.com", "bbox": {"l": 298.03497, "t": 177.08203000000003, "r": 378.73257, "b": 184.00409000000002, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Abstract", "bbox": {"l": 145.99498, "t": 215.48297000000002, "r": 190.48029, "b": 226.23071000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Tables organize valuable content in a concise and com-", "bbox": {"l": 62.066978, "t": 241.39508, "r": 286.36493, "b": 249.98284999999998, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "pact representation. This content is extremely valuable for", "bbox": {"l": 50.111977, "t": 253.3501, "r": 286.36508, "b": 261.93787, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "systems such as search engines, Knowledge Graph\u2019s, etc,", "bbox": {"l": 50.111977, "t": 265.30511, "r": 286.36508, "b": 273.89288, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "since they enhance their predictive capabilities. Unfortu-", "bbox": {"l": 50.111977, "t": 277.26111000000003, "r": 286.36505, "b": 285.84888, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "nately, tables come in a large variety of shapes and sizes.", "bbox": {"l": 50.111977, "t": 289.21609, "r": 286.36505, "b": 297.80386, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Furthermore, they can have complex column/row-header", "bbox": {"l": 50.111977, "t": 301.17108, "r": 286.36505, "b": 309.75884999999994, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "configurations, multiline rows, different variety of separa-", "bbox": {"l": 50.111977, "t": 313.12607, "r": 286.36508, "b": 321.71384, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "tion lines, missing entries, etc. As such, the correct iden-", "bbox": {"l": 50.111977, "t": 325.08105, "r": 286.36508, "b": 333.66882, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "tification of the table-structure from an image is a non-", "bbox": {"l": 50.111977, "t": 337.03604, "r": 286.36505, "b": 345.62381, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "trivial task. In this paper, we present a new table-structure", "bbox": {"l": 50.111977, "t": 348.99203, "r": 286.36508, "b": 357.5798, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "identification model. The latter improves the latest end-to-", "bbox": {"l": 50.111977, "t": 360.94701999999995, "r": 286.36505, "b": 369.53479, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "end deep learning model (i.e. encoder-dual-decoder from", "bbox": {"l": 50.111977, "t": 372.90201, "r": 286.36508, "b": 381.48978, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "PubTabNet) in two significant ways. First, we introduce a", "bbox": {"l": 50.111977, "t": 384.85699, "r": 286.36505, "b": 393.44476, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "new object detection decoder for table-cells. In this way,", "bbox": {"l": 50.111977, "t": 396.81198, "r": 286.36511, "b": 405.39975000000004, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "we can obtain the content of the table-cells from program-", "bbox": {"l": 50.111977, "t": 408.76697, "r": 286.36508, "b": 417.35474, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "matic PDF\u2019s directly from the PDF source and avoid the", "bbox": {"l": 50.111977, "t": 420.72296000000006, "r": 286.36505, "b": 429.31073, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "training of the custom OCR decoders.", "bbox": {"l": 50.111977, "t": 432.67795, "r": 207.23216, "b": 441.26572, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "This architectural", "bbox": {"l": 214.09639, "t": 432.67795, "r": 286.36508, "b": 441.26572, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "change leads to more accurate table-content extraction and", "bbox": {"l": 50.111977, "t": 444.63293, "r": 286.36508, "b": 453.2207, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "allows us to tackle non-english tables. Second, we replace", "bbox": {"l": 50.111977, "t": 456.58792000000005, "r": 286.36505, "b": 465.17569, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "the LSTM decoders with transformer based decoders. This", "bbox": {"l": 50.111977, "t": 468.54291, "r": 286.36505, "b": 477.13068, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "upgrade improves significantly the previous state-of-the-art", "bbox": {"l": 50.111977, "t": 480.4989, "r": 286.36508, "b": 489.08667, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "tree-editing-distance-score (TEDS) from 91% to 98.5% on", "bbox": {"l": 50.111977, "t": 492.45389, "r": 286.36505, "b": 501.04166, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "simple tables and from 88.7% to 95% on complex tables.", "bbox": {"l": 50.111977, "t": 504.40887, "r": 276.65152, "b": 512.9966400000001, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "1.", "bbox": {"l": 50.111977, "t": 539.94276, "r": 58.121296, "b": 550.69049, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "Introduction", "bbox": {"l": 68.800385, "t": 539.94276, "r": 126.94804, "b": 550.69049, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "The occurrence of tables in documents is ubiquitous.", "bbox": {"l": 62.066978, "t": 560.7832, "r": 286.36496, "b": 569.68976, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "They often summarise quantitative or factual data, which is", "bbox": {"l": 50.111977, "t": 572.7382, "r": 286.36508, "b": 581.64476, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "cumbersome to describe in verbose text but nevertheless ex-", "bbox": {"l": 50.111977, "t": 584.69321, "r": 286.36505, "b": 593.5997600000001, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "tremely valuable. Unfortunately, this compact representa-", "bbox": {"l": 50.111977, "t": 596.6492000000001, "r": 286.36505, "b": 605.55576, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "tion is often not easy to parse by machines. There are many", "bbox": {"l": 50.111977, "t": 608.6042, "r": 286.36505, "b": 617.51076, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "implicit conventions used to obtain a compact table repre-", "bbox": {"l": 50.111977, "t": 620.5592, "r": 286.36505, "b": 629.46576, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "sentation. For example, tables often have complex column-", "bbox": {"l": 50.111977, "t": 632.51421, "r": 286.36508, "b": 641.42076, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "and row-headers in order to reduce duplicated cell content.", "bbox": {"l": 50.111977, "t": 644.46921, "r": 286.36508, "b": 653.37576, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "Lines of different shapes and sizes are leveraged to separate", "bbox": {"l": 50.111977, "t": 656.42421, "r": 286.36502, "b": 665.33077, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "content or indicate a tree structure. Additionally, tables can", "bbox": {"l": 50.111977, "t": 668.3802000000001, "r": 286.36505, "b": 677.28677, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "also have empty/missing table-entries or multi-row textual", "bbox": {"l": 50.111977, "t": 680.33521, "r": 286.36505, "b": 689.2417800000001, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "table-entries. Fig. 1 shows a table which presents all these", "bbox": {"l": 50.111977, "t": 692.290207, "r": 286.36505, "b": 701.196777, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "issues.", "bbox": {"l": 50.111977, "t": 704.245209, "r": 76.403275, "b": 713.151779, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "a.", "bbox": {"l": 315.56702, "t": 218.00684, "r": 324.01007, "b": 226.75482, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Picture of a table:", "bbox": {"l": 328.2316, "t": 218.00684, "r": 408.4407, "b": 226.75482, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "b.", "bbox": {"l": 315.56702, "t": 313.69478999999995, "r": 325.05786, "b": 322.44281, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Red-annotation of bounding boxes,", "bbox": {"l": 329.80325, "t": 313.69478999999995, "r": 486.40194999999994, "b": 322.44281, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Blue-predictions by TableFormer", "bbox": {"l": 326.46252, "t": 324.49478, "r": 472.47411999999997, "b": 333.2428, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "c.", "bbox": {"l": 315.56702, "t": 420.1828, "r": 324.81039, "b": 428.93082, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Structure predicted by TableFormer:", "bbox": {"l": 329.4321, "t": 420.1828, "r": 491.1912500000001, "b": 428.93082, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "1", "bbox": {"l": 408.14752, "t": 342.82828, "r": 412.54001, "b": 351.61322, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "0", "bbox": {"l": 356.11011, "t": 341.57217, "r": 360.50259, "b": 350.35712, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "2", "bbox": {"l": 500.6777, "t": 340.93768, "r": 505.0701900000001, "b": 349.7226299999999, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "3", "bbox": {"l": 356.13382, "t": 351.74789, "r": 360.52631, "b": 360.53284, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "4", "bbox": {"l": 402.53992, "t": 355.8765, "r": 406.9324, "b": 364.66144, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "5", "bbox": {"l": 448.58178999999996, "t": 352.84018, "r": 452.97427, "b": 361.62512, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "6", "bbox": {"l": 491.65161000000006, "t": 353.70657, "r": 496.0441, "b": 362.49152, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "7", "bbox": {"l": 535.13843, "t": 353.33969, "r": 539.53088, "b": 362.12463, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "8", "bbox": {"l": 348.82822, "t": 387.09781, "r": 353.2207, "b": 395.88275, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "9", "bbox": {"l": 389.27151, "t": 375.37228, "r": 393.664, "b": 384.15723, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "10", "bbox": {"l": 442.67479999999995, "t": 375.64621, "r": 451.45889000000005, "b": 384.43115, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "11", "bbox": {"l": 477.4382299999999, "t": 375.534, "r": 485.90167, "b": 384.31894000000005, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "12", "bbox": {"l": 522.57263, "t": 375.64621, "r": 531.35669, "b": 384.43115, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "13", "bbox": {"l": 400.22992, "t": 387.11429, "r": 409.01401, "b": 395.89923, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "14", "bbox": {"l": 442.30792, "t": 386.98981000000003, "r": 451.0920100000001, "b": 395.77475000000004, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "15", "bbox": {"l": 478.21941999999996, "t": 387.37469, "r": 487.00351000000006, "b": 396.15964, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "16", "bbox": {"l": 523.2287, "t": 386.98981000000003, "r": 532.01276, "b": 395.77475000000004, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "1", "bbox": {"l": 411.57233, "t": 399.42477, "r": 415.96481, "b": 408.20972, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "7", "bbox": {"l": 415.96393, "t": 399.42477, "r": 420.35641, "b": 408.20972, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "18", "bbox": {"l": 442.30521, "t": 399.0371999999999, "r": 451.08929, "b": 407.82213999999993, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "19", "bbox": {"l": 478.77893, "t": 398.99639999999994, "r": 487.56302, "b": 407.78133999999994, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "20", "bbox": {"l": 523.97241, "t": 398.6114799999999, "r": 532.75647, "b": 407.39642, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "1", "bbox": {"l": 347.24872, "t": 437.68588, "r": 351.6412, "b": 446.47083, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "0", "bbox": {"l": 318.88071, "t": 437.68588, "r": 323.27319, "b": 446.47083, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "2", "bbox": {"l": 394.10422, "t": 437.68588, "r": 398.4967, "b": 446.47083, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "3", "bbox": {"l": 318.77316, "t": 449.5455, "r": 323.16565, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "4", "bbox": {"l": 347.24872, "t": 449.5455, "r": 351.6412, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "5", "bbox": {"l": 394.10422, "t": 449.5455, "r": 398.4967, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "6", "bbox": {"l": 440.95941000000005, "t": 449.5455, "r": 445.3519, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "7", "bbox": {"l": 487.81491, "t": 449.5455, "r": 492.2074, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "8", "bbox": {"l": 318.77316, "t": 473.70425, "r": 323.16565, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "9", "bbox": {"l": 347.24872, "t": 461.8446, "r": 351.6412, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "10", "bbox": {"l": 394.10422, "t": 461.8446, "r": 402.88831, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "11", "bbox": {"l": 440.95941000000005, "t": 461.8446, "r": 449.42285, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "12", "bbox": {"l": 487.81491, "t": 461.8446, "r": 496.599, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "13", "bbox": {"l": 347.24872, "t": 473.70425, "r": 356.03281, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "14", "bbox": {"l": 394.10422, "t": 473.70425, "r": 402.88831, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "15", "bbox": {"l": 440.95941000000005, "t": 473.70425, "r": 449.7435, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "16", "bbox": {"l": 487.81491, "t": 473.70425, "r": 496.599, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "17", "bbox": {"l": 347.24872, "t": 485.12469, "r": 356.03281, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "18", "bbox": {"l": 394.10422, "t": 485.12469, "r": 402.88831, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "19", "bbox": {"l": 440.95941000000005, "t": 485.12469, "r": 449.7435, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "20", "bbox": {"l": 487.81491, "t": 485.12469, "r": 496.599, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "1", "bbox": {"l": 451.9457100000001, "t": 235.34704999999997, "r": 457.95050000000003, "b": 245.47748, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "3", "bbox": {"l": 385.09399, "t": 357.76030999999995, "r": 391.09879, "b": 367.89072, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "3", "bbox": {"l": 366.70102, "t": 449.12082, "r": 372.70581, "b": 459.25122, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "2", "bbox": {"l": 331.19681, "t": 269.35266, "r": 337.2016, "b": 279.48308999999995, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "2", "bbox": {"l": 333.43451, "t": 380.7265, "r": 339.4393, "b": 390.85689999999994, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "2", "bbox": {"l": 331.90424, "t": 473.32291, "r": 337.90903, "b": 483.45331, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "1", "bbox": {"l": 478.07210999999995, "t": 341.0368000000001, "r": 484.0769, "b": 351.16720999999995, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "1", "bbox": {"l": 459.87621999999993, "t": 437.5936, "r": 465.88101, "b": 447.724, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "3", "bbox": {"l": 384.0329, "t": 252.67895999999996, "r": 390.03769, "b": 262.80939, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "Figure 1:", "bbox": {"l": 308.862, "t": 514.50037, "r": 345.73361, "b": 523.40692, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "Picture of a table with subtle, complex features", "bbox": {"l": 353.17566, "t": 514.50037, "r": 545.11511, "b": 523.40692, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "such as (1) multi-column headers, (2) cell with multi-row", "bbox": {"l": 308.862, "t": 526.45535, "r": 545.11511, "b": 535.3619100000001, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "text and (3) cells with no content. Image from PubTabNet", "bbox": {"l": 308.862, "t": 538.41035, "r": 545.11517, "b": 547.31691, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "evaluation set, filename: \u2018PMC2944238 004 02\u2019.", "bbox": {"l": 308.862, "t": 550.36635, "r": 505.6917700000001, "b": 559.2729, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "Recently, significant progress has been made with vi-", "bbox": {"l": 320.81699, "t": 584.40936, "r": 545.11493, "b": 593.31592, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "sion based approaches to extract tables in documents. For", "bbox": {"l": 308.862, "t": 596.36436, "r": 545.11517, "b": 605.2709199999999, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "the sake of completeness, the issue of table extraction from", "bbox": {"l": 308.862, "t": 608.31937, "r": 545.11511, "b": 617.22592, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "documents is typically decomposed into two separate chal-", "bbox": {"l": 308.862, "t": 620.27437, "r": 545.11505, "b": 629.18092, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "lenges, i.e.", "bbox": {"l": 308.862, "t": 632.23036, "r": 353.6937, "b": 641.13692, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "(1)", "bbox": {"l": 362.11209, "t": 632.23036, "r": 374.66617, "b": 641.13692, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "finding the location of the table(s) on a", "bbox": {"l": 377.35785, "t": 632.23036, "r": 545.11505, "b": 641.13692, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "document-page and (2) finding the structure of a given table", "bbox": {"l": 308.862, "t": 644.18536, "r": 545.11517, "b": 653.09192, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "in the document.", "bbox": {"l": 308.862, "t": 656.14037, "r": 375.55167, "b": 665.04693, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "The first problem is called table-location and has been", "bbox": {"l": 320.81699, "t": 668.38036, "r": 545.11493, "b": 677.28693, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "previously addressed [30, 38, 19, 21, 23, 26, 8] with state-", "bbox": {"l": 308.862, "t": 680.33536, "r": 545.11511, "b": 689.24193, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "of-the-art object-detection networks (e.g. YOLO and later", "bbox": {"l": 308.862, "t": 692.290359, "r": 545.11511, "b": 701.19693, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "on Mask-RCNN [9]). For all practical purposes, it can be", "bbox": {"l": 308.862, "t": 704.245361, "r": 545.11499, "b": 713.151932, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "1", "bbox": {"l": 295.121, "t": 734.133366, "r": 300.10229, "b": 743.039928, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "arXiv:2203.01017v2 [cs.CV] 11 Mar 2022", "bbox": {"l": 18.340221, "t": 207.82001000000002, "r": 36.339779, "b": 560.00003, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 8, "label": "section_header", "bbox": {"l": 96.301003, "t": 107.03412000000003, "r": 498.92708999999996, "b": 119.93133999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.8868061304092407, "cells": [{"id": 0, "text": "TableFormer: Table Structure Understanding with Transformers.", "bbox": {"l": 96.301003, "t": 107.03412000000003, "r": 498.92708999999996, "b": 119.93133999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "section_header", "bbox": {"l": 142.47701, "t": 146.68535999999995, "r": 452.75027, "b": 171.32037000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.7586213946342468, "cells": [{"id": 1, "text": "Ahmed Nassar, Nikolaos Livathinos, Maksym Lysak, Peter Staar", "bbox": {"l": 142.47701, "t": 146.68535999999995, "r": 452.75027, "b": 157.37334999999996, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "IBM Research", "bbox": {"l": 262.918, "t": 160.63239, "r": 332.30597, "b": 171.32037000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "key_value_region", "bbox": {"l": 208.123, "t": 175.96123999999998, "r": 378.73257, "b": 184.42553999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.48547235131263733, "cells": [{"id": 3, "text": "{", "bbox": {"l": 208.123, "t": 175.96123999999998, "r": 212.73083, "b": 184.42553999999996, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "ahn,nli,mly,taa", "bbox": {"l": 212.73, "t": 177.08203000000003, "r": 293.42761, "b": 184.00409000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "}", "bbox": {"l": 293.42798, "t": 175.96123999999998, "r": 298.0358, "b": 184.42553999999996, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "@zurich.ibm.com", "bbox": {"l": 298.03497, "t": 177.08203000000003, "r": 378.73257, "b": 184.00409000000002, "coord_origin": "TOPLEFT"}}], "children": [{"id": 7, "label": "text", "bbox": {"l": 208.123, "t": 175.96123999999998, "r": 378.73257, "b": 184.42553999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9096333980560303, "cells": [{"id": 3, "text": "{", "bbox": {"l": 208.123, "t": 175.96123999999998, "r": 212.73083, "b": 184.42553999999996, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "ahn,nli,mly,taa", "bbox": {"l": 212.73, "t": 177.08203000000003, "r": 293.42761, "b": 184.00409000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "}", "bbox": {"l": 293.42798, "t": 175.96123999999998, "r": 298.0358, "b": 184.42553999999996, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "@zurich.ibm.com", "bbox": {"l": 298.03497, "t": 177.08203000000003, "r": 378.73257, "b": 184.00409000000002, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 5, "label": "section_header", "bbox": {"l": 145.99498, "t": 215.48297000000002, "r": 190.48029, "b": 226.23071000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9258671998977661, "cells": [{"id": 7, "text": "Abstract", "bbox": {"l": 145.99498, "t": 215.48297000000002, "r": 190.48029, "b": 226.23071000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 50.111977, "t": 241.39508, "r": 286.36511, "b": 512.9966400000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9838882088661194, "cells": [{"id": 8, "text": "Tables organize valuable content in a concise and com-", "bbox": {"l": 62.066978, "t": 241.39508, "r": 286.36493, "b": 249.98284999999998, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "pact representation. This content is extremely valuable for", "bbox": {"l": 50.111977, "t": 253.3501, "r": 286.36508, "b": 261.93787, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "systems such as search engines, Knowledge Graph\u2019s, etc,", "bbox": {"l": 50.111977, "t": 265.30511, "r": 286.36508, "b": 273.89288, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "since they enhance their predictive capabilities. Unfortu-", "bbox": {"l": 50.111977, "t": 277.26111000000003, "r": 286.36505, "b": 285.84888, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "nately, tables come in a large variety of shapes and sizes.", "bbox": {"l": 50.111977, "t": 289.21609, "r": 286.36505, "b": 297.80386, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Furthermore, they can have complex column/row-header", "bbox": {"l": 50.111977, "t": 301.17108, "r": 286.36505, "b": 309.75884999999994, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "configurations, multiline rows, different variety of separa-", "bbox": {"l": 50.111977, "t": 313.12607, "r": 286.36508, "b": 321.71384, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "tion lines, missing entries, etc. As such, the correct iden-", "bbox": {"l": 50.111977, "t": 325.08105, "r": 286.36508, "b": 333.66882, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "tification of the table-structure from an image is a non-", "bbox": {"l": 50.111977, "t": 337.03604, "r": 286.36505, "b": 345.62381, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "trivial task. In this paper, we present a new table-structure", "bbox": {"l": 50.111977, "t": 348.99203, "r": 286.36508, "b": 357.5798, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "identification model. The latter improves the latest end-to-", "bbox": {"l": 50.111977, "t": 360.94701999999995, "r": 286.36505, "b": 369.53479, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "end deep learning model (i.e. encoder-dual-decoder from", "bbox": {"l": 50.111977, "t": 372.90201, "r": 286.36508, "b": 381.48978, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "PubTabNet) in two significant ways. First, we introduce a", "bbox": {"l": 50.111977, "t": 384.85699, "r": 286.36505, "b": 393.44476, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "new object detection decoder for table-cells. In this way,", "bbox": {"l": 50.111977, "t": 396.81198, "r": 286.36511, "b": 405.39975000000004, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "we can obtain the content of the table-cells from program-", "bbox": {"l": 50.111977, "t": 408.76697, "r": 286.36508, "b": 417.35474, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "matic PDF\u2019s directly from the PDF source and avoid the", "bbox": {"l": 50.111977, "t": 420.72296000000006, "r": 286.36505, "b": 429.31073, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "training of the custom OCR decoders.", "bbox": {"l": 50.111977, "t": 432.67795, "r": 207.23216, "b": 441.26572, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "This architectural", "bbox": {"l": 214.09639, "t": 432.67795, "r": 286.36508, "b": 441.26572, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "change leads to more accurate table-content extraction and", "bbox": {"l": 50.111977, "t": 444.63293, "r": 286.36508, "b": 453.2207, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "allows us to tackle non-english tables. Second, we replace", "bbox": {"l": 50.111977, "t": 456.58792000000005, "r": 286.36505, "b": 465.17569, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "the LSTM decoders with transformer based decoders. This", "bbox": {"l": 50.111977, "t": 468.54291, "r": 286.36505, "b": 477.13068, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "upgrade improves significantly the previous state-of-the-art", "bbox": {"l": 50.111977, "t": 480.4989, "r": 286.36508, "b": 489.08667, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "tree-editing-distance-score (TEDS) from 91% to 98.5% on", "bbox": {"l": 50.111977, "t": 492.45389, "r": 286.36505, "b": 501.04166, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "simple tables and from 88.7% to 95% on complex tables.", "bbox": {"l": 50.111977, "t": 504.40887, "r": 276.65152, "b": 512.9966400000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "section_header", "bbox": {"l": 50.111977, "t": 539.94276, "r": 126.94804, "b": 550.69049, "coord_origin": "TOPLEFT"}, "confidence": 0.9317678213119507, "cells": [{"id": 32, "text": "1.", "bbox": {"l": 50.111977, "t": 539.94276, "r": 58.121296, "b": 550.69049, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "Introduction", "bbox": {"l": 68.800385, "t": 539.94276, "r": 126.94804, "b": 550.69049, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 50.111977, "t": 560.7832, "r": 286.36508, "b": 713.151779, "coord_origin": "TOPLEFT"}, "confidence": 0.9841895699501038, "cells": [{"id": 34, "text": "The occurrence of tables in documents is ubiquitous.", "bbox": {"l": 62.066978, "t": 560.7832, "r": 286.36496, "b": 569.68976, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "They often summarise quantitative or factual data, which is", "bbox": {"l": 50.111977, "t": 572.7382, "r": 286.36508, "b": 581.64476, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "cumbersome to describe in verbose text but nevertheless ex-", "bbox": {"l": 50.111977, "t": 584.69321, "r": 286.36505, "b": 593.5997600000001, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "tremely valuable. Unfortunately, this compact representa-", "bbox": {"l": 50.111977, "t": 596.6492000000001, "r": 286.36505, "b": 605.55576, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "tion is often not easy to parse by machines. There are many", "bbox": {"l": 50.111977, "t": 608.6042, "r": 286.36505, "b": 617.51076, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "implicit conventions used to obtain a compact table repre-", "bbox": {"l": 50.111977, "t": 620.5592, "r": 286.36505, "b": 629.46576, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "sentation. For example, tables often have complex column-", "bbox": {"l": 50.111977, "t": 632.51421, "r": 286.36508, "b": 641.42076, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "and row-headers in order to reduce duplicated cell content.", "bbox": {"l": 50.111977, "t": 644.46921, "r": 286.36508, "b": 653.37576, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "Lines of different shapes and sizes are leveraged to separate", "bbox": {"l": 50.111977, "t": 656.42421, "r": 286.36502, "b": 665.33077, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "content or indicate a tree structure. Additionally, tables can", "bbox": {"l": 50.111977, "t": 668.3802000000001, "r": 286.36505, "b": 677.28677, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "also have empty/missing table-entries or multi-row textual", "bbox": {"l": 50.111977, "t": 680.33521, "r": 286.36505, "b": 689.2417800000001, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "table-entries. Fig. 1 shows a table which presents all these", "bbox": {"l": 50.111977, "t": 692.290207, "r": 286.36505, "b": 701.196777, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "issues.", "bbox": {"l": 50.111977, "t": 704.245209, "r": 76.403275, "b": 713.151779, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "section_header", "bbox": {"l": 315.56702, "t": 218.00684, "r": 408.4407, "b": 226.75482, "coord_origin": "TOPLEFT"}, "confidence": 0.6724023818969727, "cells": [{"id": 47, "text": "a.", "bbox": {"l": 315.56702, "t": 218.00684, "r": 324.01007, "b": 226.75482, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Picture of a table:", "bbox": {"l": 328.2316, "t": 218.00684, "r": 408.4407, "b": 226.75482, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "list_item", "bbox": {"l": 315.56702, "t": 313.69478999999995, "r": 486.40194999999994, "b": 333.2428, "coord_origin": "TOPLEFT"}, "confidence": 0.5549326539039612, "cells": [{"id": 49, "text": "b.", "bbox": {"l": 315.56702, "t": 313.69478999999995, "r": 325.05786, "b": 322.44281, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Red-annotation of bounding boxes,", "bbox": {"l": 329.80325, "t": 313.69478999999995, "r": 486.40194999999994, "b": 322.44281, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Blue-predictions by TableFormer", "bbox": {"l": 326.46252, "t": 324.49478, "r": 472.47411999999997, "b": 333.2428, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "list_item", "bbox": {"l": 315.56702, "t": 420.1828, "r": 491.1912500000001, "b": 428.93082, "coord_origin": "TOPLEFT"}, "confidence": 0.5501352548599243, "cells": [{"id": 52, "text": "c.", "bbox": {"l": 315.56702, "t": 420.1828, "r": 324.81039, "b": 428.93082, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Structure predicted by TableFormer:", "bbox": {"l": 329.4321, "t": 420.1828, "r": 491.1912500000001, "b": 428.93082, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "picture", "bbox": {"l": 314.78173828125, "t": 338.0652770996094, "r": 539.1802978515625, "b": 410.0494384765625, "coord_origin": "TOPLEFT"}, "confidence": 0.8742762207984924, "cells": [{"id": 54, "text": "1", "bbox": {"l": 408.14752, "t": 342.82828, "r": 412.54001, "b": 351.61322, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "0", "bbox": {"l": 356.11011, "t": 341.57217, "r": 360.50259, "b": 350.35712, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "2", "bbox": {"l": 500.6777, "t": 340.93768, "r": 505.0701900000001, "b": 349.7226299999999, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "3", "bbox": {"l": 356.13382, "t": 351.74789, "r": 360.52631, "b": 360.53284, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "4", "bbox": {"l": 402.53992, "t": 355.8765, "r": 406.9324, "b": 364.66144, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "5", "bbox": {"l": 448.58178999999996, "t": 352.84018, "r": 452.97427, "b": 361.62512, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "6", "bbox": {"l": 491.65161000000006, "t": 353.70657, "r": 496.0441, "b": 362.49152, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "7", "bbox": {"l": 535.13843, "t": 353.33969, "r": 539.53088, "b": 362.12463, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "8", "bbox": {"l": 348.82822, "t": 387.09781, "r": 353.2207, "b": 395.88275, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "9", "bbox": {"l": 389.27151, "t": 375.37228, "r": 393.664, "b": 384.15723, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "10", "bbox": {"l": 442.67479999999995, "t": 375.64621, "r": 451.45889000000005, "b": 384.43115, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "11", "bbox": {"l": 477.4382299999999, "t": 375.534, "r": 485.90167, "b": 384.31894000000005, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "12", "bbox": {"l": 522.57263, "t": 375.64621, "r": 531.35669, "b": 384.43115, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "13", "bbox": {"l": 400.22992, "t": 387.11429, "r": 409.01401, "b": 395.89923, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "14", "bbox": {"l": 442.30792, "t": 386.98981000000003, "r": 451.0920100000001, "b": 395.77475000000004, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "15", "bbox": {"l": 478.21941999999996, "t": 387.37469, "r": 487.00351000000006, "b": 396.15964, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "16", "bbox": {"l": 523.2287, "t": 386.98981000000003, "r": 532.01276, "b": 395.77475000000004, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "1", "bbox": {"l": 411.57233, "t": 399.42477, "r": 415.96481, "b": 408.20972, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "7", "bbox": {"l": 415.96393, "t": 399.42477, "r": 420.35641, "b": 408.20972, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "18", "bbox": {"l": 442.30521, "t": 399.0371999999999, "r": 451.08929, "b": 407.82213999999993, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "19", "bbox": {"l": 478.77893, "t": 398.99639999999994, "r": 487.56302, "b": 407.78133999999994, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "20", "bbox": {"l": 523.97241, "t": 398.6114799999999, "r": 532.75647, "b": 407.39642, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "3", "bbox": {"l": 385.09399, "t": 357.76030999999995, "r": 391.09879, "b": 367.89072, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "2", "bbox": {"l": 333.43451, "t": 380.7265, "r": 339.4393, "b": 390.85689999999994, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "1", "bbox": {"l": 478.07210999999995, "t": 341.0368000000001, "r": 484.0769, "b": 351.16720999999995, "coord_origin": "TOPLEFT"}}], "children": [{"id": 19, "label": "text", "bbox": {"l": 408.14752, "t": 342.82828, "r": 412.54001, "b": 351.61322, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "1", "bbox": {"l": 408.14752, "t": 342.82828, "r": 412.54001, "b": 351.61322, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 356.11011, "t": 341.57217, "r": 360.50259, "b": 350.35712, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "0", "bbox": {"l": 356.11011, "t": 341.57217, "r": 360.50259, "b": 350.35712, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 500.6777, "t": 340.93768, "r": 505.0701900000001, "b": 349.7226299999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "2", "bbox": {"l": 500.6777, "t": 340.93768, "r": 505.0701900000001, "b": 349.7226299999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 356.13382, "t": 351.74789, "r": 360.52631, "b": 360.53284, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "3", "bbox": {"l": 356.13382, "t": 351.74789, "r": 360.52631, "b": 360.53284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 402.53992, "t": 355.8765, "r": 406.9324, "b": 364.66144, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "4", "bbox": {"l": 402.53992, "t": 355.8765, "r": 406.9324, "b": 364.66144, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 448.58178999999996, "t": 352.84018, "r": 452.97427, "b": 361.62512, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "5", "bbox": {"l": 448.58178999999996, "t": 352.84018, "r": 452.97427, "b": 361.62512, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 491.65161000000006, "t": 353.70657, "r": 496.0441, "b": 362.49152, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "6", "bbox": {"l": 491.65161000000006, "t": 353.70657, "r": 496.0441, "b": 362.49152, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 535.13843, "t": 353.33969, "r": 539.53088, "b": 362.12463, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "7", "bbox": {"l": 535.13843, "t": 353.33969, "r": 539.53088, "b": 362.12463, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 348.82822, "t": 387.09781, "r": 353.2207, "b": 395.88275, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "8", "bbox": {"l": 348.82822, "t": 387.09781, "r": 353.2207, "b": 395.88275, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 389.27151, "t": 375.37228, "r": 393.664, "b": 384.15723, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "9", "bbox": {"l": 389.27151, "t": 375.37228, "r": 393.664, "b": 384.15723, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 442.67479999999995, "t": 375.64621, "r": 451.45889000000005, "b": 384.43115, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "10", "bbox": {"l": 442.67479999999995, "t": 375.64621, "r": 451.45889000000005, "b": 384.43115, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 477.4382299999999, "t": 375.534, "r": 485.90167, "b": 384.31894000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "11", "bbox": {"l": 477.4382299999999, "t": 375.534, "r": 485.90167, "b": 384.31894000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 522.57263, "t": 375.64621, "r": 531.35669, "b": 384.43115, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "12", "bbox": {"l": 522.57263, "t": 375.64621, "r": 531.35669, "b": 384.43115, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 400.22992, "t": 387.11429, "r": 409.01401, "b": 395.89923, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "13", "bbox": {"l": 400.22992, "t": 387.11429, "r": 409.01401, "b": 395.89923, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 442.30792, "t": 386.98981000000003, "r": 451.0920100000001, "b": 395.77475000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "14", "bbox": {"l": 442.30792, "t": 386.98981000000003, "r": 451.0920100000001, "b": 395.77475000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 478.21941999999996, "t": 387.37469, "r": 487.00351000000006, "b": 396.15964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "15", "bbox": {"l": 478.21941999999996, "t": 387.37469, "r": 487.00351000000006, "b": 396.15964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 523.2287, "t": 386.98981000000003, "r": 532.01276, "b": 395.77475000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "16", "bbox": {"l": 523.2287, "t": 386.98981000000003, "r": 532.01276, "b": 395.77475000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 411.57233, "t": 399.42477, "r": 415.96481, "b": 408.20972, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "1", "bbox": {"l": 411.57233, "t": 399.42477, "r": 415.96481, "b": 408.20972, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 415.96393, "t": 399.42477, "r": 420.35641, "b": 408.20972, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "7", "bbox": {"l": 415.96393, "t": 399.42477, "r": 420.35641, "b": 408.20972, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 442.30521, "t": 399.0371999999999, "r": 451.08929, "b": 407.82213999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "18", "bbox": {"l": 442.30521, "t": 399.0371999999999, "r": 451.08929, "b": 407.82213999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 478.77893, "t": 398.99639999999994, "r": 487.56302, "b": 407.78133999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "19", "bbox": {"l": 478.77893, "t": 398.99639999999994, "r": 487.56302, "b": 407.78133999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 523.97241, "t": 398.6114799999999, "r": 532.75647, "b": 407.39642, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "20", "bbox": {"l": 523.97241, "t": 398.6114799999999, "r": 532.75647, "b": 407.39642, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 385.09399, "t": 357.76030999999995, "r": 391.09879, "b": 367.89072, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "3", "bbox": {"l": 385.09399, "t": 357.76030999999995, "r": 391.09879, "b": 367.89072, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 333.43451, "t": 380.7265, "r": 339.4393, "b": 390.85689999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "2", "bbox": {"l": 333.43451, "t": 380.7265, "r": 339.4393, "b": 390.85689999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 478.07210999999995, "t": 341.0368000000001, "r": 484.0769, "b": 351.16720999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": "1", "bbox": {"l": 478.07210999999995, "t": 341.0368000000001, "r": 484.0769, "b": 351.16720999999995, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 23, "label": "picture", "bbox": {"l": 315.7172546386719, "t": 433.823486328125, "r": 536.835693359375, "b": 496.0290222167969, "coord_origin": "TOPLEFT"}, "confidence": 0.5088647603988647, "cells": [{"id": 76, "text": "1", "bbox": {"l": 347.24872, "t": 437.68588, "r": 351.6412, "b": 446.47083, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "0", "bbox": {"l": 318.88071, "t": 437.68588, "r": 323.27319, "b": 446.47083, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "2", "bbox": {"l": 394.10422, "t": 437.68588, "r": 398.4967, "b": 446.47083, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "3", "bbox": {"l": 318.77316, "t": 449.5455, "r": 323.16565, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "4", "bbox": {"l": 347.24872, "t": 449.5455, "r": 351.6412, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "5", "bbox": {"l": 394.10422, "t": 449.5455, "r": 398.4967, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "6", "bbox": {"l": 440.95941000000005, "t": 449.5455, "r": 445.3519, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "7", "bbox": {"l": 487.81491, "t": 449.5455, "r": 492.2074, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "8", "bbox": {"l": 318.77316, "t": 473.70425, "r": 323.16565, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "9", "bbox": {"l": 347.24872, "t": 461.8446, "r": 351.6412, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "10", "bbox": {"l": 394.10422, "t": 461.8446, "r": 402.88831, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "11", "bbox": {"l": 440.95941000000005, "t": 461.8446, "r": 449.42285, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "12", "bbox": {"l": 487.81491, "t": 461.8446, "r": 496.599, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "13", "bbox": {"l": 347.24872, "t": 473.70425, "r": 356.03281, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "14", "bbox": {"l": 394.10422, "t": 473.70425, "r": 402.88831, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "15", "bbox": {"l": 440.95941000000005, "t": 473.70425, "r": 449.7435, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "16", "bbox": {"l": 487.81491, "t": 473.70425, "r": 496.599, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "17", "bbox": {"l": 347.24872, "t": 485.12469, "r": 356.03281, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "18", "bbox": {"l": 394.10422, "t": 485.12469, "r": 402.88831, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "19", "bbox": {"l": 440.95941000000005, "t": 485.12469, "r": 449.7435, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "20", "bbox": {"l": 487.81491, "t": 485.12469, "r": 496.599, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "3", "bbox": {"l": 366.70102, "t": 449.12082, "r": 372.70581, "b": 459.25122, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "2", "bbox": {"l": 331.90424, "t": 473.32291, "r": 337.90903, "b": 483.45331, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "1", "bbox": {"l": 459.87621999999993, "t": 437.5936, "r": 465.88101, "b": 447.724, "coord_origin": "TOPLEFT"}}], "children": [{"id": 41, "label": "text", "bbox": {"l": 347.24872, "t": 437.68588, "r": 351.6412, "b": 446.47083, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "1", "bbox": {"l": 347.24872, "t": 437.68588, "r": 351.6412, "b": 446.47083, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 318.88071, "t": 437.68588, "r": 323.27319, "b": 446.47083, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "0", "bbox": {"l": 318.88071, "t": 437.68588, "r": 323.27319, "b": 446.47083, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 394.10422, "t": 437.68588, "r": 398.4967, "b": 446.47083, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "2", "bbox": {"l": 394.10422, "t": 437.68588, "r": 398.4967, "b": 446.47083, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 318.77316, "t": 449.5455, "r": 323.16565, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "3", "bbox": {"l": 318.77316, "t": 449.5455, "r": 323.16565, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 347.24872, "t": 449.5455, "r": 351.6412, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "4", "bbox": {"l": 347.24872, "t": 449.5455, "r": 351.6412, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 394.10422, "t": 449.5455, "r": 398.4967, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "5", "bbox": {"l": 394.10422, "t": 449.5455, "r": 398.4967, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 440.95941000000005, "t": 449.5455, "r": 445.3519, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "6", "bbox": {"l": 440.95941000000005, "t": 449.5455, "r": 445.3519, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 487.81491, "t": 449.5455, "r": 492.2074, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "7", "bbox": {"l": 487.81491, "t": 449.5455, "r": 492.2074, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 318.77316, "t": 473.70425, "r": 323.16565, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "8", "bbox": {"l": 318.77316, "t": 473.70425, "r": 323.16565, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 347.24872, "t": 461.8446, "r": 351.6412, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "9", "bbox": {"l": 347.24872, "t": 461.8446, "r": 351.6412, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 394.10422, "t": 461.8446, "r": 402.88831, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "10", "bbox": {"l": 394.10422, "t": 461.8446, "r": 402.88831, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 440.95941000000005, "t": 461.8446, "r": 449.42285, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "11", "bbox": {"l": 440.95941000000005, "t": 461.8446, "r": 449.42285, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 487.81491, "t": 461.8446, "r": 496.599, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "12", "bbox": {"l": 487.81491, "t": 461.8446, "r": 496.599, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 347.24872, "t": 473.70425, "r": 356.03281, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "13", "bbox": {"l": 347.24872, "t": 473.70425, "r": 356.03281, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 394.10422, "t": 473.70425, "r": 402.88831, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "14", "bbox": {"l": 394.10422, "t": 473.70425, "r": 402.88831, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 440.95941000000005, "t": 473.70425, "r": 449.7435, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "15", "bbox": {"l": 440.95941000000005, "t": 473.70425, "r": 449.7435, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 487.81491, "t": 473.70425, "r": 496.599, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "16", "bbox": {"l": 487.81491, "t": 473.70425, "r": 496.599, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 347.24872, "t": 485.12469, "r": 356.03281, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "17", "bbox": {"l": 347.24872, "t": 485.12469, "r": 356.03281, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 394.10422, "t": 485.12469, "r": 402.88831, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "18", "bbox": {"l": 394.10422, "t": 485.12469, "r": 402.88831, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 440.95941000000005, "t": 485.12469, "r": 449.7435, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "19", "bbox": {"l": 440.95941000000005, "t": 485.12469, "r": 449.7435, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 487.81491, "t": 485.12469, "r": 496.599, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "20", "bbox": {"l": 487.81491, "t": 485.12469, "r": 496.599, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 366.70102, "t": 449.12082, "r": 372.70581, "b": 459.25122, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "3", "bbox": {"l": 366.70102, "t": 449.12082, "r": 372.70581, "b": 459.25122, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 331.90424, "t": 473.32291, "r": 337.90903, "b": 483.45331, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "2", "bbox": {"l": 331.90424, "t": 473.32291, "r": 337.90903, "b": 483.45331, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 459.87621999999993, "t": 437.5936, "r": 465.88101, "b": 447.724, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "1", "bbox": {"l": 459.87621999999993, "t": 437.5936, "r": 465.88101, "b": 447.724, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 11, "label": "table", "bbox": {"l": 315.7172546386719, "t": 433.823486328125, "r": 536.835693359375, "b": 496.0290222167969, "coord_origin": "TOPLEFT"}, "confidence": 0.8056104183197021, "cells": [{"id": 76, "text": "1", "bbox": {"l": 347.24872, "t": 437.68588, "r": 351.6412, "b": 446.47083, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "0", "bbox": {"l": 318.88071, "t": 437.68588, "r": 323.27319, "b": 446.47083, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "2", "bbox": {"l": 394.10422, "t": 437.68588, "r": 398.4967, "b": 446.47083, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "3", "bbox": {"l": 318.77316, "t": 449.5455, "r": 323.16565, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "4", "bbox": {"l": 347.24872, "t": 449.5455, "r": 351.6412, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "5", "bbox": {"l": 394.10422, "t": 449.5455, "r": 398.4967, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "6", "bbox": {"l": 440.95941000000005, "t": 449.5455, "r": 445.3519, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "7", "bbox": {"l": 487.81491, "t": 449.5455, "r": 492.2074, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "8", "bbox": {"l": 318.77316, "t": 473.70425, "r": 323.16565, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "9", "bbox": {"l": 347.24872, "t": 461.8446, "r": 351.6412, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "10", "bbox": {"l": 394.10422, "t": 461.8446, "r": 402.88831, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "11", "bbox": {"l": 440.95941000000005, "t": 461.8446, "r": 449.42285, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "12", "bbox": {"l": 487.81491, "t": 461.8446, "r": 496.599, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "13", "bbox": {"l": 347.24872, "t": 473.70425, "r": 356.03281, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "14", "bbox": {"l": 394.10422, "t": 473.70425, "r": 402.88831, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "15", "bbox": {"l": 440.95941000000005, "t": 473.70425, "r": 449.7435, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "16", "bbox": {"l": 487.81491, "t": 473.70425, "r": 496.599, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "17", "bbox": {"l": 347.24872, "t": 485.12469, "r": 356.03281, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "18", "bbox": {"l": 394.10422, "t": 485.12469, "r": 402.88831, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "19", "bbox": {"l": 440.95941000000005, "t": 485.12469, "r": 449.7435, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "20", "bbox": {"l": 487.81491, "t": 485.12469, "r": 496.599, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "3", "bbox": {"l": 366.70102, "t": 449.12082, "r": 372.70581, "b": 459.25122, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "2", "bbox": {"l": 331.90424, "t": 473.32291, "r": 337.90903, "b": 483.45331, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "1", "bbox": {"l": 459.87621999999993, "t": 437.5936, "r": 465.88101, "b": 447.724, "coord_origin": "TOPLEFT"}}], "children": [{"id": 41, "label": "text", "bbox": {"l": 347.24872, "t": 437.68588, "r": 351.6412, "b": 446.47083, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "1", "bbox": {"l": 347.24872, "t": 437.68588, "r": 351.6412, "b": 446.47083, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 318.88071, "t": 437.68588, "r": 323.27319, "b": 446.47083, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "0", "bbox": {"l": 318.88071, "t": 437.68588, "r": 323.27319, "b": 446.47083, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 394.10422, "t": 437.68588, "r": 398.4967, "b": 446.47083, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "2", "bbox": {"l": 394.10422, "t": 437.68588, "r": 398.4967, "b": 446.47083, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 318.77316, "t": 449.5455, "r": 323.16565, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "3", "bbox": {"l": 318.77316, "t": 449.5455, "r": 323.16565, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 347.24872, "t": 449.5455, "r": 351.6412, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "4", "bbox": {"l": 347.24872, "t": 449.5455, "r": 351.6412, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 394.10422, "t": 449.5455, "r": 398.4967, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "5", "bbox": {"l": 394.10422, "t": 449.5455, "r": 398.4967, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 440.95941000000005, "t": 449.5455, "r": 445.3519, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "6", "bbox": {"l": 440.95941000000005, "t": 449.5455, "r": 445.3519, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 487.81491, "t": 449.5455, "r": 492.2074, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "7", "bbox": {"l": 487.81491, "t": 449.5455, "r": 492.2074, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 318.77316, "t": 473.70425, "r": 323.16565, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "8", "bbox": {"l": 318.77316, "t": 473.70425, "r": 323.16565, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 347.24872, "t": 461.8446, "r": 351.6412, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "9", "bbox": {"l": 347.24872, "t": 461.8446, "r": 351.6412, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 394.10422, "t": 461.8446, "r": 402.88831, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "10", "bbox": {"l": 394.10422, "t": 461.8446, "r": 402.88831, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 440.95941000000005, "t": 461.8446, "r": 449.42285, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "11", "bbox": {"l": 440.95941000000005, "t": 461.8446, "r": 449.42285, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 487.81491, "t": 461.8446, "r": 496.599, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "12", "bbox": {"l": 487.81491, "t": 461.8446, "r": 496.599, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 347.24872, "t": 473.70425, "r": 356.03281, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "13", "bbox": {"l": 347.24872, "t": 473.70425, "r": 356.03281, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 394.10422, "t": 473.70425, "r": 402.88831, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "14", "bbox": {"l": 394.10422, "t": 473.70425, "r": 402.88831, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 440.95941000000005, "t": 473.70425, "r": 449.7435, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "15", "bbox": {"l": 440.95941000000005, "t": 473.70425, "r": 449.7435, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 487.81491, "t": 473.70425, "r": 496.599, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "16", "bbox": {"l": 487.81491, "t": 473.70425, "r": 496.599, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 347.24872, "t": 485.12469, "r": 356.03281, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "17", "bbox": {"l": 347.24872, "t": 485.12469, "r": 356.03281, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 394.10422, "t": 485.12469, "r": 402.88831, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "18", "bbox": {"l": 394.10422, "t": 485.12469, "r": 402.88831, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 440.95941000000005, "t": 485.12469, "r": 449.7435, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "19", "bbox": {"l": 440.95941000000005, "t": 485.12469, "r": 449.7435, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 487.81491, "t": 485.12469, "r": 496.599, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "20", "bbox": {"l": 487.81491, "t": 485.12469, "r": 496.599, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 366.70102, "t": 449.12082, "r": 372.70581, "b": 459.25122, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "3", "bbox": {"l": 366.70102, "t": 449.12082, "r": 372.70581, "b": 459.25122, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 331.90424, "t": 473.32291, "r": 337.90903, "b": 483.45331, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "2", "bbox": {"l": 331.90424, "t": 473.32291, "r": 337.90903, "b": 483.45331, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 459.87621999999993, "t": 437.5936, "r": 465.88101, "b": 447.724, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "1", "bbox": {"l": 459.87621999999993, "t": 437.5936, "r": 465.88101, "b": 447.724, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 16, "label": "picture", "bbox": {"l": 315.65362548828125, "t": 228.7234344482422, "r": 537.1475219726562, "b": 302.80145263671875, "coord_origin": "TOPLEFT"}, "confidence": 0.608779788017273, "cells": [{"id": 97, "text": "1", "bbox": {"l": 451.9457100000001, "t": 235.34704999999997, "r": 457.95050000000003, "b": 245.47748, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "2", "bbox": {"l": 331.19681, "t": 269.35266, "r": 337.2016, "b": 279.48308999999995, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "3", "bbox": {"l": 384.0329, "t": 252.67895999999996, "r": 390.03769, "b": 262.80939, "coord_origin": "TOPLEFT"}}], "children": [{"id": 62, "label": "text", "bbox": {"l": 451.9457100000001, "t": 235.34704999999997, "r": 457.95050000000003, "b": 245.47748, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "1", "bbox": {"l": 451.9457100000001, "t": 235.34704999999997, "r": 457.95050000000003, "b": 245.47748, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 331.19681, "t": 269.35266, "r": 337.2016, "b": 279.48308999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "2", "bbox": {"l": 331.19681, "t": 269.35266, "r": 337.2016, "b": 279.48308999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 384.0329, "t": 252.67895999999996, "r": 390.03769, "b": 262.80939, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "3", "bbox": {"l": 384.0329, "t": 252.67895999999996, "r": 390.03769, "b": 262.80939, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 15, "label": "table", "bbox": {"l": 315.65362548828125, "t": 228.7234344482422, "r": 537.1475219726562, "b": 302.80145263671875, "coord_origin": "TOPLEFT"}, "confidence": 0.651587724685669, "cells": [{"id": 97, "text": "1", "bbox": {"l": 451.9457100000001, "t": 235.34704999999997, "r": 457.95050000000003, "b": 245.47748, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "2", "bbox": {"l": 331.19681, "t": 269.35266, "r": 337.2016, "b": 279.48308999999995, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "3", "bbox": {"l": 384.0329, "t": 252.67895999999996, "r": 390.03769, "b": 262.80939, "coord_origin": "TOPLEFT"}}], "children": [{"id": 62, "label": "text", "bbox": {"l": 451.9457100000001, "t": 235.34704999999997, "r": 457.95050000000003, "b": 245.47748, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "1", "bbox": {"l": 451.9457100000001, "t": 235.34704999999997, "r": 457.95050000000003, "b": 245.47748, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 331.19681, "t": 269.35266, "r": 337.2016, "b": 279.48308999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "2", "bbox": {"l": 331.19681, "t": 269.35266, "r": 337.2016, "b": 279.48308999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 384.0329, "t": 252.67895999999996, "r": 390.03769, "b": 262.80939, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "3", "bbox": {"l": 384.0329, "t": 252.67895999999996, "r": 390.03769, "b": 262.80939, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 6, "label": "caption", "bbox": {"l": 308.862, "t": 514.50037, "r": 545.11517, "b": 559.2729, "coord_origin": "TOPLEFT"}, "confidence": 0.9214621186256409, "cells": [{"id": 106, "text": "Figure 1:", "bbox": {"l": 308.862, "t": 514.50037, "r": 345.73361, "b": 523.40692, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "Picture of a table with subtle, complex features", "bbox": {"l": 353.17566, "t": 514.50037, "r": 545.11511, "b": 523.40692, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "such as (1) multi-column headers, (2) cell with multi-row", "bbox": {"l": 308.862, "t": 526.45535, "r": 545.11511, "b": 535.3619100000001, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "text and (3) cells with no content. Image from PubTabNet", "bbox": {"l": 308.862, "t": 538.41035, "r": 545.11517, "b": 547.31691, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "evaluation set, filename: \u2018PMC2944238 004 02\u2019.", "bbox": {"l": 308.862, "t": 550.36635, "r": 505.6917700000001, "b": 559.2729, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 308.862, "t": 584.40936, "r": 545.11517, "b": 665.04693, "coord_origin": "TOPLEFT"}, "confidence": 0.9848759770393372, "cells": [{"id": 111, "text": "Recently, significant progress has been made with vi-", "bbox": {"l": 320.81699, "t": 584.40936, "r": 545.11493, "b": 593.31592, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "sion based approaches to extract tables in documents. For", "bbox": {"l": 308.862, "t": 596.36436, "r": 545.11517, "b": 605.2709199999999, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "the sake of completeness, the issue of table extraction from", "bbox": {"l": 308.862, "t": 608.31937, "r": 545.11511, "b": 617.22592, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "documents is typically decomposed into two separate chal-", "bbox": {"l": 308.862, "t": 620.27437, "r": 545.11505, "b": 629.18092, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "lenges, i.e.", "bbox": {"l": 308.862, "t": 632.23036, "r": 353.6937, "b": 641.13692, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "(1)", "bbox": {"l": 362.11209, "t": 632.23036, "r": 374.66617, "b": 641.13692, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "finding the location of the table(s) on a", "bbox": {"l": 377.35785, "t": 632.23036, "r": 545.11505, "b": 641.13692, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "document-page and (2) finding the structure of a given table", "bbox": {"l": 308.862, "t": 644.18536, "r": 545.11517, "b": 653.09192, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "in the document.", "bbox": {"l": 308.862, "t": 656.14037, "r": 375.55167, "b": 665.04693, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 308.862, "t": 668.38036, "r": 545.11511, "b": 713.151932, "coord_origin": "TOPLEFT"}, "confidence": 0.9791521430015564, "cells": [{"id": 120, "text": "The first problem is called table-location and has been", "bbox": {"l": 320.81699, "t": 668.38036, "r": 545.11493, "b": 677.28693, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "previously addressed [30, 38, 19, 21, 23, 26, 8] with state-", "bbox": {"l": 308.862, "t": 680.33536, "r": 545.11511, "b": 689.24193, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "of-the-art object-detection networks (e.g. YOLO and later", "bbox": {"l": 308.862, "t": 692.290359, "r": 545.11511, "b": 701.19693, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "on Mask-RCNN [9]). For all practical purposes, it can be", "bbox": {"l": 308.862, "t": 704.245361, "r": 545.11499, "b": 713.151932, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "page_footer", "bbox": {"l": 295.121, "t": 734.133366, "r": 300.10229, "b": 743.039928, "coord_origin": "TOPLEFT"}, "confidence": 0.8045889139175415, "cells": [{"id": 124, "text": "1", "bbox": {"l": 295.121, "t": 734.133366, "r": 300.10229, "b": 743.039928, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "page_header", "bbox": {"l": 18.340221, "t": 207.82001000000002, "r": 36.339779, "b": 560.00003, "coord_origin": "TOPLEFT"}, "confidence": 0.8773146271705627, "cells": [{"id": 125, "text": "arXiv:2203.01017v2 [cs.CV] 11 Mar 2022", "bbox": {"l": 18.340221, "t": 207.82001000000002, "r": 36.339779, "b": 560.00003, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {"11": {"label": "table", "id": 11, "page_no": 0, "cluster": {"id": 11, "label": "table", "bbox": {"l": 315.7172546386719, "t": 433.823486328125, "r": 536.835693359375, "b": 496.0290222167969, "coord_origin": "TOPLEFT"}, "confidence": 0.8056104183197021, "cells": [{"id": 76, "text": "1", "bbox": {"l": 347.24872, "t": 437.68588, "r": 351.6412, "b": 446.47083, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "0", "bbox": {"l": 318.88071, "t": 437.68588, "r": 323.27319, "b": 446.47083, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "2", "bbox": {"l": 394.10422, "t": 437.68588, "r": 398.4967, "b": 446.47083, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "3", "bbox": {"l": 318.77316, "t": 449.5455, "r": 323.16565, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "4", "bbox": {"l": 347.24872, "t": 449.5455, "r": 351.6412, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "5", "bbox": {"l": 394.10422, "t": 449.5455, "r": 398.4967, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "6", "bbox": {"l": 440.95941000000005, "t": 449.5455, "r": 445.3519, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "7", "bbox": {"l": 487.81491, "t": 449.5455, "r": 492.2074, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "8", "bbox": {"l": 318.77316, "t": 473.70425, "r": 323.16565, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "9", "bbox": {"l": 347.24872, "t": 461.8446, "r": 351.6412, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "10", "bbox": {"l": 394.10422, "t": 461.8446, "r": 402.88831, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "11", "bbox": {"l": 440.95941000000005, "t": 461.8446, "r": 449.42285, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "12", "bbox": {"l": 487.81491, "t": 461.8446, "r": 496.599, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "13", "bbox": {"l": 347.24872, "t": 473.70425, "r": 356.03281, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "14", "bbox": {"l": 394.10422, "t": 473.70425, "r": 402.88831, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "15", "bbox": {"l": 440.95941000000005, "t": 473.70425, "r": 449.7435, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "16", "bbox": {"l": 487.81491, "t": 473.70425, "r": 496.599, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "17", "bbox": {"l": 347.24872, "t": 485.12469, "r": 356.03281, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "18", "bbox": {"l": 394.10422, "t": 485.12469, "r": 402.88831, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "19", "bbox": {"l": 440.95941000000005, "t": 485.12469, "r": 449.7435, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "20", "bbox": {"l": 487.81491, "t": 485.12469, "r": 496.599, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "3", "bbox": {"l": 366.70102, "t": 449.12082, "r": 372.70581, "b": 459.25122, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "2", "bbox": {"l": 331.90424, "t": 473.32291, "r": 337.90903, "b": 483.45331, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "1", "bbox": {"l": 459.87621999999993, "t": 437.5936, "r": 465.88101, "b": 447.724, "coord_origin": "TOPLEFT"}}], "children": [{"id": 41, "label": "text", "bbox": {"l": 347.24872, "t": 437.68588, "r": 351.6412, "b": 446.47083, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "1", "bbox": {"l": 347.24872, "t": 437.68588, "r": 351.6412, "b": 446.47083, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 318.88071, "t": 437.68588, "r": 323.27319, "b": 446.47083, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "0", "bbox": {"l": 318.88071, "t": 437.68588, "r": 323.27319, "b": 446.47083, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 394.10422, "t": 437.68588, "r": 398.4967, "b": 446.47083, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "2", "bbox": {"l": 394.10422, "t": 437.68588, "r": 398.4967, "b": 446.47083, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 318.77316, "t": 449.5455, "r": 323.16565, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "3", "bbox": {"l": 318.77316, "t": 449.5455, "r": 323.16565, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 347.24872, "t": 449.5455, "r": 351.6412, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "4", "bbox": {"l": 347.24872, "t": 449.5455, "r": 351.6412, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 394.10422, "t": 449.5455, "r": 398.4967, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "5", "bbox": {"l": 394.10422, "t": 449.5455, "r": 398.4967, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 440.95941000000005, "t": 449.5455, "r": 445.3519, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "6", "bbox": {"l": 440.95941000000005, "t": 449.5455, "r": 445.3519, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 487.81491, "t": 449.5455, "r": 492.2074, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "7", "bbox": {"l": 487.81491, "t": 449.5455, "r": 492.2074, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 318.77316, "t": 473.70425, "r": 323.16565, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "8", "bbox": {"l": 318.77316, "t": 473.70425, "r": 323.16565, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 347.24872, "t": 461.8446, "r": 351.6412, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "9", "bbox": {"l": 347.24872, "t": 461.8446, "r": 351.6412, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 394.10422, "t": 461.8446, "r": 402.88831, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "10", "bbox": {"l": 394.10422, "t": 461.8446, "r": 402.88831, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 440.95941000000005, "t": 461.8446, "r": 449.42285, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "11", "bbox": {"l": 440.95941000000005, "t": 461.8446, "r": 449.42285, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 487.81491, "t": 461.8446, "r": 496.599, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "12", "bbox": {"l": 487.81491, "t": 461.8446, "r": 496.599, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 347.24872, "t": 473.70425, "r": 356.03281, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "13", "bbox": {"l": 347.24872, "t": 473.70425, "r": 356.03281, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 394.10422, "t": 473.70425, "r": 402.88831, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "14", "bbox": {"l": 394.10422, "t": 473.70425, "r": 402.88831, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 440.95941000000005, "t": 473.70425, "r": 449.7435, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "15", "bbox": {"l": 440.95941000000005, "t": 473.70425, "r": 449.7435, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 487.81491, "t": 473.70425, "r": 496.599, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "16", "bbox": {"l": 487.81491, "t": 473.70425, "r": 496.599, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 347.24872, "t": 485.12469, "r": 356.03281, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "17", "bbox": {"l": 347.24872, "t": 485.12469, "r": 356.03281, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 394.10422, "t": 485.12469, "r": 402.88831, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "18", "bbox": {"l": 394.10422, "t": 485.12469, "r": 402.88831, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 440.95941000000005, "t": 485.12469, "r": 449.7435, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "19", "bbox": {"l": 440.95941000000005, "t": 485.12469, "r": 449.7435, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 487.81491, "t": 485.12469, "r": 496.599, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "20", "bbox": {"l": 487.81491, "t": 485.12469, "r": 496.599, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 366.70102, "t": 449.12082, "r": 372.70581, "b": 459.25122, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "3", "bbox": {"l": 366.70102, "t": 449.12082, "r": 372.70581, "b": 459.25122, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 331.90424, "t": 473.32291, "r": 337.90903, "b": 483.45331, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "2", "bbox": {"l": 331.90424, "t": 473.32291, "r": 337.90903, "b": 483.45331, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 459.87621999999993, "t": 437.5936, "r": 465.88101, "b": 447.724, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "1", "bbox": {"l": 459.87621999999993, "t": 437.5936, "r": 465.88101, "b": 447.724, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "lcel", "ched", "lcel", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "ucel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "ucel", "nl"], "num_rows": 5, "num_cols": 6, "table_cells": [{"bbox": {"l": 347.24872, "t": 437.68588, "r": 351.6412, "b": 446.47083, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 3, "text": "1", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 318.88071, "t": 437.68588, "r": 323.27319, "b": 446.47083, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "0", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 394.10422, "t": 437.5936, "r": 465.88101, "b": 447.724, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 5, "text": "2 1", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 318.77316, "t": 449.5455, "r": 323.16565, "b": 458.33044, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 347.24872, "t": 449.5455, "r": 351.6412, "b": 458.33044, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 366.70102, "t": 449.12082, "r": 398.4967, "b": 459.25122, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "5 3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.95941000000005, "t": 449.5455, "r": 445.3519, "b": 458.33044, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.81491, "t": 449.5455, "r": 492.2074, "b": 458.33044, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 318.77316, "t": 473.70425, "r": 323.16565, "b": 482.4892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 347.24872, "t": 461.8446, "r": 351.6412, "b": 470.62955, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.10422, "t": 461.8446, "r": 402.88831, "b": 470.62955, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "10", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.95941000000005, "t": 461.8446, "r": 449.42285, "b": 470.62955, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "11", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.81491, "t": 461.8446, "r": 496.599, "b": 470.62955, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "12", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 347.24872, "t": 473.70425, "r": 356.03281, "b": 482.4892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "13", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.10422, "t": 473.70425, "r": 402.88831, "b": 482.4892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "14", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.95941000000005, "t": 473.70425, "r": 449.7435, "b": 482.4892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "15", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.81491, "t": 473.70425, "r": 496.599, "b": 482.4892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "16", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 347.24872, "t": 485.12469, "r": 356.03281, "b": 493.90964, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "17", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.10422, "t": 485.12469, "r": 402.88831, "b": 493.90964, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "18", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.95941000000005, "t": 485.12469, "r": 449.7435, "b": 493.90964, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "19", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.81491, "t": 485.12469, "r": 496.599, "b": 493.90964, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "20", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 331.90424, "t": 473.32291, "r": 337.90903, "b": 483.45331, "coord_origin": "TOPLEFT"}, "row_span": 3, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "2", "column_header": false, "row_header": false, "row_section": false}]}, "15": {"label": "table", "id": 15, "page_no": 0, "cluster": {"id": 15, "label": "table", "bbox": {"l": 315.65362548828125, "t": 228.7234344482422, "r": 537.1475219726562, "b": 302.80145263671875, "coord_origin": "TOPLEFT"}, "confidence": 0.651587724685669, "cells": [{"id": 97, "text": "1", "bbox": {"l": 451.9457100000001, "t": 235.34704999999997, "r": 457.95050000000003, "b": 245.47748, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "2", "bbox": {"l": 331.19681, "t": 269.35266, "r": 337.2016, "b": 279.48308999999995, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "3", "bbox": {"l": 384.0329, "t": 252.67895999999996, "r": 390.03769, "b": 262.80939, "coord_origin": "TOPLEFT"}}], "children": [{"id": 62, "label": "text", "bbox": {"l": 451.9457100000001, "t": 235.34704999999997, "r": 457.95050000000003, "b": 245.47748, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "1", "bbox": {"l": 451.9457100000001, "t": 235.34704999999997, "r": 457.95050000000003, "b": 245.47748, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 331.19681, "t": 269.35266, "r": 337.2016, "b": 279.48308999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "2", "bbox": {"l": 331.19681, "t": 269.35266, "r": 337.2016, "b": 279.48308999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 384.0329, "t": 252.67895999999996, "r": 390.03769, "b": 262.80939, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "3", "bbox": {"l": 384.0329, "t": 252.67895999999996, "r": 390.03769, "b": 262.80939, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ecel", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "ucel", "fcel", "fcel", "fcel", "fcel", "nl", "ucel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 1, "num_cols": 2, "table_cells": [{"bbox": {"l": 451.9457100000001, "t": 235.34704999999997, "r": 457.95050000000003, "b": 245.47748, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "1", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 384.0329, "t": 252.67895999999996, "r": 390.03769, "b": 262.80939, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3", "column_header": true, "row_header": false, "row_section": false}]}}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "section_header", "id": 8, "page_no": 0, "cluster": {"id": 8, "label": "section_header", "bbox": {"l": 96.301003, "t": 107.03412000000003, "r": 498.92708999999996, "b": 119.93133999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.8868061304092407, "cells": [{"id": 0, "text": "TableFormer: Table Structure Understanding with Transformers.", "bbox": {"l": 96.301003, "t": 107.03412000000003, "r": 498.92708999999996, "b": 119.93133999999998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "TableFormer: Table Structure Understanding with Transformers."}, {"label": "section_header", "id": 13, "page_no": 0, "cluster": {"id": 13, "label": "section_header", "bbox": {"l": 142.47701, "t": 146.68535999999995, "r": 452.75027, "b": 171.32037000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.7586213946342468, "cells": [{"id": 1, "text": "Ahmed Nassar, Nikolaos Livathinos, Maksym Lysak, Peter Staar", "bbox": {"l": 142.47701, "t": 146.68535999999995, "r": 452.75027, "b": 157.37334999999996, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "IBM Research", "bbox": {"l": 262.918, "t": 160.63239, "r": 332.30597, "b": 171.32037000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Ahmed Nassar, Nikolaos Livathinos, Maksym Lysak, Peter Staar IBM Research"}, {"label": "key_value_region", "id": 25, "page_no": 0, "cluster": {"id": 25, "label": "key_value_region", "bbox": {"l": 208.123, "t": 175.96123999999998, "r": 378.73257, "b": 184.42553999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.48547235131263733, "cells": [{"id": 3, "text": "{", "bbox": {"l": 208.123, "t": 175.96123999999998, "r": 212.73083, "b": 184.42553999999996, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "ahn,nli,mly,taa", "bbox": {"l": 212.73, "t": 177.08203000000003, "r": 293.42761, "b": 184.00409000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "}", "bbox": {"l": 293.42798, "t": 175.96123999999998, "r": 298.0358, "b": 184.42553999999996, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "@zurich.ibm.com", "bbox": {"l": 298.03497, "t": 177.08203000000003, "r": 378.73257, "b": 184.00409000000002, "coord_origin": "TOPLEFT"}}], "children": [{"id": 7, "label": "text", "bbox": {"l": 208.123, "t": 175.96123999999998, "r": 378.73257, "b": 184.42553999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9096333980560303, "cells": [{"id": 3, "text": "{", "bbox": {"l": 208.123, "t": 175.96123999999998, "r": 212.73083, "b": 184.42553999999996, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "ahn,nli,mly,taa", "bbox": {"l": 212.73, "t": 177.08203000000003, "r": 293.42761, "b": 184.00409000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "}", "bbox": {"l": 293.42798, "t": 175.96123999999998, "r": 298.0358, "b": 184.42553999999996, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "@zurich.ibm.com", "bbox": {"l": 298.03497, "t": 177.08203000000003, "r": 378.73257, "b": 184.00409000000002, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null}, {"label": "section_header", "id": 5, "page_no": 0, "cluster": {"id": 5, "label": "section_header", "bbox": {"l": 145.99498, "t": 215.48297000000002, "r": 190.48029, "b": 226.23071000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9258671998977661, "cells": [{"id": 7, "text": "Abstract", "bbox": {"l": 145.99498, "t": 215.48297000000002, "r": 190.48029, "b": 226.23071000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Abstract"}, {"label": "text", "id": 2, "page_no": 0, "cluster": {"id": 2, "label": "text", "bbox": {"l": 50.111977, "t": 241.39508, "r": 286.36511, "b": 512.9966400000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9838882088661194, "cells": [{"id": 8, "text": "Tables organize valuable content in a concise and com-", "bbox": {"l": 62.066978, "t": 241.39508, "r": 286.36493, "b": 249.98284999999998, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "pact representation. This content is extremely valuable for", "bbox": {"l": 50.111977, "t": 253.3501, "r": 286.36508, "b": 261.93787, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "systems such as search engines, Knowledge Graph\u2019s, etc,", "bbox": {"l": 50.111977, "t": 265.30511, "r": 286.36508, "b": 273.89288, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "since they enhance their predictive capabilities. Unfortu-", "bbox": {"l": 50.111977, "t": 277.26111000000003, "r": 286.36505, "b": 285.84888, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "nately, tables come in a large variety of shapes and sizes.", "bbox": {"l": 50.111977, "t": 289.21609, "r": 286.36505, "b": 297.80386, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Furthermore, they can have complex column/row-header", "bbox": {"l": 50.111977, "t": 301.17108, "r": 286.36505, "b": 309.75884999999994, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "configurations, multiline rows, different variety of separa-", "bbox": {"l": 50.111977, "t": 313.12607, "r": 286.36508, "b": 321.71384, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "tion lines, missing entries, etc. As such, the correct iden-", "bbox": {"l": 50.111977, "t": 325.08105, "r": 286.36508, "b": 333.66882, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "tification of the table-structure from an image is a non-", "bbox": {"l": 50.111977, "t": 337.03604, "r": 286.36505, "b": 345.62381, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "trivial task. In this paper, we present a new table-structure", "bbox": {"l": 50.111977, "t": 348.99203, "r": 286.36508, "b": 357.5798, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "identification model. The latter improves the latest end-to-", "bbox": {"l": 50.111977, "t": 360.94701999999995, "r": 286.36505, "b": 369.53479, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "end deep learning model (i.e. encoder-dual-decoder from", "bbox": {"l": 50.111977, "t": 372.90201, "r": 286.36508, "b": 381.48978, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "PubTabNet) in two significant ways. First, we introduce a", "bbox": {"l": 50.111977, "t": 384.85699, "r": 286.36505, "b": 393.44476, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "new object detection decoder for table-cells. In this way,", "bbox": {"l": 50.111977, "t": 396.81198, "r": 286.36511, "b": 405.39975000000004, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "we can obtain the content of the table-cells from program-", "bbox": {"l": 50.111977, "t": 408.76697, "r": 286.36508, "b": 417.35474, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "matic PDF\u2019s directly from the PDF source and avoid the", "bbox": {"l": 50.111977, "t": 420.72296000000006, "r": 286.36505, "b": 429.31073, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "training of the custom OCR decoders.", "bbox": {"l": 50.111977, "t": 432.67795, "r": 207.23216, "b": 441.26572, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "This architectural", "bbox": {"l": 214.09639, "t": 432.67795, "r": 286.36508, "b": 441.26572, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "change leads to more accurate table-content extraction and", "bbox": {"l": 50.111977, "t": 444.63293, "r": 286.36508, "b": 453.2207, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "allows us to tackle non-english tables. Second, we replace", "bbox": {"l": 50.111977, "t": 456.58792000000005, "r": 286.36505, "b": 465.17569, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "the LSTM decoders with transformer based decoders. This", "bbox": {"l": 50.111977, "t": 468.54291, "r": 286.36505, "b": 477.13068, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "upgrade improves significantly the previous state-of-the-art", "bbox": {"l": 50.111977, "t": 480.4989, "r": 286.36508, "b": 489.08667, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "tree-editing-distance-score (TEDS) from 91% to 98.5% on", "bbox": {"l": 50.111977, "t": 492.45389, "r": 286.36505, "b": 501.04166, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "simple tables and from 88.7% to 95% on complex tables.", "bbox": {"l": 50.111977, "t": 504.40887, "r": 276.65152, "b": 512.9966400000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Tables organize valuable content in a concise and compact representation. This content is extremely valuable for systems such as search engines, Knowledge Graph\u2019s, etc, since they enhance their predictive capabilities. Unfortunately, tables come in a large variety of shapes and sizes. Furthermore, they can have complex column/row-header configurations, multiline rows, different variety of separation lines, missing entries, etc. As such, the correct identification of the table-structure from an image is a nontrivial task. In this paper, we present a new table-structure identification model. The latter improves the latest end-toend deep learning model (i.e. encoder-dual-decoder from PubTabNet) in two significant ways. First, we introduce a new object detection decoder for table-cells. In this way, we can obtain the content of the table-cells from programmatic PDF\u2019s directly from the PDF source and avoid the training of the custom OCR decoders. This architectural change leads to more accurate table-content extraction and allows us to tackle non-english tables. Second, we replace the LSTM decoders with transformer based decoders. This upgrade improves significantly the previous state-of-the-art tree-editing-distance-score (TEDS) from 91% to 98.5% on simple tables and from 88.7% to 95% on complex tables."}, {"label": "section_header", "id": 4, "page_no": 0, "cluster": {"id": 4, "label": "section_header", "bbox": {"l": 50.111977, "t": 539.94276, "r": 126.94804, "b": 550.69049, "coord_origin": "TOPLEFT"}, "confidence": 0.9317678213119507, "cells": [{"id": 32, "text": "1.", "bbox": {"l": 50.111977, "t": 539.94276, "r": 58.121296, "b": 550.69049, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "Introduction", "bbox": {"l": 68.800385, "t": 539.94276, "r": 126.94804, "b": 550.69049, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1. Introduction"}, {"label": "text", "id": 1, "page_no": 0, "cluster": {"id": 1, "label": "text", "bbox": {"l": 50.111977, "t": 560.7832, "r": 286.36508, "b": 713.151779, "coord_origin": "TOPLEFT"}, "confidence": 0.9841895699501038, "cells": [{"id": 34, "text": "The occurrence of tables in documents is ubiquitous.", "bbox": {"l": 62.066978, "t": 560.7832, "r": 286.36496, "b": 569.68976, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "They often summarise quantitative or factual data, which is", "bbox": {"l": 50.111977, "t": 572.7382, "r": 286.36508, "b": 581.64476, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "cumbersome to describe in verbose text but nevertheless ex-", "bbox": {"l": 50.111977, "t": 584.69321, "r": 286.36505, "b": 593.5997600000001, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "tremely valuable. Unfortunately, this compact representa-", "bbox": {"l": 50.111977, "t": 596.6492000000001, "r": 286.36505, "b": 605.55576, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "tion is often not easy to parse by machines. There are many", "bbox": {"l": 50.111977, "t": 608.6042, "r": 286.36505, "b": 617.51076, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "implicit conventions used to obtain a compact table repre-", "bbox": {"l": 50.111977, "t": 620.5592, "r": 286.36505, "b": 629.46576, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "sentation. For example, tables often have complex column-", "bbox": {"l": 50.111977, "t": 632.51421, "r": 286.36508, "b": 641.42076, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "and row-headers in order to reduce duplicated cell content.", "bbox": {"l": 50.111977, "t": 644.46921, "r": 286.36508, "b": 653.37576, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "Lines of different shapes and sizes are leveraged to separate", "bbox": {"l": 50.111977, "t": 656.42421, "r": 286.36502, "b": 665.33077, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "content or indicate a tree structure. Additionally, tables can", "bbox": {"l": 50.111977, "t": 668.3802000000001, "r": 286.36505, "b": 677.28677, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "also have empty/missing table-entries or multi-row textual", "bbox": {"l": 50.111977, "t": 680.33521, "r": 286.36505, "b": 689.2417800000001, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "table-entries. Fig. 1 shows a table which presents all these", "bbox": {"l": 50.111977, "t": 692.290207, "r": 286.36505, "b": 701.196777, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "issues.", "bbox": {"l": 50.111977, "t": 704.245209, "r": 76.403275, "b": 713.151779, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The occurrence of tables in documents is ubiquitous. They often summarise quantitative or factual data, which is cumbersome to describe in verbose text but nevertheless extremely valuable. Unfortunately, this compact representation is often not easy to parse by machines. There are many implicit conventions used to obtain a compact table representation. For example, tables often have complex columnand row-headers in order to reduce duplicated cell content. Lines of different shapes and sizes are leveraged to separate content or indicate a tree structure. Additionally, tables can also have empty/missing table-entries or multi-row textual table-entries. Fig. 1 shows a table which presents all these issues."}, {"label": "section_header", "id": 14, "page_no": 0, "cluster": {"id": 14, "label": "section_header", "bbox": {"l": 315.56702, "t": 218.00684, "r": 408.4407, "b": 226.75482, "coord_origin": "TOPLEFT"}, "confidence": 0.6724023818969727, "cells": [{"id": 47, "text": "a.", "bbox": {"l": 315.56702, "t": 218.00684, "r": 324.01007, "b": 226.75482, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Picture of a table:", "bbox": {"l": 328.2316, "t": 218.00684, "r": 408.4407, "b": 226.75482, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "a. Picture of a table:"}, {"label": "list_item", "id": 17, "page_no": 0, "cluster": {"id": 17, "label": "list_item", "bbox": {"l": 315.56702, "t": 313.69478999999995, "r": 486.40194999999994, "b": 333.2428, "coord_origin": "TOPLEFT"}, "confidence": 0.5549326539039612, "cells": [{"id": 49, "text": "b.", "bbox": {"l": 315.56702, "t": 313.69478999999995, "r": 325.05786, "b": 322.44281, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Red-annotation of bounding boxes,", "bbox": {"l": 329.80325, "t": 313.69478999999995, "r": 486.40194999999994, "b": 322.44281, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Blue-predictions by TableFormer", "bbox": {"l": 326.46252, "t": 324.49478, "r": 472.47411999999997, "b": 333.2428, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "b. Red-annotation of bounding boxes, Blue-predictions by TableFormer"}, {"label": "list_item", "id": 18, "page_no": 0, "cluster": {"id": 18, "label": "list_item", "bbox": {"l": 315.56702, "t": 420.1828, "r": 491.1912500000001, "b": 428.93082, "coord_origin": "TOPLEFT"}, "confidence": 0.5501352548599243, "cells": [{"id": 52, "text": "c.", "bbox": {"l": 315.56702, "t": 420.1828, "r": 324.81039, "b": 428.93082, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Structure predicted by TableFormer:", "bbox": {"l": 329.4321, "t": 420.1828, "r": 491.1912500000001, "b": 428.93082, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "c. Structure predicted by TableFormer:"}, {"label": "picture", "id": 10, "page_no": 0, "cluster": {"id": 10, "label": "picture", "bbox": {"l": 314.78173828125, "t": 338.0652770996094, "r": 539.1802978515625, "b": 410.0494384765625, "coord_origin": "TOPLEFT"}, "confidence": 0.8742762207984924, "cells": [{"id": 54, "text": "1", "bbox": {"l": 408.14752, "t": 342.82828, "r": 412.54001, "b": 351.61322, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "0", "bbox": {"l": 356.11011, "t": 341.57217, "r": 360.50259, "b": 350.35712, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "2", "bbox": {"l": 500.6777, "t": 340.93768, "r": 505.0701900000001, "b": 349.7226299999999, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "3", "bbox": {"l": 356.13382, "t": 351.74789, "r": 360.52631, "b": 360.53284, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "4", "bbox": {"l": 402.53992, "t": 355.8765, "r": 406.9324, "b": 364.66144, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "5", "bbox": {"l": 448.58178999999996, "t": 352.84018, "r": 452.97427, "b": 361.62512, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "6", "bbox": {"l": 491.65161000000006, "t": 353.70657, "r": 496.0441, "b": 362.49152, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "7", "bbox": {"l": 535.13843, "t": 353.33969, "r": 539.53088, "b": 362.12463, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "8", "bbox": {"l": 348.82822, "t": 387.09781, "r": 353.2207, "b": 395.88275, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "9", "bbox": {"l": 389.27151, "t": 375.37228, "r": 393.664, "b": 384.15723, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "10", "bbox": {"l": 442.67479999999995, "t": 375.64621, "r": 451.45889000000005, "b": 384.43115, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "11", "bbox": {"l": 477.4382299999999, "t": 375.534, "r": 485.90167, "b": 384.31894000000005, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "12", "bbox": {"l": 522.57263, "t": 375.64621, "r": 531.35669, "b": 384.43115, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "13", "bbox": {"l": 400.22992, "t": 387.11429, "r": 409.01401, "b": 395.89923, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "14", "bbox": {"l": 442.30792, "t": 386.98981000000003, "r": 451.0920100000001, "b": 395.77475000000004, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "15", "bbox": {"l": 478.21941999999996, "t": 387.37469, "r": 487.00351000000006, "b": 396.15964, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "16", "bbox": {"l": 523.2287, "t": 386.98981000000003, "r": 532.01276, "b": 395.77475000000004, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "1", "bbox": {"l": 411.57233, "t": 399.42477, "r": 415.96481, "b": 408.20972, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "7", "bbox": {"l": 415.96393, "t": 399.42477, "r": 420.35641, "b": 408.20972, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "18", "bbox": {"l": 442.30521, "t": 399.0371999999999, "r": 451.08929, "b": 407.82213999999993, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "19", "bbox": {"l": 478.77893, "t": 398.99639999999994, "r": 487.56302, "b": 407.78133999999994, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "20", "bbox": {"l": 523.97241, "t": 398.6114799999999, "r": 532.75647, "b": 407.39642, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "3", "bbox": {"l": 385.09399, "t": 357.76030999999995, "r": 391.09879, "b": 367.89072, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "2", "bbox": {"l": 333.43451, "t": 380.7265, "r": 339.4393, "b": 390.85689999999994, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "1", "bbox": {"l": 478.07210999999995, "t": 341.0368000000001, "r": 484.0769, "b": 351.16720999999995, "coord_origin": "TOPLEFT"}}], "children": [{"id": 19, "label": "text", "bbox": {"l": 408.14752, "t": 342.82828, "r": 412.54001, "b": 351.61322, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "1", "bbox": {"l": 408.14752, "t": 342.82828, "r": 412.54001, "b": 351.61322, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 356.11011, "t": 341.57217, "r": 360.50259, "b": 350.35712, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "0", "bbox": {"l": 356.11011, "t": 341.57217, "r": 360.50259, "b": 350.35712, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 500.6777, "t": 340.93768, "r": 505.0701900000001, "b": 349.7226299999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "2", "bbox": {"l": 500.6777, "t": 340.93768, "r": 505.0701900000001, "b": 349.7226299999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 356.13382, "t": 351.74789, "r": 360.52631, "b": 360.53284, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "3", "bbox": {"l": 356.13382, "t": 351.74789, "r": 360.52631, "b": 360.53284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 402.53992, "t": 355.8765, "r": 406.9324, "b": 364.66144, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "4", "bbox": {"l": 402.53992, "t": 355.8765, "r": 406.9324, "b": 364.66144, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 448.58178999999996, "t": 352.84018, "r": 452.97427, "b": 361.62512, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "5", "bbox": {"l": 448.58178999999996, "t": 352.84018, "r": 452.97427, "b": 361.62512, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 491.65161000000006, "t": 353.70657, "r": 496.0441, "b": 362.49152, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "6", "bbox": {"l": 491.65161000000006, "t": 353.70657, "r": 496.0441, "b": 362.49152, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 535.13843, "t": 353.33969, "r": 539.53088, "b": 362.12463, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "7", "bbox": {"l": 535.13843, "t": 353.33969, "r": 539.53088, "b": 362.12463, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 348.82822, "t": 387.09781, "r": 353.2207, "b": 395.88275, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "8", "bbox": {"l": 348.82822, "t": 387.09781, "r": 353.2207, "b": 395.88275, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 389.27151, "t": 375.37228, "r": 393.664, "b": 384.15723, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "9", "bbox": {"l": 389.27151, "t": 375.37228, "r": 393.664, "b": 384.15723, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 442.67479999999995, "t": 375.64621, "r": 451.45889000000005, "b": 384.43115, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "10", "bbox": {"l": 442.67479999999995, "t": 375.64621, "r": 451.45889000000005, "b": 384.43115, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 477.4382299999999, "t": 375.534, "r": 485.90167, "b": 384.31894000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "11", "bbox": {"l": 477.4382299999999, "t": 375.534, "r": 485.90167, "b": 384.31894000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 522.57263, "t": 375.64621, "r": 531.35669, "b": 384.43115, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "12", "bbox": {"l": 522.57263, "t": 375.64621, "r": 531.35669, "b": 384.43115, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 400.22992, "t": 387.11429, "r": 409.01401, "b": 395.89923, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "13", "bbox": {"l": 400.22992, "t": 387.11429, "r": 409.01401, "b": 395.89923, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 442.30792, "t": 386.98981000000003, "r": 451.0920100000001, "b": 395.77475000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "14", "bbox": {"l": 442.30792, "t": 386.98981000000003, "r": 451.0920100000001, "b": 395.77475000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 478.21941999999996, "t": 387.37469, "r": 487.00351000000006, "b": 396.15964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "15", "bbox": {"l": 478.21941999999996, "t": 387.37469, "r": 487.00351000000006, "b": 396.15964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 523.2287, "t": 386.98981000000003, "r": 532.01276, "b": 395.77475000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "16", "bbox": {"l": 523.2287, "t": 386.98981000000003, "r": 532.01276, "b": 395.77475000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 411.57233, "t": 399.42477, "r": 415.96481, "b": 408.20972, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "1", "bbox": {"l": 411.57233, "t": 399.42477, "r": 415.96481, "b": 408.20972, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 415.96393, "t": 399.42477, "r": 420.35641, "b": 408.20972, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "7", "bbox": {"l": 415.96393, "t": 399.42477, "r": 420.35641, "b": 408.20972, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 442.30521, "t": 399.0371999999999, "r": 451.08929, "b": 407.82213999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "18", "bbox": {"l": 442.30521, "t": 399.0371999999999, "r": 451.08929, "b": 407.82213999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 478.77893, "t": 398.99639999999994, "r": 487.56302, "b": 407.78133999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "19", "bbox": {"l": 478.77893, "t": 398.99639999999994, "r": 487.56302, "b": 407.78133999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 523.97241, "t": 398.6114799999999, "r": 532.75647, "b": 407.39642, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "20", "bbox": {"l": 523.97241, "t": 398.6114799999999, "r": 532.75647, "b": 407.39642, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 385.09399, "t": 357.76030999999995, "r": 391.09879, "b": 367.89072, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "3", "bbox": {"l": 385.09399, "t": 357.76030999999995, "r": 391.09879, "b": 367.89072, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 333.43451, "t": 380.7265, "r": 339.4393, "b": 390.85689999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "2", "bbox": {"l": 333.43451, "t": 380.7265, "r": 339.4393, "b": 390.85689999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 478.07210999999995, "t": 341.0368000000001, "r": 484.0769, "b": 351.16720999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": "1", "bbox": {"l": 478.07210999999995, "t": 341.0368000000001, "r": 484.0769, "b": 351.16720999999995, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "picture", "id": 23, "page_no": 0, "cluster": {"id": 23, "label": "picture", "bbox": {"l": 315.7172546386719, "t": 433.823486328125, "r": 536.835693359375, "b": 496.0290222167969, "coord_origin": "TOPLEFT"}, "confidence": 0.5088647603988647, "cells": [{"id": 76, "text": "1", "bbox": {"l": 347.24872, "t": 437.68588, "r": 351.6412, "b": 446.47083, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "0", "bbox": {"l": 318.88071, "t": 437.68588, "r": 323.27319, "b": 446.47083, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "2", "bbox": {"l": 394.10422, "t": 437.68588, "r": 398.4967, "b": 446.47083, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "3", "bbox": {"l": 318.77316, "t": 449.5455, "r": 323.16565, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "4", "bbox": {"l": 347.24872, "t": 449.5455, "r": 351.6412, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "5", "bbox": {"l": 394.10422, "t": 449.5455, "r": 398.4967, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "6", "bbox": {"l": 440.95941000000005, "t": 449.5455, "r": 445.3519, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "7", "bbox": {"l": 487.81491, "t": 449.5455, "r": 492.2074, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "8", "bbox": {"l": 318.77316, "t": 473.70425, "r": 323.16565, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "9", "bbox": {"l": 347.24872, "t": 461.8446, "r": 351.6412, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "10", "bbox": {"l": 394.10422, "t": 461.8446, "r": 402.88831, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "11", "bbox": {"l": 440.95941000000005, "t": 461.8446, "r": 449.42285, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "12", "bbox": {"l": 487.81491, "t": 461.8446, "r": 496.599, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "13", "bbox": {"l": 347.24872, "t": 473.70425, "r": 356.03281, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "14", "bbox": {"l": 394.10422, "t": 473.70425, "r": 402.88831, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "15", "bbox": {"l": 440.95941000000005, "t": 473.70425, "r": 449.7435, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "16", "bbox": {"l": 487.81491, "t": 473.70425, "r": 496.599, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "17", "bbox": {"l": 347.24872, "t": 485.12469, "r": 356.03281, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "18", "bbox": {"l": 394.10422, "t": 485.12469, "r": 402.88831, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "19", "bbox": {"l": 440.95941000000005, "t": 485.12469, "r": 449.7435, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "20", "bbox": {"l": 487.81491, "t": 485.12469, "r": 496.599, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "3", "bbox": {"l": 366.70102, "t": 449.12082, "r": 372.70581, "b": 459.25122, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "2", "bbox": {"l": 331.90424, "t": 473.32291, "r": 337.90903, "b": 483.45331, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "1", "bbox": {"l": 459.87621999999993, "t": 437.5936, "r": 465.88101, "b": 447.724, "coord_origin": "TOPLEFT"}}], "children": [{"id": 41, "label": "text", "bbox": {"l": 347.24872, "t": 437.68588, "r": 351.6412, "b": 446.47083, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "1", "bbox": {"l": 347.24872, "t": 437.68588, "r": 351.6412, "b": 446.47083, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 318.88071, "t": 437.68588, "r": 323.27319, "b": 446.47083, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "0", "bbox": {"l": 318.88071, "t": 437.68588, "r": 323.27319, "b": 446.47083, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 394.10422, "t": 437.68588, "r": 398.4967, "b": 446.47083, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "2", "bbox": {"l": 394.10422, "t": 437.68588, "r": 398.4967, "b": 446.47083, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 318.77316, "t": 449.5455, "r": 323.16565, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "3", "bbox": {"l": 318.77316, "t": 449.5455, "r": 323.16565, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 347.24872, "t": 449.5455, "r": 351.6412, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "4", "bbox": {"l": 347.24872, "t": 449.5455, "r": 351.6412, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 394.10422, "t": 449.5455, "r": 398.4967, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "5", "bbox": {"l": 394.10422, "t": 449.5455, "r": 398.4967, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 440.95941000000005, "t": 449.5455, "r": 445.3519, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "6", "bbox": {"l": 440.95941000000005, "t": 449.5455, "r": 445.3519, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 487.81491, "t": 449.5455, "r": 492.2074, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "7", "bbox": {"l": 487.81491, "t": 449.5455, "r": 492.2074, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 318.77316, "t": 473.70425, "r": 323.16565, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "8", "bbox": {"l": 318.77316, "t": 473.70425, "r": 323.16565, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 347.24872, "t": 461.8446, "r": 351.6412, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "9", "bbox": {"l": 347.24872, "t": 461.8446, "r": 351.6412, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 394.10422, "t": 461.8446, "r": 402.88831, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "10", "bbox": {"l": 394.10422, "t": 461.8446, "r": 402.88831, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 440.95941000000005, "t": 461.8446, "r": 449.42285, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "11", "bbox": {"l": 440.95941000000005, "t": 461.8446, "r": 449.42285, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 487.81491, "t": 461.8446, "r": 496.599, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "12", "bbox": {"l": 487.81491, "t": 461.8446, "r": 496.599, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 347.24872, "t": 473.70425, "r": 356.03281, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "13", "bbox": {"l": 347.24872, "t": 473.70425, "r": 356.03281, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 394.10422, "t": 473.70425, "r": 402.88831, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "14", "bbox": {"l": 394.10422, "t": 473.70425, "r": 402.88831, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 440.95941000000005, "t": 473.70425, "r": 449.7435, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "15", "bbox": {"l": 440.95941000000005, "t": 473.70425, "r": 449.7435, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 487.81491, "t": 473.70425, "r": 496.599, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "16", "bbox": {"l": 487.81491, "t": 473.70425, "r": 496.599, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 347.24872, "t": 485.12469, "r": 356.03281, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "17", "bbox": {"l": 347.24872, "t": 485.12469, "r": 356.03281, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 394.10422, "t": 485.12469, "r": 402.88831, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "18", "bbox": {"l": 394.10422, "t": 485.12469, "r": 402.88831, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 440.95941000000005, "t": 485.12469, "r": 449.7435, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "19", "bbox": {"l": 440.95941000000005, "t": 485.12469, "r": 449.7435, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 487.81491, "t": 485.12469, "r": 496.599, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "20", "bbox": {"l": 487.81491, "t": 485.12469, "r": 496.599, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 366.70102, "t": 449.12082, "r": 372.70581, "b": 459.25122, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "3", "bbox": {"l": 366.70102, "t": 449.12082, "r": 372.70581, "b": 459.25122, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 331.90424, "t": 473.32291, "r": 337.90903, "b": 483.45331, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "2", "bbox": {"l": 331.90424, "t": 473.32291, "r": 337.90903, "b": 483.45331, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 459.87621999999993, "t": 437.5936, "r": 465.88101, "b": 447.724, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "1", "bbox": {"l": 459.87621999999993, "t": 437.5936, "r": 465.88101, "b": 447.724, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "table", "id": 11, "page_no": 0, "cluster": {"id": 11, "label": "table", "bbox": {"l": 315.7172546386719, "t": 433.823486328125, "r": 536.835693359375, "b": 496.0290222167969, "coord_origin": "TOPLEFT"}, "confidence": 0.8056104183197021, "cells": [{"id": 76, "text": "1", "bbox": {"l": 347.24872, "t": 437.68588, "r": 351.6412, "b": 446.47083, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "0", "bbox": {"l": 318.88071, "t": 437.68588, "r": 323.27319, "b": 446.47083, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "2", "bbox": {"l": 394.10422, "t": 437.68588, "r": 398.4967, "b": 446.47083, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "3", "bbox": {"l": 318.77316, "t": 449.5455, "r": 323.16565, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "4", "bbox": {"l": 347.24872, "t": 449.5455, "r": 351.6412, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "5", "bbox": {"l": 394.10422, "t": 449.5455, "r": 398.4967, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "6", "bbox": {"l": 440.95941000000005, "t": 449.5455, "r": 445.3519, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "7", "bbox": {"l": 487.81491, "t": 449.5455, "r": 492.2074, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "8", "bbox": {"l": 318.77316, "t": 473.70425, "r": 323.16565, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "9", "bbox": {"l": 347.24872, "t": 461.8446, "r": 351.6412, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "10", "bbox": {"l": 394.10422, "t": 461.8446, "r": 402.88831, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "11", "bbox": {"l": 440.95941000000005, "t": 461.8446, "r": 449.42285, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "12", "bbox": {"l": 487.81491, "t": 461.8446, "r": 496.599, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "13", "bbox": {"l": 347.24872, "t": 473.70425, "r": 356.03281, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "14", "bbox": {"l": 394.10422, "t": 473.70425, "r": 402.88831, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "15", "bbox": {"l": 440.95941000000005, "t": 473.70425, "r": 449.7435, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "16", "bbox": {"l": 487.81491, "t": 473.70425, "r": 496.599, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "17", "bbox": {"l": 347.24872, "t": 485.12469, "r": 356.03281, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "18", "bbox": {"l": 394.10422, "t": 485.12469, "r": 402.88831, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "19", "bbox": {"l": 440.95941000000005, "t": 485.12469, "r": 449.7435, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "20", "bbox": {"l": 487.81491, "t": 485.12469, "r": 496.599, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "3", "bbox": {"l": 366.70102, "t": 449.12082, "r": 372.70581, "b": 459.25122, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "2", "bbox": {"l": 331.90424, "t": 473.32291, "r": 337.90903, "b": 483.45331, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "1", "bbox": {"l": 459.87621999999993, "t": 437.5936, "r": 465.88101, "b": 447.724, "coord_origin": "TOPLEFT"}}], "children": [{"id": 41, "label": "text", "bbox": {"l": 347.24872, "t": 437.68588, "r": 351.6412, "b": 446.47083, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "1", "bbox": {"l": 347.24872, "t": 437.68588, "r": 351.6412, "b": 446.47083, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 318.88071, "t": 437.68588, "r": 323.27319, "b": 446.47083, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "0", "bbox": {"l": 318.88071, "t": 437.68588, "r": 323.27319, "b": 446.47083, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 394.10422, "t": 437.68588, "r": 398.4967, "b": 446.47083, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "2", "bbox": {"l": 394.10422, "t": 437.68588, "r": 398.4967, "b": 446.47083, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 318.77316, "t": 449.5455, "r": 323.16565, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "3", "bbox": {"l": 318.77316, "t": 449.5455, "r": 323.16565, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 347.24872, "t": 449.5455, "r": 351.6412, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "4", "bbox": {"l": 347.24872, "t": 449.5455, "r": 351.6412, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 394.10422, "t": 449.5455, "r": 398.4967, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "5", "bbox": {"l": 394.10422, "t": 449.5455, "r": 398.4967, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 440.95941000000005, "t": 449.5455, "r": 445.3519, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "6", "bbox": {"l": 440.95941000000005, "t": 449.5455, "r": 445.3519, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 487.81491, "t": 449.5455, "r": 492.2074, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "7", "bbox": {"l": 487.81491, "t": 449.5455, "r": 492.2074, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 318.77316, "t": 473.70425, "r": 323.16565, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "8", "bbox": {"l": 318.77316, "t": 473.70425, "r": 323.16565, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 347.24872, "t": 461.8446, "r": 351.6412, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "9", "bbox": {"l": 347.24872, "t": 461.8446, "r": 351.6412, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 394.10422, "t": 461.8446, "r": 402.88831, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "10", "bbox": {"l": 394.10422, "t": 461.8446, "r": 402.88831, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 440.95941000000005, "t": 461.8446, "r": 449.42285, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "11", "bbox": {"l": 440.95941000000005, "t": 461.8446, "r": 449.42285, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 487.81491, "t": 461.8446, "r": 496.599, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "12", "bbox": {"l": 487.81491, "t": 461.8446, "r": 496.599, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 347.24872, "t": 473.70425, "r": 356.03281, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "13", "bbox": {"l": 347.24872, "t": 473.70425, "r": 356.03281, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 394.10422, "t": 473.70425, "r": 402.88831, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "14", "bbox": {"l": 394.10422, "t": 473.70425, "r": 402.88831, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 440.95941000000005, "t": 473.70425, "r": 449.7435, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "15", "bbox": {"l": 440.95941000000005, "t": 473.70425, "r": 449.7435, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 487.81491, "t": 473.70425, "r": 496.599, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "16", "bbox": {"l": 487.81491, "t": 473.70425, "r": 496.599, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 347.24872, "t": 485.12469, "r": 356.03281, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "17", "bbox": {"l": 347.24872, "t": 485.12469, "r": 356.03281, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 394.10422, "t": 485.12469, "r": 402.88831, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "18", "bbox": {"l": 394.10422, "t": 485.12469, "r": 402.88831, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 440.95941000000005, "t": 485.12469, "r": 449.7435, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "19", "bbox": {"l": 440.95941000000005, "t": 485.12469, "r": 449.7435, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 487.81491, "t": 485.12469, "r": 496.599, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "20", "bbox": {"l": 487.81491, "t": 485.12469, "r": 496.599, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 366.70102, "t": 449.12082, "r": 372.70581, "b": 459.25122, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "3", "bbox": {"l": 366.70102, "t": 449.12082, "r": 372.70581, "b": 459.25122, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 331.90424, "t": 473.32291, "r": 337.90903, "b": 483.45331, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "2", "bbox": {"l": 331.90424, "t": 473.32291, "r": 337.90903, "b": 483.45331, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 459.87621999999993, "t": 437.5936, "r": 465.88101, "b": 447.724, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "1", "bbox": {"l": 459.87621999999993, "t": 437.5936, "r": 465.88101, "b": 447.724, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "lcel", "ched", "lcel", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "ucel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "ucel", "nl"], "num_rows": 5, "num_cols": 6, "table_cells": [{"bbox": {"l": 347.24872, "t": 437.68588, "r": 351.6412, "b": 446.47083, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 3, "text": "1", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 318.88071, "t": 437.68588, "r": 323.27319, "b": 446.47083, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "0", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 394.10422, "t": 437.5936, "r": 465.88101, "b": 447.724, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 5, "text": "2 1", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 318.77316, "t": 449.5455, "r": 323.16565, "b": 458.33044, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 347.24872, "t": 449.5455, "r": 351.6412, "b": 458.33044, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 366.70102, "t": 449.12082, "r": 398.4967, "b": 459.25122, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "5 3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.95941000000005, "t": 449.5455, "r": 445.3519, "b": 458.33044, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.81491, "t": 449.5455, "r": 492.2074, "b": 458.33044, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 318.77316, "t": 473.70425, "r": 323.16565, "b": 482.4892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 347.24872, "t": 461.8446, "r": 351.6412, "b": 470.62955, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.10422, "t": 461.8446, "r": 402.88831, "b": 470.62955, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "10", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.95941000000005, "t": 461.8446, "r": 449.42285, "b": 470.62955, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "11", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.81491, "t": 461.8446, "r": 496.599, "b": 470.62955, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "12", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 347.24872, "t": 473.70425, "r": 356.03281, "b": 482.4892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "13", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.10422, "t": 473.70425, "r": 402.88831, "b": 482.4892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "14", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.95941000000005, "t": 473.70425, "r": 449.7435, "b": 482.4892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "15", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.81491, "t": 473.70425, "r": 496.599, "b": 482.4892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "16", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 347.24872, "t": 485.12469, "r": 356.03281, "b": 493.90964, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "17", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.10422, "t": 485.12469, "r": 402.88831, "b": 493.90964, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "18", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.95941000000005, "t": 485.12469, "r": 449.7435, "b": 493.90964, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "19", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.81491, "t": 485.12469, "r": 496.599, "b": 493.90964, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "20", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 331.90424, "t": 473.32291, "r": 337.90903, "b": 483.45331, "coord_origin": "TOPLEFT"}, "row_span": 3, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "2", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "picture", "id": 16, "page_no": 0, "cluster": {"id": 16, "label": "picture", "bbox": {"l": 315.65362548828125, "t": 228.7234344482422, "r": 537.1475219726562, "b": 302.80145263671875, "coord_origin": "TOPLEFT"}, "confidence": 0.608779788017273, "cells": [{"id": 97, "text": "1", "bbox": {"l": 451.9457100000001, "t": 235.34704999999997, "r": 457.95050000000003, "b": 245.47748, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "2", "bbox": {"l": 331.19681, "t": 269.35266, "r": 337.2016, "b": 279.48308999999995, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "3", "bbox": {"l": 384.0329, "t": 252.67895999999996, "r": 390.03769, "b": 262.80939, "coord_origin": "TOPLEFT"}}], "children": [{"id": 62, "label": "text", "bbox": {"l": 451.9457100000001, "t": 235.34704999999997, "r": 457.95050000000003, "b": 245.47748, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "1", "bbox": {"l": 451.9457100000001, "t": 235.34704999999997, "r": 457.95050000000003, "b": 245.47748, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 331.19681, "t": 269.35266, "r": 337.2016, "b": 279.48308999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "2", "bbox": {"l": 331.19681, "t": 269.35266, "r": 337.2016, "b": 279.48308999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 384.0329, "t": 252.67895999999996, "r": 390.03769, "b": 262.80939, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "3", "bbox": {"l": 384.0329, "t": 252.67895999999996, "r": 390.03769, "b": 262.80939, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "table", "id": 15, "page_no": 0, "cluster": {"id": 15, "label": "table", "bbox": {"l": 315.65362548828125, "t": 228.7234344482422, "r": 537.1475219726562, "b": 302.80145263671875, "coord_origin": "TOPLEFT"}, "confidence": 0.651587724685669, "cells": [{"id": 97, "text": "1", "bbox": {"l": 451.9457100000001, "t": 235.34704999999997, "r": 457.95050000000003, "b": 245.47748, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "2", "bbox": {"l": 331.19681, "t": 269.35266, "r": 337.2016, "b": 279.48308999999995, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "3", "bbox": {"l": 384.0329, "t": 252.67895999999996, "r": 390.03769, "b": 262.80939, "coord_origin": "TOPLEFT"}}], "children": [{"id": 62, "label": "text", "bbox": {"l": 451.9457100000001, "t": 235.34704999999997, "r": 457.95050000000003, "b": 245.47748, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "1", "bbox": {"l": 451.9457100000001, "t": 235.34704999999997, "r": 457.95050000000003, "b": 245.47748, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 331.19681, "t": 269.35266, "r": 337.2016, "b": 279.48308999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "2", "bbox": {"l": 331.19681, "t": 269.35266, "r": 337.2016, "b": 279.48308999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 384.0329, "t": 252.67895999999996, "r": 390.03769, "b": 262.80939, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "3", "bbox": {"l": 384.0329, "t": 252.67895999999996, "r": 390.03769, "b": 262.80939, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ecel", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "ucel", "fcel", "fcel", "fcel", "fcel", "nl", "ucel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 1, "num_cols": 2, "table_cells": [{"bbox": {"l": 451.9457100000001, "t": 235.34704999999997, "r": 457.95050000000003, "b": 245.47748, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "1", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 384.0329, "t": 252.67895999999996, "r": 390.03769, "b": 262.80939, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3", "column_header": true, "row_header": false, "row_section": false}]}, {"label": "caption", "id": 6, "page_no": 0, "cluster": {"id": 6, "label": "caption", "bbox": {"l": 308.862, "t": 514.50037, "r": 545.11517, "b": 559.2729, "coord_origin": "TOPLEFT"}, "confidence": 0.9214621186256409, "cells": [{"id": 106, "text": "Figure 1:", "bbox": {"l": 308.862, "t": 514.50037, "r": 345.73361, "b": 523.40692, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "Picture of a table with subtle, complex features", "bbox": {"l": 353.17566, "t": 514.50037, "r": 545.11511, "b": 523.40692, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "such as (1) multi-column headers, (2) cell with multi-row", "bbox": {"l": 308.862, "t": 526.45535, "r": 545.11511, "b": 535.3619100000001, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "text and (3) cells with no content. Image from PubTabNet", "bbox": {"l": 308.862, "t": 538.41035, "r": 545.11517, "b": 547.31691, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "evaluation set, filename: \u2018PMC2944238 004 02\u2019.", "bbox": {"l": 308.862, "t": 550.36635, "r": 505.6917700000001, "b": 559.2729, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 1: Picture of a table with subtle, complex features such as (1) multi-column headers, (2) cell with multi-row text and (3) cells with no content. Image from PubTabNet evaluation set, filename: \u2018PMC2944238 004 02\u2019."}, {"label": "text", "id": 0, "page_no": 0, "cluster": {"id": 0, "label": "text", "bbox": {"l": 308.862, "t": 584.40936, "r": 545.11517, "b": 665.04693, "coord_origin": "TOPLEFT"}, "confidence": 0.9848759770393372, "cells": [{"id": 111, "text": "Recently, significant progress has been made with vi-", "bbox": {"l": 320.81699, "t": 584.40936, "r": 545.11493, "b": 593.31592, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "sion based approaches to extract tables in documents. For", "bbox": {"l": 308.862, "t": 596.36436, "r": 545.11517, "b": 605.2709199999999, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "the sake of completeness, the issue of table extraction from", "bbox": {"l": 308.862, "t": 608.31937, "r": 545.11511, "b": 617.22592, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "documents is typically decomposed into two separate chal-", "bbox": {"l": 308.862, "t": 620.27437, "r": 545.11505, "b": 629.18092, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "lenges, i.e.", "bbox": {"l": 308.862, "t": 632.23036, "r": 353.6937, "b": 641.13692, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "(1)", "bbox": {"l": 362.11209, "t": 632.23036, "r": 374.66617, "b": 641.13692, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "finding the location of the table(s) on a", "bbox": {"l": 377.35785, "t": 632.23036, "r": 545.11505, "b": 641.13692, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "document-page and (2) finding the structure of a given table", "bbox": {"l": 308.862, "t": 644.18536, "r": 545.11517, "b": 653.09192, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "in the document.", "bbox": {"l": 308.862, "t": 656.14037, "r": 375.55167, "b": 665.04693, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Recently, significant progress has been made with vision based approaches to extract tables in documents. For the sake of completeness, the issue of table extraction from documents is typically decomposed into two separate challenges, i.e. (1) finding the location of the table(s) on a document-page and (2) finding the structure of a given table in the document."}, {"label": "text", "id": 3, "page_no": 0, "cluster": {"id": 3, "label": "text", "bbox": {"l": 308.862, "t": 668.38036, "r": 545.11511, "b": 713.151932, "coord_origin": "TOPLEFT"}, "confidence": 0.9791521430015564, "cells": [{"id": 120, "text": "The first problem is called table-location and has been", "bbox": {"l": 320.81699, "t": 668.38036, "r": 545.11493, "b": 677.28693, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "previously addressed [30, 38, 19, 21, 23, 26, 8] with state-", "bbox": {"l": 308.862, "t": 680.33536, "r": 545.11511, "b": 689.24193, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "of-the-art object-detection networks (e.g. YOLO and later", "bbox": {"l": 308.862, "t": 692.290359, "r": 545.11511, "b": 701.19693, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "on Mask-RCNN [9]). For all practical purposes, it can be", "bbox": {"l": 308.862, "t": 704.245361, "r": 545.11499, "b": 713.151932, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The first problem is called table-location and has been previously addressed [30, 38, 19, 21, 23, 26, 8] with stateof-the-art object-detection networks (e.g. YOLO and later on Mask-RCNN [9]). For all practical purposes, it can be"}, {"label": "page_footer", "id": 12, "page_no": 0, "cluster": {"id": 12, "label": "page_footer", "bbox": {"l": 295.121, "t": 734.133366, "r": 300.10229, "b": 743.039928, "coord_origin": "TOPLEFT"}, "confidence": 0.8045889139175415, "cells": [{"id": 124, "text": "1", "bbox": {"l": 295.121, "t": 734.133366, "r": 300.10229, "b": 743.039928, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1"}, {"label": "page_header", "id": 9, "page_no": 0, "cluster": {"id": 9, "label": "page_header", "bbox": {"l": 18.340221, "t": 207.82001000000002, "r": 36.339779, "b": 560.00003, "coord_origin": "TOPLEFT"}, "confidence": 0.8773146271705627, "cells": [{"id": 125, "text": "arXiv:2203.01017v2 [cs.CV] 11 Mar 2022", "bbox": {"l": 18.340221, "t": 207.82001000000002, "r": 36.339779, "b": 560.00003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "arXiv:2203.01017v2 [cs.CV] 11 Mar 2022"}], "body": [{"label": "section_header", "id": 8, "page_no": 0, "cluster": {"id": 8, "label": "section_header", "bbox": {"l": 96.301003, "t": 107.03412000000003, "r": 498.92708999999996, "b": 119.93133999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.8868061304092407, "cells": [{"id": 0, "text": "TableFormer: Table Structure Understanding with Transformers.", "bbox": {"l": 96.301003, "t": 107.03412000000003, "r": 498.92708999999996, "b": 119.93133999999998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "TableFormer: Table Structure Understanding with Transformers."}, {"label": "section_header", "id": 13, "page_no": 0, "cluster": {"id": 13, "label": "section_header", "bbox": {"l": 142.47701, "t": 146.68535999999995, "r": 452.75027, "b": 171.32037000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.7586213946342468, "cells": [{"id": 1, "text": "Ahmed Nassar, Nikolaos Livathinos, Maksym Lysak, Peter Staar", "bbox": {"l": 142.47701, "t": 146.68535999999995, "r": 452.75027, "b": 157.37334999999996, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "IBM Research", "bbox": {"l": 262.918, "t": 160.63239, "r": 332.30597, "b": 171.32037000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Ahmed Nassar, Nikolaos Livathinos, Maksym Lysak, Peter Staar IBM Research"}, {"label": "key_value_region", "id": 25, "page_no": 0, "cluster": {"id": 25, "label": "key_value_region", "bbox": {"l": 208.123, "t": 175.96123999999998, "r": 378.73257, "b": 184.42553999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.48547235131263733, "cells": [{"id": 3, "text": "{", "bbox": {"l": 208.123, "t": 175.96123999999998, "r": 212.73083, "b": 184.42553999999996, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "ahn,nli,mly,taa", "bbox": {"l": 212.73, "t": 177.08203000000003, "r": 293.42761, "b": 184.00409000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "}", "bbox": {"l": 293.42798, "t": 175.96123999999998, "r": 298.0358, "b": 184.42553999999996, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "@zurich.ibm.com", "bbox": {"l": 298.03497, "t": 177.08203000000003, "r": 378.73257, "b": 184.00409000000002, "coord_origin": "TOPLEFT"}}], "children": [{"id": 7, "label": "text", "bbox": {"l": 208.123, "t": 175.96123999999998, "r": 378.73257, "b": 184.42553999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9096333980560303, "cells": [{"id": 3, "text": "{", "bbox": {"l": 208.123, "t": 175.96123999999998, "r": 212.73083, "b": 184.42553999999996, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "ahn,nli,mly,taa", "bbox": {"l": 212.73, "t": 177.08203000000003, "r": 293.42761, "b": 184.00409000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "}", "bbox": {"l": 293.42798, "t": 175.96123999999998, "r": 298.0358, "b": 184.42553999999996, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "@zurich.ibm.com", "bbox": {"l": 298.03497, "t": 177.08203000000003, "r": 378.73257, "b": 184.00409000000002, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null}, {"label": "section_header", "id": 5, "page_no": 0, "cluster": {"id": 5, "label": "section_header", "bbox": {"l": 145.99498, "t": 215.48297000000002, "r": 190.48029, "b": 226.23071000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9258671998977661, "cells": [{"id": 7, "text": "Abstract", "bbox": {"l": 145.99498, "t": 215.48297000000002, "r": 190.48029, "b": 226.23071000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Abstract"}, {"label": "text", "id": 2, "page_no": 0, "cluster": {"id": 2, "label": "text", "bbox": {"l": 50.111977, "t": 241.39508, "r": 286.36511, "b": 512.9966400000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9838882088661194, "cells": [{"id": 8, "text": "Tables organize valuable content in a concise and com-", "bbox": {"l": 62.066978, "t": 241.39508, "r": 286.36493, "b": 249.98284999999998, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "pact representation. This content is extremely valuable for", "bbox": {"l": 50.111977, "t": 253.3501, "r": 286.36508, "b": 261.93787, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "systems such as search engines, Knowledge Graph\u2019s, etc,", "bbox": {"l": 50.111977, "t": 265.30511, "r": 286.36508, "b": 273.89288, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "since they enhance their predictive capabilities. Unfortu-", "bbox": {"l": 50.111977, "t": 277.26111000000003, "r": 286.36505, "b": 285.84888, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "nately, tables come in a large variety of shapes and sizes.", "bbox": {"l": 50.111977, "t": 289.21609, "r": 286.36505, "b": 297.80386, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Furthermore, they can have complex column/row-header", "bbox": {"l": 50.111977, "t": 301.17108, "r": 286.36505, "b": 309.75884999999994, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "configurations, multiline rows, different variety of separa-", "bbox": {"l": 50.111977, "t": 313.12607, "r": 286.36508, "b": 321.71384, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "tion lines, missing entries, etc. As such, the correct iden-", "bbox": {"l": 50.111977, "t": 325.08105, "r": 286.36508, "b": 333.66882, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "tification of the table-structure from an image is a non-", "bbox": {"l": 50.111977, "t": 337.03604, "r": 286.36505, "b": 345.62381, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "trivial task. In this paper, we present a new table-structure", "bbox": {"l": 50.111977, "t": 348.99203, "r": 286.36508, "b": 357.5798, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "identification model. The latter improves the latest end-to-", "bbox": {"l": 50.111977, "t": 360.94701999999995, "r": 286.36505, "b": 369.53479, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "end deep learning model (i.e. encoder-dual-decoder from", "bbox": {"l": 50.111977, "t": 372.90201, "r": 286.36508, "b": 381.48978, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "PubTabNet) in two significant ways. First, we introduce a", "bbox": {"l": 50.111977, "t": 384.85699, "r": 286.36505, "b": 393.44476, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "new object detection decoder for table-cells. In this way,", "bbox": {"l": 50.111977, "t": 396.81198, "r": 286.36511, "b": 405.39975000000004, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "we can obtain the content of the table-cells from program-", "bbox": {"l": 50.111977, "t": 408.76697, "r": 286.36508, "b": 417.35474, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "matic PDF\u2019s directly from the PDF source and avoid the", "bbox": {"l": 50.111977, "t": 420.72296000000006, "r": 286.36505, "b": 429.31073, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "training of the custom OCR decoders.", "bbox": {"l": 50.111977, "t": 432.67795, "r": 207.23216, "b": 441.26572, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "This architectural", "bbox": {"l": 214.09639, "t": 432.67795, "r": 286.36508, "b": 441.26572, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "change leads to more accurate table-content extraction and", "bbox": {"l": 50.111977, "t": 444.63293, "r": 286.36508, "b": 453.2207, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "allows us to tackle non-english tables. Second, we replace", "bbox": {"l": 50.111977, "t": 456.58792000000005, "r": 286.36505, "b": 465.17569, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "the LSTM decoders with transformer based decoders. This", "bbox": {"l": 50.111977, "t": 468.54291, "r": 286.36505, "b": 477.13068, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "upgrade improves significantly the previous state-of-the-art", "bbox": {"l": 50.111977, "t": 480.4989, "r": 286.36508, "b": 489.08667, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "tree-editing-distance-score (TEDS) from 91% to 98.5% on", "bbox": {"l": 50.111977, "t": 492.45389, "r": 286.36505, "b": 501.04166, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "simple tables and from 88.7% to 95% on complex tables.", "bbox": {"l": 50.111977, "t": 504.40887, "r": 276.65152, "b": 512.9966400000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Tables organize valuable content in a concise and compact representation. This content is extremely valuable for systems such as search engines, Knowledge Graph\u2019s, etc, since they enhance their predictive capabilities. Unfortunately, tables come in a large variety of shapes and sizes. Furthermore, they can have complex column/row-header configurations, multiline rows, different variety of separation lines, missing entries, etc. As such, the correct identification of the table-structure from an image is a nontrivial task. In this paper, we present a new table-structure identification model. The latter improves the latest end-toend deep learning model (i.e. encoder-dual-decoder from PubTabNet) in two significant ways. First, we introduce a new object detection decoder for table-cells. In this way, we can obtain the content of the table-cells from programmatic PDF\u2019s directly from the PDF source and avoid the training of the custom OCR decoders. This architectural change leads to more accurate table-content extraction and allows us to tackle non-english tables. Second, we replace the LSTM decoders with transformer based decoders. This upgrade improves significantly the previous state-of-the-art tree-editing-distance-score (TEDS) from 91% to 98.5% on simple tables and from 88.7% to 95% on complex tables."}, {"label": "section_header", "id": 4, "page_no": 0, "cluster": {"id": 4, "label": "section_header", "bbox": {"l": 50.111977, "t": 539.94276, "r": 126.94804, "b": 550.69049, "coord_origin": "TOPLEFT"}, "confidence": 0.9317678213119507, "cells": [{"id": 32, "text": "1.", "bbox": {"l": 50.111977, "t": 539.94276, "r": 58.121296, "b": 550.69049, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "Introduction", "bbox": {"l": 68.800385, "t": 539.94276, "r": 126.94804, "b": 550.69049, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1. Introduction"}, {"label": "text", "id": 1, "page_no": 0, "cluster": {"id": 1, "label": "text", "bbox": {"l": 50.111977, "t": 560.7832, "r": 286.36508, "b": 713.151779, "coord_origin": "TOPLEFT"}, "confidence": 0.9841895699501038, "cells": [{"id": 34, "text": "The occurrence of tables in documents is ubiquitous.", "bbox": {"l": 62.066978, "t": 560.7832, "r": 286.36496, "b": 569.68976, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "They often summarise quantitative or factual data, which is", "bbox": {"l": 50.111977, "t": 572.7382, "r": 286.36508, "b": 581.64476, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "cumbersome to describe in verbose text but nevertheless ex-", "bbox": {"l": 50.111977, "t": 584.69321, "r": 286.36505, "b": 593.5997600000001, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "tremely valuable. Unfortunately, this compact representa-", "bbox": {"l": 50.111977, "t": 596.6492000000001, "r": 286.36505, "b": 605.55576, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "tion is often not easy to parse by machines. There are many", "bbox": {"l": 50.111977, "t": 608.6042, "r": 286.36505, "b": 617.51076, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "implicit conventions used to obtain a compact table repre-", "bbox": {"l": 50.111977, "t": 620.5592, "r": 286.36505, "b": 629.46576, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "sentation. For example, tables often have complex column-", "bbox": {"l": 50.111977, "t": 632.51421, "r": 286.36508, "b": 641.42076, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "and row-headers in order to reduce duplicated cell content.", "bbox": {"l": 50.111977, "t": 644.46921, "r": 286.36508, "b": 653.37576, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "Lines of different shapes and sizes are leveraged to separate", "bbox": {"l": 50.111977, "t": 656.42421, "r": 286.36502, "b": 665.33077, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "content or indicate a tree structure. Additionally, tables can", "bbox": {"l": 50.111977, "t": 668.3802000000001, "r": 286.36505, "b": 677.28677, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "also have empty/missing table-entries or multi-row textual", "bbox": {"l": 50.111977, "t": 680.33521, "r": 286.36505, "b": 689.2417800000001, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "table-entries. Fig. 1 shows a table which presents all these", "bbox": {"l": 50.111977, "t": 692.290207, "r": 286.36505, "b": 701.196777, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "issues.", "bbox": {"l": 50.111977, "t": 704.245209, "r": 76.403275, "b": 713.151779, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The occurrence of tables in documents is ubiquitous. They often summarise quantitative or factual data, which is cumbersome to describe in verbose text but nevertheless extremely valuable. Unfortunately, this compact representation is often not easy to parse by machines. There are many implicit conventions used to obtain a compact table representation. For example, tables often have complex columnand row-headers in order to reduce duplicated cell content. Lines of different shapes and sizes are leveraged to separate content or indicate a tree structure. Additionally, tables can also have empty/missing table-entries or multi-row textual table-entries. Fig. 1 shows a table which presents all these issues."}, {"label": "section_header", "id": 14, "page_no": 0, "cluster": {"id": 14, "label": "section_header", "bbox": {"l": 315.56702, "t": 218.00684, "r": 408.4407, "b": 226.75482, "coord_origin": "TOPLEFT"}, "confidence": 0.6724023818969727, "cells": [{"id": 47, "text": "a.", "bbox": {"l": 315.56702, "t": 218.00684, "r": 324.01007, "b": 226.75482, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Picture of a table:", "bbox": {"l": 328.2316, "t": 218.00684, "r": 408.4407, "b": 226.75482, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "a. Picture of a table:"}, {"label": "list_item", "id": 17, "page_no": 0, "cluster": {"id": 17, "label": "list_item", "bbox": {"l": 315.56702, "t": 313.69478999999995, "r": 486.40194999999994, "b": 333.2428, "coord_origin": "TOPLEFT"}, "confidence": 0.5549326539039612, "cells": [{"id": 49, "text": "b.", "bbox": {"l": 315.56702, "t": 313.69478999999995, "r": 325.05786, "b": 322.44281, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Red-annotation of bounding boxes,", "bbox": {"l": 329.80325, "t": 313.69478999999995, "r": 486.40194999999994, "b": 322.44281, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Blue-predictions by TableFormer", "bbox": {"l": 326.46252, "t": 324.49478, "r": 472.47411999999997, "b": 333.2428, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "b. Red-annotation of bounding boxes, Blue-predictions by TableFormer"}, {"label": "list_item", "id": 18, "page_no": 0, "cluster": {"id": 18, "label": "list_item", "bbox": {"l": 315.56702, "t": 420.1828, "r": 491.1912500000001, "b": 428.93082, "coord_origin": "TOPLEFT"}, "confidence": 0.5501352548599243, "cells": [{"id": 52, "text": "c.", "bbox": {"l": 315.56702, "t": 420.1828, "r": 324.81039, "b": 428.93082, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Structure predicted by TableFormer:", "bbox": {"l": 329.4321, "t": 420.1828, "r": 491.1912500000001, "b": 428.93082, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "c. Structure predicted by TableFormer:"}, {"label": "picture", "id": 10, "page_no": 0, "cluster": {"id": 10, "label": "picture", "bbox": {"l": 314.78173828125, "t": 338.0652770996094, "r": 539.1802978515625, "b": 410.0494384765625, "coord_origin": "TOPLEFT"}, "confidence": 0.8742762207984924, "cells": [{"id": 54, "text": "1", "bbox": {"l": 408.14752, "t": 342.82828, "r": 412.54001, "b": 351.61322, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "0", "bbox": {"l": 356.11011, "t": 341.57217, "r": 360.50259, "b": 350.35712, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "2", "bbox": {"l": 500.6777, "t": 340.93768, "r": 505.0701900000001, "b": 349.7226299999999, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "3", "bbox": {"l": 356.13382, "t": 351.74789, "r": 360.52631, "b": 360.53284, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "4", "bbox": {"l": 402.53992, "t": 355.8765, "r": 406.9324, "b": 364.66144, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "5", "bbox": {"l": 448.58178999999996, "t": 352.84018, "r": 452.97427, "b": 361.62512, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "6", "bbox": {"l": 491.65161000000006, "t": 353.70657, "r": 496.0441, "b": 362.49152, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "7", "bbox": {"l": 535.13843, "t": 353.33969, "r": 539.53088, "b": 362.12463, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "8", "bbox": {"l": 348.82822, "t": 387.09781, "r": 353.2207, "b": 395.88275, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "9", "bbox": {"l": 389.27151, "t": 375.37228, "r": 393.664, "b": 384.15723, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "10", "bbox": {"l": 442.67479999999995, "t": 375.64621, "r": 451.45889000000005, "b": 384.43115, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "11", "bbox": {"l": 477.4382299999999, "t": 375.534, "r": 485.90167, "b": 384.31894000000005, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "12", "bbox": {"l": 522.57263, "t": 375.64621, "r": 531.35669, "b": 384.43115, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "13", "bbox": {"l": 400.22992, "t": 387.11429, "r": 409.01401, "b": 395.89923, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "14", "bbox": {"l": 442.30792, "t": 386.98981000000003, "r": 451.0920100000001, "b": 395.77475000000004, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "15", "bbox": {"l": 478.21941999999996, "t": 387.37469, "r": 487.00351000000006, "b": 396.15964, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "16", "bbox": {"l": 523.2287, "t": 386.98981000000003, "r": 532.01276, "b": 395.77475000000004, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "1", "bbox": {"l": 411.57233, "t": 399.42477, "r": 415.96481, "b": 408.20972, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "7", "bbox": {"l": 415.96393, "t": 399.42477, "r": 420.35641, "b": 408.20972, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "18", "bbox": {"l": 442.30521, "t": 399.0371999999999, "r": 451.08929, "b": 407.82213999999993, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "19", "bbox": {"l": 478.77893, "t": 398.99639999999994, "r": 487.56302, "b": 407.78133999999994, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "20", "bbox": {"l": 523.97241, "t": 398.6114799999999, "r": 532.75647, "b": 407.39642, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "3", "bbox": {"l": 385.09399, "t": 357.76030999999995, "r": 391.09879, "b": 367.89072, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "2", "bbox": {"l": 333.43451, "t": 380.7265, "r": 339.4393, "b": 390.85689999999994, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "1", "bbox": {"l": 478.07210999999995, "t": 341.0368000000001, "r": 484.0769, "b": 351.16720999999995, "coord_origin": "TOPLEFT"}}], "children": [{"id": 19, "label": "text", "bbox": {"l": 408.14752, "t": 342.82828, "r": 412.54001, "b": 351.61322, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "1", "bbox": {"l": 408.14752, "t": 342.82828, "r": 412.54001, "b": 351.61322, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 356.11011, "t": 341.57217, "r": 360.50259, "b": 350.35712, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "0", "bbox": {"l": 356.11011, "t": 341.57217, "r": 360.50259, "b": 350.35712, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 500.6777, "t": 340.93768, "r": 505.0701900000001, "b": 349.7226299999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "2", "bbox": {"l": 500.6777, "t": 340.93768, "r": 505.0701900000001, "b": 349.7226299999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 356.13382, "t": 351.74789, "r": 360.52631, "b": 360.53284, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "3", "bbox": {"l": 356.13382, "t": 351.74789, "r": 360.52631, "b": 360.53284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 402.53992, "t": 355.8765, "r": 406.9324, "b": 364.66144, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "4", "bbox": {"l": 402.53992, "t": 355.8765, "r": 406.9324, "b": 364.66144, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 448.58178999999996, "t": 352.84018, "r": 452.97427, "b": 361.62512, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "5", "bbox": {"l": 448.58178999999996, "t": 352.84018, "r": 452.97427, "b": 361.62512, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 491.65161000000006, "t": 353.70657, "r": 496.0441, "b": 362.49152, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "6", "bbox": {"l": 491.65161000000006, "t": 353.70657, "r": 496.0441, "b": 362.49152, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 535.13843, "t": 353.33969, "r": 539.53088, "b": 362.12463, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "7", "bbox": {"l": 535.13843, "t": 353.33969, "r": 539.53088, "b": 362.12463, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 348.82822, "t": 387.09781, "r": 353.2207, "b": 395.88275, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "8", "bbox": {"l": 348.82822, "t": 387.09781, "r": 353.2207, "b": 395.88275, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 389.27151, "t": 375.37228, "r": 393.664, "b": 384.15723, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "9", "bbox": {"l": 389.27151, "t": 375.37228, "r": 393.664, "b": 384.15723, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 442.67479999999995, "t": 375.64621, "r": 451.45889000000005, "b": 384.43115, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "10", "bbox": {"l": 442.67479999999995, "t": 375.64621, "r": 451.45889000000005, "b": 384.43115, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 477.4382299999999, "t": 375.534, "r": 485.90167, "b": 384.31894000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "11", "bbox": {"l": 477.4382299999999, "t": 375.534, "r": 485.90167, "b": 384.31894000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 522.57263, "t": 375.64621, "r": 531.35669, "b": 384.43115, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "12", "bbox": {"l": 522.57263, "t": 375.64621, "r": 531.35669, "b": 384.43115, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 400.22992, "t": 387.11429, "r": 409.01401, "b": 395.89923, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "13", "bbox": {"l": 400.22992, "t": 387.11429, "r": 409.01401, "b": 395.89923, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 442.30792, "t": 386.98981000000003, "r": 451.0920100000001, "b": 395.77475000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "14", "bbox": {"l": 442.30792, "t": 386.98981000000003, "r": 451.0920100000001, "b": 395.77475000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 478.21941999999996, "t": 387.37469, "r": 487.00351000000006, "b": 396.15964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "15", "bbox": {"l": 478.21941999999996, "t": 387.37469, "r": 487.00351000000006, "b": 396.15964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 523.2287, "t": 386.98981000000003, "r": 532.01276, "b": 395.77475000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "16", "bbox": {"l": 523.2287, "t": 386.98981000000003, "r": 532.01276, "b": 395.77475000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 411.57233, "t": 399.42477, "r": 415.96481, "b": 408.20972, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "1", "bbox": {"l": 411.57233, "t": 399.42477, "r": 415.96481, "b": 408.20972, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 415.96393, "t": 399.42477, "r": 420.35641, "b": 408.20972, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "7", "bbox": {"l": 415.96393, "t": 399.42477, "r": 420.35641, "b": 408.20972, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 442.30521, "t": 399.0371999999999, "r": 451.08929, "b": 407.82213999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "18", "bbox": {"l": 442.30521, "t": 399.0371999999999, "r": 451.08929, "b": 407.82213999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 478.77893, "t": 398.99639999999994, "r": 487.56302, "b": 407.78133999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "19", "bbox": {"l": 478.77893, "t": 398.99639999999994, "r": 487.56302, "b": 407.78133999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 523.97241, "t": 398.6114799999999, "r": 532.75647, "b": 407.39642, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "20", "bbox": {"l": 523.97241, "t": 398.6114799999999, "r": 532.75647, "b": 407.39642, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 385.09399, "t": 357.76030999999995, "r": 391.09879, "b": 367.89072, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "3", "bbox": {"l": 385.09399, "t": 357.76030999999995, "r": 391.09879, "b": 367.89072, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 333.43451, "t": 380.7265, "r": 339.4393, "b": 390.85689999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "2", "bbox": {"l": 333.43451, "t": 380.7265, "r": 339.4393, "b": 390.85689999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 478.07210999999995, "t": 341.0368000000001, "r": 484.0769, "b": 351.16720999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": "1", "bbox": {"l": 478.07210999999995, "t": 341.0368000000001, "r": 484.0769, "b": 351.16720999999995, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "picture", "id": 23, "page_no": 0, "cluster": {"id": 23, "label": "picture", "bbox": {"l": 315.7172546386719, "t": 433.823486328125, "r": 536.835693359375, "b": 496.0290222167969, "coord_origin": "TOPLEFT"}, "confidence": 0.5088647603988647, "cells": [{"id": 76, "text": "1", "bbox": {"l": 347.24872, "t": 437.68588, "r": 351.6412, "b": 446.47083, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "0", "bbox": {"l": 318.88071, "t": 437.68588, "r": 323.27319, "b": 446.47083, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "2", "bbox": {"l": 394.10422, "t": 437.68588, "r": 398.4967, "b": 446.47083, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "3", "bbox": {"l": 318.77316, "t": 449.5455, "r": 323.16565, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "4", "bbox": {"l": 347.24872, "t": 449.5455, "r": 351.6412, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "5", "bbox": {"l": 394.10422, "t": 449.5455, "r": 398.4967, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "6", "bbox": {"l": 440.95941000000005, "t": 449.5455, "r": 445.3519, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "7", "bbox": {"l": 487.81491, "t": 449.5455, "r": 492.2074, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "8", "bbox": {"l": 318.77316, "t": 473.70425, "r": 323.16565, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "9", "bbox": {"l": 347.24872, "t": 461.8446, "r": 351.6412, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "10", "bbox": {"l": 394.10422, "t": 461.8446, "r": 402.88831, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "11", "bbox": {"l": 440.95941000000005, "t": 461.8446, "r": 449.42285, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "12", "bbox": {"l": 487.81491, "t": 461.8446, "r": 496.599, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "13", "bbox": {"l": 347.24872, "t": 473.70425, "r": 356.03281, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "14", "bbox": {"l": 394.10422, "t": 473.70425, "r": 402.88831, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "15", "bbox": {"l": 440.95941000000005, "t": 473.70425, "r": 449.7435, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "16", "bbox": {"l": 487.81491, "t": 473.70425, "r": 496.599, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "17", "bbox": {"l": 347.24872, "t": 485.12469, "r": 356.03281, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "18", "bbox": {"l": 394.10422, "t": 485.12469, "r": 402.88831, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "19", "bbox": {"l": 440.95941000000005, "t": 485.12469, "r": 449.7435, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "20", "bbox": {"l": 487.81491, "t": 485.12469, "r": 496.599, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "3", "bbox": {"l": 366.70102, "t": 449.12082, "r": 372.70581, "b": 459.25122, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "2", "bbox": {"l": 331.90424, "t": 473.32291, "r": 337.90903, "b": 483.45331, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "1", "bbox": {"l": 459.87621999999993, "t": 437.5936, "r": 465.88101, "b": 447.724, "coord_origin": "TOPLEFT"}}], "children": [{"id": 41, "label": "text", "bbox": {"l": 347.24872, "t": 437.68588, "r": 351.6412, "b": 446.47083, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "1", "bbox": {"l": 347.24872, "t": 437.68588, "r": 351.6412, "b": 446.47083, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 318.88071, "t": 437.68588, "r": 323.27319, "b": 446.47083, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "0", "bbox": {"l": 318.88071, "t": 437.68588, "r": 323.27319, "b": 446.47083, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 394.10422, "t": 437.68588, "r": 398.4967, "b": 446.47083, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "2", "bbox": {"l": 394.10422, "t": 437.68588, "r": 398.4967, "b": 446.47083, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 318.77316, "t": 449.5455, "r": 323.16565, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "3", "bbox": {"l": 318.77316, "t": 449.5455, "r": 323.16565, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 347.24872, "t": 449.5455, "r": 351.6412, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "4", "bbox": {"l": 347.24872, "t": 449.5455, "r": 351.6412, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 394.10422, "t": 449.5455, "r": 398.4967, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "5", "bbox": {"l": 394.10422, "t": 449.5455, "r": 398.4967, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 440.95941000000005, "t": 449.5455, "r": 445.3519, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "6", "bbox": {"l": 440.95941000000005, "t": 449.5455, "r": 445.3519, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 487.81491, "t": 449.5455, "r": 492.2074, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "7", "bbox": {"l": 487.81491, "t": 449.5455, "r": 492.2074, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 318.77316, "t": 473.70425, "r": 323.16565, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "8", "bbox": {"l": 318.77316, "t": 473.70425, "r": 323.16565, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 347.24872, "t": 461.8446, "r": 351.6412, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "9", "bbox": {"l": 347.24872, "t": 461.8446, "r": 351.6412, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 394.10422, "t": 461.8446, "r": 402.88831, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "10", "bbox": {"l": 394.10422, "t": 461.8446, "r": 402.88831, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 440.95941000000005, "t": 461.8446, "r": 449.42285, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "11", "bbox": {"l": 440.95941000000005, "t": 461.8446, "r": 449.42285, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 487.81491, "t": 461.8446, "r": 496.599, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "12", "bbox": {"l": 487.81491, "t": 461.8446, "r": 496.599, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 347.24872, "t": 473.70425, "r": 356.03281, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "13", "bbox": {"l": 347.24872, "t": 473.70425, "r": 356.03281, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 394.10422, "t": 473.70425, "r": 402.88831, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "14", "bbox": {"l": 394.10422, "t": 473.70425, "r": 402.88831, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 440.95941000000005, "t": 473.70425, "r": 449.7435, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "15", "bbox": {"l": 440.95941000000005, "t": 473.70425, "r": 449.7435, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 487.81491, "t": 473.70425, "r": 496.599, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "16", "bbox": {"l": 487.81491, "t": 473.70425, "r": 496.599, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 347.24872, "t": 485.12469, "r": 356.03281, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "17", "bbox": {"l": 347.24872, "t": 485.12469, "r": 356.03281, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 394.10422, "t": 485.12469, "r": 402.88831, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "18", "bbox": {"l": 394.10422, "t": 485.12469, "r": 402.88831, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 440.95941000000005, "t": 485.12469, "r": 449.7435, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "19", "bbox": {"l": 440.95941000000005, "t": 485.12469, "r": 449.7435, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 487.81491, "t": 485.12469, "r": 496.599, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "20", "bbox": {"l": 487.81491, "t": 485.12469, "r": 496.599, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 366.70102, "t": 449.12082, "r": 372.70581, "b": 459.25122, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "3", "bbox": {"l": 366.70102, "t": 449.12082, "r": 372.70581, "b": 459.25122, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 331.90424, "t": 473.32291, "r": 337.90903, "b": 483.45331, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "2", "bbox": {"l": 331.90424, "t": 473.32291, "r": 337.90903, "b": 483.45331, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 459.87621999999993, "t": 437.5936, "r": 465.88101, "b": 447.724, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "1", "bbox": {"l": 459.87621999999993, "t": 437.5936, "r": 465.88101, "b": 447.724, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "table", "id": 11, "page_no": 0, "cluster": {"id": 11, "label": "table", "bbox": {"l": 315.7172546386719, "t": 433.823486328125, "r": 536.835693359375, "b": 496.0290222167969, "coord_origin": "TOPLEFT"}, "confidence": 0.8056104183197021, "cells": [{"id": 76, "text": "1", "bbox": {"l": 347.24872, "t": 437.68588, "r": 351.6412, "b": 446.47083, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "0", "bbox": {"l": 318.88071, "t": 437.68588, "r": 323.27319, "b": 446.47083, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "2", "bbox": {"l": 394.10422, "t": 437.68588, "r": 398.4967, "b": 446.47083, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "3", "bbox": {"l": 318.77316, "t": 449.5455, "r": 323.16565, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "4", "bbox": {"l": 347.24872, "t": 449.5455, "r": 351.6412, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "5", "bbox": {"l": 394.10422, "t": 449.5455, "r": 398.4967, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "6", "bbox": {"l": 440.95941000000005, "t": 449.5455, "r": 445.3519, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "7", "bbox": {"l": 487.81491, "t": 449.5455, "r": 492.2074, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "8", "bbox": {"l": 318.77316, "t": 473.70425, "r": 323.16565, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "9", "bbox": {"l": 347.24872, "t": 461.8446, "r": 351.6412, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "10", "bbox": {"l": 394.10422, "t": 461.8446, "r": 402.88831, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "11", "bbox": {"l": 440.95941000000005, "t": 461.8446, "r": 449.42285, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "12", "bbox": {"l": 487.81491, "t": 461.8446, "r": 496.599, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "13", "bbox": {"l": 347.24872, "t": 473.70425, "r": 356.03281, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "14", "bbox": {"l": 394.10422, "t": 473.70425, "r": 402.88831, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "15", "bbox": {"l": 440.95941000000005, "t": 473.70425, "r": 449.7435, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "16", "bbox": {"l": 487.81491, "t": 473.70425, "r": 496.599, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "17", "bbox": {"l": 347.24872, "t": 485.12469, "r": 356.03281, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "18", "bbox": {"l": 394.10422, "t": 485.12469, "r": 402.88831, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "19", "bbox": {"l": 440.95941000000005, "t": 485.12469, "r": 449.7435, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "20", "bbox": {"l": 487.81491, "t": 485.12469, "r": 496.599, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "3", "bbox": {"l": 366.70102, "t": 449.12082, "r": 372.70581, "b": 459.25122, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "2", "bbox": {"l": 331.90424, "t": 473.32291, "r": 337.90903, "b": 483.45331, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "1", "bbox": {"l": 459.87621999999993, "t": 437.5936, "r": 465.88101, "b": 447.724, "coord_origin": "TOPLEFT"}}], "children": [{"id": 41, "label": "text", "bbox": {"l": 347.24872, "t": 437.68588, "r": 351.6412, "b": 446.47083, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "1", "bbox": {"l": 347.24872, "t": 437.68588, "r": 351.6412, "b": 446.47083, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 318.88071, "t": 437.68588, "r": 323.27319, "b": 446.47083, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "0", "bbox": {"l": 318.88071, "t": 437.68588, "r": 323.27319, "b": 446.47083, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 394.10422, "t": 437.68588, "r": 398.4967, "b": 446.47083, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "2", "bbox": {"l": 394.10422, "t": 437.68588, "r": 398.4967, "b": 446.47083, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 318.77316, "t": 449.5455, "r": 323.16565, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "3", "bbox": {"l": 318.77316, "t": 449.5455, "r": 323.16565, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 347.24872, "t": 449.5455, "r": 351.6412, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "4", "bbox": {"l": 347.24872, "t": 449.5455, "r": 351.6412, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 394.10422, "t": 449.5455, "r": 398.4967, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "5", "bbox": {"l": 394.10422, "t": 449.5455, "r": 398.4967, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 440.95941000000005, "t": 449.5455, "r": 445.3519, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "6", "bbox": {"l": 440.95941000000005, "t": 449.5455, "r": 445.3519, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 487.81491, "t": 449.5455, "r": 492.2074, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "7", "bbox": {"l": 487.81491, "t": 449.5455, "r": 492.2074, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 318.77316, "t": 473.70425, "r": 323.16565, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "8", "bbox": {"l": 318.77316, "t": 473.70425, "r": 323.16565, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 347.24872, "t": 461.8446, "r": 351.6412, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "9", "bbox": {"l": 347.24872, "t": 461.8446, "r": 351.6412, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 394.10422, "t": 461.8446, "r": 402.88831, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "10", "bbox": {"l": 394.10422, "t": 461.8446, "r": 402.88831, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 440.95941000000005, "t": 461.8446, "r": 449.42285, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "11", "bbox": {"l": 440.95941000000005, "t": 461.8446, "r": 449.42285, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 487.81491, "t": 461.8446, "r": 496.599, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "12", "bbox": {"l": 487.81491, "t": 461.8446, "r": 496.599, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 347.24872, "t": 473.70425, "r": 356.03281, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "13", "bbox": {"l": 347.24872, "t": 473.70425, "r": 356.03281, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 394.10422, "t": 473.70425, "r": 402.88831, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "14", "bbox": {"l": 394.10422, "t": 473.70425, "r": 402.88831, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 440.95941000000005, "t": 473.70425, "r": 449.7435, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "15", "bbox": {"l": 440.95941000000005, "t": 473.70425, "r": 449.7435, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 487.81491, "t": 473.70425, "r": 496.599, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "16", "bbox": {"l": 487.81491, "t": 473.70425, "r": 496.599, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 347.24872, "t": 485.12469, "r": 356.03281, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "17", "bbox": {"l": 347.24872, "t": 485.12469, "r": 356.03281, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 394.10422, "t": 485.12469, "r": 402.88831, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "18", "bbox": {"l": 394.10422, "t": 485.12469, "r": 402.88831, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 440.95941000000005, "t": 485.12469, "r": 449.7435, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "19", "bbox": {"l": 440.95941000000005, "t": 485.12469, "r": 449.7435, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 487.81491, "t": 485.12469, "r": 496.599, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "20", "bbox": {"l": 487.81491, "t": 485.12469, "r": 496.599, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 366.70102, "t": 449.12082, "r": 372.70581, "b": 459.25122, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "3", "bbox": {"l": 366.70102, "t": 449.12082, "r": 372.70581, "b": 459.25122, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 331.90424, "t": 473.32291, "r": 337.90903, "b": 483.45331, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "2", "bbox": {"l": 331.90424, "t": 473.32291, "r": 337.90903, "b": 483.45331, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 459.87621999999993, "t": 437.5936, "r": 465.88101, "b": 447.724, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "1", "bbox": {"l": 459.87621999999993, "t": 437.5936, "r": 465.88101, "b": 447.724, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "lcel", "ched", "lcel", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "ucel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "ucel", "nl"], "num_rows": 5, "num_cols": 6, "table_cells": [{"bbox": {"l": 347.24872, "t": 437.68588, "r": 351.6412, "b": 446.47083, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 3, "text": "1", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 318.88071, "t": 437.68588, "r": 323.27319, "b": 446.47083, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "0", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 394.10422, "t": 437.5936, "r": 465.88101, "b": 447.724, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 5, "text": "2 1", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 318.77316, "t": 449.5455, "r": 323.16565, "b": 458.33044, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 347.24872, "t": 449.5455, "r": 351.6412, "b": 458.33044, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 366.70102, "t": 449.12082, "r": 398.4967, "b": 459.25122, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "5 3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.95941000000005, "t": 449.5455, "r": 445.3519, "b": 458.33044, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.81491, "t": 449.5455, "r": 492.2074, "b": 458.33044, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 318.77316, "t": 473.70425, "r": 323.16565, "b": 482.4892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 347.24872, "t": 461.8446, "r": 351.6412, "b": 470.62955, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.10422, "t": 461.8446, "r": 402.88831, "b": 470.62955, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "10", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.95941000000005, "t": 461.8446, "r": 449.42285, "b": 470.62955, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "11", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.81491, "t": 461.8446, "r": 496.599, "b": 470.62955, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "12", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 347.24872, "t": 473.70425, "r": 356.03281, "b": 482.4892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "13", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.10422, "t": 473.70425, "r": 402.88831, "b": 482.4892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "14", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.95941000000005, "t": 473.70425, "r": 449.7435, "b": 482.4892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "15", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.81491, "t": 473.70425, "r": 496.599, "b": 482.4892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "16", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 347.24872, "t": 485.12469, "r": 356.03281, "b": 493.90964, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "17", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.10422, "t": 485.12469, "r": 402.88831, "b": 493.90964, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "18", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.95941000000005, "t": 485.12469, "r": 449.7435, "b": 493.90964, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "19", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.81491, "t": 485.12469, "r": 496.599, "b": 493.90964, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "20", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 331.90424, "t": 473.32291, "r": 337.90903, "b": 483.45331, "coord_origin": "TOPLEFT"}, "row_span": 3, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "2", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "picture", "id": 16, "page_no": 0, "cluster": {"id": 16, "label": "picture", "bbox": {"l": 315.65362548828125, "t": 228.7234344482422, "r": 537.1475219726562, "b": 302.80145263671875, "coord_origin": "TOPLEFT"}, "confidence": 0.608779788017273, "cells": [{"id": 97, "text": "1", "bbox": {"l": 451.9457100000001, "t": 235.34704999999997, "r": 457.95050000000003, "b": 245.47748, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "2", "bbox": {"l": 331.19681, "t": 269.35266, "r": 337.2016, "b": 279.48308999999995, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "3", "bbox": {"l": 384.0329, "t": 252.67895999999996, "r": 390.03769, "b": 262.80939, "coord_origin": "TOPLEFT"}}], "children": [{"id": 62, "label": "text", "bbox": {"l": 451.9457100000001, "t": 235.34704999999997, "r": 457.95050000000003, "b": 245.47748, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "1", "bbox": {"l": 451.9457100000001, "t": 235.34704999999997, "r": 457.95050000000003, "b": 245.47748, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 331.19681, "t": 269.35266, "r": 337.2016, "b": 279.48308999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "2", "bbox": {"l": 331.19681, "t": 269.35266, "r": 337.2016, "b": 279.48308999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 384.0329, "t": 252.67895999999996, "r": 390.03769, "b": 262.80939, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "3", "bbox": {"l": 384.0329, "t": 252.67895999999996, "r": 390.03769, "b": 262.80939, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "table", "id": 15, "page_no": 0, "cluster": {"id": 15, "label": "table", "bbox": {"l": 315.65362548828125, "t": 228.7234344482422, "r": 537.1475219726562, "b": 302.80145263671875, "coord_origin": "TOPLEFT"}, "confidence": 0.651587724685669, "cells": [{"id": 97, "text": "1", "bbox": {"l": 451.9457100000001, "t": 235.34704999999997, "r": 457.95050000000003, "b": 245.47748, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "2", "bbox": {"l": 331.19681, "t": 269.35266, "r": 337.2016, "b": 279.48308999999995, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "3", "bbox": {"l": 384.0329, "t": 252.67895999999996, "r": 390.03769, "b": 262.80939, "coord_origin": "TOPLEFT"}}], "children": [{"id": 62, "label": "text", "bbox": {"l": 451.9457100000001, "t": 235.34704999999997, "r": 457.95050000000003, "b": 245.47748, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "1", "bbox": {"l": 451.9457100000001, "t": 235.34704999999997, "r": 457.95050000000003, "b": 245.47748, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 331.19681, "t": 269.35266, "r": 337.2016, "b": 279.48308999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "2", "bbox": {"l": 331.19681, "t": 269.35266, "r": 337.2016, "b": 279.48308999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 384.0329, "t": 252.67895999999996, "r": 390.03769, "b": 262.80939, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "3", "bbox": {"l": 384.0329, "t": 252.67895999999996, "r": 390.03769, "b": 262.80939, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ecel", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "ucel", "fcel", "fcel", "fcel", "fcel", "nl", "ucel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 1, "num_cols": 2, "table_cells": [{"bbox": {"l": 451.9457100000001, "t": 235.34704999999997, "r": 457.95050000000003, "b": 245.47748, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "1", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 384.0329, "t": 252.67895999999996, "r": 390.03769, "b": 262.80939, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3", "column_header": true, "row_header": false, "row_section": false}]}, {"label": "caption", "id": 6, "page_no": 0, "cluster": {"id": 6, "label": "caption", "bbox": {"l": 308.862, "t": 514.50037, "r": 545.11517, "b": 559.2729, "coord_origin": "TOPLEFT"}, "confidence": 0.9214621186256409, "cells": [{"id": 106, "text": "Figure 1:", "bbox": {"l": 308.862, "t": 514.50037, "r": 345.73361, "b": 523.40692, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "Picture of a table with subtle, complex features", "bbox": {"l": 353.17566, "t": 514.50037, "r": 545.11511, "b": 523.40692, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "such as (1) multi-column headers, (2) cell with multi-row", "bbox": {"l": 308.862, "t": 526.45535, "r": 545.11511, "b": 535.3619100000001, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "text and (3) cells with no content. Image from PubTabNet", "bbox": {"l": 308.862, "t": 538.41035, "r": 545.11517, "b": 547.31691, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "evaluation set, filename: \u2018PMC2944238 004 02\u2019.", "bbox": {"l": 308.862, "t": 550.36635, "r": 505.6917700000001, "b": 559.2729, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 1: Picture of a table with subtle, complex features such as (1) multi-column headers, (2) cell with multi-row text and (3) cells with no content. Image from PubTabNet evaluation set, filename: \u2018PMC2944238 004 02\u2019."}, {"label": "text", "id": 0, "page_no": 0, "cluster": {"id": 0, "label": "text", "bbox": {"l": 308.862, "t": 584.40936, "r": 545.11517, "b": 665.04693, "coord_origin": "TOPLEFT"}, "confidence": 0.9848759770393372, "cells": [{"id": 111, "text": "Recently, significant progress has been made with vi-", "bbox": {"l": 320.81699, "t": 584.40936, "r": 545.11493, "b": 593.31592, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "sion based approaches to extract tables in documents. For", "bbox": {"l": 308.862, "t": 596.36436, "r": 545.11517, "b": 605.2709199999999, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "the sake of completeness, the issue of table extraction from", "bbox": {"l": 308.862, "t": 608.31937, "r": 545.11511, "b": 617.22592, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "documents is typically decomposed into two separate chal-", "bbox": {"l": 308.862, "t": 620.27437, "r": 545.11505, "b": 629.18092, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "lenges, i.e.", "bbox": {"l": 308.862, "t": 632.23036, "r": 353.6937, "b": 641.13692, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "(1)", "bbox": {"l": 362.11209, "t": 632.23036, "r": 374.66617, "b": 641.13692, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "finding the location of the table(s) on a", "bbox": {"l": 377.35785, "t": 632.23036, "r": 545.11505, "b": 641.13692, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "document-page and (2) finding the structure of a given table", "bbox": {"l": 308.862, "t": 644.18536, "r": 545.11517, "b": 653.09192, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "in the document.", "bbox": {"l": 308.862, "t": 656.14037, "r": 375.55167, "b": 665.04693, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Recently, significant progress has been made with vision based approaches to extract tables in documents. For the sake of completeness, the issue of table extraction from documents is typically decomposed into two separate challenges, i.e. (1) finding the location of the table(s) on a document-page and (2) finding the structure of a given table in the document."}, {"label": "text", "id": 3, "page_no": 0, "cluster": {"id": 3, "label": "text", "bbox": {"l": 308.862, "t": 668.38036, "r": 545.11511, "b": 713.151932, "coord_origin": "TOPLEFT"}, "confidence": 0.9791521430015564, "cells": [{"id": 120, "text": "The first problem is called table-location and has been", "bbox": {"l": 320.81699, "t": 668.38036, "r": 545.11493, "b": 677.28693, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "previously addressed [30, 38, 19, 21, 23, 26, 8] with state-", "bbox": {"l": 308.862, "t": 680.33536, "r": 545.11511, "b": 689.24193, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "of-the-art object-detection networks (e.g. YOLO and later", "bbox": {"l": 308.862, "t": 692.290359, "r": 545.11511, "b": 701.19693, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "on Mask-RCNN [9]). For all practical purposes, it can be", "bbox": {"l": 308.862, "t": 704.245361, "r": 545.11499, "b": 713.151932, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The first problem is called table-location and has been previously addressed [30, 38, 19, 21, 23, 26, 8] with stateof-the-art object-detection networks (e.g. YOLO and later on Mask-RCNN [9]). For all practical purposes, it can be"}], "headers": [{"label": "page_footer", "id": 12, "page_no": 0, "cluster": {"id": 12, "label": "page_footer", "bbox": {"l": 295.121, "t": 734.133366, "r": 300.10229, "b": 743.039928, "coord_origin": "TOPLEFT"}, "confidence": 0.8045889139175415, "cells": [{"id": 124, "text": "1", "bbox": {"l": 295.121, "t": 734.133366, "r": 300.10229, "b": 743.039928, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1"}, {"label": "page_header", "id": 9, "page_no": 0, "cluster": {"id": 9, "label": "page_header", "bbox": {"l": 18.340221, "t": 207.82001000000002, "r": 36.339779, "b": 560.00003, "coord_origin": "TOPLEFT"}, "confidence": 0.8773146271705627, "cells": [{"id": 125, "text": "arXiv:2203.01017v2 [cs.CV] 11 Mar 2022", "bbox": {"l": 18.340221, "t": 207.82001000000002, "r": 36.339779, "b": 560.00003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "arXiv:2203.01017v2 [cs.CV] 11 Mar 2022"}]}}, {"page_no": 1, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "considered as a solved problem, given enough ground-truth", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 286.36505, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "data to train on.", "bbox": {"l": 50.112, "t": 87.16339000000005, "r": 112.64721999999999, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "The second problem is called table-structure decompo-", "bbox": {"l": 62.067001, "t": 99.57141000000001, "r": 286.36496, "b": 108.47797000000003, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "sition.", "bbox": {"l": 50.112, "t": 111.52643, "r": 74.749512, "b": 120.43297999999993, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "The latter is a long standing problem in the com-", "bbox": {"l": 81.334793, "t": 111.52643, "r": 286.36514, "b": 120.43297999999993, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "munity of document understanding [6, 4, 14]. Contrary to", "bbox": {"l": 50.112, "t": 123.48145, "r": 286.36511, "b": 132.38800000000003, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "the table-location problem, there are no commonly used ap-", "bbox": {"l": 50.112, "t": 135.43646, "r": 286.36511, "b": 144.34302000000002, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "proaches that can easily be re-purposed to solve this prob-", "bbox": {"l": 50.112, "t": 147.39246000000003, "r": 286.36505, "b": 156.29900999999995, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "lem. Lately, a set of new model-architectures has been pro-", "bbox": {"l": 50.112, "t": 159.34747000000004, "r": 286.36511, "b": 168.25402999999994, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "posed by the community to address table-structure decom-", "bbox": {"l": 50.112, "t": 171.30249000000003, "r": 286.36508, "b": 180.20905000000005, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "position [37, 36, 18, 20]. All these models have some weak-", "bbox": {"l": 50.112, "t": 183.25751000000002, "r": 286.36511, "b": 192.16405999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "nesses (see Sec. 2). The common denominator here is the", "bbox": {"l": 50.112, "t": 195.21252000000004, "r": 286.36508, "b": 204.11908000000005, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "reliance on textual features and/or the inability to provide", "bbox": {"l": 50.112, "t": 207.16754000000003, "r": 286.36514, "b": 216.07410000000004, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "the bounding box of each table-cell in the original image.", "bbox": {"l": 50.112, "t": 219.12354000000005, "r": 278.66397, "b": 228.03008999999997, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "In this paper, we want to address these weaknesses and", "bbox": {"l": 62.067001, "t": 231.53156, "r": 286.36493, "b": 240.43811000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "present a robust table-structure decomposition algorithm.", "bbox": {"l": 50.112, "t": 243.48657000000003, "r": 286.36511, "b": 252.39313000000004, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "The design criteria for our model are the following. First,", "bbox": {"l": 50.112, "t": 255.44159000000002, "r": 286.36511, "b": 264.34813999999994, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "we want our algorithm to be language agnostic. In this way,", "bbox": {"l": 50.112, "t": 267.39661, "r": 286.36502, "b": 276.30316000000005, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "we can obtain the structure of any table, irregardless of the", "bbox": {"l": 50.112, "t": 279.35155999999995, "r": 286.36508, "b": 288.25815, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "language.", "bbox": {"l": 50.112, "t": 291.30759, "r": 88.567635, "b": 300.21414, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Second, we want our algorithm to leverage as", "bbox": {"l": 95.501602, "t": 291.30759, "r": 286.36505, "b": 300.21414, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "much data as possible from the original PDF document. For", "bbox": {"l": 50.112, "t": 303.26257, "r": 286.36508, "b": 312.16913, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "programmatic PDF documents, the text-cells can often be", "bbox": {"l": 50.112, "t": 315.21756, "r": 286.36511, "b": 324.12411, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "extracted much faster and with higher accuracy compared", "bbox": {"l": 50.112, "t": 327.17255, "r": 286.36505, "b": 336.0791, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "to OCR methods. Last but not least, we want to have a di-", "bbox": {"l": 50.112, "t": 339.12753, "r": 286.36511, "b": 348.03409, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "rect link between the table-cell and its bounding box in the", "bbox": {"l": 50.112, "t": 351.08353, "r": 286.36508, "b": 359.99008, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "image.", "bbox": {"l": 50.112, "t": 363.03851, "r": 76.951241, "b": 371.94507, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "To meet the design criteria listed above, we developed a", "bbox": {"l": 62.067001, "t": 375.4465, "r": 286.36499, "b": 384.35306, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "new model called", "bbox": {"l": 50.112, "t": 387.40149, "r": 120.98594, "b": 396.30804, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "TableFormer", "bbox": {"l": 123.901, "t": 387.28192, "r": 179.7314, "b": 396.23830999999996, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "and a synthetically gener-", "bbox": {"l": 182.646, "t": 387.40149, "r": 286.36658, "b": 396.30804, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "ated table structure dataset called", "bbox": {"l": 50.112, "t": 399.35648, "r": 181.75778, "b": 408.26302999999996, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "SynthTabNet", "bbox": {"l": 184.104, "t": 399.23690999999997, "r": 240.2034, "b": 408.1933, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "$^{1}$. In partic-", "bbox": {"l": 240.20401, "t": 399.35648, "r": 286.36069, "b": 408.26302999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "ular, our contributions in this work can be summarised as", "bbox": {"l": 50.112015, "t": 411.31146, "r": 286.36511, "b": 420.21802, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "follows:", "bbox": {"l": 50.112015, "t": 423.26645, "r": 82.520355, "b": 432.173, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "\u2022", "bbox": {"l": 61.569016, "t": 444.55145, "r": 70.741714, "b": 453.45801, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "We propose", "bbox": {"l": 73.034889, "t": 444.55145, "r": 117.10054, "b": 453.45801, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "TableFormer", "bbox": {"l": 119.59001, "t": 444.43188, "r": 175.42041, "b": 453.38828, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": ", a transformer based model", "bbox": {"l": 175.42102, "t": 444.55145, "r": 286.36453, "b": 453.45801, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "that predicts tables structure and bounding boxes for", "bbox": {"l": 70.037018, "t": 456.50644000000005, "r": 286.3649, "b": 465.41299, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "the table content simultaneously in an end-to-end ap-", "bbox": {"l": 70.037018, "t": 468.46143, "r": 286.3649, "b": 477.36798, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "proach.", "bbox": {"l": 70.037018, "t": 480.41641, "r": 99.635902, "b": 489.32297, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "\u2022", "bbox": {"l": 61.569016, "t": 502.15341, "r": 71.619438, "b": 511.05997, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "Across all benchmark datasets", "bbox": {"l": 74.132042, "t": 502.15341, "r": 196.10396, "b": 511.05997, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "TableFormer", "bbox": {"l": 200.31001, "t": 502.03384, "r": 256.14041, "b": 510.99023, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "signif-", "bbox": {"l": 260.35001, "t": 502.15341, "r": 286.36237, "b": 511.05997, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "icantly outperforms existing state-of-the-art metrics,", "bbox": {"l": 70.037003, "t": 514.1084000000001, "r": 286.3649, "b": 523.01495, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "while being much more efficient in training and infer-", "bbox": {"l": 70.037003, "t": 526.06439, "r": 286.36487, "b": 534.97095, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "ence to existing works.", "bbox": {"l": 70.037003, "t": 538.0193899999999, "r": 161.65305, "b": 546.9259500000001, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "\u2022", "bbox": {"l": 61.569, "t": 559.75639, "r": 71.115913, "b": 568.66295, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "We present", "bbox": {"l": 73.502647, "t": 559.75639, "r": 116.71199, "b": 568.66295, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "SynthTabNet", "bbox": {"l": 121.583, "t": 559.63684, "r": 177.68239, "b": 568.59322, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "a synthetically generated", "bbox": {"l": 182.55301, "t": 559.75639, "r": 286.36328, "b": 568.66295, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "dataset, with various appearance styles and complex-", "bbox": {"l": 70.03701, "t": 571.7114, "r": 286.36493, "b": 580.6179500000001, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "ity.", "bbox": {"l": 70.03701, "t": 583.6664000000001, "r": 82.400597, "b": 592.57295, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "\u2022", "bbox": {"l": 61.569008000000004, "t": 605.4034, "r": 72.332527, "b": 614.30995, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "An augmented dataset based on PubTabNet [37],", "bbox": {"l": 75.023399, "t": 605.4034, "r": 286.36508, "b": 614.30995, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "FinTabNet [36], and TableBank [17] with generated", "bbox": {"l": 70.03701, "t": 617.3584, "r": 286.36487, "b": 626.26495, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "ground-truth for reproducibility.", "bbox": {"l": 70.03701, "t": 629.31439, "r": 198.05641, "b": 638.22095, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "The paper is structured as follows. In Sec. 2, we give", "bbox": {"l": 62.067009000000006, "t": 650.59839, "r": 286.36496, "b": 659.50494, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "a brief overview of the current state-of-the-art. In Sec. 3,", "bbox": {"l": 50.112007, "t": 662.55339, "r": 286.36511, "b": 671.45995, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "we describe the datasets on which we train. In Sec. 4, we", "bbox": {"l": 50.112007, "t": 674.50839, "r": 286.36511, "b": 683.41496, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "introduce the TableFormer model-architecture and describe", "bbox": {"l": 50.112007, "t": 686.46339, "r": 286.36511, "b": 695.369957, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "$^{1}$https://github.com/IBM/SynthTabNet", "bbox": {"l": 60.97100100000001, "t": 705.596275, "r": 183.73055, "b": 712.721542, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "its results & performance in Sec. 5. As a conclusion, we de-", "bbox": {"l": 308.862, "t": 75.20836999999995, "r": 545.11511, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "scribe how this new model-architecture can be re-purposed", "bbox": {"l": 308.862, "t": 87.16339000000005, "r": 545.11505, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "for other tasks in the computer-vision community.", "bbox": {"l": 308.862, "t": 99.11841000000004, "r": 508.08417000000003, "b": 108.02495999999985, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "2.", "bbox": {"l": 308.862, "t": 121.73193000000003, "r": 315.5831, "b": 132.47968000000003, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "Previous work and State of the Art", "bbox": {"l": 324.54456, "t": 121.73193000000003, "r": 498.28021, "b": 132.47968000000003, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "Identifying the structure of a table has been an outstand-", "bbox": {"l": 320.81699, "t": 142.22136999999998, "r": 545.11493, "b": 151.12793, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "ing problem in the document-parsing community, that mo-", "bbox": {"l": 308.862, "t": 154.17638999999997, "r": 545.11505, "b": 163.08294999999998, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "tivates many organised public challenges [6, 4, 14].", "bbox": {"l": 308.862, "t": 166.13140999999996, "r": 522.55975, "b": 175.03796, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "The", "bbox": {"l": 529.62323, "t": 166.13140999999996, "r": 545.11505, "b": 175.03796, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "difficulty of the problem can be attributed to a number of", "bbox": {"l": 308.862, "t": 178.08642999999995, "r": 545.11517, "b": 186.99298, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "factors. First, there is a large variety in the shapes and sizes", "bbox": {"l": 308.862, "t": 190.04143999999997, "r": 545.11511, "b": 198.94799999999998, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "of tables.", "bbox": {"l": 308.862, "t": 201.99645999999996, "r": 346.97891, "b": 210.90301999999997, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "Such large variety requires a flexible method.", "bbox": {"l": 354.86929, "t": 201.99645999999996, "r": 545.11511, "b": 210.90301999999997, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "This is especially true for complex column- and row head-", "bbox": {"l": 308.862, "t": 213.95245, "r": 545.11505, "b": 222.85901, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "ers, which can be extremely intricate and demanding.", "bbox": {"l": 308.862, "t": 225.90747, "r": 530.9184, "b": 234.81403, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "A", "bbox": {"l": 537.92212, "t": 225.90747, "r": 545.11511, "b": 234.81403, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "second factor of complexity is the lack of data with regard", "bbox": {"l": 308.862, "t": 237.86248999999998, "r": 545.11517, "b": 246.76904000000002, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "to table-structure. Until the publication of PubTabNet [37],", "bbox": {"l": 308.862, "t": 249.8175, "r": 545.11511, "b": 258.72406, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "there were no large datasets (i.e.", "bbox": {"l": 308.862, "t": 261.77252, "r": 439.8402699999999, "b": 270.67908, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": ">", "bbox": {"l": 444.43999999999994, "t": 261.61310000000003, "r": 452.1889, "b": 270.45989999999995, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "100", "bbox": {"l": 455.89001, "t": 261.61310000000003, "r": 470.83392000000003, "b": 270.45989999999995, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "K tables) that pro-", "bbox": {"l": 470.83401, "t": 261.77252, "r": 545.11517, "b": 270.67908, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "vided structure information. This happens primarily due to", "bbox": {"l": 308.862, "t": 273.72748, "r": 545.11511, "b": 282.63406, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "the fact that tables are notoriously time-consuming to an-", "bbox": {"l": 308.862, "t": 285.6835, "r": 545.11511, "b": 294.59006, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "notate by hand. However, this has definitely changed in re-", "bbox": {"l": 308.862, "t": 297.63849, "r": 545.11511, "b": 306.54504, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "cent years with the deliverance of PubTabNet [37], FinTab-", "bbox": {"l": 308.862, "t": 309.59348, "r": 545.11517, "b": 318.50003000000004, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "Net [36], TableBank [17] etc.", "bbox": {"l": 308.862, "t": 321.54846, "r": 425.92255, "b": 330.45502, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Before the rising popularity of deep neural networks,", "bbox": {"l": 320.81699, "t": 333.56946, "r": 545.11499, "b": 342.47601, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "the community relied heavily on heuristic and/or statistical", "bbox": {"l": 308.862, "t": 345.52444, "r": 545.11499, "b": 354.43100000000004, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "methods to do table structure identification [3, 7, 11, 5, 13,", "bbox": {"l": 308.862, "t": 357.47943, "r": 545.11517, "b": 366.38599, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "28]. Although such methods work well on constrained ta-", "bbox": {"l": 308.862, "t": 369.43542, "r": 545.11511, "b": 378.34198, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "bles [12], a more data-driven approach can be applied due", "bbox": {"l": 308.862, "t": 381.39041, "r": 545.11505, "b": 390.29697, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "to the advent of convolutional neural networks (CNNs) and", "bbox": {"l": 308.862, "t": 393.3453999999999, "r": 545.11505, "b": 402.25195, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "the availability of large datasets. To the best-of-our knowl-", "bbox": {"l": 308.862, "t": 405.30038, "r": 545.11517, "b": 414.20694, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "edge, there are currently two different types of network ar-", "bbox": {"l": 308.862, "t": 417.25537, "r": 545.11523, "b": 426.16193, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "chitecture that are being pursued for state-of-the-art table-", "bbox": {"l": 308.862, "t": 429.21136000000007, "r": 545.11511, "b": 438.11792, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "structure identification.", "bbox": {"l": 308.862, "t": 441.16635, "r": 401.28503, "b": 450.0729099999999, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "Image-to-Text networks", "bbox": {"l": 320.81699, "t": 453.06778, "r": 423.26236, "b": 462.02417, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": ": In this type of network, one", "bbox": {"l": 423.26697, "t": 453.18735, "r": 545.10956, "b": 462.0939, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "predicts a sequence of tokens starting from an encoded", "bbox": {"l": 308.86197, "t": 465.14233, "r": 545.11511, "b": 474.04889, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "image.", "bbox": {"l": 308.86197, "t": 477.09732, "r": 335.7012, "b": 486.00388, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "Such sequences of tokens can be HTML table", "bbox": {"l": 345.85309, "t": 477.09732, "r": 545.11505, "b": 486.00388, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "tags [37, 17] or LaTeX symbols[10]. The choice of sym-", "bbox": {"l": 308.86197, "t": 489.05231, "r": 545.11493, "b": 497.95886, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "bols is ultimately not very important, since one can be trans-", "bbox": {"l": 308.86197, "t": 501.00729, "r": 545.11499, "b": 509.91385, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "formed into the other. There are however subtle variations", "bbox": {"l": 308.86197, "t": 512.9632899999999, "r": 545.11505, "b": 521.8698400000001, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "in the Image-to-Text networks. The easiest network archi-", "bbox": {"l": 308.86197, "t": 524.91827, "r": 545.11505, "b": 533.82483, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "tectures are \u201cimage-encoder", "bbox": {"l": 308.86197, "t": 536.87328, "r": 420.94119, "b": 545.77983, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "\u2192", "bbox": {"l": 423.59497, "t": 536.1559599999999, "r": 433.5575600000001, "b": 545.56065, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "text-decoder\u201d (IETD), sim-", "bbox": {"l": 436.21198, "t": 536.87328, "r": 545.11316, "b": 545.77983, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "ilar to network architectures that try to provide captions to", "bbox": {"l": 308.86197, "t": 548.82828, "r": 545.11511, "b": 557.73483, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "images [32]. In these IETD networks, one expects as output", "bbox": {"l": 308.86197, "t": 560.78328, "r": 545.11493, "b": 569.68983, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "the LaTeX/HTML string of the entire table, i.e. the sym-", "bbox": {"l": 308.86197, "t": 572.73828, "r": 545.11499, "b": 581.6448399999999, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "bols necessary for creating the table with the content of the", "bbox": {"l": 308.86197, "t": 584.69427, "r": 545.11505, "b": 593.60083, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "table. Another approach is the \u201cimage-encoder", "bbox": {"l": 308.86197, "t": 596.6492800000001, "r": 497.07541, "b": 605.55583, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "\u2192", "bbox": {"l": 499.80496, "t": 595.93196, "r": 509.76755, "b": 605.33665, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "dual de-", "bbox": {"l": 512.50098, "t": 596.6492800000001, "r": 545.10852, "b": 605.55583, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "coder\u201d (IEDD) networks. In these type of networks, one has", "bbox": {"l": 308.86197, "t": 608.60428, "r": 545.11511, "b": 617.5108299999999, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "two consecutive decoders with different purposes. The first", "bbox": {"l": 308.86197, "t": 620.55928, "r": 545.11505, "b": 629.46584, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "decoder is the", "bbox": {"l": 308.86197, "t": 632.51428, "r": 364.78201, "b": 641.42084, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "tag-decoder", "bbox": {"l": 367.57397, "t": 632.60394, "r": 415.61362, "b": 641.1917, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": ", i.e. it only produces the HTM-", "bbox": {"l": 415.61298, "t": 632.51428, "r": 545.11688, "b": 641.42084, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "L/LaTeX tags which construct an empty table. The second", "bbox": {"l": 308.86197, "t": 644.46928, "r": 545.11511, "b": 653.37584, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "content-decoder", "bbox": {"l": 308.86197, "t": 656.51494, "r": 373.59894, "b": 665.1027, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "uses the encoding of the image in combi-", "bbox": {"l": 376.90698, "t": 656.4252799999999, "r": 545.11548, "b": 665.33184, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "nation with the output encoding of each cell-tag (from the", "bbox": {"l": 308.862, "t": 668.38028, "r": 545.11517, "b": 677.28684, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "tag-decoder", "bbox": {"l": 308.862, "t": 680.42494, "r": 356.90164, "b": 689.0127, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": ") to generate the textual content of each table", "bbox": {"l": 357.13101, "t": 680.33528, "r": 545.1153, "b": 689.24184, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "cell. The network architecture of IEDD is certainly more", "bbox": {"l": 308.862, "t": 692.290283, "r": 545.11511, "b": 701.196846, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "elaborate, but it has the advantage that one can pre-train the", "bbox": {"l": 308.862, "t": 704.245285, "r": 545.11517, "b": 713.151848, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "2", "bbox": {"l": 295.121, "t": 734.133282, "r": 300.10229, "b": 743.039845, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 12, "label": "text", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 286.36505, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9656890034675598, "cells": [{"id": 0, "text": "considered as a solved problem, given enough ground-truth", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 286.36505, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "data to train on.", "bbox": {"l": 50.112, "t": 87.16339000000005, "r": 112.64721999999999, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "text", "bbox": {"l": 50.112, "t": 99.57141000000001, "r": 286.36514, "b": 228.03008999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9838606119155884, "cells": [{"id": 2, "text": "The second problem is called table-structure decompo-", "bbox": {"l": 62.067001, "t": 99.57141000000001, "r": 286.36496, "b": 108.47797000000003, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "sition.", "bbox": {"l": 50.112, "t": 111.52643, "r": 74.749512, "b": 120.43297999999993, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "The latter is a long standing problem in the com-", "bbox": {"l": 81.334793, "t": 111.52643, "r": 286.36514, "b": 120.43297999999993, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "munity of document understanding [6, 4, 14]. Contrary to", "bbox": {"l": 50.112, "t": 123.48145, "r": 286.36511, "b": 132.38800000000003, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "the table-location problem, there are no commonly used ap-", "bbox": {"l": 50.112, "t": 135.43646, "r": 286.36511, "b": 144.34302000000002, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "proaches that can easily be re-purposed to solve this prob-", "bbox": {"l": 50.112, "t": 147.39246000000003, "r": 286.36505, "b": 156.29900999999995, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "lem. Lately, a set of new model-architectures has been pro-", "bbox": {"l": 50.112, "t": 159.34747000000004, "r": 286.36511, "b": 168.25402999999994, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "posed by the community to address table-structure decom-", "bbox": {"l": 50.112, "t": 171.30249000000003, "r": 286.36508, "b": 180.20905000000005, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "position [37, 36, 18, 20]. All these models have some weak-", "bbox": {"l": 50.112, "t": 183.25751000000002, "r": 286.36511, "b": 192.16405999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "nesses (see Sec. 2). The common denominator here is the", "bbox": {"l": 50.112, "t": 195.21252000000004, "r": 286.36508, "b": 204.11908000000005, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "reliance on textual features and/or the inability to provide", "bbox": {"l": 50.112, "t": 207.16754000000003, "r": 286.36514, "b": 216.07410000000004, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "the bounding box of each table-cell in the original image.", "bbox": {"l": 50.112, "t": 219.12354000000005, "r": 278.66397, "b": 228.03008999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 50.112, "t": 231.53156, "r": 286.36511, "b": 371.94507, "coord_origin": "TOPLEFT"}, "confidence": 0.9855920076370239, "cells": [{"id": 14, "text": "In this paper, we want to address these weaknesses and", "bbox": {"l": 62.067001, "t": 231.53156, "r": 286.36493, "b": 240.43811000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "present a robust table-structure decomposition algorithm.", "bbox": {"l": 50.112, "t": 243.48657000000003, "r": 286.36511, "b": 252.39313000000004, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "The design criteria for our model are the following. First,", "bbox": {"l": 50.112, "t": 255.44159000000002, "r": 286.36511, "b": 264.34813999999994, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "we want our algorithm to be language agnostic. In this way,", "bbox": {"l": 50.112, "t": 267.39661, "r": 286.36502, "b": 276.30316000000005, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "we can obtain the structure of any table, irregardless of the", "bbox": {"l": 50.112, "t": 279.35155999999995, "r": 286.36508, "b": 288.25815, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "language.", "bbox": {"l": 50.112, "t": 291.30759, "r": 88.567635, "b": 300.21414, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Second, we want our algorithm to leverage as", "bbox": {"l": 95.501602, "t": 291.30759, "r": 286.36505, "b": 300.21414, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "much data as possible from the original PDF document. For", "bbox": {"l": 50.112, "t": 303.26257, "r": 286.36508, "b": 312.16913, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "programmatic PDF documents, the text-cells can often be", "bbox": {"l": 50.112, "t": 315.21756, "r": 286.36511, "b": 324.12411, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "extracted much faster and with higher accuracy compared", "bbox": {"l": 50.112, "t": 327.17255, "r": 286.36505, "b": 336.0791, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "to OCR methods. Last but not least, we want to have a di-", "bbox": {"l": 50.112, "t": 339.12753, "r": 286.36511, "b": 348.03409, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "rect link between the table-cell and its bounding box in the", "bbox": {"l": 50.112, "t": 351.08353, "r": 286.36508, "b": 359.99008, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "image.", "bbox": {"l": 50.112, "t": 363.03851, "r": 76.951241, "b": 371.94507, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "text", "bbox": {"l": 50.112, "t": 375.4465, "r": 286.36658, "b": 432.173, "coord_origin": "TOPLEFT"}, "confidence": 0.9820111393928528, "cells": [{"id": 27, "text": "To meet the design criteria listed above, we developed a", "bbox": {"l": 62.067001, "t": 375.4465, "r": 286.36499, "b": 384.35306, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "new model called", "bbox": {"l": 50.112, "t": 387.40149, "r": 120.98594, "b": 396.30804, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "TableFormer", "bbox": {"l": 123.901, "t": 387.28192, "r": 179.7314, "b": 396.23830999999996, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "and a synthetically gener-", "bbox": {"l": 182.646, "t": 387.40149, "r": 286.36658, "b": 396.30804, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "ated table structure dataset called", "bbox": {"l": 50.112, "t": 399.35648, "r": 181.75778, "b": 408.26302999999996, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "SynthTabNet", "bbox": {"l": 184.104, "t": 399.23690999999997, "r": 240.2034, "b": 408.1933, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "$^{1}$. In partic-", "bbox": {"l": 240.20401, "t": 399.35648, "r": 286.36069, "b": 408.26302999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "ular, our contributions in this work can be summarised as", "bbox": {"l": 50.112015, "t": 411.31146, "r": 286.36511, "b": 420.21802, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "follows:", "bbox": {"l": 50.112015, "t": 423.26645, "r": 82.520355, "b": 432.173, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "list_item", "bbox": {"l": 61.569016, "t": 444.43188, "r": 286.3649, "b": 489.32297, "coord_origin": "TOPLEFT"}, "confidence": 0.9822162389755249, "cells": [{"id": 36, "text": "\u2022", "bbox": {"l": 61.569016, "t": 444.55145, "r": 70.741714, "b": 453.45801, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "We propose", "bbox": {"l": 73.034889, "t": 444.55145, "r": 117.10054, "b": 453.45801, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "TableFormer", "bbox": {"l": 119.59001, "t": 444.43188, "r": 175.42041, "b": 453.38828, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": ", a transformer based model", "bbox": {"l": 175.42102, "t": 444.55145, "r": 286.36453, "b": 453.45801, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "that predicts tables structure and bounding boxes for", "bbox": {"l": 70.037018, "t": 456.50644000000005, "r": 286.3649, "b": 465.41299, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "the table content simultaneously in an end-to-end ap-", "bbox": {"l": 70.037018, "t": 468.46143, "r": 286.3649, "b": 477.36798, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "proach.", "bbox": {"l": 70.037018, "t": 480.41641, "r": 99.635902, "b": 489.32297, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "list_item", "bbox": {"l": 61.569016, "t": 502.03384, "r": 286.3649, "b": 546.9259500000001, "coord_origin": "TOPLEFT"}, "confidence": 0.982271671295166, "cells": [{"id": 43, "text": "\u2022", "bbox": {"l": 61.569016, "t": 502.15341, "r": 71.619438, "b": 511.05997, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "Across all benchmark datasets", "bbox": {"l": 74.132042, "t": 502.15341, "r": 196.10396, "b": 511.05997, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "TableFormer", "bbox": {"l": 200.31001, "t": 502.03384, "r": 256.14041, "b": 510.99023, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "signif-", "bbox": {"l": 260.35001, "t": 502.15341, "r": 286.36237, "b": 511.05997, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "icantly outperforms existing state-of-the-art metrics,", "bbox": {"l": 70.037003, "t": 514.1084000000001, "r": 286.3649, "b": 523.01495, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "while being much more efficient in training and infer-", "bbox": {"l": 70.037003, "t": 526.06439, "r": 286.36487, "b": 534.97095, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "ence to existing works.", "bbox": {"l": 70.037003, "t": 538.0193899999999, "r": 161.65305, "b": 546.9259500000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "list_item", "bbox": {"l": 61.569, "t": 559.63684, "r": 286.36493, "b": 592.57295, "coord_origin": "TOPLEFT"}, "confidence": 0.98029625415802, "cells": [{"id": 50, "text": "\u2022", "bbox": {"l": 61.569, "t": 559.75639, "r": 71.115913, "b": 568.66295, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "We present", "bbox": {"l": 73.502647, "t": 559.75639, "r": 116.71199, "b": 568.66295, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "SynthTabNet", "bbox": {"l": 121.583, "t": 559.63684, "r": 177.68239, "b": 568.59322, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "a synthetically generated", "bbox": {"l": 182.55301, "t": 559.75639, "r": 286.36328, "b": 568.66295, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "dataset, with various appearance styles and complex-", "bbox": {"l": 70.03701, "t": 571.7114, "r": 286.36493, "b": 580.6179500000001, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "ity.", "bbox": {"l": 70.03701, "t": 583.6664000000001, "r": 82.400597, "b": 592.57295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "list_item", "bbox": {"l": 61.569008000000004, "t": 605.4034, "r": 286.36508, "b": 638.22095, "coord_origin": "TOPLEFT"}, "confidence": 0.9806395173072815, "cells": [{"id": 56, "text": "\u2022", "bbox": {"l": 61.569008000000004, "t": 605.4034, "r": 72.332527, "b": 614.30995, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "An augmented dataset based on PubTabNet [37],", "bbox": {"l": 75.023399, "t": 605.4034, "r": 286.36508, "b": 614.30995, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "FinTabNet [36], and TableBank [17] with generated", "bbox": {"l": 70.03701, "t": 617.3584, "r": 286.36487, "b": 626.26495, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "ground-truth for reproducibility.", "bbox": {"l": 70.03701, "t": 629.31439, "r": 198.05641, "b": 638.22095, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 50.112007, "t": 650.59839, "r": 286.36511, "b": 695.369957, "coord_origin": "TOPLEFT"}, "confidence": 0.974253237247467, "cells": [{"id": 60, "text": "The paper is structured as follows. In Sec. 2, we give", "bbox": {"l": 62.067009000000006, "t": 650.59839, "r": 286.36496, "b": 659.50494, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "a brief overview of the current state-of-the-art. In Sec. 3,", "bbox": {"l": 50.112007, "t": 662.55339, "r": 286.36511, "b": 671.45995, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "we describe the datasets on which we train. In Sec. 4, we", "bbox": {"l": 50.112007, "t": 674.50839, "r": 286.36511, "b": 683.41496, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "introduce the TableFormer model-architecture and describe", "bbox": {"l": 50.112007, "t": 686.46339, "r": 286.36511, "b": 695.369957, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "footnote", "bbox": {"l": 60.97100100000001, "t": 705.596275, "r": 183.73055, "b": 712.721542, "coord_origin": "TOPLEFT"}, "confidence": 0.8953676223754883, "cells": [{"id": 64, "text": "$^{1}$https://github.com/IBM/SynthTabNet", "bbox": {"l": 60.97100100000001, "t": 705.596275, "r": 183.73055, "b": 712.721542, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "text", "bbox": {"l": 308.862, "t": 75.20836999999995, "r": 545.11511, "b": 108.02495999999985, "coord_origin": "TOPLEFT"}, "confidence": 0.977432370185852, "cells": [{"id": 65, "text": "its results & performance in Sec. 5. As a conclusion, we de-", "bbox": {"l": 308.862, "t": 75.20836999999995, "r": 545.11511, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "scribe how this new model-architecture can be re-purposed", "bbox": {"l": 308.862, "t": 87.16339000000005, "r": 545.11505, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "for other tasks in the computer-vision community.", "bbox": {"l": 308.862, "t": 99.11841000000004, "r": 508.08417000000003, "b": 108.02495999999985, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "section_header", "bbox": {"l": 308.862, "t": 121.73193000000003, "r": 498.28021, "b": 132.47968000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9428722262382507, "cells": [{"id": 68, "text": "2.", "bbox": {"l": 308.862, "t": 121.73193000000003, "r": 315.5831, "b": 132.47968000000003, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "Previous work and State of the Art", "bbox": {"l": 324.54456, "t": 121.73193000000003, "r": 498.28021, "b": 132.47968000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 308.862, "t": 142.22136999999998, "r": 545.11517, "b": 330.45502, "coord_origin": "TOPLEFT"}, "confidence": 0.9871949553489685, "cells": [{"id": 70, "text": "Identifying the structure of a table has been an outstand-", "bbox": {"l": 320.81699, "t": 142.22136999999998, "r": 545.11493, "b": 151.12793, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "ing problem in the document-parsing community, that mo-", "bbox": {"l": 308.862, "t": 154.17638999999997, "r": 545.11505, "b": 163.08294999999998, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "tivates many organised public challenges [6, 4, 14].", "bbox": {"l": 308.862, "t": 166.13140999999996, "r": 522.55975, "b": 175.03796, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "The", "bbox": {"l": 529.62323, "t": 166.13140999999996, "r": 545.11505, "b": 175.03796, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "difficulty of the problem can be attributed to a number of", "bbox": {"l": 308.862, "t": 178.08642999999995, "r": 545.11517, "b": 186.99298, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "factors. First, there is a large variety in the shapes and sizes", "bbox": {"l": 308.862, "t": 190.04143999999997, "r": 545.11511, "b": 198.94799999999998, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "of tables.", "bbox": {"l": 308.862, "t": 201.99645999999996, "r": 346.97891, "b": 210.90301999999997, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "Such large variety requires a flexible method.", "bbox": {"l": 354.86929, "t": 201.99645999999996, "r": 545.11511, "b": 210.90301999999997, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "This is especially true for complex column- and row head-", "bbox": {"l": 308.862, "t": 213.95245, "r": 545.11505, "b": 222.85901, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "ers, which can be extremely intricate and demanding.", "bbox": {"l": 308.862, "t": 225.90747, "r": 530.9184, "b": 234.81403, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "A", "bbox": {"l": 537.92212, "t": 225.90747, "r": 545.11511, "b": 234.81403, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "second factor of complexity is the lack of data with regard", "bbox": {"l": 308.862, "t": 237.86248999999998, "r": 545.11517, "b": 246.76904000000002, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "to table-structure. Until the publication of PubTabNet [37],", "bbox": {"l": 308.862, "t": 249.8175, "r": 545.11511, "b": 258.72406, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "there were no large datasets (i.e.", "bbox": {"l": 308.862, "t": 261.77252, "r": 439.8402699999999, "b": 270.67908, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": ">", "bbox": {"l": 444.43999999999994, "t": 261.61310000000003, "r": 452.1889, "b": 270.45989999999995, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "100", "bbox": {"l": 455.89001, "t": 261.61310000000003, "r": 470.83392000000003, "b": 270.45989999999995, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "K tables) that pro-", "bbox": {"l": 470.83401, "t": 261.77252, "r": 545.11517, "b": 270.67908, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "vided structure information. This happens primarily due to", "bbox": {"l": 308.862, "t": 273.72748, "r": 545.11511, "b": 282.63406, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "the fact that tables are notoriously time-consuming to an-", "bbox": {"l": 308.862, "t": 285.6835, "r": 545.11511, "b": 294.59006, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "notate by hand. However, this has definitely changed in re-", "bbox": {"l": 308.862, "t": 297.63849, "r": 545.11511, "b": 306.54504, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "cent years with the deliverance of PubTabNet [37], FinTab-", "bbox": {"l": 308.862, "t": 309.59348, "r": 545.11517, "b": 318.50003000000004, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "Net [36], TableBank [17] etc.", "bbox": {"l": 308.862, "t": 321.54846, "r": 425.92255, "b": 330.45502, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 308.862, "t": 333.56946, "r": 545.11523, "b": 450.0729099999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9869041442871094, "cells": [{"id": 92, "text": "Before the rising popularity of deep neural networks,", "bbox": {"l": 320.81699, "t": 333.56946, "r": 545.11499, "b": 342.47601, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "the community relied heavily on heuristic and/or statistical", "bbox": {"l": 308.862, "t": 345.52444, "r": 545.11499, "b": 354.43100000000004, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "methods to do table structure identification [3, 7, 11, 5, 13,", "bbox": {"l": 308.862, "t": 357.47943, "r": 545.11517, "b": 366.38599, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "28]. Although such methods work well on constrained ta-", "bbox": {"l": 308.862, "t": 369.43542, "r": 545.11511, "b": 378.34198, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "bles [12], a more data-driven approach can be applied due", "bbox": {"l": 308.862, "t": 381.39041, "r": 545.11505, "b": 390.29697, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "to the advent of convolutional neural networks (CNNs) and", "bbox": {"l": 308.862, "t": 393.3453999999999, "r": 545.11505, "b": 402.25195, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "the availability of large datasets. To the best-of-our knowl-", "bbox": {"l": 308.862, "t": 405.30038, "r": 545.11517, "b": 414.20694, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "edge, there are currently two different types of network ar-", "bbox": {"l": 308.862, "t": 417.25537, "r": 545.11523, "b": 426.16193, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "chitecture that are being pursued for state-of-the-art table-", "bbox": {"l": 308.862, "t": 429.21136000000007, "r": 545.11511, "b": 438.11792, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "structure identification.", "bbox": {"l": 308.862, "t": 441.16635, "r": 401.28503, "b": 450.0729099999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 308.86197, "t": 453.06778, "r": 545.11688, "b": 713.151848, "coord_origin": "TOPLEFT"}, "confidence": 0.9843218326568604, "cells": [{"id": 102, "text": "Image-to-Text networks", "bbox": {"l": 320.81699, "t": 453.06778, "r": 423.26236, "b": 462.02417, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": ": In this type of network, one", "bbox": {"l": 423.26697, "t": 453.18735, "r": 545.10956, "b": 462.0939, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "predicts a sequence of tokens starting from an encoded", "bbox": {"l": 308.86197, "t": 465.14233, "r": 545.11511, "b": 474.04889, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "image.", "bbox": {"l": 308.86197, "t": 477.09732, "r": 335.7012, "b": 486.00388, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "Such sequences of tokens can be HTML table", "bbox": {"l": 345.85309, "t": 477.09732, "r": 545.11505, "b": 486.00388, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "tags [37, 17] or LaTeX symbols[10]. The choice of sym-", "bbox": {"l": 308.86197, "t": 489.05231, "r": 545.11493, "b": 497.95886, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "bols is ultimately not very important, since one can be trans-", "bbox": {"l": 308.86197, "t": 501.00729, "r": 545.11499, "b": 509.91385, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "formed into the other. There are however subtle variations", "bbox": {"l": 308.86197, "t": 512.9632899999999, "r": 545.11505, "b": 521.8698400000001, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "in the Image-to-Text networks. The easiest network archi-", "bbox": {"l": 308.86197, "t": 524.91827, "r": 545.11505, "b": 533.82483, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "tectures are \u201cimage-encoder", "bbox": {"l": 308.86197, "t": 536.87328, "r": 420.94119, "b": 545.77983, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "\u2192", "bbox": {"l": 423.59497, "t": 536.1559599999999, "r": 433.5575600000001, "b": 545.56065, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "text-decoder\u201d (IETD), sim-", "bbox": {"l": 436.21198, "t": 536.87328, "r": 545.11316, "b": 545.77983, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "ilar to network architectures that try to provide captions to", "bbox": {"l": 308.86197, "t": 548.82828, "r": 545.11511, "b": 557.73483, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "images [32]. In these IETD networks, one expects as output", "bbox": {"l": 308.86197, "t": 560.78328, "r": 545.11493, "b": 569.68983, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "the LaTeX/HTML string of the entire table, i.e. the sym-", "bbox": {"l": 308.86197, "t": 572.73828, "r": 545.11499, "b": 581.6448399999999, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "bols necessary for creating the table with the content of the", "bbox": {"l": 308.86197, "t": 584.69427, "r": 545.11505, "b": 593.60083, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "table. Another approach is the \u201cimage-encoder", "bbox": {"l": 308.86197, "t": 596.6492800000001, "r": 497.07541, "b": 605.55583, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "\u2192", "bbox": {"l": 499.80496, "t": 595.93196, "r": 509.76755, "b": 605.33665, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "dual de-", "bbox": {"l": 512.50098, "t": 596.6492800000001, "r": 545.10852, "b": 605.55583, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "coder\u201d (IEDD) networks. In these type of networks, one has", "bbox": {"l": 308.86197, "t": 608.60428, "r": 545.11511, "b": 617.5108299999999, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "two consecutive decoders with different purposes. The first", "bbox": {"l": 308.86197, "t": 620.55928, "r": 545.11505, "b": 629.46584, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "decoder is the", "bbox": {"l": 308.86197, "t": 632.51428, "r": 364.78201, "b": 641.42084, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "tag-decoder", "bbox": {"l": 367.57397, "t": 632.60394, "r": 415.61362, "b": 641.1917, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": ", i.e. it only produces the HTM-", "bbox": {"l": 415.61298, "t": 632.51428, "r": 545.11688, "b": 641.42084, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "L/LaTeX tags which construct an empty table. The second", "bbox": {"l": 308.86197, "t": 644.46928, "r": 545.11511, "b": 653.37584, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "content-decoder", "bbox": {"l": 308.86197, "t": 656.51494, "r": 373.59894, "b": 665.1027, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "uses the encoding of the image in combi-", "bbox": {"l": 376.90698, "t": 656.4252799999999, "r": 545.11548, "b": 665.33184, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "nation with the output encoding of each cell-tag (from the", "bbox": {"l": 308.862, "t": 668.38028, "r": 545.11517, "b": 677.28684, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "tag-decoder", "bbox": {"l": 308.862, "t": 680.42494, "r": 356.90164, "b": 689.0127, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": ") to generate the textual content of each table", "bbox": {"l": 357.13101, "t": 680.33528, "r": 545.1153, "b": 689.24184, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "cell. The network architecture of IEDD is certainly more", "bbox": {"l": 308.862, "t": 692.290283, "r": 545.11511, "b": 701.196846, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "elaborate, but it has the advantage that one can pre-train the", "bbox": {"l": 308.862, "t": 704.245285, "r": 545.11517, "b": 713.151848, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "page_footer", "bbox": {"l": 295.121, "t": 734.133282, "r": 300.10229, "b": 743.039845, "coord_origin": "TOPLEFT"}, "confidence": 0.877809464931488, "cells": [{"id": 134, "text": "2", "bbox": {"l": 295.121, "t": 734.133282, "r": 300.10229, "b": 743.039845, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "text", "id": 12, "page_no": 1, "cluster": {"id": 12, "label": "text", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 286.36505, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9656890034675598, "cells": [{"id": 0, "text": "considered as a solved problem, given enough ground-truth", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 286.36505, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "data to train on.", "bbox": {"l": 50.112, "t": 87.16339000000005, "r": 112.64721999999999, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "considered as a solved problem, given enough ground-truth data to train on."}, {"label": "text", "id": 4, "page_no": 1, "cluster": {"id": 4, "label": "text", "bbox": {"l": 50.112, "t": 99.57141000000001, "r": 286.36514, "b": 228.03008999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9838606119155884, "cells": [{"id": 2, "text": "The second problem is called table-structure decompo-", "bbox": {"l": 62.067001, "t": 99.57141000000001, "r": 286.36496, "b": 108.47797000000003, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "sition.", "bbox": {"l": 50.112, "t": 111.52643, "r": 74.749512, "b": 120.43297999999993, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "The latter is a long standing problem in the com-", "bbox": {"l": 81.334793, "t": 111.52643, "r": 286.36514, "b": 120.43297999999993, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "munity of document understanding [6, 4, 14]. Contrary to", "bbox": {"l": 50.112, "t": 123.48145, "r": 286.36511, "b": 132.38800000000003, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "the table-location problem, there are no commonly used ap-", "bbox": {"l": 50.112, "t": 135.43646, "r": 286.36511, "b": 144.34302000000002, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "proaches that can easily be re-purposed to solve this prob-", "bbox": {"l": 50.112, "t": 147.39246000000003, "r": 286.36505, "b": 156.29900999999995, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "lem. Lately, a set of new model-architectures has been pro-", "bbox": {"l": 50.112, "t": 159.34747000000004, "r": 286.36511, "b": 168.25402999999994, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "posed by the community to address table-structure decom-", "bbox": {"l": 50.112, "t": 171.30249000000003, "r": 286.36508, "b": 180.20905000000005, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "position [37, 36, 18, 20]. All these models have some weak-", "bbox": {"l": 50.112, "t": 183.25751000000002, "r": 286.36511, "b": 192.16405999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "nesses (see Sec. 2). The common denominator here is the", "bbox": {"l": 50.112, "t": 195.21252000000004, "r": 286.36508, "b": 204.11908000000005, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "reliance on textual features and/or the inability to provide", "bbox": {"l": 50.112, "t": 207.16754000000003, "r": 286.36514, "b": 216.07410000000004, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "the bounding box of each table-cell in the original image.", "bbox": {"l": 50.112, "t": 219.12354000000005, "r": 278.66397, "b": 228.03008999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The second problem is called table-structure decomposition. The latter is a long standing problem in the community of document understanding [6, 4, 14]. Contrary to the table-location problem, there are no commonly used approaches that can easily be re-purposed to solve this problem. Lately, a set of new model-architectures has been proposed by the community to address table-structure decomposition [37, 36, 18, 20]. All these models have some weaknesses (see Sec. 2). The common denominator here is the reliance on textual features and/or the inability to provide the bounding box of each table-cell in the original image."}, {"label": "text", "id": 2, "page_no": 1, "cluster": {"id": 2, "label": "text", "bbox": {"l": 50.112, "t": 231.53156, "r": 286.36511, "b": 371.94507, "coord_origin": "TOPLEFT"}, "confidence": 0.9855920076370239, "cells": [{"id": 14, "text": "In this paper, we want to address these weaknesses and", "bbox": {"l": 62.067001, "t": 231.53156, "r": 286.36493, "b": 240.43811000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "present a robust table-structure decomposition algorithm.", "bbox": {"l": 50.112, "t": 243.48657000000003, "r": 286.36511, "b": 252.39313000000004, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "The design criteria for our model are the following. First,", "bbox": {"l": 50.112, "t": 255.44159000000002, "r": 286.36511, "b": 264.34813999999994, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "we want our algorithm to be language agnostic. In this way,", "bbox": {"l": 50.112, "t": 267.39661, "r": 286.36502, "b": 276.30316000000005, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "we can obtain the structure of any table, irregardless of the", "bbox": {"l": 50.112, "t": 279.35155999999995, "r": 286.36508, "b": 288.25815, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "language.", "bbox": {"l": 50.112, "t": 291.30759, "r": 88.567635, "b": 300.21414, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Second, we want our algorithm to leverage as", "bbox": {"l": 95.501602, "t": 291.30759, "r": 286.36505, "b": 300.21414, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "much data as possible from the original PDF document. For", "bbox": {"l": 50.112, "t": 303.26257, "r": 286.36508, "b": 312.16913, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "programmatic PDF documents, the text-cells can often be", "bbox": {"l": 50.112, "t": 315.21756, "r": 286.36511, "b": 324.12411, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "extracted much faster and with higher accuracy compared", "bbox": {"l": 50.112, "t": 327.17255, "r": 286.36505, "b": 336.0791, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "to OCR methods. Last but not least, we want to have a di-", "bbox": {"l": 50.112, "t": 339.12753, "r": 286.36511, "b": 348.03409, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "rect link between the table-cell and its bounding box in the", "bbox": {"l": 50.112, "t": 351.08353, "r": 286.36508, "b": 359.99008, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "image.", "bbox": {"l": 50.112, "t": 363.03851, "r": 76.951241, "b": 371.94507, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In this paper, we want to address these weaknesses and present a robust table-structure decomposition algorithm. The design criteria for our model are the following. First, we want our algorithm to be language agnostic. In this way, we can obtain the structure of any table, irregardless of the language. Second, we want our algorithm to leverage as much data as possible from the original PDF document. For programmatic PDF documents, the text-cells can often be extracted much faster and with higher accuracy compared to OCR methods. Last but not least, we want to have a direct link between the table-cell and its bounding box in the image."}, {"label": "text", "id": 7, "page_no": 1, "cluster": {"id": 7, "label": "text", "bbox": {"l": 50.112, "t": 375.4465, "r": 286.36658, "b": 432.173, "coord_origin": "TOPLEFT"}, "confidence": 0.9820111393928528, "cells": [{"id": 27, "text": "To meet the design criteria listed above, we developed a", "bbox": {"l": 62.067001, "t": 375.4465, "r": 286.36499, "b": 384.35306, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "new model called", "bbox": {"l": 50.112, "t": 387.40149, "r": 120.98594, "b": 396.30804, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "TableFormer", "bbox": {"l": 123.901, "t": 387.28192, "r": 179.7314, "b": 396.23830999999996, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "and a synthetically gener-", "bbox": {"l": 182.646, "t": 387.40149, "r": 286.36658, "b": 396.30804, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "ated table structure dataset called", "bbox": {"l": 50.112, "t": 399.35648, "r": 181.75778, "b": 408.26302999999996, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "SynthTabNet", "bbox": {"l": 184.104, "t": 399.23690999999997, "r": 240.2034, "b": 408.1933, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "$^{1}$. In partic-", "bbox": {"l": 240.20401, "t": 399.35648, "r": 286.36069, "b": 408.26302999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "ular, our contributions in this work can be summarised as", "bbox": {"l": 50.112015, "t": 411.31146, "r": 286.36511, "b": 420.21802, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "follows:", "bbox": {"l": 50.112015, "t": 423.26645, "r": 82.520355, "b": 432.173, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "To meet the design criteria listed above, we developed a new model called TableFormer and a synthetically generated table structure dataset called SynthTabNet $^{1}$. In particular, our contributions in this work can be summarised as follows:"}, {"label": "list_item", "id": 6, "page_no": 1, "cluster": {"id": 6, "label": "list_item", "bbox": {"l": 61.569016, "t": 444.43188, "r": 286.3649, "b": 489.32297, "coord_origin": "TOPLEFT"}, "confidence": 0.9822162389755249, "cells": [{"id": 36, "text": "\u2022", "bbox": {"l": 61.569016, "t": 444.55145, "r": 70.741714, "b": 453.45801, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "We propose", "bbox": {"l": 73.034889, "t": 444.55145, "r": 117.10054, "b": 453.45801, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "TableFormer", "bbox": {"l": 119.59001, "t": 444.43188, "r": 175.42041, "b": 453.38828, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": ", a transformer based model", "bbox": {"l": 175.42102, "t": 444.55145, "r": 286.36453, "b": 453.45801, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "that predicts tables structure and bounding boxes for", "bbox": {"l": 70.037018, "t": 456.50644000000005, "r": 286.3649, "b": 465.41299, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "the table content simultaneously in an end-to-end ap-", "bbox": {"l": 70.037018, "t": 468.46143, "r": 286.3649, "b": 477.36798, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "proach.", "bbox": {"l": 70.037018, "t": 480.41641, "r": 99.635902, "b": 489.32297, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u2022 We propose TableFormer , a transformer based model that predicts tables structure and bounding boxes for the table content simultaneously in an end-to-end approach."}, {"label": "list_item", "id": 5, "page_no": 1, "cluster": {"id": 5, "label": "list_item", "bbox": {"l": 61.569016, "t": 502.03384, "r": 286.3649, "b": 546.9259500000001, "coord_origin": "TOPLEFT"}, "confidence": 0.982271671295166, "cells": [{"id": 43, "text": "\u2022", "bbox": {"l": 61.569016, "t": 502.15341, "r": 71.619438, "b": 511.05997, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "Across all benchmark datasets", "bbox": {"l": 74.132042, "t": 502.15341, "r": 196.10396, "b": 511.05997, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "TableFormer", "bbox": {"l": 200.31001, "t": 502.03384, "r": 256.14041, "b": 510.99023, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "signif-", "bbox": {"l": 260.35001, "t": 502.15341, "r": 286.36237, "b": 511.05997, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "icantly outperforms existing state-of-the-art metrics,", "bbox": {"l": 70.037003, "t": 514.1084000000001, "r": 286.3649, "b": 523.01495, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "while being much more efficient in training and infer-", "bbox": {"l": 70.037003, "t": 526.06439, "r": 286.36487, "b": 534.97095, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "ence to existing works.", "bbox": {"l": 70.037003, "t": 538.0193899999999, "r": 161.65305, "b": 546.9259500000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u2022 Across all benchmark datasets TableFormer significantly outperforms existing state-of-the-art metrics, while being much more efficient in training and inference to existing works."}, {"label": "list_item", "id": 9, "page_no": 1, "cluster": {"id": 9, "label": "list_item", "bbox": {"l": 61.569, "t": 559.63684, "r": 286.36493, "b": 592.57295, "coord_origin": "TOPLEFT"}, "confidence": 0.98029625415802, "cells": [{"id": 50, "text": "\u2022", "bbox": {"l": 61.569, "t": 559.75639, "r": 71.115913, "b": 568.66295, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "We present", "bbox": {"l": 73.502647, "t": 559.75639, "r": 116.71199, "b": 568.66295, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "SynthTabNet", "bbox": {"l": 121.583, "t": 559.63684, "r": 177.68239, "b": 568.59322, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "a synthetically generated", "bbox": {"l": 182.55301, "t": 559.75639, "r": 286.36328, "b": 568.66295, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "dataset, with various appearance styles and complex-", "bbox": {"l": 70.03701, "t": 571.7114, "r": 286.36493, "b": 580.6179500000001, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "ity.", "bbox": {"l": 70.03701, "t": 583.6664000000001, "r": 82.400597, "b": 592.57295, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u2022 We present SynthTabNet a synthetically generated dataset, with various appearance styles and complexity."}, {"label": "list_item", "id": 8, "page_no": 1, "cluster": {"id": 8, "label": "list_item", "bbox": {"l": 61.569008000000004, "t": 605.4034, "r": 286.36508, "b": 638.22095, "coord_origin": "TOPLEFT"}, "confidence": 0.9806395173072815, "cells": [{"id": 56, "text": "\u2022", "bbox": {"l": 61.569008000000004, "t": 605.4034, "r": 72.332527, "b": 614.30995, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "An augmented dataset based on PubTabNet [37],", "bbox": {"l": 75.023399, "t": 605.4034, "r": 286.36508, "b": 614.30995, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "FinTabNet [36], and TableBank [17] with generated", "bbox": {"l": 70.03701, "t": 617.3584, "r": 286.36487, "b": 626.26495, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "ground-truth for reproducibility.", "bbox": {"l": 70.03701, "t": 629.31439, "r": 198.05641, "b": 638.22095, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u2022 An augmented dataset based on PubTabNet [37], FinTabNet [36], and TableBank [17] with generated ground-truth for reproducibility."}, {"label": "text", "id": 11, "page_no": 1, "cluster": {"id": 11, "label": "text", "bbox": {"l": 50.112007, "t": 650.59839, "r": 286.36511, "b": 695.369957, "coord_origin": "TOPLEFT"}, "confidence": 0.974253237247467, "cells": [{"id": 60, "text": "The paper is structured as follows. In Sec. 2, we give", "bbox": {"l": 62.067009000000006, "t": 650.59839, "r": 286.36496, "b": 659.50494, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "a brief overview of the current state-of-the-art. In Sec. 3,", "bbox": {"l": 50.112007, "t": 662.55339, "r": 286.36511, "b": 671.45995, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "we describe the datasets on which we train. In Sec. 4, we", "bbox": {"l": 50.112007, "t": 674.50839, "r": 286.36511, "b": 683.41496, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "introduce the TableFormer model-architecture and describe", "bbox": {"l": 50.112007, "t": 686.46339, "r": 286.36511, "b": 695.369957, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The paper is structured as follows. In Sec. 2, we give a brief overview of the current state-of-the-art. In Sec. 3, we describe the datasets on which we train. In Sec. 4, we introduce the TableFormer model-architecture and describe"}, {"label": "footnote", "id": 14, "page_no": 1, "cluster": {"id": 14, "label": "footnote", "bbox": {"l": 60.97100100000001, "t": 705.596275, "r": 183.73055, "b": 712.721542, "coord_origin": "TOPLEFT"}, "confidence": 0.8953676223754883, "cells": [{"id": 64, "text": "$^{1}$https://github.com/IBM/SynthTabNet", "bbox": {"l": 60.97100100000001, "t": 705.596275, "r": 183.73055, "b": 712.721542, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "$^{1}$https://github.com/IBM/SynthTabNet"}, {"label": "text", "id": 10, "page_no": 1, "cluster": {"id": 10, "label": "text", "bbox": {"l": 308.862, "t": 75.20836999999995, "r": 545.11511, "b": 108.02495999999985, "coord_origin": "TOPLEFT"}, "confidence": 0.977432370185852, "cells": [{"id": 65, "text": "its results & performance in Sec. 5. As a conclusion, we de-", "bbox": {"l": 308.862, "t": 75.20836999999995, "r": 545.11511, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "scribe how this new model-architecture can be re-purposed", "bbox": {"l": 308.862, "t": 87.16339000000005, "r": 545.11505, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "for other tasks in the computer-vision community.", "bbox": {"l": 308.862, "t": 99.11841000000004, "r": 508.08417000000003, "b": 108.02495999999985, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "its results & performance in Sec. 5. As a conclusion, we describe how this new model-architecture can be re-purposed for other tasks in the computer-vision community."}, {"label": "section_header", "id": 13, "page_no": 1, "cluster": {"id": 13, "label": "section_header", "bbox": {"l": 308.862, "t": 121.73193000000003, "r": 498.28021, "b": 132.47968000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9428722262382507, "cells": [{"id": 68, "text": "2.", "bbox": {"l": 308.862, "t": 121.73193000000003, "r": 315.5831, "b": 132.47968000000003, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "Previous work and State of the Art", "bbox": {"l": 324.54456, "t": 121.73193000000003, "r": 498.28021, "b": 132.47968000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2. Previous work and State of the Art"}, {"label": "text", "id": 0, "page_no": 1, "cluster": {"id": 0, "label": "text", "bbox": {"l": 308.862, "t": 142.22136999999998, "r": 545.11517, "b": 330.45502, "coord_origin": "TOPLEFT"}, "confidence": 0.9871949553489685, "cells": [{"id": 70, "text": "Identifying the structure of a table has been an outstand-", "bbox": {"l": 320.81699, "t": 142.22136999999998, "r": 545.11493, "b": 151.12793, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "ing problem in the document-parsing community, that mo-", "bbox": {"l": 308.862, "t": 154.17638999999997, "r": 545.11505, "b": 163.08294999999998, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "tivates many organised public challenges [6, 4, 14].", "bbox": {"l": 308.862, "t": 166.13140999999996, "r": 522.55975, "b": 175.03796, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "The", "bbox": {"l": 529.62323, "t": 166.13140999999996, "r": 545.11505, "b": 175.03796, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "difficulty of the problem can be attributed to a number of", "bbox": {"l": 308.862, "t": 178.08642999999995, "r": 545.11517, "b": 186.99298, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "factors. First, there is a large variety in the shapes and sizes", "bbox": {"l": 308.862, "t": 190.04143999999997, "r": 545.11511, "b": 198.94799999999998, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "of tables.", "bbox": {"l": 308.862, "t": 201.99645999999996, "r": 346.97891, "b": 210.90301999999997, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "Such large variety requires a flexible method.", "bbox": {"l": 354.86929, "t": 201.99645999999996, "r": 545.11511, "b": 210.90301999999997, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "This is especially true for complex column- and row head-", "bbox": {"l": 308.862, "t": 213.95245, "r": 545.11505, "b": 222.85901, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "ers, which can be extremely intricate and demanding.", "bbox": {"l": 308.862, "t": 225.90747, "r": 530.9184, "b": 234.81403, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "A", "bbox": {"l": 537.92212, "t": 225.90747, "r": 545.11511, "b": 234.81403, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "second factor of complexity is the lack of data with regard", "bbox": {"l": 308.862, "t": 237.86248999999998, "r": 545.11517, "b": 246.76904000000002, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "to table-structure. Until the publication of PubTabNet [37],", "bbox": {"l": 308.862, "t": 249.8175, "r": 545.11511, "b": 258.72406, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "there were no large datasets (i.e.", "bbox": {"l": 308.862, "t": 261.77252, "r": 439.8402699999999, "b": 270.67908, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": ">", "bbox": {"l": 444.43999999999994, "t": 261.61310000000003, "r": 452.1889, "b": 270.45989999999995, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "100", "bbox": {"l": 455.89001, "t": 261.61310000000003, "r": 470.83392000000003, "b": 270.45989999999995, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "K tables) that pro-", "bbox": {"l": 470.83401, "t": 261.77252, "r": 545.11517, "b": 270.67908, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "vided structure information. This happens primarily due to", "bbox": {"l": 308.862, "t": 273.72748, "r": 545.11511, "b": 282.63406, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "the fact that tables are notoriously time-consuming to an-", "bbox": {"l": 308.862, "t": 285.6835, "r": 545.11511, "b": 294.59006, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "notate by hand. However, this has definitely changed in re-", "bbox": {"l": 308.862, "t": 297.63849, "r": 545.11511, "b": 306.54504, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "cent years with the deliverance of PubTabNet [37], FinTab-", "bbox": {"l": 308.862, "t": 309.59348, "r": 545.11517, "b": 318.50003000000004, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "Net [36], TableBank [17] etc.", "bbox": {"l": 308.862, "t": 321.54846, "r": 425.92255, "b": 330.45502, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Identifying the structure of a table has been an outstanding problem in the document-parsing community, that motivates many organised public challenges [6, 4, 14]. The difficulty of the problem can be attributed to a number of factors. First, there is a large variety in the shapes and sizes of tables. Such large variety requires a flexible method. This is especially true for complex column- and row headers, which can be extremely intricate and demanding. A second factor of complexity is the lack of data with regard to table-structure. Until the publication of PubTabNet [37], there were no large datasets (i.e. > 100 K tables) that provided structure information. This happens primarily due to the fact that tables are notoriously time-consuming to annotate by hand. However, this has definitely changed in recent years with the deliverance of PubTabNet [37], FinTabNet [36], TableBank [17] etc."}, {"label": "text", "id": 1, "page_no": 1, "cluster": {"id": 1, "label": "text", "bbox": {"l": 308.862, "t": 333.56946, "r": 545.11523, "b": 450.0729099999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9869041442871094, "cells": [{"id": 92, "text": "Before the rising popularity of deep neural networks,", "bbox": {"l": 320.81699, "t": 333.56946, "r": 545.11499, "b": 342.47601, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "the community relied heavily on heuristic and/or statistical", "bbox": {"l": 308.862, "t": 345.52444, "r": 545.11499, "b": 354.43100000000004, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "methods to do table structure identification [3, 7, 11, 5, 13,", "bbox": {"l": 308.862, "t": 357.47943, "r": 545.11517, "b": 366.38599, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "28]. Although such methods work well on constrained ta-", "bbox": {"l": 308.862, "t": 369.43542, "r": 545.11511, "b": 378.34198, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "bles [12], a more data-driven approach can be applied due", "bbox": {"l": 308.862, "t": 381.39041, "r": 545.11505, "b": 390.29697, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "to the advent of convolutional neural networks (CNNs) and", "bbox": {"l": 308.862, "t": 393.3453999999999, "r": 545.11505, "b": 402.25195, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "the availability of large datasets. To the best-of-our knowl-", "bbox": {"l": 308.862, "t": 405.30038, "r": 545.11517, "b": 414.20694, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "edge, there are currently two different types of network ar-", "bbox": {"l": 308.862, "t": 417.25537, "r": 545.11523, "b": 426.16193, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "chitecture that are being pursued for state-of-the-art table-", "bbox": {"l": 308.862, "t": 429.21136000000007, "r": 545.11511, "b": 438.11792, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "structure identification.", "bbox": {"l": 308.862, "t": 441.16635, "r": 401.28503, "b": 450.0729099999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Before the rising popularity of deep neural networks, the community relied heavily on heuristic and/or statistical methods to do table structure identification [3, 7, 11, 5, 13, 28]. Although such methods work well on constrained tables [12], a more data-driven approach can be applied due to the advent of convolutional neural networks (CNNs) and the availability of large datasets. To the best-of-our knowledge, there are currently two different types of network architecture that are being pursued for state-of-the-art tablestructure identification."}, {"label": "text", "id": 3, "page_no": 1, "cluster": {"id": 3, "label": "text", "bbox": {"l": 308.86197, "t": 453.06778, "r": 545.11688, "b": 713.151848, "coord_origin": "TOPLEFT"}, "confidence": 0.9843218326568604, "cells": [{"id": 102, "text": "Image-to-Text networks", "bbox": {"l": 320.81699, "t": 453.06778, "r": 423.26236, "b": 462.02417, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": ": In this type of network, one", "bbox": {"l": 423.26697, "t": 453.18735, "r": 545.10956, "b": 462.0939, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "predicts a sequence of tokens starting from an encoded", "bbox": {"l": 308.86197, "t": 465.14233, "r": 545.11511, "b": 474.04889, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "image.", "bbox": {"l": 308.86197, "t": 477.09732, "r": 335.7012, "b": 486.00388, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "Such sequences of tokens can be HTML table", "bbox": {"l": 345.85309, "t": 477.09732, "r": 545.11505, "b": 486.00388, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "tags [37, 17] or LaTeX symbols[10]. The choice of sym-", "bbox": {"l": 308.86197, "t": 489.05231, "r": 545.11493, "b": 497.95886, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "bols is ultimately not very important, since one can be trans-", "bbox": {"l": 308.86197, "t": 501.00729, "r": 545.11499, "b": 509.91385, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "formed into the other. There are however subtle variations", "bbox": {"l": 308.86197, "t": 512.9632899999999, "r": 545.11505, "b": 521.8698400000001, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "in the Image-to-Text networks. The easiest network archi-", "bbox": {"l": 308.86197, "t": 524.91827, "r": 545.11505, "b": 533.82483, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "tectures are \u201cimage-encoder", "bbox": {"l": 308.86197, "t": 536.87328, "r": 420.94119, "b": 545.77983, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "\u2192", "bbox": {"l": 423.59497, "t": 536.1559599999999, "r": 433.5575600000001, "b": 545.56065, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "text-decoder\u201d (IETD), sim-", "bbox": {"l": 436.21198, "t": 536.87328, "r": 545.11316, "b": 545.77983, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "ilar to network architectures that try to provide captions to", "bbox": {"l": 308.86197, "t": 548.82828, "r": 545.11511, "b": 557.73483, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "images [32]. In these IETD networks, one expects as output", "bbox": {"l": 308.86197, "t": 560.78328, "r": 545.11493, "b": 569.68983, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "the LaTeX/HTML string of the entire table, i.e. the sym-", "bbox": {"l": 308.86197, "t": 572.73828, "r": 545.11499, "b": 581.6448399999999, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "bols necessary for creating the table with the content of the", "bbox": {"l": 308.86197, "t": 584.69427, "r": 545.11505, "b": 593.60083, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "table. Another approach is the \u201cimage-encoder", "bbox": {"l": 308.86197, "t": 596.6492800000001, "r": 497.07541, "b": 605.55583, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "\u2192", "bbox": {"l": 499.80496, "t": 595.93196, "r": 509.76755, "b": 605.33665, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "dual de-", "bbox": {"l": 512.50098, "t": 596.6492800000001, "r": 545.10852, "b": 605.55583, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "coder\u201d (IEDD) networks. In these type of networks, one has", "bbox": {"l": 308.86197, "t": 608.60428, "r": 545.11511, "b": 617.5108299999999, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "two consecutive decoders with different purposes. The first", "bbox": {"l": 308.86197, "t": 620.55928, "r": 545.11505, "b": 629.46584, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "decoder is the", "bbox": {"l": 308.86197, "t": 632.51428, "r": 364.78201, "b": 641.42084, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "tag-decoder", "bbox": {"l": 367.57397, "t": 632.60394, "r": 415.61362, "b": 641.1917, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": ", i.e. it only produces the HTM-", "bbox": {"l": 415.61298, "t": 632.51428, "r": 545.11688, "b": 641.42084, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "L/LaTeX tags which construct an empty table. The second", "bbox": {"l": 308.86197, "t": 644.46928, "r": 545.11511, "b": 653.37584, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "content-decoder", "bbox": {"l": 308.86197, "t": 656.51494, "r": 373.59894, "b": 665.1027, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "uses the encoding of the image in combi-", "bbox": {"l": 376.90698, "t": 656.4252799999999, "r": 545.11548, "b": 665.33184, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "nation with the output encoding of each cell-tag (from the", "bbox": {"l": 308.862, "t": 668.38028, "r": 545.11517, "b": 677.28684, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "tag-decoder", "bbox": {"l": 308.862, "t": 680.42494, "r": 356.90164, "b": 689.0127, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": ") to generate the textual content of each table", "bbox": {"l": 357.13101, "t": 680.33528, "r": 545.1153, "b": 689.24184, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "cell. The network architecture of IEDD is certainly more", "bbox": {"l": 308.862, "t": 692.290283, "r": 545.11511, "b": 701.196846, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "elaborate, but it has the advantage that one can pre-train the", "bbox": {"l": 308.862, "t": 704.245285, "r": 545.11517, "b": 713.151848, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Image-to-Text networks : In this type of network, one predicts a sequence of tokens starting from an encoded image. Such sequences of tokens can be HTML table tags [37, 17] or LaTeX symbols[10]. The choice of symbols is ultimately not very important, since one can be transformed into the other. There are however subtle variations in the Image-to-Text networks. The easiest network architectures are \u201cimage-encoder \u2192 text-decoder\u201d (IETD), similar to network architectures that try to provide captions to images [32]. In these IETD networks, one expects as output the LaTeX/HTML string of the entire table, i.e. the symbols necessary for creating the table with the content of the table. Another approach is the \u201cimage-encoder \u2192 dual decoder\u201d (IEDD) networks. In these type of networks, one has two consecutive decoders with different purposes. The first decoder is the tag-decoder , i.e. it only produces the HTML/LaTeX tags which construct an empty table. The second content-decoder uses the encoding of the image in combination with the output encoding of each cell-tag (from the tag-decoder ) to generate the textual content of each table cell. The network architecture of IEDD is certainly more elaborate, but it has the advantage that one can pre-train the"}, {"label": "page_footer", "id": 15, "page_no": 1, "cluster": {"id": 15, "label": "page_footer", "bbox": {"l": 295.121, "t": 734.133282, "r": 300.10229, "b": 743.039845, "coord_origin": "TOPLEFT"}, "confidence": 0.877809464931488, "cells": [{"id": 134, "text": "2", "bbox": {"l": 295.121, "t": 734.133282, "r": 300.10229, "b": 743.039845, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2"}], "body": [{"label": "text", "id": 12, "page_no": 1, "cluster": {"id": 12, "label": "text", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 286.36505, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9656890034675598, "cells": [{"id": 0, "text": "considered as a solved problem, given enough ground-truth", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 286.36505, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "data to train on.", "bbox": {"l": 50.112, "t": 87.16339000000005, "r": 112.64721999999999, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "considered as a solved problem, given enough ground-truth data to train on."}, {"label": "text", "id": 4, "page_no": 1, "cluster": {"id": 4, "label": "text", "bbox": {"l": 50.112, "t": 99.57141000000001, "r": 286.36514, "b": 228.03008999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9838606119155884, "cells": [{"id": 2, "text": "The second problem is called table-structure decompo-", "bbox": {"l": 62.067001, "t": 99.57141000000001, "r": 286.36496, "b": 108.47797000000003, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "sition.", "bbox": {"l": 50.112, "t": 111.52643, "r": 74.749512, "b": 120.43297999999993, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "The latter is a long standing problem in the com-", "bbox": {"l": 81.334793, "t": 111.52643, "r": 286.36514, "b": 120.43297999999993, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "munity of document understanding [6, 4, 14]. Contrary to", "bbox": {"l": 50.112, "t": 123.48145, "r": 286.36511, "b": 132.38800000000003, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "the table-location problem, there are no commonly used ap-", "bbox": {"l": 50.112, "t": 135.43646, "r": 286.36511, "b": 144.34302000000002, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "proaches that can easily be re-purposed to solve this prob-", "bbox": {"l": 50.112, "t": 147.39246000000003, "r": 286.36505, "b": 156.29900999999995, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "lem. Lately, a set of new model-architectures has been pro-", "bbox": {"l": 50.112, "t": 159.34747000000004, "r": 286.36511, "b": 168.25402999999994, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "posed by the community to address table-structure decom-", "bbox": {"l": 50.112, "t": 171.30249000000003, "r": 286.36508, "b": 180.20905000000005, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "position [37, 36, 18, 20]. All these models have some weak-", "bbox": {"l": 50.112, "t": 183.25751000000002, "r": 286.36511, "b": 192.16405999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "nesses (see Sec. 2). The common denominator here is the", "bbox": {"l": 50.112, "t": 195.21252000000004, "r": 286.36508, "b": 204.11908000000005, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "reliance on textual features and/or the inability to provide", "bbox": {"l": 50.112, "t": 207.16754000000003, "r": 286.36514, "b": 216.07410000000004, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "the bounding box of each table-cell in the original image.", "bbox": {"l": 50.112, "t": 219.12354000000005, "r": 278.66397, "b": 228.03008999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The second problem is called table-structure decomposition. The latter is a long standing problem in the community of document understanding [6, 4, 14]. Contrary to the table-location problem, there are no commonly used approaches that can easily be re-purposed to solve this problem. Lately, a set of new model-architectures has been proposed by the community to address table-structure decomposition [37, 36, 18, 20]. All these models have some weaknesses (see Sec. 2). The common denominator here is the reliance on textual features and/or the inability to provide the bounding box of each table-cell in the original image."}, {"label": "text", "id": 2, "page_no": 1, "cluster": {"id": 2, "label": "text", "bbox": {"l": 50.112, "t": 231.53156, "r": 286.36511, "b": 371.94507, "coord_origin": "TOPLEFT"}, "confidence": 0.9855920076370239, "cells": [{"id": 14, "text": "In this paper, we want to address these weaknesses and", "bbox": {"l": 62.067001, "t": 231.53156, "r": 286.36493, "b": 240.43811000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "present a robust table-structure decomposition algorithm.", "bbox": {"l": 50.112, "t": 243.48657000000003, "r": 286.36511, "b": 252.39313000000004, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "The design criteria for our model are the following. First,", "bbox": {"l": 50.112, "t": 255.44159000000002, "r": 286.36511, "b": 264.34813999999994, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "we want our algorithm to be language agnostic. In this way,", "bbox": {"l": 50.112, "t": 267.39661, "r": 286.36502, "b": 276.30316000000005, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "we can obtain the structure of any table, irregardless of the", "bbox": {"l": 50.112, "t": 279.35155999999995, "r": 286.36508, "b": 288.25815, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "language.", "bbox": {"l": 50.112, "t": 291.30759, "r": 88.567635, "b": 300.21414, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Second, we want our algorithm to leverage as", "bbox": {"l": 95.501602, "t": 291.30759, "r": 286.36505, "b": 300.21414, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "much data as possible from the original PDF document. For", "bbox": {"l": 50.112, "t": 303.26257, "r": 286.36508, "b": 312.16913, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "programmatic PDF documents, the text-cells can often be", "bbox": {"l": 50.112, "t": 315.21756, "r": 286.36511, "b": 324.12411, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "extracted much faster and with higher accuracy compared", "bbox": {"l": 50.112, "t": 327.17255, "r": 286.36505, "b": 336.0791, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "to OCR methods. Last but not least, we want to have a di-", "bbox": {"l": 50.112, "t": 339.12753, "r": 286.36511, "b": 348.03409, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "rect link between the table-cell and its bounding box in the", "bbox": {"l": 50.112, "t": 351.08353, "r": 286.36508, "b": 359.99008, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "image.", "bbox": {"l": 50.112, "t": 363.03851, "r": 76.951241, "b": 371.94507, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In this paper, we want to address these weaknesses and present a robust table-structure decomposition algorithm. The design criteria for our model are the following. First, we want our algorithm to be language agnostic. In this way, we can obtain the structure of any table, irregardless of the language. Second, we want our algorithm to leverage as much data as possible from the original PDF document. For programmatic PDF documents, the text-cells can often be extracted much faster and with higher accuracy compared to OCR methods. Last but not least, we want to have a direct link between the table-cell and its bounding box in the image."}, {"label": "text", "id": 7, "page_no": 1, "cluster": {"id": 7, "label": "text", "bbox": {"l": 50.112, "t": 375.4465, "r": 286.36658, "b": 432.173, "coord_origin": "TOPLEFT"}, "confidence": 0.9820111393928528, "cells": [{"id": 27, "text": "To meet the design criteria listed above, we developed a", "bbox": {"l": 62.067001, "t": 375.4465, "r": 286.36499, "b": 384.35306, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "new model called", "bbox": {"l": 50.112, "t": 387.40149, "r": 120.98594, "b": 396.30804, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "TableFormer", "bbox": {"l": 123.901, "t": 387.28192, "r": 179.7314, "b": 396.23830999999996, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "and a synthetically gener-", "bbox": {"l": 182.646, "t": 387.40149, "r": 286.36658, "b": 396.30804, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "ated table structure dataset called", "bbox": {"l": 50.112, "t": 399.35648, "r": 181.75778, "b": 408.26302999999996, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "SynthTabNet", "bbox": {"l": 184.104, "t": 399.23690999999997, "r": 240.2034, "b": 408.1933, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "$^{1}$. In partic-", "bbox": {"l": 240.20401, "t": 399.35648, "r": 286.36069, "b": 408.26302999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "ular, our contributions in this work can be summarised as", "bbox": {"l": 50.112015, "t": 411.31146, "r": 286.36511, "b": 420.21802, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "follows:", "bbox": {"l": 50.112015, "t": 423.26645, "r": 82.520355, "b": 432.173, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "To meet the design criteria listed above, we developed a new model called TableFormer and a synthetically generated table structure dataset called SynthTabNet $^{1}$. In particular, our contributions in this work can be summarised as follows:"}, {"label": "list_item", "id": 6, "page_no": 1, "cluster": {"id": 6, "label": "list_item", "bbox": {"l": 61.569016, "t": 444.43188, "r": 286.3649, "b": 489.32297, "coord_origin": "TOPLEFT"}, "confidence": 0.9822162389755249, "cells": [{"id": 36, "text": "\u2022", "bbox": {"l": 61.569016, "t": 444.55145, "r": 70.741714, "b": 453.45801, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "We propose", "bbox": {"l": 73.034889, "t": 444.55145, "r": 117.10054, "b": 453.45801, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "TableFormer", "bbox": {"l": 119.59001, "t": 444.43188, "r": 175.42041, "b": 453.38828, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": ", a transformer based model", "bbox": {"l": 175.42102, "t": 444.55145, "r": 286.36453, "b": 453.45801, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "that predicts tables structure and bounding boxes for", "bbox": {"l": 70.037018, "t": 456.50644000000005, "r": 286.3649, "b": 465.41299, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "the table content simultaneously in an end-to-end ap-", "bbox": {"l": 70.037018, "t": 468.46143, "r": 286.3649, "b": 477.36798, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "proach.", "bbox": {"l": 70.037018, "t": 480.41641, "r": 99.635902, "b": 489.32297, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u2022 We propose TableFormer , a transformer based model that predicts tables structure and bounding boxes for the table content simultaneously in an end-to-end approach."}, {"label": "list_item", "id": 5, "page_no": 1, "cluster": {"id": 5, "label": "list_item", "bbox": {"l": 61.569016, "t": 502.03384, "r": 286.3649, "b": 546.9259500000001, "coord_origin": "TOPLEFT"}, "confidence": 0.982271671295166, "cells": [{"id": 43, "text": "\u2022", "bbox": {"l": 61.569016, "t": 502.15341, "r": 71.619438, "b": 511.05997, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "Across all benchmark datasets", "bbox": {"l": 74.132042, "t": 502.15341, "r": 196.10396, "b": 511.05997, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "TableFormer", "bbox": {"l": 200.31001, "t": 502.03384, "r": 256.14041, "b": 510.99023, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "signif-", "bbox": {"l": 260.35001, "t": 502.15341, "r": 286.36237, "b": 511.05997, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "icantly outperforms existing state-of-the-art metrics,", "bbox": {"l": 70.037003, "t": 514.1084000000001, "r": 286.3649, "b": 523.01495, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "while being much more efficient in training and infer-", "bbox": {"l": 70.037003, "t": 526.06439, "r": 286.36487, "b": 534.97095, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "ence to existing works.", "bbox": {"l": 70.037003, "t": 538.0193899999999, "r": 161.65305, "b": 546.9259500000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u2022 Across all benchmark datasets TableFormer significantly outperforms existing state-of-the-art metrics, while being much more efficient in training and inference to existing works."}, {"label": "list_item", "id": 9, "page_no": 1, "cluster": {"id": 9, "label": "list_item", "bbox": {"l": 61.569, "t": 559.63684, "r": 286.36493, "b": 592.57295, "coord_origin": "TOPLEFT"}, "confidence": 0.98029625415802, "cells": [{"id": 50, "text": "\u2022", "bbox": {"l": 61.569, "t": 559.75639, "r": 71.115913, "b": 568.66295, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "We present", "bbox": {"l": 73.502647, "t": 559.75639, "r": 116.71199, "b": 568.66295, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "SynthTabNet", "bbox": {"l": 121.583, "t": 559.63684, "r": 177.68239, "b": 568.59322, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "a synthetically generated", "bbox": {"l": 182.55301, "t": 559.75639, "r": 286.36328, "b": 568.66295, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "dataset, with various appearance styles and complex-", "bbox": {"l": 70.03701, "t": 571.7114, "r": 286.36493, "b": 580.6179500000001, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "ity.", "bbox": {"l": 70.03701, "t": 583.6664000000001, "r": 82.400597, "b": 592.57295, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u2022 We present SynthTabNet a synthetically generated dataset, with various appearance styles and complexity."}, {"label": "list_item", "id": 8, "page_no": 1, "cluster": {"id": 8, "label": "list_item", "bbox": {"l": 61.569008000000004, "t": 605.4034, "r": 286.36508, "b": 638.22095, "coord_origin": "TOPLEFT"}, "confidence": 0.9806395173072815, "cells": [{"id": 56, "text": "\u2022", "bbox": {"l": 61.569008000000004, "t": 605.4034, "r": 72.332527, "b": 614.30995, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "An augmented dataset based on PubTabNet [37],", "bbox": {"l": 75.023399, "t": 605.4034, "r": 286.36508, "b": 614.30995, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "FinTabNet [36], and TableBank [17] with generated", "bbox": {"l": 70.03701, "t": 617.3584, "r": 286.36487, "b": 626.26495, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "ground-truth for reproducibility.", "bbox": {"l": 70.03701, "t": 629.31439, "r": 198.05641, "b": 638.22095, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u2022 An augmented dataset based on PubTabNet [37], FinTabNet [36], and TableBank [17] with generated ground-truth for reproducibility."}, {"label": "text", "id": 11, "page_no": 1, "cluster": {"id": 11, "label": "text", "bbox": {"l": 50.112007, "t": 650.59839, "r": 286.36511, "b": 695.369957, "coord_origin": "TOPLEFT"}, "confidence": 0.974253237247467, "cells": [{"id": 60, "text": "The paper is structured as follows. In Sec. 2, we give", "bbox": {"l": 62.067009000000006, "t": 650.59839, "r": 286.36496, "b": 659.50494, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "a brief overview of the current state-of-the-art. In Sec. 3,", "bbox": {"l": 50.112007, "t": 662.55339, "r": 286.36511, "b": 671.45995, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "we describe the datasets on which we train. In Sec. 4, we", "bbox": {"l": 50.112007, "t": 674.50839, "r": 286.36511, "b": 683.41496, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "introduce the TableFormer model-architecture and describe", "bbox": {"l": 50.112007, "t": 686.46339, "r": 286.36511, "b": 695.369957, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The paper is structured as follows. In Sec. 2, we give a brief overview of the current state-of-the-art. In Sec. 3, we describe the datasets on which we train. In Sec. 4, we introduce the TableFormer model-architecture and describe"}, {"label": "footnote", "id": 14, "page_no": 1, "cluster": {"id": 14, "label": "footnote", "bbox": {"l": 60.97100100000001, "t": 705.596275, "r": 183.73055, "b": 712.721542, "coord_origin": "TOPLEFT"}, "confidence": 0.8953676223754883, "cells": [{"id": 64, "text": "$^{1}$https://github.com/IBM/SynthTabNet", "bbox": {"l": 60.97100100000001, "t": 705.596275, "r": 183.73055, "b": 712.721542, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "$^{1}$https://github.com/IBM/SynthTabNet"}, {"label": "text", "id": 10, "page_no": 1, "cluster": {"id": 10, "label": "text", "bbox": {"l": 308.862, "t": 75.20836999999995, "r": 545.11511, "b": 108.02495999999985, "coord_origin": "TOPLEFT"}, "confidence": 0.977432370185852, "cells": [{"id": 65, "text": "its results & performance in Sec. 5. As a conclusion, we de-", "bbox": {"l": 308.862, "t": 75.20836999999995, "r": 545.11511, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "scribe how this new model-architecture can be re-purposed", "bbox": {"l": 308.862, "t": 87.16339000000005, "r": 545.11505, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "for other tasks in the computer-vision community.", "bbox": {"l": 308.862, "t": 99.11841000000004, "r": 508.08417000000003, "b": 108.02495999999985, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "its results & performance in Sec. 5. As a conclusion, we describe how this new model-architecture can be re-purposed for other tasks in the computer-vision community."}, {"label": "section_header", "id": 13, "page_no": 1, "cluster": {"id": 13, "label": "section_header", "bbox": {"l": 308.862, "t": 121.73193000000003, "r": 498.28021, "b": 132.47968000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9428722262382507, "cells": [{"id": 68, "text": "2.", "bbox": {"l": 308.862, "t": 121.73193000000003, "r": 315.5831, "b": 132.47968000000003, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "Previous work and State of the Art", "bbox": {"l": 324.54456, "t": 121.73193000000003, "r": 498.28021, "b": 132.47968000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2. Previous work and State of the Art"}, {"label": "text", "id": 0, "page_no": 1, "cluster": {"id": 0, "label": "text", "bbox": {"l": 308.862, "t": 142.22136999999998, "r": 545.11517, "b": 330.45502, "coord_origin": "TOPLEFT"}, "confidence": 0.9871949553489685, "cells": [{"id": 70, "text": "Identifying the structure of a table has been an outstand-", "bbox": {"l": 320.81699, "t": 142.22136999999998, "r": 545.11493, "b": 151.12793, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "ing problem in the document-parsing community, that mo-", "bbox": {"l": 308.862, "t": 154.17638999999997, "r": 545.11505, "b": 163.08294999999998, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "tivates many organised public challenges [6, 4, 14].", "bbox": {"l": 308.862, "t": 166.13140999999996, "r": 522.55975, "b": 175.03796, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "The", "bbox": {"l": 529.62323, "t": 166.13140999999996, "r": 545.11505, "b": 175.03796, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "difficulty of the problem can be attributed to a number of", "bbox": {"l": 308.862, "t": 178.08642999999995, "r": 545.11517, "b": 186.99298, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "factors. First, there is a large variety in the shapes and sizes", "bbox": {"l": 308.862, "t": 190.04143999999997, "r": 545.11511, "b": 198.94799999999998, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "of tables.", "bbox": {"l": 308.862, "t": 201.99645999999996, "r": 346.97891, "b": 210.90301999999997, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "Such large variety requires a flexible method.", "bbox": {"l": 354.86929, "t": 201.99645999999996, "r": 545.11511, "b": 210.90301999999997, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "This is especially true for complex column- and row head-", "bbox": {"l": 308.862, "t": 213.95245, "r": 545.11505, "b": 222.85901, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "ers, which can be extremely intricate and demanding.", "bbox": {"l": 308.862, "t": 225.90747, "r": 530.9184, "b": 234.81403, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "A", "bbox": {"l": 537.92212, "t": 225.90747, "r": 545.11511, "b": 234.81403, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "second factor of complexity is the lack of data with regard", "bbox": {"l": 308.862, "t": 237.86248999999998, "r": 545.11517, "b": 246.76904000000002, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "to table-structure. Until the publication of PubTabNet [37],", "bbox": {"l": 308.862, "t": 249.8175, "r": 545.11511, "b": 258.72406, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "there were no large datasets (i.e.", "bbox": {"l": 308.862, "t": 261.77252, "r": 439.8402699999999, "b": 270.67908, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": ">", "bbox": {"l": 444.43999999999994, "t": 261.61310000000003, "r": 452.1889, "b": 270.45989999999995, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "100", "bbox": {"l": 455.89001, "t": 261.61310000000003, "r": 470.83392000000003, "b": 270.45989999999995, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "K tables) that pro-", "bbox": {"l": 470.83401, "t": 261.77252, "r": 545.11517, "b": 270.67908, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "vided structure information. This happens primarily due to", "bbox": {"l": 308.862, "t": 273.72748, "r": 545.11511, "b": 282.63406, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "the fact that tables are notoriously time-consuming to an-", "bbox": {"l": 308.862, "t": 285.6835, "r": 545.11511, "b": 294.59006, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "notate by hand. However, this has definitely changed in re-", "bbox": {"l": 308.862, "t": 297.63849, "r": 545.11511, "b": 306.54504, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "cent years with the deliverance of PubTabNet [37], FinTab-", "bbox": {"l": 308.862, "t": 309.59348, "r": 545.11517, "b": 318.50003000000004, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "Net [36], TableBank [17] etc.", "bbox": {"l": 308.862, "t": 321.54846, "r": 425.92255, "b": 330.45502, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Identifying the structure of a table has been an outstanding problem in the document-parsing community, that motivates many organised public challenges [6, 4, 14]. The difficulty of the problem can be attributed to a number of factors. First, there is a large variety in the shapes and sizes of tables. Such large variety requires a flexible method. This is especially true for complex column- and row headers, which can be extremely intricate and demanding. A second factor of complexity is the lack of data with regard to table-structure. Until the publication of PubTabNet [37], there were no large datasets (i.e. > 100 K tables) that provided structure information. This happens primarily due to the fact that tables are notoriously time-consuming to annotate by hand. However, this has definitely changed in recent years with the deliverance of PubTabNet [37], FinTabNet [36], TableBank [17] etc."}, {"label": "text", "id": 1, "page_no": 1, "cluster": {"id": 1, "label": "text", "bbox": {"l": 308.862, "t": 333.56946, "r": 545.11523, "b": 450.0729099999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9869041442871094, "cells": [{"id": 92, "text": "Before the rising popularity of deep neural networks,", "bbox": {"l": 320.81699, "t": 333.56946, "r": 545.11499, "b": 342.47601, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "the community relied heavily on heuristic and/or statistical", "bbox": {"l": 308.862, "t": 345.52444, "r": 545.11499, "b": 354.43100000000004, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "methods to do table structure identification [3, 7, 11, 5, 13,", "bbox": {"l": 308.862, "t": 357.47943, "r": 545.11517, "b": 366.38599, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "28]. Although such methods work well on constrained ta-", "bbox": {"l": 308.862, "t": 369.43542, "r": 545.11511, "b": 378.34198, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "bles [12], a more data-driven approach can be applied due", "bbox": {"l": 308.862, "t": 381.39041, "r": 545.11505, "b": 390.29697, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "to the advent of convolutional neural networks (CNNs) and", "bbox": {"l": 308.862, "t": 393.3453999999999, "r": 545.11505, "b": 402.25195, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "the availability of large datasets. To the best-of-our knowl-", "bbox": {"l": 308.862, "t": 405.30038, "r": 545.11517, "b": 414.20694, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "edge, there are currently two different types of network ar-", "bbox": {"l": 308.862, "t": 417.25537, "r": 545.11523, "b": 426.16193, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "chitecture that are being pursued for state-of-the-art table-", "bbox": {"l": 308.862, "t": 429.21136000000007, "r": 545.11511, "b": 438.11792, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "structure identification.", "bbox": {"l": 308.862, "t": 441.16635, "r": 401.28503, "b": 450.0729099999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Before the rising popularity of deep neural networks, the community relied heavily on heuristic and/or statistical methods to do table structure identification [3, 7, 11, 5, 13, 28]. Although such methods work well on constrained tables [12], a more data-driven approach can be applied due to the advent of convolutional neural networks (CNNs) and the availability of large datasets. To the best-of-our knowledge, there are currently two different types of network architecture that are being pursued for state-of-the-art tablestructure identification."}, {"label": "text", "id": 3, "page_no": 1, "cluster": {"id": 3, "label": "text", "bbox": {"l": 308.86197, "t": 453.06778, "r": 545.11688, "b": 713.151848, "coord_origin": "TOPLEFT"}, "confidence": 0.9843218326568604, "cells": [{"id": 102, "text": "Image-to-Text networks", "bbox": {"l": 320.81699, "t": 453.06778, "r": 423.26236, "b": 462.02417, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": ": In this type of network, one", "bbox": {"l": 423.26697, "t": 453.18735, "r": 545.10956, "b": 462.0939, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "predicts a sequence of tokens starting from an encoded", "bbox": {"l": 308.86197, "t": 465.14233, "r": 545.11511, "b": 474.04889, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "image.", "bbox": {"l": 308.86197, "t": 477.09732, "r": 335.7012, "b": 486.00388, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "Such sequences of tokens can be HTML table", "bbox": {"l": 345.85309, "t": 477.09732, "r": 545.11505, "b": 486.00388, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "tags [37, 17] or LaTeX symbols[10]. The choice of sym-", "bbox": {"l": 308.86197, "t": 489.05231, "r": 545.11493, "b": 497.95886, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "bols is ultimately not very important, since one can be trans-", "bbox": {"l": 308.86197, "t": 501.00729, "r": 545.11499, "b": 509.91385, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "formed into the other. There are however subtle variations", "bbox": {"l": 308.86197, "t": 512.9632899999999, "r": 545.11505, "b": 521.8698400000001, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "in the Image-to-Text networks. The easiest network archi-", "bbox": {"l": 308.86197, "t": 524.91827, "r": 545.11505, "b": 533.82483, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "tectures are \u201cimage-encoder", "bbox": {"l": 308.86197, "t": 536.87328, "r": 420.94119, "b": 545.77983, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "\u2192", "bbox": {"l": 423.59497, "t": 536.1559599999999, "r": 433.5575600000001, "b": 545.56065, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "text-decoder\u201d (IETD), sim-", "bbox": {"l": 436.21198, "t": 536.87328, "r": 545.11316, "b": 545.77983, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "ilar to network architectures that try to provide captions to", "bbox": {"l": 308.86197, "t": 548.82828, "r": 545.11511, "b": 557.73483, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "images [32]. In these IETD networks, one expects as output", "bbox": {"l": 308.86197, "t": 560.78328, "r": 545.11493, "b": 569.68983, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "the LaTeX/HTML string of the entire table, i.e. the sym-", "bbox": {"l": 308.86197, "t": 572.73828, "r": 545.11499, "b": 581.6448399999999, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "bols necessary for creating the table with the content of the", "bbox": {"l": 308.86197, "t": 584.69427, "r": 545.11505, "b": 593.60083, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "table. Another approach is the \u201cimage-encoder", "bbox": {"l": 308.86197, "t": 596.6492800000001, "r": 497.07541, "b": 605.55583, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "\u2192", "bbox": {"l": 499.80496, "t": 595.93196, "r": 509.76755, "b": 605.33665, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "dual de-", "bbox": {"l": 512.50098, "t": 596.6492800000001, "r": 545.10852, "b": 605.55583, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "coder\u201d (IEDD) networks. In these type of networks, one has", "bbox": {"l": 308.86197, "t": 608.60428, "r": 545.11511, "b": 617.5108299999999, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "two consecutive decoders with different purposes. The first", "bbox": {"l": 308.86197, "t": 620.55928, "r": 545.11505, "b": 629.46584, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "decoder is the", "bbox": {"l": 308.86197, "t": 632.51428, "r": 364.78201, "b": 641.42084, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "tag-decoder", "bbox": {"l": 367.57397, "t": 632.60394, "r": 415.61362, "b": 641.1917, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": ", i.e. it only produces the HTM-", "bbox": {"l": 415.61298, "t": 632.51428, "r": 545.11688, "b": 641.42084, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "L/LaTeX tags which construct an empty table. The second", "bbox": {"l": 308.86197, "t": 644.46928, "r": 545.11511, "b": 653.37584, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "content-decoder", "bbox": {"l": 308.86197, "t": 656.51494, "r": 373.59894, "b": 665.1027, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "uses the encoding of the image in combi-", "bbox": {"l": 376.90698, "t": 656.4252799999999, "r": 545.11548, "b": 665.33184, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "nation with the output encoding of each cell-tag (from the", "bbox": {"l": 308.862, "t": 668.38028, "r": 545.11517, "b": 677.28684, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "tag-decoder", "bbox": {"l": 308.862, "t": 680.42494, "r": 356.90164, "b": 689.0127, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": ") to generate the textual content of each table", "bbox": {"l": 357.13101, "t": 680.33528, "r": 545.1153, "b": 689.24184, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "cell. The network architecture of IEDD is certainly more", "bbox": {"l": 308.862, "t": 692.290283, "r": 545.11511, "b": 701.196846, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "elaborate, but it has the advantage that one can pre-train the", "bbox": {"l": 308.862, "t": 704.245285, "r": 545.11517, "b": 713.151848, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Image-to-Text networks : In this type of network, one predicts a sequence of tokens starting from an encoded image. Such sequences of tokens can be HTML table tags [37, 17] or LaTeX symbols[10]. The choice of symbols is ultimately not very important, since one can be transformed into the other. There are however subtle variations in the Image-to-Text networks. The easiest network architectures are \u201cimage-encoder \u2192 text-decoder\u201d (IETD), similar to network architectures that try to provide captions to images [32]. In these IETD networks, one expects as output the LaTeX/HTML string of the entire table, i.e. the symbols necessary for creating the table with the content of the table. Another approach is the \u201cimage-encoder \u2192 dual decoder\u201d (IEDD) networks. In these type of networks, one has two consecutive decoders with different purposes. The first decoder is the tag-decoder , i.e. it only produces the HTML/LaTeX tags which construct an empty table. The second content-decoder uses the encoding of the image in combination with the output encoding of each cell-tag (from the tag-decoder ) to generate the textual content of each table cell. The network architecture of IEDD is certainly more elaborate, but it has the advantage that one can pre-train the"}], "headers": [{"label": "page_footer", "id": 15, "page_no": 1, "cluster": {"id": 15, "label": "page_footer", "bbox": {"l": 295.121, "t": 734.133282, "r": 300.10229, "b": 743.039845, "coord_origin": "TOPLEFT"}, "confidence": 0.877809464931488, "cells": [{"id": 134, "text": "2", "bbox": {"l": 295.121, "t": 734.133282, "r": 300.10229, "b": 743.039845, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2"}]}}, {"page_no": 2, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "tag-decoder which is constrained to the table-tags.", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 250.15102, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "In", "bbox": {"l": 62.067001, "t": 87.21935999999994, "r": 70.365845, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "practice,", "bbox": {"l": 76.931198, "t": 87.21935999999994, "r": 110.95348000000001, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "both", "bbox": {"l": 118.54498, "t": 87.21935999999994, "r": 136.25848, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "network", "bbox": {"l": 142.82384, "t": 87.21935999999994, "r": 175.37166, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "architectures", "bbox": {"l": 181.94698, "t": 87.21935999999994, "r": 232.83594000000002, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "(IETD", "bbox": {"l": 239.41125, "t": 87.21935999999994, "r": 265.41364, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "and", "bbox": {"l": 271.979, "t": 87.21935999999994, "r": 286.36499, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "IEDD) require an implicit, custom trained object-character-", "bbox": {"l": 50.112, "t": 99.17437999999993, "r": 286.36505, "b": 108.08092999999997, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "recognition (OCR) to obtain the content of the table-cells.", "bbox": {"l": 50.112, "t": 111.13036999999997, "r": 286.36511, "b": 120.03692999999998, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "In the case of IETD, this OCR engine is implicit in the de-", "bbox": {"l": 50.112, "t": 123.08538999999996, "r": 286.36505, "b": 131.99194, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "coder similar to [24]. For the IEDD, the OCR is solely em-", "bbox": {"l": 50.112, "t": 135.04040999999995, "r": 286.36514, "b": 143.94696, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "bedded in the content-decoder. This reliance on a custom,", "bbox": {"l": 50.112, "t": 146.99541999999997, "r": 286.36511, "b": 155.90197999999998, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "implicit OCR decoder is of course problematic. OCR is a", "bbox": {"l": 50.112, "t": 158.95043999999996, "r": 286.36505, "b": 167.85699, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "well known and extremely tough problem, that often needs", "bbox": {"l": 50.112, "t": 170.90545999999995, "r": 286.36508, "b": 179.81201, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "custom training for each individual language. However, the", "bbox": {"l": 50.112, "t": 182.86145, "r": 286.36508, "b": 191.76801, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "limited availability for non-english content in the current", "bbox": {"l": 50.112, "t": 194.81646999999998, "r": 286.36511, "b": 203.72302000000002, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "datasets, makes it impractical to apply the IETD and IEDD", "bbox": {"l": 50.112, "t": 206.77148, "r": 286.36511, "b": 215.67804, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "methods on tables with other languages. Additionally, OCR", "bbox": {"l": 50.112, "t": 218.7265, "r": 286.36505, "b": 227.63306, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "can be completely omitted if the tables originate from pro-", "bbox": {"l": 50.112, "t": 230.68151999999998, "r": 286.36505, "b": 239.58807000000002, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "grammatic PDF documents with known positions of each", "bbox": {"l": 50.112, "t": 242.63653999999997, "r": 286.36511, "b": 251.54309, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "cell. The latter was the inspiration for the work of this pa-", "bbox": {"l": 50.112, "t": 254.59253, "r": 286.36508, "b": 263.49908000000005, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "per.", "bbox": {"l": 50.112, "t": 266.54755, "r": 64.776947, "b": 275.45410000000004, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Graph Neural networks", "bbox": {"l": 62.067001, "t": 278.43895999999995, "r": 171.56593, "b": 287.39536, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": ":", "bbox": {"l": 171.56799, "t": 278.55853, "r": 174.3376, "b": 287.46509, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "Graph Neural networks", "bbox": {"l": 185.18687, "t": 278.55853, "r": 286.35709, "b": 287.46509, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "(GNN\u2019s) take a radically different approach to table-", "bbox": {"l": 50.111992, "t": 290.51453000000004, "r": 286.36511, "b": 299.42108, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "structure extraction.", "bbox": {"l": 50.111992, "t": 302.46950999999996, "r": 131.16771, "b": 311.37607, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Note that one table cell can consti-", "bbox": {"l": 138.84888, "t": 302.46950999999996, "r": 286.36508, "b": 311.37607, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "tute out of multiple text-cells. To obtain the table-structure,", "bbox": {"l": 50.111992, "t": 314.4245, "r": 286.36505, "b": 323.33105, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "one creates an initial graph, where each of the text-cells", "bbox": {"l": 50.111992, "t": 326.37949000000003, "r": 286.36508, "b": 335.28604, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "becomes a node in the graph similar to [33, 34, 2]. Each", "bbox": {"l": 50.111992, "t": 338.33447, "r": 286.36505, "b": 347.2410300000001, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "node is then associated with en embedding vector coming", "bbox": {"l": 50.111992, "t": 350.28946, "r": 286.36505, "b": 359.19601, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "from the encoded image, its coordinates and the encoded", "bbox": {"l": 50.111992, "t": 362.24545000000006, "r": 286.36508, "b": 371.15201, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "text. Furthermore, nodes that represent adjacent text-cells", "bbox": {"l": 50.111992, "t": 374.20044, "r": 286.36508, "b": 383.10699, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "are linked. Graph Convolutional Networks (GCN\u2019s) based", "bbox": {"l": 50.111992, "t": 386.15542999999997, "r": 286.36508, "b": 395.06198, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "methods take the image as an input, but also the position of", "bbox": {"l": 50.111992, "t": 398.11041000000006, "r": 286.36508, "b": 407.01697, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "the text-cells and their content [18]. The purpose of a GCN", "bbox": {"l": 50.111992, "t": 410.0654, "r": 286.36508, "b": 418.97195, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "is to transform the input graph into a new graph, which re-", "bbox": {"l": 50.111992, "t": 422.02038999999996, "r": 286.36505, "b": 430.92694, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "places the old links with new ones.", "bbox": {"l": 50.111992, "t": 433.97638, "r": 198.2359, "b": 442.88293, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "The new links then", "bbox": {"l": 205.92703, "t": 433.97638, "r": 286.36505, "b": 442.88293, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "represent the table-structure. With this approach, one can", "bbox": {"l": 50.111992, "t": 445.93137, "r": 286.36508, "b": 454.83792000000005, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "avoid the need to build custom OCR decoders. However,", "bbox": {"l": 50.111992, "t": 457.88635, "r": 286.36505, "b": 466.79291, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "the quality of the reconstructed structure is not comparable", "bbox": {"l": 50.111992, "t": 469.84134, "r": 286.36505, "b": 478.74789, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "to the current state-of-the-art [18].", "bbox": {"l": 50.111992, "t": 481.79633, "r": 186.49998, "b": 490.70288, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Hybrid Deep Learning-Rule-Based approach", "bbox": {"l": 62.066994, "t": 493.68875, "r": 252.88068000000004, "b": 502.64514, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": ": A pop-", "bbox": {"l": 252.88199, "t": 493.80832, "r": 286.36627, "b": 502.71487, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "ular current model for table-structure identification is the", "bbox": {"l": 50.111984, "t": 505.76331, "r": 286.36505, "b": 514.66986, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "use of a hybrid Deep Learning-Rule-Based approach similar", "bbox": {"l": 50.111984, "t": 517.71829, "r": 286.36505, "b": 526.6248499999999, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "to [27, 29]. In this approach, one first detects the position of", "bbox": {"l": 50.111984, "t": 529.67328, "r": 286.36508, "b": 538.57985, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "the table-cells with object detection (e.g. YoloVx or Mask-", "bbox": {"l": 50.111984, "t": 541.62929, "r": 286.36508, "b": 550.53584, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "RCNN), then classifies the table into different types (from", "bbox": {"l": 50.111984, "t": 553.58429, "r": 286.36511, "b": 562.4908399999999, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "its images) and finally uses different rule-sets to obtain", "bbox": {"l": 50.111984, "t": 565.5392899999999, "r": 286.36511, "b": 574.44585, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "its table-structure. Currently, this approach achieves state-", "bbox": {"l": 50.111984, "t": 577.49429, "r": 286.36502, "b": 586.40085, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "of-the-art results, but is not an end-to-end deep-learning", "bbox": {"l": 50.111984, "t": 589.4493, "r": 286.36505, "b": 598.35585, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "method. As such, new rules need to be written if different", "bbox": {"l": 50.111984, "t": 601.4043, "r": 286.36502, "b": 610.31085, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "types of tables are encountered.", "bbox": {"l": 50.111984, "t": 613.36029, "r": 175.98943, "b": 622.26685, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "3.", "bbox": {"l": 50.111984, "t": 635.94484, "r": 57.82375699999999, "b": 646.6925699999999, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Datasets", "bbox": {"l": 68.106125, "t": 635.94484, "r": 105.22546, "b": 646.6925699999999, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "We rely on large-scale datasets such as PubTabNet [37],", "bbox": {"l": 62.06698600000001, "t": 656.42529, "r": 286.36493, "b": 665.33186, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "FinTabNet [36], and TableBank [17] datasets to train and", "bbox": {"l": 50.111984, "t": 668.38029, "r": 286.36508, "b": 677.2868599999999, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "evaluate our models. These datasets span over various ap-", "bbox": {"l": 50.111984, "t": 680.3353, "r": 286.36502, "b": 689.24186, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "pearance styles and content.", "bbox": {"l": 50.111984, "t": 692.290298, "r": 166.24602, "b": 701.196861, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "We also introduce our own", "bbox": {"l": 173.68808, "t": 692.290298, "r": 286.36508, "b": 701.196861, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "synthetically generated SynthTabNet dataset to fix an im-", "bbox": {"l": 50.111984, "t": 704.2453, "r": 286.36505, "b": 713.151863, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "PubTabNet + FinTabNet", "bbox": {"l": 380.79849, "t": 79.81176999999991, "r": 486.84909, "b": 88.55975000000001, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "Rows / Columns", "bbox": {"l": 396.76776, "t": 242.02697999999998, "r": 469.78748, "b": 250.77495999999996, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "0", "bbox": {"l": 320.97653, "t": 233.42296999999996, "r": 324.79254, "b": 239.255, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "20", "bbox": {"l": 410.483, "t": 233.42296999999996, "r": 418.11319, "b": 239.255, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "40", "bbox": {"l": 500.84949, "t": 233.42296999999996, "r": 508.47968000000003, "b": 239.255, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "10", "bbox": {"l": 365.29999, "t": 233.42296999999996, "r": 372.93018, "b": 239.255, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "30", "bbox": {"l": 455.66626, "t": 233.42296999999996, "r": 463.29645, "b": 239.255, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "50", "bbox": {"l": 542.03528, "t": 233.42296999999996, "r": 549.66547, "b": 239.255, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "0", "bbox": {"l": 316.04474, "t": 230.44617000000005, "r": 319.86075, "b": 236.27819999999997, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "2", "bbox": {"l": 312.62521, "t": 198.69073000000003, "r": 316.44122, "b": 204.52277000000004, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "0", "bbox": {"l": 316.43942, "t": 198.69073000000003, "r": 320.2554, "b": 204.52277000000004, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "4", "bbox": {"l": 313.14951, "t": 168.09795999999994, "r": 316.96552, "b": 173.92998999999998, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "0", "bbox": {"l": 316.96371, "t": 168.09795999999994, "r": 320.77969, "b": 173.92998999999998, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "6", "bbox": {"l": 312.92972, "t": 136.58771000000002, "r": 316.74573, "b": 142.41974000000005, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "0", "bbox": {"l": 316.74393, "t": 136.58771000000002, "r": 320.55991, "b": 142.41974000000005, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "8", "bbox": {"l": 312.48227, "t": 105.60175000000004, "r": 316.29828, "b": 111.43377999999996, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "0", "bbox": {"l": 316.29648, "t": 105.60175000000004, "r": 320.11246, "b": 111.43377999999996, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "1", "bbox": {"l": 312.48227, "t": 212.25922000000003, "r": 316.29828, "b": 218.09124999999995, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "0", "bbox": {"l": 316.29648, "t": 212.25922000000003, "r": 320.11246, "b": 218.09124999999995, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "3", "bbox": {"l": 313.07639, "t": 183.72198000000003, "r": 316.8924, "b": 189.55402000000004, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "0", "bbox": {"l": 316.89059, "t": 183.72198000000003, "r": 320.70657, "b": 189.55402000000004, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "5", "bbox": {"l": 312.76321, "t": 152.47400000000005, "r": 316.57922, "b": 158.30602999999996, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "0", "bbox": {"l": 316.57742, "t": 152.47400000000005, "r": 320.3934, "b": 158.30602999999996, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "7", "bbox": {"l": 312.19775, "t": 120.57050000000004, "r": 316.01376, "b": 126.40252999999996, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "0", "bbox": {"l": 316.01196, "t": 120.57050000000004, "r": 319.82794, "b": 126.40252999999996, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "9", "bbox": {"l": 312.8165, "t": 90.1087, "r": 316.63251, "b": 95.94073000000003, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "0", "bbox": {"l": 316.63071, "t": 90.1087, "r": 320.44669, "b": 95.94073000000003, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "0", "bbox": {"l": 532.17426, "t": 222.72729000000004, "r": 536.94427, "b": 230.01727000000005, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "10K", "bbox": {"l": 532.87952, "t": 108.26702999999986, "r": 547.61249, "b": 115.55700999999999, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "8K", "bbox": {"l": 532.7735, "t": 130.78101000000004, "r": 542.73877, "b": 138.07097999999996, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "6K", "bbox": {"l": 532.79901, "t": 153.92352000000005, "r": 542.76428, "b": 161.21349999999995, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "4K", "bbox": {"l": 532.5705, "t": 176.75800000000004, "r": 542.53577, "b": 184.04796999999996, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "2K", "bbox": {"l": 532.14551, "t": 199.6463, "r": 542.11078, "b": 206.93628, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "Figure 2:", "bbox": {"l": 308.862, "t": 267.83636, "r": 346.06238, "b": 276.74292, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "Distribution of the tables across different table", "bbox": {"l": 354.49072, "t": 267.83636, "r": 545.11511, "b": 276.74292, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "dimensions in PubTabNet + FinTabNet datasets", "bbox": {"l": 308.862, "t": 279.79132000000004, "r": 498.56989, "b": 288.6979099999999, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "balance in the previous datasets.", "bbox": {"l": 308.862, "t": 317.47336, "r": 437.27002, "b": 326.37991, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "The PubTabNet dataset contains 509k tables delivered as", "bbox": {"l": 320.81699, "t": 331.53137, "r": 545.11505, "b": 340.43793, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "annotated PNG images. The annotations consist of the table", "bbox": {"l": 308.862, "t": 343.48635999999993, "r": 545.11517, "b": 352.39291, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "structure represented in HTML format, the tokenized text", "bbox": {"l": 308.862, "t": 355.44235, "r": 545.11505, "b": 364.34890999999993, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "and its bounding boxes per table cell. Fig. 1 shows the ap-", "bbox": {"l": 308.862, "t": 367.39734, "r": 545.11505, "b": 376.30389, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "pearance style of PubTabNet. Depending on its complexity,", "bbox": {"l": 308.862, "t": 379.35233, "r": 545.11511, "b": 388.25888, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "a table is characterized as \u201csimple\u201d when it does not contain", "bbox": {"l": 308.862, "t": 391.30731, "r": 545.11511, "b": 400.21386999999993, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "row spans or column spans, otherwise it is \u201ccomplex\u201d. The", "bbox": {"l": 308.862, "t": 403.26230000000004, "r": 545.11505, "b": 412.16885, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "dataset is divided into Train and Val splits (roughly 98% and", "bbox": {"l": 308.862, "t": 415.21729, "r": 545.11511, "b": 424.12384, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "2%). The Train split consists of 54% simple and 46% com-", "bbox": {"l": 308.862, "t": 427.17328, "r": 545.11517, "b": 436.0798300000001, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "plex tables and the Val split of 51% and 49% respectively.", "bbox": {"l": 308.862, "t": 439.12827, "r": 545.11517, "b": 448.03482, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "The FinTabNet dataset contains 112k tables delivered as", "bbox": {"l": 308.862, "t": 451.08325, "r": 545.11511, "b": 459.98981000000003, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "single-page PDF documents with mixed table structures and", "bbox": {"l": 308.862, "t": 463.03824, "r": 545.11505, "b": 471.94479, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "text content. Similarly to the PubTabNet, the annotations", "bbox": {"l": 308.862, "t": 474.99323, "r": 545.11511, "b": 483.89978, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "of FinTabNet include the table structure in HTML, the to-", "bbox": {"l": 308.862, "t": 486.94922, "r": 545.11511, "b": 495.85577, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "kenized text and the bounding boxes on a table cell basis.", "bbox": {"l": 308.862, "t": 498.90421, "r": 545.11511, "b": 507.81076, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "The dataset is divided into Train, Test and Val splits (81%,", "bbox": {"l": 308.862, "t": 510.85919, "r": 545.11517, "b": 519.76575, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "9.5%, 9.5%), and each one is almost equally divided into", "bbox": {"l": 308.862, "t": 522.8141800000001, "r": 545.11517, "b": 531.72073, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "simple and complex tables (Train: 48% simple, 52% com-", "bbox": {"l": 308.862, "t": 534.76917, "r": 545.11505, "b": 543.67574, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "plex, Test: 48% simple, 52% complex, Test: 53% simple,", "bbox": {"l": 308.862, "t": 546.72418, "r": 545.11511, "b": 555.6307400000001, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "47% complex). Finally the TableBank dataset consists of", "bbox": {"l": 308.862, "t": 558.6801800000001, "r": 545.11511, "b": 567.58673, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "145k tables provided as JPEG images. The latter has anno-", "bbox": {"l": 308.862, "t": 570.63518, "r": 545.11505, "b": 579.54173, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "tations for the table structure, but only few with bounding", "bbox": {"l": 308.862, "t": 582.59018, "r": 545.11499, "b": 591.49673, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "boxes of the table cells. The entire dataset consists of sim-", "bbox": {"l": 308.862, "t": 594.54518, "r": 545.11517, "b": 603.45174, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "ple tables and it is divided into 90% Train, 3% Test and 7%", "bbox": {"l": 308.862, "t": 606.50018, "r": 545.11511, "b": 615.40674, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "Val splits.", "bbox": {"l": 308.862, "t": 618.45518, "r": 348.16446, "b": 627.36174, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "Due to the heterogeneity across the dataset formats, it", "bbox": {"l": 320.81699, "t": 632.51419, "r": 545.11487, "b": 641.42075, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "was necessary to combine all available data into one homog-", "bbox": {"l": 308.862, "t": 644.46919, "r": 545.11511, "b": 653.37575, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "enized dataset before we could train our models for practi-", "bbox": {"l": 308.862, "t": 656.42419, "r": 545.11511, "b": 665.33076, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "cal purposes. Given the size of PubTabNet, we adopted its", "bbox": {"l": 308.862, "t": 668.38019, "r": 545.11499, "b": 677.28676, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "annotation format and we extracted and converted all tables", "bbox": {"l": 308.862, "t": 680.33519, "r": 545.11505, "b": 689.24176, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "as PNG images with a resolution of 72 dpi. Additionally,", "bbox": {"l": 308.862, "t": 692.290192, "r": 545.11505, "b": 701.196762, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "we have filtered out tables with extreme sizes due to small", "bbox": {"l": 308.862, "t": 704.245193, "r": 545.11511, "b": 713.151764, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "3", "bbox": {"l": 295.121, "t": 734.133198, "r": 300.10229, "b": 743.039761, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 10, "label": "text", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 250.15102, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.8767215609550476, "cells": [{"id": 0, "text": "tag-decoder which is constrained to the table-tags.", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 250.15102, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "text", "bbox": {"l": 50.112, "t": 87.21935999999994, "r": 286.36514, "b": 275.45410000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9822595119476318, "cells": [{"id": 1, "text": "In", "bbox": {"l": 62.067001, "t": 87.21935999999994, "r": 70.365845, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "practice,", "bbox": {"l": 76.931198, "t": 87.21935999999994, "r": 110.95348000000001, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "both", "bbox": {"l": 118.54498, "t": 87.21935999999994, "r": 136.25848, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "network", "bbox": {"l": 142.82384, "t": 87.21935999999994, "r": 175.37166, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "architectures", "bbox": {"l": 181.94698, "t": 87.21935999999994, "r": 232.83594000000002, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "(IETD", "bbox": {"l": 239.41125, "t": 87.21935999999994, "r": 265.41364, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "and", "bbox": {"l": 271.979, "t": 87.21935999999994, "r": 286.36499, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "IEDD) require an implicit, custom trained object-character-", "bbox": {"l": 50.112, "t": 99.17437999999993, "r": 286.36505, "b": 108.08092999999997, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "recognition (OCR) to obtain the content of the table-cells.", "bbox": {"l": 50.112, "t": 111.13036999999997, "r": 286.36511, "b": 120.03692999999998, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "In the case of IETD, this OCR engine is implicit in the de-", "bbox": {"l": 50.112, "t": 123.08538999999996, "r": 286.36505, "b": 131.99194, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "coder similar to [24]. For the IEDD, the OCR is solely em-", "bbox": {"l": 50.112, "t": 135.04040999999995, "r": 286.36514, "b": 143.94696, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "bedded in the content-decoder. This reliance on a custom,", "bbox": {"l": 50.112, "t": 146.99541999999997, "r": 286.36511, "b": 155.90197999999998, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "implicit OCR decoder is of course problematic. OCR is a", "bbox": {"l": 50.112, "t": 158.95043999999996, "r": 286.36505, "b": 167.85699, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "well known and extremely tough problem, that often needs", "bbox": {"l": 50.112, "t": 170.90545999999995, "r": 286.36508, "b": 179.81201, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "custom training for each individual language. However, the", "bbox": {"l": 50.112, "t": 182.86145, "r": 286.36508, "b": 191.76801, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "limited availability for non-english content in the current", "bbox": {"l": 50.112, "t": 194.81646999999998, "r": 286.36511, "b": 203.72302000000002, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "datasets, makes it impractical to apply the IETD and IEDD", "bbox": {"l": 50.112, "t": 206.77148, "r": 286.36511, "b": 215.67804, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "methods on tables with other languages. Additionally, OCR", "bbox": {"l": 50.112, "t": 218.7265, "r": 286.36505, "b": 227.63306, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "can be completely omitted if the tables originate from pro-", "bbox": {"l": 50.112, "t": 230.68151999999998, "r": 286.36505, "b": 239.58807000000002, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "grammatic PDF documents with known positions of each", "bbox": {"l": 50.112, "t": 242.63653999999997, "r": 286.36511, "b": 251.54309, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "cell. The latter was the inspiration for the work of this pa-", "bbox": {"l": 50.112, "t": 254.59253, "r": 286.36508, "b": 263.49908000000005, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "per.", "bbox": {"l": 50.112, "t": 266.54755, "r": 64.776947, "b": 275.45410000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 50.111992, "t": 278.43895999999995, "r": 286.36511, "b": 490.70288, "coord_origin": "TOPLEFT"}, "confidence": 0.9878448843955994, "cells": [{"id": 23, "text": "Graph Neural networks", "bbox": {"l": 62.067001, "t": 278.43895999999995, "r": 171.56593, "b": 287.39536, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": ":", "bbox": {"l": 171.56799, "t": 278.55853, "r": 174.3376, "b": 287.46509, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "Graph Neural networks", "bbox": {"l": 185.18687, "t": 278.55853, "r": 286.35709, "b": 287.46509, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "(GNN\u2019s) take a radically different approach to table-", "bbox": {"l": 50.111992, "t": 290.51453000000004, "r": 286.36511, "b": 299.42108, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "structure extraction.", "bbox": {"l": 50.111992, "t": 302.46950999999996, "r": 131.16771, "b": 311.37607, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Note that one table cell can consti-", "bbox": {"l": 138.84888, "t": 302.46950999999996, "r": 286.36508, "b": 311.37607, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "tute out of multiple text-cells. To obtain the table-structure,", "bbox": {"l": 50.111992, "t": 314.4245, "r": 286.36505, "b": 323.33105, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "one creates an initial graph, where each of the text-cells", "bbox": {"l": 50.111992, "t": 326.37949000000003, "r": 286.36508, "b": 335.28604, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "becomes a node in the graph similar to [33, 34, 2]. Each", "bbox": {"l": 50.111992, "t": 338.33447, "r": 286.36505, "b": 347.2410300000001, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "node is then associated with en embedding vector coming", "bbox": {"l": 50.111992, "t": 350.28946, "r": 286.36505, "b": 359.19601, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "from the encoded image, its coordinates and the encoded", "bbox": {"l": 50.111992, "t": 362.24545000000006, "r": 286.36508, "b": 371.15201, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "text. Furthermore, nodes that represent adjacent text-cells", "bbox": {"l": 50.111992, "t": 374.20044, "r": 286.36508, "b": 383.10699, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "are linked. Graph Convolutional Networks (GCN\u2019s) based", "bbox": {"l": 50.111992, "t": 386.15542999999997, "r": 286.36508, "b": 395.06198, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "methods take the image as an input, but also the position of", "bbox": {"l": 50.111992, "t": 398.11041000000006, "r": 286.36508, "b": 407.01697, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "the text-cells and their content [18]. The purpose of a GCN", "bbox": {"l": 50.111992, "t": 410.0654, "r": 286.36508, "b": 418.97195, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "is to transform the input graph into a new graph, which re-", "bbox": {"l": 50.111992, "t": 422.02038999999996, "r": 286.36505, "b": 430.92694, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "places the old links with new ones.", "bbox": {"l": 50.111992, "t": 433.97638, "r": 198.2359, "b": 442.88293, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "The new links then", "bbox": {"l": 205.92703, "t": 433.97638, "r": 286.36505, "b": 442.88293, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "represent the table-structure. With this approach, one can", "bbox": {"l": 50.111992, "t": 445.93137, "r": 286.36508, "b": 454.83792000000005, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "avoid the need to build custom OCR decoders. However,", "bbox": {"l": 50.111992, "t": 457.88635, "r": 286.36505, "b": 466.79291, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "the quality of the reconstructed structure is not comparable", "bbox": {"l": 50.111992, "t": 469.84134, "r": 286.36505, "b": 478.74789, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "to the current state-of-the-art [18].", "bbox": {"l": 50.111992, "t": 481.79633, "r": 186.49998, "b": 490.70288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 50.111984, "t": 493.68875, "r": 286.36627, "b": 622.26685, "coord_origin": "TOPLEFT"}, "confidence": 0.9875094294548035, "cells": [{"id": 45, "text": "Hybrid Deep Learning-Rule-Based approach", "bbox": {"l": 62.066994, "t": 493.68875, "r": 252.88068000000004, "b": 502.64514, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": ": A pop-", "bbox": {"l": 252.88199, "t": 493.80832, "r": 286.36627, "b": 502.71487, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "ular current model for table-structure identification is the", "bbox": {"l": 50.111984, "t": 505.76331, "r": 286.36505, "b": 514.66986, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "use of a hybrid Deep Learning-Rule-Based approach similar", "bbox": {"l": 50.111984, "t": 517.71829, "r": 286.36505, "b": 526.6248499999999, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "to [27, 29]. In this approach, one first detects the position of", "bbox": {"l": 50.111984, "t": 529.67328, "r": 286.36508, "b": 538.57985, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "the table-cells with object detection (e.g. YoloVx or Mask-", "bbox": {"l": 50.111984, "t": 541.62929, "r": 286.36508, "b": 550.53584, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "RCNN), then classifies the table into different types (from", "bbox": {"l": 50.111984, "t": 553.58429, "r": 286.36511, "b": 562.4908399999999, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "its images) and finally uses different rule-sets to obtain", "bbox": {"l": 50.111984, "t": 565.5392899999999, "r": 286.36511, "b": 574.44585, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "its table-structure. Currently, this approach achieves state-", "bbox": {"l": 50.111984, "t": 577.49429, "r": 286.36502, "b": 586.40085, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "of-the-art results, but is not an end-to-end deep-learning", "bbox": {"l": 50.111984, "t": 589.4493, "r": 286.36505, "b": 598.35585, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "method. As such, new rules need to be written if different", "bbox": {"l": 50.111984, "t": 601.4043, "r": 286.36502, "b": 610.31085, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "types of tables are encountered.", "bbox": {"l": 50.111984, "t": 613.36029, "r": 175.98943, "b": 622.26685, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "section_header", "bbox": {"l": 50.111984, "t": 635.94484, "r": 105.22546, "b": 646.6925699999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9423062205314636, "cells": [{"id": 57, "text": "3.", "bbox": {"l": 50.111984, "t": 635.94484, "r": 57.82375699999999, "b": 646.6925699999999, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Datasets", "bbox": {"l": 68.106125, "t": 635.94484, "r": 105.22546, "b": 646.6925699999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 50.111984, "t": 656.42529, "r": 286.36508, "b": 713.151863, "coord_origin": "TOPLEFT"}, "confidence": 0.9862047433853149, "cells": [{"id": 59, "text": "We rely on large-scale datasets such as PubTabNet [37],", "bbox": {"l": 62.06698600000001, "t": 656.42529, "r": 286.36493, "b": 665.33186, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "FinTabNet [36], and TableBank [17] datasets to train and", "bbox": {"l": 50.111984, "t": 668.38029, "r": 286.36508, "b": 677.2868599999999, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "evaluate our models. These datasets span over various ap-", "bbox": {"l": 50.111984, "t": 680.3353, "r": 286.36502, "b": 689.24186, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "pearance styles and content.", "bbox": {"l": 50.111984, "t": 692.290298, "r": 166.24602, "b": 701.196861, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "We also introduce our own", "bbox": {"l": 173.68808, "t": 692.290298, "r": 286.36508, "b": 701.196861, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "synthetically generated SynthTabNet dataset to fix an im-", "bbox": {"l": 50.111984, "t": 704.2453, "r": 286.36505, "b": 713.151863, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "picture", "bbox": {"l": 312.10369873046875, "t": 78.44087219238281, "r": 550.38916015625, "b": 250.60989379882812, "coord_origin": "TOPLEFT"}, "confidence": 0.9746918082237244, "cells": [{"id": 65, "text": "PubTabNet + FinTabNet", "bbox": {"l": 380.79849, "t": 79.81176999999991, "r": 486.84909, "b": 88.55975000000001, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "Rows / Columns", "bbox": {"l": 396.76776, "t": 242.02697999999998, "r": 469.78748, "b": 250.77495999999996, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "0", "bbox": {"l": 320.97653, "t": 233.42296999999996, "r": 324.79254, "b": 239.255, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "20", "bbox": {"l": 410.483, "t": 233.42296999999996, "r": 418.11319, "b": 239.255, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "40", "bbox": {"l": 500.84949, "t": 233.42296999999996, "r": 508.47968000000003, "b": 239.255, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "10", "bbox": {"l": 365.29999, "t": 233.42296999999996, "r": 372.93018, "b": 239.255, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "30", "bbox": {"l": 455.66626, "t": 233.42296999999996, "r": 463.29645, "b": 239.255, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "50", "bbox": {"l": 542.03528, "t": 233.42296999999996, "r": 549.66547, "b": 239.255, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "0", "bbox": {"l": 316.04474, "t": 230.44617000000005, "r": 319.86075, "b": 236.27819999999997, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "2", "bbox": {"l": 312.62521, "t": 198.69073000000003, "r": 316.44122, "b": 204.52277000000004, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "0", "bbox": {"l": 316.43942, "t": 198.69073000000003, "r": 320.2554, "b": 204.52277000000004, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "4", "bbox": {"l": 313.14951, "t": 168.09795999999994, "r": 316.96552, "b": 173.92998999999998, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "0", "bbox": {"l": 316.96371, "t": 168.09795999999994, "r": 320.77969, "b": 173.92998999999998, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "6", "bbox": {"l": 312.92972, "t": 136.58771000000002, "r": 316.74573, "b": 142.41974000000005, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "0", "bbox": {"l": 316.74393, "t": 136.58771000000002, "r": 320.55991, "b": 142.41974000000005, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "8", "bbox": {"l": 312.48227, "t": 105.60175000000004, "r": 316.29828, "b": 111.43377999999996, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "0", "bbox": {"l": 316.29648, "t": 105.60175000000004, "r": 320.11246, "b": 111.43377999999996, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "1", "bbox": {"l": 312.48227, "t": 212.25922000000003, "r": 316.29828, "b": 218.09124999999995, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "0", "bbox": {"l": 316.29648, "t": 212.25922000000003, "r": 320.11246, "b": 218.09124999999995, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "3", "bbox": {"l": 313.07639, "t": 183.72198000000003, "r": 316.8924, "b": 189.55402000000004, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "0", "bbox": {"l": 316.89059, "t": 183.72198000000003, "r": 320.70657, "b": 189.55402000000004, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "5", "bbox": {"l": 312.76321, "t": 152.47400000000005, "r": 316.57922, "b": 158.30602999999996, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "0", "bbox": {"l": 316.57742, "t": 152.47400000000005, "r": 320.3934, "b": 158.30602999999996, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "7", "bbox": {"l": 312.19775, "t": 120.57050000000004, "r": 316.01376, "b": 126.40252999999996, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "0", "bbox": {"l": 316.01196, "t": 120.57050000000004, "r": 319.82794, "b": 126.40252999999996, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "9", "bbox": {"l": 312.8165, "t": 90.1087, "r": 316.63251, "b": 95.94073000000003, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "0", "bbox": {"l": 316.63071, "t": 90.1087, "r": 320.44669, "b": 95.94073000000003, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "0", "bbox": {"l": 532.17426, "t": 222.72729000000004, "r": 536.94427, "b": 230.01727000000005, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "10K", "bbox": {"l": 532.87952, "t": 108.26702999999986, "r": 547.61249, "b": 115.55700999999999, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "8K", "bbox": {"l": 532.7735, "t": 130.78101000000004, "r": 542.73877, "b": 138.07097999999996, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "6K", "bbox": {"l": 532.79901, "t": 153.92352000000005, "r": 542.76428, "b": 161.21349999999995, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "4K", "bbox": {"l": 532.5705, "t": 176.75800000000004, "r": 542.53577, "b": 184.04796999999996, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "2K", "bbox": {"l": 532.14551, "t": 199.6463, "r": 542.11078, "b": 206.93628, "coord_origin": "TOPLEFT"}}], "children": [{"id": 12, "label": "section_header", "bbox": {"l": 380.79849, "t": 79.81176999999991, "r": 486.84909, "b": 88.55975000000001, "coord_origin": "TOPLEFT"}, "confidence": 0.5687219500541687, "cells": [{"id": 65, "text": "PubTabNet + FinTabNet", "bbox": {"l": 380.79849, "t": 79.81176999999991, "r": 486.84909, "b": 88.55975000000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 396.76776, "t": 242.02697999999998, "r": 469.78748, "b": 250.77495999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "Rows / Columns", "bbox": {"l": 396.76776, "t": 242.02697999999998, "r": 469.78748, "b": 250.77495999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 320.97653, "t": 233.42296999999996, "r": 324.79254, "b": 239.255, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "0", "bbox": {"l": 320.97653, "t": 233.42296999999996, "r": 324.79254, "b": 239.255, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 410.483, "t": 233.42296999999996, "r": 418.11319, "b": 239.255, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "20", "bbox": {"l": 410.483, "t": 233.42296999999996, "r": 418.11319, "b": 239.255, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 500.84949, "t": 233.42296999999996, "r": 508.47968000000003, "b": 239.255, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "40", "bbox": {"l": 500.84949, "t": 233.42296999999996, "r": 508.47968000000003, "b": 239.255, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 365.29999, "t": 233.42296999999996, "r": 372.93018, "b": 239.255, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "10", "bbox": {"l": 365.29999, "t": 233.42296999999996, "r": 372.93018, "b": 239.255, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 455.66626, "t": 233.42296999999996, "r": 463.29645, "b": 239.255, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "30", "bbox": {"l": 455.66626, "t": 233.42296999999996, "r": 463.29645, "b": 239.255, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 542.03528, "t": 233.42296999999996, "r": 549.66547, "b": 239.255, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "50", "bbox": {"l": 542.03528, "t": 233.42296999999996, "r": 549.66547, "b": 239.255, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 316.04474, "t": 230.44617000000005, "r": 319.86075, "b": 236.27819999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "0", "bbox": {"l": 316.04474, "t": 230.44617000000005, "r": 319.86075, "b": 236.27819999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 312.62521, "t": 198.69073000000003, "r": 316.44122, "b": 204.52277000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "2", "bbox": {"l": 312.62521, "t": 198.69073000000003, "r": 316.44122, "b": 204.52277000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 316.43942, "t": 198.69073000000003, "r": 320.2554, "b": 204.52277000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "0", "bbox": {"l": 316.43942, "t": 198.69073000000003, "r": 320.2554, "b": 204.52277000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 313.14951, "t": 168.09795999999994, "r": 316.96552, "b": 173.92998999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "4", "bbox": {"l": 313.14951, "t": 168.09795999999994, "r": 316.96552, "b": 173.92998999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 316.96371, "t": 168.09795999999994, "r": 320.77969, "b": 173.92998999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "0", "bbox": {"l": 316.96371, "t": 168.09795999999994, "r": 320.77969, "b": 173.92998999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 312.92972, "t": 136.58771000000002, "r": 316.74573, "b": 142.41974000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "6", "bbox": {"l": 312.92972, "t": 136.58771000000002, "r": 316.74573, "b": 142.41974000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 316.74393, "t": 136.58771000000002, "r": 320.55991, "b": 142.41974000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "0", "bbox": {"l": 316.74393, "t": 136.58771000000002, "r": 320.55991, "b": 142.41974000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 312.48227, "t": 105.60175000000004, "r": 316.29828, "b": 111.43377999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "8", "bbox": {"l": 312.48227, "t": 105.60175000000004, "r": 316.29828, "b": 111.43377999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 316.29648, "t": 105.60175000000004, "r": 320.11246, "b": 111.43377999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "0", "bbox": {"l": 316.29648, "t": 105.60175000000004, "r": 320.11246, "b": 111.43377999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 312.48227, "t": 212.25922000000003, "r": 316.29828, "b": 218.09124999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "1", "bbox": {"l": 312.48227, "t": 212.25922000000003, "r": 316.29828, "b": 218.09124999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 316.29648, "t": 212.25922000000003, "r": 320.11246, "b": 218.09124999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "0", "bbox": {"l": 316.29648, "t": 212.25922000000003, "r": 320.11246, "b": 218.09124999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 313.07639, "t": 183.72198000000003, "r": 316.8924, "b": 189.55402000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "3", "bbox": {"l": 313.07639, "t": 183.72198000000003, "r": 316.8924, "b": 189.55402000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 316.89059, "t": 183.72198000000003, "r": 320.70657, "b": 189.55402000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "0", "bbox": {"l": 316.89059, "t": 183.72198000000003, "r": 320.70657, "b": 189.55402000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 312.76321, "t": 152.47400000000005, "r": 316.57922, "b": 158.30602999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "5", "bbox": {"l": 312.76321, "t": 152.47400000000005, "r": 316.57922, "b": 158.30602999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 316.57742, "t": 152.47400000000005, "r": 320.3934, "b": 158.30602999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "0", "bbox": {"l": 316.57742, "t": 152.47400000000005, "r": 320.3934, "b": 158.30602999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 312.19775, "t": 120.57050000000004, "r": 316.01376, "b": 126.40252999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "7", "bbox": {"l": 312.19775, "t": 120.57050000000004, "r": 316.01376, "b": 126.40252999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 316.01196, "t": 120.57050000000004, "r": 319.82794, "b": 126.40252999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "0", "bbox": {"l": 316.01196, "t": 120.57050000000004, "r": 319.82794, "b": 126.40252999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 312.8165, "t": 90.1087, "r": 316.63251, "b": 95.94073000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "9", "bbox": {"l": 312.8165, "t": 90.1087, "r": 316.63251, "b": 95.94073000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 316.63071, "t": 90.1087, "r": 320.44669, "b": 95.94073000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "0", "bbox": {"l": 316.63071, "t": 90.1087, "r": 320.44669, "b": 95.94073000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 532.17426, "t": 222.72729000000004, "r": 536.94427, "b": 230.01727000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "0", "bbox": {"l": 532.17426, "t": 222.72729000000004, "r": 536.94427, "b": 230.01727000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 532.87952, "t": 108.26702999999986, "r": 547.61249, "b": 115.55700999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "10K", "bbox": {"l": 532.87952, "t": 108.26702999999986, "r": 547.61249, "b": 115.55700999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 532.7735, "t": 130.78101000000004, "r": 542.73877, "b": 138.07097999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "8K", "bbox": {"l": 532.7735, "t": 130.78101000000004, "r": 542.73877, "b": 138.07097999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 532.79901, "t": 153.92352000000005, "r": 542.76428, "b": 161.21349999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "6K", "bbox": {"l": 532.79901, "t": 153.92352000000005, "r": 542.76428, "b": 161.21349999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 532.5705, "t": 176.75800000000004, "r": 542.53577, "b": 184.04796999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "4K", "bbox": {"l": 532.5705, "t": 176.75800000000004, "r": 542.53577, "b": 184.04796999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 532.14551, "t": 199.6463, "r": 542.11078, "b": 206.93628, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "2K", "bbox": {"l": 532.14551, "t": 199.6463, "r": 542.11078, "b": 206.93628, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 7, "label": "caption", "bbox": {"l": 308.862, "t": 267.83636, "r": 545.11511, "b": 288.6979099999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9667503833770752, "cells": [{"id": 98, "text": "Figure 2:", "bbox": {"l": 308.862, "t": 267.83636, "r": 346.06238, "b": 276.74292, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "Distribution of the tables across different table", "bbox": {"l": 354.49072, "t": 267.83636, "r": 545.11511, "b": 276.74292, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "dimensions in PubTabNet + FinTabNet datasets", "bbox": {"l": 308.862, "t": 279.79132000000004, "r": 498.56989, "b": 288.6979099999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 308.862, "t": 317.47336, "r": 437.27002, "b": 326.37991, "coord_origin": "TOPLEFT"}, "confidence": 0.8879812359809875, "cells": [{"id": 101, "text": "balance in the previous datasets.", "bbox": {"l": 308.862, "t": 317.47336, "r": 437.27002, "b": 326.37991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 308.862, "t": 331.53137, "r": 545.11517, "b": 627.36174, "coord_origin": "TOPLEFT"}, "confidence": 0.9870319366455078, "cells": [{"id": 102, "text": "The PubTabNet dataset contains 509k tables delivered as", "bbox": {"l": 320.81699, "t": 331.53137, "r": 545.11505, "b": 340.43793, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "annotated PNG images. The annotations consist of the table", "bbox": {"l": 308.862, "t": 343.48635999999993, "r": 545.11517, "b": 352.39291, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "structure represented in HTML format, the tokenized text", "bbox": {"l": 308.862, "t": 355.44235, "r": 545.11505, "b": 364.34890999999993, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "and its bounding boxes per table cell. Fig. 1 shows the ap-", "bbox": {"l": 308.862, "t": 367.39734, "r": 545.11505, "b": 376.30389, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "pearance style of PubTabNet. Depending on its complexity,", "bbox": {"l": 308.862, "t": 379.35233, "r": 545.11511, "b": 388.25888, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "a table is characterized as \u201csimple\u201d when it does not contain", "bbox": {"l": 308.862, "t": 391.30731, "r": 545.11511, "b": 400.21386999999993, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "row spans or column spans, otherwise it is \u201ccomplex\u201d. The", "bbox": {"l": 308.862, "t": 403.26230000000004, "r": 545.11505, "b": 412.16885, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "dataset is divided into Train and Val splits (roughly 98% and", "bbox": {"l": 308.862, "t": 415.21729, "r": 545.11511, "b": 424.12384, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "2%). The Train split consists of 54% simple and 46% com-", "bbox": {"l": 308.862, "t": 427.17328, "r": 545.11517, "b": 436.0798300000001, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "plex tables and the Val split of 51% and 49% respectively.", "bbox": {"l": 308.862, "t": 439.12827, "r": 545.11517, "b": 448.03482, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "The FinTabNet dataset contains 112k tables delivered as", "bbox": {"l": 308.862, "t": 451.08325, "r": 545.11511, "b": 459.98981000000003, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "single-page PDF documents with mixed table structures and", "bbox": {"l": 308.862, "t": 463.03824, "r": 545.11505, "b": 471.94479, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "text content. Similarly to the PubTabNet, the annotations", "bbox": {"l": 308.862, "t": 474.99323, "r": 545.11511, "b": 483.89978, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "of FinTabNet include the table structure in HTML, the to-", "bbox": {"l": 308.862, "t": 486.94922, "r": 545.11511, "b": 495.85577, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "kenized text and the bounding boxes on a table cell basis.", "bbox": {"l": 308.862, "t": 498.90421, "r": 545.11511, "b": 507.81076, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "The dataset is divided into Train, Test and Val splits (81%,", "bbox": {"l": 308.862, "t": 510.85919, "r": 545.11517, "b": 519.76575, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "9.5%, 9.5%), and each one is almost equally divided into", "bbox": {"l": 308.862, "t": 522.8141800000001, "r": 545.11517, "b": 531.72073, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "simple and complex tables (Train: 48% simple, 52% com-", "bbox": {"l": 308.862, "t": 534.76917, "r": 545.11505, "b": 543.67574, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "plex, Test: 48% simple, 52% complex, Test: 53% simple,", "bbox": {"l": 308.862, "t": 546.72418, "r": 545.11511, "b": 555.6307400000001, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "47% complex). Finally the TableBank dataset consists of", "bbox": {"l": 308.862, "t": 558.6801800000001, "r": 545.11511, "b": 567.58673, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "145k tables provided as JPEG images. The latter has anno-", "bbox": {"l": 308.862, "t": 570.63518, "r": 545.11505, "b": 579.54173, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "tations for the table structure, but only few with bounding", "bbox": {"l": 308.862, "t": 582.59018, "r": 545.11499, "b": 591.49673, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "boxes of the table cells. The entire dataset consists of sim-", "bbox": {"l": 308.862, "t": 594.54518, "r": 545.11517, "b": 603.45174, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "ple tables and it is divided into 90% Train, 3% Test and 7%", "bbox": {"l": 308.862, "t": 606.50018, "r": 545.11511, "b": 615.40674, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "Val splits.", "bbox": {"l": 308.862, "t": 618.45518, "r": 348.16446, "b": 627.36174, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "text", "bbox": {"l": 308.862, "t": 632.51419, "r": 545.11511, "b": 713.151764, "coord_origin": "TOPLEFT"}, "confidence": 0.9840090274810791, "cells": [{"id": 127, "text": "Due to the heterogeneity across the dataset formats, it", "bbox": {"l": 320.81699, "t": 632.51419, "r": 545.11487, "b": 641.42075, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "was necessary to combine all available data into one homog-", "bbox": {"l": 308.862, "t": 644.46919, "r": 545.11511, "b": 653.37575, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "enized dataset before we could train our models for practi-", "bbox": {"l": 308.862, "t": 656.42419, "r": 545.11511, "b": 665.33076, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "cal purposes. Given the size of PubTabNet, we adopted its", "bbox": {"l": 308.862, "t": 668.38019, "r": 545.11499, "b": 677.28676, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "annotation format and we extracted and converted all tables", "bbox": {"l": 308.862, "t": 680.33519, "r": 545.11505, "b": 689.24176, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "as PNG images with a resolution of 72 dpi. Additionally,", "bbox": {"l": 308.862, "t": 692.290192, "r": 545.11505, "b": 701.196762, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "we have filtered out tables with extreme sizes due to small", "bbox": {"l": 308.862, "t": 704.245193, "r": 545.11511, "b": 713.151764, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "page_footer", "bbox": {"l": 295.121, "t": 734.133198, "r": 300.10229, "b": 743.039761, "coord_origin": "TOPLEFT"}, "confidence": 0.87156081199646, "cells": [{"id": 134, "text": "3", "bbox": {"l": 295.121, "t": 734.133198, "r": 300.10229, "b": 743.039761, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "text", "id": 10, "page_no": 2, "cluster": {"id": 10, "label": "text", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 250.15102, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.8767215609550476, "cells": [{"id": 0, "text": "tag-decoder which is constrained to the table-tags.", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 250.15102, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "tag-decoder which is constrained to the table-tags."}, {"label": "text", "id": 5, "page_no": 2, "cluster": {"id": 5, "label": "text", "bbox": {"l": 50.112, "t": 87.21935999999994, "r": 286.36514, "b": 275.45410000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9822595119476318, "cells": [{"id": 1, "text": "In", "bbox": {"l": 62.067001, "t": 87.21935999999994, "r": 70.365845, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "practice,", "bbox": {"l": 76.931198, "t": 87.21935999999994, "r": 110.95348000000001, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "both", "bbox": {"l": 118.54498, "t": 87.21935999999994, "r": 136.25848, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "network", "bbox": {"l": 142.82384, "t": 87.21935999999994, "r": 175.37166, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "architectures", "bbox": {"l": 181.94698, "t": 87.21935999999994, "r": 232.83594000000002, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "(IETD", "bbox": {"l": 239.41125, "t": 87.21935999999994, "r": 265.41364, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "and", "bbox": {"l": 271.979, "t": 87.21935999999994, "r": 286.36499, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "IEDD) require an implicit, custom trained object-character-", "bbox": {"l": 50.112, "t": 99.17437999999993, "r": 286.36505, "b": 108.08092999999997, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "recognition (OCR) to obtain the content of the table-cells.", "bbox": {"l": 50.112, "t": 111.13036999999997, "r": 286.36511, "b": 120.03692999999998, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "In the case of IETD, this OCR engine is implicit in the de-", "bbox": {"l": 50.112, "t": 123.08538999999996, "r": 286.36505, "b": 131.99194, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "coder similar to [24]. For the IEDD, the OCR is solely em-", "bbox": {"l": 50.112, "t": 135.04040999999995, "r": 286.36514, "b": 143.94696, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "bedded in the content-decoder. This reliance on a custom,", "bbox": {"l": 50.112, "t": 146.99541999999997, "r": 286.36511, "b": 155.90197999999998, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "implicit OCR decoder is of course problematic. OCR is a", "bbox": {"l": 50.112, "t": 158.95043999999996, "r": 286.36505, "b": 167.85699, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "well known and extremely tough problem, that often needs", "bbox": {"l": 50.112, "t": 170.90545999999995, "r": 286.36508, "b": 179.81201, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "custom training for each individual language. However, the", "bbox": {"l": 50.112, "t": 182.86145, "r": 286.36508, "b": 191.76801, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "limited availability for non-english content in the current", "bbox": {"l": 50.112, "t": 194.81646999999998, "r": 286.36511, "b": 203.72302000000002, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "datasets, makes it impractical to apply the IETD and IEDD", "bbox": {"l": 50.112, "t": 206.77148, "r": 286.36511, "b": 215.67804, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "methods on tables with other languages. Additionally, OCR", "bbox": {"l": 50.112, "t": 218.7265, "r": 286.36505, "b": 227.63306, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "can be completely omitted if the tables originate from pro-", "bbox": {"l": 50.112, "t": 230.68151999999998, "r": 286.36505, "b": 239.58807000000002, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "grammatic PDF documents with known positions of each", "bbox": {"l": 50.112, "t": 242.63653999999997, "r": 286.36511, "b": 251.54309, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "cell. The latter was the inspiration for the work of this pa-", "bbox": {"l": 50.112, "t": 254.59253, "r": 286.36508, "b": 263.49908000000005, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "per.", "bbox": {"l": 50.112, "t": 266.54755, "r": 64.776947, "b": 275.45410000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In practice, both network architectures (IETD and IEDD) require an implicit, custom trained object-characterrecognition (OCR) to obtain the content of the table-cells. In the case of IETD, this OCR engine is implicit in the decoder similar to [24]. For the IEDD, the OCR is solely embedded in the content-decoder. This reliance on a custom, implicit OCR decoder is of course problematic. OCR is a well known and extremely tough problem, that often needs custom training for each individual language. However, the limited availability for non-english content in the current datasets, makes it impractical to apply the IETD and IEDD methods on tables with other languages. Additionally, OCR can be completely omitted if the tables originate from programmatic PDF documents with known positions of each cell. The latter was the inspiration for the work of this paper."}, {"label": "text", "id": 0, "page_no": 2, "cluster": {"id": 0, "label": "text", "bbox": {"l": 50.111992, "t": 278.43895999999995, "r": 286.36511, "b": 490.70288, "coord_origin": "TOPLEFT"}, "confidence": 0.9878448843955994, "cells": [{"id": 23, "text": "Graph Neural networks", "bbox": {"l": 62.067001, "t": 278.43895999999995, "r": 171.56593, "b": 287.39536, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": ":", "bbox": {"l": 171.56799, "t": 278.55853, "r": 174.3376, "b": 287.46509, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "Graph Neural networks", "bbox": {"l": 185.18687, "t": 278.55853, "r": 286.35709, "b": 287.46509, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "(GNN\u2019s) take a radically different approach to table-", "bbox": {"l": 50.111992, "t": 290.51453000000004, "r": 286.36511, "b": 299.42108, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "structure extraction.", "bbox": {"l": 50.111992, "t": 302.46950999999996, "r": 131.16771, "b": 311.37607, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Note that one table cell can consti-", "bbox": {"l": 138.84888, "t": 302.46950999999996, "r": 286.36508, "b": 311.37607, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "tute out of multiple text-cells. To obtain the table-structure,", "bbox": {"l": 50.111992, "t": 314.4245, "r": 286.36505, "b": 323.33105, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "one creates an initial graph, where each of the text-cells", "bbox": {"l": 50.111992, "t": 326.37949000000003, "r": 286.36508, "b": 335.28604, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "becomes a node in the graph similar to [33, 34, 2]. Each", "bbox": {"l": 50.111992, "t": 338.33447, "r": 286.36505, "b": 347.2410300000001, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "node is then associated with en embedding vector coming", "bbox": {"l": 50.111992, "t": 350.28946, "r": 286.36505, "b": 359.19601, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "from the encoded image, its coordinates and the encoded", "bbox": {"l": 50.111992, "t": 362.24545000000006, "r": 286.36508, "b": 371.15201, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "text. Furthermore, nodes that represent adjacent text-cells", "bbox": {"l": 50.111992, "t": 374.20044, "r": 286.36508, "b": 383.10699, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "are linked. Graph Convolutional Networks (GCN\u2019s) based", "bbox": {"l": 50.111992, "t": 386.15542999999997, "r": 286.36508, "b": 395.06198, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "methods take the image as an input, but also the position of", "bbox": {"l": 50.111992, "t": 398.11041000000006, "r": 286.36508, "b": 407.01697, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "the text-cells and their content [18]. The purpose of a GCN", "bbox": {"l": 50.111992, "t": 410.0654, "r": 286.36508, "b": 418.97195, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "is to transform the input graph into a new graph, which re-", "bbox": {"l": 50.111992, "t": 422.02038999999996, "r": 286.36505, "b": 430.92694, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "places the old links with new ones.", "bbox": {"l": 50.111992, "t": 433.97638, "r": 198.2359, "b": 442.88293, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "The new links then", "bbox": {"l": 205.92703, "t": 433.97638, "r": 286.36505, "b": 442.88293, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "represent the table-structure. With this approach, one can", "bbox": {"l": 50.111992, "t": 445.93137, "r": 286.36508, "b": 454.83792000000005, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "avoid the need to build custom OCR decoders. However,", "bbox": {"l": 50.111992, "t": 457.88635, "r": 286.36505, "b": 466.79291, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "the quality of the reconstructed structure is not comparable", "bbox": {"l": 50.111992, "t": 469.84134, "r": 286.36505, "b": 478.74789, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "to the current state-of-the-art [18].", "bbox": {"l": 50.111992, "t": 481.79633, "r": 186.49998, "b": 490.70288, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Graph Neural networks : Graph Neural networks (GNN\u2019s) take a radically different approach to tablestructure extraction. Note that one table cell can constitute out of multiple text-cells. To obtain the table-structure, one creates an initial graph, where each of the text-cells becomes a node in the graph similar to [33, 34, 2]. Each node is then associated with en embedding vector coming from the encoded image, its coordinates and the encoded text. Furthermore, nodes that represent adjacent text-cells are linked. Graph Convolutional Networks (GCN\u2019s) based methods take the image as an input, but also the position of the text-cells and their content [18]. The purpose of a GCN is to transform the input graph into a new graph, which replaces the old links with new ones. The new links then represent the table-structure. With this approach, one can avoid the need to build custom OCR decoders. However, the quality of the reconstructed structure is not comparable to the current state-of-the-art [18]."}, {"label": "text", "id": 1, "page_no": 2, "cluster": {"id": 1, "label": "text", "bbox": {"l": 50.111984, "t": 493.68875, "r": 286.36627, "b": 622.26685, "coord_origin": "TOPLEFT"}, "confidence": 0.9875094294548035, "cells": [{"id": 45, "text": "Hybrid Deep Learning-Rule-Based approach", "bbox": {"l": 62.066994, "t": 493.68875, "r": 252.88068000000004, "b": 502.64514, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": ": A pop-", "bbox": {"l": 252.88199, "t": 493.80832, "r": 286.36627, "b": 502.71487, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "ular current model for table-structure identification is the", "bbox": {"l": 50.111984, "t": 505.76331, "r": 286.36505, "b": 514.66986, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "use of a hybrid Deep Learning-Rule-Based approach similar", "bbox": {"l": 50.111984, "t": 517.71829, "r": 286.36505, "b": 526.6248499999999, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "to [27, 29]. In this approach, one first detects the position of", "bbox": {"l": 50.111984, "t": 529.67328, "r": 286.36508, "b": 538.57985, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "the table-cells with object detection (e.g. YoloVx or Mask-", "bbox": {"l": 50.111984, "t": 541.62929, "r": 286.36508, "b": 550.53584, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "RCNN), then classifies the table into different types (from", "bbox": {"l": 50.111984, "t": 553.58429, "r": 286.36511, "b": 562.4908399999999, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "its images) and finally uses different rule-sets to obtain", "bbox": {"l": 50.111984, "t": 565.5392899999999, "r": 286.36511, "b": 574.44585, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "its table-structure. Currently, this approach achieves state-", "bbox": {"l": 50.111984, "t": 577.49429, "r": 286.36502, "b": 586.40085, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "of-the-art results, but is not an end-to-end deep-learning", "bbox": {"l": 50.111984, "t": 589.4493, "r": 286.36505, "b": 598.35585, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "method. As such, new rules need to be written if different", "bbox": {"l": 50.111984, "t": 601.4043, "r": 286.36502, "b": 610.31085, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "types of tables are encountered.", "bbox": {"l": 50.111984, "t": 613.36029, "r": 175.98943, "b": 622.26685, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Hybrid Deep Learning-Rule-Based approach : A popular current model for table-structure identification is the use of a hybrid Deep Learning-Rule-Based approach similar to [27, 29]. In this approach, one first detects the position of the table-cells with object detection (e.g. YoloVx or MaskRCNN), then classifies the table into different types (from its images) and finally uses different rule-sets to obtain its table-structure. Currently, this approach achieves stateof-the-art results, but is not an end-to-end deep-learning method. As such, new rules need to be written if different types of tables are encountered."}, {"label": "section_header", "id": 8, "page_no": 2, "cluster": {"id": 8, "label": "section_header", "bbox": {"l": 50.111984, "t": 635.94484, "r": 105.22546, "b": 646.6925699999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9423062205314636, "cells": [{"id": 57, "text": "3.", "bbox": {"l": 50.111984, "t": 635.94484, "r": 57.82375699999999, "b": 646.6925699999999, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Datasets", "bbox": {"l": 68.106125, "t": 635.94484, "r": 105.22546, "b": 646.6925699999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3. Datasets"}, {"label": "text", "id": 3, "page_no": 2, "cluster": {"id": 3, "label": "text", "bbox": {"l": 50.111984, "t": 656.42529, "r": 286.36508, "b": 713.151863, "coord_origin": "TOPLEFT"}, "confidence": 0.9862047433853149, "cells": [{"id": 59, "text": "We rely on large-scale datasets such as PubTabNet [37],", "bbox": {"l": 62.06698600000001, "t": 656.42529, "r": 286.36493, "b": 665.33186, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "FinTabNet [36], and TableBank [17] datasets to train and", "bbox": {"l": 50.111984, "t": 668.38029, "r": 286.36508, "b": 677.2868599999999, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "evaluate our models. These datasets span over various ap-", "bbox": {"l": 50.111984, "t": 680.3353, "r": 286.36502, "b": 689.24186, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "pearance styles and content.", "bbox": {"l": 50.111984, "t": 692.290298, "r": 166.24602, "b": 701.196861, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "We also introduce our own", "bbox": {"l": 173.68808, "t": 692.290298, "r": 286.36508, "b": 701.196861, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "synthetically generated SynthTabNet dataset to fix an im-", "bbox": {"l": 50.111984, "t": 704.2453, "r": 286.36505, "b": 713.151863, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "We rely on large-scale datasets such as PubTabNet [37], FinTabNet [36], and TableBank [17] datasets to train and evaluate our models. These datasets span over various appearance styles and content. We also introduce our own synthetically generated SynthTabNet dataset to fix an im-"}, {"label": "picture", "id": 6, "page_no": 2, "cluster": {"id": 6, "label": "picture", "bbox": {"l": 312.10369873046875, "t": 78.44087219238281, "r": 550.38916015625, "b": 250.60989379882812, "coord_origin": "TOPLEFT"}, "confidence": 0.9746918082237244, "cells": [{"id": 65, "text": "PubTabNet + FinTabNet", "bbox": {"l": 380.79849, "t": 79.81176999999991, "r": 486.84909, "b": 88.55975000000001, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "Rows / Columns", "bbox": {"l": 396.76776, "t": 242.02697999999998, "r": 469.78748, "b": 250.77495999999996, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "0", "bbox": {"l": 320.97653, "t": 233.42296999999996, "r": 324.79254, "b": 239.255, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "20", "bbox": {"l": 410.483, "t": 233.42296999999996, "r": 418.11319, "b": 239.255, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "40", "bbox": {"l": 500.84949, "t": 233.42296999999996, "r": 508.47968000000003, "b": 239.255, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "10", "bbox": {"l": 365.29999, "t": 233.42296999999996, "r": 372.93018, "b": 239.255, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "30", "bbox": {"l": 455.66626, "t": 233.42296999999996, "r": 463.29645, "b": 239.255, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "50", "bbox": {"l": 542.03528, "t": 233.42296999999996, "r": 549.66547, "b": 239.255, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "0", "bbox": {"l": 316.04474, "t": 230.44617000000005, "r": 319.86075, "b": 236.27819999999997, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "2", "bbox": {"l": 312.62521, "t": 198.69073000000003, "r": 316.44122, "b": 204.52277000000004, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "0", "bbox": {"l": 316.43942, "t": 198.69073000000003, "r": 320.2554, "b": 204.52277000000004, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "4", "bbox": {"l": 313.14951, "t": 168.09795999999994, "r": 316.96552, "b": 173.92998999999998, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "0", "bbox": {"l": 316.96371, "t": 168.09795999999994, "r": 320.77969, "b": 173.92998999999998, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "6", "bbox": {"l": 312.92972, "t": 136.58771000000002, "r": 316.74573, "b": 142.41974000000005, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "0", "bbox": {"l": 316.74393, "t": 136.58771000000002, "r": 320.55991, "b": 142.41974000000005, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "8", "bbox": {"l": 312.48227, "t": 105.60175000000004, "r": 316.29828, "b": 111.43377999999996, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "0", "bbox": {"l": 316.29648, "t": 105.60175000000004, "r": 320.11246, "b": 111.43377999999996, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "1", "bbox": {"l": 312.48227, "t": 212.25922000000003, "r": 316.29828, "b": 218.09124999999995, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "0", "bbox": {"l": 316.29648, "t": 212.25922000000003, "r": 320.11246, "b": 218.09124999999995, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "3", "bbox": {"l": 313.07639, "t": 183.72198000000003, "r": 316.8924, "b": 189.55402000000004, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "0", "bbox": {"l": 316.89059, "t": 183.72198000000003, "r": 320.70657, "b": 189.55402000000004, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "5", "bbox": {"l": 312.76321, "t": 152.47400000000005, "r": 316.57922, "b": 158.30602999999996, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "0", "bbox": {"l": 316.57742, "t": 152.47400000000005, "r": 320.3934, "b": 158.30602999999996, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "7", "bbox": {"l": 312.19775, "t": 120.57050000000004, "r": 316.01376, "b": 126.40252999999996, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "0", "bbox": {"l": 316.01196, "t": 120.57050000000004, "r": 319.82794, "b": 126.40252999999996, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "9", "bbox": {"l": 312.8165, "t": 90.1087, "r": 316.63251, "b": 95.94073000000003, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "0", "bbox": {"l": 316.63071, "t": 90.1087, "r": 320.44669, "b": 95.94073000000003, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "0", "bbox": {"l": 532.17426, "t": 222.72729000000004, "r": 536.94427, "b": 230.01727000000005, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "10K", "bbox": {"l": 532.87952, "t": 108.26702999999986, "r": 547.61249, "b": 115.55700999999999, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "8K", "bbox": {"l": 532.7735, "t": 130.78101000000004, "r": 542.73877, "b": 138.07097999999996, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "6K", "bbox": {"l": 532.79901, "t": 153.92352000000005, "r": 542.76428, "b": 161.21349999999995, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "4K", "bbox": {"l": 532.5705, "t": 176.75800000000004, "r": 542.53577, "b": 184.04796999999996, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "2K", "bbox": {"l": 532.14551, "t": 199.6463, "r": 542.11078, "b": 206.93628, "coord_origin": "TOPLEFT"}}], "children": [{"id": 12, "label": "section_header", "bbox": {"l": 380.79849, "t": 79.81176999999991, "r": 486.84909, "b": 88.55975000000001, "coord_origin": "TOPLEFT"}, "confidence": 0.5687219500541687, "cells": [{"id": 65, "text": "PubTabNet + FinTabNet", "bbox": {"l": 380.79849, "t": 79.81176999999991, "r": 486.84909, "b": 88.55975000000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 396.76776, "t": 242.02697999999998, "r": 469.78748, "b": 250.77495999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "Rows / Columns", "bbox": {"l": 396.76776, "t": 242.02697999999998, "r": 469.78748, "b": 250.77495999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 320.97653, "t": 233.42296999999996, "r": 324.79254, "b": 239.255, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "0", "bbox": {"l": 320.97653, "t": 233.42296999999996, "r": 324.79254, "b": 239.255, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 410.483, "t": 233.42296999999996, "r": 418.11319, "b": 239.255, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "20", "bbox": {"l": 410.483, "t": 233.42296999999996, "r": 418.11319, "b": 239.255, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 500.84949, "t": 233.42296999999996, "r": 508.47968000000003, "b": 239.255, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "40", "bbox": {"l": 500.84949, "t": 233.42296999999996, "r": 508.47968000000003, "b": 239.255, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 365.29999, "t": 233.42296999999996, "r": 372.93018, "b": 239.255, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "10", "bbox": {"l": 365.29999, "t": 233.42296999999996, "r": 372.93018, "b": 239.255, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 455.66626, "t": 233.42296999999996, "r": 463.29645, "b": 239.255, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "30", "bbox": {"l": 455.66626, "t": 233.42296999999996, "r": 463.29645, "b": 239.255, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 542.03528, "t": 233.42296999999996, "r": 549.66547, "b": 239.255, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "50", "bbox": {"l": 542.03528, "t": 233.42296999999996, "r": 549.66547, "b": 239.255, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 316.04474, "t": 230.44617000000005, "r": 319.86075, "b": 236.27819999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "0", "bbox": {"l": 316.04474, "t": 230.44617000000005, "r": 319.86075, "b": 236.27819999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 312.62521, "t": 198.69073000000003, "r": 316.44122, "b": 204.52277000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "2", "bbox": {"l": 312.62521, "t": 198.69073000000003, "r": 316.44122, "b": 204.52277000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 316.43942, "t": 198.69073000000003, "r": 320.2554, "b": 204.52277000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "0", "bbox": {"l": 316.43942, "t": 198.69073000000003, "r": 320.2554, "b": 204.52277000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 313.14951, "t": 168.09795999999994, "r": 316.96552, "b": 173.92998999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "4", "bbox": {"l": 313.14951, "t": 168.09795999999994, "r": 316.96552, "b": 173.92998999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 316.96371, "t": 168.09795999999994, "r": 320.77969, "b": 173.92998999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "0", "bbox": {"l": 316.96371, "t": 168.09795999999994, "r": 320.77969, "b": 173.92998999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 312.92972, "t": 136.58771000000002, "r": 316.74573, "b": 142.41974000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "6", "bbox": {"l": 312.92972, "t": 136.58771000000002, "r": 316.74573, "b": 142.41974000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 316.74393, "t": 136.58771000000002, "r": 320.55991, "b": 142.41974000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "0", "bbox": {"l": 316.74393, "t": 136.58771000000002, "r": 320.55991, "b": 142.41974000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 312.48227, "t": 105.60175000000004, "r": 316.29828, "b": 111.43377999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "8", "bbox": {"l": 312.48227, "t": 105.60175000000004, "r": 316.29828, "b": 111.43377999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 316.29648, "t": 105.60175000000004, "r": 320.11246, "b": 111.43377999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "0", "bbox": {"l": 316.29648, "t": 105.60175000000004, "r": 320.11246, "b": 111.43377999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 312.48227, "t": 212.25922000000003, "r": 316.29828, "b": 218.09124999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "1", "bbox": {"l": 312.48227, "t": 212.25922000000003, "r": 316.29828, "b": 218.09124999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 316.29648, "t": 212.25922000000003, "r": 320.11246, "b": 218.09124999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "0", "bbox": {"l": 316.29648, "t": 212.25922000000003, "r": 320.11246, "b": 218.09124999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 313.07639, "t": 183.72198000000003, "r": 316.8924, "b": 189.55402000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "3", "bbox": {"l": 313.07639, "t": 183.72198000000003, "r": 316.8924, "b": 189.55402000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 316.89059, "t": 183.72198000000003, "r": 320.70657, "b": 189.55402000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "0", "bbox": {"l": 316.89059, "t": 183.72198000000003, "r": 320.70657, "b": 189.55402000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 312.76321, "t": 152.47400000000005, "r": 316.57922, "b": 158.30602999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "5", "bbox": {"l": 312.76321, "t": 152.47400000000005, "r": 316.57922, "b": 158.30602999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 316.57742, "t": 152.47400000000005, "r": 320.3934, "b": 158.30602999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "0", "bbox": {"l": 316.57742, "t": 152.47400000000005, "r": 320.3934, "b": 158.30602999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 312.19775, "t": 120.57050000000004, "r": 316.01376, "b": 126.40252999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "7", "bbox": {"l": 312.19775, "t": 120.57050000000004, "r": 316.01376, "b": 126.40252999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 316.01196, "t": 120.57050000000004, "r": 319.82794, "b": 126.40252999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "0", "bbox": {"l": 316.01196, "t": 120.57050000000004, "r": 319.82794, "b": 126.40252999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 312.8165, "t": 90.1087, "r": 316.63251, "b": 95.94073000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "9", "bbox": {"l": 312.8165, "t": 90.1087, "r": 316.63251, "b": 95.94073000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 316.63071, "t": 90.1087, "r": 320.44669, "b": 95.94073000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "0", "bbox": {"l": 316.63071, "t": 90.1087, "r": 320.44669, "b": 95.94073000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 532.17426, "t": 222.72729000000004, "r": 536.94427, "b": 230.01727000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "0", "bbox": {"l": 532.17426, "t": 222.72729000000004, "r": 536.94427, "b": 230.01727000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 532.87952, "t": 108.26702999999986, "r": 547.61249, "b": 115.55700999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "10K", "bbox": {"l": 532.87952, "t": 108.26702999999986, "r": 547.61249, "b": 115.55700999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 532.7735, "t": 130.78101000000004, "r": 542.73877, "b": 138.07097999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "8K", "bbox": {"l": 532.7735, "t": 130.78101000000004, "r": 542.73877, "b": 138.07097999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 532.79901, "t": 153.92352000000005, "r": 542.76428, "b": 161.21349999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "6K", "bbox": {"l": 532.79901, "t": 153.92352000000005, "r": 542.76428, "b": 161.21349999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 532.5705, "t": 176.75800000000004, "r": 542.53577, "b": 184.04796999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "4K", "bbox": {"l": 532.5705, "t": 176.75800000000004, "r": 542.53577, "b": 184.04796999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 532.14551, "t": 199.6463, "r": 542.11078, "b": 206.93628, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "2K", "bbox": {"l": 532.14551, "t": 199.6463, "r": 542.11078, "b": 206.93628, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "caption", "id": 7, "page_no": 2, "cluster": {"id": 7, "label": "caption", "bbox": {"l": 308.862, "t": 267.83636, "r": 545.11511, "b": 288.6979099999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9667503833770752, "cells": [{"id": 98, "text": "Figure 2:", "bbox": {"l": 308.862, "t": 267.83636, "r": 346.06238, "b": 276.74292, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "Distribution of the tables across different table", "bbox": {"l": 354.49072, "t": 267.83636, "r": 545.11511, "b": 276.74292, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "dimensions in PubTabNet + FinTabNet datasets", "bbox": {"l": 308.862, "t": 279.79132000000004, "r": 498.56989, "b": 288.6979099999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 2: Distribution of the tables across different table dimensions in PubTabNet + FinTabNet datasets"}, {"label": "text", "id": 9, "page_no": 2, "cluster": {"id": 9, "label": "text", "bbox": {"l": 308.862, "t": 317.47336, "r": 437.27002, "b": 326.37991, "coord_origin": "TOPLEFT"}, "confidence": 0.8879812359809875, "cells": [{"id": 101, "text": "balance in the previous datasets.", "bbox": {"l": 308.862, "t": 317.47336, "r": 437.27002, "b": 326.37991, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "balance in the previous datasets."}, {"label": "text", "id": 2, "page_no": 2, "cluster": {"id": 2, "label": "text", "bbox": {"l": 308.862, "t": 331.53137, "r": 545.11517, "b": 627.36174, "coord_origin": "TOPLEFT"}, "confidence": 0.9870319366455078, "cells": [{"id": 102, "text": "The PubTabNet dataset contains 509k tables delivered as", "bbox": {"l": 320.81699, "t": 331.53137, "r": 545.11505, "b": 340.43793, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "annotated PNG images. The annotations consist of the table", "bbox": {"l": 308.862, "t": 343.48635999999993, "r": 545.11517, "b": 352.39291, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "structure represented in HTML format, the tokenized text", "bbox": {"l": 308.862, "t": 355.44235, "r": 545.11505, "b": 364.34890999999993, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "and its bounding boxes per table cell. Fig. 1 shows the ap-", "bbox": {"l": 308.862, "t": 367.39734, "r": 545.11505, "b": 376.30389, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "pearance style of PubTabNet. Depending on its complexity,", "bbox": {"l": 308.862, "t": 379.35233, "r": 545.11511, "b": 388.25888, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "a table is characterized as \u201csimple\u201d when it does not contain", "bbox": {"l": 308.862, "t": 391.30731, "r": 545.11511, "b": 400.21386999999993, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "row spans or column spans, otherwise it is \u201ccomplex\u201d. The", "bbox": {"l": 308.862, "t": 403.26230000000004, "r": 545.11505, "b": 412.16885, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "dataset is divided into Train and Val splits (roughly 98% and", "bbox": {"l": 308.862, "t": 415.21729, "r": 545.11511, "b": 424.12384, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "2%). The Train split consists of 54% simple and 46% com-", "bbox": {"l": 308.862, "t": 427.17328, "r": 545.11517, "b": 436.0798300000001, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "plex tables and the Val split of 51% and 49% respectively.", "bbox": {"l": 308.862, "t": 439.12827, "r": 545.11517, "b": 448.03482, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "The FinTabNet dataset contains 112k tables delivered as", "bbox": {"l": 308.862, "t": 451.08325, "r": 545.11511, "b": 459.98981000000003, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "single-page PDF documents with mixed table structures and", "bbox": {"l": 308.862, "t": 463.03824, "r": 545.11505, "b": 471.94479, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "text content. Similarly to the PubTabNet, the annotations", "bbox": {"l": 308.862, "t": 474.99323, "r": 545.11511, "b": 483.89978, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "of FinTabNet include the table structure in HTML, the to-", "bbox": {"l": 308.862, "t": 486.94922, "r": 545.11511, "b": 495.85577, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "kenized text and the bounding boxes on a table cell basis.", "bbox": {"l": 308.862, "t": 498.90421, "r": 545.11511, "b": 507.81076, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "The dataset is divided into Train, Test and Val splits (81%,", "bbox": {"l": 308.862, "t": 510.85919, "r": 545.11517, "b": 519.76575, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "9.5%, 9.5%), and each one is almost equally divided into", "bbox": {"l": 308.862, "t": 522.8141800000001, "r": 545.11517, "b": 531.72073, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "simple and complex tables (Train: 48% simple, 52% com-", "bbox": {"l": 308.862, "t": 534.76917, "r": 545.11505, "b": 543.67574, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "plex, Test: 48% simple, 52% complex, Test: 53% simple,", "bbox": {"l": 308.862, "t": 546.72418, "r": 545.11511, "b": 555.6307400000001, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "47% complex). Finally the TableBank dataset consists of", "bbox": {"l": 308.862, "t": 558.6801800000001, "r": 545.11511, "b": 567.58673, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "145k tables provided as JPEG images. The latter has anno-", "bbox": {"l": 308.862, "t": 570.63518, "r": 545.11505, "b": 579.54173, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "tations for the table structure, but only few with bounding", "bbox": {"l": 308.862, "t": 582.59018, "r": 545.11499, "b": 591.49673, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "boxes of the table cells. The entire dataset consists of sim-", "bbox": {"l": 308.862, "t": 594.54518, "r": 545.11517, "b": 603.45174, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "ple tables and it is divided into 90% Train, 3% Test and 7%", "bbox": {"l": 308.862, "t": 606.50018, "r": 545.11511, "b": 615.40674, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "Val splits.", "bbox": {"l": 308.862, "t": 618.45518, "r": 348.16446, "b": 627.36174, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The PubTabNet dataset contains 509k tables delivered as annotated PNG images. The annotations consist of the table structure represented in HTML format, the tokenized text and its bounding boxes per table cell. Fig. 1 shows the appearance style of PubTabNet. Depending on its complexity, a table is characterized as \u201csimple\u201d when it does not contain row spans or column spans, otherwise it is \u201ccomplex\u201d. The dataset is divided into Train and Val splits (roughly 98% and 2%). The Train split consists of 54% simple and 46% complex tables and the Val split of 51% and 49% respectively. The FinTabNet dataset contains 112k tables delivered as single-page PDF documents with mixed table structures and text content. Similarly to the PubTabNet, the annotations of FinTabNet include the table structure in HTML, the tokenized text and the bounding boxes on a table cell basis. The dataset is divided into Train, Test and Val splits (81%, 9.5%, 9.5%), and each one is almost equally divided into simple and complex tables (Train: 48% simple, 52% complex, Test: 48% simple, 52% complex, Test: 53% simple, 47% complex). Finally the TableBank dataset consists of 145k tables provided as JPEG images. The latter has annotations for the table structure, but only few with bounding boxes of the table cells. The entire dataset consists of simple tables and it is divided into 90% Train, 3% Test and 7% Val splits."}, {"label": "text", "id": 4, "page_no": 2, "cluster": {"id": 4, "label": "text", "bbox": {"l": 308.862, "t": 632.51419, "r": 545.11511, "b": 713.151764, "coord_origin": "TOPLEFT"}, "confidence": 0.9840090274810791, "cells": [{"id": 127, "text": "Due to the heterogeneity across the dataset formats, it", "bbox": {"l": 320.81699, "t": 632.51419, "r": 545.11487, "b": 641.42075, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "was necessary to combine all available data into one homog-", "bbox": {"l": 308.862, "t": 644.46919, "r": 545.11511, "b": 653.37575, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "enized dataset before we could train our models for practi-", "bbox": {"l": 308.862, "t": 656.42419, "r": 545.11511, "b": 665.33076, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "cal purposes. Given the size of PubTabNet, we adopted its", "bbox": {"l": 308.862, "t": 668.38019, "r": 545.11499, "b": 677.28676, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "annotation format and we extracted and converted all tables", "bbox": {"l": 308.862, "t": 680.33519, "r": 545.11505, "b": 689.24176, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "as PNG images with a resolution of 72 dpi. Additionally,", "bbox": {"l": 308.862, "t": 692.290192, "r": 545.11505, "b": 701.196762, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "we have filtered out tables with extreme sizes due to small", "bbox": {"l": 308.862, "t": 704.245193, "r": 545.11511, "b": 713.151764, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Due to the heterogeneity across the dataset formats, it was necessary to combine all available data into one homogenized dataset before we could train our models for practical purposes. Given the size of PubTabNet, we adopted its annotation format and we extracted and converted all tables as PNG images with a resolution of 72 dpi. Additionally, we have filtered out tables with extreme sizes due to small"}, {"label": "page_footer", "id": 11, "page_no": 2, "cluster": {"id": 11, "label": "page_footer", "bbox": {"l": 295.121, "t": 734.133198, "r": 300.10229, "b": 743.039761, "coord_origin": "TOPLEFT"}, "confidence": 0.87156081199646, "cells": [{"id": 134, "text": "3", "bbox": {"l": 295.121, "t": 734.133198, "r": 300.10229, "b": 743.039761, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3"}], "body": [{"label": "text", "id": 10, "page_no": 2, "cluster": {"id": 10, "label": "text", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 250.15102, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.8767215609550476, "cells": [{"id": 0, "text": "tag-decoder which is constrained to the table-tags.", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 250.15102, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "tag-decoder which is constrained to the table-tags."}, {"label": "text", "id": 5, "page_no": 2, "cluster": {"id": 5, "label": "text", "bbox": {"l": 50.112, "t": 87.21935999999994, "r": 286.36514, "b": 275.45410000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9822595119476318, "cells": [{"id": 1, "text": "In", "bbox": {"l": 62.067001, "t": 87.21935999999994, "r": 70.365845, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "practice,", "bbox": {"l": 76.931198, "t": 87.21935999999994, "r": 110.95348000000001, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "both", "bbox": {"l": 118.54498, "t": 87.21935999999994, "r": 136.25848, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "network", "bbox": {"l": 142.82384, "t": 87.21935999999994, "r": 175.37166, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "architectures", "bbox": {"l": 181.94698, "t": 87.21935999999994, "r": 232.83594000000002, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "(IETD", "bbox": {"l": 239.41125, "t": 87.21935999999994, "r": 265.41364, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "and", "bbox": {"l": 271.979, "t": 87.21935999999994, "r": 286.36499, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "IEDD) require an implicit, custom trained object-character-", "bbox": {"l": 50.112, "t": 99.17437999999993, "r": 286.36505, "b": 108.08092999999997, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "recognition (OCR) to obtain the content of the table-cells.", "bbox": {"l": 50.112, "t": 111.13036999999997, "r": 286.36511, "b": 120.03692999999998, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "In the case of IETD, this OCR engine is implicit in the de-", "bbox": {"l": 50.112, "t": 123.08538999999996, "r": 286.36505, "b": 131.99194, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "coder similar to [24]. For the IEDD, the OCR is solely em-", "bbox": {"l": 50.112, "t": 135.04040999999995, "r": 286.36514, "b": 143.94696, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "bedded in the content-decoder. This reliance on a custom,", "bbox": {"l": 50.112, "t": 146.99541999999997, "r": 286.36511, "b": 155.90197999999998, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "implicit OCR decoder is of course problematic. OCR is a", "bbox": {"l": 50.112, "t": 158.95043999999996, "r": 286.36505, "b": 167.85699, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "well known and extremely tough problem, that often needs", "bbox": {"l": 50.112, "t": 170.90545999999995, "r": 286.36508, "b": 179.81201, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "custom training for each individual language. However, the", "bbox": {"l": 50.112, "t": 182.86145, "r": 286.36508, "b": 191.76801, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "limited availability for non-english content in the current", "bbox": {"l": 50.112, "t": 194.81646999999998, "r": 286.36511, "b": 203.72302000000002, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "datasets, makes it impractical to apply the IETD and IEDD", "bbox": {"l": 50.112, "t": 206.77148, "r": 286.36511, "b": 215.67804, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "methods on tables with other languages. Additionally, OCR", "bbox": {"l": 50.112, "t": 218.7265, "r": 286.36505, "b": 227.63306, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "can be completely omitted if the tables originate from pro-", "bbox": {"l": 50.112, "t": 230.68151999999998, "r": 286.36505, "b": 239.58807000000002, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "grammatic PDF documents with known positions of each", "bbox": {"l": 50.112, "t": 242.63653999999997, "r": 286.36511, "b": 251.54309, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "cell. The latter was the inspiration for the work of this pa-", "bbox": {"l": 50.112, "t": 254.59253, "r": 286.36508, "b": 263.49908000000005, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "per.", "bbox": {"l": 50.112, "t": 266.54755, "r": 64.776947, "b": 275.45410000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In practice, both network architectures (IETD and IEDD) require an implicit, custom trained object-characterrecognition (OCR) to obtain the content of the table-cells. In the case of IETD, this OCR engine is implicit in the decoder similar to [24]. For the IEDD, the OCR is solely embedded in the content-decoder. This reliance on a custom, implicit OCR decoder is of course problematic. OCR is a well known and extremely tough problem, that often needs custom training for each individual language. However, the limited availability for non-english content in the current datasets, makes it impractical to apply the IETD and IEDD methods on tables with other languages. Additionally, OCR can be completely omitted if the tables originate from programmatic PDF documents with known positions of each cell. The latter was the inspiration for the work of this paper."}, {"label": "text", "id": 0, "page_no": 2, "cluster": {"id": 0, "label": "text", "bbox": {"l": 50.111992, "t": 278.43895999999995, "r": 286.36511, "b": 490.70288, "coord_origin": "TOPLEFT"}, "confidence": 0.9878448843955994, "cells": [{"id": 23, "text": "Graph Neural networks", "bbox": {"l": 62.067001, "t": 278.43895999999995, "r": 171.56593, "b": 287.39536, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": ":", "bbox": {"l": 171.56799, "t": 278.55853, "r": 174.3376, "b": 287.46509, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "Graph Neural networks", "bbox": {"l": 185.18687, "t": 278.55853, "r": 286.35709, "b": 287.46509, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "(GNN\u2019s) take a radically different approach to table-", "bbox": {"l": 50.111992, "t": 290.51453000000004, "r": 286.36511, "b": 299.42108, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "structure extraction.", "bbox": {"l": 50.111992, "t": 302.46950999999996, "r": 131.16771, "b": 311.37607, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Note that one table cell can consti-", "bbox": {"l": 138.84888, "t": 302.46950999999996, "r": 286.36508, "b": 311.37607, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "tute out of multiple text-cells. To obtain the table-structure,", "bbox": {"l": 50.111992, "t": 314.4245, "r": 286.36505, "b": 323.33105, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "one creates an initial graph, where each of the text-cells", "bbox": {"l": 50.111992, "t": 326.37949000000003, "r": 286.36508, "b": 335.28604, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "becomes a node in the graph similar to [33, 34, 2]. Each", "bbox": {"l": 50.111992, "t": 338.33447, "r": 286.36505, "b": 347.2410300000001, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "node is then associated with en embedding vector coming", "bbox": {"l": 50.111992, "t": 350.28946, "r": 286.36505, "b": 359.19601, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "from the encoded image, its coordinates and the encoded", "bbox": {"l": 50.111992, "t": 362.24545000000006, "r": 286.36508, "b": 371.15201, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "text. Furthermore, nodes that represent adjacent text-cells", "bbox": {"l": 50.111992, "t": 374.20044, "r": 286.36508, "b": 383.10699, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "are linked. Graph Convolutional Networks (GCN\u2019s) based", "bbox": {"l": 50.111992, "t": 386.15542999999997, "r": 286.36508, "b": 395.06198, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "methods take the image as an input, but also the position of", "bbox": {"l": 50.111992, "t": 398.11041000000006, "r": 286.36508, "b": 407.01697, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "the text-cells and their content [18]. The purpose of a GCN", "bbox": {"l": 50.111992, "t": 410.0654, "r": 286.36508, "b": 418.97195, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "is to transform the input graph into a new graph, which re-", "bbox": {"l": 50.111992, "t": 422.02038999999996, "r": 286.36505, "b": 430.92694, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "places the old links with new ones.", "bbox": {"l": 50.111992, "t": 433.97638, "r": 198.2359, "b": 442.88293, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "The new links then", "bbox": {"l": 205.92703, "t": 433.97638, "r": 286.36505, "b": 442.88293, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "represent the table-structure. With this approach, one can", "bbox": {"l": 50.111992, "t": 445.93137, "r": 286.36508, "b": 454.83792000000005, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "avoid the need to build custom OCR decoders. However,", "bbox": {"l": 50.111992, "t": 457.88635, "r": 286.36505, "b": 466.79291, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "the quality of the reconstructed structure is not comparable", "bbox": {"l": 50.111992, "t": 469.84134, "r": 286.36505, "b": 478.74789, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "to the current state-of-the-art [18].", "bbox": {"l": 50.111992, "t": 481.79633, "r": 186.49998, "b": 490.70288, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Graph Neural networks : Graph Neural networks (GNN\u2019s) take a radically different approach to tablestructure extraction. Note that one table cell can constitute out of multiple text-cells. To obtain the table-structure, one creates an initial graph, where each of the text-cells becomes a node in the graph similar to [33, 34, 2]. Each node is then associated with en embedding vector coming from the encoded image, its coordinates and the encoded text. Furthermore, nodes that represent adjacent text-cells are linked. Graph Convolutional Networks (GCN\u2019s) based methods take the image as an input, but also the position of the text-cells and their content [18]. The purpose of a GCN is to transform the input graph into a new graph, which replaces the old links with new ones. The new links then represent the table-structure. With this approach, one can avoid the need to build custom OCR decoders. However, the quality of the reconstructed structure is not comparable to the current state-of-the-art [18]."}, {"label": "text", "id": 1, "page_no": 2, "cluster": {"id": 1, "label": "text", "bbox": {"l": 50.111984, "t": 493.68875, "r": 286.36627, "b": 622.26685, "coord_origin": "TOPLEFT"}, "confidence": 0.9875094294548035, "cells": [{"id": 45, "text": "Hybrid Deep Learning-Rule-Based approach", "bbox": {"l": 62.066994, "t": 493.68875, "r": 252.88068000000004, "b": 502.64514, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": ": A pop-", "bbox": {"l": 252.88199, "t": 493.80832, "r": 286.36627, "b": 502.71487, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "ular current model for table-structure identification is the", "bbox": {"l": 50.111984, "t": 505.76331, "r": 286.36505, "b": 514.66986, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "use of a hybrid Deep Learning-Rule-Based approach similar", "bbox": {"l": 50.111984, "t": 517.71829, "r": 286.36505, "b": 526.6248499999999, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "to [27, 29]. In this approach, one first detects the position of", "bbox": {"l": 50.111984, "t": 529.67328, "r": 286.36508, "b": 538.57985, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "the table-cells with object detection (e.g. YoloVx or Mask-", "bbox": {"l": 50.111984, "t": 541.62929, "r": 286.36508, "b": 550.53584, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "RCNN), then classifies the table into different types (from", "bbox": {"l": 50.111984, "t": 553.58429, "r": 286.36511, "b": 562.4908399999999, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "its images) and finally uses different rule-sets to obtain", "bbox": {"l": 50.111984, "t": 565.5392899999999, "r": 286.36511, "b": 574.44585, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "its table-structure. Currently, this approach achieves state-", "bbox": {"l": 50.111984, "t": 577.49429, "r": 286.36502, "b": 586.40085, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "of-the-art results, but is not an end-to-end deep-learning", "bbox": {"l": 50.111984, "t": 589.4493, "r": 286.36505, "b": 598.35585, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "method. As such, new rules need to be written if different", "bbox": {"l": 50.111984, "t": 601.4043, "r": 286.36502, "b": 610.31085, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "types of tables are encountered.", "bbox": {"l": 50.111984, "t": 613.36029, "r": 175.98943, "b": 622.26685, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Hybrid Deep Learning-Rule-Based approach : A popular current model for table-structure identification is the use of a hybrid Deep Learning-Rule-Based approach similar to [27, 29]. In this approach, one first detects the position of the table-cells with object detection (e.g. YoloVx or MaskRCNN), then classifies the table into different types (from its images) and finally uses different rule-sets to obtain its table-structure. Currently, this approach achieves stateof-the-art results, but is not an end-to-end deep-learning method. As such, new rules need to be written if different types of tables are encountered."}, {"label": "section_header", "id": 8, "page_no": 2, "cluster": {"id": 8, "label": "section_header", "bbox": {"l": 50.111984, "t": 635.94484, "r": 105.22546, "b": 646.6925699999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9423062205314636, "cells": [{"id": 57, "text": "3.", "bbox": {"l": 50.111984, "t": 635.94484, "r": 57.82375699999999, "b": 646.6925699999999, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Datasets", "bbox": {"l": 68.106125, "t": 635.94484, "r": 105.22546, "b": 646.6925699999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3. Datasets"}, {"label": "text", "id": 3, "page_no": 2, "cluster": {"id": 3, "label": "text", "bbox": {"l": 50.111984, "t": 656.42529, "r": 286.36508, "b": 713.151863, "coord_origin": "TOPLEFT"}, "confidence": 0.9862047433853149, "cells": [{"id": 59, "text": "We rely on large-scale datasets such as PubTabNet [37],", "bbox": {"l": 62.06698600000001, "t": 656.42529, "r": 286.36493, "b": 665.33186, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "FinTabNet [36], and TableBank [17] datasets to train and", "bbox": {"l": 50.111984, "t": 668.38029, "r": 286.36508, "b": 677.2868599999999, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "evaluate our models. These datasets span over various ap-", "bbox": {"l": 50.111984, "t": 680.3353, "r": 286.36502, "b": 689.24186, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "pearance styles and content.", "bbox": {"l": 50.111984, "t": 692.290298, "r": 166.24602, "b": 701.196861, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "We also introduce our own", "bbox": {"l": 173.68808, "t": 692.290298, "r": 286.36508, "b": 701.196861, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "synthetically generated SynthTabNet dataset to fix an im-", "bbox": {"l": 50.111984, "t": 704.2453, "r": 286.36505, "b": 713.151863, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "We rely on large-scale datasets such as PubTabNet [37], FinTabNet [36], and TableBank [17] datasets to train and evaluate our models. These datasets span over various appearance styles and content. We also introduce our own synthetically generated SynthTabNet dataset to fix an im-"}, {"label": "picture", "id": 6, "page_no": 2, "cluster": {"id": 6, "label": "picture", "bbox": {"l": 312.10369873046875, "t": 78.44087219238281, "r": 550.38916015625, "b": 250.60989379882812, "coord_origin": "TOPLEFT"}, "confidence": 0.9746918082237244, "cells": [{"id": 65, "text": "PubTabNet + FinTabNet", "bbox": {"l": 380.79849, "t": 79.81176999999991, "r": 486.84909, "b": 88.55975000000001, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "Rows / Columns", "bbox": {"l": 396.76776, "t": 242.02697999999998, "r": 469.78748, "b": 250.77495999999996, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "0", "bbox": {"l": 320.97653, "t": 233.42296999999996, "r": 324.79254, "b": 239.255, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "20", "bbox": {"l": 410.483, "t": 233.42296999999996, "r": 418.11319, "b": 239.255, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "40", "bbox": {"l": 500.84949, "t": 233.42296999999996, "r": 508.47968000000003, "b": 239.255, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "10", "bbox": {"l": 365.29999, "t": 233.42296999999996, "r": 372.93018, "b": 239.255, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "30", "bbox": {"l": 455.66626, "t": 233.42296999999996, "r": 463.29645, "b": 239.255, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "50", "bbox": {"l": 542.03528, "t": 233.42296999999996, "r": 549.66547, "b": 239.255, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "0", "bbox": {"l": 316.04474, "t": 230.44617000000005, "r": 319.86075, "b": 236.27819999999997, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "2", "bbox": {"l": 312.62521, "t": 198.69073000000003, "r": 316.44122, "b": 204.52277000000004, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "0", "bbox": {"l": 316.43942, "t": 198.69073000000003, "r": 320.2554, "b": 204.52277000000004, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "4", "bbox": {"l": 313.14951, "t": 168.09795999999994, "r": 316.96552, "b": 173.92998999999998, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "0", "bbox": {"l": 316.96371, "t": 168.09795999999994, "r": 320.77969, "b": 173.92998999999998, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "6", "bbox": {"l": 312.92972, "t": 136.58771000000002, "r": 316.74573, "b": 142.41974000000005, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "0", "bbox": {"l": 316.74393, "t": 136.58771000000002, "r": 320.55991, "b": 142.41974000000005, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "8", "bbox": {"l": 312.48227, "t": 105.60175000000004, "r": 316.29828, "b": 111.43377999999996, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "0", "bbox": {"l": 316.29648, "t": 105.60175000000004, "r": 320.11246, "b": 111.43377999999996, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "1", "bbox": {"l": 312.48227, "t": 212.25922000000003, "r": 316.29828, "b": 218.09124999999995, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "0", "bbox": {"l": 316.29648, "t": 212.25922000000003, "r": 320.11246, "b": 218.09124999999995, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "3", "bbox": {"l": 313.07639, "t": 183.72198000000003, "r": 316.8924, "b": 189.55402000000004, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "0", "bbox": {"l": 316.89059, "t": 183.72198000000003, "r": 320.70657, "b": 189.55402000000004, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "5", "bbox": {"l": 312.76321, "t": 152.47400000000005, "r": 316.57922, "b": 158.30602999999996, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "0", "bbox": {"l": 316.57742, "t": 152.47400000000005, "r": 320.3934, "b": 158.30602999999996, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "7", "bbox": {"l": 312.19775, "t": 120.57050000000004, "r": 316.01376, "b": 126.40252999999996, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "0", "bbox": {"l": 316.01196, "t": 120.57050000000004, "r": 319.82794, "b": 126.40252999999996, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "9", "bbox": {"l": 312.8165, "t": 90.1087, "r": 316.63251, "b": 95.94073000000003, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "0", "bbox": {"l": 316.63071, "t": 90.1087, "r": 320.44669, "b": 95.94073000000003, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "0", "bbox": {"l": 532.17426, "t": 222.72729000000004, "r": 536.94427, "b": 230.01727000000005, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "10K", "bbox": {"l": 532.87952, "t": 108.26702999999986, "r": 547.61249, "b": 115.55700999999999, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "8K", "bbox": {"l": 532.7735, "t": 130.78101000000004, "r": 542.73877, "b": 138.07097999999996, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "6K", "bbox": {"l": 532.79901, "t": 153.92352000000005, "r": 542.76428, "b": 161.21349999999995, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "4K", "bbox": {"l": 532.5705, "t": 176.75800000000004, "r": 542.53577, "b": 184.04796999999996, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "2K", "bbox": {"l": 532.14551, "t": 199.6463, "r": 542.11078, "b": 206.93628, "coord_origin": "TOPLEFT"}}], "children": [{"id": 12, "label": "section_header", "bbox": {"l": 380.79849, "t": 79.81176999999991, "r": 486.84909, "b": 88.55975000000001, "coord_origin": "TOPLEFT"}, "confidence": 0.5687219500541687, "cells": [{"id": 65, "text": "PubTabNet + FinTabNet", "bbox": {"l": 380.79849, "t": 79.81176999999991, "r": 486.84909, "b": 88.55975000000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 396.76776, "t": 242.02697999999998, "r": 469.78748, "b": 250.77495999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "Rows / Columns", "bbox": {"l": 396.76776, "t": 242.02697999999998, "r": 469.78748, "b": 250.77495999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 320.97653, "t": 233.42296999999996, "r": 324.79254, "b": 239.255, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "0", "bbox": {"l": 320.97653, "t": 233.42296999999996, "r": 324.79254, "b": 239.255, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 410.483, "t": 233.42296999999996, "r": 418.11319, "b": 239.255, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "20", "bbox": {"l": 410.483, "t": 233.42296999999996, "r": 418.11319, "b": 239.255, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 500.84949, "t": 233.42296999999996, "r": 508.47968000000003, "b": 239.255, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "40", "bbox": {"l": 500.84949, "t": 233.42296999999996, "r": 508.47968000000003, "b": 239.255, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 365.29999, "t": 233.42296999999996, "r": 372.93018, "b": 239.255, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "10", "bbox": {"l": 365.29999, "t": 233.42296999999996, "r": 372.93018, "b": 239.255, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 455.66626, "t": 233.42296999999996, "r": 463.29645, "b": 239.255, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "30", "bbox": {"l": 455.66626, "t": 233.42296999999996, "r": 463.29645, "b": 239.255, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 542.03528, "t": 233.42296999999996, "r": 549.66547, "b": 239.255, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "50", "bbox": {"l": 542.03528, "t": 233.42296999999996, "r": 549.66547, "b": 239.255, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 316.04474, "t": 230.44617000000005, "r": 319.86075, "b": 236.27819999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "0", "bbox": {"l": 316.04474, "t": 230.44617000000005, "r": 319.86075, "b": 236.27819999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 312.62521, "t": 198.69073000000003, "r": 316.44122, "b": 204.52277000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "2", "bbox": {"l": 312.62521, "t": 198.69073000000003, "r": 316.44122, "b": 204.52277000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 316.43942, "t": 198.69073000000003, "r": 320.2554, "b": 204.52277000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "0", "bbox": {"l": 316.43942, "t": 198.69073000000003, "r": 320.2554, "b": 204.52277000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 313.14951, "t": 168.09795999999994, "r": 316.96552, "b": 173.92998999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "4", "bbox": {"l": 313.14951, "t": 168.09795999999994, "r": 316.96552, "b": 173.92998999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 316.96371, "t": 168.09795999999994, "r": 320.77969, "b": 173.92998999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "0", "bbox": {"l": 316.96371, "t": 168.09795999999994, "r": 320.77969, "b": 173.92998999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 312.92972, "t": 136.58771000000002, "r": 316.74573, "b": 142.41974000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "6", "bbox": {"l": 312.92972, "t": 136.58771000000002, "r": 316.74573, "b": 142.41974000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 316.74393, "t": 136.58771000000002, "r": 320.55991, "b": 142.41974000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "0", "bbox": {"l": 316.74393, "t": 136.58771000000002, "r": 320.55991, "b": 142.41974000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 312.48227, "t": 105.60175000000004, "r": 316.29828, "b": 111.43377999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "8", "bbox": {"l": 312.48227, "t": 105.60175000000004, "r": 316.29828, "b": 111.43377999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 316.29648, "t": 105.60175000000004, "r": 320.11246, "b": 111.43377999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "0", "bbox": {"l": 316.29648, "t": 105.60175000000004, "r": 320.11246, "b": 111.43377999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 312.48227, "t": 212.25922000000003, "r": 316.29828, "b": 218.09124999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "1", "bbox": {"l": 312.48227, "t": 212.25922000000003, "r": 316.29828, "b": 218.09124999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 316.29648, "t": 212.25922000000003, "r": 320.11246, "b": 218.09124999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "0", "bbox": {"l": 316.29648, "t": 212.25922000000003, "r": 320.11246, "b": 218.09124999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 313.07639, "t": 183.72198000000003, "r": 316.8924, "b": 189.55402000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "3", "bbox": {"l": 313.07639, "t": 183.72198000000003, "r": 316.8924, "b": 189.55402000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 316.89059, "t": 183.72198000000003, "r": 320.70657, "b": 189.55402000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "0", "bbox": {"l": 316.89059, "t": 183.72198000000003, "r": 320.70657, "b": 189.55402000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 312.76321, "t": 152.47400000000005, "r": 316.57922, "b": 158.30602999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "5", "bbox": {"l": 312.76321, "t": 152.47400000000005, "r": 316.57922, "b": 158.30602999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 316.57742, "t": 152.47400000000005, "r": 320.3934, "b": 158.30602999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "0", "bbox": {"l": 316.57742, "t": 152.47400000000005, "r": 320.3934, "b": 158.30602999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 312.19775, "t": 120.57050000000004, "r": 316.01376, "b": 126.40252999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "7", "bbox": {"l": 312.19775, "t": 120.57050000000004, "r": 316.01376, "b": 126.40252999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 316.01196, "t": 120.57050000000004, "r": 319.82794, "b": 126.40252999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "0", "bbox": {"l": 316.01196, "t": 120.57050000000004, "r": 319.82794, "b": 126.40252999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 312.8165, "t": 90.1087, "r": 316.63251, "b": 95.94073000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "9", "bbox": {"l": 312.8165, "t": 90.1087, "r": 316.63251, "b": 95.94073000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 316.63071, "t": 90.1087, "r": 320.44669, "b": 95.94073000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "0", "bbox": {"l": 316.63071, "t": 90.1087, "r": 320.44669, "b": 95.94073000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 532.17426, "t": 222.72729000000004, "r": 536.94427, "b": 230.01727000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "0", "bbox": {"l": 532.17426, "t": 222.72729000000004, "r": 536.94427, "b": 230.01727000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 532.87952, "t": 108.26702999999986, "r": 547.61249, "b": 115.55700999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "10K", "bbox": {"l": 532.87952, "t": 108.26702999999986, "r": 547.61249, "b": 115.55700999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 532.7735, "t": 130.78101000000004, "r": 542.73877, "b": 138.07097999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "8K", "bbox": {"l": 532.7735, "t": 130.78101000000004, "r": 542.73877, "b": 138.07097999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 532.79901, "t": 153.92352000000005, "r": 542.76428, "b": 161.21349999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "6K", "bbox": {"l": 532.79901, "t": 153.92352000000005, "r": 542.76428, "b": 161.21349999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 532.5705, "t": 176.75800000000004, "r": 542.53577, "b": 184.04796999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "4K", "bbox": {"l": 532.5705, "t": 176.75800000000004, "r": 542.53577, "b": 184.04796999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 532.14551, "t": 199.6463, "r": 542.11078, "b": 206.93628, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "2K", "bbox": {"l": 532.14551, "t": 199.6463, "r": 542.11078, "b": 206.93628, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "caption", "id": 7, "page_no": 2, "cluster": {"id": 7, "label": "caption", "bbox": {"l": 308.862, "t": 267.83636, "r": 545.11511, "b": 288.6979099999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9667503833770752, "cells": [{"id": 98, "text": "Figure 2:", "bbox": {"l": 308.862, "t": 267.83636, "r": 346.06238, "b": 276.74292, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "Distribution of the tables across different table", "bbox": {"l": 354.49072, "t": 267.83636, "r": 545.11511, "b": 276.74292, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "dimensions in PubTabNet + FinTabNet datasets", "bbox": {"l": 308.862, "t": 279.79132000000004, "r": 498.56989, "b": 288.6979099999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 2: Distribution of the tables across different table dimensions in PubTabNet + FinTabNet datasets"}, {"label": "text", "id": 9, "page_no": 2, "cluster": {"id": 9, "label": "text", "bbox": {"l": 308.862, "t": 317.47336, "r": 437.27002, "b": 326.37991, "coord_origin": "TOPLEFT"}, "confidence": 0.8879812359809875, "cells": [{"id": 101, "text": "balance in the previous datasets.", "bbox": {"l": 308.862, "t": 317.47336, "r": 437.27002, "b": 326.37991, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "balance in the previous datasets."}, {"label": "text", "id": 2, "page_no": 2, "cluster": {"id": 2, "label": "text", "bbox": {"l": 308.862, "t": 331.53137, "r": 545.11517, "b": 627.36174, "coord_origin": "TOPLEFT"}, "confidence": 0.9870319366455078, "cells": [{"id": 102, "text": "The PubTabNet dataset contains 509k tables delivered as", "bbox": {"l": 320.81699, "t": 331.53137, "r": 545.11505, "b": 340.43793, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "annotated PNG images. The annotations consist of the table", "bbox": {"l": 308.862, "t": 343.48635999999993, "r": 545.11517, "b": 352.39291, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "structure represented in HTML format, the tokenized text", "bbox": {"l": 308.862, "t": 355.44235, "r": 545.11505, "b": 364.34890999999993, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "and its bounding boxes per table cell. Fig. 1 shows the ap-", "bbox": {"l": 308.862, "t": 367.39734, "r": 545.11505, "b": 376.30389, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "pearance style of PubTabNet. Depending on its complexity,", "bbox": {"l": 308.862, "t": 379.35233, "r": 545.11511, "b": 388.25888, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "a table is characterized as \u201csimple\u201d when it does not contain", "bbox": {"l": 308.862, "t": 391.30731, "r": 545.11511, "b": 400.21386999999993, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "row spans or column spans, otherwise it is \u201ccomplex\u201d. The", "bbox": {"l": 308.862, "t": 403.26230000000004, "r": 545.11505, "b": 412.16885, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "dataset is divided into Train and Val splits (roughly 98% and", "bbox": {"l": 308.862, "t": 415.21729, "r": 545.11511, "b": 424.12384, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "2%). The Train split consists of 54% simple and 46% com-", "bbox": {"l": 308.862, "t": 427.17328, "r": 545.11517, "b": 436.0798300000001, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "plex tables and the Val split of 51% and 49% respectively.", "bbox": {"l": 308.862, "t": 439.12827, "r": 545.11517, "b": 448.03482, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "The FinTabNet dataset contains 112k tables delivered as", "bbox": {"l": 308.862, "t": 451.08325, "r": 545.11511, "b": 459.98981000000003, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "single-page PDF documents with mixed table structures and", "bbox": {"l": 308.862, "t": 463.03824, "r": 545.11505, "b": 471.94479, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "text content. Similarly to the PubTabNet, the annotations", "bbox": {"l": 308.862, "t": 474.99323, "r": 545.11511, "b": 483.89978, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "of FinTabNet include the table structure in HTML, the to-", "bbox": {"l": 308.862, "t": 486.94922, "r": 545.11511, "b": 495.85577, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "kenized text and the bounding boxes on a table cell basis.", "bbox": {"l": 308.862, "t": 498.90421, "r": 545.11511, "b": 507.81076, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "The dataset is divided into Train, Test and Val splits (81%,", "bbox": {"l": 308.862, "t": 510.85919, "r": 545.11517, "b": 519.76575, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "9.5%, 9.5%), and each one is almost equally divided into", "bbox": {"l": 308.862, "t": 522.8141800000001, "r": 545.11517, "b": 531.72073, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "simple and complex tables (Train: 48% simple, 52% com-", "bbox": {"l": 308.862, "t": 534.76917, "r": 545.11505, "b": 543.67574, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "plex, Test: 48% simple, 52% complex, Test: 53% simple,", "bbox": {"l": 308.862, "t": 546.72418, "r": 545.11511, "b": 555.6307400000001, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "47% complex). Finally the TableBank dataset consists of", "bbox": {"l": 308.862, "t": 558.6801800000001, "r": 545.11511, "b": 567.58673, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "145k tables provided as JPEG images. The latter has anno-", "bbox": {"l": 308.862, "t": 570.63518, "r": 545.11505, "b": 579.54173, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "tations for the table structure, but only few with bounding", "bbox": {"l": 308.862, "t": 582.59018, "r": 545.11499, "b": 591.49673, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "boxes of the table cells. The entire dataset consists of sim-", "bbox": {"l": 308.862, "t": 594.54518, "r": 545.11517, "b": 603.45174, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "ple tables and it is divided into 90% Train, 3% Test and 7%", "bbox": {"l": 308.862, "t": 606.50018, "r": 545.11511, "b": 615.40674, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "Val splits.", "bbox": {"l": 308.862, "t": 618.45518, "r": 348.16446, "b": 627.36174, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The PubTabNet dataset contains 509k tables delivered as annotated PNG images. The annotations consist of the table structure represented in HTML format, the tokenized text and its bounding boxes per table cell. Fig. 1 shows the appearance style of PubTabNet. Depending on its complexity, a table is characterized as \u201csimple\u201d when it does not contain row spans or column spans, otherwise it is \u201ccomplex\u201d. The dataset is divided into Train and Val splits (roughly 98% and 2%). The Train split consists of 54% simple and 46% complex tables and the Val split of 51% and 49% respectively. The FinTabNet dataset contains 112k tables delivered as single-page PDF documents with mixed table structures and text content. Similarly to the PubTabNet, the annotations of FinTabNet include the table structure in HTML, the tokenized text and the bounding boxes on a table cell basis. The dataset is divided into Train, Test and Val splits (81%, 9.5%, 9.5%), and each one is almost equally divided into simple and complex tables (Train: 48% simple, 52% complex, Test: 48% simple, 52% complex, Test: 53% simple, 47% complex). Finally the TableBank dataset consists of 145k tables provided as JPEG images. The latter has annotations for the table structure, but only few with bounding boxes of the table cells. The entire dataset consists of simple tables and it is divided into 90% Train, 3% Test and 7% Val splits."}, {"label": "text", "id": 4, "page_no": 2, "cluster": {"id": 4, "label": "text", "bbox": {"l": 308.862, "t": 632.51419, "r": 545.11511, "b": 713.151764, "coord_origin": "TOPLEFT"}, "confidence": 0.9840090274810791, "cells": [{"id": 127, "text": "Due to the heterogeneity across the dataset formats, it", "bbox": {"l": 320.81699, "t": 632.51419, "r": 545.11487, "b": 641.42075, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "was necessary to combine all available data into one homog-", "bbox": {"l": 308.862, "t": 644.46919, "r": 545.11511, "b": 653.37575, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "enized dataset before we could train our models for practi-", "bbox": {"l": 308.862, "t": 656.42419, "r": 545.11511, "b": 665.33076, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "cal purposes. Given the size of PubTabNet, we adopted its", "bbox": {"l": 308.862, "t": 668.38019, "r": 545.11499, "b": 677.28676, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "annotation format and we extracted and converted all tables", "bbox": {"l": 308.862, "t": 680.33519, "r": 545.11505, "b": 689.24176, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "as PNG images with a resolution of 72 dpi. Additionally,", "bbox": {"l": 308.862, "t": 692.290192, "r": 545.11505, "b": 701.196762, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "we have filtered out tables with extreme sizes due to small", "bbox": {"l": 308.862, "t": 704.245193, "r": 545.11511, "b": 713.151764, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Due to the heterogeneity across the dataset formats, it was necessary to combine all available data into one homogenized dataset before we could train our models for practical purposes. Given the size of PubTabNet, we adopted its annotation format and we extracted and converted all tables as PNG images with a resolution of 72 dpi. Additionally, we have filtered out tables with extreme sizes due to small"}], "headers": [{"label": "page_footer", "id": 11, "page_no": 2, "cluster": {"id": 11, "label": "page_footer", "bbox": {"l": 295.121, "t": 734.133198, "r": 300.10229, "b": 743.039761, "coord_origin": "TOPLEFT"}, "confidence": 0.87156081199646, "cells": [{"id": 134, "text": "3", "bbox": {"l": 295.121, "t": 734.133198, "r": 300.10229, "b": 743.039761, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3"}]}}, {"page_no": 3, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "amount of such tables, and kept only those ones ranging", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 286.36511, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "between 1*1 and 20*10 (rows/columns).", "bbox": {"l": 50.112, "t": 87.16339000000005, "r": 212.28319, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "The availability of the bounding boxes for all table cells", "bbox": {"l": 62.067001, "t": 100.96038999999996, "r": 286.36502, "b": 109.86694, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "is essential to train our models. In order to distinguish be-", "bbox": {"l": 50.112, "t": 112.91540999999995, "r": 286.36508, "b": 121.82195999999999, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "tween empty and non-empty bounding boxes, we have in-", "bbox": {"l": 50.112, "t": 124.87041999999997, "r": 286.36508, "b": 133.77697999999998, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "troduced a binary class in the annotation. Unfortunately, the", "bbox": {"l": 50.112, "t": 136.82641999999998, "r": 286.36511, "b": 145.73297000000002, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "original datasets either omit the bounding boxes for whole", "bbox": {"l": 50.112, "t": 148.78143, "r": 286.36511, "b": 157.68799, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "tables (e.g. TableBank) or they narrow their scope only to", "bbox": {"l": 50.112, "t": 160.73645, "r": 286.36508, "b": 169.64301, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "non-empty cells. Therefore, it was imperative to introduce", "bbox": {"l": 50.112, "t": 172.69146999999998, "r": 286.36505, "b": 181.59802000000002, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "a data pre-processing procedure that generates the missing", "bbox": {"l": 50.112, "t": 184.64648, "r": 286.36508, "b": 193.55304, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "bounding boxes out of the annotation information. This pro-", "bbox": {"l": 50.112, "t": 196.60248, "r": 286.36508, "b": 205.50903000000005, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "cedure first parses the provided table structure and calcu-", "bbox": {"l": 50.112, "t": 208.5575, "r": 286.36508, "b": 217.46405000000004, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "lates the dimensions of the most fine-grained grid that cov-", "bbox": {"l": 50.112, "t": 220.51251000000002, "r": 286.36511, "b": 229.41907000000003, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "ers the table structure. Notice that each table cell may oc-", "bbox": {"l": 50.112, "t": 232.46753, "r": 286.36508, "b": 241.37408000000005, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "cupy multiple grid squares due to row or column spans. In", "bbox": {"l": 50.112, "t": 244.42255, "r": 286.36508, "b": 253.32910000000004, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "case of PubTabNet we had to compute missing bounding", "bbox": {"l": 50.112, "t": 256.37756, "r": 286.36505, "b": 265.28412000000003, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "boxes for 48% of the simple and 69% of the complex ta-", "bbox": {"l": 50.112, "t": 268.33356000000003, "r": 286.36505, "b": 277.24010999999996, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "bles.", "bbox": {"l": 50.112, "t": 280.28853999999995, "r": 68.652397, "b": 289.1951, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Regarding FinTabNet, 68% of the simple and 98%", "bbox": {"l": 75.566444, "t": 280.28853999999995, "r": 286.36514, "b": 289.1951, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "of the complex tables require the generation of bounding", "bbox": {"l": 50.112, "t": 292.24353, "r": 286.36511, "b": 301.15009, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "boxes.", "bbox": {"l": 50.112, "t": 304.19852000000003, "r": 75.695961, "b": 313.10507, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "As it is illustrated in Fig. 2, the table distributions from", "bbox": {"l": 62.067001, "t": 317.99550999999997, "r": 286.36499, "b": 326.90207, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "all datasets are skewed towards simpler structures with", "bbox": {"l": 50.112, "t": 329.95151, "r": 286.36511, "b": 338.8580600000001, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "fewer number of rows/columns. Additionally, there is very", "bbox": {"l": 50.112, "t": 341.90649, "r": 286.36502, "b": 350.81305, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "limited variance in the table styles, which in case of Pub-", "bbox": {"l": 50.112, "t": 353.8614799999999, "r": 286.36505, "b": 362.76804, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "TabNet and FinTabNet means one styling format for the", "bbox": {"l": 50.112, "t": 365.81647, "r": 286.36508, "b": 374.72301999999996, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "majority of the tables.", "bbox": {"l": 50.112, "t": 377.77145, "r": 141.58859, "b": 386.67801, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Similar limitations appear also in", "bbox": {"l": 148.70189, "t": 377.77145, "r": 286.36508, "b": 386.67801, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "the type of table content, which in some cases (e.g. FinTab-", "bbox": {"l": 50.112, "t": 389.72644, "r": 286.36508, "b": 398.63300000000004, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Net) is restricted to a certain domain. Ultimately, the lack", "bbox": {"l": 50.112, "t": 401.68243, "r": 286.36511, "b": 410.58899, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "of diversity in the training dataset damages the ability of the", "bbox": {"l": 50.112, "t": 413.63742, "r": 286.36511, "b": 422.54398, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "models to generalize well on unseen data.", "bbox": {"l": 50.112, "t": 425.59241, "r": 216.39774, "b": 434.49896, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Motivated by those observations we aimed at generating", "bbox": {"l": 62.067001, "t": 439.3894, "r": 286.36499, "b": 448.2959599999999, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "a synthetic table dataset named", "bbox": {"l": 50.112, "t": 451.34439, "r": 172.14388, "b": 460.25095, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "SynthTabNet", "bbox": {"l": 174.14801, "t": 451.43405, "r": 224.70818999999997, "b": 460.02182, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": ". This approach", "bbox": {"l": 224.70801, "t": 451.34439, "r": 286.36655, "b": 460.25095, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "offers control over: 1) the size of the dataset, 2) the table", "bbox": {"l": 50.112015, "t": 463.30038, "r": 286.36505, "b": 472.20694, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "structure, 3) the table style and 4) the type of content. The", "bbox": {"l": 50.112015, "t": 475.25537, "r": 286.36511, "b": 484.16193, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "complexity of the table structure is described by the size of", "bbox": {"l": 50.112015, "t": 487.21036, "r": 286.36511, "b": 496.11691, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "the table header and the table body, as well as the percentage", "bbox": {"l": 50.112015, "t": 499.16534, "r": 286.36508, "b": 508.0719, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "of the table cells covered by row spans and column spans.", "bbox": {"l": 50.112015, "t": 511.12033, "r": 286.36505, "b": 520.02689, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "A set of carefully designed styling templates provides the", "bbox": {"l": 50.112015, "t": 523.07632, "r": 286.36508, "b": 531.98288, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "basis to build a wide range of table appearances. Lastly, the", "bbox": {"l": 50.112015, "t": 535.0313100000001, "r": 286.36508, "b": 543.93788, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "table content is generated out of a curated collection of text", "bbox": {"l": 50.112015, "t": 546.98633, "r": 286.36511, "b": 555.89288, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "corpora. By controlling the size and scope of the synthetic", "bbox": {"l": 50.112015, "t": 558.94133, "r": 286.36508, "b": 567.84789, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "datasets we are able to train and evaluate our models in a", "bbox": {"l": 50.112015, "t": 570.89633, "r": 286.36511, "b": 579.8028899999999, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "variety of different conditions. For example, we can first", "bbox": {"l": 50.112015, "t": 582.85133, "r": 286.36511, "b": 591.75789, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "generate a highly diverse dataset to train our models and", "bbox": {"l": 50.112015, "t": 594.80733, "r": 286.36505, "b": 603.71388, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "then evaluate their performance on other synthetic datasets", "bbox": {"l": 50.112015, "t": 606.76233, "r": 286.36508, "b": 615.6688800000001, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "which are focused on a specific domain.", "bbox": {"l": 50.112015, "t": 618.71733, "r": 209.7527, "b": 627.62389, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "In this regard, we have prepared four synthetic datasets,", "bbox": {"l": 62.067017, "t": 632.51433, "r": 286.36499, "b": 641.42088, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "each one containing 150k examples. The corpora to gener-", "bbox": {"l": 50.112015, "t": 644.46933, "r": 286.36508, "b": 653.37589, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "ate the table text consists of the most frequent terms appear-", "bbox": {"l": 50.112015, "t": 656.42532, "r": 286.36511, "b": 665.33189, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "ing in PubTabNet and FinTabNet together with randomly", "bbox": {"l": 50.112015, "t": 668.38033, "r": 286.36505, "b": 677.28689, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "generated text. The first two synthetic datasets have been", "bbox": {"l": 50.112015, "t": 680.33533, "r": 286.36508, "b": 689.24189, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "fine-tuned to mimic the appearance of the original datasets", "bbox": {"l": 50.112015, "t": 692.290329, "r": 286.36508, "b": 701.196892, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "but encompass more complicated table structures. The third", "bbox": {"l": 50.112015, "t": 704.245331, "r": 286.36511, "b": 713.151894, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Tags", "bbox": {"l": 412.332, "t": 73.61437999999998, "r": 430.90231, "b": 82.52094, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Bbox", "bbox": {"l": 442.85742, "t": 73.61437999999998, "r": 464.4463799999999, "b": 82.52094, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Size", "bbox": {"l": 477.78632, "t": 73.61437999999998, "r": 494.94193, "b": 82.52094, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Format", "bbox": {"l": 508.28186, "t": 73.61437999999998, "r": 536.91437, "b": 82.52094, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "PubTabNet", "bbox": {"l": 317.06, "t": 85.9673499999999, "r": 361.64264, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "3", "bbox": {"l": 417.85599, "t": 85.6684600000001, "r": 425.37775, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "3", "bbox": {"l": 449.89569, "t": 85.6684600000001, "r": 457.41745000000003, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "509k", "bbox": {"l": 476.401, "t": 85.9673499999999, "r": 496.3262, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "PNG", "bbox": {"l": 512.63495, "t": 85.9673499999999, "r": 532.56012, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "FinTabNet", "bbox": {"l": 317.06, "t": 97.92236000000003, "r": 359.43094, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "3", "bbox": {"l": 417.85599, "t": 97.62347, "r": 425.37775, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "3", "bbox": {"l": 449.89569, "t": 97.62347, "r": 457.41745000000003, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "112k", "bbox": {"l": 476.401, "t": 97.92236000000003, "r": 496.3262, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "PDF", "bbox": {"l": 513.46185, "t": 97.92236000000003, "r": 531.73328, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "TableBank", "bbox": {"l": 317.06, "t": 109.87836000000004, "r": 359.97888, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "3", "bbox": {"l": 417.85599, "t": 109.57947000000001, "r": 425.37775, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "7", "bbox": {"l": 450.81226, "t": 109.57947000000001, "r": 456.50091999999995, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "145k", "bbox": {"l": 476.401, "t": 109.87836000000004, "r": 496.3262, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "JPEG", "bbox": {"l": 511.25017999999994, "t": 109.87836000000004, "r": 533.94501, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "Combined-Tabnet(*)", "bbox": {"l": 317.06, "t": 121.83336999999995, "r": 400.37723, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "3", "bbox": {"l": 417.85599, "t": 121.53448000000003, "r": 425.37775, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "3", "bbox": {"l": 449.89569, "t": 121.53448000000003, "r": 457.41745000000003, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "400k", "bbox": {"l": 476.401, "t": 121.83336999999995, "r": 496.3262, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "PNG", "bbox": {"l": 512.63495, "t": 121.83336999999995, "r": 532.56012, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Combined(**)", "bbox": {"l": 317.06, "t": 133.78839000000005, "r": 375.17184, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "3", "bbox": {"l": 417.85599, "t": 133.48950000000002, "r": 425.37775, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "3", "bbox": {"l": 449.89569, "t": 133.48950000000002, "r": 457.41745000000003, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "500k", "bbox": {"l": 476.401, "t": 133.78839000000005, "r": 496.3262, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "PNG", "bbox": {"l": 512.63495, "t": 133.78839000000005, "r": 532.56012, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "SynthTabNet", "bbox": {"l": 317.06, "t": 145.74341000000004, "r": 369.39352, "b": 154.64995999999996, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "3", "bbox": {"l": 417.85599, "t": 145.44446000000005, "r": 425.37775, "b": 154.65985, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "3", "bbox": {"l": 449.89569, "t": 145.44446000000005, "r": 457.41745000000003, "b": 154.65985, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "600k", "bbox": {"l": 476.401, "t": 145.74334999999996, "r": 496.3262, "b": 154.6499, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "PNG", "bbox": {"l": 512.63495, "t": 145.74334999999996, "r": 532.56012, "b": 154.6499, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "Table 1:", "bbox": {"l": 308.862, "t": 167.66138, "r": 344.6178, "b": 176.56793000000005, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Both", "bbox": {"l": 361.07602, "t": 167.66138, "r": 380.45328, "b": 176.56793000000005, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "\u201cCombined-Tabnet\u201d", "bbox": {"l": 386.56799, "t": 167.75104, "r": 468.67974999999996, "b": 176.33880999999997, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "and", "bbox": {"l": 474.79599, "t": 167.66138, "r": 489.18198, "b": 176.56793000000005, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "\u201dCombined-", "bbox": {"l": 495.29898000000003, "t": 167.75104, "r": 545.112, "b": 176.33880999999997, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "Tabnet\u201d", "bbox": {"l": 308.862, "t": 179.70605, "r": 341.16077, "b": 188.29381999999998, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "are variations of the following: (*) The Combined-", "bbox": {"l": 343.457, "t": 179.61639000000002, "r": 545.11005, "b": 188.52295000000004, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "Tabnet dataset is the processed combination of PubTabNet", "bbox": {"l": 308.862, "t": 191.57141000000001, "r": 545.11505, "b": 200.47797000000003, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "and Fintabnet. (**) The combined dataset is the processed", "bbox": {"l": 308.862, "t": 203.52643, "r": 545.11499, "b": 212.43298000000004, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "combination of PubTabNet, Fintabnet and TableBank.", "bbox": {"l": 308.862, "t": 215.48242000000005, "r": 523.93469, "b": 224.38897999999995, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "one adopts a colorful appearance with high contrast and the", "bbox": {"l": 308.862, "t": 249.62041999999997, "r": 545.11517, "b": 258.52698, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "last one contains tables with sparse content. Lastly, we have", "bbox": {"l": 308.862, "t": 261.57543999999996, "r": 545.11517, "b": 270.48199, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "combined all synthetic datasets into one big unified syn-", "bbox": {"l": 308.862, "t": 273.5304, "r": 545.11505, "b": 282.43698, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "thetic dataset of 600k examples.", "bbox": {"l": 308.862, "t": 285.48541000000006, "r": 436.82169, "b": 294.39197, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "Tab. 1 summarizes the various attributes of the datasets.", "bbox": {"l": 320.81699, "t": 297.77240000000006, "r": 542.74396, "b": 306.67896, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "4.", "bbox": {"l": 308.862, "t": 321.18396, "r": 316.28476, "b": 331.93167000000005, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "The TableFormer model", "bbox": {"l": 326.18176, "t": 321.18396, "r": 444.93607000000003, "b": 331.93167000000005, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "Given the image of a table, TableFormer is able to pre-", "bbox": {"l": 320.81699, "t": 341.93939, "r": 545.11499, "b": 350.84594999999996, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "dict: 1) a sequence of tokens that represent the structure of", "bbox": {"l": 308.862, "t": 353.89438, "r": 545.11511, "b": 362.80092999999994, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "a table, and 2) a bounding box coupled to a subset of those", "bbox": {"l": 308.862, "t": 365.84937, "r": 545.11517, "b": 374.75592, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "tokens. The conversion of an image into a sequence of to-", "bbox": {"l": 308.862, "t": 377.80435, "r": 545.11505, "b": 386.71091, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "kens is a well-known task [35, 16]. While attention is often", "bbox": {"l": 308.862, "t": 389.75934000000007, "r": 545.11517, "b": 398.66588999999993, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "used as an implicit method to associate each token of the", "bbox": {"l": 308.862, "t": 401.71432000000004, "r": 545.11523, "b": 410.62088, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "sequence with a position in the original image, an explicit", "bbox": {"l": 308.862, "t": 413.67032, "r": 545.11517, "b": 422.57687, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "association between the individual table-cells and the image", "bbox": {"l": 308.862, "t": 425.62531, "r": 545.11505, "b": 434.53186, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "bounding boxes is also required.", "bbox": {"l": 308.862, "t": 437.58029, "r": 437.9375, "b": 446.48685000000006, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "4.1.", "bbox": {"l": 308.862, "t": 457.69427, "r": 323.14081, "b": 467.54633, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "Model architecture.", "bbox": {"l": 332.66003, "t": 457.69427, "r": 420.16058, "b": 467.54633, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "We now describe in detail the proposed method, which", "bbox": {"l": 320.81699, "t": 476.76529, "r": 545.11487, "b": 485.67184, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "is composed of three main components, see Fig.", "bbox": {"l": 308.862, "t": 488.72028, "r": 509.02054, "b": 497.62683, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "4.", "bbox": {"l": 515.58588, "t": 488.72028, "r": 523.05786, "b": 497.62683, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Our", "bbox": {"l": 529.62323, "t": 488.72028, "r": 545.11505, "b": 497.62683, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "CNN Backbone Network", "bbox": {"l": 308.862, "t": 500.76492, "r": 406.34601, "b": 509.35269, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "encodes the input as a feature vec-", "bbox": {"l": 408.87201, "t": 500.67526, "r": 545.1106, "b": 509.58182, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "tor of predefined length.", "bbox": {"l": 308.862, "t": 512.63126, "r": 409.39459, "b": 521.53781, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "The input feature vector of the", "bbox": {"l": 416.72705, "t": 512.63126, "r": 545.11505, "b": 521.53781, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "encoded image is passed to the", "bbox": {"l": 308.862, "t": 524.58624, "r": 436.194, "b": 533.4928, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "Structure Decoder", "bbox": {"l": 439.526, "t": 524.6759, "r": 513.86694, "b": 533.26367, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "to pro-", "bbox": {"l": 517.43201, "t": 524.58624, "r": 545.10815, "b": 533.4928, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "duce a sequence of HTML tags that represent the structure", "bbox": {"l": 308.862, "t": 536.54124, "r": 545.11511, "b": 545.4478, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "of the table.", "bbox": {"l": 308.862, "t": 548.49625, "r": 358.5455, "b": 557.4028000000001, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "With each prediction of an HTML standard", "bbox": {"l": 365.19055, "t": 548.49625, "r": 545.11517, "b": 557.4028000000001, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "data cell (\u2018", "bbox": {"l": 308.862, "t": 560.45125, "r": 352.40851, "b": 569.3578, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "<", "bbox": {"l": 352.409, "t": 560.29184, "r": 360.1579, "b": 569.13863, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "td", "bbox": {"l": 360.15799, "t": 560.45125, "r": 367.90891, "b": 569.3578, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": ">", "bbox": {"l": 367.909, "t": 560.29184, "r": 375.6579, "b": 569.13863, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "\u2019) the hidden state of that cell is passed to", "bbox": {"l": 375.65799, "t": 560.45125, "r": 545.11182, "b": 569.3578, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "the Cell BBox Decoder. As for spanning cells, such as row", "bbox": {"l": 308.862, "t": 572.40724, "r": 545.11499, "b": 581.3138, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "or column span, the tag is broken down to \u2018", "bbox": {"l": 308.862, "t": 584.3622399999999, "r": 483.11768, "b": 593.2688, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "<", "bbox": {"l": 483.11902, "t": 584.20284, "r": 490.86792, "b": 593.04962, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "\u2019, \u2018rowspan=\u2019", "bbox": {"l": 490.86800999999997, "t": 584.3622399999999, "r": 545.11438, "b": 593.2688, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "or \u2018colspan=\u2019, with the number of spanning cells (attribute),", "bbox": {"l": 308.862, "t": 596.31725, "r": 545.11493, "b": 605.2238, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "and \u2018", "bbox": {"l": 308.862, "t": 608.27225, "r": 329.64395, "b": 617.1788, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": ">", "bbox": {"l": 329.646, "t": 608.11284, "r": 337.3949, "b": 616.9596300000001, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "\u2019. The hidden state attached to \u2018", "bbox": {"l": 337.39398, "t": 608.27225, "r": 468.5914, "b": 617.1788, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "<", "bbox": {"l": 468.59496999999993, "t": 608.11284, "r": 476.34387000000004, "b": 616.9596300000001, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "\u2019 is passed to the", "bbox": {"l": 476.3439599999999, "t": 608.27225, "r": 545.11572, "b": 617.1788, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "Cell BBox Decoder. A shared feed forward network (FFN)", "bbox": {"l": 308.86197, "t": 620.22725, "r": 545.11499, "b": 629.1338000000001, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "receives the hidden states from the Structure Decoder, to", "bbox": {"l": 308.86197, "t": 632.1822500000001, "r": 545.11517, "b": 641.08881, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "provide the final detection predictions of the bounding box", "bbox": {"l": 308.86197, "t": 644.13824, "r": 545.11511, "b": 653.0448, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "coordinates and their classification.", "bbox": {"l": 308.86197, "t": 656.09325, "r": 449.42432, "b": 664.99981, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "CNN Backbone Network.", "bbox": {"l": 320.81696, "t": 668.2607, "r": 431.90985, "b": 677.21707, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "A ResNet-18 CNN is the", "bbox": {"l": 439.49896, "t": 668.3802499999999, "r": 545.11255, "b": 677.2868100000001, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "backbone that receives the table image and encodes it as a", "bbox": {"l": 308.86197, "t": 680.33525, "r": 545.11499, "b": 689.24181, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "vector of predefined length. The network has been modified", "bbox": {"l": 308.86197, "t": 692.290253, "r": 545.11511, "b": 701.196815, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "by removing the linear and pooling layer, as we are not per-", "bbox": {"l": 308.86197, "t": 704.245255, "r": 545.11505, "b": 713.1518169999999, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "4", "bbox": {"l": 295.12097, "t": 734.133251, "r": 300.10226, "b": 743.039814, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 10, "label": "text", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 286.36511, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.961143434047699, "cells": [{"id": 0, "text": "amount of such tables, and kept only those ones ranging", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 286.36511, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "between 1*1 and 20*10 (rows/columns).", "bbox": {"l": 50.112, "t": 87.16339000000005, "r": 212.28319, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 50.112, "t": 100.96038999999996, "r": 286.36514, "b": 313.10507, "coord_origin": "TOPLEFT"}, "confidence": 0.988013744354248, "cells": [{"id": 2, "text": "The availability of the bounding boxes for all table cells", "bbox": {"l": 62.067001, "t": 100.96038999999996, "r": 286.36502, "b": 109.86694, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "is essential to train our models. In order to distinguish be-", "bbox": {"l": 50.112, "t": 112.91540999999995, "r": 286.36508, "b": 121.82195999999999, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "tween empty and non-empty bounding boxes, we have in-", "bbox": {"l": 50.112, "t": 124.87041999999997, "r": 286.36508, "b": 133.77697999999998, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "troduced a binary class in the annotation. Unfortunately, the", "bbox": {"l": 50.112, "t": 136.82641999999998, "r": 286.36511, "b": 145.73297000000002, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "original datasets either omit the bounding boxes for whole", "bbox": {"l": 50.112, "t": 148.78143, "r": 286.36511, "b": 157.68799, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "tables (e.g. TableBank) or they narrow their scope only to", "bbox": {"l": 50.112, "t": 160.73645, "r": 286.36508, "b": 169.64301, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "non-empty cells. Therefore, it was imperative to introduce", "bbox": {"l": 50.112, "t": 172.69146999999998, "r": 286.36505, "b": 181.59802000000002, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "a data pre-processing procedure that generates the missing", "bbox": {"l": 50.112, "t": 184.64648, "r": 286.36508, "b": 193.55304, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "bounding boxes out of the annotation information. This pro-", "bbox": {"l": 50.112, "t": 196.60248, "r": 286.36508, "b": 205.50903000000005, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "cedure first parses the provided table structure and calcu-", "bbox": {"l": 50.112, "t": 208.5575, "r": 286.36508, "b": 217.46405000000004, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "lates the dimensions of the most fine-grained grid that cov-", "bbox": {"l": 50.112, "t": 220.51251000000002, "r": 286.36511, "b": 229.41907000000003, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "ers the table structure. Notice that each table cell may oc-", "bbox": {"l": 50.112, "t": 232.46753, "r": 286.36508, "b": 241.37408000000005, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "cupy multiple grid squares due to row or column spans. In", "bbox": {"l": 50.112, "t": 244.42255, "r": 286.36508, "b": 253.32910000000004, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "case of PubTabNet we had to compute missing bounding", "bbox": {"l": 50.112, "t": 256.37756, "r": 286.36505, "b": 265.28412000000003, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "boxes for 48% of the simple and 69% of the complex ta-", "bbox": {"l": 50.112, "t": 268.33356000000003, "r": 286.36505, "b": 277.24010999999996, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "bles.", "bbox": {"l": 50.112, "t": 280.28853999999995, "r": 68.652397, "b": 289.1951, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Regarding FinTabNet, 68% of the simple and 98%", "bbox": {"l": 75.566444, "t": 280.28853999999995, "r": 286.36514, "b": 289.1951, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "of the complex tables require the generation of bounding", "bbox": {"l": 50.112, "t": 292.24353, "r": 286.36511, "b": 301.15009, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "boxes.", "bbox": {"l": 50.112, "t": 304.19852000000003, "r": 75.695961, "b": 313.10507, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "text", "bbox": {"l": 50.112, "t": 317.99550999999997, "r": 286.36511, "b": 434.49896, "coord_origin": "TOPLEFT"}, "confidence": 0.9873981475830078, "cells": [{"id": 21, "text": "As it is illustrated in Fig. 2, the table distributions from", "bbox": {"l": 62.067001, "t": 317.99550999999997, "r": 286.36499, "b": 326.90207, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "all datasets are skewed towards simpler structures with", "bbox": {"l": 50.112, "t": 329.95151, "r": 286.36511, "b": 338.8580600000001, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "fewer number of rows/columns. Additionally, there is very", "bbox": {"l": 50.112, "t": 341.90649, "r": 286.36502, "b": 350.81305, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "limited variance in the table styles, which in case of Pub-", "bbox": {"l": 50.112, "t": 353.8614799999999, "r": 286.36505, "b": 362.76804, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "TabNet and FinTabNet means one styling format for the", "bbox": {"l": 50.112, "t": 365.81647, "r": 286.36508, "b": 374.72301999999996, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "majority of the tables.", "bbox": {"l": 50.112, "t": 377.77145, "r": 141.58859, "b": 386.67801, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Similar limitations appear also in", "bbox": {"l": 148.70189, "t": 377.77145, "r": 286.36508, "b": 386.67801, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "the type of table content, which in some cases (e.g. FinTab-", "bbox": {"l": 50.112, "t": 389.72644, "r": 286.36508, "b": 398.63300000000004, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Net) is restricted to a certain domain. Ultimately, the lack", "bbox": {"l": 50.112, "t": 401.68243, "r": 286.36511, "b": 410.58899, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "of diversity in the training dataset damages the ability of the", "bbox": {"l": 50.112, "t": 413.63742, "r": 286.36511, "b": 422.54398, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "models to generalize well on unseen data.", "bbox": {"l": 50.112, "t": 425.59241, "r": 216.39774, "b": 434.49896, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 50.112, "t": 439.3894, "r": 286.36655, "b": 627.62389, "coord_origin": "TOPLEFT"}, "confidence": 0.9876030087471008, "cells": [{"id": 32, "text": "Motivated by those observations we aimed at generating", "bbox": {"l": 62.067001, "t": 439.3894, "r": 286.36499, "b": 448.2959599999999, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "a synthetic table dataset named", "bbox": {"l": 50.112, "t": 451.34439, "r": 172.14388, "b": 460.25095, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "SynthTabNet", "bbox": {"l": 174.14801, "t": 451.43405, "r": 224.70818999999997, "b": 460.02182, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": ". This approach", "bbox": {"l": 224.70801, "t": 451.34439, "r": 286.36655, "b": 460.25095, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "offers control over: 1) the size of the dataset, 2) the table", "bbox": {"l": 50.112015, "t": 463.30038, "r": 286.36505, "b": 472.20694, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "structure, 3) the table style and 4) the type of content. The", "bbox": {"l": 50.112015, "t": 475.25537, "r": 286.36511, "b": 484.16193, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "complexity of the table structure is described by the size of", "bbox": {"l": 50.112015, "t": 487.21036, "r": 286.36511, "b": 496.11691, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "the table header and the table body, as well as the percentage", "bbox": {"l": 50.112015, "t": 499.16534, "r": 286.36508, "b": 508.0719, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "of the table cells covered by row spans and column spans.", "bbox": {"l": 50.112015, "t": 511.12033, "r": 286.36505, "b": 520.02689, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "A set of carefully designed styling templates provides the", "bbox": {"l": 50.112015, "t": 523.07632, "r": 286.36508, "b": 531.98288, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "basis to build a wide range of table appearances. Lastly, the", "bbox": {"l": 50.112015, "t": 535.0313100000001, "r": 286.36508, "b": 543.93788, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "table content is generated out of a curated collection of text", "bbox": {"l": 50.112015, "t": 546.98633, "r": 286.36511, "b": 555.89288, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "corpora. By controlling the size and scope of the synthetic", "bbox": {"l": 50.112015, "t": 558.94133, "r": 286.36508, "b": 567.84789, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "datasets we are able to train and evaluate our models in a", "bbox": {"l": 50.112015, "t": 570.89633, "r": 286.36511, "b": 579.8028899999999, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "variety of different conditions. For example, we can first", "bbox": {"l": 50.112015, "t": 582.85133, "r": 286.36511, "b": 591.75789, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "generate a highly diverse dataset to train our models and", "bbox": {"l": 50.112015, "t": 594.80733, "r": 286.36505, "b": 603.71388, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "then evaluate their performance on other synthetic datasets", "bbox": {"l": 50.112015, "t": 606.76233, "r": 286.36508, "b": 615.6688800000001, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "which are focused on a specific domain.", "bbox": {"l": 50.112015, "t": 618.71733, "r": 209.7527, "b": 627.62389, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "text", "bbox": {"l": 50.112015, "t": 632.51433, "r": 286.36511, "b": 713.151894, "coord_origin": "TOPLEFT"}, "confidence": 0.9871614575386047, "cells": [{"id": 50, "text": "In this regard, we have prepared four synthetic datasets,", "bbox": {"l": 62.067017, "t": 632.51433, "r": 286.36499, "b": 641.42088, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "each one containing 150k examples. The corpora to gener-", "bbox": {"l": 50.112015, "t": 644.46933, "r": 286.36508, "b": 653.37589, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "ate the table text consists of the most frequent terms appear-", "bbox": {"l": 50.112015, "t": 656.42532, "r": 286.36511, "b": 665.33189, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "ing in PubTabNet and FinTabNet together with randomly", "bbox": {"l": 50.112015, "t": 668.38033, "r": 286.36505, "b": 677.28689, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "generated text. The first two synthetic datasets have been", "bbox": {"l": 50.112015, "t": 680.33533, "r": 286.36508, "b": 689.24189, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "fine-tuned to mimic the appearance of the original datasets", "bbox": {"l": 50.112015, "t": 692.290329, "r": 286.36508, "b": 701.196892, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "but encompass more complicated table structures. The third", "bbox": {"l": 50.112015, "t": 704.245331, "r": 286.36511, "b": 713.151894, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "table", "bbox": {"l": 310.67584228515625, "t": 73.19387817382812, "r": 542.9547119140625, "b": 155.22052001953125, "coord_origin": "TOPLEFT"}, "confidence": 0.9777463674545288, "cells": [{"id": 57, "text": "Tags", "bbox": {"l": 412.332, "t": 73.61437999999998, "r": 430.90231, "b": 82.52094, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Bbox", "bbox": {"l": 442.85742, "t": 73.61437999999998, "r": 464.4463799999999, "b": 82.52094, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Size", "bbox": {"l": 477.78632, "t": 73.61437999999998, "r": 494.94193, "b": 82.52094, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Format", "bbox": {"l": 508.28186, "t": 73.61437999999998, "r": 536.91437, "b": 82.52094, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "PubTabNet", "bbox": {"l": 317.06, "t": 85.9673499999999, "r": 361.64264, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "3", "bbox": {"l": 417.85599, "t": 85.6684600000001, "r": 425.37775, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "3", "bbox": {"l": 449.89569, "t": 85.6684600000001, "r": 457.41745000000003, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "509k", "bbox": {"l": 476.401, "t": 85.9673499999999, "r": 496.3262, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "PNG", "bbox": {"l": 512.63495, "t": 85.9673499999999, "r": 532.56012, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "FinTabNet", "bbox": {"l": 317.06, "t": 97.92236000000003, "r": 359.43094, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "3", "bbox": {"l": 417.85599, "t": 97.62347, "r": 425.37775, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "3", "bbox": {"l": 449.89569, "t": 97.62347, "r": 457.41745000000003, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "112k", "bbox": {"l": 476.401, "t": 97.92236000000003, "r": 496.3262, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "PDF", "bbox": {"l": 513.46185, "t": 97.92236000000003, "r": 531.73328, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "TableBank", "bbox": {"l": 317.06, "t": 109.87836000000004, "r": 359.97888, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "3", "bbox": {"l": 417.85599, "t": 109.57947000000001, "r": 425.37775, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "7", "bbox": {"l": 450.81226, "t": 109.57947000000001, "r": 456.50091999999995, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "145k", "bbox": {"l": 476.401, "t": 109.87836000000004, "r": 496.3262, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "JPEG", "bbox": {"l": 511.25017999999994, "t": 109.87836000000004, "r": 533.94501, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "Combined-Tabnet(*)", "bbox": {"l": 317.06, "t": 121.83336999999995, "r": 400.37723, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "3", "bbox": {"l": 417.85599, "t": 121.53448000000003, "r": 425.37775, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "3", "bbox": {"l": 449.89569, "t": 121.53448000000003, "r": 457.41745000000003, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "400k", "bbox": {"l": 476.401, "t": 121.83336999999995, "r": 496.3262, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "PNG", "bbox": {"l": 512.63495, "t": 121.83336999999995, "r": 532.56012, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Combined(**)", "bbox": {"l": 317.06, "t": 133.78839000000005, "r": 375.17184, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "3", "bbox": {"l": 417.85599, "t": 133.48950000000002, "r": 425.37775, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "3", "bbox": {"l": 449.89569, "t": 133.48950000000002, "r": 457.41745000000003, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "500k", "bbox": {"l": 476.401, "t": 133.78839000000005, "r": 496.3262, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "PNG", "bbox": {"l": 512.63495, "t": 133.78839000000005, "r": 532.56012, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "SynthTabNet", "bbox": {"l": 317.06, "t": 145.74341000000004, "r": 369.39352, "b": 154.64995999999996, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "3", "bbox": {"l": 417.85599, "t": 145.44446000000005, "r": 425.37775, "b": 154.65985, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "3", "bbox": {"l": 449.89569, "t": 145.44446000000005, "r": 457.41745000000003, "b": 154.65985, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "600k", "bbox": {"l": 476.401, "t": 145.74334999999996, "r": 496.3262, "b": 154.6499, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "PNG", "bbox": {"l": 512.63495, "t": 145.74334999999996, "r": 532.56012, "b": 154.6499, "coord_origin": "TOPLEFT"}}], "children": [{"id": 15, "label": "text", "bbox": {"l": 412.332, "t": 73.61437999999998, "r": 430.90231, "b": 82.52094, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "Tags", "bbox": {"l": 412.332, "t": 73.61437999999998, "r": 430.90231, "b": 82.52094, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 442.85742, "t": 73.61437999999998, "r": 464.4463799999999, "b": 82.52094, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "Bbox", "bbox": {"l": 442.85742, "t": 73.61437999999998, "r": 464.4463799999999, "b": 82.52094, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 477.78632, "t": 73.61437999999998, "r": 494.94193, "b": 82.52094, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "Size", "bbox": {"l": 477.78632, "t": 73.61437999999998, "r": 494.94193, "b": 82.52094, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 508.28186, "t": 73.61437999999998, "r": 536.91437, "b": 82.52094, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "Format", "bbox": {"l": 508.28186, "t": 73.61437999999998, "r": 536.91437, "b": 82.52094, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 317.06, "t": 85.9673499999999, "r": 361.64264, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "PubTabNet", "bbox": {"l": 317.06, "t": 85.9673499999999, "r": 361.64264, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 417.85599, "t": 85.6684600000001, "r": 425.37775, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "3", "bbox": {"l": 417.85599, "t": 85.6684600000001, "r": 425.37775, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 449.89569, "t": 85.6684600000001, "r": 457.41745000000003, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "3", "bbox": {"l": 449.89569, "t": 85.6684600000001, "r": 457.41745000000003, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 476.401, "t": 85.9673499999999, "r": 496.3262, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "509k", "bbox": {"l": 476.401, "t": 85.9673499999999, "r": 496.3262, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 512.63495, "t": 85.9673499999999, "r": 532.56012, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "PNG", "bbox": {"l": 512.63495, "t": 85.9673499999999, "r": 532.56012, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 317.06, "t": 97.92236000000003, "r": 359.43094, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "FinTabNet", "bbox": {"l": 317.06, "t": 97.92236000000003, "r": 359.43094, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 417.85599, "t": 97.62347, "r": 425.37775, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "3", "bbox": {"l": 417.85599, "t": 97.62347, "r": 425.37775, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 449.89569, "t": 97.62347, "r": 457.41745000000003, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "3", "bbox": {"l": 449.89569, "t": 97.62347, "r": 457.41745000000003, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 476.401, "t": 97.92236000000003, "r": 496.3262, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "112k", "bbox": {"l": 476.401, "t": 97.92236000000003, "r": 496.3262, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 513.46185, "t": 97.92236000000003, "r": 531.73328, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "PDF", "bbox": {"l": 513.46185, "t": 97.92236000000003, "r": 531.73328, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 317.06, "t": 109.87836000000004, "r": 359.97888, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "TableBank", "bbox": {"l": 317.06, "t": 109.87836000000004, "r": 359.97888, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 417.85599, "t": 109.57947000000001, "r": 425.37775, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "3", "bbox": {"l": 417.85599, "t": 109.57947000000001, "r": 425.37775, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 450.81226, "t": 109.57947000000001, "r": 456.50091999999995, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "7", "bbox": {"l": 450.81226, "t": 109.57947000000001, "r": 456.50091999999995, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 476.401, "t": 109.87836000000004, "r": 496.3262, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "145k", "bbox": {"l": 476.401, "t": 109.87836000000004, "r": 496.3262, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 511.25017999999994, "t": 109.87836000000004, "r": 533.94501, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "JPEG", "bbox": {"l": 511.25017999999994, "t": 109.87836000000004, "r": 533.94501, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 317.06, "t": 121.83336999999995, "r": 400.37723, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "Combined-Tabnet(*)", "bbox": {"l": 317.06, "t": 121.83336999999995, "r": 400.37723, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 417.85599, "t": 121.53448000000003, "r": 425.37775, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "3", "bbox": {"l": 417.85599, "t": 121.53448000000003, "r": 425.37775, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 449.89569, "t": 121.53448000000003, "r": 457.41745000000003, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "3", "bbox": {"l": 449.89569, "t": 121.53448000000003, "r": 457.41745000000003, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 476.401, "t": 121.83336999999995, "r": 496.3262, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "400k", "bbox": {"l": 476.401, "t": 121.83336999999995, "r": 496.3262, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 512.63495, "t": 121.83336999999995, "r": 532.56012, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "PNG", "bbox": {"l": 512.63495, "t": 121.83336999999995, "r": 532.56012, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 317.06, "t": 133.78839000000005, "r": 375.17184, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "Combined(**)", "bbox": {"l": 317.06, "t": 133.78839000000005, "r": 375.17184, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 417.85599, "t": 133.48950000000002, "r": 425.37775, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "3", "bbox": {"l": 417.85599, "t": 133.48950000000002, "r": 425.37775, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 449.89569, "t": 133.48950000000002, "r": 457.41745000000003, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "3", "bbox": {"l": 449.89569, "t": 133.48950000000002, "r": 457.41745000000003, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 476.401, "t": 133.78839000000005, "r": 496.3262, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "500k", "bbox": {"l": 476.401, "t": 133.78839000000005, "r": 496.3262, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 512.63495, "t": 133.78839000000005, "r": 532.56012, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "PNG", "bbox": {"l": 512.63495, "t": 133.78839000000005, "r": 532.56012, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 317.06, "t": 145.74341000000004, "r": 369.39352, "b": 154.64995999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "SynthTabNet", "bbox": {"l": 317.06, "t": 145.74341000000004, "r": 369.39352, "b": 154.64995999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 417.85599, "t": 145.44446000000005, "r": 425.37775, "b": 154.65985, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "3", "bbox": {"l": 417.85599, "t": 145.44446000000005, "r": 425.37775, "b": 154.65985, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 449.89569, "t": 145.44446000000005, "r": 457.41745000000003, "b": 154.65985, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "3", "bbox": {"l": 449.89569, "t": 145.44446000000005, "r": 457.41745000000003, "b": 154.65985, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 476.401, "t": 145.74334999999996, "r": 496.3262, "b": 154.6499, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "600k", "bbox": {"l": 476.401, "t": 145.74334999999996, "r": 496.3262, "b": 154.6499, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 512.63495, "t": 145.74334999999996, "r": 532.56012, "b": 154.6499, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "PNG", "bbox": {"l": 512.63495, "t": 145.74334999999996, "r": 532.56012, "b": 154.6499, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 9, "label": "caption", "bbox": {"l": 308.862, "t": 167.66138, "r": 545.11505, "b": 224.38897999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9667726755142212, "cells": [{"id": 91, "text": "Table 1:", "bbox": {"l": 308.862, "t": 167.66138, "r": 344.6178, "b": 176.56793000000005, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Both", "bbox": {"l": 361.07602, "t": 167.66138, "r": 380.45328, "b": 176.56793000000005, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "\u201cCombined-Tabnet\u201d", "bbox": {"l": 386.56799, "t": 167.75104, "r": 468.67974999999996, "b": 176.33880999999997, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "and", "bbox": {"l": 474.79599, "t": 167.66138, "r": 489.18198, "b": 176.56793000000005, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "\u201dCombined-", "bbox": {"l": 495.29898000000003, "t": 167.75104, "r": 545.112, "b": 176.33880999999997, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "Tabnet\u201d", "bbox": {"l": 308.862, "t": 179.70605, "r": 341.16077, "b": 188.29381999999998, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "are variations of the following: (*) The Combined-", "bbox": {"l": 343.457, "t": 179.61639000000002, "r": 545.11005, "b": 188.52295000000004, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "Tabnet dataset is the processed combination of PubTabNet", "bbox": {"l": 308.862, "t": 191.57141000000001, "r": 545.11505, "b": 200.47797000000003, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "and Fintabnet. (**) The combined dataset is the processed", "bbox": {"l": 308.862, "t": 203.52643, "r": 545.11499, "b": 212.43298000000004, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "combination of PubTabNet, Fintabnet and TableBank.", "bbox": {"l": 308.862, "t": 215.48242000000005, "r": 523.93469, "b": 224.38897999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "text", "bbox": {"l": 308.862, "t": 249.62041999999997, "r": 545.11517, "b": 294.39197, "coord_origin": "TOPLEFT"}, "confidence": 0.9789542555809021, "cells": [{"id": 101, "text": "one adopts a colorful appearance with high contrast and the", "bbox": {"l": 308.862, "t": 249.62041999999997, "r": 545.11517, "b": 258.52698, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "last one contains tables with sparse content. Lastly, we have", "bbox": {"l": 308.862, "t": 261.57543999999996, "r": 545.11517, "b": 270.48199, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "combined all synthetic datasets into one big unified syn-", "bbox": {"l": 308.862, "t": 273.5304, "r": 545.11505, "b": 282.43698, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "thetic dataset of 600k examples.", "bbox": {"l": 308.862, "t": 285.48541000000006, "r": 436.82169, "b": 294.39197, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 320.81699, "t": 297.77240000000006, "r": 542.74396, "b": 306.67896, "coord_origin": "TOPLEFT"}, "confidence": 0.9043694138526917, "cells": [{"id": 105, "text": "Tab. 1 summarizes the various attributes of the datasets.", "bbox": {"l": 320.81699, "t": 297.77240000000006, "r": 542.74396, "b": 306.67896, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "section_header", "bbox": {"l": 308.862, "t": 321.18396, "r": 444.93607000000003, "b": 331.93167000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9466594457626343, "cells": [{"id": 106, "text": "4.", "bbox": {"l": 308.862, "t": 321.18396, "r": 316.28476, "b": 331.93167000000005, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "The TableFormer model", "bbox": {"l": 326.18176, "t": 321.18396, "r": 444.93607000000003, "b": 331.93167000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 308.862, "t": 341.93939, "r": 545.11523, "b": 446.48685000000006, "coord_origin": "TOPLEFT"}, "confidence": 0.9884450435638428, "cells": [{"id": 108, "text": "Given the image of a table, TableFormer is able to pre-", "bbox": {"l": 320.81699, "t": 341.93939, "r": 545.11499, "b": 350.84594999999996, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "dict: 1) a sequence of tokens that represent the structure of", "bbox": {"l": 308.862, "t": 353.89438, "r": 545.11511, "b": 362.80092999999994, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "a table, and 2) a bounding box coupled to a subset of those", "bbox": {"l": 308.862, "t": 365.84937, "r": 545.11517, "b": 374.75592, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "tokens. The conversion of an image into a sequence of to-", "bbox": {"l": 308.862, "t": 377.80435, "r": 545.11505, "b": 386.71091, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "kens is a well-known task [35, 16]. While attention is often", "bbox": {"l": 308.862, "t": 389.75934000000007, "r": 545.11517, "b": 398.66588999999993, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "used as an implicit method to associate each token of the", "bbox": {"l": 308.862, "t": 401.71432000000004, "r": 545.11523, "b": 410.62088, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "sequence with a position in the original image, an explicit", "bbox": {"l": 308.862, "t": 413.67032, "r": 545.11517, "b": 422.57687, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "association between the individual table-cells and the image", "bbox": {"l": 308.862, "t": 425.62531, "r": 545.11505, "b": 434.53186, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "bounding boxes is also required.", "bbox": {"l": 308.862, "t": 437.58029, "r": 437.9375, "b": 446.48685000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "section_header", "bbox": {"l": 308.862, "t": 457.69427, "r": 420.16058, "b": 467.54633, "coord_origin": "TOPLEFT"}, "confidence": 0.9376963376998901, "cells": [{"id": 117, "text": "4.1.", "bbox": {"l": 308.862, "t": 457.69427, "r": 323.14081, "b": 467.54633, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "Model architecture.", "bbox": {"l": 332.66003, "t": 457.69427, "r": 420.16058, "b": 467.54633, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 308.86197, "t": 476.76529, "r": 545.11572, "b": 664.99981, "coord_origin": "TOPLEFT"}, "confidence": 0.9878323078155518, "cells": [{"id": 119, "text": "We now describe in detail the proposed method, which", "bbox": {"l": 320.81699, "t": 476.76529, "r": 545.11487, "b": 485.67184, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "is composed of three main components, see Fig.", "bbox": {"l": 308.862, "t": 488.72028, "r": 509.02054, "b": 497.62683, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "4.", "bbox": {"l": 515.58588, "t": 488.72028, "r": 523.05786, "b": 497.62683, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Our", "bbox": {"l": 529.62323, "t": 488.72028, "r": 545.11505, "b": 497.62683, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "CNN Backbone Network", "bbox": {"l": 308.862, "t": 500.76492, "r": 406.34601, "b": 509.35269, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "encodes the input as a feature vec-", "bbox": {"l": 408.87201, "t": 500.67526, "r": 545.1106, "b": 509.58182, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "tor of predefined length.", "bbox": {"l": 308.862, "t": 512.63126, "r": 409.39459, "b": 521.53781, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "The input feature vector of the", "bbox": {"l": 416.72705, "t": 512.63126, "r": 545.11505, "b": 521.53781, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "encoded image is passed to the", "bbox": {"l": 308.862, "t": 524.58624, "r": 436.194, "b": 533.4928, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "Structure Decoder", "bbox": {"l": 439.526, "t": 524.6759, "r": 513.86694, "b": 533.26367, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "to pro-", "bbox": {"l": 517.43201, "t": 524.58624, "r": 545.10815, "b": 533.4928, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "duce a sequence of HTML tags that represent the structure", "bbox": {"l": 308.862, "t": 536.54124, "r": 545.11511, "b": 545.4478, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "of the table.", "bbox": {"l": 308.862, "t": 548.49625, "r": 358.5455, "b": 557.4028000000001, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "With each prediction of an HTML standard", "bbox": {"l": 365.19055, "t": 548.49625, "r": 545.11517, "b": 557.4028000000001, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "data cell (\u2018", "bbox": {"l": 308.862, "t": 560.45125, "r": 352.40851, "b": 569.3578, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "<", "bbox": {"l": 352.409, "t": 560.29184, "r": 360.1579, "b": 569.13863, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "td", "bbox": {"l": 360.15799, "t": 560.45125, "r": 367.90891, "b": 569.3578, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": ">", "bbox": {"l": 367.909, "t": 560.29184, "r": 375.6579, "b": 569.13863, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "\u2019) the hidden state of that cell is passed to", "bbox": {"l": 375.65799, "t": 560.45125, "r": 545.11182, "b": 569.3578, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "the Cell BBox Decoder. As for spanning cells, such as row", "bbox": {"l": 308.862, "t": 572.40724, "r": 545.11499, "b": 581.3138, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "or column span, the tag is broken down to \u2018", "bbox": {"l": 308.862, "t": 584.3622399999999, "r": 483.11768, "b": 593.2688, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "<", "bbox": {"l": 483.11902, "t": 584.20284, "r": 490.86792, "b": 593.04962, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "\u2019, \u2018rowspan=\u2019", "bbox": {"l": 490.86800999999997, "t": 584.3622399999999, "r": 545.11438, "b": 593.2688, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "or \u2018colspan=\u2019, with the number of spanning cells (attribute),", "bbox": {"l": 308.862, "t": 596.31725, "r": 545.11493, "b": 605.2238, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "and \u2018", "bbox": {"l": 308.862, "t": 608.27225, "r": 329.64395, "b": 617.1788, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": ">", "bbox": {"l": 329.646, "t": 608.11284, "r": 337.3949, "b": 616.9596300000001, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "\u2019. The hidden state attached to \u2018", "bbox": {"l": 337.39398, "t": 608.27225, "r": 468.5914, "b": 617.1788, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "<", "bbox": {"l": 468.59496999999993, "t": 608.11284, "r": 476.34387000000004, "b": 616.9596300000001, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "\u2019 is passed to the", "bbox": {"l": 476.3439599999999, "t": 608.27225, "r": 545.11572, "b": 617.1788, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "Cell BBox Decoder. A shared feed forward network (FFN)", "bbox": {"l": 308.86197, "t": 620.22725, "r": 545.11499, "b": 629.1338000000001, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "receives the hidden states from the Structure Decoder, to", "bbox": {"l": 308.86197, "t": 632.1822500000001, "r": 545.11517, "b": 641.08881, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "provide the final detection predictions of the bounding box", "bbox": {"l": 308.86197, "t": 644.13824, "r": 545.11511, "b": 653.0448, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "coordinates and their classification.", "bbox": {"l": 308.86197, "t": 656.09325, "r": 449.42432, "b": 664.99981, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "text", "bbox": {"l": 308.86197, "t": 668.2607, "r": 545.11511, "b": 713.1518169999999, "coord_origin": "TOPLEFT"}, "confidence": 0.978580117225647, "cells": [{"id": 152, "text": "CNN Backbone Network.", "bbox": {"l": 320.81696, "t": 668.2607, "r": 431.90985, "b": 677.21707, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "A ResNet-18 CNN is the", "bbox": {"l": 439.49896, "t": 668.3802499999999, "r": 545.11255, "b": 677.2868100000001, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "backbone that receives the table image and encodes it as a", "bbox": {"l": 308.86197, "t": 680.33525, "r": 545.11499, "b": 689.24181, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "vector of predefined length. The network has been modified", "bbox": {"l": 308.86197, "t": 692.290253, "r": 545.11511, "b": 701.196815, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "by removing the linear and pooling layer, as we are not per-", "bbox": {"l": 308.86197, "t": 704.245255, "r": 545.11505, "b": 713.1518169999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "page_footer", "bbox": {"l": 295.12097, "t": 734.133251, "r": 300.10226, "b": 743.039814, "coord_origin": "TOPLEFT"}, "confidence": 0.8565719723701477, "cells": [{"id": 157, "text": "4", "bbox": {"l": 295.12097, "t": 734.133251, "r": 300.10226, "b": 743.039814, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {"8": {"label": "table", "id": 8, "page_no": 3, "cluster": {"id": 8, "label": "table", "bbox": {"l": 310.67584228515625, "t": 73.19387817382812, "r": 542.9547119140625, "b": 155.22052001953125, "coord_origin": "TOPLEFT"}, "confidence": 0.9777463674545288, "cells": [{"id": 57, "text": "Tags", "bbox": {"l": 412.332, "t": 73.61437999999998, "r": 430.90231, "b": 82.52094, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Bbox", "bbox": {"l": 442.85742, "t": 73.61437999999998, "r": 464.4463799999999, "b": 82.52094, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Size", "bbox": {"l": 477.78632, "t": 73.61437999999998, "r": 494.94193, "b": 82.52094, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Format", "bbox": {"l": 508.28186, "t": 73.61437999999998, "r": 536.91437, "b": 82.52094, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "PubTabNet", "bbox": {"l": 317.06, "t": 85.9673499999999, "r": 361.64264, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "3", "bbox": {"l": 417.85599, "t": 85.6684600000001, "r": 425.37775, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "3", "bbox": {"l": 449.89569, "t": 85.6684600000001, "r": 457.41745000000003, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "509k", "bbox": {"l": 476.401, "t": 85.9673499999999, "r": 496.3262, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "PNG", "bbox": {"l": 512.63495, "t": 85.9673499999999, "r": 532.56012, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "FinTabNet", "bbox": {"l": 317.06, "t": 97.92236000000003, "r": 359.43094, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "3", "bbox": {"l": 417.85599, "t": 97.62347, "r": 425.37775, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "3", "bbox": {"l": 449.89569, "t": 97.62347, "r": 457.41745000000003, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "112k", "bbox": {"l": 476.401, "t": 97.92236000000003, "r": 496.3262, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "PDF", "bbox": {"l": 513.46185, "t": 97.92236000000003, "r": 531.73328, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "TableBank", "bbox": {"l": 317.06, "t": 109.87836000000004, "r": 359.97888, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "3", "bbox": {"l": 417.85599, "t": 109.57947000000001, "r": 425.37775, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "7", "bbox": {"l": 450.81226, "t": 109.57947000000001, "r": 456.50091999999995, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "145k", "bbox": {"l": 476.401, "t": 109.87836000000004, "r": 496.3262, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "JPEG", "bbox": {"l": 511.25017999999994, "t": 109.87836000000004, "r": 533.94501, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "Combined-Tabnet(*)", "bbox": {"l": 317.06, "t": 121.83336999999995, "r": 400.37723, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "3", "bbox": {"l": 417.85599, "t": 121.53448000000003, "r": 425.37775, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "3", "bbox": {"l": 449.89569, "t": 121.53448000000003, "r": 457.41745000000003, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "400k", "bbox": {"l": 476.401, "t": 121.83336999999995, "r": 496.3262, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "PNG", "bbox": {"l": 512.63495, "t": 121.83336999999995, "r": 532.56012, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Combined(**)", "bbox": {"l": 317.06, "t": 133.78839000000005, "r": 375.17184, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "3", "bbox": {"l": 417.85599, "t": 133.48950000000002, "r": 425.37775, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "3", "bbox": {"l": 449.89569, "t": 133.48950000000002, "r": 457.41745000000003, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "500k", "bbox": {"l": 476.401, "t": 133.78839000000005, "r": 496.3262, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "PNG", "bbox": {"l": 512.63495, "t": 133.78839000000005, "r": 532.56012, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "SynthTabNet", "bbox": {"l": 317.06, "t": 145.74341000000004, "r": 369.39352, "b": 154.64995999999996, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "3", "bbox": {"l": 417.85599, "t": 145.44446000000005, "r": 425.37775, "b": 154.65985, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "3", "bbox": {"l": 449.89569, "t": 145.44446000000005, "r": 457.41745000000003, "b": 154.65985, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "600k", "bbox": {"l": 476.401, "t": 145.74334999999996, "r": 496.3262, "b": 154.6499, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "PNG", "bbox": {"l": 512.63495, "t": 145.74334999999996, "r": 532.56012, "b": 154.6499, "coord_origin": "TOPLEFT"}}], "children": [{"id": 15, "label": "text", "bbox": {"l": 412.332, "t": 73.61437999999998, "r": 430.90231, "b": 82.52094, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "Tags", "bbox": {"l": 412.332, "t": 73.61437999999998, "r": 430.90231, "b": 82.52094, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 442.85742, "t": 73.61437999999998, "r": 464.4463799999999, "b": 82.52094, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "Bbox", "bbox": {"l": 442.85742, "t": 73.61437999999998, "r": 464.4463799999999, "b": 82.52094, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 477.78632, "t": 73.61437999999998, "r": 494.94193, "b": 82.52094, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "Size", "bbox": {"l": 477.78632, "t": 73.61437999999998, "r": 494.94193, "b": 82.52094, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 508.28186, "t": 73.61437999999998, "r": 536.91437, "b": 82.52094, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "Format", "bbox": {"l": 508.28186, "t": 73.61437999999998, "r": 536.91437, "b": 82.52094, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 317.06, "t": 85.9673499999999, "r": 361.64264, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "PubTabNet", "bbox": {"l": 317.06, "t": 85.9673499999999, "r": 361.64264, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 417.85599, "t": 85.6684600000001, "r": 425.37775, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "3", "bbox": {"l": 417.85599, "t": 85.6684600000001, "r": 425.37775, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 449.89569, "t": 85.6684600000001, "r": 457.41745000000003, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "3", "bbox": {"l": 449.89569, "t": 85.6684600000001, "r": 457.41745000000003, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 476.401, "t": 85.9673499999999, "r": 496.3262, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "509k", "bbox": {"l": 476.401, "t": 85.9673499999999, "r": 496.3262, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 512.63495, "t": 85.9673499999999, "r": 532.56012, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "PNG", "bbox": {"l": 512.63495, "t": 85.9673499999999, "r": 532.56012, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 317.06, "t": 97.92236000000003, "r": 359.43094, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "FinTabNet", "bbox": {"l": 317.06, "t": 97.92236000000003, "r": 359.43094, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 417.85599, "t": 97.62347, "r": 425.37775, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "3", "bbox": {"l": 417.85599, "t": 97.62347, "r": 425.37775, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 449.89569, "t": 97.62347, "r": 457.41745000000003, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "3", "bbox": {"l": 449.89569, "t": 97.62347, "r": 457.41745000000003, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 476.401, "t": 97.92236000000003, "r": 496.3262, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "112k", "bbox": {"l": 476.401, "t": 97.92236000000003, "r": 496.3262, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 513.46185, "t": 97.92236000000003, "r": 531.73328, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "PDF", "bbox": {"l": 513.46185, "t": 97.92236000000003, "r": 531.73328, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 317.06, "t": 109.87836000000004, "r": 359.97888, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "TableBank", "bbox": {"l": 317.06, "t": 109.87836000000004, "r": 359.97888, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 417.85599, "t": 109.57947000000001, "r": 425.37775, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "3", "bbox": {"l": 417.85599, "t": 109.57947000000001, "r": 425.37775, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 450.81226, "t": 109.57947000000001, "r": 456.50091999999995, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "7", "bbox": {"l": 450.81226, "t": 109.57947000000001, "r": 456.50091999999995, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 476.401, "t": 109.87836000000004, "r": 496.3262, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "145k", "bbox": {"l": 476.401, "t": 109.87836000000004, "r": 496.3262, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 511.25017999999994, "t": 109.87836000000004, "r": 533.94501, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "JPEG", "bbox": {"l": 511.25017999999994, "t": 109.87836000000004, "r": 533.94501, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 317.06, "t": 121.83336999999995, "r": 400.37723, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "Combined-Tabnet(*)", "bbox": {"l": 317.06, "t": 121.83336999999995, "r": 400.37723, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 417.85599, "t": 121.53448000000003, "r": 425.37775, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "3", "bbox": {"l": 417.85599, "t": 121.53448000000003, "r": 425.37775, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 449.89569, "t": 121.53448000000003, "r": 457.41745000000003, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "3", "bbox": {"l": 449.89569, "t": 121.53448000000003, "r": 457.41745000000003, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 476.401, "t": 121.83336999999995, "r": 496.3262, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "400k", "bbox": {"l": 476.401, "t": 121.83336999999995, "r": 496.3262, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 512.63495, "t": 121.83336999999995, "r": 532.56012, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "PNG", "bbox": {"l": 512.63495, "t": 121.83336999999995, "r": 532.56012, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 317.06, "t": 133.78839000000005, "r": 375.17184, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "Combined(**)", "bbox": {"l": 317.06, "t": 133.78839000000005, "r": 375.17184, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 417.85599, "t": 133.48950000000002, "r": 425.37775, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "3", "bbox": {"l": 417.85599, "t": 133.48950000000002, "r": 425.37775, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 449.89569, "t": 133.48950000000002, "r": 457.41745000000003, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "3", "bbox": {"l": 449.89569, "t": 133.48950000000002, "r": 457.41745000000003, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 476.401, "t": 133.78839000000005, "r": 496.3262, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "500k", "bbox": {"l": 476.401, "t": 133.78839000000005, "r": 496.3262, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 512.63495, "t": 133.78839000000005, "r": 532.56012, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "PNG", "bbox": {"l": 512.63495, "t": 133.78839000000005, "r": 532.56012, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 317.06, "t": 145.74341000000004, "r": 369.39352, "b": 154.64995999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "SynthTabNet", "bbox": {"l": 317.06, "t": 145.74341000000004, "r": 369.39352, "b": 154.64995999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 417.85599, "t": 145.44446000000005, "r": 425.37775, "b": 154.65985, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "3", "bbox": {"l": 417.85599, "t": 145.44446000000005, "r": 425.37775, "b": 154.65985, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 449.89569, "t": 145.44446000000005, "r": 457.41745000000003, "b": 154.65985, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "3", "bbox": {"l": 449.89569, "t": 145.44446000000005, "r": 457.41745000000003, "b": 154.65985, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 476.401, "t": 145.74334999999996, "r": 496.3262, "b": 154.6499, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "600k", "bbox": {"l": 476.401, "t": 145.74334999999996, "r": 496.3262, "b": 154.6499, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 512.63495, "t": 145.74334999999996, "r": 532.56012, "b": 154.6499, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "PNG", "bbox": {"l": 512.63495, "t": 145.74334999999996, "r": 532.56012, "b": 154.6499, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ecel", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 7, "num_cols": 5, "table_cells": [{"bbox": {"l": 412.332, "t": 73.61437999999998, "r": 430.90231, "b": 82.52094, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Tags", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 442.85742, "t": 73.61437999999998, "r": 464.4463799999999, "b": 82.52094, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Bbox", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 477.78632, "t": 73.61437999999998, "r": 494.94193, "b": 82.52094, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Size", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 508.28186, "t": 73.61437999999998, "r": 536.91437, "b": 82.52094, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Format", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 317.06, "t": 85.9673499999999, "r": 361.64264, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PubTabNet", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 417.85599, "t": 85.6684600000001, "r": 425.37775, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 449.89569, "t": 85.6684600000001, "r": 457.41745000000003, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 476.401, "t": 85.9673499999999, "r": 496.3262, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "509k", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 512.63495, "t": 85.9673499999999, "r": 532.56012, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "PNG", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 317.06, "t": 97.92236000000003, "r": 359.43094, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "FinTabNet", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 417.85599, "t": 97.62347, "r": 425.37775, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 449.89569, "t": 97.62347, "r": 457.41745000000003, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 476.401, "t": 97.92236000000003, "r": 496.3262, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "112k", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 513.46185, "t": 97.92236000000003, "r": 531.73328, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "PDF", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 317.06, "t": 109.87836000000004, "r": 359.97888, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableBank", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 417.85599, "t": 109.57947000000001, "r": 425.37775, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 450.81226, "t": 109.57947000000001, "r": 456.50091999999995, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 476.401, "t": 109.87836000000004, "r": 496.3262, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "145k", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 511.25017999999994, "t": 109.87836000000004, "r": 533.94501, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "JPEG", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 317.06, "t": 121.83336999999995, "r": 400.37723, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Combined-Tabnet(*)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 417.85599, "t": 121.53448000000003, "r": 425.37775, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 449.89569, "t": 121.53448000000003, "r": 457.41745000000003, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 476.401, "t": 121.83336999999995, "r": 496.3262, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "400k", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 512.63495, "t": 121.83336999999995, "r": 532.56012, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "PNG", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 317.06, "t": 133.78839000000005, "r": 375.17184, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Combined(**)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 417.85599, "t": 133.48950000000002, "r": 425.37775, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 449.89569, "t": 133.48950000000002, "r": 457.41745000000003, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 476.401, "t": 133.78839000000005, "r": 496.3262, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "500k", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 512.63495, "t": 133.78839000000005, "r": 532.56012, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "PNG", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 317.06, "t": 145.74341000000004, "r": 369.39352, "b": 154.64995999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "SynthTabNet", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 417.85599, "t": 145.44446000000005, "r": 425.37775, "b": 154.65985, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 449.89569, "t": 145.44446000000005, "r": 457.41745000000003, "b": 154.65985, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 476.401, "t": 145.74334999999996, "r": 496.3262, "b": 154.6499, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "600k", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 512.63495, "t": 145.74334999999996, "r": 532.56012, "b": 154.6499, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "PNG", "column_header": false, "row_header": false, "row_section": false}]}}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "text", "id": 10, "page_no": 3, "cluster": {"id": 10, "label": "text", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 286.36511, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.961143434047699, "cells": [{"id": 0, "text": "amount of such tables, and kept only those ones ranging", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 286.36511, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "between 1*1 and 20*10 (rows/columns).", "bbox": {"l": 50.112, "t": 87.16339000000005, "r": 212.28319, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "amount of such tables, and kept only those ones ranging between 1*1 and 20*10 (rows/columns)."}, {"label": "text", "id": 1, "page_no": 3, "cluster": {"id": 1, "label": "text", "bbox": {"l": 50.112, "t": 100.96038999999996, "r": 286.36514, "b": 313.10507, "coord_origin": "TOPLEFT"}, "confidence": 0.988013744354248, "cells": [{"id": 2, "text": "The availability of the bounding boxes for all table cells", "bbox": {"l": 62.067001, "t": 100.96038999999996, "r": 286.36502, "b": 109.86694, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "is essential to train our models. In order to distinguish be-", "bbox": {"l": 50.112, "t": 112.91540999999995, "r": 286.36508, "b": 121.82195999999999, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "tween empty and non-empty bounding boxes, we have in-", "bbox": {"l": 50.112, "t": 124.87041999999997, "r": 286.36508, "b": 133.77697999999998, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "troduced a binary class in the annotation. Unfortunately, the", "bbox": {"l": 50.112, "t": 136.82641999999998, "r": 286.36511, "b": 145.73297000000002, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "original datasets either omit the bounding boxes for whole", "bbox": {"l": 50.112, "t": 148.78143, "r": 286.36511, "b": 157.68799, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "tables (e.g. TableBank) or they narrow their scope only to", "bbox": {"l": 50.112, "t": 160.73645, "r": 286.36508, "b": 169.64301, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "non-empty cells. Therefore, it was imperative to introduce", "bbox": {"l": 50.112, "t": 172.69146999999998, "r": 286.36505, "b": 181.59802000000002, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "a data pre-processing procedure that generates the missing", "bbox": {"l": 50.112, "t": 184.64648, "r": 286.36508, "b": 193.55304, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "bounding boxes out of the annotation information. This pro-", "bbox": {"l": 50.112, "t": 196.60248, "r": 286.36508, "b": 205.50903000000005, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "cedure first parses the provided table structure and calcu-", "bbox": {"l": 50.112, "t": 208.5575, "r": 286.36508, "b": 217.46405000000004, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "lates the dimensions of the most fine-grained grid that cov-", "bbox": {"l": 50.112, "t": 220.51251000000002, "r": 286.36511, "b": 229.41907000000003, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "ers the table structure. Notice that each table cell may oc-", "bbox": {"l": 50.112, "t": 232.46753, "r": 286.36508, "b": 241.37408000000005, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "cupy multiple grid squares due to row or column spans. In", "bbox": {"l": 50.112, "t": 244.42255, "r": 286.36508, "b": 253.32910000000004, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "case of PubTabNet we had to compute missing bounding", "bbox": {"l": 50.112, "t": 256.37756, "r": 286.36505, "b": 265.28412000000003, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "boxes for 48% of the simple and 69% of the complex ta-", "bbox": {"l": 50.112, "t": 268.33356000000003, "r": 286.36505, "b": 277.24010999999996, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "bles.", "bbox": {"l": 50.112, "t": 280.28853999999995, "r": 68.652397, "b": 289.1951, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Regarding FinTabNet, 68% of the simple and 98%", "bbox": {"l": 75.566444, "t": 280.28853999999995, "r": 286.36514, "b": 289.1951, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "of the complex tables require the generation of bounding", "bbox": {"l": 50.112, "t": 292.24353, "r": 286.36511, "b": 301.15009, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "boxes.", "bbox": {"l": 50.112, "t": 304.19852000000003, "r": 75.695961, "b": 313.10507, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The availability of the bounding boxes for all table cells is essential to train our models. In order to distinguish between empty and non-empty bounding boxes, we have introduced a binary class in the annotation. Unfortunately, the original datasets either omit the bounding boxes for whole tables (e.g. TableBank) or they narrow their scope only to non-empty cells. Therefore, it was imperative to introduce a data pre-processing procedure that generates the missing bounding boxes out of the annotation information. This procedure first parses the provided table structure and calculates the dimensions of the most fine-grained grid that covers the table structure. Notice that each table cell may occupy multiple grid squares due to row or column spans. In case of PubTabNet we had to compute missing bounding boxes for 48% of the simple and 69% of the complex tables. Regarding FinTabNet, 68% of the simple and 98% of the complex tables require the generation of bounding boxes."}, {"label": "text", "id": 4, "page_no": 3, "cluster": {"id": 4, "label": "text", "bbox": {"l": 50.112, "t": 317.99550999999997, "r": 286.36511, "b": 434.49896, "coord_origin": "TOPLEFT"}, "confidence": 0.9873981475830078, "cells": [{"id": 21, "text": "As it is illustrated in Fig. 2, the table distributions from", "bbox": {"l": 62.067001, "t": 317.99550999999997, "r": 286.36499, "b": 326.90207, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "all datasets are skewed towards simpler structures with", "bbox": {"l": 50.112, "t": 329.95151, "r": 286.36511, "b": 338.8580600000001, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "fewer number of rows/columns. Additionally, there is very", "bbox": {"l": 50.112, "t": 341.90649, "r": 286.36502, "b": 350.81305, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "limited variance in the table styles, which in case of Pub-", "bbox": {"l": 50.112, "t": 353.8614799999999, "r": 286.36505, "b": 362.76804, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "TabNet and FinTabNet means one styling format for the", "bbox": {"l": 50.112, "t": 365.81647, "r": 286.36508, "b": 374.72301999999996, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "majority of the tables.", "bbox": {"l": 50.112, "t": 377.77145, "r": 141.58859, "b": 386.67801, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Similar limitations appear also in", "bbox": {"l": 148.70189, "t": 377.77145, "r": 286.36508, "b": 386.67801, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "the type of table content, which in some cases (e.g. FinTab-", "bbox": {"l": 50.112, "t": 389.72644, "r": 286.36508, "b": 398.63300000000004, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Net) is restricted to a certain domain. Ultimately, the lack", "bbox": {"l": 50.112, "t": 401.68243, "r": 286.36511, "b": 410.58899, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "of diversity in the training dataset damages the ability of the", "bbox": {"l": 50.112, "t": 413.63742, "r": 286.36511, "b": 422.54398, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "models to generalize well on unseen data.", "bbox": {"l": 50.112, "t": 425.59241, "r": 216.39774, "b": 434.49896, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "As it is illustrated in Fig. 2, the table distributions from all datasets are skewed towards simpler structures with fewer number of rows/columns. Additionally, there is very limited variance in the table styles, which in case of PubTabNet and FinTabNet means one styling format for the majority of the tables. Similar limitations appear also in the type of table content, which in some cases (e.g. FinTabNet) is restricted to a certain domain. Ultimately, the lack of diversity in the training dataset damages the ability of the models to generalize well on unseen data."}, {"label": "text", "id": 3, "page_no": 3, "cluster": {"id": 3, "label": "text", "bbox": {"l": 50.112, "t": 439.3894, "r": 286.36655, "b": 627.62389, "coord_origin": "TOPLEFT"}, "confidence": 0.9876030087471008, "cells": [{"id": 32, "text": "Motivated by those observations we aimed at generating", "bbox": {"l": 62.067001, "t": 439.3894, "r": 286.36499, "b": 448.2959599999999, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "a synthetic table dataset named", "bbox": {"l": 50.112, "t": 451.34439, "r": 172.14388, "b": 460.25095, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "SynthTabNet", "bbox": {"l": 174.14801, "t": 451.43405, "r": 224.70818999999997, "b": 460.02182, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": ". This approach", "bbox": {"l": 224.70801, "t": 451.34439, "r": 286.36655, "b": 460.25095, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "offers control over: 1) the size of the dataset, 2) the table", "bbox": {"l": 50.112015, "t": 463.30038, "r": 286.36505, "b": 472.20694, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "structure, 3) the table style and 4) the type of content. The", "bbox": {"l": 50.112015, "t": 475.25537, "r": 286.36511, "b": 484.16193, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "complexity of the table structure is described by the size of", "bbox": {"l": 50.112015, "t": 487.21036, "r": 286.36511, "b": 496.11691, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "the table header and the table body, as well as the percentage", "bbox": {"l": 50.112015, "t": 499.16534, "r": 286.36508, "b": 508.0719, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "of the table cells covered by row spans and column spans.", "bbox": {"l": 50.112015, "t": 511.12033, "r": 286.36505, "b": 520.02689, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "A set of carefully designed styling templates provides the", "bbox": {"l": 50.112015, "t": 523.07632, "r": 286.36508, "b": 531.98288, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "basis to build a wide range of table appearances. Lastly, the", "bbox": {"l": 50.112015, "t": 535.0313100000001, "r": 286.36508, "b": 543.93788, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "table content is generated out of a curated collection of text", "bbox": {"l": 50.112015, "t": 546.98633, "r": 286.36511, "b": 555.89288, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "corpora. By controlling the size and scope of the synthetic", "bbox": {"l": 50.112015, "t": 558.94133, "r": 286.36508, "b": 567.84789, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "datasets we are able to train and evaluate our models in a", "bbox": {"l": 50.112015, "t": 570.89633, "r": 286.36511, "b": 579.8028899999999, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "variety of different conditions. For example, we can first", "bbox": {"l": 50.112015, "t": 582.85133, "r": 286.36511, "b": 591.75789, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "generate a highly diverse dataset to train our models and", "bbox": {"l": 50.112015, "t": 594.80733, "r": 286.36505, "b": 603.71388, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "then evaluate their performance on other synthetic datasets", "bbox": {"l": 50.112015, "t": 606.76233, "r": 286.36508, "b": 615.6688800000001, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "which are focused on a specific domain.", "bbox": {"l": 50.112015, "t": 618.71733, "r": 209.7527, "b": 627.62389, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Motivated by those observations we aimed at generating a synthetic table dataset named SynthTabNet . This approach offers control over: 1) the size of the dataset, 2) the table structure, 3) the table style and 4) the type of content. The complexity of the table structure is described by the size of the table header and the table body, as well as the percentage of the table cells covered by row spans and column spans. A set of carefully designed styling templates provides the basis to build a wide range of table appearances. Lastly, the table content is generated out of a curated collection of text corpora. By controlling the size and scope of the synthetic datasets we are able to train and evaluate our models in a variety of different conditions. For example, we can first generate a highly diverse dataset to train our models and then evaluate their performance on other synthetic datasets which are focused on a specific domain."}, {"label": "text", "id": 5, "page_no": 3, "cluster": {"id": 5, "label": "text", "bbox": {"l": 50.112015, "t": 632.51433, "r": 286.36511, "b": 713.151894, "coord_origin": "TOPLEFT"}, "confidence": 0.9871614575386047, "cells": [{"id": 50, "text": "In this regard, we have prepared four synthetic datasets,", "bbox": {"l": 62.067017, "t": 632.51433, "r": 286.36499, "b": 641.42088, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "each one containing 150k examples. The corpora to gener-", "bbox": {"l": 50.112015, "t": 644.46933, "r": 286.36508, "b": 653.37589, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "ate the table text consists of the most frequent terms appear-", "bbox": {"l": 50.112015, "t": 656.42532, "r": 286.36511, "b": 665.33189, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "ing in PubTabNet and FinTabNet together with randomly", "bbox": {"l": 50.112015, "t": 668.38033, "r": 286.36505, "b": 677.28689, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "generated text. The first two synthetic datasets have been", "bbox": {"l": 50.112015, "t": 680.33533, "r": 286.36508, "b": 689.24189, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "fine-tuned to mimic the appearance of the original datasets", "bbox": {"l": 50.112015, "t": 692.290329, "r": 286.36508, "b": 701.196892, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "but encompass more complicated table structures. The third", "bbox": {"l": 50.112015, "t": 704.245331, "r": 286.36511, "b": 713.151894, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In this regard, we have prepared four synthetic datasets, each one containing 150k examples. The corpora to generate the table text consists of the most frequent terms appearing in PubTabNet and FinTabNet together with randomly generated text. The first two synthetic datasets have been fine-tuned to mimic the appearance of the original datasets but encompass more complicated table structures. The third"}, {"label": "table", "id": 8, "page_no": 3, "cluster": {"id": 8, "label": "table", "bbox": {"l": 310.67584228515625, "t": 73.19387817382812, "r": 542.9547119140625, "b": 155.22052001953125, "coord_origin": "TOPLEFT"}, "confidence": 0.9777463674545288, "cells": [{"id": 57, "text": "Tags", "bbox": {"l": 412.332, "t": 73.61437999999998, "r": 430.90231, "b": 82.52094, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Bbox", "bbox": {"l": 442.85742, "t": 73.61437999999998, "r": 464.4463799999999, "b": 82.52094, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Size", "bbox": {"l": 477.78632, "t": 73.61437999999998, "r": 494.94193, "b": 82.52094, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Format", "bbox": {"l": 508.28186, "t": 73.61437999999998, "r": 536.91437, "b": 82.52094, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "PubTabNet", "bbox": {"l": 317.06, "t": 85.9673499999999, "r": 361.64264, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "3", "bbox": {"l": 417.85599, "t": 85.6684600000001, "r": 425.37775, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "3", "bbox": {"l": 449.89569, "t": 85.6684600000001, "r": 457.41745000000003, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "509k", "bbox": {"l": 476.401, "t": 85.9673499999999, "r": 496.3262, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "PNG", "bbox": {"l": 512.63495, "t": 85.9673499999999, "r": 532.56012, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "FinTabNet", "bbox": {"l": 317.06, "t": 97.92236000000003, "r": 359.43094, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "3", "bbox": {"l": 417.85599, "t": 97.62347, "r": 425.37775, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "3", "bbox": {"l": 449.89569, "t": 97.62347, "r": 457.41745000000003, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "112k", "bbox": {"l": 476.401, "t": 97.92236000000003, "r": 496.3262, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "PDF", "bbox": {"l": 513.46185, "t": 97.92236000000003, "r": 531.73328, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "TableBank", "bbox": {"l": 317.06, "t": 109.87836000000004, "r": 359.97888, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "3", "bbox": {"l": 417.85599, "t": 109.57947000000001, "r": 425.37775, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "7", "bbox": {"l": 450.81226, "t": 109.57947000000001, "r": 456.50091999999995, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "145k", "bbox": {"l": 476.401, "t": 109.87836000000004, "r": 496.3262, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "JPEG", "bbox": {"l": 511.25017999999994, "t": 109.87836000000004, "r": 533.94501, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "Combined-Tabnet(*)", "bbox": {"l": 317.06, "t": 121.83336999999995, "r": 400.37723, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "3", "bbox": {"l": 417.85599, "t": 121.53448000000003, "r": 425.37775, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "3", "bbox": {"l": 449.89569, "t": 121.53448000000003, "r": 457.41745000000003, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "400k", "bbox": {"l": 476.401, "t": 121.83336999999995, "r": 496.3262, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "PNG", "bbox": {"l": 512.63495, "t": 121.83336999999995, "r": 532.56012, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Combined(**)", "bbox": {"l": 317.06, "t": 133.78839000000005, "r": 375.17184, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "3", "bbox": {"l": 417.85599, "t": 133.48950000000002, "r": 425.37775, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "3", "bbox": {"l": 449.89569, "t": 133.48950000000002, "r": 457.41745000000003, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "500k", "bbox": {"l": 476.401, "t": 133.78839000000005, "r": 496.3262, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "PNG", "bbox": {"l": 512.63495, "t": 133.78839000000005, "r": 532.56012, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "SynthTabNet", "bbox": {"l": 317.06, "t": 145.74341000000004, "r": 369.39352, "b": 154.64995999999996, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "3", "bbox": {"l": 417.85599, "t": 145.44446000000005, "r": 425.37775, "b": 154.65985, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "3", "bbox": {"l": 449.89569, "t": 145.44446000000005, "r": 457.41745000000003, "b": 154.65985, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "600k", "bbox": {"l": 476.401, "t": 145.74334999999996, "r": 496.3262, "b": 154.6499, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "PNG", "bbox": {"l": 512.63495, "t": 145.74334999999996, "r": 532.56012, "b": 154.6499, "coord_origin": "TOPLEFT"}}], "children": [{"id": 15, "label": "text", "bbox": {"l": 412.332, "t": 73.61437999999998, "r": 430.90231, "b": 82.52094, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "Tags", "bbox": {"l": 412.332, "t": 73.61437999999998, "r": 430.90231, "b": 82.52094, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 442.85742, "t": 73.61437999999998, "r": 464.4463799999999, "b": 82.52094, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "Bbox", "bbox": {"l": 442.85742, "t": 73.61437999999998, "r": 464.4463799999999, "b": 82.52094, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 477.78632, "t": 73.61437999999998, "r": 494.94193, "b": 82.52094, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "Size", "bbox": {"l": 477.78632, "t": 73.61437999999998, "r": 494.94193, "b": 82.52094, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 508.28186, "t": 73.61437999999998, "r": 536.91437, "b": 82.52094, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "Format", "bbox": {"l": 508.28186, "t": 73.61437999999998, "r": 536.91437, "b": 82.52094, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 317.06, "t": 85.9673499999999, "r": 361.64264, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "PubTabNet", "bbox": {"l": 317.06, "t": 85.9673499999999, "r": 361.64264, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 417.85599, "t": 85.6684600000001, "r": 425.37775, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "3", "bbox": {"l": 417.85599, "t": 85.6684600000001, "r": 425.37775, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 449.89569, "t": 85.6684600000001, "r": 457.41745000000003, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "3", "bbox": {"l": 449.89569, "t": 85.6684600000001, "r": 457.41745000000003, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 476.401, "t": 85.9673499999999, "r": 496.3262, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "509k", "bbox": {"l": 476.401, "t": 85.9673499999999, "r": 496.3262, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 512.63495, "t": 85.9673499999999, "r": 532.56012, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "PNG", "bbox": {"l": 512.63495, "t": 85.9673499999999, "r": 532.56012, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 317.06, "t": 97.92236000000003, "r": 359.43094, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "FinTabNet", "bbox": {"l": 317.06, "t": 97.92236000000003, "r": 359.43094, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 417.85599, "t": 97.62347, "r": 425.37775, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "3", "bbox": {"l": 417.85599, "t": 97.62347, "r": 425.37775, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 449.89569, "t": 97.62347, "r": 457.41745000000003, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "3", "bbox": {"l": 449.89569, "t": 97.62347, "r": 457.41745000000003, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 476.401, "t": 97.92236000000003, "r": 496.3262, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "112k", "bbox": {"l": 476.401, "t": 97.92236000000003, "r": 496.3262, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 513.46185, "t": 97.92236000000003, "r": 531.73328, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "PDF", "bbox": {"l": 513.46185, "t": 97.92236000000003, "r": 531.73328, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 317.06, "t": 109.87836000000004, "r": 359.97888, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "TableBank", "bbox": {"l": 317.06, "t": 109.87836000000004, "r": 359.97888, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 417.85599, "t": 109.57947000000001, "r": 425.37775, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "3", "bbox": {"l": 417.85599, "t": 109.57947000000001, "r": 425.37775, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 450.81226, "t": 109.57947000000001, "r": 456.50091999999995, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "7", "bbox": {"l": 450.81226, "t": 109.57947000000001, "r": 456.50091999999995, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 476.401, "t": 109.87836000000004, "r": 496.3262, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "145k", "bbox": {"l": 476.401, "t": 109.87836000000004, "r": 496.3262, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 511.25017999999994, "t": 109.87836000000004, "r": 533.94501, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "JPEG", "bbox": {"l": 511.25017999999994, "t": 109.87836000000004, "r": 533.94501, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 317.06, "t": 121.83336999999995, "r": 400.37723, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "Combined-Tabnet(*)", "bbox": {"l": 317.06, "t": 121.83336999999995, "r": 400.37723, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 417.85599, "t": 121.53448000000003, "r": 425.37775, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "3", "bbox": {"l": 417.85599, "t": 121.53448000000003, "r": 425.37775, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 449.89569, "t": 121.53448000000003, "r": 457.41745000000003, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "3", "bbox": {"l": 449.89569, "t": 121.53448000000003, "r": 457.41745000000003, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 476.401, "t": 121.83336999999995, "r": 496.3262, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "400k", "bbox": {"l": 476.401, "t": 121.83336999999995, "r": 496.3262, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 512.63495, "t": 121.83336999999995, "r": 532.56012, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "PNG", "bbox": {"l": 512.63495, "t": 121.83336999999995, "r": 532.56012, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 317.06, "t": 133.78839000000005, "r": 375.17184, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "Combined(**)", "bbox": {"l": 317.06, "t": 133.78839000000005, "r": 375.17184, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 417.85599, "t": 133.48950000000002, "r": 425.37775, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "3", "bbox": {"l": 417.85599, "t": 133.48950000000002, "r": 425.37775, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 449.89569, "t": 133.48950000000002, "r": 457.41745000000003, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "3", "bbox": {"l": 449.89569, "t": 133.48950000000002, "r": 457.41745000000003, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 476.401, "t": 133.78839000000005, "r": 496.3262, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "500k", "bbox": {"l": 476.401, "t": 133.78839000000005, "r": 496.3262, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 512.63495, "t": 133.78839000000005, "r": 532.56012, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "PNG", "bbox": {"l": 512.63495, "t": 133.78839000000005, "r": 532.56012, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 317.06, "t": 145.74341000000004, "r": 369.39352, "b": 154.64995999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "SynthTabNet", "bbox": {"l": 317.06, "t": 145.74341000000004, "r": 369.39352, "b": 154.64995999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 417.85599, "t": 145.44446000000005, "r": 425.37775, "b": 154.65985, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "3", "bbox": {"l": 417.85599, "t": 145.44446000000005, "r": 425.37775, "b": 154.65985, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 449.89569, "t": 145.44446000000005, "r": 457.41745000000003, "b": 154.65985, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "3", "bbox": {"l": 449.89569, "t": 145.44446000000005, "r": 457.41745000000003, "b": 154.65985, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 476.401, "t": 145.74334999999996, "r": 496.3262, "b": 154.6499, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "600k", "bbox": {"l": 476.401, "t": 145.74334999999996, "r": 496.3262, "b": 154.6499, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 512.63495, "t": 145.74334999999996, "r": 532.56012, "b": 154.6499, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "PNG", "bbox": {"l": 512.63495, "t": 145.74334999999996, "r": 532.56012, "b": 154.6499, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ecel", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 7, "num_cols": 5, "table_cells": [{"bbox": {"l": 412.332, "t": 73.61437999999998, "r": 430.90231, "b": 82.52094, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Tags", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 442.85742, "t": 73.61437999999998, "r": 464.4463799999999, "b": 82.52094, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Bbox", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 477.78632, "t": 73.61437999999998, "r": 494.94193, "b": 82.52094, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Size", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 508.28186, "t": 73.61437999999998, "r": 536.91437, "b": 82.52094, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Format", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 317.06, "t": 85.9673499999999, "r": 361.64264, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PubTabNet", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 417.85599, "t": 85.6684600000001, "r": 425.37775, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 449.89569, "t": 85.6684600000001, "r": 457.41745000000003, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 476.401, "t": 85.9673499999999, "r": 496.3262, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "509k", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 512.63495, "t": 85.9673499999999, "r": 532.56012, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "PNG", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 317.06, "t": 97.92236000000003, "r": 359.43094, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "FinTabNet", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 417.85599, "t": 97.62347, "r": 425.37775, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 449.89569, "t": 97.62347, "r": 457.41745000000003, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 476.401, "t": 97.92236000000003, "r": 496.3262, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "112k", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 513.46185, "t": 97.92236000000003, "r": 531.73328, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "PDF", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 317.06, "t": 109.87836000000004, "r": 359.97888, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableBank", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 417.85599, "t": 109.57947000000001, "r": 425.37775, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 450.81226, "t": 109.57947000000001, "r": 456.50091999999995, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 476.401, "t": 109.87836000000004, "r": 496.3262, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "145k", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 511.25017999999994, "t": 109.87836000000004, "r": 533.94501, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "JPEG", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 317.06, "t": 121.83336999999995, "r": 400.37723, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Combined-Tabnet(*)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 417.85599, "t": 121.53448000000003, "r": 425.37775, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 449.89569, "t": 121.53448000000003, "r": 457.41745000000003, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 476.401, "t": 121.83336999999995, "r": 496.3262, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "400k", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 512.63495, "t": 121.83336999999995, "r": 532.56012, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "PNG", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 317.06, "t": 133.78839000000005, "r": 375.17184, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Combined(**)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 417.85599, "t": 133.48950000000002, "r": 425.37775, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 449.89569, "t": 133.48950000000002, "r": 457.41745000000003, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 476.401, "t": 133.78839000000005, "r": 496.3262, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "500k", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 512.63495, "t": 133.78839000000005, "r": 532.56012, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "PNG", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 317.06, "t": 145.74341000000004, "r": 369.39352, "b": 154.64995999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "SynthTabNet", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 417.85599, "t": 145.44446000000005, "r": 425.37775, "b": 154.65985, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 449.89569, "t": 145.44446000000005, "r": 457.41745000000003, "b": 154.65985, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 476.401, "t": 145.74334999999996, "r": 496.3262, "b": 154.6499, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "600k", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 512.63495, "t": 145.74334999999996, "r": 532.56012, "b": 154.6499, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "PNG", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "caption", "id": 9, "page_no": 3, "cluster": {"id": 9, "label": "caption", "bbox": {"l": 308.862, "t": 167.66138, "r": 545.11505, "b": 224.38897999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9667726755142212, "cells": [{"id": 91, "text": "Table 1:", "bbox": {"l": 308.862, "t": 167.66138, "r": 344.6178, "b": 176.56793000000005, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Both", "bbox": {"l": 361.07602, "t": 167.66138, "r": 380.45328, "b": 176.56793000000005, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "\u201cCombined-Tabnet\u201d", "bbox": {"l": 386.56799, "t": 167.75104, "r": 468.67974999999996, "b": 176.33880999999997, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "and", "bbox": {"l": 474.79599, "t": 167.66138, "r": 489.18198, "b": 176.56793000000005, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "\u201dCombined-", "bbox": {"l": 495.29898000000003, "t": 167.75104, "r": 545.112, "b": 176.33880999999997, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "Tabnet\u201d", "bbox": {"l": 308.862, "t": 179.70605, "r": 341.16077, "b": 188.29381999999998, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "are variations of the following: (*) The Combined-", "bbox": {"l": 343.457, "t": 179.61639000000002, "r": 545.11005, "b": 188.52295000000004, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "Tabnet dataset is the processed combination of PubTabNet", "bbox": {"l": 308.862, "t": 191.57141000000001, "r": 545.11505, "b": 200.47797000000003, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "and Fintabnet. (**) The combined dataset is the processed", "bbox": {"l": 308.862, "t": 203.52643, "r": 545.11499, "b": 212.43298000000004, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "combination of PubTabNet, Fintabnet and TableBank.", "bbox": {"l": 308.862, "t": 215.48242000000005, "r": 523.93469, "b": 224.38897999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 1: Both \u201cCombined-Tabnet\u201d and \u201dCombinedTabnet\u201d are variations of the following: (*) The CombinedTabnet dataset is the processed combination of PubTabNet and Fintabnet. (**) The combined dataset is the processed combination of PubTabNet, Fintabnet and TableBank."}, {"label": "text", "id": 6, "page_no": 3, "cluster": {"id": 6, "label": "text", "bbox": {"l": 308.862, "t": 249.62041999999997, "r": 545.11517, "b": 294.39197, "coord_origin": "TOPLEFT"}, "confidence": 0.9789542555809021, "cells": [{"id": 101, "text": "one adopts a colorful appearance with high contrast and the", "bbox": {"l": 308.862, "t": 249.62041999999997, "r": 545.11517, "b": 258.52698, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "last one contains tables with sparse content. Lastly, we have", "bbox": {"l": 308.862, "t": 261.57543999999996, "r": 545.11517, "b": 270.48199, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "combined all synthetic datasets into one big unified syn-", "bbox": {"l": 308.862, "t": 273.5304, "r": 545.11505, "b": 282.43698, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "thetic dataset of 600k examples.", "bbox": {"l": 308.862, "t": 285.48541000000006, "r": 436.82169, "b": 294.39197, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "one adopts a colorful appearance with high contrast and the last one contains tables with sparse content. Lastly, we have combined all synthetic datasets into one big unified synthetic dataset of 600k examples."}, {"label": "text", "id": 13, "page_no": 3, "cluster": {"id": 13, "label": "text", "bbox": {"l": 320.81699, "t": 297.77240000000006, "r": 542.74396, "b": 306.67896, "coord_origin": "TOPLEFT"}, "confidence": 0.9043694138526917, "cells": [{"id": 105, "text": "Tab. 1 summarizes the various attributes of the datasets.", "bbox": {"l": 320.81699, "t": 297.77240000000006, "r": 542.74396, "b": 306.67896, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Tab. 1 summarizes the various attributes of the datasets."}, {"label": "section_header", "id": 11, "page_no": 3, "cluster": {"id": 11, "label": "section_header", "bbox": {"l": 308.862, "t": 321.18396, "r": 444.93607000000003, "b": 331.93167000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9466594457626343, "cells": [{"id": 106, "text": "4.", "bbox": {"l": 308.862, "t": 321.18396, "r": 316.28476, "b": 331.93167000000005, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "The TableFormer model", "bbox": {"l": 326.18176, "t": 321.18396, "r": 444.93607000000003, "b": 331.93167000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4. The TableFormer model"}, {"label": "text", "id": 0, "page_no": 3, "cluster": {"id": 0, "label": "text", "bbox": {"l": 308.862, "t": 341.93939, "r": 545.11523, "b": 446.48685000000006, "coord_origin": "TOPLEFT"}, "confidence": 0.9884450435638428, "cells": [{"id": 108, "text": "Given the image of a table, TableFormer is able to pre-", "bbox": {"l": 320.81699, "t": 341.93939, "r": 545.11499, "b": 350.84594999999996, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "dict: 1) a sequence of tokens that represent the structure of", "bbox": {"l": 308.862, "t": 353.89438, "r": 545.11511, "b": 362.80092999999994, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "a table, and 2) a bounding box coupled to a subset of those", "bbox": {"l": 308.862, "t": 365.84937, "r": 545.11517, "b": 374.75592, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "tokens. The conversion of an image into a sequence of to-", "bbox": {"l": 308.862, "t": 377.80435, "r": 545.11505, "b": 386.71091, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "kens is a well-known task [35, 16]. While attention is often", "bbox": {"l": 308.862, "t": 389.75934000000007, "r": 545.11517, "b": 398.66588999999993, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "used as an implicit method to associate each token of the", "bbox": {"l": 308.862, "t": 401.71432000000004, "r": 545.11523, "b": 410.62088, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "sequence with a position in the original image, an explicit", "bbox": {"l": 308.862, "t": 413.67032, "r": 545.11517, "b": 422.57687, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "association between the individual table-cells and the image", "bbox": {"l": 308.862, "t": 425.62531, "r": 545.11505, "b": 434.53186, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "bounding boxes is also required.", "bbox": {"l": 308.862, "t": 437.58029, "r": 437.9375, "b": 446.48685000000006, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Given the image of a table, TableFormer is able to predict: 1) a sequence of tokens that represent the structure of a table, and 2) a bounding box coupled to a subset of those tokens. The conversion of an image into a sequence of tokens is a well-known task [35, 16]. While attention is often used as an implicit method to associate each token of the sequence with a position in the original image, an explicit association between the individual table-cells and the image bounding boxes is also required."}, {"label": "section_header", "id": 12, "page_no": 3, "cluster": {"id": 12, "label": "section_header", "bbox": {"l": 308.862, "t": 457.69427, "r": 420.16058, "b": 467.54633, "coord_origin": "TOPLEFT"}, "confidence": 0.9376963376998901, "cells": [{"id": 117, "text": "4.1.", "bbox": {"l": 308.862, "t": 457.69427, "r": 323.14081, "b": 467.54633, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "Model architecture.", "bbox": {"l": 332.66003, "t": 457.69427, "r": 420.16058, "b": 467.54633, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4.1. Model architecture."}, {"label": "text", "id": 2, "page_no": 3, "cluster": {"id": 2, "label": "text", "bbox": {"l": 308.86197, "t": 476.76529, "r": 545.11572, "b": 664.99981, "coord_origin": "TOPLEFT"}, "confidence": 0.9878323078155518, "cells": [{"id": 119, "text": "We now describe in detail the proposed method, which", "bbox": {"l": 320.81699, "t": 476.76529, "r": 545.11487, "b": 485.67184, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "is composed of three main components, see Fig.", "bbox": {"l": 308.862, "t": 488.72028, "r": 509.02054, "b": 497.62683, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "4.", "bbox": {"l": 515.58588, "t": 488.72028, "r": 523.05786, "b": 497.62683, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Our", "bbox": {"l": 529.62323, "t": 488.72028, "r": 545.11505, "b": 497.62683, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "CNN Backbone Network", "bbox": {"l": 308.862, "t": 500.76492, "r": 406.34601, "b": 509.35269, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "encodes the input as a feature vec-", "bbox": {"l": 408.87201, "t": 500.67526, "r": 545.1106, "b": 509.58182, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "tor of predefined length.", "bbox": {"l": 308.862, "t": 512.63126, "r": 409.39459, "b": 521.53781, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "The input feature vector of the", "bbox": {"l": 416.72705, "t": 512.63126, "r": 545.11505, "b": 521.53781, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "encoded image is passed to the", "bbox": {"l": 308.862, "t": 524.58624, "r": 436.194, "b": 533.4928, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "Structure Decoder", "bbox": {"l": 439.526, "t": 524.6759, "r": 513.86694, "b": 533.26367, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "to pro-", "bbox": {"l": 517.43201, "t": 524.58624, "r": 545.10815, "b": 533.4928, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "duce a sequence of HTML tags that represent the structure", "bbox": {"l": 308.862, "t": 536.54124, "r": 545.11511, "b": 545.4478, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "of the table.", "bbox": {"l": 308.862, "t": 548.49625, "r": 358.5455, "b": 557.4028000000001, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "With each prediction of an HTML standard", "bbox": {"l": 365.19055, "t": 548.49625, "r": 545.11517, "b": 557.4028000000001, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "data cell (\u2018", "bbox": {"l": 308.862, "t": 560.45125, "r": 352.40851, "b": 569.3578, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "<", "bbox": {"l": 352.409, "t": 560.29184, "r": 360.1579, "b": 569.13863, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "td", "bbox": {"l": 360.15799, "t": 560.45125, "r": 367.90891, "b": 569.3578, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": ">", "bbox": {"l": 367.909, "t": 560.29184, "r": 375.6579, "b": 569.13863, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "\u2019) the hidden state of that cell is passed to", "bbox": {"l": 375.65799, "t": 560.45125, "r": 545.11182, "b": 569.3578, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "the Cell BBox Decoder. As for spanning cells, such as row", "bbox": {"l": 308.862, "t": 572.40724, "r": 545.11499, "b": 581.3138, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "or column span, the tag is broken down to \u2018", "bbox": {"l": 308.862, "t": 584.3622399999999, "r": 483.11768, "b": 593.2688, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "<", "bbox": {"l": 483.11902, "t": 584.20284, "r": 490.86792, "b": 593.04962, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "\u2019, \u2018rowspan=\u2019", "bbox": {"l": 490.86800999999997, "t": 584.3622399999999, "r": 545.11438, "b": 593.2688, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "or \u2018colspan=\u2019, with the number of spanning cells (attribute),", "bbox": {"l": 308.862, "t": 596.31725, "r": 545.11493, "b": 605.2238, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "and \u2018", "bbox": {"l": 308.862, "t": 608.27225, "r": 329.64395, "b": 617.1788, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": ">", "bbox": {"l": 329.646, "t": 608.11284, "r": 337.3949, "b": 616.9596300000001, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "\u2019. The hidden state attached to \u2018", "bbox": {"l": 337.39398, "t": 608.27225, "r": 468.5914, "b": 617.1788, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "<", "bbox": {"l": 468.59496999999993, "t": 608.11284, "r": 476.34387000000004, "b": 616.9596300000001, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "\u2019 is passed to the", "bbox": {"l": 476.3439599999999, "t": 608.27225, "r": 545.11572, "b": 617.1788, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "Cell BBox Decoder. A shared feed forward network (FFN)", "bbox": {"l": 308.86197, "t": 620.22725, "r": 545.11499, "b": 629.1338000000001, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "receives the hidden states from the Structure Decoder, to", "bbox": {"l": 308.86197, "t": 632.1822500000001, "r": 545.11517, "b": 641.08881, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "provide the final detection predictions of the bounding box", "bbox": {"l": 308.86197, "t": 644.13824, "r": 545.11511, "b": 653.0448, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "coordinates and their classification.", "bbox": {"l": 308.86197, "t": 656.09325, "r": 449.42432, "b": 664.99981, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "We now describe in detail the proposed method, which is composed of three main components, see Fig. 4. Our CNN Backbone Network encodes the input as a feature vector of predefined length. The input feature vector of the encoded image is passed to the Structure Decoder to produce a sequence of HTML tags that represent the structure of the table. With each prediction of an HTML standard data cell (\u2018 < td > \u2019) the hidden state of that cell is passed to the Cell BBox Decoder. As for spanning cells, such as row or column span, the tag is broken down to \u2018 < \u2019, \u2018rowspan=\u2019 or \u2018colspan=\u2019, with the number of spanning cells (attribute), and \u2018 > \u2019. The hidden state attached to \u2018 < \u2019 is passed to the Cell BBox Decoder. A shared feed forward network (FFN) receives the hidden states from the Structure Decoder, to provide the final detection predictions of the bounding box coordinates and their classification."}, {"label": "text", "id": 7, "page_no": 3, "cluster": {"id": 7, "label": "text", "bbox": {"l": 308.86197, "t": 668.2607, "r": 545.11511, "b": 713.1518169999999, "coord_origin": "TOPLEFT"}, "confidence": 0.978580117225647, "cells": [{"id": 152, "text": "CNN Backbone Network.", "bbox": {"l": 320.81696, "t": 668.2607, "r": 431.90985, "b": 677.21707, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "A ResNet-18 CNN is the", "bbox": {"l": 439.49896, "t": 668.3802499999999, "r": 545.11255, "b": 677.2868100000001, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "backbone that receives the table image and encodes it as a", "bbox": {"l": 308.86197, "t": 680.33525, "r": 545.11499, "b": 689.24181, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "vector of predefined length. The network has been modified", "bbox": {"l": 308.86197, "t": 692.290253, "r": 545.11511, "b": 701.196815, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "by removing the linear and pooling layer, as we are not per-", "bbox": {"l": 308.86197, "t": 704.245255, "r": 545.11505, "b": 713.1518169999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "CNN Backbone Network. A ResNet-18 CNN is the backbone that receives the table image and encodes it as a vector of predefined length. The network has been modified by removing the linear and pooling layer, as we are not per-"}, {"label": "page_footer", "id": 14, "page_no": 3, "cluster": {"id": 14, "label": "page_footer", "bbox": {"l": 295.12097, "t": 734.133251, "r": 300.10226, "b": 743.039814, "coord_origin": "TOPLEFT"}, "confidence": 0.8565719723701477, "cells": [{"id": 157, "text": "4", "bbox": {"l": 295.12097, "t": 734.133251, "r": 300.10226, "b": 743.039814, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4"}], "body": [{"label": "text", "id": 10, "page_no": 3, "cluster": {"id": 10, "label": "text", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 286.36511, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.961143434047699, "cells": [{"id": 0, "text": "amount of such tables, and kept only those ones ranging", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 286.36511, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "between 1*1 and 20*10 (rows/columns).", "bbox": {"l": 50.112, "t": 87.16339000000005, "r": 212.28319, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "amount of such tables, and kept only those ones ranging between 1*1 and 20*10 (rows/columns)."}, {"label": "text", "id": 1, "page_no": 3, "cluster": {"id": 1, "label": "text", "bbox": {"l": 50.112, "t": 100.96038999999996, "r": 286.36514, "b": 313.10507, "coord_origin": "TOPLEFT"}, "confidence": 0.988013744354248, "cells": [{"id": 2, "text": "The availability of the bounding boxes for all table cells", "bbox": {"l": 62.067001, "t": 100.96038999999996, "r": 286.36502, "b": 109.86694, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "is essential to train our models. In order to distinguish be-", "bbox": {"l": 50.112, "t": 112.91540999999995, "r": 286.36508, "b": 121.82195999999999, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "tween empty and non-empty bounding boxes, we have in-", "bbox": {"l": 50.112, "t": 124.87041999999997, "r": 286.36508, "b": 133.77697999999998, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "troduced a binary class in the annotation. Unfortunately, the", "bbox": {"l": 50.112, "t": 136.82641999999998, "r": 286.36511, "b": 145.73297000000002, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "original datasets either omit the bounding boxes for whole", "bbox": {"l": 50.112, "t": 148.78143, "r": 286.36511, "b": 157.68799, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "tables (e.g. TableBank) or they narrow their scope only to", "bbox": {"l": 50.112, "t": 160.73645, "r": 286.36508, "b": 169.64301, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "non-empty cells. Therefore, it was imperative to introduce", "bbox": {"l": 50.112, "t": 172.69146999999998, "r": 286.36505, "b": 181.59802000000002, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "a data pre-processing procedure that generates the missing", "bbox": {"l": 50.112, "t": 184.64648, "r": 286.36508, "b": 193.55304, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "bounding boxes out of the annotation information. This pro-", "bbox": {"l": 50.112, "t": 196.60248, "r": 286.36508, "b": 205.50903000000005, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "cedure first parses the provided table structure and calcu-", "bbox": {"l": 50.112, "t": 208.5575, "r": 286.36508, "b": 217.46405000000004, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "lates the dimensions of the most fine-grained grid that cov-", "bbox": {"l": 50.112, "t": 220.51251000000002, "r": 286.36511, "b": 229.41907000000003, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "ers the table structure. Notice that each table cell may oc-", "bbox": {"l": 50.112, "t": 232.46753, "r": 286.36508, "b": 241.37408000000005, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "cupy multiple grid squares due to row or column spans. In", "bbox": {"l": 50.112, "t": 244.42255, "r": 286.36508, "b": 253.32910000000004, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "case of PubTabNet we had to compute missing bounding", "bbox": {"l": 50.112, "t": 256.37756, "r": 286.36505, "b": 265.28412000000003, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "boxes for 48% of the simple and 69% of the complex ta-", "bbox": {"l": 50.112, "t": 268.33356000000003, "r": 286.36505, "b": 277.24010999999996, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "bles.", "bbox": {"l": 50.112, "t": 280.28853999999995, "r": 68.652397, "b": 289.1951, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Regarding FinTabNet, 68% of the simple and 98%", "bbox": {"l": 75.566444, "t": 280.28853999999995, "r": 286.36514, "b": 289.1951, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "of the complex tables require the generation of bounding", "bbox": {"l": 50.112, "t": 292.24353, "r": 286.36511, "b": 301.15009, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "boxes.", "bbox": {"l": 50.112, "t": 304.19852000000003, "r": 75.695961, "b": 313.10507, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The availability of the bounding boxes for all table cells is essential to train our models. In order to distinguish between empty and non-empty bounding boxes, we have introduced a binary class in the annotation. Unfortunately, the original datasets either omit the bounding boxes for whole tables (e.g. TableBank) or they narrow their scope only to non-empty cells. Therefore, it was imperative to introduce a data pre-processing procedure that generates the missing bounding boxes out of the annotation information. This procedure first parses the provided table structure and calculates the dimensions of the most fine-grained grid that covers the table structure. Notice that each table cell may occupy multiple grid squares due to row or column spans. In case of PubTabNet we had to compute missing bounding boxes for 48% of the simple and 69% of the complex tables. Regarding FinTabNet, 68% of the simple and 98% of the complex tables require the generation of bounding boxes."}, {"label": "text", "id": 4, "page_no": 3, "cluster": {"id": 4, "label": "text", "bbox": {"l": 50.112, "t": 317.99550999999997, "r": 286.36511, "b": 434.49896, "coord_origin": "TOPLEFT"}, "confidence": 0.9873981475830078, "cells": [{"id": 21, "text": "As it is illustrated in Fig. 2, the table distributions from", "bbox": {"l": 62.067001, "t": 317.99550999999997, "r": 286.36499, "b": 326.90207, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "all datasets are skewed towards simpler structures with", "bbox": {"l": 50.112, "t": 329.95151, "r": 286.36511, "b": 338.8580600000001, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "fewer number of rows/columns. Additionally, there is very", "bbox": {"l": 50.112, "t": 341.90649, "r": 286.36502, "b": 350.81305, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "limited variance in the table styles, which in case of Pub-", "bbox": {"l": 50.112, "t": 353.8614799999999, "r": 286.36505, "b": 362.76804, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "TabNet and FinTabNet means one styling format for the", "bbox": {"l": 50.112, "t": 365.81647, "r": 286.36508, "b": 374.72301999999996, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "majority of the tables.", "bbox": {"l": 50.112, "t": 377.77145, "r": 141.58859, "b": 386.67801, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Similar limitations appear also in", "bbox": {"l": 148.70189, "t": 377.77145, "r": 286.36508, "b": 386.67801, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "the type of table content, which in some cases (e.g. FinTab-", "bbox": {"l": 50.112, "t": 389.72644, "r": 286.36508, "b": 398.63300000000004, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Net) is restricted to a certain domain. Ultimately, the lack", "bbox": {"l": 50.112, "t": 401.68243, "r": 286.36511, "b": 410.58899, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "of diversity in the training dataset damages the ability of the", "bbox": {"l": 50.112, "t": 413.63742, "r": 286.36511, "b": 422.54398, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "models to generalize well on unseen data.", "bbox": {"l": 50.112, "t": 425.59241, "r": 216.39774, "b": 434.49896, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "As it is illustrated in Fig. 2, the table distributions from all datasets are skewed towards simpler structures with fewer number of rows/columns. Additionally, there is very limited variance in the table styles, which in case of PubTabNet and FinTabNet means one styling format for the majority of the tables. Similar limitations appear also in the type of table content, which in some cases (e.g. FinTabNet) is restricted to a certain domain. Ultimately, the lack of diversity in the training dataset damages the ability of the models to generalize well on unseen data."}, {"label": "text", "id": 3, "page_no": 3, "cluster": {"id": 3, "label": "text", "bbox": {"l": 50.112, "t": 439.3894, "r": 286.36655, "b": 627.62389, "coord_origin": "TOPLEFT"}, "confidence": 0.9876030087471008, "cells": [{"id": 32, "text": "Motivated by those observations we aimed at generating", "bbox": {"l": 62.067001, "t": 439.3894, "r": 286.36499, "b": 448.2959599999999, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "a synthetic table dataset named", "bbox": {"l": 50.112, "t": 451.34439, "r": 172.14388, "b": 460.25095, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "SynthTabNet", "bbox": {"l": 174.14801, "t": 451.43405, "r": 224.70818999999997, "b": 460.02182, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": ". This approach", "bbox": {"l": 224.70801, "t": 451.34439, "r": 286.36655, "b": 460.25095, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "offers control over: 1) the size of the dataset, 2) the table", "bbox": {"l": 50.112015, "t": 463.30038, "r": 286.36505, "b": 472.20694, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "structure, 3) the table style and 4) the type of content. The", "bbox": {"l": 50.112015, "t": 475.25537, "r": 286.36511, "b": 484.16193, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "complexity of the table structure is described by the size of", "bbox": {"l": 50.112015, "t": 487.21036, "r": 286.36511, "b": 496.11691, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "the table header and the table body, as well as the percentage", "bbox": {"l": 50.112015, "t": 499.16534, "r": 286.36508, "b": 508.0719, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "of the table cells covered by row spans and column spans.", "bbox": {"l": 50.112015, "t": 511.12033, "r": 286.36505, "b": 520.02689, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "A set of carefully designed styling templates provides the", "bbox": {"l": 50.112015, "t": 523.07632, "r": 286.36508, "b": 531.98288, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "basis to build a wide range of table appearances. Lastly, the", "bbox": {"l": 50.112015, "t": 535.0313100000001, "r": 286.36508, "b": 543.93788, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "table content is generated out of a curated collection of text", "bbox": {"l": 50.112015, "t": 546.98633, "r": 286.36511, "b": 555.89288, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "corpora. By controlling the size and scope of the synthetic", "bbox": {"l": 50.112015, "t": 558.94133, "r": 286.36508, "b": 567.84789, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "datasets we are able to train and evaluate our models in a", "bbox": {"l": 50.112015, "t": 570.89633, "r": 286.36511, "b": 579.8028899999999, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "variety of different conditions. For example, we can first", "bbox": {"l": 50.112015, "t": 582.85133, "r": 286.36511, "b": 591.75789, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "generate a highly diverse dataset to train our models and", "bbox": {"l": 50.112015, "t": 594.80733, "r": 286.36505, "b": 603.71388, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "then evaluate their performance on other synthetic datasets", "bbox": {"l": 50.112015, "t": 606.76233, "r": 286.36508, "b": 615.6688800000001, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "which are focused on a specific domain.", "bbox": {"l": 50.112015, "t": 618.71733, "r": 209.7527, "b": 627.62389, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Motivated by those observations we aimed at generating a synthetic table dataset named SynthTabNet . This approach offers control over: 1) the size of the dataset, 2) the table structure, 3) the table style and 4) the type of content. The complexity of the table structure is described by the size of the table header and the table body, as well as the percentage of the table cells covered by row spans and column spans. A set of carefully designed styling templates provides the basis to build a wide range of table appearances. Lastly, the table content is generated out of a curated collection of text corpora. By controlling the size and scope of the synthetic datasets we are able to train and evaluate our models in a variety of different conditions. For example, we can first generate a highly diverse dataset to train our models and then evaluate their performance on other synthetic datasets which are focused on a specific domain."}, {"label": "text", "id": 5, "page_no": 3, "cluster": {"id": 5, "label": "text", "bbox": {"l": 50.112015, "t": 632.51433, "r": 286.36511, "b": 713.151894, "coord_origin": "TOPLEFT"}, "confidence": 0.9871614575386047, "cells": [{"id": 50, "text": "In this regard, we have prepared four synthetic datasets,", "bbox": {"l": 62.067017, "t": 632.51433, "r": 286.36499, "b": 641.42088, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "each one containing 150k examples. The corpora to gener-", "bbox": {"l": 50.112015, "t": 644.46933, "r": 286.36508, "b": 653.37589, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "ate the table text consists of the most frequent terms appear-", "bbox": {"l": 50.112015, "t": 656.42532, "r": 286.36511, "b": 665.33189, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "ing in PubTabNet and FinTabNet together with randomly", "bbox": {"l": 50.112015, "t": 668.38033, "r": 286.36505, "b": 677.28689, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "generated text. The first two synthetic datasets have been", "bbox": {"l": 50.112015, "t": 680.33533, "r": 286.36508, "b": 689.24189, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "fine-tuned to mimic the appearance of the original datasets", "bbox": {"l": 50.112015, "t": 692.290329, "r": 286.36508, "b": 701.196892, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "but encompass more complicated table structures. The third", "bbox": {"l": 50.112015, "t": 704.245331, "r": 286.36511, "b": 713.151894, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In this regard, we have prepared four synthetic datasets, each one containing 150k examples. The corpora to generate the table text consists of the most frequent terms appearing in PubTabNet and FinTabNet together with randomly generated text. The first two synthetic datasets have been fine-tuned to mimic the appearance of the original datasets but encompass more complicated table structures. The third"}, {"label": "table", "id": 8, "page_no": 3, "cluster": {"id": 8, "label": "table", "bbox": {"l": 310.67584228515625, "t": 73.19387817382812, "r": 542.9547119140625, "b": 155.22052001953125, "coord_origin": "TOPLEFT"}, "confidence": 0.9777463674545288, "cells": [{"id": 57, "text": "Tags", "bbox": {"l": 412.332, "t": 73.61437999999998, "r": 430.90231, "b": 82.52094, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Bbox", "bbox": {"l": 442.85742, "t": 73.61437999999998, "r": 464.4463799999999, "b": 82.52094, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Size", "bbox": {"l": 477.78632, "t": 73.61437999999998, "r": 494.94193, "b": 82.52094, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Format", "bbox": {"l": 508.28186, "t": 73.61437999999998, "r": 536.91437, "b": 82.52094, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "PubTabNet", "bbox": {"l": 317.06, "t": 85.9673499999999, "r": 361.64264, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "3", "bbox": {"l": 417.85599, "t": 85.6684600000001, "r": 425.37775, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "3", "bbox": {"l": 449.89569, "t": 85.6684600000001, "r": 457.41745000000003, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "509k", "bbox": {"l": 476.401, "t": 85.9673499999999, "r": 496.3262, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "PNG", "bbox": {"l": 512.63495, "t": 85.9673499999999, "r": 532.56012, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "FinTabNet", "bbox": {"l": 317.06, "t": 97.92236000000003, "r": 359.43094, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "3", "bbox": {"l": 417.85599, "t": 97.62347, "r": 425.37775, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "3", "bbox": {"l": 449.89569, "t": 97.62347, "r": 457.41745000000003, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "112k", "bbox": {"l": 476.401, "t": 97.92236000000003, "r": 496.3262, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "PDF", "bbox": {"l": 513.46185, "t": 97.92236000000003, "r": 531.73328, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "TableBank", "bbox": {"l": 317.06, "t": 109.87836000000004, "r": 359.97888, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "3", "bbox": {"l": 417.85599, "t": 109.57947000000001, "r": 425.37775, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "7", "bbox": {"l": 450.81226, "t": 109.57947000000001, "r": 456.50091999999995, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "145k", "bbox": {"l": 476.401, "t": 109.87836000000004, "r": 496.3262, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "JPEG", "bbox": {"l": 511.25017999999994, "t": 109.87836000000004, "r": 533.94501, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "Combined-Tabnet(*)", "bbox": {"l": 317.06, "t": 121.83336999999995, "r": 400.37723, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "3", "bbox": {"l": 417.85599, "t": 121.53448000000003, "r": 425.37775, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "3", "bbox": {"l": 449.89569, "t": 121.53448000000003, "r": 457.41745000000003, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "400k", "bbox": {"l": 476.401, "t": 121.83336999999995, "r": 496.3262, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "PNG", "bbox": {"l": 512.63495, "t": 121.83336999999995, "r": 532.56012, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Combined(**)", "bbox": {"l": 317.06, "t": 133.78839000000005, "r": 375.17184, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "3", "bbox": {"l": 417.85599, "t": 133.48950000000002, "r": 425.37775, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "3", "bbox": {"l": 449.89569, "t": 133.48950000000002, "r": 457.41745000000003, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "500k", "bbox": {"l": 476.401, "t": 133.78839000000005, "r": 496.3262, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "PNG", "bbox": {"l": 512.63495, "t": 133.78839000000005, "r": 532.56012, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "SynthTabNet", "bbox": {"l": 317.06, "t": 145.74341000000004, "r": 369.39352, "b": 154.64995999999996, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "3", "bbox": {"l": 417.85599, "t": 145.44446000000005, "r": 425.37775, "b": 154.65985, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "3", "bbox": {"l": 449.89569, "t": 145.44446000000005, "r": 457.41745000000003, "b": 154.65985, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "600k", "bbox": {"l": 476.401, "t": 145.74334999999996, "r": 496.3262, "b": 154.6499, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "PNG", "bbox": {"l": 512.63495, "t": 145.74334999999996, "r": 532.56012, "b": 154.6499, "coord_origin": "TOPLEFT"}}], "children": [{"id": 15, "label": "text", "bbox": {"l": 412.332, "t": 73.61437999999998, "r": 430.90231, "b": 82.52094, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "Tags", "bbox": {"l": 412.332, "t": 73.61437999999998, "r": 430.90231, "b": 82.52094, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 442.85742, "t": 73.61437999999998, "r": 464.4463799999999, "b": 82.52094, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "Bbox", "bbox": {"l": 442.85742, "t": 73.61437999999998, "r": 464.4463799999999, "b": 82.52094, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 477.78632, "t": 73.61437999999998, "r": 494.94193, "b": 82.52094, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "Size", "bbox": {"l": 477.78632, "t": 73.61437999999998, "r": 494.94193, "b": 82.52094, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 508.28186, "t": 73.61437999999998, "r": 536.91437, "b": 82.52094, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "Format", "bbox": {"l": 508.28186, "t": 73.61437999999998, "r": 536.91437, "b": 82.52094, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 317.06, "t": 85.9673499999999, "r": 361.64264, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "PubTabNet", "bbox": {"l": 317.06, "t": 85.9673499999999, "r": 361.64264, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 417.85599, "t": 85.6684600000001, "r": 425.37775, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "3", "bbox": {"l": 417.85599, "t": 85.6684600000001, "r": 425.37775, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 449.89569, "t": 85.6684600000001, "r": 457.41745000000003, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "3", "bbox": {"l": 449.89569, "t": 85.6684600000001, "r": 457.41745000000003, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 476.401, "t": 85.9673499999999, "r": 496.3262, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "509k", "bbox": {"l": 476.401, "t": 85.9673499999999, "r": 496.3262, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 512.63495, "t": 85.9673499999999, "r": 532.56012, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "PNG", "bbox": {"l": 512.63495, "t": 85.9673499999999, "r": 532.56012, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 317.06, "t": 97.92236000000003, "r": 359.43094, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "FinTabNet", "bbox": {"l": 317.06, "t": 97.92236000000003, "r": 359.43094, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 417.85599, "t": 97.62347, "r": 425.37775, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "3", "bbox": {"l": 417.85599, "t": 97.62347, "r": 425.37775, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 449.89569, "t": 97.62347, "r": 457.41745000000003, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "3", "bbox": {"l": 449.89569, "t": 97.62347, "r": 457.41745000000003, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 476.401, "t": 97.92236000000003, "r": 496.3262, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "112k", "bbox": {"l": 476.401, "t": 97.92236000000003, "r": 496.3262, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 513.46185, "t": 97.92236000000003, "r": 531.73328, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "PDF", "bbox": {"l": 513.46185, "t": 97.92236000000003, "r": 531.73328, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 317.06, "t": 109.87836000000004, "r": 359.97888, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "TableBank", "bbox": {"l": 317.06, "t": 109.87836000000004, "r": 359.97888, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 417.85599, "t": 109.57947000000001, "r": 425.37775, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "3", "bbox": {"l": 417.85599, "t": 109.57947000000001, "r": 425.37775, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 450.81226, "t": 109.57947000000001, "r": 456.50091999999995, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "7", "bbox": {"l": 450.81226, "t": 109.57947000000001, "r": 456.50091999999995, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 476.401, "t": 109.87836000000004, "r": 496.3262, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "145k", "bbox": {"l": 476.401, "t": 109.87836000000004, "r": 496.3262, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 511.25017999999994, "t": 109.87836000000004, "r": 533.94501, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "JPEG", "bbox": {"l": 511.25017999999994, "t": 109.87836000000004, "r": 533.94501, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 317.06, "t": 121.83336999999995, "r": 400.37723, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "Combined-Tabnet(*)", "bbox": {"l": 317.06, "t": 121.83336999999995, "r": 400.37723, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 417.85599, "t": 121.53448000000003, "r": 425.37775, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "3", "bbox": {"l": 417.85599, "t": 121.53448000000003, "r": 425.37775, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 449.89569, "t": 121.53448000000003, "r": 457.41745000000003, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "3", "bbox": {"l": 449.89569, "t": 121.53448000000003, "r": 457.41745000000003, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 476.401, "t": 121.83336999999995, "r": 496.3262, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "400k", "bbox": {"l": 476.401, "t": 121.83336999999995, "r": 496.3262, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 512.63495, "t": 121.83336999999995, "r": 532.56012, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "PNG", "bbox": {"l": 512.63495, "t": 121.83336999999995, "r": 532.56012, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 317.06, "t": 133.78839000000005, "r": 375.17184, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "Combined(**)", "bbox": {"l": 317.06, "t": 133.78839000000005, "r": 375.17184, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 417.85599, "t": 133.48950000000002, "r": 425.37775, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "3", "bbox": {"l": 417.85599, "t": 133.48950000000002, "r": 425.37775, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 449.89569, "t": 133.48950000000002, "r": 457.41745000000003, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "3", "bbox": {"l": 449.89569, "t": 133.48950000000002, "r": 457.41745000000003, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 476.401, "t": 133.78839000000005, "r": 496.3262, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "500k", "bbox": {"l": 476.401, "t": 133.78839000000005, "r": 496.3262, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 512.63495, "t": 133.78839000000005, "r": 532.56012, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "PNG", "bbox": {"l": 512.63495, "t": 133.78839000000005, "r": 532.56012, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 317.06, "t": 145.74341000000004, "r": 369.39352, "b": 154.64995999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "SynthTabNet", "bbox": {"l": 317.06, "t": 145.74341000000004, "r": 369.39352, "b": 154.64995999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 417.85599, "t": 145.44446000000005, "r": 425.37775, "b": 154.65985, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "3", "bbox": {"l": 417.85599, "t": 145.44446000000005, "r": 425.37775, "b": 154.65985, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 449.89569, "t": 145.44446000000005, "r": 457.41745000000003, "b": 154.65985, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "3", "bbox": {"l": 449.89569, "t": 145.44446000000005, "r": 457.41745000000003, "b": 154.65985, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 476.401, "t": 145.74334999999996, "r": 496.3262, "b": 154.6499, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "600k", "bbox": {"l": 476.401, "t": 145.74334999999996, "r": 496.3262, "b": 154.6499, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 512.63495, "t": 145.74334999999996, "r": 532.56012, "b": 154.6499, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "PNG", "bbox": {"l": 512.63495, "t": 145.74334999999996, "r": 532.56012, "b": 154.6499, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ecel", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 7, "num_cols": 5, "table_cells": [{"bbox": {"l": 412.332, "t": 73.61437999999998, "r": 430.90231, "b": 82.52094, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Tags", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 442.85742, "t": 73.61437999999998, "r": 464.4463799999999, "b": 82.52094, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Bbox", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 477.78632, "t": 73.61437999999998, "r": 494.94193, "b": 82.52094, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Size", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 508.28186, "t": 73.61437999999998, "r": 536.91437, "b": 82.52094, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Format", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 317.06, "t": 85.9673499999999, "r": 361.64264, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PubTabNet", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 417.85599, "t": 85.6684600000001, "r": 425.37775, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 449.89569, "t": 85.6684600000001, "r": 457.41745000000003, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 476.401, "t": 85.9673499999999, "r": 496.3262, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "509k", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 512.63495, "t": 85.9673499999999, "r": 532.56012, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "PNG", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 317.06, "t": 97.92236000000003, "r": 359.43094, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "FinTabNet", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 417.85599, "t": 97.62347, "r": 425.37775, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 449.89569, "t": 97.62347, "r": 457.41745000000003, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 476.401, "t": 97.92236000000003, "r": 496.3262, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "112k", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 513.46185, "t": 97.92236000000003, "r": 531.73328, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "PDF", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 317.06, "t": 109.87836000000004, "r": 359.97888, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableBank", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 417.85599, "t": 109.57947000000001, "r": 425.37775, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 450.81226, "t": 109.57947000000001, "r": 456.50091999999995, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 476.401, "t": 109.87836000000004, "r": 496.3262, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "145k", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 511.25017999999994, "t": 109.87836000000004, "r": 533.94501, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "JPEG", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 317.06, "t": 121.83336999999995, "r": 400.37723, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Combined-Tabnet(*)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 417.85599, "t": 121.53448000000003, "r": 425.37775, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 449.89569, "t": 121.53448000000003, "r": 457.41745000000003, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 476.401, "t": 121.83336999999995, "r": 496.3262, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "400k", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 512.63495, "t": 121.83336999999995, "r": 532.56012, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "PNG", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 317.06, "t": 133.78839000000005, "r": 375.17184, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Combined(**)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 417.85599, "t": 133.48950000000002, "r": 425.37775, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 449.89569, "t": 133.48950000000002, "r": 457.41745000000003, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 476.401, "t": 133.78839000000005, "r": 496.3262, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "500k", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 512.63495, "t": 133.78839000000005, "r": 532.56012, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "PNG", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 317.06, "t": 145.74341000000004, "r": 369.39352, "b": 154.64995999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "SynthTabNet", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 417.85599, "t": 145.44446000000005, "r": 425.37775, "b": 154.65985, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 449.89569, "t": 145.44446000000005, "r": 457.41745000000003, "b": 154.65985, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 476.401, "t": 145.74334999999996, "r": 496.3262, "b": 154.6499, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "600k", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 512.63495, "t": 145.74334999999996, "r": 532.56012, "b": 154.6499, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "PNG", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "caption", "id": 9, "page_no": 3, "cluster": {"id": 9, "label": "caption", "bbox": {"l": 308.862, "t": 167.66138, "r": 545.11505, "b": 224.38897999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9667726755142212, "cells": [{"id": 91, "text": "Table 1:", "bbox": {"l": 308.862, "t": 167.66138, "r": 344.6178, "b": 176.56793000000005, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Both", "bbox": {"l": 361.07602, "t": 167.66138, "r": 380.45328, "b": 176.56793000000005, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "\u201cCombined-Tabnet\u201d", "bbox": {"l": 386.56799, "t": 167.75104, "r": 468.67974999999996, "b": 176.33880999999997, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "and", "bbox": {"l": 474.79599, "t": 167.66138, "r": 489.18198, "b": 176.56793000000005, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "\u201dCombined-", "bbox": {"l": 495.29898000000003, "t": 167.75104, "r": 545.112, "b": 176.33880999999997, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "Tabnet\u201d", "bbox": {"l": 308.862, "t": 179.70605, "r": 341.16077, "b": 188.29381999999998, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "are variations of the following: (*) The Combined-", "bbox": {"l": 343.457, "t": 179.61639000000002, "r": 545.11005, "b": 188.52295000000004, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "Tabnet dataset is the processed combination of PubTabNet", "bbox": {"l": 308.862, "t": 191.57141000000001, "r": 545.11505, "b": 200.47797000000003, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "and Fintabnet. (**) The combined dataset is the processed", "bbox": {"l": 308.862, "t": 203.52643, "r": 545.11499, "b": 212.43298000000004, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "combination of PubTabNet, Fintabnet and TableBank.", "bbox": {"l": 308.862, "t": 215.48242000000005, "r": 523.93469, "b": 224.38897999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 1: Both \u201cCombined-Tabnet\u201d and \u201dCombinedTabnet\u201d are variations of the following: (*) The CombinedTabnet dataset is the processed combination of PubTabNet and Fintabnet. (**) The combined dataset is the processed combination of PubTabNet, Fintabnet and TableBank."}, {"label": "text", "id": 6, "page_no": 3, "cluster": {"id": 6, "label": "text", "bbox": {"l": 308.862, "t": 249.62041999999997, "r": 545.11517, "b": 294.39197, "coord_origin": "TOPLEFT"}, "confidence": 0.9789542555809021, "cells": [{"id": 101, "text": "one adopts a colorful appearance with high contrast and the", "bbox": {"l": 308.862, "t": 249.62041999999997, "r": 545.11517, "b": 258.52698, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "last one contains tables with sparse content. Lastly, we have", "bbox": {"l": 308.862, "t": 261.57543999999996, "r": 545.11517, "b": 270.48199, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "combined all synthetic datasets into one big unified syn-", "bbox": {"l": 308.862, "t": 273.5304, "r": 545.11505, "b": 282.43698, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "thetic dataset of 600k examples.", "bbox": {"l": 308.862, "t": 285.48541000000006, "r": 436.82169, "b": 294.39197, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "one adopts a colorful appearance with high contrast and the last one contains tables with sparse content. Lastly, we have combined all synthetic datasets into one big unified synthetic dataset of 600k examples."}, {"label": "text", "id": 13, "page_no": 3, "cluster": {"id": 13, "label": "text", "bbox": {"l": 320.81699, "t": 297.77240000000006, "r": 542.74396, "b": 306.67896, "coord_origin": "TOPLEFT"}, "confidence": 0.9043694138526917, "cells": [{"id": 105, "text": "Tab. 1 summarizes the various attributes of the datasets.", "bbox": {"l": 320.81699, "t": 297.77240000000006, "r": 542.74396, "b": 306.67896, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Tab. 1 summarizes the various attributes of the datasets."}, {"label": "section_header", "id": 11, "page_no": 3, "cluster": {"id": 11, "label": "section_header", "bbox": {"l": 308.862, "t": 321.18396, "r": 444.93607000000003, "b": 331.93167000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9466594457626343, "cells": [{"id": 106, "text": "4.", "bbox": {"l": 308.862, "t": 321.18396, "r": 316.28476, "b": 331.93167000000005, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "The TableFormer model", "bbox": {"l": 326.18176, "t": 321.18396, "r": 444.93607000000003, "b": 331.93167000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4. The TableFormer model"}, {"label": "text", "id": 0, "page_no": 3, "cluster": {"id": 0, "label": "text", "bbox": {"l": 308.862, "t": 341.93939, "r": 545.11523, "b": 446.48685000000006, "coord_origin": "TOPLEFT"}, "confidence": 0.9884450435638428, "cells": [{"id": 108, "text": "Given the image of a table, TableFormer is able to pre-", "bbox": {"l": 320.81699, "t": 341.93939, "r": 545.11499, "b": 350.84594999999996, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "dict: 1) a sequence of tokens that represent the structure of", "bbox": {"l": 308.862, "t": 353.89438, "r": 545.11511, "b": 362.80092999999994, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "a table, and 2) a bounding box coupled to a subset of those", "bbox": {"l": 308.862, "t": 365.84937, "r": 545.11517, "b": 374.75592, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "tokens. The conversion of an image into a sequence of to-", "bbox": {"l": 308.862, "t": 377.80435, "r": 545.11505, "b": 386.71091, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "kens is a well-known task [35, 16]. While attention is often", "bbox": {"l": 308.862, "t": 389.75934000000007, "r": 545.11517, "b": 398.66588999999993, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "used as an implicit method to associate each token of the", "bbox": {"l": 308.862, "t": 401.71432000000004, "r": 545.11523, "b": 410.62088, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "sequence with a position in the original image, an explicit", "bbox": {"l": 308.862, "t": 413.67032, "r": 545.11517, "b": 422.57687, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "association between the individual table-cells and the image", "bbox": {"l": 308.862, "t": 425.62531, "r": 545.11505, "b": 434.53186, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "bounding boxes is also required.", "bbox": {"l": 308.862, "t": 437.58029, "r": 437.9375, "b": 446.48685000000006, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Given the image of a table, TableFormer is able to predict: 1) a sequence of tokens that represent the structure of a table, and 2) a bounding box coupled to a subset of those tokens. The conversion of an image into a sequence of tokens is a well-known task [35, 16]. While attention is often used as an implicit method to associate each token of the sequence with a position in the original image, an explicit association between the individual table-cells and the image bounding boxes is also required."}, {"label": "section_header", "id": 12, "page_no": 3, "cluster": {"id": 12, "label": "section_header", "bbox": {"l": 308.862, "t": 457.69427, "r": 420.16058, "b": 467.54633, "coord_origin": "TOPLEFT"}, "confidence": 0.9376963376998901, "cells": [{"id": 117, "text": "4.1.", "bbox": {"l": 308.862, "t": 457.69427, "r": 323.14081, "b": 467.54633, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "Model architecture.", "bbox": {"l": 332.66003, "t": 457.69427, "r": 420.16058, "b": 467.54633, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4.1. Model architecture."}, {"label": "text", "id": 2, "page_no": 3, "cluster": {"id": 2, "label": "text", "bbox": {"l": 308.86197, "t": 476.76529, "r": 545.11572, "b": 664.99981, "coord_origin": "TOPLEFT"}, "confidence": 0.9878323078155518, "cells": [{"id": 119, "text": "We now describe in detail the proposed method, which", "bbox": {"l": 320.81699, "t": 476.76529, "r": 545.11487, "b": 485.67184, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "is composed of three main components, see Fig.", "bbox": {"l": 308.862, "t": 488.72028, "r": 509.02054, "b": 497.62683, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "4.", "bbox": {"l": 515.58588, "t": 488.72028, "r": 523.05786, "b": 497.62683, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Our", "bbox": {"l": 529.62323, "t": 488.72028, "r": 545.11505, "b": 497.62683, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "CNN Backbone Network", "bbox": {"l": 308.862, "t": 500.76492, "r": 406.34601, "b": 509.35269, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "encodes the input as a feature vec-", "bbox": {"l": 408.87201, "t": 500.67526, "r": 545.1106, "b": 509.58182, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "tor of predefined length.", "bbox": {"l": 308.862, "t": 512.63126, "r": 409.39459, "b": 521.53781, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "The input feature vector of the", "bbox": {"l": 416.72705, "t": 512.63126, "r": 545.11505, "b": 521.53781, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "encoded image is passed to the", "bbox": {"l": 308.862, "t": 524.58624, "r": 436.194, "b": 533.4928, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "Structure Decoder", "bbox": {"l": 439.526, "t": 524.6759, "r": 513.86694, "b": 533.26367, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "to pro-", "bbox": {"l": 517.43201, "t": 524.58624, "r": 545.10815, "b": 533.4928, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "duce a sequence of HTML tags that represent the structure", "bbox": {"l": 308.862, "t": 536.54124, "r": 545.11511, "b": 545.4478, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "of the table.", "bbox": {"l": 308.862, "t": 548.49625, "r": 358.5455, "b": 557.4028000000001, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "With each prediction of an HTML standard", "bbox": {"l": 365.19055, "t": 548.49625, "r": 545.11517, "b": 557.4028000000001, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "data cell (\u2018", "bbox": {"l": 308.862, "t": 560.45125, "r": 352.40851, "b": 569.3578, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "<", "bbox": {"l": 352.409, "t": 560.29184, "r": 360.1579, "b": 569.13863, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "td", "bbox": {"l": 360.15799, "t": 560.45125, "r": 367.90891, "b": 569.3578, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": ">", "bbox": {"l": 367.909, "t": 560.29184, "r": 375.6579, "b": 569.13863, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "\u2019) the hidden state of that cell is passed to", "bbox": {"l": 375.65799, "t": 560.45125, "r": 545.11182, "b": 569.3578, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "the Cell BBox Decoder. As for spanning cells, such as row", "bbox": {"l": 308.862, "t": 572.40724, "r": 545.11499, "b": 581.3138, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "or column span, the tag is broken down to \u2018", "bbox": {"l": 308.862, "t": 584.3622399999999, "r": 483.11768, "b": 593.2688, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "<", "bbox": {"l": 483.11902, "t": 584.20284, "r": 490.86792, "b": 593.04962, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "\u2019, \u2018rowspan=\u2019", "bbox": {"l": 490.86800999999997, "t": 584.3622399999999, "r": 545.11438, "b": 593.2688, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "or \u2018colspan=\u2019, with the number of spanning cells (attribute),", "bbox": {"l": 308.862, "t": 596.31725, "r": 545.11493, "b": 605.2238, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "and \u2018", "bbox": {"l": 308.862, "t": 608.27225, "r": 329.64395, "b": 617.1788, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": ">", "bbox": {"l": 329.646, "t": 608.11284, "r": 337.3949, "b": 616.9596300000001, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "\u2019. The hidden state attached to \u2018", "bbox": {"l": 337.39398, "t": 608.27225, "r": 468.5914, "b": 617.1788, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "<", "bbox": {"l": 468.59496999999993, "t": 608.11284, "r": 476.34387000000004, "b": 616.9596300000001, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "\u2019 is passed to the", "bbox": {"l": 476.3439599999999, "t": 608.27225, "r": 545.11572, "b": 617.1788, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "Cell BBox Decoder. A shared feed forward network (FFN)", "bbox": {"l": 308.86197, "t": 620.22725, "r": 545.11499, "b": 629.1338000000001, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "receives the hidden states from the Structure Decoder, to", "bbox": {"l": 308.86197, "t": 632.1822500000001, "r": 545.11517, "b": 641.08881, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "provide the final detection predictions of the bounding box", "bbox": {"l": 308.86197, "t": 644.13824, "r": 545.11511, "b": 653.0448, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "coordinates and their classification.", "bbox": {"l": 308.86197, "t": 656.09325, "r": 449.42432, "b": 664.99981, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "We now describe in detail the proposed method, which is composed of three main components, see Fig. 4. Our CNN Backbone Network encodes the input as a feature vector of predefined length. The input feature vector of the encoded image is passed to the Structure Decoder to produce a sequence of HTML tags that represent the structure of the table. With each prediction of an HTML standard data cell (\u2018 < td > \u2019) the hidden state of that cell is passed to the Cell BBox Decoder. As for spanning cells, such as row or column span, the tag is broken down to \u2018 < \u2019, \u2018rowspan=\u2019 or \u2018colspan=\u2019, with the number of spanning cells (attribute), and \u2018 > \u2019. The hidden state attached to \u2018 < \u2019 is passed to the Cell BBox Decoder. A shared feed forward network (FFN) receives the hidden states from the Structure Decoder, to provide the final detection predictions of the bounding box coordinates and their classification."}, {"label": "text", "id": 7, "page_no": 3, "cluster": {"id": 7, "label": "text", "bbox": {"l": 308.86197, "t": 668.2607, "r": 545.11511, "b": 713.1518169999999, "coord_origin": "TOPLEFT"}, "confidence": 0.978580117225647, "cells": [{"id": 152, "text": "CNN Backbone Network.", "bbox": {"l": 320.81696, "t": 668.2607, "r": 431.90985, "b": 677.21707, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "A ResNet-18 CNN is the", "bbox": {"l": 439.49896, "t": 668.3802499999999, "r": 545.11255, "b": 677.2868100000001, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "backbone that receives the table image and encodes it as a", "bbox": {"l": 308.86197, "t": 680.33525, "r": 545.11499, "b": 689.24181, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "vector of predefined length. The network has been modified", "bbox": {"l": 308.86197, "t": 692.290253, "r": 545.11511, "b": 701.196815, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "by removing the linear and pooling layer, as we are not per-", "bbox": {"l": 308.86197, "t": 704.245255, "r": 545.11505, "b": 713.1518169999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "CNN Backbone Network. A ResNet-18 CNN is the backbone that receives the table image and encodes it as a vector of predefined length. The network has been modified by removing the linear and pooling layer, as we are not per-"}], "headers": [{"label": "page_footer", "id": 14, "page_no": 3, "cluster": {"id": 14, "label": "page_footer", "bbox": {"l": 295.12097, "t": 734.133251, "r": 300.10226, "b": 743.039814, "coord_origin": "TOPLEFT"}, "confidence": 0.8565719723701477, "cells": [{"id": 157, "text": "4", "bbox": {"l": 295.12097, "t": 734.133251, "r": 300.10226, "b": 743.039814, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4"}]}}, {"page_no": 4, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "1.", "bbox": {"l": 81.688072, "t": 122.43970000000002, "r": 84.927567, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Item", "bbox": {"l": 86.54731, "t": 122.43970000000002, "r": 93.026291, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Amount", "bbox": {"l": 102.50498, "t": 115.25214000000005, "r": 115.3461, "b": 118.44135000000006, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Names", "bbox": {"l": 82.140205, "t": 115.21489999999994, "r": 93.291527, "b": 118.40410999999995, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "1000", "bbox": {"l": 96.748268, "t": 122.43970000000002, "r": 104.3119, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "500", "bbox": {"l": 96.748268, "t": 127.74370999999985, "r": 102.42083, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "3500", "bbox": {"l": 96.748268, "t": 133.45569, "r": 104.3119, "b": 136.6449, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "150", "bbox": {"l": 96.748268, "t": 139.16772000000003, "r": 102.42083, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "unit", "bbox": {"l": 110.66107, "t": 122.43970000000002, "r": 116.14391, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "unit", "bbox": {"l": 110.66107, "t": 127.74370999999985, "r": 116.14391, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "unit", "bbox": {"l": 110.66107, "t": 133.45569, "r": 116.14391, "b": 136.6449, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "unit", "bbox": {"l": 110.66107, "t": 139.16772000000003, "r": 116.14391, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "2.", "bbox": {"l": 81.688072, "t": 127.74370999999985, "r": 84.927567, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Item", "bbox": {"l": 86.54731, "t": 127.74370999999985, "r": 93.026291, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "3.", "bbox": {"l": 81.688072, "t": 133.45569, "r": 84.927567, "b": 136.6449, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Item", "bbox": {"l": 86.54731, "t": 133.45569, "r": 93.026291, "b": 136.6449, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "4.", "bbox": {"l": 81.688072, "t": 139.16772000000003, "r": 84.927567, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "Item", "bbox": {"l": 86.54731, "t": 139.16772000000003, "r": 93.026291, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Extracted", "bbox": {"l": 88.084389, "t": 90.49738000000002, "r": 113.93649, "b": 96.23798, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Table Images", "bbox": {"l": 82.81002, "t": 97.63738999999998, "r": 119.21240000000002, "b": 103.37798999999995, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Standardized", "bbox": {"l": 143.94247, "t": 100.60235999999998, "r": 180.01131, "b": 106.34295999999995, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Images", "bbox": {"l": 151.94064, "t": 107.74237000000005, "r": 172.0118, "b": 113.48297000000014, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "BBox", "bbox": {"l": 251.76939000000002, "t": 80.93096999999989, "r": 266.39557, "b": 86.67156999999997, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Decoder", "bbox": {"l": 247.51601, "t": 86.03101000000004, "r": 270.65021, "b": 91.77161000000001, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "BBoxes", "bbox": {"l": 331.03699, "t": 78.55980999999997, "r": 352.12589, "b": 84.30042000000003, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "BBoxes can be", "bbox": {"l": 390.56421, "t": 96.03223000000003, "r": 431.7261, "b": 101.77282999999989, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "traced back to the", "bbox": {"l": 386.82422, "t": 102.15228000000013, "r": 435.46966999999995, "b": 107.89287999999999, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "original image to", "bbox": {"l": 388.69589, "t": 108.27228000000002, "r": 433.6032400000001, "b": 114.01288000000011, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "extract content", "bbox": {"l": 391.07761, "t": 114.39227000000005, "r": 431.22542999999996, "b": 120.13286999999991, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Structure Tags sequence", "bbox": {"l": 431.22650000000004, "t": 151.68511999999998, "r": 498.82068, "b": 157.42571999999996, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "provide full description of", "bbox": {"l": 431.1738, "t": 157.80517999999995, "r": 498.87753000000004, "b": 163.54578000000004, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "the table structure", "bbox": {"l": 440.5289, "t": 163.92516999999998, "r": 489.51827999999995, "b": 169.66576999999995, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Structure Tags", "bbox": {"l": 328.37479, "t": 178.25385000000006, "r": 367.72333, "b": 183.99445000000003, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "BBoxes in sync", "bbox": {"l": 331.84451, "t": 123.90886999999998, "r": 373.67963, "b": 129.64948000000015, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "with tag sequence", "bbox": {"l": 331.84451, "t": 129.00885000000017, "r": 381.17786, "b": 134.74945000000002, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "Encoder", "bbox": {"l": 196.62633, "t": 88.11621000000002, "r": 219.42332, "b": 93.85681, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Structure", "bbox": {"l": 246.66771, "t": 129.4946900000001, "r": 271.49899, "b": 135.23528999999996, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "Decoder", "bbox": {"l": 247.51601, "t": 134.59473000000003, "r": 270.65021, "b": 140.33533, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "[x1, y2, x2, y2]", "bbox": {"l": 330.63071, "t": 89.01923, "r": 365.55347, "b": 94.75982999999997, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "[x1', y2', x2', y2']", "bbox": {"l": 330.63071, "t": 97.17926, "r": 370.22717, "b": 102.91985999999997, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "[x1'', y2'', x2'', y2'']", "bbox": {"l": 330.63071, "t": 105.33922999999993, "r": 374.51157, "b": 111.07983000000002, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "...", "bbox": {"l": 330.63071, "t": 113.49926999999991, "r": 335.73233, "b": 119.23987, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "<TR>", "bbox": {"l": 322.30579, "t": 141.79236000000003, "r": 335.05988, "b": 146.57617000000005, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "<TD>", "bbox": {"l": 322.30579, "t": 148.93231000000003, "r": 335.05988, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "1", "bbox": {"l": 337.54971, "t": 148.55579, "r": 340.95242, "b": 154.29638999999997, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "</TD><TD colspan=\"2\">", "bbox": {"l": 343.56262, "t": 148.93231000000003, "r": 398.91446, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "</TD>", "bbox": {"l": 407.41718, "t": 148.93231000000003, "r": 421.58801, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "</TR><TR>", "bbox": {"l": 322.30579, "t": 156.07232999999997, "r": 349.23022, "b": 160.85613999999998, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "<TD>", "bbox": {"l": 322.30579, "t": 163.21234000000004, "r": 335.05988, "b": 167.99614999999994, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "</TD><TD>...", "bbox": {"l": 343.56155, "t": 163.21234000000004, "r": 374.73685, "b": 167.99614999999994, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "...", "bbox": {"l": 322.30579, "t": 170.35235999999998, "r": 326.55716, "b": 175.13617, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "1", "bbox": {"l": 323.51111, "t": 89.66967999999997, "r": 326.91382, "b": 95.41027999999994, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "2", "bbox": {"l": 323.71509, "t": 97.78887999999995, "r": 327.1178, "b": 103.52948000000004, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "3", "bbox": {"l": 323.71509, "t": 105.98969, "r": 327.1178, "b": 111.73029000000008, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "2", "bbox": {"l": 401.4816, "t": 148.54625999999996, "r": 404.88431, "b": 154.28687000000002, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "3", "bbox": {"l": 337.6976, "t": 162.68451000000005, "r": 341.10031, "b": 168.42511000000002, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "3", "bbox": {"l": 454.46378, "t": 104.54584, "r": 457.86648999999994, "b": 110.28644000000008, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "2", "bbox": {"l": 493.32580999999993, "t": 91.09546, "r": 496.72852, "b": 96.83605999999997, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "1", "bbox": {"l": 454.08298, "t": 90.56879000000015, "r": 457.48569000000003, "b": 96.30939000000001, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Figure 3:", "bbox": {"l": 50.112, "t": 204.10535000000004, "r": 86.883949, "b": 213.01189999999997, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "TableFormer", "bbox": {"l": 94.020996, "t": 203.98577999999998, "r": 149.85141, "b": 212.94214, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "takes in an image of the PDF and creates bounding box and HTML structure predictions that are", "bbox": {"l": 152.86099, "t": 204.10535000000004, "r": 545.10846, "b": 213.01189999999997, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "synchronized. The bounding boxes grabs the content from the PDF and inserts it in the structure.", "bbox": {"l": 50.111992, "t": 216.06035999999995, "r": 436.0134, "b": 224.96691999999996, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "Input Image", "bbox": {"l": 74.253464, "t": 258.21472000000006, "r": 101.75846, "b": 264.17474000000004, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "Tokenised Tags", "bbox": {"l": 122.29972, "t": 258.34520999999995, "r": 157.83972, "b": 264.30524, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "Multi-Head Attention", "bbox": {"l": 78.549347, "t": 371.38579999999996, "r": 125.68359000000001, "b": 377.04782, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "Add", "bbox": {"l": 78.513298, "t": 391.31857, "r": 84.644547, "b": 396.98059, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "& Normalisation", "bbox": {"l": 116.52705, "t": 391.31857, "r": 125.11079999999998, "b": 396.98059, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "Feed Forward Network", "bbox": {"l": 76.024773, "t": 424.45309, "r": 127.92327000000002, "b": 430.11511, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "Add", "bbox": {"l": 78.382828, "t": 444.88956, "r": 84.514076, "b": 450.55157, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "& Normalisation", "bbox": {"l": 116.39658, "t": 444.88956, "r": 124.98033, "b": 450.55157, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Linear", "bbox": {"l": 167.46945, "t": 462.44324, "r": 181.6292, "b": 468.10526, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "Softmax", "bbox": {"l": 165.61292, "t": 478.47107, "r": 184.43242, "b": 484.13309, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "CNN BACKBONE ENCODER", "bbox": {"l": 65.319511, "t": 324.26235999999994, "r": 132.9245, "b": 330.22235000000006, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "[30, 1, 2, 3, 4, \u2026 3, ", "bbox": {"l": 119.51457, "t": 269.66394, "r": 162.98782, "b": 274.72992, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "4, 5, 8, 31]", "bbox": {"l": 128.72858, "t": 274.91394, "r": 151.41083, "b": 279.97992, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "Positional ", "bbox": {"l": 60.434211999999995, "t": 338.95993, "r": 80.27021, "b": 344.26993, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "Encoding", "bbox": {"l": 60.598457, "t": 343.38605, "r": 78.854958, "b": 348.69604, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "Positional ", "bbox": {"l": 134.82877, "t": 293.37762, "r": 154.66476, "b": 298.68762, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "Encoding", "bbox": {"l": 134.99303, "t": 297.80370999999997, "r": 153.24953, "b": 303.11371, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "Add & Normalisation", "bbox": {"l": 150.55193, "t": 345.35861, "r": 197.14943, "b": 351.02063, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Add", "bbox": {"l": 150.55193, "t": 394.4234, "r": 156.68318, "b": 400.08542, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "& Normalisation", "bbox": {"l": 188.56567, "t": 394.4234, "r": 197.14943, "b": 400.08542, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "Multi-Head Attention", "bbox": {"l": 150.18539, "t": 375.66843, "r": 197.31964, "b": 381.33044, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "Add", "bbox": {"l": 150.55193, "t": 440.24847000000005, "r": 156.68318, "b": 445.91049, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "& Normalisation", "bbox": {"l": 188.56567, "t": 440.24847000000005, "r": 197.14943, "b": 445.91049, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Feed Forward Network", "bbox": {"l": 147.86377, "t": 422.09335, "r": 199.76227, "b": 427.75537, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Linear", "bbox": {"l": 241.56567000000004, "t": 314.26285000000007, "r": 255.72542, "b": 319.92487, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "Linear", "bbox": {"l": 241.91730000000004, "t": 361.36493, "r": 256.07706, "b": 367.02695, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "Attention", "bbox": {"l": 228.054, "t": 336.61929000000003, "r": 248.72363000000004, "b": 342.28131, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "Network", "bbox": {"l": 246.2919, "t": 336.61929000000003, "r": 269.39325, "b": 342.28131, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "MLP", "bbox": {"l": 228.44568000000004, "t": 405.14682, "r": 238.73892, "b": 410.80884, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Linear ", "bbox": {"l": 256.29767, "t": 405.2032500000001, "r": 271.77792, "b": 410.86526, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "Sigmoid", "bbox": {"l": 239.54543, "t": 382.21344, "r": 258.08942, "b": 387.87546, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "Transformer Encoder Network", "bbox": {"l": 54.14704100000001, "t": 384.87183, "r": 59.51152, "b": 449.78326, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "x2", "bbox": {"l": 54.235424, "t": 373.81232, "r": 59.30449699999999, "b": 378.45421999999996, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "Encoded Output", "bbox": {"l": 85.295891, "t": 484.53189, "r": 122.16431, "b": 490.36688, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "Encoded Output", "bbox": {"l": 229.66599, "t": 279.54607999999996, "r": 265.3194, "b": 285.45572000000004, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "Predicted Tags", "bbox": {"l": 157.17369, "t": 500.3031, "r": 190.41711, "b": 506.12943, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "Bounding Boxes & ", "bbox": {"l": 227.81598999999997, "t": 438.05542, "r": 270.78442, "b": 443.89206, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "Classification", "bbox": {"l": 233.70262, "t": 444.06183, "r": 263.51105, "b": 449.8904999999999, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "Transformer ", "bbox": {"l": 184.74655, "t": 293.39502, "r": 212.16055, "b": 298.75903, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "Decoder Network", "bbox": {"l": 178.91229, "t": 299.14502, "r": 216.74378999999996, "b": 304.50903, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "x4", "bbox": {"l": 194.24574, "t": 282.7822, "r": 198.89099, "b": 287.84817999999996, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "CELL BBOX DECODER", "bbox": {"l": 221.45587, "t": 271.86914, "r": 276.47089, "b": 277.82916, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "Masked Multi-Head ", "bbox": {"l": 151.65219, "t": 323.44241, "r": 197.29019, "b": 329.10443, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "Attention", "bbox": {"l": 163.43277, "t": 329.44241, "r": 184.19028, "b": 335.10443, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "Figure 4: Given an input image of a table, the", "bbox": {"l": 50.112, "t": 527.90237, "r": 229.78752, "b": 536.80893, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "Encoder", "bbox": {"l": 231.787, "t": 527.7828099999999, "r": 267.76196, "b": 536.7392, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "pro-", "bbox": {"l": 269.76401, "t": 527.90237, "r": 286.36169, "b": 536.80893, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "duces fixed-length features that represent the input image.", "bbox": {"l": 50.112015, "t": 539.85738, "r": 286.36508, "b": 548.76393, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "The features are then passed to both the", "bbox": {"l": 50.112015, "t": 551.81337, "r": 205.84735, "b": 560.71992, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "Structure Decoder", "bbox": {"l": 208.01802, "t": 551.69382, "r": 286.36392, "b": 560.6501900000001, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "and", "bbox": {"l": 50.112015, "t": 563.76837, "r": 64.498009, "b": 572.67493, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "Cell BBox Decoder", "bbox": {"l": 68.165016, "t": 563.64882, "r": 151.31288, "b": 572.60519, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": ".", "bbox": {"l": 151.31302, "t": 563.76837, "r": 153.80367, "b": 572.67493, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "During training, the", "bbox": {"l": 160.41884, "t": 563.76837, "r": 241.93283000000002, "b": 572.67493, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "Structure", "bbox": {"l": 245.59502, "t": 563.64882, "r": 286.362, "b": 572.60519, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "Decoder", "bbox": {"l": 50.112015, "t": 575.60382, "r": 85.519089, "b": 584.5602, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "receives \u2018tokenized tags\u2019 of the HTML code that", "bbox": {"l": 88.623016, "t": 575.7233699999999, "r": 286.36072, "b": 584.6299300000001, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "represent the table structure. Afterwards, a transformer en-", "bbox": {"l": 50.112015, "t": 587.6783800000001, "r": 286.36511, "b": 596.58493, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "coder and decoder architecture is employed to produce fea-", "bbox": {"l": 50.112015, "t": 599.63338, "r": 286.36508, "b": 608.53993, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "tures that are received by a linear layer, and the", "bbox": {"l": 50.112015, "t": 611.58838, "r": 240.43756000000002, "b": 620.4949300000001, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "Cell BBox", "bbox": {"l": 243.19801, "t": 611.46883, "r": 286.36597, "b": 620.4252, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "Decoder. The linear layer is applied to the features to", "bbox": {"l": 50.112015, "t": 623.42482, "r": 286.36511, "b": 632.3812, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "predict the tags. Simultaneously, the Cell BBox Decoder", "bbox": {"l": 50.112015, "t": 635.37982, "r": 286.36508, "b": 644.3362, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "selects features referring to the data cells (\u2018", "bbox": {"l": 50.112015, "t": 647.45438, "r": 220.58205, "b": 656.36093, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "<", "bbox": {"l": 220.57802000000004, "t": 647.29497, "r": 228.32693, "b": 656.14175, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "td", "bbox": {"l": 228.32700999999997, "t": 647.45438, "r": 236.07791000000003, "b": 656.36093, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": ">", "bbox": {"l": 236.07802000000004, "t": 647.29497, "r": 243.82693, "b": 656.14175, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "\u2019, \u2018", "bbox": {"l": 243.82602, "t": 647.45438, "r": 255.29298000000003, "b": 656.36093, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "<", "bbox": {"l": 255.29102000000003, "t": 647.29497, "r": 263.03992, "b": 656.14175, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "\u2019) and", "bbox": {"l": 263.04001, "t": 647.45438, "r": 286.36246, "b": 656.36093, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "passes them through an attention network, an MLP, and a", "bbox": {"l": 50.112015, "t": 659.40938, "r": 286.36511, "b": 668.31594, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "linear layer to predict the bounding boxes.", "bbox": {"l": 50.112015, "t": 671.36438, "r": 218.46996, "b": 680.27094, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "forming classification, and adding an adaptive pooling", "bbox": {"l": 308.862, "t": 249.53441999999995, "r": 523.05786, "b": 258.44097999999997, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "layer", "bbox": {"l": 525.19983, "t": 249.53441999999995, "r": 545.11505, "b": 258.44097999999997, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "of size 28*28. ResNet by default downsamples the", "bbox": {"l": 308.862, "t": 261.49042, "r": 517.55847, "b": 270.39697, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "image", "bbox": {"l": 520.76642, "t": 261.49042, "r": 545.11499, "b": 270.39697, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "resolution by 32 and then the encoded image is provided", "bbox": {"l": 308.862, "t": 273.44537, "r": 534.80377, "b": 282.35196, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "to", "bbox": {"l": 537.36414, "t": 273.44537, "r": 545.11505, "b": 282.35196, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "both the", "bbox": {"l": 308.862, "t": 285.40039, "r": 341.24045, "b": 294.3069499999999, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "Structure Decoder", "bbox": {"l": 343.73099, "t": 285.49005, "r": 417.23508, "b": 294.07782000000003, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": ", and", "bbox": {"l": 417.23398, "t": 285.40039, "r": 436.60129, "b": 294.3069499999999, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "Cell BBox Decoder", "bbox": {"l": 439.09198, "t": 285.49005, "r": 516.56116, "b": 294.07782000000003, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": ".", "bbox": {"l": 516.56097, "t": 285.40039, "r": 519.05164, "b": 294.3069499999999, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "Structure Decoder.", "bbox": {"l": 320.81696, "t": 297.33981, "r": 400.86649, "b": 306.2962, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "The transformer architecture of", "bbox": {"l": 403.91394, "t": 297.45938, "r": 528.33685, "b": 306.36594, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "this", "bbox": {"l": 530.7179, "t": 297.45938, "r": 545.11383, "b": 306.36594, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "component is based on the work proposed in [31].", "bbox": {"l": 308.86194, "t": 309.41437, "r": 517.5285, "b": 318.32092, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "After", "bbox": {"l": 524.09387, "t": 309.41437, "r": 545.11493, "b": 318.32092, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "extensive experimentation, the", "bbox": {"l": 308.86194, "t": 321.36934999999994, "r": 432.35833999999994, "b": 330.27591, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "Structure Decoder", "bbox": {"l": 435.81995000000006, "t": 321.45901, "r": 510.29041, "b": 330.04678, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "is", "bbox": {"l": 513.97797, "t": 321.36934999999994, "r": 520.62305, "b": 330.27591, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "mod-", "bbox": {"l": 524.08008, "t": 321.36934999999994, "r": 545.11115, "b": 330.27591, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "eled as a transformer encoder with two encoder layers", "bbox": {"l": 308.86197, "t": 333.32434, "r": 527.76013, "b": 342.2309, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "and", "bbox": {"l": 530.729, "t": 333.32434, "r": 545.11499, "b": 342.2309, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "a transformer decoder made from a stack of 4 decoder", "bbox": {"l": 308.86197, "t": 345.27933, "r": 526.85352, "b": 354.18588, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "lay-", "bbox": {"l": 529.62311, "t": 345.27933, "r": 545.11493, "b": 354.18588, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "ers that comprise mainly of multi-head attention and", "bbox": {"l": 308.86197, "t": 357.23532, "r": 524.51245, "b": 366.14188, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "feed", "bbox": {"l": 527.96948, "t": 357.23532, "r": 545.11511, "b": 366.14188, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "forward layers.", "bbox": {"l": 308.86197, "t": 369.19031000000007, "r": 370.39096, "b": 378.09685999999994, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "This configuration uses fewer layers", "bbox": {"l": 377.44449, "t": 369.19031000000007, "r": 526.91339, "b": 378.09685999999994, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "and", "bbox": {"l": 530.72906, "t": 369.19031000000007, "r": 545.11505, "b": 378.09685999999994, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "heads in comparison to networks applied to other", "bbox": {"l": 308.86197, "t": 381.14529000000005, "r": 505.46395999999993, "b": 390.05185, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "problems", "bbox": {"l": 508.03430000000003, "t": 381.14529000000005, "r": 545.11511, "b": 390.05185, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "(e.g. \u201cScene Understanding\u201d, \u201cImage Captioning\u201d),", "bbox": {"l": 308.86197, "t": 393.10028, "r": 517.68799, "b": 402.00684, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "some-", "bbox": {"l": 520.76642, "t": 393.10028, "r": 545.11499, "b": 402.00684, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "thing which we relate to the simplicity of table images.", "bbox": {"l": 308.86197, "t": 405.05526999999995, "r": 528.01935, "b": 413.96182, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "The transformer encoder receives an encoded", "bbox": {"l": 320.81696, "t": 417.11426, "r": 515.49609, "b": 426.02081, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "image", "bbox": {"l": 520.7663, "t": 417.11426, "r": 545.11487, "b": 426.02081, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "from the", "bbox": {"l": 308.86197, "t": 429.0692399999999, "r": 343.72107, "b": 437.9758, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "CNN Backbone Network", "bbox": {"l": 347.03796, "t": 429.15891, "r": 446.45471000000003, "b": 437.74667, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "and refines it", "bbox": {"l": 449.93996999999996, "t": 429.0692399999999, "r": 503.06055000000003, "b": 437.9758, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "through", "bbox": {"l": 506.37808, "t": 429.0692399999999, "r": 537.3717, "b": 437.9758, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "a", "bbox": {"l": 540.68927, "t": 429.0692399999999, "r": 545.11267, "b": 437.9758, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "multi-head dot-product attention layer, followed by a", "bbox": {"l": 308.86197, "t": 441.02423, "r": 522.78894, "b": 449.93079, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "Feed", "bbox": {"l": 525.7478, "t": 441.02423, "r": 545.11511, "b": 449.93079, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "Forward Network.", "bbox": {"l": 308.86197, "t": 452.97922, "r": 384.14929, "b": 461.88577, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "During training, the transformer", "bbox": {"l": 393.37466, "t": 452.97922, "r": 527.84985, "b": 461.88577, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "de-", "bbox": {"l": 532.39282, "t": 452.97922, "r": 545.11505, "b": 461.88577, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "coder receives as input the output feature produced by", "bbox": {"l": 308.86197, "t": 464.93521, "r": 529.7627, "b": 473.84177, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "the", "bbox": {"l": 532.94073, "t": 464.93521, "r": 545.11505, "b": 473.84177, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "transformer encoder, and the tokenized input of the", "bbox": {"l": 308.86197, "t": 476.8902, "r": 514.17126, "b": 485.79675, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "HTML", "bbox": {"l": 516.89105, "t": 476.8902, "r": 545.11511, "b": 485.79675, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": "ground-truth tags. Using a stack of multi-head attention", "bbox": {"l": 308.86197, "t": 488.84518, "r": 527.63068, "b": 497.75174, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "lay-", "bbox": {"l": 529.62317, "t": 488.84518, "r": 545.11499, "b": 497.75174, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "ers, different aspects of the tag sequence could be", "bbox": {"l": 308.86197, "t": 500.80017, "r": 508.3630999999999, "b": 509.70673, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": "inferred.", "bbox": {"l": 511.09286000000003, "t": 500.80017, "r": 545.11511, "b": 509.70673, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "This is achieved by each attention head on a layer operating", "bbox": {"l": 308.86197, "t": 512.7551599999999, "r": 545.11499, "b": 521.6617100000001, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "in a different subspace, and then combining altogether their", "bbox": {"l": 308.86197, "t": 524.71115, "r": 545.11511, "b": 533.61771, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "attention score.", "bbox": {"l": 308.86197, "t": 536.66615, "r": 369.73349, "b": 545.57271, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": "Cell BBox Decoder.", "bbox": {"l": 320.81696, "t": 548.6046, "r": 404.76184, "b": 557.56097, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "Our architecture allows to simul-", "bbox": {"l": 410.34094, "t": 548.72415, "r": 545.11505, "b": 557.63071, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "taneously predict HTML tags and bounding boxes for each", "bbox": {"l": 308.86194, "t": 560.68015, "r": 545.11493, "b": 569.5867000000001, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "table cell without the need of a separate object detector end", "bbox": {"l": 308.86194, "t": 572.6351500000001, "r": 545.11511, "b": 581.5417, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "to end. This approach is inspired by DETR [1] which em-", "bbox": {"l": 308.86194, "t": 584.59015, "r": 545.11493, "b": 593.4967, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "ploys a Transformer Encoder, and Decoder that looks for", "bbox": {"l": 308.86194, "t": 596.54515, "r": 545.11499, "b": 605.45171, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "a specific number of object queries (potential object detec-", "bbox": {"l": 308.86194, "t": 608.50015, "r": 545.11505, "b": 617.40671, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "tions). As our model utilizes a transformer architecture, the", "bbox": {"l": 308.86194, "t": 620.45515, "r": 545.11505, "b": 629.36171, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "hidden state of the", "bbox": {"l": 308.86194, "t": 632.41115, "r": 381.67859, "b": 641.3177000000001, "coord_origin": "TOPLEFT"}}, {"id": 201, "text": "<", "bbox": {"l": 383.99695, "t": 632.25174, "r": 391.74585, "b": 641.09853, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": "td", "bbox": {"l": 391.74594, "t": 632.41115, "r": 399.49686, "b": 641.3177000000001, "coord_origin": "TOPLEFT"}}, {"id": 203, "text": ">", "bbox": {"l": 399.49695, "t": 632.25174, "r": 407.24585, "b": 641.09853, "coord_origin": "TOPLEFT"}}, {"id": 204, "text": "\u2019 and \u2018", "bbox": {"l": 407.24594, "t": 632.41115, "r": 432.90958, "b": 641.3177000000001, "coord_origin": "TOPLEFT"}}, {"id": 205, "text": "<", "bbox": {"l": 432.90792999999996, "t": 632.25174, "r": 440.65683000000007, "b": 641.09853, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": "\u2019 HTML structure tags be-", "bbox": {"l": 440.65691999999996, "t": 632.41115, "r": 545.11475, "b": 641.3177000000001, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": "come the object query.", "bbox": {"l": 308.86194, "t": 644.3661500000001, "r": 398.96371, "b": 653.27271, "coord_origin": "TOPLEFT"}}, {"id": 208, "text": "The encoding generated by the", "bbox": {"l": 320.81693, "t": 656.42516, "r": 444.34316999999993, "b": 665.33172, "coord_origin": "TOPLEFT"}}, {"id": 209, "text": "CNN Backbone Network", "bbox": {"l": 447.00591999999995, "t": 656.51482, "r": 545.1076, "b": 665.10258, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": "along with the features acquired for every data cell from the", "bbox": {"l": 308.86194, "t": 668.38016, "r": 545.11505, "b": 677.2867200000001, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "Transformer Decoder are then passed to the attention net-", "bbox": {"l": 308.86194, "t": 680.33516, "r": 545.11505, "b": 689.24172, "coord_origin": "TOPLEFT"}}, {"id": 212, "text": "work. The attention network takes both inputs and learns to", "bbox": {"l": 308.86194, "t": 692.290161, "r": 545.11505, "b": 701.196724, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "provide an attention weighted encoding. This weighted at-", "bbox": {"l": 308.86194, "t": 704.245163, "r": 545.11505, "b": 713.151726, "coord_origin": "TOPLEFT"}}, {"id": 214, "text": "5", "bbox": {"l": 295.12094, "t": 734.13316, "r": 300.10223, "b": 743.039722, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 7, "label": "picture", "bbox": {"l": 74.30525970458984, "t": 77.9112319946289, "r": 519.9801025390625, "b": 183.70150756835938, "coord_origin": "TOPLEFT"}, "confidence": 0.9296805262565613, "cells": [{"id": 0, "text": "1.", "bbox": {"l": 81.688072, "t": 122.43970000000002, "r": 84.927567, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Item", "bbox": {"l": 86.54731, "t": 122.43970000000002, "r": 93.026291, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Amount", "bbox": {"l": 102.50498, "t": 115.25214000000005, "r": 115.3461, "b": 118.44135000000006, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Names", "bbox": {"l": 82.140205, "t": 115.21489999999994, "r": 93.291527, "b": 118.40410999999995, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "1000", "bbox": {"l": 96.748268, "t": 122.43970000000002, "r": 104.3119, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "500", "bbox": {"l": 96.748268, "t": 127.74370999999985, "r": 102.42083, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "3500", "bbox": {"l": 96.748268, "t": 133.45569, "r": 104.3119, "b": 136.6449, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "150", "bbox": {"l": 96.748268, "t": 139.16772000000003, "r": 102.42083, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "unit", "bbox": {"l": 110.66107, "t": 122.43970000000002, "r": 116.14391, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "unit", "bbox": {"l": 110.66107, "t": 127.74370999999985, "r": 116.14391, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "unit", "bbox": {"l": 110.66107, "t": 133.45569, "r": 116.14391, "b": 136.6449, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "unit", "bbox": {"l": 110.66107, "t": 139.16772000000003, "r": 116.14391, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "2.", "bbox": {"l": 81.688072, "t": 127.74370999999985, "r": 84.927567, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Item", "bbox": {"l": 86.54731, "t": 127.74370999999985, "r": 93.026291, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "3.", "bbox": {"l": 81.688072, "t": 133.45569, "r": 84.927567, "b": 136.6449, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Item", "bbox": {"l": 86.54731, "t": 133.45569, "r": 93.026291, "b": 136.6449, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "4.", "bbox": {"l": 81.688072, "t": 139.16772000000003, "r": 84.927567, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "Item", "bbox": {"l": 86.54731, "t": 139.16772000000003, "r": 93.026291, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Extracted", "bbox": {"l": 88.084389, "t": 90.49738000000002, "r": 113.93649, "b": 96.23798, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Table Images", "bbox": {"l": 82.81002, "t": 97.63738999999998, "r": 119.21240000000002, "b": 103.37798999999995, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Standardized", "bbox": {"l": 143.94247, "t": 100.60235999999998, "r": 180.01131, "b": 106.34295999999995, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Images", "bbox": {"l": 151.94064, "t": 107.74237000000005, "r": 172.0118, "b": 113.48297000000014, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "BBox", "bbox": {"l": 251.76939000000002, "t": 80.93096999999989, "r": 266.39557, "b": 86.67156999999997, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Decoder", "bbox": {"l": 247.51601, "t": 86.03101000000004, "r": 270.65021, "b": 91.77161000000001, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "BBoxes", "bbox": {"l": 331.03699, "t": 78.55980999999997, "r": 352.12589, "b": 84.30042000000003, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "BBoxes can be", "bbox": {"l": 390.56421, "t": 96.03223000000003, "r": 431.7261, "b": 101.77282999999989, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "traced back to the", "bbox": {"l": 386.82422, "t": 102.15228000000013, "r": 435.46966999999995, "b": 107.89287999999999, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "original image to", "bbox": {"l": 388.69589, "t": 108.27228000000002, "r": 433.6032400000001, "b": 114.01288000000011, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "extract content", "bbox": {"l": 391.07761, "t": 114.39227000000005, "r": 431.22542999999996, "b": 120.13286999999991, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Structure Tags sequence", "bbox": {"l": 431.22650000000004, "t": 151.68511999999998, "r": 498.82068, "b": 157.42571999999996, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "provide full description of", "bbox": {"l": 431.1738, "t": 157.80517999999995, "r": 498.87753000000004, "b": 163.54578000000004, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "the table structure", "bbox": {"l": 440.5289, "t": 163.92516999999998, "r": 489.51827999999995, "b": 169.66576999999995, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Structure Tags", "bbox": {"l": 328.37479, "t": 178.25385000000006, "r": 367.72333, "b": 183.99445000000003, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "BBoxes in sync", "bbox": {"l": 331.84451, "t": 123.90886999999998, "r": 373.67963, "b": 129.64948000000015, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "with tag sequence", "bbox": {"l": 331.84451, "t": 129.00885000000017, "r": 381.17786, "b": 134.74945000000002, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "Encoder", "bbox": {"l": 196.62633, "t": 88.11621000000002, "r": 219.42332, "b": 93.85681, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Structure", "bbox": {"l": 246.66771, "t": 129.4946900000001, "r": 271.49899, "b": 135.23528999999996, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "Decoder", "bbox": {"l": 247.51601, "t": 134.59473000000003, "r": 270.65021, "b": 140.33533, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "[x1, y2, x2, y2]", "bbox": {"l": 330.63071, "t": 89.01923, "r": 365.55347, "b": 94.75982999999997, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "[x1', y2', x2', y2']", "bbox": {"l": 330.63071, "t": 97.17926, "r": 370.22717, "b": 102.91985999999997, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "[x1'', y2'', x2'', y2'']", "bbox": {"l": 330.63071, "t": 105.33922999999993, "r": 374.51157, "b": 111.07983000000002, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "...", "bbox": {"l": 330.63071, "t": 113.49926999999991, "r": 335.73233, "b": 119.23987, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "<TR>", "bbox": {"l": 322.30579, "t": 141.79236000000003, "r": 335.05988, "b": 146.57617000000005, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "<TD>", "bbox": {"l": 322.30579, "t": 148.93231000000003, "r": 335.05988, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "1", "bbox": {"l": 337.54971, "t": 148.55579, "r": 340.95242, "b": 154.29638999999997, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "</TD><TD colspan=\"2\">", "bbox": {"l": 343.56262, "t": 148.93231000000003, "r": 398.91446, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "</TD>", "bbox": {"l": 407.41718, "t": 148.93231000000003, "r": 421.58801, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "</TR><TR>", "bbox": {"l": 322.30579, "t": 156.07232999999997, "r": 349.23022, "b": 160.85613999999998, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "<TD>", "bbox": {"l": 322.30579, "t": 163.21234000000004, "r": 335.05988, "b": 167.99614999999994, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "</TD><TD>...", "bbox": {"l": 343.56155, "t": 163.21234000000004, "r": 374.73685, "b": 167.99614999999994, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "...", "bbox": {"l": 322.30579, "t": 170.35235999999998, "r": 326.55716, "b": 175.13617, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "1", "bbox": {"l": 323.51111, "t": 89.66967999999997, "r": 326.91382, "b": 95.41027999999994, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "2", "bbox": {"l": 323.71509, "t": 97.78887999999995, "r": 327.1178, "b": 103.52948000000004, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "3", "bbox": {"l": 323.71509, "t": 105.98969, "r": 327.1178, "b": 111.73029000000008, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "2", "bbox": {"l": 401.4816, "t": 148.54625999999996, "r": 404.88431, "b": 154.28687000000002, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "3", "bbox": {"l": 337.6976, "t": 162.68451000000005, "r": 341.10031, "b": 168.42511000000002, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "3", "bbox": {"l": 454.46378, "t": 104.54584, "r": 457.86648999999994, "b": 110.28644000000008, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "2", "bbox": {"l": 493.32580999999993, "t": 91.09546, "r": 496.72852, "b": 96.83605999999997, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "1", "bbox": {"l": 454.08298, "t": 90.56879000000015, "r": 457.48569000000003, "b": 96.30939000000001, "coord_origin": "TOPLEFT"}}], "children": [{"id": 10, "label": "text", "bbox": {"l": 81.688072, "t": 122.43970000000002, "r": 84.927567, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 0, "text": "1.", "bbox": {"l": 81.688072, "t": 122.43970000000002, "r": 84.927567, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 86.54731, "t": 122.43970000000002, "r": 93.026291, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 1, "text": "Item", "bbox": {"l": 86.54731, "t": 122.43970000000002, "r": 93.026291, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 102.50498, "t": 115.25214000000005, "r": 115.3461, "b": 118.44135000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 2, "text": "Amount", "bbox": {"l": 102.50498, "t": 115.25214000000005, "r": 115.3461, "b": 118.44135000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 82.140205, "t": 115.21489999999994, "r": 93.291527, "b": 118.40410999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 3, "text": "Names", "bbox": {"l": 82.140205, "t": 115.21489999999994, "r": 93.291527, "b": 118.40410999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 96.748268, "t": 122.43970000000002, "r": 104.3119, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 4, "text": "1000", "bbox": {"l": 96.748268, "t": 122.43970000000002, "r": 104.3119, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 96.748268, "t": 127.74370999999985, "r": 102.42083, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 5, "text": "500", "bbox": {"l": 96.748268, "t": 127.74370999999985, "r": 102.42083, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 96.748268, "t": 133.45569, "r": 104.3119, "b": 136.6449, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": "3500", "bbox": {"l": 96.748268, "t": 133.45569, "r": 104.3119, "b": 136.6449, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 96.748268, "t": 139.16772000000003, "r": 102.42083, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "150", "bbox": {"l": 96.748268, "t": 139.16772000000003, "r": 102.42083, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 110.66107, "t": 122.43970000000002, "r": 116.14391, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "unit", "bbox": {"l": 110.66107, "t": 122.43970000000002, "r": 116.14391, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 110.66107, "t": 127.74370999999985, "r": 116.14391, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "unit", "bbox": {"l": 110.66107, "t": 127.74370999999985, "r": 116.14391, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 110.66107, "t": 133.45569, "r": 116.14391, "b": 136.6449, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "unit", "bbox": {"l": 110.66107, "t": 133.45569, "r": 116.14391, "b": 136.6449, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 110.66107, "t": 139.16772000000003, "r": 116.14391, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "unit", "bbox": {"l": 110.66107, "t": 139.16772000000003, "r": 116.14391, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 81.688072, "t": 127.74370999999985, "r": 84.927567, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "2.", "bbox": {"l": 81.688072, "t": 127.74370999999985, "r": 84.927567, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 86.54731, "t": 127.74370999999985, "r": 93.026291, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "Item", "bbox": {"l": 86.54731, "t": 127.74370999999985, "r": 93.026291, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 81.688072, "t": 133.45569, "r": 84.927567, "b": 136.6449, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "3.", "bbox": {"l": 81.688072, "t": 133.45569, "r": 84.927567, "b": 136.6449, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 86.54731, "t": 133.45569, "r": 93.026291, "b": 136.6449, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "Item", "bbox": {"l": 86.54731, "t": 133.45569, "r": 93.026291, "b": 136.6449, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 81.688072, "t": 139.16772000000003, "r": 84.927567, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "4.", "bbox": {"l": 81.688072, "t": 139.16772000000003, "r": 84.927567, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 86.54731, "t": 139.16772000000003, "r": 93.026291, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "Item", "bbox": {"l": 86.54731, "t": 139.16772000000003, "r": 93.026291, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 88.084389, "t": 90.49738000000002, "r": 113.93649, "b": 96.23798, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "Extracted", "bbox": {"l": 88.084389, "t": 90.49738000000002, "r": 113.93649, "b": 96.23798, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 82.81002, "t": 97.63738999999998, "r": 119.21240000000002, "b": 103.37798999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "Table Images", "bbox": {"l": 82.81002, "t": 97.63738999999998, "r": 119.21240000000002, "b": 103.37798999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 143.94247, "t": 100.60235999999998, "r": 180.01131, "b": 106.34295999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "Standardized", "bbox": {"l": 143.94247, "t": 100.60235999999998, "r": 180.01131, "b": 106.34295999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 151.94064, "t": 107.74237000000005, "r": 172.0118, "b": 113.48297000000014, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "Images", "bbox": {"l": 151.94064, "t": 107.74237000000005, "r": 172.0118, "b": 113.48297000000014, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 251.76939000000002, "t": 80.93096999999989, "r": 266.39557, "b": 86.67156999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "BBox", "bbox": {"l": 251.76939000000002, "t": 80.93096999999989, "r": 266.39557, "b": 86.67156999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 247.51601, "t": 86.03101000000004, "r": 270.65021, "b": 91.77161000000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "Decoder", "bbox": {"l": 247.51601, "t": 86.03101000000004, "r": 270.65021, "b": 91.77161000000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 331.03699, "t": 78.55980999999997, "r": 352.12589, "b": 84.30042000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "BBoxes", "bbox": {"l": 331.03699, "t": 78.55980999999997, "r": 352.12589, "b": 84.30042000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 390.56421, "t": 96.03223000000003, "r": 431.7261, "b": 101.77282999999989, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "BBoxes can be", "bbox": {"l": 390.56421, "t": 96.03223000000003, "r": 431.7261, "b": 101.77282999999989, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 386.82422, "t": 102.15228000000013, "r": 435.46966999999995, "b": 107.89287999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "traced back to the", "bbox": {"l": 386.82422, "t": 102.15228000000013, "r": 435.46966999999995, "b": 107.89287999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 388.69589, "t": 108.27228000000002, "r": 433.6032400000001, "b": 114.01288000000011, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "original image to", "bbox": {"l": 388.69589, "t": 108.27228000000002, "r": 433.6032400000001, "b": 114.01288000000011, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 391.07761, "t": 114.39227000000005, "r": 431.22542999999996, "b": 120.13286999999991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "extract content", "bbox": {"l": 391.07761, "t": 114.39227000000005, "r": 431.22542999999996, "b": 120.13286999999991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 431.22650000000004, "t": 151.68511999999998, "r": 498.82068, "b": 157.42571999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "Structure Tags sequence", "bbox": {"l": 431.22650000000004, "t": 151.68511999999998, "r": 498.82068, "b": 157.42571999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 431.1738, "t": 157.80517999999995, "r": 498.87753000000004, "b": 163.54578000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "provide full description of", "bbox": {"l": 431.1738, "t": 157.80517999999995, "r": 498.87753000000004, "b": 163.54578000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 440.5289, "t": 163.92516999999998, "r": 489.51827999999995, "b": 169.66576999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "the table structure", "bbox": {"l": 440.5289, "t": 163.92516999999998, "r": 489.51827999999995, "b": 169.66576999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 328.37479, "t": 178.25385000000006, "r": 367.72333, "b": 183.99445000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "Structure Tags", "bbox": {"l": 328.37479, "t": 178.25385000000006, "r": 367.72333, "b": 183.99445000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 331.84451, "t": 123.90886999999998, "r": 373.67963, "b": 129.64948000000015, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "BBoxes in sync", "bbox": {"l": 331.84451, "t": 123.90886999999998, "r": 373.67963, "b": 129.64948000000015, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 331.84451, "t": 129.00885000000017, "r": 381.17786, "b": 134.74945000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "with tag sequence", "bbox": {"l": 331.84451, "t": 129.00885000000017, "r": 381.17786, "b": 134.74945000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 196.62633, "t": 88.11621000000002, "r": 219.42332, "b": 93.85681, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "Encoder", "bbox": {"l": 196.62633, "t": 88.11621000000002, "r": 219.42332, "b": 93.85681, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 246.66771, "t": 129.4946900000001, "r": 271.49899, "b": 135.23528999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "Structure", "bbox": {"l": 246.66771, "t": 129.4946900000001, "r": 271.49899, "b": 135.23528999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 247.51601, "t": 134.59473000000003, "r": 270.65021, "b": 140.33533, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "Decoder", "bbox": {"l": 247.51601, "t": 134.59473000000003, "r": 270.65021, "b": 140.33533, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 330.63071, "t": 89.01923, "r": 365.55347, "b": 94.75982999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "[x1, y2, x2, y2]", "bbox": {"l": 330.63071, "t": 89.01923, "r": 365.55347, "b": 94.75982999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 330.63071, "t": 97.17926, "r": 370.22717, "b": 102.91985999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "[x1', y2', x2', y2']", "bbox": {"l": 330.63071, "t": 97.17926, "r": 370.22717, "b": 102.91985999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 330.63071, "t": 105.33922999999993, "r": 374.51157, "b": 111.07983000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "[x1'', y2'', x2'', y2'']", "bbox": {"l": 330.63071, "t": 105.33922999999993, "r": 374.51157, "b": 111.07983000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 330.63071, "t": 113.49926999999991, "r": 335.73233, "b": 119.23987, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "...", "bbox": {"l": 330.63071, "t": 113.49926999999991, "r": 335.73233, "b": 119.23987, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 322.30579, "t": 141.79236000000003, "r": 335.05988, "b": 146.57617000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "<TR>", "bbox": {"l": 322.30579, "t": 141.79236000000003, "r": 335.05988, "b": 146.57617000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 322.30579, "t": 148.93231000000003, "r": 335.05988, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "<TD>", "bbox": {"l": 322.30579, "t": 148.93231000000003, "r": 335.05988, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 337.54971, "t": 148.55579, "r": 340.95242, "b": 154.29638999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "1", "bbox": {"l": 337.54971, "t": 148.55579, "r": 340.95242, "b": 154.29638999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 343.56262, "t": 148.93231000000003, "r": 398.91446, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "</TD><TD colspan=\"2\">", "bbox": {"l": 343.56262, "t": 148.93231000000003, "r": 398.91446, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 407.41718, "t": 148.93231000000003, "r": 421.58801, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "</TD>", "bbox": {"l": 407.41718, "t": 148.93231000000003, "r": 421.58801, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 322.30579, "t": 156.07232999999997, "r": 349.23022, "b": 160.85613999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "</TR><TR>", "bbox": {"l": 322.30579, "t": 156.07232999999997, "r": 349.23022, "b": 160.85613999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 322.30579, "t": 163.21234000000004, "r": 335.05988, "b": 167.99614999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "<TD>", "bbox": {"l": 322.30579, "t": 163.21234000000004, "r": 335.05988, "b": 167.99614999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 343.56155, "t": 163.21234000000004, "r": 374.73685, "b": 167.99614999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "</TD><TD>...", "bbox": {"l": 343.56155, "t": 163.21234000000004, "r": 374.73685, "b": 167.99614999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 322.30579, "t": 170.35235999999998, "r": 326.55716, "b": 175.13617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "...", "bbox": {"l": 322.30579, "t": 170.35235999999998, "r": 326.55716, "b": 175.13617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 323.51111, "t": 89.66967999999997, "r": 326.91382, "b": 95.41027999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "1", "bbox": {"l": 323.51111, "t": 89.66967999999997, "r": 326.91382, "b": 95.41027999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 323.71509, "t": 97.78887999999995, "r": 327.1178, "b": 103.52948000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "2", "bbox": {"l": 323.71509, "t": 97.78887999999995, "r": 327.1178, "b": 103.52948000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 323.71509, "t": 105.98969, "r": 327.1178, "b": 111.73029000000008, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "3", "bbox": {"l": 323.71509, "t": 105.98969, "r": 327.1178, "b": 111.73029000000008, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 401.4816, "t": 148.54625999999996, "r": 404.88431, "b": 154.28687000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "2", "bbox": {"l": 401.4816, "t": 148.54625999999996, "r": 404.88431, "b": 154.28687000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 337.6976, "t": 162.68451000000005, "r": 341.10031, "b": 168.42511000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "3", "bbox": {"l": 337.6976, "t": 162.68451000000005, "r": 341.10031, "b": 168.42511000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 454.46378, "t": 104.54584, "r": 457.86648999999994, "b": 110.28644000000008, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "3", "bbox": {"l": 454.46378, "t": 104.54584, "r": 457.86648999999994, "b": 110.28644000000008, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 493.32580999999993, "t": 91.09546, "r": 496.72852, "b": 96.83605999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "2", "bbox": {"l": 493.32580999999993, "t": 91.09546, "r": 496.72852, "b": 96.83605999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 454.08298, "t": 90.56879000000015, "r": 457.48569000000003, "b": 96.30939000000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "1", "bbox": {"l": 454.08298, "t": 90.56879000000015, "r": 457.48569000000003, "b": 96.30939000000001, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 6, "label": "caption", "bbox": {"l": 50.111992, "t": 203.98577999999998, "r": 545.10846, "b": 224.96691999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9677653908729553, "cells": [{"id": 59, "text": "Figure 3:", "bbox": {"l": 50.112, "t": 204.10535000000004, "r": 86.883949, "b": 213.01189999999997, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "TableFormer", "bbox": {"l": 94.020996, "t": 203.98577999999998, "r": 149.85141, "b": 212.94214, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "takes in an image of the PDF and creates bounding box and HTML structure predictions that are", "bbox": {"l": 152.86099, "t": 204.10535000000004, "r": 545.10846, "b": 213.01189999999997, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "synchronized. The bounding boxes grabs the content from the PDF and inserts it in the structure.", "bbox": {"l": 50.111992, "t": 216.06035999999995, "r": 436.0134, "b": 224.96691999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "picture", "bbox": {"l": 53.03325653076172, "t": 257.66534423828125, "r": 285.3731689453125, "b": 507.6688537597656, "coord_origin": "TOPLEFT"}, "confidence": 0.9724941253662109, "cells": [{"id": 63, "text": "Input Image", "bbox": {"l": 74.253464, "t": 258.21472000000006, "r": 101.75846, "b": 264.17474000000004, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "Tokenised Tags", "bbox": {"l": 122.29972, "t": 258.34520999999995, "r": 157.83972, "b": 264.30524, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "Multi-Head Attention", "bbox": {"l": 78.549347, "t": 371.38579999999996, "r": 125.68359000000001, "b": 377.04782, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "Add", "bbox": {"l": 78.513298, "t": 391.31857, "r": 84.644547, "b": 396.98059, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "& Normalisation", "bbox": {"l": 116.52705, "t": 391.31857, "r": 125.11079999999998, "b": 396.98059, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "Feed Forward Network", "bbox": {"l": 76.024773, "t": 424.45309, "r": 127.92327000000002, "b": 430.11511, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "Add", "bbox": {"l": 78.382828, "t": 444.88956, "r": 84.514076, "b": 450.55157, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "& Normalisation", "bbox": {"l": 116.39658, "t": 444.88956, "r": 124.98033, "b": 450.55157, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Linear", "bbox": {"l": 167.46945, "t": 462.44324, "r": 181.6292, "b": 468.10526, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "Softmax", "bbox": {"l": 165.61292, "t": 478.47107, "r": 184.43242, "b": 484.13309, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "CNN BACKBONE ENCODER", "bbox": {"l": 65.319511, "t": 324.26235999999994, "r": 132.9245, "b": 330.22235000000006, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "[30, 1, 2, 3, 4, \u2026 3, ", "bbox": {"l": 119.51457, "t": 269.66394, "r": 162.98782, "b": 274.72992, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "4, 5, 8, 31]", "bbox": {"l": 128.72858, "t": 274.91394, "r": 151.41083, "b": 279.97992, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "Positional ", "bbox": {"l": 60.434211999999995, "t": 338.95993, "r": 80.27021, "b": 344.26993, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "Encoding", "bbox": {"l": 60.598457, "t": 343.38605, "r": 78.854958, "b": 348.69604, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "Positional ", "bbox": {"l": 134.82877, "t": 293.37762, "r": 154.66476, "b": 298.68762, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "Encoding", "bbox": {"l": 134.99303, "t": 297.80370999999997, "r": 153.24953, "b": 303.11371, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "Add & Normalisation", "bbox": {"l": 150.55193, "t": 345.35861, "r": 197.14943, "b": 351.02063, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Add", "bbox": {"l": 150.55193, "t": 394.4234, "r": 156.68318, "b": 400.08542, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "& Normalisation", "bbox": {"l": 188.56567, "t": 394.4234, "r": 197.14943, "b": 400.08542, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "Multi-Head Attention", "bbox": {"l": 150.18539, "t": 375.66843, "r": 197.31964, "b": 381.33044, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "Add", "bbox": {"l": 150.55193, "t": 440.24847000000005, "r": 156.68318, "b": 445.91049, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "& Normalisation", "bbox": {"l": 188.56567, "t": 440.24847000000005, "r": 197.14943, "b": 445.91049, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Feed Forward Network", "bbox": {"l": 147.86377, "t": 422.09335, "r": 199.76227, "b": 427.75537, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Linear", "bbox": {"l": 241.56567000000004, "t": 314.26285000000007, "r": 255.72542, "b": 319.92487, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "Linear", "bbox": {"l": 241.91730000000004, "t": 361.36493, "r": 256.07706, "b": 367.02695, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "Attention", "bbox": {"l": 228.054, "t": 336.61929000000003, "r": 248.72363000000004, "b": 342.28131, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "Network", "bbox": {"l": 246.2919, "t": 336.61929000000003, "r": 269.39325, "b": 342.28131, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "MLP", "bbox": {"l": 228.44568000000004, "t": 405.14682, "r": 238.73892, "b": 410.80884, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Linear ", "bbox": {"l": 256.29767, "t": 405.2032500000001, "r": 271.77792, "b": 410.86526, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "Sigmoid", "bbox": {"l": 239.54543, "t": 382.21344, "r": 258.08942, "b": 387.87546, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "Transformer Encoder Network", "bbox": {"l": 54.14704100000001, "t": 384.87183, "r": 59.51152, "b": 449.78326, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "x2", "bbox": {"l": 54.235424, "t": 373.81232, "r": 59.30449699999999, "b": 378.45421999999996, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "Encoded Output", "bbox": {"l": 85.295891, "t": 484.53189, "r": 122.16431, "b": 490.36688, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "Encoded Output", "bbox": {"l": 229.66599, "t": 279.54607999999996, "r": 265.3194, "b": 285.45572000000004, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "Predicted Tags", "bbox": {"l": 157.17369, "t": 500.3031, "r": 190.41711, "b": 506.12943, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "Bounding Boxes & ", "bbox": {"l": 227.81598999999997, "t": 438.05542, "r": 270.78442, "b": 443.89206, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "Classification", "bbox": {"l": 233.70262, "t": 444.06183, "r": 263.51105, "b": 449.8904999999999, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "Transformer ", "bbox": {"l": 184.74655, "t": 293.39502, "r": 212.16055, "b": 298.75903, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "Decoder Network", "bbox": {"l": 178.91229, "t": 299.14502, "r": 216.74378999999996, "b": 304.50903, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "x4", "bbox": {"l": 194.24574, "t": 282.7822, "r": 198.89099, "b": 287.84817999999996, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "CELL BBOX DECODER", "bbox": {"l": 221.45587, "t": 271.86914, "r": 276.47089, "b": 277.82916, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "Masked Multi-Head ", "bbox": {"l": 151.65219, "t": 323.44241, "r": 197.29019, "b": 329.10443, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "Attention", "bbox": {"l": 163.43277, "t": 329.44241, "r": 184.19028, "b": 335.10443, "coord_origin": "TOPLEFT"}}], "children": [{"id": 69, "label": "text", "bbox": {"l": 74.253464, "t": 258.21472000000006, "r": 101.75846, "b": 264.17474000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "Input Image", "bbox": {"l": 74.253464, "t": 258.21472000000006, "r": 101.75846, "b": 264.17474000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 122.29972, "t": 258.34520999999995, "r": 157.83972, "b": 264.30524, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "Tokenised Tags", "bbox": {"l": 122.29972, "t": 258.34520999999995, "r": 157.83972, "b": 264.30524, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 78.549347, "t": 371.38579999999996, "r": 125.68359000000001, "b": 377.04782, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "Multi-Head Attention", "bbox": {"l": 78.549347, "t": 371.38579999999996, "r": 125.68359000000001, "b": 377.04782, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 78.513298, "t": 391.31857, "r": 84.644547, "b": 396.98059, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "Add", "bbox": {"l": 78.513298, "t": 391.31857, "r": 84.644547, "b": 396.98059, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 116.52705, "t": 391.31857, "r": 125.11079999999998, "b": 396.98059, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "& Normalisation", "bbox": {"l": 116.52705, "t": 391.31857, "r": 125.11079999999998, "b": 396.98059, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 76.024773, "t": 424.45309, "r": 127.92327000000002, "b": 430.11511, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "Feed Forward Network", "bbox": {"l": 76.024773, "t": 424.45309, "r": 127.92327000000002, "b": 430.11511, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 78.382828, "t": 444.88956, "r": 84.514076, "b": 450.55157, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "Add", "bbox": {"l": 78.382828, "t": 444.88956, "r": 84.514076, "b": 450.55157, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 116.39658, "t": 444.88956, "r": 124.98033, "b": 450.55157, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "& Normalisation", "bbox": {"l": 116.39658, "t": 444.88956, "r": 124.98033, "b": 450.55157, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 167.46945, "t": 462.44324, "r": 181.6292, "b": 468.10526, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "Linear", "bbox": {"l": 167.46945, "t": 462.44324, "r": 181.6292, "b": 468.10526, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 165.61292, "t": 478.47107, "r": 184.43242, "b": 484.13309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "Softmax", "bbox": {"l": 165.61292, "t": 478.47107, "r": 184.43242, "b": 484.13309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 65.319511, "t": 324.26235999999994, "r": 132.9245, "b": 330.22235000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "CNN BACKBONE ENCODER", "bbox": {"l": 65.319511, "t": 324.26235999999994, "r": 132.9245, "b": 330.22235000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 119.51457, "t": 269.66394, "r": 162.98782, "b": 274.72992, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "[30, 1, 2, 3, 4, \u2026 3, ", "bbox": {"l": 119.51457, "t": 269.66394, "r": 162.98782, "b": 274.72992, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 128.72858, "t": 274.91394, "r": 151.41083, "b": 279.97992, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "4, 5, 8, 31]", "bbox": {"l": 128.72858, "t": 274.91394, "r": 151.41083, "b": 279.97992, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 60.434211999999995, "t": 338.95993, "r": 80.27021, "b": 344.26993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "Positional ", "bbox": {"l": 60.434211999999995, "t": 338.95993, "r": 80.27021, "b": 344.26993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 60.598457, "t": 343.38605, "r": 78.854958, "b": 348.69604, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "Encoding", "bbox": {"l": 60.598457, "t": 343.38605, "r": 78.854958, "b": 348.69604, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 134.82877, "t": 293.37762, "r": 154.66476, "b": 298.68762, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "Positional ", "bbox": {"l": 134.82877, "t": 293.37762, "r": 154.66476, "b": 298.68762, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 134.99303, "t": 297.80370999999997, "r": 153.24953, "b": 303.11371, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "Encoding", "bbox": {"l": 134.99303, "t": 297.80370999999997, "r": 153.24953, "b": 303.11371, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 150.55193, "t": 345.35861, "r": 197.14943, "b": 351.02063, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "Add & Normalisation", "bbox": {"l": 150.55193, "t": 345.35861, "r": 197.14943, "b": 351.02063, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 150.55193, "t": 394.4234, "r": 156.68318, "b": 400.08542, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "Add", "bbox": {"l": 150.55193, "t": 394.4234, "r": 156.68318, "b": 400.08542, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 188.56567, "t": 394.4234, "r": 197.14943, "b": 400.08542, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "& Normalisation", "bbox": {"l": 188.56567, "t": 394.4234, "r": 197.14943, "b": 400.08542, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 150.18539, "t": 375.66843, "r": 197.31964, "b": 381.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "Multi-Head Attention", "bbox": {"l": 150.18539, "t": 375.66843, "r": 197.31964, "b": 381.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 150.55193, "t": 440.24847000000005, "r": 156.68318, "b": 445.91049, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "Add", "bbox": {"l": 150.55193, "t": 440.24847000000005, "r": 156.68318, "b": 445.91049, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 188.56567, "t": 440.24847000000005, "r": 197.14943, "b": 445.91049, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "& Normalisation", "bbox": {"l": 188.56567, "t": 440.24847000000005, "r": 197.14943, "b": 445.91049, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 147.86377, "t": 422.09335, "r": 199.76227, "b": 427.75537, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "Feed Forward Network", "bbox": {"l": 147.86377, "t": 422.09335, "r": 199.76227, "b": 427.75537, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 241.56567000000004, "t": 314.26285000000007, "r": 255.72542, "b": 319.92487, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "Linear", "bbox": {"l": 241.56567000000004, "t": 314.26285000000007, "r": 255.72542, "b": 319.92487, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 241.91730000000004, "t": 361.36493, "r": 256.07706, "b": 367.02695, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "Linear", "bbox": {"l": 241.91730000000004, "t": 361.36493, "r": 256.07706, "b": 367.02695, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 228.054, "t": 336.61929000000003, "r": 248.72363000000004, "b": 342.28131, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "Attention", "bbox": {"l": 228.054, "t": 336.61929000000003, "r": 248.72363000000004, "b": 342.28131, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 246.2919, "t": 336.61929000000003, "r": 269.39325, "b": 342.28131, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "Network", "bbox": {"l": 246.2919, "t": 336.61929000000003, "r": 269.39325, "b": 342.28131, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 228.44568000000004, "t": 405.14682, "r": 238.73892, "b": 410.80884, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "MLP", "bbox": {"l": 228.44568000000004, "t": 405.14682, "r": 238.73892, "b": 410.80884, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 256.29767, "t": 405.2032500000001, "r": 271.77792, "b": 410.86526, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "Linear ", "bbox": {"l": 256.29767, "t": 405.2032500000001, "r": 271.77792, "b": 410.86526, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 239.54543, "t": 382.21344, "r": 258.08942, "b": 387.87546, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "Sigmoid", "bbox": {"l": 239.54543, "t": 382.21344, "r": 258.08942, "b": 387.87546, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 54.14704100000001, "t": 384.87183, "r": 59.51152, "b": 449.78326, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "Transformer Encoder Network", "bbox": {"l": 54.14704100000001, "t": 384.87183, "r": 59.51152, "b": 449.78326, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 54.235424, "t": 373.81232, "r": 59.30449699999999, "b": 378.45421999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "x2", "bbox": {"l": 54.235424, "t": 373.81232, "r": 59.30449699999999, "b": 378.45421999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 85.295891, "t": 484.53189, "r": 122.16431, "b": 490.36688, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "Encoded Output", "bbox": {"l": 85.295891, "t": 484.53189, "r": 122.16431, "b": 490.36688, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 229.66599, "t": 279.54607999999996, "r": 265.3194, "b": 285.45572000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "Encoded Output", "bbox": {"l": 229.66599, "t": 279.54607999999996, "r": 265.3194, "b": 285.45572000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 157.17369, "t": 500.3031, "r": 190.41711, "b": 506.12943, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "Predicted Tags", "bbox": {"l": 157.17369, "t": 500.3031, "r": 190.41711, "b": 506.12943, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 227.81598999999997, "t": 438.05542, "r": 270.78442, "b": 443.89206, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "Bounding Boxes & ", "bbox": {"l": 227.81598999999997, "t": 438.05542, "r": 270.78442, "b": 443.89206, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 233.70262, "t": 444.06183, "r": 263.51105, "b": 449.8904999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "Classification", "bbox": {"l": 233.70262, "t": 444.06183, "r": 263.51105, "b": 449.8904999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 184.74655, "t": 293.39502, "r": 212.16055, "b": 298.75903, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "Transformer ", "bbox": {"l": 184.74655, "t": 293.39502, "r": 212.16055, "b": 298.75903, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 178.91229, "t": 299.14502, "r": 216.74378999999996, "b": 304.50903, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "Decoder Network", "bbox": {"l": 178.91229, "t": 299.14502, "r": 216.74378999999996, "b": 304.50903, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 194.24574, "t": 282.7822, "r": 198.89099, "b": 287.84817999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": "x4", "bbox": {"l": 194.24574, "t": 282.7822, "r": 198.89099, "b": 287.84817999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 221.45587, "t": 271.86914, "r": 276.47089, "b": 277.82916, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "CELL BBOX DECODER", "bbox": {"l": 221.45587, "t": 271.86914, "r": 276.47089, "b": 277.82916, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 151.65219, "t": 323.44241, "r": 197.29019, "b": 329.10443, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "Masked Multi-Head ", "bbox": {"l": 151.65219, "t": 323.44241, "r": 197.29019, "b": 329.10443, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 163.43277, "t": 329.44241, "r": 184.19028, "b": 335.10443, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": "Attention", "bbox": {"l": 163.43277, "t": 329.44241, "r": 184.19028, "b": 335.10443, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 8, "label": "caption", "bbox": {"l": 50.112, "t": 527.7828099999999, "r": 286.36597, "b": 680.27094, "coord_origin": "TOPLEFT"}, "confidence": 0.8913412094116211, "cells": [{"id": 107, "text": "Figure 4: Given an input image of a table, the", "bbox": {"l": 50.112, "t": 527.90237, "r": 229.78752, "b": 536.80893, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "Encoder", "bbox": {"l": 231.787, "t": 527.7828099999999, "r": 267.76196, "b": 536.7392, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "pro-", "bbox": {"l": 269.76401, "t": 527.90237, "r": 286.36169, "b": 536.80893, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "duces fixed-length features that represent the input image.", "bbox": {"l": 50.112015, "t": 539.85738, "r": 286.36508, "b": 548.76393, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "The features are then passed to both the", "bbox": {"l": 50.112015, "t": 551.81337, "r": 205.84735, "b": 560.71992, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "Structure Decoder", "bbox": {"l": 208.01802, "t": 551.69382, "r": 286.36392, "b": 560.6501900000001, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "and", "bbox": {"l": 50.112015, "t": 563.76837, "r": 64.498009, "b": 572.67493, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "Cell BBox Decoder", "bbox": {"l": 68.165016, "t": 563.64882, "r": 151.31288, "b": 572.60519, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": ".", "bbox": {"l": 151.31302, "t": 563.76837, "r": 153.80367, "b": 572.67493, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "During training, the", "bbox": {"l": 160.41884, "t": 563.76837, "r": 241.93283000000002, "b": 572.67493, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "Structure", "bbox": {"l": 245.59502, "t": 563.64882, "r": 286.362, "b": 572.60519, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "Decoder", "bbox": {"l": 50.112015, "t": 575.60382, "r": 85.519089, "b": 584.5602, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "receives \u2018tokenized tags\u2019 of the HTML code that", "bbox": {"l": 88.623016, "t": 575.7233699999999, "r": 286.36072, "b": 584.6299300000001, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "represent the table structure. Afterwards, a transformer en-", "bbox": {"l": 50.112015, "t": 587.6783800000001, "r": 286.36511, "b": 596.58493, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "coder and decoder architecture is employed to produce fea-", "bbox": {"l": 50.112015, "t": 599.63338, "r": 286.36508, "b": 608.53993, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "tures that are received by a linear layer, and the", "bbox": {"l": 50.112015, "t": 611.58838, "r": 240.43756000000002, "b": 620.4949300000001, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "Cell BBox", "bbox": {"l": 243.19801, "t": 611.46883, "r": 286.36597, "b": 620.4252, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "Decoder. The linear layer is applied to the features to", "bbox": {"l": 50.112015, "t": 623.42482, "r": 286.36511, "b": 632.3812, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "predict the tags. Simultaneously, the Cell BBox Decoder", "bbox": {"l": 50.112015, "t": 635.37982, "r": 286.36508, "b": 644.3362, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "selects features referring to the data cells (\u2018", "bbox": {"l": 50.112015, "t": 647.45438, "r": 220.58205, "b": 656.36093, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "<", "bbox": {"l": 220.57802000000004, "t": 647.29497, "r": 228.32693, "b": 656.14175, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "td", "bbox": {"l": 228.32700999999997, "t": 647.45438, "r": 236.07791000000003, "b": 656.36093, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": ">", "bbox": {"l": 236.07802000000004, "t": 647.29497, "r": 243.82693, "b": 656.14175, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "\u2019, \u2018", "bbox": {"l": 243.82602, "t": 647.45438, "r": 255.29298000000003, "b": 656.36093, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "<", "bbox": {"l": 255.29102000000003, "t": 647.29497, "r": 263.03992, "b": 656.14175, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "\u2019) and", "bbox": {"l": 263.04001, "t": 647.45438, "r": 286.36246, "b": 656.36093, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "passes them through an attention network, an MLP, and a", "bbox": {"l": 50.112015, "t": 659.40938, "r": 286.36511, "b": 668.31594, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "linear layer to predict the bounding boxes.", "bbox": {"l": 50.112015, "t": 671.36438, "r": 218.46996, "b": 680.27094, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "text", "bbox": {"l": 308.862, "t": 249.53441999999995, "r": 545.11505, "b": 294.3069499999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9831458330154419, "cells": [{"id": 135, "text": "forming classification, and adding an adaptive pooling", "bbox": {"l": 308.862, "t": 249.53441999999995, "r": 523.05786, "b": 258.44097999999997, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "layer", "bbox": {"l": 525.19983, "t": 249.53441999999995, "r": 545.11505, "b": 258.44097999999997, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "of size 28*28. ResNet by default downsamples the", "bbox": {"l": 308.862, "t": 261.49042, "r": 517.55847, "b": 270.39697, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "image", "bbox": {"l": 520.76642, "t": 261.49042, "r": 545.11499, "b": 270.39697, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "resolution by 32 and then the encoded image is provided", "bbox": {"l": 308.862, "t": 273.44537, "r": 534.80377, "b": 282.35196, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "to", "bbox": {"l": 537.36414, "t": 273.44537, "r": 545.11505, "b": 282.35196, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "both the", "bbox": {"l": 308.862, "t": 285.40039, "r": 341.24045, "b": 294.3069499999999, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "Structure Decoder", "bbox": {"l": 343.73099, "t": 285.49005, "r": 417.23508, "b": 294.07782000000003, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": ", and", "bbox": {"l": 417.23398, "t": 285.40039, "r": 436.60129, "b": 294.3069499999999, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "Cell BBox Decoder", "bbox": {"l": 439.09198, "t": 285.49005, "r": 516.56116, "b": 294.07782000000003, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": ".", "bbox": {"l": 516.56097, "t": 285.40039, "r": 519.05164, "b": 294.3069499999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 308.86194, "t": 297.33981, "r": 545.11511, "b": 413.96182, "coord_origin": "TOPLEFT"}, "confidence": 0.9862009882926941, "cells": [{"id": 146, "text": "Structure Decoder.", "bbox": {"l": 320.81696, "t": 297.33981, "r": 400.86649, "b": 306.2962, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "The transformer architecture of", "bbox": {"l": 403.91394, "t": 297.45938, "r": 528.33685, "b": 306.36594, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "this", "bbox": {"l": 530.7179, "t": 297.45938, "r": 545.11383, "b": 306.36594, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "component is based on the work proposed in [31].", "bbox": {"l": 308.86194, "t": 309.41437, "r": 517.5285, "b": 318.32092, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "After", "bbox": {"l": 524.09387, "t": 309.41437, "r": 545.11493, "b": 318.32092, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "extensive experimentation, the", "bbox": {"l": 308.86194, "t": 321.36934999999994, "r": 432.35833999999994, "b": 330.27591, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "Structure Decoder", "bbox": {"l": 435.81995000000006, "t": 321.45901, "r": 510.29041, "b": 330.04678, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "is", "bbox": {"l": 513.97797, "t": 321.36934999999994, "r": 520.62305, "b": 330.27591, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "mod-", "bbox": {"l": 524.08008, "t": 321.36934999999994, "r": 545.11115, "b": 330.27591, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "eled as a transformer encoder with two encoder layers", "bbox": {"l": 308.86197, "t": 333.32434, "r": 527.76013, "b": 342.2309, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "and", "bbox": {"l": 530.729, "t": 333.32434, "r": 545.11499, "b": 342.2309, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "a transformer decoder made from a stack of 4 decoder", "bbox": {"l": 308.86197, "t": 345.27933, "r": 526.85352, "b": 354.18588, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "lay-", "bbox": {"l": 529.62311, "t": 345.27933, "r": 545.11493, "b": 354.18588, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "ers that comprise mainly of multi-head attention and", "bbox": {"l": 308.86197, "t": 357.23532, "r": 524.51245, "b": 366.14188, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "feed", "bbox": {"l": 527.96948, "t": 357.23532, "r": 545.11511, "b": 366.14188, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "forward layers.", "bbox": {"l": 308.86197, "t": 369.19031000000007, "r": 370.39096, "b": 378.09685999999994, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "This configuration uses fewer layers", "bbox": {"l": 377.44449, "t": 369.19031000000007, "r": 526.91339, "b": 378.09685999999994, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "and", "bbox": {"l": 530.72906, "t": 369.19031000000007, "r": 545.11505, "b": 378.09685999999994, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "heads in comparison to networks applied to other", "bbox": {"l": 308.86197, "t": 381.14529000000005, "r": 505.46395999999993, "b": 390.05185, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "problems", "bbox": {"l": 508.03430000000003, "t": 381.14529000000005, "r": 545.11511, "b": 390.05185, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "(e.g. \u201cScene Understanding\u201d, \u201cImage Captioning\u201d),", "bbox": {"l": 308.86197, "t": 393.10028, "r": 517.68799, "b": 402.00684, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "some-", "bbox": {"l": 520.76642, "t": 393.10028, "r": 545.11499, "b": 402.00684, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "thing which we relate to the simplicity of table images.", "bbox": {"l": 308.86197, "t": 405.05526999999995, "r": 528.01935, "b": 413.96182, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 308.86197, "t": 417.11426, "r": 545.11511, "b": 545.57271, "coord_origin": "TOPLEFT"}, "confidence": 0.9851908087730408, "cells": [{"id": 169, "text": "The transformer encoder receives an encoded", "bbox": {"l": 320.81696, "t": 417.11426, "r": 515.49609, "b": 426.02081, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "image", "bbox": {"l": 520.7663, "t": 417.11426, "r": 545.11487, "b": 426.02081, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "from the", "bbox": {"l": 308.86197, "t": 429.0692399999999, "r": 343.72107, "b": 437.9758, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "CNN Backbone Network", "bbox": {"l": 347.03796, "t": 429.15891, "r": 446.45471000000003, "b": 437.74667, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "and refines it", "bbox": {"l": 449.93996999999996, "t": 429.0692399999999, "r": 503.06055000000003, "b": 437.9758, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "through", "bbox": {"l": 506.37808, "t": 429.0692399999999, "r": 537.3717, "b": 437.9758, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "a", "bbox": {"l": 540.68927, "t": 429.0692399999999, "r": 545.11267, "b": 437.9758, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "multi-head dot-product attention layer, followed by a", "bbox": {"l": 308.86197, "t": 441.02423, "r": 522.78894, "b": 449.93079, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "Feed", "bbox": {"l": 525.7478, "t": 441.02423, "r": 545.11511, "b": 449.93079, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "Forward Network.", "bbox": {"l": 308.86197, "t": 452.97922, "r": 384.14929, "b": 461.88577, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "During training, the transformer", "bbox": {"l": 393.37466, "t": 452.97922, "r": 527.84985, "b": 461.88577, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "de-", "bbox": {"l": 532.39282, "t": 452.97922, "r": 545.11505, "b": 461.88577, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "coder receives as input the output feature produced by", "bbox": {"l": 308.86197, "t": 464.93521, "r": 529.7627, "b": 473.84177, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "the", "bbox": {"l": 532.94073, "t": 464.93521, "r": 545.11505, "b": 473.84177, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "transformer encoder, and the tokenized input of the", "bbox": {"l": 308.86197, "t": 476.8902, "r": 514.17126, "b": 485.79675, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "HTML", "bbox": {"l": 516.89105, "t": 476.8902, "r": 545.11511, "b": 485.79675, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": "ground-truth tags. Using a stack of multi-head attention", "bbox": {"l": 308.86197, "t": 488.84518, "r": 527.63068, "b": 497.75174, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "lay-", "bbox": {"l": 529.62317, "t": 488.84518, "r": 545.11499, "b": 497.75174, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "ers, different aspects of the tag sequence could be", "bbox": {"l": 308.86197, "t": 500.80017, "r": 508.3630999999999, "b": 509.70673, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": "inferred.", "bbox": {"l": 511.09286000000003, "t": 500.80017, "r": 545.11511, "b": 509.70673, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "This is achieved by each attention head on a layer operating", "bbox": {"l": 308.86197, "t": 512.7551599999999, "r": 545.11499, "b": 521.6617100000001, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "in a different subspace, and then combining altogether their", "bbox": {"l": 308.86197, "t": 524.71115, "r": 545.11511, "b": 533.61771, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "attention score.", "bbox": {"l": 308.86197, "t": 536.66615, "r": 369.73349, "b": 545.57271, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 308.86194, "t": 548.6046, "r": 545.11511, "b": 653.27271, "coord_origin": "TOPLEFT"}, "confidence": 0.9869197010993958, "cells": [{"id": 192, "text": "Cell BBox Decoder.", "bbox": {"l": 320.81696, "t": 548.6046, "r": 404.76184, "b": 557.56097, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "Our architecture allows to simul-", "bbox": {"l": 410.34094, "t": 548.72415, "r": 545.11505, "b": 557.63071, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "taneously predict HTML tags and bounding boxes for each", "bbox": {"l": 308.86194, "t": 560.68015, "r": 545.11493, "b": 569.5867000000001, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "table cell without the need of a separate object detector end", "bbox": {"l": 308.86194, "t": 572.6351500000001, "r": 545.11511, "b": 581.5417, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "to end. This approach is inspired by DETR [1] which em-", "bbox": {"l": 308.86194, "t": 584.59015, "r": 545.11493, "b": 593.4967, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "ploys a Transformer Encoder, and Decoder that looks for", "bbox": {"l": 308.86194, "t": 596.54515, "r": 545.11499, "b": 605.45171, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "a specific number of object queries (potential object detec-", "bbox": {"l": 308.86194, "t": 608.50015, "r": 545.11505, "b": 617.40671, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "tions). As our model utilizes a transformer architecture, the", "bbox": {"l": 308.86194, "t": 620.45515, "r": 545.11505, "b": 629.36171, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "hidden state of the", "bbox": {"l": 308.86194, "t": 632.41115, "r": 381.67859, "b": 641.3177000000001, "coord_origin": "TOPLEFT"}}, {"id": 201, "text": "<", "bbox": {"l": 383.99695, "t": 632.25174, "r": 391.74585, "b": 641.09853, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": "td", "bbox": {"l": 391.74594, "t": 632.41115, "r": 399.49686, "b": 641.3177000000001, "coord_origin": "TOPLEFT"}}, {"id": 203, "text": ">", "bbox": {"l": 399.49695, "t": 632.25174, "r": 407.24585, "b": 641.09853, "coord_origin": "TOPLEFT"}}, {"id": 204, "text": "\u2019 and \u2018", "bbox": {"l": 407.24594, "t": 632.41115, "r": 432.90958, "b": 641.3177000000001, "coord_origin": "TOPLEFT"}}, {"id": 205, "text": "<", "bbox": {"l": 432.90792999999996, "t": 632.25174, "r": 440.65683000000007, "b": 641.09853, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": "\u2019 HTML structure tags be-", "bbox": {"l": 440.65691999999996, "t": 632.41115, "r": 545.11475, "b": 641.3177000000001, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": "come the object query.", "bbox": {"l": 308.86194, "t": 644.3661500000001, "r": 398.96371, "b": 653.27271, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 308.86194, "t": 656.42516, "r": 545.11505, "b": 713.151726, "coord_origin": "TOPLEFT"}, "confidence": 0.9852352142333984, "cells": [{"id": 208, "text": "The encoding generated by the", "bbox": {"l": 320.81693, "t": 656.42516, "r": 444.34316999999993, "b": 665.33172, "coord_origin": "TOPLEFT"}}, {"id": 209, "text": "CNN Backbone Network", "bbox": {"l": 447.00591999999995, "t": 656.51482, "r": 545.1076, "b": 665.10258, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": "along with the features acquired for every data cell from the", "bbox": {"l": 308.86194, "t": 668.38016, "r": 545.11505, "b": 677.2867200000001, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "Transformer Decoder are then passed to the attention net-", "bbox": {"l": 308.86194, "t": 680.33516, "r": 545.11505, "b": 689.24172, "coord_origin": "TOPLEFT"}}, {"id": 212, "text": "work. The attention network takes both inputs and learns to", "bbox": {"l": 308.86194, "t": 692.290161, "r": 545.11505, "b": 701.196724, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "provide an attention weighted encoding. This weighted at-", "bbox": {"l": 308.86194, "t": 704.245163, "r": 545.11505, "b": 713.151726, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "page_footer", "bbox": {"l": 295.12094, "t": 734.13316, "r": 300.10223, "b": 743.039722, "coord_origin": "TOPLEFT"}, "confidence": 0.8719562292098999, "cells": [{"id": 214, "text": "5", "bbox": {"l": 295.12094, "t": 734.13316, "r": 300.10223, "b": 743.039722, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "picture", "id": 7, "page_no": 4, "cluster": {"id": 7, "label": "picture", "bbox": {"l": 74.30525970458984, "t": 77.9112319946289, "r": 519.9801025390625, "b": 183.70150756835938, "coord_origin": "TOPLEFT"}, "confidence": 0.9296805262565613, "cells": [{"id": 0, "text": "1.", "bbox": {"l": 81.688072, "t": 122.43970000000002, "r": 84.927567, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Item", "bbox": {"l": 86.54731, "t": 122.43970000000002, "r": 93.026291, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Amount", "bbox": {"l": 102.50498, "t": 115.25214000000005, "r": 115.3461, "b": 118.44135000000006, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Names", "bbox": {"l": 82.140205, "t": 115.21489999999994, "r": 93.291527, "b": 118.40410999999995, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "1000", "bbox": {"l": 96.748268, "t": 122.43970000000002, "r": 104.3119, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "500", "bbox": {"l": 96.748268, "t": 127.74370999999985, "r": 102.42083, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "3500", "bbox": {"l": 96.748268, "t": 133.45569, "r": 104.3119, "b": 136.6449, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "150", "bbox": {"l": 96.748268, "t": 139.16772000000003, "r": 102.42083, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "unit", "bbox": {"l": 110.66107, "t": 122.43970000000002, "r": 116.14391, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "unit", "bbox": {"l": 110.66107, "t": 127.74370999999985, "r": 116.14391, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "unit", "bbox": {"l": 110.66107, "t": 133.45569, "r": 116.14391, "b": 136.6449, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "unit", "bbox": {"l": 110.66107, "t": 139.16772000000003, "r": 116.14391, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "2.", "bbox": {"l": 81.688072, "t": 127.74370999999985, "r": 84.927567, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Item", "bbox": {"l": 86.54731, "t": 127.74370999999985, "r": 93.026291, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "3.", "bbox": {"l": 81.688072, "t": 133.45569, "r": 84.927567, "b": 136.6449, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Item", "bbox": {"l": 86.54731, "t": 133.45569, "r": 93.026291, "b": 136.6449, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "4.", "bbox": {"l": 81.688072, "t": 139.16772000000003, "r": 84.927567, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "Item", "bbox": {"l": 86.54731, "t": 139.16772000000003, "r": 93.026291, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Extracted", "bbox": {"l": 88.084389, "t": 90.49738000000002, "r": 113.93649, "b": 96.23798, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Table Images", "bbox": {"l": 82.81002, "t": 97.63738999999998, "r": 119.21240000000002, "b": 103.37798999999995, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Standardized", "bbox": {"l": 143.94247, "t": 100.60235999999998, "r": 180.01131, "b": 106.34295999999995, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Images", "bbox": {"l": 151.94064, "t": 107.74237000000005, "r": 172.0118, "b": 113.48297000000014, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "BBox", "bbox": {"l": 251.76939000000002, "t": 80.93096999999989, "r": 266.39557, "b": 86.67156999999997, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Decoder", "bbox": {"l": 247.51601, "t": 86.03101000000004, "r": 270.65021, "b": 91.77161000000001, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "BBoxes", "bbox": {"l": 331.03699, "t": 78.55980999999997, "r": 352.12589, "b": 84.30042000000003, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "BBoxes can be", "bbox": {"l": 390.56421, "t": 96.03223000000003, "r": 431.7261, "b": 101.77282999999989, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "traced back to the", "bbox": {"l": 386.82422, "t": 102.15228000000013, "r": 435.46966999999995, "b": 107.89287999999999, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "original image to", "bbox": {"l": 388.69589, "t": 108.27228000000002, "r": 433.6032400000001, "b": 114.01288000000011, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "extract content", "bbox": {"l": 391.07761, "t": 114.39227000000005, "r": 431.22542999999996, "b": 120.13286999999991, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Structure Tags sequence", "bbox": {"l": 431.22650000000004, "t": 151.68511999999998, "r": 498.82068, "b": 157.42571999999996, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "provide full description of", "bbox": {"l": 431.1738, "t": 157.80517999999995, "r": 498.87753000000004, "b": 163.54578000000004, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "the table structure", "bbox": {"l": 440.5289, "t": 163.92516999999998, "r": 489.51827999999995, "b": 169.66576999999995, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Structure Tags", "bbox": {"l": 328.37479, "t": 178.25385000000006, "r": 367.72333, "b": 183.99445000000003, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "BBoxes in sync", "bbox": {"l": 331.84451, "t": 123.90886999999998, "r": 373.67963, "b": 129.64948000000015, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "with tag sequence", "bbox": {"l": 331.84451, "t": 129.00885000000017, "r": 381.17786, "b": 134.74945000000002, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "Encoder", "bbox": {"l": 196.62633, "t": 88.11621000000002, "r": 219.42332, "b": 93.85681, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Structure", "bbox": {"l": 246.66771, "t": 129.4946900000001, "r": 271.49899, "b": 135.23528999999996, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "Decoder", "bbox": {"l": 247.51601, "t": 134.59473000000003, "r": 270.65021, "b": 140.33533, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "[x1, y2, x2, y2]", "bbox": {"l": 330.63071, "t": 89.01923, "r": 365.55347, "b": 94.75982999999997, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "[x1', y2', x2', y2']", "bbox": {"l": 330.63071, "t": 97.17926, "r": 370.22717, "b": 102.91985999999997, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "[x1'', y2'', x2'', y2'']", "bbox": {"l": 330.63071, "t": 105.33922999999993, "r": 374.51157, "b": 111.07983000000002, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "...", "bbox": {"l": 330.63071, "t": 113.49926999999991, "r": 335.73233, "b": 119.23987, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "<TR>", "bbox": {"l": 322.30579, "t": 141.79236000000003, "r": 335.05988, "b": 146.57617000000005, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "<TD>", "bbox": {"l": 322.30579, "t": 148.93231000000003, "r": 335.05988, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "1", "bbox": {"l": 337.54971, "t": 148.55579, "r": 340.95242, "b": 154.29638999999997, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "</TD><TD colspan=\"2\">", "bbox": {"l": 343.56262, "t": 148.93231000000003, "r": 398.91446, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "</TD>", "bbox": {"l": 407.41718, "t": 148.93231000000003, "r": 421.58801, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "</TR><TR>", "bbox": {"l": 322.30579, "t": 156.07232999999997, "r": 349.23022, "b": 160.85613999999998, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "<TD>", "bbox": {"l": 322.30579, "t": 163.21234000000004, "r": 335.05988, "b": 167.99614999999994, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "</TD><TD>...", "bbox": {"l": 343.56155, "t": 163.21234000000004, "r": 374.73685, "b": 167.99614999999994, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "...", "bbox": {"l": 322.30579, "t": 170.35235999999998, "r": 326.55716, "b": 175.13617, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "1", "bbox": {"l": 323.51111, "t": 89.66967999999997, "r": 326.91382, "b": 95.41027999999994, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "2", "bbox": {"l": 323.71509, "t": 97.78887999999995, "r": 327.1178, "b": 103.52948000000004, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "3", "bbox": {"l": 323.71509, "t": 105.98969, "r": 327.1178, "b": 111.73029000000008, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "2", "bbox": {"l": 401.4816, "t": 148.54625999999996, "r": 404.88431, "b": 154.28687000000002, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "3", "bbox": {"l": 337.6976, "t": 162.68451000000005, "r": 341.10031, "b": 168.42511000000002, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "3", "bbox": {"l": 454.46378, "t": 104.54584, "r": 457.86648999999994, "b": 110.28644000000008, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "2", "bbox": {"l": 493.32580999999993, "t": 91.09546, "r": 496.72852, "b": 96.83605999999997, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "1", "bbox": {"l": 454.08298, "t": 90.56879000000015, "r": 457.48569000000003, "b": 96.30939000000001, "coord_origin": "TOPLEFT"}}], "children": [{"id": 10, "label": "text", "bbox": {"l": 81.688072, "t": 122.43970000000002, "r": 84.927567, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 0, "text": "1.", "bbox": {"l": 81.688072, "t": 122.43970000000002, "r": 84.927567, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 86.54731, "t": 122.43970000000002, "r": 93.026291, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 1, "text": "Item", "bbox": {"l": 86.54731, "t": 122.43970000000002, "r": 93.026291, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 102.50498, "t": 115.25214000000005, "r": 115.3461, "b": 118.44135000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 2, "text": "Amount", "bbox": {"l": 102.50498, "t": 115.25214000000005, "r": 115.3461, "b": 118.44135000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 82.140205, "t": 115.21489999999994, "r": 93.291527, "b": 118.40410999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 3, "text": "Names", "bbox": {"l": 82.140205, "t": 115.21489999999994, "r": 93.291527, "b": 118.40410999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 96.748268, "t": 122.43970000000002, "r": 104.3119, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 4, "text": "1000", "bbox": {"l": 96.748268, "t": 122.43970000000002, "r": 104.3119, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 96.748268, "t": 127.74370999999985, "r": 102.42083, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 5, "text": "500", "bbox": {"l": 96.748268, "t": 127.74370999999985, "r": 102.42083, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 96.748268, "t": 133.45569, "r": 104.3119, "b": 136.6449, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": "3500", "bbox": {"l": 96.748268, "t": 133.45569, "r": 104.3119, "b": 136.6449, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 96.748268, "t": 139.16772000000003, "r": 102.42083, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "150", "bbox": {"l": 96.748268, "t": 139.16772000000003, "r": 102.42083, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 110.66107, "t": 122.43970000000002, "r": 116.14391, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "unit", "bbox": {"l": 110.66107, "t": 122.43970000000002, "r": 116.14391, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 110.66107, "t": 127.74370999999985, "r": 116.14391, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "unit", "bbox": {"l": 110.66107, "t": 127.74370999999985, "r": 116.14391, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 110.66107, "t": 133.45569, "r": 116.14391, "b": 136.6449, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "unit", "bbox": {"l": 110.66107, "t": 133.45569, "r": 116.14391, "b": 136.6449, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 110.66107, "t": 139.16772000000003, "r": 116.14391, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "unit", "bbox": {"l": 110.66107, "t": 139.16772000000003, "r": 116.14391, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 81.688072, "t": 127.74370999999985, "r": 84.927567, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "2.", "bbox": {"l": 81.688072, "t": 127.74370999999985, "r": 84.927567, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 86.54731, "t": 127.74370999999985, "r": 93.026291, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "Item", "bbox": {"l": 86.54731, "t": 127.74370999999985, "r": 93.026291, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 81.688072, "t": 133.45569, "r": 84.927567, "b": 136.6449, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "3.", "bbox": {"l": 81.688072, "t": 133.45569, "r": 84.927567, "b": 136.6449, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 86.54731, "t": 133.45569, "r": 93.026291, "b": 136.6449, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "Item", "bbox": {"l": 86.54731, "t": 133.45569, "r": 93.026291, "b": 136.6449, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 81.688072, "t": 139.16772000000003, "r": 84.927567, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "4.", "bbox": {"l": 81.688072, "t": 139.16772000000003, "r": 84.927567, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 86.54731, "t": 139.16772000000003, "r": 93.026291, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "Item", "bbox": {"l": 86.54731, "t": 139.16772000000003, "r": 93.026291, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 88.084389, "t": 90.49738000000002, "r": 113.93649, "b": 96.23798, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "Extracted", "bbox": {"l": 88.084389, "t": 90.49738000000002, "r": 113.93649, "b": 96.23798, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 82.81002, "t": 97.63738999999998, "r": 119.21240000000002, "b": 103.37798999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "Table Images", "bbox": {"l": 82.81002, "t": 97.63738999999998, "r": 119.21240000000002, "b": 103.37798999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 143.94247, "t": 100.60235999999998, "r": 180.01131, "b": 106.34295999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "Standardized", "bbox": {"l": 143.94247, "t": 100.60235999999998, "r": 180.01131, "b": 106.34295999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 151.94064, "t": 107.74237000000005, "r": 172.0118, "b": 113.48297000000014, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "Images", "bbox": {"l": 151.94064, "t": 107.74237000000005, "r": 172.0118, "b": 113.48297000000014, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 251.76939000000002, "t": 80.93096999999989, "r": 266.39557, "b": 86.67156999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "BBox", "bbox": {"l": 251.76939000000002, "t": 80.93096999999989, "r": 266.39557, "b": 86.67156999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 247.51601, "t": 86.03101000000004, "r": 270.65021, "b": 91.77161000000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "Decoder", "bbox": {"l": 247.51601, "t": 86.03101000000004, "r": 270.65021, "b": 91.77161000000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 331.03699, "t": 78.55980999999997, "r": 352.12589, "b": 84.30042000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "BBoxes", "bbox": {"l": 331.03699, "t": 78.55980999999997, "r": 352.12589, "b": 84.30042000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 390.56421, "t": 96.03223000000003, "r": 431.7261, "b": 101.77282999999989, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "BBoxes can be", "bbox": {"l": 390.56421, "t": 96.03223000000003, "r": 431.7261, "b": 101.77282999999989, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 386.82422, "t": 102.15228000000013, "r": 435.46966999999995, "b": 107.89287999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "traced back to the", "bbox": {"l": 386.82422, "t": 102.15228000000013, "r": 435.46966999999995, "b": 107.89287999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 388.69589, "t": 108.27228000000002, "r": 433.6032400000001, "b": 114.01288000000011, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "original image to", "bbox": {"l": 388.69589, "t": 108.27228000000002, "r": 433.6032400000001, "b": 114.01288000000011, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 391.07761, "t": 114.39227000000005, "r": 431.22542999999996, "b": 120.13286999999991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "extract content", "bbox": {"l": 391.07761, "t": 114.39227000000005, "r": 431.22542999999996, "b": 120.13286999999991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 431.22650000000004, "t": 151.68511999999998, "r": 498.82068, "b": 157.42571999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "Structure Tags sequence", "bbox": {"l": 431.22650000000004, "t": 151.68511999999998, "r": 498.82068, "b": 157.42571999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 431.1738, "t": 157.80517999999995, "r": 498.87753000000004, "b": 163.54578000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "provide full description of", "bbox": {"l": 431.1738, "t": 157.80517999999995, "r": 498.87753000000004, "b": 163.54578000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 440.5289, "t": 163.92516999999998, "r": 489.51827999999995, "b": 169.66576999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "the table structure", "bbox": {"l": 440.5289, "t": 163.92516999999998, "r": 489.51827999999995, "b": 169.66576999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 328.37479, "t": 178.25385000000006, "r": 367.72333, "b": 183.99445000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "Structure Tags", "bbox": {"l": 328.37479, "t": 178.25385000000006, "r": 367.72333, "b": 183.99445000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 331.84451, "t": 123.90886999999998, "r": 373.67963, "b": 129.64948000000015, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "BBoxes in sync", "bbox": {"l": 331.84451, "t": 123.90886999999998, "r": 373.67963, "b": 129.64948000000015, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 331.84451, "t": 129.00885000000017, "r": 381.17786, "b": 134.74945000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "with tag sequence", "bbox": {"l": 331.84451, "t": 129.00885000000017, "r": 381.17786, "b": 134.74945000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 196.62633, "t": 88.11621000000002, "r": 219.42332, "b": 93.85681, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "Encoder", "bbox": {"l": 196.62633, "t": 88.11621000000002, "r": 219.42332, "b": 93.85681, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 246.66771, "t": 129.4946900000001, "r": 271.49899, "b": 135.23528999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "Structure", "bbox": {"l": 246.66771, "t": 129.4946900000001, "r": 271.49899, "b": 135.23528999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 247.51601, "t": 134.59473000000003, "r": 270.65021, "b": 140.33533, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "Decoder", "bbox": {"l": 247.51601, "t": 134.59473000000003, "r": 270.65021, "b": 140.33533, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 330.63071, "t": 89.01923, "r": 365.55347, "b": 94.75982999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "[x1, y2, x2, y2]", "bbox": {"l": 330.63071, "t": 89.01923, "r": 365.55347, "b": 94.75982999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 330.63071, "t": 97.17926, "r": 370.22717, "b": 102.91985999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "[x1', y2', x2', y2']", "bbox": {"l": 330.63071, "t": 97.17926, "r": 370.22717, "b": 102.91985999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 330.63071, "t": 105.33922999999993, "r": 374.51157, "b": 111.07983000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "[x1'', y2'', x2'', y2'']", "bbox": {"l": 330.63071, "t": 105.33922999999993, "r": 374.51157, "b": 111.07983000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 330.63071, "t": 113.49926999999991, "r": 335.73233, "b": 119.23987, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "...", "bbox": {"l": 330.63071, "t": 113.49926999999991, "r": 335.73233, "b": 119.23987, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 322.30579, "t": 141.79236000000003, "r": 335.05988, "b": 146.57617000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "<TR>", "bbox": {"l": 322.30579, "t": 141.79236000000003, "r": 335.05988, "b": 146.57617000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 322.30579, "t": 148.93231000000003, "r": 335.05988, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "<TD>", "bbox": {"l": 322.30579, "t": 148.93231000000003, "r": 335.05988, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 337.54971, "t": 148.55579, "r": 340.95242, "b": 154.29638999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "1", "bbox": {"l": 337.54971, "t": 148.55579, "r": 340.95242, "b": 154.29638999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 343.56262, "t": 148.93231000000003, "r": 398.91446, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "</TD><TD colspan=\"2\">", "bbox": {"l": 343.56262, "t": 148.93231000000003, "r": 398.91446, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 407.41718, "t": 148.93231000000003, "r": 421.58801, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "</TD>", "bbox": {"l": 407.41718, "t": 148.93231000000003, "r": 421.58801, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 322.30579, "t": 156.07232999999997, "r": 349.23022, "b": 160.85613999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "</TR><TR>", "bbox": {"l": 322.30579, "t": 156.07232999999997, "r": 349.23022, "b": 160.85613999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 322.30579, "t": 163.21234000000004, "r": 335.05988, "b": 167.99614999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "<TD>", "bbox": {"l": 322.30579, "t": 163.21234000000004, "r": 335.05988, "b": 167.99614999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 343.56155, "t": 163.21234000000004, "r": 374.73685, "b": 167.99614999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "</TD><TD>...", "bbox": {"l": 343.56155, "t": 163.21234000000004, "r": 374.73685, "b": 167.99614999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 322.30579, "t": 170.35235999999998, "r": 326.55716, "b": 175.13617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "...", "bbox": {"l": 322.30579, "t": 170.35235999999998, "r": 326.55716, "b": 175.13617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 323.51111, "t": 89.66967999999997, "r": 326.91382, "b": 95.41027999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "1", "bbox": {"l": 323.51111, "t": 89.66967999999997, "r": 326.91382, "b": 95.41027999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 323.71509, "t": 97.78887999999995, "r": 327.1178, "b": 103.52948000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "2", "bbox": {"l": 323.71509, "t": 97.78887999999995, "r": 327.1178, "b": 103.52948000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 323.71509, "t": 105.98969, "r": 327.1178, "b": 111.73029000000008, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "3", "bbox": {"l": 323.71509, "t": 105.98969, "r": 327.1178, "b": 111.73029000000008, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 401.4816, "t": 148.54625999999996, "r": 404.88431, "b": 154.28687000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "2", "bbox": {"l": 401.4816, "t": 148.54625999999996, "r": 404.88431, "b": 154.28687000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 337.6976, "t": 162.68451000000005, "r": 341.10031, "b": 168.42511000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "3", "bbox": {"l": 337.6976, "t": 162.68451000000005, "r": 341.10031, "b": 168.42511000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 454.46378, "t": 104.54584, "r": 457.86648999999994, "b": 110.28644000000008, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "3", "bbox": {"l": 454.46378, "t": 104.54584, "r": 457.86648999999994, "b": 110.28644000000008, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 493.32580999999993, "t": 91.09546, "r": 496.72852, "b": 96.83605999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "2", "bbox": {"l": 493.32580999999993, "t": 91.09546, "r": 496.72852, "b": 96.83605999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 454.08298, "t": 90.56879000000015, "r": 457.48569000000003, "b": 96.30939000000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "1", "bbox": {"l": 454.08298, "t": 90.56879000000015, "r": 457.48569000000003, "b": 96.30939000000001, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "caption", "id": 6, "page_no": 4, "cluster": {"id": 6, "label": "caption", "bbox": {"l": 50.111992, "t": 203.98577999999998, "r": 545.10846, "b": 224.96691999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9677653908729553, "cells": [{"id": 59, "text": "Figure 3:", "bbox": {"l": 50.112, "t": 204.10535000000004, "r": 86.883949, "b": 213.01189999999997, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "TableFormer", "bbox": {"l": 94.020996, "t": 203.98577999999998, "r": 149.85141, "b": 212.94214, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "takes in an image of the PDF and creates bounding box and HTML structure predictions that are", "bbox": {"l": 152.86099, "t": 204.10535000000004, "r": 545.10846, "b": 213.01189999999997, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "synchronized. The bounding boxes grabs the content from the PDF and inserts it in the structure.", "bbox": {"l": 50.111992, "t": 216.06035999999995, "r": 436.0134, "b": 224.96691999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 3: TableFormer takes in an image of the PDF and creates bounding box and HTML structure predictions that are synchronized. The bounding boxes grabs the content from the PDF and inserts it in the structure."}, {"label": "picture", "id": 5, "page_no": 4, "cluster": {"id": 5, "label": "picture", "bbox": {"l": 53.03325653076172, "t": 257.66534423828125, "r": 285.3731689453125, "b": 507.6688537597656, "coord_origin": "TOPLEFT"}, "confidence": 0.9724941253662109, "cells": [{"id": 63, "text": "Input Image", "bbox": {"l": 74.253464, "t": 258.21472000000006, "r": 101.75846, "b": 264.17474000000004, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "Tokenised Tags", "bbox": {"l": 122.29972, "t": 258.34520999999995, "r": 157.83972, "b": 264.30524, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "Multi-Head Attention", "bbox": {"l": 78.549347, "t": 371.38579999999996, "r": 125.68359000000001, "b": 377.04782, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "Add", "bbox": {"l": 78.513298, "t": 391.31857, "r": 84.644547, "b": 396.98059, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "& Normalisation", "bbox": {"l": 116.52705, "t": 391.31857, "r": 125.11079999999998, "b": 396.98059, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "Feed Forward Network", "bbox": {"l": 76.024773, "t": 424.45309, "r": 127.92327000000002, "b": 430.11511, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "Add", "bbox": {"l": 78.382828, "t": 444.88956, "r": 84.514076, "b": 450.55157, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "& Normalisation", "bbox": {"l": 116.39658, "t": 444.88956, "r": 124.98033, "b": 450.55157, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Linear", "bbox": {"l": 167.46945, "t": 462.44324, "r": 181.6292, "b": 468.10526, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "Softmax", "bbox": {"l": 165.61292, "t": 478.47107, "r": 184.43242, "b": 484.13309, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "CNN BACKBONE ENCODER", "bbox": {"l": 65.319511, "t": 324.26235999999994, "r": 132.9245, "b": 330.22235000000006, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "[30, 1, 2, 3, 4, \u2026 3, ", "bbox": {"l": 119.51457, "t": 269.66394, "r": 162.98782, "b": 274.72992, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "4, 5, 8, 31]", "bbox": {"l": 128.72858, "t": 274.91394, "r": 151.41083, "b": 279.97992, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "Positional ", "bbox": {"l": 60.434211999999995, "t": 338.95993, "r": 80.27021, "b": 344.26993, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "Encoding", "bbox": {"l": 60.598457, "t": 343.38605, "r": 78.854958, "b": 348.69604, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "Positional ", "bbox": {"l": 134.82877, "t": 293.37762, "r": 154.66476, "b": 298.68762, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "Encoding", "bbox": {"l": 134.99303, "t": 297.80370999999997, "r": 153.24953, "b": 303.11371, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "Add & Normalisation", "bbox": {"l": 150.55193, "t": 345.35861, "r": 197.14943, "b": 351.02063, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Add", "bbox": {"l": 150.55193, "t": 394.4234, "r": 156.68318, "b": 400.08542, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "& Normalisation", "bbox": {"l": 188.56567, "t": 394.4234, "r": 197.14943, "b": 400.08542, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "Multi-Head Attention", "bbox": {"l": 150.18539, "t": 375.66843, "r": 197.31964, "b": 381.33044, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "Add", "bbox": {"l": 150.55193, "t": 440.24847000000005, "r": 156.68318, "b": 445.91049, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "& Normalisation", "bbox": {"l": 188.56567, "t": 440.24847000000005, "r": 197.14943, "b": 445.91049, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Feed Forward Network", "bbox": {"l": 147.86377, "t": 422.09335, "r": 199.76227, "b": 427.75537, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Linear", "bbox": {"l": 241.56567000000004, "t": 314.26285000000007, "r": 255.72542, "b": 319.92487, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "Linear", "bbox": {"l": 241.91730000000004, "t": 361.36493, "r": 256.07706, "b": 367.02695, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "Attention", "bbox": {"l": 228.054, "t": 336.61929000000003, "r": 248.72363000000004, "b": 342.28131, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "Network", "bbox": {"l": 246.2919, "t": 336.61929000000003, "r": 269.39325, "b": 342.28131, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "MLP", "bbox": {"l": 228.44568000000004, "t": 405.14682, "r": 238.73892, "b": 410.80884, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Linear ", "bbox": {"l": 256.29767, "t": 405.2032500000001, "r": 271.77792, "b": 410.86526, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "Sigmoid", "bbox": {"l": 239.54543, "t": 382.21344, "r": 258.08942, "b": 387.87546, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "Transformer Encoder Network", "bbox": {"l": 54.14704100000001, "t": 384.87183, "r": 59.51152, "b": 449.78326, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "x2", "bbox": {"l": 54.235424, "t": 373.81232, "r": 59.30449699999999, "b": 378.45421999999996, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "Encoded Output", "bbox": {"l": 85.295891, "t": 484.53189, "r": 122.16431, "b": 490.36688, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "Encoded Output", "bbox": {"l": 229.66599, "t": 279.54607999999996, "r": 265.3194, "b": 285.45572000000004, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "Predicted Tags", "bbox": {"l": 157.17369, "t": 500.3031, "r": 190.41711, "b": 506.12943, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "Bounding Boxes & ", "bbox": {"l": 227.81598999999997, "t": 438.05542, "r": 270.78442, "b": 443.89206, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "Classification", "bbox": {"l": 233.70262, "t": 444.06183, "r": 263.51105, "b": 449.8904999999999, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "Transformer ", "bbox": {"l": 184.74655, "t": 293.39502, "r": 212.16055, "b": 298.75903, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "Decoder Network", "bbox": {"l": 178.91229, "t": 299.14502, "r": 216.74378999999996, "b": 304.50903, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "x4", "bbox": {"l": 194.24574, "t": 282.7822, "r": 198.89099, "b": 287.84817999999996, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "CELL BBOX DECODER", "bbox": {"l": 221.45587, "t": 271.86914, "r": 276.47089, "b": 277.82916, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "Masked Multi-Head ", "bbox": {"l": 151.65219, "t": 323.44241, "r": 197.29019, "b": 329.10443, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "Attention", "bbox": {"l": 163.43277, "t": 329.44241, "r": 184.19028, "b": 335.10443, "coord_origin": "TOPLEFT"}}], "children": [{"id": 69, "label": "text", "bbox": {"l": 74.253464, "t": 258.21472000000006, "r": 101.75846, "b": 264.17474000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "Input Image", "bbox": {"l": 74.253464, "t": 258.21472000000006, "r": 101.75846, "b": 264.17474000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 122.29972, "t": 258.34520999999995, "r": 157.83972, "b": 264.30524, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "Tokenised Tags", "bbox": {"l": 122.29972, "t": 258.34520999999995, "r": 157.83972, "b": 264.30524, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 78.549347, "t": 371.38579999999996, "r": 125.68359000000001, "b": 377.04782, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "Multi-Head Attention", "bbox": {"l": 78.549347, "t": 371.38579999999996, "r": 125.68359000000001, "b": 377.04782, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 78.513298, "t": 391.31857, "r": 84.644547, "b": 396.98059, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "Add", "bbox": {"l": 78.513298, "t": 391.31857, "r": 84.644547, "b": 396.98059, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 116.52705, "t": 391.31857, "r": 125.11079999999998, "b": 396.98059, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "& Normalisation", "bbox": {"l": 116.52705, "t": 391.31857, "r": 125.11079999999998, "b": 396.98059, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 76.024773, "t": 424.45309, "r": 127.92327000000002, "b": 430.11511, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "Feed Forward Network", "bbox": {"l": 76.024773, "t": 424.45309, "r": 127.92327000000002, "b": 430.11511, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 78.382828, "t": 444.88956, "r": 84.514076, "b": 450.55157, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "Add", "bbox": {"l": 78.382828, "t": 444.88956, "r": 84.514076, "b": 450.55157, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 116.39658, "t": 444.88956, "r": 124.98033, "b": 450.55157, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "& Normalisation", "bbox": {"l": 116.39658, "t": 444.88956, "r": 124.98033, "b": 450.55157, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 167.46945, "t": 462.44324, "r": 181.6292, "b": 468.10526, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "Linear", "bbox": {"l": 167.46945, "t": 462.44324, "r": 181.6292, "b": 468.10526, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 165.61292, "t": 478.47107, "r": 184.43242, "b": 484.13309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "Softmax", "bbox": {"l": 165.61292, "t": 478.47107, "r": 184.43242, "b": 484.13309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 65.319511, "t": 324.26235999999994, "r": 132.9245, "b": 330.22235000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "CNN BACKBONE ENCODER", "bbox": {"l": 65.319511, "t": 324.26235999999994, "r": 132.9245, "b": 330.22235000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 119.51457, "t": 269.66394, "r": 162.98782, "b": 274.72992, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "[30, 1, 2, 3, 4, \u2026 3, ", "bbox": {"l": 119.51457, "t": 269.66394, "r": 162.98782, "b": 274.72992, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 128.72858, "t": 274.91394, "r": 151.41083, "b": 279.97992, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "4, 5, 8, 31]", "bbox": {"l": 128.72858, "t": 274.91394, "r": 151.41083, "b": 279.97992, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 60.434211999999995, "t": 338.95993, "r": 80.27021, "b": 344.26993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "Positional ", "bbox": {"l": 60.434211999999995, "t": 338.95993, "r": 80.27021, "b": 344.26993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 60.598457, "t": 343.38605, "r": 78.854958, "b": 348.69604, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "Encoding", "bbox": {"l": 60.598457, "t": 343.38605, "r": 78.854958, "b": 348.69604, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 134.82877, "t": 293.37762, "r": 154.66476, "b": 298.68762, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "Positional ", "bbox": {"l": 134.82877, "t": 293.37762, "r": 154.66476, "b": 298.68762, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 134.99303, "t": 297.80370999999997, "r": 153.24953, "b": 303.11371, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "Encoding", "bbox": {"l": 134.99303, "t": 297.80370999999997, "r": 153.24953, "b": 303.11371, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 150.55193, "t": 345.35861, "r": 197.14943, "b": 351.02063, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "Add & Normalisation", "bbox": {"l": 150.55193, "t": 345.35861, "r": 197.14943, "b": 351.02063, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 150.55193, "t": 394.4234, "r": 156.68318, "b": 400.08542, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "Add", "bbox": {"l": 150.55193, "t": 394.4234, "r": 156.68318, "b": 400.08542, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 188.56567, "t": 394.4234, "r": 197.14943, "b": 400.08542, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "& Normalisation", "bbox": {"l": 188.56567, "t": 394.4234, "r": 197.14943, "b": 400.08542, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 150.18539, "t": 375.66843, "r": 197.31964, "b": 381.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "Multi-Head Attention", "bbox": {"l": 150.18539, "t": 375.66843, "r": 197.31964, "b": 381.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 150.55193, "t": 440.24847000000005, "r": 156.68318, "b": 445.91049, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "Add", "bbox": {"l": 150.55193, "t": 440.24847000000005, "r": 156.68318, "b": 445.91049, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 188.56567, "t": 440.24847000000005, "r": 197.14943, "b": 445.91049, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "& Normalisation", "bbox": {"l": 188.56567, "t": 440.24847000000005, "r": 197.14943, "b": 445.91049, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 147.86377, "t": 422.09335, "r": 199.76227, "b": 427.75537, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "Feed Forward Network", "bbox": {"l": 147.86377, "t": 422.09335, "r": 199.76227, "b": 427.75537, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 241.56567000000004, "t": 314.26285000000007, "r": 255.72542, "b": 319.92487, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "Linear", "bbox": {"l": 241.56567000000004, "t": 314.26285000000007, "r": 255.72542, "b": 319.92487, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 241.91730000000004, "t": 361.36493, "r": 256.07706, "b": 367.02695, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "Linear", "bbox": {"l": 241.91730000000004, "t": 361.36493, "r": 256.07706, "b": 367.02695, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 228.054, "t": 336.61929000000003, "r": 248.72363000000004, "b": 342.28131, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "Attention", "bbox": {"l": 228.054, "t": 336.61929000000003, "r": 248.72363000000004, "b": 342.28131, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 246.2919, "t": 336.61929000000003, "r": 269.39325, "b": 342.28131, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "Network", "bbox": {"l": 246.2919, "t": 336.61929000000003, "r": 269.39325, "b": 342.28131, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 228.44568000000004, "t": 405.14682, "r": 238.73892, "b": 410.80884, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "MLP", "bbox": {"l": 228.44568000000004, "t": 405.14682, "r": 238.73892, "b": 410.80884, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 256.29767, "t": 405.2032500000001, "r": 271.77792, "b": 410.86526, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "Linear ", "bbox": {"l": 256.29767, "t": 405.2032500000001, "r": 271.77792, "b": 410.86526, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 239.54543, "t": 382.21344, "r": 258.08942, "b": 387.87546, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "Sigmoid", "bbox": {"l": 239.54543, "t": 382.21344, "r": 258.08942, "b": 387.87546, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 54.14704100000001, "t": 384.87183, "r": 59.51152, "b": 449.78326, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "Transformer Encoder Network", "bbox": {"l": 54.14704100000001, "t": 384.87183, "r": 59.51152, "b": 449.78326, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 54.235424, "t": 373.81232, "r": 59.30449699999999, "b": 378.45421999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "x2", "bbox": {"l": 54.235424, "t": 373.81232, "r": 59.30449699999999, "b": 378.45421999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 85.295891, "t": 484.53189, "r": 122.16431, "b": 490.36688, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "Encoded Output", "bbox": {"l": 85.295891, "t": 484.53189, "r": 122.16431, "b": 490.36688, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 229.66599, "t": 279.54607999999996, "r": 265.3194, "b": 285.45572000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "Encoded Output", "bbox": {"l": 229.66599, "t": 279.54607999999996, "r": 265.3194, "b": 285.45572000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 157.17369, "t": 500.3031, "r": 190.41711, "b": 506.12943, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "Predicted Tags", "bbox": {"l": 157.17369, "t": 500.3031, "r": 190.41711, "b": 506.12943, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 227.81598999999997, "t": 438.05542, "r": 270.78442, "b": 443.89206, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "Bounding Boxes & ", "bbox": {"l": 227.81598999999997, "t": 438.05542, "r": 270.78442, "b": 443.89206, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 233.70262, "t": 444.06183, "r": 263.51105, "b": 449.8904999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "Classification", "bbox": {"l": 233.70262, "t": 444.06183, "r": 263.51105, "b": 449.8904999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 184.74655, "t": 293.39502, "r": 212.16055, "b": 298.75903, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "Transformer ", "bbox": {"l": 184.74655, "t": 293.39502, "r": 212.16055, "b": 298.75903, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 178.91229, "t": 299.14502, "r": 216.74378999999996, "b": 304.50903, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "Decoder Network", "bbox": {"l": 178.91229, "t": 299.14502, "r": 216.74378999999996, "b": 304.50903, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 194.24574, "t": 282.7822, "r": 198.89099, "b": 287.84817999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": "x4", "bbox": {"l": 194.24574, "t": 282.7822, "r": 198.89099, "b": 287.84817999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 221.45587, "t": 271.86914, "r": 276.47089, "b": 277.82916, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "CELL BBOX DECODER", "bbox": {"l": 221.45587, "t": 271.86914, "r": 276.47089, "b": 277.82916, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 151.65219, "t": 323.44241, "r": 197.29019, "b": 329.10443, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "Masked Multi-Head ", "bbox": {"l": 151.65219, "t": 323.44241, "r": 197.29019, "b": 329.10443, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 163.43277, "t": 329.44241, "r": 184.19028, "b": 335.10443, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": "Attention", "bbox": {"l": 163.43277, "t": 329.44241, "r": 184.19028, "b": 335.10443, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "caption", "id": 8, "page_no": 4, "cluster": {"id": 8, "label": "caption", "bbox": {"l": 50.112, "t": 527.7828099999999, "r": 286.36597, "b": 680.27094, "coord_origin": "TOPLEFT"}, "confidence": 0.8913412094116211, "cells": [{"id": 107, "text": "Figure 4: Given an input image of a table, the", "bbox": {"l": 50.112, "t": 527.90237, "r": 229.78752, "b": 536.80893, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "Encoder", "bbox": {"l": 231.787, "t": 527.7828099999999, "r": 267.76196, "b": 536.7392, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "pro-", "bbox": {"l": 269.76401, "t": 527.90237, "r": 286.36169, "b": 536.80893, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "duces fixed-length features that represent the input image.", "bbox": {"l": 50.112015, "t": 539.85738, "r": 286.36508, "b": 548.76393, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "The features are then passed to both the", "bbox": {"l": 50.112015, "t": 551.81337, "r": 205.84735, "b": 560.71992, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "Structure Decoder", "bbox": {"l": 208.01802, "t": 551.69382, "r": 286.36392, "b": 560.6501900000001, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "and", "bbox": {"l": 50.112015, "t": 563.76837, "r": 64.498009, "b": 572.67493, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "Cell BBox Decoder", "bbox": {"l": 68.165016, "t": 563.64882, "r": 151.31288, "b": 572.60519, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": ".", "bbox": {"l": 151.31302, "t": 563.76837, "r": 153.80367, "b": 572.67493, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "During training, the", "bbox": {"l": 160.41884, "t": 563.76837, "r": 241.93283000000002, "b": 572.67493, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "Structure", "bbox": {"l": 245.59502, "t": 563.64882, "r": 286.362, "b": 572.60519, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "Decoder", "bbox": {"l": 50.112015, "t": 575.60382, "r": 85.519089, "b": 584.5602, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "receives \u2018tokenized tags\u2019 of the HTML code that", "bbox": {"l": 88.623016, "t": 575.7233699999999, "r": 286.36072, "b": 584.6299300000001, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "represent the table structure. Afterwards, a transformer en-", "bbox": {"l": 50.112015, "t": 587.6783800000001, "r": 286.36511, "b": 596.58493, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "coder and decoder architecture is employed to produce fea-", "bbox": {"l": 50.112015, "t": 599.63338, "r": 286.36508, "b": 608.53993, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "tures that are received by a linear layer, and the", "bbox": {"l": 50.112015, "t": 611.58838, "r": 240.43756000000002, "b": 620.4949300000001, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "Cell BBox", "bbox": {"l": 243.19801, "t": 611.46883, "r": 286.36597, "b": 620.4252, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "Decoder. The linear layer is applied to the features to", "bbox": {"l": 50.112015, "t": 623.42482, "r": 286.36511, "b": 632.3812, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "predict the tags. Simultaneously, the Cell BBox Decoder", "bbox": {"l": 50.112015, "t": 635.37982, "r": 286.36508, "b": 644.3362, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "selects features referring to the data cells (\u2018", "bbox": {"l": 50.112015, "t": 647.45438, "r": 220.58205, "b": 656.36093, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "<", "bbox": {"l": 220.57802000000004, "t": 647.29497, "r": 228.32693, "b": 656.14175, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "td", "bbox": {"l": 228.32700999999997, "t": 647.45438, "r": 236.07791000000003, "b": 656.36093, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": ">", "bbox": {"l": 236.07802000000004, "t": 647.29497, "r": 243.82693, "b": 656.14175, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "\u2019, \u2018", "bbox": {"l": 243.82602, "t": 647.45438, "r": 255.29298000000003, "b": 656.36093, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "<", "bbox": {"l": 255.29102000000003, "t": 647.29497, "r": 263.03992, "b": 656.14175, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "\u2019) and", "bbox": {"l": 263.04001, "t": 647.45438, "r": 286.36246, "b": 656.36093, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "passes them through an attention network, an MLP, and a", "bbox": {"l": 50.112015, "t": 659.40938, "r": 286.36511, "b": 668.31594, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "linear layer to predict the bounding boxes.", "bbox": {"l": 50.112015, "t": 671.36438, "r": 218.46996, "b": 680.27094, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 4: Given an input image of a table, the Encoder produces fixed-length features that represent the input image. The features are then passed to both the Structure Decoder and Cell BBox Decoder . During training, the Structure Decoder receives \u2018tokenized tags\u2019 of the HTML code that represent the table structure. Afterwards, a transformer encoder and decoder architecture is employed to produce features that are received by a linear layer, and the Cell BBox Decoder. The linear layer is applied to the features to predict the tags. Simultaneously, the Cell BBox Decoder selects features referring to the data cells (\u2018 < td > \u2019, \u2018 < \u2019) and passes them through an attention network, an MLP, and a linear layer to predict the bounding boxes."}, {"label": "text", "id": 4, "page_no": 4, "cluster": {"id": 4, "label": "text", "bbox": {"l": 308.862, "t": 249.53441999999995, "r": 545.11505, "b": 294.3069499999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9831458330154419, "cells": [{"id": 135, "text": "forming classification, and adding an adaptive pooling", "bbox": {"l": 308.862, "t": 249.53441999999995, "r": 523.05786, "b": 258.44097999999997, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "layer", "bbox": {"l": 525.19983, "t": 249.53441999999995, "r": 545.11505, "b": 258.44097999999997, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "of size 28*28. ResNet by default downsamples the", "bbox": {"l": 308.862, "t": 261.49042, "r": 517.55847, "b": 270.39697, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "image", "bbox": {"l": 520.76642, "t": 261.49042, "r": 545.11499, "b": 270.39697, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "resolution by 32 and then the encoded image is provided", "bbox": {"l": 308.862, "t": 273.44537, "r": 534.80377, "b": 282.35196, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "to", "bbox": {"l": 537.36414, "t": 273.44537, "r": 545.11505, "b": 282.35196, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "both the", "bbox": {"l": 308.862, "t": 285.40039, "r": 341.24045, "b": 294.3069499999999, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "Structure Decoder", "bbox": {"l": 343.73099, "t": 285.49005, "r": 417.23508, "b": 294.07782000000003, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": ", and", "bbox": {"l": 417.23398, "t": 285.40039, "r": 436.60129, "b": 294.3069499999999, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "Cell BBox Decoder", "bbox": {"l": 439.09198, "t": 285.49005, "r": 516.56116, "b": 294.07782000000003, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": ".", "bbox": {"l": 516.56097, "t": 285.40039, "r": 519.05164, "b": 294.3069499999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "forming classification, and adding an adaptive pooling layer of size 28*28. ResNet by default downsamples the image resolution by 32 and then the encoded image is provided to both the Structure Decoder , and Cell BBox Decoder ."}, {"label": "text", "id": 1, "page_no": 4, "cluster": {"id": 1, "label": "text", "bbox": {"l": 308.86194, "t": 297.33981, "r": 545.11511, "b": 413.96182, "coord_origin": "TOPLEFT"}, "confidence": 0.9862009882926941, "cells": [{"id": 146, "text": "Structure Decoder.", "bbox": {"l": 320.81696, "t": 297.33981, "r": 400.86649, "b": 306.2962, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "The transformer architecture of", "bbox": {"l": 403.91394, "t": 297.45938, "r": 528.33685, "b": 306.36594, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "this", "bbox": {"l": 530.7179, "t": 297.45938, "r": 545.11383, "b": 306.36594, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "component is based on the work proposed in [31].", "bbox": {"l": 308.86194, "t": 309.41437, "r": 517.5285, "b": 318.32092, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "After", "bbox": {"l": 524.09387, "t": 309.41437, "r": 545.11493, "b": 318.32092, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "extensive experimentation, the", "bbox": {"l": 308.86194, "t": 321.36934999999994, "r": 432.35833999999994, "b": 330.27591, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "Structure Decoder", "bbox": {"l": 435.81995000000006, "t": 321.45901, "r": 510.29041, "b": 330.04678, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "is", "bbox": {"l": 513.97797, "t": 321.36934999999994, "r": 520.62305, "b": 330.27591, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "mod-", "bbox": {"l": 524.08008, "t": 321.36934999999994, "r": 545.11115, "b": 330.27591, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "eled as a transformer encoder with two encoder layers", "bbox": {"l": 308.86197, "t": 333.32434, "r": 527.76013, "b": 342.2309, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "and", "bbox": {"l": 530.729, "t": 333.32434, "r": 545.11499, "b": 342.2309, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "a transformer decoder made from a stack of 4 decoder", "bbox": {"l": 308.86197, "t": 345.27933, "r": 526.85352, "b": 354.18588, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "lay-", "bbox": {"l": 529.62311, "t": 345.27933, "r": 545.11493, "b": 354.18588, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "ers that comprise mainly of multi-head attention and", "bbox": {"l": 308.86197, "t": 357.23532, "r": 524.51245, "b": 366.14188, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "feed", "bbox": {"l": 527.96948, "t": 357.23532, "r": 545.11511, "b": 366.14188, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "forward layers.", "bbox": {"l": 308.86197, "t": 369.19031000000007, "r": 370.39096, "b": 378.09685999999994, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "This configuration uses fewer layers", "bbox": {"l": 377.44449, "t": 369.19031000000007, "r": 526.91339, "b": 378.09685999999994, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "and", "bbox": {"l": 530.72906, "t": 369.19031000000007, "r": 545.11505, "b": 378.09685999999994, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "heads in comparison to networks applied to other", "bbox": {"l": 308.86197, "t": 381.14529000000005, "r": 505.46395999999993, "b": 390.05185, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "problems", "bbox": {"l": 508.03430000000003, "t": 381.14529000000005, "r": 545.11511, "b": 390.05185, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "(e.g. \u201cScene Understanding\u201d, \u201cImage Captioning\u201d),", "bbox": {"l": 308.86197, "t": 393.10028, "r": 517.68799, "b": 402.00684, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "some-", "bbox": {"l": 520.76642, "t": 393.10028, "r": 545.11499, "b": 402.00684, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "thing which we relate to the simplicity of table images.", "bbox": {"l": 308.86197, "t": 405.05526999999995, "r": 528.01935, "b": 413.96182, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Structure Decoder. The transformer architecture of this component is based on the work proposed in [31]. After extensive experimentation, the Structure Decoder is modeled as a transformer encoder with two encoder layers and a transformer decoder made from a stack of 4 decoder layers that comprise mainly of multi-head attention and feed forward layers. This configuration uses fewer layers and heads in comparison to networks applied to other problems (e.g. \u201cScene Understanding\u201d, \u201cImage Captioning\u201d), something which we relate to the simplicity of table images."}, {"label": "text", "id": 3, "page_no": 4, "cluster": {"id": 3, "label": "text", "bbox": {"l": 308.86197, "t": 417.11426, "r": 545.11511, "b": 545.57271, "coord_origin": "TOPLEFT"}, "confidence": 0.9851908087730408, "cells": [{"id": 169, "text": "The transformer encoder receives an encoded", "bbox": {"l": 320.81696, "t": 417.11426, "r": 515.49609, "b": 426.02081, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "image", "bbox": {"l": 520.7663, "t": 417.11426, "r": 545.11487, "b": 426.02081, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "from the", "bbox": {"l": 308.86197, "t": 429.0692399999999, "r": 343.72107, "b": 437.9758, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "CNN Backbone Network", "bbox": {"l": 347.03796, "t": 429.15891, "r": 446.45471000000003, "b": 437.74667, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "and refines it", "bbox": {"l": 449.93996999999996, "t": 429.0692399999999, "r": 503.06055000000003, "b": 437.9758, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "through", "bbox": {"l": 506.37808, "t": 429.0692399999999, "r": 537.3717, "b": 437.9758, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "a", "bbox": {"l": 540.68927, "t": 429.0692399999999, "r": 545.11267, "b": 437.9758, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "multi-head dot-product attention layer, followed by a", "bbox": {"l": 308.86197, "t": 441.02423, "r": 522.78894, "b": 449.93079, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "Feed", "bbox": {"l": 525.7478, "t": 441.02423, "r": 545.11511, "b": 449.93079, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "Forward Network.", "bbox": {"l": 308.86197, "t": 452.97922, "r": 384.14929, "b": 461.88577, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "During training, the transformer", "bbox": {"l": 393.37466, "t": 452.97922, "r": 527.84985, "b": 461.88577, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "de-", "bbox": {"l": 532.39282, "t": 452.97922, "r": 545.11505, "b": 461.88577, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "coder receives as input the output feature produced by", "bbox": {"l": 308.86197, "t": 464.93521, "r": 529.7627, "b": 473.84177, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "the", "bbox": {"l": 532.94073, "t": 464.93521, "r": 545.11505, "b": 473.84177, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "transformer encoder, and the tokenized input of the", "bbox": {"l": 308.86197, "t": 476.8902, "r": 514.17126, "b": 485.79675, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "HTML", "bbox": {"l": 516.89105, "t": 476.8902, "r": 545.11511, "b": 485.79675, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": "ground-truth tags. Using a stack of multi-head attention", "bbox": {"l": 308.86197, "t": 488.84518, "r": 527.63068, "b": 497.75174, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "lay-", "bbox": {"l": 529.62317, "t": 488.84518, "r": 545.11499, "b": 497.75174, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "ers, different aspects of the tag sequence could be", "bbox": {"l": 308.86197, "t": 500.80017, "r": 508.3630999999999, "b": 509.70673, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": "inferred.", "bbox": {"l": 511.09286000000003, "t": 500.80017, "r": 545.11511, "b": 509.70673, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "This is achieved by each attention head on a layer operating", "bbox": {"l": 308.86197, "t": 512.7551599999999, "r": 545.11499, "b": 521.6617100000001, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "in a different subspace, and then combining altogether their", "bbox": {"l": 308.86197, "t": 524.71115, "r": 545.11511, "b": 533.61771, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "attention score.", "bbox": {"l": 308.86197, "t": 536.66615, "r": 369.73349, "b": 545.57271, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The transformer encoder receives an encoded image from the CNN Backbone Network and refines it through a multi-head dot-product attention layer, followed by a Feed Forward Network. During training, the transformer decoder receives as input the output feature produced by the transformer encoder, and the tokenized input of the HTML ground-truth tags. Using a stack of multi-head attention layers, different aspects of the tag sequence could be inferred. This is achieved by each attention head on a layer operating in a different subspace, and then combining altogether their attention score."}, {"label": "text", "id": 0, "page_no": 4, "cluster": {"id": 0, "label": "text", "bbox": {"l": 308.86194, "t": 548.6046, "r": 545.11511, "b": 653.27271, "coord_origin": "TOPLEFT"}, "confidence": 0.9869197010993958, "cells": [{"id": 192, "text": "Cell BBox Decoder.", "bbox": {"l": 320.81696, "t": 548.6046, "r": 404.76184, "b": 557.56097, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "Our architecture allows to simul-", "bbox": {"l": 410.34094, "t": 548.72415, "r": 545.11505, "b": 557.63071, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "taneously predict HTML tags and bounding boxes for each", "bbox": {"l": 308.86194, "t": 560.68015, "r": 545.11493, "b": 569.5867000000001, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "table cell without the need of a separate object detector end", "bbox": {"l": 308.86194, "t": 572.6351500000001, "r": 545.11511, "b": 581.5417, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "to end. This approach is inspired by DETR [1] which em-", "bbox": {"l": 308.86194, "t": 584.59015, "r": 545.11493, "b": 593.4967, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "ploys a Transformer Encoder, and Decoder that looks for", "bbox": {"l": 308.86194, "t": 596.54515, "r": 545.11499, "b": 605.45171, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "a specific number of object queries (potential object detec-", "bbox": {"l": 308.86194, "t": 608.50015, "r": 545.11505, "b": 617.40671, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "tions). As our model utilizes a transformer architecture, the", "bbox": {"l": 308.86194, "t": 620.45515, "r": 545.11505, "b": 629.36171, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "hidden state of the", "bbox": {"l": 308.86194, "t": 632.41115, "r": 381.67859, "b": 641.3177000000001, "coord_origin": "TOPLEFT"}}, {"id": 201, "text": "<", "bbox": {"l": 383.99695, "t": 632.25174, "r": 391.74585, "b": 641.09853, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": "td", "bbox": {"l": 391.74594, "t": 632.41115, "r": 399.49686, "b": 641.3177000000001, "coord_origin": "TOPLEFT"}}, {"id": 203, "text": ">", "bbox": {"l": 399.49695, "t": 632.25174, "r": 407.24585, "b": 641.09853, "coord_origin": "TOPLEFT"}}, {"id": 204, "text": "\u2019 and \u2018", "bbox": {"l": 407.24594, "t": 632.41115, "r": 432.90958, "b": 641.3177000000001, "coord_origin": "TOPLEFT"}}, {"id": 205, "text": "<", "bbox": {"l": 432.90792999999996, "t": 632.25174, "r": 440.65683000000007, "b": 641.09853, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": "\u2019 HTML structure tags be-", "bbox": {"l": 440.65691999999996, "t": 632.41115, "r": 545.11475, "b": 641.3177000000001, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": "come the object query.", "bbox": {"l": 308.86194, "t": 644.3661500000001, "r": 398.96371, "b": 653.27271, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Cell BBox Decoder. Our architecture allows to simultaneously predict HTML tags and bounding boxes for each table cell without the need of a separate object detector end to end. This approach is inspired by DETR [1] which employs a Transformer Encoder, and Decoder that looks for a specific number of object queries (potential object detections). As our model utilizes a transformer architecture, the hidden state of the < td > \u2019 and \u2018 < \u2019 HTML structure tags become the object query."}, {"label": "text", "id": 2, "page_no": 4, "cluster": {"id": 2, "label": "text", "bbox": {"l": 308.86194, "t": 656.42516, "r": 545.11505, "b": 713.151726, "coord_origin": "TOPLEFT"}, "confidence": 0.9852352142333984, "cells": [{"id": 208, "text": "The encoding generated by the", "bbox": {"l": 320.81693, "t": 656.42516, "r": 444.34316999999993, "b": 665.33172, "coord_origin": "TOPLEFT"}}, {"id": 209, "text": "CNN Backbone Network", "bbox": {"l": 447.00591999999995, "t": 656.51482, "r": 545.1076, "b": 665.10258, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": "along with the features acquired for every data cell from the", "bbox": {"l": 308.86194, "t": 668.38016, "r": 545.11505, "b": 677.2867200000001, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "Transformer Decoder are then passed to the attention net-", "bbox": {"l": 308.86194, "t": 680.33516, "r": 545.11505, "b": 689.24172, "coord_origin": "TOPLEFT"}}, {"id": 212, "text": "work. The attention network takes both inputs and learns to", "bbox": {"l": 308.86194, "t": 692.290161, "r": 545.11505, "b": 701.196724, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "provide an attention weighted encoding. This weighted at-", "bbox": {"l": 308.86194, "t": 704.245163, "r": 545.11505, "b": 713.151726, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The encoding generated by the CNN Backbone Network along with the features acquired for every data cell from the Transformer Decoder are then passed to the attention network. The attention network takes both inputs and learns to provide an attention weighted encoding. This weighted at-"}, {"label": "page_footer", "id": 9, "page_no": 4, "cluster": {"id": 9, "label": "page_footer", "bbox": {"l": 295.12094, "t": 734.13316, "r": 300.10223, "b": 743.039722, "coord_origin": "TOPLEFT"}, "confidence": 0.8719562292098999, "cells": [{"id": 214, "text": "5", "bbox": {"l": 295.12094, "t": 734.13316, "r": 300.10223, "b": 743.039722, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5"}], "body": [{"label": "picture", "id": 7, "page_no": 4, "cluster": {"id": 7, "label": "picture", "bbox": {"l": 74.30525970458984, "t": 77.9112319946289, "r": 519.9801025390625, "b": 183.70150756835938, "coord_origin": "TOPLEFT"}, "confidence": 0.9296805262565613, "cells": [{"id": 0, "text": "1.", "bbox": {"l": 81.688072, "t": 122.43970000000002, "r": 84.927567, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Item", "bbox": {"l": 86.54731, "t": 122.43970000000002, "r": 93.026291, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Amount", "bbox": {"l": 102.50498, "t": 115.25214000000005, "r": 115.3461, "b": 118.44135000000006, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Names", "bbox": {"l": 82.140205, "t": 115.21489999999994, "r": 93.291527, "b": 118.40410999999995, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "1000", "bbox": {"l": 96.748268, "t": 122.43970000000002, "r": 104.3119, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "500", "bbox": {"l": 96.748268, "t": 127.74370999999985, "r": 102.42083, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "3500", "bbox": {"l": 96.748268, "t": 133.45569, "r": 104.3119, "b": 136.6449, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "150", "bbox": {"l": 96.748268, "t": 139.16772000000003, "r": 102.42083, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "unit", "bbox": {"l": 110.66107, "t": 122.43970000000002, "r": 116.14391, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "unit", "bbox": {"l": 110.66107, "t": 127.74370999999985, "r": 116.14391, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "unit", "bbox": {"l": 110.66107, "t": 133.45569, "r": 116.14391, "b": 136.6449, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "unit", "bbox": {"l": 110.66107, "t": 139.16772000000003, "r": 116.14391, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "2.", "bbox": {"l": 81.688072, "t": 127.74370999999985, "r": 84.927567, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Item", "bbox": {"l": 86.54731, "t": 127.74370999999985, "r": 93.026291, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "3.", "bbox": {"l": 81.688072, "t": 133.45569, "r": 84.927567, "b": 136.6449, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Item", "bbox": {"l": 86.54731, "t": 133.45569, "r": 93.026291, "b": 136.6449, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "4.", "bbox": {"l": 81.688072, "t": 139.16772000000003, "r": 84.927567, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "Item", "bbox": {"l": 86.54731, "t": 139.16772000000003, "r": 93.026291, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Extracted", "bbox": {"l": 88.084389, "t": 90.49738000000002, "r": 113.93649, "b": 96.23798, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Table Images", "bbox": {"l": 82.81002, "t": 97.63738999999998, "r": 119.21240000000002, "b": 103.37798999999995, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Standardized", "bbox": {"l": 143.94247, "t": 100.60235999999998, "r": 180.01131, "b": 106.34295999999995, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Images", "bbox": {"l": 151.94064, "t": 107.74237000000005, "r": 172.0118, "b": 113.48297000000014, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "BBox", "bbox": {"l": 251.76939000000002, "t": 80.93096999999989, "r": 266.39557, "b": 86.67156999999997, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Decoder", "bbox": {"l": 247.51601, "t": 86.03101000000004, "r": 270.65021, "b": 91.77161000000001, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "BBoxes", "bbox": {"l": 331.03699, "t": 78.55980999999997, "r": 352.12589, "b": 84.30042000000003, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "BBoxes can be", "bbox": {"l": 390.56421, "t": 96.03223000000003, "r": 431.7261, "b": 101.77282999999989, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "traced back to the", "bbox": {"l": 386.82422, "t": 102.15228000000013, "r": 435.46966999999995, "b": 107.89287999999999, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "original image to", "bbox": {"l": 388.69589, "t": 108.27228000000002, "r": 433.6032400000001, "b": 114.01288000000011, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "extract content", "bbox": {"l": 391.07761, "t": 114.39227000000005, "r": 431.22542999999996, "b": 120.13286999999991, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Structure Tags sequence", "bbox": {"l": 431.22650000000004, "t": 151.68511999999998, "r": 498.82068, "b": 157.42571999999996, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "provide full description of", "bbox": {"l": 431.1738, "t": 157.80517999999995, "r": 498.87753000000004, "b": 163.54578000000004, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "the table structure", "bbox": {"l": 440.5289, "t": 163.92516999999998, "r": 489.51827999999995, "b": 169.66576999999995, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Structure Tags", "bbox": {"l": 328.37479, "t": 178.25385000000006, "r": 367.72333, "b": 183.99445000000003, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "BBoxes in sync", "bbox": {"l": 331.84451, "t": 123.90886999999998, "r": 373.67963, "b": 129.64948000000015, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "with tag sequence", "bbox": {"l": 331.84451, "t": 129.00885000000017, "r": 381.17786, "b": 134.74945000000002, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "Encoder", "bbox": {"l": 196.62633, "t": 88.11621000000002, "r": 219.42332, "b": 93.85681, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Structure", "bbox": {"l": 246.66771, "t": 129.4946900000001, "r": 271.49899, "b": 135.23528999999996, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "Decoder", "bbox": {"l": 247.51601, "t": 134.59473000000003, "r": 270.65021, "b": 140.33533, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "[x1, y2, x2, y2]", "bbox": {"l": 330.63071, "t": 89.01923, "r": 365.55347, "b": 94.75982999999997, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "[x1', y2', x2', y2']", "bbox": {"l": 330.63071, "t": 97.17926, "r": 370.22717, "b": 102.91985999999997, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "[x1'', y2'', x2'', y2'']", "bbox": {"l": 330.63071, "t": 105.33922999999993, "r": 374.51157, "b": 111.07983000000002, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "...", "bbox": {"l": 330.63071, "t": 113.49926999999991, "r": 335.73233, "b": 119.23987, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "<TR>", "bbox": {"l": 322.30579, "t": 141.79236000000003, "r": 335.05988, "b": 146.57617000000005, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "<TD>", "bbox": {"l": 322.30579, "t": 148.93231000000003, "r": 335.05988, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "1", "bbox": {"l": 337.54971, "t": 148.55579, "r": 340.95242, "b": 154.29638999999997, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "</TD><TD colspan=\"2\">", "bbox": {"l": 343.56262, "t": 148.93231000000003, "r": 398.91446, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "</TD>", "bbox": {"l": 407.41718, "t": 148.93231000000003, "r": 421.58801, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "</TR><TR>", "bbox": {"l": 322.30579, "t": 156.07232999999997, "r": 349.23022, "b": 160.85613999999998, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "<TD>", "bbox": {"l": 322.30579, "t": 163.21234000000004, "r": 335.05988, "b": 167.99614999999994, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "</TD><TD>...", "bbox": {"l": 343.56155, "t": 163.21234000000004, "r": 374.73685, "b": 167.99614999999994, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "...", "bbox": {"l": 322.30579, "t": 170.35235999999998, "r": 326.55716, "b": 175.13617, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "1", "bbox": {"l": 323.51111, "t": 89.66967999999997, "r": 326.91382, "b": 95.41027999999994, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "2", "bbox": {"l": 323.71509, "t": 97.78887999999995, "r": 327.1178, "b": 103.52948000000004, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "3", "bbox": {"l": 323.71509, "t": 105.98969, "r": 327.1178, "b": 111.73029000000008, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "2", "bbox": {"l": 401.4816, "t": 148.54625999999996, "r": 404.88431, "b": 154.28687000000002, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "3", "bbox": {"l": 337.6976, "t": 162.68451000000005, "r": 341.10031, "b": 168.42511000000002, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "3", "bbox": {"l": 454.46378, "t": 104.54584, "r": 457.86648999999994, "b": 110.28644000000008, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "2", "bbox": {"l": 493.32580999999993, "t": 91.09546, "r": 496.72852, "b": 96.83605999999997, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "1", "bbox": {"l": 454.08298, "t": 90.56879000000015, "r": 457.48569000000003, "b": 96.30939000000001, "coord_origin": "TOPLEFT"}}], "children": [{"id": 10, "label": "text", "bbox": {"l": 81.688072, "t": 122.43970000000002, "r": 84.927567, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 0, "text": "1.", "bbox": {"l": 81.688072, "t": 122.43970000000002, "r": 84.927567, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 86.54731, "t": 122.43970000000002, "r": 93.026291, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 1, "text": "Item", "bbox": {"l": 86.54731, "t": 122.43970000000002, "r": 93.026291, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 102.50498, "t": 115.25214000000005, "r": 115.3461, "b": 118.44135000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 2, "text": "Amount", "bbox": {"l": 102.50498, "t": 115.25214000000005, "r": 115.3461, "b": 118.44135000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 82.140205, "t": 115.21489999999994, "r": 93.291527, "b": 118.40410999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 3, "text": "Names", "bbox": {"l": 82.140205, "t": 115.21489999999994, "r": 93.291527, "b": 118.40410999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 96.748268, "t": 122.43970000000002, "r": 104.3119, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 4, "text": "1000", "bbox": {"l": 96.748268, "t": 122.43970000000002, "r": 104.3119, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 96.748268, "t": 127.74370999999985, "r": 102.42083, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 5, "text": "500", "bbox": {"l": 96.748268, "t": 127.74370999999985, "r": 102.42083, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 96.748268, "t": 133.45569, "r": 104.3119, "b": 136.6449, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": "3500", "bbox": {"l": 96.748268, "t": 133.45569, "r": 104.3119, "b": 136.6449, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 96.748268, "t": 139.16772000000003, "r": 102.42083, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "150", "bbox": {"l": 96.748268, "t": 139.16772000000003, "r": 102.42083, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 110.66107, "t": 122.43970000000002, "r": 116.14391, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "unit", "bbox": {"l": 110.66107, "t": 122.43970000000002, "r": 116.14391, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 110.66107, "t": 127.74370999999985, "r": 116.14391, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "unit", "bbox": {"l": 110.66107, "t": 127.74370999999985, "r": 116.14391, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 110.66107, "t": 133.45569, "r": 116.14391, "b": 136.6449, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "unit", "bbox": {"l": 110.66107, "t": 133.45569, "r": 116.14391, "b": 136.6449, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 110.66107, "t": 139.16772000000003, "r": 116.14391, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "unit", "bbox": {"l": 110.66107, "t": 139.16772000000003, "r": 116.14391, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 81.688072, "t": 127.74370999999985, "r": 84.927567, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "2.", "bbox": {"l": 81.688072, "t": 127.74370999999985, "r": 84.927567, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 86.54731, "t": 127.74370999999985, "r": 93.026291, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "Item", "bbox": {"l": 86.54731, "t": 127.74370999999985, "r": 93.026291, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 81.688072, "t": 133.45569, "r": 84.927567, "b": 136.6449, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "3.", "bbox": {"l": 81.688072, "t": 133.45569, "r": 84.927567, "b": 136.6449, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 86.54731, "t": 133.45569, "r": 93.026291, "b": 136.6449, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "Item", "bbox": {"l": 86.54731, "t": 133.45569, "r": 93.026291, "b": 136.6449, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 81.688072, "t": 139.16772000000003, "r": 84.927567, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "4.", "bbox": {"l": 81.688072, "t": 139.16772000000003, "r": 84.927567, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 86.54731, "t": 139.16772000000003, "r": 93.026291, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "Item", "bbox": {"l": 86.54731, "t": 139.16772000000003, "r": 93.026291, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 88.084389, "t": 90.49738000000002, "r": 113.93649, "b": 96.23798, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "Extracted", "bbox": {"l": 88.084389, "t": 90.49738000000002, "r": 113.93649, "b": 96.23798, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 82.81002, "t": 97.63738999999998, "r": 119.21240000000002, "b": 103.37798999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "Table Images", "bbox": {"l": 82.81002, "t": 97.63738999999998, "r": 119.21240000000002, "b": 103.37798999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 143.94247, "t": 100.60235999999998, "r": 180.01131, "b": 106.34295999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "Standardized", "bbox": {"l": 143.94247, "t": 100.60235999999998, "r": 180.01131, "b": 106.34295999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 151.94064, "t": 107.74237000000005, "r": 172.0118, "b": 113.48297000000014, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "Images", "bbox": {"l": 151.94064, "t": 107.74237000000005, "r": 172.0118, "b": 113.48297000000014, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 251.76939000000002, "t": 80.93096999999989, "r": 266.39557, "b": 86.67156999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "BBox", "bbox": {"l": 251.76939000000002, "t": 80.93096999999989, "r": 266.39557, "b": 86.67156999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 247.51601, "t": 86.03101000000004, "r": 270.65021, "b": 91.77161000000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "Decoder", "bbox": {"l": 247.51601, "t": 86.03101000000004, "r": 270.65021, "b": 91.77161000000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 331.03699, "t": 78.55980999999997, "r": 352.12589, "b": 84.30042000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "BBoxes", "bbox": {"l": 331.03699, "t": 78.55980999999997, "r": 352.12589, "b": 84.30042000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 390.56421, "t": 96.03223000000003, "r": 431.7261, "b": 101.77282999999989, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "BBoxes can be", "bbox": {"l": 390.56421, "t": 96.03223000000003, "r": 431.7261, "b": 101.77282999999989, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 386.82422, "t": 102.15228000000013, "r": 435.46966999999995, "b": 107.89287999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "traced back to the", "bbox": {"l": 386.82422, "t": 102.15228000000013, "r": 435.46966999999995, "b": 107.89287999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 388.69589, "t": 108.27228000000002, "r": 433.6032400000001, "b": 114.01288000000011, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "original image to", "bbox": {"l": 388.69589, "t": 108.27228000000002, "r": 433.6032400000001, "b": 114.01288000000011, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 391.07761, "t": 114.39227000000005, "r": 431.22542999999996, "b": 120.13286999999991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "extract content", "bbox": {"l": 391.07761, "t": 114.39227000000005, "r": 431.22542999999996, "b": 120.13286999999991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 431.22650000000004, "t": 151.68511999999998, "r": 498.82068, "b": 157.42571999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "Structure Tags sequence", "bbox": {"l": 431.22650000000004, "t": 151.68511999999998, "r": 498.82068, "b": 157.42571999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 431.1738, "t": 157.80517999999995, "r": 498.87753000000004, "b": 163.54578000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "provide full description of", "bbox": {"l": 431.1738, "t": 157.80517999999995, "r": 498.87753000000004, "b": 163.54578000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 440.5289, "t": 163.92516999999998, "r": 489.51827999999995, "b": 169.66576999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "the table structure", "bbox": {"l": 440.5289, "t": 163.92516999999998, "r": 489.51827999999995, "b": 169.66576999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 328.37479, "t": 178.25385000000006, "r": 367.72333, "b": 183.99445000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "Structure Tags", "bbox": {"l": 328.37479, "t": 178.25385000000006, "r": 367.72333, "b": 183.99445000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 331.84451, "t": 123.90886999999998, "r": 373.67963, "b": 129.64948000000015, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "BBoxes in sync", "bbox": {"l": 331.84451, "t": 123.90886999999998, "r": 373.67963, "b": 129.64948000000015, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 331.84451, "t": 129.00885000000017, "r": 381.17786, "b": 134.74945000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "with tag sequence", "bbox": {"l": 331.84451, "t": 129.00885000000017, "r": 381.17786, "b": 134.74945000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 196.62633, "t": 88.11621000000002, "r": 219.42332, "b": 93.85681, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "Encoder", "bbox": {"l": 196.62633, "t": 88.11621000000002, "r": 219.42332, "b": 93.85681, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 246.66771, "t": 129.4946900000001, "r": 271.49899, "b": 135.23528999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "Structure", "bbox": {"l": 246.66771, "t": 129.4946900000001, "r": 271.49899, "b": 135.23528999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 247.51601, "t": 134.59473000000003, "r": 270.65021, "b": 140.33533, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "Decoder", "bbox": {"l": 247.51601, "t": 134.59473000000003, "r": 270.65021, "b": 140.33533, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 330.63071, "t": 89.01923, "r": 365.55347, "b": 94.75982999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "[x1, y2, x2, y2]", "bbox": {"l": 330.63071, "t": 89.01923, "r": 365.55347, "b": 94.75982999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 330.63071, "t": 97.17926, "r": 370.22717, "b": 102.91985999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "[x1', y2', x2', y2']", "bbox": {"l": 330.63071, "t": 97.17926, "r": 370.22717, "b": 102.91985999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 330.63071, "t": 105.33922999999993, "r": 374.51157, "b": 111.07983000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "[x1'', y2'', x2'', y2'']", "bbox": {"l": 330.63071, "t": 105.33922999999993, "r": 374.51157, "b": 111.07983000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 330.63071, "t": 113.49926999999991, "r": 335.73233, "b": 119.23987, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "...", "bbox": {"l": 330.63071, "t": 113.49926999999991, "r": 335.73233, "b": 119.23987, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 322.30579, "t": 141.79236000000003, "r": 335.05988, "b": 146.57617000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "<TR>", "bbox": {"l": 322.30579, "t": 141.79236000000003, "r": 335.05988, "b": 146.57617000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 322.30579, "t": 148.93231000000003, "r": 335.05988, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "<TD>", "bbox": {"l": 322.30579, "t": 148.93231000000003, "r": 335.05988, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 337.54971, "t": 148.55579, "r": 340.95242, "b": 154.29638999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "1", "bbox": {"l": 337.54971, "t": 148.55579, "r": 340.95242, "b": 154.29638999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 343.56262, "t": 148.93231000000003, "r": 398.91446, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "</TD><TD colspan=\"2\">", "bbox": {"l": 343.56262, "t": 148.93231000000003, "r": 398.91446, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 407.41718, "t": 148.93231000000003, "r": 421.58801, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "</TD>", "bbox": {"l": 407.41718, "t": 148.93231000000003, "r": 421.58801, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 322.30579, "t": 156.07232999999997, "r": 349.23022, "b": 160.85613999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "</TR><TR>", "bbox": {"l": 322.30579, "t": 156.07232999999997, "r": 349.23022, "b": 160.85613999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 322.30579, "t": 163.21234000000004, "r": 335.05988, "b": 167.99614999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "<TD>", "bbox": {"l": 322.30579, "t": 163.21234000000004, "r": 335.05988, "b": 167.99614999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 343.56155, "t": 163.21234000000004, "r": 374.73685, "b": 167.99614999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "</TD><TD>...", "bbox": {"l": 343.56155, "t": 163.21234000000004, "r": 374.73685, "b": 167.99614999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 322.30579, "t": 170.35235999999998, "r": 326.55716, "b": 175.13617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "...", "bbox": {"l": 322.30579, "t": 170.35235999999998, "r": 326.55716, "b": 175.13617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 323.51111, "t": 89.66967999999997, "r": 326.91382, "b": 95.41027999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "1", "bbox": {"l": 323.51111, "t": 89.66967999999997, "r": 326.91382, "b": 95.41027999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 323.71509, "t": 97.78887999999995, "r": 327.1178, "b": 103.52948000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "2", "bbox": {"l": 323.71509, "t": 97.78887999999995, "r": 327.1178, "b": 103.52948000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 323.71509, "t": 105.98969, "r": 327.1178, "b": 111.73029000000008, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "3", "bbox": {"l": 323.71509, "t": 105.98969, "r": 327.1178, "b": 111.73029000000008, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 401.4816, "t": 148.54625999999996, "r": 404.88431, "b": 154.28687000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "2", "bbox": {"l": 401.4816, "t": 148.54625999999996, "r": 404.88431, "b": 154.28687000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 337.6976, "t": 162.68451000000005, "r": 341.10031, "b": 168.42511000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "3", "bbox": {"l": 337.6976, "t": 162.68451000000005, "r": 341.10031, "b": 168.42511000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 454.46378, "t": 104.54584, "r": 457.86648999999994, "b": 110.28644000000008, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "3", "bbox": {"l": 454.46378, "t": 104.54584, "r": 457.86648999999994, "b": 110.28644000000008, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 493.32580999999993, "t": 91.09546, "r": 496.72852, "b": 96.83605999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "2", "bbox": {"l": 493.32580999999993, "t": 91.09546, "r": 496.72852, "b": 96.83605999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 454.08298, "t": 90.56879000000015, "r": 457.48569000000003, "b": 96.30939000000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "1", "bbox": {"l": 454.08298, "t": 90.56879000000015, "r": 457.48569000000003, "b": 96.30939000000001, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "caption", "id": 6, "page_no": 4, "cluster": {"id": 6, "label": "caption", "bbox": {"l": 50.111992, "t": 203.98577999999998, "r": 545.10846, "b": 224.96691999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9677653908729553, "cells": [{"id": 59, "text": "Figure 3:", "bbox": {"l": 50.112, "t": 204.10535000000004, "r": 86.883949, "b": 213.01189999999997, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "TableFormer", "bbox": {"l": 94.020996, "t": 203.98577999999998, "r": 149.85141, "b": 212.94214, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "takes in an image of the PDF and creates bounding box and HTML structure predictions that are", "bbox": {"l": 152.86099, "t": 204.10535000000004, "r": 545.10846, "b": 213.01189999999997, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "synchronized. The bounding boxes grabs the content from the PDF and inserts it in the structure.", "bbox": {"l": 50.111992, "t": 216.06035999999995, "r": 436.0134, "b": 224.96691999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 3: TableFormer takes in an image of the PDF and creates bounding box and HTML structure predictions that are synchronized. The bounding boxes grabs the content from the PDF and inserts it in the structure."}, {"label": "picture", "id": 5, "page_no": 4, "cluster": {"id": 5, "label": "picture", "bbox": {"l": 53.03325653076172, "t": 257.66534423828125, "r": 285.3731689453125, "b": 507.6688537597656, "coord_origin": "TOPLEFT"}, "confidence": 0.9724941253662109, "cells": [{"id": 63, "text": "Input Image", "bbox": {"l": 74.253464, "t": 258.21472000000006, "r": 101.75846, "b": 264.17474000000004, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "Tokenised Tags", "bbox": {"l": 122.29972, "t": 258.34520999999995, "r": 157.83972, "b": 264.30524, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "Multi-Head Attention", "bbox": {"l": 78.549347, "t": 371.38579999999996, "r": 125.68359000000001, "b": 377.04782, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "Add", "bbox": {"l": 78.513298, "t": 391.31857, "r": 84.644547, "b": 396.98059, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "& Normalisation", "bbox": {"l": 116.52705, "t": 391.31857, "r": 125.11079999999998, "b": 396.98059, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "Feed Forward Network", "bbox": {"l": 76.024773, "t": 424.45309, "r": 127.92327000000002, "b": 430.11511, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "Add", "bbox": {"l": 78.382828, "t": 444.88956, "r": 84.514076, "b": 450.55157, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "& Normalisation", "bbox": {"l": 116.39658, "t": 444.88956, "r": 124.98033, "b": 450.55157, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Linear", "bbox": {"l": 167.46945, "t": 462.44324, "r": 181.6292, "b": 468.10526, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "Softmax", "bbox": {"l": 165.61292, "t": 478.47107, "r": 184.43242, "b": 484.13309, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "CNN BACKBONE ENCODER", "bbox": {"l": 65.319511, "t": 324.26235999999994, "r": 132.9245, "b": 330.22235000000006, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "[30, 1, 2, 3, 4, \u2026 3, ", "bbox": {"l": 119.51457, "t": 269.66394, "r": 162.98782, "b": 274.72992, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "4, 5, 8, 31]", "bbox": {"l": 128.72858, "t": 274.91394, "r": 151.41083, "b": 279.97992, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "Positional ", "bbox": {"l": 60.434211999999995, "t": 338.95993, "r": 80.27021, "b": 344.26993, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "Encoding", "bbox": {"l": 60.598457, "t": 343.38605, "r": 78.854958, "b": 348.69604, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "Positional ", "bbox": {"l": 134.82877, "t": 293.37762, "r": 154.66476, "b": 298.68762, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "Encoding", "bbox": {"l": 134.99303, "t": 297.80370999999997, "r": 153.24953, "b": 303.11371, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "Add & Normalisation", "bbox": {"l": 150.55193, "t": 345.35861, "r": 197.14943, "b": 351.02063, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Add", "bbox": {"l": 150.55193, "t": 394.4234, "r": 156.68318, "b": 400.08542, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "& Normalisation", "bbox": {"l": 188.56567, "t": 394.4234, "r": 197.14943, "b": 400.08542, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "Multi-Head Attention", "bbox": {"l": 150.18539, "t": 375.66843, "r": 197.31964, "b": 381.33044, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "Add", "bbox": {"l": 150.55193, "t": 440.24847000000005, "r": 156.68318, "b": 445.91049, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "& Normalisation", "bbox": {"l": 188.56567, "t": 440.24847000000005, "r": 197.14943, "b": 445.91049, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Feed Forward Network", "bbox": {"l": 147.86377, "t": 422.09335, "r": 199.76227, "b": 427.75537, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Linear", "bbox": {"l": 241.56567000000004, "t": 314.26285000000007, "r": 255.72542, "b": 319.92487, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "Linear", "bbox": {"l": 241.91730000000004, "t": 361.36493, "r": 256.07706, "b": 367.02695, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "Attention", "bbox": {"l": 228.054, "t": 336.61929000000003, "r": 248.72363000000004, "b": 342.28131, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "Network", "bbox": {"l": 246.2919, "t": 336.61929000000003, "r": 269.39325, "b": 342.28131, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "MLP", "bbox": {"l": 228.44568000000004, "t": 405.14682, "r": 238.73892, "b": 410.80884, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Linear ", "bbox": {"l": 256.29767, "t": 405.2032500000001, "r": 271.77792, "b": 410.86526, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "Sigmoid", "bbox": {"l": 239.54543, "t": 382.21344, "r": 258.08942, "b": 387.87546, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "Transformer Encoder Network", "bbox": {"l": 54.14704100000001, "t": 384.87183, "r": 59.51152, "b": 449.78326, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "x2", "bbox": {"l": 54.235424, "t": 373.81232, "r": 59.30449699999999, "b": 378.45421999999996, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "Encoded Output", "bbox": {"l": 85.295891, "t": 484.53189, "r": 122.16431, "b": 490.36688, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "Encoded Output", "bbox": {"l": 229.66599, "t": 279.54607999999996, "r": 265.3194, "b": 285.45572000000004, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "Predicted Tags", "bbox": {"l": 157.17369, "t": 500.3031, "r": 190.41711, "b": 506.12943, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "Bounding Boxes & ", "bbox": {"l": 227.81598999999997, "t": 438.05542, "r": 270.78442, "b": 443.89206, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "Classification", "bbox": {"l": 233.70262, "t": 444.06183, "r": 263.51105, "b": 449.8904999999999, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "Transformer ", "bbox": {"l": 184.74655, "t": 293.39502, "r": 212.16055, "b": 298.75903, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "Decoder Network", "bbox": {"l": 178.91229, "t": 299.14502, "r": 216.74378999999996, "b": 304.50903, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "x4", "bbox": {"l": 194.24574, "t": 282.7822, "r": 198.89099, "b": 287.84817999999996, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "CELL BBOX DECODER", "bbox": {"l": 221.45587, "t": 271.86914, "r": 276.47089, "b": 277.82916, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "Masked Multi-Head ", "bbox": {"l": 151.65219, "t": 323.44241, "r": 197.29019, "b": 329.10443, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "Attention", "bbox": {"l": 163.43277, "t": 329.44241, "r": 184.19028, "b": 335.10443, "coord_origin": "TOPLEFT"}}], "children": [{"id": 69, "label": "text", "bbox": {"l": 74.253464, "t": 258.21472000000006, "r": 101.75846, "b": 264.17474000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "Input Image", "bbox": {"l": 74.253464, "t": 258.21472000000006, "r": 101.75846, "b": 264.17474000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 122.29972, "t": 258.34520999999995, "r": 157.83972, "b": 264.30524, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "Tokenised Tags", "bbox": {"l": 122.29972, "t": 258.34520999999995, "r": 157.83972, "b": 264.30524, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 78.549347, "t": 371.38579999999996, "r": 125.68359000000001, "b": 377.04782, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "Multi-Head Attention", "bbox": {"l": 78.549347, "t": 371.38579999999996, "r": 125.68359000000001, "b": 377.04782, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 78.513298, "t": 391.31857, "r": 84.644547, "b": 396.98059, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "Add", "bbox": {"l": 78.513298, "t": 391.31857, "r": 84.644547, "b": 396.98059, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 116.52705, "t": 391.31857, "r": 125.11079999999998, "b": 396.98059, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "& Normalisation", "bbox": {"l": 116.52705, "t": 391.31857, "r": 125.11079999999998, "b": 396.98059, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 76.024773, "t": 424.45309, "r": 127.92327000000002, "b": 430.11511, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "Feed Forward Network", "bbox": {"l": 76.024773, "t": 424.45309, "r": 127.92327000000002, "b": 430.11511, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 78.382828, "t": 444.88956, "r": 84.514076, "b": 450.55157, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "Add", "bbox": {"l": 78.382828, "t": 444.88956, "r": 84.514076, "b": 450.55157, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 116.39658, "t": 444.88956, "r": 124.98033, "b": 450.55157, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "& Normalisation", "bbox": {"l": 116.39658, "t": 444.88956, "r": 124.98033, "b": 450.55157, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 167.46945, "t": 462.44324, "r": 181.6292, "b": 468.10526, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "Linear", "bbox": {"l": 167.46945, "t": 462.44324, "r": 181.6292, "b": 468.10526, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 165.61292, "t": 478.47107, "r": 184.43242, "b": 484.13309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "Softmax", "bbox": {"l": 165.61292, "t": 478.47107, "r": 184.43242, "b": 484.13309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 65.319511, "t": 324.26235999999994, "r": 132.9245, "b": 330.22235000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "CNN BACKBONE ENCODER", "bbox": {"l": 65.319511, "t": 324.26235999999994, "r": 132.9245, "b": 330.22235000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 119.51457, "t": 269.66394, "r": 162.98782, "b": 274.72992, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "[30, 1, 2, 3, 4, \u2026 3, ", "bbox": {"l": 119.51457, "t": 269.66394, "r": 162.98782, "b": 274.72992, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 128.72858, "t": 274.91394, "r": 151.41083, "b": 279.97992, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "4, 5, 8, 31]", "bbox": {"l": 128.72858, "t": 274.91394, "r": 151.41083, "b": 279.97992, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 60.434211999999995, "t": 338.95993, "r": 80.27021, "b": 344.26993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "Positional ", "bbox": {"l": 60.434211999999995, "t": 338.95993, "r": 80.27021, "b": 344.26993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 60.598457, "t": 343.38605, "r": 78.854958, "b": 348.69604, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "Encoding", "bbox": {"l": 60.598457, "t": 343.38605, "r": 78.854958, "b": 348.69604, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 134.82877, "t": 293.37762, "r": 154.66476, "b": 298.68762, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "Positional ", "bbox": {"l": 134.82877, "t": 293.37762, "r": 154.66476, "b": 298.68762, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 134.99303, "t": 297.80370999999997, "r": 153.24953, "b": 303.11371, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "Encoding", "bbox": {"l": 134.99303, "t": 297.80370999999997, "r": 153.24953, "b": 303.11371, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 150.55193, "t": 345.35861, "r": 197.14943, "b": 351.02063, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "Add & Normalisation", "bbox": {"l": 150.55193, "t": 345.35861, "r": 197.14943, "b": 351.02063, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 150.55193, "t": 394.4234, "r": 156.68318, "b": 400.08542, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "Add", "bbox": {"l": 150.55193, "t": 394.4234, "r": 156.68318, "b": 400.08542, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 188.56567, "t": 394.4234, "r": 197.14943, "b": 400.08542, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "& Normalisation", "bbox": {"l": 188.56567, "t": 394.4234, "r": 197.14943, "b": 400.08542, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 150.18539, "t": 375.66843, "r": 197.31964, "b": 381.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "Multi-Head Attention", "bbox": {"l": 150.18539, "t": 375.66843, "r": 197.31964, "b": 381.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 150.55193, "t": 440.24847000000005, "r": 156.68318, "b": 445.91049, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "Add", "bbox": {"l": 150.55193, "t": 440.24847000000005, "r": 156.68318, "b": 445.91049, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 188.56567, "t": 440.24847000000005, "r": 197.14943, "b": 445.91049, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "& Normalisation", "bbox": {"l": 188.56567, "t": 440.24847000000005, "r": 197.14943, "b": 445.91049, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 147.86377, "t": 422.09335, "r": 199.76227, "b": 427.75537, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "Feed Forward Network", "bbox": {"l": 147.86377, "t": 422.09335, "r": 199.76227, "b": 427.75537, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 241.56567000000004, "t": 314.26285000000007, "r": 255.72542, "b": 319.92487, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "Linear", "bbox": {"l": 241.56567000000004, "t": 314.26285000000007, "r": 255.72542, "b": 319.92487, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 241.91730000000004, "t": 361.36493, "r": 256.07706, "b": 367.02695, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "Linear", "bbox": {"l": 241.91730000000004, "t": 361.36493, "r": 256.07706, "b": 367.02695, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 228.054, "t": 336.61929000000003, "r": 248.72363000000004, "b": 342.28131, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "Attention", "bbox": {"l": 228.054, "t": 336.61929000000003, "r": 248.72363000000004, "b": 342.28131, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 246.2919, "t": 336.61929000000003, "r": 269.39325, "b": 342.28131, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "Network", "bbox": {"l": 246.2919, "t": 336.61929000000003, "r": 269.39325, "b": 342.28131, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 228.44568000000004, "t": 405.14682, "r": 238.73892, "b": 410.80884, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "MLP", "bbox": {"l": 228.44568000000004, "t": 405.14682, "r": 238.73892, "b": 410.80884, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 256.29767, "t": 405.2032500000001, "r": 271.77792, "b": 410.86526, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "Linear ", "bbox": {"l": 256.29767, "t": 405.2032500000001, "r": 271.77792, "b": 410.86526, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 239.54543, "t": 382.21344, "r": 258.08942, "b": 387.87546, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "Sigmoid", "bbox": {"l": 239.54543, "t": 382.21344, "r": 258.08942, "b": 387.87546, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 54.14704100000001, "t": 384.87183, "r": 59.51152, "b": 449.78326, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "Transformer Encoder Network", "bbox": {"l": 54.14704100000001, "t": 384.87183, "r": 59.51152, "b": 449.78326, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 54.235424, "t": 373.81232, "r": 59.30449699999999, "b": 378.45421999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "x2", "bbox": {"l": 54.235424, "t": 373.81232, "r": 59.30449699999999, "b": 378.45421999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 85.295891, "t": 484.53189, "r": 122.16431, "b": 490.36688, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "Encoded Output", "bbox": {"l": 85.295891, "t": 484.53189, "r": 122.16431, "b": 490.36688, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 229.66599, "t": 279.54607999999996, "r": 265.3194, "b": 285.45572000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "Encoded Output", "bbox": {"l": 229.66599, "t": 279.54607999999996, "r": 265.3194, "b": 285.45572000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 157.17369, "t": 500.3031, "r": 190.41711, "b": 506.12943, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "Predicted Tags", "bbox": {"l": 157.17369, "t": 500.3031, "r": 190.41711, "b": 506.12943, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 227.81598999999997, "t": 438.05542, "r": 270.78442, "b": 443.89206, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "Bounding Boxes & ", "bbox": {"l": 227.81598999999997, "t": 438.05542, "r": 270.78442, "b": 443.89206, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 233.70262, "t": 444.06183, "r": 263.51105, "b": 449.8904999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "Classification", "bbox": {"l": 233.70262, "t": 444.06183, "r": 263.51105, "b": 449.8904999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 184.74655, "t": 293.39502, "r": 212.16055, "b": 298.75903, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "Transformer ", "bbox": {"l": 184.74655, "t": 293.39502, "r": 212.16055, "b": 298.75903, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 178.91229, "t": 299.14502, "r": 216.74378999999996, "b": 304.50903, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "Decoder Network", "bbox": {"l": 178.91229, "t": 299.14502, "r": 216.74378999999996, "b": 304.50903, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 194.24574, "t": 282.7822, "r": 198.89099, "b": 287.84817999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": "x4", "bbox": {"l": 194.24574, "t": 282.7822, "r": 198.89099, "b": 287.84817999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 221.45587, "t": 271.86914, "r": 276.47089, "b": 277.82916, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "CELL BBOX DECODER", "bbox": {"l": 221.45587, "t": 271.86914, "r": 276.47089, "b": 277.82916, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 151.65219, "t": 323.44241, "r": 197.29019, "b": 329.10443, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "Masked Multi-Head ", "bbox": {"l": 151.65219, "t": 323.44241, "r": 197.29019, "b": 329.10443, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 163.43277, "t": 329.44241, "r": 184.19028, "b": 335.10443, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": "Attention", "bbox": {"l": 163.43277, "t": 329.44241, "r": 184.19028, "b": 335.10443, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "caption", "id": 8, "page_no": 4, "cluster": {"id": 8, "label": "caption", "bbox": {"l": 50.112, "t": 527.7828099999999, "r": 286.36597, "b": 680.27094, "coord_origin": "TOPLEFT"}, "confidence": 0.8913412094116211, "cells": [{"id": 107, "text": "Figure 4: Given an input image of a table, the", "bbox": {"l": 50.112, "t": 527.90237, "r": 229.78752, "b": 536.80893, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "Encoder", "bbox": {"l": 231.787, "t": 527.7828099999999, "r": 267.76196, "b": 536.7392, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "pro-", "bbox": {"l": 269.76401, "t": 527.90237, "r": 286.36169, "b": 536.80893, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "duces fixed-length features that represent the input image.", "bbox": {"l": 50.112015, "t": 539.85738, "r": 286.36508, "b": 548.76393, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "The features are then passed to both the", "bbox": {"l": 50.112015, "t": 551.81337, "r": 205.84735, "b": 560.71992, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "Structure Decoder", "bbox": {"l": 208.01802, "t": 551.69382, "r": 286.36392, "b": 560.6501900000001, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "and", "bbox": {"l": 50.112015, "t": 563.76837, "r": 64.498009, "b": 572.67493, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "Cell BBox Decoder", "bbox": {"l": 68.165016, "t": 563.64882, "r": 151.31288, "b": 572.60519, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": ".", "bbox": {"l": 151.31302, "t": 563.76837, "r": 153.80367, "b": 572.67493, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "During training, the", "bbox": {"l": 160.41884, "t": 563.76837, "r": 241.93283000000002, "b": 572.67493, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "Structure", "bbox": {"l": 245.59502, "t": 563.64882, "r": 286.362, "b": 572.60519, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "Decoder", "bbox": {"l": 50.112015, "t": 575.60382, "r": 85.519089, "b": 584.5602, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "receives \u2018tokenized tags\u2019 of the HTML code that", "bbox": {"l": 88.623016, "t": 575.7233699999999, "r": 286.36072, "b": 584.6299300000001, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "represent the table structure. Afterwards, a transformer en-", "bbox": {"l": 50.112015, "t": 587.6783800000001, "r": 286.36511, "b": 596.58493, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "coder and decoder architecture is employed to produce fea-", "bbox": {"l": 50.112015, "t": 599.63338, "r": 286.36508, "b": 608.53993, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "tures that are received by a linear layer, and the", "bbox": {"l": 50.112015, "t": 611.58838, "r": 240.43756000000002, "b": 620.4949300000001, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "Cell BBox", "bbox": {"l": 243.19801, "t": 611.46883, "r": 286.36597, "b": 620.4252, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "Decoder. The linear layer is applied to the features to", "bbox": {"l": 50.112015, "t": 623.42482, "r": 286.36511, "b": 632.3812, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "predict the tags. Simultaneously, the Cell BBox Decoder", "bbox": {"l": 50.112015, "t": 635.37982, "r": 286.36508, "b": 644.3362, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "selects features referring to the data cells (\u2018", "bbox": {"l": 50.112015, "t": 647.45438, "r": 220.58205, "b": 656.36093, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "<", "bbox": {"l": 220.57802000000004, "t": 647.29497, "r": 228.32693, "b": 656.14175, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "td", "bbox": {"l": 228.32700999999997, "t": 647.45438, "r": 236.07791000000003, "b": 656.36093, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": ">", "bbox": {"l": 236.07802000000004, "t": 647.29497, "r": 243.82693, "b": 656.14175, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "\u2019, \u2018", "bbox": {"l": 243.82602, "t": 647.45438, "r": 255.29298000000003, "b": 656.36093, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "<", "bbox": {"l": 255.29102000000003, "t": 647.29497, "r": 263.03992, "b": 656.14175, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "\u2019) and", "bbox": {"l": 263.04001, "t": 647.45438, "r": 286.36246, "b": 656.36093, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "passes them through an attention network, an MLP, and a", "bbox": {"l": 50.112015, "t": 659.40938, "r": 286.36511, "b": 668.31594, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "linear layer to predict the bounding boxes.", "bbox": {"l": 50.112015, "t": 671.36438, "r": 218.46996, "b": 680.27094, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 4: Given an input image of a table, the Encoder produces fixed-length features that represent the input image. The features are then passed to both the Structure Decoder and Cell BBox Decoder . During training, the Structure Decoder receives \u2018tokenized tags\u2019 of the HTML code that represent the table structure. Afterwards, a transformer encoder and decoder architecture is employed to produce features that are received by a linear layer, and the Cell BBox Decoder. The linear layer is applied to the features to predict the tags. Simultaneously, the Cell BBox Decoder selects features referring to the data cells (\u2018 < td > \u2019, \u2018 < \u2019) and passes them through an attention network, an MLP, and a linear layer to predict the bounding boxes."}, {"label": "text", "id": 4, "page_no": 4, "cluster": {"id": 4, "label": "text", "bbox": {"l": 308.862, "t": 249.53441999999995, "r": 545.11505, "b": 294.3069499999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9831458330154419, "cells": [{"id": 135, "text": "forming classification, and adding an adaptive pooling", "bbox": {"l": 308.862, "t": 249.53441999999995, "r": 523.05786, "b": 258.44097999999997, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "layer", "bbox": {"l": 525.19983, "t": 249.53441999999995, "r": 545.11505, "b": 258.44097999999997, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "of size 28*28. ResNet by default downsamples the", "bbox": {"l": 308.862, "t": 261.49042, "r": 517.55847, "b": 270.39697, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "image", "bbox": {"l": 520.76642, "t": 261.49042, "r": 545.11499, "b": 270.39697, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "resolution by 32 and then the encoded image is provided", "bbox": {"l": 308.862, "t": 273.44537, "r": 534.80377, "b": 282.35196, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "to", "bbox": {"l": 537.36414, "t": 273.44537, "r": 545.11505, "b": 282.35196, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "both the", "bbox": {"l": 308.862, "t": 285.40039, "r": 341.24045, "b": 294.3069499999999, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "Structure Decoder", "bbox": {"l": 343.73099, "t": 285.49005, "r": 417.23508, "b": 294.07782000000003, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": ", and", "bbox": {"l": 417.23398, "t": 285.40039, "r": 436.60129, "b": 294.3069499999999, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "Cell BBox Decoder", "bbox": {"l": 439.09198, "t": 285.49005, "r": 516.56116, "b": 294.07782000000003, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": ".", "bbox": {"l": 516.56097, "t": 285.40039, "r": 519.05164, "b": 294.3069499999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "forming classification, and adding an adaptive pooling layer of size 28*28. ResNet by default downsamples the image resolution by 32 and then the encoded image is provided to both the Structure Decoder , and Cell BBox Decoder ."}, {"label": "text", "id": 1, "page_no": 4, "cluster": {"id": 1, "label": "text", "bbox": {"l": 308.86194, "t": 297.33981, "r": 545.11511, "b": 413.96182, "coord_origin": "TOPLEFT"}, "confidence": 0.9862009882926941, "cells": [{"id": 146, "text": "Structure Decoder.", "bbox": {"l": 320.81696, "t": 297.33981, "r": 400.86649, "b": 306.2962, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "The transformer architecture of", "bbox": {"l": 403.91394, "t": 297.45938, "r": 528.33685, "b": 306.36594, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "this", "bbox": {"l": 530.7179, "t": 297.45938, "r": 545.11383, "b": 306.36594, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "component is based on the work proposed in [31].", "bbox": {"l": 308.86194, "t": 309.41437, "r": 517.5285, "b": 318.32092, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "After", "bbox": {"l": 524.09387, "t": 309.41437, "r": 545.11493, "b": 318.32092, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "extensive experimentation, the", "bbox": {"l": 308.86194, "t": 321.36934999999994, "r": 432.35833999999994, "b": 330.27591, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "Structure Decoder", "bbox": {"l": 435.81995000000006, "t": 321.45901, "r": 510.29041, "b": 330.04678, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "is", "bbox": {"l": 513.97797, "t": 321.36934999999994, "r": 520.62305, "b": 330.27591, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "mod-", "bbox": {"l": 524.08008, "t": 321.36934999999994, "r": 545.11115, "b": 330.27591, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "eled as a transformer encoder with two encoder layers", "bbox": {"l": 308.86197, "t": 333.32434, "r": 527.76013, "b": 342.2309, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "and", "bbox": {"l": 530.729, "t": 333.32434, "r": 545.11499, "b": 342.2309, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "a transformer decoder made from a stack of 4 decoder", "bbox": {"l": 308.86197, "t": 345.27933, "r": 526.85352, "b": 354.18588, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "lay-", "bbox": {"l": 529.62311, "t": 345.27933, "r": 545.11493, "b": 354.18588, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "ers that comprise mainly of multi-head attention and", "bbox": {"l": 308.86197, "t": 357.23532, "r": 524.51245, "b": 366.14188, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "feed", "bbox": {"l": 527.96948, "t": 357.23532, "r": 545.11511, "b": 366.14188, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "forward layers.", "bbox": {"l": 308.86197, "t": 369.19031000000007, "r": 370.39096, "b": 378.09685999999994, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "This configuration uses fewer layers", "bbox": {"l": 377.44449, "t": 369.19031000000007, "r": 526.91339, "b": 378.09685999999994, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "and", "bbox": {"l": 530.72906, "t": 369.19031000000007, "r": 545.11505, "b": 378.09685999999994, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "heads in comparison to networks applied to other", "bbox": {"l": 308.86197, "t": 381.14529000000005, "r": 505.46395999999993, "b": 390.05185, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "problems", "bbox": {"l": 508.03430000000003, "t": 381.14529000000005, "r": 545.11511, "b": 390.05185, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "(e.g. \u201cScene Understanding\u201d, \u201cImage Captioning\u201d),", "bbox": {"l": 308.86197, "t": 393.10028, "r": 517.68799, "b": 402.00684, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "some-", "bbox": {"l": 520.76642, "t": 393.10028, "r": 545.11499, "b": 402.00684, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "thing which we relate to the simplicity of table images.", "bbox": {"l": 308.86197, "t": 405.05526999999995, "r": 528.01935, "b": 413.96182, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Structure Decoder. The transformer architecture of this component is based on the work proposed in [31]. After extensive experimentation, the Structure Decoder is modeled as a transformer encoder with two encoder layers and a transformer decoder made from a stack of 4 decoder layers that comprise mainly of multi-head attention and feed forward layers. This configuration uses fewer layers and heads in comparison to networks applied to other problems (e.g. \u201cScene Understanding\u201d, \u201cImage Captioning\u201d), something which we relate to the simplicity of table images."}, {"label": "text", "id": 3, "page_no": 4, "cluster": {"id": 3, "label": "text", "bbox": {"l": 308.86197, "t": 417.11426, "r": 545.11511, "b": 545.57271, "coord_origin": "TOPLEFT"}, "confidence": 0.9851908087730408, "cells": [{"id": 169, "text": "The transformer encoder receives an encoded", "bbox": {"l": 320.81696, "t": 417.11426, "r": 515.49609, "b": 426.02081, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "image", "bbox": {"l": 520.7663, "t": 417.11426, "r": 545.11487, "b": 426.02081, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "from the", "bbox": {"l": 308.86197, "t": 429.0692399999999, "r": 343.72107, "b": 437.9758, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "CNN Backbone Network", "bbox": {"l": 347.03796, "t": 429.15891, "r": 446.45471000000003, "b": 437.74667, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "and refines it", "bbox": {"l": 449.93996999999996, "t": 429.0692399999999, "r": 503.06055000000003, "b": 437.9758, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "through", "bbox": {"l": 506.37808, "t": 429.0692399999999, "r": 537.3717, "b": 437.9758, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "a", "bbox": {"l": 540.68927, "t": 429.0692399999999, "r": 545.11267, "b": 437.9758, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "multi-head dot-product attention layer, followed by a", "bbox": {"l": 308.86197, "t": 441.02423, "r": 522.78894, "b": 449.93079, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "Feed", "bbox": {"l": 525.7478, "t": 441.02423, "r": 545.11511, "b": 449.93079, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "Forward Network.", "bbox": {"l": 308.86197, "t": 452.97922, "r": 384.14929, "b": 461.88577, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "During training, the transformer", "bbox": {"l": 393.37466, "t": 452.97922, "r": 527.84985, "b": 461.88577, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "de-", "bbox": {"l": 532.39282, "t": 452.97922, "r": 545.11505, "b": 461.88577, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "coder receives as input the output feature produced by", "bbox": {"l": 308.86197, "t": 464.93521, "r": 529.7627, "b": 473.84177, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "the", "bbox": {"l": 532.94073, "t": 464.93521, "r": 545.11505, "b": 473.84177, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "transformer encoder, and the tokenized input of the", "bbox": {"l": 308.86197, "t": 476.8902, "r": 514.17126, "b": 485.79675, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "HTML", "bbox": {"l": 516.89105, "t": 476.8902, "r": 545.11511, "b": 485.79675, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": "ground-truth tags. Using a stack of multi-head attention", "bbox": {"l": 308.86197, "t": 488.84518, "r": 527.63068, "b": 497.75174, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "lay-", "bbox": {"l": 529.62317, "t": 488.84518, "r": 545.11499, "b": 497.75174, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "ers, different aspects of the tag sequence could be", "bbox": {"l": 308.86197, "t": 500.80017, "r": 508.3630999999999, "b": 509.70673, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": "inferred.", "bbox": {"l": 511.09286000000003, "t": 500.80017, "r": 545.11511, "b": 509.70673, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "This is achieved by each attention head on a layer operating", "bbox": {"l": 308.86197, "t": 512.7551599999999, "r": 545.11499, "b": 521.6617100000001, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "in a different subspace, and then combining altogether their", "bbox": {"l": 308.86197, "t": 524.71115, "r": 545.11511, "b": 533.61771, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "attention score.", "bbox": {"l": 308.86197, "t": 536.66615, "r": 369.73349, "b": 545.57271, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The transformer encoder receives an encoded image from the CNN Backbone Network and refines it through a multi-head dot-product attention layer, followed by a Feed Forward Network. During training, the transformer decoder receives as input the output feature produced by the transformer encoder, and the tokenized input of the HTML ground-truth tags. Using a stack of multi-head attention layers, different aspects of the tag sequence could be inferred. This is achieved by each attention head on a layer operating in a different subspace, and then combining altogether their attention score."}, {"label": "text", "id": 0, "page_no": 4, "cluster": {"id": 0, "label": "text", "bbox": {"l": 308.86194, "t": 548.6046, "r": 545.11511, "b": 653.27271, "coord_origin": "TOPLEFT"}, "confidence": 0.9869197010993958, "cells": [{"id": 192, "text": "Cell BBox Decoder.", "bbox": {"l": 320.81696, "t": 548.6046, "r": 404.76184, "b": 557.56097, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "Our architecture allows to simul-", "bbox": {"l": 410.34094, "t": 548.72415, "r": 545.11505, "b": 557.63071, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "taneously predict HTML tags and bounding boxes for each", "bbox": {"l": 308.86194, "t": 560.68015, "r": 545.11493, "b": 569.5867000000001, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "table cell without the need of a separate object detector end", "bbox": {"l": 308.86194, "t": 572.6351500000001, "r": 545.11511, "b": 581.5417, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "to end. This approach is inspired by DETR [1] which em-", "bbox": {"l": 308.86194, "t": 584.59015, "r": 545.11493, "b": 593.4967, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "ploys a Transformer Encoder, and Decoder that looks for", "bbox": {"l": 308.86194, "t": 596.54515, "r": 545.11499, "b": 605.45171, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "a specific number of object queries (potential object detec-", "bbox": {"l": 308.86194, "t": 608.50015, "r": 545.11505, "b": 617.40671, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "tions). As our model utilizes a transformer architecture, the", "bbox": {"l": 308.86194, "t": 620.45515, "r": 545.11505, "b": 629.36171, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "hidden state of the", "bbox": {"l": 308.86194, "t": 632.41115, "r": 381.67859, "b": 641.3177000000001, "coord_origin": "TOPLEFT"}}, {"id": 201, "text": "<", "bbox": {"l": 383.99695, "t": 632.25174, "r": 391.74585, "b": 641.09853, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": "td", "bbox": {"l": 391.74594, "t": 632.41115, "r": 399.49686, "b": 641.3177000000001, "coord_origin": "TOPLEFT"}}, {"id": 203, "text": ">", "bbox": {"l": 399.49695, "t": 632.25174, "r": 407.24585, "b": 641.09853, "coord_origin": "TOPLEFT"}}, {"id": 204, "text": "\u2019 and \u2018", "bbox": {"l": 407.24594, "t": 632.41115, "r": 432.90958, "b": 641.3177000000001, "coord_origin": "TOPLEFT"}}, {"id": 205, "text": "<", "bbox": {"l": 432.90792999999996, "t": 632.25174, "r": 440.65683000000007, "b": 641.09853, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": "\u2019 HTML structure tags be-", "bbox": {"l": 440.65691999999996, "t": 632.41115, "r": 545.11475, "b": 641.3177000000001, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": "come the object query.", "bbox": {"l": 308.86194, "t": 644.3661500000001, "r": 398.96371, "b": 653.27271, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Cell BBox Decoder. Our architecture allows to simultaneously predict HTML tags and bounding boxes for each table cell without the need of a separate object detector end to end. This approach is inspired by DETR [1] which employs a Transformer Encoder, and Decoder that looks for a specific number of object queries (potential object detections). As our model utilizes a transformer architecture, the hidden state of the < td > \u2019 and \u2018 < \u2019 HTML structure tags become the object query."}, {"label": "text", "id": 2, "page_no": 4, "cluster": {"id": 2, "label": "text", "bbox": {"l": 308.86194, "t": 656.42516, "r": 545.11505, "b": 713.151726, "coord_origin": "TOPLEFT"}, "confidence": 0.9852352142333984, "cells": [{"id": 208, "text": "The encoding generated by the", "bbox": {"l": 320.81693, "t": 656.42516, "r": 444.34316999999993, "b": 665.33172, "coord_origin": "TOPLEFT"}}, {"id": 209, "text": "CNN Backbone Network", "bbox": {"l": 447.00591999999995, "t": 656.51482, "r": 545.1076, "b": 665.10258, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": "along with the features acquired for every data cell from the", "bbox": {"l": 308.86194, "t": 668.38016, "r": 545.11505, "b": 677.2867200000001, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "Transformer Decoder are then passed to the attention net-", "bbox": {"l": 308.86194, "t": 680.33516, "r": 545.11505, "b": 689.24172, "coord_origin": "TOPLEFT"}}, {"id": 212, "text": "work. The attention network takes both inputs and learns to", "bbox": {"l": 308.86194, "t": 692.290161, "r": 545.11505, "b": 701.196724, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "provide an attention weighted encoding. This weighted at-", "bbox": {"l": 308.86194, "t": 704.245163, "r": 545.11505, "b": 713.151726, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The encoding generated by the CNN Backbone Network along with the features acquired for every data cell from the Transformer Decoder are then passed to the attention network. The attention network takes both inputs and learns to provide an attention weighted encoding. This weighted at-"}], "headers": [{"label": "page_footer", "id": 9, "page_no": 4, "cluster": {"id": 9, "label": "page_footer", "bbox": {"l": 295.12094, "t": 734.13316, "r": 300.10223, "b": 743.039722, "coord_origin": "TOPLEFT"}, "confidence": 0.8719562292098999, "cells": [{"id": 214, "text": "5", "bbox": {"l": 295.12094, "t": 734.13316, "r": 300.10223, "b": 743.039722, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5"}]}}, {"page_no": 5, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "tention encoding is then multiplied to the encoded image to", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 286.36514, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "produce a feature for each table cell. Notice that this is dif-", "bbox": {"l": 50.112, "t": 87.16339000000005, "r": 286.36508, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "ferent than the typical object detection problem where im-", "bbox": {"l": 50.112, "t": 99.11841000000004, "r": 286.36508, "b": 108.02495999999985, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "balances between the number of detections and the amount", "bbox": {"l": 50.112, "t": 111.07343000000003, "r": 286.36508, "b": 119.97997999999984, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "of objects may exist. In our case, we know up front that", "bbox": {"l": 50.112, "t": 123.02844000000005, "r": 286.36508, "b": 131.93499999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "the produced detections always match with the table cells", "bbox": {"l": 50.112, "t": 134.98443999999995, "r": 286.36514, "b": 143.89099, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "in number and correspondence.", "bbox": {"l": 50.112, "t": 146.93944999999997, "r": 175.16254, "b": 155.84600999999998, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "The output features for each table cell are then fed", "bbox": {"l": 62.067001, "t": 159.62445000000002, "r": 286.36496, "b": 168.53101000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "into the feed-forward network (FFN). The FFN consists", "bbox": {"l": 50.112, "t": 171.58043999999995, "r": 286.36511, "b": 180.48699999999997, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "of a Multi-Layer Perceptron (3 layers with ReLU activa-", "bbox": {"l": 50.112, "t": 183.53545999999994, "r": 286.36511, "b": 192.44201999999996, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "tion function) that predicts the normalized coordinates for", "bbox": {"l": 50.112, "t": 195.49048000000005, "r": 286.36511, "b": 204.39702999999997, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "the bounding box of each table cell. Finally, the predicted", "bbox": {"l": 50.112, "t": 207.44550000000004, "r": 286.36511, "b": 216.35204999999996, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "bounding boxes are classified based on whether they are", "bbox": {"l": 50.112, "t": 219.40051000000005, "r": 286.36511, "b": 228.30706999999995, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "empty or not using a linear layer.", "bbox": {"l": 50.112, "t": 231.35650999999996, "r": 181.54855, "b": 240.26306, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Loss Functions.", "bbox": {"l": 62.067001, "t": 243.92193999999995, "r": 129.21492, "b": 252.87829999999997, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "We formulate a multi-task loss Eq. 2", "bbox": {"l": 134.451, "t": 244.04150000000004, "r": 286.36078, "b": 252.94806000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "to train our network. The Cross-Entropy loss (denoted as", "bbox": {"l": 50.112007, "t": 255.99652000000003, "r": 286.36511, "b": 264.90308000000005, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "l$_{s}$", "bbox": {"l": 50.112007, "t": 267.79309, "r": 56.84528, "b": 276.63989000000004, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": ") is used to train the", "bbox": {"l": 57.343006, "t": 267.95250999999996, "r": 135.39996, "b": 276.85907, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Structure Decoder", "bbox": {"l": 137.735, "t": 268.04218000000003, "r": 211.07965, "b": 276.62994000000003, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "which predicts the", "bbox": {"l": 213.63699, "t": 267.95250999999996, "r": 286.36395, "b": 276.85907, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "structure tokens. As for the", "bbox": {"l": 50.112, "t": 279.90747, "r": 158.82388, "b": 288.81406, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "Cell BBox Decoder", "bbox": {"l": 161.31799, "t": 279.99712999999997, "r": 238.79712, "b": 288.58493, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "it is trained", "bbox": {"l": 241.521, "t": 279.90747, "r": 286.36264, "b": 288.81406, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "with a combination of losses denoted as", "bbox": {"l": 50.112, "t": 291.86249, "r": 211.3766, "b": 300.76904, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "l$_{box}$", "bbox": {"l": 214.271, "t": 291.70309, "r": 229.19780000000003, "b": 300.54987, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": ".", "bbox": {"l": 229.696, "t": 291.86249, "r": 232.18665000000001, "b": 300.76904, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "l$_{box}$", "bbox": {"l": 236.49001, "t": 291.70309, "r": 251.41681000000003, "b": 300.54987, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "consists", "bbox": {"l": 254.81099999999998, "t": 291.86249, "r": 286.36255, "b": 300.76904, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "of the generally used", "bbox": {"l": 50.112, "t": 303.81747, "r": 137.45412, "b": 312.72403, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "l$_{1}$", "bbox": {"l": 141.298, "t": 303.65808, "r": 148.24258, "b": 312.50485, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "loss for object detection and the", "bbox": {"l": 152.58601, "t": 303.81747, "r": 286.36377, "b": 312.72403, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "IoU loss (", "bbox": {"l": 50.112015, "t": 315.77245999999997, "r": 89.683464, "b": 324.67902, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "l$_{iou}$", "bbox": {"l": 89.68602, "t": 315.61307, "r": 104.12046, "b": 324.45984, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": ") to be scale invariant as explained in [25]. In", "bbox": {"l": 104.61802, "t": 315.77245999999997, "r": 286.36572, "b": 324.67902, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "comparison to DETR, we do not use the Hungarian algo-", "bbox": {"l": 50.112019, "t": 327.72845, "r": 286.36511, "b": 336.6350100000001, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "rithm [15] to match the predicted bounding boxes with the", "bbox": {"l": 50.112019, "t": 339.68344, "r": 286.36508, "b": 348.59, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "ground-truth boxes, as we have already achieved a one-to-", "bbox": {"l": 50.112019, "t": 351.63843, "r": 286.36511, "b": 360.54498, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "one match through two steps: 1) Our token input sequence", "bbox": {"l": 50.112019, "t": 363.59341, "r": 286.36508, "b": 372.49996999999996, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "is naturally ordered, therefore the hidden states of the table", "bbox": {"l": 50.112019, "t": 375.5484, "r": 286.36511, "b": 384.45496, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "data cells are also in order when they are provided as in-", "bbox": {"l": 50.112019, "t": 387.50339, "r": 286.36514, "b": 396.40994, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "put to the", "bbox": {"l": 50.112019, "t": 399.45938, "r": 88.68721, "b": 408.36594, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "Cell BBox Decoder", "bbox": {"l": 91.646019, "t": 399.54904, "r": 170.0517, "b": 408.13681, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": ", and 2) Our bounding boxes", "bbox": {"l": 170.05103, "t": 399.45938, "r": 286.36438, "b": 408.36594, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "generation mechanism (see Sec.", "bbox": {"l": 50.112022, "t": 411.41437, "r": 181.96703, "b": 420.32092, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "3)", "bbox": {"l": 189.09029, "t": 411.41437, "r": 197.74918, "b": 420.32092, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "ensures a one-to-one", "bbox": {"l": 200.34789, "t": 411.41437, "r": 286.36511, "b": 420.32092, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "mapping between the cell content and its bounding box for", "bbox": {"l": 50.112022, "t": 423.36934999999994, "r": 286.36511, "b": 432.27591, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "all post-processed datasets.", "bbox": {"l": 50.112022, "t": 435.32434, "r": 158.2959, "b": 444.2309, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "The loss used to train the TableFormer can be defined as", "bbox": {"l": 62.067024, "t": 448.01035, "r": 286.36499, "b": 456.9169, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "following:", "bbox": {"l": 50.112022, "t": 459.96533, "r": 91.377113, "b": 468.87189, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "l$_{box}$", "bbox": {"l": 125.71502, "t": 493.28094, "r": 140.64182, "b": 502.12772, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "=", "bbox": {"l": 143.90701, "t": 493.28094, "r": 151.65593, "b": 502.12772, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "\u03bb$_{iou}$l$_{iou}$", "bbox": {"l": 154.42302, "t": 493.28094, "r": 186.62846, "b": 502.12772, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "+", "bbox": {"l": 189.34003, "t": 493.28094, "r": 197.08894, "b": 502.12772, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "\u03bb$_{l}$$_{1}$", "bbox": {"l": 199.30302, "t": 493.28094, "r": 211.64659, "b": 502.12772, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "l", "bbox": {"l": 124.33002, "t": 508.22495, "r": 127.30286, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "=", "bbox": {"l": 130.26602, "t": 508.22495, "r": 138.01494, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "\u03bbl$_{s}$", "bbox": {"l": 140.78203, "t": 508.22495, "r": 153.32629, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "+ (1", "bbox": {"l": 156.03903, "t": 508.22495, "r": 174.85541, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "\u2212", "bbox": {"l": 177.07103, "t": 507.66702, "r": 184.81995, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "\u03bb", "bbox": {"l": 187.03304, "t": 508.22495, "r": 192.84422, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": ")", "bbox": {"l": 192.84503, "t": 508.22495, "r": 196.71948, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "l$_{box}$", "bbox": {"l": 196.71902, "t": 508.22495, "r": 211.64583, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "(1)", "bbox": {"l": 274.74603, "t": 501.01132, "r": 286.36243, "b": 509.91788, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "where", "bbox": {"l": 50.11203, "t": 531.30933, "r": 74.450661, "b": 540.21588, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "\u03bb", "bbox": {"l": 76.941032, "t": 531.14993, "r": 82.75222, "b": 539.9967, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "\u2208", "bbox": {"l": 85.520035, "t": 530.5920100000001, "r": 92.162102, "b": 539.9967, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "[0, 1], and", "bbox": {"l": 94.653038, "t": 531.30933, "r": 135.59932, "b": 540.21588, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "\u03bb$_{iou}$, \u03bb$_{l}$$_{1}$", "bbox": {"l": 138.09004, "t": 531.14993, "r": 172.63162, "b": 539.9967, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "\u2208$_{R}$", "bbox": {"l": 175.89705, "t": 530.5920100000001, "r": 192.50104, "b": 539.9967, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "are hyper-parameters.", "bbox": {"l": 194.99205, "t": 531.30933, "r": 281.59692, "b": 540.21588, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "5.", "bbox": {"l": 50.112045, "t": 555.91689, "r": 57.92831799999999, "b": 566.66461, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "Experimental Results", "bbox": {"l": 68.350014, "t": 555.91689, "r": 171.98335, "b": 566.66461, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "5.1.", "bbox": {"l": 50.112045, "t": 576.26433, "r": 64.693237, "b": 586.1163799999999, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "Implementation Details", "bbox": {"l": 74.414032, "t": 576.26433, "r": 179.17502, "b": 586.1163799999999, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "TableFormer uses ResNet-18 as the", "bbox": {"l": 62.067047, "t": 595.73433, "r": 202.97806, "b": 604.64088, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "CNN Backbone Net-", "bbox": {"l": 205.38405, "t": 595.82399, "r": 286.36008, "b": 604.41174, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "work", "bbox": {"l": 50.112045, "t": 607.77899, "r": 70.037247, "b": 616.3667399999999, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": ". The input images are resized to 448*448 pixels and", "bbox": {"l": 70.037048, "t": 607.68933, "r": 286.36496, "b": 616.59589, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "the feature map has a dimension of 28*28. Additionally, we", "bbox": {"l": 50.112049, "t": 619.64433, "r": 286.36517, "b": 628.55089, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "enforce the following input constraints:", "bbox": {"l": 50.112049, "t": 631.60033, "r": 207.03294, "b": 640.50688, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "Image width and height", "bbox": {"l": 91.661049, "t": 654.54532, "r": 186.01683, "b": 663.45187, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "\u2264", "bbox": {"l": 188.50705, "t": 653.828, "r": 196.25597, "b": 663.2327, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "1024 pixels", "bbox": {"l": 198.74605, "t": 654.54532, "r": 244.81310999999997, "b": 663.45187, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "Structural tags length", "bbox": {"l": 101.01604, "t": 669.48932, "r": 186.24606, "b": 678.39588, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "\u2264", "bbox": {"l": 188.73605, "t": 668.77201, "r": 196.48497, "b": 678.1767, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "512 tokens.", "bbox": {"l": 198.97505, "t": 669.48932, "r": 244.81296999999998, "b": 678.39588, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "(2)", "bbox": {"l": 274.74606, "t": 662.11731, "r": 286.36246, "b": 671.02388, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "Although input constraints are used also by other methods,", "bbox": {"l": 50.112061, "t": 692.290314, "r": 286.36514, "b": 701.196877, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "such as EDD, ours are less restrictive due to the improved", "bbox": {"l": 50.112061, "t": 704.245316, "r": 286.36514, "b": 713.151878, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "runtime performance and lower memory footprint of Table-", "bbox": {"l": 308.86206, "t": 75.20830999999998, "r": 545.11523, "b": 84.11487, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Former.", "bbox": {"l": 308.86206, "t": 87.16332999999997, "r": 339.98523, "b": 96.06988999999999, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "This allows to utilize input samples with longer", "bbox": {"l": 346.88931, "t": 87.16332999999997, "r": 545.11523, "b": 96.06988999999999, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "sequences and images with larger dimensions.", "bbox": {"l": 308.86206, "t": 99.11835000000008, "r": 492.96097, "b": 108.0249, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "The Transformer Encoder consists of two \u201cTransformer", "bbox": {"l": 320.81705, "t": 116.22937000000002, "r": 545.11499, "b": 125.13593000000003, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "Encoder Layers\u201d, with an input feature size of 512, feed", "bbox": {"l": 308.86206, "t": 128.18439, "r": 545.11517, "b": 137.09094000000005, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "forward network of 1024, and 4 attention heads. As for the", "bbox": {"l": 308.86206, "t": 140.13940000000002, "r": 545.11505, "b": 149.04596000000004, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "Transformer Decoder it is composed of four \u201cTransformer", "bbox": {"l": 308.86206, "t": 152.09442, "r": 545.11511, "b": 161.00098000000003, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "Decoder Layers\u201d with similar input and output dimensions", "bbox": {"l": 308.86206, "t": 164.04944, "r": 545.11517, "b": 172.95599000000004, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "as the \u201cTransformer Encoder Layers\u201d.", "bbox": {"l": 308.86206, "t": 176.00543000000005, "r": 467.21756000000005, "b": 184.91198999999995, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "Even though our", "bbox": {"l": 475.43671, "t": 176.00543000000005, "r": 545.11511, "b": 184.91198999999995, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "model uses fewer layers and heads than the default imple-", "bbox": {"l": 308.86206, "t": 187.96045000000004, "r": 545.11511, "b": 196.86699999999996, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "mentation parameters, our extensive experimentation has", "bbox": {"l": 308.86206, "t": 199.91547000000003, "r": 545.11511, "b": 208.82201999999995, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "proved this setup to be more suitable for table images. We", "bbox": {"l": 308.86206, "t": 211.87048000000004, "r": 545.11517, "b": 220.77704000000006, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "attribute this finding to the inherent design of table im-", "bbox": {"l": 308.86206, "t": 223.82550000000003, "r": 545.11511, "b": 232.73206000000005, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "ages, which contain mostly lines and text, unlike the more", "bbox": {"l": 308.86206, "t": 235.78052000000002, "r": 545.11511, "b": 244.68706999999995, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "elaborate content present in other scopes (e.g. the COCO", "bbox": {"l": 308.86206, "t": 247.73650999999995, "r": 545.11523, "b": 256.64306999999997, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "dataset).", "bbox": {"l": 308.86206, "t": 259.69152999999994, "r": 342.3364, "b": 268.59808, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "Moreover, we have added ResNet blocks to the", "bbox": {"l": 348.95157, "t": 259.69152999999994, "r": 545.11517, "b": 268.59808, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "inputs of the Structure Decoder and Cell BBox Decoder.", "bbox": {"l": 308.86206, "t": 271.64655000000005, "r": 545.11517, "b": 280.55310000000003, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "This prevents a decoder having a stronger influence over the", "bbox": {"l": 308.86206, "t": 283.6015300000001, "r": 545.1153, "b": 292.50809, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "learned weights which would damage the other prediction", "bbox": {"l": 308.86206, "t": 295.55652, "r": 545.11511, "b": 304.46307, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "task (structure vs bounding boxes), but learn task specific", "bbox": {"l": 308.86206, "t": 307.51151, "r": 545.11511, "b": 316.41806, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "weights instead. Lastly our dropout layers are set to 0.5.", "bbox": {"l": 308.86206, "t": 319.4674999999999, "r": 532.48267, "b": 328.37405, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "For training, TableFormer is trained with 3 Adam opti-", "bbox": {"l": 320.81705, "t": 336.57751, "r": 545.11499, "b": 345.48407000000003, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "mizers, each one for the", "bbox": {"l": 308.86206, "t": 348.5325000000001, "r": 403.7359, "b": 357.43906, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "CNN Backbone Network", "bbox": {"l": 406.07605, "t": 348.62216, "r": 503.54016, "b": 357.20993, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": ",", "bbox": {"l": 503.53906, "t": 348.5325000000001, "r": 506.02972, "b": 357.43906, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "Structure", "bbox": {"l": 508.40004999999996, "t": 348.62216, "r": 545.11224, "b": 357.20993, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "Decoder", "bbox": {"l": 308.86206, "t": 360.57715, "r": 343.1633, "b": 369.16492000000005, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": ", and", "bbox": {"l": 343.16306, "t": 360.48749, "r": 362.2016, "b": 369.39404, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Cell BBox Decoder", "bbox": {"l": 364.28604, "t": 360.57715, "r": 440.93829, "b": 369.16492000000005, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": ". Taking the PubTabNet as", "bbox": {"l": 440.93903, "t": 360.48749, "r": 545.10797, "b": 369.39404, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "an example for our parameter set up, the initializing learn-", "bbox": {"l": 308.86203, "t": 372.44247, "r": 545.11511, "b": 381.34903, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "ing rate is 0.001 for 12 epochs with a batch size of 24, and", "bbox": {"l": 308.86203, "t": 384.3984699999999, "r": 545.11517, "b": 393.30502, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "\u03bb", "bbox": {"l": 308.86203, "t": 396.19406000000004, "r": 314.67322, "b": 405.04083, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "set to 0.5.", "bbox": {"l": 318.65802, "t": 396.35345, "r": 360.39139, "b": 405.2600100000001, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "Afterwards, we reduce the learning rate to", "bbox": {"l": 367.96295, "t": 396.35345, "r": 545.10803, "b": 405.2600100000001, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "0.0001, the batch size to 18 and train for 12 more epochs or", "bbox": {"l": 308.86203, "t": 408.30844, "r": 545.11511, "b": 417.215, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "convergence.", "bbox": {"l": 308.86203, "t": 420.26343, "r": 360.9664, "b": 429.16998, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "TableFormer is implemented with PyTorch and Torchvi-", "bbox": {"l": 320.81702, "t": 437.37441999999993, "r": 545.11499, "b": 446.28098, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "sion libraries [22].", "bbox": {"l": 308.86203, "t": 449.32941, "r": 384.62759, "b": 458.23596, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "To speed up the inference, the image", "bbox": {"l": 391.37228, "t": 449.32941, "r": 545.11511, "b": 458.23596, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "undergoes a single forward pass through the", "bbox": {"l": 308.86203, "t": 461.28439, "r": 494.00693000000007, "b": 470.19095, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "CNN Back-", "bbox": {"l": 498.07803, "t": 461.37405, "r": 545.11145, "b": 469.96182, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "bone Network", "bbox": {"l": 308.86203, "t": 473.32904, "r": 364.44336, "b": 481.91681, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "and transformer encoder. This eliminates the", "bbox": {"l": 367.06104, "t": 473.23938, "r": 545.11267, "b": 482.14594, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "overhead of generating the same features for each decoding", "bbox": {"l": 308.86203, "t": 485.19437, "r": 545.11511, "b": 494.10092, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "step. Similarly, we employ a \u2019caching\u2019 technique to preform", "bbox": {"l": 308.86203, "t": 497.14935, "r": 545.11523, "b": 506.05591, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "faster autoregressive decoding. This is achieved by storing", "bbox": {"l": 308.86203, "t": 509.10535, "r": 545.11511, "b": 518.0119, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "the features of decoded tokens so we can reuse them for", "bbox": {"l": 308.86203, "t": 521.06033, "r": 545.11517, "b": 529.9668899999999, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "each time step. Therefore, we only compute the attention", "bbox": {"l": 308.86203, "t": 533.01532, "r": 545.11517, "b": 541.9218900000001, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "for each new tag.", "bbox": {"l": 308.86203, "t": 544.97034, "r": 377.21548, "b": 553.87689, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "5.2.", "bbox": {"l": 308.86203, "t": 579.55432, "r": 323.9046, "b": 589.40637, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "Generalization", "bbox": {"l": 333.93301, "t": 579.55432, "r": 397.44281, "b": 589.40637, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "TableFormer is evaluated on three major publicly avail-", "bbox": {"l": 320.81702, "t": 603.44933, "r": 545.11493, "b": 612.3558800000001, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "able datasets of different nature to prove the generalization", "bbox": {"l": 308.86203, "t": 615.40433, "r": 545.11511, "b": 624.31088, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "and effectiveness of our model. The datasets used for eval-", "bbox": {"l": 308.86203, "t": 627.35933, "r": 545.11517, "b": 636.26588, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "uation are the PubTabNet, FinTabNet and TableBank which", "bbox": {"l": 308.86203, "t": 639.31433, "r": 545.11511, "b": 648.22089, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "stem from the scientific, financial and general domains re-", "bbox": {"l": 308.86203, "t": 651.27032, "r": 545.11517, "b": 660.17688, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "spectively.", "bbox": {"l": 308.86203, "t": 663.22533, "r": 350.70493, "b": 672.13189, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "We also share our baseline results on the challenging", "bbox": {"l": 320.81702, "t": 680.33533, "r": 545.11505, "b": 689.24189, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "SynthTabNet dataset.", "bbox": {"l": 308.86203, "t": 692.290329, "r": 396.21411, "b": 701.196892, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "Throughout our experiments, the", "bbox": {"l": 406.40585, "t": 692.290329, "r": 545.11523, "b": 701.196892, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "same parameters stated in Sec. 5.1 are utilized.", "bbox": {"l": 308.86203, "t": 704.246323, "r": 495.93982, "b": 713.152893, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "6", "bbox": {"l": 295.12103, "t": 734.133327, "r": 300.10233, "b": 743.03989, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 5, "label": "text", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 286.36514, "b": 155.84600999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.9868088960647583, "cells": [{"id": 0, "text": "tention encoding is then multiplied to the encoded image to", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 286.36514, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "produce a feature for each table cell. Notice that this is dif-", "bbox": {"l": 50.112, "t": 87.16339000000005, "r": 286.36508, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "ferent than the typical object detection problem where im-", "bbox": {"l": 50.112, "t": 99.11841000000004, "r": 286.36508, "b": 108.02495999999985, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "balances between the number of detections and the amount", "bbox": {"l": 50.112, "t": 111.07343000000003, "r": 286.36508, "b": 119.97997999999984, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "of objects may exist. In our case, we know up front that", "bbox": {"l": 50.112, "t": 123.02844000000005, "r": 286.36508, "b": 131.93499999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "the produced detections always match with the table cells", "bbox": {"l": 50.112, "t": 134.98443999999995, "r": 286.36514, "b": 143.89099, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "in number and correspondence.", "bbox": {"l": 50.112, "t": 146.93944999999997, "r": 175.16254, "b": 155.84600999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "text", "bbox": {"l": 50.112, "t": 159.62445000000002, "r": 286.36511, "b": 240.26306, "coord_origin": "TOPLEFT"}, "confidence": 0.9860327839851379, "cells": [{"id": 7, "text": "The output features for each table cell are then fed", "bbox": {"l": 62.067001, "t": 159.62445000000002, "r": 286.36496, "b": 168.53101000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "into the feed-forward network (FFN). The FFN consists", "bbox": {"l": 50.112, "t": 171.58043999999995, "r": 286.36511, "b": 180.48699999999997, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "of a Multi-Layer Perceptron (3 layers with ReLU activa-", "bbox": {"l": 50.112, "t": 183.53545999999994, "r": 286.36511, "b": 192.44201999999996, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "tion function) that predicts the normalized coordinates for", "bbox": {"l": 50.112, "t": 195.49048000000005, "r": 286.36511, "b": 204.39702999999997, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "the bounding box of each table cell. Finally, the predicted", "bbox": {"l": 50.112, "t": 207.44550000000004, "r": 286.36511, "b": 216.35204999999996, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "bounding boxes are classified based on whether they are", "bbox": {"l": 50.112, "t": 219.40051000000005, "r": 286.36511, "b": 228.30706999999995, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "empty or not using a linear layer.", "bbox": {"l": 50.112, "t": 231.35650999999996, "r": 181.54855, "b": 240.26306, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "text", "bbox": {"l": 50.112, "t": 243.92193999999995, "r": 286.36572, "b": 444.2309, "coord_origin": "TOPLEFT"}, "confidence": 0.987363874912262, "cells": [{"id": 14, "text": "Loss Functions.", "bbox": {"l": 62.067001, "t": 243.92193999999995, "r": 129.21492, "b": 252.87829999999997, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "We formulate a multi-task loss Eq. 2", "bbox": {"l": 134.451, "t": 244.04150000000004, "r": 286.36078, "b": 252.94806000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "to train our network. The Cross-Entropy loss (denoted as", "bbox": {"l": 50.112007, "t": 255.99652000000003, "r": 286.36511, "b": 264.90308000000005, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "l$_{s}$", "bbox": {"l": 50.112007, "t": 267.79309, "r": 56.84528, "b": 276.63989000000004, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": ") is used to train the", "bbox": {"l": 57.343006, "t": 267.95250999999996, "r": 135.39996, "b": 276.85907, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Structure Decoder", "bbox": {"l": 137.735, "t": 268.04218000000003, "r": 211.07965, "b": 276.62994000000003, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "which predicts the", "bbox": {"l": 213.63699, "t": 267.95250999999996, "r": 286.36395, "b": 276.85907, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "structure tokens. As for the", "bbox": {"l": 50.112, "t": 279.90747, "r": 158.82388, "b": 288.81406, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "Cell BBox Decoder", "bbox": {"l": 161.31799, "t": 279.99712999999997, "r": 238.79712, "b": 288.58493, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "it is trained", "bbox": {"l": 241.521, "t": 279.90747, "r": 286.36264, "b": 288.81406, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "with a combination of losses denoted as", "bbox": {"l": 50.112, "t": 291.86249, "r": 211.3766, "b": 300.76904, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "l$_{box}$", "bbox": {"l": 214.271, "t": 291.70309, "r": 229.19780000000003, "b": 300.54987, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": ".", "bbox": {"l": 229.696, "t": 291.86249, "r": 232.18665000000001, "b": 300.76904, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "l$_{box}$", "bbox": {"l": 236.49001, "t": 291.70309, "r": 251.41681000000003, "b": 300.54987, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "consists", "bbox": {"l": 254.81099999999998, "t": 291.86249, "r": 286.36255, "b": 300.76904, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "of the generally used", "bbox": {"l": 50.112, "t": 303.81747, "r": 137.45412, "b": 312.72403, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "l$_{1}$", "bbox": {"l": 141.298, "t": 303.65808, "r": 148.24258, "b": 312.50485, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "loss for object detection and the", "bbox": {"l": 152.58601, "t": 303.81747, "r": 286.36377, "b": 312.72403, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "IoU loss (", "bbox": {"l": 50.112015, "t": 315.77245999999997, "r": 89.683464, "b": 324.67902, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "l$_{iou}$", "bbox": {"l": 89.68602, "t": 315.61307, "r": 104.12046, "b": 324.45984, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": ") to be scale invariant as explained in [25]. In", "bbox": {"l": 104.61802, "t": 315.77245999999997, "r": 286.36572, "b": 324.67902, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "comparison to DETR, we do not use the Hungarian algo-", "bbox": {"l": 50.112019, "t": 327.72845, "r": 286.36511, "b": 336.6350100000001, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "rithm [15] to match the predicted bounding boxes with the", "bbox": {"l": 50.112019, "t": 339.68344, "r": 286.36508, "b": 348.59, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "ground-truth boxes, as we have already achieved a one-to-", "bbox": {"l": 50.112019, "t": 351.63843, "r": 286.36511, "b": 360.54498, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "one match through two steps: 1) Our token input sequence", "bbox": {"l": 50.112019, "t": 363.59341, "r": 286.36508, "b": 372.49996999999996, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "is naturally ordered, therefore the hidden states of the table", "bbox": {"l": 50.112019, "t": 375.5484, "r": 286.36511, "b": 384.45496, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "data cells are also in order when they are provided as in-", "bbox": {"l": 50.112019, "t": 387.50339, "r": 286.36514, "b": 396.40994, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "put to the", "bbox": {"l": 50.112019, "t": 399.45938, "r": 88.68721, "b": 408.36594, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "Cell BBox Decoder", "bbox": {"l": 91.646019, "t": 399.54904, "r": 170.0517, "b": 408.13681, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": ", and 2) Our bounding boxes", "bbox": {"l": 170.05103, "t": 399.45938, "r": 286.36438, "b": 408.36594, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "generation mechanism (see Sec.", "bbox": {"l": 50.112022, "t": 411.41437, "r": 181.96703, "b": 420.32092, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "3)", "bbox": {"l": 189.09029, "t": 411.41437, "r": 197.74918, "b": 420.32092, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "ensures a one-to-one", "bbox": {"l": 200.34789, "t": 411.41437, "r": 286.36511, "b": 420.32092, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "mapping between the cell content and its bounding box for", "bbox": {"l": 50.112022, "t": 423.36934999999994, "r": 286.36511, "b": 432.27591, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "all post-processed datasets.", "bbox": {"l": 50.112022, "t": 435.32434, "r": 158.2959, "b": 444.2309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 50.112022, "t": 448.01035, "r": 286.36499, "b": 468.87189, "coord_origin": "TOPLEFT"}, "confidence": 0.9724196195602417, "cells": [{"id": 49, "text": "The loss used to train the TableFormer can be defined as", "bbox": {"l": 62.067024, "t": 448.01035, "r": 286.36499, "b": 456.9169, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "following:", "bbox": {"l": 50.112022, "t": 459.96533, "r": 91.377113, "b": 468.87189, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "formula", "bbox": {"l": 124.33002, "t": 493.28094, "r": 286.36243, "b": 517.07172, "coord_origin": "TOPLEFT"}, "confidence": 0.9423347115516663, "cells": [{"id": 51, "text": "l$_{box}$", "bbox": {"l": 125.71502, "t": 493.28094, "r": 140.64182, "b": 502.12772, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "=", "bbox": {"l": 143.90701, "t": 493.28094, "r": 151.65593, "b": 502.12772, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "\u03bb$_{iou}$l$_{iou}$", "bbox": {"l": 154.42302, "t": 493.28094, "r": 186.62846, "b": 502.12772, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "+", "bbox": {"l": 189.34003, "t": 493.28094, "r": 197.08894, "b": 502.12772, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "\u03bb$_{l}$$_{1}$", "bbox": {"l": 199.30302, "t": 493.28094, "r": 211.64659, "b": 502.12772, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "l", "bbox": {"l": 124.33002, "t": 508.22495, "r": 127.30286, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "=", "bbox": {"l": 130.26602, "t": 508.22495, "r": 138.01494, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "\u03bbl$_{s}$", "bbox": {"l": 140.78203, "t": 508.22495, "r": 153.32629, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "+ (1", "bbox": {"l": 156.03903, "t": 508.22495, "r": 174.85541, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "\u2212", "bbox": {"l": 177.07103, "t": 507.66702, "r": 184.81995, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "\u03bb", "bbox": {"l": 187.03304, "t": 508.22495, "r": 192.84422, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": ")", "bbox": {"l": 192.84503, "t": 508.22495, "r": 196.71948, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "l$_{box}$", "bbox": {"l": 196.71902, "t": 508.22495, "r": 211.64583, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "(1)", "bbox": {"l": 274.74603, "t": 501.01132, "r": 286.36243, "b": 509.91788, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 50.11203, "t": 530.5920100000001, "r": 281.59692, "b": 540.21588, "coord_origin": "TOPLEFT"}, "confidence": 0.9363929629325867, "cells": [{"id": 65, "text": "where", "bbox": {"l": 50.11203, "t": 531.30933, "r": 74.450661, "b": 540.21588, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "\u03bb", "bbox": {"l": 76.941032, "t": 531.14993, "r": 82.75222, "b": 539.9967, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "\u2208", "bbox": {"l": 85.520035, "t": 530.5920100000001, "r": 92.162102, "b": 539.9967, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "[0, 1], and", "bbox": {"l": 94.653038, "t": 531.30933, "r": 135.59932, "b": 540.21588, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "\u03bb$_{iou}$, \u03bb$_{l}$$_{1}$", "bbox": {"l": 138.09004, "t": 531.14993, "r": 172.63162, "b": 539.9967, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "\u2208$_{R}$", "bbox": {"l": 175.89705, "t": 530.5920100000001, "r": 192.50104, "b": 539.9967, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "are hyper-parameters.", "bbox": {"l": 194.99205, "t": 531.30933, "r": 281.59692, "b": 540.21588, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "section_header", "bbox": {"l": 50.112045, "t": 555.91689, "r": 171.98335, "b": 566.66461, "coord_origin": "TOPLEFT"}, "confidence": 0.9554555416107178, "cells": [{"id": 72, "text": "5.", "bbox": {"l": 50.112045, "t": 555.91689, "r": 57.92831799999999, "b": 566.66461, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "Experimental Results", "bbox": {"l": 68.350014, "t": 555.91689, "r": 171.98335, "b": 566.66461, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "section_header", "bbox": {"l": 50.112045, "t": 576.26433, "r": 179.17502, "b": 586.1163799999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9538504481315613, "cells": [{"id": 74, "text": "5.1.", "bbox": {"l": 50.112045, "t": 576.26433, "r": 64.693237, "b": 586.1163799999999, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "Implementation Details", "bbox": {"l": 74.414032, "t": 576.26433, "r": 179.17502, "b": 586.1163799999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "text", "bbox": {"l": 50.112045, "t": 595.73433, "r": 286.36517, "b": 640.50688, "coord_origin": "TOPLEFT"}, "confidence": 0.9856163263320923, "cells": [{"id": 76, "text": "TableFormer uses ResNet-18 as the", "bbox": {"l": 62.067047, "t": 595.73433, "r": 202.97806, "b": 604.64088, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "CNN Backbone Net-", "bbox": {"l": 205.38405, "t": 595.82399, "r": 286.36008, "b": 604.41174, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "work", "bbox": {"l": 50.112045, "t": 607.77899, "r": 70.037247, "b": 616.3667399999999, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": ". The input images are resized to 448*448 pixels and", "bbox": {"l": 70.037048, "t": 607.68933, "r": 286.36496, "b": 616.59589, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "the feature map has a dimension of 28*28. Additionally, we", "bbox": {"l": 50.112049, "t": 619.64433, "r": 286.36517, "b": 628.55089, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "enforce the following input constraints:", "bbox": {"l": 50.112049, "t": 631.60033, "r": 207.03294, "b": 640.50688, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "formula", "bbox": {"l": 91.661049, "t": 653.828, "r": 286.36246, "b": 678.39588, "coord_origin": "TOPLEFT"}, "confidence": 0.8441831469535828, "cells": [{"id": 82, "text": "Image width and height", "bbox": {"l": 91.661049, "t": 654.54532, "r": 186.01683, "b": 663.45187, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "\u2264", "bbox": {"l": 188.50705, "t": 653.828, "r": 196.25597, "b": 663.2327, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "1024 pixels", "bbox": {"l": 198.74605, "t": 654.54532, "r": 244.81310999999997, "b": 663.45187, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "Structural tags length", "bbox": {"l": 101.01604, "t": 669.48932, "r": 186.24606, "b": 678.39588, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "\u2264", "bbox": {"l": 188.73605, "t": 668.77201, "r": 196.48497, "b": 678.1767, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "512 tokens.", "bbox": {"l": 198.97505, "t": 669.48932, "r": 244.81296999999998, "b": 678.39588, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "(2)", "bbox": {"l": 274.74606, "t": 662.11731, "r": 286.36246, "b": 671.02388, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "text", "bbox": {"l": 50.112061, "t": 692.290314, "r": 286.36514, "b": 713.151878, "coord_origin": "TOPLEFT"}, "confidence": 0.9724979996681213, "cells": [{"id": 89, "text": "Although input constraints are used also by other methods,", "bbox": {"l": 50.112061, "t": 692.290314, "r": 286.36514, "b": 701.196877, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "such as EDD, ours are less restrictive due to the improved", "bbox": {"l": 50.112061, "t": 704.245316, "r": 286.36514, "b": 713.151878, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 308.86206, "t": 75.20830999999998, "r": 545.11523, "b": 108.0249, "coord_origin": "TOPLEFT"}, "confidence": 0.9799237847328186, "cells": [{"id": 91, "text": "runtime performance and lower memory footprint of Table-", "bbox": {"l": 308.86206, "t": 75.20830999999998, "r": 545.11523, "b": 84.11487, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Former.", "bbox": {"l": 308.86206, "t": 87.16332999999997, "r": 339.98523, "b": 96.06988999999999, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "This allows to utilize input samples with longer", "bbox": {"l": 346.88931, "t": 87.16332999999997, "r": 545.11523, "b": 96.06988999999999, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "sequences and images with larger dimensions.", "bbox": {"l": 308.86206, "t": 99.11835000000008, "r": 492.96097, "b": 108.0249, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 308.86206, "t": 116.22937000000002, "r": 545.1153, "b": 328.37405, "coord_origin": "TOPLEFT"}, "confidence": 0.9880929589271545, "cells": [{"id": 95, "text": "The Transformer Encoder consists of two \u201cTransformer", "bbox": {"l": 320.81705, "t": 116.22937000000002, "r": 545.11499, "b": 125.13593000000003, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "Encoder Layers\u201d, with an input feature size of 512, feed", "bbox": {"l": 308.86206, "t": 128.18439, "r": 545.11517, "b": 137.09094000000005, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "forward network of 1024, and 4 attention heads. As for the", "bbox": {"l": 308.86206, "t": 140.13940000000002, "r": 545.11505, "b": 149.04596000000004, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "Transformer Decoder it is composed of four \u201cTransformer", "bbox": {"l": 308.86206, "t": 152.09442, "r": 545.11511, "b": 161.00098000000003, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "Decoder Layers\u201d with similar input and output dimensions", "bbox": {"l": 308.86206, "t": 164.04944, "r": 545.11517, "b": 172.95599000000004, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "as the \u201cTransformer Encoder Layers\u201d.", "bbox": {"l": 308.86206, "t": 176.00543000000005, "r": 467.21756000000005, "b": 184.91198999999995, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "Even though our", "bbox": {"l": 475.43671, "t": 176.00543000000005, "r": 545.11511, "b": 184.91198999999995, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "model uses fewer layers and heads than the default imple-", "bbox": {"l": 308.86206, "t": 187.96045000000004, "r": 545.11511, "b": 196.86699999999996, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "mentation parameters, our extensive experimentation has", "bbox": {"l": 308.86206, "t": 199.91547000000003, "r": 545.11511, "b": 208.82201999999995, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "proved this setup to be more suitable for table images. We", "bbox": {"l": 308.86206, "t": 211.87048000000004, "r": 545.11517, "b": 220.77704000000006, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "attribute this finding to the inherent design of table im-", "bbox": {"l": 308.86206, "t": 223.82550000000003, "r": 545.11511, "b": 232.73206000000005, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "ages, which contain mostly lines and text, unlike the more", "bbox": {"l": 308.86206, "t": 235.78052000000002, "r": 545.11511, "b": 244.68706999999995, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "elaborate content present in other scopes (e.g. the COCO", "bbox": {"l": 308.86206, "t": 247.73650999999995, "r": 545.11523, "b": 256.64306999999997, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "dataset).", "bbox": {"l": 308.86206, "t": 259.69152999999994, "r": 342.3364, "b": 268.59808, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "Moreover, we have added ResNet blocks to the", "bbox": {"l": 348.95157, "t": 259.69152999999994, "r": 545.11517, "b": 268.59808, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "inputs of the Structure Decoder and Cell BBox Decoder.", "bbox": {"l": 308.86206, "t": 271.64655000000005, "r": 545.11517, "b": 280.55310000000003, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "This prevents a decoder having a stronger influence over the", "bbox": {"l": 308.86206, "t": 283.6015300000001, "r": 545.1153, "b": 292.50809, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "learned weights which would damage the other prediction", "bbox": {"l": 308.86206, "t": 295.55652, "r": 545.11511, "b": 304.46307, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "task (structure vs bounding boxes), but learn task specific", "bbox": {"l": 308.86206, "t": 307.51151, "r": 545.11511, "b": 316.41806, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "weights instead. Lastly our dropout layers are set to 0.5.", "bbox": {"l": 308.86206, "t": 319.4674999999999, "r": 532.48267, "b": 328.37405, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 308.86203, "t": 336.57751, "r": 545.11517, "b": 429.16998, "coord_origin": "TOPLEFT"}, "confidence": 0.9877589344978333, "cells": [{"id": 115, "text": "For training, TableFormer is trained with 3 Adam opti-", "bbox": {"l": 320.81705, "t": 336.57751, "r": 545.11499, "b": 345.48407000000003, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "mizers, each one for the", "bbox": {"l": 308.86206, "t": 348.5325000000001, "r": 403.7359, "b": 357.43906, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "CNN Backbone Network", "bbox": {"l": 406.07605, "t": 348.62216, "r": 503.54016, "b": 357.20993, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": ",", "bbox": {"l": 503.53906, "t": 348.5325000000001, "r": 506.02972, "b": 357.43906, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "Structure", "bbox": {"l": 508.40004999999996, "t": 348.62216, "r": 545.11224, "b": 357.20993, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "Decoder", "bbox": {"l": 308.86206, "t": 360.57715, "r": 343.1633, "b": 369.16492000000005, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": ", and", "bbox": {"l": 343.16306, "t": 360.48749, "r": 362.2016, "b": 369.39404, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Cell BBox Decoder", "bbox": {"l": 364.28604, "t": 360.57715, "r": 440.93829, "b": 369.16492000000005, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": ". Taking the PubTabNet as", "bbox": {"l": 440.93903, "t": 360.48749, "r": 545.10797, "b": 369.39404, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "an example for our parameter set up, the initializing learn-", "bbox": {"l": 308.86203, "t": 372.44247, "r": 545.11511, "b": 381.34903, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "ing rate is 0.001 for 12 epochs with a batch size of 24, and", "bbox": {"l": 308.86203, "t": 384.3984699999999, "r": 545.11517, "b": 393.30502, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "\u03bb", "bbox": {"l": 308.86203, "t": 396.19406000000004, "r": 314.67322, "b": 405.04083, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "set to 0.5.", "bbox": {"l": 318.65802, "t": 396.35345, "r": 360.39139, "b": 405.2600100000001, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "Afterwards, we reduce the learning rate to", "bbox": {"l": 367.96295, "t": 396.35345, "r": 545.10803, "b": 405.2600100000001, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "0.0001, the batch size to 18 and train for 12 more epochs or", "bbox": {"l": 308.86203, "t": 408.30844, "r": 545.11511, "b": 417.215, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "convergence.", "bbox": {"l": 308.86203, "t": 420.26343, "r": 360.9664, "b": 429.16998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 308.86203, "t": 437.37441999999993, "r": 545.11523, "b": 553.87689, "coord_origin": "TOPLEFT"}, "confidence": 0.9884491562843323, "cells": [{"id": 131, "text": "TableFormer is implemented with PyTorch and Torchvi-", "bbox": {"l": 320.81702, "t": 437.37441999999993, "r": 545.11499, "b": 446.28098, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "sion libraries [22].", "bbox": {"l": 308.86203, "t": 449.32941, "r": 384.62759, "b": 458.23596, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "To speed up the inference, the image", "bbox": {"l": 391.37228, "t": 449.32941, "r": 545.11511, "b": 458.23596, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "undergoes a single forward pass through the", "bbox": {"l": 308.86203, "t": 461.28439, "r": 494.00693000000007, "b": 470.19095, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "CNN Back-", "bbox": {"l": 498.07803, "t": 461.37405, "r": 545.11145, "b": 469.96182, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "bone Network", "bbox": {"l": 308.86203, "t": 473.32904, "r": 364.44336, "b": 481.91681, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "and transformer encoder. This eliminates the", "bbox": {"l": 367.06104, "t": 473.23938, "r": 545.11267, "b": 482.14594, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "overhead of generating the same features for each decoding", "bbox": {"l": 308.86203, "t": 485.19437, "r": 545.11511, "b": 494.10092, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "step. Similarly, we employ a \u2019caching\u2019 technique to preform", "bbox": {"l": 308.86203, "t": 497.14935, "r": 545.11523, "b": 506.05591, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "faster autoregressive decoding. This is achieved by storing", "bbox": {"l": 308.86203, "t": 509.10535, "r": 545.11511, "b": 518.0119, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "the features of decoded tokens so we can reuse them for", "bbox": {"l": 308.86203, "t": 521.06033, "r": 545.11517, "b": 529.9668899999999, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "each time step. Therefore, we only compute the attention", "bbox": {"l": 308.86203, "t": 533.01532, "r": 545.11517, "b": 541.9218900000001, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "for each new tag.", "bbox": {"l": 308.86203, "t": 544.97034, "r": 377.21548, "b": 553.87689, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "section_header", "bbox": {"l": 308.86203, "t": 579.55432, "r": 397.44281, "b": 589.40637, "coord_origin": "TOPLEFT"}, "confidence": 0.9450808167457581, "cells": [{"id": 144, "text": "5.2.", "bbox": {"l": 308.86203, "t": 579.55432, "r": 323.9046, "b": 589.40637, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "Generalization", "bbox": {"l": 333.93301, "t": 579.55432, "r": 397.44281, "b": 589.40637, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 308.86203, "t": 603.44933, "r": 545.11517, "b": 672.13189, "coord_origin": "TOPLEFT"}, "confidence": 0.9880596995353699, "cells": [{"id": 146, "text": "TableFormer is evaluated on three major publicly avail-", "bbox": {"l": 320.81702, "t": 603.44933, "r": 545.11493, "b": 612.3558800000001, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "able datasets of different nature to prove the generalization", "bbox": {"l": 308.86203, "t": 615.40433, "r": 545.11511, "b": 624.31088, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "and effectiveness of our model. The datasets used for eval-", "bbox": {"l": 308.86203, "t": 627.35933, "r": 545.11517, "b": 636.26588, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "uation are the PubTabNet, FinTabNet and TableBank which", "bbox": {"l": 308.86203, "t": 639.31433, "r": 545.11511, "b": 648.22089, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "stem from the scientific, financial and general domains re-", "bbox": {"l": 308.86203, "t": 651.27032, "r": 545.11517, "b": 660.17688, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "spectively.", "bbox": {"l": 308.86203, "t": 663.22533, "r": 350.70493, "b": 672.13189, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "text", "bbox": {"l": 308.86203, "t": 680.33533, "r": 545.11523, "b": 713.152893, "coord_origin": "TOPLEFT"}, "confidence": 0.9830910563468933, "cells": [{"id": 152, "text": "We also share our baseline results on the challenging", "bbox": {"l": 320.81702, "t": 680.33533, "r": 545.11505, "b": 689.24189, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "SynthTabNet dataset.", "bbox": {"l": 308.86203, "t": 692.290329, "r": 396.21411, "b": 701.196892, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "Throughout our experiments, the", "bbox": {"l": 406.40585, "t": 692.290329, "r": 545.11523, "b": 701.196892, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "same parameters stated in Sec. 5.1 are utilized.", "bbox": {"l": 308.86203, "t": 704.246323, "r": 495.93982, "b": 713.152893, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "page_footer", "bbox": {"l": 295.12103, "t": 734.133327, "r": 300.10233, "b": 743.03989, "coord_origin": "TOPLEFT"}, "confidence": 0.8820405602455139, "cells": [{"id": 156, "text": "6", "bbox": {"l": 295.12103, "t": 734.133327, "r": 300.10233, "b": 743.03989, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "text", "id": 5, "page_no": 5, "cluster": {"id": 5, "label": "text", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 286.36514, "b": 155.84600999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.9868088960647583, "cells": [{"id": 0, "text": "tention encoding is then multiplied to the encoded image to", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 286.36514, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "produce a feature for each table cell. Notice that this is dif-", "bbox": {"l": 50.112, "t": 87.16339000000005, "r": 286.36508, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "ferent than the typical object detection problem where im-", "bbox": {"l": 50.112, "t": 99.11841000000004, "r": 286.36508, "b": 108.02495999999985, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "balances between the number of detections and the amount", "bbox": {"l": 50.112, "t": 111.07343000000003, "r": 286.36508, "b": 119.97997999999984, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "of objects may exist. In our case, we know up front that", "bbox": {"l": 50.112, "t": 123.02844000000005, "r": 286.36508, "b": 131.93499999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "the produced detections always match with the table cells", "bbox": {"l": 50.112, "t": 134.98443999999995, "r": 286.36514, "b": 143.89099, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "in number and correspondence.", "bbox": {"l": 50.112, "t": 146.93944999999997, "r": 175.16254, "b": 155.84600999999998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "tention encoding is then multiplied to the encoded image to produce a feature for each table cell. Notice that this is different than the typical object detection problem where imbalances between the number of detections and the amount of objects may exist. In our case, we know up front that the produced detections always match with the table cells in number and correspondence."}, {"label": "text", "id": 6, "page_no": 5, "cluster": {"id": 6, "label": "text", "bbox": {"l": 50.112, "t": 159.62445000000002, "r": 286.36511, "b": 240.26306, "coord_origin": "TOPLEFT"}, "confidence": 0.9860327839851379, "cells": [{"id": 7, "text": "The output features for each table cell are then fed", "bbox": {"l": 62.067001, "t": 159.62445000000002, "r": 286.36496, "b": 168.53101000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "into the feed-forward network (FFN). The FFN consists", "bbox": {"l": 50.112, "t": 171.58043999999995, "r": 286.36511, "b": 180.48699999999997, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "of a Multi-Layer Perceptron (3 layers with ReLU activa-", "bbox": {"l": 50.112, "t": 183.53545999999994, "r": 286.36511, "b": 192.44201999999996, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "tion function) that predicts the normalized coordinates for", "bbox": {"l": 50.112, "t": 195.49048000000005, "r": 286.36511, "b": 204.39702999999997, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "the bounding box of each table cell. Finally, the predicted", "bbox": {"l": 50.112, "t": 207.44550000000004, "r": 286.36511, "b": 216.35204999999996, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "bounding boxes are classified based on whether they are", "bbox": {"l": 50.112, "t": 219.40051000000005, "r": 286.36511, "b": 228.30706999999995, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "empty or not using a linear layer.", "bbox": {"l": 50.112, "t": 231.35650999999996, "r": 181.54855, "b": 240.26306, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The output features for each table cell are then fed into the feed-forward network (FFN). The FFN consists of a Multi-Layer Perceptron (3 layers with ReLU activation function) that predicts the normalized coordinates for the bounding box of each table cell. Finally, the predicted bounding boxes are classified based on whether they are empty or not using a linear layer."}, {"label": "text", "id": 4, "page_no": 5, "cluster": {"id": 4, "label": "text", "bbox": {"l": 50.112, "t": 243.92193999999995, "r": 286.36572, "b": 444.2309, "coord_origin": "TOPLEFT"}, "confidence": 0.987363874912262, "cells": [{"id": 14, "text": "Loss Functions.", "bbox": {"l": 62.067001, "t": 243.92193999999995, "r": 129.21492, "b": 252.87829999999997, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "We formulate a multi-task loss Eq. 2", "bbox": {"l": 134.451, "t": 244.04150000000004, "r": 286.36078, "b": 252.94806000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "to train our network. The Cross-Entropy loss (denoted as", "bbox": {"l": 50.112007, "t": 255.99652000000003, "r": 286.36511, "b": 264.90308000000005, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "l$_{s}$", "bbox": {"l": 50.112007, "t": 267.79309, "r": 56.84528, "b": 276.63989000000004, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": ") is used to train the", "bbox": {"l": 57.343006, "t": 267.95250999999996, "r": 135.39996, "b": 276.85907, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Structure Decoder", "bbox": {"l": 137.735, "t": 268.04218000000003, "r": 211.07965, "b": 276.62994000000003, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "which predicts the", "bbox": {"l": 213.63699, "t": 267.95250999999996, "r": 286.36395, "b": 276.85907, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "structure tokens. As for the", "bbox": {"l": 50.112, "t": 279.90747, "r": 158.82388, "b": 288.81406, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "Cell BBox Decoder", "bbox": {"l": 161.31799, "t": 279.99712999999997, "r": 238.79712, "b": 288.58493, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "it is trained", "bbox": {"l": 241.521, "t": 279.90747, "r": 286.36264, "b": 288.81406, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "with a combination of losses denoted as", "bbox": {"l": 50.112, "t": 291.86249, "r": 211.3766, "b": 300.76904, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "l$_{box}$", "bbox": {"l": 214.271, "t": 291.70309, "r": 229.19780000000003, "b": 300.54987, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": ".", "bbox": {"l": 229.696, "t": 291.86249, "r": 232.18665000000001, "b": 300.76904, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "l$_{box}$", "bbox": {"l": 236.49001, "t": 291.70309, "r": 251.41681000000003, "b": 300.54987, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "consists", "bbox": {"l": 254.81099999999998, "t": 291.86249, "r": 286.36255, "b": 300.76904, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "of the generally used", "bbox": {"l": 50.112, "t": 303.81747, "r": 137.45412, "b": 312.72403, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "l$_{1}$", "bbox": {"l": 141.298, "t": 303.65808, "r": 148.24258, "b": 312.50485, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "loss for object detection and the", "bbox": {"l": 152.58601, "t": 303.81747, "r": 286.36377, "b": 312.72403, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "IoU loss (", "bbox": {"l": 50.112015, "t": 315.77245999999997, "r": 89.683464, "b": 324.67902, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "l$_{iou}$", "bbox": {"l": 89.68602, "t": 315.61307, "r": 104.12046, "b": 324.45984, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": ") to be scale invariant as explained in [25]. In", "bbox": {"l": 104.61802, "t": 315.77245999999997, "r": 286.36572, "b": 324.67902, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "comparison to DETR, we do not use the Hungarian algo-", "bbox": {"l": 50.112019, "t": 327.72845, "r": 286.36511, "b": 336.6350100000001, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "rithm [15] to match the predicted bounding boxes with the", "bbox": {"l": 50.112019, "t": 339.68344, "r": 286.36508, "b": 348.59, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "ground-truth boxes, as we have already achieved a one-to-", "bbox": {"l": 50.112019, "t": 351.63843, "r": 286.36511, "b": 360.54498, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "one match through two steps: 1) Our token input sequence", "bbox": {"l": 50.112019, "t": 363.59341, "r": 286.36508, "b": 372.49996999999996, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "is naturally ordered, therefore the hidden states of the table", "bbox": {"l": 50.112019, "t": 375.5484, "r": 286.36511, "b": 384.45496, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "data cells are also in order when they are provided as in-", "bbox": {"l": 50.112019, "t": 387.50339, "r": 286.36514, "b": 396.40994, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "put to the", "bbox": {"l": 50.112019, "t": 399.45938, "r": 88.68721, "b": 408.36594, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "Cell BBox Decoder", "bbox": {"l": 91.646019, "t": 399.54904, "r": 170.0517, "b": 408.13681, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": ", and 2) Our bounding boxes", "bbox": {"l": 170.05103, "t": 399.45938, "r": 286.36438, "b": 408.36594, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "generation mechanism (see Sec.", "bbox": {"l": 50.112022, "t": 411.41437, "r": 181.96703, "b": 420.32092, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "3)", "bbox": {"l": 189.09029, "t": 411.41437, "r": 197.74918, "b": 420.32092, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "ensures a one-to-one", "bbox": {"l": 200.34789, "t": 411.41437, "r": 286.36511, "b": 420.32092, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "mapping between the cell content and its bounding box for", "bbox": {"l": 50.112022, "t": 423.36934999999994, "r": 286.36511, "b": 432.27591, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "all post-processed datasets.", "bbox": {"l": 50.112022, "t": 435.32434, "r": 158.2959, "b": 444.2309, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Loss Functions. We formulate a multi-task loss Eq. 2 to train our network. The Cross-Entropy loss (denoted as l$_{s}$ ) is used to train the Structure Decoder which predicts the structure tokens. As for the Cell BBox Decoder it is trained with a combination of losses denoted as l$_{box}$ . l$_{box}$ consists of the generally used l$_{1}$ loss for object detection and the IoU loss ( l$_{iou}$ ) to be scale invariant as explained in [25]. In comparison to DETR, we do not use the Hungarian algorithm [15] to match the predicted bounding boxes with the ground-truth boxes, as we have already achieved a one-toone match through two steps: 1) Our token input sequence is naturally ordered, therefore the hidden states of the table data cells are also in order when they are provided as input to the Cell BBox Decoder , and 2) Our bounding boxes generation mechanism (see Sec. 3) ensures a one-to-one mapping between the cell content and its bounding box for all post-processed datasets."}, {"label": "text", "id": 11, "page_no": 5, "cluster": {"id": 11, "label": "text", "bbox": {"l": 50.112022, "t": 448.01035, "r": 286.36499, "b": 468.87189, "coord_origin": "TOPLEFT"}, "confidence": 0.9724196195602417, "cells": [{"id": 49, "text": "The loss used to train the TableFormer can be defined as", "bbox": {"l": 62.067024, "t": 448.01035, "r": 286.36499, "b": 456.9169, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "following:", "bbox": {"l": 50.112022, "t": 459.96533, "r": 91.377113, "b": 468.87189, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The loss used to train the TableFormer can be defined as following:"}, {"label": "formula", "id": 15, "page_no": 5, "cluster": {"id": 15, "label": "formula", "bbox": {"l": 124.33002, "t": 493.28094, "r": 286.36243, "b": 517.07172, "coord_origin": "TOPLEFT"}, "confidence": 0.9423347115516663, "cells": [{"id": 51, "text": "l$_{box}$", "bbox": {"l": 125.71502, "t": 493.28094, "r": 140.64182, "b": 502.12772, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "=", "bbox": {"l": 143.90701, "t": 493.28094, "r": 151.65593, "b": 502.12772, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "\u03bb$_{iou}$l$_{iou}$", "bbox": {"l": 154.42302, "t": 493.28094, "r": 186.62846, "b": 502.12772, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "+", "bbox": {"l": 189.34003, "t": 493.28094, "r": 197.08894, "b": 502.12772, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "\u03bb$_{l}$$_{1}$", "bbox": {"l": 199.30302, "t": 493.28094, "r": 211.64659, "b": 502.12772, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "l", "bbox": {"l": 124.33002, "t": 508.22495, "r": 127.30286, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "=", "bbox": {"l": 130.26602, "t": 508.22495, "r": 138.01494, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "\u03bbl$_{s}$", "bbox": {"l": 140.78203, "t": 508.22495, "r": 153.32629, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "+ (1", "bbox": {"l": 156.03903, "t": 508.22495, "r": 174.85541, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "\u2212", "bbox": {"l": 177.07103, "t": 507.66702, "r": 184.81995, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "\u03bb", "bbox": {"l": 187.03304, "t": 508.22495, "r": 192.84422, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": ")", "bbox": {"l": 192.84503, "t": 508.22495, "r": 196.71948, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "l$_{box}$", "bbox": {"l": 196.71902, "t": 508.22495, "r": 211.64583, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "(1)", "bbox": {"l": 274.74603, "t": 501.01132, "r": 286.36243, "b": 509.91788, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "l$_{box}$ = \u03bb$_{iou}$l$_{iou}$ + \u03bb$_{l}$$_{1}$ l = \u03bbl$_{s}$ + (1 \u2212 \u03bb ) l$_{box}$ (1)"}, {"label": "text", "id": 16, "page_no": 5, "cluster": {"id": 16, "label": "text", "bbox": {"l": 50.11203, "t": 530.5920100000001, "r": 281.59692, "b": 540.21588, "coord_origin": "TOPLEFT"}, "confidence": 0.9363929629325867, "cells": [{"id": 65, "text": "where", "bbox": {"l": 50.11203, "t": 531.30933, "r": 74.450661, "b": 540.21588, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "\u03bb", "bbox": {"l": 76.941032, "t": 531.14993, "r": 82.75222, "b": 539.9967, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "\u2208", "bbox": {"l": 85.520035, "t": 530.5920100000001, "r": 92.162102, "b": 539.9967, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "[0, 1], and", "bbox": {"l": 94.653038, "t": 531.30933, "r": 135.59932, "b": 540.21588, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "\u03bb$_{iou}$, \u03bb$_{l}$$_{1}$", "bbox": {"l": 138.09004, "t": 531.14993, "r": 172.63162, "b": 539.9967, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "\u2208$_{R}$", "bbox": {"l": 175.89705, "t": 530.5920100000001, "r": 192.50104, "b": 539.9967, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "are hyper-parameters.", "bbox": {"l": 194.99205, "t": 531.30933, "r": 281.59692, "b": 540.21588, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "where \u03bb \u2208 [0, 1], and \u03bb$_{iou}$, \u03bb$_{l}$$_{1}$ \u2208$_{R}$ are hyper-parameters."}, {"label": "section_header", "id": 12, "page_no": 5, "cluster": {"id": 12, "label": "section_header", "bbox": {"l": 50.112045, "t": 555.91689, "r": 171.98335, "b": 566.66461, "coord_origin": "TOPLEFT"}, "confidence": 0.9554555416107178, "cells": [{"id": 72, "text": "5.", "bbox": {"l": 50.112045, "t": 555.91689, "r": 57.92831799999999, "b": 566.66461, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "Experimental Results", "bbox": {"l": 68.350014, "t": 555.91689, "r": 171.98335, "b": 566.66461, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5. Experimental Results"}, {"label": "section_header", "id": 13, "page_no": 5, "cluster": {"id": 13, "label": "section_header", "bbox": {"l": 50.112045, "t": 576.26433, "r": 179.17502, "b": 586.1163799999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9538504481315613, "cells": [{"id": 74, "text": "5.1.", "bbox": {"l": 50.112045, "t": 576.26433, "r": 64.693237, "b": 586.1163799999999, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "Implementation Details", "bbox": {"l": 74.414032, "t": 576.26433, "r": 179.17502, "b": 586.1163799999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5.1. Implementation Details"}, {"label": "text", "id": 7, "page_no": 5, "cluster": {"id": 7, "label": "text", "bbox": {"l": 50.112045, "t": 595.73433, "r": 286.36517, "b": 640.50688, "coord_origin": "TOPLEFT"}, "confidence": 0.9856163263320923, "cells": [{"id": 76, "text": "TableFormer uses ResNet-18 as the", "bbox": {"l": 62.067047, "t": 595.73433, "r": 202.97806, "b": 604.64088, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "CNN Backbone Net-", "bbox": {"l": 205.38405, "t": 595.82399, "r": 286.36008, "b": 604.41174, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "work", "bbox": {"l": 50.112045, "t": 607.77899, "r": 70.037247, "b": 616.3667399999999, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": ". The input images are resized to 448*448 pixels and", "bbox": {"l": 70.037048, "t": 607.68933, "r": 286.36496, "b": 616.59589, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "the feature map has a dimension of 28*28. Additionally, we", "bbox": {"l": 50.112049, "t": 619.64433, "r": 286.36517, "b": 628.55089, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "enforce the following input constraints:", "bbox": {"l": 50.112049, "t": 631.60033, "r": 207.03294, "b": 640.50688, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "TableFormer uses ResNet-18 as the CNN Backbone Network . The input images are resized to 448*448 pixels and the feature map has a dimension of 28*28. Additionally, we enforce the following input constraints:"}, {"label": "formula", "id": 18, "page_no": 5, "cluster": {"id": 18, "label": "formula", "bbox": {"l": 91.661049, "t": 653.828, "r": 286.36246, "b": 678.39588, "coord_origin": "TOPLEFT"}, "confidence": 0.8441831469535828, "cells": [{"id": 82, "text": "Image width and height", "bbox": {"l": 91.661049, "t": 654.54532, "r": 186.01683, "b": 663.45187, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "\u2264", "bbox": {"l": 188.50705, "t": 653.828, "r": 196.25597, "b": 663.2327, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "1024 pixels", "bbox": {"l": 198.74605, "t": 654.54532, "r": 244.81310999999997, "b": 663.45187, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "Structural tags length", "bbox": {"l": 101.01604, "t": 669.48932, "r": 186.24606, "b": 678.39588, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "\u2264", "bbox": {"l": 188.73605, "t": 668.77201, "r": 196.48497, "b": 678.1767, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "512 tokens.", "bbox": {"l": 198.97505, "t": 669.48932, "r": 244.81296999999998, "b": 678.39588, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "(2)", "bbox": {"l": 274.74606, "t": 662.11731, "r": 286.36246, "b": 671.02388, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Image width and height \u2264 1024 pixels Structural tags length \u2264 512 tokens. (2)"}, {"label": "text", "id": 10, "page_no": 5, "cluster": {"id": 10, "label": "text", "bbox": {"l": 50.112061, "t": 692.290314, "r": 286.36514, "b": 713.151878, "coord_origin": "TOPLEFT"}, "confidence": 0.9724979996681213, "cells": [{"id": 89, "text": "Although input constraints are used also by other methods,", "bbox": {"l": 50.112061, "t": 692.290314, "r": 286.36514, "b": 701.196877, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "such as EDD, ours are less restrictive due to the improved", "bbox": {"l": 50.112061, "t": 704.245316, "r": 286.36514, "b": 713.151878, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Although input constraints are used also by other methods, such as EDD, ours are less restrictive due to the improved"}, {"label": "text", "id": 9, "page_no": 5, "cluster": {"id": 9, "label": "text", "bbox": {"l": 308.86206, "t": 75.20830999999998, "r": 545.11523, "b": 108.0249, "coord_origin": "TOPLEFT"}, "confidence": 0.9799237847328186, "cells": [{"id": 91, "text": "runtime performance and lower memory footprint of Table-", "bbox": {"l": 308.86206, "t": 75.20830999999998, "r": 545.11523, "b": 84.11487, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Former.", "bbox": {"l": 308.86206, "t": 87.16332999999997, "r": 339.98523, "b": 96.06988999999999, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "This allows to utilize input samples with longer", "bbox": {"l": 346.88931, "t": 87.16332999999997, "r": 545.11523, "b": 96.06988999999999, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "sequences and images with larger dimensions.", "bbox": {"l": 308.86206, "t": 99.11835000000008, "r": 492.96097, "b": 108.0249, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "runtime performance and lower memory footprint of TableFormer. This allows to utilize input samples with longer sequences and images with larger dimensions."}, {"label": "text", "id": 1, "page_no": 5, "cluster": {"id": 1, "label": "text", "bbox": {"l": 308.86206, "t": 116.22937000000002, "r": 545.1153, "b": 328.37405, "coord_origin": "TOPLEFT"}, "confidence": 0.9880929589271545, "cells": [{"id": 95, "text": "The Transformer Encoder consists of two \u201cTransformer", "bbox": {"l": 320.81705, "t": 116.22937000000002, "r": 545.11499, "b": 125.13593000000003, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "Encoder Layers\u201d, with an input feature size of 512, feed", "bbox": {"l": 308.86206, "t": 128.18439, "r": 545.11517, "b": 137.09094000000005, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "forward network of 1024, and 4 attention heads. As for the", "bbox": {"l": 308.86206, "t": 140.13940000000002, "r": 545.11505, "b": 149.04596000000004, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "Transformer Decoder it is composed of four \u201cTransformer", "bbox": {"l": 308.86206, "t": 152.09442, "r": 545.11511, "b": 161.00098000000003, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "Decoder Layers\u201d with similar input and output dimensions", "bbox": {"l": 308.86206, "t": 164.04944, "r": 545.11517, "b": 172.95599000000004, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "as the \u201cTransformer Encoder Layers\u201d.", "bbox": {"l": 308.86206, "t": 176.00543000000005, "r": 467.21756000000005, "b": 184.91198999999995, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "Even though our", "bbox": {"l": 475.43671, "t": 176.00543000000005, "r": 545.11511, "b": 184.91198999999995, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "model uses fewer layers and heads than the default imple-", "bbox": {"l": 308.86206, "t": 187.96045000000004, "r": 545.11511, "b": 196.86699999999996, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "mentation parameters, our extensive experimentation has", "bbox": {"l": 308.86206, "t": 199.91547000000003, "r": 545.11511, "b": 208.82201999999995, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "proved this setup to be more suitable for table images. We", "bbox": {"l": 308.86206, "t": 211.87048000000004, "r": 545.11517, "b": 220.77704000000006, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "attribute this finding to the inherent design of table im-", "bbox": {"l": 308.86206, "t": 223.82550000000003, "r": 545.11511, "b": 232.73206000000005, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "ages, which contain mostly lines and text, unlike the more", "bbox": {"l": 308.86206, "t": 235.78052000000002, "r": 545.11511, "b": 244.68706999999995, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "elaborate content present in other scopes (e.g. the COCO", "bbox": {"l": 308.86206, "t": 247.73650999999995, "r": 545.11523, "b": 256.64306999999997, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "dataset).", "bbox": {"l": 308.86206, "t": 259.69152999999994, "r": 342.3364, "b": 268.59808, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "Moreover, we have added ResNet blocks to the", "bbox": {"l": 348.95157, "t": 259.69152999999994, "r": 545.11517, "b": 268.59808, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "inputs of the Structure Decoder and Cell BBox Decoder.", "bbox": {"l": 308.86206, "t": 271.64655000000005, "r": 545.11517, "b": 280.55310000000003, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "This prevents a decoder having a stronger influence over the", "bbox": {"l": 308.86206, "t": 283.6015300000001, "r": 545.1153, "b": 292.50809, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "learned weights which would damage the other prediction", "bbox": {"l": 308.86206, "t": 295.55652, "r": 545.11511, "b": 304.46307, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "task (structure vs bounding boxes), but learn task specific", "bbox": {"l": 308.86206, "t": 307.51151, "r": 545.11511, "b": 316.41806, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "weights instead. Lastly our dropout layers are set to 0.5.", "bbox": {"l": 308.86206, "t": 319.4674999999999, "r": 532.48267, "b": 328.37405, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The Transformer Encoder consists of two \u201cTransformer Encoder Layers\u201d, with an input feature size of 512, feed forward network of 1024, and 4 attention heads. As for the Transformer Decoder it is composed of four \u201cTransformer Decoder Layers\u201d with similar input and output dimensions as the \u201cTransformer Encoder Layers\u201d. Even though our model uses fewer layers and heads than the default implementation parameters, our extensive experimentation has proved this setup to be more suitable for table images. We attribute this finding to the inherent design of table images, which contain mostly lines and text, unlike the more elaborate content present in other scopes (e.g. the COCO dataset). Moreover, we have added ResNet blocks to the inputs of the Structure Decoder and Cell BBox Decoder. This prevents a decoder having a stronger influence over the learned weights which would damage the other prediction task (structure vs bounding boxes), but learn task specific weights instead. Lastly our dropout layers are set to 0.5."}, {"label": "text", "id": 3, "page_no": 5, "cluster": {"id": 3, "label": "text", "bbox": {"l": 308.86203, "t": 336.57751, "r": 545.11517, "b": 429.16998, "coord_origin": "TOPLEFT"}, "confidence": 0.9877589344978333, "cells": [{"id": 115, "text": "For training, TableFormer is trained with 3 Adam opti-", "bbox": {"l": 320.81705, "t": 336.57751, "r": 545.11499, "b": 345.48407000000003, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "mizers, each one for the", "bbox": {"l": 308.86206, "t": 348.5325000000001, "r": 403.7359, "b": 357.43906, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "CNN Backbone Network", "bbox": {"l": 406.07605, "t": 348.62216, "r": 503.54016, "b": 357.20993, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": ",", "bbox": {"l": 503.53906, "t": 348.5325000000001, "r": 506.02972, "b": 357.43906, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "Structure", "bbox": {"l": 508.40004999999996, "t": 348.62216, "r": 545.11224, "b": 357.20993, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "Decoder", "bbox": {"l": 308.86206, "t": 360.57715, "r": 343.1633, "b": 369.16492000000005, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": ", and", "bbox": {"l": 343.16306, "t": 360.48749, "r": 362.2016, "b": 369.39404, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Cell BBox Decoder", "bbox": {"l": 364.28604, "t": 360.57715, "r": 440.93829, "b": 369.16492000000005, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": ". Taking the PubTabNet as", "bbox": {"l": 440.93903, "t": 360.48749, "r": 545.10797, "b": 369.39404, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "an example for our parameter set up, the initializing learn-", "bbox": {"l": 308.86203, "t": 372.44247, "r": 545.11511, "b": 381.34903, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "ing rate is 0.001 for 12 epochs with a batch size of 24, and", "bbox": {"l": 308.86203, "t": 384.3984699999999, "r": 545.11517, "b": 393.30502, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "\u03bb", "bbox": {"l": 308.86203, "t": 396.19406000000004, "r": 314.67322, "b": 405.04083, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "set to 0.5.", "bbox": {"l": 318.65802, "t": 396.35345, "r": 360.39139, "b": 405.2600100000001, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "Afterwards, we reduce the learning rate to", "bbox": {"l": 367.96295, "t": 396.35345, "r": 545.10803, "b": 405.2600100000001, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "0.0001, the batch size to 18 and train for 12 more epochs or", "bbox": {"l": 308.86203, "t": 408.30844, "r": 545.11511, "b": 417.215, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "convergence.", "bbox": {"l": 308.86203, "t": 420.26343, "r": 360.9664, "b": 429.16998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "For training, TableFormer is trained with 3 Adam optimizers, each one for the CNN Backbone Network , Structure Decoder , and Cell BBox Decoder . Taking the PubTabNet as an example for our parameter set up, the initializing learning rate is 0.001 for 12 epochs with a batch size of 24, and \u03bb set to 0.5. Afterwards, we reduce the learning rate to 0.0001, the batch size to 18 and train for 12 more epochs or convergence."}, {"label": "text", "id": 0, "page_no": 5, "cluster": {"id": 0, "label": "text", "bbox": {"l": 308.86203, "t": 437.37441999999993, "r": 545.11523, "b": 553.87689, "coord_origin": "TOPLEFT"}, "confidence": 0.9884491562843323, "cells": [{"id": 131, "text": "TableFormer is implemented with PyTorch and Torchvi-", "bbox": {"l": 320.81702, "t": 437.37441999999993, "r": 545.11499, "b": 446.28098, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "sion libraries [22].", "bbox": {"l": 308.86203, "t": 449.32941, "r": 384.62759, "b": 458.23596, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "To speed up the inference, the image", "bbox": {"l": 391.37228, "t": 449.32941, "r": 545.11511, "b": 458.23596, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "undergoes a single forward pass through the", "bbox": {"l": 308.86203, "t": 461.28439, "r": 494.00693000000007, "b": 470.19095, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "CNN Back-", "bbox": {"l": 498.07803, "t": 461.37405, "r": 545.11145, "b": 469.96182, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "bone Network", "bbox": {"l": 308.86203, "t": 473.32904, "r": 364.44336, "b": 481.91681, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "and transformer encoder. This eliminates the", "bbox": {"l": 367.06104, "t": 473.23938, "r": 545.11267, "b": 482.14594, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "overhead of generating the same features for each decoding", "bbox": {"l": 308.86203, "t": 485.19437, "r": 545.11511, "b": 494.10092, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "step. Similarly, we employ a \u2019caching\u2019 technique to preform", "bbox": {"l": 308.86203, "t": 497.14935, "r": 545.11523, "b": 506.05591, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "faster autoregressive decoding. This is achieved by storing", "bbox": {"l": 308.86203, "t": 509.10535, "r": 545.11511, "b": 518.0119, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "the features of decoded tokens so we can reuse them for", "bbox": {"l": 308.86203, "t": 521.06033, "r": 545.11517, "b": 529.9668899999999, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "each time step. Therefore, we only compute the attention", "bbox": {"l": 308.86203, "t": 533.01532, "r": 545.11517, "b": 541.9218900000001, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "for each new tag.", "bbox": {"l": 308.86203, "t": 544.97034, "r": 377.21548, "b": 553.87689, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "TableFormer is implemented with PyTorch and Torchvision libraries [22]. To speed up the inference, the image undergoes a single forward pass through the CNN Backbone Network and transformer encoder. This eliminates the overhead of generating the same features for each decoding step. Similarly, we employ a \u2019caching\u2019 technique to preform faster autoregressive decoding. This is achieved by storing the features of decoded tokens so we can reuse them for each time step. Therefore, we only compute the attention for each new tag."}, {"label": "section_header", "id": 14, "page_no": 5, "cluster": {"id": 14, "label": "section_header", "bbox": {"l": 308.86203, "t": 579.55432, "r": 397.44281, "b": 589.40637, "coord_origin": "TOPLEFT"}, "confidence": 0.9450808167457581, "cells": [{"id": 144, "text": "5.2.", "bbox": {"l": 308.86203, "t": 579.55432, "r": 323.9046, "b": 589.40637, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "Generalization", "bbox": {"l": 333.93301, "t": 579.55432, "r": 397.44281, "b": 589.40637, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5.2. Generalization"}, {"label": "text", "id": 2, "page_no": 5, "cluster": {"id": 2, "label": "text", "bbox": {"l": 308.86203, "t": 603.44933, "r": 545.11517, "b": 672.13189, "coord_origin": "TOPLEFT"}, "confidence": 0.9880596995353699, "cells": [{"id": 146, "text": "TableFormer is evaluated on three major publicly avail-", "bbox": {"l": 320.81702, "t": 603.44933, "r": 545.11493, "b": 612.3558800000001, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "able datasets of different nature to prove the generalization", "bbox": {"l": 308.86203, "t": 615.40433, "r": 545.11511, "b": 624.31088, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "and effectiveness of our model. The datasets used for eval-", "bbox": {"l": 308.86203, "t": 627.35933, "r": 545.11517, "b": 636.26588, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "uation are the PubTabNet, FinTabNet and TableBank which", "bbox": {"l": 308.86203, "t": 639.31433, "r": 545.11511, "b": 648.22089, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "stem from the scientific, financial and general domains re-", "bbox": {"l": 308.86203, "t": 651.27032, "r": 545.11517, "b": 660.17688, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "spectively.", "bbox": {"l": 308.86203, "t": 663.22533, "r": 350.70493, "b": 672.13189, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "TableFormer is evaluated on three major publicly available datasets of different nature to prove the generalization and effectiveness of our model. The datasets used for evaluation are the PubTabNet, FinTabNet and TableBank which stem from the scientific, financial and general domains respectively."}, {"label": "text", "id": 8, "page_no": 5, "cluster": {"id": 8, "label": "text", "bbox": {"l": 308.86203, "t": 680.33533, "r": 545.11523, "b": 713.152893, "coord_origin": "TOPLEFT"}, "confidence": 0.9830910563468933, "cells": [{"id": 152, "text": "We also share our baseline results on the challenging", "bbox": {"l": 320.81702, "t": 680.33533, "r": 545.11505, "b": 689.24189, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "SynthTabNet dataset.", "bbox": {"l": 308.86203, "t": 692.290329, "r": 396.21411, "b": 701.196892, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "Throughout our experiments, the", "bbox": {"l": 406.40585, "t": 692.290329, "r": 545.11523, "b": 701.196892, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "same parameters stated in Sec. 5.1 are utilized.", "bbox": {"l": 308.86203, "t": 704.246323, "r": 495.93982, "b": 713.152893, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "We also share our baseline results on the challenging SynthTabNet dataset. Throughout our experiments, the same parameters stated in Sec. 5.1 are utilized."}, {"label": "page_footer", "id": 17, "page_no": 5, "cluster": {"id": 17, "label": "page_footer", "bbox": {"l": 295.12103, "t": 734.133327, "r": 300.10233, "b": 743.03989, "coord_origin": "TOPLEFT"}, "confidence": 0.8820405602455139, "cells": [{"id": 156, "text": "6", "bbox": {"l": 295.12103, "t": 734.133327, "r": 300.10233, "b": 743.03989, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "6"}], "body": [{"label": "text", "id": 5, "page_no": 5, "cluster": {"id": 5, "label": "text", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 286.36514, "b": 155.84600999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.9868088960647583, "cells": [{"id": 0, "text": "tention encoding is then multiplied to the encoded image to", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 286.36514, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "produce a feature for each table cell. Notice that this is dif-", "bbox": {"l": 50.112, "t": 87.16339000000005, "r": 286.36508, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "ferent than the typical object detection problem where im-", "bbox": {"l": 50.112, "t": 99.11841000000004, "r": 286.36508, "b": 108.02495999999985, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "balances between the number of detections and the amount", "bbox": {"l": 50.112, "t": 111.07343000000003, "r": 286.36508, "b": 119.97997999999984, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "of objects may exist. In our case, we know up front that", "bbox": {"l": 50.112, "t": 123.02844000000005, "r": 286.36508, "b": 131.93499999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "the produced detections always match with the table cells", "bbox": {"l": 50.112, "t": 134.98443999999995, "r": 286.36514, "b": 143.89099, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "in number and correspondence.", "bbox": {"l": 50.112, "t": 146.93944999999997, "r": 175.16254, "b": 155.84600999999998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "tention encoding is then multiplied to the encoded image to produce a feature for each table cell. Notice that this is different than the typical object detection problem where imbalances between the number of detections and the amount of objects may exist. In our case, we know up front that the produced detections always match with the table cells in number and correspondence."}, {"label": "text", "id": 6, "page_no": 5, "cluster": {"id": 6, "label": "text", "bbox": {"l": 50.112, "t": 159.62445000000002, "r": 286.36511, "b": 240.26306, "coord_origin": "TOPLEFT"}, "confidence": 0.9860327839851379, "cells": [{"id": 7, "text": "The output features for each table cell are then fed", "bbox": {"l": 62.067001, "t": 159.62445000000002, "r": 286.36496, "b": 168.53101000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "into the feed-forward network (FFN). The FFN consists", "bbox": {"l": 50.112, "t": 171.58043999999995, "r": 286.36511, "b": 180.48699999999997, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "of a Multi-Layer Perceptron (3 layers with ReLU activa-", "bbox": {"l": 50.112, "t": 183.53545999999994, "r": 286.36511, "b": 192.44201999999996, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "tion function) that predicts the normalized coordinates for", "bbox": {"l": 50.112, "t": 195.49048000000005, "r": 286.36511, "b": 204.39702999999997, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "the bounding box of each table cell. Finally, the predicted", "bbox": {"l": 50.112, "t": 207.44550000000004, "r": 286.36511, "b": 216.35204999999996, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "bounding boxes are classified based on whether they are", "bbox": {"l": 50.112, "t": 219.40051000000005, "r": 286.36511, "b": 228.30706999999995, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "empty or not using a linear layer.", "bbox": {"l": 50.112, "t": 231.35650999999996, "r": 181.54855, "b": 240.26306, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The output features for each table cell are then fed into the feed-forward network (FFN). The FFN consists of a Multi-Layer Perceptron (3 layers with ReLU activation function) that predicts the normalized coordinates for the bounding box of each table cell. Finally, the predicted bounding boxes are classified based on whether they are empty or not using a linear layer."}, {"label": "text", "id": 4, "page_no": 5, "cluster": {"id": 4, "label": "text", "bbox": {"l": 50.112, "t": 243.92193999999995, "r": 286.36572, "b": 444.2309, "coord_origin": "TOPLEFT"}, "confidence": 0.987363874912262, "cells": [{"id": 14, "text": "Loss Functions.", "bbox": {"l": 62.067001, "t": 243.92193999999995, "r": 129.21492, "b": 252.87829999999997, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "We formulate a multi-task loss Eq. 2", "bbox": {"l": 134.451, "t": 244.04150000000004, "r": 286.36078, "b": 252.94806000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "to train our network. The Cross-Entropy loss (denoted as", "bbox": {"l": 50.112007, "t": 255.99652000000003, "r": 286.36511, "b": 264.90308000000005, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "l$_{s}$", "bbox": {"l": 50.112007, "t": 267.79309, "r": 56.84528, "b": 276.63989000000004, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": ") is used to train the", "bbox": {"l": 57.343006, "t": 267.95250999999996, "r": 135.39996, "b": 276.85907, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Structure Decoder", "bbox": {"l": 137.735, "t": 268.04218000000003, "r": 211.07965, "b": 276.62994000000003, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "which predicts the", "bbox": {"l": 213.63699, "t": 267.95250999999996, "r": 286.36395, "b": 276.85907, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "structure tokens. As for the", "bbox": {"l": 50.112, "t": 279.90747, "r": 158.82388, "b": 288.81406, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "Cell BBox Decoder", "bbox": {"l": 161.31799, "t": 279.99712999999997, "r": 238.79712, "b": 288.58493, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "it is trained", "bbox": {"l": 241.521, "t": 279.90747, "r": 286.36264, "b": 288.81406, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "with a combination of losses denoted as", "bbox": {"l": 50.112, "t": 291.86249, "r": 211.3766, "b": 300.76904, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "l$_{box}$", "bbox": {"l": 214.271, "t": 291.70309, "r": 229.19780000000003, "b": 300.54987, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": ".", "bbox": {"l": 229.696, "t": 291.86249, "r": 232.18665000000001, "b": 300.76904, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "l$_{box}$", "bbox": {"l": 236.49001, "t": 291.70309, "r": 251.41681000000003, "b": 300.54987, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "consists", "bbox": {"l": 254.81099999999998, "t": 291.86249, "r": 286.36255, "b": 300.76904, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "of the generally used", "bbox": {"l": 50.112, "t": 303.81747, "r": 137.45412, "b": 312.72403, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "l$_{1}$", "bbox": {"l": 141.298, "t": 303.65808, "r": 148.24258, "b": 312.50485, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "loss for object detection and the", "bbox": {"l": 152.58601, "t": 303.81747, "r": 286.36377, "b": 312.72403, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "IoU loss (", "bbox": {"l": 50.112015, "t": 315.77245999999997, "r": 89.683464, "b": 324.67902, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "l$_{iou}$", "bbox": {"l": 89.68602, "t": 315.61307, "r": 104.12046, "b": 324.45984, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": ") to be scale invariant as explained in [25]. In", "bbox": {"l": 104.61802, "t": 315.77245999999997, "r": 286.36572, "b": 324.67902, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "comparison to DETR, we do not use the Hungarian algo-", "bbox": {"l": 50.112019, "t": 327.72845, "r": 286.36511, "b": 336.6350100000001, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "rithm [15] to match the predicted bounding boxes with the", "bbox": {"l": 50.112019, "t": 339.68344, "r": 286.36508, "b": 348.59, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "ground-truth boxes, as we have already achieved a one-to-", "bbox": {"l": 50.112019, "t": 351.63843, "r": 286.36511, "b": 360.54498, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "one match through two steps: 1) Our token input sequence", "bbox": {"l": 50.112019, "t": 363.59341, "r": 286.36508, "b": 372.49996999999996, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "is naturally ordered, therefore the hidden states of the table", "bbox": {"l": 50.112019, "t": 375.5484, "r": 286.36511, "b": 384.45496, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "data cells are also in order when they are provided as in-", "bbox": {"l": 50.112019, "t": 387.50339, "r": 286.36514, "b": 396.40994, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "put to the", "bbox": {"l": 50.112019, "t": 399.45938, "r": 88.68721, "b": 408.36594, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "Cell BBox Decoder", "bbox": {"l": 91.646019, "t": 399.54904, "r": 170.0517, "b": 408.13681, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": ", and 2) Our bounding boxes", "bbox": {"l": 170.05103, "t": 399.45938, "r": 286.36438, "b": 408.36594, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "generation mechanism (see Sec.", "bbox": {"l": 50.112022, "t": 411.41437, "r": 181.96703, "b": 420.32092, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "3)", "bbox": {"l": 189.09029, "t": 411.41437, "r": 197.74918, "b": 420.32092, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "ensures a one-to-one", "bbox": {"l": 200.34789, "t": 411.41437, "r": 286.36511, "b": 420.32092, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "mapping between the cell content and its bounding box for", "bbox": {"l": 50.112022, "t": 423.36934999999994, "r": 286.36511, "b": 432.27591, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "all post-processed datasets.", "bbox": {"l": 50.112022, "t": 435.32434, "r": 158.2959, "b": 444.2309, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Loss Functions. We formulate a multi-task loss Eq. 2 to train our network. The Cross-Entropy loss (denoted as l$_{s}$ ) is used to train the Structure Decoder which predicts the structure tokens. As for the Cell BBox Decoder it is trained with a combination of losses denoted as l$_{box}$ . l$_{box}$ consists of the generally used l$_{1}$ loss for object detection and the IoU loss ( l$_{iou}$ ) to be scale invariant as explained in [25]. In comparison to DETR, we do not use the Hungarian algorithm [15] to match the predicted bounding boxes with the ground-truth boxes, as we have already achieved a one-toone match through two steps: 1) Our token input sequence is naturally ordered, therefore the hidden states of the table data cells are also in order when they are provided as input to the Cell BBox Decoder , and 2) Our bounding boxes generation mechanism (see Sec. 3) ensures a one-to-one mapping between the cell content and its bounding box for all post-processed datasets."}, {"label": "text", "id": 11, "page_no": 5, "cluster": {"id": 11, "label": "text", "bbox": {"l": 50.112022, "t": 448.01035, "r": 286.36499, "b": 468.87189, "coord_origin": "TOPLEFT"}, "confidence": 0.9724196195602417, "cells": [{"id": 49, "text": "The loss used to train the TableFormer can be defined as", "bbox": {"l": 62.067024, "t": 448.01035, "r": 286.36499, "b": 456.9169, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "following:", "bbox": {"l": 50.112022, "t": 459.96533, "r": 91.377113, "b": 468.87189, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The loss used to train the TableFormer can be defined as following:"}, {"label": "formula", "id": 15, "page_no": 5, "cluster": {"id": 15, "label": "formula", "bbox": {"l": 124.33002, "t": 493.28094, "r": 286.36243, "b": 517.07172, "coord_origin": "TOPLEFT"}, "confidence": 0.9423347115516663, "cells": [{"id": 51, "text": "l$_{box}$", "bbox": {"l": 125.71502, "t": 493.28094, "r": 140.64182, "b": 502.12772, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "=", "bbox": {"l": 143.90701, "t": 493.28094, "r": 151.65593, "b": 502.12772, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "\u03bb$_{iou}$l$_{iou}$", "bbox": {"l": 154.42302, "t": 493.28094, "r": 186.62846, "b": 502.12772, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "+", "bbox": {"l": 189.34003, "t": 493.28094, "r": 197.08894, "b": 502.12772, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "\u03bb$_{l}$$_{1}$", "bbox": {"l": 199.30302, "t": 493.28094, "r": 211.64659, "b": 502.12772, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "l", "bbox": {"l": 124.33002, "t": 508.22495, "r": 127.30286, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "=", "bbox": {"l": 130.26602, "t": 508.22495, "r": 138.01494, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "\u03bbl$_{s}$", "bbox": {"l": 140.78203, "t": 508.22495, "r": 153.32629, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "+ (1", "bbox": {"l": 156.03903, "t": 508.22495, "r": 174.85541, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "\u2212", "bbox": {"l": 177.07103, "t": 507.66702, "r": 184.81995, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "\u03bb", "bbox": {"l": 187.03304, "t": 508.22495, "r": 192.84422, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": ")", "bbox": {"l": 192.84503, "t": 508.22495, "r": 196.71948, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "l$_{box}$", "bbox": {"l": 196.71902, "t": 508.22495, "r": 211.64583, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "(1)", "bbox": {"l": 274.74603, "t": 501.01132, "r": 286.36243, "b": 509.91788, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "l$_{box}$ = \u03bb$_{iou}$l$_{iou}$ + \u03bb$_{l}$$_{1}$ l = \u03bbl$_{s}$ + (1 \u2212 \u03bb ) l$_{box}$ (1)"}, {"label": "text", "id": 16, "page_no": 5, "cluster": {"id": 16, "label": "text", "bbox": {"l": 50.11203, "t": 530.5920100000001, "r": 281.59692, "b": 540.21588, "coord_origin": "TOPLEFT"}, "confidence": 0.9363929629325867, "cells": [{"id": 65, "text": "where", "bbox": {"l": 50.11203, "t": 531.30933, "r": 74.450661, "b": 540.21588, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "\u03bb", "bbox": {"l": 76.941032, "t": 531.14993, "r": 82.75222, "b": 539.9967, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "\u2208", "bbox": {"l": 85.520035, "t": 530.5920100000001, "r": 92.162102, "b": 539.9967, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "[0, 1], and", "bbox": {"l": 94.653038, "t": 531.30933, "r": 135.59932, "b": 540.21588, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "\u03bb$_{iou}$, \u03bb$_{l}$$_{1}$", "bbox": {"l": 138.09004, "t": 531.14993, "r": 172.63162, "b": 539.9967, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "\u2208$_{R}$", "bbox": {"l": 175.89705, "t": 530.5920100000001, "r": 192.50104, "b": 539.9967, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "are hyper-parameters.", "bbox": {"l": 194.99205, "t": 531.30933, "r": 281.59692, "b": 540.21588, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "where \u03bb \u2208 [0, 1], and \u03bb$_{iou}$, \u03bb$_{l}$$_{1}$ \u2208$_{R}$ are hyper-parameters."}, {"label": "section_header", "id": 12, "page_no": 5, "cluster": {"id": 12, "label": "section_header", "bbox": {"l": 50.112045, "t": 555.91689, "r": 171.98335, "b": 566.66461, "coord_origin": "TOPLEFT"}, "confidence": 0.9554555416107178, "cells": [{"id": 72, "text": "5.", "bbox": {"l": 50.112045, "t": 555.91689, "r": 57.92831799999999, "b": 566.66461, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "Experimental Results", "bbox": {"l": 68.350014, "t": 555.91689, "r": 171.98335, "b": 566.66461, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5. Experimental Results"}, {"label": "section_header", "id": 13, "page_no": 5, "cluster": {"id": 13, "label": "section_header", "bbox": {"l": 50.112045, "t": 576.26433, "r": 179.17502, "b": 586.1163799999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9538504481315613, "cells": [{"id": 74, "text": "5.1.", "bbox": {"l": 50.112045, "t": 576.26433, "r": 64.693237, "b": 586.1163799999999, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "Implementation Details", "bbox": {"l": 74.414032, "t": 576.26433, "r": 179.17502, "b": 586.1163799999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5.1. Implementation Details"}, {"label": "text", "id": 7, "page_no": 5, "cluster": {"id": 7, "label": "text", "bbox": {"l": 50.112045, "t": 595.73433, "r": 286.36517, "b": 640.50688, "coord_origin": "TOPLEFT"}, "confidence": 0.9856163263320923, "cells": [{"id": 76, "text": "TableFormer uses ResNet-18 as the", "bbox": {"l": 62.067047, "t": 595.73433, "r": 202.97806, "b": 604.64088, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "CNN Backbone Net-", "bbox": {"l": 205.38405, "t": 595.82399, "r": 286.36008, "b": 604.41174, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "work", "bbox": {"l": 50.112045, "t": 607.77899, "r": 70.037247, "b": 616.3667399999999, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": ". The input images are resized to 448*448 pixels and", "bbox": {"l": 70.037048, "t": 607.68933, "r": 286.36496, "b": 616.59589, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "the feature map has a dimension of 28*28. Additionally, we", "bbox": {"l": 50.112049, "t": 619.64433, "r": 286.36517, "b": 628.55089, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "enforce the following input constraints:", "bbox": {"l": 50.112049, "t": 631.60033, "r": 207.03294, "b": 640.50688, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "TableFormer uses ResNet-18 as the CNN Backbone Network . The input images are resized to 448*448 pixels and the feature map has a dimension of 28*28. Additionally, we enforce the following input constraints:"}, {"label": "formula", "id": 18, "page_no": 5, "cluster": {"id": 18, "label": "formula", "bbox": {"l": 91.661049, "t": 653.828, "r": 286.36246, "b": 678.39588, "coord_origin": "TOPLEFT"}, "confidence": 0.8441831469535828, "cells": [{"id": 82, "text": "Image width and height", "bbox": {"l": 91.661049, "t": 654.54532, "r": 186.01683, "b": 663.45187, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "\u2264", "bbox": {"l": 188.50705, "t": 653.828, "r": 196.25597, "b": 663.2327, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "1024 pixels", "bbox": {"l": 198.74605, "t": 654.54532, "r": 244.81310999999997, "b": 663.45187, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "Structural tags length", "bbox": {"l": 101.01604, "t": 669.48932, "r": 186.24606, "b": 678.39588, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "\u2264", "bbox": {"l": 188.73605, "t": 668.77201, "r": 196.48497, "b": 678.1767, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "512 tokens.", "bbox": {"l": 198.97505, "t": 669.48932, "r": 244.81296999999998, "b": 678.39588, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "(2)", "bbox": {"l": 274.74606, "t": 662.11731, "r": 286.36246, "b": 671.02388, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Image width and height \u2264 1024 pixels Structural tags length \u2264 512 tokens. (2)"}, {"label": "text", "id": 10, "page_no": 5, "cluster": {"id": 10, "label": "text", "bbox": {"l": 50.112061, "t": 692.290314, "r": 286.36514, "b": 713.151878, "coord_origin": "TOPLEFT"}, "confidence": 0.9724979996681213, "cells": [{"id": 89, "text": "Although input constraints are used also by other methods,", "bbox": {"l": 50.112061, "t": 692.290314, "r": 286.36514, "b": 701.196877, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "such as EDD, ours are less restrictive due to the improved", "bbox": {"l": 50.112061, "t": 704.245316, "r": 286.36514, "b": 713.151878, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Although input constraints are used also by other methods, such as EDD, ours are less restrictive due to the improved"}, {"label": "text", "id": 9, "page_no": 5, "cluster": {"id": 9, "label": "text", "bbox": {"l": 308.86206, "t": 75.20830999999998, "r": 545.11523, "b": 108.0249, "coord_origin": "TOPLEFT"}, "confidence": 0.9799237847328186, "cells": [{"id": 91, "text": "runtime performance and lower memory footprint of Table-", "bbox": {"l": 308.86206, "t": 75.20830999999998, "r": 545.11523, "b": 84.11487, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Former.", "bbox": {"l": 308.86206, "t": 87.16332999999997, "r": 339.98523, "b": 96.06988999999999, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "This allows to utilize input samples with longer", "bbox": {"l": 346.88931, "t": 87.16332999999997, "r": 545.11523, "b": 96.06988999999999, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "sequences and images with larger dimensions.", "bbox": {"l": 308.86206, "t": 99.11835000000008, "r": 492.96097, "b": 108.0249, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "runtime performance and lower memory footprint of TableFormer. This allows to utilize input samples with longer sequences and images with larger dimensions."}, {"label": "text", "id": 1, "page_no": 5, "cluster": {"id": 1, "label": "text", "bbox": {"l": 308.86206, "t": 116.22937000000002, "r": 545.1153, "b": 328.37405, "coord_origin": "TOPLEFT"}, "confidence": 0.9880929589271545, "cells": [{"id": 95, "text": "The Transformer Encoder consists of two \u201cTransformer", "bbox": {"l": 320.81705, "t": 116.22937000000002, "r": 545.11499, "b": 125.13593000000003, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "Encoder Layers\u201d, with an input feature size of 512, feed", "bbox": {"l": 308.86206, "t": 128.18439, "r": 545.11517, "b": 137.09094000000005, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "forward network of 1024, and 4 attention heads. As for the", "bbox": {"l": 308.86206, "t": 140.13940000000002, "r": 545.11505, "b": 149.04596000000004, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "Transformer Decoder it is composed of four \u201cTransformer", "bbox": {"l": 308.86206, "t": 152.09442, "r": 545.11511, "b": 161.00098000000003, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "Decoder Layers\u201d with similar input and output dimensions", "bbox": {"l": 308.86206, "t": 164.04944, "r": 545.11517, "b": 172.95599000000004, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "as the \u201cTransformer Encoder Layers\u201d.", "bbox": {"l": 308.86206, "t": 176.00543000000005, "r": 467.21756000000005, "b": 184.91198999999995, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "Even though our", "bbox": {"l": 475.43671, "t": 176.00543000000005, "r": 545.11511, "b": 184.91198999999995, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "model uses fewer layers and heads than the default imple-", "bbox": {"l": 308.86206, "t": 187.96045000000004, "r": 545.11511, "b": 196.86699999999996, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "mentation parameters, our extensive experimentation has", "bbox": {"l": 308.86206, "t": 199.91547000000003, "r": 545.11511, "b": 208.82201999999995, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "proved this setup to be more suitable for table images. We", "bbox": {"l": 308.86206, "t": 211.87048000000004, "r": 545.11517, "b": 220.77704000000006, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "attribute this finding to the inherent design of table im-", "bbox": {"l": 308.86206, "t": 223.82550000000003, "r": 545.11511, "b": 232.73206000000005, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "ages, which contain mostly lines and text, unlike the more", "bbox": {"l": 308.86206, "t": 235.78052000000002, "r": 545.11511, "b": 244.68706999999995, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "elaborate content present in other scopes (e.g. the COCO", "bbox": {"l": 308.86206, "t": 247.73650999999995, "r": 545.11523, "b": 256.64306999999997, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "dataset).", "bbox": {"l": 308.86206, "t": 259.69152999999994, "r": 342.3364, "b": 268.59808, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "Moreover, we have added ResNet blocks to the", "bbox": {"l": 348.95157, "t": 259.69152999999994, "r": 545.11517, "b": 268.59808, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "inputs of the Structure Decoder and Cell BBox Decoder.", "bbox": {"l": 308.86206, "t": 271.64655000000005, "r": 545.11517, "b": 280.55310000000003, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "This prevents a decoder having a stronger influence over the", "bbox": {"l": 308.86206, "t": 283.6015300000001, "r": 545.1153, "b": 292.50809, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "learned weights which would damage the other prediction", "bbox": {"l": 308.86206, "t": 295.55652, "r": 545.11511, "b": 304.46307, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "task (structure vs bounding boxes), but learn task specific", "bbox": {"l": 308.86206, "t": 307.51151, "r": 545.11511, "b": 316.41806, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "weights instead. Lastly our dropout layers are set to 0.5.", "bbox": {"l": 308.86206, "t": 319.4674999999999, "r": 532.48267, "b": 328.37405, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The Transformer Encoder consists of two \u201cTransformer Encoder Layers\u201d, with an input feature size of 512, feed forward network of 1024, and 4 attention heads. As for the Transformer Decoder it is composed of four \u201cTransformer Decoder Layers\u201d with similar input and output dimensions as the \u201cTransformer Encoder Layers\u201d. Even though our model uses fewer layers and heads than the default implementation parameters, our extensive experimentation has proved this setup to be more suitable for table images. We attribute this finding to the inherent design of table images, which contain mostly lines and text, unlike the more elaborate content present in other scopes (e.g. the COCO dataset). Moreover, we have added ResNet blocks to the inputs of the Structure Decoder and Cell BBox Decoder. This prevents a decoder having a stronger influence over the learned weights which would damage the other prediction task (structure vs bounding boxes), but learn task specific weights instead. Lastly our dropout layers are set to 0.5."}, {"label": "text", "id": 3, "page_no": 5, "cluster": {"id": 3, "label": "text", "bbox": {"l": 308.86203, "t": 336.57751, "r": 545.11517, "b": 429.16998, "coord_origin": "TOPLEFT"}, "confidence": 0.9877589344978333, "cells": [{"id": 115, "text": "For training, TableFormer is trained with 3 Adam opti-", "bbox": {"l": 320.81705, "t": 336.57751, "r": 545.11499, "b": 345.48407000000003, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "mizers, each one for the", "bbox": {"l": 308.86206, "t": 348.5325000000001, "r": 403.7359, "b": 357.43906, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "CNN Backbone Network", "bbox": {"l": 406.07605, "t": 348.62216, "r": 503.54016, "b": 357.20993, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": ",", "bbox": {"l": 503.53906, "t": 348.5325000000001, "r": 506.02972, "b": 357.43906, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "Structure", "bbox": {"l": 508.40004999999996, "t": 348.62216, "r": 545.11224, "b": 357.20993, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "Decoder", "bbox": {"l": 308.86206, "t": 360.57715, "r": 343.1633, "b": 369.16492000000005, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": ", and", "bbox": {"l": 343.16306, "t": 360.48749, "r": 362.2016, "b": 369.39404, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Cell BBox Decoder", "bbox": {"l": 364.28604, "t": 360.57715, "r": 440.93829, "b": 369.16492000000005, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": ". Taking the PubTabNet as", "bbox": {"l": 440.93903, "t": 360.48749, "r": 545.10797, "b": 369.39404, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "an example for our parameter set up, the initializing learn-", "bbox": {"l": 308.86203, "t": 372.44247, "r": 545.11511, "b": 381.34903, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "ing rate is 0.001 for 12 epochs with a batch size of 24, and", "bbox": {"l": 308.86203, "t": 384.3984699999999, "r": 545.11517, "b": 393.30502, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "\u03bb", "bbox": {"l": 308.86203, "t": 396.19406000000004, "r": 314.67322, "b": 405.04083, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "set to 0.5.", "bbox": {"l": 318.65802, "t": 396.35345, "r": 360.39139, "b": 405.2600100000001, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "Afterwards, we reduce the learning rate to", "bbox": {"l": 367.96295, "t": 396.35345, "r": 545.10803, "b": 405.2600100000001, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "0.0001, the batch size to 18 and train for 12 more epochs or", "bbox": {"l": 308.86203, "t": 408.30844, "r": 545.11511, "b": 417.215, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "convergence.", "bbox": {"l": 308.86203, "t": 420.26343, "r": 360.9664, "b": 429.16998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "For training, TableFormer is trained with 3 Adam optimizers, each one for the CNN Backbone Network , Structure Decoder , and Cell BBox Decoder . Taking the PubTabNet as an example for our parameter set up, the initializing learning rate is 0.001 for 12 epochs with a batch size of 24, and \u03bb set to 0.5. Afterwards, we reduce the learning rate to 0.0001, the batch size to 18 and train for 12 more epochs or convergence."}, {"label": "text", "id": 0, "page_no": 5, "cluster": {"id": 0, "label": "text", "bbox": {"l": 308.86203, "t": 437.37441999999993, "r": 545.11523, "b": 553.87689, "coord_origin": "TOPLEFT"}, "confidence": 0.9884491562843323, "cells": [{"id": 131, "text": "TableFormer is implemented with PyTorch and Torchvi-", "bbox": {"l": 320.81702, "t": 437.37441999999993, "r": 545.11499, "b": 446.28098, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "sion libraries [22].", "bbox": {"l": 308.86203, "t": 449.32941, "r": 384.62759, "b": 458.23596, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "To speed up the inference, the image", "bbox": {"l": 391.37228, "t": 449.32941, "r": 545.11511, "b": 458.23596, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "undergoes a single forward pass through the", "bbox": {"l": 308.86203, "t": 461.28439, "r": 494.00693000000007, "b": 470.19095, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "CNN Back-", "bbox": {"l": 498.07803, "t": 461.37405, "r": 545.11145, "b": 469.96182, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "bone Network", "bbox": {"l": 308.86203, "t": 473.32904, "r": 364.44336, "b": 481.91681, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "and transformer encoder. This eliminates the", "bbox": {"l": 367.06104, "t": 473.23938, "r": 545.11267, "b": 482.14594, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "overhead of generating the same features for each decoding", "bbox": {"l": 308.86203, "t": 485.19437, "r": 545.11511, "b": 494.10092, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "step. Similarly, we employ a \u2019caching\u2019 technique to preform", "bbox": {"l": 308.86203, "t": 497.14935, "r": 545.11523, "b": 506.05591, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "faster autoregressive decoding. This is achieved by storing", "bbox": {"l": 308.86203, "t": 509.10535, "r": 545.11511, "b": 518.0119, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "the features of decoded tokens so we can reuse them for", "bbox": {"l": 308.86203, "t": 521.06033, "r": 545.11517, "b": 529.9668899999999, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "each time step. Therefore, we only compute the attention", "bbox": {"l": 308.86203, "t": 533.01532, "r": 545.11517, "b": 541.9218900000001, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "for each new tag.", "bbox": {"l": 308.86203, "t": 544.97034, "r": 377.21548, "b": 553.87689, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "TableFormer is implemented with PyTorch and Torchvision libraries [22]. To speed up the inference, the image undergoes a single forward pass through the CNN Backbone Network and transformer encoder. This eliminates the overhead of generating the same features for each decoding step. Similarly, we employ a \u2019caching\u2019 technique to preform faster autoregressive decoding. This is achieved by storing the features of decoded tokens so we can reuse them for each time step. Therefore, we only compute the attention for each new tag."}, {"label": "section_header", "id": 14, "page_no": 5, "cluster": {"id": 14, "label": "section_header", "bbox": {"l": 308.86203, "t": 579.55432, "r": 397.44281, "b": 589.40637, "coord_origin": "TOPLEFT"}, "confidence": 0.9450808167457581, "cells": [{"id": 144, "text": "5.2.", "bbox": {"l": 308.86203, "t": 579.55432, "r": 323.9046, "b": 589.40637, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "Generalization", "bbox": {"l": 333.93301, "t": 579.55432, "r": 397.44281, "b": 589.40637, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5.2. Generalization"}, {"label": "text", "id": 2, "page_no": 5, "cluster": {"id": 2, "label": "text", "bbox": {"l": 308.86203, "t": 603.44933, "r": 545.11517, "b": 672.13189, "coord_origin": "TOPLEFT"}, "confidence": 0.9880596995353699, "cells": [{"id": 146, "text": "TableFormer is evaluated on three major publicly avail-", "bbox": {"l": 320.81702, "t": 603.44933, "r": 545.11493, "b": 612.3558800000001, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "able datasets of different nature to prove the generalization", "bbox": {"l": 308.86203, "t": 615.40433, "r": 545.11511, "b": 624.31088, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "and effectiveness of our model. The datasets used for eval-", "bbox": {"l": 308.86203, "t": 627.35933, "r": 545.11517, "b": 636.26588, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "uation are the PubTabNet, FinTabNet and TableBank which", "bbox": {"l": 308.86203, "t": 639.31433, "r": 545.11511, "b": 648.22089, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "stem from the scientific, financial and general domains re-", "bbox": {"l": 308.86203, "t": 651.27032, "r": 545.11517, "b": 660.17688, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "spectively.", "bbox": {"l": 308.86203, "t": 663.22533, "r": 350.70493, "b": 672.13189, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "TableFormer is evaluated on three major publicly available datasets of different nature to prove the generalization and effectiveness of our model. The datasets used for evaluation are the PubTabNet, FinTabNet and TableBank which stem from the scientific, financial and general domains respectively."}, {"label": "text", "id": 8, "page_no": 5, "cluster": {"id": 8, "label": "text", "bbox": {"l": 308.86203, "t": 680.33533, "r": 545.11523, "b": 713.152893, "coord_origin": "TOPLEFT"}, "confidence": 0.9830910563468933, "cells": [{"id": 152, "text": "We also share our baseline results on the challenging", "bbox": {"l": 320.81702, "t": 680.33533, "r": 545.11505, "b": 689.24189, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "SynthTabNet dataset.", "bbox": {"l": 308.86203, "t": 692.290329, "r": 396.21411, "b": 701.196892, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "Throughout our experiments, the", "bbox": {"l": 406.40585, "t": 692.290329, "r": 545.11523, "b": 701.196892, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "same parameters stated in Sec. 5.1 are utilized.", "bbox": {"l": 308.86203, "t": 704.246323, "r": 495.93982, "b": 713.152893, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "We also share our baseline results on the challenging SynthTabNet dataset. Throughout our experiments, the same parameters stated in Sec. 5.1 are utilized."}], "headers": [{"label": "page_footer", "id": 17, "page_no": 5, "cluster": {"id": 17, "label": "page_footer", "bbox": {"l": 295.12103, "t": 734.133327, "r": 300.10233, "b": 743.03989, "coord_origin": "TOPLEFT"}, "confidence": 0.8820405602455139, "cells": [{"id": 156, "text": "6", "bbox": {"l": 295.12103, "t": 734.133327, "r": 300.10233, "b": 743.03989, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "6"}]}}, {"page_no": 6, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "5.3.", "bbox": {"l": 50.112, "t": 74.40137000000016, "r": 63.704811, "b": 84.25342, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Datasets and Metrics", "bbox": {"l": 72.766685, "t": 74.40137000000016, "r": 167.89825, "b": 84.25342, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "The Tree-Edit-Distance-Based Similarity (TEDS) met-", "bbox": {"l": 62.067001, "t": 93.35039999999992, "r": 286.36499, "b": 102.25696000000016, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "ric was introduced in [37]. It represents the prediction, and", "bbox": {"l": 50.112, "t": 105.30542000000003, "r": 286.36511, "b": 114.21198000000015, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "ground-truth as a tree structure of HTML tags. This simi-", "bbox": {"l": 50.112, "t": 117.26044000000002, "r": 286.36505, "b": 126.16699000000006, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "larity is calculated as:", "bbox": {"l": 50.112, "t": 129.21642999999995, "r": 136.71687, "b": 138.12298999999996, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "TEDS (", "bbox": {"l": 86.218994, "t": 157.05798000000004, "r": 118.8784, "b": 165.90479000000005, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "T$_{a}$, T$_{b}$", "bbox": {"l": 118.87499, "t": 157.05798000000004, "r": 143.26962, "b": 165.90479000000005, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": ") = 1", "bbox": {"l": 143.76799, "t": 157.05798000000004, "r": 165.9019, "b": 165.90479000000005, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "\u2212", "bbox": {"l": 168.12099, "t": 156.50012000000004, "r": 175.8699, "b": 165.90479000000005, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "EditDist (", "bbox": {"l": 179.27899, "t": 150.31799, "r": 221.95677, "b": 159.16479000000004, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "T$_{a}$, T$_{b}$", "bbox": {"l": 221.95200000000003, "t": 150.31799, "r": 246.34663, "b": 159.16479000000004, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": ")", "bbox": {"l": 246.84499999999997, "t": 150.31799, "r": 250.71945, "b": 159.16479000000004, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "max (", "bbox": {"l": 182.21201, "t": 163.89197000000001, "r": 206.29161, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "|", "bbox": {"l": 206.289, "t": 163.33411, "r": 209.05661, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "T$_{a}$", "bbox": {"l": 209.056, "t": 163.89197000000001, "r": 219.19968, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "|", "bbox": {"l": 219.69700999999998, "t": 163.33411, "r": 222.46461000000002, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": ",", "bbox": {"l": 224.125, "t": 163.89197000000001, "r": 226.89261, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "|", "bbox": {"l": 228.55299000000002, "t": 163.33411, "r": 231.3206, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "T$_{b}$", "bbox": {"l": 231.31999, "t": 163.89197000000001, "r": 240.64563, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "|", "bbox": {"l": 241.144, "t": 163.33411, "r": 243.91161, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": ")", "bbox": {"l": 243.911, "t": 163.89197000000001, "r": 247.78545, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "(3)", "bbox": {"l": 274.746, "t": 157.21740999999997, "r": 286.3624, "b": 166.12396, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "where", "bbox": {"l": 62.067001, "t": 181.16241000000002, "r": 86.405632, "b": 190.06897000000004, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "T$_{a}$", "bbox": {"l": 88.581001, "t": 181.00298999999995, "r": 98.724663, "b": 189.84978999999998, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "and", "bbox": {"l": 101.399, "t": 181.16241000000002, "r": 115.785, "b": 190.06897000000004, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "T$_{b}$", "bbox": {"l": 117.961, "t": 181.00298999999995, "r": 127.28664, "b": 189.84978999999998, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "represent tables in tree structure HTML", "bbox": {"l": 129.95999, "t": 181.16241000000002, "r": 286.36285, "b": 190.06897000000004, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "format. EditDist denotes the tree-edit distance, and", "bbox": {"l": 50.111992, "t": 193.11743, "r": 252.78116000000003, "b": 202.02399000000003, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "|", "bbox": {"l": 255.18201, "t": 192.40015000000005, "r": 257.94962, "b": 201.80480999999997, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "T", "bbox": {"l": 257.94901, "t": 192.95800999999994, "r": 263.77115, "b": 201.80480999999997, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "|", "bbox": {"l": 265.155, "t": 192.40015000000005, "r": 267.92261, "b": 201.80480999999997, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "rep-", "bbox": {"l": 270.32199, "t": 193.11743, "r": 286.36179, "b": 202.02399000000003, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "resents the number of nodes in", "bbox": {"l": 50.111984, "t": 205.07245, "r": 172.13388, "b": 213.97900000000004, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "T", "bbox": {"l": 174.62399, "t": 204.91301999999996, "r": 180.44614, "b": 213.75982999999997, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": ".", "bbox": {"l": 181.82899, "t": 205.07245, "r": 184.31964, "b": 213.97900000000004, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "5.4.", "bbox": {"l": 50.112, "t": 224.81946000000005, "r": 64.551605, "b": 234.67151, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "Quantitative Analysis", "bbox": {"l": 74.178009, "t": 224.81946000000005, "r": 170.45169, "b": 234.67151, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "Structure.", "bbox": {"l": 62.067001, "t": 243.6499, "r": 105.32461, "b": 252.60626000000002, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "As shown in Tab.", "bbox": {"l": 112.12600000000002, "t": 243.76946999999996, "r": 184.68361, "b": 252.67602999999997, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "2, TableFormer outper-", "bbox": {"l": 191.4781, "t": 243.76946999999996, "r": 286.36188, "b": 252.67602999999997, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "forms all SOTA methods across different datasets by a large", "bbox": {"l": 50.112, "t": 255.72448999999995, "r": 286.36508, "b": 264.63104, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "margin for predicting the table structure from an image.", "bbox": {"l": 50.112, "t": 267.67949999999996, "r": 286.36508, "b": 276.58606, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "All the more, our model outperforms pre-trained methods.", "bbox": {"l": 50.112, "t": 279.63446, "r": 286.36508, "b": 288.54105, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "During the evaluation we do not apply any table filtering.", "bbox": {"l": 50.112, "t": 291.59048, "r": 286.36514, "b": 300.49704, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "We also provide our baseline results on the SynthTabNet", "bbox": {"l": 50.112, "t": 303.54547, "r": 286.36508, "b": 312.45203000000004, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "dataset. It has been observed that large tables (e.g. tables", "bbox": {"l": 50.112, "t": 315.50046, "r": 286.36505, "b": 324.40700999999996, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "that occupy half of the page or more) yield poor predictions.", "bbox": {"l": 50.112, "t": 327.45544, "r": 286.36508, "b": 336.362, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "We attribute this issue to the image resizing during the pre-", "bbox": {"l": 50.112, "t": 339.41043, "r": 286.36508, "b": 348.31699000000003, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "processing step, that produces downsampled images with", "bbox": {"l": 50.112, "t": 351.36542, "r": 286.36505, "b": 360.27197, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "indistinguishable features. This problem can be addressed", "bbox": {"l": 50.112, "t": 363.32141, "r": 286.36508, "b": 372.2279700000001, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "by treating such big tables with a separate model which ac-", "bbox": {"l": 50.112, "t": 375.2764, "r": 286.36511, "b": 384.18295000000006, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "cepts a large input image size.", "bbox": {"l": 50.112, "t": 387.23138, "r": 170.01187, "b": 396.13794, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Model", "bbox": {"l": 78.843002, "t": 420.69037, "r": 104.85535, "b": 429.59692, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "TEDS", "bbox": {"l": 211.2, "t": 414.71237, "r": 236.10649, "b": 423.61893, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "Dataset", "bbox": {"l": 129.338, "t": 426.66736, "r": 159.21584, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Simple", "bbox": {"l": 171.17096, "t": 426.66736, "r": 199.40497, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Complex", "bbox": {"l": 211.36009, "t": 426.66736, "r": 247.74349999999998, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "All", "bbox": {"l": 264.54044, "t": 426.66736, "r": 277.27264, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "EDD", "bbox": {"l": 81.612, "t": 443.62436, "r": 102.08514, "b": 452.53091, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "PTN", "bbox": {"l": 134.87206, "t": 443.62436, "r": 153.69141, "b": 452.53091, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "91.1", "bbox": {"l": 176.56554, "t": 443.62436, "r": 194.00009, "b": 452.53091, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "88.7", "bbox": {"l": 220.82938000000001, "t": 443.62436, "r": 238.26393, "b": 452.53091, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "89.9", "bbox": {"l": 262.18414, "t": 443.62436, "r": 279.61868, "b": 452.53091, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "GTE", "bbox": {"l": 82.165001, "t": 455.58035, "r": 101.5323, "b": 464.48691, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "PTN", "bbox": {"l": 134.86716, "t": 455.58035, "r": 153.68651, "b": 464.48691, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "-", "bbox": {"l": 183.62411, "t": 455.58035, "r": 186.94167, "b": 464.48691, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "-", "bbox": {"l": 227.88795000000002, "t": 455.58035, "r": 231.20551, "b": 464.48691, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "93.01", "bbox": {"l": 259.69855, "t": 455.58035, "r": 282.11441, "b": 464.48691, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 468.13336, "r": 117.38329000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "PTN", "bbox": {"l": 134.86766, "t": 468.13336, "r": 153.68701, "b": 477.03992, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "98.5", "bbox": {"l": 176.57111, "t": 468.13336, "r": 194.00566, "b": 477.03992, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "95.0", "bbox": {"l": 220.83495, "t": 468.13336, "r": 238.26950000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "96.75", "bbox": {"l": 259.698, "t": 468.01379, "r": 282.11386, "b": 476.97018, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "EDD", "bbox": {"l": 81.612, "t": 483.32635, "r": 102.08514, "b": 492.23291, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "FTN", "bbox": {"l": 134.87206, "t": 483.32635, "r": 153.69141, "b": 492.23291, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "88.4", "bbox": {"l": 176.56554, "t": 483.32635, "r": 194.00009, "b": 492.23291, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "92.08", "bbox": {"l": 218.33870999999996, "t": 483.32635, "r": 240.75455999999997, "b": 492.23291, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "90.6", "bbox": {"l": 262.18411, "t": 483.32635, "r": 279.61865, "b": 492.23291, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "GTE", "bbox": {"l": 82.165001, "t": 495.28134, "r": 101.5323, "b": 504.1879, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "FTN", "bbox": {"l": 134.86716, "t": 495.28134, "r": 153.68651, "b": 504.1879, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "-", "bbox": {"l": 183.62411, "t": 495.28134, "r": 186.94167, "b": 504.1879, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "-", "bbox": {"l": 227.88795000000002, "t": 495.28134, "r": 231.20551, "b": 504.1879, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "87.14", "bbox": {"l": 259.69855, "t": 495.28134, "r": 282.11441, "b": 504.1879, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "GTE (FT)", "bbox": {"l": 71.789001, "t": 507.23633, "r": 111.90838999999998, "b": 516.14288, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "FTN", "bbox": {"l": 134.86221, "t": 507.23633, "r": 153.68156, "b": 516.14288, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "-", "bbox": {"l": 183.62914, "t": 507.23633, "r": 186.94669, "b": 516.14288, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "-", "bbox": {"l": 227.89297, "t": 507.23633, "r": 231.21053000000003, "b": 516.14288, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "91.02", "bbox": {"l": 259.6936, "t": 507.23633, "r": 282.10947, "b": 516.14288, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 519.1913099999999, "r": 117.38329000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "FTN", "bbox": {"l": 134.86766, "t": 519.1913099999999, "r": 153.68701, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "97.5", "bbox": {"l": 176.57111, "t": 519.1913099999999, "r": 194.00566, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "96.0", "bbox": {"l": 220.83495, "t": 519.1913099999999, "r": 238.26950000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "96.8", "bbox": {"l": 262.189, "t": 519.0717500000001, "r": 279.62354, "b": 528.02814, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "EDD", "bbox": {"l": 81.612, "t": 536.49837, "r": 102.08514, "b": 545.40492, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "TB", "bbox": {"l": 137.91064, "t": 536.49837, "r": 150.64285, "b": 545.40492, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "86.0", "bbox": {"l": 176.56554, "t": 536.49837, "r": 194.00009, "b": 545.40492, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "-", "bbox": {"l": 227.89285, "t": 536.49837, "r": 231.21040000000002, "b": 545.40492, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "86.0", "bbox": {"l": 262.18411, "t": 536.49837, "r": 279.61865, "b": 545.40492, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 548.45436, "r": 117.38329000000002, "b": 557.36092, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "TB", "bbox": {"l": 137.90625, "t": 548.45436, "r": 150.63846, "b": 557.36092, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "89.6", "bbox": {"l": 176.57111, "t": 548.45436, "r": 194.00566, "b": 557.36092, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "-", "bbox": {"l": 227.88845999999998, "t": 548.45436, "r": 231.20601, "b": 557.36092, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "89.6", "bbox": {"l": 262.189, "t": 548.3348100000001, "r": 279.62354, "b": 557.2911799999999, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 568.00237, "r": 117.38329000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "STN", "bbox": {"l": 134.86766, "t": 568.00237, "r": 153.68701, "b": 576.90892, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "96.9", "bbox": {"l": 176.57111, "t": 568.00237, "r": 194.00566, "b": 576.90892, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "95.7", "bbox": {"l": 220.83495, "t": 568.00237, "r": 238.26950000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "96.7", "bbox": {"l": 262.1897, "t": 568.00237, "r": 279.62424, "b": 576.90892, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "Table 2: Structure results on PubTabNet (PTN), FinTabNet", "bbox": {"l": 50.112, "t": 592.43336, "r": 286.36511, "b": 601.33992, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "(FTN), TableBank (TB) and SynthTabNet (STN).", "bbox": {"l": 50.112, "t": 604.38837, "r": 247.46114, "b": 613.29492, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "FT: Model was trained on PubTabNet then finetuned.", "bbox": {"l": 50.112, "t": 616.34337, "r": 261.78732, "b": 625.24992, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "Cell Detection.", "bbox": {"l": 62.067001, "t": 644.3498099999999, "r": 124.72179, "b": 653.30618, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "Like any object detector, our", "bbox": {"l": 128.20401, "t": 644.46936, "r": 242.9333, "b": 653.37592, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "Cell BBox", "bbox": {"l": 245.55401999999998, "t": 644.55902, "r": 286.36084, "b": 653.1467700000001, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "Detector", "bbox": {"l": 50.112015, "t": 656.51402, "r": 84.971146, "b": 665.10178, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "provides bounding boxes that can be improved", "bbox": {"l": 89.515015, "t": 656.42436, "r": 286.366, "b": 665.33092, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "with post-processing during inference. We make use of the", "bbox": {"l": 50.112015, "t": 668.37936, "r": 286.36511, "b": 677.28593, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "grid-like structure of tables to refine the predictions. A de-", "bbox": {"l": 50.112015, "t": 680.33536, "r": 286.36505, "b": 689.24193, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "tailed explanation on the post-processing is available in the", "bbox": {"l": 50.112015, "t": 692.290359, "r": 286.36511, "b": 701.19693, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "supplementary material. As shown in Tab. 3, we evaluate", "bbox": {"l": 50.112015, "t": 704.245361, "r": 286.36508, "b": 713.151932, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "our", "bbox": {"l": 308.862, "t": 75.20836999999995, "r": 322.14215, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Cell BBox Decoder", "bbox": {"l": 325.45401, "t": 75.29803000000004, "r": 404.56702, "b": 83.88580000000002, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "accuracy for cells with a class la-", "bbox": {"l": 408.104, "t": 75.20836999999995, "r": 545.10968, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "bel of \u2018content\u2019 only using the PASCAL VOC mAP metric", "bbox": {"l": 308.862, "t": 87.16339000000005, "r": 545.11511, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "for pre-processing and post-processing.", "bbox": {"l": 308.862, "t": 99.11841000000004, "r": 470.22626, "b": 108.02495999999985, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "Note that we do", "bbox": {"l": 477.52884, "t": 99.11841000000004, "r": 545.11511, "b": 108.02495999999985, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "not have post-processing results for SynthTabNet as images", "bbox": {"l": 308.862, "t": 111.07343000000003, "r": 545.11517, "b": 119.97997999999984, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "are only provided. To compare the performance of our pro-", "bbox": {"l": 308.862, "t": 123.02844000000005, "r": 545.11511, "b": 131.93499999999995, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "posed approach, we\u2019ve integrated TableFormer\u2019s", "bbox": {"l": 308.862, "t": 134.98443999999995, "r": 502.01691000000005, "b": 143.89099, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "Cell BBox", "bbox": {"l": 504.47299, "t": 135.07410000000004, "r": 545.11041, "b": 143.66187000000002, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "Decoder", "bbox": {"l": 308.862, "t": 147.02910999999995, "r": 343.16324, "b": 155.61688000000004, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "into EDD architecture. As mentioned previously,", "bbox": {"l": 346.371, "t": 146.93944999999997, "r": 545.11493, "b": 155.84600999999998, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "the Structure Decoder provides the", "bbox": {"l": 308.862, "t": 158.89446999999996, "r": 446.15652, "b": 167.80102999999997, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "Cell BBox Decoder", "bbox": {"l": 448.28998000000007, "t": 158.98413000000005, "r": 525.04181, "b": 167.57190000000003, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "with", "bbox": {"l": 527.39899, "t": 158.89446999999996, "r": 545.11249, "b": 167.80102999999997, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "the features needed to predict the bounding box predictions.", "bbox": {"l": 308.862, "t": 170.84948999999995, "r": 545.11511, "b": 179.75603999999998, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "Therefore, the accuracy of the", "bbox": {"l": 308.862, "t": 182.80449999999996, "r": 432.86642000000006, "b": 191.71105999999997, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "Structure Decoder", "bbox": {"l": 436.39001, "t": 182.89417000000003, "r": 510.93021, "b": 191.48193000000003, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "directly", "bbox": {"l": 514.677, "t": 182.80449999999996, "r": 545.11273, "b": 191.71105999999997, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "influences the accuracy of the", "bbox": {"l": 308.862, "t": 194.75951999999995, "r": 431.17285, "b": 203.66607999999997, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "Cell BBox Decoder", "bbox": {"l": 434.6790199999999, "t": 194.84918000000005, "r": 514.18054, "b": 203.43695000000002, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": ". If the", "bbox": {"l": 514.17603, "t": 194.75951999999995, "r": 545.10992, "b": 203.66607999999997, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "Structure Decoder", "bbox": {"l": 308.86203, "t": 206.80517999999995, "r": 382.35614, "b": 215.39293999999995, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "predicts an extra column, this will result", "bbox": {"l": 385.07501, "t": 206.71551999999997, "r": 545.11426, "b": 215.62207, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "in an extra column of predicted bounding boxes.", "bbox": {"l": 308.862, "t": 218.67052999999999, "r": 501.6981799999999, "b": 227.57709, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "Model", "bbox": {"l": 339.323, "t": 253.66436999999996, "r": 365.33536, "b": 262.57092, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "Dataset", "bbox": {"l": 401.04132, "t": 253.66436999999996, "r": 430.91916, "b": 262.57092, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "mAP", "bbox": {"l": 454.10214, "t": 253.66436999999996, "r": 474.58523999999994, "b": 262.57092, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "mAP (PP)", "bbox": {"l": 486.54034, "t": 253.66436999999996, "r": 527.2276, "b": 262.57092, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "EDD+BBox", "bbox": {"l": 327.65601, "t": 270.62134000000003, "r": 377.00076, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "PubTabNet", "bbox": {"l": 393.69809, "t": 270.62134000000003, "r": 438.28073, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "79.2", "bbox": {"l": 455.63559, "t": 270.62134000000003, "r": 473.07013, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "82.7", "bbox": {"l": 498.16592, "t": 270.62134000000003, "r": 515.60046, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "TableFormer", "bbox": {"l": 326.79501, "t": 282.57631999999995, "r": 377.86331, "b": 291.48288, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "PubTabNet", "bbox": {"l": 393.69388, "t": 282.57631999999995, "r": 438.27652, "b": 291.48288, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "82.1", "bbox": {"l": 455.63101, "t": 282.45676, "r": 473.06555000000003, "b": 291.41315, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "86.8", "bbox": {"l": 498.1713, "t": 282.45676, "r": 515.60583, "b": 291.41315, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "TableFormer", "bbox": {"l": 326.79501, "t": 294.53131, "r": 377.86331, "b": 303.43787, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "SynthTabNet", "bbox": {"l": 389.81842, "t": 294.53131, "r": 442.15194999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "87.7", "bbox": {"l": 455.63135, "t": 294.53131, "r": 473.06589, "b": 303.43787, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "-", "bbox": {"l": 505.22515999999996, "t": 294.53131, "r": 508.54268999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "Table 3:", "bbox": {"l": 308.862, "t": 316.44931, "r": 341.49951, "b": 325.35587, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "Cell Bounding Box detection results on PubTab-", "bbox": {"l": 348.60284, "t": 316.44931, "r": 545.11517, "b": 325.35587, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "Net, and FinTabNet. PP: Post-processing.", "bbox": {"l": 308.862, "t": 328.4043, "r": 474.97845, "b": 337.3108500000001, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "Cell Content.", "bbox": {"l": 320.81699, "t": 367.6797199999999, "r": 378.94876, "b": 376.63611, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "In this section, we evaluate the entire", "bbox": {"l": 387.07898, "t": 367.79929, "r": 545.11566, "b": 376.70584, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "pipeline of recovering a table with content.", "bbox": {"l": 308.86197, "t": 379.75426999999996, "r": 487.19257, "b": 388.66083, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "Here we put", "bbox": {"l": 493.96713, "t": 379.75426999999996, "r": 545.11511, "b": 388.66083, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "our approach to test by capitalizing on extracting content", "bbox": {"l": 308.86197, "t": 391.70926, "r": 545.11505, "b": 400.61581, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "from the PDF cells rather than decoding from images. Tab.", "bbox": {"l": 308.86197, "t": 403.66525, "r": 545.11523, "b": 412.57181, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "4", "bbox": {"l": 308.86197, "t": 415.62024, "r": 314.08096, "b": 424.52679, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "shows the TEDs score of HTML code representing the", "bbox": {"l": 316.69046, "t": 415.62024, "r": 545.11517, "b": 424.52679, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "structure of the table along with the content inserted in the", "bbox": {"l": 308.86197, "t": 427.57523, "r": 545.11505, "b": 436.48177999999996, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "data cell and compared with the ground-truth. Our method", "bbox": {"l": 308.86197, "t": 439.53021, "r": 545.11505, "b": 448.43677, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "achieved a", "bbox": {"l": 308.86197, "t": 451.4852, "r": 350.23666, "b": 460.39175, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "5.3%", "bbox": {"l": 352.17596, "t": 451.36563, "r": 374.59183, "b": 460.32201999999995, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "increase over the state-of-the-art, and com-", "bbox": {"l": 376.53296, "t": 451.4852, "r": 545.11011, "b": 460.39175, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "mercial solutions. We believe our scores would be higher", "bbox": {"l": 308.86197, "t": 463.44019, "r": 545.11511, "b": 472.34674, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "if the HTML ground-truth matched the extracted PDF cell", "bbox": {"l": 308.86197, "t": 475.39618, "r": 545.11517, "b": 484.30273, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "content. Unfortunately, there are small discrepancies such", "bbox": {"l": 308.86197, "t": 487.35117, "r": 545.11511, "b": 496.25772, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "as spacings around words or special characters with various", "bbox": {"l": 308.86197, "t": 499.30615, "r": 545.11505, "b": 508.21271, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "unicode representations.", "bbox": {"l": 308.86197, "t": 511.26114, "r": 405.69846, "b": 520.16769, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "Model", "bbox": {"l": 358.01099, "t": 552.23337, "r": 384.02335, "b": 561.1399200000001, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "TEDS", "bbox": {"l": 449.03400000000005, "t": 546.25537, "r": 473.94049000000007, "b": 555.16193, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": "Simple", "bbox": {"l": 408.50598, "t": 558.21037, "r": 436.73999, "b": 567.11693, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "Complex", "bbox": {"l": 448.6951, "t": 558.21037, "r": 485.07849, "b": 567.11693, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "All", "bbox": {"l": 499.3848, "t": 558.21037, "r": 512.117, "b": 567.11693, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": "Tabula", "bbox": {"l": 357.68201, "t": 575.16736, "r": 384.3519, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "78.0", "bbox": {"l": 413.90097, "t": 575.16736, "r": 431.33550999999994, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "57.8", "bbox": {"l": 458.16479000000004, "t": 575.16736, "r": 475.59933000000007, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "67.9", "bbox": {"l": 497.0289, "t": 575.16736, "r": 514.46344, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": "Traprange", "bbox": {"l": 350.72299, "t": 587.12236, "r": 391.31064, "b": 596.02892, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "60.8", "bbox": {"l": 413.90582, "t": 587.12236, "r": 431.34036, "b": 596.02892, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "49.9", "bbox": {"l": 458.16965, "t": 587.12236, "r": 475.60419, "b": 596.02892, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "55.4", "bbox": {"l": 497.03374999999994, "t": 587.12236, "r": 514.46832, "b": 596.02892, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "Camelot", "bbox": {"l": 354.13599, "t": 599.07835, "r": 387.89923, "b": 607.98491, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "80.0", "bbox": {"l": 413.90161, "t": 599.07835, "r": 431.33615, "b": 607.98491, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "66.0", "bbox": {"l": 458.16544, "t": 599.07835, "r": 475.59998, "b": 607.98491, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "73.0", "bbox": {"l": 497.02954000000005, "t": 599.07835, "r": 514.46411, "b": 607.98491, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "Acrobat Pro", "bbox": {"l": 346.55899, "t": 611.03336, "r": 395.47534, "b": 619.93991, "coord_origin": "TOPLEFT"}}, {"id": 201, "text": "68.9", "bbox": {"l": 413.90616, "t": 611.03336, "r": 431.34069999999997, "b": 619.93991, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": "61.8", "bbox": {"l": 458.16998000000007, "t": 611.03336, "r": 475.60452, "b": 619.93991, "coord_origin": "TOPLEFT"}}, {"id": 203, "text": "65.3", "bbox": {"l": 497.03409, "t": 611.03336, "r": 514.46863, "b": 619.93991, "coord_origin": "TOPLEFT"}}, {"id": 204, "text": "EDD", "bbox": {"l": 360.78101, "t": 622.9883600000001, "r": 381.25415, "b": 631.89491, "coord_origin": "TOPLEFT"}}, {"id": 205, "text": "91.2", "bbox": {"l": 413.90158, "t": 622.9883600000001, "r": 431.33612, "b": 631.89491, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": "85.4", "bbox": {"l": 458.16541, "t": 622.9883600000001, "r": 475.59995000000004, "b": 631.89491, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": "88.3", "bbox": {"l": 497.0295100000001, "t": 622.9883600000001, "r": 514.46405, "b": 631.89491, "coord_origin": "TOPLEFT"}}, {"id": 208, "text": "TableFormer", "bbox": {"l": 345.483, "t": 634.94336, "r": 396.5513, "b": 643.84991, "coord_origin": "TOPLEFT"}}, {"id": 209, "text": "95.4", "bbox": {"l": 413.90616, "t": 634.94336, "r": 431.34069999999997, "b": 643.84991, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": "90.1", "bbox": {"l": 458.16998000000007, "t": 634.94336, "r": 475.60452, "b": 643.84991, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "93.6", "bbox": {"l": 497.03400000000005, "t": 634.82381, "r": 514.46857, "b": 643.78018, "coord_origin": "TOPLEFT"}}, {"id": 212, "text": "Table 4:", "bbox": {"l": 308.862, "t": 656.86136, "r": 341.73862, "b": 665.76792, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "Results of structure with content retrieved using", "bbox": {"l": 349.55927, "t": 656.86136, "r": 545.11517, "b": 665.76792, "coord_origin": "TOPLEFT"}}, {"id": 214, "text": "cell detection on PubTabNet. In all cases the input is PDF", "bbox": {"l": 308.862, "t": 668.81636, "r": 545.11505, "b": 677.7229199999999, "coord_origin": "TOPLEFT"}}, {"id": 215, "text": "documents with cropped tables.", "bbox": {"l": 308.862, "t": 680.77136, "r": 435.03836, "b": 689.6779300000001, "coord_origin": "TOPLEFT"}}, {"id": 216, "text": "7", "bbox": {"l": 295.121, "t": 734.133358, "r": 300.10229, "b": 743.039921, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 10, "label": "section_header", "bbox": {"l": 50.112, "t": 74.40137000000016, "r": 167.89825, "b": 84.25342, "coord_origin": "TOPLEFT"}, "confidence": 0.955427348613739, "cells": [{"id": 0, "text": "5.3.", "bbox": {"l": 50.112, "t": 74.40137000000016, "r": 63.704811, "b": 84.25342, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Datasets and Metrics", "bbox": {"l": 72.766685, "t": 74.40137000000016, "r": 167.89825, "b": 84.25342, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 50.112, "t": 93.35039999999992, "r": 286.36511, "b": 138.12298999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9862998127937317, "cells": [{"id": 2, "text": "The Tree-Edit-Distance-Based Similarity (TEDS) met-", "bbox": {"l": 62.067001, "t": 93.35039999999992, "r": 286.36499, "b": 102.25696000000016, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "ric was introduced in [37]. It represents the prediction, and", "bbox": {"l": 50.112, "t": 105.30542000000003, "r": 286.36511, "b": 114.21198000000015, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "ground-truth as a tree structure of HTML tags. This simi-", "bbox": {"l": 50.112, "t": 117.26044000000002, "r": 286.36505, "b": 126.16699000000006, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "larity is calculated as:", "bbox": {"l": 50.112, "t": 129.21642999999995, "r": 136.71687, "b": 138.12298999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "formula", "bbox": {"l": 86.218994, "t": 150.31799, "r": 286.3624, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9500411748886108, "cells": [{"id": 6, "text": "TEDS (", "bbox": {"l": 86.218994, "t": 157.05798000000004, "r": 118.8784, "b": 165.90479000000005, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "T$_{a}$, T$_{b}$", "bbox": {"l": 118.87499, "t": 157.05798000000004, "r": 143.26962, "b": 165.90479000000005, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": ") = 1", "bbox": {"l": 143.76799, "t": 157.05798000000004, "r": 165.9019, "b": 165.90479000000005, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "\u2212", "bbox": {"l": 168.12099, "t": 156.50012000000004, "r": 175.8699, "b": 165.90479000000005, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "EditDist (", "bbox": {"l": 179.27899, "t": 150.31799, "r": 221.95677, "b": 159.16479000000004, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "T$_{a}$, T$_{b}$", "bbox": {"l": 221.95200000000003, "t": 150.31799, "r": 246.34663, "b": 159.16479000000004, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": ")", "bbox": {"l": 246.84499999999997, "t": 150.31799, "r": 250.71945, "b": 159.16479000000004, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "max (", "bbox": {"l": 182.21201, "t": 163.89197000000001, "r": 206.29161, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "|", "bbox": {"l": 206.289, "t": 163.33411, "r": 209.05661, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "T$_{a}$", "bbox": {"l": 209.056, "t": 163.89197000000001, "r": 219.19968, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "|", "bbox": {"l": 219.69700999999998, "t": 163.33411, "r": 222.46461000000002, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": ",", "bbox": {"l": 224.125, "t": 163.89197000000001, "r": 226.89261, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "|", "bbox": {"l": 228.55299000000002, "t": 163.33411, "r": 231.3206, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "T$_{b}$", "bbox": {"l": 231.31999, "t": 163.89197000000001, "r": 240.64563, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "|", "bbox": {"l": 241.144, "t": 163.33411, "r": 243.91161, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": ")", "bbox": {"l": 243.911, "t": 163.89197000000001, "r": 247.78545, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "(3)", "bbox": {"l": 274.746, "t": 157.21740999999997, "r": 286.3624, "b": 166.12396, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "text", "bbox": {"l": 50.111984, "t": 181.00298999999995, "r": 286.36285, "b": 213.97900000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9735319018363953, "cells": [{"id": 23, "text": "where", "bbox": {"l": 62.067001, "t": 181.16241000000002, "r": 86.405632, "b": 190.06897000000004, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "T$_{a}$", "bbox": {"l": 88.581001, "t": 181.00298999999995, "r": 98.724663, "b": 189.84978999999998, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "and", "bbox": {"l": 101.399, "t": 181.16241000000002, "r": 115.785, "b": 190.06897000000004, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "T$_{b}$", "bbox": {"l": 117.961, "t": 181.00298999999995, "r": 127.28664, "b": 189.84978999999998, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "represent tables in tree structure HTML", "bbox": {"l": 129.95999, "t": 181.16241000000002, "r": 286.36285, "b": 190.06897000000004, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "format. EditDist denotes the tree-edit distance, and", "bbox": {"l": 50.111992, "t": 193.11743, "r": 252.78116000000003, "b": 202.02399000000003, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "|", "bbox": {"l": 255.18201, "t": 192.40015000000005, "r": 257.94962, "b": 201.80480999999997, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "T", "bbox": {"l": 257.94901, "t": 192.95800999999994, "r": 263.77115, "b": 201.80480999999997, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "|", "bbox": {"l": 265.155, "t": 192.40015000000005, "r": 267.92261, "b": 201.80480999999997, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "rep-", "bbox": {"l": 270.32199, "t": 193.11743, "r": 286.36179, "b": 202.02399000000003, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "resents the number of nodes in", "bbox": {"l": 50.111984, "t": 205.07245, "r": 172.13388, "b": 213.97900000000004, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "T", "bbox": {"l": 174.62399, "t": 204.91301999999996, "r": 180.44614, "b": 213.75982999999997, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": ".", "bbox": {"l": 181.82899, "t": 205.07245, "r": 184.31964, "b": 213.97900000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "section_header", "bbox": {"l": 50.112, "t": 224.81946000000005, "r": 170.45169, "b": 234.67151, "coord_origin": "TOPLEFT"}, "confidence": 0.9588837027549744, "cells": [{"id": 36, "text": "5.4.", "bbox": {"l": 50.112, "t": 224.81946000000005, "r": 64.551605, "b": 234.67151, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "Quantitative Analysis", "bbox": {"l": 74.178009, "t": 224.81946000000005, "r": 170.45169, "b": 234.67151, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 50.112, "t": 243.6499, "r": 286.36514, "b": 396.13794, "coord_origin": "TOPLEFT"}, "confidence": 0.9855090975761414, "cells": [{"id": 38, "text": "Structure.", "bbox": {"l": 62.067001, "t": 243.6499, "r": 105.32461, "b": 252.60626000000002, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "As shown in Tab.", "bbox": {"l": 112.12600000000002, "t": 243.76946999999996, "r": 184.68361, "b": 252.67602999999997, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "2, TableFormer outper-", "bbox": {"l": 191.4781, "t": 243.76946999999996, "r": 286.36188, "b": 252.67602999999997, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "forms all SOTA methods across different datasets by a large", "bbox": {"l": 50.112, "t": 255.72448999999995, "r": 286.36508, "b": 264.63104, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "margin for predicting the table structure from an image.", "bbox": {"l": 50.112, "t": 267.67949999999996, "r": 286.36508, "b": 276.58606, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "All the more, our model outperforms pre-trained methods.", "bbox": {"l": 50.112, "t": 279.63446, "r": 286.36508, "b": 288.54105, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "During the evaluation we do not apply any table filtering.", "bbox": {"l": 50.112, "t": 291.59048, "r": 286.36514, "b": 300.49704, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "We also provide our baseline results on the SynthTabNet", "bbox": {"l": 50.112, "t": 303.54547, "r": 286.36508, "b": 312.45203000000004, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "dataset. It has been observed that large tables (e.g. tables", "bbox": {"l": 50.112, "t": 315.50046, "r": 286.36505, "b": 324.40700999999996, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "that occupy half of the page or more) yield poor predictions.", "bbox": {"l": 50.112, "t": 327.45544, "r": 286.36508, "b": 336.362, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "We attribute this issue to the image resizing during the pre-", "bbox": {"l": 50.112, "t": 339.41043, "r": 286.36508, "b": 348.31699000000003, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "processing step, that produces downsampled images with", "bbox": {"l": 50.112, "t": 351.36542, "r": 286.36505, "b": 360.27197, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "indistinguishable features. This problem can be addressed", "bbox": {"l": 50.112, "t": 363.32141, "r": 286.36508, "b": 372.2279700000001, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "by treating such big tables with a separate model which ac-", "bbox": {"l": 50.112, "t": 375.2764, "r": 286.36511, "b": 384.18295000000006, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "cepts a large input image size.", "bbox": {"l": 50.112, "t": 387.23138, "r": 170.01187, "b": 396.13794, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "table", "bbox": {"l": 53.36848831176758, "t": 409.1357727050781, "r": 283.04437255859375, "b": 582.3977661132812, "coord_origin": "TOPLEFT"}, "confidence": 0.9892510175704956, "cells": [{"id": 53, "text": "Model", "bbox": {"l": 78.843002, "t": 420.69037, "r": 104.85535, "b": 429.59692, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "TEDS", "bbox": {"l": 211.2, "t": 414.71237, "r": 236.10649, "b": 423.61893, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "Dataset", "bbox": {"l": 129.338, "t": 426.66736, "r": 159.21584, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Simple", "bbox": {"l": 171.17096, "t": 426.66736, "r": 199.40497, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Complex", "bbox": {"l": 211.36009, "t": 426.66736, "r": 247.74349999999998, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "All", "bbox": {"l": 264.54044, "t": 426.66736, "r": 277.27264, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "EDD", "bbox": {"l": 81.612, "t": 443.62436, "r": 102.08514, "b": 452.53091, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "PTN", "bbox": {"l": 134.87206, "t": 443.62436, "r": 153.69141, "b": 452.53091, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "91.1", "bbox": {"l": 176.56554, "t": 443.62436, "r": 194.00009, "b": 452.53091, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "88.7", "bbox": {"l": 220.82938000000001, "t": 443.62436, "r": 238.26393, "b": 452.53091, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "89.9", "bbox": {"l": 262.18414, "t": 443.62436, "r": 279.61868, "b": 452.53091, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "GTE", "bbox": {"l": 82.165001, "t": 455.58035, "r": 101.5323, "b": 464.48691, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "PTN", "bbox": {"l": 134.86716, "t": 455.58035, "r": 153.68651, "b": 464.48691, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "-", "bbox": {"l": 183.62411, "t": 455.58035, "r": 186.94167, "b": 464.48691, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "-", "bbox": {"l": 227.88795000000002, "t": 455.58035, "r": 231.20551, "b": 464.48691, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "93.01", "bbox": {"l": 259.69855, "t": 455.58035, "r": 282.11441, "b": 464.48691, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 468.13336, "r": 117.38329000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "PTN", "bbox": {"l": 134.86766, "t": 468.13336, "r": 153.68701, "b": 477.03992, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "98.5", "bbox": {"l": 176.57111, "t": 468.13336, "r": 194.00566, "b": 477.03992, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "95.0", "bbox": {"l": 220.83495, "t": 468.13336, "r": 238.26950000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "96.75", "bbox": {"l": 259.698, "t": 468.01379, "r": 282.11386, "b": 476.97018, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "EDD", "bbox": {"l": 81.612, "t": 483.32635, "r": 102.08514, "b": 492.23291, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "FTN", "bbox": {"l": 134.87206, "t": 483.32635, "r": 153.69141, "b": 492.23291, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "88.4", "bbox": {"l": 176.56554, "t": 483.32635, "r": 194.00009, "b": 492.23291, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "92.08", "bbox": {"l": 218.33870999999996, "t": 483.32635, "r": 240.75455999999997, "b": 492.23291, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "90.6", "bbox": {"l": 262.18411, "t": 483.32635, "r": 279.61865, "b": 492.23291, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "GTE", "bbox": {"l": 82.165001, "t": 495.28134, "r": 101.5323, "b": 504.1879, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "FTN", "bbox": {"l": 134.86716, "t": 495.28134, "r": 153.68651, "b": 504.1879, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "-", "bbox": {"l": 183.62411, "t": 495.28134, "r": 186.94167, "b": 504.1879, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "-", "bbox": {"l": 227.88795000000002, "t": 495.28134, "r": 231.20551, "b": 504.1879, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "87.14", "bbox": {"l": 259.69855, "t": 495.28134, "r": 282.11441, "b": 504.1879, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "GTE (FT)", "bbox": {"l": 71.789001, "t": 507.23633, "r": 111.90838999999998, "b": 516.14288, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "FTN", "bbox": {"l": 134.86221, "t": 507.23633, "r": 153.68156, "b": 516.14288, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "-", "bbox": {"l": 183.62914, "t": 507.23633, "r": 186.94669, "b": 516.14288, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "-", "bbox": {"l": 227.89297, "t": 507.23633, "r": 231.21053000000003, "b": 516.14288, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "91.02", "bbox": {"l": 259.6936, "t": 507.23633, "r": 282.10947, "b": 516.14288, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 519.1913099999999, "r": 117.38329000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "FTN", "bbox": {"l": 134.86766, "t": 519.1913099999999, "r": 153.68701, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "97.5", "bbox": {"l": 176.57111, "t": 519.1913099999999, "r": 194.00566, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "96.0", "bbox": {"l": 220.83495, "t": 519.1913099999999, "r": 238.26950000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "96.8", "bbox": {"l": 262.189, "t": 519.0717500000001, "r": 279.62354, "b": 528.02814, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "EDD", "bbox": {"l": 81.612, "t": 536.49837, "r": 102.08514, "b": 545.40492, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "TB", "bbox": {"l": 137.91064, "t": 536.49837, "r": 150.64285, "b": 545.40492, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "86.0", "bbox": {"l": 176.56554, "t": 536.49837, "r": 194.00009, "b": 545.40492, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "-", "bbox": {"l": 227.89285, "t": 536.49837, "r": 231.21040000000002, "b": 545.40492, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "86.0", "bbox": {"l": 262.18411, "t": 536.49837, "r": 279.61865, "b": 545.40492, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 548.45436, "r": 117.38329000000002, "b": 557.36092, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "TB", "bbox": {"l": 137.90625, "t": 548.45436, "r": 150.63846, "b": 557.36092, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "89.6", "bbox": {"l": 176.57111, "t": 548.45436, "r": 194.00566, "b": 557.36092, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "-", "bbox": {"l": 227.88845999999998, "t": 548.45436, "r": 231.20601, "b": 557.36092, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "89.6", "bbox": {"l": 262.189, "t": 548.3348100000001, "r": 279.62354, "b": 557.2911799999999, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 568.00237, "r": 117.38329000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "STN", "bbox": {"l": 134.86766, "t": 568.00237, "r": 153.68701, "b": 576.90892, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "96.9", "bbox": {"l": 176.57111, "t": 568.00237, "r": 194.00566, "b": 576.90892, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "95.7", "bbox": {"l": 220.83495, "t": 568.00237, "r": 238.26950000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "96.7", "bbox": {"l": 262.1897, "t": 568.00237, "r": 279.62424, "b": 576.90892, "coord_origin": "TOPLEFT"}}], "children": [{"id": 17, "label": "text", "bbox": {"l": 78.843002, "t": 420.69037, "r": 104.85535, "b": 429.59692, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "Model", "bbox": {"l": 78.843002, "t": 420.69037, "r": 104.85535, "b": 429.59692, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 211.2, "t": 414.71237, "r": 236.10649, "b": 423.61893, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "TEDS", "bbox": {"l": 211.2, "t": 414.71237, "r": 236.10649, "b": 423.61893, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 129.338, "t": 426.66736, "r": 159.21584, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "Dataset", "bbox": {"l": 129.338, "t": 426.66736, "r": 159.21584, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 171.17096, "t": 426.66736, "r": 199.40497, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "Simple", "bbox": {"l": 171.17096, "t": 426.66736, "r": 199.40497, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 211.36009, "t": 426.66736, "r": 247.74349999999998, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "Complex", "bbox": {"l": 211.36009, "t": 426.66736, "r": 247.74349999999998, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 264.54044, "t": 426.66736, "r": 277.27264, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "All", "bbox": {"l": 264.54044, "t": 426.66736, "r": 277.27264, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 81.612, "t": 443.62436, "r": 102.08514, "b": 452.53091, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "EDD", "bbox": {"l": 81.612, "t": 443.62436, "r": 102.08514, "b": 452.53091, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 134.87206, "t": 443.62436, "r": 153.69141, "b": 452.53091, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "PTN", "bbox": {"l": 134.87206, "t": 443.62436, "r": 153.69141, "b": 452.53091, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 176.56554, "t": 443.62436, "r": 194.00009, "b": 452.53091, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "91.1", "bbox": {"l": 176.56554, "t": 443.62436, "r": 194.00009, "b": 452.53091, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 220.82938000000001, "t": 443.62436, "r": 238.26393, "b": 452.53091, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "88.7", "bbox": {"l": 220.82938000000001, "t": 443.62436, "r": 238.26393, "b": 452.53091, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 262.18414, "t": 443.62436, "r": 279.61868, "b": 452.53091, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "89.9", "bbox": {"l": 262.18414, "t": 443.62436, "r": 279.61868, "b": 452.53091, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 82.165001, "t": 455.58035, "r": 101.5323, "b": 464.48691, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "GTE", "bbox": {"l": 82.165001, "t": 455.58035, "r": 101.5323, "b": 464.48691, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 134.86716, "t": 455.58035, "r": 153.68651, "b": 464.48691, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "PTN", "bbox": {"l": 134.86716, "t": 455.58035, "r": 153.68651, "b": 464.48691, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 183.62411, "t": 455.58035, "r": 186.94167, "b": 464.48691, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "-", "bbox": {"l": 183.62411, "t": 455.58035, "r": 186.94167, "b": 464.48691, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 227.88795000000002, "t": 455.58035, "r": 231.20551, "b": 464.48691, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "-", "bbox": {"l": 227.88795000000002, "t": 455.58035, "r": 231.20551, "b": 464.48691, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 259.69855, "t": 455.58035, "r": 282.11441, "b": 464.48691, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "93.01", "bbox": {"l": 259.69855, "t": 455.58035, "r": 282.11441, "b": 464.48691, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 66.315002, "t": 468.13336, "r": 117.38329000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 468.13336, "r": 117.38329000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 134.86766, "t": 468.13336, "r": 153.68701, "b": 477.03992, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "PTN", "bbox": {"l": 134.86766, "t": 468.13336, "r": 153.68701, "b": 477.03992, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 176.57111, "t": 468.13336, "r": 194.00566, "b": 477.03992, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "98.5", "bbox": {"l": 176.57111, "t": 468.13336, "r": 194.00566, "b": 477.03992, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 220.83495, "t": 468.13336, "r": 238.26950000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "95.0", "bbox": {"l": 220.83495, "t": 468.13336, "r": 238.26950000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 259.698, "t": 468.01379, "r": 282.11386, "b": 476.97018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "96.75", "bbox": {"l": 259.698, "t": 468.01379, "r": 282.11386, "b": 476.97018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 81.612, "t": 483.32635, "r": 102.08514, "b": 492.23291, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "EDD", "bbox": {"l": 81.612, "t": 483.32635, "r": 102.08514, "b": 492.23291, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 134.87206, "t": 483.32635, "r": 153.69141, "b": 492.23291, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "FTN", "bbox": {"l": 134.87206, "t": 483.32635, "r": 153.69141, "b": 492.23291, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 176.56554, "t": 483.32635, "r": 194.00009, "b": 492.23291, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "88.4", "bbox": {"l": 176.56554, "t": 483.32635, "r": 194.00009, "b": 492.23291, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 218.33870999999996, "t": 483.32635, "r": 240.75455999999997, "b": 492.23291, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "92.08", "bbox": {"l": 218.33870999999996, "t": 483.32635, "r": 240.75455999999997, "b": 492.23291, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 262.18411, "t": 483.32635, "r": 279.61865, "b": 492.23291, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "90.6", "bbox": {"l": 262.18411, "t": 483.32635, "r": 279.61865, "b": 492.23291, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 82.165001, "t": 495.28134, "r": 101.5323, "b": 504.1879, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "GTE", "bbox": {"l": 82.165001, "t": 495.28134, "r": 101.5323, "b": 504.1879, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 134.86716, "t": 495.28134, "r": 153.68651, "b": 504.1879, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "FTN", "bbox": {"l": 134.86716, "t": 495.28134, "r": 153.68651, "b": 504.1879, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 183.62411, "t": 495.28134, "r": 186.94167, "b": 504.1879, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "-", "bbox": {"l": 183.62411, "t": 495.28134, "r": 186.94167, "b": 504.1879, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 227.88795000000002, "t": 495.28134, "r": 231.20551, "b": 504.1879, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "-", "bbox": {"l": 227.88795000000002, "t": 495.28134, "r": 231.20551, "b": 504.1879, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 259.69855, "t": 495.28134, "r": 282.11441, "b": 504.1879, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "87.14", "bbox": {"l": 259.69855, "t": 495.28134, "r": 282.11441, "b": 504.1879, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 71.789001, "t": 507.23633, "r": 111.90838999999998, "b": 516.14288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "GTE (FT)", "bbox": {"l": 71.789001, "t": 507.23633, "r": 111.90838999999998, "b": 516.14288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 134.86221, "t": 507.23633, "r": 153.68156, "b": 516.14288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "FTN", "bbox": {"l": 134.86221, "t": 507.23633, "r": 153.68156, "b": 516.14288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 183.62914, "t": 507.23633, "r": 186.94669, "b": 516.14288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "-", "bbox": {"l": 183.62914, "t": 507.23633, "r": 186.94669, "b": 516.14288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 227.89297, "t": 507.23633, "r": 231.21053000000003, "b": 516.14288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "-", "bbox": {"l": 227.89297, "t": 507.23633, "r": 231.21053000000003, "b": 516.14288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 259.6936, "t": 507.23633, "r": 282.10947, "b": 516.14288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "91.02", "bbox": {"l": 259.6936, "t": 507.23633, "r": 282.10947, "b": 516.14288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 66.315002, "t": 519.1913099999999, "r": 117.38329000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 519.1913099999999, "r": 117.38329000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 134.86766, "t": 519.1913099999999, "r": 153.68701, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "FTN", "bbox": {"l": 134.86766, "t": 519.1913099999999, "r": 153.68701, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 176.57111, "t": 519.1913099999999, "r": 194.00566, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "97.5", "bbox": {"l": 176.57111, "t": 519.1913099999999, "r": 194.00566, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 220.83495, "t": 519.1913099999999, "r": 238.26950000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "96.0", "bbox": {"l": 220.83495, "t": 519.1913099999999, "r": 238.26950000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 262.189, "t": 519.0717500000001, "r": 279.62354, "b": 528.02814, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "96.8", "bbox": {"l": 262.189, "t": 519.0717500000001, "r": 279.62354, "b": 528.02814, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 81.612, "t": 536.49837, "r": 102.08514, "b": 545.40492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "EDD", "bbox": {"l": 81.612, "t": 536.49837, "r": 102.08514, "b": 545.40492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 137.91064, "t": 536.49837, "r": 150.64285, "b": 545.40492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "TB", "bbox": {"l": 137.91064, "t": 536.49837, "r": 150.64285, "b": 545.40492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 176.56554, "t": 536.49837, "r": 194.00009, "b": 545.40492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "86.0", "bbox": {"l": 176.56554, "t": 536.49837, "r": 194.00009, "b": 545.40492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 227.89285, "t": 536.49837, "r": 231.21040000000002, "b": 545.40492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "-", "bbox": {"l": 227.89285, "t": 536.49837, "r": 231.21040000000002, "b": 545.40492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 262.18411, "t": 536.49837, "r": 279.61865, "b": 545.40492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "86.0", "bbox": {"l": 262.18411, "t": 536.49837, "r": 279.61865, "b": 545.40492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 66.315002, "t": 548.45436, "r": 117.38329000000002, "b": 557.36092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 548.45436, "r": 117.38329000000002, "b": 557.36092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 137.90625, "t": 548.45436, "r": 150.63846, "b": 557.36092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "TB", "bbox": {"l": 137.90625, "t": 548.45436, "r": 150.63846, "b": 557.36092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 176.57111, "t": 548.45436, "r": 194.00566, "b": 557.36092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "89.6", "bbox": {"l": 176.57111, "t": 548.45436, "r": 194.00566, "b": 557.36092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 227.88845999999998, "t": 548.45436, "r": 231.20601, "b": 557.36092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "-", "bbox": {"l": 227.88845999999998, "t": 548.45436, "r": 231.20601, "b": 557.36092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 262.189, "t": 548.3348100000001, "r": 279.62354, "b": 557.2911799999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": "89.6", "bbox": {"l": 262.189, "t": 548.3348100000001, "r": 279.62354, "b": 557.2911799999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 66.315002, "t": 568.00237, "r": 117.38329000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 568.00237, "r": 117.38329000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 134.86766, "t": 568.00237, "r": 153.68701, "b": 576.90892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "STN", "bbox": {"l": 134.86766, "t": 568.00237, "r": 153.68701, "b": 576.90892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 176.57111, "t": 568.00237, "r": 194.00566, "b": 576.90892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": "96.9", "bbox": {"l": 176.57111, "t": 568.00237, "r": 194.00566, "b": 576.90892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 220.83495, "t": 568.00237, "r": 238.26950000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 107, "text": "95.7", "bbox": {"l": 220.83495, "t": 568.00237, "r": 238.26950000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 262.1897, "t": 568.00237, "r": 279.62424, "b": 576.90892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 108, "text": "96.7", "bbox": {"l": 262.1897, "t": 568.00237, "r": 279.62424, "b": 576.90892, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 15, "label": "text", "bbox": {"l": 50.112, "t": 592.43336, "r": 286.36511, "b": 613.29492, "coord_origin": "TOPLEFT"}, "confidence": 0.7209174633026123, "cells": [{"id": 109, "text": "Table 2: Structure results on PubTabNet (PTN), FinTabNet", "bbox": {"l": 50.112, "t": 592.43336, "r": 286.36511, "b": 601.33992, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "(FTN), TableBank (TB) and SynthTabNet (STN).", "bbox": {"l": 50.112, "t": 604.38837, "r": 247.46114, "b": 613.29492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 50.112, "t": 616.34337, "r": 261.78732, "b": 625.24992, "coord_origin": "TOPLEFT"}, "confidence": 0.6433308124542236, "cells": [{"id": 111, "text": "FT: Model was trained on PubTabNet then finetuned.", "bbox": {"l": 50.112, "t": 616.34337, "r": 261.78732, "b": 625.24992, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 50.112015, "t": 644.3498099999999, "r": 286.366, "b": 713.151932, "coord_origin": "TOPLEFT"}, "confidence": 0.9854633808135986, "cells": [{"id": 112, "text": "Cell Detection.", "bbox": {"l": 62.067001, "t": 644.3498099999999, "r": 124.72179, "b": 653.30618, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "Like any object detector, our", "bbox": {"l": 128.20401, "t": 644.46936, "r": 242.9333, "b": 653.37592, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "Cell BBox", "bbox": {"l": 245.55401999999998, "t": 644.55902, "r": 286.36084, "b": 653.1467700000001, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "Detector", "bbox": {"l": 50.112015, "t": 656.51402, "r": 84.971146, "b": 665.10178, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "provides bounding boxes that can be improved", "bbox": {"l": 89.515015, "t": 656.42436, "r": 286.366, "b": 665.33092, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "with post-processing during inference. We make use of the", "bbox": {"l": 50.112015, "t": 668.37936, "r": 286.36511, "b": 677.28593, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "grid-like structure of tables to refine the predictions. A de-", "bbox": {"l": 50.112015, "t": 680.33536, "r": 286.36505, "b": 689.24193, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "tailed explanation on the post-processing is available in the", "bbox": {"l": 50.112015, "t": 692.290359, "r": 286.36511, "b": 701.19693, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "supplementary material. As shown in Tab. 3, we evaluate", "bbox": {"l": 50.112015, "t": 704.245361, "r": 286.36508, "b": 713.151932, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "text", "bbox": {"l": 308.862, "t": 75.20836999999995, "r": 545.11517, "b": 227.57709, "coord_origin": "TOPLEFT"}, "confidence": 0.9713196754455566, "cells": [{"id": 121, "text": "our", "bbox": {"l": 308.862, "t": 75.20836999999995, "r": 322.14215, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Cell BBox Decoder", "bbox": {"l": 325.45401, "t": 75.29803000000004, "r": 404.56702, "b": 83.88580000000002, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "accuracy for cells with a class la-", "bbox": {"l": 408.104, "t": 75.20836999999995, "r": 545.10968, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "bel of \u2018content\u2019 only using the PASCAL VOC mAP metric", "bbox": {"l": 308.862, "t": 87.16339000000005, "r": 545.11511, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "for pre-processing and post-processing.", "bbox": {"l": 308.862, "t": 99.11841000000004, "r": 470.22626, "b": 108.02495999999985, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "Note that we do", "bbox": {"l": 477.52884, "t": 99.11841000000004, "r": 545.11511, "b": 108.02495999999985, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "not have post-processing results for SynthTabNet as images", "bbox": {"l": 308.862, "t": 111.07343000000003, "r": 545.11517, "b": 119.97997999999984, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "are only provided. To compare the performance of our pro-", "bbox": {"l": 308.862, "t": 123.02844000000005, "r": 545.11511, "b": 131.93499999999995, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "posed approach, we\u2019ve integrated TableFormer\u2019s", "bbox": {"l": 308.862, "t": 134.98443999999995, "r": 502.01691000000005, "b": 143.89099, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "Cell BBox", "bbox": {"l": 504.47299, "t": 135.07410000000004, "r": 545.11041, "b": 143.66187000000002, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "Decoder", "bbox": {"l": 308.862, "t": 147.02910999999995, "r": 343.16324, "b": 155.61688000000004, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "into EDD architecture. As mentioned previously,", "bbox": {"l": 346.371, "t": 146.93944999999997, "r": 545.11493, "b": 155.84600999999998, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "the Structure Decoder provides the", "bbox": {"l": 308.862, "t": 158.89446999999996, "r": 446.15652, "b": 167.80102999999997, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "Cell BBox Decoder", "bbox": {"l": 448.28998000000007, "t": 158.98413000000005, "r": 525.04181, "b": 167.57190000000003, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "with", "bbox": {"l": 527.39899, "t": 158.89446999999996, "r": 545.11249, "b": 167.80102999999997, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "the features needed to predict the bounding box predictions.", "bbox": {"l": 308.862, "t": 170.84948999999995, "r": 545.11511, "b": 179.75603999999998, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "Therefore, the accuracy of the", "bbox": {"l": 308.862, "t": 182.80449999999996, "r": 432.86642000000006, "b": 191.71105999999997, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "Structure Decoder", "bbox": {"l": 436.39001, "t": 182.89417000000003, "r": 510.93021, "b": 191.48193000000003, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "directly", "bbox": {"l": 514.677, "t": 182.80449999999996, "r": 545.11273, "b": 191.71105999999997, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "influences the accuracy of the", "bbox": {"l": 308.862, "t": 194.75951999999995, "r": 431.17285, "b": 203.66607999999997, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "Cell BBox Decoder", "bbox": {"l": 434.6790199999999, "t": 194.84918000000005, "r": 514.18054, "b": 203.43695000000002, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": ". If the", "bbox": {"l": 514.17603, "t": 194.75951999999995, "r": 545.10992, "b": 203.66607999999997, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "Structure Decoder", "bbox": {"l": 308.86203, "t": 206.80517999999995, "r": 382.35614, "b": 215.39293999999995, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "predicts an extra column, this will result", "bbox": {"l": 385.07501, "t": 206.71551999999997, "r": 545.11426, "b": 215.62207, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "in an extra column of predicted bounding boxes.", "bbox": {"l": 308.862, "t": 218.67052999999999, "r": 501.6981799999999, "b": 227.57709, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "table", "bbox": {"l": 308.4068908691406, "t": 247.87631225585938, "r": 533.6420288085938, "b": 303.8056640625, "coord_origin": "TOPLEFT"}, "confidence": 0.9691731929779053, "cells": [{"id": 146, "text": "Model", "bbox": {"l": 339.323, "t": 253.66436999999996, "r": 365.33536, "b": 262.57092, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "Dataset", "bbox": {"l": 401.04132, "t": 253.66436999999996, "r": 430.91916, "b": 262.57092, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "mAP", "bbox": {"l": 454.10214, "t": 253.66436999999996, "r": 474.58523999999994, "b": 262.57092, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "mAP (PP)", "bbox": {"l": 486.54034, "t": 253.66436999999996, "r": 527.2276, "b": 262.57092, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "EDD+BBox", "bbox": {"l": 327.65601, "t": 270.62134000000003, "r": 377.00076, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "PubTabNet", "bbox": {"l": 393.69809, "t": 270.62134000000003, "r": 438.28073, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "79.2", "bbox": {"l": 455.63559, "t": 270.62134000000003, "r": 473.07013, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "82.7", "bbox": {"l": 498.16592, "t": 270.62134000000003, "r": 515.60046, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "TableFormer", "bbox": {"l": 326.79501, "t": 282.57631999999995, "r": 377.86331, "b": 291.48288, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "PubTabNet", "bbox": {"l": 393.69388, "t": 282.57631999999995, "r": 438.27652, "b": 291.48288, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "82.1", "bbox": {"l": 455.63101, "t": 282.45676, "r": 473.06555000000003, "b": 291.41315, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "86.8", "bbox": {"l": 498.1713, "t": 282.45676, "r": 515.60583, "b": 291.41315, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "TableFormer", "bbox": {"l": 326.79501, "t": 294.53131, "r": 377.86331, "b": 303.43787, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "SynthTabNet", "bbox": {"l": 389.81842, "t": 294.53131, "r": 442.15194999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "87.7", "bbox": {"l": 455.63135, "t": 294.53131, "r": 473.06589, "b": 303.43787, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "-", "bbox": {"l": 505.22515999999996, "t": 294.53131, "r": 508.54268999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}}], "children": [{"id": 73, "label": "text", "bbox": {"l": 339.323, "t": 253.66436999999996, "r": 365.33536, "b": 262.57092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 146, "text": "Model", "bbox": {"l": 339.323, "t": 253.66436999999996, "r": 365.33536, "b": 262.57092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 401.04132, "t": 253.66436999999996, "r": 430.91916, "b": 262.57092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 147, "text": "Dataset", "bbox": {"l": 401.04132, "t": 253.66436999999996, "r": 430.91916, "b": 262.57092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 454.10214, "t": 253.66436999999996, "r": 474.58523999999994, "b": 262.57092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 148, "text": "mAP", "bbox": {"l": 454.10214, "t": 253.66436999999996, "r": 474.58523999999994, "b": 262.57092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 486.54034, "t": 253.66436999999996, "r": 527.2276, "b": 262.57092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 149, "text": "mAP (PP)", "bbox": {"l": 486.54034, "t": 253.66436999999996, "r": 527.2276, "b": 262.57092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 327.65601, "t": 270.62134000000003, "r": 377.00076, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 150, "text": "EDD+BBox", "bbox": {"l": 327.65601, "t": 270.62134000000003, "r": 377.00076, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 393.69809, "t": 270.62134000000003, "r": 438.28073, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 151, "text": "PubTabNet", "bbox": {"l": 393.69809, "t": 270.62134000000003, "r": 438.28073, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 455.63559, "t": 270.62134000000003, "r": 473.07013, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 152, "text": "79.2", "bbox": {"l": 455.63559, "t": 270.62134000000003, "r": 473.07013, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 498.16592, "t": 270.62134000000003, "r": 515.60046, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 153, "text": "82.7", "bbox": {"l": 498.16592, "t": 270.62134000000003, "r": 515.60046, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 326.79501, "t": 282.57631999999995, "r": 377.86331, "b": 291.48288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 154, "text": "TableFormer", "bbox": {"l": 326.79501, "t": 282.57631999999995, "r": 377.86331, "b": 291.48288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 393.69388, "t": 282.57631999999995, "r": 438.27652, "b": 291.48288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 155, "text": "PubTabNet", "bbox": {"l": 393.69388, "t": 282.57631999999995, "r": 438.27652, "b": 291.48288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 455.63101, "t": 282.45676, "r": 473.06555000000003, "b": 291.41315, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 156, "text": "82.1", "bbox": {"l": 455.63101, "t": 282.45676, "r": 473.06555000000003, "b": 291.41315, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 498.1713, "t": 282.45676, "r": 515.60583, "b": 291.41315, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 157, "text": "86.8", "bbox": {"l": 498.1713, "t": 282.45676, "r": 515.60583, "b": 291.41315, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 326.79501, "t": 294.53131, "r": 377.86331, "b": 303.43787, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 158, "text": "TableFormer", "bbox": {"l": 326.79501, "t": 294.53131, "r": 377.86331, "b": 303.43787, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 389.81842, "t": 294.53131, "r": 442.15194999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 159, "text": "SynthTabNet", "bbox": {"l": 389.81842, "t": 294.53131, "r": 442.15194999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 455.63135, "t": 294.53131, "r": 473.06589, "b": 303.43787, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 160, "text": "87.7", "bbox": {"l": 455.63135, "t": 294.53131, "r": 473.06589, "b": 303.43787, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 505.22515999999996, "t": 294.53131, "r": 508.54268999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 161, "text": "-", "bbox": {"l": 505.22515999999996, "t": 294.53131, "r": 508.54268999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 12, "label": "caption", "bbox": {"l": 308.862, "t": 316.44931, "r": 545.11517, "b": 337.3108500000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9519919157028198, "cells": [{"id": 162, "text": "Table 3:", "bbox": {"l": 308.862, "t": 316.44931, "r": 341.49951, "b": 325.35587, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "Cell Bounding Box detection results on PubTab-", "bbox": {"l": 348.60284, "t": 316.44931, "r": 545.11517, "b": 325.35587, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "Net, and FinTabNet. PP: Post-processing.", "bbox": {"l": 308.862, "t": 328.4043, "r": 474.97845, "b": 337.3108500000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "text", "bbox": {"l": 308.86197, "t": 367.6797199999999, "r": 545.11566, "b": 520.16769, "coord_origin": "TOPLEFT"}, "confidence": 0.9835010766983032, "cells": [{"id": 165, "text": "Cell Content.", "bbox": {"l": 320.81699, "t": 367.6797199999999, "r": 378.94876, "b": 376.63611, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "In this section, we evaluate the entire", "bbox": {"l": 387.07898, "t": 367.79929, "r": 545.11566, "b": 376.70584, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "pipeline of recovering a table with content.", "bbox": {"l": 308.86197, "t": 379.75426999999996, "r": 487.19257, "b": 388.66083, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "Here we put", "bbox": {"l": 493.96713, "t": 379.75426999999996, "r": 545.11511, "b": 388.66083, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "our approach to test by capitalizing on extracting content", "bbox": {"l": 308.86197, "t": 391.70926, "r": 545.11505, "b": 400.61581, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "from the PDF cells rather than decoding from images. Tab.", "bbox": {"l": 308.86197, "t": 403.66525, "r": 545.11523, "b": 412.57181, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "4", "bbox": {"l": 308.86197, "t": 415.62024, "r": 314.08096, "b": 424.52679, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "shows the TEDs score of HTML code representing the", "bbox": {"l": 316.69046, "t": 415.62024, "r": 545.11517, "b": 424.52679, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "structure of the table along with the content inserted in the", "bbox": {"l": 308.86197, "t": 427.57523, "r": 545.11505, "b": 436.48177999999996, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "data cell and compared with the ground-truth. Our method", "bbox": {"l": 308.86197, "t": 439.53021, "r": 545.11505, "b": 448.43677, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "achieved a", "bbox": {"l": 308.86197, "t": 451.4852, "r": 350.23666, "b": 460.39175, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "5.3%", "bbox": {"l": 352.17596, "t": 451.36563, "r": 374.59183, "b": 460.32201999999995, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "increase over the state-of-the-art, and com-", "bbox": {"l": 376.53296, "t": 451.4852, "r": 545.11011, "b": 460.39175, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "mercial solutions. We believe our scores would be higher", "bbox": {"l": 308.86197, "t": 463.44019, "r": 545.11511, "b": 472.34674, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "if the HTML ground-truth matched the extracted PDF cell", "bbox": {"l": 308.86197, "t": 475.39618, "r": 545.11517, "b": 484.30273, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "content. Unfortunately, there are small discrepancies such", "bbox": {"l": 308.86197, "t": 487.35117, "r": 545.11511, "b": 496.25772, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "as spacings around words or special characters with various", "bbox": {"l": 308.86197, "t": 499.30615, "r": 545.11505, "b": 508.21271, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "unicode representations.", "bbox": {"l": 308.86197, "t": 511.26114, "r": 405.69846, "b": 520.16769, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "table", "bbox": {"l": 332.9688720703125, "t": 540.2835083007812, "r": 520.942138671875, "b": 643.2697143554688, "coord_origin": "TOPLEFT"}, "confidence": 0.9775568842887878, "cells": [{"id": 183, "text": "Model", "bbox": {"l": 358.01099, "t": 552.23337, "r": 384.02335, "b": 561.1399200000001, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "TEDS", "bbox": {"l": 449.03400000000005, "t": 546.25537, "r": 473.94049000000007, "b": 555.16193, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": "Simple", "bbox": {"l": 408.50598, "t": 558.21037, "r": 436.73999, "b": 567.11693, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "Complex", "bbox": {"l": 448.6951, "t": 558.21037, "r": 485.07849, "b": 567.11693, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "All", "bbox": {"l": 499.3848, "t": 558.21037, "r": 512.117, "b": 567.11693, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": "Tabula", "bbox": {"l": 357.68201, "t": 575.16736, "r": 384.3519, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "78.0", "bbox": {"l": 413.90097, "t": 575.16736, "r": 431.33550999999994, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "57.8", "bbox": {"l": 458.16479000000004, "t": 575.16736, "r": 475.59933000000007, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "67.9", "bbox": {"l": 497.0289, "t": 575.16736, "r": 514.46344, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": "Traprange", "bbox": {"l": 350.72299, "t": 587.12236, "r": 391.31064, "b": 596.02892, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "60.8", "bbox": {"l": 413.90582, "t": 587.12236, "r": 431.34036, "b": 596.02892, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "49.9", "bbox": {"l": 458.16965, "t": 587.12236, "r": 475.60419, "b": 596.02892, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "55.4", "bbox": {"l": 497.03374999999994, "t": 587.12236, "r": 514.46832, "b": 596.02892, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "Camelot", "bbox": {"l": 354.13599, "t": 599.07835, "r": 387.89923, "b": 607.98491, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "80.0", "bbox": {"l": 413.90161, "t": 599.07835, "r": 431.33615, "b": 607.98491, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "66.0", "bbox": {"l": 458.16544, "t": 599.07835, "r": 475.59998, "b": 607.98491, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "73.0", "bbox": {"l": 497.02954000000005, "t": 599.07835, "r": 514.46411, "b": 607.98491, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "Acrobat Pro", "bbox": {"l": 346.55899, "t": 611.03336, "r": 395.47534, "b": 619.93991, "coord_origin": "TOPLEFT"}}, {"id": 201, "text": "68.9", "bbox": {"l": 413.90616, "t": 611.03336, "r": 431.34069999999997, "b": 619.93991, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": "61.8", "bbox": {"l": 458.16998000000007, "t": 611.03336, "r": 475.60452, "b": 619.93991, "coord_origin": "TOPLEFT"}}, {"id": 203, "text": "65.3", "bbox": {"l": 497.03409, "t": 611.03336, "r": 514.46863, "b": 619.93991, "coord_origin": "TOPLEFT"}}, {"id": 204, "text": "EDD", "bbox": {"l": 360.78101, "t": 622.9883600000001, "r": 381.25415, "b": 631.89491, "coord_origin": "TOPLEFT"}}, {"id": 205, "text": "91.2", "bbox": {"l": 413.90158, "t": 622.9883600000001, "r": 431.33612, "b": 631.89491, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": "85.4", "bbox": {"l": 458.16541, "t": 622.9883600000001, "r": 475.59995000000004, "b": 631.89491, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": "88.3", "bbox": {"l": 497.0295100000001, "t": 622.9883600000001, "r": 514.46405, "b": 631.89491, "coord_origin": "TOPLEFT"}}, {"id": 208, "text": "TableFormer", "bbox": {"l": 345.483, "t": 634.94336, "r": 396.5513, "b": 643.84991, "coord_origin": "TOPLEFT"}}, {"id": 209, "text": "95.4", "bbox": {"l": 413.90616, "t": 634.94336, "r": 431.34069999999997, "b": 643.84991, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": "90.1", "bbox": {"l": 458.16998000000007, "t": 634.94336, "r": 475.60452, "b": 643.84991, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "93.6", "bbox": {"l": 497.03400000000005, "t": 634.82381, "r": 514.46857, "b": 643.78018, "coord_origin": "TOPLEFT"}}], "children": [{"id": 89, "label": "text", "bbox": {"l": 358.01099, "t": 552.23337, "r": 384.02335, "b": 561.1399200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 183, "text": "Model", "bbox": {"l": 358.01099, "t": 552.23337, "r": 384.02335, "b": 561.1399200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 449.03400000000005, "t": 546.25537, "r": 473.94049000000007, "b": 555.16193, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 184, "text": "TEDS", "bbox": {"l": 449.03400000000005, "t": 546.25537, "r": 473.94049000000007, "b": 555.16193, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 408.50598, "t": 558.21037, "r": 436.73999, "b": 567.11693, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 185, "text": "Simple", "bbox": {"l": 408.50598, "t": 558.21037, "r": 436.73999, "b": 567.11693, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 448.6951, "t": 558.21037, "r": 485.07849, "b": 567.11693, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 186, "text": "Complex", "bbox": {"l": 448.6951, "t": 558.21037, "r": 485.07849, "b": 567.11693, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 499.3848, "t": 558.21037, "r": 512.117, "b": 567.11693, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 187, "text": "All", "bbox": {"l": 499.3848, "t": 558.21037, "r": 512.117, "b": 567.11693, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 357.68201, "t": 575.16736, "r": 384.3519, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 188, "text": "Tabula", "bbox": {"l": 357.68201, "t": 575.16736, "r": 384.3519, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 413.90097, "t": 575.16736, "r": 431.33550999999994, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 189, "text": "78.0", "bbox": {"l": 413.90097, "t": 575.16736, "r": 431.33550999999994, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 458.16479000000004, "t": 575.16736, "r": 475.59933000000007, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 190, "text": "57.8", "bbox": {"l": 458.16479000000004, "t": 575.16736, "r": 475.59933000000007, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 497.0289, "t": 575.16736, "r": 514.46344, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 191, "text": "67.9", "bbox": {"l": 497.0289, "t": 575.16736, "r": 514.46344, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 350.72299, "t": 587.12236, "r": 391.31064, "b": 596.02892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 192, "text": "Traprange", "bbox": {"l": 350.72299, "t": 587.12236, "r": 391.31064, "b": 596.02892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 413.90582, "t": 587.12236, "r": 431.34036, "b": 596.02892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 193, "text": "60.8", "bbox": {"l": 413.90582, "t": 587.12236, "r": 431.34036, "b": 596.02892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 458.16965, "t": 587.12236, "r": 475.60419, "b": 596.02892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 194, "text": "49.9", "bbox": {"l": 458.16965, "t": 587.12236, "r": 475.60419, "b": 596.02892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 497.03374999999994, "t": 587.12236, "r": 514.46832, "b": 596.02892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 195, "text": "55.4", "bbox": {"l": 497.03374999999994, "t": 587.12236, "r": 514.46832, "b": 596.02892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 354.13599, "t": 599.07835, "r": 387.89923, "b": 607.98491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 196, "text": "Camelot", "bbox": {"l": 354.13599, "t": 599.07835, "r": 387.89923, "b": 607.98491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 413.90161, "t": 599.07835, "r": 431.33615, "b": 607.98491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 197, "text": "80.0", "bbox": {"l": 413.90161, "t": 599.07835, "r": 431.33615, "b": 607.98491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 458.16544, "t": 599.07835, "r": 475.59998, "b": 607.98491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 198, "text": "66.0", "bbox": {"l": 458.16544, "t": 599.07835, "r": 475.59998, "b": 607.98491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 497.02954000000005, "t": 599.07835, "r": 514.46411, "b": 607.98491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 199, "text": "73.0", "bbox": {"l": 497.02954000000005, "t": 599.07835, "r": 514.46411, "b": 607.98491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 346.55899, "t": 611.03336, "r": 395.47534, "b": 619.93991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 200, "text": "Acrobat Pro", "bbox": {"l": 346.55899, "t": 611.03336, "r": 395.47534, "b": 619.93991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 413.90616, "t": 611.03336, "r": 431.34069999999997, "b": 619.93991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 201, "text": "68.9", "bbox": {"l": 413.90616, "t": 611.03336, "r": 431.34069999999997, "b": 619.93991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 458.16998000000007, "t": 611.03336, "r": 475.60452, "b": 619.93991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 202, "text": "61.8", "bbox": {"l": 458.16998000000007, "t": 611.03336, "r": 475.60452, "b": 619.93991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 497.03409, "t": 611.03336, "r": 514.46863, "b": 619.93991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 203, "text": "65.3", "bbox": {"l": 497.03409, "t": 611.03336, "r": 514.46863, "b": 619.93991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 360.78101, "t": 622.9883600000001, "r": 381.25415, "b": 631.89491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 204, "text": "EDD", "bbox": {"l": 360.78101, "t": 622.9883600000001, "r": 381.25415, "b": 631.89491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 413.90158, "t": 622.9883600000001, "r": 431.33612, "b": 631.89491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 205, "text": "91.2", "bbox": {"l": 413.90158, "t": 622.9883600000001, "r": 431.33612, "b": 631.89491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 458.16541, "t": 622.9883600000001, "r": 475.59995000000004, "b": 631.89491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 206, "text": "85.4", "bbox": {"l": 458.16541, "t": 622.9883600000001, "r": 475.59995000000004, "b": 631.89491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 497.0295100000001, "t": 622.9883600000001, "r": 514.46405, "b": 631.89491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 207, "text": "88.3", "bbox": {"l": 497.0295100000001, "t": 622.9883600000001, "r": 514.46405, "b": 631.89491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 114, "label": "text", "bbox": {"l": 345.483, "t": 634.94336, "r": 396.5513, "b": 643.84991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 208, "text": "TableFormer", "bbox": {"l": 345.483, "t": 634.94336, "r": 396.5513, "b": 643.84991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 115, "label": "text", "bbox": {"l": 413.90616, "t": 634.94336, "r": 431.34069999999997, "b": 643.84991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 209, "text": "95.4", "bbox": {"l": 413.90616, "t": 634.94336, "r": 431.34069999999997, "b": 643.84991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 116, "label": "text", "bbox": {"l": 458.16998000000007, "t": 634.94336, "r": 475.60452, "b": 643.84991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 210, "text": "90.1", "bbox": {"l": 458.16998000000007, "t": 634.94336, "r": 475.60452, "b": 643.84991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 117, "label": "text", "bbox": {"l": 497.03400000000005, "t": 634.82381, "r": 514.46857, "b": 643.78018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 211, "text": "93.6", "bbox": {"l": 497.03400000000005, "t": 634.82381, "r": 514.46857, "b": 643.78018, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 11, "label": "caption", "bbox": {"l": 308.862, "t": 656.86136, "r": 545.11517, "b": 689.6779300000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9541401863098145, "cells": [{"id": 212, "text": "Table 4:", "bbox": {"l": 308.862, "t": 656.86136, "r": 341.73862, "b": 665.76792, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "Results of structure with content retrieved using", "bbox": {"l": 349.55927, "t": 656.86136, "r": 545.11517, "b": 665.76792, "coord_origin": "TOPLEFT"}}, {"id": 214, "text": "cell detection on PubTabNet. In all cases the input is PDF", "bbox": {"l": 308.862, "t": 668.81636, "r": 545.11505, "b": 677.7229199999999, "coord_origin": "TOPLEFT"}}, {"id": 215, "text": "documents with cropped tables.", "bbox": {"l": 308.862, "t": 680.77136, "r": 435.03836, "b": 689.6779300000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "page_footer", "bbox": {"l": 295.121, "t": 734.133358, "r": 300.10229, "b": 743.039921, "coord_origin": "TOPLEFT"}, "confidence": 0.8787970542907715, "cells": [{"id": 216, "text": "7", "bbox": {"l": 295.121, "t": 734.133358, "r": 300.10229, "b": 743.039921, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {"0": {"label": "table", "id": 0, "page_no": 6, "cluster": {"id": 0, "label": "table", "bbox": {"l": 53.36848831176758, "t": 409.1357727050781, "r": 283.04437255859375, "b": 582.3977661132812, "coord_origin": "TOPLEFT"}, "confidence": 0.9892510175704956, "cells": [{"id": 53, "text": "Model", "bbox": {"l": 78.843002, "t": 420.69037, "r": 104.85535, "b": 429.59692, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "TEDS", "bbox": {"l": 211.2, "t": 414.71237, "r": 236.10649, "b": 423.61893, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "Dataset", "bbox": {"l": 129.338, "t": 426.66736, "r": 159.21584, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Simple", "bbox": {"l": 171.17096, "t": 426.66736, "r": 199.40497, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Complex", "bbox": {"l": 211.36009, "t": 426.66736, "r": 247.74349999999998, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "All", "bbox": {"l": 264.54044, "t": 426.66736, "r": 277.27264, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "EDD", "bbox": {"l": 81.612, "t": 443.62436, "r": 102.08514, "b": 452.53091, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "PTN", "bbox": {"l": 134.87206, "t": 443.62436, "r": 153.69141, "b": 452.53091, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "91.1", "bbox": {"l": 176.56554, "t": 443.62436, "r": 194.00009, "b": 452.53091, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "88.7", "bbox": {"l": 220.82938000000001, "t": 443.62436, "r": 238.26393, "b": 452.53091, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "89.9", "bbox": {"l": 262.18414, "t": 443.62436, "r": 279.61868, "b": 452.53091, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "GTE", "bbox": {"l": 82.165001, "t": 455.58035, "r": 101.5323, "b": 464.48691, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "PTN", "bbox": {"l": 134.86716, "t": 455.58035, "r": 153.68651, "b": 464.48691, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "-", "bbox": {"l": 183.62411, "t": 455.58035, "r": 186.94167, "b": 464.48691, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "-", "bbox": {"l": 227.88795000000002, "t": 455.58035, "r": 231.20551, "b": 464.48691, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "93.01", "bbox": {"l": 259.69855, "t": 455.58035, "r": 282.11441, "b": 464.48691, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 468.13336, "r": 117.38329000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "PTN", "bbox": {"l": 134.86766, "t": 468.13336, "r": 153.68701, "b": 477.03992, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "98.5", "bbox": {"l": 176.57111, "t": 468.13336, "r": 194.00566, "b": 477.03992, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "95.0", "bbox": {"l": 220.83495, "t": 468.13336, "r": 238.26950000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "96.75", "bbox": {"l": 259.698, "t": 468.01379, "r": 282.11386, "b": 476.97018, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "EDD", "bbox": {"l": 81.612, "t": 483.32635, "r": 102.08514, "b": 492.23291, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "FTN", "bbox": {"l": 134.87206, "t": 483.32635, "r": 153.69141, "b": 492.23291, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "88.4", "bbox": {"l": 176.56554, "t": 483.32635, "r": 194.00009, "b": 492.23291, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "92.08", "bbox": {"l": 218.33870999999996, "t": 483.32635, "r": 240.75455999999997, "b": 492.23291, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "90.6", "bbox": {"l": 262.18411, "t": 483.32635, "r": 279.61865, "b": 492.23291, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "GTE", "bbox": {"l": 82.165001, "t": 495.28134, "r": 101.5323, "b": 504.1879, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "FTN", "bbox": {"l": 134.86716, "t": 495.28134, "r": 153.68651, "b": 504.1879, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "-", "bbox": {"l": 183.62411, "t": 495.28134, "r": 186.94167, "b": 504.1879, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "-", "bbox": {"l": 227.88795000000002, "t": 495.28134, "r": 231.20551, "b": 504.1879, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "87.14", "bbox": {"l": 259.69855, "t": 495.28134, "r": 282.11441, "b": 504.1879, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "GTE (FT)", "bbox": {"l": 71.789001, "t": 507.23633, "r": 111.90838999999998, "b": 516.14288, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "FTN", "bbox": {"l": 134.86221, "t": 507.23633, "r": 153.68156, "b": 516.14288, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "-", "bbox": {"l": 183.62914, "t": 507.23633, "r": 186.94669, "b": 516.14288, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "-", "bbox": {"l": 227.89297, "t": 507.23633, "r": 231.21053000000003, "b": 516.14288, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "91.02", "bbox": {"l": 259.6936, "t": 507.23633, "r": 282.10947, "b": 516.14288, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 519.1913099999999, "r": 117.38329000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "FTN", "bbox": {"l": 134.86766, "t": 519.1913099999999, "r": 153.68701, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "97.5", "bbox": {"l": 176.57111, "t": 519.1913099999999, "r": 194.00566, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "96.0", "bbox": {"l": 220.83495, "t": 519.1913099999999, "r": 238.26950000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "96.8", "bbox": {"l": 262.189, "t": 519.0717500000001, "r": 279.62354, "b": 528.02814, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "EDD", "bbox": {"l": 81.612, "t": 536.49837, "r": 102.08514, "b": 545.40492, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "TB", "bbox": {"l": 137.91064, "t": 536.49837, "r": 150.64285, "b": 545.40492, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "86.0", "bbox": {"l": 176.56554, "t": 536.49837, "r": 194.00009, "b": 545.40492, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "-", "bbox": {"l": 227.89285, "t": 536.49837, "r": 231.21040000000002, "b": 545.40492, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "86.0", "bbox": {"l": 262.18411, "t": 536.49837, "r": 279.61865, "b": 545.40492, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 548.45436, "r": 117.38329000000002, "b": 557.36092, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "TB", "bbox": {"l": 137.90625, "t": 548.45436, "r": 150.63846, "b": 557.36092, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "89.6", "bbox": {"l": 176.57111, "t": 548.45436, "r": 194.00566, "b": 557.36092, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "-", "bbox": {"l": 227.88845999999998, "t": 548.45436, "r": 231.20601, "b": 557.36092, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "89.6", "bbox": {"l": 262.189, "t": 548.3348100000001, "r": 279.62354, "b": 557.2911799999999, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 568.00237, "r": 117.38329000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "STN", "bbox": {"l": 134.86766, "t": 568.00237, "r": 153.68701, "b": 576.90892, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "96.9", "bbox": {"l": 176.57111, "t": 568.00237, "r": 194.00566, "b": 576.90892, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "95.7", "bbox": {"l": 220.83495, "t": 568.00237, "r": 238.26950000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "96.7", "bbox": {"l": 262.1897, "t": 568.00237, "r": 279.62424, "b": 576.90892, "coord_origin": "TOPLEFT"}}], "children": [{"id": 17, "label": "text", "bbox": {"l": 78.843002, "t": 420.69037, "r": 104.85535, "b": 429.59692, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "Model", "bbox": {"l": 78.843002, "t": 420.69037, "r": 104.85535, "b": 429.59692, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 211.2, "t": 414.71237, "r": 236.10649, "b": 423.61893, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "TEDS", "bbox": {"l": 211.2, "t": 414.71237, "r": 236.10649, "b": 423.61893, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 129.338, "t": 426.66736, "r": 159.21584, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "Dataset", "bbox": {"l": 129.338, "t": 426.66736, "r": 159.21584, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 171.17096, "t": 426.66736, "r": 199.40497, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "Simple", "bbox": {"l": 171.17096, "t": 426.66736, "r": 199.40497, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 211.36009, "t": 426.66736, "r": 247.74349999999998, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "Complex", "bbox": {"l": 211.36009, "t": 426.66736, "r": 247.74349999999998, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 264.54044, "t": 426.66736, "r": 277.27264, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "All", "bbox": {"l": 264.54044, "t": 426.66736, "r": 277.27264, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 81.612, "t": 443.62436, "r": 102.08514, "b": 452.53091, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "EDD", "bbox": {"l": 81.612, "t": 443.62436, "r": 102.08514, "b": 452.53091, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 134.87206, "t": 443.62436, "r": 153.69141, "b": 452.53091, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "PTN", "bbox": {"l": 134.87206, "t": 443.62436, "r": 153.69141, "b": 452.53091, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 176.56554, "t": 443.62436, "r": 194.00009, "b": 452.53091, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "91.1", "bbox": {"l": 176.56554, "t": 443.62436, "r": 194.00009, "b": 452.53091, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 220.82938000000001, "t": 443.62436, "r": 238.26393, "b": 452.53091, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "88.7", "bbox": {"l": 220.82938000000001, "t": 443.62436, "r": 238.26393, "b": 452.53091, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 262.18414, "t": 443.62436, "r": 279.61868, "b": 452.53091, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "89.9", "bbox": {"l": 262.18414, "t": 443.62436, "r": 279.61868, "b": 452.53091, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 82.165001, "t": 455.58035, "r": 101.5323, "b": 464.48691, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "GTE", "bbox": {"l": 82.165001, "t": 455.58035, "r": 101.5323, "b": 464.48691, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 134.86716, "t": 455.58035, "r": 153.68651, "b": 464.48691, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "PTN", "bbox": {"l": 134.86716, "t": 455.58035, "r": 153.68651, "b": 464.48691, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 183.62411, "t": 455.58035, "r": 186.94167, "b": 464.48691, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "-", "bbox": {"l": 183.62411, "t": 455.58035, "r": 186.94167, "b": 464.48691, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 227.88795000000002, "t": 455.58035, "r": 231.20551, "b": 464.48691, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "-", "bbox": {"l": 227.88795000000002, "t": 455.58035, "r": 231.20551, "b": 464.48691, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 259.69855, "t": 455.58035, "r": 282.11441, "b": 464.48691, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "93.01", "bbox": {"l": 259.69855, "t": 455.58035, "r": 282.11441, "b": 464.48691, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 66.315002, "t": 468.13336, "r": 117.38329000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 468.13336, "r": 117.38329000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 134.86766, "t": 468.13336, "r": 153.68701, "b": 477.03992, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "PTN", "bbox": {"l": 134.86766, "t": 468.13336, "r": 153.68701, "b": 477.03992, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 176.57111, "t": 468.13336, "r": 194.00566, "b": 477.03992, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "98.5", "bbox": {"l": 176.57111, "t": 468.13336, "r": 194.00566, "b": 477.03992, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 220.83495, "t": 468.13336, "r": 238.26950000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "95.0", "bbox": {"l": 220.83495, "t": 468.13336, "r": 238.26950000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 259.698, "t": 468.01379, "r": 282.11386, "b": 476.97018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "96.75", "bbox": {"l": 259.698, "t": 468.01379, "r": 282.11386, "b": 476.97018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 81.612, "t": 483.32635, "r": 102.08514, "b": 492.23291, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "EDD", "bbox": {"l": 81.612, "t": 483.32635, "r": 102.08514, "b": 492.23291, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 134.87206, "t": 483.32635, "r": 153.69141, "b": 492.23291, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "FTN", "bbox": {"l": 134.87206, "t": 483.32635, "r": 153.69141, "b": 492.23291, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 176.56554, "t": 483.32635, "r": 194.00009, "b": 492.23291, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "88.4", "bbox": {"l": 176.56554, "t": 483.32635, "r": 194.00009, "b": 492.23291, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 218.33870999999996, "t": 483.32635, "r": 240.75455999999997, "b": 492.23291, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "92.08", "bbox": {"l": 218.33870999999996, "t": 483.32635, "r": 240.75455999999997, "b": 492.23291, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 262.18411, "t": 483.32635, "r": 279.61865, "b": 492.23291, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "90.6", "bbox": {"l": 262.18411, "t": 483.32635, "r": 279.61865, "b": 492.23291, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 82.165001, "t": 495.28134, "r": 101.5323, "b": 504.1879, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "GTE", "bbox": {"l": 82.165001, "t": 495.28134, "r": 101.5323, "b": 504.1879, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 134.86716, "t": 495.28134, "r": 153.68651, "b": 504.1879, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "FTN", "bbox": {"l": 134.86716, "t": 495.28134, "r": 153.68651, "b": 504.1879, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 183.62411, "t": 495.28134, "r": 186.94167, "b": 504.1879, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "-", "bbox": {"l": 183.62411, "t": 495.28134, "r": 186.94167, "b": 504.1879, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 227.88795000000002, "t": 495.28134, "r": 231.20551, "b": 504.1879, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "-", "bbox": {"l": 227.88795000000002, "t": 495.28134, "r": 231.20551, "b": 504.1879, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 259.69855, "t": 495.28134, "r": 282.11441, "b": 504.1879, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "87.14", "bbox": {"l": 259.69855, "t": 495.28134, "r": 282.11441, "b": 504.1879, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 71.789001, "t": 507.23633, "r": 111.90838999999998, "b": 516.14288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "GTE (FT)", "bbox": {"l": 71.789001, "t": 507.23633, "r": 111.90838999999998, "b": 516.14288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 134.86221, "t": 507.23633, "r": 153.68156, "b": 516.14288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "FTN", "bbox": {"l": 134.86221, "t": 507.23633, "r": 153.68156, "b": 516.14288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 183.62914, "t": 507.23633, "r": 186.94669, "b": 516.14288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "-", "bbox": {"l": 183.62914, "t": 507.23633, "r": 186.94669, "b": 516.14288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 227.89297, "t": 507.23633, "r": 231.21053000000003, "b": 516.14288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "-", "bbox": {"l": 227.89297, "t": 507.23633, "r": 231.21053000000003, "b": 516.14288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 259.6936, "t": 507.23633, "r": 282.10947, "b": 516.14288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "91.02", "bbox": {"l": 259.6936, "t": 507.23633, "r": 282.10947, "b": 516.14288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 66.315002, "t": 519.1913099999999, "r": 117.38329000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 519.1913099999999, "r": 117.38329000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 134.86766, "t": 519.1913099999999, "r": 153.68701, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "FTN", "bbox": {"l": 134.86766, "t": 519.1913099999999, "r": 153.68701, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 176.57111, "t": 519.1913099999999, "r": 194.00566, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "97.5", "bbox": {"l": 176.57111, "t": 519.1913099999999, "r": 194.00566, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 220.83495, "t": 519.1913099999999, "r": 238.26950000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "96.0", "bbox": {"l": 220.83495, "t": 519.1913099999999, "r": 238.26950000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 262.189, "t": 519.0717500000001, "r": 279.62354, "b": 528.02814, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "96.8", "bbox": {"l": 262.189, "t": 519.0717500000001, "r": 279.62354, "b": 528.02814, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 81.612, "t": 536.49837, "r": 102.08514, "b": 545.40492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "EDD", "bbox": {"l": 81.612, "t": 536.49837, "r": 102.08514, "b": 545.40492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 137.91064, "t": 536.49837, "r": 150.64285, "b": 545.40492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "TB", "bbox": {"l": 137.91064, "t": 536.49837, "r": 150.64285, "b": 545.40492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 176.56554, "t": 536.49837, "r": 194.00009, "b": 545.40492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "86.0", "bbox": {"l": 176.56554, "t": 536.49837, "r": 194.00009, "b": 545.40492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 227.89285, "t": 536.49837, "r": 231.21040000000002, "b": 545.40492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "-", "bbox": {"l": 227.89285, "t": 536.49837, "r": 231.21040000000002, "b": 545.40492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 262.18411, "t": 536.49837, "r": 279.61865, "b": 545.40492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "86.0", "bbox": {"l": 262.18411, "t": 536.49837, "r": 279.61865, "b": 545.40492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 66.315002, "t": 548.45436, "r": 117.38329000000002, "b": 557.36092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 548.45436, "r": 117.38329000000002, "b": 557.36092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 137.90625, "t": 548.45436, "r": 150.63846, "b": 557.36092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "TB", "bbox": {"l": 137.90625, "t": 548.45436, "r": 150.63846, "b": 557.36092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 176.57111, "t": 548.45436, "r": 194.00566, "b": 557.36092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "89.6", "bbox": {"l": 176.57111, "t": 548.45436, "r": 194.00566, "b": 557.36092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 227.88845999999998, "t": 548.45436, "r": 231.20601, "b": 557.36092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "-", "bbox": {"l": 227.88845999999998, "t": 548.45436, "r": 231.20601, "b": 557.36092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 262.189, "t": 548.3348100000001, "r": 279.62354, "b": 557.2911799999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": "89.6", "bbox": {"l": 262.189, "t": 548.3348100000001, "r": 279.62354, "b": 557.2911799999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 66.315002, "t": 568.00237, "r": 117.38329000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 568.00237, "r": 117.38329000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 134.86766, "t": 568.00237, "r": 153.68701, "b": 576.90892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "STN", "bbox": {"l": 134.86766, "t": 568.00237, "r": 153.68701, "b": 576.90892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 176.57111, "t": 568.00237, "r": 194.00566, "b": 576.90892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": "96.9", "bbox": {"l": 176.57111, "t": 568.00237, "r": 194.00566, "b": 576.90892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 220.83495, "t": 568.00237, "r": 238.26950000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 107, "text": "95.7", "bbox": {"l": 220.83495, "t": 568.00237, "r": 238.26950000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 262.1897, "t": 568.00237, "r": 279.62424, "b": 576.90892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 108, "text": "96.7", "bbox": {"l": 262.1897, "t": 568.00237, "r": 279.62424, "b": 576.90892, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 11, "num_cols": 5, "table_cells": [{"bbox": {"l": 78.843002, "t": 420.69037, "r": 104.85535, "b": 429.59692, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Model", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 211.2, "t": 414.71237, "r": 247.74349999999998, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "TEDS Complex", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 129.338, "t": 426.66736, "r": 159.21584, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Dataset", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 171.17096, "t": 426.66736, "r": 199.40497, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Simple", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 264.54044, "t": 426.66736, "r": 277.27264, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "All", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 81.612, "t": 443.62436, "r": 102.08514, "b": 452.53091, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "EDD", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.87206, "t": 443.62436, "r": 153.69141, "b": 452.53091, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "PTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.56554, "t": 443.62436, "r": 194.00009, "b": 452.53091, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "91.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 220.82938000000001, "t": 443.62436, "r": 238.26393, "b": 452.53091, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "88.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 262.18414, "t": 443.62436, "r": 279.61868, "b": 452.53091, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "89.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 82.165001, "t": 455.58035, "r": 101.5323, "b": 464.48691, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "GTE", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.86716, "t": 455.58035, "r": 153.68651, "b": 464.48691, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "PTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 183.62411, "t": 455.58035, "r": 186.94167, "b": 464.48691, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 227.88795000000002, "t": 455.58035, "r": 231.20551, "b": 464.48691, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 259.69855, "t": 455.58035, "r": 282.11441, "b": 464.48691, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "93.01", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 66.315002, "t": 468.13336, "r": 117.38329000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.86766, "t": 468.13336, "r": 153.68701, "b": 477.03992, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "PTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.57111, "t": 468.13336, "r": 194.00566, "b": 477.03992, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "98.5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 220.83495, "t": 468.13336, "r": 238.26950000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "95.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 259.698, "t": 468.01379, "r": 282.11386, "b": 476.97018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "96.75", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 81.612, "t": 483.32635, "r": 102.08514, "b": 492.23291, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "EDD", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.87206, "t": 483.32635, "r": 153.69141, "b": 492.23291, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "FTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.56554, "t": 483.32635, "r": 194.00009, "b": 492.23291, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "88.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 218.33870999999996, "t": 483.32635, "r": 240.75455999999997, "b": 492.23291, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "92.08", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 262.18411, "t": 483.32635, "r": 279.61865, "b": 492.23291, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "90.6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 82.165001, "t": 495.28134, "r": 101.5323, "b": 504.1879, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "GTE", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.86716, "t": 495.28134, "r": 153.68651, "b": 504.1879, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "FTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 183.62411, "t": 495.28134, "r": 186.94167, "b": 504.1879, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 227.88795000000002, "t": 495.28134, "r": 231.20551, "b": 504.1879, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 259.69855, "t": 495.28134, "r": 282.11441, "b": 504.1879, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "87.14", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 71.789001, "t": 507.23633, "r": 111.90838999999998, "b": 516.14288, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "GTE (FT)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.86221, "t": 507.23633, "r": 153.68156, "b": 516.14288, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "FTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 183.62914, "t": 507.23633, "r": 186.94669, "b": 516.14288, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 227.89297, "t": 507.23633, "r": 231.21053000000003, "b": 516.14288, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 259.6936, "t": 507.23633, "r": 282.10947, "b": 516.14288, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "91.02", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 66.315002, "t": 519.1913099999999, "r": 117.38329000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.86766, "t": 519.1913099999999, "r": 153.68701, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "FTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.57111, "t": 519.1913099999999, "r": 194.00566, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "97.5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 220.83495, "t": 519.1913099999999, "r": 238.26950000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "96.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 262.189, "t": 519.0717500000001, "r": 279.62354, "b": 528.02814, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "96.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 81.612, "t": 536.49837, "r": 102.08514, "b": 545.40492, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "EDD", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 137.91064, "t": 536.49837, "r": 150.64285, "b": 545.40492, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "TB", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.56554, "t": 536.49837, "r": 194.00009, "b": 545.40492, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "86.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 227.89285, "t": 536.49837, "r": 231.21040000000002, "b": 545.40492, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 262.18411, "t": 536.49837, "r": 279.61865, "b": 545.40492, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "86.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 66.315002, "t": 548.45436, "r": 117.38329000000002, "b": 557.36092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 137.90625, "t": 548.45436, "r": 150.63846, "b": 557.36092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "TB", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.57111, "t": 548.45436, "r": 194.00566, "b": 557.36092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "89.6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 227.88845999999998, "t": 548.45436, "r": 231.20601, "b": 557.36092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 262.189, "t": 548.3348100000001, "r": 279.62354, "b": 557.2911799999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "89.6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 66.315002, "t": 568.00237, "r": 117.38329000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.86766, "t": 568.00237, "r": 153.68701, "b": 576.90892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "STN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.57111, "t": 568.00237, "r": 194.00566, "b": 576.90892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "96.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 220.83495, "t": 568.00237, "r": 238.26950000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "95.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 262.1897, "t": 568.00237, "r": 279.62424, "b": 576.90892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "96.7", "column_header": false, "row_header": false, "row_section": false}]}, "8": {"label": "table", "id": 8, "page_no": 6, "cluster": {"id": 8, "label": "table", "bbox": {"l": 308.4068908691406, "t": 247.87631225585938, "r": 533.6420288085938, "b": 303.8056640625, "coord_origin": "TOPLEFT"}, "confidence": 0.9691731929779053, "cells": [{"id": 146, "text": "Model", "bbox": {"l": 339.323, "t": 253.66436999999996, "r": 365.33536, "b": 262.57092, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "Dataset", "bbox": {"l": 401.04132, "t": 253.66436999999996, "r": 430.91916, "b": 262.57092, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "mAP", "bbox": {"l": 454.10214, "t": 253.66436999999996, "r": 474.58523999999994, "b": 262.57092, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "mAP (PP)", "bbox": {"l": 486.54034, "t": 253.66436999999996, "r": 527.2276, "b": 262.57092, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "EDD+BBox", "bbox": {"l": 327.65601, "t": 270.62134000000003, "r": 377.00076, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "PubTabNet", "bbox": {"l": 393.69809, "t": 270.62134000000003, "r": 438.28073, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "79.2", "bbox": {"l": 455.63559, "t": 270.62134000000003, "r": 473.07013, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "82.7", "bbox": {"l": 498.16592, "t": 270.62134000000003, "r": 515.60046, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "TableFormer", "bbox": {"l": 326.79501, "t": 282.57631999999995, "r": 377.86331, "b": 291.48288, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "PubTabNet", "bbox": {"l": 393.69388, "t": 282.57631999999995, "r": 438.27652, "b": 291.48288, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "82.1", "bbox": {"l": 455.63101, "t": 282.45676, "r": 473.06555000000003, "b": 291.41315, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "86.8", "bbox": {"l": 498.1713, "t": 282.45676, "r": 515.60583, "b": 291.41315, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "TableFormer", "bbox": {"l": 326.79501, "t": 294.53131, "r": 377.86331, "b": 303.43787, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "SynthTabNet", "bbox": {"l": 389.81842, "t": 294.53131, "r": 442.15194999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "87.7", "bbox": {"l": 455.63135, "t": 294.53131, "r": 473.06589, "b": 303.43787, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "-", "bbox": {"l": 505.22515999999996, "t": 294.53131, "r": 508.54268999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}}], "children": [{"id": 73, "label": "text", "bbox": {"l": 339.323, "t": 253.66436999999996, "r": 365.33536, "b": 262.57092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 146, "text": "Model", "bbox": {"l": 339.323, "t": 253.66436999999996, "r": 365.33536, "b": 262.57092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 401.04132, "t": 253.66436999999996, "r": 430.91916, "b": 262.57092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 147, "text": "Dataset", "bbox": {"l": 401.04132, "t": 253.66436999999996, "r": 430.91916, "b": 262.57092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 454.10214, "t": 253.66436999999996, "r": 474.58523999999994, "b": 262.57092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 148, "text": "mAP", "bbox": {"l": 454.10214, "t": 253.66436999999996, "r": 474.58523999999994, "b": 262.57092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 486.54034, "t": 253.66436999999996, "r": 527.2276, "b": 262.57092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 149, "text": "mAP (PP)", "bbox": {"l": 486.54034, "t": 253.66436999999996, "r": 527.2276, "b": 262.57092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 327.65601, "t": 270.62134000000003, "r": 377.00076, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 150, "text": "EDD+BBox", "bbox": {"l": 327.65601, "t": 270.62134000000003, "r": 377.00076, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 393.69809, "t": 270.62134000000003, "r": 438.28073, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 151, "text": "PubTabNet", "bbox": {"l": 393.69809, "t": 270.62134000000003, "r": 438.28073, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 455.63559, "t": 270.62134000000003, "r": 473.07013, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 152, "text": "79.2", "bbox": {"l": 455.63559, "t": 270.62134000000003, "r": 473.07013, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 498.16592, "t": 270.62134000000003, "r": 515.60046, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 153, "text": "82.7", "bbox": {"l": 498.16592, "t": 270.62134000000003, "r": 515.60046, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 326.79501, "t": 282.57631999999995, "r": 377.86331, "b": 291.48288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 154, "text": "TableFormer", "bbox": {"l": 326.79501, "t": 282.57631999999995, "r": 377.86331, "b": 291.48288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 393.69388, "t": 282.57631999999995, "r": 438.27652, "b": 291.48288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 155, "text": "PubTabNet", "bbox": {"l": 393.69388, "t": 282.57631999999995, "r": 438.27652, "b": 291.48288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 455.63101, "t": 282.45676, "r": 473.06555000000003, "b": 291.41315, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 156, "text": "82.1", "bbox": {"l": 455.63101, "t": 282.45676, "r": 473.06555000000003, "b": 291.41315, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 498.1713, "t": 282.45676, "r": 515.60583, "b": 291.41315, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 157, "text": "86.8", "bbox": {"l": 498.1713, "t": 282.45676, "r": 515.60583, "b": 291.41315, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 326.79501, "t": 294.53131, "r": 377.86331, "b": 303.43787, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 158, "text": "TableFormer", "bbox": {"l": 326.79501, "t": 294.53131, "r": 377.86331, "b": 303.43787, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 389.81842, "t": 294.53131, "r": 442.15194999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 159, "text": "SynthTabNet", "bbox": {"l": 389.81842, "t": 294.53131, "r": 442.15194999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 455.63135, "t": 294.53131, "r": 473.06589, "b": 303.43787, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 160, "text": "87.7", "bbox": {"l": 455.63135, "t": 294.53131, "r": 473.06589, "b": 303.43787, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 505.22515999999996, "t": 294.53131, "r": 508.54268999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 161, "text": "-", "bbox": {"l": 505.22515999999996, "t": 294.53131, "r": 508.54268999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 4, "num_cols": 4, "table_cells": [{"bbox": {"l": 339.323, "t": 253.66436999999996, "r": 365.33536, "b": 262.57092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Model", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 401.04132, "t": 253.66436999999996, "r": 430.91916, "b": 262.57092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Dataset", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 454.10214, "t": 253.66436999999996, "r": 474.58523999999994, "b": 262.57092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "mAP", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 486.54034, "t": 253.66436999999996, "r": 527.2276, "b": 262.57092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "mAP (PP)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 327.65601, "t": 270.62134000000003, "r": 377.00076, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "EDD+BBox", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 393.69809, "t": 270.62134000000003, "r": 438.28073, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "PubTabNet", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 455.63559, "t": 270.62134000000003, "r": 473.07013, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "79.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 498.16592, "t": 270.62134000000003, "r": 515.60046, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "82.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.79501, "t": 282.57631999999995, "r": 377.86331, "b": 291.48288, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 393.69388, "t": 282.57631999999995, "r": 438.27652, "b": 291.48288, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "PubTabNet", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 455.63101, "t": 282.45676, "r": 473.06555000000003, "b": 291.41315, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "82.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 498.1713, "t": 282.45676, "r": 515.60583, "b": 291.41315, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "86.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.79501, "t": 294.53131, "r": 377.86331, "b": 303.43787, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 389.81842, "t": 294.53131, "r": 442.15194999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "SynthTabNet", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 455.63135, "t": 294.53131, "r": 473.06589, "b": 303.43787, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "87.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 505.22515999999996, "t": 294.53131, "r": 508.54268999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}]}, "5": {"label": "table", "id": 5, "page_no": 6, "cluster": {"id": 5, "label": "table", "bbox": {"l": 332.9688720703125, "t": 540.2835083007812, "r": 520.942138671875, "b": 643.2697143554688, "coord_origin": "TOPLEFT"}, "confidence": 0.9775568842887878, "cells": [{"id": 183, "text": "Model", "bbox": {"l": 358.01099, "t": 552.23337, "r": 384.02335, "b": 561.1399200000001, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "TEDS", "bbox": {"l": 449.03400000000005, "t": 546.25537, "r": 473.94049000000007, "b": 555.16193, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": "Simple", "bbox": {"l": 408.50598, "t": 558.21037, "r": 436.73999, "b": 567.11693, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "Complex", "bbox": {"l": 448.6951, "t": 558.21037, "r": 485.07849, "b": 567.11693, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "All", "bbox": {"l": 499.3848, "t": 558.21037, "r": 512.117, "b": 567.11693, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": "Tabula", "bbox": {"l": 357.68201, "t": 575.16736, "r": 384.3519, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "78.0", "bbox": {"l": 413.90097, "t": 575.16736, "r": 431.33550999999994, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "57.8", "bbox": {"l": 458.16479000000004, "t": 575.16736, "r": 475.59933000000007, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "67.9", "bbox": {"l": 497.0289, "t": 575.16736, "r": 514.46344, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": "Traprange", "bbox": {"l": 350.72299, "t": 587.12236, "r": 391.31064, "b": 596.02892, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "60.8", "bbox": {"l": 413.90582, "t": 587.12236, "r": 431.34036, "b": 596.02892, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "49.9", "bbox": {"l": 458.16965, "t": 587.12236, "r": 475.60419, "b": 596.02892, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "55.4", "bbox": {"l": 497.03374999999994, "t": 587.12236, "r": 514.46832, "b": 596.02892, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "Camelot", "bbox": {"l": 354.13599, "t": 599.07835, "r": 387.89923, "b": 607.98491, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "80.0", "bbox": {"l": 413.90161, "t": 599.07835, "r": 431.33615, "b": 607.98491, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "66.0", "bbox": {"l": 458.16544, "t": 599.07835, "r": 475.59998, "b": 607.98491, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "73.0", "bbox": {"l": 497.02954000000005, "t": 599.07835, "r": 514.46411, "b": 607.98491, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "Acrobat Pro", "bbox": {"l": 346.55899, "t": 611.03336, "r": 395.47534, "b": 619.93991, "coord_origin": "TOPLEFT"}}, {"id": 201, "text": "68.9", "bbox": {"l": 413.90616, "t": 611.03336, "r": 431.34069999999997, "b": 619.93991, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": "61.8", "bbox": {"l": 458.16998000000007, "t": 611.03336, "r": 475.60452, "b": 619.93991, "coord_origin": "TOPLEFT"}}, {"id": 203, "text": "65.3", "bbox": {"l": 497.03409, "t": 611.03336, "r": 514.46863, "b": 619.93991, "coord_origin": "TOPLEFT"}}, {"id": 204, "text": "EDD", "bbox": {"l": 360.78101, "t": 622.9883600000001, "r": 381.25415, "b": 631.89491, "coord_origin": "TOPLEFT"}}, {"id": 205, "text": "91.2", "bbox": {"l": 413.90158, "t": 622.9883600000001, "r": 431.33612, "b": 631.89491, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": "85.4", "bbox": {"l": 458.16541, "t": 622.9883600000001, "r": 475.59995000000004, "b": 631.89491, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": "88.3", "bbox": {"l": 497.0295100000001, "t": 622.9883600000001, "r": 514.46405, "b": 631.89491, "coord_origin": "TOPLEFT"}}, {"id": 208, "text": "TableFormer", "bbox": {"l": 345.483, "t": 634.94336, "r": 396.5513, "b": 643.84991, "coord_origin": "TOPLEFT"}}, {"id": 209, "text": "95.4", "bbox": {"l": 413.90616, "t": 634.94336, "r": 431.34069999999997, "b": 643.84991, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": "90.1", "bbox": {"l": 458.16998000000007, "t": 634.94336, "r": 475.60452, "b": 643.84991, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "93.6", "bbox": {"l": 497.03400000000005, "t": 634.82381, "r": 514.46857, "b": 643.78018, "coord_origin": "TOPLEFT"}}], "children": [{"id": 89, "label": "text", "bbox": {"l": 358.01099, "t": 552.23337, "r": 384.02335, "b": 561.1399200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 183, "text": "Model", "bbox": {"l": 358.01099, "t": 552.23337, "r": 384.02335, "b": 561.1399200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 449.03400000000005, "t": 546.25537, "r": 473.94049000000007, "b": 555.16193, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 184, "text": "TEDS", "bbox": {"l": 449.03400000000005, "t": 546.25537, "r": 473.94049000000007, "b": 555.16193, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 408.50598, "t": 558.21037, "r": 436.73999, "b": 567.11693, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 185, "text": "Simple", "bbox": {"l": 408.50598, "t": 558.21037, "r": 436.73999, "b": 567.11693, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 448.6951, "t": 558.21037, "r": 485.07849, "b": 567.11693, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 186, "text": "Complex", "bbox": {"l": 448.6951, "t": 558.21037, "r": 485.07849, "b": 567.11693, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 499.3848, "t": 558.21037, "r": 512.117, "b": 567.11693, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 187, "text": "All", "bbox": {"l": 499.3848, "t": 558.21037, "r": 512.117, "b": 567.11693, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 357.68201, "t": 575.16736, "r": 384.3519, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 188, "text": "Tabula", "bbox": {"l": 357.68201, "t": 575.16736, "r": 384.3519, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 413.90097, "t": 575.16736, "r": 431.33550999999994, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 189, "text": "78.0", "bbox": {"l": 413.90097, "t": 575.16736, "r": 431.33550999999994, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 458.16479000000004, "t": 575.16736, "r": 475.59933000000007, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 190, "text": "57.8", "bbox": {"l": 458.16479000000004, "t": 575.16736, "r": 475.59933000000007, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 497.0289, "t": 575.16736, "r": 514.46344, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 191, "text": "67.9", "bbox": {"l": 497.0289, "t": 575.16736, "r": 514.46344, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 350.72299, "t": 587.12236, "r": 391.31064, "b": 596.02892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 192, "text": "Traprange", "bbox": {"l": 350.72299, "t": 587.12236, "r": 391.31064, "b": 596.02892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 413.90582, "t": 587.12236, "r": 431.34036, "b": 596.02892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 193, "text": "60.8", "bbox": {"l": 413.90582, "t": 587.12236, "r": 431.34036, "b": 596.02892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 458.16965, "t": 587.12236, "r": 475.60419, "b": 596.02892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 194, "text": "49.9", "bbox": {"l": 458.16965, "t": 587.12236, "r": 475.60419, "b": 596.02892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 497.03374999999994, "t": 587.12236, "r": 514.46832, "b": 596.02892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 195, "text": "55.4", "bbox": {"l": 497.03374999999994, "t": 587.12236, "r": 514.46832, "b": 596.02892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 354.13599, "t": 599.07835, "r": 387.89923, "b": 607.98491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 196, "text": "Camelot", "bbox": {"l": 354.13599, "t": 599.07835, "r": 387.89923, "b": 607.98491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 413.90161, "t": 599.07835, "r": 431.33615, "b": 607.98491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 197, "text": "80.0", "bbox": {"l": 413.90161, "t": 599.07835, "r": 431.33615, "b": 607.98491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 458.16544, "t": 599.07835, "r": 475.59998, "b": 607.98491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 198, "text": "66.0", "bbox": {"l": 458.16544, "t": 599.07835, "r": 475.59998, "b": 607.98491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 497.02954000000005, "t": 599.07835, "r": 514.46411, "b": 607.98491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 199, "text": "73.0", "bbox": {"l": 497.02954000000005, "t": 599.07835, "r": 514.46411, "b": 607.98491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 346.55899, "t": 611.03336, "r": 395.47534, "b": 619.93991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 200, "text": "Acrobat Pro", "bbox": {"l": 346.55899, "t": 611.03336, "r": 395.47534, "b": 619.93991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 413.90616, "t": 611.03336, "r": 431.34069999999997, "b": 619.93991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 201, "text": "68.9", "bbox": {"l": 413.90616, "t": 611.03336, "r": 431.34069999999997, "b": 619.93991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 458.16998000000007, "t": 611.03336, "r": 475.60452, "b": 619.93991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 202, "text": "61.8", "bbox": {"l": 458.16998000000007, "t": 611.03336, "r": 475.60452, "b": 619.93991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 497.03409, "t": 611.03336, "r": 514.46863, "b": 619.93991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 203, "text": "65.3", "bbox": {"l": 497.03409, "t": 611.03336, "r": 514.46863, "b": 619.93991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 360.78101, "t": 622.9883600000001, "r": 381.25415, "b": 631.89491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 204, "text": "EDD", "bbox": {"l": 360.78101, "t": 622.9883600000001, "r": 381.25415, "b": 631.89491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 413.90158, "t": 622.9883600000001, "r": 431.33612, "b": 631.89491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 205, "text": "91.2", "bbox": {"l": 413.90158, "t": 622.9883600000001, "r": 431.33612, "b": 631.89491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 458.16541, "t": 622.9883600000001, "r": 475.59995000000004, "b": 631.89491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 206, "text": "85.4", "bbox": {"l": 458.16541, "t": 622.9883600000001, "r": 475.59995000000004, "b": 631.89491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 497.0295100000001, "t": 622.9883600000001, "r": 514.46405, "b": 631.89491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 207, "text": "88.3", "bbox": {"l": 497.0295100000001, "t": 622.9883600000001, "r": 514.46405, "b": 631.89491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 114, "label": "text", "bbox": {"l": 345.483, "t": 634.94336, "r": 396.5513, "b": 643.84991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 208, "text": "TableFormer", "bbox": {"l": 345.483, "t": 634.94336, "r": 396.5513, "b": 643.84991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 115, "label": "text", "bbox": {"l": 413.90616, "t": 634.94336, "r": 431.34069999999997, "b": 643.84991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 209, "text": "95.4", "bbox": {"l": 413.90616, "t": 634.94336, "r": 431.34069999999997, "b": 643.84991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 116, "label": "text", "bbox": {"l": 458.16998000000007, "t": 634.94336, "r": 475.60452, "b": 643.84991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 210, "text": "90.1", "bbox": {"l": 458.16998000000007, "t": 634.94336, "r": 475.60452, "b": 643.84991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 117, "label": "text", "bbox": {"l": 497.03400000000005, "t": 634.82381, "r": 514.46857, "b": 643.78018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 211, "text": "93.6", "bbox": {"l": 497.03400000000005, "t": 634.82381, "r": 514.46857, "b": 643.78018, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["fcel", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "nl"], "num_rows": 7, "num_cols": 4, "table_cells": [{"bbox": {"l": 358.01099, "t": 552.23337, "r": 384.02335, "b": 561.1399200000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Model", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 448.6951, "t": 546.25537, "r": 485.07849, "b": 567.11693, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "TEDS Complex", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 408.50598, "t": 558.21037, "r": 436.73999, "b": 567.11693, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Simple", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 499.3848, "t": 558.21037, "r": 512.117, "b": 567.11693, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "All", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 357.68201, "t": 575.16736, "r": 384.3519, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Tabula", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 413.90097, "t": 575.16736, "r": 431.33550999999994, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "78.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 458.16479000000004, "t": 575.16736, "r": 475.59933000000007, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "57.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 497.0289, "t": 575.16736, "r": 514.46344, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "67.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 350.72299, "t": 587.12236, "r": 391.31064, "b": 596.02892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Traprange", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 413.90582, "t": 587.12236, "r": 431.34036, "b": 596.02892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "60.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 458.16965, "t": 587.12236, "r": 475.60419, "b": 596.02892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "49.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 497.03374999999994, "t": 587.12236, "r": 514.46832, "b": 596.02892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "55.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 354.13599, "t": 599.07835, "r": 387.89923, "b": 607.98491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Camelot", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 413.90161, "t": 599.07835, "r": 431.33615, "b": 607.98491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "80.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 458.16544, "t": 599.07835, "r": 475.59998, "b": 607.98491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "66.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 497.02954000000005, "t": 599.07835, "r": 514.46411, "b": 607.98491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "73.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 346.55899, "t": 611.03336, "r": 395.47534, "b": 619.93991, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Acrobat Pro", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 413.90616, "t": 611.03336, "r": 431.34069999999997, "b": 619.93991, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "68.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 458.16998000000007, "t": 611.03336, "r": 475.60452, "b": 619.93991, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "61.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 497.03409, "t": 611.03336, "r": 514.46863, "b": 619.93991, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "65.3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 360.78101, "t": 622.9883600000001, "r": 381.25415, "b": 631.89491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "EDD", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 413.90158, "t": 622.9883600000001, "r": 431.33612, "b": 631.89491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "91.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 458.16541, "t": 622.9883600000001, "r": 475.59995000000004, "b": 631.89491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "85.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 497.0295100000001, "t": 622.9883600000001, "r": 514.46405, "b": 631.89491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "88.3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 345.483, "t": 634.94336, "r": 396.5513, "b": 643.84991, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 413.90616, "t": 634.94336, "r": 431.34069999999997, "b": 643.84991, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "95.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 458.16998000000007, "t": 634.94336, "r": 475.60452, "b": 643.84991, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "90.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 497.03400000000005, "t": 634.82381, "r": 514.46857, "b": 643.78018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "93.6", "column_header": false, "row_header": false, "row_section": false}]}}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "section_header", "id": 10, "page_no": 6, "cluster": {"id": 10, "label": "section_header", "bbox": {"l": 50.112, "t": 74.40137000000016, "r": 167.89825, "b": 84.25342, "coord_origin": "TOPLEFT"}, "confidence": 0.955427348613739, "cells": [{"id": 0, "text": "5.3.", "bbox": {"l": 50.112, "t": 74.40137000000016, "r": 63.704811, "b": 84.25342, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Datasets and Metrics", "bbox": {"l": 72.766685, "t": 74.40137000000016, "r": 167.89825, "b": 84.25342, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5.3. Datasets and Metrics"}, {"label": "text", "id": 1, "page_no": 6, "cluster": {"id": 1, "label": "text", "bbox": {"l": 50.112, "t": 93.35039999999992, "r": 286.36511, "b": 138.12298999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9862998127937317, "cells": [{"id": 2, "text": "The Tree-Edit-Distance-Based Similarity (TEDS) met-", "bbox": {"l": 62.067001, "t": 93.35039999999992, "r": 286.36499, "b": 102.25696000000016, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "ric was introduced in [37]. It represents the prediction, and", "bbox": {"l": 50.112, "t": 105.30542000000003, "r": 286.36511, "b": 114.21198000000015, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "ground-truth as a tree structure of HTML tags. This simi-", "bbox": {"l": 50.112, "t": 117.26044000000002, "r": 286.36505, "b": 126.16699000000006, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "larity is calculated as:", "bbox": {"l": 50.112, "t": 129.21642999999995, "r": 136.71687, "b": 138.12298999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The Tree-Edit-Distance-Based Similarity (TEDS) metric was introduced in [37]. It represents the prediction, and ground-truth as a tree structure of HTML tags. This similarity is calculated as:"}, {"label": "formula", "id": 13, "page_no": 6, "cluster": {"id": 13, "label": "formula", "bbox": {"l": 86.218994, "t": 150.31799, "r": 286.3624, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9500411748886108, "cells": [{"id": 6, "text": "TEDS (", "bbox": {"l": 86.218994, "t": 157.05798000000004, "r": 118.8784, "b": 165.90479000000005, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "T$_{a}$, T$_{b}$", "bbox": {"l": 118.87499, "t": 157.05798000000004, "r": 143.26962, "b": 165.90479000000005, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": ") = 1", "bbox": {"l": 143.76799, "t": 157.05798000000004, "r": 165.9019, "b": 165.90479000000005, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "\u2212", "bbox": {"l": 168.12099, "t": 156.50012000000004, "r": 175.8699, "b": 165.90479000000005, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "EditDist (", "bbox": {"l": 179.27899, "t": 150.31799, "r": 221.95677, "b": 159.16479000000004, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "T$_{a}$, T$_{b}$", "bbox": {"l": 221.95200000000003, "t": 150.31799, "r": 246.34663, "b": 159.16479000000004, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": ")", "bbox": {"l": 246.84499999999997, "t": 150.31799, "r": 250.71945, "b": 159.16479000000004, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "max (", "bbox": {"l": 182.21201, "t": 163.89197000000001, "r": 206.29161, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "|", "bbox": {"l": 206.289, "t": 163.33411, "r": 209.05661, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "T$_{a}$", "bbox": {"l": 209.056, "t": 163.89197000000001, "r": 219.19968, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "|", "bbox": {"l": 219.69700999999998, "t": 163.33411, "r": 222.46461000000002, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": ",", "bbox": {"l": 224.125, "t": 163.89197000000001, "r": 226.89261, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "|", "bbox": {"l": 228.55299000000002, "t": 163.33411, "r": 231.3206, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "T$_{b}$", "bbox": {"l": 231.31999, "t": 163.89197000000001, "r": 240.64563, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "|", "bbox": {"l": 241.144, "t": 163.33411, "r": 243.91161, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": ")", "bbox": {"l": 243.911, "t": 163.89197000000001, "r": 247.78545, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "(3)", "bbox": {"l": 274.746, "t": 157.21740999999997, "r": 286.3624, "b": 166.12396, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "TEDS ( T$_{a}$, T$_{b}$ ) = 1 \u2212 EditDist ( T$_{a}$, T$_{b}$ ) max ( | T$_{a}$ | , | T$_{b}$ | ) (3)"}, {"label": "text", "id": 6, "page_no": 6, "cluster": {"id": 6, "label": "text", "bbox": {"l": 50.111984, "t": 181.00298999999995, "r": 286.36285, "b": 213.97900000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9735319018363953, "cells": [{"id": 23, "text": "where", "bbox": {"l": 62.067001, "t": 181.16241000000002, "r": 86.405632, "b": 190.06897000000004, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "T$_{a}$", "bbox": {"l": 88.581001, "t": 181.00298999999995, "r": 98.724663, "b": 189.84978999999998, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "and", "bbox": {"l": 101.399, "t": 181.16241000000002, "r": 115.785, "b": 190.06897000000004, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "T$_{b}$", "bbox": {"l": 117.961, "t": 181.00298999999995, "r": 127.28664, "b": 189.84978999999998, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "represent tables in tree structure HTML", "bbox": {"l": 129.95999, "t": 181.16241000000002, "r": 286.36285, "b": 190.06897000000004, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "format. EditDist denotes the tree-edit distance, and", "bbox": {"l": 50.111992, "t": 193.11743, "r": 252.78116000000003, "b": 202.02399000000003, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "|", "bbox": {"l": 255.18201, "t": 192.40015000000005, "r": 257.94962, "b": 201.80480999999997, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "T", "bbox": {"l": 257.94901, "t": 192.95800999999994, "r": 263.77115, "b": 201.80480999999997, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "|", "bbox": {"l": 265.155, "t": 192.40015000000005, "r": 267.92261, "b": 201.80480999999997, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "rep-", "bbox": {"l": 270.32199, "t": 193.11743, "r": 286.36179, "b": 202.02399000000003, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "resents the number of nodes in", "bbox": {"l": 50.111984, "t": 205.07245, "r": 172.13388, "b": 213.97900000000004, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "T", "bbox": {"l": 174.62399, "t": 204.91301999999996, "r": 180.44614, "b": 213.75982999999997, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": ".", "bbox": {"l": 181.82899, "t": 205.07245, "r": 184.31964, "b": 213.97900000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "where T$_{a}$ and T$_{b}$ represent tables in tree structure HTML format. EditDist denotes the tree-edit distance, and | T | represents the number of nodes in T ."}, {"label": "section_header", "id": 9, "page_no": 6, "cluster": {"id": 9, "label": "section_header", "bbox": {"l": 50.112, "t": 224.81946000000005, "r": 170.45169, "b": 234.67151, "coord_origin": "TOPLEFT"}, "confidence": 0.9588837027549744, "cells": [{"id": 36, "text": "5.4.", "bbox": {"l": 50.112, "t": 224.81946000000005, "r": 64.551605, "b": 234.67151, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "Quantitative Analysis", "bbox": {"l": 74.178009, "t": 224.81946000000005, "r": 170.45169, "b": 234.67151, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5.4. Quantitative Analysis"}, {"label": "text", "id": 2, "page_no": 6, "cluster": {"id": 2, "label": "text", "bbox": {"l": 50.112, "t": 243.6499, "r": 286.36514, "b": 396.13794, "coord_origin": "TOPLEFT"}, "confidence": 0.9855090975761414, "cells": [{"id": 38, "text": "Structure.", "bbox": {"l": 62.067001, "t": 243.6499, "r": 105.32461, "b": 252.60626000000002, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "As shown in Tab.", "bbox": {"l": 112.12600000000002, "t": 243.76946999999996, "r": 184.68361, "b": 252.67602999999997, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "2, TableFormer outper-", "bbox": {"l": 191.4781, "t": 243.76946999999996, "r": 286.36188, "b": 252.67602999999997, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "forms all SOTA methods across different datasets by a large", "bbox": {"l": 50.112, "t": 255.72448999999995, "r": 286.36508, "b": 264.63104, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "margin for predicting the table structure from an image.", "bbox": {"l": 50.112, "t": 267.67949999999996, "r": 286.36508, "b": 276.58606, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "All the more, our model outperforms pre-trained methods.", "bbox": {"l": 50.112, "t": 279.63446, "r": 286.36508, "b": 288.54105, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "During the evaluation we do not apply any table filtering.", "bbox": {"l": 50.112, "t": 291.59048, "r": 286.36514, "b": 300.49704, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "We also provide our baseline results on the SynthTabNet", "bbox": {"l": 50.112, "t": 303.54547, "r": 286.36508, "b": 312.45203000000004, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "dataset. It has been observed that large tables (e.g. tables", "bbox": {"l": 50.112, "t": 315.50046, "r": 286.36505, "b": 324.40700999999996, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "that occupy half of the page or more) yield poor predictions.", "bbox": {"l": 50.112, "t": 327.45544, "r": 286.36508, "b": 336.362, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "We attribute this issue to the image resizing during the pre-", "bbox": {"l": 50.112, "t": 339.41043, "r": 286.36508, "b": 348.31699000000003, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "processing step, that produces downsampled images with", "bbox": {"l": 50.112, "t": 351.36542, "r": 286.36505, "b": 360.27197, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "indistinguishable features. This problem can be addressed", "bbox": {"l": 50.112, "t": 363.32141, "r": 286.36508, "b": 372.2279700000001, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "by treating such big tables with a separate model which ac-", "bbox": {"l": 50.112, "t": 375.2764, "r": 286.36511, "b": 384.18295000000006, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "cepts a large input image size.", "bbox": {"l": 50.112, "t": 387.23138, "r": 170.01187, "b": 396.13794, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Structure. As shown in Tab. 2, TableFormer outperforms all SOTA methods across different datasets by a large margin for predicting the table structure from an image. All the more, our model outperforms pre-trained methods. During the evaluation we do not apply any table filtering. We also provide our baseline results on the SynthTabNet dataset. It has been observed that large tables (e.g. tables that occupy half of the page or more) yield poor predictions. We attribute this issue to the image resizing during the preprocessing step, that produces downsampled images with indistinguishable features. This problem can be addressed by treating such big tables with a separate model which accepts a large input image size."}, {"label": "table", "id": 0, "page_no": 6, "cluster": {"id": 0, "label": "table", "bbox": {"l": 53.36848831176758, "t": 409.1357727050781, "r": 283.04437255859375, "b": 582.3977661132812, "coord_origin": "TOPLEFT"}, "confidence": 0.9892510175704956, "cells": [{"id": 53, "text": "Model", "bbox": {"l": 78.843002, "t": 420.69037, "r": 104.85535, "b": 429.59692, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "TEDS", "bbox": {"l": 211.2, "t": 414.71237, "r": 236.10649, "b": 423.61893, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "Dataset", "bbox": {"l": 129.338, "t": 426.66736, "r": 159.21584, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Simple", "bbox": {"l": 171.17096, "t": 426.66736, "r": 199.40497, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Complex", "bbox": {"l": 211.36009, "t": 426.66736, "r": 247.74349999999998, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "All", "bbox": {"l": 264.54044, "t": 426.66736, "r": 277.27264, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "EDD", "bbox": {"l": 81.612, "t": 443.62436, "r": 102.08514, "b": 452.53091, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "PTN", "bbox": {"l": 134.87206, "t": 443.62436, "r": 153.69141, "b": 452.53091, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "91.1", "bbox": {"l": 176.56554, "t": 443.62436, "r": 194.00009, "b": 452.53091, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "88.7", "bbox": {"l": 220.82938000000001, "t": 443.62436, "r": 238.26393, "b": 452.53091, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "89.9", "bbox": {"l": 262.18414, "t": 443.62436, "r": 279.61868, "b": 452.53091, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "GTE", "bbox": {"l": 82.165001, "t": 455.58035, "r": 101.5323, "b": 464.48691, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "PTN", "bbox": {"l": 134.86716, "t": 455.58035, "r": 153.68651, "b": 464.48691, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "-", "bbox": {"l": 183.62411, "t": 455.58035, "r": 186.94167, "b": 464.48691, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "-", "bbox": {"l": 227.88795000000002, "t": 455.58035, "r": 231.20551, "b": 464.48691, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "93.01", "bbox": {"l": 259.69855, "t": 455.58035, "r": 282.11441, "b": 464.48691, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 468.13336, "r": 117.38329000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "PTN", "bbox": {"l": 134.86766, "t": 468.13336, "r": 153.68701, "b": 477.03992, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "98.5", "bbox": {"l": 176.57111, "t": 468.13336, "r": 194.00566, "b": 477.03992, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "95.0", "bbox": {"l": 220.83495, "t": 468.13336, "r": 238.26950000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "96.75", "bbox": {"l": 259.698, "t": 468.01379, "r": 282.11386, "b": 476.97018, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "EDD", "bbox": {"l": 81.612, "t": 483.32635, "r": 102.08514, "b": 492.23291, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "FTN", "bbox": {"l": 134.87206, "t": 483.32635, "r": 153.69141, "b": 492.23291, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "88.4", "bbox": {"l": 176.56554, "t": 483.32635, "r": 194.00009, "b": 492.23291, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "92.08", "bbox": {"l": 218.33870999999996, "t": 483.32635, "r": 240.75455999999997, "b": 492.23291, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "90.6", "bbox": {"l": 262.18411, "t": 483.32635, "r": 279.61865, "b": 492.23291, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "GTE", "bbox": {"l": 82.165001, "t": 495.28134, "r": 101.5323, "b": 504.1879, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "FTN", "bbox": {"l": 134.86716, "t": 495.28134, "r": 153.68651, "b": 504.1879, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "-", "bbox": {"l": 183.62411, "t": 495.28134, "r": 186.94167, "b": 504.1879, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "-", "bbox": {"l": 227.88795000000002, "t": 495.28134, "r": 231.20551, "b": 504.1879, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "87.14", "bbox": {"l": 259.69855, "t": 495.28134, "r": 282.11441, "b": 504.1879, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "GTE (FT)", "bbox": {"l": 71.789001, "t": 507.23633, "r": 111.90838999999998, "b": 516.14288, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "FTN", "bbox": {"l": 134.86221, "t": 507.23633, "r": 153.68156, "b": 516.14288, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "-", "bbox": {"l": 183.62914, "t": 507.23633, "r": 186.94669, "b": 516.14288, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "-", "bbox": {"l": 227.89297, "t": 507.23633, "r": 231.21053000000003, "b": 516.14288, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "91.02", "bbox": {"l": 259.6936, "t": 507.23633, "r": 282.10947, "b": 516.14288, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 519.1913099999999, "r": 117.38329000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "FTN", "bbox": {"l": 134.86766, "t": 519.1913099999999, "r": 153.68701, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "97.5", "bbox": {"l": 176.57111, "t": 519.1913099999999, "r": 194.00566, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "96.0", "bbox": {"l": 220.83495, "t": 519.1913099999999, "r": 238.26950000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "96.8", "bbox": {"l": 262.189, "t": 519.0717500000001, "r": 279.62354, "b": 528.02814, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "EDD", "bbox": {"l": 81.612, "t": 536.49837, "r": 102.08514, "b": 545.40492, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "TB", "bbox": {"l": 137.91064, "t": 536.49837, "r": 150.64285, "b": 545.40492, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "86.0", "bbox": {"l": 176.56554, "t": 536.49837, "r": 194.00009, "b": 545.40492, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "-", "bbox": {"l": 227.89285, "t": 536.49837, "r": 231.21040000000002, "b": 545.40492, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "86.0", "bbox": {"l": 262.18411, "t": 536.49837, "r": 279.61865, "b": 545.40492, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 548.45436, "r": 117.38329000000002, "b": 557.36092, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "TB", "bbox": {"l": 137.90625, "t": 548.45436, "r": 150.63846, "b": 557.36092, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "89.6", "bbox": {"l": 176.57111, "t": 548.45436, "r": 194.00566, "b": 557.36092, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "-", "bbox": {"l": 227.88845999999998, "t": 548.45436, "r": 231.20601, "b": 557.36092, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "89.6", "bbox": {"l": 262.189, "t": 548.3348100000001, "r": 279.62354, "b": 557.2911799999999, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 568.00237, "r": 117.38329000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "STN", "bbox": {"l": 134.86766, "t": 568.00237, "r": 153.68701, "b": 576.90892, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "96.9", "bbox": {"l": 176.57111, "t": 568.00237, "r": 194.00566, "b": 576.90892, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "95.7", "bbox": {"l": 220.83495, "t": 568.00237, "r": 238.26950000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "96.7", "bbox": {"l": 262.1897, "t": 568.00237, "r": 279.62424, "b": 576.90892, "coord_origin": "TOPLEFT"}}], "children": [{"id": 17, "label": "text", "bbox": {"l": 78.843002, "t": 420.69037, "r": 104.85535, "b": 429.59692, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "Model", "bbox": {"l": 78.843002, "t": 420.69037, "r": 104.85535, "b": 429.59692, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 211.2, "t": 414.71237, "r": 236.10649, "b": 423.61893, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "TEDS", "bbox": {"l": 211.2, "t": 414.71237, "r": 236.10649, "b": 423.61893, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 129.338, "t": 426.66736, "r": 159.21584, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "Dataset", "bbox": {"l": 129.338, "t": 426.66736, "r": 159.21584, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 171.17096, "t": 426.66736, "r": 199.40497, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "Simple", "bbox": {"l": 171.17096, "t": 426.66736, "r": 199.40497, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 211.36009, "t": 426.66736, "r": 247.74349999999998, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "Complex", "bbox": {"l": 211.36009, "t": 426.66736, "r": 247.74349999999998, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 264.54044, "t": 426.66736, "r": 277.27264, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "All", "bbox": {"l": 264.54044, "t": 426.66736, "r": 277.27264, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 81.612, "t": 443.62436, "r": 102.08514, "b": 452.53091, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "EDD", "bbox": {"l": 81.612, "t": 443.62436, "r": 102.08514, "b": 452.53091, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 134.87206, "t": 443.62436, "r": 153.69141, "b": 452.53091, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "PTN", "bbox": {"l": 134.87206, "t": 443.62436, "r": 153.69141, "b": 452.53091, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 176.56554, "t": 443.62436, "r": 194.00009, "b": 452.53091, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "91.1", "bbox": {"l": 176.56554, "t": 443.62436, "r": 194.00009, "b": 452.53091, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 220.82938000000001, "t": 443.62436, "r": 238.26393, "b": 452.53091, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "88.7", "bbox": {"l": 220.82938000000001, "t": 443.62436, "r": 238.26393, "b": 452.53091, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 262.18414, "t": 443.62436, "r": 279.61868, "b": 452.53091, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "89.9", "bbox": {"l": 262.18414, "t": 443.62436, "r": 279.61868, "b": 452.53091, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 82.165001, "t": 455.58035, "r": 101.5323, "b": 464.48691, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "GTE", "bbox": {"l": 82.165001, "t": 455.58035, "r": 101.5323, "b": 464.48691, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 134.86716, "t": 455.58035, "r": 153.68651, "b": 464.48691, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "PTN", "bbox": {"l": 134.86716, "t": 455.58035, "r": 153.68651, "b": 464.48691, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 183.62411, "t": 455.58035, "r": 186.94167, "b": 464.48691, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "-", "bbox": {"l": 183.62411, "t": 455.58035, "r": 186.94167, "b": 464.48691, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 227.88795000000002, "t": 455.58035, "r": 231.20551, "b": 464.48691, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "-", "bbox": {"l": 227.88795000000002, "t": 455.58035, "r": 231.20551, "b": 464.48691, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 259.69855, "t": 455.58035, "r": 282.11441, "b": 464.48691, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "93.01", "bbox": {"l": 259.69855, "t": 455.58035, "r": 282.11441, "b": 464.48691, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 66.315002, "t": 468.13336, "r": 117.38329000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 468.13336, "r": 117.38329000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 134.86766, "t": 468.13336, "r": 153.68701, "b": 477.03992, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "PTN", "bbox": {"l": 134.86766, "t": 468.13336, "r": 153.68701, "b": 477.03992, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 176.57111, "t": 468.13336, "r": 194.00566, "b": 477.03992, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "98.5", "bbox": {"l": 176.57111, "t": 468.13336, "r": 194.00566, "b": 477.03992, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 220.83495, "t": 468.13336, "r": 238.26950000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "95.0", "bbox": {"l": 220.83495, "t": 468.13336, "r": 238.26950000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 259.698, "t": 468.01379, "r": 282.11386, "b": 476.97018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "96.75", "bbox": {"l": 259.698, "t": 468.01379, "r": 282.11386, "b": 476.97018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 81.612, "t": 483.32635, "r": 102.08514, "b": 492.23291, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "EDD", "bbox": {"l": 81.612, "t": 483.32635, "r": 102.08514, "b": 492.23291, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 134.87206, "t": 483.32635, "r": 153.69141, "b": 492.23291, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "FTN", "bbox": {"l": 134.87206, "t": 483.32635, "r": 153.69141, "b": 492.23291, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 176.56554, "t": 483.32635, "r": 194.00009, "b": 492.23291, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "88.4", "bbox": {"l": 176.56554, "t": 483.32635, "r": 194.00009, "b": 492.23291, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 218.33870999999996, "t": 483.32635, "r": 240.75455999999997, "b": 492.23291, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "92.08", "bbox": {"l": 218.33870999999996, "t": 483.32635, "r": 240.75455999999997, "b": 492.23291, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 262.18411, "t": 483.32635, "r": 279.61865, "b": 492.23291, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "90.6", "bbox": {"l": 262.18411, "t": 483.32635, "r": 279.61865, "b": 492.23291, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 82.165001, "t": 495.28134, "r": 101.5323, "b": 504.1879, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "GTE", "bbox": {"l": 82.165001, "t": 495.28134, "r": 101.5323, "b": 504.1879, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 134.86716, "t": 495.28134, "r": 153.68651, "b": 504.1879, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "FTN", "bbox": {"l": 134.86716, "t": 495.28134, "r": 153.68651, "b": 504.1879, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 183.62411, "t": 495.28134, "r": 186.94167, "b": 504.1879, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "-", "bbox": {"l": 183.62411, "t": 495.28134, "r": 186.94167, "b": 504.1879, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 227.88795000000002, "t": 495.28134, "r": 231.20551, "b": 504.1879, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "-", "bbox": {"l": 227.88795000000002, "t": 495.28134, "r": 231.20551, "b": 504.1879, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 259.69855, "t": 495.28134, "r": 282.11441, "b": 504.1879, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "87.14", "bbox": {"l": 259.69855, "t": 495.28134, "r": 282.11441, "b": 504.1879, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 71.789001, "t": 507.23633, "r": 111.90838999999998, "b": 516.14288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "GTE (FT)", "bbox": {"l": 71.789001, "t": 507.23633, "r": 111.90838999999998, "b": 516.14288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 134.86221, "t": 507.23633, "r": 153.68156, "b": 516.14288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "FTN", "bbox": {"l": 134.86221, "t": 507.23633, "r": 153.68156, "b": 516.14288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 183.62914, "t": 507.23633, "r": 186.94669, "b": 516.14288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "-", "bbox": {"l": 183.62914, "t": 507.23633, "r": 186.94669, "b": 516.14288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 227.89297, "t": 507.23633, "r": 231.21053000000003, "b": 516.14288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "-", "bbox": {"l": 227.89297, "t": 507.23633, "r": 231.21053000000003, "b": 516.14288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 259.6936, "t": 507.23633, "r": 282.10947, "b": 516.14288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "91.02", "bbox": {"l": 259.6936, "t": 507.23633, "r": 282.10947, "b": 516.14288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 66.315002, "t": 519.1913099999999, "r": 117.38329000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 519.1913099999999, "r": 117.38329000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 134.86766, "t": 519.1913099999999, "r": 153.68701, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "FTN", "bbox": {"l": 134.86766, "t": 519.1913099999999, "r": 153.68701, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 176.57111, "t": 519.1913099999999, "r": 194.00566, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "97.5", "bbox": {"l": 176.57111, "t": 519.1913099999999, "r": 194.00566, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 220.83495, "t": 519.1913099999999, "r": 238.26950000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "96.0", "bbox": {"l": 220.83495, "t": 519.1913099999999, "r": 238.26950000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 262.189, "t": 519.0717500000001, "r": 279.62354, "b": 528.02814, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "96.8", "bbox": {"l": 262.189, "t": 519.0717500000001, "r": 279.62354, "b": 528.02814, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 81.612, "t": 536.49837, "r": 102.08514, "b": 545.40492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "EDD", "bbox": {"l": 81.612, "t": 536.49837, "r": 102.08514, "b": 545.40492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 137.91064, "t": 536.49837, "r": 150.64285, "b": 545.40492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "TB", "bbox": {"l": 137.91064, "t": 536.49837, "r": 150.64285, "b": 545.40492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 176.56554, "t": 536.49837, "r": 194.00009, "b": 545.40492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "86.0", "bbox": {"l": 176.56554, "t": 536.49837, "r": 194.00009, "b": 545.40492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 227.89285, "t": 536.49837, "r": 231.21040000000002, "b": 545.40492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "-", "bbox": {"l": 227.89285, "t": 536.49837, "r": 231.21040000000002, "b": 545.40492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 262.18411, "t": 536.49837, "r": 279.61865, "b": 545.40492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "86.0", "bbox": {"l": 262.18411, "t": 536.49837, "r": 279.61865, "b": 545.40492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 66.315002, "t": 548.45436, "r": 117.38329000000002, "b": 557.36092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 548.45436, "r": 117.38329000000002, "b": 557.36092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 137.90625, "t": 548.45436, "r": 150.63846, "b": 557.36092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "TB", "bbox": {"l": 137.90625, "t": 548.45436, "r": 150.63846, "b": 557.36092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 176.57111, "t": 548.45436, "r": 194.00566, "b": 557.36092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "89.6", "bbox": {"l": 176.57111, "t": 548.45436, "r": 194.00566, "b": 557.36092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 227.88845999999998, "t": 548.45436, "r": 231.20601, "b": 557.36092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "-", "bbox": {"l": 227.88845999999998, "t": 548.45436, "r": 231.20601, "b": 557.36092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 262.189, "t": 548.3348100000001, "r": 279.62354, "b": 557.2911799999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": "89.6", "bbox": {"l": 262.189, "t": 548.3348100000001, "r": 279.62354, "b": 557.2911799999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 66.315002, "t": 568.00237, "r": 117.38329000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 568.00237, "r": 117.38329000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 134.86766, "t": 568.00237, "r": 153.68701, "b": 576.90892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "STN", "bbox": {"l": 134.86766, "t": 568.00237, "r": 153.68701, "b": 576.90892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 176.57111, "t": 568.00237, "r": 194.00566, "b": 576.90892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": "96.9", "bbox": {"l": 176.57111, "t": 568.00237, "r": 194.00566, "b": 576.90892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 220.83495, "t": 568.00237, "r": 238.26950000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 107, "text": "95.7", "bbox": {"l": 220.83495, "t": 568.00237, "r": 238.26950000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 262.1897, "t": 568.00237, "r": 279.62424, "b": 576.90892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 108, "text": "96.7", "bbox": {"l": 262.1897, "t": 568.00237, "r": 279.62424, "b": 576.90892, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 11, "num_cols": 5, "table_cells": [{"bbox": {"l": 78.843002, "t": 420.69037, "r": 104.85535, "b": 429.59692, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Model", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 211.2, "t": 414.71237, "r": 247.74349999999998, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "TEDS Complex", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 129.338, "t": 426.66736, "r": 159.21584, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Dataset", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 171.17096, "t": 426.66736, "r": 199.40497, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Simple", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 264.54044, "t": 426.66736, "r": 277.27264, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "All", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 81.612, "t": 443.62436, "r": 102.08514, "b": 452.53091, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "EDD", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.87206, "t": 443.62436, "r": 153.69141, "b": 452.53091, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "PTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.56554, "t": 443.62436, "r": 194.00009, "b": 452.53091, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "91.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 220.82938000000001, "t": 443.62436, "r": 238.26393, "b": 452.53091, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "88.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 262.18414, "t": 443.62436, "r": 279.61868, "b": 452.53091, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "89.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 82.165001, "t": 455.58035, "r": 101.5323, "b": 464.48691, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "GTE", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.86716, "t": 455.58035, "r": 153.68651, "b": 464.48691, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "PTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 183.62411, "t": 455.58035, "r": 186.94167, "b": 464.48691, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 227.88795000000002, "t": 455.58035, "r": 231.20551, "b": 464.48691, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 259.69855, "t": 455.58035, "r": 282.11441, "b": 464.48691, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "93.01", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 66.315002, "t": 468.13336, "r": 117.38329000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.86766, "t": 468.13336, "r": 153.68701, "b": 477.03992, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "PTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.57111, "t": 468.13336, "r": 194.00566, "b": 477.03992, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "98.5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 220.83495, "t": 468.13336, "r": 238.26950000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "95.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 259.698, "t": 468.01379, "r": 282.11386, "b": 476.97018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "96.75", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 81.612, "t": 483.32635, "r": 102.08514, "b": 492.23291, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "EDD", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.87206, "t": 483.32635, "r": 153.69141, "b": 492.23291, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "FTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.56554, "t": 483.32635, "r": 194.00009, "b": 492.23291, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "88.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 218.33870999999996, "t": 483.32635, "r": 240.75455999999997, "b": 492.23291, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "92.08", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 262.18411, "t": 483.32635, "r": 279.61865, "b": 492.23291, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "90.6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 82.165001, "t": 495.28134, "r": 101.5323, "b": 504.1879, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "GTE", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.86716, "t": 495.28134, "r": 153.68651, "b": 504.1879, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "FTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 183.62411, "t": 495.28134, "r": 186.94167, "b": 504.1879, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 227.88795000000002, "t": 495.28134, "r": 231.20551, "b": 504.1879, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 259.69855, "t": 495.28134, "r": 282.11441, "b": 504.1879, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "87.14", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 71.789001, "t": 507.23633, "r": 111.90838999999998, "b": 516.14288, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "GTE (FT)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.86221, "t": 507.23633, "r": 153.68156, "b": 516.14288, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "FTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 183.62914, "t": 507.23633, "r": 186.94669, "b": 516.14288, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 227.89297, "t": 507.23633, "r": 231.21053000000003, "b": 516.14288, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 259.6936, "t": 507.23633, "r": 282.10947, "b": 516.14288, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "91.02", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 66.315002, "t": 519.1913099999999, "r": 117.38329000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.86766, "t": 519.1913099999999, "r": 153.68701, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "FTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.57111, "t": 519.1913099999999, "r": 194.00566, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "97.5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 220.83495, "t": 519.1913099999999, "r": 238.26950000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "96.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 262.189, "t": 519.0717500000001, "r": 279.62354, "b": 528.02814, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "96.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 81.612, "t": 536.49837, "r": 102.08514, "b": 545.40492, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "EDD", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 137.91064, "t": 536.49837, "r": 150.64285, "b": 545.40492, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "TB", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.56554, "t": 536.49837, "r": 194.00009, "b": 545.40492, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "86.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 227.89285, "t": 536.49837, "r": 231.21040000000002, "b": 545.40492, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 262.18411, "t": 536.49837, "r": 279.61865, "b": 545.40492, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "86.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 66.315002, "t": 548.45436, "r": 117.38329000000002, "b": 557.36092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 137.90625, "t": 548.45436, "r": 150.63846, "b": 557.36092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "TB", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.57111, "t": 548.45436, "r": 194.00566, "b": 557.36092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "89.6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 227.88845999999998, "t": 548.45436, "r": 231.20601, "b": 557.36092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 262.189, "t": 548.3348100000001, "r": 279.62354, "b": 557.2911799999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "89.6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 66.315002, "t": 568.00237, "r": 117.38329000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.86766, "t": 568.00237, "r": 153.68701, "b": 576.90892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "STN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.57111, "t": 568.00237, "r": 194.00566, "b": 576.90892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "96.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 220.83495, "t": 568.00237, "r": 238.26950000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "95.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 262.1897, "t": 568.00237, "r": 279.62424, "b": 576.90892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "96.7", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "text", "id": 15, "page_no": 6, "cluster": {"id": 15, "label": "text", "bbox": {"l": 50.112, "t": 592.43336, "r": 286.36511, "b": 613.29492, "coord_origin": "TOPLEFT"}, "confidence": 0.7209174633026123, "cells": [{"id": 109, "text": "Table 2: Structure results on PubTabNet (PTN), FinTabNet", "bbox": {"l": 50.112, "t": 592.43336, "r": 286.36511, "b": 601.33992, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "(FTN), TableBank (TB) and SynthTabNet (STN).", "bbox": {"l": 50.112, "t": 604.38837, "r": 247.46114, "b": 613.29492, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 2: Structure results on PubTabNet (PTN), FinTabNet (FTN), TableBank (TB) and SynthTabNet (STN)."}, {"label": "text", "id": 16, "page_no": 6, "cluster": {"id": 16, "label": "text", "bbox": {"l": 50.112, "t": 616.34337, "r": 261.78732, "b": 625.24992, "coord_origin": "TOPLEFT"}, "confidence": 0.6433308124542236, "cells": [{"id": 111, "text": "FT: Model was trained on PubTabNet then finetuned.", "bbox": {"l": 50.112, "t": 616.34337, "r": 261.78732, "b": 625.24992, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "FT: Model was trained on PubTabNet then finetuned."}, {"label": "text", "id": 3, "page_no": 6, "cluster": {"id": 3, "label": "text", "bbox": {"l": 50.112015, "t": 644.3498099999999, "r": 286.366, "b": 713.151932, "coord_origin": "TOPLEFT"}, "confidence": 0.9854633808135986, "cells": [{"id": 112, "text": "Cell Detection.", "bbox": {"l": 62.067001, "t": 644.3498099999999, "r": 124.72179, "b": 653.30618, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "Like any object detector, our", "bbox": {"l": 128.20401, "t": 644.46936, "r": 242.9333, "b": 653.37592, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "Cell BBox", "bbox": {"l": 245.55401999999998, "t": 644.55902, "r": 286.36084, "b": 653.1467700000001, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "Detector", "bbox": {"l": 50.112015, "t": 656.51402, "r": 84.971146, "b": 665.10178, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "provides bounding boxes that can be improved", "bbox": {"l": 89.515015, "t": 656.42436, "r": 286.366, "b": 665.33092, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "with post-processing during inference. We make use of the", "bbox": {"l": 50.112015, "t": 668.37936, "r": 286.36511, "b": 677.28593, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "grid-like structure of tables to refine the predictions. A de-", "bbox": {"l": 50.112015, "t": 680.33536, "r": 286.36505, "b": 689.24193, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "tailed explanation on the post-processing is available in the", "bbox": {"l": 50.112015, "t": 692.290359, "r": 286.36511, "b": 701.19693, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "supplementary material. As shown in Tab. 3, we evaluate", "bbox": {"l": 50.112015, "t": 704.245361, "r": 286.36508, "b": 713.151932, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Cell Detection. Like any object detector, our Cell BBox Detector provides bounding boxes that can be improved with post-processing during inference. We make use of the grid-like structure of tables to refine the predictions. A detailed explanation on the post-processing is available in the supplementary material. As shown in Tab. 3, we evaluate"}, {"label": "text", "id": 7, "page_no": 6, "cluster": {"id": 7, "label": "text", "bbox": {"l": 308.862, "t": 75.20836999999995, "r": 545.11517, "b": 227.57709, "coord_origin": "TOPLEFT"}, "confidence": 0.9713196754455566, "cells": [{"id": 121, "text": "our", "bbox": {"l": 308.862, "t": 75.20836999999995, "r": 322.14215, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Cell BBox Decoder", "bbox": {"l": 325.45401, "t": 75.29803000000004, "r": 404.56702, "b": 83.88580000000002, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "accuracy for cells with a class la-", "bbox": {"l": 408.104, "t": 75.20836999999995, "r": 545.10968, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "bel of \u2018content\u2019 only using the PASCAL VOC mAP metric", "bbox": {"l": 308.862, "t": 87.16339000000005, "r": 545.11511, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "for pre-processing and post-processing.", "bbox": {"l": 308.862, "t": 99.11841000000004, "r": 470.22626, "b": 108.02495999999985, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "Note that we do", "bbox": {"l": 477.52884, "t": 99.11841000000004, "r": 545.11511, "b": 108.02495999999985, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "not have post-processing results for SynthTabNet as images", "bbox": {"l": 308.862, "t": 111.07343000000003, "r": 545.11517, "b": 119.97997999999984, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "are only provided. To compare the performance of our pro-", "bbox": {"l": 308.862, "t": 123.02844000000005, "r": 545.11511, "b": 131.93499999999995, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "posed approach, we\u2019ve integrated TableFormer\u2019s", "bbox": {"l": 308.862, "t": 134.98443999999995, "r": 502.01691000000005, "b": 143.89099, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "Cell BBox", "bbox": {"l": 504.47299, "t": 135.07410000000004, "r": 545.11041, "b": 143.66187000000002, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "Decoder", "bbox": {"l": 308.862, "t": 147.02910999999995, "r": 343.16324, "b": 155.61688000000004, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "into EDD architecture. As mentioned previously,", "bbox": {"l": 346.371, "t": 146.93944999999997, "r": 545.11493, "b": 155.84600999999998, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "the Structure Decoder provides the", "bbox": {"l": 308.862, "t": 158.89446999999996, "r": 446.15652, "b": 167.80102999999997, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "Cell BBox Decoder", "bbox": {"l": 448.28998000000007, "t": 158.98413000000005, "r": 525.04181, "b": 167.57190000000003, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "with", "bbox": {"l": 527.39899, "t": 158.89446999999996, "r": 545.11249, "b": 167.80102999999997, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "the features needed to predict the bounding box predictions.", "bbox": {"l": 308.862, "t": 170.84948999999995, "r": 545.11511, "b": 179.75603999999998, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "Therefore, the accuracy of the", "bbox": {"l": 308.862, "t": 182.80449999999996, "r": 432.86642000000006, "b": 191.71105999999997, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "Structure Decoder", "bbox": {"l": 436.39001, "t": 182.89417000000003, "r": 510.93021, "b": 191.48193000000003, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "directly", "bbox": {"l": 514.677, "t": 182.80449999999996, "r": 545.11273, "b": 191.71105999999997, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "influences the accuracy of the", "bbox": {"l": 308.862, "t": 194.75951999999995, "r": 431.17285, "b": 203.66607999999997, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "Cell BBox Decoder", "bbox": {"l": 434.6790199999999, "t": 194.84918000000005, "r": 514.18054, "b": 203.43695000000002, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": ". If the", "bbox": {"l": 514.17603, "t": 194.75951999999995, "r": 545.10992, "b": 203.66607999999997, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "Structure Decoder", "bbox": {"l": 308.86203, "t": 206.80517999999995, "r": 382.35614, "b": 215.39293999999995, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "predicts an extra column, this will result", "bbox": {"l": 385.07501, "t": 206.71551999999997, "r": 545.11426, "b": 215.62207, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "in an extra column of predicted bounding boxes.", "bbox": {"l": 308.862, "t": 218.67052999999999, "r": 501.6981799999999, "b": 227.57709, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "our Cell BBox Decoder accuracy for cells with a class label of \u2018content\u2019 only using the PASCAL VOC mAP metric for pre-processing and post-processing. Note that we do not have post-processing results for SynthTabNet as images are only provided. To compare the performance of our proposed approach, we\u2019ve integrated TableFormer\u2019s Cell BBox Decoder into EDD architecture. As mentioned previously, the Structure Decoder provides the Cell BBox Decoder with the features needed to predict the bounding box predictions. Therefore, the accuracy of the Structure Decoder directly influences the accuracy of the Cell BBox Decoder . If the Structure Decoder predicts an extra column, this will result in an extra column of predicted bounding boxes."}, {"label": "table", "id": 8, "page_no": 6, "cluster": {"id": 8, "label": "table", "bbox": {"l": 308.4068908691406, "t": 247.87631225585938, "r": 533.6420288085938, "b": 303.8056640625, "coord_origin": "TOPLEFT"}, "confidence": 0.9691731929779053, "cells": [{"id": 146, "text": "Model", "bbox": {"l": 339.323, "t": 253.66436999999996, "r": 365.33536, "b": 262.57092, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "Dataset", "bbox": {"l": 401.04132, "t": 253.66436999999996, "r": 430.91916, "b": 262.57092, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "mAP", "bbox": {"l": 454.10214, "t": 253.66436999999996, "r": 474.58523999999994, "b": 262.57092, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "mAP (PP)", "bbox": {"l": 486.54034, "t": 253.66436999999996, "r": 527.2276, "b": 262.57092, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "EDD+BBox", "bbox": {"l": 327.65601, "t": 270.62134000000003, "r": 377.00076, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "PubTabNet", "bbox": {"l": 393.69809, "t": 270.62134000000003, "r": 438.28073, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "79.2", "bbox": {"l": 455.63559, "t": 270.62134000000003, "r": 473.07013, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "82.7", "bbox": {"l": 498.16592, "t": 270.62134000000003, "r": 515.60046, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "TableFormer", "bbox": {"l": 326.79501, "t": 282.57631999999995, "r": 377.86331, "b": 291.48288, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "PubTabNet", "bbox": {"l": 393.69388, "t": 282.57631999999995, "r": 438.27652, "b": 291.48288, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "82.1", "bbox": {"l": 455.63101, "t": 282.45676, "r": 473.06555000000003, "b": 291.41315, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "86.8", "bbox": {"l": 498.1713, "t": 282.45676, "r": 515.60583, "b": 291.41315, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "TableFormer", "bbox": {"l": 326.79501, "t": 294.53131, "r": 377.86331, "b": 303.43787, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "SynthTabNet", "bbox": {"l": 389.81842, "t": 294.53131, "r": 442.15194999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "87.7", "bbox": {"l": 455.63135, "t": 294.53131, "r": 473.06589, "b": 303.43787, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "-", "bbox": {"l": 505.22515999999996, "t": 294.53131, "r": 508.54268999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}}], "children": [{"id": 73, "label": "text", "bbox": {"l": 339.323, "t": 253.66436999999996, "r": 365.33536, "b": 262.57092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 146, "text": "Model", "bbox": {"l": 339.323, "t": 253.66436999999996, "r": 365.33536, "b": 262.57092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 401.04132, "t": 253.66436999999996, "r": 430.91916, "b": 262.57092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 147, "text": "Dataset", "bbox": {"l": 401.04132, "t": 253.66436999999996, "r": 430.91916, "b": 262.57092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 454.10214, "t": 253.66436999999996, "r": 474.58523999999994, "b": 262.57092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 148, "text": "mAP", "bbox": {"l": 454.10214, "t": 253.66436999999996, "r": 474.58523999999994, "b": 262.57092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 486.54034, "t": 253.66436999999996, "r": 527.2276, "b": 262.57092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 149, "text": "mAP (PP)", "bbox": {"l": 486.54034, "t": 253.66436999999996, "r": 527.2276, "b": 262.57092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 327.65601, "t": 270.62134000000003, "r": 377.00076, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 150, "text": "EDD+BBox", "bbox": {"l": 327.65601, "t": 270.62134000000003, "r": 377.00076, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 393.69809, "t": 270.62134000000003, "r": 438.28073, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 151, "text": "PubTabNet", "bbox": {"l": 393.69809, "t": 270.62134000000003, "r": 438.28073, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 455.63559, "t": 270.62134000000003, "r": 473.07013, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 152, "text": "79.2", "bbox": {"l": 455.63559, "t": 270.62134000000003, "r": 473.07013, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 498.16592, "t": 270.62134000000003, "r": 515.60046, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 153, "text": "82.7", "bbox": {"l": 498.16592, "t": 270.62134000000003, "r": 515.60046, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 326.79501, "t": 282.57631999999995, "r": 377.86331, "b": 291.48288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 154, "text": "TableFormer", "bbox": {"l": 326.79501, "t": 282.57631999999995, "r": 377.86331, "b": 291.48288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 393.69388, "t": 282.57631999999995, "r": 438.27652, "b": 291.48288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 155, "text": "PubTabNet", "bbox": {"l": 393.69388, "t": 282.57631999999995, "r": 438.27652, "b": 291.48288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 455.63101, "t": 282.45676, "r": 473.06555000000003, "b": 291.41315, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 156, "text": "82.1", "bbox": {"l": 455.63101, "t": 282.45676, "r": 473.06555000000003, "b": 291.41315, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 498.1713, "t": 282.45676, "r": 515.60583, "b": 291.41315, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 157, "text": "86.8", "bbox": {"l": 498.1713, "t": 282.45676, "r": 515.60583, "b": 291.41315, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 326.79501, "t": 294.53131, "r": 377.86331, "b": 303.43787, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 158, "text": "TableFormer", "bbox": {"l": 326.79501, "t": 294.53131, "r": 377.86331, "b": 303.43787, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 389.81842, "t": 294.53131, "r": 442.15194999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 159, "text": "SynthTabNet", "bbox": {"l": 389.81842, "t": 294.53131, "r": 442.15194999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 455.63135, "t": 294.53131, "r": 473.06589, "b": 303.43787, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 160, "text": "87.7", "bbox": {"l": 455.63135, "t": 294.53131, "r": 473.06589, "b": 303.43787, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 505.22515999999996, "t": 294.53131, "r": 508.54268999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 161, "text": "-", "bbox": {"l": 505.22515999999996, "t": 294.53131, "r": 508.54268999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 4, "num_cols": 4, "table_cells": [{"bbox": {"l": 339.323, "t": 253.66436999999996, "r": 365.33536, "b": 262.57092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Model", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 401.04132, "t": 253.66436999999996, "r": 430.91916, "b": 262.57092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Dataset", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 454.10214, "t": 253.66436999999996, "r": 474.58523999999994, "b": 262.57092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "mAP", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 486.54034, "t": 253.66436999999996, "r": 527.2276, "b": 262.57092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "mAP (PP)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 327.65601, "t": 270.62134000000003, "r": 377.00076, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "EDD+BBox", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 393.69809, "t": 270.62134000000003, "r": 438.28073, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "PubTabNet", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 455.63559, "t": 270.62134000000003, "r": 473.07013, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "79.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 498.16592, "t": 270.62134000000003, "r": 515.60046, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "82.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.79501, "t": 282.57631999999995, "r": 377.86331, "b": 291.48288, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 393.69388, "t": 282.57631999999995, "r": 438.27652, "b": 291.48288, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "PubTabNet", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 455.63101, "t": 282.45676, "r": 473.06555000000003, "b": 291.41315, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "82.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 498.1713, "t": 282.45676, "r": 515.60583, "b": 291.41315, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "86.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.79501, "t": 294.53131, "r": 377.86331, "b": 303.43787, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 389.81842, "t": 294.53131, "r": 442.15194999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "SynthTabNet", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 455.63135, "t": 294.53131, "r": 473.06589, "b": 303.43787, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "87.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 505.22515999999996, "t": 294.53131, "r": 508.54268999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "caption", "id": 12, "page_no": 6, "cluster": {"id": 12, "label": "caption", "bbox": {"l": 308.862, "t": 316.44931, "r": 545.11517, "b": 337.3108500000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9519919157028198, "cells": [{"id": 162, "text": "Table 3:", "bbox": {"l": 308.862, "t": 316.44931, "r": 341.49951, "b": 325.35587, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "Cell Bounding Box detection results on PubTab-", "bbox": {"l": 348.60284, "t": 316.44931, "r": 545.11517, "b": 325.35587, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "Net, and FinTabNet. PP: Post-processing.", "bbox": {"l": 308.862, "t": 328.4043, "r": 474.97845, "b": 337.3108500000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 3: Cell Bounding Box detection results on PubTabNet, and FinTabNet. PP: Post-processing."}, {"label": "text", "id": 4, "page_no": 6, "cluster": {"id": 4, "label": "text", "bbox": {"l": 308.86197, "t": 367.6797199999999, "r": 545.11566, "b": 520.16769, "coord_origin": "TOPLEFT"}, "confidence": 0.9835010766983032, "cells": [{"id": 165, "text": "Cell Content.", "bbox": {"l": 320.81699, "t": 367.6797199999999, "r": 378.94876, "b": 376.63611, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "In this section, we evaluate the entire", "bbox": {"l": 387.07898, "t": 367.79929, "r": 545.11566, "b": 376.70584, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "pipeline of recovering a table with content.", "bbox": {"l": 308.86197, "t": 379.75426999999996, "r": 487.19257, "b": 388.66083, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "Here we put", "bbox": {"l": 493.96713, "t": 379.75426999999996, "r": 545.11511, "b": 388.66083, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "our approach to test by capitalizing on extracting content", "bbox": {"l": 308.86197, "t": 391.70926, "r": 545.11505, "b": 400.61581, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "from the PDF cells rather than decoding from images. Tab.", "bbox": {"l": 308.86197, "t": 403.66525, "r": 545.11523, "b": 412.57181, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "4", "bbox": {"l": 308.86197, "t": 415.62024, "r": 314.08096, "b": 424.52679, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "shows the TEDs score of HTML code representing the", "bbox": {"l": 316.69046, "t": 415.62024, "r": 545.11517, "b": 424.52679, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "structure of the table along with the content inserted in the", "bbox": {"l": 308.86197, "t": 427.57523, "r": 545.11505, "b": 436.48177999999996, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "data cell and compared with the ground-truth. Our method", "bbox": {"l": 308.86197, "t": 439.53021, "r": 545.11505, "b": 448.43677, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "achieved a", "bbox": {"l": 308.86197, "t": 451.4852, "r": 350.23666, "b": 460.39175, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "5.3%", "bbox": {"l": 352.17596, "t": 451.36563, "r": 374.59183, "b": 460.32201999999995, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "increase over the state-of-the-art, and com-", "bbox": {"l": 376.53296, "t": 451.4852, "r": 545.11011, "b": 460.39175, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "mercial solutions. We believe our scores would be higher", "bbox": {"l": 308.86197, "t": 463.44019, "r": 545.11511, "b": 472.34674, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "if the HTML ground-truth matched the extracted PDF cell", "bbox": {"l": 308.86197, "t": 475.39618, "r": 545.11517, "b": 484.30273, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "content. Unfortunately, there are small discrepancies such", "bbox": {"l": 308.86197, "t": 487.35117, "r": 545.11511, "b": 496.25772, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "as spacings around words or special characters with various", "bbox": {"l": 308.86197, "t": 499.30615, "r": 545.11505, "b": 508.21271, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "unicode representations.", "bbox": {"l": 308.86197, "t": 511.26114, "r": 405.69846, "b": 520.16769, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Cell Content. In this section, we evaluate the entire pipeline of recovering a table with content. Here we put our approach to test by capitalizing on extracting content from the PDF cells rather than decoding from images. Tab. 4 shows the TEDs score of HTML code representing the structure of the table along with the content inserted in the data cell and compared with the ground-truth. Our method achieved a 5.3% increase over the state-of-the-art, and commercial solutions. We believe our scores would be higher if the HTML ground-truth matched the extracted PDF cell content. Unfortunately, there are small discrepancies such as spacings around words or special characters with various unicode representations."}, {"label": "table", "id": 5, "page_no": 6, "cluster": {"id": 5, "label": "table", "bbox": {"l": 332.9688720703125, "t": 540.2835083007812, "r": 520.942138671875, "b": 643.2697143554688, "coord_origin": "TOPLEFT"}, "confidence": 0.9775568842887878, "cells": [{"id": 183, "text": "Model", "bbox": {"l": 358.01099, "t": 552.23337, "r": 384.02335, "b": 561.1399200000001, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "TEDS", "bbox": {"l": 449.03400000000005, "t": 546.25537, "r": 473.94049000000007, "b": 555.16193, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": "Simple", "bbox": {"l": 408.50598, "t": 558.21037, "r": 436.73999, "b": 567.11693, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "Complex", "bbox": {"l": 448.6951, "t": 558.21037, "r": 485.07849, "b": 567.11693, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "All", "bbox": {"l": 499.3848, "t": 558.21037, "r": 512.117, "b": 567.11693, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": "Tabula", "bbox": {"l": 357.68201, "t": 575.16736, "r": 384.3519, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "78.0", "bbox": {"l": 413.90097, "t": 575.16736, "r": 431.33550999999994, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "57.8", "bbox": {"l": 458.16479000000004, "t": 575.16736, "r": 475.59933000000007, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "67.9", "bbox": {"l": 497.0289, "t": 575.16736, "r": 514.46344, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": "Traprange", "bbox": {"l": 350.72299, "t": 587.12236, "r": 391.31064, "b": 596.02892, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "60.8", "bbox": {"l": 413.90582, "t": 587.12236, "r": 431.34036, "b": 596.02892, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "49.9", "bbox": {"l": 458.16965, "t": 587.12236, "r": 475.60419, "b": 596.02892, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "55.4", "bbox": {"l": 497.03374999999994, "t": 587.12236, "r": 514.46832, "b": 596.02892, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "Camelot", "bbox": {"l": 354.13599, "t": 599.07835, "r": 387.89923, "b": 607.98491, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "80.0", "bbox": {"l": 413.90161, "t": 599.07835, "r": 431.33615, "b": 607.98491, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "66.0", "bbox": {"l": 458.16544, "t": 599.07835, "r": 475.59998, "b": 607.98491, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "73.0", "bbox": {"l": 497.02954000000005, "t": 599.07835, "r": 514.46411, "b": 607.98491, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "Acrobat Pro", "bbox": {"l": 346.55899, "t": 611.03336, "r": 395.47534, "b": 619.93991, "coord_origin": "TOPLEFT"}}, {"id": 201, "text": "68.9", "bbox": {"l": 413.90616, "t": 611.03336, "r": 431.34069999999997, "b": 619.93991, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": "61.8", "bbox": {"l": 458.16998000000007, "t": 611.03336, "r": 475.60452, "b": 619.93991, "coord_origin": "TOPLEFT"}}, {"id": 203, "text": "65.3", "bbox": {"l": 497.03409, "t": 611.03336, "r": 514.46863, "b": 619.93991, "coord_origin": "TOPLEFT"}}, {"id": 204, "text": "EDD", "bbox": {"l": 360.78101, "t": 622.9883600000001, "r": 381.25415, "b": 631.89491, "coord_origin": "TOPLEFT"}}, {"id": 205, "text": "91.2", "bbox": {"l": 413.90158, "t": 622.9883600000001, "r": 431.33612, "b": 631.89491, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": "85.4", "bbox": {"l": 458.16541, "t": 622.9883600000001, "r": 475.59995000000004, "b": 631.89491, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": "88.3", "bbox": {"l": 497.0295100000001, "t": 622.9883600000001, "r": 514.46405, "b": 631.89491, "coord_origin": "TOPLEFT"}}, {"id": 208, "text": "TableFormer", "bbox": {"l": 345.483, "t": 634.94336, "r": 396.5513, "b": 643.84991, "coord_origin": "TOPLEFT"}}, {"id": 209, "text": "95.4", "bbox": {"l": 413.90616, "t": 634.94336, "r": 431.34069999999997, "b": 643.84991, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": "90.1", "bbox": {"l": 458.16998000000007, "t": 634.94336, "r": 475.60452, "b": 643.84991, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "93.6", "bbox": {"l": 497.03400000000005, "t": 634.82381, "r": 514.46857, "b": 643.78018, "coord_origin": "TOPLEFT"}}], "children": [{"id": 89, "label": "text", "bbox": {"l": 358.01099, "t": 552.23337, "r": 384.02335, "b": 561.1399200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 183, "text": "Model", "bbox": {"l": 358.01099, "t": 552.23337, "r": 384.02335, "b": 561.1399200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 449.03400000000005, "t": 546.25537, "r": 473.94049000000007, "b": 555.16193, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 184, "text": "TEDS", "bbox": {"l": 449.03400000000005, "t": 546.25537, "r": 473.94049000000007, "b": 555.16193, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 408.50598, "t": 558.21037, "r": 436.73999, "b": 567.11693, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 185, "text": "Simple", "bbox": {"l": 408.50598, "t": 558.21037, "r": 436.73999, "b": 567.11693, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 448.6951, "t": 558.21037, "r": 485.07849, "b": 567.11693, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 186, "text": "Complex", "bbox": {"l": 448.6951, "t": 558.21037, "r": 485.07849, "b": 567.11693, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 499.3848, "t": 558.21037, "r": 512.117, "b": 567.11693, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 187, "text": "All", "bbox": {"l": 499.3848, "t": 558.21037, "r": 512.117, "b": 567.11693, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 357.68201, "t": 575.16736, "r": 384.3519, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 188, "text": "Tabula", "bbox": {"l": 357.68201, "t": 575.16736, "r": 384.3519, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 413.90097, "t": 575.16736, "r": 431.33550999999994, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 189, "text": "78.0", "bbox": {"l": 413.90097, "t": 575.16736, "r": 431.33550999999994, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 458.16479000000004, "t": 575.16736, "r": 475.59933000000007, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 190, "text": "57.8", "bbox": {"l": 458.16479000000004, "t": 575.16736, "r": 475.59933000000007, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 497.0289, "t": 575.16736, "r": 514.46344, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 191, "text": "67.9", "bbox": {"l": 497.0289, "t": 575.16736, "r": 514.46344, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 350.72299, "t": 587.12236, "r": 391.31064, "b": 596.02892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 192, "text": "Traprange", "bbox": {"l": 350.72299, "t": 587.12236, "r": 391.31064, "b": 596.02892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 413.90582, "t": 587.12236, "r": 431.34036, "b": 596.02892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 193, "text": "60.8", "bbox": {"l": 413.90582, "t": 587.12236, "r": 431.34036, "b": 596.02892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 458.16965, "t": 587.12236, "r": 475.60419, "b": 596.02892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 194, "text": "49.9", "bbox": {"l": 458.16965, "t": 587.12236, "r": 475.60419, "b": 596.02892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 497.03374999999994, "t": 587.12236, "r": 514.46832, "b": 596.02892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 195, "text": "55.4", "bbox": {"l": 497.03374999999994, "t": 587.12236, "r": 514.46832, "b": 596.02892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 354.13599, "t": 599.07835, "r": 387.89923, "b": 607.98491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 196, "text": "Camelot", "bbox": {"l": 354.13599, "t": 599.07835, "r": 387.89923, "b": 607.98491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 413.90161, "t": 599.07835, "r": 431.33615, "b": 607.98491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 197, "text": "80.0", "bbox": {"l": 413.90161, "t": 599.07835, "r": 431.33615, "b": 607.98491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 458.16544, "t": 599.07835, "r": 475.59998, "b": 607.98491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 198, "text": "66.0", "bbox": {"l": 458.16544, "t": 599.07835, "r": 475.59998, "b": 607.98491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 497.02954000000005, "t": 599.07835, "r": 514.46411, "b": 607.98491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 199, "text": "73.0", "bbox": {"l": 497.02954000000005, "t": 599.07835, "r": 514.46411, "b": 607.98491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 346.55899, "t": 611.03336, "r": 395.47534, "b": 619.93991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 200, "text": "Acrobat Pro", "bbox": {"l": 346.55899, "t": 611.03336, "r": 395.47534, "b": 619.93991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 413.90616, "t": 611.03336, "r": 431.34069999999997, "b": 619.93991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 201, "text": "68.9", "bbox": {"l": 413.90616, "t": 611.03336, "r": 431.34069999999997, "b": 619.93991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 458.16998000000007, "t": 611.03336, "r": 475.60452, "b": 619.93991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 202, "text": "61.8", "bbox": {"l": 458.16998000000007, "t": 611.03336, "r": 475.60452, "b": 619.93991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 497.03409, "t": 611.03336, "r": 514.46863, "b": 619.93991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 203, "text": "65.3", "bbox": {"l": 497.03409, "t": 611.03336, "r": 514.46863, "b": 619.93991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 360.78101, "t": 622.9883600000001, "r": 381.25415, "b": 631.89491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 204, "text": "EDD", "bbox": {"l": 360.78101, "t": 622.9883600000001, "r": 381.25415, "b": 631.89491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 413.90158, "t": 622.9883600000001, "r": 431.33612, "b": 631.89491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 205, "text": "91.2", "bbox": {"l": 413.90158, "t": 622.9883600000001, "r": 431.33612, "b": 631.89491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 458.16541, "t": 622.9883600000001, "r": 475.59995000000004, "b": 631.89491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 206, "text": "85.4", "bbox": {"l": 458.16541, "t": 622.9883600000001, "r": 475.59995000000004, "b": 631.89491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 497.0295100000001, "t": 622.9883600000001, "r": 514.46405, "b": 631.89491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 207, "text": "88.3", "bbox": {"l": 497.0295100000001, "t": 622.9883600000001, "r": 514.46405, "b": 631.89491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 114, "label": "text", "bbox": {"l": 345.483, "t": 634.94336, "r": 396.5513, "b": 643.84991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 208, "text": "TableFormer", "bbox": {"l": 345.483, "t": 634.94336, "r": 396.5513, "b": 643.84991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 115, "label": "text", "bbox": {"l": 413.90616, "t": 634.94336, "r": 431.34069999999997, "b": 643.84991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 209, "text": "95.4", "bbox": {"l": 413.90616, "t": 634.94336, "r": 431.34069999999997, "b": 643.84991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 116, "label": "text", "bbox": {"l": 458.16998000000007, "t": 634.94336, "r": 475.60452, "b": 643.84991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 210, "text": "90.1", "bbox": {"l": 458.16998000000007, "t": 634.94336, "r": 475.60452, "b": 643.84991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 117, "label": "text", "bbox": {"l": 497.03400000000005, "t": 634.82381, "r": 514.46857, "b": 643.78018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 211, "text": "93.6", "bbox": {"l": 497.03400000000005, "t": 634.82381, "r": 514.46857, "b": 643.78018, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["fcel", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "nl"], "num_rows": 7, "num_cols": 4, "table_cells": [{"bbox": {"l": 358.01099, "t": 552.23337, "r": 384.02335, "b": 561.1399200000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Model", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 448.6951, "t": 546.25537, "r": 485.07849, "b": 567.11693, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "TEDS Complex", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 408.50598, "t": 558.21037, "r": 436.73999, "b": 567.11693, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Simple", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 499.3848, "t": 558.21037, "r": 512.117, "b": 567.11693, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "All", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 357.68201, "t": 575.16736, "r": 384.3519, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Tabula", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 413.90097, "t": 575.16736, "r": 431.33550999999994, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "78.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 458.16479000000004, "t": 575.16736, "r": 475.59933000000007, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "57.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 497.0289, "t": 575.16736, "r": 514.46344, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "67.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 350.72299, "t": 587.12236, "r": 391.31064, "b": 596.02892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Traprange", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 413.90582, "t": 587.12236, "r": 431.34036, "b": 596.02892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "60.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 458.16965, "t": 587.12236, "r": 475.60419, "b": 596.02892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "49.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 497.03374999999994, "t": 587.12236, "r": 514.46832, "b": 596.02892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "55.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 354.13599, "t": 599.07835, "r": 387.89923, "b": 607.98491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Camelot", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 413.90161, "t": 599.07835, "r": 431.33615, "b": 607.98491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "80.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 458.16544, "t": 599.07835, "r": 475.59998, "b": 607.98491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "66.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 497.02954000000005, "t": 599.07835, "r": 514.46411, "b": 607.98491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "73.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 346.55899, "t": 611.03336, "r": 395.47534, "b": 619.93991, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Acrobat Pro", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 413.90616, "t": 611.03336, "r": 431.34069999999997, "b": 619.93991, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "68.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 458.16998000000007, "t": 611.03336, "r": 475.60452, "b": 619.93991, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "61.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 497.03409, "t": 611.03336, "r": 514.46863, "b": 619.93991, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "65.3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 360.78101, "t": 622.9883600000001, "r": 381.25415, "b": 631.89491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "EDD", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 413.90158, "t": 622.9883600000001, "r": 431.33612, "b": 631.89491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "91.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 458.16541, "t": 622.9883600000001, "r": 475.59995000000004, "b": 631.89491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "85.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 497.0295100000001, "t": 622.9883600000001, "r": 514.46405, "b": 631.89491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "88.3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 345.483, "t": 634.94336, "r": 396.5513, "b": 643.84991, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 413.90616, "t": 634.94336, "r": 431.34069999999997, "b": 643.84991, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "95.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 458.16998000000007, "t": 634.94336, "r": 475.60452, "b": 643.84991, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "90.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 497.03400000000005, "t": 634.82381, "r": 514.46857, "b": 643.78018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "93.6", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "caption", "id": 11, "page_no": 6, "cluster": {"id": 11, "label": "caption", "bbox": {"l": 308.862, "t": 656.86136, "r": 545.11517, "b": 689.6779300000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9541401863098145, "cells": [{"id": 212, "text": "Table 4:", "bbox": {"l": 308.862, "t": 656.86136, "r": 341.73862, "b": 665.76792, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "Results of structure with content retrieved using", "bbox": {"l": 349.55927, "t": 656.86136, "r": 545.11517, "b": 665.76792, "coord_origin": "TOPLEFT"}}, {"id": 214, "text": "cell detection on PubTabNet. In all cases the input is PDF", "bbox": {"l": 308.862, "t": 668.81636, "r": 545.11505, "b": 677.7229199999999, "coord_origin": "TOPLEFT"}}, {"id": 215, "text": "documents with cropped tables.", "bbox": {"l": 308.862, "t": 680.77136, "r": 435.03836, "b": 689.6779300000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 4: Results of structure with content retrieved using cell detection on PubTabNet. In all cases the input is PDF documents with cropped tables."}, {"label": "page_footer", "id": 14, "page_no": 6, "cluster": {"id": 14, "label": "page_footer", "bbox": {"l": 295.121, "t": 734.133358, "r": 300.10229, "b": 743.039921, "coord_origin": "TOPLEFT"}, "confidence": 0.8787970542907715, "cells": [{"id": 216, "text": "7", "bbox": {"l": 295.121, "t": 734.133358, "r": 300.10229, "b": 743.039921, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "7"}], "body": [{"label": "section_header", "id": 10, "page_no": 6, "cluster": {"id": 10, "label": "section_header", "bbox": {"l": 50.112, "t": 74.40137000000016, "r": 167.89825, "b": 84.25342, "coord_origin": "TOPLEFT"}, "confidence": 0.955427348613739, "cells": [{"id": 0, "text": "5.3.", "bbox": {"l": 50.112, "t": 74.40137000000016, "r": 63.704811, "b": 84.25342, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Datasets and Metrics", "bbox": {"l": 72.766685, "t": 74.40137000000016, "r": 167.89825, "b": 84.25342, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5.3. Datasets and Metrics"}, {"label": "text", "id": 1, "page_no": 6, "cluster": {"id": 1, "label": "text", "bbox": {"l": 50.112, "t": 93.35039999999992, "r": 286.36511, "b": 138.12298999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9862998127937317, "cells": [{"id": 2, "text": "The Tree-Edit-Distance-Based Similarity (TEDS) met-", "bbox": {"l": 62.067001, "t": 93.35039999999992, "r": 286.36499, "b": 102.25696000000016, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "ric was introduced in [37]. It represents the prediction, and", "bbox": {"l": 50.112, "t": 105.30542000000003, "r": 286.36511, "b": 114.21198000000015, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "ground-truth as a tree structure of HTML tags. This simi-", "bbox": {"l": 50.112, "t": 117.26044000000002, "r": 286.36505, "b": 126.16699000000006, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "larity is calculated as:", "bbox": {"l": 50.112, "t": 129.21642999999995, "r": 136.71687, "b": 138.12298999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The Tree-Edit-Distance-Based Similarity (TEDS) metric was introduced in [37]. It represents the prediction, and ground-truth as a tree structure of HTML tags. This similarity is calculated as:"}, {"label": "formula", "id": 13, "page_no": 6, "cluster": {"id": 13, "label": "formula", "bbox": {"l": 86.218994, "t": 150.31799, "r": 286.3624, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9500411748886108, "cells": [{"id": 6, "text": "TEDS (", "bbox": {"l": 86.218994, "t": 157.05798000000004, "r": 118.8784, "b": 165.90479000000005, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "T$_{a}$, T$_{b}$", "bbox": {"l": 118.87499, "t": 157.05798000000004, "r": 143.26962, "b": 165.90479000000005, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": ") = 1", "bbox": {"l": 143.76799, "t": 157.05798000000004, "r": 165.9019, "b": 165.90479000000005, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "\u2212", "bbox": {"l": 168.12099, "t": 156.50012000000004, "r": 175.8699, "b": 165.90479000000005, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "EditDist (", "bbox": {"l": 179.27899, "t": 150.31799, "r": 221.95677, "b": 159.16479000000004, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "T$_{a}$, T$_{b}$", "bbox": {"l": 221.95200000000003, "t": 150.31799, "r": 246.34663, "b": 159.16479000000004, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": ")", "bbox": {"l": 246.84499999999997, "t": 150.31799, "r": 250.71945, "b": 159.16479000000004, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "max (", "bbox": {"l": 182.21201, "t": 163.89197000000001, "r": 206.29161, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "|", "bbox": {"l": 206.289, "t": 163.33411, "r": 209.05661, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "T$_{a}$", "bbox": {"l": 209.056, "t": 163.89197000000001, "r": 219.19968, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "|", "bbox": {"l": 219.69700999999998, "t": 163.33411, "r": 222.46461000000002, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": ",", "bbox": {"l": 224.125, "t": 163.89197000000001, "r": 226.89261, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "|", "bbox": {"l": 228.55299000000002, "t": 163.33411, "r": 231.3206, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "T$_{b}$", "bbox": {"l": 231.31999, "t": 163.89197000000001, "r": 240.64563, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "|", "bbox": {"l": 241.144, "t": 163.33411, "r": 243.91161, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": ")", "bbox": {"l": 243.911, "t": 163.89197000000001, "r": 247.78545, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "(3)", "bbox": {"l": 274.746, "t": 157.21740999999997, "r": 286.3624, "b": 166.12396, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "TEDS ( T$_{a}$, T$_{b}$ ) = 1 \u2212 EditDist ( T$_{a}$, T$_{b}$ ) max ( | T$_{a}$ | , | T$_{b}$ | ) (3)"}, {"label": "text", "id": 6, "page_no": 6, "cluster": {"id": 6, "label": "text", "bbox": {"l": 50.111984, "t": 181.00298999999995, "r": 286.36285, "b": 213.97900000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9735319018363953, "cells": [{"id": 23, "text": "where", "bbox": {"l": 62.067001, "t": 181.16241000000002, "r": 86.405632, "b": 190.06897000000004, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "T$_{a}$", "bbox": {"l": 88.581001, "t": 181.00298999999995, "r": 98.724663, "b": 189.84978999999998, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "and", "bbox": {"l": 101.399, "t": 181.16241000000002, "r": 115.785, "b": 190.06897000000004, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "T$_{b}$", "bbox": {"l": 117.961, "t": 181.00298999999995, "r": 127.28664, "b": 189.84978999999998, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "represent tables in tree structure HTML", "bbox": {"l": 129.95999, "t": 181.16241000000002, "r": 286.36285, "b": 190.06897000000004, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "format. EditDist denotes the tree-edit distance, and", "bbox": {"l": 50.111992, "t": 193.11743, "r": 252.78116000000003, "b": 202.02399000000003, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "|", "bbox": {"l": 255.18201, "t": 192.40015000000005, "r": 257.94962, "b": 201.80480999999997, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "T", "bbox": {"l": 257.94901, "t": 192.95800999999994, "r": 263.77115, "b": 201.80480999999997, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "|", "bbox": {"l": 265.155, "t": 192.40015000000005, "r": 267.92261, "b": 201.80480999999997, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "rep-", "bbox": {"l": 270.32199, "t": 193.11743, "r": 286.36179, "b": 202.02399000000003, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "resents the number of nodes in", "bbox": {"l": 50.111984, "t": 205.07245, "r": 172.13388, "b": 213.97900000000004, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "T", "bbox": {"l": 174.62399, "t": 204.91301999999996, "r": 180.44614, "b": 213.75982999999997, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": ".", "bbox": {"l": 181.82899, "t": 205.07245, "r": 184.31964, "b": 213.97900000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "where T$_{a}$ and T$_{b}$ represent tables in tree structure HTML format. EditDist denotes the tree-edit distance, and | T | represents the number of nodes in T ."}, {"label": "section_header", "id": 9, "page_no": 6, "cluster": {"id": 9, "label": "section_header", "bbox": {"l": 50.112, "t": 224.81946000000005, "r": 170.45169, "b": 234.67151, "coord_origin": "TOPLEFT"}, "confidence": 0.9588837027549744, "cells": [{"id": 36, "text": "5.4.", "bbox": {"l": 50.112, "t": 224.81946000000005, "r": 64.551605, "b": 234.67151, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "Quantitative Analysis", "bbox": {"l": 74.178009, "t": 224.81946000000005, "r": 170.45169, "b": 234.67151, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5.4. Quantitative Analysis"}, {"label": "text", "id": 2, "page_no": 6, "cluster": {"id": 2, "label": "text", "bbox": {"l": 50.112, "t": 243.6499, "r": 286.36514, "b": 396.13794, "coord_origin": "TOPLEFT"}, "confidence": 0.9855090975761414, "cells": [{"id": 38, "text": "Structure.", "bbox": {"l": 62.067001, "t": 243.6499, "r": 105.32461, "b": 252.60626000000002, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "As shown in Tab.", "bbox": {"l": 112.12600000000002, "t": 243.76946999999996, "r": 184.68361, "b": 252.67602999999997, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "2, TableFormer outper-", "bbox": {"l": 191.4781, "t": 243.76946999999996, "r": 286.36188, "b": 252.67602999999997, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "forms all SOTA methods across different datasets by a large", "bbox": {"l": 50.112, "t": 255.72448999999995, "r": 286.36508, "b": 264.63104, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "margin for predicting the table structure from an image.", "bbox": {"l": 50.112, "t": 267.67949999999996, "r": 286.36508, "b": 276.58606, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "All the more, our model outperforms pre-trained methods.", "bbox": {"l": 50.112, "t": 279.63446, "r": 286.36508, "b": 288.54105, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "During the evaluation we do not apply any table filtering.", "bbox": {"l": 50.112, "t": 291.59048, "r": 286.36514, "b": 300.49704, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "We also provide our baseline results on the SynthTabNet", "bbox": {"l": 50.112, "t": 303.54547, "r": 286.36508, "b": 312.45203000000004, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "dataset. It has been observed that large tables (e.g. tables", "bbox": {"l": 50.112, "t": 315.50046, "r": 286.36505, "b": 324.40700999999996, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "that occupy half of the page or more) yield poor predictions.", "bbox": {"l": 50.112, "t": 327.45544, "r": 286.36508, "b": 336.362, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "We attribute this issue to the image resizing during the pre-", "bbox": {"l": 50.112, "t": 339.41043, "r": 286.36508, "b": 348.31699000000003, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "processing step, that produces downsampled images with", "bbox": {"l": 50.112, "t": 351.36542, "r": 286.36505, "b": 360.27197, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "indistinguishable features. This problem can be addressed", "bbox": {"l": 50.112, "t": 363.32141, "r": 286.36508, "b": 372.2279700000001, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "by treating such big tables with a separate model which ac-", "bbox": {"l": 50.112, "t": 375.2764, "r": 286.36511, "b": 384.18295000000006, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "cepts a large input image size.", "bbox": {"l": 50.112, "t": 387.23138, "r": 170.01187, "b": 396.13794, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Structure. As shown in Tab. 2, TableFormer outperforms all SOTA methods across different datasets by a large margin for predicting the table structure from an image. All the more, our model outperforms pre-trained methods. During the evaluation we do not apply any table filtering. We also provide our baseline results on the SynthTabNet dataset. It has been observed that large tables (e.g. tables that occupy half of the page or more) yield poor predictions. We attribute this issue to the image resizing during the preprocessing step, that produces downsampled images with indistinguishable features. This problem can be addressed by treating such big tables with a separate model which accepts a large input image size."}, {"label": "table", "id": 0, "page_no": 6, "cluster": {"id": 0, "label": "table", "bbox": {"l": 53.36848831176758, "t": 409.1357727050781, "r": 283.04437255859375, "b": 582.3977661132812, "coord_origin": "TOPLEFT"}, "confidence": 0.9892510175704956, "cells": [{"id": 53, "text": "Model", "bbox": {"l": 78.843002, "t": 420.69037, "r": 104.85535, "b": 429.59692, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "TEDS", "bbox": {"l": 211.2, "t": 414.71237, "r": 236.10649, "b": 423.61893, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "Dataset", "bbox": {"l": 129.338, "t": 426.66736, "r": 159.21584, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Simple", "bbox": {"l": 171.17096, "t": 426.66736, "r": 199.40497, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Complex", "bbox": {"l": 211.36009, "t": 426.66736, "r": 247.74349999999998, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "All", "bbox": {"l": 264.54044, "t": 426.66736, "r": 277.27264, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "EDD", "bbox": {"l": 81.612, "t": 443.62436, "r": 102.08514, "b": 452.53091, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "PTN", "bbox": {"l": 134.87206, "t": 443.62436, "r": 153.69141, "b": 452.53091, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "91.1", "bbox": {"l": 176.56554, "t": 443.62436, "r": 194.00009, "b": 452.53091, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "88.7", "bbox": {"l": 220.82938000000001, "t": 443.62436, "r": 238.26393, "b": 452.53091, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "89.9", "bbox": {"l": 262.18414, "t": 443.62436, "r": 279.61868, "b": 452.53091, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "GTE", "bbox": {"l": 82.165001, "t": 455.58035, "r": 101.5323, "b": 464.48691, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "PTN", "bbox": {"l": 134.86716, "t": 455.58035, "r": 153.68651, "b": 464.48691, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "-", "bbox": {"l": 183.62411, "t": 455.58035, "r": 186.94167, "b": 464.48691, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "-", "bbox": {"l": 227.88795000000002, "t": 455.58035, "r": 231.20551, "b": 464.48691, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "93.01", "bbox": {"l": 259.69855, "t": 455.58035, "r": 282.11441, "b": 464.48691, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 468.13336, "r": 117.38329000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "PTN", "bbox": {"l": 134.86766, "t": 468.13336, "r": 153.68701, "b": 477.03992, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "98.5", "bbox": {"l": 176.57111, "t": 468.13336, "r": 194.00566, "b": 477.03992, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "95.0", "bbox": {"l": 220.83495, "t": 468.13336, "r": 238.26950000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "96.75", "bbox": {"l": 259.698, "t": 468.01379, "r": 282.11386, "b": 476.97018, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "EDD", "bbox": {"l": 81.612, "t": 483.32635, "r": 102.08514, "b": 492.23291, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "FTN", "bbox": {"l": 134.87206, "t": 483.32635, "r": 153.69141, "b": 492.23291, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "88.4", "bbox": {"l": 176.56554, "t": 483.32635, "r": 194.00009, "b": 492.23291, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "92.08", "bbox": {"l": 218.33870999999996, "t": 483.32635, "r": 240.75455999999997, "b": 492.23291, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "90.6", "bbox": {"l": 262.18411, "t": 483.32635, "r": 279.61865, "b": 492.23291, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "GTE", "bbox": {"l": 82.165001, "t": 495.28134, "r": 101.5323, "b": 504.1879, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "FTN", "bbox": {"l": 134.86716, "t": 495.28134, "r": 153.68651, "b": 504.1879, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "-", "bbox": {"l": 183.62411, "t": 495.28134, "r": 186.94167, "b": 504.1879, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "-", "bbox": {"l": 227.88795000000002, "t": 495.28134, "r": 231.20551, "b": 504.1879, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "87.14", "bbox": {"l": 259.69855, "t": 495.28134, "r": 282.11441, "b": 504.1879, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "GTE (FT)", "bbox": {"l": 71.789001, "t": 507.23633, "r": 111.90838999999998, "b": 516.14288, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "FTN", "bbox": {"l": 134.86221, "t": 507.23633, "r": 153.68156, "b": 516.14288, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "-", "bbox": {"l": 183.62914, "t": 507.23633, "r": 186.94669, "b": 516.14288, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "-", "bbox": {"l": 227.89297, "t": 507.23633, "r": 231.21053000000003, "b": 516.14288, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "91.02", "bbox": {"l": 259.6936, "t": 507.23633, "r": 282.10947, "b": 516.14288, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 519.1913099999999, "r": 117.38329000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "FTN", "bbox": {"l": 134.86766, "t": 519.1913099999999, "r": 153.68701, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "97.5", "bbox": {"l": 176.57111, "t": 519.1913099999999, "r": 194.00566, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "96.0", "bbox": {"l": 220.83495, "t": 519.1913099999999, "r": 238.26950000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "96.8", "bbox": {"l": 262.189, "t": 519.0717500000001, "r": 279.62354, "b": 528.02814, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "EDD", "bbox": {"l": 81.612, "t": 536.49837, "r": 102.08514, "b": 545.40492, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "TB", "bbox": {"l": 137.91064, "t": 536.49837, "r": 150.64285, "b": 545.40492, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "86.0", "bbox": {"l": 176.56554, "t": 536.49837, "r": 194.00009, "b": 545.40492, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "-", "bbox": {"l": 227.89285, "t": 536.49837, "r": 231.21040000000002, "b": 545.40492, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "86.0", "bbox": {"l": 262.18411, "t": 536.49837, "r": 279.61865, "b": 545.40492, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 548.45436, "r": 117.38329000000002, "b": 557.36092, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "TB", "bbox": {"l": 137.90625, "t": 548.45436, "r": 150.63846, "b": 557.36092, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "89.6", "bbox": {"l": 176.57111, "t": 548.45436, "r": 194.00566, "b": 557.36092, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "-", "bbox": {"l": 227.88845999999998, "t": 548.45436, "r": 231.20601, "b": 557.36092, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "89.6", "bbox": {"l": 262.189, "t": 548.3348100000001, "r": 279.62354, "b": 557.2911799999999, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 568.00237, "r": 117.38329000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "STN", "bbox": {"l": 134.86766, "t": 568.00237, "r": 153.68701, "b": 576.90892, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "96.9", "bbox": {"l": 176.57111, "t": 568.00237, "r": 194.00566, "b": 576.90892, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "95.7", "bbox": {"l": 220.83495, "t": 568.00237, "r": 238.26950000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "96.7", "bbox": {"l": 262.1897, "t": 568.00237, "r": 279.62424, "b": 576.90892, "coord_origin": "TOPLEFT"}}], "children": [{"id": 17, "label": "text", "bbox": {"l": 78.843002, "t": 420.69037, "r": 104.85535, "b": 429.59692, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "Model", "bbox": {"l": 78.843002, "t": 420.69037, "r": 104.85535, "b": 429.59692, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 211.2, "t": 414.71237, "r": 236.10649, "b": 423.61893, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "TEDS", "bbox": {"l": 211.2, "t": 414.71237, "r": 236.10649, "b": 423.61893, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 129.338, "t": 426.66736, "r": 159.21584, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "Dataset", "bbox": {"l": 129.338, "t": 426.66736, "r": 159.21584, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 171.17096, "t": 426.66736, "r": 199.40497, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "Simple", "bbox": {"l": 171.17096, "t": 426.66736, "r": 199.40497, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 211.36009, "t": 426.66736, "r": 247.74349999999998, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "Complex", "bbox": {"l": 211.36009, "t": 426.66736, "r": 247.74349999999998, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 264.54044, "t": 426.66736, "r": 277.27264, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "All", "bbox": {"l": 264.54044, "t": 426.66736, "r": 277.27264, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 81.612, "t": 443.62436, "r": 102.08514, "b": 452.53091, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "EDD", "bbox": {"l": 81.612, "t": 443.62436, "r": 102.08514, "b": 452.53091, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 134.87206, "t": 443.62436, "r": 153.69141, "b": 452.53091, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "PTN", "bbox": {"l": 134.87206, "t": 443.62436, "r": 153.69141, "b": 452.53091, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 176.56554, "t": 443.62436, "r": 194.00009, "b": 452.53091, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "91.1", "bbox": {"l": 176.56554, "t": 443.62436, "r": 194.00009, "b": 452.53091, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 220.82938000000001, "t": 443.62436, "r": 238.26393, "b": 452.53091, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "88.7", "bbox": {"l": 220.82938000000001, "t": 443.62436, "r": 238.26393, "b": 452.53091, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 262.18414, "t": 443.62436, "r": 279.61868, "b": 452.53091, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "89.9", "bbox": {"l": 262.18414, "t": 443.62436, "r": 279.61868, "b": 452.53091, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 82.165001, "t": 455.58035, "r": 101.5323, "b": 464.48691, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "GTE", "bbox": {"l": 82.165001, "t": 455.58035, "r": 101.5323, "b": 464.48691, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 134.86716, "t": 455.58035, "r": 153.68651, "b": 464.48691, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "PTN", "bbox": {"l": 134.86716, "t": 455.58035, "r": 153.68651, "b": 464.48691, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 183.62411, "t": 455.58035, "r": 186.94167, "b": 464.48691, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "-", "bbox": {"l": 183.62411, "t": 455.58035, "r": 186.94167, "b": 464.48691, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 227.88795000000002, "t": 455.58035, "r": 231.20551, "b": 464.48691, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "-", "bbox": {"l": 227.88795000000002, "t": 455.58035, "r": 231.20551, "b": 464.48691, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 259.69855, "t": 455.58035, "r": 282.11441, "b": 464.48691, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "93.01", "bbox": {"l": 259.69855, "t": 455.58035, "r": 282.11441, "b": 464.48691, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 66.315002, "t": 468.13336, "r": 117.38329000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 468.13336, "r": 117.38329000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 134.86766, "t": 468.13336, "r": 153.68701, "b": 477.03992, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "PTN", "bbox": {"l": 134.86766, "t": 468.13336, "r": 153.68701, "b": 477.03992, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 176.57111, "t": 468.13336, "r": 194.00566, "b": 477.03992, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "98.5", "bbox": {"l": 176.57111, "t": 468.13336, "r": 194.00566, "b": 477.03992, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 220.83495, "t": 468.13336, "r": 238.26950000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "95.0", "bbox": {"l": 220.83495, "t": 468.13336, "r": 238.26950000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 259.698, "t": 468.01379, "r": 282.11386, "b": 476.97018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "96.75", "bbox": {"l": 259.698, "t": 468.01379, "r": 282.11386, "b": 476.97018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 81.612, "t": 483.32635, "r": 102.08514, "b": 492.23291, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "EDD", "bbox": {"l": 81.612, "t": 483.32635, "r": 102.08514, "b": 492.23291, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 134.87206, "t": 483.32635, "r": 153.69141, "b": 492.23291, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "FTN", "bbox": {"l": 134.87206, "t": 483.32635, "r": 153.69141, "b": 492.23291, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 176.56554, "t": 483.32635, "r": 194.00009, "b": 492.23291, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "88.4", "bbox": {"l": 176.56554, "t": 483.32635, "r": 194.00009, "b": 492.23291, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 218.33870999999996, "t": 483.32635, "r": 240.75455999999997, "b": 492.23291, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "92.08", "bbox": {"l": 218.33870999999996, "t": 483.32635, "r": 240.75455999999997, "b": 492.23291, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 262.18411, "t": 483.32635, "r": 279.61865, "b": 492.23291, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "90.6", "bbox": {"l": 262.18411, "t": 483.32635, "r": 279.61865, "b": 492.23291, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 82.165001, "t": 495.28134, "r": 101.5323, "b": 504.1879, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "GTE", "bbox": {"l": 82.165001, "t": 495.28134, "r": 101.5323, "b": 504.1879, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 134.86716, "t": 495.28134, "r": 153.68651, "b": 504.1879, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "FTN", "bbox": {"l": 134.86716, "t": 495.28134, "r": 153.68651, "b": 504.1879, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 183.62411, "t": 495.28134, "r": 186.94167, "b": 504.1879, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "-", "bbox": {"l": 183.62411, "t": 495.28134, "r": 186.94167, "b": 504.1879, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 227.88795000000002, "t": 495.28134, "r": 231.20551, "b": 504.1879, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "-", "bbox": {"l": 227.88795000000002, "t": 495.28134, "r": 231.20551, "b": 504.1879, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 259.69855, "t": 495.28134, "r": 282.11441, "b": 504.1879, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "87.14", "bbox": {"l": 259.69855, "t": 495.28134, "r": 282.11441, "b": 504.1879, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 71.789001, "t": 507.23633, "r": 111.90838999999998, "b": 516.14288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "GTE (FT)", "bbox": {"l": 71.789001, "t": 507.23633, "r": 111.90838999999998, "b": 516.14288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 134.86221, "t": 507.23633, "r": 153.68156, "b": 516.14288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "FTN", "bbox": {"l": 134.86221, "t": 507.23633, "r": 153.68156, "b": 516.14288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 183.62914, "t": 507.23633, "r": 186.94669, "b": 516.14288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "-", "bbox": {"l": 183.62914, "t": 507.23633, "r": 186.94669, "b": 516.14288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 227.89297, "t": 507.23633, "r": 231.21053000000003, "b": 516.14288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "-", "bbox": {"l": 227.89297, "t": 507.23633, "r": 231.21053000000003, "b": 516.14288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 259.6936, "t": 507.23633, "r": 282.10947, "b": 516.14288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "91.02", "bbox": {"l": 259.6936, "t": 507.23633, "r": 282.10947, "b": 516.14288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 66.315002, "t": 519.1913099999999, "r": 117.38329000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 519.1913099999999, "r": 117.38329000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 134.86766, "t": 519.1913099999999, "r": 153.68701, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "FTN", "bbox": {"l": 134.86766, "t": 519.1913099999999, "r": 153.68701, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 176.57111, "t": 519.1913099999999, "r": 194.00566, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "97.5", "bbox": {"l": 176.57111, "t": 519.1913099999999, "r": 194.00566, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 220.83495, "t": 519.1913099999999, "r": 238.26950000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "96.0", "bbox": {"l": 220.83495, "t": 519.1913099999999, "r": 238.26950000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 262.189, "t": 519.0717500000001, "r": 279.62354, "b": 528.02814, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "96.8", "bbox": {"l": 262.189, "t": 519.0717500000001, "r": 279.62354, "b": 528.02814, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 81.612, "t": 536.49837, "r": 102.08514, "b": 545.40492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "EDD", "bbox": {"l": 81.612, "t": 536.49837, "r": 102.08514, "b": 545.40492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 137.91064, "t": 536.49837, "r": 150.64285, "b": 545.40492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "TB", "bbox": {"l": 137.91064, "t": 536.49837, "r": 150.64285, "b": 545.40492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 176.56554, "t": 536.49837, "r": 194.00009, "b": 545.40492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "86.0", "bbox": {"l": 176.56554, "t": 536.49837, "r": 194.00009, "b": 545.40492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 227.89285, "t": 536.49837, "r": 231.21040000000002, "b": 545.40492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "-", "bbox": {"l": 227.89285, "t": 536.49837, "r": 231.21040000000002, "b": 545.40492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 262.18411, "t": 536.49837, "r": 279.61865, "b": 545.40492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "86.0", "bbox": {"l": 262.18411, "t": 536.49837, "r": 279.61865, "b": 545.40492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 66.315002, "t": 548.45436, "r": 117.38329000000002, "b": 557.36092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 548.45436, "r": 117.38329000000002, "b": 557.36092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 137.90625, "t": 548.45436, "r": 150.63846, "b": 557.36092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "TB", "bbox": {"l": 137.90625, "t": 548.45436, "r": 150.63846, "b": 557.36092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 176.57111, "t": 548.45436, "r": 194.00566, "b": 557.36092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "89.6", "bbox": {"l": 176.57111, "t": 548.45436, "r": 194.00566, "b": 557.36092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 227.88845999999998, "t": 548.45436, "r": 231.20601, "b": 557.36092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "-", "bbox": {"l": 227.88845999999998, "t": 548.45436, "r": 231.20601, "b": 557.36092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 262.189, "t": 548.3348100000001, "r": 279.62354, "b": 557.2911799999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": "89.6", "bbox": {"l": 262.189, "t": 548.3348100000001, "r": 279.62354, "b": 557.2911799999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 66.315002, "t": 568.00237, "r": 117.38329000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 568.00237, "r": 117.38329000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 134.86766, "t": 568.00237, "r": 153.68701, "b": 576.90892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "STN", "bbox": {"l": 134.86766, "t": 568.00237, "r": 153.68701, "b": 576.90892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 176.57111, "t": 568.00237, "r": 194.00566, "b": 576.90892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": "96.9", "bbox": {"l": 176.57111, "t": 568.00237, "r": 194.00566, "b": 576.90892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 220.83495, "t": 568.00237, "r": 238.26950000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 107, "text": "95.7", "bbox": {"l": 220.83495, "t": 568.00237, "r": 238.26950000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 262.1897, "t": 568.00237, "r": 279.62424, "b": 576.90892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 108, "text": "96.7", "bbox": {"l": 262.1897, "t": 568.00237, "r": 279.62424, "b": 576.90892, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 11, "num_cols": 5, "table_cells": [{"bbox": {"l": 78.843002, "t": 420.69037, "r": 104.85535, "b": 429.59692, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Model", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 211.2, "t": 414.71237, "r": 247.74349999999998, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "TEDS Complex", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 129.338, "t": 426.66736, "r": 159.21584, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Dataset", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 171.17096, "t": 426.66736, "r": 199.40497, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Simple", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 264.54044, "t": 426.66736, "r": 277.27264, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "All", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 81.612, "t": 443.62436, "r": 102.08514, "b": 452.53091, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "EDD", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.87206, "t": 443.62436, "r": 153.69141, "b": 452.53091, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "PTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.56554, "t": 443.62436, "r": 194.00009, "b": 452.53091, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "91.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 220.82938000000001, "t": 443.62436, "r": 238.26393, "b": 452.53091, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "88.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 262.18414, "t": 443.62436, "r": 279.61868, "b": 452.53091, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "89.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 82.165001, "t": 455.58035, "r": 101.5323, "b": 464.48691, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "GTE", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.86716, "t": 455.58035, "r": 153.68651, "b": 464.48691, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "PTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 183.62411, "t": 455.58035, "r": 186.94167, "b": 464.48691, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 227.88795000000002, "t": 455.58035, "r": 231.20551, "b": 464.48691, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 259.69855, "t": 455.58035, "r": 282.11441, "b": 464.48691, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "93.01", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 66.315002, "t": 468.13336, "r": 117.38329000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.86766, "t": 468.13336, "r": 153.68701, "b": 477.03992, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "PTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.57111, "t": 468.13336, "r": 194.00566, "b": 477.03992, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "98.5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 220.83495, "t": 468.13336, "r": 238.26950000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "95.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 259.698, "t": 468.01379, "r": 282.11386, "b": 476.97018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "96.75", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 81.612, "t": 483.32635, "r": 102.08514, "b": 492.23291, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "EDD", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.87206, "t": 483.32635, "r": 153.69141, "b": 492.23291, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "FTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.56554, "t": 483.32635, "r": 194.00009, "b": 492.23291, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "88.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 218.33870999999996, "t": 483.32635, "r": 240.75455999999997, "b": 492.23291, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "92.08", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 262.18411, "t": 483.32635, "r": 279.61865, "b": 492.23291, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "90.6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 82.165001, "t": 495.28134, "r": 101.5323, "b": 504.1879, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "GTE", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.86716, "t": 495.28134, "r": 153.68651, "b": 504.1879, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "FTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 183.62411, "t": 495.28134, "r": 186.94167, "b": 504.1879, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 227.88795000000002, "t": 495.28134, "r": 231.20551, "b": 504.1879, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 259.69855, "t": 495.28134, "r": 282.11441, "b": 504.1879, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "87.14", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 71.789001, "t": 507.23633, "r": 111.90838999999998, "b": 516.14288, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "GTE (FT)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.86221, "t": 507.23633, "r": 153.68156, "b": 516.14288, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "FTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 183.62914, "t": 507.23633, "r": 186.94669, "b": 516.14288, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 227.89297, "t": 507.23633, "r": 231.21053000000003, "b": 516.14288, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 259.6936, "t": 507.23633, "r": 282.10947, "b": 516.14288, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "91.02", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 66.315002, "t": 519.1913099999999, "r": 117.38329000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.86766, "t": 519.1913099999999, "r": 153.68701, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "FTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.57111, "t": 519.1913099999999, "r": 194.00566, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "97.5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 220.83495, "t": 519.1913099999999, "r": 238.26950000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "96.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 262.189, "t": 519.0717500000001, "r": 279.62354, "b": 528.02814, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "96.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 81.612, "t": 536.49837, "r": 102.08514, "b": 545.40492, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "EDD", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 137.91064, "t": 536.49837, "r": 150.64285, "b": 545.40492, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "TB", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.56554, "t": 536.49837, "r": 194.00009, "b": 545.40492, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "86.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 227.89285, "t": 536.49837, "r": 231.21040000000002, "b": 545.40492, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 262.18411, "t": 536.49837, "r": 279.61865, "b": 545.40492, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "86.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 66.315002, "t": 548.45436, "r": 117.38329000000002, "b": 557.36092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 137.90625, "t": 548.45436, "r": 150.63846, "b": 557.36092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "TB", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.57111, "t": 548.45436, "r": 194.00566, "b": 557.36092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "89.6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 227.88845999999998, "t": 548.45436, "r": 231.20601, "b": 557.36092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 262.189, "t": 548.3348100000001, "r": 279.62354, "b": 557.2911799999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "89.6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 66.315002, "t": 568.00237, "r": 117.38329000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.86766, "t": 568.00237, "r": 153.68701, "b": 576.90892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "STN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.57111, "t": 568.00237, "r": 194.00566, "b": 576.90892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "96.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 220.83495, "t": 568.00237, "r": 238.26950000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "95.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 262.1897, "t": 568.00237, "r": 279.62424, "b": 576.90892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "96.7", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "text", "id": 15, "page_no": 6, "cluster": {"id": 15, "label": "text", "bbox": {"l": 50.112, "t": 592.43336, "r": 286.36511, "b": 613.29492, "coord_origin": "TOPLEFT"}, "confidence": 0.7209174633026123, "cells": [{"id": 109, "text": "Table 2: Structure results on PubTabNet (PTN), FinTabNet", "bbox": {"l": 50.112, "t": 592.43336, "r": 286.36511, "b": 601.33992, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "(FTN), TableBank (TB) and SynthTabNet (STN).", "bbox": {"l": 50.112, "t": 604.38837, "r": 247.46114, "b": 613.29492, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 2: Structure results on PubTabNet (PTN), FinTabNet (FTN), TableBank (TB) and SynthTabNet (STN)."}, {"label": "text", "id": 16, "page_no": 6, "cluster": {"id": 16, "label": "text", "bbox": {"l": 50.112, "t": 616.34337, "r": 261.78732, "b": 625.24992, "coord_origin": "TOPLEFT"}, "confidence": 0.6433308124542236, "cells": [{"id": 111, "text": "FT: Model was trained on PubTabNet then finetuned.", "bbox": {"l": 50.112, "t": 616.34337, "r": 261.78732, "b": 625.24992, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "FT: Model was trained on PubTabNet then finetuned."}, {"label": "text", "id": 3, "page_no": 6, "cluster": {"id": 3, "label": "text", "bbox": {"l": 50.112015, "t": 644.3498099999999, "r": 286.366, "b": 713.151932, "coord_origin": "TOPLEFT"}, "confidence": 0.9854633808135986, "cells": [{"id": 112, "text": "Cell Detection.", "bbox": {"l": 62.067001, "t": 644.3498099999999, "r": 124.72179, "b": 653.30618, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "Like any object detector, our", "bbox": {"l": 128.20401, "t": 644.46936, "r": 242.9333, "b": 653.37592, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "Cell BBox", "bbox": {"l": 245.55401999999998, "t": 644.55902, "r": 286.36084, "b": 653.1467700000001, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "Detector", "bbox": {"l": 50.112015, "t": 656.51402, "r": 84.971146, "b": 665.10178, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "provides bounding boxes that can be improved", "bbox": {"l": 89.515015, "t": 656.42436, "r": 286.366, "b": 665.33092, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "with post-processing during inference. We make use of the", "bbox": {"l": 50.112015, "t": 668.37936, "r": 286.36511, "b": 677.28593, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "grid-like structure of tables to refine the predictions. A de-", "bbox": {"l": 50.112015, "t": 680.33536, "r": 286.36505, "b": 689.24193, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "tailed explanation on the post-processing is available in the", "bbox": {"l": 50.112015, "t": 692.290359, "r": 286.36511, "b": 701.19693, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "supplementary material. As shown in Tab. 3, we evaluate", "bbox": {"l": 50.112015, "t": 704.245361, "r": 286.36508, "b": 713.151932, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Cell Detection. Like any object detector, our Cell BBox Detector provides bounding boxes that can be improved with post-processing during inference. We make use of the grid-like structure of tables to refine the predictions. A detailed explanation on the post-processing is available in the supplementary material. As shown in Tab. 3, we evaluate"}, {"label": "text", "id": 7, "page_no": 6, "cluster": {"id": 7, "label": "text", "bbox": {"l": 308.862, "t": 75.20836999999995, "r": 545.11517, "b": 227.57709, "coord_origin": "TOPLEFT"}, "confidence": 0.9713196754455566, "cells": [{"id": 121, "text": "our", "bbox": {"l": 308.862, "t": 75.20836999999995, "r": 322.14215, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Cell BBox Decoder", "bbox": {"l": 325.45401, "t": 75.29803000000004, "r": 404.56702, "b": 83.88580000000002, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "accuracy for cells with a class la-", "bbox": {"l": 408.104, "t": 75.20836999999995, "r": 545.10968, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "bel of \u2018content\u2019 only using the PASCAL VOC mAP metric", "bbox": {"l": 308.862, "t": 87.16339000000005, "r": 545.11511, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "for pre-processing and post-processing.", "bbox": {"l": 308.862, "t": 99.11841000000004, "r": 470.22626, "b": 108.02495999999985, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "Note that we do", "bbox": {"l": 477.52884, "t": 99.11841000000004, "r": 545.11511, "b": 108.02495999999985, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "not have post-processing results for SynthTabNet as images", "bbox": {"l": 308.862, "t": 111.07343000000003, "r": 545.11517, "b": 119.97997999999984, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "are only provided. To compare the performance of our pro-", "bbox": {"l": 308.862, "t": 123.02844000000005, "r": 545.11511, "b": 131.93499999999995, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "posed approach, we\u2019ve integrated TableFormer\u2019s", "bbox": {"l": 308.862, "t": 134.98443999999995, "r": 502.01691000000005, "b": 143.89099, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "Cell BBox", "bbox": {"l": 504.47299, "t": 135.07410000000004, "r": 545.11041, "b": 143.66187000000002, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "Decoder", "bbox": {"l": 308.862, "t": 147.02910999999995, "r": 343.16324, "b": 155.61688000000004, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "into EDD architecture. As mentioned previously,", "bbox": {"l": 346.371, "t": 146.93944999999997, "r": 545.11493, "b": 155.84600999999998, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "the Structure Decoder provides the", "bbox": {"l": 308.862, "t": 158.89446999999996, "r": 446.15652, "b": 167.80102999999997, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "Cell BBox Decoder", "bbox": {"l": 448.28998000000007, "t": 158.98413000000005, "r": 525.04181, "b": 167.57190000000003, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "with", "bbox": {"l": 527.39899, "t": 158.89446999999996, "r": 545.11249, "b": 167.80102999999997, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "the features needed to predict the bounding box predictions.", "bbox": {"l": 308.862, "t": 170.84948999999995, "r": 545.11511, "b": 179.75603999999998, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "Therefore, the accuracy of the", "bbox": {"l": 308.862, "t": 182.80449999999996, "r": 432.86642000000006, "b": 191.71105999999997, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "Structure Decoder", "bbox": {"l": 436.39001, "t": 182.89417000000003, "r": 510.93021, "b": 191.48193000000003, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "directly", "bbox": {"l": 514.677, "t": 182.80449999999996, "r": 545.11273, "b": 191.71105999999997, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "influences the accuracy of the", "bbox": {"l": 308.862, "t": 194.75951999999995, "r": 431.17285, "b": 203.66607999999997, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "Cell BBox Decoder", "bbox": {"l": 434.6790199999999, "t": 194.84918000000005, "r": 514.18054, "b": 203.43695000000002, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": ". If the", "bbox": {"l": 514.17603, "t": 194.75951999999995, "r": 545.10992, "b": 203.66607999999997, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "Structure Decoder", "bbox": {"l": 308.86203, "t": 206.80517999999995, "r": 382.35614, "b": 215.39293999999995, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "predicts an extra column, this will result", "bbox": {"l": 385.07501, "t": 206.71551999999997, "r": 545.11426, "b": 215.62207, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "in an extra column of predicted bounding boxes.", "bbox": {"l": 308.862, "t": 218.67052999999999, "r": 501.6981799999999, "b": 227.57709, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "our Cell BBox Decoder accuracy for cells with a class label of \u2018content\u2019 only using the PASCAL VOC mAP metric for pre-processing and post-processing. Note that we do not have post-processing results for SynthTabNet as images are only provided. To compare the performance of our proposed approach, we\u2019ve integrated TableFormer\u2019s Cell BBox Decoder into EDD architecture. As mentioned previously, the Structure Decoder provides the Cell BBox Decoder with the features needed to predict the bounding box predictions. Therefore, the accuracy of the Structure Decoder directly influences the accuracy of the Cell BBox Decoder . If the Structure Decoder predicts an extra column, this will result in an extra column of predicted bounding boxes."}, {"label": "table", "id": 8, "page_no": 6, "cluster": {"id": 8, "label": "table", "bbox": {"l": 308.4068908691406, "t": 247.87631225585938, "r": 533.6420288085938, "b": 303.8056640625, "coord_origin": "TOPLEFT"}, "confidence": 0.9691731929779053, "cells": [{"id": 146, "text": "Model", "bbox": {"l": 339.323, "t": 253.66436999999996, "r": 365.33536, "b": 262.57092, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "Dataset", "bbox": {"l": 401.04132, "t": 253.66436999999996, "r": 430.91916, "b": 262.57092, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "mAP", "bbox": {"l": 454.10214, "t": 253.66436999999996, "r": 474.58523999999994, "b": 262.57092, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "mAP (PP)", "bbox": {"l": 486.54034, "t": 253.66436999999996, "r": 527.2276, "b": 262.57092, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "EDD+BBox", "bbox": {"l": 327.65601, "t": 270.62134000000003, "r": 377.00076, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "PubTabNet", "bbox": {"l": 393.69809, "t": 270.62134000000003, "r": 438.28073, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "79.2", "bbox": {"l": 455.63559, "t": 270.62134000000003, "r": 473.07013, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "82.7", "bbox": {"l": 498.16592, "t": 270.62134000000003, "r": 515.60046, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "TableFormer", "bbox": {"l": 326.79501, "t": 282.57631999999995, "r": 377.86331, "b": 291.48288, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "PubTabNet", "bbox": {"l": 393.69388, "t": 282.57631999999995, "r": 438.27652, "b": 291.48288, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "82.1", "bbox": {"l": 455.63101, "t": 282.45676, "r": 473.06555000000003, "b": 291.41315, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "86.8", "bbox": {"l": 498.1713, "t": 282.45676, "r": 515.60583, "b": 291.41315, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "TableFormer", "bbox": {"l": 326.79501, "t": 294.53131, "r": 377.86331, "b": 303.43787, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "SynthTabNet", "bbox": {"l": 389.81842, "t": 294.53131, "r": 442.15194999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "87.7", "bbox": {"l": 455.63135, "t": 294.53131, "r": 473.06589, "b": 303.43787, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "-", "bbox": {"l": 505.22515999999996, "t": 294.53131, "r": 508.54268999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}}], "children": [{"id": 73, "label": "text", "bbox": {"l": 339.323, "t": 253.66436999999996, "r": 365.33536, "b": 262.57092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 146, "text": "Model", "bbox": {"l": 339.323, "t": 253.66436999999996, "r": 365.33536, "b": 262.57092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 401.04132, "t": 253.66436999999996, "r": 430.91916, "b": 262.57092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 147, "text": "Dataset", "bbox": {"l": 401.04132, "t": 253.66436999999996, "r": 430.91916, "b": 262.57092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 454.10214, "t": 253.66436999999996, "r": 474.58523999999994, "b": 262.57092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 148, "text": "mAP", "bbox": {"l": 454.10214, "t": 253.66436999999996, "r": 474.58523999999994, "b": 262.57092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 486.54034, "t": 253.66436999999996, "r": 527.2276, "b": 262.57092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 149, "text": "mAP (PP)", "bbox": {"l": 486.54034, "t": 253.66436999999996, "r": 527.2276, "b": 262.57092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 327.65601, "t": 270.62134000000003, "r": 377.00076, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 150, "text": "EDD+BBox", "bbox": {"l": 327.65601, "t": 270.62134000000003, "r": 377.00076, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 393.69809, "t": 270.62134000000003, "r": 438.28073, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 151, "text": "PubTabNet", "bbox": {"l": 393.69809, "t": 270.62134000000003, "r": 438.28073, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 455.63559, "t": 270.62134000000003, "r": 473.07013, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 152, "text": "79.2", "bbox": {"l": 455.63559, "t": 270.62134000000003, "r": 473.07013, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 498.16592, "t": 270.62134000000003, "r": 515.60046, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 153, "text": "82.7", "bbox": {"l": 498.16592, "t": 270.62134000000003, "r": 515.60046, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 326.79501, "t": 282.57631999999995, "r": 377.86331, "b": 291.48288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 154, "text": "TableFormer", "bbox": {"l": 326.79501, "t": 282.57631999999995, "r": 377.86331, "b": 291.48288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 393.69388, "t": 282.57631999999995, "r": 438.27652, "b": 291.48288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 155, "text": "PubTabNet", "bbox": {"l": 393.69388, "t": 282.57631999999995, "r": 438.27652, "b": 291.48288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 455.63101, "t": 282.45676, "r": 473.06555000000003, "b": 291.41315, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 156, "text": "82.1", "bbox": {"l": 455.63101, "t": 282.45676, "r": 473.06555000000003, "b": 291.41315, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 498.1713, "t": 282.45676, "r": 515.60583, "b": 291.41315, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 157, "text": "86.8", "bbox": {"l": 498.1713, "t": 282.45676, "r": 515.60583, "b": 291.41315, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 326.79501, "t": 294.53131, "r": 377.86331, "b": 303.43787, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 158, "text": "TableFormer", "bbox": {"l": 326.79501, "t": 294.53131, "r": 377.86331, "b": 303.43787, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 389.81842, "t": 294.53131, "r": 442.15194999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 159, "text": "SynthTabNet", "bbox": {"l": 389.81842, "t": 294.53131, "r": 442.15194999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 455.63135, "t": 294.53131, "r": 473.06589, "b": 303.43787, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 160, "text": "87.7", "bbox": {"l": 455.63135, "t": 294.53131, "r": 473.06589, "b": 303.43787, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 505.22515999999996, "t": 294.53131, "r": 508.54268999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 161, "text": "-", "bbox": {"l": 505.22515999999996, "t": 294.53131, "r": 508.54268999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 4, "num_cols": 4, "table_cells": [{"bbox": {"l": 339.323, "t": 253.66436999999996, "r": 365.33536, "b": 262.57092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Model", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 401.04132, "t": 253.66436999999996, "r": 430.91916, "b": 262.57092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Dataset", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 454.10214, "t": 253.66436999999996, "r": 474.58523999999994, "b": 262.57092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "mAP", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 486.54034, "t": 253.66436999999996, "r": 527.2276, "b": 262.57092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "mAP (PP)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 327.65601, "t": 270.62134000000003, "r": 377.00076, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "EDD+BBox", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 393.69809, "t": 270.62134000000003, "r": 438.28073, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "PubTabNet", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 455.63559, "t": 270.62134000000003, "r": 473.07013, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "79.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 498.16592, "t": 270.62134000000003, "r": 515.60046, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "82.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.79501, "t": 282.57631999999995, "r": 377.86331, "b": 291.48288, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 393.69388, "t": 282.57631999999995, "r": 438.27652, "b": 291.48288, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "PubTabNet", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 455.63101, "t": 282.45676, "r": 473.06555000000003, "b": 291.41315, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "82.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 498.1713, "t": 282.45676, "r": 515.60583, "b": 291.41315, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "86.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.79501, "t": 294.53131, "r": 377.86331, "b": 303.43787, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 389.81842, "t": 294.53131, "r": 442.15194999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "SynthTabNet", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 455.63135, "t": 294.53131, "r": 473.06589, "b": 303.43787, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "87.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 505.22515999999996, "t": 294.53131, "r": 508.54268999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "caption", "id": 12, "page_no": 6, "cluster": {"id": 12, "label": "caption", "bbox": {"l": 308.862, "t": 316.44931, "r": 545.11517, "b": 337.3108500000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9519919157028198, "cells": [{"id": 162, "text": "Table 3:", "bbox": {"l": 308.862, "t": 316.44931, "r": 341.49951, "b": 325.35587, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "Cell Bounding Box detection results on PubTab-", "bbox": {"l": 348.60284, "t": 316.44931, "r": 545.11517, "b": 325.35587, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "Net, and FinTabNet. PP: Post-processing.", "bbox": {"l": 308.862, "t": 328.4043, "r": 474.97845, "b": 337.3108500000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 3: Cell Bounding Box detection results on PubTabNet, and FinTabNet. PP: Post-processing."}, {"label": "text", "id": 4, "page_no": 6, "cluster": {"id": 4, "label": "text", "bbox": {"l": 308.86197, "t": 367.6797199999999, "r": 545.11566, "b": 520.16769, "coord_origin": "TOPLEFT"}, "confidence": 0.9835010766983032, "cells": [{"id": 165, "text": "Cell Content.", "bbox": {"l": 320.81699, "t": 367.6797199999999, "r": 378.94876, "b": 376.63611, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "In this section, we evaluate the entire", "bbox": {"l": 387.07898, "t": 367.79929, "r": 545.11566, "b": 376.70584, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "pipeline of recovering a table with content.", "bbox": {"l": 308.86197, "t": 379.75426999999996, "r": 487.19257, "b": 388.66083, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "Here we put", "bbox": {"l": 493.96713, "t": 379.75426999999996, "r": 545.11511, "b": 388.66083, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "our approach to test by capitalizing on extracting content", "bbox": {"l": 308.86197, "t": 391.70926, "r": 545.11505, "b": 400.61581, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "from the PDF cells rather than decoding from images. Tab.", "bbox": {"l": 308.86197, "t": 403.66525, "r": 545.11523, "b": 412.57181, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "4", "bbox": {"l": 308.86197, "t": 415.62024, "r": 314.08096, "b": 424.52679, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "shows the TEDs score of HTML code representing the", "bbox": {"l": 316.69046, "t": 415.62024, "r": 545.11517, "b": 424.52679, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "structure of the table along with the content inserted in the", "bbox": {"l": 308.86197, "t": 427.57523, "r": 545.11505, "b": 436.48177999999996, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "data cell and compared with the ground-truth. Our method", "bbox": {"l": 308.86197, "t": 439.53021, "r": 545.11505, "b": 448.43677, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "achieved a", "bbox": {"l": 308.86197, "t": 451.4852, "r": 350.23666, "b": 460.39175, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "5.3%", "bbox": {"l": 352.17596, "t": 451.36563, "r": 374.59183, "b": 460.32201999999995, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "increase over the state-of-the-art, and com-", "bbox": {"l": 376.53296, "t": 451.4852, "r": 545.11011, "b": 460.39175, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "mercial solutions. We believe our scores would be higher", "bbox": {"l": 308.86197, "t": 463.44019, "r": 545.11511, "b": 472.34674, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "if the HTML ground-truth matched the extracted PDF cell", "bbox": {"l": 308.86197, "t": 475.39618, "r": 545.11517, "b": 484.30273, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "content. Unfortunately, there are small discrepancies such", "bbox": {"l": 308.86197, "t": 487.35117, "r": 545.11511, "b": 496.25772, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "as spacings around words or special characters with various", "bbox": {"l": 308.86197, "t": 499.30615, "r": 545.11505, "b": 508.21271, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "unicode representations.", "bbox": {"l": 308.86197, "t": 511.26114, "r": 405.69846, "b": 520.16769, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Cell Content. In this section, we evaluate the entire pipeline of recovering a table with content. Here we put our approach to test by capitalizing on extracting content from the PDF cells rather than decoding from images. Tab. 4 shows the TEDs score of HTML code representing the structure of the table along with the content inserted in the data cell and compared with the ground-truth. Our method achieved a 5.3% increase over the state-of-the-art, and commercial solutions. We believe our scores would be higher if the HTML ground-truth matched the extracted PDF cell content. Unfortunately, there are small discrepancies such as spacings around words or special characters with various unicode representations."}, {"label": "table", "id": 5, "page_no": 6, "cluster": {"id": 5, "label": "table", "bbox": {"l": 332.9688720703125, "t": 540.2835083007812, "r": 520.942138671875, "b": 643.2697143554688, "coord_origin": "TOPLEFT"}, "confidence": 0.9775568842887878, "cells": [{"id": 183, "text": "Model", "bbox": {"l": 358.01099, "t": 552.23337, "r": 384.02335, "b": 561.1399200000001, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "TEDS", "bbox": {"l": 449.03400000000005, "t": 546.25537, "r": 473.94049000000007, "b": 555.16193, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": "Simple", "bbox": {"l": 408.50598, "t": 558.21037, "r": 436.73999, "b": 567.11693, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "Complex", "bbox": {"l": 448.6951, "t": 558.21037, "r": 485.07849, "b": 567.11693, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "All", "bbox": {"l": 499.3848, "t": 558.21037, "r": 512.117, "b": 567.11693, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": "Tabula", "bbox": {"l": 357.68201, "t": 575.16736, "r": 384.3519, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "78.0", "bbox": {"l": 413.90097, "t": 575.16736, "r": 431.33550999999994, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "57.8", "bbox": {"l": 458.16479000000004, "t": 575.16736, "r": 475.59933000000007, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "67.9", "bbox": {"l": 497.0289, "t": 575.16736, "r": 514.46344, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": "Traprange", "bbox": {"l": 350.72299, "t": 587.12236, "r": 391.31064, "b": 596.02892, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "60.8", "bbox": {"l": 413.90582, "t": 587.12236, "r": 431.34036, "b": 596.02892, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "49.9", "bbox": {"l": 458.16965, "t": 587.12236, "r": 475.60419, "b": 596.02892, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "55.4", "bbox": {"l": 497.03374999999994, "t": 587.12236, "r": 514.46832, "b": 596.02892, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "Camelot", "bbox": {"l": 354.13599, "t": 599.07835, "r": 387.89923, "b": 607.98491, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "80.0", "bbox": {"l": 413.90161, "t": 599.07835, "r": 431.33615, "b": 607.98491, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "66.0", "bbox": {"l": 458.16544, "t": 599.07835, "r": 475.59998, "b": 607.98491, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "73.0", "bbox": {"l": 497.02954000000005, "t": 599.07835, "r": 514.46411, "b": 607.98491, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "Acrobat Pro", "bbox": {"l": 346.55899, "t": 611.03336, "r": 395.47534, "b": 619.93991, "coord_origin": "TOPLEFT"}}, {"id": 201, "text": "68.9", "bbox": {"l": 413.90616, "t": 611.03336, "r": 431.34069999999997, "b": 619.93991, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": "61.8", "bbox": {"l": 458.16998000000007, "t": 611.03336, "r": 475.60452, "b": 619.93991, "coord_origin": "TOPLEFT"}}, {"id": 203, "text": "65.3", "bbox": {"l": 497.03409, "t": 611.03336, "r": 514.46863, "b": 619.93991, "coord_origin": "TOPLEFT"}}, {"id": 204, "text": "EDD", "bbox": {"l": 360.78101, "t": 622.9883600000001, "r": 381.25415, "b": 631.89491, "coord_origin": "TOPLEFT"}}, {"id": 205, "text": "91.2", "bbox": {"l": 413.90158, "t": 622.9883600000001, "r": 431.33612, "b": 631.89491, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": "85.4", "bbox": {"l": 458.16541, "t": 622.9883600000001, "r": 475.59995000000004, "b": 631.89491, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": "88.3", "bbox": {"l": 497.0295100000001, "t": 622.9883600000001, "r": 514.46405, "b": 631.89491, "coord_origin": "TOPLEFT"}}, {"id": 208, "text": "TableFormer", "bbox": {"l": 345.483, "t": 634.94336, "r": 396.5513, "b": 643.84991, "coord_origin": "TOPLEFT"}}, {"id": 209, "text": "95.4", "bbox": {"l": 413.90616, "t": 634.94336, "r": 431.34069999999997, "b": 643.84991, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": "90.1", "bbox": {"l": 458.16998000000007, "t": 634.94336, "r": 475.60452, "b": 643.84991, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "93.6", "bbox": {"l": 497.03400000000005, "t": 634.82381, "r": 514.46857, "b": 643.78018, "coord_origin": "TOPLEFT"}}], "children": [{"id": 89, "label": "text", "bbox": {"l": 358.01099, "t": 552.23337, "r": 384.02335, "b": 561.1399200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 183, "text": "Model", "bbox": {"l": 358.01099, "t": 552.23337, "r": 384.02335, "b": 561.1399200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 449.03400000000005, "t": 546.25537, "r": 473.94049000000007, "b": 555.16193, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 184, "text": "TEDS", "bbox": {"l": 449.03400000000005, "t": 546.25537, "r": 473.94049000000007, "b": 555.16193, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 408.50598, "t": 558.21037, "r": 436.73999, "b": 567.11693, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 185, "text": "Simple", "bbox": {"l": 408.50598, "t": 558.21037, "r": 436.73999, "b": 567.11693, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 448.6951, "t": 558.21037, "r": 485.07849, "b": 567.11693, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 186, "text": "Complex", "bbox": {"l": 448.6951, "t": 558.21037, "r": 485.07849, "b": 567.11693, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 499.3848, "t": 558.21037, "r": 512.117, "b": 567.11693, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 187, "text": "All", "bbox": {"l": 499.3848, "t": 558.21037, "r": 512.117, "b": 567.11693, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 357.68201, "t": 575.16736, "r": 384.3519, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 188, "text": "Tabula", "bbox": {"l": 357.68201, "t": 575.16736, "r": 384.3519, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 413.90097, "t": 575.16736, "r": 431.33550999999994, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 189, "text": "78.0", "bbox": {"l": 413.90097, "t": 575.16736, "r": 431.33550999999994, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 458.16479000000004, "t": 575.16736, "r": 475.59933000000007, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 190, "text": "57.8", "bbox": {"l": 458.16479000000004, "t": 575.16736, "r": 475.59933000000007, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 497.0289, "t": 575.16736, "r": 514.46344, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 191, "text": "67.9", "bbox": {"l": 497.0289, "t": 575.16736, "r": 514.46344, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 350.72299, "t": 587.12236, "r": 391.31064, "b": 596.02892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 192, "text": "Traprange", "bbox": {"l": 350.72299, "t": 587.12236, "r": 391.31064, "b": 596.02892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 413.90582, "t": 587.12236, "r": 431.34036, "b": 596.02892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 193, "text": "60.8", "bbox": {"l": 413.90582, "t": 587.12236, "r": 431.34036, "b": 596.02892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 458.16965, "t": 587.12236, "r": 475.60419, "b": 596.02892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 194, "text": "49.9", "bbox": {"l": 458.16965, "t": 587.12236, "r": 475.60419, "b": 596.02892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 497.03374999999994, "t": 587.12236, "r": 514.46832, "b": 596.02892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 195, "text": "55.4", "bbox": {"l": 497.03374999999994, "t": 587.12236, "r": 514.46832, "b": 596.02892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 354.13599, "t": 599.07835, "r": 387.89923, "b": 607.98491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 196, "text": "Camelot", "bbox": {"l": 354.13599, "t": 599.07835, "r": 387.89923, "b": 607.98491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 413.90161, "t": 599.07835, "r": 431.33615, "b": 607.98491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 197, "text": "80.0", "bbox": {"l": 413.90161, "t": 599.07835, "r": 431.33615, "b": 607.98491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 458.16544, "t": 599.07835, "r": 475.59998, "b": 607.98491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 198, "text": "66.0", "bbox": {"l": 458.16544, "t": 599.07835, "r": 475.59998, "b": 607.98491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 497.02954000000005, "t": 599.07835, "r": 514.46411, "b": 607.98491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 199, "text": "73.0", "bbox": {"l": 497.02954000000005, "t": 599.07835, "r": 514.46411, "b": 607.98491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 346.55899, "t": 611.03336, "r": 395.47534, "b": 619.93991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 200, "text": "Acrobat Pro", "bbox": {"l": 346.55899, "t": 611.03336, "r": 395.47534, "b": 619.93991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 413.90616, "t": 611.03336, "r": 431.34069999999997, "b": 619.93991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 201, "text": "68.9", "bbox": {"l": 413.90616, "t": 611.03336, "r": 431.34069999999997, "b": 619.93991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 458.16998000000007, "t": 611.03336, "r": 475.60452, "b": 619.93991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 202, "text": "61.8", "bbox": {"l": 458.16998000000007, "t": 611.03336, "r": 475.60452, "b": 619.93991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 497.03409, "t": 611.03336, "r": 514.46863, "b": 619.93991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 203, "text": "65.3", "bbox": {"l": 497.03409, "t": 611.03336, "r": 514.46863, "b": 619.93991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 360.78101, "t": 622.9883600000001, "r": 381.25415, "b": 631.89491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 204, "text": "EDD", "bbox": {"l": 360.78101, "t": 622.9883600000001, "r": 381.25415, "b": 631.89491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 413.90158, "t": 622.9883600000001, "r": 431.33612, "b": 631.89491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 205, "text": "91.2", "bbox": {"l": 413.90158, "t": 622.9883600000001, "r": 431.33612, "b": 631.89491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 458.16541, "t": 622.9883600000001, "r": 475.59995000000004, "b": 631.89491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 206, "text": "85.4", "bbox": {"l": 458.16541, "t": 622.9883600000001, "r": 475.59995000000004, "b": 631.89491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 497.0295100000001, "t": 622.9883600000001, "r": 514.46405, "b": 631.89491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 207, "text": "88.3", "bbox": {"l": 497.0295100000001, "t": 622.9883600000001, "r": 514.46405, "b": 631.89491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 114, "label": "text", "bbox": {"l": 345.483, "t": 634.94336, "r": 396.5513, "b": 643.84991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 208, "text": "TableFormer", "bbox": {"l": 345.483, "t": 634.94336, "r": 396.5513, "b": 643.84991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 115, "label": "text", "bbox": {"l": 413.90616, "t": 634.94336, "r": 431.34069999999997, "b": 643.84991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 209, "text": "95.4", "bbox": {"l": 413.90616, "t": 634.94336, "r": 431.34069999999997, "b": 643.84991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 116, "label": "text", "bbox": {"l": 458.16998000000007, "t": 634.94336, "r": 475.60452, "b": 643.84991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 210, "text": "90.1", "bbox": {"l": 458.16998000000007, "t": 634.94336, "r": 475.60452, "b": 643.84991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 117, "label": "text", "bbox": {"l": 497.03400000000005, "t": 634.82381, "r": 514.46857, "b": 643.78018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 211, "text": "93.6", "bbox": {"l": 497.03400000000005, "t": 634.82381, "r": 514.46857, "b": 643.78018, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["fcel", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "nl"], "num_rows": 7, "num_cols": 4, "table_cells": [{"bbox": {"l": 358.01099, "t": 552.23337, "r": 384.02335, "b": 561.1399200000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Model", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 448.6951, "t": 546.25537, "r": 485.07849, "b": 567.11693, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "TEDS Complex", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 408.50598, "t": 558.21037, "r": 436.73999, "b": 567.11693, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Simple", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 499.3848, "t": 558.21037, "r": 512.117, "b": 567.11693, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "All", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 357.68201, "t": 575.16736, "r": 384.3519, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Tabula", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 413.90097, "t": 575.16736, "r": 431.33550999999994, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "78.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 458.16479000000004, "t": 575.16736, "r": 475.59933000000007, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "57.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 497.0289, "t": 575.16736, "r": 514.46344, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "67.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 350.72299, "t": 587.12236, "r": 391.31064, "b": 596.02892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Traprange", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 413.90582, "t": 587.12236, "r": 431.34036, "b": 596.02892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "60.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 458.16965, "t": 587.12236, "r": 475.60419, "b": 596.02892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "49.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 497.03374999999994, "t": 587.12236, "r": 514.46832, "b": 596.02892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "55.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 354.13599, "t": 599.07835, "r": 387.89923, "b": 607.98491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Camelot", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 413.90161, "t": 599.07835, "r": 431.33615, "b": 607.98491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "80.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 458.16544, "t": 599.07835, "r": 475.59998, "b": 607.98491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "66.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 497.02954000000005, "t": 599.07835, "r": 514.46411, "b": 607.98491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "73.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 346.55899, "t": 611.03336, "r": 395.47534, "b": 619.93991, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Acrobat Pro", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 413.90616, "t": 611.03336, "r": 431.34069999999997, "b": 619.93991, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "68.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 458.16998000000007, "t": 611.03336, "r": 475.60452, "b": 619.93991, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "61.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 497.03409, "t": 611.03336, "r": 514.46863, "b": 619.93991, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "65.3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 360.78101, "t": 622.9883600000001, "r": 381.25415, "b": 631.89491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "EDD", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 413.90158, "t": 622.9883600000001, "r": 431.33612, "b": 631.89491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "91.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 458.16541, "t": 622.9883600000001, "r": 475.59995000000004, "b": 631.89491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "85.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 497.0295100000001, "t": 622.9883600000001, "r": 514.46405, "b": 631.89491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "88.3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 345.483, "t": 634.94336, "r": 396.5513, "b": 643.84991, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 413.90616, "t": 634.94336, "r": 431.34069999999997, "b": 643.84991, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "95.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 458.16998000000007, "t": 634.94336, "r": 475.60452, "b": 643.84991, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "90.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 497.03400000000005, "t": 634.82381, "r": 514.46857, "b": 643.78018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "93.6", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "caption", "id": 11, "page_no": 6, "cluster": {"id": 11, "label": "caption", "bbox": {"l": 308.862, "t": 656.86136, "r": 545.11517, "b": 689.6779300000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9541401863098145, "cells": [{"id": 212, "text": "Table 4:", "bbox": {"l": 308.862, "t": 656.86136, "r": 341.73862, "b": 665.76792, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "Results of structure with content retrieved using", "bbox": {"l": 349.55927, "t": 656.86136, "r": 545.11517, "b": 665.76792, "coord_origin": "TOPLEFT"}}, {"id": 214, "text": "cell detection on PubTabNet. In all cases the input is PDF", "bbox": {"l": 308.862, "t": 668.81636, "r": 545.11505, "b": 677.7229199999999, "coord_origin": "TOPLEFT"}}, {"id": 215, "text": "documents with cropped tables.", "bbox": {"l": 308.862, "t": 680.77136, "r": 435.03836, "b": 689.6779300000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 4: Results of structure with content retrieved using cell detection on PubTabNet. In all cases the input is PDF documents with cropped tables."}], "headers": [{"label": "page_footer", "id": 14, "page_no": 6, "cluster": {"id": 14, "label": "page_footer", "bbox": {"l": 295.121, "t": 734.133358, "r": 300.10229, "b": 743.039921, "coord_origin": "TOPLEFT"}, "confidence": 0.8787970542907715, "cells": [{"id": 216, "text": "7", "bbox": {"l": 295.121, "t": 734.133358, "r": 300.10229, "b": 743.039921, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "7"}]}}, {"page_no": 7, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "b.", "bbox": {"l": 53.811783000000005, "t": 208.23328000000004, "r": 62.219952, "b": 216.10645, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Structure predicted by TableFormer, with superimposed matched PDF cell text:", "bbox": {"l": 66.424026, "t": 208.23328000000004, "r": 385.93451, "b": 216.10645, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Japanese language (previously unseen by TableFormer):", "bbox": {"l": 53.811783000000005, "t": 94.28112999999996, "r": 284.34592, "b": 102.15430000000003, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Example table from FinTabNet:", "bbox": {"l": 304.83081, "t": 94.28112999999996, "r": 431.09119, "b": 102.15430000000003, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "a.", "bbox": {"l": 53.286037, "t": 78.68756000000008, "r": 61.550289, "b": 86.56073000000004, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Red - PDF cells, Green - predicted bounding boxes, Blue - post-processed predictions matched to PDF cells", "bbox": {"l": 65.682419, "t": 78.68756000000008, "r": 499.55563, "b": 86.56073000000004, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "\u8ad6\u6587\u30d5\u30a1\u30a4\u30eb", "bbox": {"l": 209.93285, "t": 222.18073000000004, "r": 241.04458999999997, "b": 226.36212, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "\u53c2\u8003\u6587\u732e", "bbox": {"l": 263.76489, "t": 222.18073000000004, "r": 284.50589, "b": 226.36212, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "\u51fa\u5178", "bbox": {"l": 110.24990999999999, "t": 229.66594999999995, "r": 120.62018, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "\u30d5\u30a1\u30a4\u30eb", "bbox": {"l": 175.36609, "t": 229.66594999999995, "r": 196.1071, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "\u6570", "bbox": {"l": 196.10756, "t": 229.66594999999995, "r": 201.29247, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "\u82f1\u8a9e", "bbox": {"l": 209.62408, "t": 229.66594999999995, "r": 219.99435, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "\u65e5\u672c\u8a9e", "bbox": {"l": 229.19814, "t": 229.66594999999995, "r": 244.75377, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "\u82f1\u8a9e", "bbox": {"l": 256.1142, "t": 229.66594999999995, "r": 266.48447, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "\u65e5\u672c\u8a9e", "bbox": {"l": 278.38434, "t": 229.66594999999995, "r": 293.93997, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Association for Computational Linguistics(ACL2003)", "bbox": {"l": 55.53052099999999, "t": 236.42584, "r": 162.7131, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "65", "bbox": {"l": 184.39731, "t": 236.42584, "r": 189.56456, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "65", "bbox": {"l": 208.99026, "t": 236.42584, "r": 214.15752, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "0", "bbox": {"l": 234.87517, "t": 236.42584, "r": 237.45833000000002, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "150", "bbox": {"l": 256.88446, "t": 236.42584, "r": 264.6358, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "0", "bbox": {"l": 284.06134, "t": 236.42584, "r": 286.6445, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Computational Linguistics(COLING2002)", "bbox": {"l": 55.53052099999999, "t": 242.62048000000004, "r": 139.72253, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "140", "bbox": {"l": 183.10536, "t": 242.62048000000004, "r": 190.8567, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "140", "bbox": {"l": 207.69832, "t": 242.62048000000004, "r": 215.44965999999997, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "0", "bbox": {"l": 234.87517, "t": 242.62048000000004, "r": 237.45833000000002, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "150", "bbox": {"l": 256.88446, "t": 242.62048000000004, "r": 264.6358, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "0", "bbox": {"l": 284.06134, "t": 242.62048000000004, "r": 286.6445, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "\u96fb\u6c17\u60c5\u5831\u901a\u4fe1\u5b66\u4f1a", "bbox": {"l": 55.53052099999999, "t": 249.79845999999998, "r": 97.013, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "2003", "bbox": {"l": 92.698288, "t": 249.58942000000002, "r": 103.03371, "b": 253.94732999999997, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "\u5e74\u7dcf\u5408\u5927\u4f1a", "bbox": {"l": 103.03389, "t": 249.79845999999998, "r": 128.96027, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "150", "bbox": {"l": 183.10536, "t": 248.81506000000002, "r": 190.8567, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "8", "bbox": {"l": 210.28223, "t": 248.81506000000002, "r": 212.86539, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "142", "bbox": {"l": 232.29153, "t": 248.81506000000002, "r": 240.04287999999997, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "223", "bbox": {"l": 256.88446, "t": 248.81506000000002, "r": 264.6358, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "147", "bbox": {"l": 281.47742, "t": 248.81506000000002, "r": 289.22876, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "\u60c5\u5831\u51e6\u7406\u5b66\u4f1a\u7b2c", "bbox": {"l": 55.53052099999999, "t": 257.28369, "r": 91.827637, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "65", "bbox": {"l": 88.052673, "t": 257.07465, "r": 93.219925, "b": 261.43255999999997, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "\u56de\u5168\u56fd\u5927\u4f1a", "bbox": {"l": 93.220474, "t": 257.28369, "r": 119.14685, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "(2003)", "bbox": {"l": 116.45073999999998, "t": 257.07465, "r": 129.88177, "b": 261.43255999999997, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "177", "bbox": {"l": 183.10536, "t": 256.30029, "r": 190.8567, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "1", "bbox": {"l": 210.28223, "t": 256.30029, "r": 212.86539, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "176", "bbox": {"l": 232.29153, "t": 256.30029, "r": 240.04287999999997, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "150", "bbox": {"l": 256.88446, "t": 256.30029, "r": 264.6358, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "236", "bbox": {"l": 281.47742, "t": 256.30029, "r": 289.22876, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "\u7b2c", "bbox": {"l": 55.53052099999999, "t": 264.5108, "r": 60.715424, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "17", "bbox": {"l": 60.17654799999999, "t": 264.30175999999994, "r": 65.343796, "b": 268.65967, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "\u56de\u4eba\u5de5\u77e5\u80fd\u5b66\u4f1a\u5168\u56fd\u5927\u4f1a", "bbox": {"l": 65.344376, "t": 264.5108, "r": 122.38297000000001, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "(2003)", "bbox": {"l": 116.45073999999998, "t": 264.30175999999994, "r": 129.88177, "b": 268.65967, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "208", "bbox": {"l": 183.10536, "t": 263.52739999999994, "r": 190.8567, "b": 267.88531, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "5", "bbox": {"l": 210.28223, "t": 263.52739999999994, "r": 212.86539, "b": 267.88531, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "203", "bbox": {"l": 232.29153, "t": 263.52739999999994, "r": 240.04287999999997, "b": 267.88531, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "152", "bbox": {"l": 256.88446, "t": 263.52739999999994, "r": 264.6358, "b": 267.88531, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "244", "bbox": {"l": 281.47742, "t": 263.52739999999994, "r": 289.22876, "b": 267.88531, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "\u81ea\u7136\u8a00\u8a9e\u51e6\u7406\u7814\u7a76\u4f1a\u7b2c", "bbox": {"l": 55.53052099999999, "t": 271.73785, "r": 107.38374, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "146", "bbox": {"l": 101.99034, "t": 271.52881, "r": 109.74168000000002, "b": 275.88671999999997, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "\u301c", "bbox": {"l": 109.74204, "t": 271.73785, "r": 114.92695000000002, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "155", "bbox": {"l": 114.38793, "t": 271.52881, "r": 122.13927, "b": 275.88671999999997, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "\u56de", "bbox": {"l": 122.13963, "t": 271.73785, "r": 127.32454000000001, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "98", "bbox": {"l": 184.39731, "t": 270.75446, "r": 189.56456, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "2", "bbox": {"l": 210.28223, "t": 270.75446, "r": 212.86539, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "96", "bbox": {"l": 233.58348, "t": 270.75446, "r": 238.75072999999998, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "150", "bbox": {"l": 256.88446, "t": 270.75446, "r": 264.6358, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "232", "bbox": {"l": 281.47742, "t": 270.75446, "r": 289.22876, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "WWW", "bbox": {"l": 55.53052099999999, "t": 279.01392, "r": 68.68605, "b": 283.37183, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "\u304b\u3089\u53ce\u96c6\u3057\u305f\u8ad6\u6587", "bbox": {"l": 68.685814, "t": 279.22295999999994, "r": 110.16829999999999, "b": 283.40436, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "107", "bbox": {"l": 183.10536, "t": 277.98157000000003, "r": 190.8567, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "73", "bbox": {"l": 208.99026, "t": 277.98157000000003, "r": 214.15752, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "34", "bbox": {"l": 233.58348, "t": 277.98157000000003, "r": 238.75072999999998, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "147", "bbox": {"l": 256.88446, "t": 277.98157000000003, "r": 264.6358, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "96", "bbox": {"l": 282.76938, "t": 277.98157000000003, "r": 287.93661, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "\u8a08", "bbox": {"l": 169.61508, "t": 286.45004, "r": 174.79999, "b": 290.63141, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "945", "bbox": {"l": 183.10536, "t": 285.46667, "r": 190.8567, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "294", "bbox": {"l": 207.69832, "t": 285.46667, "r": 215.44965999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "651", "bbox": {"l": 232.29153, "t": 285.46667, "r": 240.04287999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "1122", "bbox": {"l": 255.76506, "t": 285.46667, "r": 265.75204, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "955", "bbox": {"l": 281.47742, "t": 285.46667, "r": 289.22876, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "Text is aligned to match original for ease of viewing", "bbox": {"l": 380.42731, "t": 292.30426, "r": 549.42175, "b": 298.60284, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "Weighted Average Grant Date Fair", "bbox": {"l": 459.04861, "t": 221.62415, "r": 542.00018, "b": 226.68933000000004, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "Value", "bbox": {"l": 493.82193, "t": 227.83416999999997, "r": 507.2258, "b": 232.89935000000003, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "RS", "bbox": {"l": 393.2442, "t": 236.74712999999997, "r": 400.74588, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "U", "bbox": {"l": 400.74643, "t": 236.74712999999997, "r": 404.64523, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "s", "bbox": {"l": 404.6463, "t": 236.74712999999997, "r": 407.34631, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "Shares (in millions)", "bbox": {"l": 392.09671, "t": 221.57446000000004, "r": 438.0145, "b": 226.63964999999996, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "PSUs", "bbox": {"l": 427.18323, "t": 236.74712999999997, "r": 440.98778999999996, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "RSUs", "bbox": {"l": 468.38254, "t": 236.74712999999997, "r": 482.48465000000004, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "PSUs", "bbox": {"l": 516.92578, "t": 236.74712999999997, "r": 530.73035, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Nonvested on Janua", "bbox": {"l": 306.11493, "t": 244.61084000000005, "r": 355.6532, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "ry 1", "bbox": {"l": 355.65427, "t": 244.61084000000005, "r": 364.65607, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "1.", "bbox": {"l": 396.24661, "t": 244.91327, "r": 400.75238, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "1", "bbox": {"l": 400.7529, "t": 244.91327, "r": 403.75531, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "0.3", "bbox": {"l": 429.81838999999997, "t": 244.91327, "r": 437.32708999999994, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "90.10", "bbox": {"l": 465.52859, "t": 244.91327, "r": 478.40103, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "$", "bbox": {"l": 480.97552, "t": 244.91327, "r": 483.55001999999996, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "$ 91.19", "bbox": {"l": 513.44824, "t": 244.91327, "r": 531.46967, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "Granted", "bbox": {"l": 306.11493, "t": 253.68451000000005, "r": 325.62674, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "0.", "bbox": {"l": 396.24661, "t": 253.68451000000005, "r": 400.75238, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "5", "bbox": {"l": 400.7529, "t": 253.68451000000005, "r": 403.75531, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "0.1", "bbox": {"l": 429.81838999999997, "t": 253.68451000000005, "r": 437.32708999999994, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "117.44", "bbox": {"l": 466.43579000000005, "t": 253.68451000000005, "r": 482.54831, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "122.41", "bbox": {"l": 514.29065, "t": 253.68451000000005, "r": 530.80981, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "Vested", "bbox": {"l": 306.11493, "t": 261.54822, "r": 322.62866, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "(0.", "bbox": {"l": 394.43222, "t": 261.54822, "r": 400.73563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "5", "bbox": {"l": 400.73456, "t": 261.54822, "r": 403.73697, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": ")", "bbox": {"l": 403.73804, "t": 261.54822, "r": 405.53625, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "(0.1)", "bbox": {"l": 427.7016, "t": 261.54822, "r": 438.80563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "87.08", "bbox": {"l": 468.55533, "t": 261.54822, "r": 482.07043, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "81.14", "bbox": {"l": 516.01862, "t": 261.54822, "r": 529.53375, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "Canceled or forfeited", "bbox": {"l": 306.11493, "t": 269.64148, "r": 356.24771, "b": 274.70667000000003, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "(0.", "bbox": {"l": 394.43222, "t": 270.31946000000005, "r": 400.73563, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "1", "bbox": {"l": 400.73456, "t": 270.31946000000005, "r": 403.73697, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": ")", "bbox": {"l": 403.73804, "t": 270.31946000000005, "r": 405.53625, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "-", "bbox": {"l": 431.02802, "t": 270.31946000000005, "r": 436.4280099999999, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "102.01", "bbox": {"l": 465.83099000000004, "t": 270.31946000000005, "r": 482.35013, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "92.18", "bbox": {"l": 516.01862, "t": 270.31946000000005, "r": 529.53375, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "Nonvested on December 31", "bbox": {"l": 306.11493, "t": 278.48572, "r": 373.35764, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "1.0", "bbox": {"l": 396.24661, "t": 278.48572, "r": 403.75531, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "0.3", "bbox": {"l": 429.51599, "t": 278.48572, "r": 437.02469, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "104.85 $", "bbox": {"l": 463.7142, "t": 278.48572, "r": 484.73965000000004, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "$ 104.51", "bbox": {"l": 512.99463, "t": 278.48572, "r": 534.02008, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "Figure 5:", "bbox": {"l": 50.112, "t": 320.87735, "r": 86.864021, "b": 329.78391, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "One of the benefits of TableFormer is that it is language agnostic, as an example, the left part of the illustration", "bbox": {"l": 93.917542, "t": 320.87735, "r": 545.11371, "b": 329.78391, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "demonstrates TableFormer predictions on previously unseen language (Japanese). Additionally, we see that TableFormer is", "bbox": {"l": 50.112, "t": 332.83233999999993, "r": 545.11371, "b": 341.73889, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "robust to variability in style and content, right side of the illustration shows the example of the TableFormer prediction from", "bbox": {"l": 50.112, "t": 344.78732, "r": 545.11377, "b": 353.69388, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "the FinTabNet dataset.", "bbox": {"l": 50.112, "t": 356.74332, "r": 139.79532, "b": 365.64987, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "Red - PDF cells, Green - predicted bounding boxes", "bbox": {"l": 220.26282, "t": 381.77722, "r": 342.07819, "b": 386.44281, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "Ground Truth", "bbox": {"l": 53.715248, "t": 381.77722, "r": 85.657333, "b": 386.44281, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "16", "bbox": {"l": 437.37939, "t": 400.55295, "r": 443.69870000000003, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "17", "bbox": {"l": 450.33203, "t": 400.55295, "r": 456.6513100000001, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "18", "bbox": {"l": 463.28464, "t": 400.55295, "r": 469.60394, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "19", "bbox": {"l": 476.23724000000004, "t": 400.55295, "r": 482.5565500000001, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "20", "bbox": {"l": 489.18988, "t": 400.55295, "r": 495.50916, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "21", "bbox": {"l": 502.14251999999993, "t": 400.55295, "r": 508.46178999999995, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "22", "bbox": {"l": 515.09509, "t": 400.55295, "r": 521.41443, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "23", "bbox": {"l": 385.2814, "t": 411.03836000000007, "r": 391.60071, "b": 417.35699, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "24", "bbox": {"l": 398.52341, "t": 411.03836000000007, "r": 404.84271, "b": 417.35699, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "25", "bbox": {"l": 411.47604, "t": 411.03836000000007, "r": 417.79535, "b": 417.35699, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "26", "bbox": {"l": 437.37939, "t": 411.03836000000007, "r": 443.69870000000003, "b": 417.35699, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "27", "bbox": {"l": 450.33203, "t": 411.03836000000007, "r": 456.6513100000001, "b": 417.35699, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "28", "bbox": {"l": 463.28464, "t": 411.03836000000007, "r": 469.60394, "b": 417.35699, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "30", "bbox": {"l": 385.2814, "t": 421.0697, "r": 391.60071, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "31", "bbox": {"l": 398.52341, "t": 421.0697, "r": 404.84271, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "32", "bbox": {"l": 411.47604, "t": 421.0697, "r": 417.79532, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "33", "bbox": {"l": 424.42865, "t": 421.0697, "r": 430.74796, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "34", "bbox": {"l": 437.38129, "t": 421.0697, "r": 443.70056, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "35", "bbox": {"l": 450.33389000000005, "t": 421.0697, "r": 456.65319999999997, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "36", "bbox": {"l": 463.2865, "t": 421.0697, "r": 469.6058, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "37", "bbox": {"l": 476.23914, "t": 421.0697, "r": 482.55841, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "38", "bbox": {"l": 489.1917700000001, "t": 421.0697, "r": 495.51105, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "39", "bbox": {"l": 502.14438, "t": 421.0697, "r": 508.46368, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "40", "bbox": {"l": 515.09705, "t": 421.0697, "r": 521.41632, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "41", "bbox": {"l": 528.04962, "t": 421.0697, "r": 534.3689, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "42", "bbox": {"l": 385.2814, "t": 432.04431, "r": 391.60071, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "43", "bbox": {"l": 398.52341, "t": 432.04431, "r": 404.84271, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "44", "bbox": {"l": 411.47604, "t": 432.04431, "r": 417.79532, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "45", "bbox": {"l": 424.42865, "t": 432.04431, "r": 430.74796, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "46", "bbox": {"l": 437.38129, "t": 432.04431, "r": 443.70056, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "47", "bbox": {"l": 450.33389000000005, "t": 432.04431, "r": 456.65319999999997, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "48", "bbox": {"l": 463.2865, "t": 432.04431, "r": 469.6058, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "49", "bbox": {"l": 476.23914, "t": 432.04431, "r": 482.55841, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "50", "bbox": {"l": 489.1917700000001, "t": 432.04431, "r": 495.51105, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "51", "bbox": {"l": 502.14438, "t": 432.04431, "r": 508.46368, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "52", "bbox": {"l": 515.09705, "t": 432.04431, "r": 521.41632, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "53", "bbox": {"l": 528.04962, "t": 432.04431, "r": 534.3689, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "0", "bbox": {"l": 385.2814, "t": 389.20004, "r": 388.44073, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "1", "bbox": {"l": 398.52341, "t": 389.20004, "r": 401.68274, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "2", "bbox": {"l": 411.4754, "t": 389.20004, "r": 414.63474, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "3", "bbox": {"l": 424.4274, "t": 389.20004, "r": 427.58673, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "4", "bbox": {"l": 437.37939, "t": 389.20004, "r": 440.53870000000006, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "5", "bbox": {"l": 450.33136, "t": 389.20004, "r": 453.49069000000003, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "6", "bbox": {"l": 463.28336, "t": 389.20004, "r": 466.44269, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "7", "bbox": {"l": 476.23535, "t": 389.20004, "r": 479.39468, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "8", "bbox": {"l": 489.18735, "t": 389.20004, "r": 492.34668, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "9", "bbox": {"l": 502.13933999999995, "t": 389.20004, "r": 505.29868000000005, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "10", "bbox": {"l": 515.09131, "t": 389.20004, "r": 521.41064, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "11", "bbox": {"l": 528.04364, "t": 389.20004, "r": 534.13104, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "12", "bbox": {"l": 385.2814, "t": 398.97464, "r": 391.60071, "b": 405.29327, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "13", "bbox": {"l": 398.52341, "t": 398.97464, "r": 404.84271, "b": 405.29327, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "14", "bbox": {"l": 411.47604, "t": 398.97464, "r": 417.79535, "b": 405.29327, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "15", "bbox": {"l": 424.42719, "t": 406.77463000000006, "r": 430.74648999999994, "b": 413.09326, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "29", "bbox": {"l": 502.86941999999993, "t": 410.99438, "r": 509.18871999999993, "b": 417.31302, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "Predicted Structure", "bbox": {"l": 384.35437, "t": 381.77722, "r": 430.99261, "b": 386.44281, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "Figure 6: An example of TableFormer predictions (bounding boxes and structure) from generated SynthTabNet table.", "bbox": {"l": 62.595001, "t": 458.72836, "r": 532.63049, "b": 467.63492, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "5.5.", "bbox": {"l": 50.112, "t": 491.39536, "r": 64.448898, "b": 501.24741, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "Qualitative Analysis", "bbox": {"l": 74.006828, "t": 491.39536, "r": 163.7558, "b": 501.24741, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "We showcase several visualizations for the different", "bbox": {"l": 62.067001, "t": 536.87337, "r": 286.36499, "b": 545.77992, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": "components of our network on various", "bbox": {"l": 50.112, "t": 548.82837, "r": 211.15741, "b": 557.73492, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "\u201ccomplex\u201d", "bbox": {"l": 215.10000999999997, "t": 548.91803, "r": 259.17453, "b": 557.50578, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "tables", "bbox": {"l": 263.12, "t": 548.82837, "r": 286.36273, "b": 557.73492, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": "within datasets presented in this work in Fig. 5 and Fig. 6", "bbox": {"l": 50.112, "t": 560.78337, "r": 286.36505, "b": 569.68993, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "As it is shown, our model is able to predict bounding boxes", "bbox": {"l": 50.112, "t": 572.73837, "r": 286.36508, "b": 581.6449299999999, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "for all table cells, even for the empty ones. Additionally,", "bbox": {"l": 50.112, "t": 584.69337, "r": 286.36508, "b": 593.59993, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "our post-processing techniques can extract the cell content", "bbox": {"l": 50.112, "t": 596.64937, "r": 286.36505, "b": 605.55592, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": "by matching the predicted bounding boxes to the PDF cells", "bbox": {"l": 50.112, "t": 608.60437, "r": 286.36508, "b": 617.51093, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "based on their overlap and spatial proximity. The left part", "bbox": {"l": 50.112, "t": 620.55937, "r": 286.36508, "b": 629.46593, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "of Fig. 5 demonstrates also the adaptability of our method", "bbox": {"l": 50.112, "t": 632.51437, "r": 286.36508, "b": 641.42093, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "to any language, as it can successfully extract Japanese", "bbox": {"l": 50.112, "t": 644.46938, "r": 286.36508, "b": 653.37593, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "text, although the training set contains only English content.", "bbox": {"l": 50.112, "t": 656.42438, "r": 286.36511, "b": 665.33094, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "We provide more visualizations including the intermediate", "bbox": {"l": 50.112, "t": 668.38037, "r": 286.36508, "b": 677.28694, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "steps in the supplementary material. Overall these illustra-", "bbox": {"l": 50.112, "t": 680.33537, "r": 286.36511, "b": 689.24194, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "tions justify the versatility of our method across a diverse", "bbox": {"l": 50.112, "t": 692.290375, "r": 286.36511, "b": 701.196945, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "range of table appearances and content type.", "bbox": {"l": 50.112, "t": 704.245377, "r": 226.88833999999997, "b": 713.1519470000001, "coord_origin": "TOPLEFT"}}, {"id": 201, "text": "6.", "bbox": {"l": 308.862, "t": 490.70892, "r": 316.07382, "b": 501.45663, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": "Future Work & Conclusion", "bbox": {"l": 325.68954, "t": 490.70892, "r": 460.84848, "b": 501.45663, "coord_origin": "TOPLEFT"}}, {"id": 203, "text": "In this paper, we presented TableFormer an end-to-end", "bbox": {"l": 320.81699, "t": 512.89337, "r": 545.11505, "b": 521.79993, "coord_origin": "TOPLEFT"}}, {"id": 204, "text": "transformer based approach to predict table structures and", "bbox": {"l": 308.862, "t": 524.84836, "r": 545.11517, "b": 533.75491, "coord_origin": "TOPLEFT"}}, {"id": 205, "text": "bounding boxes of cells from an image. This approach en-", "bbox": {"l": 308.862, "t": 536.80336, "r": 545.11511, "b": 545.70992, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": "ables us to recreate the table structure, and extract the cell", "bbox": {"l": 308.862, "t": 548.75836, "r": 545.11505, "b": 557.6649199999999, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": "content from PDF or OCR by using bounding boxes. Ad-", "bbox": {"l": 308.862, "t": 560.71336, "r": 545.11517, "b": 569.61992, "coord_origin": "TOPLEFT"}}, {"id": 208, "text": "ditionally, it provides the versatility required in real-world", "bbox": {"l": 308.862, "t": 572.66837, "r": 545.11511, "b": 581.57492, "coord_origin": "TOPLEFT"}}, {"id": 209, "text": "scenarios when dealing with various types of PDF docu-", "bbox": {"l": 308.862, "t": 584.62436, "r": 545.11511, "b": 593.53091, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": "ments, and languages.", "bbox": {"l": 308.862, "t": 596.57936, "r": 400.46808, "b": 605.48592, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "Furthermore, our method outper-", "bbox": {"l": 408.37839, "t": 596.57936, "r": 545.11511, "b": 605.48592, "coord_origin": "TOPLEFT"}}, {"id": 212, "text": "forms all state-of-the-arts with a wide margin. Finally, we", "bbox": {"l": 308.862, "t": 608.53436, "r": 545.11505, "b": 617.44092, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "introduce \u201cSynthTabNet\u201d a challenging synthetically gen-", "bbox": {"l": 308.862, "t": 620.48936, "r": 545.11511, "b": 629.3959199999999, "coord_origin": "TOPLEFT"}}, {"id": 214, "text": "erated dataset that reinforces missing characteristics from", "bbox": {"l": 308.862, "t": 632.4443699999999, "r": 545.11505, "b": 641.35092, "coord_origin": "TOPLEFT"}}, {"id": 215, "text": "other datasets.", "bbox": {"l": 308.862, "t": 644.39937, "r": 365.85803, "b": 653.30592, "coord_origin": "TOPLEFT"}}, {"id": 216, "text": "References", "bbox": {"l": 308.862, "t": 672.09892, "r": 364.40585, "b": 682.84664, "coord_origin": "TOPLEFT"}}, {"id": 217, "text": "[1]", "bbox": {"l": 313.345, "t": 693.9617920000001, "r": 323.80792, "b": 701.977753, "coord_origin": "TOPLEFT"}}, {"id": 218, "text": "Nicolas Carion, Francisco Massa, Gabriel Synnaeve, Nicolas", "bbox": {"l": 326.05127, "t": 693.9617920000001, "r": 545.10852, "b": 701.977753, "coord_origin": "TOPLEFT"}}, {"id": 219, "text": "Usunier, Alexander Kirillov, and Sergey Zagoruyko. End-to-", "bbox": {"l": 328.78101, "t": 704.920792, "r": 545.1134, "b": 712.936752, "coord_origin": "TOPLEFT"}}, {"id": 220, "text": "8", "bbox": {"l": 295.121, "t": 734.133366, "r": 300.10229, "b": 743.039928, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 18, "label": "caption", "bbox": {"l": 53.811783000000005, "t": 208.23328000000004, "r": 385.93451, "b": 216.10645, "coord_origin": "TOPLEFT"}, "confidence": 0.5986502170562744, "cells": [{"id": 0, "text": "b.", "bbox": {"l": 53.811783000000005, "t": 208.23328000000004, "r": 62.219952, "b": 216.10645, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Structure predicted by TableFormer, with superimposed matched PDF cell text:", "bbox": {"l": 66.424026, "t": 208.23328000000004, "r": 385.93451, "b": 216.10645, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "section_header", "bbox": {"l": 53.811783000000005, "t": 94.28112999999996, "r": 284.34592, "b": 102.15430000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.46452993154525757, "cells": [{"id": 2, "text": "Japanese language (previously unseen by TableFormer):", "bbox": {"l": 53.811783000000005, "t": 94.28112999999996, "r": 284.34592, "b": 102.15430000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "section_header", "bbox": {"l": 304.83081, "t": 94.28112999999996, "r": 431.09119, "b": 102.15430000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.46292340755462646, "cells": [{"id": 3, "text": "Example table from FinTabNet:", "bbox": {"l": 304.83081, "t": 94.28112999999996, "r": 431.09119, "b": 102.15430000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "list_item", "bbox": {"l": 53.286037, "t": 78.68756000000008, "r": 61.550289, "b": 86.56073000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.5820133090019226, "cells": [{"id": 4, "text": "a.", "bbox": {"l": 53.286037, "t": 78.68756000000008, "r": 61.550289, "b": 86.56073000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "list_item", "bbox": {"l": 65.682419, "t": 78.68756000000008, "r": 499.55563, "b": 86.56073000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.5412113666534424, "cells": [{"id": 5, "text": "Red - PDF cells, Green - predicted bounding boxes, Blue - post-processed predictions matched to PDF cells", "bbox": {"l": 65.682419, "t": 78.68756000000008, "r": 499.55563, "b": 86.56073000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "table", "bbox": {"l": 53.6285514831543, "t": 218.94854736328125, "r": 298.5574645996094, "b": 292.3999938964844, "coord_origin": "TOPLEFT"}, "confidence": 0.8824008107185364, "cells": [{"id": 6, "text": "\u8ad6\u6587\u30d5\u30a1\u30a4\u30eb", "bbox": {"l": 209.93285, "t": 222.18073000000004, "r": 241.04458999999997, "b": 226.36212, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "\u53c2\u8003\u6587\u732e", "bbox": {"l": 263.76489, "t": 222.18073000000004, "r": 284.50589, "b": 226.36212, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "\u51fa\u5178", "bbox": {"l": 110.24990999999999, "t": 229.66594999999995, "r": 120.62018, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "\u30d5\u30a1\u30a4\u30eb", "bbox": {"l": 175.36609, "t": 229.66594999999995, "r": 196.1071, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "\u6570", "bbox": {"l": 196.10756, "t": 229.66594999999995, "r": 201.29247, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "\u82f1\u8a9e", "bbox": {"l": 209.62408, "t": 229.66594999999995, "r": 219.99435, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "\u65e5\u672c\u8a9e", "bbox": {"l": 229.19814, "t": 229.66594999999995, "r": 244.75377, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "\u82f1\u8a9e", "bbox": {"l": 256.1142, "t": 229.66594999999995, "r": 266.48447, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "\u65e5\u672c\u8a9e", "bbox": {"l": 278.38434, "t": 229.66594999999995, "r": 293.93997, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Association for Computational Linguistics(ACL2003)", "bbox": {"l": 55.53052099999999, "t": 236.42584, "r": 162.7131, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "65", "bbox": {"l": 184.39731, "t": 236.42584, "r": 189.56456, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "65", "bbox": {"l": 208.99026, "t": 236.42584, "r": 214.15752, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "0", "bbox": {"l": 234.87517, "t": 236.42584, "r": 237.45833000000002, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "150", "bbox": {"l": 256.88446, "t": 236.42584, "r": 264.6358, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "0", "bbox": {"l": 284.06134, "t": 236.42584, "r": 286.6445, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Computational Linguistics(COLING2002)", "bbox": {"l": 55.53052099999999, "t": 242.62048000000004, "r": 139.72253, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "140", "bbox": {"l": 183.10536, "t": 242.62048000000004, "r": 190.8567, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "140", "bbox": {"l": 207.69832, "t": 242.62048000000004, "r": 215.44965999999997, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "0", "bbox": {"l": 234.87517, "t": 242.62048000000004, "r": 237.45833000000002, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "150", "bbox": {"l": 256.88446, "t": 242.62048000000004, "r": 264.6358, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "0", "bbox": {"l": 284.06134, "t": 242.62048000000004, "r": 286.6445, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "\u96fb\u6c17\u60c5\u5831\u901a\u4fe1\u5b66\u4f1a", "bbox": {"l": 55.53052099999999, "t": 249.79845999999998, "r": 97.013, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "2003", "bbox": {"l": 92.698288, "t": 249.58942000000002, "r": 103.03371, "b": 253.94732999999997, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "\u5e74\u7dcf\u5408\u5927\u4f1a", "bbox": {"l": 103.03389, "t": 249.79845999999998, "r": 128.96027, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "150", "bbox": {"l": 183.10536, "t": 248.81506000000002, "r": 190.8567, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "8", "bbox": {"l": 210.28223, "t": 248.81506000000002, "r": 212.86539, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "142", "bbox": {"l": 232.29153, "t": 248.81506000000002, "r": 240.04287999999997, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "223", "bbox": {"l": 256.88446, "t": 248.81506000000002, "r": 264.6358, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "147", "bbox": {"l": 281.47742, "t": 248.81506000000002, "r": 289.22876, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "\u60c5\u5831\u51e6\u7406\u5b66\u4f1a\u7b2c", "bbox": {"l": 55.53052099999999, "t": 257.28369, "r": 91.827637, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "65", "bbox": {"l": 88.052673, "t": 257.07465, "r": 93.219925, "b": 261.43255999999997, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "\u56de\u5168\u56fd\u5927\u4f1a", "bbox": {"l": 93.220474, "t": 257.28369, "r": 119.14685, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "(2003)", "bbox": {"l": 116.45073999999998, "t": 257.07465, "r": 129.88177, "b": 261.43255999999997, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "177", "bbox": {"l": 183.10536, "t": 256.30029, "r": 190.8567, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "1", "bbox": {"l": 210.28223, "t": 256.30029, "r": 212.86539, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "176", "bbox": {"l": 232.29153, "t": 256.30029, "r": 240.04287999999997, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "150", "bbox": {"l": 256.88446, "t": 256.30029, "r": 264.6358, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "236", "bbox": {"l": 281.47742, "t": 256.30029, "r": 289.22876, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "\u7b2c", "bbox": {"l": 55.53052099999999, "t": 264.5108, "r": 60.715424, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "17", "bbox": {"l": 60.17654799999999, "t": 264.30175999999994, "r": 65.343796, "b": 268.65967, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "\u56de\u4eba\u5de5\u77e5\u80fd\u5b66\u4f1a\u5168\u56fd\u5927\u4f1a", "bbox": {"l": 65.344376, "t": 264.5108, "r": 122.38297000000001, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "(2003)", "bbox": {"l": 116.45073999999998, "t": 264.30175999999994, "r": 129.88177, "b": 268.65967, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "208", "bbox": {"l": 183.10536, "t": 263.52739999999994, "r": 190.8567, "b": 267.88531, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "5", "bbox": {"l": 210.28223, "t": 263.52739999999994, "r": 212.86539, "b": 267.88531, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "203", "bbox": {"l": 232.29153, "t": 263.52739999999994, "r": 240.04287999999997, "b": 267.88531, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "152", "bbox": {"l": 256.88446, "t": 263.52739999999994, "r": 264.6358, "b": 267.88531, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "244", "bbox": {"l": 281.47742, "t": 263.52739999999994, "r": 289.22876, "b": 267.88531, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "\u81ea\u7136\u8a00\u8a9e\u51e6\u7406\u7814\u7a76\u4f1a\u7b2c", "bbox": {"l": 55.53052099999999, "t": 271.73785, "r": 107.38374, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "146", "bbox": {"l": 101.99034, "t": 271.52881, "r": 109.74168000000002, "b": 275.88671999999997, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "\u301c", "bbox": {"l": 109.74204, "t": 271.73785, "r": 114.92695000000002, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "155", "bbox": {"l": 114.38793, "t": 271.52881, "r": 122.13927, "b": 275.88671999999997, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "\u56de", "bbox": {"l": 122.13963, "t": 271.73785, "r": 127.32454000000001, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "98", "bbox": {"l": 184.39731, "t": 270.75446, "r": 189.56456, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "2", "bbox": {"l": 210.28223, "t": 270.75446, "r": 212.86539, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "96", "bbox": {"l": 233.58348, "t": 270.75446, "r": 238.75072999999998, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "150", "bbox": {"l": 256.88446, "t": 270.75446, "r": 264.6358, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "232", "bbox": {"l": 281.47742, "t": 270.75446, "r": 289.22876, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "WWW", "bbox": {"l": 55.53052099999999, "t": 279.01392, "r": 68.68605, "b": 283.37183, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "\u304b\u3089\u53ce\u96c6\u3057\u305f\u8ad6\u6587", "bbox": {"l": 68.685814, "t": 279.22295999999994, "r": 110.16829999999999, "b": 283.40436, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "107", "bbox": {"l": 183.10536, "t": 277.98157000000003, "r": 190.8567, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "73", "bbox": {"l": 208.99026, "t": 277.98157000000003, "r": 214.15752, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "34", "bbox": {"l": 233.58348, "t": 277.98157000000003, "r": 238.75072999999998, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "147", "bbox": {"l": 256.88446, "t": 277.98157000000003, "r": 264.6358, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "96", "bbox": {"l": 282.76938, "t": 277.98157000000003, "r": 287.93661, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "\u8a08", "bbox": {"l": 169.61508, "t": 286.45004, "r": 174.79999, "b": 290.63141, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "945", "bbox": {"l": 183.10536, "t": 285.46667, "r": 190.8567, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "294", "bbox": {"l": 207.69832, "t": 285.46667, "r": 215.44965999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "651", "bbox": {"l": 232.29153, "t": 285.46667, "r": 240.04287999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "1122", "bbox": {"l": 255.76506, "t": 285.46667, "r": 265.75204, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "955", "bbox": {"l": 281.47742, "t": 285.46667, "r": 289.22876, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}], "children": [{"id": 32, "label": "text", "bbox": {"l": 209.93285, "t": 222.18073000000004, "r": 241.04458999999997, "b": 226.36212, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": "\u8ad6\u6587\u30d5\u30a1\u30a4\u30eb", "bbox": {"l": 209.93285, "t": 222.18073000000004, "r": 241.04458999999997, "b": 226.36212, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 263.76489, "t": 222.18073000000004, "r": 284.50589, "b": 226.36212, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "\u53c2\u8003\u6587\u732e", "bbox": {"l": 263.76489, "t": 222.18073000000004, "r": 284.50589, "b": 226.36212, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 110.24990999999999, "t": 229.66594999999995, "r": 120.62018, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "\u51fa\u5178", "bbox": {"l": 110.24990999999999, "t": 229.66594999999995, "r": 120.62018, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 175.36609, "t": 229.66594999999995, "r": 196.1071, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "\u30d5\u30a1\u30a4\u30eb", "bbox": {"l": 175.36609, "t": 229.66594999999995, "r": 196.1071, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 196.10756, "t": 229.66594999999995, "r": 201.29247, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "\u6570", "bbox": {"l": 196.10756, "t": 229.66594999999995, "r": 201.29247, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 209.62408, "t": 229.66594999999995, "r": 219.99435, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "\u82f1\u8a9e", "bbox": {"l": 209.62408, "t": 229.66594999999995, "r": 219.99435, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 229.19814, "t": 229.66594999999995, "r": 244.75377, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "\u65e5\u672c\u8a9e", "bbox": {"l": 229.19814, "t": 229.66594999999995, "r": 244.75377, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 256.1142, "t": 229.66594999999995, "r": 266.48447, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "\u82f1\u8a9e", "bbox": {"l": 256.1142, "t": 229.66594999999995, "r": 266.48447, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 278.38434, "t": 229.66594999999995, "r": 293.93997, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "\u65e5\u672c\u8a9e", "bbox": {"l": 278.38434, "t": 229.66594999999995, "r": 293.93997, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 55.53052099999999, "t": 236.42584, "r": 162.7131, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "Association for Computational Linguistics(ACL2003)", "bbox": {"l": 55.53052099999999, "t": 236.42584, "r": 162.7131, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 184.39731, "t": 236.42584, "r": 189.56456, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "65", "bbox": {"l": 184.39731, "t": 236.42584, "r": 189.56456, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 208.99026, "t": 236.42584, "r": 214.15752, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "65", "bbox": {"l": 208.99026, "t": 236.42584, "r": 214.15752, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 234.87517, "t": 236.42584, "r": 237.45833000000002, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "0", "bbox": {"l": 234.87517, "t": 236.42584, "r": 237.45833000000002, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 256.88446, "t": 236.42584, "r": 264.6358, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "150", "bbox": {"l": 256.88446, "t": 236.42584, "r": 264.6358, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 284.06134, "t": 236.42584, "r": 286.6445, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "0", "bbox": {"l": 284.06134, "t": 236.42584, "r": 286.6445, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 55.53052099999999, "t": 242.62048000000004, "r": 139.72253, "b": 246.97839, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "Computational Linguistics(COLING2002)", "bbox": {"l": 55.53052099999999, "t": 242.62048000000004, "r": 139.72253, "b": 246.97839, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 183.10536, "t": 242.62048000000004, "r": 190.8567, "b": 246.97839, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "140", "bbox": {"l": 183.10536, "t": 242.62048000000004, "r": 190.8567, "b": 246.97839, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 207.69832, "t": 242.62048000000004, "r": 215.44965999999997, "b": 246.97839, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "140", "bbox": {"l": 207.69832, "t": 242.62048000000004, "r": 215.44965999999997, "b": 246.97839, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 234.87517, "t": 242.62048000000004, "r": 237.45833000000002, "b": 246.97839, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "0", "bbox": {"l": 234.87517, "t": 242.62048000000004, "r": 237.45833000000002, "b": 246.97839, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 256.88446, "t": 242.62048000000004, "r": 264.6358, "b": 246.97839, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "150", "bbox": {"l": 256.88446, "t": 242.62048000000004, "r": 264.6358, "b": 246.97839, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 284.06134, "t": 242.62048000000004, "r": 286.6445, "b": 246.97839, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "0", "bbox": {"l": 284.06134, "t": 242.62048000000004, "r": 286.6445, "b": 246.97839, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 55.53052099999999, "t": 249.79845999999998, "r": 97.013, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "\u96fb\u6c17\u60c5\u5831\u901a\u4fe1\u5b66\u4f1a", "bbox": {"l": 55.53052099999999, "t": 249.79845999999998, "r": 97.013, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 92.698288, "t": 249.58942000000002, "r": 103.03371, "b": 253.94732999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "2003", "bbox": {"l": 92.698288, "t": 249.58942000000002, "r": 103.03371, "b": 253.94732999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 103.03389, "t": 249.79845999999998, "r": 128.96027, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "\u5e74\u7dcf\u5408\u5927\u4f1a", "bbox": {"l": 103.03389, "t": 249.79845999999998, "r": 128.96027, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 183.10536, "t": 248.81506000000002, "r": 190.8567, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "150", "bbox": {"l": 183.10536, "t": 248.81506000000002, "r": 190.8567, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 210.28223, "t": 248.81506000000002, "r": 212.86539, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "8", "bbox": {"l": 210.28223, "t": 248.81506000000002, "r": 212.86539, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 232.29153, "t": 248.81506000000002, "r": 240.04287999999997, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "142", "bbox": {"l": 232.29153, "t": 248.81506000000002, "r": 240.04287999999997, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 256.88446, "t": 248.81506000000002, "r": 264.6358, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "223", "bbox": {"l": 256.88446, "t": 248.81506000000002, "r": 264.6358, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 281.47742, "t": 248.81506000000002, "r": 289.22876, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "147", "bbox": {"l": 281.47742, "t": 248.81506000000002, "r": 289.22876, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 55.53052099999999, "t": 257.28369, "r": 91.827637, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "\u60c5\u5831\u51e6\u7406\u5b66\u4f1a\u7b2c", "bbox": {"l": 55.53052099999999, "t": 257.28369, "r": 91.827637, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 88.052673, "t": 257.07465, "r": 93.219925, "b": 261.43255999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "65", "bbox": {"l": 88.052673, "t": 257.07465, "r": 93.219925, "b": 261.43255999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 93.220474, "t": 257.28369, "r": 119.14685, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "\u56de\u5168\u56fd\u5927\u4f1a", "bbox": {"l": 93.220474, "t": 257.28369, "r": 119.14685, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 116.45073999999998, "t": 257.07465, "r": 129.88177, "b": 261.43255999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "(2003)", "bbox": {"l": 116.45073999999998, "t": 257.07465, "r": 129.88177, "b": 261.43255999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 183.10536, "t": 256.30029, "r": 190.8567, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "177", "bbox": {"l": 183.10536, "t": 256.30029, "r": 190.8567, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 210.28223, "t": 256.30029, "r": 212.86539, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "1", "bbox": {"l": 210.28223, "t": 256.30029, "r": 212.86539, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 232.29153, "t": 256.30029, "r": 240.04287999999997, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "176", "bbox": {"l": 232.29153, "t": 256.30029, "r": 240.04287999999997, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 256.88446, "t": 256.30029, "r": 264.6358, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "150", "bbox": {"l": 256.88446, "t": 256.30029, "r": 264.6358, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 281.47742, "t": 256.30029, "r": 289.22876, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "236", "bbox": {"l": 281.47742, "t": 256.30029, "r": 289.22876, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 55.53052099999999, "t": 264.5108, "r": 60.715424, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "\u7b2c", "bbox": {"l": 55.53052099999999, "t": 264.5108, "r": 60.715424, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 60.17654799999999, "t": 264.30175999999994, "r": 65.343796, "b": 268.65967, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "17", "bbox": {"l": 60.17654799999999, "t": 264.30175999999994, "r": 65.343796, "b": 268.65967, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 65.344376, "t": 264.5108, "r": 122.38297000000001, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "\u56de\u4eba\u5de5\u77e5\u80fd\u5b66\u4f1a\u5168\u56fd\u5927\u4f1a", "bbox": {"l": 65.344376, "t": 264.5108, "r": 122.38297000000001, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 116.45073999999998, "t": 264.30175999999994, "r": 129.88177, "b": 268.65967, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "(2003)", "bbox": {"l": 116.45073999999998, "t": 264.30175999999994, "r": 129.88177, "b": 268.65967, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 183.10536, "t": 263.52739999999994, "r": 190.8567, "b": 267.88531, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "208", "bbox": {"l": 183.10536, "t": 263.52739999999994, "r": 190.8567, "b": 267.88531, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 210.28223, "t": 263.52739999999994, "r": 212.86539, "b": 267.88531, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "5", "bbox": {"l": 210.28223, "t": 263.52739999999994, "r": 212.86539, "b": 267.88531, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 232.29153, "t": 263.52739999999994, "r": 240.04287999999997, "b": 267.88531, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "203", "bbox": {"l": 232.29153, "t": 263.52739999999994, "r": 240.04287999999997, "b": 267.88531, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 256.88446, "t": 263.52739999999994, "r": 264.6358, "b": 267.88531, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "152", "bbox": {"l": 256.88446, "t": 263.52739999999994, "r": 264.6358, "b": 267.88531, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 281.47742, "t": 263.52739999999994, "r": 289.22876, "b": 267.88531, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "244", "bbox": {"l": 281.47742, "t": 263.52739999999994, "r": 289.22876, "b": 267.88531, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 55.53052099999999, "t": 271.73785, "r": 107.38374, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "\u81ea\u7136\u8a00\u8a9e\u51e6\u7406\u7814\u7a76\u4f1a\u7b2c", "bbox": {"l": 55.53052099999999, "t": 271.73785, "r": 107.38374, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 101.99034, "t": 271.52881, "r": 109.74168000000002, "b": 275.88671999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "146", "bbox": {"l": 101.99034, "t": 271.52881, "r": 109.74168000000002, "b": 275.88671999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 109.74204, "t": 271.73785, "r": 114.92695000000002, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "\u301c", "bbox": {"l": 109.74204, "t": 271.73785, "r": 114.92695000000002, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 114.38793, "t": 271.52881, "r": 122.13927, "b": 275.88671999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "155", "bbox": {"l": 114.38793, "t": 271.52881, "r": 122.13927, "b": 275.88671999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 122.13963, "t": 271.73785, "r": 127.32454000000001, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "\u56de", "bbox": {"l": 122.13963, "t": 271.73785, "r": 127.32454000000001, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 184.39731, "t": 270.75446, "r": 189.56456, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "98", "bbox": {"l": 184.39731, "t": 270.75446, "r": 189.56456, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 210.28223, "t": 270.75446, "r": 212.86539, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "2", "bbox": {"l": 210.28223, "t": 270.75446, "r": 212.86539, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 233.58348, "t": 270.75446, "r": 238.75072999999998, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "96", "bbox": {"l": 233.58348, "t": 270.75446, "r": 238.75072999999998, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 256.88446, "t": 270.75446, "r": 264.6358, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "150", "bbox": {"l": 256.88446, "t": 270.75446, "r": 264.6358, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 281.47742, "t": 270.75446, "r": 289.22876, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "232", "bbox": {"l": 281.47742, "t": 270.75446, "r": 289.22876, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 55.53052099999999, "t": 279.01392, "r": 68.68605, "b": 283.37183, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "WWW", "bbox": {"l": 55.53052099999999, "t": 279.01392, "r": 68.68605, "b": 283.37183, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 68.685814, "t": 279.22295999999994, "r": 110.16829999999999, "b": 283.40436, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "\u304b\u3089\u53ce\u96c6\u3057\u305f\u8ad6\u6587", "bbox": {"l": 68.685814, "t": 279.22295999999994, "r": 110.16829999999999, "b": 283.40436, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 183.10536, "t": 277.98157000000003, "r": 190.8567, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "107", "bbox": {"l": 183.10536, "t": 277.98157000000003, "r": 190.8567, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 208.99026, "t": 277.98157000000003, "r": 214.15752, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "73", "bbox": {"l": 208.99026, "t": 277.98157000000003, "r": 214.15752, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 233.58348, "t": 277.98157000000003, "r": 238.75072999999998, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "34", "bbox": {"l": 233.58348, "t": 277.98157000000003, "r": 238.75072999999998, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 256.88446, "t": 277.98157000000003, "r": 264.6358, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "147", "bbox": {"l": 256.88446, "t": 277.98157000000003, "r": 264.6358, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 282.76938, "t": 277.98157000000003, "r": 287.93661, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "96", "bbox": {"l": 282.76938, "t": 277.98157000000003, "r": 287.93661, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 169.61508, "t": 286.45004, "r": 174.79999, "b": 290.63141, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "\u8a08", "bbox": {"l": 169.61508, "t": 286.45004, "r": 174.79999, "b": 290.63141, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 183.10536, "t": 285.46667, "r": 190.8567, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "945", "bbox": {"l": 183.10536, "t": 285.46667, "r": 190.8567, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 207.69832, "t": 285.46667, "r": 215.44965999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "294", "bbox": {"l": 207.69832, "t": 285.46667, "r": 215.44965999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 232.29153, "t": 285.46667, "r": 240.04287999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "651", "bbox": {"l": 232.29153, "t": 285.46667, "r": 240.04287999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 255.76506, "t": 285.46667, "r": 265.75204, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "1122", "bbox": {"l": 255.76506, "t": 285.46667, "r": 265.75204, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 281.47742, "t": 285.46667, "r": 289.22876, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "955", "bbox": {"l": 281.47742, "t": 285.46667, "r": 289.22876, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 16, "label": "caption", "bbox": {"l": 380.42731, "t": 292.30426, "r": 549.42175, "b": 298.60284, "coord_origin": "TOPLEFT"}, "confidence": 0.7499910593032837, "cells": [{"id": 76, "text": "Text is aligned to match original for ease of viewing", "bbox": {"l": 380.42731, "t": 292.30426, "r": 549.42175, "b": 298.60284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "table", "bbox": {"l": 304.9219970703125, "t": 218.51486206054688, "r": 550.2321166992188, "b": 287.90069580078125, "coord_origin": "TOPLEFT"}, "confidence": 0.8899765014648438, "cells": [{"id": 77, "text": "Weighted Average Grant Date Fair", "bbox": {"l": 459.04861, "t": 221.62415, "r": 542.00018, "b": 226.68933000000004, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "Value", "bbox": {"l": 493.82193, "t": 227.83416999999997, "r": 507.2258, "b": 232.89935000000003, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "RS", "bbox": {"l": 393.2442, "t": 236.74712999999997, "r": 400.74588, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "U", "bbox": {"l": 400.74643, "t": 236.74712999999997, "r": 404.64523, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "s", "bbox": {"l": 404.6463, "t": 236.74712999999997, "r": 407.34631, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "Shares (in millions)", "bbox": {"l": 392.09671, "t": 221.57446000000004, "r": 438.0145, "b": 226.63964999999996, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "PSUs", "bbox": {"l": 427.18323, "t": 236.74712999999997, "r": 440.98778999999996, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "RSUs", "bbox": {"l": 468.38254, "t": 236.74712999999997, "r": 482.48465000000004, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "PSUs", "bbox": {"l": 516.92578, "t": 236.74712999999997, "r": 530.73035, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Nonvested on Janua", "bbox": {"l": 306.11493, "t": 244.61084000000005, "r": 355.6532, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "ry 1", "bbox": {"l": 355.65427, "t": 244.61084000000005, "r": 364.65607, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "1.", "bbox": {"l": 396.24661, "t": 244.91327, "r": 400.75238, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "1", "bbox": {"l": 400.7529, "t": 244.91327, "r": 403.75531, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "0.3", "bbox": {"l": 429.81838999999997, "t": 244.91327, "r": 437.32708999999994, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "90.10", "bbox": {"l": 465.52859, "t": 244.91327, "r": 478.40103, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "$", "bbox": {"l": 480.97552, "t": 244.91327, "r": 483.55001999999996, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "$ 91.19", "bbox": {"l": 513.44824, "t": 244.91327, "r": 531.46967, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "Granted", "bbox": {"l": 306.11493, "t": 253.68451000000005, "r": 325.62674, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "0.", "bbox": {"l": 396.24661, "t": 253.68451000000005, "r": 400.75238, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "5", "bbox": {"l": 400.7529, "t": 253.68451000000005, "r": 403.75531, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "0.1", "bbox": {"l": 429.81838999999997, "t": 253.68451000000005, "r": 437.32708999999994, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "117.44", "bbox": {"l": 466.43579000000005, "t": 253.68451000000005, "r": 482.54831, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "122.41", "bbox": {"l": 514.29065, "t": 253.68451000000005, "r": 530.80981, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "Vested", "bbox": {"l": 306.11493, "t": 261.54822, "r": 322.62866, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "(0.", "bbox": {"l": 394.43222, "t": 261.54822, "r": 400.73563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "5", "bbox": {"l": 400.73456, "t": 261.54822, "r": 403.73697, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": ")", "bbox": {"l": 403.73804, "t": 261.54822, "r": 405.53625, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "(0.1)", "bbox": {"l": 427.7016, "t": 261.54822, "r": 438.80563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "87.08", "bbox": {"l": 468.55533, "t": 261.54822, "r": 482.07043, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "81.14", "bbox": {"l": 516.01862, "t": 261.54822, "r": 529.53375, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "Canceled or forfeited", "bbox": {"l": 306.11493, "t": 269.64148, "r": 356.24771, "b": 274.70667000000003, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "(0.", "bbox": {"l": 394.43222, "t": 270.31946000000005, "r": 400.73563, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "1", "bbox": {"l": 400.73456, "t": 270.31946000000005, "r": 403.73697, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": ")", "bbox": {"l": 403.73804, "t": 270.31946000000005, "r": 405.53625, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "-", "bbox": {"l": 431.02802, "t": 270.31946000000005, "r": 436.4280099999999, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "102.01", "bbox": {"l": 465.83099000000004, "t": 270.31946000000005, "r": 482.35013, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "92.18", "bbox": {"l": 516.01862, "t": 270.31946000000005, "r": 529.53375, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "Nonvested on December 31", "bbox": {"l": 306.11493, "t": 278.48572, "r": 373.35764, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "1.0", "bbox": {"l": 396.24661, "t": 278.48572, "r": 403.75531, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "0.3", "bbox": {"l": 429.51599, "t": 278.48572, "r": 437.02469, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "104.85 $", "bbox": {"l": 463.7142, "t": 278.48572, "r": 484.73965000000004, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "$ 104.51", "bbox": {"l": 512.99463, "t": 278.48572, "r": 534.02008, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}], "children": [{"id": 102, "label": "text", "bbox": {"l": 459.04861, "t": 221.62415, "r": 542.00018, "b": 226.68933000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "Weighted Average Grant Date Fair", "bbox": {"l": 459.04861, "t": 221.62415, "r": 542.00018, "b": 226.68933000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 493.82193, "t": 227.83416999999997, "r": 507.2258, "b": 232.89935000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "Value", "bbox": {"l": 493.82193, "t": 227.83416999999997, "r": 507.2258, "b": 232.89935000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 393.2442, "t": 236.74712999999997, "r": 400.74588, "b": 241.81232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "RS", "bbox": {"l": 393.2442, "t": 236.74712999999997, "r": 400.74588, "b": 241.81232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 400.74643, "t": 236.74712999999997, "r": 404.64523, "b": 241.81232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "U", "bbox": {"l": 400.74643, "t": 236.74712999999997, "r": 404.64523, "b": 241.81232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 404.6463, "t": 236.74712999999997, "r": 407.34631, "b": 241.81232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "s", "bbox": {"l": 404.6463, "t": 236.74712999999997, "r": 407.34631, "b": 241.81232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 392.09671, "t": 221.57446000000004, "r": 438.0145, "b": 226.63964999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "Shares (in millions)", "bbox": {"l": 392.09671, "t": 221.57446000000004, "r": 438.0145, "b": 226.63964999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 427.18323, "t": 236.74712999999997, "r": 440.98778999999996, "b": 241.81232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "PSUs", "bbox": {"l": 427.18323, "t": 236.74712999999997, "r": 440.98778999999996, "b": 241.81232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 468.38254, "t": 236.74712999999997, "r": 482.48465000000004, "b": 241.81232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "RSUs", "bbox": {"l": 468.38254, "t": 236.74712999999997, "r": 482.48465000000004, "b": 241.81232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 516.92578, "t": 236.74712999999997, "r": 530.73035, "b": 241.81232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "PSUs", "bbox": {"l": 516.92578, "t": 236.74712999999997, "r": 530.73035, "b": 241.81232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 306.11493, "t": 244.61084000000005, "r": 355.6532, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "Nonvested on Janua", "bbox": {"l": 306.11493, "t": 244.61084000000005, "r": 355.6532, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 355.65427, "t": 244.61084000000005, "r": 364.65607, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "ry 1", "bbox": {"l": 355.65427, "t": 244.61084000000005, "r": 364.65607, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 396.24661, "t": 244.91327, "r": 400.75238, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "1.", "bbox": {"l": 396.24661, "t": 244.91327, "r": 400.75238, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 114, "label": "text", "bbox": {"l": 400.7529, "t": 244.91327, "r": 403.75531, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "1", "bbox": {"l": 400.7529, "t": 244.91327, "r": 403.75531, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 115, "label": "text", "bbox": {"l": 429.81838999999997, "t": 244.91327, "r": 437.32708999999994, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "0.3", "bbox": {"l": 429.81838999999997, "t": 244.91327, "r": 437.32708999999994, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 116, "label": "text", "bbox": {"l": 465.52859, "t": 244.91327, "r": 478.40103, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "90.10", "bbox": {"l": 465.52859, "t": 244.91327, "r": 478.40103, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 117, "label": "text", "bbox": {"l": 480.97552, "t": 244.91327, "r": 483.55001999999996, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "$", "bbox": {"l": 480.97552, "t": 244.91327, "r": 483.55001999999996, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 118, "label": "text", "bbox": {"l": 513.44824, "t": 244.91327, "r": 531.46967, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "$ 91.19", "bbox": {"l": 513.44824, "t": 244.91327, "r": 531.46967, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 119, "label": "text", "bbox": {"l": 306.11493, "t": 253.68451000000005, "r": 325.62674, "b": 258.74969, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "Granted", "bbox": {"l": 306.11493, "t": 253.68451000000005, "r": 325.62674, "b": 258.74969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 120, "label": "text", "bbox": {"l": 396.24661, "t": 253.68451000000005, "r": 400.75238, "b": 258.74969, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "0.", "bbox": {"l": 396.24661, "t": 253.68451000000005, "r": 400.75238, "b": 258.74969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 121, "label": "text", "bbox": {"l": 400.7529, "t": 253.68451000000005, "r": 403.75531, "b": 258.74969, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "5", "bbox": {"l": 400.7529, "t": 253.68451000000005, "r": 403.75531, "b": 258.74969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 122, "label": "text", "bbox": {"l": 429.81838999999997, "t": 253.68451000000005, "r": 437.32708999999994, "b": 258.74969, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "0.1", "bbox": {"l": 429.81838999999997, "t": 253.68451000000005, "r": 437.32708999999994, "b": 258.74969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 123, "label": "text", "bbox": {"l": 466.43579000000005, "t": 253.68451000000005, "r": 482.54831, "b": 258.74969, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "117.44", "bbox": {"l": 466.43579000000005, "t": 253.68451000000005, "r": 482.54831, "b": 258.74969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 124, "label": "text", "bbox": {"l": 514.29065, "t": 253.68451000000005, "r": 530.80981, "b": 258.74969, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "122.41", "bbox": {"l": 514.29065, "t": 253.68451000000005, "r": 530.80981, "b": 258.74969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 125, "label": "text", "bbox": {"l": 306.11493, "t": 261.54822, "r": 322.62866, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "Vested", "bbox": {"l": 306.11493, "t": 261.54822, "r": 322.62866, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 126, "label": "text", "bbox": {"l": 394.43222, "t": 261.54822, "r": 400.73563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "(0.", "bbox": {"l": 394.43222, "t": 261.54822, "r": 400.73563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 127, "label": "text", "bbox": {"l": 400.73456, "t": 261.54822, "r": 403.73697, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "5", "bbox": {"l": 400.73456, "t": 261.54822, "r": 403.73697, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 128, "label": "text", "bbox": {"l": 403.73804, "t": 261.54822, "r": 405.53625, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": ")", "bbox": {"l": 403.73804, "t": 261.54822, "r": 405.53625, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 129, "label": "text", "bbox": {"l": 427.7016, "t": 261.54822, "r": 438.80563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "(0.1)", "bbox": {"l": 427.7016, "t": 261.54822, "r": 438.80563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 130, "label": "text", "bbox": {"l": 468.55533, "t": 261.54822, "r": 482.07043, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "87.08", "bbox": {"l": 468.55533, "t": 261.54822, "r": 482.07043, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 131, "label": "text", "bbox": {"l": 516.01862, "t": 261.54822, "r": 529.53375, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": "81.14", "bbox": {"l": 516.01862, "t": 261.54822, "r": 529.53375, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 132, "label": "text", "bbox": {"l": 306.11493, "t": 269.64148, "r": 356.24771, "b": 274.70667000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 107, "text": "Canceled or forfeited", "bbox": {"l": 306.11493, "t": 269.64148, "r": 356.24771, "b": 274.70667000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 133, "label": "text", "bbox": {"l": 394.43222, "t": 270.31946000000005, "r": 400.73563, "b": 275.38464, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 108, "text": "(0.", "bbox": {"l": 394.43222, "t": 270.31946000000005, "r": 400.73563, "b": 275.38464, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 134, "label": "text", "bbox": {"l": 400.73456, "t": 270.31946000000005, "r": 403.73697, "b": 275.38464, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 109, "text": "1", "bbox": {"l": 400.73456, "t": 270.31946000000005, "r": 403.73697, "b": 275.38464, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 135, "label": "text", "bbox": {"l": 403.73804, "t": 270.31946000000005, "r": 405.53625, "b": 275.38464, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 110, "text": ")", "bbox": {"l": 403.73804, "t": 270.31946000000005, "r": 405.53625, "b": 275.38464, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 136, "label": "text", "bbox": {"l": 431.02802, "t": 270.31946000000005, "r": 436.4280099999999, "b": 275.38464, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 111, "text": "-", "bbox": {"l": 431.02802, "t": 270.31946000000005, "r": 436.4280099999999, "b": 275.38464, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 137, "label": "text", "bbox": {"l": 465.83099000000004, "t": 270.31946000000005, "r": 482.35013, "b": 275.38464, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 112, "text": "102.01", "bbox": {"l": 465.83099000000004, "t": 270.31946000000005, "r": 482.35013, "b": 275.38464, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 138, "label": "text", "bbox": {"l": 516.01862, "t": 270.31946000000005, "r": 529.53375, "b": 275.38464, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 113, "text": "92.18", "bbox": {"l": 516.01862, "t": 270.31946000000005, "r": 529.53375, "b": 275.38464, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 139, "label": "text", "bbox": {"l": 306.11493, "t": 278.48572, "r": 373.35764, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 114, "text": "Nonvested on December 31", "bbox": {"l": 306.11493, "t": 278.48572, "r": 373.35764, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 140, "label": "text", "bbox": {"l": 396.24661, "t": 278.48572, "r": 403.75531, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 115, "text": "1.0", "bbox": {"l": 396.24661, "t": 278.48572, "r": 403.75531, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 141, "label": "text", "bbox": {"l": 429.51599, "t": 278.48572, "r": 437.02469, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 116, "text": "0.3", "bbox": {"l": 429.51599, "t": 278.48572, "r": 437.02469, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 142, "label": "text", "bbox": {"l": 463.7142, "t": 278.48572, "r": 484.73965000000004, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 117, "text": "104.85 $", "bbox": {"l": 463.7142, "t": 278.48572, "r": 484.73965000000004, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 143, "label": "text", "bbox": {"l": 512.99463, "t": 278.48572, "r": 534.02008, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 118, "text": "$ 104.51", "bbox": {"l": 512.99463, "t": 278.48572, "r": 534.02008, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 6, "label": "caption", "bbox": {"l": 50.112, "t": 320.87735, "r": 545.11377, "b": 365.64987, "coord_origin": "TOPLEFT"}, "confidence": 0.9140306711196899, "cells": [{"id": 119, "text": "Figure 5:", "bbox": {"l": 50.112, "t": 320.87735, "r": 86.864021, "b": 329.78391, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "One of the benefits of TableFormer is that it is language agnostic, as an example, the left part of the illustration", "bbox": {"l": 93.917542, "t": 320.87735, "r": 545.11371, "b": 329.78391, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "demonstrates TableFormer predictions on previously unseen language (Japanese). Additionally, we see that TableFormer is", "bbox": {"l": 50.112, "t": 332.83233999999993, "r": 545.11371, "b": 341.73889, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "robust to variability in style and content, right side of the illustration shows the example of the TableFormer prediction from", "bbox": {"l": 50.112, "t": 344.78732, "r": 545.11377, "b": 353.69388, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "the FinTabNet dataset.", "bbox": {"l": 50.112, "t": 356.74332, "r": 139.79532, "b": 365.64987, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "picture", "bbox": {"l": 216.76925659179688, "t": 380.4906005859375, "r": 375.7829284667969, "b": 443.3470458984375, "coord_origin": "TOPLEFT"}, "confidence": 0.8058525919914246, "cells": [{"id": 124, "text": "Red - PDF cells, Green - predicted bounding boxes", "bbox": {"l": 220.26282, "t": 381.77722, "r": 342.07819, "b": 386.44281, "coord_origin": "TOPLEFT"}}], "children": [{"id": 144, "label": "text", "bbox": {"l": 220.26282, "t": 381.77722, "r": 342.07819, "b": 386.44281, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 124, "text": "Red - PDF cells, Green - predicted bounding boxes", "bbox": {"l": 220.26282, "t": 381.77722, "r": 342.07819, "b": 386.44281, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 11, "label": "picture", "bbox": {"l": 51.736167907714844, "t": 380.48065185546875, "r": 211.83778381347656, "b": 443.6580810546875, "coord_origin": "TOPLEFT"}, "confidence": 0.8308417797088623, "cells": [{"id": 125, "text": "Ground Truth", "bbox": {"l": 53.715248, "t": 381.77722, "r": 85.657333, "b": 386.44281, "coord_origin": "TOPLEFT"}}], "children": [{"id": 145, "label": "text", "bbox": {"l": 53.715248, "t": 381.77722, "r": 85.657333, "b": 386.44281, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 125, "text": "Ground Truth", "bbox": {"l": 53.715248, "t": 381.77722, "r": 85.657333, "b": 386.44281, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 13, "label": "picture", "bbox": {"l": 383.1364440917969, "t": 381.2312927246094, "r": 542.1132202148438, "b": 442.7749328613281, "coord_origin": "TOPLEFT"}, "confidence": 0.7881613969802856, "cells": [{"id": 126, "text": "16", "bbox": {"l": 437.37939, "t": 400.55295, "r": 443.69870000000003, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "17", "bbox": {"l": 450.33203, "t": 400.55295, "r": 456.6513100000001, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "18", "bbox": {"l": 463.28464, "t": 400.55295, "r": 469.60394, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "19", "bbox": {"l": 476.23724000000004, "t": 400.55295, "r": 482.5565500000001, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "20", "bbox": {"l": 489.18988, "t": 400.55295, "r": 495.50916, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "21", "bbox": {"l": 502.14251999999993, "t": 400.55295, "r": 508.46178999999995, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "22", "bbox": {"l": 515.09509, "t": 400.55295, "r": 521.41443, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "23", "bbox": {"l": 385.2814, "t": 411.03836000000007, "r": 391.60071, "b": 417.35699, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "24", "bbox": {"l": 398.52341, "t": 411.03836000000007, "r": 404.84271, "b": 417.35699, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "25", "bbox": {"l": 411.47604, "t": 411.03836000000007, "r": 417.79535, "b": 417.35699, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "26", "bbox": {"l": 437.37939, "t": 411.03836000000007, "r": 443.69870000000003, "b": 417.35699, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "27", "bbox": {"l": 450.33203, "t": 411.03836000000007, "r": 456.6513100000001, "b": 417.35699, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "28", "bbox": {"l": 463.28464, "t": 411.03836000000007, "r": 469.60394, "b": 417.35699, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "30", "bbox": {"l": 385.2814, "t": 421.0697, "r": 391.60071, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "31", "bbox": {"l": 398.52341, "t": 421.0697, "r": 404.84271, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "32", "bbox": {"l": 411.47604, "t": 421.0697, "r": 417.79532, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "33", "bbox": {"l": 424.42865, "t": 421.0697, "r": 430.74796, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "34", "bbox": {"l": 437.38129, "t": 421.0697, "r": 443.70056, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "35", "bbox": {"l": 450.33389000000005, "t": 421.0697, "r": 456.65319999999997, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "36", "bbox": {"l": 463.2865, "t": 421.0697, "r": 469.6058, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "37", "bbox": {"l": 476.23914, "t": 421.0697, "r": 482.55841, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "38", "bbox": {"l": 489.1917700000001, "t": 421.0697, "r": 495.51105, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "39", "bbox": {"l": 502.14438, "t": 421.0697, "r": 508.46368, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "40", "bbox": {"l": 515.09705, "t": 421.0697, "r": 521.41632, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "41", "bbox": {"l": 528.04962, "t": 421.0697, "r": 534.3689, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "42", "bbox": {"l": 385.2814, "t": 432.04431, "r": 391.60071, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "43", "bbox": {"l": 398.52341, "t": 432.04431, "r": 404.84271, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "44", "bbox": {"l": 411.47604, "t": 432.04431, "r": 417.79532, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "45", "bbox": {"l": 424.42865, "t": 432.04431, "r": 430.74796, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "46", "bbox": {"l": 437.38129, "t": 432.04431, "r": 443.70056, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "47", "bbox": {"l": 450.33389000000005, "t": 432.04431, "r": 456.65319999999997, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "48", "bbox": {"l": 463.2865, "t": 432.04431, "r": 469.6058, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "49", "bbox": {"l": 476.23914, "t": 432.04431, "r": 482.55841, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "50", "bbox": {"l": 489.1917700000001, "t": 432.04431, "r": 495.51105, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "51", "bbox": {"l": 502.14438, "t": 432.04431, "r": 508.46368, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "52", "bbox": {"l": 515.09705, "t": 432.04431, "r": 521.41632, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "53", "bbox": {"l": 528.04962, "t": 432.04431, "r": 534.3689, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "0", "bbox": {"l": 385.2814, "t": 389.20004, "r": 388.44073, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "1", "bbox": {"l": 398.52341, "t": 389.20004, "r": 401.68274, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "2", "bbox": {"l": 411.4754, "t": 389.20004, "r": 414.63474, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "3", "bbox": {"l": 424.4274, "t": 389.20004, "r": 427.58673, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "4", "bbox": {"l": 437.37939, "t": 389.20004, "r": 440.53870000000006, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "5", "bbox": {"l": 450.33136, "t": 389.20004, "r": 453.49069000000003, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "6", "bbox": {"l": 463.28336, "t": 389.20004, "r": 466.44269, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "7", "bbox": {"l": 476.23535, "t": 389.20004, "r": 479.39468, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "8", "bbox": {"l": 489.18735, "t": 389.20004, "r": 492.34668, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "9", "bbox": {"l": 502.13933999999995, "t": 389.20004, "r": 505.29868000000005, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "10", "bbox": {"l": 515.09131, "t": 389.20004, "r": 521.41064, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "11", "bbox": {"l": 528.04364, "t": 389.20004, "r": 534.13104, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "12", "bbox": {"l": 385.2814, "t": 398.97464, "r": 391.60071, "b": 405.29327, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "13", "bbox": {"l": 398.52341, "t": 398.97464, "r": 404.84271, "b": 405.29327, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "14", "bbox": {"l": 411.47604, "t": 398.97464, "r": 417.79535, "b": 405.29327, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "15", "bbox": {"l": 424.42719, "t": 406.77463000000006, "r": 430.74648999999994, "b": 413.09326, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "29", "bbox": {"l": 502.86941999999993, "t": 410.99438, "r": 509.18871999999993, "b": 417.31302, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "Predicted Structure", "bbox": {"l": 384.35437, "t": 381.77722, "r": 430.99261, "b": 386.44281, "coord_origin": "TOPLEFT"}}], "children": [{"id": 146, "label": "text", "bbox": {"l": 437.37939, "t": 400.55295, "r": 443.69870000000003, "b": 406.87158, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 126, "text": "16", "bbox": {"l": 437.37939, "t": 400.55295, "r": 443.69870000000003, "b": 406.87158, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 147, "label": "text", "bbox": {"l": 450.33203, "t": 400.55295, "r": 456.6513100000001, "b": 406.87158, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 127, "text": "17", "bbox": {"l": 450.33203, "t": 400.55295, "r": 456.6513100000001, "b": 406.87158, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 148, "label": "text", "bbox": {"l": 463.28464, "t": 400.55295, "r": 469.60394, "b": 406.87158, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 128, "text": "18", "bbox": {"l": 463.28464, "t": 400.55295, "r": 469.60394, "b": 406.87158, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 149, "label": "text", "bbox": {"l": 476.23724000000004, "t": 400.55295, "r": 482.5565500000001, "b": 406.87158, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 129, "text": "19", "bbox": {"l": 476.23724000000004, "t": 400.55295, "r": 482.5565500000001, "b": 406.87158, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 150, "label": "text", "bbox": {"l": 489.18988, "t": 400.55295, "r": 495.50916, "b": 406.87158, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 130, "text": "20", "bbox": {"l": 489.18988, "t": 400.55295, "r": 495.50916, "b": 406.87158, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 151, "label": "text", "bbox": {"l": 502.14251999999993, "t": 400.55295, "r": 508.46178999999995, "b": 406.87158, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 131, "text": "21", "bbox": {"l": 502.14251999999993, "t": 400.55295, "r": 508.46178999999995, "b": 406.87158, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 152, "label": "text", "bbox": {"l": 515.09509, "t": 400.55295, "r": 521.41443, "b": 406.87158, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 132, "text": "22", "bbox": {"l": 515.09509, "t": 400.55295, "r": 521.41443, "b": 406.87158, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 153, "label": "text", "bbox": {"l": 385.2814, "t": 411.03836000000007, "r": 391.60071, "b": 417.35699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 133, "text": "23", "bbox": {"l": 385.2814, "t": 411.03836000000007, "r": 391.60071, "b": 417.35699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 154, "label": "text", "bbox": {"l": 398.52341, "t": 411.03836000000007, "r": 404.84271, "b": 417.35699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 134, "text": "24", "bbox": {"l": 398.52341, "t": 411.03836000000007, "r": 404.84271, "b": 417.35699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 155, "label": "text", "bbox": {"l": 411.47604, "t": 411.03836000000007, "r": 417.79535, "b": 417.35699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 135, "text": "25", "bbox": {"l": 411.47604, "t": 411.03836000000007, "r": 417.79535, "b": 417.35699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 156, "label": "text", "bbox": {"l": 437.37939, "t": 411.03836000000007, "r": 443.69870000000003, "b": 417.35699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 136, "text": "26", "bbox": {"l": 437.37939, "t": 411.03836000000007, "r": 443.69870000000003, "b": 417.35699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 157, "label": "text", "bbox": {"l": 450.33203, "t": 411.03836000000007, "r": 456.6513100000001, "b": 417.35699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 137, "text": "27", "bbox": {"l": 450.33203, "t": 411.03836000000007, "r": 456.6513100000001, "b": 417.35699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 158, "label": "text", "bbox": {"l": 463.28464, "t": 411.03836000000007, "r": 469.60394, "b": 417.35699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 138, "text": "28", "bbox": {"l": 463.28464, "t": 411.03836000000007, "r": 469.60394, "b": 417.35699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 159, "label": "text", "bbox": {"l": 385.2814, "t": 421.0697, "r": 391.60071, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 139, "text": "30", "bbox": {"l": 385.2814, "t": 421.0697, "r": 391.60071, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 160, "label": "text", "bbox": {"l": 398.52341, "t": 421.0697, "r": 404.84271, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 140, "text": "31", "bbox": {"l": 398.52341, "t": 421.0697, "r": 404.84271, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 161, "label": "text", "bbox": {"l": 411.47604, "t": 421.0697, "r": 417.79532, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 141, "text": "32", "bbox": {"l": 411.47604, "t": 421.0697, "r": 417.79532, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 162, "label": "text", "bbox": {"l": 424.42865, "t": 421.0697, "r": 430.74796, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 142, "text": "33", "bbox": {"l": 424.42865, "t": 421.0697, "r": 430.74796, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 163, "label": "text", "bbox": {"l": 437.38129, "t": 421.0697, "r": 443.70056, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 143, "text": "34", "bbox": {"l": 437.38129, "t": 421.0697, "r": 443.70056, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 164, "label": "text", "bbox": {"l": 450.33389000000005, "t": 421.0697, "r": 456.65319999999997, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 144, "text": "35", "bbox": {"l": 450.33389000000005, "t": 421.0697, "r": 456.65319999999997, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 165, "label": "text", "bbox": {"l": 463.2865, "t": 421.0697, "r": 469.6058, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 145, "text": "36", "bbox": {"l": 463.2865, "t": 421.0697, "r": 469.6058, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 166, "label": "text", "bbox": {"l": 476.23914, "t": 421.0697, "r": 482.55841, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 146, "text": "37", "bbox": {"l": 476.23914, "t": 421.0697, "r": 482.55841, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 167, "label": "text", "bbox": {"l": 489.1917700000001, "t": 421.0697, "r": 495.51105, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 147, "text": "38", "bbox": {"l": 489.1917700000001, "t": 421.0697, "r": 495.51105, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 168, "label": "text", "bbox": {"l": 502.14438, "t": 421.0697, "r": 508.46368, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 148, "text": "39", "bbox": {"l": 502.14438, "t": 421.0697, "r": 508.46368, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 169, "label": "text", "bbox": {"l": 515.09705, "t": 421.0697, "r": 521.41632, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 149, "text": "40", "bbox": {"l": 515.09705, "t": 421.0697, "r": 521.41632, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 170, "label": "text", "bbox": {"l": 528.04962, "t": 421.0697, "r": 534.3689, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 150, "text": "41", "bbox": {"l": 528.04962, "t": 421.0697, "r": 534.3689, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 171, "label": "text", "bbox": {"l": 385.2814, "t": 432.04431, "r": 391.60071, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 151, "text": "42", "bbox": {"l": 385.2814, "t": 432.04431, "r": 391.60071, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 172, "label": "text", "bbox": {"l": 398.52341, "t": 432.04431, "r": 404.84271, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 152, "text": "43", "bbox": {"l": 398.52341, "t": 432.04431, "r": 404.84271, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 173, "label": "text", "bbox": {"l": 411.47604, "t": 432.04431, "r": 417.79532, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 153, "text": "44", "bbox": {"l": 411.47604, "t": 432.04431, "r": 417.79532, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 174, "label": "text", "bbox": {"l": 424.42865, "t": 432.04431, "r": 430.74796, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 154, "text": "45", "bbox": {"l": 424.42865, "t": 432.04431, "r": 430.74796, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 175, "label": "text", "bbox": {"l": 437.38129, "t": 432.04431, "r": 443.70056, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 155, "text": "46", "bbox": {"l": 437.38129, "t": 432.04431, "r": 443.70056, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 176, "label": "text", "bbox": {"l": 450.33389000000005, "t": 432.04431, "r": 456.65319999999997, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 156, "text": "47", "bbox": {"l": 450.33389000000005, "t": 432.04431, "r": 456.65319999999997, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 177, "label": "text", "bbox": {"l": 463.2865, "t": 432.04431, "r": 469.6058, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 157, "text": "48", "bbox": {"l": 463.2865, "t": 432.04431, "r": 469.6058, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 178, "label": "text", "bbox": {"l": 476.23914, "t": 432.04431, "r": 482.55841, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 158, "text": "49", "bbox": {"l": 476.23914, "t": 432.04431, "r": 482.55841, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 179, "label": "text", "bbox": {"l": 489.1917700000001, "t": 432.04431, "r": 495.51105, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 159, "text": "50", "bbox": {"l": 489.1917700000001, "t": 432.04431, "r": 495.51105, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 180, "label": "text", "bbox": {"l": 502.14438, "t": 432.04431, "r": 508.46368, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 160, "text": "51", "bbox": {"l": 502.14438, "t": 432.04431, "r": 508.46368, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 181, "label": "text", "bbox": {"l": 515.09705, "t": 432.04431, "r": 521.41632, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 161, "text": "52", "bbox": {"l": 515.09705, "t": 432.04431, "r": 521.41632, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 182, "label": "text", "bbox": {"l": 528.04962, "t": 432.04431, "r": 534.3689, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 162, "text": "53", "bbox": {"l": 528.04962, "t": 432.04431, "r": 534.3689, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 183, "label": "text", "bbox": {"l": 385.2814, "t": 389.20004, "r": 388.44073, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 163, "text": "0", "bbox": {"l": 385.2814, "t": 389.20004, "r": 388.44073, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 184, "label": "text", "bbox": {"l": 398.52341, "t": 389.20004, "r": 401.68274, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 164, "text": "1", "bbox": {"l": 398.52341, "t": 389.20004, "r": 401.68274, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 185, "label": "text", "bbox": {"l": 411.4754, "t": 389.20004, "r": 414.63474, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 165, "text": "2", "bbox": {"l": 411.4754, "t": 389.20004, "r": 414.63474, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 186, "label": "text", "bbox": {"l": 424.4274, "t": 389.20004, "r": 427.58673, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 166, "text": "3", "bbox": {"l": 424.4274, "t": 389.20004, "r": 427.58673, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 187, "label": "text", "bbox": {"l": 437.37939, "t": 389.20004, "r": 440.53870000000006, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 167, "text": "4", "bbox": {"l": 437.37939, "t": 389.20004, "r": 440.53870000000006, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 188, "label": "text", "bbox": {"l": 450.33136, "t": 389.20004, "r": 453.49069000000003, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 168, "text": "5", "bbox": {"l": 450.33136, "t": 389.20004, "r": 453.49069000000003, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 189, "label": "text", "bbox": {"l": 463.28336, "t": 389.20004, "r": 466.44269, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 169, "text": "6", "bbox": {"l": 463.28336, "t": 389.20004, "r": 466.44269, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 190, "label": "text", "bbox": {"l": 476.23535, "t": 389.20004, "r": 479.39468, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 170, "text": "7", "bbox": {"l": 476.23535, "t": 389.20004, "r": 479.39468, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 191, "label": "text", "bbox": {"l": 489.18735, "t": 389.20004, "r": 492.34668, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 171, "text": "8", "bbox": {"l": 489.18735, "t": 389.20004, "r": 492.34668, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 192, "label": "text", "bbox": {"l": 502.13933999999995, "t": 389.20004, "r": 505.29868000000005, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 172, "text": "9", "bbox": {"l": 502.13933999999995, "t": 389.20004, "r": 505.29868000000005, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 193, "label": "text", "bbox": {"l": 515.09131, "t": 389.20004, "r": 521.41064, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 173, "text": "10", "bbox": {"l": 515.09131, "t": 389.20004, "r": 521.41064, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 194, "label": "text", "bbox": {"l": 528.04364, "t": 389.20004, "r": 534.13104, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 174, "text": "11", "bbox": {"l": 528.04364, "t": 389.20004, "r": 534.13104, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 195, "label": "text", "bbox": {"l": 385.2814, "t": 398.97464, "r": 391.60071, "b": 405.29327, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 175, "text": "12", "bbox": {"l": 385.2814, "t": 398.97464, "r": 391.60071, "b": 405.29327, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 196, "label": "text", "bbox": {"l": 398.52341, "t": 398.97464, "r": 404.84271, "b": 405.29327, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 176, "text": "13", "bbox": {"l": 398.52341, "t": 398.97464, "r": 404.84271, "b": 405.29327, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 197, "label": "text", "bbox": {"l": 411.47604, "t": 398.97464, "r": 417.79535, "b": 405.29327, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 177, "text": "14", "bbox": {"l": 411.47604, "t": 398.97464, "r": 417.79535, "b": 405.29327, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 198, "label": "text", "bbox": {"l": 424.42719, "t": 406.77463000000006, "r": 430.74648999999994, "b": 413.09326, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 178, "text": "15", "bbox": {"l": 424.42719, "t": 406.77463000000006, "r": 430.74648999999994, "b": 413.09326, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 199, "label": "text", "bbox": {"l": 502.86941999999993, "t": 410.99438, "r": 509.18871999999993, "b": 417.31302, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 179, "text": "29", "bbox": {"l": 502.86941999999993, "t": 410.99438, "r": 509.18871999999993, "b": 417.31302, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 200, "label": "text", "bbox": {"l": 384.35437, "t": 381.77722, "r": 430.99261, "b": 386.44281, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 180, "text": "Predicted Structure", "bbox": {"l": 384.35437, "t": 381.77722, "r": 430.99261, "b": 386.44281, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 5, "label": "caption", "bbox": {"l": 62.595001, "t": 458.72836, "r": 532.63049, "b": 467.63492, "coord_origin": "TOPLEFT"}, "confidence": 0.9153599143028259, "cells": [{"id": 181, "text": "Figure 6: An example of TableFormer predictions (bounding boxes and structure) from generated SynthTabNet table.", "bbox": {"l": 62.595001, "t": 458.72836, "r": 532.63049, "b": 467.63492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "section_header", "bbox": {"l": 50.112, "t": 491.39536, "r": 163.7558, "b": 501.24741, "coord_origin": "TOPLEFT"}, "confidence": 0.9561247229576111, "cells": [{"id": 182, "text": "5.5.", "bbox": {"l": 50.112, "t": 491.39536, "r": 64.448898, "b": 501.24741, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "Qualitative Analysis", "bbox": {"l": 74.006828, "t": 491.39536, "r": 163.7558, "b": 501.24741, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 50.112, "t": 536.87337, "r": 286.36511, "b": 713.1519470000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9852360486984253, "cells": [{"id": 184, "text": "We showcase several visualizations for the different", "bbox": {"l": 62.067001, "t": 536.87337, "r": 286.36499, "b": 545.77992, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": "components of our network on various", "bbox": {"l": 50.112, "t": 548.82837, "r": 211.15741, "b": 557.73492, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "\u201ccomplex\u201d", "bbox": {"l": 215.10000999999997, "t": 548.91803, "r": 259.17453, "b": 557.50578, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "tables", "bbox": {"l": 263.12, "t": 548.82837, "r": 286.36273, "b": 557.73492, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": "within datasets presented in this work in Fig. 5 and Fig. 6", "bbox": {"l": 50.112, "t": 560.78337, "r": 286.36505, "b": 569.68993, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "As it is shown, our model is able to predict bounding boxes", "bbox": {"l": 50.112, "t": 572.73837, "r": 286.36508, "b": 581.6449299999999, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "for all table cells, even for the empty ones. Additionally,", "bbox": {"l": 50.112, "t": 584.69337, "r": 286.36508, "b": 593.59993, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "our post-processing techniques can extract the cell content", "bbox": {"l": 50.112, "t": 596.64937, "r": 286.36505, "b": 605.55592, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": "by matching the predicted bounding boxes to the PDF cells", "bbox": {"l": 50.112, "t": 608.60437, "r": 286.36508, "b": 617.51093, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "based on their overlap and spatial proximity. The left part", "bbox": {"l": 50.112, "t": 620.55937, "r": 286.36508, "b": 629.46593, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "of Fig. 5 demonstrates also the adaptability of our method", "bbox": {"l": 50.112, "t": 632.51437, "r": 286.36508, "b": 641.42093, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "to any language, as it can successfully extract Japanese", "bbox": {"l": 50.112, "t": 644.46938, "r": 286.36508, "b": 653.37593, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "text, although the training set contains only English content.", "bbox": {"l": 50.112, "t": 656.42438, "r": 286.36511, "b": 665.33094, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "We provide more visualizations including the intermediate", "bbox": {"l": 50.112, "t": 668.38037, "r": 286.36508, "b": 677.28694, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "steps in the supplementary material. Overall these illustra-", "bbox": {"l": 50.112, "t": 680.33537, "r": 286.36511, "b": 689.24194, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "tions justify the versatility of our method across a diverse", "bbox": {"l": 50.112, "t": 692.290375, "r": 286.36511, "b": 701.196945, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "range of table appearances and content type.", "bbox": {"l": 50.112, "t": 704.245377, "r": 226.88833999999997, "b": 713.1519470000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "section_header", "bbox": {"l": 308.862, "t": 490.70892, "r": 460.84848, "b": 501.45663, "coord_origin": "TOPLEFT"}, "confidence": 0.943652331829071, "cells": [{"id": 201, "text": "6.", "bbox": {"l": 308.862, "t": 490.70892, "r": 316.07382, "b": 501.45663, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": "Future Work & Conclusion", "bbox": {"l": 325.68954, "t": 490.70892, "r": 460.84848, "b": 501.45663, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 308.862, "t": 512.89337, "r": 545.11517, "b": 653.30592, "coord_origin": "TOPLEFT"}, "confidence": 0.9875594973564148, "cells": [{"id": 203, "text": "In this paper, we presented TableFormer an end-to-end", "bbox": {"l": 320.81699, "t": 512.89337, "r": 545.11505, "b": 521.79993, "coord_origin": "TOPLEFT"}}, {"id": 204, "text": "transformer based approach to predict table structures and", "bbox": {"l": 308.862, "t": 524.84836, "r": 545.11517, "b": 533.75491, "coord_origin": "TOPLEFT"}}, {"id": 205, "text": "bounding boxes of cells from an image. This approach en-", "bbox": {"l": 308.862, "t": 536.80336, "r": 545.11511, "b": 545.70992, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": "ables us to recreate the table structure, and extract the cell", "bbox": {"l": 308.862, "t": 548.75836, "r": 545.11505, "b": 557.6649199999999, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": "content from PDF or OCR by using bounding boxes. Ad-", "bbox": {"l": 308.862, "t": 560.71336, "r": 545.11517, "b": 569.61992, "coord_origin": "TOPLEFT"}}, {"id": 208, "text": "ditionally, it provides the versatility required in real-world", "bbox": {"l": 308.862, "t": 572.66837, "r": 545.11511, "b": 581.57492, "coord_origin": "TOPLEFT"}}, {"id": 209, "text": "scenarios when dealing with various types of PDF docu-", "bbox": {"l": 308.862, "t": 584.62436, "r": 545.11511, "b": 593.53091, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": "ments, and languages.", "bbox": {"l": 308.862, "t": 596.57936, "r": 400.46808, "b": 605.48592, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "Furthermore, our method outper-", "bbox": {"l": 408.37839, "t": 596.57936, "r": 545.11511, "b": 605.48592, "coord_origin": "TOPLEFT"}}, {"id": 212, "text": "forms all state-of-the-arts with a wide margin. Finally, we", "bbox": {"l": 308.862, "t": 608.53436, "r": 545.11505, "b": 617.44092, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "introduce \u201cSynthTabNet\u201d a challenging synthetically gen-", "bbox": {"l": 308.862, "t": 620.48936, "r": 545.11511, "b": 629.3959199999999, "coord_origin": "TOPLEFT"}}, {"id": 214, "text": "erated dataset that reinforces missing characteristics from", "bbox": {"l": 308.862, "t": 632.4443699999999, "r": 545.11505, "b": 641.35092, "coord_origin": "TOPLEFT"}}, {"id": 215, "text": "other datasets.", "bbox": {"l": 308.862, "t": 644.39937, "r": 365.85803, "b": 653.30592, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "section_header", "bbox": {"l": 308.862, "t": 672.09892, "r": 364.40585, "b": 682.84664, "coord_origin": "TOPLEFT"}, "confidence": 0.9442470669746399, "cells": [{"id": 216, "text": "References", "bbox": {"l": 308.862, "t": 672.09892, "r": 364.40585, "b": 682.84664, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "list_item", "bbox": {"l": 313.345, "t": 693.9617920000001, "r": 545.1134, "b": 712.936752, "coord_origin": "TOPLEFT"}, "confidence": 0.8318749070167542, "cells": [{"id": 217, "text": "[1]", "bbox": {"l": 313.345, "t": 693.9617920000001, "r": 323.80792, "b": 701.977753, "coord_origin": "TOPLEFT"}}, {"id": 218, "text": "Nicolas Carion, Francisco Massa, Gabriel Synnaeve, Nicolas", "bbox": {"l": 326.05127, "t": 693.9617920000001, "r": 545.10852, "b": 701.977753, "coord_origin": "TOPLEFT"}}, {"id": 219, "text": "Usunier, Alexander Kirillov, and Sergey Zagoruyko. End-to-", "bbox": {"l": 328.78101, "t": 704.920792, "r": 545.1134, "b": 712.936752, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "page_footer", "bbox": {"l": 295.121, "t": 734.133366, "r": 300.10229, "b": 743.039928, "coord_origin": "TOPLEFT"}, "confidence": 0.8709856867790222, "cells": [{"id": 220, "text": "8", "bbox": {"l": 295.121, "t": 734.133366, "r": 300.10229, "b": 743.039928, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "picture", "bbox": {"l": 305.58367919921875, "t": 98.65414428710938, "r": 554.8258666992188, "b": 180.6267547607422, "coord_origin": "TOPLEFT"}, "confidence": 0.7699168920516968, "cells": [], "children": []}, {"id": 14, "label": "picture", "bbox": {"l": 49.97503662109375, "t": 103.71266174316406, "r": 301.6335754394531, "b": 187.57891845703125, "coord_origin": "TOPLEFT"}, "confidence": 0.787392258644104, "cells": [], "children": []}]}, "tablestructure": {"table_map": {"8": {"label": "table", "id": 8, "page_no": 7, "cluster": {"id": 8, "label": "table", "bbox": {"l": 53.6285514831543, "t": 218.94854736328125, "r": 298.5574645996094, "b": 292.3999938964844, "coord_origin": "TOPLEFT"}, "confidence": 0.8824008107185364, "cells": [{"id": 6, "text": "\u8ad6\u6587\u30d5\u30a1\u30a4\u30eb", "bbox": {"l": 209.93285, "t": 222.18073000000004, "r": 241.04458999999997, "b": 226.36212, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "\u53c2\u8003\u6587\u732e", "bbox": {"l": 263.76489, "t": 222.18073000000004, "r": 284.50589, "b": 226.36212, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "\u51fa\u5178", "bbox": {"l": 110.24990999999999, "t": 229.66594999999995, "r": 120.62018, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "\u30d5\u30a1\u30a4\u30eb", "bbox": {"l": 175.36609, "t": 229.66594999999995, "r": 196.1071, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "\u6570", "bbox": {"l": 196.10756, "t": 229.66594999999995, "r": 201.29247, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "\u82f1\u8a9e", "bbox": {"l": 209.62408, "t": 229.66594999999995, "r": 219.99435, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "\u65e5\u672c\u8a9e", "bbox": {"l": 229.19814, "t": 229.66594999999995, "r": 244.75377, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "\u82f1\u8a9e", "bbox": {"l": 256.1142, "t": 229.66594999999995, "r": 266.48447, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "\u65e5\u672c\u8a9e", "bbox": {"l": 278.38434, "t": 229.66594999999995, "r": 293.93997, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Association for Computational Linguistics(ACL2003)", "bbox": {"l": 55.53052099999999, "t": 236.42584, "r": 162.7131, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "65", "bbox": {"l": 184.39731, "t": 236.42584, "r": 189.56456, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "65", "bbox": {"l": 208.99026, "t": 236.42584, "r": 214.15752, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "0", "bbox": {"l": 234.87517, "t": 236.42584, "r": 237.45833000000002, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "150", "bbox": {"l": 256.88446, "t": 236.42584, "r": 264.6358, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "0", "bbox": {"l": 284.06134, "t": 236.42584, "r": 286.6445, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Computational Linguistics(COLING2002)", "bbox": {"l": 55.53052099999999, "t": 242.62048000000004, "r": 139.72253, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "140", "bbox": {"l": 183.10536, "t": 242.62048000000004, "r": 190.8567, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "140", "bbox": {"l": 207.69832, "t": 242.62048000000004, "r": 215.44965999999997, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "0", "bbox": {"l": 234.87517, "t": 242.62048000000004, "r": 237.45833000000002, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "150", "bbox": {"l": 256.88446, "t": 242.62048000000004, "r": 264.6358, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "0", "bbox": {"l": 284.06134, "t": 242.62048000000004, "r": 286.6445, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "\u96fb\u6c17\u60c5\u5831\u901a\u4fe1\u5b66\u4f1a", "bbox": {"l": 55.53052099999999, "t": 249.79845999999998, "r": 97.013, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "2003", "bbox": {"l": 92.698288, "t": 249.58942000000002, "r": 103.03371, "b": 253.94732999999997, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "\u5e74\u7dcf\u5408\u5927\u4f1a", "bbox": {"l": 103.03389, "t": 249.79845999999998, "r": 128.96027, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "150", "bbox": {"l": 183.10536, "t": 248.81506000000002, "r": 190.8567, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "8", "bbox": {"l": 210.28223, "t": 248.81506000000002, "r": 212.86539, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "142", "bbox": {"l": 232.29153, "t": 248.81506000000002, "r": 240.04287999999997, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "223", "bbox": {"l": 256.88446, "t": 248.81506000000002, "r": 264.6358, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "147", "bbox": {"l": 281.47742, "t": 248.81506000000002, "r": 289.22876, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "\u60c5\u5831\u51e6\u7406\u5b66\u4f1a\u7b2c", "bbox": {"l": 55.53052099999999, "t": 257.28369, "r": 91.827637, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "65", "bbox": {"l": 88.052673, "t": 257.07465, "r": 93.219925, "b": 261.43255999999997, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "\u56de\u5168\u56fd\u5927\u4f1a", "bbox": {"l": 93.220474, "t": 257.28369, "r": 119.14685, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "(2003)", "bbox": {"l": 116.45073999999998, "t": 257.07465, "r": 129.88177, "b": 261.43255999999997, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "177", "bbox": {"l": 183.10536, "t": 256.30029, "r": 190.8567, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "1", "bbox": {"l": 210.28223, "t": 256.30029, "r": 212.86539, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "176", "bbox": {"l": 232.29153, "t": 256.30029, "r": 240.04287999999997, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "150", "bbox": {"l": 256.88446, "t": 256.30029, "r": 264.6358, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "236", "bbox": {"l": 281.47742, "t": 256.30029, "r": 289.22876, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "\u7b2c", "bbox": {"l": 55.53052099999999, "t": 264.5108, "r": 60.715424, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "17", "bbox": {"l": 60.17654799999999, "t": 264.30175999999994, "r": 65.343796, "b": 268.65967, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "\u56de\u4eba\u5de5\u77e5\u80fd\u5b66\u4f1a\u5168\u56fd\u5927\u4f1a", "bbox": {"l": 65.344376, "t": 264.5108, "r": 122.38297000000001, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "(2003)", "bbox": {"l": 116.45073999999998, "t": 264.30175999999994, "r": 129.88177, "b": 268.65967, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "208", "bbox": {"l": 183.10536, "t": 263.52739999999994, "r": 190.8567, "b": 267.88531, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "5", "bbox": {"l": 210.28223, "t": 263.52739999999994, "r": 212.86539, "b": 267.88531, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "203", "bbox": {"l": 232.29153, "t": 263.52739999999994, "r": 240.04287999999997, "b": 267.88531, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "152", "bbox": {"l": 256.88446, "t": 263.52739999999994, "r": 264.6358, "b": 267.88531, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "244", "bbox": {"l": 281.47742, "t": 263.52739999999994, "r": 289.22876, "b": 267.88531, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "\u81ea\u7136\u8a00\u8a9e\u51e6\u7406\u7814\u7a76\u4f1a\u7b2c", "bbox": {"l": 55.53052099999999, "t": 271.73785, "r": 107.38374, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "146", "bbox": {"l": 101.99034, "t": 271.52881, "r": 109.74168000000002, "b": 275.88671999999997, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "\u301c", "bbox": {"l": 109.74204, "t": 271.73785, "r": 114.92695000000002, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "155", "bbox": {"l": 114.38793, "t": 271.52881, "r": 122.13927, "b": 275.88671999999997, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "\u56de", "bbox": {"l": 122.13963, "t": 271.73785, "r": 127.32454000000001, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "98", "bbox": {"l": 184.39731, "t": 270.75446, "r": 189.56456, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "2", "bbox": {"l": 210.28223, "t": 270.75446, "r": 212.86539, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "96", "bbox": {"l": 233.58348, "t": 270.75446, "r": 238.75072999999998, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "150", "bbox": {"l": 256.88446, "t": 270.75446, "r": 264.6358, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "232", "bbox": {"l": 281.47742, "t": 270.75446, "r": 289.22876, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "WWW", "bbox": {"l": 55.53052099999999, "t": 279.01392, "r": 68.68605, "b": 283.37183, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "\u304b\u3089\u53ce\u96c6\u3057\u305f\u8ad6\u6587", "bbox": {"l": 68.685814, "t": 279.22295999999994, "r": 110.16829999999999, "b": 283.40436, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "107", "bbox": {"l": 183.10536, "t": 277.98157000000003, "r": 190.8567, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "73", "bbox": {"l": 208.99026, "t": 277.98157000000003, "r": 214.15752, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "34", "bbox": {"l": 233.58348, "t": 277.98157000000003, "r": 238.75072999999998, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "147", "bbox": {"l": 256.88446, "t": 277.98157000000003, "r": 264.6358, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "96", "bbox": {"l": 282.76938, "t": 277.98157000000003, "r": 287.93661, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "\u8a08", "bbox": {"l": 169.61508, "t": 286.45004, "r": 174.79999, "b": 290.63141, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "945", "bbox": {"l": 183.10536, "t": 285.46667, "r": 190.8567, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "294", "bbox": {"l": 207.69832, "t": 285.46667, "r": 215.44965999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "651", "bbox": {"l": 232.29153, "t": 285.46667, "r": 240.04287999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "1122", "bbox": {"l": 255.76506, "t": 285.46667, "r": 265.75204, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "955", "bbox": {"l": 281.47742, "t": 285.46667, "r": 289.22876, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}], "children": [{"id": 32, "label": "text", "bbox": {"l": 209.93285, "t": 222.18073000000004, "r": 241.04458999999997, "b": 226.36212, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": "\u8ad6\u6587\u30d5\u30a1\u30a4\u30eb", "bbox": {"l": 209.93285, "t": 222.18073000000004, "r": 241.04458999999997, "b": 226.36212, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 263.76489, "t": 222.18073000000004, "r": 284.50589, "b": 226.36212, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "\u53c2\u8003\u6587\u732e", "bbox": {"l": 263.76489, "t": 222.18073000000004, "r": 284.50589, "b": 226.36212, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 110.24990999999999, "t": 229.66594999999995, "r": 120.62018, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "\u51fa\u5178", "bbox": {"l": 110.24990999999999, "t": 229.66594999999995, "r": 120.62018, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 175.36609, "t": 229.66594999999995, "r": 196.1071, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "\u30d5\u30a1\u30a4\u30eb", "bbox": {"l": 175.36609, "t": 229.66594999999995, "r": 196.1071, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 196.10756, "t": 229.66594999999995, "r": 201.29247, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "\u6570", "bbox": {"l": 196.10756, "t": 229.66594999999995, "r": 201.29247, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 209.62408, "t": 229.66594999999995, "r": 219.99435, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "\u82f1\u8a9e", "bbox": {"l": 209.62408, "t": 229.66594999999995, "r": 219.99435, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 229.19814, "t": 229.66594999999995, "r": 244.75377, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "\u65e5\u672c\u8a9e", "bbox": {"l": 229.19814, "t": 229.66594999999995, "r": 244.75377, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 256.1142, "t": 229.66594999999995, "r": 266.48447, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "\u82f1\u8a9e", "bbox": {"l": 256.1142, "t": 229.66594999999995, "r": 266.48447, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 278.38434, "t": 229.66594999999995, "r": 293.93997, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "\u65e5\u672c\u8a9e", "bbox": {"l": 278.38434, "t": 229.66594999999995, "r": 293.93997, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 55.53052099999999, "t": 236.42584, "r": 162.7131, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "Association for Computational Linguistics(ACL2003)", "bbox": {"l": 55.53052099999999, "t": 236.42584, "r": 162.7131, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 184.39731, "t": 236.42584, "r": 189.56456, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "65", "bbox": {"l": 184.39731, "t": 236.42584, "r": 189.56456, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 208.99026, "t": 236.42584, "r": 214.15752, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "65", "bbox": {"l": 208.99026, "t": 236.42584, "r": 214.15752, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 234.87517, "t": 236.42584, "r": 237.45833000000002, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "0", "bbox": {"l": 234.87517, "t": 236.42584, "r": 237.45833000000002, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 256.88446, "t": 236.42584, "r": 264.6358, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "150", "bbox": {"l": 256.88446, "t": 236.42584, "r": 264.6358, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 284.06134, "t": 236.42584, "r": 286.6445, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "0", "bbox": {"l": 284.06134, "t": 236.42584, "r": 286.6445, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 55.53052099999999, "t": 242.62048000000004, "r": 139.72253, "b": 246.97839, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "Computational Linguistics(COLING2002)", "bbox": {"l": 55.53052099999999, "t": 242.62048000000004, "r": 139.72253, "b": 246.97839, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 183.10536, "t": 242.62048000000004, "r": 190.8567, "b": 246.97839, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "140", "bbox": {"l": 183.10536, "t": 242.62048000000004, "r": 190.8567, "b": 246.97839, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 207.69832, "t": 242.62048000000004, "r": 215.44965999999997, "b": 246.97839, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "140", "bbox": {"l": 207.69832, "t": 242.62048000000004, "r": 215.44965999999997, "b": 246.97839, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 234.87517, "t": 242.62048000000004, "r": 237.45833000000002, "b": 246.97839, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "0", "bbox": {"l": 234.87517, "t": 242.62048000000004, "r": 237.45833000000002, "b": 246.97839, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 256.88446, "t": 242.62048000000004, "r": 264.6358, "b": 246.97839, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "150", "bbox": {"l": 256.88446, "t": 242.62048000000004, "r": 264.6358, "b": 246.97839, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 284.06134, "t": 242.62048000000004, "r": 286.6445, "b": 246.97839, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "0", "bbox": {"l": 284.06134, "t": 242.62048000000004, "r": 286.6445, "b": 246.97839, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 55.53052099999999, "t": 249.79845999999998, "r": 97.013, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "\u96fb\u6c17\u60c5\u5831\u901a\u4fe1\u5b66\u4f1a", "bbox": {"l": 55.53052099999999, "t": 249.79845999999998, "r": 97.013, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 92.698288, "t": 249.58942000000002, "r": 103.03371, "b": 253.94732999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "2003", "bbox": {"l": 92.698288, "t": 249.58942000000002, "r": 103.03371, "b": 253.94732999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 103.03389, "t": 249.79845999999998, "r": 128.96027, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "\u5e74\u7dcf\u5408\u5927\u4f1a", "bbox": {"l": 103.03389, "t": 249.79845999999998, "r": 128.96027, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 183.10536, "t": 248.81506000000002, "r": 190.8567, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "150", "bbox": {"l": 183.10536, "t": 248.81506000000002, "r": 190.8567, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 210.28223, "t": 248.81506000000002, "r": 212.86539, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "8", "bbox": {"l": 210.28223, "t": 248.81506000000002, "r": 212.86539, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 232.29153, "t": 248.81506000000002, "r": 240.04287999999997, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "142", "bbox": {"l": 232.29153, "t": 248.81506000000002, "r": 240.04287999999997, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 256.88446, "t": 248.81506000000002, "r": 264.6358, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "223", "bbox": {"l": 256.88446, "t": 248.81506000000002, "r": 264.6358, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 281.47742, "t": 248.81506000000002, "r": 289.22876, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "147", "bbox": {"l": 281.47742, "t": 248.81506000000002, "r": 289.22876, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 55.53052099999999, "t": 257.28369, "r": 91.827637, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "\u60c5\u5831\u51e6\u7406\u5b66\u4f1a\u7b2c", "bbox": {"l": 55.53052099999999, "t": 257.28369, "r": 91.827637, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 88.052673, "t": 257.07465, "r": 93.219925, "b": 261.43255999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "65", "bbox": {"l": 88.052673, "t": 257.07465, "r": 93.219925, "b": 261.43255999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 93.220474, "t": 257.28369, "r": 119.14685, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "\u56de\u5168\u56fd\u5927\u4f1a", "bbox": {"l": 93.220474, "t": 257.28369, "r": 119.14685, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 116.45073999999998, "t": 257.07465, "r": 129.88177, "b": 261.43255999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "(2003)", "bbox": {"l": 116.45073999999998, "t": 257.07465, "r": 129.88177, "b": 261.43255999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 183.10536, "t": 256.30029, "r": 190.8567, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "177", "bbox": {"l": 183.10536, "t": 256.30029, "r": 190.8567, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 210.28223, "t": 256.30029, "r": 212.86539, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "1", "bbox": {"l": 210.28223, "t": 256.30029, "r": 212.86539, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 232.29153, "t": 256.30029, "r": 240.04287999999997, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "176", "bbox": {"l": 232.29153, "t": 256.30029, "r": 240.04287999999997, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 256.88446, "t": 256.30029, "r": 264.6358, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "150", "bbox": {"l": 256.88446, "t": 256.30029, "r": 264.6358, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 281.47742, "t": 256.30029, "r": 289.22876, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "236", "bbox": {"l": 281.47742, "t": 256.30029, "r": 289.22876, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 55.53052099999999, "t": 264.5108, "r": 60.715424, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "\u7b2c", "bbox": {"l": 55.53052099999999, "t": 264.5108, "r": 60.715424, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 60.17654799999999, "t": 264.30175999999994, "r": 65.343796, "b": 268.65967, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "17", "bbox": {"l": 60.17654799999999, "t": 264.30175999999994, "r": 65.343796, "b": 268.65967, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 65.344376, "t": 264.5108, "r": 122.38297000000001, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "\u56de\u4eba\u5de5\u77e5\u80fd\u5b66\u4f1a\u5168\u56fd\u5927\u4f1a", "bbox": {"l": 65.344376, "t": 264.5108, "r": 122.38297000000001, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 116.45073999999998, "t": 264.30175999999994, "r": 129.88177, "b": 268.65967, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "(2003)", "bbox": {"l": 116.45073999999998, "t": 264.30175999999994, "r": 129.88177, "b": 268.65967, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 183.10536, "t": 263.52739999999994, "r": 190.8567, "b": 267.88531, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "208", "bbox": {"l": 183.10536, "t": 263.52739999999994, "r": 190.8567, "b": 267.88531, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 210.28223, "t": 263.52739999999994, "r": 212.86539, "b": 267.88531, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "5", "bbox": {"l": 210.28223, "t": 263.52739999999994, "r": 212.86539, "b": 267.88531, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 232.29153, "t": 263.52739999999994, "r": 240.04287999999997, "b": 267.88531, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "203", "bbox": {"l": 232.29153, "t": 263.52739999999994, "r": 240.04287999999997, "b": 267.88531, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 256.88446, "t": 263.52739999999994, "r": 264.6358, "b": 267.88531, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "152", "bbox": {"l": 256.88446, "t": 263.52739999999994, "r": 264.6358, "b": 267.88531, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 281.47742, "t": 263.52739999999994, "r": 289.22876, "b": 267.88531, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "244", "bbox": {"l": 281.47742, "t": 263.52739999999994, "r": 289.22876, "b": 267.88531, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 55.53052099999999, "t": 271.73785, "r": 107.38374, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "\u81ea\u7136\u8a00\u8a9e\u51e6\u7406\u7814\u7a76\u4f1a\u7b2c", "bbox": {"l": 55.53052099999999, "t": 271.73785, "r": 107.38374, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 101.99034, "t": 271.52881, "r": 109.74168000000002, "b": 275.88671999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "146", "bbox": {"l": 101.99034, "t": 271.52881, "r": 109.74168000000002, "b": 275.88671999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 109.74204, "t": 271.73785, "r": 114.92695000000002, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "\u301c", "bbox": {"l": 109.74204, "t": 271.73785, "r": 114.92695000000002, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 114.38793, "t": 271.52881, "r": 122.13927, "b": 275.88671999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "155", "bbox": {"l": 114.38793, "t": 271.52881, "r": 122.13927, "b": 275.88671999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 122.13963, "t": 271.73785, "r": 127.32454000000001, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "\u56de", "bbox": {"l": 122.13963, "t": 271.73785, "r": 127.32454000000001, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 184.39731, "t": 270.75446, "r": 189.56456, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "98", "bbox": {"l": 184.39731, "t": 270.75446, "r": 189.56456, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 210.28223, "t": 270.75446, "r": 212.86539, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "2", "bbox": {"l": 210.28223, "t": 270.75446, "r": 212.86539, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 233.58348, "t": 270.75446, "r": 238.75072999999998, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "96", "bbox": {"l": 233.58348, "t": 270.75446, "r": 238.75072999999998, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 256.88446, "t": 270.75446, "r": 264.6358, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "150", "bbox": {"l": 256.88446, "t": 270.75446, "r": 264.6358, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 281.47742, "t": 270.75446, "r": 289.22876, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "232", "bbox": {"l": 281.47742, "t": 270.75446, "r": 289.22876, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 55.53052099999999, "t": 279.01392, "r": 68.68605, "b": 283.37183, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "WWW", "bbox": {"l": 55.53052099999999, "t": 279.01392, "r": 68.68605, "b": 283.37183, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 68.685814, "t": 279.22295999999994, "r": 110.16829999999999, "b": 283.40436, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "\u304b\u3089\u53ce\u96c6\u3057\u305f\u8ad6\u6587", "bbox": {"l": 68.685814, "t": 279.22295999999994, "r": 110.16829999999999, "b": 283.40436, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 183.10536, "t": 277.98157000000003, "r": 190.8567, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "107", "bbox": {"l": 183.10536, "t": 277.98157000000003, "r": 190.8567, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 208.99026, "t": 277.98157000000003, "r": 214.15752, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "73", "bbox": {"l": 208.99026, "t": 277.98157000000003, "r": 214.15752, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 233.58348, "t": 277.98157000000003, "r": 238.75072999999998, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "34", "bbox": {"l": 233.58348, "t": 277.98157000000003, "r": 238.75072999999998, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 256.88446, "t": 277.98157000000003, "r": 264.6358, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "147", "bbox": {"l": 256.88446, "t": 277.98157000000003, "r": 264.6358, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 282.76938, "t": 277.98157000000003, "r": 287.93661, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "96", "bbox": {"l": 282.76938, "t": 277.98157000000003, "r": 287.93661, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 169.61508, "t": 286.45004, "r": 174.79999, "b": 290.63141, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "\u8a08", "bbox": {"l": 169.61508, "t": 286.45004, "r": 174.79999, "b": 290.63141, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 183.10536, "t": 285.46667, "r": 190.8567, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "945", "bbox": {"l": 183.10536, "t": 285.46667, "r": 190.8567, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 207.69832, "t": 285.46667, "r": 215.44965999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "294", "bbox": {"l": 207.69832, "t": 285.46667, "r": 215.44965999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 232.29153, "t": 285.46667, "r": 240.04287999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "651", "bbox": {"l": 232.29153, "t": 285.46667, "r": 240.04287999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 255.76506, "t": 285.46667, "r": 265.75204, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "1122", "bbox": {"l": 255.76506, "t": 285.46667, "r": 265.75204, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 281.47742, "t": 285.46667, "r": 289.22876, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "955", "bbox": {"l": 281.47742, "t": 285.46667, "r": 289.22876, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "lcel", "ched", "lcel", "nl", "ched", "ched", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 10, "num_cols": 6, "table_cells": [{"bbox": {"l": 209.93285, "t": 222.18073000000004, "r": 241.04458999999997, "b": 226.36212, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 4, "text": "\u8ad6\u6587\u30d5\u30a1\u30a4\u30eb", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 263.76489, "t": 222.18073000000004, "r": 284.50589, "b": 226.36212, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 4, "end_col_offset_idx": 6, "text": "\u53c2\u8003\u6587\u732e", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 110.24990999999999, "t": 229.66594999999995, "r": 120.62018, "b": 233.84735, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "\u51fa\u5178", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 175.36609, "t": 229.66594999999995, "r": 201.29247, "b": 233.84735, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "\u30d5\u30a1\u30a4\u30eb \u6570", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 209.62408, "t": 229.66594999999995, "r": 219.99435, "b": 233.84735, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "\u82f1\u8a9e", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 229.19814, "t": 229.66594999999995, "r": 244.75377, "b": 233.84735, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "\u65e5\u672c\u8a9e", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 256.1142, "t": 229.66594999999995, "r": 266.48447, "b": 233.84735, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "\u82f1\u8a9e", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 278.38434, "t": 229.66594999999995, "r": 293.93997, "b": 233.84735, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "\u65e5\u672c\u8a9e", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 55.53052099999999, "t": 236.42584, "r": 162.7131, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Association for Computational Linguistics(ACL2003)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 184.39731, "t": 236.42584, "r": 189.56456, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "65", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 208.99026, "t": 236.42584, "r": 214.15752, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "65", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 234.87517, "t": 236.42584, "r": 237.45833000000002, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446, "t": 236.42584, "r": 264.6358, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "150", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 284.06134, "t": 236.42584, "r": 286.6445, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 55.53052099999999, "t": 242.62048000000004, "r": 139.72253, "b": 246.97839, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Computational Linguistics(COLING2002)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 183.10536, "t": 242.62048000000004, "r": 190.8567, "b": 246.97839, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "140", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 207.69832, "t": 242.62048000000004, "r": 215.44965999999997, "b": 246.97839, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "140", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 234.87517, "t": 242.62048000000004, "r": 237.45833000000002, "b": 246.97839, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446, "t": 242.62048000000004, "r": 264.6358, "b": 246.97839, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "150", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 284.06134, "t": 242.62048000000004, "r": 286.6445, "b": 246.97839, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 55.53052099999999, "t": 249.58942000000002, "r": 128.96027, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "\u96fb\u6c17\u60c5\u5831\u901a\u4fe1\u5b66\u4f1a 2003 \u5e74\u7dcf\u5408\u5927\u4f1a", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 183.10536, "t": 248.81506000000002, "r": 190.8567, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "150", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 210.28223, "t": 248.81506000000002, "r": 212.86539, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.29153, "t": 248.81506000000002, "r": 240.04287999999997, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "142", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446, "t": 248.81506000000002, "r": 264.6358, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "223", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.47742, "t": 248.81506000000002, "r": 289.22876, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "147", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 55.53052099999999, "t": 257.07465, "r": 129.88177, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "\u60c5\u5831\u51e6\u7406\u5b66\u4f1a\u7b2c 65 \u56de\u5168\u56fd\u5927\u4f1a (2003)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 183.10536, "t": 256.30029, "r": 190.8567, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "177", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 210.28223, "t": 256.30029, "r": 212.86539, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.29153, "t": 256.30029, "r": 240.04287999999997, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "176", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446, "t": 256.30029, "r": 264.6358, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "150", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.47742, "t": 256.30029, "r": 289.22876, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "236", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 55.53052099999999, "t": 264.30175999999994, "r": 129.88177, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "\u7b2c 17 \u56de\u4eba\u5de5\u77e5\u80fd\u5b66\u4f1a\u5168\u56fd\u5927\u4f1a (2003)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 183.10536, "t": 263.52739999999994, "r": 190.8567, "b": 267.88531, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "208", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 210.28223, "t": 263.52739999999994, "r": 212.86539, "b": 267.88531, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.29153, "t": 263.52739999999994, "r": 240.04287999999997, "b": 267.88531, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "203", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446, "t": 263.52739999999994, "r": 264.6358, "b": 267.88531, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "152", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.47742, "t": 263.52739999999994, "r": 289.22876, "b": 267.88531, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "244", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 55.53052099999999, "t": 271.52881, "r": 127.32454000000001, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "\u81ea\u7136\u8a00\u8a9e\u51e6\u7406\u7814\u7a76\u4f1a\u7b2c 146 \u301c 155 \u56de", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 184.39731, "t": 270.75446, "r": 189.56456, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "98", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 210.28223, "t": 270.75446, "r": 212.86539, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 233.58348, "t": 270.75446, "r": 238.75072999999998, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446, "t": 270.75446, "r": 264.6358, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "150", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.47742, "t": 270.75446, "r": 289.22876, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "232", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 55.53052099999999, "t": 279.01392, "r": 110.16829999999999, "b": 283.40436, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "WWW \u304b\u3089\u53ce\u96c6\u3057\u305f\u8ad6\u6587", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 183.10536, "t": 277.98157000000003, "r": 190.8567, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "107", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 208.99026, "t": 277.98157000000003, "r": 214.15752, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "73", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 233.58348, "t": 277.98157000000003, "r": 238.75072999999998, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "34", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446, "t": 277.98157000000003, "r": 264.6358, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "147", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 282.76938, "t": 277.98157000000003, "r": 287.93661, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 183.10536, "t": 285.46667, "r": 190.8567, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "945", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 207.69832, "t": 285.46667, "r": 215.44965999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "294", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.29153, "t": 285.46667, "r": 240.04287999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "651", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 255.76506, "t": 285.46667, "r": 265.75204, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "1122", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.47742, "t": 285.46667, "r": 289.22876, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "955", "column_header": false, "row_header": false, "row_section": false}]}, "7": {"label": "table", "id": 7, "page_no": 7, "cluster": {"id": 7, "label": "table", "bbox": {"l": 304.9219970703125, "t": 218.51486206054688, "r": 550.2321166992188, "b": 287.90069580078125, "coord_origin": "TOPLEFT"}, "confidence": 0.8899765014648438, "cells": [{"id": 77, "text": "Weighted Average Grant Date Fair", "bbox": {"l": 459.04861, "t": 221.62415, "r": 542.00018, "b": 226.68933000000004, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "Value", "bbox": {"l": 493.82193, "t": 227.83416999999997, "r": 507.2258, "b": 232.89935000000003, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "RS", "bbox": {"l": 393.2442, "t": 236.74712999999997, "r": 400.74588, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "U", "bbox": {"l": 400.74643, "t": 236.74712999999997, "r": 404.64523, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "s", "bbox": {"l": 404.6463, "t": 236.74712999999997, "r": 407.34631, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "Shares (in millions)", "bbox": {"l": 392.09671, "t": 221.57446000000004, "r": 438.0145, "b": 226.63964999999996, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "PSUs", "bbox": {"l": 427.18323, "t": 236.74712999999997, "r": 440.98778999999996, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "RSUs", "bbox": {"l": 468.38254, "t": 236.74712999999997, "r": 482.48465000000004, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "PSUs", "bbox": {"l": 516.92578, "t": 236.74712999999997, "r": 530.73035, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Nonvested on Janua", "bbox": {"l": 306.11493, "t": 244.61084000000005, "r": 355.6532, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "ry 1", "bbox": {"l": 355.65427, "t": 244.61084000000005, "r": 364.65607, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "1.", "bbox": {"l": 396.24661, "t": 244.91327, "r": 400.75238, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "1", "bbox": {"l": 400.7529, "t": 244.91327, "r": 403.75531, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "0.3", "bbox": {"l": 429.81838999999997, "t": 244.91327, "r": 437.32708999999994, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "90.10", "bbox": {"l": 465.52859, "t": 244.91327, "r": 478.40103, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "$", "bbox": {"l": 480.97552, "t": 244.91327, "r": 483.55001999999996, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "$ 91.19", "bbox": {"l": 513.44824, "t": 244.91327, "r": 531.46967, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "Granted", "bbox": {"l": 306.11493, "t": 253.68451000000005, "r": 325.62674, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "0.", "bbox": {"l": 396.24661, "t": 253.68451000000005, "r": 400.75238, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "5", "bbox": {"l": 400.7529, "t": 253.68451000000005, "r": 403.75531, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "0.1", "bbox": {"l": 429.81838999999997, "t": 253.68451000000005, "r": 437.32708999999994, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "117.44", "bbox": {"l": 466.43579000000005, "t": 253.68451000000005, "r": 482.54831, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "122.41", "bbox": {"l": 514.29065, "t": 253.68451000000005, "r": 530.80981, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "Vested", "bbox": {"l": 306.11493, "t": 261.54822, "r": 322.62866, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "(0.", "bbox": {"l": 394.43222, "t": 261.54822, "r": 400.73563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "5", "bbox": {"l": 400.73456, "t": 261.54822, "r": 403.73697, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": ")", "bbox": {"l": 403.73804, "t": 261.54822, "r": 405.53625, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "(0.1)", "bbox": {"l": 427.7016, "t": 261.54822, "r": 438.80563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "87.08", "bbox": {"l": 468.55533, "t": 261.54822, "r": 482.07043, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "81.14", "bbox": {"l": 516.01862, "t": 261.54822, "r": 529.53375, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "Canceled or forfeited", "bbox": {"l": 306.11493, "t": 269.64148, "r": 356.24771, "b": 274.70667000000003, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "(0.", "bbox": {"l": 394.43222, "t": 270.31946000000005, "r": 400.73563, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "1", "bbox": {"l": 400.73456, "t": 270.31946000000005, "r": 403.73697, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": ")", "bbox": {"l": 403.73804, "t": 270.31946000000005, "r": 405.53625, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "-", "bbox": {"l": 431.02802, "t": 270.31946000000005, "r": 436.4280099999999, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "102.01", "bbox": {"l": 465.83099000000004, "t": 270.31946000000005, "r": 482.35013, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "92.18", "bbox": {"l": 516.01862, "t": 270.31946000000005, "r": 529.53375, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "Nonvested on December 31", "bbox": {"l": 306.11493, "t": 278.48572, "r": 373.35764, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "1.0", "bbox": {"l": 396.24661, "t": 278.48572, "r": 403.75531, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "0.3", "bbox": {"l": 429.51599, "t": 278.48572, "r": 437.02469, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "104.85 $", "bbox": {"l": 463.7142, "t": 278.48572, "r": 484.73965000000004, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "$ 104.51", "bbox": {"l": 512.99463, "t": 278.48572, "r": 534.02008, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}], "children": [{"id": 102, "label": "text", "bbox": {"l": 459.04861, "t": 221.62415, "r": 542.00018, "b": 226.68933000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "Weighted Average Grant Date Fair", "bbox": {"l": 459.04861, "t": 221.62415, "r": 542.00018, "b": 226.68933000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 493.82193, "t": 227.83416999999997, "r": 507.2258, "b": 232.89935000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "Value", "bbox": {"l": 493.82193, "t": 227.83416999999997, "r": 507.2258, "b": 232.89935000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 393.2442, "t": 236.74712999999997, "r": 400.74588, "b": 241.81232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "RS", "bbox": {"l": 393.2442, "t": 236.74712999999997, "r": 400.74588, "b": 241.81232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 400.74643, "t": 236.74712999999997, "r": 404.64523, "b": 241.81232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "U", "bbox": {"l": 400.74643, "t": 236.74712999999997, "r": 404.64523, "b": 241.81232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 404.6463, "t": 236.74712999999997, "r": 407.34631, "b": 241.81232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "s", "bbox": {"l": 404.6463, "t": 236.74712999999997, "r": 407.34631, "b": 241.81232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 392.09671, "t": 221.57446000000004, "r": 438.0145, "b": 226.63964999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "Shares (in millions)", "bbox": {"l": 392.09671, "t": 221.57446000000004, "r": 438.0145, "b": 226.63964999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 427.18323, "t": 236.74712999999997, "r": 440.98778999999996, "b": 241.81232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "PSUs", "bbox": {"l": 427.18323, "t": 236.74712999999997, "r": 440.98778999999996, "b": 241.81232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 468.38254, "t": 236.74712999999997, "r": 482.48465000000004, "b": 241.81232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "RSUs", "bbox": {"l": 468.38254, "t": 236.74712999999997, "r": 482.48465000000004, "b": 241.81232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 516.92578, "t": 236.74712999999997, "r": 530.73035, "b": 241.81232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "PSUs", "bbox": {"l": 516.92578, "t": 236.74712999999997, "r": 530.73035, "b": 241.81232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 306.11493, "t": 244.61084000000005, "r": 355.6532, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "Nonvested on Janua", "bbox": {"l": 306.11493, "t": 244.61084000000005, "r": 355.6532, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 355.65427, "t": 244.61084000000005, "r": 364.65607, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "ry 1", "bbox": {"l": 355.65427, "t": 244.61084000000005, "r": 364.65607, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 396.24661, "t": 244.91327, "r": 400.75238, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "1.", "bbox": {"l": 396.24661, "t": 244.91327, "r": 400.75238, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 114, "label": "text", "bbox": {"l": 400.7529, "t": 244.91327, "r": 403.75531, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "1", "bbox": {"l": 400.7529, "t": 244.91327, "r": 403.75531, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 115, "label": "text", "bbox": {"l": 429.81838999999997, "t": 244.91327, "r": 437.32708999999994, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "0.3", "bbox": {"l": 429.81838999999997, "t": 244.91327, "r": 437.32708999999994, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 116, "label": "text", "bbox": {"l": 465.52859, "t": 244.91327, "r": 478.40103, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "90.10", "bbox": {"l": 465.52859, "t": 244.91327, "r": 478.40103, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 117, "label": "text", "bbox": {"l": 480.97552, "t": 244.91327, "r": 483.55001999999996, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "$", "bbox": {"l": 480.97552, "t": 244.91327, "r": 483.55001999999996, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 118, "label": "text", "bbox": {"l": 513.44824, "t": 244.91327, "r": 531.46967, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "$ 91.19", "bbox": {"l": 513.44824, "t": 244.91327, "r": 531.46967, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 119, "label": "text", "bbox": {"l": 306.11493, "t": 253.68451000000005, "r": 325.62674, "b": 258.74969, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "Granted", "bbox": {"l": 306.11493, "t": 253.68451000000005, "r": 325.62674, "b": 258.74969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 120, "label": "text", "bbox": {"l": 396.24661, "t": 253.68451000000005, "r": 400.75238, "b": 258.74969, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "0.", "bbox": {"l": 396.24661, "t": 253.68451000000005, "r": 400.75238, "b": 258.74969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 121, "label": "text", "bbox": {"l": 400.7529, "t": 253.68451000000005, "r": 403.75531, "b": 258.74969, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "5", "bbox": {"l": 400.7529, "t": 253.68451000000005, "r": 403.75531, "b": 258.74969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 122, "label": "text", "bbox": {"l": 429.81838999999997, "t": 253.68451000000005, "r": 437.32708999999994, "b": 258.74969, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "0.1", "bbox": {"l": 429.81838999999997, "t": 253.68451000000005, "r": 437.32708999999994, "b": 258.74969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 123, "label": "text", "bbox": {"l": 466.43579000000005, "t": 253.68451000000005, "r": 482.54831, "b": 258.74969, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "117.44", "bbox": {"l": 466.43579000000005, "t": 253.68451000000005, "r": 482.54831, "b": 258.74969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 124, "label": "text", "bbox": {"l": 514.29065, "t": 253.68451000000005, "r": 530.80981, "b": 258.74969, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "122.41", "bbox": {"l": 514.29065, "t": 253.68451000000005, "r": 530.80981, "b": 258.74969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 125, "label": "text", "bbox": {"l": 306.11493, "t": 261.54822, "r": 322.62866, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "Vested", "bbox": {"l": 306.11493, "t": 261.54822, "r": 322.62866, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 126, "label": "text", "bbox": {"l": 394.43222, "t": 261.54822, "r": 400.73563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "(0.", "bbox": {"l": 394.43222, "t": 261.54822, "r": 400.73563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 127, "label": "text", "bbox": {"l": 400.73456, "t": 261.54822, "r": 403.73697, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "5", "bbox": {"l": 400.73456, "t": 261.54822, "r": 403.73697, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 128, "label": "text", "bbox": {"l": 403.73804, "t": 261.54822, "r": 405.53625, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": ")", "bbox": {"l": 403.73804, "t": 261.54822, "r": 405.53625, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 129, "label": "text", "bbox": {"l": 427.7016, "t": 261.54822, "r": 438.80563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "(0.1)", "bbox": {"l": 427.7016, "t": 261.54822, "r": 438.80563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 130, "label": "text", "bbox": {"l": 468.55533, "t": 261.54822, "r": 482.07043, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "87.08", "bbox": {"l": 468.55533, "t": 261.54822, "r": 482.07043, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 131, "label": "text", "bbox": {"l": 516.01862, "t": 261.54822, "r": 529.53375, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": "81.14", "bbox": {"l": 516.01862, "t": 261.54822, "r": 529.53375, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 132, "label": "text", "bbox": {"l": 306.11493, "t": 269.64148, "r": 356.24771, "b": 274.70667000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 107, "text": "Canceled or forfeited", "bbox": {"l": 306.11493, "t": 269.64148, "r": 356.24771, "b": 274.70667000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 133, "label": "text", "bbox": {"l": 394.43222, "t": 270.31946000000005, "r": 400.73563, "b": 275.38464, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 108, "text": "(0.", "bbox": {"l": 394.43222, "t": 270.31946000000005, "r": 400.73563, "b": 275.38464, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 134, "label": "text", "bbox": {"l": 400.73456, "t": 270.31946000000005, "r": 403.73697, "b": 275.38464, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 109, "text": "1", "bbox": {"l": 400.73456, "t": 270.31946000000005, "r": 403.73697, "b": 275.38464, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 135, "label": "text", "bbox": {"l": 403.73804, "t": 270.31946000000005, "r": 405.53625, "b": 275.38464, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 110, "text": ")", "bbox": {"l": 403.73804, "t": 270.31946000000005, "r": 405.53625, "b": 275.38464, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 136, "label": "text", "bbox": {"l": 431.02802, "t": 270.31946000000005, "r": 436.4280099999999, "b": 275.38464, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 111, "text": "-", "bbox": {"l": 431.02802, "t": 270.31946000000005, "r": 436.4280099999999, "b": 275.38464, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 137, "label": "text", "bbox": {"l": 465.83099000000004, "t": 270.31946000000005, "r": 482.35013, "b": 275.38464, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 112, "text": "102.01", "bbox": {"l": 465.83099000000004, "t": 270.31946000000005, "r": 482.35013, "b": 275.38464, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 138, "label": "text", "bbox": {"l": 516.01862, "t": 270.31946000000005, "r": 529.53375, "b": 275.38464, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 113, "text": "92.18", "bbox": {"l": 516.01862, "t": 270.31946000000005, "r": 529.53375, "b": 275.38464, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 139, "label": "text", "bbox": {"l": 306.11493, "t": 278.48572, "r": 373.35764, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 114, "text": "Nonvested on December 31", "bbox": {"l": 306.11493, "t": 278.48572, "r": 373.35764, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 140, "label": "text", "bbox": {"l": 396.24661, "t": 278.48572, "r": 403.75531, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 115, "text": "1.0", "bbox": {"l": 396.24661, "t": 278.48572, "r": 403.75531, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 141, "label": "text", "bbox": {"l": 429.51599, "t": 278.48572, "r": 437.02469, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 116, "text": "0.3", "bbox": {"l": 429.51599, "t": 278.48572, "r": 437.02469, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 142, "label": "text", "bbox": {"l": 463.7142, "t": 278.48572, "r": 484.73965000000004, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 117, "text": "104.85 $", "bbox": {"l": 463.7142, "t": 278.48572, "r": 484.73965000000004, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 143, "label": "text", "bbox": {"l": 512.99463, "t": 278.48572, "r": 534.02008, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 118, "text": "$ 104.51", "bbox": {"l": 512.99463, "t": 278.48572, "r": 534.02008, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ecel", "ched", "lcel", "ched", "lcel", "nl", "ecel", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 7, "num_cols": 5, "table_cells": [{"bbox": {"l": 459.04861, "t": 221.62415, "r": 542.00018, "b": 232.89935000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 5, "text": "Weighted Average Grant Date Fair Value", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 393.2442, "t": 236.74712999999997, "r": 407.34631, "b": 241.81232, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "RS U s", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 392.09671, "t": 221.57446000000004, "r": 438.0145, "b": 226.63964999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 3, "text": "Shares (in millions)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 427.18323, "t": 236.74712999999997, "r": 440.98778999999996, "b": 241.81232, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "PSUs", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 468.38254, "t": 236.74712999999997, "r": 482.48465000000004, "b": 241.81232, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "RSUs", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 516.92578, "t": 236.74712999999997, "r": 530.73035, "b": 241.81232, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "PSUs", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 306.11493, "t": 244.61084000000005, "r": 364.65607, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Nonvested on Janua ry 1", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 396.24661, "t": 244.91327, "r": 403.75531, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "1. 1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 429.81838999999997, "t": 244.91327, "r": 437.32708999999994, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 465.52859, "t": 244.91327, "r": 483.55001999999996, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "90.10 $", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 513.44824, "t": 244.91327, "r": 531.46967, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "$ 91.19", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 306.11493, "t": 253.68451000000005, "r": 325.62674, "b": 258.74969, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Granted", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 396.24661, "t": 253.68451000000005, "r": 403.75531, "b": 258.74969, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "0. 5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 429.81838999999997, "t": 253.68451000000005, "r": 437.32708999999994, "b": 258.74969, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 466.43579000000005, "t": 253.68451000000005, "r": 482.54831, "b": 258.74969, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "117.44", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 514.29065, "t": 253.68451000000005, "r": 530.80981, "b": 258.74969, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "122.41", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 306.11493, "t": 261.54822, "r": 322.62866, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Vested", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 394.43222, "t": 261.54822, "r": 405.53625, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "(0. 5 )", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 427.7016, "t": 261.54822, "r": 438.80563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "(0.1)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 468.55533, "t": 261.54822, "r": 482.07043, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "87.08", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 516.01862, "t": 261.54822, "r": 529.53375, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "81.14", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 306.11493, "t": 269.64148, "r": 356.24771, "b": 274.70667000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Canceled or forfeited", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 394.43222, "t": 270.31946000000005, "r": 405.53625, "b": 275.38464, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "(0. 1 )", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 431.02802, "t": 270.31946000000005, "r": 436.4280099999999, "b": 275.38464, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 465.83099000000004, "t": 270.31946000000005, "r": 482.35013, "b": 275.38464, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "102.01", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 516.01862, "t": 270.31946000000005, "r": 529.53375, "b": 275.38464, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "92.18", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 306.11493, "t": 278.48572, "r": 373.35764, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Nonvested on December 31", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 396.24661, "t": 278.48572, "r": 403.75531, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "1.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 429.51599, "t": 278.48572, "r": 437.02469, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 463.7142, "t": 278.48572, "r": 484.73965000000004, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "104.85 $", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 512.99463, "t": 278.48572, "r": 534.02008, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "$ 104.51", "column_header": false, "row_header": false, "row_section": false}]}}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "caption", "id": 18, "page_no": 7, "cluster": {"id": 18, "label": "caption", "bbox": {"l": 53.811783000000005, "t": 208.23328000000004, "r": 385.93451, "b": 216.10645, "coord_origin": "TOPLEFT"}, "confidence": 0.5986502170562744, "cells": [{"id": 0, "text": "b.", "bbox": {"l": 53.811783000000005, "t": 208.23328000000004, "r": 62.219952, "b": 216.10645, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Structure predicted by TableFormer, with superimposed matched PDF cell text:", "bbox": {"l": 66.424026, "t": 208.23328000000004, "r": 385.93451, "b": 216.10645, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "b. Structure predicted by TableFormer, with superimposed matched PDF cell text:"}, {"label": "section_header", "id": 29, "page_no": 7, "cluster": {"id": 29, "label": "section_header", "bbox": {"l": 53.811783000000005, "t": 94.28112999999996, "r": 284.34592, "b": 102.15430000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.46452993154525757, "cells": [{"id": 2, "text": "Japanese language (previously unseen by TableFormer):", "bbox": {"l": 53.811783000000005, "t": 94.28112999999996, "r": 284.34592, "b": 102.15430000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Japanese language (previously unseen by TableFormer):"}, {"label": "section_header", "id": 31, "page_no": 7, "cluster": {"id": 31, "label": "section_header", "bbox": {"l": 304.83081, "t": 94.28112999999996, "r": 431.09119, "b": 102.15430000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.46292340755462646, "cells": [{"id": 3, "text": "Example table from FinTabNet:", "bbox": {"l": 304.83081, "t": 94.28112999999996, "r": 431.09119, "b": 102.15430000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Example table from FinTabNet:"}, {"label": "list_item", "id": 20, "page_no": 7, "cluster": {"id": 20, "label": "list_item", "bbox": {"l": 53.286037, "t": 78.68756000000008, "r": 61.550289, "b": 86.56073000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.5820133090019226, "cells": [{"id": 4, "text": "a.", "bbox": {"l": 53.286037, "t": 78.68756000000008, "r": 61.550289, "b": 86.56073000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "a."}, {"label": "list_item", "id": 21, "page_no": 7, "cluster": {"id": 21, "label": "list_item", "bbox": {"l": 65.682419, "t": 78.68756000000008, "r": 499.55563, "b": 86.56073000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.5412113666534424, "cells": [{"id": 5, "text": "Red - PDF cells, Green - predicted bounding boxes, Blue - post-processed predictions matched to PDF cells", "bbox": {"l": 65.682419, "t": 78.68756000000008, "r": 499.55563, "b": 86.56073000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Red - PDF cells, Green - predicted bounding boxes, Blue - post-processed predictions matched to PDF cells"}, {"label": "table", "id": 8, "page_no": 7, "cluster": {"id": 8, "label": "table", "bbox": {"l": 53.6285514831543, "t": 218.94854736328125, "r": 298.5574645996094, "b": 292.3999938964844, "coord_origin": "TOPLEFT"}, "confidence": 0.8824008107185364, "cells": [{"id": 6, "text": "\u8ad6\u6587\u30d5\u30a1\u30a4\u30eb", "bbox": {"l": 209.93285, "t": 222.18073000000004, "r": 241.04458999999997, "b": 226.36212, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "\u53c2\u8003\u6587\u732e", "bbox": {"l": 263.76489, "t": 222.18073000000004, "r": 284.50589, "b": 226.36212, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "\u51fa\u5178", "bbox": {"l": 110.24990999999999, "t": 229.66594999999995, "r": 120.62018, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "\u30d5\u30a1\u30a4\u30eb", "bbox": {"l": 175.36609, "t": 229.66594999999995, "r": 196.1071, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "\u6570", "bbox": {"l": 196.10756, "t": 229.66594999999995, "r": 201.29247, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "\u82f1\u8a9e", "bbox": {"l": 209.62408, "t": 229.66594999999995, "r": 219.99435, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "\u65e5\u672c\u8a9e", "bbox": {"l": 229.19814, "t": 229.66594999999995, "r": 244.75377, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "\u82f1\u8a9e", "bbox": {"l": 256.1142, "t": 229.66594999999995, "r": 266.48447, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "\u65e5\u672c\u8a9e", "bbox": {"l": 278.38434, "t": 229.66594999999995, "r": 293.93997, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Association for Computational Linguistics(ACL2003)", "bbox": {"l": 55.53052099999999, "t": 236.42584, "r": 162.7131, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "65", "bbox": {"l": 184.39731, "t": 236.42584, "r": 189.56456, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "65", "bbox": {"l": 208.99026, "t": 236.42584, "r": 214.15752, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "0", "bbox": {"l": 234.87517, "t": 236.42584, "r": 237.45833000000002, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "150", "bbox": {"l": 256.88446, "t": 236.42584, "r": 264.6358, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "0", "bbox": {"l": 284.06134, "t": 236.42584, "r": 286.6445, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Computational Linguistics(COLING2002)", "bbox": {"l": 55.53052099999999, "t": 242.62048000000004, "r": 139.72253, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "140", "bbox": {"l": 183.10536, "t": 242.62048000000004, "r": 190.8567, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "140", "bbox": {"l": 207.69832, "t": 242.62048000000004, "r": 215.44965999999997, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "0", "bbox": {"l": 234.87517, "t": 242.62048000000004, "r": 237.45833000000002, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "150", "bbox": {"l": 256.88446, "t": 242.62048000000004, "r": 264.6358, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "0", "bbox": {"l": 284.06134, "t": 242.62048000000004, "r": 286.6445, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "\u96fb\u6c17\u60c5\u5831\u901a\u4fe1\u5b66\u4f1a", "bbox": {"l": 55.53052099999999, "t": 249.79845999999998, "r": 97.013, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "2003", "bbox": {"l": 92.698288, "t": 249.58942000000002, "r": 103.03371, "b": 253.94732999999997, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "\u5e74\u7dcf\u5408\u5927\u4f1a", "bbox": {"l": 103.03389, "t": 249.79845999999998, "r": 128.96027, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "150", "bbox": {"l": 183.10536, "t": 248.81506000000002, "r": 190.8567, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "8", "bbox": {"l": 210.28223, "t": 248.81506000000002, "r": 212.86539, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "142", "bbox": {"l": 232.29153, "t": 248.81506000000002, "r": 240.04287999999997, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "223", "bbox": {"l": 256.88446, "t": 248.81506000000002, "r": 264.6358, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "147", "bbox": {"l": 281.47742, "t": 248.81506000000002, "r": 289.22876, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "\u60c5\u5831\u51e6\u7406\u5b66\u4f1a\u7b2c", "bbox": {"l": 55.53052099999999, "t": 257.28369, "r": 91.827637, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "65", "bbox": {"l": 88.052673, "t": 257.07465, "r": 93.219925, "b": 261.43255999999997, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "\u56de\u5168\u56fd\u5927\u4f1a", "bbox": {"l": 93.220474, "t": 257.28369, "r": 119.14685, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "(2003)", "bbox": {"l": 116.45073999999998, "t": 257.07465, "r": 129.88177, "b": 261.43255999999997, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "177", "bbox": {"l": 183.10536, "t": 256.30029, "r": 190.8567, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "1", "bbox": {"l": 210.28223, "t": 256.30029, "r": 212.86539, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "176", "bbox": {"l": 232.29153, "t": 256.30029, "r": 240.04287999999997, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "150", "bbox": {"l": 256.88446, "t": 256.30029, "r": 264.6358, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "236", "bbox": {"l": 281.47742, "t": 256.30029, "r": 289.22876, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "\u7b2c", "bbox": {"l": 55.53052099999999, "t": 264.5108, "r": 60.715424, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "17", "bbox": {"l": 60.17654799999999, "t": 264.30175999999994, "r": 65.343796, "b": 268.65967, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "\u56de\u4eba\u5de5\u77e5\u80fd\u5b66\u4f1a\u5168\u56fd\u5927\u4f1a", "bbox": {"l": 65.344376, "t": 264.5108, "r": 122.38297000000001, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "(2003)", "bbox": {"l": 116.45073999999998, "t": 264.30175999999994, "r": 129.88177, "b": 268.65967, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "208", "bbox": {"l": 183.10536, "t": 263.52739999999994, "r": 190.8567, "b": 267.88531, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "5", "bbox": {"l": 210.28223, "t": 263.52739999999994, "r": 212.86539, "b": 267.88531, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "203", "bbox": {"l": 232.29153, "t": 263.52739999999994, "r": 240.04287999999997, "b": 267.88531, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "152", "bbox": {"l": 256.88446, "t": 263.52739999999994, "r": 264.6358, "b": 267.88531, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "244", "bbox": {"l": 281.47742, "t": 263.52739999999994, "r": 289.22876, "b": 267.88531, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "\u81ea\u7136\u8a00\u8a9e\u51e6\u7406\u7814\u7a76\u4f1a\u7b2c", "bbox": {"l": 55.53052099999999, "t": 271.73785, "r": 107.38374, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "146", "bbox": {"l": 101.99034, "t": 271.52881, "r": 109.74168000000002, "b": 275.88671999999997, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "\u301c", "bbox": {"l": 109.74204, "t": 271.73785, "r": 114.92695000000002, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "155", "bbox": {"l": 114.38793, "t": 271.52881, "r": 122.13927, "b": 275.88671999999997, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "\u56de", "bbox": {"l": 122.13963, "t": 271.73785, "r": 127.32454000000001, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "98", "bbox": {"l": 184.39731, "t": 270.75446, "r": 189.56456, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "2", "bbox": {"l": 210.28223, "t": 270.75446, "r": 212.86539, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "96", "bbox": {"l": 233.58348, "t": 270.75446, "r": 238.75072999999998, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "150", "bbox": {"l": 256.88446, "t": 270.75446, "r": 264.6358, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "232", "bbox": {"l": 281.47742, "t": 270.75446, "r": 289.22876, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "WWW", "bbox": {"l": 55.53052099999999, "t": 279.01392, "r": 68.68605, "b": 283.37183, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "\u304b\u3089\u53ce\u96c6\u3057\u305f\u8ad6\u6587", "bbox": {"l": 68.685814, "t": 279.22295999999994, "r": 110.16829999999999, "b": 283.40436, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "107", "bbox": {"l": 183.10536, "t": 277.98157000000003, "r": 190.8567, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "73", "bbox": {"l": 208.99026, "t": 277.98157000000003, "r": 214.15752, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "34", "bbox": {"l": 233.58348, "t": 277.98157000000003, "r": 238.75072999999998, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "147", "bbox": {"l": 256.88446, "t": 277.98157000000003, "r": 264.6358, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "96", "bbox": {"l": 282.76938, "t": 277.98157000000003, "r": 287.93661, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "\u8a08", "bbox": {"l": 169.61508, "t": 286.45004, "r": 174.79999, "b": 290.63141, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "945", "bbox": {"l": 183.10536, "t": 285.46667, "r": 190.8567, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "294", "bbox": {"l": 207.69832, "t": 285.46667, "r": 215.44965999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "651", "bbox": {"l": 232.29153, "t": 285.46667, "r": 240.04287999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "1122", "bbox": {"l": 255.76506, "t": 285.46667, "r": 265.75204, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "955", "bbox": {"l": 281.47742, "t": 285.46667, "r": 289.22876, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}], "children": [{"id": 32, "label": "text", "bbox": {"l": 209.93285, "t": 222.18073000000004, "r": 241.04458999999997, "b": 226.36212, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": "\u8ad6\u6587\u30d5\u30a1\u30a4\u30eb", "bbox": {"l": 209.93285, "t": 222.18073000000004, "r": 241.04458999999997, "b": 226.36212, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 263.76489, "t": 222.18073000000004, "r": 284.50589, "b": 226.36212, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "\u53c2\u8003\u6587\u732e", "bbox": {"l": 263.76489, "t": 222.18073000000004, "r": 284.50589, "b": 226.36212, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 110.24990999999999, "t": 229.66594999999995, "r": 120.62018, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "\u51fa\u5178", "bbox": {"l": 110.24990999999999, "t": 229.66594999999995, "r": 120.62018, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 175.36609, "t": 229.66594999999995, "r": 196.1071, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "\u30d5\u30a1\u30a4\u30eb", "bbox": {"l": 175.36609, "t": 229.66594999999995, "r": 196.1071, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 196.10756, "t": 229.66594999999995, "r": 201.29247, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "\u6570", "bbox": {"l": 196.10756, "t": 229.66594999999995, "r": 201.29247, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 209.62408, "t": 229.66594999999995, "r": 219.99435, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "\u82f1\u8a9e", "bbox": {"l": 209.62408, "t": 229.66594999999995, "r": 219.99435, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 229.19814, "t": 229.66594999999995, "r": 244.75377, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "\u65e5\u672c\u8a9e", "bbox": {"l": 229.19814, "t": 229.66594999999995, "r": 244.75377, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 256.1142, "t": 229.66594999999995, "r": 266.48447, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "\u82f1\u8a9e", "bbox": {"l": 256.1142, "t": 229.66594999999995, "r": 266.48447, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 278.38434, "t": 229.66594999999995, "r": 293.93997, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "\u65e5\u672c\u8a9e", "bbox": {"l": 278.38434, "t": 229.66594999999995, "r": 293.93997, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 55.53052099999999, "t": 236.42584, "r": 162.7131, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "Association for Computational Linguistics(ACL2003)", "bbox": {"l": 55.53052099999999, "t": 236.42584, "r": 162.7131, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 184.39731, "t": 236.42584, "r": 189.56456, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "65", "bbox": {"l": 184.39731, "t": 236.42584, "r": 189.56456, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 208.99026, "t": 236.42584, "r": 214.15752, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "65", "bbox": {"l": 208.99026, "t": 236.42584, "r": 214.15752, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 234.87517, "t": 236.42584, "r": 237.45833000000002, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "0", "bbox": {"l": 234.87517, "t": 236.42584, "r": 237.45833000000002, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 256.88446, "t": 236.42584, "r": 264.6358, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "150", "bbox": {"l": 256.88446, "t": 236.42584, "r": 264.6358, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 284.06134, "t": 236.42584, "r": 286.6445, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "0", "bbox": {"l": 284.06134, "t": 236.42584, "r": 286.6445, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 55.53052099999999, "t": 242.62048000000004, "r": 139.72253, "b": 246.97839, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "Computational Linguistics(COLING2002)", "bbox": {"l": 55.53052099999999, "t": 242.62048000000004, "r": 139.72253, "b": 246.97839, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 183.10536, "t": 242.62048000000004, "r": 190.8567, "b": 246.97839, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "140", "bbox": {"l": 183.10536, "t": 242.62048000000004, "r": 190.8567, "b": 246.97839, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 207.69832, "t": 242.62048000000004, "r": 215.44965999999997, "b": 246.97839, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "140", "bbox": {"l": 207.69832, "t": 242.62048000000004, "r": 215.44965999999997, "b": 246.97839, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 234.87517, "t": 242.62048000000004, "r": 237.45833000000002, "b": 246.97839, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "0", "bbox": {"l": 234.87517, "t": 242.62048000000004, "r": 237.45833000000002, "b": 246.97839, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 256.88446, "t": 242.62048000000004, "r": 264.6358, "b": 246.97839, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "150", "bbox": {"l": 256.88446, "t": 242.62048000000004, "r": 264.6358, "b": 246.97839, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 284.06134, "t": 242.62048000000004, "r": 286.6445, "b": 246.97839, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "0", "bbox": {"l": 284.06134, "t": 242.62048000000004, "r": 286.6445, "b": 246.97839, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 55.53052099999999, "t": 249.79845999999998, "r": 97.013, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "\u96fb\u6c17\u60c5\u5831\u901a\u4fe1\u5b66\u4f1a", "bbox": {"l": 55.53052099999999, "t": 249.79845999999998, "r": 97.013, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 92.698288, "t": 249.58942000000002, "r": 103.03371, "b": 253.94732999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "2003", "bbox": {"l": 92.698288, "t": 249.58942000000002, "r": 103.03371, "b": 253.94732999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 103.03389, "t": 249.79845999999998, "r": 128.96027, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "\u5e74\u7dcf\u5408\u5927\u4f1a", "bbox": {"l": 103.03389, "t": 249.79845999999998, "r": 128.96027, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 183.10536, "t": 248.81506000000002, "r": 190.8567, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "150", "bbox": {"l": 183.10536, "t": 248.81506000000002, "r": 190.8567, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 210.28223, "t": 248.81506000000002, "r": 212.86539, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "8", "bbox": {"l": 210.28223, "t": 248.81506000000002, "r": 212.86539, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 232.29153, "t": 248.81506000000002, "r": 240.04287999999997, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "142", "bbox": {"l": 232.29153, "t": 248.81506000000002, "r": 240.04287999999997, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 256.88446, "t": 248.81506000000002, "r": 264.6358, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "223", "bbox": {"l": 256.88446, "t": 248.81506000000002, "r": 264.6358, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 281.47742, "t": 248.81506000000002, "r": 289.22876, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "147", "bbox": {"l": 281.47742, "t": 248.81506000000002, "r": 289.22876, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 55.53052099999999, "t": 257.28369, "r": 91.827637, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "\u60c5\u5831\u51e6\u7406\u5b66\u4f1a\u7b2c", "bbox": {"l": 55.53052099999999, "t": 257.28369, "r": 91.827637, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 88.052673, "t": 257.07465, "r": 93.219925, "b": 261.43255999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "65", "bbox": {"l": 88.052673, "t": 257.07465, "r": 93.219925, "b": 261.43255999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 93.220474, "t": 257.28369, "r": 119.14685, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "\u56de\u5168\u56fd\u5927\u4f1a", "bbox": {"l": 93.220474, "t": 257.28369, "r": 119.14685, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 116.45073999999998, "t": 257.07465, "r": 129.88177, "b": 261.43255999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "(2003)", "bbox": {"l": 116.45073999999998, "t": 257.07465, "r": 129.88177, "b": 261.43255999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 183.10536, "t": 256.30029, "r": 190.8567, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "177", "bbox": {"l": 183.10536, "t": 256.30029, "r": 190.8567, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 210.28223, "t": 256.30029, "r": 212.86539, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "1", "bbox": {"l": 210.28223, "t": 256.30029, "r": 212.86539, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 232.29153, "t": 256.30029, "r": 240.04287999999997, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "176", "bbox": {"l": 232.29153, "t": 256.30029, "r": 240.04287999999997, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 256.88446, "t": 256.30029, "r": 264.6358, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "150", "bbox": {"l": 256.88446, "t": 256.30029, "r": 264.6358, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 281.47742, "t": 256.30029, "r": 289.22876, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "236", "bbox": {"l": 281.47742, "t": 256.30029, "r": 289.22876, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 55.53052099999999, "t": 264.5108, "r": 60.715424, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "\u7b2c", "bbox": {"l": 55.53052099999999, "t": 264.5108, "r": 60.715424, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 60.17654799999999, "t": 264.30175999999994, "r": 65.343796, "b": 268.65967, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "17", "bbox": {"l": 60.17654799999999, "t": 264.30175999999994, "r": 65.343796, "b": 268.65967, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 65.344376, "t": 264.5108, "r": 122.38297000000001, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "\u56de\u4eba\u5de5\u77e5\u80fd\u5b66\u4f1a\u5168\u56fd\u5927\u4f1a", "bbox": {"l": 65.344376, "t": 264.5108, "r": 122.38297000000001, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 116.45073999999998, "t": 264.30175999999994, "r": 129.88177, "b": 268.65967, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "(2003)", "bbox": {"l": 116.45073999999998, "t": 264.30175999999994, "r": 129.88177, "b": 268.65967, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 183.10536, "t": 263.52739999999994, "r": 190.8567, "b": 267.88531, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "208", "bbox": {"l": 183.10536, "t": 263.52739999999994, "r": 190.8567, "b": 267.88531, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 210.28223, "t": 263.52739999999994, "r": 212.86539, "b": 267.88531, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "5", "bbox": {"l": 210.28223, "t": 263.52739999999994, "r": 212.86539, "b": 267.88531, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 232.29153, "t": 263.52739999999994, "r": 240.04287999999997, "b": 267.88531, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "203", "bbox": {"l": 232.29153, "t": 263.52739999999994, "r": 240.04287999999997, "b": 267.88531, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 256.88446, "t": 263.52739999999994, "r": 264.6358, "b": 267.88531, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "152", "bbox": {"l": 256.88446, "t": 263.52739999999994, "r": 264.6358, "b": 267.88531, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 281.47742, "t": 263.52739999999994, "r": 289.22876, "b": 267.88531, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "244", "bbox": {"l": 281.47742, "t": 263.52739999999994, "r": 289.22876, "b": 267.88531, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 55.53052099999999, "t": 271.73785, "r": 107.38374, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "\u81ea\u7136\u8a00\u8a9e\u51e6\u7406\u7814\u7a76\u4f1a\u7b2c", "bbox": {"l": 55.53052099999999, "t": 271.73785, "r": 107.38374, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 101.99034, "t": 271.52881, "r": 109.74168000000002, "b": 275.88671999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "146", "bbox": {"l": 101.99034, "t": 271.52881, "r": 109.74168000000002, "b": 275.88671999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 109.74204, "t": 271.73785, "r": 114.92695000000002, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "\u301c", "bbox": {"l": 109.74204, "t": 271.73785, "r": 114.92695000000002, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 114.38793, "t": 271.52881, "r": 122.13927, "b": 275.88671999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "155", "bbox": {"l": 114.38793, "t": 271.52881, "r": 122.13927, "b": 275.88671999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 122.13963, "t": 271.73785, "r": 127.32454000000001, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "\u56de", "bbox": {"l": 122.13963, "t": 271.73785, "r": 127.32454000000001, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 184.39731, "t": 270.75446, "r": 189.56456, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "98", "bbox": {"l": 184.39731, "t": 270.75446, "r": 189.56456, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 210.28223, "t": 270.75446, "r": 212.86539, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "2", "bbox": {"l": 210.28223, "t": 270.75446, "r": 212.86539, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 233.58348, "t": 270.75446, "r": 238.75072999999998, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "96", "bbox": {"l": 233.58348, "t": 270.75446, "r": 238.75072999999998, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 256.88446, "t": 270.75446, "r": 264.6358, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "150", "bbox": {"l": 256.88446, "t": 270.75446, "r": 264.6358, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 281.47742, "t": 270.75446, "r": 289.22876, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "232", "bbox": {"l": 281.47742, "t": 270.75446, "r": 289.22876, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 55.53052099999999, "t": 279.01392, "r": 68.68605, "b": 283.37183, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "WWW", "bbox": {"l": 55.53052099999999, "t": 279.01392, "r": 68.68605, "b": 283.37183, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 68.685814, "t": 279.22295999999994, "r": 110.16829999999999, "b": 283.40436, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "\u304b\u3089\u53ce\u96c6\u3057\u305f\u8ad6\u6587", "bbox": {"l": 68.685814, "t": 279.22295999999994, "r": 110.16829999999999, "b": 283.40436, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 183.10536, "t": 277.98157000000003, "r": 190.8567, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "107", "bbox": {"l": 183.10536, "t": 277.98157000000003, "r": 190.8567, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 208.99026, "t": 277.98157000000003, "r": 214.15752, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "73", "bbox": {"l": 208.99026, "t": 277.98157000000003, "r": 214.15752, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 233.58348, "t": 277.98157000000003, "r": 238.75072999999998, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "34", "bbox": {"l": 233.58348, "t": 277.98157000000003, "r": 238.75072999999998, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 256.88446, "t": 277.98157000000003, "r": 264.6358, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "147", "bbox": {"l": 256.88446, "t": 277.98157000000003, "r": 264.6358, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 282.76938, "t": 277.98157000000003, "r": 287.93661, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "96", "bbox": {"l": 282.76938, "t": 277.98157000000003, "r": 287.93661, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 169.61508, "t": 286.45004, "r": 174.79999, "b": 290.63141, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "\u8a08", "bbox": {"l": 169.61508, "t": 286.45004, "r": 174.79999, "b": 290.63141, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 183.10536, "t": 285.46667, "r": 190.8567, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "945", "bbox": {"l": 183.10536, "t": 285.46667, "r": 190.8567, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 207.69832, "t": 285.46667, "r": 215.44965999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "294", "bbox": {"l": 207.69832, "t": 285.46667, "r": 215.44965999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 232.29153, "t": 285.46667, "r": 240.04287999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "651", "bbox": {"l": 232.29153, "t": 285.46667, "r": 240.04287999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 255.76506, "t": 285.46667, "r": 265.75204, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "1122", "bbox": {"l": 255.76506, "t": 285.46667, "r": 265.75204, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 281.47742, "t": 285.46667, "r": 289.22876, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "955", "bbox": {"l": 281.47742, "t": 285.46667, "r": 289.22876, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "lcel", "ched", "lcel", "nl", "ched", "ched", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 10, "num_cols": 6, "table_cells": [{"bbox": {"l": 209.93285, "t": 222.18073000000004, "r": 241.04458999999997, "b": 226.36212, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 4, "text": "\u8ad6\u6587\u30d5\u30a1\u30a4\u30eb", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 263.76489, "t": 222.18073000000004, "r": 284.50589, "b": 226.36212, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 4, "end_col_offset_idx": 6, "text": "\u53c2\u8003\u6587\u732e", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 110.24990999999999, "t": 229.66594999999995, "r": 120.62018, "b": 233.84735, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "\u51fa\u5178", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 175.36609, "t": 229.66594999999995, "r": 201.29247, "b": 233.84735, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "\u30d5\u30a1\u30a4\u30eb \u6570", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 209.62408, "t": 229.66594999999995, "r": 219.99435, "b": 233.84735, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "\u82f1\u8a9e", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 229.19814, "t": 229.66594999999995, "r": 244.75377, "b": 233.84735, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "\u65e5\u672c\u8a9e", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 256.1142, "t": 229.66594999999995, "r": 266.48447, "b": 233.84735, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "\u82f1\u8a9e", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 278.38434, "t": 229.66594999999995, "r": 293.93997, "b": 233.84735, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "\u65e5\u672c\u8a9e", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 55.53052099999999, "t": 236.42584, "r": 162.7131, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Association for Computational Linguistics(ACL2003)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 184.39731, "t": 236.42584, "r": 189.56456, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "65", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 208.99026, "t": 236.42584, "r": 214.15752, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "65", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 234.87517, "t": 236.42584, "r": 237.45833000000002, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446, "t": 236.42584, "r": 264.6358, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "150", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 284.06134, "t": 236.42584, "r": 286.6445, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 55.53052099999999, "t": 242.62048000000004, "r": 139.72253, "b": 246.97839, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Computational Linguistics(COLING2002)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 183.10536, "t": 242.62048000000004, "r": 190.8567, "b": 246.97839, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "140", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 207.69832, "t": 242.62048000000004, "r": 215.44965999999997, "b": 246.97839, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "140", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 234.87517, "t": 242.62048000000004, "r": 237.45833000000002, "b": 246.97839, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446, "t": 242.62048000000004, "r": 264.6358, "b": 246.97839, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "150", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 284.06134, "t": 242.62048000000004, "r": 286.6445, "b": 246.97839, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 55.53052099999999, "t": 249.58942000000002, "r": 128.96027, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "\u96fb\u6c17\u60c5\u5831\u901a\u4fe1\u5b66\u4f1a 2003 \u5e74\u7dcf\u5408\u5927\u4f1a", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 183.10536, "t": 248.81506000000002, "r": 190.8567, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "150", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 210.28223, "t": 248.81506000000002, "r": 212.86539, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.29153, "t": 248.81506000000002, "r": 240.04287999999997, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "142", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446, "t": 248.81506000000002, "r": 264.6358, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "223", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.47742, "t": 248.81506000000002, "r": 289.22876, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "147", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 55.53052099999999, "t": 257.07465, "r": 129.88177, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "\u60c5\u5831\u51e6\u7406\u5b66\u4f1a\u7b2c 65 \u56de\u5168\u56fd\u5927\u4f1a (2003)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 183.10536, "t": 256.30029, "r": 190.8567, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "177", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 210.28223, "t": 256.30029, "r": 212.86539, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.29153, "t": 256.30029, "r": 240.04287999999997, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "176", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446, "t": 256.30029, "r": 264.6358, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "150", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.47742, "t": 256.30029, "r": 289.22876, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "236", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 55.53052099999999, "t": 264.30175999999994, "r": 129.88177, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "\u7b2c 17 \u56de\u4eba\u5de5\u77e5\u80fd\u5b66\u4f1a\u5168\u56fd\u5927\u4f1a (2003)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 183.10536, "t": 263.52739999999994, "r": 190.8567, "b": 267.88531, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "208", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 210.28223, "t": 263.52739999999994, "r": 212.86539, "b": 267.88531, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.29153, "t": 263.52739999999994, "r": 240.04287999999997, "b": 267.88531, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "203", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446, "t": 263.52739999999994, "r": 264.6358, "b": 267.88531, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "152", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.47742, "t": 263.52739999999994, "r": 289.22876, "b": 267.88531, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "244", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 55.53052099999999, "t": 271.52881, "r": 127.32454000000001, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "\u81ea\u7136\u8a00\u8a9e\u51e6\u7406\u7814\u7a76\u4f1a\u7b2c 146 \u301c 155 \u56de", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 184.39731, "t": 270.75446, "r": 189.56456, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "98", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 210.28223, "t": 270.75446, "r": 212.86539, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 233.58348, "t": 270.75446, "r": 238.75072999999998, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446, "t": 270.75446, "r": 264.6358, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "150", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.47742, "t": 270.75446, "r": 289.22876, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "232", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 55.53052099999999, "t": 279.01392, "r": 110.16829999999999, "b": 283.40436, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "WWW \u304b\u3089\u53ce\u96c6\u3057\u305f\u8ad6\u6587", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 183.10536, "t": 277.98157000000003, "r": 190.8567, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "107", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 208.99026, "t": 277.98157000000003, "r": 214.15752, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "73", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 233.58348, "t": 277.98157000000003, "r": 238.75072999999998, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "34", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446, "t": 277.98157000000003, "r": 264.6358, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "147", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 282.76938, "t": 277.98157000000003, "r": 287.93661, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 183.10536, "t": 285.46667, "r": 190.8567, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "945", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 207.69832, "t": 285.46667, "r": 215.44965999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "294", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.29153, "t": 285.46667, "r": 240.04287999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "651", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 255.76506, "t": 285.46667, "r": 265.75204, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "1122", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.47742, "t": 285.46667, "r": 289.22876, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "955", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "caption", "id": 16, "page_no": 7, "cluster": {"id": 16, "label": "caption", "bbox": {"l": 380.42731, "t": 292.30426, "r": 549.42175, "b": 298.60284, "coord_origin": "TOPLEFT"}, "confidence": 0.7499910593032837, "cells": [{"id": 76, "text": "Text is aligned to match original for ease of viewing", "bbox": {"l": 380.42731, "t": 292.30426, "r": 549.42175, "b": 298.60284, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Text is aligned to match original for ease of viewing"}, {"label": "table", "id": 7, "page_no": 7, "cluster": {"id": 7, "label": "table", "bbox": {"l": 304.9219970703125, "t": 218.51486206054688, "r": 550.2321166992188, "b": 287.90069580078125, "coord_origin": "TOPLEFT"}, "confidence": 0.8899765014648438, "cells": [{"id": 77, "text": "Weighted Average Grant Date Fair", "bbox": {"l": 459.04861, "t": 221.62415, "r": 542.00018, "b": 226.68933000000004, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "Value", "bbox": {"l": 493.82193, "t": 227.83416999999997, "r": 507.2258, "b": 232.89935000000003, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "RS", "bbox": {"l": 393.2442, "t": 236.74712999999997, "r": 400.74588, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "U", "bbox": {"l": 400.74643, "t": 236.74712999999997, "r": 404.64523, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "s", "bbox": {"l": 404.6463, "t": 236.74712999999997, "r": 407.34631, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "Shares (in millions)", "bbox": {"l": 392.09671, "t": 221.57446000000004, "r": 438.0145, "b": 226.63964999999996, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "PSUs", "bbox": {"l": 427.18323, "t": 236.74712999999997, "r": 440.98778999999996, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "RSUs", "bbox": {"l": 468.38254, "t": 236.74712999999997, "r": 482.48465000000004, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "PSUs", "bbox": {"l": 516.92578, "t": 236.74712999999997, "r": 530.73035, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Nonvested on Janua", "bbox": {"l": 306.11493, "t": 244.61084000000005, "r": 355.6532, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "ry 1", "bbox": {"l": 355.65427, "t": 244.61084000000005, "r": 364.65607, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "1.", "bbox": {"l": 396.24661, "t": 244.91327, "r": 400.75238, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "1", "bbox": {"l": 400.7529, "t": 244.91327, "r": 403.75531, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "0.3", "bbox": {"l": 429.81838999999997, "t": 244.91327, "r": 437.32708999999994, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "90.10", "bbox": {"l": 465.52859, "t": 244.91327, "r": 478.40103, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "$", "bbox": {"l": 480.97552, "t": 244.91327, "r": 483.55001999999996, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "$ 91.19", "bbox": {"l": 513.44824, "t": 244.91327, "r": 531.46967, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "Granted", "bbox": {"l": 306.11493, "t": 253.68451000000005, "r": 325.62674, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "0.", "bbox": {"l": 396.24661, "t": 253.68451000000005, "r": 400.75238, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "5", "bbox": {"l": 400.7529, "t": 253.68451000000005, "r": 403.75531, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "0.1", "bbox": {"l": 429.81838999999997, "t": 253.68451000000005, "r": 437.32708999999994, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "117.44", "bbox": {"l": 466.43579000000005, "t": 253.68451000000005, "r": 482.54831, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "122.41", "bbox": {"l": 514.29065, "t": 253.68451000000005, "r": 530.80981, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "Vested", "bbox": {"l": 306.11493, "t": 261.54822, "r": 322.62866, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "(0.", "bbox": {"l": 394.43222, "t": 261.54822, "r": 400.73563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "5", "bbox": {"l": 400.73456, "t": 261.54822, "r": 403.73697, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": ")", "bbox": {"l": 403.73804, "t": 261.54822, "r": 405.53625, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "(0.1)", "bbox": {"l": 427.7016, "t": 261.54822, "r": 438.80563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "87.08", "bbox": {"l": 468.55533, "t": 261.54822, "r": 482.07043, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "81.14", "bbox": {"l": 516.01862, "t": 261.54822, "r": 529.53375, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "Canceled or forfeited", "bbox": {"l": 306.11493, "t": 269.64148, "r": 356.24771, "b": 274.70667000000003, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "(0.", "bbox": {"l": 394.43222, "t": 270.31946000000005, "r": 400.73563, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "1", "bbox": {"l": 400.73456, "t": 270.31946000000005, "r": 403.73697, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": ")", "bbox": {"l": 403.73804, "t": 270.31946000000005, "r": 405.53625, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "-", "bbox": {"l": 431.02802, "t": 270.31946000000005, "r": 436.4280099999999, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "102.01", "bbox": {"l": 465.83099000000004, "t": 270.31946000000005, "r": 482.35013, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "92.18", "bbox": {"l": 516.01862, "t": 270.31946000000005, "r": 529.53375, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "Nonvested on December 31", "bbox": {"l": 306.11493, "t": 278.48572, "r": 373.35764, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "1.0", "bbox": {"l": 396.24661, "t": 278.48572, "r": 403.75531, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "0.3", "bbox": {"l": 429.51599, "t": 278.48572, "r": 437.02469, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "104.85 $", "bbox": {"l": 463.7142, "t": 278.48572, "r": 484.73965000000004, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "$ 104.51", "bbox": {"l": 512.99463, "t": 278.48572, "r": 534.02008, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}], "children": [{"id": 102, "label": "text", "bbox": {"l": 459.04861, "t": 221.62415, "r": 542.00018, "b": 226.68933000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "Weighted Average Grant Date Fair", "bbox": {"l": 459.04861, "t": 221.62415, "r": 542.00018, "b": 226.68933000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 493.82193, "t": 227.83416999999997, "r": 507.2258, "b": 232.89935000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "Value", "bbox": {"l": 493.82193, "t": 227.83416999999997, "r": 507.2258, "b": 232.89935000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 393.2442, "t": 236.74712999999997, "r": 400.74588, "b": 241.81232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "RS", "bbox": {"l": 393.2442, "t": 236.74712999999997, "r": 400.74588, "b": 241.81232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 400.74643, "t": 236.74712999999997, "r": 404.64523, "b": 241.81232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "U", "bbox": {"l": 400.74643, "t": 236.74712999999997, "r": 404.64523, "b": 241.81232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 404.6463, "t": 236.74712999999997, "r": 407.34631, "b": 241.81232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "s", "bbox": {"l": 404.6463, "t": 236.74712999999997, "r": 407.34631, "b": 241.81232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 392.09671, "t": 221.57446000000004, "r": 438.0145, "b": 226.63964999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "Shares (in millions)", "bbox": {"l": 392.09671, "t": 221.57446000000004, "r": 438.0145, "b": 226.63964999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 427.18323, "t": 236.74712999999997, "r": 440.98778999999996, "b": 241.81232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "PSUs", "bbox": {"l": 427.18323, "t": 236.74712999999997, "r": 440.98778999999996, "b": 241.81232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 468.38254, "t": 236.74712999999997, "r": 482.48465000000004, "b": 241.81232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "RSUs", "bbox": {"l": 468.38254, "t": 236.74712999999997, "r": 482.48465000000004, "b": 241.81232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 516.92578, "t": 236.74712999999997, "r": 530.73035, "b": 241.81232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "PSUs", "bbox": {"l": 516.92578, "t": 236.74712999999997, "r": 530.73035, "b": 241.81232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 306.11493, "t": 244.61084000000005, "r": 355.6532, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "Nonvested on Janua", "bbox": {"l": 306.11493, "t": 244.61084000000005, "r": 355.6532, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 355.65427, "t": 244.61084000000005, "r": 364.65607, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "ry 1", "bbox": {"l": 355.65427, "t": 244.61084000000005, "r": 364.65607, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 396.24661, "t": 244.91327, "r": 400.75238, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "1.", "bbox": {"l": 396.24661, "t": 244.91327, "r": 400.75238, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 114, "label": "text", "bbox": {"l": 400.7529, "t": 244.91327, "r": 403.75531, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "1", "bbox": {"l": 400.7529, "t": 244.91327, "r": 403.75531, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 115, "label": "text", "bbox": {"l": 429.81838999999997, "t": 244.91327, "r": 437.32708999999994, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "0.3", "bbox": {"l": 429.81838999999997, "t": 244.91327, "r": 437.32708999999994, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 116, "label": "text", "bbox": {"l": 465.52859, "t": 244.91327, "r": 478.40103, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "90.10", "bbox": {"l": 465.52859, "t": 244.91327, "r": 478.40103, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 117, "label": "text", "bbox": {"l": 480.97552, "t": 244.91327, "r": 483.55001999999996, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "$", "bbox": {"l": 480.97552, "t": 244.91327, "r": 483.55001999999996, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 118, "label": "text", "bbox": {"l": 513.44824, "t": 244.91327, "r": 531.46967, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "$ 91.19", "bbox": {"l": 513.44824, "t": 244.91327, "r": 531.46967, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 119, "label": "text", "bbox": {"l": 306.11493, "t": 253.68451000000005, "r": 325.62674, "b": 258.74969, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "Granted", "bbox": {"l": 306.11493, "t": 253.68451000000005, "r": 325.62674, "b": 258.74969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 120, "label": "text", "bbox": {"l": 396.24661, "t": 253.68451000000005, "r": 400.75238, "b": 258.74969, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "0.", "bbox": {"l": 396.24661, "t": 253.68451000000005, "r": 400.75238, "b": 258.74969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 121, "label": "text", "bbox": {"l": 400.7529, "t": 253.68451000000005, "r": 403.75531, "b": 258.74969, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "5", "bbox": {"l": 400.7529, "t": 253.68451000000005, "r": 403.75531, "b": 258.74969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 122, "label": "text", "bbox": {"l": 429.81838999999997, "t": 253.68451000000005, "r": 437.32708999999994, "b": 258.74969, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "0.1", "bbox": {"l": 429.81838999999997, "t": 253.68451000000005, "r": 437.32708999999994, "b": 258.74969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 123, "label": "text", "bbox": {"l": 466.43579000000005, "t": 253.68451000000005, "r": 482.54831, "b": 258.74969, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "117.44", "bbox": {"l": 466.43579000000005, "t": 253.68451000000005, "r": 482.54831, "b": 258.74969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 124, "label": "text", "bbox": {"l": 514.29065, "t": 253.68451000000005, "r": 530.80981, "b": 258.74969, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "122.41", "bbox": {"l": 514.29065, "t": 253.68451000000005, "r": 530.80981, "b": 258.74969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 125, "label": "text", "bbox": {"l": 306.11493, "t": 261.54822, "r": 322.62866, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "Vested", "bbox": {"l": 306.11493, "t": 261.54822, "r": 322.62866, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 126, "label": "text", "bbox": {"l": 394.43222, "t": 261.54822, "r": 400.73563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "(0.", "bbox": {"l": 394.43222, "t": 261.54822, "r": 400.73563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 127, "label": "text", "bbox": {"l": 400.73456, "t": 261.54822, "r": 403.73697, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "5", "bbox": {"l": 400.73456, "t": 261.54822, "r": 403.73697, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 128, "label": "text", "bbox": {"l": 403.73804, "t": 261.54822, "r": 405.53625, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": ")", "bbox": {"l": 403.73804, "t": 261.54822, "r": 405.53625, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 129, "label": "text", "bbox": {"l": 427.7016, "t": 261.54822, "r": 438.80563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "(0.1)", "bbox": {"l": 427.7016, "t": 261.54822, "r": 438.80563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 130, "label": "text", "bbox": {"l": 468.55533, "t": 261.54822, "r": 482.07043, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "87.08", "bbox": {"l": 468.55533, "t": 261.54822, "r": 482.07043, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 131, "label": "text", "bbox": {"l": 516.01862, "t": 261.54822, "r": 529.53375, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": "81.14", "bbox": {"l": 516.01862, "t": 261.54822, "r": 529.53375, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 132, "label": "text", "bbox": {"l": 306.11493, "t": 269.64148, "r": 356.24771, "b": 274.70667000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 107, "text": "Canceled or forfeited", "bbox": {"l": 306.11493, "t": 269.64148, "r": 356.24771, "b": 274.70667000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 133, "label": "text", "bbox": {"l": 394.43222, "t": 270.31946000000005, "r": 400.73563, "b": 275.38464, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 108, "text": "(0.", "bbox": {"l": 394.43222, "t": 270.31946000000005, "r": 400.73563, "b": 275.38464, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 134, "label": "text", "bbox": {"l": 400.73456, "t": 270.31946000000005, "r": 403.73697, "b": 275.38464, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 109, "text": "1", "bbox": {"l": 400.73456, "t": 270.31946000000005, "r": 403.73697, "b": 275.38464, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 135, "label": "text", "bbox": {"l": 403.73804, "t": 270.31946000000005, "r": 405.53625, "b": 275.38464, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 110, "text": ")", "bbox": {"l": 403.73804, "t": 270.31946000000005, "r": 405.53625, "b": 275.38464, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 136, "label": "text", "bbox": {"l": 431.02802, "t": 270.31946000000005, "r": 436.4280099999999, "b": 275.38464, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 111, "text": "-", "bbox": {"l": 431.02802, "t": 270.31946000000005, "r": 436.4280099999999, "b": 275.38464, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 137, "label": "text", "bbox": {"l": 465.83099000000004, "t": 270.31946000000005, "r": 482.35013, "b": 275.38464, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 112, "text": "102.01", "bbox": {"l": 465.83099000000004, "t": 270.31946000000005, "r": 482.35013, "b": 275.38464, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 138, "label": "text", "bbox": {"l": 516.01862, "t": 270.31946000000005, "r": 529.53375, "b": 275.38464, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 113, "text": "92.18", "bbox": {"l": 516.01862, "t": 270.31946000000005, "r": 529.53375, "b": 275.38464, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 139, "label": "text", "bbox": {"l": 306.11493, "t": 278.48572, "r": 373.35764, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 114, "text": "Nonvested on December 31", "bbox": {"l": 306.11493, "t": 278.48572, "r": 373.35764, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 140, "label": "text", "bbox": {"l": 396.24661, "t": 278.48572, "r": 403.75531, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 115, "text": "1.0", "bbox": {"l": 396.24661, "t": 278.48572, "r": 403.75531, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 141, "label": "text", "bbox": {"l": 429.51599, "t": 278.48572, "r": 437.02469, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 116, "text": "0.3", "bbox": {"l": 429.51599, "t": 278.48572, "r": 437.02469, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 142, "label": "text", "bbox": {"l": 463.7142, "t": 278.48572, "r": 484.73965000000004, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 117, "text": "104.85 $", "bbox": {"l": 463.7142, "t": 278.48572, "r": 484.73965000000004, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 143, "label": "text", "bbox": {"l": 512.99463, "t": 278.48572, "r": 534.02008, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 118, "text": "$ 104.51", "bbox": {"l": 512.99463, "t": 278.48572, "r": 534.02008, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ecel", "ched", "lcel", "ched", "lcel", "nl", "ecel", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 7, "num_cols": 5, "table_cells": [{"bbox": {"l": 459.04861, "t": 221.62415, "r": 542.00018, "b": 232.89935000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 5, "text": "Weighted Average Grant Date Fair Value", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 393.2442, "t": 236.74712999999997, "r": 407.34631, "b": 241.81232, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "RS U s", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 392.09671, "t": 221.57446000000004, "r": 438.0145, "b": 226.63964999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 3, "text": "Shares (in millions)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 427.18323, "t": 236.74712999999997, "r": 440.98778999999996, "b": 241.81232, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "PSUs", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 468.38254, "t": 236.74712999999997, "r": 482.48465000000004, "b": 241.81232, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "RSUs", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 516.92578, "t": 236.74712999999997, "r": 530.73035, "b": 241.81232, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "PSUs", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 306.11493, "t": 244.61084000000005, "r": 364.65607, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Nonvested on Janua ry 1", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 396.24661, "t": 244.91327, "r": 403.75531, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "1. 1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 429.81838999999997, "t": 244.91327, "r": 437.32708999999994, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 465.52859, "t": 244.91327, "r": 483.55001999999996, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "90.10 $", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 513.44824, "t": 244.91327, "r": 531.46967, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "$ 91.19", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 306.11493, "t": 253.68451000000005, "r": 325.62674, "b": 258.74969, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Granted", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 396.24661, "t": 253.68451000000005, "r": 403.75531, "b": 258.74969, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "0. 5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 429.81838999999997, "t": 253.68451000000005, "r": 437.32708999999994, "b": 258.74969, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 466.43579000000005, "t": 253.68451000000005, "r": 482.54831, "b": 258.74969, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "117.44", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 514.29065, "t": 253.68451000000005, "r": 530.80981, "b": 258.74969, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "122.41", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 306.11493, "t": 261.54822, "r": 322.62866, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Vested", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 394.43222, "t": 261.54822, "r": 405.53625, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "(0. 5 )", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 427.7016, "t": 261.54822, "r": 438.80563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "(0.1)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 468.55533, "t": 261.54822, "r": 482.07043, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "87.08", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 516.01862, "t": 261.54822, "r": 529.53375, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "81.14", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 306.11493, "t": 269.64148, "r": 356.24771, "b": 274.70667000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Canceled or forfeited", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 394.43222, "t": 270.31946000000005, "r": 405.53625, "b": 275.38464, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "(0. 1 )", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 431.02802, "t": 270.31946000000005, "r": 436.4280099999999, "b": 275.38464, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 465.83099000000004, "t": 270.31946000000005, "r": 482.35013, "b": 275.38464, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "102.01", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 516.01862, "t": 270.31946000000005, "r": 529.53375, "b": 275.38464, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "92.18", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 306.11493, "t": 278.48572, "r": 373.35764, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Nonvested on December 31", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 396.24661, "t": 278.48572, "r": 403.75531, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "1.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 429.51599, "t": 278.48572, "r": 437.02469, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 463.7142, "t": 278.48572, "r": 484.73965000000004, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "104.85 $", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 512.99463, "t": 278.48572, "r": 534.02008, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "$ 104.51", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "caption", "id": 6, "page_no": 7, "cluster": {"id": 6, "label": "caption", "bbox": {"l": 50.112, "t": 320.87735, "r": 545.11377, "b": 365.64987, "coord_origin": "TOPLEFT"}, "confidence": 0.9140306711196899, "cells": [{"id": 119, "text": "Figure 5:", "bbox": {"l": 50.112, "t": 320.87735, "r": 86.864021, "b": 329.78391, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "One of the benefits of TableFormer is that it is language agnostic, as an example, the left part of the illustration", "bbox": {"l": 93.917542, "t": 320.87735, "r": 545.11371, "b": 329.78391, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "demonstrates TableFormer predictions on previously unseen language (Japanese). Additionally, we see that TableFormer is", "bbox": {"l": 50.112, "t": 332.83233999999993, "r": 545.11371, "b": 341.73889, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "robust to variability in style and content, right side of the illustration shows the example of the TableFormer prediction from", "bbox": {"l": 50.112, "t": 344.78732, "r": 545.11377, "b": 353.69388, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "the FinTabNet dataset.", "bbox": {"l": 50.112, "t": 356.74332, "r": 139.79532, "b": 365.64987, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 5: One of the benefits of TableFormer is that it is language agnostic, as an example, the left part of the illustration demonstrates TableFormer predictions on previously unseen language (Japanese). Additionally, we see that TableFormer is robust to variability in style and content, right side of the illustration shows the example of the TableFormer prediction from the FinTabNet dataset."}, {"label": "picture", "id": 12, "page_no": 7, "cluster": {"id": 12, "label": "picture", "bbox": {"l": 216.76925659179688, "t": 380.4906005859375, "r": 375.7829284667969, "b": 443.3470458984375, "coord_origin": "TOPLEFT"}, "confidence": 0.8058525919914246, "cells": [{"id": 124, "text": "Red - PDF cells, Green - predicted bounding boxes", "bbox": {"l": 220.26282, "t": 381.77722, "r": 342.07819, "b": 386.44281, "coord_origin": "TOPLEFT"}}], "children": [{"id": 144, "label": "text", "bbox": {"l": 220.26282, "t": 381.77722, "r": 342.07819, "b": 386.44281, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 124, "text": "Red - PDF cells, Green - predicted bounding boxes", "bbox": {"l": 220.26282, "t": 381.77722, "r": 342.07819, "b": 386.44281, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "picture", "id": 11, "page_no": 7, "cluster": {"id": 11, "label": "picture", "bbox": {"l": 51.736167907714844, "t": 380.48065185546875, "r": 211.83778381347656, "b": 443.6580810546875, "coord_origin": "TOPLEFT"}, "confidence": 0.8308417797088623, "cells": [{"id": 125, "text": "Ground Truth", "bbox": {"l": 53.715248, "t": 381.77722, "r": 85.657333, "b": 386.44281, "coord_origin": "TOPLEFT"}}], "children": [{"id": 145, "label": "text", "bbox": {"l": 53.715248, "t": 381.77722, "r": 85.657333, "b": 386.44281, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 125, "text": "Ground Truth", "bbox": {"l": 53.715248, "t": 381.77722, "r": 85.657333, "b": 386.44281, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "picture", "id": 13, "page_no": 7, "cluster": {"id": 13, "label": "picture", "bbox": {"l": 383.1364440917969, "t": 381.2312927246094, "r": 542.1132202148438, "b": 442.7749328613281, "coord_origin": "TOPLEFT"}, "confidence": 0.7881613969802856, "cells": [{"id": 126, "text": "16", "bbox": {"l": 437.37939, "t": 400.55295, "r": 443.69870000000003, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "17", "bbox": {"l": 450.33203, "t": 400.55295, "r": 456.6513100000001, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "18", "bbox": {"l": 463.28464, "t": 400.55295, "r": 469.60394, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "19", "bbox": {"l": 476.23724000000004, "t": 400.55295, "r": 482.5565500000001, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "20", "bbox": {"l": 489.18988, "t": 400.55295, "r": 495.50916, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "21", "bbox": {"l": 502.14251999999993, "t": 400.55295, "r": 508.46178999999995, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "22", "bbox": {"l": 515.09509, "t": 400.55295, "r": 521.41443, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "23", "bbox": {"l": 385.2814, "t": 411.03836000000007, "r": 391.60071, "b": 417.35699, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "24", "bbox": {"l": 398.52341, "t": 411.03836000000007, "r": 404.84271, "b": 417.35699, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "25", "bbox": {"l": 411.47604, "t": 411.03836000000007, "r": 417.79535, "b": 417.35699, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "26", "bbox": {"l": 437.37939, "t": 411.03836000000007, "r": 443.69870000000003, "b": 417.35699, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "27", "bbox": {"l": 450.33203, "t": 411.03836000000007, "r": 456.6513100000001, "b": 417.35699, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "28", "bbox": {"l": 463.28464, "t": 411.03836000000007, "r": 469.60394, "b": 417.35699, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "30", "bbox": {"l": 385.2814, "t": 421.0697, "r": 391.60071, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "31", "bbox": {"l": 398.52341, "t": 421.0697, "r": 404.84271, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "32", "bbox": {"l": 411.47604, "t": 421.0697, "r": 417.79532, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "33", "bbox": {"l": 424.42865, "t": 421.0697, "r": 430.74796, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "34", "bbox": {"l": 437.38129, "t": 421.0697, "r": 443.70056, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "35", "bbox": {"l": 450.33389000000005, "t": 421.0697, "r": 456.65319999999997, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "36", "bbox": {"l": 463.2865, "t": 421.0697, "r": 469.6058, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "37", "bbox": {"l": 476.23914, "t": 421.0697, "r": 482.55841, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "38", "bbox": {"l": 489.1917700000001, "t": 421.0697, "r": 495.51105, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "39", "bbox": {"l": 502.14438, "t": 421.0697, "r": 508.46368, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "40", "bbox": {"l": 515.09705, "t": 421.0697, "r": 521.41632, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "41", "bbox": {"l": 528.04962, "t": 421.0697, "r": 534.3689, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "42", "bbox": {"l": 385.2814, "t": 432.04431, "r": 391.60071, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "43", "bbox": {"l": 398.52341, "t": 432.04431, "r": 404.84271, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "44", "bbox": {"l": 411.47604, "t": 432.04431, "r": 417.79532, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "45", "bbox": {"l": 424.42865, "t": 432.04431, "r": 430.74796, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "46", "bbox": {"l": 437.38129, "t": 432.04431, "r": 443.70056, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "47", "bbox": {"l": 450.33389000000005, "t": 432.04431, "r": 456.65319999999997, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "48", "bbox": {"l": 463.2865, "t": 432.04431, "r": 469.6058, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "49", "bbox": {"l": 476.23914, "t": 432.04431, "r": 482.55841, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "50", "bbox": {"l": 489.1917700000001, "t": 432.04431, "r": 495.51105, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "51", "bbox": {"l": 502.14438, "t": 432.04431, "r": 508.46368, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "52", "bbox": {"l": 515.09705, "t": 432.04431, "r": 521.41632, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "53", "bbox": {"l": 528.04962, "t": 432.04431, "r": 534.3689, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "0", "bbox": {"l": 385.2814, "t": 389.20004, "r": 388.44073, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "1", "bbox": {"l": 398.52341, "t": 389.20004, "r": 401.68274, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "2", "bbox": {"l": 411.4754, "t": 389.20004, "r": 414.63474, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "3", "bbox": {"l": 424.4274, "t": 389.20004, "r": 427.58673, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "4", "bbox": {"l": 437.37939, "t": 389.20004, "r": 440.53870000000006, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "5", "bbox": {"l": 450.33136, "t": 389.20004, "r": 453.49069000000003, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "6", "bbox": {"l": 463.28336, "t": 389.20004, "r": 466.44269, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "7", "bbox": {"l": 476.23535, "t": 389.20004, "r": 479.39468, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "8", "bbox": {"l": 489.18735, "t": 389.20004, "r": 492.34668, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "9", "bbox": {"l": 502.13933999999995, "t": 389.20004, "r": 505.29868000000005, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "10", "bbox": {"l": 515.09131, "t": 389.20004, "r": 521.41064, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "11", "bbox": {"l": 528.04364, "t": 389.20004, "r": 534.13104, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "12", "bbox": {"l": 385.2814, "t": 398.97464, "r": 391.60071, "b": 405.29327, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "13", "bbox": {"l": 398.52341, "t": 398.97464, "r": 404.84271, "b": 405.29327, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "14", "bbox": {"l": 411.47604, "t": 398.97464, "r": 417.79535, "b": 405.29327, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "15", "bbox": {"l": 424.42719, "t": 406.77463000000006, "r": 430.74648999999994, "b": 413.09326, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "29", "bbox": {"l": 502.86941999999993, "t": 410.99438, "r": 509.18871999999993, "b": 417.31302, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "Predicted Structure", "bbox": {"l": 384.35437, "t": 381.77722, "r": 430.99261, "b": 386.44281, "coord_origin": "TOPLEFT"}}], "children": [{"id": 146, "label": "text", "bbox": {"l": 437.37939, "t": 400.55295, "r": 443.69870000000003, "b": 406.87158, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 126, "text": "16", "bbox": {"l": 437.37939, "t": 400.55295, "r": 443.69870000000003, "b": 406.87158, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 147, "label": "text", "bbox": {"l": 450.33203, "t": 400.55295, "r": 456.6513100000001, "b": 406.87158, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 127, "text": "17", "bbox": {"l": 450.33203, "t": 400.55295, "r": 456.6513100000001, "b": 406.87158, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 148, "label": "text", "bbox": {"l": 463.28464, "t": 400.55295, "r": 469.60394, "b": 406.87158, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 128, "text": "18", "bbox": {"l": 463.28464, "t": 400.55295, "r": 469.60394, "b": 406.87158, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 149, "label": "text", "bbox": {"l": 476.23724000000004, "t": 400.55295, "r": 482.5565500000001, "b": 406.87158, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 129, "text": "19", "bbox": {"l": 476.23724000000004, "t": 400.55295, "r": 482.5565500000001, "b": 406.87158, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 150, "label": "text", "bbox": {"l": 489.18988, "t": 400.55295, "r": 495.50916, "b": 406.87158, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 130, "text": "20", "bbox": {"l": 489.18988, "t": 400.55295, "r": 495.50916, "b": 406.87158, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 151, "label": "text", "bbox": {"l": 502.14251999999993, "t": 400.55295, "r": 508.46178999999995, "b": 406.87158, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 131, "text": "21", "bbox": {"l": 502.14251999999993, "t": 400.55295, "r": 508.46178999999995, "b": 406.87158, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 152, "label": "text", "bbox": {"l": 515.09509, "t": 400.55295, "r": 521.41443, "b": 406.87158, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 132, "text": "22", "bbox": {"l": 515.09509, "t": 400.55295, "r": 521.41443, "b": 406.87158, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 153, "label": "text", "bbox": {"l": 385.2814, "t": 411.03836000000007, "r": 391.60071, "b": 417.35699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 133, "text": "23", "bbox": {"l": 385.2814, "t": 411.03836000000007, "r": 391.60071, "b": 417.35699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 154, "label": "text", "bbox": {"l": 398.52341, "t": 411.03836000000007, "r": 404.84271, "b": 417.35699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 134, "text": "24", "bbox": {"l": 398.52341, "t": 411.03836000000007, "r": 404.84271, "b": 417.35699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 155, "label": "text", "bbox": {"l": 411.47604, "t": 411.03836000000007, "r": 417.79535, "b": 417.35699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 135, "text": "25", "bbox": {"l": 411.47604, "t": 411.03836000000007, "r": 417.79535, "b": 417.35699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 156, "label": "text", "bbox": {"l": 437.37939, "t": 411.03836000000007, "r": 443.69870000000003, "b": 417.35699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 136, "text": "26", "bbox": {"l": 437.37939, "t": 411.03836000000007, "r": 443.69870000000003, "b": 417.35699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 157, "label": "text", "bbox": {"l": 450.33203, "t": 411.03836000000007, "r": 456.6513100000001, "b": 417.35699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 137, "text": "27", "bbox": {"l": 450.33203, "t": 411.03836000000007, "r": 456.6513100000001, "b": 417.35699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 158, "label": "text", "bbox": {"l": 463.28464, "t": 411.03836000000007, "r": 469.60394, "b": 417.35699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 138, "text": "28", "bbox": {"l": 463.28464, "t": 411.03836000000007, "r": 469.60394, "b": 417.35699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 159, "label": "text", "bbox": {"l": 385.2814, "t": 421.0697, "r": 391.60071, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 139, "text": "30", "bbox": {"l": 385.2814, "t": 421.0697, "r": 391.60071, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 160, "label": "text", "bbox": {"l": 398.52341, "t": 421.0697, "r": 404.84271, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 140, "text": "31", "bbox": {"l": 398.52341, "t": 421.0697, "r": 404.84271, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 161, "label": "text", "bbox": {"l": 411.47604, "t": 421.0697, "r": 417.79532, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 141, "text": "32", "bbox": {"l": 411.47604, "t": 421.0697, "r": 417.79532, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 162, "label": "text", "bbox": {"l": 424.42865, "t": 421.0697, "r": 430.74796, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 142, "text": "33", "bbox": {"l": 424.42865, "t": 421.0697, "r": 430.74796, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 163, "label": "text", "bbox": {"l": 437.38129, "t": 421.0697, "r": 443.70056, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 143, "text": "34", "bbox": {"l": 437.38129, "t": 421.0697, "r": 443.70056, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 164, "label": "text", "bbox": {"l": 450.33389000000005, "t": 421.0697, "r": 456.65319999999997, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 144, "text": "35", "bbox": {"l": 450.33389000000005, "t": 421.0697, "r": 456.65319999999997, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 165, "label": "text", "bbox": {"l": 463.2865, "t": 421.0697, "r": 469.6058, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 145, "text": "36", "bbox": {"l": 463.2865, "t": 421.0697, "r": 469.6058, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 166, "label": "text", "bbox": {"l": 476.23914, "t": 421.0697, "r": 482.55841, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 146, "text": "37", "bbox": {"l": 476.23914, "t": 421.0697, "r": 482.55841, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 167, "label": "text", "bbox": {"l": 489.1917700000001, "t": 421.0697, "r": 495.51105, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 147, "text": "38", "bbox": {"l": 489.1917700000001, "t": 421.0697, "r": 495.51105, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 168, "label": "text", "bbox": {"l": 502.14438, "t": 421.0697, "r": 508.46368, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 148, "text": "39", "bbox": {"l": 502.14438, "t": 421.0697, "r": 508.46368, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 169, "label": "text", "bbox": {"l": 515.09705, "t": 421.0697, "r": 521.41632, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 149, "text": "40", "bbox": {"l": 515.09705, "t": 421.0697, "r": 521.41632, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 170, "label": "text", "bbox": {"l": 528.04962, "t": 421.0697, "r": 534.3689, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 150, "text": "41", "bbox": {"l": 528.04962, "t": 421.0697, "r": 534.3689, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 171, "label": "text", "bbox": {"l": 385.2814, "t": 432.04431, "r": 391.60071, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 151, "text": "42", "bbox": {"l": 385.2814, "t": 432.04431, "r": 391.60071, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 172, "label": "text", "bbox": {"l": 398.52341, "t": 432.04431, "r": 404.84271, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 152, "text": "43", "bbox": {"l": 398.52341, "t": 432.04431, "r": 404.84271, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 173, "label": "text", "bbox": {"l": 411.47604, "t": 432.04431, "r": 417.79532, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 153, "text": "44", "bbox": {"l": 411.47604, "t": 432.04431, "r": 417.79532, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 174, "label": "text", "bbox": {"l": 424.42865, "t": 432.04431, "r": 430.74796, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 154, "text": "45", "bbox": {"l": 424.42865, "t": 432.04431, "r": 430.74796, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 175, "label": "text", "bbox": {"l": 437.38129, "t": 432.04431, "r": 443.70056, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 155, "text": "46", "bbox": {"l": 437.38129, "t": 432.04431, "r": 443.70056, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 176, "label": "text", "bbox": {"l": 450.33389000000005, "t": 432.04431, "r": 456.65319999999997, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 156, "text": "47", "bbox": {"l": 450.33389000000005, "t": 432.04431, "r": 456.65319999999997, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 177, "label": "text", "bbox": {"l": 463.2865, "t": 432.04431, "r": 469.6058, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 157, "text": "48", "bbox": {"l": 463.2865, "t": 432.04431, "r": 469.6058, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 178, "label": "text", "bbox": {"l": 476.23914, "t": 432.04431, "r": 482.55841, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 158, "text": "49", "bbox": {"l": 476.23914, "t": 432.04431, "r": 482.55841, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 179, "label": "text", "bbox": {"l": 489.1917700000001, "t": 432.04431, "r": 495.51105, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 159, "text": "50", "bbox": {"l": 489.1917700000001, "t": 432.04431, "r": 495.51105, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 180, "label": "text", "bbox": {"l": 502.14438, "t": 432.04431, "r": 508.46368, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 160, "text": "51", "bbox": {"l": 502.14438, "t": 432.04431, "r": 508.46368, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 181, "label": "text", "bbox": {"l": 515.09705, "t": 432.04431, "r": 521.41632, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 161, "text": "52", "bbox": {"l": 515.09705, "t": 432.04431, "r": 521.41632, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 182, "label": "text", "bbox": {"l": 528.04962, "t": 432.04431, "r": 534.3689, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 162, "text": "53", "bbox": {"l": 528.04962, "t": 432.04431, "r": 534.3689, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 183, "label": "text", "bbox": {"l": 385.2814, "t": 389.20004, "r": 388.44073, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 163, "text": "0", "bbox": {"l": 385.2814, "t": 389.20004, "r": 388.44073, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 184, "label": "text", "bbox": {"l": 398.52341, "t": 389.20004, "r": 401.68274, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 164, "text": "1", "bbox": {"l": 398.52341, "t": 389.20004, "r": 401.68274, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 185, "label": "text", "bbox": {"l": 411.4754, "t": 389.20004, "r": 414.63474, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 165, "text": "2", "bbox": {"l": 411.4754, "t": 389.20004, "r": 414.63474, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 186, "label": "text", "bbox": {"l": 424.4274, "t": 389.20004, "r": 427.58673, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 166, "text": "3", "bbox": {"l": 424.4274, "t": 389.20004, "r": 427.58673, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 187, "label": "text", "bbox": {"l": 437.37939, "t": 389.20004, "r": 440.53870000000006, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 167, "text": "4", "bbox": {"l": 437.37939, "t": 389.20004, "r": 440.53870000000006, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 188, "label": "text", "bbox": {"l": 450.33136, "t": 389.20004, "r": 453.49069000000003, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 168, "text": "5", "bbox": {"l": 450.33136, "t": 389.20004, "r": 453.49069000000003, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 189, "label": "text", "bbox": {"l": 463.28336, "t": 389.20004, "r": 466.44269, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 169, "text": "6", "bbox": {"l": 463.28336, "t": 389.20004, "r": 466.44269, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 190, "label": "text", "bbox": {"l": 476.23535, "t": 389.20004, "r": 479.39468, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 170, "text": "7", "bbox": {"l": 476.23535, "t": 389.20004, "r": 479.39468, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 191, "label": "text", "bbox": {"l": 489.18735, "t": 389.20004, "r": 492.34668, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 171, "text": "8", "bbox": {"l": 489.18735, "t": 389.20004, "r": 492.34668, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 192, "label": "text", "bbox": {"l": 502.13933999999995, "t": 389.20004, "r": 505.29868000000005, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 172, "text": "9", "bbox": {"l": 502.13933999999995, "t": 389.20004, "r": 505.29868000000005, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 193, "label": "text", "bbox": {"l": 515.09131, "t": 389.20004, "r": 521.41064, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 173, "text": "10", "bbox": {"l": 515.09131, "t": 389.20004, "r": 521.41064, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 194, "label": "text", "bbox": {"l": 528.04364, "t": 389.20004, "r": 534.13104, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 174, "text": "11", "bbox": {"l": 528.04364, "t": 389.20004, "r": 534.13104, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 195, "label": "text", "bbox": {"l": 385.2814, "t": 398.97464, "r": 391.60071, "b": 405.29327, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 175, "text": "12", "bbox": {"l": 385.2814, "t": 398.97464, "r": 391.60071, "b": 405.29327, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 196, "label": "text", "bbox": {"l": 398.52341, "t": 398.97464, "r": 404.84271, "b": 405.29327, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 176, "text": "13", "bbox": {"l": 398.52341, "t": 398.97464, "r": 404.84271, "b": 405.29327, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 197, "label": "text", "bbox": {"l": 411.47604, "t": 398.97464, "r": 417.79535, "b": 405.29327, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 177, "text": "14", "bbox": {"l": 411.47604, "t": 398.97464, "r": 417.79535, "b": 405.29327, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 198, "label": "text", "bbox": {"l": 424.42719, "t": 406.77463000000006, "r": 430.74648999999994, "b": 413.09326, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 178, "text": "15", "bbox": {"l": 424.42719, "t": 406.77463000000006, "r": 430.74648999999994, "b": 413.09326, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 199, "label": "text", "bbox": {"l": 502.86941999999993, "t": 410.99438, "r": 509.18871999999993, "b": 417.31302, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 179, "text": "29", "bbox": {"l": 502.86941999999993, "t": 410.99438, "r": 509.18871999999993, "b": 417.31302, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 200, "label": "text", "bbox": {"l": 384.35437, "t": 381.77722, "r": 430.99261, "b": 386.44281, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 180, "text": "Predicted Structure", "bbox": {"l": 384.35437, "t": 381.77722, "r": 430.99261, "b": 386.44281, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "caption", "id": 5, "page_no": 7, "cluster": {"id": 5, "label": "caption", "bbox": {"l": 62.595001, "t": 458.72836, "r": 532.63049, "b": 467.63492, "coord_origin": "TOPLEFT"}, "confidence": 0.9153599143028259, "cells": [{"id": 181, "text": "Figure 6: An example of TableFormer predictions (bounding boxes and structure) from generated SynthTabNet table.", "bbox": {"l": 62.595001, "t": 458.72836, "r": 532.63049, "b": 467.63492, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 6: An example of TableFormer predictions (bounding boxes and structure) from generated SynthTabNet table."}, {"label": "section_header", "id": 2, "page_no": 7, "cluster": {"id": 2, "label": "section_header", "bbox": {"l": 50.112, "t": 491.39536, "r": 163.7558, "b": 501.24741, "coord_origin": "TOPLEFT"}, "confidence": 0.9561247229576111, "cells": [{"id": 182, "text": "5.5.", "bbox": {"l": 50.112, "t": 491.39536, "r": 64.448898, "b": 501.24741, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "Qualitative Analysis", "bbox": {"l": 74.006828, "t": 491.39536, "r": 163.7558, "b": 501.24741, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5.5. Qualitative Analysis"}, {"label": "text", "id": 1, "page_no": 7, "cluster": {"id": 1, "label": "text", "bbox": {"l": 50.112, "t": 536.87337, "r": 286.36511, "b": 713.1519470000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9852360486984253, "cells": [{"id": 184, "text": "We showcase several visualizations for the different", "bbox": {"l": 62.067001, "t": 536.87337, "r": 286.36499, "b": 545.77992, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": "components of our network on various", "bbox": {"l": 50.112, "t": 548.82837, "r": 211.15741, "b": 557.73492, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "\u201ccomplex\u201d", "bbox": {"l": 215.10000999999997, "t": 548.91803, "r": 259.17453, "b": 557.50578, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "tables", "bbox": {"l": 263.12, "t": 548.82837, "r": 286.36273, "b": 557.73492, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": "within datasets presented in this work in Fig. 5 and Fig. 6", "bbox": {"l": 50.112, "t": 560.78337, "r": 286.36505, "b": 569.68993, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "As it is shown, our model is able to predict bounding boxes", "bbox": {"l": 50.112, "t": 572.73837, "r": 286.36508, "b": 581.6449299999999, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "for all table cells, even for the empty ones. Additionally,", "bbox": {"l": 50.112, "t": 584.69337, "r": 286.36508, "b": 593.59993, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "our post-processing techniques can extract the cell content", "bbox": {"l": 50.112, "t": 596.64937, "r": 286.36505, "b": 605.55592, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": "by matching the predicted bounding boxes to the PDF cells", "bbox": {"l": 50.112, "t": 608.60437, "r": 286.36508, "b": 617.51093, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "based on their overlap and spatial proximity. The left part", "bbox": {"l": 50.112, "t": 620.55937, "r": 286.36508, "b": 629.46593, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "of Fig. 5 demonstrates also the adaptability of our method", "bbox": {"l": 50.112, "t": 632.51437, "r": 286.36508, "b": 641.42093, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "to any language, as it can successfully extract Japanese", "bbox": {"l": 50.112, "t": 644.46938, "r": 286.36508, "b": 653.37593, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "text, although the training set contains only English content.", "bbox": {"l": 50.112, "t": 656.42438, "r": 286.36511, "b": 665.33094, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "We provide more visualizations including the intermediate", "bbox": {"l": 50.112, "t": 668.38037, "r": 286.36508, "b": 677.28694, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "steps in the supplementary material. Overall these illustra-", "bbox": {"l": 50.112, "t": 680.33537, "r": 286.36511, "b": 689.24194, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "tions justify the versatility of our method across a diverse", "bbox": {"l": 50.112, "t": 692.290375, "r": 286.36511, "b": 701.196945, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "range of table appearances and content type.", "bbox": {"l": 50.112, "t": 704.245377, "r": 226.88833999999997, "b": 713.1519470000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "We showcase several visualizations for the different components of our network on various \u201ccomplex\u201d tables within datasets presented in this work in Fig. 5 and Fig. 6 As it is shown, our model is able to predict bounding boxes for all table cells, even for the empty ones. Additionally, our post-processing techniques can extract the cell content by matching the predicted bounding boxes to the PDF cells based on their overlap and spatial proximity. The left part of Fig. 5 demonstrates also the adaptability of our method to any language, as it can successfully extract Japanese text, although the training set contains only English content. We provide more visualizations including the intermediate steps in the supplementary material. Overall these illustrations justify the versatility of our method across a diverse range of table appearances and content type."}, {"label": "section_header", "id": 4, "page_no": 7, "cluster": {"id": 4, "label": "section_header", "bbox": {"l": 308.862, "t": 490.70892, "r": 460.84848, "b": 501.45663, "coord_origin": "TOPLEFT"}, "confidence": 0.943652331829071, "cells": [{"id": 201, "text": "6.", "bbox": {"l": 308.862, "t": 490.70892, "r": 316.07382, "b": 501.45663, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": "Future Work & Conclusion", "bbox": {"l": 325.68954, "t": 490.70892, "r": 460.84848, "b": 501.45663, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "6. Future Work & Conclusion"}, {"label": "text", "id": 0, "page_no": 7, "cluster": {"id": 0, "label": "text", "bbox": {"l": 308.862, "t": 512.89337, "r": 545.11517, "b": 653.30592, "coord_origin": "TOPLEFT"}, "confidence": 0.9875594973564148, "cells": [{"id": 203, "text": "In this paper, we presented TableFormer an end-to-end", "bbox": {"l": 320.81699, "t": 512.89337, "r": 545.11505, "b": 521.79993, "coord_origin": "TOPLEFT"}}, {"id": 204, "text": "transformer based approach to predict table structures and", "bbox": {"l": 308.862, "t": 524.84836, "r": 545.11517, "b": 533.75491, "coord_origin": "TOPLEFT"}}, {"id": 205, "text": "bounding boxes of cells from an image. This approach en-", "bbox": {"l": 308.862, "t": 536.80336, "r": 545.11511, "b": 545.70992, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": "ables us to recreate the table structure, and extract the cell", "bbox": {"l": 308.862, "t": 548.75836, "r": 545.11505, "b": 557.6649199999999, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": "content from PDF or OCR by using bounding boxes. Ad-", "bbox": {"l": 308.862, "t": 560.71336, "r": 545.11517, "b": 569.61992, "coord_origin": "TOPLEFT"}}, {"id": 208, "text": "ditionally, it provides the versatility required in real-world", "bbox": {"l": 308.862, "t": 572.66837, "r": 545.11511, "b": 581.57492, "coord_origin": "TOPLEFT"}}, {"id": 209, "text": "scenarios when dealing with various types of PDF docu-", "bbox": {"l": 308.862, "t": 584.62436, "r": 545.11511, "b": 593.53091, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": "ments, and languages.", "bbox": {"l": 308.862, "t": 596.57936, "r": 400.46808, "b": 605.48592, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "Furthermore, our method outper-", "bbox": {"l": 408.37839, "t": 596.57936, "r": 545.11511, "b": 605.48592, "coord_origin": "TOPLEFT"}}, {"id": 212, "text": "forms all state-of-the-arts with a wide margin. Finally, we", "bbox": {"l": 308.862, "t": 608.53436, "r": 545.11505, "b": 617.44092, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "introduce \u201cSynthTabNet\u201d a challenging synthetically gen-", "bbox": {"l": 308.862, "t": 620.48936, "r": 545.11511, "b": 629.3959199999999, "coord_origin": "TOPLEFT"}}, {"id": 214, "text": "erated dataset that reinforces missing characteristics from", "bbox": {"l": 308.862, "t": 632.4443699999999, "r": 545.11505, "b": 641.35092, "coord_origin": "TOPLEFT"}}, {"id": 215, "text": "other datasets.", "bbox": {"l": 308.862, "t": 644.39937, "r": 365.85803, "b": 653.30592, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In this paper, we presented TableFormer an end-to-end transformer based approach to predict table structures and bounding boxes of cells from an image. This approach enables us to recreate the table structure, and extract the cell content from PDF or OCR by using bounding boxes. Additionally, it provides the versatility required in real-world scenarios when dealing with various types of PDF documents, and languages. Furthermore, our method outperforms all state-of-the-arts with a wide margin. Finally, we introduce \u201cSynthTabNet\u201d a challenging synthetically generated dataset that reinforces missing characteristics from other datasets."}, {"label": "section_header", "id": 3, "page_no": 7, "cluster": {"id": 3, "label": "section_header", "bbox": {"l": 308.862, "t": 672.09892, "r": 364.40585, "b": 682.84664, "coord_origin": "TOPLEFT"}, "confidence": 0.9442470669746399, "cells": [{"id": 216, "text": "References", "bbox": {"l": 308.862, "t": 672.09892, "r": 364.40585, "b": 682.84664, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "References"}, {"label": "list_item", "id": 10, "page_no": 7, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 313.345, "t": 693.9617920000001, "r": 545.1134, "b": 712.936752, "coord_origin": "TOPLEFT"}, "confidence": 0.8318749070167542, "cells": [{"id": 217, "text": "[1]", "bbox": {"l": 313.345, "t": 693.9617920000001, "r": 323.80792, "b": 701.977753, "coord_origin": "TOPLEFT"}}, {"id": 218, "text": "Nicolas Carion, Francisco Massa, Gabriel Synnaeve, Nicolas", "bbox": {"l": 326.05127, "t": 693.9617920000001, "r": 545.10852, "b": 701.977753, "coord_origin": "TOPLEFT"}}, {"id": 219, "text": "Usunier, Alexander Kirillov, and Sergey Zagoruyko. End-to-", "bbox": {"l": 328.78101, "t": 704.920792, "r": 545.1134, "b": 712.936752, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[1] Nicolas Carion, Francisco Massa, Gabriel Synnaeve, Nicolas Usunier, Alexander Kirillov, and Sergey Zagoruyko. End-to-"}, {"label": "page_footer", "id": 9, "page_no": 7, "cluster": {"id": 9, "label": "page_footer", "bbox": {"l": 295.121, "t": 734.133366, "r": 300.10229, "b": 743.039928, "coord_origin": "TOPLEFT"}, "confidence": 0.8709856867790222, "cells": [{"id": 220, "text": "8", "bbox": {"l": 295.121, "t": 734.133366, "r": 300.10229, "b": 743.039928, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "8"}, {"label": "picture", "id": 15, "page_no": 7, "cluster": {"id": 15, "label": "picture", "bbox": {"l": 305.58367919921875, "t": 98.65414428710938, "r": 554.8258666992188, "b": 180.6267547607422, "coord_origin": "TOPLEFT"}, "confidence": 0.7699168920516968, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "picture", "id": 14, "page_no": 7, "cluster": {"id": 14, "label": "picture", "bbox": {"l": 49.97503662109375, "t": 103.71266174316406, "r": 301.6335754394531, "b": 187.57891845703125, "coord_origin": "TOPLEFT"}, "confidence": 0.787392258644104, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "body": [{"label": "caption", "id": 18, "page_no": 7, "cluster": {"id": 18, "label": "caption", "bbox": {"l": 53.811783000000005, "t": 208.23328000000004, "r": 385.93451, "b": 216.10645, "coord_origin": "TOPLEFT"}, "confidence": 0.5986502170562744, "cells": [{"id": 0, "text": "b.", "bbox": {"l": 53.811783000000005, "t": 208.23328000000004, "r": 62.219952, "b": 216.10645, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Structure predicted by TableFormer, with superimposed matched PDF cell text:", "bbox": {"l": 66.424026, "t": 208.23328000000004, "r": 385.93451, "b": 216.10645, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "b. Structure predicted by TableFormer, with superimposed matched PDF cell text:"}, {"label": "section_header", "id": 29, "page_no": 7, "cluster": {"id": 29, "label": "section_header", "bbox": {"l": 53.811783000000005, "t": 94.28112999999996, "r": 284.34592, "b": 102.15430000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.46452993154525757, "cells": [{"id": 2, "text": "Japanese language (previously unseen by TableFormer):", "bbox": {"l": 53.811783000000005, "t": 94.28112999999996, "r": 284.34592, "b": 102.15430000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Japanese language (previously unseen by TableFormer):"}, {"label": "section_header", "id": 31, "page_no": 7, "cluster": {"id": 31, "label": "section_header", "bbox": {"l": 304.83081, "t": 94.28112999999996, "r": 431.09119, "b": 102.15430000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.46292340755462646, "cells": [{"id": 3, "text": "Example table from FinTabNet:", "bbox": {"l": 304.83081, "t": 94.28112999999996, "r": 431.09119, "b": 102.15430000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Example table from FinTabNet:"}, {"label": "list_item", "id": 20, "page_no": 7, "cluster": {"id": 20, "label": "list_item", "bbox": {"l": 53.286037, "t": 78.68756000000008, "r": 61.550289, "b": 86.56073000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.5820133090019226, "cells": [{"id": 4, "text": "a.", "bbox": {"l": 53.286037, "t": 78.68756000000008, "r": 61.550289, "b": 86.56073000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "a."}, {"label": "list_item", "id": 21, "page_no": 7, "cluster": {"id": 21, "label": "list_item", "bbox": {"l": 65.682419, "t": 78.68756000000008, "r": 499.55563, "b": 86.56073000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.5412113666534424, "cells": [{"id": 5, "text": "Red - PDF cells, Green - predicted bounding boxes, Blue - post-processed predictions matched to PDF cells", "bbox": {"l": 65.682419, "t": 78.68756000000008, "r": 499.55563, "b": 86.56073000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Red - PDF cells, Green - predicted bounding boxes, Blue - post-processed predictions matched to PDF cells"}, {"label": "table", "id": 8, "page_no": 7, "cluster": {"id": 8, "label": "table", "bbox": {"l": 53.6285514831543, "t": 218.94854736328125, "r": 298.5574645996094, "b": 292.3999938964844, "coord_origin": "TOPLEFT"}, "confidence": 0.8824008107185364, "cells": [{"id": 6, "text": "\u8ad6\u6587\u30d5\u30a1\u30a4\u30eb", "bbox": {"l": 209.93285, "t": 222.18073000000004, "r": 241.04458999999997, "b": 226.36212, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "\u53c2\u8003\u6587\u732e", "bbox": {"l": 263.76489, "t": 222.18073000000004, "r": 284.50589, "b": 226.36212, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "\u51fa\u5178", "bbox": {"l": 110.24990999999999, "t": 229.66594999999995, "r": 120.62018, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "\u30d5\u30a1\u30a4\u30eb", "bbox": {"l": 175.36609, "t": 229.66594999999995, "r": 196.1071, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "\u6570", "bbox": {"l": 196.10756, "t": 229.66594999999995, "r": 201.29247, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "\u82f1\u8a9e", "bbox": {"l": 209.62408, "t": 229.66594999999995, "r": 219.99435, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "\u65e5\u672c\u8a9e", "bbox": {"l": 229.19814, "t": 229.66594999999995, "r": 244.75377, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "\u82f1\u8a9e", "bbox": {"l": 256.1142, "t": 229.66594999999995, "r": 266.48447, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "\u65e5\u672c\u8a9e", "bbox": {"l": 278.38434, "t": 229.66594999999995, "r": 293.93997, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Association for Computational Linguistics(ACL2003)", "bbox": {"l": 55.53052099999999, "t": 236.42584, "r": 162.7131, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "65", "bbox": {"l": 184.39731, "t": 236.42584, "r": 189.56456, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "65", "bbox": {"l": 208.99026, "t": 236.42584, "r": 214.15752, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "0", "bbox": {"l": 234.87517, "t": 236.42584, "r": 237.45833000000002, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "150", "bbox": {"l": 256.88446, "t": 236.42584, "r": 264.6358, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "0", "bbox": {"l": 284.06134, "t": 236.42584, "r": 286.6445, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Computational Linguistics(COLING2002)", "bbox": {"l": 55.53052099999999, "t": 242.62048000000004, "r": 139.72253, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "140", "bbox": {"l": 183.10536, "t": 242.62048000000004, "r": 190.8567, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "140", "bbox": {"l": 207.69832, "t": 242.62048000000004, "r": 215.44965999999997, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "0", "bbox": {"l": 234.87517, "t": 242.62048000000004, "r": 237.45833000000002, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "150", "bbox": {"l": 256.88446, "t": 242.62048000000004, "r": 264.6358, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "0", "bbox": {"l": 284.06134, "t": 242.62048000000004, "r": 286.6445, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "\u96fb\u6c17\u60c5\u5831\u901a\u4fe1\u5b66\u4f1a", "bbox": {"l": 55.53052099999999, "t": 249.79845999999998, "r": 97.013, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "2003", "bbox": {"l": 92.698288, "t": 249.58942000000002, "r": 103.03371, "b": 253.94732999999997, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "\u5e74\u7dcf\u5408\u5927\u4f1a", "bbox": {"l": 103.03389, "t": 249.79845999999998, "r": 128.96027, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "150", "bbox": {"l": 183.10536, "t": 248.81506000000002, "r": 190.8567, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "8", "bbox": {"l": 210.28223, "t": 248.81506000000002, "r": 212.86539, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "142", "bbox": {"l": 232.29153, "t": 248.81506000000002, "r": 240.04287999999997, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "223", "bbox": {"l": 256.88446, "t": 248.81506000000002, "r": 264.6358, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "147", "bbox": {"l": 281.47742, "t": 248.81506000000002, "r": 289.22876, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "\u60c5\u5831\u51e6\u7406\u5b66\u4f1a\u7b2c", "bbox": {"l": 55.53052099999999, "t": 257.28369, "r": 91.827637, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "65", "bbox": {"l": 88.052673, "t": 257.07465, "r": 93.219925, "b": 261.43255999999997, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "\u56de\u5168\u56fd\u5927\u4f1a", "bbox": {"l": 93.220474, "t": 257.28369, "r": 119.14685, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "(2003)", "bbox": {"l": 116.45073999999998, "t": 257.07465, "r": 129.88177, "b": 261.43255999999997, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "177", "bbox": {"l": 183.10536, "t": 256.30029, "r": 190.8567, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "1", "bbox": {"l": 210.28223, "t": 256.30029, "r": 212.86539, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "176", "bbox": {"l": 232.29153, "t": 256.30029, "r": 240.04287999999997, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "150", "bbox": {"l": 256.88446, "t": 256.30029, "r": 264.6358, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "236", "bbox": {"l": 281.47742, "t": 256.30029, "r": 289.22876, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "\u7b2c", "bbox": {"l": 55.53052099999999, "t": 264.5108, "r": 60.715424, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "17", "bbox": {"l": 60.17654799999999, "t": 264.30175999999994, "r": 65.343796, "b": 268.65967, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "\u56de\u4eba\u5de5\u77e5\u80fd\u5b66\u4f1a\u5168\u56fd\u5927\u4f1a", "bbox": {"l": 65.344376, "t": 264.5108, "r": 122.38297000000001, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "(2003)", "bbox": {"l": 116.45073999999998, "t": 264.30175999999994, "r": 129.88177, "b": 268.65967, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "208", "bbox": {"l": 183.10536, "t": 263.52739999999994, "r": 190.8567, "b": 267.88531, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "5", "bbox": {"l": 210.28223, "t": 263.52739999999994, "r": 212.86539, "b": 267.88531, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "203", "bbox": {"l": 232.29153, "t": 263.52739999999994, "r": 240.04287999999997, "b": 267.88531, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "152", "bbox": {"l": 256.88446, "t": 263.52739999999994, "r": 264.6358, "b": 267.88531, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "244", "bbox": {"l": 281.47742, "t": 263.52739999999994, "r": 289.22876, "b": 267.88531, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "\u81ea\u7136\u8a00\u8a9e\u51e6\u7406\u7814\u7a76\u4f1a\u7b2c", "bbox": {"l": 55.53052099999999, "t": 271.73785, "r": 107.38374, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "146", "bbox": {"l": 101.99034, "t": 271.52881, "r": 109.74168000000002, "b": 275.88671999999997, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "\u301c", "bbox": {"l": 109.74204, "t": 271.73785, "r": 114.92695000000002, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "155", "bbox": {"l": 114.38793, "t": 271.52881, "r": 122.13927, "b": 275.88671999999997, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "\u56de", "bbox": {"l": 122.13963, "t": 271.73785, "r": 127.32454000000001, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "98", "bbox": {"l": 184.39731, "t": 270.75446, "r": 189.56456, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "2", "bbox": {"l": 210.28223, "t": 270.75446, "r": 212.86539, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "96", "bbox": {"l": 233.58348, "t": 270.75446, "r": 238.75072999999998, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "150", "bbox": {"l": 256.88446, "t": 270.75446, "r": 264.6358, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "232", "bbox": {"l": 281.47742, "t": 270.75446, "r": 289.22876, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "WWW", "bbox": {"l": 55.53052099999999, "t": 279.01392, "r": 68.68605, "b": 283.37183, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "\u304b\u3089\u53ce\u96c6\u3057\u305f\u8ad6\u6587", "bbox": {"l": 68.685814, "t": 279.22295999999994, "r": 110.16829999999999, "b": 283.40436, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "107", "bbox": {"l": 183.10536, "t": 277.98157000000003, "r": 190.8567, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "73", "bbox": {"l": 208.99026, "t": 277.98157000000003, "r": 214.15752, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "34", "bbox": {"l": 233.58348, "t": 277.98157000000003, "r": 238.75072999999998, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "147", "bbox": {"l": 256.88446, "t": 277.98157000000003, "r": 264.6358, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "96", "bbox": {"l": 282.76938, "t": 277.98157000000003, "r": 287.93661, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "\u8a08", "bbox": {"l": 169.61508, "t": 286.45004, "r": 174.79999, "b": 290.63141, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "945", "bbox": {"l": 183.10536, "t": 285.46667, "r": 190.8567, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "294", "bbox": {"l": 207.69832, "t": 285.46667, "r": 215.44965999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "651", "bbox": {"l": 232.29153, "t": 285.46667, "r": 240.04287999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "1122", "bbox": {"l": 255.76506, "t": 285.46667, "r": 265.75204, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "955", "bbox": {"l": 281.47742, "t": 285.46667, "r": 289.22876, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}], "children": [{"id": 32, "label": "text", "bbox": {"l": 209.93285, "t": 222.18073000000004, "r": 241.04458999999997, "b": 226.36212, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": "\u8ad6\u6587\u30d5\u30a1\u30a4\u30eb", "bbox": {"l": 209.93285, "t": 222.18073000000004, "r": 241.04458999999997, "b": 226.36212, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 263.76489, "t": 222.18073000000004, "r": 284.50589, "b": 226.36212, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "\u53c2\u8003\u6587\u732e", "bbox": {"l": 263.76489, "t": 222.18073000000004, "r": 284.50589, "b": 226.36212, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 110.24990999999999, "t": 229.66594999999995, "r": 120.62018, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "\u51fa\u5178", "bbox": {"l": 110.24990999999999, "t": 229.66594999999995, "r": 120.62018, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 175.36609, "t": 229.66594999999995, "r": 196.1071, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "\u30d5\u30a1\u30a4\u30eb", "bbox": {"l": 175.36609, "t": 229.66594999999995, "r": 196.1071, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 196.10756, "t": 229.66594999999995, "r": 201.29247, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "\u6570", "bbox": {"l": 196.10756, "t": 229.66594999999995, "r": 201.29247, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 209.62408, "t": 229.66594999999995, "r": 219.99435, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "\u82f1\u8a9e", "bbox": {"l": 209.62408, "t": 229.66594999999995, "r": 219.99435, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 229.19814, "t": 229.66594999999995, "r": 244.75377, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "\u65e5\u672c\u8a9e", "bbox": {"l": 229.19814, "t": 229.66594999999995, "r": 244.75377, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 256.1142, "t": 229.66594999999995, "r": 266.48447, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "\u82f1\u8a9e", "bbox": {"l": 256.1142, "t": 229.66594999999995, "r": 266.48447, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 278.38434, "t": 229.66594999999995, "r": 293.93997, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "\u65e5\u672c\u8a9e", "bbox": {"l": 278.38434, "t": 229.66594999999995, "r": 293.93997, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 55.53052099999999, "t": 236.42584, "r": 162.7131, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "Association for Computational Linguistics(ACL2003)", "bbox": {"l": 55.53052099999999, "t": 236.42584, "r": 162.7131, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 184.39731, "t": 236.42584, "r": 189.56456, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "65", "bbox": {"l": 184.39731, "t": 236.42584, "r": 189.56456, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 208.99026, "t": 236.42584, "r": 214.15752, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "65", "bbox": {"l": 208.99026, "t": 236.42584, "r": 214.15752, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 234.87517, "t": 236.42584, "r": 237.45833000000002, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "0", "bbox": {"l": 234.87517, "t": 236.42584, "r": 237.45833000000002, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 256.88446, "t": 236.42584, "r": 264.6358, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "150", "bbox": {"l": 256.88446, "t": 236.42584, "r": 264.6358, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 284.06134, "t": 236.42584, "r": 286.6445, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "0", "bbox": {"l": 284.06134, "t": 236.42584, "r": 286.6445, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 55.53052099999999, "t": 242.62048000000004, "r": 139.72253, "b": 246.97839, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "Computational Linguistics(COLING2002)", "bbox": {"l": 55.53052099999999, "t": 242.62048000000004, "r": 139.72253, "b": 246.97839, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 183.10536, "t": 242.62048000000004, "r": 190.8567, "b": 246.97839, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "140", "bbox": {"l": 183.10536, "t": 242.62048000000004, "r": 190.8567, "b": 246.97839, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 207.69832, "t": 242.62048000000004, "r": 215.44965999999997, "b": 246.97839, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "140", "bbox": {"l": 207.69832, "t": 242.62048000000004, "r": 215.44965999999997, "b": 246.97839, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 234.87517, "t": 242.62048000000004, "r": 237.45833000000002, "b": 246.97839, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "0", "bbox": {"l": 234.87517, "t": 242.62048000000004, "r": 237.45833000000002, "b": 246.97839, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 256.88446, "t": 242.62048000000004, "r": 264.6358, "b": 246.97839, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "150", "bbox": {"l": 256.88446, "t": 242.62048000000004, "r": 264.6358, "b": 246.97839, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 284.06134, "t": 242.62048000000004, "r": 286.6445, "b": 246.97839, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "0", "bbox": {"l": 284.06134, "t": 242.62048000000004, "r": 286.6445, "b": 246.97839, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 55.53052099999999, "t": 249.79845999999998, "r": 97.013, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "\u96fb\u6c17\u60c5\u5831\u901a\u4fe1\u5b66\u4f1a", "bbox": {"l": 55.53052099999999, "t": 249.79845999999998, "r": 97.013, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 92.698288, "t": 249.58942000000002, "r": 103.03371, "b": 253.94732999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "2003", "bbox": {"l": 92.698288, "t": 249.58942000000002, "r": 103.03371, "b": 253.94732999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 103.03389, "t": 249.79845999999998, "r": 128.96027, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "\u5e74\u7dcf\u5408\u5927\u4f1a", "bbox": {"l": 103.03389, "t": 249.79845999999998, "r": 128.96027, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 183.10536, "t": 248.81506000000002, "r": 190.8567, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "150", "bbox": {"l": 183.10536, "t": 248.81506000000002, "r": 190.8567, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 210.28223, "t": 248.81506000000002, "r": 212.86539, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "8", "bbox": {"l": 210.28223, "t": 248.81506000000002, "r": 212.86539, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 232.29153, "t": 248.81506000000002, "r": 240.04287999999997, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "142", "bbox": {"l": 232.29153, "t": 248.81506000000002, "r": 240.04287999999997, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 256.88446, "t": 248.81506000000002, "r": 264.6358, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "223", "bbox": {"l": 256.88446, "t": 248.81506000000002, "r": 264.6358, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 281.47742, "t": 248.81506000000002, "r": 289.22876, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "147", "bbox": {"l": 281.47742, "t": 248.81506000000002, "r": 289.22876, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 55.53052099999999, "t": 257.28369, "r": 91.827637, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "\u60c5\u5831\u51e6\u7406\u5b66\u4f1a\u7b2c", "bbox": {"l": 55.53052099999999, "t": 257.28369, "r": 91.827637, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 88.052673, "t": 257.07465, "r": 93.219925, "b": 261.43255999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "65", "bbox": {"l": 88.052673, "t": 257.07465, "r": 93.219925, "b": 261.43255999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 93.220474, "t": 257.28369, "r": 119.14685, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "\u56de\u5168\u56fd\u5927\u4f1a", "bbox": {"l": 93.220474, "t": 257.28369, "r": 119.14685, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 116.45073999999998, "t": 257.07465, "r": 129.88177, "b": 261.43255999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "(2003)", "bbox": {"l": 116.45073999999998, "t": 257.07465, "r": 129.88177, "b": 261.43255999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 183.10536, "t": 256.30029, "r": 190.8567, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "177", "bbox": {"l": 183.10536, "t": 256.30029, "r": 190.8567, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 210.28223, "t": 256.30029, "r": 212.86539, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "1", "bbox": {"l": 210.28223, "t": 256.30029, "r": 212.86539, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 232.29153, "t": 256.30029, "r": 240.04287999999997, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "176", "bbox": {"l": 232.29153, "t": 256.30029, "r": 240.04287999999997, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 256.88446, "t": 256.30029, "r": 264.6358, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "150", "bbox": {"l": 256.88446, "t": 256.30029, "r": 264.6358, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 281.47742, "t": 256.30029, "r": 289.22876, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "236", "bbox": {"l": 281.47742, "t": 256.30029, "r": 289.22876, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 55.53052099999999, "t": 264.5108, "r": 60.715424, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "\u7b2c", "bbox": {"l": 55.53052099999999, "t": 264.5108, "r": 60.715424, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 60.17654799999999, "t": 264.30175999999994, "r": 65.343796, "b": 268.65967, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "17", "bbox": {"l": 60.17654799999999, "t": 264.30175999999994, "r": 65.343796, "b": 268.65967, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 65.344376, "t": 264.5108, "r": 122.38297000000001, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "\u56de\u4eba\u5de5\u77e5\u80fd\u5b66\u4f1a\u5168\u56fd\u5927\u4f1a", "bbox": {"l": 65.344376, "t": 264.5108, "r": 122.38297000000001, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 116.45073999999998, "t": 264.30175999999994, "r": 129.88177, "b": 268.65967, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "(2003)", "bbox": {"l": 116.45073999999998, "t": 264.30175999999994, "r": 129.88177, "b": 268.65967, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 183.10536, "t": 263.52739999999994, "r": 190.8567, "b": 267.88531, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "208", "bbox": {"l": 183.10536, "t": 263.52739999999994, "r": 190.8567, "b": 267.88531, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 210.28223, "t": 263.52739999999994, "r": 212.86539, "b": 267.88531, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "5", "bbox": {"l": 210.28223, "t": 263.52739999999994, "r": 212.86539, "b": 267.88531, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 232.29153, "t": 263.52739999999994, "r": 240.04287999999997, "b": 267.88531, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "203", "bbox": {"l": 232.29153, "t": 263.52739999999994, "r": 240.04287999999997, "b": 267.88531, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 256.88446, "t": 263.52739999999994, "r": 264.6358, "b": 267.88531, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "152", "bbox": {"l": 256.88446, "t": 263.52739999999994, "r": 264.6358, "b": 267.88531, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 281.47742, "t": 263.52739999999994, "r": 289.22876, "b": 267.88531, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "244", "bbox": {"l": 281.47742, "t": 263.52739999999994, "r": 289.22876, "b": 267.88531, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 55.53052099999999, "t": 271.73785, "r": 107.38374, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "\u81ea\u7136\u8a00\u8a9e\u51e6\u7406\u7814\u7a76\u4f1a\u7b2c", "bbox": {"l": 55.53052099999999, "t": 271.73785, "r": 107.38374, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 101.99034, "t": 271.52881, "r": 109.74168000000002, "b": 275.88671999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "146", "bbox": {"l": 101.99034, "t": 271.52881, "r": 109.74168000000002, "b": 275.88671999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 109.74204, "t": 271.73785, "r": 114.92695000000002, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "\u301c", "bbox": {"l": 109.74204, "t": 271.73785, "r": 114.92695000000002, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 114.38793, "t": 271.52881, "r": 122.13927, "b": 275.88671999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "155", "bbox": {"l": 114.38793, "t": 271.52881, "r": 122.13927, "b": 275.88671999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 122.13963, "t": 271.73785, "r": 127.32454000000001, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "\u56de", "bbox": {"l": 122.13963, "t": 271.73785, "r": 127.32454000000001, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 184.39731, "t": 270.75446, "r": 189.56456, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "98", "bbox": {"l": 184.39731, "t": 270.75446, "r": 189.56456, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 210.28223, "t": 270.75446, "r": 212.86539, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "2", "bbox": {"l": 210.28223, "t": 270.75446, "r": 212.86539, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 233.58348, "t": 270.75446, "r": 238.75072999999998, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "96", "bbox": {"l": 233.58348, "t": 270.75446, "r": 238.75072999999998, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 256.88446, "t": 270.75446, "r": 264.6358, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "150", "bbox": {"l": 256.88446, "t": 270.75446, "r": 264.6358, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 281.47742, "t": 270.75446, "r": 289.22876, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "232", "bbox": {"l": 281.47742, "t": 270.75446, "r": 289.22876, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 55.53052099999999, "t": 279.01392, "r": 68.68605, "b": 283.37183, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "WWW", "bbox": {"l": 55.53052099999999, "t": 279.01392, "r": 68.68605, "b": 283.37183, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 68.685814, "t": 279.22295999999994, "r": 110.16829999999999, "b": 283.40436, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "\u304b\u3089\u53ce\u96c6\u3057\u305f\u8ad6\u6587", "bbox": {"l": 68.685814, "t": 279.22295999999994, "r": 110.16829999999999, "b": 283.40436, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 183.10536, "t": 277.98157000000003, "r": 190.8567, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "107", "bbox": {"l": 183.10536, "t": 277.98157000000003, "r": 190.8567, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 208.99026, "t": 277.98157000000003, "r": 214.15752, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "73", "bbox": {"l": 208.99026, "t": 277.98157000000003, "r": 214.15752, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 233.58348, "t": 277.98157000000003, "r": 238.75072999999998, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "34", "bbox": {"l": 233.58348, "t": 277.98157000000003, "r": 238.75072999999998, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 256.88446, "t": 277.98157000000003, "r": 264.6358, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "147", "bbox": {"l": 256.88446, "t": 277.98157000000003, "r": 264.6358, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 282.76938, "t": 277.98157000000003, "r": 287.93661, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "96", "bbox": {"l": 282.76938, "t": 277.98157000000003, "r": 287.93661, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 169.61508, "t": 286.45004, "r": 174.79999, "b": 290.63141, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "\u8a08", "bbox": {"l": 169.61508, "t": 286.45004, "r": 174.79999, "b": 290.63141, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 183.10536, "t": 285.46667, "r": 190.8567, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "945", "bbox": {"l": 183.10536, "t": 285.46667, "r": 190.8567, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 207.69832, "t": 285.46667, "r": 215.44965999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "294", "bbox": {"l": 207.69832, "t": 285.46667, "r": 215.44965999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 232.29153, "t": 285.46667, "r": 240.04287999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "651", "bbox": {"l": 232.29153, "t": 285.46667, "r": 240.04287999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 255.76506, "t": 285.46667, "r": 265.75204, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "1122", "bbox": {"l": 255.76506, "t": 285.46667, "r": 265.75204, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 281.47742, "t": 285.46667, "r": 289.22876, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "955", "bbox": {"l": 281.47742, "t": 285.46667, "r": 289.22876, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "lcel", "ched", "lcel", "nl", "ched", "ched", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 10, "num_cols": 6, "table_cells": [{"bbox": {"l": 209.93285, "t": 222.18073000000004, "r": 241.04458999999997, "b": 226.36212, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 4, "text": "\u8ad6\u6587\u30d5\u30a1\u30a4\u30eb", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 263.76489, "t": 222.18073000000004, "r": 284.50589, "b": 226.36212, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 4, "end_col_offset_idx": 6, "text": "\u53c2\u8003\u6587\u732e", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 110.24990999999999, "t": 229.66594999999995, "r": 120.62018, "b": 233.84735, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "\u51fa\u5178", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 175.36609, "t": 229.66594999999995, "r": 201.29247, "b": 233.84735, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "\u30d5\u30a1\u30a4\u30eb \u6570", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 209.62408, "t": 229.66594999999995, "r": 219.99435, "b": 233.84735, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "\u82f1\u8a9e", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 229.19814, "t": 229.66594999999995, "r": 244.75377, "b": 233.84735, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "\u65e5\u672c\u8a9e", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 256.1142, "t": 229.66594999999995, "r": 266.48447, "b": 233.84735, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "\u82f1\u8a9e", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 278.38434, "t": 229.66594999999995, "r": 293.93997, "b": 233.84735, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "\u65e5\u672c\u8a9e", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 55.53052099999999, "t": 236.42584, "r": 162.7131, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Association for Computational Linguistics(ACL2003)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 184.39731, "t": 236.42584, "r": 189.56456, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "65", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 208.99026, "t": 236.42584, "r": 214.15752, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "65", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 234.87517, "t": 236.42584, "r": 237.45833000000002, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446, "t": 236.42584, "r": 264.6358, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "150", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 284.06134, "t": 236.42584, "r": 286.6445, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 55.53052099999999, "t": 242.62048000000004, "r": 139.72253, "b": 246.97839, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Computational Linguistics(COLING2002)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 183.10536, "t": 242.62048000000004, "r": 190.8567, "b": 246.97839, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "140", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 207.69832, "t": 242.62048000000004, "r": 215.44965999999997, "b": 246.97839, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "140", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 234.87517, "t": 242.62048000000004, "r": 237.45833000000002, "b": 246.97839, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446, "t": 242.62048000000004, "r": 264.6358, "b": 246.97839, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "150", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 284.06134, "t": 242.62048000000004, "r": 286.6445, "b": 246.97839, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 55.53052099999999, "t": 249.58942000000002, "r": 128.96027, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "\u96fb\u6c17\u60c5\u5831\u901a\u4fe1\u5b66\u4f1a 2003 \u5e74\u7dcf\u5408\u5927\u4f1a", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 183.10536, "t": 248.81506000000002, "r": 190.8567, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "150", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 210.28223, "t": 248.81506000000002, "r": 212.86539, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.29153, "t": 248.81506000000002, "r": 240.04287999999997, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "142", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446, "t": 248.81506000000002, "r": 264.6358, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "223", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.47742, "t": 248.81506000000002, "r": 289.22876, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "147", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 55.53052099999999, "t": 257.07465, "r": 129.88177, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "\u60c5\u5831\u51e6\u7406\u5b66\u4f1a\u7b2c 65 \u56de\u5168\u56fd\u5927\u4f1a (2003)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 183.10536, "t": 256.30029, "r": 190.8567, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "177", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 210.28223, "t": 256.30029, "r": 212.86539, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.29153, "t": 256.30029, "r": 240.04287999999997, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "176", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446, "t": 256.30029, "r": 264.6358, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "150", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.47742, "t": 256.30029, "r": 289.22876, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "236", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 55.53052099999999, "t": 264.30175999999994, "r": 129.88177, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "\u7b2c 17 \u56de\u4eba\u5de5\u77e5\u80fd\u5b66\u4f1a\u5168\u56fd\u5927\u4f1a (2003)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 183.10536, "t": 263.52739999999994, "r": 190.8567, "b": 267.88531, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "208", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 210.28223, "t": 263.52739999999994, "r": 212.86539, "b": 267.88531, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.29153, "t": 263.52739999999994, "r": 240.04287999999997, "b": 267.88531, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "203", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446, "t": 263.52739999999994, "r": 264.6358, "b": 267.88531, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "152", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.47742, "t": 263.52739999999994, "r": 289.22876, "b": 267.88531, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "244", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 55.53052099999999, "t": 271.52881, "r": 127.32454000000001, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "\u81ea\u7136\u8a00\u8a9e\u51e6\u7406\u7814\u7a76\u4f1a\u7b2c 146 \u301c 155 \u56de", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 184.39731, "t": 270.75446, "r": 189.56456, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "98", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 210.28223, "t": 270.75446, "r": 212.86539, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 233.58348, "t": 270.75446, "r": 238.75072999999998, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446, "t": 270.75446, "r": 264.6358, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "150", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.47742, "t": 270.75446, "r": 289.22876, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "232", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 55.53052099999999, "t": 279.01392, "r": 110.16829999999999, "b": 283.40436, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "WWW \u304b\u3089\u53ce\u96c6\u3057\u305f\u8ad6\u6587", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 183.10536, "t": 277.98157000000003, "r": 190.8567, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "107", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 208.99026, "t": 277.98157000000003, "r": 214.15752, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "73", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 233.58348, "t": 277.98157000000003, "r": 238.75072999999998, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "34", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446, "t": 277.98157000000003, "r": 264.6358, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "147", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 282.76938, "t": 277.98157000000003, "r": 287.93661, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 183.10536, "t": 285.46667, "r": 190.8567, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "945", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 207.69832, "t": 285.46667, "r": 215.44965999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "294", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.29153, "t": 285.46667, "r": 240.04287999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "651", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 255.76506, "t": 285.46667, "r": 265.75204, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "1122", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.47742, "t": 285.46667, "r": 289.22876, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "955", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "caption", "id": 16, "page_no": 7, "cluster": {"id": 16, "label": "caption", "bbox": {"l": 380.42731, "t": 292.30426, "r": 549.42175, "b": 298.60284, "coord_origin": "TOPLEFT"}, "confidence": 0.7499910593032837, "cells": [{"id": 76, "text": "Text is aligned to match original for ease of viewing", "bbox": {"l": 380.42731, "t": 292.30426, "r": 549.42175, "b": 298.60284, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Text is aligned to match original for ease of viewing"}, {"label": "table", "id": 7, "page_no": 7, "cluster": {"id": 7, "label": "table", "bbox": {"l": 304.9219970703125, "t": 218.51486206054688, "r": 550.2321166992188, "b": 287.90069580078125, "coord_origin": "TOPLEFT"}, "confidence": 0.8899765014648438, "cells": [{"id": 77, "text": "Weighted Average Grant Date Fair", "bbox": {"l": 459.04861, "t": 221.62415, "r": 542.00018, "b": 226.68933000000004, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "Value", "bbox": {"l": 493.82193, "t": 227.83416999999997, "r": 507.2258, "b": 232.89935000000003, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "RS", "bbox": {"l": 393.2442, "t": 236.74712999999997, "r": 400.74588, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "U", "bbox": {"l": 400.74643, "t": 236.74712999999997, "r": 404.64523, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "s", "bbox": {"l": 404.6463, "t": 236.74712999999997, "r": 407.34631, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "Shares (in millions)", "bbox": {"l": 392.09671, "t": 221.57446000000004, "r": 438.0145, "b": 226.63964999999996, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "PSUs", "bbox": {"l": 427.18323, "t": 236.74712999999997, "r": 440.98778999999996, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "RSUs", "bbox": {"l": 468.38254, "t": 236.74712999999997, "r": 482.48465000000004, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "PSUs", "bbox": {"l": 516.92578, "t": 236.74712999999997, "r": 530.73035, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Nonvested on Janua", "bbox": {"l": 306.11493, "t": 244.61084000000005, "r": 355.6532, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "ry 1", "bbox": {"l": 355.65427, "t": 244.61084000000005, "r": 364.65607, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "1.", "bbox": {"l": 396.24661, "t": 244.91327, "r": 400.75238, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "1", "bbox": {"l": 400.7529, "t": 244.91327, "r": 403.75531, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "0.3", "bbox": {"l": 429.81838999999997, "t": 244.91327, "r": 437.32708999999994, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "90.10", "bbox": {"l": 465.52859, "t": 244.91327, "r": 478.40103, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "$", "bbox": {"l": 480.97552, "t": 244.91327, "r": 483.55001999999996, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "$ 91.19", "bbox": {"l": 513.44824, "t": 244.91327, "r": 531.46967, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "Granted", "bbox": {"l": 306.11493, "t": 253.68451000000005, "r": 325.62674, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "0.", "bbox": {"l": 396.24661, "t": 253.68451000000005, "r": 400.75238, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "5", "bbox": {"l": 400.7529, "t": 253.68451000000005, "r": 403.75531, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "0.1", "bbox": {"l": 429.81838999999997, "t": 253.68451000000005, "r": 437.32708999999994, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "117.44", "bbox": {"l": 466.43579000000005, "t": 253.68451000000005, "r": 482.54831, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "122.41", "bbox": {"l": 514.29065, "t": 253.68451000000005, "r": 530.80981, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "Vested", "bbox": {"l": 306.11493, "t": 261.54822, "r": 322.62866, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "(0.", "bbox": {"l": 394.43222, "t": 261.54822, "r": 400.73563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "5", "bbox": {"l": 400.73456, "t": 261.54822, "r": 403.73697, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": ")", "bbox": {"l": 403.73804, "t": 261.54822, "r": 405.53625, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "(0.1)", "bbox": {"l": 427.7016, "t": 261.54822, "r": 438.80563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "87.08", "bbox": {"l": 468.55533, "t": 261.54822, "r": 482.07043, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "81.14", "bbox": {"l": 516.01862, "t": 261.54822, "r": 529.53375, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "Canceled or forfeited", "bbox": {"l": 306.11493, "t": 269.64148, "r": 356.24771, "b": 274.70667000000003, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "(0.", "bbox": {"l": 394.43222, "t": 270.31946000000005, "r": 400.73563, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "1", "bbox": {"l": 400.73456, "t": 270.31946000000005, "r": 403.73697, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": ")", "bbox": {"l": 403.73804, "t": 270.31946000000005, "r": 405.53625, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "-", "bbox": {"l": 431.02802, "t": 270.31946000000005, "r": 436.4280099999999, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "102.01", "bbox": {"l": 465.83099000000004, "t": 270.31946000000005, "r": 482.35013, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "92.18", "bbox": {"l": 516.01862, "t": 270.31946000000005, "r": 529.53375, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "Nonvested on December 31", "bbox": {"l": 306.11493, "t": 278.48572, "r": 373.35764, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "1.0", "bbox": {"l": 396.24661, "t": 278.48572, "r": 403.75531, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "0.3", "bbox": {"l": 429.51599, "t": 278.48572, "r": 437.02469, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "104.85 $", "bbox": {"l": 463.7142, "t": 278.48572, "r": 484.73965000000004, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "$ 104.51", "bbox": {"l": 512.99463, "t": 278.48572, "r": 534.02008, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}], "children": [{"id": 102, "label": "text", "bbox": {"l": 459.04861, "t": 221.62415, "r": 542.00018, "b": 226.68933000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "Weighted Average Grant Date Fair", "bbox": {"l": 459.04861, "t": 221.62415, "r": 542.00018, "b": 226.68933000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 493.82193, "t": 227.83416999999997, "r": 507.2258, "b": 232.89935000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "Value", "bbox": {"l": 493.82193, "t": 227.83416999999997, "r": 507.2258, "b": 232.89935000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 393.2442, "t": 236.74712999999997, "r": 400.74588, "b": 241.81232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "RS", "bbox": {"l": 393.2442, "t": 236.74712999999997, "r": 400.74588, "b": 241.81232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 400.74643, "t": 236.74712999999997, "r": 404.64523, "b": 241.81232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "U", "bbox": {"l": 400.74643, "t": 236.74712999999997, "r": 404.64523, "b": 241.81232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 404.6463, "t": 236.74712999999997, "r": 407.34631, "b": 241.81232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "s", "bbox": {"l": 404.6463, "t": 236.74712999999997, "r": 407.34631, "b": 241.81232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 392.09671, "t": 221.57446000000004, "r": 438.0145, "b": 226.63964999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "Shares (in millions)", "bbox": {"l": 392.09671, "t": 221.57446000000004, "r": 438.0145, "b": 226.63964999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 427.18323, "t": 236.74712999999997, "r": 440.98778999999996, "b": 241.81232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "PSUs", "bbox": {"l": 427.18323, "t": 236.74712999999997, "r": 440.98778999999996, "b": 241.81232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 468.38254, "t": 236.74712999999997, "r": 482.48465000000004, "b": 241.81232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "RSUs", "bbox": {"l": 468.38254, "t": 236.74712999999997, "r": 482.48465000000004, "b": 241.81232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 516.92578, "t": 236.74712999999997, "r": 530.73035, "b": 241.81232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "PSUs", "bbox": {"l": 516.92578, "t": 236.74712999999997, "r": 530.73035, "b": 241.81232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 306.11493, "t": 244.61084000000005, "r": 355.6532, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "Nonvested on Janua", "bbox": {"l": 306.11493, "t": 244.61084000000005, "r": 355.6532, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 355.65427, "t": 244.61084000000005, "r": 364.65607, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "ry 1", "bbox": {"l": 355.65427, "t": 244.61084000000005, "r": 364.65607, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 396.24661, "t": 244.91327, "r": 400.75238, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "1.", "bbox": {"l": 396.24661, "t": 244.91327, "r": 400.75238, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 114, "label": "text", "bbox": {"l": 400.7529, "t": 244.91327, "r": 403.75531, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "1", "bbox": {"l": 400.7529, "t": 244.91327, "r": 403.75531, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 115, "label": "text", "bbox": {"l": 429.81838999999997, "t": 244.91327, "r": 437.32708999999994, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "0.3", "bbox": {"l": 429.81838999999997, "t": 244.91327, "r": 437.32708999999994, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 116, "label": "text", "bbox": {"l": 465.52859, "t": 244.91327, "r": 478.40103, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "90.10", "bbox": {"l": 465.52859, "t": 244.91327, "r": 478.40103, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 117, "label": "text", "bbox": {"l": 480.97552, "t": 244.91327, "r": 483.55001999999996, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "$", "bbox": {"l": 480.97552, "t": 244.91327, "r": 483.55001999999996, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 118, "label": "text", "bbox": {"l": 513.44824, "t": 244.91327, "r": 531.46967, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "$ 91.19", "bbox": {"l": 513.44824, "t": 244.91327, "r": 531.46967, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 119, "label": "text", "bbox": {"l": 306.11493, "t": 253.68451000000005, "r": 325.62674, "b": 258.74969, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "Granted", "bbox": {"l": 306.11493, "t": 253.68451000000005, "r": 325.62674, "b": 258.74969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 120, "label": "text", "bbox": {"l": 396.24661, "t": 253.68451000000005, "r": 400.75238, "b": 258.74969, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "0.", "bbox": {"l": 396.24661, "t": 253.68451000000005, "r": 400.75238, "b": 258.74969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 121, "label": "text", "bbox": {"l": 400.7529, "t": 253.68451000000005, "r": 403.75531, "b": 258.74969, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "5", "bbox": {"l": 400.7529, "t": 253.68451000000005, "r": 403.75531, "b": 258.74969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 122, "label": "text", "bbox": {"l": 429.81838999999997, "t": 253.68451000000005, "r": 437.32708999999994, "b": 258.74969, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "0.1", "bbox": {"l": 429.81838999999997, "t": 253.68451000000005, "r": 437.32708999999994, "b": 258.74969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 123, "label": "text", "bbox": {"l": 466.43579000000005, "t": 253.68451000000005, "r": 482.54831, "b": 258.74969, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "117.44", "bbox": {"l": 466.43579000000005, "t": 253.68451000000005, "r": 482.54831, "b": 258.74969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 124, "label": "text", "bbox": {"l": 514.29065, "t": 253.68451000000005, "r": 530.80981, "b": 258.74969, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "122.41", "bbox": {"l": 514.29065, "t": 253.68451000000005, "r": 530.80981, "b": 258.74969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 125, "label": "text", "bbox": {"l": 306.11493, "t": 261.54822, "r": 322.62866, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "Vested", "bbox": {"l": 306.11493, "t": 261.54822, "r": 322.62866, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 126, "label": "text", "bbox": {"l": 394.43222, "t": 261.54822, "r": 400.73563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "(0.", "bbox": {"l": 394.43222, "t": 261.54822, "r": 400.73563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 127, "label": "text", "bbox": {"l": 400.73456, "t": 261.54822, "r": 403.73697, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "5", "bbox": {"l": 400.73456, "t": 261.54822, "r": 403.73697, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 128, "label": "text", "bbox": {"l": 403.73804, "t": 261.54822, "r": 405.53625, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": ")", "bbox": {"l": 403.73804, "t": 261.54822, "r": 405.53625, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 129, "label": "text", "bbox": {"l": 427.7016, "t": 261.54822, "r": 438.80563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "(0.1)", "bbox": {"l": 427.7016, "t": 261.54822, "r": 438.80563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 130, "label": "text", "bbox": {"l": 468.55533, "t": 261.54822, "r": 482.07043, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "87.08", "bbox": {"l": 468.55533, "t": 261.54822, "r": 482.07043, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 131, "label": "text", "bbox": {"l": 516.01862, "t": 261.54822, "r": 529.53375, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": "81.14", "bbox": {"l": 516.01862, "t": 261.54822, "r": 529.53375, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 132, "label": "text", "bbox": {"l": 306.11493, "t": 269.64148, "r": 356.24771, "b": 274.70667000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 107, "text": "Canceled or forfeited", "bbox": {"l": 306.11493, "t": 269.64148, "r": 356.24771, "b": 274.70667000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 133, "label": "text", "bbox": {"l": 394.43222, "t": 270.31946000000005, "r": 400.73563, "b": 275.38464, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 108, "text": "(0.", "bbox": {"l": 394.43222, "t": 270.31946000000005, "r": 400.73563, "b": 275.38464, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 134, "label": "text", "bbox": {"l": 400.73456, "t": 270.31946000000005, "r": 403.73697, "b": 275.38464, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 109, "text": "1", "bbox": {"l": 400.73456, "t": 270.31946000000005, "r": 403.73697, "b": 275.38464, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 135, "label": "text", "bbox": {"l": 403.73804, "t": 270.31946000000005, "r": 405.53625, "b": 275.38464, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 110, "text": ")", "bbox": {"l": 403.73804, "t": 270.31946000000005, "r": 405.53625, "b": 275.38464, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 136, "label": "text", "bbox": {"l": 431.02802, "t": 270.31946000000005, "r": 436.4280099999999, "b": 275.38464, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 111, "text": "-", "bbox": {"l": 431.02802, "t": 270.31946000000005, "r": 436.4280099999999, "b": 275.38464, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 137, "label": "text", "bbox": {"l": 465.83099000000004, "t": 270.31946000000005, "r": 482.35013, "b": 275.38464, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 112, "text": "102.01", "bbox": {"l": 465.83099000000004, "t": 270.31946000000005, "r": 482.35013, "b": 275.38464, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 138, "label": "text", "bbox": {"l": 516.01862, "t": 270.31946000000005, "r": 529.53375, "b": 275.38464, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 113, "text": "92.18", "bbox": {"l": 516.01862, "t": 270.31946000000005, "r": 529.53375, "b": 275.38464, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 139, "label": "text", "bbox": {"l": 306.11493, "t": 278.48572, "r": 373.35764, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 114, "text": "Nonvested on December 31", "bbox": {"l": 306.11493, "t": 278.48572, "r": 373.35764, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 140, "label": "text", "bbox": {"l": 396.24661, "t": 278.48572, "r": 403.75531, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 115, "text": "1.0", "bbox": {"l": 396.24661, "t": 278.48572, "r": 403.75531, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 141, "label": "text", "bbox": {"l": 429.51599, "t": 278.48572, "r": 437.02469, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 116, "text": "0.3", "bbox": {"l": 429.51599, "t": 278.48572, "r": 437.02469, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 142, "label": "text", "bbox": {"l": 463.7142, "t": 278.48572, "r": 484.73965000000004, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 117, "text": "104.85 $", "bbox": {"l": 463.7142, "t": 278.48572, "r": 484.73965000000004, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 143, "label": "text", "bbox": {"l": 512.99463, "t": 278.48572, "r": 534.02008, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 118, "text": "$ 104.51", "bbox": {"l": 512.99463, "t": 278.48572, "r": 534.02008, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ecel", "ched", "lcel", "ched", "lcel", "nl", "ecel", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 7, "num_cols": 5, "table_cells": [{"bbox": {"l": 459.04861, "t": 221.62415, "r": 542.00018, "b": 232.89935000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 5, "text": "Weighted Average Grant Date Fair Value", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 393.2442, "t": 236.74712999999997, "r": 407.34631, "b": 241.81232, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "RS U s", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 392.09671, "t": 221.57446000000004, "r": 438.0145, "b": 226.63964999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 3, "text": "Shares (in millions)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 427.18323, "t": 236.74712999999997, "r": 440.98778999999996, "b": 241.81232, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "PSUs", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 468.38254, "t": 236.74712999999997, "r": 482.48465000000004, "b": 241.81232, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "RSUs", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 516.92578, "t": 236.74712999999997, "r": 530.73035, "b": 241.81232, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "PSUs", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 306.11493, "t": 244.61084000000005, "r": 364.65607, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Nonvested on Janua ry 1", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 396.24661, "t": 244.91327, "r": 403.75531, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "1. 1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 429.81838999999997, "t": 244.91327, "r": 437.32708999999994, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 465.52859, "t": 244.91327, "r": 483.55001999999996, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "90.10 $", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 513.44824, "t": 244.91327, "r": 531.46967, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "$ 91.19", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 306.11493, "t": 253.68451000000005, "r": 325.62674, "b": 258.74969, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Granted", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 396.24661, "t": 253.68451000000005, "r": 403.75531, "b": 258.74969, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "0. 5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 429.81838999999997, "t": 253.68451000000005, "r": 437.32708999999994, "b": 258.74969, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 466.43579000000005, "t": 253.68451000000005, "r": 482.54831, "b": 258.74969, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "117.44", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 514.29065, "t": 253.68451000000005, "r": 530.80981, "b": 258.74969, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "122.41", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 306.11493, "t": 261.54822, "r": 322.62866, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Vested", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 394.43222, "t": 261.54822, "r": 405.53625, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "(0. 5 )", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 427.7016, "t": 261.54822, "r": 438.80563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "(0.1)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 468.55533, "t": 261.54822, "r": 482.07043, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "87.08", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 516.01862, "t": 261.54822, "r": 529.53375, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "81.14", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 306.11493, "t": 269.64148, "r": 356.24771, "b": 274.70667000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Canceled or forfeited", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 394.43222, "t": 270.31946000000005, "r": 405.53625, "b": 275.38464, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "(0. 1 )", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 431.02802, "t": 270.31946000000005, "r": 436.4280099999999, "b": 275.38464, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 465.83099000000004, "t": 270.31946000000005, "r": 482.35013, "b": 275.38464, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "102.01", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 516.01862, "t": 270.31946000000005, "r": 529.53375, "b": 275.38464, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "92.18", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 306.11493, "t": 278.48572, "r": 373.35764, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Nonvested on December 31", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 396.24661, "t": 278.48572, "r": 403.75531, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "1.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 429.51599, "t": 278.48572, "r": 437.02469, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 463.7142, "t": 278.48572, "r": 484.73965000000004, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "104.85 $", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 512.99463, "t": 278.48572, "r": 534.02008, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "$ 104.51", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "caption", "id": 6, "page_no": 7, "cluster": {"id": 6, "label": "caption", "bbox": {"l": 50.112, "t": 320.87735, "r": 545.11377, "b": 365.64987, "coord_origin": "TOPLEFT"}, "confidence": 0.9140306711196899, "cells": [{"id": 119, "text": "Figure 5:", "bbox": {"l": 50.112, "t": 320.87735, "r": 86.864021, "b": 329.78391, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "One of the benefits of TableFormer is that it is language agnostic, as an example, the left part of the illustration", "bbox": {"l": 93.917542, "t": 320.87735, "r": 545.11371, "b": 329.78391, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "demonstrates TableFormer predictions on previously unseen language (Japanese). Additionally, we see that TableFormer is", "bbox": {"l": 50.112, "t": 332.83233999999993, "r": 545.11371, "b": 341.73889, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "robust to variability in style and content, right side of the illustration shows the example of the TableFormer prediction from", "bbox": {"l": 50.112, "t": 344.78732, "r": 545.11377, "b": 353.69388, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "the FinTabNet dataset.", "bbox": {"l": 50.112, "t": 356.74332, "r": 139.79532, "b": 365.64987, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 5: One of the benefits of TableFormer is that it is language agnostic, as an example, the left part of the illustration demonstrates TableFormer predictions on previously unseen language (Japanese). Additionally, we see that TableFormer is robust to variability in style and content, right side of the illustration shows the example of the TableFormer prediction from the FinTabNet dataset."}, {"label": "picture", "id": 12, "page_no": 7, "cluster": {"id": 12, "label": "picture", "bbox": {"l": 216.76925659179688, "t": 380.4906005859375, "r": 375.7829284667969, "b": 443.3470458984375, "coord_origin": "TOPLEFT"}, "confidence": 0.8058525919914246, "cells": [{"id": 124, "text": "Red - PDF cells, Green - predicted bounding boxes", "bbox": {"l": 220.26282, "t": 381.77722, "r": 342.07819, "b": 386.44281, "coord_origin": "TOPLEFT"}}], "children": [{"id": 144, "label": "text", "bbox": {"l": 220.26282, "t": 381.77722, "r": 342.07819, "b": 386.44281, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 124, "text": "Red - PDF cells, Green - predicted bounding boxes", "bbox": {"l": 220.26282, "t": 381.77722, "r": 342.07819, "b": 386.44281, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "picture", "id": 11, "page_no": 7, "cluster": {"id": 11, "label": "picture", "bbox": {"l": 51.736167907714844, "t": 380.48065185546875, "r": 211.83778381347656, "b": 443.6580810546875, "coord_origin": "TOPLEFT"}, "confidence": 0.8308417797088623, "cells": [{"id": 125, "text": "Ground Truth", "bbox": {"l": 53.715248, "t": 381.77722, "r": 85.657333, "b": 386.44281, "coord_origin": "TOPLEFT"}}], "children": [{"id": 145, "label": "text", "bbox": {"l": 53.715248, "t": 381.77722, "r": 85.657333, "b": 386.44281, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 125, "text": "Ground Truth", "bbox": {"l": 53.715248, "t": 381.77722, "r": 85.657333, "b": 386.44281, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "picture", "id": 13, "page_no": 7, "cluster": {"id": 13, "label": "picture", "bbox": {"l": 383.1364440917969, "t": 381.2312927246094, "r": 542.1132202148438, "b": 442.7749328613281, "coord_origin": "TOPLEFT"}, "confidence": 0.7881613969802856, "cells": [{"id": 126, "text": "16", "bbox": {"l": 437.37939, "t": 400.55295, "r": 443.69870000000003, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "17", "bbox": {"l": 450.33203, "t": 400.55295, "r": 456.6513100000001, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "18", "bbox": {"l": 463.28464, "t": 400.55295, "r": 469.60394, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "19", "bbox": {"l": 476.23724000000004, "t": 400.55295, "r": 482.5565500000001, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "20", "bbox": {"l": 489.18988, "t": 400.55295, "r": 495.50916, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "21", "bbox": {"l": 502.14251999999993, "t": 400.55295, "r": 508.46178999999995, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "22", "bbox": {"l": 515.09509, "t": 400.55295, "r": 521.41443, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "23", "bbox": {"l": 385.2814, "t": 411.03836000000007, "r": 391.60071, "b": 417.35699, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "24", "bbox": {"l": 398.52341, "t": 411.03836000000007, "r": 404.84271, "b": 417.35699, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "25", "bbox": {"l": 411.47604, "t": 411.03836000000007, "r": 417.79535, "b": 417.35699, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "26", "bbox": {"l": 437.37939, "t": 411.03836000000007, "r": 443.69870000000003, "b": 417.35699, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "27", "bbox": {"l": 450.33203, "t": 411.03836000000007, "r": 456.6513100000001, "b": 417.35699, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "28", "bbox": {"l": 463.28464, "t": 411.03836000000007, "r": 469.60394, "b": 417.35699, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "30", "bbox": {"l": 385.2814, "t": 421.0697, "r": 391.60071, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "31", "bbox": {"l": 398.52341, "t": 421.0697, "r": 404.84271, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "32", "bbox": {"l": 411.47604, "t": 421.0697, "r": 417.79532, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "33", "bbox": {"l": 424.42865, "t": 421.0697, "r": 430.74796, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "34", "bbox": {"l": 437.38129, "t": 421.0697, "r": 443.70056, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "35", "bbox": {"l": 450.33389000000005, "t": 421.0697, "r": 456.65319999999997, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "36", "bbox": {"l": 463.2865, "t": 421.0697, "r": 469.6058, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "37", "bbox": {"l": 476.23914, "t": 421.0697, "r": 482.55841, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "38", "bbox": {"l": 489.1917700000001, "t": 421.0697, "r": 495.51105, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "39", "bbox": {"l": 502.14438, "t": 421.0697, "r": 508.46368, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "40", "bbox": {"l": 515.09705, "t": 421.0697, "r": 521.41632, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "41", "bbox": {"l": 528.04962, "t": 421.0697, "r": 534.3689, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "42", "bbox": {"l": 385.2814, "t": 432.04431, "r": 391.60071, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "43", "bbox": {"l": 398.52341, "t": 432.04431, "r": 404.84271, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "44", "bbox": {"l": 411.47604, "t": 432.04431, "r": 417.79532, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "45", "bbox": {"l": 424.42865, "t": 432.04431, "r": 430.74796, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "46", "bbox": {"l": 437.38129, "t": 432.04431, "r": 443.70056, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "47", "bbox": {"l": 450.33389000000005, "t": 432.04431, "r": 456.65319999999997, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "48", "bbox": {"l": 463.2865, "t": 432.04431, "r": 469.6058, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "49", "bbox": {"l": 476.23914, "t": 432.04431, "r": 482.55841, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "50", "bbox": {"l": 489.1917700000001, "t": 432.04431, "r": 495.51105, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "51", "bbox": {"l": 502.14438, "t": 432.04431, "r": 508.46368, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "52", "bbox": {"l": 515.09705, "t": 432.04431, "r": 521.41632, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "53", "bbox": {"l": 528.04962, "t": 432.04431, "r": 534.3689, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "0", "bbox": {"l": 385.2814, "t": 389.20004, "r": 388.44073, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "1", "bbox": {"l": 398.52341, "t": 389.20004, "r": 401.68274, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "2", "bbox": {"l": 411.4754, "t": 389.20004, "r": 414.63474, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "3", "bbox": {"l": 424.4274, "t": 389.20004, "r": 427.58673, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "4", "bbox": {"l": 437.37939, "t": 389.20004, "r": 440.53870000000006, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "5", "bbox": {"l": 450.33136, "t": 389.20004, "r": 453.49069000000003, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "6", "bbox": {"l": 463.28336, "t": 389.20004, "r": 466.44269, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "7", "bbox": {"l": 476.23535, "t": 389.20004, "r": 479.39468, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "8", "bbox": {"l": 489.18735, "t": 389.20004, "r": 492.34668, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "9", "bbox": {"l": 502.13933999999995, "t": 389.20004, "r": 505.29868000000005, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "10", "bbox": {"l": 515.09131, "t": 389.20004, "r": 521.41064, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "11", "bbox": {"l": 528.04364, "t": 389.20004, "r": 534.13104, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "12", "bbox": {"l": 385.2814, "t": 398.97464, "r": 391.60071, "b": 405.29327, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "13", "bbox": {"l": 398.52341, "t": 398.97464, "r": 404.84271, "b": 405.29327, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "14", "bbox": {"l": 411.47604, "t": 398.97464, "r": 417.79535, "b": 405.29327, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "15", "bbox": {"l": 424.42719, "t": 406.77463000000006, "r": 430.74648999999994, "b": 413.09326, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "29", "bbox": {"l": 502.86941999999993, "t": 410.99438, "r": 509.18871999999993, "b": 417.31302, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "Predicted Structure", "bbox": {"l": 384.35437, "t": 381.77722, "r": 430.99261, "b": 386.44281, "coord_origin": "TOPLEFT"}}], "children": [{"id": 146, "label": "text", "bbox": {"l": 437.37939, "t": 400.55295, "r": 443.69870000000003, "b": 406.87158, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 126, "text": "16", "bbox": {"l": 437.37939, "t": 400.55295, "r": 443.69870000000003, "b": 406.87158, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 147, "label": "text", "bbox": {"l": 450.33203, "t": 400.55295, "r": 456.6513100000001, "b": 406.87158, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 127, "text": "17", "bbox": {"l": 450.33203, "t": 400.55295, "r": 456.6513100000001, "b": 406.87158, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 148, "label": "text", "bbox": {"l": 463.28464, "t": 400.55295, "r": 469.60394, "b": 406.87158, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 128, "text": "18", "bbox": {"l": 463.28464, "t": 400.55295, "r": 469.60394, "b": 406.87158, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 149, "label": "text", "bbox": {"l": 476.23724000000004, "t": 400.55295, "r": 482.5565500000001, "b": 406.87158, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 129, "text": "19", "bbox": {"l": 476.23724000000004, "t": 400.55295, "r": 482.5565500000001, "b": 406.87158, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 150, "label": "text", "bbox": {"l": 489.18988, "t": 400.55295, "r": 495.50916, "b": 406.87158, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 130, "text": "20", "bbox": {"l": 489.18988, "t": 400.55295, "r": 495.50916, "b": 406.87158, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 151, "label": "text", "bbox": {"l": 502.14251999999993, "t": 400.55295, "r": 508.46178999999995, "b": 406.87158, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 131, "text": "21", "bbox": {"l": 502.14251999999993, "t": 400.55295, "r": 508.46178999999995, "b": 406.87158, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 152, "label": "text", "bbox": {"l": 515.09509, "t": 400.55295, "r": 521.41443, "b": 406.87158, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 132, "text": "22", "bbox": {"l": 515.09509, "t": 400.55295, "r": 521.41443, "b": 406.87158, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 153, "label": "text", "bbox": {"l": 385.2814, "t": 411.03836000000007, "r": 391.60071, "b": 417.35699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 133, "text": "23", "bbox": {"l": 385.2814, "t": 411.03836000000007, "r": 391.60071, "b": 417.35699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 154, "label": "text", "bbox": {"l": 398.52341, "t": 411.03836000000007, "r": 404.84271, "b": 417.35699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 134, "text": "24", "bbox": {"l": 398.52341, "t": 411.03836000000007, "r": 404.84271, "b": 417.35699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 155, "label": "text", "bbox": {"l": 411.47604, "t": 411.03836000000007, "r": 417.79535, "b": 417.35699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 135, "text": "25", "bbox": {"l": 411.47604, "t": 411.03836000000007, "r": 417.79535, "b": 417.35699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 156, "label": "text", "bbox": {"l": 437.37939, "t": 411.03836000000007, "r": 443.69870000000003, "b": 417.35699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 136, "text": "26", "bbox": {"l": 437.37939, "t": 411.03836000000007, "r": 443.69870000000003, "b": 417.35699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 157, "label": "text", "bbox": {"l": 450.33203, "t": 411.03836000000007, "r": 456.6513100000001, "b": 417.35699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 137, "text": "27", "bbox": {"l": 450.33203, "t": 411.03836000000007, "r": 456.6513100000001, "b": 417.35699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 158, "label": "text", "bbox": {"l": 463.28464, "t": 411.03836000000007, "r": 469.60394, "b": 417.35699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 138, "text": "28", "bbox": {"l": 463.28464, "t": 411.03836000000007, "r": 469.60394, "b": 417.35699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 159, "label": "text", "bbox": {"l": 385.2814, "t": 421.0697, "r": 391.60071, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 139, "text": "30", "bbox": {"l": 385.2814, "t": 421.0697, "r": 391.60071, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 160, "label": "text", "bbox": {"l": 398.52341, "t": 421.0697, "r": 404.84271, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 140, "text": "31", "bbox": {"l": 398.52341, "t": 421.0697, "r": 404.84271, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 161, "label": "text", "bbox": {"l": 411.47604, "t": 421.0697, "r": 417.79532, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 141, "text": "32", "bbox": {"l": 411.47604, "t": 421.0697, "r": 417.79532, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 162, "label": "text", "bbox": {"l": 424.42865, "t": 421.0697, "r": 430.74796, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 142, "text": "33", "bbox": {"l": 424.42865, "t": 421.0697, "r": 430.74796, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 163, "label": "text", "bbox": {"l": 437.38129, "t": 421.0697, "r": 443.70056, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 143, "text": "34", "bbox": {"l": 437.38129, "t": 421.0697, "r": 443.70056, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 164, "label": "text", "bbox": {"l": 450.33389000000005, "t": 421.0697, "r": 456.65319999999997, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 144, "text": "35", "bbox": {"l": 450.33389000000005, "t": 421.0697, "r": 456.65319999999997, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 165, "label": "text", "bbox": {"l": 463.2865, "t": 421.0697, "r": 469.6058, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 145, "text": "36", "bbox": {"l": 463.2865, "t": 421.0697, "r": 469.6058, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 166, "label": "text", "bbox": {"l": 476.23914, "t": 421.0697, "r": 482.55841, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 146, "text": "37", "bbox": {"l": 476.23914, "t": 421.0697, "r": 482.55841, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 167, "label": "text", "bbox": {"l": 489.1917700000001, "t": 421.0697, "r": 495.51105, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 147, "text": "38", "bbox": {"l": 489.1917700000001, "t": 421.0697, "r": 495.51105, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 168, "label": "text", "bbox": {"l": 502.14438, "t": 421.0697, "r": 508.46368, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 148, "text": "39", "bbox": {"l": 502.14438, "t": 421.0697, "r": 508.46368, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 169, "label": "text", "bbox": {"l": 515.09705, "t": 421.0697, "r": 521.41632, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 149, "text": "40", "bbox": {"l": 515.09705, "t": 421.0697, "r": 521.41632, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 170, "label": "text", "bbox": {"l": 528.04962, "t": 421.0697, "r": 534.3689, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 150, "text": "41", "bbox": {"l": 528.04962, "t": 421.0697, "r": 534.3689, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 171, "label": "text", "bbox": {"l": 385.2814, "t": 432.04431, "r": 391.60071, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 151, "text": "42", "bbox": {"l": 385.2814, "t": 432.04431, "r": 391.60071, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 172, "label": "text", "bbox": {"l": 398.52341, "t": 432.04431, "r": 404.84271, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 152, "text": "43", "bbox": {"l": 398.52341, "t": 432.04431, "r": 404.84271, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 173, "label": "text", "bbox": {"l": 411.47604, "t": 432.04431, "r": 417.79532, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 153, "text": "44", "bbox": {"l": 411.47604, "t": 432.04431, "r": 417.79532, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 174, "label": "text", "bbox": {"l": 424.42865, "t": 432.04431, "r": 430.74796, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 154, "text": "45", "bbox": {"l": 424.42865, "t": 432.04431, "r": 430.74796, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 175, "label": "text", "bbox": {"l": 437.38129, "t": 432.04431, "r": 443.70056, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 155, "text": "46", "bbox": {"l": 437.38129, "t": 432.04431, "r": 443.70056, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 176, "label": "text", "bbox": {"l": 450.33389000000005, "t": 432.04431, "r": 456.65319999999997, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 156, "text": "47", "bbox": {"l": 450.33389000000005, "t": 432.04431, "r": 456.65319999999997, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 177, "label": "text", "bbox": {"l": 463.2865, "t": 432.04431, "r": 469.6058, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 157, "text": "48", "bbox": {"l": 463.2865, "t": 432.04431, "r": 469.6058, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 178, "label": "text", "bbox": {"l": 476.23914, "t": 432.04431, "r": 482.55841, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 158, "text": "49", "bbox": {"l": 476.23914, "t": 432.04431, "r": 482.55841, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 179, "label": "text", "bbox": {"l": 489.1917700000001, "t": 432.04431, "r": 495.51105, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 159, "text": "50", "bbox": {"l": 489.1917700000001, "t": 432.04431, "r": 495.51105, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 180, "label": "text", "bbox": {"l": 502.14438, "t": 432.04431, "r": 508.46368, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 160, "text": "51", "bbox": {"l": 502.14438, "t": 432.04431, "r": 508.46368, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 181, "label": "text", "bbox": {"l": 515.09705, "t": 432.04431, "r": 521.41632, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 161, "text": "52", "bbox": {"l": 515.09705, "t": 432.04431, "r": 521.41632, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 182, "label": "text", "bbox": {"l": 528.04962, "t": 432.04431, "r": 534.3689, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 162, "text": "53", "bbox": {"l": 528.04962, "t": 432.04431, "r": 534.3689, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 183, "label": "text", "bbox": {"l": 385.2814, "t": 389.20004, "r": 388.44073, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 163, "text": "0", "bbox": {"l": 385.2814, "t": 389.20004, "r": 388.44073, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 184, "label": "text", "bbox": {"l": 398.52341, "t": 389.20004, "r": 401.68274, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 164, "text": "1", "bbox": {"l": 398.52341, "t": 389.20004, "r": 401.68274, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 185, "label": "text", "bbox": {"l": 411.4754, "t": 389.20004, "r": 414.63474, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 165, "text": "2", "bbox": {"l": 411.4754, "t": 389.20004, "r": 414.63474, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 186, "label": "text", "bbox": {"l": 424.4274, "t": 389.20004, "r": 427.58673, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 166, "text": "3", "bbox": {"l": 424.4274, "t": 389.20004, "r": 427.58673, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 187, "label": "text", "bbox": {"l": 437.37939, "t": 389.20004, "r": 440.53870000000006, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 167, "text": "4", "bbox": {"l": 437.37939, "t": 389.20004, "r": 440.53870000000006, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 188, "label": "text", "bbox": {"l": 450.33136, "t": 389.20004, "r": 453.49069000000003, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 168, "text": "5", "bbox": {"l": 450.33136, "t": 389.20004, "r": 453.49069000000003, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 189, "label": "text", "bbox": {"l": 463.28336, "t": 389.20004, "r": 466.44269, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 169, "text": "6", "bbox": {"l": 463.28336, "t": 389.20004, "r": 466.44269, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 190, "label": "text", "bbox": {"l": 476.23535, "t": 389.20004, "r": 479.39468, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 170, "text": "7", "bbox": {"l": 476.23535, "t": 389.20004, "r": 479.39468, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 191, "label": "text", "bbox": {"l": 489.18735, "t": 389.20004, "r": 492.34668, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 171, "text": "8", "bbox": {"l": 489.18735, "t": 389.20004, "r": 492.34668, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 192, "label": "text", "bbox": {"l": 502.13933999999995, "t": 389.20004, "r": 505.29868000000005, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 172, "text": "9", "bbox": {"l": 502.13933999999995, "t": 389.20004, "r": 505.29868000000005, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 193, "label": "text", "bbox": {"l": 515.09131, "t": 389.20004, "r": 521.41064, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 173, "text": "10", "bbox": {"l": 515.09131, "t": 389.20004, "r": 521.41064, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 194, "label": "text", "bbox": {"l": 528.04364, "t": 389.20004, "r": 534.13104, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 174, "text": "11", "bbox": {"l": 528.04364, "t": 389.20004, "r": 534.13104, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 195, "label": "text", "bbox": {"l": 385.2814, "t": 398.97464, "r": 391.60071, "b": 405.29327, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 175, "text": "12", "bbox": {"l": 385.2814, "t": 398.97464, "r": 391.60071, "b": 405.29327, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 196, "label": "text", "bbox": {"l": 398.52341, "t": 398.97464, "r": 404.84271, "b": 405.29327, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 176, "text": "13", "bbox": {"l": 398.52341, "t": 398.97464, "r": 404.84271, "b": 405.29327, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 197, "label": "text", "bbox": {"l": 411.47604, "t": 398.97464, "r": 417.79535, "b": 405.29327, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 177, "text": "14", "bbox": {"l": 411.47604, "t": 398.97464, "r": 417.79535, "b": 405.29327, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 198, "label": "text", "bbox": {"l": 424.42719, "t": 406.77463000000006, "r": 430.74648999999994, "b": 413.09326, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 178, "text": "15", "bbox": {"l": 424.42719, "t": 406.77463000000006, "r": 430.74648999999994, "b": 413.09326, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 199, "label": "text", "bbox": {"l": 502.86941999999993, "t": 410.99438, "r": 509.18871999999993, "b": 417.31302, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 179, "text": "29", "bbox": {"l": 502.86941999999993, "t": 410.99438, "r": 509.18871999999993, "b": 417.31302, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 200, "label": "text", "bbox": {"l": 384.35437, "t": 381.77722, "r": 430.99261, "b": 386.44281, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 180, "text": "Predicted Structure", "bbox": {"l": 384.35437, "t": 381.77722, "r": 430.99261, "b": 386.44281, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "caption", "id": 5, "page_no": 7, "cluster": {"id": 5, "label": "caption", "bbox": {"l": 62.595001, "t": 458.72836, "r": 532.63049, "b": 467.63492, "coord_origin": "TOPLEFT"}, "confidence": 0.9153599143028259, "cells": [{"id": 181, "text": "Figure 6: An example of TableFormer predictions (bounding boxes and structure) from generated SynthTabNet table.", "bbox": {"l": 62.595001, "t": 458.72836, "r": 532.63049, "b": 467.63492, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 6: An example of TableFormer predictions (bounding boxes and structure) from generated SynthTabNet table."}, {"label": "section_header", "id": 2, "page_no": 7, "cluster": {"id": 2, "label": "section_header", "bbox": {"l": 50.112, "t": 491.39536, "r": 163.7558, "b": 501.24741, "coord_origin": "TOPLEFT"}, "confidence": 0.9561247229576111, "cells": [{"id": 182, "text": "5.5.", "bbox": {"l": 50.112, "t": 491.39536, "r": 64.448898, "b": 501.24741, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "Qualitative Analysis", "bbox": {"l": 74.006828, "t": 491.39536, "r": 163.7558, "b": 501.24741, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5.5. Qualitative Analysis"}, {"label": "text", "id": 1, "page_no": 7, "cluster": {"id": 1, "label": "text", "bbox": {"l": 50.112, "t": 536.87337, "r": 286.36511, "b": 713.1519470000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9852360486984253, "cells": [{"id": 184, "text": "We showcase several visualizations for the different", "bbox": {"l": 62.067001, "t": 536.87337, "r": 286.36499, "b": 545.77992, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": "components of our network on various", "bbox": {"l": 50.112, "t": 548.82837, "r": 211.15741, "b": 557.73492, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "\u201ccomplex\u201d", "bbox": {"l": 215.10000999999997, "t": 548.91803, "r": 259.17453, "b": 557.50578, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "tables", "bbox": {"l": 263.12, "t": 548.82837, "r": 286.36273, "b": 557.73492, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": "within datasets presented in this work in Fig. 5 and Fig. 6", "bbox": {"l": 50.112, "t": 560.78337, "r": 286.36505, "b": 569.68993, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "As it is shown, our model is able to predict bounding boxes", "bbox": {"l": 50.112, "t": 572.73837, "r": 286.36508, "b": 581.6449299999999, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "for all table cells, even for the empty ones. Additionally,", "bbox": {"l": 50.112, "t": 584.69337, "r": 286.36508, "b": 593.59993, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "our post-processing techniques can extract the cell content", "bbox": {"l": 50.112, "t": 596.64937, "r": 286.36505, "b": 605.55592, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": "by matching the predicted bounding boxes to the PDF cells", "bbox": {"l": 50.112, "t": 608.60437, "r": 286.36508, "b": 617.51093, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "based on their overlap and spatial proximity. The left part", "bbox": {"l": 50.112, "t": 620.55937, "r": 286.36508, "b": 629.46593, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "of Fig. 5 demonstrates also the adaptability of our method", "bbox": {"l": 50.112, "t": 632.51437, "r": 286.36508, "b": 641.42093, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "to any language, as it can successfully extract Japanese", "bbox": {"l": 50.112, "t": 644.46938, "r": 286.36508, "b": 653.37593, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "text, although the training set contains only English content.", "bbox": {"l": 50.112, "t": 656.42438, "r": 286.36511, "b": 665.33094, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "We provide more visualizations including the intermediate", "bbox": {"l": 50.112, "t": 668.38037, "r": 286.36508, "b": 677.28694, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "steps in the supplementary material. Overall these illustra-", "bbox": {"l": 50.112, "t": 680.33537, "r": 286.36511, "b": 689.24194, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "tions justify the versatility of our method across a diverse", "bbox": {"l": 50.112, "t": 692.290375, "r": 286.36511, "b": 701.196945, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "range of table appearances and content type.", "bbox": {"l": 50.112, "t": 704.245377, "r": 226.88833999999997, "b": 713.1519470000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "We showcase several visualizations for the different components of our network on various \u201ccomplex\u201d tables within datasets presented in this work in Fig. 5 and Fig. 6 As it is shown, our model is able to predict bounding boxes for all table cells, even for the empty ones. Additionally, our post-processing techniques can extract the cell content by matching the predicted bounding boxes to the PDF cells based on their overlap and spatial proximity. The left part of Fig. 5 demonstrates also the adaptability of our method to any language, as it can successfully extract Japanese text, although the training set contains only English content. We provide more visualizations including the intermediate steps in the supplementary material. Overall these illustrations justify the versatility of our method across a diverse range of table appearances and content type."}, {"label": "section_header", "id": 4, "page_no": 7, "cluster": {"id": 4, "label": "section_header", "bbox": {"l": 308.862, "t": 490.70892, "r": 460.84848, "b": 501.45663, "coord_origin": "TOPLEFT"}, "confidence": 0.943652331829071, "cells": [{"id": 201, "text": "6.", "bbox": {"l": 308.862, "t": 490.70892, "r": 316.07382, "b": 501.45663, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": "Future Work & Conclusion", "bbox": {"l": 325.68954, "t": 490.70892, "r": 460.84848, "b": 501.45663, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "6. Future Work & Conclusion"}, {"label": "text", "id": 0, "page_no": 7, "cluster": {"id": 0, "label": "text", "bbox": {"l": 308.862, "t": 512.89337, "r": 545.11517, "b": 653.30592, "coord_origin": "TOPLEFT"}, "confidence": 0.9875594973564148, "cells": [{"id": 203, "text": "In this paper, we presented TableFormer an end-to-end", "bbox": {"l": 320.81699, "t": 512.89337, "r": 545.11505, "b": 521.79993, "coord_origin": "TOPLEFT"}}, {"id": 204, "text": "transformer based approach to predict table structures and", "bbox": {"l": 308.862, "t": 524.84836, "r": 545.11517, "b": 533.75491, "coord_origin": "TOPLEFT"}}, {"id": 205, "text": "bounding boxes of cells from an image. This approach en-", "bbox": {"l": 308.862, "t": 536.80336, "r": 545.11511, "b": 545.70992, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": "ables us to recreate the table structure, and extract the cell", "bbox": {"l": 308.862, "t": 548.75836, "r": 545.11505, "b": 557.6649199999999, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": "content from PDF or OCR by using bounding boxes. Ad-", "bbox": {"l": 308.862, "t": 560.71336, "r": 545.11517, "b": 569.61992, "coord_origin": "TOPLEFT"}}, {"id": 208, "text": "ditionally, it provides the versatility required in real-world", "bbox": {"l": 308.862, "t": 572.66837, "r": 545.11511, "b": 581.57492, "coord_origin": "TOPLEFT"}}, {"id": 209, "text": "scenarios when dealing with various types of PDF docu-", "bbox": {"l": 308.862, "t": 584.62436, "r": 545.11511, "b": 593.53091, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": "ments, and languages.", "bbox": {"l": 308.862, "t": 596.57936, "r": 400.46808, "b": 605.48592, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "Furthermore, our method outper-", "bbox": {"l": 408.37839, "t": 596.57936, "r": 545.11511, "b": 605.48592, "coord_origin": "TOPLEFT"}}, {"id": 212, "text": "forms all state-of-the-arts with a wide margin. Finally, we", "bbox": {"l": 308.862, "t": 608.53436, "r": 545.11505, "b": 617.44092, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "introduce \u201cSynthTabNet\u201d a challenging synthetically gen-", "bbox": {"l": 308.862, "t": 620.48936, "r": 545.11511, "b": 629.3959199999999, "coord_origin": "TOPLEFT"}}, {"id": 214, "text": "erated dataset that reinforces missing characteristics from", "bbox": {"l": 308.862, "t": 632.4443699999999, "r": 545.11505, "b": 641.35092, "coord_origin": "TOPLEFT"}}, {"id": 215, "text": "other datasets.", "bbox": {"l": 308.862, "t": 644.39937, "r": 365.85803, "b": 653.30592, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In this paper, we presented TableFormer an end-to-end transformer based approach to predict table structures and bounding boxes of cells from an image. This approach enables us to recreate the table structure, and extract the cell content from PDF or OCR by using bounding boxes. Additionally, it provides the versatility required in real-world scenarios when dealing with various types of PDF documents, and languages. Furthermore, our method outperforms all state-of-the-arts with a wide margin. Finally, we introduce \u201cSynthTabNet\u201d a challenging synthetically generated dataset that reinforces missing characteristics from other datasets."}, {"label": "section_header", "id": 3, "page_no": 7, "cluster": {"id": 3, "label": "section_header", "bbox": {"l": 308.862, "t": 672.09892, "r": 364.40585, "b": 682.84664, "coord_origin": "TOPLEFT"}, "confidence": 0.9442470669746399, "cells": [{"id": 216, "text": "References", "bbox": {"l": 308.862, "t": 672.09892, "r": 364.40585, "b": 682.84664, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "References"}, {"label": "list_item", "id": 10, "page_no": 7, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 313.345, "t": 693.9617920000001, "r": 545.1134, "b": 712.936752, "coord_origin": "TOPLEFT"}, "confidence": 0.8318749070167542, "cells": [{"id": 217, "text": "[1]", "bbox": {"l": 313.345, "t": 693.9617920000001, "r": 323.80792, "b": 701.977753, "coord_origin": "TOPLEFT"}}, {"id": 218, "text": "Nicolas Carion, Francisco Massa, Gabriel Synnaeve, Nicolas", "bbox": {"l": 326.05127, "t": 693.9617920000001, "r": 545.10852, "b": 701.977753, "coord_origin": "TOPLEFT"}}, {"id": 219, "text": "Usunier, Alexander Kirillov, and Sergey Zagoruyko. End-to-", "bbox": {"l": 328.78101, "t": 704.920792, "r": 545.1134, "b": 712.936752, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[1] Nicolas Carion, Francisco Massa, Gabriel Synnaeve, Nicolas Usunier, Alexander Kirillov, and Sergey Zagoruyko. End-to-"}, {"label": "picture", "id": 15, "page_no": 7, "cluster": {"id": 15, "label": "picture", "bbox": {"l": 305.58367919921875, "t": 98.65414428710938, "r": 554.8258666992188, "b": 180.6267547607422, "coord_origin": "TOPLEFT"}, "confidence": 0.7699168920516968, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "picture", "id": 14, "page_no": 7, "cluster": {"id": 14, "label": "picture", "bbox": {"l": 49.97503662109375, "t": 103.71266174316406, "r": 301.6335754394531, "b": 187.57891845703125, "coord_origin": "TOPLEFT"}, "confidence": 0.787392258644104, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "headers": [{"label": "page_footer", "id": 9, "page_no": 7, "cluster": {"id": 9, "label": "page_footer", "bbox": {"l": 295.121, "t": 734.133366, "r": 300.10229, "b": 743.039928, "coord_origin": "TOPLEFT"}, "confidence": 0.8709856867790222, "cells": [{"id": 220, "text": "8", "bbox": {"l": 295.121, "t": 734.133366, "r": 300.10229, "b": 743.039928, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "8"}]}}, {"page_no": 8, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "end object detection with transformers. In Andrea Vedaldi,", "bbox": {"l": 70.030998, "t": 75.88378999999998, "r": 286.36334, "b": 83.89977999999996, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Horst Bischof, Thomas Brox, and Jan-Michael Frahm, edi-", "bbox": {"l": 70.030998, "t": 86.84276999999997, "r": 286.36331, "b": 94.85875999999996, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "tors,", "bbox": {"l": 70.030998, "t": 97.80078000000003, "r": 85.722198, "b": 105.81677000000002, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Computer Vision - ECCV 2020", "bbox": {"l": 87.889, "t": 97.88147000000004, "r": 199.93315, "b": 105.61053000000004, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": ", pages 213-229, Cham,", "bbox": {"l": 199.936, "t": 97.80078000000003, "r": 286.36313, "b": 105.81677000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "2020. Springer International Publishing. 5", "bbox": {"l": 70.031006, "t": 108.75977, "r": 221.94871999999998, "b": 116.77575999999999, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "[2]", "bbox": {"l": 54.595005, "t": 120.03174000000013, "r": 65.206657, "b": 128.04773, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Zewen Chi, Heyan Huang, Heng-Da Xu, Houjin Yu, Wanx-", "bbox": {"l": 67.481873, "t": 120.03174000000013, "r": 286.35852, "b": 128.04773, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "uan Yin, and Xian-Ling Mao.", "bbox": {"l": 70.031006, "t": 130.99072, "r": 179.67215, "b": 139.00671, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Complicated table structure", "bbox": {"l": 185.58101, "t": 130.99072, "r": 286.36334, "b": 139.00671, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "recognition.", "bbox": {"l": 70.031006, "t": 141.94970999999998, "r": 113.11456, "b": 149.96569999999997, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "arXiv preprint arXiv:1908.04729", "bbox": {"l": 116.34200999999999, "t": 142.0304, "r": 235.3082, "b": 149.75946, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": ", 2019. 3", "bbox": {"l": 235.30701, "t": 141.94970999999998, "r": 267.67572, "b": 149.96569999999997, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "[3]", "bbox": {"l": 54.595001, "t": 153.22168, "r": 65.103195, "b": 161.23766999999998, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Bertrand Couasnon and Aurelie Lemaitre.", "bbox": {"l": 67.356239, "t": 153.22168, "r": 218.77876, "b": 161.23766999999998, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Recognition of Ta-", "bbox": {"l": 220.97999999999996, "t": 153.30237, "r": 286.36301, "b": 161.03143, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "bles and Forms", "bbox": {"l": 70.030991, "t": 164.26135, "r": 125.26401000000001, "b": 171.99041999999997, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": ", pages 647-677. Springer London, London,", "bbox": {"l": 125.26098999999999, "t": 164.18066, "r": 286.36029, "b": 172.19665999999995, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "2014. 2", "bbox": {"l": 70.030991, "t": 175.13867000000005, "r": 97.916496, "b": 183.15466000000004, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "[4]", "bbox": {"l": 54.59499, "t": 186.41063999999994, "r": 65.806984, "b": 194.42664000000002, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Herv\u00b4e D\u00b4ejean, Jean-Luc Meunier, Liangcai Gao, Yilun", "bbox": {"l": 68.210922, "t": 186.41063999999994, "r": 286.36401, "b": 194.42664000000002, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Huang, Yu Fang, Florian Kleber, and Eva-Maria Lang. IC-", "bbox": {"l": 70.030983, "t": 197.36963000000003, "r": 286.36331, "b": 205.38562000000002, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "DAR 2019 Competition on Table Detection and Recognition", "bbox": {"l": 70.030983, "t": 208.32861000000003, "r": 286.36334, "b": 216.3446, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "(cTDaR), Apr. 2019. http://sac.founderit.com/. 2", "bbox": {"l": 70.030983, "t": 219.2876, "r": 245.83519, "b": 227.30358999999999, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "[5]", "bbox": {"l": 54.594982, "t": 230.55957, "r": 65.381134, "b": 238.57556, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "Basilios Gatos, Dimitrios Danatsas, Ioannis Pratikakis, and", "bbox": {"l": 67.693779, "t": 230.55957, "r": 286.35849, "b": 238.57556, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "Stavros J Perantonis. Automatic table detection in document", "bbox": {"l": 70.030983, "t": 241.51855, "r": 286.36334, "b": 249.53454999999997, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "images. In", "bbox": {"l": 70.030983, "t": 252.47655999999995, "r": 108.39821, "b": 260.49255000000005, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "International Conference on Pattern Recognition", "bbox": {"l": 110.64498000000002, "t": 252.55724999999995, "r": 286.3595, "b": 260.28632000000005, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "and Image Analysis", "bbox": {"l": 70.030983, "t": 263.51624000000004, "r": 140.57861, "b": 271.24530000000004, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": ", pages 609-618. Springer, 2005. 2", "bbox": {"l": 140.57797, "t": 263.43555000000003, "r": 266.47522, "b": 271.45154, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "[6]", "bbox": {"l": 54.594971, "t": 274.70758, "r": 64.848648, "b": 282.72351, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Max G\u00a8obel, Tamir Hassan, Ermelinda Oro, and Giorgio Orsi.", "bbox": {"l": 67.047119, "t": 274.70758, "r": 286.36676, "b": 282.72351, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "Icdar 2013 table competition.", "bbox": {"l": 70.030975, "t": 285.66655999999995, "r": 179.57349, "b": 293.68253, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "In", "bbox": {"l": 187.01559, "t": 285.66655999999995, "r": 194.4846, "b": 293.68253, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "2013 12th International", "bbox": {"l": 198.04398, "t": 285.74725, "r": 286.36304, "b": 293.47632, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Conference on Document Analysis and Recognition", "bbox": {"l": 70.030975, "t": 296.70624, "r": 260.19937, "b": 304.43530000000004, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": ", pages", "bbox": {"l": 260.198, "t": 296.62555, "r": 286.36197, "b": 304.64151, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "1449-1453, 2013. 2", "bbox": {"l": 70.030991, "t": 307.5845299999999, "r": 142.74849, "b": 315.6004899999999, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "[7]", "bbox": {"l": 54.59499, "t": 318.85654, "r": 65.61586, "b": 326.8725, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "EA Green and M Krishnamoorthy.", "bbox": {"l": 67.978821, "t": 318.85654, "r": 199.492, "b": 326.8725, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Recognition of tables", "bbox": {"l": 206.98792, "t": 318.85654, "r": 286.35849, "b": 326.8725, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "using table grammars. procs.", "bbox": {"l": 70.030991, "t": 329.8145400000001, "r": 176.28284, "b": 337.83051, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "In", "bbox": {"l": 182.60416, "t": 329.8145400000001, "r": 190.07317, "b": 337.83051, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "Symposium on Document", "bbox": {"l": 193.28299, "t": 329.89522999999997, "r": 286.36319, "b": 337.62429999999995, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Analysis and Recognition (SDAIR\u201995)", "bbox": {"l": 70.030991, "t": 340.85425, "r": 206.34717, "b": 348.58331, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": ", pages 261-277. 2", "bbox": {"l": 206.34599, "t": 340.77356, "r": 274.82239, "b": 348.78952, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "[8]", "bbox": {"l": 54.594986000000006, "t": 352.0455600000001, "r": 65.04657, "b": 360.06152, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Khurram Azeem Hashmi, Alain Pagani, Marcus Liwicki, Di-", "bbox": {"l": 67.287483, "t": 352.0455600000001, "r": 286.35849, "b": 360.06152, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "dier Stricker, and Muhammad Zeshan Afzal.", "bbox": {"l": 70.030983, "t": 363.00458, "r": 234.12507999999997, "b": 371.02054, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Castabdetec-", "bbox": {"l": 240.05186, "t": 363.00458, "r": 286.36331, "b": 371.02054, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "tors: Cascade network for table detection in document im-", "bbox": {"l": 70.030983, "t": 373.96356, "r": 286.36331, "b": 381.97952, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "ages with recursive feature pyramid and switchable atrous", "bbox": {"l": 70.030983, "t": 384.92255, "r": 286.36331, "b": 392.93851, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "convolution.", "bbox": {"l": 70.030983, "t": 395.88153, "r": 114.57605, "b": 403.89749, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "Journal of Imaging", "bbox": {"l": 117.80399000000001, "t": 395.96222, "r": 186.7287, "b": 403.69128, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": ", 7(10), 2021. 1", "bbox": {"l": 186.728, "t": 395.88153, "r": 243.00113999999996, "b": 403.89749, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "[9]", "bbox": {"l": 54.595001, "t": 407.15253000000007, "r": 65.334427, "b": 415.1684900000001, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Kaiming He, Georgia Gkioxari, Piotr Dollar, and Ross Gir-", "bbox": {"l": 67.637054, "t": 407.15253000000007, "r": 286.35852, "b": 415.1684900000001, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "shick. Mask r-cnn. In", "bbox": {"l": 70.030998, "t": 418.11151, "r": 147.13306, "b": 426.12747, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Proceedings of the IEEE International", "bbox": {"l": 149.15601, "t": 418.1922, "r": 286.35989, "b": 425.92126, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Conference on Computer Vision (ICCV)", "bbox": {"l": 70.031006, "t": 429.15118, "r": 213.48445, "b": 436.88025, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": ", Oct 2017. 1", "bbox": {"l": 213.483, "t": 429.07050000000004, "r": 261.04083, "b": 437.08646000000005, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "[10]", "bbox": {"l": 50.112, "t": 440.3424999999999, "r": 65.399307, "b": 448.3584599999999, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "Yelin He, X. Qi, Jiaquan Ye, Peng Gao, Yihao Chen, Bing-", "bbox": {"l": 67.693321, "t": 440.3424999999999, "r": 286.3587, "b": 448.3584599999999, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "cong Li, Xin Tang, and Rong Xiao.", "bbox": {"l": 70.030998, "t": 451.30151, "r": 202.74268, "b": 459.31747, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "Pingan-vcgroup\u2019s so-", "bbox": {"l": 209.00122, "t": 451.30151, "r": 286.36331, "b": 459.31747, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "lution for icdar 2021 competition on scientific table image", "bbox": {"l": 70.030998, "t": 462.2605, "r": 286.36334, "b": 470.27646, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "recognition to latex.", "bbox": {"l": 70.030998, "t": 473.21948, "r": 141.86981, "b": 481.23544, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "ArXiv", "bbox": {"l": 145.097, "t": 473.30017, "r": 166.01561, "b": 481.02924, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": ", abs/2105.01846, 2021. 2", "bbox": {"l": 166.015, "t": 473.21948, "r": 259.90216, "b": 481.23544, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "[11]", "bbox": {"l": 50.112, "t": 484.49048, "r": 66.033806, "b": 492.50644, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Jianying Hu, Ramanujan S Kashi, Daniel P Lopresti, and", "bbox": {"l": 68.423035, "t": 484.49048, "r": 286.35873, "b": 492.50644, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "Gordon Wilfong. Medium-independent table detection. In", "bbox": {"l": 70.030998, "t": 495.44946, "r": 286.36331, "b": 503.46542, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "Document Recognition and Retrieval VII", "bbox": {"l": 70.030998, "t": 506.48914, "r": 227.40926, "b": 514.2182, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": ", volume 3967,", "bbox": {"l": 227.40500000000003, "t": 506.40845, "r": 286.35913, "b": 514.4244100000001, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "pages 291-302. International Society for Optics and Photon-", "bbox": {"l": 70.031006, "t": 517.36743, "r": 286.36328, "b": 525.38339, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "ics, 1999. 2", "bbox": {"l": 70.031006, "t": 528.32642, "r": 112.36138000000001, "b": 536.34238, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "[12]", "bbox": {"l": 50.112007, "t": 539.59842, "r": 65.466705, "b": 547.61438, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "Matthew Hurst. A constraint-based approach to table struc-", "bbox": {"l": 67.770828, "t": 539.59842, "r": 286.35873, "b": 547.61438, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "ture derivation. In", "bbox": {"l": 70.031006, "t": 550.55742, "r": 136.28374, "b": 558.57338, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "Proceedings of the Seventh International", "bbox": {"l": 138.811, "t": 550.63812, "r": 286.36206, "b": 558.36716, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Conference on Document Analysis and Recognition - Volume", "bbox": {"l": 70.031006, "t": 561.5971199999999, "r": 286.36334, "b": 569.32616, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "2", "bbox": {"l": 70.031006, "t": 572.55612, "r": 74.514206, "b": 580.28516, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": ", ICDAR \u201903, page 911, USA, 2003. IEEE Computer Soci-", "bbox": {"l": 74.514008, "t": 572.47542, "r": 286.36313, "b": 580.4913799999999, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "ety. 2", "bbox": {"l": 70.031006, "t": 583.4334100000001, "r": 90.357834, "b": 591.44937, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "[13]", "bbox": {"l": 50.112007, "t": 594.70541, "r": 66.270439, "b": 602.72137, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Thotreingam Kasar, Philippine Barlas, Sebastien Adam,", "bbox": {"l": 68.695168, "t": 594.70541, "r": 286.35873, "b": 602.72137, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Cl\u00b4ement Chatelain, and Thierry Paquet. Learning to detect", "bbox": {"l": 70.031006, "t": 605.66441, "r": 286.3631, "b": 613.68037, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "tables in scanned document images using line information.", "bbox": {"l": 70.031006, "t": 616.62341, "r": 286.36331, "b": 624.63937, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "In", "bbox": {"l": 70.031006, "t": 627.58241, "r": 77.500015, "b": 635.5983699999999, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "2013 12th International Conference on Document Analy-", "bbox": {"l": 79.920006, "t": 627.6631199999999, "r": 286.3624, "b": 635.39215, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "sis and Recognition", "bbox": {"l": 70.031006, "t": 638.62212, "r": 140.67728, "b": 646.35115, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": ", pages 1185-1189. IEEE, 2013. 2", "bbox": {"l": 140.67599, "t": 638.54141, "r": 264.43921, "b": 646.55737, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "[14]", "bbox": {"l": 50.111992, "t": 649.81342, "r": 66.534035, "b": 657.82938, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "Pratik Kayal, Mrinal Anand, Harsh Desai, and Mayank", "bbox": {"l": 68.998329, "t": 649.81342, "r": 286.35873, "b": 657.82938, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "Singh.", "bbox": {"l": 70.030991, "t": 660.77142, "r": 93.200165, "b": 668.78738, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "Icdar 2021 competition on scientific table image", "bbox": {"l": 102.20243, "t": 660.77142, "r": 286.36334, "b": 668.78738, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "recognition to latex, 2021. 2", "bbox": {"l": 70.030991, "t": 671.73042, "r": 171.9969, "b": 679.74638, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "[15]", "bbox": {"l": 50.111992, "t": 683.00243, "r": 65.515968, "b": 691.01839, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "Harold W Kuhn. The hungarian method for the assignment", "bbox": {"l": 67.827499, "t": 683.00243, "r": 286.3587, "b": 691.01839, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "problem.", "bbox": {"l": 70.030991, "t": 693.9614260000001, "r": 102.15761, "b": 701.977386, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "Naval research logistics quarterly", "bbox": {"l": 107.54999, "t": 694.0421220000001, "r": 231.47461, "b": 701.771156, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": ", 2(1-2):83-97,", "bbox": {"l": 231.47598, "t": 693.9614260000001, "r": 286.35931, "b": 701.977386, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "1955. 6", "bbox": {"l": 70.030975, "t": 704.920425, "r": 97.916481, "b": 712.936386, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "[16]", "bbox": {"l": 308.86197, "t": 75.88342000000011, "r": 324.74973, "b": 83.89940999999999, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "Girish Kulkarni, Visruth Premraj, Vicente Ordonez, Sag-", "bbox": {"l": 327.13382, "t": 75.88342000000011, "r": 545.1087, "b": 83.89940999999999, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "nik Dhar, Siming Li, Yejin Choi, Alexander C. Berg, and", "bbox": {"l": 328.78098, "t": 86.84142999999995, "r": 545.1134, "b": 94.85741999999993, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "Tamara L. Berg.", "bbox": {"l": 328.78098, "t": 97.80042000000003, "r": 390.96295, "b": 105.81641000000002, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "Babytalk:", "bbox": {"l": 400.27008, "t": 97.80042000000003, "r": 435.1404099999999, "b": 105.81641000000002, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "Understanding and generat-", "bbox": {"l": 441.71277, "t": 97.80042000000003, "r": 545.11328, "b": 105.81641000000002, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "ing simple image descriptions.", "bbox": {"l": 328.78098, "t": 108.75940000000003, "r": 440.80719, "b": 116.7753899999999, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "IEEE Transactions on Pat-", "bbox": {"l": 446.63498, "t": 108.84009000000003, "r": 545.11304, "b": 116.56914999999992, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "tern Analysis and Machine Intelligence", "bbox": {"l": 328.78098, "t": 119.79907000000003, "r": 471.13153, "b": 127.52814000000001, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": ", 35(12):2891-2903,", "bbox": {"l": 471.13300000000004, "t": 119.71838000000002, "r": 545.11475, "b": 127.73437999999999, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "2013. 4", "bbox": {"l": 328.78101, "t": 130.67737, "r": 356.6665, "b": 138.69335999999998, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "[17]", "bbox": {"l": 308.862, "t": 142.12334999999996, "r": 325.24371, "b": 150.13933999999995, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "Minghao Li, Lei Cui, Shaohan Huang, Furu Wei, Ming", "bbox": {"l": 327.70197, "t": 142.12334999999996, "r": 545.10883, "b": 150.13933999999995, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "Zhou, and Zhoujun Li.", "bbox": {"l": 328.78101, "t": 153.08136000000002, "r": 414.44598, "b": 161.09735, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "Tablebank: A benchmark dataset", "bbox": {"l": 421.82532, "t": 153.08136000000002, "r": 545.1134, "b": 161.09735, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "for table detection and recognition, 2019. 2, 3", "bbox": {"l": 328.78101, "t": 164.04034000000001, "r": 493.62835999999993, "b": 172.05633999999998, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "[18]", "bbox": {"l": 308.862, "t": 175.48632999999995, "r": 324.26599, "b": 183.50232000000005, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "Yiren Li, Zheng Huang, Junchi Yan, Yi Zhou, Fan Ye, and", "bbox": {"l": 326.57751, "t": 175.48632999999995, "r": 545.10876, "b": 183.50232000000005, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Xianhui Liu. Gfte: Graph-based financial table extraction.", "bbox": {"l": 328.78101, "t": 186.44530999999995, "r": 545.11334, "b": 194.46130000000005, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "In Alberto Del Bimbo, Rita Cucchiara, Stan Sclaroff, Gio-", "bbox": {"l": 328.78101, "t": 197.40430000000003, "r": 545.11346, "b": 205.42029000000002, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "vanni Maria Farinella, Tao Mei, Marco Bertini, Hugo Jair", "bbox": {"l": 328.78101, "t": 208.36328000000003, "r": 545.11353, "b": 216.37927000000002, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "Escalante, and Roberto Vezzani, editors,", "bbox": {"l": 328.78101, "t": 219.32227, "r": 479.26413, "b": 227.33826, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "Pattern Recogni-", "bbox": {"l": 483.11902, "t": 219.40295000000003, "r": 545.11273, "b": 227.13202, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "tion. ICPR International Workshops and Challenges", "bbox": {"l": 328.78101, "t": 230.36095999999998, "r": 519.39771, "b": 238.09002999999996, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": ", pages", "bbox": {"l": 519.401, "t": 230.28026999999997, "r": 545.10767, "b": 238.29625999999996, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "644-658, Cham, 2021. Springer International Publishing. 2,", "bbox": {"l": 328.78101, "t": 241.23925999999994, "r": 545.11328, "b": 249.25525000000005, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "3", "bbox": {"l": 328.78101, "t": 252.19824000000006, "r": 333.26422, "b": 260.21423000000004, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "[19]", "bbox": {"l": 308.862, "t": 263.64423, "r": 324.26477, "b": 271.66022, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "Nikolaos Livathinos, Cesar Berrospi, Maksym Lysak, Vik-", "bbox": {"l": 326.57611, "t": 263.64423, "r": 545.10883, "b": 271.66022, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "tor Kuropiatnyk, Ahmed Nassar, Andre Carvalho, Michele", "bbox": {"l": 328.78101, "t": 274.60321, "r": 545.1134, "b": 282.61917000000005, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "Dolfi, Christoph Auer, Kasper Dinkla, and Peter Staar. Ro-", "bbox": {"l": 328.78101, "t": 285.56219, "r": 545.11328, "b": 293.57816, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "bust pdf document conversion using recurrent neural net-", "bbox": {"l": 328.78101, "t": 296.52118, "r": 545.11334, "b": 304.53714, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "works.", "bbox": {"l": 328.78101, "t": 307.47919, "r": 352.84683, "b": 315.49515, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "Proceedings of the AAAI Conference on Artificial", "bbox": {"l": 360.23599, "t": 307.55988, "r": 545.1142, "b": 315.28894, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "Intelligence", "bbox": {"l": 328.78101, "t": 318.51886, "r": 371.02173, "b": 326.24792, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": ", 35(17):15137-15145, May 2021. 1", "bbox": {"l": 371.021, "t": 318.43817, "r": 502.26227, "b": 326.45413, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "[20]", "bbox": {"l": 308.862, "t": 329.88419, "r": 323.82672, "b": 337.90015, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "Rujiao Long, Wen Wang, Nan Xue, Feiyu Gao, Zhibo Yang,", "bbox": {"l": 326.07233, "t": 329.88419, "r": 545.10876, "b": 337.90015, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "Yongpan Wang, and Gui-Song Xia. Parsing table structures", "bbox": {"l": 328.78101, "t": 340.8432, "r": 545.11346, "b": 348.85916, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "in the wild. In", "bbox": {"l": 328.78101, "t": 351.80219000000005, "r": 382.7767, "b": 359.81815000000006, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "Proceedings of the IEEE/CVF International", "bbox": {"l": 385.54102, "t": 351.88287, "r": 545.11609, "b": 359.61194, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "Conference on Computer Vision", "bbox": {"l": 328.78101, "t": 362.84186, "r": 443.59579, "b": 370.57092, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": ", pages 944-952, 2021. 2", "bbox": {"l": 443.59399, "t": 362.76117, "r": 534.48645, "b": 370.77713, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "[21]", "bbox": {"l": 308.862, "t": 374.20618, "r": 324.60281, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "Shubham", "bbox": {"l": 326.96487, "t": 374.20618, "r": 362.6604, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "Singh", "bbox": {"l": 368.69479, "t": 374.20618, "r": 389.6134, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "Paliwal,", "bbox": {"l": 395.6478, "t": 374.20618, "r": 424.56445, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "D", "bbox": {"l": 431.5492899999999, "t": 374.20618, "r": 438.0230399999999, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "Vishwanath,", "bbox": {"l": 444.05743, "t": 374.20618, "r": 488.5038799999999, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "Rohit", "bbox": {"l": 495.47974, "t": 374.20618, "r": 515.41205, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "Rahul,", "bbox": {"l": 521.44641, "t": 374.20618, "r": 545.10876, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "Monika Sharma, and Lovekesh Vig. Tablenet: Deep learn-", "bbox": {"l": 328.78101, "t": 385.16516, "r": 545.1134, "b": 393.18112, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "ing model for end-to-end table detection and tabular data ex-", "bbox": {"l": 328.78101, "t": 396.12415, "r": 545.11346, "b": 404.14011, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "traction from scanned document images.", "bbox": {"l": 328.78101, "t": 407.08313, "r": 478.00881999999996, "b": 415.09909, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "In", "bbox": {"l": 484.0701, "t": 407.08313, "r": 491.53912, "b": 415.09909, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "2019 Interna-", "bbox": {"l": 494.668, "t": 407.16382, "r": 545.11298, "b": 414.89288, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "tional Conference on Document Analysis and Recognition", "bbox": {"l": 328.78101, "t": 418.12280000000004, "r": 545.11334, "b": 425.85187, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "(ICDAR)", "bbox": {"l": 328.78101, "t": 429.08179, "r": 360.83591, "b": 436.8108500000001, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": ", pages 128-133. IEEE, 2019. 1", "bbox": {"l": 360.836, "t": 429.0011, "r": 475.63287, "b": 437.01706, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "[22]", "bbox": {"l": 308.862, "t": 440.44611, "r": 324.57407, "b": 448.46207, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "Adam Paszke, Sam Gross, Francisco Massa, Adam Lerer,", "bbox": {"l": 326.93179, "t": 440.44611, "r": 545.1087, "b": 448.46207, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "James Bradbury, Gregory Chanan, Trevor Killeen, Zeming", "bbox": {"l": 328.78101, "t": 451.40509, "r": 545.11346, "b": 459.42105, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "Lin, Natalia Gimelshein, Luca Antiga, Alban Desmaison,", "bbox": {"l": 328.78101, "t": 462.36407, "r": 545.11328, "b": 470.38004, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "Andreas Kopf, Edward Yang, Zachary DeVito, Martin Rai-", "bbox": {"l": 328.78101, "t": 473.32306, "r": 545.11328, "b": 481.33902, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "son, Alykhan Tejani, Sasank Chilamkurthy, Benoit Steiner,", "bbox": {"l": 328.78101, "t": 484.28204, "r": 545.11328, "b": 492.298, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "Lu Fang, Junjie Bai, and Soumith Chintala. Pytorch: An im-", "bbox": {"l": 328.78101, "t": 495.24103, "r": 545.1134, "b": 503.25699, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "perative style, high-performance deep learning library. In H.", "bbox": {"l": 328.78101, "t": 506.20001, "r": 545.1134, "b": 514.21597, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "Wallach, H. Larochelle, A. Beygelzimer, F. d'Alch\u00b4e-Buc, E.", "bbox": {"l": 328.78101, "t": 517.159, "r": 545.1098, "b": 525.17496, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "Fox, and R. Garnett, editors,", "bbox": {"l": 328.78101, "t": 528.117, "r": 434.56659, "b": 536.13297, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "Advances in Neural Informa-", "bbox": {"l": 437.86401, "t": 528.19769, "r": 545.11115, "b": 535.9267600000001, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "tion Processing Systems 32", "bbox": {"l": 328.78101, "t": 539.15671, "r": 425.73471, "b": 546.8857399999999, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": ", pages 8024-8035. Curran Asso-", "bbox": {"l": 425.73602, "t": 539.076, "r": 545.11475, "b": 547.09196, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "ciates, Inc., 2019. 6", "bbox": {"l": 328.78101, "t": 550.035, "r": 399.74109, "b": 558.05096, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "[23]", "bbox": {"l": 308.862, "t": 561.481, "r": 324.50351, "b": 569.49696, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "Devashish Prasad, Ayan Gadpal, Kshitij Kapadni, Manish", "bbox": {"l": 326.85068, "t": 561.481, "r": 545.10876, "b": 569.49696, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "Visave, and Kavita Sultanpure. Cascadetabnet: An approach", "bbox": {"l": 328.78101, "t": 572.44, "r": 545.1134, "b": 580.45596, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "for end to end table detection and structure recognition from", "bbox": {"l": 328.78101, "t": 583.399, "r": 545.11334, "b": 591.4149600000001, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "image-based documents. In", "bbox": {"l": 328.78101, "t": 594.358, "r": 431.61667, "b": 602.37396, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "Proceedings of the IEEE/CVF", "bbox": {"l": 434.69101000000006, "t": 594.4387099999999, "r": 545.11224, "b": 602.16774, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "Conference on Computer Vision and Pattern Recognition", "bbox": {"l": 328.78101, "t": 605.39671, "r": 545.1134, "b": 613.12575, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "Workshops", "bbox": {"l": 328.78101, "t": 616.35571, "r": 367.8028, "b": 624.08475, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": ", pages 572-573, 2020. 1", "bbox": {"l": 367.802, "t": 616.2750100000001, "r": 458.69446000000005, "b": 624.29097, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "[24]", "bbox": {"l": 308.862, "t": 627.72101, "r": 324.69476, "b": 635.73697, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "Shah Rukh Qasim, Hassan Mahmood, and Faisal Shafait.", "bbox": {"l": 327.07065, "t": 627.72101, "r": 545.1087, "b": 635.73697, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": "Rethinking table recognition using graph neural networks.", "bbox": {"l": 328.78101, "t": 638.68001, "r": 545.11328, "b": 646.69597, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "In", "bbox": {"l": 328.78101, "t": 649.63901, "r": 336.25003, "b": 657.65497, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "2019 International Conference on Document Analysis and", "bbox": {"l": 338.10001, "t": 649.71971, "r": 545.11621, "b": 657.44875, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "Recognition (ICDAR)", "bbox": {"l": 328.78101, "t": 660.67871, "r": 406.32245, "b": 668.40775, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": ", pages 142-147. IEEE, 2019. 3", "bbox": {"l": 406.32202, "t": 660.5980099999999, "r": 521.1189, "b": 668.61398, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "[25]", "bbox": {"l": 308.86203, "t": 672.04301, "r": 324.71329, "b": 680.05898, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "Hamid Rezatofighi, Nathan Tsoi, JunYoung Gwak, Amir", "bbox": {"l": 327.09195, "t": 672.04301, "r": 545.10876, "b": 680.05898, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "Sadeghian, Ian Reid, and Silvio Savarese.", "bbox": {"l": 328.78104, "t": 683.0020099999999, "r": 482.81488, "b": 691.01797, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "Generalized in-", "bbox": {"l": 488.75064, "t": 683.0020099999999, "r": 545.1134, "b": 691.01797, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "tersection over union: A metric and a loss for bounding box", "bbox": {"l": 328.78104, "t": 693.961014, "r": 545.11334, "b": 701.976974, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "regression. In", "bbox": {"l": 328.78104, "t": 704.920013, "r": 379.1543, "b": 712.935974, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "Proceedings of the IEEE/CVF Conference on", "bbox": {"l": 381.61603, "t": 705.00071, "r": 545.10938, "b": 712.729744, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "9", "bbox": {"l": 295.12103, "t": 734.1325870000001, "r": 300.10233, "b": 743.0391500000001, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 25, "label": "list_item", "bbox": {"l": 70.030998, "t": 75.88378999999998, "r": 286.36334, "b": 116.77575999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.7310386300086975, "cells": [{"id": 0, "text": "end object detection with transformers. In Andrea Vedaldi,", "bbox": {"l": 70.030998, "t": 75.88378999999998, "r": 286.36334, "b": 83.89977999999996, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Horst Bischof, Thomas Brox, and Jan-Michael Frahm, edi-", "bbox": {"l": 70.030998, "t": 86.84276999999997, "r": 286.36331, "b": 94.85875999999996, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "tors,", "bbox": {"l": 70.030998, "t": 97.80078000000003, "r": 85.722198, "b": 105.81677000000002, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Computer Vision - ECCV 2020", "bbox": {"l": 87.889, "t": 97.88147000000004, "r": 199.93315, "b": 105.61053000000004, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": ", pages 213-229, Cham,", "bbox": {"l": 199.936, "t": 97.80078000000003, "r": 286.36313, "b": 105.81677000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "2020. Springer International Publishing. 5", "bbox": {"l": 70.031006, "t": 108.75977, "r": 221.94871999999998, "b": 116.77575999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "list_item", "bbox": {"l": 54.595005, "t": 120.03174000000013, "r": 286.36334, "b": 149.96569999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.937275767326355, "cells": [{"id": 6, "text": "[2]", "bbox": {"l": 54.595005, "t": 120.03174000000013, "r": 65.206657, "b": 128.04773, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Zewen Chi, Heyan Huang, Heng-Da Xu, Houjin Yu, Wanx-", "bbox": {"l": 67.481873, "t": 120.03174000000013, "r": 286.35852, "b": 128.04773, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "uan Yin, and Xian-Ling Mao.", "bbox": {"l": 70.031006, "t": 130.99072, "r": 179.67215, "b": 139.00671, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Complicated table structure", "bbox": {"l": 185.58101, "t": 130.99072, "r": 286.36334, "b": 139.00671, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "recognition.", "bbox": {"l": 70.031006, "t": 141.94970999999998, "r": 113.11456, "b": 149.96569999999997, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "arXiv preprint arXiv:1908.04729", "bbox": {"l": 116.34200999999999, "t": 142.0304, "r": 235.3082, "b": 149.75946, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": ", 2019. 3", "bbox": {"l": 235.30701, "t": 141.94970999999998, "r": 267.67572, "b": 149.96569999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "list_item", "bbox": {"l": 54.595001, "t": 153.22168, "r": 286.36301, "b": 183.15466000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.937837541103363, "cells": [{"id": 13, "text": "[3]", "bbox": {"l": 54.595001, "t": 153.22168, "r": 65.103195, "b": 161.23766999999998, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Bertrand Couasnon and Aurelie Lemaitre.", "bbox": {"l": 67.356239, "t": 153.22168, "r": 218.77876, "b": 161.23766999999998, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Recognition of Ta-", "bbox": {"l": 220.97999999999996, "t": 153.30237, "r": 286.36301, "b": 161.03143, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "bles and Forms", "bbox": {"l": 70.030991, "t": 164.26135, "r": 125.26401000000001, "b": 171.99041999999997, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": ", pages 647-677. Springer London, London,", "bbox": {"l": 125.26098999999999, "t": 164.18066, "r": 286.36029, "b": 172.19665999999995, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "2014. 2", "bbox": {"l": 70.030991, "t": 175.13867000000005, "r": 97.916496, "b": 183.15466000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "list_item", "bbox": {"l": 54.59499, "t": 186.41063999999994, "r": 286.36401, "b": 227.30358999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9648825526237488, "cells": [{"id": 19, "text": "[4]", "bbox": {"l": 54.59499, "t": 186.41063999999994, "r": 65.806984, "b": 194.42664000000002, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Herv\u00b4e D\u00b4ejean, Jean-Luc Meunier, Liangcai Gao, Yilun", "bbox": {"l": 68.210922, "t": 186.41063999999994, "r": 286.36401, "b": 194.42664000000002, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Huang, Yu Fang, Florian Kleber, and Eva-Maria Lang. IC-", "bbox": {"l": 70.030983, "t": 197.36963000000003, "r": 286.36331, "b": 205.38562000000002, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "DAR 2019 Competition on Table Detection and Recognition", "bbox": {"l": 70.030983, "t": 208.32861000000003, "r": 286.36334, "b": 216.3446, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "(cTDaR), Apr. 2019. http://sac.founderit.com/. 2", "bbox": {"l": 70.030983, "t": 219.2876, "r": 245.83519, "b": 227.30358999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "list_item", "bbox": {"l": 54.594982, "t": 230.55957, "r": 286.36334, "b": 271.45154, "coord_origin": "TOPLEFT"}, "confidence": 0.9620944261550903, "cells": [{"id": 24, "text": "[5]", "bbox": {"l": 54.594982, "t": 230.55957, "r": 65.381134, "b": 238.57556, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "Basilios Gatos, Dimitrios Danatsas, Ioannis Pratikakis, and", "bbox": {"l": 67.693779, "t": 230.55957, "r": 286.35849, "b": 238.57556, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "Stavros J Perantonis. Automatic table detection in document", "bbox": {"l": 70.030983, "t": 241.51855, "r": 286.36334, "b": 249.53454999999997, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "images. In", "bbox": {"l": 70.030983, "t": 252.47655999999995, "r": 108.39821, "b": 260.49255000000005, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "International Conference on Pattern Recognition", "bbox": {"l": 110.64498000000002, "t": 252.55724999999995, "r": 286.3595, "b": 260.28632000000005, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "and Image Analysis", "bbox": {"l": 70.030983, "t": 263.51624000000004, "r": 140.57861, "b": 271.24530000000004, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": ", pages 609-618. Springer, 2005. 2", "bbox": {"l": 140.57797, "t": 263.43555000000003, "r": 266.47522, "b": 271.45154, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "list_item", "bbox": {"l": 54.594971, "t": 274.70758, "r": 286.36676, "b": 315.6004899999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9555518627166748, "cells": [{"id": 31, "text": "[6]", "bbox": {"l": 54.594971, "t": 274.70758, "r": 64.848648, "b": 282.72351, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Max G\u00a8obel, Tamir Hassan, Ermelinda Oro, and Giorgio Orsi.", "bbox": {"l": 67.047119, "t": 274.70758, "r": 286.36676, "b": 282.72351, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "Icdar 2013 table competition.", "bbox": {"l": 70.030975, "t": 285.66655999999995, "r": 179.57349, "b": 293.68253, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "In", "bbox": {"l": 187.01559, "t": 285.66655999999995, "r": 194.4846, "b": 293.68253, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "2013 12th International", "bbox": {"l": 198.04398, "t": 285.74725, "r": 286.36304, "b": 293.47632, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Conference on Document Analysis and Recognition", "bbox": {"l": 70.030975, "t": 296.70624, "r": 260.19937, "b": 304.43530000000004, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": ", pages", "bbox": {"l": 260.198, "t": 296.62555, "r": 286.36197, "b": 304.64151, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "1449-1453, 2013. 2", "bbox": {"l": 70.030991, "t": 307.5845299999999, "r": 142.74849, "b": 315.6004899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "list_item", "bbox": {"l": 54.59499, "t": 318.85654, "r": 286.36319, "b": 348.78952, "coord_origin": "TOPLEFT"}, "confidence": 0.9479843974113464, "cells": [{"id": 39, "text": "[7]", "bbox": {"l": 54.59499, "t": 318.85654, "r": 65.61586, "b": 326.8725, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "EA Green and M Krishnamoorthy.", "bbox": {"l": 67.978821, "t": 318.85654, "r": 199.492, "b": 326.8725, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Recognition of tables", "bbox": {"l": 206.98792, "t": 318.85654, "r": 286.35849, "b": 326.8725, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "using table grammars. procs.", "bbox": {"l": 70.030991, "t": 329.8145400000001, "r": 176.28284, "b": 337.83051, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "In", "bbox": {"l": 182.60416, "t": 329.8145400000001, "r": 190.07317, "b": 337.83051, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "Symposium on Document", "bbox": {"l": 193.28299, "t": 329.89522999999997, "r": 286.36319, "b": 337.62429999999995, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Analysis and Recognition (SDAIR\u201995)", "bbox": {"l": 70.030991, "t": 340.85425, "r": 206.34717, "b": 348.58331, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": ", pages 261-277. 2", "bbox": {"l": 206.34599, "t": 340.77356, "r": 274.82239, "b": 348.78952, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "list_item", "bbox": {"l": 54.594986000000006, "t": 352.0455600000001, "r": 286.36331, "b": 403.89749, "coord_origin": "TOPLEFT"}, "confidence": 0.948442816734314, "cells": [{"id": 47, "text": "[8]", "bbox": {"l": 54.594986000000006, "t": 352.0455600000001, "r": 65.04657, "b": 360.06152, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Khurram Azeem Hashmi, Alain Pagani, Marcus Liwicki, Di-", "bbox": {"l": 67.287483, "t": 352.0455600000001, "r": 286.35849, "b": 360.06152, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "dier Stricker, and Muhammad Zeshan Afzal.", "bbox": {"l": 70.030983, "t": 363.00458, "r": 234.12507999999997, "b": 371.02054, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Castabdetec-", "bbox": {"l": 240.05186, "t": 363.00458, "r": 286.36331, "b": 371.02054, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "tors: Cascade network for table detection in document im-", "bbox": {"l": 70.030983, "t": 373.96356, "r": 286.36331, "b": 381.97952, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "ages with recursive feature pyramid and switchable atrous", "bbox": {"l": 70.030983, "t": 384.92255, "r": 286.36331, "b": 392.93851, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "convolution.", "bbox": {"l": 70.030983, "t": 395.88153, "r": 114.57605, "b": 403.89749, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "Journal of Imaging", "bbox": {"l": 117.80399000000001, "t": 395.96222, "r": 186.7287, "b": 403.69128, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": ", 7(10), 2021. 1", "bbox": {"l": 186.728, "t": 395.88153, "r": 243.00113999999996, "b": 403.89749, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "list_item", "bbox": {"l": 54.595001, "t": 407.15253000000007, "r": 286.35989, "b": 437.08646000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.933076024055481, "cells": [{"id": 56, "text": "[9]", "bbox": {"l": 54.595001, "t": 407.15253000000007, "r": 65.334427, "b": 415.1684900000001, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Kaiming He, Georgia Gkioxari, Piotr Dollar, and Ross Gir-", "bbox": {"l": 67.637054, "t": 407.15253000000007, "r": 286.35852, "b": 415.1684900000001, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "shick. Mask r-cnn. In", "bbox": {"l": 70.030998, "t": 418.11151, "r": 147.13306, "b": 426.12747, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Proceedings of the IEEE International", "bbox": {"l": 149.15601, "t": 418.1922, "r": 286.35989, "b": 425.92126, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Conference on Computer Vision (ICCV)", "bbox": {"l": 70.031006, "t": 429.15118, "r": 213.48445, "b": 436.88025, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": ", Oct 2017. 1", "bbox": {"l": 213.483, "t": 429.07050000000004, "r": 261.04083, "b": 437.08646000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "list_item", "bbox": {"l": 50.112, "t": 440.3424999999999, "r": 286.36334, "b": 481.23544, "coord_origin": "TOPLEFT"}, "confidence": 0.9274739027023315, "cells": [{"id": 62, "text": "[10]", "bbox": {"l": 50.112, "t": 440.3424999999999, "r": 65.399307, "b": 448.3584599999999, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "Yelin He, X. Qi, Jiaquan Ye, Peng Gao, Yihao Chen, Bing-", "bbox": {"l": 67.693321, "t": 440.3424999999999, "r": 286.3587, "b": 448.3584599999999, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "cong Li, Xin Tang, and Rong Xiao.", "bbox": {"l": 70.030998, "t": 451.30151, "r": 202.74268, "b": 459.31747, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "Pingan-vcgroup\u2019s so-", "bbox": {"l": 209.00122, "t": 451.30151, "r": 286.36331, "b": 459.31747, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "lution for icdar 2021 competition on scientific table image", "bbox": {"l": 70.030998, "t": 462.2605, "r": 286.36334, "b": 470.27646, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "recognition to latex.", "bbox": {"l": 70.030998, "t": 473.21948, "r": 141.86981, "b": 481.23544, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "ArXiv", "bbox": {"l": 145.097, "t": 473.30017, "r": 166.01561, "b": 481.02924, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": ", abs/2105.01846, 2021. 2", "bbox": {"l": 166.015, "t": 473.21948, "r": 259.90216, "b": 481.23544, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "list_item", "bbox": {"l": 50.112, "t": 484.49048, "r": 286.36331, "b": 536.34238, "coord_origin": "TOPLEFT"}, "confidence": 0.9299951195716858, "cells": [{"id": 70, "text": "[11]", "bbox": {"l": 50.112, "t": 484.49048, "r": 66.033806, "b": 492.50644, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Jianying Hu, Ramanujan S Kashi, Daniel P Lopresti, and", "bbox": {"l": 68.423035, "t": 484.49048, "r": 286.35873, "b": 492.50644, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "Gordon Wilfong. Medium-independent table detection. In", "bbox": {"l": 70.030998, "t": 495.44946, "r": 286.36331, "b": 503.46542, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "Document Recognition and Retrieval VII", "bbox": {"l": 70.030998, "t": 506.48914, "r": 227.40926, "b": 514.2182, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": ", volume 3967,", "bbox": {"l": 227.40500000000003, "t": 506.40845, "r": 286.35913, "b": 514.4244100000001, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "pages 291-302. International Society for Optics and Photon-", "bbox": {"l": 70.031006, "t": 517.36743, "r": 286.36328, "b": 525.38339, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "ics, 1999. 2", "bbox": {"l": 70.031006, "t": 528.32642, "r": 112.36138000000001, "b": 536.34238, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "list_item", "bbox": {"l": 50.112007, "t": 539.59842, "r": 286.36334, "b": 591.44937, "coord_origin": "TOPLEFT"}, "confidence": 0.9394106268882751, "cells": [{"id": 77, "text": "[12]", "bbox": {"l": 50.112007, "t": 539.59842, "r": 65.466705, "b": 547.61438, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "Matthew Hurst. A constraint-based approach to table struc-", "bbox": {"l": 67.770828, "t": 539.59842, "r": 286.35873, "b": 547.61438, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "ture derivation. In", "bbox": {"l": 70.031006, "t": 550.55742, "r": 136.28374, "b": 558.57338, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "Proceedings of the Seventh International", "bbox": {"l": 138.811, "t": 550.63812, "r": 286.36206, "b": 558.36716, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Conference on Document Analysis and Recognition - Volume", "bbox": {"l": 70.031006, "t": 561.5971199999999, "r": 286.36334, "b": 569.32616, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "2", "bbox": {"l": 70.031006, "t": 572.55612, "r": 74.514206, "b": 580.28516, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": ", ICDAR \u201903, page 911, USA, 2003. IEEE Computer Soci-", "bbox": {"l": 74.514008, "t": 572.47542, "r": 286.36313, "b": 580.4913799999999, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "ety. 2", "bbox": {"l": 70.031006, "t": 583.4334100000001, "r": 90.357834, "b": 591.44937, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "list_item", "bbox": {"l": 50.112007, "t": 594.70541, "r": 286.36331, "b": 646.55737, "coord_origin": "TOPLEFT"}, "confidence": 0.9298841953277588, "cells": [{"id": 85, "text": "[13]", "bbox": {"l": 50.112007, "t": 594.70541, "r": 66.270439, "b": 602.72137, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Thotreingam Kasar, Philippine Barlas, Sebastien Adam,", "bbox": {"l": 68.695168, "t": 594.70541, "r": 286.35873, "b": 602.72137, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Cl\u00b4ement Chatelain, and Thierry Paquet. Learning to detect", "bbox": {"l": 70.031006, "t": 605.66441, "r": 286.3631, "b": 613.68037, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "tables in scanned document images using line information.", "bbox": {"l": 70.031006, "t": 616.62341, "r": 286.36331, "b": 624.63937, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "In", "bbox": {"l": 70.031006, "t": 627.58241, "r": 77.500015, "b": 635.5983699999999, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "2013 12th International Conference on Document Analy-", "bbox": {"l": 79.920006, "t": 627.6631199999999, "r": 286.3624, "b": 635.39215, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "sis and Recognition", "bbox": {"l": 70.031006, "t": 638.62212, "r": 140.67728, "b": 646.35115, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": ", pages 1185-1189. IEEE, 2013. 2", "bbox": {"l": 140.67599, "t": 638.54141, "r": 264.43921, "b": 646.55737, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "list_item", "bbox": {"l": 50.111992, "t": 649.81342, "r": 286.36334, "b": 679.74638, "coord_origin": "TOPLEFT"}, "confidence": 0.9115262031555176, "cells": [{"id": 93, "text": "[14]", "bbox": {"l": 50.111992, "t": 649.81342, "r": 66.534035, "b": 657.82938, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "Pratik Kayal, Mrinal Anand, Harsh Desai, and Mayank", "bbox": {"l": 68.998329, "t": 649.81342, "r": 286.35873, "b": 657.82938, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "Singh.", "bbox": {"l": 70.030991, "t": 660.77142, "r": 93.200165, "b": 668.78738, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "Icdar 2021 competition on scientific table image", "bbox": {"l": 102.20243, "t": 660.77142, "r": 286.36334, "b": 668.78738, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "recognition to latex, 2021. 2", "bbox": {"l": 70.030991, "t": 671.73042, "r": 171.9969, "b": 679.74638, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "list_item", "bbox": {"l": 50.111992, "t": 683.00243, "r": 286.35931, "b": 712.936386, "coord_origin": "TOPLEFT"}, "confidence": 0.9122309684753418, "cells": [{"id": 98, "text": "[15]", "bbox": {"l": 50.111992, "t": 683.00243, "r": 65.515968, "b": 691.01839, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "Harold W Kuhn. The hungarian method for the assignment", "bbox": {"l": 67.827499, "t": 683.00243, "r": 286.3587, "b": 691.01839, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "problem.", "bbox": {"l": 70.030991, "t": 693.9614260000001, "r": 102.15761, "b": 701.977386, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "Naval research logistics quarterly", "bbox": {"l": 107.54999, "t": 694.0421220000001, "r": 231.47461, "b": 701.771156, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": ", 2(1-2):83-97,", "bbox": {"l": 231.47598, "t": 693.9614260000001, "r": 286.35931, "b": 701.977386, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "1955. 6", "bbox": {"l": 70.030975, "t": 704.920425, "r": 97.916481, "b": 712.936386, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "list_item", "bbox": {"l": 308.86197, "t": 75.88342000000011, "r": 545.11475, "b": 138.69335999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.9389600157737732, "cells": [{"id": 104, "text": "[16]", "bbox": {"l": 308.86197, "t": 75.88342000000011, "r": 324.74973, "b": 83.89940999999999, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "Girish Kulkarni, Visruth Premraj, Vicente Ordonez, Sag-", "bbox": {"l": 327.13382, "t": 75.88342000000011, "r": 545.1087, "b": 83.89940999999999, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "nik Dhar, Siming Li, Yejin Choi, Alexander C. Berg, and", "bbox": {"l": 328.78098, "t": 86.84142999999995, "r": 545.1134, "b": 94.85741999999993, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "Tamara L. Berg.", "bbox": {"l": 328.78098, "t": 97.80042000000003, "r": 390.96295, "b": 105.81641000000002, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "Babytalk:", "bbox": {"l": 400.27008, "t": 97.80042000000003, "r": 435.1404099999999, "b": 105.81641000000002, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "Understanding and generat-", "bbox": {"l": 441.71277, "t": 97.80042000000003, "r": 545.11328, "b": 105.81641000000002, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "ing simple image descriptions.", "bbox": {"l": 328.78098, "t": 108.75940000000003, "r": 440.80719, "b": 116.7753899999999, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "IEEE Transactions on Pat-", "bbox": {"l": 446.63498, "t": 108.84009000000003, "r": 545.11304, "b": 116.56914999999992, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "tern Analysis and Machine Intelligence", "bbox": {"l": 328.78098, "t": 119.79907000000003, "r": 471.13153, "b": 127.52814000000001, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": ", 35(12):2891-2903,", "bbox": {"l": 471.13300000000004, "t": 119.71838000000002, "r": 545.11475, "b": 127.73437999999999, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "2013. 4", "bbox": {"l": 328.78101, "t": 130.67737, "r": 356.6665, "b": 138.69335999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "list_item", "bbox": {"l": 308.862, "t": 142.12334999999996, "r": 545.1134, "b": 172.05633999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.9253131747245789, "cells": [{"id": 115, "text": "[17]", "bbox": {"l": 308.862, "t": 142.12334999999996, "r": 325.24371, "b": 150.13933999999995, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "Minghao Li, Lei Cui, Shaohan Huang, Furu Wei, Ming", "bbox": {"l": 327.70197, "t": 142.12334999999996, "r": 545.10883, "b": 150.13933999999995, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "Zhou, and Zhoujun Li.", "bbox": {"l": 328.78101, "t": 153.08136000000002, "r": 414.44598, "b": 161.09735, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "Tablebank: A benchmark dataset", "bbox": {"l": 421.82532, "t": 153.08136000000002, "r": 545.1134, "b": 161.09735, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "for table detection and recognition, 2019. 2, 3", "bbox": {"l": 328.78101, "t": 164.04034000000001, "r": 493.62835999999993, "b": 172.05633999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "list_item", "bbox": {"l": 308.862, "t": 175.48632999999995, "r": 545.11353, "b": 260.21423000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9299730658531189, "cells": [{"id": 120, "text": "[18]", "bbox": {"l": 308.862, "t": 175.48632999999995, "r": 324.26599, "b": 183.50232000000005, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "Yiren Li, Zheng Huang, Junchi Yan, Yi Zhou, Fan Ye, and", "bbox": {"l": 326.57751, "t": 175.48632999999995, "r": 545.10876, "b": 183.50232000000005, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Xianhui Liu. Gfte: Graph-based financial table extraction.", "bbox": {"l": 328.78101, "t": 186.44530999999995, "r": 545.11334, "b": 194.46130000000005, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "In Alberto Del Bimbo, Rita Cucchiara, Stan Sclaroff, Gio-", "bbox": {"l": 328.78101, "t": 197.40430000000003, "r": 545.11346, "b": 205.42029000000002, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "vanni Maria Farinella, Tao Mei, Marco Bertini, Hugo Jair", "bbox": {"l": 328.78101, "t": 208.36328000000003, "r": 545.11353, "b": 216.37927000000002, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "Escalante, and Roberto Vezzani, editors,", "bbox": {"l": 328.78101, "t": 219.32227, "r": 479.26413, "b": 227.33826, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "Pattern Recogni-", "bbox": {"l": 483.11902, "t": 219.40295000000003, "r": 545.11273, "b": 227.13202, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "tion. ICPR International Workshops and Challenges", "bbox": {"l": 328.78101, "t": 230.36095999999998, "r": 519.39771, "b": 238.09002999999996, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": ", pages", "bbox": {"l": 519.401, "t": 230.28026999999997, "r": 545.10767, "b": 238.29625999999996, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "644-658, Cham, 2021. Springer International Publishing. 2,", "bbox": {"l": 328.78101, "t": 241.23925999999994, "r": 545.11328, "b": 249.25525000000005, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "3", "bbox": {"l": 328.78101, "t": 252.19824000000006, "r": 333.26422, "b": 260.21423000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "list_item", "bbox": {"l": 308.862, "t": 263.64423, "r": 545.1142, "b": 326.45413, "coord_origin": "TOPLEFT"}, "confidence": 0.9373219609260559, "cells": [{"id": 131, "text": "[19]", "bbox": {"l": 308.862, "t": 263.64423, "r": 324.26477, "b": 271.66022, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "Nikolaos Livathinos, Cesar Berrospi, Maksym Lysak, Vik-", "bbox": {"l": 326.57611, "t": 263.64423, "r": 545.10883, "b": 271.66022, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "tor Kuropiatnyk, Ahmed Nassar, Andre Carvalho, Michele", "bbox": {"l": 328.78101, "t": 274.60321, "r": 545.1134, "b": 282.61917000000005, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "Dolfi, Christoph Auer, Kasper Dinkla, and Peter Staar. Ro-", "bbox": {"l": 328.78101, "t": 285.56219, "r": 545.11328, "b": 293.57816, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "bust pdf document conversion using recurrent neural net-", "bbox": {"l": 328.78101, "t": 296.52118, "r": 545.11334, "b": 304.53714, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "works.", "bbox": {"l": 328.78101, "t": 307.47919, "r": 352.84683, "b": 315.49515, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "Proceedings of the AAAI Conference on Artificial", "bbox": {"l": 360.23599, "t": 307.55988, "r": 545.1142, "b": 315.28894, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "Intelligence", "bbox": {"l": 328.78101, "t": 318.51886, "r": 371.02173, "b": 326.24792, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": ", 35(17):15137-15145, May 2021. 1", "bbox": {"l": 371.021, "t": 318.43817, "r": 502.26227, "b": 326.45413, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "list_item", "bbox": {"l": 308.862, "t": 329.88419, "r": 545.11609, "b": 370.77713, "coord_origin": "TOPLEFT"}, "confidence": 0.902729332447052, "cells": [{"id": 140, "text": "[20]", "bbox": {"l": 308.862, "t": 329.88419, "r": 323.82672, "b": 337.90015, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "Rujiao Long, Wen Wang, Nan Xue, Feiyu Gao, Zhibo Yang,", "bbox": {"l": 326.07233, "t": 329.88419, "r": 545.10876, "b": 337.90015, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "Yongpan Wang, and Gui-Song Xia. Parsing table structures", "bbox": {"l": 328.78101, "t": 340.8432, "r": 545.11346, "b": 348.85916, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "in the wild. In", "bbox": {"l": 328.78101, "t": 351.80219000000005, "r": 382.7767, "b": 359.81815000000006, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "Proceedings of the IEEE/CVF International", "bbox": {"l": 385.54102, "t": 351.88287, "r": 545.11609, "b": 359.61194, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "Conference on Computer Vision", "bbox": {"l": 328.78101, "t": 362.84186, "r": 443.59579, "b": 370.57092, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": ", pages 944-952, 2021. 2", "bbox": {"l": 443.59399, "t": 362.76117, "r": 534.48645, "b": 370.77713, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "list_item", "bbox": {"l": 308.862, "t": 374.20618, "r": 545.11346, "b": 437.01706, "coord_origin": "TOPLEFT"}, "confidence": 0.882714569568634, "cells": [{"id": 147, "text": "[21]", "bbox": {"l": 308.862, "t": 374.20618, "r": 324.60281, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "Shubham", "bbox": {"l": 326.96487, "t": 374.20618, "r": 362.6604, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "Singh", "bbox": {"l": 368.69479, "t": 374.20618, "r": 389.6134, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "Paliwal,", "bbox": {"l": 395.6478, "t": 374.20618, "r": 424.56445, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "D", "bbox": {"l": 431.5492899999999, "t": 374.20618, "r": 438.0230399999999, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "Vishwanath,", "bbox": {"l": 444.05743, "t": 374.20618, "r": 488.5038799999999, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "Rohit", "bbox": {"l": 495.47974, "t": 374.20618, "r": 515.41205, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "Rahul,", "bbox": {"l": 521.44641, "t": 374.20618, "r": 545.10876, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "Monika Sharma, and Lovekesh Vig. Tablenet: Deep learn-", "bbox": {"l": 328.78101, "t": 385.16516, "r": 545.1134, "b": 393.18112, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "ing model for end-to-end table detection and tabular data ex-", "bbox": {"l": 328.78101, "t": 396.12415, "r": 545.11346, "b": 404.14011, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "traction from scanned document images.", "bbox": {"l": 328.78101, "t": 407.08313, "r": 478.00881999999996, "b": 415.09909, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "In", "bbox": {"l": 484.0701, "t": 407.08313, "r": 491.53912, "b": 415.09909, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "2019 Interna-", "bbox": {"l": 494.668, "t": 407.16382, "r": 545.11298, "b": 414.89288, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "tional Conference on Document Analysis and Recognition", "bbox": {"l": 328.78101, "t": 418.12280000000004, "r": 545.11334, "b": 425.85187, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "(ICDAR)", "bbox": {"l": 328.78101, "t": 429.08179, "r": 360.83591, "b": 436.8108500000001, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": ", pages 128-133. IEEE, 2019. 1", "bbox": {"l": 360.836, "t": 429.0011, "r": 475.63287, "b": 437.01706, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "list_item", "bbox": {"l": 308.862, "t": 440.44611, "r": 545.11475, "b": 558.05096, "coord_origin": "TOPLEFT"}, "confidence": 0.8896440863609314, "cells": [{"id": 163, "text": "[22]", "bbox": {"l": 308.862, "t": 440.44611, "r": 324.57407, "b": 448.46207, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "Adam Paszke, Sam Gross, Francisco Massa, Adam Lerer,", "bbox": {"l": 326.93179, "t": 440.44611, "r": 545.1087, "b": 448.46207, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "James Bradbury, Gregory Chanan, Trevor Killeen, Zeming", "bbox": {"l": 328.78101, "t": 451.40509, "r": 545.11346, "b": 459.42105, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "Lin, Natalia Gimelshein, Luca Antiga, Alban Desmaison,", "bbox": {"l": 328.78101, "t": 462.36407, "r": 545.11328, "b": 470.38004, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "Andreas Kopf, Edward Yang, Zachary DeVito, Martin Rai-", "bbox": {"l": 328.78101, "t": 473.32306, "r": 545.11328, "b": 481.33902, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "son, Alykhan Tejani, Sasank Chilamkurthy, Benoit Steiner,", "bbox": {"l": 328.78101, "t": 484.28204, "r": 545.11328, "b": 492.298, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "Lu Fang, Junjie Bai, and Soumith Chintala. Pytorch: An im-", "bbox": {"l": 328.78101, "t": 495.24103, "r": 545.1134, "b": 503.25699, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "perative style, high-performance deep learning library. In H.", "bbox": {"l": 328.78101, "t": 506.20001, "r": 545.1134, "b": 514.21597, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "Wallach, H. Larochelle, A. Beygelzimer, F. d'Alch\u00b4e-Buc, E.", "bbox": {"l": 328.78101, "t": 517.159, "r": 545.1098, "b": 525.17496, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "Fox, and R. Garnett, editors,", "bbox": {"l": 328.78101, "t": 528.117, "r": 434.56659, "b": 536.13297, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "Advances in Neural Informa-", "bbox": {"l": 437.86401, "t": 528.19769, "r": 545.11115, "b": 535.9267600000001, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "tion Processing Systems 32", "bbox": {"l": 328.78101, "t": 539.15671, "r": 425.73471, "b": 546.8857399999999, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": ", pages 8024-8035. Curran Asso-", "bbox": {"l": 425.73602, "t": 539.076, "r": 545.11475, "b": 547.09196, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "ciates, Inc., 2019. 6", "bbox": {"l": 328.78101, "t": 550.035, "r": 399.74109, "b": 558.05096, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "list_item", "bbox": {"l": 308.862, "t": 561.481, "r": 545.1134, "b": 624.29097, "coord_origin": "TOPLEFT"}, "confidence": 0.9025441408157349, "cells": [{"id": 177, "text": "[23]", "bbox": {"l": 308.862, "t": 561.481, "r": 324.50351, "b": 569.49696, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "Devashish Prasad, Ayan Gadpal, Kshitij Kapadni, Manish", "bbox": {"l": 326.85068, "t": 561.481, "r": 545.10876, "b": 569.49696, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "Visave, and Kavita Sultanpure. Cascadetabnet: An approach", "bbox": {"l": 328.78101, "t": 572.44, "r": 545.1134, "b": 580.45596, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "for end to end table detection and structure recognition from", "bbox": {"l": 328.78101, "t": 583.399, "r": 545.11334, "b": 591.4149600000001, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "image-based documents. In", "bbox": {"l": 328.78101, "t": 594.358, "r": 431.61667, "b": 602.37396, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "Proceedings of the IEEE/CVF", "bbox": {"l": 434.69101000000006, "t": 594.4387099999999, "r": 545.11224, "b": 602.16774, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "Conference on Computer Vision and Pattern Recognition", "bbox": {"l": 328.78101, "t": 605.39671, "r": 545.1134, "b": 613.12575, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "Workshops", "bbox": {"l": 328.78101, "t": 616.35571, "r": 367.8028, "b": 624.08475, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": ", pages 572-573, 2020. 1", "bbox": {"l": 367.802, "t": 616.2750100000001, "r": 458.69446000000005, "b": 624.29097, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "list_item", "bbox": {"l": 308.862, "t": 627.72101, "r": 545.11621, "b": 668.61398, "coord_origin": "TOPLEFT"}, "confidence": 0.8777539134025574, "cells": [{"id": 186, "text": "[24]", "bbox": {"l": 308.862, "t": 627.72101, "r": 324.69476, "b": 635.73697, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "Shah Rukh Qasim, Hassan Mahmood, and Faisal Shafait.", "bbox": {"l": 327.07065, "t": 627.72101, "r": 545.1087, "b": 635.73697, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": "Rethinking table recognition using graph neural networks.", "bbox": {"l": 328.78101, "t": 638.68001, "r": 545.11328, "b": 646.69597, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "In", "bbox": {"l": 328.78101, "t": 649.63901, "r": 336.25003, "b": 657.65497, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "2019 International Conference on Document Analysis and", "bbox": {"l": 338.10001, "t": 649.71971, "r": 545.11621, "b": 657.44875, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "Recognition (ICDAR)", "bbox": {"l": 328.78101, "t": 660.67871, "r": 406.32245, "b": 668.40775, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": ", pages 142-147. IEEE, 2019. 3", "bbox": {"l": 406.32202, "t": 660.5980099999999, "r": 521.1189, "b": 668.61398, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "list_item", "bbox": {"l": 308.86203, "t": 672.04301, "r": 545.1134, "b": 712.935974, "coord_origin": "TOPLEFT"}, "confidence": 0.8654531240463257, "cells": [{"id": 193, "text": "[25]", "bbox": {"l": 308.86203, "t": 672.04301, "r": 324.71329, "b": 680.05898, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "Hamid Rezatofighi, Nathan Tsoi, JunYoung Gwak, Amir", "bbox": {"l": 327.09195, "t": 672.04301, "r": 545.10876, "b": 680.05898, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "Sadeghian, Ian Reid, and Silvio Savarese.", "bbox": {"l": 328.78104, "t": 683.0020099999999, "r": 482.81488, "b": 691.01797, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "Generalized in-", "bbox": {"l": 488.75064, "t": 683.0020099999999, "r": 545.1134, "b": 691.01797, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "tersection over union: A metric and a loss for bounding box", "bbox": {"l": 328.78104, "t": 693.961014, "r": 545.11334, "b": 701.976974, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "regression. In", "bbox": {"l": 328.78104, "t": 704.920013, "r": 379.1543, "b": 712.935974, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "Proceedings of the IEEE/CVF Conference on", "bbox": {"l": 381.61603, "t": 705.00071, "r": 545.10938, "b": 712.729744, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "page_footer", "bbox": {"l": 295.12103, "t": 734.1325870000001, "r": 300.10233, "b": 743.0391500000001, "coord_origin": "TOPLEFT"}, "confidence": 0.8797810077667236, "cells": [{"id": 200, "text": "9", "bbox": {"l": 295.12103, "t": 734.1325870000001, "r": 300.10233, "b": 743.0391500000001, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "list_item", "id": 25, "page_no": 8, "cluster": {"id": 25, "label": "list_item", "bbox": {"l": 70.030998, "t": 75.88378999999998, "r": 286.36334, "b": 116.77575999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.7310386300086975, "cells": [{"id": 0, "text": "end object detection with transformers. In Andrea Vedaldi,", "bbox": {"l": 70.030998, "t": 75.88378999999998, "r": 286.36334, "b": 83.89977999999996, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Horst Bischof, Thomas Brox, and Jan-Michael Frahm, edi-", "bbox": {"l": 70.030998, "t": 86.84276999999997, "r": 286.36331, "b": 94.85875999999996, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "tors,", "bbox": {"l": 70.030998, "t": 97.80078000000003, "r": 85.722198, "b": 105.81677000000002, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Computer Vision - ECCV 2020", "bbox": {"l": 87.889, "t": 97.88147000000004, "r": 199.93315, "b": 105.61053000000004, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": ", pages 213-229, Cham,", "bbox": {"l": 199.936, "t": 97.80078000000003, "r": 286.36313, "b": 105.81677000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "2020. Springer International Publishing. 5", "bbox": {"l": 70.031006, "t": 108.75977, "r": 221.94871999999998, "b": 116.77575999999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "end object detection with transformers. In Andrea Vedaldi, Horst Bischof, Thomas Brox, and Jan-Michael Frahm, editors, Computer Vision - ECCV 2020 , pages 213-229, Cham, 2020. Springer International Publishing. 5"}, {"label": "list_item", "id": 9, "page_no": 8, "cluster": {"id": 9, "label": "list_item", "bbox": {"l": 54.595005, "t": 120.03174000000013, "r": 286.36334, "b": 149.96569999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.937275767326355, "cells": [{"id": 6, "text": "[2]", "bbox": {"l": 54.595005, "t": 120.03174000000013, "r": 65.206657, "b": 128.04773, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Zewen Chi, Heyan Huang, Heng-Da Xu, Houjin Yu, Wanx-", "bbox": {"l": 67.481873, "t": 120.03174000000013, "r": 286.35852, "b": 128.04773, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "uan Yin, and Xian-Ling Mao.", "bbox": {"l": 70.031006, "t": 130.99072, "r": 179.67215, "b": 139.00671, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Complicated table structure", "bbox": {"l": 185.58101, "t": 130.99072, "r": 286.36334, "b": 139.00671, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "recognition.", "bbox": {"l": 70.031006, "t": 141.94970999999998, "r": 113.11456, "b": 149.96569999999997, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "arXiv preprint arXiv:1908.04729", "bbox": {"l": 116.34200999999999, "t": 142.0304, "r": 235.3082, "b": 149.75946, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": ", 2019. 3", "bbox": {"l": 235.30701, "t": 141.94970999999998, "r": 267.67572, "b": 149.96569999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[2] Zewen Chi, Heyan Huang, Heng-Da Xu, Houjin Yu, Wanxuan Yin, and Xian-Ling Mao. Complicated table structure recognition. arXiv preprint arXiv:1908.04729 , 2019. 3"}, {"label": "list_item", "id": 7, "page_no": 8, "cluster": {"id": 7, "label": "list_item", "bbox": {"l": 54.595001, "t": 153.22168, "r": 286.36301, "b": 183.15466000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.937837541103363, "cells": [{"id": 13, "text": "[3]", "bbox": {"l": 54.595001, "t": 153.22168, "r": 65.103195, "b": 161.23766999999998, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Bertrand Couasnon and Aurelie Lemaitre.", "bbox": {"l": 67.356239, "t": 153.22168, "r": 218.77876, "b": 161.23766999999998, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Recognition of Ta-", "bbox": {"l": 220.97999999999996, "t": 153.30237, "r": 286.36301, "b": 161.03143, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "bles and Forms", "bbox": {"l": 70.030991, "t": 164.26135, "r": 125.26401000000001, "b": 171.99041999999997, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": ", pages 647-677. Springer London, London,", "bbox": {"l": 125.26098999999999, "t": 164.18066, "r": 286.36029, "b": 172.19665999999995, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "2014. 2", "bbox": {"l": 70.030991, "t": 175.13867000000005, "r": 97.916496, "b": 183.15466000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[3] Bertrand Couasnon and Aurelie Lemaitre. Recognition of Tables and Forms , pages 647-677. Springer London, London, 2014. 2"}, {"label": "list_item", "id": 0, "page_no": 8, "cluster": {"id": 0, "label": "list_item", "bbox": {"l": 54.59499, "t": 186.41063999999994, "r": 286.36401, "b": 227.30358999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9648825526237488, "cells": [{"id": 19, "text": "[4]", "bbox": {"l": 54.59499, "t": 186.41063999999994, "r": 65.806984, "b": 194.42664000000002, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Herv\u00b4e D\u00b4ejean, Jean-Luc Meunier, Liangcai Gao, Yilun", "bbox": {"l": 68.210922, "t": 186.41063999999994, "r": 286.36401, "b": 194.42664000000002, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Huang, Yu Fang, Florian Kleber, and Eva-Maria Lang. IC-", "bbox": {"l": 70.030983, "t": 197.36963000000003, "r": 286.36331, "b": 205.38562000000002, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "DAR 2019 Competition on Table Detection and Recognition", "bbox": {"l": 70.030983, "t": 208.32861000000003, "r": 286.36334, "b": 216.3446, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "(cTDaR), Apr. 2019. http://sac.founderit.com/. 2", "bbox": {"l": 70.030983, "t": 219.2876, "r": 245.83519, "b": 227.30358999999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[4] Herv\u00b4e D\u00b4ejean, Jean-Luc Meunier, Liangcai Gao, Yilun Huang, Yu Fang, Florian Kleber, and Eva-Maria Lang. ICDAR 2019 Competition on Table Detection and Recognition (cTDaR), Apr. 2019. http://sac.founderit.com/. 2"}, {"label": "list_item", "id": 1, "page_no": 8, "cluster": {"id": 1, "label": "list_item", "bbox": {"l": 54.594982, "t": 230.55957, "r": 286.36334, "b": 271.45154, "coord_origin": "TOPLEFT"}, "confidence": 0.9620944261550903, "cells": [{"id": 24, "text": "[5]", "bbox": {"l": 54.594982, "t": 230.55957, "r": 65.381134, "b": 238.57556, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "Basilios Gatos, Dimitrios Danatsas, Ioannis Pratikakis, and", "bbox": {"l": 67.693779, "t": 230.55957, "r": 286.35849, "b": 238.57556, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "Stavros J Perantonis. Automatic table detection in document", "bbox": {"l": 70.030983, "t": 241.51855, "r": 286.36334, "b": 249.53454999999997, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "images. In", "bbox": {"l": 70.030983, "t": 252.47655999999995, "r": 108.39821, "b": 260.49255000000005, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "International Conference on Pattern Recognition", "bbox": {"l": 110.64498000000002, "t": 252.55724999999995, "r": 286.3595, "b": 260.28632000000005, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "and Image Analysis", "bbox": {"l": 70.030983, "t": 263.51624000000004, "r": 140.57861, "b": 271.24530000000004, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": ", pages 609-618. Springer, 2005. 2", "bbox": {"l": 140.57797, "t": 263.43555000000003, "r": 266.47522, "b": 271.45154, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[5] Basilios Gatos, Dimitrios Danatsas, Ioannis Pratikakis, and Stavros J Perantonis. Automatic table detection in document images. In International Conference on Pattern Recognition and Image Analysis , pages 609-618. Springer, 2005. 2"}, {"label": "list_item", "id": 2, "page_no": 8, "cluster": {"id": 2, "label": "list_item", "bbox": {"l": 54.594971, "t": 274.70758, "r": 286.36676, "b": 315.6004899999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9555518627166748, "cells": [{"id": 31, "text": "[6]", "bbox": {"l": 54.594971, "t": 274.70758, "r": 64.848648, "b": 282.72351, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Max G\u00a8obel, Tamir Hassan, Ermelinda Oro, and Giorgio Orsi.", "bbox": {"l": 67.047119, "t": 274.70758, "r": 286.36676, "b": 282.72351, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "Icdar 2013 table competition.", "bbox": {"l": 70.030975, "t": 285.66655999999995, "r": 179.57349, "b": 293.68253, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "In", "bbox": {"l": 187.01559, "t": 285.66655999999995, "r": 194.4846, "b": 293.68253, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "2013 12th International", "bbox": {"l": 198.04398, "t": 285.74725, "r": 286.36304, "b": 293.47632, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Conference on Document Analysis and Recognition", "bbox": {"l": 70.030975, "t": 296.70624, "r": 260.19937, "b": 304.43530000000004, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": ", pages", "bbox": {"l": 260.198, "t": 296.62555, "r": 286.36197, "b": 304.64151, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "1449-1453, 2013. 2", "bbox": {"l": 70.030991, "t": 307.5845299999999, "r": 142.74849, "b": 315.6004899999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[6] Max G\u00a8obel, Tamir Hassan, Ermelinda Oro, and Giorgio Orsi. Icdar 2013 table competition. In 2013 12th International Conference on Document Analysis and Recognition , pages 1449-1453, 2013. 2"}, {"label": "list_item", "id": 4, "page_no": 8, "cluster": {"id": 4, "label": "list_item", "bbox": {"l": 54.59499, "t": 318.85654, "r": 286.36319, "b": 348.78952, "coord_origin": "TOPLEFT"}, "confidence": 0.9479843974113464, "cells": [{"id": 39, "text": "[7]", "bbox": {"l": 54.59499, "t": 318.85654, "r": 65.61586, "b": 326.8725, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "EA Green and M Krishnamoorthy.", "bbox": {"l": 67.978821, "t": 318.85654, "r": 199.492, "b": 326.8725, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Recognition of tables", "bbox": {"l": 206.98792, "t": 318.85654, "r": 286.35849, "b": 326.8725, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "using table grammars. procs.", "bbox": {"l": 70.030991, "t": 329.8145400000001, "r": 176.28284, "b": 337.83051, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "In", "bbox": {"l": 182.60416, "t": 329.8145400000001, "r": 190.07317, "b": 337.83051, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "Symposium on Document", "bbox": {"l": 193.28299, "t": 329.89522999999997, "r": 286.36319, "b": 337.62429999999995, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Analysis and Recognition (SDAIR\u201995)", "bbox": {"l": 70.030991, "t": 340.85425, "r": 206.34717, "b": 348.58331, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": ", pages 261-277. 2", "bbox": {"l": 206.34599, "t": 340.77356, "r": 274.82239, "b": 348.78952, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[7] EA Green and M Krishnamoorthy. Recognition of tables using table grammars. procs. In Symposium on Document Analysis and Recognition (SDAIR\u201995) , pages 261-277. 2"}, {"label": "list_item", "id": 3, "page_no": 8, "cluster": {"id": 3, "label": "list_item", "bbox": {"l": 54.594986000000006, "t": 352.0455600000001, "r": 286.36331, "b": 403.89749, "coord_origin": "TOPLEFT"}, "confidence": 0.948442816734314, "cells": [{"id": 47, "text": "[8]", "bbox": {"l": 54.594986000000006, "t": 352.0455600000001, "r": 65.04657, "b": 360.06152, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Khurram Azeem Hashmi, Alain Pagani, Marcus Liwicki, Di-", "bbox": {"l": 67.287483, "t": 352.0455600000001, "r": 286.35849, "b": 360.06152, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "dier Stricker, and Muhammad Zeshan Afzal.", "bbox": {"l": 70.030983, "t": 363.00458, "r": 234.12507999999997, "b": 371.02054, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Castabdetec-", "bbox": {"l": 240.05186, "t": 363.00458, "r": 286.36331, "b": 371.02054, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "tors: Cascade network for table detection in document im-", "bbox": {"l": 70.030983, "t": 373.96356, "r": 286.36331, "b": 381.97952, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "ages with recursive feature pyramid and switchable atrous", "bbox": {"l": 70.030983, "t": 384.92255, "r": 286.36331, "b": 392.93851, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "convolution.", "bbox": {"l": 70.030983, "t": 395.88153, "r": 114.57605, "b": 403.89749, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "Journal of Imaging", "bbox": {"l": 117.80399000000001, "t": 395.96222, "r": 186.7287, "b": 403.69128, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": ", 7(10), 2021. 1", "bbox": {"l": 186.728, "t": 395.88153, "r": 243.00113999999996, "b": 403.89749, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[8] Khurram Azeem Hashmi, Alain Pagani, Marcus Liwicki, Didier Stricker, and Muhammad Zeshan Afzal. Castabdetectors: Cascade network for table detection in document images with recursive feature pyramid and switchable atrous convolution. Journal of Imaging , 7(10), 2021. 1"}, {"label": "list_item", "id": 10, "page_no": 8, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 54.595001, "t": 407.15253000000007, "r": 286.35989, "b": 437.08646000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.933076024055481, "cells": [{"id": 56, "text": "[9]", "bbox": {"l": 54.595001, "t": 407.15253000000007, "r": 65.334427, "b": 415.1684900000001, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Kaiming He, Georgia Gkioxari, Piotr Dollar, and Ross Gir-", "bbox": {"l": 67.637054, "t": 407.15253000000007, "r": 286.35852, "b": 415.1684900000001, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "shick. Mask r-cnn. In", "bbox": {"l": 70.030998, "t": 418.11151, "r": 147.13306, "b": 426.12747, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Proceedings of the IEEE International", "bbox": {"l": 149.15601, "t": 418.1922, "r": 286.35989, "b": 425.92126, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Conference on Computer Vision (ICCV)", "bbox": {"l": 70.031006, "t": 429.15118, "r": 213.48445, "b": 436.88025, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": ", Oct 2017. 1", "bbox": {"l": 213.483, "t": 429.07050000000004, "r": 261.04083, "b": 437.08646000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[9] Kaiming He, Georgia Gkioxari, Piotr Dollar, and Ross Girshick. Mask r-cnn. In Proceedings of the IEEE International Conference on Computer Vision (ICCV) , Oct 2017. 1"}, {"label": "list_item", "id": 14, "page_no": 8, "cluster": {"id": 14, "label": "list_item", "bbox": {"l": 50.112, "t": 440.3424999999999, "r": 286.36334, "b": 481.23544, "coord_origin": "TOPLEFT"}, "confidence": 0.9274739027023315, "cells": [{"id": 62, "text": "[10]", "bbox": {"l": 50.112, "t": 440.3424999999999, "r": 65.399307, "b": 448.3584599999999, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "Yelin He, X. Qi, Jiaquan Ye, Peng Gao, Yihao Chen, Bing-", "bbox": {"l": 67.693321, "t": 440.3424999999999, "r": 286.3587, "b": 448.3584599999999, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "cong Li, Xin Tang, and Rong Xiao.", "bbox": {"l": 70.030998, "t": 451.30151, "r": 202.74268, "b": 459.31747, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "Pingan-vcgroup\u2019s so-", "bbox": {"l": 209.00122, "t": 451.30151, "r": 286.36331, "b": 459.31747, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "lution for icdar 2021 competition on scientific table image", "bbox": {"l": 70.030998, "t": 462.2605, "r": 286.36334, "b": 470.27646, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "recognition to latex.", "bbox": {"l": 70.030998, "t": 473.21948, "r": 141.86981, "b": 481.23544, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "ArXiv", "bbox": {"l": 145.097, "t": 473.30017, "r": 166.01561, "b": 481.02924, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": ", abs/2105.01846, 2021. 2", "bbox": {"l": 166.015, "t": 473.21948, "r": 259.90216, "b": 481.23544, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[10] Yelin He, X. Qi, Jiaquan Ye, Peng Gao, Yihao Chen, Bingcong Li, Xin Tang, and Rong Xiao. Pingan-vcgroup\u2019s solution for icdar 2021 competition on scientific table image recognition to latex. ArXiv , abs/2105.01846, 2021. 2"}, {"label": "list_item", "id": 11, "page_no": 8, "cluster": {"id": 11, "label": "list_item", "bbox": {"l": 50.112, "t": 484.49048, "r": 286.36331, "b": 536.34238, "coord_origin": "TOPLEFT"}, "confidence": 0.9299951195716858, "cells": [{"id": 70, "text": "[11]", "bbox": {"l": 50.112, "t": 484.49048, "r": 66.033806, "b": 492.50644, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Jianying Hu, Ramanujan S Kashi, Daniel P Lopresti, and", "bbox": {"l": 68.423035, "t": 484.49048, "r": 286.35873, "b": 492.50644, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "Gordon Wilfong. Medium-independent table detection. In", "bbox": {"l": 70.030998, "t": 495.44946, "r": 286.36331, "b": 503.46542, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "Document Recognition and Retrieval VII", "bbox": {"l": 70.030998, "t": 506.48914, "r": 227.40926, "b": 514.2182, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": ", volume 3967,", "bbox": {"l": 227.40500000000003, "t": 506.40845, "r": 286.35913, "b": 514.4244100000001, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "pages 291-302. International Society for Optics and Photon-", "bbox": {"l": 70.031006, "t": 517.36743, "r": 286.36328, "b": 525.38339, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "ics, 1999. 2", "bbox": {"l": 70.031006, "t": 528.32642, "r": 112.36138000000001, "b": 536.34238, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[11] Jianying Hu, Ramanujan S Kashi, Daniel P Lopresti, and Gordon Wilfong. Medium-independent table detection. In Document Recognition and Retrieval VII , volume 3967, pages 291-302. International Society for Optics and Photonics, 1999. 2"}, {"label": "list_item", "id": 5, "page_no": 8, "cluster": {"id": 5, "label": "list_item", "bbox": {"l": 50.112007, "t": 539.59842, "r": 286.36334, "b": 591.44937, "coord_origin": "TOPLEFT"}, "confidence": 0.9394106268882751, "cells": [{"id": 77, "text": "[12]", "bbox": {"l": 50.112007, "t": 539.59842, "r": 65.466705, "b": 547.61438, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "Matthew Hurst. A constraint-based approach to table struc-", "bbox": {"l": 67.770828, "t": 539.59842, "r": 286.35873, "b": 547.61438, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "ture derivation. In", "bbox": {"l": 70.031006, "t": 550.55742, "r": 136.28374, "b": 558.57338, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "Proceedings of the Seventh International", "bbox": {"l": 138.811, "t": 550.63812, "r": 286.36206, "b": 558.36716, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Conference on Document Analysis and Recognition - Volume", "bbox": {"l": 70.031006, "t": 561.5971199999999, "r": 286.36334, "b": 569.32616, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "2", "bbox": {"l": 70.031006, "t": 572.55612, "r": 74.514206, "b": 580.28516, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": ", ICDAR \u201903, page 911, USA, 2003. IEEE Computer Soci-", "bbox": {"l": 74.514008, "t": 572.47542, "r": 286.36313, "b": 580.4913799999999, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "ety. 2", "bbox": {"l": 70.031006, "t": 583.4334100000001, "r": 90.357834, "b": 591.44937, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[12] Matthew Hurst. A constraint-based approach to table structure derivation. In Proceedings of the Seventh International Conference on Document Analysis and Recognition - Volume 2 , ICDAR \u201903, page 911, USA, 2003. IEEE Computer Society. 2"}, {"label": "list_item", "id": 13, "page_no": 8, "cluster": {"id": 13, "label": "list_item", "bbox": {"l": 50.112007, "t": 594.70541, "r": 286.36331, "b": 646.55737, "coord_origin": "TOPLEFT"}, "confidence": 0.9298841953277588, "cells": [{"id": 85, "text": "[13]", "bbox": {"l": 50.112007, "t": 594.70541, "r": 66.270439, "b": 602.72137, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Thotreingam Kasar, Philippine Barlas, Sebastien Adam,", "bbox": {"l": 68.695168, "t": 594.70541, "r": 286.35873, "b": 602.72137, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Cl\u00b4ement Chatelain, and Thierry Paquet. Learning to detect", "bbox": {"l": 70.031006, "t": 605.66441, "r": 286.3631, "b": 613.68037, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "tables in scanned document images using line information.", "bbox": {"l": 70.031006, "t": 616.62341, "r": 286.36331, "b": 624.63937, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "In", "bbox": {"l": 70.031006, "t": 627.58241, "r": 77.500015, "b": 635.5983699999999, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "2013 12th International Conference on Document Analy-", "bbox": {"l": 79.920006, "t": 627.6631199999999, "r": 286.3624, "b": 635.39215, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "sis and Recognition", "bbox": {"l": 70.031006, "t": 638.62212, "r": 140.67728, "b": 646.35115, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": ", pages 1185-1189. IEEE, 2013. 2", "bbox": {"l": 140.67599, "t": 638.54141, "r": 264.43921, "b": 646.55737, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[13] Thotreingam Kasar, Philippine Barlas, Sebastien Adam, Cl\u00b4ement Chatelain, and Thierry Paquet. Learning to detect tables in scanned document images using line information. In 2013 12th International Conference on Document Analysis and Recognition , pages 1185-1189. IEEE, 2013. 2"}, {"label": "list_item", "id": 17, "page_no": 8, "cluster": {"id": 17, "label": "list_item", "bbox": {"l": 50.111992, "t": 649.81342, "r": 286.36334, "b": 679.74638, "coord_origin": "TOPLEFT"}, "confidence": 0.9115262031555176, "cells": [{"id": 93, "text": "[14]", "bbox": {"l": 50.111992, "t": 649.81342, "r": 66.534035, "b": 657.82938, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "Pratik Kayal, Mrinal Anand, Harsh Desai, and Mayank", "bbox": {"l": 68.998329, "t": 649.81342, "r": 286.35873, "b": 657.82938, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "Singh.", "bbox": {"l": 70.030991, "t": 660.77142, "r": 93.200165, "b": 668.78738, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "Icdar 2021 competition on scientific table image", "bbox": {"l": 102.20243, "t": 660.77142, "r": 286.36334, "b": 668.78738, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "recognition to latex, 2021. 2", "bbox": {"l": 70.030991, "t": 671.73042, "r": 171.9969, "b": 679.74638, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[14] Pratik Kayal, Mrinal Anand, Harsh Desai, and Mayank Singh. Icdar 2021 competition on scientific table image recognition to latex, 2021. 2"}, {"label": "list_item", "id": 16, "page_no": 8, "cluster": {"id": 16, "label": "list_item", "bbox": {"l": 50.111992, "t": 683.00243, "r": 286.35931, "b": 712.936386, "coord_origin": "TOPLEFT"}, "confidence": 0.9122309684753418, "cells": [{"id": 98, "text": "[15]", "bbox": {"l": 50.111992, "t": 683.00243, "r": 65.515968, "b": 691.01839, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "Harold W Kuhn. The hungarian method for the assignment", "bbox": {"l": 67.827499, "t": 683.00243, "r": 286.3587, "b": 691.01839, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "problem.", "bbox": {"l": 70.030991, "t": 693.9614260000001, "r": 102.15761, "b": 701.977386, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "Naval research logistics quarterly", "bbox": {"l": 107.54999, "t": 694.0421220000001, "r": 231.47461, "b": 701.771156, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": ", 2(1-2):83-97,", "bbox": {"l": 231.47598, "t": 693.9614260000001, "r": 286.35931, "b": 701.977386, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "1955. 6", "bbox": {"l": 70.030975, "t": 704.920425, "r": 97.916481, "b": 712.936386, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[15] Harold W Kuhn. The hungarian method for the assignment problem. Naval research logistics quarterly , 2(1-2):83-97, 1955. 6"}, {"label": "list_item", "id": 6, "page_no": 8, "cluster": {"id": 6, "label": "list_item", "bbox": {"l": 308.86197, "t": 75.88342000000011, "r": 545.11475, "b": 138.69335999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.9389600157737732, "cells": [{"id": 104, "text": "[16]", "bbox": {"l": 308.86197, "t": 75.88342000000011, "r": 324.74973, "b": 83.89940999999999, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "Girish Kulkarni, Visruth Premraj, Vicente Ordonez, Sag-", "bbox": {"l": 327.13382, "t": 75.88342000000011, "r": 545.1087, "b": 83.89940999999999, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "nik Dhar, Siming Li, Yejin Choi, Alexander C. Berg, and", "bbox": {"l": 328.78098, "t": 86.84142999999995, "r": 545.1134, "b": 94.85741999999993, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "Tamara L. Berg.", "bbox": {"l": 328.78098, "t": 97.80042000000003, "r": 390.96295, "b": 105.81641000000002, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "Babytalk:", "bbox": {"l": 400.27008, "t": 97.80042000000003, "r": 435.1404099999999, "b": 105.81641000000002, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "Understanding and generat-", "bbox": {"l": 441.71277, "t": 97.80042000000003, "r": 545.11328, "b": 105.81641000000002, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "ing simple image descriptions.", "bbox": {"l": 328.78098, "t": 108.75940000000003, "r": 440.80719, "b": 116.7753899999999, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "IEEE Transactions on Pat-", "bbox": {"l": 446.63498, "t": 108.84009000000003, "r": 545.11304, "b": 116.56914999999992, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "tern Analysis and Machine Intelligence", "bbox": {"l": 328.78098, "t": 119.79907000000003, "r": 471.13153, "b": 127.52814000000001, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": ", 35(12):2891-2903,", "bbox": {"l": 471.13300000000004, "t": 119.71838000000002, "r": 545.11475, "b": 127.73437999999999, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "2013. 4", "bbox": {"l": 328.78101, "t": 130.67737, "r": 356.6665, "b": 138.69335999999998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[16] Girish Kulkarni, Visruth Premraj, Vicente Ordonez, Sagnik Dhar, Siming Li, Yejin Choi, Alexander C. Berg, and Tamara L. Berg. Babytalk: Understanding and generating simple image descriptions. IEEE Transactions on Pattern Analysis and Machine Intelligence , 35(12):2891-2903, 2013. 4"}, {"label": "list_item", "id": 15, "page_no": 8, "cluster": {"id": 15, "label": "list_item", "bbox": {"l": 308.862, "t": 142.12334999999996, "r": 545.1134, "b": 172.05633999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.9253131747245789, "cells": [{"id": 115, "text": "[17]", "bbox": {"l": 308.862, "t": 142.12334999999996, "r": 325.24371, "b": 150.13933999999995, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "Minghao Li, Lei Cui, Shaohan Huang, Furu Wei, Ming", "bbox": {"l": 327.70197, "t": 142.12334999999996, "r": 545.10883, "b": 150.13933999999995, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "Zhou, and Zhoujun Li.", "bbox": {"l": 328.78101, "t": 153.08136000000002, "r": 414.44598, "b": 161.09735, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "Tablebank: A benchmark dataset", "bbox": {"l": 421.82532, "t": 153.08136000000002, "r": 545.1134, "b": 161.09735, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "for table detection and recognition, 2019. 2, 3", "bbox": {"l": 328.78101, "t": 164.04034000000001, "r": 493.62835999999993, "b": 172.05633999999998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[17] Minghao Li, Lei Cui, Shaohan Huang, Furu Wei, Ming Zhou, and Zhoujun Li. Tablebank: A benchmark dataset for table detection and recognition, 2019. 2, 3"}, {"label": "list_item", "id": 12, "page_no": 8, "cluster": {"id": 12, "label": "list_item", "bbox": {"l": 308.862, "t": 175.48632999999995, "r": 545.11353, "b": 260.21423000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9299730658531189, "cells": [{"id": 120, "text": "[18]", "bbox": {"l": 308.862, "t": 175.48632999999995, "r": 324.26599, "b": 183.50232000000005, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "Yiren Li, Zheng Huang, Junchi Yan, Yi Zhou, Fan Ye, and", "bbox": {"l": 326.57751, "t": 175.48632999999995, "r": 545.10876, "b": 183.50232000000005, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Xianhui Liu. Gfte: Graph-based financial table extraction.", "bbox": {"l": 328.78101, "t": 186.44530999999995, "r": 545.11334, "b": 194.46130000000005, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "In Alberto Del Bimbo, Rita Cucchiara, Stan Sclaroff, Gio-", "bbox": {"l": 328.78101, "t": 197.40430000000003, "r": 545.11346, "b": 205.42029000000002, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "vanni Maria Farinella, Tao Mei, Marco Bertini, Hugo Jair", "bbox": {"l": 328.78101, "t": 208.36328000000003, "r": 545.11353, "b": 216.37927000000002, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "Escalante, and Roberto Vezzani, editors,", "bbox": {"l": 328.78101, "t": 219.32227, "r": 479.26413, "b": 227.33826, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "Pattern Recogni-", "bbox": {"l": 483.11902, "t": 219.40295000000003, "r": 545.11273, "b": 227.13202, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "tion. ICPR International Workshops and Challenges", "bbox": {"l": 328.78101, "t": 230.36095999999998, "r": 519.39771, "b": 238.09002999999996, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": ", pages", "bbox": {"l": 519.401, "t": 230.28026999999997, "r": 545.10767, "b": 238.29625999999996, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "644-658, Cham, 2021. Springer International Publishing. 2,", "bbox": {"l": 328.78101, "t": 241.23925999999994, "r": 545.11328, "b": 249.25525000000005, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "3", "bbox": {"l": 328.78101, "t": 252.19824000000006, "r": 333.26422, "b": 260.21423000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[18] Yiren Li, Zheng Huang, Junchi Yan, Yi Zhou, Fan Ye, and Xianhui Liu. Gfte: Graph-based financial table extraction. In Alberto Del Bimbo, Rita Cucchiara, Stan Sclaroff, Giovanni Maria Farinella, Tao Mei, Marco Bertini, Hugo Jair Escalante, and Roberto Vezzani, editors, Pattern Recognition. ICPR International Workshops and Challenges , pages 644-658, Cham, 2021. Springer International Publishing. 2, 3"}, {"label": "list_item", "id": 8, "page_no": 8, "cluster": {"id": 8, "label": "list_item", "bbox": {"l": 308.862, "t": 263.64423, "r": 545.1142, "b": 326.45413, "coord_origin": "TOPLEFT"}, "confidence": 0.9373219609260559, "cells": [{"id": 131, "text": "[19]", "bbox": {"l": 308.862, "t": 263.64423, "r": 324.26477, "b": 271.66022, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "Nikolaos Livathinos, Cesar Berrospi, Maksym Lysak, Vik-", "bbox": {"l": 326.57611, "t": 263.64423, "r": 545.10883, "b": 271.66022, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "tor Kuropiatnyk, Ahmed Nassar, Andre Carvalho, Michele", "bbox": {"l": 328.78101, "t": 274.60321, "r": 545.1134, "b": 282.61917000000005, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "Dolfi, Christoph Auer, Kasper Dinkla, and Peter Staar. Ro-", "bbox": {"l": 328.78101, "t": 285.56219, "r": 545.11328, "b": 293.57816, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "bust pdf document conversion using recurrent neural net-", "bbox": {"l": 328.78101, "t": 296.52118, "r": 545.11334, "b": 304.53714, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "works.", "bbox": {"l": 328.78101, "t": 307.47919, "r": 352.84683, "b": 315.49515, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "Proceedings of the AAAI Conference on Artificial", "bbox": {"l": 360.23599, "t": 307.55988, "r": 545.1142, "b": 315.28894, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "Intelligence", "bbox": {"l": 328.78101, "t": 318.51886, "r": 371.02173, "b": 326.24792, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": ", 35(17):15137-15145, May 2021. 1", "bbox": {"l": 371.021, "t": 318.43817, "r": 502.26227, "b": 326.45413, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[19] Nikolaos Livathinos, Cesar Berrospi, Maksym Lysak, Viktor Kuropiatnyk, Ahmed Nassar, Andre Carvalho, Michele Dolfi, Christoph Auer, Kasper Dinkla, and Peter Staar. Robust pdf document conversion using recurrent neural networks. Proceedings of the AAAI Conference on Artificial Intelligence , 35(17):15137-15145, May 2021. 1"}, {"label": "list_item", "id": 18, "page_no": 8, "cluster": {"id": 18, "label": "list_item", "bbox": {"l": 308.862, "t": 329.88419, "r": 545.11609, "b": 370.77713, "coord_origin": "TOPLEFT"}, "confidence": 0.902729332447052, "cells": [{"id": 140, "text": "[20]", "bbox": {"l": 308.862, "t": 329.88419, "r": 323.82672, "b": 337.90015, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "Rujiao Long, Wen Wang, Nan Xue, Feiyu Gao, Zhibo Yang,", "bbox": {"l": 326.07233, "t": 329.88419, "r": 545.10876, "b": 337.90015, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "Yongpan Wang, and Gui-Song Xia. Parsing table structures", "bbox": {"l": 328.78101, "t": 340.8432, "r": 545.11346, "b": 348.85916, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "in the wild. In", "bbox": {"l": 328.78101, "t": 351.80219000000005, "r": 382.7767, "b": 359.81815000000006, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "Proceedings of the IEEE/CVF International", "bbox": {"l": 385.54102, "t": 351.88287, "r": 545.11609, "b": 359.61194, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "Conference on Computer Vision", "bbox": {"l": 328.78101, "t": 362.84186, "r": 443.59579, "b": 370.57092, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": ", pages 944-952, 2021. 2", "bbox": {"l": 443.59399, "t": 362.76117, "r": 534.48645, "b": 370.77713, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[20] Rujiao Long, Wen Wang, Nan Xue, Feiyu Gao, Zhibo Yang, Yongpan Wang, and Gui-Song Xia. Parsing table structures in the wild. In Proceedings of the IEEE/CVF International Conference on Computer Vision , pages 944-952, 2021. 2"}, {"label": "list_item", "id": 21, "page_no": 8, "cluster": {"id": 21, "label": "list_item", "bbox": {"l": 308.862, "t": 374.20618, "r": 545.11346, "b": 437.01706, "coord_origin": "TOPLEFT"}, "confidence": 0.882714569568634, "cells": [{"id": 147, "text": "[21]", "bbox": {"l": 308.862, "t": 374.20618, "r": 324.60281, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "Shubham", "bbox": {"l": 326.96487, "t": 374.20618, "r": 362.6604, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "Singh", "bbox": {"l": 368.69479, "t": 374.20618, "r": 389.6134, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "Paliwal,", "bbox": {"l": 395.6478, "t": 374.20618, "r": 424.56445, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "D", "bbox": {"l": 431.5492899999999, "t": 374.20618, "r": 438.0230399999999, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "Vishwanath,", "bbox": {"l": 444.05743, "t": 374.20618, "r": 488.5038799999999, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "Rohit", "bbox": {"l": 495.47974, "t": 374.20618, "r": 515.41205, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "Rahul,", "bbox": {"l": 521.44641, "t": 374.20618, "r": 545.10876, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "Monika Sharma, and Lovekesh Vig. Tablenet: Deep learn-", "bbox": {"l": 328.78101, "t": 385.16516, "r": 545.1134, "b": 393.18112, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "ing model for end-to-end table detection and tabular data ex-", "bbox": {"l": 328.78101, "t": 396.12415, "r": 545.11346, "b": 404.14011, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "traction from scanned document images.", "bbox": {"l": 328.78101, "t": 407.08313, "r": 478.00881999999996, "b": 415.09909, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "In", "bbox": {"l": 484.0701, "t": 407.08313, "r": 491.53912, "b": 415.09909, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "2019 Interna-", "bbox": {"l": 494.668, "t": 407.16382, "r": 545.11298, "b": 414.89288, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "tional Conference on Document Analysis and Recognition", "bbox": {"l": 328.78101, "t": 418.12280000000004, "r": 545.11334, "b": 425.85187, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "(ICDAR)", "bbox": {"l": 328.78101, "t": 429.08179, "r": 360.83591, "b": 436.8108500000001, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": ", pages 128-133. IEEE, 2019. 1", "bbox": {"l": 360.836, "t": 429.0011, "r": 475.63287, "b": 437.01706, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[21] Shubham Singh Paliwal, D Vishwanath, Rohit Rahul, Monika Sharma, and Lovekesh Vig. Tablenet: Deep learning model for end-to-end table detection and tabular data extraction from scanned document images. In 2019 International Conference on Document Analysis and Recognition (ICDAR) , pages 128-133. IEEE, 2019. 1"}, {"label": "list_item", "id": 20, "page_no": 8, "cluster": {"id": 20, "label": "list_item", "bbox": {"l": 308.862, "t": 440.44611, "r": 545.11475, "b": 558.05096, "coord_origin": "TOPLEFT"}, "confidence": 0.8896440863609314, "cells": [{"id": 163, "text": "[22]", "bbox": {"l": 308.862, "t": 440.44611, "r": 324.57407, "b": 448.46207, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "Adam Paszke, Sam Gross, Francisco Massa, Adam Lerer,", "bbox": {"l": 326.93179, "t": 440.44611, "r": 545.1087, "b": 448.46207, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "James Bradbury, Gregory Chanan, Trevor Killeen, Zeming", "bbox": {"l": 328.78101, "t": 451.40509, "r": 545.11346, "b": 459.42105, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "Lin, Natalia Gimelshein, Luca Antiga, Alban Desmaison,", "bbox": {"l": 328.78101, "t": 462.36407, "r": 545.11328, "b": 470.38004, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "Andreas Kopf, Edward Yang, Zachary DeVito, Martin Rai-", "bbox": {"l": 328.78101, "t": 473.32306, "r": 545.11328, "b": 481.33902, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "son, Alykhan Tejani, Sasank Chilamkurthy, Benoit Steiner,", "bbox": {"l": 328.78101, "t": 484.28204, "r": 545.11328, "b": 492.298, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "Lu Fang, Junjie Bai, and Soumith Chintala. Pytorch: An im-", "bbox": {"l": 328.78101, "t": 495.24103, "r": 545.1134, "b": 503.25699, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "perative style, high-performance deep learning library. In H.", "bbox": {"l": 328.78101, "t": 506.20001, "r": 545.1134, "b": 514.21597, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "Wallach, H. Larochelle, A. Beygelzimer, F. d'Alch\u00b4e-Buc, E.", "bbox": {"l": 328.78101, "t": 517.159, "r": 545.1098, "b": 525.17496, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "Fox, and R. Garnett, editors,", "bbox": {"l": 328.78101, "t": 528.117, "r": 434.56659, "b": 536.13297, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "Advances in Neural Informa-", "bbox": {"l": 437.86401, "t": 528.19769, "r": 545.11115, "b": 535.9267600000001, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "tion Processing Systems 32", "bbox": {"l": 328.78101, "t": 539.15671, "r": 425.73471, "b": 546.8857399999999, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": ", pages 8024-8035. Curran Asso-", "bbox": {"l": 425.73602, "t": 539.076, "r": 545.11475, "b": 547.09196, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "ciates, Inc., 2019. 6", "bbox": {"l": 328.78101, "t": 550.035, "r": 399.74109, "b": 558.05096, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[22] Adam Paszke, Sam Gross, Francisco Massa, Adam Lerer, James Bradbury, Gregory Chanan, Trevor Killeen, Zeming Lin, Natalia Gimelshein, Luca Antiga, Alban Desmaison, Andreas Kopf, Edward Yang, Zachary DeVito, Martin Raison, Alykhan Tejani, Sasank Chilamkurthy, Benoit Steiner, Lu Fang, Junjie Bai, and Soumith Chintala. Pytorch: An imperative style, high-performance deep learning library. In H. Wallach, H. Larochelle, A. Beygelzimer, F. d'Alch\u00b4e-Buc, E. Fox, and R. Garnett, editors, Advances in Neural Information Processing Systems 32 , pages 8024-8035. Curran Associates, Inc., 2019. 6"}, {"label": "list_item", "id": 19, "page_no": 8, "cluster": {"id": 19, "label": "list_item", "bbox": {"l": 308.862, "t": 561.481, "r": 545.1134, "b": 624.29097, "coord_origin": "TOPLEFT"}, "confidence": 0.9025441408157349, "cells": [{"id": 177, "text": "[23]", "bbox": {"l": 308.862, "t": 561.481, "r": 324.50351, "b": 569.49696, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "Devashish Prasad, Ayan Gadpal, Kshitij Kapadni, Manish", "bbox": {"l": 326.85068, "t": 561.481, "r": 545.10876, "b": 569.49696, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "Visave, and Kavita Sultanpure. Cascadetabnet: An approach", "bbox": {"l": 328.78101, "t": 572.44, "r": 545.1134, "b": 580.45596, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "for end to end table detection and structure recognition from", "bbox": {"l": 328.78101, "t": 583.399, "r": 545.11334, "b": 591.4149600000001, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "image-based documents. In", "bbox": {"l": 328.78101, "t": 594.358, "r": 431.61667, "b": 602.37396, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "Proceedings of the IEEE/CVF", "bbox": {"l": 434.69101000000006, "t": 594.4387099999999, "r": 545.11224, "b": 602.16774, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "Conference on Computer Vision and Pattern Recognition", "bbox": {"l": 328.78101, "t": 605.39671, "r": 545.1134, "b": 613.12575, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "Workshops", "bbox": {"l": 328.78101, "t": 616.35571, "r": 367.8028, "b": 624.08475, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": ", pages 572-573, 2020. 1", "bbox": {"l": 367.802, "t": 616.2750100000001, "r": 458.69446000000005, "b": 624.29097, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[23] Devashish Prasad, Ayan Gadpal, Kshitij Kapadni, Manish Visave, and Kavita Sultanpure. Cascadetabnet: An approach for end to end table detection and structure recognition from image-based documents. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition Workshops , pages 572-573, 2020. 1"}, {"label": "list_item", "id": 23, "page_no": 8, "cluster": {"id": 23, "label": "list_item", "bbox": {"l": 308.862, "t": 627.72101, "r": 545.11621, "b": 668.61398, "coord_origin": "TOPLEFT"}, "confidence": 0.8777539134025574, "cells": [{"id": 186, "text": "[24]", "bbox": {"l": 308.862, "t": 627.72101, "r": 324.69476, "b": 635.73697, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "Shah Rukh Qasim, Hassan Mahmood, and Faisal Shafait.", "bbox": {"l": 327.07065, "t": 627.72101, "r": 545.1087, "b": 635.73697, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": "Rethinking table recognition using graph neural networks.", "bbox": {"l": 328.78101, "t": 638.68001, "r": 545.11328, "b": 646.69597, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "In", "bbox": {"l": 328.78101, "t": 649.63901, "r": 336.25003, "b": 657.65497, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "2019 International Conference on Document Analysis and", "bbox": {"l": 338.10001, "t": 649.71971, "r": 545.11621, "b": 657.44875, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "Recognition (ICDAR)", "bbox": {"l": 328.78101, "t": 660.67871, "r": 406.32245, "b": 668.40775, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": ", pages 142-147. IEEE, 2019. 3", "bbox": {"l": 406.32202, "t": 660.5980099999999, "r": 521.1189, "b": 668.61398, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[24] Shah Rukh Qasim, Hassan Mahmood, and Faisal Shafait. Rethinking table recognition using graph neural networks. In 2019 International Conference on Document Analysis and Recognition (ICDAR) , pages 142-147. IEEE, 2019. 3"}, {"label": "list_item", "id": 24, "page_no": 8, "cluster": {"id": 24, "label": "list_item", "bbox": {"l": 308.86203, "t": 672.04301, "r": 545.1134, "b": 712.935974, "coord_origin": "TOPLEFT"}, "confidence": 0.8654531240463257, "cells": [{"id": 193, "text": "[25]", "bbox": {"l": 308.86203, "t": 672.04301, "r": 324.71329, "b": 680.05898, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "Hamid Rezatofighi, Nathan Tsoi, JunYoung Gwak, Amir", "bbox": {"l": 327.09195, "t": 672.04301, "r": 545.10876, "b": 680.05898, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "Sadeghian, Ian Reid, and Silvio Savarese.", "bbox": {"l": 328.78104, "t": 683.0020099999999, "r": 482.81488, "b": 691.01797, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "Generalized in-", "bbox": {"l": 488.75064, "t": 683.0020099999999, "r": 545.1134, "b": 691.01797, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "tersection over union: A metric and a loss for bounding box", "bbox": {"l": 328.78104, "t": 693.961014, "r": 545.11334, "b": 701.976974, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "regression. In", "bbox": {"l": 328.78104, "t": 704.920013, "r": 379.1543, "b": 712.935974, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "Proceedings of the IEEE/CVF Conference on", "bbox": {"l": 381.61603, "t": 705.00071, "r": 545.10938, "b": 712.729744, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[25] Hamid Rezatofighi, Nathan Tsoi, JunYoung Gwak, Amir Sadeghian, Ian Reid, and Silvio Savarese. Generalized intersection over union: A metric and a loss for bounding box regression. In Proceedings of the IEEE/CVF Conference on"}, {"label": "page_footer", "id": 22, "page_no": 8, "cluster": {"id": 22, "label": "page_footer", "bbox": {"l": 295.12103, "t": 734.1325870000001, "r": 300.10233, "b": 743.0391500000001, "coord_origin": "TOPLEFT"}, "confidence": 0.8797810077667236, "cells": [{"id": 200, "text": "9", "bbox": {"l": 295.12103, "t": 734.1325870000001, "r": 300.10233, "b": 743.0391500000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "9"}], "body": [{"label": "list_item", "id": 25, "page_no": 8, "cluster": {"id": 25, "label": "list_item", "bbox": {"l": 70.030998, "t": 75.88378999999998, "r": 286.36334, "b": 116.77575999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.7310386300086975, "cells": [{"id": 0, "text": "end object detection with transformers. In Andrea Vedaldi,", "bbox": {"l": 70.030998, "t": 75.88378999999998, "r": 286.36334, "b": 83.89977999999996, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Horst Bischof, Thomas Brox, and Jan-Michael Frahm, edi-", "bbox": {"l": 70.030998, "t": 86.84276999999997, "r": 286.36331, "b": 94.85875999999996, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "tors,", "bbox": {"l": 70.030998, "t": 97.80078000000003, "r": 85.722198, "b": 105.81677000000002, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Computer Vision - ECCV 2020", "bbox": {"l": 87.889, "t": 97.88147000000004, "r": 199.93315, "b": 105.61053000000004, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": ", pages 213-229, Cham,", "bbox": {"l": 199.936, "t": 97.80078000000003, "r": 286.36313, "b": 105.81677000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "2020. Springer International Publishing. 5", "bbox": {"l": 70.031006, "t": 108.75977, "r": 221.94871999999998, "b": 116.77575999999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "end object detection with transformers. In Andrea Vedaldi, Horst Bischof, Thomas Brox, and Jan-Michael Frahm, editors, Computer Vision - ECCV 2020 , pages 213-229, Cham, 2020. Springer International Publishing. 5"}, {"label": "list_item", "id": 9, "page_no": 8, "cluster": {"id": 9, "label": "list_item", "bbox": {"l": 54.595005, "t": 120.03174000000013, "r": 286.36334, "b": 149.96569999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.937275767326355, "cells": [{"id": 6, "text": "[2]", "bbox": {"l": 54.595005, "t": 120.03174000000013, "r": 65.206657, "b": 128.04773, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Zewen Chi, Heyan Huang, Heng-Da Xu, Houjin Yu, Wanx-", "bbox": {"l": 67.481873, "t": 120.03174000000013, "r": 286.35852, "b": 128.04773, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "uan Yin, and Xian-Ling Mao.", "bbox": {"l": 70.031006, "t": 130.99072, "r": 179.67215, "b": 139.00671, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Complicated table structure", "bbox": {"l": 185.58101, "t": 130.99072, "r": 286.36334, "b": 139.00671, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "recognition.", "bbox": {"l": 70.031006, "t": 141.94970999999998, "r": 113.11456, "b": 149.96569999999997, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "arXiv preprint arXiv:1908.04729", "bbox": {"l": 116.34200999999999, "t": 142.0304, "r": 235.3082, "b": 149.75946, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": ", 2019. 3", "bbox": {"l": 235.30701, "t": 141.94970999999998, "r": 267.67572, "b": 149.96569999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[2] Zewen Chi, Heyan Huang, Heng-Da Xu, Houjin Yu, Wanxuan Yin, and Xian-Ling Mao. Complicated table structure recognition. arXiv preprint arXiv:1908.04729 , 2019. 3"}, {"label": "list_item", "id": 7, "page_no": 8, "cluster": {"id": 7, "label": "list_item", "bbox": {"l": 54.595001, "t": 153.22168, "r": 286.36301, "b": 183.15466000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.937837541103363, "cells": [{"id": 13, "text": "[3]", "bbox": {"l": 54.595001, "t": 153.22168, "r": 65.103195, "b": 161.23766999999998, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Bertrand Couasnon and Aurelie Lemaitre.", "bbox": {"l": 67.356239, "t": 153.22168, "r": 218.77876, "b": 161.23766999999998, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Recognition of Ta-", "bbox": {"l": 220.97999999999996, "t": 153.30237, "r": 286.36301, "b": 161.03143, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "bles and Forms", "bbox": {"l": 70.030991, "t": 164.26135, "r": 125.26401000000001, "b": 171.99041999999997, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": ", pages 647-677. Springer London, London,", "bbox": {"l": 125.26098999999999, "t": 164.18066, "r": 286.36029, "b": 172.19665999999995, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "2014. 2", "bbox": {"l": 70.030991, "t": 175.13867000000005, "r": 97.916496, "b": 183.15466000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[3] Bertrand Couasnon and Aurelie Lemaitre. Recognition of Tables and Forms , pages 647-677. Springer London, London, 2014. 2"}, {"label": "list_item", "id": 0, "page_no": 8, "cluster": {"id": 0, "label": "list_item", "bbox": {"l": 54.59499, "t": 186.41063999999994, "r": 286.36401, "b": 227.30358999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9648825526237488, "cells": [{"id": 19, "text": "[4]", "bbox": {"l": 54.59499, "t": 186.41063999999994, "r": 65.806984, "b": 194.42664000000002, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Herv\u00b4e D\u00b4ejean, Jean-Luc Meunier, Liangcai Gao, Yilun", "bbox": {"l": 68.210922, "t": 186.41063999999994, "r": 286.36401, "b": 194.42664000000002, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Huang, Yu Fang, Florian Kleber, and Eva-Maria Lang. IC-", "bbox": {"l": 70.030983, "t": 197.36963000000003, "r": 286.36331, "b": 205.38562000000002, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "DAR 2019 Competition on Table Detection and Recognition", "bbox": {"l": 70.030983, "t": 208.32861000000003, "r": 286.36334, "b": 216.3446, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "(cTDaR), Apr. 2019. http://sac.founderit.com/. 2", "bbox": {"l": 70.030983, "t": 219.2876, "r": 245.83519, "b": 227.30358999999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[4] Herv\u00b4e D\u00b4ejean, Jean-Luc Meunier, Liangcai Gao, Yilun Huang, Yu Fang, Florian Kleber, and Eva-Maria Lang. ICDAR 2019 Competition on Table Detection and Recognition (cTDaR), Apr. 2019. http://sac.founderit.com/. 2"}, {"label": "list_item", "id": 1, "page_no": 8, "cluster": {"id": 1, "label": "list_item", "bbox": {"l": 54.594982, "t": 230.55957, "r": 286.36334, "b": 271.45154, "coord_origin": "TOPLEFT"}, "confidence": 0.9620944261550903, "cells": [{"id": 24, "text": "[5]", "bbox": {"l": 54.594982, "t": 230.55957, "r": 65.381134, "b": 238.57556, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "Basilios Gatos, Dimitrios Danatsas, Ioannis Pratikakis, and", "bbox": {"l": 67.693779, "t": 230.55957, "r": 286.35849, "b": 238.57556, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "Stavros J Perantonis. Automatic table detection in document", "bbox": {"l": 70.030983, "t": 241.51855, "r": 286.36334, "b": 249.53454999999997, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "images. In", "bbox": {"l": 70.030983, "t": 252.47655999999995, "r": 108.39821, "b": 260.49255000000005, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "International Conference on Pattern Recognition", "bbox": {"l": 110.64498000000002, "t": 252.55724999999995, "r": 286.3595, "b": 260.28632000000005, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "and Image Analysis", "bbox": {"l": 70.030983, "t": 263.51624000000004, "r": 140.57861, "b": 271.24530000000004, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": ", pages 609-618. Springer, 2005. 2", "bbox": {"l": 140.57797, "t": 263.43555000000003, "r": 266.47522, "b": 271.45154, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[5] Basilios Gatos, Dimitrios Danatsas, Ioannis Pratikakis, and Stavros J Perantonis. Automatic table detection in document images. In International Conference on Pattern Recognition and Image Analysis , pages 609-618. Springer, 2005. 2"}, {"label": "list_item", "id": 2, "page_no": 8, "cluster": {"id": 2, "label": "list_item", "bbox": {"l": 54.594971, "t": 274.70758, "r": 286.36676, "b": 315.6004899999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9555518627166748, "cells": [{"id": 31, "text": "[6]", "bbox": {"l": 54.594971, "t": 274.70758, "r": 64.848648, "b": 282.72351, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Max G\u00a8obel, Tamir Hassan, Ermelinda Oro, and Giorgio Orsi.", "bbox": {"l": 67.047119, "t": 274.70758, "r": 286.36676, "b": 282.72351, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "Icdar 2013 table competition.", "bbox": {"l": 70.030975, "t": 285.66655999999995, "r": 179.57349, "b": 293.68253, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "In", "bbox": {"l": 187.01559, "t": 285.66655999999995, "r": 194.4846, "b": 293.68253, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "2013 12th International", "bbox": {"l": 198.04398, "t": 285.74725, "r": 286.36304, "b": 293.47632, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Conference on Document Analysis and Recognition", "bbox": {"l": 70.030975, "t": 296.70624, "r": 260.19937, "b": 304.43530000000004, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": ", pages", "bbox": {"l": 260.198, "t": 296.62555, "r": 286.36197, "b": 304.64151, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "1449-1453, 2013. 2", "bbox": {"l": 70.030991, "t": 307.5845299999999, "r": 142.74849, "b": 315.6004899999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[6] Max G\u00a8obel, Tamir Hassan, Ermelinda Oro, and Giorgio Orsi. Icdar 2013 table competition. In 2013 12th International Conference on Document Analysis and Recognition , pages 1449-1453, 2013. 2"}, {"label": "list_item", "id": 4, "page_no": 8, "cluster": {"id": 4, "label": "list_item", "bbox": {"l": 54.59499, "t": 318.85654, "r": 286.36319, "b": 348.78952, "coord_origin": "TOPLEFT"}, "confidence": 0.9479843974113464, "cells": [{"id": 39, "text": "[7]", "bbox": {"l": 54.59499, "t": 318.85654, "r": 65.61586, "b": 326.8725, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "EA Green and M Krishnamoorthy.", "bbox": {"l": 67.978821, "t": 318.85654, "r": 199.492, "b": 326.8725, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Recognition of tables", "bbox": {"l": 206.98792, "t": 318.85654, "r": 286.35849, "b": 326.8725, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "using table grammars. procs.", "bbox": {"l": 70.030991, "t": 329.8145400000001, "r": 176.28284, "b": 337.83051, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "In", "bbox": {"l": 182.60416, "t": 329.8145400000001, "r": 190.07317, "b": 337.83051, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "Symposium on Document", "bbox": {"l": 193.28299, "t": 329.89522999999997, "r": 286.36319, "b": 337.62429999999995, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Analysis and Recognition (SDAIR\u201995)", "bbox": {"l": 70.030991, "t": 340.85425, "r": 206.34717, "b": 348.58331, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": ", pages 261-277. 2", "bbox": {"l": 206.34599, "t": 340.77356, "r": 274.82239, "b": 348.78952, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[7] EA Green and M Krishnamoorthy. Recognition of tables using table grammars. procs. In Symposium on Document Analysis and Recognition (SDAIR\u201995) , pages 261-277. 2"}, {"label": "list_item", "id": 3, "page_no": 8, "cluster": {"id": 3, "label": "list_item", "bbox": {"l": 54.594986000000006, "t": 352.0455600000001, "r": 286.36331, "b": 403.89749, "coord_origin": "TOPLEFT"}, "confidence": 0.948442816734314, "cells": [{"id": 47, "text": "[8]", "bbox": {"l": 54.594986000000006, "t": 352.0455600000001, "r": 65.04657, "b": 360.06152, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Khurram Azeem Hashmi, Alain Pagani, Marcus Liwicki, Di-", "bbox": {"l": 67.287483, "t": 352.0455600000001, "r": 286.35849, "b": 360.06152, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "dier Stricker, and Muhammad Zeshan Afzal.", "bbox": {"l": 70.030983, "t": 363.00458, "r": 234.12507999999997, "b": 371.02054, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Castabdetec-", "bbox": {"l": 240.05186, "t": 363.00458, "r": 286.36331, "b": 371.02054, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "tors: Cascade network for table detection in document im-", "bbox": {"l": 70.030983, "t": 373.96356, "r": 286.36331, "b": 381.97952, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "ages with recursive feature pyramid and switchable atrous", "bbox": {"l": 70.030983, "t": 384.92255, "r": 286.36331, "b": 392.93851, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "convolution.", "bbox": {"l": 70.030983, "t": 395.88153, "r": 114.57605, "b": 403.89749, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "Journal of Imaging", "bbox": {"l": 117.80399000000001, "t": 395.96222, "r": 186.7287, "b": 403.69128, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": ", 7(10), 2021. 1", "bbox": {"l": 186.728, "t": 395.88153, "r": 243.00113999999996, "b": 403.89749, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[8] Khurram Azeem Hashmi, Alain Pagani, Marcus Liwicki, Didier Stricker, and Muhammad Zeshan Afzal. Castabdetectors: Cascade network for table detection in document images with recursive feature pyramid and switchable atrous convolution. Journal of Imaging , 7(10), 2021. 1"}, {"label": "list_item", "id": 10, "page_no": 8, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 54.595001, "t": 407.15253000000007, "r": 286.35989, "b": 437.08646000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.933076024055481, "cells": [{"id": 56, "text": "[9]", "bbox": {"l": 54.595001, "t": 407.15253000000007, "r": 65.334427, "b": 415.1684900000001, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Kaiming He, Georgia Gkioxari, Piotr Dollar, and Ross Gir-", "bbox": {"l": 67.637054, "t": 407.15253000000007, "r": 286.35852, "b": 415.1684900000001, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "shick. Mask r-cnn. In", "bbox": {"l": 70.030998, "t": 418.11151, "r": 147.13306, "b": 426.12747, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Proceedings of the IEEE International", "bbox": {"l": 149.15601, "t": 418.1922, "r": 286.35989, "b": 425.92126, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Conference on Computer Vision (ICCV)", "bbox": {"l": 70.031006, "t": 429.15118, "r": 213.48445, "b": 436.88025, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": ", Oct 2017. 1", "bbox": {"l": 213.483, "t": 429.07050000000004, "r": 261.04083, "b": 437.08646000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[9] Kaiming He, Georgia Gkioxari, Piotr Dollar, and Ross Girshick. Mask r-cnn. In Proceedings of the IEEE International Conference on Computer Vision (ICCV) , Oct 2017. 1"}, {"label": "list_item", "id": 14, "page_no": 8, "cluster": {"id": 14, "label": "list_item", "bbox": {"l": 50.112, "t": 440.3424999999999, "r": 286.36334, "b": 481.23544, "coord_origin": "TOPLEFT"}, "confidence": 0.9274739027023315, "cells": [{"id": 62, "text": "[10]", "bbox": {"l": 50.112, "t": 440.3424999999999, "r": 65.399307, "b": 448.3584599999999, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "Yelin He, X. Qi, Jiaquan Ye, Peng Gao, Yihao Chen, Bing-", "bbox": {"l": 67.693321, "t": 440.3424999999999, "r": 286.3587, "b": 448.3584599999999, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "cong Li, Xin Tang, and Rong Xiao.", "bbox": {"l": 70.030998, "t": 451.30151, "r": 202.74268, "b": 459.31747, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "Pingan-vcgroup\u2019s so-", "bbox": {"l": 209.00122, "t": 451.30151, "r": 286.36331, "b": 459.31747, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "lution for icdar 2021 competition on scientific table image", "bbox": {"l": 70.030998, "t": 462.2605, "r": 286.36334, "b": 470.27646, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "recognition to latex.", "bbox": {"l": 70.030998, "t": 473.21948, "r": 141.86981, "b": 481.23544, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "ArXiv", "bbox": {"l": 145.097, "t": 473.30017, "r": 166.01561, "b": 481.02924, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": ", abs/2105.01846, 2021. 2", "bbox": {"l": 166.015, "t": 473.21948, "r": 259.90216, "b": 481.23544, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[10] Yelin He, X. Qi, Jiaquan Ye, Peng Gao, Yihao Chen, Bingcong Li, Xin Tang, and Rong Xiao. Pingan-vcgroup\u2019s solution for icdar 2021 competition on scientific table image recognition to latex. ArXiv , abs/2105.01846, 2021. 2"}, {"label": "list_item", "id": 11, "page_no": 8, "cluster": {"id": 11, "label": "list_item", "bbox": {"l": 50.112, "t": 484.49048, "r": 286.36331, "b": 536.34238, "coord_origin": "TOPLEFT"}, "confidence": 0.9299951195716858, "cells": [{"id": 70, "text": "[11]", "bbox": {"l": 50.112, "t": 484.49048, "r": 66.033806, "b": 492.50644, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Jianying Hu, Ramanujan S Kashi, Daniel P Lopresti, and", "bbox": {"l": 68.423035, "t": 484.49048, "r": 286.35873, "b": 492.50644, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "Gordon Wilfong. Medium-independent table detection. In", "bbox": {"l": 70.030998, "t": 495.44946, "r": 286.36331, "b": 503.46542, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "Document Recognition and Retrieval VII", "bbox": {"l": 70.030998, "t": 506.48914, "r": 227.40926, "b": 514.2182, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": ", volume 3967,", "bbox": {"l": 227.40500000000003, "t": 506.40845, "r": 286.35913, "b": 514.4244100000001, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "pages 291-302. International Society for Optics and Photon-", "bbox": {"l": 70.031006, "t": 517.36743, "r": 286.36328, "b": 525.38339, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "ics, 1999. 2", "bbox": {"l": 70.031006, "t": 528.32642, "r": 112.36138000000001, "b": 536.34238, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[11] Jianying Hu, Ramanujan S Kashi, Daniel P Lopresti, and Gordon Wilfong. Medium-independent table detection. In Document Recognition and Retrieval VII , volume 3967, pages 291-302. International Society for Optics and Photonics, 1999. 2"}, {"label": "list_item", "id": 5, "page_no": 8, "cluster": {"id": 5, "label": "list_item", "bbox": {"l": 50.112007, "t": 539.59842, "r": 286.36334, "b": 591.44937, "coord_origin": "TOPLEFT"}, "confidence": 0.9394106268882751, "cells": [{"id": 77, "text": "[12]", "bbox": {"l": 50.112007, "t": 539.59842, "r": 65.466705, "b": 547.61438, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "Matthew Hurst. A constraint-based approach to table struc-", "bbox": {"l": 67.770828, "t": 539.59842, "r": 286.35873, "b": 547.61438, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "ture derivation. In", "bbox": {"l": 70.031006, "t": 550.55742, "r": 136.28374, "b": 558.57338, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "Proceedings of the Seventh International", "bbox": {"l": 138.811, "t": 550.63812, "r": 286.36206, "b": 558.36716, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Conference on Document Analysis and Recognition - Volume", "bbox": {"l": 70.031006, "t": 561.5971199999999, "r": 286.36334, "b": 569.32616, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "2", "bbox": {"l": 70.031006, "t": 572.55612, "r": 74.514206, "b": 580.28516, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": ", ICDAR \u201903, page 911, USA, 2003. IEEE Computer Soci-", "bbox": {"l": 74.514008, "t": 572.47542, "r": 286.36313, "b": 580.4913799999999, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "ety. 2", "bbox": {"l": 70.031006, "t": 583.4334100000001, "r": 90.357834, "b": 591.44937, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[12] Matthew Hurst. A constraint-based approach to table structure derivation. In Proceedings of the Seventh International Conference on Document Analysis and Recognition - Volume 2 , ICDAR \u201903, page 911, USA, 2003. IEEE Computer Society. 2"}, {"label": "list_item", "id": 13, "page_no": 8, "cluster": {"id": 13, "label": "list_item", "bbox": {"l": 50.112007, "t": 594.70541, "r": 286.36331, "b": 646.55737, "coord_origin": "TOPLEFT"}, "confidence": 0.9298841953277588, "cells": [{"id": 85, "text": "[13]", "bbox": {"l": 50.112007, "t": 594.70541, "r": 66.270439, "b": 602.72137, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Thotreingam Kasar, Philippine Barlas, Sebastien Adam,", "bbox": {"l": 68.695168, "t": 594.70541, "r": 286.35873, "b": 602.72137, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Cl\u00b4ement Chatelain, and Thierry Paquet. Learning to detect", "bbox": {"l": 70.031006, "t": 605.66441, "r": 286.3631, "b": 613.68037, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "tables in scanned document images using line information.", "bbox": {"l": 70.031006, "t": 616.62341, "r": 286.36331, "b": 624.63937, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "In", "bbox": {"l": 70.031006, "t": 627.58241, "r": 77.500015, "b": 635.5983699999999, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "2013 12th International Conference on Document Analy-", "bbox": {"l": 79.920006, "t": 627.6631199999999, "r": 286.3624, "b": 635.39215, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "sis and Recognition", "bbox": {"l": 70.031006, "t": 638.62212, "r": 140.67728, "b": 646.35115, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": ", pages 1185-1189. IEEE, 2013. 2", "bbox": {"l": 140.67599, "t": 638.54141, "r": 264.43921, "b": 646.55737, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[13] Thotreingam Kasar, Philippine Barlas, Sebastien Adam, Cl\u00b4ement Chatelain, and Thierry Paquet. Learning to detect tables in scanned document images using line information. In 2013 12th International Conference on Document Analysis and Recognition , pages 1185-1189. IEEE, 2013. 2"}, {"label": "list_item", "id": 17, "page_no": 8, "cluster": {"id": 17, "label": "list_item", "bbox": {"l": 50.111992, "t": 649.81342, "r": 286.36334, "b": 679.74638, "coord_origin": "TOPLEFT"}, "confidence": 0.9115262031555176, "cells": [{"id": 93, "text": "[14]", "bbox": {"l": 50.111992, "t": 649.81342, "r": 66.534035, "b": 657.82938, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "Pratik Kayal, Mrinal Anand, Harsh Desai, and Mayank", "bbox": {"l": 68.998329, "t": 649.81342, "r": 286.35873, "b": 657.82938, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "Singh.", "bbox": {"l": 70.030991, "t": 660.77142, "r": 93.200165, "b": 668.78738, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "Icdar 2021 competition on scientific table image", "bbox": {"l": 102.20243, "t": 660.77142, "r": 286.36334, "b": 668.78738, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "recognition to latex, 2021. 2", "bbox": {"l": 70.030991, "t": 671.73042, "r": 171.9969, "b": 679.74638, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[14] Pratik Kayal, Mrinal Anand, Harsh Desai, and Mayank Singh. Icdar 2021 competition on scientific table image recognition to latex, 2021. 2"}, {"label": "list_item", "id": 16, "page_no": 8, "cluster": {"id": 16, "label": "list_item", "bbox": {"l": 50.111992, "t": 683.00243, "r": 286.35931, "b": 712.936386, "coord_origin": "TOPLEFT"}, "confidence": 0.9122309684753418, "cells": [{"id": 98, "text": "[15]", "bbox": {"l": 50.111992, "t": 683.00243, "r": 65.515968, "b": 691.01839, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "Harold W Kuhn. The hungarian method for the assignment", "bbox": {"l": 67.827499, "t": 683.00243, "r": 286.3587, "b": 691.01839, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "problem.", "bbox": {"l": 70.030991, "t": 693.9614260000001, "r": 102.15761, "b": 701.977386, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "Naval research logistics quarterly", "bbox": {"l": 107.54999, "t": 694.0421220000001, "r": 231.47461, "b": 701.771156, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": ", 2(1-2):83-97,", "bbox": {"l": 231.47598, "t": 693.9614260000001, "r": 286.35931, "b": 701.977386, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "1955. 6", "bbox": {"l": 70.030975, "t": 704.920425, "r": 97.916481, "b": 712.936386, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[15] Harold W Kuhn. The hungarian method for the assignment problem. Naval research logistics quarterly , 2(1-2):83-97, 1955. 6"}, {"label": "list_item", "id": 6, "page_no": 8, "cluster": {"id": 6, "label": "list_item", "bbox": {"l": 308.86197, "t": 75.88342000000011, "r": 545.11475, "b": 138.69335999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.9389600157737732, "cells": [{"id": 104, "text": "[16]", "bbox": {"l": 308.86197, "t": 75.88342000000011, "r": 324.74973, "b": 83.89940999999999, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "Girish Kulkarni, Visruth Premraj, Vicente Ordonez, Sag-", "bbox": {"l": 327.13382, "t": 75.88342000000011, "r": 545.1087, "b": 83.89940999999999, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "nik Dhar, Siming Li, Yejin Choi, Alexander C. Berg, and", "bbox": {"l": 328.78098, "t": 86.84142999999995, "r": 545.1134, "b": 94.85741999999993, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "Tamara L. Berg.", "bbox": {"l": 328.78098, "t": 97.80042000000003, "r": 390.96295, "b": 105.81641000000002, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "Babytalk:", "bbox": {"l": 400.27008, "t": 97.80042000000003, "r": 435.1404099999999, "b": 105.81641000000002, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "Understanding and generat-", "bbox": {"l": 441.71277, "t": 97.80042000000003, "r": 545.11328, "b": 105.81641000000002, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "ing simple image descriptions.", "bbox": {"l": 328.78098, "t": 108.75940000000003, "r": 440.80719, "b": 116.7753899999999, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "IEEE Transactions on Pat-", "bbox": {"l": 446.63498, "t": 108.84009000000003, "r": 545.11304, "b": 116.56914999999992, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "tern Analysis and Machine Intelligence", "bbox": {"l": 328.78098, "t": 119.79907000000003, "r": 471.13153, "b": 127.52814000000001, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": ", 35(12):2891-2903,", "bbox": {"l": 471.13300000000004, "t": 119.71838000000002, "r": 545.11475, "b": 127.73437999999999, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "2013. 4", "bbox": {"l": 328.78101, "t": 130.67737, "r": 356.6665, "b": 138.69335999999998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[16] Girish Kulkarni, Visruth Premraj, Vicente Ordonez, Sagnik Dhar, Siming Li, Yejin Choi, Alexander C. Berg, and Tamara L. Berg. Babytalk: Understanding and generating simple image descriptions. IEEE Transactions on Pattern Analysis and Machine Intelligence , 35(12):2891-2903, 2013. 4"}, {"label": "list_item", "id": 15, "page_no": 8, "cluster": {"id": 15, "label": "list_item", "bbox": {"l": 308.862, "t": 142.12334999999996, "r": 545.1134, "b": 172.05633999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.9253131747245789, "cells": [{"id": 115, "text": "[17]", "bbox": {"l": 308.862, "t": 142.12334999999996, "r": 325.24371, "b": 150.13933999999995, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "Minghao Li, Lei Cui, Shaohan Huang, Furu Wei, Ming", "bbox": {"l": 327.70197, "t": 142.12334999999996, "r": 545.10883, "b": 150.13933999999995, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "Zhou, and Zhoujun Li.", "bbox": {"l": 328.78101, "t": 153.08136000000002, "r": 414.44598, "b": 161.09735, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "Tablebank: A benchmark dataset", "bbox": {"l": 421.82532, "t": 153.08136000000002, "r": 545.1134, "b": 161.09735, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "for table detection and recognition, 2019. 2, 3", "bbox": {"l": 328.78101, "t": 164.04034000000001, "r": 493.62835999999993, "b": 172.05633999999998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[17] Minghao Li, Lei Cui, Shaohan Huang, Furu Wei, Ming Zhou, and Zhoujun Li. Tablebank: A benchmark dataset for table detection and recognition, 2019. 2, 3"}, {"label": "list_item", "id": 12, "page_no": 8, "cluster": {"id": 12, "label": "list_item", "bbox": {"l": 308.862, "t": 175.48632999999995, "r": 545.11353, "b": 260.21423000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9299730658531189, "cells": [{"id": 120, "text": "[18]", "bbox": {"l": 308.862, "t": 175.48632999999995, "r": 324.26599, "b": 183.50232000000005, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "Yiren Li, Zheng Huang, Junchi Yan, Yi Zhou, Fan Ye, and", "bbox": {"l": 326.57751, "t": 175.48632999999995, "r": 545.10876, "b": 183.50232000000005, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Xianhui Liu. Gfte: Graph-based financial table extraction.", "bbox": {"l": 328.78101, "t": 186.44530999999995, "r": 545.11334, "b": 194.46130000000005, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "In Alberto Del Bimbo, Rita Cucchiara, Stan Sclaroff, Gio-", "bbox": {"l": 328.78101, "t": 197.40430000000003, "r": 545.11346, "b": 205.42029000000002, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "vanni Maria Farinella, Tao Mei, Marco Bertini, Hugo Jair", "bbox": {"l": 328.78101, "t": 208.36328000000003, "r": 545.11353, "b": 216.37927000000002, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "Escalante, and Roberto Vezzani, editors,", "bbox": {"l": 328.78101, "t": 219.32227, "r": 479.26413, "b": 227.33826, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "Pattern Recogni-", "bbox": {"l": 483.11902, "t": 219.40295000000003, "r": 545.11273, "b": 227.13202, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "tion. ICPR International Workshops and Challenges", "bbox": {"l": 328.78101, "t": 230.36095999999998, "r": 519.39771, "b": 238.09002999999996, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": ", pages", "bbox": {"l": 519.401, "t": 230.28026999999997, "r": 545.10767, "b": 238.29625999999996, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "644-658, Cham, 2021. Springer International Publishing. 2,", "bbox": {"l": 328.78101, "t": 241.23925999999994, "r": 545.11328, "b": 249.25525000000005, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "3", "bbox": {"l": 328.78101, "t": 252.19824000000006, "r": 333.26422, "b": 260.21423000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[18] Yiren Li, Zheng Huang, Junchi Yan, Yi Zhou, Fan Ye, and Xianhui Liu. Gfte: Graph-based financial table extraction. In Alberto Del Bimbo, Rita Cucchiara, Stan Sclaroff, Giovanni Maria Farinella, Tao Mei, Marco Bertini, Hugo Jair Escalante, and Roberto Vezzani, editors, Pattern Recognition. ICPR International Workshops and Challenges , pages 644-658, Cham, 2021. Springer International Publishing. 2, 3"}, {"label": "list_item", "id": 8, "page_no": 8, "cluster": {"id": 8, "label": "list_item", "bbox": {"l": 308.862, "t": 263.64423, "r": 545.1142, "b": 326.45413, "coord_origin": "TOPLEFT"}, "confidence": 0.9373219609260559, "cells": [{"id": 131, "text": "[19]", "bbox": {"l": 308.862, "t": 263.64423, "r": 324.26477, "b": 271.66022, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "Nikolaos Livathinos, Cesar Berrospi, Maksym Lysak, Vik-", "bbox": {"l": 326.57611, "t": 263.64423, "r": 545.10883, "b": 271.66022, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "tor Kuropiatnyk, Ahmed Nassar, Andre Carvalho, Michele", "bbox": {"l": 328.78101, "t": 274.60321, "r": 545.1134, "b": 282.61917000000005, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "Dolfi, Christoph Auer, Kasper Dinkla, and Peter Staar. Ro-", "bbox": {"l": 328.78101, "t": 285.56219, "r": 545.11328, "b": 293.57816, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "bust pdf document conversion using recurrent neural net-", "bbox": {"l": 328.78101, "t": 296.52118, "r": 545.11334, "b": 304.53714, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "works.", "bbox": {"l": 328.78101, "t": 307.47919, "r": 352.84683, "b": 315.49515, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "Proceedings of the AAAI Conference on Artificial", "bbox": {"l": 360.23599, "t": 307.55988, "r": 545.1142, "b": 315.28894, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "Intelligence", "bbox": {"l": 328.78101, "t": 318.51886, "r": 371.02173, "b": 326.24792, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": ", 35(17):15137-15145, May 2021. 1", "bbox": {"l": 371.021, "t": 318.43817, "r": 502.26227, "b": 326.45413, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[19] Nikolaos Livathinos, Cesar Berrospi, Maksym Lysak, Viktor Kuropiatnyk, Ahmed Nassar, Andre Carvalho, Michele Dolfi, Christoph Auer, Kasper Dinkla, and Peter Staar. Robust pdf document conversion using recurrent neural networks. Proceedings of the AAAI Conference on Artificial Intelligence , 35(17):15137-15145, May 2021. 1"}, {"label": "list_item", "id": 18, "page_no": 8, "cluster": {"id": 18, "label": "list_item", "bbox": {"l": 308.862, "t": 329.88419, "r": 545.11609, "b": 370.77713, "coord_origin": "TOPLEFT"}, "confidence": 0.902729332447052, "cells": [{"id": 140, "text": "[20]", "bbox": {"l": 308.862, "t": 329.88419, "r": 323.82672, "b": 337.90015, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "Rujiao Long, Wen Wang, Nan Xue, Feiyu Gao, Zhibo Yang,", "bbox": {"l": 326.07233, "t": 329.88419, "r": 545.10876, "b": 337.90015, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "Yongpan Wang, and Gui-Song Xia. Parsing table structures", "bbox": {"l": 328.78101, "t": 340.8432, "r": 545.11346, "b": 348.85916, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "in the wild. In", "bbox": {"l": 328.78101, "t": 351.80219000000005, "r": 382.7767, "b": 359.81815000000006, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "Proceedings of the IEEE/CVF International", "bbox": {"l": 385.54102, "t": 351.88287, "r": 545.11609, "b": 359.61194, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "Conference on Computer Vision", "bbox": {"l": 328.78101, "t": 362.84186, "r": 443.59579, "b": 370.57092, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": ", pages 944-952, 2021. 2", "bbox": {"l": 443.59399, "t": 362.76117, "r": 534.48645, "b": 370.77713, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[20] Rujiao Long, Wen Wang, Nan Xue, Feiyu Gao, Zhibo Yang, Yongpan Wang, and Gui-Song Xia. Parsing table structures in the wild. In Proceedings of the IEEE/CVF International Conference on Computer Vision , pages 944-952, 2021. 2"}, {"label": "list_item", "id": 21, "page_no": 8, "cluster": {"id": 21, "label": "list_item", "bbox": {"l": 308.862, "t": 374.20618, "r": 545.11346, "b": 437.01706, "coord_origin": "TOPLEFT"}, "confidence": 0.882714569568634, "cells": [{"id": 147, "text": "[21]", "bbox": {"l": 308.862, "t": 374.20618, "r": 324.60281, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "Shubham", "bbox": {"l": 326.96487, "t": 374.20618, "r": 362.6604, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "Singh", "bbox": {"l": 368.69479, "t": 374.20618, "r": 389.6134, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "Paliwal,", "bbox": {"l": 395.6478, "t": 374.20618, "r": 424.56445, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "D", "bbox": {"l": 431.5492899999999, "t": 374.20618, "r": 438.0230399999999, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "Vishwanath,", "bbox": {"l": 444.05743, "t": 374.20618, "r": 488.5038799999999, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "Rohit", "bbox": {"l": 495.47974, "t": 374.20618, "r": 515.41205, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "Rahul,", "bbox": {"l": 521.44641, "t": 374.20618, "r": 545.10876, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "Monika Sharma, and Lovekesh Vig. Tablenet: Deep learn-", "bbox": {"l": 328.78101, "t": 385.16516, "r": 545.1134, "b": 393.18112, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "ing model for end-to-end table detection and tabular data ex-", "bbox": {"l": 328.78101, "t": 396.12415, "r": 545.11346, "b": 404.14011, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "traction from scanned document images.", "bbox": {"l": 328.78101, "t": 407.08313, "r": 478.00881999999996, "b": 415.09909, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "In", "bbox": {"l": 484.0701, "t": 407.08313, "r": 491.53912, "b": 415.09909, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "2019 Interna-", "bbox": {"l": 494.668, "t": 407.16382, "r": 545.11298, "b": 414.89288, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "tional Conference on Document Analysis and Recognition", "bbox": {"l": 328.78101, "t": 418.12280000000004, "r": 545.11334, "b": 425.85187, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "(ICDAR)", "bbox": {"l": 328.78101, "t": 429.08179, "r": 360.83591, "b": 436.8108500000001, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": ", pages 128-133. IEEE, 2019. 1", "bbox": {"l": 360.836, "t": 429.0011, "r": 475.63287, "b": 437.01706, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[21] Shubham Singh Paliwal, D Vishwanath, Rohit Rahul, Monika Sharma, and Lovekesh Vig. Tablenet: Deep learning model for end-to-end table detection and tabular data extraction from scanned document images. In 2019 International Conference on Document Analysis and Recognition (ICDAR) , pages 128-133. IEEE, 2019. 1"}, {"label": "list_item", "id": 20, "page_no": 8, "cluster": {"id": 20, "label": "list_item", "bbox": {"l": 308.862, "t": 440.44611, "r": 545.11475, "b": 558.05096, "coord_origin": "TOPLEFT"}, "confidence": 0.8896440863609314, "cells": [{"id": 163, "text": "[22]", "bbox": {"l": 308.862, "t": 440.44611, "r": 324.57407, "b": 448.46207, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "Adam Paszke, Sam Gross, Francisco Massa, Adam Lerer,", "bbox": {"l": 326.93179, "t": 440.44611, "r": 545.1087, "b": 448.46207, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "James Bradbury, Gregory Chanan, Trevor Killeen, Zeming", "bbox": {"l": 328.78101, "t": 451.40509, "r": 545.11346, "b": 459.42105, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "Lin, Natalia Gimelshein, Luca Antiga, Alban Desmaison,", "bbox": {"l": 328.78101, "t": 462.36407, "r": 545.11328, "b": 470.38004, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "Andreas Kopf, Edward Yang, Zachary DeVito, Martin Rai-", "bbox": {"l": 328.78101, "t": 473.32306, "r": 545.11328, "b": 481.33902, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "son, Alykhan Tejani, Sasank Chilamkurthy, Benoit Steiner,", "bbox": {"l": 328.78101, "t": 484.28204, "r": 545.11328, "b": 492.298, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "Lu Fang, Junjie Bai, and Soumith Chintala. Pytorch: An im-", "bbox": {"l": 328.78101, "t": 495.24103, "r": 545.1134, "b": 503.25699, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "perative style, high-performance deep learning library. In H.", "bbox": {"l": 328.78101, "t": 506.20001, "r": 545.1134, "b": 514.21597, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "Wallach, H. Larochelle, A. Beygelzimer, F. d'Alch\u00b4e-Buc, E.", "bbox": {"l": 328.78101, "t": 517.159, "r": 545.1098, "b": 525.17496, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "Fox, and R. Garnett, editors,", "bbox": {"l": 328.78101, "t": 528.117, "r": 434.56659, "b": 536.13297, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "Advances in Neural Informa-", "bbox": {"l": 437.86401, "t": 528.19769, "r": 545.11115, "b": 535.9267600000001, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "tion Processing Systems 32", "bbox": {"l": 328.78101, "t": 539.15671, "r": 425.73471, "b": 546.8857399999999, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": ", pages 8024-8035. Curran Asso-", "bbox": {"l": 425.73602, "t": 539.076, "r": 545.11475, "b": 547.09196, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "ciates, Inc., 2019. 6", "bbox": {"l": 328.78101, "t": 550.035, "r": 399.74109, "b": 558.05096, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[22] Adam Paszke, Sam Gross, Francisco Massa, Adam Lerer, James Bradbury, Gregory Chanan, Trevor Killeen, Zeming Lin, Natalia Gimelshein, Luca Antiga, Alban Desmaison, Andreas Kopf, Edward Yang, Zachary DeVito, Martin Raison, Alykhan Tejani, Sasank Chilamkurthy, Benoit Steiner, Lu Fang, Junjie Bai, and Soumith Chintala. Pytorch: An imperative style, high-performance deep learning library. In H. Wallach, H. Larochelle, A. Beygelzimer, F. d'Alch\u00b4e-Buc, E. Fox, and R. Garnett, editors, Advances in Neural Information Processing Systems 32 , pages 8024-8035. Curran Associates, Inc., 2019. 6"}, {"label": "list_item", "id": 19, "page_no": 8, "cluster": {"id": 19, "label": "list_item", "bbox": {"l": 308.862, "t": 561.481, "r": 545.1134, "b": 624.29097, "coord_origin": "TOPLEFT"}, "confidence": 0.9025441408157349, "cells": [{"id": 177, "text": "[23]", "bbox": {"l": 308.862, "t": 561.481, "r": 324.50351, "b": 569.49696, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "Devashish Prasad, Ayan Gadpal, Kshitij Kapadni, Manish", "bbox": {"l": 326.85068, "t": 561.481, "r": 545.10876, "b": 569.49696, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "Visave, and Kavita Sultanpure. Cascadetabnet: An approach", "bbox": {"l": 328.78101, "t": 572.44, "r": 545.1134, "b": 580.45596, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "for end to end table detection and structure recognition from", "bbox": {"l": 328.78101, "t": 583.399, "r": 545.11334, "b": 591.4149600000001, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "image-based documents. In", "bbox": {"l": 328.78101, "t": 594.358, "r": 431.61667, "b": 602.37396, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "Proceedings of the IEEE/CVF", "bbox": {"l": 434.69101000000006, "t": 594.4387099999999, "r": 545.11224, "b": 602.16774, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "Conference on Computer Vision and Pattern Recognition", "bbox": {"l": 328.78101, "t": 605.39671, "r": 545.1134, "b": 613.12575, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "Workshops", "bbox": {"l": 328.78101, "t": 616.35571, "r": 367.8028, "b": 624.08475, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": ", pages 572-573, 2020. 1", "bbox": {"l": 367.802, "t": 616.2750100000001, "r": 458.69446000000005, "b": 624.29097, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[23] Devashish Prasad, Ayan Gadpal, Kshitij Kapadni, Manish Visave, and Kavita Sultanpure. Cascadetabnet: An approach for end to end table detection and structure recognition from image-based documents. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition Workshops , pages 572-573, 2020. 1"}, {"label": "list_item", "id": 23, "page_no": 8, "cluster": {"id": 23, "label": "list_item", "bbox": {"l": 308.862, "t": 627.72101, "r": 545.11621, "b": 668.61398, "coord_origin": "TOPLEFT"}, "confidence": 0.8777539134025574, "cells": [{"id": 186, "text": "[24]", "bbox": {"l": 308.862, "t": 627.72101, "r": 324.69476, "b": 635.73697, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "Shah Rukh Qasim, Hassan Mahmood, and Faisal Shafait.", "bbox": {"l": 327.07065, "t": 627.72101, "r": 545.1087, "b": 635.73697, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": "Rethinking table recognition using graph neural networks.", "bbox": {"l": 328.78101, "t": 638.68001, "r": 545.11328, "b": 646.69597, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "In", "bbox": {"l": 328.78101, "t": 649.63901, "r": 336.25003, "b": 657.65497, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "2019 International Conference on Document Analysis and", "bbox": {"l": 338.10001, "t": 649.71971, "r": 545.11621, "b": 657.44875, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "Recognition (ICDAR)", "bbox": {"l": 328.78101, "t": 660.67871, "r": 406.32245, "b": 668.40775, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": ", pages 142-147. IEEE, 2019. 3", "bbox": {"l": 406.32202, "t": 660.5980099999999, "r": 521.1189, "b": 668.61398, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[24] Shah Rukh Qasim, Hassan Mahmood, and Faisal Shafait. Rethinking table recognition using graph neural networks. In 2019 International Conference on Document Analysis and Recognition (ICDAR) , pages 142-147. IEEE, 2019. 3"}, {"label": "list_item", "id": 24, "page_no": 8, "cluster": {"id": 24, "label": "list_item", "bbox": {"l": 308.86203, "t": 672.04301, "r": 545.1134, "b": 712.935974, "coord_origin": "TOPLEFT"}, "confidence": 0.8654531240463257, "cells": [{"id": 193, "text": "[25]", "bbox": {"l": 308.86203, "t": 672.04301, "r": 324.71329, "b": 680.05898, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "Hamid Rezatofighi, Nathan Tsoi, JunYoung Gwak, Amir", "bbox": {"l": 327.09195, "t": 672.04301, "r": 545.10876, "b": 680.05898, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "Sadeghian, Ian Reid, and Silvio Savarese.", "bbox": {"l": 328.78104, "t": 683.0020099999999, "r": 482.81488, "b": 691.01797, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "Generalized in-", "bbox": {"l": 488.75064, "t": 683.0020099999999, "r": 545.1134, "b": 691.01797, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "tersection over union: A metric and a loss for bounding box", "bbox": {"l": 328.78104, "t": 693.961014, "r": 545.11334, "b": 701.976974, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "regression. In", "bbox": {"l": 328.78104, "t": 704.920013, "r": 379.1543, "b": 712.935974, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "Proceedings of the IEEE/CVF Conference on", "bbox": {"l": 381.61603, "t": 705.00071, "r": 545.10938, "b": 712.729744, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[25] Hamid Rezatofighi, Nathan Tsoi, JunYoung Gwak, Amir Sadeghian, Ian Reid, and Silvio Savarese. Generalized intersection over union: A metric and a loss for bounding box regression. In Proceedings of the IEEE/CVF Conference on"}], "headers": [{"label": "page_footer", "id": 22, "page_no": 8, "cluster": {"id": 22, "label": "page_footer", "bbox": {"l": 295.12103, "t": 734.1325870000001, "r": 300.10233, "b": 743.0391500000001, "coord_origin": "TOPLEFT"}, "confidence": 0.8797810077667236, "cells": [{"id": 200, "text": "9", "bbox": {"l": 295.12103, "t": 734.1325870000001, "r": 300.10233, "b": 743.0391500000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "9"}]}}, {"page_no": 9, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "Computer Vision and Pattern Recognition", "bbox": {"l": 70.030998, "t": 75.96447999999998, "r": 223.58061, "b": 83.69353999999998, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": ", pages 658-666,", "bbox": {"l": 223.57901, "t": 75.88378999999998, "r": 286.36176, "b": 83.89977999999996, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "2019. 6", "bbox": {"l": 70.031006, "t": 86.84276999999997, "r": 97.916512, "b": 94.85875999999996, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "[26]", "bbox": {"l": 50.112007, "t": 98.16576999999995, "r": 65.534088, "b": 106.18176000000005, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Sebastian Schreiber, Stefan Agne, Ivo Wolf, Andreas Den-", "bbox": {"l": 67.84832, "t": 98.16576999999995, "r": 286.35867, "b": 106.18176000000005, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "gel, and Sheraz Ahmed. Deepdesrt: Deep learning for detec-", "bbox": {"l": 70.031006, "t": 109.12476000000004, "r": 286.36331, "b": 117.14075000000003, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "tion and structure recognition of tables in document images.", "bbox": {"l": 70.031006, "t": 120.08374000000003, "r": 286.36334, "b": 128.0997299999999, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "In", "bbox": {"l": 70.031006, "t": 131.04272000000003, "r": 77.500015, "b": 139.05872, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "2017 14th IAPR International Conference on Document", "bbox": {"l": 80.560005, "t": 131.12341000000004, "r": 286.36578, "b": 138.85248, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Analysis and Recognition (ICDAR)", "bbox": {"l": 70.031006, "t": 142.0824, "r": 195.22885, "b": 149.81146, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": ", volume 01, pages 1162-", "bbox": {"l": 195.231, "t": 142.00171, "r": 286.36548, "b": 150.0177, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "1167, 2017. 1", "bbox": {"l": 70.031006, "t": 152.96069, "r": 120.33251, "b": 160.97668, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "[27]", "bbox": {"l": 50.112007, "t": 164.28467, "r": 65.534088, "b": 172.30066, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Sebastian Schreiber, Stefan Agne, Ivo Wolf, Andreas Den-", "bbox": {"l": 67.84832, "t": 164.28467, "r": 286.35867, "b": 172.30066, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "gel, and Sheraz Ahmed. Deepdesrt: Deep learning for de-", "bbox": {"l": 70.031006, "t": 175.24365, "r": 286.36337, "b": 183.25964, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "tection and structure recognition of tables in document im-", "bbox": {"l": 70.031006, "t": 186.20263999999997, "r": 286.36334, "b": 194.21862999999996, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "ages. In", "bbox": {"l": 70.031006, "t": 197.16161999999997, "r": 101.33271, "b": 205.17760999999996, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "2017 14th IAPR international conference on doc-", "bbox": {"l": 104.33101, "t": 197.24230999999997, "r": 286.35791, "b": 204.97136999999998, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "ument analysis and recognition (ICDAR)", "bbox": {"l": 70.031006, "t": 208.20032000000003, "r": 220.48719999999997, "b": 215.92938000000004, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": ", volume 1, pages", "bbox": {"l": 220.48401000000004, "t": 208.11963000000003, "r": 286.36017, "b": 216.13562000000002, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "1162-1167. IEEE, 2017. 3", "bbox": {"l": 70.031006, "t": 219.07861000000003, "r": 166.65294, "b": 227.0946, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "[28]", "bbox": {"l": 50.112007, "t": 230.40259000000003, "r": 65.650383, "b": 238.41858000000002, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "Faisal Shafait and Ray Smith. Table detection in heteroge-", "bbox": {"l": 67.982063, "t": 230.40259000000003, "r": 286.3587, "b": 238.41858000000002, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "neous documents. In", "bbox": {"l": 70.031006, "t": 241.36157000000003, "r": 147.16895, "b": 249.37756000000002, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "Proceedings of the 9th IAPR Interna-", "bbox": {"l": 149.93301, "t": 241.44226000000003, "r": 286.36578, "b": 249.17133, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "tional Workshop on Document Analysis Systems", "bbox": {"l": 70.031013, "t": 252.40125, "r": 244.6875, "b": 260.13031, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": ", pages 65-", "bbox": {"l": 244.69101, "t": 252.32056, "r": 286.35791, "b": 260.33655, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "72, 2010. 2", "bbox": {"l": 70.031006, "t": 263.27954, "r": 111.36611, "b": 271.29553, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "[29]", "bbox": {"l": 50.112007, "t": 274.60357999999997, "r": 66.023834, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Shoaib", "bbox": {"l": 68.411568, "t": 274.60357999999997, "r": 94.944016, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Ahmed", "bbox": {"l": 100.8708, "t": 274.60357999999997, "r": 127.26788000000002, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Siddiqui,", "bbox": {"l": 133.19467, "t": 274.60357999999997, "r": 165.83237, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Imran", "bbox": {"l": 172.68269, "t": 274.60357999999997, "r": 194.09445, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "Ali", "bbox": {"l": 200.02124, "t": 274.60357999999997, "r": 211.4803, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Fateh,", "bbox": {"l": 217.40708999999998, "t": 274.60357999999997, "r": 239.43755, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "Syed", "bbox": {"l": 246.28787000000003, "t": 274.60357999999997, "r": 264.22067, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Tah-", "bbox": {"l": 270.14746, "t": 274.60357999999997, "r": 286.35873, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "seen Raza Rizvi, Andreas Dengel, and Sheraz Ahmed.", "bbox": {"l": 70.031006, "t": 285.56256, "r": 286.36331, "b": 293.57852, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "Deeptabstr: Deep learning based table structure recognition.", "bbox": {"l": 70.031006, "t": 296.52155, "r": 286.36331, "b": 304.53751, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "In", "bbox": {"l": 70.031006, "t": 307.48053, "r": 77.500015, "b": 315.49649, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "2019 International Conference on Document Analysis and", "bbox": {"l": 79.350006, "t": 307.56122, "r": 286.36627, "b": 315.29028, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Recognition (ICDAR)", "bbox": {"l": 70.031006, "t": 318.51923, "r": 147.57243, "b": 326.24829, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": ", pages 1403-1409. IEEE, 2019. 3", "bbox": {"l": 147.57201, "t": 318.43854, "r": 271.33521, "b": 326.4545, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "[30]", "bbox": {"l": 50.112007, "t": 329.76254, "r": 65.366135, "b": 337.7785, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "Peter W J Staar, Michele Dolfi, Christoph Auer, and Costas", "bbox": {"l": 67.655159, "t": 329.76254, "r": 286.3587, "b": 337.7785, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Bekas. Corpus conversion service: A machine learning plat-", "bbox": {"l": 70.031006, "t": 340.72156000000007, "r": 286.36334, "b": 348.7375200000001, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "form to ingest documents at scale.", "bbox": {"l": 70.031006, "t": 351.68054, "r": 198.82439, "b": 359.6965, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "In", "bbox": {"l": 206.06027, "t": 351.68054, "r": 213.52928, "b": 359.6965, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Proceedings of the", "bbox": {"l": 217.02101, "t": 351.76123, "r": 286.35815, "b": 359.4903, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "24th ACM SIGKDD", "bbox": {"l": 70.031006, "t": 362.72021, "r": 143.08028, "b": 370.44928, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": ", KDD \u201918, pages 774-782, New York,", "bbox": {"l": 143.078, "t": 362.63953000000004, "r": 286.36111, "b": 370.65549000000004, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "NY, USA, 2018. ACM. 1", "bbox": {"l": 70.031006, "t": 373.59851, "r": 161.15652, "b": 381.61447, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "[31]", "bbox": {"l": 50.112007, "t": 384.92252, "r": 65.140724, "b": 392.93848, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Ashish Vaswani, Noam Shazeer, Niki Parmar, Jakob Uszko-", "bbox": {"l": 67.395927, "t": 384.92252, "r": 286.35876, "b": 392.93848, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "reit, Llion Jones, Aidan N Gomez, \u0141 ukasz Kaiser, and Il-", "bbox": {"l": 70.031006, "t": 395.88153, "r": 286.36337, "b": 403.89749, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "lia Polosukhin.", "bbox": {"l": 70.031006, "t": 406.84052, "r": 125.47024999999998, "b": 414.85648, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Attention is all you need.", "bbox": {"l": 133.90764, "t": 406.84052, "r": 230.83444, "b": 414.85648, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "In I. Guyon,", "bbox": {"l": 239.27182, "t": 406.84052, "r": 286.36334, "b": 414.85648, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "U.", "bbox": {"l": 70.031006, "t": 417.7995, "r": 78.958366, "b": 425.81546, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "V. Luxburg, S. Bengio, H. Wallach, R. Fergus, S. Vish-", "bbox": {"l": 81.254494, "t": 417.7995, "r": 286.36334, "b": 425.81546, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "wanathan, and R. Garnett, editors,", "bbox": {"l": 70.031006, "t": 428.75751, "r": 196.7621, "b": 436.7734699999999, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "Advances in Neural In-", "bbox": {"l": 200.20201, "t": 428.8381999999999, "r": 286.36017, "b": 436.56726, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "formation Processing Systems 30", "bbox": {"l": 70.031006, "t": 439.79717999999997, "r": 189.19447, "b": 447.52624999999995, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": ", pages 5998-6008. Curran", "bbox": {"l": 189.19501, "t": 439.71648999999996, "r": 286.36389, "b": 447.73245, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "Associates, Inc., 2017. 5", "bbox": {"l": 70.031006, "t": 450.67548, "r": 158.9239, "b": 458.69144, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "[32]", "bbox": {"l": 50.112007, "t": 461.99948, "r": 65.910469, "b": 470.01544, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "Oriol Vinyals, Alexander Toshev, Samy Bengio, and Du-", "bbox": {"l": 68.281181, "t": 461.99948, "r": 286.35873, "b": 470.01544, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "mitru Erhan.", "bbox": {"l": 70.031006, "t": 472.9585, "r": 116.27969999999999, "b": 480.97446, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "Show and tell: A neural image caption gen-", "bbox": {"l": 122.48445, "t": 472.9585, "r": 286.36334, "b": 480.97446, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "erator. In", "bbox": {"l": 70.031006, "t": 483.91748, "r": 103.30532, "b": 491.93344, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "Proceedings of the IEEE Conference on Computer", "bbox": {"l": 105.51601, "t": 483.99817, "r": 286.35931, "b": 491.72723, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Vision and Pattern Recognition (CVPR)", "bbox": {"l": 70.031006, "t": 494.95715, "r": 212.51607, "b": 502.68622, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": ", June 2015. 2", "bbox": {"l": 212.51401, "t": 494.87646, "r": 263.55975, "b": 502.89243, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "[33]", "bbox": {"l": 50.112015, "t": 506.20047, "r": 65.682777, "b": 514.21643, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "Wenyuan Xue, Qingyong Li, and Dacheng Tao.", "bbox": {"l": 68.019325, "t": 506.20047, "r": 247.37280000000004, "b": 514.21643, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "Res2tim:", "bbox": {"l": 253.97208000000003, "t": 506.20047, "r": 286.3587, "b": 514.21643, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "reconstruct syntactic structures from table images. In", "bbox": {"l": 70.031013, "t": 517.15948, "r": 265.62408, "b": 525.17545, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "2019", "bbox": {"l": 268.42902, "t": 517.24017, "r": 286.36182, "b": 524.96924, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "International Conference on Document Analysis and Recog-", "bbox": {"l": 70.031021, "t": 528.19916, "r": 286.36337, "b": 535.92822, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "nition (ICDAR)", "bbox": {"l": 70.031021, "t": 539.15718, "r": 125.25507999999999, "b": 546.88622, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": ", pages 749-755. IEEE, 2019. 3", "bbox": {"l": 125.25402, "t": 539.07648, "r": 240.05083, "b": 547.09244, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "[34]", "bbox": {"l": 50.112022, "t": 550.40048, "r": 66.037048, "b": 558.41644, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "Wenyuan Xue, Baosheng Yu, Wen Wang, Dacheng Tao,", "bbox": {"l": 68.426765, "t": 550.40048, "r": 286.3587, "b": 558.41644, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "and Qingyong Li.", "bbox": {"l": 70.031021, "t": 561.35948, "r": 137.08176, "b": 569.37544, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "Tgrnet:", "bbox": {"l": 145.9854, "t": 561.35948, "r": 172.38248, "b": 569.37544, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "A table graph reconstruction", "bbox": {"l": 178.7038, "t": 561.35948, "r": 286.36337, "b": 569.37544, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "network for table structure recognition.", "bbox": {"l": 70.031021, "t": 572.31848, "r": 221.00723, "b": 580.33444, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "arXiv preprint", "bbox": {"l": 232.54300999999998, "t": 572.39919, "r": 286.35938, "b": 580.12822, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "arXiv:2106.10598", "bbox": {"l": 70.031021, "t": 583.35818, "r": 135.53058, "b": 591.08722, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": ", 2021. 3", "bbox": {"l": 135.53003, "t": 583.27748, "r": 167.89876, "b": 591.29344, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "[35]", "bbox": {"l": 50.11203, "t": 594.60149, "r": 65.23661, "b": 602.61745, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "Quanzeng You, Hailin Jin, Zhaowen Wang, Chen Fang, and", "bbox": {"l": 67.506203, "t": 594.60149, "r": 286.3587, "b": 602.61745, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Jiebo Luo.", "bbox": {"l": 70.031029, "t": 605.56049, "r": 109.1066, "b": 613.57645, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "Image captioning with semantic attention.", "bbox": {"l": 116.22592, "t": 605.56049, "r": 271.76605, "b": 613.57645, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "In", "bbox": {"l": 278.89435, "t": 605.56049, "r": 286.36337, "b": 613.57645, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "Proceedings of the IEEE conference on computer vision and", "bbox": {"l": 70.031029, "t": 616.60019, "r": 286.3634, "b": 624.32922, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "pattern recognition", "bbox": {"l": 70.031029, "t": 627.55919, "r": 139.09921, "b": 635.28822, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": ", pages 4651-4659, 2016. 4", "bbox": {"l": 139.09802, "t": 627.47849, "r": 238.95683, "b": 635.49445, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "[36]", "bbox": {"l": 50.112022, "t": 638.80249, "r": 65.203552, "b": 646.81845, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "Xinyi Zheng, Doug Burdick, Lucian Popa, Peter Zhong, and", "bbox": {"l": 67.468193, "t": 638.80249, "r": 286.35873, "b": 646.81845, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "Nancy Xin Ru Wang. Global table extractor (gte): A frame-", "bbox": {"l": 70.031021, "t": 649.7605, "r": 286.36337, "b": 657.77646, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "work for joint table identification and cell structure recogni-", "bbox": {"l": 70.031021, "t": 660.7195, "r": 286.36334, "b": 668.73547, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "tion using visual context.", "bbox": {"l": 70.031021, "t": 671.6785, "r": 158.45766, "b": 679.69447, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "Winter Conference for Applications", "bbox": {"l": 160.52802, "t": 671.7592, "r": 286.36249, "b": 679.48824, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "in Computer Vision (WACV)", "bbox": {"l": 70.031013, "t": 682.7182, "r": 171.42305, "b": 690.44724, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": ", 2021. 2, 3", "bbox": {"l": 171.42201, "t": 682.6375, "r": 212.75713, "b": 690.65347, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "[37]", "bbox": {"l": 50.112015, "t": 693.961502, "r": 66.506706, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "Xu", "bbox": {"l": 68.966896, "t": 693.961502, "r": 80.992294, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "Zhong,", "bbox": {"l": 89.062057, "t": 693.961502, "r": 114.71492999999998, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "Elaheh", "bbox": {"l": 124.24621000000002, "t": 693.961502, "r": 149.1459, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "ShafieiBavani,", "bbox": {"l": 157.22462, "t": 693.961502, "r": 209.37321, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "and", "bbox": {"l": 218.9045, "t": 693.961502, "r": 231.85196999999997, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "Antonio", "bbox": {"l": 239.93069, "t": 693.961502, "r": 269.32254, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "Ji-", "bbox": {"l": 277.3923, "t": 693.961502, "r": 286.3587, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "meno Yepes. Image-based table recognition: Data, model,", "bbox": {"l": 70.031013, "t": 704.920502, "r": 286.36334, "b": 712.936462, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "and evaluation. In Andrea Vedaldi, Horst Bischof, Thomas", "bbox": {"l": 328.78101, "t": 75.88347999999996, "r": 545.11346, "b": 83.89948000000015, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "Brox, and Jan-Michael Frahm, editors,", "bbox": {"l": 328.78101, "t": 86.84149000000002, "r": 472.30618, "b": 94.85748000000001, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "Computer Vision -", "bbox": {"l": 475.88501, "t": 86.92218000000003, "r": 545.11456, "b": 94.65125, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "ECCV 2020", "bbox": {"l": 328.78101, "t": 97.88116000000002, "r": 371.92734, "b": 105.61023, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": ", pages 564-580, Cham, 2020. Springer Interna-", "bbox": {"l": 371.92599, "t": 97.80048, "r": 545.11206, "b": 105.81646999999987, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "tional Publishing. 2, 3, 7", "bbox": {"l": 328.78101, "t": 108.75945999999999, "r": 417.70087, "b": 116.77544999999998, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "[38]", "bbox": {"l": 308.862, "t": 120.71447999999998, "r": 324.33197, "b": 128.73046999999997, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Xu Zhong, Jianbin Tang, and Antonio Jimeno Yepes. Pub-", "bbox": {"l": 326.65341, "t": 120.71447999999998, "r": 545.10876, "b": 128.73046999999997, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "laynet: Largest dataset ever for document layout analysis. In", "bbox": {"l": 328.78101, "t": 131.67345999999998, "r": 545.11334, "b": 139.68944999999997, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "2019 International Conference on Document Analysis and", "bbox": {"l": 328.78101, "t": 142.71312999999998, "r": 545.11328, "b": 150.44219999999996, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "Recognition (ICDAR)", "bbox": {"l": 328.78101, "t": 153.67211999999995, "r": 406.32245, "b": 161.40117999999995, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": ", pages 1015-1022, 2019. 1", "bbox": {"l": 406.32202, "t": 153.59142999999995, "r": 506.18085, "b": 161.60742000000005, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "10", "bbox": {"l": 292.63, "t": 734.1329920000001, "r": 302.59259, "b": 743.039555, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 15, "label": "text", "bbox": {"l": 70.030998, "t": 75.88378999999998, "r": 286.36176, "b": 94.85875999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.6886768937110901, "cells": [{"id": 0, "text": "Computer Vision and Pattern Recognition", "bbox": {"l": 70.030998, "t": 75.96447999999998, "r": 223.58061, "b": 83.69353999999998, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": ", pages 658-666,", "bbox": {"l": 223.57901, "t": 75.88378999999998, "r": 286.36176, "b": 83.89977999999996, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "2019. 6", "bbox": {"l": 70.031006, "t": 86.84276999999997, "r": 97.916512, "b": 94.85875999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "list_item", "bbox": {"l": 50.112007, "t": 98.16576999999995, "r": 286.36578, "b": 160.97668, "coord_origin": "TOPLEFT"}, "confidence": 0.7723013758659363, "cells": [{"id": 3, "text": "[26]", "bbox": {"l": 50.112007, "t": 98.16576999999995, "r": 65.534088, "b": 106.18176000000005, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Sebastian Schreiber, Stefan Agne, Ivo Wolf, Andreas Den-", "bbox": {"l": 67.84832, "t": 98.16576999999995, "r": 286.35867, "b": 106.18176000000005, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "gel, and Sheraz Ahmed. Deepdesrt: Deep learning for detec-", "bbox": {"l": 70.031006, "t": 109.12476000000004, "r": 286.36331, "b": 117.14075000000003, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "tion and structure recognition of tables in document images.", "bbox": {"l": 70.031006, "t": 120.08374000000003, "r": 286.36334, "b": 128.0997299999999, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "In", "bbox": {"l": 70.031006, "t": 131.04272000000003, "r": 77.500015, "b": 139.05872, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "2017 14th IAPR International Conference on Document", "bbox": {"l": 80.560005, "t": 131.12341000000004, "r": 286.36578, "b": 138.85248, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Analysis and Recognition (ICDAR)", "bbox": {"l": 70.031006, "t": 142.0824, "r": 195.22885, "b": 149.81146, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": ", volume 01, pages 1162-", "bbox": {"l": 195.231, "t": 142.00171, "r": 286.36548, "b": 150.0177, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "1167, 2017. 1", "bbox": {"l": 70.031006, "t": 152.96069, "r": 120.33251, "b": 160.97668, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "list_item", "bbox": {"l": 50.112007, "t": 164.28467, "r": 286.36337, "b": 227.0946, "coord_origin": "TOPLEFT"}, "confidence": 0.8580600619316101, "cells": [{"id": 12, "text": "[27]", "bbox": {"l": 50.112007, "t": 164.28467, "r": 65.534088, "b": 172.30066, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Sebastian Schreiber, Stefan Agne, Ivo Wolf, Andreas Den-", "bbox": {"l": 67.84832, "t": 164.28467, "r": 286.35867, "b": 172.30066, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "gel, and Sheraz Ahmed. Deepdesrt: Deep learning for de-", "bbox": {"l": 70.031006, "t": 175.24365, "r": 286.36337, "b": 183.25964, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "tection and structure recognition of tables in document im-", "bbox": {"l": 70.031006, "t": 186.20263999999997, "r": 286.36334, "b": 194.21862999999996, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "ages. In", "bbox": {"l": 70.031006, "t": 197.16161999999997, "r": 101.33271, "b": 205.17760999999996, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "2017 14th IAPR international conference on doc-", "bbox": {"l": 104.33101, "t": 197.24230999999997, "r": 286.35791, "b": 204.97136999999998, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "ument analysis and recognition (ICDAR)", "bbox": {"l": 70.031006, "t": 208.20032000000003, "r": 220.48719999999997, "b": 215.92938000000004, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": ", volume 1, pages", "bbox": {"l": 220.48401000000004, "t": 208.11963000000003, "r": 286.36017, "b": 216.13562000000002, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "1162-1167. IEEE, 2017. 3", "bbox": {"l": 70.031006, "t": 219.07861000000003, "r": 166.65294, "b": 227.0946, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "list_item", "bbox": {"l": 50.112007, "t": 230.40259000000003, "r": 286.36578, "b": 271.29553, "coord_origin": "TOPLEFT"}, "confidence": 0.8512733578681946, "cells": [{"id": 21, "text": "[28]", "bbox": {"l": 50.112007, "t": 230.40259000000003, "r": 65.650383, "b": 238.41858000000002, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "Faisal Shafait and Ray Smith. Table detection in heteroge-", "bbox": {"l": 67.982063, "t": 230.40259000000003, "r": 286.3587, "b": 238.41858000000002, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "neous documents. In", "bbox": {"l": 70.031006, "t": 241.36157000000003, "r": 147.16895, "b": 249.37756000000002, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "Proceedings of the 9th IAPR Interna-", "bbox": {"l": 149.93301, "t": 241.44226000000003, "r": 286.36578, "b": 249.17133, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "tional Workshop on Document Analysis Systems", "bbox": {"l": 70.031013, "t": 252.40125, "r": 244.6875, "b": 260.13031, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": ", pages 65-", "bbox": {"l": 244.69101, "t": 252.32056, "r": 286.35791, "b": 260.33655, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "72, 2010. 2", "bbox": {"l": 70.031006, "t": 263.27954, "r": 111.36611, "b": 271.29553, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "list_item", "bbox": {"l": 50.112007, "t": 274.60357999999997, "r": 286.36627, "b": 326.4545, "coord_origin": "TOPLEFT"}, "confidence": 0.8494514226913452, "cells": [{"id": 28, "text": "[29]", "bbox": {"l": 50.112007, "t": 274.60357999999997, "r": 66.023834, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Shoaib", "bbox": {"l": 68.411568, "t": 274.60357999999997, "r": 94.944016, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Ahmed", "bbox": {"l": 100.8708, "t": 274.60357999999997, "r": 127.26788000000002, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Siddiqui,", "bbox": {"l": 133.19467, "t": 274.60357999999997, "r": 165.83237, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Imran", "bbox": {"l": 172.68269, "t": 274.60357999999997, "r": 194.09445, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "Ali", "bbox": {"l": 200.02124, "t": 274.60357999999997, "r": 211.4803, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Fateh,", "bbox": {"l": 217.40708999999998, "t": 274.60357999999997, "r": 239.43755, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "Syed", "bbox": {"l": 246.28787000000003, "t": 274.60357999999997, "r": 264.22067, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Tah-", "bbox": {"l": 270.14746, "t": 274.60357999999997, "r": 286.35873, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "seen Raza Rizvi, Andreas Dengel, and Sheraz Ahmed.", "bbox": {"l": 70.031006, "t": 285.56256, "r": 286.36331, "b": 293.57852, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "Deeptabstr: Deep learning based table structure recognition.", "bbox": {"l": 70.031006, "t": 296.52155, "r": 286.36331, "b": 304.53751, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "In", "bbox": {"l": 70.031006, "t": 307.48053, "r": 77.500015, "b": 315.49649, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "2019 International Conference on Document Analysis and", "bbox": {"l": 79.350006, "t": 307.56122, "r": 286.36627, "b": 315.29028, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Recognition (ICDAR)", "bbox": {"l": 70.031006, "t": 318.51923, "r": 147.57243, "b": 326.24829, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": ", pages 1403-1409. IEEE, 2019. 3", "bbox": {"l": 147.57201, "t": 318.43854, "r": 271.33521, "b": 326.4545, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "list_item", "bbox": {"l": 50.112007, "t": 329.76254, "r": 286.36334, "b": 381.61447, "coord_origin": "TOPLEFT"}, "confidence": 0.8567667007446289, "cells": [{"id": 43, "text": "[30]", "bbox": {"l": 50.112007, "t": 329.76254, "r": 65.366135, "b": 337.7785, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "Peter W J Staar, Michele Dolfi, Christoph Auer, and Costas", "bbox": {"l": 67.655159, "t": 329.76254, "r": 286.3587, "b": 337.7785, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Bekas. Corpus conversion service: A machine learning plat-", "bbox": {"l": 70.031006, "t": 340.72156000000007, "r": 286.36334, "b": 348.7375200000001, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "form to ingest documents at scale.", "bbox": {"l": 70.031006, "t": 351.68054, "r": 198.82439, "b": 359.6965, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "In", "bbox": {"l": 206.06027, "t": 351.68054, "r": 213.52928, "b": 359.6965, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Proceedings of the", "bbox": {"l": 217.02101, "t": 351.76123, "r": 286.35815, "b": 359.4903, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "24th ACM SIGKDD", "bbox": {"l": 70.031006, "t": 362.72021, "r": 143.08028, "b": 370.44928, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": ", KDD \u201918, pages 774-782, New York,", "bbox": {"l": 143.078, "t": 362.63953000000004, "r": 286.36111, "b": 370.65549000000004, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "NY, USA, 2018. ACM. 1", "bbox": {"l": 70.031006, "t": 373.59851, "r": 161.15652, "b": 381.61447, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "list_item", "bbox": {"l": 50.112007, "t": 384.92252, "r": 286.36389, "b": 458.69144, "coord_origin": "TOPLEFT"}, "confidence": 0.8832165598869324, "cells": [{"id": 52, "text": "[31]", "bbox": {"l": 50.112007, "t": 384.92252, "r": 65.140724, "b": 392.93848, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Ashish Vaswani, Noam Shazeer, Niki Parmar, Jakob Uszko-", "bbox": {"l": 67.395927, "t": 384.92252, "r": 286.35876, "b": 392.93848, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "reit, Llion Jones, Aidan N Gomez, \u0141 ukasz Kaiser, and Il-", "bbox": {"l": 70.031006, "t": 395.88153, "r": 286.36337, "b": 403.89749, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "lia Polosukhin.", "bbox": {"l": 70.031006, "t": 406.84052, "r": 125.47024999999998, "b": 414.85648, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Attention is all you need.", "bbox": {"l": 133.90764, "t": 406.84052, "r": 230.83444, "b": 414.85648, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "In I. Guyon,", "bbox": {"l": 239.27182, "t": 406.84052, "r": 286.36334, "b": 414.85648, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "U.", "bbox": {"l": 70.031006, "t": 417.7995, "r": 78.958366, "b": 425.81546, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "V. Luxburg, S. Bengio, H. Wallach, R. Fergus, S. Vish-", "bbox": {"l": 81.254494, "t": 417.7995, "r": 286.36334, "b": 425.81546, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "wanathan, and R. Garnett, editors,", "bbox": {"l": 70.031006, "t": 428.75751, "r": 196.7621, "b": 436.7734699999999, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "Advances in Neural In-", "bbox": {"l": 200.20201, "t": 428.8381999999999, "r": 286.36017, "b": 436.56726, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "formation Processing Systems 30", "bbox": {"l": 70.031006, "t": 439.79717999999997, "r": 189.19447, "b": 447.52624999999995, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": ", pages 5998-6008. Curran", "bbox": {"l": 189.19501, "t": 439.71648999999996, "r": 286.36389, "b": 447.73245, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "Associates, Inc., 2017. 5", "bbox": {"l": 70.031006, "t": 450.67548, "r": 158.9239, "b": 458.69144, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "list_item", "bbox": {"l": 50.112007, "t": 461.99948, "r": 286.36334, "b": 502.89243, "coord_origin": "TOPLEFT"}, "confidence": 0.843192458152771, "cells": [{"id": 65, "text": "[32]", "bbox": {"l": 50.112007, "t": 461.99948, "r": 65.910469, "b": 470.01544, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "Oriol Vinyals, Alexander Toshev, Samy Bengio, and Du-", "bbox": {"l": 68.281181, "t": 461.99948, "r": 286.35873, "b": 470.01544, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "mitru Erhan.", "bbox": {"l": 70.031006, "t": 472.9585, "r": 116.27969999999999, "b": 480.97446, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "Show and tell: A neural image caption gen-", "bbox": {"l": 122.48445, "t": 472.9585, "r": 286.36334, "b": 480.97446, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "erator. In", "bbox": {"l": 70.031006, "t": 483.91748, "r": 103.30532, "b": 491.93344, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "Proceedings of the IEEE Conference on Computer", "bbox": {"l": 105.51601, "t": 483.99817, "r": 286.35931, "b": 491.72723, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Vision and Pattern Recognition (CVPR)", "bbox": {"l": 70.031006, "t": 494.95715, "r": 212.51607, "b": 502.68622, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": ", June 2015. 2", "bbox": {"l": 212.51401, "t": 494.87646, "r": 263.55975, "b": 502.89243, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "list_item", "bbox": {"l": 50.112015, "t": 506.20047, "r": 286.36337, "b": 547.09244, "coord_origin": "TOPLEFT"}, "confidence": 0.8405641317367554, "cells": [{"id": 73, "text": "[33]", "bbox": {"l": 50.112015, "t": 506.20047, "r": 65.682777, "b": 514.21643, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "Wenyuan Xue, Qingyong Li, and Dacheng Tao.", "bbox": {"l": 68.019325, "t": 506.20047, "r": 247.37280000000004, "b": 514.21643, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "Res2tim:", "bbox": {"l": 253.97208000000003, "t": 506.20047, "r": 286.3587, "b": 514.21643, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "reconstruct syntactic structures from table images. In", "bbox": {"l": 70.031013, "t": 517.15948, "r": 265.62408, "b": 525.17545, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "2019", "bbox": {"l": 268.42902, "t": 517.24017, "r": 286.36182, "b": 524.96924, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "International Conference on Document Analysis and Recog-", "bbox": {"l": 70.031021, "t": 528.19916, "r": 286.36337, "b": 535.92822, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "nition (ICDAR)", "bbox": {"l": 70.031021, "t": 539.15718, "r": 125.25507999999999, "b": 546.88622, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": ", pages 749-755. IEEE, 2019. 3", "bbox": {"l": 125.25402, "t": 539.07648, "r": 240.05083, "b": 547.09244, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "list_item", "bbox": {"l": 50.112022, "t": 550.40048, "r": 286.36337, "b": 591.29344, "coord_origin": "TOPLEFT"}, "confidence": 0.824152410030365, "cells": [{"id": 81, "text": "[34]", "bbox": {"l": 50.112022, "t": 550.40048, "r": 66.037048, "b": 558.41644, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "Wenyuan Xue, Baosheng Yu, Wen Wang, Dacheng Tao,", "bbox": {"l": 68.426765, "t": 550.40048, "r": 286.3587, "b": 558.41644, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "and Qingyong Li.", "bbox": {"l": 70.031021, "t": 561.35948, "r": 137.08176, "b": 569.37544, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "Tgrnet:", "bbox": {"l": 145.9854, "t": 561.35948, "r": 172.38248, "b": 569.37544, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "A table graph reconstruction", "bbox": {"l": 178.7038, "t": 561.35948, "r": 286.36337, "b": 569.37544, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "network for table structure recognition.", "bbox": {"l": 70.031021, "t": 572.31848, "r": 221.00723, "b": 580.33444, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "arXiv preprint", "bbox": {"l": 232.54300999999998, "t": 572.39919, "r": 286.35938, "b": 580.12822, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "arXiv:2106.10598", "bbox": {"l": 70.031021, "t": 583.35818, "r": 135.53058, "b": 591.08722, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": ", 2021. 3", "bbox": {"l": 135.53003, "t": 583.27748, "r": 167.89876, "b": 591.29344, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "list_item", "bbox": {"l": 50.11203, "t": 594.60149, "r": 286.3634, "b": 635.49445, "coord_origin": "TOPLEFT"}, "confidence": 0.8360886573791504, "cells": [{"id": 90, "text": "[35]", "bbox": {"l": 50.11203, "t": 594.60149, "r": 65.23661, "b": 602.61745, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "Quanzeng You, Hailin Jin, Zhaowen Wang, Chen Fang, and", "bbox": {"l": 67.506203, "t": 594.60149, "r": 286.3587, "b": 602.61745, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Jiebo Luo.", "bbox": {"l": 70.031029, "t": 605.56049, "r": 109.1066, "b": 613.57645, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "Image captioning with semantic attention.", "bbox": {"l": 116.22592, "t": 605.56049, "r": 271.76605, "b": 613.57645, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "In", "bbox": {"l": 278.89435, "t": 605.56049, "r": 286.36337, "b": 613.57645, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "Proceedings of the IEEE conference on computer vision and", "bbox": {"l": 70.031029, "t": 616.60019, "r": 286.3634, "b": 624.32922, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "pattern recognition", "bbox": {"l": 70.031029, "t": 627.55919, "r": 139.09921, "b": 635.28822, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": ", pages 4651-4659, 2016. 4", "bbox": {"l": 139.09802, "t": 627.47849, "r": 238.95683, "b": 635.49445, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "list_item", "bbox": {"l": 50.112022, "t": 638.80249, "r": 286.36337, "b": 690.65347, "coord_origin": "TOPLEFT"}, "confidence": 0.8079469203948975, "cells": [{"id": 98, "text": "[36]", "bbox": {"l": 50.112022, "t": 638.80249, "r": 65.203552, "b": 646.81845, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "Xinyi Zheng, Doug Burdick, Lucian Popa, Peter Zhong, and", "bbox": {"l": 67.468193, "t": 638.80249, "r": 286.35873, "b": 646.81845, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "Nancy Xin Ru Wang. Global table extractor (gte): A frame-", "bbox": {"l": 70.031021, "t": 649.7605, "r": 286.36337, "b": 657.77646, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "work for joint table identification and cell structure recogni-", "bbox": {"l": 70.031021, "t": 660.7195, "r": 286.36334, "b": 668.73547, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "tion using visual context.", "bbox": {"l": 70.031021, "t": 671.6785, "r": 158.45766, "b": 679.69447, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "Winter Conference for Applications", "bbox": {"l": 160.52802, "t": 671.7592, "r": 286.36249, "b": 679.48824, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "in Computer Vision (WACV)", "bbox": {"l": 70.031013, "t": 682.7182, "r": 171.42305, "b": 690.44724, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": ", 2021. 2, 3", "bbox": {"l": 171.42201, "t": 682.6375, "r": 212.75713, "b": 690.65347, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "list_item", "bbox": {"l": 50.112015, "t": 693.961502, "r": 286.36334, "b": 712.936462, "coord_origin": "TOPLEFT"}, "confidence": 0.8385787606239319, "cells": [{"id": 106, "text": "[37]", "bbox": {"l": 50.112015, "t": 693.961502, "r": 66.506706, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "Xu", "bbox": {"l": 68.966896, "t": 693.961502, "r": 80.992294, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "Zhong,", "bbox": {"l": 89.062057, "t": 693.961502, "r": 114.71492999999998, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "Elaheh", "bbox": {"l": 124.24621000000002, "t": 693.961502, "r": 149.1459, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "ShafieiBavani,", "bbox": {"l": 157.22462, "t": 693.961502, "r": 209.37321, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "and", "bbox": {"l": 218.9045, "t": 693.961502, "r": 231.85196999999997, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "Antonio", "bbox": {"l": 239.93069, "t": 693.961502, "r": 269.32254, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "Ji-", "bbox": {"l": 277.3923, "t": 693.961502, "r": 286.3587, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "meno Yepes. Image-based table recognition: Data, model,", "bbox": {"l": 70.031013, "t": 704.920502, "r": 286.36334, "b": 712.936462, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "list_item", "bbox": {"l": 328.78101, "t": 75.88347999999996, "r": 545.11456, "b": 116.77544999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.7556984424591064, "cells": [{"id": 115, "text": "and evaluation. In Andrea Vedaldi, Horst Bischof, Thomas", "bbox": {"l": 328.78101, "t": 75.88347999999996, "r": 545.11346, "b": 83.89948000000015, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "Brox, and Jan-Michael Frahm, editors,", "bbox": {"l": 328.78101, "t": 86.84149000000002, "r": 472.30618, "b": 94.85748000000001, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "Computer Vision -", "bbox": {"l": 475.88501, "t": 86.92218000000003, "r": 545.11456, "b": 94.65125, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "ECCV 2020", "bbox": {"l": 328.78101, "t": 97.88116000000002, "r": 371.92734, "b": 105.61023, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": ", pages 564-580, Cham, 2020. Springer Interna-", "bbox": {"l": 371.92599, "t": 97.80048, "r": 545.11206, "b": 105.81646999999987, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "tional Publishing. 2, 3, 7", "bbox": {"l": 328.78101, "t": 108.75945999999999, "r": 417.70087, "b": 116.77544999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "list_item", "bbox": {"l": 308.862, "t": 120.71447999999998, "r": 545.11334, "b": 161.60742000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.8375807404518127, "cells": [{"id": 121, "text": "[38]", "bbox": {"l": 308.862, "t": 120.71447999999998, "r": 324.33197, "b": 128.73046999999997, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Xu Zhong, Jianbin Tang, and Antonio Jimeno Yepes. Pub-", "bbox": {"l": 326.65341, "t": 120.71447999999998, "r": 545.10876, "b": 128.73046999999997, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "laynet: Largest dataset ever for document layout analysis. In", "bbox": {"l": 328.78101, "t": 131.67345999999998, "r": 545.11334, "b": 139.68944999999997, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "2019 International Conference on Document Analysis and", "bbox": {"l": 328.78101, "t": 142.71312999999998, "r": 545.11328, "b": 150.44219999999996, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "Recognition (ICDAR)", "bbox": {"l": 328.78101, "t": 153.67211999999995, "r": 406.32245, "b": 161.40117999999995, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": ", pages 1015-1022, 2019. 1", "bbox": {"l": 406.32202, "t": 153.59142999999995, "r": 506.18085, "b": 161.60742000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "page_footer", "bbox": {"l": 292.63, "t": 734.1329920000001, "r": 302.59259, "b": 743.039555, "coord_origin": "TOPLEFT"}, "confidence": 0.9069585204124451, "cells": [{"id": 127, "text": "10", "bbox": {"l": 292.63, "t": 734.1329920000001, "r": 302.59259, "b": 743.039555, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "text", "id": 15, "page_no": 9, "cluster": {"id": 15, "label": "text", "bbox": {"l": 70.030998, "t": 75.88378999999998, "r": 286.36176, "b": 94.85875999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.6886768937110901, "cells": [{"id": 0, "text": "Computer Vision and Pattern Recognition", "bbox": {"l": 70.030998, "t": 75.96447999999998, "r": 223.58061, "b": 83.69353999999998, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": ", pages 658-666,", "bbox": {"l": 223.57901, "t": 75.88378999999998, "r": 286.36176, "b": 83.89977999999996, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "2019. 6", "bbox": {"l": 70.031006, "t": 86.84276999999997, "r": 97.916512, "b": 94.85875999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Computer Vision and Pattern Recognition , pages 658-666, 2019. 6"}, {"label": "list_item", "id": 13, "page_no": 9, "cluster": {"id": 13, "label": "list_item", "bbox": {"l": 50.112007, "t": 98.16576999999995, "r": 286.36578, "b": 160.97668, "coord_origin": "TOPLEFT"}, "confidence": 0.7723013758659363, "cells": [{"id": 3, "text": "[26]", "bbox": {"l": 50.112007, "t": 98.16576999999995, "r": 65.534088, "b": 106.18176000000005, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Sebastian Schreiber, Stefan Agne, Ivo Wolf, Andreas Den-", "bbox": {"l": 67.84832, "t": 98.16576999999995, "r": 286.35867, "b": 106.18176000000005, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "gel, and Sheraz Ahmed. Deepdesrt: Deep learning for detec-", "bbox": {"l": 70.031006, "t": 109.12476000000004, "r": 286.36331, "b": 117.14075000000003, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "tion and structure recognition of tables in document images.", "bbox": {"l": 70.031006, "t": 120.08374000000003, "r": 286.36334, "b": 128.0997299999999, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "In", "bbox": {"l": 70.031006, "t": 131.04272000000003, "r": 77.500015, "b": 139.05872, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "2017 14th IAPR International Conference on Document", "bbox": {"l": 80.560005, "t": 131.12341000000004, "r": 286.36578, "b": 138.85248, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Analysis and Recognition (ICDAR)", "bbox": {"l": 70.031006, "t": 142.0824, "r": 195.22885, "b": 149.81146, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": ", volume 01, pages 1162-", "bbox": {"l": 195.231, "t": 142.00171, "r": 286.36548, "b": 150.0177, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "1167, 2017. 1", "bbox": {"l": 70.031006, "t": 152.96069, "r": 120.33251, "b": 160.97668, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[26] Sebastian Schreiber, Stefan Agne, Ivo Wolf, Andreas Dengel, and Sheraz Ahmed. Deepdesrt: Deep learning for detection and structure recognition of tables in document images. In 2017 14th IAPR International Conference on Document Analysis and Recognition (ICDAR) , volume 01, pages 11621167, 2017. 1"}, {"label": "list_item", "id": 2, "page_no": 9, "cluster": {"id": 2, "label": "list_item", "bbox": {"l": 50.112007, "t": 164.28467, "r": 286.36337, "b": 227.0946, "coord_origin": "TOPLEFT"}, "confidence": 0.8580600619316101, "cells": [{"id": 12, "text": "[27]", "bbox": {"l": 50.112007, "t": 164.28467, "r": 65.534088, "b": 172.30066, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Sebastian Schreiber, Stefan Agne, Ivo Wolf, Andreas Den-", "bbox": {"l": 67.84832, "t": 164.28467, "r": 286.35867, "b": 172.30066, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "gel, and Sheraz Ahmed. Deepdesrt: Deep learning for de-", "bbox": {"l": 70.031006, "t": 175.24365, "r": 286.36337, "b": 183.25964, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "tection and structure recognition of tables in document im-", "bbox": {"l": 70.031006, "t": 186.20263999999997, "r": 286.36334, "b": 194.21862999999996, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "ages. In", "bbox": {"l": 70.031006, "t": 197.16161999999997, "r": 101.33271, "b": 205.17760999999996, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "2017 14th IAPR international conference on doc-", "bbox": {"l": 104.33101, "t": 197.24230999999997, "r": 286.35791, "b": 204.97136999999998, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "ument analysis and recognition (ICDAR)", "bbox": {"l": 70.031006, "t": 208.20032000000003, "r": 220.48719999999997, "b": 215.92938000000004, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": ", volume 1, pages", "bbox": {"l": 220.48401000000004, "t": 208.11963000000003, "r": 286.36017, "b": 216.13562000000002, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "1162-1167. IEEE, 2017. 3", "bbox": {"l": 70.031006, "t": 219.07861000000003, "r": 166.65294, "b": 227.0946, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[27] Sebastian Schreiber, Stefan Agne, Ivo Wolf, Andreas Dengel, and Sheraz Ahmed. Deepdesrt: Deep learning for detection and structure recognition of tables in document images. In 2017 14th IAPR international conference on document analysis and recognition (ICDAR) , volume 1, pages 1162-1167. IEEE, 2017. 3"}, {"label": "list_item", "id": 4, "page_no": 9, "cluster": {"id": 4, "label": "list_item", "bbox": {"l": 50.112007, "t": 230.40259000000003, "r": 286.36578, "b": 271.29553, "coord_origin": "TOPLEFT"}, "confidence": 0.8512733578681946, "cells": [{"id": 21, "text": "[28]", "bbox": {"l": 50.112007, "t": 230.40259000000003, "r": 65.650383, "b": 238.41858000000002, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "Faisal Shafait and Ray Smith. Table detection in heteroge-", "bbox": {"l": 67.982063, "t": 230.40259000000003, "r": 286.3587, "b": 238.41858000000002, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "neous documents. In", "bbox": {"l": 70.031006, "t": 241.36157000000003, "r": 147.16895, "b": 249.37756000000002, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "Proceedings of the 9th IAPR Interna-", "bbox": {"l": 149.93301, "t": 241.44226000000003, "r": 286.36578, "b": 249.17133, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "tional Workshop on Document Analysis Systems", "bbox": {"l": 70.031013, "t": 252.40125, "r": 244.6875, "b": 260.13031, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": ", pages 65-", "bbox": {"l": 244.69101, "t": 252.32056, "r": 286.35791, "b": 260.33655, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "72, 2010. 2", "bbox": {"l": 70.031006, "t": 263.27954, "r": 111.36611, "b": 271.29553, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[28] Faisal Shafait and Ray Smith. Table detection in heterogeneous documents. In Proceedings of the 9th IAPR International Workshop on Document Analysis Systems , pages 6572, 2010. 2"}, {"label": "list_item", "id": 5, "page_no": 9, "cluster": {"id": 5, "label": "list_item", "bbox": {"l": 50.112007, "t": 274.60357999999997, "r": 286.36627, "b": 326.4545, "coord_origin": "TOPLEFT"}, "confidence": 0.8494514226913452, "cells": [{"id": 28, "text": "[29]", "bbox": {"l": 50.112007, "t": 274.60357999999997, "r": 66.023834, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Shoaib", "bbox": {"l": 68.411568, "t": 274.60357999999997, "r": 94.944016, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Ahmed", "bbox": {"l": 100.8708, "t": 274.60357999999997, "r": 127.26788000000002, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Siddiqui,", "bbox": {"l": 133.19467, "t": 274.60357999999997, "r": 165.83237, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Imran", "bbox": {"l": 172.68269, "t": 274.60357999999997, "r": 194.09445, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "Ali", "bbox": {"l": 200.02124, "t": 274.60357999999997, "r": 211.4803, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Fateh,", "bbox": {"l": 217.40708999999998, "t": 274.60357999999997, "r": 239.43755, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "Syed", "bbox": {"l": 246.28787000000003, "t": 274.60357999999997, "r": 264.22067, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Tah-", "bbox": {"l": 270.14746, "t": 274.60357999999997, "r": 286.35873, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "seen Raza Rizvi, Andreas Dengel, and Sheraz Ahmed.", "bbox": {"l": 70.031006, "t": 285.56256, "r": 286.36331, "b": 293.57852, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "Deeptabstr: Deep learning based table structure recognition.", "bbox": {"l": 70.031006, "t": 296.52155, "r": 286.36331, "b": 304.53751, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "In", "bbox": {"l": 70.031006, "t": 307.48053, "r": 77.500015, "b": 315.49649, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "2019 International Conference on Document Analysis and", "bbox": {"l": 79.350006, "t": 307.56122, "r": 286.36627, "b": 315.29028, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Recognition (ICDAR)", "bbox": {"l": 70.031006, "t": 318.51923, "r": 147.57243, "b": 326.24829, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": ", pages 1403-1409. IEEE, 2019. 3", "bbox": {"l": 147.57201, "t": 318.43854, "r": 271.33521, "b": 326.4545, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[29] Shoaib Ahmed Siddiqui, Imran Ali Fateh, Syed Tahseen Raza Rizvi, Andreas Dengel, and Sheraz Ahmed. Deeptabstr: Deep learning based table structure recognition. In 2019 International Conference on Document Analysis and Recognition (ICDAR) , pages 1403-1409. IEEE, 2019. 3"}, {"label": "list_item", "id": 3, "page_no": 9, "cluster": {"id": 3, "label": "list_item", "bbox": {"l": 50.112007, "t": 329.76254, "r": 286.36334, "b": 381.61447, "coord_origin": "TOPLEFT"}, "confidence": 0.8567667007446289, "cells": [{"id": 43, "text": "[30]", "bbox": {"l": 50.112007, "t": 329.76254, "r": 65.366135, "b": 337.7785, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "Peter W J Staar, Michele Dolfi, Christoph Auer, and Costas", "bbox": {"l": 67.655159, "t": 329.76254, "r": 286.3587, "b": 337.7785, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Bekas. Corpus conversion service: A machine learning plat-", "bbox": {"l": 70.031006, "t": 340.72156000000007, "r": 286.36334, "b": 348.7375200000001, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "form to ingest documents at scale.", "bbox": {"l": 70.031006, "t": 351.68054, "r": 198.82439, "b": 359.6965, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "In", "bbox": {"l": 206.06027, "t": 351.68054, "r": 213.52928, "b": 359.6965, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Proceedings of the", "bbox": {"l": 217.02101, "t": 351.76123, "r": 286.35815, "b": 359.4903, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "24th ACM SIGKDD", "bbox": {"l": 70.031006, "t": 362.72021, "r": 143.08028, "b": 370.44928, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": ", KDD \u201918, pages 774-782, New York,", "bbox": {"l": 143.078, "t": 362.63953000000004, "r": 286.36111, "b": 370.65549000000004, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "NY, USA, 2018. ACM. 1", "bbox": {"l": 70.031006, "t": 373.59851, "r": 161.15652, "b": 381.61447, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[30] Peter W J Staar, Michele Dolfi, Christoph Auer, and Costas Bekas. Corpus conversion service: A machine learning platform to ingest documents at scale. In Proceedings of the 24th ACM SIGKDD , KDD \u201918, pages 774-782, New York, NY, USA, 2018. ACM. 1"}, {"label": "list_item", "id": 1, "page_no": 9, "cluster": {"id": 1, "label": "list_item", "bbox": {"l": 50.112007, "t": 384.92252, "r": 286.36389, "b": 458.69144, "coord_origin": "TOPLEFT"}, "confidence": 0.8832165598869324, "cells": [{"id": 52, "text": "[31]", "bbox": {"l": 50.112007, "t": 384.92252, "r": 65.140724, "b": 392.93848, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Ashish Vaswani, Noam Shazeer, Niki Parmar, Jakob Uszko-", "bbox": {"l": 67.395927, "t": 384.92252, "r": 286.35876, "b": 392.93848, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "reit, Llion Jones, Aidan N Gomez, \u0141 ukasz Kaiser, and Il-", "bbox": {"l": 70.031006, "t": 395.88153, "r": 286.36337, "b": 403.89749, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "lia Polosukhin.", "bbox": {"l": 70.031006, "t": 406.84052, "r": 125.47024999999998, "b": 414.85648, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Attention is all you need.", "bbox": {"l": 133.90764, "t": 406.84052, "r": 230.83444, "b": 414.85648, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "In I. Guyon,", "bbox": {"l": 239.27182, "t": 406.84052, "r": 286.36334, "b": 414.85648, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "U.", "bbox": {"l": 70.031006, "t": 417.7995, "r": 78.958366, "b": 425.81546, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "V. Luxburg, S. Bengio, H. Wallach, R. Fergus, S. Vish-", "bbox": {"l": 81.254494, "t": 417.7995, "r": 286.36334, "b": 425.81546, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "wanathan, and R. Garnett, editors,", "bbox": {"l": 70.031006, "t": 428.75751, "r": 196.7621, "b": 436.7734699999999, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "Advances in Neural In-", "bbox": {"l": 200.20201, "t": 428.8381999999999, "r": 286.36017, "b": 436.56726, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "formation Processing Systems 30", "bbox": {"l": 70.031006, "t": 439.79717999999997, "r": 189.19447, "b": 447.52624999999995, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": ", pages 5998-6008. Curran", "bbox": {"l": 189.19501, "t": 439.71648999999996, "r": 286.36389, "b": 447.73245, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "Associates, Inc., 2017. 5", "bbox": {"l": 70.031006, "t": 450.67548, "r": 158.9239, "b": 458.69144, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[31] Ashish Vaswani, Noam Shazeer, Niki Parmar, Jakob Uszkoreit, Llion Jones, Aidan N Gomez, \u0141 ukasz Kaiser, and Illia Polosukhin. Attention is all you need. In I. Guyon, U. V. Luxburg, S. Bengio, H. Wallach, R. Fergus, S. Vishwanathan, and R. Garnett, editors, Advances in Neural Information Processing Systems 30 , pages 5998-6008. Curran Associates, Inc., 2017. 5"}, {"label": "list_item", "id": 6, "page_no": 9, "cluster": {"id": 6, "label": "list_item", "bbox": {"l": 50.112007, "t": 461.99948, "r": 286.36334, "b": 502.89243, "coord_origin": "TOPLEFT"}, "confidence": 0.843192458152771, "cells": [{"id": 65, "text": "[32]", "bbox": {"l": 50.112007, "t": 461.99948, "r": 65.910469, "b": 470.01544, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "Oriol Vinyals, Alexander Toshev, Samy Bengio, and Du-", "bbox": {"l": 68.281181, "t": 461.99948, "r": 286.35873, "b": 470.01544, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "mitru Erhan.", "bbox": {"l": 70.031006, "t": 472.9585, "r": 116.27969999999999, "b": 480.97446, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "Show and tell: A neural image caption gen-", "bbox": {"l": 122.48445, "t": 472.9585, "r": 286.36334, "b": 480.97446, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "erator. In", "bbox": {"l": 70.031006, "t": 483.91748, "r": 103.30532, "b": 491.93344, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "Proceedings of the IEEE Conference on Computer", "bbox": {"l": 105.51601, "t": 483.99817, "r": 286.35931, "b": 491.72723, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Vision and Pattern Recognition (CVPR)", "bbox": {"l": 70.031006, "t": 494.95715, "r": 212.51607, "b": 502.68622, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": ", June 2015. 2", "bbox": {"l": 212.51401, "t": 494.87646, "r": 263.55975, "b": 502.89243, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[32] Oriol Vinyals, Alexander Toshev, Samy Bengio, and Dumitru Erhan. Show and tell: A neural image caption generator. In Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR) , June 2015. 2"}, {"label": "list_item", "id": 7, "page_no": 9, "cluster": {"id": 7, "label": "list_item", "bbox": {"l": 50.112015, "t": 506.20047, "r": 286.36337, "b": 547.09244, "coord_origin": "TOPLEFT"}, "confidence": 0.8405641317367554, "cells": [{"id": 73, "text": "[33]", "bbox": {"l": 50.112015, "t": 506.20047, "r": 65.682777, "b": 514.21643, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "Wenyuan Xue, Qingyong Li, and Dacheng Tao.", "bbox": {"l": 68.019325, "t": 506.20047, "r": 247.37280000000004, "b": 514.21643, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "Res2tim:", "bbox": {"l": 253.97208000000003, "t": 506.20047, "r": 286.3587, "b": 514.21643, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "reconstruct syntactic structures from table images. In", "bbox": {"l": 70.031013, "t": 517.15948, "r": 265.62408, "b": 525.17545, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "2019", "bbox": {"l": 268.42902, "t": 517.24017, "r": 286.36182, "b": 524.96924, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "International Conference on Document Analysis and Recog-", "bbox": {"l": 70.031021, "t": 528.19916, "r": 286.36337, "b": 535.92822, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "nition (ICDAR)", "bbox": {"l": 70.031021, "t": 539.15718, "r": 125.25507999999999, "b": 546.88622, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": ", pages 749-755. IEEE, 2019. 3", "bbox": {"l": 125.25402, "t": 539.07648, "r": 240.05083, "b": 547.09244, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[33] Wenyuan Xue, Qingyong Li, and Dacheng Tao. Res2tim: reconstruct syntactic structures from table images. In 2019 International Conference on Document Analysis and Recognition (ICDAR) , pages 749-755. IEEE, 2019. 3"}, {"label": "list_item", "id": 11, "page_no": 9, "cluster": {"id": 11, "label": "list_item", "bbox": {"l": 50.112022, "t": 550.40048, "r": 286.36337, "b": 591.29344, "coord_origin": "TOPLEFT"}, "confidence": 0.824152410030365, "cells": [{"id": 81, "text": "[34]", "bbox": {"l": 50.112022, "t": 550.40048, "r": 66.037048, "b": 558.41644, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "Wenyuan Xue, Baosheng Yu, Wen Wang, Dacheng Tao,", "bbox": {"l": 68.426765, "t": 550.40048, "r": 286.3587, "b": 558.41644, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "and Qingyong Li.", "bbox": {"l": 70.031021, "t": 561.35948, "r": 137.08176, "b": 569.37544, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "Tgrnet:", "bbox": {"l": 145.9854, "t": 561.35948, "r": 172.38248, "b": 569.37544, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "A table graph reconstruction", "bbox": {"l": 178.7038, "t": 561.35948, "r": 286.36337, "b": 569.37544, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "network for table structure recognition.", "bbox": {"l": 70.031021, "t": 572.31848, "r": 221.00723, "b": 580.33444, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "arXiv preprint", "bbox": {"l": 232.54300999999998, "t": 572.39919, "r": 286.35938, "b": 580.12822, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "arXiv:2106.10598", "bbox": {"l": 70.031021, "t": 583.35818, "r": 135.53058, "b": 591.08722, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": ", 2021. 3", "bbox": {"l": 135.53003, "t": 583.27748, "r": 167.89876, "b": 591.29344, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[34] Wenyuan Xue, Baosheng Yu, Wen Wang, Dacheng Tao, and Qingyong Li. Tgrnet: A table graph reconstruction network for table structure recognition. arXiv preprint arXiv:2106.10598 , 2021. 3"}, {"label": "list_item", "id": 10, "page_no": 9, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 50.11203, "t": 594.60149, "r": 286.3634, "b": 635.49445, "coord_origin": "TOPLEFT"}, "confidence": 0.8360886573791504, "cells": [{"id": 90, "text": "[35]", "bbox": {"l": 50.11203, "t": 594.60149, "r": 65.23661, "b": 602.61745, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "Quanzeng You, Hailin Jin, Zhaowen Wang, Chen Fang, and", "bbox": {"l": 67.506203, "t": 594.60149, "r": 286.3587, "b": 602.61745, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Jiebo Luo.", "bbox": {"l": 70.031029, "t": 605.56049, "r": 109.1066, "b": 613.57645, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "Image captioning with semantic attention.", "bbox": {"l": 116.22592, "t": 605.56049, "r": 271.76605, "b": 613.57645, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "In", "bbox": {"l": 278.89435, "t": 605.56049, "r": 286.36337, "b": 613.57645, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "Proceedings of the IEEE conference on computer vision and", "bbox": {"l": 70.031029, "t": 616.60019, "r": 286.3634, "b": 624.32922, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "pattern recognition", "bbox": {"l": 70.031029, "t": 627.55919, "r": 139.09921, "b": 635.28822, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": ", pages 4651-4659, 2016. 4", "bbox": {"l": 139.09802, "t": 627.47849, "r": 238.95683, "b": 635.49445, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[35] Quanzeng You, Hailin Jin, Zhaowen Wang, Chen Fang, and Jiebo Luo. Image captioning with semantic attention. In Proceedings of the IEEE conference on computer vision and pattern recognition , pages 4651-4659, 2016. 4"}, {"label": "list_item", "id": 12, "page_no": 9, "cluster": {"id": 12, "label": "list_item", "bbox": {"l": 50.112022, "t": 638.80249, "r": 286.36337, "b": 690.65347, "coord_origin": "TOPLEFT"}, "confidence": 0.8079469203948975, "cells": [{"id": 98, "text": "[36]", "bbox": {"l": 50.112022, "t": 638.80249, "r": 65.203552, "b": 646.81845, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "Xinyi Zheng, Doug Burdick, Lucian Popa, Peter Zhong, and", "bbox": {"l": 67.468193, "t": 638.80249, "r": 286.35873, "b": 646.81845, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "Nancy Xin Ru Wang. Global table extractor (gte): A frame-", "bbox": {"l": 70.031021, "t": 649.7605, "r": 286.36337, "b": 657.77646, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "work for joint table identification and cell structure recogni-", "bbox": {"l": 70.031021, "t": 660.7195, "r": 286.36334, "b": 668.73547, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "tion using visual context.", "bbox": {"l": 70.031021, "t": 671.6785, "r": 158.45766, "b": 679.69447, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "Winter Conference for Applications", "bbox": {"l": 160.52802, "t": 671.7592, "r": 286.36249, "b": 679.48824, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "in Computer Vision (WACV)", "bbox": {"l": 70.031013, "t": 682.7182, "r": 171.42305, "b": 690.44724, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": ", 2021. 2, 3", "bbox": {"l": 171.42201, "t": 682.6375, "r": 212.75713, "b": 690.65347, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[36] Xinyi Zheng, Doug Burdick, Lucian Popa, Peter Zhong, and Nancy Xin Ru Wang. Global table extractor (gte): A framework for joint table identification and cell structure recognition using visual context. Winter Conference for Applications in Computer Vision (WACV) , 2021. 2, 3"}, {"label": "list_item", "id": 8, "page_no": 9, "cluster": {"id": 8, "label": "list_item", "bbox": {"l": 50.112015, "t": 693.961502, "r": 286.36334, "b": 712.936462, "coord_origin": "TOPLEFT"}, "confidence": 0.8385787606239319, "cells": [{"id": 106, "text": "[37]", "bbox": {"l": 50.112015, "t": 693.961502, "r": 66.506706, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "Xu", "bbox": {"l": 68.966896, "t": 693.961502, "r": 80.992294, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "Zhong,", "bbox": {"l": 89.062057, "t": 693.961502, "r": 114.71492999999998, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "Elaheh", "bbox": {"l": 124.24621000000002, "t": 693.961502, "r": 149.1459, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "ShafieiBavani,", "bbox": {"l": 157.22462, "t": 693.961502, "r": 209.37321, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "and", "bbox": {"l": 218.9045, "t": 693.961502, "r": 231.85196999999997, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "Antonio", "bbox": {"l": 239.93069, "t": 693.961502, "r": 269.32254, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "Ji-", "bbox": {"l": 277.3923, "t": 693.961502, "r": 286.3587, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "meno Yepes. Image-based table recognition: Data, model,", "bbox": {"l": 70.031013, "t": 704.920502, "r": 286.36334, "b": 712.936462, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[37] Xu Zhong, Elaheh ShafieiBavani, and Antonio Jimeno Yepes. Image-based table recognition: Data, model,"}, {"label": "list_item", "id": 14, "page_no": 9, "cluster": {"id": 14, "label": "list_item", "bbox": {"l": 328.78101, "t": 75.88347999999996, "r": 545.11456, "b": 116.77544999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.7556984424591064, "cells": [{"id": 115, "text": "and evaluation. In Andrea Vedaldi, Horst Bischof, Thomas", "bbox": {"l": 328.78101, "t": 75.88347999999996, "r": 545.11346, "b": 83.89948000000015, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "Brox, and Jan-Michael Frahm, editors,", "bbox": {"l": 328.78101, "t": 86.84149000000002, "r": 472.30618, "b": 94.85748000000001, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "Computer Vision -", "bbox": {"l": 475.88501, "t": 86.92218000000003, "r": 545.11456, "b": 94.65125, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "ECCV 2020", "bbox": {"l": 328.78101, "t": 97.88116000000002, "r": 371.92734, "b": 105.61023, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": ", pages 564-580, Cham, 2020. Springer Interna-", "bbox": {"l": 371.92599, "t": 97.80048, "r": 545.11206, "b": 105.81646999999987, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "tional Publishing. 2, 3, 7", "bbox": {"l": 328.78101, "t": 108.75945999999999, "r": 417.70087, "b": 116.77544999999998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "and evaluation. In Andrea Vedaldi, Horst Bischof, Thomas Brox, and Jan-Michael Frahm, editors, Computer Vision ECCV 2020 , pages 564-580, Cham, 2020. Springer International Publishing. 2, 3, 7"}, {"label": "list_item", "id": 9, "page_no": 9, "cluster": {"id": 9, "label": "list_item", "bbox": {"l": 308.862, "t": 120.71447999999998, "r": 545.11334, "b": 161.60742000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.8375807404518127, "cells": [{"id": 121, "text": "[38]", "bbox": {"l": 308.862, "t": 120.71447999999998, "r": 324.33197, "b": 128.73046999999997, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Xu Zhong, Jianbin Tang, and Antonio Jimeno Yepes. Pub-", "bbox": {"l": 326.65341, "t": 120.71447999999998, "r": 545.10876, "b": 128.73046999999997, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "laynet: Largest dataset ever for document layout analysis. In", "bbox": {"l": 328.78101, "t": 131.67345999999998, "r": 545.11334, "b": 139.68944999999997, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "2019 International Conference on Document Analysis and", "bbox": {"l": 328.78101, "t": 142.71312999999998, "r": 545.11328, "b": 150.44219999999996, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "Recognition (ICDAR)", "bbox": {"l": 328.78101, "t": 153.67211999999995, "r": 406.32245, "b": 161.40117999999995, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": ", pages 1015-1022, 2019. 1", "bbox": {"l": 406.32202, "t": 153.59142999999995, "r": 506.18085, "b": 161.60742000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[38] Xu Zhong, Jianbin Tang, and Antonio Jimeno Yepes. Publaynet: Largest dataset ever for document layout analysis. In 2019 International Conference on Document Analysis and Recognition (ICDAR) , pages 1015-1022, 2019. 1"}, {"label": "page_footer", "id": 0, "page_no": 9, "cluster": {"id": 0, "label": "page_footer", "bbox": {"l": 292.63, "t": 734.1329920000001, "r": 302.59259, "b": 743.039555, "coord_origin": "TOPLEFT"}, "confidence": 0.9069585204124451, "cells": [{"id": 127, "text": "10", "bbox": {"l": 292.63, "t": 734.1329920000001, "r": 302.59259, "b": 743.039555, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "10"}], "body": [{"label": "text", "id": 15, "page_no": 9, "cluster": {"id": 15, "label": "text", "bbox": {"l": 70.030998, "t": 75.88378999999998, "r": 286.36176, "b": 94.85875999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.6886768937110901, "cells": [{"id": 0, "text": "Computer Vision and Pattern Recognition", "bbox": {"l": 70.030998, "t": 75.96447999999998, "r": 223.58061, "b": 83.69353999999998, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": ", pages 658-666,", "bbox": {"l": 223.57901, "t": 75.88378999999998, "r": 286.36176, "b": 83.89977999999996, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "2019. 6", "bbox": {"l": 70.031006, "t": 86.84276999999997, "r": 97.916512, "b": 94.85875999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Computer Vision and Pattern Recognition , pages 658-666, 2019. 6"}, {"label": "list_item", "id": 13, "page_no": 9, "cluster": {"id": 13, "label": "list_item", "bbox": {"l": 50.112007, "t": 98.16576999999995, "r": 286.36578, "b": 160.97668, "coord_origin": "TOPLEFT"}, "confidence": 0.7723013758659363, "cells": [{"id": 3, "text": "[26]", "bbox": {"l": 50.112007, "t": 98.16576999999995, "r": 65.534088, "b": 106.18176000000005, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Sebastian Schreiber, Stefan Agne, Ivo Wolf, Andreas Den-", "bbox": {"l": 67.84832, "t": 98.16576999999995, "r": 286.35867, "b": 106.18176000000005, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "gel, and Sheraz Ahmed. Deepdesrt: Deep learning for detec-", "bbox": {"l": 70.031006, "t": 109.12476000000004, "r": 286.36331, "b": 117.14075000000003, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "tion and structure recognition of tables in document images.", "bbox": {"l": 70.031006, "t": 120.08374000000003, "r": 286.36334, "b": 128.0997299999999, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "In", "bbox": {"l": 70.031006, "t": 131.04272000000003, "r": 77.500015, "b": 139.05872, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "2017 14th IAPR International Conference on Document", "bbox": {"l": 80.560005, "t": 131.12341000000004, "r": 286.36578, "b": 138.85248, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Analysis and Recognition (ICDAR)", "bbox": {"l": 70.031006, "t": 142.0824, "r": 195.22885, "b": 149.81146, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": ", volume 01, pages 1162-", "bbox": {"l": 195.231, "t": 142.00171, "r": 286.36548, "b": 150.0177, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "1167, 2017. 1", "bbox": {"l": 70.031006, "t": 152.96069, "r": 120.33251, "b": 160.97668, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[26] Sebastian Schreiber, Stefan Agne, Ivo Wolf, Andreas Dengel, and Sheraz Ahmed. Deepdesrt: Deep learning for detection and structure recognition of tables in document images. In 2017 14th IAPR International Conference on Document Analysis and Recognition (ICDAR) , volume 01, pages 11621167, 2017. 1"}, {"label": "list_item", "id": 2, "page_no": 9, "cluster": {"id": 2, "label": "list_item", "bbox": {"l": 50.112007, "t": 164.28467, "r": 286.36337, "b": 227.0946, "coord_origin": "TOPLEFT"}, "confidence": 0.8580600619316101, "cells": [{"id": 12, "text": "[27]", "bbox": {"l": 50.112007, "t": 164.28467, "r": 65.534088, "b": 172.30066, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Sebastian Schreiber, Stefan Agne, Ivo Wolf, Andreas Den-", "bbox": {"l": 67.84832, "t": 164.28467, "r": 286.35867, "b": 172.30066, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "gel, and Sheraz Ahmed. Deepdesrt: Deep learning for de-", "bbox": {"l": 70.031006, "t": 175.24365, "r": 286.36337, "b": 183.25964, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "tection and structure recognition of tables in document im-", "bbox": {"l": 70.031006, "t": 186.20263999999997, "r": 286.36334, "b": 194.21862999999996, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "ages. In", "bbox": {"l": 70.031006, "t": 197.16161999999997, "r": 101.33271, "b": 205.17760999999996, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "2017 14th IAPR international conference on doc-", "bbox": {"l": 104.33101, "t": 197.24230999999997, "r": 286.35791, "b": 204.97136999999998, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "ument analysis and recognition (ICDAR)", "bbox": {"l": 70.031006, "t": 208.20032000000003, "r": 220.48719999999997, "b": 215.92938000000004, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": ", volume 1, pages", "bbox": {"l": 220.48401000000004, "t": 208.11963000000003, "r": 286.36017, "b": 216.13562000000002, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "1162-1167. IEEE, 2017. 3", "bbox": {"l": 70.031006, "t": 219.07861000000003, "r": 166.65294, "b": 227.0946, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[27] Sebastian Schreiber, Stefan Agne, Ivo Wolf, Andreas Dengel, and Sheraz Ahmed. Deepdesrt: Deep learning for detection and structure recognition of tables in document images. In 2017 14th IAPR international conference on document analysis and recognition (ICDAR) , volume 1, pages 1162-1167. IEEE, 2017. 3"}, {"label": "list_item", "id": 4, "page_no": 9, "cluster": {"id": 4, "label": "list_item", "bbox": {"l": 50.112007, "t": 230.40259000000003, "r": 286.36578, "b": 271.29553, "coord_origin": "TOPLEFT"}, "confidence": 0.8512733578681946, "cells": [{"id": 21, "text": "[28]", "bbox": {"l": 50.112007, "t": 230.40259000000003, "r": 65.650383, "b": 238.41858000000002, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "Faisal Shafait and Ray Smith. Table detection in heteroge-", "bbox": {"l": 67.982063, "t": 230.40259000000003, "r": 286.3587, "b": 238.41858000000002, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "neous documents. In", "bbox": {"l": 70.031006, "t": 241.36157000000003, "r": 147.16895, "b": 249.37756000000002, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "Proceedings of the 9th IAPR Interna-", "bbox": {"l": 149.93301, "t": 241.44226000000003, "r": 286.36578, "b": 249.17133, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "tional Workshop on Document Analysis Systems", "bbox": {"l": 70.031013, "t": 252.40125, "r": 244.6875, "b": 260.13031, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": ", pages 65-", "bbox": {"l": 244.69101, "t": 252.32056, "r": 286.35791, "b": 260.33655, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "72, 2010. 2", "bbox": {"l": 70.031006, "t": 263.27954, "r": 111.36611, "b": 271.29553, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[28] Faisal Shafait and Ray Smith. Table detection in heterogeneous documents. In Proceedings of the 9th IAPR International Workshop on Document Analysis Systems , pages 6572, 2010. 2"}, {"label": "list_item", "id": 5, "page_no": 9, "cluster": {"id": 5, "label": "list_item", "bbox": {"l": 50.112007, "t": 274.60357999999997, "r": 286.36627, "b": 326.4545, "coord_origin": "TOPLEFT"}, "confidence": 0.8494514226913452, "cells": [{"id": 28, "text": "[29]", "bbox": {"l": 50.112007, "t": 274.60357999999997, "r": 66.023834, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Shoaib", "bbox": {"l": 68.411568, "t": 274.60357999999997, "r": 94.944016, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Ahmed", "bbox": {"l": 100.8708, "t": 274.60357999999997, "r": 127.26788000000002, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Siddiqui,", "bbox": {"l": 133.19467, "t": 274.60357999999997, "r": 165.83237, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Imran", "bbox": {"l": 172.68269, "t": 274.60357999999997, "r": 194.09445, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "Ali", "bbox": {"l": 200.02124, "t": 274.60357999999997, "r": 211.4803, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Fateh,", "bbox": {"l": 217.40708999999998, "t": 274.60357999999997, "r": 239.43755, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "Syed", "bbox": {"l": 246.28787000000003, "t": 274.60357999999997, "r": 264.22067, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Tah-", "bbox": {"l": 270.14746, "t": 274.60357999999997, "r": 286.35873, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "seen Raza Rizvi, Andreas Dengel, and Sheraz Ahmed.", "bbox": {"l": 70.031006, "t": 285.56256, "r": 286.36331, "b": 293.57852, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "Deeptabstr: Deep learning based table structure recognition.", "bbox": {"l": 70.031006, "t": 296.52155, "r": 286.36331, "b": 304.53751, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "In", "bbox": {"l": 70.031006, "t": 307.48053, "r": 77.500015, "b": 315.49649, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "2019 International Conference on Document Analysis and", "bbox": {"l": 79.350006, "t": 307.56122, "r": 286.36627, "b": 315.29028, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Recognition (ICDAR)", "bbox": {"l": 70.031006, "t": 318.51923, "r": 147.57243, "b": 326.24829, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": ", pages 1403-1409. IEEE, 2019. 3", "bbox": {"l": 147.57201, "t": 318.43854, "r": 271.33521, "b": 326.4545, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[29] Shoaib Ahmed Siddiqui, Imran Ali Fateh, Syed Tahseen Raza Rizvi, Andreas Dengel, and Sheraz Ahmed. Deeptabstr: Deep learning based table structure recognition. In 2019 International Conference on Document Analysis and Recognition (ICDAR) , pages 1403-1409. IEEE, 2019. 3"}, {"label": "list_item", "id": 3, "page_no": 9, "cluster": {"id": 3, "label": "list_item", "bbox": {"l": 50.112007, "t": 329.76254, "r": 286.36334, "b": 381.61447, "coord_origin": "TOPLEFT"}, "confidence": 0.8567667007446289, "cells": [{"id": 43, "text": "[30]", "bbox": {"l": 50.112007, "t": 329.76254, "r": 65.366135, "b": 337.7785, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "Peter W J Staar, Michele Dolfi, Christoph Auer, and Costas", "bbox": {"l": 67.655159, "t": 329.76254, "r": 286.3587, "b": 337.7785, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Bekas. Corpus conversion service: A machine learning plat-", "bbox": {"l": 70.031006, "t": 340.72156000000007, "r": 286.36334, "b": 348.7375200000001, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "form to ingest documents at scale.", "bbox": {"l": 70.031006, "t": 351.68054, "r": 198.82439, "b": 359.6965, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "In", "bbox": {"l": 206.06027, "t": 351.68054, "r": 213.52928, "b": 359.6965, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Proceedings of the", "bbox": {"l": 217.02101, "t": 351.76123, "r": 286.35815, "b": 359.4903, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "24th ACM SIGKDD", "bbox": {"l": 70.031006, "t": 362.72021, "r": 143.08028, "b": 370.44928, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": ", KDD \u201918, pages 774-782, New York,", "bbox": {"l": 143.078, "t": 362.63953000000004, "r": 286.36111, "b": 370.65549000000004, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "NY, USA, 2018. ACM. 1", "bbox": {"l": 70.031006, "t": 373.59851, "r": 161.15652, "b": 381.61447, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[30] Peter W J Staar, Michele Dolfi, Christoph Auer, and Costas Bekas. Corpus conversion service: A machine learning platform to ingest documents at scale. In Proceedings of the 24th ACM SIGKDD , KDD \u201918, pages 774-782, New York, NY, USA, 2018. ACM. 1"}, {"label": "list_item", "id": 1, "page_no": 9, "cluster": {"id": 1, "label": "list_item", "bbox": {"l": 50.112007, "t": 384.92252, "r": 286.36389, "b": 458.69144, "coord_origin": "TOPLEFT"}, "confidence": 0.8832165598869324, "cells": [{"id": 52, "text": "[31]", "bbox": {"l": 50.112007, "t": 384.92252, "r": 65.140724, "b": 392.93848, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Ashish Vaswani, Noam Shazeer, Niki Parmar, Jakob Uszko-", "bbox": {"l": 67.395927, "t": 384.92252, "r": 286.35876, "b": 392.93848, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "reit, Llion Jones, Aidan N Gomez, \u0141 ukasz Kaiser, and Il-", "bbox": {"l": 70.031006, "t": 395.88153, "r": 286.36337, "b": 403.89749, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "lia Polosukhin.", "bbox": {"l": 70.031006, "t": 406.84052, "r": 125.47024999999998, "b": 414.85648, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Attention is all you need.", "bbox": {"l": 133.90764, "t": 406.84052, "r": 230.83444, "b": 414.85648, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "In I. Guyon,", "bbox": {"l": 239.27182, "t": 406.84052, "r": 286.36334, "b": 414.85648, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "U.", "bbox": {"l": 70.031006, "t": 417.7995, "r": 78.958366, "b": 425.81546, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "V. Luxburg, S. Bengio, H. Wallach, R. Fergus, S. Vish-", "bbox": {"l": 81.254494, "t": 417.7995, "r": 286.36334, "b": 425.81546, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "wanathan, and R. Garnett, editors,", "bbox": {"l": 70.031006, "t": 428.75751, "r": 196.7621, "b": 436.7734699999999, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "Advances in Neural In-", "bbox": {"l": 200.20201, "t": 428.8381999999999, "r": 286.36017, "b": 436.56726, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "formation Processing Systems 30", "bbox": {"l": 70.031006, "t": 439.79717999999997, "r": 189.19447, "b": 447.52624999999995, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": ", pages 5998-6008. Curran", "bbox": {"l": 189.19501, "t": 439.71648999999996, "r": 286.36389, "b": 447.73245, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "Associates, Inc., 2017. 5", "bbox": {"l": 70.031006, "t": 450.67548, "r": 158.9239, "b": 458.69144, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[31] Ashish Vaswani, Noam Shazeer, Niki Parmar, Jakob Uszkoreit, Llion Jones, Aidan N Gomez, \u0141 ukasz Kaiser, and Illia Polosukhin. Attention is all you need. In I. Guyon, U. V. Luxburg, S. Bengio, H. Wallach, R. Fergus, S. Vishwanathan, and R. Garnett, editors, Advances in Neural Information Processing Systems 30 , pages 5998-6008. Curran Associates, Inc., 2017. 5"}, {"label": "list_item", "id": 6, "page_no": 9, "cluster": {"id": 6, "label": "list_item", "bbox": {"l": 50.112007, "t": 461.99948, "r": 286.36334, "b": 502.89243, "coord_origin": "TOPLEFT"}, "confidence": 0.843192458152771, "cells": [{"id": 65, "text": "[32]", "bbox": {"l": 50.112007, "t": 461.99948, "r": 65.910469, "b": 470.01544, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "Oriol Vinyals, Alexander Toshev, Samy Bengio, and Du-", "bbox": {"l": 68.281181, "t": 461.99948, "r": 286.35873, "b": 470.01544, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "mitru Erhan.", "bbox": {"l": 70.031006, "t": 472.9585, "r": 116.27969999999999, "b": 480.97446, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "Show and tell: A neural image caption gen-", "bbox": {"l": 122.48445, "t": 472.9585, "r": 286.36334, "b": 480.97446, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "erator. In", "bbox": {"l": 70.031006, "t": 483.91748, "r": 103.30532, "b": 491.93344, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "Proceedings of the IEEE Conference on Computer", "bbox": {"l": 105.51601, "t": 483.99817, "r": 286.35931, "b": 491.72723, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Vision and Pattern Recognition (CVPR)", "bbox": {"l": 70.031006, "t": 494.95715, "r": 212.51607, "b": 502.68622, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": ", June 2015. 2", "bbox": {"l": 212.51401, "t": 494.87646, "r": 263.55975, "b": 502.89243, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[32] Oriol Vinyals, Alexander Toshev, Samy Bengio, and Dumitru Erhan. Show and tell: A neural image caption generator. In Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR) , June 2015. 2"}, {"label": "list_item", "id": 7, "page_no": 9, "cluster": {"id": 7, "label": "list_item", "bbox": {"l": 50.112015, "t": 506.20047, "r": 286.36337, "b": 547.09244, "coord_origin": "TOPLEFT"}, "confidence": 0.8405641317367554, "cells": [{"id": 73, "text": "[33]", "bbox": {"l": 50.112015, "t": 506.20047, "r": 65.682777, "b": 514.21643, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "Wenyuan Xue, Qingyong Li, and Dacheng Tao.", "bbox": {"l": 68.019325, "t": 506.20047, "r": 247.37280000000004, "b": 514.21643, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "Res2tim:", "bbox": {"l": 253.97208000000003, "t": 506.20047, "r": 286.3587, "b": 514.21643, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "reconstruct syntactic structures from table images. In", "bbox": {"l": 70.031013, "t": 517.15948, "r": 265.62408, "b": 525.17545, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "2019", "bbox": {"l": 268.42902, "t": 517.24017, "r": 286.36182, "b": 524.96924, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "International Conference on Document Analysis and Recog-", "bbox": {"l": 70.031021, "t": 528.19916, "r": 286.36337, "b": 535.92822, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "nition (ICDAR)", "bbox": {"l": 70.031021, "t": 539.15718, "r": 125.25507999999999, "b": 546.88622, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": ", pages 749-755. IEEE, 2019. 3", "bbox": {"l": 125.25402, "t": 539.07648, "r": 240.05083, "b": 547.09244, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[33] Wenyuan Xue, Qingyong Li, and Dacheng Tao. Res2tim: reconstruct syntactic structures from table images. In 2019 International Conference on Document Analysis and Recognition (ICDAR) , pages 749-755. IEEE, 2019. 3"}, {"label": "list_item", "id": 11, "page_no": 9, "cluster": {"id": 11, "label": "list_item", "bbox": {"l": 50.112022, "t": 550.40048, "r": 286.36337, "b": 591.29344, "coord_origin": "TOPLEFT"}, "confidence": 0.824152410030365, "cells": [{"id": 81, "text": "[34]", "bbox": {"l": 50.112022, "t": 550.40048, "r": 66.037048, "b": 558.41644, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "Wenyuan Xue, Baosheng Yu, Wen Wang, Dacheng Tao,", "bbox": {"l": 68.426765, "t": 550.40048, "r": 286.3587, "b": 558.41644, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "and Qingyong Li.", "bbox": {"l": 70.031021, "t": 561.35948, "r": 137.08176, "b": 569.37544, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "Tgrnet:", "bbox": {"l": 145.9854, "t": 561.35948, "r": 172.38248, "b": 569.37544, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "A table graph reconstruction", "bbox": {"l": 178.7038, "t": 561.35948, "r": 286.36337, "b": 569.37544, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "network for table structure recognition.", "bbox": {"l": 70.031021, "t": 572.31848, "r": 221.00723, "b": 580.33444, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "arXiv preprint", "bbox": {"l": 232.54300999999998, "t": 572.39919, "r": 286.35938, "b": 580.12822, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "arXiv:2106.10598", "bbox": {"l": 70.031021, "t": 583.35818, "r": 135.53058, "b": 591.08722, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": ", 2021. 3", "bbox": {"l": 135.53003, "t": 583.27748, "r": 167.89876, "b": 591.29344, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[34] Wenyuan Xue, Baosheng Yu, Wen Wang, Dacheng Tao, and Qingyong Li. Tgrnet: A table graph reconstruction network for table structure recognition. arXiv preprint arXiv:2106.10598 , 2021. 3"}, {"label": "list_item", "id": 10, "page_no": 9, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 50.11203, "t": 594.60149, "r": 286.3634, "b": 635.49445, "coord_origin": "TOPLEFT"}, "confidence": 0.8360886573791504, "cells": [{"id": 90, "text": "[35]", "bbox": {"l": 50.11203, "t": 594.60149, "r": 65.23661, "b": 602.61745, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "Quanzeng You, Hailin Jin, Zhaowen Wang, Chen Fang, and", "bbox": {"l": 67.506203, "t": 594.60149, "r": 286.3587, "b": 602.61745, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Jiebo Luo.", "bbox": {"l": 70.031029, "t": 605.56049, "r": 109.1066, "b": 613.57645, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "Image captioning with semantic attention.", "bbox": {"l": 116.22592, "t": 605.56049, "r": 271.76605, "b": 613.57645, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "In", "bbox": {"l": 278.89435, "t": 605.56049, "r": 286.36337, "b": 613.57645, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "Proceedings of the IEEE conference on computer vision and", "bbox": {"l": 70.031029, "t": 616.60019, "r": 286.3634, "b": 624.32922, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "pattern recognition", "bbox": {"l": 70.031029, "t": 627.55919, "r": 139.09921, "b": 635.28822, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": ", pages 4651-4659, 2016. 4", "bbox": {"l": 139.09802, "t": 627.47849, "r": 238.95683, "b": 635.49445, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[35] Quanzeng You, Hailin Jin, Zhaowen Wang, Chen Fang, and Jiebo Luo. Image captioning with semantic attention. In Proceedings of the IEEE conference on computer vision and pattern recognition , pages 4651-4659, 2016. 4"}, {"label": "list_item", "id": 12, "page_no": 9, "cluster": {"id": 12, "label": "list_item", "bbox": {"l": 50.112022, "t": 638.80249, "r": 286.36337, "b": 690.65347, "coord_origin": "TOPLEFT"}, "confidence": 0.8079469203948975, "cells": [{"id": 98, "text": "[36]", "bbox": {"l": 50.112022, "t": 638.80249, "r": 65.203552, "b": 646.81845, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "Xinyi Zheng, Doug Burdick, Lucian Popa, Peter Zhong, and", "bbox": {"l": 67.468193, "t": 638.80249, "r": 286.35873, "b": 646.81845, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "Nancy Xin Ru Wang. Global table extractor (gte): A frame-", "bbox": {"l": 70.031021, "t": 649.7605, "r": 286.36337, "b": 657.77646, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "work for joint table identification and cell structure recogni-", "bbox": {"l": 70.031021, "t": 660.7195, "r": 286.36334, "b": 668.73547, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "tion using visual context.", "bbox": {"l": 70.031021, "t": 671.6785, "r": 158.45766, "b": 679.69447, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "Winter Conference for Applications", "bbox": {"l": 160.52802, "t": 671.7592, "r": 286.36249, "b": 679.48824, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "in Computer Vision (WACV)", "bbox": {"l": 70.031013, "t": 682.7182, "r": 171.42305, "b": 690.44724, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": ", 2021. 2, 3", "bbox": {"l": 171.42201, "t": 682.6375, "r": 212.75713, "b": 690.65347, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[36] Xinyi Zheng, Doug Burdick, Lucian Popa, Peter Zhong, and Nancy Xin Ru Wang. Global table extractor (gte): A framework for joint table identification and cell structure recognition using visual context. Winter Conference for Applications in Computer Vision (WACV) , 2021. 2, 3"}, {"label": "list_item", "id": 8, "page_no": 9, "cluster": {"id": 8, "label": "list_item", "bbox": {"l": 50.112015, "t": 693.961502, "r": 286.36334, "b": 712.936462, "coord_origin": "TOPLEFT"}, "confidence": 0.8385787606239319, "cells": [{"id": 106, "text": "[37]", "bbox": {"l": 50.112015, "t": 693.961502, "r": 66.506706, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "Xu", "bbox": {"l": 68.966896, "t": 693.961502, "r": 80.992294, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "Zhong,", "bbox": {"l": 89.062057, "t": 693.961502, "r": 114.71492999999998, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "Elaheh", "bbox": {"l": 124.24621000000002, "t": 693.961502, "r": 149.1459, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "ShafieiBavani,", "bbox": {"l": 157.22462, "t": 693.961502, "r": 209.37321, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "and", "bbox": {"l": 218.9045, "t": 693.961502, "r": 231.85196999999997, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "Antonio", "bbox": {"l": 239.93069, "t": 693.961502, "r": 269.32254, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "Ji-", "bbox": {"l": 277.3923, "t": 693.961502, "r": 286.3587, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "meno Yepes. Image-based table recognition: Data, model,", "bbox": {"l": 70.031013, "t": 704.920502, "r": 286.36334, "b": 712.936462, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[37] Xu Zhong, Elaheh ShafieiBavani, and Antonio Jimeno Yepes. Image-based table recognition: Data, model,"}, {"label": "list_item", "id": 14, "page_no": 9, "cluster": {"id": 14, "label": "list_item", "bbox": {"l": 328.78101, "t": 75.88347999999996, "r": 545.11456, "b": 116.77544999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.7556984424591064, "cells": [{"id": 115, "text": "and evaluation. In Andrea Vedaldi, Horst Bischof, Thomas", "bbox": {"l": 328.78101, "t": 75.88347999999996, "r": 545.11346, "b": 83.89948000000015, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "Brox, and Jan-Michael Frahm, editors,", "bbox": {"l": 328.78101, "t": 86.84149000000002, "r": 472.30618, "b": 94.85748000000001, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "Computer Vision -", "bbox": {"l": 475.88501, "t": 86.92218000000003, "r": 545.11456, "b": 94.65125, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "ECCV 2020", "bbox": {"l": 328.78101, "t": 97.88116000000002, "r": 371.92734, "b": 105.61023, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": ", pages 564-580, Cham, 2020. Springer Interna-", "bbox": {"l": 371.92599, "t": 97.80048, "r": 545.11206, "b": 105.81646999999987, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "tional Publishing. 2, 3, 7", "bbox": {"l": 328.78101, "t": 108.75945999999999, "r": 417.70087, "b": 116.77544999999998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "and evaluation. In Andrea Vedaldi, Horst Bischof, Thomas Brox, and Jan-Michael Frahm, editors, Computer Vision ECCV 2020 , pages 564-580, Cham, 2020. Springer International Publishing. 2, 3, 7"}, {"label": "list_item", "id": 9, "page_no": 9, "cluster": {"id": 9, "label": "list_item", "bbox": {"l": 308.862, "t": 120.71447999999998, "r": 545.11334, "b": 161.60742000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.8375807404518127, "cells": [{"id": 121, "text": "[38]", "bbox": {"l": 308.862, "t": 120.71447999999998, "r": 324.33197, "b": 128.73046999999997, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Xu Zhong, Jianbin Tang, and Antonio Jimeno Yepes. Pub-", "bbox": {"l": 326.65341, "t": 120.71447999999998, "r": 545.10876, "b": 128.73046999999997, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "laynet: Largest dataset ever for document layout analysis. In", "bbox": {"l": 328.78101, "t": 131.67345999999998, "r": 545.11334, "b": 139.68944999999997, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "2019 International Conference on Document Analysis and", "bbox": {"l": 328.78101, "t": 142.71312999999998, "r": 545.11328, "b": 150.44219999999996, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "Recognition (ICDAR)", "bbox": {"l": 328.78101, "t": 153.67211999999995, "r": 406.32245, "b": 161.40117999999995, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": ", pages 1015-1022, 2019. 1", "bbox": {"l": 406.32202, "t": 153.59142999999995, "r": 506.18085, "b": 161.60742000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[38] Xu Zhong, Jianbin Tang, and Antonio Jimeno Yepes. Publaynet: Largest dataset ever for document layout analysis. In 2019 International Conference on Document Analysis and Recognition (ICDAR) , pages 1015-1022, 2019. 1"}], "headers": [{"label": "page_footer", "id": 0, "page_no": 9, "cluster": {"id": 0, "label": "page_footer", "bbox": {"l": 292.63, "t": 734.1329920000001, "r": 302.59259, "b": 743.039555, "coord_origin": "TOPLEFT"}, "confidence": 0.9069585204124451, "cells": [{"id": 127, "text": "10", "bbox": {"l": 292.63, "t": 734.1329920000001, "r": 302.59259, "b": 743.039555, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "10"}]}}, {"page_no": 10, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "TableFormer: Table Structure Understanding with Transformers", "bbox": {"l": 132.842, "t": 110.57488999999998, "r": 465.37591999999995, "b": 121.32263, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Supplementary Material", "bbox": {"l": 220.18399, "t": 122.25982999999997, "r": 375.04269, "b": 135.53008999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "1.", "bbox": {"l": 50.111984, "t": 161.16089, "r": 57.089828, "b": 171.90863000000002, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Details on the datasets", "bbox": {"l": 66.393616, "t": 161.16089, "r": 175.96437, "b": 171.90863000000002, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "1.1.", "bbox": {"l": 50.111984, "t": 180.97931000000005, "r": 64.210808, "b": 190.83136000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Data preparation", "bbox": {"l": 73.610023, "t": 180.97931000000005, "r": 150.36401, "b": 190.83136000000002, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "As a first step of our data preparation process, we have", "bbox": {"l": 62.06698600000001, "t": 199.92029000000002, "r": 286.36496, "b": 208.82683999999995, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "calculated statistics over the datasets across the following", "bbox": {"l": 50.111984, "t": 211.87627999999995, "r": 286.36505, "b": 220.78283999999996, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "dimensions: (1) table size measured in the number of rows", "bbox": {"l": 50.111984, "t": 223.83130000000006, "r": 286.36514, "b": 232.73784999999998, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "and columns, (2) complexity of the table, (3) strictness of", "bbox": {"l": 50.111984, "t": 235.78632000000005, "r": 286.36508, "b": 244.69286999999997, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "the provided HTML structure and (4) completeness (i.e. no", "bbox": {"l": 50.111984, "t": 247.74132999999995, "r": 286.36505, "b": 256.64788999999996, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "omitted bounding boxes). A table is considered to be simple", "bbox": {"l": 50.111984, "t": 259.69635000000005, "r": 286.36505, "b": 268.60290999999995, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "if it does not contain row spans or column spans. Addition-", "bbox": {"l": 50.111984, "t": 271.65137000000004, "r": 286.36505, "b": 280.55792, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "ally, a table has a strict HTML structure if every row has the", "bbox": {"l": 50.111984, "t": 283.60736, "r": 286.36502, "b": 292.5139199999999, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "same number of columns after taking into account any row", "bbox": {"l": 50.111984, "t": 295.56235, "r": 286.36505, "b": 304.4689, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "or column spans. Therefore a strict HTML structure looks", "bbox": {"l": 50.111984, "t": 307.5173300000001, "r": 286.36508, "b": 316.42389, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "always rectangular. However, HTML is a lenient encoding", "bbox": {"l": 50.111984, "t": 319.47232, "r": 286.36505, "b": 328.3788799999999, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "format, i.e. tables with rows of different sizes might still", "bbox": {"l": 50.111984, "t": 331.42731000000003, "r": 286.36502, "b": 340.33386, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "be regarded as correct due to implicit display rules. These", "bbox": {"l": 50.111984, "t": 343.3833, "r": 286.36508, "b": 352.28986, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "implicit rules leave room for ambiguity, which we want to", "bbox": {"l": 50.111984, "t": 355.33829, "r": 286.36505, "b": 364.24484000000007, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "avoid. As such, we prefer to have \u201dstrict\u201d tables, i.e. tables", "bbox": {"l": 50.111984, "t": 367.29327, "r": 286.36508, "b": 376.19983, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "where every row has exactly the same length.", "bbox": {"l": 50.111984, "t": 379.24826, "r": 230.80364999999998, "b": 388.15482000000003, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "We have developed a technique that tries to derive a", "bbox": {"l": 62.06698600000001, "t": 391.40527, "r": 286.36499, "b": 400.31183, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "missing bounding box out of its neighbors. As a first step,", "bbox": {"l": 50.111984, "t": 403.36026, "r": 286.36508, "b": 412.26681999999994, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "we use the annotation data to generate the most fine-grained", "bbox": {"l": 50.111984, "t": 415.31525, "r": 286.36505, "b": 424.22180000000003, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "grid that covers the table structure. In case of strict HTML", "bbox": {"l": 50.111984, "t": 427.2712399999999, "r": 286.36505, "b": 436.1778, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "tables, all grid squares are associated with some table cell", "bbox": {"l": 50.111984, "t": 439.22623, "r": 286.36508, "b": 448.1327800000001, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "and in the presence of table spans a cell extends across mul-", "bbox": {"l": 50.111984, "t": 451.18121, "r": 286.36511, "b": 460.08777, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "tiple grid squares. When enough bounding boxes are known", "bbox": {"l": 50.111984, "t": 463.1362, "r": 286.36505, "b": 472.04276, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "for a rectangular table, it is possible to compute the geo-", "bbox": {"l": 50.111984, "t": 475.09119, "r": 286.36508, "b": 483.99774, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "metrical border lines between the grid rows and columns.", "bbox": {"l": 50.111984, "t": 487.04617, "r": 286.36502, "b": 495.95273, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Eventually this information is used to generate the missing", "bbox": {"l": 50.111984, "t": 499.00217, "r": 286.36511, "b": 507.90872, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "bounding boxes. Additionally, the existence of unused grid", "bbox": {"l": 50.111984, "t": 510.95715, "r": 286.36508, "b": 519.8637100000001, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "squares indicates that the table rows have unequal number", "bbox": {"l": 50.111984, "t": 522.91214, "r": 286.36508, "b": 531.8187, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "of columns and the overall structure is non-strict. The gen-", "bbox": {"l": 50.111984, "t": 534.86713, "r": 286.36505, "b": 543.7737, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "eration of missing bounding boxes for non-strict HTML ta-", "bbox": {"l": 50.111984, "t": 546.82214, "r": 286.36502, "b": 555.7287, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "bles is ambiguous and therefore quite challenging.", "bbox": {"l": 50.111984, "t": 558.77814, "r": 257.47351, "b": 567.68469, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "Thus,", "bbox": {"l": 263.94919, "t": 558.77814, "r": 286.36505, "b": 567.68469, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "we have decided to simply discard those tables. In case of", "bbox": {"l": 50.111984, "t": 570.73314, "r": 286.36508, "b": 579.63969, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "PubTabNet we have computed missing bounding boxes for", "bbox": {"l": 50.111984, "t": 582.68814, "r": 286.36511, "b": 591.5947, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "48% of the simple and 69% of the complex tables. Regard-", "bbox": {"l": 50.111984, "t": 594.64314, "r": 286.36511, "b": 603.5497, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "ing FinTabNet, 68% of the simple and 98% of the complex", "bbox": {"l": 50.111984, "t": 606.5981400000001, "r": 286.36505, "b": 615.5047, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "tables require the generation of bounding boxes.", "bbox": {"l": 50.111984, "t": 618.55315, "r": 242.2606, "b": 627.4597, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Figure 7 illustrates the distribution of the tables across", "bbox": {"l": 62.06698600000001, "t": 630.71014, "r": 286.36496, "b": 639.6167, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "different dimensions per dataset.", "bbox": {"l": 50.111984, "t": 642.66614, "r": 179.90472, "b": 651.57269, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "1.2.", "bbox": {"l": 50.111984, "t": 662.39014, "r": 64.297272, "b": 672.24219, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "Synthetic datasets", "bbox": {"l": 73.754135, "t": 662.39014, "r": 153.60785, "b": 672.24219, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "Aiming to train and evaluate our models in a broader", "bbox": {"l": 62.06698600000001, "t": 681.33113, "r": 286.36493, "b": 690.2377, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "spectrum of table data we have synthesized four types of", "bbox": {"l": 50.111984, "t": 693.2861330000001, "r": 286.36505, "b": 702.1927029999999, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "datasets.", "bbox": {"l": 50.111984, "t": 705.241135, "r": 84.144226, "b": 714.147705, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Each one contains tables with different appear-", "bbox": {"l": 91.237595, "t": 705.241135, "r": 286.36505, "b": 714.147705, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "ances in regard to their size, structure, style and content.", "bbox": {"l": 308.862, "t": 162.65515000000005, "r": 545.11511, "b": 171.56170999999995, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Every synthetic dataset contains 150k examples, summing", "bbox": {"l": 308.862, "t": 174.61017000000004, "r": 545.11511, "b": 183.51671999999996, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "up to 600k synthetic examples. All datasets are divided into", "bbox": {"l": 308.862, "t": 186.56519000000003, "r": 545.11511, "b": 195.47173999999995, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "Train, Test and Val splits (80%, 10%, 10%).", "bbox": {"l": 308.862, "t": 198.52117999999996, "r": 484.07434, "b": 207.42773, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "The process of generating a synthetic dataset can be de-", "bbox": {"l": 320.81699, "t": 211.23517000000004, "r": 545.11505, "b": 220.14171999999996, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "composed into the following steps:", "bbox": {"l": 308.862, "t": 223.19019000000003, "r": 448.08939, "b": 232.09673999999995, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "1.", "bbox": {"l": 320.81699, "t": 235.90521, "r": 328.28894, "b": 244.81177000000002, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Prepare styling and content templates: The styling", "bbox": {"l": 335.38232, "t": 235.90521, "r": 545.11499, "b": 244.81177000000002, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "templates have been manually designed and organized into", "bbox": {"l": 308.862, "t": 247.86023, "r": 545.11511, "b": 256.76678000000004, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "groups of scope specific appearances (e.g. financial data,", "bbox": {"l": 308.862, "t": 259.81525, "r": 545.11511, "b": 268.72180000000003, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "marketing data, etc.)", "bbox": {"l": 308.862, "t": 271.77026, "r": 393.3847, "b": 280.67682, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "Additionally, we have prepared cu-", "bbox": {"l": 400.11942, "t": 271.77026, "r": 545.11511, "b": 280.67682, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "rated collections of content templates by extracting the most", "bbox": {"l": 308.862, "t": 283.72524999999996, "r": 545.11505, "b": 292.63181, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "frequently used terms out of non-synthetic datasets (e.g.", "bbox": {"l": 308.862, "t": 295.68124, "r": 545.11511, "b": 304.5878000000001, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "PubTabNet, FinTabNet, etc.).", "bbox": {"l": 308.862, "t": 307.63623, "r": 425.69348, "b": 316.54279, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "2.", "bbox": {"l": 320.81699, "t": 320.35022, "r": 328.4949, "b": 329.25677, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "Generate table structures: The structure of each syn-", "bbox": {"l": 331.05423, "t": 320.35022, "r": 545.11499, "b": 329.25677, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "thetic dataset assumes a horizontal table header which po-", "bbox": {"l": 308.862, "t": 332.30521000000005, "r": 545.11517, "b": 341.21176, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "tentially spans over multiple rows and a table body that", "bbox": {"l": 308.862, "t": 344.26018999999997, "r": 545.11505, "b": 353.16675, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "may contain a combination of row spans and column spans.", "bbox": {"l": 308.862, "t": 356.21619, "r": 545.11511, "b": 365.12273999999996, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "However, spans are not allowed to cross the header - body", "bbox": {"l": 308.862, "t": 368.17117, "r": 545.11511, "b": 377.07773, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "boundary. The table structure is described by the parame-", "bbox": {"l": 308.862, "t": 380.12616, "r": 545.11499, "b": 389.03271, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "ters: Total number of table rows and columns, number of", "bbox": {"l": 308.862, "t": 392.08115, "r": 545.11517, "b": 400.98769999999996, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "header rows, type of spans (header only spans, row only", "bbox": {"l": 308.862, "t": 404.03613000000007, "r": 545.11511, "b": 412.94269, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "spans, column only spans, both row and column spans),", "bbox": {"l": 308.862, "t": 415.99112, "r": 545.11499, "b": 424.89767, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "maximum span size and the ratio of the table area covered", "bbox": {"l": 308.862, "t": 427.94711, "r": 545.11517, "b": 436.85367, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "by spans.", "bbox": {"l": 308.862, "t": 439.9021, "r": 345.94278, "b": 448.80865, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "3.", "bbox": {"l": 320.81699, "t": 452.61609, "r": 328.30341, "b": 461.52264, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "Generate content: Based on the dataset", "bbox": {"l": 330.79889, "t": 452.61609, "r": 485.75772000000006, "b": 461.52264, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "theme", "bbox": {"l": 488.073, "t": 452.70575, "r": 511.86368, "b": 461.29352, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": ", a set of", "bbox": {"l": 511.86301, "t": 452.61609, "r": 545.10815, "b": 461.52264, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "suitable content templates is chosen first. Then, this content", "bbox": {"l": 308.862, "t": 464.57108, "r": 545.11505, "b": 473.47763, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "can be combined with purely random text to produce the", "bbox": {"l": 308.862, "t": 476.52707, "r": 545.11517, "b": 485.43362, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "synthetic content.", "bbox": {"l": 308.862, "t": 488.48206, "r": 379.14816, "b": 497.38861, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "4.", "bbox": {"l": 320.81699, "t": 501.19604, "r": 328.66177, "b": 510.1026, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Apply styling templates: Depending on the domain", "bbox": {"l": 331.2767, "t": 501.19604, "r": 545.11493, "b": 510.1026, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "of the synthetic dataset, a set of styling templates is first", "bbox": {"l": 308.862, "t": 513.15103, "r": 545.1153, "b": 522.05759, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "manually selected.", "bbox": {"l": 308.862, "t": 525.10703, "r": 384.29883, "b": 534.01358, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "Then, a style is randomly selected to", "bbox": {"l": 391.25272, "t": 525.10703, "r": 545.11511, "b": 534.01358, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "format the appearance of the synthesized table.", "bbox": {"l": 308.862, "t": 537.06203, "r": 496.15897000000007, "b": 545.96858, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "5.", "bbox": {"l": 320.81699, "t": 549.77603, "r": 328.28894, "b": 558.68259, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Render the complete tables: The synthetic table is", "bbox": {"l": 335.40222, "t": 549.77603, "r": 545.11499, "b": 558.68259, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "finally rendered by a web browser engine to generate the", "bbox": {"l": 308.862, "t": 561.73103, "r": 545.11517, "b": 570.63759, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "bounding boxes for each table cell. A batching technique is", "bbox": {"l": 308.862, "t": 573.68604, "r": 545.11511, "b": 582.59259, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "utilized to optimize the runtime overhead of the rendering", "bbox": {"l": 308.862, "t": 585.64203, "r": 545.11505, "b": 594.54858, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "process.", "bbox": {"l": 308.862, "t": 597.59703, "r": 341.2305, "b": 606.50359, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "2.", "bbox": {"l": 308.862, "t": 622.2905900000001, "r": 316.76675, "b": 633.03831, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "Prediction post-processing for PDF docu-", "bbox": {"l": 327.30643, "t": 622.2905900000001, "r": 545.10876, "b": 633.03831, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "ments", "bbox": {"l": 326.79501, "t": 636.2385899999999, "r": 357.34055, "b": 646.98631, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "Although TableFormer can predict the table structure and", "bbox": {"l": 320.81702, "t": 657.42104, "r": 545.11499, "b": 666.3276, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "the bounding boxes for tables recognized inside PDF docu-", "bbox": {"l": 308.86203, "t": 669.37604, "r": 545.11511, "b": 678.2826, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "ments, this is not enough when a full reconstruction of the", "bbox": {"l": 308.86203, "t": 681.33104, "r": 545.11517, "b": 690.2376, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "original table is required. This happens mainly due the fol-", "bbox": {"l": 308.86203, "t": 693.286041, "r": 545.11505, "b": 702.1926040000001, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "lowing reasons:", "bbox": {"l": 308.86203, "t": 705.242035, "r": 371.42719, "b": 714.148605, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "11", "bbox": {"l": 292.63104, "t": 734.1330379999999, "r": 302.59363, "b": 743.0396, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 18, "label": "section_header", "bbox": {"l": 132.842, "t": 110.57488999999998, "r": 465.37591999999995, "b": 135.53008999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.6497079730033875, "cells": [{"id": 0, "text": "TableFormer: Table Structure Understanding with Transformers", "bbox": {"l": 132.842, "t": 110.57488999999998, "r": 465.37591999999995, "b": 121.32263, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Supplementary Material", "bbox": {"l": 220.18399, "t": 122.25982999999997, "r": 375.04269, "b": 135.53008999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "section_header", "bbox": {"l": 50.111984, "t": 161.16089, "r": 175.96437, "b": 171.90863000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9454860091209412, "cells": [{"id": 2, "text": "1.", "bbox": {"l": 50.111984, "t": 161.16089, "r": 57.089828, "b": 171.90863000000002, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Details on the datasets", "bbox": {"l": 66.393616, "t": 161.16089, "r": 175.96437, "b": 171.90863000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "section_header", "bbox": {"l": 50.111984, "t": 180.97931000000005, "r": 150.36401, "b": 190.83136000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9535645246505737, "cells": [{"id": 4, "text": "1.1.", "bbox": {"l": 50.111984, "t": 180.97931000000005, "r": 64.210808, "b": 190.83136000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Data preparation", "bbox": {"l": 73.610023, "t": 180.97931000000005, "r": 150.36401, "b": 190.83136000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 50.111984, "t": 199.92029000000002, "r": 286.36514, "b": 388.15482000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9864971041679382, "cells": [{"id": 6, "text": "As a first step of our data preparation process, we have", "bbox": {"l": 62.06698600000001, "t": 199.92029000000002, "r": 286.36496, "b": 208.82683999999995, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "calculated statistics over the datasets across the following", "bbox": {"l": 50.111984, "t": 211.87627999999995, "r": 286.36505, "b": 220.78283999999996, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "dimensions: (1) table size measured in the number of rows", "bbox": {"l": 50.111984, "t": 223.83130000000006, "r": 286.36514, "b": 232.73784999999998, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "and columns, (2) complexity of the table, (3) strictness of", "bbox": {"l": 50.111984, "t": 235.78632000000005, "r": 286.36508, "b": 244.69286999999997, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "the provided HTML structure and (4) completeness (i.e. no", "bbox": {"l": 50.111984, "t": 247.74132999999995, "r": 286.36505, "b": 256.64788999999996, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "omitted bounding boxes). A table is considered to be simple", "bbox": {"l": 50.111984, "t": 259.69635000000005, "r": 286.36505, "b": 268.60290999999995, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "if it does not contain row spans or column spans. Addition-", "bbox": {"l": 50.111984, "t": 271.65137000000004, "r": 286.36505, "b": 280.55792, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "ally, a table has a strict HTML structure if every row has the", "bbox": {"l": 50.111984, "t": 283.60736, "r": 286.36502, "b": 292.5139199999999, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "same number of columns after taking into account any row", "bbox": {"l": 50.111984, "t": 295.56235, "r": 286.36505, "b": 304.4689, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "or column spans. Therefore a strict HTML structure looks", "bbox": {"l": 50.111984, "t": 307.5173300000001, "r": 286.36508, "b": 316.42389, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "always rectangular. However, HTML is a lenient encoding", "bbox": {"l": 50.111984, "t": 319.47232, "r": 286.36505, "b": 328.3788799999999, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "format, i.e. tables with rows of different sizes might still", "bbox": {"l": 50.111984, "t": 331.42731000000003, "r": 286.36502, "b": 340.33386, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "be regarded as correct due to implicit display rules. These", "bbox": {"l": 50.111984, "t": 343.3833, "r": 286.36508, "b": 352.28986, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "implicit rules leave room for ambiguity, which we want to", "bbox": {"l": 50.111984, "t": 355.33829, "r": 286.36505, "b": 364.24484000000007, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "avoid. As such, we prefer to have \u201dstrict\u201d tables, i.e. tables", "bbox": {"l": 50.111984, "t": 367.29327, "r": 286.36508, "b": 376.19983, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "where every row has exactly the same length.", "bbox": {"l": 50.111984, "t": 379.24826, "r": 230.80364999999998, "b": 388.15482000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 50.111984, "t": 391.40527, "r": 286.36511, "b": 627.4597, "coord_origin": "TOPLEFT"}, "confidence": 0.9826022386550903, "cells": [{"id": 22, "text": "We have developed a technique that tries to derive a", "bbox": {"l": 62.06698600000001, "t": 391.40527, "r": 286.36499, "b": 400.31183, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "missing bounding box out of its neighbors. As a first step,", "bbox": {"l": 50.111984, "t": 403.36026, "r": 286.36508, "b": 412.26681999999994, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "we use the annotation data to generate the most fine-grained", "bbox": {"l": 50.111984, "t": 415.31525, "r": 286.36505, "b": 424.22180000000003, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "grid that covers the table structure. In case of strict HTML", "bbox": {"l": 50.111984, "t": 427.2712399999999, "r": 286.36505, "b": 436.1778, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "tables, all grid squares are associated with some table cell", "bbox": {"l": 50.111984, "t": 439.22623, "r": 286.36508, "b": 448.1327800000001, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "and in the presence of table spans a cell extends across mul-", "bbox": {"l": 50.111984, "t": 451.18121, "r": 286.36511, "b": 460.08777, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "tiple grid squares. When enough bounding boxes are known", "bbox": {"l": 50.111984, "t": 463.1362, "r": 286.36505, "b": 472.04276, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "for a rectangular table, it is possible to compute the geo-", "bbox": {"l": 50.111984, "t": 475.09119, "r": 286.36508, "b": 483.99774, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "metrical border lines between the grid rows and columns.", "bbox": {"l": 50.111984, "t": 487.04617, "r": 286.36502, "b": 495.95273, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Eventually this information is used to generate the missing", "bbox": {"l": 50.111984, "t": 499.00217, "r": 286.36511, "b": 507.90872, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "bounding boxes. Additionally, the existence of unused grid", "bbox": {"l": 50.111984, "t": 510.95715, "r": 286.36508, "b": 519.8637100000001, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "squares indicates that the table rows have unequal number", "bbox": {"l": 50.111984, "t": 522.91214, "r": 286.36508, "b": 531.8187, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "of columns and the overall structure is non-strict. The gen-", "bbox": {"l": 50.111984, "t": 534.86713, "r": 286.36505, "b": 543.7737, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "eration of missing bounding boxes for non-strict HTML ta-", "bbox": {"l": 50.111984, "t": 546.82214, "r": 286.36502, "b": 555.7287, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "bles is ambiguous and therefore quite challenging.", "bbox": {"l": 50.111984, "t": 558.77814, "r": 257.47351, "b": 567.68469, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "Thus,", "bbox": {"l": 263.94919, "t": 558.77814, "r": 286.36505, "b": 567.68469, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "we have decided to simply discard those tables. In case of", "bbox": {"l": 50.111984, "t": 570.73314, "r": 286.36508, "b": 579.63969, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "PubTabNet we have computed missing bounding boxes for", "bbox": {"l": 50.111984, "t": 582.68814, "r": 286.36511, "b": 591.5947, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "48% of the simple and 69% of the complex tables. Regard-", "bbox": {"l": 50.111984, "t": 594.64314, "r": 286.36511, "b": 603.5497, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "ing FinTabNet, 68% of the simple and 98% of the complex", "bbox": {"l": 50.111984, "t": 606.5981400000001, "r": 286.36505, "b": 615.5047, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "tables require the generation of bounding boxes.", "bbox": {"l": 50.111984, "t": 618.55315, "r": 242.2606, "b": 627.4597, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 50.111984, "t": 630.71014, "r": 286.36496, "b": 651.57269, "coord_origin": "TOPLEFT"}, "confidence": 0.9335852265357971, "cells": [{"id": 43, "text": "Figure 7 illustrates the distribution of the tables across", "bbox": {"l": 62.06698600000001, "t": 630.71014, "r": 286.36496, "b": 639.6167, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "different dimensions per dataset.", "bbox": {"l": 50.111984, "t": 642.66614, "r": 179.90472, "b": 651.57269, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "section_header", "bbox": {"l": 50.111984, "t": 662.39014, "r": 153.60785, "b": 672.24219, "coord_origin": "TOPLEFT"}, "confidence": 0.9515743255615234, "cells": [{"id": 45, "text": "1.2.", "bbox": {"l": 50.111984, "t": 662.39014, "r": 64.297272, "b": 672.24219, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "Synthetic datasets", "bbox": {"l": 73.754135, "t": 662.39014, "r": 153.60785, "b": 672.24219, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 50.111984, "t": 681.33113, "r": 286.36505, "b": 714.147705, "coord_origin": "TOPLEFT"}, "confidence": 0.978333592414856, "cells": [{"id": 47, "text": "Aiming to train and evaluate our models in a broader", "bbox": {"l": 62.06698600000001, "t": 681.33113, "r": 286.36493, "b": 690.2377, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "spectrum of table data we have synthesized four types of", "bbox": {"l": 50.111984, "t": 693.2861330000001, "r": 286.36505, "b": 702.1927029999999, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "datasets.", "bbox": {"l": 50.111984, "t": 705.241135, "r": 84.144226, "b": 714.147705, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Each one contains tables with different appear-", "bbox": {"l": 91.237595, "t": 705.241135, "r": 286.36505, "b": 714.147705, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "text", "bbox": {"l": 308.862, "t": 162.65515000000005, "r": 545.11511, "b": 207.42773, "coord_origin": "TOPLEFT"}, "confidence": 0.9596062302589417, "cells": [{"id": 51, "text": "ances in regard to their size, structure, style and content.", "bbox": {"l": 308.862, "t": 162.65515000000005, "r": 545.11511, "b": 171.56170999999995, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Every synthetic dataset contains 150k examples, summing", "bbox": {"l": 308.862, "t": 174.61017000000004, "r": 545.11511, "b": 183.51671999999996, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "up to 600k synthetic examples. All datasets are divided into", "bbox": {"l": 308.862, "t": 186.56519000000003, "r": 545.11511, "b": 195.47173999999995, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "Train, Test and Val splits (80%, 10%, 10%).", "bbox": {"l": 308.862, "t": 198.52117999999996, "r": 484.07434, "b": 207.42773, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 308.862, "t": 211.23517000000004, "r": 545.11505, "b": 232.09673999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9261794090270996, "cells": [{"id": 55, "text": "The process of generating a synthetic dataset can be de-", "bbox": {"l": 320.81699, "t": 211.23517000000004, "r": 545.11505, "b": 220.14171999999996, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "composed into the following steps:", "bbox": {"l": 308.862, "t": 223.19019000000003, "r": 448.08939, "b": 232.09673999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "list_item", "bbox": {"l": 308.862, "t": 235.90521, "r": 545.11511, "b": 316.54279, "coord_origin": "TOPLEFT"}, "confidence": 0.9642950296401978, "cells": [{"id": 57, "text": "1.", "bbox": {"l": 320.81699, "t": 235.90521, "r": 328.28894, "b": 244.81177000000002, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Prepare styling and content templates: The styling", "bbox": {"l": 335.38232, "t": 235.90521, "r": 545.11499, "b": 244.81177000000002, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "templates have been manually designed and organized into", "bbox": {"l": 308.862, "t": 247.86023, "r": 545.11511, "b": 256.76678000000004, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "groups of scope specific appearances (e.g. financial data,", "bbox": {"l": 308.862, "t": 259.81525, "r": 545.11511, "b": 268.72180000000003, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "marketing data, etc.)", "bbox": {"l": 308.862, "t": 271.77026, "r": 393.3847, "b": 280.67682, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "Additionally, we have prepared cu-", "bbox": {"l": 400.11942, "t": 271.77026, "r": 545.11511, "b": 280.67682, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "rated collections of content templates by extracting the most", "bbox": {"l": 308.862, "t": 283.72524999999996, "r": 545.11505, "b": 292.63181, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "frequently used terms out of non-synthetic datasets (e.g.", "bbox": {"l": 308.862, "t": 295.68124, "r": 545.11511, "b": 304.5878000000001, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "PubTabNet, FinTabNet, etc.).", "bbox": {"l": 308.862, "t": 307.63623, "r": 425.69348, "b": 316.54279, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "list_item", "bbox": {"l": 308.862, "t": 320.35022, "r": 545.11517, "b": 448.80865, "coord_origin": "TOPLEFT"}, "confidence": 0.9699996113777161, "cells": [{"id": 66, "text": "2.", "bbox": {"l": 320.81699, "t": 320.35022, "r": 328.4949, "b": 329.25677, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "Generate table structures: The structure of each syn-", "bbox": {"l": 331.05423, "t": 320.35022, "r": 545.11499, "b": 329.25677, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "thetic dataset assumes a horizontal table header which po-", "bbox": {"l": 308.862, "t": 332.30521000000005, "r": 545.11517, "b": 341.21176, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "tentially spans over multiple rows and a table body that", "bbox": {"l": 308.862, "t": 344.26018999999997, "r": 545.11505, "b": 353.16675, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "may contain a combination of row spans and column spans.", "bbox": {"l": 308.862, "t": 356.21619, "r": 545.11511, "b": 365.12273999999996, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "However, spans are not allowed to cross the header - body", "bbox": {"l": 308.862, "t": 368.17117, "r": 545.11511, "b": 377.07773, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "boundary. The table structure is described by the parame-", "bbox": {"l": 308.862, "t": 380.12616, "r": 545.11499, "b": 389.03271, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "ters: Total number of table rows and columns, number of", "bbox": {"l": 308.862, "t": 392.08115, "r": 545.11517, "b": 400.98769999999996, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "header rows, type of spans (header only spans, row only", "bbox": {"l": 308.862, "t": 404.03613000000007, "r": 545.11511, "b": 412.94269, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "spans, column only spans, both row and column spans),", "bbox": {"l": 308.862, "t": 415.99112, "r": 545.11499, "b": 424.89767, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "maximum span size and the ratio of the table area covered", "bbox": {"l": 308.862, "t": 427.94711, "r": 545.11517, "b": 436.85367, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "by spans.", "bbox": {"l": 308.862, "t": 439.9021, "r": 345.94278, "b": 448.80865, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "list_item", "bbox": {"l": 308.862, "t": 452.61609, "r": 545.11517, "b": 497.38861, "coord_origin": "TOPLEFT"}, "confidence": 0.9568929672241211, "cells": [{"id": 78, "text": "3.", "bbox": {"l": 320.81699, "t": 452.61609, "r": 328.30341, "b": 461.52264, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "Generate content: Based on the dataset", "bbox": {"l": 330.79889, "t": 452.61609, "r": 485.75772000000006, "b": 461.52264, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "theme", "bbox": {"l": 488.073, "t": 452.70575, "r": 511.86368, "b": 461.29352, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": ", a set of", "bbox": {"l": 511.86301, "t": 452.61609, "r": 545.10815, "b": 461.52264, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "suitable content templates is chosen first. Then, this content", "bbox": {"l": 308.862, "t": 464.57108, "r": 545.11505, "b": 473.47763, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "can be combined with purely random text to produce the", "bbox": {"l": 308.862, "t": 476.52707, "r": 545.11517, "b": 485.43362, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "synthetic content.", "bbox": {"l": 308.862, "t": 488.48206, "r": 379.14816, "b": 497.38861, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "list_item", "bbox": {"l": 308.862, "t": 501.19604, "r": 545.1153, "b": 545.96858, "coord_origin": "TOPLEFT"}, "confidence": 0.9710659980773926, "cells": [{"id": 85, "text": "4.", "bbox": {"l": 320.81699, "t": 501.19604, "r": 328.66177, "b": 510.1026, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Apply styling templates: Depending on the domain", "bbox": {"l": 331.2767, "t": 501.19604, "r": 545.11493, "b": 510.1026, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "of the synthetic dataset, a set of styling templates is first", "bbox": {"l": 308.862, "t": 513.15103, "r": 545.1153, "b": 522.05759, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "manually selected.", "bbox": {"l": 308.862, "t": 525.10703, "r": 384.29883, "b": 534.01358, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "Then, a style is randomly selected to", "bbox": {"l": 391.25272, "t": 525.10703, "r": 545.11511, "b": 534.01358, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "format the appearance of the synthesized table.", "bbox": {"l": 308.862, "t": 537.06203, "r": 496.15897000000007, "b": 545.96858, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "list_item", "bbox": {"l": 308.862, "t": 549.77603, "r": 545.11517, "b": 606.50359, "coord_origin": "TOPLEFT"}, "confidence": 0.9778757095336914, "cells": [{"id": 91, "text": "5.", "bbox": {"l": 320.81699, "t": 549.77603, "r": 328.28894, "b": 558.68259, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Render the complete tables: The synthetic table is", "bbox": {"l": 335.40222, "t": 549.77603, "r": 545.11499, "b": 558.68259, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "finally rendered by a web browser engine to generate the", "bbox": {"l": 308.862, "t": 561.73103, "r": 545.11517, "b": 570.63759, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "bounding boxes for each table cell. A batching technique is", "bbox": {"l": 308.862, "t": 573.68604, "r": 545.11511, "b": 582.59259, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "utilized to optimize the runtime overhead of the rendering", "bbox": {"l": 308.862, "t": 585.64203, "r": 545.11505, "b": 594.54858, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "process.", "bbox": {"l": 308.862, "t": 597.59703, "r": 341.2305, "b": 606.50359, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "section_header", "bbox": {"l": 308.862, "t": 622.2905900000001, "r": 545.10876, "b": 646.98631, "coord_origin": "TOPLEFT"}, "confidence": 0.954940915107727, "cells": [{"id": 97, "text": "2.", "bbox": {"l": 308.862, "t": 622.2905900000001, "r": 316.76675, "b": 633.03831, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "Prediction post-processing for PDF docu-", "bbox": {"l": 327.30643, "t": 622.2905900000001, "r": 545.10876, "b": 633.03831, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "ments", "bbox": {"l": 326.79501, "t": 636.2385899999999, "r": 357.34055, "b": 646.98631, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 308.86203, "t": 657.42104, "r": 545.11517, "b": 714.148605, "coord_origin": "TOPLEFT"}, "confidence": 0.9829329252243042, "cells": [{"id": 100, "text": "Although TableFormer can predict the table structure and", "bbox": {"l": 320.81702, "t": 657.42104, "r": 545.11499, "b": 666.3276, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "the bounding boxes for tables recognized inside PDF docu-", "bbox": {"l": 308.86203, "t": 669.37604, "r": 545.11511, "b": 678.2826, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "ments, this is not enough when a full reconstruction of the", "bbox": {"l": 308.86203, "t": 681.33104, "r": 545.11517, "b": 690.2376, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "original table is required. This happens mainly due the fol-", "bbox": {"l": 308.86203, "t": 693.286041, "r": 545.11505, "b": 702.1926040000001, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "lowing reasons:", "bbox": {"l": 308.86203, "t": 705.242035, "r": 371.42719, "b": 714.148605, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "page_footer", "bbox": {"l": 292.63104, "t": 734.1330379999999, "r": 302.59363, "b": 743.0396, "coord_origin": "TOPLEFT"}, "confidence": 0.8986662030220032, "cells": [{"id": 105, "text": "11", "bbox": {"l": 292.63104, "t": 734.1330379999999, "r": 302.59363, "b": 743.0396, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "section_header", "id": 18, "page_no": 10, "cluster": {"id": 18, "label": "section_header", "bbox": {"l": 132.842, "t": 110.57488999999998, "r": 465.37591999999995, "b": 135.53008999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.6497079730033875, "cells": [{"id": 0, "text": "TableFormer: Table Structure Understanding with Transformers", "bbox": {"l": 132.842, "t": 110.57488999999998, "r": 465.37591999999995, "b": 121.32263, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Supplementary Material", "bbox": {"l": 220.18399, "t": 122.25982999999997, "r": 375.04269, "b": 135.53008999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "TableFormer: Table Structure Understanding with Transformers Supplementary Material"}, {"label": "section_header", "id": 13, "page_no": 10, "cluster": {"id": 13, "label": "section_header", "bbox": {"l": 50.111984, "t": 161.16089, "r": 175.96437, "b": 171.90863000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9454860091209412, "cells": [{"id": 2, "text": "1.", "bbox": {"l": 50.111984, "t": 161.16089, "r": 57.089828, "b": 171.90863000000002, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Details on the datasets", "bbox": {"l": 66.393616, "t": 161.16089, "r": 175.96437, "b": 171.90863000000002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1. Details on the datasets"}, {"label": "section_header", "id": 11, "page_no": 10, "cluster": {"id": 11, "label": "section_header", "bbox": {"l": 50.111984, "t": 180.97931000000005, "r": 150.36401, "b": 190.83136000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9535645246505737, "cells": [{"id": 4, "text": "1.1.", "bbox": {"l": 50.111984, "t": 180.97931000000005, "r": 64.210808, "b": 190.83136000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Data preparation", "bbox": {"l": 73.610023, "t": 180.97931000000005, "r": 150.36401, "b": 190.83136000000002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1.1. Data preparation"}, {"label": "text", "id": 0, "page_no": 10, "cluster": {"id": 0, "label": "text", "bbox": {"l": 50.111984, "t": 199.92029000000002, "r": 286.36514, "b": 388.15482000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9864971041679382, "cells": [{"id": 6, "text": "As a first step of our data preparation process, we have", "bbox": {"l": 62.06698600000001, "t": 199.92029000000002, "r": 286.36496, "b": 208.82683999999995, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "calculated statistics over the datasets across the following", "bbox": {"l": 50.111984, "t": 211.87627999999995, "r": 286.36505, "b": 220.78283999999996, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "dimensions: (1) table size measured in the number of rows", "bbox": {"l": 50.111984, "t": 223.83130000000006, "r": 286.36514, "b": 232.73784999999998, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "and columns, (2) complexity of the table, (3) strictness of", "bbox": {"l": 50.111984, "t": 235.78632000000005, "r": 286.36508, "b": 244.69286999999997, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "the provided HTML structure and (4) completeness (i.e. no", "bbox": {"l": 50.111984, "t": 247.74132999999995, "r": 286.36505, "b": 256.64788999999996, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "omitted bounding boxes). A table is considered to be simple", "bbox": {"l": 50.111984, "t": 259.69635000000005, "r": 286.36505, "b": 268.60290999999995, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "if it does not contain row spans or column spans. Addition-", "bbox": {"l": 50.111984, "t": 271.65137000000004, "r": 286.36505, "b": 280.55792, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "ally, a table has a strict HTML structure if every row has the", "bbox": {"l": 50.111984, "t": 283.60736, "r": 286.36502, "b": 292.5139199999999, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "same number of columns after taking into account any row", "bbox": {"l": 50.111984, "t": 295.56235, "r": 286.36505, "b": 304.4689, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "or column spans. Therefore a strict HTML structure looks", "bbox": {"l": 50.111984, "t": 307.5173300000001, "r": 286.36508, "b": 316.42389, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "always rectangular. However, HTML is a lenient encoding", "bbox": {"l": 50.111984, "t": 319.47232, "r": 286.36505, "b": 328.3788799999999, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "format, i.e. tables with rows of different sizes might still", "bbox": {"l": 50.111984, "t": 331.42731000000003, "r": 286.36502, "b": 340.33386, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "be regarded as correct due to implicit display rules. These", "bbox": {"l": 50.111984, "t": 343.3833, "r": 286.36508, "b": 352.28986, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "implicit rules leave room for ambiguity, which we want to", "bbox": {"l": 50.111984, "t": 355.33829, "r": 286.36505, "b": 364.24484000000007, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "avoid. As such, we prefer to have \u201dstrict\u201d tables, i.e. tables", "bbox": {"l": 50.111984, "t": 367.29327, "r": 286.36508, "b": 376.19983, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "where every row has exactly the same length.", "bbox": {"l": 50.111984, "t": 379.24826, "r": 230.80364999999998, "b": 388.15482000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "As a first step of our data preparation process, we have calculated statistics over the datasets across the following dimensions: (1) table size measured in the number of rows and columns, (2) complexity of the table, (3) strictness of the provided HTML structure and (4) completeness (i.e. no omitted bounding boxes). A table is considered to be simple if it does not contain row spans or column spans. Additionally, a table has a strict HTML structure if every row has the same number of columns after taking into account any row or column spans. Therefore a strict HTML structure looks always rectangular. However, HTML is a lenient encoding format, i.e. tables with rows of different sizes might still be regarded as correct due to implicit display rules. These implicit rules leave room for ambiguity, which we want to avoid. As such, we prefer to have \u201dstrict\u201d tables, i.e. tables where every row has exactly the same length."}, {"label": "text", "id": 2, "page_no": 10, "cluster": {"id": 2, "label": "text", "bbox": {"l": 50.111984, "t": 391.40527, "r": 286.36511, "b": 627.4597, "coord_origin": "TOPLEFT"}, "confidence": 0.9826022386550903, "cells": [{"id": 22, "text": "We have developed a technique that tries to derive a", "bbox": {"l": 62.06698600000001, "t": 391.40527, "r": 286.36499, "b": 400.31183, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "missing bounding box out of its neighbors. As a first step,", "bbox": {"l": 50.111984, "t": 403.36026, "r": 286.36508, "b": 412.26681999999994, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "we use the annotation data to generate the most fine-grained", "bbox": {"l": 50.111984, "t": 415.31525, "r": 286.36505, "b": 424.22180000000003, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "grid that covers the table structure. In case of strict HTML", "bbox": {"l": 50.111984, "t": 427.2712399999999, "r": 286.36505, "b": 436.1778, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "tables, all grid squares are associated with some table cell", "bbox": {"l": 50.111984, "t": 439.22623, "r": 286.36508, "b": 448.1327800000001, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "and in the presence of table spans a cell extends across mul-", "bbox": {"l": 50.111984, "t": 451.18121, "r": 286.36511, "b": 460.08777, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "tiple grid squares. When enough bounding boxes are known", "bbox": {"l": 50.111984, "t": 463.1362, "r": 286.36505, "b": 472.04276, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "for a rectangular table, it is possible to compute the geo-", "bbox": {"l": 50.111984, "t": 475.09119, "r": 286.36508, "b": 483.99774, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "metrical border lines between the grid rows and columns.", "bbox": {"l": 50.111984, "t": 487.04617, "r": 286.36502, "b": 495.95273, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Eventually this information is used to generate the missing", "bbox": {"l": 50.111984, "t": 499.00217, "r": 286.36511, "b": 507.90872, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "bounding boxes. Additionally, the existence of unused grid", "bbox": {"l": 50.111984, "t": 510.95715, "r": 286.36508, "b": 519.8637100000001, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "squares indicates that the table rows have unequal number", "bbox": {"l": 50.111984, "t": 522.91214, "r": 286.36508, "b": 531.8187, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "of columns and the overall structure is non-strict. The gen-", "bbox": {"l": 50.111984, "t": 534.86713, "r": 286.36505, "b": 543.7737, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "eration of missing bounding boxes for non-strict HTML ta-", "bbox": {"l": 50.111984, "t": 546.82214, "r": 286.36502, "b": 555.7287, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "bles is ambiguous and therefore quite challenging.", "bbox": {"l": 50.111984, "t": 558.77814, "r": 257.47351, "b": 567.68469, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "Thus,", "bbox": {"l": 263.94919, "t": 558.77814, "r": 286.36505, "b": 567.68469, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "we have decided to simply discard those tables. In case of", "bbox": {"l": 50.111984, "t": 570.73314, "r": 286.36508, "b": 579.63969, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "PubTabNet we have computed missing bounding boxes for", "bbox": {"l": 50.111984, "t": 582.68814, "r": 286.36511, "b": 591.5947, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "48% of the simple and 69% of the complex tables. Regard-", "bbox": {"l": 50.111984, "t": 594.64314, "r": 286.36511, "b": 603.5497, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "ing FinTabNet, 68% of the simple and 98% of the complex", "bbox": {"l": 50.111984, "t": 606.5981400000001, "r": 286.36505, "b": 615.5047, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "tables require the generation of bounding boxes.", "bbox": {"l": 50.111984, "t": 618.55315, "r": 242.2606, "b": 627.4597, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "We have developed a technique that tries to derive a missing bounding box out of its neighbors. As a first step, we use the annotation data to generate the most fine-grained grid that covers the table structure. In case of strict HTML tables, all grid squares are associated with some table cell and in the presence of table spans a cell extends across multiple grid squares. When enough bounding boxes are known for a rectangular table, it is possible to compute the geometrical border lines between the grid rows and columns. Eventually this information is used to generate the missing bounding boxes. Additionally, the existence of unused grid squares indicates that the table rows have unequal number of columns and the overall structure is non-strict. The generation of missing bounding boxes for non-strict HTML tables is ambiguous and therefore quite challenging. Thus, we have decided to simply discard those tables. In case of PubTabNet we have computed missing bounding boxes for 48% of the simple and 69% of the complex tables. Regarding FinTabNet, 68% of the simple and 98% of the complex tables require the generation of bounding boxes."}, {"label": "text", "id": 14, "page_no": 10, "cluster": {"id": 14, "label": "text", "bbox": {"l": 50.111984, "t": 630.71014, "r": 286.36496, "b": 651.57269, "coord_origin": "TOPLEFT"}, "confidence": 0.9335852265357971, "cells": [{"id": 43, "text": "Figure 7 illustrates the distribution of the tables across", "bbox": {"l": 62.06698600000001, "t": 630.71014, "r": 286.36496, "b": 639.6167, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "different dimensions per dataset.", "bbox": {"l": 50.111984, "t": 642.66614, "r": 179.90472, "b": 651.57269, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 7 illustrates the distribution of the tables across different dimensions per dataset."}, {"label": "section_header", "id": 12, "page_no": 10, "cluster": {"id": 12, "label": "section_header", "bbox": {"l": 50.111984, "t": 662.39014, "r": 153.60785, "b": 672.24219, "coord_origin": "TOPLEFT"}, "confidence": 0.9515743255615234, "cells": [{"id": 45, "text": "1.2.", "bbox": {"l": 50.111984, "t": 662.39014, "r": 64.297272, "b": 672.24219, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "Synthetic datasets", "bbox": {"l": 73.754135, "t": 662.39014, "r": 153.60785, "b": 672.24219, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1.2. Synthetic datasets"}, {"label": "text", "id": 3, "page_no": 10, "cluster": {"id": 3, "label": "text", "bbox": {"l": 50.111984, "t": 681.33113, "r": 286.36505, "b": 714.147705, "coord_origin": "TOPLEFT"}, "confidence": 0.978333592414856, "cells": [{"id": 47, "text": "Aiming to train and evaluate our models in a broader", "bbox": {"l": 62.06698600000001, "t": 681.33113, "r": 286.36493, "b": 690.2377, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "spectrum of table data we have synthesized four types of", "bbox": {"l": 50.111984, "t": 693.2861330000001, "r": 286.36505, "b": 702.1927029999999, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "datasets.", "bbox": {"l": 50.111984, "t": 705.241135, "r": 84.144226, "b": 714.147705, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Each one contains tables with different appear-", "bbox": {"l": 91.237595, "t": 705.241135, "r": 286.36505, "b": 714.147705, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Aiming to train and evaluate our models in a broader spectrum of table data we have synthesized four types of datasets. Each one contains tables with different appear-"}, {"label": "text", "id": 8, "page_no": 10, "cluster": {"id": 8, "label": "text", "bbox": {"l": 308.862, "t": 162.65515000000005, "r": 545.11511, "b": 207.42773, "coord_origin": "TOPLEFT"}, "confidence": 0.9596062302589417, "cells": [{"id": 51, "text": "ances in regard to their size, structure, style and content.", "bbox": {"l": 308.862, "t": 162.65515000000005, "r": 545.11511, "b": 171.56170999999995, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Every synthetic dataset contains 150k examples, summing", "bbox": {"l": 308.862, "t": 174.61017000000004, "r": 545.11511, "b": 183.51671999999996, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "up to 600k synthetic examples. All datasets are divided into", "bbox": {"l": 308.862, "t": 186.56519000000003, "r": 545.11511, "b": 195.47173999999995, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "Train, Test and Val splits (80%, 10%, 10%).", "bbox": {"l": 308.862, "t": 198.52117999999996, "r": 484.07434, "b": 207.42773, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "ances in regard to their size, structure, style and content. Every synthetic dataset contains 150k examples, summing up to 600k synthetic examples. All datasets are divided into Train, Test and Val splits (80%, 10%, 10%)."}, {"label": "text", "id": 15, "page_no": 10, "cluster": {"id": 15, "label": "text", "bbox": {"l": 308.862, "t": 211.23517000000004, "r": 545.11505, "b": 232.09673999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9261794090270996, "cells": [{"id": 55, "text": "The process of generating a synthetic dataset can be de-", "bbox": {"l": 320.81699, "t": 211.23517000000004, "r": 545.11505, "b": 220.14171999999996, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "composed into the following steps:", "bbox": {"l": 308.862, "t": 223.19019000000003, "r": 448.08939, "b": 232.09673999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The process of generating a synthetic dataset can be decomposed into the following steps:"}, {"label": "list_item", "id": 7, "page_no": 10, "cluster": {"id": 7, "label": "list_item", "bbox": {"l": 308.862, "t": 235.90521, "r": 545.11511, "b": 316.54279, "coord_origin": "TOPLEFT"}, "confidence": 0.9642950296401978, "cells": [{"id": 57, "text": "1.", "bbox": {"l": 320.81699, "t": 235.90521, "r": 328.28894, "b": 244.81177000000002, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Prepare styling and content templates: The styling", "bbox": {"l": 335.38232, "t": 235.90521, "r": 545.11499, "b": 244.81177000000002, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "templates have been manually designed and organized into", "bbox": {"l": 308.862, "t": 247.86023, "r": 545.11511, "b": 256.76678000000004, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "groups of scope specific appearances (e.g. financial data,", "bbox": {"l": 308.862, "t": 259.81525, "r": 545.11511, "b": 268.72180000000003, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "marketing data, etc.)", "bbox": {"l": 308.862, "t": 271.77026, "r": 393.3847, "b": 280.67682, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "Additionally, we have prepared cu-", "bbox": {"l": 400.11942, "t": 271.77026, "r": 545.11511, "b": 280.67682, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "rated collections of content templates by extracting the most", "bbox": {"l": 308.862, "t": 283.72524999999996, "r": 545.11505, "b": 292.63181, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "frequently used terms out of non-synthetic datasets (e.g.", "bbox": {"l": 308.862, "t": 295.68124, "r": 545.11511, "b": 304.5878000000001, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "PubTabNet, FinTabNet, etc.).", "bbox": {"l": 308.862, "t": 307.63623, "r": 425.69348, "b": 316.54279, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1. Prepare styling and content templates: The styling templates have been manually designed and organized into groups of scope specific appearances (e.g. financial data, marketing data, etc.) Additionally, we have prepared curated collections of content templates by extracting the most frequently used terms out of non-synthetic datasets (e.g. PubTabNet, FinTabNet, etc.)."}, {"label": "list_item", "id": 6, "page_no": 10, "cluster": {"id": 6, "label": "list_item", "bbox": {"l": 308.862, "t": 320.35022, "r": 545.11517, "b": 448.80865, "coord_origin": "TOPLEFT"}, "confidence": 0.9699996113777161, "cells": [{"id": 66, "text": "2.", "bbox": {"l": 320.81699, "t": 320.35022, "r": 328.4949, "b": 329.25677, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "Generate table structures: The structure of each syn-", "bbox": {"l": 331.05423, "t": 320.35022, "r": 545.11499, "b": 329.25677, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "thetic dataset assumes a horizontal table header which po-", "bbox": {"l": 308.862, "t": 332.30521000000005, "r": 545.11517, "b": 341.21176, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "tentially spans over multiple rows and a table body that", "bbox": {"l": 308.862, "t": 344.26018999999997, "r": 545.11505, "b": 353.16675, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "may contain a combination of row spans and column spans.", "bbox": {"l": 308.862, "t": 356.21619, "r": 545.11511, "b": 365.12273999999996, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "However, spans are not allowed to cross the header - body", "bbox": {"l": 308.862, "t": 368.17117, "r": 545.11511, "b": 377.07773, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "boundary. The table structure is described by the parame-", "bbox": {"l": 308.862, "t": 380.12616, "r": 545.11499, "b": 389.03271, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "ters: Total number of table rows and columns, number of", "bbox": {"l": 308.862, "t": 392.08115, "r": 545.11517, "b": 400.98769999999996, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "header rows, type of spans (header only spans, row only", "bbox": {"l": 308.862, "t": 404.03613000000007, "r": 545.11511, "b": 412.94269, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "spans, column only spans, both row and column spans),", "bbox": {"l": 308.862, "t": 415.99112, "r": 545.11499, "b": 424.89767, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "maximum span size and the ratio of the table area covered", "bbox": {"l": 308.862, "t": 427.94711, "r": 545.11517, "b": 436.85367, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "by spans.", "bbox": {"l": 308.862, "t": 439.9021, "r": 345.94278, "b": 448.80865, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2. Generate table structures: The structure of each synthetic dataset assumes a horizontal table header which potentially spans over multiple rows and a table body that may contain a combination of row spans and column spans. However, spans are not allowed to cross the header - body boundary. The table structure is described by the parameters: Total number of table rows and columns, number of header rows, type of spans (header only spans, row only spans, column only spans, both row and column spans), maximum span size and the ratio of the table area covered by spans."}, {"label": "list_item", "id": 9, "page_no": 10, "cluster": {"id": 9, "label": "list_item", "bbox": {"l": 308.862, "t": 452.61609, "r": 545.11517, "b": 497.38861, "coord_origin": "TOPLEFT"}, "confidence": 0.9568929672241211, "cells": [{"id": 78, "text": "3.", "bbox": {"l": 320.81699, "t": 452.61609, "r": 328.30341, "b": 461.52264, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "Generate content: Based on the dataset", "bbox": {"l": 330.79889, "t": 452.61609, "r": 485.75772000000006, "b": 461.52264, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "theme", "bbox": {"l": 488.073, "t": 452.70575, "r": 511.86368, "b": 461.29352, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": ", a set of", "bbox": {"l": 511.86301, "t": 452.61609, "r": 545.10815, "b": 461.52264, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "suitable content templates is chosen first. Then, this content", "bbox": {"l": 308.862, "t": 464.57108, "r": 545.11505, "b": 473.47763, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "can be combined with purely random text to produce the", "bbox": {"l": 308.862, "t": 476.52707, "r": 545.11517, "b": 485.43362, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "synthetic content.", "bbox": {"l": 308.862, "t": 488.48206, "r": 379.14816, "b": 497.38861, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3. Generate content: Based on the dataset theme , a set of suitable content templates is chosen first. Then, this content can be combined with purely random text to produce the synthetic content."}, {"label": "list_item", "id": 5, "page_no": 10, "cluster": {"id": 5, "label": "list_item", "bbox": {"l": 308.862, "t": 501.19604, "r": 545.1153, "b": 545.96858, "coord_origin": "TOPLEFT"}, "confidence": 0.9710659980773926, "cells": [{"id": 85, "text": "4.", "bbox": {"l": 320.81699, "t": 501.19604, "r": 328.66177, "b": 510.1026, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Apply styling templates: Depending on the domain", "bbox": {"l": 331.2767, "t": 501.19604, "r": 545.11493, "b": 510.1026, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "of the synthetic dataset, a set of styling templates is first", "bbox": {"l": 308.862, "t": 513.15103, "r": 545.1153, "b": 522.05759, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "manually selected.", "bbox": {"l": 308.862, "t": 525.10703, "r": 384.29883, "b": 534.01358, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "Then, a style is randomly selected to", "bbox": {"l": 391.25272, "t": 525.10703, "r": 545.11511, "b": 534.01358, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "format the appearance of the synthesized table.", "bbox": {"l": 308.862, "t": 537.06203, "r": 496.15897000000007, "b": 545.96858, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4. Apply styling templates: Depending on the domain of the synthetic dataset, a set of styling templates is first manually selected. Then, a style is randomly selected to format the appearance of the synthesized table."}, {"label": "list_item", "id": 4, "page_no": 10, "cluster": {"id": 4, "label": "list_item", "bbox": {"l": 308.862, "t": 549.77603, "r": 545.11517, "b": 606.50359, "coord_origin": "TOPLEFT"}, "confidence": 0.9778757095336914, "cells": [{"id": 91, "text": "5.", "bbox": {"l": 320.81699, "t": 549.77603, "r": 328.28894, "b": 558.68259, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Render the complete tables: The synthetic table is", "bbox": {"l": 335.40222, "t": 549.77603, "r": 545.11499, "b": 558.68259, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "finally rendered by a web browser engine to generate the", "bbox": {"l": 308.862, "t": 561.73103, "r": 545.11517, "b": 570.63759, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "bounding boxes for each table cell. A batching technique is", "bbox": {"l": 308.862, "t": 573.68604, "r": 545.11511, "b": 582.59259, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "utilized to optimize the runtime overhead of the rendering", "bbox": {"l": 308.862, "t": 585.64203, "r": 545.11505, "b": 594.54858, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "process.", "bbox": {"l": 308.862, "t": 597.59703, "r": 341.2305, "b": 606.50359, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5. Render the complete tables: The synthetic table is finally rendered by a web browser engine to generate the bounding boxes for each table cell. A batching technique is utilized to optimize the runtime overhead of the rendering process."}, {"label": "section_header", "id": 10, "page_no": 10, "cluster": {"id": 10, "label": "section_header", "bbox": {"l": 308.862, "t": 622.2905900000001, "r": 545.10876, "b": 646.98631, "coord_origin": "TOPLEFT"}, "confidence": 0.954940915107727, "cells": [{"id": 97, "text": "2.", "bbox": {"l": 308.862, "t": 622.2905900000001, "r": 316.76675, "b": 633.03831, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "Prediction post-processing for PDF docu-", "bbox": {"l": 327.30643, "t": 622.2905900000001, "r": 545.10876, "b": 633.03831, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "ments", "bbox": {"l": 326.79501, "t": 636.2385899999999, "r": 357.34055, "b": 646.98631, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2. Prediction post-processing for PDF documents"}, {"label": "text", "id": 1, "page_no": 10, "cluster": {"id": 1, "label": "text", "bbox": {"l": 308.86203, "t": 657.42104, "r": 545.11517, "b": 714.148605, "coord_origin": "TOPLEFT"}, "confidence": 0.9829329252243042, "cells": [{"id": 100, "text": "Although TableFormer can predict the table structure and", "bbox": {"l": 320.81702, "t": 657.42104, "r": 545.11499, "b": 666.3276, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "the bounding boxes for tables recognized inside PDF docu-", "bbox": {"l": 308.86203, "t": 669.37604, "r": 545.11511, "b": 678.2826, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "ments, this is not enough when a full reconstruction of the", "bbox": {"l": 308.86203, "t": 681.33104, "r": 545.11517, "b": 690.2376, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "original table is required. This happens mainly due the fol-", "bbox": {"l": 308.86203, "t": 693.286041, "r": 545.11505, "b": 702.1926040000001, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "lowing reasons:", "bbox": {"l": 308.86203, "t": 705.242035, "r": 371.42719, "b": 714.148605, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Although TableFormer can predict the table structure and the bounding boxes for tables recognized inside PDF documents, this is not enough when a full reconstruction of the original table is required. This happens mainly due the following reasons:"}, {"label": "page_footer", "id": 16, "page_no": 10, "cluster": {"id": 16, "label": "page_footer", "bbox": {"l": 292.63104, "t": 734.1330379999999, "r": 302.59363, "b": 743.0396, "coord_origin": "TOPLEFT"}, "confidence": 0.8986662030220032, "cells": [{"id": 105, "text": "11", "bbox": {"l": 292.63104, "t": 734.1330379999999, "r": 302.59363, "b": 743.0396, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "11"}], "body": [{"label": "section_header", "id": 18, "page_no": 10, "cluster": {"id": 18, "label": "section_header", "bbox": {"l": 132.842, "t": 110.57488999999998, "r": 465.37591999999995, "b": 135.53008999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.6497079730033875, "cells": [{"id": 0, "text": "TableFormer: Table Structure Understanding with Transformers", "bbox": {"l": 132.842, "t": 110.57488999999998, "r": 465.37591999999995, "b": 121.32263, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Supplementary Material", "bbox": {"l": 220.18399, "t": 122.25982999999997, "r": 375.04269, "b": 135.53008999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "TableFormer: Table Structure Understanding with Transformers Supplementary Material"}, {"label": "section_header", "id": 13, "page_no": 10, "cluster": {"id": 13, "label": "section_header", "bbox": {"l": 50.111984, "t": 161.16089, "r": 175.96437, "b": 171.90863000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9454860091209412, "cells": [{"id": 2, "text": "1.", "bbox": {"l": 50.111984, "t": 161.16089, "r": 57.089828, "b": 171.90863000000002, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Details on the datasets", "bbox": {"l": 66.393616, "t": 161.16089, "r": 175.96437, "b": 171.90863000000002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1. Details on the datasets"}, {"label": "section_header", "id": 11, "page_no": 10, "cluster": {"id": 11, "label": "section_header", "bbox": {"l": 50.111984, "t": 180.97931000000005, "r": 150.36401, "b": 190.83136000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9535645246505737, "cells": [{"id": 4, "text": "1.1.", "bbox": {"l": 50.111984, "t": 180.97931000000005, "r": 64.210808, "b": 190.83136000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Data preparation", "bbox": {"l": 73.610023, "t": 180.97931000000005, "r": 150.36401, "b": 190.83136000000002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1.1. Data preparation"}, {"label": "text", "id": 0, "page_no": 10, "cluster": {"id": 0, "label": "text", "bbox": {"l": 50.111984, "t": 199.92029000000002, "r": 286.36514, "b": 388.15482000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9864971041679382, "cells": [{"id": 6, "text": "As a first step of our data preparation process, we have", "bbox": {"l": 62.06698600000001, "t": 199.92029000000002, "r": 286.36496, "b": 208.82683999999995, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "calculated statistics over the datasets across the following", "bbox": {"l": 50.111984, "t": 211.87627999999995, "r": 286.36505, "b": 220.78283999999996, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "dimensions: (1) table size measured in the number of rows", "bbox": {"l": 50.111984, "t": 223.83130000000006, "r": 286.36514, "b": 232.73784999999998, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "and columns, (2) complexity of the table, (3) strictness of", "bbox": {"l": 50.111984, "t": 235.78632000000005, "r": 286.36508, "b": 244.69286999999997, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "the provided HTML structure and (4) completeness (i.e. no", "bbox": {"l": 50.111984, "t": 247.74132999999995, "r": 286.36505, "b": 256.64788999999996, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "omitted bounding boxes). A table is considered to be simple", "bbox": {"l": 50.111984, "t": 259.69635000000005, "r": 286.36505, "b": 268.60290999999995, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "if it does not contain row spans or column spans. Addition-", "bbox": {"l": 50.111984, "t": 271.65137000000004, "r": 286.36505, "b": 280.55792, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "ally, a table has a strict HTML structure if every row has the", "bbox": {"l": 50.111984, "t": 283.60736, "r": 286.36502, "b": 292.5139199999999, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "same number of columns after taking into account any row", "bbox": {"l": 50.111984, "t": 295.56235, "r": 286.36505, "b": 304.4689, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "or column spans. Therefore a strict HTML structure looks", "bbox": {"l": 50.111984, "t": 307.5173300000001, "r": 286.36508, "b": 316.42389, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "always rectangular. However, HTML is a lenient encoding", "bbox": {"l": 50.111984, "t": 319.47232, "r": 286.36505, "b": 328.3788799999999, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "format, i.e. tables with rows of different sizes might still", "bbox": {"l": 50.111984, "t": 331.42731000000003, "r": 286.36502, "b": 340.33386, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "be regarded as correct due to implicit display rules. These", "bbox": {"l": 50.111984, "t": 343.3833, "r": 286.36508, "b": 352.28986, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "implicit rules leave room for ambiguity, which we want to", "bbox": {"l": 50.111984, "t": 355.33829, "r": 286.36505, "b": 364.24484000000007, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "avoid. As such, we prefer to have \u201dstrict\u201d tables, i.e. tables", "bbox": {"l": 50.111984, "t": 367.29327, "r": 286.36508, "b": 376.19983, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "where every row has exactly the same length.", "bbox": {"l": 50.111984, "t": 379.24826, "r": 230.80364999999998, "b": 388.15482000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "As a first step of our data preparation process, we have calculated statistics over the datasets across the following dimensions: (1) table size measured in the number of rows and columns, (2) complexity of the table, (3) strictness of the provided HTML structure and (4) completeness (i.e. no omitted bounding boxes). A table is considered to be simple if it does not contain row spans or column spans. Additionally, a table has a strict HTML structure if every row has the same number of columns after taking into account any row or column spans. Therefore a strict HTML structure looks always rectangular. However, HTML is a lenient encoding format, i.e. tables with rows of different sizes might still be regarded as correct due to implicit display rules. These implicit rules leave room for ambiguity, which we want to avoid. As such, we prefer to have \u201dstrict\u201d tables, i.e. tables where every row has exactly the same length."}, {"label": "text", "id": 2, "page_no": 10, "cluster": {"id": 2, "label": "text", "bbox": {"l": 50.111984, "t": 391.40527, "r": 286.36511, "b": 627.4597, "coord_origin": "TOPLEFT"}, "confidence": 0.9826022386550903, "cells": [{"id": 22, "text": "We have developed a technique that tries to derive a", "bbox": {"l": 62.06698600000001, "t": 391.40527, "r": 286.36499, "b": 400.31183, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "missing bounding box out of its neighbors. As a first step,", "bbox": {"l": 50.111984, "t": 403.36026, "r": 286.36508, "b": 412.26681999999994, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "we use the annotation data to generate the most fine-grained", "bbox": {"l": 50.111984, "t": 415.31525, "r": 286.36505, "b": 424.22180000000003, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "grid that covers the table structure. In case of strict HTML", "bbox": {"l": 50.111984, "t": 427.2712399999999, "r": 286.36505, "b": 436.1778, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "tables, all grid squares are associated with some table cell", "bbox": {"l": 50.111984, "t": 439.22623, "r": 286.36508, "b": 448.1327800000001, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "and in the presence of table spans a cell extends across mul-", "bbox": {"l": 50.111984, "t": 451.18121, "r": 286.36511, "b": 460.08777, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "tiple grid squares. When enough bounding boxes are known", "bbox": {"l": 50.111984, "t": 463.1362, "r": 286.36505, "b": 472.04276, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "for a rectangular table, it is possible to compute the geo-", "bbox": {"l": 50.111984, "t": 475.09119, "r": 286.36508, "b": 483.99774, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "metrical border lines between the grid rows and columns.", "bbox": {"l": 50.111984, "t": 487.04617, "r": 286.36502, "b": 495.95273, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Eventually this information is used to generate the missing", "bbox": {"l": 50.111984, "t": 499.00217, "r": 286.36511, "b": 507.90872, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "bounding boxes. Additionally, the existence of unused grid", "bbox": {"l": 50.111984, "t": 510.95715, "r": 286.36508, "b": 519.8637100000001, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "squares indicates that the table rows have unequal number", "bbox": {"l": 50.111984, "t": 522.91214, "r": 286.36508, "b": 531.8187, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "of columns and the overall structure is non-strict. The gen-", "bbox": {"l": 50.111984, "t": 534.86713, "r": 286.36505, "b": 543.7737, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "eration of missing bounding boxes for non-strict HTML ta-", "bbox": {"l": 50.111984, "t": 546.82214, "r": 286.36502, "b": 555.7287, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "bles is ambiguous and therefore quite challenging.", "bbox": {"l": 50.111984, "t": 558.77814, "r": 257.47351, "b": 567.68469, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "Thus,", "bbox": {"l": 263.94919, "t": 558.77814, "r": 286.36505, "b": 567.68469, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "we have decided to simply discard those tables. In case of", "bbox": {"l": 50.111984, "t": 570.73314, "r": 286.36508, "b": 579.63969, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "PubTabNet we have computed missing bounding boxes for", "bbox": {"l": 50.111984, "t": 582.68814, "r": 286.36511, "b": 591.5947, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "48% of the simple and 69% of the complex tables. Regard-", "bbox": {"l": 50.111984, "t": 594.64314, "r": 286.36511, "b": 603.5497, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "ing FinTabNet, 68% of the simple and 98% of the complex", "bbox": {"l": 50.111984, "t": 606.5981400000001, "r": 286.36505, "b": 615.5047, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "tables require the generation of bounding boxes.", "bbox": {"l": 50.111984, "t": 618.55315, "r": 242.2606, "b": 627.4597, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "We have developed a technique that tries to derive a missing bounding box out of its neighbors. As a first step, we use the annotation data to generate the most fine-grained grid that covers the table structure. In case of strict HTML tables, all grid squares are associated with some table cell and in the presence of table spans a cell extends across multiple grid squares. When enough bounding boxes are known for a rectangular table, it is possible to compute the geometrical border lines between the grid rows and columns. Eventually this information is used to generate the missing bounding boxes. Additionally, the existence of unused grid squares indicates that the table rows have unequal number of columns and the overall structure is non-strict. The generation of missing bounding boxes for non-strict HTML tables is ambiguous and therefore quite challenging. Thus, we have decided to simply discard those tables. In case of PubTabNet we have computed missing bounding boxes for 48% of the simple and 69% of the complex tables. Regarding FinTabNet, 68% of the simple and 98% of the complex tables require the generation of bounding boxes."}, {"label": "text", "id": 14, "page_no": 10, "cluster": {"id": 14, "label": "text", "bbox": {"l": 50.111984, "t": 630.71014, "r": 286.36496, "b": 651.57269, "coord_origin": "TOPLEFT"}, "confidence": 0.9335852265357971, "cells": [{"id": 43, "text": "Figure 7 illustrates the distribution of the tables across", "bbox": {"l": 62.06698600000001, "t": 630.71014, "r": 286.36496, "b": 639.6167, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "different dimensions per dataset.", "bbox": {"l": 50.111984, "t": 642.66614, "r": 179.90472, "b": 651.57269, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 7 illustrates the distribution of the tables across different dimensions per dataset."}, {"label": "section_header", "id": 12, "page_no": 10, "cluster": {"id": 12, "label": "section_header", "bbox": {"l": 50.111984, "t": 662.39014, "r": 153.60785, "b": 672.24219, "coord_origin": "TOPLEFT"}, "confidence": 0.9515743255615234, "cells": [{"id": 45, "text": "1.2.", "bbox": {"l": 50.111984, "t": 662.39014, "r": 64.297272, "b": 672.24219, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "Synthetic datasets", "bbox": {"l": 73.754135, "t": 662.39014, "r": 153.60785, "b": 672.24219, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1.2. Synthetic datasets"}, {"label": "text", "id": 3, "page_no": 10, "cluster": {"id": 3, "label": "text", "bbox": {"l": 50.111984, "t": 681.33113, "r": 286.36505, "b": 714.147705, "coord_origin": "TOPLEFT"}, "confidence": 0.978333592414856, "cells": [{"id": 47, "text": "Aiming to train and evaluate our models in a broader", "bbox": {"l": 62.06698600000001, "t": 681.33113, "r": 286.36493, "b": 690.2377, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "spectrum of table data we have synthesized four types of", "bbox": {"l": 50.111984, "t": 693.2861330000001, "r": 286.36505, "b": 702.1927029999999, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "datasets.", "bbox": {"l": 50.111984, "t": 705.241135, "r": 84.144226, "b": 714.147705, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Each one contains tables with different appear-", "bbox": {"l": 91.237595, "t": 705.241135, "r": 286.36505, "b": 714.147705, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Aiming to train and evaluate our models in a broader spectrum of table data we have synthesized four types of datasets. Each one contains tables with different appear-"}, {"label": "text", "id": 8, "page_no": 10, "cluster": {"id": 8, "label": "text", "bbox": {"l": 308.862, "t": 162.65515000000005, "r": 545.11511, "b": 207.42773, "coord_origin": "TOPLEFT"}, "confidence": 0.9596062302589417, "cells": [{"id": 51, "text": "ances in regard to their size, structure, style and content.", "bbox": {"l": 308.862, "t": 162.65515000000005, "r": 545.11511, "b": 171.56170999999995, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Every synthetic dataset contains 150k examples, summing", "bbox": {"l": 308.862, "t": 174.61017000000004, "r": 545.11511, "b": 183.51671999999996, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "up to 600k synthetic examples. All datasets are divided into", "bbox": {"l": 308.862, "t": 186.56519000000003, "r": 545.11511, "b": 195.47173999999995, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "Train, Test and Val splits (80%, 10%, 10%).", "bbox": {"l": 308.862, "t": 198.52117999999996, "r": 484.07434, "b": 207.42773, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "ances in regard to their size, structure, style and content. Every synthetic dataset contains 150k examples, summing up to 600k synthetic examples. All datasets are divided into Train, Test and Val splits (80%, 10%, 10%)."}, {"label": "text", "id": 15, "page_no": 10, "cluster": {"id": 15, "label": "text", "bbox": {"l": 308.862, "t": 211.23517000000004, "r": 545.11505, "b": 232.09673999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9261794090270996, "cells": [{"id": 55, "text": "The process of generating a synthetic dataset can be de-", "bbox": {"l": 320.81699, "t": 211.23517000000004, "r": 545.11505, "b": 220.14171999999996, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "composed into the following steps:", "bbox": {"l": 308.862, "t": 223.19019000000003, "r": 448.08939, "b": 232.09673999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The process of generating a synthetic dataset can be decomposed into the following steps:"}, {"label": "list_item", "id": 7, "page_no": 10, "cluster": {"id": 7, "label": "list_item", "bbox": {"l": 308.862, "t": 235.90521, "r": 545.11511, "b": 316.54279, "coord_origin": "TOPLEFT"}, "confidence": 0.9642950296401978, "cells": [{"id": 57, "text": "1.", "bbox": {"l": 320.81699, "t": 235.90521, "r": 328.28894, "b": 244.81177000000002, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Prepare styling and content templates: The styling", "bbox": {"l": 335.38232, "t": 235.90521, "r": 545.11499, "b": 244.81177000000002, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "templates have been manually designed and organized into", "bbox": {"l": 308.862, "t": 247.86023, "r": 545.11511, "b": 256.76678000000004, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "groups of scope specific appearances (e.g. financial data,", "bbox": {"l": 308.862, "t": 259.81525, "r": 545.11511, "b": 268.72180000000003, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "marketing data, etc.)", "bbox": {"l": 308.862, "t": 271.77026, "r": 393.3847, "b": 280.67682, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "Additionally, we have prepared cu-", "bbox": {"l": 400.11942, "t": 271.77026, "r": 545.11511, "b": 280.67682, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "rated collections of content templates by extracting the most", "bbox": {"l": 308.862, "t": 283.72524999999996, "r": 545.11505, "b": 292.63181, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "frequently used terms out of non-synthetic datasets (e.g.", "bbox": {"l": 308.862, "t": 295.68124, "r": 545.11511, "b": 304.5878000000001, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "PubTabNet, FinTabNet, etc.).", "bbox": {"l": 308.862, "t": 307.63623, "r": 425.69348, "b": 316.54279, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1. Prepare styling and content templates: The styling templates have been manually designed and organized into groups of scope specific appearances (e.g. financial data, marketing data, etc.) Additionally, we have prepared curated collections of content templates by extracting the most frequently used terms out of non-synthetic datasets (e.g. PubTabNet, FinTabNet, etc.)."}, {"label": "list_item", "id": 6, "page_no": 10, "cluster": {"id": 6, "label": "list_item", "bbox": {"l": 308.862, "t": 320.35022, "r": 545.11517, "b": 448.80865, "coord_origin": "TOPLEFT"}, "confidence": 0.9699996113777161, "cells": [{"id": 66, "text": "2.", "bbox": {"l": 320.81699, "t": 320.35022, "r": 328.4949, "b": 329.25677, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "Generate table structures: The structure of each syn-", "bbox": {"l": 331.05423, "t": 320.35022, "r": 545.11499, "b": 329.25677, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "thetic dataset assumes a horizontal table header which po-", "bbox": {"l": 308.862, "t": 332.30521000000005, "r": 545.11517, "b": 341.21176, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "tentially spans over multiple rows and a table body that", "bbox": {"l": 308.862, "t": 344.26018999999997, "r": 545.11505, "b": 353.16675, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "may contain a combination of row spans and column spans.", "bbox": {"l": 308.862, "t": 356.21619, "r": 545.11511, "b": 365.12273999999996, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "However, spans are not allowed to cross the header - body", "bbox": {"l": 308.862, "t": 368.17117, "r": 545.11511, "b": 377.07773, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "boundary. The table structure is described by the parame-", "bbox": {"l": 308.862, "t": 380.12616, "r": 545.11499, "b": 389.03271, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "ters: Total number of table rows and columns, number of", "bbox": {"l": 308.862, "t": 392.08115, "r": 545.11517, "b": 400.98769999999996, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "header rows, type of spans (header only spans, row only", "bbox": {"l": 308.862, "t": 404.03613000000007, "r": 545.11511, "b": 412.94269, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "spans, column only spans, both row and column spans),", "bbox": {"l": 308.862, "t": 415.99112, "r": 545.11499, "b": 424.89767, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "maximum span size and the ratio of the table area covered", "bbox": {"l": 308.862, "t": 427.94711, "r": 545.11517, "b": 436.85367, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "by spans.", "bbox": {"l": 308.862, "t": 439.9021, "r": 345.94278, "b": 448.80865, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2. Generate table structures: The structure of each synthetic dataset assumes a horizontal table header which potentially spans over multiple rows and a table body that may contain a combination of row spans and column spans. However, spans are not allowed to cross the header - body boundary. The table structure is described by the parameters: Total number of table rows and columns, number of header rows, type of spans (header only spans, row only spans, column only spans, both row and column spans), maximum span size and the ratio of the table area covered by spans."}, {"label": "list_item", "id": 9, "page_no": 10, "cluster": {"id": 9, "label": "list_item", "bbox": {"l": 308.862, "t": 452.61609, "r": 545.11517, "b": 497.38861, "coord_origin": "TOPLEFT"}, "confidence": 0.9568929672241211, "cells": [{"id": 78, "text": "3.", "bbox": {"l": 320.81699, "t": 452.61609, "r": 328.30341, "b": 461.52264, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "Generate content: Based on the dataset", "bbox": {"l": 330.79889, "t": 452.61609, "r": 485.75772000000006, "b": 461.52264, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "theme", "bbox": {"l": 488.073, "t": 452.70575, "r": 511.86368, "b": 461.29352, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": ", a set of", "bbox": {"l": 511.86301, "t": 452.61609, "r": 545.10815, "b": 461.52264, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "suitable content templates is chosen first. Then, this content", "bbox": {"l": 308.862, "t": 464.57108, "r": 545.11505, "b": 473.47763, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "can be combined with purely random text to produce the", "bbox": {"l": 308.862, "t": 476.52707, "r": 545.11517, "b": 485.43362, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "synthetic content.", "bbox": {"l": 308.862, "t": 488.48206, "r": 379.14816, "b": 497.38861, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3. Generate content: Based on the dataset theme , a set of suitable content templates is chosen first. Then, this content can be combined with purely random text to produce the synthetic content."}, {"label": "list_item", "id": 5, "page_no": 10, "cluster": {"id": 5, "label": "list_item", "bbox": {"l": 308.862, "t": 501.19604, "r": 545.1153, "b": 545.96858, "coord_origin": "TOPLEFT"}, "confidence": 0.9710659980773926, "cells": [{"id": 85, "text": "4.", "bbox": {"l": 320.81699, "t": 501.19604, "r": 328.66177, "b": 510.1026, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Apply styling templates: Depending on the domain", "bbox": {"l": 331.2767, "t": 501.19604, "r": 545.11493, "b": 510.1026, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "of the synthetic dataset, a set of styling templates is first", "bbox": {"l": 308.862, "t": 513.15103, "r": 545.1153, "b": 522.05759, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "manually selected.", "bbox": {"l": 308.862, "t": 525.10703, "r": 384.29883, "b": 534.01358, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "Then, a style is randomly selected to", "bbox": {"l": 391.25272, "t": 525.10703, "r": 545.11511, "b": 534.01358, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "format the appearance of the synthesized table.", "bbox": {"l": 308.862, "t": 537.06203, "r": 496.15897000000007, "b": 545.96858, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4. Apply styling templates: Depending on the domain of the synthetic dataset, a set of styling templates is first manually selected. Then, a style is randomly selected to format the appearance of the synthesized table."}, {"label": "list_item", "id": 4, "page_no": 10, "cluster": {"id": 4, "label": "list_item", "bbox": {"l": 308.862, "t": 549.77603, "r": 545.11517, "b": 606.50359, "coord_origin": "TOPLEFT"}, "confidence": 0.9778757095336914, "cells": [{"id": 91, "text": "5.", "bbox": {"l": 320.81699, "t": 549.77603, "r": 328.28894, "b": 558.68259, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Render the complete tables: The synthetic table is", "bbox": {"l": 335.40222, "t": 549.77603, "r": 545.11499, "b": 558.68259, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "finally rendered by a web browser engine to generate the", "bbox": {"l": 308.862, "t": 561.73103, "r": 545.11517, "b": 570.63759, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "bounding boxes for each table cell. A batching technique is", "bbox": {"l": 308.862, "t": 573.68604, "r": 545.11511, "b": 582.59259, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "utilized to optimize the runtime overhead of the rendering", "bbox": {"l": 308.862, "t": 585.64203, "r": 545.11505, "b": 594.54858, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "process.", "bbox": {"l": 308.862, "t": 597.59703, "r": 341.2305, "b": 606.50359, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5. Render the complete tables: The synthetic table is finally rendered by a web browser engine to generate the bounding boxes for each table cell. A batching technique is utilized to optimize the runtime overhead of the rendering process."}, {"label": "section_header", "id": 10, "page_no": 10, "cluster": {"id": 10, "label": "section_header", "bbox": {"l": 308.862, "t": 622.2905900000001, "r": 545.10876, "b": 646.98631, "coord_origin": "TOPLEFT"}, "confidence": 0.954940915107727, "cells": [{"id": 97, "text": "2.", "bbox": {"l": 308.862, "t": 622.2905900000001, "r": 316.76675, "b": 633.03831, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "Prediction post-processing for PDF docu-", "bbox": {"l": 327.30643, "t": 622.2905900000001, "r": 545.10876, "b": 633.03831, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "ments", "bbox": {"l": 326.79501, "t": 636.2385899999999, "r": 357.34055, "b": 646.98631, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2. Prediction post-processing for PDF documents"}, {"label": "text", "id": 1, "page_no": 10, "cluster": {"id": 1, "label": "text", "bbox": {"l": 308.86203, "t": 657.42104, "r": 545.11517, "b": 714.148605, "coord_origin": "TOPLEFT"}, "confidence": 0.9829329252243042, "cells": [{"id": 100, "text": "Although TableFormer can predict the table structure and", "bbox": {"l": 320.81702, "t": 657.42104, "r": 545.11499, "b": 666.3276, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "the bounding boxes for tables recognized inside PDF docu-", "bbox": {"l": 308.86203, "t": 669.37604, "r": 545.11511, "b": 678.2826, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "ments, this is not enough when a full reconstruction of the", "bbox": {"l": 308.86203, "t": 681.33104, "r": 545.11517, "b": 690.2376, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "original table is required. This happens mainly due the fol-", "bbox": {"l": 308.86203, "t": 693.286041, "r": 545.11505, "b": 702.1926040000001, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "lowing reasons:", "bbox": {"l": 308.86203, "t": 705.242035, "r": 371.42719, "b": 714.148605, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Although TableFormer can predict the table structure and the bounding boxes for tables recognized inside PDF documents, this is not enough when a full reconstruction of the original table is required. This happens mainly due the following reasons:"}], "headers": [{"label": "page_footer", "id": 16, "page_no": 10, "cluster": {"id": 16, "label": "page_footer", "bbox": {"l": 292.63104, "t": 734.1330379999999, "r": 302.59363, "b": 743.0396, "coord_origin": "TOPLEFT"}, "confidence": 0.8986662030220032, "cells": [{"id": 105, "text": "11", "bbox": {"l": 292.63104, "t": 734.1330379999999, "r": 302.59363, "b": 743.0396, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "11"}]}}, {"page_no": 11, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "PubTabNet", "bbox": {"l": 119.39108, "t": 77.31055000000003, "r": 151.94641, "b": 83.25922000000003, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "b.", "bbox": {"l": 53.345978, "t": 75.19152999999994, "r": 59.327053, "b": 81.14020000000005, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "FinTabNet", "bbox": {"l": 289.5791, "t": 77.45830999999998, "r": 319.8266, "b": 83.40698000000009, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Table Bank", "bbox": {"l": 448.37271, "t": 77.25396999999987, "r": 481.75916, "b": 83.20263999999997, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Train", "bbox": {"l": 82.553436, "t": 141.27617999999995, "r": 94.976013, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Complex", "bbox": {"l": 63.03878399999999, "t": 101.10413000000005, "r": 85.290085, "b": 106.06133999999986, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Simple", "bbox": {"l": 67.76786, "t": 124.39531999999997, "r": 85.231277, "b": 129.35253999999998, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Complex", "bbox": {"l": 227.55121, "t": 102.53992000000005, "r": 249.80251, "b": 107.49712999999997, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Simple", "bbox": {"l": 232.19898999999998, "t": 126.98577999999986, "r": 249.66241, "b": 131.94299, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Simple", "bbox": {"l": 396.2337, "t": 114.04522999999995, "r": 413.69711, "b": 119.00243999999998, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Val", "bbox": {"l": 97.382202, "t": 141.27617999999995, "r": 105.08014, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "100%", "bbox": {"l": 60.93763400000001, "t": 85.73321999999996, "r": 76.151443, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "500K 10K", "bbox": {"l": 82.304901, "t": 86.22351000000003, "r": 106.99162, "b": 91.18073000000015, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Train Test Val", "bbox": {"l": 246.20530999999997, "t": 141.60608000000002, "r": 281.88013, "b": 146.56329000000005, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "100%", "bbox": {"l": 226.69780000000003, "t": 85.73321999999996, "r": 241.91161, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "91K 10K 10K", "bbox": {"l": 249.93848999999997, "t": 86.08801000000005, "r": 282.49384, "b": 91.04522999999995, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Train Test Val", "bbox": {"l": 410.19409, "t": 141.27617999999995, "r": 444.68915, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "100% 130K 5K", "bbox": {"l": 391.37341, "t": 85.73321999999996, "r": 432.6716599999999, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "10K", "bbox": {"l": 435.60571000000004, "t": 86.26140999999996, "r": 445.62414999999993, "b": 91.21862999999996, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Complex", "bbox": {"l": 113.94921, "t": 141.28845, "r": 136.20052, "b": 146.24567000000002, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Non", "bbox": {"l": 116.91554000000001, "t": 94.81853999999998, "r": 127.05433999999998, "b": 99.77575999999999, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Strict", "bbox": {"l": 113.3146, "t": 100.93853999999999, "r": 127.05298, "b": 105.89575000000002, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "HTML", "bbox": {"l": 112.94112, "t": 107.05853000000013, "r": 127.05537, "b": 112.01575000000003, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Strict", "bbox": {"l": 113.22738999999999, "t": 122.61523, "r": 126.96577, "b": 127.57245, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "HTML", "bbox": {"l": 112.85390000000001, "t": 128.73523, "r": 126.96814999999998, "b": 133.69244000000003, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "Simple", "bbox": {"l": 138.57864, "t": 141.43640000000005, "r": 156.04207, "b": 146.39362000000006, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "230K 280K", "bbox": {"l": 122.03101, "t": 86.2713, "r": 151.04185, "b": 91.22852, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "65K", "bbox": {"l": 311.65359, "t": 86.55498999999998, "r": 321.67203, "b": 91.5122100000001, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Complex", "bbox": {"l": 287.89441, "t": 141.71063000000004, "r": 310.14572, "b": 146.66785000000004, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Non", "bbox": {"l": 289.23572, "t": 93.07977000000005, "r": 299.37451, "b": 98.03698999999995, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Strict", "bbox": {"l": 285.63513, "t": 99.19976999999994, "r": 299.3735, "b": 104.15698000000009, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "HTML", "bbox": {"l": 285.26111, "t": 105.31975999999997, "r": 299.37537, "b": 110.27697999999998, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Strict", "bbox": {"l": 285.43109, "t": 120.38995, "r": 299.16946, "b": 125.34717, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "HTML", "bbox": {"l": 285.05713, "t": 126.50995, "r": 299.17139, "b": 131.46716000000004, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Simple", "bbox": {"l": 311.34592, "t": 141.71063000000004, "r": 328.80933, "b": 146.66785000000004, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "47K", "bbox": {"l": 299.58362, "t": 86.69353999999998, "r": 309.60205, "b": 91.65075999999999, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Simple", "bbox": {"l": 466.04077000000007, "t": 141.67169, "r": 483.50418, "b": 146.62891000000002, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "Non", "bbox": {"l": 459.02151, "t": 93.76116999999999, "r": 469.16031000000004, "b": 98.71838000000002, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "Strict", "bbox": {"l": 455.4209, "t": 99.88116000000002, "r": 469.15927000000005, "b": 104.83838000000003, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "HTML", "bbox": {"l": 455.04691, "t": 106.00116000000014, "r": 469.16115999999994, "b": 110.95836999999995, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "145K", "bbox": {"l": 467.39401, "t": 85.57239000000004, "r": 480.6545100000001, "b": 90.52959999999996, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Complex", "bbox": {"l": 160.37672, "t": 141.58385999999996, "r": 182.62802, "b": 146.54107999999997, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "Contain", "bbox": {"l": 153.74265, "t": 94.86481000000003, "r": 173.32664, "b": 99.82201999999995, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Missing", "bbox": {"l": 154.50967, "t": 100.98479999999995, "r": 173.3246, "b": 105.94202000000007, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "bboxes", "bbox": {"l": 155.27162, "t": 107.10479999999995, "r": 173.32664, "b": 112.06200999999987, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Contain", "bbox": {"l": 326.41302, "t": 107.23248000000001, "r": 345.99701, "b": 112.18970000000002, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "Missing", "bbox": {"l": 327.17972, "t": 113.35248000000001, "r": 345.99463, "b": 118.30969000000005, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "bboxes", "bbox": {"l": 327.94131, "t": 119.47247000000004, "r": 345.99634, "b": 124.42969000000005, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Dataset", "bbox": {"l": 488.9942, "t": 104.15374999999983, "r": 508.76384999999993, "b": 109.11095999999998, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "doesn't", "bbox": {"l": 490.1893, "t": 110.27373999999998, "r": 508.76349000000005, "b": 115.2309600000001, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "provide", "bbox": {"l": 489.72009, "t": 116.39373999999998, "r": 508.76758, "b": 121.35095000000013, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "bboxes", "bbox": {"l": 490.71121, "t": 122.51373000000001, "r": 508.76624, "b": 127.47095000000002, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Simple", "bbox": {"l": 185.37759, "t": 141.71118, "r": 202.84102, "b": 146.66840000000002, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "230K 280K", "bbox": {"l": 168.50357, "t": 86.13611000000003, "r": 197.52699, "b": 91.09331999999995, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "65K", "bbox": {"l": 357.3768, "t": 85.99707000000001, "r": 367.39523, "b": 90.95428000000004, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "Complex Simple", "bbox": {"l": 333.73151, "t": 141.62323000000004, "r": 374.92862, "b": 146.58043999999995, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "47K", "bbox": {"l": 345.69101, "t": 86.05591000000004, "r": 355.70944, "b": 91.01312000000007, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Simple", "bbox": {"l": 508.54248, "t": 141.37683000000004, "r": 526.00592, "b": 146.33405000000005, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "145K", "bbox": {"l": 510.44653000000005, "t": 86.09258999999986, "r": 523.70703, "b": 91.0498, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Figure 7: Distribution of the tables across different dimensions per dataset. Simple vs complex tables per dataset and split,", "bbox": {"l": 50.112, "t": 165.50238000000002, "r": 545.11371, "b": 174.40894000000003, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "strict vs non strict html structures per dataset and table complexity, missing bboxes per dataset and table complexity.", "bbox": {"l": 50.112, "t": 177.4574, "r": 513.52234, "b": 186.36395000000005, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "\u2022", "bbox": {"l": 61.569, "t": 210.93140000000005, "r": 71.14743, "b": 219.83794999999998, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "TableFormer output does not include the table cell con-", "bbox": {"l": 73.542038, "t": 210.93140000000005, "r": 286.36511, "b": 219.83794999999998, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "tent.", "bbox": {"l": 70.037003, "t": 222.88640999999996, "r": 87.47155, "b": 231.79296999999997, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "\u2022", "bbox": {"l": 61.569, "t": 244.07141000000001, "r": 71.345718, "b": 252.97797000000003, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "There are occasional inaccuracies in the predictions of", "bbox": {"l": 73.789902, "t": 244.07141000000001, "r": 286.36514, "b": 252.97797000000003, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "the bounding boxes.", "bbox": {"l": 70.037003, "t": 256.02643, "r": 150.41524, "b": 264.93298000000004, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "However, it is possible to mitigate those limitations by", "bbox": {"l": 62.067001, "t": 279.20343, "r": 286.36499, "b": 288.10999, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "combining the TableFormer predictions with the informa-", "bbox": {"l": 50.112, "t": 291.15842, "r": 286.36505, "b": 300.06497, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "tion already present inside a programmatic PDF document.", "bbox": {"l": 50.112, "t": 303.1134, "r": 286.36511, "b": 312.01996, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "More specifically, PDF documents can be seen as a se-", "bbox": {"l": 50.112, "t": 315.06839, "r": 286.36511, "b": 323.97495, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "quence of PDF cells where each cell is described by its con-", "bbox": {"l": 50.112, "t": 327.02438, "r": 286.36511, "b": 335.93093999999996, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "tent and bounding box. If we are able to associate the PDF", "bbox": {"l": 50.112, "t": 338.97937, "r": 286.36505, "b": 347.88593, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "cells with the predicted table cells, we can directly link the", "bbox": {"l": 50.112, "t": 350.93436, "r": 286.36508, "b": 359.84091, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "PDF cell content to the table cell structure and use the PDF", "bbox": {"l": 50.112, "t": 362.88934, "r": 286.36511, "b": 371.7959, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "bounding boxes to correct misalignments in the predicted", "bbox": {"l": 50.112, "t": 374.84433000000007, "r": 286.36508, "b": 383.75089, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "table cell bounding boxes.", "bbox": {"l": 50.112, "t": 386.80032, "r": 154.55988, "b": 395.70688, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "Here is a step-by-step description of the prediction post-", "bbox": {"l": 62.067001, "t": 399.06934, "r": 286.36496, "b": 407.97589, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "processing:", "bbox": {"l": 50.112, "t": 411.02533, "r": 95.491638, "b": 419.93188, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "1.", "bbox": {"l": 62.067001, "t": 423.29532, "r": 69.37281, "b": 432.20187, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "Get the minimal grid dimensions - number of rows and", "bbox": {"l": 71.808075, "t": 423.29532, "r": 286.36502, "b": 432.20187, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "columns for the predicted table structure. This represents", "bbox": {"l": 50.112, "t": 435.25031, "r": 286.36508, "b": 444.15686, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "the most granular grid for the underlying table structure.", "bbox": {"l": 50.112, "t": 447.20529, "r": 274.50958, "b": 456.11185000000006, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "2.", "bbox": {"l": 62.067001, "t": 459.47528, "r": 69.538948, "b": 468.38184, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "Generate pair-wise matches between the bounding", "bbox": {"l": 77.429329, "t": 459.47528, "r": 286.36499, "b": 468.38184, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "boxes of the PDF cells and the predicted cells. The Intersec-", "bbox": {"l": 50.112, "t": 471.43027, "r": 286.36505, "b": 480.33682, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "tion Over Union (IOU) metric is used to evaluate the quality", "bbox": {"l": 50.112, "t": 483.38525, "r": 286.36505, "b": 492.29181, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "of the matches.", "bbox": {"l": 50.112, "t": 495.34024, "r": 110.70452999999999, "b": 504.2468, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "3.", "bbox": {"l": 62.067001, "t": 507.61023, "r": 69.863068, "b": 516.5167799999999, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "Use a carefully selected IOU threshold to designate", "bbox": {"l": 72.461754, "t": 507.61023, "r": 286.36493, "b": 516.5167799999999, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "the matches as \u201cgood\u201d ones and \u201cbad\u201d ones.", "bbox": {"l": 50.112, "t": 519.5662199999999, "r": 226.0714, "b": 528.4727800000001, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "3.a. If all IOU scores in a column are below the thresh-", "bbox": {"l": 62.067001, "t": 531.83521, "r": 286.36496, "b": 540.7417800000001, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "old, discard all predictions (structure and bounding boxes)", "bbox": {"l": 50.112, "t": 543.79121, "r": 286.36511, "b": 552.69777, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "for that column.", "bbox": {"l": 50.112, "t": 555.74622, "r": 114.03204, "b": 564.65277, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "4.", "bbox": {"l": 62.067001, "t": 568.01622, "r": 69.538948, "b": 576.92278, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "Find the best-fitting content alignment for the pre-", "bbox": {"l": 76.731949, "t": 568.01622, "r": 286.36502, "b": 576.92278, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "dicted cells with good IOU per each column. The alignment", "bbox": {"l": 50.112, "t": 579.97122, "r": 286.36508, "b": 588.87778, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "of the column can be identified by the following formula:", "bbox": {"l": 50.112, "t": 591.9262200000001, "r": 278.70383, "b": 600.83278, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "alignment", "bbox": {"l": 112.02799999999999, "t": 623.99382, "r": 157.9516, "b": 632.84061, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "= arg min", "bbox": {"l": 160.715, "t": 623.99382, "r": 203.4964, "b": 632.84061, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "c", "bbox": {"l": 185.58499, "t": 633.98305, "r": 189.14511, "b": 640.17578, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "{", "bbox": {"l": 203.49899, "t": 623.43591, "r": 208.48029, "b": 632.84061, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "D$_{c}$", "bbox": {"l": 208.48099, "t": 623.99382, "r": 220.28911, "b": 632.84061, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "}", "bbox": {"l": 220.78699, "t": 623.43591, "r": 225.76828, "b": 632.84061, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "D$_{c}$", "bbox": {"l": 110.70499, "t": 645.25882, "r": 122.51310999999998, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "=", "bbox": {"l": 125.77899000000001, "t": 645.25882, "r": 133.52791, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "max", "bbox": {"l": 136.295, "t": 645.25882, "r": 156.00201, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "{", "bbox": {"l": 156.00299, "t": 644.70091, "r": 160.98428, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "x$_{c}$", "bbox": {"l": 160.98399, "t": 645.25882, "r": 170.23811, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "} \u2212", "bbox": {"l": 170.73599, "t": 644.70091, "r": 185.6779, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "min", "bbox": {"l": 187.894, "t": 645.25882, "r": 206.05283, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "{", "bbox": {"l": 206.054, "t": 644.70091, "r": 211.03529, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "x$_{c}$", "bbox": {"l": 211.035, "t": 645.25882, "r": 220.28912, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "}", "bbox": {"l": 220.787, "t": 644.70091, "r": 225.76829999999998, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "(4)", "bbox": {"l": 274.746, "t": 634.88522, "r": 286.3624, "b": 643.79178, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "where", "bbox": {"l": 50.112, "t": 668.06522, "r": 74.45063, "b": 676.97179, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "c", "bbox": {"l": 78.335999, "t": 667.90582, "r": 82.647812, "b": 676.75261, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "is one of", "bbox": {"l": 86.532997, "t": 668.06522, "r": 123.63372, "b": 676.97179, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "{", "bbox": {"l": 127.51899999999999, "t": 667.3479199999999, "r": 132.50029, "b": 676.75261, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "left, centroid, right", "bbox": {"l": 132.50099, "t": 668.06522, "r": 210.69743, "b": 676.97179, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "}", "bbox": {"l": 210.69699, "t": 667.3479199999999, "r": 215.67828, "b": 676.75261, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "and", "bbox": {"l": 219.56299, "t": 668.06522, "r": 233.94897000000003, "b": 676.97179, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "x$_{c}$", "bbox": {"l": 237.83499000000003, "t": 667.90582, "r": 247.08911, "b": 676.75261, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "is the x-", "bbox": {"l": 251.47299000000004, "t": 668.06522, "r": 286.362, "b": 676.97179, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "coordinate for the corresponding point.", "bbox": {"l": 50.112, "t": 680.02022, "r": 205.88721, "b": 688.92679, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "5.", "bbox": {"l": 62.067001, "t": 692.290222, "r": 69.538948, "b": 701.196785, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "Use the alignment computed in step 4, to compute", "bbox": {"l": 76.273666, "t": 692.290222, "r": 286.36496, "b": 701.196785, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "the median", "bbox": {"l": 50.112, "t": 704.245224, "r": 94.604973, "b": 713.151787, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "x", "bbox": {"l": 97.598999, "t": 704.085815, "r": 103.29263, "b": 712.93261, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "-coordinate for all table columns and the me-", "bbox": {"l": 103.292, "t": 704.245224, "r": 286.36481, "b": 713.151787, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "dian cell size for all table cells. The usage of median dur-", "bbox": {"l": 308.862, "t": 210.93120999999996, "r": 545.11517, "b": 219.83776999999998, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "ing the computations, helps to eliminate outliers caused by", "bbox": {"l": 308.862, "t": 222.88720999999998, "r": 545.11511, "b": 231.79376000000002, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "occasional column spans which are usually wider than the", "bbox": {"l": 308.862, "t": 234.84222, "r": 545.11511, "b": 243.74878, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "normal.", "bbox": {"l": 308.862, "t": 246.79724, "r": 339.57669, "b": 255.7038, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "6.", "bbox": {"l": 320.81699, "t": 259.10222999999996, "r": 328.28894, "b": 268.00879, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "Snap all cells with bad IOU to their corresponding", "bbox": {"l": 334.88419, "t": 259.10222999999996, "r": 545.11499, "b": 268.00879, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "median", "bbox": {"l": 308.862, "t": 271.05724999999995, "r": 338.19189, "b": 279.96380999999997, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "x", "bbox": {"l": 340.68201, "t": 270.89783, "r": 346.37564, "b": 279.74463000000003, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "-coordinates and cell sizes.", "bbox": {"l": 346.37601, "t": 271.05724999999995, "r": 453.72305000000006, "b": 279.96380999999997, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "7.", "bbox": {"l": 320.81702, "t": 283.36325000000005, "r": 328.38953, "b": 292.26981, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "Generate a new set of pair-wise matches between the", "bbox": {"l": 330.9137, "t": 283.36325000000005, "r": 545.11499, "b": 292.26981, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "corrected bounding boxes and PDF cells. This time use a", "bbox": {"l": 308.86203, "t": 295.31824, "r": 545.11511, "b": 304.22479, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "modified version of the IOU metric, where the area of the", "bbox": {"l": 308.86203, "t": 307.27322, "r": 545.11505, "b": 316.17978, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "intersection between the predicted and PDF cells is divided", "bbox": {"l": 308.86203, "t": 319.22821000000005, "r": 545.11511, "b": 328.13477, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "by the PDF cell area.", "bbox": {"l": 308.86203, "t": 331.1842, "r": 397.19043, "b": 340.09076000000005, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "In case there are multiple matches", "bbox": {"l": 403.65616, "t": 331.1842, "r": 545.11511, "b": 340.09076000000005, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "for the same PDF cell, the prediction with the higher score", "bbox": {"l": 308.86203, "t": 343.13919, "r": 545.11511, "b": 352.04575, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "is preferred. This covers the cases where the PDF cells are", "bbox": {"l": 308.86203, "t": 355.09418, "r": 545.11505, "b": 364.00073, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "smaller than the area of predicted or corrected prediction", "bbox": {"l": 308.86203, "t": 367.04916, "r": 545.11505, "b": 375.95572000000004, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "cells.", "bbox": {"l": 308.86203, "t": 379.00415, "r": 329.61414, "b": 387.91071, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "8.", "bbox": {"l": 320.81702, "t": 391.31015, "r": 328.55356, "b": 400.2167099999999, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "In some rare occasions, we have noticed that Table-", "bbox": {"l": 331.13242, "t": 391.31015, "r": 545.11505, "b": 400.2167099999999, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "Former can confuse a single column as two. When the post-", "bbox": {"l": 308.86203, "t": 403.26514, "r": 545.11517, "b": 412.17169, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "processing steps are applied, this results with two predicted", "bbox": {"l": 308.86203, "t": 415.22012000000007, "r": 545.11511, "b": 424.12668, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "columns pointing to the same PDF column. In such case", "bbox": {"l": 308.86203, "t": 427.17511, "r": 545.11511, "b": 436.0816699999999, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "we must de-duplicate the columns according to highest to-", "bbox": {"l": 308.86203, "t": 439.1301, "r": 545.11505, "b": 448.03665, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "tal column intersection score.", "bbox": {"l": 308.86203, "t": 451.08507999999995, "r": 426.18161, "b": 459.99164, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "9.", "bbox": {"l": 320.81702, "t": 463.39108, "r": 328.67316, "b": 472.29764, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "Pick up the remaining orphan cells. There could be", "bbox": {"l": 331.29187, "t": 463.39108, "r": 545.11499, "b": 472.29764, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "cases, when after applying all the previous post-processing", "bbox": {"l": 308.86203, "t": 475.34607, "r": 545.11505, "b": 484.25262, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "steps, some PDF cells could still remain without any match", "bbox": {"l": 308.86203, "t": 487.30106, "r": 545.11517, "b": 496.20761, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "to predicted cells.", "bbox": {"l": 308.86203, "t": 499.25604, "r": 381.89786, "b": 508.1626, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "However, it is still possible to deduce", "bbox": {"l": 388.7023, "t": 499.25604, "r": 545.11517, "b": 508.1626, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "the correct matching for an orphan PDF cell by mapping its", "bbox": {"l": 308.86203, "t": 511.21204, "r": 545.11511, "b": 520.11859, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "bounding box on the geometry of the grid. This mapping", "bbox": {"l": 308.86203, "t": 523.16702, "r": 545.11505, "b": 532.07358, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "decides if the content of the orphan cell will be appended to", "bbox": {"l": 308.86203, "t": 535.12201, "r": 545.11499, "b": 544.02858, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "an already matched table cell, or a new table cell should be", "bbox": {"l": 308.86203, "t": 547.07703, "r": 545.11517, "b": 555.98358, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "created to match with the orphan.", "bbox": {"l": 308.86203, "t": 559.03203, "r": 442.22147000000007, "b": 567.93858, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "9a. Compute the top and bottom boundary of the hori-", "bbox": {"l": 320.81702, "t": 571.33803, "r": 545.11493, "b": 580.24458, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "zontal band for each grid row (min/max", "bbox": {"l": 308.86203, "t": 583.29303, "r": 471.64093, "b": 592.19958, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "y", "bbox": {"l": 474.83405, "t": 583.1336200000001, "r": 479.71872, "b": 591.98041, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "coordinates per", "bbox": {"l": 483.26903999999996, "t": 583.29303, "r": 545.11688, "b": 592.19958, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "row).", "bbox": {"l": 308.86206, "t": 595.24803, "r": 329.91306, "b": 604.15459, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "9b.", "bbox": {"l": 320.81705, "t": 607.55304, "r": 332.8718, "b": 616.4595899999999, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "Intersect the orphan\u2019s bounding box with the row", "bbox": {"l": 339.92532, "t": 607.55304, "r": 545.11505, "b": 616.4595899999999, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "bands, and map the cell to the closest grid row.", "bbox": {"l": 308.86206, "t": 619.50903, "r": 495.2923, "b": 628.4155900000001, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "9c. Compute the left and right boundary of the vertical", "bbox": {"l": 320.81705, "t": 631.81403, "r": 545.11505, "b": 640.72058, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "band for each grid column (min/max", "bbox": {"l": 308.86206, "t": 643.7690299999999, "r": 455.28238, "b": 652.67558, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "x", "bbox": {"l": 457.77704, "t": 643.60962, "r": 463.47067, "b": 652.45641, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "coordinates per col-", "bbox": {"l": 465.97104, "t": 643.7690299999999, "r": 545.11389, "b": 652.67558, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "umn).", "bbox": {"l": 308.86206, "t": 655.72403, "r": 332.38376, "b": 664.63059, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "9d. Intersect the orphan\u2019s bounding box with the column", "bbox": {"l": 320.81705, "t": 668.03003, "r": 545.11499, "b": 676.93659, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "bands, and map the cell to the closest grid column.", "bbox": {"l": 308.86206, "t": 679.98503, "r": 510.5848700000001, "b": 688.89159, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "9e. If the table cell under the identified row and column", "bbox": {"l": 320.81705, "t": 692.290024, "r": 545.11505, "b": 701.196594, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "is not empty, extend its content with the content of the or-", "bbox": {"l": 308.86206, "t": 704.245026, "r": 545.11517, "b": 713.151596, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": "12", "bbox": {"l": 292.63107, "t": 734.13303, "r": 302.59366, "b": 743.039593, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 30, "label": "picture", "bbox": {"l": 53.54228973388672, "t": 74.74851989746094, "r": 544.938232421875, "b": 147.5908966064453, "coord_origin": "TOPLEFT"}, "confidence": 0.6033812761306763, "cells": [{"id": 0, "text": "PubTabNet", "bbox": {"l": 119.39108, "t": 77.31055000000003, "r": 151.94641, "b": 83.25922000000003, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "b.", "bbox": {"l": 53.345978, "t": 75.19152999999994, "r": 59.327053, "b": 81.14020000000005, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "FinTabNet", "bbox": {"l": 289.5791, "t": 77.45830999999998, "r": 319.8266, "b": 83.40698000000009, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Table Bank", "bbox": {"l": 448.37271, "t": 77.25396999999987, "r": 481.75916, "b": 83.20263999999997, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Train", "bbox": {"l": 82.553436, "t": 141.27617999999995, "r": 94.976013, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Complex", "bbox": {"l": 63.03878399999999, "t": 101.10413000000005, "r": 85.290085, "b": 106.06133999999986, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Simple", "bbox": {"l": 67.76786, "t": 124.39531999999997, "r": 85.231277, "b": 129.35253999999998, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Complex", "bbox": {"l": 227.55121, "t": 102.53992000000005, "r": 249.80251, "b": 107.49712999999997, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Simple", "bbox": {"l": 232.19898999999998, "t": 126.98577999999986, "r": 249.66241, "b": 131.94299, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Simple", "bbox": {"l": 396.2337, "t": 114.04522999999995, "r": 413.69711, "b": 119.00243999999998, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Val", "bbox": {"l": 97.382202, "t": 141.27617999999995, "r": 105.08014, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "100%", "bbox": {"l": 60.93763400000001, "t": 85.73321999999996, "r": 76.151443, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "500K 10K", "bbox": {"l": 82.304901, "t": 86.22351000000003, "r": 106.99162, "b": 91.18073000000015, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Train Test Val", "bbox": {"l": 246.20530999999997, "t": 141.60608000000002, "r": 281.88013, "b": 146.56329000000005, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "100%", "bbox": {"l": 226.69780000000003, "t": 85.73321999999996, "r": 241.91161, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "91K 10K 10K", "bbox": {"l": 249.93848999999997, "t": 86.08801000000005, "r": 282.49384, "b": 91.04522999999995, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Train Test Val", "bbox": {"l": 410.19409, "t": 141.27617999999995, "r": 444.68915, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "100% 130K 5K", "bbox": {"l": 391.37341, "t": 85.73321999999996, "r": 432.6716599999999, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "10K", "bbox": {"l": 435.60571000000004, "t": 86.26140999999996, "r": 445.62414999999993, "b": 91.21862999999996, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Complex", "bbox": {"l": 113.94921, "t": 141.28845, "r": 136.20052, "b": 146.24567000000002, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Non", "bbox": {"l": 116.91554000000001, "t": 94.81853999999998, "r": 127.05433999999998, "b": 99.77575999999999, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Strict", "bbox": {"l": 113.3146, "t": 100.93853999999999, "r": 127.05298, "b": 105.89575000000002, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "HTML", "bbox": {"l": 112.94112, "t": 107.05853000000013, "r": 127.05537, "b": 112.01575000000003, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Strict", "bbox": {"l": 113.22738999999999, "t": 122.61523, "r": 126.96577, "b": 127.57245, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "HTML", "bbox": {"l": 112.85390000000001, "t": 128.73523, "r": 126.96814999999998, "b": 133.69244000000003, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "Simple", "bbox": {"l": 138.57864, "t": 141.43640000000005, "r": 156.04207, "b": 146.39362000000006, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "230K 280K", "bbox": {"l": 122.03101, "t": 86.2713, "r": 151.04185, "b": 91.22852, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "65K", "bbox": {"l": 311.65359, "t": 86.55498999999998, "r": 321.67203, "b": 91.5122100000001, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Complex", "bbox": {"l": 287.89441, "t": 141.71063000000004, "r": 310.14572, "b": 146.66785000000004, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Non", "bbox": {"l": 289.23572, "t": 93.07977000000005, "r": 299.37451, "b": 98.03698999999995, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Strict", "bbox": {"l": 285.63513, "t": 99.19976999999994, "r": 299.3735, "b": 104.15698000000009, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "HTML", "bbox": {"l": 285.26111, "t": 105.31975999999997, "r": 299.37537, "b": 110.27697999999998, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Strict", "bbox": {"l": 285.43109, "t": 120.38995, "r": 299.16946, "b": 125.34717, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "HTML", "bbox": {"l": 285.05713, "t": 126.50995, "r": 299.17139, "b": 131.46716000000004, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Simple", "bbox": {"l": 311.34592, "t": 141.71063000000004, "r": 328.80933, "b": 146.66785000000004, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "47K", "bbox": {"l": 299.58362, "t": 86.69353999999998, "r": 309.60205, "b": 91.65075999999999, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Simple", "bbox": {"l": 466.04077000000007, "t": 141.67169, "r": 483.50418, "b": 146.62891000000002, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "Non", "bbox": {"l": 459.02151, "t": 93.76116999999999, "r": 469.16031000000004, "b": 98.71838000000002, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "Strict", "bbox": {"l": 455.4209, "t": 99.88116000000002, "r": 469.15927000000005, "b": 104.83838000000003, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "HTML", "bbox": {"l": 455.04691, "t": 106.00116000000014, "r": 469.16115999999994, "b": 110.95836999999995, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "145K", "bbox": {"l": 467.39401, "t": 85.57239000000004, "r": 480.6545100000001, "b": 90.52959999999996, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Complex", "bbox": {"l": 160.37672, "t": 141.58385999999996, "r": 182.62802, "b": 146.54107999999997, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "Contain", "bbox": {"l": 153.74265, "t": 94.86481000000003, "r": 173.32664, "b": 99.82201999999995, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Missing", "bbox": {"l": 154.50967, "t": 100.98479999999995, "r": 173.3246, "b": 105.94202000000007, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "bboxes", "bbox": {"l": 155.27162, "t": 107.10479999999995, "r": 173.32664, "b": 112.06200999999987, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Contain", "bbox": {"l": 326.41302, "t": 107.23248000000001, "r": 345.99701, "b": 112.18970000000002, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "Missing", "bbox": {"l": 327.17972, "t": 113.35248000000001, "r": 345.99463, "b": 118.30969000000005, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "bboxes", "bbox": {"l": 327.94131, "t": 119.47247000000004, "r": 345.99634, "b": 124.42969000000005, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Dataset", "bbox": {"l": 488.9942, "t": 104.15374999999983, "r": 508.76384999999993, "b": 109.11095999999998, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "doesn't", "bbox": {"l": 490.1893, "t": 110.27373999999998, "r": 508.76349000000005, "b": 115.2309600000001, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "provide", "bbox": {"l": 489.72009, "t": 116.39373999999998, "r": 508.76758, "b": 121.35095000000013, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "bboxes", "bbox": {"l": 490.71121, "t": 122.51373000000001, "r": 508.76624, "b": 127.47095000000002, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Simple", "bbox": {"l": 185.37759, "t": 141.71118, "r": 202.84102, "b": 146.66840000000002, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "230K 280K", "bbox": {"l": 168.50357, "t": 86.13611000000003, "r": 197.52699, "b": 91.09331999999995, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "65K", "bbox": {"l": 357.3768, "t": 85.99707000000001, "r": 367.39523, "b": 90.95428000000004, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "Complex Simple", "bbox": {"l": 333.73151, "t": 141.62323000000004, "r": 374.92862, "b": 146.58043999999995, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "47K", "bbox": {"l": 345.69101, "t": 86.05591000000004, "r": 355.70944, "b": 91.01312000000007, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Simple", "bbox": {"l": 508.54248, "t": 141.37683000000004, "r": 526.00592, "b": 146.33405000000005, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "145K", "bbox": {"l": 510.44653000000005, "t": 86.09258999999986, "r": 523.70703, "b": 91.0498, "coord_origin": "TOPLEFT"}}], "children": [{"id": 26, "label": "text", "bbox": {"l": 119.39108, "t": 77.31055000000003, "r": 151.94641, "b": 83.25922000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 0, "text": "PubTabNet", "bbox": {"l": 119.39108, "t": 77.31055000000003, "r": 151.94641, "b": 83.25922000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 53.345978, "t": 75.19152999999994, "r": 59.327053, "b": 81.14020000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 1, "text": "b.", "bbox": {"l": 53.345978, "t": 75.19152999999994, "r": 59.327053, "b": 81.14020000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 289.5791, "t": 77.45830999999998, "r": 319.8266, "b": 83.40698000000009, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 2, "text": "FinTabNet", "bbox": {"l": 289.5791, "t": 77.45830999999998, "r": 319.8266, "b": 83.40698000000009, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 448.37271, "t": 77.25396999999987, "r": 481.75916, "b": 83.20263999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 3, "text": "Table Bank", "bbox": {"l": 448.37271, "t": 77.25396999999987, "r": 481.75916, "b": 83.20263999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 82.553436, "t": 141.27617999999995, "r": 94.976013, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 4, "text": "Train", "bbox": {"l": 82.553436, "t": 141.27617999999995, "r": 94.976013, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 63.03878399999999, "t": 101.10413000000005, "r": 85.290085, "b": 106.06133999999986, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 5, "text": "Complex", "bbox": {"l": 63.03878399999999, "t": 101.10413000000005, "r": 85.290085, "b": 106.06133999999986, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 67.76786, "t": 124.39531999999997, "r": 85.231277, "b": 129.35253999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": "Simple", "bbox": {"l": 67.76786, "t": 124.39531999999997, "r": 85.231277, "b": 129.35253999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 227.55121, "t": 102.53992000000005, "r": 249.80251, "b": 107.49712999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "Complex", "bbox": {"l": 227.55121, "t": 102.53992000000005, "r": 249.80251, "b": 107.49712999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 232.19898999999998, "t": 126.98577999999986, "r": 249.66241, "b": 131.94299, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "Simple", "bbox": {"l": 232.19898999999998, "t": 126.98577999999986, "r": 249.66241, "b": 131.94299, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 396.2337, "t": 114.04522999999995, "r": 413.69711, "b": 119.00243999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "Simple", "bbox": {"l": 396.2337, "t": 114.04522999999995, "r": 413.69711, "b": 119.00243999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 97.382202, "t": 141.27617999999995, "r": 105.08014, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "Val", "bbox": {"l": 97.382202, "t": 141.27617999999995, "r": 105.08014, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 60.93763400000001, "t": 85.73321999999996, "r": 76.151443, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "100%", "bbox": {"l": 60.93763400000001, "t": 85.73321999999996, "r": 76.151443, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 82.304901, "t": 86.22351000000003, "r": 106.99162, "b": 91.18073000000015, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "500K 10K", "bbox": {"l": 82.304901, "t": 86.22351000000003, "r": 106.99162, "b": 91.18073000000015, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 246.20530999999997, "t": 141.60608000000002, "r": 281.88013, "b": 146.56329000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "Train Test Val", "bbox": {"l": 246.20530999999997, "t": 141.60608000000002, "r": 281.88013, "b": 146.56329000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 226.69780000000003, "t": 85.73321999999996, "r": 241.91161, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "100%", "bbox": {"l": 226.69780000000003, "t": 85.73321999999996, "r": 241.91161, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 249.93848999999997, "t": 86.08801000000005, "r": 282.49384, "b": 91.04522999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "91K 10K 10K", "bbox": {"l": 249.93848999999997, "t": 86.08801000000005, "r": 282.49384, "b": 91.04522999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 410.19409, "t": 141.27617999999995, "r": 444.68915, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "Train Test Val", "bbox": {"l": 410.19409, "t": 141.27617999999995, "r": 444.68915, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 391.37341, "t": 85.73321999999996, "r": 432.6716599999999, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "100% 130K 5K", "bbox": {"l": 391.37341, "t": 85.73321999999996, "r": 432.6716599999999, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 435.60571000000004, "t": 86.26140999999996, "r": 445.62414999999993, "b": 91.21862999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "10K", "bbox": {"l": 435.60571000000004, "t": 86.26140999999996, "r": 445.62414999999993, "b": 91.21862999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 113.94921, "t": 141.28845, "r": 136.20052, "b": 146.24567000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "Complex", "bbox": {"l": 113.94921, "t": 141.28845, "r": 136.20052, "b": 146.24567000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 116.91554000000001, "t": 94.81853999999998, "r": 127.05433999999998, "b": 99.77575999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "Non", "bbox": {"l": 116.91554000000001, "t": 94.81853999999998, "r": 127.05433999999998, "b": 99.77575999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 113.3146, "t": 100.93853999999999, "r": 127.05298, "b": 105.89575000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "Strict", "bbox": {"l": 113.3146, "t": 100.93853999999999, "r": 127.05298, "b": 105.89575000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 112.94112, "t": 107.05853000000013, "r": 127.05537, "b": 112.01575000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "HTML", "bbox": {"l": 112.94112, "t": 107.05853000000013, "r": 127.05537, "b": 112.01575000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 113.22738999999999, "t": 122.61523, "r": 126.96577, "b": 127.57245, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "Strict", "bbox": {"l": 113.22738999999999, "t": 122.61523, "r": 126.96577, "b": 127.57245, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 112.85390000000001, "t": 128.73523, "r": 126.96814999999998, "b": 133.69244000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "HTML", "bbox": {"l": 112.85390000000001, "t": 128.73523, "r": 126.96814999999998, "b": 133.69244000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 138.57864, "t": 141.43640000000005, "r": 156.04207, "b": 146.39362000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "Simple", "bbox": {"l": 138.57864, "t": 141.43640000000005, "r": 156.04207, "b": 146.39362000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 122.03101, "t": 86.2713, "r": 151.04185, "b": 91.22852, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "230K 280K", "bbox": {"l": 122.03101, "t": 86.2713, "r": 151.04185, "b": 91.22852, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 311.65359, "t": 86.55498999999998, "r": 321.67203, "b": 91.5122100000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "65K", "bbox": {"l": 311.65359, "t": 86.55498999999998, "r": 321.67203, "b": 91.5122100000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 287.89441, "t": 141.71063000000004, "r": 310.14572, "b": 146.66785000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "Complex", "bbox": {"l": 287.89441, "t": 141.71063000000004, "r": 310.14572, "b": 146.66785000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 289.23572, "t": 93.07977000000005, "r": 299.37451, "b": 98.03698999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "Non", "bbox": {"l": 289.23572, "t": 93.07977000000005, "r": 299.37451, "b": 98.03698999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 285.63513, "t": 99.19976999999994, "r": 299.3735, "b": 104.15698000000009, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "Strict", "bbox": {"l": 285.63513, "t": 99.19976999999994, "r": 299.3735, "b": 104.15698000000009, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 285.26111, "t": 105.31975999999997, "r": 299.37537, "b": 110.27697999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "HTML", "bbox": {"l": 285.26111, "t": 105.31975999999997, "r": 299.37537, "b": 110.27697999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 285.43109, "t": 120.38995, "r": 299.16946, "b": 125.34717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "Strict", "bbox": {"l": 285.43109, "t": 120.38995, "r": 299.16946, "b": 125.34717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 285.05713, "t": 126.50995, "r": 299.17139, "b": 131.46716000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "HTML", "bbox": {"l": 285.05713, "t": 126.50995, "r": 299.17139, "b": 131.46716000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 311.34592, "t": 141.71063000000004, "r": 328.80933, "b": 146.66785000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "Simple", "bbox": {"l": 311.34592, "t": 141.71063000000004, "r": 328.80933, "b": 146.66785000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 299.58362, "t": 86.69353999999998, "r": 309.60205, "b": 91.65075999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "47K", "bbox": {"l": 299.58362, "t": 86.69353999999998, "r": 309.60205, "b": 91.65075999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 466.04077000000007, "t": 141.67169, "r": 483.50418, "b": 146.62891000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "Simple", "bbox": {"l": 466.04077000000007, "t": 141.67169, "r": 483.50418, "b": 146.62891000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 459.02151, "t": 93.76116999999999, "r": 469.16031000000004, "b": 98.71838000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "Non", "bbox": {"l": 459.02151, "t": 93.76116999999999, "r": 469.16031000000004, "b": 98.71838000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 455.4209, "t": 99.88116000000002, "r": 469.15927000000005, "b": 104.83838000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "Strict", "bbox": {"l": 455.4209, "t": 99.88116000000002, "r": 469.15927000000005, "b": 104.83838000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 455.04691, "t": 106.00116000000014, "r": 469.16115999999994, "b": 110.95836999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "HTML", "bbox": {"l": 455.04691, "t": 106.00116000000014, "r": 469.16115999999994, "b": 110.95836999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 467.39401, "t": 85.57239000000004, "r": 480.6545100000001, "b": 90.52959999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "145K", "bbox": {"l": 467.39401, "t": 85.57239000000004, "r": 480.6545100000001, "b": 90.52959999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 160.37672, "t": 141.58385999999996, "r": 182.62802, "b": 146.54107999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "Complex", "bbox": {"l": 160.37672, "t": 141.58385999999996, "r": 182.62802, "b": 146.54107999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 153.74265, "t": 94.86481000000003, "r": 173.32664, "b": 99.82201999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "Contain", "bbox": {"l": 153.74265, "t": 94.86481000000003, "r": 173.32664, "b": 99.82201999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 154.50967, "t": 100.98479999999995, "r": 173.3246, "b": 105.94202000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "Missing", "bbox": {"l": 154.50967, "t": 100.98479999999995, "r": 173.3246, "b": 105.94202000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 155.27162, "t": 107.10479999999995, "r": 173.32664, "b": 112.06200999999987, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "bboxes", "bbox": {"l": 155.27162, "t": 107.10479999999995, "r": 173.32664, "b": 112.06200999999987, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 326.41302, "t": 107.23248000000001, "r": 345.99701, "b": 112.18970000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "Contain", "bbox": {"l": 326.41302, "t": 107.23248000000001, "r": 345.99701, "b": 112.18970000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 327.17972, "t": 113.35248000000001, "r": 345.99463, "b": 118.30969000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "Missing", "bbox": {"l": 327.17972, "t": 113.35248000000001, "r": 345.99463, "b": 118.30969000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 327.94131, "t": 119.47247000000004, "r": 345.99634, "b": 124.42969000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "bboxes", "bbox": {"l": 327.94131, "t": 119.47247000000004, "r": 345.99634, "b": 124.42969000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 488.9942, "t": 104.15374999999983, "r": 508.76384999999993, "b": 109.11095999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "Dataset", "bbox": {"l": 488.9942, "t": 104.15374999999983, "r": 508.76384999999993, "b": 109.11095999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 490.1893, "t": 110.27373999999998, "r": 508.76349000000005, "b": 115.2309600000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "doesn't", "bbox": {"l": 490.1893, "t": 110.27373999999998, "r": 508.76349000000005, "b": 115.2309600000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 489.72009, "t": 116.39373999999998, "r": 508.76758, "b": 121.35095000000013, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "provide", "bbox": {"l": 489.72009, "t": 116.39373999999998, "r": 508.76758, "b": 121.35095000000013, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 490.71121, "t": 122.51373000000001, "r": 508.76624, "b": 127.47095000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "bboxes", "bbox": {"l": 490.71121, "t": 122.51373000000001, "r": 508.76624, "b": 127.47095000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 185.37759, "t": 141.71118, "r": 202.84102, "b": 146.66840000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "Simple", "bbox": {"l": 185.37759, "t": 141.71118, "r": 202.84102, "b": 146.66840000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 168.50357, "t": 86.13611000000003, "r": 197.52699, "b": 91.09331999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "230K 280K", "bbox": {"l": 168.50357, "t": 86.13611000000003, "r": 197.52699, "b": 91.09331999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 357.3768, "t": 85.99707000000001, "r": 367.39523, "b": 90.95428000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "65K", "bbox": {"l": 357.3768, "t": 85.99707000000001, "r": 367.39523, "b": 90.95428000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 333.73151, "t": 141.62323000000004, "r": 374.92862, "b": 146.58043999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "Complex Simple", "bbox": {"l": 333.73151, "t": 141.62323000000004, "r": 374.92862, "b": 146.58043999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 345.69101, "t": 86.05591000000004, "r": 355.70944, "b": 91.01312000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "47K", "bbox": {"l": 345.69101, "t": 86.05591000000004, "r": 355.70944, "b": 91.01312000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 508.54248, "t": 141.37683000000004, "r": 526.00592, "b": 146.33405000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "Simple", "bbox": {"l": 508.54248, "t": 141.37683000000004, "r": 526.00592, "b": 146.33405000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 510.44653000000005, "t": 86.09258999999986, "r": 523.70703, "b": 91.0498, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "145K", "bbox": {"l": 510.44653000000005, "t": 86.09258999999986, "r": 523.70703, "b": 91.0498, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 1, "label": "caption", "bbox": {"l": 50.112, "t": 165.50238000000002, "r": 545.11371, "b": 186.36395000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9661495685577393, "cells": [{"id": 59, "text": "Figure 7: Distribution of the tables across different dimensions per dataset. Simple vs complex tables per dataset and split,", "bbox": {"l": 50.112, "t": 165.50238000000002, "r": 545.11371, "b": 174.40894000000003, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "strict vs non strict html structures per dataset and table complexity, missing bboxes per dataset and table complexity.", "bbox": {"l": 50.112, "t": 177.4574, "r": 513.52234, "b": 186.36395000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "list_item", "bbox": {"l": 61.569, "t": 210.93140000000005, "r": 286.36511, "b": 231.79296999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9621952772140503, "cells": [{"id": 61, "text": "\u2022", "bbox": {"l": 61.569, "t": 210.93140000000005, "r": 71.14743, "b": 219.83794999999998, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "TableFormer output does not include the table cell con-", "bbox": {"l": 73.542038, "t": 210.93140000000005, "r": 286.36511, "b": 219.83794999999998, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "tent.", "bbox": {"l": 70.037003, "t": 222.88640999999996, "r": 87.47155, "b": 231.79296999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "list_item", "bbox": {"l": 61.569, "t": 244.07141000000001, "r": 286.36514, "b": 264.93298000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.96295565366745, "cells": [{"id": 64, "text": "\u2022", "bbox": {"l": 61.569, "t": 244.07141000000001, "r": 71.345718, "b": 252.97797000000003, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "There are occasional inaccuracies in the predictions of", "bbox": {"l": 73.789902, "t": 244.07141000000001, "r": 286.36514, "b": 252.97797000000003, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "the bounding boxes.", "bbox": {"l": 70.037003, "t": 256.02643, "r": 150.41524, "b": 264.93298000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 50.112, "t": 279.20343, "r": 286.36511, "b": 395.70688, "coord_origin": "TOPLEFT"}, "confidence": 0.9767084717750549, "cells": [{"id": 67, "text": "However, it is possible to mitigate those limitations by", "bbox": {"l": 62.067001, "t": 279.20343, "r": 286.36499, "b": 288.10999, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "combining the TableFormer predictions with the informa-", "bbox": {"l": 50.112, "t": 291.15842, "r": 286.36505, "b": 300.06497, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "tion already present inside a programmatic PDF document.", "bbox": {"l": 50.112, "t": 303.1134, "r": 286.36511, "b": 312.01996, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "More specifically, PDF documents can be seen as a se-", "bbox": {"l": 50.112, "t": 315.06839, "r": 286.36511, "b": 323.97495, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "quence of PDF cells where each cell is described by its con-", "bbox": {"l": 50.112, "t": 327.02438, "r": 286.36511, "b": 335.93093999999996, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "tent and bounding box. If we are able to associate the PDF", "bbox": {"l": 50.112, "t": 338.97937, "r": 286.36505, "b": 347.88593, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "cells with the predicted table cells, we can directly link the", "bbox": {"l": 50.112, "t": 350.93436, "r": 286.36508, "b": 359.84091, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "PDF cell content to the table cell structure and use the PDF", "bbox": {"l": 50.112, "t": 362.88934, "r": 286.36511, "b": 371.7959, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "bounding boxes to correct misalignments in the predicted", "bbox": {"l": 50.112, "t": 374.84433000000007, "r": 286.36508, "b": 383.75089, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "table cell bounding boxes.", "bbox": {"l": 50.112, "t": 386.80032, "r": 154.55988, "b": 395.70688, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 50.112, "t": 399.06934, "r": 286.36496, "b": 419.93188, "coord_origin": "TOPLEFT"}, "confidence": 0.9347665309906006, "cells": [{"id": 77, "text": "Here is a step-by-step description of the prediction post-", "bbox": {"l": 62.067001, "t": 399.06934, "r": 286.36496, "b": 407.97589, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "processing:", "bbox": {"l": 50.112, "t": 411.02533, "r": 95.491638, "b": 419.93188, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "list_item", "bbox": {"l": 50.112, "t": 423.29532, "r": 286.36508, "b": 456.11185000000006, "coord_origin": "TOPLEFT"}, "confidence": 0.8280701637268066, "cells": [{"id": 79, "text": "1.", "bbox": {"l": 62.067001, "t": 423.29532, "r": 69.37281, "b": 432.20187, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "Get the minimal grid dimensions - number of rows and", "bbox": {"l": 71.808075, "t": 423.29532, "r": 286.36502, "b": 432.20187, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "columns for the predicted table structure. This represents", "bbox": {"l": 50.112, "t": 435.25031, "r": 286.36508, "b": 444.15686, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "the most granular grid for the underlying table structure.", "bbox": {"l": 50.112, "t": 447.20529, "r": 274.50958, "b": 456.11185000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "list_item", "bbox": {"l": 50.112, "t": 459.47528, "r": 286.36505, "b": 504.2468, "coord_origin": "TOPLEFT"}, "confidence": 0.9646760821342468, "cells": [{"id": 83, "text": "2.", "bbox": {"l": 62.067001, "t": 459.47528, "r": 69.538948, "b": 468.38184, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "Generate pair-wise matches between the bounding", "bbox": {"l": 77.429329, "t": 459.47528, "r": 286.36499, "b": 468.38184, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "boxes of the PDF cells and the predicted cells. The Intersec-", "bbox": {"l": 50.112, "t": 471.43027, "r": 286.36505, "b": 480.33682, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "tion Over Union (IOU) metric is used to evaluate the quality", "bbox": {"l": 50.112, "t": 483.38525, "r": 286.36505, "b": 492.29181, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "of the matches.", "bbox": {"l": 50.112, "t": 495.34024, "r": 110.70452999999999, "b": 504.2468, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "list_item", "bbox": {"l": 50.112, "t": 507.61023, "r": 286.36493, "b": 528.4727800000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9391399025917053, "cells": [{"id": 88, "text": "3.", "bbox": {"l": 62.067001, "t": 507.61023, "r": 69.863068, "b": 516.5167799999999, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "Use a carefully selected IOU threshold to designate", "bbox": {"l": 72.461754, "t": 507.61023, "r": 286.36493, "b": 516.5167799999999, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "the matches as \u201cgood\u201d ones and \u201cbad\u201d ones.", "bbox": {"l": 50.112, "t": 519.5662199999999, "r": 226.0714, "b": 528.4727800000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "list_item", "bbox": {"l": 50.112, "t": 531.83521, "r": 286.36511, "b": 564.65277, "coord_origin": "TOPLEFT"}, "confidence": 0.9491711854934692, "cells": [{"id": 91, "text": "3.a. If all IOU scores in a column are below the thresh-", "bbox": {"l": 62.067001, "t": 531.83521, "r": 286.36496, "b": 540.7417800000001, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "old, discard all predictions (structure and bounding boxes)", "bbox": {"l": 50.112, "t": 543.79121, "r": 286.36511, "b": 552.69777, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "for that column.", "bbox": {"l": 50.112, "t": 555.74622, "r": 114.03204, "b": 564.65277, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "list_item", "bbox": {"l": 50.112, "t": 568.01622, "r": 286.36508, "b": 600.83278, "coord_origin": "TOPLEFT"}, "confidence": 0.9587164521217346, "cells": [{"id": 94, "text": "4.", "bbox": {"l": 62.067001, "t": 568.01622, "r": 69.538948, "b": 576.92278, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "Find the best-fitting content alignment for the pre-", "bbox": {"l": 76.731949, "t": 568.01622, "r": 286.36502, "b": 576.92278, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "dicted cells with good IOU per each column. The alignment", "bbox": {"l": 50.112, "t": 579.97122, "r": 286.36508, "b": 588.87778, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "of the column can be identified by the following formula:", "bbox": {"l": 50.112, "t": 591.9262200000001, "r": 278.70383, "b": 600.83278, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "formula", "bbox": {"l": 110.70499, "t": 623.43591, "r": 286.3624, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9298409819602966, "cells": [{"id": 98, "text": "alignment", "bbox": {"l": 112.02799999999999, "t": 623.99382, "r": 157.9516, "b": 632.84061, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "= arg min", "bbox": {"l": 160.715, "t": 623.99382, "r": 203.4964, "b": 632.84061, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "c", "bbox": {"l": 185.58499, "t": 633.98305, "r": 189.14511, "b": 640.17578, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "{", "bbox": {"l": 203.49899, "t": 623.43591, "r": 208.48029, "b": 632.84061, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "D$_{c}$", "bbox": {"l": 208.48099, "t": 623.99382, "r": 220.28911, "b": 632.84061, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "}", "bbox": {"l": 220.78699, "t": 623.43591, "r": 225.76828, "b": 632.84061, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "D$_{c}$", "bbox": {"l": 110.70499, "t": 645.25882, "r": 122.51310999999998, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "=", "bbox": {"l": 125.77899000000001, "t": 645.25882, "r": 133.52791, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "max", "bbox": {"l": 136.295, "t": 645.25882, "r": 156.00201, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "{", "bbox": {"l": 156.00299, "t": 644.70091, "r": 160.98428, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "x$_{c}$", "bbox": {"l": 160.98399, "t": 645.25882, "r": 170.23811, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "} \u2212", "bbox": {"l": 170.73599, "t": 644.70091, "r": 185.6779, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "min", "bbox": {"l": 187.894, "t": 645.25882, "r": 206.05283, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "{", "bbox": {"l": 206.054, "t": 644.70091, "r": 211.03529, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "x$_{c}$", "bbox": {"l": 211.035, "t": 645.25882, "r": 220.28912, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "}", "bbox": {"l": 220.787, "t": 644.70091, "r": 225.76829999999998, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "(4)", "bbox": {"l": 274.746, "t": 634.88522, "r": 286.3624, "b": 643.79178, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "text", "bbox": {"l": 50.112, "t": 667.3479199999999, "r": 286.362, "b": 688.92679, "coord_origin": "TOPLEFT"}, "confidence": 0.9545555114746094, "cells": [{"id": 115, "text": "where", "bbox": {"l": 50.112, "t": 668.06522, "r": 74.45063, "b": 676.97179, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "c", "bbox": {"l": 78.335999, "t": 667.90582, "r": 82.647812, "b": 676.75261, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "is one of", "bbox": {"l": 86.532997, "t": 668.06522, "r": 123.63372, "b": 676.97179, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "{", "bbox": {"l": 127.51899999999999, "t": 667.3479199999999, "r": 132.50029, "b": 676.75261, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "left, centroid, right", "bbox": {"l": 132.50099, "t": 668.06522, "r": 210.69743, "b": 676.97179, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "}", "bbox": {"l": 210.69699, "t": 667.3479199999999, "r": 215.67828, "b": 676.75261, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "and", "bbox": {"l": 219.56299, "t": 668.06522, "r": 233.94897000000003, "b": 676.97179, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "x$_{c}$", "bbox": {"l": 237.83499000000003, "t": 667.90582, "r": 247.08911, "b": 676.75261, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "is the x-", "bbox": {"l": 251.47299000000004, "t": 668.06522, "r": 286.362, "b": 676.97179, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "coordinate for the corresponding point.", "bbox": {"l": 50.112, "t": 680.02022, "r": 205.88721, "b": 688.92679, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "list_item", "bbox": {"l": 50.112, "t": 692.290222, "r": 286.36496, "b": 713.151787, "coord_origin": "TOPLEFT"}, "confidence": 0.9260510802268982, "cells": [{"id": 125, "text": "5.", "bbox": {"l": 62.067001, "t": 692.290222, "r": 69.538948, "b": 701.196785, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "Use the alignment computed in step 4, to compute", "bbox": {"l": 76.273666, "t": 692.290222, "r": 286.36496, "b": 701.196785, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "the median", "bbox": {"l": 50.112, "t": 704.245224, "r": 94.604973, "b": 713.151787, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "x", "bbox": {"l": 97.598999, "t": 704.085815, "r": 103.29263, "b": 712.93261, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "-coordinate for all table columns and the me-", "bbox": {"l": 103.292, "t": 704.245224, "r": 286.36481, "b": 713.151787, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 308.862, "t": 210.93120999999996, "r": 545.11517, "b": 255.7038, "coord_origin": "TOPLEFT"}, "confidence": 0.8942293524742126, "cells": [{"id": 130, "text": "dian cell size for all table cells. The usage of median dur-", "bbox": {"l": 308.862, "t": 210.93120999999996, "r": 545.11517, "b": 219.83776999999998, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "ing the computations, helps to eliminate outliers caused by", "bbox": {"l": 308.862, "t": 222.88720999999998, "r": 545.11511, "b": 231.79376000000002, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "occasional column spans which are usually wider than the", "bbox": {"l": 308.862, "t": 234.84222, "r": 545.11511, "b": 243.74878, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "normal.", "bbox": {"l": 308.862, "t": 246.79724, "r": 339.57669, "b": 255.7038, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "list_item", "bbox": {"l": 308.862, "t": 259.10222999999996, "r": 545.11499, "b": 279.96380999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9423391819000244, "cells": [{"id": 134, "text": "6.", "bbox": {"l": 320.81699, "t": 259.10222999999996, "r": 328.28894, "b": 268.00879, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "Snap all cells with bad IOU to their corresponding", "bbox": {"l": 334.88419, "t": 259.10222999999996, "r": 545.11499, "b": 268.00879, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "median", "bbox": {"l": 308.862, "t": 271.05724999999995, "r": 338.19189, "b": 279.96380999999997, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "x", "bbox": {"l": 340.68201, "t": 270.89783, "r": 346.37564, "b": 279.74463000000003, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "-coordinates and cell sizes.", "bbox": {"l": 346.37601, "t": 271.05724999999995, "r": 453.72305000000006, "b": 279.96380999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "list_item", "bbox": {"l": 308.86203, "t": 283.36325000000005, "r": 545.11511, "b": 387.91071, "coord_origin": "TOPLEFT"}, "confidence": 0.9562006592750549, "cells": [{"id": 139, "text": "7.", "bbox": {"l": 320.81702, "t": 283.36325000000005, "r": 328.38953, "b": 292.26981, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "Generate a new set of pair-wise matches between the", "bbox": {"l": 330.9137, "t": 283.36325000000005, "r": 545.11499, "b": 292.26981, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "corrected bounding boxes and PDF cells. This time use a", "bbox": {"l": 308.86203, "t": 295.31824, "r": 545.11511, "b": 304.22479, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "modified version of the IOU metric, where the area of the", "bbox": {"l": 308.86203, "t": 307.27322, "r": 545.11505, "b": 316.17978, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "intersection between the predicted and PDF cells is divided", "bbox": {"l": 308.86203, "t": 319.22821000000005, "r": 545.11511, "b": 328.13477, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "by the PDF cell area.", "bbox": {"l": 308.86203, "t": 331.1842, "r": 397.19043, "b": 340.09076000000005, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "In case there are multiple matches", "bbox": {"l": 403.65616, "t": 331.1842, "r": 545.11511, "b": 340.09076000000005, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "for the same PDF cell, the prediction with the higher score", "bbox": {"l": 308.86203, "t": 343.13919, "r": 545.11511, "b": 352.04575, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "is preferred. This covers the cases where the PDF cells are", "bbox": {"l": 308.86203, "t": 355.09418, "r": 545.11505, "b": 364.00073, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "smaller than the area of predicted or corrected prediction", "bbox": {"l": 308.86203, "t": 367.04916, "r": 545.11505, "b": 375.95572000000004, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "cells.", "bbox": {"l": 308.86203, "t": 379.00415, "r": 329.61414, "b": 387.91071, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "list_item", "bbox": {"l": 308.86203, "t": 391.31015, "r": 545.11517, "b": 459.99164, "coord_origin": "TOPLEFT"}, "confidence": 0.8719939589500427, "cells": [{"id": 150, "text": "8.", "bbox": {"l": 320.81702, "t": 391.31015, "r": 328.55356, "b": 400.2167099999999, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "In some rare occasions, we have noticed that Table-", "bbox": {"l": 331.13242, "t": 391.31015, "r": 545.11505, "b": 400.2167099999999, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "Former can confuse a single column as two. When the post-", "bbox": {"l": 308.86203, "t": 403.26514, "r": 545.11517, "b": 412.17169, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "processing steps are applied, this results with two predicted", "bbox": {"l": 308.86203, "t": 415.22012000000007, "r": 545.11511, "b": 424.12668, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "columns pointing to the same PDF column. In such case", "bbox": {"l": 308.86203, "t": 427.17511, "r": 545.11511, "b": 436.0816699999999, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "we must de-duplicate the columns according to highest to-", "bbox": {"l": 308.86203, "t": 439.1301, "r": 545.11505, "b": 448.03665, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "tal column intersection score.", "bbox": {"l": 308.86203, "t": 451.08507999999995, "r": 426.18161, "b": 459.99164, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "list_item", "bbox": {"l": 308.86203, "t": 463.39108, "r": 545.11517, "b": 567.93858, "coord_origin": "TOPLEFT"}, "confidence": 0.9126085042953491, "cells": [{"id": 157, "text": "9.", "bbox": {"l": 320.81702, "t": 463.39108, "r": 328.67316, "b": 472.29764, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "Pick up the remaining orphan cells. There could be", "bbox": {"l": 331.29187, "t": 463.39108, "r": 545.11499, "b": 472.29764, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "cases, when after applying all the previous post-processing", "bbox": {"l": 308.86203, "t": 475.34607, "r": 545.11505, "b": 484.25262, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "steps, some PDF cells could still remain without any match", "bbox": {"l": 308.86203, "t": 487.30106, "r": 545.11517, "b": 496.20761, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "to predicted cells.", "bbox": {"l": 308.86203, "t": 499.25604, "r": 381.89786, "b": 508.1626, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "However, it is still possible to deduce", "bbox": {"l": 388.7023, "t": 499.25604, "r": 545.11517, "b": 508.1626, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "the correct matching for an orphan PDF cell by mapping its", "bbox": {"l": 308.86203, "t": 511.21204, "r": 545.11511, "b": 520.11859, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "bounding box on the geometry of the grid. This mapping", "bbox": {"l": 308.86203, "t": 523.16702, "r": 545.11505, "b": 532.07358, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "decides if the content of the orphan cell will be appended to", "bbox": {"l": 308.86203, "t": 535.12201, "r": 545.11499, "b": 544.02858, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "an already matched table cell, or a new table cell should be", "bbox": {"l": 308.86203, "t": 547.07703, "r": 545.11517, "b": 555.98358, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "created to match with the orphan.", "bbox": {"l": 308.86203, "t": 559.03203, "r": 442.22147000000007, "b": 567.93858, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 308.86203, "t": 571.33803, "r": 545.11688, "b": 604.15459, "coord_origin": "TOPLEFT"}, "confidence": 0.8459475636482239, "cells": [{"id": 168, "text": "9a. Compute the top and bottom boundary of the hori-", "bbox": {"l": 320.81702, "t": 571.33803, "r": 545.11493, "b": 580.24458, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "zontal band for each grid row (min/max", "bbox": {"l": 308.86203, "t": 583.29303, "r": 471.64093, "b": 592.19958, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "y", "bbox": {"l": 474.83405, "t": 583.1336200000001, "r": 479.71872, "b": 591.98041, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "coordinates per", "bbox": {"l": 483.26903999999996, "t": 583.29303, "r": 545.11688, "b": 592.19958, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "row).", "bbox": {"l": 308.86206, "t": 595.24803, "r": 329.91306, "b": 604.15459, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "list_item", "bbox": {"l": 308.86206, "t": 607.55304, "r": 545.11505, "b": 628.4155900000001, "coord_origin": "TOPLEFT"}, "confidence": 0.7716898918151855, "cells": [{"id": 173, "text": "9b.", "bbox": {"l": 320.81705, "t": 607.55304, "r": 332.8718, "b": 616.4595899999999, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "Intersect the orphan\u2019s bounding box with the row", "bbox": {"l": 339.92532, "t": 607.55304, "r": 545.11505, "b": 616.4595899999999, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "bands, and map the cell to the closest grid row.", "bbox": {"l": 308.86206, "t": 619.50903, "r": 495.2923, "b": 628.4155900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "list_item", "bbox": {"l": 308.86206, "t": 631.81403, "r": 545.11505, "b": 664.63059, "coord_origin": "TOPLEFT"}, "confidence": 0.8584902882575989, "cells": [{"id": 176, "text": "9c. Compute the left and right boundary of the vertical", "bbox": {"l": 320.81705, "t": 631.81403, "r": 545.11505, "b": 640.72058, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "band for each grid column (min/max", "bbox": {"l": 308.86206, "t": 643.7690299999999, "r": 455.28238, "b": 652.67558, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "x", "bbox": {"l": 457.77704, "t": 643.60962, "r": 463.47067, "b": 652.45641, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "coordinates per col-", "bbox": {"l": 465.97104, "t": 643.7690299999999, "r": 545.11389, "b": 652.67558, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "umn).", "bbox": {"l": 308.86206, "t": 655.72403, "r": 332.38376, "b": 664.63059, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "list_item", "bbox": {"l": 308.86206, "t": 668.03003, "r": 545.11499, "b": 688.89159, "coord_origin": "TOPLEFT"}, "confidence": 0.759074866771698, "cells": [{"id": 181, "text": "9d. Intersect the orphan\u2019s bounding box with the column", "bbox": {"l": 320.81705, "t": 668.03003, "r": 545.11499, "b": 676.93659, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "bands, and map the cell to the closest grid column.", "bbox": {"l": 308.86206, "t": 679.98503, "r": 510.5848700000001, "b": 688.89159, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "list_item", "bbox": {"l": 308.86206, "t": 692.290024, "r": 545.11517, "b": 713.151596, "coord_origin": "TOPLEFT"}, "confidence": 0.6971189975738525, "cells": [{"id": 183, "text": "9e. If the table cell under the identified row and column", "bbox": {"l": 320.81705, "t": 692.290024, "r": 545.11505, "b": 701.196594, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "is not empty, extend its content with the content of the or-", "bbox": {"l": 308.86206, "t": 704.245026, "r": 545.11517, "b": 713.151596, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "page_footer", "bbox": {"l": 292.63107, "t": 734.13303, "r": 302.59366, "b": 743.039593, "coord_origin": "TOPLEFT"}, "confidence": 0.9126599431037903, "cells": [{"id": 185, "text": "12", "bbox": {"l": 292.63107, "t": 734.13303, "r": 302.59366, "b": 743.039593, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "picture", "id": 30, "page_no": 11, "cluster": {"id": 30, "label": "picture", "bbox": {"l": 53.54228973388672, "t": 74.74851989746094, "r": 544.938232421875, "b": 147.5908966064453, "coord_origin": "TOPLEFT"}, "confidence": 0.6033812761306763, "cells": [{"id": 0, "text": "PubTabNet", "bbox": {"l": 119.39108, "t": 77.31055000000003, "r": 151.94641, "b": 83.25922000000003, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "b.", "bbox": {"l": 53.345978, "t": 75.19152999999994, "r": 59.327053, "b": 81.14020000000005, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "FinTabNet", "bbox": {"l": 289.5791, "t": 77.45830999999998, "r": 319.8266, "b": 83.40698000000009, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Table Bank", "bbox": {"l": 448.37271, "t": 77.25396999999987, "r": 481.75916, "b": 83.20263999999997, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Train", "bbox": {"l": 82.553436, "t": 141.27617999999995, "r": 94.976013, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Complex", "bbox": {"l": 63.03878399999999, "t": 101.10413000000005, "r": 85.290085, "b": 106.06133999999986, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Simple", "bbox": {"l": 67.76786, "t": 124.39531999999997, "r": 85.231277, "b": 129.35253999999998, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Complex", "bbox": {"l": 227.55121, "t": 102.53992000000005, "r": 249.80251, "b": 107.49712999999997, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Simple", "bbox": {"l": 232.19898999999998, "t": 126.98577999999986, "r": 249.66241, "b": 131.94299, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Simple", "bbox": {"l": 396.2337, "t": 114.04522999999995, "r": 413.69711, "b": 119.00243999999998, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Val", "bbox": {"l": 97.382202, "t": 141.27617999999995, "r": 105.08014, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "100%", "bbox": {"l": 60.93763400000001, "t": 85.73321999999996, "r": 76.151443, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "500K 10K", "bbox": {"l": 82.304901, "t": 86.22351000000003, "r": 106.99162, "b": 91.18073000000015, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Train Test Val", "bbox": {"l": 246.20530999999997, "t": 141.60608000000002, "r": 281.88013, "b": 146.56329000000005, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "100%", "bbox": {"l": 226.69780000000003, "t": 85.73321999999996, "r": 241.91161, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "91K 10K 10K", "bbox": {"l": 249.93848999999997, "t": 86.08801000000005, "r": 282.49384, "b": 91.04522999999995, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Train Test Val", "bbox": {"l": 410.19409, "t": 141.27617999999995, "r": 444.68915, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "100% 130K 5K", "bbox": {"l": 391.37341, "t": 85.73321999999996, "r": 432.6716599999999, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "10K", "bbox": {"l": 435.60571000000004, "t": 86.26140999999996, "r": 445.62414999999993, "b": 91.21862999999996, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Complex", "bbox": {"l": 113.94921, "t": 141.28845, "r": 136.20052, "b": 146.24567000000002, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Non", "bbox": {"l": 116.91554000000001, "t": 94.81853999999998, "r": 127.05433999999998, "b": 99.77575999999999, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Strict", "bbox": {"l": 113.3146, "t": 100.93853999999999, "r": 127.05298, "b": 105.89575000000002, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "HTML", "bbox": {"l": 112.94112, "t": 107.05853000000013, "r": 127.05537, "b": 112.01575000000003, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Strict", "bbox": {"l": 113.22738999999999, "t": 122.61523, "r": 126.96577, "b": 127.57245, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "HTML", "bbox": {"l": 112.85390000000001, "t": 128.73523, "r": 126.96814999999998, "b": 133.69244000000003, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "Simple", "bbox": {"l": 138.57864, "t": 141.43640000000005, "r": 156.04207, "b": 146.39362000000006, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "230K 280K", "bbox": {"l": 122.03101, "t": 86.2713, "r": 151.04185, "b": 91.22852, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "65K", "bbox": {"l": 311.65359, "t": 86.55498999999998, "r": 321.67203, "b": 91.5122100000001, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Complex", "bbox": {"l": 287.89441, "t": 141.71063000000004, "r": 310.14572, "b": 146.66785000000004, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Non", "bbox": {"l": 289.23572, "t": 93.07977000000005, "r": 299.37451, "b": 98.03698999999995, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Strict", "bbox": {"l": 285.63513, "t": 99.19976999999994, "r": 299.3735, "b": 104.15698000000009, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "HTML", "bbox": {"l": 285.26111, "t": 105.31975999999997, "r": 299.37537, "b": 110.27697999999998, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Strict", "bbox": {"l": 285.43109, "t": 120.38995, "r": 299.16946, "b": 125.34717, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "HTML", "bbox": {"l": 285.05713, "t": 126.50995, "r": 299.17139, "b": 131.46716000000004, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Simple", "bbox": {"l": 311.34592, "t": 141.71063000000004, "r": 328.80933, "b": 146.66785000000004, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "47K", "bbox": {"l": 299.58362, "t": 86.69353999999998, "r": 309.60205, "b": 91.65075999999999, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Simple", "bbox": {"l": 466.04077000000007, "t": 141.67169, "r": 483.50418, "b": 146.62891000000002, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "Non", "bbox": {"l": 459.02151, "t": 93.76116999999999, "r": 469.16031000000004, "b": 98.71838000000002, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "Strict", "bbox": {"l": 455.4209, "t": 99.88116000000002, "r": 469.15927000000005, "b": 104.83838000000003, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "HTML", "bbox": {"l": 455.04691, "t": 106.00116000000014, "r": 469.16115999999994, "b": 110.95836999999995, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "145K", "bbox": {"l": 467.39401, "t": 85.57239000000004, "r": 480.6545100000001, "b": 90.52959999999996, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Complex", "bbox": {"l": 160.37672, "t": 141.58385999999996, "r": 182.62802, "b": 146.54107999999997, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "Contain", "bbox": {"l": 153.74265, "t": 94.86481000000003, "r": 173.32664, "b": 99.82201999999995, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Missing", "bbox": {"l": 154.50967, "t": 100.98479999999995, "r": 173.3246, "b": 105.94202000000007, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "bboxes", "bbox": {"l": 155.27162, "t": 107.10479999999995, "r": 173.32664, "b": 112.06200999999987, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Contain", "bbox": {"l": 326.41302, "t": 107.23248000000001, "r": 345.99701, "b": 112.18970000000002, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "Missing", "bbox": {"l": 327.17972, "t": 113.35248000000001, "r": 345.99463, "b": 118.30969000000005, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "bboxes", "bbox": {"l": 327.94131, "t": 119.47247000000004, "r": 345.99634, "b": 124.42969000000005, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Dataset", "bbox": {"l": 488.9942, "t": 104.15374999999983, "r": 508.76384999999993, "b": 109.11095999999998, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "doesn't", "bbox": {"l": 490.1893, "t": 110.27373999999998, "r": 508.76349000000005, "b": 115.2309600000001, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "provide", "bbox": {"l": 489.72009, "t": 116.39373999999998, "r": 508.76758, "b": 121.35095000000013, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "bboxes", "bbox": {"l": 490.71121, "t": 122.51373000000001, "r": 508.76624, "b": 127.47095000000002, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Simple", "bbox": {"l": 185.37759, "t": 141.71118, "r": 202.84102, "b": 146.66840000000002, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "230K 280K", "bbox": {"l": 168.50357, "t": 86.13611000000003, "r": 197.52699, "b": 91.09331999999995, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "65K", "bbox": {"l": 357.3768, "t": 85.99707000000001, "r": 367.39523, "b": 90.95428000000004, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "Complex Simple", "bbox": {"l": 333.73151, "t": 141.62323000000004, "r": 374.92862, "b": 146.58043999999995, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "47K", "bbox": {"l": 345.69101, "t": 86.05591000000004, "r": 355.70944, "b": 91.01312000000007, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Simple", "bbox": {"l": 508.54248, "t": 141.37683000000004, "r": 526.00592, "b": 146.33405000000005, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "145K", "bbox": {"l": 510.44653000000005, "t": 86.09258999999986, "r": 523.70703, "b": 91.0498, "coord_origin": "TOPLEFT"}}], "children": [{"id": 26, "label": "text", "bbox": {"l": 119.39108, "t": 77.31055000000003, "r": 151.94641, "b": 83.25922000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 0, "text": "PubTabNet", "bbox": {"l": 119.39108, "t": 77.31055000000003, "r": 151.94641, "b": 83.25922000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 53.345978, "t": 75.19152999999994, "r": 59.327053, "b": 81.14020000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 1, "text": "b.", "bbox": {"l": 53.345978, "t": 75.19152999999994, "r": 59.327053, "b": 81.14020000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 289.5791, "t": 77.45830999999998, "r": 319.8266, "b": 83.40698000000009, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 2, "text": "FinTabNet", "bbox": {"l": 289.5791, "t": 77.45830999999998, "r": 319.8266, "b": 83.40698000000009, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 448.37271, "t": 77.25396999999987, "r": 481.75916, "b": 83.20263999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 3, "text": "Table Bank", "bbox": {"l": 448.37271, "t": 77.25396999999987, "r": 481.75916, "b": 83.20263999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 82.553436, "t": 141.27617999999995, "r": 94.976013, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 4, "text": "Train", "bbox": {"l": 82.553436, "t": 141.27617999999995, "r": 94.976013, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 63.03878399999999, "t": 101.10413000000005, "r": 85.290085, "b": 106.06133999999986, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 5, "text": "Complex", "bbox": {"l": 63.03878399999999, "t": 101.10413000000005, "r": 85.290085, "b": 106.06133999999986, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 67.76786, "t": 124.39531999999997, "r": 85.231277, "b": 129.35253999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": "Simple", "bbox": {"l": 67.76786, "t": 124.39531999999997, "r": 85.231277, "b": 129.35253999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 227.55121, "t": 102.53992000000005, "r": 249.80251, "b": 107.49712999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "Complex", "bbox": {"l": 227.55121, "t": 102.53992000000005, "r": 249.80251, "b": 107.49712999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 232.19898999999998, "t": 126.98577999999986, "r": 249.66241, "b": 131.94299, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "Simple", "bbox": {"l": 232.19898999999998, "t": 126.98577999999986, "r": 249.66241, "b": 131.94299, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 396.2337, "t": 114.04522999999995, "r": 413.69711, "b": 119.00243999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "Simple", "bbox": {"l": 396.2337, "t": 114.04522999999995, "r": 413.69711, "b": 119.00243999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 97.382202, "t": 141.27617999999995, "r": 105.08014, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "Val", "bbox": {"l": 97.382202, "t": 141.27617999999995, "r": 105.08014, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 60.93763400000001, "t": 85.73321999999996, "r": 76.151443, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "100%", "bbox": {"l": 60.93763400000001, "t": 85.73321999999996, "r": 76.151443, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 82.304901, "t": 86.22351000000003, "r": 106.99162, "b": 91.18073000000015, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "500K 10K", "bbox": {"l": 82.304901, "t": 86.22351000000003, "r": 106.99162, "b": 91.18073000000015, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 246.20530999999997, "t": 141.60608000000002, "r": 281.88013, "b": 146.56329000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "Train Test Val", "bbox": {"l": 246.20530999999997, "t": 141.60608000000002, "r": 281.88013, "b": 146.56329000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 226.69780000000003, "t": 85.73321999999996, "r": 241.91161, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "100%", "bbox": {"l": 226.69780000000003, "t": 85.73321999999996, "r": 241.91161, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 249.93848999999997, "t": 86.08801000000005, "r": 282.49384, "b": 91.04522999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "91K 10K 10K", "bbox": {"l": 249.93848999999997, "t": 86.08801000000005, "r": 282.49384, "b": 91.04522999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 410.19409, "t": 141.27617999999995, "r": 444.68915, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "Train Test Val", "bbox": {"l": 410.19409, "t": 141.27617999999995, "r": 444.68915, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 391.37341, "t": 85.73321999999996, "r": 432.6716599999999, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "100% 130K 5K", "bbox": {"l": 391.37341, "t": 85.73321999999996, "r": 432.6716599999999, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 435.60571000000004, "t": 86.26140999999996, "r": 445.62414999999993, "b": 91.21862999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "10K", "bbox": {"l": 435.60571000000004, "t": 86.26140999999996, "r": 445.62414999999993, "b": 91.21862999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 113.94921, "t": 141.28845, "r": 136.20052, "b": 146.24567000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "Complex", "bbox": {"l": 113.94921, "t": 141.28845, "r": 136.20052, "b": 146.24567000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 116.91554000000001, "t": 94.81853999999998, "r": 127.05433999999998, "b": 99.77575999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "Non", "bbox": {"l": 116.91554000000001, "t": 94.81853999999998, "r": 127.05433999999998, "b": 99.77575999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 113.3146, "t": 100.93853999999999, "r": 127.05298, "b": 105.89575000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "Strict", "bbox": {"l": 113.3146, "t": 100.93853999999999, "r": 127.05298, "b": 105.89575000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 112.94112, "t": 107.05853000000013, "r": 127.05537, "b": 112.01575000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "HTML", "bbox": {"l": 112.94112, "t": 107.05853000000013, "r": 127.05537, "b": 112.01575000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 113.22738999999999, "t": 122.61523, "r": 126.96577, "b": 127.57245, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "Strict", "bbox": {"l": 113.22738999999999, "t": 122.61523, "r": 126.96577, "b": 127.57245, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 112.85390000000001, "t": 128.73523, "r": 126.96814999999998, "b": 133.69244000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "HTML", "bbox": {"l": 112.85390000000001, "t": 128.73523, "r": 126.96814999999998, "b": 133.69244000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 138.57864, "t": 141.43640000000005, "r": 156.04207, "b": 146.39362000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "Simple", "bbox": {"l": 138.57864, "t": 141.43640000000005, "r": 156.04207, "b": 146.39362000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 122.03101, "t": 86.2713, "r": 151.04185, "b": 91.22852, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "230K 280K", "bbox": {"l": 122.03101, "t": 86.2713, "r": 151.04185, "b": 91.22852, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 311.65359, "t": 86.55498999999998, "r": 321.67203, "b": 91.5122100000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "65K", "bbox": {"l": 311.65359, "t": 86.55498999999998, "r": 321.67203, "b": 91.5122100000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 287.89441, "t": 141.71063000000004, "r": 310.14572, "b": 146.66785000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "Complex", "bbox": {"l": 287.89441, "t": 141.71063000000004, "r": 310.14572, "b": 146.66785000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 289.23572, "t": 93.07977000000005, "r": 299.37451, "b": 98.03698999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "Non", "bbox": {"l": 289.23572, "t": 93.07977000000005, "r": 299.37451, "b": 98.03698999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 285.63513, "t": 99.19976999999994, "r": 299.3735, "b": 104.15698000000009, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "Strict", "bbox": {"l": 285.63513, "t": 99.19976999999994, "r": 299.3735, "b": 104.15698000000009, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 285.26111, "t": 105.31975999999997, "r": 299.37537, "b": 110.27697999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "HTML", "bbox": {"l": 285.26111, "t": 105.31975999999997, "r": 299.37537, "b": 110.27697999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 285.43109, "t": 120.38995, "r": 299.16946, "b": 125.34717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "Strict", "bbox": {"l": 285.43109, "t": 120.38995, "r": 299.16946, "b": 125.34717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 285.05713, "t": 126.50995, "r": 299.17139, "b": 131.46716000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "HTML", "bbox": {"l": 285.05713, "t": 126.50995, "r": 299.17139, "b": 131.46716000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 311.34592, "t": 141.71063000000004, "r": 328.80933, "b": 146.66785000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "Simple", "bbox": {"l": 311.34592, "t": 141.71063000000004, "r": 328.80933, "b": 146.66785000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 299.58362, "t": 86.69353999999998, "r": 309.60205, "b": 91.65075999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "47K", "bbox": {"l": 299.58362, "t": 86.69353999999998, "r": 309.60205, "b": 91.65075999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 466.04077000000007, "t": 141.67169, "r": 483.50418, "b": 146.62891000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "Simple", "bbox": {"l": 466.04077000000007, "t": 141.67169, "r": 483.50418, "b": 146.62891000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 459.02151, "t": 93.76116999999999, "r": 469.16031000000004, "b": 98.71838000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "Non", "bbox": {"l": 459.02151, "t": 93.76116999999999, "r": 469.16031000000004, "b": 98.71838000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 455.4209, "t": 99.88116000000002, "r": 469.15927000000005, "b": 104.83838000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "Strict", "bbox": {"l": 455.4209, "t": 99.88116000000002, "r": 469.15927000000005, "b": 104.83838000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 455.04691, "t": 106.00116000000014, "r": 469.16115999999994, "b": 110.95836999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "HTML", "bbox": {"l": 455.04691, "t": 106.00116000000014, "r": 469.16115999999994, "b": 110.95836999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 467.39401, "t": 85.57239000000004, "r": 480.6545100000001, "b": 90.52959999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "145K", "bbox": {"l": 467.39401, "t": 85.57239000000004, "r": 480.6545100000001, "b": 90.52959999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 160.37672, "t": 141.58385999999996, "r": 182.62802, "b": 146.54107999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "Complex", "bbox": {"l": 160.37672, "t": 141.58385999999996, "r": 182.62802, "b": 146.54107999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 153.74265, "t": 94.86481000000003, "r": 173.32664, "b": 99.82201999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "Contain", "bbox": {"l": 153.74265, "t": 94.86481000000003, "r": 173.32664, "b": 99.82201999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 154.50967, "t": 100.98479999999995, "r": 173.3246, "b": 105.94202000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "Missing", "bbox": {"l": 154.50967, "t": 100.98479999999995, "r": 173.3246, "b": 105.94202000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 155.27162, "t": 107.10479999999995, "r": 173.32664, "b": 112.06200999999987, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "bboxes", "bbox": {"l": 155.27162, "t": 107.10479999999995, "r": 173.32664, "b": 112.06200999999987, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 326.41302, "t": 107.23248000000001, "r": 345.99701, "b": 112.18970000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "Contain", "bbox": {"l": 326.41302, "t": 107.23248000000001, "r": 345.99701, "b": 112.18970000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 327.17972, "t": 113.35248000000001, "r": 345.99463, "b": 118.30969000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "Missing", "bbox": {"l": 327.17972, "t": 113.35248000000001, "r": 345.99463, "b": 118.30969000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 327.94131, "t": 119.47247000000004, "r": 345.99634, "b": 124.42969000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "bboxes", "bbox": {"l": 327.94131, "t": 119.47247000000004, "r": 345.99634, "b": 124.42969000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 488.9942, "t": 104.15374999999983, "r": 508.76384999999993, "b": 109.11095999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "Dataset", "bbox": {"l": 488.9942, "t": 104.15374999999983, "r": 508.76384999999993, "b": 109.11095999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 490.1893, "t": 110.27373999999998, "r": 508.76349000000005, "b": 115.2309600000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "doesn't", "bbox": {"l": 490.1893, "t": 110.27373999999998, "r": 508.76349000000005, "b": 115.2309600000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 489.72009, "t": 116.39373999999998, "r": 508.76758, "b": 121.35095000000013, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "provide", "bbox": {"l": 489.72009, "t": 116.39373999999998, "r": 508.76758, "b": 121.35095000000013, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 490.71121, "t": 122.51373000000001, "r": 508.76624, "b": 127.47095000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "bboxes", "bbox": {"l": 490.71121, "t": 122.51373000000001, "r": 508.76624, "b": 127.47095000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 185.37759, "t": 141.71118, "r": 202.84102, "b": 146.66840000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "Simple", "bbox": {"l": 185.37759, "t": 141.71118, "r": 202.84102, "b": 146.66840000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 168.50357, "t": 86.13611000000003, "r": 197.52699, "b": 91.09331999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "230K 280K", "bbox": {"l": 168.50357, "t": 86.13611000000003, "r": 197.52699, "b": 91.09331999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 357.3768, "t": 85.99707000000001, "r": 367.39523, "b": 90.95428000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "65K", "bbox": {"l": 357.3768, "t": 85.99707000000001, "r": 367.39523, "b": 90.95428000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 333.73151, "t": 141.62323000000004, "r": 374.92862, "b": 146.58043999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "Complex Simple", "bbox": {"l": 333.73151, "t": 141.62323000000004, "r": 374.92862, "b": 146.58043999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 345.69101, "t": 86.05591000000004, "r": 355.70944, "b": 91.01312000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "47K", "bbox": {"l": 345.69101, "t": 86.05591000000004, "r": 355.70944, "b": 91.01312000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 508.54248, "t": 141.37683000000004, "r": 526.00592, "b": 146.33405000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "Simple", "bbox": {"l": 508.54248, "t": 141.37683000000004, "r": 526.00592, "b": 146.33405000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 510.44653000000005, "t": 86.09258999999986, "r": 523.70703, "b": 91.0498, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "145K", "bbox": {"l": 510.44653000000005, "t": 86.09258999999986, "r": 523.70703, "b": 91.0498, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "caption", "id": 1, "page_no": 11, "cluster": {"id": 1, "label": "caption", "bbox": {"l": 50.112, "t": 165.50238000000002, "r": 545.11371, "b": 186.36395000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9661495685577393, "cells": [{"id": 59, "text": "Figure 7: Distribution of the tables across different dimensions per dataset. Simple vs complex tables per dataset and split,", "bbox": {"l": 50.112, "t": 165.50238000000002, "r": 545.11371, "b": 174.40894000000003, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "strict vs non strict html structures per dataset and table complexity, missing bboxes per dataset and table complexity.", "bbox": {"l": 50.112, "t": 177.4574, "r": 513.52234, "b": 186.36395000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 7: Distribution of the tables across different dimensions per dataset. Simple vs complex tables per dataset and split, strict vs non strict html structures per dataset and table complexity, missing bboxes per dataset and table complexity."}, {"label": "list_item", "id": 4, "page_no": 11, "cluster": {"id": 4, "label": "list_item", "bbox": {"l": 61.569, "t": 210.93140000000005, "r": 286.36511, "b": 231.79296999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9621952772140503, "cells": [{"id": 61, "text": "\u2022", "bbox": {"l": 61.569, "t": 210.93140000000005, "r": 71.14743, "b": 219.83794999999998, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "TableFormer output does not include the table cell con-", "bbox": {"l": 73.542038, "t": 210.93140000000005, "r": 286.36511, "b": 219.83794999999998, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "tent.", "bbox": {"l": 70.037003, "t": 222.88640999999996, "r": 87.47155, "b": 231.79296999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u2022 TableFormer output does not include the table cell content."}, {"label": "list_item", "id": 3, "page_no": 11, "cluster": {"id": 3, "label": "list_item", "bbox": {"l": 61.569, "t": 244.07141000000001, "r": 286.36514, "b": 264.93298000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.96295565366745, "cells": [{"id": 64, "text": "\u2022", "bbox": {"l": 61.569, "t": 244.07141000000001, "r": 71.345718, "b": 252.97797000000003, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "There are occasional inaccuracies in the predictions of", "bbox": {"l": 73.789902, "t": 244.07141000000001, "r": 286.36514, "b": 252.97797000000003, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "the bounding boxes.", "bbox": {"l": 70.037003, "t": 256.02643, "r": 150.41524, "b": 264.93298000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u2022 There are occasional inaccuracies in the predictions of the bounding boxes."}, {"label": "text", "id": 0, "page_no": 11, "cluster": {"id": 0, "label": "text", "bbox": {"l": 50.112, "t": 279.20343, "r": 286.36511, "b": 395.70688, "coord_origin": "TOPLEFT"}, "confidence": 0.9767084717750549, "cells": [{"id": 67, "text": "However, it is possible to mitigate those limitations by", "bbox": {"l": 62.067001, "t": 279.20343, "r": 286.36499, "b": 288.10999, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "combining the TableFormer predictions with the informa-", "bbox": {"l": 50.112, "t": 291.15842, "r": 286.36505, "b": 300.06497, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "tion already present inside a programmatic PDF document.", "bbox": {"l": 50.112, "t": 303.1134, "r": 286.36511, "b": 312.01996, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "More specifically, PDF documents can be seen as a se-", "bbox": {"l": 50.112, "t": 315.06839, "r": 286.36511, "b": 323.97495, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "quence of PDF cells where each cell is described by its con-", "bbox": {"l": 50.112, "t": 327.02438, "r": 286.36511, "b": 335.93093999999996, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "tent and bounding box. If we are able to associate the PDF", "bbox": {"l": 50.112, "t": 338.97937, "r": 286.36505, "b": 347.88593, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "cells with the predicted table cells, we can directly link the", "bbox": {"l": 50.112, "t": 350.93436, "r": 286.36508, "b": 359.84091, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "PDF cell content to the table cell structure and use the PDF", "bbox": {"l": 50.112, "t": 362.88934, "r": 286.36511, "b": 371.7959, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "bounding boxes to correct misalignments in the predicted", "bbox": {"l": 50.112, "t": 374.84433000000007, "r": 286.36508, "b": 383.75089, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "table cell bounding boxes.", "bbox": {"l": 50.112, "t": 386.80032, "r": 154.55988, "b": 395.70688, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "However, it is possible to mitigate those limitations by combining the TableFormer predictions with the information already present inside a programmatic PDF document. More specifically, PDF documents can be seen as a sequence of PDF cells where each cell is described by its content and bounding box. If we are able to associate the PDF cells with the predicted table cells, we can directly link the PDF cell content to the table cell structure and use the PDF bounding boxes to correct misalignments in the predicted table cell bounding boxes."}, {"label": "text", "id": 11, "page_no": 11, "cluster": {"id": 11, "label": "text", "bbox": {"l": 50.112, "t": 399.06934, "r": 286.36496, "b": 419.93188, "coord_origin": "TOPLEFT"}, "confidence": 0.9347665309906006, "cells": [{"id": 77, "text": "Here is a step-by-step description of the prediction post-", "bbox": {"l": 62.067001, "t": 399.06934, "r": 286.36496, "b": 407.97589, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "processing:", "bbox": {"l": 50.112, "t": 411.02533, "r": 95.491638, "b": 419.93188, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Here is a step-by-step description of the prediction postprocessing:"}, {"label": "list_item", "id": 20, "page_no": 11, "cluster": {"id": 20, "label": "list_item", "bbox": {"l": 50.112, "t": 423.29532, "r": 286.36508, "b": 456.11185000000006, "coord_origin": "TOPLEFT"}, "confidence": 0.8280701637268066, "cells": [{"id": 79, "text": "1.", "bbox": {"l": 62.067001, "t": 423.29532, "r": 69.37281, "b": 432.20187, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "Get the minimal grid dimensions - number of rows and", "bbox": {"l": 71.808075, "t": 423.29532, "r": 286.36502, "b": 432.20187, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "columns for the predicted table structure. This represents", "bbox": {"l": 50.112, "t": 435.25031, "r": 286.36508, "b": 444.15686, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "the most granular grid for the underlying table structure.", "bbox": {"l": 50.112, "t": 447.20529, "r": 274.50958, "b": 456.11185000000006, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1. Get the minimal grid dimensions - number of rows and columns for the predicted table structure. This represents the most granular grid for the underlying table structure."}, {"label": "list_item", "id": 2, "page_no": 11, "cluster": {"id": 2, "label": "list_item", "bbox": {"l": 50.112, "t": 459.47528, "r": 286.36505, "b": 504.2468, "coord_origin": "TOPLEFT"}, "confidence": 0.9646760821342468, "cells": [{"id": 83, "text": "2.", "bbox": {"l": 62.067001, "t": 459.47528, "r": 69.538948, "b": 468.38184, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "Generate pair-wise matches between the bounding", "bbox": {"l": 77.429329, "t": 459.47528, "r": 286.36499, "b": 468.38184, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "boxes of the PDF cells and the predicted cells. The Intersec-", "bbox": {"l": 50.112, "t": 471.43027, "r": 286.36505, "b": 480.33682, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "tion Over Union (IOU) metric is used to evaluate the quality", "bbox": {"l": 50.112, "t": 483.38525, "r": 286.36505, "b": 492.29181, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "of the matches.", "bbox": {"l": 50.112, "t": 495.34024, "r": 110.70452999999999, "b": 504.2468, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2. Generate pair-wise matches between the bounding boxes of the PDF cells and the predicted cells. The Intersection Over Union (IOU) metric is used to evaluate the quality of the matches."}, {"label": "list_item", "id": 10, "page_no": 11, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 50.112, "t": 507.61023, "r": 286.36493, "b": 528.4727800000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9391399025917053, "cells": [{"id": 88, "text": "3.", "bbox": {"l": 62.067001, "t": 507.61023, "r": 69.863068, "b": 516.5167799999999, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "Use a carefully selected IOU threshold to designate", "bbox": {"l": 72.461754, "t": 507.61023, "r": 286.36493, "b": 516.5167799999999, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "the matches as \u201cgood\u201d ones and \u201cbad\u201d ones.", "bbox": {"l": 50.112, "t": 519.5662199999999, "r": 226.0714, "b": 528.4727800000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3. Use a carefully selected IOU threshold to designate the matches as \u201cgood\u201d ones and \u201cbad\u201d ones."}, {"label": "list_item", "id": 8, "page_no": 11, "cluster": {"id": 8, "label": "list_item", "bbox": {"l": 50.112, "t": 531.83521, "r": 286.36511, "b": 564.65277, "coord_origin": "TOPLEFT"}, "confidence": 0.9491711854934692, "cells": [{"id": 91, "text": "3.a. If all IOU scores in a column are below the thresh-", "bbox": {"l": 62.067001, "t": 531.83521, "r": 286.36496, "b": 540.7417800000001, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "old, discard all predictions (structure and bounding boxes)", "bbox": {"l": 50.112, "t": 543.79121, "r": 286.36511, "b": 552.69777, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "for that column.", "bbox": {"l": 50.112, "t": 555.74622, "r": 114.03204, "b": 564.65277, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3.a. If all IOU scores in a column are below the threshold, discard all predictions (structure and bounding boxes) for that column."}, {"label": "list_item", "id": 5, "page_no": 11, "cluster": {"id": 5, "label": "list_item", "bbox": {"l": 50.112, "t": 568.01622, "r": 286.36508, "b": 600.83278, "coord_origin": "TOPLEFT"}, "confidence": 0.9587164521217346, "cells": [{"id": 94, "text": "4.", "bbox": {"l": 62.067001, "t": 568.01622, "r": 69.538948, "b": 576.92278, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "Find the best-fitting content alignment for the pre-", "bbox": {"l": 76.731949, "t": 568.01622, "r": 286.36502, "b": 576.92278, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "dicted cells with good IOU per each column. The alignment", "bbox": {"l": 50.112, "t": 579.97122, "r": 286.36508, "b": 588.87778, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "of the column can be identified by the following formula:", "bbox": {"l": 50.112, "t": 591.9262200000001, "r": 278.70383, "b": 600.83278, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4. Find the best-fitting content alignment for the predicted cells with good IOU per each column. The alignment of the column can be identified by the following formula:"}, {"label": "formula", "id": 12, "page_no": 11, "cluster": {"id": 12, "label": "formula", "bbox": {"l": 110.70499, "t": 623.43591, "r": 286.3624, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9298409819602966, "cells": [{"id": 98, "text": "alignment", "bbox": {"l": 112.02799999999999, "t": 623.99382, "r": 157.9516, "b": 632.84061, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "= arg min", "bbox": {"l": 160.715, "t": 623.99382, "r": 203.4964, "b": 632.84061, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "c", "bbox": {"l": 185.58499, "t": 633.98305, "r": 189.14511, "b": 640.17578, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "{", "bbox": {"l": 203.49899, "t": 623.43591, "r": 208.48029, "b": 632.84061, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "D$_{c}$", "bbox": {"l": 208.48099, "t": 623.99382, "r": 220.28911, "b": 632.84061, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "}", "bbox": {"l": 220.78699, "t": 623.43591, "r": 225.76828, "b": 632.84061, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "D$_{c}$", "bbox": {"l": 110.70499, "t": 645.25882, "r": 122.51310999999998, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "=", "bbox": {"l": 125.77899000000001, "t": 645.25882, "r": 133.52791, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "max", "bbox": {"l": 136.295, "t": 645.25882, "r": 156.00201, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "{", "bbox": {"l": 156.00299, "t": 644.70091, "r": 160.98428, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "x$_{c}$", "bbox": {"l": 160.98399, "t": 645.25882, "r": 170.23811, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "} \u2212", "bbox": {"l": 170.73599, "t": 644.70091, "r": 185.6779, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "min", "bbox": {"l": 187.894, "t": 645.25882, "r": 206.05283, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "{", "bbox": {"l": 206.054, "t": 644.70091, "r": 211.03529, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "x$_{c}$", "bbox": {"l": 211.035, "t": 645.25882, "r": 220.28912, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "}", "bbox": {"l": 220.787, "t": 644.70091, "r": 225.76829999999998, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "(4)", "bbox": {"l": 274.746, "t": 634.88522, "r": 286.3624, "b": 643.79178, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "alignment = arg min c { D$_{c}$ } D$_{c}$ = max { x$_{c}$ } \u2212 min { x$_{c}$ } (4)"}, {"label": "text", "id": 7, "page_no": 11, "cluster": {"id": 7, "label": "text", "bbox": {"l": 50.112, "t": 667.3479199999999, "r": 286.362, "b": 688.92679, "coord_origin": "TOPLEFT"}, "confidence": 0.9545555114746094, "cells": [{"id": 115, "text": "where", "bbox": {"l": 50.112, "t": 668.06522, "r": 74.45063, "b": 676.97179, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "c", "bbox": {"l": 78.335999, "t": 667.90582, "r": 82.647812, "b": 676.75261, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "is one of", "bbox": {"l": 86.532997, "t": 668.06522, "r": 123.63372, "b": 676.97179, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "{", "bbox": {"l": 127.51899999999999, "t": 667.3479199999999, "r": 132.50029, "b": 676.75261, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "left, centroid, right", "bbox": {"l": 132.50099, "t": 668.06522, "r": 210.69743, "b": 676.97179, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "}", "bbox": {"l": 210.69699, "t": 667.3479199999999, "r": 215.67828, "b": 676.75261, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "and", "bbox": {"l": 219.56299, "t": 668.06522, "r": 233.94897000000003, "b": 676.97179, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "x$_{c}$", "bbox": {"l": 237.83499000000003, "t": 667.90582, "r": 247.08911, "b": 676.75261, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "is the x-", "bbox": {"l": 251.47299000000004, "t": 668.06522, "r": 286.362, "b": 676.97179, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "coordinate for the corresponding point.", "bbox": {"l": 50.112, "t": 680.02022, "r": 205.88721, "b": 688.92679, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "where c is one of { left, centroid, right } and x$_{c}$ is the xcoordinate for the corresponding point."}, {"label": "list_item", "id": 13, "page_no": 11, "cluster": {"id": 13, "label": "list_item", "bbox": {"l": 50.112, "t": 692.290222, "r": 286.36496, "b": 713.151787, "coord_origin": "TOPLEFT"}, "confidence": 0.9260510802268982, "cells": [{"id": 125, "text": "5.", "bbox": {"l": 62.067001, "t": 692.290222, "r": 69.538948, "b": 701.196785, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "Use the alignment computed in step 4, to compute", "bbox": {"l": 76.273666, "t": 692.290222, "r": 286.36496, "b": 701.196785, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "the median", "bbox": {"l": 50.112, "t": 704.245224, "r": 94.604973, "b": 713.151787, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "x", "bbox": {"l": 97.598999, "t": 704.085815, "r": 103.29263, "b": 712.93261, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "-coordinate for all table columns and the me-", "bbox": {"l": 103.292, "t": 704.245224, "r": 286.36481, "b": 713.151787, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5. Use the alignment computed in step 4, to compute the median x -coordinate for all table columns and the me-"}, {"label": "text", "id": 16, "page_no": 11, "cluster": {"id": 16, "label": "text", "bbox": {"l": 308.862, "t": 210.93120999999996, "r": 545.11517, "b": 255.7038, "coord_origin": "TOPLEFT"}, "confidence": 0.8942293524742126, "cells": [{"id": 130, "text": "dian cell size for all table cells. The usage of median dur-", "bbox": {"l": 308.862, "t": 210.93120999999996, "r": 545.11517, "b": 219.83776999999998, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "ing the computations, helps to eliminate outliers caused by", "bbox": {"l": 308.862, "t": 222.88720999999998, "r": 545.11511, "b": 231.79376000000002, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "occasional column spans which are usually wider than the", "bbox": {"l": 308.862, "t": 234.84222, "r": 545.11511, "b": 243.74878, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "normal.", "bbox": {"l": 308.862, "t": 246.79724, "r": 339.57669, "b": 255.7038, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "dian cell size for all table cells. The usage of median during the computations, helps to eliminate outliers caused by occasional column spans which are usually wider than the normal."}, {"label": "list_item", "id": 9, "page_no": 11, "cluster": {"id": 9, "label": "list_item", "bbox": {"l": 308.862, "t": 259.10222999999996, "r": 545.11499, "b": 279.96380999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9423391819000244, "cells": [{"id": 134, "text": "6.", "bbox": {"l": 320.81699, "t": 259.10222999999996, "r": 328.28894, "b": 268.00879, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "Snap all cells with bad IOU to their corresponding", "bbox": {"l": 334.88419, "t": 259.10222999999996, "r": 545.11499, "b": 268.00879, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "median", "bbox": {"l": 308.862, "t": 271.05724999999995, "r": 338.19189, "b": 279.96380999999997, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "x", "bbox": {"l": 340.68201, "t": 270.89783, "r": 346.37564, "b": 279.74463000000003, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "-coordinates and cell sizes.", "bbox": {"l": 346.37601, "t": 271.05724999999995, "r": 453.72305000000006, "b": 279.96380999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "6. Snap all cells with bad IOU to their corresponding median x -coordinates and cell sizes."}, {"label": "list_item", "id": 6, "page_no": 11, "cluster": {"id": 6, "label": "list_item", "bbox": {"l": 308.86203, "t": 283.36325000000005, "r": 545.11511, "b": 387.91071, "coord_origin": "TOPLEFT"}, "confidence": 0.9562006592750549, "cells": [{"id": 139, "text": "7.", "bbox": {"l": 320.81702, "t": 283.36325000000005, "r": 328.38953, "b": 292.26981, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "Generate a new set of pair-wise matches between the", "bbox": {"l": 330.9137, "t": 283.36325000000005, "r": 545.11499, "b": 292.26981, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "corrected bounding boxes and PDF cells. This time use a", "bbox": {"l": 308.86203, "t": 295.31824, "r": 545.11511, "b": 304.22479, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "modified version of the IOU metric, where the area of the", "bbox": {"l": 308.86203, "t": 307.27322, "r": 545.11505, "b": 316.17978, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "intersection between the predicted and PDF cells is divided", "bbox": {"l": 308.86203, "t": 319.22821000000005, "r": 545.11511, "b": 328.13477, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "by the PDF cell area.", "bbox": {"l": 308.86203, "t": 331.1842, "r": 397.19043, "b": 340.09076000000005, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "In case there are multiple matches", "bbox": {"l": 403.65616, "t": 331.1842, "r": 545.11511, "b": 340.09076000000005, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "for the same PDF cell, the prediction with the higher score", "bbox": {"l": 308.86203, "t": 343.13919, "r": 545.11511, "b": 352.04575, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "is preferred. This covers the cases where the PDF cells are", "bbox": {"l": 308.86203, "t": 355.09418, "r": 545.11505, "b": 364.00073, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "smaller than the area of predicted or corrected prediction", "bbox": {"l": 308.86203, "t": 367.04916, "r": 545.11505, "b": 375.95572000000004, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "cells.", "bbox": {"l": 308.86203, "t": 379.00415, "r": 329.61414, "b": 387.91071, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "7. Generate a new set of pair-wise matches between the corrected bounding boxes and PDF cells. This time use a modified version of the IOU metric, where the area of the intersection between the predicted and PDF cells is divided by the PDF cell area. In case there are multiple matches for the same PDF cell, the prediction with the higher score is preferred. This covers the cases where the PDF cells are smaller than the area of predicted or corrected prediction cells."}, {"label": "list_item", "id": 17, "page_no": 11, "cluster": {"id": 17, "label": "list_item", "bbox": {"l": 308.86203, "t": 391.31015, "r": 545.11517, "b": 459.99164, "coord_origin": "TOPLEFT"}, "confidence": 0.8719939589500427, "cells": [{"id": 150, "text": "8.", "bbox": {"l": 320.81702, "t": 391.31015, "r": 328.55356, "b": 400.2167099999999, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "In some rare occasions, we have noticed that Table-", "bbox": {"l": 331.13242, "t": 391.31015, "r": 545.11505, "b": 400.2167099999999, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "Former can confuse a single column as two. When the post-", "bbox": {"l": 308.86203, "t": 403.26514, "r": 545.11517, "b": 412.17169, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "processing steps are applied, this results with two predicted", "bbox": {"l": 308.86203, "t": 415.22012000000007, "r": 545.11511, "b": 424.12668, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "columns pointing to the same PDF column. In such case", "bbox": {"l": 308.86203, "t": 427.17511, "r": 545.11511, "b": 436.0816699999999, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "we must de-duplicate the columns according to highest to-", "bbox": {"l": 308.86203, "t": 439.1301, "r": 545.11505, "b": 448.03665, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "tal column intersection score.", "bbox": {"l": 308.86203, "t": 451.08507999999995, "r": 426.18161, "b": 459.99164, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "8. In some rare occasions, we have noticed that TableFormer can confuse a single column as two. When the postprocessing steps are applied, this results with two predicted columns pointing to the same PDF column. In such case we must de-duplicate the columns according to highest total column intersection score."}, {"label": "list_item", "id": 15, "page_no": 11, "cluster": {"id": 15, "label": "list_item", "bbox": {"l": 308.86203, "t": 463.39108, "r": 545.11517, "b": 567.93858, "coord_origin": "TOPLEFT"}, "confidence": 0.9126085042953491, "cells": [{"id": 157, "text": "9.", "bbox": {"l": 320.81702, "t": 463.39108, "r": 328.67316, "b": 472.29764, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "Pick up the remaining orphan cells. There could be", "bbox": {"l": 331.29187, "t": 463.39108, "r": 545.11499, "b": 472.29764, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "cases, when after applying all the previous post-processing", "bbox": {"l": 308.86203, "t": 475.34607, "r": 545.11505, "b": 484.25262, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "steps, some PDF cells could still remain without any match", "bbox": {"l": 308.86203, "t": 487.30106, "r": 545.11517, "b": 496.20761, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "to predicted cells.", "bbox": {"l": 308.86203, "t": 499.25604, "r": 381.89786, "b": 508.1626, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "However, it is still possible to deduce", "bbox": {"l": 388.7023, "t": 499.25604, "r": 545.11517, "b": 508.1626, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "the correct matching for an orphan PDF cell by mapping its", "bbox": {"l": 308.86203, "t": 511.21204, "r": 545.11511, "b": 520.11859, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "bounding box on the geometry of the grid. This mapping", "bbox": {"l": 308.86203, "t": 523.16702, "r": 545.11505, "b": 532.07358, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "decides if the content of the orphan cell will be appended to", "bbox": {"l": 308.86203, "t": 535.12201, "r": 545.11499, "b": 544.02858, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "an already matched table cell, or a new table cell should be", "bbox": {"l": 308.86203, "t": 547.07703, "r": 545.11517, "b": 555.98358, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "created to match with the orphan.", "bbox": {"l": 308.86203, "t": 559.03203, "r": 442.22147000000007, "b": 567.93858, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "9. Pick up the remaining orphan cells. There could be cases, when after applying all the previous post-processing steps, some PDF cells could still remain without any match to predicted cells. However, it is still possible to deduce the correct matching for an orphan PDF cell by mapping its bounding box on the geometry of the grid. This mapping decides if the content of the orphan cell will be appended to an already matched table cell, or a new table cell should be created to match with the orphan."}, {"label": "text", "id": 19, "page_no": 11, "cluster": {"id": 19, "label": "text", "bbox": {"l": 308.86203, "t": 571.33803, "r": 545.11688, "b": 604.15459, "coord_origin": "TOPLEFT"}, "confidence": 0.8459475636482239, "cells": [{"id": 168, "text": "9a. Compute the top and bottom boundary of the hori-", "bbox": {"l": 320.81702, "t": 571.33803, "r": 545.11493, "b": 580.24458, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "zontal band for each grid row (min/max", "bbox": {"l": 308.86203, "t": 583.29303, "r": 471.64093, "b": 592.19958, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "y", "bbox": {"l": 474.83405, "t": 583.1336200000001, "r": 479.71872, "b": 591.98041, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "coordinates per", "bbox": {"l": 483.26903999999996, "t": 583.29303, "r": 545.11688, "b": 592.19958, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "row).", "bbox": {"l": 308.86206, "t": 595.24803, "r": 329.91306, "b": 604.15459, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "9a. Compute the top and bottom boundary of the horizontal band for each grid row (min/max y coordinates per row)."}, {"label": "list_item", "id": 21, "page_no": 11, "cluster": {"id": 21, "label": "list_item", "bbox": {"l": 308.86206, "t": 607.55304, "r": 545.11505, "b": 628.4155900000001, "coord_origin": "TOPLEFT"}, "confidence": 0.7716898918151855, "cells": [{"id": 173, "text": "9b.", "bbox": {"l": 320.81705, "t": 607.55304, "r": 332.8718, "b": 616.4595899999999, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "Intersect the orphan\u2019s bounding box with the row", "bbox": {"l": 339.92532, "t": 607.55304, "r": 545.11505, "b": 616.4595899999999, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "bands, and map the cell to the closest grid row.", "bbox": {"l": 308.86206, "t": 619.50903, "r": 495.2923, "b": 628.4155900000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "9b. Intersect the orphan\u2019s bounding box with the row bands, and map the cell to the closest grid row."}, {"label": "list_item", "id": 18, "page_no": 11, "cluster": {"id": 18, "label": "list_item", "bbox": {"l": 308.86206, "t": 631.81403, "r": 545.11505, "b": 664.63059, "coord_origin": "TOPLEFT"}, "confidence": 0.8584902882575989, "cells": [{"id": 176, "text": "9c. Compute the left and right boundary of the vertical", "bbox": {"l": 320.81705, "t": 631.81403, "r": 545.11505, "b": 640.72058, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "band for each grid column (min/max", "bbox": {"l": 308.86206, "t": 643.7690299999999, "r": 455.28238, "b": 652.67558, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "x", "bbox": {"l": 457.77704, "t": 643.60962, "r": 463.47067, "b": 652.45641, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "coordinates per col-", "bbox": {"l": 465.97104, "t": 643.7690299999999, "r": 545.11389, "b": 652.67558, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "umn).", "bbox": {"l": 308.86206, "t": 655.72403, "r": 332.38376, "b": 664.63059, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "9c. Compute the left and right boundary of the vertical band for each grid column (min/max x coordinates per column)."}, {"label": "list_item", "id": 22, "page_no": 11, "cluster": {"id": 22, "label": "list_item", "bbox": {"l": 308.86206, "t": 668.03003, "r": 545.11499, "b": 688.89159, "coord_origin": "TOPLEFT"}, "confidence": 0.759074866771698, "cells": [{"id": 181, "text": "9d. Intersect the orphan\u2019s bounding box with the column", "bbox": {"l": 320.81705, "t": 668.03003, "r": 545.11499, "b": 676.93659, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "bands, and map the cell to the closest grid column.", "bbox": {"l": 308.86206, "t": 679.98503, "r": 510.5848700000001, "b": 688.89159, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "9d. Intersect the orphan\u2019s bounding box with the column bands, and map the cell to the closest grid column."}, {"label": "list_item", "id": 25, "page_no": 11, "cluster": {"id": 25, "label": "list_item", "bbox": {"l": 308.86206, "t": 692.290024, "r": 545.11517, "b": 713.151596, "coord_origin": "TOPLEFT"}, "confidence": 0.6971189975738525, "cells": [{"id": 183, "text": "9e. If the table cell under the identified row and column", "bbox": {"l": 320.81705, "t": 692.290024, "r": 545.11505, "b": 701.196594, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "is not empty, extend its content with the content of the or-", "bbox": {"l": 308.86206, "t": 704.245026, "r": 545.11517, "b": 713.151596, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "9e. If the table cell under the identified row and column is not empty, extend its content with the content of the or-"}, {"label": "page_footer", "id": 14, "page_no": 11, "cluster": {"id": 14, "label": "page_footer", "bbox": {"l": 292.63107, "t": 734.13303, "r": 302.59366, "b": 743.039593, "coord_origin": "TOPLEFT"}, "confidence": 0.9126599431037903, "cells": [{"id": 185, "text": "12", "bbox": {"l": 292.63107, "t": 734.13303, "r": 302.59366, "b": 743.039593, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "12"}], "body": [{"label": "picture", "id": 30, "page_no": 11, "cluster": {"id": 30, "label": "picture", "bbox": {"l": 53.54228973388672, "t": 74.74851989746094, "r": 544.938232421875, "b": 147.5908966064453, "coord_origin": "TOPLEFT"}, "confidence": 0.6033812761306763, "cells": [{"id": 0, "text": "PubTabNet", "bbox": {"l": 119.39108, "t": 77.31055000000003, "r": 151.94641, "b": 83.25922000000003, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "b.", "bbox": {"l": 53.345978, "t": 75.19152999999994, "r": 59.327053, "b": 81.14020000000005, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "FinTabNet", "bbox": {"l": 289.5791, "t": 77.45830999999998, "r": 319.8266, "b": 83.40698000000009, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Table Bank", "bbox": {"l": 448.37271, "t": 77.25396999999987, "r": 481.75916, "b": 83.20263999999997, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Train", "bbox": {"l": 82.553436, "t": 141.27617999999995, "r": 94.976013, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Complex", "bbox": {"l": 63.03878399999999, "t": 101.10413000000005, "r": 85.290085, "b": 106.06133999999986, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Simple", "bbox": {"l": 67.76786, "t": 124.39531999999997, "r": 85.231277, "b": 129.35253999999998, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Complex", "bbox": {"l": 227.55121, "t": 102.53992000000005, "r": 249.80251, "b": 107.49712999999997, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Simple", "bbox": {"l": 232.19898999999998, "t": 126.98577999999986, "r": 249.66241, "b": 131.94299, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Simple", "bbox": {"l": 396.2337, "t": 114.04522999999995, "r": 413.69711, "b": 119.00243999999998, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Val", "bbox": {"l": 97.382202, "t": 141.27617999999995, "r": 105.08014, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "100%", "bbox": {"l": 60.93763400000001, "t": 85.73321999999996, "r": 76.151443, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "500K 10K", "bbox": {"l": 82.304901, "t": 86.22351000000003, "r": 106.99162, "b": 91.18073000000015, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Train Test Val", "bbox": {"l": 246.20530999999997, "t": 141.60608000000002, "r": 281.88013, "b": 146.56329000000005, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "100%", "bbox": {"l": 226.69780000000003, "t": 85.73321999999996, "r": 241.91161, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "91K 10K 10K", "bbox": {"l": 249.93848999999997, "t": 86.08801000000005, "r": 282.49384, "b": 91.04522999999995, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Train Test Val", "bbox": {"l": 410.19409, "t": 141.27617999999995, "r": 444.68915, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "100% 130K 5K", "bbox": {"l": 391.37341, "t": 85.73321999999996, "r": 432.6716599999999, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "10K", "bbox": {"l": 435.60571000000004, "t": 86.26140999999996, "r": 445.62414999999993, "b": 91.21862999999996, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Complex", "bbox": {"l": 113.94921, "t": 141.28845, "r": 136.20052, "b": 146.24567000000002, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Non", "bbox": {"l": 116.91554000000001, "t": 94.81853999999998, "r": 127.05433999999998, "b": 99.77575999999999, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Strict", "bbox": {"l": 113.3146, "t": 100.93853999999999, "r": 127.05298, "b": 105.89575000000002, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "HTML", "bbox": {"l": 112.94112, "t": 107.05853000000013, "r": 127.05537, "b": 112.01575000000003, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Strict", "bbox": {"l": 113.22738999999999, "t": 122.61523, "r": 126.96577, "b": 127.57245, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "HTML", "bbox": {"l": 112.85390000000001, "t": 128.73523, "r": 126.96814999999998, "b": 133.69244000000003, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "Simple", "bbox": {"l": 138.57864, "t": 141.43640000000005, "r": 156.04207, "b": 146.39362000000006, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "230K 280K", "bbox": {"l": 122.03101, "t": 86.2713, "r": 151.04185, "b": 91.22852, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "65K", "bbox": {"l": 311.65359, "t": 86.55498999999998, "r": 321.67203, "b": 91.5122100000001, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Complex", "bbox": {"l": 287.89441, "t": 141.71063000000004, "r": 310.14572, "b": 146.66785000000004, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Non", "bbox": {"l": 289.23572, "t": 93.07977000000005, "r": 299.37451, "b": 98.03698999999995, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Strict", "bbox": {"l": 285.63513, "t": 99.19976999999994, "r": 299.3735, "b": 104.15698000000009, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "HTML", "bbox": {"l": 285.26111, "t": 105.31975999999997, "r": 299.37537, "b": 110.27697999999998, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Strict", "bbox": {"l": 285.43109, "t": 120.38995, "r": 299.16946, "b": 125.34717, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "HTML", "bbox": {"l": 285.05713, "t": 126.50995, "r": 299.17139, "b": 131.46716000000004, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Simple", "bbox": {"l": 311.34592, "t": 141.71063000000004, "r": 328.80933, "b": 146.66785000000004, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "47K", "bbox": {"l": 299.58362, "t": 86.69353999999998, "r": 309.60205, "b": 91.65075999999999, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Simple", "bbox": {"l": 466.04077000000007, "t": 141.67169, "r": 483.50418, "b": 146.62891000000002, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "Non", "bbox": {"l": 459.02151, "t": 93.76116999999999, "r": 469.16031000000004, "b": 98.71838000000002, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "Strict", "bbox": {"l": 455.4209, "t": 99.88116000000002, "r": 469.15927000000005, "b": 104.83838000000003, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "HTML", "bbox": {"l": 455.04691, "t": 106.00116000000014, "r": 469.16115999999994, "b": 110.95836999999995, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "145K", "bbox": {"l": 467.39401, "t": 85.57239000000004, "r": 480.6545100000001, "b": 90.52959999999996, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Complex", "bbox": {"l": 160.37672, "t": 141.58385999999996, "r": 182.62802, "b": 146.54107999999997, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "Contain", "bbox": {"l": 153.74265, "t": 94.86481000000003, "r": 173.32664, "b": 99.82201999999995, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Missing", "bbox": {"l": 154.50967, "t": 100.98479999999995, "r": 173.3246, "b": 105.94202000000007, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "bboxes", "bbox": {"l": 155.27162, "t": 107.10479999999995, "r": 173.32664, "b": 112.06200999999987, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Contain", "bbox": {"l": 326.41302, "t": 107.23248000000001, "r": 345.99701, "b": 112.18970000000002, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "Missing", "bbox": {"l": 327.17972, "t": 113.35248000000001, "r": 345.99463, "b": 118.30969000000005, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "bboxes", "bbox": {"l": 327.94131, "t": 119.47247000000004, "r": 345.99634, "b": 124.42969000000005, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Dataset", "bbox": {"l": 488.9942, "t": 104.15374999999983, "r": 508.76384999999993, "b": 109.11095999999998, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "doesn't", "bbox": {"l": 490.1893, "t": 110.27373999999998, "r": 508.76349000000005, "b": 115.2309600000001, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "provide", "bbox": {"l": 489.72009, "t": 116.39373999999998, "r": 508.76758, "b": 121.35095000000013, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "bboxes", "bbox": {"l": 490.71121, "t": 122.51373000000001, "r": 508.76624, "b": 127.47095000000002, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Simple", "bbox": {"l": 185.37759, "t": 141.71118, "r": 202.84102, "b": 146.66840000000002, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "230K 280K", "bbox": {"l": 168.50357, "t": 86.13611000000003, "r": 197.52699, "b": 91.09331999999995, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "65K", "bbox": {"l": 357.3768, "t": 85.99707000000001, "r": 367.39523, "b": 90.95428000000004, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "Complex Simple", "bbox": {"l": 333.73151, "t": 141.62323000000004, "r": 374.92862, "b": 146.58043999999995, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "47K", "bbox": {"l": 345.69101, "t": 86.05591000000004, "r": 355.70944, "b": 91.01312000000007, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Simple", "bbox": {"l": 508.54248, "t": 141.37683000000004, "r": 526.00592, "b": 146.33405000000005, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "145K", "bbox": {"l": 510.44653000000005, "t": 86.09258999999986, "r": 523.70703, "b": 91.0498, "coord_origin": "TOPLEFT"}}], "children": [{"id": 26, "label": "text", "bbox": {"l": 119.39108, "t": 77.31055000000003, "r": 151.94641, "b": 83.25922000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 0, "text": "PubTabNet", "bbox": {"l": 119.39108, "t": 77.31055000000003, "r": 151.94641, "b": 83.25922000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 53.345978, "t": 75.19152999999994, "r": 59.327053, "b": 81.14020000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 1, "text": "b.", "bbox": {"l": 53.345978, "t": 75.19152999999994, "r": 59.327053, "b": 81.14020000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 289.5791, "t": 77.45830999999998, "r": 319.8266, "b": 83.40698000000009, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 2, "text": "FinTabNet", "bbox": {"l": 289.5791, "t": 77.45830999999998, "r": 319.8266, "b": 83.40698000000009, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 448.37271, "t": 77.25396999999987, "r": 481.75916, "b": 83.20263999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 3, "text": "Table Bank", "bbox": {"l": 448.37271, "t": 77.25396999999987, "r": 481.75916, "b": 83.20263999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 82.553436, "t": 141.27617999999995, "r": 94.976013, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 4, "text": "Train", "bbox": {"l": 82.553436, "t": 141.27617999999995, "r": 94.976013, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 63.03878399999999, "t": 101.10413000000005, "r": 85.290085, "b": 106.06133999999986, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 5, "text": "Complex", "bbox": {"l": 63.03878399999999, "t": 101.10413000000005, "r": 85.290085, "b": 106.06133999999986, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 67.76786, "t": 124.39531999999997, "r": 85.231277, "b": 129.35253999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": "Simple", "bbox": {"l": 67.76786, "t": 124.39531999999997, "r": 85.231277, "b": 129.35253999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 227.55121, "t": 102.53992000000005, "r": 249.80251, "b": 107.49712999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "Complex", "bbox": {"l": 227.55121, "t": 102.53992000000005, "r": 249.80251, "b": 107.49712999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 232.19898999999998, "t": 126.98577999999986, "r": 249.66241, "b": 131.94299, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "Simple", "bbox": {"l": 232.19898999999998, "t": 126.98577999999986, "r": 249.66241, "b": 131.94299, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 396.2337, "t": 114.04522999999995, "r": 413.69711, "b": 119.00243999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "Simple", "bbox": {"l": 396.2337, "t": 114.04522999999995, "r": 413.69711, "b": 119.00243999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 97.382202, "t": 141.27617999999995, "r": 105.08014, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "Val", "bbox": {"l": 97.382202, "t": 141.27617999999995, "r": 105.08014, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 60.93763400000001, "t": 85.73321999999996, "r": 76.151443, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "100%", "bbox": {"l": 60.93763400000001, "t": 85.73321999999996, "r": 76.151443, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 82.304901, "t": 86.22351000000003, "r": 106.99162, "b": 91.18073000000015, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "500K 10K", "bbox": {"l": 82.304901, "t": 86.22351000000003, "r": 106.99162, "b": 91.18073000000015, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 246.20530999999997, "t": 141.60608000000002, "r": 281.88013, "b": 146.56329000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "Train Test Val", "bbox": {"l": 246.20530999999997, "t": 141.60608000000002, "r": 281.88013, "b": 146.56329000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 226.69780000000003, "t": 85.73321999999996, "r": 241.91161, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "100%", "bbox": {"l": 226.69780000000003, "t": 85.73321999999996, "r": 241.91161, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 249.93848999999997, "t": 86.08801000000005, "r": 282.49384, "b": 91.04522999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "91K 10K 10K", "bbox": {"l": 249.93848999999997, "t": 86.08801000000005, "r": 282.49384, "b": 91.04522999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 410.19409, "t": 141.27617999999995, "r": 444.68915, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "Train Test Val", "bbox": {"l": 410.19409, "t": 141.27617999999995, "r": 444.68915, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 391.37341, "t": 85.73321999999996, "r": 432.6716599999999, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "100% 130K 5K", "bbox": {"l": 391.37341, "t": 85.73321999999996, "r": 432.6716599999999, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 435.60571000000004, "t": 86.26140999999996, "r": 445.62414999999993, "b": 91.21862999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "10K", "bbox": {"l": 435.60571000000004, "t": 86.26140999999996, "r": 445.62414999999993, "b": 91.21862999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 113.94921, "t": 141.28845, "r": 136.20052, "b": 146.24567000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "Complex", "bbox": {"l": 113.94921, "t": 141.28845, "r": 136.20052, "b": 146.24567000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 116.91554000000001, "t": 94.81853999999998, "r": 127.05433999999998, "b": 99.77575999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "Non", "bbox": {"l": 116.91554000000001, "t": 94.81853999999998, "r": 127.05433999999998, "b": 99.77575999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 113.3146, "t": 100.93853999999999, "r": 127.05298, "b": 105.89575000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "Strict", "bbox": {"l": 113.3146, "t": 100.93853999999999, "r": 127.05298, "b": 105.89575000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 112.94112, "t": 107.05853000000013, "r": 127.05537, "b": 112.01575000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "HTML", "bbox": {"l": 112.94112, "t": 107.05853000000013, "r": 127.05537, "b": 112.01575000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 113.22738999999999, "t": 122.61523, "r": 126.96577, "b": 127.57245, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "Strict", "bbox": {"l": 113.22738999999999, "t": 122.61523, "r": 126.96577, "b": 127.57245, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 112.85390000000001, "t": 128.73523, "r": 126.96814999999998, "b": 133.69244000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "HTML", "bbox": {"l": 112.85390000000001, "t": 128.73523, "r": 126.96814999999998, "b": 133.69244000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 138.57864, "t": 141.43640000000005, "r": 156.04207, "b": 146.39362000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "Simple", "bbox": {"l": 138.57864, "t": 141.43640000000005, "r": 156.04207, "b": 146.39362000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 122.03101, "t": 86.2713, "r": 151.04185, "b": 91.22852, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "230K 280K", "bbox": {"l": 122.03101, "t": 86.2713, "r": 151.04185, "b": 91.22852, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 311.65359, "t": 86.55498999999998, "r": 321.67203, "b": 91.5122100000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "65K", "bbox": {"l": 311.65359, "t": 86.55498999999998, "r": 321.67203, "b": 91.5122100000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 287.89441, "t": 141.71063000000004, "r": 310.14572, "b": 146.66785000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "Complex", "bbox": {"l": 287.89441, "t": 141.71063000000004, "r": 310.14572, "b": 146.66785000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 289.23572, "t": 93.07977000000005, "r": 299.37451, "b": 98.03698999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "Non", "bbox": {"l": 289.23572, "t": 93.07977000000005, "r": 299.37451, "b": 98.03698999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 285.63513, "t": 99.19976999999994, "r": 299.3735, "b": 104.15698000000009, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "Strict", "bbox": {"l": 285.63513, "t": 99.19976999999994, "r": 299.3735, "b": 104.15698000000009, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 285.26111, "t": 105.31975999999997, "r": 299.37537, "b": 110.27697999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "HTML", "bbox": {"l": 285.26111, "t": 105.31975999999997, "r": 299.37537, "b": 110.27697999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 285.43109, "t": 120.38995, "r": 299.16946, "b": 125.34717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "Strict", "bbox": {"l": 285.43109, "t": 120.38995, "r": 299.16946, "b": 125.34717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 285.05713, "t": 126.50995, "r": 299.17139, "b": 131.46716000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "HTML", "bbox": {"l": 285.05713, "t": 126.50995, "r": 299.17139, "b": 131.46716000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 311.34592, "t": 141.71063000000004, "r": 328.80933, "b": 146.66785000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "Simple", "bbox": {"l": 311.34592, "t": 141.71063000000004, "r": 328.80933, "b": 146.66785000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 299.58362, "t": 86.69353999999998, "r": 309.60205, "b": 91.65075999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "47K", "bbox": {"l": 299.58362, "t": 86.69353999999998, "r": 309.60205, "b": 91.65075999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 466.04077000000007, "t": 141.67169, "r": 483.50418, "b": 146.62891000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "Simple", "bbox": {"l": 466.04077000000007, "t": 141.67169, "r": 483.50418, "b": 146.62891000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 459.02151, "t": 93.76116999999999, "r": 469.16031000000004, "b": 98.71838000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "Non", "bbox": {"l": 459.02151, "t": 93.76116999999999, "r": 469.16031000000004, "b": 98.71838000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 455.4209, "t": 99.88116000000002, "r": 469.15927000000005, "b": 104.83838000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "Strict", "bbox": {"l": 455.4209, "t": 99.88116000000002, "r": 469.15927000000005, "b": 104.83838000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 455.04691, "t": 106.00116000000014, "r": 469.16115999999994, "b": 110.95836999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "HTML", "bbox": {"l": 455.04691, "t": 106.00116000000014, "r": 469.16115999999994, "b": 110.95836999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 467.39401, "t": 85.57239000000004, "r": 480.6545100000001, "b": 90.52959999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "145K", "bbox": {"l": 467.39401, "t": 85.57239000000004, "r": 480.6545100000001, "b": 90.52959999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 160.37672, "t": 141.58385999999996, "r": 182.62802, "b": 146.54107999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "Complex", "bbox": {"l": 160.37672, "t": 141.58385999999996, "r": 182.62802, "b": 146.54107999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 153.74265, "t": 94.86481000000003, "r": 173.32664, "b": 99.82201999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "Contain", "bbox": {"l": 153.74265, "t": 94.86481000000003, "r": 173.32664, "b": 99.82201999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 154.50967, "t": 100.98479999999995, "r": 173.3246, "b": 105.94202000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "Missing", "bbox": {"l": 154.50967, "t": 100.98479999999995, "r": 173.3246, "b": 105.94202000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 155.27162, "t": 107.10479999999995, "r": 173.32664, "b": 112.06200999999987, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "bboxes", "bbox": {"l": 155.27162, "t": 107.10479999999995, "r": 173.32664, "b": 112.06200999999987, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 326.41302, "t": 107.23248000000001, "r": 345.99701, "b": 112.18970000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "Contain", "bbox": {"l": 326.41302, "t": 107.23248000000001, "r": 345.99701, "b": 112.18970000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 327.17972, "t": 113.35248000000001, "r": 345.99463, "b": 118.30969000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "Missing", "bbox": {"l": 327.17972, "t": 113.35248000000001, "r": 345.99463, "b": 118.30969000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 327.94131, "t": 119.47247000000004, "r": 345.99634, "b": 124.42969000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "bboxes", "bbox": {"l": 327.94131, "t": 119.47247000000004, "r": 345.99634, "b": 124.42969000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 488.9942, "t": 104.15374999999983, "r": 508.76384999999993, "b": 109.11095999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "Dataset", "bbox": {"l": 488.9942, "t": 104.15374999999983, "r": 508.76384999999993, "b": 109.11095999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 490.1893, "t": 110.27373999999998, "r": 508.76349000000005, "b": 115.2309600000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "doesn't", "bbox": {"l": 490.1893, "t": 110.27373999999998, "r": 508.76349000000005, "b": 115.2309600000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 489.72009, "t": 116.39373999999998, "r": 508.76758, "b": 121.35095000000013, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "provide", "bbox": {"l": 489.72009, "t": 116.39373999999998, "r": 508.76758, "b": 121.35095000000013, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 490.71121, "t": 122.51373000000001, "r": 508.76624, "b": 127.47095000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "bboxes", "bbox": {"l": 490.71121, "t": 122.51373000000001, "r": 508.76624, "b": 127.47095000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 185.37759, "t": 141.71118, "r": 202.84102, "b": 146.66840000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "Simple", "bbox": {"l": 185.37759, "t": 141.71118, "r": 202.84102, "b": 146.66840000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 168.50357, "t": 86.13611000000003, "r": 197.52699, "b": 91.09331999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "230K 280K", "bbox": {"l": 168.50357, "t": 86.13611000000003, "r": 197.52699, "b": 91.09331999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 357.3768, "t": 85.99707000000001, "r": 367.39523, "b": 90.95428000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "65K", "bbox": {"l": 357.3768, "t": 85.99707000000001, "r": 367.39523, "b": 90.95428000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 333.73151, "t": 141.62323000000004, "r": 374.92862, "b": 146.58043999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "Complex Simple", "bbox": {"l": 333.73151, "t": 141.62323000000004, "r": 374.92862, "b": 146.58043999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 345.69101, "t": 86.05591000000004, "r": 355.70944, "b": 91.01312000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "47K", "bbox": {"l": 345.69101, "t": 86.05591000000004, "r": 355.70944, "b": 91.01312000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 508.54248, "t": 141.37683000000004, "r": 526.00592, "b": 146.33405000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "Simple", "bbox": {"l": 508.54248, "t": 141.37683000000004, "r": 526.00592, "b": 146.33405000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 510.44653000000005, "t": 86.09258999999986, "r": 523.70703, "b": 91.0498, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "145K", "bbox": {"l": 510.44653000000005, "t": 86.09258999999986, "r": 523.70703, "b": 91.0498, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "caption", "id": 1, "page_no": 11, "cluster": {"id": 1, "label": "caption", "bbox": {"l": 50.112, "t": 165.50238000000002, "r": 545.11371, "b": 186.36395000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9661495685577393, "cells": [{"id": 59, "text": "Figure 7: Distribution of the tables across different dimensions per dataset. Simple vs complex tables per dataset and split,", "bbox": {"l": 50.112, "t": 165.50238000000002, "r": 545.11371, "b": 174.40894000000003, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "strict vs non strict html structures per dataset and table complexity, missing bboxes per dataset and table complexity.", "bbox": {"l": 50.112, "t": 177.4574, "r": 513.52234, "b": 186.36395000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 7: Distribution of the tables across different dimensions per dataset. Simple vs complex tables per dataset and split, strict vs non strict html structures per dataset and table complexity, missing bboxes per dataset and table complexity."}, {"label": "list_item", "id": 4, "page_no": 11, "cluster": {"id": 4, "label": "list_item", "bbox": {"l": 61.569, "t": 210.93140000000005, "r": 286.36511, "b": 231.79296999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9621952772140503, "cells": [{"id": 61, "text": "\u2022", "bbox": {"l": 61.569, "t": 210.93140000000005, "r": 71.14743, "b": 219.83794999999998, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "TableFormer output does not include the table cell con-", "bbox": {"l": 73.542038, "t": 210.93140000000005, "r": 286.36511, "b": 219.83794999999998, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "tent.", "bbox": {"l": 70.037003, "t": 222.88640999999996, "r": 87.47155, "b": 231.79296999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u2022 TableFormer output does not include the table cell content."}, {"label": "list_item", "id": 3, "page_no": 11, "cluster": {"id": 3, "label": "list_item", "bbox": {"l": 61.569, "t": 244.07141000000001, "r": 286.36514, "b": 264.93298000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.96295565366745, "cells": [{"id": 64, "text": "\u2022", "bbox": {"l": 61.569, "t": 244.07141000000001, "r": 71.345718, "b": 252.97797000000003, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "There are occasional inaccuracies in the predictions of", "bbox": {"l": 73.789902, "t": 244.07141000000001, "r": 286.36514, "b": 252.97797000000003, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "the bounding boxes.", "bbox": {"l": 70.037003, "t": 256.02643, "r": 150.41524, "b": 264.93298000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u2022 There are occasional inaccuracies in the predictions of the bounding boxes."}, {"label": "text", "id": 0, "page_no": 11, "cluster": {"id": 0, "label": "text", "bbox": {"l": 50.112, "t": 279.20343, "r": 286.36511, "b": 395.70688, "coord_origin": "TOPLEFT"}, "confidence": 0.9767084717750549, "cells": [{"id": 67, "text": "However, it is possible to mitigate those limitations by", "bbox": {"l": 62.067001, "t": 279.20343, "r": 286.36499, "b": 288.10999, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "combining the TableFormer predictions with the informa-", "bbox": {"l": 50.112, "t": 291.15842, "r": 286.36505, "b": 300.06497, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "tion already present inside a programmatic PDF document.", "bbox": {"l": 50.112, "t": 303.1134, "r": 286.36511, "b": 312.01996, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "More specifically, PDF documents can be seen as a se-", "bbox": {"l": 50.112, "t": 315.06839, "r": 286.36511, "b": 323.97495, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "quence of PDF cells where each cell is described by its con-", "bbox": {"l": 50.112, "t": 327.02438, "r": 286.36511, "b": 335.93093999999996, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "tent and bounding box. If we are able to associate the PDF", "bbox": {"l": 50.112, "t": 338.97937, "r": 286.36505, "b": 347.88593, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "cells with the predicted table cells, we can directly link the", "bbox": {"l": 50.112, "t": 350.93436, "r": 286.36508, "b": 359.84091, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "PDF cell content to the table cell structure and use the PDF", "bbox": {"l": 50.112, "t": 362.88934, "r": 286.36511, "b": 371.7959, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "bounding boxes to correct misalignments in the predicted", "bbox": {"l": 50.112, "t": 374.84433000000007, "r": 286.36508, "b": 383.75089, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "table cell bounding boxes.", "bbox": {"l": 50.112, "t": 386.80032, "r": 154.55988, "b": 395.70688, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "However, it is possible to mitigate those limitations by combining the TableFormer predictions with the information already present inside a programmatic PDF document. More specifically, PDF documents can be seen as a sequence of PDF cells where each cell is described by its content and bounding box. If we are able to associate the PDF cells with the predicted table cells, we can directly link the PDF cell content to the table cell structure and use the PDF bounding boxes to correct misalignments in the predicted table cell bounding boxes."}, {"label": "text", "id": 11, "page_no": 11, "cluster": {"id": 11, "label": "text", "bbox": {"l": 50.112, "t": 399.06934, "r": 286.36496, "b": 419.93188, "coord_origin": "TOPLEFT"}, "confidence": 0.9347665309906006, "cells": [{"id": 77, "text": "Here is a step-by-step description of the prediction post-", "bbox": {"l": 62.067001, "t": 399.06934, "r": 286.36496, "b": 407.97589, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "processing:", "bbox": {"l": 50.112, "t": 411.02533, "r": 95.491638, "b": 419.93188, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Here is a step-by-step description of the prediction postprocessing:"}, {"label": "list_item", "id": 20, "page_no": 11, "cluster": {"id": 20, "label": "list_item", "bbox": {"l": 50.112, "t": 423.29532, "r": 286.36508, "b": 456.11185000000006, "coord_origin": "TOPLEFT"}, "confidence": 0.8280701637268066, "cells": [{"id": 79, "text": "1.", "bbox": {"l": 62.067001, "t": 423.29532, "r": 69.37281, "b": 432.20187, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "Get the minimal grid dimensions - number of rows and", "bbox": {"l": 71.808075, "t": 423.29532, "r": 286.36502, "b": 432.20187, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "columns for the predicted table structure. This represents", "bbox": {"l": 50.112, "t": 435.25031, "r": 286.36508, "b": 444.15686, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "the most granular grid for the underlying table structure.", "bbox": {"l": 50.112, "t": 447.20529, "r": 274.50958, "b": 456.11185000000006, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1. Get the minimal grid dimensions - number of rows and columns for the predicted table structure. This represents the most granular grid for the underlying table structure."}, {"label": "list_item", "id": 2, "page_no": 11, "cluster": {"id": 2, "label": "list_item", "bbox": {"l": 50.112, "t": 459.47528, "r": 286.36505, "b": 504.2468, "coord_origin": "TOPLEFT"}, "confidence": 0.9646760821342468, "cells": [{"id": 83, "text": "2.", "bbox": {"l": 62.067001, "t": 459.47528, "r": 69.538948, "b": 468.38184, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "Generate pair-wise matches between the bounding", "bbox": {"l": 77.429329, "t": 459.47528, "r": 286.36499, "b": 468.38184, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "boxes of the PDF cells and the predicted cells. The Intersec-", "bbox": {"l": 50.112, "t": 471.43027, "r": 286.36505, "b": 480.33682, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "tion Over Union (IOU) metric is used to evaluate the quality", "bbox": {"l": 50.112, "t": 483.38525, "r": 286.36505, "b": 492.29181, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "of the matches.", "bbox": {"l": 50.112, "t": 495.34024, "r": 110.70452999999999, "b": 504.2468, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2. Generate pair-wise matches between the bounding boxes of the PDF cells and the predicted cells. The Intersection Over Union (IOU) metric is used to evaluate the quality of the matches."}, {"label": "list_item", "id": 10, "page_no": 11, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 50.112, "t": 507.61023, "r": 286.36493, "b": 528.4727800000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9391399025917053, "cells": [{"id": 88, "text": "3.", "bbox": {"l": 62.067001, "t": 507.61023, "r": 69.863068, "b": 516.5167799999999, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "Use a carefully selected IOU threshold to designate", "bbox": {"l": 72.461754, "t": 507.61023, "r": 286.36493, "b": 516.5167799999999, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "the matches as \u201cgood\u201d ones and \u201cbad\u201d ones.", "bbox": {"l": 50.112, "t": 519.5662199999999, "r": 226.0714, "b": 528.4727800000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3. Use a carefully selected IOU threshold to designate the matches as \u201cgood\u201d ones and \u201cbad\u201d ones."}, {"label": "list_item", "id": 8, "page_no": 11, "cluster": {"id": 8, "label": "list_item", "bbox": {"l": 50.112, "t": 531.83521, "r": 286.36511, "b": 564.65277, "coord_origin": "TOPLEFT"}, "confidence": 0.9491711854934692, "cells": [{"id": 91, "text": "3.a. If all IOU scores in a column are below the thresh-", "bbox": {"l": 62.067001, "t": 531.83521, "r": 286.36496, "b": 540.7417800000001, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "old, discard all predictions (structure and bounding boxes)", "bbox": {"l": 50.112, "t": 543.79121, "r": 286.36511, "b": 552.69777, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "for that column.", "bbox": {"l": 50.112, "t": 555.74622, "r": 114.03204, "b": 564.65277, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3.a. If all IOU scores in a column are below the threshold, discard all predictions (structure and bounding boxes) for that column."}, {"label": "list_item", "id": 5, "page_no": 11, "cluster": {"id": 5, "label": "list_item", "bbox": {"l": 50.112, "t": 568.01622, "r": 286.36508, "b": 600.83278, "coord_origin": "TOPLEFT"}, "confidence": 0.9587164521217346, "cells": [{"id": 94, "text": "4.", "bbox": {"l": 62.067001, "t": 568.01622, "r": 69.538948, "b": 576.92278, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "Find the best-fitting content alignment for the pre-", "bbox": {"l": 76.731949, "t": 568.01622, "r": 286.36502, "b": 576.92278, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "dicted cells with good IOU per each column. The alignment", "bbox": {"l": 50.112, "t": 579.97122, "r": 286.36508, "b": 588.87778, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "of the column can be identified by the following formula:", "bbox": {"l": 50.112, "t": 591.9262200000001, "r": 278.70383, "b": 600.83278, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4. Find the best-fitting content alignment for the predicted cells with good IOU per each column. The alignment of the column can be identified by the following formula:"}, {"label": "formula", "id": 12, "page_no": 11, "cluster": {"id": 12, "label": "formula", "bbox": {"l": 110.70499, "t": 623.43591, "r": 286.3624, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9298409819602966, "cells": [{"id": 98, "text": "alignment", "bbox": {"l": 112.02799999999999, "t": 623.99382, "r": 157.9516, "b": 632.84061, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "= arg min", "bbox": {"l": 160.715, "t": 623.99382, "r": 203.4964, "b": 632.84061, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "c", "bbox": {"l": 185.58499, "t": 633.98305, "r": 189.14511, "b": 640.17578, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "{", "bbox": {"l": 203.49899, "t": 623.43591, "r": 208.48029, "b": 632.84061, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "D$_{c}$", "bbox": {"l": 208.48099, "t": 623.99382, "r": 220.28911, "b": 632.84061, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "}", "bbox": {"l": 220.78699, "t": 623.43591, "r": 225.76828, "b": 632.84061, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "D$_{c}$", "bbox": {"l": 110.70499, "t": 645.25882, "r": 122.51310999999998, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "=", "bbox": {"l": 125.77899000000001, "t": 645.25882, "r": 133.52791, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "max", "bbox": {"l": 136.295, "t": 645.25882, "r": 156.00201, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "{", "bbox": {"l": 156.00299, "t": 644.70091, "r": 160.98428, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "x$_{c}$", "bbox": {"l": 160.98399, "t": 645.25882, "r": 170.23811, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "} \u2212", "bbox": {"l": 170.73599, "t": 644.70091, "r": 185.6779, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "min", "bbox": {"l": 187.894, "t": 645.25882, "r": 206.05283, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "{", "bbox": {"l": 206.054, "t": 644.70091, "r": 211.03529, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "x$_{c}$", "bbox": {"l": 211.035, "t": 645.25882, "r": 220.28912, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "}", "bbox": {"l": 220.787, "t": 644.70091, "r": 225.76829999999998, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "(4)", "bbox": {"l": 274.746, "t": 634.88522, "r": 286.3624, "b": 643.79178, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "alignment = arg min c { D$_{c}$ } D$_{c}$ = max { x$_{c}$ } \u2212 min { x$_{c}$ } (4)"}, {"label": "text", "id": 7, "page_no": 11, "cluster": {"id": 7, "label": "text", "bbox": {"l": 50.112, "t": 667.3479199999999, "r": 286.362, "b": 688.92679, "coord_origin": "TOPLEFT"}, "confidence": 0.9545555114746094, "cells": [{"id": 115, "text": "where", "bbox": {"l": 50.112, "t": 668.06522, "r": 74.45063, "b": 676.97179, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "c", "bbox": {"l": 78.335999, "t": 667.90582, "r": 82.647812, "b": 676.75261, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "is one of", "bbox": {"l": 86.532997, "t": 668.06522, "r": 123.63372, "b": 676.97179, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "{", "bbox": {"l": 127.51899999999999, "t": 667.3479199999999, "r": 132.50029, "b": 676.75261, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "left, centroid, right", "bbox": {"l": 132.50099, "t": 668.06522, "r": 210.69743, "b": 676.97179, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "}", "bbox": {"l": 210.69699, "t": 667.3479199999999, "r": 215.67828, "b": 676.75261, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "and", "bbox": {"l": 219.56299, "t": 668.06522, "r": 233.94897000000003, "b": 676.97179, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "x$_{c}$", "bbox": {"l": 237.83499000000003, "t": 667.90582, "r": 247.08911, "b": 676.75261, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "is the x-", "bbox": {"l": 251.47299000000004, "t": 668.06522, "r": 286.362, "b": 676.97179, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "coordinate for the corresponding point.", "bbox": {"l": 50.112, "t": 680.02022, "r": 205.88721, "b": 688.92679, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "where c is one of { left, centroid, right } and x$_{c}$ is the xcoordinate for the corresponding point."}, {"label": "list_item", "id": 13, "page_no": 11, "cluster": {"id": 13, "label": "list_item", "bbox": {"l": 50.112, "t": 692.290222, "r": 286.36496, "b": 713.151787, "coord_origin": "TOPLEFT"}, "confidence": 0.9260510802268982, "cells": [{"id": 125, "text": "5.", "bbox": {"l": 62.067001, "t": 692.290222, "r": 69.538948, "b": 701.196785, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "Use the alignment computed in step 4, to compute", "bbox": {"l": 76.273666, "t": 692.290222, "r": 286.36496, "b": 701.196785, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "the median", "bbox": {"l": 50.112, "t": 704.245224, "r": 94.604973, "b": 713.151787, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "x", "bbox": {"l": 97.598999, "t": 704.085815, "r": 103.29263, "b": 712.93261, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "-coordinate for all table columns and the me-", "bbox": {"l": 103.292, "t": 704.245224, "r": 286.36481, "b": 713.151787, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5. Use the alignment computed in step 4, to compute the median x -coordinate for all table columns and the me-"}, {"label": "text", "id": 16, "page_no": 11, "cluster": {"id": 16, "label": "text", "bbox": {"l": 308.862, "t": 210.93120999999996, "r": 545.11517, "b": 255.7038, "coord_origin": "TOPLEFT"}, "confidence": 0.8942293524742126, "cells": [{"id": 130, "text": "dian cell size for all table cells. The usage of median dur-", "bbox": {"l": 308.862, "t": 210.93120999999996, "r": 545.11517, "b": 219.83776999999998, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "ing the computations, helps to eliminate outliers caused by", "bbox": {"l": 308.862, "t": 222.88720999999998, "r": 545.11511, "b": 231.79376000000002, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "occasional column spans which are usually wider than the", "bbox": {"l": 308.862, "t": 234.84222, "r": 545.11511, "b": 243.74878, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "normal.", "bbox": {"l": 308.862, "t": 246.79724, "r": 339.57669, "b": 255.7038, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "dian cell size for all table cells. The usage of median during the computations, helps to eliminate outliers caused by occasional column spans which are usually wider than the normal."}, {"label": "list_item", "id": 9, "page_no": 11, "cluster": {"id": 9, "label": "list_item", "bbox": {"l": 308.862, "t": 259.10222999999996, "r": 545.11499, "b": 279.96380999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9423391819000244, "cells": [{"id": 134, "text": "6.", "bbox": {"l": 320.81699, "t": 259.10222999999996, "r": 328.28894, "b": 268.00879, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "Snap all cells with bad IOU to their corresponding", "bbox": {"l": 334.88419, "t": 259.10222999999996, "r": 545.11499, "b": 268.00879, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "median", "bbox": {"l": 308.862, "t": 271.05724999999995, "r": 338.19189, "b": 279.96380999999997, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "x", "bbox": {"l": 340.68201, "t": 270.89783, "r": 346.37564, "b": 279.74463000000003, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "-coordinates and cell sizes.", "bbox": {"l": 346.37601, "t": 271.05724999999995, "r": 453.72305000000006, "b": 279.96380999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "6. Snap all cells with bad IOU to their corresponding median x -coordinates and cell sizes."}, {"label": "list_item", "id": 6, "page_no": 11, "cluster": {"id": 6, "label": "list_item", "bbox": {"l": 308.86203, "t": 283.36325000000005, "r": 545.11511, "b": 387.91071, "coord_origin": "TOPLEFT"}, "confidence": 0.9562006592750549, "cells": [{"id": 139, "text": "7.", "bbox": {"l": 320.81702, "t": 283.36325000000005, "r": 328.38953, "b": 292.26981, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "Generate a new set of pair-wise matches between the", "bbox": {"l": 330.9137, "t": 283.36325000000005, "r": 545.11499, "b": 292.26981, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "corrected bounding boxes and PDF cells. This time use a", "bbox": {"l": 308.86203, "t": 295.31824, "r": 545.11511, "b": 304.22479, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "modified version of the IOU metric, where the area of the", "bbox": {"l": 308.86203, "t": 307.27322, "r": 545.11505, "b": 316.17978, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "intersection between the predicted and PDF cells is divided", "bbox": {"l": 308.86203, "t": 319.22821000000005, "r": 545.11511, "b": 328.13477, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "by the PDF cell area.", "bbox": {"l": 308.86203, "t": 331.1842, "r": 397.19043, "b": 340.09076000000005, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "In case there are multiple matches", "bbox": {"l": 403.65616, "t": 331.1842, "r": 545.11511, "b": 340.09076000000005, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "for the same PDF cell, the prediction with the higher score", "bbox": {"l": 308.86203, "t": 343.13919, "r": 545.11511, "b": 352.04575, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "is preferred. This covers the cases where the PDF cells are", "bbox": {"l": 308.86203, "t": 355.09418, "r": 545.11505, "b": 364.00073, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "smaller than the area of predicted or corrected prediction", "bbox": {"l": 308.86203, "t": 367.04916, "r": 545.11505, "b": 375.95572000000004, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "cells.", "bbox": {"l": 308.86203, "t": 379.00415, "r": 329.61414, "b": 387.91071, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "7. Generate a new set of pair-wise matches between the corrected bounding boxes and PDF cells. This time use a modified version of the IOU metric, where the area of the intersection between the predicted and PDF cells is divided by the PDF cell area. In case there are multiple matches for the same PDF cell, the prediction with the higher score is preferred. This covers the cases where the PDF cells are smaller than the area of predicted or corrected prediction cells."}, {"label": "list_item", "id": 17, "page_no": 11, "cluster": {"id": 17, "label": "list_item", "bbox": {"l": 308.86203, "t": 391.31015, "r": 545.11517, "b": 459.99164, "coord_origin": "TOPLEFT"}, "confidence": 0.8719939589500427, "cells": [{"id": 150, "text": "8.", "bbox": {"l": 320.81702, "t": 391.31015, "r": 328.55356, "b": 400.2167099999999, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "In some rare occasions, we have noticed that Table-", "bbox": {"l": 331.13242, "t": 391.31015, "r": 545.11505, "b": 400.2167099999999, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "Former can confuse a single column as two. When the post-", "bbox": {"l": 308.86203, "t": 403.26514, "r": 545.11517, "b": 412.17169, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "processing steps are applied, this results with two predicted", "bbox": {"l": 308.86203, "t": 415.22012000000007, "r": 545.11511, "b": 424.12668, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "columns pointing to the same PDF column. In such case", "bbox": {"l": 308.86203, "t": 427.17511, "r": 545.11511, "b": 436.0816699999999, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "we must de-duplicate the columns according to highest to-", "bbox": {"l": 308.86203, "t": 439.1301, "r": 545.11505, "b": 448.03665, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "tal column intersection score.", "bbox": {"l": 308.86203, "t": 451.08507999999995, "r": 426.18161, "b": 459.99164, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "8. In some rare occasions, we have noticed that TableFormer can confuse a single column as two. When the postprocessing steps are applied, this results with two predicted columns pointing to the same PDF column. In such case we must de-duplicate the columns according to highest total column intersection score."}, {"label": "list_item", "id": 15, "page_no": 11, "cluster": {"id": 15, "label": "list_item", "bbox": {"l": 308.86203, "t": 463.39108, "r": 545.11517, "b": 567.93858, "coord_origin": "TOPLEFT"}, "confidence": 0.9126085042953491, "cells": [{"id": 157, "text": "9.", "bbox": {"l": 320.81702, "t": 463.39108, "r": 328.67316, "b": 472.29764, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "Pick up the remaining orphan cells. There could be", "bbox": {"l": 331.29187, "t": 463.39108, "r": 545.11499, "b": 472.29764, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "cases, when after applying all the previous post-processing", "bbox": {"l": 308.86203, "t": 475.34607, "r": 545.11505, "b": 484.25262, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "steps, some PDF cells could still remain without any match", "bbox": {"l": 308.86203, "t": 487.30106, "r": 545.11517, "b": 496.20761, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "to predicted cells.", "bbox": {"l": 308.86203, "t": 499.25604, "r": 381.89786, "b": 508.1626, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "However, it is still possible to deduce", "bbox": {"l": 388.7023, "t": 499.25604, "r": 545.11517, "b": 508.1626, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "the correct matching for an orphan PDF cell by mapping its", "bbox": {"l": 308.86203, "t": 511.21204, "r": 545.11511, "b": 520.11859, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "bounding box on the geometry of the grid. This mapping", "bbox": {"l": 308.86203, "t": 523.16702, "r": 545.11505, "b": 532.07358, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "decides if the content of the orphan cell will be appended to", "bbox": {"l": 308.86203, "t": 535.12201, "r": 545.11499, "b": 544.02858, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "an already matched table cell, or a new table cell should be", "bbox": {"l": 308.86203, "t": 547.07703, "r": 545.11517, "b": 555.98358, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "created to match with the orphan.", "bbox": {"l": 308.86203, "t": 559.03203, "r": 442.22147000000007, "b": 567.93858, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "9. Pick up the remaining orphan cells. There could be cases, when after applying all the previous post-processing steps, some PDF cells could still remain without any match to predicted cells. However, it is still possible to deduce the correct matching for an orphan PDF cell by mapping its bounding box on the geometry of the grid. This mapping decides if the content of the orphan cell will be appended to an already matched table cell, or a new table cell should be created to match with the orphan."}, {"label": "text", "id": 19, "page_no": 11, "cluster": {"id": 19, "label": "text", "bbox": {"l": 308.86203, "t": 571.33803, "r": 545.11688, "b": 604.15459, "coord_origin": "TOPLEFT"}, "confidence": 0.8459475636482239, "cells": [{"id": 168, "text": "9a. Compute the top and bottom boundary of the hori-", "bbox": {"l": 320.81702, "t": 571.33803, "r": 545.11493, "b": 580.24458, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "zontal band for each grid row (min/max", "bbox": {"l": 308.86203, "t": 583.29303, "r": 471.64093, "b": 592.19958, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "y", "bbox": {"l": 474.83405, "t": 583.1336200000001, "r": 479.71872, "b": 591.98041, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "coordinates per", "bbox": {"l": 483.26903999999996, "t": 583.29303, "r": 545.11688, "b": 592.19958, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "row).", "bbox": {"l": 308.86206, "t": 595.24803, "r": 329.91306, "b": 604.15459, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "9a. Compute the top and bottom boundary of the horizontal band for each grid row (min/max y coordinates per row)."}, {"label": "list_item", "id": 21, "page_no": 11, "cluster": {"id": 21, "label": "list_item", "bbox": {"l": 308.86206, "t": 607.55304, "r": 545.11505, "b": 628.4155900000001, "coord_origin": "TOPLEFT"}, "confidence": 0.7716898918151855, "cells": [{"id": 173, "text": "9b.", "bbox": {"l": 320.81705, "t": 607.55304, "r": 332.8718, "b": 616.4595899999999, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "Intersect the orphan\u2019s bounding box with the row", "bbox": {"l": 339.92532, "t": 607.55304, "r": 545.11505, "b": 616.4595899999999, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "bands, and map the cell to the closest grid row.", "bbox": {"l": 308.86206, "t": 619.50903, "r": 495.2923, "b": 628.4155900000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "9b. Intersect the orphan\u2019s bounding box with the row bands, and map the cell to the closest grid row."}, {"label": "list_item", "id": 18, "page_no": 11, "cluster": {"id": 18, "label": "list_item", "bbox": {"l": 308.86206, "t": 631.81403, "r": 545.11505, "b": 664.63059, "coord_origin": "TOPLEFT"}, "confidence": 0.8584902882575989, "cells": [{"id": 176, "text": "9c. Compute the left and right boundary of the vertical", "bbox": {"l": 320.81705, "t": 631.81403, "r": 545.11505, "b": 640.72058, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "band for each grid column (min/max", "bbox": {"l": 308.86206, "t": 643.7690299999999, "r": 455.28238, "b": 652.67558, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "x", "bbox": {"l": 457.77704, "t": 643.60962, "r": 463.47067, "b": 652.45641, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "coordinates per col-", "bbox": {"l": 465.97104, "t": 643.7690299999999, "r": 545.11389, "b": 652.67558, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "umn).", "bbox": {"l": 308.86206, "t": 655.72403, "r": 332.38376, "b": 664.63059, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "9c. Compute the left and right boundary of the vertical band for each grid column (min/max x coordinates per column)."}, {"label": "list_item", "id": 22, "page_no": 11, "cluster": {"id": 22, "label": "list_item", "bbox": {"l": 308.86206, "t": 668.03003, "r": 545.11499, "b": 688.89159, "coord_origin": "TOPLEFT"}, "confidence": 0.759074866771698, "cells": [{"id": 181, "text": "9d. Intersect the orphan\u2019s bounding box with the column", "bbox": {"l": 320.81705, "t": 668.03003, "r": 545.11499, "b": 676.93659, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "bands, and map the cell to the closest grid column.", "bbox": {"l": 308.86206, "t": 679.98503, "r": 510.5848700000001, "b": 688.89159, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "9d. Intersect the orphan\u2019s bounding box with the column bands, and map the cell to the closest grid column."}, {"label": "list_item", "id": 25, "page_no": 11, "cluster": {"id": 25, "label": "list_item", "bbox": {"l": 308.86206, "t": 692.290024, "r": 545.11517, "b": 713.151596, "coord_origin": "TOPLEFT"}, "confidence": 0.6971189975738525, "cells": [{"id": 183, "text": "9e. If the table cell under the identified row and column", "bbox": {"l": 320.81705, "t": 692.290024, "r": 545.11505, "b": 701.196594, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "is not empty, extend its content with the content of the or-", "bbox": {"l": 308.86206, "t": 704.245026, "r": 545.11517, "b": 713.151596, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "9e. If the table cell under the identified row and column is not empty, extend its content with the content of the or-"}], "headers": [{"label": "page_footer", "id": 14, "page_no": 11, "cluster": {"id": 14, "label": "page_footer", "bbox": {"l": 292.63107, "t": 734.13303, "r": 302.59366, "b": 743.039593, "coord_origin": "TOPLEFT"}, "confidence": 0.9126599431037903, "cells": [{"id": 185, "text": "12", "bbox": {"l": 292.63107, "t": 734.13303, "r": 302.59366, "b": 743.039593, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "12"}]}}, {"page_no": 12, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "phan cell.", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 88.846588, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "9f. Otherwise create a new structural cell and match it", "bbox": {"l": 62.067001, "t": 87.16339000000005, "r": 286.36496, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "wit the orphan cell.", "bbox": {"l": 50.112, "t": 99.11841000000004, "r": 127.03322, "b": 108.02495999999985, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Aditional images with examples of TableFormer predic-", "bbox": {"l": 62.067001, "t": 111.16309000000001, "r": 286.36499, "b": 119.7508499999999, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "tions and post-processing can be found below.", "bbox": {"l": 50.112, "t": 123.11810000000003, "r": 234.06139999999996, "b": 131.70587, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Figure 8: Example of a table with multi-line header.", "bbox": {"l": 63.341, "t": 502.05637, "r": 273.13342, "b": 510.96292, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Figure 9:", "bbox": {"l": 308.862, "t": 306.59836, "r": 345.63397, "b": 315.50491, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Example of a table with big empty distance be-", "bbox": {"l": 352.78711, "t": 306.59836, "r": 545.11511, "b": 315.50491, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "tween cells.", "bbox": {"l": 308.862, "t": 318.55334, "r": 355.89545, "b": 327.45990000000006, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Figure 10: Example of a complex table with empty cells.", "bbox": {"l": 312.34299, "t": 680.4933599999999, "r": 541.63232, "b": 689.39993, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "13", "bbox": {"l": 292.63098, "t": 734.133358, "r": 302.59357, "b": 743.039921, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 14, "label": "text", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 88.846588, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.7545604109764099, "cells": [{"id": 0, "text": "phan cell.", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 88.846588, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 50.112, "t": 87.16339000000005, "r": 286.36496, "b": 108.02495999999985, "coord_origin": "TOPLEFT"}, "confidence": 0.9170765280723572, "cells": [{"id": 1, "text": "9f. Otherwise create a new structural cell and match it", "bbox": {"l": 62.067001, "t": 87.16339000000005, "r": 286.36496, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "wit the orphan cell.", "bbox": {"l": 50.112, "t": 99.11841000000004, "r": 127.03322, "b": 108.02495999999985, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 50.112, "t": 111.16309000000001, "r": 286.36499, "b": 131.70587, "coord_origin": "TOPLEFT"}, "confidence": 0.9454684257507324, "cells": [{"id": 3, "text": "Aditional images with examples of TableFormer predic-", "bbox": {"l": 62.067001, "t": 111.16309000000001, "r": 286.36499, "b": 119.7508499999999, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "tions and post-processing can be found below.", "bbox": {"l": 50.112, "t": 123.11810000000003, "r": 234.06139999999996, "b": 131.70587, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "caption", "bbox": {"l": 63.341, "t": 502.05637, "r": 273.13342, "b": 510.96292, "coord_origin": "TOPLEFT"}, "confidence": 0.8971083164215088, "cells": [{"id": 5, "text": "Figure 8: Example of a table with multi-line header.", "bbox": {"l": 63.341, "t": 502.05637, "r": 273.13342, "b": 510.96292, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "caption", "bbox": {"l": 308.862, "t": 306.59836, "r": 545.11511, "b": 327.45990000000006, "coord_origin": "TOPLEFT"}, "confidence": 0.8773334622383118, "cells": [{"id": 6, "text": "Figure 9:", "bbox": {"l": 308.862, "t": 306.59836, "r": 345.63397, "b": 315.50491, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Example of a table with big empty distance be-", "bbox": {"l": 352.78711, "t": 306.59836, "r": 545.11511, "b": 315.50491, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "tween cells.", "bbox": {"l": 308.862, "t": 318.55334, "r": 355.89545, "b": 327.45990000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "caption", "bbox": {"l": 312.34299, "t": 680.4933599999999, "r": 541.63232, "b": 689.39993, "coord_origin": "TOPLEFT"}, "confidence": 0.9188510179519653, "cells": [{"id": 9, "text": "Figure 10: Example of a complex table with empty cells.", "bbox": {"l": 312.34299, "t": 680.4933599999999, "r": 541.63232, "b": 689.39993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "page_footer", "bbox": {"l": 292.63098, "t": 734.133358, "r": 302.59357, "b": 743.039921, "coord_origin": "TOPLEFT"}, "confidence": 0.9020507335662842, "cells": [{"id": 10, "text": "13", "bbox": {"l": 292.63098, "t": 734.133358, "r": 302.59357, "b": 743.039921, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "table", "bbox": {"l": 310.3294372558594, "t": 101.17761993408203, "r": 555.8338623046875, "b": 136.14747619628906, "coord_origin": "TOPLEFT"}, "confidence": 0.7048211097717285, "cells": [], "children": []}, {"id": 32, "label": "table", "bbox": {"l": 309.9566345214844, "t": 154.61447143554688, "r": 555.7466430664062, "b": 184.72254943847656, "coord_origin": "TOPLEFT"}, "confidence": 0.5642898082733154, "cells": [], "children": []}, {"id": 9, "label": "table", "bbox": {"l": 84.0283203125, "t": 156.3335418701172, "r": 239.1690673828125, "b": 214.39334106445312, "coord_origin": "TOPLEFT"}, "confidence": 0.8857285976409912, "cells": [], "children": []}, {"id": 21, "label": "table", "bbox": {"l": 309.9635314941406, "t": 195.7053985595703, "r": 555.7054443359375, "b": 233.55148315429688, "coord_origin": "TOPLEFT"}, "confidence": 0.6602534651756287, "cells": [], "children": []}, {"id": 4, "label": "table", "bbox": {"l": 82.92001342773438, "t": 233.7763214111328, "r": 239.1903533935547, "b": 291.283935546875, "coord_origin": "TOPLEFT"}, "confidence": 0.9155728220939636, "cells": [], "children": []}, {"id": 19, "label": "picture", "bbox": {"l": 309.79150390625, "t": 253.90536499023438, "r": 425.9603271484375, "b": 292.39398193359375, "coord_origin": "TOPLEFT"}, "confidence": 0.6956613063812256, "cells": [], "children": []}, {"id": 37, "label": "table", "bbox": {"l": 309.79150390625, "t": 253.90536499023438, "r": 425.9603271484375, "b": 292.39398193359375, "coord_origin": "TOPLEFT"}, "confidence": 0.5282703042030334, "cells": [], "children": []}, {"id": 6, "label": "table", "bbox": {"l": 83.94786071777344, "t": 309.0477294921875, "r": 239.17135620117188, "b": 367.9095764160156, "coord_origin": "TOPLEFT"}, "confidence": 0.9085132479667664, "cells": [], "children": []}, {"id": 12, "label": "table", "bbox": {"l": 335.2694091796875, "t": 388.46746826171875, "r": 490.08184814453125, "b": 437.02239990234375, "coord_origin": "TOPLEFT"}, "confidence": 0.8486074805259705, "cells": [], "children": []}, {"id": 0, "label": "table", "bbox": {"l": 83.31758117675781, "t": 396.0135498046875, "r": 248.87306213378906, "b": 487.2569885253906, "coord_origin": "TOPLEFT"}, "confidence": 0.9613965749740601, "cells": [], "children": []}, {"id": 10, "label": "table", "bbox": {"l": 334.9334411621094, "t": 453.9476318359375, "r": 490.0914611816406, "b": 502.7210998535156, "coord_origin": "TOPLEFT"}, "confidence": 0.8815536499023438, "cells": [], "children": []}, {"id": 5, "label": "table", "bbox": {"l": 335.2545471191406, "t": 519.07568359375, "r": 490.22369384765625, "b": 567.6879272460938, "coord_origin": "TOPLEFT"}, "confidence": 0.9096733927726746, "cells": [], "children": []}, {"id": 13, "label": "picture", "bbox": {"l": 333.9573669433594, "t": 593.1134033203125, "r": 518.4768676757812, "b": 665.4903564453125, "coord_origin": "TOPLEFT"}, "confidence": 0.802356481552124, "cells": [], "children": []}, {"id": 30, "label": "table", "bbox": {"l": 333.9573669433594, "t": 593.1134033203125, "r": 518.4768676757812, "b": 665.4903564453125, "coord_origin": "TOPLEFT"}, "confidence": 0.5930299758911133, "cells": [], "children": []}]}, "tablestructure": {"table_map": {"17": {"label": "table", "id": 17, "page_no": 12, "cluster": {"id": 17, "label": "table", "bbox": {"l": 310.3294372558594, "t": 101.17761993408203, "r": 555.8338623046875, "b": 136.14747619628906, "coord_origin": "TOPLEFT"}, "confidence": 0.7048211097717285, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, "32": {"label": "table", "id": 32, "page_no": 12, "cluster": {"id": 32, "label": "table", "bbox": {"l": 309.9566345214844, "t": 154.61447143554688, "r": 555.7466430664062, "b": 184.72254943847656, "coord_origin": "TOPLEFT"}, "confidence": 0.5642898082733154, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, "9": {"label": "table", "id": 9, "page_no": 12, "cluster": {"id": 9, "label": "table", "bbox": {"l": 84.0283203125, "t": 156.3335418701172, "r": 239.1690673828125, "b": 214.39334106445312, "coord_origin": "TOPLEFT"}, "confidence": 0.8857285976409912, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, "21": {"label": "table", "id": 21, "page_no": 12, "cluster": {"id": 21, "label": "table", "bbox": {"l": 309.9635314941406, "t": 195.7053985595703, "r": 555.7054443359375, "b": 233.55148315429688, "coord_origin": "TOPLEFT"}, "confidence": 0.6602534651756287, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, "4": {"label": "table", "id": 4, "page_no": 12, "cluster": {"id": 4, "label": "table", "bbox": {"l": 82.92001342773438, "t": 233.7763214111328, "r": 239.1903533935547, "b": 291.283935546875, "coord_origin": "TOPLEFT"}, "confidence": 0.9155728220939636, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, "37": {"label": "table", "id": 37, "page_no": 12, "cluster": {"id": 37, "label": "table", "bbox": {"l": 309.79150390625, "t": 253.90536499023438, "r": 425.9603271484375, "b": 292.39398193359375, "coord_origin": "TOPLEFT"}, "confidence": 0.5282703042030334, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, "6": {"label": "table", "id": 6, "page_no": 12, "cluster": {"id": 6, "label": "table", "bbox": {"l": 83.94786071777344, "t": 309.0477294921875, "r": 239.17135620117188, "b": 367.9095764160156, "coord_origin": "TOPLEFT"}, "confidence": 0.9085132479667664, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, "12": {"label": "table", "id": 12, "page_no": 12, "cluster": {"id": 12, "label": "table", "bbox": {"l": 335.2694091796875, "t": 388.46746826171875, "r": 490.08184814453125, "b": 437.02239990234375, "coord_origin": "TOPLEFT"}, "confidence": 0.8486074805259705, "cells": [], "children": []}, "text": null, "otsl_seq": ["ecel", "ched", "ched", "lcel", "ched", "nl", "ecel", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, "0": {"label": "table", "id": 0, "page_no": 12, "cluster": {"id": 0, "label": "table", "bbox": {"l": 83.31758117675781, "t": 396.0135498046875, "r": 248.87306213378906, "b": 487.2569885253906, "coord_origin": "TOPLEFT"}, "confidence": 0.9613965749740601, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "ched", "nl", "fcel", "lcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "lcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, "10": {"label": "table", "id": 10, "page_no": 12, "cluster": {"id": 10, "label": "table", "bbox": {"l": 334.9334411621094, "t": 453.9476318359375, "r": 490.0914611816406, "b": 502.7210998535156, "coord_origin": "TOPLEFT"}, "confidence": 0.8815536499023438, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "lcel", "lcel", "lcel", "nl", "ched", "ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, "5": {"label": "table", "id": 5, "page_no": 12, "cluster": {"id": 5, "label": "table", "bbox": {"l": 335.2545471191406, "t": 519.07568359375, "r": 490.22369384765625, "b": 567.6879272460938, "coord_origin": "TOPLEFT"}, "confidence": 0.9096733927726746, "cells": [], "children": []}, "text": null, "otsl_seq": ["ecel", "ched", "lcel", "lcel", "lcel", "nl", "ecel", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, "30": {"label": "table", "id": 30, "page_no": 12, "cluster": {"id": 30, "label": "table", "bbox": {"l": 333.9573669433594, "t": 593.1134033203125, "r": 518.4768676757812, "b": 665.4903564453125, "coord_origin": "TOPLEFT"}, "confidence": 0.5930299758911133, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "text", "id": 14, "page_no": 12, "cluster": {"id": 14, "label": "text", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 88.846588, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.7545604109764099, "cells": [{"id": 0, "text": "phan cell.", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 88.846588, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "phan cell."}, {"label": "text", "id": 3, "page_no": 12, "cluster": {"id": 3, "label": "text", "bbox": {"l": 50.112, "t": 87.16339000000005, "r": 286.36496, "b": 108.02495999999985, "coord_origin": "TOPLEFT"}, "confidence": 0.9170765280723572, "cells": [{"id": 1, "text": "9f. Otherwise create a new structural cell and match it", "bbox": {"l": 62.067001, "t": 87.16339000000005, "r": 286.36496, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "wit the orphan cell.", "bbox": {"l": 50.112, "t": 99.11841000000004, "r": 127.03322, "b": 108.02495999999985, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "9f. Otherwise create a new structural cell and match it wit the orphan cell."}, {"label": "text", "id": 1, "page_no": 12, "cluster": {"id": 1, "label": "text", "bbox": {"l": 50.112, "t": 111.16309000000001, "r": 286.36499, "b": 131.70587, "coord_origin": "TOPLEFT"}, "confidence": 0.9454684257507324, "cells": [{"id": 3, "text": "Aditional images with examples of TableFormer predic-", "bbox": {"l": 62.067001, "t": 111.16309000000001, "r": 286.36499, "b": 119.7508499999999, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "tions and post-processing can be found below.", "bbox": {"l": 50.112, "t": 123.11810000000003, "r": 234.06139999999996, "b": 131.70587, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Aditional images with examples of TableFormer predictions and post-processing can be found below."}, {"label": "caption", "id": 8, "page_no": 12, "cluster": {"id": 8, "label": "caption", "bbox": {"l": 63.341, "t": 502.05637, "r": 273.13342, "b": 510.96292, "coord_origin": "TOPLEFT"}, "confidence": 0.8971083164215088, "cells": [{"id": 5, "text": "Figure 8: Example of a table with multi-line header.", "bbox": {"l": 63.341, "t": 502.05637, "r": 273.13342, "b": 510.96292, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 8: Example of a table with multi-line header."}, {"label": "caption", "id": 11, "page_no": 12, "cluster": {"id": 11, "label": "caption", "bbox": {"l": 308.862, "t": 306.59836, "r": 545.11511, "b": 327.45990000000006, "coord_origin": "TOPLEFT"}, "confidence": 0.8773334622383118, "cells": [{"id": 6, "text": "Figure 9:", "bbox": {"l": 308.862, "t": 306.59836, "r": 345.63397, "b": 315.50491, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Example of a table with big empty distance be-", "bbox": {"l": 352.78711, "t": 306.59836, "r": 545.11511, "b": 315.50491, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "tween cells.", "bbox": {"l": 308.862, "t": 318.55334, "r": 355.89545, "b": 327.45990000000006, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 9: Example of a table with big empty distance between cells."}, {"label": "caption", "id": 2, "page_no": 12, "cluster": {"id": 2, "label": "caption", "bbox": {"l": 312.34299, "t": 680.4933599999999, "r": 541.63232, "b": 689.39993, "coord_origin": "TOPLEFT"}, "confidence": 0.9188510179519653, "cells": [{"id": 9, "text": "Figure 10: Example of a complex table with empty cells.", "bbox": {"l": 312.34299, "t": 680.4933599999999, "r": 541.63232, "b": 689.39993, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 10: Example of a complex table with empty cells."}, {"label": "page_footer", "id": 7, "page_no": 12, "cluster": {"id": 7, "label": "page_footer", "bbox": {"l": 292.63098, "t": 734.133358, "r": 302.59357, "b": 743.039921, "coord_origin": "TOPLEFT"}, "confidence": 0.9020507335662842, "cells": [{"id": 10, "text": "13", "bbox": {"l": 292.63098, "t": 734.133358, "r": 302.59357, "b": 743.039921, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "13"}, {"label": "table", "id": 17, "page_no": 12, "cluster": {"id": 17, "label": "table", "bbox": {"l": 310.3294372558594, "t": 101.17761993408203, "r": 555.8338623046875, "b": 136.14747619628906, "coord_origin": "TOPLEFT"}, "confidence": 0.7048211097717285, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 32, "page_no": 12, "cluster": {"id": 32, "label": "table", "bbox": {"l": 309.9566345214844, "t": 154.61447143554688, "r": 555.7466430664062, "b": 184.72254943847656, "coord_origin": "TOPLEFT"}, "confidence": 0.5642898082733154, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 9, "page_no": 12, "cluster": {"id": 9, "label": "table", "bbox": {"l": 84.0283203125, "t": 156.3335418701172, "r": 239.1690673828125, "b": 214.39334106445312, "coord_origin": "TOPLEFT"}, "confidence": 0.8857285976409912, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 21, "page_no": 12, "cluster": {"id": 21, "label": "table", "bbox": {"l": 309.9635314941406, "t": 195.7053985595703, "r": 555.7054443359375, "b": 233.55148315429688, "coord_origin": "TOPLEFT"}, "confidence": 0.6602534651756287, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 4, "page_no": 12, "cluster": {"id": 4, "label": "table", "bbox": {"l": 82.92001342773438, "t": 233.7763214111328, "r": 239.1903533935547, "b": 291.283935546875, "coord_origin": "TOPLEFT"}, "confidence": 0.9155728220939636, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "picture", "id": 19, "page_no": 12, "cluster": {"id": 19, "label": "picture", "bbox": {"l": 309.79150390625, "t": 253.90536499023438, "r": 425.9603271484375, "b": 292.39398193359375, "coord_origin": "TOPLEFT"}, "confidence": 0.6956613063812256, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "table", "id": 37, "page_no": 12, "cluster": {"id": 37, "label": "table", "bbox": {"l": 309.79150390625, "t": 253.90536499023438, "r": 425.9603271484375, "b": 292.39398193359375, "coord_origin": "TOPLEFT"}, "confidence": 0.5282703042030334, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 6, "page_no": 12, "cluster": {"id": 6, "label": "table", "bbox": {"l": 83.94786071777344, "t": 309.0477294921875, "r": 239.17135620117188, "b": 367.9095764160156, "coord_origin": "TOPLEFT"}, "confidence": 0.9085132479667664, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 12, "page_no": 12, "cluster": {"id": 12, "label": "table", "bbox": {"l": 335.2694091796875, "t": 388.46746826171875, "r": 490.08184814453125, "b": 437.02239990234375, "coord_origin": "TOPLEFT"}, "confidence": 0.8486074805259705, "cells": [], "children": []}, "text": null, "otsl_seq": ["ecel", "ched", "ched", "lcel", "ched", "nl", "ecel", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 0, "page_no": 12, "cluster": {"id": 0, "label": "table", "bbox": {"l": 83.31758117675781, "t": 396.0135498046875, "r": 248.87306213378906, "b": 487.2569885253906, "coord_origin": "TOPLEFT"}, "confidence": 0.9613965749740601, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "ched", "nl", "fcel", "lcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "lcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 10, "page_no": 12, "cluster": {"id": 10, "label": "table", "bbox": {"l": 334.9334411621094, "t": 453.9476318359375, "r": 490.0914611816406, "b": 502.7210998535156, "coord_origin": "TOPLEFT"}, "confidence": 0.8815536499023438, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "lcel", "lcel", "lcel", "nl", "ched", "ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 5, "page_no": 12, "cluster": {"id": 5, "label": "table", "bbox": {"l": 335.2545471191406, "t": 519.07568359375, "r": 490.22369384765625, "b": 567.6879272460938, "coord_origin": "TOPLEFT"}, "confidence": 0.9096733927726746, "cells": [], "children": []}, "text": null, "otsl_seq": ["ecel", "ched", "lcel", "lcel", "lcel", "nl", "ecel", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "picture", "id": 13, "page_no": 12, "cluster": {"id": 13, "label": "picture", "bbox": {"l": 333.9573669433594, "t": 593.1134033203125, "r": 518.4768676757812, "b": 665.4903564453125, "coord_origin": "TOPLEFT"}, "confidence": 0.802356481552124, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "table", "id": 30, "page_no": 12, "cluster": {"id": 30, "label": "table", "bbox": {"l": 333.9573669433594, "t": 593.1134033203125, "r": 518.4768676757812, "b": 665.4903564453125, "coord_origin": "TOPLEFT"}, "confidence": 0.5930299758911133, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}], "body": [{"label": "text", "id": 14, "page_no": 12, "cluster": {"id": 14, "label": "text", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 88.846588, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.7545604109764099, "cells": [{"id": 0, "text": "phan cell.", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 88.846588, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "phan cell."}, {"label": "text", "id": 3, "page_no": 12, "cluster": {"id": 3, "label": "text", "bbox": {"l": 50.112, "t": 87.16339000000005, "r": 286.36496, "b": 108.02495999999985, "coord_origin": "TOPLEFT"}, "confidence": 0.9170765280723572, "cells": [{"id": 1, "text": "9f. Otherwise create a new structural cell and match it", "bbox": {"l": 62.067001, "t": 87.16339000000005, "r": 286.36496, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "wit the orphan cell.", "bbox": {"l": 50.112, "t": 99.11841000000004, "r": 127.03322, "b": 108.02495999999985, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "9f. Otherwise create a new structural cell and match it wit the orphan cell."}, {"label": "text", "id": 1, "page_no": 12, "cluster": {"id": 1, "label": "text", "bbox": {"l": 50.112, "t": 111.16309000000001, "r": 286.36499, "b": 131.70587, "coord_origin": "TOPLEFT"}, "confidence": 0.9454684257507324, "cells": [{"id": 3, "text": "Aditional images with examples of TableFormer predic-", "bbox": {"l": 62.067001, "t": 111.16309000000001, "r": 286.36499, "b": 119.7508499999999, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "tions and post-processing can be found below.", "bbox": {"l": 50.112, "t": 123.11810000000003, "r": 234.06139999999996, "b": 131.70587, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Aditional images with examples of TableFormer predictions and post-processing can be found below."}, {"label": "caption", "id": 8, "page_no": 12, "cluster": {"id": 8, "label": "caption", "bbox": {"l": 63.341, "t": 502.05637, "r": 273.13342, "b": 510.96292, "coord_origin": "TOPLEFT"}, "confidence": 0.8971083164215088, "cells": [{"id": 5, "text": "Figure 8: Example of a table with multi-line header.", "bbox": {"l": 63.341, "t": 502.05637, "r": 273.13342, "b": 510.96292, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 8: Example of a table with multi-line header."}, {"label": "caption", "id": 11, "page_no": 12, "cluster": {"id": 11, "label": "caption", "bbox": {"l": 308.862, "t": 306.59836, "r": 545.11511, "b": 327.45990000000006, "coord_origin": "TOPLEFT"}, "confidence": 0.8773334622383118, "cells": [{"id": 6, "text": "Figure 9:", "bbox": {"l": 308.862, "t": 306.59836, "r": 345.63397, "b": 315.50491, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Example of a table with big empty distance be-", "bbox": {"l": 352.78711, "t": 306.59836, "r": 545.11511, "b": 315.50491, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "tween cells.", "bbox": {"l": 308.862, "t": 318.55334, "r": 355.89545, "b": 327.45990000000006, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 9: Example of a table with big empty distance between cells."}, {"label": "caption", "id": 2, "page_no": 12, "cluster": {"id": 2, "label": "caption", "bbox": {"l": 312.34299, "t": 680.4933599999999, "r": 541.63232, "b": 689.39993, "coord_origin": "TOPLEFT"}, "confidence": 0.9188510179519653, "cells": [{"id": 9, "text": "Figure 10: Example of a complex table with empty cells.", "bbox": {"l": 312.34299, "t": 680.4933599999999, "r": 541.63232, "b": 689.39993, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 10: Example of a complex table with empty cells."}, {"label": "table", "id": 17, "page_no": 12, "cluster": {"id": 17, "label": "table", "bbox": {"l": 310.3294372558594, "t": 101.17761993408203, "r": 555.8338623046875, "b": 136.14747619628906, "coord_origin": "TOPLEFT"}, "confidence": 0.7048211097717285, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 32, "page_no": 12, "cluster": {"id": 32, "label": "table", "bbox": {"l": 309.9566345214844, "t": 154.61447143554688, "r": 555.7466430664062, "b": 184.72254943847656, "coord_origin": "TOPLEFT"}, "confidence": 0.5642898082733154, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 9, "page_no": 12, "cluster": {"id": 9, "label": "table", "bbox": {"l": 84.0283203125, "t": 156.3335418701172, "r": 239.1690673828125, "b": 214.39334106445312, "coord_origin": "TOPLEFT"}, "confidence": 0.8857285976409912, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 21, "page_no": 12, "cluster": {"id": 21, "label": "table", "bbox": {"l": 309.9635314941406, "t": 195.7053985595703, "r": 555.7054443359375, "b": 233.55148315429688, "coord_origin": "TOPLEFT"}, "confidence": 0.6602534651756287, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 4, "page_no": 12, "cluster": {"id": 4, "label": "table", "bbox": {"l": 82.92001342773438, "t": 233.7763214111328, "r": 239.1903533935547, "b": 291.283935546875, "coord_origin": "TOPLEFT"}, "confidence": 0.9155728220939636, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "picture", "id": 19, "page_no": 12, "cluster": {"id": 19, "label": "picture", "bbox": {"l": 309.79150390625, "t": 253.90536499023438, "r": 425.9603271484375, "b": 292.39398193359375, "coord_origin": "TOPLEFT"}, "confidence": 0.6956613063812256, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "table", "id": 37, "page_no": 12, "cluster": {"id": 37, "label": "table", "bbox": {"l": 309.79150390625, "t": 253.90536499023438, "r": 425.9603271484375, "b": 292.39398193359375, "coord_origin": "TOPLEFT"}, "confidence": 0.5282703042030334, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 6, "page_no": 12, "cluster": {"id": 6, "label": "table", "bbox": {"l": 83.94786071777344, "t": 309.0477294921875, "r": 239.17135620117188, "b": 367.9095764160156, "coord_origin": "TOPLEFT"}, "confidence": 0.9085132479667664, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 12, "page_no": 12, "cluster": {"id": 12, "label": "table", "bbox": {"l": 335.2694091796875, "t": 388.46746826171875, "r": 490.08184814453125, "b": 437.02239990234375, "coord_origin": "TOPLEFT"}, "confidence": 0.8486074805259705, "cells": [], "children": []}, "text": null, "otsl_seq": ["ecel", "ched", "ched", "lcel", "ched", "nl", "ecel", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 0, "page_no": 12, "cluster": {"id": 0, "label": "table", "bbox": {"l": 83.31758117675781, "t": 396.0135498046875, "r": 248.87306213378906, "b": 487.2569885253906, "coord_origin": "TOPLEFT"}, "confidence": 0.9613965749740601, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "ched", "nl", "fcel", "lcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "lcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 10, "page_no": 12, "cluster": {"id": 10, "label": "table", "bbox": {"l": 334.9334411621094, "t": 453.9476318359375, "r": 490.0914611816406, "b": 502.7210998535156, "coord_origin": "TOPLEFT"}, "confidence": 0.8815536499023438, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "lcel", "lcel", "lcel", "nl", "ched", "ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 5, "page_no": 12, "cluster": {"id": 5, "label": "table", "bbox": {"l": 335.2545471191406, "t": 519.07568359375, "r": 490.22369384765625, "b": 567.6879272460938, "coord_origin": "TOPLEFT"}, "confidence": 0.9096733927726746, "cells": [], "children": []}, "text": null, "otsl_seq": ["ecel", "ched", "lcel", "lcel", "lcel", "nl", "ecel", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "picture", "id": 13, "page_no": 12, "cluster": {"id": 13, "label": "picture", "bbox": {"l": 333.9573669433594, "t": 593.1134033203125, "r": 518.4768676757812, "b": 665.4903564453125, "coord_origin": "TOPLEFT"}, "confidence": 0.802356481552124, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "table", "id": 30, "page_no": 12, "cluster": {"id": 30, "label": "table", "bbox": {"l": 333.9573669433594, "t": 593.1134033203125, "r": 518.4768676757812, "b": 665.4903564453125, "coord_origin": "TOPLEFT"}, "confidence": 0.5930299758911133, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}], "headers": [{"label": "page_footer", "id": 7, "page_no": 12, "cluster": {"id": 7, "label": "page_footer", "bbox": {"l": 292.63098, "t": 734.133358, "r": 302.59357, "b": 743.039921, "coord_origin": "TOPLEFT"}, "confidence": 0.9020507335662842, "cells": [{"id": 10, "text": "13", "bbox": {"l": 292.63098, "t": 734.133358, "r": 302.59357, "b": 743.039921, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "13"}]}}, {"page_no": 13, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "Figure 11:", "bbox": {"l": 50.112, "t": 356.77036, "r": 93.050797, "b": 365.67691, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Simple table with different style and empty", "bbox": {"l": 103.73071, "t": 356.77036, "r": 286.36508, "b": 365.67691, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "cells.", "bbox": {"l": 50.112, "t": 368.72534, "r": 70.864098, "b": 377.6319, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Figure 12: Simple table predictions and post processing.", "bbox": {"l": 54.618998999999995, "t": 671.81836, "r": 281.8559, "b": 680.72492, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Figure 13: Table predictions example on colorful table.", "bbox": {"l": 315.79001, "t": 371.68436, "r": 538.18524, "b": 380.59091, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Figure 14: Example with multi-line text.", "bbox": {"l": 344.98499, "t": 683.54636, "r": 508.98935000000006, "b": 692.452927, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "14", "bbox": {"l": 292.63098, "t": 734.133362, "r": 302.59357, "b": 743.039925, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 0, "label": "caption", "bbox": {"l": 50.112, "t": 356.77036, "r": 286.36508, "b": 377.6319, "coord_origin": "TOPLEFT"}, "confidence": 0.951069176197052, "cells": [{"id": 0, "text": "Figure 11:", "bbox": {"l": 50.112, "t": 356.77036, "r": 93.050797, "b": 365.67691, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Simple table with different style and empty", "bbox": {"l": 103.73071, "t": 356.77036, "r": 286.36508, "b": 365.67691, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "cells.", "bbox": {"l": 50.112, "t": 368.72534, "r": 70.864098, "b": 377.6319, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "caption", "bbox": {"l": 54.618998999999995, "t": 671.81836, "r": 281.8559, "b": 680.72492, "coord_origin": "TOPLEFT"}, "confidence": 0.9263845086097717, "cells": [{"id": 3, "text": "Figure 12: Simple table predictions and post processing.", "bbox": {"l": 54.618998999999995, "t": 671.81836, "r": 281.8559, "b": 680.72492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "caption", "bbox": {"l": 315.79001, "t": 371.68436, "r": 538.18524, "b": 380.59091, "coord_origin": "TOPLEFT"}, "confidence": 0.9178510904312134, "cells": [{"id": 4, "text": "Figure 13: Table predictions example on colorful table.", "bbox": {"l": 315.79001, "t": 371.68436, "r": 538.18524, "b": 380.59091, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "caption", "bbox": {"l": 344.98499, "t": 683.54636, "r": 508.98935000000006, "b": 692.452927, "coord_origin": "TOPLEFT"}, "confidence": 0.9191023111343384, "cells": [{"id": 5, "text": "Figure 14: Example with multi-line text.", "bbox": {"l": 344.98499, "t": 683.54636, "r": 508.98935000000006, "b": 692.452927, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "page_footer", "bbox": {"l": 292.63098, "t": 734.133362, "r": 302.59357, "b": 743.039925, "coord_origin": "TOPLEFT"}, "confidence": 0.887715220451355, "cells": [{"id": 6, "text": "14", "bbox": {"l": 292.63098, "t": 734.133362, "r": 302.59357, "b": 743.039925, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "picture", "bbox": {"l": 318.6332092285156, "t": 90.88423156738281, "r": 534.73583984375, "b": 359.0575866699219, "coord_origin": "TOPLEFT"}, "confidence": 0.500360369682312, "cells": [], "children": []}, {"id": 30, "label": "picture", "bbox": {"l": 51.1537971496582, "t": 104.30853271484375, "r": 282.8598937988281, "b": 344.9066467285156, "coord_origin": "TOPLEFT"}, "confidence": 0.5613778829574585, "cells": [], "children": []}, {"id": 23, "label": "table", "bbox": {"l": 318.98101806640625, "t": 161.23458862304688, "r": 534.6228637695312, "b": 214.62606811523438, "coord_origin": "TOPLEFT"}, "confidence": 0.6235625743865967, "cells": [], "children": []}, {"id": 33, "label": "table", "bbox": {"l": 319.0057678222656, "t": 226.10633850097656, "r": 534.408935546875, "b": 279.8576965332031, "coord_origin": "TOPLEFT"}, "confidence": 0.5502498149871826, "cells": [], "children": []}, {"id": 27, "label": "table", "bbox": {"l": 51.72642135620117, "t": 273.6092529296875, "r": 283.114013671875, "b": 344.2444763183594, "coord_origin": "TOPLEFT"}, "confidence": 0.5696624517440796, "cells": [], "children": []}, {"id": 38, "label": "table", "bbox": {"l": 328.13812255859375, "t": 288.6817932128906, "r": 523.8915405273438, "b": 358.2724304199219, "coord_origin": "TOPLEFT"}, "confidence": 0.5227429270744324, "cells": [], "children": []}, {"id": 10, "label": "table", "bbox": {"l": 319.4707946777344, "t": 430.90301513671875, "r": 518.5693359375, "b": 477.94354248046875, "coord_origin": "TOPLEFT"}, "confidence": 0.8384720683097839, "cells": [], "children": []}, {"id": 9, "label": "table", "bbox": {"l": 51.43488693237305, "t": 453.48748779296875, "r": 310.7267150878906, "b": 491.82025146484375, "coord_origin": "TOPLEFT"}, "confidence": 0.8418160676956177, "cells": [], "children": []}, {"id": 8, "label": "table", "bbox": {"l": 319.982666015625, "t": 489.2437438964844, "r": 519.0963745117188, "b": 535.69580078125, "coord_origin": "TOPLEFT"}, "confidence": 0.8502873182296753, "cells": [], "children": []}, {"id": 4, "label": "table", "bbox": {"l": 50.86823654174805, "t": 504.09625244140625, "r": 310.6080017089844, "b": 542.4459838867188, "coord_origin": "TOPLEFT"}, "confidence": 0.8922698497772217, "cells": [], "children": []}, {"id": 15, "label": "table", "bbox": {"l": 319.82879638671875, "t": 546.4093017578125, "r": 519.6065673828125, "b": 593.1064453125, "coord_origin": "TOPLEFT"}, "confidence": 0.6817978024482727, "cells": [], "children": []}, {"id": 6, "label": "table", "bbox": {"l": 51.27280807495117, "t": 553.728515625, "r": 311.0897216796875, "b": 591.913330078125, "coord_origin": "TOPLEFT"}, "confidence": 0.8872220516204834, "cells": [], "children": []}, {"id": 7, "label": "table", "bbox": {"l": 319.0649719238281, "t": 609.8408203125, "r": 533.7738647460938, "b": 669.1920776367188, "coord_origin": "TOPLEFT"}, "confidence": 0.8717731237411499, "cells": [], "children": []}, {"id": 11, "label": "picture", "bbox": {"l": 50.404788970947266, "t": 611.0038452148438, "r": 177.05642700195312, "b": 656.1609497070312, "coord_origin": "TOPLEFT"}, "confidence": 0.7871124148368835, "cells": [], "children": []}]}, "tablestructure": {"table_map": {"23": {"label": "table", "id": 23, "page_no": 13, "cluster": {"id": 23, "label": "table", "bbox": {"l": 318.98101806640625, "t": 161.23458862304688, "r": 534.6228637695312, "b": 214.62606811523438, "coord_origin": "TOPLEFT"}, "confidence": 0.6235625743865967, "cells": [], "children": []}, "text": null, "otsl_seq": ["fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, "33": {"label": "table", "id": 33, "page_no": 13, "cluster": {"id": 33, "label": "table", "bbox": {"l": 319.0057678222656, "t": 226.10633850097656, "r": 534.408935546875, "b": 279.8576965332031, "coord_origin": "TOPLEFT"}, "confidence": 0.5502498149871826, "cells": [], "children": []}, "text": null, "otsl_seq": ["fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, "27": {"label": "table", "id": 27, "page_no": 13, "cluster": {"id": 27, "label": "table", "bbox": {"l": 51.72642135620117, "t": 273.6092529296875, "r": 283.114013671875, "b": 344.2444763183594, "coord_origin": "TOPLEFT"}, "confidence": 0.5696624517440796, "cells": [], "children": []}, "text": null, "otsl_seq": ["ecel", "ched", "ched", "ched", "nl", "ecel", "fcel", "fcel", "fcel", "nl", "ecel", "fcel", "fcel", "fcel", "nl", "ecel", "fcel", "fcel", "ecel", "nl", "ecel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "ecel", "nl", "rhed", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "ecel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, "38": {"label": "table", "id": 38, "page_no": 13, "cluster": {"id": 38, "label": "table", "bbox": {"l": 328.13812255859375, "t": 288.6817932128906, "r": 523.8915405273438, "b": 358.2724304199219, "coord_origin": "TOPLEFT"}, "confidence": 0.5227429270744324, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "ecel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, "10": {"label": "table", "id": 10, "page_no": 13, "cluster": {"id": 10, "label": "table", "bbox": {"l": 319.4707946777344, "t": 430.90301513671875, "r": 518.5693359375, "b": 477.94354248046875, "coord_origin": "TOPLEFT"}, "confidence": 0.8384720683097839, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, "9": {"label": "table", "id": 9, "page_no": 13, "cluster": {"id": 9, "label": "table", "bbox": {"l": 51.43488693237305, "t": 453.48748779296875, "r": 310.7267150878906, "b": 491.82025146484375, "coord_origin": "TOPLEFT"}, "confidence": 0.8418160676956177, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, "8": {"label": "table", "id": 8, "page_no": 13, "cluster": {"id": 8, "label": "table", "bbox": {"l": 319.982666015625, "t": 489.2437438964844, "r": 519.0963745117188, "b": 535.69580078125, "coord_origin": "TOPLEFT"}, "confidence": 0.8502873182296753, "cells": [], "children": []}, "text": null, "otsl_seq": ["fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, "4": {"label": "table", "id": 4, "page_no": 13, "cluster": {"id": 4, "label": "table", "bbox": {"l": 50.86823654174805, "t": 504.09625244140625, "r": 310.6080017089844, "b": 542.4459838867188, "coord_origin": "TOPLEFT"}, "confidence": 0.8922698497772217, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, "15": {"label": "table", "id": 15, "page_no": 13, "cluster": {"id": 15, "label": "table", "bbox": {"l": 319.82879638671875, "t": 546.4093017578125, "r": 519.6065673828125, "b": 593.1064453125, "coord_origin": "TOPLEFT"}, "confidence": 0.6817978024482727, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, "6": {"label": "table", "id": 6, "page_no": 13, "cluster": {"id": 6, "label": "table", "bbox": {"l": 51.27280807495117, "t": 553.728515625, "r": 311.0897216796875, "b": 591.913330078125, "coord_origin": "TOPLEFT"}, "confidence": 0.8872220516204834, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, "7": {"label": "table", "id": 7, "page_no": 13, "cluster": {"id": 7, "label": "table", "bbox": {"l": 319.0649719238281, "t": 609.8408203125, "r": 533.7738647460938, "b": 669.1920776367188, "coord_origin": "TOPLEFT"}, "confidence": 0.8717731237411499, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "caption", "id": 0, "page_no": 13, "cluster": {"id": 0, "label": "caption", "bbox": {"l": 50.112, "t": 356.77036, "r": 286.36508, "b": 377.6319, "coord_origin": "TOPLEFT"}, "confidence": 0.951069176197052, "cells": [{"id": 0, "text": "Figure 11:", "bbox": {"l": 50.112, "t": 356.77036, "r": 93.050797, "b": 365.67691, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Simple table with different style and empty", "bbox": {"l": 103.73071, "t": 356.77036, "r": 286.36508, "b": 365.67691, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "cells.", "bbox": {"l": 50.112, "t": 368.72534, "r": 70.864098, "b": 377.6319, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 11: Simple table with different style and empty cells."}, {"label": "caption", "id": 1, "page_no": 13, "cluster": {"id": 1, "label": "caption", "bbox": {"l": 54.618998999999995, "t": 671.81836, "r": 281.8559, "b": 680.72492, "coord_origin": "TOPLEFT"}, "confidence": 0.9263845086097717, "cells": [{"id": 3, "text": "Figure 12: Simple table predictions and post processing.", "bbox": {"l": 54.618998999999995, "t": 671.81836, "r": 281.8559, "b": 680.72492, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 12: Simple table predictions and post processing."}, {"label": "caption", "id": 3, "page_no": 13, "cluster": {"id": 3, "label": "caption", "bbox": {"l": 315.79001, "t": 371.68436, "r": 538.18524, "b": 380.59091, "coord_origin": "TOPLEFT"}, "confidence": 0.9178510904312134, "cells": [{"id": 4, "text": "Figure 13: Table predictions example on colorful table.", "bbox": {"l": 315.79001, "t": 371.68436, "r": 538.18524, "b": 380.59091, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 13: Table predictions example on colorful table."}, {"label": "caption", "id": 2, "page_no": 13, "cluster": {"id": 2, "label": "caption", "bbox": {"l": 344.98499, "t": 683.54636, "r": 508.98935000000006, "b": 692.452927, "coord_origin": "TOPLEFT"}, "confidence": 0.9191023111343384, "cells": [{"id": 5, "text": "Figure 14: Example with multi-line text.", "bbox": {"l": 344.98499, "t": 683.54636, "r": 508.98935000000006, "b": 692.452927, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 14: Example with multi-line text."}, {"label": "page_footer", "id": 5, "page_no": 13, "cluster": {"id": 5, "label": "page_footer", "bbox": {"l": 292.63098, "t": 734.133362, "r": 302.59357, "b": 743.039925, "coord_origin": "TOPLEFT"}, "confidence": 0.887715220451355, "cells": [{"id": 6, "text": "14", "bbox": {"l": 292.63098, "t": 734.133362, "r": 302.59357, "b": 743.039925, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "14"}, {"label": "picture", "id": 41, "page_no": 13, "cluster": {"id": 41, "label": "picture", "bbox": {"l": 318.6332092285156, "t": 90.88423156738281, "r": 534.73583984375, "b": 359.0575866699219, "coord_origin": "TOPLEFT"}, "confidence": 0.500360369682312, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "picture", "id": 30, "page_no": 13, "cluster": {"id": 30, "label": "picture", "bbox": {"l": 51.1537971496582, "t": 104.30853271484375, "r": 282.8598937988281, "b": 344.9066467285156, "coord_origin": "TOPLEFT"}, "confidence": 0.5613778829574585, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "table", "id": 23, "page_no": 13, "cluster": {"id": 23, "label": "table", "bbox": {"l": 318.98101806640625, "t": 161.23458862304688, "r": 534.6228637695312, "b": 214.62606811523438, "coord_origin": "TOPLEFT"}, "confidence": 0.6235625743865967, "cells": [], "children": []}, "text": null, "otsl_seq": ["fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 33, "page_no": 13, "cluster": {"id": 33, "label": "table", "bbox": {"l": 319.0057678222656, "t": 226.10633850097656, "r": 534.408935546875, "b": 279.8576965332031, "coord_origin": "TOPLEFT"}, "confidence": 0.5502498149871826, "cells": [], "children": []}, "text": null, "otsl_seq": ["fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 27, "page_no": 13, "cluster": {"id": 27, "label": "table", "bbox": {"l": 51.72642135620117, "t": 273.6092529296875, "r": 283.114013671875, "b": 344.2444763183594, "coord_origin": "TOPLEFT"}, "confidence": 0.5696624517440796, "cells": [], "children": []}, "text": null, "otsl_seq": ["ecel", "ched", "ched", "ched", "nl", "ecel", "fcel", "fcel", "fcel", "nl", "ecel", "fcel", "fcel", "fcel", "nl", "ecel", "fcel", "fcel", "ecel", "nl", "ecel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "ecel", "nl", "rhed", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "ecel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 38, "page_no": 13, "cluster": {"id": 38, "label": "table", "bbox": {"l": 328.13812255859375, "t": 288.6817932128906, "r": 523.8915405273438, "b": 358.2724304199219, "coord_origin": "TOPLEFT"}, "confidence": 0.5227429270744324, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "ecel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 10, "page_no": 13, "cluster": {"id": 10, "label": "table", "bbox": {"l": 319.4707946777344, "t": 430.90301513671875, "r": 518.5693359375, "b": 477.94354248046875, "coord_origin": "TOPLEFT"}, "confidence": 0.8384720683097839, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 9, "page_no": 13, "cluster": {"id": 9, "label": "table", "bbox": {"l": 51.43488693237305, "t": 453.48748779296875, "r": 310.7267150878906, "b": 491.82025146484375, "coord_origin": "TOPLEFT"}, "confidence": 0.8418160676956177, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 8, "page_no": 13, "cluster": {"id": 8, "label": "table", "bbox": {"l": 319.982666015625, "t": 489.2437438964844, "r": 519.0963745117188, "b": 535.69580078125, "coord_origin": "TOPLEFT"}, "confidence": 0.8502873182296753, "cells": [], "children": []}, "text": null, "otsl_seq": ["fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 4, "page_no": 13, "cluster": {"id": 4, "label": "table", "bbox": {"l": 50.86823654174805, "t": 504.09625244140625, "r": 310.6080017089844, "b": 542.4459838867188, "coord_origin": "TOPLEFT"}, "confidence": 0.8922698497772217, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 15, "page_no": 13, "cluster": {"id": 15, "label": "table", "bbox": {"l": 319.82879638671875, "t": 546.4093017578125, "r": 519.6065673828125, "b": 593.1064453125, "coord_origin": "TOPLEFT"}, "confidence": 0.6817978024482727, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 6, "page_no": 13, "cluster": {"id": 6, "label": "table", "bbox": {"l": 51.27280807495117, "t": 553.728515625, "r": 311.0897216796875, "b": 591.913330078125, "coord_origin": "TOPLEFT"}, "confidence": 0.8872220516204834, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 7, "page_no": 13, "cluster": {"id": 7, "label": "table", "bbox": {"l": 319.0649719238281, "t": 609.8408203125, "r": 533.7738647460938, "b": 669.1920776367188, "coord_origin": "TOPLEFT"}, "confidence": 0.8717731237411499, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "picture", "id": 11, "page_no": 13, "cluster": {"id": 11, "label": "picture", "bbox": {"l": 50.404788970947266, "t": 611.0038452148438, "r": 177.05642700195312, "b": 656.1609497070312, "coord_origin": "TOPLEFT"}, "confidence": 0.7871124148368835, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "body": [{"label": "caption", "id": 0, "page_no": 13, "cluster": {"id": 0, "label": "caption", "bbox": {"l": 50.112, "t": 356.77036, "r": 286.36508, "b": 377.6319, "coord_origin": "TOPLEFT"}, "confidence": 0.951069176197052, "cells": [{"id": 0, "text": "Figure 11:", "bbox": {"l": 50.112, "t": 356.77036, "r": 93.050797, "b": 365.67691, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Simple table with different style and empty", "bbox": {"l": 103.73071, "t": 356.77036, "r": 286.36508, "b": 365.67691, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "cells.", "bbox": {"l": 50.112, "t": 368.72534, "r": 70.864098, "b": 377.6319, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 11: Simple table with different style and empty cells."}, {"label": "caption", "id": 1, "page_no": 13, "cluster": {"id": 1, "label": "caption", "bbox": {"l": 54.618998999999995, "t": 671.81836, "r": 281.8559, "b": 680.72492, "coord_origin": "TOPLEFT"}, "confidence": 0.9263845086097717, "cells": [{"id": 3, "text": "Figure 12: Simple table predictions and post processing.", "bbox": {"l": 54.618998999999995, "t": 671.81836, "r": 281.8559, "b": 680.72492, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 12: Simple table predictions and post processing."}, {"label": "caption", "id": 3, "page_no": 13, "cluster": {"id": 3, "label": "caption", "bbox": {"l": 315.79001, "t": 371.68436, "r": 538.18524, "b": 380.59091, "coord_origin": "TOPLEFT"}, "confidence": 0.9178510904312134, "cells": [{"id": 4, "text": "Figure 13: Table predictions example on colorful table.", "bbox": {"l": 315.79001, "t": 371.68436, "r": 538.18524, "b": 380.59091, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 13: Table predictions example on colorful table."}, {"label": "caption", "id": 2, "page_no": 13, "cluster": {"id": 2, "label": "caption", "bbox": {"l": 344.98499, "t": 683.54636, "r": 508.98935000000006, "b": 692.452927, "coord_origin": "TOPLEFT"}, "confidence": 0.9191023111343384, "cells": [{"id": 5, "text": "Figure 14: Example with multi-line text.", "bbox": {"l": 344.98499, "t": 683.54636, "r": 508.98935000000006, "b": 692.452927, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 14: Example with multi-line text."}, {"label": "picture", "id": 41, "page_no": 13, "cluster": {"id": 41, "label": "picture", "bbox": {"l": 318.6332092285156, "t": 90.88423156738281, "r": 534.73583984375, "b": 359.0575866699219, "coord_origin": "TOPLEFT"}, "confidence": 0.500360369682312, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "picture", "id": 30, "page_no": 13, "cluster": {"id": 30, "label": "picture", "bbox": {"l": 51.1537971496582, "t": 104.30853271484375, "r": 282.8598937988281, "b": 344.9066467285156, "coord_origin": "TOPLEFT"}, "confidence": 0.5613778829574585, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "table", "id": 23, "page_no": 13, "cluster": {"id": 23, "label": "table", "bbox": {"l": 318.98101806640625, "t": 161.23458862304688, "r": 534.6228637695312, "b": 214.62606811523438, "coord_origin": "TOPLEFT"}, "confidence": 0.6235625743865967, "cells": [], "children": []}, "text": null, "otsl_seq": ["fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 33, "page_no": 13, "cluster": {"id": 33, "label": "table", "bbox": {"l": 319.0057678222656, "t": 226.10633850097656, "r": 534.408935546875, "b": 279.8576965332031, "coord_origin": "TOPLEFT"}, "confidence": 0.5502498149871826, "cells": [], "children": []}, "text": null, "otsl_seq": ["fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 27, "page_no": 13, "cluster": {"id": 27, "label": "table", "bbox": {"l": 51.72642135620117, "t": 273.6092529296875, "r": 283.114013671875, "b": 344.2444763183594, "coord_origin": "TOPLEFT"}, "confidence": 0.5696624517440796, "cells": [], "children": []}, "text": null, "otsl_seq": ["ecel", "ched", "ched", "ched", "nl", "ecel", "fcel", "fcel", "fcel", "nl", "ecel", "fcel", "fcel", "fcel", "nl", "ecel", "fcel", "fcel", "ecel", "nl", "ecel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "ecel", "nl", "rhed", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "ecel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 38, "page_no": 13, "cluster": {"id": 38, "label": "table", "bbox": {"l": 328.13812255859375, "t": 288.6817932128906, "r": 523.8915405273438, "b": 358.2724304199219, "coord_origin": "TOPLEFT"}, "confidence": 0.5227429270744324, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "ecel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 10, "page_no": 13, "cluster": {"id": 10, "label": "table", "bbox": {"l": 319.4707946777344, "t": 430.90301513671875, "r": 518.5693359375, "b": 477.94354248046875, "coord_origin": "TOPLEFT"}, "confidence": 0.8384720683097839, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 9, "page_no": 13, "cluster": {"id": 9, "label": "table", "bbox": {"l": 51.43488693237305, "t": 453.48748779296875, "r": 310.7267150878906, "b": 491.82025146484375, "coord_origin": "TOPLEFT"}, "confidence": 0.8418160676956177, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 8, "page_no": 13, "cluster": {"id": 8, "label": "table", "bbox": {"l": 319.982666015625, "t": 489.2437438964844, "r": 519.0963745117188, "b": 535.69580078125, "coord_origin": "TOPLEFT"}, "confidence": 0.8502873182296753, "cells": [], "children": []}, "text": null, "otsl_seq": ["fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 4, "page_no": 13, "cluster": {"id": 4, "label": "table", "bbox": {"l": 50.86823654174805, "t": 504.09625244140625, "r": 310.6080017089844, "b": 542.4459838867188, "coord_origin": "TOPLEFT"}, "confidence": 0.8922698497772217, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 15, "page_no": 13, "cluster": {"id": 15, "label": "table", "bbox": {"l": 319.82879638671875, "t": 546.4093017578125, "r": 519.6065673828125, "b": 593.1064453125, "coord_origin": "TOPLEFT"}, "confidence": 0.6817978024482727, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 6, "page_no": 13, "cluster": {"id": 6, "label": "table", "bbox": {"l": 51.27280807495117, "t": 553.728515625, "r": 311.0897216796875, "b": 591.913330078125, "coord_origin": "TOPLEFT"}, "confidence": 0.8872220516204834, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 7, "page_no": 13, "cluster": {"id": 7, "label": "table", "bbox": {"l": 319.0649719238281, "t": 609.8408203125, "r": 533.7738647460938, "b": 669.1920776367188, "coord_origin": "TOPLEFT"}, "confidence": 0.8717731237411499, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "picture", "id": 11, "page_no": 13, "cluster": {"id": 11, "label": "picture", "bbox": {"l": 50.404788970947266, "t": 611.0038452148438, "r": 177.05642700195312, "b": 656.1609497070312, "coord_origin": "TOPLEFT"}, "confidence": 0.7871124148368835, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "headers": [{"label": "page_footer", "id": 5, "page_no": 13, "cluster": {"id": 5, "label": "page_footer", "bbox": {"l": 292.63098, "t": 734.133362, "r": 302.59357, "b": 743.039925, "coord_origin": "TOPLEFT"}, "confidence": 0.887715220451355, "cells": [{"id": 6, "text": "14", "bbox": {"l": 292.63098, "t": 734.133362, "r": 302.59357, "b": 743.039925, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "14"}]}}, {"page_no": 14, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "Figure 15: Example with triangular table.", "bbox": {"l": 84.233002, "t": 644.3513800000001, "r": 252.24225, "b": 653.25793, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Figure 16: Example of how post-processing helps to restore", "bbox": {"l": 308.86197, "t": 652.93535, "r": 545.11511, "b": 661.8419, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "mis-aligned bounding boxes prediction artifact.", "bbox": {"l": 308.86197, "t": 664.89035, "r": 497.60349, "b": 673.79691, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "15", "bbox": {"l": 292.63098, "t": 734.133343, "r": 302.59357, "b": 743.039906, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 0, "label": "caption", "bbox": {"l": 84.233002, "t": 644.3513800000001, "r": 252.24225, "b": 653.25793, "coord_origin": "TOPLEFT"}, "confidence": 0.9257222414016724, "cells": [{"id": 0, "text": "Figure 15: Example with triangular table.", "bbox": {"l": 84.233002, "t": 644.3513800000001, "r": 252.24225, "b": 653.25793, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "caption", "bbox": {"l": 308.86197, "t": 652.93535, "r": 545.11511, "b": 673.79691, "coord_origin": "TOPLEFT"}, "confidence": 0.9134758710861206, "cells": [{"id": 1, "text": "Figure 16: Example of how post-processing helps to restore", "bbox": {"l": 308.86197, "t": 652.93535, "r": 545.11511, "b": 661.8419, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "mis-aligned bounding boxes prediction artifact.", "bbox": {"l": 308.86197, "t": 664.89035, "r": 497.60349, "b": 673.79691, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "page_footer", "bbox": {"l": 292.63098, "t": 734.133343, "r": 302.59357, "b": 743.039906, "coord_origin": "TOPLEFT"}, "confidence": 0.9037020802497864, "cells": [{"id": 3, "text": "15", "bbox": {"l": 292.63098, "t": 734.133343, "r": 302.59357, "b": 743.039906, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "table", "bbox": {"l": 323.0059814453125, "t": 121.54714965820312, "r": 525.95166015625, "b": 222.91140747070312, "coord_origin": "TOPLEFT"}, "confidence": 0.8569067120552063, "cells": [], "children": []}, {"id": 6, "label": "picture", "bbox": {"l": 55.1163444519043, "t": 136.2550048828125, "r": 279.370849609375, "b": 249.33450317382812, "coord_origin": "TOPLEFT"}, "confidence": 0.8099274635314941, "cells": [], "children": []}, {"id": 19, "label": "table", "bbox": {"l": 55.1163444519043, "t": 136.2550048828125, "r": 279.370849609375, "b": 249.33450317382812, "coord_origin": "TOPLEFT"}, "confidence": 0.5584843158721924, "cells": [], "children": []}, {"id": 2, "label": "table", "bbox": {"l": 323.384765625, "t": 241.97293090820312, "r": 526.1268920898438, "b": 344.0920715332031, "coord_origin": "TOPLEFT"}, "confidence": 0.9060242772102356, "cells": [], "children": []}, {"id": 18, "label": "picture", "bbox": {"l": 54.28135299682617, "t": 260.2615661621094, "r": 279.2568359375, "b": 373.5271301269531, "coord_origin": "TOPLEFT"}, "confidence": 0.567050039768219, "cells": [], "children": []}, {"id": 10, "label": "table", "bbox": {"l": 54.28135299682617, "t": 260.2615661621094, "r": 279.2568359375, "b": 373.5271301269531, "coord_origin": "TOPLEFT"}, "confidence": 0.7748245000839233, "cells": [], "children": []}, {"id": 20, "label": "picture", "bbox": {"l": 323.4686279296875, "t": 362.4508361816406, "r": 525.9568481445312, "b": 464.260498046875, "coord_origin": "TOPLEFT"}, "confidence": 0.5515204071998596, "cells": [], "children": []}, {"id": 9, "label": "table", "bbox": {"l": 323.4686279296875, "t": 362.4508361816406, "r": 525.9568481445312, "b": 464.260498046875, "coord_origin": "TOPLEFT"}, "confidence": 0.7755159139633179, "cells": [], "children": []}, {"id": 5, "label": "picture", "bbox": {"l": 55.423954010009766, "t": 384.5550537109375, "r": 280.2310791015625, "b": 497.563720703125, "coord_origin": "TOPLEFT"}, "confidence": 0.8410322666168213, "cells": [], "children": []}, {"id": 22, "label": "picture", "bbox": {"l": 353.6920471191406, "t": 487.405029296875, "r": 495.4288024902344, "b": 635.7732543945312, "coord_origin": "TOPLEFT"}, "confidence": 0.5478789210319519, "cells": [], "children": []}, {"id": 8, "label": "table", "bbox": {"l": 353.6920471191406, "t": 487.405029296875, "r": 495.4288024902344, "b": 635.7732543945312, "coord_origin": "TOPLEFT"}, "confidence": 0.7805565595626831, "cells": [], "children": []}, {"id": 7, "label": "picture", "bbox": {"l": 50.64816665649414, "t": 505.9803161621094, "r": 319.91033935546875, "b": 631.2634887695312, "coord_origin": "TOPLEFT"}, "confidence": 0.8057597875595093, "cells": [], "children": []}, {"id": 11, "label": "table", "bbox": {"l": 50.64816665649414, "t": 505.9803161621094, "r": 319.91033935546875, "b": 631.2634887695312, "coord_origin": "TOPLEFT"}, "confidence": 0.6835255026817322, "cells": [], "children": []}]}, "tablestructure": {"table_map": {"4": {"label": "table", "id": 4, "page_no": 14, "cluster": {"id": 4, "label": "table", "bbox": {"l": 323.0059814453125, "t": 121.54714965820312, "r": 525.95166015625, "b": 222.91140747070312, "coord_origin": "TOPLEFT"}, "confidence": 0.8569067120552063, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, "19": {"label": "table", "id": 19, "page_no": 14, "cluster": {"id": 19, "label": "table", "bbox": {"l": 55.1163444519043, "t": 136.2550048828125, "r": 279.370849609375, "b": 249.33450317382812, "coord_origin": "TOPLEFT"}, "confidence": 0.5584843158721924, "cells": [], "children": []}, "text": null, "otsl_seq": ["ecel", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, "2": {"label": "table", "id": 2, "page_no": 14, "cluster": {"id": 2, "label": "table", "bbox": {"l": 323.384765625, "t": 241.97293090820312, "r": 526.1268920898438, "b": 344.0920715332031, "coord_origin": "TOPLEFT"}, "confidence": 0.9060242772102356, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, "10": {"label": "table", "id": 10, "page_no": 14, "cluster": {"id": 10, "label": "table", "bbox": {"l": 54.28135299682617, "t": 260.2615661621094, "r": 279.2568359375, "b": 373.5271301269531, "coord_origin": "TOPLEFT"}, "confidence": 0.7748245000839233, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, "9": {"label": "table", "id": 9, "page_no": 14, "cluster": {"id": 9, "label": "table", "bbox": {"l": 323.4686279296875, "t": 362.4508361816406, "r": 525.9568481445312, "b": 464.260498046875, "coord_origin": "TOPLEFT"}, "confidence": 0.7755159139633179, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, "8": {"label": "table", "id": 8, "page_no": 14, "cluster": {"id": 8, "label": "table", "bbox": {"l": 353.6920471191406, "t": 487.405029296875, "r": 495.4288024902344, "b": 635.7732543945312, "coord_origin": "TOPLEFT"}, "confidence": 0.7805565595626831, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, "11": {"label": "table", "id": 11, "page_no": 14, "cluster": {"id": 11, "label": "table", "bbox": {"l": 50.64816665649414, "t": 505.9803161621094, "r": 319.91033935546875, "b": 631.2634887695312, "coord_origin": "TOPLEFT"}, "confidence": 0.6835255026817322, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "caption", "id": 0, "page_no": 14, "cluster": {"id": 0, "label": "caption", "bbox": {"l": 84.233002, "t": 644.3513800000001, "r": 252.24225, "b": 653.25793, "coord_origin": "TOPLEFT"}, "confidence": 0.9257222414016724, "cells": [{"id": 0, "text": "Figure 15: Example with triangular table.", "bbox": {"l": 84.233002, "t": 644.3513800000001, "r": 252.24225, "b": 653.25793, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 15: Example with triangular table."}, {"label": "caption", "id": 1, "page_no": 14, "cluster": {"id": 1, "label": "caption", "bbox": {"l": 308.86197, "t": 652.93535, "r": 545.11511, "b": 673.79691, "coord_origin": "TOPLEFT"}, "confidence": 0.9134758710861206, "cells": [{"id": 1, "text": "Figure 16: Example of how post-processing helps to restore", "bbox": {"l": 308.86197, "t": 652.93535, "r": 545.11511, "b": 661.8419, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "mis-aligned bounding boxes prediction artifact.", "bbox": {"l": 308.86197, "t": 664.89035, "r": 497.60349, "b": 673.79691, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 16: Example of how post-processing helps to restore mis-aligned bounding boxes prediction artifact."}, {"label": "page_footer", "id": 3, "page_no": 14, "cluster": {"id": 3, "label": "page_footer", "bbox": {"l": 292.63098, "t": 734.133343, "r": 302.59357, "b": 743.039906, "coord_origin": "TOPLEFT"}, "confidence": 0.9037020802497864, "cells": [{"id": 3, "text": "15", "bbox": {"l": 292.63098, "t": 734.133343, "r": 302.59357, "b": 743.039906, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "15"}, {"label": "table", "id": 4, "page_no": 14, "cluster": {"id": 4, "label": "table", "bbox": {"l": 323.0059814453125, "t": 121.54714965820312, "r": 525.95166015625, "b": 222.91140747070312, "coord_origin": "TOPLEFT"}, "confidence": 0.8569067120552063, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "picture", "id": 6, "page_no": 14, "cluster": {"id": 6, "label": "picture", "bbox": {"l": 55.1163444519043, "t": 136.2550048828125, "r": 279.370849609375, "b": 249.33450317382812, "coord_origin": "TOPLEFT"}, "confidence": 0.8099274635314941, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "table", "id": 19, "page_no": 14, "cluster": {"id": 19, "label": "table", "bbox": {"l": 55.1163444519043, "t": 136.2550048828125, "r": 279.370849609375, "b": 249.33450317382812, "coord_origin": "TOPLEFT"}, "confidence": 0.5584843158721924, "cells": [], "children": []}, "text": null, "otsl_seq": ["ecel", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 2, "page_no": 14, "cluster": {"id": 2, "label": "table", "bbox": {"l": 323.384765625, "t": 241.97293090820312, "r": 526.1268920898438, "b": 344.0920715332031, "coord_origin": "TOPLEFT"}, "confidence": 0.9060242772102356, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "picture", "id": 18, "page_no": 14, "cluster": {"id": 18, "label": "picture", "bbox": {"l": 54.28135299682617, "t": 260.2615661621094, "r": 279.2568359375, "b": 373.5271301269531, "coord_origin": "TOPLEFT"}, "confidence": 0.567050039768219, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "table", "id": 10, "page_no": 14, "cluster": {"id": 10, "label": "table", "bbox": {"l": 54.28135299682617, "t": 260.2615661621094, "r": 279.2568359375, "b": 373.5271301269531, "coord_origin": "TOPLEFT"}, "confidence": 0.7748245000839233, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "picture", "id": 20, "page_no": 14, "cluster": {"id": 20, "label": "picture", "bbox": {"l": 323.4686279296875, "t": 362.4508361816406, "r": 525.9568481445312, "b": 464.260498046875, "coord_origin": "TOPLEFT"}, "confidence": 0.5515204071998596, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "table", "id": 9, "page_no": 14, "cluster": {"id": 9, "label": "table", "bbox": {"l": 323.4686279296875, "t": 362.4508361816406, "r": 525.9568481445312, "b": 464.260498046875, "coord_origin": "TOPLEFT"}, "confidence": 0.7755159139633179, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "picture", "id": 5, "page_no": 14, "cluster": {"id": 5, "label": "picture", "bbox": {"l": 55.423954010009766, "t": 384.5550537109375, "r": 280.2310791015625, "b": 497.563720703125, "coord_origin": "TOPLEFT"}, "confidence": 0.8410322666168213, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "picture", "id": 22, "page_no": 14, "cluster": {"id": 22, "label": "picture", "bbox": {"l": 353.6920471191406, "t": 487.405029296875, "r": 495.4288024902344, "b": 635.7732543945312, "coord_origin": "TOPLEFT"}, "confidence": 0.5478789210319519, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "table", "id": 8, "page_no": 14, "cluster": {"id": 8, "label": "table", "bbox": {"l": 353.6920471191406, "t": 487.405029296875, "r": 495.4288024902344, "b": 635.7732543945312, "coord_origin": "TOPLEFT"}, "confidence": 0.7805565595626831, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "picture", "id": 7, "page_no": 14, "cluster": {"id": 7, "label": "picture", "bbox": {"l": 50.64816665649414, "t": 505.9803161621094, "r": 319.91033935546875, "b": 631.2634887695312, "coord_origin": "TOPLEFT"}, "confidence": 0.8057597875595093, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "table", "id": 11, "page_no": 14, "cluster": {"id": 11, "label": "table", "bbox": {"l": 50.64816665649414, "t": 505.9803161621094, "r": 319.91033935546875, "b": 631.2634887695312, "coord_origin": "TOPLEFT"}, "confidence": 0.6835255026817322, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}], "body": [{"label": "caption", "id": 0, "page_no": 14, "cluster": {"id": 0, "label": "caption", "bbox": {"l": 84.233002, "t": 644.3513800000001, "r": 252.24225, "b": 653.25793, "coord_origin": "TOPLEFT"}, "confidence": 0.9257222414016724, "cells": [{"id": 0, "text": "Figure 15: Example with triangular table.", "bbox": {"l": 84.233002, "t": 644.3513800000001, "r": 252.24225, "b": 653.25793, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 15: Example with triangular table."}, {"label": "caption", "id": 1, "page_no": 14, "cluster": {"id": 1, "label": "caption", "bbox": {"l": 308.86197, "t": 652.93535, "r": 545.11511, "b": 673.79691, "coord_origin": "TOPLEFT"}, "confidence": 0.9134758710861206, "cells": [{"id": 1, "text": "Figure 16: Example of how post-processing helps to restore", "bbox": {"l": 308.86197, "t": 652.93535, "r": 545.11511, "b": 661.8419, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "mis-aligned bounding boxes prediction artifact.", "bbox": {"l": 308.86197, "t": 664.89035, "r": 497.60349, "b": 673.79691, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 16: Example of how post-processing helps to restore mis-aligned bounding boxes prediction artifact."}, {"label": "table", "id": 4, "page_no": 14, "cluster": {"id": 4, "label": "table", "bbox": {"l": 323.0059814453125, "t": 121.54714965820312, "r": 525.95166015625, "b": 222.91140747070312, "coord_origin": "TOPLEFT"}, "confidence": 0.8569067120552063, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "picture", "id": 6, "page_no": 14, "cluster": {"id": 6, "label": "picture", "bbox": {"l": 55.1163444519043, "t": 136.2550048828125, "r": 279.370849609375, "b": 249.33450317382812, "coord_origin": "TOPLEFT"}, "confidence": 0.8099274635314941, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "table", "id": 19, "page_no": 14, "cluster": {"id": 19, "label": "table", "bbox": {"l": 55.1163444519043, "t": 136.2550048828125, "r": 279.370849609375, "b": 249.33450317382812, "coord_origin": "TOPLEFT"}, "confidence": 0.5584843158721924, "cells": [], "children": []}, "text": null, "otsl_seq": ["ecel", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 2, "page_no": 14, "cluster": {"id": 2, "label": "table", "bbox": {"l": 323.384765625, "t": 241.97293090820312, "r": 526.1268920898438, "b": 344.0920715332031, "coord_origin": "TOPLEFT"}, "confidence": 0.9060242772102356, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "picture", "id": 18, "page_no": 14, "cluster": {"id": 18, "label": "picture", "bbox": {"l": 54.28135299682617, "t": 260.2615661621094, "r": 279.2568359375, "b": 373.5271301269531, "coord_origin": "TOPLEFT"}, "confidence": 0.567050039768219, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "table", "id": 10, "page_no": 14, "cluster": {"id": 10, "label": "table", "bbox": {"l": 54.28135299682617, "t": 260.2615661621094, "r": 279.2568359375, "b": 373.5271301269531, "coord_origin": "TOPLEFT"}, "confidence": 0.7748245000839233, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "picture", "id": 20, "page_no": 14, "cluster": {"id": 20, "label": "picture", "bbox": {"l": 323.4686279296875, "t": 362.4508361816406, "r": 525.9568481445312, "b": 464.260498046875, "coord_origin": "TOPLEFT"}, "confidence": 0.5515204071998596, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "table", "id": 9, "page_no": 14, "cluster": {"id": 9, "label": "table", "bbox": {"l": 323.4686279296875, "t": 362.4508361816406, "r": 525.9568481445312, "b": 464.260498046875, "coord_origin": "TOPLEFT"}, "confidence": 0.7755159139633179, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "picture", "id": 5, "page_no": 14, "cluster": {"id": 5, "label": "picture", "bbox": {"l": 55.423954010009766, "t": 384.5550537109375, "r": 280.2310791015625, "b": 497.563720703125, "coord_origin": "TOPLEFT"}, "confidence": 0.8410322666168213, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "picture", "id": 22, "page_no": 14, "cluster": {"id": 22, "label": "picture", "bbox": {"l": 353.6920471191406, "t": 487.405029296875, "r": 495.4288024902344, "b": 635.7732543945312, "coord_origin": "TOPLEFT"}, "confidence": 0.5478789210319519, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "table", "id": 8, "page_no": 14, "cluster": {"id": 8, "label": "table", "bbox": {"l": 353.6920471191406, "t": 487.405029296875, "r": 495.4288024902344, "b": 635.7732543945312, "coord_origin": "TOPLEFT"}, "confidence": 0.7805565595626831, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "picture", "id": 7, "page_no": 14, "cluster": {"id": 7, "label": "picture", "bbox": {"l": 50.64816665649414, "t": 505.9803161621094, "r": 319.91033935546875, "b": 631.2634887695312, "coord_origin": "TOPLEFT"}, "confidence": 0.8057597875595093, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "table", "id": 11, "page_no": 14, "cluster": {"id": 11, "label": "table", "bbox": {"l": 50.64816665649414, "t": 505.9803161621094, "r": 319.91033935546875, "b": 631.2634887695312, "coord_origin": "TOPLEFT"}, "confidence": 0.6835255026817322, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}], "headers": [{"label": "page_footer", "id": 3, "page_no": 14, "cluster": {"id": 3, "label": "page_footer", "bbox": {"l": 292.63098, "t": 734.133343, "r": 302.59357, "b": 743.039906, "coord_origin": "TOPLEFT"}, "confidence": 0.9037020802497864, "cells": [{"id": 3, "text": "15", "bbox": {"l": 292.63098, "t": 734.133343, "r": 302.59357, "b": 743.039906, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "15"}]}}, {"page_no": 15, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "Figure 17: Example of long table. End-to-end example from initial PDF cells to prediction of bounding boxes, post process-", "bbox": {"l": 50.112, "t": 508.33737, "r": 545.11383, "b": 517.24393, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "ing and prediction of structure.", "bbox": {"l": 50.112, "t": 520.2923599999999, "r": 173.23975, "b": 529.1989100000001, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "16", "bbox": {"l": 292.63098, "t": 734.133358, "r": 302.59357, "b": 743.039921, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 0, "label": "caption", "bbox": {"l": 50.112, "t": 508.33737, "r": 545.11383, "b": 529.1989100000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9624595642089844, "cells": [{"id": 0, "text": "Figure 17: Example of long table. End-to-end example from initial PDF cells to prediction of bounding boxes, post process-", "bbox": {"l": 50.112, "t": 508.33737, "r": 545.11383, "b": 517.24393, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "ing and prediction of structure.", "bbox": {"l": 50.112, "t": 520.2923599999999, "r": 173.23975, "b": 529.1989100000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "page_footer", "bbox": {"l": 292.63098, "t": 734.133358, "r": 302.59357, "b": 743.039921, "coord_origin": "TOPLEFT"}, "confidence": 0.9134100675582886, "cells": [{"id": 2, "text": "16", "bbox": {"l": 292.63098, "t": 734.133358, "r": 302.59357, "b": 743.039921, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "picture", "bbox": {"l": 66.79946899414062, "t": 253.61631774902344, "r": 528.5564575195312, "b": 498.1383972167969, "coord_origin": "TOPLEFT"}, "confidence": 0.6913459897041321, "cells": [], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "caption", "id": 0, "page_no": 15, "cluster": {"id": 0, "label": "caption", "bbox": {"l": 50.112, "t": 508.33737, "r": 545.11383, "b": 529.1989100000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9624595642089844, "cells": [{"id": 0, "text": "Figure 17: Example of long table. End-to-end example from initial PDF cells to prediction of bounding boxes, post process-", "bbox": {"l": 50.112, "t": 508.33737, "r": 545.11383, "b": 517.24393, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "ing and prediction of structure.", "bbox": {"l": 50.112, "t": 520.2923599999999, "r": 173.23975, "b": 529.1989100000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 17: Example of long table. End-to-end example from initial PDF cells to prediction of bounding boxes, post processing and prediction of structure."}, {"label": "page_footer", "id": 1, "page_no": 15, "cluster": {"id": 1, "label": "page_footer", "bbox": {"l": 292.63098, "t": 734.133358, "r": 302.59357, "b": 743.039921, "coord_origin": "TOPLEFT"}, "confidence": 0.9134100675582886, "cells": [{"id": 2, "text": "16", "bbox": {"l": 292.63098, "t": 734.133358, "r": 302.59357, "b": 743.039921, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "16"}, {"label": "picture", "id": 2, "page_no": 15, "cluster": {"id": 2, "label": "picture", "bbox": {"l": 66.79946899414062, "t": 253.61631774902344, "r": 528.5564575195312, "b": 498.1383972167969, "coord_origin": "TOPLEFT"}, "confidence": 0.6913459897041321, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "body": [{"label": "caption", "id": 0, "page_no": 15, "cluster": {"id": 0, "label": "caption", "bbox": {"l": 50.112, "t": 508.33737, "r": 545.11383, "b": 529.1989100000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9624595642089844, "cells": [{"id": 0, "text": "Figure 17: Example of long table. End-to-end example from initial PDF cells to prediction of bounding boxes, post process-", "bbox": {"l": 50.112, "t": 508.33737, "r": 545.11383, "b": 517.24393, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "ing and prediction of structure.", "bbox": {"l": 50.112, "t": 520.2923599999999, "r": 173.23975, "b": 529.1989100000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 17: Example of long table. End-to-end example from initial PDF cells to prediction of bounding boxes, post processing and prediction of structure."}, {"label": "picture", "id": 2, "page_no": 15, "cluster": {"id": 2, "label": "picture", "bbox": {"l": 66.79946899414062, "t": 253.61631774902344, "r": 528.5564575195312, "b": 498.1383972167969, "coord_origin": "TOPLEFT"}, "confidence": 0.6913459897041321, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "headers": [{"label": "page_footer", "id": 1, "page_no": 15, "cluster": {"id": 1, "label": "page_footer", "bbox": {"l": 292.63098, "t": 734.133358, "r": 302.59357, "b": 743.039921, "coord_origin": "TOPLEFT"}, "confidence": 0.9134100675582886, "cells": [{"id": 2, "text": "16", "bbox": {"l": 292.63098, "t": 734.133358, "r": 302.59357, "b": 743.039921, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "16"}]}}]
\ No newline at end of file
+[{"page_no": 0, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "TableFormer: Table Structure Understanding with Transformers.", "bbox": {"l": 96.301003, "t": 107.03412000000003, "r": 498.92708999999996, "b": 119.93133999999998, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Ahmed Nassar, Nikolaos Livathinos, Maksym Lysak, Peter Staar", "bbox": {"l": 142.47701, "t": 146.68535999999995, "r": 452.75027, "b": 157.37334999999996, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "IBM Research", "bbox": {"l": 262.918, "t": 160.63239, "r": 332.30597, "b": 171.32037000000003, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "{", "bbox": {"l": 208.123, "t": 175.96123999999998, "r": 212.73083, "b": 184.42553999999996, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "ahn,nli,mly,taa", "bbox": {"l": 212.73, "t": 177.08203000000003, "r": 293.42761, "b": 184.00409000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "}", "bbox": {"l": 293.42798, "t": 175.96123999999998, "r": 298.0358, "b": 184.42553999999996, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "@zurich.ibm.com", "bbox": {"l": 298.03497, "t": 177.08203000000003, "r": 378.73257, "b": 184.00409000000002, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Abstract", "bbox": {"l": 145.99498, "t": 215.48297000000002, "r": 190.48029, "b": 226.23071000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Tables organize valuable content in a concise and com-", "bbox": {"l": 62.066978, "t": 241.39508, "r": 286.36493, "b": 249.98284999999998, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "pact representation. This content is extremely valuable for", "bbox": {"l": 50.111977, "t": 253.3501, "r": 286.36508, "b": 261.93787, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "systems such as search engines, Knowledge Graph\u2019s, etc,", "bbox": {"l": 50.111977, "t": 265.30511, "r": 286.36508, "b": 273.89288, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "since they enhance their predictive capabilities. Unfortu-", "bbox": {"l": 50.111977, "t": 277.26111000000003, "r": 286.36505, "b": 285.84888, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "nately, tables come in a large variety of shapes and sizes.", "bbox": {"l": 50.111977, "t": 289.21609, "r": 286.36505, "b": 297.80386, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Furthermore, they can have complex column/row-header", "bbox": {"l": 50.111977, "t": 301.17108, "r": 286.36505, "b": 309.75884999999994, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "configurations, multiline rows, different variety of separa-", "bbox": {"l": 50.111977, "t": 313.12607, "r": 286.36508, "b": 321.71384, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "tion lines, missing entries, etc. As such, the correct iden-", "bbox": {"l": 50.111977, "t": 325.08105, "r": 286.36508, "b": 333.66882, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "tification of the table-structure from an image is a non-", "bbox": {"l": 50.111977, "t": 337.03604, "r": 286.36505, "b": 345.62381, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "trivial task. In this paper, we present a new table-structure", "bbox": {"l": 50.111977, "t": 348.99203, "r": 286.36508, "b": 357.5798, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "identification model. The latter improves the latest end-to-", "bbox": {"l": 50.111977, "t": 360.94701999999995, "r": 286.36505, "b": 369.53479, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "end deep learning model (i.e. encoder-dual-decoder from", "bbox": {"l": 50.111977, "t": 372.90201, "r": 286.36508, "b": 381.48978, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "PubTabNet) in two significant ways. First, we introduce a", "bbox": {"l": 50.111977, "t": 384.85699, "r": 286.36505, "b": 393.44476, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "new object detection decoder for table-cells. In this way,", "bbox": {"l": 50.111977, "t": 396.81198, "r": 286.36511, "b": 405.39975000000004, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "we can obtain the content of the table-cells from program-", "bbox": {"l": 50.111977, "t": 408.76697, "r": 286.36508, "b": 417.35474, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "matic PDF\u2019s directly from the PDF source and avoid the", "bbox": {"l": 50.111977, "t": 420.72296000000006, "r": 286.36505, "b": 429.31073, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "training of the custom OCR decoders.", "bbox": {"l": 50.111977, "t": 432.67795, "r": 207.23216, "b": 441.26572, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "This architectural", "bbox": {"l": 214.09639, "t": 432.67795, "r": 286.36508, "b": 441.26572, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "change leads to more accurate table-content extraction and", "bbox": {"l": 50.111977, "t": 444.63293, "r": 286.36508, "b": 453.2207, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "allows us to tackle non-english tables. Second, we replace", "bbox": {"l": 50.111977, "t": 456.58792000000005, "r": 286.36505, "b": 465.17569, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "the LSTM decoders with transformer based decoders. This", "bbox": {"l": 50.111977, "t": 468.54291, "r": 286.36505, "b": 477.13068, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "upgrade improves significantly the previous state-of-the-art", "bbox": {"l": 50.111977, "t": 480.4989, "r": 286.36508, "b": 489.08667, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "tree-editing-distance-score (TEDS) from 91% to 98.5% on", "bbox": {"l": 50.111977, "t": 492.45389, "r": 286.36505, "b": 501.04166, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "simple tables and from 88.7% to 95% on complex tables.", "bbox": {"l": 50.111977, "t": 504.40887, "r": 276.65152, "b": 512.9966400000001, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "1.", "bbox": {"l": 50.111977, "t": 539.94276, "r": 58.121296, "b": 550.69049, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "Introduction", "bbox": {"l": 68.800385, "t": 539.94276, "r": 126.94804, "b": 550.69049, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "The occurrence of tables in documents is ubiquitous.", "bbox": {"l": 62.066978, "t": 560.7832, "r": 286.36496, "b": 569.68976, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "They often summarise quantitative or factual data, which is", "bbox": {"l": 50.111977, "t": 572.7382, "r": 286.36508, "b": 581.64476, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "cumbersome to describe in verbose text but nevertheless ex-", "bbox": {"l": 50.111977, "t": 584.69321, "r": 286.36505, "b": 593.5997600000001, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "tremely valuable. Unfortunately, this compact representa-", "bbox": {"l": 50.111977, "t": 596.6492000000001, "r": 286.36505, "b": 605.55576, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "tion is often not easy to parse by machines. There are many", "bbox": {"l": 50.111977, "t": 608.6042, "r": 286.36505, "b": 617.51076, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "implicit conventions used to obtain a compact table repre-", "bbox": {"l": 50.111977, "t": 620.5592, "r": 286.36505, "b": 629.46576, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "sentation. For example, tables often have complex column-", "bbox": {"l": 50.111977, "t": 632.51421, "r": 286.36508, "b": 641.42076, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "and row-headers in order to reduce duplicated cell content.", "bbox": {"l": 50.111977, "t": 644.46921, "r": 286.36508, "b": 653.37576, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "Lines of different shapes and sizes are leveraged to separate", "bbox": {"l": 50.111977, "t": 656.42421, "r": 286.36502, "b": 665.33077, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "content or indicate a tree structure. Additionally, tables can", "bbox": {"l": 50.111977, "t": 668.3802000000001, "r": 286.36505, "b": 677.28677, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "also have empty/missing table-entries or multi-row textual", "bbox": {"l": 50.111977, "t": 680.33521, "r": 286.36505, "b": 689.2417800000001, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "table-entries. Fig. 1 shows a table which presents all these", "bbox": {"l": 50.111977, "t": 692.290207, "r": 286.36505, "b": 701.196777, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "issues.", "bbox": {"l": 50.111977, "t": 704.245209, "r": 76.403275, "b": 713.151779, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "a.", "bbox": {"l": 315.56702, "t": 218.00684, "r": 324.01007, "b": 226.75482, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Picture of a table:", "bbox": {"l": 328.2316, "t": 218.00684, "r": 408.4407, "b": 226.75482, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "b.", "bbox": {"l": 315.56702, "t": 313.69478999999995, "r": 325.05786, "b": 322.44281, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Red-annotation of bounding boxes,", "bbox": {"l": 329.80325, "t": 313.69478999999995, "r": 486.40194999999994, "b": 322.44281, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Blue-predictions by TableFormer", "bbox": {"l": 326.46252, "t": 324.49478, "r": 472.47411999999997, "b": 333.2428, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "c.", "bbox": {"l": 315.56702, "t": 420.1828, "r": 324.81039, "b": 428.93082, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Structure predicted by TableFormer:", "bbox": {"l": 329.4321, "t": 420.1828, "r": 491.1912500000001, "b": 428.93082, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "1", "bbox": {"l": 408.14752, "t": 342.82828, "r": 412.54001, "b": 351.61322, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "0", "bbox": {"l": 356.11011, "t": 341.57217, "r": 360.50259, "b": 350.35712, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "2", "bbox": {"l": 500.6777, "t": 340.93768, "r": 505.0701900000001, "b": 349.7226299999999, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "3", "bbox": {"l": 356.13382, "t": 351.74789, "r": 360.52631, "b": 360.53284, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "4", "bbox": {"l": 402.53992, "t": 355.8765, "r": 406.9324, "b": 364.66144, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "5", "bbox": {"l": 448.58178999999996, "t": 352.84018, "r": 452.97427, "b": 361.62512, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "6", "bbox": {"l": 491.65161000000006, "t": 353.70657, "r": 496.0441, "b": 362.49152, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "7", "bbox": {"l": 535.13843, "t": 353.33969, "r": 539.53088, "b": 362.12463, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "8", "bbox": {"l": 348.82822, "t": 387.09781, "r": 353.2207, "b": 395.88275, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "9", "bbox": {"l": 389.27151, "t": 375.37228, "r": 393.664, "b": 384.15723, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "10", "bbox": {"l": 442.67479999999995, "t": 375.64621, "r": 451.45889000000005, "b": 384.43115, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "11", "bbox": {"l": 477.4382299999999, "t": 375.534, "r": 485.90167, "b": 384.31894000000005, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "12", "bbox": {"l": 522.57263, "t": 375.64621, "r": 531.35669, "b": 384.43115, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "13", "bbox": {"l": 400.22992, "t": 387.11429, "r": 409.01401, "b": 395.89923, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "14", "bbox": {"l": 442.30792, "t": 386.98981000000003, "r": 451.0920100000001, "b": 395.77475000000004, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "15", "bbox": {"l": 478.21941999999996, "t": 387.37469, "r": 487.00351000000006, "b": 396.15964, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "16", "bbox": {"l": 523.2287, "t": 386.98981000000003, "r": 532.01276, "b": 395.77475000000004, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "1", "bbox": {"l": 411.57233, "t": 399.42477, "r": 415.96481, "b": 408.20972, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "7", "bbox": {"l": 415.96393, "t": 399.42477, "r": 420.35641, "b": 408.20972, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "18", "bbox": {"l": 442.30521, "t": 399.0371999999999, "r": 451.08929, "b": 407.82213999999993, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "19", "bbox": {"l": 478.77893, "t": 398.99639999999994, "r": 487.56302, "b": 407.78133999999994, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "20", "bbox": {"l": 523.97241, "t": 398.6114799999999, "r": 532.75647, "b": 407.39642, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "1", "bbox": {"l": 347.24872, "t": 437.68588, "r": 351.6412, "b": 446.47083, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "0", "bbox": {"l": 318.88071, "t": 437.68588, "r": 323.27319, "b": 446.47083, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "2", "bbox": {"l": 394.10422, "t": 437.68588, "r": 398.4967, "b": 446.47083, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "3", "bbox": {"l": 318.77316, "t": 449.5455, "r": 323.16565, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "4", "bbox": {"l": 347.24872, "t": 449.5455, "r": 351.6412, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "5", "bbox": {"l": 394.10422, "t": 449.5455, "r": 398.4967, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "6", "bbox": {"l": 440.95941000000005, "t": 449.5455, "r": 445.3519, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "7", "bbox": {"l": 487.81491, "t": 449.5455, "r": 492.2074, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "8", "bbox": {"l": 318.77316, "t": 473.70425, "r": 323.16565, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "9", "bbox": {"l": 347.24872, "t": 461.8446, "r": 351.6412, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "10", "bbox": {"l": 394.10422, "t": 461.8446, "r": 402.88831, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "11", "bbox": {"l": 440.95941000000005, "t": 461.8446, "r": 449.42285, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "12", "bbox": {"l": 487.81491, "t": 461.8446, "r": 496.599, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "13", "bbox": {"l": 347.24872, "t": 473.70425, "r": 356.03281, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "14", "bbox": {"l": 394.10422, "t": 473.70425, "r": 402.88831, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "15", "bbox": {"l": 440.95941000000005, "t": 473.70425, "r": 449.7435, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "16", "bbox": {"l": 487.81491, "t": 473.70425, "r": 496.599, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "17", "bbox": {"l": 347.24872, "t": 485.12469, "r": 356.03281, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "18", "bbox": {"l": 394.10422, "t": 485.12469, "r": 402.88831, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "19", "bbox": {"l": 440.95941000000005, "t": 485.12469, "r": 449.7435, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "20", "bbox": {"l": 487.81491, "t": 485.12469, "r": 496.599, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "1", "bbox": {"l": 451.9457100000001, "t": 235.34704999999997, "r": 457.95050000000003, "b": 245.47748, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "3", "bbox": {"l": 385.09399, "t": 357.76030999999995, "r": 391.09879, "b": 367.89072, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "3", "bbox": {"l": 366.70102, "t": 449.12082, "r": 372.70581, "b": 459.25122, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "2", "bbox": {"l": 331.19681, "t": 269.35266, "r": 337.2016, "b": 279.48308999999995, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "2", "bbox": {"l": 333.43451, "t": 380.7265, "r": 339.4393, "b": 390.85689999999994, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "2", "bbox": {"l": 331.90424, "t": 473.32291, "r": 337.90903, "b": 483.45331, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "1", "bbox": {"l": 478.07210999999995, "t": 341.0368000000001, "r": 484.0769, "b": 351.16720999999995, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "1", "bbox": {"l": 459.87621999999993, "t": 437.5936, "r": 465.88101, "b": 447.724, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "3", "bbox": {"l": 384.0329, "t": 252.67895999999996, "r": 390.03769, "b": 262.80939, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "Figure 1:", "bbox": {"l": 308.862, "t": 514.50037, "r": 345.73361, "b": 523.40692, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "Picture of a table with subtle, complex features", "bbox": {"l": 353.17566, "t": 514.50037, "r": 545.11511, "b": 523.40692, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "such as (1) multi-column headers, (2) cell with multi-row", "bbox": {"l": 308.862, "t": 526.45535, "r": 545.11511, "b": 535.3619100000001, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "text and (3) cells with no content. Image from PubTabNet", "bbox": {"l": 308.862, "t": 538.41035, "r": 545.11517, "b": 547.31691, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "evaluation set, filename: \u2018PMC2944238 004 02\u2019.", "bbox": {"l": 308.862, "t": 550.36635, "r": 505.6917700000001, "b": 559.2729, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "Recently, significant progress has been made with vi-", "bbox": {"l": 320.81699, "t": 584.40936, "r": 545.11493, "b": 593.31592, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "sion based approaches to extract tables in documents. For", "bbox": {"l": 308.862, "t": 596.36436, "r": 545.11517, "b": 605.2709199999999, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "the sake of completeness, the issue of table extraction from", "bbox": {"l": 308.862, "t": 608.31937, "r": 545.11511, "b": 617.22592, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "documents is typically decomposed into two separate chal-", "bbox": {"l": 308.862, "t": 620.27437, "r": 545.11505, "b": 629.18092, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "lenges, i.e.", "bbox": {"l": 308.862, "t": 632.23036, "r": 353.6937, "b": 641.13692, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "(1)", "bbox": {"l": 362.11209, "t": 632.23036, "r": 374.66617, "b": 641.13692, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "finding the location of the table(s) on a", "bbox": {"l": 377.35785, "t": 632.23036, "r": 545.11505, "b": 641.13692, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "document-page and (2) finding the structure of a given table", "bbox": {"l": 308.862, "t": 644.18536, "r": 545.11517, "b": 653.09192, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "in the document.", "bbox": {"l": 308.862, "t": 656.14037, "r": 375.55167, "b": 665.04693, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "The first problem is called table-location and has been", "bbox": {"l": 320.81699, "t": 668.38036, "r": 545.11493, "b": 677.28693, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "previously addressed [30, 38, 19, 21, 23, 26, 8] with state-", "bbox": {"l": 308.862, "t": 680.33536, "r": 545.11511, "b": 689.24193, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "of-the-art object-detection networks (e.g. YOLO and later", "bbox": {"l": 308.862, "t": 692.290359, "r": 545.11511, "b": 701.19693, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "on Mask-RCNN [9]). For all practical purposes, it can be", "bbox": {"l": 308.862, "t": 704.245361, "r": 545.11499, "b": 713.151932, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "1", "bbox": {"l": 295.121, "t": 734.133366, "r": 300.10229, "b": 743.039928, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "arXiv:2203.01017v2 [cs.CV] 11 Mar 2022", "bbox": {"l": 18.340221, "t": 207.82001000000002, "r": 36.339779, "b": 560.00003, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 8, "label": "section_header", "bbox": {"l": 96.301003, "t": 107.03412000000003, "r": 498.92708999999996, "b": 119.93133999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.8868067860603333, "cells": [{"id": 0, "text": "TableFormer: Table Structure Understanding with Transformers.", "bbox": {"l": 96.301003, "t": 107.03412000000003, "r": 498.92708999999996, "b": 119.93133999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "section_header", "bbox": {"l": 142.47701, "t": 146.68535999999995, "r": 452.75027, "b": 171.32037000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.7586215734481812, "cells": [{"id": 1, "text": "Ahmed Nassar, Nikolaos Livathinos, Maksym Lysak, Peter Staar", "bbox": {"l": 142.47701, "t": 146.68535999999995, "r": 452.75027, "b": 157.37334999999996, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "IBM Research", "bbox": {"l": 262.918, "t": 160.63239, "r": 332.30597, "b": 171.32037000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "key_value_region", "bbox": {"l": 208.123, "t": 175.96123999999998, "r": 378.73257, "b": 184.42553999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.4854728579521179, "cells": [{"id": 3, "text": "{", "bbox": {"l": 208.123, "t": 175.96123999999998, "r": 212.73083, "b": 184.42553999999996, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "ahn,nli,mly,taa", "bbox": {"l": 212.73, "t": 177.08203000000003, "r": 293.42761, "b": 184.00409000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "}", "bbox": {"l": 293.42798, "t": 175.96123999999998, "r": 298.0358, "b": 184.42553999999996, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "@zurich.ibm.com", "bbox": {"l": 298.03497, "t": 177.08203000000003, "r": 378.73257, "b": 184.00409000000002, "coord_origin": "TOPLEFT"}}], "children": [{"id": 7, "label": "text", "bbox": {"l": 208.123, "t": 175.96123999999998, "r": 378.73257, "b": 184.42553999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9096331596374512, "cells": [{"id": 3, "text": "{", "bbox": {"l": 208.123, "t": 175.96123999999998, "r": 212.73083, "b": 184.42553999999996, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "ahn,nli,mly,taa", "bbox": {"l": 212.73, "t": 177.08203000000003, "r": 293.42761, "b": 184.00409000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "}", "bbox": {"l": 293.42798, "t": 175.96123999999998, "r": 298.0358, "b": 184.42553999999996, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "@zurich.ibm.com", "bbox": {"l": 298.03497, "t": 177.08203000000003, "r": 378.73257, "b": 184.00409000000002, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 5, "label": "section_header", "bbox": {"l": 145.99498, "t": 215.48297000000002, "r": 190.48029, "b": 226.23071000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9258671402931213, "cells": [{"id": 7, "text": "Abstract", "bbox": {"l": 145.99498, "t": 215.48297000000002, "r": 190.48029, "b": 226.23071000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 50.111977, "t": 241.39508, "r": 286.36511, "b": 512.9966400000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9838882088661194, "cells": [{"id": 8, "text": "Tables organize valuable content in a concise and com-", "bbox": {"l": 62.066978, "t": 241.39508, "r": 286.36493, "b": 249.98284999999998, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "pact representation. This content is extremely valuable for", "bbox": {"l": 50.111977, "t": 253.3501, "r": 286.36508, "b": 261.93787, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "systems such as search engines, Knowledge Graph\u2019s, etc,", "bbox": {"l": 50.111977, "t": 265.30511, "r": 286.36508, "b": 273.89288, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "since they enhance their predictive capabilities. Unfortu-", "bbox": {"l": 50.111977, "t": 277.26111000000003, "r": 286.36505, "b": 285.84888, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "nately, tables come in a large variety of shapes and sizes.", "bbox": {"l": 50.111977, "t": 289.21609, "r": 286.36505, "b": 297.80386, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Furthermore, they can have complex column/row-header", "bbox": {"l": 50.111977, "t": 301.17108, "r": 286.36505, "b": 309.75884999999994, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "configurations, multiline rows, different variety of separa-", "bbox": {"l": 50.111977, "t": 313.12607, "r": 286.36508, "b": 321.71384, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "tion lines, missing entries, etc. As such, the correct iden-", "bbox": {"l": 50.111977, "t": 325.08105, "r": 286.36508, "b": 333.66882, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "tification of the table-structure from an image is a non-", "bbox": {"l": 50.111977, "t": 337.03604, "r": 286.36505, "b": 345.62381, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "trivial task. In this paper, we present a new table-structure", "bbox": {"l": 50.111977, "t": 348.99203, "r": 286.36508, "b": 357.5798, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "identification model. The latter improves the latest end-to-", "bbox": {"l": 50.111977, "t": 360.94701999999995, "r": 286.36505, "b": 369.53479, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "end deep learning model (i.e. encoder-dual-decoder from", "bbox": {"l": 50.111977, "t": 372.90201, "r": 286.36508, "b": 381.48978, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "PubTabNet) in two significant ways. First, we introduce a", "bbox": {"l": 50.111977, "t": 384.85699, "r": 286.36505, "b": 393.44476, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "new object detection decoder for table-cells. In this way,", "bbox": {"l": 50.111977, "t": 396.81198, "r": 286.36511, "b": 405.39975000000004, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "we can obtain the content of the table-cells from program-", "bbox": {"l": 50.111977, "t": 408.76697, "r": 286.36508, "b": 417.35474, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "matic PDF\u2019s directly from the PDF source and avoid the", "bbox": {"l": 50.111977, "t": 420.72296000000006, "r": 286.36505, "b": 429.31073, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "training of the custom OCR decoders.", "bbox": {"l": 50.111977, "t": 432.67795, "r": 207.23216, "b": 441.26572, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "This architectural", "bbox": {"l": 214.09639, "t": 432.67795, "r": 286.36508, "b": 441.26572, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "change leads to more accurate table-content extraction and", "bbox": {"l": 50.111977, "t": 444.63293, "r": 286.36508, "b": 453.2207, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "allows us to tackle non-english tables. Second, we replace", "bbox": {"l": 50.111977, "t": 456.58792000000005, "r": 286.36505, "b": 465.17569, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "the LSTM decoders with transformer based decoders. This", "bbox": {"l": 50.111977, "t": 468.54291, "r": 286.36505, "b": 477.13068, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "upgrade improves significantly the previous state-of-the-art", "bbox": {"l": 50.111977, "t": 480.4989, "r": 286.36508, "b": 489.08667, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "tree-editing-distance-score (TEDS) from 91% to 98.5% on", "bbox": {"l": 50.111977, "t": 492.45389, "r": 286.36505, "b": 501.04166, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "simple tables and from 88.7% to 95% on complex tables.", "bbox": {"l": 50.111977, "t": 504.40887, "r": 276.65152, "b": 512.9966400000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "section_header", "bbox": {"l": 50.111977, "t": 539.94276, "r": 126.94804, "b": 550.69049, "coord_origin": "TOPLEFT"}, "confidence": 0.9317677617073059, "cells": [{"id": 32, "text": "1.", "bbox": {"l": 50.111977, "t": 539.94276, "r": 58.121296, "b": 550.69049, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "Introduction", "bbox": {"l": 68.800385, "t": 539.94276, "r": 126.94804, "b": 550.69049, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 50.111977, "t": 560.7832, "r": 286.36508, "b": 713.151779, "coord_origin": "TOPLEFT"}, "confidence": 0.9841895699501038, "cells": [{"id": 34, "text": "The occurrence of tables in documents is ubiquitous.", "bbox": {"l": 62.066978, "t": 560.7832, "r": 286.36496, "b": 569.68976, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "They often summarise quantitative or factual data, which is", "bbox": {"l": 50.111977, "t": 572.7382, "r": 286.36508, "b": 581.64476, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "cumbersome to describe in verbose text but nevertheless ex-", "bbox": {"l": 50.111977, "t": 584.69321, "r": 286.36505, "b": 593.5997600000001, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "tremely valuable. Unfortunately, this compact representa-", "bbox": {"l": 50.111977, "t": 596.6492000000001, "r": 286.36505, "b": 605.55576, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "tion is often not easy to parse by machines. There are many", "bbox": {"l": 50.111977, "t": 608.6042, "r": 286.36505, "b": 617.51076, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "implicit conventions used to obtain a compact table repre-", "bbox": {"l": 50.111977, "t": 620.5592, "r": 286.36505, "b": 629.46576, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "sentation. For example, tables often have complex column-", "bbox": {"l": 50.111977, "t": 632.51421, "r": 286.36508, "b": 641.42076, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "and row-headers in order to reduce duplicated cell content.", "bbox": {"l": 50.111977, "t": 644.46921, "r": 286.36508, "b": 653.37576, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "Lines of different shapes and sizes are leveraged to separate", "bbox": {"l": 50.111977, "t": 656.42421, "r": 286.36502, "b": 665.33077, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "content or indicate a tree structure. Additionally, tables can", "bbox": {"l": 50.111977, "t": 668.3802000000001, "r": 286.36505, "b": 677.28677, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "also have empty/missing table-entries or multi-row textual", "bbox": {"l": 50.111977, "t": 680.33521, "r": 286.36505, "b": 689.2417800000001, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "table-entries. Fig. 1 shows a table which presents all these", "bbox": {"l": 50.111977, "t": 692.290207, "r": 286.36505, "b": 701.196777, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "issues.", "bbox": {"l": 50.111977, "t": 704.245209, "r": 76.403275, "b": 713.151779, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "section_header", "bbox": {"l": 315.56702, "t": 218.00684, "r": 408.4407, "b": 226.75482, "coord_origin": "TOPLEFT"}, "confidence": 0.6724023818969727, "cells": [{"id": 47, "text": "a.", "bbox": {"l": 315.56702, "t": 218.00684, "r": 324.01007, "b": 226.75482, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Picture of a table:", "bbox": {"l": 328.2316, "t": 218.00684, "r": 408.4407, "b": 226.75482, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "list_item", "bbox": {"l": 315.56702, "t": 313.69478999999995, "r": 486.40194999999994, "b": 333.2428, "coord_origin": "TOPLEFT"}, "confidence": 0.5549328923225403, "cells": [{"id": 49, "text": "b.", "bbox": {"l": 315.56702, "t": 313.69478999999995, "r": 325.05786, "b": 322.44281, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Red-annotation of bounding boxes,", "bbox": {"l": 329.80325, "t": 313.69478999999995, "r": 486.40194999999994, "b": 322.44281, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Blue-predictions by TableFormer", "bbox": {"l": 326.46252, "t": 324.49478, "r": 472.47411999999997, "b": 333.2428, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "list_item", "bbox": {"l": 315.56702, "t": 420.1828, "r": 491.1912500000001, "b": 428.93082, "coord_origin": "TOPLEFT"}, "confidence": 0.5501358509063721, "cells": [{"id": 52, "text": "c.", "bbox": {"l": 315.56702, "t": 420.1828, "r": 324.81039, "b": 428.93082, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Structure predicted by TableFormer:", "bbox": {"l": 329.4321, "t": 420.1828, "r": 491.1912500000001, "b": 428.93082, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "picture", "bbox": {"l": 314.78173828125, "t": 338.0652770996094, "r": 539.1802978515625, "b": 410.0494384765625, "coord_origin": "TOPLEFT"}, "confidence": 0.8742761611938477, "cells": [{"id": 54, "text": "1", "bbox": {"l": 408.14752, "t": 342.82828, "r": 412.54001, "b": 351.61322, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "0", "bbox": {"l": 356.11011, "t": 341.57217, "r": 360.50259, "b": 350.35712, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "2", "bbox": {"l": 500.6777, "t": 340.93768, "r": 505.0701900000001, "b": 349.7226299999999, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "3", "bbox": {"l": 356.13382, "t": 351.74789, "r": 360.52631, "b": 360.53284, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "4", "bbox": {"l": 402.53992, "t": 355.8765, "r": 406.9324, "b": 364.66144, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "5", "bbox": {"l": 448.58178999999996, "t": 352.84018, "r": 452.97427, "b": 361.62512, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "6", "bbox": {"l": 491.65161000000006, "t": 353.70657, "r": 496.0441, "b": 362.49152, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "7", "bbox": {"l": 535.13843, "t": 353.33969, "r": 539.53088, "b": 362.12463, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "8", "bbox": {"l": 348.82822, "t": 387.09781, "r": 353.2207, "b": 395.88275, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "9", "bbox": {"l": 389.27151, "t": 375.37228, "r": 393.664, "b": 384.15723, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "10", "bbox": {"l": 442.67479999999995, "t": 375.64621, "r": 451.45889000000005, "b": 384.43115, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "11", "bbox": {"l": 477.4382299999999, "t": 375.534, "r": 485.90167, "b": 384.31894000000005, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "12", "bbox": {"l": 522.57263, "t": 375.64621, "r": 531.35669, "b": 384.43115, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "13", "bbox": {"l": 400.22992, "t": 387.11429, "r": 409.01401, "b": 395.89923, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "14", "bbox": {"l": 442.30792, "t": 386.98981000000003, "r": 451.0920100000001, "b": 395.77475000000004, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "15", "bbox": {"l": 478.21941999999996, "t": 387.37469, "r": 487.00351000000006, "b": 396.15964, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "16", "bbox": {"l": 523.2287, "t": 386.98981000000003, "r": 532.01276, "b": 395.77475000000004, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "1", "bbox": {"l": 411.57233, "t": 399.42477, "r": 415.96481, "b": 408.20972, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "7", "bbox": {"l": 415.96393, "t": 399.42477, "r": 420.35641, "b": 408.20972, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "18", "bbox": {"l": 442.30521, "t": 399.0371999999999, "r": 451.08929, "b": 407.82213999999993, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "19", "bbox": {"l": 478.77893, "t": 398.99639999999994, "r": 487.56302, "b": 407.78133999999994, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "20", "bbox": {"l": 523.97241, "t": 398.6114799999999, "r": 532.75647, "b": 407.39642, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "3", "bbox": {"l": 385.09399, "t": 357.76030999999995, "r": 391.09879, "b": 367.89072, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "2", "bbox": {"l": 333.43451, "t": 380.7265, "r": 339.4393, "b": 390.85689999999994, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "1", "bbox": {"l": 478.07210999999995, "t": 341.0368000000001, "r": 484.0769, "b": 351.16720999999995, "coord_origin": "TOPLEFT"}}], "children": [{"id": 19, "label": "text", "bbox": {"l": 408.14752, "t": 342.82828, "r": 412.54001, "b": 351.61322, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "1", "bbox": {"l": 408.14752, "t": 342.82828, "r": 412.54001, "b": 351.61322, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 356.11011, "t": 341.57217, "r": 360.50259, "b": 350.35712, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "0", "bbox": {"l": 356.11011, "t": 341.57217, "r": 360.50259, "b": 350.35712, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 500.6777, "t": 340.93768, "r": 505.0701900000001, "b": 349.7226299999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "2", "bbox": {"l": 500.6777, "t": 340.93768, "r": 505.0701900000001, "b": 349.7226299999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 356.13382, "t": 351.74789, "r": 360.52631, "b": 360.53284, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "3", "bbox": {"l": 356.13382, "t": 351.74789, "r": 360.52631, "b": 360.53284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 402.53992, "t": 355.8765, "r": 406.9324, "b": 364.66144, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "4", "bbox": {"l": 402.53992, "t": 355.8765, "r": 406.9324, "b": 364.66144, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 448.58178999999996, "t": 352.84018, "r": 452.97427, "b": 361.62512, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "5", "bbox": {"l": 448.58178999999996, "t": 352.84018, "r": 452.97427, "b": 361.62512, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 491.65161000000006, "t": 353.70657, "r": 496.0441, "b": 362.49152, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "6", "bbox": {"l": 491.65161000000006, "t": 353.70657, "r": 496.0441, "b": 362.49152, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 535.13843, "t": 353.33969, "r": 539.53088, "b": 362.12463, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "7", "bbox": {"l": 535.13843, "t": 353.33969, "r": 539.53088, "b": 362.12463, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 348.82822, "t": 387.09781, "r": 353.2207, "b": 395.88275, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "8", "bbox": {"l": 348.82822, "t": 387.09781, "r": 353.2207, "b": 395.88275, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 389.27151, "t": 375.37228, "r": 393.664, "b": 384.15723, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "9", "bbox": {"l": 389.27151, "t": 375.37228, "r": 393.664, "b": 384.15723, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 442.67479999999995, "t": 375.64621, "r": 451.45889000000005, "b": 384.43115, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "10", "bbox": {"l": 442.67479999999995, "t": 375.64621, "r": 451.45889000000005, "b": 384.43115, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 477.4382299999999, "t": 375.534, "r": 485.90167, "b": 384.31894000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "11", "bbox": {"l": 477.4382299999999, "t": 375.534, "r": 485.90167, "b": 384.31894000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 522.57263, "t": 375.64621, "r": 531.35669, "b": 384.43115, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "12", "bbox": {"l": 522.57263, "t": 375.64621, "r": 531.35669, "b": 384.43115, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 400.22992, "t": 387.11429, "r": 409.01401, "b": 395.89923, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "13", "bbox": {"l": 400.22992, "t": 387.11429, "r": 409.01401, "b": 395.89923, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 442.30792, "t": 386.98981000000003, "r": 451.0920100000001, "b": 395.77475000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "14", "bbox": {"l": 442.30792, "t": 386.98981000000003, "r": 451.0920100000001, "b": 395.77475000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 478.21941999999996, "t": 387.37469, "r": 487.00351000000006, "b": 396.15964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "15", "bbox": {"l": 478.21941999999996, "t": 387.37469, "r": 487.00351000000006, "b": 396.15964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 523.2287, "t": 386.98981000000003, "r": 532.01276, "b": 395.77475000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "16", "bbox": {"l": 523.2287, "t": 386.98981000000003, "r": 532.01276, "b": 395.77475000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 411.57233, "t": 399.42477, "r": 415.96481, "b": 408.20972, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "1", "bbox": {"l": 411.57233, "t": 399.42477, "r": 415.96481, "b": 408.20972, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 415.96393, "t": 399.42477, "r": 420.35641, "b": 408.20972, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "7", "bbox": {"l": 415.96393, "t": 399.42477, "r": 420.35641, "b": 408.20972, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 442.30521, "t": 399.0371999999999, "r": 451.08929, "b": 407.82213999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "18", "bbox": {"l": 442.30521, "t": 399.0371999999999, "r": 451.08929, "b": 407.82213999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 478.77893, "t": 398.99639999999994, "r": 487.56302, "b": 407.78133999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "19", "bbox": {"l": 478.77893, "t": 398.99639999999994, "r": 487.56302, "b": 407.78133999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 523.97241, "t": 398.6114799999999, "r": 532.75647, "b": 407.39642, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "20", "bbox": {"l": 523.97241, "t": 398.6114799999999, "r": 532.75647, "b": 407.39642, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 385.09399, "t": 357.76030999999995, "r": 391.09879, "b": 367.89072, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "3", "bbox": {"l": 385.09399, "t": 357.76030999999995, "r": 391.09879, "b": 367.89072, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 333.43451, "t": 380.7265, "r": 339.4393, "b": 390.85689999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "2", "bbox": {"l": 333.43451, "t": 380.7265, "r": 339.4393, "b": 390.85689999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 478.07210999999995, "t": 341.0368000000001, "r": 484.0769, "b": 351.16720999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": "1", "bbox": {"l": 478.07210999999995, "t": 341.0368000000001, "r": 484.0769, "b": 351.16720999999995, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 23, "label": "picture", "bbox": {"l": 315.7172546386719, "t": 433.823486328125, "r": 536.835693359375, "b": 496.0290222167969, "coord_origin": "TOPLEFT"}, "confidence": 0.5088632702827454, "cells": [{"id": 76, "text": "1", "bbox": {"l": 347.24872, "t": 437.68588, "r": 351.6412, "b": 446.47083, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "0", "bbox": {"l": 318.88071, "t": 437.68588, "r": 323.27319, "b": 446.47083, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "2", "bbox": {"l": 394.10422, "t": 437.68588, "r": 398.4967, "b": 446.47083, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "3", "bbox": {"l": 318.77316, "t": 449.5455, "r": 323.16565, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "4", "bbox": {"l": 347.24872, "t": 449.5455, "r": 351.6412, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "5", "bbox": {"l": 394.10422, "t": 449.5455, "r": 398.4967, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "6", "bbox": {"l": 440.95941000000005, "t": 449.5455, "r": 445.3519, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "7", "bbox": {"l": 487.81491, "t": 449.5455, "r": 492.2074, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "8", "bbox": {"l": 318.77316, "t": 473.70425, "r": 323.16565, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "9", "bbox": {"l": 347.24872, "t": 461.8446, "r": 351.6412, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "10", "bbox": {"l": 394.10422, "t": 461.8446, "r": 402.88831, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "11", "bbox": {"l": 440.95941000000005, "t": 461.8446, "r": 449.42285, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "12", "bbox": {"l": 487.81491, "t": 461.8446, "r": 496.599, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "13", "bbox": {"l": 347.24872, "t": 473.70425, "r": 356.03281, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "14", "bbox": {"l": 394.10422, "t": 473.70425, "r": 402.88831, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "15", "bbox": {"l": 440.95941000000005, "t": 473.70425, "r": 449.7435, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "16", "bbox": {"l": 487.81491, "t": 473.70425, "r": 496.599, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "17", "bbox": {"l": 347.24872, "t": 485.12469, "r": 356.03281, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "18", "bbox": {"l": 394.10422, "t": 485.12469, "r": 402.88831, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "19", "bbox": {"l": 440.95941000000005, "t": 485.12469, "r": 449.7435, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "20", "bbox": {"l": 487.81491, "t": 485.12469, "r": 496.599, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "3", "bbox": {"l": 366.70102, "t": 449.12082, "r": 372.70581, "b": 459.25122, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "2", "bbox": {"l": 331.90424, "t": 473.32291, "r": 337.90903, "b": 483.45331, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "1", "bbox": {"l": 459.87621999999993, "t": 437.5936, "r": 465.88101, "b": 447.724, "coord_origin": "TOPLEFT"}}], "children": [{"id": 41, "label": "text", "bbox": {"l": 347.24872, "t": 437.68588, "r": 351.6412, "b": 446.47083, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "1", "bbox": {"l": 347.24872, "t": 437.68588, "r": 351.6412, "b": 446.47083, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 318.88071, "t": 437.68588, "r": 323.27319, "b": 446.47083, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "0", "bbox": {"l": 318.88071, "t": 437.68588, "r": 323.27319, "b": 446.47083, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 394.10422, "t": 437.68588, "r": 398.4967, "b": 446.47083, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "2", "bbox": {"l": 394.10422, "t": 437.68588, "r": 398.4967, "b": 446.47083, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 318.77316, "t": 449.5455, "r": 323.16565, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "3", "bbox": {"l": 318.77316, "t": 449.5455, "r": 323.16565, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 347.24872, "t": 449.5455, "r": 351.6412, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "4", "bbox": {"l": 347.24872, "t": 449.5455, "r": 351.6412, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 394.10422, "t": 449.5455, "r": 398.4967, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "5", "bbox": {"l": 394.10422, "t": 449.5455, "r": 398.4967, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 440.95941000000005, "t": 449.5455, "r": 445.3519, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "6", "bbox": {"l": 440.95941000000005, "t": 449.5455, "r": 445.3519, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 487.81491, "t": 449.5455, "r": 492.2074, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "7", "bbox": {"l": 487.81491, "t": 449.5455, "r": 492.2074, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 318.77316, "t": 473.70425, "r": 323.16565, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "8", "bbox": {"l": 318.77316, "t": 473.70425, "r": 323.16565, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 347.24872, "t": 461.8446, "r": 351.6412, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "9", "bbox": {"l": 347.24872, "t": 461.8446, "r": 351.6412, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 394.10422, "t": 461.8446, "r": 402.88831, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "10", "bbox": {"l": 394.10422, "t": 461.8446, "r": 402.88831, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 440.95941000000005, "t": 461.8446, "r": 449.42285, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "11", "bbox": {"l": 440.95941000000005, "t": 461.8446, "r": 449.42285, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 487.81491, "t": 461.8446, "r": 496.599, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "12", "bbox": {"l": 487.81491, "t": 461.8446, "r": 496.599, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 347.24872, "t": 473.70425, "r": 356.03281, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "13", "bbox": {"l": 347.24872, "t": 473.70425, "r": 356.03281, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 394.10422, "t": 473.70425, "r": 402.88831, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "14", "bbox": {"l": 394.10422, "t": 473.70425, "r": 402.88831, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 440.95941000000005, "t": 473.70425, "r": 449.7435, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "15", "bbox": {"l": 440.95941000000005, "t": 473.70425, "r": 449.7435, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 487.81491, "t": 473.70425, "r": 496.599, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "16", "bbox": {"l": 487.81491, "t": 473.70425, "r": 496.599, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 347.24872, "t": 485.12469, "r": 356.03281, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "17", "bbox": {"l": 347.24872, "t": 485.12469, "r": 356.03281, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 394.10422, "t": 485.12469, "r": 402.88831, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "18", "bbox": {"l": 394.10422, "t": 485.12469, "r": 402.88831, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 440.95941000000005, "t": 485.12469, "r": 449.7435, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "19", "bbox": {"l": 440.95941000000005, "t": 485.12469, "r": 449.7435, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 487.81491, "t": 485.12469, "r": 496.599, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "20", "bbox": {"l": 487.81491, "t": 485.12469, "r": 496.599, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 366.70102, "t": 449.12082, "r": 372.70581, "b": 459.25122, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "3", "bbox": {"l": 366.70102, "t": 449.12082, "r": 372.70581, "b": 459.25122, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 331.90424, "t": 473.32291, "r": 337.90903, "b": 483.45331, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "2", "bbox": {"l": 331.90424, "t": 473.32291, "r": 337.90903, "b": 483.45331, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 459.87621999999993, "t": 437.5936, "r": 465.88101, "b": 447.724, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "1", "bbox": {"l": 459.87621999999993, "t": 437.5936, "r": 465.88101, "b": 447.724, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 11, "label": "table", "bbox": {"l": 315.7172546386719, "t": 433.823486328125, "r": 536.835693359375, "b": 496.0290222167969, "coord_origin": "TOPLEFT"}, "confidence": 0.8056110739707947, "cells": [{"id": 76, "text": "1", "bbox": {"l": 347.24872, "t": 437.68588, "r": 351.6412, "b": 446.47083, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "0", "bbox": {"l": 318.88071, "t": 437.68588, "r": 323.27319, "b": 446.47083, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "2", "bbox": {"l": 394.10422, "t": 437.68588, "r": 398.4967, "b": 446.47083, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "3", "bbox": {"l": 318.77316, "t": 449.5455, "r": 323.16565, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "4", "bbox": {"l": 347.24872, "t": 449.5455, "r": 351.6412, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "5", "bbox": {"l": 394.10422, "t": 449.5455, "r": 398.4967, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "6", "bbox": {"l": 440.95941000000005, "t": 449.5455, "r": 445.3519, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "7", "bbox": {"l": 487.81491, "t": 449.5455, "r": 492.2074, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "8", "bbox": {"l": 318.77316, "t": 473.70425, "r": 323.16565, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "9", "bbox": {"l": 347.24872, "t": 461.8446, "r": 351.6412, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "10", "bbox": {"l": 394.10422, "t": 461.8446, "r": 402.88831, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "11", "bbox": {"l": 440.95941000000005, "t": 461.8446, "r": 449.42285, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "12", "bbox": {"l": 487.81491, "t": 461.8446, "r": 496.599, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "13", "bbox": {"l": 347.24872, "t": 473.70425, "r": 356.03281, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "14", "bbox": {"l": 394.10422, "t": 473.70425, "r": 402.88831, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "15", "bbox": {"l": 440.95941000000005, "t": 473.70425, "r": 449.7435, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "16", "bbox": {"l": 487.81491, "t": 473.70425, "r": 496.599, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "17", "bbox": {"l": 347.24872, "t": 485.12469, "r": 356.03281, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "18", "bbox": {"l": 394.10422, "t": 485.12469, "r": 402.88831, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "19", "bbox": {"l": 440.95941000000005, "t": 485.12469, "r": 449.7435, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "20", "bbox": {"l": 487.81491, "t": 485.12469, "r": 496.599, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "3", "bbox": {"l": 366.70102, "t": 449.12082, "r": 372.70581, "b": 459.25122, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "2", "bbox": {"l": 331.90424, "t": 473.32291, "r": 337.90903, "b": 483.45331, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "1", "bbox": {"l": 459.87621999999993, "t": 437.5936, "r": 465.88101, "b": 447.724, "coord_origin": "TOPLEFT"}}], "children": [{"id": 41, "label": "text", "bbox": {"l": 347.24872, "t": 437.68588, "r": 351.6412, "b": 446.47083, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "1", "bbox": {"l": 347.24872, "t": 437.68588, "r": 351.6412, "b": 446.47083, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 318.88071, "t": 437.68588, "r": 323.27319, "b": 446.47083, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "0", "bbox": {"l": 318.88071, "t": 437.68588, "r": 323.27319, "b": 446.47083, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 394.10422, "t": 437.68588, "r": 398.4967, "b": 446.47083, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "2", "bbox": {"l": 394.10422, "t": 437.68588, "r": 398.4967, "b": 446.47083, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 318.77316, "t": 449.5455, "r": 323.16565, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "3", "bbox": {"l": 318.77316, "t": 449.5455, "r": 323.16565, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 347.24872, "t": 449.5455, "r": 351.6412, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "4", "bbox": {"l": 347.24872, "t": 449.5455, "r": 351.6412, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 394.10422, "t": 449.5455, "r": 398.4967, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "5", "bbox": {"l": 394.10422, "t": 449.5455, "r": 398.4967, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 440.95941000000005, "t": 449.5455, "r": 445.3519, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "6", "bbox": {"l": 440.95941000000005, "t": 449.5455, "r": 445.3519, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 487.81491, "t": 449.5455, "r": 492.2074, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "7", "bbox": {"l": 487.81491, "t": 449.5455, "r": 492.2074, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 318.77316, "t": 473.70425, "r": 323.16565, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "8", "bbox": {"l": 318.77316, "t": 473.70425, "r": 323.16565, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 347.24872, "t": 461.8446, "r": 351.6412, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "9", "bbox": {"l": 347.24872, "t": 461.8446, "r": 351.6412, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 394.10422, "t": 461.8446, "r": 402.88831, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "10", "bbox": {"l": 394.10422, "t": 461.8446, "r": 402.88831, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 440.95941000000005, "t": 461.8446, "r": 449.42285, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "11", "bbox": {"l": 440.95941000000005, "t": 461.8446, "r": 449.42285, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 487.81491, "t": 461.8446, "r": 496.599, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "12", "bbox": {"l": 487.81491, "t": 461.8446, "r": 496.599, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 347.24872, "t": 473.70425, "r": 356.03281, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "13", "bbox": {"l": 347.24872, "t": 473.70425, "r": 356.03281, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 394.10422, "t": 473.70425, "r": 402.88831, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "14", "bbox": {"l": 394.10422, "t": 473.70425, "r": 402.88831, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 440.95941000000005, "t": 473.70425, "r": 449.7435, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "15", "bbox": {"l": 440.95941000000005, "t": 473.70425, "r": 449.7435, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 487.81491, "t": 473.70425, "r": 496.599, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "16", "bbox": {"l": 487.81491, "t": 473.70425, "r": 496.599, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 347.24872, "t": 485.12469, "r": 356.03281, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "17", "bbox": {"l": 347.24872, "t": 485.12469, "r": 356.03281, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 394.10422, "t": 485.12469, "r": 402.88831, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "18", "bbox": {"l": 394.10422, "t": 485.12469, "r": 402.88831, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 440.95941000000005, "t": 485.12469, "r": 449.7435, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "19", "bbox": {"l": 440.95941000000005, "t": 485.12469, "r": 449.7435, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 487.81491, "t": 485.12469, "r": 496.599, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "20", "bbox": {"l": 487.81491, "t": 485.12469, "r": 496.599, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 366.70102, "t": 449.12082, "r": 372.70581, "b": 459.25122, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "3", "bbox": {"l": 366.70102, "t": 449.12082, "r": 372.70581, "b": 459.25122, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 331.90424, "t": 473.32291, "r": 337.90903, "b": 483.45331, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "2", "bbox": {"l": 331.90424, "t": 473.32291, "r": 337.90903, "b": 483.45331, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 459.87621999999993, "t": 437.5936, "r": 465.88101, "b": 447.724, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "1", "bbox": {"l": 459.87621999999993, "t": 437.5936, "r": 465.88101, "b": 447.724, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 16, "label": "picture", "bbox": {"l": 315.65362548828125, "t": 228.723388671875, "r": 537.1475219726562, "b": 302.8014221191406, "coord_origin": "TOPLEFT"}, "confidence": 0.608779788017273, "cells": [{"id": 97, "text": "1", "bbox": {"l": 451.9457100000001, "t": 235.34704999999997, "r": 457.95050000000003, "b": 245.47748, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "2", "bbox": {"l": 331.19681, "t": 269.35266, "r": 337.2016, "b": 279.48308999999995, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "3", "bbox": {"l": 384.0329, "t": 252.67895999999996, "r": 390.03769, "b": 262.80939, "coord_origin": "TOPLEFT"}}], "children": [{"id": 62, "label": "text", "bbox": {"l": 451.9457100000001, "t": 235.34704999999997, "r": 457.95050000000003, "b": 245.47748, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "1", "bbox": {"l": 451.9457100000001, "t": 235.34704999999997, "r": 457.95050000000003, "b": 245.47748, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 331.19681, "t": 269.35266, "r": 337.2016, "b": 279.48308999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "2", "bbox": {"l": 331.19681, "t": 269.35266, "r": 337.2016, "b": 279.48308999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 384.0329, "t": 252.67895999999996, "r": 390.03769, "b": 262.80939, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "3", "bbox": {"l": 384.0329, "t": 252.67895999999996, "r": 390.03769, "b": 262.80939, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 15, "label": "table", "bbox": {"l": 315.65362548828125, "t": 228.723388671875, "r": 537.1475219726562, "b": 302.8014221191406, "coord_origin": "TOPLEFT"}, "confidence": 0.6515864729881287, "cells": [{"id": 97, "text": "1", "bbox": {"l": 451.9457100000001, "t": 235.34704999999997, "r": 457.95050000000003, "b": 245.47748, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "2", "bbox": {"l": 331.19681, "t": 269.35266, "r": 337.2016, "b": 279.48308999999995, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "3", "bbox": {"l": 384.0329, "t": 252.67895999999996, "r": 390.03769, "b": 262.80939, "coord_origin": "TOPLEFT"}}], "children": [{"id": 62, "label": "text", "bbox": {"l": 451.9457100000001, "t": 235.34704999999997, "r": 457.95050000000003, "b": 245.47748, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "1", "bbox": {"l": 451.9457100000001, "t": 235.34704999999997, "r": 457.95050000000003, "b": 245.47748, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 331.19681, "t": 269.35266, "r": 337.2016, "b": 279.48308999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "2", "bbox": {"l": 331.19681, "t": 269.35266, "r": 337.2016, "b": 279.48308999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 384.0329, "t": 252.67895999999996, "r": 390.03769, "b": 262.80939, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "3", "bbox": {"l": 384.0329, "t": 252.67895999999996, "r": 390.03769, "b": 262.80939, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 6, "label": "caption", "bbox": {"l": 308.862, "t": 514.50037, "r": 545.11517, "b": 559.2729, "coord_origin": "TOPLEFT"}, "confidence": 0.9214619398117065, "cells": [{"id": 106, "text": "Figure 1:", "bbox": {"l": 308.862, "t": 514.50037, "r": 345.73361, "b": 523.40692, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "Picture of a table with subtle, complex features", "bbox": {"l": 353.17566, "t": 514.50037, "r": 545.11511, "b": 523.40692, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "such as (1) multi-column headers, (2) cell with multi-row", "bbox": {"l": 308.862, "t": 526.45535, "r": 545.11511, "b": 535.3619100000001, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "text and (3) cells with no content. Image from PubTabNet", "bbox": {"l": 308.862, "t": 538.41035, "r": 545.11517, "b": 547.31691, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "evaluation set, filename: \u2018PMC2944238 004 02\u2019.", "bbox": {"l": 308.862, "t": 550.36635, "r": 505.6917700000001, "b": 559.2729, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 308.862, "t": 584.40936, "r": 545.11517, "b": 665.04693, "coord_origin": "TOPLEFT"}, "confidence": 0.9848759770393372, "cells": [{"id": 111, "text": "Recently, significant progress has been made with vi-", "bbox": {"l": 320.81699, "t": 584.40936, "r": 545.11493, "b": 593.31592, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "sion based approaches to extract tables in documents. For", "bbox": {"l": 308.862, "t": 596.36436, "r": 545.11517, "b": 605.2709199999999, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "the sake of completeness, the issue of table extraction from", "bbox": {"l": 308.862, "t": 608.31937, "r": 545.11511, "b": 617.22592, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "documents is typically decomposed into two separate chal-", "bbox": {"l": 308.862, "t": 620.27437, "r": 545.11505, "b": 629.18092, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "lenges, i.e.", "bbox": {"l": 308.862, "t": 632.23036, "r": 353.6937, "b": 641.13692, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "(1)", "bbox": {"l": 362.11209, "t": 632.23036, "r": 374.66617, "b": 641.13692, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "finding the location of the table(s) on a", "bbox": {"l": 377.35785, "t": 632.23036, "r": 545.11505, "b": 641.13692, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "document-page and (2) finding the structure of a given table", "bbox": {"l": 308.862, "t": 644.18536, "r": 545.11517, "b": 653.09192, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "in the document.", "bbox": {"l": 308.862, "t": 656.14037, "r": 375.55167, "b": 665.04693, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 308.862, "t": 668.38036, "r": 545.11511, "b": 713.151932, "coord_origin": "TOPLEFT"}, "confidence": 0.979152262210846, "cells": [{"id": 120, "text": "The first problem is called table-location and has been", "bbox": {"l": 320.81699, "t": 668.38036, "r": 545.11493, "b": 677.28693, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "previously addressed [30, 38, 19, 21, 23, 26, 8] with state-", "bbox": {"l": 308.862, "t": 680.33536, "r": 545.11511, "b": 689.24193, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "of-the-art object-detection networks (e.g. YOLO and later", "bbox": {"l": 308.862, "t": 692.290359, "r": 545.11511, "b": 701.19693, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "on Mask-RCNN [9]). For all practical purposes, it can be", "bbox": {"l": 308.862, "t": 704.245361, "r": 545.11499, "b": 713.151932, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "page_footer", "bbox": {"l": 295.121, "t": 734.133366, "r": 300.10229, "b": 743.039928, "coord_origin": "TOPLEFT"}, "confidence": 0.8045893311500549, "cells": [{"id": 124, "text": "1", "bbox": {"l": 295.121, "t": 734.133366, "r": 300.10229, "b": 743.039928, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "page_header", "bbox": {"l": 18.340221, "t": 207.82001000000002, "r": 36.339779, "b": 560.00003, "coord_origin": "TOPLEFT"}, "confidence": 0.8773143887519836, "cells": [{"id": 125, "text": "arXiv:2203.01017v2 [cs.CV] 11 Mar 2022", "bbox": {"l": 18.340221, "t": 207.82001000000002, "r": 36.339779, "b": 560.00003, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {"11": {"label": "table", "id": 11, "page_no": 0, "cluster": {"id": 11, "label": "table", "bbox": {"l": 315.7172546386719, "t": 433.823486328125, "r": 536.835693359375, "b": 496.0290222167969, "coord_origin": "TOPLEFT"}, "confidence": 0.8056110739707947, "cells": [{"id": 76, "text": "1", "bbox": {"l": 347.24872, "t": 437.68588, "r": 351.6412, "b": 446.47083, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "0", "bbox": {"l": 318.88071, "t": 437.68588, "r": 323.27319, "b": 446.47083, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "2", "bbox": {"l": 394.10422, "t": 437.68588, "r": 398.4967, "b": 446.47083, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "3", "bbox": {"l": 318.77316, "t": 449.5455, "r": 323.16565, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "4", "bbox": {"l": 347.24872, "t": 449.5455, "r": 351.6412, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "5", "bbox": {"l": 394.10422, "t": 449.5455, "r": 398.4967, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "6", "bbox": {"l": 440.95941000000005, "t": 449.5455, "r": 445.3519, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "7", "bbox": {"l": 487.81491, "t": 449.5455, "r": 492.2074, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "8", "bbox": {"l": 318.77316, "t": 473.70425, "r": 323.16565, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "9", "bbox": {"l": 347.24872, "t": 461.8446, "r": 351.6412, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "10", "bbox": {"l": 394.10422, "t": 461.8446, "r": 402.88831, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "11", "bbox": {"l": 440.95941000000005, "t": 461.8446, "r": 449.42285, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "12", "bbox": {"l": 487.81491, "t": 461.8446, "r": 496.599, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "13", "bbox": {"l": 347.24872, "t": 473.70425, "r": 356.03281, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "14", "bbox": {"l": 394.10422, "t": 473.70425, "r": 402.88831, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "15", "bbox": {"l": 440.95941000000005, "t": 473.70425, "r": 449.7435, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "16", "bbox": {"l": 487.81491, "t": 473.70425, "r": 496.599, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "17", "bbox": {"l": 347.24872, "t": 485.12469, "r": 356.03281, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "18", "bbox": {"l": 394.10422, "t": 485.12469, "r": 402.88831, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "19", "bbox": {"l": 440.95941000000005, "t": 485.12469, "r": 449.7435, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "20", "bbox": {"l": 487.81491, "t": 485.12469, "r": 496.599, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "3", "bbox": {"l": 366.70102, "t": 449.12082, "r": 372.70581, "b": 459.25122, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "2", "bbox": {"l": 331.90424, "t": 473.32291, "r": 337.90903, "b": 483.45331, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "1", "bbox": {"l": 459.87621999999993, "t": 437.5936, "r": 465.88101, "b": 447.724, "coord_origin": "TOPLEFT"}}], "children": [{"id": 41, "label": "text", "bbox": {"l": 347.24872, "t": 437.68588, "r": 351.6412, "b": 446.47083, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "1", "bbox": {"l": 347.24872, "t": 437.68588, "r": 351.6412, "b": 446.47083, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 318.88071, "t": 437.68588, "r": 323.27319, "b": 446.47083, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "0", "bbox": {"l": 318.88071, "t": 437.68588, "r": 323.27319, "b": 446.47083, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 394.10422, "t": 437.68588, "r": 398.4967, "b": 446.47083, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "2", "bbox": {"l": 394.10422, "t": 437.68588, "r": 398.4967, "b": 446.47083, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 318.77316, "t": 449.5455, "r": 323.16565, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "3", "bbox": {"l": 318.77316, "t": 449.5455, "r": 323.16565, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 347.24872, "t": 449.5455, "r": 351.6412, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "4", "bbox": {"l": 347.24872, "t": 449.5455, "r": 351.6412, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 394.10422, "t": 449.5455, "r": 398.4967, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "5", "bbox": {"l": 394.10422, "t": 449.5455, "r": 398.4967, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 440.95941000000005, "t": 449.5455, "r": 445.3519, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "6", "bbox": {"l": 440.95941000000005, "t": 449.5455, "r": 445.3519, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 487.81491, "t": 449.5455, "r": 492.2074, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "7", "bbox": {"l": 487.81491, "t": 449.5455, "r": 492.2074, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 318.77316, "t": 473.70425, "r": 323.16565, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "8", "bbox": {"l": 318.77316, "t": 473.70425, "r": 323.16565, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 347.24872, "t": 461.8446, "r": 351.6412, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "9", "bbox": {"l": 347.24872, "t": 461.8446, "r": 351.6412, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 394.10422, "t": 461.8446, "r": 402.88831, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "10", "bbox": {"l": 394.10422, "t": 461.8446, "r": 402.88831, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 440.95941000000005, "t": 461.8446, "r": 449.42285, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "11", "bbox": {"l": 440.95941000000005, "t": 461.8446, "r": 449.42285, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 487.81491, "t": 461.8446, "r": 496.599, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "12", "bbox": {"l": 487.81491, "t": 461.8446, "r": 496.599, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 347.24872, "t": 473.70425, "r": 356.03281, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "13", "bbox": {"l": 347.24872, "t": 473.70425, "r": 356.03281, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 394.10422, "t": 473.70425, "r": 402.88831, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "14", "bbox": {"l": 394.10422, "t": 473.70425, "r": 402.88831, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 440.95941000000005, "t": 473.70425, "r": 449.7435, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "15", "bbox": {"l": 440.95941000000005, "t": 473.70425, "r": 449.7435, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 487.81491, "t": 473.70425, "r": 496.599, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "16", "bbox": {"l": 487.81491, "t": 473.70425, "r": 496.599, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 347.24872, "t": 485.12469, "r": 356.03281, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "17", "bbox": {"l": 347.24872, "t": 485.12469, "r": 356.03281, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 394.10422, "t": 485.12469, "r": 402.88831, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "18", "bbox": {"l": 394.10422, "t": 485.12469, "r": 402.88831, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 440.95941000000005, "t": 485.12469, "r": 449.7435, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "19", "bbox": {"l": 440.95941000000005, "t": 485.12469, "r": 449.7435, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 487.81491, "t": 485.12469, "r": 496.599, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "20", "bbox": {"l": 487.81491, "t": 485.12469, "r": 496.599, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 366.70102, "t": 449.12082, "r": 372.70581, "b": 459.25122, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "3", "bbox": {"l": 366.70102, "t": 449.12082, "r": 372.70581, "b": 459.25122, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 331.90424, "t": 473.32291, "r": 337.90903, "b": 483.45331, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "2", "bbox": {"l": 331.90424, "t": 473.32291, "r": 337.90903, "b": 483.45331, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 459.87621999999993, "t": 437.5936, "r": 465.88101, "b": 447.724, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "1", "bbox": {"l": 459.87621999999993, "t": 437.5936, "r": 465.88101, "b": 447.724, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "lcel", "ched", "lcel", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "ucel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "ucel", "nl"], "num_rows": 5, "num_cols": 6, "table_cells": [{"bbox": {"l": 347.24872, "t": 437.68588, "r": 351.6412, "b": 446.47083, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 3, "text": "1", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 318.88071, "t": 437.68588, "r": 323.27319, "b": 446.47083, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "0", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 394.10422, "t": 437.5936, "r": 465.88101, "b": 447.724, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 5, "text": "2 1", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 318.77316, "t": 449.5455, "r": 323.16565, "b": 458.33044, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 347.24872, "t": 449.5455, "r": 351.6412, "b": 458.33044, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 366.70102, "t": 449.12082, "r": 398.4967, "b": 459.25122, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "5 3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.95941000000005, "t": 449.5455, "r": 445.3519, "b": 458.33044, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.81491, "t": 449.5455, "r": 492.2074, "b": 458.33044, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 318.77316, "t": 473.70425, "r": 323.16565, "b": 482.4892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 347.24872, "t": 461.8446, "r": 351.6412, "b": 470.62955, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.10422, "t": 461.8446, "r": 402.88831, "b": 470.62955, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "10", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.95941000000005, "t": 461.8446, "r": 449.42285, "b": 470.62955, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "11", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.81491, "t": 461.8446, "r": 496.599, "b": 470.62955, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "12", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 347.24872, "t": 473.70425, "r": 356.03281, "b": 482.4892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "13", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.10422, "t": 473.70425, "r": 402.88831, "b": 482.4892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "14", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.95941000000005, "t": 473.70425, "r": 449.7435, "b": 482.4892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "15", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.81491, "t": 473.70425, "r": 496.599, "b": 482.4892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "16", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 347.24872, "t": 485.12469, "r": 356.03281, "b": 493.90964, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "17", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.10422, "t": 485.12469, "r": 402.88831, "b": 493.90964, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "18", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.95941000000005, "t": 485.12469, "r": 449.7435, "b": 493.90964, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "19", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.81491, "t": 485.12469, "r": 496.599, "b": 493.90964, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "20", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 331.90424, "t": 473.32291, "r": 337.90903, "b": 483.45331, "coord_origin": "TOPLEFT"}, "row_span": 3, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "2", "column_header": false, "row_header": false, "row_section": false}]}, "15": {"label": "table", "id": 15, "page_no": 0, "cluster": {"id": 15, "label": "table", "bbox": {"l": 315.65362548828125, "t": 228.723388671875, "r": 537.1475219726562, "b": 302.8014221191406, "coord_origin": "TOPLEFT"}, "confidence": 0.6515864729881287, "cells": [{"id": 97, "text": "1", "bbox": {"l": 451.9457100000001, "t": 235.34704999999997, "r": 457.95050000000003, "b": 245.47748, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "2", "bbox": {"l": 331.19681, "t": 269.35266, "r": 337.2016, "b": 279.48308999999995, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "3", "bbox": {"l": 384.0329, "t": 252.67895999999996, "r": 390.03769, "b": 262.80939, "coord_origin": "TOPLEFT"}}], "children": [{"id": 62, "label": "text", "bbox": {"l": 451.9457100000001, "t": 235.34704999999997, "r": 457.95050000000003, "b": 245.47748, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "1", "bbox": {"l": 451.9457100000001, "t": 235.34704999999997, "r": 457.95050000000003, "b": 245.47748, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 331.19681, "t": 269.35266, "r": 337.2016, "b": 279.48308999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "2", "bbox": {"l": 331.19681, "t": 269.35266, "r": 337.2016, "b": 279.48308999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 384.0329, "t": 252.67895999999996, "r": 390.03769, "b": 262.80939, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "3", "bbox": {"l": 384.0329, "t": 252.67895999999996, "r": 390.03769, "b": 262.80939, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ecel", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "ucel", "fcel", "fcel", "fcel", "fcel", "nl", "ucel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 1, "num_cols": 2, "table_cells": [{"bbox": {"l": 451.9457100000001, "t": 235.34704999999997, "r": 457.95050000000003, "b": 245.47748, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "1", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 384.0329, "t": 252.67895999999996, "r": 390.03769, "b": 262.80939, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3", "column_header": true, "row_header": false, "row_section": false}]}}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "section_header", "id": 8, "page_no": 0, "cluster": {"id": 8, "label": "section_header", "bbox": {"l": 96.301003, "t": 107.03412000000003, "r": 498.92708999999996, "b": 119.93133999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.8868067860603333, "cells": [{"id": 0, "text": "TableFormer: Table Structure Understanding with Transformers.", "bbox": {"l": 96.301003, "t": 107.03412000000003, "r": 498.92708999999996, "b": 119.93133999999998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "TableFormer: Table Structure Understanding with Transformers."}, {"label": "section_header", "id": 13, "page_no": 0, "cluster": {"id": 13, "label": "section_header", "bbox": {"l": 142.47701, "t": 146.68535999999995, "r": 452.75027, "b": 171.32037000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.7586215734481812, "cells": [{"id": 1, "text": "Ahmed Nassar, Nikolaos Livathinos, Maksym Lysak, Peter Staar", "bbox": {"l": 142.47701, "t": 146.68535999999995, "r": 452.75027, "b": 157.37334999999996, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "IBM Research", "bbox": {"l": 262.918, "t": 160.63239, "r": 332.30597, "b": 171.32037000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Ahmed Nassar, Nikolaos Livathinos, Maksym Lysak, Peter Staar IBM Research"}, {"label": "key_value_region", "id": 25, "page_no": 0, "cluster": {"id": 25, "label": "key_value_region", "bbox": {"l": 208.123, "t": 175.96123999999998, "r": 378.73257, "b": 184.42553999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.4854728579521179, "cells": [{"id": 3, "text": "{", "bbox": {"l": 208.123, "t": 175.96123999999998, "r": 212.73083, "b": 184.42553999999996, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "ahn,nli,mly,taa", "bbox": {"l": 212.73, "t": 177.08203000000003, "r": 293.42761, "b": 184.00409000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "}", "bbox": {"l": 293.42798, "t": 175.96123999999998, "r": 298.0358, "b": 184.42553999999996, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "@zurich.ibm.com", "bbox": {"l": 298.03497, "t": 177.08203000000003, "r": 378.73257, "b": 184.00409000000002, "coord_origin": "TOPLEFT"}}], "children": [{"id": 7, "label": "text", "bbox": {"l": 208.123, "t": 175.96123999999998, "r": 378.73257, "b": 184.42553999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9096331596374512, "cells": [{"id": 3, "text": "{", "bbox": {"l": 208.123, "t": 175.96123999999998, "r": 212.73083, "b": 184.42553999999996, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "ahn,nli,mly,taa", "bbox": {"l": 212.73, "t": 177.08203000000003, "r": 293.42761, "b": 184.00409000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "}", "bbox": {"l": 293.42798, "t": 175.96123999999998, "r": 298.0358, "b": 184.42553999999996, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "@zurich.ibm.com", "bbox": {"l": 298.03497, "t": 177.08203000000003, "r": 378.73257, "b": 184.00409000000002, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null}, {"label": "section_header", "id": 5, "page_no": 0, "cluster": {"id": 5, "label": "section_header", "bbox": {"l": 145.99498, "t": 215.48297000000002, "r": 190.48029, "b": 226.23071000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9258671402931213, "cells": [{"id": 7, "text": "Abstract", "bbox": {"l": 145.99498, "t": 215.48297000000002, "r": 190.48029, "b": 226.23071000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Abstract"}, {"label": "text", "id": 2, "page_no": 0, "cluster": {"id": 2, "label": "text", "bbox": {"l": 50.111977, "t": 241.39508, "r": 286.36511, "b": 512.9966400000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9838882088661194, "cells": [{"id": 8, "text": "Tables organize valuable content in a concise and com-", "bbox": {"l": 62.066978, "t": 241.39508, "r": 286.36493, "b": 249.98284999999998, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "pact representation. This content is extremely valuable for", "bbox": {"l": 50.111977, "t": 253.3501, "r": 286.36508, "b": 261.93787, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "systems such as search engines, Knowledge Graph\u2019s, etc,", "bbox": {"l": 50.111977, "t": 265.30511, "r": 286.36508, "b": 273.89288, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "since they enhance their predictive capabilities. Unfortu-", "bbox": {"l": 50.111977, "t": 277.26111000000003, "r": 286.36505, "b": 285.84888, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "nately, tables come in a large variety of shapes and sizes.", "bbox": {"l": 50.111977, "t": 289.21609, "r": 286.36505, "b": 297.80386, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Furthermore, they can have complex column/row-header", "bbox": {"l": 50.111977, "t": 301.17108, "r": 286.36505, "b": 309.75884999999994, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "configurations, multiline rows, different variety of separa-", "bbox": {"l": 50.111977, "t": 313.12607, "r": 286.36508, "b": 321.71384, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "tion lines, missing entries, etc. As such, the correct iden-", "bbox": {"l": 50.111977, "t": 325.08105, "r": 286.36508, "b": 333.66882, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "tification of the table-structure from an image is a non-", "bbox": {"l": 50.111977, "t": 337.03604, "r": 286.36505, "b": 345.62381, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "trivial task. In this paper, we present a new table-structure", "bbox": {"l": 50.111977, "t": 348.99203, "r": 286.36508, "b": 357.5798, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "identification model. The latter improves the latest end-to-", "bbox": {"l": 50.111977, "t": 360.94701999999995, "r": 286.36505, "b": 369.53479, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "end deep learning model (i.e. encoder-dual-decoder from", "bbox": {"l": 50.111977, "t": 372.90201, "r": 286.36508, "b": 381.48978, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "PubTabNet) in two significant ways. First, we introduce a", "bbox": {"l": 50.111977, "t": 384.85699, "r": 286.36505, "b": 393.44476, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "new object detection decoder for table-cells. In this way,", "bbox": {"l": 50.111977, "t": 396.81198, "r": 286.36511, "b": 405.39975000000004, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "we can obtain the content of the table-cells from program-", "bbox": {"l": 50.111977, "t": 408.76697, "r": 286.36508, "b": 417.35474, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "matic PDF\u2019s directly from the PDF source and avoid the", "bbox": {"l": 50.111977, "t": 420.72296000000006, "r": 286.36505, "b": 429.31073, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "training of the custom OCR decoders.", "bbox": {"l": 50.111977, "t": 432.67795, "r": 207.23216, "b": 441.26572, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "This architectural", "bbox": {"l": 214.09639, "t": 432.67795, "r": 286.36508, "b": 441.26572, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "change leads to more accurate table-content extraction and", "bbox": {"l": 50.111977, "t": 444.63293, "r": 286.36508, "b": 453.2207, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "allows us to tackle non-english tables. Second, we replace", "bbox": {"l": 50.111977, "t": 456.58792000000005, "r": 286.36505, "b": 465.17569, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "the LSTM decoders with transformer based decoders. This", "bbox": {"l": 50.111977, "t": 468.54291, "r": 286.36505, "b": 477.13068, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "upgrade improves significantly the previous state-of-the-art", "bbox": {"l": 50.111977, "t": 480.4989, "r": 286.36508, "b": 489.08667, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "tree-editing-distance-score (TEDS) from 91% to 98.5% on", "bbox": {"l": 50.111977, "t": 492.45389, "r": 286.36505, "b": 501.04166, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "simple tables and from 88.7% to 95% on complex tables.", "bbox": {"l": 50.111977, "t": 504.40887, "r": 276.65152, "b": 512.9966400000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Tables organize valuable content in a concise and compact representation. This content is extremely valuable for systems such as search engines, Knowledge Graph's, etc, since they enhance their predictive capabilities. Unfortunately, tables come in a large variety of shapes and sizes. Furthermore, they can have complex column/row-header configurations, multiline rows, different variety of separation lines, missing entries, etc. As such, the correct identification of the table-structure from an image is a nontrivial task. In this paper, we present a new table-structure identification model. The latter improves the latest end-toend deep learning model (i.e. encoder-dual-decoder from PubTabNet) in two significant ways. First, we introduce a new object detection decoder for table-cells. In this way, we can obtain the content of the table-cells from programmatic PDF's directly from the PDF source and avoid the training of the custom OCR decoders. This architectural change leads to more accurate table-content extraction and allows us to tackle non-english tables. Second, we replace the LSTM decoders with transformer based decoders. This upgrade improves significantly the previous state-of-the-art tree-editing-distance-score (TEDS) from 91% to 98.5% on simple tables and from 88.7% to 95% on complex tables."}, {"label": "section_header", "id": 4, "page_no": 0, "cluster": {"id": 4, "label": "section_header", "bbox": {"l": 50.111977, "t": 539.94276, "r": 126.94804, "b": 550.69049, "coord_origin": "TOPLEFT"}, "confidence": 0.9317677617073059, "cells": [{"id": 32, "text": "1.", "bbox": {"l": 50.111977, "t": 539.94276, "r": 58.121296, "b": 550.69049, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "Introduction", "bbox": {"l": 68.800385, "t": 539.94276, "r": 126.94804, "b": 550.69049, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1. Introduction"}, {"label": "text", "id": 1, "page_no": 0, "cluster": {"id": 1, "label": "text", "bbox": {"l": 50.111977, "t": 560.7832, "r": 286.36508, "b": 713.151779, "coord_origin": "TOPLEFT"}, "confidence": 0.9841895699501038, "cells": [{"id": 34, "text": "The occurrence of tables in documents is ubiquitous.", "bbox": {"l": 62.066978, "t": 560.7832, "r": 286.36496, "b": 569.68976, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "They often summarise quantitative or factual data, which is", "bbox": {"l": 50.111977, "t": 572.7382, "r": 286.36508, "b": 581.64476, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "cumbersome to describe in verbose text but nevertheless ex-", "bbox": {"l": 50.111977, "t": 584.69321, "r": 286.36505, "b": 593.5997600000001, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "tremely valuable. Unfortunately, this compact representa-", "bbox": {"l": 50.111977, "t": 596.6492000000001, "r": 286.36505, "b": 605.55576, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "tion is often not easy to parse by machines. There are many", "bbox": {"l": 50.111977, "t": 608.6042, "r": 286.36505, "b": 617.51076, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "implicit conventions used to obtain a compact table repre-", "bbox": {"l": 50.111977, "t": 620.5592, "r": 286.36505, "b": 629.46576, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "sentation. For example, tables often have complex column-", "bbox": {"l": 50.111977, "t": 632.51421, "r": 286.36508, "b": 641.42076, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "and row-headers in order to reduce duplicated cell content.", "bbox": {"l": 50.111977, "t": 644.46921, "r": 286.36508, "b": 653.37576, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "Lines of different shapes and sizes are leveraged to separate", "bbox": {"l": 50.111977, "t": 656.42421, "r": 286.36502, "b": 665.33077, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "content or indicate a tree structure. Additionally, tables can", "bbox": {"l": 50.111977, "t": 668.3802000000001, "r": 286.36505, "b": 677.28677, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "also have empty/missing table-entries or multi-row textual", "bbox": {"l": 50.111977, "t": 680.33521, "r": 286.36505, "b": 689.2417800000001, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "table-entries. Fig. 1 shows a table which presents all these", "bbox": {"l": 50.111977, "t": 692.290207, "r": 286.36505, "b": 701.196777, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "issues.", "bbox": {"l": 50.111977, "t": 704.245209, "r": 76.403275, "b": 713.151779, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The occurrence of tables in documents is ubiquitous. They often summarise quantitative or factual data, which is cumbersome to describe in verbose text but nevertheless extremely valuable. Unfortunately, this compact representation is often not easy to parse by machines. There are many implicit conventions used to obtain a compact table representation. For example, tables often have complex columnand row-headers in order to reduce duplicated cell content. Lines of different shapes and sizes are leveraged to separate content or indicate a tree structure. Additionally, tables can also have empty/missing table-entries or multi-row textual table-entries. Fig. 1 shows a table which presents all these issues."}, {"label": "section_header", "id": 14, "page_no": 0, "cluster": {"id": 14, "label": "section_header", "bbox": {"l": 315.56702, "t": 218.00684, "r": 408.4407, "b": 226.75482, "coord_origin": "TOPLEFT"}, "confidence": 0.6724023818969727, "cells": [{"id": 47, "text": "a.", "bbox": {"l": 315.56702, "t": 218.00684, "r": 324.01007, "b": 226.75482, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Picture of a table:", "bbox": {"l": 328.2316, "t": 218.00684, "r": 408.4407, "b": 226.75482, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "a. Picture of a table:"}, {"label": "list_item", "id": 17, "page_no": 0, "cluster": {"id": 17, "label": "list_item", "bbox": {"l": 315.56702, "t": 313.69478999999995, "r": 486.40194999999994, "b": 333.2428, "coord_origin": "TOPLEFT"}, "confidence": 0.5549328923225403, "cells": [{"id": 49, "text": "b.", "bbox": {"l": 315.56702, "t": 313.69478999999995, "r": 325.05786, "b": 322.44281, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Red-annotation of bounding boxes,", "bbox": {"l": 329.80325, "t": 313.69478999999995, "r": 486.40194999999994, "b": 322.44281, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Blue-predictions by TableFormer", "bbox": {"l": 326.46252, "t": 324.49478, "r": 472.47411999999997, "b": 333.2428, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "b. Red-annotation of bounding boxes, Blue-predictions by TableFormer"}, {"label": "list_item", "id": 18, "page_no": 0, "cluster": {"id": 18, "label": "list_item", "bbox": {"l": 315.56702, "t": 420.1828, "r": 491.1912500000001, "b": 428.93082, "coord_origin": "TOPLEFT"}, "confidence": 0.5501358509063721, "cells": [{"id": 52, "text": "c.", "bbox": {"l": 315.56702, "t": 420.1828, "r": 324.81039, "b": 428.93082, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Structure predicted by TableFormer:", "bbox": {"l": 329.4321, "t": 420.1828, "r": 491.1912500000001, "b": 428.93082, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "c. Structure predicted by TableFormer:"}, {"label": "picture", "id": 10, "page_no": 0, "cluster": {"id": 10, "label": "picture", "bbox": {"l": 314.78173828125, "t": 338.0652770996094, "r": 539.1802978515625, "b": 410.0494384765625, "coord_origin": "TOPLEFT"}, "confidence": 0.8742761611938477, "cells": [{"id": 54, "text": "1", "bbox": {"l": 408.14752, "t": 342.82828, "r": 412.54001, "b": 351.61322, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "0", "bbox": {"l": 356.11011, "t": 341.57217, "r": 360.50259, "b": 350.35712, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "2", "bbox": {"l": 500.6777, "t": 340.93768, "r": 505.0701900000001, "b": 349.7226299999999, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "3", "bbox": {"l": 356.13382, "t": 351.74789, "r": 360.52631, "b": 360.53284, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "4", "bbox": {"l": 402.53992, "t": 355.8765, "r": 406.9324, "b": 364.66144, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "5", "bbox": {"l": 448.58178999999996, "t": 352.84018, "r": 452.97427, "b": 361.62512, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "6", "bbox": {"l": 491.65161000000006, "t": 353.70657, "r": 496.0441, "b": 362.49152, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "7", "bbox": {"l": 535.13843, "t": 353.33969, "r": 539.53088, "b": 362.12463, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "8", "bbox": {"l": 348.82822, "t": 387.09781, "r": 353.2207, "b": 395.88275, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "9", "bbox": {"l": 389.27151, "t": 375.37228, "r": 393.664, "b": 384.15723, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "10", "bbox": {"l": 442.67479999999995, "t": 375.64621, "r": 451.45889000000005, "b": 384.43115, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "11", "bbox": {"l": 477.4382299999999, "t": 375.534, "r": 485.90167, "b": 384.31894000000005, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "12", "bbox": {"l": 522.57263, "t": 375.64621, "r": 531.35669, "b": 384.43115, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "13", "bbox": {"l": 400.22992, "t": 387.11429, "r": 409.01401, "b": 395.89923, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "14", "bbox": {"l": 442.30792, "t": 386.98981000000003, "r": 451.0920100000001, "b": 395.77475000000004, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "15", "bbox": {"l": 478.21941999999996, "t": 387.37469, "r": 487.00351000000006, "b": 396.15964, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "16", "bbox": {"l": 523.2287, "t": 386.98981000000003, "r": 532.01276, "b": 395.77475000000004, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "1", "bbox": {"l": 411.57233, "t": 399.42477, "r": 415.96481, "b": 408.20972, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "7", "bbox": {"l": 415.96393, "t": 399.42477, "r": 420.35641, "b": 408.20972, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "18", "bbox": {"l": 442.30521, "t": 399.0371999999999, "r": 451.08929, "b": 407.82213999999993, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "19", "bbox": {"l": 478.77893, "t": 398.99639999999994, "r": 487.56302, "b": 407.78133999999994, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "20", "bbox": {"l": 523.97241, "t": 398.6114799999999, "r": 532.75647, "b": 407.39642, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "3", "bbox": {"l": 385.09399, "t": 357.76030999999995, "r": 391.09879, "b": 367.89072, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "2", "bbox": {"l": 333.43451, "t": 380.7265, "r": 339.4393, "b": 390.85689999999994, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "1", "bbox": {"l": 478.07210999999995, "t": 341.0368000000001, "r": 484.0769, "b": 351.16720999999995, "coord_origin": "TOPLEFT"}}], "children": [{"id": 19, "label": "text", "bbox": {"l": 408.14752, "t": 342.82828, "r": 412.54001, "b": 351.61322, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "1", "bbox": {"l": 408.14752, "t": 342.82828, "r": 412.54001, "b": 351.61322, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 356.11011, "t": 341.57217, "r": 360.50259, "b": 350.35712, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "0", "bbox": {"l": 356.11011, "t": 341.57217, "r": 360.50259, "b": 350.35712, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 500.6777, "t": 340.93768, "r": 505.0701900000001, "b": 349.7226299999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "2", "bbox": {"l": 500.6777, "t": 340.93768, "r": 505.0701900000001, "b": 349.7226299999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 356.13382, "t": 351.74789, "r": 360.52631, "b": 360.53284, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "3", "bbox": {"l": 356.13382, "t": 351.74789, "r": 360.52631, "b": 360.53284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 402.53992, "t": 355.8765, "r": 406.9324, "b": 364.66144, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "4", "bbox": {"l": 402.53992, "t": 355.8765, "r": 406.9324, "b": 364.66144, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 448.58178999999996, "t": 352.84018, "r": 452.97427, "b": 361.62512, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "5", "bbox": {"l": 448.58178999999996, "t": 352.84018, "r": 452.97427, "b": 361.62512, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 491.65161000000006, "t": 353.70657, "r": 496.0441, "b": 362.49152, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "6", "bbox": {"l": 491.65161000000006, "t": 353.70657, "r": 496.0441, "b": 362.49152, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 535.13843, "t": 353.33969, "r": 539.53088, "b": 362.12463, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "7", "bbox": {"l": 535.13843, "t": 353.33969, "r": 539.53088, "b": 362.12463, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 348.82822, "t": 387.09781, "r": 353.2207, "b": 395.88275, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "8", "bbox": {"l": 348.82822, "t": 387.09781, "r": 353.2207, "b": 395.88275, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 389.27151, "t": 375.37228, "r": 393.664, "b": 384.15723, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "9", "bbox": {"l": 389.27151, "t": 375.37228, "r": 393.664, "b": 384.15723, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 442.67479999999995, "t": 375.64621, "r": 451.45889000000005, "b": 384.43115, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "10", "bbox": {"l": 442.67479999999995, "t": 375.64621, "r": 451.45889000000005, "b": 384.43115, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 477.4382299999999, "t": 375.534, "r": 485.90167, "b": 384.31894000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "11", "bbox": {"l": 477.4382299999999, "t": 375.534, "r": 485.90167, "b": 384.31894000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 522.57263, "t": 375.64621, "r": 531.35669, "b": 384.43115, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "12", "bbox": {"l": 522.57263, "t": 375.64621, "r": 531.35669, "b": 384.43115, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 400.22992, "t": 387.11429, "r": 409.01401, "b": 395.89923, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "13", "bbox": {"l": 400.22992, "t": 387.11429, "r": 409.01401, "b": 395.89923, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 442.30792, "t": 386.98981000000003, "r": 451.0920100000001, "b": 395.77475000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "14", "bbox": {"l": 442.30792, "t": 386.98981000000003, "r": 451.0920100000001, "b": 395.77475000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 478.21941999999996, "t": 387.37469, "r": 487.00351000000006, "b": 396.15964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "15", "bbox": {"l": 478.21941999999996, "t": 387.37469, "r": 487.00351000000006, "b": 396.15964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 523.2287, "t": 386.98981000000003, "r": 532.01276, "b": 395.77475000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "16", "bbox": {"l": 523.2287, "t": 386.98981000000003, "r": 532.01276, "b": 395.77475000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 411.57233, "t": 399.42477, "r": 415.96481, "b": 408.20972, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "1", "bbox": {"l": 411.57233, "t": 399.42477, "r": 415.96481, "b": 408.20972, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 415.96393, "t": 399.42477, "r": 420.35641, "b": 408.20972, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "7", "bbox": {"l": 415.96393, "t": 399.42477, "r": 420.35641, "b": 408.20972, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 442.30521, "t": 399.0371999999999, "r": 451.08929, "b": 407.82213999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "18", "bbox": {"l": 442.30521, "t": 399.0371999999999, "r": 451.08929, "b": 407.82213999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 478.77893, "t": 398.99639999999994, "r": 487.56302, "b": 407.78133999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "19", "bbox": {"l": 478.77893, "t": 398.99639999999994, "r": 487.56302, "b": 407.78133999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 523.97241, "t": 398.6114799999999, "r": 532.75647, "b": 407.39642, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "20", "bbox": {"l": 523.97241, "t": 398.6114799999999, "r": 532.75647, "b": 407.39642, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 385.09399, "t": 357.76030999999995, "r": 391.09879, "b": 367.89072, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "3", "bbox": {"l": 385.09399, "t": 357.76030999999995, "r": 391.09879, "b": 367.89072, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 333.43451, "t": 380.7265, "r": 339.4393, "b": 390.85689999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "2", "bbox": {"l": 333.43451, "t": 380.7265, "r": 339.4393, "b": 390.85689999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 478.07210999999995, "t": 341.0368000000001, "r": 484.0769, "b": 351.16720999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": "1", "bbox": {"l": 478.07210999999995, "t": 341.0368000000001, "r": 484.0769, "b": 351.16720999999995, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "picture", "id": 23, "page_no": 0, "cluster": {"id": 23, "label": "picture", "bbox": {"l": 315.7172546386719, "t": 433.823486328125, "r": 536.835693359375, "b": 496.0290222167969, "coord_origin": "TOPLEFT"}, "confidence": 0.5088632702827454, "cells": [{"id": 76, "text": "1", "bbox": {"l": 347.24872, "t": 437.68588, "r": 351.6412, "b": 446.47083, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "0", "bbox": {"l": 318.88071, "t": 437.68588, "r": 323.27319, "b": 446.47083, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "2", "bbox": {"l": 394.10422, "t": 437.68588, "r": 398.4967, "b": 446.47083, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "3", "bbox": {"l": 318.77316, "t": 449.5455, "r": 323.16565, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "4", "bbox": {"l": 347.24872, "t": 449.5455, "r": 351.6412, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "5", "bbox": {"l": 394.10422, "t": 449.5455, "r": 398.4967, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "6", "bbox": {"l": 440.95941000000005, "t": 449.5455, "r": 445.3519, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "7", "bbox": {"l": 487.81491, "t": 449.5455, "r": 492.2074, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "8", "bbox": {"l": 318.77316, "t": 473.70425, "r": 323.16565, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "9", "bbox": {"l": 347.24872, "t": 461.8446, "r": 351.6412, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "10", "bbox": {"l": 394.10422, "t": 461.8446, "r": 402.88831, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "11", "bbox": {"l": 440.95941000000005, "t": 461.8446, "r": 449.42285, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "12", "bbox": {"l": 487.81491, "t": 461.8446, "r": 496.599, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "13", "bbox": {"l": 347.24872, "t": 473.70425, "r": 356.03281, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "14", "bbox": {"l": 394.10422, "t": 473.70425, "r": 402.88831, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "15", "bbox": {"l": 440.95941000000005, "t": 473.70425, "r": 449.7435, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "16", "bbox": {"l": 487.81491, "t": 473.70425, "r": 496.599, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "17", "bbox": {"l": 347.24872, "t": 485.12469, "r": 356.03281, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "18", "bbox": {"l": 394.10422, "t": 485.12469, "r": 402.88831, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "19", "bbox": {"l": 440.95941000000005, "t": 485.12469, "r": 449.7435, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "20", "bbox": {"l": 487.81491, "t": 485.12469, "r": 496.599, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "3", "bbox": {"l": 366.70102, "t": 449.12082, "r": 372.70581, "b": 459.25122, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "2", "bbox": {"l": 331.90424, "t": 473.32291, "r": 337.90903, "b": 483.45331, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "1", "bbox": {"l": 459.87621999999993, "t": 437.5936, "r": 465.88101, "b": 447.724, "coord_origin": "TOPLEFT"}}], "children": [{"id": 41, "label": "text", "bbox": {"l": 347.24872, "t": 437.68588, "r": 351.6412, "b": 446.47083, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "1", "bbox": {"l": 347.24872, "t": 437.68588, "r": 351.6412, "b": 446.47083, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 318.88071, "t": 437.68588, "r": 323.27319, "b": 446.47083, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "0", "bbox": {"l": 318.88071, "t": 437.68588, "r": 323.27319, "b": 446.47083, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 394.10422, "t": 437.68588, "r": 398.4967, "b": 446.47083, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "2", "bbox": {"l": 394.10422, "t": 437.68588, "r": 398.4967, "b": 446.47083, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 318.77316, "t": 449.5455, "r": 323.16565, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "3", "bbox": {"l": 318.77316, "t": 449.5455, "r": 323.16565, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 347.24872, "t": 449.5455, "r": 351.6412, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "4", "bbox": {"l": 347.24872, "t": 449.5455, "r": 351.6412, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 394.10422, "t": 449.5455, "r": 398.4967, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "5", "bbox": {"l": 394.10422, "t": 449.5455, "r": 398.4967, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 440.95941000000005, "t": 449.5455, "r": 445.3519, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "6", "bbox": {"l": 440.95941000000005, "t": 449.5455, "r": 445.3519, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 487.81491, "t": 449.5455, "r": 492.2074, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "7", "bbox": {"l": 487.81491, "t": 449.5455, "r": 492.2074, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 318.77316, "t": 473.70425, "r": 323.16565, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "8", "bbox": {"l": 318.77316, "t": 473.70425, "r": 323.16565, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 347.24872, "t": 461.8446, "r": 351.6412, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "9", "bbox": {"l": 347.24872, "t": 461.8446, "r": 351.6412, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 394.10422, "t": 461.8446, "r": 402.88831, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "10", "bbox": {"l": 394.10422, "t": 461.8446, "r": 402.88831, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 440.95941000000005, "t": 461.8446, "r": 449.42285, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "11", "bbox": {"l": 440.95941000000005, "t": 461.8446, "r": 449.42285, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 487.81491, "t": 461.8446, "r": 496.599, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "12", "bbox": {"l": 487.81491, "t": 461.8446, "r": 496.599, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 347.24872, "t": 473.70425, "r": 356.03281, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "13", "bbox": {"l": 347.24872, "t": 473.70425, "r": 356.03281, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 394.10422, "t": 473.70425, "r": 402.88831, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "14", "bbox": {"l": 394.10422, "t": 473.70425, "r": 402.88831, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 440.95941000000005, "t": 473.70425, "r": 449.7435, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "15", "bbox": {"l": 440.95941000000005, "t": 473.70425, "r": 449.7435, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 487.81491, "t": 473.70425, "r": 496.599, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "16", "bbox": {"l": 487.81491, "t": 473.70425, "r": 496.599, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 347.24872, "t": 485.12469, "r": 356.03281, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "17", "bbox": {"l": 347.24872, "t": 485.12469, "r": 356.03281, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 394.10422, "t": 485.12469, "r": 402.88831, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "18", "bbox": {"l": 394.10422, "t": 485.12469, "r": 402.88831, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 440.95941000000005, "t": 485.12469, "r": 449.7435, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "19", "bbox": {"l": 440.95941000000005, "t": 485.12469, "r": 449.7435, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 487.81491, "t": 485.12469, "r": 496.599, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "20", "bbox": {"l": 487.81491, "t": 485.12469, "r": 496.599, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 366.70102, "t": 449.12082, "r": 372.70581, "b": 459.25122, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "3", "bbox": {"l": 366.70102, "t": 449.12082, "r": 372.70581, "b": 459.25122, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 331.90424, "t": 473.32291, "r": 337.90903, "b": 483.45331, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "2", "bbox": {"l": 331.90424, "t": 473.32291, "r": 337.90903, "b": 483.45331, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 459.87621999999993, "t": 437.5936, "r": 465.88101, "b": 447.724, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "1", "bbox": {"l": 459.87621999999993, "t": 437.5936, "r": 465.88101, "b": 447.724, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "table", "id": 11, "page_no": 0, "cluster": {"id": 11, "label": "table", "bbox": {"l": 315.7172546386719, "t": 433.823486328125, "r": 536.835693359375, "b": 496.0290222167969, "coord_origin": "TOPLEFT"}, "confidence": 0.8056110739707947, "cells": [{"id": 76, "text": "1", "bbox": {"l": 347.24872, "t": 437.68588, "r": 351.6412, "b": 446.47083, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "0", "bbox": {"l": 318.88071, "t": 437.68588, "r": 323.27319, "b": 446.47083, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "2", "bbox": {"l": 394.10422, "t": 437.68588, "r": 398.4967, "b": 446.47083, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "3", "bbox": {"l": 318.77316, "t": 449.5455, "r": 323.16565, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "4", "bbox": {"l": 347.24872, "t": 449.5455, "r": 351.6412, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "5", "bbox": {"l": 394.10422, "t": 449.5455, "r": 398.4967, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "6", "bbox": {"l": 440.95941000000005, "t": 449.5455, "r": 445.3519, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "7", "bbox": {"l": 487.81491, "t": 449.5455, "r": 492.2074, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "8", "bbox": {"l": 318.77316, "t": 473.70425, "r": 323.16565, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "9", "bbox": {"l": 347.24872, "t": 461.8446, "r": 351.6412, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "10", "bbox": {"l": 394.10422, "t": 461.8446, "r": 402.88831, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "11", "bbox": {"l": 440.95941000000005, "t": 461.8446, "r": 449.42285, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "12", "bbox": {"l": 487.81491, "t": 461.8446, "r": 496.599, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "13", "bbox": {"l": 347.24872, "t": 473.70425, "r": 356.03281, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "14", "bbox": {"l": 394.10422, "t": 473.70425, "r": 402.88831, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "15", "bbox": {"l": 440.95941000000005, "t": 473.70425, "r": 449.7435, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "16", "bbox": {"l": 487.81491, "t": 473.70425, "r": 496.599, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "17", "bbox": {"l": 347.24872, "t": 485.12469, "r": 356.03281, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "18", "bbox": {"l": 394.10422, "t": 485.12469, "r": 402.88831, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "19", "bbox": {"l": 440.95941000000005, "t": 485.12469, "r": 449.7435, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "20", "bbox": {"l": 487.81491, "t": 485.12469, "r": 496.599, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "3", "bbox": {"l": 366.70102, "t": 449.12082, "r": 372.70581, "b": 459.25122, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "2", "bbox": {"l": 331.90424, "t": 473.32291, "r": 337.90903, "b": 483.45331, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "1", "bbox": {"l": 459.87621999999993, "t": 437.5936, "r": 465.88101, "b": 447.724, "coord_origin": "TOPLEFT"}}], "children": [{"id": 41, "label": "text", "bbox": {"l": 347.24872, "t": 437.68588, "r": 351.6412, "b": 446.47083, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "1", "bbox": {"l": 347.24872, "t": 437.68588, "r": 351.6412, "b": 446.47083, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 318.88071, "t": 437.68588, "r": 323.27319, "b": 446.47083, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "0", "bbox": {"l": 318.88071, "t": 437.68588, "r": 323.27319, "b": 446.47083, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 394.10422, "t": 437.68588, "r": 398.4967, "b": 446.47083, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "2", "bbox": {"l": 394.10422, "t": 437.68588, "r": 398.4967, "b": 446.47083, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 318.77316, "t": 449.5455, "r": 323.16565, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "3", "bbox": {"l": 318.77316, "t": 449.5455, "r": 323.16565, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 347.24872, "t": 449.5455, "r": 351.6412, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "4", "bbox": {"l": 347.24872, "t": 449.5455, "r": 351.6412, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 394.10422, "t": 449.5455, "r": 398.4967, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "5", "bbox": {"l": 394.10422, "t": 449.5455, "r": 398.4967, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 440.95941000000005, "t": 449.5455, "r": 445.3519, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "6", "bbox": {"l": 440.95941000000005, "t": 449.5455, "r": 445.3519, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 487.81491, "t": 449.5455, "r": 492.2074, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "7", "bbox": {"l": 487.81491, "t": 449.5455, "r": 492.2074, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 318.77316, "t": 473.70425, "r": 323.16565, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "8", "bbox": {"l": 318.77316, "t": 473.70425, "r": 323.16565, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 347.24872, "t": 461.8446, "r": 351.6412, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "9", "bbox": {"l": 347.24872, "t": 461.8446, "r": 351.6412, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 394.10422, "t": 461.8446, "r": 402.88831, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "10", "bbox": {"l": 394.10422, "t": 461.8446, "r": 402.88831, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 440.95941000000005, "t": 461.8446, "r": 449.42285, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "11", "bbox": {"l": 440.95941000000005, "t": 461.8446, "r": 449.42285, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 487.81491, "t": 461.8446, "r": 496.599, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "12", "bbox": {"l": 487.81491, "t": 461.8446, "r": 496.599, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 347.24872, "t": 473.70425, "r": 356.03281, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "13", "bbox": {"l": 347.24872, "t": 473.70425, "r": 356.03281, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 394.10422, "t": 473.70425, "r": 402.88831, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "14", "bbox": {"l": 394.10422, "t": 473.70425, "r": 402.88831, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 440.95941000000005, "t": 473.70425, "r": 449.7435, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "15", "bbox": {"l": 440.95941000000005, "t": 473.70425, "r": 449.7435, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 487.81491, "t": 473.70425, "r": 496.599, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "16", "bbox": {"l": 487.81491, "t": 473.70425, "r": 496.599, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 347.24872, "t": 485.12469, "r": 356.03281, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "17", "bbox": {"l": 347.24872, "t": 485.12469, "r": 356.03281, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 394.10422, "t": 485.12469, "r": 402.88831, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "18", "bbox": {"l": 394.10422, "t": 485.12469, "r": 402.88831, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 440.95941000000005, "t": 485.12469, "r": 449.7435, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "19", "bbox": {"l": 440.95941000000005, "t": 485.12469, "r": 449.7435, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 487.81491, "t": 485.12469, "r": 496.599, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "20", "bbox": {"l": 487.81491, "t": 485.12469, "r": 496.599, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 366.70102, "t": 449.12082, "r": 372.70581, "b": 459.25122, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "3", "bbox": {"l": 366.70102, "t": 449.12082, "r": 372.70581, "b": 459.25122, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 331.90424, "t": 473.32291, "r": 337.90903, "b": 483.45331, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "2", "bbox": {"l": 331.90424, "t": 473.32291, "r": 337.90903, "b": 483.45331, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 459.87621999999993, "t": 437.5936, "r": 465.88101, "b": 447.724, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "1", "bbox": {"l": 459.87621999999993, "t": 437.5936, "r": 465.88101, "b": 447.724, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "lcel", "ched", "lcel", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "ucel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "ucel", "nl"], "num_rows": 5, "num_cols": 6, "table_cells": [{"bbox": {"l": 347.24872, "t": 437.68588, "r": 351.6412, "b": 446.47083, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 3, "text": "1", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 318.88071, "t": 437.68588, "r": 323.27319, "b": 446.47083, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "0", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 394.10422, "t": 437.5936, "r": 465.88101, "b": 447.724, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 5, "text": "2 1", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 318.77316, "t": 449.5455, "r": 323.16565, "b": 458.33044, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 347.24872, "t": 449.5455, "r": 351.6412, "b": 458.33044, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 366.70102, "t": 449.12082, "r": 398.4967, "b": 459.25122, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "5 3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.95941000000005, "t": 449.5455, "r": 445.3519, "b": 458.33044, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.81491, "t": 449.5455, "r": 492.2074, "b": 458.33044, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 318.77316, "t": 473.70425, "r": 323.16565, "b": 482.4892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 347.24872, "t": 461.8446, "r": 351.6412, "b": 470.62955, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.10422, "t": 461.8446, "r": 402.88831, "b": 470.62955, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "10", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.95941000000005, "t": 461.8446, "r": 449.42285, "b": 470.62955, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "11", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.81491, "t": 461.8446, "r": 496.599, "b": 470.62955, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "12", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 347.24872, "t": 473.70425, "r": 356.03281, "b": 482.4892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "13", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.10422, "t": 473.70425, "r": 402.88831, "b": 482.4892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "14", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.95941000000005, "t": 473.70425, "r": 449.7435, "b": 482.4892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "15", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.81491, "t": 473.70425, "r": 496.599, "b": 482.4892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "16", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 347.24872, "t": 485.12469, "r": 356.03281, "b": 493.90964, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "17", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.10422, "t": 485.12469, "r": 402.88831, "b": 493.90964, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "18", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.95941000000005, "t": 485.12469, "r": 449.7435, "b": 493.90964, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "19", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.81491, "t": 485.12469, "r": 496.599, "b": 493.90964, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "20", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 331.90424, "t": 473.32291, "r": 337.90903, "b": 483.45331, "coord_origin": "TOPLEFT"}, "row_span": 3, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "2", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "picture", "id": 16, "page_no": 0, "cluster": {"id": 16, "label": "picture", "bbox": {"l": 315.65362548828125, "t": 228.723388671875, "r": 537.1475219726562, "b": 302.8014221191406, "coord_origin": "TOPLEFT"}, "confidence": 0.608779788017273, "cells": [{"id": 97, "text": "1", "bbox": {"l": 451.9457100000001, "t": 235.34704999999997, "r": 457.95050000000003, "b": 245.47748, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "2", "bbox": {"l": 331.19681, "t": 269.35266, "r": 337.2016, "b": 279.48308999999995, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "3", "bbox": {"l": 384.0329, "t": 252.67895999999996, "r": 390.03769, "b": 262.80939, "coord_origin": "TOPLEFT"}}], "children": [{"id": 62, "label": "text", "bbox": {"l": 451.9457100000001, "t": 235.34704999999997, "r": 457.95050000000003, "b": 245.47748, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "1", "bbox": {"l": 451.9457100000001, "t": 235.34704999999997, "r": 457.95050000000003, "b": 245.47748, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 331.19681, "t": 269.35266, "r": 337.2016, "b": 279.48308999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "2", "bbox": {"l": 331.19681, "t": 269.35266, "r": 337.2016, "b": 279.48308999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 384.0329, "t": 252.67895999999996, "r": 390.03769, "b": 262.80939, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "3", "bbox": {"l": 384.0329, "t": 252.67895999999996, "r": 390.03769, "b": 262.80939, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "table", "id": 15, "page_no": 0, "cluster": {"id": 15, "label": "table", "bbox": {"l": 315.65362548828125, "t": 228.723388671875, "r": 537.1475219726562, "b": 302.8014221191406, "coord_origin": "TOPLEFT"}, "confidence": 0.6515864729881287, "cells": [{"id": 97, "text": "1", "bbox": {"l": 451.9457100000001, "t": 235.34704999999997, "r": 457.95050000000003, "b": 245.47748, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "2", "bbox": {"l": 331.19681, "t": 269.35266, "r": 337.2016, "b": 279.48308999999995, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "3", "bbox": {"l": 384.0329, "t": 252.67895999999996, "r": 390.03769, "b": 262.80939, "coord_origin": "TOPLEFT"}}], "children": [{"id": 62, "label": "text", "bbox": {"l": 451.9457100000001, "t": 235.34704999999997, "r": 457.95050000000003, "b": 245.47748, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "1", "bbox": {"l": 451.9457100000001, "t": 235.34704999999997, "r": 457.95050000000003, "b": 245.47748, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 331.19681, "t": 269.35266, "r": 337.2016, "b": 279.48308999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "2", "bbox": {"l": 331.19681, "t": 269.35266, "r": 337.2016, "b": 279.48308999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 384.0329, "t": 252.67895999999996, "r": 390.03769, "b": 262.80939, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "3", "bbox": {"l": 384.0329, "t": 252.67895999999996, "r": 390.03769, "b": 262.80939, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ecel", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "ucel", "fcel", "fcel", "fcel", "fcel", "nl", "ucel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 1, "num_cols": 2, "table_cells": [{"bbox": {"l": 451.9457100000001, "t": 235.34704999999997, "r": 457.95050000000003, "b": 245.47748, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "1", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 384.0329, "t": 252.67895999999996, "r": 390.03769, "b": 262.80939, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3", "column_header": true, "row_header": false, "row_section": false}]}, {"label": "caption", "id": 6, "page_no": 0, "cluster": {"id": 6, "label": "caption", "bbox": {"l": 308.862, "t": 514.50037, "r": 545.11517, "b": 559.2729, "coord_origin": "TOPLEFT"}, "confidence": 0.9214619398117065, "cells": [{"id": 106, "text": "Figure 1:", "bbox": {"l": 308.862, "t": 514.50037, "r": 345.73361, "b": 523.40692, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "Picture of a table with subtle, complex features", "bbox": {"l": 353.17566, "t": 514.50037, "r": 545.11511, "b": 523.40692, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "such as (1) multi-column headers, (2) cell with multi-row", "bbox": {"l": 308.862, "t": 526.45535, "r": 545.11511, "b": 535.3619100000001, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "text and (3) cells with no content. Image from PubTabNet", "bbox": {"l": 308.862, "t": 538.41035, "r": 545.11517, "b": 547.31691, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "evaluation set, filename: \u2018PMC2944238 004 02\u2019.", "bbox": {"l": 308.862, "t": 550.36635, "r": 505.6917700000001, "b": 559.2729, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 1: Picture of a table with subtle, complex features such as (1) multi-column headers, (2) cell with multi-row text and (3) cells with no content. Image from PubTabNet evaluation set, filename: 'PMC2944238 004 02'."}, {"label": "text", "id": 0, "page_no": 0, "cluster": {"id": 0, "label": "text", "bbox": {"l": 308.862, "t": 584.40936, "r": 545.11517, "b": 665.04693, "coord_origin": "TOPLEFT"}, "confidence": 0.9848759770393372, "cells": [{"id": 111, "text": "Recently, significant progress has been made with vi-", "bbox": {"l": 320.81699, "t": 584.40936, "r": 545.11493, "b": 593.31592, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "sion based approaches to extract tables in documents. For", "bbox": {"l": 308.862, "t": 596.36436, "r": 545.11517, "b": 605.2709199999999, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "the sake of completeness, the issue of table extraction from", "bbox": {"l": 308.862, "t": 608.31937, "r": 545.11511, "b": 617.22592, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "documents is typically decomposed into two separate chal-", "bbox": {"l": 308.862, "t": 620.27437, "r": 545.11505, "b": 629.18092, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "lenges, i.e.", "bbox": {"l": 308.862, "t": 632.23036, "r": 353.6937, "b": 641.13692, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "(1)", "bbox": {"l": 362.11209, "t": 632.23036, "r": 374.66617, "b": 641.13692, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "finding the location of the table(s) on a", "bbox": {"l": 377.35785, "t": 632.23036, "r": 545.11505, "b": 641.13692, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "document-page and (2) finding the structure of a given table", "bbox": {"l": 308.862, "t": 644.18536, "r": 545.11517, "b": 653.09192, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "in the document.", "bbox": {"l": 308.862, "t": 656.14037, "r": 375.55167, "b": 665.04693, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Recently, significant progress has been made with vision based approaches to extract tables in documents. For the sake of completeness, the issue of table extraction from documents is typically decomposed into two separate challenges, i.e. (1) finding the location of the table(s) on a document-page and (2) finding the structure of a given table in the document."}, {"label": "text", "id": 3, "page_no": 0, "cluster": {"id": 3, "label": "text", "bbox": {"l": 308.862, "t": 668.38036, "r": 545.11511, "b": 713.151932, "coord_origin": "TOPLEFT"}, "confidence": 0.979152262210846, "cells": [{"id": 120, "text": "The first problem is called table-location and has been", "bbox": {"l": 320.81699, "t": 668.38036, "r": 545.11493, "b": 677.28693, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "previously addressed [30, 38, 19, 21, 23, 26, 8] with state-", "bbox": {"l": 308.862, "t": 680.33536, "r": 545.11511, "b": 689.24193, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "of-the-art object-detection networks (e.g. YOLO and later", "bbox": {"l": 308.862, "t": 692.290359, "r": 545.11511, "b": 701.19693, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "on Mask-RCNN [9]). For all practical purposes, it can be", "bbox": {"l": 308.862, "t": 704.245361, "r": 545.11499, "b": 713.151932, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The first problem is called table-location and has been previously addressed [30, 38, 19, 21, 23, 26, 8] with stateof-the-art object-detection networks (e.g. YOLO and later on Mask-RCNN [9]). For all practical purposes, it can be"}, {"label": "page_footer", "id": 12, "page_no": 0, "cluster": {"id": 12, "label": "page_footer", "bbox": {"l": 295.121, "t": 734.133366, "r": 300.10229, "b": 743.039928, "coord_origin": "TOPLEFT"}, "confidence": 0.8045893311500549, "cells": [{"id": 124, "text": "1", "bbox": {"l": 295.121, "t": 734.133366, "r": 300.10229, "b": 743.039928, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1"}, {"label": "page_header", "id": 9, "page_no": 0, "cluster": {"id": 9, "label": "page_header", "bbox": {"l": 18.340221, "t": 207.82001000000002, "r": 36.339779, "b": 560.00003, "coord_origin": "TOPLEFT"}, "confidence": 0.8773143887519836, "cells": [{"id": 125, "text": "arXiv:2203.01017v2 [cs.CV] 11 Mar 2022", "bbox": {"l": 18.340221, "t": 207.82001000000002, "r": 36.339779, "b": 560.00003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "arXiv:2203.01017v2 [cs.CV] 11 Mar 2022"}], "body": [{"label": "section_header", "id": 8, "page_no": 0, "cluster": {"id": 8, "label": "section_header", "bbox": {"l": 96.301003, "t": 107.03412000000003, "r": 498.92708999999996, "b": 119.93133999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.8868067860603333, "cells": [{"id": 0, "text": "TableFormer: Table Structure Understanding with Transformers.", "bbox": {"l": 96.301003, "t": 107.03412000000003, "r": 498.92708999999996, "b": 119.93133999999998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "TableFormer: Table Structure Understanding with Transformers."}, {"label": "section_header", "id": 13, "page_no": 0, "cluster": {"id": 13, "label": "section_header", "bbox": {"l": 142.47701, "t": 146.68535999999995, "r": 452.75027, "b": 171.32037000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.7586215734481812, "cells": [{"id": 1, "text": "Ahmed Nassar, Nikolaos Livathinos, Maksym Lysak, Peter Staar", "bbox": {"l": 142.47701, "t": 146.68535999999995, "r": 452.75027, "b": 157.37334999999996, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "IBM Research", "bbox": {"l": 262.918, "t": 160.63239, "r": 332.30597, "b": 171.32037000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Ahmed Nassar, Nikolaos Livathinos, Maksym Lysak, Peter Staar IBM Research"}, {"label": "key_value_region", "id": 25, "page_no": 0, "cluster": {"id": 25, "label": "key_value_region", "bbox": {"l": 208.123, "t": 175.96123999999998, "r": 378.73257, "b": 184.42553999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.4854728579521179, "cells": [{"id": 3, "text": "{", "bbox": {"l": 208.123, "t": 175.96123999999998, "r": 212.73083, "b": 184.42553999999996, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "ahn,nli,mly,taa", "bbox": {"l": 212.73, "t": 177.08203000000003, "r": 293.42761, "b": 184.00409000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "}", "bbox": {"l": 293.42798, "t": 175.96123999999998, "r": 298.0358, "b": 184.42553999999996, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "@zurich.ibm.com", "bbox": {"l": 298.03497, "t": 177.08203000000003, "r": 378.73257, "b": 184.00409000000002, "coord_origin": "TOPLEFT"}}], "children": [{"id": 7, "label": "text", "bbox": {"l": 208.123, "t": 175.96123999999998, "r": 378.73257, "b": 184.42553999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9096331596374512, "cells": [{"id": 3, "text": "{", "bbox": {"l": 208.123, "t": 175.96123999999998, "r": 212.73083, "b": 184.42553999999996, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "ahn,nli,mly,taa", "bbox": {"l": 212.73, "t": 177.08203000000003, "r": 293.42761, "b": 184.00409000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "}", "bbox": {"l": 293.42798, "t": 175.96123999999998, "r": 298.0358, "b": 184.42553999999996, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "@zurich.ibm.com", "bbox": {"l": 298.03497, "t": 177.08203000000003, "r": 378.73257, "b": 184.00409000000002, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null}, {"label": "section_header", "id": 5, "page_no": 0, "cluster": {"id": 5, "label": "section_header", "bbox": {"l": 145.99498, "t": 215.48297000000002, "r": 190.48029, "b": 226.23071000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9258671402931213, "cells": [{"id": 7, "text": "Abstract", "bbox": {"l": 145.99498, "t": 215.48297000000002, "r": 190.48029, "b": 226.23071000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Abstract"}, {"label": "text", "id": 2, "page_no": 0, "cluster": {"id": 2, "label": "text", "bbox": {"l": 50.111977, "t": 241.39508, "r": 286.36511, "b": 512.9966400000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9838882088661194, "cells": [{"id": 8, "text": "Tables organize valuable content in a concise and com-", "bbox": {"l": 62.066978, "t": 241.39508, "r": 286.36493, "b": 249.98284999999998, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "pact representation. This content is extremely valuable for", "bbox": {"l": 50.111977, "t": 253.3501, "r": 286.36508, "b": 261.93787, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "systems such as search engines, Knowledge Graph\u2019s, etc,", "bbox": {"l": 50.111977, "t": 265.30511, "r": 286.36508, "b": 273.89288, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "since they enhance their predictive capabilities. Unfortu-", "bbox": {"l": 50.111977, "t": 277.26111000000003, "r": 286.36505, "b": 285.84888, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "nately, tables come in a large variety of shapes and sizes.", "bbox": {"l": 50.111977, "t": 289.21609, "r": 286.36505, "b": 297.80386, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Furthermore, they can have complex column/row-header", "bbox": {"l": 50.111977, "t": 301.17108, "r": 286.36505, "b": 309.75884999999994, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "configurations, multiline rows, different variety of separa-", "bbox": {"l": 50.111977, "t": 313.12607, "r": 286.36508, "b": 321.71384, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "tion lines, missing entries, etc. As such, the correct iden-", "bbox": {"l": 50.111977, "t": 325.08105, "r": 286.36508, "b": 333.66882, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "tification of the table-structure from an image is a non-", "bbox": {"l": 50.111977, "t": 337.03604, "r": 286.36505, "b": 345.62381, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "trivial task. In this paper, we present a new table-structure", "bbox": {"l": 50.111977, "t": 348.99203, "r": 286.36508, "b": 357.5798, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "identification model. The latter improves the latest end-to-", "bbox": {"l": 50.111977, "t": 360.94701999999995, "r": 286.36505, "b": 369.53479, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "end deep learning model (i.e. encoder-dual-decoder from", "bbox": {"l": 50.111977, "t": 372.90201, "r": 286.36508, "b": 381.48978, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "PubTabNet) in two significant ways. First, we introduce a", "bbox": {"l": 50.111977, "t": 384.85699, "r": 286.36505, "b": 393.44476, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "new object detection decoder for table-cells. In this way,", "bbox": {"l": 50.111977, "t": 396.81198, "r": 286.36511, "b": 405.39975000000004, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "we can obtain the content of the table-cells from program-", "bbox": {"l": 50.111977, "t": 408.76697, "r": 286.36508, "b": 417.35474, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "matic PDF\u2019s directly from the PDF source and avoid the", "bbox": {"l": 50.111977, "t": 420.72296000000006, "r": 286.36505, "b": 429.31073, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "training of the custom OCR decoders.", "bbox": {"l": 50.111977, "t": 432.67795, "r": 207.23216, "b": 441.26572, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "This architectural", "bbox": {"l": 214.09639, "t": 432.67795, "r": 286.36508, "b": 441.26572, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "change leads to more accurate table-content extraction and", "bbox": {"l": 50.111977, "t": 444.63293, "r": 286.36508, "b": 453.2207, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "allows us to tackle non-english tables. Second, we replace", "bbox": {"l": 50.111977, "t": 456.58792000000005, "r": 286.36505, "b": 465.17569, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "the LSTM decoders with transformer based decoders. This", "bbox": {"l": 50.111977, "t": 468.54291, "r": 286.36505, "b": 477.13068, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "upgrade improves significantly the previous state-of-the-art", "bbox": {"l": 50.111977, "t": 480.4989, "r": 286.36508, "b": 489.08667, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "tree-editing-distance-score (TEDS) from 91% to 98.5% on", "bbox": {"l": 50.111977, "t": 492.45389, "r": 286.36505, "b": 501.04166, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "simple tables and from 88.7% to 95% on complex tables.", "bbox": {"l": 50.111977, "t": 504.40887, "r": 276.65152, "b": 512.9966400000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Tables organize valuable content in a concise and compact representation. This content is extremely valuable for systems such as search engines, Knowledge Graph's, etc, since they enhance their predictive capabilities. Unfortunately, tables come in a large variety of shapes and sizes. Furthermore, they can have complex column/row-header configurations, multiline rows, different variety of separation lines, missing entries, etc. As such, the correct identification of the table-structure from an image is a nontrivial task. In this paper, we present a new table-structure identification model. The latter improves the latest end-toend deep learning model (i.e. encoder-dual-decoder from PubTabNet) in two significant ways. First, we introduce a new object detection decoder for table-cells. In this way, we can obtain the content of the table-cells from programmatic PDF's directly from the PDF source and avoid the training of the custom OCR decoders. This architectural change leads to more accurate table-content extraction and allows us to tackle non-english tables. Second, we replace the LSTM decoders with transformer based decoders. This upgrade improves significantly the previous state-of-the-art tree-editing-distance-score (TEDS) from 91% to 98.5% on simple tables and from 88.7% to 95% on complex tables."}, {"label": "section_header", "id": 4, "page_no": 0, "cluster": {"id": 4, "label": "section_header", "bbox": {"l": 50.111977, "t": 539.94276, "r": 126.94804, "b": 550.69049, "coord_origin": "TOPLEFT"}, "confidence": 0.9317677617073059, "cells": [{"id": 32, "text": "1.", "bbox": {"l": 50.111977, "t": 539.94276, "r": 58.121296, "b": 550.69049, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "Introduction", "bbox": {"l": 68.800385, "t": 539.94276, "r": 126.94804, "b": 550.69049, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1. Introduction"}, {"label": "text", "id": 1, "page_no": 0, "cluster": {"id": 1, "label": "text", "bbox": {"l": 50.111977, "t": 560.7832, "r": 286.36508, "b": 713.151779, "coord_origin": "TOPLEFT"}, "confidence": 0.9841895699501038, "cells": [{"id": 34, "text": "The occurrence of tables in documents is ubiquitous.", "bbox": {"l": 62.066978, "t": 560.7832, "r": 286.36496, "b": 569.68976, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "They often summarise quantitative or factual data, which is", "bbox": {"l": 50.111977, "t": 572.7382, "r": 286.36508, "b": 581.64476, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "cumbersome to describe in verbose text but nevertheless ex-", "bbox": {"l": 50.111977, "t": 584.69321, "r": 286.36505, "b": 593.5997600000001, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "tremely valuable. Unfortunately, this compact representa-", "bbox": {"l": 50.111977, "t": 596.6492000000001, "r": 286.36505, "b": 605.55576, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "tion is often not easy to parse by machines. There are many", "bbox": {"l": 50.111977, "t": 608.6042, "r": 286.36505, "b": 617.51076, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "implicit conventions used to obtain a compact table repre-", "bbox": {"l": 50.111977, "t": 620.5592, "r": 286.36505, "b": 629.46576, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "sentation. For example, tables often have complex column-", "bbox": {"l": 50.111977, "t": 632.51421, "r": 286.36508, "b": 641.42076, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "and row-headers in order to reduce duplicated cell content.", "bbox": {"l": 50.111977, "t": 644.46921, "r": 286.36508, "b": 653.37576, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "Lines of different shapes and sizes are leveraged to separate", "bbox": {"l": 50.111977, "t": 656.42421, "r": 286.36502, "b": 665.33077, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "content or indicate a tree structure. Additionally, tables can", "bbox": {"l": 50.111977, "t": 668.3802000000001, "r": 286.36505, "b": 677.28677, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "also have empty/missing table-entries or multi-row textual", "bbox": {"l": 50.111977, "t": 680.33521, "r": 286.36505, "b": 689.2417800000001, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "table-entries. Fig. 1 shows a table which presents all these", "bbox": {"l": 50.111977, "t": 692.290207, "r": 286.36505, "b": 701.196777, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "issues.", "bbox": {"l": 50.111977, "t": 704.245209, "r": 76.403275, "b": 713.151779, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The occurrence of tables in documents is ubiquitous. They often summarise quantitative or factual data, which is cumbersome to describe in verbose text but nevertheless extremely valuable. Unfortunately, this compact representation is often not easy to parse by machines. There are many implicit conventions used to obtain a compact table representation. For example, tables often have complex columnand row-headers in order to reduce duplicated cell content. Lines of different shapes and sizes are leveraged to separate content or indicate a tree structure. Additionally, tables can also have empty/missing table-entries or multi-row textual table-entries. Fig. 1 shows a table which presents all these issues."}, {"label": "section_header", "id": 14, "page_no": 0, "cluster": {"id": 14, "label": "section_header", "bbox": {"l": 315.56702, "t": 218.00684, "r": 408.4407, "b": 226.75482, "coord_origin": "TOPLEFT"}, "confidence": 0.6724023818969727, "cells": [{"id": 47, "text": "a.", "bbox": {"l": 315.56702, "t": 218.00684, "r": 324.01007, "b": 226.75482, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Picture of a table:", "bbox": {"l": 328.2316, "t": 218.00684, "r": 408.4407, "b": 226.75482, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "a. Picture of a table:"}, {"label": "list_item", "id": 17, "page_no": 0, "cluster": {"id": 17, "label": "list_item", "bbox": {"l": 315.56702, "t": 313.69478999999995, "r": 486.40194999999994, "b": 333.2428, "coord_origin": "TOPLEFT"}, "confidence": 0.5549328923225403, "cells": [{"id": 49, "text": "b.", "bbox": {"l": 315.56702, "t": 313.69478999999995, "r": 325.05786, "b": 322.44281, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Red-annotation of bounding boxes,", "bbox": {"l": 329.80325, "t": 313.69478999999995, "r": 486.40194999999994, "b": 322.44281, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Blue-predictions by TableFormer", "bbox": {"l": 326.46252, "t": 324.49478, "r": 472.47411999999997, "b": 333.2428, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "b. Red-annotation of bounding boxes, Blue-predictions by TableFormer"}, {"label": "list_item", "id": 18, "page_no": 0, "cluster": {"id": 18, "label": "list_item", "bbox": {"l": 315.56702, "t": 420.1828, "r": 491.1912500000001, "b": 428.93082, "coord_origin": "TOPLEFT"}, "confidence": 0.5501358509063721, "cells": [{"id": 52, "text": "c.", "bbox": {"l": 315.56702, "t": 420.1828, "r": 324.81039, "b": 428.93082, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Structure predicted by TableFormer:", "bbox": {"l": 329.4321, "t": 420.1828, "r": 491.1912500000001, "b": 428.93082, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "c. Structure predicted by TableFormer:"}, {"label": "picture", "id": 10, "page_no": 0, "cluster": {"id": 10, "label": "picture", "bbox": {"l": 314.78173828125, "t": 338.0652770996094, "r": 539.1802978515625, "b": 410.0494384765625, "coord_origin": "TOPLEFT"}, "confidence": 0.8742761611938477, "cells": [{"id": 54, "text": "1", "bbox": {"l": 408.14752, "t": 342.82828, "r": 412.54001, "b": 351.61322, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "0", "bbox": {"l": 356.11011, "t": 341.57217, "r": 360.50259, "b": 350.35712, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "2", "bbox": {"l": 500.6777, "t": 340.93768, "r": 505.0701900000001, "b": 349.7226299999999, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "3", "bbox": {"l": 356.13382, "t": 351.74789, "r": 360.52631, "b": 360.53284, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "4", "bbox": {"l": 402.53992, "t": 355.8765, "r": 406.9324, "b": 364.66144, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "5", "bbox": {"l": 448.58178999999996, "t": 352.84018, "r": 452.97427, "b": 361.62512, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "6", "bbox": {"l": 491.65161000000006, "t": 353.70657, "r": 496.0441, "b": 362.49152, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "7", "bbox": {"l": 535.13843, "t": 353.33969, "r": 539.53088, "b": 362.12463, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "8", "bbox": {"l": 348.82822, "t": 387.09781, "r": 353.2207, "b": 395.88275, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "9", "bbox": {"l": 389.27151, "t": 375.37228, "r": 393.664, "b": 384.15723, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "10", "bbox": {"l": 442.67479999999995, "t": 375.64621, "r": 451.45889000000005, "b": 384.43115, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "11", "bbox": {"l": 477.4382299999999, "t": 375.534, "r": 485.90167, "b": 384.31894000000005, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "12", "bbox": {"l": 522.57263, "t": 375.64621, "r": 531.35669, "b": 384.43115, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "13", "bbox": {"l": 400.22992, "t": 387.11429, "r": 409.01401, "b": 395.89923, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "14", "bbox": {"l": 442.30792, "t": 386.98981000000003, "r": 451.0920100000001, "b": 395.77475000000004, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "15", "bbox": {"l": 478.21941999999996, "t": 387.37469, "r": 487.00351000000006, "b": 396.15964, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "16", "bbox": {"l": 523.2287, "t": 386.98981000000003, "r": 532.01276, "b": 395.77475000000004, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "1", "bbox": {"l": 411.57233, "t": 399.42477, "r": 415.96481, "b": 408.20972, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "7", "bbox": {"l": 415.96393, "t": 399.42477, "r": 420.35641, "b": 408.20972, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "18", "bbox": {"l": 442.30521, "t": 399.0371999999999, "r": 451.08929, "b": 407.82213999999993, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "19", "bbox": {"l": 478.77893, "t": 398.99639999999994, "r": 487.56302, "b": 407.78133999999994, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "20", "bbox": {"l": 523.97241, "t": 398.6114799999999, "r": 532.75647, "b": 407.39642, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "3", "bbox": {"l": 385.09399, "t": 357.76030999999995, "r": 391.09879, "b": 367.89072, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "2", "bbox": {"l": 333.43451, "t": 380.7265, "r": 339.4393, "b": 390.85689999999994, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "1", "bbox": {"l": 478.07210999999995, "t": 341.0368000000001, "r": 484.0769, "b": 351.16720999999995, "coord_origin": "TOPLEFT"}}], "children": [{"id": 19, "label": "text", "bbox": {"l": 408.14752, "t": 342.82828, "r": 412.54001, "b": 351.61322, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "1", "bbox": {"l": 408.14752, "t": 342.82828, "r": 412.54001, "b": 351.61322, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 356.11011, "t": 341.57217, "r": 360.50259, "b": 350.35712, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "0", "bbox": {"l": 356.11011, "t": 341.57217, "r": 360.50259, "b": 350.35712, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 500.6777, "t": 340.93768, "r": 505.0701900000001, "b": 349.7226299999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "2", "bbox": {"l": 500.6777, "t": 340.93768, "r": 505.0701900000001, "b": 349.7226299999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 356.13382, "t": 351.74789, "r": 360.52631, "b": 360.53284, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "3", "bbox": {"l": 356.13382, "t": 351.74789, "r": 360.52631, "b": 360.53284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 402.53992, "t": 355.8765, "r": 406.9324, "b": 364.66144, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "4", "bbox": {"l": 402.53992, "t": 355.8765, "r": 406.9324, "b": 364.66144, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 448.58178999999996, "t": 352.84018, "r": 452.97427, "b": 361.62512, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "5", "bbox": {"l": 448.58178999999996, "t": 352.84018, "r": 452.97427, "b": 361.62512, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 491.65161000000006, "t": 353.70657, "r": 496.0441, "b": 362.49152, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "6", "bbox": {"l": 491.65161000000006, "t": 353.70657, "r": 496.0441, "b": 362.49152, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 535.13843, "t": 353.33969, "r": 539.53088, "b": 362.12463, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "7", "bbox": {"l": 535.13843, "t": 353.33969, "r": 539.53088, "b": 362.12463, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 348.82822, "t": 387.09781, "r": 353.2207, "b": 395.88275, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "8", "bbox": {"l": 348.82822, "t": 387.09781, "r": 353.2207, "b": 395.88275, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 389.27151, "t": 375.37228, "r": 393.664, "b": 384.15723, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "9", "bbox": {"l": 389.27151, "t": 375.37228, "r": 393.664, "b": 384.15723, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 442.67479999999995, "t": 375.64621, "r": 451.45889000000005, "b": 384.43115, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "10", "bbox": {"l": 442.67479999999995, "t": 375.64621, "r": 451.45889000000005, "b": 384.43115, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 477.4382299999999, "t": 375.534, "r": 485.90167, "b": 384.31894000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "11", "bbox": {"l": 477.4382299999999, "t": 375.534, "r": 485.90167, "b": 384.31894000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 522.57263, "t": 375.64621, "r": 531.35669, "b": 384.43115, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "12", "bbox": {"l": 522.57263, "t": 375.64621, "r": 531.35669, "b": 384.43115, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 400.22992, "t": 387.11429, "r": 409.01401, "b": 395.89923, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "13", "bbox": {"l": 400.22992, "t": 387.11429, "r": 409.01401, "b": 395.89923, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 442.30792, "t": 386.98981000000003, "r": 451.0920100000001, "b": 395.77475000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "14", "bbox": {"l": 442.30792, "t": 386.98981000000003, "r": 451.0920100000001, "b": 395.77475000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 478.21941999999996, "t": 387.37469, "r": 487.00351000000006, "b": 396.15964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "15", "bbox": {"l": 478.21941999999996, "t": 387.37469, "r": 487.00351000000006, "b": 396.15964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 523.2287, "t": 386.98981000000003, "r": 532.01276, "b": 395.77475000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "16", "bbox": {"l": 523.2287, "t": 386.98981000000003, "r": 532.01276, "b": 395.77475000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 411.57233, "t": 399.42477, "r": 415.96481, "b": 408.20972, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "1", "bbox": {"l": 411.57233, "t": 399.42477, "r": 415.96481, "b": 408.20972, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 415.96393, "t": 399.42477, "r": 420.35641, "b": 408.20972, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "7", "bbox": {"l": 415.96393, "t": 399.42477, "r": 420.35641, "b": 408.20972, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 442.30521, "t": 399.0371999999999, "r": 451.08929, "b": 407.82213999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "18", "bbox": {"l": 442.30521, "t": 399.0371999999999, "r": 451.08929, "b": 407.82213999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 478.77893, "t": 398.99639999999994, "r": 487.56302, "b": 407.78133999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "19", "bbox": {"l": 478.77893, "t": 398.99639999999994, "r": 487.56302, "b": 407.78133999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 523.97241, "t": 398.6114799999999, "r": 532.75647, "b": 407.39642, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "20", "bbox": {"l": 523.97241, "t": 398.6114799999999, "r": 532.75647, "b": 407.39642, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 385.09399, "t": 357.76030999999995, "r": 391.09879, "b": 367.89072, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "3", "bbox": {"l": 385.09399, "t": 357.76030999999995, "r": 391.09879, "b": 367.89072, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 333.43451, "t": 380.7265, "r": 339.4393, "b": 390.85689999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "2", "bbox": {"l": 333.43451, "t": 380.7265, "r": 339.4393, "b": 390.85689999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 478.07210999999995, "t": 341.0368000000001, "r": 484.0769, "b": 351.16720999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": "1", "bbox": {"l": 478.07210999999995, "t": 341.0368000000001, "r": 484.0769, "b": 351.16720999999995, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "picture", "id": 23, "page_no": 0, "cluster": {"id": 23, "label": "picture", "bbox": {"l": 315.7172546386719, "t": 433.823486328125, "r": 536.835693359375, "b": 496.0290222167969, "coord_origin": "TOPLEFT"}, "confidence": 0.5088632702827454, "cells": [{"id": 76, "text": "1", "bbox": {"l": 347.24872, "t": 437.68588, "r": 351.6412, "b": 446.47083, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "0", "bbox": {"l": 318.88071, "t": 437.68588, "r": 323.27319, "b": 446.47083, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "2", "bbox": {"l": 394.10422, "t": 437.68588, "r": 398.4967, "b": 446.47083, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "3", "bbox": {"l": 318.77316, "t": 449.5455, "r": 323.16565, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "4", "bbox": {"l": 347.24872, "t": 449.5455, "r": 351.6412, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "5", "bbox": {"l": 394.10422, "t": 449.5455, "r": 398.4967, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "6", "bbox": {"l": 440.95941000000005, "t": 449.5455, "r": 445.3519, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "7", "bbox": {"l": 487.81491, "t": 449.5455, "r": 492.2074, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "8", "bbox": {"l": 318.77316, "t": 473.70425, "r": 323.16565, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "9", "bbox": {"l": 347.24872, "t": 461.8446, "r": 351.6412, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "10", "bbox": {"l": 394.10422, "t": 461.8446, "r": 402.88831, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "11", "bbox": {"l": 440.95941000000005, "t": 461.8446, "r": 449.42285, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "12", "bbox": {"l": 487.81491, "t": 461.8446, "r": 496.599, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "13", "bbox": {"l": 347.24872, "t": 473.70425, "r": 356.03281, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "14", "bbox": {"l": 394.10422, "t": 473.70425, "r": 402.88831, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "15", "bbox": {"l": 440.95941000000005, "t": 473.70425, "r": 449.7435, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "16", "bbox": {"l": 487.81491, "t": 473.70425, "r": 496.599, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "17", "bbox": {"l": 347.24872, "t": 485.12469, "r": 356.03281, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "18", "bbox": {"l": 394.10422, "t": 485.12469, "r": 402.88831, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "19", "bbox": {"l": 440.95941000000005, "t": 485.12469, "r": 449.7435, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "20", "bbox": {"l": 487.81491, "t": 485.12469, "r": 496.599, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "3", "bbox": {"l": 366.70102, "t": 449.12082, "r": 372.70581, "b": 459.25122, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "2", "bbox": {"l": 331.90424, "t": 473.32291, "r": 337.90903, "b": 483.45331, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "1", "bbox": {"l": 459.87621999999993, "t": 437.5936, "r": 465.88101, "b": 447.724, "coord_origin": "TOPLEFT"}}], "children": [{"id": 41, "label": "text", "bbox": {"l": 347.24872, "t": 437.68588, "r": 351.6412, "b": 446.47083, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "1", "bbox": {"l": 347.24872, "t": 437.68588, "r": 351.6412, "b": 446.47083, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 318.88071, "t": 437.68588, "r": 323.27319, "b": 446.47083, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "0", "bbox": {"l": 318.88071, "t": 437.68588, "r": 323.27319, "b": 446.47083, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 394.10422, "t": 437.68588, "r": 398.4967, "b": 446.47083, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "2", "bbox": {"l": 394.10422, "t": 437.68588, "r": 398.4967, "b": 446.47083, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 318.77316, "t": 449.5455, "r": 323.16565, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "3", "bbox": {"l": 318.77316, "t": 449.5455, "r": 323.16565, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 347.24872, "t": 449.5455, "r": 351.6412, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "4", "bbox": {"l": 347.24872, "t": 449.5455, "r": 351.6412, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 394.10422, "t": 449.5455, "r": 398.4967, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "5", "bbox": {"l": 394.10422, "t": 449.5455, "r": 398.4967, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 440.95941000000005, "t": 449.5455, "r": 445.3519, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "6", "bbox": {"l": 440.95941000000005, "t": 449.5455, "r": 445.3519, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 487.81491, "t": 449.5455, "r": 492.2074, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "7", "bbox": {"l": 487.81491, "t": 449.5455, "r": 492.2074, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 318.77316, "t": 473.70425, "r": 323.16565, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "8", "bbox": {"l": 318.77316, "t": 473.70425, "r": 323.16565, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 347.24872, "t": 461.8446, "r": 351.6412, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "9", "bbox": {"l": 347.24872, "t": 461.8446, "r": 351.6412, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 394.10422, "t": 461.8446, "r": 402.88831, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "10", "bbox": {"l": 394.10422, "t": 461.8446, "r": 402.88831, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 440.95941000000005, "t": 461.8446, "r": 449.42285, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "11", "bbox": {"l": 440.95941000000005, "t": 461.8446, "r": 449.42285, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 487.81491, "t": 461.8446, "r": 496.599, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "12", "bbox": {"l": 487.81491, "t": 461.8446, "r": 496.599, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 347.24872, "t": 473.70425, "r": 356.03281, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "13", "bbox": {"l": 347.24872, "t": 473.70425, "r": 356.03281, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 394.10422, "t": 473.70425, "r": 402.88831, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "14", "bbox": {"l": 394.10422, "t": 473.70425, "r": 402.88831, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 440.95941000000005, "t": 473.70425, "r": 449.7435, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "15", "bbox": {"l": 440.95941000000005, "t": 473.70425, "r": 449.7435, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 487.81491, "t": 473.70425, "r": 496.599, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "16", "bbox": {"l": 487.81491, "t": 473.70425, "r": 496.599, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 347.24872, "t": 485.12469, "r": 356.03281, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "17", "bbox": {"l": 347.24872, "t": 485.12469, "r": 356.03281, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 394.10422, "t": 485.12469, "r": 402.88831, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "18", "bbox": {"l": 394.10422, "t": 485.12469, "r": 402.88831, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 440.95941000000005, "t": 485.12469, "r": 449.7435, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "19", "bbox": {"l": 440.95941000000005, "t": 485.12469, "r": 449.7435, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 487.81491, "t": 485.12469, "r": 496.599, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "20", "bbox": {"l": 487.81491, "t": 485.12469, "r": 496.599, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 366.70102, "t": 449.12082, "r": 372.70581, "b": 459.25122, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "3", "bbox": {"l": 366.70102, "t": 449.12082, "r": 372.70581, "b": 459.25122, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 331.90424, "t": 473.32291, "r": 337.90903, "b": 483.45331, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "2", "bbox": {"l": 331.90424, "t": 473.32291, "r": 337.90903, "b": 483.45331, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 459.87621999999993, "t": 437.5936, "r": 465.88101, "b": 447.724, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "1", "bbox": {"l": 459.87621999999993, "t": 437.5936, "r": 465.88101, "b": 447.724, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "table", "id": 11, "page_no": 0, "cluster": {"id": 11, "label": "table", "bbox": {"l": 315.7172546386719, "t": 433.823486328125, "r": 536.835693359375, "b": 496.0290222167969, "coord_origin": "TOPLEFT"}, "confidence": 0.8056110739707947, "cells": [{"id": 76, "text": "1", "bbox": {"l": 347.24872, "t": 437.68588, "r": 351.6412, "b": 446.47083, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "0", "bbox": {"l": 318.88071, "t": 437.68588, "r": 323.27319, "b": 446.47083, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "2", "bbox": {"l": 394.10422, "t": 437.68588, "r": 398.4967, "b": 446.47083, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "3", "bbox": {"l": 318.77316, "t": 449.5455, "r": 323.16565, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "4", "bbox": {"l": 347.24872, "t": 449.5455, "r": 351.6412, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "5", "bbox": {"l": 394.10422, "t": 449.5455, "r": 398.4967, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "6", "bbox": {"l": 440.95941000000005, "t": 449.5455, "r": 445.3519, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "7", "bbox": {"l": 487.81491, "t": 449.5455, "r": 492.2074, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "8", "bbox": {"l": 318.77316, "t": 473.70425, "r": 323.16565, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "9", "bbox": {"l": 347.24872, "t": 461.8446, "r": 351.6412, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "10", "bbox": {"l": 394.10422, "t": 461.8446, "r": 402.88831, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "11", "bbox": {"l": 440.95941000000005, "t": 461.8446, "r": 449.42285, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "12", "bbox": {"l": 487.81491, "t": 461.8446, "r": 496.599, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "13", "bbox": {"l": 347.24872, "t": 473.70425, "r": 356.03281, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "14", "bbox": {"l": 394.10422, "t": 473.70425, "r": 402.88831, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "15", "bbox": {"l": 440.95941000000005, "t": 473.70425, "r": 449.7435, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "16", "bbox": {"l": 487.81491, "t": 473.70425, "r": 496.599, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "17", "bbox": {"l": 347.24872, "t": 485.12469, "r": 356.03281, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "18", "bbox": {"l": 394.10422, "t": 485.12469, "r": 402.88831, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "19", "bbox": {"l": 440.95941000000005, "t": 485.12469, "r": 449.7435, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "20", "bbox": {"l": 487.81491, "t": 485.12469, "r": 496.599, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "3", "bbox": {"l": 366.70102, "t": 449.12082, "r": 372.70581, "b": 459.25122, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "2", "bbox": {"l": 331.90424, "t": 473.32291, "r": 337.90903, "b": 483.45331, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "1", "bbox": {"l": 459.87621999999993, "t": 437.5936, "r": 465.88101, "b": 447.724, "coord_origin": "TOPLEFT"}}], "children": [{"id": 41, "label": "text", "bbox": {"l": 347.24872, "t": 437.68588, "r": 351.6412, "b": 446.47083, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "1", "bbox": {"l": 347.24872, "t": 437.68588, "r": 351.6412, "b": 446.47083, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 318.88071, "t": 437.68588, "r": 323.27319, "b": 446.47083, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "0", "bbox": {"l": 318.88071, "t": 437.68588, "r": 323.27319, "b": 446.47083, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 394.10422, "t": 437.68588, "r": 398.4967, "b": 446.47083, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "2", "bbox": {"l": 394.10422, "t": 437.68588, "r": 398.4967, "b": 446.47083, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 318.77316, "t": 449.5455, "r": 323.16565, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "3", "bbox": {"l": 318.77316, "t": 449.5455, "r": 323.16565, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 347.24872, "t": 449.5455, "r": 351.6412, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "4", "bbox": {"l": 347.24872, "t": 449.5455, "r": 351.6412, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 394.10422, "t": 449.5455, "r": 398.4967, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "5", "bbox": {"l": 394.10422, "t": 449.5455, "r": 398.4967, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 440.95941000000005, "t": 449.5455, "r": 445.3519, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "6", "bbox": {"l": 440.95941000000005, "t": 449.5455, "r": 445.3519, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 487.81491, "t": 449.5455, "r": 492.2074, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "7", "bbox": {"l": 487.81491, "t": 449.5455, "r": 492.2074, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 318.77316, "t": 473.70425, "r": 323.16565, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "8", "bbox": {"l": 318.77316, "t": 473.70425, "r": 323.16565, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 347.24872, "t": 461.8446, "r": 351.6412, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "9", "bbox": {"l": 347.24872, "t": 461.8446, "r": 351.6412, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 394.10422, "t": 461.8446, "r": 402.88831, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "10", "bbox": {"l": 394.10422, "t": 461.8446, "r": 402.88831, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 440.95941000000005, "t": 461.8446, "r": 449.42285, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "11", "bbox": {"l": 440.95941000000005, "t": 461.8446, "r": 449.42285, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 487.81491, "t": 461.8446, "r": 496.599, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "12", "bbox": {"l": 487.81491, "t": 461.8446, "r": 496.599, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 347.24872, "t": 473.70425, "r": 356.03281, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "13", "bbox": {"l": 347.24872, "t": 473.70425, "r": 356.03281, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 394.10422, "t": 473.70425, "r": 402.88831, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "14", "bbox": {"l": 394.10422, "t": 473.70425, "r": 402.88831, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 440.95941000000005, "t": 473.70425, "r": 449.7435, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "15", "bbox": {"l": 440.95941000000005, "t": 473.70425, "r": 449.7435, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 487.81491, "t": 473.70425, "r": 496.599, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "16", "bbox": {"l": 487.81491, "t": 473.70425, "r": 496.599, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 347.24872, "t": 485.12469, "r": 356.03281, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "17", "bbox": {"l": 347.24872, "t": 485.12469, "r": 356.03281, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 394.10422, "t": 485.12469, "r": 402.88831, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "18", "bbox": {"l": 394.10422, "t": 485.12469, "r": 402.88831, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 440.95941000000005, "t": 485.12469, "r": 449.7435, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "19", "bbox": {"l": 440.95941000000005, "t": 485.12469, "r": 449.7435, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 487.81491, "t": 485.12469, "r": 496.599, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "20", "bbox": {"l": 487.81491, "t": 485.12469, "r": 496.599, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 366.70102, "t": 449.12082, "r": 372.70581, "b": 459.25122, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "3", "bbox": {"l": 366.70102, "t": 449.12082, "r": 372.70581, "b": 459.25122, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 331.90424, "t": 473.32291, "r": 337.90903, "b": 483.45331, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "2", "bbox": {"l": 331.90424, "t": 473.32291, "r": 337.90903, "b": 483.45331, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 459.87621999999993, "t": 437.5936, "r": 465.88101, "b": 447.724, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "1", "bbox": {"l": 459.87621999999993, "t": 437.5936, "r": 465.88101, "b": 447.724, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "lcel", "ched", "lcel", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "ucel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "ucel", "nl"], "num_rows": 5, "num_cols": 6, "table_cells": [{"bbox": {"l": 347.24872, "t": 437.68588, "r": 351.6412, "b": 446.47083, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 3, "text": "1", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 318.88071, "t": 437.68588, "r": 323.27319, "b": 446.47083, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "0", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 394.10422, "t": 437.5936, "r": 465.88101, "b": 447.724, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 5, "text": "2 1", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 318.77316, "t": 449.5455, "r": 323.16565, "b": 458.33044, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 347.24872, "t": 449.5455, "r": 351.6412, "b": 458.33044, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 366.70102, "t": 449.12082, "r": 398.4967, "b": 459.25122, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "5 3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.95941000000005, "t": 449.5455, "r": 445.3519, "b": 458.33044, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.81491, "t": 449.5455, "r": 492.2074, "b": 458.33044, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 318.77316, "t": 473.70425, "r": 323.16565, "b": 482.4892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 347.24872, "t": 461.8446, "r": 351.6412, "b": 470.62955, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.10422, "t": 461.8446, "r": 402.88831, "b": 470.62955, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "10", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.95941000000005, "t": 461.8446, "r": 449.42285, "b": 470.62955, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "11", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.81491, "t": 461.8446, "r": 496.599, "b": 470.62955, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "12", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 347.24872, "t": 473.70425, "r": 356.03281, "b": 482.4892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "13", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.10422, "t": 473.70425, "r": 402.88831, "b": 482.4892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "14", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.95941000000005, "t": 473.70425, "r": 449.7435, "b": 482.4892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "15", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.81491, "t": 473.70425, "r": 496.599, "b": 482.4892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "16", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 347.24872, "t": 485.12469, "r": 356.03281, "b": 493.90964, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "17", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.10422, "t": 485.12469, "r": 402.88831, "b": 493.90964, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "18", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.95941000000005, "t": 485.12469, "r": 449.7435, "b": 493.90964, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "19", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.81491, "t": 485.12469, "r": 496.599, "b": 493.90964, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "20", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 331.90424, "t": 473.32291, "r": 337.90903, "b": 483.45331, "coord_origin": "TOPLEFT"}, "row_span": 3, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "2", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "picture", "id": 16, "page_no": 0, "cluster": {"id": 16, "label": "picture", "bbox": {"l": 315.65362548828125, "t": 228.723388671875, "r": 537.1475219726562, "b": 302.8014221191406, "coord_origin": "TOPLEFT"}, "confidence": 0.608779788017273, "cells": [{"id": 97, "text": "1", "bbox": {"l": 451.9457100000001, "t": 235.34704999999997, "r": 457.95050000000003, "b": 245.47748, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "2", "bbox": {"l": 331.19681, "t": 269.35266, "r": 337.2016, "b": 279.48308999999995, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "3", "bbox": {"l": 384.0329, "t": 252.67895999999996, "r": 390.03769, "b": 262.80939, "coord_origin": "TOPLEFT"}}], "children": [{"id": 62, "label": "text", "bbox": {"l": 451.9457100000001, "t": 235.34704999999997, "r": 457.95050000000003, "b": 245.47748, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "1", "bbox": {"l": 451.9457100000001, "t": 235.34704999999997, "r": 457.95050000000003, "b": 245.47748, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 331.19681, "t": 269.35266, "r": 337.2016, "b": 279.48308999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "2", "bbox": {"l": 331.19681, "t": 269.35266, "r": 337.2016, "b": 279.48308999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 384.0329, "t": 252.67895999999996, "r": 390.03769, "b": 262.80939, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "3", "bbox": {"l": 384.0329, "t": 252.67895999999996, "r": 390.03769, "b": 262.80939, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "table", "id": 15, "page_no": 0, "cluster": {"id": 15, "label": "table", "bbox": {"l": 315.65362548828125, "t": 228.723388671875, "r": 537.1475219726562, "b": 302.8014221191406, "coord_origin": "TOPLEFT"}, "confidence": 0.6515864729881287, "cells": [{"id": 97, "text": "1", "bbox": {"l": 451.9457100000001, "t": 235.34704999999997, "r": 457.95050000000003, "b": 245.47748, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "2", "bbox": {"l": 331.19681, "t": 269.35266, "r": 337.2016, "b": 279.48308999999995, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "3", "bbox": {"l": 384.0329, "t": 252.67895999999996, "r": 390.03769, "b": 262.80939, "coord_origin": "TOPLEFT"}}], "children": [{"id": 62, "label": "text", "bbox": {"l": 451.9457100000001, "t": 235.34704999999997, "r": 457.95050000000003, "b": 245.47748, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "1", "bbox": {"l": 451.9457100000001, "t": 235.34704999999997, "r": 457.95050000000003, "b": 245.47748, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 331.19681, "t": 269.35266, "r": 337.2016, "b": 279.48308999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "2", "bbox": {"l": 331.19681, "t": 269.35266, "r": 337.2016, "b": 279.48308999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 384.0329, "t": 252.67895999999996, "r": 390.03769, "b": 262.80939, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "3", "bbox": {"l": 384.0329, "t": 252.67895999999996, "r": 390.03769, "b": 262.80939, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ecel", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "ucel", "fcel", "fcel", "fcel", "fcel", "nl", "ucel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 1, "num_cols": 2, "table_cells": [{"bbox": {"l": 451.9457100000001, "t": 235.34704999999997, "r": 457.95050000000003, "b": 245.47748, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "1", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 384.0329, "t": 252.67895999999996, "r": 390.03769, "b": 262.80939, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3", "column_header": true, "row_header": false, "row_section": false}]}, {"label": "caption", "id": 6, "page_no": 0, "cluster": {"id": 6, "label": "caption", "bbox": {"l": 308.862, "t": 514.50037, "r": 545.11517, "b": 559.2729, "coord_origin": "TOPLEFT"}, "confidence": 0.9214619398117065, "cells": [{"id": 106, "text": "Figure 1:", "bbox": {"l": 308.862, "t": 514.50037, "r": 345.73361, "b": 523.40692, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "Picture of a table with subtle, complex features", "bbox": {"l": 353.17566, "t": 514.50037, "r": 545.11511, "b": 523.40692, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "such as (1) multi-column headers, (2) cell with multi-row", "bbox": {"l": 308.862, "t": 526.45535, "r": 545.11511, "b": 535.3619100000001, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "text and (3) cells with no content. Image from PubTabNet", "bbox": {"l": 308.862, "t": 538.41035, "r": 545.11517, "b": 547.31691, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "evaluation set, filename: \u2018PMC2944238 004 02\u2019.", "bbox": {"l": 308.862, "t": 550.36635, "r": 505.6917700000001, "b": 559.2729, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 1: Picture of a table with subtle, complex features such as (1) multi-column headers, (2) cell with multi-row text and (3) cells with no content. Image from PubTabNet evaluation set, filename: 'PMC2944238 004 02'."}, {"label": "text", "id": 0, "page_no": 0, "cluster": {"id": 0, "label": "text", "bbox": {"l": 308.862, "t": 584.40936, "r": 545.11517, "b": 665.04693, "coord_origin": "TOPLEFT"}, "confidence": 0.9848759770393372, "cells": [{"id": 111, "text": "Recently, significant progress has been made with vi-", "bbox": {"l": 320.81699, "t": 584.40936, "r": 545.11493, "b": 593.31592, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "sion based approaches to extract tables in documents. For", "bbox": {"l": 308.862, "t": 596.36436, "r": 545.11517, "b": 605.2709199999999, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "the sake of completeness, the issue of table extraction from", "bbox": {"l": 308.862, "t": 608.31937, "r": 545.11511, "b": 617.22592, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "documents is typically decomposed into two separate chal-", "bbox": {"l": 308.862, "t": 620.27437, "r": 545.11505, "b": 629.18092, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "lenges, i.e.", "bbox": {"l": 308.862, "t": 632.23036, "r": 353.6937, "b": 641.13692, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "(1)", "bbox": {"l": 362.11209, "t": 632.23036, "r": 374.66617, "b": 641.13692, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "finding the location of the table(s) on a", "bbox": {"l": 377.35785, "t": 632.23036, "r": 545.11505, "b": 641.13692, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "document-page and (2) finding the structure of a given table", "bbox": {"l": 308.862, "t": 644.18536, "r": 545.11517, "b": 653.09192, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "in the document.", "bbox": {"l": 308.862, "t": 656.14037, "r": 375.55167, "b": 665.04693, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Recently, significant progress has been made with vision based approaches to extract tables in documents. For the sake of completeness, the issue of table extraction from documents is typically decomposed into two separate challenges, i.e. (1) finding the location of the table(s) on a document-page and (2) finding the structure of a given table in the document."}, {"label": "text", "id": 3, "page_no": 0, "cluster": {"id": 3, "label": "text", "bbox": {"l": 308.862, "t": 668.38036, "r": 545.11511, "b": 713.151932, "coord_origin": "TOPLEFT"}, "confidence": 0.979152262210846, "cells": [{"id": 120, "text": "The first problem is called table-location and has been", "bbox": {"l": 320.81699, "t": 668.38036, "r": 545.11493, "b": 677.28693, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "previously addressed [30, 38, 19, 21, 23, 26, 8] with state-", "bbox": {"l": 308.862, "t": 680.33536, "r": 545.11511, "b": 689.24193, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "of-the-art object-detection networks (e.g. YOLO and later", "bbox": {"l": 308.862, "t": 692.290359, "r": 545.11511, "b": 701.19693, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "on Mask-RCNN [9]). For all practical purposes, it can be", "bbox": {"l": 308.862, "t": 704.245361, "r": 545.11499, "b": 713.151932, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The first problem is called table-location and has been previously addressed [30, 38, 19, 21, 23, 26, 8] with stateof-the-art object-detection networks (e.g. YOLO and later on Mask-RCNN [9]). For all practical purposes, it can be"}], "headers": [{"label": "page_footer", "id": 12, "page_no": 0, "cluster": {"id": 12, "label": "page_footer", "bbox": {"l": 295.121, "t": 734.133366, "r": 300.10229, "b": 743.039928, "coord_origin": "TOPLEFT"}, "confidence": 0.8045893311500549, "cells": [{"id": 124, "text": "1", "bbox": {"l": 295.121, "t": 734.133366, "r": 300.10229, "b": 743.039928, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1"}, {"label": "page_header", "id": 9, "page_no": 0, "cluster": {"id": 9, "label": "page_header", "bbox": {"l": 18.340221, "t": 207.82001000000002, "r": 36.339779, "b": 560.00003, "coord_origin": "TOPLEFT"}, "confidence": 0.8773143887519836, "cells": [{"id": 125, "text": "arXiv:2203.01017v2 [cs.CV] 11 Mar 2022", "bbox": {"l": 18.340221, "t": 207.82001000000002, "r": 36.339779, "b": 560.00003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "arXiv:2203.01017v2 [cs.CV] 11 Mar 2022"}]}}, {"page_no": 1, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "considered as a solved problem, given enough ground-truth", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 286.36505, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "data to train on.", "bbox": {"l": 50.112, "t": 87.16339000000005, "r": 112.64721999999999, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "The second problem is called table-structure decompo-", "bbox": {"l": 62.067001, "t": 99.57141000000001, "r": 286.36496, "b": 108.47797000000003, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "sition.", "bbox": {"l": 50.112, "t": 111.52643, "r": 74.749512, "b": 120.43297999999993, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "The latter is a long standing problem in the com-", "bbox": {"l": 81.334793, "t": 111.52643, "r": 286.36514, "b": 120.43297999999993, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "munity of document understanding [6, 4, 14]. Contrary to", "bbox": {"l": 50.112, "t": 123.48145, "r": 286.36511, "b": 132.38800000000003, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "the table-location problem, there are no commonly used ap-", "bbox": {"l": 50.112, "t": 135.43646, "r": 286.36511, "b": 144.34302000000002, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "proaches that can easily be re-purposed to solve this prob-", "bbox": {"l": 50.112, "t": 147.39246000000003, "r": 286.36505, "b": 156.29900999999995, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "lem. Lately, a set of new model-architectures has been pro-", "bbox": {"l": 50.112, "t": 159.34747000000004, "r": 286.36511, "b": 168.25402999999994, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "posed by the community to address table-structure decom-", "bbox": {"l": 50.112, "t": 171.30249000000003, "r": 286.36508, "b": 180.20905000000005, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "position [37, 36, 18, 20]. All these models have some weak-", "bbox": {"l": 50.112, "t": 183.25751000000002, "r": 286.36511, "b": 192.16405999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "nesses (see Sec. 2). The common denominator here is the", "bbox": {"l": 50.112, "t": 195.21252000000004, "r": 286.36508, "b": 204.11908000000005, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "reliance on textual features and/or the inability to provide", "bbox": {"l": 50.112, "t": 207.16754000000003, "r": 286.36514, "b": 216.07410000000004, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "the bounding box of each table-cell in the original image.", "bbox": {"l": 50.112, "t": 219.12354000000005, "r": 278.66397, "b": 228.03008999999997, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "In this paper, we want to address these weaknesses and", "bbox": {"l": 62.067001, "t": 231.53156, "r": 286.36493, "b": 240.43811000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "present a robust table-structure decomposition algorithm.", "bbox": {"l": 50.112, "t": 243.48657000000003, "r": 286.36511, "b": 252.39313000000004, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "The design criteria for our model are the following. First,", "bbox": {"l": 50.112, "t": 255.44159000000002, "r": 286.36511, "b": 264.34813999999994, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "we want our algorithm to be language agnostic. In this way,", "bbox": {"l": 50.112, "t": 267.39661, "r": 286.36502, "b": 276.30316000000005, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "we can obtain the structure of any table, irregardless of the", "bbox": {"l": 50.112, "t": 279.35155999999995, "r": 286.36508, "b": 288.25815, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "language.", "bbox": {"l": 50.112, "t": 291.30759, "r": 88.567635, "b": 300.21414, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Second, we want our algorithm to leverage as", "bbox": {"l": 95.501602, "t": 291.30759, "r": 286.36505, "b": 300.21414, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "much data as possible from the original PDF document. For", "bbox": {"l": 50.112, "t": 303.26257, "r": 286.36508, "b": 312.16913, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "programmatic PDF documents, the text-cells can often be", "bbox": {"l": 50.112, "t": 315.21756, "r": 286.36511, "b": 324.12411, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "extracted much faster and with higher accuracy compared", "bbox": {"l": 50.112, "t": 327.17255, "r": 286.36505, "b": 336.0791, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "to OCR methods. Last but not least, we want to have a di-", "bbox": {"l": 50.112, "t": 339.12753, "r": 286.36511, "b": 348.03409, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "rect link between the table-cell and its bounding box in the", "bbox": {"l": 50.112, "t": 351.08353, "r": 286.36508, "b": 359.99008, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "image.", "bbox": {"l": 50.112, "t": 363.03851, "r": 76.951241, "b": 371.94507, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "To meet the design criteria listed above, we developed a", "bbox": {"l": 62.067001, "t": 375.4465, "r": 286.36499, "b": 384.35306, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "new model called", "bbox": {"l": 50.112, "t": 387.40149, "r": 120.98594, "b": 396.30804, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "TableFormer", "bbox": {"l": 123.901, "t": 387.28192, "r": 179.7314, "b": 396.23830999999996, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "and a synthetically gener-", "bbox": {"l": 182.646, "t": 387.40149, "r": 286.36658, "b": 396.30804, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "ated table structure dataset called", "bbox": {"l": 50.112, "t": 399.35648, "r": 181.75778, "b": 408.26302999999996, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "SynthTabNet", "bbox": {"l": 184.104, "t": 399.23690999999997, "r": 240.2034, "b": 408.1933, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "$^{1}$. In partic-", "bbox": {"l": 240.20401, "t": 399.35648, "r": 286.36069, "b": 408.26302999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "ular, our contributions in this work can be summarised as", "bbox": {"l": 50.112015, "t": 411.31146, "r": 286.36511, "b": 420.21802, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "follows:", "bbox": {"l": 50.112015, "t": 423.26645, "r": 82.520355, "b": 432.173, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "\u2022", "bbox": {"l": 61.569016, "t": 444.55145, "r": 70.741714, "b": 453.45801, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "We propose", "bbox": {"l": 73.034889, "t": 444.55145, "r": 117.10054, "b": 453.45801, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "TableFormer", "bbox": {"l": 119.59001, "t": 444.43188, "r": 175.42041, "b": 453.38828, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": ", a transformer based model", "bbox": {"l": 175.42102, "t": 444.55145, "r": 286.36453, "b": 453.45801, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "that predicts tables structure and bounding boxes for", "bbox": {"l": 70.037018, "t": 456.50644000000005, "r": 286.3649, "b": 465.41299, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "the table content simultaneously in an end-to-end ap-", "bbox": {"l": 70.037018, "t": 468.46143, "r": 286.3649, "b": 477.36798, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "proach.", "bbox": {"l": 70.037018, "t": 480.41641, "r": 99.635902, "b": 489.32297, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "\u2022", "bbox": {"l": 61.569016, "t": 502.15341, "r": 71.619438, "b": 511.05997, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "Across all benchmark datasets", "bbox": {"l": 74.132042, "t": 502.15341, "r": 196.10396, "b": 511.05997, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "TableFormer", "bbox": {"l": 200.31001, "t": 502.03384, "r": 256.14041, "b": 510.99023, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "signif-", "bbox": {"l": 260.35001, "t": 502.15341, "r": 286.36237, "b": 511.05997, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "icantly outperforms existing state-of-the-art metrics,", "bbox": {"l": 70.037003, "t": 514.1084000000001, "r": 286.3649, "b": 523.01495, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "while being much more efficient in training and infer-", "bbox": {"l": 70.037003, "t": 526.06439, "r": 286.36487, "b": 534.97095, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "ence to existing works.", "bbox": {"l": 70.037003, "t": 538.0193899999999, "r": 161.65305, "b": 546.9259500000001, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "\u2022", "bbox": {"l": 61.569, "t": 559.75639, "r": 71.115913, "b": 568.66295, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "We present", "bbox": {"l": 73.502647, "t": 559.75639, "r": 116.71199, "b": 568.66295, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "SynthTabNet", "bbox": {"l": 121.583, "t": 559.63684, "r": 177.68239, "b": 568.59322, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "a synthetically generated", "bbox": {"l": 182.55301, "t": 559.75639, "r": 286.36328, "b": 568.66295, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "dataset, with various appearance styles and complex-", "bbox": {"l": 70.03701, "t": 571.7114, "r": 286.36493, "b": 580.6179500000001, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "ity.", "bbox": {"l": 70.03701, "t": 583.6664000000001, "r": 82.400597, "b": 592.57295, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "\u2022", "bbox": {"l": 61.569008000000004, "t": 605.4034, "r": 72.332527, "b": 614.30995, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "An augmented dataset based on PubTabNet [37],", "bbox": {"l": 75.023399, "t": 605.4034, "r": 286.36508, "b": 614.30995, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "FinTabNet [36], and TableBank [17] with generated", "bbox": {"l": 70.03701, "t": 617.3584, "r": 286.36487, "b": 626.26495, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "ground-truth for reproducibility.", "bbox": {"l": 70.03701, "t": 629.31439, "r": 198.05641, "b": 638.22095, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "The paper is structured as follows. In Sec. 2, we give", "bbox": {"l": 62.067009000000006, "t": 650.59839, "r": 286.36496, "b": 659.50494, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "a brief overview of the current state-of-the-art. In Sec. 3,", "bbox": {"l": 50.112007, "t": 662.55339, "r": 286.36511, "b": 671.45995, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "we describe the datasets on which we train. In Sec. 4, we", "bbox": {"l": 50.112007, "t": 674.50839, "r": 286.36511, "b": 683.41496, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "introduce the TableFormer model-architecture and describe", "bbox": {"l": 50.112007, "t": 686.46339, "r": 286.36511, "b": 695.369957, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "$^{1}$https://github.com/IBM/SynthTabNet", "bbox": {"l": 60.97100100000001, "t": 705.596275, "r": 183.73055, "b": 712.721542, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "its results & performance in Sec. 5. As a conclusion, we de-", "bbox": {"l": 308.862, "t": 75.20836999999995, "r": 545.11511, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "scribe how this new model-architecture can be re-purposed", "bbox": {"l": 308.862, "t": 87.16339000000005, "r": 545.11505, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "for other tasks in the computer-vision community.", "bbox": {"l": 308.862, "t": 99.11841000000004, "r": 508.08417000000003, "b": 108.02495999999985, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "2.", "bbox": {"l": 308.862, "t": 121.73193000000003, "r": 315.5831, "b": 132.47968000000003, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "Previous work and State of the Art", "bbox": {"l": 324.54456, "t": 121.73193000000003, "r": 498.28021, "b": 132.47968000000003, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "Identifying the structure of a table has been an outstand-", "bbox": {"l": 320.81699, "t": 142.22136999999998, "r": 545.11493, "b": 151.12793, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "ing problem in the document-parsing community, that mo-", "bbox": {"l": 308.862, "t": 154.17638999999997, "r": 545.11505, "b": 163.08294999999998, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "tivates many organised public challenges [6, 4, 14].", "bbox": {"l": 308.862, "t": 166.13140999999996, "r": 522.55975, "b": 175.03796, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "The", "bbox": {"l": 529.62323, "t": 166.13140999999996, "r": 545.11505, "b": 175.03796, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "difficulty of the problem can be attributed to a number of", "bbox": {"l": 308.862, "t": 178.08642999999995, "r": 545.11517, "b": 186.99298, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "factors. First, there is a large variety in the shapes and sizes", "bbox": {"l": 308.862, "t": 190.04143999999997, "r": 545.11511, "b": 198.94799999999998, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "of tables.", "bbox": {"l": 308.862, "t": 201.99645999999996, "r": 346.97891, "b": 210.90301999999997, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "Such large variety requires a flexible method.", "bbox": {"l": 354.86929, "t": 201.99645999999996, "r": 545.11511, "b": 210.90301999999997, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "This is especially true for complex column- and row head-", "bbox": {"l": 308.862, "t": 213.95245, "r": 545.11505, "b": 222.85901, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "ers, which can be extremely intricate and demanding.", "bbox": {"l": 308.862, "t": 225.90747, "r": 530.9184, "b": 234.81403, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "A", "bbox": {"l": 537.92212, "t": 225.90747, "r": 545.11511, "b": 234.81403, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "second factor of complexity is the lack of data with regard", "bbox": {"l": 308.862, "t": 237.86248999999998, "r": 545.11517, "b": 246.76904000000002, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "to table-structure. Until the publication of PubTabNet [37],", "bbox": {"l": 308.862, "t": 249.8175, "r": 545.11511, "b": 258.72406, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "there were no large datasets (i.e.", "bbox": {"l": 308.862, "t": 261.77252, "r": 439.8402699999999, "b": 270.67908, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": ">", "bbox": {"l": 444.43999999999994, "t": 261.61310000000003, "r": 452.1889, "b": 270.45989999999995, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "100", "bbox": {"l": 455.89001, "t": 261.61310000000003, "r": 470.83392000000003, "b": 270.45989999999995, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "K tables) that pro-", "bbox": {"l": 470.83401, "t": 261.77252, "r": 545.11517, "b": 270.67908, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "vided structure information. This happens primarily due to", "bbox": {"l": 308.862, "t": 273.72748, "r": 545.11511, "b": 282.63406, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "the fact that tables are notoriously time-consuming to an-", "bbox": {"l": 308.862, "t": 285.6835, "r": 545.11511, "b": 294.59006, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "notate by hand. However, this has definitely changed in re-", "bbox": {"l": 308.862, "t": 297.63849, "r": 545.11511, "b": 306.54504, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "cent years with the deliverance of PubTabNet [37], FinTab-", "bbox": {"l": 308.862, "t": 309.59348, "r": 545.11517, "b": 318.50003000000004, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "Net [36], TableBank [17] etc.", "bbox": {"l": 308.862, "t": 321.54846, "r": 425.92255, "b": 330.45502, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Before the rising popularity of deep neural networks,", "bbox": {"l": 320.81699, "t": 333.56946, "r": 545.11499, "b": 342.47601, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "the community relied heavily on heuristic and/or statistical", "bbox": {"l": 308.862, "t": 345.52444, "r": 545.11499, "b": 354.43100000000004, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "methods to do table structure identification [3, 7, 11, 5, 13,", "bbox": {"l": 308.862, "t": 357.47943, "r": 545.11517, "b": 366.38599, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "28]. Although such methods work well on constrained ta-", "bbox": {"l": 308.862, "t": 369.43542, "r": 545.11511, "b": 378.34198, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "bles [12], a more data-driven approach can be applied due", "bbox": {"l": 308.862, "t": 381.39041, "r": 545.11505, "b": 390.29697, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "to the advent of convolutional neural networks (CNNs) and", "bbox": {"l": 308.862, "t": 393.3453999999999, "r": 545.11505, "b": 402.25195, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "the availability of large datasets. To the best-of-our knowl-", "bbox": {"l": 308.862, "t": 405.30038, "r": 545.11517, "b": 414.20694, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "edge, there are currently two different types of network ar-", "bbox": {"l": 308.862, "t": 417.25537, "r": 545.11523, "b": 426.16193, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "chitecture that are being pursued for state-of-the-art table-", "bbox": {"l": 308.862, "t": 429.21136000000007, "r": 545.11511, "b": 438.11792, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "structure identification.", "bbox": {"l": 308.862, "t": 441.16635, "r": 401.28503, "b": 450.0729099999999, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "Image-to-Text networks", "bbox": {"l": 320.81699, "t": 453.06778, "r": 423.26236, "b": 462.02417, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": ": In this type of network, one", "bbox": {"l": 423.26697, "t": 453.18735, "r": 545.10956, "b": 462.0939, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "predicts a sequence of tokens starting from an encoded", "bbox": {"l": 308.86197, "t": 465.14233, "r": 545.11511, "b": 474.04889, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "image.", "bbox": {"l": 308.86197, "t": 477.09732, "r": 335.7012, "b": 486.00388, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "Such sequences of tokens can be HTML table", "bbox": {"l": 345.85309, "t": 477.09732, "r": 545.11505, "b": 486.00388, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "tags [37, 17] or LaTeX symbols[10]. The choice of sym-", "bbox": {"l": 308.86197, "t": 489.05231, "r": 545.11493, "b": 497.95886, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "bols is ultimately not very important, since one can be trans-", "bbox": {"l": 308.86197, "t": 501.00729, "r": 545.11499, "b": 509.91385, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "formed into the other. There are however subtle variations", "bbox": {"l": 308.86197, "t": 512.9632899999999, "r": 545.11505, "b": 521.8698400000001, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "in the Image-to-Text networks. The easiest network archi-", "bbox": {"l": 308.86197, "t": 524.91827, "r": 545.11505, "b": 533.82483, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "tectures are \u201cimage-encoder", "bbox": {"l": 308.86197, "t": 536.87328, "r": 420.94119, "b": 545.77983, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "\u2192", "bbox": {"l": 423.59497, "t": 536.1559599999999, "r": 433.5575600000001, "b": 545.56065, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "text-decoder\u201d (IETD), sim-", "bbox": {"l": 436.21198, "t": 536.87328, "r": 545.11316, "b": 545.77983, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "ilar to network architectures that try to provide captions to", "bbox": {"l": 308.86197, "t": 548.82828, "r": 545.11511, "b": 557.73483, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "images [32]. In these IETD networks, one expects as output", "bbox": {"l": 308.86197, "t": 560.78328, "r": 545.11493, "b": 569.68983, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "the LaTeX/HTML string of the entire table, i.e. the sym-", "bbox": {"l": 308.86197, "t": 572.73828, "r": 545.11499, "b": 581.6448399999999, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "bols necessary for creating the table with the content of the", "bbox": {"l": 308.86197, "t": 584.69427, "r": 545.11505, "b": 593.60083, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "table. Another approach is the \u201cimage-encoder", "bbox": {"l": 308.86197, "t": 596.6492800000001, "r": 497.07541, "b": 605.55583, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "\u2192", "bbox": {"l": 499.80496, "t": 595.93196, "r": 509.76755, "b": 605.33665, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "dual de-", "bbox": {"l": 512.50098, "t": 596.6492800000001, "r": 545.10852, "b": 605.55583, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "coder\u201d (IEDD) networks. In these type of networks, one has", "bbox": {"l": 308.86197, "t": 608.60428, "r": 545.11511, "b": 617.5108299999999, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "two consecutive decoders with different purposes. The first", "bbox": {"l": 308.86197, "t": 620.55928, "r": 545.11505, "b": 629.46584, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "decoder is the", "bbox": {"l": 308.86197, "t": 632.51428, "r": 364.78201, "b": 641.42084, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "tag-decoder", "bbox": {"l": 367.57397, "t": 632.60394, "r": 415.61362, "b": 641.1917, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": ", i.e. it only produces the HTM-", "bbox": {"l": 415.61298, "t": 632.51428, "r": 545.11688, "b": 641.42084, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "L/LaTeX tags which construct an empty table. The second", "bbox": {"l": 308.86197, "t": 644.46928, "r": 545.11511, "b": 653.37584, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "content-decoder", "bbox": {"l": 308.86197, "t": 656.51494, "r": 373.59894, "b": 665.1027, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "uses the encoding of the image in combi-", "bbox": {"l": 376.90698, "t": 656.4252799999999, "r": 545.11548, "b": 665.33184, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "nation with the output encoding of each cell-tag (from the", "bbox": {"l": 308.862, "t": 668.38028, "r": 545.11517, "b": 677.28684, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "tag-decoder", "bbox": {"l": 308.862, "t": 680.42494, "r": 356.90164, "b": 689.0127, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": ") to generate the textual content of each table", "bbox": {"l": 357.13101, "t": 680.33528, "r": 545.1153, "b": 689.24184, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "cell. The network architecture of IEDD is certainly more", "bbox": {"l": 308.862, "t": 692.290283, "r": 545.11511, "b": 701.196846, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "elaborate, but it has the advantage that one can pre-train the", "bbox": {"l": 308.862, "t": 704.245285, "r": 545.11517, "b": 713.151848, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "2", "bbox": {"l": 295.121, "t": 734.133282, "r": 300.10229, "b": 743.039845, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 12, "label": "text", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 286.36505, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9656890034675598, "cells": [{"id": 0, "text": "considered as a solved problem, given enough ground-truth", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 286.36505, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "data to train on.", "bbox": {"l": 50.112, "t": 87.16339000000005, "r": 112.64721999999999, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "text", "bbox": {"l": 50.112, "t": 99.57141000000001, "r": 286.36514, "b": 228.03008999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9838606119155884, "cells": [{"id": 2, "text": "The second problem is called table-structure decompo-", "bbox": {"l": 62.067001, "t": 99.57141000000001, "r": 286.36496, "b": 108.47797000000003, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "sition.", "bbox": {"l": 50.112, "t": 111.52643, "r": 74.749512, "b": 120.43297999999993, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "The latter is a long standing problem in the com-", "bbox": {"l": 81.334793, "t": 111.52643, "r": 286.36514, "b": 120.43297999999993, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "munity of document understanding [6, 4, 14]. Contrary to", "bbox": {"l": 50.112, "t": 123.48145, "r": 286.36511, "b": 132.38800000000003, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "the table-location problem, there are no commonly used ap-", "bbox": {"l": 50.112, "t": 135.43646, "r": 286.36511, "b": 144.34302000000002, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "proaches that can easily be re-purposed to solve this prob-", "bbox": {"l": 50.112, "t": 147.39246000000003, "r": 286.36505, "b": 156.29900999999995, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "lem. Lately, a set of new model-architectures has been pro-", "bbox": {"l": 50.112, "t": 159.34747000000004, "r": 286.36511, "b": 168.25402999999994, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "posed by the community to address table-structure decom-", "bbox": {"l": 50.112, "t": 171.30249000000003, "r": 286.36508, "b": 180.20905000000005, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "position [37, 36, 18, 20]. All these models have some weak-", "bbox": {"l": 50.112, "t": 183.25751000000002, "r": 286.36511, "b": 192.16405999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "nesses (see Sec. 2). The common denominator here is the", "bbox": {"l": 50.112, "t": 195.21252000000004, "r": 286.36508, "b": 204.11908000000005, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "reliance on textual features and/or the inability to provide", "bbox": {"l": 50.112, "t": 207.16754000000003, "r": 286.36514, "b": 216.07410000000004, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "the bounding box of each table-cell in the original image.", "bbox": {"l": 50.112, "t": 219.12354000000005, "r": 278.66397, "b": 228.03008999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 50.112, "t": 231.53156, "r": 286.36511, "b": 371.94507, "coord_origin": "TOPLEFT"}, "confidence": 0.9855920076370239, "cells": [{"id": 14, "text": "In this paper, we want to address these weaknesses and", "bbox": {"l": 62.067001, "t": 231.53156, "r": 286.36493, "b": 240.43811000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "present a robust table-structure decomposition algorithm.", "bbox": {"l": 50.112, "t": 243.48657000000003, "r": 286.36511, "b": 252.39313000000004, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "The design criteria for our model are the following. First,", "bbox": {"l": 50.112, "t": 255.44159000000002, "r": 286.36511, "b": 264.34813999999994, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "we want our algorithm to be language agnostic. In this way,", "bbox": {"l": 50.112, "t": 267.39661, "r": 286.36502, "b": 276.30316000000005, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "we can obtain the structure of any table, irregardless of the", "bbox": {"l": 50.112, "t": 279.35155999999995, "r": 286.36508, "b": 288.25815, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "language.", "bbox": {"l": 50.112, "t": 291.30759, "r": 88.567635, "b": 300.21414, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Second, we want our algorithm to leverage as", "bbox": {"l": 95.501602, "t": 291.30759, "r": 286.36505, "b": 300.21414, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "much data as possible from the original PDF document. For", "bbox": {"l": 50.112, "t": 303.26257, "r": 286.36508, "b": 312.16913, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "programmatic PDF documents, the text-cells can often be", "bbox": {"l": 50.112, "t": 315.21756, "r": 286.36511, "b": 324.12411, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "extracted much faster and with higher accuracy compared", "bbox": {"l": 50.112, "t": 327.17255, "r": 286.36505, "b": 336.0791, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "to OCR methods. Last but not least, we want to have a di-", "bbox": {"l": 50.112, "t": 339.12753, "r": 286.36511, "b": 348.03409, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "rect link between the table-cell and its bounding box in the", "bbox": {"l": 50.112, "t": 351.08353, "r": 286.36508, "b": 359.99008, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "image.", "bbox": {"l": 50.112, "t": 363.03851, "r": 76.951241, "b": 371.94507, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "text", "bbox": {"l": 50.112, "t": 375.4465, "r": 286.36658, "b": 432.173, "coord_origin": "TOPLEFT"}, "confidence": 0.9820111393928528, "cells": [{"id": 27, "text": "To meet the design criteria listed above, we developed a", "bbox": {"l": 62.067001, "t": 375.4465, "r": 286.36499, "b": 384.35306, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "new model called", "bbox": {"l": 50.112, "t": 387.40149, "r": 120.98594, "b": 396.30804, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "TableFormer", "bbox": {"l": 123.901, "t": 387.28192, "r": 179.7314, "b": 396.23830999999996, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "and a synthetically gener-", "bbox": {"l": 182.646, "t": 387.40149, "r": 286.36658, "b": 396.30804, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "ated table structure dataset called", "bbox": {"l": 50.112, "t": 399.35648, "r": 181.75778, "b": 408.26302999999996, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "SynthTabNet", "bbox": {"l": 184.104, "t": 399.23690999999997, "r": 240.2034, "b": 408.1933, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "$^{1}$. In partic-", "bbox": {"l": 240.20401, "t": 399.35648, "r": 286.36069, "b": 408.26302999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "ular, our contributions in this work can be summarised as", "bbox": {"l": 50.112015, "t": 411.31146, "r": 286.36511, "b": 420.21802, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "follows:", "bbox": {"l": 50.112015, "t": 423.26645, "r": 82.520355, "b": 432.173, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "list_item", "bbox": {"l": 61.569016, "t": 444.43188, "r": 286.3649, "b": 489.32297, "coord_origin": "TOPLEFT"}, "confidence": 0.9822162389755249, "cells": [{"id": 36, "text": "\u2022", "bbox": {"l": 61.569016, "t": 444.55145, "r": 70.741714, "b": 453.45801, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "We propose", "bbox": {"l": 73.034889, "t": 444.55145, "r": 117.10054, "b": 453.45801, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "TableFormer", "bbox": {"l": 119.59001, "t": 444.43188, "r": 175.42041, "b": 453.38828, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": ", a transformer based model", "bbox": {"l": 175.42102, "t": 444.55145, "r": 286.36453, "b": 453.45801, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "that predicts tables structure and bounding boxes for", "bbox": {"l": 70.037018, "t": 456.50644000000005, "r": 286.3649, "b": 465.41299, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "the table content simultaneously in an end-to-end ap-", "bbox": {"l": 70.037018, "t": 468.46143, "r": 286.3649, "b": 477.36798, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "proach.", "bbox": {"l": 70.037018, "t": 480.41641, "r": 99.635902, "b": 489.32297, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "list_item", "bbox": {"l": 61.569016, "t": 502.03384, "r": 286.3649, "b": 546.9259500000001, "coord_origin": "TOPLEFT"}, "confidence": 0.982271671295166, "cells": [{"id": 43, "text": "\u2022", "bbox": {"l": 61.569016, "t": 502.15341, "r": 71.619438, "b": 511.05997, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "Across all benchmark datasets", "bbox": {"l": 74.132042, "t": 502.15341, "r": 196.10396, "b": 511.05997, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "TableFormer", "bbox": {"l": 200.31001, "t": 502.03384, "r": 256.14041, "b": 510.99023, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "signif-", "bbox": {"l": 260.35001, "t": 502.15341, "r": 286.36237, "b": 511.05997, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "icantly outperforms existing state-of-the-art metrics,", "bbox": {"l": 70.037003, "t": 514.1084000000001, "r": 286.3649, "b": 523.01495, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "while being much more efficient in training and infer-", "bbox": {"l": 70.037003, "t": 526.06439, "r": 286.36487, "b": 534.97095, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "ence to existing works.", "bbox": {"l": 70.037003, "t": 538.0193899999999, "r": 161.65305, "b": 546.9259500000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "list_item", "bbox": {"l": 61.569, "t": 559.63684, "r": 286.36493, "b": 592.57295, "coord_origin": "TOPLEFT"}, "confidence": 0.9802963733673096, "cells": [{"id": 50, "text": "\u2022", "bbox": {"l": 61.569, "t": 559.75639, "r": 71.115913, "b": 568.66295, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "We present", "bbox": {"l": 73.502647, "t": 559.75639, "r": 116.71199, "b": 568.66295, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "SynthTabNet", "bbox": {"l": 121.583, "t": 559.63684, "r": 177.68239, "b": 568.59322, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "a synthetically generated", "bbox": {"l": 182.55301, "t": 559.75639, "r": 286.36328, "b": 568.66295, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "dataset, with various appearance styles and complex-", "bbox": {"l": 70.03701, "t": 571.7114, "r": 286.36493, "b": 580.6179500000001, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "ity.", "bbox": {"l": 70.03701, "t": 583.6664000000001, "r": 82.400597, "b": 592.57295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "list_item", "bbox": {"l": 61.569008000000004, "t": 605.4034, "r": 286.36508, "b": 638.22095, "coord_origin": "TOPLEFT"}, "confidence": 0.9806395173072815, "cells": [{"id": 56, "text": "\u2022", "bbox": {"l": 61.569008000000004, "t": 605.4034, "r": 72.332527, "b": 614.30995, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "An augmented dataset based on PubTabNet [37],", "bbox": {"l": 75.023399, "t": 605.4034, "r": 286.36508, "b": 614.30995, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "FinTabNet [36], and TableBank [17] with generated", "bbox": {"l": 70.03701, "t": 617.3584, "r": 286.36487, "b": 626.26495, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "ground-truth for reproducibility.", "bbox": {"l": 70.03701, "t": 629.31439, "r": 198.05641, "b": 638.22095, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 50.112007, "t": 650.59839, "r": 286.36511, "b": 695.369957, "coord_origin": "TOPLEFT"}, "confidence": 0.9742533564567566, "cells": [{"id": 60, "text": "The paper is structured as follows. In Sec. 2, we give", "bbox": {"l": 62.067009000000006, "t": 650.59839, "r": 286.36496, "b": 659.50494, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "a brief overview of the current state-of-the-art. In Sec. 3,", "bbox": {"l": 50.112007, "t": 662.55339, "r": 286.36511, "b": 671.45995, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "we describe the datasets on which we train. In Sec. 4, we", "bbox": {"l": 50.112007, "t": 674.50839, "r": 286.36511, "b": 683.41496, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "introduce the TableFormer model-architecture and describe", "bbox": {"l": 50.112007, "t": 686.46339, "r": 286.36511, "b": 695.369957, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "footnote", "bbox": {"l": 60.97100100000001, "t": 705.596275, "r": 183.73055, "b": 712.721542, "coord_origin": "TOPLEFT"}, "confidence": 0.895367443561554, "cells": [{"id": 64, "text": "$^{1}$https://github.com/IBM/SynthTabNet", "bbox": {"l": 60.97100100000001, "t": 705.596275, "r": 183.73055, "b": 712.721542, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "text", "bbox": {"l": 308.862, "t": 75.20836999999995, "r": 545.11511, "b": 108.02495999999985, "coord_origin": "TOPLEFT"}, "confidence": 0.9774322509765625, "cells": [{"id": 65, "text": "its results & performance in Sec. 5. As a conclusion, we de-", "bbox": {"l": 308.862, "t": 75.20836999999995, "r": 545.11511, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "scribe how this new model-architecture can be re-purposed", "bbox": {"l": 308.862, "t": 87.16339000000005, "r": 545.11505, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "for other tasks in the computer-vision community.", "bbox": {"l": 308.862, "t": 99.11841000000004, "r": 508.08417000000003, "b": 108.02495999999985, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "section_header", "bbox": {"l": 308.862, "t": 121.73193000000003, "r": 498.28021, "b": 132.47968000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9428724646568298, "cells": [{"id": 68, "text": "2.", "bbox": {"l": 308.862, "t": 121.73193000000003, "r": 315.5831, "b": 132.47968000000003, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "Previous work and State of the Art", "bbox": {"l": 324.54456, "t": 121.73193000000003, "r": 498.28021, "b": 132.47968000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 308.862, "t": 142.22136999999998, "r": 545.11517, "b": 330.45502, "coord_origin": "TOPLEFT"}, "confidence": 0.987194836139679, "cells": [{"id": 70, "text": "Identifying the structure of a table has been an outstand-", "bbox": {"l": 320.81699, "t": 142.22136999999998, "r": 545.11493, "b": 151.12793, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "ing problem in the document-parsing community, that mo-", "bbox": {"l": 308.862, "t": 154.17638999999997, "r": 545.11505, "b": 163.08294999999998, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "tivates many organised public challenges [6, 4, 14].", "bbox": {"l": 308.862, "t": 166.13140999999996, "r": 522.55975, "b": 175.03796, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "The", "bbox": {"l": 529.62323, "t": 166.13140999999996, "r": 545.11505, "b": 175.03796, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "difficulty of the problem can be attributed to a number of", "bbox": {"l": 308.862, "t": 178.08642999999995, "r": 545.11517, "b": 186.99298, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "factors. First, there is a large variety in the shapes and sizes", "bbox": {"l": 308.862, "t": 190.04143999999997, "r": 545.11511, "b": 198.94799999999998, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "of tables.", "bbox": {"l": 308.862, "t": 201.99645999999996, "r": 346.97891, "b": 210.90301999999997, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "Such large variety requires a flexible method.", "bbox": {"l": 354.86929, "t": 201.99645999999996, "r": 545.11511, "b": 210.90301999999997, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "This is especially true for complex column- and row head-", "bbox": {"l": 308.862, "t": 213.95245, "r": 545.11505, "b": 222.85901, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "ers, which can be extremely intricate and demanding.", "bbox": {"l": 308.862, "t": 225.90747, "r": 530.9184, "b": 234.81403, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "A", "bbox": {"l": 537.92212, "t": 225.90747, "r": 545.11511, "b": 234.81403, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "second factor of complexity is the lack of data with regard", "bbox": {"l": 308.862, "t": 237.86248999999998, "r": 545.11517, "b": 246.76904000000002, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "to table-structure. Until the publication of PubTabNet [37],", "bbox": {"l": 308.862, "t": 249.8175, "r": 545.11511, "b": 258.72406, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "there were no large datasets (i.e.", "bbox": {"l": 308.862, "t": 261.77252, "r": 439.8402699999999, "b": 270.67908, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": ">", "bbox": {"l": 444.43999999999994, "t": 261.61310000000003, "r": 452.1889, "b": 270.45989999999995, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "100", "bbox": {"l": 455.89001, "t": 261.61310000000003, "r": 470.83392000000003, "b": 270.45989999999995, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "K tables) that pro-", "bbox": {"l": 470.83401, "t": 261.77252, "r": 545.11517, "b": 270.67908, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "vided structure information. This happens primarily due to", "bbox": {"l": 308.862, "t": 273.72748, "r": 545.11511, "b": 282.63406, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "the fact that tables are notoriously time-consuming to an-", "bbox": {"l": 308.862, "t": 285.6835, "r": 545.11511, "b": 294.59006, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "notate by hand. However, this has definitely changed in re-", "bbox": {"l": 308.862, "t": 297.63849, "r": 545.11511, "b": 306.54504, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "cent years with the deliverance of PubTabNet [37], FinTab-", "bbox": {"l": 308.862, "t": 309.59348, "r": 545.11517, "b": 318.50003000000004, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "Net [36], TableBank [17] etc.", "bbox": {"l": 308.862, "t": 321.54846, "r": 425.92255, "b": 330.45502, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 308.862, "t": 333.56946, "r": 545.11523, "b": 450.0729099999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9869040250778198, "cells": [{"id": 92, "text": "Before the rising popularity of deep neural networks,", "bbox": {"l": 320.81699, "t": 333.56946, "r": 545.11499, "b": 342.47601, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "the community relied heavily on heuristic and/or statistical", "bbox": {"l": 308.862, "t": 345.52444, "r": 545.11499, "b": 354.43100000000004, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "methods to do table structure identification [3, 7, 11, 5, 13,", "bbox": {"l": 308.862, "t": 357.47943, "r": 545.11517, "b": 366.38599, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "28]. Although such methods work well on constrained ta-", "bbox": {"l": 308.862, "t": 369.43542, "r": 545.11511, "b": 378.34198, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "bles [12], a more data-driven approach can be applied due", "bbox": {"l": 308.862, "t": 381.39041, "r": 545.11505, "b": 390.29697, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "to the advent of convolutional neural networks (CNNs) and", "bbox": {"l": 308.862, "t": 393.3453999999999, "r": 545.11505, "b": 402.25195, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "the availability of large datasets. To the best-of-our knowl-", "bbox": {"l": 308.862, "t": 405.30038, "r": 545.11517, "b": 414.20694, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "edge, there are currently two different types of network ar-", "bbox": {"l": 308.862, "t": 417.25537, "r": 545.11523, "b": 426.16193, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "chitecture that are being pursued for state-of-the-art table-", "bbox": {"l": 308.862, "t": 429.21136000000007, "r": 545.11511, "b": 438.11792, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "structure identification.", "bbox": {"l": 308.862, "t": 441.16635, "r": 401.28503, "b": 450.0729099999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 308.86197, "t": 453.06778, "r": 545.11688, "b": 713.151848, "coord_origin": "TOPLEFT"}, "confidence": 0.9843218326568604, "cells": [{"id": 102, "text": "Image-to-Text networks", "bbox": {"l": 320.81699, "t": 453.06778, "r": 423.26236, "b": 462.02417, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": ": In this type of network, one", "bbox": {"l": 423.26697, "t": 453.18735, "r": 545.10956, "b": 462.0939, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "predicts a sequence of tokens starting from an encoded", "bbox": {"l": 308.86197, "t": 465.14233, "r": 545.11511, "b": 474.04889, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "image.", "bbox": {"l": 308.86197, "t": 477.09732, "r": 335.7012, "b": 486.00388, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "Such sequences of tokens can be HTML table", "bbox": {"l": 345.85309, "t": 477.09732, "r": 545.11505, "b": 486.00388, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "tags [37, 17] or LaTeX symbols[10]. The choice of sym-", "bbox": {"l": 308.86197, "t": 489.05231, "r": 545.11493, "b": 497.95886, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "bols is ultimately not very important, since one can be trans-", "bbox": {"l": 308.86197, "t": 501.00729, "r": 545.11499, "b": 509.91385, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "formed into the other. There are however subtle variations", "bbox": {"l": 308.86197, "t": 512.9632899999999, "r": 545.11505, "b": 521.8698400000001, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "in the Image-to-Text networks. The easiest network archi-", "bbox": {"l": 308.86197, "t": 524.91827, "r": 545.11505, "b": 533.82483, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "tectures are \u201cimage-encoder", "bbox": {"l": 308.86197, "t": 536.87328, "r": 420.94119, "b": 545.77983, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "\u2192", "bbox": {"l": 423.59497, "t": 536.1559599999999, "r": 433.5575600000001, "b": 545.56065, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "text-decoder\u201d (IETD), sim-", "bbox": {"l": 436.21198, "t": 536.87328, "r": 545.11316, "b": 545.77983, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "ilar to network architectures that try to provide captions to", "bbox": {"l": 308.86197, "t": 548.82828, "r": 545.11511, "b": 557.73483, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "images [32]. In these IETD networks, one expects as output", "bbox": {"l": 308.86197, "t": 560.78328, "r": 545.11493, "b": 569.68983, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "the LaTeX/HTML string of the entire table, i.e. the sym-", "bbox": {"l": 308.86197, "t": 572.73828, "r": 545.11499, "b": 581.6448399999999, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "bols necessary for creating the table with the content of the", "bbox": {"l": 308.86197, "t": 584.69427, "r": 545.11505, "b": 593.60083, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "table. Another approach is the \u201cimage-encoder", "bbox": {"l": 308.86197, "t": 596.6492800000001, "r": 497.07541, "b": 605.55583, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "\u2192", "bbox": {"l": 499.80496, "t": 595.93196, "r": 509.76755, "b": 605.33665, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "dual de-", "bbox": {"l": 512.50098, "t": 596.6492800000001, "r": 545.10852, "b": 605.55583, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "coder\u201d (IEDD) networks. In these type of networks, one has", "bbox": {"l": 308.86197, "t": 608.60428, "r": 545.11511, "b": 617.5108299999999, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "two consecutive decoders with different purposes. The first", "bbox": {"l": 308.86197, "t": 620.55928, "r": 545.11505, "b": 629.46584, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "decoder is the", "bbox": {"l": 308.86197, "t": 632.51428, "r": 364.78201, "b": 641.42084, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "tag-decoder", "bbox": {"l": 367.57397, "t": 632.60394, "r": 415.61362, "b": 641.1917, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": ", i.e. it only produces the HTM-", "bbox": {"l": 415.61298, "t": 632.51428, "r": 545.11688, "b": 641.42084, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "L/LaTeX tags which construct an empty table. The second", "bbox": {"l": 308.86197, "t": 644.46928, "r": 545.11511, "b": 653.37584, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "content-decoder", "bbox": {"l": 308.86197, "t": 656.51494, "r": 373.59894, "b": 665.1027, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "uses the encoding of the image in combi-", "bbox": {"l": 376.90698, "t": 656.4252799999999, "r": 545.11548, "b": 665.33184, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "nation with the output encoding of each cell-tag (from the", "bbox": {"l": 308.862, "t": 668.38028, "r": 545.11517, "b": 677.28684, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "tag-decoder", "bbox": {"l": 308.862, "t": 680.42494, "r": 356.90164, "b": 689.0127, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": ") to generate the textual content of each table", "bbox": {"l": 357.13101, "t": 680.33528, "r": 545.1153, "b": 689.24184, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "cell. The network architecture of IEDD is certainly more", "bbox": {"l": 308.862, "t": 692.290283, "r": 545.11511, "b": 701.196846, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "elaborate, but it has the advantage that one can pre-train the", "bbox": {"l": 308.862, "t": 704.245285, "r": 545.11517, "b": 713.151848, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "page_footer", "bbox": {"l": 295.121, "t": 734.133282, "r": 300.10229, "b": 743.039845, "coord_origin": "TOPLEFT"}, "confidence": 0.8778094053268433, "cells": [{"id": 134, "text": "2", "bbox": {"l": 295.121, "t": 734.133282, "r": 300.10229, "b": 743.039845, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "text", "id": 12, "page_no": 1, "cluster": {"id": 12, "label": "text", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 286.36505, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9656890034675598, "cells": [{"id": 0, "text": "considered as a solved problem, given enough ground-truth", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 286.36505, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "data to train on.", "bbox": {"l": 50.112, "t": 87.16339000000005, "r": 112.64721999999999, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "considered as a solved problem, given enough ground-truth data to train on."}, {"label": "text", "id": 4, "page_no": 1, "cluster": {"id": 4, "label": "text", "bbox": {"l": 50.112, "t": 99.57141000000001, "r": 286.36514, "b": 228.03008999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9838606119155884, "cells": [{"id": 2, "text": "The second problem is called table-structure decompo-", "bbox": {"l": 62.067001, "t": 99.57141000000001, "r": 286.36496, "b": 108.47797000000003, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "sition.", "bbox": {"l": 50.112, "t": 111.52643, "r": 74.749512, "b": 120.43297999999993, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "The latter is a long standing problem in the com-", "bbox": {"l": 81.334793, "t": 111.52643, "r": 286.36514, "b": 120.43297999999993, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "munity of document understanding [6, 4, 14]. Contrary to", "bbox": {"l": 50.112, "t": 123.48145, "r": 286.36511, "b": 132.38800000000003, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "the table-location problem, there are no commonly used ap-", "bbox": {"l": 50.112, "t": 135.43646, "r": 286.36511, "b": 144.34302000000002, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "proaches that can easily be re-purposed to solve this prob-", "bbox": {"l": 50.112, "t": 147.39246000000003, "r": 286.36505, "b": 156.29900999999995, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "lem. Lately, a set of new model-architectures has been pro-", "bbox": {"l": 50.112, "t": 159.34747000000004, "r": 286.36511, "b": 168.25402999999994, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "posed by the community to address table-structure decom-", "bbox": {"l": 50.112, "t": 171.30249000000003, "r": 286.36508, "b": 180.20905000000005, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "position [37, 36, 18, 20]. All these models have some weak-", "bbox": {"l": 50.112, "t": 183.25751000000002, "r": 286.36511, "b": 192.16405999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "nesses (see Sec. 2). The common denominator here is the", "bbox": {"l": 50.112, "t": 195.21252000000004, "r": 286.36508, "b": 204.11908000000005, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "reliance on textual features and/or the inability to provide", "bbox": {"l": 50.112, "t": 207.16754000000003, "r": 286.36514, "b": 216.07410000000004, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "the bounding box of each table-cell in the original image.", "bbox": {"l": 50.112, "t": 219.12354000000005, "r": 278.66397, "b": 228.03008999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The second problem is called table-structure decomposition. The latter is a long standing problem in the community of document understanding [6, 4, 14]. Contrary to the table-location problem, there are no commonly used approaches that can easily be re-purposed to solve this problem. Lately, a set of new model-architectures has been proposed by the community to address table-structure decomposition [37, 36, 18, 20]. All these models have some weaknesses (see Sec. 2). The common denominator here is the reliance on textual features and/or the inability to provide the bounding box of each table-cell in the original image."}, {"label": "text", "id": 2, "page_no": 1, "cluster": {"id": 2, "label": "text", "bbox": {"l": 50.112, "t": 231.53156, "r": 286.36511, "b": 371.94507, "coord_origin": "TOPLEFT"}, "confidence": 0.9855920076370239, "cells": [{"id": 14, "text": "In this paper, we want to address these weaknesses and", "bbox": {"l": 62.067001, "t": 231.53156, "r": 286.36493, "b": 240.43811000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "present a robust table-structure decomposition algorithm.", "bbox": {"l": 50.112, "t": 243.48657000000003, "r": 286.36511, "b": 252.39313000000004, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "The design criteria for our model are the following. First,", "bbox": {"l": 50.112, "t": 255.44159000000002, "r": 286.36511, "b": 264.34813999999994, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "we want our algorithm to be language agnostic. In this way,", "bbox": {"l": 50.112, "t": 267.39661, "r": 286.36502, "b": 276.30316000000005, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "we can obtain the structure of any table, irregardless of the", "bbox": {"l": 50.112, "t": 279.35155999999995, "r": 286.36508, "b": 288.25815, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "language.", "bbox": {"l": 50.112, "t": 291.30759, "r": 88.567635, "b": 300.21414, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Second, we want our algorithm to leverage as", "bbox": {"l": 95.501602, "t": 291.30759, "r": 286.36505, "b": 300.21414, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "much data as possible from the original PDF document. For", "bbox": {"l": 50.112, "t": 303.26257, "r": 286.36508, "b": 312.16913, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "programmatic PDF documents, the text-cells can often be", "bbox": {"l": 50.112, "t": 315.21756, "r": 286.36511, "b": 324.12411, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "extracted much faster and with higher accuracy compared", "bbox": {"l": 50.112, "t": 327.17255, "r": 286.36505, "b": 336.0791, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "to OCR methods. Last but not least, we want to have a di-", "bbox": {"l": 50.112, "t": 339.12753, "r": 286.36511, "b": 348.03409, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "rect link between the table-cell and its bounding box in the", "bbox": {"l": 50.112, "t": 351.08353, "r": 286.36508, "b": 359.99008, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "image.", "bbox": {"l": 50.112, "t": 363.03851, "r": 76.951241, "b": 371.94507, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In this paper, we want to address these weaknesses and present a robust table-structure decomposition algorithm. The design criteria for our model are the following. First, we want our algorithm to be language agnostic. In this way, we can obtain the structure of any table, irregardless of the language. Second, we want our algorithm to leverage as much data as possible from the original PDF document. For programmatic PDF documents, the text-cells can often be extracted much faster and with higher accuracy compared to OCR methods. Last but not least, we want to have a direct link between the table-cell and its bounding box in the image."}, {"label": "text", "id": 7, "page_no": 1, "cluster": {"id": 7, "label": "text", "bbox": {"l": 50.112, "t": 375.4465, "r": 286.36658, "b": 432.173, "coord_origin": "TOPLEFT"}, "confidence": 0.9820111393928528, "cells": [{"id": 27, "text": "To meet the design criteria listed above, we developed a", "bbox": {"l": 62.067001, "t": 375.4465, "r": 286.36499, "b": 384.35306, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "new model called", "bbox": {"l": 50.112, "t": 387.40149, "r": 120.98594, "b": 396.30804, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "TableFormer", "bbox": {"l": 123.901, "t": 387.28192, "r": 179.7314, "b": 396.23830999999996, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "and a synthetically gener-", "bbox": {"l": 182.646, "t": 387.40149, "r": 286.36658, "b": 396.30804, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "ated table structure dataset called", "bbox": {"l": 50.112, "t": 399.35648, "r": 181.75778, "b": 408.26302999999996, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "SynthTabNet", "bbox": {"l": 184.104, "t": 399.23690999999997, "r": 240.2034, "b": 408.1933, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "$^{1}$. In partic-", "bbox": {"l": 240.20401, "t": 399.35648, "r": 286.36069, "b": 408.26302999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "ular, our contributions in this work can be summarised as", "bbox": {"l": 50.112015, "t": 411.31146, "r": 286.36511, "b": 420.21802, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "follows:", "bbox": {"l": 50.112015, "t": 423.26645, "r": 82.520355, "b": 432.173, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "To meet the design criteria listed above, we developed a new model called TableFormer and a synthetically generated table structure dataset called SynthTabNet $^{1}$. In particular, our contributions in this work can be summarised as follows:"}, {"label": "list_item", "id": 6, "page_no": 1, "cluster": {"id": 6, "label": "list_item", "bbox": {"l": 61.569016, "t": 444.43188, "r": 286.3649, "b": 489.32297, "coord_origin": "TOPLEFT"}, "confidence": 0.9822162389755249, "cells": [{"id": 36, "text": "\u2022", "bbox": {"l": 61.569016, "t": 444.55145, "r": 70.741714, "b": 453.45801, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "We propose", "bbox": {"l": 73.034889, "t": 444.55145, "r": 117.10054, "b": 453.45801, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "TableFormer", "bbox": {"l": 119.59001, "t": 444.43188, "r": 175.42041, "b": 453.38828, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": ", a transformer based model", "bbox": {"l": 175.42102, "t": 444.55145, "r": 286.36453, "b": 453.45801, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "that predicts tables structure and bounding boxes for", "bbox": {"l": 70.037018, "t": 456.50644000000005, "r": 286.3649, "b": 465.41299, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "the table content simultaneously in an end-to-end ap-", "bbox": {"l": 70.037018, "t": 468.46143, "r": 286.3649, "b": 477.36798, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "proach.", "bbox": {"l": 70.037018, "t": 480.41641, "r": 99.635902, "b": 489.32297, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u00b7 We propose TableFormer , a transformer based model that predicts tables structure and bounding boxes for the table content simultaneously in an end-to-end approach."}, {"label": "list_item", "id": 5, "page_no": 1, "cluster": {"id": 5, "label": "list_item", "bbox": {"l": 61.569016, "t": 502.03384, "r": 286.3649, "b": 546.9259500000001, "coord_origin": "TOPLEFT"}, "confidence": 0.982271671295166, "cells": [{"id": 43, "text": "\u2022", "bbox": {"l": 61.569016, "t": 502.15341, "r": 71.619438, "b": 511.05997, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "Across all benchmark datasets", "bbox": {"l": 74.132042, "t": 502.15341, "r": 196.10396, "b": 511.05997, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "TableFormer", "bbox": {"l": 200.31001, "t": 502.03384, "r": 256.14041, "b": 510.99023, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "signif-", "bbox": {"l": 260.35001, "t": 502.15341, "r": 286.36237, "b": 511.05997, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "icantly outperforms existing state-of-the-art metrics,", "bbox": {"l": 70.037003, "t": 514.1084000000001, "r": 286.3649, "b": 523.01495, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "while being much more efficient in training and infer-", "bbox": {"l": 70.037003, "t": 526.06439, "r": 286.36487, "b": 534.97095, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "ence to existing works.", "bbox": {"l": 70.037003, "t": 538.0193899999999, "r": 161.65305, "b": 546.9259500000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u00b7 Across all benchmark datasets TableFormer significantly outperforms existing state-of-the-art metrics, while being much more efficient in training and inference to existing works."}, {"label": "list_item", "id": 9, "page_no": 1, "cluster": {"id": 9, "label": "list_item", "bbox": {"l": 61.569, "t": 559.63684, "r": 286.36493, "b": 592.57295, "coord_origin": "TOPLEFT"}, "confidence": 0.9802963733673096, "cells": [{"id": 50, "text": "\u2022", "bbox": {"l": 61.569, "t": 559.75639, "r": 71.115913, "b": 568.66295, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "We present", "bbox": {"l": 73.502647, "t": 559.75639, "r": 116.71199, "b": 568.66295, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "SynthTabNet", "bbox": {"l": 121.583, "t": 559.63684, "r": 177.68239, "b": 568.59322, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "a synthetically generated", "bbox": {"l": 182.55301, "t": 559.75639, "r": 286.36328, "b": 568.66295, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "dataset, with various appearance styles and complex-", "bbox": {"l": 70.03701, "t": 571.7114, "r": 286.36493, "b": 580.6179500000001, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "ity.", "bbox": {"l": 70.03701, "t": 583.6664000000001, "r": 82.400597, "b": 592.57295, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u00b7 We present SynthTabNet a synthetically generated dataset, with various appearance styles and complexity."}, {"label": "list_item", "id": 8, "page_no": 1, "cluster": {"id": 8, "label": "list_item", "bbox": {"l": 61.569008000000004, "t": 605.4034, "r": 286.36508, "b": 638.22095, "coord_origin": "TOPLEFT"}, "confidence": 0.9806395173072815, "cells": [{"id": 56, "text": "\u2022", "bbox": {"l": 61.569008000000004, "t": 605.4034, "r": 72.332527, "b": 614.30995, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "An augmented dataset based on PubTabNet [37],", "bbox": {"l": 75.023399, "t": 605.4034, "r": 286.36508, "b": 614.30995, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "FinTabNet [36], and TableBank [17] with generated", "bbox": {"l": 70.03701, "t": 617.3584, "r": 286.36487, "b": 626.26495, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "ground-truth for reproducibility.", "bbox": {"l": 70.03701, "t": 629.31439, "r": 198.05641, "b": 638.22095, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u00b7 An augmented dataset based on PubTabNet [37], FinTabNet [36], and TableBank [17] with generated ground-truth for reproducibility."}, {"label": "text", "id": 11, "page_no": 1, "cluster": {"id": 11, "label": "text", "bbox": {"l": 50.112007, "t": 650.59839, "r": 286.36511, "b": 695.369957, "coord_origin": "TOPLEFT"}, "confidence": 0.9742533564567566, "cells": [{"id": 60, "text": "The paper is structured as follows. In Sec. 2, we give", "bbox": {"l": 62.067009000000006, "t": 650.59839, "r": 286.36496, "b": 659.50494, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "a brief overview of the current state-of-the-art. In Sec. 3,", "bbox": {"l": 50.112007, "t": 662.55339, "r": 286.36511, "b": 671.45995, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "we describe the datasets on which we train. In Sec. 4, we", "bbox": {"l": 50.112007, "t": 674.50839, "r": 286.36511, "b": 683.41496, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "introduce the TableFormer model-architecture and describe", "bbox": {"l": 50.112007, "t": 686.46339, "r": 286.36511, "b": 695.369957, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The paper is structured as follows. In Sec. 2, we give a brief overview of the current state-of-the-art. In Sec. 3, we describe the datasets on which we train. In Sec. 4, we introduce the TableFormer model-architecture and describe"}, {"label": "footnote", "id": 14, "page_no": 1, "cluster": {"id": 14, "label": "footnote", "bbox": {"l": 60.97100100000001, "t": 705.596275, "r": 183.73055, "b": 712.721542, "coord_origin": "TOPLEFT"}, "confidence": 0.895367443561554, "cells": [{"id": 64, "text": "$^{1}$https://github.com/IBM/SynthTabNet", "bbox": {"l": 60.97100100000001, "t": 705.596275, "r": 183.73055, "b": 712.721542, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "$^{1}$https://github.com/IBM/SynthTabNet"}, {"label": "text", "id": 10, "page_no": 1, "cluster": {"id": 10, "label": "text", "bbox": {"l": 308.862, "t": 75.20836999999995, "r": 545.11511, "b": 108.02495999999985, "coord_origin": "TOPLEFT"}, "confidence": 0.9774322509765625, "cells": [{"id": 65, "text": "its results & performance in Sec. 5. As a conclusion, we de-", "bbox": {"l": 308.862, "t": 75.20836999999995, "r": 545.11511, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "scribe how this new model-architecture can be re-purposed", "bbox": {"l": 308.862, "t": 87.16339000000005, "r": 545.11505, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "for other tasks in the computer-vision community.", "bbox": {"l": 308.862, "t": 99.11841000000004, "r": 508.08417000000003, "b": 108.02495999999985, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "its results & performance in Sec. 5. As a conclusion, we describe how this new model-architecture can be re-purposed for other tasks in the computer-vision community."}, {"label": "section_header", "id": 13, "page_no": 1, "cluster": {"id": 13, "label": "section_header", "bbox": {"l": 308.862, "t": 121.73193000000003, "r": 498.28021, "b": 132.47968000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9428724646568298, "cells": [{"id": 68, "text": "2.", "bbox": {"l": 308.862, "t": 121.73193000000003, "r": 315.5831, "b": 132.47968000000003, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "Previous work and State of the Art", "bbox": {"l": 324.54456, "t": 121.73193000000003, "r": 498.28021, "b": 132.47968000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2. Previous work and State of the Art"}, {"label": "text", "id": 0, "page_no": 1, "cluster": {"id": 0, "label": "text", "bbox": {"l": 308.862, "t": 142.22136999999998, "r": 545.11517, "b": 330.45502, "coord_origin": "TOPLEFT"}, "confidence": 0.987194836139679, "cells": [{"id": 70, "text": "Identifying the structure of a table has been an outstand-", "bbox": {"l": 320.81699, "t": 142.22136999999998, "r": 545.11493, "b": 151.12793, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "ing problem in the document-parsing community, that mo-", "bbox": {"l": 308.862, "t": 154.17638999999997, "r": 545.11505, "b": 163.08294999999998, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "tivates many organised public challenges [6, 4, 14].", "bbox": {"l": 308.862, "t": 166.13140999999996, "r": 522.55975, "b": 175.03796, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "The", "bbox": {"l": 529.62323, "t": 166.13140999999996, "r": 545.11505, "b": 175.03796, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "difficulty of the problem can be attributed to a number of", "bbox": {"l": 308.862, "t": 178.08642999999995, "r": 545.11517, "b": 186.99298, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "factors. First, there is a large variety in the shapes and sizes", "bbox": {"l": 308.862, "t": 190.04143999999997, "r": 545.11511, "b": 198.94799999999998, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "of tables.", "bbox": {"l": 308.862, "t": 201.99645999999996, "r": 346.97891, "b": 210.90301999999997, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "Such large variety requires a flexible method.", "bbox": {"l": 354.86929, "t": 201.99645999999996, "r": 545.11511, "b": 210.90301999999997, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "This is especially true for complex column- and row head-", "bbox": {"l": 308.862, "t": 213.95245, "r": 545.11505, "b": 222.85901, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "ers, which can be extremely intricate and demanding.", "bbox": {"l": 308.862, "t": 225.90747, "r": 530.9184, "b": 234.81403, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "A", "bbox": {"l": 537.92212, "t": 225.90747, "r": 545.11511, "b": 234.81403, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "second factor of complexity is the lack of data with regard", "bbox": {"l": 308.862, "t": 237.86248999999998, "r": 545.11517, "b": 246.76904000000002, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "to table-structure. Until the publication of PubTabNet [37],", "bbox": {"l": 308.862, "t": 249.8175, "r": 545.11511, "b": 258.72406, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "there were no large datasets (i.e.", "bbox": {"l": 308.862, "t": 261.77252, "r": 439.8402699999999, "b": 270.67908, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": ">", "bbox": {"l": 444.43999999999994, "t": 261.61310000000003, "r": 452.1889, "b": 270.45989999999995, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "100", "bbox": {"l": 455.89001, "t": 261.61310000000003, "r": 470.83392000000003, "b": 270.45989999999995, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "K tables) that pro-", "bbox": {"l": 470.83401, "t": 261.77252, "r": 545.11517, "b": 270.67908, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "vided structure information. This happens primarily due to", "bbox": {"l": 308.862, "t": 273.72748, "r": 545.11511, "b": 282.63406, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "the fact that tables are notoriously time-consuming to an-", "bbox": {"l": 308.862, "t": 285.6835, "r": 545.11511, "b": 294.59006, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "notate by hand. However, this has definitely changed in re-", "bbox": {"l": 308.862, "t": 297.63849, "r": 545.11511, "b": 306.54504, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "cent years with the deliverance of PubTabNet [37], FinTab-", "bbox": {"l": 308.862, "t": 309.59348, "r": 545.11517, "b": 318.50003000000004, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "Net [36], TableBank [17] etc.", "bbox": {"l": 308.862, "t": 321.54846, "r": 425.92255, "b": 330.45502, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Identifying the structure of a table has been an outstanding problem in the document-parsing community, that motivates many organised public challenges [6, 4, 14]. The difficulty of the problem can be attributed to a number of factors. First, there is a large variety in the shapes and sizes of tables. Such large variety requires a flexible method. This is especially true for complex column- and row headers, which can be extremely intricate and demanding. A second factor of complexity is the lack of data with regard to table-structure. Until the publication of PubTabNet [37], there were no large datasets (i.e. > 100 K tables) that provided structure information. This happens primarily due to the fact that tables are notoriously time-consuming to annotate by hand. However, this has definitely changed in recent years with the deliverance of PubTabNet [37], FinTabNet [36], TableBank [17] etc."}, {"label": "text", "id": 1, "page_no": 1, "cluster": {"id": 1, "label": "text", "bbox": {"l": 308.862, "t": 333.56946, "r": 545.11523, "b": 450.0729099999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9869040250778198, "cells": [{"id": 92, "text": "Before the rising popularity of deep neural networks,", "bbox": {"l": 320.81699, "t": 333.56946, "r": 545.11499, "b": 342.47601, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "the community relied heavily on heuristic and/or statistical", "bbox": {"l": 308.862, "t": 345.52444, "r": 545.11499, "b": 354.43100000000004, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "methods to do table structure identification [3, 7, 11, 5, 13,", "bbox": {"l": 308.862, "t": 357.47943, "r": 545.11517, "b": 366.38599, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "28]. Although such methods work well on constrained ta-", "bbox": {"l": 308.862, "t": 369.43542, "r": 545.11511, "b": 378.34198, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "bles [12], a more data-driven approach can be applied due", "bbox": {"l": 308.862, "t": 381.39041, "r": 545.11505, "b": 390.29697, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "to the advent of convolutional neural networks (CNNs) and", "bbox": {"l": 308.862, "t": 393.3453999999999, "r": 545.11505, "b": 402.25195, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "the availability of large datasets. To the best-of-our knowl-", "bbox": {"l": 308.862, "t": 405.30038, "r": 545.11517, "b": 414.20694, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "edge, there are currently two different types of network ar-", "bbox": {"l": 308.862, "t": 417.25537, "r": 545.11523, "b": 426.16193, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "chitecture that are being pursued for state-of-the-art table-", "bbox": {"l": 308.862, "t": 429.21136000000007, "r": 545.11511, "b": 438.11792, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "structure identification.", "bbox": {"l": 308.862, "t": 441.16635, "r": 401.28503, "b": 450.0729099999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Before the rising popularity of deep neural networks, the community relied heavily on heuristic and/or statistical methods to do table structure identification [3, 7, 11, 5, 13, 28]. Although such methods work well on constrained tables [12], a more data-driven approach can be applied due to the advent of convolutional neural networks (CNNs) and the availability of large datasets. To the best-of-our knowledge, there are currently two different types of network architecture that are being pursued for state-of-the-art tablestructure identification."}, {"label": "text", "id": 3, "page_no": 1, "cluster": {"id": 3, "label": "text", "bbox": {"l": 308.86197, "t": 453.06778, "r": 545.11688, "b": 713.151848, "coord_origin": "TOPLEFT"}, "confidence": 0.9843218326568604, "cells": [{"id": 102, "text": "Image-to-Text networks", "bbox": {"l": 320.81699, "t": 453.06778, "r": 423.26236, "b": 462.02417, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": ": In this type of network, one", "bbox": {"l": 423.26697, "t": 453.18735, "r": 545.10956, "b": 462.0939, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "predicts a sequence of tokens starting from an encoded", "bbox": {"l": 308.86197, "t": 465.14233, "r": 545.11511, "b": 474.04889, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "image.", "bbox": {"l": 308.86197, "t": 477.09732, "r": 335.7012, "b": 486.00388, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "Such sequences of tokens can be HTML table", "bbox": {"l": 345.85309, "t": 477.09732, "r": 545.11505, "b": 486.00388, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "tags [37, 17] or LaTeX symbols[10]. The choice of sym-", "bbox": {"l": 308.86197, "t": 489.05231, "r": 545.11493, "b": 497.95886, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "bols is ultimately not very important, since one can be trans-", "bbox": {"l": 308.86197, "t": 501.00729, "r": 545.11499, "b": 509.91385, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "formed into the other. There are however subtle variations", "bbox": {"l": 308.86197, "t": 512.9632899999999, "r": 545.11505, "b": 521.8698400000001, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "in the Image-to-Text networks. The easiest network archi-", "bbox": {"l": 308.86197, "t": 524.91827, "r": 545.11505, "b": 533.82483, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "tectures are \u201cimage-encoder", "bbox": {"l": 308.86197, "t": 536.87328, "r": 420.94119, "b": 545.77983, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "\u2192", "bbox": {"l": 423.59497, "t": 536.1559599999999, "r": 433.5575600000001, "b": 545.56065, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "text-decoder\u201d (IETD), sim-", "bbox": {"l": 436.21198, "t": 536.87328, "r": 545.11316, "b": 545.77983, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "ilar to network architectures that try to provide captions to", "bbox": {"l": 308.86197, "t": 548.82828, "r": 545.11511, "b": 557.73483, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "images [32]. In these IETD networks, one expects as output", "bbox": {"l": 308.86197, "t": 560.78328, "r": 545.11493, "b": 569.68983, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "the LaTeX/HTML string of the entire table, i.e. the sym-", "bbox": {"l": 308.86197, "t": 572.73828, "r": 545.11499, "b": 581.6448399999999, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "bols necessary for creating the table with the content of the", "bbox": {"l": 308.86197, "t": 584.69427, "r": 545.11505, "b": 593.60083, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "table. Another approach is the \u201cimage-encoder", "bbox": {"l": 308.86197, "t": 596.6492800000001, "r": 497.07541, "b": 605.55583, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "\u2192", "bbox": {"l": 499.80496, "t": 595.93196, "r": 509.76755, "b": 605.33665, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "dual de-", "bbox": {"l": 512.50098, "t": 596.6492800000001, "r": 545.10852, "b": 605.55583, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "coder\u201d (IEDD) networks. In these type of networks, one has", "bbox": {"l": 308.86197, "t": 608.60428, "r": 545.11511, "b": 617.5108299999999, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "two consecutive decoders with different purposes. The first", "bbox": {"l": 308.86197, "t": 620.55928, "r": 545.11505, "b": 629.46584, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "decoder is the", "bbox": {"l": 308.86197, "t": 632.51428, "r": 364.78201, "b": 641.42084, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "tag-decoder", "bbox": {"l": 367.57397, "t": 632.60394, "r": 415.61362, "b": 641.1917, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": ", i.e. it only produces the HTM-", "bbox": {"l": 415.61298, "t": 632.51428, "r": 545.11688, "b": 641.42084, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "L/LaTeX tags which construct an empty table. The second", "bbox": {"l": 308.86197, "t": 644.46928, "r": 545.11511, "b": 653.37584, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "content-decoder", "bbox": {"l": 308.86197, "t": 656.51494, "r": 373.59894, "b": 665.1027, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "uses the encoding of the image in combi-", "bbox": {"l": 376.90698, "t": 656.4252799999999, "r": 545.11548, "b": 665.33184, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "nation with the output encoding of each cell-tag (from the", "bbox": {"l": 308.862, "t": 668.38028, "r": 545.11517, "b": 677.28684, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "tag-decoder", "bbox": {"l": 308.862, "t": 680.42494, "r": 356.90164, "b": 689.0127, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": ") to generate the textual content of each table", "bbox": {"l": 357.13101, "t": 680.33528, "r": 545.1153, "b": 689.24184, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "cell. The network architecture of IEDD is certainly more", "bbox": {"l": 308.862, "t": 692.290283, "r": 545.11511, "b": 701.196846, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "elaborate, but it has the advantage that one can pre-train the", "bbox": {"l": 308.862, "t": 704.245285, "r": 545.11517, "b": 713.151848, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Image-to-Text networks : In this type of network, one predicts a sequence of tokens starting from an encoded image. Such sequences of tokens can be HTML table tags [37, 17] or LaTeX symbols[10]. The choice of symbols is ultimately not very important, since one can be transformed into the other. There are however subtle variations in the Image-to-Text networks. The easiest network architectures are \"image-encoder \u2192 text-decoder\" (IETD), similar to network architectures that try to provide captions to images [32]. In these IETD networks, one expects as output the LaTeX/HTML string of the entire table, i.e. the symbols necessary for creating the table with the content of the table. Another approach is the \"image-encoder \u2192 dual decoder\" (IEDD) networks. In these type of networks, one has two consecutive decoders with different purposes. The first decoder is the tag-decoder , i.e. it only produces the HTML/LaTeX tags which construct an empty table. The second content-decoder uses the encoding of the image in combination with the output encoding of each cell-tag (from the tag-decoder ) to generate the textual content of each table cell. The network architecture of IEDD is certainly more elaborate, but it has the advantage that one can pre-train the"}, {"label": "page_footer", "id": 15, "page_no": 1, "cluster": {"id": 15, "label": "page_footer", "bbox": {"l": 295.121, "t": 734.133282, "r": 300.10229, "b": 743.039845, "coord_origin": "TOPLEFT"}, "confidence": 0.8778094053268433, "cells": [{"id": 134, "text": "2", "bbox": {"l": 295.121, "t": 734.133282, "r": 300.10229, "b": 743.039845, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2"}], "body": [{"label": "text", "id": 12, "page_no": 1, "cluster": {"id": 12, "label": "text", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 286.36505, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9656890034675598, "cells": [{"id": 0, "text": "considered as a solved problem, given enough ground-truth", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 286.36505, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "data to train on.", "bbox": {"l": 50.112, "t": 87.16339000000005, "r": 112.64721999999999, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "considered as a solved problem, given enough ground-truth data to train on."}, {"label": "text", "id": 4, "page_no": 1, "cluster": {"id": 4, "label": "text", "bbox": {"l": 50.112, "t": 99.57141000000001, "r": 286.36514, "b": 228.03008999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9838606119155884, "cells": [{"id": 2, "text": "The second problem is called table-structure decompo-", "bbox": {"l": 62.067001, "t": 99.57141000000001, "r": 286.36496, "b": 108.47797000000003, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "sition.", "bbox": {"l": 50.112, "t": 111.52643, "r": 74.749512, "b": 120.43297999999993, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "The latter is a long standing problem in the com-", "bbox": {"l": 81.334793, "t": 111.52643, "r": 286.36514, "b": 120.43297999999993, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "munity of document understanding [6, 4, 14]. Contrary to", "bbox": {"l": 50.112, "t": 123.48145, "r": 286.36511, "b": 132.38800000000003, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "the table-location problem, there are no commonly used ap-", "bbox": {"l": 50.112, "t": 135.43646, "r": 286.36511, "b": 144.34302000000002, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "proaches that can easily be re-purposed to solve this prob-", "bbox": {"l": 50.112, "t": 147.39246000000003, "r": 286.36505, "b": 156.29900999999995, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "lem. Lately, a set of new model-architectures has been pro-", "bbox": {"l": 50.112, "t": 159.34747000000004, "r": 286.36511, "b": 168.25402999999994, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "posed by the community to address table-structure decom-", "bbox": {"l": 50.112, "t": 171.30249000000003, "r": 286.36508, "b": 180.20905000000005, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "position [37, 36, 18, 20]. All these models have some weak-", "bbox": {"l": 50.112, "t": 183.25751000000002, "r": 286.36511, "b": 192.16405999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "nesses (see Sec. 2). The common denominator here is the", "bbox": {"l": 50.112, "t": 195.21252000000004, "r": 286.36508, "b": 204.11908000000005, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "reliance on textual features and/or the inability to provide", "bbox": {"l": 50.112, "t": 207.16754000000003, "r": 286.36514, "b": 216.07410000000004, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "the bounding box of each table-cell in the original image.", "bbox": {"l": 50.112, "t": 219.12354000000005, "r": 278.66397, "b": 228.03008999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The second problem is called table-structure decomposition. The latter is a long standing problem in the community of document understanding [6, 4, 14]. Contrary to the table-location problem, there are no commonly used approaches that can easily be re-purposed to solve this problem. Lately, a set of new model-architectures has been proposed by the community to address table-structure decomposition [37, 36, 18, 20]. All these models have some weaknesses (see Sec. 2). The common denominator here is the reliance on textual features and/or the inability to provide the bounding box of each table-cell in the original image."}, {"label": "text", "id": 2, "page_no": 1, "cluster": {"id": 2, "label": "text", "bbox": {"l": 50.112, "t": 231.53156, "r": 286.36511, "b": 371.94507, "coord_origin": "TOPLEFT"}, "confidence": 0.9855920076370239, "cells": [{"id": 14, "text": "In this paper, we want to address these weaknesses and", "bbox": {"l": 62.067001, "t": 231.53156, "r": 286.36493, "b": 240.43811000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "present a robust table-structure decomposition algorithm.", "bbox": {"l": 50.112, "t": 243.48657000000003, "r": 286.36511, "b": 252.39313000000004, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "The design criteria for our model are the following. First,", "bbox": {"l": 50.112, "t": 255.44159000000002, "r": 286.36511, "b": 264.34813999999994, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "we want our algorithm to be language agnostic. In this way,", "bbox": {"l": 50.112, "t": 267.39661, "r": 286.36502, "b": 276.30316000000005, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "we can obtain the structure of any table, irregardless of the", "bbox": {"l": 50.112, "t": 279.35155999999995, "r": 286.36508, "b": 288.25815, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "language.", "bbox": {"l": 50.112, "t": 291.30759, "r": 88.567635, "b": 300.21414, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Second, we want our algorithm to leverage as", "bbox": {"l": 95.501602, "t": 291.30759, "r": 286.36505, "b": 300.21414, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "much data as possible from the original PDF document. For", "bbox": {"l": 50.112, "t": 303.26257, "r": 286.36508, "b": 312.16913, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "programmatic PDF documents, the text-cells can often be", "bbox": {"l": 50.112, "t": 315.21756, "r": 286.36511, "b": 324.12411, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "extracted much faster and with higher accuracy compared", "bbox": {"l": 50.112, "t": 327.17255, "r": 286.36505, "b": 336.0791, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "to OCR methods. Last but not least, we want to have a di-", "bbox": {"l": 50.112, "t": 339.12753, "r": 286.36511, "b": 348.03409, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "rect link between the table-cell and its bounding box in the", "bbox": {"l": 50.112, "t": 351.08353, "r": 286.36508, "b": 359.99008, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "image.", "bbox": {"l": 50.112, "t": 363.03851, "r": 76.951241, "b": 371.94507, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In this paper, we want to address these weaknesses and present a robust table-structure decomposition algorithm. The design criteria for our model are the following. First, we want our algorithm to be language agnostic. In this way, we can obtain the structure of any table, irregardless of the language. Second, we want our algorithm to leverage as much data as possible from the original PDF document. For programmatic PDF documents, the text-cells can often be extracted much faster and with higher accuracy compared to OCR methods. Last but not least, we want to have a direct link between the table-cell and its bounding box in the image."}, {"label": "text", "id": 7, "page_no": 1, "cluster": {"id": 7, "label": "text", "bbox": {"l": 50.112, "t": 375.4465, "r": 286.36658, "b": 432.173, "coord_origin": "TOPLEFT"}, "confidence": 0.9820111393928528, "cells": [{"id": 27, "text": "To meet the design criteria listed above, we developed a", "bbox": {"l": 62.067001, "t": 375.4465, "r": 286.36499, "b": 384.35306, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "new model called", "bbox": {"l": 50.112, "t": 387.40149, "r": 120.98594, "b": 396.30804, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "TableFormer", "bbox": {"l": 123.901, "t": 387.28192, "r": 179.7314, "b": 396.23830999999996, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "and a synthetically gener-", "bbox": {"l": 182.646, "t": 387.40149, "r": 286.36658, "b": 396.30804, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "ated table structure dataset called", "bbox": {"l": 50.112, "t": 399.35648, "r": 181.75778, "b": 408.26302999999996, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "SynthTabNet", "bbox": {"l": 184.104, "t": 399.23690999999997, "r": 240.2034, "b": 408.1933, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "$^{1}$. In partic-", "bbox": {"l": 240.20401, "t": 399.35648, "r": 286.36069, "b": 408.26302999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "ular, our contributions in this work can be summarised as", "bbox": {"l": 50.112015, "t": 411.31146, "r": 286.36511, "b": 420.21802, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "follows:", "bbox": {"l": 50.112015, "t": 423.26645, "r": 82.520355, "b": 432.173, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "To meet the design criteria listed above, we developed a new model called TableFormer and a synthetically generated table structure dataset called SynthTabNet $^{1}$. In particular, our contributions in this work can be summarised as follows:"}, {"label": "list_item", "id": 6, "page_no": 1, "cluster": {"id": 6, "label": "list_item", "bbox": {"l": 61.569016, "t": 444.43188, "r": 286.3649, "b": 489.32297, "coord_origin": "TOPLEFT"}, "confidence": 0.9822162389755249, "cells": [{"id": 36, "text": "\u2022", "bbox": {"l": 61.569016, "t": 444.55145, "r": 70.741714, "b": 453.45801, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "We propose", "bbox": {"l": 73.034889, "t": 444.55145, "r": 117.10054, "b": 453.45801, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "TableFormer", "bbox": {"l": 119.59001, "t": 444.43188, "r": 175.42041, "b": 453.38828, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": ", a transformer based model", "bbox": {"l": 175.42102, "t": 444.55145, "r": 286.36453, "b": 453.45801, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "that predicts tables structure and bounding boxes for", "bbox": {"l": 70.037018, "t": 456.50644000000005, "r": 286.3649, "b": 465.41299, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "the table content simultaneously in an end-to-end ap-", "bbox": {"l": 70.037018, "t": 468.46143, "r": 286.3649, "b": 477.36798, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "proach.", "bbox": {"l": 70.037018, "t": 480.41641, "r": 99.635902, "b": 489.32297, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u00b7 We propose TableFormer , a transformer based model that predicts tables structure and bounding boxes for the table content simultaneously in an end-to-end approach."}, {"label": "list_item", "id": 5, "page_no": 1, "cluster": {"id": 5, "label": "list_item", "bbox": {"l": 61.569016, "t": 502.03384, "r": 286.3649, "b": 546.9259500000001, "coord_origin": "TOPLEFT"}, "confidence": 0.982271671295166, "cells": [{"id": 43, "text": "\u2022", "bbox": {"l": 61.569016, "t": 502.15341, "r": 71.619438, "b": 511.05997, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "Across all benchmark datasets", "bbox": {"l": 74.132042, "t": 502.15341, "r": 196.10396, "b": 511.05997, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "TableFormer", "bbox": {"l": 200.31001, "t": 502.03384, "r": 256.14041, "b": 510.99023, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "signif-", "bbox": {"l": 260.35001, "t": 502.15341, "r": 286.36237, "b": 511.05997, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "icantly outperforms existing state-of-the-art metrics,", "bbox": {"l": 70.037003, "t": 514.1084000000001, "r": 286.3649, "b": 523.01495, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "while being much more efficient in training and infer-", "bbox": {"l": 70.037003, "t": 526.06439, "r": 286.36487, "b": 534.97095, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "ence to existing works.", "bbox": {"l": 70.037003, "t": 538.0193899999999, "r": 161.65305, "b": 546.9259500000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u00b7 Across all benchmark datasets TableFormer significantly outperforms existing state-of-the-art metrics, while being much more efficient in training and inference to existing works."}, {"label": "list_item", "id": 9, "page_no": 1, "cluster": {"id": 9, "label": "list_item", "bbox": {"l": 61.569, "t": 559.63684, "r": 286.36493, "b": 592.57295, "coord_origin": "TOPLEFT"}, "confidence": 0.9802963733673096, "cells": [{"id": 50, "text": "\u2022", "bbox": {"l": 61.569, "t": 559.75639, "r": 71.115913, "b": 568.66295, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "We present", "bbox": {"l": 73.502647, "t": 559.75639, "r": 116.71199, "b": 568.66295, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "SynthTabNet", "bbox": {"l": 121.583, "t": 559.63684, "r": 177.68239, "b": 568.59322, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "a synthetically generated", "bbox": {"l": 182.55301, "t": 559.75639, "r": 286.36328, "b": 568.66295, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "dataset, with various appearance styles and complex-", "bbox": {"l": 70.03701, "t": 571.7114, "r": 286.36493, "b": 580.6179500000001, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "ity.", "bbox": {"l": 70.03701, "t": 583.6664000000001, "r": 82.400597, "b": 592.57295, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u00b7 We present SynthTabNet a synthetically generated dataset, with various appearance styles and complexity."}, {"label": "list_item", "id": 8, "page_no": 1, "cluster": {"id": 8, "label": "list_item", "bbox": {"l": 61.569008000000004, "t": 605.4034, "r": 286.36508, "b": 638.22095, "coord_origin": "TOPLEFT"}, "confidence": 0.9806395173072815, "cells": [{"id": 56, "text": "\u2022", "bbox": {"l": 61.569008000000004, "t": 605.4034, "r": 72.332527, "b": 614.30995, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "An augmented dataset based on PubTabNet [37],", "bbox": {"l": 75.023399, "t": 605.4034, "r": 286.36508, "b": 614.30995, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "FinTabNet [36], and TableBank [17] with generated", "bbox": {"l": 70.03701, "t": 617.3584, "r": 286.36487, "b": 626.26495, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "ground-truth for reproducibility.", "bbox": {"l": 70.03701, "t": 629.31439, "r": 198.05641, "b": 638.22095, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u00b7 An augmented dataset based on PubTabNet [37], FinTabNet [36], and TableBank [17] with generated ground-truth for reproducibility."}, {"label": "text", "id": 11, "page_no": 1, "cluster": {"id": 11, "label": "text", "bbox": {"l": 50.112007, "t": 650.59839, "r": 286.36511, "b": 695.369957, "coord_origin": "TOPLEFT"}, "confidence": 0.9742533564567566, "cells": [{"id": 60, "text": "The paper is structured as follows. In Sec. 2, we give", "bbox": {"l": 62.067009000000006, "t": 650.59839, "r": 286.36496, "b": 659.50494, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "a brief overview of the current state-of-the-art. In Sec. 3,", "bbox": {"l": 50.112007, "t": 662.55339, "r": 286.36511, "b": 671.45995, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "we describe the datasets on which we train. In Sec. 4, we", "bbox": {"l": 50.112007, "t": 674.50839, "r": 286.36511, "b": 683.41496, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "introduce the TableFormer model-architecture and describe", "bbox": {"l": 50.112007, "t": 686.46339, "r": 286.36511, "b": 695.369957, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The paper is structured as follows. In Sec. 2, we give a brief overview of the current state-of-the-art. In Sec. 3, we describe the datasets on which we train. In Sec. 4, we introduce the TableFormer model-architecture and describe"}, {"label": "footnote", "id": 14, "page_no": 1, "cluster": {"id": 14, "label": "footnote", "bbox": {"l": 60.97100100000001, "t": 705.596275, "r": 183.73055, "b": 712.721542, "coord_origin": "TOPLEFT"}, "confidence": 0.895367443561554, "cells": [{"id": 64, "text": "$^{1}$https://github.com/IBM/SynthTabNet", "bbox": {"l": 60.97100100000001, "t": 705.596275, "r": 183.73055, "b": 712.721542, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "$^{1}$https://github.com/IBM/SynthTabNet"}, {"label": "text", "id": 10, "page_no": 1, "cluster": {"id": 10, "label": "text", "bbox": {"l": 308.862, "t": 75.20836999999995, "r": 545.11511, "b": 108.02495999999985, "coord_origin": "TOPLEFT"}, "confidence": 0.9774322509765625, "cells": [{"id": 65, "text": "its results & performance in Sec. 5. As a conclusion, we de-", "bbox": {"l": 308.862, "t": 75.20836999999995, "r": 545.11511, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "scribe how this new model-architecture can be re-purposed", "bbox": {"l": 308.862, "t": 87.16339000000005, "r": 545.11505, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "for other tasks in the computer-vision community.", "bbox": {"l": 308.862, "t": 99.11841000000004, "r": 508.08417000000003, "b": 108.02495999999985, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "its results & performance in Sec. 5. As a conclusion, we describe how this new model-architecture can be re-purposed for other tasks in the computer-vision community."}, {"label": "section_header", "id": 13, "page_no": 1, "cluster": {"id": 13, "label": "section_header", "bbox": {"l": 308.862, "t": 121.73193000000003, "r": 498.28021, "b": 132.47968000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9428724646568298, "cells": [{"id": 68, "text": "2.", "bbox": {"l": 308.862, "t": 121.73193000000003, "r": 315.5831, "b": 132.47968000000003, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "Previous work and State of the Art", "bbox": {"l": 324.54456, "t": 121.73193000000003, "r": 498.28021, "b": 132.47968000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2. Previous work and State of the Art"}, {"label": "text", "id": 0, "page_no": 1, "cluster": {"id": 0, "label": "text", "bbox": {"l": 308.862, "t": 142.22136999999998, "r": 545.11517, "b": 330.45502, "coord_origin": "TOPLEFT"}, "confidence": 0.987194836139679, "cells": [{"id": 70, "text": "Identifying the structure of a table has been an outstand-", "bbox": {"l": 320.81699, "t": 142.22136999999998, "r": 545.11493, "b": 151.12793, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "ing problem in the document-parsing community, that mo-", "bbox": {"l": 308.862, "t": 154.17638999999997, "r": 545.11505, "b": 163.08294999999998, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "tivates many organised public challenges [6, 4, 14].", "bbox": {"l": 308.862, "t": 166.13140999999996, "r": 522.55975, "b": 175.03796, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "The", "bbox": {"l": 529.62323, "t": 166.13140999999996, "r": 545.11505, "b": 175.03796, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "difficulty of the problem can be attributed to a number of", "bbox": {"l": 308.862, "t": 178.08642999999995, "r": 545.11517, "b": 186.99298, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "factors. First, there is a large variety in the shapes and sizes", "bbox": {"l": 308.862, "t": 190.04143999999997, "r": 545.11511, "b": 198.94799999999998, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "of tables.", "bbox": {"l": 308.862, "t": 201.99645999999996, "r": 346.97891, "b": 210.90301999999997, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "Such large variety requires a flexible method.", "bbox": {"l": 354.86929, "t": 201.99645999999996, "r": 545.11511, "b": 210.90301999999997, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "This is especially true for complex column- and row head-", "bbox": {"l": 308.862, "t": 213.95245, "r": 545.11505, "b": 222.85901, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "ers, which can be extremely intricate and demanding.", "bbox": {"l": 308.862, "t": 225.90747, "r": 530.9184, "b": 234.81403, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "A", "bbox": {"l": 537.92212, "t": 225.90747, "r": 545.11511, "b": 234.81403, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "second factor of complexity is the lack of data with regard", "bbox": {"l": 308.862, "t": 237.86248999999998, "r": 545.11517, "b": 246.76904000000002, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "to table-structure. Until the publication of PubTabNet [37],", "bbox": {"l": 308.862, "t": 249.8175, "r": 545.11511, "b": 258.72406, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "there were no large datasets (i.e.", "bbox": {"l": 308.862, "t": 261.77252, "r": 439.8402699999999, "b": 270.67908, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": ">", "bbox": {"l": 444.43999999999994, "t": 261.61310000000003, "r": 452.1889, "b": 270.45989999999995, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "100", "bbox": {"l": 455.89001, "t": 261.61310000000003, "r": 470.83392000000003, "b": 270.45989999999995, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "K tables) that pro-", "bbox": {"l": 470.83401, "t": 261.77252, "r": 545.11517, "b": 270.67908, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "vided structure information. This happens primarily due to", "bbox": {"l": 308.862, "t": 273.72748, "r": 545.11511, "b": 282.63406, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "the fact that tables are notoriously time-consuming to an-", "bbox": {"l": 308.862, "t": 285.6835, "r": 545.11511, "b": 294.59006, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "notate by hand. However, this has definitely changed in re-", "bbox": {"l": 308.862, "t": 297.63849, "r": 545.11511, "b": 306.54504, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "cent years with the deliverance of PubTabNet [37], FinTab-", "bbox": {"l": 308.862, "t": 309.59348, "r": 545.11517, "b": 318.50003000000004, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "Net [36], TableBank [17] etc.", "bbox": {"l": 308.862, "t": 321.54846, "r": 425.92255, "b": 330.45502, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Identifying the structure of a table has been an outstanding problem in the document-parsing community, that motivates many organised public challenges [6, 4, 14]. The difficulty of the problem can be attributed to a number of factors. First, there is a large variety in the shapes and sizes of tables. Such large variety requires a flexible method. This is especially true for complex column- and row headers, which can be extremely intricate and demanding. A second factor of complexity is the lack of data with regard to table-structure. Until the publication of PubTabNet [37], there were no large datasets (i.e. > 100 K tables) that provided structure information. This happens primarily due to the fact that tables are notoriously time-consuming to annotate by hand. However, this has definitely changed in recent years with the deliverance of PubTabNet [37], FinTabNet [36], TableBank [17] etc."}, {"label": "text", "id": 1, "page_no": 1, "cluster": {"id": 1, "label": "text", "bbox": {"l": 308.862, "t": 333.56946, "r": 545.11523, "b": 450.0729099999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9869040250778198, "cells": [{"id": 92, "text": "Before the rising popularity of deep neural networks,", "bbox": {"l": 320.81699, "t": 333.56946, "r": 545.11499, "b": 342.47601, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "the community relied heavily on heuristic and/or statistical", "bbox": {"l": 308.862, "t": 345.52444, "r": 545.11499, "b": 354.43100000000004, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "methods to do table structure identification [3, 7, 11, 5, 13,", "bbox": {"l": 308.862, "t": 357.47943, "r": 545.11517, "b": 366.38599, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "28]. Although such methods work well on constrained ta-", "bbox": {"l": 308.862, "t": 369.43542, "r": 545.11511, "b": 378.34198, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "bles [12], a more data-driven approach can be applied due", "bbox": {"l": 308.862, "t": 381.39041, "r": 545.11505, "b": 390.29697, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "to the advent of convolutional neural networks (CNNs) and", "bbox": {"l": 308.862, "t": 393.3453999999999, "r": 545.11505, "b": 402.25195, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "the availability of large datasets. To the best-of-our knowl-", "bbox": {"l": 308.862, "t": 405.30038, "r": 545.11517, "b": 414.20694, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "edge, there are currently two different types of network ar-", "bbox": {"l": 308.862, "t": 417.25537, "r": 545.11523, "b": 426.16193, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "chitecture that are being pursued for state-of-the-art table-", "bbox": {"l": 308.862, "t": 429.21136000000007, "r": 545.11511, "b": 438.11792, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "structure identification.", "bbox": {"l": 308.862, "t": 441.16635, "r": 401.28503, "b": 450.0729099999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Before the rising popularity of deep neural networks, the community relied heavily on heuristic and/or statistical methods to do table structure identification [3, 7, 11, 5, 13, 28]. Although such methods work well on constrained tables [12], a more data-driven approach can be applied due to the advent of convolutional neural networks (CNNs) and the availability of large datasets. To the best-of-our knowledge, there are currently two different types of network architecture that are being pursued for state-of-the-art tablestructure identification."}, {"label": "text", "id": 3, "page_no": 1, "cluster": {"id": 3, "label": "text", "bbox": {"l": 308.86197, "t": 453.06778, "r": 545.11688, "b": 713.151848, "coord_origin": "TOPLEFT"}, "confidence": 0.9843218326568604, "cells": [{"id": 102, "text": "Image-to-Text networks", "bbox": {"l": 320.81699, "t": 453.06778, "r": 423.26236, "b": 462.02417, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": ": In this type of network, one", "bbox": {"l": 423.26697, "t": 453.18735, "r": 545.10956, "b": 462.0939, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "predicts a sequence of tokens starting from an encoded", "bbox": {"l": 308.86197, "t": 465.14233, "r": 545.11511, "b": 474.04889, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "image.", "bbox": {"l": 308.86197, "t": 477.09732, "r": 335.7012, "b": 486.00388, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "Such sequences of tokens can be HTML table", "bbox": {"l": 345.85309, "t": 477.09732, "r": 545.11505, "b": 486.00388, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "tags [37, 17] or LaTeX symbols[10]. The choice of sym-", "bbox": {"l": 308.86197, "t": 489.05231, "r": 545.11493, "b": 497.95886, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "bols is ultimately not very important, since one can be trans-", "bbox": {"l": 308.86197, "t": 501.00729, "r": 545.11499, "b": 509.91385, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "formed into the other. There are however subtle variations", "bbox": {"l": 308.86197, "t": 512.9632899999999, "r": 545.11505, "b": 521.8698400000001, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "in the Image-to-Text networks. The easiest network archi-", "bbox": {"l": 308.86197, "t": 524.91827, "r": 545.11505, "b": 533.82483, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "tectures are \u201cimage-encoder", "bbox": {"l": 308.86197, "t": 536.87328, "r": 420.94119, "b": 545.77983, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "\u2192", "bbox": {"l": 423.59497, "t": 536.1559599999999, "r": 433.5575600000001, "b": 545.56065, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "text-decoder\u201d (IETD), sim-", "bbox": {"l": 436.21198, "t": 536.87328, "r": 545.11316, "b": 545.77983, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "ilar to network architectures that try to provide captions to", "bbox": {"l": 308.86197, "t": 548.82828, "r": 545.11511, "b": 557.73483, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "images [32]. In these IETD networks, one expects as output", "bbox": {"l": 308.86197, "t": 560.78328, "r": 545.11493, "b": 569.68983, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "the LaTeX/HTML string of the entire table, i.e. the sym-", "bbox": {"l": 308.86197, "t": 572.73828, "r": 545.11499, "b": 581.6448399999999, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "bols necessary for creating the table with the content of the", "bbox": {"l": 308.86197, "t": 584.69427, "r": 545.11505, "b": 593.60083, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "table. Another approach is the \u201cimage-encoder", "bbox": {"l": 308.86197, "t": 596.6492800000001, "r": 497.07541, "b": 605.55583, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "\u2192", "bbox": {"l": 499.80496, "t": 595.93196, "r": 509.76755, "b": 605.33665, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "dual de-", "bbox": {"l": 512.50098, "t": 596.6492800000001, "r": 545.10852, "b": 605.55583, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "coder\u201d (IEDD) networks. In these type of networks, one has", "bbox": {"l": 308.86197, "t": 608.60428, "r": 545.11511, "b": 617.5108299999999, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "two consecutive decoders with different purposes. The first", "bbox": {"l": 308.86197, "t": 620.55928, "r": 545.11505, "b": 629.46584, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "decoder is the", "bbox": {"l": 308.86197, "t": 632.51428, "r": 364.78201, "b": 641.42084, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "tag-decoder", "bbox": {"l": 367.57397, "t": 632.60394, "r": 415.61362, "b": 641.1917, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": ", i.e. it only produces the HTM-", "bbox": {"l": 415.61298, "t": 632.51428, "r": 545.11688, "b": 641.42084, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "L/LaTeX tags which construct an empty table. The second", "bbox": {"l": 308.86197, "t": 644.46928, "r": 545.11511, "b": 653.37584, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "content-decoder", "bbox": {"l": 308.86197, "t": 656.51494, "r": 373.59894, "b": 665.1027, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "uses the encoding of the image in combi-", "bbox": {"l": 376.90698, "t": 656.4252799999999, "r": 545.11548, "b": 665.33184, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "nation with the output encoding of each cell-tag (from the", "bbox": {"l": 308.862, "t": 668.38028, "r": 545.11517, "b": 677.28684, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "tag-decoder", "bbox": {"l": 308.862, "t": 680.42494, "r": 356.90164, "b": 689.0127, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": ") to generate the textual content of each table", "bbox": {"l": 357.13101, "t": 680.33528, "r": 545.1153, "b": 689.24184, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "cell. The network architecture of IEDD is certainly more", "bbox": {"l": 308.862, "t": 692.290283, "r": 545.11511, "b": 701.196846, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "elaborate, but it has the advantage that one can pre-train the", "bbox": {"l": 308.862, "t": 704.245285, "r": 545.11517, "b": 713.151848, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Image-to-Text networks : In this type of network, one predicts a sequence of tokens starting from an encoded image. Such sequences of tokens can be HTML table tags [37, 17] or LaTeX symbols[10]. The choice of symbols is ultimately not very important, since one can be transformed into the other. There are however subtle variations in the Image-to-Text networks. The easiest network architectures are \"image-encoder \u2192 text-decoder\" (IETD), similar to network architectures that try to provide captions to images [32]. In these IETD networks, one expects as output the LaTeX/HTML string of the entire table, i.e. the symbols necessary for creating the table with the content of the table. Another approach is the \"image-encoder \u2192 dual decoder\" (IEDD) networks. In these type of networks, one has two consecutive decoders with different purposes. The first decoder is the tag-decoder , i.e. it only produces the HTML/LaTeX tags which construct an empty table. The second content-decoder uses the encoding of the image in combination with the output encoding of each cell-tag (from the tag-decoder ) to generate the textual content of each table cell. The network architecture of IEDD is certainly more elaborate, but it has the advantage that one can pre-train the"}], "headers": [{"label": "page_footer", "id": 15, "page_no": 1, "cluster": {"id": 15, "label": "page_footer", "bbox": {"l": 295.121, "t": 734.133282, "r": 300.10229, "b": 743.039845, "coord_origin": "TOPLEFT"}, "confidence": 0.8778094053268433, "cells": [{"id": 134, "text": "2", "bbox": {"l": 295.121, "t": 734.133282, "r": 300.10229, "b": 743.039845, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2"}]}}, {"page_no": 2, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "tag-decoder which is constrained to the table-tags.", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 250.15102, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "In", "bbox": {"l": 62.067001, "t": 87.21935999999994, "r": 70.365845, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "practice,", "bbox": {"l": 76.931198, "t": 87.21935999999994, "r": 110.95348000000001, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "both", "bbox": {"l": 118.54498, "t": 87.21935999999994, "r": 136.25848, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "network", "bbox": {"l": 142.82384, "t": 87.21935999999994, "r": 175.37166, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "architectures", "bbox": {"l": 181.94698, "t": 87.21935999999994, "r": 232.83594000000002, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "(IETD", "bbox": {"l": 239.41125, "t": 87.21935999999994, "r": 265.41364, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "and", "bbox": {"l": 271.979, "t": 87.21935999999994, "r": 286.36499, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "IEDD) require an implicit, custom trained object-character-", "bbox": {"l": 50.112, "t": 99.17437999999993, "r": 286.36505, "b": 108.08092999999997, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "recognition (OCR) to obtain the content of the table-cells.", "bbox": {"l": 50.112, "t": 111.13036999999997, "r": 286.36511, "b": 120.03692999999998, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "In the case of IETD, this OCR engine is implicit in the de-", "bbox": {"l": 50.112, "t": 123.08538999999996, "r": 286.36505, "b": 131.99194, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "coder similar to [24]. For the IEDD, the OCR is solely em-", "bbox": {"l": 50.112, "t": 135.04040999999995, "r": 286.36514, "b": 143.94696, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "bedded in the content-decoder. This reliance on a custom,", "bbox": {"l": 50.112, "t": 146.99541999999997, "r": 286.36511, "b": 155.90197999999998, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "implicit OCR decoder is of course problematic. OCR is a", "bbox": {"l": 50.112, "t": 158.95043999999996, "r": 286.36505, "b": 167.85699, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "well known and extremely tough problem, that often needs", "bbox": {"l": 50.112, "t": 170.90545999999995, "r": 286.36508, "b": 179.81201, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "custom training for each individual language. However, the", "bbox": {"l": 50.112, "t": 182.86145, "r": 286.36508, "b": 191.76801, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "limited availability for non-english content in the current", "bbox": {"l": 50.112, "t": 194.81646999999998, "r": 286.36511, "b": 203.72302000000002, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "datasets, makes it impractical to apply the IETD and IEDD", "bbox": {"l": 50.112, "t": 206.77148, "r": 286.36511, "b": 215.67804, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "methods on tables with other languages. Additionally, OCR", "bbox": {"l": 50.112, "t": 218.7265, "r": 286.36505, "b": 227.63306, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "can be completely omitted if the tables originate from pro-", "bbox": {"l": 50.112, "t": 230.68151999999998, "r": 286.36505, "b": 239.58807000000002, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "grammatic PDF documents with known positions of each", "bbox": {"l": 50.112, "t": 242.63653999999997, "r": 286.36511, "b": 251.54309, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "cell. The latter was the inspiration for the work of this pa-", "bbox": {"l": 50.112, "t": 254.59253, "r": 286.36508, "b": 263.49908000000005, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "per.", "bbox": {"l": 50.112, "t": 266.54755, "r": 64.776947, "b": 275.45410000000004, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Graph Neural networks", "bbox": {"l": 62.067001, "t": 278.43895999999995, "r": 171.56593, "b": 287.39536, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": ":", "bbox": {"l": 171.56799, "t": 278.55853, "r": 174.3376, "b": 287.46509, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "Graph Neural networks", "bbox": {"l": 185.18687, "t": 278.55853, "r": 286.35709, "b": 287.46509, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "(GNN\u2019s) take a radically different approach to table-", "bbox": {"l": 50.111992, "t": 290.51453000000004, "r": 286.36511, "b": 299.42108, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "structure extraction.", "bbox": {"l": 50.111992, "t": 302.46950999999996, "r": 131.16771, "b": 311.37607, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Note that one table cell can consti-", "bbox": {"l": 138.84888, "t": 302.46950999999996, "r": 286.36508, "b": 311.37607, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "tute out of multiple text-cells. To obtain the table-structure,", "bbox": {"l": 50.111992, "t": 314.4245, "r": 286.36505, "b": 323.33105, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "one creates an initial graph, where each of the text-cells", "bbox": {"l": 50.111992, "t": 326.37949000000003, "r": 286.36508, "b": 335.28604, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "becomes a node in the graph similar to [33, 34, 2]. Each", "bbox": {"l": 50.111992, "t": 338.33447, "r": 286.36505, "b": 347.2410300000001, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "node is then associated with en embedding vector coming", "bbox": {"l": 50.111992, "t": 350.28946, "r": 286.36505, "b": 359.19601, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "from the encoded image, its coordinates and the encoded", "bbox": {"l": 50.111992, "t": 362.24545000000006, "r": 286.36508, "b": 371.15201, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "text. Furthermore, nodes that represent adjacent text-cells", "bbox": {"l": 50.111992, "t": 374.20044, "r": 286.36508, "b": 383.10699, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "are linked. Graph Convolutional Networks (GCN\u2019s) based", "bbox": {"l": 50.111992, "t": 386.15542999999997, "r": 286.36508, "b": 395.06198, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "methods take the image as an input, but also the position of", "bbox": {"l": 50.111992, "t": 398.11041000000006, "r": 286.36508, "b": 407.01697, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "the text-cells and their content [18]. The purpose of a GCN", "bbox": {"l": 50.111992, "t": 410.0654, "r": 286.36508, "b": 418.97195, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "is to transform the input graph into a new graph, which re-", "bbox": {"l": 50.111992, "t": 422.02038999999996, "r": 286.36505, "b": 430.92694, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "places the old links with new ones.", "bbox": {"l": 50.111992, "t": 433.97638, "r": 198.2359, "b": 442.88293, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "The new links then", "bbox": {"l": 205.92703, "t": 433.97638, "r": 286.36505, "b": 442.88293, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "represent the table-structure. With this approach, one can", "bbox": {"l": 50.111992, "t": 445.93137, "r": 286.36508, "b": 454.83792000000005, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "avoid the need to build custom OCR decoders. However,", "bbox": {"l": 50.111992, "t": 457.88635, "r": 286.36505, "b": 466.79291, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "the quality of the reconstructed structure is not comparable", "bbox": {"l": 50.111992, "t": 469.84134, "r": 286.36505, "b": 478.74789, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "to the current state-of-the-art [18].", "bbox": {"l": 50.111992, "t": 481.79633, "r": 186.49998, "b": 490.70288, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Hybrid Deep Learning-Rule-Based approach", "bbox": {"l": 62.066994, "t": 493.68875, "r": 252.88068000000004, "b": 502.64514, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": ": A pop-", "bbox": {"l": 252.88199, "t": 493.80832, "r": 286.36627, "b": 502.71487, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "ular current model for table-structure identification is the", "bbox": {"l": 50.111984, "t": 505.76331, "r": 286.36505, "b": 514.66986, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "use of a hybrid Deep Learning-Rule-Based approach similar", "bbox": {"l": 50.111984, "t": 517.71829, "r": 286.36505, "b": 526.6248499999999, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "to [27, 29]. In this approach, one first detects the position of", "bbox": {"l": 50.111984, "t": 529.67328, "r": 286.36508, "b": 538.57985, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "the table-cells with object detection (e.g. YoloVx or Mask-", "bbox": {"l": 50.111984, "t": 541.62929, "r": 286.36508, "b": 550.53584, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "RCNN), then classifies the table into different types (from", "bbox": {"l": 50.111984, "t": 553.58429, "r": 286.36511, "b": 562.4908399999999, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "its images) and finally uses different rule-sets to obtain", "bbox": {"l": 50.111984, "t": 565.5392899999999, "r": 286.36511, "b": 574.44585, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "its table-structure. Currently, this approach achieves state-", "bbox": {"l": 50.111984, "t": 577.49429, "r": 286.36502, "b": 586.40085, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "of-the-art results, but is not an end-to-end deep-learning", "bbox": {"l": 50.111984, "t": 589.4493, "r": 286.36505, "b": 598.35585, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "method. As such, new rules need to be written if different", "bbox": {"l": 50.111984, "t": 601.4043, "r": 286.36502, "b": 610.31085, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "types of tables are encountered.", "bbox": {"l": 50.111984, "t": 613.36029, "r": 175.98943, "b": 622.26685, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "3.", "bbox": {"l": 50.111984, "t": 635.94484, "r": 57.82375699999999, "b": 646.6925699999999, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Datasets", "bbox": {"l": 68.106125, "t": 635.94484, "r": 105.22546, "b": 646.6925699999999, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "We rely on large-scale datasets such as PubTabNet [37],", "bbox": {"l": 62.06698600000001, "t": 656.42529, "r": 286.36493, "b": 665.33186, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "FinTabNet [36], and TableBank [17] datasets to train and", "bbox": {"l": 50.111984, "t": 668.38029, "r": 286.36508, "b": 677.2868599999999, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "evaluate our models. These datasets span over various ap-", "bbox": {"l": 50.111984, "t": 680.3353, "r": 286.36502, "b": 689.24186, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "pearance styles and content.", "bbox": {"l": 50.111984, "t": 692.290298, "r": 166.24602, "b": 701.196861, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "We also introduce our own", "bbox": {"l": 173.68808, "t": 692.290298, "r": 286.36508, "b": 701.196861, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "synthetically generated SynthTabNet dataset to fix an im-", "bbox": {"l": 50.111984, "t": 704.2453, "r": 286.36505, "b": 713.151863, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "PubTabNet + FinTabNet", "bbox": {"l": 380.79849, "t": 79.81176999999991, "r": 486.84909, "b": 88.55975000000001, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "Rows / Columns", "bbox": {"l": 396.76776, "t": 242.02697999999998, "r": 469.78748, "b": 250.77495999999996, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "0", "bbox": {"l": 320.97653, "t": 233.42296999999996, "r": 324.79254, "b": 239.255, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "20", "bbox": {"l": 410.483, "t": 233.42296999999996, "r": 418.11319, "b": 239.255, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "40", "bbox": {"l": 500.84949, "t": 233.42296999999996, "r": 508.47968000000003, "b": 239.255, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "10", "bbox": {"l": 365.29999, "t": 233.42296999999996, "r": 372.93018, "b": 239.255, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "30", "bbox": {"l": 455.66626, "t": 233.42296999999996, "r": 463.29645, "b": 239.255, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "50", "bbox": {"l": 542.03528, "t": 233.42296999999996, "r": 549.66547, "b": 239.255, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "0", "bbox": {"l": 316.04474, "t": 230.44617000000005, "r": 319.86075, "b": 236.27819999999997, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "2", "bbox": {"l": 312.62521, "t": 198.69073000000003, "r": 316.44122, "b": 204.52277000000004, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "0", "bbox": {"l": 316.43942, "t": 198.69073000000003, "r": 320.2554, "b": 204.52277000000004, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "4", "bbox": {"l": 313.14951, "t": 168.09795999999994, "r": 316.96552, "b": 173.92998999999998, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "0", "bbox": {"l": 316.96371, "t": 168.09795999999994, "r": 320.77969, "b": 173.92998999999998, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "6", "bbox": {"l": 312.92972, "t": 136.58771000000002, "r": 316.74573, "b": 142.41974000000005, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "0", "bbox": {"l": 316.74393, "t": 136.58771000000002, "r": 320.55991, "b": 142.41974000000005, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "8", "bbox": {"l": 312.48227, "t": 105.60175000000004, "r": 316.29828, "b": 111.43377999999996, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "0", "bbox": {"l": 316.29648, "t": 105.60175000000004, "r": 320.11246, "b": 111.43377999999996, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "1", "bbox": {"l": 312.48227, "t": 212.25922000000003, "r": 316.29828, "b": 218.09124999999995, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "0", "bbox": {"l": 316.29648, "t": 212.25922000000003, "r": 320.11246, "b": 218.09124999999995, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "3", "bbox": {"l": 313.07639, "t": 183.72198000000003, "r": 316.8924, "b": 189.55402000000004, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "0", "bbox": {"l": 316.89059, "t": 183.72198000000003, "r": 320.70657, "b": 189.55402000000004, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "5", "bbox": {"l": 312.76321, "t": 152.47400000000005, "r": 316.57922, "b": 158.30602999999996, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "0", "bbox": {"l": 316.57742, "t": 152.47400000000005, "r": 320.3934, "b": 158.30602999999996, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "7", "bbox": {"l": 312.19775, "t": 120.57050000000004, "r": 316.01376, "b": 126.40252999999996, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "0", "bbox": {"l": 316.01196, "t": 120.57050000000004, "r": 319.82794, "b": 126.40252999999996, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "9", "bbox": {"l": 312.8165, "t": 90.1087, "r": 316.63251, "b": 95.94073000000003, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "0", "bbox": {"l": 316.63071, "t": 90.1087, "r": 320.44669, "b": 95.94073000000003, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "0", "bbox": {"l": 532.17426, "t": 222.72729000000004, "r": 536.94427, "b": 230.01727000000005, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "10K", "bbox": {"l": 532.87952, "t": 108.26702999999986, "r": 547.61249, "b": 115.55700999999999, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "8K", "bbox": {"l": 532.7735, "t": 130.78101000000004, "r": 542.73877, "b": 138.07097999999996, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "6K", "bbox": {"l": 532.79901, "t": 153.92352000000005, "r": 542.76428, "b": 161.21349999999995, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "4K", "bbox": {"l": 532.5705, "t": 176.75800000000004, "r": 542.53577, "b": 184.04796999999996, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "2K", "bbox": {"l": 532.14551, "t": 199.6463, "r": 542.11078, "b": 206.93628, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "Figure 2:", "bbox": {"l": 308.862, "t": 267.83636, "r": 346.06238, "b": 276.74292, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "Distribution of the tables across different table", "bbox": {"l": 354.49072, "t": 267.83636, "r": 545.11511, "b": 276.74292, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "dimensions in PubTabNet + FinTabNet datasets", "bbox": {"l": 308.862, "t": 279.79132000000004, "r": 498.56989, "b": 288.6979099999999, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "balance in the previous datasets.", "bbox": {"l": 308.862, "t": 317.47336, "r": 437.27002, "b": 326.37991, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "The PubTabNet dataset contains 509k tables delivered as", "bbox": {"l": 320.81699, "t": 331.53137, "r": 545.11505, "b": 340.43793, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "annotated PNG images. The annotations consist of the table", "bbox": {"l": 308.862, "t": 343.48635999999993, "r": 545.11517, "b": 352.39291, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "structure represented in HTML format, the tokenized text", "bbox": {"l": 308.862, "t": 355.44235, "r": 545.11505, "b": 364.34890999999993, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "and its bounding boxes per table cell. Fig. 1 shows the ap-", "bbox": {"l": 308.862, "t": 367.39734, "r": 545.11505, "b": 376.30389, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "pearance style of PubTabNet. Depending on its complexity,", "bbox": {"l": 308.862, "t": 379.35233, "r": 545.11511, "b": 388.25888, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "a table is characterized as \u201csimple\u201d when it does not contain", "bbox": {"l": 308.862, "t": 391.30731, "r": 545.11511, "b": 400.21386999999993, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "row spans or column spans, otherwise it is \u201ccomplex\u201d. The", "bbox": {"l": 308.862, "t": 403.26230000000004, "r": 545.11505, "b": 412.16885, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "dataset is divided into Train and Val splits (roughly 98% and", "bbox": {"l": 308.862, "t": 415.21729, "r": 545.11511, "b": 424.12384, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "2%). The Train split consists of 54% simple and 46% com-", "bbox": {"l": 308.862, "t": 427.17328, "r": 545.11517, "b": 436.0798300000001, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "plex tables and the Val split of 51% and 49% respectively.", "bbox": {"l": 308.862, "t": 439.12827, "r": 545.11517, "b": 448.03482, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "The FinTabNet dataset contains 112k tables delivered as", "bbox": {"l": 308.862, "t": 451.08325, "r": 545.11511, "b": 459.98981000000003, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "single-page PDF documents with mixed table structures and", "bbox": {"l": 308.862, "t": 463.03824, "r": 545.11505, "b": 471.94479, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "text content. Similarly to the PubTabNet, the annotations", "bbox": {"l": 308.862, "t": 474.99323, "r": 545.11511, "b": 483.89978, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "of FinTabNet include the table structure in HTML, the to-", "bbox": {"l": 308.862, "t": 486.94922, "r": 545.11511, "b": 495.85577, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "kenized text and the bounding boxes on a table cell basis.", "bbox": {"l": 308.862, "t": 498.90421, "r": 545.11511, "b": 507.81076, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "The dataset is divided into Train, Test and Val splits (81%,", "bbox": {"l": 308.862, "t": 510.85919, "r": 545.11517, "b": 519.76575, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "9.5%, 9.5%), and each one is almost equally divided into", "bbox": {"l": 308.862, "t": 522.8141800000001, "r": 545.11517, "b": 531.72073, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "simple and complex tables (Train: 48% simple, 52% com-", "bbox": {"l": 308.862, "t": 534.76917, "r": 545.11505, "b": 543.67574, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "plex, Test: 48% simple, 52% complex, Test: 53% simple,", "bbox": {"l": 308.862, "t": 546.72418, "r": 545.11511, "b": 555.6307400000001, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "47% complex). Finally the TableBank dataset consists of", "bbox": {"l": 308.862, "t": 558.6801800000001, "r": 545.11511, "b": 567.58673, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "145k tables provided as JPEG images. The latter has anno-", "bbox": {"l": 308.862, "t": 570.63518, "r": 545.11505, "b": 579.54173, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "tations for the table structure, but only few with bounding", "bbox": {"l": 308.862, "t": 582.59018, "r": 545.11499, "b": 591.49673, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "boxes of the table cells. The entire dataset consists of sim-", "bbox": {"l": 308.862, "t": 594.54518, "r": 545.11517, "b": 603.45174, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "ple tables and it is divided into 90% Train, 3% Test and 7%", "bbox": {"l": 308.862, "t": 606.50018, "r": 545.11511, "b": 615.40674, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "Val splits.", "bbox": {"l": 308.862, "t": 618.45518, "r": 348.16446, "b": 627.36174, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "Due to the heterogeneity across the dataset formats, it", "bbox": {"l": 320.81699, "t": 632.51419, "r": 545.11487, "b": 641.42075, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "was necessary to combine all available data into one homog-", "bbox": {"l": 308.862, "t": 644.46919, "r": 545.11511, "b": 653.37575, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "enized dataset before we could train our models for practi-", "bbox": {"l": 308.862, "t": 656.42419, "r": 545.11511, "b": 665.33076, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "cal purposes. Given the size of PubTabNet, we adopted its", "bbox": {"l": 308.862, "t": 668.38019, "r": 545.11499, "b": 677.28676, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "annotation format and we extracted and converted all tables", "bbox": {"l": 308.862, "t": 680.33519, "r": 545.11505, "b": 689.24176, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "as PNG images with a resolution of 72 dpi. Additionally,", "bbox": {"l": 308.862, "t": 692.290192, "r": 545.11505, "b": 701.196762, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "we have filtered out tables with extreme sizes due to small", "bbox": {"l": 308.862, "t": 704.245193, "r": 545.11511, "b": 713.151764, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "3", "bbox": {"l": 295.121, "t": 734.133198, "r": 300.10229, "b": 743.039761, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 10, "label": "text", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 250.15102, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.8767216801643372, "cells": [{"id": 0, "text": "tag-decoder which is constrained to the table-tags.", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 250.15102, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "text", "bbox": {"l": 50.112, "t": 87.21935999999994, "r": 286.36514, "b": 275.45410000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9822593927383423, "cells": [{"id": 1, "text": "In", "bbox": {"l": 62.067001, "t": 87.21935999999994, "r": 70.365845, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "practice,", "bbox": {"l": 76.931198, "t": 87.21935999999994, "r": 110.95348000000001, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "both", "bbox": {"l": 118.54498, "t": 87.21935999999994, "r": 136.25848, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "network", "bbox": {"l": 142.82384, "t": 87.21935999999994, "r": 175.37166, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "architectures", "bbox": {"l": 181.94698, "t": 87.21935999999994, "r": 232.83594000000002, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "(IETD", "bbox": {"l": 239.41125, "t": 87.21935999999994, "r": 265.41364, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "and", "bbox": {"l": 271.979, "t": 87.21935999999994, "r": 286.36499, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "IEDD) require an implicit, custom trained object-character-", "bbox": {"l": 50.112, "t": 99.17437999999993, "r": 286.36505, "b": 108.08092999999997, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "recognition (OCR) to obtain the content of the table-cells.", "bbox": {"l": 50.112, "t": 111.13036999999997, "r": 286.36511, "b": 120.03692999999998, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "In the case of IETD, this OCR engine is implicit in the de-", "bbox": {"l": 50.112, "t": 123.08538999999996, "r": 286.36505, "b": 131.99194, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "coder similar to [24]. For the IEDD, the OCR is solely em-", "bbox": {"l": 50.112, "t": 135.04040999999995, "r": 286.36514, "b": 143.94696, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "bedded in the content-decoder. This reliance on a custom,", "bbox": {"l": 50.112, "t": 146.99541999999997, "r": 286.36511, "b": 155.90197999999998, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "implicit OCR decoder is of course problematic. OCR is a", "bbox": {"l": 50.112, "t": 158.95043999999996, "r": 286.36505, "b": 167.85699, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "well known and extremely tough problem, that often needs", "bbox": {"l": 50.112, "t": 170.90545999999995, "r": 286.36508, "b": 179.81201, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "custom training for each individual language. However, the", "bbox": {"l": 50.112, "t": 182.86145, "r": 286.36508, "b": 191.76801, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "limited availability for non-english content in the current", "bbox": {"l": 50.112, "t": 194.81646999999998, "r": 286.36511, "b": 203.72302000000002, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "datasets, makes it impractical to apply the IETD and IEDD", "bbox": {"l": 50.112, "t": 206.77148, "r": 286.36511, "b": 215.67804, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "methods on tables with other languages. Additionally, OCR", "bbox": {"l": 50.112, "t": 218.7265, "r": 286.36505, "b": 227.63306, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "can be completely omitted if the tables originate from pro-", "bbox": {"l": 50.112, "t": 230.68151999999998, "r": 286.36505, "b": 239.58807000000002, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "grammatic PDF documents with known positions of each", "bbox": {"l": 50.112, "t": 242.63653999999997, "r": 286.36511, "b": 251.54309, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "cell. The latter was the inspiration for the work of this pa-", "bbox": {"l": 50.112, "t": 254.59253, "r": 286.36508, "b": 263.49908000000005, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "per.", "bbox": {"l": 50.112, "t": 266.54755, "r": 64.776947, "b": 275.45410000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 50.111992, "t": 278.43895999999995, "r": 286.36511, "b": 490.70288, "coord_origin": "TOPLEFT"}, "confidence": 0.9878450036048889, "cells": [{"id": 23, "text": "Graph Neural networks", "bbox": {"l": 62.067001, "t": 278.43895999999995, "r": 171.56593, "b": 287.39536, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": ":", "bbox": {"l": 171.56799, "t": 278.55853, "r": 174.3376, "b": 287.46509, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "Graph Neural networks", "bbox": {"l": 185.18687, "t": 278.55853, "r": 286.35709, "b": 287.46509, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "(GNN\u2019s) take a radically different approach to table-", "bbox": {"l": 50.111992, "t": 290.51453000000004, "r": 286.36511, "b": 299.42108, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "structure extraction.", "bbox": {"l": 50.111992, "t": 302.46950999999996, "r": 131.16771, "b": 311.37607, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Note that one table cell can consti-", "bbox": {"l": 138.84888, "t": 302.46950999999996, "r": 286.36508, "b": 311.37607, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "tute out of multiple text-cells. To obtain the table-structure,", "bbox": {"l": 50.111992, "t": 314.4245, "r": 286.36505, "b": 323.33105, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "one creates an initial graph, where each of the text-cells", "bbox": {"l": 50.111992, "t": 326.37949000000003, "r": 286.36508, "b": 335.28604, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "becomes a node in the graph similar to [33, 34, 2]. Each", "bbox": {"l": 50.111992, "t": 338.33447, "r": 286.36505, "b": 347.2410300000001, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "node is then associated with en embedding vector coming", "bbox": {"l": 50.111992, "t": 350.28946, "r": 286.36505, "b": 359.19601, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "from the encoded image, its coordinates and the encoded", "bbox": {"l": 50.111992, "t": 362.24545000000006, "r": 286.36508, "b": 371.15201, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "text. Furthermore, nodes that represent adjacent text-cells", "bbox": {"l": 50.111992, "t": 374.20044, "r": 286.36508, "b": 383.10699, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "are linked. Graph Convolutional Networks (GCN\u2019s) based", "bbox": {"l": 50.111992, "t": 386.15542999999997, "r": 286.36508, "b": 395.06198, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "methods take the image as an input, but also the position of", "bbox": {"l": 50.111992, "t": 398.11041000000006, "r": 286.36508, "b": 407.01697, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "the text-cells and their content [18]. The purpose of a GCN", "bbox": {"l": 50.111992, "t": 410.0654, "r": 286.36508, "b": 418.97195, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "is to transform the input graph into a new graph, which re-", "bbox": {"l": 50.111992, "t": 422.02038999999996, "r": 286.36505, "b": 430.92694, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "places the old links with new ones.", "bbox": {"l": 50.111992, "t": 433.97638, "r": 198.2359, "b": 442.88293, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "The new links then", "bbox": {"l": 205.92703, "t": 433.97638, "r": 286.36505, "b": 442.88293, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "represent the table-structure. With this approach, one can", "bbox": {"l": 50.111992, "t": 445.93137, "r": 286.36508, "b": 454.83792000000005, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "avoid the need to build custom OCR decoders. However,", "bbox": {"l": 50.111992, "t": 457.88635, "r": 286.36505, "b": 466.79291, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "the quality of the reconstructed structure is not comparable", "bbox": {"l": 50.111992, "t": 469.84134, "r": 286.36505, "b": 478.74789, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "to the current state-of-the-art [18].", "bbox": {"l": 50.111992, "t": 481.79633, "r": 186.49998, "b": 490.70288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 50.111984, "t": 493.68875, "r": 286.36627, "b": 622.26685, "coord_origin": "TOPLEFT"}, "confidence": 0.9875094294548035, "cells": [{"id": 45, "text": "Hybrid Deep Learning-Rule-Based approach", "bbox": {"l": 62.066994, "t": 493.68875, "r": 252.88068000000004, "b": 502.64514, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": ": A pop-", "bbox": {"l": 252.88199, "t": 493.80832, "r": 286.36627, "b": 502.71487, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "ular current model for table-structure identification is the", "bbox": {"l": 50.111984, "t": 505.76331, "r": 286.36505, "b": 514.66986, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "use of a hybrid Deep Learning-Rule-Based approach similar", "bbox": {"l": 50.111984, "t": 517.71829, "r": 286.36505, "b": 526.6248499999999, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "to [27, 29]. In this approach, one first detects the position of", "bbox": {"l": 50.111984, "t": 529.67328, "r": 286.36508, "b": 538.57985, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "the table-cells with object detection (e.g. YoloVx or Mask-", "bbox": {"l": 50.111984, "t": 541.62929, "r": 286.36508, "b": 550.53584, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "RCNN), then classifies the table into different types (from", "bbox": {"l": 50.111984, "t": 553.58429, "r": 286.36511, "b": 562.4908399999999, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "its images) and finally uses different rule-sets to obtain", "bbox": {"l": 50.111984, "t": 565.5392899999999, "r": 286.36511, "b": 574.44585, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "its table-structure. Currently, this approach achieves state-", "bbox": {"l": 50.111984, "t": 577.49429, "r": 286.36502, "b": 586.40085, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "of-the-art results, but is not an end-to-end deep-learning", "bbox": {"l": 50.111984, "t": 589.4493, "r": 286.36505, "b": 598.35585, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "method. As such, new rules need to be written if different", "bbox": {"l": 50.111984, "t": 601.4043, "r": 286.36502, "b": 610.31085, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "types of tables are encountered.", "bbox": {"l": 50.111984, "t": 613.36029, "r": 175.98943, "b": 622.26685, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "section_header", "bbox": {"l": 50.111984, "t": 635.94484, "r": 105.22546, "b": 646.6925699999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9423062205314636, "cells": [{"id": 57, "text": "3.", "bbox": {"l": 50.111984, "t": 635.94484, "r": 57.82375699999999, "b": 646.6925699999999, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Datasets", "bbox": {"l": 68.106125, "t": 635.94484, "r": 105.22546, "b": 646.6925699999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 50.111984, "t": 656.42529, "r": 286.36508, "b": 713.151863, "coord_origin": "TOPLEFT"}, "confidence": 0.9862047433853149, "cells": [{"id": 59, "text": "We rely on large-scale datasets such as PubTabNet [37],", "bbox": {"l": 62.06698600000001, "t": 656.42529, "r": 286.36493, "b": 665.33186, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "FinTabNet [36], and TableBank [17] datasets to train and", "bbox": {"l": 50.111984, "t": 668.38029, "r": 286.36508, "b": 677.2868599999999, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "evaluate our models. These datasets span over various ap-", "bbox": {"l": 50.111984, "t": 680.3353, "r": 286.36502, "b": 689.24186, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "pearance styles and content.", "bbox": {"l": 50.111984, "t": 692.290298, "r": 166.24602, "b": 701.196861, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "We also introduce our own", "bbox": {"l": 173.68808, "t": 692.290298, "r": 286.36508, "b": 701.196861, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "synthetically generated SynthTabNet dataset to fix an im-", "bbox": {"l": 50.111984, "t": 704.2453, "r": 286.36505, "b": 713.151863, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "picture", "bbox": {"l": 312.10369873046875, "t": 78.44086456298828, "r": 550.38916015625, "b": 250.60984802246094, "coord_origin": "TOPLEFT"}, "confidence": 0.9746918082237244, "cells": [{"id": 65, "text": "PubTabNet + FinTabNet", "bbox": {"l": 380.79849, "t": 79.81176999999991, "r": 486.84909, "b": 88.55975000000001, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "Rows / Columns", "bbox": {"l": 396.76776, "t": 242.02697999999998, "r": 469.78748, "b": 250.77495999999996, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "0", "bbox": {"l": 320.97653, "t": 233.42296999999996, "r": 324.79254, "b": 239.255, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "20", "bbox": {"l": 410.483, "t": 233.42296999999996, "r": 418.11319, "b": 239.255, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "40", "bbox": {"l": 500.84949, "t": 233.42296999999996, "r": 508.47968000000003, "b": 239.255, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "10", "bbox": {"l": 365.29999, "t": 233.42296999999996, "r": 372.93018, "b": 239.255, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "30", "bbox": {"l": 455.66626, "t": 233.42296999999996, "r": 463.29645, "b": 239.255, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "50", "bbox": {"l": 542.03528, "t": 233.42296999999996, "r": 549.66547, "b": 239.255, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "0", "bbox": {"l": 316.04474, "t": 230.44617000000005, "r": 319.86075, "b": 236.27819999999997, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "2", "bbox": {"l": 312.62521, "t": 198.69073000000003, "r": 316.44122, "b": 204.52277000000004, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "0", "bbox": {"l": 316.43942, "t": 198.69073000000003, "r": 320.2554, "b": 204.52277000000004, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "4", "bbox": {"l": 313.14951, "t": 168.09795999999994, "r": 316.96552, "b": 173.92998999999998, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "0", "bbox": {"l": 316.96371, "t": 168.09795999999994, "r": 320.77969, "b": 173.92998999999998, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "6", "bbox": {"l": 312.92972, "t": 136.58771000000002, "r": 316.74573, "b": 142.41974000000005, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "0", "bbox": {"l": 316.74393, "t": 136.58771000000002, "r": 320.55991, "b": 142.41974000000005, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "8", "bbox": {"l": 312.48227, "t": 105.60175000000004, "r": 316.29828, "b": 111.43377999999996, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "0", "bbox": {"l": 316.29648, "t": 105.60175000000004, "r": 320.11246, "b": 111.43377999999996, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "1", "bbox": {"l": 312.48227, "t": 212.25922000000003, "r": 316.29828, "b": 218.09124999999995, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "0", "bbox": {"l": 316.29648, "t": 212.25922000000003, "r": 320.11246, "b": 218.09124999999995, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "3", "bbox": {"l": 313.07639, "t": 183.72198000000003, "r": 316.8924, "b": 189.55402000000004, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "0", "bbox": {"l": 316.89059, "t": 183.72198000000003, "r": 320.70657, "b": 189.55402000000004, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "5", "bbox": {"l": 312.76321, "t": 152.47400000000005, "r": 316.57922, "b": 158.30602999999996, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "0", "bbox": {"l": 316.57742, "t": 152.47400000000005, "r": 320.3934, "b": 158.30602999999996, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "7", "bbox": {"l": 312.19775, "t": 120.57050000000004, "r": 316.01376, "b": 126.40252999999996, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "0", "bbox": {"l": 316.01196, "t": 120.57050000000004, "r": 319.82794, "b": 126.40252999999996, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "9", "bbox": {"l": 312.8165, "t": 90.1087, "r": 316.63251, "b": 95.94073000000003, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "0", "bbox": {"l": 316.63071, "t": 90.1087, "r": 320.44669, "b": 95.94073000000003, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "0", "bbox": {"l": 532.17426, "t": 222.72729000000004, "r": 536.94427, "b": 230.01727000000005, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "10K", "bbox": {"l": 532.87952, "t": 108.26702999999986, "r": 547.61249, "b": 115.55700999999999, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "8K", "bbox": {"l": 532.7735, "t": 130.78101000000004, "r": 542.73877, "b": 138.07097999999996, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "6K", "bbox": {"l": 532.79901, "t": 153.92352000000005, "r": 542.76428, "b": 161.21349999999995, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "4K", "bbox": {"l": 532.5705, "t": 176.75800000000004, "r": 542.53577, "b": 184.04796999999996, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "2K", "bbox": {"l": 532.14551, "t": 199.6463, "r": 542.11078, "b": 206.93628, "coord_origin": "TOPLEFT"}}], "children": [{"id": 12, "label": "section_header", "bbox": {"l": 380.79849, "t": 79.81176999999991, "r": 486.84909, "b": 88.55975000000001, "coord_origin": "TOPLEFT"}, "confidence": 0.5687217116355896, "cells": [{"id": 65, "text": "PubTabNet + FinTabNet", "bbox": {"l": 380.79849, "t": 79.81176999999991, "r": 486.84909, "b": 88.55975000000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 396.76776, "t": 242.02697999999998, "r": 469.78748, "b": 250.77495999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "Rows / Columns", "bbox": {"l": 396.76776, "t": 242.02697999999998, "r": 469.78748, "b": 250.77495999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 320.97653, "t": 233.42296999999996, "r": 324.79254, "b": 239.255, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "0", "bbox": {"l": 320.97653, "t": 233.42296999999996, "r": 324.79254, "b": 239.255, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 410.483, "t": 233.42296999999996, "r": 418.11319, "b": 239.255, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "20", "bbox": {"l": 410.483, "t": 233.42296999999996, "r": 418.11319, "b": 239.255, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 500.84949, "t": 233.42296999999996, "r": 508.47968000000003, "b": 239.255, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "40", "bbox": {"l": 500.84949, "t": 233.42296999999996, "r": 508.47968000000003, "b": 239.255, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 365.29999, "t": 233.42296999999996, "r": 372.93018, "b": 239.255, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "10", "bbox": {"l": 365.29999, "t": 233.42296999999996, "r": 372.93018, "b": 239.255, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 455.66626, "t": 233.42296999999996, "r": 463.29645, "b": 239.255, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "30", "bbox": {"l": 455.66626, "t": 233.42296999999996, "r": 463.29645, "b": 239.255, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 542.03528, "t": 233.42296999999996, "r": 549.66547, "b": 239.255, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "50", "bbox": {"l": 542.03528, "t": 233.42296999999996, "r": 549.66547, "b": 239.255, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 316.04474, "t": 230.44617000000005, "r": 319.86075, "b": 236.27819999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "0", "bbox": {"l": 316.04474, "t": 230.44617000000005, "r": 319.86075, "b": 236.27819999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 312.62521, "t": 198.69073000000003, "r": 316.44122, "b": 204.52277000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "2", "bbox": {"l": 312.62521, "t": 198.69073000000003, "r": 316.44122, "b": 204.52277000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 316.43942, "t": 198.69073000000003, "r": 320.2554, "b": 204.52277000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "0", "bbox": {"l": 316.43942, "t": 198.69073000000003, "r": 320.2554, "b": 204.52277000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 313.14951, "t": 168.09795999999994, "r": 316.96552, "b": 173.92998999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "4", "bbox": {"l": 313.14951, "t": 168.09795999999994, "r": 316.96552, "b": 173.92998999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 316.96371, "t": 168.09795999999994, "r": 320.77969, "b": 173.92998999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "0", "bbox": {"l": 316.96371, "t": 168.09795999999994, "r": 320.77969, "b": 173.92998999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 312.92972, "t": 136.58771000000002, "r": 316.74573, "b": 142.41974000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "6", "bbox": {"l": 312.92972, "t": 136.58771000000002, "r": 316.74573, "b": 142.41974000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 316.74393, "t": 136.58771000000002, "r": 320.55991, "b": 142.41974000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "0", "bbox": {"l": 316.74393, "t": 136.58771000000002, "r": 320.55991, "b": 142.41974000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 312.48227, "t": 105.60175000000004, "r": 316.29828, "b": 111.43377999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "8", "bbox": {"l": 312.48227, "t": 105.60175000000004, "r": 316.29828, "b": 111.43377999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 316.29648, "t": 105.60175000000004, "r": 320.11246, "b": 111.43377999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "0", "bbox": {"l": 316.29648, "t": 105.60175000000004, "r": 320.11246, "b": 111.43377999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 312.48227, "t": 212.25922000000003, "r": 316.29828, "b": 218.09124999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "1", "bbox": {"l": 312.48227, "t": 212.25922000000003, "r": 316.29828, "b": 218.09124999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 316.29648, "t": 212.25922000000003, "r": 320.11246, "b": 218.09124999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "0", "bbox": {"l": 316.29648, "t": 212.25922000000003, "r": 320.11246, "b": 218.09124999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 313.07639, "t": 183.72198000000003, "r": 316.8924, "b": 189.55402000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "3", "bbox": {"l": 313.07639, "t": 183.72198000000003, "r": 316.8924, "b": 189.55402000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 316.89059, "t": 183.72198000000003, "r": 320.70657, "b": 189.55402000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "0", "bbox": {"l": 316.89059, "t": 183.72198000000003, "r": 320.70657, "b": 189.55402000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 312.76321, "t": 152.47400000000005, "r": 316.57922, "b": 158.30602999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "5", "bbox": {"l": 312.76321, "t": 152.47400000000005, "r": 316.57922, "b": 158.30602999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 316.57742, "t": 152.47400000000005, "r": 320.3934, "b": 158.30602999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "0", "bbox": {"l": 316.57742, "t": 152.47400000000005, "r": 320.3934, "b": 158.30602999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 312.19775, "t": 120.57050000000004, "r": 316.01376, "b": 126.40252999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "7", "bbox": {"l": 312.19775, "t": 120.57050000000004, "r": 316.01376, "b": 126.40252999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 316.01196, "t": 120.57050000000004, "r": 319.82794, "b": 126.40252999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "0", "bbox": {"l": 316.01196, "t": 120.57050000000004, "r": 319.82794, "b": 126.40252999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 312.8165, "t": 90.1087, "r": 316.63251, "b": 95.94073000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "9", "bbox": {"l": 312.8165, "t": 90.1087, "r": 316.63251, "b": 95.94073000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 316.63071, "t": 90.1087, "r": 320.44669, "b": 95.94073000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "0", "bbox": {"l": 316.63071, "t": 90.1087, "r": 320.44669, "b": 95.94073000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 532.17426, "t": 222.72729000000004, "r": 536.94427, "b": 230.01727000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "0", "bbox": {"l": 532.17426, "t": 222.72729000000004, "r": 536.94427, "b": 230.01727000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 532.87952, "t": 108.26702999999986, "r": 547.61249, "b": 115.55700999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "10K", "bbox": {"l": 532.87952, "t": 108.26702999999986, "r": 547.61249, "b": 115.55700999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 532.7735, "t": 130.78101000000004, "r": 542.73877, "b": 138.07097999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "8K", "bbox": {"l": 532.7735, "t": 130.78101000000004, "r": 542.73877, "b": 138.07097999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 532.79901, "t": 153.92352000000005, "r": 542.76428, "b": 161.21349999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "6K", "bbox": {"l": 532.79901, "t": 153.92352000000005, "r": 542.76428, "b": 161.21349999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 532.5705, "t": 176.75800000000004, "r": 542.53577, "b": 184.04796999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "4K", "bbox": {"l": 532.5705, "t": 176.75800000000004, "r": 542.53577, "b": 184.04796999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 532.14551, "t": 199.6463, "r": 542.11078, "b": 206.93628, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "2K", "bbox": {"l": 532.14551, "t": 199.6463, "r": 542.11078, "b": 206.93628, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 7, "label": "caption", "bbox": {"l": 308.862, "t": 267.83636, "r": 545.11511, "b": 288.6979099999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9667505025863647, "cells": [{"id": 98, "text": "Figure 2:", "bbox": {"l": 308.862, "t": 267.83636, "r": 346.06238, "b": 276.74292, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "Distribution of the tables across different table", "bbox": {"l": 354.49072, "t": 267.83636, "r": 545.11511, "b": 276.74292, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "dimensions in PubTabNet + FinTabNet datasets", "bbox": {"l": 308.862, "t": 279.79132000000004, "r": 498.56989, "b": 288.6979099999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 308.862, "t": 317.47336, "r": 437.27002, "b": 326.37991, "coord_origin": "TOPLEFT"}, "confidence": 0.8879811763763428, "cells": [{"id": 101, "text": "balance in the previous datasets.", "bbox": {"l": 308.862, "t": 317.47336, "r": 437.27002, "b": 326.37991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 308.862, "t": 331.53137, "r": 545.11517, "b": 627.36174, "coord_origin": "TOPLEFT"}, "confidence": 0.9870319366455078, "cells": [{"id": 102, "text": "The PubTabNet dataset contains 509k tables delivered as", "bbox": {"l": 320.81699, "t": 331.53137, "r": 545.11505, "b": 340.43793, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "annotated PNG images. The annotations consist of the table", "bbox": {"l": 308.862, "t": 343.48635999999993, "r": 545.11517, "b": 352.39291, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "structure represented in HTML format, the tokenized text", "bbox": {"l": 308.862, "t": 355.44235, "r": 545.11505, "b": 364.34890999999993, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "and its bounding boxes per table cell. Fig. 1 shows the ap-", "bbox": {"l": 308.862, "t": 367.39734, "r": 545.11505, "b": 376.30389, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "pearance style of PubTabNet. Depending on its complexity,", "bbox": {"l": 308.862, "t": 379.35233, "r": 545.11511, "b": 388.25888, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "a table is characterized as \u201csimple\u201d when it does not contain", "bbox": {"l": 308.862, "t": 391.30731, "r": 545.11511, "b": 400.21386999999993, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "row spans or column spans, otherwise it is \u201ccomplex\u201d. The", "bbox": {"l": 308.862, "t": 403.26230000000004, "r": 545.11505, "b": 412.16885, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "dataset is divided into Train and Val splits (roughly 98% and", "bbox": {"l": 308.862, "t": 415.21729, "r": 545.11511, "b": 424.12384, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "2%). The Train split consists of 54% simple and 46% com-", "bbox": {"l": 308.862, "t": 427.17328, "r": 545.11517, "b": 436.0798300000001, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "plex tables and the Val split of 51% and 49% respectively.", "bbox": {"l": 308.862, "t": 439.12827, "r": 545.11517, "b": 448.03482, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "The FinTabNet dataset contains 112k tables delivered as", "bbox": {"l": 308.862, "t": 451.08325, "r": 545.11511, "b": 459.98981000000003, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "single-page PDF documents with mixed table structures and", "bbox": {"l": 308.862, "t": 463.03824, "r": 545.11505, "b": 471.94479, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "text content. Similarly to the PubTabNet, the annotations", "bbox": {"l": 308.862, "t": 474.99323, "r": 545.11511, "b": 483.89978, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "of FinTabNet include the table structure in HTML, the to-", "bbox": {"l": 308.862, "t": 486.94922, "r": 545.11511, "b": 495.85577, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "kenized text and the bounding boxes on a table cell basis.", "bbox": {"l": 308.862, "t": 498.90421, "r": 545.11511, "b": 507.81076, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "The dataset is divided into Train, Test and Val splits (81%,", "bbox": {"l": 308.862, "t": 510.85919, "r": 545.11517, "b": 519.76575, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "9.5%, 9.5%), and each one is almost equally divided into", "bbox": {"l": 308.862, "t": 522.8141800000001, "r": 545.11517, "b": 531.72073, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "simple and complex tables (Train: 48% simple, 52% com-", "bbox": {"l": 308.862, "t": 534.76917, "r": 545.11505, "b": 543.67574, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "plex, Test: 48% simple, 52% complex, Test: 53% simple,", "bbox": {"l": 308.862, "t": 546.72418, "r": 545.11511, "b": 555.6307400000001, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "47% complex). Finally the TableBank dataset consists of", "bbox": {"l": 308.862, "t": 558.6801800000001, "r": 545.11511, "b": 567.58673, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "145k tables provided as JPEG images. The latter has anno-", "bbox": {"l": 308.862, "t": 570.63518, "r": 545.11505, "b": 579.54173, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "tations for the table structure, but only few with bounding", "bbox": {"l": 308.862, "t": 582.59018, "r": 545.11499, "b": 591.49673, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "boxes of the table cells. The entire dataset consists of sim-", "bbox": {"l": 308.862, "t": 594.54518, "r": 545.11517, "b": 603.45174, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "ple tables and it is divided into 90% Train, 3% Test and 7%", "bbox": {"l": 308.862, "t": 606.50018, "r": 545.11511, "b": 615.40674, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "Val splits.", "bbox": {"l": 308.862, "t": 618.45518, "r": 348.16446, "b": 627.36174, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "text", "bbox": {"l": 308.862, "t": 632.51419, "r": 545.11511, "b": 713.151764, "coord_origin": "TOPLEFT"}, "confidence": 0.9840091466903687, "cells": [{"id": 127, "text": "Due to the heterogeneity across the dataset formats, it", "bbox": {"l": 320.81699, "t": 632.51419, "r": 545.11487, "b": 641.42075, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "was necessary to combine all available data into one homog-", "bbox": {"l": 308.862, "t": 644.46919, "r": 545.11511, "b": 653.37575, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "enized dataset before we could train our models for practi-", "bbox": {"l": 308.862, "t": 656.42419, "r": 545.11511, "b": 665.33076, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "cal purposes. Given the size of PubTabNet, we adopted its", "bbox": {"l": 308.862, "t": 668.38019, "r": 545.11499, "b": 677.28676, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "annotation format and we extracted and converted all tables", "bbox": {"l": 308.862, "t": 680.33519, "r": 545.11505, "b": 689.24176, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "as PNG images with a resolution of 72 dpi. Additionally,", "bbox": {"l": 308.862, "t": 692.290192, "r": 545.11505, "b": 701.196762, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "we have filtered out tables with extreme sizes due to small", "bbox": {"l": 308.862, "t": 704.245193, "r": 545.11511, "b": 713.151764, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "page_footer", "bbox": {"l": 295.121, "t": 734.133198, "r": 300.10229, "b": 743.039761, "coord_origin": "TOPLEFT"}, "confidence": 0.8715606927871704, "cells": [{"id": 134, "text": "3", "bbox": {"l": 295.121, "t": 734.133198, "r": 300.10229, "b": 743.039761, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "text", "id": 10, "page_no": 2, "cluster": {"id": 10, "label": "text", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 250.15102, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.8767216801643372, "cells": [{"id": 0, "text": "tag-decoder which is constrained to the table-tags.", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 250.15102, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "tag-decoder which is constrained to the table-tags."}, {"label": "text", "id": 5, "page_no": 2, "cluster": {"id": 5, "label": "text", "bbox": {"l": 50.112, "t": 87.21935999999994, "r": 286.36514, "b": 275.45410000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9822593927383423, "cells": [{"id": 1, "text": "In", "bbox": {"l": 62.067001, "t": 87.21935999999994, "r": 70.365845, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "practice,", "bbox": {"l": 76.931198, "t": 87.21935999999994, "r": 110.95348000000001, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "both", "bbox": {"l": 118.54498, "t": 87.21935999999994, "r": 136.25848, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "network", "bbox": {"l": 142.82384, "t": 87.21935999999994, "r": 175.37166, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "architectures", "bbox": {"l": 181.94698, "t": 87.21935999999994, "r": 232.83594000000002, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "(IETD", "bbox": {"l": 239.41125, "t": 87.21935999999994, "r": 265.41364, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "and", "bbox": {"l": 271.979, "t": 87.21935999999994, "r": 286.36499, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "IEDD) require an implicit, custom trained object-character-", "bbox": {"l": 50.112, "t": 99.17437999999993, "r": 286.36505, "b": 108.08092999999997, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "recognition (OCR) to obtain the content of the table-cells.", "bbox": {"l": 50.112, "t": 111.13036999999997, "r": 286.36511, "b": 120.03692999999998, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "In the case of IETD, this OCR engine is implicit in the de-", "bbox": {"l": 50.112, "t": 123.08538999999996, "r": 286.36505, "b": 131.99194, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "coder similar to [24]. For the IEDD, the OCR is solely em-", "bbox": {"l": 50.112, "t": 135.04040999999995, "r": 286.36514, "b": 143.94696, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "bedded in the content-decoder. This reliance on a custom,", "bbox": {"l": 50.112, "t": 146.99541999999997, "r": 286.36511, "b": 155.90197999999998, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "implicit OCR decoder is of course problematic. OCR is a", "bbox": {"l": 50.112, "t": 158.95043999999996, "r": 286.36505, "b": 167.85699, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "well known and extremely tough problem, that often needs", "bbox": {"l": 50.112, "t": 170.90545999999995, "r": 286.36508, "b": 179.81201, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "custom training for each individual language. However, the", "bbox": {"l": 50.112, "t": 182.86145, "r": 286.36508, "b": 191.76801, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "limited availability for non-english content in the current", "bbox": {"l": 50.112, "t": 194.81646999999998, "r": 286.36511, "b": 203.72302000000002, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "datasets, makes it impractical to apply the IETD and IEDD", "bbox": {"l": 50.112, "t": 206.77148, "r": 286.36511, "b": 215.67804, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "methods on tables with other languages. Additionally, OCR", "bbox": {"l": 50.112, "t": 218.7265, "r": 286.36505, "b": 227.63306, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "can be completely omitted if the tables originate from pro-", "bbox": {"l": 50.112, "t": 230.68151999999998, "r": 286.36505, "b": 239.58807000000002, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "grammatic PDF documents with known positions of each", "bbox": {"l": 50.112, "t": 242.63653999999997, "r": 286.36511, "b": 251.54309, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "cell. The latter was the inspiration for the work of this pa-", "bbox": {"l": 50.112, "t": 254.59253, "r": 286.36508, "b": 263.49908000000005, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "per.", "bbox": {"l": 50.112, "t": 266.54755, "r": 64.776947, "b": 275.45410000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In practice, both network architectures (IETD and IEDD) require an implicit, custom trained object-characterrecognition (OCR) to obtain the content of the table-cells. In the case of IETD, this OCR engine is implicit in the decoder similar to [24]. For the IEDD, the OCR is solely embedded in the content-decoder. This reliance on a custom, implicit OCR decoder is of course problematic. OCR is a well known and extremely tough problem, that often needs custom training for each individual language. However, the limited availability for non-english content in the current datasets, makes it impractical to apply the IETD and IEDD methods on tables with other languages. Additionally, OCR can be completely omitted if the tables originate from programmatic PDF documents with known positions of each cell. The latter was the inspiration for the work of this paper."}, {"label": "text", "id": 0, "page_no": 2, "cluster": {"id": 0, "label": "text", "bbox": {"l": 50.111992, "t": 278.43895999999995, "r": 286.36511, "b": 490.70288, "coord_origin": "TOPLEFT"}, "confidence": 0.9878450036048889, "cells": [{"id": 23, "text": "Graph Neural networks", "bbox": {"l": 62.067001, "t": 278.43895999999995, "r": 171.56593, "b": 287.39536, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": ":", "bbox": {"l": 171.56799, "t": 278.55853, "r": 174.3376, "b": 287.46509, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "Graph Neural networks", "bbox": {"l": 185.18687, "t": 278.55853, "r": 286.35709, "b": 287.46509, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "(GNN\u2019s) take a radically different approach to table-", "bbox": {"l": 50.111992, "t": 290.51453000000004, "r": 286.36511, "b": 299.42108, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "structure extraction.", "bbox": {"l": 50.111992, "t": 302.46950999999996, "r": 131.16771, "b": 311.37607, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Note that one table cell can consti-", "bbox": {"l": 138.84888, "t": 302.46950999999996, "r": 286.36508, "b": 311.37607, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "tute out of multiple text-cells. To obtain the table-structure,", "bbox": {"l": 50.111992, "t": 314.4245, "r": 286.36505, "b": 323.33105, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "one creates an initial graph, where each of the text-cells", "bbox": {"l": 50.111992, "t": 326.37949000000003, "r": 286.36508, "b": 335.28604, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "becomes a node in the graph similar to [33, 34, 2]. Each", "bbox": {"l": 50.111992, "t": 338.33447, "r": 286.36505, "b": 347.2410300000001, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "node is then associated with en embedding vector coming", "bbox": {"l": 50.111992, "t": 350.28946, "r": 286.36505, "b": 359.19601, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "from the encoded image, its coordinates and the encoded", "bbox": {"l": 50.111992, "t": 362.24545000000006, "r": 286.36508, "b": 371.15201, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "text. Furthermore, nodes that represent adjacent text-cells", "bbox": {"l": 50.111992, "t": 374.20044, "r": 286.36508, "b": 383.10699, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "are linked. Graph Convolutional Networks (GCN\u2019s) based", "bbox": {"l": 50.111992, "t": 386.15542999999997, "r": 286.36508, "b": 395.06198, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "methods take the image as an input, but also the position of", "bbox": {"l": 50.111992, "t": 398.11041000000006, "r": 286.36508, "b": 407.01697, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "the text-cells and their content [18]. The purpose of a GCN", "bbox": {"l": 50.111992, "t": 410.0654, "r": 286.36508, "b": 418.97195, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "is to transform the input graph into a new graph, which re-", "bbox": {"l": 50.111992, "t": 422.02038999999996, "r": 286.36505, "b": 430.92694, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "places the old links with new ones.", "bbox": {"l": 50.111992, "t": 433.97638, "r": 198.2359, "b": 442.88293, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "The new links then", "bbox": {"l": 205.92703, "t": 433.97638, "r": 286.36505, "b": 442.88293, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "represent the table-structure. With this approach, one can", "bbox": {"l": 50.111992, "t": 445.93137, "r": 286.36508, "b": 454.83792000000005, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "avoid the need to build custom OCR decoders. However,", "bbox": {"l": 50.111992, "t": 457.88635, "r": 286.36505, "b": 466.79291, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "the quality of the reconstructed structure is not comparable", "bbox": {"l": 50.111992, "t": 469.84134, "r": 286.36505, "b": 478.74789, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "to the current state-of-the-art [18].", "bbox": {"l": 50.111992, "t": 481.79633, "r": 186.49998, "b": 490.70288, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Graph Neural networks : Graph Neural networks (GNN's) take a radically different approach to tablestructure extraction. Note that one table cell can constitute out of multiple text-cells. To obtain the table-structure, one creates an initial graph, where each of the text-cells becomes a node in the graph similar to [33, 34, 2]. Each node is then associated with en embedding vector coming from the encoded image, its coordinates and the encoded text. Furthermore, nodes that represent adjacent text-cells are linked. Graph Convolutional Networks (GCN's) based methods take the image as an input, but also the position of the text-cells and their content [18]. The purpose of a GCN is to transform the input graph into a new graph, which replaces the old links with new ones. The new links then represent the table-structure. With this approach, one can avoid the need to build custom OCR decoders. However, the quality of the reconstructed structure is not comparable to the current state-of-the-art [18]."}, {"label": "text", "id": 1, "page_no": 2, "cluster": {"id": 1, "label": "text", "bbox": {"l": 50.111984, "t": 493.68875, "r": 286.36627, "b": 622.26685, "coord_origin": "TOPLEFT"}, "confidence": 0.9875094294548035, "cells": [{"id": 45, "text": "Hybrid Deep Learning-Rule-Based approach", "bbox": {"l": 62.066994, "t": 493.68875, "r": 252.88068000000004, "b": 502.64514, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": ": A pop-", "bbox": {"l": 252.88199, "t": 493.80832, "r": 286.36627, "b": 502.71487, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "ular current model for table-structure identification is the", "bbox": {"l": 50.111984, "t": 505.76331, "r": 286.36505, "b": 514.66986, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "use of a hybrid Deep Learning-Rule-Based approach similar", "bbox": {"l": 50.111984, "t": 517.71829, "r": 286.36505, "b": 526.6248499999999, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "to [27, 29]. In this approach, one first detects the position of", "bbox": {"l": 50.111984, "t": 529.67328, "r": 286.36508, "b": 538.57985, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "the table-cells with object detection (e.g. YoloVx or Mask-", "bbox": {"l": 50.111984, "t": 541.62929, "r": 286.36508, "b": 550.53584, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "RCNN), then classifies the table into different types (from", "bbox": {"l": 50.111984, "t": 553.58429, "r": 286.36511, "b": 562.4908399999999, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "its images) and finally uses different rule-sets to obtain", "bbox": {"l": 50.111984, "t": 565.5392899999999, "r": 286.36511, "b": 574.44585, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "its table-structure. Currently, this approach achieves state-", "bbox": {"l": 50.111984, "t": 577.49429, "r": 286.36502, "b": 586.40085, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "of-the-art results, but is not an end-to-end deep-learning", "bbox": {"l": 50.111984, "t": 589.4493, "r": 286.36505, "b": 598.35585, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "method. As such, new rules need to be written if different", "bbox": {"l": 50.111984, "t": 601.4043, "r": 286.36502, "b": 610.31085, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "types of tables are encountered.", "bbox": {"l": 50.111984, "t": 613.36029, "r": 175.98943, "b": 622.26685, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Hybrid Deep Learning-Rule-Based approach : A popular current model for table-structure identification is the use of a hybrid Deep Learning-Rule-Based approach similar to [27, 29]. In this approach, one first detects the position of the table-cells with object detection (e.g. YoloVx or MaskRCNN), then classifies the table into different types (from its images) and finally uses different rule-sets to obtain its table-structure. Currently, this approach achieves stateof-the-art results, but is not an end-to-end deep-learning method. As such, new rules need to be written if different types of tables are encountered."}, {"label": "section_header", "id": 8, "page_no": 2, "cluster": {"id": 8, "label": "section_header", "bbox": {"l": 50.111984, "t": 635.94484, "r": 105.22546, "b": 646.6925699999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9423062205314636, "cells": [{"id": 57, "text": "3.", "bbox": {"l": 50.111984, "t": 635.94484, "r": 57.82375699999999, "b": 646.6925699999999, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Datasets", "bbox": {"l": 68.106125, "t": 635.94484, "r": 105.22546, "b": 646.6925699999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3. Datasets"}, {"label": "text", "id": 3, "page_no": 2, "cluster": {"id": 3, "label": "text", "bbox": {"l": 50.111984, "t": 656.42529, "r": 286.36508, "b": 713.151863, "coord_origin": "TOPLEFT"}, "confidence": 0.9862047433853149, "cells": [{"id": 59, "text": "We rely on large-scale datasets such as PubTabNet [37],", "bbox": {"l": 62.06698600000001, "t": 656.42529, "r": 286.36493, "b": 665.33186, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "FinTabNet [36], and TableBank [17] datasets to train and", "bbox": {"l": 50.111984, "t": 668.38029, "r": 286.36508, "b": 677.2868599999999, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "evaluate our models. These datasets span over various ap-", "bbox": {"l": 50.111984, "t": 680.3353, "r": 286.36502, "b": 689.24186, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "pearance styles and content.", "bbox": {"l": 50.111984, "t": 692.290298, "r": 166.24602, "b": 701.196861, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "We also introduce our own", "bbox": {"l": 173.68808, "t": 692.290298, "r": 286.36508, "b": 701.196861, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "synthetically generated SynthTabNet dataset to fix an im-", "bbox": {"l": 50.111984, "t": 704.2453, "r": 286.36505, "b": 713.151863, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "We rely on large-scale datasets such as PubTabNet [37], FinTabNet [36], and TableBank [17] datasets to train and evaluate our models. These datasets span over various appearance styles and content. We also introduce our own synthetically generated SynthTabNet dataset to fix an im-"}, {"label": "picture", "id": 6, "page_no": 2, "cluster": {"id": 6, "label": "picture", "bbox": {"l": 312.10369873046875, "t": 78.44086456298828, "r": 550.38916015625, "b": 250.60984802246094, "coord_origin": "TOPLEFT"}, "confidence": 0.9746918082237244, "cells": [{"id": 65, "text": "PubTabNet + FinTabNet", "bbox": {"l": 380.79849, "t": 79.81176999999991, "r": 486.84909, "b": 88.55975000000001, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "Rows / Columns", "bbox": {"l": 396.76776, "t": 242.02697999999998, "r": 469.78748, "b": 250.77495999999996, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "0", "bbox": {"l": 320.97653, "t": 233.42296999999996, "r": 324.79254, "b": 239.255, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "20", "bbox": {"l": 410.483, "t": 233.42296999999996, "r": 418.11319, "b": 239.255, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "40", "bbox": {"l": 500.84949, "t": 233.42296999999996, "r": 508.47968000000003, "b": 239.255, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "10", "bbox": {"l": 365.29999, "t": 233.42296999999996, "r": 372.93018, "b": 239.255, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "30", "bbox": {"l": 455.66626, "t": 233.42296999999996, "r": 463.29645, "b": 239.255, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "50", "bbox": {"l": 542.03528, "t": 233.42296999999996, "r": 549.66547, "b": 239.255, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "0", "bbox": {"l": 316.04474, "t": 230.44617000000005, "r": 319.86075, "b": 236.27819999999997, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "2", "bbox": {"l": 312.62521, "t": 198.69073000000003, "r": 316.44122, "b": 204.52277000000004, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "0", "bbox": {"l": 316.43942, "t": 198.69073000000003, "r": 320.2554, "b": 204.52277000000004, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "4", "bbox": {"l": 313.14951, "t": 168.09795999999994, "r": 316.96552, "b": 173.92998999999998, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "0", "bbox": {"l": 316.96371, "t": 168.09795999999994, "r": 320.77969, "b": 173.92998999999998, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "6", "bbox": {"l": 312.92972, "t": 136.58771000000002, "r": 316.74573, "b": 142.41974000000005, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "0", "bbox": {"l": 316.74393, "t": 136.58771000000002, "r": 320.55991, "b": 142.41974000000005, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "8", "bbox": {"l": 312.48227, "t": 105.60175000000004, "r": 316.29828, "b": 111.43377999999996, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "0", "bbox": {"l": 316.29648, "t": 105.60175000000004, "r": 320.11246, "b": 111.43377999999996, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "1", "bbox": {"l": 312.48227, "t": 212.25922000000003, "r": 316.29828, "b": 218.09124999999995, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "0", "bbox": {"l": 316.29648, "t": 212.25922000000003, "r": 320.11246, "b": 218.09124999999995, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "3", "bbox": {"l": 313.07639, "t": 183.72198000000003, "r": 316.8924, "b": 189.55402000000004, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "0", "bbox": {"l": 316.89059, "t": 183.72198000000003, "r": 320.70657, "b": 189.55402000000004, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "5", "bbox": {"l": 312.76321, "t": 152.47400000000005, "r": 316.57922, "b": 158.30602999999996, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "0", "bbox": {"l": 316.57742, "t": 152.47400000000005, "r": 320.3934, "b": 158.30602999999996, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "7", "bbox": {"l": 312.19775, "t": 120.57050000000004, "r": 316.01376, "b": 126.40252999999996, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "0", "bbox": {"l": 316.01196, "t": 120.57050000000004, "r": 319.82794, "b": 126.40252999999996, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "9", "bbox": {"l": 312.8165, "t": 90.1087, "r": 316.63251, "b": 95.94073000000003, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "0", "bbox": {"l": 316.63071, "t": 90.1087, "r": 320.44669, "b": 95.94073000000003, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "0", "bbox": {"l": 532.17426, "t": 222.72729000000004, "r": 536.94427, "b": 230.01727000000005, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "10K", "bbox": {"l": 532.87952, "t": 108.26702999999986, "r": 547.61249, "b": 115.55700999999999, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "8K", "bbox": {"l": 532.7735, "t": 130.78101000000004, "r": 542.73877, "b": 138.07097999999996, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "6K", "bbox": {"l": 532.79901, "t": 153.92352000000005, "r": 542.76428, "b": 161.21349999999995, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "4K", "bbox": {"l": 532.5705, "t": 176.75800000000004, "r": 542.53577, "b": 184.04796999999996, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "2K", "bbox": {"l": 532.14551, "t": 199.6463, "r": 542.11078, "b": 206.93628, "coord_origin": "TOPLEFT"}}], "children": [{"id": 12, "label": "section_header", "bbox": {"l": 380.79849, "t": 79.81176999999991, "r": 486.84909, "b": 88.55975000000001, "coord_origin": "TOPLEFT"}, "confidence": 0.5687217116355896, "cells": [{"id": 65, "text": "PubTabNet + FinTabNet", "bbox": {"l": 380.79849, "t": 79.81176999999991, "r": 486.84909, "b": 88.55975000000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 396.76776, "t": 242.02697999999998, "r": 469.78748, "b": 250.77495999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "Rows / Columns", "bbox": {"l": 396.76776, "t": 242.02697999999998, "r": 469.78748, "b": 250.77495999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 320.97653, "t": 233.42296999999996, "r": 324.79254, "b": 239.255, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "0", "bbox": {"l": 320.97653, "t": 233.42296999999996, "r": 324.79254, "b": 239.255, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 410.483, "t": 233.42296999999996, "r": 418.11319, "b": 239.255, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "20", "bbox": {"l": 410.483, "t": 233.42296999999996, "r": 418.11319, "b": 239.255, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 500.84949, "t": 233.42296999999996, "r": 508.47968000000003, "b": 239.255, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "40", "bbox": {"l": 500.84949, "t": 233.42296999999996, "r": 508.47968000000003, "b": 239.255, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 365.29999, "t": 233.42296999999996, "r": 372.93018, "b": 239.255, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "10", "bbox": {"l": 365.29999, "t": 233.42296999999996, "r": 372.93018, "b": 239.255, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 455.66626, "t": 233.42296999999996, "r": 463.29645, "b": 239.255, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "30", "bbox": {"l": 455.66626, "t": 233.42296999999996, "r": 463.29645, "b": 239.255, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 542.03528, "t": 233.42296999999996, "r": 549.66547, "b": 239.255, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "50", "bbox": {"l": 542.03528, "t": 233.42296999999996, "r": 549.66547, "b": 239.255, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 316.04474, "t": 230.44617000000005, "r": 319.86075, "b": 236.27819999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "0", "bbox": {"l": 316.04474, "t": 230.44617000000005, "r": 319.86075, "b": 236.27819999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 312.62521, "t": 198.69073000000003, "r": 316.44122, "b": 204.52277000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "2", "bbox": {"l": 312.62521, "t": 198.69073000000003, "r": 316.44122, "b": 204.52277000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 316.43942, "t": 198.69073000000003, "r": 320.2554, "b": 204.52277000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "0", "bbox": {"l": 316.43942, "t": 198.69073000000003, "r": 320.2554, "b": 204.52277000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 313.14951, "t": 168.09795999999994, "r": 316.96552, "b": 173.92998999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "4", "bbox": {"l": 313.14951, "t": 168.09795999999994, "r": 316.96552, "b": 173.92998999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 316.96371, "t": 168.09795999999994, "r": 320.77969, "b": 173.92998999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "0", "bbox": {"l": 316.96371, "t": 168.09795999999994, "r": 320.77969, "b": 173.92998999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 312.92972, "t": 136.58771000000002, "r": 316.74573, "b": 142.41974000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "6", "bbox": {"l": 312.92972, "t": 136.58771000000002, "r": 316.74573, "b": 142.41974000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 316.74393, "t": 136.58771000000002, "r": 320.55991, "b": 142.41974000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "0", "bbox": {"l": 316.74393, "t": 136.58771000000002, "r": 320.55991, "b": 142.41974000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 312.48227, "t": 105.60175000000004, "r": 316.29828, "b": 111.43377999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "8", "bbox": {"l": 312.48227, "t": 105.60175000000004, "r": 316.29828, "b": 111.43377999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 316.29648, "t": 105.60175000000004, "r": 320.11246, "b": 111.43377999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "0", "bbox": {"l": 316.29648, "t": 105.60175000000004, "r": 320.11246, "b": 111.43377999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 312.48227, "t": 212.25922000000003, "r": 316.29828, "b": 218.09124999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "1", "bbox": {"l": 312.48227, "t": 212.25922000000003, "r": 316.29828, "b": 218.09124999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 316.29648, "t": 212.25922000000003, "r": 320.11246, "b": 218.09124999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "0", "bbox": {"l": 316.29648, "t": 212.25922000000003, "r": 320.11246, "b": 218.09124999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 313.07639, "t": 183.72198000000003, "r": 316.8924, "b": 189.55402000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "3", "bbox": {"l": 313.07639, "t": 183.72198000000003, "r": 316.8924, "b": 189.55402000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 316.89059, "t": 183.72198000000003, "r": 320.70657, "b": 189.55402000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "0", "bbox": {"l": 316.89059, "t": 183.72198000000003, "r": 320.70657, "b": 189.55402000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 312.76321, "t": 152.47400000000005, "r": 316.57922, "b": 158.30602999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "5", "bbox": {"l": 312.76321, "t": 152.47400000000005, "r": 316.57922, "b": 158.30602999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 316.57742, "t": 152.47400000000005, "r": 320.3934, "b": 158.30602999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "0", "bbox": {"l": 316.57742, "t": 152.47400000000005, "r": 320.3934, "b": 158.30602999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 312.19775, "t": 120.57050000000004, "r": 316.01376, "b": 126.40252999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "7", "bbox": {"l": 312.19775, "t": 120.57050000000004, "r": 316.01376, "b": 126.40252999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 316.01196, "t": 120.57050000000004, "r": 319.82794, "b": 126.40252999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "0", "bbox": {"l": 316.01196, "t": 120.57050000000004, "r": 319.82794, "b": 126.40252999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 312.8165, "t": 90.1087, "r": 316.63251, "b": 95.94073000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "9", "bbox": {"l": 312.8165, "t": 90.1087, "r": 316.63251, "b": 95.94073000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 316.63071, "t": 90.1087, "r": 320.44669, "b": 95.94073000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "0", "bbox": {"l": 316.63071, "t": 90.1087, "r": 320.44669, "b": 95.94073000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 532.17426, "t": 222.72729000000004, "r": 536.94427, "b": 230.01727000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "0", "bbox": {"l": 532.17426, "t": 222.72729000000004, "r": 536.94427, "b": 230.01727000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 532.87952, "t": 108.26702999999986, "r": 547.61249, "b": 115.55700999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "10K", "bbox": {"l": 532.87952, "t": 108.26702999999986, "r": 547.61249, "b": 115.55700999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 532.7735, "t": 130.78101000000004, "r": 542.73877, "b": 138.07097999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "8K", "bbox": {"l": 532.7735, "t": 130.78101000000004, "r": 542.73877, "b": 138.07097999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 532.79901, "t": 153.92352000000005, "r": 542.76428, "b": 161.21349999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "6K", "bbox": {"l": 532.79901, "t": 153.92352000000005, "r": 542.76428, "b": 161.21349999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 532.5705, "t": 176.75800000000004, "r": 542.53577, "b": 184.04796999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "4K", "bbox": {"l": 532.5705, "t": 176.75800000000004, "r": 542.53577, "b": 184.04796999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 532.14551, "t": 199.6463, "r": 542.11078, "b": 206.93628, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "2K", "bbox": {"l": 532.14551, "t": 199.6463, "r": 542.11078, "b": 206.93628, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "caption", "id": 7, "page_no": 2, "cluster": {"id": 7, "label": "caption", "bbox": {"l": 308.862, "t": 267.83636, "r": 545.11511, "b": 288.6979099999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9667505025863647, "cells": [{"id": 98, "text": "Figure 2:", "bbox": {"l": 308.862, "t": 267.83636, "r": 346.06238, "b": 276.74292, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "Distribution of the tables across different table", "bbox": {"l": 354.49072, "t": 267.83636, "r": 545.11511, "b": 276.74292, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "dimensions in PubTabNet + FinTabNet datasets", "bbox": {"l": 308.862, "t": 279.79132000000004, "r": 498.56989, "b": 288.6979099999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 2: Distribution of the tables across different table dimensions in PubTabNet + FinTabNet datasets"}, {"label": "text", "id": 9, "page_no": 2, "cluster": {"id": 9, "label": "text", "bbox": {"l": 308.862, "t": 317.47336, "r": 437.27002, "b": 326.37991, "coord_origin": "TOPLEFT"}, "confidence": 0.8879811763763428, "cells": [{"id": 101, "text": "balance in the previous datasets.", "bbox": {"l": 308.862, "t": 317.47336, "r": 437.27002, "b": 326.37991, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "balance in the previous datasets."}, {"label": "text", "id": 2, "page_no": 2, "cluster": {"id": 2, "label": "text", "bbox": {"l": 308.862, "t": 331.53137, "r": 545.11517, "b": 627.36174, "coord_origin": "TOPLEFT"}, "confidence": 0.9870319366455078, "cells": [{"id": 102, "text": "The PubTabNet dataset contains 509k tables delivered as", "bbox": {"l": 320.81699, "t": 331.53137, "r": 545.11505, "b": 340.43793, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "annotated PNG images. The annotations consist of the table", "bbox": {"l": 308.862, "t": 343.48635999999993, "r": 545.11517, "b": 352.39291, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "structure represented in HTML format, the tokenized text", "bbox": {"l": 308.862, "t": 355.44235, "r": 545.11505, "b": 364.34890999999993, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "and its bounding boxes per table cell. Fig. 1 shows the ap-", "bbox": {"l": 308.862, "t": 367.39734, "r": 545.11505, "b": 376.30389, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "pearance style of PubTabNet. Depending on its complexity,", "bbox": {"l": 308.862, "t": 379.35233, "r": 545.11511, "b": 388.25888, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "a table is characterized as \u201csimple\u201d when it does not contain", "bbox": {"l": 308.862, "t": 391.30731, "r": 545.11511, "b": 400.21386999999993, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "row spans or column spans, otherwise it is \u201ccomplex\u201d. The", "bbox": {"l": 308.862, "t": 403.26230000000004, "r": 545.11505, "b": 412.16885, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "dataset is divided into Train and Val splits (roughly 98% and", "bbox": {"l": 308.862, "t": 415.21729, "r": 545.11511, "b": 424.12384, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "2%). The Train split consists of 54% simple and 46% com-", "bbox": {"l": 308.862, "t": 427.17328, "r": 545.11517, "b": 436.0798300000001, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "plex tables and the Val split of 51% and 49% respectively.", "bbox": {"l": 308.862, "t": 439.12827, "r": 545.11517, "b": 448.03482, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "The FinTabNet dataset contains 112k tables delivered as", "bbox": {"l": 308.862, "t": 451.08325, "r": 545.11511, "b": 459.98981000000003, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "single-page PDF documents with mixed table structures and", "bbox": {"l": 308.862, "t": 463.03824, "r": 545.11505, "b": 471.94479, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "text content. Similarly to the PubTabNet, the annotations", "bbox": {"l": 308.862, "t": 474.99323, "r": 545.11511, "b": 483.89978, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "of FinTabNet include the table structure in HTML, the to-", "bbox": {"l": 308.862, "t": 486.94922, "r": 545.11511, "b": 495.85577, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "kenized text and the bounding boxes on a table cell basis.", "bbox": {"l": 308.862, "t": 498.90421, "r": 545.11511, "b": 507.81076, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "The dataset is divided into Train, Test and Val splits (81%,", "bbox": {"l": 308.862, "t": 510.85919, "r": 545.11517, "b": 519.76575, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "9.5%, 9.5%), and each one is almost equally divided into", "bbox": {"l": 308.862, "t": 522.8141800000001, "r": 545.11517, "b": 531.72073, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "simple and complex tables (Train: 48% simple, 52% com-", "bbox": {"l": 308.862, "t": 534.76917, "r": 545.11505, "b": 543.67574, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "plex, Test: 48% simple, 52% complex, Test: 53% simple,", "bbox": {"l": 308.862, "t": 546.72418, "r": 545.11511, "b": 555.6307400000001, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "47% complex). Finally the TableBank dataset consists of", "bbox": {"l": 308.862, "t": 558.6801800000001, "r": 545.11511, "b": 567.58673, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "145k tables provided as JPEG images. The latter has anno-", "bbox": {"l": 308.862, "t": 570.63518, "r": 545.11505, "b": 579.54173, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "tations for the table structure, but only few with bounding", "bbox": {"l": 308.862, "t": 582.59018, "r": 545.11499, "b": 591.49673, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "boxes of the table cells. The entire dataset consists of sim-", "bbox": {"l": 308.862, "t": 594.54518, "r": 545.11517, "b": 603.45174, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "ple tables and it is divided into 90% Train, 3% Test and 7%", "bbox": {"l": 308.862, "t": 606.50018, "r": 545.11511, "b": 615.40674, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "Val splits.", "bbox": {"l": 308.862, "t": 618.45518, "r": 348.16446, "b": 627.36174, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The PubTabNet dataset contains 509k tables delivered as annotated PNG images. The annotations consist of the table structure represented in HTML format, the tokenized text and its bounding boxes per table cell. Fig. 1 shows the appearance style of PubTabNet. Depending on its complexity, a table is characterized as \"simple\" when it does not contain row spans or column spans, otherwise it is \"complex\". The dataset is divided into Train and Val splits (roughly 98% and 2%). The Train split consists of 54% simple and 46% complex tables and the Val split of 51% and 49% respectively. The FinTabNet dataset contains 112k tables delivered as single-page PDF documents with mixed table structures and text content. Similarly to the PubTabNet, the annotations of FinTabNet include the table structure in HTML, the tokenized text and the bounding boxes on a table cell basis. The dataset is divided into Train, Test and Val splits (81%, 9.5%, 9.5%), and each one is almost equally divided into simple and complex tables (Train: 48% simple, 52% complex, Test: 48% simple, 52% complex, Test: 53% simple, 47% complex). Finally the TableBank dataset consists of 145k tables provided as JPEG images. The latter has annotations for the table structure, but only few with bounding boxes of the table cells. The entire dataset consists of simple tables and it is divided into 90% Train, 3% Test and 7% Val splits."}, {"label": "text", "id": 4, "page_no": 2, "cluster": {"id": 4, "label": "text", "bbox": {"l": 308.862, "t": 632.51419, "r": 545.11511, "b": 713.151764, "coord_origin": "TOPLEFT"}, "confidence": 0.9840091466903687, "cells": [{"id": 127, "text": "Due to the heterogeneity across the dataset formats, it", "bbox": {"l": 320.81699, "t": 632.51419, "r": 545.11487, "b": 641.42075, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "was necessary to combine all available data into one homog-", "bbox": {"l": 308.862, "t": 644.46919, "r": 545.11511, "b": 653.37575, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "enized dataset before we could train our models for practi-", "bbox": {"l": 308.862, "t": 656.42419, "r": 545.11511, "b": 665.33076, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "cal purposes. Given the size of PubTabNet, we adopted its", "bbox": {"l": 308.862, "t": 668.38019, "r": 545.11499, "b": 677.28676, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "annotation format and we extracted and converted all tables", "bbox": {"l": 308.862, "t": 680.33519, "r": 545.11505, "b": 689.24176, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "as PNG images with a resolution of 72 dpi. Additionally,", "bbox": {"l": 308.862, "t": 692.290192, "r": 545.11505, "b": 701.196762, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "we have filtered out tables with extreme sizes due to small", "bbox": {"l": 308.862, "t": 704.245193, "r": 545.11511, "b": 713.151764, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Due to the heterogeneity across the dataset formats, it was necessary to combine all available data into one homogenized dataset before we could train our models for practical purposes. Given the size of PubTabNet, we adopted its annotation format and we extracted and converted all tables as PNG images with a resolution of 72 dpi. Additionally, we have filtered out tables with extreme sizes due to small"}, {"label": "page_footer", "id": 11, "page_no": 2, "cluster": {"id": 11, "label": "page_footer", "bbox": {"l": 295.121, "t": 734.133198, "r": 300.10229, "b": 743.039761, "coord_origin": "TOPLEFT"}, "confidence": 0.8715606927871704, "cells": [{"id": 134, "text": "3", "bbox": {"l": 295.121, "t": 734.133198, "r": 300.10229, "b": 743.039761, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3"}], "body": [{"label": "text", "id": 10, "page_no": 2, "cluster": {"id": 10, "label": "text", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 250.15102, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.8767216801643372, "cells": [{"id": 0, "text": "tag-decoder which is constrained to the table-tags.", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 250.15102, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "tag-decoder which is constrained to the table-tags."}, {"label": "text", "id": 5, "page_no": 2, "cluster": {"id": 5, "label": "text", "bbox": {"l": 50.112, "t": 87.21935999999994, "r": 286.36514, "b": 275.45410000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9822593927383423, "cells": [{"id": 1, "text": "In", "bbox": {"l": 62.067001, "t": 87.21935999999994, "r": 70.365845, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "practice,", "bbox": {"l": 76.931198, "t": 87.21935999999994, "r": 110.95348000000001, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "both", "bbox": {"l": 118.54498, "t": 87.21935999999994, "r": 136.25848, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "network", "bbox": {"l": 142.82384, "t": 87.21935999999994, "r": 175.37166, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "architectures", "bbox": {"l": 181.94698, "t": 87.21935999999994, "r": 232.83594000000002, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "(IETD", "bbox": {"l": 239.41125, "t": 87.21935999999994, "r": 265.41364, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "and", "bbox": {"l": 271.979, "t": 87.21935999999994, "r": 286.36499, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "IEDD) require an implicit, custom trained object-character-", "bbox": {"l": 50.112, "t": 99.17437999999993, "r": 286.36505, "b": 108.08092999999997, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "recognition (OCR) to obtain the content of the table-cells.", "bbox": {"l": 50.112, "t": 111.13036999999997, "r": 286.36511, "b": 120.03692999999998, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "In the case of IETD, this OCR engine is implicit in the de-", "bbox": {"l": 50.112, "t": 123.08538999999996, "r": 286.36505, "b": 131.99194, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "coder similar to [24]. For the IEDD, the OCR is solely em-", "bbox": {"l": 50.112, "t": 135.04040999999995, "r": 286.36514, "b": 143.94696, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "bedded in the content-decoder. This reliance on a custom,", "bbox": {"l": 50.112, "t": 146.99541999999997, "r": 286.36511, "b": 155.90197999999998, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "implicit OCR decoder is of course problematic. OCR is a", "bbox": {"l": 50.112, "t": 158.95043999999996, "r": 286.36505, "b": 167.85699, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "well known and extremely tough problem, that often needs", "bbox": {"l": 50.112, "t": 170.90545999999995, "r": 286.36508, "b": 179.81201, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "custom training for each individual language. However, the", "bbox": {"l": 50.112, "t": 182.86145, "r": 286.36508, "b": 191.76801, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "limited availability for non-english content in the current", "bbox": {"l": 50.112, "t": 194.81646999999998, "r": 286.36511, "b": 203.72302000000002, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "datasets, makes it impractical to apply the IETD and IEDD", "bbox": {"l": 50.112, "t": 206.77148, "r": 286.36511, "b": 215.67804, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "methods on tables with other languages. Additionally, OCR", "bbox": {"l": 50.112, "t": 218.7265, "r": 286.36505, "b": 227.63306, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "can be completely omitted if the tables originate from pro-", "bbox": {"l": 50.112, "t": 230.68151999999998, "r": 286.36505, "b": 239.58807000000002, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "grammatic PDF documents with known positions of each", "bbox": {"l": 50.112, "t": 242.63653999999997, "r": 286.36511, "b": 251.54309, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "cell. The latter was the inspiration for the work of this pa-", "bbox": {"l": 50.112, "t": 254.59253, "r": 286.36508, "b": 263.49908000000005, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "per.", "bbox": {"l": 50.112, "t": 266.54755, "r": 64.776947, "b": 275.45410000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In practice, both network architectures (IETD and IEDD) require an implicit, custom trained object-characterrecognition (OCR) to obtain the content of the table-cells. In the case of IETD, this OCR engine is implicit in the decoder similar to [24]. For the IEDD, the OCR is solely embedded in the content-decoder. This reliance on a custom, implicit OCR decoder is of course problematic. OCR is a well known and extremely tough problem, that often needs custom training for each individual language. However, the limited availability for non-english content in the current datasets, makes it impractical to apply the IETD and IEDD methods on tables with other languages. Additionally, OCR can be completely omitted if the tables originate from programmatic PDF documents with known positions of each cell. The latter was the inspiration for the work of this paper."}, {"label": "text", "id": 0, "page_no": 2, "cluster": {"id": 0, "label": "text", "bbox": {"l": 50.111992, "t": 278.43895999999995, "r": 286.36511, "b": 490.70288, "coord_origin": "TOPLEFT"}, "confidence": 0.9878450036048889, "cells": [{"id": 23, "text": "Graph Neural networks", "bbox": {"l": 62.067001, "t": 278.43895999999995, "r": 171.56593, "b": 287.39536, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": ":", "bbox": {"l": 171.56799, "t": 278.55853, "r": 174.3376, "b": 287.46509, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "Graph Neural networks", "bbox": {"l": 185.18687, "t": 278.55853, "r": 286.35709, "b": 287.46509, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "(GNN\u2019s) take a radically different approach to table-", "bbox": {"l": 50.111992, "t": 290.51453000000004, "r": 286.36511, "b": 299.42108, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "structure extraction.", "bbox": {"l": 50.111992, "t": 302.46950999999996, "r": 131.16771, "b": 311.37607, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Note that one table cell can consti-", "bbox": {"l": 138.84888, "t": 302.46950999999996, "r": 286.36508, "b": 311.37607, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "tute out of multiple text-cells. To obtain the table-structure,", "bbox": {"l": 50.111992, "t": 314.4245, "r": 286.36505, "b": 323.33105, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "one creates an initial graph, where each of the text-cells", "bbox": {"l": 50.111992, "t": 326.37949000000003, "r": 286.36508, "b": 335.28604, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "becomes a node in the graph similar to [33, 34, 2]. Each", "bbox": {"l": 50.111992, "t": 338.33447, "r": 286.36505, "b": 347.2410300000001, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "node is then associated with en embedding vector coming", "bbox": {"l": 50.111992, "t": 350.28946, "r": 286.36505, "b": 359.19601, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "from the encoded image, its coordinates and the encoded", "bbox": {"l": 50.111992, "t": 362.24545000000006, "r": 286.36508, "b": 371.15201, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "text. Furthermore, nodes that represent adjacent text-cells", "bbox": {"l": 50.111992, "t": 374.20044, "r": 286.36508, "b": 383.10699, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "are linked. Graph Convolutional Networks (GCN\u2019s) based", "bbox": {"l": 50.111992, "t": 386.15542999999997, "r": 286.36508, "b": 395.06198, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "methods take the image as an input, but also the position of", "bbox": {"l": 50.111992, "t": 398.11041000000006, "r": 286.36508, "b": 407.01697, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "the text-cells and their content [18]. The purpose of a GCN", "bbox": {"l": 50.111992, "t": 410.0654, "r": 286.36508, "b": 418.97195, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "is to transform the input graph into a new graph, which re-", "bbox": {"l": 50.111992, "t": 422.02038999999996, "r": 286.36505, "b": 430.92694, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "places the old links with new ones.", "bbox": {"l": 50.111992, "t": 433.97638, "r": 198.2359, "b": 442.88293, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "The new links then", "bbox": {"l": 205.92703, "t": 433.97638, "r": 286.36505, "b": 442.88293, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "represent the table-structure. With this approach, one can", "bbox": {"l": 50.111992, "t": 445.93137, "r": 286.36508, "b": 454.83792000000005, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "avoid the need to build custom OCR decoders. However,", "bbox": {"l": 50.111992, "t": 457.88635, "r": 286.36505, "b": 466.79291, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "the quality of the reconstructed structure is not comparable", "bbox": {"l": 50.111992, "t": 469.84134, "r": 286.36505, "b": 478.74789, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "to the current state-of-the-art [18].", "bbox": {"l": 50.111992, "t": 481.79633, "r": 186.49998, "b": 490.70288, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Graph Neural networks : Graph Neural networks (GNN's) take a radically different approach to tablestructure extraction. Note that one table cell can constitute out of multiple text-cells. To obtain the table-structure, one creates an initial graph, where each of the text-cells becomes a node in the graph similar to [33, 34, 2]. Each node is then associated with en embedding vector coming from the encoded image, its coordinates and the encoded text. Furthermore, nodes that represent adjacent text-cells are linked. Graph Convolutional Networks (GCN's) based methods take the image as an input, but also the position of the text-cells and their content [18]. The purpose of a GCN is to transform the input graph into a new graph, which replaces the old links with new ones. The new links then represent the table-structure. With this approach, one can avoid the need to build custom OCR decoders. However, the quality of the reconstructed structure is not comparable to the current state-of-the-art [18]."}, {"label": "text", "id": 1, "page_no": 2, "cluster": {"id": 1, "label": "text", "bbox": {"l": 50.111984, "t": 493.68875, "r": 286.36627, "b": 622.26685, "coord_origin": "TOPLEFT"}, "confidence": 0.9875094294548035, "cells": [{"id": 45, "text": "Hybrid Deep Learning-Rule-Based approach", "bbox": {"l": 62.066994, "t": 493.68875, "r": 252.88068000000004, "b": 502.64514, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": ": A pop-", "bbox": {"l": 252.88199, "t": 493.80832, "r": 286.36627, "b": 502.71487, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "ular current model for table-structure identification is the", "bbox": {"l": 50.111984, "t": 505.76331, "r": 286.36505, "b": 514.66986, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "use of a hybrid Deep Learning-Rule-Based approach similar", "bbox": {"l": 50.111984, "t": 517.71829, "r": 286.36505, "b": 526.6248499999999, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "to [27, 29]. In this approach, one first detects the position of", "bbox": {"l": 50.111984, "t": 529.67328, "r": 286.36508, "b": 538.57985, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "the table-cells with object detection (e.g. YoloVx or Mask-", "bbox": {"l": 50.111984, "t": 541.62929, "r": 286.36508, "b": 550.53584, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "RCNN), then classifies the table into different types (from", "bbox": {"l": 50.111984, "t": 553.58429, "r": 286.36511, "b": 562.4908399999999, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "its images) and finally uses different rule-sets to obtain", "bbox": {"l": 50.111984, "t": 565.5392899999999, "r": 286.36511, "b": 574.44585, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "its table-structure. Currently, this approach achieves state-", "bbox": {"l": 50.111984, "t": 577.49429, "r": 286.36502, "b": 586.40085, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "of-the-art results, but is not an end-to-end deep-learning", "bbox": {"l": 50.111984, "t": 589.4493, "r": 286.36505, "b": 598.35585, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "method. As such, new rules need to be written if different", "bbox": {"l": 50.111984, "t": 601.4043, "r": 286.36502, "b": 610.31085, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "types of tables are encountered.", "bbox": {"l": 50.111984, "t": 613.36029, "r": 175.98943, "b": 622.26685, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Hybrid Deep Learning-Rule-Based approach : A popular current model for table-structure identification is the use of a hybrid Deep Learning-Rule-Based approach similar to [27, 29]. In this approach, one first detects the position of the table-cells with object detection (e.g. YoloVx or MaskRCNN), then classifies the table into different types (from its images) and finally uses different rule-sets to obtain its table-structure. Currently, this approach achieves stateof-the-art results, but is not an end-to-end deep-learning method. As such, new rules need to be written if different types of tables are encountered."}, {"label": "section_header", "id": 8, "page_no": 2, "cluster": {"id": 8, "label": "section_header", "bbox": {"l": 50.111984, "t": 635.94484, "r": 105.22546, "b": 646.6925699999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9423062205314636, "cells": [{"id": 57, "text": "3.", "bbox": {"l": 50.111984, "t": 635.94484, "r": 57.82375699999999, "b": 646.6925699999999, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Datasets", "bbox": {"l": 68.106125, "t": 635.94484, "r": 105.22546, "b": 646.6925699999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3. Datasets"}, {"label": "text", "id": 3, "page_no": 2, "cluster": {"id": 3, "label": "text", "bbox": {"l": 50.111984, "t": 656.42529, "r": 286.36508, "b": 713.151863, "coord_origin": "TOPLEFT"}, "confidence": 0.9862047433853149, "cells": [{"id": 59, "text": "We rely on large-scale datasets such as PubTabNet [37],", "bbox": {"l": 62.06698600000001, "t": 656.42529, "r": 286.36493, "b": 665.33186, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "FinTabNet [36], and TableBank [17] datasets to train and", "bbox": {"l": 50.111984, "t": 668.38029, "r": 286.36508, "b": 677.2868599999999, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "evaluate our models. These datasets span over various ap-", "bbox": {"l": 50.111984, "t": 680.3353, "r": 286.36502, "b": 689.24186, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "pearance styles and content.", "bbox": {"l": 50.111984, "t": 692.290298, "r": 166.24602, "b": 701.196861, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "We also introduce our own", "bbox": {"l": 173.68808, "t": 692.290298, "r": 286.36508, "b": 701.196861, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "synthetically generated SynthTabNet dataset to fix an im-", "bbox": {"l": 50.111984, "t": 704.2453, "r": 286.36505, "b": 713.151863, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "We rely on large-scale datasets such as PubTabNet [37], FinTabNet [36], and TableBank [17] datasets to train and evaluate our models. These datasets span over various appearance styles and content. We also introduce our own synthetically generated SynthTabNet dataset to fix an im-"}, {"label": "picture", "id": 6, "page_no": 2, "cluster": {"id": 6, "label": "picture", "bbox": {"l": 312.10369873046875, "t": 78.44086456298828, "r": 550.38916015625, "b": 250.60984802246094, "coord_origin": "TOPLEFT"}, "confidence": 0.9746918082237244, "cells": [{"id": 65, "text": "PubTabNet + FinTabNet", "bbox": {"l": 380.79849, "t": 79.81176999999991, "r": 486.84909, "b": 88.55975000000001, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "Rows / Columns", "bbox": {"l": 396.76776, "t": 242.02697999999998, "r": 469.78748, "b": 250.77495999999996, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "0", "bbox": {"l": 320.97653, "t": 233.42296999999996, "r": 324.79254, "b": 239.255, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "20", "bbox": {"l": 410.483, "t": 233.42296999999996, "r": 418.11319, "b": 239.255, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "40", "bbox": {"l": 500.84949, "t": 233.42296999999996, "r": 508.47968000000003, "b": 239.255, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "10", "bbox": {"l": 365.29999, "t": 233.42296999999996, "r": 372.93018, "b": 239.255, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "30", "bbox": {"l": 455.66626, "t": 233.42296999999996, "r": 463.29645, "b": 239.255, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "50", "bbox": {"l": 542.03528, "t": 233.42296999999996, "r": 549.66547, "b": 239.255, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "0", "bbox": {"l": 316.04474, "t": 230.44617000000005, "r": 319.86075, "b": 236.27819999999997, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "2", "bbox": {"l": 312.62521, "t": 198.69073000000003, "r": 316.44122, "b": 204.52277000000004, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "0", "bbox": {"l": 316.43942, "t": 198.69073000000003, "r": 320.2554, "b": 204.52277000000004, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "4", "bbox": {"l": 313.14951, "t": 168.09795999999994, "r": 316.96552, "b": 173.92998999999998, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "0", "bbox": {"l": 316.96371, "t": 168.09795999999994, "r": 320.77969, "b": 173.92998999999998, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "6", "bbox": {"l": 312.92972, "t": 136.58771000000002, "r": 316.74573, "b": 142.41974000000005, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "0", "bbox": {"l": 316.74393, "t": 136.58771000000002, "r": 320.55991, "b": 142.41974000000005, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "8", "bbox": {"l": 312.48227, "t": 105.60175000000004, "r": 316.29828, "b": 111.43377999999996, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "0", "bbox": {"l": 316.29648, "t": 105.60175000000004, "r": 320.11246, "b": 111.43377999999996, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "1", "bbox": {"l": 312.48227, "t": 212.25922000000003, "r": 316.29828, "b": 218.09124999999995, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "0", "bbox": {"l": 316.29648, "t": 212.25922000000003, "r": 320.11246, "b": 218.09124999999995, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "3", "bbox": {"l": 313.07639, "t": 183.72198000000003, "r": 316.8924, "b": 189.55402000000004, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "0", "bbox": {"l": 316.89059, "t": 183.72198000000003, "r": 320.70657, "b": 189.55402000000004, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "5", "bbox": {"l": 312.76321, "t": 152.47400000000005, "r": 316.57922, "b": 158.30602999999996, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "0", "bbox": {"l": 316.57742, "t": 152.47400000000005, "r": 320.3934, "b": 158.30602999999996, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "7", "bbox": {"l": 312.19775, "t": 120.57050000000004, "r": 316.01376, "b": 126.40252999999996, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "0", "bbox": {"l": 316.01196, "t": 120.57050000000004, "r": 319.82794, "b": 126.40252999999996, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "9", "bbox": {"l": 312.8165, "t": 90.1087, "r": 316.63251, "b": 95.94073000000003, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "0", "bbox": {"l": 316.63071, "t": 90.1087, "r": 320.44669, "b": 95.94073000000003, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "0", "bbox": {"l": 532.17426, "t": 222.72729000000004, "r": 536.94427, "b": 230.01727000000005, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "10K", "bbox": {"l": 532.87952, "t": 108.26702999999986, "r": 547.61249, "b": 115.55700999999999, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "8K", "bbox": {"l": 532.7735, "t": 130.78101000000004, "r": 542.73877, "b": 138.07097999999996, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "6K", "bbox": {"l": 532.79901, "t": 153.92352000000005, "r": 542.76428, "b": 161.21349999999995, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "4K", "bbox": {"l": 532.5705, "t": 176.75800000000004, "r": 542.53577, "b": 184.04796999999996, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "2K", "bbox": {"l": 532.14551, "t": 199.6463, "r": 542.11078, "b": 206.93628, "coord_origin": "TOPLEFT"}}], "children": [{"id": 12, "label": "section_header", "bbox": {"l": 380.79849, "t": 79.81176999999991, "r": 486.84909, "b": 88.55975000000001, "coord_origin": "TOPLEFT"}, "confidence": 0.5687217116355896, "cells": [{"id": 65, "text": "PubTabNet + FinTabNet", "bbox": {"l": 380.79849, "t": 79.81176999999991, "r": 486.84909, "b": 88.55975000000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 396.76776, "t": 242.02697999999998, "r": 469.78748, "b": 250.77495999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "Rows / Columns", "bbox": {"l": 396.76776, "t": 242.02697999999998, "r": 469.78748, "b": 250.77495999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 320.97653, "t": 233.42296999999996, "r": 324.79254, "b": 239.255, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "0", "bbox": {"l": 320.97653, "t": 233.42296999999996, "r": 324.79254, "b": 239.255, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 410.483, "t": 233.42296999999996, "r": 418.11319, "b": 239.255, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "20", "bbox": {"l": 410.483, "t": 233.42296999999996, "r": 418.11319, "b": 239.255, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 500.84949, "t": 233.42296999999996, "r": 508.47968000000003, "b": 239.255, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "40", "bbox": {"l": 500.84949, "t": 233.42296999999996, "r": 508.47968000000003, "b": 239.255, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 365.29999, "t": 233.42296999999996, "r": 372.93018, "b": 239.255, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "10", "bbox": {"l": 365.29999, "t": 233.42296999999996, "r": 372.93018, "b": 239.255, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 455.66626, "t": 233.42296999999996, "r": 463.29645, "b": 239.255, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "30", "bbox": {"l": 455.66626, "t": 233.42296999999996, "r": 463.29645, "b": 239.255, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 542.03528, "t": 233.42296999999996, "r": 549.66547, "b": 239.255, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "50", "bbox": {"l": 542.03528, "t": 233.42296999999996, "r": 549.66547, "b": 239.255, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 316.04474, "t": 230.44617000000005, "r": 319.86075, "b": 236.27819999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "0", "bbox": {"l": 316.04474, "t": 230.44617000000005, "r": 319.86075, "b": 236.27819999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 312.62521, "t": 198.69073000000003, "r": 316.44122, "b": 204.52277000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "2", "bbox": {"l": 312.62521, "t": 198.69073000000003, "r": 316.44122, "b": 204.52277000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 316.43942, "t": 198.69073000000003, "r": 320.2554, "b": 204.52277000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "0", "bbox": {"l": 316.43942, "t": 198.69073000000003, "r": 320.2554, "b": 204.52277000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 313.14951, "t": 168.09795999999994, "r": 316.96552, "b": 173.92998999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "4", "bbox": {"l": 313.14951, "t": 168.09795999999994, "r": 316.96552, "b": 173.92998999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 316.96371, "t": 168.09795999999994, "r": 320.77969, "b": 173.92998999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "0", "bbox": {"l": 316.96371, "t": 168.09795999999994, "r": 320.77969, "b": 173.92998999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 312.92972, "t": 136.58771000000002, "r": 316.74573, "b": 142.41974000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "6", "bbox": {"l": 312.92972, "t": 136.58771000000002, "r": 316.74573, "b": 142.41974000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 316.74393, "t": 136.58771000000002, "r": 320.55991, "b": 142.41974000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "0", "bbox": {"l": 316.74393, "t": 136.58771000000002, "r": 320.55991, "b": 142.41974000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 312.48227, "t": 105.60175000000004, "r": 316.29828, "b": 111.43377999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "8", "bbox": {"l": 312.48227, "t": 105.60175000000004, "r": 316.29828, "b": 111.43377999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 316.29648, "t": 105.60175000000004, "r": 320.11246, "b": 111.43377999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "0", "bbox": {"l": 316.29648, "t": 105.60175000000004, "r": 320.11246, "b": 111.43377999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 312.48227, "t": 212.25922000000003, "r": 316.29828, "b": 218.09124999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "1", "bbox": {"l": 312.48227, "t": 212.25922000000003, "r": 316.29828, "b": 218.09124999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 316.29648, "t": 212.25922000000003, "r": 320.11246, "b": 218.09124999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "0", "bbox": {"l": 316.29648, "t": 212.25922000000003, "r": 320.11246, "b": 218.09124999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 313.07639, "t": 183.72198000000003, "r": 316.8924, "b": 189.55402000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "3", "bbox": {"l": 313.07639, "t": 183.72198000000003, "r": 316.8924, "b": 189.55402000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 316.89059, "t": 183.72198000000003, "r": 320.70657, "b": 189.55402000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "0", "bbox": {"l": 316.89059, "t": 183.72198000000003, "r": 320.70657, "b": 189.55402000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 312.76321, "t": 152.47400000000005, "r": 316.57922, "b": 158.30602999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "5", "bbox": {"l": 312.76321, "t": 152.47400000000005, "r": 316.57922, "b": 158.30602999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 316.57742, "t": 152.47400000000005, "r": 320.3934, "b": 158.30602999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "0", "bbox": {"l": 316.57742, "t": 152.47400000000005, "r": 320.3934, "b": 158.30602999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 312.19775, "t": 120.57050000000004, "r": 316.01376, "b": 126.40252999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "7", "bbox": {"l": 312.19775, "t": 120.57050000000004, "r": 316.01376, "b": 126.40252999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 316.01196, "t": 120.57050000000004, "r": 319.82794, "b": 126.40252999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "0", "bbox": {"l": 316.01196, "t": 120.57050000000004, "r": 319.82794, "b": 126.40252999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 312.8165, "t": 90.1087, "r": 316.63251, "b": 95.94073000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "9", "bbox": {"l": 312.8165, "t": 90.1087, "r": 316.63251, "b": 95.94073000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 316.63071, "t": 90.1087, "r": 320.44669, "b": 95.94073000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "0", "bbox": {"l": 316.63071, "t": 90.1087, "r": 320.44669, "b": 95.94073000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 532.17426, "t": 222.72729000000004, "r": 536.94427, "b": 230.01727000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "0", "bbox": {"l": 532.17426, "t": 222.72729000000004, "r": 536.94427, "b": 230.01727000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 532.87952, "t": 108.26702999999986, "r": 547.61249, "b": 115.55700999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "10K", "bbox": {"l": 532.87952, "t": 108.26702999999986, "r": 547.61249, "b": 115.55700999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 532.7735, "t": 130.78101000000004, "r": 542.73877, "b": 138.07097999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "8K", "bbox": {"l": 532.7735, "t": 130.78101000000004, "r": 542.73877, "b": 138.07097999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 532.79901, "t": 153.92352000000005, "r": 542.76428, "b": 161.21349999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "6K", "bbox": {"l": 532.79901, "t": 153.92352000000005, "r": 542.76428, "b": 161.21349999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 532.5705, "t": 176.75800000000004, "r": 542.53577, "b": 184.04796999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "4K", "bbox": {"l": 532.5705, "t": 176.75800000000004, "r": 542.53577, "b": 184.04796999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 532.14551, "t": 199.6463, "r": 542.11078, "b": 206.93628, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "2K", "bbox": {"l": 532.14551, "t": 199.6463, "r": 542.11078, "b": 206.93628, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "caption", "id": 7, "page_no": 2, "cluster": {"id": 7, "label": "caption", "bbox": {"l": 308.862, "t": 267.83636, "r": 545.11511, "b": 288.6979099999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9667505025863647, "cells": [{"id": 98, "text": "Figure 2:", "bbox": {"l": 308.862, "t": 267.83636, "r": 346.06238, "b": 276.74292, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "Distribution of the tables across different table", "bbox": {"l": 354.49072, "t": 267.83636, "r": 545.11511, "b": 276.74292, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "dimensions in PubTabNet + FinTabNet datasets", "bbox": {"l": 308.862, "t": 279.79132000000004, "r": 498.56989, "b": 288.6979099999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 2: Distribution of the tables across different table dimensions in PubTabNet + FinTabNet datasets"}, {"label": "text", "id": 9, "page_no": 2, "cluster": {"id": 9, "label": "text", "bbox": {"l": 308.862, "t": 317.47336, "r": 437.27002, "b": 326.37991, "coord_origin": "TOPLEFT"}, "confidence": 0.8879811763763428, "cells": [{"id": 101, "text": "balance in the previous datasets.", "bbox": {"l": 308.862, "t": 317.47336, "r": 437.27002, "b": 326.37991, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "balance in the previous datasets."}, {"label": "text", "id": 2, "page_no": 2, "cluster": {"id": 2, "label": "text", "bbox": {"l": 308.862, "t": 331.53137, "r": 545.11517, "b": 627.36174, "coord_origin": "TOPLEFT"}, "confidence": 0.9870319366455078, "cells": [{"id": 102, "text": "The PubTabNet dataset contains 509k tables delivered as", "bbox": {"l": 320.81699, "t": 331.53137, "r": 545.11505, "b": 340.43793, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "annotated PNG images. The annotations consist of the table", "bbox": {"l": 308.862, "t": 343.48635999999993, "r": 545.11517, "b": 352.39291, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "structure represented in HTML format, the tokenized text", "bbox": {"l": 308.862, "t": 355.44235, "r": 545.11505, "b": 364.34890999999993, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "and its bounding boxes per table cell. Fig. 1 shows the ap-", "bbox": {"l": 308.862, "t": 367.39734, "r": 545.11505, "b": 376.30389, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "pearance style of PubTabNet. Depending on its complexity,", "bbox": {"l": 308.862, "t": 379.35233, "r": 545.11511, "b": 388.25888, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "a table is characterized as \u201csimple\u201d when it does not contain", "bbox": {"l": 308.862, "t": 391.30731, "r": 545.11511, "b": 400.21386999999993, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "row spans or column spans, otherwise it is \u201ccomplex\u201d. The", "bbox": {"l": 308.862, "t": 403.26230000000004, "r": 545.11505, "b": 412.16885, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "dataset is divided into Train and Val splits (roughly 98% and", "bbox": {"l": 308.862, "t": 415.21729, "r": 545.11511, "b": 424.12384, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "2%). The Train split consists of 54% simple and 46% com-", "bbox": {"l": 308.862, "t": 427.17328, "r": 545.11517, "b": 436.0798300000001, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "plex tables and the Val split of 51% and 49% respectively.", "bbox": {"l": 308.862, "t": 439.12827, "r": 545.11517, "b": 448.03482, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "The FinTabNet dataset contains 112k tables delivered as", "bbox": {"l": 308.862, "t": 451.08325, "r": 545.11511, "b": 459.98981000000003, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "single-page PDF documents with mixed table structures and", "bbox": {"l": 308.862, "t": 463.03824, "r": 545.11505, "b": 471.94479, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "text content. Similarly to the PubTabNet, the annotations", "bbox": {"l": 308.862, "t": 474.99323, "r": 545.11511, "b": 483.89978, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "of FinTabNet include the table structure in HTML, the to-", "bbox": {"l": 308.862, "t": 486.94922, "r": 545.11511, "b": 495.85577, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "kenized text and the bounding boxes on a table cell basis.", "bbox": {"l": 308.862, "t": 498.90421, "r": 545.11511, "b": 507.81076, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "The dataset is divided into Train, Test and Val splits (81%,", "bbox": {"l": 308.862, "t": 510.85919, "r": 545.11517, "b": 519.76575, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "9.5%, 9.5%), and each one is almost equally divided into", "bbox": {"l": 308.862, "t": 522.8141800000001, "r": 545.11517, "b": 531.72073, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "simple and complex tables (Train: 48% simple, 52% com-", "bbox": {"l": 308.862, "t": 534.76917, "r": 545.11505, "b": 543.67574, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "plex, Test: 48% simple, 52% complex, Test: 53% simple,", "bbox": {"l": 308.862, "t": 546.72418, "r": 545.11511, "b": 555.6307400000001, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "47% complex). Finally the TableBank dataset consists of", "bbox": {"l": 308.862, "t": 558.6801800000001, "r": 545.11511, "b": 567.58673, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "145k tables provided as JPEG images. The latter has anno-", "bbox": {"l": 308.862, "t": 570.63518, "r": 545.11505, "b": 579.54173, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "tations for the table structure, but only few with bounding", "bbox": {"l": 308.862, "t": 582.59018, "r": 545.11499, "b": 591.49673, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "boxes of the table cells. The entire dataset consists of sim-", "bbox": {"l": 308.862, "t": 594.54518, "r": 545.11517, "b": 603.45174, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "ple tables and it is divided into 90% Train, 3% Test and 7%", "bbox": {"l": 308.862, "t": 606.50018, "r": 545.11511, "b": 615.40674, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "Val splits.", "bbox": {"l": 308.862, "t": 618.45518, "r": 348.16446, "b": 627.36174, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The PubTabNet dataset contains 509k tables delivered as annotated PNG images. The annotations consist of the table structure represented in HTML format, the tokenized text and its bounding boxes per table cell. Fig. 1 shows the appearance style of PubTabNet. Depending on its complexity, a table is characterized as \"simple\" when it does not contain row spans or column spans, otherwise it is \"complex\". The dataset is divided into Train and Val splits (roughly 98% and 2%). The Train split consists of 54% simple and 46% complex tables and the Val split of 51% and 49% respectively. The FinTabNet dataset contains 112k tables delivered as single-page PDF documents with mixed table structures and text content. Similarly to the PubTabNet, the annotations of FinTabNet include the table structure in HTML, the tokenized text and the bounding boxes on a table cell basis. The dataset is divided into Train, Test and Val splits (81%, 9.5%, 9.5%), and each one is almost equally divided into simple and complex tables (Train: 48% simple, 52% complex, Test: 48% simple, 52% complex, Test: 53% simple, 47% complex). Finally the TableBank dataset consists of 145k tables provided as JPEG images. The latter has annotations for the table structure, but only few with bounding boxes of the table cells. The entire dataset consists of simple tables and it is divided into 90% Train, 3% Test and 7% Val splits."}, {"label": "text", "id": 4, "page_no": 2, "cluster": {"id": 4, "label": "text", "bbox": {"l": 308.862, "t": 632.51419, "r": 545.11511, "b": 713.151764, "coord_origin": "TOPLEFT"}, "confidence": 0.9840091466903687, "cells": [{"id": 127, "text": "Due to the heterogeneity across the dataset formats, it", "bbox": {"l": 320.81699, "t": 632.51419, "r": 545.11487, "b": 641.42075, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "was necessary to combine all available data into one homog-", "bbox": {"l": 308.862, "t": 644.46919, "r": 545.11511, "b": 653.37575, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "enized dataset before we could train our models for practi-", "bbox": {"l": 308.862, "t": 656.42419, "r": 545.11511, "b": 665.33076, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "cal purposes. Given the size of PubTabNet, we adopted its", "bbox": {"l": 308.862, "t": 668.38019, "r": 545.11499, "b": 677.28676, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "annotation format and we extracted and converted all tables", "bbox": {"l": 308.862, "t": 680.33519, "r": 545.11505, "b": 689.24176, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "as PNG images with a resolution of 72 dpi. Additionally,", "bbox": {"l": 308.862, "t": 692.290192, "r": 545.11505, "b": 701.196762, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "we have filtered out tables with extreme sizes due to small", "bbox": {"l": 308.862, "t": 704.245193, "r": 545.11511, "b": 713.151764, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Due to the heterogeneity across the dataset formats, it was necessary to combine all available data into one homogenized dataset before we could train our models for practical purposes. Given the size of PubTabNet, we adopted its annotation format and we extracted and converted all tables as PNG images with a resolution of 72 dpi. Additionally, we have filtered out tables with extreme sizes due to small"}], "headers": [{"label": "page_footer", "id": 11, "page_no": 2, "cluster": {"id": 11, "label": "page_footer", "bbox": {"l": 295.121, "t": 734.133198, "r": 300.10229, "b": 743.039761, "coord_origin": "TOPLEFT"}, "confidence": 0.8715606927871704, "cells": [{"id": 134, "text": "3", "bbox": {"l": 295.121, "t": 734.133198, "r": 300.10229, "b": 743.039761, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3"}]}}, {"page_no": 3, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "amount of such tables, and kept only those ones ranging", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 286.36511, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "between 1*1 and 20*10 (rows/columns).", "bbox": {"l": 50.112, "t": 87.16339000000005, "r": 212.28319, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "The availability of the bounding boxes for all table cells", "bbox": {"l": 62.067001, "t": 100.96038999999996, "r": 286.36502, "b": 109.86694, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "is essential to train our models. In order to distinguish be-", "bbox": {"l": 50.112, "t": 112.91540999999995, "r": 286.36508, "b": 121.82195999999999, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "tween empty and non-empty bounding boxes, we have in-", "bbox": {"l": 50.112, "t": 124.87041999999997, "r": 286.36508, "b": 133.77697999999998, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "troduced a binary class in the annotation. Unfortunately, the", "bbox": {"l": 50.112, "t": 136.82641999999998, "r": 286.36511, "b": 145.73297000000002, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "original datasets either omit the bounding boxes for whole", "bbox": {"l": 50.112, "t": 148.78143, "r": 286.36511, "b": 157.68799, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "tables (e.g. TableBank) or they narrow their scope only to", "bbox": {"l": 50.112, "t": 160.73645, "r": 286.36508, "b": 169.64301, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "non-empty cells. Therefore, it was imperative to introduce", "bbox": {"l": 50.112, "t": 172.69146999999998, "r": 286.36505, "b": 181.59802000000002, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "a data pre-processing procedure that generates the missing", "bbox": {"l": 50.112, "t": 184.64648, "r": 286.36508, "b": 193.55304, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "bounding boxes out of the annotation information. This pro-", "bbox": {"l": 50.112, "t": 196.60248, "r": 286.36508, "b": 205.50903000000005, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "cedure first parses the provided table structure and calcu-", "bbox": {"l": 50.112, "t": 208.5575, "r": 286.36508, "b": 217.46405000000004, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "lates the dimensions of the most fine-grained grid that cov-", "bbox": {"l": 50.112, "t": 220.51251000000002, "r": 286.36511, "b": 229.41907000000003, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "ers the table structure. Notice that each table cell may oc-", "bbox": {"l": 50.112, "t": 232.46753, "r": 286.36508, "b": 241.37408000000005, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "cupy multiple grid squares due to row or column spans. In", "bbox": {"l": 50.112, "t": 244.42255, "r": 286.36508, "b": 253.32910000000004, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "case of PubTabNet we had to compute missing bounding", "bbox": {"l": 50.112, "t": 256.37756, "r": 286.36505, "b": 265.28412000000003, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "boxes for 48% of the simple and 69% of the complex ta-", "bbox": {"l": 50.112, "t": 268.33356000000003, "r": 286.36505, "b": 277.24010999999996, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "bles.", "bbox": {"l": 50.112, "t": 280.28853999999995, "r": 68.652397, "b": 289.1951, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Regarding FinTabNet, 68% of the simple and 98%", "bbox": {"l": 75.566444, "t": 280.28853999999995, "r": 286.36514, "b": 289.1951, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "of the complex tables require the generation of bounding", "bbox": {"l": 50.112, "t": 292.24353, "r": 286.36511, "b": 301.15009, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "boxes.", "bbox": {"l": 50.112, "t": 304.19852000000003, "r": 75.695961, "b": 313.10507, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "As it is illustrated in Fig. 2, the table distributions from", "bbox": {"l": 62.067001, "t": 317.99550999999997, "r": 286.36499, "b": 326.90207, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "all datasets are skewed towards simpler structures with", "bbox": {"l": 50.112, "t": 329.95151, "r": 286.36511, "b": 338.8580600000001, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "fewer number of rows/columns. Additionally, there is very", "bbox": {"l": 50.112, "t": 341.90649, "r": 286.36502, "b": 350.81305, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "limited variance in the table styles, which in case of Pub-", "bbox": {"l": 50.112, "t": 353.8614799999999, "r": 286.36505, "b": 362.76804, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "TabNet and FinTabNet means one styling format for the", "bbox": {"l": 50.112, "t": 365.81647, "r": 286.36508, "b": 374.72301999999996, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "majority of the tables.", "bbox": {"l": 50.112, "t": 377.77145, "r": 141.58859, "b": 386.67801, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Similar limitations appear also in", "bbox": {"l": 148.70189, "t": 377.77145, "r": 286.36508, "b": 386.67801, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "the type of table content, which in some cases (e.g. FinTab-", "bbox": {"l": 50.112, "t": 389.72644, "r": 286.36508, "b": 398.63300000000004, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Net) is restricted to a certain domain. Ultimately, the lack", "bbox": {"l": 50.112, "t": 401.68243, "r": 286.36511, "b": 410.58899, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "of diversity in the training dataset damages the ability of the", "bbox": {"l": 50.112, "t": 413.63742, "r": 286.36511, "b": 422.54398, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "models to generalize well on unseen data.", "bbox": {"l": 50.112, "t": 425.59241, "r": 216.39774, "b": 434.49896, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Motivated by those observations we aimed at generating", "bbox": {"l": 62.067001, "t": 439.3894, "r": 286.36499, "b": 448.2959599999999, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "a synthetic table dataset named", "bbox": {"l": 50.112, "t": 451.34439, "r": 172.14388, "b": 460.25095, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "SynthTabNet", "bbox": {"l": 174.14801, "t": 451.43405, "r": 224.70818999999997, "b": 460.02182, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": ". This approach", "bbox": {"l": 224.70801, "t": 451.34439, "r": 286.36655, "b": 460.25095, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "offers control over: 1) the size of the dataset, 2) the table", "bbox": {"l": 50.112015, "t": 463.30038, "r": 286.36505, "b": 472.20694, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "structure, 3) the table style and 4) the type of content. The", "bbox": {"l": 50.112015, "t": 475.25537, "r": 286.36511, "b": 484.16193, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "complexity of the table structure is described by the size of", "bbox": {"l": 50.112015, "t": 487.21036, "r": 286.36511, "b": 496.11691, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "the table header and the table body, as well as the percentage", "bbox": {"l": 50.112015, "t": 499.16534, "r": 286.36508, "b": 508.0719, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "of the table cells covered by row spans and column spans.", "bbox": {"l": 50.112015, "t": 511.12033, "r": 286.36505, "b": 520.02689, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "A set of carefully designed styling templates provides the", "bbox": {"l": 50.112015, "t": 523.07632, "r": 286.36508, "b": 531.98288, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "basis to build a wide range of table appearances. Lastly, the", "bbox": {"l": 50.112015, "t": 535.0313100000001, "r": 286.36508, "b": 543.93788, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "table content is generated out of a curated collection of text", "bbox": {"l": 50.112015, "t": 546.98633, "r": 286.36511, "b": 555.89288, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "corpora. By controlling the size and scope of the synthetic", "bbox": {"l": 50.112015, "t": 558.94133, "r": 286.36508, "b": 567.84789, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "datasets we are able to train and evaluate our models in a", "bbox": {"l": 50.112015, "t": 570.89633, "r": 286.36511, "b": 579.8028899999999, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "variety of different conditions. For example, we can first", "bbox": {"l": 50.112015, "t": 582.85133, "r": 286.36511, "b": 591.75789, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "generate a highly diverse dataset to train our models and", "bbox": {"l": 50.112015, "t": 594.80733, "r": 286.36505, "b": 603.71388, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "then evaluate their performance on other synthetic datasets", "bbox": {"l": 50.112015, "t": 606.76233, "r": 286.36508, "b": 615.6688800000001, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "which are focused on a specific domain.", "bbox": {"l": 50.112015, "t": 618.71733, "r": 209.7527, "b": 627.62389, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "In this regard, we have prepared four synthetic datasets,", "bbox": {"l": 62.067017, "t": 632.51433, "r": 286.36499, "b": 641.42088, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "each one containing 150k examples. The corpora to gener-", "bbox": {"l": 50.112015, "t": 644.46933, "r": 286.36508, "b": 653.37589, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "ate the table text consists of the most frequent terms appear-", "bbox": {"l": 50.112015, "t": 656.42532, "r": 286.36511, "b": 665.33189, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "ing in PubTabNet and FinTabNet together with randomly", "bbox": {"l": 50.112015, "t": 668.38033, "r": 286.36505, "b": 677.28689, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "generated text. The first two synthetic datasets have been", "bbox": {"l": 50.112015, "t": 680.33533, "r": 286.36508, "b": 689.24189, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "fine-tuned to mimic the appearance of the original datasets", "bbox": {"l": 50.112015, "t": 692.290329, "r": 286.36508, "b": 701.196892, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "but encompass more complicated table structures. The third", "bbox": {"l": 50.112015, "t": 704.245331, "r": 286.36511, "b": 713.151894, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Tags", "bbox": {"l": 412.332, "t": 73.61437999999998, "r": 430.90231, "b": 82.52094, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Bbox", "bbox": {"l": 442.85742, "t": 73.61437999999998, "r": 464.4463799999999, "b": 82.52094, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Size", "bbox": {"l": 477.78632, "t": 73.61437999999998, "r": 494.94193, "b": 82.52094, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Format", "bbox": {"l": 508.28186, "t": 73.61437999999998, "r": 536.91437, "b": 82.52094, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "PubTabNet", "bbox": {"l": 317.06, "t": 85.9673499999999, "r": 361.64264, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "3", "bbox": {"l": 417.85599, "t": 85.6684600000001, "r": 425.37775, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "3", "bbox": {"l": 449.89569, "t": 85.6684600000001, "r": 457.41745000000003, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "509k", "bbox": {"l": 476.401, "t": 85.9673499999999, "r": 496.3262, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "PNG", "bbox": {"l": 512.63495, "t": 85.9673499999999, "r": 532.56012, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "FinTabNet", "bbox": {"l": 317.06, "t": 97.92236000000003, "r": 359.43094, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "3", "bbox": {"l": 417.85599, "t": 97.62347, "r": 425.37775, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "3", "bbox": {"l": 449.89569, "t": 97.62347, "r": 457.41745000000003, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "112k", "bbox": {"l": 476.401, "t": 97.92236000000003, "r": 496.3262, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "PDF", "bbox": {"l": 513.46185, "t": 97.92236000000003, "r": 531.73328, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "TableBank", "bbox": {"l": 317.06, "t": 109.87836000000004, "r": 359.97888, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "3", "bbox": {"l": 417.85599, "t": 109.57947000000001, "r": 425.37775, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "7", "bbox": {"l": 450.81226, "t": 109.57947000000001, "r": 456.50091999999995, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "145k", "bbox": {"l": 476.401, "t": 109.87836000000004, "r": 496.3262, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "JPEG", "bbox": {"l": 511.25017999999994, "t": 109.87836000000004, "r": 533.94501, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "Combined-Tabnet(*)", "bbox": {"l": 317.06, "t": 121.83336999999995, "r": 400.37723, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "3", "bbox": {"l": 417.85599, "t": 121.53448000000003, "r": 425.37775, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "3", "bbox": {"l": 449.89569, "t": 121.53448000000003, "r": 457.41745000000003, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "400k", "bbox": {"l": 476.401, "t": 121.83336999999995, "r": 496.3262, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "PNG", "bbox": {"l": 512.63495, "t": 121.83336999999995, "r": 532.56012, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Combined(**)", "bbox": {"l": 317.06, "t": 133.78839000000005, "r": 375.17184, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "3", "bbox": {"l": 417.85599, "t": 133.48950000000002, "r": 425.37775, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "3", "bbox": {"l": 449.89569, "t": 133.48950000000002, "r": 457.41745000000003, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "500k", "bbox": {"l": 476.401, "t": 133.78839000000005, "r": 496.3262, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "PNG", "bbox": {"l": 512.63495, "t": 133.78839000000005, "r": 532.56012, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "SynthTabNet", "bbox": {"l": 317.06, "t": 145.74341000000004, "r": 369.39352, "b": 154.64995999999996, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "3", "bbox": {"l": 417.85599, "t": 145.44446000000005, "r": 425.37775, "b": 154.65985, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "3", "bbox": {"l": 449.89569, "t": 145.44446000000005, "r": 457.41745000000003, "b": 154.65985, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "600k", "bbox": {"l": 476.401, "t": 145.74334999999996, "r": 496.3262, "b": 154.6499, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "PNG", "bbox": {"l": 512.63495, "t": 145.74334999999996, "r": 532.56012, "b": 154.6499, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "Table 1:", "bbox": {"l": 308.862, "t": 167.66138, "r": 344.6178, "b": 176.56793000000005, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Both", "bbox": {"l": 361.07602, "t": 167.66138, "r": 380.45328, "b": 176.56793000000005, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "\u201cCombined-Tabnet\u201d", "bbox": {"l": 386.56799, "t": 167.75104, "r": 468.67974999999996, "b": 176.33880999999997, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "and", "bbox": {"l": 474.79599, "t": 167.66138, "r": 489.18198, "b": 176.56793000000005, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "\u201dCombined-", "bbox": {"l": 495.29898000000003, "t": 167.75104, "r": 545.112, "b": 176.33880999999997, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "Tabnet\u201d", "bbox": {"l": 308.862, "t": 179.70605, "r": 341.16077, "b": 188.29381999999998, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "are variations of the following: (*) The Combined-", "bbox": {"l": 343.457, "t": 179.61639000000002, "r": 545.11005, "b": 188.52295000000004, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "Tabnet dataset is the processed combination of PubTabNet", "bbox": {"l": 308.862, "t": 191.57141000000001, "r": 545.11505, "b": 200.47797000000003, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "and Fintabnet. (**) The combined dataset is the processed", "bbox": {"l": 308.862, "t": 203.52643, "r": 545.11499, "b": 212.43298000000004, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "combination of PubTabNet, Fintabnet and TableBank.", "bbox": {"l": 308.862, "t": 215.48242000000005, "r": 523.93469, "b": 224.38897999999995, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "one adopts a colorful appearance with high contrast and the", "bbox": {"l": 308.862, "t": 249.62041999999997, "r": 545.11517, "b": 258.52698, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "last one contains tables with sparse content. Lastly, we have", "bbox": {"l": 308.862, "t": 261.57543999999996, "r": 545.11517, "b": 270.48199, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "combined all synthetic datasets into one big unified syn-", "bbox": {"l": 308.862, "t": 273.5304, "r": 545.11505, "b": 282.43698, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "thetic dataset of 600k examples.", "bbox": {"l": 308.862, "t": 285.48541000000006, "r": 436.82169, "b": 294.39197, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "Tab. 1 summarizes the various attributes of the datasets.", "bbox": {"l": 320.81699, "t": 297.77240000000006, "r": 542.74396, "b": 306.67896, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "4.", "bbox": {"l": 308.862, "t": 321.18396, "r": 316.28476, "b": 331.93167000000005, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "The TableFormer model", "bbox": {"l": 326.18176, "t": 321.18396, "r": 444.93607000000003, "b": 331.93167000000005, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "Given the image of a table, TableFormer is able to pre-", "bbox": {"l": 320.81699, "t": 341.93939, "r": 545.11499, "b": 350.84594999999996, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "dict: 1) a sequence of tokens that represent the structure of", "bbox": {"l": 308.862, "t": 353.89438, "r": 545.11511, "b": 362.80092999999994, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "a table, and 2) a bounding box coupled to a subset of those", "bbox": {"l": 308.862, "t": 365.84937, "r": 545.11517, "b": 374.75592, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "tokens. The conversion of an image into a sequence of to-", "bbox": {"l": 308.862, "t": 377.80435, "r": 545.11505, "b": 386.71091, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "kens is a well-known task [35, 16]. While attention is often", "bbox": {"l": 308.862, "t": 389.75934000000007, "r": 545.11517, "b": 398.66588999999993, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "used as an implicit method to associate each token of the", "bbox": {"l": 308.862, "t": 401.71432000000004, "r": 545.11523, "b": 410.62088, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "sequence with a position in the original image, an explicit", "bbox": {"l": 308.862, "t": 413.67032, "r": 545.11517, "b": 422.57687, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "association between the individual table-cells and the image", "bbox": {"l": 308.862, "t": 425.62531, "r": 545.11505, "b": 434.53186, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "bounding boxes is also required.", "bbox": {"l": 308.862, "t": 437.58029, "r": 437.9375, "b": 446.48685000000006, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "4.1.", "bbox": {"l": 308.862, "t": 457.69427, "r": 323.14081, "b": 467.54633, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "Model architecture.", "bbox": {"l": 332.66003, "t": 457.69427, "r": 420.16058, "b": 467.54633, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "We now describe in detail the proposed method, which", "bbox": {"l": 320.81699, "t": 476.76529, "r": 545.11487, "b": 485.67184, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "is composed of three main components, see Fig.", "bbox": {"l": 308.862, "t": 488.72028, "r": 509.02054, "b": 497.62683, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "4.", "bbox": {"l": 515.58588, "t": 488.72028, "r": 523.05786, "b": 497.62683, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Our", "bbox": {"l": 529.62323, "t": 488.72028, "r": 545.11505, "b": 497.62683, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "CNN Backbone Network", "bbox": {"l": 308.862, "t": 500.76492, "r": 406.34601, "b": 509.35269, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "encodes the input as a feature vec-", "bbox": {"l": 408.87201, "t": 500.67526, "r": 545.1106, "b": 509.58182, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "tor of predefined length.", "bbox": {"l": 308.862, "t": 512.63126, "r": 409.39459, "b": 521.53781, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "The input feature vector of the", "bbox": {"l": 416.72705, "t": 512.63126, "r": 545.11505, "b": 521.53781, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "encoded image is passed to the", "bbox": {"l": 308.862, "t": 524.58624, "r": 436.194, "b": 533.4928, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "Structure Decoder", "bbox": {"l": 439.526, "t": 524.6759, "r": 513.86694, "b": 533.26367, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "to pro-", "bbox": {"l": 517.43201, "t": 524.58624, "r": 545.10815, "b": 533.4928, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "duce a sequence of HTML tags that represent the structure", "bbox": {"l": 308.862, "t": 536.54124, "r": 545.11511, "b": 545.4478, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "of the table.", "bbox": {"l": 308.862, "t": 548.49625, "r": 358.5455, "b": 557.4028000000001, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "With each prediction of an HTML standard", "bbox": {"l": 365.19055, "t": 548.49625, "r": 545.11517, "b": 557.4028000000001, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "data cell (\u2018", "bbox": {"l": 308.862, "t": 560.45125, "r": 352.40851, "b": 569.3578, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "<", "bbox": {"l": 352.409, "t": 560.29184, "r": 360.1579, "b": 569.13863, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "td", "bbox": {"l": 360.15799, "t": 560.45125, "r": 367.90891, "b": 569.3578, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": ">", "bbox": {"l": 367.909, "t": 560.29184, "r": 375.6579, "b": 569.13863, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "\u2019) the hidden state of that cell is passed to", "bbox": {"l": 375.65799, "t": 560.45125, "r": 545.11182, "b": 569.3578, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "the Cell BBox Decoder. As for spanning cells, such as row", "bbox": {"l": 308.862, "t": 572.40724, "r": 545.11499, "b": 581.3138, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "or column span, the tag is broken down to \u2018", "bbox": {"l": 308.862, "t": 584.3622399999999, "r": 483.11768, "b": 593.2688, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "<", "bbox": {"l": 483.11902, "t": 584.20284, "r": 490.86792, "b": 593.04962, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "\u2019, \u2018rowspan=\u2019", "bbox": {"l": 490.86800999999997, "t": 584.3622399999999, "r": 545.11438, "b": 593.2688, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "or \u2018colspan=\u2019, with the number of spanning cells (attribute),", "bbox": {"l": 308.862, "t": 596.31725, "r": 545.11493, "b": 605.2238, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "and \u2018", "bbox": {"l": 308.862, "t": 608.27225, "r": 329.64395, "b": 617.1788, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": ">", "bbox": {"l": 329.646, "t": 608.11284, "r": 337.3949, "b": 616.9596300000001, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "\u2019. The hidden state attached to \u2018", "bbox": {"l": 337.39398, "t": 608.27225, "r": 468.5914, "b": 617.1788, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "<", "bbox": {"l": 468.59496999999993, "t": 608.11284, "r": 476.34387000000004, "b": 616.9596300000001, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "\u2019 is passed to the", "bbox": {"l": 476.3439599999999, "t": 608.27225, "r": 545.11572, "b": 617.1788, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "Cell BBox Decoder. A shared feed forward network (FFN)", "bbox": {"l": 308.86197, "t": 620.22725, "r": 545.11499, "b": 629.1338000000001, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "receives the hidden states from the Structure Decoder, to", "bbox": {"l": 308.86197, "t": 632.1822500000001, "r": 545.11517, "b": 641.08881, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "provide the final detection predictions of the bounding box", "bbox": {"l": 308.86197, "t": 644.13824, "r": 545.11511, "b": 653.0448, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "coordinates and their classification.", "bbox": {"l": 308.86197, "t": 656.09325, "r": 449.42432, "b": 664.99981, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "CNN Backbone Network.", "bbox": {"l": 320.81696, "t": 668.2607, "r": 431.90985, "b": 677.21707, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "A ResNet-18 CNN is the", "bbox": {"l": 439.49896, "t": 668.3802499999999, "r": 545.11255, "b": 677.2868100000001, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "backbone that receives the table image and encodes it as a", "bbox": {"l": 308.86197, "t": 680.33525, "r": 545.11499, "b": 689.24181, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "vector of predefined length. The network has been modified", "bbox": {"l": 308.86197, "t": 692.290253, "r": 545.11511, "b": 701.196815, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "by removing the linear and pooling layer, as we are not per-", "bbox": {"l": 308.86197, "t": 704.245255, "r": 545.11505, "b": 713.1518169999999, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "4", "bbox": {"l": 295.12097, "t": 734.133251, "r": 300.10226, "b": 743.039814, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 10, "label": "text", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 286.36511, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9611433148384094, "cells": [{"id": 0, "text": "amount of such tables, and kept only those ones ranging", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 286.36511, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "between 1*1 and 20*10 (rows/columns).", "bbox": {"l": 50.112, "t": 87.16339000000005, "r": 212.28319, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 50.112, "t": 100.96038999999996, "r": 286.36514, "b": 313.10507, "coord_origin": "TOPLEFT"}, "confidence": 0.988013744354248, "cells": [{"id": 2, "text": "The availability of the bounding boxes for all table cells", "bbox": {"l": 62.067001, "t": 100.96038999999996, "r": 286.36502, "b": 109.86694, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "is essential to train our models. In order to distinguish be-", "bbox": {"l": 50.112, "t": 112.91540999999995, "r": 286.36508, "b": 121.82195999999999, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "tween empty and non-empty bounding boxes, we have in-", "bbox": {"l": 50.112, "t": 124.87041999999997, "r": 286.36508, "b": 133.77697999999998, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "troduced a binary class in the annotation. Unfortunately, the", "bbox": {"l": 50.112, "t": 136.82641999999998, "r": 286.36511, "b": 145.73297000000002, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "original datasets either omit the bounding boxes for whole", "bbox": {"l": 50.112, "t": 148.78143, "r": 286.36511, "b": 157.68799, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "tables (e.g. TableBank) or they narrow their scope only to", "bbox": {"l": 50.112, "t": 160.73645, "r": 286.36508, "b": 169.64301, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "non-empty cells. Therefore, it was imperative to introduce", "bbox": {"l": 50.112, "t": 172.69146999999998, "r": 286.36505, "b": 181.59802000000002, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "a data pre-processing procedure that generates the missing", "bbox": {"l": 50.112, "t": 184.64648, "r": 286.36508, "b": 193.55304, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "bounding boxes out of the annotation information. This pro-", "bbox": {"l": 50.112, "t": 196.60248, "r": 286.36508, "b": 205.50903000000005, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "cedure first parses the provided table structure and calcu-", "bbox": {"l": 50.112, "t": 208.5575, "r": 286.36508, "b": 217.46405000000004, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "lates the dimensions of the most fine-grained grid that cov-", "bbox": {"l": 50.112, "t": 220.51251000000002, "r": 286.36511, "b": 229.41907000000003, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "ers the table structure. Notice that each table cell may oc-", "bbox": {"l": 50.112, "t": 232.46753, "r": 286.36508, "b": 241.37408000000005, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "cupy multiple grid squares due to row or column spans. In", "bbox": {"l": 50.112, "t": 244.42255, "r": 286.36508, "b": 253.32910000000004, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "case of PubTabNet we had to compute missing bounding", "bbox": {"l": 50.112, "t": 256.37756, "r": 286.36505, "b": 265.28412000000003, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "boxes for 48% of the simple and 69% of the complex ta-", "bbox": {"l": 50.112, "t": 268.33356000000003, "r": 286.36505, "b": 277.24010999999996, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "bles.", "bbox": {"l": 50.112, "t": 280.28853999999995, "r": 68.652397, "b": 289.1951, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Regarding FinTabNet, 68% of the simple and 98%", "bbox": {"l": 75.566444, "t": 280.28853999999995, "r": 286.36514, "b": 289.1951, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "of the complex tables require the generation of bounding", "bbox": {"l": 50.112, "t": 292.24353, "r": 286.36511, "b": 301.15009, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "boxes.", "bbox": {"l": 50.112, "t": 304.19852000000003, "r": 75.695961, "b": 313.10507, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "text", "bbox": {"l": 50.112, "t": 317.99550999999997, "r": 286.36511, "b": 434.49896, "coord_origin": "TOPLEFT"}, "confidence": 0.9873981475830078, "cells": [{"id": 21, "text": "As it is illustrated in Fig. 2, the table distributions from", "bbox": {"l": 62.067001, "t": 317.99550999999997, "r": 286.36499, "b": 326.90207, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "all datasets are skewed towards simpler structures with", "bbox": {"l": 50.112, "t": 329.95151, "r": 286.36511, "b": 338.8580600000001, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "fewer number of rows/columns. Additionally, there is very", "bbox": {"l": 50.112, "t": 341.90649, "r": 286.36502, "b": 350.81305, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "limited variance in the table styles, which in case of Pub-", "bbox": {"l": 50.112, "t": 353.8614799999999, "r": 286.36505, "b": 362.76804, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "TabNet and FinTabNet means one styling format for the", "bbox": {"l": 50.112, "t": 365.81647, "r": 286.36508, "b": 374.72301999999996, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "majority of the tables.", "bbox": {"l": 50.112, "t": 377.77145, "r": 141.58859, "b": 386.67801, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Similar limitations appear also in", "bbox": {"l": 148.70189, "t": 377.77145, "r": 286.36508, "b": 386.67801, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "the type of table content, which in some cases (e.g. FinTab-", "bbox": {"l": 50.112, "t": 389.72644, "r": 286.36508, "b": 398.63300000000004, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Net) is restricted to a certain domain. Ultimately, the lack", "bbox": {"l": 50.112, "t": 401.68243, "r": 286.36511, "b": 410.58899, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "of diversity in the training dataset damages the ability of the", "bbox": {"l": 50.112, "t": 413.63742, "r": 286.36511, "b": 422.54398, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "models to generalize well on unseen data.", "bbox": {"l": 50.112, "t": 425.59241, "r": 216.39774, "b": 434.49896, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 50.112, "t": 439.3894, "r": 286.36655, "b": 627.62389, "coord_origin": "TOPLEFT"}, "confidence": 0.9876030087471008, "cells": [{"id": 32, "text": "Motivated by those observations we aimed at generating", "bbox": {"l": 62.067001, "t": 439.3894, "r": 286.36499, "b": 448.2959599999999, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "a synthetic table dataset named", "bbox": {"l": 50.112, "t": 451.34439, "r": 172.14388, "b": 460.25095, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "SynthTabNet", "bbox": {"l": 174.14801, "t": 451.43405, "r": 224.70818999999997, "b": 460.02182, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": ". This approach", "bbox": {"l": 224.70801, "t": 451.34439, "r": 286.36655, "b": 460.25095, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "offers control over: 1) the size of the dataset, 2) the table", "bbox": {"l": 50.112015, "t": 463.30038, "r": 286.36505, "b": 472.20694, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "structure, 3) the table style and 4) the type of content. The", "bbox": {"l": 50.112015, "t": 475.25537, "r": 286.36511, "b": 484.16193, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "complexity of the table structure is described by the size of", "bbox": {"l": 50.112015, "t": 487.21036, "r": 286.36511, "b": 496.11691, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "the table header and the table body, as well as the percentage", "bbox": {"l": 50.112015, "t": 499.16534, "r": 286.36508, "b": 508.0719, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "of the table cells covered by row spans and column spans.", "bbox": {"l": 50.112015, "t": 511.12033, "r": 286.36505, "b": 520.02689, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "A set of carefully designed styling templates provides the", "bbox": {"l": 50.112015, "t": 523.07632, "r": 286.36508, "b": 531.98288, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "basis to build a wide range of table appearances. Lastly, the", "bbox": {"l": 50.112015, "t": 535.0313100000001, "r": 286.36508, "b": 543.93788, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "table content is generated out of a curated collection of text", "bbox": {"l": 50.112015, "t": 546.98633, "r": 286.36511, "b": 555.89288, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "corpora. By controlling the size and scope of the synthetic", "bbox": {"l": 50.112015, "t": 558.94133, "r": 286.36508, "b": 567.84789, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "datasets we are able to train and evaluate our models in a", "bbox": {"l": 50.112015, "t": 570.89633, "r": 286.36511, "b": 579.8028899999999, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "variety of different conditions. For example, we can first", "bbox": {"l": 50.112015, "t": 582.85133, "r": 286.36511, "b": 591.75789, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "generate a highly diverse dataset to train our models and", "bbox": {"l": 50.112015, "t": 594.80733, "r": 286.36505, "b": 603.71388, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "then evaluate their performance on other synthetic datasets", "bbox": {"l": 50.112015, "t": 606.76233, "r": 286.36508, "b": 615.6688800000001, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "which are focused on a specific domain.", "bbox": {"l": 50.112015, "t": 618.71733, "r": 209.7527, "b": 627.62389, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "text", "bbox": {"l": 50.112015, "t": 632.51433, "r": 286.36511, "b": 713.151894, "coord_origin": "TOPLEFT"}, "confidence": 0.9871614575386047, "cells": [{"id": 50, "text": "In this regard, we have prepared four synthetic datasets,", "bbox": {"l": 62.067017, "t": 632.51433, "r": 286.36499, "b": 641.42088, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "each one containing 150k examples. The corpora to gener-", "bbox": {"l": 50.112015, "t": 644.46933, "r": 286.36508, "b": 653.37589, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "ate the table text consists of the most frequent terms appear-", "bbox": {"l": 50.112015, "t": 656.42532, "r": 286.36511, "b": 665.33189, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "ing in PubTabNet and FinTabNet together with randomly", "bbox": {"l": 50.112015, "t": 668.38033, "r": 286.36505, "b": 677.28689, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "generated text. The first two synthetic datasets have been", "bbox": {"l": 50.112015, "t": 680.33533, "r": 286.36508, "b": 689.24189, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "fine-tuned to mimic the appearance of the original datasets", "bbox": {"l": 50.112015, "t": 692.290329, "r": 286.36508, "b": 701.196892, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "but encompass more complicated table structures. The third", "bbox": {"l": 50.112015, "t": 704.245331, "r": 286.36511, "b": 713.151894, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "table", "bbox": {"l": 310.67584228515625, "t": 73.19388580322266, "r": 542.9547119140625, "b": 155.22052001953125, "coord_origin": "TOPLEFT"}, "confidence": 0.9777463674545288, "cells": [{"id": 57, "text": "Tags", "bbox": {"l": 412.332, "t": 73.61437999999998, "r": 430.90231, "b": 82.52094, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Bbox", "bbox": {"l": 442.85742, "t": 73.61437999999998, "r": 464.4463799999999, "b": 82.52094, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Size", "bbox": {"l": 477.78632, "t": 73.61437999999998, "r": 494.94193, "b": 82.52094, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Format", "bbox": {"l": 508.28186, "t": 73.61437999999998, "r": 536.91437, "b": 82.52094, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "PubTabNet", "bbox": {"l": 317.06, "t": 85.9673499999999, "r": 361.64264, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "3", "bbox": {"l": 417.85599, "t": 85.6684600000001, "r": 425.37775, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "3", "bbox": {"l": 449.89569, "t": 85.6684600000001, "r": 457.41745000000003, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "509k", "bbox": {"l": 476.401, "t": 85.9673499999999, "r": 496.3262, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "PNG", "bbox": {"l": 512.63495, "t": 85.9673499999999, "r": 532.56012, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "FinTabNet", "bbox": {"l": 317.06, "t": 97.92236000000003, "r": 359.43094, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "3", "bbox": {"l": 417.85599, "t": 97.62347, "r": 425.37775, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "3", "bbox": {"l": 449.89569, "t": 97.62347, "r": 457.41745000000003, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "112k", "bbox": {"l": 476.401, "t": 97.92236000000003, "r": 496.3262, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "PDF", "bbox": {"l": 513.46185, "t": 97.92236000000003, "r": 531.73328, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "TableBank", "bbox": {"l": 317.06, "t": 109.87836000000004, "r": 359.97888, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "3", "bbox": {"l": 417.85599, "t": 109.57947000000001, "r": 425.37775, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "7", "bbox": {"l": 450.81226, "t": 109.57947000000001, "r": 456.50091999999995, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "145k", "bbox": {"l": 476.401, "t": 109.87836000000004, "r": 496.3262, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "JPEG", "bbox": {"l": 511.25017999999994, "t": 109.87836000000004, "r": 533.94501, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "Combined-Tabnet(*)", "bbox": {"l": 317.06, "t": 121.83336999999995, "r": 400.37723, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "3", "bbox": {"l": 417.85599, "t": 121.53448000000003, "r": 425.37775, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "3", "bbox": {"l": 449.89569, "t": 121.53448000000003, "r": 457.41745000000003, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "400k", "bbox": {"l": 476.401, "t": 121.83336999999995, "r": 496.3262, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "PNG", "bbox": {"l": 512.63495, "t": 121.83336999999995, "r": 532.56012, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Combined(**)", "bbox": {"l": 317.06, "t": 133.78839000000005, "r": 375.17184, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "3", "bbox": {"l": 417.85599, "t": 133.48950000000002, "r": 425.37775, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "3", "bbox": {"l": 449.89569, "t": 133.48950000000002, "r": 457.41745000000003, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "500k", "bbox": {"l": 476.401, "t": 133.78839000000005, "r": 496.3262, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "PNG", "bbox": {"l": 512.63495, "t": 133.78839000000005, "r": 532.56012, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "SynthTabNet", "bbox": {"l": 317.06, "t": 145.74341000000004, "r": 369.39352, "b": 154.64995999999996, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "3", "bbox": {"l": 417.85599, "t": 145.44446000000005, "r": 425.37775, "b": 154.65985, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "3", "bbox": {"l": 449.89569, "t": 145.44446000000005, "r": 457.41745000000003, "b": 154.65985, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "600k", "bbox": {"l": 476.401, "t": 145.74334999999996, "r": 496.3262, "b": 154.6499, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "PNG", "bbox": {"l": 512.63495, "t": 145.74334999999996, "r": 532.56012, "b": 154.6499, "coord_origin": "TOPLEFT"}}], "children": [{"id": 15, "label": "text", "bbox": {"l": 412.332, "t": 73.61437999999998, "r": 430.90231, "b": 82.52094, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "Tags", "bbox": {"l": 412.332, "t": 73.61437999999998, "r": 430.90231, "b": 82.52094, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 442.85742, "t": 73.61437999999998, "r": 464.4463799999999, "b": 82.52094, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "Bbox", "bbox": {"l": 442.85742, "t": 73.61437999999998, "r": 464.4463799999999, "b": 82.52094, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 477.78632, "t": 73.61437999999998, "r": 494.94193, "b": 82.52094, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "Size", "bbox": {"l": 477.78632, "t": 73.61437999999998, "r": 494.94193, "b": 82.52094, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 508.28186, "t": 73.61437999999998, "r": 536.91437, "b": 82.52094, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "Format", "bbox": {"l": 508.28186, "t": 73.61437999999998, "r": 536.91437, "b": 82.52094, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 317.06, "t": 85.9673499999999, "r": 361.64264, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "PubTabNet", "bbox": {"l": 317.06, "t": 85.9673499999999, "r": 361.64264, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 417.85599, "t": 85.6684600000001, "r": 425.37775, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "3", "bbox": {"l": 417.85599, "t": 85.6684600000001, "r": 425.37775, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 449.89569, "t": 85.6684600000001, "r": 457.41745000000003, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "3", "bbox": {"l": 449.89569, "t": 85.6684600000001, "r": 457.41745000000003, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 476.401, "t": 85.9673499999999, "r": 496.3262, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "509k", "bbox": {"l": 476.401, "t": 85.9673499999999, "r": 496.3262, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 512.63495, "t": 85.9673499999999, "r": 532.56012, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "PNG", "bbox": {"l": 512.63495, "t": 85.9673499999999, "r": 532.56012, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 317.06, "t": 97.92236000000003, "r": 359.43094, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "FinTabNet", "bbox": {"l": 317.06, "t": 97.92236000000003, "r": 359.43094, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 417.85599, "t": 97.62347, "r": 425.37775, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "3", "bbox": {"l": 417.85599, "t": 97.62347, "r": 425.37775, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 449.89569, "t": 97.62347, "r": 457.41745000000003, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "3", "bbox": {"l": 449.89569, "t": 97.62347, "r": 457.41745000000003, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 476.401, "t": 97.92236000000003, "r": 496.3262, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "112k", "bbox": {"l": 476.401, "t": 97.92236000000003, "r": 496.3262, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 513.46185, "t": 97.92236000000003, "r": 531.73328, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "PDF", "bbox": {"l": 513.46185, "t": 97.92236000000003, "r": 531.73328, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 317.06, "t": 109.87836000000004, "r": 359.97888, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "TableBank", "bbox": {"l": 317.06, "t": 109.87836000000004, "r": 359.97888, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 417.85599, "t": 109.57947000000001, "r": 425.37775, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "3", "bbox": {"l": 417.85599, "t": 109.57947000000001, "r": 425.37775, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 450.81226, "t": 109.57947000000001, "r": 456.50091999999995, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "7", "bbox": {"l": 450.81226, "t": 109.57947000000001, "r": 456.50091999999995, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 476.401, "t": 109.87836000000004, "r": 496.3262, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "145k", "bbox": {"l": 476.401, "t": 109.87836000000004, "r": 496.3262, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 511.25017999999994, "t": 109.87836000000004, "r": 533.94501, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "JPEG", "bbox": {"l": 511.25017999999994, "t": 109.87836000000004, "r": 533.94501, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 317.06, "t": 121.83336999999995, "r": 400.37723, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "Combined-Tabnet(*)", "bbox": {"l": 317.06, "t": 121.83336999999995, "r": 400.37723, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 417.85599, "t": 121.53448000000003, "r": 425.37775, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "3", "bbox": {"l": 417.85599, "t": 121.53448000000003, "r": 425.37775, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 449.89569, "t": 121.53448000000003, "r": 457.41745000000003, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "3", "bbox": {"l": 449.89569, "t": 121.53448000000003, "r": 457.41745000000003, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 476.401, "t": 121.83336999999995, "r": 496.3262, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "400k", "bbox": {"l": 476.401, "t": 121.83336999999995, "r": 496.3262, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 512.63495, "t": 121.83336999999995, "r": 532.56012, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "PNG", "bbox": {"l": 512.63495, "t": 121.83336999999995, "r": 532.56012, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 317.06, "t": 133.78839000000005, "r": 375.17184, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "Combined(**)", "bbox": {"l": 317.06, "t": 133.78839000000005, "r": 375.17184, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 417.85599, "t": 133.48950000000002, "r": 425.37775, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "3", "bbox": {"l": 417.85599, "t": 133.48950000000002, "r": 425.37775, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 449.89569, "t": 133.48950000000002, "r": 457.41745000000003, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "3", "bbox": {"l": 449.89569, "t": 133.48950000000002, "r": 457.41745000000003, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 476.401, "t": 133.78839000000005, "r": 496.3262, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "500k", "bbox": {"l": 476.401, "t": 133.78839000000005, "r": 496.3262, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 512.63495, "t": 133.78839000000005, "r": 532.56012, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "PNG", "bbox": {"l": 512.63495, "t": 133.78839000000005, "r": 532.56012, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 317.06, "t": 145.74341000000004, "r": 369.39352, "b": 154.64995999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "SynthTabNet", "bbox": {"l": 317.06, "t": 145.74341000000004, "r": 369.39352, "b": 154.64995999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 417.85599, "t": 145.44446000000005, "r": 425.37775, "b": 154.65985, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "3", "bbox": {"l": 417.85599, "t": 145.44446000000005, "r": 425.37775, "b": 154.65985, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 449.89569, "t": 145.44446000000005, "r": 457.41745000000003, "b": 154.65985, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "3", "bbox": {"l": 449.89569, "t": 145.44446000000005, "r": 457.41745000000003, "b": 154.65985, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 476.401, "t": 145.74334999999996, "r": 496.3262, "b": 154.6499, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "600k", "bbox": {"l": 476.401, "t": 145.74334999999996, "r": 496.3262, "b": 154.6499, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 512.63495, "t": 145.74334999999996, "r": 532.56012, "b": 154.6499, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "PNG", "bbox": {"l": 512.63495, "t": 145.74334999999996, "r": 532.56012, "b": 154.6499, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 9, "label": "caption", "bbox": {"l": 308.862, "t": 167.66138, "r": 545.11505, "b": 224.38897999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9667726755142212, "cells": [{"id": 91, "text": "Table 1:", "bbox": {"l": 308.862, "t": 167.66138, "r": 344.6178, "b": 176.56793000000005, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Both", "bbox": {"l": 361.07602, "t": 167.66138, "r": 380.45328, "b": 176.56793000000005, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "\u201cCombined-Tabnet\u201d", "bbox": {"l": 386.56799, "t": 167.75104, "r": 468.67974999999996, "b": 176.33880999999997, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "and", "bbox": {"l": 474.79599, "t": 167.66138, "r": 489.18198, "b": 176.56793000000005, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "\u201dCombined-", "bbox": {"l": 495.29898000000003, "t": 167.75104, "r": 545.112, "b": 176.33880999999997, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "Tabnet\u201d", "bbox": {"l": 308.862, "t": 179.70605, "r": 341.16077, "b": 188.29381999999998, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "are variations of the following: (*) The Combined-", "bbox": {"l": 343.457, "t": 179.61639000000002, "r": 545.11005, "b": 188.52295000000004, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "Tabnet dataset is the processed combination of PubTabNet", "bbox": {"l": 308.862, "t": 191.57141000000001, "r": 545.11505, "b": 200.47797000000003, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "and Fintabnet. (**) The combined dataset is the processed", "bbox": {"l": 308.862, "t": 203.52643, "r": 545.11499, "b": 212.43298000000004, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "combination of PubTabNet, Fintabnet and TableBank.", "bbox": {"l": 308.862, "t": 215.48242000000005, "r": 523.93469, "b": 224.38897999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "text", "bbox": {"l": 308.862, "t": 249.62041999999997, "r": 545.11517, "b": 294.39197, "coord_origin": "TOPLEFT"}, "confidence": 0.978954017162323, "cells": [{"id": 101, "text": "one adopts a colorful appearance with high contrast and the", "bbox": {"l": 308.862, "t": 249.62041999999997, "r": 545.11517, "b": 258.52698, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "last one contains tables with sparse content. Lastly, we have", "bbox": {"l": 308.862, "t": 261.57543999999996, "r": 545.11517, "b": 270.48199, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "combined all synthetic datasets into one big unified syn-", "bbox": {"l": 308.862, "t": 273.5304, "r": 545.11505, "b": 282.43698, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "thetic dataset of 600k examples.", "bbox": {"l": 308.862, "t": 285.48541000000006, "r": 436.82169, "b": 294.39197, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 320.81699, "t": 297.77240000000006, "r": 542.74396, "b": 306.67896, "coord_origin": "TOPLEFT"}, "confidence": 0.9043695330619812, "cells": [{"id": 105, "text": "Tab. 1 summarizes the various attributes of the datasets.", "bbox": {"l": 320.81699, "t": 297.77240000000006, "r": 542.74396, "b": 306.67896, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "section_header", "bbox": {"l": 308.862, "t": 321.18396, "r": 444.93607000000003, "b": 331.93167000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9466595649719238, "cells": [{"id": 106, "text": "4.", "bbox": {"l": 308.862, "t": 321.18396, "r": 316.28476, "b": 331.93167000000005, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "The TableFormer model", "bbox": {"l": 326.18176, "t": 321.18396, "r": 444.93607000000003, "b": 331.93167000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 308.862, "t": 341.93939, "r": 545.11523, "b": 446.48685000000006, "coord_origin": "TOPLEFT"}, "confidence": 0.9884450435638428, "cells": [{"id": 108, "text": "Given the image of a table, TableFormer is able to pre-", "bbox": {"l": 320.81699, "t": 341.93939, "r": 545.11499, "b": 350.84594999999996, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "dict: 1) a sequence of tokens that represent the structure of", "bbox": {"l": 308.862, "t": 353.89438, "r": 545.11511, "b": 362.80092999999994, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "a table, and 2) a bounding box coupled to a subset of those", "bbox": {"l": 308.862, "t": 365.84937, "r": 545.11517, "b": 374.75592, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "tokens. The conversion of an image into a sequence of to-", "bbox": {"l": 308.862, "t": 377.80435, "r": 545.11505, "b": 386.71091, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "kens is a well-known task [35, 16]. While attention is often", "bbox": {"l": 308.862, "t": 389.75934000000007, "r": 545.11517, "b": 398.66588999999993, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "used as an implicit method to associate each token of the", "bbox": {"l": 308.862, "t": 401.71432000000004, "r": 545.11523, "b": 410.62088, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "sequence with a position in the original image, an explicit", "bbox": {"l": 308.862, "t": 413.67032, "r": 545.11517, "b": 422.57687, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "association between the individual table-cells and the image", "bbox": {"l": 308.862, "t": 425.62531, "r": 545.11505, "b": 434.53186, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "bounding boxes is also required.", "bbox": {"l": 308.862, "t": 437.58029, "r": 437.9375, "b": 446.48685000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "section_header", "bbox": {"l": 308.862, "t": 457.69427, "r": 420.16058, "b": 467.54633, "coord_origin": "TOPLEFT"}, "confidence": 0.937696099281311, "cells": [{"id": 117, "text": "4.1.", "bbox": {"l": 308.862, "t": 457.69427, "r": 323.14081, "b": 467.54633, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "Model architecture.", "bbox": {"l": 332.66003, "t": 457.69427, "r": 420.16058, "b": 467.54633, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 308.86197, "t": 476.76529, "r": 545.11572, "b": 664.99981, "coord_origin": "TOPLEFT"}, "confidence": 0.9878323078155518, "cells": [{"id": 119, "text": "We now describe in detail the proposed method, which", "bbox": {"l": 320.81699, "t": 476.76529, "r": 545.11487, "b": 485.67184, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "is composed of three main components, see Fig.", "bbox": {"l": 308.862, "t": 488.72028, "r": 509.02054, "b": 497.62683, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "4.", "bbox": {"l": 515.58588, "t": 488.72028, "r": 523.05786, "b": 497.62683, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Our", "bbox": {"l": 529.62323, "t": 488.72028, "r": 545.11505, "b": 497.62683, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "CNN Backbone Network", "bbox": {"l": 308.862, "t": 500.76492, "r": 406.34601, "b": 509.35269, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "encodes the input as a feature vec-", "bbox": {"l": 408.87201, "t": 500.67526, "r": 545.1106, "b": 509.58182, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "tor of predefined length.", "bbox": {"l": 308.862, "t": 512.63126, "r": 409.39459, "b": 521.53781, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "The input feature vector of the", "bbox": {"l": 416.72705, "t": 512.63126, "r": 545.11505, "b": 521.53781, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "encoded image is passed to the", "bbox": {"l": 308.862, "t": 524.58624, "r": 436.194, "b": 533.4928, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "Structure Decoder", "bbox": {"l": 439.526, "t": 524.6759, "r": 513.86694, "b": 533.26367, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "to pro-", "bbox": {"l": 517.43201, "t": 524.58624, "r": 545.10815, "b": 533.4928, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "duce a sequence of HTML tags that represent the structure", "bbox": {"l": 308.862, "t": 536.54124, "r": 545.11511, "b": 545.4478, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "of the table.", "bbox": {"l": 308.862, "t": 548.49625, "r": 358.5455, "b": 557.4028000000001, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "With each prediction of an HTML standard", "bbox": {"l": 365.19055, "t": 548.49625, "r": 545.11517, "b": 557.4028000000001, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "data cell (\u2018", "bbox": {"l": 308.862, "t": 560.45125, "r": 352.40851, "b": 569.3578, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "<", "bbox": {"l": 352.409, "t": 560.29184, "r": 360.1579, "b": 569.13863, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "td", "bbox": {"l": 360.15799, "t": 560.45125, "r": 367.90891, "b": 569.3578, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": ">", "bbox": {"l": 367.909, "t": 560.29184, "r": 375.6579, "b": 569.13863, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "\u2019) the hidden state of that cell is passed to", "bbox": {"l": 375.65799, "t": 560.45125, "r": 545.11182, "b": 569.3578, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "the Cell BBox Decoder. As for spanning cells, such as row", "bbox": {"l": 308.862, "t": 572.40724, "r": 545.11499, "b": 581.3138, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "or column span, the tag is broken down to \u2018", "bbox": {"l": 308.862, "t": 584.3622399999999, "r": 483.11768, "b": 593.2688, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "<", "bbox": {"l": 483.11902, "t": 584.20284, "r": 490.86792, "b": 593.04962, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "\u2019, \u2018rowspan=\u2019", "bbox": {"l": 490.86800999999997, "t": 584.3622399999999, "r": 545.11438, "b": 593.2688, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "or \u2018colspan=\u2019, with the number of spanning cells (attribute),", "bbox": {"l": 308.862, "t": 596.31725, "r": 545.11493, "b": 605.2238, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "and \u2018", "bbox": {"l": 308.862, "t": 608.27225, "r": 329.64395, "b": 617.1788, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": ">", "bbox": {"l": 329.646, "t": 608.11284, "r": 337.3949, "b": 616.9596300000001, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "\u2019. The hidden state attached to \u2018", "bbox": {"l": 337.39398, "t": 608.27225, "r": 468.5914, "b": 617.1788, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "<", "bbox": {"l": 468.59496999999993, "t": 608.11284, "r": 476.34387000000004, "b": 616.9596300000001, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "\u2019 is passed to the", "bbox": {"l": 476.3439599999999, "t": 608.27225, "r": 545.11572, "b": 617.1788, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "Cell BBox Decoder. A shared feed forward network (FFN)", "bbox": {"l": 308.86197, "t": 620.22725, "r": 545.11499, "b": 629.1338000000001, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "receives the hidden states from the Structure Decoder, to", "bbox": {"l": 308.86197, "t": 632.1822500000001, "r": 545.11517, "b": 641.08881, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "provide the final detection predictions of the bounding box", "bbox": {"l": 308.86197, "t": 644.13824, "r": 545.11511, "b": 653.0448, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "coordinates and their classification.", "bbox": {"l": 308.86197, "t": 656.09325, "r": 449.42432, "b": 664.99981, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "text", "bbox": {"l": 308.86197, "t": 668.2607, "r": 545.11511, "b": 713.1518169999999, "coord_origin": "TOPLEFT"}, "confidence": 0.978580117225647, "cells": [{"id": 152, "text": "CNN Backbone Network.", "bbox": {"l": 320.81696, "t": 668.2607, "r": 431.90985, "b": 677.21707, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "A ResNet-18 CNN is the", "bbox": {"l": 439.49896, "t": 668.3802499999999, "r": 545.11255, "b": 677.2868100000001, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "backbone that receives the table image and encodes it as a", "bbox": {"l": 308.86197, "t": 680.33525, "r": 545.11499, "b": 689.24181, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "vector of predefined length. The network has been modified", "bbox": {"l": 308.86197, "t": 692.290253, "r": 545.11511, "b": 701.196815, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "by removing the linear and pooling layer, as we are not per-", "bbox": {"l": 308.86197, "t": 704.245255, "r": 545.11505, "b": 713.1518169999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "page_footer", "bbox": {"l": 295.12097, "t": 734.133251, "r": 300.10226, "b": 743.039814, "coord_origin": "TOPLEFT"}, "confidence": 0.8565718531608582, "cells": [{"id": 157, "text": "4", "bbox": {"l": 295.12097, "t": 734.133251, "r": 300.10226, "b": 743.039814, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {"8": {"label": "table", "id": 8, "page_no": 3, "cluster": {"id": 8, "label": "table", "bbox": {"l": 310.67584228515625, "t": 73.19388580322266, "r": 542.9547119140625, "b": 155.22052001953125, "coord_origin": "TOPLEFT"}, "confidence": 0.9777463674545288, "cells": [{"id": 57, "text": "Tags", "bbox": {"l": 412.332, "t": 73.61437999999998, "r": 430.90231, "b": 82.52094, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Bbox", "bbox": {"l": 442.85742, "t": 73.61437999999998, "r": 464.4463799999999, "b": 82.52094, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Size", "bbox": {"l": 477.78632, "t": 73.61437999999998, "r": 494.94193, "b": 82.52094, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Format", "bbox": {"l": 508.28186, "t": 73.61437999999998, "r": 536.91437, "b": 82.52094, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "PubTabNet", "bbox": {"l": 317.06, "t": 85.9673499999999, "r": 361.64264, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "3", "bbox": {"l": 417.85599, "t": 85.6684600000001, "r": 425.37775, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "3", "bbox": {"l": 449.89569, "t": 85.6684600000001, "r": 457.41745000000003, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "509k", "bbox": {"l": 476.401, "t": 85.9673499999999, "r": 496.3262, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "PNG", "bbox": {"l": 512.63495, "t": 85.9673499999999, "r": 532.56012, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "FinTabNet", "bbox": {"l": 317.06, "t": 97.92236000000003, "r": 359.43094, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "3", "bbox": {"l": 417.85599, "t": 97.62347, "r": 425.37775, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "3", "bbox": {"l": 449.89569, "t": 97.62347, "r": 457.41745000000003, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "112k", "bbox": {"l": 476.401, "t": 97.92236000000003, "r": 496.3262, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "PDF", "bbox": {"l": 513.46185, "t": 97.92236000000003, "r": 531.73328, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "TableBank", "bbox": {"l": 317.06, "t": 109.87836000000004, "r": 359.97888, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "3", "bbox": {"l": 417.85599, "t": 109.57947000000001, "r": 425.37775, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "7", "bbox": {"l": 450.81226, "t": 109.57947000000001, "r": 456.50091999999995, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "145k", "bbox": {"l": 476.401, "t": 109.87836000000004, "r": 496.3262, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "JPEG", "bbox": {"l": 511.25017999999994, "t": 109.87836000000004, "r": 533.94501, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "Combined-Tabnet(*)", "bbox": {"l": 317.06, "t": 121.83336999999995, "r": 400.37723, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "3", "bbox": {"l": 417.85599, "t": 121.53448000000003, "r": 425.37775, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "3", "bbox": {"l": 449.89569, "t": 121.53448000000003, "r": 457.41745000000003, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "400k", "bbox": {"l": 476.401, "t": 121.83336999999995, "r": 496.3262, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "PNG", "bbox": {"l": 512.63495, "t": 121.83336999999995, "r": 532.56012, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Combined(**)", "bbox": {"l": 317.06, "t": 133.78839000000005, "r": 375.17184, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "3", "bbox": {"l": 417.85599, "t": 133.48950000000002, "r": 425.37775, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "3", "bbox": {"l": 449.89569, "t": 133.48950000000002, "r": 457.41745000000003, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "500k", "bbox": {"l": 476.401, "t": 133.78839000000005, "r": 496.3262, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "PNG", "bbox": {"l": 512.63495, "t": 133.78839000000005, "r": 532.56012, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "SynthTabNet", "bbox": {"l": 317.06, "t": 145.74341000000004, "r": 369.39352, "b": 154.64995999999996, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "3", "bbox": {"l": 417.85599, "t": 145.44446000000005, "r": 425.37775, "b": 154.65985, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "3", "bbox": {"l": 449.89569, "t": 145.44446000000005, "r": 457.41745000000003, "b": 154.65985, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "600k", "bbox": {"l": 476.401, "t": 145.74334999999996, "r": 496.3262, "b": 154.6499, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "PNG", "bbox": {"l": 512.63495, "t": 145.74334999999996, "r": 532.56012, "b": 154.6499, "coord_origin": "TOPLEFT"}}], "children": [{"id": 15, "label": "text", "bbox": {"l": 412.332, "t": 73.61437999999998, "r": 430.90231, "b": 82.52094, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "Tags", "bbox": {"l": 412.332, "t": 73.61437999999998, "r": 430.90231, "b": 82.52094, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 442.85742, "t": 73.61437999999998, "r": 464.4463799999999, "b": 82.52094, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "Bbox", "bbox": {"l": 442.85742, "t": 73.61437999999998, "r": 464.4463799999999, "b": 82.52094, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 477.78632, "t": 73.61437999999998, "r": 494.94193, "b": 82.52094, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "Size", "bbox": {"l": 477.78632, "t": 73.61437999999998, "r": 494.94193, "b": 82.52094, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 508.28186, "t": 73.61437999999998, "r": 536.91437, "b": 82.52094, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "Format", "bbox": {"l": 508.28186, "t": 73.61437999999998, "r": 536.91437, "b": 82.52094, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 317.06, "t": 85.9673499999999, "r": 361.64264, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "PubTabNet", "bbox": {"l": 317.06, "t": 85.9673499999999, "r": 361.64264, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 417.85599, "t": 85.6684600000001, "r": 425.37775, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "3", "bbox": {"l": 417.85599, "t": 85.6684600000001, "r": 425.37775, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 449.89569, "t": 85.6684600000001, "r": 457.41745000000003, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "3", "bbox": {"l": 449.89569, "t": 85.6684600000001, "r": 457.41745000000003, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 476.401, "t": 85.9673499999999, "r": 496.3262, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "509k", "bbox": {"l": 476.401, "t": 85.9673499999999, "r": 496.3262, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 512.63495, "t": 85.9673499999999, "r": 532.56012, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "PNG", "bbox": {"l": 512.63495, "t": 85.9673499999999, "r": 532.56012, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 317.06, "t": 97.92236000000003, "r": 359.43094, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "FinTabNet", "bbox": {"l": 317.06, "t": 97.92236000000003, "r": 359.43094, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 417.85599, "t": 97.62347, "r": 425.37775, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "3", "bbox": {"l": 417.85599, "t": 97.62347, "r": 425.37775, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 449.89569, "t": 97.62347, "r": 457.41745000000003, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "3", "bbox": {"l": 449.89569, "t": 97.62347, "r": 457.41745000000003, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 476.401, "t": 97.92236000000003, "r": 496.3262, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "112k", "bbox": {"l": 476.401, "t": 97.92236000000003, "r": 496.3262, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 513.46185, "t": 97.92236000000003, "r": 531.73328, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "PDF", "bbox": {"l": 513.46185, "t": 97.92236000000003, "r": 531.73328, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 317.06, "t": 109.87836000000004, "r": 359.97888, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "TableBank", "bbox": {"l": 317.06, "t": 109.87836000000004, "r": 359.97888, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 417.85599, "t": 109.57947000000001, "r": 425.37775, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "3", "bbox": {"l": 417.85599, "t": 109.57947000000001, "r": 425.37775, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 450.81226, "t": 109.57947000000001, "r": 456.50091999999995, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "7", "bbox": {"l": 450.81226, "t": 109.57947000000001, "r": 456.50091999999995, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 476.401, "t": 109.87836000000004, "r": 496.3262, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "145k", "bbox": {"l": 476.401, "t": 109.87836000000004, "r": 496.3262, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 511.25017999999994, "t": 109.87836000000004, "r": 533.94501, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "JPEG", "bbox": {"l": 511.25017999999994, "t": 109.87836000000004, "r": 533.94501, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 317.06, "t": 121.83336999999995, "r": 400.37723, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "Combined-Tabnet(*)", "bbox": {"l": 317.06, "t": 121.83336999999995, "r": 400.37723, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 417.85599, "t": 121.53448000000003, "r": 425.37775, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "3", "bbox": {"l": 417.85599, "t": 121.53448000000003, "r": 425.37775, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 449.89569, "t": 121.53448000000003, "r": 457.41745000000003, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "3", "bbox": {"l": 449.89569, "t": 121.53448000000003, "r": 457.41745000000003, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 476.401, "t": 121.83336999999995, "r": 496.3262, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "400k", "bbox": {"l": 476.401, "t": 121.83336999999995, "r": 496.3262, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 512.63495, "t": 121.83336999999995, "r": 532.56012, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "PNG", "bbox": {"l": 512.63495, "t": 121.83336999999995, "r": 532.56012, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 317.06, "t": 133.78839000000005, "r": 375.17184, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "Combined(**)", "bbox": {"l": 317.06, "t": 133.78839000000005, "r": 375.17184, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 417.85599, "t": 133.48950000000002, "r": 425.37775, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "3", "bbox": {"l": 417.85599, "t": 133.48950000000002, "r": 425.37775, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 449.89569, "t": 133.48950000000002, "r": 457.41745000000003, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "3", "bbox": {"l": 449.89569, "t": 133.48950000000002, "r": 457.41745000000003, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 476.401, "t": 133.78839000000005, "r": 496.3262, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "500k", "bbox": {"l": 476.401, "t": 133.78839000000005, "r": 496.3262, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 512.63495, "t": 133.78839000000005, "r": 532.56012, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "PNG", "bbox": {"l": 512.63495, "t": 133.78839000000005, "r": 532.56012, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 317.06, "t": 145.74341000000004, "r": 369.39352, "b": 154.64995999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "SynthTabNet", "bbox": {"l": 317.06, "t": 145.74341000000004, "r": 369.39352, "b": 154.64995999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 417.85599, "t": 145.44446000000005, "r": 425.37775, "b": 154.65985, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "3", "bbox": {"l": 417.85599, "t": 145.44446000000005, "r": 425.37775, "b": 154.65985, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 449.89569, "t": 145.44446000000005, "r": 457.41745000000003, "b": 154.65985, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "3", "bbox": {"l": 449.89569, "t": 145.44446000000005, "r": 457.41745000000003, "b": 154.65985, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 476.401, "t": 145.74334999999996, "r": 496.3262, "b": 154.6499, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "600k", "bbox": {"l": 476.401, "t": 145.74334999999996, "r": 496.3262, "b": 154.6499, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 512.63495, "t": 145.74334999999996, "r": 532.56012, "b": 154.6499, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "PNG", "bbox": {"l": 512.63495, "t": 145.74334999999996, "r": 532.56012, "b": 154.6499, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ecel", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 7, "num_cols": 5, "table_cells": [{"bbox": {"l": 412.332, "t": 73.61437999999998, "r": 430.90231, "b": 82.52094, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Tags", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 442.85742, "t": 73.61437999999998, "r": 464.4463799999999, "b": 82.52094, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Bbox", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 477.78632, "t": 73.61437999999998, "r": 494.94193, "b": 82.52094, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Size", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 508.28186, "t": 73.61437999999998, "r": 536.91437, "b": 82.52094, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Format", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 317.06, "t": 85.9673499999999, "r": 361.64264, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PubTabNet", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 417.85599, "t": 85.6684600000001, "r": 425.37775, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 449.89569, "t": 85.6684600000001, "r": 457.41745000000003, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 476.401, "t": 85.9673499999999, "r": 496.3262, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "509k", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 512.63495, "t": 85.9673499999999, "r": 532.56012, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "PNG", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 317.06, "t": 97.92236000000003, "r": 359.43094, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "FinTabNet", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 417.85599, "t": 97.62347, "r": 425.37775, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 449.89569, "t": 97.62347, "r": 457.41745000000003, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 476.401, "t": 97.92236000000003, "r": 496.3262, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "112k", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 513.46185, "t": 97.92236000000003, "r": 531.73328, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "PDF", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 317.06, "t": 109.87836000000004, "r": 359.97888, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableBank", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 417.85599, "t": 109.57947000000001, "r": 425.37775, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 450.81226, "t": 109.57947000000001, "r": 456.50091999999995, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 476.401, "t": 109.87836000000004, "r": 496.3262, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "145k", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 511.25017999999994, "t": 109.87836000000004, "r": 533.94501, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "JPEG", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 317.06, "t": 121.83336999999995, "r": 400.37723, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Combined-Tabnet(*)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 417.85599, "t": 121.53448000000003, "r": 425.37775, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 449.89569, "t": 121.53448000000003, "r": 457.41745000000003, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 476.401, "t": 121.83336999999995, "r": 496.3262, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "400k", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 512.63495, "t": 121.83336999999995, "r": 532.56012, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "PNG", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 317.06, "t": 133.78839000000005, "r": 375.17184, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Combined(**)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 417.85599, "t": 133.48950000000002, "r": 425.37775, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 449.89569, "t": 133.48950000000002, "r": 457.41745000000003, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 476.401, "t": 133.78839000000005, "r": 496.3262, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "500k", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 512.63495, "t": 133.78839000000005, "r": 532.56012, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "PNG", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 317.06, "t": 145.74341000000004, "r": 369.39352, "b": 154.64995999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "SynthTabNet", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 417.85599, "t": 145.44446000000005, "r": 425.37775, "b": 154.65985, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 449.89569, "t": 145.44446000000005, "r": 457.41745000000003, "b": 154.65985, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 476.401, "t": 145.74334999999996, "r": 496.3262, "b": 154.6499, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "600k", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 512.63495, "t": 145.74334999999996, "r": 532.56012, "b": 154.6499, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "PNG", "column_header": false, "row_header": false, "row_section": false}]}}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "text", "id": 10, "page_no": 3, "cluster": {"id": 10, "label": "text", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 286.36511, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9611433148384094, "cells": [{"id": 0, "text": "amount of such tables, and kept only those ones ranging", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 286.36511, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "between 1*1 and 20*10 (rows/columns).", "bbox": {"l": 50.112, "t": 87.16339000000005, "r": 212.28319, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "amount of such tables, and kept only those ones ranging between 1*1 and 20*10 (rows/columns)."}, {"label": "text", "id": 1, "page_no": 3, "cluster": {"id": 1, "label": "text", "bbox": {"l": 50.112, "t": 100.96038999999996, "r": 286.36514, "b": 313.10507, "coord_origin": "TOPLEFT"}, "confidence": 0.988013744354248, "cells": [{"id": 2, "text": "The availability of the bounding boxes for all table cells", "bbox": {"l": 62.067001, "t": 100.96038999999996, "r": 286.36502, "b": 109.86694, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "is essential to train our models. In order to distinguish be-", "bbox": {"l": 50.112, "t": 112.91540999999995, "r": 286.36508, "b": 121.82195999999999, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "tween empty and non-empty bounding boxes, we have in-", "bbox": {"l": 50.112, "t": 124.87041999999997, "r": 286.36508, "b": 133.77697999999998, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "troduced a binary class in the annotation. Unfortunately, the", "bbox": {"l": 50.112, "t": 136.82641999999998, "r": 286.36511, "b": 145.73297000000002, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "original datasets either omit the bounding boxes for whole", "bbox": {"l": 50.112, "t": 148.78143, "r": 286.36511, "b": 157.68799, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "tables (e.g. TableBank) or they narrow their scope only to", "bbox": {"l": 50.112, "t": 160.73645, "r": 286.36508, "b": 169.64301, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "non-empty cells. Therefore, it was imperative to introduce", "bbox": {"l": 50.112, "t": 172.69146999999998, "r": 286.36505, "b": 181.59802000000002, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "a data pre-processing procedure that generates the missing", "bbox": {"l": 50.112, "t": 184.64648, "r": 286.36508, "b": 193.55304, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "bounding boxes out of the annotation information. This pro-", "bbox": {"l": 50.112, "t": 196.60248, "r": 286.36508, "b": 205.50903000000005, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "cedure first parses the provided table structure and calcu-", "bbox": {"l": 50.112, "t": 208.5575, "r": 286.36508, "b": 217.46405000000004, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "lates the dimensions of the most fine-grained grid that cov-", "bbox": {"l": 50.112, "t": 220.51251000000002, "r": 286.36511, "b": 229.41907000000003, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "ers the table structure. Notice that each table cell may oc-", "bbox": {"l": 50.112, "t": 232.46753, "r": 286.36508, "b": 241.37408000000005, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "cupy multiple grid squares due to row or column spans. In", "bbox": {"l": 50.112, "t": 244.42255, "r": 286.36508, "b": 253.32910000000004, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "case of PubTabNet we had to compute missing bounding", "bbox": {"l": 50.112, "t": 256.37756, "r": 286.36505, "b": 265.28412000000003, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "boxes for 48% of the simple and 69% of the complex ta-", "bbox": {"l": 50.112, "t": 268.33356000000003, "r": 286.36505, "b": 277.24010999999996, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "bles.", "bbox": {"l": 50.112, "t": 280.28853999999995, "r": 68.652397, "b": 289.1951, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Regarding FinTabNet, 68% of the simple and 98%", "bbox": {"l": 75.566444, "t": 280.28853999999995, "r": 286.36514, "b": 289.1951, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "of the complex tables require the generation of bounding", "bbox": {"l": 50.112, "t": 292.24353, "r": 286.36511, "b": 301.15009, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "boxes.", "bbox": {"l": 50.112, "t": 304.19852000000003, "r": 75.695961, "b": 313.10507, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The availability of the bounding boxes for all table cells is essential to train our models. In order to distinguish between empty and non-empty bounding boxes, we have introduced a binary class in the annotation. Unfortunately, the original datasets either omit the bounding boxes for whole tables (e.g. TableBank) or they narrow their scope only to non-empty cells. Therefore, it was imperative to introduce a data pre-processing procedure that generates the missing bounding boxes out of the annotation information. This procedure first parses the provided table structure and calculates the dimensions of the most fine-grained grid that covers the table structure. Notice that each table cell may occupy multiple grid squares due to row or column spans. In case of PubTabNet we had to compute missing bounding boxes for 48% of the simple and 69% of the complex tables. Regarding FinTabNet, 68% of the simple and 98% of the complex tables require the generation of bounding boxes."}, {"label": "text", "id": 4, "page_no": 3, "cluster": {"id": 4, "label": "text", "bbox": {"l": 50.112, "t": 317.99550999999997, "r": 286.36511, "b": 434.49896, "coord_origin": "TOPLEFT"}, "confidence": 0.9873981475830078, "cells": [{"id": 21, "text": "As it is illustrated in Fig. 2, the table distributions from", "bbox": {"l": 62.067001, "t": 317.99550999999997, "r": 286.36499, "b": 326.90207, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "all datasets are skewed towards simpler structures with", "bbox": {"l": 50.112, "t": 329.95151, "r": 286.36511, "b": 338.8580600000001, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "fewer number of rows/columns. Additionally, there is very", "bbox": {"l": 50.112, "t": 341.90649, "r": 286.36502, "b": 350.81305, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "limited variance in the table styles, which in case of Pub-", "bbox": {"l": 50.112, "t": 353.8614799999999, "r": 286.36505, "b": 362.76804, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "TabNet and FinTabNet means one styling format for the", "bbox": {"l": 50.112, "t": 365.81647, "r": 286.36508, "b": 374.72301999999996, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "majority of the tables.", "bbox": {"l": 50.112, "t": 377.77145, "r": 141.58859, "b": 386.67801, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Similar limitations appear also in", "bbox": {"l": 148.70189, "t": 377.77145, "r": 286.36508, "b": 386.67801, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "the type of table content, which in some cases (e.g. FinTab-", "bbox": {"l": 50.112, "t": 389.72644, "r": 286.36508, "b": 398.63300000000004, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Net) is restricted to a certain domain. Ultimately, the lack", "bbox": {"l": 50.112, "t": 401.68243, "r": 286.36511, "b": 410.58899, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "of diversity in the training dataset damages the ability of the", "bbox": {"l": 50.112, "t": 413.63742, "r": 286.36511, "b": 422.54398, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "models to generalize well on unseen data.", "bbox": {"l": 50.112, "t": 425.59241, "r": 216.39774, "b": 434.49896, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "As it is illustrated in Fig. 2, the table distributions from all datasets are skewed towards simpler structures with fewer number of rows/columns. Additionally, there is very limited variance in the table styles, which in case of PubTabNet and FinTabNet means one styling format for the majority of the tables. Similar limitations appear also in the type of table content, which in some cases (e.g. FinTabNet) is restricted to a certain domain. Ultimately, the lack of diversity in the training dataset damages the ability of the models to generalize well on unseen data."}, {"label": "text", "id": 3, "page_no": 3, "cluster": {"id": 3, "label": "text", "bbox": {"l": 50.112, "t": 439.3894, "r": 286.36655, "b": 627.62389, "coord_origin": "TOPLEFT"}, "confidence": 0.9876030087471008, "cells": [{"id": 32, "text": "Motivated by those observations we aimed at generating", "bbox": {"l": 62.067001, "t": 439.3894, "r": 286.36499, "b": 448.2959599999999, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "a synthetic table dataset named", "bbox": {"l": 50.112, "t": 451.34439, "r": 172.14388, "b": 460.25095, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "SynthTabNet", "bbox": {"l": 174.14801, "t": 451.43405, "r": 224.70818999999997, "b": 460.02182, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": ". This approach", "bbox": {"l": 224.70801, "t": 451.34439, "r": 286.36655, "b": 460.25095, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "offers control over: 1) the size of the dataset, 2) the table", "bbox": {"l": 50.112015, "t": 463.30038, "r": 286.36505, "b": 472.20694, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "structure, 3) the table style and 4) the type of content. The", "bbox": {"l": 50.112015, "t": 475.25537, "r": 286.36511, "b": 484.16193, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "complexity of the table structure is described by the size of", "bbox": {"l": 50.112015, "t": 487.21036, "r": 286.36511, "b": 496.11691, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "the table header and the table body, as well as the percentage", "bbox": {"l": 50.112015, "t": 499.16534, "r": 286.36508, "b": 508.0719, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "of the table cells covered by row spans and column spans.", "bbox": {"l": 50.112015, "t": 511.12033, "r": 286.36505, "b": 520.02689, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "A set of carefully designed styling templates provides the", "bbox": {"l": 50.112015, "t": 523.07632, "r": 286.36508, "b": 531.98288, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "basis to build a wide range of table appearances. Lastly, the", "bbox": {"l": 50.112015, "t": 535.0313100000001, "r": 286.36508, "b": 543.93788, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "table content is generated out of a curated collection of text", "bbox": {"l": 50.112015, "t": 546.98633, "r": 286.36511, "b": 555.89288, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "corpora. By controlling the size and scope of the synthetic", "bbox": {"l": 50.112015, "t": 558.94133, "r": 286.36508, "b": 567.84789, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "datasets we are able to train and evaluate our models in a", "bbox": {"l": 50.112015, "t": 570.89633, "r": 286.36511, "b": 579.8028899999999, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "variety of different conditions. For example, we can first", "bbox": {"l": 50.112015, "t": 582.85133, "r": 286.36511, "b": 591.75789, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "generate a highly diverse dataset to train our models and", "bbox": {"l": 50.112015, "t": 594.80733, "r": 286.36505, "b": 603.71388, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "then evaluate their performance on other synthetic datasets", "bbox": {"l": 50.112015, "t": 606.76233, "r": 286.36508, "b": 615.6688800000001, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "which are focused on a specific domain.", "bbox": {"l": 50.112015, "t": 618.71733, "r": 209.7527, "b": 627.62389, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Motivated by those observations we aimed at generating a synthetic table dataset named SynthTabNet . This approach offers control over: 1) the size of the dataset, 2) the table structure, 3) the table style and 4) the type of content. The complexity of the table structure is described by the size of the table header and the table body, as well as the percentage of the table cells covered by row spans and column spans. A set of carefully designed styling templates provides the basis to build a wide range of table appearances. Lastly, the table content is generated out of a curated collection of text corpora. By controlling the size and scope of the synthetic datasets we are able to train and evaluate our models in a variety of different conditions. For example, we can first generate a highly diverse dataset to train our models and then evaluate their performance on other synthetic datasets which are focused on a specific domain."}, {"label": "text", "id": 5, "page_no": 3, "cluster": {"id": 5, "label": "text", "bbox": {"l": 50.112015, "t": 632.51433, "r": 286.36511, "b": 713.151894, "coord_origin": "TOPLEFT"}, "confidence": 0.9871614575386047, "cells": [{"id": 50, "text": "In this regard, we have prepared four synthetic datasets,", "bbox": {"l": 62.067017, "t": 632.51433, "r": 286.36499, "b": 641.42088, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "each one containing 150k examples. The corpora to gener-", "bbox": {"l": 50.112015, "t": 644.46933, "r": 286.36508, "b": 653.37589, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "ate the table text consists of the most frequent terms appear-", "bbox": {"l": 50.112015, "t": 656.42532, "r": 286.36511, "b": 665.33189, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "ing in PubTabNet and FinTabNet together with randomly", "bbox": {"l": 50.112015, "t": 668.38033, "r": 286.36505, "b": 677.28689, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "generated text. The first two synthetic datasets have been", "bbox": {"l": 50.112015, "t": 680.33533, "r": 286.36508, "b": 689.24189, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "fine-tuned to mimic the appearance of the original datasets", "bbox": {"l": 50.112015, "t": 692.290329, "r": 286.36508, "b": 701.196892, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "but encompass more complicated table structures. The third", "bbox": {"l": 50.112015, "t": 704.245331, "r": 286.36511, "b": 713.151894, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In this regard, we have prepared four synthetic datasets, each one containing 150k examples. The corpora to generate the table text consists of the most frequent terms appearing in PubTabNet and FinTabNet together with randomly generated text. The first two synthetic datasets have been fine-tuned to mimic the appearance of the original datasets but encompass more complicated table structures. The third"}, {"label": "table", "id": 8, "page_no": 3, "cluster": {"id": 8, "label": "table", "bbox": {"l": 310.67584228515625, "t": 73.19388580322266, "r": 542.9547119140625, "b": 155.22052001953125, "coord_origin": "TOPLEFT"}, "confidence": 0.9777463674545288, "cells": [{"id": 57, "text": "Tags", "bbox": {"l": 412.332, "t": 73.61437999999998, "r": 430.90231, "b": 82.52094, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Bbox", "bbox": {"l": 442.85742, "t": 73.61437999999998, "r": 464.4463799999999, "b": 82.52094, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Size", "bbox": {"l": 477.78632, "t": 73.61437999999998, "r": 494.94193, "b": 82.52094, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Format", "bbox": {"l": 508.28186, "t": 73.61437999999998, "r": 536.91437, "b": 82.52094, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "PubTabNet", "bbox": {"l": 317.06, "t": 85.9673499999999, "r": 361.64264, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "3", "bbox": {"l": 417.85599, "t": 85.6684600000001, "r": 425.37775, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "3", "bbox": {"l": 449.89569, "t": 85.6684600000001, "r": 457.41745000000003, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "509k", "bbox": {"l": 476.401, "t": 85.9673499999999, "r": 496.3262, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "PNG", "bbox": {"l": 512.63495, "t": 85.9673499999999, "r": 532.56012, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "FinTabNet", "bbox": {"l": 317.06, "t": 97.92236000000003, "r": 359.43094, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "3", "bbox": {"l": 417.85599, "t": 97.62347, "r": 425.37775, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "3", "bbox": {"l": 449.89569, "t": 97.62347, "r": 457.41745000000003, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "112k", "bbox": {"l": 476.401, "t": 97.92236000000003, "r": 496.3262, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "PDF", "bbox": {"l": 513.46185, "t": 97.92236000000003, "r": 531.73328, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "TableBank", "bbox": {"l": 317.06, "t": 109.87836000000004, "r": 359.97888, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "3", "bbox": {"l": 417.85599, "t": 109.57947000000001, "r": 425.37775, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "7", "bbox": {"l": 450.81226, "t": 109.57947000000001, "r": 456.50091999999995, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "145k", "bbox": {"l": 476.401, "t": 109.87836000000004, "r": 496.3262, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "JPEG", "bbox": {"l": 511.25017999999994, "t": 109.87836000000004, "r": 533.94501, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "Combined-Tabnet(*)", "bbox": {"l": 317.06, "t": 121.83336999999995, "r": 400.37723, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "3", "bbox": {"l": 417.85599, "t": 121.53448000000003, "r": 425.37775, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "3", "bbox": {"l": 449.89569, "t": 121.53448000000003, "r": 457.41745000000003, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "400k", "bbox": {"l": 476.401, "t": 121.83336999999995, "r": 496.3262, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "PNG", "bbox": {"l": 512.63495, "t": 121.83336999999995, "r": 532.56012, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Combined(**)", "bbox": {"l": 317.06, "t": 133.78839000000005, "r": 375.17184, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "3", "bbox": {"l": 417.85599, "t": 133.48950000000002, "r": 425.37775, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "3", "bbox": {"l": 449.89569, "t": 133.48950000000002, "r": 457.41745000000003, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "500k", "bbox": {"l": 476.401, "t": 133.78839000000005, "r": 496.3262, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "PNG", "bbox": {"l": 512.63495, "t": 133.78839000000005, "r": 532.56012, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "SynthTabNet", "bbox": {"l": 317.06, "t": 145.74341000000004, "r": 369.39352, "b": 154.64995999999996, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "3", "bbox": {"l": 417.85599, "t": 145.44446000000005, "r": 425.37775, "b": 154.65985, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "3", "bbox": {"l": 449.89569, "t": 145.44446000000005, "r": 457.41745000000003, "b": 154.65985, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "600k", "bbox": {"l": 476.401, "t": 145.74334999999996, "r": 496.3262, "b": 154.6499, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "PNG", "bbox": {"l": 512.63495, "t": 145.74334999999996, "r": 532.56012, "b": 154.6499, "coord_origin": "TOPLEFT"}}], "children": [{"id": 15, "label": "text", "bbox": {"l": 412.332, "t": 73.61437999999998, "r": 430.90231, "b": 82.52094, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "Tags", "bbox": {"l": 412.332, "t": 73.61437999999998, "r": 430.90231, "b": 82.52094, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 442.85742, "t": 73.61437999999998, "r": 464.4463799999999, "b": 82.52094, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "Bbox", "bbox": {"l": 442.85742, "t": 73.61437999999998, "r": 464.4463799999999, "b": 82.52094, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 477.78632, "t": 73.61437999999998, "r": 494.94193, "b": 82.52094, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "Size", "bbox": {"l": 477.78632, "t": 73.61437999999998, "r": 494.94193, "b": 82.52094, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 508.28186, "t": 73.61437999999998, "r": 536.91437, "b": 82.52094, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "Format", "bbox": {"l": 508.28186, "t": 73.61437999999998, "r": 536.91437, "b": 82.52094, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 317.06, "t": 85.9673499999999, "r": 361.64264, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "PubTabNet", "bbox": {"l": 317.06, "t": 85.9673499999999, "r": 361.64264, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 417.85599, "t": 85.6684600000001, "r": 425.37775, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "3", "bbox": {"l": 417.85599, "t": 85.6684600000001, "r": 425.37775, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 449.89569, "t": 85.6684600000001, "r": 457.41745000000003, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "3", "bbox": {"l": 449.89569, "t": 85.6684600000001, "r": 457.41745000000003, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 476.401, "t": 85.9673499999999, "r": 496.3262, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "509k", "bbox": {"l": 476.401, "t": 85.9673499999999, "r": 496.3262, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 512.63495, "t": 85.9673499999999, "r": 532.56012, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "PNG", "bbox": {"l": 512.63495, "t": 85.9673499999999, "r": 532.56012, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 317.06, "t": 97.92236000000003, "r": 359.43094, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "FinTabNet", "bbox": {"l": 317.06, "t": 97.92236000000003, "r": 359.43094, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 417.85599, "t": 97.62347, "r": 425.37775, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "3", "bbox": {"l": 417.85599, "t": 97.62347, "r": 425.37775, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 449.89569, "t": 97.62347, "r": 457.41745000000003, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "3", "bbox": {"l": 449.89569, "t": 97.62347, "r": 457.41745000000003, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 476.401, "t": 97.92236000000003, "r": 496.3262, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "112k", "bbox": {"l": 476.401, "t": 97.92236000000003, "r": 496.3262, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 513.46185, "t": 97.92236000000003, "r": 531.73328, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "PDF", "bbox": {"l": 513.46185, "t": 97.92236000000003, "r": 531.73328, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 317.06, "t": 109.87836000000004, "r": 359.97888, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "TableBank", "bbox": {"l": 317.06, "t": 109.87836000000004, "r": 359.97888, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 417.85599, "t": 109.57947000000001, "r": 425.37775, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "3", "bbox": {"l": 417.85599, "t": 109.57947000000001, "r": 425.37775, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 450.81226, "t": 109.57947000000001, "r": 456.50091999999995, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "7", "bbox": {"l": 450.81226, "t": 109.57947000000001, "r": 456.50091999999995, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 476.401, "t": 109.87836000000004, "r": 496.3262, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "145k", "bbox": {"l": 476.401, "t": 109.87836000000004, "r": 496.3262, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 511.25017999999994, "t": 109.87836000000004, "r": 533.94501, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "JPEG", "bbox": {"l": 511.25017999999994, "t": 109.87836000000004, "r": 533.94501, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 317.06, "t": 121.83336999999995, "r": 400.37723, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "Combined-Tabnet(*)", "bbox": {"l": 317.06, "t": 121.83336999999995, "r": 400.37723, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 417.85599, "t": 121.53448000000003, "r": 425.37775, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "3", "bbox": {"l": 417.85599, "t": 121.53448000000003, "r": 425.37775, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 449.89569, "t": 121.53448000000003, "r": 457.41745000000003, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "3", "bbox": {"l": 449.89569, "t": 121.53448000000003, "r": 457.41745000000003, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 476.401, "t": 121.83336999999995, "r": 496.3262, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "400k", "bbox": {"l": 476.401, "t": 121.83336999999995, "r": 496.3262, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 512.63495, "t": 121.83336999999995, "r": 532.56012, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "PNG", "bbox": {"l": 512.63495, "t": 121.83336999999995, "r": 532.56012, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 317.06, "t": 133.78839000000005, "r": 375.17184, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "Combined(**)", "bbox": {"l": 317.06, "t": 133.78839000000005, "r": 375.17184, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 417.85599, "t": 133.48950000000002, "r": 425.37775, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "3", "bbox": {"l": 417.85599, "t": 133.48950000000002, "r": 425.37775, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 449.89569, "t": 133.48950000000002, "r": 457.41745000000003, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "3", "bbox": {"l": 449.89569, "t": 133.48950000000002, "r": 457.41745000000003, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 476.401, "t": 133.78839000000005, "r": 496.3262, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "500k", "bbox": {"l": 476.401, "t": 133.78839000000005, "r": 496.3262, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 512.63495, "t": 133.78839000000005, "r": 532.56012, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "PNG", "bbox": {"l": 512.63495, "t": 133.78839000000005, "r": 532.56012, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 317.06, "t": 145.74341000000004, "r": 369.39352, "b": 154.64995999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "SynthTabNet", "bbox": {"l": 317.06, "t": 145.74341000000004, "r": 369.39352, "b": 154.64995999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 417.85599, "t": 145.44446000000005, "r": 425.37775, "b": 154.65985, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "3", "bbox": {"l": 417.85599, "t": 145.44446000000005, "r": 425.37775, "b": 154.65985, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 449.89569, "t": 145.44446000000005, "r": 457.41745000000003, "b": 154.65985, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "3", "bbox": {"l": 449.89569, "t": 145.44446000000005, "r": 457.41745000000003, "b": 154.65985, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 476.401, "t": 145.74334999999996, "r": 496.3262, "b": 154.6499, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "600k", "bbox": {"l": 476.401, "t": 145.74334999999996, "r": 496.3262, "b": 154.6499, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 512.63495, "t": 145.74334999999996, "r": 532.56012, "b": 154.6499, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "PNG", "bbox": {"l": 512.63495, "t": 145.74334999999996, "r": 532.56012, "b": 154.6499, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ecel", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 7, "num_cols": 5, "table_cells": [{"bbox": {"l": 412.332, "t": 73.61437999999998, "r": 430.90231, "b": 82.52094, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Tags", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 442.85742, "t": 73.61437999999998, "r": 464.4463799999999, "b": 82.52094, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Bbox", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 477.78632, "t": 73.61437999999998, "r": 494.94193, "b": 82.52094, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Size", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 508.28186, "t": 73.61437999999998, "r": 536.91437, "b": 82.52094, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Format", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 317.06, "t": 85.9673499999999, "r": 361.64264, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PubTabNet", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 417.85599, "t": 85.6684600000001, "r": 425.37775, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 449.89569, "t": 85.6684600000001, "r": 457.41745000000003, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 476.401, "t": 85.9673499999999, "r": 496.3262, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "509k", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 512.63495, "t": 85.9673499999999, "r": 532.56012, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "PNG", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 317.06, "t": 97.92236000000003, "r": 359.43094, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "FinTabNet", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 417.85599, "t": 97.62347, "r": 425.37775, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 449.89569, "t": 97.62347, "r": 457.41745000000003, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 476.401, "t": 97.92236000000003, "r": 496.3262, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "112k", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 513.46185, "t": 97.92236000000003, "r": 531.73328, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "PDF", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 317.06, "t": 109.87836000000004, "r": 359.97888, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableBank", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 417.85599, "t": 109.57947000000001, "r": 425.37775, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 450.81226, "t": 109.57947000000001, "r": 456.50091999999995, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 476.401, "t": 109.87836000000004, "r": 496.3262, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "145k", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 511.25017999999994, "t": 109.87836000000004, "r": 533.94501, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "JPEG", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 317.06, "t": 121.83336999999995, "r": 400.37723, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Combined-Tabnet(*)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 417.85599, "t": 121.53448000000003, "r": 425.37775, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 449.89569, "t": 121.53448000000003, "r": 457.41745000000003, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 476.401, "t": 121.83336999999995, "r": 496.3262, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "400k", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 512.63495, "t": 121.83336999999995, "r": 532.56012, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "PNG", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 317.06, "t": 133.78839000000005, "r": 375.17184, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Combined(**)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 417.85599, "t": 133.48950000000002, "r": 425.37775, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 449.89569, "t": 133.48950000000002, "r": 457.41745000000003, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 476.401, "t": 133.78839000000005, "r": 496.3262, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "500k", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 512.63495, "t": 133.78839000000005, "r": 532.56012, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "PNG", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 317.06, "t": 145.74341000000004, "r": 369.39352, "b": 154.64995999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "SynthTabNet", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 417.85599, "t": 145.44446000000005, "r": 425.37775, "b": 154.65985, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 449.89569, "t": 145.44446000000005, "r": 457.41745000000003, "b": 154.65985, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 476.401, "t": 145.74334999999996, "r": 496.3262, "b": 154.6499, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "600k", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 512.63495, "t": 145.74334999999996, "r": 532.56012, "b": 154.6499, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "PNG", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "caption", "id": 9, "page_no": 3, "cluster": {"id": 9, "label": "caption", "bbox": {"l": 308.862, "t": 167.66138, "r": 545.11505, "b": 224.38897999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9667726755142212, "cells": [{"id": 91, "text": "Table 1:", "bbox": {"l": 308.862, "t": 167.66138, "r": 344.6178, "b": 176.56793000000005, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Both", "bbox": {"l": 361.07602, "t": 167.66138, "r": 380.45328, "b": 176.56793000000005, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "\u201cCombined-Tabnet\u201d", "bbox": {"l": 386.56799, "t": 167.75104, "r": 468.67974999999996, "b": 176.33880999999997, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "and", "bbox": {"l": 474.79599, "t": 167.66138, "r": 489.18198, "b": 176.56793000000005, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "\u201dCombined-", "bbox": {"l": 495.29898000000003, "t": 167.75104, "r": 545.112, "b": 176.33880999999997, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "Tabnet\u201d", "bbox": {"l": 308.862, "t": 179.70605, "r": 341.16077, "b": 188.29381999999998, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "are variations of the following: (*) The Combined-", "bbox": {"l": 343.457, "t": 179.61639000000002, "r": 545.11005, "b": 188.52295000000004, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "Tabnet dataset is the processed combination of PubTabNet", "bbox": {"l": 308.862, "t": 191.57141000000001, "r": 545.11505, "b": 200.47797000000003, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "and Fintabnet. (**) The combined dataset is the processed", "bbox": {"l": 308.862, "t": 203.52643, "r": 545.11499, "b": 212.43298000000004, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "combination of PubTabNet, Fintabnet and TableBank.", "bbox": {"l": 308.862, "t": 215.48242000000005, "r": 523.93469, "b": 224.38897999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 1: Both \"Combined-Tabnet\" and \"CombinedTabnet\" are variations of the following: (*) The CombinedTabnet dataset is the processed combination of PubTabNet and Fintabnet. (**) The combined dataset is the processed combination of PubTabNet, Fintabnet and TableBank."}, {"label": "text", "id": 6, "page_no": 3, "cluster": {"id": 6, "label": "text", "bbox": {"l": 308.862, "t": 249.62041999999997, "r": 545.11517, "b": 294.39197, "coord_origin": "TOPLEFT"}, "confidence": 0.978954017162323, "cells": [{"id": 101, "text": "one adopts a colorful appearance with high contrast and the", "bbox": {"l": 308.862, "t": 249.62041999999997, "r": 545.11517, "b": 258.52698, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "last one contains tables with sparse content. Lastly, we have", "bbox": {"l": 308.862, "t": 261.57543999999996, "r": 545.11517, "b": 270.48199, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "combined all synthetic datasets into one big unified syn-", "bbox": {"l": 308.862, "t": 273.5304, "r": 545.11505, "b": 282.43698, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "thetic dataset of 600k examples.", "bbox": {"l": 308.862, "t": 285.48541000000006, "r": 436.82169, "b": 294.39197, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "one adopts a colorful appearance with high contrast and the last one contains tables with sparse content. Lastly, we have combined all synthetic datasets into one big unified synthetic dataset of 600k examples."}, {"label": "text", "id": 13, "page_no": 3, "cluster": {"id": 13, "label": "text", "bbox": {"l": 320.81699, "t": 297.77240000000006, "r": 542.74396, "b": 306.67896, "coord_origin": "TOPLEFT"}, "confidence": 0.9043695330619812, "cells": [{"id": 105, "text": "Tab. 1 summarizes the various attributes of the datasets.", "bbox": {"l": 320.81699, "t": 297.77240000000006, "r": 542.74396, "b": 306.67896, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Tab. 1 summarizes the various attributes of the datasets."}, {"label": "section_header", "id": 11, "page_no": 3, "cluster": {"id": 11, "label": "section_header", "bbox": {"l": 308.862, "t": 321.18396, "r": 444.93607000000003, "b": 331.93167000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9466595649719238, "cells": [{"id": 106, "text": "4.", "bbox": {"l": 308.862, "t": 321.18396, "r": 316.28476, "b": 331.93167000000005, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "The TableFormer model", "bbox": {"l": 326.18176, "t": 321.18396, "r": 444.93607000000003, "b": 331.93167000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4. The TableFormer model"}, {"label": "text", "id": 0, "page_no": 3, "cluster": {"id": 0, "label": "text", "bbox": {"l": 308.862, "t": 341.93939, "r": 545.11523, "b": 446.48685000000006, "coord_origin": "TOPLEFT"}, "confidence": 0.9884450435638428, "cells": [{"id": 108, "text": "Given the image of a table, TableFormer is able to pre-", "bbox": {"l": 320.81699, "t": 341.93939, "r": 545.11499, "b": 350.84594999999996, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "dict: 1) a sequence of tokens that represent the structure of", "bbox": {"l": 308.862, "t": 353.89438, "r": 545.11511, "b": 362.80092999999994, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "a table, and 2) a bounding box coupled to a subset of those", "bbox": {"l": 308.862, "t": 365.84937, "r": 545.11517, "b": 374.75592, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "tokens. The conversion of an image into a sequence of to-", "bbox": {"l": 308.862, "t": 377.80435, "r": 545.11505, "b": 386.71091, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "kens is a well-known task [35, 16]. While attention is often", "bbox": {"l": 308.862, "t": 389.75934000000007, "r": 545.11517, "b": 398.66588999999993, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "used as an implicit method to associate each token of the", "bbox": {"l": 308.862, "t": 401.71432000000004, "r": 545.11523, "b": 410.62088, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "sequence with a position in the original image, an explicit", "bbox": {"l": 308.862, "t": 413.67032, "r": 545.11517, "b": 422.57687, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "association between the individual table-cells and the image", "bbox": {"l": 308.862, "t": 425.62531, "r": 545.11505, "b": 434.53186, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "bounding boxes is also required.", "bbox": {"l": 308.862, "t": 437.58029, "r": 437.9375, "b": 446.48685000000006, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Given the image of a table, TableFormer is able to predict: 1) a sequence of tokens that represent the structure of a table, and 2) a bounding box coupled to a subset of those tokens. The conversion of an image into a sequence of tokens is a well-known task [35, 16]. While attention is often used as an implicit method to associate each token of the sequence with a position in the original image, an explicit association between the individual table-cells and the image bounding boxes is also required."}, {"label": "section_header", "id": 12, "page_no": 3, "cluster": {"id": 12, "label": "section_header", "bbox": {"l": 308.862, "t": 457.69427, "r": 420.16058, "b": 467.54633, "coord_origin": "TOPLEFT"}, "confidence": 0.937696099281311, "cells": [{"id": 117, "text": "4.1.", "bbox": {"l": 308.862, "t": 457.69427, "r": 323.14081, "b": 467.54633, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "Model architecture.", "bbox": {"l": 332.66003, "t": 457.69427, "r": 420.16058, "b": 467.54633, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4.1. Model architecture."}, {"label": "text", "id": 2, "page_no": 3, "cluster": {"id": 2, "label": "text", "bbox": {"l": 308.86197, "t": 476.76529, "r": 545.11572, "b": 664.99981, "coord_origin": "TOPLEFT"}, "confidence": 0.9878323078155518, "cells": [{"id": 119, "text": "We now describe in detail the proposed method, which", "bbox": {"l": 320.81699, "t": 476.76529, "r": 545.11487, "b": 485.67184, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "is composed of three main components, see Fig.", "bbox": {"l": 308.862, "t": 488.72028, "r": 509.02054, "b": 497.62683, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "4.", "bbox": {"l": 515.58588, "t": 488.72028, "r": 523.05786, "b": 497.62683, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Our", "bbox": {"l": 529.62323, "t": 488.72028, "r": 545.11505, "b": 497.62683, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "CNN Backbone Network", "bbox": {"l": 308.862, "t": 500.76492, "r": 406.34601, "b": 509.35269, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "encodes the input as a feature vec-", "bbox": {"l": 408.87201, "t": 500.67526, "r": 545.1106, "b": 509.58182, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "tor of predefined length.", "bbox": {"l": 308.862, "t": 512.63126, "r": 409.39459, "b": 521.53781, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "The input feature vector of the", "bbox": {"l": 416.72705, "t": 512.63126, "r": 545.11505, "b": 521.53781, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "encoded image is passed to the", "bbox": {"l": 308.862, "t": 524.58624, "r": 436.194, "b": 533.4928, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "Structure Decoder", "bbox": {"l": 439.526, "t": 524.6759, "r": 513.86694, "b": 533.26367, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "to pro-", "bbox": {"l": 517.43201, "t": 524.58624, "r": 545.10815, "b": 533.4928, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "duce a sequence of HTML tags that represent the structure", "bbox": {"l": 308.862, "t": 536.54124, "r": 545.11511, "b": 545.4478, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "of the table.", "bbox": {"l": 308.862, "t": 548.49625, "r": 358.5455, "b": 557.4028000000001, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "With each prediction of an HTML standard", "bbox": {"l": 365.19055, "t": 548.49625, "r": 545.11517, "b": 557.4028000000001, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "data cell (\u2018", "bbox": {"l": 308.862, "t": 560.45125, "r": 352.40851, "b": 569.3578, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "<", "bbox": {"l": 352.409, "t": 560.29184, "r": 360.1579, "b": 569.13863, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "td", "bbox": {"l": 360.15799, "t": 560.45125, "r": 367.90891, "b": 569.3578, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": ">", "bbox": {"l": 367.909, "t": 560.29184, "r": 375.6579, "b": 569.13863, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "\u2019) the hidden state of that cell is passed to", "bbox": {"l": 375.65799, "t": 560.45125, "r": 545.11182, "b": 569.3578, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "the Cell BBox Decoder. As for spanning cells, such as row", "bbox": {"l": 308.862, "t": 572.40724, "r": 545.11499, "b": 581.3138, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "or column span, the tag is broken down to \u2018", "bbox": {"l": 308.862, "t": 584.3622399999999, "r": 483.11768, "b": 593.2688, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "<", "bbox": {"l": 483.11902, "t": 584.20284, "r": 490.86792, "b": 593.04962, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "\u2019, \u2018rowspan=\u2019", "bbox": {"l": 490.86800999999997, "t": 584.3622399999999, "r": 545.11438, "b": 593.2688, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "or \u2018colspan=\u2019, with the number of spanning cells (attribute),", "bbox": {"l": 308.862, "t": 596.31725, "r": 545.11493, "b": 605.2238, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "and \u2018", "bbox": {"l": 308.862, "t": 608.27225, "r": 329.64395, "b": 617.1788, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": ">", "bbox": {"l": 329.646, "t": 608.11284, "r": 337.3949, "b": 616.9596300000001, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "\u2019. The hidden state attached to \u2018", "bbox": {"l": 337.39398, "t": 608.27225, "r": 468.5914, "b": 617.1788, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "<", "bbox": {"l": 468.59496999999993, "t": 608.11284, "r": 476.34387000000004, "b": 616.9596300000001, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "\u2019 is passed to the", "bbox": {"l": 476.3439599999999, "t": 608.27225, "r": 545.11572, "b": 617.1788, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "Cell BBox Decoder. A shared feed forward network (FFN)", "bbox": {"l": 308.86197, "t": 620.22725, "r": 545.11499, "b": 629.1338000000001, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "receives the hidden states from the Structure Decoder, to", "bbox": {"l": 308.86197, "t": 632.1822500000001, "r": 545.11517, "b": 641.08881, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "provide the final detection predictions of the bounding box", "bbox": {"l": 308.86197, "t": 644.13824, "r": 545.11511, "b": 653.0448, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "coordinates and their classification.", "bbox": {"l": 308.86197, "t": 656.09325, "r": 449.42432, "b": 664.99981, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "We now describe in detail the proposed method, which is composed of three main components, see Fig. 4. Our CNN Backbone Network encodes the input as a feature vector of predefined length. The input feature vector of the encoded image is passed to the Structure Decoder to produce a sequence of HTML tags that represent the structure of the table. With each prediction of an HTML standard data cell (' < td > ') the hidden state of that cell is passed to the Cell BBox Decoder. As for spanning cells, such as row or column span, the tag is broken down to ' < ', 'rowspan=' or 'colspan=', with the number of spanning cells (attribute), and ' > '. The hidden state attached to ' < ' is passed to the Cell BBox Decoder. A shared feed forward network (FFN) receives the hidden states from the Structure Decoder, to provide the final detection predictions of the bounding box coordinates and their classification."}, {"label": "text", "id": 7, "page_no": 3, "cluster": {"id": 7, "label": "text", "bbox": {"l": 308.86197, "t": 668.2607, "r": 545.11511, "b": 713.1518169999999, "coord_origin": "TOPLEFT"}, "confidence": 0.978580117225647, "cells": [{"id": 152, "text": "CNN Backbone Network.", "bbox": {"l": 320.81696, "t": 668.2607, "r": 431.90985, "b": 677.21707, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "A ResNet-18 CNN is the", "bbox": {"l": 439.49896, "t": 668.3802499999999, "r": 545.11255, "b": 677.2868100000001, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "backbone that receives the table image and encodes it as a", "bbox": {"l": 308.86197, "t": 680.33525, "r": 545.11499, "b": 689.24181, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "vector of predefined length. The network has been modified", "bbox": {"l": 308.86197, "t": 692.290253, "r": 545.11511, "b": 701.196815, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "by removing the linear and pooling layer, as we are not per-", "bbox": {"l": 308.86197, "t": 704.245255, "r": 545.11505, "b": 713.1518169999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "CNN Backbone Network. A ResNet-18 CNN is the backbone that receives the table image and encodes it as a vector of predefined length. The network has been modified by removing the linear and pooling layer, as we are not per-"}, {"label": "page_footer", "id": 14, "page_no": 3, "cluster": {"id": 14, "label": "page_footer", "bbox": {"l": 295.12097, "t": 734.133251, "r": 300.10226, "b": 743.039814, "coord_origin": "TOPLEFT"}, "confidence": 0.8565718531608582, "cells": [{"id": 157, "text": "4", "bbox": {"l": 295.12097, "t": 734.133251, "r": 300.10226, "b": 743.039814, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4"}], "body": [{"label": "text", "id": 10, "page_no": 3, "cluster": {"id": 10, "label": "text", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 286.36511, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9611433148384094, "cells": [{"id": 0, "text": "amount of such tables, and kept only those ones ranging", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 286.36511, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "between 1*1 and 20*10 (rows/columns).", "bbox": {"l": 50.112, "t": 87.16339000000005, "r": 212.28319, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "amount of such tables, and kept only those ones ranging between 1*1 and 20*10 (rows/columns)."}, {"label": "text", "id": 1, "page_no": 3, "cluster": {"id": 1, "label": "text", "bbox": {"l": 50.112, "t": 100.96038999999996, "r": 286.36514, "b": 313.10507, "coord_origin": "TOPLEFT"}, "confidence": 0.988013744354248, "cells": [{"id": 2, "text": "The availability of the bounding boxes for all table cells", "bbox": {"l": 62.067001, "t": 100.96038999999996, "r": 286.36502, "b": 109.86694, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "is essential to train our models. In order to distinguish be-", "bbox": {"l": 50.112, "t": 112.91540999999995, "r": 286.36508, "b": 121.82195999999999, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "tween empty and non-empty bounding boxes, we have in-", "bbox": {"l": 50.112, "t": 124.87041999999997, "r": 286.36508, "b": 133.77697999999998, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "troduced a binary class in the annotation. Unfortunately, the", "bbox": {"l": 50.112, "t": 136.82641999999998, "r": 286.36511, "b": 145.73297000000002, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "original datasets either omit the bounding boxes for whole", "bbox": {"l": 50.112, "t": 148.78143, "r": 286.36511, "b": 157.68799, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "tables (e.g. TableBank) or they narrow their scope only to", "bbox": {"l": 50.112, "t": 160.73645, "r": 286.36508, "b": 169.64301, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "non-empty cells. Therefore, it was imperative to introduce", "bbox": {"l": 50.112, "t": 172.69146999999998, "r": 286.36505, "b": 181.59802000000002, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "a data pre-processing procedure that generates the missing", "bbox": {"l": 50.112, "t": 184.64648, "r": 286.36508, "b": 193.55304, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "bounding boxes out of the annotation information. This pro-", "bbox": {"l": 50.112, "t": 196.60248, "r": 286.36508, "b": 205.50903000000005, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "cedure first parses the provided table structure and calcu-", "bbox": {"l": 50.112, "t": 208.5575, "r": 286.36508, "b": 217.46405000000004, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "lates the dimensions of the most fine-grained grid that cov-", "bbox": {"l": 50.112, "t": 220.51251000000002, "r": 286.36511, "b": 229.41907000000003, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "ers the table structure. Notice that each table cell may oc-", "bbox": {"l": 50.112, "t": 232.46753, "r": 286.36508, "b": 241.37408000000005, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "cupy multiple grid squares due to row or column spans. In", "bbox": {"l": 50.112, "t": 244.42255, "r": 286.36508, "b": 253.32910000000004, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "case of PubTabNet we had to compute missing bounding", "bbox": {"l": 50.112, "t": 256.37756, "r": 286.36505, "b": 265.28412000000003, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "boxes for 48% of the simple and 69% of the complex ta-", "bbox": {"l": 50.112, "t": 268.33356000000003, "r": 286.36505, "b": 277.24010999999996, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "bles.", "bbox": {"l": 50.112, "t": 280.28853999999995, "r": 68.652397, "b": 289.1951, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Regarding FinTabNet, 68% of the simple and 98%", "bbox": {"l": 75.566444, "t": 280.28853999999995, "r": 286.36514, "b": 289.1951, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "of the complex tables require the generation of bounding", "bbox": {"l": 50.112, "t": 292.24353, "r": 286.36511, "b": 301.15009, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "boxes.", "bbox": {"l": 50.112, "t": 304.19852000000003, "r": 75.695961, "b": 313.10507, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The availability of the bounding boxes for all table cells is essential to train our models. In order to distinguish between empty and non-empty bounding boxes, we have introduced a binary class in the annotation. Unfortunately, the original datasets either omit the bounding boxes for whole tables (e.g. TableBank) or they narrow their scope only to non-empty cells. Therefore, it was imperative to introduce a data pre-processing procedure that generates the missing bounding boxes out of the annotation information. This procedure first parses the provided table structure and calculates the dimensions of the most fine-grained grid that covers the table structure. Notice that each table cell may occupy multiple grid squares due to row or column spans. In case of PubTabNet we had to compute missing bounding boxes for 48% of the simple and 69% of the complex tables. Regarding FinTabNet, 68% of the simple and 98% of the complex tables require the generation of bounding boxes."}, {"label": "text", "id": 4, "page_no": 3, "cluster": {"id": 4, "label": "text", "bbox": {"l": 50.112, "t": 317.99550999999997, "r": 286.36511, "b": 434.49896, "coord_origin": "TOPLEFT"}, "confidence": 0.9873981475830078, "cells": [{"id": 21, "text": "As it is illustrated in Fig. 2, the table distributions from", "bbox": {"l": 62.067001, "t": 317.99550999999997, "r": 286.36499, "b": 326.90207, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "all datasets are skewed towards simpler structures with", "bbox": {"l": 50.112, "t": 329.95151, "r": 286.36511, "b": 338.8580600000001, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "fewer number of rows/columns. Additionally, there is very", "bbox": {"l": 50.112, "t": 341.90649, "r": 286.36502, "b": 350.81305, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "limited variance in the table styles, which in case of Pub-", "bbox": {"l": 50.112, "t": 353.8614799999999, "r": 286.36505, "b": 362.76804, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "TabNet and FinTabNet means one styling format for the", "bbox": {"l": 50.112, "t": 365.81647, "r": 286.36508, "b": 374.72301999999996, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "majority of the tables.", "bbox": {"l": 50.112, "t": 377.77145, "r": 141.58859, "b": 386.67801, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Similar limitations appear also in", "bbox": {"l": 148.70189, "t": 377.77145, "r": 286.36508, "b": 386.67801, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "the type of table content, which in some cases (e.g. FinTab-", "bbox": {"l": 50.112, "t": 389.72644, "r": 286.36508, "b": 398.63300000000004, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Net) is restricted to a certain domain. Ultimately, the lack", "bbox": {"l": 50.112, "t": 401.68243, "r": 286.36511, "b": 410.58899, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "of diversity in the training dataset damages the ability of the", "bbox": {"l": 50.112, "t": 413.63742, "r": 286.36511, "b": 422.54398, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "models to generalize well on unseen data.", "bbox": {"l": 50.112, "t": 425.59241, "r": 216.39774, "b": 434.49896, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "As it is illustrated in Fig. 2, the table distributions from all datasets are skewed towards simpler structures with fewer number of rows/columns. Additionally, there is very limited variance in the table styles, which in case of PubTabNet and FinTabNet means one styling format for the majority of the tables. Similar limitations appear also in the type of table content, which in some cases (e.g. FinTabNet) is restricted to a certain domain. Ultimately, the lack of diversity in the training dataset damages the ability of the models to generalize well on unseen data."}, {"label": "text", "id": 3, "page_no": 3, "cluster": {"id": 3, "label": "text", "bbox": {"l": 50.112, "t": 439.3894, "r": 286.36655, "b": 627.62389, "coord_origin": "TOPLEFT"}, "confidence": 0.9876030087471008, "cells": [{"id": 32, "text": "Motivated by those observations we aimed at generating", "bbox": {"l": 62.067001, "t": 439.3894, "r": 286.36499, "b": 448.2959599999999, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "a synthetic table dataset named", "bbox": {"l": 50.112, "t": 451.34439, "r": 172.14388, "b": 460.25095, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "SynthTabNet", "bbox": {"l": 174.14801, "t": 451.43405, "r": 224.70818999999997, "b": 460.02182, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": ". This approach", "bbox": {"l": 224.70801, "t": 451.34439, "r": 286.36655, "b": 460.25095, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "offers control over: 1) the size of the dataset, 2) the table", "bbox": {"l": 50.112015, "t": 463.30038, "r": 286.36505, "b": 472.20694, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "structure, 3) the table style and 4) the type of content. The", "bbox": {"l": 50.112015, "t": 475.25537, "r": 286.36511, "b": 484.16193, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "complexity of the table structure is described by the size of", "bbox": {"l": 50.112015, "t": 487.21036, "r": 286.36511, "b": 496.11691, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "the table header and the table body, as well as the percentage", "bbox": {"l": 50.112015, "t": 499.16534, "r": 286.36508, "b": 508.0719, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "of the table cells covered by row spans and column spans.", "bbox": {"l": 50.112015, "t": 511.12033, "r": 286.36505, "b": 520.02689, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "A set of carefully designed styling templates provides the", "bbox": {"l": 50.112015, "t": 523.07632, "r": 286.36508, "b": 531.98288, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "basis to build a wide range of table appearances. Lastly, the", "bbox": {"l": 50.112015, "t": 535.0313100000001, "r": 286.36508, "b": 543.93788, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "table content is generated out of a curated collection of text", "bbox": {"l": 50.112015, "t": 546.98633, "r": 286.36511, "b": 555.89288, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "corpora. By controlling the size and scope of the synthetic", "bbox": {"l": 50.112015, "t": 558.94133, "r": 286.36508, "b": 567.84789, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "datasets we are able to train and evaluate our models in a", "bbox": {"l": 50.112015, "t": 570.89633, "r": 286.36511, "b": 579.8028899999999, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "variety of different conditions. For example, we can first", "bbox": {"l": 50.112015, "t": 582.85133, "r": 286.36511, "b": 591.75789, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "generate a highly diverse dataset to train our models and", "bbox": {"l": 50.112015, "t": 594.80733, "r": 286.36505, "b": 603.71388, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "then evaluate their performance on other synthetic datasets", "bbox": {"l": 50.112015, "t": 606.76233, "r": 286.36508, "b": 615.6688800000001, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "which are focused on a specific domain.", "bbox": {"l": 50.112015, "t": 618.71733, "r": 209.7527, "b": 627.62389, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Motivated by those observations we aimed at generating a synthetic table dataset named SynthTabNet . This approach offers control over: 1) the size of the dataset, 2) the table structure, 3) the table style and 4) the type of content. The complexity of the table structure is described by the size of the table header and the table body, as well as the percentage of the table cells covered by row spans and column spans. A set of carefully designed styling templates provides the basis to build a wide range of table appearances. Lastly, the table content is generated out of a curated collection of text corpora. By controlling the size and scope of the synthetic datasets we are able to train and evaluate our models in a variety of different conditions. For example, we can first generate a highly diverse dataset to train our models and then evaluate their performance on other synthetic datasets which are focused on a specific domain."}, {"label": "text", "id": 5, "page_no": 3, "cluster": {"id": 5, "label": "text", "bbox": {"l": 50.112015, "t": 632.51433, "r": 286.36511, "b": 713.151894, "coord_origin": "TOPLEFT"}, "confidence": 0.9871614575386047, "cells": [{"id": 50, "text": "In this regard, we have prepared four synthetic datasets,", "bbox": {"l": 62.067017, "t": 632.51433, "r": 286.36499, "b": 641.42088, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "each one containing 150k examples. The corpora to gener-", "bbox": {"l": 50.112015, "t": 644.46933, "r": 286.36508, "b": 653.37589, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "ate the table text consists of the most frequent terms appear-", "bbox": {"l": 50.112015, "t": 656.42532, "r": 286.36511, "b": 665.33189, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "ing in PubTabNet and FinTabNet together with randomly", "bbox": {"l": 50.112015, "t": 668.38033, "r": 286.36505, "b": 677.28689, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "generated text. The first two synthetic datasets have been", "bbox": {"l": 50.112015, "t": 680.33533, "r": 286.36508, "b": 689.24189, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "fine-tuned to mimic the appearance of the original datasets", "bbox": {"l": 50.112015, "t": 692.290329, "r": 286.36508, "b": 701.196892, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "but encompass more complicated table structures. The third", "bbox": {"l": 50.112015, "t": 704.245331, "r": 286.36511, "b": 713.151894, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In this regard, we have prepared four synthetic datasets, each one containing 150k examples. The corpora to generate the table text consists of the most frequent terms appearing in PubTabNet and FinTabNet together with randomly generated text. The first two synthetic datasets have been fine-tuned to mimic the appearance of the original datasets but encompass more complicated table structures. The third"}, {"label": "table", "id": 8, "page_no": 3, "cluster": {"id": 8, "label": "table", "bbox": {"l": 310.67584228515625, "t": 73.19388580322266, "r": 542.9547119140625, "b": 155.22052001953125, "coord_origin": "TOPLEFT"}, "confidence": 0.9777463674545288, "cells": [{"id": 57, "text": "Tags", "bbox": {"l": 412.332, "t": 73.61437999999998, "r": 430.90231, "b": 82.52094, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Bbox", "bbox": {"l": 442.85742, "t": 73.61437999999998, "r": 464.4463799999999, "b": 82.52094, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Size", "bbox": {"l": 477.78632, "t": 73.61437999999998, "r": 494.94193, "b": 82.52094, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Format", "bbox": {"l": 508.28186, "t": 73.61437999999998, "r": 536.91437, "b": 82.52094, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "PubTabNet", "bbox": {"l": 317.06, "t": 85.9673499999999, "r": 361.64264, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "3", "bbox": {"l": 417.85599, "t": 85.6684600000001, "r": 425.37775, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "3", "bbox": {"l": 449.89569, "t": 85.6684600000001, "r": 457.41745000000003, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "509k", "bbox": {"l": 476.401, "t": 85.9673499999999, "r": 496.3262, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "PNG", "bbox": {"l": 512.63495, "t": 85.9673499999999, "r": 532.56012, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "FinTabNet", "bbox": {"l": 317.06, "t": 97.92236000000003, "r": 359.43094, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "3", "bbox": {"l": 417.85599, "t": 97.62347, "r": 425.37775, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "3", "bbox": {"l": 449.89569, "t": 97.62347, "r": 457.41745000000003, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "112k", "bbox": {"l": 476.401, "t": 97.92236000000003, "r": 496.3262, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "PDF", "bbox": {"l": 513.46185, "t": 97.92236000000003, "r": 531.73328, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "TableBank", "bbox": {"l": 317.06, "t": 109.87836000000004, "r": 359.97888, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "3", "bbox": {"l": 417.85599, "t": 109.57947000000001, "r": 425.37775, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "7", "bbox": {"l": 450.81226, "t": 109.57947000000001, "r": 456.50091999999995, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "145k", "bbox": {"l": 476.401, "t": 109.87836000000004, "r": 496.3262, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "JPEG", "bbox": {"l": 511.25017999999994, "t": 109.87836000000004, "r": 533.94501, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "Combined-Tabnet(*)", "bbox": {"l": 317.06, "t": 121.83336999999995, "r": 400.37723, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "3", "bbox": {"l": 417.85599, "t": 121.53448000000003, "r": 425.37775, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "3", "bbox": {"l": 449.89569, "t": 121.53448000000003, "r": 457.41745000000003, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "400k", "bbox": {"l": 476.401, "t": 121.83336999999995, "r": 496.3262, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "PNG", "bbox": {"l": 512.63495, "t": 121.83336999999995, "r": 532.56012, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Combined(**)", "bbox": {"l": 317.06, "t": 133.78839000000005, "r": 375.17184, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "3", "bbox": {"l": 417.85599, "t": 133.48950000000002, "r": 425.37775, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "3", "bbox": {"l": 449.89569, "t": 133.48950000000002, "r": 457.41745000000003, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "500k", "bbox": {"l": 476.401, "t": 133.78839000000005, "r": 496.3262, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "PNG", "bbox": {"l": 512.63495, "t": 133.78839000000005, "r": 532.56012, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "SynthTabNet", "bbox": {"l": 317.06, "t": 145.74341000000004, "r": 369.39352, "b": 154.64995999999996, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "3", "bbox": {"l": 417.85599, "t": 145.44446000000005, "r": 425.37775, "b": 154.65985, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "3", "bbox": {"l": 449.89569, "t": 145.44446000000005, "r": 457.41745000000003, "b": 154.65985, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "600k", "bbox": {"l": 476.401, "t": 145.74334999999996, "r": 496.3262, "b": 154.6499, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "PNG", "bbox": {"l": 512.63495, "t": 145.74334999999996, "r": 532.56012, "b": 154.6499, "coord_origin": "TOPLEFT"}}], "children": [{"id": 15, "label": "text", "bbox": {"l": 412.332, "t": 73.61437999999998, "r": 430.90231, "b": 82.52094, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "Tags", "bbox": {"l": 412.332, "t": 73.61437999999998, "r": 430.90231, "b": 82.52094, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 442.85742, "t": 73.61437999999998, "r": 464.4463799999999, "b": 82.52094, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "Bbox", "bbox": {"l": 442.85742, "t": 73.61437999999998, "r": 464.4463799999999, "b": 82.52094, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 477.78632, "t": 73.61437999999998, "r": 494.94193, "b": 82.52094, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "Size", "bbox": {"l": 477.78632, "t": 73.61437999999998, "r": 494.94193, "b": 82.52094, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 508.28186, "t": 73.61437999999998, "r": 536.91437, "b": 82.52094, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "Format", "bbox": {"l": 508.28186, "t": 73.61437999999998, "r": 536.91437, "b": 82.52094, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 317.06, "t": 85.9673499999999, "r": 361.64264, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "PubTabNet", "bbox": {"l": 317.06, "t": 85.9673499999999, "r": 361.64264, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 417.85599, "t": 85.6684600000001, "r": 425.37775, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "3", "bbox": {"l": 417.85599, "t": 85.6684600000001, "r": 425.37775, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 449.89569, "t": 85.6684600000001, "r": 457.41745000000003, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "3", "bbox": {"l": 449.89569, "t": 85.6684600000001, "r": 457.41745000000003, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 476.401, "t": 85.9673499999999, "r": 496.3262, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "509k", "bbox": {"l": 476.401, "t": 85.9673499999999, "r": 496.3262, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 512.63495, "t": 85.9673499999999, "r": 532.56012, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "PNG", "bbox": {"l": 512.63495, "t": 85.9673499999999, "r": 532.56012, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 317.06, "t": 97.92236000000003, "r": 359.43094, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "FinTabNet", "bbox": {"l": 317.06, "t": 97.92236000000003, "r": 359.43094, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 417.85599, "t": 97.62347, "r": 425.37775, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "3", "bbox": {"l": 417.85599, "t": 97.62347, "r": 425.37775, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 449.89569, "t": 97.62347, "r": 457.41745000000003, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "3", "bbox": {"l": 449.89569, "t": 97.62347, "r": 457.41745000000003, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 476.401, "t": 97.92236000000003, "r": 496.3262, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "112k", "bbox": {"l": 476.401, "t": 97.92236000000003, "r": 496.3262, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 513.46185, "t": 97.92236000000003, "r": 531.73328, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "PDF", "bbox": {"l": 513.46185, "t": 97.92236000000003, "r": 531.73328, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 317.06, "t": 109.87836000000004, "r": 359.97888, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "TableBank", "bbox": {"l": 317.06, "t": 109.87836000000004, "r": 359.97888, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 417.85599, "t": 109.57947000000001, "r": 425.37775, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "3", "bbox": {"l": 417.85599, "t": 109.57947000000001, "r": 425.37775, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 450.81226, "t": 109.57947000000001, "r": 456.50091999999995, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "7", "bbox": {"l": 450.81226, "t": 109.57947000000001, "r": 456.50091999999995, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 476.401, "t": 109.87836000000004, "r": 496.3262, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "145k", "bbox": {"l": 476.401, "t": 109.87836000000004, "r": 496.3262, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 511.25017999999994, "t": 109.87836000000004, "r": 533.94501, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "JPEG", "bbox": {"l": 511.25017999999994, "t": 109.87836000000004, "r": 533.94501, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 317.06, "t": 121.83336999999995, "r": 400.37723, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "Combined-Tabnet(*)", "bbox": {"l": 317.06, "t": 121.83336999999995, "r": 400.37723, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 417.85599, "t": 121.53448000000003, "r": 425.37775, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "3", "bbox": {"l": 417.85599, "t": 121.53448000000003, "r": 425.37775, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 449.89569, "t": 121.53448000000003, "r": 457.41745000000003, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "3", "bbox": {"l": 449.89569, "t": 121.53448000000003, "r": 457.41745000000003, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 476.401, "t": 121.83336999999995, "r": 496.3262, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "400k", "bbox": {"l": 476.401, "t": 121.83336999999995, "r": 496.3262, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 512.63495, "t": 121.83336999999995, "r": 532.56012, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "PNG", "bbox": {"l": 512.63495, "t": 121.83336999999995, "r": 532.56012, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 317.06, "t": 133.78839000000005, "r": 375.17184, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "Combined(**)", "bbox": {"l": 317.06, "t": 133.78839000000005, "r": 375.17184, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 417.85599, "t": 133.48950000000002, "r": 425.37775, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "3", "bbox": {"l": 417.85599, "t": 133.48950000000002, "r": 425.37775, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 449.89569, "t": 133.48950000000002, "r": 457.41745000000003, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "3", "bbox": {"l": 449.89569, "t": 133.48950000000002, "r": 457.41745000000003, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 476.401, "t": 133.78839000000005, "r": 496.3262, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "500k", "bbox": {"l": 476.401, "t": 133.78839000000005, "r": 496.3262, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 512.63495, "t": 133.78839000000005, "r": 532.56012, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "PNG", "bbox": {"l": 512.63495, "t": 133.78839000000005, "r": 532.56012, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 317.06, "t": 145.74341000000004, "r": 369.39352, "b": 154.64995999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "SynthTabNet", "bbox": {"l": 317.06, "t": 145.74341000000004, "r": 369.39352, "b": 154.64995999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 417.85599, "t": 145.44446000000005, "r": 425.37775, "b": 154.65985, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "3", "bbox": {"l": 417.85599, "t": 145.44446000000005, "r": 425.37775, "b": 154.65985, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 449.89569, "t": 145.44446000000005, "r": 457.41745000000003, "b": 154.65985, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "3", "bbox": {"l": 449.89569, "t": 145.44446000000005, "r": 457.41745000000003, "b": 154.65985, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 476.401, "t": 145.74334999999996, "r": 496.3262, "b": 154.6499, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "600k", "bbox": {"l": 476.401, "t": 145.74334999999996, "r": 496.3262, "b": 154.6499, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 512.63495, "t": 145.74334999999996, "r": 532.56012, "b": 154.6499, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "PNG", "bbox": {"l": 512.63495, "t": 145.74334999999996, "r": 532.56012, "b": 154.6499, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ecel", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 7, "num_cols": 5, "table_cells": [{"bbox": {"l": 412.332, "t": 73.61437999999998, "r": 430.90231, "b": 82.52094, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Tags", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 442.85742, "t": 73.61437999999998, "r": 464.4463799999999, "b": 82.52094, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Bbox", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 477.78632, "t": 73.61437999999998, "r": 494.94193, "b": 82.52094, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Size", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 508.28186, "t": 73.61437999999998, "r": 536.91437, "b": 82.52094, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Format", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 317.06, "t": 85.9673499999999, "r": 361.64264, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PubTabNet", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 417.85599, "t": 85.6684600000001, "r": 425.37775, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 449.89569, "t": 85.6684600000001, "r": 457.41745000000003, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 476.401, "t": 85.9673499999999, "r": 496.3262, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "509k", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 512.63495, "t": 85.9673499999999, "r": 532.56012, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "PNG", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 317.06, "t": 97.92236000000003, "r": 359.43094, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "FinTabNet", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 417.85599, "t": 97.62347, "r": 425.37775, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 449.89569, "t": 97.62347, "r": 457.41745000000003, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 476.401, "t": 97.92236000000003, "r": 496.3262, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "112k", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 513.46185, "t": 97.92236000000003, "r": 531.73328, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "PDF", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 317.06, "t": 109.87836000000004, "r": 359.97888, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableBank", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 417.85599, "t": 109.57947000000001, "r": 425.37775, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 450.81226, "t": 109.57947000000001, "r": 456.50091999999995, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 476.401, "t": 109.87836000000004, "r": 496.3262, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "145k", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 511.25017999999994, "t": 109.87836000000004, "r": 533.94501, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "JPEG", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 317.06, "t": 121.83336999999995, "r": 400.37723, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Combined-Tabnet(*)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 417.85599, "t": 121.53448000000003, "r": 425.37775, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 449.89569, "t": 121.53448000000003, "r": 457.41745000000003, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 476.401, "t": 121.83336999999995, "r": 496.3262, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "400k", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 512.63495, "t": 121.83336999999995, "r": 532.56012, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "PNG", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 317.06, "t": 133.78839000000005, "r": 375.17184, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Combined(**)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 417.85599, "t": 133.48950000000002, "r": 425.37775, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 449.89569, "t": 133.48950000000002, "r": 457.41745000000003, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 476.401, "t": 133.78839000000005, "r": 496.3262, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "500k", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 512.63495, "t": 133.78839000000005, "r": 532.56012, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "PNG", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 317.06, "t": 145.74341000000004, "r": 369.39352, "b": 154.64995999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "SynthTabNet", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 417.85599, "t": 145.44446000000005, "r": 425.37775, "b": 154.65985, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 449.89569, "t": 145.44446000000005, "r": 457.41745000000003, "b": 154.65985, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 476.401, "t": 145.74334999999996, "r": 496.3262, "b": 154.6499, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "600k", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 512.63495, "t": 145.74334999999996, "r": 532.56012, "b": 154.6499, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "PNG", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "caption", "id": 9, "page_no": 3, "cluster": {"id": 9, "label": "caption", "bbox": {"l": 308.862, "t": 167.66138, "r": 545.11505, "b": 224.38897999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9667726755142212, "cells": [{"id": 91, "text": "Table 1:", "bbox": {"l": 308.862, "t": 167.66138, "r": 344.6178, "b": 176.56793000000005, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Both", "bbox": {"l": 361.07602, "t": 167.66138, "r": 380.45328, "b": 176.56793000000005, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "\u201cCombined-Tabnet\u201d", "bbox": {"l": 386.56799, "t": 167.75104, "r": 468.67974999999996, "b": 176.33880999999997, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "and", "bbox": {"l": 474.79599, "t": 167.66138, "r": 489.18198, "b": 176.56793000000005, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "\u201dCombined-", "bbox": {"l": 495.29898000000003, "t": 167.75104, "r": 545.112, "b": 176.33880999999997, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "Tabnet\u201d", "bbox": {"l": 308.862, "t": 179.70605, "r": 341.16077, "b": 188.29381999999998, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "are variations of the following: (*) The Combined-", "bbox": {"l": 343.457, "t": 179.61639000000002, "r": 545.11005, "b": 188.52295000000004, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "Tabnet dataset is the processed combination of PubTabNet", "bbox": {"l": 308.862, "t": 191.57141000000001, "r": 545.11505, "b": 200.47797000000003, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "and Fintabnet. (**) The combined dataset is the processed", "bbox": {"l": 308.862, "t": 203.52643, "r": 545.11499, "b": 212.43298000000004, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "combination of PubTabNet, Fintabnet and TableBank.", "bbox": {"l": 308.862, "t": 215.48242000000005, "r": 523.93469, "b": 224.38897999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 1: Both \"Combined-Tabnet\" and \"CombinedTabnet\" are variations of the following: (*) The CombinedTabnet dataset is the processed combination of PubTabNet and Fintabnet. (**) The combined dataset is the processed combination of PubTabNet, Fintabnet and TableBank."}, {"label": "text", "id": 6, "page_no": 3, "cluster": {"id": 6, "label": "text", "bbox": {"l": 308.862, "t": 249.62041999999997, "r": 545.11517, "b": 294.39197, "coord_origin": "TOPLEFT"}, "confidence": 0.978954017162323, "cells": [{"id": 101, "text": "one adopts a colorful appearance with high contrast and the", "bbox": {"l": 308.862, "t": 249.62041999999997, "r": 545.11517, "b": 258.52698, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "last one contains tables with sparse content. Lastly, we have", "bbox": {"l": 308.862, "t": 261.57543999999996, "r": 545.11517, "b": 270.48199, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "combined all synthetic datasets into one big unified syn-", "bbox": {"l": 308.862, "t": 273.5304, "r": 545.11505, "b": 282.43698, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "thetic dataset of 600k examples.", "bbox": {"l": 308.862, "t": 285.48541000000006, "r": 436.82169, "b": 294.39197, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "one adopts a colorful appearance with high contrast and the last one contains tables with sparse content. Lastly, we have combined all synthetic datasets into one big unified synthetic dataset of 600k examples."}, {"label": "text", "id": 13, "page_no": 3, "cluster": {"id": 13, "label": "text", "bbox": {"l": 320.81699, "t": 297.77240000000006, "r": 542.74396, "b": 306.67896, "coord_origin": "TOPLEFT"}, "confidence": 0.9043695330619812, "cells": [{"id": 105, "text": "Tab. 1 summarizes the various attributes of the datasets.", "bbox": {"l": 320.81699, "t": 297.77240000000006, "r": 542.74396, "b": 306.67896, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Tab. 1 summarizes the various attributes of the datasets."}, {"label": "section_header", "id": 11, "page_no": 3, "cluster": {"id": 11, "label": "section_header", "bbox": {"l": 308.862, "t": 321.18396, "r": 444.93607000000003, "b": 331.93167000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9466595649719238, "cells": [{"id": 106, "text": "4.", "bbox": {"l": 308.862, "t": 321.18396, "r": 316.28476, "b": 331.93167000000005, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "The TableFormer model", "bbox": {"l": 326.18176, "t": 321.18396, "r": 444.93607000000003, "b": 331.93167000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4. The TableFormer model"}, {"label": "text", "id": 0, "page_no": 3, "cluster": {"id": 0, "label": "text", "bbox": {"l": 308.862, "t": 341.93939, "r": 545.11523, "b": 446.48685000000006, "coord_origin": "TOPLEFT"}, "confidence": 0.9884450435638428, "cells": [{"id": 108, "text": "Given the image of a table, TableFormer is able to pre-", "bbox": {"l": 320.81699, "t": 341.93939, "r": 545.11499, "b": 350.84594999999996, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "dict: 1) a sequence of tokens that represent the structure of", "bbox": {"l": 308.862, "t": 353.89438, "r": 545.11511, "b": 362.80092999999994, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "a table, and 2) a bounding box coupled to a subset of those", "bbox": {"l": 308.862, "t": 365.84937, "r": 545.11517, "b": 374.75592, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "tokens. The conversion of an image into a sequence of to-", "bbox": {"l": 308.862, "t": 377.80435, "r": 545.11505, "b": 386.71091, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "kens is a well-known task [35, 16]. While attention is often", "bbox": {"l": 308.862, "t": 389.75934000000007, "r": 545.11517, "b": 398.66588999999993, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "used as an implicit method to associate each token of the", "bbox": {"l": 308.862, "t": 401.71432000000004, "r": 545.11523, "b": 410.62088, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "sequence with a position in the original image, an explicit", "bbox": {"l": 308.862, "t": 413.67032, "r": 545.11517, "b": 422.57687, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "association between the individual table-cells and the image", "bbox": {"l": 308.862, "t": 425.62531, "r": 545.11505, "b": 434.53186, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "bounding boxes is also required.", "bbox": {"l": 308.862, "t": 437.58029, "r": 437.9375, "b": 446.48685000000006, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Given the image of a table, TableFormer is able to predict: 1) a sequence of tokens that represent the structure of a table, and 2) a bounding box coupled to a subset of those tokens. The conversion of an image into a sequence of tokens is a well-known task [35, 16]. While attention is often used as an implicit method to associate each token of the sequence with a position in the original image, an explicit association between the individual table-cells and the image bounding boxes is also required."}, {"label": "section_header", "id": 12, "page_no": 3, "cluster": {"id": 12, "label": "section_header", "bbox": {"l": 308.862, "t": 457.69427, "r": 420.16058, "b": 467.54633, "coord_origin": "TOPLEFT"}, "confidence": 0.937696099281311, "cells": [{"id": 117, "text": "4.1.", "bbox": {"l": 308.862, "t": 457.69427, "r": 323.14081, "b": 467.54633, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "Model architecture.", "bbox": {"l": 332.66003, "t": 457.69427, "r": 420.16058, "b": 467.54633, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4.1. Model architecture."}, {"label": "text", "id": 2, "page_no": 3, "cluster": {"id": 2, "label": "text", "bbox": {"l": 308.86197, "t": 476.76529, "r": 545.11572, "b": 664.99981, "coord_origin": "TOPLEFT"}, "confidence": 0.9878323078155518, "cells": [{"id": 119, "text": "We now describe in detail the proposed method, which", "bbox": {"l": 320.81699, "t": 476.76529, "r": 545.11487, "b": 485.67184, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "is composed of three main components, see Fig.", "bbox": {"l": 308.862, "t": 488.72028, "r": 509.02054, "b": 497.62683, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "4.", "bbox": {"l": 515.58588, "t": 488.72028, "r": 523.05786, "b": 497.62683, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Our", "bbox": {"l": 529.62323, "t": 488.72028, "r": 545.11505, "b": 497.62683, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "CNN Backbone Network", "bbox": {"l": 308.862, "t": 500.76492, "r": 406.34601, "b": 509.35269, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "encodes the input as a feature vec-", "bbox": {"l": 408.87201, "t": 500.67526, "r": 545.1106, "b": 509.58182, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "tor of predefined length.", "bbox": {"l": 308.862, "t": 512.63126, "r": 409.39459, "b": 521.53781, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "The input feature vector of the", "bbox": {"l": 416.72705, "t": 512.63126, "r": 545.11505, "b": 521.53781, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "encoded image is passed to the", "bbox": {"l": 308.862, "t": 524.58624, "r": 436.194, "b": 533.4928, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "Structure Decoder", "bbox": {"l": 439.526, "t": 524.6759, "r": 513.86694, "b": 533.26367, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "to pro-", "bbox": {"l": 517.43201, "t": 524.58624, "r": 545.10815, "b": 533.4928, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "duce a sequence of HTML tags that represent the structure", "bbox": {"l": 308.862, "t": 536.54124, "r": 545.11511, "b": 545.4478, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "of the table.", "bbox": {"l": 308.862, "t": 548.49625, "r": 358.5455, "b": 557.4028000000001, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "With each prediction of an HTML standard", "bbox": {"l": 365.19055, "t": 548.49625, "r": 545.11517, "b": 557.4028000000001, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "data cell (\u2018", "bbox": {"l": 308.862, "t": 560.45125, "r": 352.40851, "b": 569.3578, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "<", "bbox": {"l": 352.409, "t": 560.29184, "r": 360.1579, "b": 569.13863, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "td", "bbox": {"l": 360.15799, "t": 560.45125, "r": 367.90891, "b": 569.3578, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": ">", "bbox": {"l": 367.909, "t": 560.29184, "r": 375.6579, "b": 569.13863, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "\u2019) the hidden state of that cell is passed to", "bbox": {"l": 375.65799, "t": 560.45125, "r": 545.11182, "b": 569.3578, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "the Cell BBox Decoder. As for spanning cells, such as row", "bbox": {"l": 308.862, "t": 572.40724, "r": 545.11499, "b": 581.3138, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "or column span, the tag is broken down to \u2018", "bbox": {"l": 308.862, "t": 584.3622399999999, "r": 483.11768, "b": 593.2688, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "<", "bbox": {"l": 483.11902, "t": 584.20284, "r": 490.86792, "b": 593.04962, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "\u2019, \u2018rowspan=\u2019", "bbox": {"l": 490.86800999999997, "t": 584.3622399999999, "r": 545.11438, "b": 593.2688, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "or \u2018colspan=\u2019, with the number of spanning cells (attribute),", "bbox": {"l": 308.862, "t": 596.31725, "r": 545.11493, "b": 605.2238, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "and \u2018", "bbox": {"l": 308.862, "t": 608.27225, "r": 329.64395, "b": 617.1788, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": ">", "bbox": {"l": 329.646, "t": 608.11284, "r": 337.3949, "b": 616.9596300000001, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "\u2019. The hidden state attached to \u2018", "bbox": {"l": 337.39398, "t": 608.27225, "r": 468.5914, "b": 617.1788, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "<", "bbox": {"l": 468.59496999999993, "t": 608.11284, "r": 476.34387000000004, "b": 616.9596300000001, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "\u2019 is passed to the", "bbox": {"l": 476.3439599999999, "t": 608.27225, "r": 545.11572, "b": 617.1788, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "Cell BBox Decoder. A shared feed forward network (FFN)", "bbox": {"l": 308.86197, "t": 620.22725, "r": 545.11499, "b": 629.1338000000001, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "receives the hidden states from the Structure Decoder, to", "bbox": {"l": 308.86197, "t": 632.1822500000001, "r": 545.11517, "b": 641.08881, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "provide the final detection predictions of the bounding box", "bbox": {"l": 308.86197, "t": 644.13824, "r": 545.11511, "b": 653.0448, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "coordinates and their classification.", "bbox": {"l": 308.86197, "t": 656.09325, "r": 449.42432, "b": 664.99981, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "We now describe in detail the proposed method, which is composed of three main components, see Fig. 4. Our CNN Backbone Network encodes the input as a feature vector of predefined length. The input feature vector of the encoded image is passed to the Structure Decoder to produce a sequence of HTML tags that represent the structure of the table. With each prediction of an HTML standard data cell (' < td > ') the hidden state of that cell is passed to the Cell BBox Decoder. As for spanning cells, such as row or column span, the tag is broken down to ' < ', 'rowspan=' or 'colspan=', with the number of spanning cells (attribute), and ' > '. The hidden state attached to ' < ' is passed to the Cell BBox Decoder. A shared feed forward network (FFN) receives the hidden states from the Structure Decoder, to provide the final detection predictions of the bounding box coordinates and their classification."}, {"label": "text", "id": 7, "page_no": 3, "cluster": {"id": 7, "label": "text", "bbox": {"l": 308.86197, "t": 668.2607, "r": 545.11511, "b": 713.1518169999999, "coord_origin": "TOPLEFT"}, "confidence": 0.978580117225647, "cells": [{"id": 152, "text": "CNN Backbone Network.", "bbox": {"l": 320.81696, "t": 668.2607, "r": 431.90985, "b": 677.21707, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "A ResNet-18 CNN is the", "bbox": {"l": 439.49896, "t": 668.3802499999999, "r": 545.11255, "b": 677.2868100000001, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "backbone that receives the table image and encodes it as a", "bbox": {"l": 308.86197, "t": 680.33525, "r": 545.11499, "b": 689.24181, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "vector of predefined length. The network has been modified", "bbox": {"l": 308.86197, "t": 692.290253, "r": 545.11511, "b": 701.196815, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "by removing the linear and pooling layer, as we are not per-", "bbox": {"l": 308.86197, "t": 704.245255, "r": 545.11505, "b": 713.1518169999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "CNN Backbone Network. A ResNet-18 CNN is the backbone that receives the table image and encodes it as a vector of predefined length. The network has been modified by removing the linear and pooling layer, as we are not per-"}], "headers": [{"label": "page_footer", "id": 14, "page_no": 3, "cluster": {"id": 14, "label": "page_footer", "bbox": {"l": 295.12097, "t": 734.133251, "r": 300.10226, "b": 743.039814, "coord_origin": "TOPLEFT"}, "confidence": 0.8565718531608582, "cells": [{"id": 157, "text": "4", "bbox": {"l": 295.12097, "t": 734.133251, "r": 300.10226, "b": 743.039814, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4"}]}}, {"page_no": 4, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "1.", "bbox": {"l": 81.688072, "t": 122.43970000000002, "r": 84.927567, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Item", "bbox": {"l": 86.54731, "t": 122.43970000000002, "r": 93.026291, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Amount", "bbox": {"l": 102.50498, "t": 115.25214000000005, "r": 115.3461, "b": 118.44135000000006, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Names", "bbox": {"l": 82.140205, "t": 115.21489999999994, "r": 93.291527, "b": 118.40410999999995, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "1000", "bbox": {"l": 96.748268, "t": 122.43970000000002, "r": 104.3119, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "500", "bbox": {"l": 96.748268, "t": 127.74370999999985, "r": 102.42083, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "3500", "bbox": {"l": 96.748268, "t": 133.45569, "r": 104.3119, "b": 136.6449, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "150", "bbox": {"l": 96.748268, "t": 139.16772000000003, "r": 102.42083, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "unit", "bbox": {"l": 110.66107, "t": 122.43970000000002, "r": 116.14391, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "unit", "bbox": {"l": 110.66107, "t": 127.74370999999985, "r": 116.14391, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "unit", "bbox": {"l": 110.66107, "t": 133.45569, "r": 116.14391, "b": 136.6449, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "unit", "bbox": {"l": 110.66107, "t": 139.16772000000003, "r": 116.14391, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "2.", "bbox": {"l": 81.688072, "t": 127.74370999999985, "r": 84.927567, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Item", "bbox": {"l": 86.54731, "t": 127.74370999999985, "r": 93.026291, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "3.", "bbox": {"l": 81.688072, "t": 133.45569, "r": 84.927567, "b": 136.6449, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Item", "bbox": {"l": 86.54731, "t": 133.45569, "r": 93.026291, "b": 136.6449, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "4.", "bbox": {"l": 81.688072, "t": 139.16772000000003, "r": 84.927567, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "Item", "bbox": {"l": 86.54731, "t": 139.16772000000003, "r": 93.026291, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Extracted", "bbox": {"l": 88.084389, "t": 90.49738000000002, "r": 113.93649, "b": 96.23798, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Table Images", "bbox": {"l": 82.81002, "t": 97.63738999999998, "r": 119.21240000000002, "b": 103.37798999999995, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Standardized", "bbox": {"l": 143.94247, "t": 100.60235999999998, "r": 180.01131, "b": 106.34295999999995, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Images", "bbox": {"l": 151.94064, "t": 107.74237000000005, "r": 172.0118, "b": 113.48297000000014, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "BBox", "bbox": {"l": 251.76939000000002, "t": 80.93096999999989, "r": 266.39557, "b": 86.67156999999997, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Decoder", "bbox": {"l": 247.51601, "t": 86.03101000000004, "r": 270.65021, "b": 91.77161000000001, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "BBoxes", "bbox": {"l": 331.03699, "t": 78.55980999999997, "r": 352.12589, "b": 84.30042000000003, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "BBoxes can be", "bbox": {"l": 390.56421, "t": 96.03223000000003, "r": 431.7261, "b": 101.77282999999989, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "traced back to the", "bbox": {"l": 386.82422, "t": 102.15228000000013, "r": 435.46966999999995, "b": 107.89287999999999, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "original image to", "bbox": {"l": 388.69589, "t": 108.27228000000002, "r": 433.6032400000001, "b": 114.01288000000011, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "extract content", "bbox": {"l": 391.07761, "t": 114.39227000000005, "r": 431.22542999999996, "b": 120.13286999999991, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Structure Tags sequence", "bbox": {"l": 431.22650000000004, "t": 151.68511999999998, "r": 498.82068, "b": 157.42571999999996, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "provide full description of", "bbox": {"l": 431.1738, "t": 157.80517999999995, "r": 498.87753000000004, "b": 163.54578000000004, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "the table structure", "bbox": {"l": 440.5289, "t": 163.92516999999998, "r": 489.51827999999995, "b": 169.66576999999995, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Structure Tags", "bbox": {"l": 328.37479, "t": 178.25385000000006, "r": 367.72333, "b": 183.99445000000003, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "BBoxes in sync", "bbox": {"l": 331.84451, "t": 123.90886999999998, "r": 373.67963, "b": 129.64948000000015, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "with tag sequence", "bbox": {"l": 331.84451, "t": 129.00885000000017, "r": 381.17786, "b": 134.74945000000002, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "Encoder", "bbox": {"l": 196.62633, "t": 88.11621000000002, "r": 219.42332, "b": 93.85681, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Structure", "bbox": {"l": 246.66771, "t": 129.4946900000001, "r": 271.49899, "b": 135.23528999999996, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "Decoder", "bbox": {"l": 247.51601, "t": 134.59473000000003, "r": 270.65021, "b": 140.33533, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "[x1, y2, x2, y2]", "bbox": {"l": 330.63071, "t": 89.01923, "r": 365.55347, "b": 94.75982999999997, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "[x1', y2', x2', y2']", "bbox": {"l": 330.63071, "t": 97.17926, "r": 370.22717, "b": 102.91985999999997, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "[x1'', y2'', x2'', y2'']", "bbox": {"l": 330.63071, "t": 105.33922999999993, "r": 374.51157, "b": 111.07983000000002, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "...", "bbox": {"l": 330.63071, "t": 113.49926999999991, "r": 335.73233, "b": 119.23987, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "<TR>", "bbox": {"l": 322.30579, "t": 141.79236000000003, "r": 335.05988, "b": 146.57617000000005, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "<TD>", "bbox": {"l": 322.30579, "t": 148.93231000000003, "r": 335.05988, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "1", "bbox": {"l": 337.54971, "t": 148.55579, "r": 340.95242, "b": 154.29638999999997, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "</TD><TD colspan=\"2\">", "bbox": {"l": 343.56262, "t": 148.93231000000003, "r": 398.91446, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "</TD>", "bbox": {"l": 407.41718, "t": 148.93231000000003, "r": 421.58801, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "</TR><TR>", "bbox": {"l": 322.30579, "t": 156.07232999999997, "r": 349.23022, "b": 160.85613999999998, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "<TD>", "bbox": {"l": 322.30579, "t": 163.21234000000004, "r": 335.05988, "b": 167.99614999999994, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "</TD><TD>...", "bbox": {"l": 343.56155, "t": 163.21234000000004, "r": 374.73685, "b": 167.99614999999994, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "...", "bbox": {"l": 322.30579, "t": 170.35235999999998, "r": 326.55716, "b": 175.13617, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "1", "bbox": {"l": 323.51111, "t": 89.66967999999997, "r": 326.91382, "b": 95.41027999999994, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "2", "bbox": {"l": 323.71509, "t": 97.78887999999995, "r": 327.1178, "b": 103.52948000000004, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "3", "bbox": {"l": 323.71509, "t": 105.98969, "r": 327.1178, "b": 111.73029000000008, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "2", "bbox": {"l": 401.4816, "t": 148.54625999999996, "r": 404.88431, "b": 154.28687000000002, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "3", "bbox": {"l": 337.6976, "t": 162.68451000000005, "r": 341.10031, "b": 168.42511000000002, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "3", "bbox": {"l": 454.46378, "t": 104.54584, "r": 457.86648999999994, "b": 110.28644000000008, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "2", "bbox": {"l": 493.32580999999993, "t": 91.09546, "r": 496.72852, "b": 96.83605999999997, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "1", "bbox": {"l": 454.08298, "t": 90.56879000000015, "r": 457.48569000000003, "b": 96.30939000000001, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Figure 3:", "bbox": {"l": 50.112, "t": 204.10535000000004, "r": 86.883949, "b": 213.01189999999997, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "TableFormer", "bbox": {"l": 94.020996, "t": 203.98577999999998, "r": 149.85141, "b": 212.94214, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "takes in an image of the PDF and creates bounding box and HTML structure predictions that are", "bbox": {"l": 152.86099, "t": 204.10535000000004, "r": 545.10846, "b": 213.01189999999997, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "synchronized. The bounding boxes grabs the content from the PDF and inserts it in the structure.", "bbox": {"l": 50.111992, "t": 216.06035999999995, "r": 436.0134, "b": 224.96691999999996, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "Input Image", "bbox": {"l": 74.253464, "t": 258.21472000000006, "r": 101.75846, "b": 264.17474000000004, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "Tokenised Tags", "bbox": {"l": 122.29972, "t": 258.34520999999995, "r": 157.83972, "b": 264.30524, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "Multi-Head Attention", "bbox": {"l": 78.549347, "t": 371.38579999999996, "r": 125.68359000000001, "b": 377.04782, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "Add", "bbox": {"l": 78.513298, "t": 391.31857, "r": 84.644547, "b": 396.98059, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "& Normalisation", "bbox": {"l": 116.52705, "t": 391.31857, "r": 125.11079999999998, "b": 396.98059, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "Feed Forward Network", "bbox": {"l": 76.024773, "t": 424.45309, "r": 127.92327000000002, "b": 430.11511, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "Add", "bbox": {"l": 78.382828, "t": 444.88956, "r": 84.514076, "b": 450.55157, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "& Normalisation", "bbox": {"l": 116.39658, "t": 444.88956, "r": 124.98033, "b": 450.55157, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Linear", "bbox": {"l": 167.46945, "t": 462.44324, "r": 181.6292, "b": 468.10526, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "Softmax", "bbox": {"l": 165.61292, "t": 478.47107, "r": 184.43242, "b": 484.13309, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "CNN BACKBONE ENCODER", "bbox": {"l": 65.319511, "t": 324.26235999999994, "r": 132.9245, "b": 330.22235000000006, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "[30, 1, 2, 3, 4, \u2026 3, ", "bbox": {"l": 119.51457, "t": 269.66394, "r": 162.98782, "b": 274.72992, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "4, 5, 8, 31]", "bbox": {"l": 128.72858, "t": 274.91394, "r": 151.41083, "b": 279.97992, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "Positional ", "bbox": {"l": 60.434211999999995, "t": 338.95993, "r": 80.27021, "b": 344.26993, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "Encoding", "bbox": {"l": 60.598457, "t": 343.38605, "r": 78.854958, "b": 348.69604, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "Positional ", "bbox": {"l": 134.82877, "t": 293.37762, "r": 154.66476, "b": 298.68762, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "Encoding", "bbox": {"l": 134.99303, "t": 297.80370999999997, "r": 153.24953, "b": 303.11371, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "Add & Normalisation", "bbox": {"l": 150.55193, "t": 345.35861, "r": 197.14943, "b": 351.02063, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Add", "bbox": {"l": 150.55193, "t": 394.4234, "r": 156.68318, "b": 400.08542, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "& Normalisation", "bbox": {"l": 188.56567, "t": 394.4234, "r": 197.14943, "b": 400.08542, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "Multi-Head Attention", "bbox": {"l": 150.18539, "t": 375.66843, "r": 197.31964, "b": 381.33044, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "Add", "bbox": {"l": 150.55193, "t": 440.24847000000005, "r": 156.68318, "b": 445.91049, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "& Normalisation", "bbox": {"l": 188.56567, "t": 440.24847000000005, "r": 197.14943, "b": 445.91049, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Feed Forward Network", "bbox": {"l": 147.86377, "t": 422.09335, "r": 199.76227, "b": 427.75537, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Linear", "bbox": {"l": 241.56567000000004, "t": 314.26285000000007, "r": 255.72542, "b": 319.92487, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "Linear", "bbox": {"l": 241.91730000000004, "t": 361.36493, "r": 256.07706, "b": 367.02695, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "Attention", "bbox": {"l": 228.054, "t": 336.61929000000003, "r": 248.72363000000004, "b": 342.28131, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "Network", "bbox": {"l": 246.2919, "t": 336.61929000000003, "r": 269.39325, "b": 342.28131, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "MLP", "bbox": {"l": 228.44568000000004, "t": 405.14682, "r": 238.73892, "b": 410.80884, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Linear ", "bbox": {"l": 256.29767, "t": 405.2032500000001, "r": 271.77792, "b": 410.86526, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "Sigmoid", "bbox": {"l": 239.54543, "t": 382.21344, "r": 258.08942, "b": 387.87546, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "Transformer Encoder Network", "bbox": {"l": 54.14704100000001, "t": 384.87183, "r": 59.51152, "b": 449.78326, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "x2", "bbox": {"l": 54.235424, "t": 373.81232, "r": 59.30449699999999, "b": 378.45421999999996, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "Encoded Output", "bbox": {"l": 85.295891, "t": 484.53189, "r": 122.16431, "b": 490.36688, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "Encoded Output", "bbox": {"l": 229.66599, "t": 279.54607999999996, "r": 265.3194, "b": 285.45572000000004, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "Predicted Tags", "bbox": {"l": 157.17369, "t": 500.3031, "r": 190.41711, "b": 506.12943, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "Bounding Boxes & ", "bbox": {"l": 227.81598999999997, "t": 438.05542, "r": 270.78442, "b": 443.89206, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "Classification", "bbox": {"l": 233.70262, "t": 444.06183, "r": 263.51105, "b": 449.8904999999999, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "Transformer ", "bbox": {"l": 184.74655, "t": 293.39502, "r": 212.16055, "b": 298.75903, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "Decoder Network", "bbox": {"l": 178.91229, "t": 299.14502, "r": 216.74378999999996, "b": 304.50903, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "x4", "bbox": {"l": 194.24574, "t": 282.7822, "r": 198.89099, "b": 287.84817999999996, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "CELL BBOX DECODER", "bbox": {"l": 221.45587, "t": 271.86914, "r": 276.47089, "b": 277.82916, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "Masked Multi-Head ", "bbox": {"l": 151.65219, "t": 323.44241, "r": 197.29019, "b": 329.10443, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "Attention", "bbox": {"l": 163.43277, "t": 329.44241, "r": 184.19028, "b": 335.10443, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "Figure 4: Given an input image of a table, the", "bbox": {"l": 50.112, "t": 527.90237, "r": 229.78752, "b": 536.80893, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "Encoder", "bbox": {"l": 231.787, "t": 527.7828099999999, "r": 267.76196, "b": 536.7392, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "pro-", "bbox": {"l": 269.76401, "t": 527.90237, "r": 286.36169, "b": 536.80893, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "duces fixed-length features that represent the input image.", "bbox": {"l": 50.112015, "t": 539.85738, "r": 286.36508, "b": 548.76393, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "The features are then passed to both the", "bbox": {"l": 50.112015, "t": 551.81337, "r": 205.84735, "b": 560.71992, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "Structure Decoder", "bbox": {"l": 208.01802, "t": 551.69382, "r": 286.36392, "b": 560.6501900000001, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "and", "bbox": {"l": 50.112015, "t": 563.76837, "r": 64.498009, "b": 572.67493, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "Cell BBox Decoder", "bbox": {"l": 68.165016, "t": 563.64882, "r": 151.31288, "b": 572.60519, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": ".", "bbox": {"l": 151.31302, "t": 563.76837, "r": 153.80367, "b": 572.67493, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "During training, the", "bbox": {"l": 160.41884, "t": 563.76837, "r": 241.93283000000002, "b": 572.67493, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "Structure", "bbox": {"l": 245.59502, "t": 563.64882, "r": 286.362, "b": 572.60519, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "Decoder", "bbox": {"l": 50.112015, "t": 575.60382, "r": 85.519089, "b": 584.5602, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "receives \u2018tokenized tags\u2019 of the HTML code that", "bbox": {"l": 88.623016, "t": 575.7233699999999, "r": 286.36072, "b": 584.6299300000001, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "represent the table structure. Afterwards, a transformer en-", "bbox": {"l": 50.112015, "t": 587.6783800000001, "r": 286.36511, "b": 596.58493, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "coder and decoder architecture is employed to produce fea-", "bbox": {"l": 50.112015, "t": 599.63338, "r": 286.36508, "b": 608.53993, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "tures that are received by a linear layer, and the", "bbox": {"l": 50.112015, "t": 611.58838, "r": 240.43756000000002, "b": 620.4949300000001, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "Cell BBox", "bbox": {"l": 243.19801, "t": 611.46883, "r": 286.36597, "b": 620.4252, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "Decoder. The linear layer is applied to the features to", "bbox": {"l": 50.112015, "t": 623.42482, "r": 286.36511, "b": 632.3812, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "predict the tags. Simultaneously, the Cell BBox Decoder", "bbox": {"l": 50.112015, "t": 635.37982, "r": 286.36508, "b": 644.3362, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "selects features referring to the data cells (\u2018", "bbox": {"l": 50.112015, "t": 647.45438, "r": 220.58205, "b": 656.36093, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "<", "bbox": {"l": 220.57802000000004, "t": 647.29497, "r": 228.32693, "b": 656.14175, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "td", "bbox": {"l": 228.32700999999997, "t": 647.45438, "r": 236.07791000000003, "b": 656.36093, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": ">", "bbox": {"l": 236.07802000000004, "t": 647.29497, "r": 243.82693, "b": 656.14175, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "\u2019, \u2018", "bbox": {"l": 243.82602, "t": 647.45438, "r": 255.29298000000003, "b": 656.36093, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "<", "bbox": {"l": 255.29102000000003, "t": 647.29497, "r": 263.03992, "b": 656.14175, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "\u2019) and", "bbox": {"l": 263.04001, "t": 647.45438, "r": 286.36246, "b": 656.36093, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "passes them through an attention network, an MLP, and a", "bbox": {"l": 50.112015, "t": 659.40938, "r": 286.36511, "b": 668.31594, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "linear layer to predict the bounding boxes.", "bbox": {"l": 50.112015, "t": 671.36438, "r": 218.46996, "b": 680.27094, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "forming classification, and adding an adaptive pooling", "bbox": {"l": 308.862, "t": 249.53441999999995, "r": 523.05786, "b": 258.44097999999997, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "layer", "bbox": {"l": 525.19983, "t": 249.53441999999995, "r": 545.11505, "b": 258.44097999999997, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "of size 28*28. ResNet by default downsamples the", "bbox": {"l": 308.862, "t": 261.49042, "r": 517.55847, "b": 270.39697, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "image", "bbox": {"l": 520.76642, "t": 261.49042, "r": 545.11499, "b": 270.39697, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "resolution by 32 and then the encoded image is provided", "bbox": {"l": 308.862, "t": 273.44537, "r": 534.80377, "b": 282.35196, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "to", "bbox": {"l": 537.36414, "t": 273.44537, "r": 545.11505, "b": 282.35196, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "both the", "bbox": {"l": 308.862, "t": 285.40039, "r": 341.24045, "b": 294.3069499999999, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "Structure Decoder", "bbox": {"l": 343.73099, "t": 285.49005, "r": 417.23508, "b": 294.07782000000003, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": ", and", "bbox": {"l": 417.23398, "t": 285.40039, "r": 436.60129, "b": 294.3069499999999, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "Cell BBox Decoder", "bbox": {"l": 439.09198, "t": 285.49005, "r": 516.56116, "b": 294.07782000000003, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": ".", "bbox": {"l": 516.56097, "t": 285.40039, "r": 519.05164, "b": 294.3069499999999, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "Structure Decoder.", "bbox": {"l": 320.81696, "t": 297.33981, "r": 400.86649, "b": 306.2962, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "The transformer architecture of", "bbox": {"l": 403.91394, "t": 297.45938, "r": 528.33685, "b": 306.36594, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "this", "bbox": {"l": 530.7179, "t": 297.45938, "r": 545.11383, "b": 306.36594, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "component is based on the work proposed in [31].", "bbox": {"l": 308.86194, "t": 309.41437, "r": 517.5285, "b": 318.32092, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "After", "bbox": {"l": 524.09387, "t": 309.41437, "r": 545.11493, "b": 318.32092, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "extensive experimentation, the", "bbox": {"l": 308.86194, "t": 321.36934999999994, "r": 432.35833999999994, "b": 330.27591, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "Structure Decoder", "bbox": {"l": 435.81995000000006, "t": 321.45901, "r": 510.29041, "b": 330.04678, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "is", "bbox": {"l": 513.97797, "t": 321.36934999999994, "r": 520.62305, "b": 330.27591, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "mod-", "bbox": {"l": 524.08008, "t": 321.36934999999994, "r": 545.11115, "b": 330.27591, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "eled as a transformer encoder with two encoder layers", "bbox": {"l": 308.86197, "t": 333.32434, "r": 527.76013, "b": 342.2309, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "and", "bbox": {"l": 530.729, "t": 333.32434, "r": 545.11499, "b": 342.2309, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "a transformer decoder made from a stack of 4 decoder", "bbox": {"l": 308.86197, "t": 345.27933, "r": 526.85352, "b": 354.18588, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "lay-", "bbox": {"l": 529.62311, "t": 345.27933, "r": 545.11493, "b": 354.18588, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "ers that comprise mainly of multi-head attention and", "bbox": {"l": 308.86197, "t": 357.23532, "r": 524.51245, "b": 366.14188, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "feed", "bbox": {"l": 527.96948, "t": 357.23532, "r": 545.11511, "b": 366.14188, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "forward layers.", "bbox": {"l": 308.86197, "t": 369.19031000000007, "r": 370.39096, "b": 378.09685999999994, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "This configuration uses fewer layers", "bbox": {"l": 377.44449, "t": 369.19031000000007, "r": 526.91339, "b": 378.09685999999994, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "and", "bbox": {"l": 530.72906, "t": 369.19031000000007, "r": 545.11505, "b": 378.09685999999994, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "heads in comparison to networks applied to other", "bbox": {"l": 308.86197, "t": 381.14529000000005, "r": 505.46395999999993, "b": 390.05185, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "problems", "bbox": {"l": 508.03430000000003, "t": 381.14529000000005, "r": 545.11511, "b": 390.05185, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "(e.g. \u201cScene Understanding\u201d, \u201cImage Captioning\u201d),", "bbox": {"l": 308.86197, "t": 393.10028, "r": 517.68799, "b": 402.00684, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "some-", "bbox": {"l": 520.76642, "t": 393.10028, "r": 545.11499, "b": 402.00684, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "thing which we relate to the simplicity of table images.", "bbox": {"l": 308.86197, "t": 405.05526999999995, "r": 528.01935, "b": 413.96182, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "The transformer encoder receives an encoded", "bbox": {"l": 320.81696, "t": 417.11426, "r": 515.49609, "b": 426.02081, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "image", "bbox": {"l": 520.7663, "t": 417.11426, "r": 545.11487, "b": 426.02081, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "from the", "bbox": {"l": 308.86197, "t": 429.0692399999999, "r": 343.72107, "b": 437.9758, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "CNN Backbone Network", "bbox": {"l": 347.03796, "t": 429.15891, "r": 446.45471000000003, "b": 437.74667, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "and refines it", "bbox": {"l": 449.93996999999996, "t": 429.0692399999999, "r": 503.06055000000003, "b": 437.9758, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "through", "bbox": {"l": 506.37808, "t": 429.0692399999999, "r": 537.3717, "b": 437.9758, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "a", "bbox": {"l": 540.68927, "t": 429.0692399999999, "r": 545.11267, "b": 437.9758, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "multi-head dot-product attention layer, followed by a", "bbox": {"l": 308.86197, "t": 441.02423, "r": 522.78894, "b": 449.93079, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "Feed", "bbox": {"l": 525.7478, "t": 441.02423, "r": 545.11511, "b": 449.93079, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "Forward Network.", "bbox": {"l": 308.86197, "t": 452.97922, "r": 384.14929, "b": 461.88577, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "During training, the transformer", "bbox": {"l": 393.37466, "t": 452.97922, "r": 527.84985, "b": 461.88577, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "de-", "bbox": {"l": 532.39282, "t": 452.97922, "r": 545.11505, "b": 461.88577, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "coder receives as input the output feature produced by", "bbox": {"l": 308.86197, "t": 464.93521, "r": 529.7627, "b": 473.84177, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "the", "bbox": {"l": 532.94073, "t": 464.93521, "r": 545.11505, "b": 473.84177, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "transformer encoder, and the tokenized input of the", "bbox": {"l": 308.86197, "t": 476.8902, "r": 514.17126, "b": 485.79675, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "HTML", "bbox": {"l": 516.89105, "t": 476.8902, "r": 545.11511, "b": 485.79675, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": "ground-truth tags. Using a stack of multi-head attention", "bbox": {"l": 308.86197, "t": 488.84518, "r": 527.63068, "b": 497.75174, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "lay-", "bbox": {"l": 529.62317, "t": 488.84518, "r": 545.11499, "b": 497.75174, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "ers, different aspects of the tag sequence could be", "bbox": {"l": 308.86197, "t": 500.80017, "r": 508.3630999999999, "b": 509.70673, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": "inferred.", "bbox": {"l": 511.09286000000003, "t": 500.80017, "r": 545.11511, "b": 509.70673, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "This is achieved by each attention head on a layer operating", "bbox": {"l": 308.86197, "t": 512.7551599999999, "r": 545.11499, "b": 521.6617100000001, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "in a different subspace, and then combining altogether their", "bbox": {"l": 308.86197, "t": 524.71115, "r": 545.11511, "b": 533.61771, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "attention score.", "bbox": {"l": 308.86197, "t": 536.66615, "r": 369.73349, "b": 545.57271, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": "Cell BBox Decoder.", "bbox": {"l": 320.81696, "t": 548.6046, "r": 404.76184, "b": 557.56097, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "Our architecture allows to simul-", "bbox": {"l": 410.34094, "t": 548.72415, "r": 545.11505, "b": 557.63071, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "taneously predict HTML tags and bounding boxes for each", "bbox": {"l": 308.86194, "t": 560.68015, "r": 545.11493, "b": 569.5867000000001, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "table cell without the need of a separate object detector end", "bbox": {"l": 308.86194, "t": 572.6351500000001, "r": 545.11511, "b": 581.5417, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "to end. This approach is inspired by DETR [1] which em-", "bbox": {"l": 308.86194, "t": 584.59015, "r": 545.11493, "b": 593.4967, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "ploys a Transformer Encoder, and Decoder that looks for", "bbox": {"l": 308.86194, "t": 596.54515, "r": 545.11499, "b": 605.45171, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "a specific number of object queries (potential object detec-", "bbox": {"l": 308.86194, "t": 608.50015, "r": 545.11505, "b": 617.40671, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "tions). As our model utilizes a transformer architecture, the", "bbox": {"l": 308.86194, "t": 620.45515, "r": 545.11505, "b": 629.36171, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "hidden state of the", "bbox": {"l": 308.86194, "t": 632.41115, "r": 381.67859, "b": 641.3177000000001, "coord_origin": "TOPLEFT"}}, {"id": 201, "text": "<", "bbox": {"l": 383.99695, "t": 632.25174, "r": 391.74585, "b": 641.09853, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": "td", "bbox": {"l": 391.74594, "t": 632.41115, "r": 399.49686, "b": 641.3177000000001, "coord_origin": "TOPLEFT"}}, {"id": 203, "text": ">", "bbox": {"l": 399.49695, "t": 632.25174, "r": 407.24585, "b": 641.09853, "coord_origin": "TOPLEFT"}}, {"id": 204, "text": "\u2019 and \u2018", "bbox": {"l": 407.24594, "t": 632.41115, "r": 432.90958, "b": 641.3177000000001, "coord_origin": "TOPLEFT"}}, {"id": 205, "text": "<", "bbox": {"l": 432.90792999999996, "t": 632.25174, "r": 440.65683000000007, "b": 641.09853, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": "\u2019 HTML structure tags be-", "bbox": {"l": 440.65691999999996, "t": 632.41115, "r": 545.11475, "b": 641.3177000000001, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": "come the object query.", "bbox": {"l": 308.86194, "t": 644.3661500000001, "r": 398.96371, "b": 653.27271, "coord_origin": "TOPLEFT"}}, {"id": 208, "text": "The encoding generated by the", "bbox": {"l": 320.81693, "t": 656.42516, "r": 444.34316999999993, "b": 665.33172, "coord_origin": "TOPLEFT"}}, {"id": 209, "text": "CNN Backbone Network", "bbox": {"l": 447.00591999999995, "t": 656.51482, "r": 545.1076, "b": 665.10258, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": "along with the features acquired for every data cell from the", "bbox": {"l": 308.86194, "t": 668.38016, "r": 545.11505, "b": 677.2867200000001, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "Transformer Decoder are then passed to the attention net-", "bbox": {"l": 308.86194, "t": 680.33516, "r": 545.11505, "b": 689.24172, "coord_origin": "TOPLEFT"}}, {"id": 212, "text": "work. The attention network takes both inputs and learns to", "bbox": {"l": 308.86194, "t": 692.290161, "r": 545.11505, "b": 701.196724, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "provide an attention weighted encoding. This weighted at-", "bbox": {"l": 308.86194, "t": 704.245163, "r": 545.11505, "b": 713.151726, "coord_origin": "TOPLEFT"}}, {"id": 214, "text": "5", "bbox": {"l": 295.12094, "t": 734.13316, "r": 300.10223, "b": 743.039722, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 7, "label": "picture", "bbox": {"l": 74.30525970458984, "t": 77.91120147705078, "r": 519.9801025390625, "b": 183.70150756835938, "coord_origin": "TOPLEFT"}, "confidence": 0.9296807646751404, "cells": [{"id": 0, "text": "1.", "bbox": {"l": 81.688072, "t": 122.43970000000002, "r": 84.927567, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Item", "bbox": {"l": 86.54731, "t": 122.43970000000002, "r": 93.026291, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Amount", "bbox": {"l": 102.50498, "t": 115.25214000000005, "r": 115.3461, "b": 118.44135000000006, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Names", "bbox": {"l": 82.140205, "t": 115.21489999999994, "r": 93.291527, "b": 118.40410999999995, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "1000", "bbox": {"l": 96.748268, "t": 122.43970000000002, "r": 104.3119, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "500", "bbox": {"l": 96.748268, "t": 127.74370999999985, "r": 102.42083, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "3500", "bbox": {"l": 96.748268, "t": 133.45569, "r": 104.3119, "b": 136.6449, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "150", "bbox": {"l": 96.748268, "t": 139.16772000000003, "r": 102.42083, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "unit", "bbox": {"l": 110.66107, "t": 122.43970000000002, "r": 116.14391, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "unit", "bbox": {"l": 110.66107, "t": 127.74370999999985, "r": 116.14391, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "unit", "bbox": {"l": 110.66107, "t": 133.45569, "r": 116.14391, "b": 136.6449, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "unit", "bbox": {"l": 110.66107, "t": 139.16772000000003, "r": 116.14391, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "2.", "bbox": {"l": 81.688072, "t": 127.74370999999985, "r": 84.927567, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Item", "bbox": {"l": 86.54731, "t": 127.74370999999985, "r": 93.026291, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "3.", "bbox": {"l": 81.688072, "t": 133.45569, "r": 84.927567, "b": 136.6449, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Item", "bbox": {"l": 86.54731, "t": 133.45569, "r": 93.026291, "b": 136.6449, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "4.", "bbox": {"l": 81.688072, "t": 139.16772000000003, "r": 84.927567, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "Item", "bbox": {"l": 86.54731, "t": 139.16772000000003, "r": 93.026291, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Extracted", "bbox": {"l": 88.084389, "t": 90.49738000000002, "r": 113.93649, "b": 96.23798, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Table Images", "bbox": {"l": 82.81002, "t": 97.63738999999998, "r": 119.21240000000002, "b": 103.37798999999995, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Standardized", "bbox": {"l": 143.94247, "t": 100.60235999999998, "r": 180.01131, "b": 106.34295999999995, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Images", "bbox": {"l": 151.94064, "t": 107.74237000000005, "r": 172.0118, "b": 113.48297000000014, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "BBox", "bbox": {"l": 251.76939000000002, "t": 80.93096999999989, "r": 266.39557, "b": 86.67156999999997, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Decoder", "bbox": {"l": 247.51601, "t": 86.03101000000004, "r": 270.65021, "b": 91.77161000000001, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "BBoxes", "bbox": {"l": 331.03699, "t": 78.55980999999997, "r": 352.12589, "b": 84.30042000000003, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "BBoxes can be", "bbox": {"l": 390.56421, "t": 96.03223000000003, "r": 431.7261, "b": 101.77282999999989, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "traced back to the", "bbox": {"l": 386.82422, "t": 102.15228000000013, "r": 435.46966999999995, "b": 107.89287999999999, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "original image to", "bbox": {"l": 388.69589, "t": 108.27228000000002, "r": 433.6032400000001, "b": 114.01288000000011, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "extract content", "bbox": {"l": 391.07761, "t": 114.39227000000005, "r": 431.22542999999996, "b": 120.13286999999991, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Structure Tags sequence", "bbox": {"l": 431.22650000000004, "t": 151.68511999999998, "r": 498.82068, "b": 157.42571999999996, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "provide full description of", "bbox": {"l": 431.1738, "t": 157.80517999999995, "r": 498.87753000000004, "b": 163.54578000000004, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "the table structure", "bbox": {"l": 440.5289, "t": 163.92516999999998, "r": 489.51827999999995, "b": 169.66576999999995, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Structure Tags", "bbox": {"l": 328.37479, "t": 178.25385000000006, "r": 367.72333, "b": 183.99445000000003, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "BBoxes in sync", "bbox": {"l": 331.84451, "t": 123.90886999999998, "r": 373.67963, "b": 129.64948000000015, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "with tag sequence", "bbox": {"l": 331.84451, "t": 129.00885000000017, "r": 381.17786, "b": 134.74945000000002, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "Encoder", "bbox": {"l": 196.62633, "t": 88.11621000000002, "r": 219.42332, "b": 93.85681, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Structure", "bbox": {"l": 246.66771, "t": 129.4946900000001, "r": 271.49899, "b": 135.23528999999996, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "Decoder", "bbox": {"l": 247.51601, "t": 134.59473000000003, "r": 270.65021, "b": 140.33533, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "[x1, y2, x2, y2]", "bbox": {"l": 330.63071, "t": 89.01923, "r": 365.55347, "b": 94.75982999999997, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "[x1', y2', x2', y2']", "bbox": {"l": 330.63071, "t": 97.17926, "r": 370.22717, "b": 102.91985999999997, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "[x1'', y2'', x2'', y2'']", "bbox": {"l": 330.63071, "t": 105.33922999999993, "r": 374.51157, "b": 111.07983000000002, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "...", "bbox": {"l": 330.63071, "t": 113.49926999999991, "r": 335.73233, "b": 119.23987, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "<TR>", "bbox": {"l": 322.30579, "t": 141.79236000000003, "r": 335.05988, "b": 146.57617000000005, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "<TD>", "bbox": {"l": 322.30579, "t": 148.93231000000003, "r": 335.05988, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "1", "bbox": {"l": 337.54971, "t": 148.55579, "r": 340.95242, "b": 154.29638999999997, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "</TD><TD colspan=\"2\">", "bbox": {"l": 343.56262, "t": 148.93231000000003, "r": 398.91446, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "</TD>", "bbox": {"l": 407.41718, "t": 148.93231000000003, "r": 421.58801, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "</TR><TR>", "bbox": {"l": 322.30579, "t": 156.07232999999997, "r": 349.23022, "b": 160.85613999999998, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "<TD>", "bbox": {"l": 322.30579, "t": 163.21234000000004, "r": 335.05988, "b": 167.99614999999994, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "</TD><TD>...", "bbox": {"l": 343.56155, "t": 163.21234000000004, "r": 374.73685, "b": 167.99614999999994, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "...", "bbox": {"l": 322.30579, "t": 170.35235999999998, "r": 326.55716, "b": 175.13617, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "1", "bbox": {"l": 323.51111, "t": 89.66967999999997, "r": 326.91382, "b": 95.41027999999994, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "2", "bbox": {"l": 323.71509, "t": 97.78887999999995, "r": 327.1178, "b": 103.52948000000004, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "3", "bbox": {"l": 323.71509, "t": 105.98969, "r": 327.1178, "b": 111.73029000000008, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "2", "bbox": {"l": 401.4816, "t": 148.54625999999996, "r": 404.88431, "b": 154.28687000000002, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "3", "bbox": {"l": 337.6976, "t": 162.68451000000005, "r": 341.10031, "b": 168.42511000000002, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "3", "bbox": {"l": 454.46378, "t": 104.54584, "r": 457.86648999999994, "b": 110.28644000000008, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "2", "bbox": {"l": 493.32580999999993, "t": 91.09546, "r": 496.72852, "b": 96.83605999999997, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "1", "bbox": {"l": 454.08298, "t": 90.56879000000015, "r": 457.48569000000003, "b": 96.30939000000001, "coord_origin": "TOPLEFT"}}], "children": [{"id": 10, "label": "text", "bbox": {"l": 81.688072, "t": 122.43970000000002, "r": 84.927567, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 0, "text": "1.", "bbox": {"l": 81.688072, "t": 122.43970000000002, "r": 84.927567, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 86.54731, "t": 122.43970000000002, "r": 93.026291, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 1, "text": "Item", "bbox": {"l": 86.54731, "t": 122.43970000000002, "r": 93.026291, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 102.50498, "t": 115.25214000000005, "r": 115.3461, "b": 118.44135000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 2, "text": "Amount", "bbox": {"l": 102.50498, "t": 115.25214000000005, "r": 115.3461, "b": 118.44135000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 82.140205, "t": 115.21489999999994, "r": 93.291527, "b": 118.40410999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 3, "text": "Names", "bbox": {"l": 82.140205, "t": 115.21489999999994, "r": 93.291527, "b": 118.40410999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 96.748268, "t": 122.43970000000002, "r": 104.3119, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 4, "text": "1000", "bbox": {"l": 96.748268, "t": 122.43970000000002, "r": 104.3119, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 96.748268, "t": 127.74370999999985, "r": 102.42083, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 5, "text": "500", "bbox": {"l": 96.748268, "t": 127.74370999999985, "r": 102.42083, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 96.748268, "t": 133.45569, "r": 104.3119, "b": 136.6449, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": "3500", "bbox": {"l": 96.748268, "t": 133.45569, "r": 104.3119, "b": 136.6449, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 96.748268, "t": 139.16772000000003, "r": 102.42083, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "150", "bbox": {"l": 96.748268, "t": 139.16772000000003, "r": 102.42083, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 110.66107, "t": 122.43970000000002, "r": 116.14391, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "unit", "bbox": {"l": 110.66107, "t": 122.43970000000002, "r": 116.14391, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 110.66107, "t": 127.74370999999985, "r": 116.14391, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "unit", "bbox": {"l": 110.66107, "t": 127.74370999999985, "r": 116.14391, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 110.66107, "t": 133.45569, "r": 116.14391, "b": 136.6449, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "unit", "bbox": {"l": 110.66107, "t": 133.45569, "r": 116.14391, "b": 136.6449, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 110.66107, "t": 139.16772000000003, "r": 116.14391, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "unit", "bbox": {"l": 110.66107, "t": 139.16772000000003, "r": 116.14391, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 81.688072, "t": 127.74370999999985, "r": 84.927567, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "2.", "bbox": {"l": 81.688072, "t": 127.74370999999985, "r": 84.927567, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 86.54731, "t": 127.74370999999985, "r": 93.026291, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "Item", "bbox": {"l": 86.54731, "t": 127.74370999999985, "r": 93.026291, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 81.688072, "t": 133.45569, "r": 84.927567, "b": 136.6449, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "3.", "bbox": {"l": 81.688072, "t": 133.45569, "r": 84.927567, "b": 136.6449, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 86.54731, "t": 133.45569, "r": 93.026291, "b": 136.6449, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "Item", "bbox": {"l": 86.54731, "t": 133.45569, "r": 93.026291, "b": 136.6449, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 81.688072, "t": 139.16772000000003, "r": 84.927567, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "4.", "bbox": {"l": 81.688072, "t": 139.16772000000003, "r": 84.927567, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 86.54731, "t": 139.16772000000003, "r": 93.026291, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "Item", "bbox": {"l": 86.54731, "t": 139.16772000000003, "r": 93.026291, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 88.084389, "t": 90.49738000000002, "r": 113.93649, "b": 96.23798, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "Extracted", "bbox": {"l": 88.084389, "t": 90.49738000000002, "r": 113.93649, "b": 96.23798, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 82.81002, "t": 97.63738999999998, "r": 119.21240000000002, "b": 103.37798999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "Table Images", "bbox": {"l": 82.81002, "t": 97.63738999999998, "r": 119.21240000000002, "b": 103.37798999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 143.94247, "t": 100.60235999999998, "r": 180.01131, "b": 106.34295999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "Standardized", "bbox": {"l": 143.94247, "t": 100.60235999999998, "r": 180.01131, "b": 106.34295999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 151.94064, "t": 107.74237000000005, "r": 172.0118, "b": 113.48297000000014, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "Images", "bbox": {"l": 151.94064, "t": 107.74237000000005, "r": 172.0118, "b": 113.48297000000014, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 251.76939000000002, "t": 80.93096999999989, "r": 266.39557, "b": 86.67156999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "BBox", "bbox": {"l": 251.76939000000002, "t": 80.93096999999989, "r": 266.39557, "b": 86.67156999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 247.51601, "t": 86.03101000000004, "r": 270.65021, "b": 91.77161000000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "Decoder", "bbox": {"l": 247.51601, "t": 86.03101000000004, "r": 270.65021, "b": 91.77161000000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 331.03699, "t": 78.55980999999997, "r": 352.12589, "b": 84.30042000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "BBoxes", "bbox": {"l": 331.03699, "t": 78.55980999999997, "r": 352.12589, "b": 84.30042000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 390.56421, "t": 96.03223000000003, "r": 431.7261, "b": 101.77282999999989, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "BBoxes can be", "bbox": {"l": 390.56421, "t": 96.03223000000003, "r": 431.7261, "b": 101.77282999999989, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 386.82422, "t": 102.15228000000013, "r": 435.46966999999995, "b": 107.89287999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "traced back to the", "bbox": {"l": 386.82422, "t": 102.15228000000013, "r": 435.46966999999995, "b": 107.89287999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 388.69589, "t": 108.27228000000002, "r": 433.6032400000001, "b": 114.01288000000011, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "original image to", "bbox": {"l": 388.69589, "t": 108.27228000000002, "r": 433.6032400000001, "b": 114.01288000000011, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 391.07761, "t": 114.39227000000005, "r": 431.22542999999996, "b": 120.13286999999991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "extract content", "bbox": {"l": 391.07761, "t": 114.39227000000005, "r": 431.22542999999996, "b": 120.13286999999991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 431.22650000000004, "t": 151.68511999999998, "r": 498.82068, "b": 157.42571999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "Structure Tags sequence", "bbox": {"l": 431.22650000000004, "t": 151.68511999999998, "r": 498.82068, "b": 157.42571999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 431.1738, "t": 157.80517999999995, "r": 498.87753000000004, "b": 163.54578000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "provide full description of", "bbox": {"l": 431.1738, "t": 157.80517999999995, "r": 498.87753000000004, "b": 163.54578000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 440.5289, "t": 163.92516999999998, "r": 489.51827999999995, "b": 169.66576999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "the table structure", "bbox": {"l": 440.5289, "t": 163.92516999999998, "r": 489.51827999999995, "b": 169.66576999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 328.37479, "t": 178.25385000000006, "r": 367.72333, "b": 183.99445000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "Structure Tags", "bbox": {"l": 328.37479, "t": 178.25385000000006, "r": 367.72333, "b": 183.99445000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 331.84451, "t": 123.90886999999998, "r": 373.67963, "b": 129.64948000000015, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "BBoxes in sync", "bbox": {"l": 331.84451, "t": 123.90886999999998, "r": 373.67963, "b": 129.64948000000015, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 331.84451, "t": 129.00885000000017, "r": 381.17786, "b": 134.74945000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "with tag sequence", "bbox": {"l": 331.84451, "t": 129.00885000000017, "r": 381.17786, "b": 134.74945000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 196.62633, "t": 88.11621000000002, "r": 219.42332, "b": 93.85681, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "Encoder", "bbox": {"l": 196.62633, "t": 88.11621000000002, "r": 219.42332, "b": 93.85681, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 246.66771, "t": 129.4946900000001, "r": 271.49899, "b": 135.23528999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "Structure", "bbox": {"l": 246.66771, "t": 129.4946900000001, "r": 271.49899, "b": 135.23528999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 247.51601, "t": 134.59473000000003, "r": 270.65021, "b": 140.33533, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "Decoder", "bbox": {"l": 247.51601, "t": 134.59473000000003, "r": 270.65021, "b": 140.33533, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 330.63071, "t": 89.01923, "r": 365.55347, "b": 94.75982999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "[x1, y2, x2, y2]", "bbox": {"l": 330.63071, "t": 89.01923, "r": 365.55347, "b": 94.75982999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 330.63071, "t": 97.17926, "r": 370.22717, "b": 102.91985999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "[x1', y2', x2', y2']", "bbox": {"l": 330.63071, "t": 97.17926, "r": 370.22717, "b": 102.91985999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 330.63071, "t": 105.33922999999993, "r": 374.51157, "b": 111.07983000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "[x1'', y2'', x2'', y2'']", "bbox": {"l": 330.63071, "t": 105.33922999999993, "r": 374.51157, "b": 111.07983000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 330.63071, "t": 113.49926999999991, "r": 335.73233, "b": 119.23987, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "...", "bbox": {"l": 330.63071, "t": 113.49926999999991, "r": 335.73233, "b": 119.23987, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 322.30579, "t": 141.79236000000003, "r": 335.05988, "b": 146.57617000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "<TR>", "bbox": {"l": 322.30579, "t": 141.79236000000003, "r": 335.05988, "b": 146.57617000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 322.30579, "t": 148.93231000000003, "r": 335.05988, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "<TD>", "bbox": {"l": 322.30579, "t": 148.93231000000003, "r": 335.05988, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 337.54971, "t": 148.55579, "r": 340.95242, "b": 154.29638999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "1", "bbox": {"l": 337.54971, "t": 148.55579, "r": 340.95242, "b": 154.29638999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 343.56262, "t": 148.93231000000003, "r": 398.91446, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "</TD><TD colspan=\"2\">", "bbox": {"l": 343.56262, "t": 148.93231000000003, "r": 398.91446, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 407.41718, "t": 148.93231000000003, "r": 421.58801, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "</TD>", "bbox": {"l": 407.41718, "t": 148.93231000000003, "r": 421.58801, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 322.30579, "t": 156.07232999999997, "r": 349.23022, "b": 160.85613999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "</TR><TR>", "bbox": {"l": 322.30579, "t": 156.07232999999997, "r": 349.23022, "b": 160.85613999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 322.30579, "t": 163.21234000000004, "r": 335.05988, "b": 167.99614999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "<TD>", "bbox": {"l": 322.30579, "t": 163.21234000000004, "r": 335.05988, "b": 167.99614999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 343.56155, "t": 163.21234000000004, "r": 374.73685, "b": 167.99614999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "</TD><TD>...", "bbox": {"l": 343.56155, "t": 163.21234000000004, "r": 374.73685, "b": 167.99614999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 322.30579, "t": 170.35235999999998, "r": 326.55716, "b": 175.13617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "...", "bbox": {"l": 322.30579, "t": 170.35235999999998, "r": 326.55716, "b": 175.13617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 323.51111, "t": 89.66967999999997, "r": 326.91382, "b": 95.41027999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "1", "bbox": {"l": 323.51111, "t": 89.66967999999997, "r": 326.91382, "b": 95.41027999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 323.71509, "t": 97.78887999999995, "r": 327.1178, "b": 103.52948000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "2", "bbox": {"l": 323.71509, "t": 97.78887999999995, "r": 327.1178, "b": 103.52948000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 323.71509, "t": 105.98969, "r": 327.1178, "b": 111.73029000000008, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "3", "bbox": {"l": 323.71509, "t": 105.98969, "r": 327.1178, "b": 111.73029000000008, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 401.4816, "t": 148.54625999999996, "r": 404.88431, "b": 154.28687000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "2", "bbox": {"l": 401.4816, "t": 148.54625999999996, "r": 404.88431, "b": 154.28687000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 337.6976, "t": 162.68451000000005, "r": 341.10031, "b": 168.42511000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "3", "bbox": {"l": 337.6976, "t": 162.68451000000005, "r": 341.10031, "b": 168.42511000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 454.46378, "t": 104.54584, "r": 457.86648999999994, "b": 110.28644000000008, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "3", "bbox": {"l": 454.46378, "t": 104.54584, "r": 457.86648999999994, "b": 110.28644000000008, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 493.32580999999993, "t": 91.09546, "r": 496.72852, "b": 96.83605999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "2", "bbox": {"l": 493.32580999999993, "t": 91.09546, "r": 496.72852, "b": 96.83605999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 454.08298, "t": 90.56879000000015, "r": 457.48569000000003, "b": 96.30939000000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "1", "bbox": {"l": 454.08298, "t": 90.56879000000015, "r": 457.48569000000003, "b": 96.30939000000001, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 6, "label": "caption", "bbox": {"l": 50.111992, "t": 203.98577999999998, "r": 545.10846, "b": 224.96691999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9677652716636658, "cells": [{"id": 59, "text": "Figure 3:", "bbox": {"l": 50.112, "t": 204.10535000000004, "r": 86.883949, "b": 213.01189999999997, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "TableFormer", "bbox": {"l": 94.020996, "t": 203.98577999999998, "r": 149.85141, "b": 212.94214, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "takes in an image of the PDF and creates bounding box and HTML structure predictions that are", "bbox": {"l": 152.86099, "t": 204.10535000000004, "r": 545.10846, "b": 213.01189999999997, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "synchronized. The bounding boxes grabs the content from the PDF and inserts it in the structure.", "bbox": {"l": 50.111992, "t": 216.06035999999995, "r": 436.0134, "b": 224.96691999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "picture", "bbox": {"l": 53.03328323364258, "t": 257.66534423828125, "r": 285.3731689453125, "b": 507.6688537597656, "coord_origin": "TOPLEFT"}, "confidence": 0.9724942445755005, "cells": [{"id": 63, "text": "Input Image", "bbox": {"l": 74.253464, "t": 258.21472000000006, "r": 101.75846, "b": 264.17474000000004, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "Tokenised Tags", "bbox": {"l": 122.29972, "t": 258.34520999999995, "r": 157.83972, "b": 264.30524, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "Multi-Head Attention", "bbox": {"l": 78.549347, "t": 371.38579999999996, "r": 125.68359000000001, "b": 377.04782, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "Add", "bbox": {"l": 78.513298, "t": 391.31857, "r": 84.644547, "b": 396.98059, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "& Normalisation", "bbox": {"l": 116.52705, "t": 391.31857, "r": 125.11079999999998, "b": 396.98059, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "Feed Forward Network", "bbox": {"l": 76.024773, "t": 424.45309, "r": 127.92327000000002, "b": 430.11511, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "Add", "bbox": {"l": 78.382828, "t": 444.88956, "r": 84.514076, "b": 450.55157, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "& Normalisation", "bbox": {"l": 116.39658, "t": 444.88956, "r": 124.98033, "b": 450.55157, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Linear", "bbox": {"l": 167.46945, "t": 462.44324, "r": 181.6292, "b": 468.10526, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "Softmax", "bbox": {"l": 165.61292, "t": 478.47107, "r": 184.43242, "b": 484.13309, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "CNN BACKBONE ENCODER", "bbox": {"l": 65.319511, "t": 324.26235999999994, "r": 132.9245, "b": 330.22235000000006, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "[30, 1, 2, 3, 4, \u2026 3, ", "bbox": {"l": 119.51457, "t": 269.66394, "r": 162.98782, "b": 274.72992, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "4, 5, 8, 31]", "bbox": {"l": 128.72858, "t": 274.91394, "r": 151.41083, "b": 279.97992, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "Positional ", "bbox": {"l": 60.434211999999995, "t": 338.95993, "r": 80.27021, "b": 344.26993, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "Encoding", "bbox": {"l": 60.598457, "t": 343.38605, "r": 78.854958, "b": 348.69604, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "Positional ", "bbox": {"l": 134.82877, "t": 293.37762, "r": 154.66476, "b": 298.68762, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "Encoding", "bbox": {"l": 134.99303, "t": 297.80370999999997, "r": 153.24953, "b": 303.11371, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "Add & Normalisation", "bbox": {"l": 150.55193, "t": 345.35861, "r": 197.14943, "b": 351.02063, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Add", "bbox": {"l": 150.55193, "t": 394.4234, "r": 156.68318, "b": 400.08542, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "& Normalisation", "bbox": {"l": 188.56567, "t": 394.4234, "r": 197.14943, "b": 400.08542, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "Multi-Head Attention", "bbox": {"l": 150.18539, "t": 375.66843, "r": 197.31964, "b": 381.33044, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "Add", "bbox": {"l": 150.55193, "t": 440.24847000000005, "r": 156.68318, "b": 445.91049, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "& Normalisation", "bbox": {"l": 188.56567, "t": 440.24847000000005, "r": 197.14943, "b": 445.91049, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Feed Forward Network", "bbox": {"l": 147.86377, "t": 422.09335, "r": 199.76227, "b": 427.75537, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Linear", "bbox": {"l": 241.56567000000004, "t": 314.26285000000007, "r": 255.72542, "b": 319.92487, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "Linear", "bbox": {"l": 241.91730000000004, "t": 361.36493, "r": 256.07706, "b": 367.02695, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "Attention", "bbox": {"l": 228.054, "t": 336.61929000000003, "r": 248.72363000000004, "b": 342.28131, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "Network", "bbox": {"l": 246.2919, "t": 336.61929000000003, "r": 269.39325, "b": 342.28131, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "MLP", "bbox": {"l": 228.44568000000004, "t": 405.14682, "r": 238.73892, "b": 410.80884, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Linear ", "bbox": {"l": 256.29767, "t": 405.2032500000001, "r": 271.77792, "b": 410.86526, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "Sigmoid", "bbox": {"l": 239.54543, "t": 382.21344, "r": 258.08942, "b": 387.87546, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "Transformer Encoder Network", "bbox": {"l": 54.14704100000001, "t": 384.87183, "r": 59.51152, "b": 449.78326, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "x2", "bbox": {"l": 54.235424, "t": 373.81232, "r": 59.30449699999999, "b": 378.45421999999996, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "Encoded Output", "bbox": {"l": 85.295891, "t": 484.53189, "r": 122.16431, "b": 490.36688, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "Encoded Output", "bbox": {"l": 229.66599, "t": 279.54607999999996, "r": 265.3194, "b": 285.45572000000004, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "Predicted Tags", "bbox": {"l": 157.17369, "t": 500.3031, "r": 190.41711, "b": 506.12943, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "Bounding Boxes & ", "bbox": {"l": 227.81598999999997, "t": 438.05542, "r": 270.78442, "b": 443.89206, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "Classification", "bbox": {"l": 233.70262, "t": 444.06183, "r": 263.51105, "b": 449.8904999999999, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "Transformer ", "bbox": {"l": 184.74655, "t": 293.39502, "r": 212.16055, "b": 298.75903, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "Decoder Network", "bbox": {"l": 178.91229, "t": 299.14502, "r": 216.74378999999996, "b": 304.50903, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "x4", "bbox": {"l": 194.24574, "t": 282.7822, "r": 198.89099, "b": 287.84817999999996, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "CELL BBOX DECODER", "bbox": {"l": 221.45587, "t": 271.86914, "r": 276.47089, "b": 277.82916, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "Masked Multi-Head ", "bbox": {"l": 151.65219, "t": 323.44241, "r": 197.29019, "b": 329.10443, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "Attention", "bbox": {"l": 163.43277, "t": 329.44241, "r": 184.19028, "b": 335.10443, "coord_origin": "TOPLEFT"}}], "children": [{"id": 69, "label": "text", "bbox": {"l": 74.253464, "t": 258.21472000000006, "r": 101.75846, "b": 264.17474000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "Input Image", "bbox": {"l": 74.253464, "t": 258.21472000000006, "r": 101.75846, "b": 264.17474000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 122.29972, "t": 258.34520999999995, "r": 157.83972, "b": 264.30524, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "Tokenised Tags", "bbox": {"l": 122.29972, "t": 258.34520999999995, "r": 157.83972, "b": 264.30524, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 78.549347, "t": 371.38579999999996, "r": 125.68359000000001, "b": 377.04782, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "Multi-Head Attention", "bbox": {"l": 78.549347, "t": 371.38579999999996, "r": 125.68359000000001, "b": 377.04782, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 78.513298, "t": 391.31857, "r": 84.644547, "b": 396.98059, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "Add", "bbox": {"l": 78.513298, "t": 391.31857, "r": 84.644547, "b": 396.98059, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 116.52705, "t": 391.31857, "r": 125.11079999999998, "b": 396.98059, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "& Normalisation", "bbox": {"l": 116.52705, "t": 391.31857, "r": 125.11079999999998, "b": 396.98059, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 76.024773, "t": 424.45309, "r": 127.92327000000002, "b": 430.11511, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "Feed Forward Network", "bbox": {"l": 76.024773, "t": 424.45309, "r": 127.92327000000002, "b": 430.11511, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 78.382828, "t": 444.88956, "r": 84.514076, "b": 450.55157, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "Add", "bbox": {"l": 78.382828, "t": 444.88956, "r": 84.514076, "b": 450.55157, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 116.39658, "t": 444.88956, "r": 124.98033, "b": 450.55157, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "& Normalisation", "bbox": {"l": 116.39658, "t": 444.88956, "r": 124.98033, "b": 450.55157, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 167.46945, "t": 462.44324, "r": 181.6292, "b": 468.10526, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "Linear", "bbox": {"l": 167.46945, "t": 462.44324, "r": 181.6292, "b": 468.10526, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 165.61292, "t": 478.47107, "r": 184.43242, "b": 484.13309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "Softmax", "bbox": {"l": 165.61292, "t": 478.47107, "r": 184.43242, "b": 484.13309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 65.319511, "t": 324.26235999999994, "r": 132.9245, "b": 330.22235000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "CNN BACKBONE ENCODER", "bbox": {"l": 65.319511, "t": 324.26235999999994, "r": 132.9245, "b": 330.22235000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 119.51457, "t": 269.66394, "r": 162.98782, "b": 274.72992, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "[30, 1, 2, 3, 4, \u2026 3, ", "bbox": {"l": 119.51457, "t": 269.66394, "r": 162.98782, "b": 274.72992, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 128.72858, "t": 274.91394, "r": 151.41083, "b": 279.97992, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "4, 5, 8, 31]", "bbox": {"l": 128.72858, "t": 274.91394, "r": 151.41083, "b": 279.97992, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 60.434211999999995, "t": 338.95993, "r": 80.27021, "b": 344.26993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "Positional ", "bbox": {"l": 60.434211999999995, "t": 338.95993, "r": 80.27021, "b": 344.26993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 60.598457, "t": 343.38605, "r": 78.854958, "b": 348.69604, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "Encoding", "bbox": {"l": 60.598457, "t": 343.38605, "r": 78.854958, "b": 348.69604, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 134.82877, "t": 293.37762, "r": 154.66476, "b": 298.68762, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "Positional ", "bbox": {"l": 134.82877, "t": 293.37762, "r": 154.66476, "b": 298.68762, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 134.99303, "t": 297.80370999999997, "r": 153.24953, "b": 303.11371, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "Encoding", "bbox": {"l": 134.99303, "t": 297.80370999999997, "r": 153.24953, "b": 303.11371, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 150.55193, "t": 345.35861, "r": 197.14943, "b": 351.02063, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "Add & Normalisation", "bbox": {"l": 150.55193, "t": 345.35861, "r": 197.14943, "b": 351.02063, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 150.55193, "t": 394.4234, "r": 156.68318, "b": 400.08542, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "Add", "bbox": {"l": 150.55193, "t": 394.4234, "r": 156.68318, "b": 400.08542, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 188.56567, "t": 394.4234, "r": 197.14943, "b": 400.08542, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "& Normalisation", "bbox": {"l": 188.56567, "t": 394.4234, "r": 197.14943, "b": 400.08542, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 150.18539, "t": 375.66843, "r": 197.31964, "b": 381.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "Multi-Head Attention", "bbox": {"l": 150.18539, "t": 375.66843, "r": 197.31964, "b": 381.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 150.55193, "t": 440.24847000000005, "r": 156.68318, "b": 445.91049, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "Add", "bbox": {"l": 150.55193, "t": 440.24847000000005, "r": 156.68318, "b": 445.91049, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 188.56567, "t": 440.24847000000005, "r": 197.14943, "b": 445.91049, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "& Normalisation", "bbox": {"l": 188.56567, "t": 440.24847000000005, "r": 197.14943, "b": 445.91049, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 147.86377, "t": 422.09335, "r": 199.76227, "b": 427.75537, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "Feed Forward Network", "bbox": {"l": 147.86377, "t": 422.09335, "r": 199.76227, "b": 427.75537, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 241.56567000000004, "t": 314.26285000000007, "r": 255.72542, "b": 319.92487, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "Linear", "bbox": {"l": 241.56567000000004, "t": 314.26285000000007, "r": 255.72542, "b": 319.92487, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 241.91730000000004, "t": 361.36493, "r": 256.07706, "b": 367.02695, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "Linear", "bbox": {"l": 241.91730000000004, "t": 361.36493, "r": 256.07706, "b": 367.02695, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 228.054, "t": 336.61929000000003, "r": 248.72363000000004, "b": 342.28131, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "Attention", "bbox": {"l": 228.054, "t": 336.61929000000003, "r": 248.72363000000004, "b": 342.28131, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 246.2919, "t": 336.61929000000003, "r": 269.39325, "b": 342.28131, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "Network", "bbox": {"l": 246.2919, "t": 336.61929000000003, "r": 269.39325, "b": 342.28131, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 228.44568000000004, "t": 405.14682, "r": 238.73892, "b": 410.80884, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "MLP", "bbox": {"l": 228.44568000000004, "t": 405.14682, "r": 238.73892, "b": 410.80884, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 256.29767, "t": 405.2032500000001, "r": 271.77792, "b": 410.86526, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "Linear ", "bbox": {"l": 256.29767, "t": 405.2032500000001, "r": 271.77792, "b": 410.86526, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 239.54543, "t": 382.21344, "r": 258.08942, "b": 387.87546, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "Sigmoid", "bbox": {"l": 239.54543, "t": 382.21344, "r": 258.08942, "b": 387.87546, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 54.14704100000001, "t": 384.87183, "r": 59.51152, "b": 449.78326, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "Transformer Encoder Network", "bbox": {"l": 54.14704100000001, "t": 384.87183, "r": 59.51152, "b": 449.78326, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 54.235424, "t": 373.81232, "r": 59.30449699999999, "b": 378.45421999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "x2", "bbox": {"l": 54.235424, "t": 373.81232, "r": 59.30449699999999, "b": 378.45421999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 85.295891, "t": 484.53189, "r": 122.16431, "b": 490.36688, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "Encoded Output", "bbox": {"l": 85.295891, "t": 484.53189, "r": 122.16431, "b": 490.36688, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 229.66599, "t": 279.54607999999996, "r": 265.3194, "b": 285.45572000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "Encoded Output", "bbox": {"l": 229.66599, "t": 279.54607999999996, "r": 265.3194, "b": 285.45572000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 157.17369, "t": 500.3031, "r": 190.41711, "b": 506.12943, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "Predicted Tags", "bbox": {"l": 157.17369, "t": 500.3031, "r": 190.41711, "b": 506.12943, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 227.81598999999997, "t": 438.05542, "r": 270.78442, "b": 443.89206, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "Bounding Boxes & ", "bbox": {"l": 227.81598999999997, "t": 438.05542, "r": 270.78442, "b": 443.89206, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 233.70262, "t": 444.06183, "r": 263.51105, "b": 449.8904999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "Classification", "bbox": {"l": 233.70262, "t": 444.06183, "r": 263.51105, "b": 449.8904999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 184.74655, "t": 293.39502, "r": 212.16055, "b": 298.75903, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "Transformer ", "bbox": {"l": 184.74655, "t": 293.39502, "r": 212.16055, "b": 298.75903, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 178.91229, "t": 299.14502, "r": 216.74378999999996, "b": 304.50903, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "Decoder Network", "bbox": {"l": 178.91229, "t": 299.14502, "r": 216.74378999999996, "b": 304.50903, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 194.24574, "t": 282.7822, "r": 198.89099, "b": 287.84817999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": "x4", "bbox": {"l": 194.24574, "t": 282.7822, "r": 198.89099, "b": 287.84817999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 221.45587, "t": 271.86914, "r": 276.47089, "b": 277.82916, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "CELL BBOX DECODER", "bbox": {"l": 221.45587, "t": 271.86914, "r": 276.47089, "b": 277.82916, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 151.65219, "t": 323.44241, "r": 197.29019, "b": 329.10443, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "Masked Multi-Head ", "bbox": {"l": 151.65219, "t": 323.44241, "r": 197.29019, "b": 329.10443, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 163.43277, "t": 329.44241, "r": 184.19028, "b": 335.10443, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": "Attention", "bbox": {"l": 163.43277, "t": 329.44241, "r": 184.19028, "b": 335.10443, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 8, "label": "caption", "bbox": {"l": 50.112, "t": 527.7828099999999, "r": 286.36597, "b": 680.27094, "coord_origin": "TOPLEFT"}, "confidence": 0.8913407325744629, "cells": [{"id": 107, "text": "Figure 4: Given an input image of a table, the", "bbox": {"l": 50.112, "t": 527.90237, "r": 229.78752, "b": 536.80893, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "Encoder", "bbox": {"l": 231.787, "t": 527.7828099999999, "r": 267.76196, "b": 536.7392, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "pro-", "bbox": {"l": 269.76401, "t": 527.90237, "r": 286.36169, "b": 536.80893, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "duces fixed-length features that represent the input image.", "bbox": {"l": 50.112015, "t": 539.85738, "r": 286.36508, "b": 548.76393, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "The features are then passed to both the", "bbox": {"l": 50.112015, "t": 551.81337, "r": 205.84735, "b": 560.71992, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "Structure Decoder", "bbox": {"l": 208.01802, "t": 551.69382, "r": 286.36392, "b": 560.6501900000001, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "and", "bbox": {"l": 50.112015, "t": 563.76837, "r": 64.498009, "b": 572.67493, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "Cell BBox Decoder", "bbox": {"l": 68.165016, "t": 563.64882, "r": 151.31288, "b": 572.60519, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": ".", "bbox": {"l": 151.31302, "t": 563.76837, "r": 153.80367, "b": 572.67493, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "During training, the", "bbox": {"l": 160.41884, "t": 563.76837, "r": 241.93283000000002, "b": 572.67493, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "Structure", "bbox": {"l": 245.59502, "t": 563.64882, "r": 286.362, "b": 572.60519, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "Decoder", "bbox": {"l": 50.112015, "t": 575.60382, "r": 85.519089, "b": 584.5602, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "receives \u2018tokenized tags\u2019 of the HTML code that", "bbox": {"l": 88.623016, "t": 575.7233699999999, "r": 286.36072, "b": 584.6299300000001, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "represent the table structure. Afterwards, a transformer en-", "bbox": {"l": 50.112015, "t": 587.6783800000001, "r": 286.36511, "b": 596.58493, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "coder and decoder architecture is employed to produce fea-", "bbox": {"l": 50.112015, "t": 599.63338, "r": 286.36508, "b": 608.53993, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "tures that are received by a linear layer, and the", "bbox": {"l": 50.112015, "t": 611.58838, "r": 240.43756000000002, "b": 620.4949300000001, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "Cell BBox", "bbox": {"l": 243.19801, "t": 611.46883, "r": 286.36597, "b": 620.4252, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "Decoder. The linear layer is applied to the features to", "bbox": {"l": 50.112015, "t": 623.42482, "r": 286.36511, "b": 632.3812, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "predict the tags. Simultaneously, the Cell BBox Decoder", "bbox": {"l": 50.112015, "t": 635.37982, "r": 286.36508, "b": 644.3362, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "selects features referring to the data cells (\u2018", "bbox": {"l": 50.112015, "t": 647.45438, "r": 220.58205, "b": 656.36093, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "<", "bbox": {"l": 220.57802000000004, "t": 647.29497, "r": 228.32693, "b": 656.14175, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "td", "bbox": {"l": 228.32700999999997, "t": 647.45438, "r": 236.07791000000003, "b": 656.36093, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": ">", "bbox": {"l": 236.07802000000004, "t": 647.29497, "r": 243.82693, "b": 656.14175, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "\u2019, \u2018", "bbox": {"l": 243.82602, "t": 647.45438, "r": 255.29298000000003, "b": 656.36093, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "<", "bbox": {"l": 255.29102000000003, "t": 647.29497, "r": 263.03992, "b": 656.14175, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "\u2019) and", "bbox": {"l": 263.04001, "t": 647.45438, "r": 286.36246, "b": 656.36093, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "passes them through an attention network, an MLP, and a", "bbox": {"l": 50.112015, "t": 659.40938, "r": 286.36511, "b": 668.31594, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "linear layer to predict the bounding boxes.", "bbox": {"l": 50.112015, "t": 671.36438, "r": 218.46996, "b": 680.27094, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "text", "bbox": {"l": 308.862, "t": 249.53441999999995, "r": 545.11505, "b": 294.3069499999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9831458330154419, "cells": [{"id": 135, "text": "forming classification, and adding an adaptive pooling", "bbox": {"l": 308.862, "t": 249.53441999999995, "r": 523.05786, "b": 258.44097999999997, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "layer", "bbox": {"l": 525.19983, "t": 249.53441999999995, "r": 545.11505, "b": 258.44097999999997, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "of size 28*28. ResNet by default downsamples the", "bbox": {"l": 308.862, "t": 261.49042, "r": 517.55847, "b": 270.39697, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "image", "bbox": {"l": 520.76642, "t": 261.49042, "r": 545.11499, "b": 270.39697, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "resolution by 32 and then the encoded image is provided", "bbox": {"l": 308.862, "t": 273.44537, "r": 534.80377, "b": 282.35196, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "to", "bbox": {"l": 537.36414, "t": 273.44537, "r": 545.11505, "b": 282.35196, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "both the", "bbox": {"l": 308.862, "t": 285.40039, "r": 341.24045, "b": 294.3069499999999, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "Structure Decoder", "bbox": {"l": 343.73099, "t": 285.49005, "r": 417.23508, "b": 294.07782000000003, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": ", and", "bbox": {"l": 417.23398, "t": 285.40039, "r": 436.60129, "b": 294.3069499999999, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "Cell BBox Decoder", "bbox": {"l": 439.09198, "t": 285.49005, "r": 516.56116, "b": 294.07782000000003, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": ".", "bbox": {"l": 516.56097, "t": 285.40039, "r": 519.05164, "b": 294.3069499999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 308.86194, "t": 297.33981, "r": 545.11511, "b": 413.96182, "coord_origin": "TOPLEFT"}, "confidence": 0.9862009882926941, "cells": [{"id": 146, "text": "Structure Decoder.", "bbox": {"l": 320.81696, "t": 297.33981, "r": 400.86649, "b": 306.2962, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "The transformer architecture of", "bbox": {"l": 403.91394, "t": 297.45938, "r": 528.33685, "b": 306.36594, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "this", "bbox": {"l": 530.7179, "t": 297.45938, "r": 545.11383, "b": 306.36594, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "component is based on the work proposed in [31].", "bbox": {"l": 308.86194, "t": 309.41437, "r": 517.5285, "b": 318.32092, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "After", "bbox": {"l": 524.09387, "t": 309.41437, "r": 545.11493, "b": 318.32092, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "extensive experimentation, the", "bbox": {"l": 308.86194, "t": 321.36934999999994, "r": 432.35833999999994, "b": 330.27591, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "Structure Decoder", "bbox": {"l": 435.81995000000006, "t": 321.45901, "r": 510.29041, "b": 330.04678, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "is", "bbox": {"l": 513.97797, "t": 321.36934999999994, "r": 520.62305, "b": 330.27591, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "mod-", "bbox": {"l": 524.08008, "t": 321.36934999999994, "r": 545.11115, "b": 330.27591, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "eled as a transformer encoder with two encoder layers", "bbox": {"l": 308.86197, "t": 333.32434, "r": 527.76013, "b": 342.2309, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "and", "bbox": {"l": 530.729, "t": 333.32434, "r": 545.11499, "b": 342.2309, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "a transformer decoder made from a stack of 4 decoder", "bbox": {"l": 308.86197, "t": 345.27933, "r": 526.85352, "b": 354.18588, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "lay-", "bbox": {"l": 529.62311, "t": 345.27933, "r": 545.11493, "b": 354.18588, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "ers that comprise mainly of multi-head attention and", "bbox": {"l": 308.86197, "t": 357.23532, "r": 524.51245, "b": 366.14188, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "feed", "bbox": {"l": 527.96948, "t": 357.23532, "r": 545.11511, "b": 366.14188, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "forward layers.", "bbox": {"l": 308.86197, "t": 369.19031000000007, "r": 370.39096, "b": 378.09685999999994, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "This configuration uses fewer layers", "bbox": {"l": 377.44449, "t": 369.19031000000007, "r": 526.91339, "b": 378.09685999999994, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "and", "bbox": {"l": 530.72906, "t": 369.19031000000007, "r": 545.11505, "b": 378.09685999999994, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "heads in comparison to networks applied to other", "bbox": {"l": 308.86197, "t": 381.14529000000005, "r": 505.46395999999993, "b": 390.05185, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "problems", "bbox": {"l": 508.03430000000003, "t": 381.14529000000005, "r": 545.11511, "b": 390.05185, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "(e.g. \u201cScene Understanding\u201d, \u201cImage Captioning\u201d),", "bbox": {"l": 308.86197, "t": 393.10028, "r": 517.68799, "b": 402.00684, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "some-", "bbox": {"l": 520.76642, "t": 393.10028, "r": 545.11499, "b": 402.00684, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "thing which we relate to the simplicity of table images.", "bbox": {"l": 308.86197, "t": 405.05526999999995, "r": 528.01935, "b": 413.96182, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 308.86197, "t": 417.11426, "r": 545.11511, "b": 545.57271, "coord_origin": "TOPLEFT"}, "confidence": 0.9851906895637512, "cells": [{"id": 169, "text": "The transformer encoder receives an encoded", "bbox": {"l": 320.81696, "t": 417.11426, "r": 515.49609, "b": 426.02081, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "image", "bbox": {"l": 520.7663, "t": 417.11426, "r": 545.11487, "b": 426.02081, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "from the", "bbox": {"l": 308.86197, "t": 429.0692399999999, "r": 343.72107, "b": 437.9758, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "CNN Backbone Network", "bbox": {"l": 347.03796, "t": 429.15891, "r": 446.45471000000003, "b": 437.74667, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "and refines it", "bbox": {"l": 449.93996999999996, "t": 429.0692399999999, "r": 503.06055000000003, "b": 437.9758, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "through", "bbox": {"l": 506.37808, "t": 429.0692399999999, "r": 537.3717, "b": 437.9758, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "a", "bbox": {"l": 540.68927, "t": 429.0692399999999, "r": 545.11267, "b": 437.9758, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "multi-head dot-product attention layer, followed by a", "bbox": {"l": 308.86197, "t": 441.02423, "r": 522.78894, "b": 449.93079, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "Feed", "bbox": {"l": 525.7478, "t": 441.02423, "r": 545.11511, "b": 449.93079, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "Forward Network.", "bbox": {"l": 308.86197, "t": 452.97922, "r": 384.14929, "b": 461.88577, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "During training, the transformer", "bbox": {"l": 393.37466, "t": 452.97922, "r": 527.84985, "b": 461.88577, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "de-", "bbox": {"l": 532.39282, "t": 452.97922, "r": 545.11505, "b": 461.88577, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "coder receives as input the output feature produced by", "bbox": {"l": 308.86197, "t": 464.93521, "r": 529.7627, "b": 473.84177, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "the", "bbox": {"l": 532.94073, "t": 464.93521, "r": 545.11505, "b": 473.84177, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "transformer encoder, and the tokenized input of the", "bbox": {"l": 308.86197, "t": 476.8902, "r": 514.17126, "b": 485.79675, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "HTML", "bbox": {"l": 516.89105, "t": 476.8902, "r": 545.11511, "b": 485.79675, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": "ground-truth tags. Using a stack of multi-head attention", "bbox": {"l": 308.86197, "t": 488.84518, "r": 527.63068, "b": 497.75174, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "lay-", "bbox": {"l": 529.62317, "t": 488.84518, "r": 545.11499, "b": 497.75174, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "ers, different aspects of the tag sequence could be", "bbox": {"l": 308.86197, "t": 500.80017, "r": 508.3630999999999, "b": 509.70673, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": "inferred.", "bbox": {"l": 511.09286000000003, "t": 500.80017, "r": 545.11511, "b": 509.70673, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "This is achieved by each attention head on a layer operating", "bbox": {"l": 308.86197, "t": 512.7551599999999, "r": 545.11499, "b": 521.6617100000001, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "in a different subspace, and then combining altogether their", "bbox": {"l": 308.86197, "t": 524.71115, "r": 545.11511, "b": 533.61771, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "attention score.", "bbox": {"l": 308.86197, "t": 536.66615, "r": 369.73349, "b": 545.57271, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 308.86194, "t": 548.6046, "r": 545.11511, "b": 653.27271, "coord_origin": "TOPLEFT"}, "confidence": 0.9869195818901062, "cells": [{"id": 192, "text": "Cell BBox Decoder.", "bbox": {"l": 320.81696, "t": 548.6046, "r": 404.76184, "b": 557.56097, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "Our architecture allows to simul-", "bbox": {"l": 410.34094, "t": 548.72415, "r": 545.11505, "b": 557.63071, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "taneously predict HTML tags and bounding boxes for each", "bbox": {"l": 308.86194, "t": 560.68015, "r": 545.11493, "b": 569.5867000000001, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "table cell without the need of a separate object detector end", "bbox": {"l": 308.86194, "t": 572.6351500000001, "r": 545.11511, "b": 581.5417, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "to end. This approach is inspired by DETR [1] which em-", "bbox": {"l": 308.86194, "t": 584.59015, "r": 545.11493, "b": 593.4967, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "ploys a Transformer Encoder, and Decoder that looks for", "bbox": {"l": 308.86194, "t": 596.54515, "r": 545.11499, "b": 605.45171, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "a specific number of object queries (potential object detec-", "bbox": {"l": 308.86194, "t": 608.50015, "r": 545.11505, "b": 617.40671, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "tions). As our model utilizes a transformer architecture, the", "bbox": {"l": 308.86194, "t": 620.45515, "r": 545.11505, "b": 629.36171, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "hidden state of the", "bbox": {"l": 308.86194, "t": 632.41115, "r": 381.67859, "b": 641.3177000000001, "coord_origin": "TOPLEFT"}}, {"id": 201, "text": "<", "bbox": {"l": 383.99695, "t": 632.25174, "r": 391.74585, "b": 641.09853, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": "td", "bbox": {"l": 391.74594, "t": 632.41115, "r": 399.49686, "b": 641.3177000000001, "coord_origin": "TOPLEFT"}}, {"id": 203, "text": ">", "bbox": {"l": 399.49695, "t": 632.25174, "r": 407.24585, "b": 641.09853, "coord_origin": "TOPLEFT"}}, {"id": 204, "text": "\u2019 and \u2018", "bbox": {"l": 407.24594, "t": 632.41115, "r": 432.90958, "b": 641.3177000000001, "coord_origin": "TOPLEFT"}}, {"id": 205, "text": "<", "bbox": {"l": 432.90792999999996, "t": 632.25174, "r": 440.65683000000007, "b": 641.09853, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": "\u2019 HTML structure tags be-", "bbox": {"l": 440.65691999999996, "t": 632.41115, "r": 545.11475, "b": 641.3177000000001, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": "come the object query.", "bbox": {"l": 308.86194, "t": 644.3661500000001, "r": 398.96371, "b": 653.27271, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 308.86194, "t": 656.42516, "r": 545.11505, "b": 713.151726, "coord_origin": "TOPLEFT"}, "confidence": 0.9852352142333984, "cells": [{"id": 208, "text": "The encoding generated by the", "bbox": {"l": 320.81693, "t": 656.42516, "r": 444.34316999999993, "b": 665.33172, "coord_origin": "TOPLEFT"}}, {"id": 209, "text": "CNN Backbone Network", "bbox": {"l": 447.00591999999995, "t": 656.51482, "r": 545.1076, "b": 665.10258, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": "along with the features acquired for every data cell from the", "bbox": {"l": 308.86194, "t": 668.38016, "r": 545.11505, "b": 677.2867200000001, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "Transformer Decoder are then passed to the attention net-", "bbox": {"l": 308.86194, "t": 680.33516, "r": 545.11505, "b": 689.24172, "coord_origin": "TOPLEFT"}}, {"id": 212, "text": "work. The attention network takes both inputs and learns to", "bbox": {"l": 308.86194, "t": 692.290161, "r": 545.11505, "b": 701.196724, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "provide an attention weighted encoding. This weighted at-", "bbox": {"l": 308.86194, "t": 704.245163, "r": 545.11505, "b": 713.151726, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "page_footer", "bbox": {"l": 295.12094, "t": 734.13316, "r": 300.10223, "b": 743.039722, "coord_origin": "TOPLEFT"}, "confidence": 0.8719564080238342, "cells": [{"id": 214, "text": "5", "bbox": {"l": 295.12094, "t": 734.13316, "r": 300.10223, "b": 743.039722, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "picture", "id": 7, "page_no": 4, "cluster": {"id": 7, "label": "picture", "bbox": {"l": 74.30525970458984, "t": 77.91120147705078, "r": 519.9801025390625, "b": 183.70150756835938, "coord_origin": "TOPLEFT"}, "confidence": 0.9296807646751404, "cells": [{"id": 0, "text": "1.", "bbox": {"l": 81.688072, "t": 122.43970000000002, "r": 84.927567, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Item", "bbox": {"l": 86.54731, "t": 122.43970000000002, "r": 93.026291, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Amount", "bbox": {"l": 102.50498, "t": 115.25214000000005, "r": 115.3461, "b": 118.44135000000006, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Names", "bbox": {"l": 82.140205, "t": 115.21489999999994, "r": 93.291527, "b": 118.40410999999995, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "1000", "bbox": {"l": 96.748268, "t": 122.43970000000002, "r": 104.3119, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "500", "bbox": {"l": 96.748268, "t": 127.74370999999985, "r": 102.42083, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "3500", "bbox": {"l": 96.748268, "t": 133.45569, "r": 104.3119, "b": 136.6449, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "150", "bbox": {"l": 96.748268, "t": 139.16772000000003, "r": 102.42083, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "unit", "bbox": {"l": 110.66107, "t": 122.43970000000002, "r": 116.14391, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "unit", "bbox": {"l": 110.66107, "t": 127.74370999999985, "r": 116.14391, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "unit", "bbox": {"l": 110.66107, "t": 133.45569, "r": 116.14391, "b": 136.6449, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "unit", "bbox": {"l": 110.66107, "t": 139.16772000000003, "r": 116.14391, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "2.", "bbox": {"l": 81.688072, "t": 127.74370999999985, "r": 84.927567, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Item", "bbox": {"l": 86.54731, "t": 127.74370999999985, "r": 93.026291, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "3.", "bbox": {"l": 81.688072, "t": 133.45569, "r": 84.927567, "b": 136.6449, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Item", "bbox": {"l": 86.54731, "t": 133.45569, "r": 93.026291, "b": 136.6449, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "4.", "bbox": {"l": 81.688072, "t": 139.16772000000003, "r": 84.927567, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "Item", "bbox": {"l": 86.54731, "t": 139.16772000000003, "r": 93.026291, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Extracted", "bbox": {"l": 88.084389, "t": 90.49738000000002, "r": 113.93649, "b": 96.23798, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Table Images", "bbox": {"l": 82.81002, "t": 97.63738999999998, "r": 119.21240000000002, "b": 103.37798999999995, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Standardized", "bbox": {"l": 143.94247, "t": 100.60235999999998, "r": 180.01131, "b": 106.34295999999995, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Images", "bbox": {"l": 151.94064, "t": 107.74237000000005, "r": 172.0118, "b": 113.48297000000014, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "BBox", "bbox": {"l": 251.76939000000002, "t": 80.93096999999989, "r": 266.39557, "b": 86.67156999999997, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Decoder", "bbox": {"l": 247.51601, "t": 86.03101000000004, "r": 270.65021, "b": 91.77161000000001, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "BBoxes", "bbox": {"l": 331.03699, "t": 78.55980999999997, "r": 352.12589, "b": 84.30042000000003, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "BBoxes can be", "bbox": {"l": 390.56421, "t": 96.03223000000003, "r": 431.7261, "b": 101.77282999999989, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "traced back to the", "bbox": {"l": 386.82422, "t": 102.15228000000013, "r": 435.46966999999995, "b": 107.89287999999999, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "original image to", "bbox": {"l": 388.69589, "t": 108.27228000000002, "r": 433.6032400000001, "b": 114.01288000000011, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "extract content", "bbox": {"l": 391.07761, "t": 114.39227000000005, "r": 431.22542999999996, "b": 120.13286999999991, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Structure Tags sequence", "bbox": {"l": 431.22650000000004, "t": 151.68511999999998, "r": 498.82068, "b": 157.42571999999996, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "provide full description of", "bbox": {"l": 431.1738, "t": 157.80517999999995, "r": 498.87753000000004, "b": 163.54578000000004, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "the table structure", "bbox": {"l": 440.5289, "t": 163.92516999999998, "r": 489.51827999999995, "b": 169.66576999999995, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Structure Tags", "bbox": {"l": 328.37479, "t": 178.25385000000006, "r": 367.72333, "b": 183.99445000000003, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "BBoxes in sync", "bbox": {"l": 331.84451, "t": 123.90886999999998, "r": 373.67963, "b": 129.64948000000015, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "with tag sequence", "bbox": {"l": 331.84451, "t": 129.00885000000017, "r": 381.17786, "b": 134.74945000000002, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "Encoder", "bbox": {"l": 196.62633, "t": 88.11621000000002, "r": 219.42332, "b": 93.85681, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Structure", "bbox": {"l": 246.66771, "t": 129.4946900000001, "r": 271.49899, "b": 135.23528999999996, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "Decoder", "bbox": {"l": 247.51601, "t": 134.59473000000003, "r": 270.65021, "b": 140.33533, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "[x1, y2, x2, y2]", "bbox": {"l": 330.63071, "t": 89.01923, "r": 365.55347, "b": 94.75982999999997, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "[x1', y2', x2', y2']", "bbox": {"l": 330.63071, "t": 97.17926, "r": 370.22717, "b": 102.91985999999997, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "[x1'', y2'', x2'', y2'']", "bbox": {"l": 330.63071, "t": 105.33922999999993, "r": 374.51157, "b": 111.07983000000002, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "...", "bbox": {"l": 330.63071, "t": 113.49926999999991, "r": 335.73233, "b": 119.23987, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "<TR>", "bbox": {"l": 322.30579, "t": 141.79236000000003, "r": 335.05988, "b": 146.57617000000005, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "<TD>", "bbox": {"l": 322.30579, "t": 148.93231000000003, "r": 335.05988, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "1", "bbox": {"l": 337.54971, "t": 148.55579, "r": 340.95242, "b": 154.29638999999997, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "</TD><TD colspan=\"2\">", "bbox": {"l": 343.56262, "t": 148.93231000000003, "r": 398.91446, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "</TD>", "bbox": {"l": 407.41718, "t": 148.93231000000003, "r": 421.58801, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "</TR><TR>", "bbox": {"l": 322.30579, "t": 156.07232999999997, "r": 349.23022, "b": 160.85613999999998, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "<TD>", "bbox": {"l": 322.30579, "t": 163.21234000000004, "r": 335.05988, "b": 167.99614999999994, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "</TD><TD>...", "bbox": {"l": 343.56155, "t": 163.21234000000004, "r": 374.73685, "b": 167.99614999999994, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "...", "bbox": {"l": 322.30579, "t": 170.35235999999998, "r": 326.55716, "b": 175.13617, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "1", "bbox": {"l": 323.51111, "t": 89.66967999999997, "r": 326.91382, "b": 95.41027999999994, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "2", "bbox": {"l": 323.71509, "t": 97.78887999999995, "r": 327.1178, "b": 103.52948000000004, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "3", "bbox": {"l": 323.71509, "t": 105.98969, "r": 327.1178, "b": 111.73029000000008, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "2", "bbox": {"l": 401.4816, "t": 148.54625999999996, "r": 404.88431, "b": 154.28687000000002, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "3", "bbox": {"l": 337.6976, "t": 162.68451000000005, "r": 341.10031, "b": 168.42511000000002, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "3", "bbox": {"l": 454.46378, "t": 104.54584, "r": 457.86648999999994, "b": 110.28644000000008, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "2", "bbox": {"l": 493.32580999999993, "t": 91.09546, "r": 496.72852, "b": 96.83605999999997, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "1", "bbox": {"l": 454.08298, "t": 90.56879000000015, "r": 457.48569000000003, "b": 96.30939000000001, "coord_origin": "TOPLEFT"}}], "children": [{"id": 10, "label": "text", "bbox": {"l": 81.688072, "t": 122.43970000000002, "r": 84.927567, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 0, "text": "1.", "bbox": {"l": 81.688072, "t": 122.43970000000002, "r": 84.927567, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 86.54731, "t": 122.43970000000002, "r": 93.026291, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 1, "text": "Item", "bbox": {"l": 86.54731, "t": 122.43970000000002, "r": 93.026291, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 102.50498, "t": 115.25214000000005, "r": 115.3461, "b": 118.44135000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 2, "text": "Amount", "bbox": {"l": 102.50498, "t": 115.25214000000005, "r": 115.3461, "b": 118.44135000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 82.140205, "t": 115.21489999999994, "r": 93.291527, "b": 118.40410999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 3, "text": "Names", "bbox": {"l": 82.140205, "t": 115.21489999999994, "r": 93.291527, "b": 118.40410999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 96.748268, "t": 122.43970000000002, "r": 104.3119, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 4, "text": "1000", "bbox": {"l": 96.748268, "t": 122.43970000000002, "r": 104.3119, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 96.748268, "t": 127.74370999999985, "r": 102.42083, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 5, "text": "500", "bbox": {"l": 96.748268, "t": 127.74370999999985, "r": 102.42083, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 96.748268, "t": 133.45569, "r": 104.3119, "b": 136.6449, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": "3500", "bbox": {"l": 96.748268, "t": 133.45569, "r": 104.3119, "b": 136.6449, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 96.748268, "t": 139.16772000000003, "r": 102.42083, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "150", "bbox": {"l": 96.748268, "t": 139.16772000000003, "r": 102.42083, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 110.66107, "t": 122.43970000000002, "r": 116.14391, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "unit", "bbox": {"l": 110.66107, "t": 122.43970000000002, "r": 116.14391, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 110.66107, "t": 127.74370999999985, "r": 116.14391, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "unit", "bbox": {"l": 110.66107, "t": 127.74370999999985, "r": 116.14391, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 110.66107, "t": 133.45569, "r": 116.14391, "b": 136.6449, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "unit", "bbox": {"l": 110.66107, "t": 133.45569, "r": 116.14391, "b": 136.6449, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 110.66107, "t": 139.16772000000003, "r": 116.14391, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "unit", "bbox": {"l": 110.66107, "t": 139.16772000000003, "r": 116.14391, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 81.688072, "t": 127.74370999999985, "r": 84.927567, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "2.", "bbox": {"l": 81.688072, "t": 127.74370999999985, "r": 84.927567, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 86.54731, "t": 127.74370999999985, "r": 93.026291, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "Item", "bbox": {"l": 86.54731, "t": 127.74370999999985, "r": 93.026291, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 81.688072, "t": 133.45569, "r": 84.927567, "b": 136.6449, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "3.", "bbox": {"l": 81.688072, "t": 133.45569, "r": 84.927567, "b": 136.6449, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 86.54731, "t": 133.45569, "r": 93.026291, "b": 136.6449, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "Item", "bbox": {"l": 86.54731, "t": 133.45569, "r": 93.026291, "b": 136.6449, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 81.688072, "t": 139.16772000000003, "r": 84.927567, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "4.", "bbox": {"l": 81.688072, "t": 139.16772000000003, "r": 84.927567, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 86.54731, "t": 139.16772000000003, "r": 93.026291, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "Item", "bbox": {"l": 86.54731, "t": 139.16772000000003, "r": 93.026291, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 88.084389, "t": 90.49738000000002, "r": 113.93649, "b": 96.23798, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "Extracted", "bbox": {"l": 88.084389, "t": 90.49738000000002, "r": 113.93649, "b": 96.23798, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 82.81002, "t": 97.63738999999998, "r": 119.21240000000002, "b": 103.37798999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "Table Images", "bbox": {"l": 82.81002, "t": 97.63738999999998, "r": 119.21240000000002, "b": 103.37798999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 143.94247, "t": 100.60235999999998, "r": 180.01131, "b": 106.34295999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "Standardized", "bbox": {"l": 143.94247, "t": 100.60235999999998, "r": 180.01131, "b": 106.34295999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 151.94064, "t": 107.74237000000005, "r": 172.0118, "b": 113.48297000000014, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "Images", "bbox": {"l": 151.94064, "t": 107.74237000000005, "r": 172.0118, "b": 113.48297000000014, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 251.76939000000002, "t": 80.93096999999989, "r": 266.39557, "b": 86.67156999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "BBox", "bbox": {"l": 251.76939000000002, "t": 80.93096999999989, "r": 266.39557, "b": 86.67156999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 247.51601, "t": 86.03101000000004, "r": 270.65021, "b": 91.77161000000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "Decoder", "bbox": {"l": 247.51601, "t": 86.03101000000004, "r": 270.65021, "b": 91.77161000000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 331.03699, "t": 78.55980999999997, "r": 352.12589, "b": 84.30042000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "BBoxes", "bbox": {"l": 331.03699, "t": 78.55980999999997, "r": 352.12589, "b": 84.30042000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 390.56421, "t": 96.03223000000003, "r": 431.7261, "b": 101.77282999999989, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "BBoxes can be", "bbox": {"l": 390.56421, "t": 96.03223000000003, "r": 431.7261, "b": 101.77282999999989, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 386.82422, "t": 102.15228000000013, "r": 435.46966999999995, "b": 107.89287999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "traced back to the", "bbox": {"l": 386.82422, "t": 102.15228000000013, "r": 435.46966999999995, "b": 107.89287999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 388.69589, "t": 108.27228000000002, "r": 433.6032400000001, "b": 114.01288000000011, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "original image to", "bbox": {"l": 388.69589, "t": 108.27228000000002, "r": 433.6032400000001, "b": 114.01288000000011, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 391.07761, "t": 114.39227000000005, "r": 431.22542999999996, "b": 120.13286999999991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "extract content", "bbox": {"l": 391.07761, "t": 114.39227000000005, "r": 431.22542999999996, "b": 120.13286999999991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 431.22650000000004, "t": 151.68511999999998, "r": 498.82068, "b": 157.42571999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "Structure Tags sequence", "bbox": {"l": 431.22650000000004, "t": 151.68511999999998, "r": 498.82068, "b": 157.42571999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 431.1738, "t": 157.80517999999995, "r": 498.87753000000004, "b": 163.54578000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "provide full description of", "bbox": {"l": 431.1738, "t": 157.80517999999995, "r": 498.87753000000004, "b": 163.54578000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 440.5289, "t": 163.92516999999998, "r": 489.51827999999995, "b": 169.66576999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "the table structure", "bbox": {"l": 440.5289, "t": 163.92516999999998, "r": 489.51827999999995, "b": 169.66576999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 328.37479, "t": 178.25385000000006, "r": 367.72333, "b": 183.99445000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "Structure Tags", "bbox": {"l": 328.37479, "t": 178.25385000000006, "r": 367.72333, "b": 183.99445000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 331.84451, "t": 123.90886999999998, "r": 373.67963, "b": 129.64948000000015, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "BBoxes in sync", "bbox": {"l": 331.84451, "t": 123.90886999999998, "r": 373.67963, "b": 129.64948000000015, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 331.84451, "t": 129.00885000000017, "r": 381.17786, "b": 134.74945000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "with tag sequence", "bbox": {"l": 331.84451, "t": 129.00885000000017, "r": 381.17786, "b": 134.74945000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 196.62633, "t": 88.11621000000002, "r": 219.42332, "b": 93.85681, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "Encoder", "bbox": {"l": 196.62633, "t": 88.11621000000002, "r": 219.42332, "b": 93.85681, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 246.66771, "t": 129.4946900000001, "r": 271.49899, "b": 135.23528999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "Structure", "bbox": {"l": 246.66771, "t": 129.4946900000001, "r": 271.49899, "b": 135.23528999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 247.51601, "t": 134.59473000000003, "r": 270.65021, "b": 140.33533, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "Decoder", "bbox": {"l": 247.51601, "t": 134.59473000000003, "r": 270.65021, "b": 140.33533, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 330.63071, "t": 89.01923, "r": 365.55347, "b": 94.75982999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "[x1, y2, x2, y2]", "bbox": {"l": 330.63071, "t": 89.01923, "r": 365.55347, "b": 94.75982999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 330.63071, "t": 97.17926, "r": 370.22717, "b": 102.91985999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "[x1', y2', x2', y2']", "bbox": {"l": 330.63071, "t": 97.17926, "r": 370.22717, "b": 102.91985999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 330.63071, "t": 105.33922999999993, "r": 374.51157, "b": 111.07983000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "[x1'', y2'', x2'', y2'']", "bbox": {"l": 330.63071, "t": 105.33922999999993, "r": 374.51157, "b": 111.07983000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 330.63071, "t": 113.49926999999991, "r": 335.73233, "b": 119.23987, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "...", "bbox": {"l": 330.63071, "t": 113.49926999999991, "r": 335.73233, "b": 119.23987, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 322.30579, "t": 141.79236000000003, "r": 335.05988, "b": 146.57617000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "<TR>", "bbox": {"l": 322.30579, "t": 141.79236000000003, "r": 335.05988, "b": 146.57617000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 322.30579, "t": 148.93231000000003, "r": 335.05988, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "<TD>", "bbox": {"l": 322.30579, "t": 148.93231000000003, "r": 335.05988, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 337.54971, "t": 148.55579, "r": 340.95242, "b": 154.29638999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "1", "bbox": {"l": 337.54971, "t": 148.55579, "r": 340.95242, "b": 154.29638999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 343.56262, "t": 148.93231000000003, "r": 398.91446, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "</TD><TD colspan=\"2\">", "bbox": {"l": 343.56262, "t": 148.93231000000003, "r": 398.91446, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 407.41718, "t": 148.93231000000003, "r": 421.58801, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "</TD>", "bbox": {"l": 407.41718, "t": 148.93231000000003, "r": 421.58801, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 322.30579, "t": 156.07232999999997, "r": 349.23022, "b": 160.85613999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "</TR><TR>", "bbox": {"l": 322.30579, "t": 156.07232999999997, "r": 349.23022, "b": 160.85613999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 322.30579, "t": 163.21234000000004, "r": 335.05988, "b": 167.99614999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "<TD>", "bbox": {"l": 322.30579, "t": 163.21234000000004, "r": 335.05988, "b": 167.99614999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 343.56155, "t": 163.21234000000004, "r": 374.73685, "b": 167.99614999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "</TD><TD>...", "bbox": {"l": 343.56155, "t": 163.21234000000004, "r": 374.73685, "b": 167.99614999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 322.30579, "t": 170.35235999999998, "r": 326.55716, "b": 175.13617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "...", "bbox": {"l": 322.30579, "t": 170.35235999999998, "r": 326.55716, "b": 175.13617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 323.51111, "t": 89.66967999999997, "r": 326.91382, "b": 95.41027999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "1", "bbox": {"l": 323.51111, "t": 89.66967999999997, "r": 326.91382, "b": 95.41027999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 323.71509, "t": 97.78887999999995, "r": 327.1178, "b": 103.52948000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "2", "bbox": {"l": 323.71509, "t": 97.78887999999995, "r": 327.1178, "b": 103.52948000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 323.71509, "t": 105.98969, "r": 327.1178, "b": 111.73029000000008, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "3", "bbox": {"l": 323.71509, "t": 105.98969, "r": 327.1178, "b": 111.73029000000008, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 401.4816, "t": 148.54625999999996, "r": 404.88431, "b": 154.28687000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "2", "bbox": {"l": 401.4816, "t": 148.54625999999996, "r": 404.88431, "b": 154.28687000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 337.6976, "t": 162.68451000000005, "r": 341.10031, "b": 168.42511000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "3", "bbox": {"l": 337.6976, "t": 162.68451000000005, "r": 341.10031, "b": 168.42511000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 454.46378, "t": 104.54584, "r": 457.86648999999994, "b": 110.28644000000008, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "3", "bbox": {"l": 454.46378, "t": 104.54584, "r": 457.86648999999994, "b": 110.28644000000008, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 493.32580999999993, "t": 91.09546, "r": 496.72852, "b": 96.83605999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "2", "bbox": {"l": 493.32580999999993, "t": 91.09546, "r": 496.72852, "b": 96.83605999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 454.08298, "t": 90.56879000000015, "r": 457.48569000000003, "b": 96.30939000000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "1", "bbox": {"l": 454.08298, "t": 90.56879000000015, "r": 457.48569000000003, "b": 96.30939000000001, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "caption", "id": 6, "page_no": 4, "cluster": {"id": 6, "label": "caption", "bbox": {"l": 50.111992, "t": 203.98577999999998, "r": 545.10846, "b": 224.96691999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9677652716636658, "cells": [{"id": 59, "text": "Figure 3:", "bbox": {"l": 50.112, "t": 204.10535000000004, "r": 86.883949, "b": 213.01189999999997, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "TableFormer", "bbox": {"l": 94.020996, "t": 203.98577999999998, "r": 149.85141, "b": 212.94214, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "takes in an image of the PDF and creates bounding box and HTML structure predictions that are", "bbox": {"l": 152.86099, "t": 204.10535000000004, "r": 545.10846, "b": 213.01189999999997, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "synchronized. The bounding boxes grabs the content from the PDF and inserts it in the structure.", "bbox": {"l": 50.111992, "t": 216.06035999999995, "r": 436.0134, "b": 224.96691999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 3: TableFormer takes in an image of the PDF and creates bounding box and HTML structure predictions that are synchronized. The bounding boxes grabs the content from the PDF and inserts it in the structure."}, {"label": "picture", "id": 5, "page_no": 4, "cluster": {"id": 5, "label": "picture", "bbox": {"l": 53.03328323364258, "t": 257.66534423828125, "r": 285.3731689453125, "b": 507.6688537597656, "coord_origin": "TOPLEFT"}, "confidence": 0.9724942445755005, "cells": [{"id": 63, "text": "Input Image", "bbox": {"l": 74.253464, "t": 258.21472000000006, "r": 101.75846, "b": 264.17474000000004, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "Tokenised Tags", "bbox": {"l": 122.29972, "t": 258.34520999999995, "r": 157.83972, "b": 264.30524, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "Multi-Head Attention", "bbox": {"l": 78.549347, "t": 371.38579999999996, "r": 125.68359000000001, "b": 377.04782, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "Add", "bbox": {"l": 78.513298, "t": 391.31857, "r": 84.644547, "b": 396.98059, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "& Normalisation", "bbox": {"l": 116.52705, "t": 391.31857, "r": 125.11079999999998, "b": 396.98059, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "Feed Forward Network", "bbox": {"l": 76.024773, "t": 424.45309, "r": 127.92327000000002, "b": 430.11511, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "Add", "bbox": {"l": 78.382828, "t": 444.88956, "r": 84.514076, "b": 450.55157, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "& Normalisation", "bbox": {"l": 116.39658, "t": 444.88956, "r": 124.98033, "b": 450.55157, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Linear", "bbox": {"l": 167.46945, "t": 462.44324, "r": 181.6292, "b": 468.10526, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "Softmax", "bbox": {"l": 165.61292, "t": 478.47107, "r": 184.43242, "b": 484.13309, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "CNN BACKBONE ENCODER", "bbox": {"l": 65.319511, "t": 324.26235999999994, "r": 132.9245, "b": 330.22235000000006, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "[30, 1, 2, 3, 4, \u2026 3, ", "bbox": {"l": 119.51457, "t": 269.66394, "r": 162.98782, "b": 274.72992, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "4, 5, 8, 31]", "bbox": {"l": 128.72858, "t": 274.91394, "r": 151.41083, "b": 279.97992, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "Positional ", "bbox": {"l": 60.434211999999995, "t": 338.95993, "r": 80.27021, "b": 344.26993, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "Encoding", "bbox": {"l": 60.598457, "t": 343.38605, "r": 78.854958, "b": 348.69604, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "Positional ", "bbox": {"l": 134.82877, "t": 293.37762, "r": 154.66476, "b": 298.68762, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "Encoding", "bbox": {"l": 134.99303, "t": 297.80370999999997, "r": 153.24953, "b": 303.11371, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "Add & Normalisation", "bbox": {"l": 150.55193, "t": 345.35861, "r": 197.14943, "b": 351.02063, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Add", "bbox": {"l": 150.55193, "t": 394.4234, "r": 156.68318, "b": 400.08542, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "& Normalisation", "bbox": {"l": 188.56567, "t": 394.4234, "r": 197.14943, "b": 400.08542, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "Multi-Head Attention", "bbox": {"l": 150.18539, "t": 375.66843, "r": 197.31964, "b": 381.33044, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "Add", "bbox": {"l": 150.55193, "t": 440.24847000000005, "r": 156.68318, "b": 445.91049, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "& Normalisation", "bbox": {"l": 188.56567, "t": 440.24847000000005, "r": 197.14943, "b": 445.91049, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Feed Forward Network", "bbox": {"l": 147.86377, "t": 422.09335, "r": 199.76227, "b": 427.75537, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Linear", "bbox": {"l": 241.56567000000004, "t": 314.26285000000007, "r": 255.72542, "b": 319.92487, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "Linear", "bbox": {"l": 241.91730000000004, "t": 361.36493, "r": 256.07706, "b": 367.02695, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "Attention", "bbox": {"l": 228.054, "t": 336.61929000000003, "r": 248.72363000000004, "b": 342.28131, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "Network", "bbox": {"l": 246.2919, "t": 336.61929000000003, "r": 269.39325, "b": 342.28131, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "MLP", "bbox": {"l": 228.44568000000004, "t": 405.14682, "r": 238.73892, "b": 410.80884, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Linear ", "bbox": {"l": 256.29767, "t": 405.2032500000001, "r": 271.77792, "b": 410.86526, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "Sigmoid", "bbox": {"l": 239.54543, "t": 382.21344, "r": 258.08942, "b": 387.87546, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "Transformer Encoder Network", "bbox": {"l": 54.14704100000001, "t": 384.87183, "r": 59.51152, "b": 449.78326, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "x2", "bbox": {"l": 54.235424, "t": 373.81232, "r": 59.30449699999999, "b": 378.45421999999996, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "Encoded Output", "bbox": {"l": 85.295891, "t": 484.53189, "r": 122.16431, "b": 490.36688, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "Encoded Output", "bbox": {"l": 229.66599, "t": 279.54607999999996, "r": 265.3194, "b": 285.45572000000004, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "Predicted Tags", "bbox": {"l": 157.17369, "t": 500.3031, "r": 190.41711, "b": 506.12943, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "Bounding Boxes & ", "bbox": {"l": 227.81598999999997, "t": 438.05542, "r": 270.78442, "b": 443.89206, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "Classification", "bbox": {"l": 233.70262, "t": 444.06183, "r": 263.51105, "b": 449.8904999999999, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "Transformer ", "bbox": {"l": 184.74655, "t": 293.39502, "r": 212.16055, "b": 298.75903, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "Decoder Network", "bbox": {"l": 178.91229, "t": 299.14502, "r": 216.74378999999996, "b": 304.50903, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "x4", "bbox": {"l": 194.24574, "t": 282.7822, "r": 198.89099, "b": 287.84817999999996, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "CELL BBOX DECODER", "bbox": {"l": 221.45587, "t": 271.86914, "r": 276.47089, "b": 277.82916, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "Masked Multi-Head ", "bbox": {"l": 151.65219, "t": 323.44241, "r": 197.29019, "b": 329.10443, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "Attention", "bbox": {"l": 163.43277, "t": 329.44241, "r": 184.19028, "b": 335.10443, "coord_origin": "TOPLEFT"}}], "children": [{"id": 69, "label": "text", "bbox": {"l": 74.253464, "t": 258.21472000000006, "r": 101.75846, "b": 264.17474000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "Input Image", "bbox": {"l": 74.253464, "t": 258.21472000000006, "r": 101.75846, "b": 264.17474000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 122.29972, "t": 258.34520999999995, "r": 157.83972, "b": 264.30524, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "Tokenised Tags", "bbox": {"l": 122.29972, "t": 258.34520999999995, "r": 157.83972, "b": 264.30524, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 78.549347, "t": 371.38579999999996, "r": 125.68359000000001, "b": 377.04782, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "Multi-Head Attention", "bbox": {"l": 78.549347, "t": 371.38579999999996, "r": 125.68359000000001, "b": 377.04782, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 78.513298, "t": 391.31857, "r": 84.644547, "b": 396.98059, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "Add", "bbox": {"l": 78.513298, "t": 391.31857, "r": 84.644547, "b": 396.98059, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 116.52705, "t": 391.31857, "r": 125.11079999999998, "b": 396.98059, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "& Normalisation", "bbox": {"l": 116.52705, "t": 391.31857, "r": 125.11079999999998, "b": 396.98059, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 76.024773, "t": 424.45309, "r": 127.92327000000002, "b": 430.11511, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "Feed Forward Network", "bbox": {"l": 76.024773, "t": 424.45309, "r": 127.92327000000002, "b": 430.11511, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 78.382828, "t": 444.88956, "r": 84.514076, "b": 450.55157, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "Add", "bbox": {"l": 78.382828, "t": 444.88956, "r": 84.514076, "b": 450.55157, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 116.39658, "t": 444.88956, "r": 124.98033, "b": 450.55157, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "& Normalisation", "bbox": {"l": 116.39658, "t": 444.88956, "r": 124.98033, "b": 450.55157, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 167.46945, "t": 462.44324, "r": 181.6292, "b": 468.10526, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "Linear", "bbox": {"l": 167.46945, "t": 462.44324, "r": 181.6292, "b": 468.10526, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 165.61292, "t": 478.47107, "r": 184.43242, "b": 484.13309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "Softmax", "bbox": {"l": 165.61292, "t": 478.47107, "r": 184.43242, "b": 484.13309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 65.319511, "t": 324.26235999999994, "r": 132.9245, "b": 330.22235000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "CNN BACKBONE ENCODER", "bbox": {"l": 65.319511, "t": 324.26235999999994, "r": 132.9245, "b": 330.22235000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 119.51457, "t": 269.66394, "r": 162.98782, "b": 274.72992, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "[30, 1, 2, 3, 4, \u2026 3, ", "bbox": {"l": 119.51457, "t": 269.66394, "r": 162.98782, "b": 274.72992, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 128.72858, "t": 274.91394, "r": 151.41083, "b": 279.97992, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "4, 5, 8, 31]", "bbox": {"l": 128.72858, "t": 274.91394, "r": 151.41083, "b": 279.97992, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 60.434211999999995, "t": 338.95993, "r": 80.27021, "b": 344.26993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "Positional ", "bbox": {"l": 60.434211999999995, "t": 338.95993, "r": 80.27021, "b": 344.26993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 60.598457, "t": 343.38605, "r": 78.854958, "b": 348.69604, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "Encoding", "bbox": {"l": 60.598457, "t": 343.38605, "r": 78.854958, "b": 348.69604, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 134.82877, "t": 293.37762, "r": 154.66476, "b": 298.68762, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "Positional ", "bbox": {"l": 134.82877, "t": 293.37762, "r": 154.66476, "b": 298.68762, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 134.99303, "t": 297.80370999999997, "r": 153.24953, "b": 303.11371, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "Encoding", "bbox": {"l": 134.99303, "t": 297.80370999999997, "r": 153.24953, "b": 303.11371, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 150.55193, "t": 345.35861, "r": 197.14943, "b": 351.02063, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "Add & Normalisation", "bbox": {"l": 150.55193, "t": 345.35861, "r": 197.14943, "b": 351.02063, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 150.55193, "t": 394.4234, "r": 156.68318, "b": 400.08542, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "Add", "bbox": {"l": 150.55193, "t": 394.4234, "r": 156.68318, "b": 400.08542, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 188.56567, "t": 394.4234, "r": 197.14943, "b": 400.08542, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "& Normalisation", "bbox": {"l": 188.56567, "t": 394.4234, "r": 197.14943, "b": 400.08542, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 150.18539, "t": 375.66843, "r": 197.31964, "b": 381.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "Multi-Head Attention", "bbox": {"l": 150.18539, "t": 375.66843, "r": 197.31964, "b": 381.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 150.55193, "t": 440.24847000000005, "r": 156.68318, "b": 445.91049, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "Add", "bbox": {"l": 150.55193, "t": 440.24847000000005, "r": 156.68318, "b": 445.91049, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 188.56567, "t": 440.24847000000005, "r": 197.14943, "b": 445.91049, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "& Normalisation", "bbox": {"l": 188.56567, "t": 440.24847000000005, "r": 197.14943, "b": 445.91049, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 147.86377, "t": 422.09335, "r": 199.76227, "b": 427.75537, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "Feed Forward Network", "bbox": {"l": 147.86377, "t": 422.09335, "r": 199.76227, "b": 427.75537, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 241.56567000000004, "t": 314.26285000000007, "r": 255.72542, "b": 319.92487, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "Linear", "bbox": {"l": 241.56567000000004, "t": 314.26285000000007, "r": 255.72542, "b": 319.92487, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 241.91730000000004, "t": 361.36493, "r": 256.07706, "b": 367.02695, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "Linear", "bbox": {"l": 241.91730000000004, "t": 361.36493, "r": 256.07706, "b": 367.02695, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 228.054, "t": 336.61929000000003, "r": 248.72363000000004, "b": 342.28131, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "Attention", "bbox": {"l": 228.054, "t": 336.61929000000003, "r": 248.72363000000004, "b": 342.28131, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 246.2919, "t": 336.61929000000003, "r": 269.39325, "b": 342.28131, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "Network", "bbox": {"l": 246.2919, "t": 336.61929000000003, "r": 269.39325, "b": 342.28131, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 228.44568000000004, "t": 405.14682, "r": 238.73892, "b": 410.80884, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "MLP", "bbox": {"l": 228.44568000000004, "t": 405.14682, "r": 238.73892, "b": 410.80884, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 256.29767, "t": 405.2032500000001, "r": 271.77792, "b": 410.86526, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "Linear ", "bbox": {"l": 256.29767, "t": 405.2032500000001, "r": 271.77792, "b": 410.86526, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 239.54543, "t": 382.21344, "r": 258.08942, "b": 387.87546, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "Sigmoid", "bbox": {"l": 239.54543, "t": 382.21344, "r": 258.08942, "b": 387.87546, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 54.14704100000001, "t": 384.87183, "r": 59.51152, "b": 449.78326, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "Transformer Encoder Network", "bbox": {"l": 54.14704100000001, "t": 384.87183, "r": 59.51152, "b": 449.78326, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 54.235424, "t": 373.81232, "r": 59.30449699999999, "b": 378.45421999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "x2", "bbox": {"l": 54.235424, "t": 373.81232, "r": 59.30449699999999, "b": 378.45421999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 85.295891, "t": 484.53189, "r": 122.16431, "b": 490.36688, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "Encoded Output", "bbox": {"l": 85.295891, "t": 484.53189, "r": 122.16431, "b": 490.36688, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 229.66599, "t": 279.54607999999996, "r": 265.3194, "b": 285.45572000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "Encoded Output", "bbox": {"l": 229.66599, "t": 279.54607999999996, "r": 265.3194, "b": 285.45572000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 157.17369, "t": 500.3031, "r": 190.41711, "b": 506.12943, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "Predicted Tags", "bbox": {"l": 157.17369, "t": 500.3031, "r": 190.41711, "b": 506.12943, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 227.81598999999997, "t": 438.05542, "r": 270.78442, "b": 443.89206, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "Bounding Boxes & ", "bbox": {"l": 227.81598999999997, "t": 438.05542, "r": 270.78442, "b": 443.89206, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 233.70262, "t": 444.06183, "r": 263.51105, "b": 449.8904999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "Classification", "bbox": {"l": 233.70262, "t": 444.06183, "r": 263.51105, "b": 449.8904999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 184.74655, "t": 293.39502, "r": 212.16055, "b": 298.75903, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "Transformer ", "bbox": {"l": 184.74655, "t": 293.39502, "r": 212.16055, "b": 298.75903, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 178.91229, "t": 299.14502, "r": 216.74378999999996, "b": 304.50903, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "Decoder Network", "bbox": {"l": 178.91229, "t": 299.14502, "r": 216.74378999999996, "b": 304.50903, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 194.24574, "t": 282.7822, "r": 198.89099, "b": 287.84817999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": "x4", "bbox": {"l": 194.24574, "t": 282.7822, "r": 198.89099, "b": 287.84817999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 221.45587, "t": 271.86914, "r": 276.47089, "b": 277.82916, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "CELL BBOX DECODER", "bbox": {"l": 221.45587, "t": 271.86914, "r": 276.47089, "b": 277.82916, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 151.65219, "t": 323.44241, "r": 197.29019, "b": 329.10443, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "Masked Multi-Head ", "bbox": {"l": 151.65219, "t": 323.44241, "r": 197.29019, "b": 329.10443, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 163.43277, "t": 329.44241, "r": 184.19028, "b": 335.10443, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": "Attention", "bbox": {"l": 163.43277, "t": 329.44241, "r": 184.19028, "b": 335.10443, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "caption", "id": 8, "page_no": 4, "cluster": {"id": 8, "label": "caption", "bbox": {"l": 50.112, "t": 527.7828099999999, "r": 286.36597, "b": 680.27094, "coord_origin": "TOPLEFT"}, "confidence": 0.8913407325744629, "cells": [{"id": 107, "text": "Figure 4: Given an input image of a table, the", "bbox": {"l": 50.112, "t": 527.90237, "r": 229.78752, "b": 536.80893, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "Encoder", "bbox": {"l": 231.787, "t": 527.7828099999999, "r": 267.76196, "b": 536.7392, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "pro-", "bbox": {"l": 269.76401, "t": 527.90237, "r": 286.36169, "b": 536.80893, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "duces fixed-length features that represent the input image.", "bbox": {"l": 50.112015, "t": 539.85738, "r": 286.36508, "b": 548.76393, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "The features are then passed to both the", "bbox": {"l": 50.112015, "t": 551.81337, "r": 205.84735, "b": 560.71992, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "Structure Decoder", "bbox": {"l": 208.01802, "t": 551.69382, "r": 286.36392, "b": 560.6501900000001, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "and", "bbox": {"l": 50.112015, "t": 563.76837, "r": 64.498009, "b": 572.67493, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "Cell BBox Decoder", "bbox": {"l": 68.165016, "t": 563.64882, "r": 151.31288, "b": 572.60519, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": ".", "bbox": {"l": 151.31302, "t": 563.76837, "r": 153.80367, "b": 572.67493, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "During training, the", "bbox": {"l": 160.41884, "t": 563.76837, "r": 241.93283000000002, "b": 572.67493, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "Structure", "bbox": {"l": 245.59502, "t": 563.64882, "r": 286.362, "b": 572.60519, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "Decoder", "bbox": {"l": 50.112015, "t": 575.60382, "r": 85.519089, "b": 584.5602, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "receives \u2018tokenized tags\u2019 of the HTML code that", "bbox": {"l": 88.623016, "t": 575.7233699999999, "r": 286.36072, "b": 584.6299300000001, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "represent the table structure. Afterwards, a transformer en-", "bbox": {"l": 50.112015, "t": 587.6783800000001, "r": 286.36511, "b": 596.58493, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "coder and decoder architecture is employed to produce fea-", "bbox": {"l": 50.112015, "t": 599.63338, "r": 286.36508, "b": 608.53993, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "tures that are received by a linear layer, and the", "bbox": {"l": 50.112015, "t": 611.58838, "r": 240.43756000000002, "b": 620.4949300000001, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "Cell BBox", "bbox": {"l": 243.19801, "t": 611.46883, "r": 286.36597, "b": 620.4252, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "Decoder. The linear layer is applied to the features to", "bbox": {"l": 50.112015, "t": 623.42482, "r": 286.36511, "b": 632.3812, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "predict the tags. Simultaneously, the Cell BBox Decoder", "bbox": {"l": 50.112015, "t": 635.37982, "r": 286.36508, "b": 644.3362, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "selects features referring to the data cells (\u2018", "bbox": {"l": 50.112015, "t": 647.45438, "r": 220.58205, "b": 656.36093, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "<", "bbox": {"l": 220.57802000000004, "t": 647.29497, "r": 228.32693, "b": 656.14175, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "td", "bbox": {"l": 228.32700999999997, "t": 647.45438, "r": 236.07791000000003, "b": 656.36093, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": ">", "bbox": {"l": 236.07802000000004, "t": 647.29497, "r": 243.82693, "b": 656.14175, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "\u2019, \u2018", "bbox": {"l": 243.82602, "t": 647.45438, "r": 255.29298000000003, "b": 656.36093, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "<", "bbox": {"l": 255.29102000000003, "t": 647.29497, "r": 263.03992, "b": 656.14175, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "\u2019) and", "bbox": {"l": 263.04001, "t": 647.45438, "r": 286.36246, "b": 656.36093, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "passes them through an attention network, an MLP, and a", "bbox": {"l": 50.112015, "t": 659.40938, "r": 286.36511, "b": 668.31594, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "linear layer to predict the bounding boxes.", "bbox": {"l": 50.112015, "t": 671.36438, "r": 218.46996, "b": 680.27094, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 4: Given an input image of a table, the Encoder produces fixed-length features that represent the input image. The features are then passed to both the Structure Decoder and Cell BBox Decoder . During training, the Structure Decoder receives 'tokenized tags' of the HTML code that represent the table structure. Afterwards, a transformer encoder and decoder architecture is employed to produce features that are received by a linear layer, and the Cell BBox Decoder. The linear layer is applied to the features to predict the tags. Simultaneously, the Cell BBox Decoder selects features referring to the data cells (' < td > ', ' < ') and passes them through an attention network, an MLP, and a linear layer to predict the bounding boxes."}, {"label": "text", "id": 4, "page_no": 4, "cluster": {"id": 4, "label": "text", "bbox": {"l": 308.862, "t": 249.53441999999995, "r": 545.11505, "b": 294.3069499999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9831458330154419, "cells": [{"id": 135, "text": "forming classification, and adding an adaptive pooling", "bbox": {"l": 308.862, "t": 249.53441999999995, "r": 523.05786, "b": 258.44097999999997, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "layer", "bbox": {"l": 525.19983, "t": 249.53441999999995, "r": 545.11505, "b": 258.44097999999997, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "of size 28*28. ResNet by default downsamples the", "bbox": {"l": 308.862, "t": 261.49042, "r": 517.55847, "b": 270.39697, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "image", "bbox": {"l": 520.76642, "t": 261.49042, "r": 545.11499, "b": 270.39697, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "resolution by 32 and then the encoded image is provided", "bbox": {"l": 308.862, "t": 273.44537, "r": 534.80377, "b": 282.35196, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "to", "bbox": {"l": 537.36414, "t": 273.44537, "r": 545.11505, "b": 282.35196, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "both the", "bbox": {"l": 308.862, "t": 285.40039, "r": 341.24045, "b": 294.3069499999999, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "Structure Decoder", "bbox": {"l": 343.73099, "t": 285.49005, "r": 417.23508, "b": 294.07782000000003, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": ", and", "bbox": {"l": 417.23398, "t": 285.40039, "r": 436.60129, "b": 294.3069499999999, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "Cell BBox Decoder", "bbox": {"l": 439.09198, "t": 285.49005, "r": 516.56116, "b": 294.07782000000003, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": ".", "bbox": {"l": 516.56097, "t": 285.40039, "r": 519.05164, "b": 294.3069499999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "forming classification, and adding an adaptive pooling layer of size 28*28. ResNet by default downsamples the image resolution by 32 and then the encoded image is provided to both the Structure Decoder , and Cell BBox Decoder ."}, {"label": "text", "id": 1, "page_no": 4, "cluster": {"id": 1, "label": "text", "bbox": {"l": 308.86194, "t": 297.33981, "r": 545.11511, "b": 413.96182, "coord_origin": "TOPLEFT"}, "confidence": 0.9862009882926941, "cells": [{"id": 146, "text": "Structure Decoder.", "bbox": {"l": 320.81696, "t": 297.33981, "r": 400.86649, "b": 306.2962, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "The transformer architecture of", "bbox": {"l": 403.91394, "t": 297.45938, "r": 528.33685, "b": 306.36594, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "this", "bbox": {"l": 530.7179, "t": 297.45938, "r": 545.11383, "b": 306.36594, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "component is based on the work proposed in [31].", "bbox": {"l": 308.86194, "t": 309.41437, "r": 517.5285, "b": 318.32092, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "After", "bbox": {"l": 524.09387, "t": 309.41437, "r": 545.11493, "b": 318.32092, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "extensive experimentation, the", "bbox": {"l": 308.86194, "t": 321.36934999999994, "r": 432.35833999999994, "b": 330.27591, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "Structure Decoder", "bbox": {"l": 435.81995000000006, "t": 321.45901, "r": 510.29041, "b": 330.04678, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "is", "bbox": {"l": 513.97797, "t": 321.36934999999994, "r": 520.62305, "b": 330.27591, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "mod-", "bbox": {"l": 524.08008, "t": 321.36934999999994, "r": 545.11115, "b": 330.27591, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "eled as a transformer encoder with two encoder layers", "bbox": {"l": 308.86197, "t": 333.32434, "r": 527.76013, "b": 342.2309, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "and", "bbox": {"l": 530.729, "t": 333.32434, "r": 545.11499, "b": 342.2309, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "a transformer decoder made from a stack of 4 decoder", "bbox": {"l": 308.86197, "t": 345.27933, "r": 526.85352, "b": 354.18588, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "lay-", "bbox": {"l": 529.62311, "t": 345.27933, "r": 545.11493, "b": 354.18588, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "ers that comprise mainly of multi-head attention and", "bbox": {"l": 308.86197, "t": 357.23532, "r": 524.51245, "b": 366.14188, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "feed", "bbox": {"l": 527.96948, "t": 357.23532, "r": 545.11511, "b": 366.14188, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "forward layers.", "bbox": {"l": 308.86197, "t": 369.19031000000007, "r": 370.39096, "b": 378.09685999999994, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "This configuration uses fewer layers", "bbox": {"l": 377.44449, "t": 369.19031000000007, "r": 526.91339, "b": 378.09685999999994, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "and", "bbox": {"l": 530.72906, "t": 369.19031000000007, "r": 545.11505, "b": 378.09685999999994, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "heads in comparison to networks applied to other", "bbox": {"l": 308.86197, "t": 381.14529000000005, "r": 505.46395999999993, "b": 390.05185, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "problems", "bbox": {"l": 508.03430000000003, "t": 381.14529000000005, "r": 545.11511, "b": 390.05185, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "(e.g. \u201cScene Understanding\u201d, \u201cImage Captioning\u201d),", "bbox": {"l": 308.86197, "t": 393.10028, "r": 517.68799, "b": 402.00684, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "some-", "bbox": {"l": 520.76642, "t": 393.10028, "r": 545.11499, "b": 402.00684, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "thing which we relate to the simplicity of table images.", "bbox": {"l": 308.86197, "t": 405.05526999999995, "r": 528.01935, "b": 413.96182, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Structure Decoder. The transformer architecture of this component is based on the work proposed in [31]. After extensive experimentation, the Structure Decoder is modeled as a transformer encoder with two encoder layers and a transformer decoder made from a stack of 4 decoder layers that comprise mainly of multi-head attention and feed forward layers. This configuration uses fewer layers and heads in comparison to networks applied to other problems (e.g. \"Scene Understanding\", \"Image Captioning\"), something which we relate to the simplicity of table images."}, {"label": "text", "id": 3, "page_no": 4, "cluster": {"id": 3, "label": "text", "bbox": {"l": 308.86197, "t": 417.11426, "r": 545.11511, "b": 545.57271, "coord_origin": "TOPLEFT"}, "confidence": 0.9851906895637512, "cells": [{"id": 169, "text": "The transformer encoder receives an encoded", "bbox": {"l": 320.81696, "t": 417.11426, "r": 515.49609, "b": 426.02081, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "image", "bbox": {"l": 520.7663, "t": 417.11426, "r": 545.11487, "b": 426.02081, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "from the", "bbox": {"l": 308.86197, "t": 429.0692399999999, "r": 343.72107, "b": 437.9758, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "CNN Backbone Network", "bbox": {"l": 347.03796, "t": 429.15891, "r": 446.45471000000003, "b": 437.74667, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "and refines it", "bbox": {"l": 449.93996999999996, "t": 429.0692399999999, "r": 503.06055000000003, "b": 437.9758, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "through", "bbox": {"l": 506.37808, "t": 429.0692399999999, "r": 537.3717, "b": 437.9758, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "a", "bbox": {"l": 540.68927, "t": 429.0692399999999, "r": 545.11267, "b": 437.9758, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "multi-head dot-product attention layer, followed by a", "bbox": {"l": 308.86197, "t": 441.02423, "r": 522.78894, "b": 449.93079, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "Feed", "bbox": {"l": 525.7478, "t": 441.02423, "r": 545.11511, "b": 449.93079, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "Forward Network.", "bbox": {"l": 308.86197, "t": 452.97922, "r": 384.14929, "b": 461.88577, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "During training, the transformer", "bbox": {"l": 393.37466, "t": 452.97922, "r": 527.84985, "b": 461.88577, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "de-", "bbox": {"l": 532.39282, "t": 452.97922, "r": 545.11505, "b": 461.88577, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "coder receives as input the output feature produced by", "bbox": {"l": 308.86197, "t": 464.93521, "r": 529.7627, "b": 473.84177, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "the", "bbox": {"l": 532.94073, "t": 464.93521, "r": 545.11505, "b": 473.84177, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "transformer encoder, and the tokenized input of the", "bbox": {"l": 308.86197, "t": 476.8902, "r": 514.17126, "b": 485.79675, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "HTML", "bbox": {"l": 516.89105, "t": 476.8902, "r": 545.11511, "b": 485.79675, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": "ground-truth tags. Using a stack of multi-head attention", "bbox": {"l": 308.86197, "t": 488.84518, "r": 527.63068, "b": 497.75174, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "lay-", "bbox": {"l": 529.62317, "t": 488.84518, "r": 545.11499, "b": 497.75174, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "ers, different aspects of the tag sequence could be", "bbox": {"l": 308.86197, "t": 500.80017, "r": 508.3630999999999, "b": 509.70673, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": "inferred.", "bbox": {"l": 511.09286000000003, "t": 500.80017, "r": 545.11511, "b": 509.70673, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "This is achieved by each attention head on a layer operating", "bbox": {"l": 308.86197, "t": 512.7551599999999, "r": 545.11499, "b": 521.6617100000001, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "in a different subspace, and then combining altogether their", "bbox": {"l": 308.86197, "t": 524.71115, "r": 545.11511, "b": 533.61771, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "attention score.", "bbox": {"l": 308.86197, "t": 536.66615, "r": 369.73349, "b": 545.57271, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The transformer encoder receives an encoded image from the CNN Backbone Network and refines it through a multi-head dot-product attention layer, followed by a Feed Forward Network. During training, the transformer decoder receives as input the output feature produced by the transformer encoder, and the tokenized input of the HTML ground-truth tags. Using a stack of multi-head attention layers, different aspects of the tag sequence could be inferred. This is achieved by each attention head on a layer operating in a different subspace, and then combining altogether their attention score."}, {"label": "text", "id": 0, "page_no": 4, "cluster": {"id": 0, "label": "text", "bbox": {"l": 308.86194, "t": 548.6046, "r": 545.11511, "b": 653.27271, "coord_origin": "TOPLEFT"}, "confidence": 0.9869195818901062, "cells": [{"id": 192, "text": "Cell BBox Decoder.", "bbox": {"l": 320.81696, "t": 548.6046, "r": 404.76184, "b": 557.56097, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "Our architecture allows to simul-", "bbox": {"l": 410.34094, "t": 548.72415, "r": 545.11505, "b": 557.63071, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "taneously predict HTML tags and bounding boxes for each", "bbox": {"l": 308.86194, "t": 560.68015, "r": 545.11493, "b": 569.5867000000001, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "table cell without the need of a separate object detector end", "bbox": {"l": 308.86194, "t": 572.6351500000001, "r": 545.11511, "b": 581.5417, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "to end. This approach is inspired by DETR [1] which em-", "bbox": {"l": 308.86194, "t": 584.59015, "r": 545.11493, "b": 593.4967, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "ploys a Transformer Encoder, and Decoder that looks for", "bbox": {"l": 308.86194, "t": 596.54515, "r": 545.11499, "b": 605.45171, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "a specific number of object queries (potential object detec-", "bbox": {"l": 308.86194, "t": 608.50015, "r": 545.11505, "b": 617.40671, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "tions). As our model utilizes a transformer architecture, the", "bbox": {"l": 308.86194, "t": 620.45515, "r": 545.11505, "b": 629.36171, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "hidden state of the", "bbox": {"l": 308.86194, "t": 632.41115, "r": 381.67859, "b": 641.3177000000001, "coord_origin": "TOPLEFT"}}, {"id": 201, "text": "<", "bbox": {"l": 383.99695, "t": 632.25174, "r": 391.74585, "b": 641.09853, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": "td", "bbox": {"l": 391.74594, "t": 632.41115, "r": 399.49686, "b": 641.3177000000001, "coord_origin": "TOPLEFT"}}, {"id": 203, "text": ">", "bbox": {"l": 399.49695, "t": 632.25174, "r": 407.24585, "b": 641.09853, "coord_origin": "TOPLEFT"}}, {"id": 204, "text": "\u2019 and \u2018", "bbox": {"l": 407.24594, "t": 632.41115, "r": 432.90958, "b": 641.3177000000001, "coord_origin": "TOPLEFT"}}, {"id": 205, "text": "<", "bbox": {"l": 432.90792999999996, "t": 632.25174, "r": 440.65683000000007, "b": 641.09853, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": "\u2019 HTML structure tags be-", "bbox": {"l": 440.65691999999996, "t": 632.41115, "r": 545.11475, "b": 641.3177000000001, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": "come the object query.", "bbox": {"l": 308.86194, "t": 644.3661500000001, "r": 398.96371, "b": 653.27271, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Cell BBox Decoder. Our architecture allows to simultaneously predict HTML tags and bounding boxes for each table cell without the need of a separate object detector end to end. This approach is inspired by DETR [1] which employs a Transformer Encoder, and Decoder that looks for a specific number of object queries (potential object detections). As our model utilizes a transformer architecture, the hidden state of the < td > ' and ' < ' HTML structure tags become the object query."}, {"label": "text", "id": 2, "page_no": 4, "cluster": {"id": 2, "label": "text", "bbox": {"l": 308.86194, "t": 656.42516, "r": 545.11505, "b": 713.151726, "coord_origin": "TOPLEFT"}, "confidence": 0.9852352142333984, "cells": [{"id": 208, "text": "The encoding generated by the", "bbox": {"l": 320.81693, "t": 656.42516, "r": 444.34316999999993, "b": 665.33172, "coord_origin": "TOPLEFT"}}, {"id": 209, "text": "CNN Backbone Network", "bbox": {"l": 447.00591999999995, "t": 656.51482, "r": 545.1076, "b": 665.10258, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": "along with the features acquired for every data cell from the", "bbox": {"l": 308.86194, "t": 668.38016, "r": 545.11505, "b": 677.2867200000001, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "Transformer Decoder are then passed to the attention net-", "bbox": {"l": 308.86194, "t": 680.33516, "r": 545.11505, "b": 689.24172, "coord_origin": "TOPLEFT"}}, {"id": 212, "text": "work. The attention network takes both inputs and learns to", "bbox": {"l": 308.86194, "t": 692.290161, "r": 545.11505, "b": 701.196724, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "provide an attention weighted encoding. This weighted at-", "bbox": {"l": 308.86194, "t": 704.245163, "r": 545.11505, "b": 713.151726, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The encoding generated by the CNN Backbone Network along with the features acquired for every data cell from the Transformer Decoder are then passed to the attention network. The attention network takes both inputs and learns to provide an attention weighted encoding. This weighted at-"}, {"label": "page_footer", "id": 9, "page_no": 4, "cluster": {"id": 9, "label": "page_footer", "bbox": {"l": 295.12094, "t": 734.13316, "r": 300.10223, "b": 743.039722, "coord_origin": "TOPLEFT"}, "confidence": 0.8719564080238342, "cells": [{"id": 214, "text": "5", "bbox": {"l": 295.12094, "t": 734.13316, "r": 300.10223, "b": 743.039722, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5"}], "body": [{"label": "picture", "id": 7, "page_no": 4, "cluster": {"id": 7, "label": "picture", "bbox": {"l": 74.30525970458984, "t": 77.91120147705078, "r": 519.9801025390625, "b": 183.70150756835938, "coord_origin": "TOPLEFT"}, "confidence": 0.9296807646751404, "cells": [{"id": 0, "text": "1.", "bbox": {"l": 81.688072, "t": 122.43970000000002, "r": 84.927567, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Item", "bbox": {"l": 86.54731, "t": 122.43970000000002, "r": 93.026291, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Amount", "bbox": {"l": 102.50498, "t": 115.25214000000005, "r": 115.3461, "b": 118.44135000000006, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Names", "bbox": {"l": 82.140205, "t": 115.21489999999994, "r": 93.291527, "b": 118.40410999999995, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "1000", "bbox": {"l": 96.748268, "t": 122.43970000000002, "r": 104.3119, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "500", "bbox": {"l": 96.748268, "t": 127.74370999999985, "r": 102.42083, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "3500", "bbox": {"l": 96.748268, "t": 133.45569, "r": 104.3119, "b": 136.6449, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "150", "bbox": {"l": 96.748268, "t": 139.16772000000003, "r": 102.42083, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "unit", "bbox": {"l": 110.66107, "t": 122.43970000000002, "r": 116.14391, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "unit", "bbox": {"l": 110.66107, "t": 127.74370999999985, "r": 116.14391, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "unit", "bbox": {"l": 110.66107, "t": 133.45569, "r": 116.14391, "b": 136.6449, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "unit", "bbox": {"l": 110.66107, "t": 139.16772000000003, "r": 116.14391, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "2.", "bbox": {"l": 81.688072, "t": 127.74370999999985, "r": 84.927567, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Item", "bbox": {"l": 86.54731, "t": 127.74370999999985, "r": 93.026291, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "3.", "bbox": {"l": 81.688072, "t": 133.45569, "r": 84.927567, "b": 136.6449, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Item", "bbox": {"l": 86.54731, "t": 133.45569, "r": 93.026291, "b": 136.6449, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "4.", "bbox": {"l": 81.688072, "t": 139.16772000000003, "r": 84.927567, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "Item", "bbox": {"l": 86.54731, "t": 139.16772000000003, "r": 93.026291, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Extracted", "bbox": {"l": 88.084389, "t": 90.49738000000002, "r": 113.93649, "b": 96.23798, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Table Images", "bbox": {"l": 82.81002, "t": 97.63738999999998, "r": 119.21240000000002, "b": 103.37798999999995, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Standardized", "bbox": {"l": 143.94247, "t": 100.60235999999998, "r": 180.01131, "b": 106.34295999999995, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Images", "bbox": {"l": 151.94064, "t": 107.74237000000005, "r": 172.0118, "b": 113.48297000000014, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "BBox", "bbox": {"l": 251.76939000000002, "t": 80.93096999999989, "r": 266.39557, "b": 86.67156999999997, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Decoder", "bbox": {"l": 247.51601, "t": 86.03101000000004, "r": 270.65021, "b": 91.77161000000001, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "BBoxes", "bbox": {"l": 331.03699, "t": 78.55980999999997, "r": 352.12589, "b": 84.30042000000003, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "BBoxes can be", "bbox": {"l": 390.56421, "t": 96.03223000000003, "r": 431.7261, "b": 101.77282999999989, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "traced back to the", "bbox": {"l": 386.82422, "t": 102.15228000000013, "r": 435.46966999999995, "b": 107.89287999999999, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "original image to", "bbox": {"l": 388.69589, "t": 108.27228000000002, "r": 433.6032400000001, "b": 114.01288000000011, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "extract content", "bbox": {"l": 391.07761, "t": 114.39227000000005, "r": 431.22542999999996, "b": 120.13286999999991, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Structure Tags sequence", "bbox": {"l": 431.22650000000004, "t": 151.68511999999998, "r": 498.82068, "b": 157.42571999999996, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "provide full description of", "bbox": {"l": 431.1738, "t": 157.80517999999995, "r": 498.87753000000004, "b": 163.54578000000004, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "the table structure", "bbox": {"l": 440.5289, "t": 163.92516999999998, "r": 489.51827999999995, "b": 169.66576999999995, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Structure Tags", "bbox": {"l": 328.37479, "t": 178.25385000000006, "r": 367.72333, "b": 183.99445000000003, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "BBoxes in sync", "bbox": {"l": 331.84451, "t": 123.90886999999998, "r": 373.67963, "b": 129.64948000000015, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "with tag sequence", "bbox": {"l": 331.84451, "t": 129.00885000000017, "r": 381.17786, "b": 134.74945000000002, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "Encoder", "bbox": {"l": 196.62633, "t": 88.11621000000002, "r": 219.42332, "b": 93.85681, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Structure", "bbox": {"l": 246.66771, "t": 129.4946900000001, "r": 271.49899, "b": 135.23528999999996, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "Decoder", "bbox": {"l": 247.51601, "t": 134.59473000000003, "r": 270.65021, "b": 140.33533, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "[x1, y2, x2, y2]", "bbox": {"l": 330.63071, "t": 89.01923, "r": 365.55347, "b": 94.75982999999997, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "[x1', y2', x2', y2']", "bbox": {"l": 330.63071, "t": 97.17926, "r": 370.22717, "b": 102.91985999999997, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "[x1'', y2'', x2'', y2'']", "bbox": {"l": 330.63071, "t": 105.33922999999993, "r": 374.51157, "b": 111.07983000000002, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "...", "bbox": {"l": 330.63071, "t": 113.49926999999991, "r": 335.73233, "b": 119.23987, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "<TR>", "bbox": {"l": 322.30579, "t": 141.79236000000003, "r": 335.05988, "b": 146.57617000000005, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "<TD>", "bbox": {"l": 322.30579, "t": 148.93231000000003, "r": 335.05988, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "1", "bbox": {"l": 337.54971, "t": 148.55579, "r": 340.95242, "b": 154.29638999999997, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "</TD><TD colspan=\"2\">", "bbox": {"l": 343.56262, "t": 148.93231000000003, "r": 398.91446, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "</TD>", "bbox": {"l": 407.41718, "t": 148.93231000000003, "r": 421.58801, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "</TR><TR>", "bbox": {"l": 322.30579, "t": 156.07232999999997, "r": 349.23022, "b": 160.85613999999998, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "<TD>", "bbox": {"l": 322.30579, "t": 163.21234000000004, "r": 335.05988, "b": 167.99614999999994, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "</TD><TD>...", "bbox": {"l": 343.56155, "t": 163.21234000000004, "r": 374.73685, "b": 167.99614999999994, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "...", "bbox": {"l": 322.30579, "t": 170.35235999999998, "r": 326.55716, "b": 175.13617, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "1", "bbox": {"l": 323.51111, "t": 89.66967999999997, "r": 326.91382, "b": 95.41027999999994, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "2", "bbox": {"l": 323.71509, "t": 97.78887999999995, "r": 327.1178, "b": 103.52948000000004, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "3", "bbox": {"l": 323.71509, "t": 105.98969, "r": 327.1178, "b": 111.73029000000008, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "2", "bbox": {"l": 401.4816, "t": 148.54625999999996, "r": 404.88431, "b": 154.28687000000002, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "3", "bbox": {"l": 337.6976, "t": 162.68451000000005, "r": 341.10031, "b": 168.42511000000002, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "3", "bbox": {"l": 454.46378, "t": 104.54584, "r": 457.86648999999994, "b": 110.28644000000008, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "2", "bbox": {"l": 493.32580999999993, "t": 91.09546, "r": 496.72852, "b": 96.83605999999997, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "1", "bbox": {"l": 454.08298, "t": 90.56879000000015, "r": 457.48569000000003, "b": 96.30939000000001, "coord_origin": "TOPLEFT"}}], "children": [{"id": 10, "label": "text", "bbox": {"l": 81.688072, "t": 122.43970000000002, "r": 84.927567, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 0, "text": "1.", "bbox": {"l": 81.688072, "t": 122.43970000000002, "r": 84.927567, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 86.54731, "t": 122.43970000000002, "r": 93.026291, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 1, "text": "Item", "bbox": {"l": 86.54731, "t": 122.43970000000002, "r": 93.026291, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 102.50498, "t": 115.25214000000005, "r": 115.3461, "b": 118.44135000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 2, "text": "Amount", "bbox": {"l": 102.50498, "t": 115.25214000000005, "r": 115.3461, "b": 118.44135000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 82.140205, "t": 115.21489999999994, "r": 93.291527, "b": 118.40410999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 3, "text": "Names", "bbox": {"l": 82.140205, "t": 115.21489999999994, "r": 93.291527, "b": 118.40410999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 96.748268, "t": 122.43970000000002, "r": 104.3119, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 4, "text": "1000", "bbox": {"l": 96.748268, "t": 122.43970000000002, "r": 104.3119, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 96.748268, "t": 127.74370999999985, "r": 102.42083, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 5, "text": "500", "bbox": {"l": 96.748268, "t": 127.74370999999985, "r": 102.42083, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 96.748268, "t": 133.45569, "r": 104.3119, "b": 136.6449, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": "3500", "bbox": {"l": 96.748268, "t": 133.45569, "r": 104.3119, "b": 136.6449, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 96.748268, "t": 139.16772000000003, "r": 102.42083, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "150", "bbox": {"l": 96.748268, "t": 139.16772000000003, "r": 102.42083, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 110.66107, "t": 122.43970000000002, "r": 116.14391, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "unit", "bbox": {"l": 110.66107, "t": 122.43970000000002, "r": 116.14391, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 110.66107, "t": 127.74370999999985, "r": 116.14391, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "unit", "bbox": {"l": 110.66107, "t": 127.74370999999985, "r": 116.14391, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 110.66107, "t": 133.45569, "r": 116.14391, "b": 136.6449, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "unit", "bbox": {"l": 110.66107, "t": 133.45569, "r": 116.14391, "b": 136.6449, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 110.66107, "t": 139.16772000000003, "r": 116.14391, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "unit", "bbox": {"l": 110.66107, "t": 139.16772000000003, "r": 116.14391, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 81.688072, "t": 127.74370999999985, "r": 84.927567, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "2.", "bbox": {"l": 81.688072, "t": 127.74370999999985, "r": 84.927567, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 86.54731, "t": 127.74370999999985, "r": 93.026291, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "Item", "bbox": {"l": 86.54731, "t": 127.74370999999985, "r": 93.026291, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 81.688072, "t": 133.45569, "r": 84.927567, "b": 136.6449, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "3.", "bbox": {"l": 81.688072, "t": 133.45569, "r": 84.927567, "b": 136.6449, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 86.54731, "t": 133.45569, "r": 93.026291, "b": 136.6449, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "Item", "bbox": {"l": 86.54731, "t": 133.45569, "r": 93.026291, "b": 136.6449, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 81.688072, "t": 139.16772000000003, "r": 84.927567, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "4.", "bbox": {"l": 81.688072, "t": 139.16772000000003, "r": 84.927567, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 86.54731, "t": 139.16772000000003, "r": 93.026291, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "Item", "bbox": {"l": 86.54731, "t": 139.16772000000003, "r": 93.026291, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 88.084389, "t": 90.49738000000002, "r": 113.93649, "b": 96.23798, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "Extracted", "bbox": {"l": 88.084389, "t": 90.49738000000002, "r": 113.93649, "b": 96.23798, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 82.81002, "t": 97.63738999999998, "r": 119.21240000000002, "b": 103.37798999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "Table Images", "bbox": {"l": 82.81002, "t": 97.63738999999998, "r": 119.21240000000002, "b": 103.37798999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 143.94247, "t": 100.60235999999998, "r": 180.01131, "b": 106.34295999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "Standardized", "bbox": {"l": 143.94247, "t": 100.60235999999998, "r": 180.01131, "b": 106.34295999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 151.94064, "t": 107.74237000000005, "r": 172.0118, "b": 113.48297000000014, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "Images", "bbox": {"l": 151.94064, "t": 107.74237000000005, "r": 172.0118, "b": 113.48297000000014, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 251.76939000000002, "t": 80.93096999999989, "r": 266.39557, "b": 86.67156999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "BBox", "bbox": {"l": 251.76939000000002, "t": 80.93096999999989, "r": 266.39557, "b": 86.67156999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 247.51601, "t": 86.03101000000004, "r": 270.65021, "b": 91.77161000000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "Decoder", "bbox": {"l": 247.51601, "t": 86.03101000000004, "r": 270.65021, "b": 91.77161000000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 331.03699, "t": 78.55980999999997, "r": 352.12589, "b": 84.30042000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "BBoxes", "bbox": {"l": 331.03699, "t": 78.55980999999997, "r": 352.12589, "b": 84.30042000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 390.56421, "t": 96.03223000000003, "r": 431.7261, "b": 101.77282999999989, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "BBoxes can be", "bbox": {"l": 390.56421, "t": 96.03223000000003, "r": 431.7261, "b": 101.77282999999989, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 386.82422, "t": 102.15228000000013, "r": 435.46966999999995, "b": 107.89287999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "traced back to the", "bbox": {"l": 386.82422, "t": 102.15228000000013, "r": 435.46966999999995, "b": 107.89287999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 388.69589, "t": 108.27228000000002, "r": 433.6032400000001, "b": 114.01288000000011, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "original image to", "bbox": {"l": 388.69589, "t": 108.27228000000002, "r": 433.6032400000001, "b": 114.01288000000011, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 391.07761, "t": 114.39227000000005, "r": 431.22542999999996, "b": 120.13286999999991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "extract content", "bbox": {"l": 391.07761, "t": 114.39227000000005, "r": 431.22542999999996, "b": 120.13286999999991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 431.22650000000004, "t": 151.68511999999998, "r": 498.82068, "b": 157.42571999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "Structure Tags sequence", "bbox": {"l": 431.22650000000004, "t": 151.68511999999998, "r": 498.82068, "b": 157.42571999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 431.1738, "t": 157.80517999999995, "r": 498.87753000000004, "b": 163.54578000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "provide full description of", "bbox": {"l": 431.1738, "t": 157.80517999999995, "r": 498.87753000000004, "b": 163.54578000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 440.5289, "t": 163.92516999999998, "r": 489.51827999999995, "b": 169.66576999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "the table structure", "bbox": {"l": 440.5289, "t": 163.92516999999998, "r": 489.51827999999995, "b": 169.66576999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 328.37479, "t": 178.25385000000006, "r": 367.72333, "b": 183.99445000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "Structure Tags", "bbox": {"l": 328.37479, "t": 178.25385000000006, "r": 367.72333, "b": 183.99445000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 331.84451, "t": 123.90886999999998, "r": 373.67963, "b": 129.64948000000015, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "BBoxes in sync", "bbox": {"l": 331.84451, "t": 123.90886999999998, "r": 373.67963, "b": 129.64948000000015, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 331.84451, "t": 129.00885000000017, "r": 381.17786, "b": 134.74945000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "with tag sequence", "bbox": {"l": 331.84451, "t": 129.00885000000017, "r": 381.17786, "b": 134.74945000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 196.62633, "t": 88.11621000000002, "r": 219.42332, "b": 93.85681, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "Encoder", "bbox": {"l": 196.62633, "t": 88.11621000000002, "r": 219.42332, "b": 93.85681, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 246.66771, "t": 129.4946900000001, "r": 271.49899, "b": 135.23528999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "Structure", "bbox": {"l": 246.66771, "t": 129.4946900000001, "r": 271.49899, "b": 135.23528999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 247.51601, "t": 134.59473000000003, "r": 270.65021, "b": 140.33533, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "Decoder", "bbox": {"l": 247.51601, "t": 134.59473000000003, "r": 270.65021, "b": 140.33533, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 330.63071, "t": 89.01923, "r": 365.55347, "b": 94.75982999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "[x1, y2, x2, y2]", "bbox": {"l": 330.63071, "t": 89.01923, "r": 365.55347, "b": 94.75982999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 330.63071, "t": 97.17926, "r": 370.22717, "b": 102.91985999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "[x1', y2', x2', y2']", "bbox": {"l": 330.63071, "t": 97.17926, "r": 370.22717, "b": 102.91985999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 330.63071, "t": 105.33922999999993, "r": 374.51157, "b": 111.07983000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "[x1'', y2'', x2'', y2'']", "bbox": {"l": 330.63071, "t": 105.33922999999993, "r": 374.51157, "b": 111.07983000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 330.63071, "t": 113.49926999999991, "r": 335.73233, "b": 119.23987, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "...", "bbox": {"l": 330.63071, "t": 113.49926999999991, "r": 335.73233, "b": 119.23987, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 322.30579, "t": 141.79236000000003, "r": 335.05988, "b": 146.57617000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "<TR>", "bbox": {"l": 322.30579, "t": 141.79236000000003, "r": 335.05988, "b": 146.57617000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 322.30579, "t": 148.93231000000003, "r": 335.05988, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "<TD>", "bbox": {"l": 322.30579, "t": 148.93231000000003, "r": 335.05988, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 337.54971, "t": 148.55579, "r": 340.95242, "b": 154.29638999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "1", "bbox": {"l": 337.54971, "t": 148.55579, "r": 340.95242, "b": 154.29638999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 343.56262, "t": 148.93231000000003, "r": 398.91446, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "</TD><TD colspan=\"2\">", "bbox": {"l": 343.56262, "t": 148.93231000000003, "r": 398.91446, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 407.41718, "t": 148.93231000000003, "r": 421.58801, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "</TD>", "bbox": {"l": 407.41718, "t": 148.93231000000003, "r": 421.58801, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 322.30579, "t": 156.07232999999997, "r": 349.23022, "b": 160.85613999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "</TR><TR>", "bbox": {"l": 322.30579, "t": 156.07232999999997, "r": 349.23022, "b": 160.85613999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 322.30579, "t": 163.21234000000004, "r": 335.05988, "b": 167.99614999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "<TD>", "bbox": {"l": 322.30579, "t": 163.21234000000004, "r": 335.05988, "b": 167.99614999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 343.56155, "t": 163.21234000000004, "r": 374.73685, "b": 167.99614999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "</TD><TD>...", "bbox": {"l": 343.56155, "t": 163.21234000000004, "r": 374.73685, "b": 167.99614999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 322.30579, "t": 170.35235999999998, "r": 326.55716, "b": 175.13617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "...", "bbox": {"l": 322.30579, "t": 170.35235999999998, "r": 326.55716, "b": 175.13617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 323.51111, "t": 89.66967999999997, "r": 326.91382, "b": 95.41027999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "1", "bbox": {"l": 323.51111, "t": 89.66967999999997, "r": 326.91382, "b": 95.41027999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 323.71509, "t": 97.78887999999995, "r": 327.1178, "b": 103.52948000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "2", "bbox": {"l": 323.71509, "t": 97.78887999999995, "r": 327.1178, "b": 103.52948000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 323.71509, "t": 105.98969, "r": 327.1178, "b": 111.73029000000008, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "3", "bbox": {"l": 323.71509, "t": 105.98969, "r": 327.1178, "b": 111.73029000000008, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 401.4816, "t": 148.54625999999996, "r": 404.88431, "b": 154.28687000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "2", "bbox": {"l": 401.4816, "t": 148.54625999999996, "r": 404.88431, "b": 154.28687000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 337.6976, "t": 162.68451000000005, "r": 341.10031, "b": 168.42511000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "3", "bbox": {"l": 337.6976, "t": 162.68451000000005, "r": 341.10031, "b": 168.42511000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 454.46378, "t": 104.54584, "r": 457.86648999999994, "b": 110.28644000000008, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "3", "bbox": {"l": 454.46378, "t": 104.54584, "r": 457.86648999999994, "b": 110.28644000000008, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 493.32580999999993, "t": 91.09546, "r": 496.72852, "b": 96.83605999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "2", "bbox": {"l": 493.32580999999993, "t": 91.09546, "r": 496.72852, "b": 96.83605999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 454.08298, "t": 90.56879000000015, "r": 457.48569000000003, "b": 96.30939000000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "1", "bbox": {"l": 454.08298, "t": 90.56879000000015, "r": 457.48569000000003, "b": 96.30939000000001, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "caption", "id": 6, "page_no": 4, "cluster": {"id": 6, "label": "caption", "bbox": {"l": 50.111992, "t": 203.98577999999998, "r": 545.10846, "b": 224.96691999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9677652716636658, "cells": [{"id": 59, "text": "Figure 3:", "bbox": {"l": 50.112, "t": 204.10535000000004, "r": 86.883949, "b": 213.01189999999997, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "TableFormer", "bbox": {"l": 94.020996, "t": 203.98577999999998, "r": 149.85141, "b": 212.94214, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "takes in an image of the PDF and creates bounding box and HTML structure predictions that are", "bbox": {"l": 152.86099, "t": 204.10535000000004, "r": 545.10846, "b": 213.01189999999997, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "synchronized. The bounding boxes grabs the content from the PDF and inserts it in the structure.", "bbox": {"l": 50.111992, "t": 216.06035999999995, "r": 436.0134, "b": 224.96691999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 3: TableFormer takes in an image of the PDF and creates bounding box and HTML structure predictions that are synchronized. The bounding boxes grabs the content from the PDF and inserts it in the structure."}, {"label": "picture", "id": 5, "page_no": 4, "cluster": {"id": 5, "label": "picture", "bbox": {"l": 53.03328323364258, "t": 257.66534423828125, "r": 285.3731689453125, "b": 507.6688537597656, "coord_origin": "TOPLEFT"}, "confidence": 0.9724942445755005, "cells": [{"id": 63, "text": "Input Image", "bbox": {"l": 74.253464, "t": 258.21472000000006, "r": 101.75846, "b": 264.17474000000004, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "Tokenised Tags", "bbox": {"l": 122.29972, "t": 258.34520999999995, "r": 157.83972, "b": 264.30524, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "Multi-Head Attention", "bbox": {"l": 78.549347, "t": 371.38579999999996, "r": 125.68359000000001, "b": 377.04782, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "Add", "bbox": {"l": 78.513298, "t": 391.31857, "r": 84.644547, "b": 396.98059, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "& Normalisation", "bbox": {"l": 116.52705, "t": 391.31857, "r": 125.11079999999998, "b": 396.98059, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "Feed Forward Network", "bbox": {"l": 76.024773, "t": 424.45309, "r": 127.92327000000002, "b": 430.11511, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "Add", "bbox": {"l": 78.382828, "t": 444.88956, "r": 84.514076, "b": 450.55157, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "& Normalisation", "bbox": {"l": 116.39658, "t": 444.88956, "r": 124.98033, "b": 450.55157, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Linear", "bbox": {"l": 167.46945, "t": 462.44324, "r": 181.6292, "b": 468.10526, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "Softmax", "bbox": {"l": 165.61292, "t": 478.47107, "r": 184.43242, "b": 484.13309, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "CNN BACKBONE ENCODER", "bbox": {"l": 65.319511, "t": 324.26235999999994, "r": 132.9245, "b": 330.22235000000006, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "[30, 1, 2, 3, 4, \u2026 3, ", "bbox": {"l": 119.51457, "t": 269.66394, "r": 162.98782, "b": 274.72992, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "4, 5, 8, 31]", "bbox": {"l": 128.72858, "t": 274.91394, "r": 151.41083, "b": 279.97992, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "Positional ", "bbox": {"l": 60.434211999999995, "t": 338.95993, "r": 80.27021, "b": 344.26993, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "Encoding", "bbox": {"l": 60.598457, "t": 343.38605, "r": 78.854958, "b": 348.69604, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "Positional ", "bbox": {"l": 134.82877, "t": 293.37762, "r": 154.66476, "b": 298.68762, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "Encoding", "bbox": {"l": 134.99303, "t": 297.80370999999997, "r": 153.24953, "b": 303.11371, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "Add & Normalisation", "bbox": {"l": 150.55193, "t": 345.35861, "r": 197.14943, "b": 351.02063, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Add", "bbox": {"l": 150.55193, "t": 394.4234, "r": 156.68318, "b": 400.08542, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "& Normalisation", "bbox": {"l": 188.56567, "t": 394.4234, "r": 197.14943, "b": 400.08542, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "Multi-Head Attention", "bbox": {"l": 150.18539, "t": 375.66843, "r": 197.31964, "b": 381.33044, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "Add", "bbox": {"l": 150.55193, "t": 440.24847000000005, "r": 156.68318, "b": 445.91049, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "& Normalisation", "bbox": {"l": 188.56567, "t": 440.24847000000005, "r": 197.14943, "b": 445.91049, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Feed Forward Network", "bbox": {"l": 147.86377, "t": 422.09335, "r": 199.76227, "b": 427.75537, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Linear", "bbox": {"l": 241.56567000000004, "t": 314.26285000000007, "r": 255.72542, "b": 319.92487, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "Linear", "bbox": {"l": 241.91730000000004, "t": 361.36493, "r": 256.07706, "b": 367.02695, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "Attention", "bbox": {"l": 228.054, "t": 336.61929000000003, "r": 248.72363000000004, "b": 342.28131, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "Network", "bbox": {"l": 246.2919, "t": 336.61929000000003, "r": 269.39325, "b": 342.28131, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "MLP", "bbox": {"l": 228.44568000000004, "t": 405.14682, "r": 238.73892, "b": 410.80884, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Linear ", "bbox": {"l": 256.29767, "t": 405.2032500000001, "r": 271.77792, "b": 410.86526, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "Sigmoid", "bbox": {"l": 239.54543, "t": 382.21344, "r": 258.08942, "b": 387.87546, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "Transformer Encoder Network", "bbox": {"l": 54.14704100000001, "t": 384.87183, "r": 59.51152, "b": 449.78326, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "x2", "bbox": {"l": 54.235424, "t": 373.81232, "r": 59.30449699999999, "b": 378.45421999999996, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "Encoded Output", "bbox": {"l": 85.295891, "t": 484.53189, "r": 122.16431, "b": 490.36688, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "Encoded Output", "bbox": {"l": 229.66599, "t": 279.54607999999996, "r": 265.3194, "b": 285.45572000000004, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "Predicted Tags", "bbox": {"l": 157.17369, "t": 500.3031, "r": 190.41711, "b": 506.12943, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "Bounding Boxes & ", "bbox": {"l": 227.81598999999997, "t": 438.05542, "r": 270.78442, "b": 443.89206, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "Classification", "bbox": {"l": 233.70262, "t": 444.06183, "r": 263.51105, "b": 449.8904999999999, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "Transformer ", "bbox": {"l": 184.74655, "t": 293.39502, "r": 212.16055, "b": 298.75903, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "Decoder Network", "bbox": {"l": 178.91229, "t": 299.14502, "r": 216.74378999999996, "b": 304.50903, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "x4", "bbox": {"l": 194.24574, "t": 282.7822, "r": 198.89099, "b": 287.84817999999996, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "CELL BBOX DECODER", "bbox": {"l": 221.45587, "t": 271.86914, "r": 276.47089, "b": 277.82916, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "Masked Multi-Head ", "bbox": {"l": 151.65219, "t": 323.44241, "r": 197.29019, "b": 329.10443, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "Attention", "bbox": {"l": 163.43277, "t": 329.44241, "r": 184.19028, "b": 335.10443, "coord_origin": "TOPLEFT"}}], "children": [{"id": 69, "label": "text", "bbox": {"l": 74.253464, "t": 258.21472000000006, "r": 101.75846, "b": 264.17474000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "Input Image", "bbox": {"l": 74.253464, "t": 258.21472000000006, "r": 101.75846, "b": 264.17474000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 122.29972, "t": 258.34520999999995, "r": 157.83972, "b": 264.30524, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "Tokenised Tags", "bbox": {"l": 122.29972, "t": 258.34520999999995, "r": 157.83972, "b": 264.30524, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 78.549347, "t": 371.38579999999996, "r": 125.68359000000001, "b": 377.04782, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "Multi-Head Attention", "bbox": {"l": 78.549347, "t": 371.38579999999996, "r": 125.68359000000001, "b": 377.04782, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 78.513298, "t": 391.31857, "r": 84.644547, "b": 396.98059, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "Add", "bbox": {"l": 78.513298, "t": 391.31857, "r": 84.644547, "b": 396.98059, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 116.52705, "t": 391.31857, "r": 125.11079999999998, "b": 396.98059, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "& Normalisation", "bbox": {"l": 116.52705, "t": 391.31857, "r": 125.11079999999998, "b": 396.98059, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 76.024773, "t": 424.45309, "r": 127.92327000000002, "b": 430.11511, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "Feed Forward Network", "bbox": {"l": 76.024773, "t": 424.45309, "r": 127.92327000000002, "b": 430.11511, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 78.382828, "t": 444.88956, "r": 84.514076, "b": 450.55157, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "Add", "bbox": {"l": 78.382828, "t": 444.88956, "r": 84.514076, "b": 450.55157, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 116.39658, "t": 444.88956, "r": 124.98033, "b": 450.55157, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "& Normalisation", "bbox": {"l": 116.39658, "t": 444.88956, "r": 124.98033, "b": 450.55157, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 167.46945, "t": 462.44324, "r": 181.6292, "b": 468.10526, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "Linear", "bbox": {"l": 167.46945, "t": 462.44324, "r": 181.6292, "b": 468.10526, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 165.61292, "t": 478.47107, "r": 184.43242, "b": 484.13309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "Softmax", "bbox": {"l": 165.61292, "t": 478.47107, "r": 184.43242, "b": 484.13309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 65.319511, "t": 324.26235999999994, "r": 132.9245, "b": 330.22235000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "CNN BACKBONE ENCODER", "bbox": {"l": 65.319511, "t": 324.26235999999994, "r": 132.9245, "b": 330.22235000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 119.51457, "t": 269.66394, "r": 162.98782, "b": 274.72992, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "[30, 1, 2, 3, 4, \u2026 3, ", "bbox": {"l": 119.51457, "t": 269.66394, "r": 162.98782, "b": 274.72992, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 128.72858, "t": 274.91394, "r": 151.41083, "b": 279.97992, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "4, 5, 8, 31]", "bbox": {"l": 128.72858, "t": 274.91394, "r": 151.41083, "b": 279.97992, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 60.434211999999995, "t": 338.95993, "r": 80.27021, "b": 344.26993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "Positional ", "bbox": {"l": 60.434211999999995, "t": 338.95993, "r": 80.27021, "b": 344.26993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 60.598457, "t": 343.38605, "r": 78.854958, "b": 348.69604, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "Encoding", "bbox": {"l": 60.598457, "t": 343.38605, "r": 78.854958, "b": 348.69604, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 134.82877, "t": 293.37762, "r": 154.66476, "b": 298.68762, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "Positional ", "bbox": {"l": 134.82877, "t": 293.37762, "r": 154.66476, "b": 298.68762, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 134.99303, "t": 297.80370999999997, "r": 153.24953, "b": 303.11371, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "Encoding", "bbox": {"l": 134.99303, "t": 297.80370999999997, "r": 153.24953, "b": 303.11371, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 150.55193, "t": 345.35861, "r": 197.14943, "b": 351.02063, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "Add & Normalisation", "bbox": {"l": 150.55193, "t": 345.35861, "r": 197.14943, "b": 351.02063, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 150.55193, "t": 394.4234, "r": 156.68318, "b": 400.08542, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "Add", "bbox": {"l": 150.55193, "t": 394.4234, "r": 156.68318, "b": 400.08542, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 188.56567, "t": 394.4234, "r": 197.14943, "b": 400.08542, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "& Normalisation", "bbox": {"l": 188.56567, "t": 394.4234, "r": 197.14943, "b": 400.08542, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 150.18539, "t": 375.66843, "r": 197.31964, "b": 381.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "Multi-Head Attention", "bbox": {"l": 150.18539, "t": 375.66843, "r": 197.31964, "b": 381.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 150.55193, "t": 440.24847000000005, "r": 156.68318, "b": 445.91049, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "Add", "bbox": {"l": 150.55193, "t": 440.24847000000005, "r": 156.68318, "b": 445.91049, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 188.56567, "t": 440.24847000000005, "r": 197.14943, "b": 445.91049, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "& Normalisation", "bbox": {"l": 188.56567, "t": 440.24847000000005, "r": 197.14943, "b": 445.91049, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 147.86377, "t": 422.09335, "r": 199.76227, "b": 427.75537, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "Feed Forward Network", "bbox": {"l": 147.86377, "t": 422.09335, "r": 199.76227, "b": 427.75537, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 241.56567000000004, "t": 314.26285000000007, "r": 255.72542, "b": 319.92487, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "Linear", "bbox": {"l": 241.56567000000004, "t": 314.26285000000007, "r": 255.72542, "b": 319.92487, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 241.91730000000004, "t": 361.36493, "r": 256.07706, "b": 367.02695, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "Linear", "bbox": {"l": 241.91730000000004, "t": 361.36493, "r": 256.07706, "b": 367.02695, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 228.054, "t": 336.61929000000003, "r": 248.72363000000004, "b": 342.28131, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "Attention", "bbox": {"l": 228.054, "t": 336.61929000000003, "r": 248.72363000000004, "b": 342.28131, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 246.2919, "t": 336.61929000000003, "r": 269.39325, "b": 342.28131, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "Network", "bbox": {"l": 246.2919, "t": 336.61929000000003, "r": 269.39325, "b": 342.28131, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 228.44568000000004, "t": 405.14682, "r": 238.73892, "b": 410.80884, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "MLP", "bbox": {"l": 228.44568000000004, "t": 405.14682, "r": 238.73892, "b": 410.80884, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 256.29767, "t": 405.2032500000001, "r": 271.77792, "b": 410.86526, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "Linear ", "bbox": {"l": 256.29767, "t": 405.2032500000001, "r": 271.77792, "b": 410.86526, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 239.54543, "t": 382.21344, "r": 258.08942, "b": 387.87546, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "Sigmoid", "bbox": {"l": 239.54543, "t": 382.21344, "r": 258.08942, "b": 387.87546, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 54.14704100000001, "t": 384.87183, "r": 59.51152, "b": 449.78326, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "Transformer Encoder Network", "bbox": {"l": 54.14704100000001, "t": 384.87183, "r": 59.51152, "b": 449.78326, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 54.235424, "t": 373.81232, "r": 59.30449699999999, "b": 378.45421999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "x2", "bbox": {"l": 54.235424, "t": 373.81232, "r": 59.30449699999999, "b": 378.45421999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 85.295891, "t": 484.53189, "r": 122.16431, "b": 490.36688, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "Encoded Output", "bbox": {"l": 85.295891, "t": 484.53189, "r": 122.16431, "b": 490.36688, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 229.66599, "t": 279.54607999999996, "r": 265.3194, "b": 285.45572000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "Encoded Output", "bbox": {"l": 229.66599, "t": 279.54607999999996, "r": 265.3194, "b": 285.45572000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 157.17369, "t": 500.3031, "r": 190.41711, "b": 506.12943, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "Predicted Tags", "bbox": {"l": 157.17369, "t": 500.3031, "r": 190.41711, "b": 506.12943, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 227.81598999999997, "t": 438.05542, "r": 270.78442, "b": 443.89206, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "Bounding Boxes & ", "bbox": {"l": 227.81598999999997, "t": 438.05542, "r": 270.78442, "b": 443.89206, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 233.70262, "t": 444.06183, "r": 263.51105, "b": 449.8904999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "Classification", "bbox": {"l": 233.70262, "t": 444.06183, "r": 263.51105, "b": 449.8904999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 184.74655, "t": 293.39502, "r": 212.16055, "b": 298.75903, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "Transformer ", "bbox": {"l": 184.74655, "t": 293.39502, "r": 212.16055, "b": 298.75903, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 178.91229, "t": 299.14502, "r": 216.74378999999996, "b": 304.50903, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "Decoder Network", "bbox": {"l": 178.91229, "t": 299.14502, "r": 216.74378999999996, "b": 304.50903, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 194.24574, "t": 282.7822, "r": 198.89099, "b": 287.84817999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": "x4", "bbox": {"l": 194.24574, "t": 282.7822, "r": 198.89099, "b": 287.84817999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 221.45587, "t": 271.86914, "r": 276.47089, "b": 277.82916, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "CELL BBOX DECODER", "bbox": {"l": 221.45587, "t": 271.86914, "r": 276.47089, "b": 277.82916, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 151.65219, "t": 323.44241, "r": 197.29019, "b": 329.10443, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "Masked Multi-Head ", "bbox": {"l": 151.65219, "t": 323.44241, "r": 197.29019, "b": 329.10443, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 163.43277, "t": 329.44241, "r": 184.19028, "b": 335.10443, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": "Attention", "bbox": {"l": 163.43277, "t": 329.44241, "r": 184.19028, "b": 335.10443, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "caption", "id": 8, "page_no": 4, "cluster": {"id": 8, "label": "caption", "bbox": {"l": 50.112, "t": 527.7828099999999, "r": 286.36597, "b": 680.27094, "coord_origin": "TOPLEFT"}, "confidence": 0.8913407325744629, "cells": [{"id": 107, "text": "Figure 4: Given an input image of a table, the", "bbox": {"l": 50.112, "t": 527.90237, "r": 229.78752, "b": 536.80893, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "Encoder", "bbox": {"l": 231.787, "t": 527.7828099999999, "r": 267.76196, "b": 536.7392, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "pro-", "bbox": {"l": 269.76401, "t": 527.90237, "r": 286.36169, "b": 536.80893, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "duces fixed-length features that represent the input image.", "bbox": {"l": 50.112015, "t": 539.85738, "r": 286.36508, "b": 548.76393, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "The features are then passed to both the", "bbox": {"l": 50.112015, "t": 551.81337, "r": 205.84735, "b": 560.71992, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "Structure Decoder", "bbox": {"l": 208.01802, "t": 551.69382, "r": 286.36392, "b": 560.6501900000001, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "and", "bbox": {"l": 50.112015, "t": 563.76837, "r": 64.498009, "b": 572.67493, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "Cell BBox Decoder", "bbox": {"l": 68.165016, "t": 563.64882, "r": 151.31288, "b": 572.60519, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": ".", "bbox": {"l": 151.31302, "t": 563.76837, "r": 153.80367, "b": 572.67493, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "During training, the", "bbox": {"l": 160.41884, "t": 563.76837, "r": 241.93283000000002, "b": 572.67493, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "Structure", "bbox": {"l": 245.59502, "t": 563.64882, "r": 286.362, "b": 572.60519, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "Decoder", "bbox": {"l": 50.112015, "t": 575.60382, "r": 85.519089, "b": 584.5602, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "receives \u2018tokenized tags\u2019 of the HTML code that", "bbox": {"l": 88.623016, "t": 575.7233699999999, "r": 286.36072, "b": 584.6299300000001, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "represent the table structure. Afterwards, a transformer en-", "bbox": {"l": 50.112015, "t": 587.6783800000001, "r": 286.36511, "b": 596.58493, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "coder and decoder architecture is employed to produce fea-", "bbox": {"l": 50.112015, "t": 599.63338, "r": 286.36508, "b": 608.53993, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "tures that are received by a linear layer, and the", "bbox": {"l": 50.112015, "t": 611.58838, "r": 240.43756000000002, "b": 620.4949300000001, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "Cell BBox", "bbox": {"l": 243.19801, "t": 611.46883, "r": 286.36597, "b": 620.4252, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "Decoder. The linear layer is applied to the features to", "bbox": {"l": 50.112015, "t": 623.42482, "r": 286.36511, "b": 632.3812, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "predict the tags. Simultaneously, the Cell BBox Decoder", "bbox": {"l": 50.112015, "t": 635.37982, "r": 286.36508, "b": 644.3362, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "selects features referring to the data cells (\u2018", "bbox": {"l": 50.112015, "t": 647.45438, "r": 220.58205, "b": 656.36093, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "<", "bbox": {"l": 220.57802000000004, "t": 647.29497, "r": 228.32693, "b": 656.14175, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "td", "bbox": {"l": 228.32700999999997, "t": 647.45438, "r": 236.07791000000003, "b": 656.36093, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": ">", "bbox": {"l": 236.07802000000004, "t": 647.29497, "r": 243.82693, "b": 656.14175, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "\u2019, \u2018", "bbox": {"l": 243.82602, "t": 647.45438, "r": 255.29298000000003, "b": 656.36093, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "<", "bbox": {"l": 255.29102000000003, "t": 647.29497, "r": 263.03992, "b": 656.14175, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "\u2019) and", "bbox": {"l": 263.04001, "t": 647.45438, "r": 286.36246, "b": 656.36093, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "passes them through an attention network, an MLP, and a", "bbox": {"l": 50.112015, "t": 659.40938, "r": 286.36511, "b": 668.31594, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "linear layer to predict the bounding boxes.", "bbox": {"l": 50.112015, "t": 671.36438, "r": 218.46996, "b": 680.27094, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 4: Given an input image of a table, the Encoder produces fixed-length features that represent the input image. The features are then passed to both the Structure Decoder and Cell BBox Decoder . During training, the Structure Decoder receives 'tokenized tags' of the HTML code that represent the table structure. Afterwards, a transformer encoder and decoder architecture is employed to produce features that are received by a linear layer, and the Cell BBox Decoder. The linear layer is applied to the features to predict the tags. Simultaneously, the Cell BBox Decoder selects features referring to the data cells (' < td > ', ' < ') and passes them through an attention network, an MLP, and a linear layer to predict the bounding boxes."}, {"label": "text", "id": 4, "page_no": 4, "cluster": {"id": 4, "label": "text", "bbox": {"l": 308.862, "t": 249.53441999999995, "r": 545.11505, "b": 294.3069499999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9831458330154419, "cells": [{"id": 135, "text": "forming classification, and adding an adaptive pooling", "bbox": {"l": 308.862, "t": 249.53441999999995, "r": 523.05786, "b": 258.44097999999997, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "layer", "bbox": {"l": 525.19983, "t": 249.53441999999995, "r": 545.11505, "b": 258.44097999999997, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "of size 28*28. ResNet by default downsamples the", "bbox": {"l": 308.862, "t": 261.49042, "r": 517.55847, "b": 270.39697, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "image", "bbox": {"l": 520.76642, "t": 261.49042, "r": 545.11499, "b": 270.39697, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "resolution by 32 and then the encoded image is provided", "bbox": {"l": 308.862, "t": 273.44537, "r": 534.80377, "b": 282.35196, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "to", "bbox": {"l": 537.36414, "t": 273.44537, "r": 545.11505, "b": 282.35196, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "both the", "bbox": {"l": 308.862, "t": 285.40039, "r": 341.24045, "b": 294.3069499999999, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "Structure Decoder", "bbox": {"l": 343.73099, "t": 285.49005, "r": 417.23508, "b": 294.07782000000003, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": ", and", "bbox": {"l": 417.23398, "t": 285.40039, "r": 436.60129, "b": 294.3069499999999, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "Cell BBox Decoder", "bbox": {"l": 439.09198, "t": 285.49005, "r": 516.56116, "b": 294.07782000000003, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": ".", "bbox": {"l": 516.56097, "t": 285.40039, "r": 519.05164, "b": 294.3069499999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "forming classification, and adding an adaptive pooling layer of size 28*28. ResNet by default downsamples the image resolution by 32 and then the encoded image is provided to both the Structure Decoder , and Cell BBox Decoder ."}, {"label": "text", "id": 1, "page_no": 4, "cluster": {"id": 1, "label": "text", "bbox": {"l": 308.86194, "t": 297.33981, "r": 545.11511, "b": 413.96182, "coord_origin": "TOPLEFT"}, "confidence": 0.9862009882926941, "cells": [{"id": 146, "text": "Structure Decoder.", "bbox": {"l": 320.81696, "t": 297.33981, "r": 400.86649, "b": 306.2962, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "The transformer architecture of", "bbox": {"l": 403.91394, "t": 297.45938, "r": 528.33685, "b": 306.36594, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "this", "bbox": {"l": 530.7179, "t": 297.45938, "r": 545.11383, "b": 306.36594, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "component is based on the work proposed in [31].", "bbox": {"l": 308.86194, "t": 309.41437, "r": 517.5285, "b": 318.32092, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "After", "bbox": {"l": 524.09387, "t": 309.41437, "r": 545.11493, "b": 318.32092, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "extensive experimentation, the", "bbox": {"l": 308.86194, "t": 321.36934999999994, "r": 432.35833999999994, "b": 330.27591, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "Structure Decoder", "bbox": {"l": 435.81995000000006, "t": 321.45901, "r": 510.29041, "b": 330.04678, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "is", "bbox": {"l": 513.97797, "t": 321.36934999999994, "r": 520.62305, "b": 330.27591, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "mod-", "bbox": {"l": 524.08008, "t": 321.36934999999994, "r": 545.11115, "b": 330.27591, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "eled as a transformer encoder with two encoder layers", "bbox": {"l": 308.86197, "t": 333.32434, "r": 527.76013, "b": 342.2309, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "and", "bbox": {"l": 530.729, "t": 333.32434, "r": 545.11499, "b": 342.2309, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "a transformer decoder made from a stack of 4 decoder", "bbox": {"l": 308.86197, "t": 345.27933, "r": 526.85352, "b": 354.18588, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "lay-", "bbox": {"l": 529.62311, "t": 345.27933, "r": 545.11493, "b": 354.18588, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "ers that comprise mainly of multi-head attention and", "bbox": {"l": 308.86197, "t": 357.23532, "r": 524.51245, "b": 366.14188, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "feed", "bbox": {"l": 527.96948, "t": 357.23532, "r": 545.11511, "b": 366.14188, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "forward layers.", "bbox": {"l": 308.86197, "t": 369.19031000000007, "r": 370.39096, "b": 378.09685999999994, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "This configuration uses fewer layers", "bbox": {"l": 377.44449, "t": 369.19031000000007, "r": 526.91339, "b": 378.09685999999994, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "and", "bbox": {"l": 530.72906, "t": 369.19031000000007, "r": 545.11505, "b": 378.09685999999994, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "heads in comparison to networks applied to other", "bbox": {"l": 308.86197, "t": 381.14529000000005, "r": 505.46395999999993, "b": 390.05185, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "problems", "bbox": {"l": 508.03430000000003, "t": 381.14529000000005, "r": 545.11511, "b": 390.05185, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "(e.g. \u201cScene Understanding\u201d, \u201cImage Captioning\u201d),", "bbox": {"l": 308.86197, "t": 393.10028, "r": 517.68799, "b": 402.00684, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "some-", "bbox": {"l": 520.76642, "t": 393.10028, "r": 545.11499, "b": 402.00684, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "thing which we relate to the simplicity of table images.", "bbox": {"l": 308.86197, "t": 405.05526999999995, "r": 528.01935, "b": 413.96182, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Structure Decoder. The transformer architecture of this component is based on the work proposed in [31]. After extensive experimentation, the Structure Decoder is modeled as a transformer encoder with two encoder layers and a transformer decoder made from a stack of 4 decoder layers that comprise mainly of multi-head attention and feed forward layers. This configuration uses fewer layers and heads in comparison to networks applied to other problems (e.g. \"Scene Understanding\", \"Image Captioning\"), something which we relate to the simplicity of table images."}, {"label": "text", "id": 3, "page_no": 4, "cluster": {"id": 3, "label": "text", "bbox": {"l": 308.86197, "t": 417.11426, "r": 545.11511, "b": 545.57271, "coord_origin": "TOPLEFT"}, "confidence": 0.9851906895637512, "cells": [{"id": 169, "text": "The transformer encoder receives an encoded", "bbox": {"l": 320.81696, "t": 417.11426, "r": 515.49609, "b": 426.02081, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "image", "bbox": {"l": 520.7663, "t": 417.11426, "r": 545.11487, "b": 426.02081, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "from the", "bbox": {"l": 308.86197, "t": 429.0692399999999, "r": 343.72107, "b": 437.9758, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "CNN Backbone Network", "bbox": {"l": 347.03796, "t": 429.15891, "r": 446.45471000000003, "b": 437.74667, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "and refines it", "bbox": {"l": 449.93996999999996, "t": 429.0692399999999, "r": 503.06055000000003, "b": 437.9758, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "through", "bbox": {"l": 506.37808, "t": 429.0692399999999, "r": 537.3717, "b": 437.9758, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "a", "bbox": {"l": 540.68927, "t": 429.0692399999999, "r": 545.11267, "b": 437.9758, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "multi-head dot-product attention layer, followed by a", "bbox": {"l": 308.86197, "t": 441.02423, "r": 522.78894, "b": 449.93079, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "Feed", "bbox": {"l": 525.7478, "t": 441.02423, "r": 545.11511, "b": 449.93079, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "Forward Network.", "bbox": {"l": 308.86197, "t": 452.97922, "r": 384.14929, "b": 461.88577, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "During training, the transformer", "bbox": {"l": 393.37466, "t": 452.97922, "r": 527.84985, "b": 461.88577, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "de-", "bbox": {"l": 532.39282, "t": 452.97922, "r": 545.11505, "b": 461.88577, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "coder receives as input the output feature produced by", "bbox": {"l": 308.86197, "t": 464.93521, "r": 529.7627, "b": 473.84177, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "the", "bbox": {"l": 532.94073, "t": 464.93521, "r": 545.11505, "b": 473.84177, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "transformer encoder, and the tokenized input of the", "bbox": {"l": 308.86197, "t": 476.8902, "r": 514.17126, "b": 485.79675, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "HTML", "bbox": {"l": 516.89105, "t": 476.8902, "r": 545.11511, "b": 485.79675, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": "ground-truth tags. Using a stack of multi-head attention", "bbox": {"l": 308.86197, "t": 488.84518, "r": 527.63068, "b": 497.75174, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "lay-", "bbox": {"l": 529.62317, "t": 488.84518, "r": 545.11499, "b": 497.75174, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "ers, different aspects of the tag sequence could be", "bbox": {"l": 308.86197, "t": 500.80017, "r": 508.3630999999999, "b": 509.70673, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": "inferred.", "bbox": {"l": 511.09286000000003, "t": 500.80017, "r": 545.11511, "b": 509.70673, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "This is achieved by each attention head on a layer operating", "bbox": {"l": 308.86197, "t": 512.7551599999999, "r": 545.11499, "b": 521.6617100000001, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "in a different subspace, and then combining altogether their", "bbox": {"l": 308.86197, "t": 524.71115, "r": 545.11511, "b": 533.61771, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "attention score.", "bbox": {"l": 308.86197, "t": 536.66615, "r": 369.73349, "b": 545.57271, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The transformer encoder receives an encoded image from the CNN Backbone Network and refines it through a multi-head dot-product attention layer, followed by a Feed Forward Network. During training, the transformer decoder receives as input the output feature produced by the transformer encoder, and the tokenized input of the HTML ground-truth tags. Using a stack of multi-head attention layers, different aspects of the tag sequence could be inferred. This is achieved by each attention head on a layer operating in a different subspace, and then combining altogether their attention score."}, {"label": "text", "id": 0, "page_no": 4, "cluster": {"id": 0, "label": "text", "bbox": {"l": 308.86194, "t": 548.6046, "r": 545.11511, "b": 653.27271, "coord_origin": "TOPLEFT"}, "confidence": 0.9869195818901062, "cells": [{"id": 192, "text": "Cell BBox Decoder.", "bbox": {"l": 320.81696, "t": 548.6046, "r": 404.76184, "b": 557.56097, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "Our architecture allows to simul-", "bbox": {"l": 410.34094, "t": 548.72415, "r": 545.11505, "b": 557.63071, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "taneously predict HTML tags and bounding boxes for each", "bbox": {"l": 308.86194, "t": 560.68015, "r": 545.11493, "b": 569.5867000000001, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "table cell without the need of a separate object detector end", "bbox": {"l": 308.86194, "t": 572.6351500000001, "r": 545.11511, "b": 581.5417, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "to end. This approach is inspired by DETR [1] which em-", "bbox": {"l": 308.86194, "t": 584.59015, "r": 545.11493, "b": 593.4967, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "ploys a Transformer Encoder, and Decoder that looks for", "bbox": {"l": 308.86194, "t": 596.54515, "r": 545.11499, "b": 605.45171, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "a specific number of object queries (potential object detec-", "bbox": {"l": 308.86194, "t": 608.50015, "r": 545.11505, "b": 617.40671, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "tions). As our model utilizes a transformer architecture, the", "bbox": {"l": 308.86194, "t": 620.45515, "r": 545.11505, "b": 629.36171, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "hidden state of the", "bbox": {"l": 308.86194, "t": 632.41115, "r": 381.67859, "b": 641.3177000000001, "coord_origin": "TOPLEFT"}}, {"id": 201, "text": "<", "bbox": {"l": 383.99695, "t": 632.25174, "r": 391.74585, "b": 641.09853, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": "td", "bbox": {"l": 391.74594, "t": 632.41115, "r": 399.49686, "b": 641.3177000000001, "coord_origin": "TOPLEFT"}}, {"id": 203, "text": ">", "bbox": {"l": 399.49695, "t": 632.25174, "r": 407.24585, "b": 641.09853, "coord_origin": "TOPLEFT"}}, {"id": 204, "text": "\u2019 and \u2018", "bbox": {"l": 407.24594, "t": 632.41115, "r": 432.90958, "b": 641.3177000000001, "coord_origin": "TOPLEFT"}}, {"id": 205, "text": "<", "bbox": {"l": 432.90792999999996, "t": 632.25174, "r": 440.65683000000007, "b": 641.09853, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": "\u2019 HTML structure tags be-", "bbox": {"l": 440.65691999999996, "t": 632.41115, "r": 545.11475, "b": 641.3177000000001, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": "come the object query.", "bbox": {"l": 308.86194, "t": 644.3661500000001, "r": 398.96371, "b": 653.27271, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Cell BBox Decoder. Our architecture allows to simultaneously predict HTML tags and bounding boxes for each table cell without the need of a separate object detector end to end. This approach is inspired by DETR [1] which employs a Transformer Encoder, and Decoder that looks for a specific number of object queries (potential object detections). As our model utilizes a transformer architecture, the hidden state of the < td > ' and ' < ' HTML structure tags become the object query."}, {"label": "text", "id": 2, "page_no": 4, "cluster": {"id": 2, "label": "text", "bbox": {"l": 308.86194, "t": 656.42516, "r": 545.11505, "b": 713.151726, "coord_origin": "TOPLEFT"}, "confidence": 0.9852352142333984, "cells": [{"id": 208, "text": "The encoding generated by the", "bbox": {"l": 320.81693, "t": 656.42516, "r": 444.34316999999993, "b": 665.33172, "coord_origin": "TOPLEFT"}}, {"id": 209, "text": "CNN Backbone Network", "bbox": {"l": 447.00591999999995, "t": 656.51482, "r": 545.1076, "b": 665.10258, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": "along with the features acquired for every data cell from the", "bbox": {"l": 308.86194, "t": 668.38016, "r": 545.11505, "b": 677.2867200000001, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "Transformer Decoder are then passed to the attention net-", "bbox": {"l": 308.86194, "t": 680.33516, "r": 545.11505, "b": 689.24172, "coord_origin": "TOPLEFT"}}, {"id": 212, "text": "work. The attention network takes both inputs and learns to", "bbox": {"l": 308.86194, "t": 692.290161, "r": 545.11505, "b": 701.196724, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "provide an attention weighted encoding. This weighted at-", "bbox": {"l": 308.86194, "t": 704.245163, "r": 545.11505, "b": 713.151726, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The encoding generated by the CNN Backbone Network along with the features acquired for every data cell from the Transformer Decoder are then passed to the attention network. The attention network takes both inputs and learns to provide an attention weighted encoding. This weighted at-"}], "headers": [{"label": "page_footer", "id": 9, "page_no": 4, "cluster": {"id": 9, "label": "page_footer", "bbox": {"l": 295.12094, "t": 734.13316, "r": 300.10223, "b": 743.039722, "coord_origin": "TOPLEFT"}, "confidence": 0.8719564080238342, "cells": [{"id": 214, "text": "5", "bbox": {"l": 295.12094, "t": 734.13316, "r": 300.10223, "b": 743.039722, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5"}]}}, {"page_no": 5, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "tention encoding is then multiplied to the encoded image to", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 286.36514, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "produce a feature for each table cell. Notice that this is dif-", "bbox": {"l": 50.112, "t": 87.16339000000005, "r": 286.36508, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "ferent than the typical object detection problem where im-", "bbox": {"l": 50.112, "t": 99.11841000000004, "r": 286.36508, "b": 108.02495999999985, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "balances between the number of detections and the amount", "bbox": {"l": 50.112, "t": 111.07343000000003, "r": 286.36508, "b": 119.97997999999984, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "of objects may exist. In our case, we know up front that", "bbox": {"l": 50.112, "t": 123.02844000000005, "r": 286.36508, "b": 131.93499999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "the produced detections always match with the table cells", "bbox": {"l": 50.112, "t": 134.98443999999995, "r": 286.36514, "b": 143.89099, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "in number and correspondence.", "bbox": {"l": 50.112, "t": 146.93944999999997, "r": 175.16254, "b": 155.84600999999998, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "The output features for each table cell are then fed", "bbox": {"l": 62.067001, "t": 159.62445000000002, "r": 286.36496, "b": 168.53101000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "into the feed-forward network (FFN). The FFN consists", "bbox": {"l": 50.112, "t": 171.58043999999995, "r": 286.36511, "b": 180.48699999999997, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "of a Multi-Layer Perceptron (3 layers with ReLU activa-", "bbox": {"l": 50.112, "t": 183.53545999999994, "r": 286.36511, "b": 192.44201999999996, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "tion function) that predicts the normalized coordinates for", "bbox": {"l": 50.112, "t": 195.49048000000005, "r": 286.36511, "b": 204.39702999999997, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "the bounding box of each table cell. Finally, the predicted", "bbox": {"l": 50.112, "t": 207.44550000000004, "r": 286.36511, "b": 216.35204999999996, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "bounding boxes are classified based on whether they are", "bbox": {"l": 50.112, "t": 219.40051000000005, "r": 286.36511, "b": 228.30706999999995, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "empty or not using a linear layer.", "bbox": {"l": 50.112, "t": 231.35650999999996, "r": 181.54855, "b": 240.26306, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Loss Functions.", "bbox": {"l": 62.067001, "t": 243.92193999999995, "r": 129.21492, "b": 252.87829999999997, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "We formulate a multi-task loss Eq. 2", "bbox": {"l": 134.451, "t": 244.04150000000004, "r": 286.36078, "b": 252.94806000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "to train our network. The Cross-Entropy loss (denoted as", "bbox": {"l": 50.112007, "t": 255.99652000000003, "r": 286.36511, "b": 264.90308000000005, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "l$_{s}$", "bbox": {"l": 50.112007, "t": 267.79309, "r": 56.84528, "b": 276.63989000000004, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": ") is used to train the", "bbox": {"l": 57.343006, "t": 267.95250999999996, "r": 135.39996, "b": 276.85907, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Structure Decoder", "bbox": {"l": 137.735, "t": 268.04218000000003, "r": 211.07965, "b": 276.62994000000003, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "which predicts the", "bbox": {"l": 213.63699, "t": 267.95250999999996, "r": 286.36395, "b": 276.85907, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "structure tokens. As for the", "bbox": {"l": 50.112, "t": 279.90747, "r": 158.82388, "b": 288.81406, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "Cell BBox Decoder", "bbox": {"l": 161.31799, "t": 279.99712999999997, "r": 238.79712, "b": 288.58493, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "it is trained", "bbox": {"l": 241.521, "t": 279.90747, "r": 286.36264, "b": 288.81406, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "with a combination of losses denoted as", "bbox": {"l": 50.112, "t": 291.86249, "r": 211.3766, "b": 300.76904, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "l$_{box}$", "bbox": {"l": 214.271, "t": 291.70309, "r": 229.19780000000003, "b": 300.54987, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": ".", "bbox": {"l": 229.696, "t": 291.86249, "r": 232.18665000000001, "b": 300.76904, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "l$_{box}$", "bbox": {"l": 236.49001, "t": 291.70309, "r": 251.41681000000003, "b": 300.54987, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "consists", "bbox": {"l": 254.81099999999998, "t": 291.86249, "r": 286.36255, "b": 300.76904, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "of the generally used", "bbox": {"l": 50.112, "t": 303.81747, "r": 137.45412, "b": 312.72403, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "l$_{1}$", "bbox": {"l": 141.298, "t": 303.65808, "r": 148.24258, "b": 312.50485, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "loss for object detection and the", "bbox": {"l": 152.58601, "t": 303.81747, "r": 286.36377, "b": 312.72403, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "IoU loss (", "bbox": {"l": 50.112015, "t": 315.77245999999997, "r": 89.683464, "b": 324.67902, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "l$_{iou}$", "bbox": {"l": 89.68602, "t": 315.61307, "r": 104.12046, "b": 324.45984, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": ") to be scale invariant as explained in [25]. In", "bbox": {"l": 104.61802, "t": 315.77245999999997, "r": 286.36572, "b": 324.67902, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "comparison to DETR, we do not use the Hungarian algo-", "bbox": {"l": 50.112019, "t": 327.72845, "r": 286.36511, "b": 336.6350100000001, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "rithm [15] to match the predicted bounding boxes with the", "bbox": {"l": 50.112019, "t": 339.68344, "r": 286.36508, "b": 348.59, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "ground-truth boxes, as we have already achieved a one-to-", "bbox": {"l": 50.112019, "t": 351.63843, "r": 286.36511, "b": 360.54498, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "one match through two steps: 1) Our token input sequence", "bbox": {"l": 50.112019, "t": 363.59341, "r": 286.36508, "b": 372.49996999999996, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "is naturally ordered, therefore the hidden states of the table", "bbox": {"l": 50.112019, "t": 375.5484, "r": 286.36511, "b": 384.45496, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "data cells are also in order when they are provided as in-", "bbox": {"l": 50.112019, "t": 387.50339, "r": 286.36514, "b": 396.40994, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "put to the", "bbox": {"l": 50.112019, "t": 399.45938, "r": 88.68721, "b": 408.36594, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "Cell BBox Decoder", "bbox": {"l": 91.646019, "t": 399.54904, "r": 170.0517, "b": 408.13681, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": ", and 2) Our bounding boxes", "bbox": {"l": 170.05103, "t": 399.45938, "r": 286.36438, "b": 408.36594, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "generation mechanism (see Sec.", "bbox": {"l": 50.112022, "t": 411.41437, "r": 181.96703, "b": 420.32092, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "3)", "bbox": {"l": 189.09029, "t": 411.41437, "r": 197.74918, "b": 420.32092, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "ensures a one-to-one", "bbox": {"l": 200.34789, "t": 411.41437, "r": 286.36511, "b": 420.32092, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "mapping between the cell content and its bounding box for", "bbox": {"l": 50.112022, "t": 423.36934999999994, "r": 286.36511, "b": 432.27591, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "all post-processed datasets.", "bbox": {"l": 50.112022, "t": 435.32434, "r": 158.2959, "b": 444.2309, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "The loss used to train the TableFormer can be defined as", "bbox": {"l": 62.067024, "t": 448.01035, "r": 286.36499, "b": 456.9169, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "following:", "bbox": {"l": 50.112022, "t": 459.96533, "r": 91.377113, "b": 468.87189, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "l$_{box}$", "bbox": {"l": 125.71502, "t": 493.28094, "r": 140.64182, "b": 502.12772, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "=", "bbox": {"l": 143.90701, "t": 493.28094, "r": 151.65593, "b": 502.12772, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "\u03bb$_{iou}$l$_{iou}$", "bbox": {"l": 154.42302, "t": 493.28094, "r": 186.62846, "b": 502.12772, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "+", "bbox": {"l": 189.34003, "t": 493.28094, "r": 197.08894, "b": 502.12772, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "\u03bb$_{l}$$_{1}$", "bbox": {"l": 199.30302, "t": 493.28094, "r": 211.64659, "b": 502.12772, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "l", "bbox": {"l": 124.33002, "t": 508.22495, "r": 127.30286, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "=", "bbox": {"l": 130.26602, "t": 508.22495, "r": 138.01494, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "\u03bbl$_{s}$", "bbox": {"l": 140.78203, "t": 508.22495, "r": 153.32629, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "+ (1", "bbox": {"l": 156.03903, "t": 508.22495, "r": 174.85541, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "\u2212", "bbox": {"l": 177.07103, "t": 507.66702, "r": 184.81995, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "\u03bb", "bbox": {"l": 187.03304, "t": 508.22495, "r": 192.84422, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": ")", "bbox": {"l": 192.84503, "t": 508.22495, "r": 196.71948, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "l$_{box}$", "bbox": {"l": 196.71902, "t": 508.22495, "r": 211.64583, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "(1)", "bbox": {"l": 274.74603, "t": 501.01132, "r": 286.36243, "b": 509.91788, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "where", "bbox": {"l": 50.11203, "t": 531.30933, "r": 74.450661, "b": 540.21588, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "\u03bb", "bbox": {"l": 76.941032, "t": 531.14993, "r": 82.75222, "b": 539.9967, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "\u2208", "bbox": {"l": 85.520035, "t": 530.5920100000001, "r": 92.162102, "b": 539.9967, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "[0, 1], and", "bbox": {"l": 94.653038, "t": 531.30933, "r": 135.59932, "b": 540.21588, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "\u03bb$_{iou}$, \u03bb$_{l}$$_{1}$", "bbox": {"l": 138.09004, "t": 531.14993, "r": 172.63162, "b": 539.9967, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "\u2208$_{R}$", "bbox": {"l": 175.89705, "t": 530.5920100000001, "r": 192.50104, "b": 539.9967, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "are hyper-parameters.", "bbox": {"l": 194.99205, "t": 531.30933, "r": 281.59692, "b": 540.21588, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "5.", "bbox": {"l": 50.112045, "t": 555.91689, "r": 57.92831799999999, "b": 566.66461, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "Experimental Results", "bbox": {"l": 68.350014, "t": 555.91689, "r": 171.98335, "b": 566.66461, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "5.1.", "bbox": {"l": 50.112045, "t": 576.26433, "r": 64.693237, "b": 586.1163799999999, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "Implementation Details", "bbox": {"l": 74.414032, "t": 576.26433, "r": 179.17502, "b": 586.1163799999999, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "TableFormer uses ResNet-18 as the", "bbox": {"l": 62.067047, "t": 595.73433, "r": 202.97806, "b": 604.64088, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "CNN Backbone Net-", "bbox": {"l": 205.38405, "t": 595.82399, "r": 286.36008, "b": 604.41174, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "work", "bbox": {"l": 50.112045, "t": 607.77899, "r": 70.037247, "b": 616.3667399999999, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": ". The input images are resized to 448*448 pixels and", "bbox": {"l": 70.037048, "t": 607.68933, "r": 286.36496, "b": 616.59589, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "the feature map has a dimension of 28*28. Additionally, we", "bbox": {"l": 50.112049, "t": 619.64433, "r": 286.36517, "b": 628.55089, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "enforce the following input constraints:", "bbox": {"l": 50.112049, "t": 631.60033, "r": 207.03294, "b": 640.50688, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "Image width and height", "bbox": {"l": 91.661049, "t": 654.54532, "r": 186.01683, "b": 663.45187, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "\u2264", "bbox": {"l": 188.50705, "t": 653.828, "r": 196.25597, "b": 663.2327, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "1024 pixels", "bbox": {"l": 198.74605, "t": 654.54532, "r": 244.81310999999997, "b": 663.45187, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "Structural tags length", "bbox": {"l": 101.01604, "t": 669.48932, "r": 186.24606, "b": 678.39588, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "\u2264", "bbox": {"l": 188.73605, "t": 668.77201, "r": 196.48497, "b": 678.1767, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "512 tokens.", "bbox": {"l": 198.97505, "t": 669.48932, "r": 244.81296999999998, "b": 678.39588, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "(2)", "bbox": {"l": 274.74606, "t": 662.11731, "r": 286.36246, "b": 671.02388, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "Although input constraints are used also by other methods,", "bbox": {"l": 50.112061, "t": 692.290314, "r": 286.36514, "b": 701.196877, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "such as EDD, ours are less restrictive due to the improved", "bbox": {"l": 50.112061, "t": 704.245316, "r": 286.36514, "b": 713.151878, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "runtime performance and lower memory footprint of Table-", "bbox": {"l": 308.86206, "t": 75.20830999999998, "r": 545.11523, "b": 84.11487, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Former.", "bbox": {"l": 308.86206, "t": 87.16332999999997, "r": 339.98523, "b": 96.06988999999999, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "This allows to utilize input samples with longer", "bbox": {"l": 346.88931, "t": 87.16332999999997, "r": 545.11523, "b": 96.06988999999999, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "sequences and images with larger dimensions.", "bbox": {"l": 308.86206, "t": 99.11835000000008, "r": 492.96097, "b": 108.0249, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "The Transformer Encoder consists of two \u201cTransformer", "bbox": {"l": 320.81705, "t": 116.22937000000002, "r": 545.11499, "b": 125.13593000000003, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "Encoder Layers\u201d, with an input feature size of 512, feed", "bbox": {"l": 308.86206, "t": 128.18439, "r": 545.11517, "b": 137.09094000000005, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "forward network of 1024, and 4 attention heads. As for the", "bbox": {"l": 308.86206, "t": 140.13940000000002, "r": 545.11505, "b": 149.04596000000004, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "Transformer Decoder it is composed of four \u201cTransformer", "bbox": {"l": 308.86206, "t": 152.09442, "r": 545.11511, "b": 161.00098000000003, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "Decoder Layers\u201d with similar input and output dimensions", "bbox": {"l": 308.86206, "t": 164.04944, "r": 545.11517, "b": 172.95599000000004, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "as the \u201cTransformer Encoder Layers\u201d.", "bbox": {"l": 308.86206, "t": 176.00543000000005, "r": 467.21756000000005, "b": 184.91198999999995, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "Even though our", "bbox": {"l": 475.43671, "t": 176.00543000000005, "r": 545.11511, "b": 184.91198999999995, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "model uses fewer layers and heads than the default imple-", "bbox": {"l": 308.86206, "t": 187.96045000000004, "r": 545.11511, "b": 196.86699999999996, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "mentation parameters, our extensive experimentation has", "bbox": {"l": 308.86206, "t": 199.91547000000003, "r": 545.11511, "b": 208.82201999999995, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "proved this setup to be more suitable for table images. We", "bbox": {"l": 308.86206, "t": 211.87048000000004, "r": 545.11517, "b": 220.77704000000006, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "attribute this finding to the inherent design of table im-", "bbox": {"l": 308.86206, "t": 223.82550000000003, "r": 545.11511, "b": 232.73206000000005, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "ages, which contain mostly lines and text, unlike the more", "bbox": {"l": 308.86206, "t": 235.78052000000002, "r": 545.11511, "b": 244.68706999999995, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "elaborate content present in other scopes (e.g. the COCO", "bbox": {"l": 308.86206, "t": 247.73650999999995, "r": 545.11523, "b": 256.64306999999997, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "dataset).", "bbox": {"l": 308.86206, "t": 259.69152999999994, "r": 342.3364, "b": 268.59808, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "Moreover, we have added ResNet blocks to the", "bbox": {"l": 348.95157, "t": 259.69152999999994, "r": 545.11517, "b": 268.59808, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "inputs of the Structure Decoder and Cell BBox Decoder.", "bbox": {"l": 308.86206, "t": 271.64655000000005, "r": 545.11517, "b": 280.55310000000003, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "This prevents a decoder having a stronger influence over the", "bbox": {"l": 308.86206, "t": 283.6015300000001, "r": 545.1153, "b": 292.50809, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "learned weights which would damage the other prediction", "bbox": {"l": 308.86206, "t": 295.55652, "r": 545.11511, "b": 304.46307, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "task (structure vs bounding boxes), but learn task specific", "bbox": {"l": 308.86206, "t": 307.51151, "r": 545.11511, "b": 316.41806, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "weights instead. Lastly our dropout layers are set to 0.5.", "bbox": {"l": 308.86206, "t": 319.4674999999999, "r": 532.48267, "b": 328.37405, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "For training, TableFormer is trained with 3 Adam opti-", "bbox": {"l": 320.81705, "t": 336.57751, "r": 545.11499, "b": 345.48407000000003, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "mizers, each one for the", "bbox": {"l": 308.86206, "t": 348.5325000000001, "r": 403.7359, "b": 357.43906, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "CNN Backbone Network", "bbox": {"l": 406.07605, "t": 348.62216, "r": 503.54016, "b": 357.20993, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": ",", "bbox": {"l": 503.53906, "t": 348.5325000000001, "r": 506.02972, "b": 357.43906, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "Structure", "bbox": {"l": 508.40004999999996, "t": 348.62216, "r": 545.11224, "b": 357.20993, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "Decoder", "bbox": {"l": 308.86206, "t": 360.57715, "r": 343.1633, "b": 369.16492000000005, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": ", and", "bbox": {"l": 343.16306, "t": 360.48749, "r": 362.2016, "b": 369.39404, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Cell BBox Decoder", "bbox": {"l": 364.28604, "t": 360.57715, "r": 440.93829, "b": 369.16492000000005, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": ". Taking the PubTabNet as", "bbox": {"l": 440.93903, "t": 360.48749, "r": 545.10797, "b": 369.39404, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "an example for our parameter set up, the initializing learn-", "bbox": {"l": 308.86203, "t": 372.44247, "r": 545.11511, "b": 381.34903, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "ing rate is 0.001 for 12 epochs with a batch size of 24, and", "bbox": {"l": 308.86203, "t": 384.3984699999999, "r": 545.11517, "b": 393.30502, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "\u03bb", "bbox": {"l": 308.86203, "t": 396.19406000000004, "r": 314.67322, "b": 405.04083, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "set to 0.5.", "bbox": {"l": 318.65802, "t": 396.35345, "r": 360.39139, "b": 405.2600100000001, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "Afterwards, we reduce the learning rate to", "bbox": {"l": 367.96295, "t": 396.35345, "r": 545.10803, "b": 405.2600100000001, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "0.0001, the batch size to 18 and train for 12 more epochs or", "bbox": {"l": 308.86203, "t": 408.30844, "r": 545.11511, "b": 417.215, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "convergence.", "bbox": {"l": 308.86203, "t": 420.26343, "r": 360.9664, "b": 429.16998, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "TableFormer is implemented with PyTorch and Torchvi-", "bbox": {"l": 320.81702, "t": 437.37441999999993, "r": 545.11499, "b": 446.28098, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "sion libraries [22].", "bbox": {"l": 308.86203, "t": 449.32941, "r": 384.62759, "b": 458.23596, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "To speed up the inference, the image", "bbox": {"l": 391.37228, "t": 449.32941, "r": 545.11511, "b": 458.23596, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "undergoes a single forward pass through the", "bbox": {"l": 308.86203, "t": 461.28439, "r": 494.00693000000007, "b": 470.19095, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "CNN Back-", "bbox": {"l": 498.07803, "t": 461.37405, "r": 545.11145, "b": 469.96182, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "bone Network", "bbox": {"l": 308.86203, "t": 473.32904, "r": 364.44336, "b": 481.91681, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "and transformer encoder. This eliminates the", "bbox": {"l": 367.06104, "t": 473.23938, "r": 545.11267, "b": 482.14594, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "overhead of generating the same features for each decoding", "bbox": {"l": 308.86203, "t": 485.19437, "r": 545.11511, "b": 494.10092, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "step. Similarly, we employ a \u2019caching\u2019 technique to preform", "bbox": {"l": 308.86203, "t": 497.14935, "r": 545.11523, "b": 506.05591, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "faster autoregressive decoding. This is achieved by storing", "bbox": {"l": 308.86203, "t": 509.10535, "r": 545.11511, "b": 518.0119, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "the features of decoded tokens so we can reuse them for", "bbox": {"l": 308.86203, "t": 521.06033, "r": 545.11517, "b": 529.9668899999999, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "each time step. Therefore, we only compute the attention", "bbox": {"l": 308.86203, "t": 533.01532, "r": 545.11517, "b": 541.9218900000001, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "for each new tag.", "bbox": {"l": 308.86203, "t": 544.97034, "r": 377.21548, "b": 553.87689, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "5.2.", "bbox": {"l": 308.86203, "t": 579.55432, "r": 323.9046, "b": 589.40637, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "Generalization", "bbox": {"l": 333.93301, "t": 579.55432, "r": 397.44281, "b": 589.40637, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "TableFormer is evaluated on three major publicly avail-", "bbox": {"l": 320.81702, "t": 603.44933, "r": 545.11493, "b": 612.3558800000001, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "able datasets of different nature to prove the generalization", "bbox": {"l": 308.86203, "t": 615.40433, "r": 545.11511, "b": 624.31088, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "and effectiveness of our model. The datasets used for eval-", "bbox": {"l": 308.86203, "t": 627.35933, "r": 545.11517, "b": 636.26588, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "uation are the PubTabNet, FinTabNet and TableBank which", "bbox": {"l": 308.86203, "t": 639.31433, "r": 545.11511, "b": 648.22089, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "stem from the scientific, financial and general domains re-", "bbox": {"l": 308.86203, "t": 651.27032, "r": 545.11517, "b": 660.17688, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "spectively.", "bbox": {"l": 308.86203, "t": 663.22533, "r": 350.70493, "b": 672.13189, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "We also share our baseline results on the challenging", "bbox": {"l": 320.81702, "t": 680.33533, "r": 545.11505, "b": 689.24189, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "SynthTabNet dataset.", "bbox": {"l": 308.86203, "t": 692.290329, "r": 396.21411, "b": 701.196892, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "Throughout our experiments, the", "bbox": {"l": 406.40585, "t": 692.290329, "r": 545.11523, "b": 701.196892, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "same parameters stated in Sec. 5.1 are utilized.", "bbox": {"l": 308.86203, "t": 704.246323, "r": 495.93982, "b": 713.152893, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "6", "bbox": {"l": 295.12103, "t": 734.133327, "r": 300.10233, "b": 743.03989, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 5, "label": "text", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 286.36514, "b": 155.84600999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.9868090152740479, "cells": [{"id": 0, "text": "tention encoding is then multiplied to the encoded image to", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 286.36514, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "produce a feature for each table cell. Notice that this is dif-", "bbox": {"l": 50.112, "t": 87.16339000000005, "r": 286.36508, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "ferent than the typical object detection problem where im-", "bbox": {"l": 50.112, "t": 99.11841000000004, "r": 286.36508, "b": 108.02495999999985, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "balances between the number of detections and the amount", "bbox": {"l": 50.112, "t": 111.07343000000003, "r": 286.36508, "b": 119.97997999999984, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "of objects may exist. In our case, we know up front that", "bbox": {"l": 50.112, "t": 123.02844000000005, "r": 286.36508, "b": 131.93499999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "the produced detections always match with the table cells", "bbox": {"l": 50.112, "t": 134.98443999999995, "r": 286.36514, "b": 143.89099, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "in number and correspondence.", "bbox": {"l": 50.112, "t": 146.93944999999997, "r": 175.16254, "b": 155.84600999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "text", "bbox": {"l": 50.112, "t": 159.62445000000002, "r": 286.36511, "b": 240.26306, "coord_origin": "TOPLEFT"}, "confidence": 0.9860327839851379, "cells": [{"id": 7, "text": "The output features for each table cell are then fed", "bbox": {"l": 62.067001, "t": 159.62445000000002, "r": 286.36496, "b": 168.53101000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "into the feed-forward network (FFN). The FFN consists", "bbox": {"l": 50.112, "t": 171.58043999999995, "r": 286.36511, "b": 180.48699999999997, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "of a Multi-Layer Perceptron (3 layers with ReLU activa-", "bbox": {"l": 50.112, "t": 183.53545999999994, "r": 286.36511, "b": 192.44201999999996, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "tion function) that predicts the normalized coordinates for", "bbox": {"l": 50.112, "t": 195.49048000000005, "r": 286.36511, "b": 204.39702999999997, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "the bounding box of each table cell. Finally, the predicted", "bbox": {"l": 50.112, "t": 207.44550000000004, "r": 286.36511, "b": 216.35204999999996, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "bounding boxes are classified based on whether they are", "bbox": {"l": 50.112, "t": 219.40051000000005, "r": 286.36511, "b": 228.30706999999995, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "empty or not using a linear layer.", "bbox": {"l": 50.112, "t": 231.35650999999996, "r": 181.54855, "b": 240.26306, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "text", "bbox": {"l": 50.112, "t": 243.92193999999995, "r": 286.36572, "b": 444.2309, "coord_origin": "TOPLEFT"}, "confidence": 0.9873637557029724, "cells": [{"id": 14, "text": "Loss Functions.", "bbox": {"l": 62.067001, "t": 243.92193999999995, "r": 129.21492, "b": 252.87829999999997, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "We formulate a multi-task loss Eq. 2", "bbox": {"l": 134.451, "t": 244.04150000000004, "r": 286.36078, "b": 252.94806000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "to train our network. The Cross-Entropy loss (denoted as", "bbox": {"l": 50.112007, "t": 255.99652000000003, "r": 286.36511, "b": 264.90308000000005, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "l$_{s}$", "bbox": {"l": 50.112007, "t": 267.79309, "r": 56.84528, "b": 276.63989000000004, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": ") is used to train the", "bbox": {"l": 57.343006, "t": 267.95250999999996, "r": 135.39996, "b": 276.85907, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Structure Decoder", "bbox": {"l": 137.735, "t": 268.04218000000003, "r": 211.07965, "b": 276.62994000000003, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "which predicts the", "bbox": {"l": 213.63699, "t": 267.95250999999996, "r": 286.36395, "b": 276.85907, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "structure tokens. As for the", "bbox": {"l": 50.112, "t": 279.90747, "r": 158.82388, "b": 288.81406, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "Cell BBox Decoder", "bbox": {"l": 161.31799, "t": 279.99712999999997, "r": 238.79712, "b": 288.58493, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "it is trained", "bbox": {"l": 241.521, "t": 279.90747, "r": 286.36264, "b": 288.81406, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "with a combination of losses denoted as", "bbox": {"l": 50.112, "t": 291.86249, "r": 211.3766, "b": 300.76904, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "l$_{box}$", "bbox": {"l": 214.271, "t": 291.70309, "r": 229.19780000000003, "b": 300.54987, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": ".", "bbox": {"l": 229.696, "t": 291.86249, "r": 232.18665000000001, "b": 300.76904, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "l$_{box}$", "bbox": {"l": 236.49001, "t": 291.70309, "r": 251.41681000000003, "b": 300.54987, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "consists", "bbox": {"l": 254.81099999999998, "t": 291.86249, "r": 286.36255, "b": 300.76904, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "of the generally used", "bbox": {"l": 50.112, "t": 303.81747, "r": 137.45412, "b": 312.72403, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "l$_{1}$", "bbox": {"l": 141.298, "t": 303.65808, "r": 148.24258, "b": 312.50485, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "loss for object detection and the", "bbox": {"l": 152.58601, "t": 303.81747, "r": 286.36377, "b": 312.72403, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "IoU loss (", "bbox": {"l": 50.112015, "t": 315.77245999999997, "r": 89.683464, "b": 324.67902, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "l$_{iou}$", "bbox": {"l": 89.68602, "t": 315.61307, "r": 104.12046, "b": 324.45984, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": ") to be scale invariant as explained in [25]. In", "bbox": {"l": 104.61802, "t": 315.77245999999997, "r": 286.36572, "b": 324.67902, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "comparison to DETR, we do not use the Hungarian algo-", "bbox": {"l": 50.112019, "t": 327.72845, "r": 286.36511, "b": 336.6350100000001, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "rithm [15] to match the predicted bounding boxes with the", "bbox": {"l": 50.112019, "t": 339.68344, "r": 286.36508, "b": 348.59, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "ground-truth boxes, as we have already achieved a one-to-", "bbox": {"l": 50.112019, "t": 351.63843, "r": 286.36511, "b": 360.54498, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "one match through two steps: 1) Our token input sequence", "bbox": {"l": 50.112019, "t": 363.59341, "r": 286.36508, "b": 372.49996999999996, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "is naturally ordered, therefore the hidden states of the table", "bbox": {"l": 50.112019, "t": 375.5484, "r": 286.36511, "b": 384.45496, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "data cells are also in order when they are provided as in-", "bbox": {"l": 50.112019, "t": 387.50339, "r": 286.36514, "b": 396.40994, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "put to the", "bbox": {"l": 50.112019, "t": 399.45938, "r": 88.68721, "b": 408.36594, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "Cell BBox Decoder", "bbox": {"l": 91.646019, "t": 399.54904, "r": 170.0517, "b": 408.13681, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": ", and 2) Our bounding boxes", "bbox": {"l": 170.05103, "t": 399.45938, "r": 286.36438, "b": 408.36594, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "generation mechanism (see Sec.", "bbox": {"l": 50.112022, "t": 411.41437, "r": 181.96703, "b": 420.32092, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "3)", "bbox": {"l": 189.09029, "t": 411.41437, "r": 197.74918, "b": 420.32092, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "ensures a one-to-one", "bbox": {"l": 200.34789, "t": 411.41437, "r": 286.36511, "b": 420.32092, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "mapping between the cell content and its bounding box for", "bbox": {"l": 50.112022, "t": 423.36934999999994, "r": 286.36511, "b": 432.27591, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "all post-processed datasets.", "bbox": {"l": 50.112022, "t": 435.32434, "r": 158.2959, "b": 444.2309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 50.112022, "t": 448.01035, "r": 286.36499, "b": 468.87189, "coord_origin": "TOPLEFT"}, "confidence": 0.9724196195602417, "cells": [{"id": 49, "text": "The loss used to train the TableFormer can be defined as", "bbox": {"l": 62.067024, "t": 448.01035, "r": 286.36499, "b": 456.9169, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "following:", "bbox": {"l": 50.112022, "t": 459.96533, "r": 91.377113, "b": 468.87189, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "formula", "bbox": {"l": 124.33002, "t": 493.28094, "r": 286.36243, "b": 517.07172, "coord_origin": "TOPLEFT"}, "confidence": 0.9423348307609558, "cells": [{"id": 51, "text": "l$_{box}$", "bbox": {"l": 125.71502, "t": 493.28094, "r": 140.64182, "b": 502.12772, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "=", "bbox": {"l": 143.90701, "t": 493.28094, "r": 151.65593, "b": 502.12772, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "\u03bb$_{iou}$l$_{iou}$", "bbox": {"l": 154.42302, "t": 493.28094, "r": 186.62846, "b": 502.12772, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "+", "bbox": {"l": 189.34003, "t": 493.28094, "r": 197.08894, "b": 502.12772, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "\u03bb$_{l}$$_{1}$", "bbox": {"l": 199.30302, "t": 493.28094, "r": 211.64659, "b": 502.12772, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "l", "bbox": {"l": 124.33002, "t": 508.22495, "r": 127.30286, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "=", "bbox": {"l": 130.26602, "t": 508.22495, "r": 138.01494, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "\u03bbl$_{s}$", "bbox": {"l": 140.78203, "t": 508.22495, "r": 153.32629, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "+ (1", "bbox": {"l": 156.03903, "t": 508.22495, "r": 174.85541, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "\u2212", "bbox": {"l": 177.07103, "t": 507.66702, "r": 184.81995, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "\u03bb", "bbox": {"l": 187.03304, "t": 508.22495, "r": 192.84422, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": ")", "bbox": {"l": 192.84503, "t": 508.22495, "r": 196.71948, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "l$_{box}$", "bbox": {"l": 196.71902, "t": 508.22495, "r": 211.64583, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "(1)", "bbox": {"l": 274.74603, "t": 501.01132, "r": 286.36243, "b": 509.91788, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 50.11203, "t": 530.5920100000001, "r": 281.59692, "b": 540.21588, "coord_origin": "TOPLEFT"}, "confidence": 0.9363929629325867, "cells": [{"id": 65, "text": "where", "bbox": {"l": 50.11203, "t": 531.30933, "r": 74.450661, "b": 540.21588, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "\u03bb", "bbox": {"l": 76.941032, "t": 531.14993, "r": 82.75222, "b": 539.9967, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "\u2208", "bbox": {"l": 85.520035, "t": 530.5920100000001, "r": 92.162102, "b": 539.9967, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "[0, 1], and", "bbox": {"l": 94.653038, "t": 531.30933, "r": 135.59932, "b": 540.21588, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "\u03bb$_{iou}$, \u03bb$_{l}$$_{1}$", "bbox": {"l": 138.09004, "t": 531.14993, "r": 172.63162, "b": 539.9967, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "\u2208$_{R}$", "bbox": {"l": 175.89705, "t": 530.5920100000001, "r": 192.50104, "b": 539.9967, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "are hyper-parameters.", "bbox": {"l": 194.99205, "t": 531.30933, "r": 281.59692, "b": 540.21588, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "section_header", "bbox": {"l": 50.112045, "t": 555.91689, "r": 171.98335, "b": 566.66461, "coord_origin": "TOPLEFT"}, "confidence": 0.9554555416107178, "cells": [{"id": 72, "text": "5.", "bbox": {"l": 50.112045, "t": 555.91689, "r": 57.92831799999999, "b": 566.66461, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "Experimental Results", "bbox": {"l": 68.350014, "t": 555.91689, "r": 171.98335, "b": 566.66461, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "section_header", "bbox": {"l": 50.112045, "t": 576.26433, "r": 179.17502, "b": 586.1163799999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9538503289222717, "cells": [{"id": 74, "text": "5.1.", "bbox": {"l": 50.112045, "t": 576.26433, "r": 64.693237, "b": 586.1163799999999, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "Implementation Details", "bbox": {"l": 74.414032, "t": 576.26433, "r": 179.17502, "b": 586.1163799999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "text", "bbox": {"l": 50.112045, "t": 595.73433, "r": 286.36517, "b": 640.50688, "coord_origin": "TOPLEFT"}, "confidence": 0.9856163263320923, "cells": [{"id": 76, "text": "TableFormer uses ResNet-18 as the", "bbox": {"l": 62.067047, "t": 595.73433, "r": 202.97806, "b": 604.64088, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "CNN Backbone Net-", "bbox": {"l": 205.38405, "t": 595.82399, "r": 286.36008, "b": 604.41174, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "work", "bbox": {"l": 50.112045, "t": 607.77899, "r": 70.037247, "b": 616.3667399999999, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": ". The input images are resized to 448*448 pixels and", "bbox": {"l": 70.037048, "t": 607.68933, "r": 286.36496, "b": 616.59589, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "the feature map has a dimension of 28*28. Additionally, we", "bbox": {"l": 50.112049, "t": 619.64433, "r": 286.36517, "b": 628.55089, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "enforce the following input constraints:", "bbox": {"l": 50.112049, "t": 631.60033, "r": 207.03294, "b": 640.50688, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "formula", "bbox": {"l": 91.661049, "t": 653.828, "r": 286.36246, "b": 678.39588, "coord_origin": "TOPLEFT"}, "confidence": 0.844183623790741, "cells": [{"id": 82, "text": "Image width and height", "bbox": {"l": 91.661049, "t": 654.54532, "r": 186.01683, "b": 663.45187, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "\u2264", "bbox": {"l": 188.50705, "t": 653.828, "r": 196.25597, "b": 663.2327, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "1024 pixels", "bbox": {"l": 198.74605, "t": 654.54532, "r": 244.81310999999997, "b": 663.45187, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "Structural tags length", "bbox": {"l": 101.01604, "t": 669.48932, "r": 186.24606, "b": 678.39588, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "\u2264", "bbox": {"l": 188.73605, "t": 668.77201, "r": 196.48497, "b": 678.1767, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "512 tokens.", "bbox": {"l": 198.97505, "t": 669.48932, "r": 244.81296999999998, "b": 678.39588, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "(2)", "bbox": {"l": 274.74606, "t": 662.11731, "r": 286.36246, "b": 671.02388, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "text", "bbox": {"l": 50.112061, "t": 692.290314, "r": 286.36514, "b": 713.151878, "coord_origin": "TOPLEFT"}, "confidence": 0.9724979996681213, "cells": [{"id": 89, "text": "Although input constraints are used also by other methods,", "bbox": {"l": 50.112061, "t": 692.290314, "r": 286.36514, "b": 701.196877, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "such as EDD, ours are less restrictive due to the improved", "bbox": {"l": 50.112061, "t": 704.245316, "r": 286.36514, "b": 713.151878, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 308.86206, "t": 75.20830999999998, "r": 545.11523, "b": 108.0249, "coord_origin": "TOPLEFT"}, "confidence": 0.9799237847328186, "cells": [{"id": 91, "text": "runtime performance and lower memory footprint of Table-", "bbox": {"l": 308.86206, "t": 75.20830999999998, "r": 545.11523, "b": 84.11487, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Former.", "bbox": {"l": 308.86206, "t": 87.16332999999997, "r": 339.98523, "b": 96.06988999999999, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "This allows to utilize input samples with longer", "bbox": {"l": 346.88931, "t": 87.16332999999997, "r": 545.11523, "b": 96.06988999999999, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "sequences and images with larger dimensions.", "bbox": {"l": 308.86206, "t": 99.11835000000008, "r": 492.96097, "b": 108.0249, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 308.86206, "t": 116.22937000000002, "r": 545.1153, "b": 328.37405, "coord_origin": "TOPLEFT"}, "confidence": 0.9880930781364441, "cells": [{"id": 95, "text": "The Transformer Encoder consists of two \u201cTransformer", "bbox": {"l": 320.81705, "t": 116.22937000000002, "r": 545.11499, "b": 125.13593000000003, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "Encoder Layers\u201d, with an input feature size of 512, feed", "bbox": {"l": 308.86206, "t": 128.18439, "r": 545.11517, "b": 137.09094000000005, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "forward network of 1024, and 4 attention heads. As for the", "bbox": {"l": 308.86206, "t": 140.13940000000002, "r": 545.11505, "b": 149.04596000000004, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "Transformer Decoder it is composed of four \u201cTransformer", "bbox": {"l": 308.86206, "t": 152.09442, "r": 545.11511, "b": 161.00098000000003, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "Decoder Layers\u201d with similar input and output dimensions", "bbox": {"l": 308.86206, "t": 164.04944, "r": 545.11517, "b": 172.95599000000004, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "as the \u201cTransformer Encoder Layers\u201d.", "bbox": {"l": 308.86206, "t": 176.00543000000005, "r": 467.21756000000005, "b": 184.91198999999995, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "Even though our", "bbox": {"l": 475.43671, "t": 176.00543000000005, "r": 545.11511, "b": 184.91198999999995, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "model uses fewer layers and heads than the default imple-", "bbox": {"l": 308.86206, "t": 187.96045000000004, "r": 545.11511, "b": 196.86699999999996, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "mentation parameters, our extensive experimentation has", "bbox": {"l": 308.86206, "t": 199.91547000000003, "r": 545.11511, "b": 208.82201999999995, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "proved this setup to be more suitable for table images. We", "bbox": {"l": 308.86206, "t": 211.87048000000004, "r": 545.11517, "b": 220.77704000000006, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "attribute this finding to the inherent design of table im-", "bbox": {"l": 308.86206, "t": 223.82550000000003, "r": 545.11511, "b": 232.73206000000005, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "ages, which contain mostly lines and text, unlike the more", "bbox": {"l": 308.86206, "t": 235.78052000000002, "r": 545.11511, "b": 244.68706999999995, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "elaborate content present in other scopes (e.g. the COCO", "bbox": {"l": 308.86206, "t": 247.73650999999995, "r": 545.11523, "b": 256.64306999999997, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "dataset).", "bbox": {"l": 308.86206, "t": 259.69152999999994, "r": 342.3364, "b": 268.59808, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "Moreover, we have added ResNet blocks to the", "bbox": {"l": 348.95157, "t": 259.69152999999994, "r": 545.11517, "b": 268.59808, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "inputs of the Structure Decoder and Cell BBox Decoder.", "bbox": {"l": 308.86206, "t": 271.64655000000005, "r": 545.11517, "b": 280.55310000000003, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "This prevents a decoder having a stronger influence over the", "bbox": {"l": 308.86206, "t": 283.6015300000001, "r": 545.1153, "b": 292.50809, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "learned weights which would damage the other prediction", "bbox": {"l": 308.86206, "t": 295.55652, "r": 545.11511, "b": 304.46307, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "task (structure vs bounding boxes), but learn task specific", "bbox": {"l": 308.86206, "t": 307.51151, "r": 545.11511, "b": 316.41806, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "weights instead. Lastly our dropout layers are set to 0.5.", "bbox": {"l": 308.86206, "t": 319.4674999999999, "r": 532.48267, "b": 328.37405, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 308.86203, "t": 336.57751, "r": 545.11517, "b": 429.16998, "coord_origin": "TOPLEFT"}, "confidence": 0.9877589344978333, "cells": [{"id": 115, "text": "For training, TableFormer is trained with 3 Adam opti-", "bbox": {"l": 320.81705, "t": 336.57751, "r": 545.11499, "b": 345.48407000000003, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "mizers, each one for the", "bbox": {"l": 308.86206, "t": 348.5325000000001, "r": 403.7359, "b": 357.43906, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "CNN Backbone Network", "bbox": {"l": 406.07605, "t": 348.62216, "r": 503.54016, "b": 357.20993, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": ",", "bbox": {"l": 503.53906, "t": 348.5325000000001, "r": 506.02972, "b": 357.43906, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "Structure", "bbox": {"l": 508.40004999999996, "t": 348.62216, "r": 545.11224, "b": 357.20993, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "Decoder", "bbox": {"l": 308.86206, "t": 360.57715, "r": 343.1633, "b": 369.16492000000005, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": ", and", "bbox": {"l": 343.16306, "t": 360.48749, "r": 362.2016, "b": 369.39404, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Cell BBox Decoder", "bbox": {"l": 364.28604, "t": 360.57715, "r": 440.93829, "b": 369.16492000000005, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": ". Taking the PubTabNet as", "bbox": {"l": 440.93903, "t": 360.48749, "r": 545.10797, "b": 369.39404, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "an example for our parameter set up, the initializing learn-", "bbox": {"l": 308.86203, "t": 372.44247, "r": 545.11511, "b": 381.34903, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "ing rate is 0.001 for 12 epochs with a batch size of 24, and", "bbox": {"l": 308.86203, "t": 384.3984699999999, "r": 545.11517, "b": 393.30502, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "\u03bb", "bbox": {"l": 308.86203, "t": 396.19406000000004, "r": 314.67322, "b": 405.04083, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "set to 0.5.", "bbox": {"l": 318.65802, "t": 396.35345, "r": 360.39139, "b": 405.2600100000001, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "Afterwards, we reduce the learning rate to", "bbox": {"l": 367.96295, "t": 396.35345, "r": 545.10803, "b": 405.2600100000001, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "0.0001, the batch size to 18 and train for 12 more epochs or", "bbox": {"l": 308.86203, "t": 408.30844, "r": 545.11511, "b": 417.215, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "convergence.", "bbox": {"l": 308.86203, "t": 420.26343, "r": 360.9664, "b": 429.16998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 308.86203, "t": 437.37441999999993, "r": 545.11523, "b": 553.87689, "coord_origin": "TOPLEFT"}, "confidence": 0.9884491562843323, "cells": [{"id": 131, "text": "TableFormer is implemented with PyTorch and Torchvi-", "bbox": {"l": 320.81702, "t": 437.37441999999993, "r": 545.11499, "b": 446.28098, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "sion libraries [22].", "bbox": {"l": 308.86203, "t": 449.32941, "r": 384.62759, "b": 458.23596, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "To speed up the inference, the image", "bbox": {"l": 391.37228, "t": 449.32941, "r": 545.11511, "b": 458.23596, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "undergoes a single forward pass through the", "bbox": {"l": 308.86203, "t": 461.28439, "r": 494.00693000000007, "b": 470.19095, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "CNN Back-", "bbox": {"l": 498.07803, "t": 461.37405, "r": 545.11145, "b": 469.96182, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "bone Network", "bbox": {"l": 308.86203, "t": 473.32904, "r": 364.44336, "b": 481.91681, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "and transformer encoder. This eliminates the", "bbox": {"l": 367.06104, "t": 473.23938, "r": 545.11267, "b": 482.14594, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "overhead of generating the same features for each decoding", "bbox": {"l": 308.86203, "t": 485.19437, "r": 545.11511, "b": 494.10092, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "step. Similarly, we employ a \u2019caching\u2019 technique to preform", "bbox": {"l": 308.86203, "t": 497.14935, "r": 545.11523, "b": 506.05591, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "faster autoregressive decoding. This is achieved by storing", "bbox": {"l": 308.86203, "t": 509.10535, "r": 545.11511, "b": 518.0119, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "the features of decoded tokens so we can reuse them for", "bbox": {"l": 308.86203, "t": 521.06033, "r": 545.11517, "b": 529.9668899999999, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "each time step. Therefore, we only compute the attention", "bbox": {"l": 308.86203, "t": 533.01532, "r": 545.11517, "b": 541.9218900000001, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "for each new tag.", "bbox": {"l": 308.86203, "t": 544.97034, "r": 377.21548, "b": 553.87689, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "section_header", "bbox": {"l": 308.86203, "t": 579.55432, "r": 397.44281, "b": 589.40637, "coord_origin": "TOPLEFT"}, "confidence": 0.9450808763504028, "cells": [{"id": 144, "text": "5.2.", "bbox": {"l": 308.86203, "t": 579.55432, "r": 323.9046, "b": 589.40637, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "Generalization", "bbox": {"l": 333.93301, "t": 579.55432, "r": 397.44281, "b": 589.40637, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 308.86203, "t": 603.44933, "r": 545.11517, "b": 672.13189, "coord_origin": "TOPLEFT"}, "confidence": 0.9880595803260803, "cells": [{"id": 146, "text": "TableFormer is evaluated on three major publicly avail-", "bbox": {"l": 320.81702, "t": 603.44933, "r": 545.11493, "b": 612.3558800000001, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "able datasets of different nature to prove the generalization", "bbox": {"l": 308.86203, "t": 615.40433, "r": 545.11511, "b": 624.31088, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "and effectiveness of our model. The datasets used for eval-", "bbox": {"l": 308.86203, "t": 627.35933, "r": 545.11517, "b": 636.26588, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "uation are the PubTabNet, FinTabNet and TableBank which", "bbox": {"l": 308.86203, "t": 639.31433, "r": 545.11511, "b": 648.22089, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "stem from the scientific, financial and general domains re-", "bbox": {"l": 308.86203, "t": 651.27032, "r": 545.11517, "b": 660.17688, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "spectively.", "bbox": {"l": 308.86203, "t": 663.22533, "r": 350.70493, "b": 672.13189, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "text", "bbox": {"l": 308.86203, "t": 680.33533, "r": 545.11523, "b": 713.152893, "coord_origin": "TOPLEFT"}, "confidence": 0.9830910563468933, "cells": [{"id": 152, "text": "We also share our baseline results on the challenging", "bbox": {"l": 320.81702, "t": 680.33533, "r": 545.11505, "b": 689.24189, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "SynthTabNet dataset.", "bbox": {"l": 308.86203, "t": 692.290329, "r": 396.21411, "b": 701.196892, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "Throughout our experiments, the", "bbox": {"l": 406.40585, "t": 692.290329, "r": 545.11523, "b": 701.196892, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "same parameters stated in Sec. 5.1 are utilized.", "bbox": {"l": 308.86203, "t": 704.246323, "r": 495.93982, "b": 713.152893, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "page_footer", "bbox": {"l": 295.12103, "t": 734.133327, "r": 300.10233, "b": 743.03989, "coord_origin": "TOPLEFT"}, "confidence": 0.8820409178733826, "cells": [{"id": 156, "text": "6", "bbox": {"l": 295.12103, "t": 734.133327, "r": 300.10233, "b": 743.03989, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "text", "id": 5, "page_no": 5, "cluster": {"id": 5, "label": "text", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 286.36514, "b": 155.84600999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.9868090152740479, "cells": [{"id": 0, "text": "tention encoding is then multiplied to the encoded image to", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 286.36514, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "produce a feature for each table cell. Notice that this is dif-", "bbox": {"l": 50.112, "t": 87.16339000000005, "r": 286.36508, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "ferent than the typical object detection problem where im-", "bbox": {"l": 50.112, "t": 99.11841000000004, "r": 286.36508, "b": 108.02495999999985, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "balances between the number of detections and the amount", "bbox": {"l": 50.112, "t": 111.07343000000003, "r": 286.36508, "b": 119.97997999999984, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "of objects may exist. In our case, we know up front that", "bbox": {"l": 50.112, "t": 123.02844000000005, "r": 286.36508, "b": 131.93499999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "the produced detections always match with the table cells", "bbox": {"l": 50.112, "t": 134.98443999999995, "r": 286.36514, "b": 143.89099, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "in number and correspondence.", "bbox": {"l": 50.112, "t": 146.93944999999997, "r": 175.16254, "b": 155.84600999999998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "tention encoding is then multiplied to the encoded image to produce a feature for each table cell. Notice that this is different than the typical object detection problem where imbalances between the number of detections and the amount of objects may exist. In our case, we know up front that the produced detections always match with the table cells in number and correspondence."}, {"label": "text", "id": 6, "page_no": 5, "cluster": {"id": 6, "label": "text", "bbox": {"l": 50.112, "t": 159.62445000000002, "r": 286.36511, "b": 240.26306, "coord_origin": "TOPLEFT"}, "confidence": 0.9860327839851379, "cells": [{"id": 7, "text": "The output features for each table cell are then fed", "bbox": {"l": 62.067001, "t": 159.62445000000002, "r": 286.36496, "b": 168.53101000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "into the feed-forward network (FFN). The FFN consists", "bbox": {"l": 50.112, "t": 171.58043999999995, "r": 286.36511, "b": 180.48699999999997, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "of a Multi-Layer Perceptron (3 layers with ReLU activa-", "bbox": {"l": 50.112, "t": 183.53545999999994, "r": 286.36511, "b": 192.44201999999996, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "tion function) that predicts the normalized coordinates for", "bbox": {"l": 50.112, "t": 195.49048000000005, "r": 286.36511, "b": 204.39702999999997, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "the bounding box of each table cell. Finally, the predicted", "bbox": {"l": 50.112, "t": 207.44550000000004, "r": 286.36511, "b": 216.35204999999996, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "bounding boxes are classified based on whether they are", "bbox": {"l": 50.112, "t": 219.40051000000005, "r": 286.36511, "b": 228.30706999999995, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "empty or not using a linear layer.", "bbox": {"l": 50.112, "t": 231.35650999999996, "r": 181.54855, "b": 240.26306, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The output features for each table cell are then fed into the feed-forward network (FFN). The FFN consists of a Multi-Layer Perceptron (3 layers with ReLU activation function) that predicts the normalized coordinates for the bounding box of each table cell. Finally, the predicted bounding boxes are classified based on whether they are empty or not using a linear layer."}, {"label": "text", "id": 4, "page_no": 5, "cluster": {"id": 4, "label": "text", "bbox": {"l": 50.112, "t": 243.92193999999995, "r": 286.36572, "b": 444.2309, "coord_origin": "TOPLEFT"}, "confidence": 0.9873637557029724, "cells": [{"id": 14, "text": "Loss Functions.", "bbox": {"l": 62.067001, "t": 243.92193999999995, "r": 129.21492, "b": 252.87829999999997, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "We formulate a multi-task loss Eq. 2", "bbox": {"l": 134.451, "t": 244.04150000000004, "r": 286.36078, "b": 252.94806000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "to train our network. The Cross-Entropy loss (denoted as", "bbox": {"l": 50.112007, "t": 255.99652000000003, "r": 286.36511, "b": 264.90308000000005, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "l$_{s}$", "bbox": {"l": 50.112007, "t": 267.79309, "r": 56.84528, "b": 276.63989000000004, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": ") is used to train the", "bbox": {"l": 57.343006, "t": 267.95250999999996, "r": 135.39996, "b": 276.85907, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Structure Decoder", "bbox": {"l": 137.735, "t": 268.04218000000003, "r": 211.07965, "b": 276.62994000000003, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "which predicts the", "bbox": {"l": 213.63699, "t": 267.95250999999996, "r": 286.36395, "b": 276.85907, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "structure tokens. As for the", "bbox": {"l": 50.112, "t": 279.90747, "r": 158.82388, "b": 288.81406, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "Cell BBox Decoder", "bbox": {"l": 161.31799, "t": 279.99712999999997, "r": 238.79712, "b": 288.58493, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "it is trained", "bbox": {"l": 241.521, "t": 279.90747, "r": 286.36264, "b": 288.81406, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "with a combination of losses denoted as", "bbox": {"l": 50.112, "t": 291.86249, "r": 211.3766, "b": 300.76904, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "l$_{box}$", "bbox": {"l": 214.271, "t": 291.70309, "r": 229.19780000000003, "b": 300.54987, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": ".", "bbox": {"l": 229.696, "t": 291.86249, "r": 232.18665000000001, "b": 300.76904, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "l$_{box}$", "bbox": {"l": 236.49001, "t": 291.70309, "r": 251.41681000000003, "b": 300.54987, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "consists", "bbox": {"l": 254.81099999999998, "t": 291.86249, "r": 286.36255, "b": 300.76904, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "of the generally used", "bbox": {"l": 50.112, "t": 303.81747, "r": 137.45412, "b": 312.72403, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "l$_{1}$", "bbox": {"l": 141.298, "t": 303.65808, "r": 148.24258, "b": 312.50485, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "loss for object detection and the", "bbox": {"l": 152.58601, "t": 303.81747, "r": 286.36377, "b": 312.72403, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "IoU loss (", "bbox": {"l": 50.112015, "t": 315.77245999999997, "r": 89.683464, "b": 324.67902, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "l$_{iou}$", "bbox": {"l": 89.68602, "t": 315.61307, "r": 104.12046, "b": 324.45984, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": ") to be scale invariant as explained in [25]. In", "bbox": {"l": 104.61802, "t": 315.77245999999997, "r": 286.36572, "b": 324.67902, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "comparison to DETR, we do not use the Hungarian algo-", "bbox": {"l": 50.112019, "t": 327.72845, "r": 286.36511, "b": 336.6350100000001, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "rithm [15] to match the predicted bounding boxes with the", "bbox": {"l": 50.112019, "t": 339.68344, "r": 286.36508, "b": 348.59, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "ground-truth boxes, as we have already achieved a one-to-", "bbox": {"l": 50.112019, "t": 351.63843, "r": 286.36511, "b": 360.54498, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "one match through two steps: 1) Our token input sequence", "bbox": {"l": 50.112019, "t": 363.59341, "r": 286.36508, "b": 372.49996999999996, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "is naturally ordered, therefore the hidden states of the table", "bbox": {"l": 50.112019, "t": 375.5484, "r": 286.36511, "b": 384.45496, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "data cells are also in order when they are provided as in-", "bbox": {"l": 50.112019, "t": 387.50339, "r": 286.36514, "b": 396.40994, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "put to the", "bbox": {"l": 50.112019, "t": 399.45938, "r": 88.68721, "b": 408.36594, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "Cell BBox Decoder", "bbox": {"l": 91.646019, "t": 399.54904, "r": 170.0517, "b": 408.13681, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": ", and 2) Our bounding boxes", "bbox": {"l": 170.05103, "t": 399.45938, "r": 286.36438, "b": 408.36594, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "generation mechanism (see Sec.", "bbox": {"l": 50.112022, "t": 411.41437, "r": 181.96703, "b": 420.32092, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "3)", "bbox": {"l": 189.09029, "t": 411.41437, "r": 197.74918, "b": 420.32092, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "ensures a one-to-one", "bbox": {"l": 200.34789, "t": 411.41437, "r": 286.36511, "b": 420.32092, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "mapping between the cell content and its bounding box for", "bbox": {"l": 50.112022, "t": 423.36934999999994, "r": 286.36511, "b": 432.27591, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "all post-processed datasets.", "bbox": {"l": 50.112022, "t": 435.32434, "r": 158.2959, "b": 444.2309, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Loss Functions. We formulate a multi-task loss Eq. 2 to train our network. The Cross-Entropy loss (denoted as l$_{s}$ ) is used to train the Structure Decoder which predicts the structure tokens. As for the Cell BBox Decoder it is trained with a combination of losses denoted as l$_{box}$ . l$_{box}$ consists of the generally used l$_{1}$ loss for object detection and the IoU loss ( l$_{iou}$ ) to be scale invariant as explained in [25]. In comparison to DETR, we do not use the Hungarian algorithm [15] to match the predicted bounding boxes with the ground-truth boxes, as we have already achieved a one-toone match through two steps: 1) Our token input sequence is naturally ordered, therefore the hidden states of the table data cells are also in order when they are provided as input to the Cell BBox Decoder , and 2) Our bounding boxes generation mechanism (see Sec. 3) ensures a one-to-one mapping between the cell content and its bounding box for all post-processed datasets."}, {"label": "text", "id": 11, "page_no": 5, "cluster": {"id": 11, "label": "text", "bbox": {"l": 50.112022, "t": 448.01035, "r": 286.36499, "b": 468.87189, "coord_origin": "TOPLEFT"}, "confidence": 0.9724196195602417, "cells": [{"id": 49, "text": "The loss used to train the TableFormer can be defined as", "bbox": {"l": 62.067024, "t": 448.01035, "r": 286.36499, "b": 456.9169, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "following:", "bbox": {"l": 50.112022, "t": 459.96533, "r": 91.377113, "b": 468.87189, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The loss used to train the TableFormer can be defined as following:"}, {"label": "formula", "id": 15, "page_no": 5, "cluster": {"id": 15, "label": "formula", "bbox": {"l": 124.33002, "t": 493.28094, "r": 286.36243, "b": 517.07172, "coord_origin": "TOPLEFT"}, "confidence": 0.9423348307609558, "cells": [{"id": 51, "text": "l$_{box}$", "bbox": {"l": 125.71502, "t": 493.28094, "r": 140.64182, "b": 502.12772, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "=", "bbox": {"l": 143.90701, "t": 493.28094, "r": 151.65593, "b": 502.12772, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "\u03bb$_{iou}$l$_{iou}$", "bbox": {"l": 154.42302, "t": 493.28094, "r": 186.62846, "b": 502.12772, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "+", "bbox": {"l": 189.34003, "t": 493.28094, "r": 197.08894, "b": 502.12772, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "\u03bb$_{l}$$_{1}$", "bbox": {"l": 199.30302, "t": 493.28094, "r": 211.64659, "b": 502.12772, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "l", "bbox": {"l": 124.33002, "t": 508.22495, "r": 127.30286, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "=", "bbox": {"l": 130.26602, "t": 508.22495, "r": 138.01494, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "\u03bbl$_{s}$", "bbox": {"l": 140.78203, "t": 508.22495, "r": 153.32629, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "+ (1", "bbox": {"l": 156.03903, "t": 508.22495, "r": 174.85541, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "\u2212", "bbox": {"l": 177.07103, "t": 507.66702, "r": 184.81995, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "\u03bb", "bbox": {"l": 187.03304, "t": 508.22495, "r": 192.84422, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": ")", "bbox": {"l": 192.84503, "t": 508.22495, "r": 196.71948, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "l$_{box}$", "bbox": {"l": 196.71902, "t": 508.22495, "r": 211.64583, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "(1)", "bbox": {"l": 274.74603, "t": 501.01132, "r": 286.36243, "b": 509.91788, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "l$_{box}$ = \u03bb$_{iou}$l$_{iou}$ + \u03bb$_{l}$$_{1}$ l = \u03bbl$_{s}$ + (1 \u2212 \u03bb ) l$_{box}$ (1)"}, {"label": "text", "id": 16, "page_no": 5, "cluster": {"id": 16, "label": "text", "bbox": {"l": 50.11203, "t": 530.5920100000001, "r": 281.59692, "b": 540.21588, "coord_origin": "TOPLEFT"}, "confidence": 0.9363929629325867, "cells": [{"id": 65, "text": "where", "bbox": {"l": 50.11203, "t": 531.30933, "r": 74.450661, "b": 540.21588, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "\u03bb", "bbox": {"l": 76.941032, "t": 531.14993, "r": 82.75222, "b": 539.9967, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "\u2208", "bbox": {"l": 85.520035, "t": 530.5920100000001, "r": 92.162102, "b": 539.9967, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "[0, 1], and", "bbox": {"l": 94.653038, "t": 531.30933, "r": 135.59932, "b": 540.21588, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "\u03bb$_{iou}$, \u03bb$_{l}$$_{1}$", "bbox": {"l": 138.09004, "t": 531.14993, "r": 172.63162, "b": 539.9967, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "\u2208$_{R}$", "bbox": {"l": 175.89705, "t": 530.5920100000001, "r": 192.50104, "b": 539.9967, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "are hyper-parameters.", "bbox": {"l": 194.99205, "t": 531.30933, "r": 281.59692, "b": 540.21588, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "where \u03bb \u2208 [0, 1], and \u03bb$_{iou}$, \u03bb$_{l}$$_{1}$ \u2208$_{R}$ are hyper-parameters."}, {"label": "section_header", "id": 12, "page_no": 5, "cluster": {"id": 12, "label": "section_header", "bbox": {"l": 50.112045, "t": 555.91689, "r": 171.98335, "b": 566.66461, "coord_origin": "TOPLEFT"}, "confidence": 0.9554555416107178, "cells": [{"id": 72, "text": "5.", "bbox": {"l": 50.112045, "t": 555.91689, "r": 57.92831799999999, "b": 566.66461, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "Experimental Results", "bbox": {"l": 68.350014, "t": 555.91689, "r": 171.98335, "b": 566.66461, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5. Experimental Results"}, {"label": "section_header", "id": 13, "page_no": 5, "cluster": {"id": 13, "label": "section_header", "bbox": {"l": 50.112045, "t": 576.26433, "r": 179.17502, "b": 586.1163799999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9538503289222717, "cells": [{"id": 74, "text": "5.1.", "bbox": {"l": 50.112045, "t": 576.26433, "r": 64.693237, "b": 586.1163799999999, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "Implementation Details", "bbox": {"l": 74.414032, "t": 576.26433, "r": 179.17502, "b": 586.1163799999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5.1. Implementation Details"}, {"label": "text", "id": 7, "page_no": 5, "cluster": {"id": 7, "label": "text", "bbox": {"l": 50.112045, "t": 595.73433, "r": 286.36517, "b": 640.50688, "coord_origin": "TOPLEFT"}, "confidence": 0.9856163263320923, "cells": [{"id": 76, "text": "TableFormer uses ResNet-18 as the", "bbox": {"l": 62.067047, "t": 595.73433, "r": 202.97806, "b": 604.64088, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "CNN Backbone Net-", "bbox": {"l": 205.38405, "t": 595.82399, "r": 286.36008, "b": 604.41174, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "work", "bbox": {"l": 50.112045, "t": 607.77899, "r": 70.037247, "b": 616.3667399999999, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": ". The input images are resized to 448*448 pixels and", "bbox": {"l": 70.037048, "t": 607.68933, "r": 286.36496, "b": 616.59589, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "the feature map has a dimension of 28*28. Additionally, we", "bbox": {"l": 50.112049, "t": 619.64433, "r": 286.36517, "b": 628.55089, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "enforce the following input constraints:", "bbox": {"l": 50.112049, "t": 631.60033, "r": 207.03294, "b": 640.50688, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "TableFormer uses ResNet-18 as the CNN Backbone Network . The input images are resized to 448*448 pixels and the feature map has a dimension of 28*28. Additionally, we enforce the following input constraints:"}, {"label": "formula", "id": 18, "page_no": 5, "cluster": {"id": 18, "label": "formula", "bbox": {"l": 91.661049, "t": 653.828, "r": 286.36246, "b": 678.39588, "coord_origin": "TOPLEFT"}, "confidence": 0.844183623790741, "cells": [{"id": 82, "text": "Image width and height", "bbox": {"l": 91.661049, "t": 654.54532, "r": 186.01683, "b": 663.45187, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "\u2264", "bbox": {"l": 188.50705, "t": 653.828, "r": 196.25597, "b": 663.2327, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "1024 pixels", "bbox": {"l": 198.74605, "t": 654.54532, "r": 244.81310999999997, "b": 663.45187, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "Structural tags length", "bbox": {"l": 101.01604, "t": 669.48932, "r": 186.24606, "b": 678.39588, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "\u2264", "bbox": {"l": 188.73605, "t": 668.77201, "r": 196.48497, "b": 678.1767, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "512 tokens.", "bbox": {"l": 198.97505, "t": 669.48932, "r": 244.81296999999998, "b": 678.39588, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "(2)", "bbox": {"l": 274.74606, "t": 662.11731, "r": 286.36246, "b": 671.02388, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Image width and height \u2264 1024 pixels Structural tags length \u2264 512 tokens. (2)"}, {"label": "text", "id": 10, "page_no": 5, "cluster": {"id": 10, "label": "text", "bbox": {"l": 50.112061, "t": 692.290314, "r": 286.36514, "b": 713.151878, "coord_origin": "TOPLEFT"}, "confidence": 0.9724979996681213, "cells": [{"id": 89, "text": "Although input constraints are used also by other methods,", "bbox": {"l": 50.112061, "t": 692.290314, "r": 286.36514, "b": 701.196877, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "such as EDD, ours are less restrictive due to the improved", "bbox": {"l": 50.112061, "t": 704.245316, "r": 286.36514, "b": 713.151878, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Although input constraints are used also by other methods, such as EDD, ours are less restrictive due to the improved"}, {"label": "text", "id": 9, "page_no": 5, "cluster": {"id": 9, "label": "text", "bbox": {"l": 308.86206, "t": 75.20830999999998, "r": 545.11523, "b": 108.0249, "coord_origin": "TOPLEFT"}, "confidence": 0.9799237847328186, "cells": [{"id": 91, "text": "runtime performance and lower memory footprint of Table-", "bbox": {"l": 308.86206, "t": 75.20830999999998, "r": 545.11523, "b": 84.11487, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Former.", "bbox": {"l": 308.86206, "t": 87.16332999999997, "r": 339.98523, "b": 96.06988999999999, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "This allows to utilize input samples with longer", "bbox": {"l": 346.88931, "t": 87.16332999999997, "r": 545.11523, "b": 96.06988999999999, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "sequences and images with larger dimensions.", "bbox": {"l": 308.86206, "t": 99.11835000000008, "r": 492.96097, "b": 108.0249, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "runtime performance and lower memory footprint of TableFormer. This allows to utilize input samples with longer sequences and images with larger dimensions."}, {"label": "text", "id": 1, "page_no": 5, "cluster": {"id": 1, "label": "text", "bbox": {"l": 308.86206, "t": 116.22937000000002, "r": 545.1153, "b": 328.37405, "coord_origin": "TOPLEFT"}, "confidence": 0.9880930781364441, "cells": [{"id": 95, "text": "The Transformer Encoder consists of two \u201cTransformer", "bbox": {"l": 320.81705, "t": 116.22937000000002, "r": 545.11499, "b": 125.13593000000003, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "Encoder Layers\u201d, with an input feature size of 512, feed", "bbox": {"l": 308.86206, "t": 128.18439, "r": 545.11517, "b": 137.09094000000005, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "forward network of 1024, and 4 attention heads. As for the", "bbox": {"l": 308.86206, "t": 140.13940000000002, "r": 545.11505, "b": 149.04596000000004, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "Transformer Decoder it is composed of four \u201cTransformer", "bbox": {"l": 308.86206, "t": 152.09442, "r": 545.11511, "b": 161.00098000000003, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "Decoder Layers\u201d with similar input and output dimensions", "bbox": {"l": 308.86206, "t": 164.04944, "r": 545.11517, "b": 172.95599000000004, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "as the \u201cTransformer Encoder Layers\u201d.", "bbox": {"l": 308.86206, "t": 176.00543000000005, "r": 467.21756000000005, "b": 184.91198999999995, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "Even though our", "bbox": {"l": 475.43671, "t": 176.00543000000005, "r": 545.11511, "b": 184.91198999999995, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "model uses fewer layers and heads than the default imple-", "bbox": {"l": 308.86206, "t": 187.96045000000004, "r": 545.11511, "b": 196.86699999999996, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "mentation parameters, our extensive experimentation has", "bbox": {"l": 308.86206, "t": 199.91547000000003, "r": 545.11511, "b": 208.82201999999995, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "proved this setup to be more suitable for table images. We", "bbox": {"l": 308.86206, "t": 211.87048000000004, "r": 545.11517, "b": 220.77704000000006, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "attribute this finding to the inherent design of table im-", "bbox": {"l": 308.86206, "t": 223.82550000000003, "r": 545.11511, "b": 232.73206000000005, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "ages, which contain mostly lines and text, unlike the more", "bbox": {"l": 308.86206, "t": 235.78052000000002, "r": 545.11511, "b": 244.68706999999995, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "elaborate content present in other scopes (e.g. the COCO", "bbox": {"l": 308.86206, "t": 247.73650999999995, "r": 545.11523, "b": 256.64306999999997, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "dataset).", "bbox": {"l": 308.86206, "t": 259.69152999999994, "r": 342.3364, "b": 268.59808, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "Moreover, we have added ResNet blocks to the", "bbox": {"l": 348.95157, "t": 259.69152999999994, "r": 545.11517, "b": 268.59808, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "inputs of the Structure Decoder and Cell BBox Decoder.", "bbox": {"l": 308.86206, "t": 271.64655000000005, "r": 545.11517, "b": 280.55310000000003, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "This prevents a decoder having a stronger influence over the", "bbox": {"l": 308.86206, "t": 283.6015300000001, "r": 545.1153, "b": 292.50809, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "learned weights which would damage the other prediction", "bbox": {"l": 308.86206, "t": 295.55652, "r": 545.11511, "b": 304.46307, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "task (structure vs bounding boxes), but learn task specific", "bbox": {"l": 308.86206, "t": 307.51151, "r": 545.11511, "b": 316.41806, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "weights instead. Lastly our dropout layers are set to 0.5.", "bbox": {"l": 308.86206, "t": 319.4674999999999, "r": 532.48267, "b": 328.37405, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The Transformer Encoder consists of two \"Transformer Encoder Layers\", with an input feature size of 512, feed forward network of 1024, and 4 attention heads. As for the Transformer Decoder it is composed of four \"Transformer Decoder Layers\" with similar input and output dimensions as the \"Transformer Encoder Layers\". Even though our model uses fewer layers and heads than the default implementation parameters, our extensive experimentation has proved this setup to be more suitable for table images. We attribute this finding to the inherent design of table images, which contain mostly lines and text, unlike the more elaborate content present in other scopes (e.g. the COCO dataset). Moreover, we have added ResNet blocks to the inputs of the Structure Decoder and Cell BBox Decoder. This prevents a decoder having a stronger influence over the learned weights which would damage the other prediction task (structure vs bounding boxes), but learn task specific weights instead. Lastly our dropout layers are set to 0.5."}, {"label": "text", "id": 3, "page_no": 5, "cluster": {"id": 3, "label": "text", "bbox": {"l": 308.86203, "t": 336.57751, "r": 545.11517, "b": 429.16998, "coord_origin": "TOPLEFT"}, "confidence": 0.9877589344978333, "cells": [{"id": 115, "text": "For training, TableFormer is trained with 3 Adam opti-", "bbox": {"l": 320.81705, "t": 336.57751, "r": 545.11499, "b": 345.48407000000003, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "mizers, each one for the", "bbox": {"l": 308.86206, "t": 348.5325000000001, "r": 403.7359, "b": 357.43906, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "CNN Backbone Network", "bbox": {"l": 406.07605, "t": 348.62216, "r": 503.54016, "b": 357.20993, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": ",", "bbox": {"l": 503.53906, "t": 348.5325000000001, "r": 506.02972, "b": 357.43906, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "Structure", "bbox": {"l": 508.40004999999996, "t": 348.62216, "r": 545.11224, "b": 357.20993, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "Decoder", "bbox": {"l": 308.86206, "t": 360.57715, "r": 343.1633, "b": 369.16492000000005, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": ", and", "bbox": {"l": 343.16306, "t": 360.48749, "r": 362.2016, "b": 369.39404, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Cell BBox Decoder", "bbox": {"l": 364.28604, "t": 360.57715, "r": 440.93829, "b": 369.16492000000005, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": ". Taking the PubTabNet as", "bbox": {"l": 440.93903, "t": 360.48749, "r": 545.10797, "b": 369.39404, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "an example for our parameter set up, the initializing learn-", "bbox": {"l": 308.86203, "t": 372.44247, "r": 545.11511, "b": 381.34903, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "ing rate is 0.001 for 12 epochs with a batch size of 24, and", "bbox": {"l": 308.86203, "t": 384.3984699999999, "r": 545.11517, "b": 393.30502, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "\u03bb", "bbox": {"l": 308.86203, "t": 396.19406000000004, "r": 314.67322, "b": 405.04083, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "set to 0.5.", "bbox": {"l": 318.65802, "t": 396.35345, "r": 360.39139, "b": 405.2600100000001, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "Afterwards, we reduce the learning rate to", "bbox": {"l": 367.96295, "t": 396.35345, "r": 545.10803, "b": 405.2600100000001, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "0.0001, the batch size to 18 and train for 12 more epochs or", "bbox": {"l": 308.86203, "t": 408.30844, "r": 545.11511, "b": 417.215, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "convergence.", "bbox": {"l": 308.86203, "t": 420.26343, "r": 360.9664, "b": 429.16998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "For training, TableFormer is trained with 3 Adam optimizers, each one for the CNN Backbone Network , Structure Decoder , and Cell BBox Decoder . Taking the PubTabNet as an example for our parameter set up, the initializing learning rate is 0.001 for 12 epochs with a batch size of 24, and \u03bb set to 0.5. Afterwards, we reduce the learning rate to 0.0001, the batch size to 18 and train for 12 more epochs or convergence."}, {"label": "text", "id": 0, "page_no": 5, "cluster": {"id": 0, "label": "text", "bbox": {"l": 308.86203, "t": 437.37441999999993, "r": 545.11523, "b": 553.87689, "coord_origin": "TOPLEFT"}, "confidence": 0.9884491562843323, "cells": [{"id": 131, "text": "TableFormer is implemented with PyTorch and Torchvi-", "bbox": {"l": 320.81702, "t": 437.37441999999993, "r": 545.11499, "b": 446.28098, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "sion libraries [22].", "bbox": {"l": 308.86203, "t": 449.32941, "r": 384.62759, "b": 458.23596, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "To speed up the inference, the image", "bbox": {"l": 391.37228, "t": 449.32941, "r": 545.11511, "b": 458.23596, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "undergoes a single forward pass through the", "bbox": {"l": 308.86203, "t": 461.28439, "r": 494.00693000000007, "b": 470.19095, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "CNN Back-", "bbox": {"l": 498.07803, "t": 461.37405, "r": 545.11145, "b": 469.96182, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "bone Network", "bbox": {"l": 308.86203, "t": 473.32904, "r": 364.44336, "b": 481.91681, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "and transformer encoder. This eliminates the", "bbox": {"l": 367.06104, "t": 473.23938, "r": 545.11267, "b": 482.14594, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "overhead of generating the same features for each decoding", "bbox": {"l": 308.86203, "t": 485.19437, "r": 545.11511, "b": 494.10092, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "step. Similarly, we employ a \u2019caching\u2019 technique to preform", "bbox": {"l": 308.86203, "t": 497.14935, "r": 545.11523, "b": 506.05591, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "faster autoregressive decoding. This is achieved by storing", "bbox": {"l": 308.86203, "t": 509.10535, "r": 545.11511, "b": 518.0119, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "the features of decoded tokens so we can reuse them for", "bbox": {"l": 308.86203, "t": 521.06033, "r": 545.11517, "b": 529.9668899999999, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "each time step. Therefore, we only compute the attention", "bbox": {"l": 308.86203, "t": 533.01532, "r": 545.11517, "b": 541.9218900000001, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "for each new tag.", "bbox": {"l": 308.86203, "t": 544.97034, "r": 377.21548, "b": 553.87689, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "TableFormer is implemented with PyTorch and Torchvision libraries [22]. To speed up the inference, the image undergoes a single forward pass through the CNN Backbone Network and transformer encoder. This eliminates the overhead of generating the same features for each decoding step. Similarly, we employ a 'caching' technique to preform faster autoregressive decoding. This is achieved by storing the features of decoded tokens so we can reuse them for each time step. Therefore, we only compute the attention for each new tag."}, {"label": "section_header", "id": 14, "page_no": 5, "cluster": {"id": 14, "label": "section_header", "bbox": {"l": 308.86203, "t": 579.55432, "r": 397.44281, "b": 589.40637, "coord_origin": "TOPLEFT"}, "confidence": 0.9450808763504028, "cells": [{"id": 144, "text": "5.2.", "bbox": {"l": 308.86203, "t": 579.55432, "r": 323.9046, "b": 589.40637, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "Generalization", "bbox": {"l": 333.93301, "t": 579.55432, "r": 397.44281, "b": 589.40637, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5.2. Generalization"}, {"label": "text", "id": 2, "page_no": 5, "cluster": {"id": 2, "label": "text", "bbox": {"l": 308.86203, "t": 603.44933, "r": 545.11517, "b": 672.13189, "coord_origin": "TOPLEFT"}, "confidence": 0.9880595803260803, "cells": [{"id": 146, "text": "TableFormer is evaluated on three major publicly avail-", "bbox": {"l": 320.81702, "t": 603.44933, "r": 545.11493, "b": 612.3558800000001, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "able datasets of different nature to prove the generalization", "bbox": {"l": 308.86203, "t": 615.40433, "r": 545.11511, "b": 624.31088, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "and effectiveness of our model. The datasets used for eval-", "bbox": {"l": 308.86203, "t": 627.35933, "r": 545.11517, "b": 636.26588, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "uation are the PubTabNet, FinTabNet and TableBank which", "bbox": {"l": 308.86203, "t": 639.31433, "r": 545.11511, "b": 648.22089, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "stem from the scientific, financial and general domains re-", "bbox": {"l": 308.86203, "t": 651.27032, "r": 545.11517, "b": 660.17688, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "spectively.", "bbox": {"l": 308.86203, "t": 663.22533, "r": 350.70493, "b": 672.13189, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "TableFormer is evaluated on three major publicly available datasets of different nature to prove the generalization and effectiveness of our model. The datasets used for evaluation are the PubTabNet, FinTabNet and TableBank which stem from the scientific, financial and general domains respectively."}, {"label": "text", "id": 8, "page_no": 5, "cluster": {"id": 8, "label": "text", "bbox": {"l": 308.86203, "t": 680.33533, "r": 545.11523, "b": 713.152893, "coord_origin": "TOPLEFT"}, "confidence": 0.9830910563468933, "cells": [{"id": 152, "text": "We also share our baseline results on the challenging", "bbox": {"l": 320.81702, "t": 680.33533, "r": 545.11505, "b": 689.24189, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "SynthTabNet dataset.", "bbox": {"l": 308.86203, "t": 692.290329, "r": 396.21411, "b": 701.196892, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "Throughout our experiments, the", "bbox": {"l": 406.40585, "t": 692.290329, "r": 545.11523, "b": 701.196892, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "same parameters stated in Sec. 5.1 are utilized.", "bbox": {"l": 308.86203, "t": 704.246323, "r": 495.93982, "b": 713.152893, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "We also share our baseline results on the challenging SynthTabNet dataset. Throughout our experiments, the same parameters stated in Sec. 5.1 are utilized."}, {"label": "page_footer", "id": 17, "page_no": 5, "cluster": {"id": 17, "label": "page_footer", "bbox": {"l": 295.12103, "t": 734.133327, "r": 300.10233, "b": 743.03989, "coord_origin": "TOPLEFT"}, "confidence": 0.8820409178733826, "cells": [{"id": 156, "text": "6", "bbox": {"l": 295.12103, "t": 734.133327, "r": 300.10233, "b": 743.03989, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "6"}], "body": [{"label": "text", "id": 5, "page_no": 5, "cluster": {"id": 5, "label": "text", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 286.36514, "b": 155.84600999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.9868090152740479, "cells": [{"id": 0, "text": "tention encoding is then multiplied to the encoded image to", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 286.36514, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "produce a feature for each table cell. Notice that this is dif-", "bbox": {"l": 50.112, "t": 87.16339000000005, "r": 286.36508, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "ferent than the typical object detection problem where im-", "bbox": {"l": 50.112, "t": 99.11841000000004, "r": 286.36508, "b": 108.02495999999985, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "balances between the number of detections and the amount", "bbox": {"l": 50.112, "t": 111.07343000000003, "r": 286.36508, "b": 119.97997999999984, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "of objects may exist. In our case, we know up front that", "bbox": {"l": 50.112, "t": 123.02844000000005, "r": 286.36508, "b": 131.93499999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "the produced detections always match with the table cells", "bbox": {"l": 50.112, "t": 134.98443999999995, "r": 286.36514, "b": 143.89099, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "in number and correspondence.", "bbox": {"l": 50.112, "t": 146.93944999999997, "r": 175.16254, "b": 155.84600999999998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "tention encoding is then multiplied to the encoded image to produce a feature for each table cell. Notice that this is different than the typical object detection problem where imbalances between the number of detections and the amount of objects may exist. In our case, we know up front that the produced detections always match with the table cells in number and correspondence."}, {"label": "text", "id": 6, "page_no": 5, "cluster": {"id": 6, "label": "text", "bbox": {"l": 50.112, "t": 159.62445000000002, "r": 286.36511, "b": 240.26306, "coord_origin": "TOPLEFT"}, "confidence": 0.9860327839851379, "cells": [{"id": 7, "text": "The output features for each table cell are then fed", "bbox": {"l": 62.067001, "t": 159.62445000000002, "r": 286.36496, "b": 168.53101000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "into the feed-forward network (FFN). The FFN consists", "bbox": {"l": 50.112, "t": 171.58043999999995, "r": 286.36511, "b": 180.48699999999997, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "of a Multi-Layer Perceptron (3 layers with ReLU activa-", "bbox": {"l": 50.112, "t": 183.53545999999994, "r": 286.36511, "b": 192.44201999999996, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "tion function) that predicts the normalized coordinates for", "bbox": {"l": 50.112, "t": 195.49048000000005, "r": 286.36511, "b": 204.39702999999997, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "the bounding box of each table cell. Finally, the predicted", "bbox": {"l": 50.112, "t": 207.44550000000004, "r": 286.36511, "b": 216.35204999999996, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "bounding boxes are classified based on whether they are", "bbox": {"l": 50.112, "t": 219.40051000000005, "r": 286.36511, "b": 228.30706999999995, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "empty or not using a linear layer.", "bbox": {"l": 50.112, "t": 231.35650999999996, "r": 181.54855, "b": 240.26306, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The output features for each table cell are then fed into the feed-forward network (FFN). The FFN consists of a Multi-Layer Perceptron (3 layers with ReLU activation function) that predicts the normalized coordinates for the bounding box of each table cell. Finally, the predicted bounding boxes are classified based on whether they are empty or not using a linear layer."}, {"label": "text", "id": 4, "page_no": 5, "cluster": {"id": 4, "label": "text", "bbox": {"l": 50.112, "t": 243.92193999999995, "r": 286.36572, "b": 444.2309, "coord_origin": "TOPLEFT"}, "confidence": 0.9873637557029724, "cells": [{"id": 14, "text": "Loss Functions.", "bbox": {"l": 62.067001, "t": 243.92193999999995, "r": 129.21492, "b": 252.87829999999997, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "We formulate a multi-task loss Eq. 2", "bbox": {"l": 134.451, "t": 244.04150000000004, "r": 286.36078, "b": 252.94806000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "to train our network. The Cross-Entropy loss (denoted as", "bbox": {"l": 50.112007, "t": 255.99652000000003, "r": 286.36511, "b": 264.90308000000005, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "l$_{s}$", "bbox": {"l": 50.112007, "t": 267.79309, "r": 56.84528, "b": 276.63989000000004, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": ") is used to train the", "bbox": {"l": 57.343006, "t": 267.95250999999996, "r": 135.39996, "b": 276.85907, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Structure Decoder", "bbox": {"l": 137.735, "t": 268.04218000000003, "r": 211.07965, "b": 276.62994000000003, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "which predicts the", "bbox": {"l": 213.63699, "t": 267.95250999999996, "r": 286.36395, "b": 276.85907, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "structure tokens. As for the", "bbox": {"l": 50.112, "t": 279.90747, "r": 158.82388, "b": 288.81406, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "Cell BBox Decoder", "bbox": {"l": 161.31799, "t": 279.99712999999997, "r": 238.79712, "b": 288.58493, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "it is trained", "bbox": {"l": 241.521, "t": 279.90747, "r": 286.36264, "b": 288.81406, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "with a combination of losses denoted as", "bbox": {"l": 50.112, "t": 291.86249, "r": 211.3766, "b": 300.76904, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "l$_{box}$", "bbox": {"l": 214.271, "t": 291.70309, "r": 229.19780000000003, "b": 300.54987, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": ".", "bbox": {"l": 229.696, "t": 291.86249, "r": 232.18665000000001, "b": 300.76904, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "l$_{box}$", "bbox": {"l": 236.49001, "t": 291.70309, "r": 251.41681000000003, "b": 300.54987, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "consists", "bbox": {"l": 254.81099999999998, "t": 291.86249, "r": 286.36255, "b": 300.76904, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "of the generally used", "bbox": {"l": 50.112, "t": 303.81747, "r": 137.45412, "b": 312.72403, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "l$_{1}$", "bbox": {"l": 141.298, "t": 303.65808, "r": 148.24258, "b": 312.50485, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "loss for object detection and the", "bbox": {"l": 152.58601, "t": 303.81747, "r": 286.36377, "b": 312.72403, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "IoU loss (", "bbox": {"l": 50.112015, "t": 315.77245999999997, "r": 89.683464, "b": 324.67902, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "l$_{iou}$", "bbox": {"l": 89.68602, "t": 315.61307, "r": 104.12046, "b": 324.45984, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": ") to be scale invariant as explained in [25]. In", "bbox": {"l": 104.61802, "t": 315.77245999999997, "r": 286.36572, "b": 324.67902, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "comparison to DETR, we do not use the Hungarian algo-", "bbox": {"l": 50.112019, "t": 327.72845, "r": 286.36511, "b": 336.6350100000001, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "rithm [15] to match the predicted bounding boxes with the", "bbox": {"l": 50.112019, "t": 339.68344, "r": 286.36508, "b": 348.59, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "ground-truth boxes, as we have already achieved a one-to-", "bbox": {"l": 50.112019, "t": 351.63843, "r": 286.36511, "b": 360.54498, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "one match through two steps: 1) Our token input sequence", "bbox": {"l": 50.112019, "t": 363.59341, "r": 286.36508, "b": 372.49996999999996, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "is naturally ordered, therefore the hidden states of the table", "bbox": {"l": 50.112019, "t": 375.5484, "r": 286.36511, "b": 384.45496, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "data cells are also in order when they are provided as in-", "bbox": {"l": 50.112019, "t": 387.50339, "r": 286.36514, "b": 396.40994, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "put to the", "bbox": {"l": 50.112019, "t": 399.45938, "r": 88.68721, "b": 408.36594, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "Cell BBox Decoder", "bbox": {"l": 91.646019, "t": 399.54904, "r": 170.0517, "b": 408.13681, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": ", and 2) Our bounding boxes", "bbox": {"l": 170.05103, "t": 399.45938, "r": 286.36438, "b": 408.36594, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "generation mechanism (see Sec.", "bbox": {"l": 50.112022, "t": 411.41437, "r": 181.96703, "b": 420.32092, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "3)", "bbox": {"l": 189.09029, "t": 411.41437, "r": 197.74918, "b": 420.32092, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "ensures a one-to-one", "bbox": {"l": 200.34789, "t": 411.41437, "r": 286.36511, "b": 420.32092, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "mapping between the cell content and its bounding box for", "bbox": {"l": 50.112022, "t": 423.36934999999994, "r": 286.36511, "b": 432.27591, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "all post-processed datasets.", "bbox": {"l": 50.112022, "t": 435.32434, "r": 158.2959, "b": 444.2309, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Loss Functions. We formulate a multi-task loss Eq. 2 to train our network. The Cross-Entropy loss (denoted as l$_{s}$ ) is used to train the Structure Decoder which predicts the structure tokens. As for the Cell BBox Decoder it is trained with a combination of losses denoted as l$_{box}$ . l$_{box}$ consists of the generally used l$_{1}$ loss for object detection and the IoU loss ( l$_{iou}$ ) to be scale invariant as explained in [25]. In comparison to DETR, we do not use the Hungarian algorithm [15] to match the predicted bounding boxes with the ground-truth boxes, as we have already achieved a one-toone match through two steps: 1) Our token input sequence is naturally ordered, therefore the hidden states of the table data cells are also in order when they are provided as input to the Cell BBox Decoder , and 2) Our bounding boxes generation mechanism (see Sec. 3) ensures a one-to-one mapping between the cell content and its bounding box for all post-processed datasets."}, {"label": "text", "id": 11, "page_no": 5, "cluster": {"id": 11, "label": "text", "bbox": {"l": 50.112022, "t": 448.01035, "r": 286.36499, "b": 468.87189, "coord_origin": "TOPLEFT"}, "confidence": 0.9724196195602417, "cells": [{"id": 49, "text": "The loss used to train the TableFormer can be defined as", "bbox": {"l": 62.067024, "t": 448.01035, "r": 286.36499, "b": 456.9169, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "following:", "bbox": {"l": 50.112022, "t": 459.96533, "r": 91.377113, "b": 468.87189, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The loss used to train the TableFormer can be defined as following:"}, {"label": "formula", "id": 15, "page_no": 5, "cluster": {"id": 15, "label": "formula", "bbox": {"l": 124.33002, "t": 493.28094, "r": 286.36243, "b": 517.07172, "coord_origin": "TOPLEFT"}, "confidence": 0.9423348307609558, "cells": [{"id": 51, "text": "l$_{box}$", "bbox": {"l": 125.71502, "t": 493.28094, "r": 140.64182, "b": 502.12772, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "=", "bbox": {"l": 143.90701, "t": 493.28094, "r": 151.65593, "b": 502.12772, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "\u03bb$_{iou}$l$_{iou}$", "bbox": {"l": 154.42302, "t": 493.28094, "r": 186.62846, "b": 502.12772, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "+", "bbox": {"l": 189.34003, "t": 493.28094, "r": 197.08894, "b": 502.12772, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "\u03bb$_{l}$$_{1}$", "bbox": {"l": 199.30302, "t": 493.28094, "r": 211.64659, "b": 502.12772, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "l", "bbox": {"l": 124.33002, "t": 508.22495, "r": 127.30286, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "=", "bbox": {"l": 130.26602, "t": 508.22495, "r": 138.01494, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "\u03bbl$_{s}$", "bbox": {"l": 140.78203, "t": 508.22495, "r": 153.32629, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "+ (1", "bbox": {"l": 156.03903, "t": 508.22495, "r": 174.85541, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "\u2212", "bbox": {"l": 177.07103, "t": 507.66702, "r": 184.81995, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "\u03bb", "bbox": {"l": 187.03304, "t": 508.22495, "r": 192.84422, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": ")", "bbox": {"l": 192.84503, "t": 508.22495, "r": 196.71948, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "l$_{box}$", "bbox": {"l": 196.71902, "t": 508.22495, "r": 211.64583, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "(1)", "bbox": {"l": 274.74603, "t": 501.01132, "r": 286.36243, "b": 509.91788, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "l$_{box}$ = \u03bb$_{iou}$l$_{iou}$ + \u03bb$_{l}$$_{1}$ l = \u03bbl$_{s}$ + (1 \u2212 \u03bb ) l$_{box}$ (1)"}, {"label": "text", "id": 16, "page_no": 5, "cluster": {"id": 16, "label": "text", "bbox": {"l": 50.11203, "t": 530.5920100000001, "r": 281.59692, "b": 540.21588, "coord_origin": "TOPLEFT"}, "confidence": 0.9363929629325867, "cells": [{"id": 65, "text": "where", "bbox": {"l": 50.11203, "t": 531.30933, "r": 74.450661, "b": 540.21588, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "\u03bb", "bbox": {"l": 76.941032, "t": 531.14993, "r": 82.75222, "b": 539.9967, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "\u2208", "bbox": {"l": 85.520035, "t": 530.5920100000001, "r": 92.162102, "b": 539.9967, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "[0, 1], and", "bbox": {"l": 94.653038, "t": 531.30933, "r": 135.59932, "b": 540.21588, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "\u03bb$_{iou}$, \u03bb$_{l}$$_{1}$", "bbox": {"l": 138.09004, "t": 531.14993, "r": 172.63162, "b": 539.9967, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "\u2208$_{R}$", "bbox": {"l": 175.89705, "t": 530.5920100000001, "r": 192.50104, "b": 539.9967, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "are hyper-parameters.", "bbox": {"l": 194.99205, "t": 531.30933, "r": 281.59692, "b": 540.21588, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "where \u03bb \u2208 [0, 1], and \u03bb$_{iou}$, \u03bb$_{l}$$_{1}$ \u2208$_{R}$ are hyper-parameters."}, {"label": "section_header", "id": 12, "page_no": 5, "cluster": {"id": 12, "label": "section_header", "bbox": {"l": 50.112045, "t": 555.91689, "r": 171.98335, "b": 566.66461, "coord_origin": "TOPLEFT"}, "confidence": 0.9554555416107178, "cells": [{"id": 72, "text": "5.", "bbox": {"l": 50.112045, "t": 555.91689, "r": 57.92831799999999, "b": 566.66461, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "Experimental Results", "bbox": {"l": 68.350014, "t": 555.91689, "r": 171.98335, "b": 566.66461, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5. Experimental Results"}, {"label": "section_header", "id": 13, "page_no": 5, "cluster": {"id": 13, "label": "section_header", "bbox": {"l": 50.112045, "t": 576.26433, "r": 179.17502, "b": 586.1163799999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9538503289222717, "cells": [{"id": 74, "text": "5.1.", "bbox": {"l": 50.112045, "t": 576.26433, "r": 64.693237, "b": 586.1163799999999, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "Implementation Details", "bbox": {"l": 74.414032, "t": 576.26433, "r": 179.17502, "b": 586.1163799999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5.1. Implementation Details"}, {"label": "text", "id": 7, "page_no": 5, "cluster": {"id": 7, "label": "text", "bbox": {"l": 50.112045, "t": 595.73433, "r": 286.36517, "b": 640.50688, "coord_origin": "TOPLEFT"}, "confidence": 0.9856163263320923, "cells": [{"id": 76, "text": "TableFormer uses ResNet-18 as the", "bbox": {"l": 62.067047, "t": 595.73433, "r": 202.97806, "b": 604.64088, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "CNN Backbone Net-", "bbox": {"l": 205.38405, "t": 595.82399, "r": 286.36008, "b": 604.41174, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "work", "bbox": {"l": 50.112045, "t": 607.77899, "r": 70.037247, "b": 616.3667399999999, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": ". The input images are resized to 448*448 pixels and", "bbox": {"l": 70.037048, "t": 607.68933, "r": 286.36496, "b": 616.59589, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "the feature map has a dimension of 28*28. Additionally, we", "bbox": {"l": 50.112049, "t": 619.64433, "r": 286.36517, "b": 628.55089, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "enforce the following input constraints:", "bbox": {"l": 50.112049, "t": 631.60033, "r": 207.03294, "b": 640.50688, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "TableFormer uses ResNet-18 as the CNN Backbone Network . The input images are resized to 448*448 pixels and the feature map has a dimension of 28*28. Additionally, we enforce the following input constraints:"}, {"label": "formula", "id": 18, "page_no": 5, "cluster": {"id": 18, "label": "formula", "bbox": {"l": 91.661049, "t": 653.828, "r": 286.36246, "b": 678.39588, "coord_origin": "TOPLEFT"}, "confidence": 0.844183623790741, "cells": [{"id": 82, "text": "Image width and height", "bbox": {"l": 91.661049, "t": 654.54532, "r": 186.01683, "b": 663.45187, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "\u2264", "bbox": {"l": 188.50705, "t": 653.828, "r": 196.25597, "b": 663.2327, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "1024 pixels", "bbox": {"l": 198.74605, "t": 654.54532, "r": 244.81310999999997, "b": 663.45187, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "Structural tags length", "bbox": {"l": 101.01604, "t": 669.48932, "r": 186.24606, "b": 678.39588, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "\u2264", "bbox": {"l": 188.73605, "t": 668.77201, "r": 196.48497, "b": 678.1767, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "512 tokens.", "bbox": {"l": 198.97505, "t": 669.48932, "r": 244.81296999999998, "b": 678.39588, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "(2)", "bbox": {"l": 274.74606, "t": 662.11731, "r": 286.36246, "b": 671.02388, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Image width and height \u2264 1024 pixels Structural tags length \u2264 512 tokens. (2)"}, {"label": "text", "id": 10, "page_no": 5, "cluster": {"id": 10, "label": "text", "bbox": {"l": 50.112061, "t": 692.290314, "r": 286.36514, "b": 713.151878, "coord_origin": "TOPLEFT"}, "confidence": 0.9724979996681213, "cells": [{"id": 89, "text": "Although input constraints are used also by other methods,", "bbox": {"l": 50.112061, "t": 692.290314, "r": 286.36514, "b": 701.196877, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "such as EDD, ours are less restrictive due to the improved", "bbox": {"l": 50.112061, "t": 704.245316, "r": 286.36514, "b": 713.151878, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Although input constraints are used also by other methods, such as EDD, ours are less restrictive due to the improved"}, {"label": "text", "id": 9, "page_no": 5, "cluster": {"id": 9, "label": "text", "bbox": {"l": 308.86206, "t": 75.20830999999998, "r": 545.11523, "b": 108.0249, "coord_origin": "TOPLEFT"}, "confidence": 0.9799237847328186, "cells": [{"id": 91, "text": "runtime performance and lower memory footprint of Table-", "bbox": {"l": 308.86206, "t": 75.20830999999998, "r": 545.11523, "b": 84.11487, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Former.", "bbox": {"l": 308.86206, "t": 87.16332999999997, "r": 339.98523, "b": 96.06988999999999, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "This allows to utilize input samples with longer", "bbox": {"l": 346.88931, "t": 87.16332999999997, "r": 545.11523, "b": 96.06988999999999, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "sequences and images with larger dimensions.", "bbox": {"l": 308.86206, "t": 99.11835000000008, "r": 492.96097, "b": 108.0249, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "runtime performance and lower memory footprint of TableFormer. This allows to utilize input samples with longer sequences and images with larger dimensions."}, {"label": "text", "id": 1, "page_no": 5, "cluster": {"id": 1, "label": "text", "bbox": {"l": 308.86206, "t": 116.22937000000002, "r": 545.1153, "b": 328.37405, "coord_origin": "TOPLEFT"}, "confidence": 0.9880930781364441, "cells": [{"id": 95, "text": "The Transformer Encoder consists of two \u201cTransformer", "bbox": {"l": 320.81705, "t": 116.22937000000002, "r": 545.11499, "b": 125.13593000000003, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "Encoder Layers\u201d, with an input feature size of 512, feed", "bbox": {"l": 308.86206, "t": 128.18439, "r": 545.11517, "b": 137.09094000000005, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "forward network of 1024, and 4 attention heads. As for the", "bbox": {"l": 308.86206, "t": 140.13940000000002, "r": 545.11505, "b": 149.04596000000004, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "Transformer Decoder it is composed of four \u201cTransformer", "bbox": {"l": 308.86206, "t": 152.09442, "r": 545.11511, "b": 161.00098000000003, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "Decoder Layers\u201d with similar input and output dimensions", "bbox": {"l": 308.86206, "t": 164.04944, "r": 545.11517, "b": 172.95599000000004, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "as the \u201cTransformer Encoder Layers\u201d.", "bbox": {"l": 308.86206, "t": 176.00543000000005, "r": 467.21756000000005, "b": 184.91198999999995, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "Even though our", "bbox": {"l": 475.43671, "t": 176.00543000000005, "r": 545.11511, "b": 184.91198999999995, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "model uses fewer layers and heads than the default imple-", "bbox": {"l": 308.86206, "t": 187.96045000000004, "r": 545.11511, "b": 196.86699999999996, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "mentation parameters, our extensive experimentation has", "bbox": {"l": 308.86206, "t": 199.91547000000003, "r": 545.11511, "b": 208.82201999999995, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "proved this setup to be more suitable for table images. We", "bbox": {"l": 308.86206, "t": 211.87048000000004, "r": 545.11517, "b": 220.77704000000006, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "attribute this finding to the inherent design of table im-", "bbox": {"l": 308.86206, "t": 223.82550000000003, "r": 545.11511, "b": 232.73206000000005, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "ages, which contain mostly lines and text, unlike the more", "bbox": {"l": 308.86206, "t": 235.78052000000002, "r": 545.11511, "b": 244.68706999999995, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "elaborate content present in other scopes (e.g. the COCO", "bbox": {"l": 308.86206, "t": 247.73650999999995, "r": 545.11523, "b": 256.64306999999997, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "dataset).", "bbox": {"l": 308.86206, "t": 259.69152999999994, "r": 342.3364, "b": 268.59808, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "Moreover, we have added ResNet blocks to the", "bbox": {"l": 348.95157, "t": 259.69152999999994, "r": 545.11517, "b": 268.59808, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "inputs of the Structure Decoder and Cell BBox Decoder.", "bbox": {"l": 308.86206, "t": 271.64655000000005, "r": 545.11517, "b": 280.55310000000003, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "This prevents a decoder having a stronger influence over the", "bbox": {"l": 308.86206, "t": 283.6015300000001, "r": 545.1153, "b": 292.50809, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "learned weights which would damage the other prediction", "bbox": {"l": 308.86206, "t": 295.55652, "r": 545.11511, "b": 304.46307, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "task (structure vs bounding boxes), but learn task specific", "bbox": {"l": 308.86206, "t": 307.51151, "r": 545.11511, "b": 316.41806, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "weights instead. Lastly our dropout layers are set to 0.5.", "bbox": {"l": 308.86206, "t": 319.4674999999999, "r": 532.48267, "b": 328.37405, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The Transformer Encoder consists of two \"Transformer Encoder Layers\", with an input feature size of 512, feed forward network of 1024, and 4 attention heads. As for the Transformer Decoder it is composed of four \"Transformer Decoder Layers\" with similar input and output dimensions as the \"Transformer Encoder Layers\". Even though our model uses fewer layers and heads than the default implementation parameters, our extensive experimentation has proved this setup to be more suitable for table images. We attribute this finding to the inherent design of table images, which contain mostly lines and text, unlike the more elaborate content present in other scopes (e.g. the COCO dataset). Moreover, we have added ResNet blocks to the inputs of the Structure Decoder and Cell BBox Decoder. This prevents a decoder having a stronger influence over the learned weights which would damage the other prediction task (structure vs bounding boxes), but learn task specific weights instead. Lastly our dropout layers are set to 0.5."}, {"label": "text", "id": 3, "page_no": 5, "cluster": {"id": 3, "label": "text", "bbox": {"l": 308.86203, "t": 336.57751, "r": 545.11517, "b": 429.16998, "coord_origin": "TOPLEFT"}, "confidence": 0.9877589344978333, "cells": [{"id": 115, "text": "For training, TableFormer is trained with 3 Adam opti-", "bbox": {"l": 320.81705, "t": 336.57751, "r": 545.11499, "b": 345.48407000000003, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "mizers, each one for the", "bbox": {"l": 308.86206, "t": 348.5325000000001, "r": 403.7359, "b": 357.43906, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "CNN Backbone Network", "bbox": {"l": 406.07605, "t": 348.62216, "r": 503.54016, "b": 357.20993, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": ",", "bbox": {"l": 503.53906, "t": 348.5325000000001, "r": 506.02972, "b": 357.43906, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "Structure", "bbox": {"l": 508.40004999999996, "t": 348.62216, "r": 545.11224, "b": 357.20993, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "Decoder", "bbox": {"l": 308.86206, "t": 360.57715, "r": 343.1633, "b": 369.16492000000005, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": ", and", "bbox": {"l": 343.16306, "t": 360.48749, "r": 362.2016, "b": 369.39404, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Cell BBox Decoder", "bbox": {"l": 364.28604, "t": 360.57715, "r": 440.93829, "b": 369.16492000000005, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": ". Taking the PubTabNet as", "bbox": {"l": 440.93903, "t": 360.48749, "r": 545.10797, "b": 369.39404, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "an example for our parameter set up, the initializing learn-", "bbox": {"l": 308.86203, "t": 372.44247, "r": 545.11511, "b": 381.34903, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "ing rate is 0.001 for 12 epochs with a batch size of 24, and", "bbox": {"l": 308.86203, "t": 384.3984699999999, "r": 545.11517, "b": 393.30502, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "\u03bb", "bbox": {"l": 308.86203, "t": 396.19406000000004, "r": 314.67322, "b": 405.04083, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "set to 0.5.", "bbox": {"l": 318.65802, "t": 396.35345, "r": 360.39139, "b": 405.2600100000001, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "Afterwards, we reduce the learning rate to", "bbox": {"l": 367.96295, "t": 396.35345, "r": 545.10803, "b": 405.2600100000001, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "0.0001, the batch size to 18 and train for 12 more epochs or", "bbox": {"l": 308.86203, "t": 408.30844, "r": 545.11511, "b": 417.215, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "convergence.", "bbox": {"l": 308.86203, "t": 420.26343, "r": 360.9664, "b": 429.16998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "For training, TableFormer is trained with 3 Adam optimizers, each one for the CNN Backbone Network , Structure Decoder , and Cell BBox Decoder . Taking the PubTabNet as an example for our parameter set up, the initializing learning rate is 0.001 for 12 epochs with a batch size of 24, and \u03bb set to 0.5. Afterwards, we reduce the learning rate to 0.0001, the batch size to 18 and train for 12 more epochs or convergence."}, {"label": "text", "id": 0, "page_no": 5, "cluster": {"id": 0, "label": "text", "bbox": {"l": 308.86203, "t": 437.37441999999993, "r": 545.11523, "b": 553.87689, "coord_origin": "TOPLEFT"}, "confidence": 0.9884491562843323, "cells": [{"id": 131, "text": "TableFormer is implemented with PyTorch and Torchvi-", "bbox": {"l": 320.81702, "t": 437.37441999999993, "r": 545.11499, "b": 446.28098, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "sion libraries [22].", "bbox": {"l": 308.86203, "t": 449.32941, "r": 384.62759, "b": 458.23596, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "To speed up the inference, the image", "bbox": {"l": 391.37228, "t": 449.32941, "r": 545.11511, "b": 458.23596, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "undergoes a single forward pass through the", "bbox": {"l": 308.86203, "t": 461.28439, "r": 494.00693000000007, "b": 470.19095, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "CNN Back-", "bbox": {"l": 498.07803, "t": 461.37405, "r": 545.11145, "b": 469.96182, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "bone Network", "bbox": {"l": 308.86203, "t": 473.32904, "r": 364.44336, "b": 481.91681, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "and transformer encoder. This eliminates the", "bbox": {"l": 367.06104, "t": 473.23938, "r": 545.11267, "b": 482.14594, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "overhead of generating the same features for each decoding", "bbox": {"l": 308.86203, "t": 485.19437, "r": 545.11511, "b": 494.10092, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "step. Similarly, we employ a \u2019caching\u2019 technique to preform", "bbox": {"l": 308.86203, "t": 497.14935, "r": 545.11523, "b": 506.05591, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "faster autoregressive decoding. This is achieved by storing", "bbox": {"l": 308.86203, "t": 509.10535, "r": 545.11511, "b": 518.0119, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "the features of decoded tokens so we can reuse them for", "bbox": {"l": 308.86203, "t": 521.06033, "r": 545.11517, "b": 529.9668899999999, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "each time step. Therefore, we only compute the attention", "bbox": {"l": 308.86203, "t": 533.01532, "r": 545.11517, "b": 541.9218900000001, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "for each new tag.", "bbox": {"l": 308.86203, "t": 544.97034, "r": 377.21548, "b": 553.87689, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "TableFormer is implemented with PyTorch and Torchvision libraries [22]. To speed up the inference, the image undergoes a single forward pass through the CNN Backbone Network and transformer encoder. This eliminates the overhead of generating the same features for each decoding step. Similarly, we employ a 'caching' technique to preform faster autoregressive decoding. This is achieved by storing the features of decoded tokens so we can reuse them for each time step. Therefore, we only compute the attention for each new tag."}, {"label": "section_header", "id": 14, "page_no": 5, "cluster": {"id": 14, "label": "section_header", "bbox": {"l": 308.86203, "t": 579.55432, "r": 397.44281, "b": 589.40637, "coord_origin": "TOPLEFT"}, "confidence": 0.9450808763504028, "cells": [{"id": 144, "text": "5.2.", "bbox": {"l": 308.86203, "t": 579.55432, "r": 323.9046, "b": 589.40637, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "Generalization", "bbox": {"l": 333.93301, "t": 579.55432, "r": 397.44281, "b": 589.40637, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5.2. Generalization"}, {"label": "text", "id": 2, "page_no": 5, "cluster": {"id": 2, "label": "text", "bbox": {"l": 308.86203, "t": 603.44933, "r": 545.11517, "b": 672.13189, "coord_origin": "TOPLEFT"}, "confidence": 0.9880595803260803, "cells": [{"id": 146, "text": "TableFormer is evaluated on three major publicly avail-", "bbox": {"l": 320.81702, "t": 603.44933, "r": 545.11493, "b": 612.3558800000001, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "able datasets of different nature to prove the generalization", "bbox": {"l": 308.86203, "t": 615.40433, "r": 545.11511, "b": 624.31088, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "and effectiveness of our model. The datasets used for eval-", "bbox": {"l": 308.86203, "t": 627.35933, "r": 545.11517, "b": 636.26588, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "uation are the PubTabNet, FinTabNet and TableBank which", "bbox": {"l": 308.86203, "t": 639.31433, "r": 545.11511, "b": 648.22089, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "stem from the scientific, financial and general domains re-", "bbox": {"l": 308.86203, "t": 651.27032, "r": 545.11517, "b": 660.17688, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "spectively.", "bbox": {"l": 308.86203, "t": 663.22533, "r": 350.70493, "b": 672.13189, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "TableFormer is evaluated on three major publicly available datasets of different nature to prove the generalization and effectiveness of our model. The datasets used for evaluation are the PubTabNet, FinTabNet and TableBank which stem from the scientific, financial and general domains respectively."}, {"label": "text", "id": 8, "page_no": 5, "cluster": {"id": 8, "label": "text", "bbox": {"l": 308.86203, "t": 680.33533, "r": 545.11523, "b": 713.152893, "coord_origin": "TOPLEFT"}, "confidence": 0.9830910563468933, "cells": [{"id": 152, "text": "We also share our baseline results on the challenging", "bbox": {"l": 320.81702, "t": 680.33533, "r": 545.11505, "b": 689.24189, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "SynthTabNet dataset.", "bbox": {"l": 308.86203, "t": 692.290329, "r": 396.21411, "b": 701.196892, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "Throughout our experiments, the", "bbox": {"l": 406.40585, "t": 692.290329, "r": 545.11523, "b": 701.196892, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "same parameters stated in Sec. 5.1 are utilized.", "bbox": {"l": 308.86203, "t": 704.246323, "r": 495.93982, "b": 713.152893, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "We also share our baseline results on the challenging SynthTabNet dataset. Throughout our experiments, the same parameters stated in Sec. 5.1 are utilized."}], "headers": [{"label": "page_footer", "id": 17, "page_no": 5, "cluster": {"id": 17, "label": "page_footer", "bbox": {"l": 295.12103, "t": 734.133327, "r": 300.10233, "b": 743.03989, "coord_origin": "TOPLEFT"}, "confidence": 0.8820409178733826, "cells": [{"id": 156, "text": "6", "bbox": {"l": 295.12103, "t": 734.133327, "r": 300.10233, "b": 743.03989, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "6"}]}}, {"page_no": 6, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "5.3.", "bbox": {"l": 50.112, "t": 74.40137000000016, "r": 63.704811, "b": 84.25342, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Datasets and Metrics", "bbox": {"l": 72.766685, "t": 74.40137000000016, "r": 167.89825, "b": 84.25342, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "The Tree-Edit-Distance-Based Similarity (TEDS) met-", "bbox": {"l": 62.067001, "t": 93.35039999999992, "r": 286.36499, "b": 102.25696000000016, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "ric was introduced in [37]. It represents the prediction, and", "bbox": {"l": 50.112, "t": 105.30542000000003, "r": 286.36511, "b": 114.21198000000015, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "ground-truth as a tree structure of HTML tags. This simi-", "bbox": {"l": 50.112, "t": 117.26044000000002, "r": 286.36505, "b": 126.16699000000006, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "larity is calculated as:", "bbox": {"l": 50.112, "t": 129.21642999999995, "r": 136.71687, "b": 138.12298999999996, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "TEDS (", "bbox": {"l": 86.218994, "t": 157.05798000000004, "r": 118.8784, "b": 165.90479000000005, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "T$_{a}$, T$_{b}$", "bbox": {"l": 118.87499, "t": 157.05798000000004, "r": 143.26962, "b": 165.90479000000005, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": ") = 1", "bbox": {"l": 143.76799, "t": 157.05798000000004, "r": 165.9019, "b": 165.90479000000005, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "\u2212", "bbox": {"l": 168.12099, "t": 156.50012000000004, "r": 175.8699, "b": 165.90479000000005, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "EditDist (", "bbox": {"l": 179.27899, "t": 150.31799, "r": 221.95677, "b": 159.16479000000004, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "T$_{a}$, T$_{b}$", "bbox": {"l": 221.95200000000003, "t": 150.31799, "r": 246.34663, "b": 159.16479000000004, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": ")", "bbox": {"l": 246.84499999999997, "t": 150.31799, "r": 250.71945, "b": 159.16479000000004, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "max (", "bbox": {"l": 182.21201, "t": 163.89197000000001, "r": 206.29161, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "|", "bbox": {"l": 206.289, "t": 163.33411, "r": 209.05661, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "T$_{a}$", "bbox": {"l": 209.056, "t": 163.89197000000001, "r": 219.19968, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "|", "bbox": {"l": 219.69700999999998, "t": 163.33411, "r": 222.46461000000002, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": ",", "bbox": {"l": 224.125, "t": 163.89197000000001, "r": 226.89261, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "|", "bbox": {"l": 228.55299000000002, "t": 163.33411, "r": 231.3206, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "T$_{b}$", "bbox": {"l": 231.31999, "t": 163.89197000000001, "r": 240.64563, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "|", "bbox": {"l": 241.144, "t": 163.33411, "r": 243.91161, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": ")", "bbox": {"l": 243.911, "t": 163.89197000000001, "r": 247.78545, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "(3)", "bbox": {"l": 274.746, "t": 157.21740999999997, "r": 286.3624, "b": 166.12396, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "where", "bbox": {"l": 62.067001, "t": 181.16241000000002, "r": 86.405632, "b": 190.06897000000004, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "T$_{a}$", "bbox": {"l": 88.581001, "t": 181.00298999999995, "r": 98.724663, "b": 189.84978999999998, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "and", "bbox": {"l": 101.399, "t": 181.16241000000002, "r": 115.785, "b": 190.06897000000004, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "T$_{b}$", "bbox": {"l": 117.961, "t": 181.00298999999995, "r": 127.28664, "b": 189.84978999999998, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "represent tables in tree structure HTML", "bbox": {"l": 129.95999, "t": 181.16241000000002, "r": 286.36285, "b": 190.06897000000004, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "format. EditDist denotes the tree-edit distance, and", "bbox": {"l": 50.111992, "t": 193.11743, "r": 252.78116000000003, "b": 202.02399000000003, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "|", "bbox": {"l": 255.18201, "t": 192.40015000000005, "r": 257.94962, "b": 201.80480999999997, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "T", "bbox": {"l": 257.94901, "t": 192.95800999999994, "r": 263.77115, "b": 201.80480999999997, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "|", "bbox": {"l": 265.155, "t": 192.40015000000005, "r": 267.92261, "b": 201.80480999999997, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "rep-", "bbox": {"l": 270.32199, "t": 193.11743, "r": 286.36179, "b": 202.02399000000003, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "resents the number of nodes in", "bbox": {"l": 50.111984, "t": 205.07245, "r": 172.13388, "b": 213.97900000000004, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "T", "bbox": {"l": 174.62399, "t": 204.91301999999996, "r": 180.44614, "b": 213.75982999999997, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": ".", "bbox": {"l": 181.82899, "t": 205.07245, "r": 184.31964, "b": 213.97900000000004, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "5.4.", "bbox": {"l": 50.112, "t": 224.81946000000005, "r": 64.551605, "b": 234.67151, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "Quantitative Analysis", "bbox": {"l": 74.178009, "t": 224.81946000000005, "r": 170.45169, "b": 234.67151, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "Structure.", "bbox": {"l": 62.067001, "t": 243.6499, "r": 105.32461, "b": 252.60626000000002, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "As shown in Tab.", "bbox": {"l": 112.12600000000002, "t": 243.76946999999996, "r": 184.68361, "b": 252.67602999999997, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "2, TableFormer outper-", "bbox": {"l": 191.4781, "t": 243.76946999999996, "r": 286.36188, "b": 252.67602999999997, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "forms all SOTA methods across different datasets by a large", "bbox": {"l": 50.112, "t": 255.72448999999995, "r": 286.36508, "b": 264.63104, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "margin for predicting the table structure from an image.", "bbox": {"l": 50.112, "t": 267.67949999999996, "r": 286.36508, "b": 276.58606, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "All the more, our model outperforms pre-trained methods.", "bbox": {"l": 50.112, "t": 279.63446, "r": 286.36508, "b": 288.54105, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "During the evaluation we do not apply any table filtering.", "bbox": {"l": 50.112, "t": 291.59048, "r": 286.36514, "b": 300.49704, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "We also provide our baseline results on the SynthTabNet", "bbox": {"l": 50.112, "t": 303.54547, "r": 286.36508, "b": 312.45203000000004, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "dataset. It has been observed that large tables (e.g. tables", "bbox": {"l": 50.112, "t": 315.50046, "r": 286.36505, "b": 324.40700999999996, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "that occupy half of the page or more) yield poor predictions.", "bbox": {"l": 50.112, "t": 327.45544, "r": 286.36508, "b": 336.362, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "We attribute this issue to the image resizing during the pre-", "bbox": {"l": 50.112, "t": 339.41043, "r": 286.36508, "b": 348.31699000000003, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "processing step, that produces downsampled images with", "bbox": {"l": 50.112, "t": 351.36542, "r": 286.36505, "b": 360.27197, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "indistinguishable features. This problem can be addressed", "bbox": {"l": 50.112, "t": 363.32141, "r": 286.36508, "b": 372.2279700000001, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "by treating such big tables with a separate model which ac-", "bbox": {"l": 50.112, "t": 375.2764, "r": 286.36511, "b": 384.18295000000006, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "cepts a large input image size.", "bbox": {"l": 50.112, "t": 387.23138, "r": 170.01187, "b": 396.13794, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Model", "bbox": {"l": 78.843002, "t": 420.69037, "r": 104.85535, "b": 429.59692, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "TEDS", "bbox": {"l": 211.2, "t": 414.71237, "r": 236.10649, "b": 423.61893, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "Dataset", "bbox": {"l": 129.338, "t": 426.66736, "r": 159.21584, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Simple", "bbox": {"l": 171.17096, "t": 426.66736, "r": 199.40497, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Complex", "bbox": {"l": 211.36009, "t": 426.66736, "r": 247.74349999999998, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "All", "bbox": {"l": 264.54044, "t": 426.66736, "r": 277.27264, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "EDD", "bbox": {"l": 81.612, "t": 443.62436, "r": 102.08514, "b": 452.53091, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "PTN", "bbox": {"l": 134.87206, "t": 443.62436, "r": 153.69141, "b": 452.53091, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "91.1", "bbox": {"l": 176.56554, "t": 443.62436, "r": 194.00009, "b": 452.53091, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "88.7", "bbox": {"l": 220.82938000000001, "t": 443.62436, "r": 238.26393, "b": 452.53091, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "89.9", "bbox": {"l": 262.18414, "t": 443.62436, "r": 279.61868, "b": 452.53091, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "GTE", "bbox": {"l": 82.165001, "t": 455.58035, "r": 101.5323, "b": 464.48691, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "PTN", "bbox": {"l": 134.86716, "t": 455.58035, "r": 153.68651, "b": 464.48691, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "-", "bbox": {"l": 183.62411, "t": 455.58035, "r": 186.94167, "b": 464.48691, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "-", "bbox": {"l": 227.88795000000002, "t": 455.58035, "r": 231.20551, "b": 464.48691, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "93.01", "bbox": {"l": 259.69855, "t": 455.58035, "r": 282.11441, "b": 464.48691, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 468.13336, "r": 117.38329000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "PTN", "bbox": {"l": 134.86766, "t": 468.13336, "r": 153.68701, "b": 477.03992, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "98.5", "bbox": {"l": 176.57111, "t": 468.13336, "r": 194.00566, "b": 477.03992, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "95.0", "bbox": {"l": 220.83495, "t": 468.13336, "r": 238.26950000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "96.75", "bbox": {"l": 259.698, "t": 468.01379, "r": 282.11386, "b": 476.97018, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "EDD", "bbox": {"l": 81.612, "t": 483.32635, "r": 102.08514, "b": 492.23291, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "FTN", "bbox": {"l": 134.87206, "t": 483.32635, "r": 153.69141, "b": 492.23291, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "88.4", "bbox": {"l": 176.56554, "t": 483.32635, "r": 194.00009, "b": 492.23291, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "92.08", "bbox": {"l": 218.33870999999996, "t": 483.32635, "r": 240.75455999999997, "b": 492.23291, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "90.6", "bbox": {"l": 262.18411, "t": 483.32635, "r": 279.61865, "b": 492.23291, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "GTE", "bbox": {"l": 82.165001, "t": 495.28134, "r": 101.5323, "b": 504.1879, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "FTN", "bbox": {"l": 134.86716, "t": 495.28134, "r": 153.68651, "b": 504.1879, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "-", "bbox": {"l": 183.62411, "t": 495.28134, "r": 186.94167, "b": 504.1879, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "-", "bbox": {"l": 227.88795000000002, "t": 495.28134, "r": 231.20551, "b": 504.1879, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "87.14", "bbox": {"l": 259.69855, "t": 495.28134, "r": 282.11441, "b": 504.1879, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "GTE (FT)", "bbox": {"l": 71.789001, "t": 507.23633, "r": 111.90838999999998, "b": 516.14288, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "FTN", "bbox": {"l": 134.86221, "t": 507.23633, "r": 153.68156, "b": 516.14288, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "-", "bbox": {"l": 183.62914, "t": 507.23633, "r": 186.94669, "b": 516.14288, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "-", "bbox": {"l": 227.89297, "t": 507.23633, "r": 231.21053000000003, "b": 516.14288, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "91.02", "bbox": {"l": 259.6936, "t": 507.23633, "r": 282.10947, "b": 516.14288, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 519.1913099999999, "r": 117.38329000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "FTN", "bbox": {"l": 134.86766, "t": 519.1913099999999, "r": 153.68701, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "97.5", "bbox": {"l": 176.57111, "t": 519.1913099999999, "r": 194.00566, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "96.0", "bbox": {"l": 220.83495, "t": 519.1913099999999, "r": 238.26950000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "96.8", "bbox": {"l": 262.189, "t": 519.0717500000001, "r": 279.62354, "b": 528.02814, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "EDD", "bbox": {"l": 81.612, "t": 536.49837, "r": 102.08514, "b": 545.40492, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "TB", "bbox": {"l": 137.91064, "t": 536.49837, "r": 150.64285, "b": 545.40492, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "86.0", "bbox": {"l": 176.56554, "t": 536.49837, "r": 194.00009, "b": 545.40492, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "-", "bbox": {"l": 227.89285, "t": 536.49837, "r": 231.21040000000002, "b": 545.40492, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "86.0", "bbox": {"l": 262.18411, "t": 536.49837, "r": 279.61865, "b": 545.40492, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 548.45436, "r": 117.38329000000002, "b": 557.36092, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "TB", "bbox": {"l": 137.90625, "t": 548.45436, "r": 150.63846, "b": 557.36092, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "89.6", "bbox": {"l": 176.57111, "t": 548.45436, "r": 194.00566, "b": 557.36092, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "-", "bbox": {"l": 227.88845999999998, "t": 548.45436, "r": 231.20601, "b": 557.36092, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "89.6", "bbox": {"l": 262.189, "t": 548.3348100000001, "r": 279.62354, "b": 557.2911799999999, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 568.00237, "r": 117.38329000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "STN", "bbox": {"l": 134.86766, "t": 568.00237, "r": 153.68701, "b": 576.90892, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "96.9", "bbox": {"l": 176.57111, "t": 568.00237, "r": 194.00566, "b": 576.90892, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "95.7", "bbox": {"l": 220.83495, "t": 568.00237, "r": 238.26950000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "96.7", "bbox": {"l": 262.1897, "t": 568.00237, "r": 279.62424, "b": 576.90892, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "Table 2: Structure results on PubTabNet (PTN), FinTabNet", "bbox": {"l": 50.112, "t": 592.43336, "r": 286.36511, "b": 601.33992, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "(FTN), TableBank (TB) and SynthTabNet (STN).", "bbox": {"l": 50.112, "t": 604.38837, "r": 247.46114, "b": 613.29492, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "FT: Model was trained on PubTabNet then finetuned.", "bbox": {"l": 50.112, "t": 616.34337, "r": 261.78732, "b": 625.24992, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "Cell Detection.", "bbox": {"l": 62.067001, "t": 644.3498099999999, "r": 124.72179, "b": 653.30618, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "Like any object detector, our", "bbox": {"l": 128.20401, "t": 644.46936, "r": 242.9333, "b": 653.37592, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "Cell BBox", "bbox": {"l": 245.55401999999998, "t": 644.55902, "r": 286.36084, "b": 653.1467700000001, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "Detector", "bbox": {"l": 50.112015, "t": 656.51402, "r": 84.971146, "b": 665.10178, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "provides bounding boxes that can be improved", "bbox": {"l": 89.515015, "t": 656.42436, "r": 286.366, "b": 665.33092, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "with post-processing during inference. We make use of the", "bbox": {"l": 50.112015, "t": 668.37936, "r": 286.36511, "b": 677.28593, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "grid-like structure of tables to refine the predictions. A de-", "bbox": {"l": 50.112015, "t": 680.33536, "r": 286.36505, "b": 689.24193, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "tailed explanation on the post-processing is available in the", "bbox": {"l": 50.112015, "t": 692.290359, "r": 286.36511, "b": 701.19693, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "supplementary material. As shown in Tab. 3, we evaluate", "bbox": {"l": 50.112015, "t": 704.245361, "r": 286.36508, "b": 713.151932, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "our", "bbox": {"l": 308.862, "t": 75.20836999999995, "r": 322.14215, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Cell BBox Decoder", "bbox": {"l": 325.45401, "t": 75.29803000000004, "r": 404.56702, "b": 83.88580000000002, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "accuracy for cells with a class la-", "bbox": {"l": 408.104, "t": 75.20836999999995, "r": 545.10968, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "bel of \u2018content\u2019 only using the PASCAL VOC mAP metric", "bbox": {"l": 308.862, "t": 87.16339000000005, "r": 545.11511, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "for pre-processing and post-processing.", "bbox": {"l": 308.862, "t": 99.11841000000004, "r": 470.22626, "b": 108.02495999999985, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "Note that we do", "bbox": {"l": 477.52884, "t": 99.11841000000004, "r": 545.11511, "b": 108.02495999999985, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "not have post-processing results for SynthTabNet as images", "bbox": {"l": 308.862, "t": 111.07343000000003, "r": 545.11517, "b": 119.97997999999984, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "are only provided. To compare the performance of our pro-", "bbox": {"l": 308.862, "t": 123.02844000000005, "r": 545.11511, "b": 131.93499999999995, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "posed approach, we\u2019ve integrated TableFormer\u2019s", "bbox": {"l": 308.862, "t": 134.98443999999995, "r": 502.01691000000005, "b": 143.89099, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "Cell BBox", "bbox": {"l": 504.47299, "t": 135.07410000000004, "r": 545.11041, "b": 143.66187000000002, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "Decoder", "bbox": {"l": 308.862, "t": 147.02910999999995, "r": 343.16324, "b": 155.61688000000004, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "into EDD architecture. As mentioned previously,", "bbox": {"l": 346.371, "t": 146.93944999999997, "r": 545.11493, "b": 155.84600999999998, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "the Structure Decoder provides the", "bbox": {"l": 308.862, "t": 158.89446999999996, "r": 446.15652, "b": 167.80102999999997, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "Cell BBox Decoder", "bbox": {"l": 448.28998000000007, "t": 158.98413000000005, "r": 525.04181, "b": 167.57190000000003, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "with", "bbox": {"l": 527.39899, "t": 158.89446999999996, "r": 545.11249, "b": 167.80102999999997, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "the features needed to predict the bounding box predictions.", "bbox": {"l": 308.862, "t": 170.84948999999995, "r": 545.11511, "b": 179.75603999999998, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "Therefore, the accuracy of the", "bbox": {"l": 308.862, "t": 182.80449999999996, "r": 432.86642000000006, "b": 191.71105999999997, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "Structure Decoder", "bbox": {"l": 436.39001, "t": 182.89417000000003, "r": 510.93021, "b": 191.48193000000003, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "directly", "bbox": {"l": 514.677, "t": 182.80449999999996, "r": 545.11273, "b": 191.71105999999997, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "influences the accuracy of the", "bbox": {"l": 308.862, "t": 194.75951999999995, "r": 431.17285, "b": 203.66607999999997, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "Cell BBox Decoder", "bbox": {"l": 434.6790199999999, "t": 194.84918000000005, "r": 514.18054, "b": 203.43695000000002, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": ". If the", "bbox": {"l": 514.17603, "t": 194.75951999999995, "r": 545.10992, "b": 203.66607999999997, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "Structure Decoder", "bbox": {"l": 308.86203, "t": 206.80517999999995, "r": 382.35614, "b": 215.39293999999995, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "predicts an extra column, this will result", "bbox": {"l": 385.07501, "t": 206.71551999999997, "r": 545.11426, "b": 215.62207, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "in an extra column of predicted bounding boxes.", "bbox": {"l": 308.862, "t": 218.67052999999999, "r": 501.6981799999999, "b": 227.57709, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "Model", "bbox": {"l": 339.323, "t": 253.66436999999996, "r": 365.33536, "b": 262.57092, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "Dataset", "bbox": {"l": 401.04132, "t": 253.66436999999996, "r": 430.91916, "b": 262.57092, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "mAP", "bbox": {"l": 454.10214, "t": 253.66436999999996, "r": 474.58523999999994, "b": 262.57092, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "mAP (PP)", "bbox": {"l": 486.54034, "t": 253.66436999999996, "r": 527.2276, "b": 262.57092, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "EDD+BBox", "bbox": {"l": 327.65601, "t": 270.62134000000003, "r": 377.00076, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "PubTabNet", "bbox": {"l": 393.69809, "t": 270.62134000000003, "r": 438.28073, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "79.2", "bbox": {"l": 455.63559, "t": 270.62134000000003, "r": 473.07013, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "82.7", "bbox": {"l": 498.16592, "t": 270.62134000000003, "r": 515.60046, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "TableFormer", "bbox": {"l": 326.79501, "t": 282.57631999999995, "r": 377.86331, "b": 291.48288, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "PubTabNet", "bbox": {"l": 393.69388, "t": 282.57631999999995, "r": 438.27652, "b": 291.48288, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "82.1", "bbox": {"l": 455.63101, "t": 282.45676, "r": 473.06555000000003, "b": 291.41315, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "86.8", "bbox": {"l": 498.1713, "t": 282.45676, "r": 515.60583, "b": 291.41315, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "TableFormer", "bbox": {"l": 326.79501, "t": 294.53131, "r": 377.86331, "b": 303.43787, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "SynthTabNet", "bbox": {"l": 389.81842, "t": 294.53131, "r": 442.15194999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "87.7", "bbox": {"l": 455.63135, "t": 294.53131, "r": 473.06589, "b": 303.43787, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "-", "bbox": {"l": 505.22515999999996, "t": 294.53131, "r": 508.54268999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "Table 3:", "bbox": {"l": 308.862, "t": 316.44931, "r": 341.49951, "b": 325.35587, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "Cell Bounding Box detection results on PubTab-", "bbox": {"l": 348.60284, "t": 316.44931, "r": 545.11517, "b": 325.35587, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "Net, and FinTabNet. PP: Post-processing.", "bbox": {"l": 308.862, "t": 328.4043, "r": 474.97845, "b": 337.3108500000001, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "Cell Content.", "bbox": {"l": 320.81699, "t": 367.6797199999999, "r": 378.94876, "b": 376.63611, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "In this section, we evaluate the entire", "bbox": {"l": 387.07898, "t": 367.79929, "r": 545.11566, "b": 376.70584, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "pipeline of recovering a table with content.", "bbox": {"l": 308.86197, "t": 379.75426999999996, "r": 487.19257, "b": 388.66083, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "Here we put", "bbox": {"l": 493.96713, "t": 379.75426999999996, "r": 545.11511, "b": 388.66083, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "our approach to test by capitalizing on extracting content", "bbox": {"l": 308.86197, "t": 391.70926, "r": 545.11505, "b": 400.61581, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "from the PDF cells rather than decoding from images. Tab.", "bbox": {"l": 308.86197, "t": 403.66525, "r": 545.11523, "b": 412.57181, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "4", "bbox": {"l": 308.86197, "t": 415.62024, "r": 314.08096, "b": 424.52679, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "shows the TEDs score of HTML code representing the", "bbox": {"l": 316.69046, "t": 415.62024, "r": 545.11517, "b": 424.52679, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "structure of the table along with the content inserted in the", "bbox": {"l": 308.86197, "t": 427.57523, "r": 545.11505, "b": 436.48177999999996, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "data cell and compared with the ground-truth. Our method", "bbox": {"l": 308.86197, "t": 439.53021, "r": 545.11505, "b": 448.43677, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "achieved a", "bbox": {"l": 308.86197, "t": 451.4852, "r": 350.23666, "b": 460.39175, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "5.3%", "bbox": {"l": 352.17596, "t": 451.36563, "r": 374.59183, "b": 460.32201999999995, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "increase over the state-of-the-art, and com-", "bbox": {"l": 376.53296, "t": 451.4852, "r": 545.11011, "b": 460.39175, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "mercial solutions. We believe our scores would be higher", "bbox": {"l": 308.86197, "t": 463.44019, "r": 545.11511, "b": 472.34674, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "if the HTML ground-truth matched the extracted PDF cell", "bbox": {"l": 308.86197, "t": 475.39618, "r": 545.11517, "b": 484.30273, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "content. Unfortunately, there are small discrepancies such", "bbox": {"l": 308.86197, "t": 487.35117, "r": 545.11511, "b": 496.25772, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "as spacings around words or special characters with various", "bbox": {"l": 308.86197, "t": 499.30615, "r": 545.11505, "b": 508.21271, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "unicode representations.", "bbox": {"l": 308.86197, "t": 511.26114, "r": 405.69846, "b": 520.16769, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "Model", "bbox": {"l": 358.01099, "t": 552.23337, "r": 384.02335, "b": 561.1399200000001, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "TEDS", "bbox": {"l": 449.03400000000005, "t": 546.25537, "r": 473.94049000000007, "b": 555.16193, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": "Simple", "bbox": {"l": 408.50598, "t": 558.21037, "r": 436.73999, "b": 567.11693, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "Complex", "bbox": {"l": 448.6951, "t": 558.21037, "r": 485.07849, "b": 567.11693, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "All", "bbox": {"l": 499.3848, "t": 558.21037, "r": 512.117, "b": 567.11693, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": "Tabula", "bbox": {"l": 357.68201, "t": 575.16736, "r": 384.3519, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "78.0", "bbox": {"l": 413.90097, "t": 575.16736, "r": 431.33550999999994, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "57.8", "bbox": {"l": 458.16479000000004, "t": 575.16736, "r": 475.59933000000007, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "67.9", "bbox": {"l": 497.0289, "t": 575.16736, "r": 514.46344, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": "Traprange", "bbox": {"l": 350.72299, "t": 587.12236, "r": 391.31064, "b": 596.02892, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "60.8", "bbox": {"l": 413.90582, "t": 587.12236, "r": 431.34036, "b": 596.02892, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "49.9", "bbox": {"l": 458.16965, "t": 587.12236, "r": 475.60419, "b": 596.02892, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "55.4", "bbox": {"l": 497.03374999999994, "t": 587.12236, "r": 514.46832, "b": 596.02892, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "Camelot", "bbox": {"l": 354.13599, "t": 599.07835, "r": 387.89923, "b": 607.98491, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "80.0", "bbox": {"l": 413.90161, "t": 599.07835, "r": 431.33615, "b": 607.98491, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "66.0", "bbox": {"l": 458.16544, "t": 599.07835, "r": 475.59998, "b": 607.98491, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "73.0", "bbox": {"l": 497.02954000000005, "t": 599.07835, "r": 514.46411, "b": 607.98491, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "Acrobat Pro", "bbox": {"l": 346.55899, "t": 611.03336, "r": 395.47534, "b": 619.93991, "coord_origin": "TOPLEFT"}}, {"id": 201, "text": "68.9", "bbox": {"l": 413.90616, "t": 611.03336, "r": 431.34069999999997, "b": 619.93991, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": "61.8", "bbox": {"l": 458.16998000000007, "t": 611.03336, "r": 475.60452, "b": 619.93991, "coord_origin": "TOPLEFT"}}, {"id": 203, "text": "65.3", "bbox": {"l": 497.03409, "t": 611.03336, "r": 514.46863, "b": 619.93991, "coord_origin": "TOPLEFT"}}, {"id": 204, "text": "EDD", "bbox": {"l": 360.78101, "t": 622.9883600000001, "r": 381.25415, "b": 631.89491, "coord_origin": "TOPLEFT"}}, {"id": 205, "text": "91.2", "bbox": {"l": 413.90158, "t": 622.9883600000001, "r": 431.33612, "b": 631.89491, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": "85.4", "bbox": {"l": 458.16541, "t": 622.9883600000001, "r": 475.59995000000004, "b": 631.89491, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": "88.3", "bbox": {"l": 497.0295100000001, "t": 622.9883600000001, "r": 514.46405, "b": 631.89491, "coord_origin": "TOPLEFT"}}, {"id": 208, "text": "TableFormer", "bbox": {"l": 345.483, "t": 634.94336, "r": 396.5513, "b": 643.84991, "coord_origin": "TOPLEFT"}}, {"id": 209, "text": "95.4", "bbox": {"l": 413.90616, "t": 634.94336, "r": 431.34069999999997, "b": 643.84991, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": "90.1", "bbox": {"l": 458.16998000000007, "t": 634.94336, "r": 475.60452, "b": 643.84991, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "93.6", "bbox": {"l": 497.03400000000005, "t": 634.82381, "r": 514.46857, "b": 643.78018, "coord_origin": "TOPLEFT"}}, {"id": 212, "text": "Table 4:", "bbox": {"l": 308.862, "t": 656.86136, "r": 341.73862, "b": 665.76792, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "Results of structure with content retrieved using", "bbox": {"l": 349.55927, "t": 656.86136, "r": 545.11517, "b": 665.76792, "coord_origin": "TOPLEFT"}}, {"id": 214, "text": "cell detection on PubTabNet. In all cases the input is PDF", "bbox": {"l": 308.862, "t": 668.81636, "r": 545.11505, "b": 677.7229199999999, "coord_origin": "TOPLEFT"}}, {"id": 215, "text": "documents with cropped tables.", "bbox": {"l": 308.862, "t": 680.77136, "r": 435.03836, "b": 689.6779300000001, "coord_origin": "TOPLEFT"}}, {"id": 216, "text": "7", "bbox": {"l": 295.121, "t": 734.133358, "r": 300.10229, "b": 743.039921, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 10, "label": "section_header", "bbox": {"l": 50.112, "t": 74.40137000000016, "r": 167.89825, "b": 84.25342, "coord_origin": "TOPLEFT"}, "confidence": 0.9554274082183838, "cells": [{"id": 0, "text": "5.3.", "bbox": {"l": 50.112, "t": 74.40137000000016, "r": 63.704811, "b": 84.25342, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Datasets and Metrics", "bbox": {"l": 72.766685, "t": 74.40137000000016, "r": 167.89825, "b": 84.25342, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 50.112, "t": 93.35039999999992, "r": 286.36511, "b": 138.12298999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9862998127937317, "cells": [{"id": 2, "text": "The Tree-Edit-Distance-Based Similarity (TEDS) met-", "bbox": {"l": 62.067001, "t": 93.35039999999992, "r": 286.36499, "b": 102.25696000000016, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "ric was introduced in [37]. It represents the prediction, and", "bbox": {"l": 50.112, "t": 105.30542000000003, "r": 286.36511, "b": 114.21198000000015, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "ground-truth as a tree structure of HTML tags. This simi-", "bbox": {"l": 50.112, "t": 117.26044000000002, "r": 286.36505, "b": 126.16699000000006, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "larity is calculated as:", "bbox": {"l": 50.112, "t": 129.21642999999995, "r": 136.71687, "b": 138.12298999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "formula", "bbox": {"l": 86.218994, "t": 150.31799, "r": 286.3624, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9500409364700317, "cells": [{"id": 6, "text": "TEDS (", "bbox": {"l": 86.218994, "t": 157.05798000000004, "r": 118.8784, "b": 165.90479000000005, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "T$_{a}$, T$_{b}$", "bbox": {"l": 118.87499, "t": 157.05798000000004, "r": 143.26962, "b": 165.90479000000005, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": ") = 1", "bbox": {"l": 143.76799, "t": 157.05798000000004, "r": 165.9019, "b": 165.90479000000005, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "\u2212", "bbox": {"l": 168.12099, "t": 156.50012000000004, "r": 175.8699, "b": 165.90479000000005, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "EditDist (", "bbox": {"l": 179.27899, "t": 150.31799, "r": 221.95677, "b": 159.16479000000004, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "T$_{a}$, T$_{b}$", "bbox": {"l": 221.95200000000003, "t": 150.31799, "r": 246.34663, "b": 159.16479000000004, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": ")", "bbox": {"l": 246.84499999999997, "t": 150.31799, "r": 250.71945, "b": 159.16479000000004, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "max (", "bbox": {"l": 182.21201, "t": 163.89197000000001, "r": 206.29161, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "|", "bbox": {"l": 206.289, "t": 163.33411, "r": 209.05661, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "T$_{a}$", "bbox": {"l": 209.056, "t": 163.89197000000001, "r": 219.19968, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "|", "bbox": {"l": 219.69700999999998, "t": 163.33411, "r": 222.46461000000002, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": ",", "bbox": {"l": 224.125, "t": 163.89197000000001, "r": 226.89261, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "|", "bbox": {"l": 228.55299000000002, "t": 163.33411, "r": 231.3206, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "T$_{b}$", "bbox": {"l": 231.31999, "t": 163.89197000000001, "r": 240.64563, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "|", "bbox": {"l": 241.144, "t": 163.33411, "r": 243.91161, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": ")", "bbox": {"l": 243.911, "t": 163.89197000000001, "r": 247.78545, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "(3)", "bbox": {"l": 274.746, "t": 157.21740999999997, "r": 286.3624, "b": 166.12396, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "text", "bbox": {"l": 50.111984, "t": 181.00298999999995, "r": 286.36285, "b": 213.97900000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9735319018363953, "cells": [{"id": 23, "text": "where", "bbox": {"l": 62.067001, "t": 181.16241000000002, "r": 86.405632, "b": 190.06897000000004, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "T$_{a}$", "bbox": {"l": 88.581001, "t": 181.00298999999995, "r": 98.724663, "b": 189.84978999999998, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "and", "bbox": {"l": 101.399, "t": 181.16241000000002, "r": 115.785, "b": 190.06897000000004, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "T$_{b}$", "bbox": {"l": 117.961, "t": 181.00298999999995, "r": 127.28664, "b": 189.84978999999998, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "represent tables in tree structure HTML", "bbox": {"l": 129.95999, "t": 181.16241000000002, "r": 286.36285, "b": 190.06897000000004, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "format. EditDist denotes the tree-edit distance, and", "bbox": {"l": 50.111992, "t": 193.11743, "r": 252.78116000000003, "b": 202.02399000000003, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "|", "bbox": {"l": 255.18201, "t": 192.40015000000005, "r": 257.94962, "b": 201.80480999999997, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "T", "bbox": {"l": 257.94901, "t": 192.95800999999994, "r": 263.77115, "b": 201.80480999999997, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "|", "bbox": {"l": 265.155, "t": 192.40015000000005, "r": 267.92261, "b": 201.80480999999997, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "rep-", "bbox": {"l": 270.32199, "t": 193.11743, "r": 286.36179, "b": 202.02399000000003, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "resents the number of nodes in", "bbox": {"l": 50.111984, "t": 205.07245, "r": 172.13388, "b": 213.97900000000004, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "T", "bbox": {"l": 174.62399, "t": 204.91301999999996, "r": 180.44614, "b": 213.75982999999997, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": ".", "bbox": {"l": 181.82899, "t": 205.07245, "r": 184.31964, "b": 213.97900000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "section_header", "bbox": {"l": 50.112, "t": 224.81946000000005, "r": 170.45169, "b": 234.67151, "coord_origin": "TOPLEFT"}, "confidence": 0.9588837027549744, "cells": [{"id": 36, "text": "5.4.", "bbox": {"l": 50.112, "t": 224.81946000000005, "r": 64.551605, "b": 234.67151, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "Quantitative Analysis", "bbox": {"l": 74.178009, "t": 224.81946000000005, "r": 170.45169, "b": 234.67151, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 50.112, "t": 243.6499, "r": 286.36514, "b": 396.13794, "coord_origin": "TOPLEFT"}, "confidence": 0.9855090975761414, "cells": [{"id": 38, "text": "Structure.", "bbox": {"l": 62.067001, "t": 243.6499, "r": 105.32461, "b": 252.60626000000002, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "As shown in Tab.", "bbox": {"l": 112.12600000000002, "t": 243.76946999999996, "r": 184.68361, "b": 252.67602999999997, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "2, TableFormer outper-", "bbox": {"l": 191.4781, "t": 243.76946999999996, "r": 286.36188, "b": 252.67602999999997, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "forms all SOTA methods across different datasets by a large", "bbox": {"l": 50.112, "t": 255.72448999999995, "r": 286.36508, "b": 264.63104, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "margin for predicting the table structure from an image.", "bbox": {"l": 50.112, "t": 267.67949999999996, "r": 286.36508, "b": 276.58606, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "All the more, our model outperforms pre-trained methods.", "bbox": {"l": 50.112, "t": 279.63446, "r": 286.36508, "b": 288.54105, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "During the evaluation we do not apply any table filtering.", "bbox": {"l": 50.112, "t": 291.59048, "r": 286.36514, "b": 300.49704, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "We also provide our baseline results on the SynthTabNet", "bbox": {"l": 50.112, "t": 303.54547, "r": 286.36508, "b": 312.45203000000004, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "dataset. It has been observed that large tables (e.g. tables", "bbox": {"l": 50.112, "t": 315.50046, "r": 286.36505, "b": 324.40700999999996, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "that occupy half of the page or more) yield poor predictions.", "bbox": {"l": 50.112, "t": 327.45544, "r": 286.36508, "b": 336.362, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "We attribute this issue to the image resizing during the pre-", "bbox": {"l": 50.112, "t": 339.41043, "r": 286.36508, "b": 348.31699000000003, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "processing step, that produces downsampled images with", "bbox": {"l": 50.112, "t": 351.36542, "r": 286.36505, "b": 360.27197, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "indistinguishable features. This problem can be addressed", "bbox": {"l": 50.112, "t": 363.32141, "r": 286.36508, "b": 372.2279700000001, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "by treating such big tables with a separate model which ac-", "bbox": {"l": 50.112, "t": 375.2764, "r": 286.36511, "b": 384.18295000000006, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "cepts a large input image size.", "bbox": {"l": 50.112, "t": 387.23138, "r": 170.01187, "b": 396.13794, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "table", "bbox": {"l": 53.368526458740234, "t": 409.1357727050781, "r": 283.0443420410156, "b": 582.3977661132812, "coord_origin": "TOPLEFT"}, "confidence": 0.9892510175704956, "cells": [{"id": 53, "text": "Model", "bbox": {"l": 78.843002, "t": 420.69037, "r": 104.85535, "b": 429.59692, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "TEDS", "bbox": {"l": 211.2, "t": 414.71237, "r": 236.10649, "b": 423.61893, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "Dataset", "bbox": {"l": 129.338, "t": 426.66736, "r": 159.21584, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Simple", "bbox": {"l": 171.17096, "t": 426.66736, "r": 199.40497, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Complex", "bbox": {"l": 211.36009, "t": 426.66736, "r": 247.74349999999998, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "All", "bbox": {"l": 264.54044, "t": 426.66736, "r": 277.27264, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "EDD", "bbox": {"l": 81.612, "t": 443.62436, "r": 102.08514, "b": 452.53091, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "PTN", "bbox": {"l": 134.87206, "t": 443.62436, "r": 153.69141, "b": 452.53091, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "91.1", "bbox": {"l": 176.56554, "t": 443.62436, "r": 194.00009, "b": 452.53091, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "88.7", "bbox": {"l": 220.82938000000001, "t": 443.62436, "r": 238.26393, "b": 452.53091, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "89.9", "bbox": {"l": 262.18414, "t": 443.62436, "r": 279.61868, "b": 452.53091, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "GTE", "bbox": {"l": 82.165001, "t": 455.58035, "r": 101.5323, "b": 464.48691, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "PTN", "bbox": {"l": 134.86716, "t": 455.58035, "r": 153.68651, "b": 464.48691, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "-", "bbox": {"l": 183.62411, "t": 455.58035, "r": 186.94167, "b": 464.48691, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "-", "bbox": {"l": 227.88795000000002, "t": 455.58035, "r": 231.20551, "b": 464.48691, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "93.01", "bbox": {"l": 259.69855, "t": 455.58035, "r": 282.11441, "b": 464.48691, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 468.13336, "r": 117.38329000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "PTN", "bbox": {"l": 134.86766, "t": 468.13336, "r": 153.68701, "b": 477.03992, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "98.5", "bbox": {"l": 176.57111, "t": 468.13336, "r": 194.00566, "b": 477.03992, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "95.0", "bbox": {"l": 220.83495, "t": 468.13336, "r": 238.26950000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "96.75", "bbox": {"l": 259.698, "t": 468.01379, "r": 282.11386, "b": 476.97018, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "EDD", "bbox": {"l": 81.612, "t": 483.32635, "r": 102.08514, "b": 492.23291, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "FTN", "bbox": {"l": 134.87206, "t": 483.32635, "r": 153.69141, "b": 492.23291, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "88.4", "bbox": {"l": 176.56554, "t": 483.32635, "r": 194.00009, "b": 492.23291, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "92.08", "bbox": {"l": 218.33870999999996, "t": 483.32635, "r": 240.75455999999997, "b": 492.23291, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "90.6", "bbox": {"l": 262.18411, "t": 483.32635, "r": 279.61865, "b": 492.23291, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "GTE", "bbox": {"l": 82.165001, "t": 495.28134, "r": 101.5323, "b": 504.1879, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "FTN", "bbox": {"l": 134.86716, "t": 495.28134, "r": 153.68651, "b": 504.1879, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "-", "bbox": {"l": 183.62411, "t": 495.28134, "r": 186.94167, "b": 504.1879, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "-", "bbox": {"l": 227.88795000000002, "t": 495.28134, "r": 231.20551, "b": 504.1879, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "87.14", "bbox": {"l": 259.69855, "t": 495.28134, "r": 282.11441, "b": 504.1879, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "GTE (FT)", "bbox": {"l": 71.789001, "t": 507.23633, "r": 111.90838999999998, "b": 516.14288, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "FTN", "bbox": {"l": 134.86221, "t": 507.23633, "r": 153.68156, "b": 516.14288, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "-", "bbox": {"l": 183.62914, "t": 507.23633, "r": 186.94669, "b": 516.14288, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "-", "bbox": {"l": 227.89297, "t": 507.23633, "r": 231.21053000000003, "b": 516.14288, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "91.02", "bbox": {"l": 259.6936, "t": 507.23633, "r": 282.10947, "b": 516.14288, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 519.1913099999999, "r": 117.38329000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "FTN", "bbox": {"l": 134.86766, "t": 519.1913099999999, "r": 153.68701, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "97.5", "bbox": {"l": 176.57111, "t": 519.1913099999999, "r": 194.00566, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "96.0", "bbox": {"l": 220.83495, "t": 519.1913099999999, "r": 238.26950000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "96.8", "bbox": {"l": 262.189, "t": 519.0717500000001, "r": 279.62354, "b": 528.02814, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "EDD", "bbox": {"l": 81.612, "t": 536.49837, "r": 102.08514, "b": 545.40492, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "TB", "bbox": {"l": 137.91064, "t": 536.49837, "r": 150.64285, "b": 545.40492, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "86.0", "bbox": {"l": 176.56554, "t": 536.49837, "r": 194.00009, "b": 545.40492, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "-", "bbox": {"l": 227.89285, "t": 536.49837, "r": 231.21040000000002, "b": 545.40492, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "86.0", "bbox": {"l": 262.18411, "t": 536.49837, "r": 279.61865, "b": 545.40492, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 548.45436, "r": 117.38329000000002, "b": 557.36092, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "TB", "bbox": {"l": 137.90625, "t": 548.45436, "r": 150.63846, "b": 557.36092, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "89.6", "bbox": {"l": 176.57111, "t": 548.45436, "r": 194.00566, "b": 557.36092, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "-", "bbox": {"l": 227.88845999999998, "t": 548.45436, "r": 231.20601, "b": 557.36092, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "89.6", "bbox": {"l": 262.189, "t": 548.3348100000001, "r": 279.62354, "b": 557.2911799999999, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 568.00237, "r": 117.38329000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "STN", "bbox": {"l": 134.86766, "t": 568.00237, "r": 153.68701, "b": 576.90892, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "96.9", "bbox": {"l": 176.57111, "t": 568.00237, "r": 194.00566, "b": 576.90892, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "95.7", "bbox": {"l": 220.83495, "t": 568.00237, "r": 238.26950000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "96.7", "bbox": {"l": 262.1897, "t": 568.00237, "r": 279.62424, "b": 576.90892, "coord_origin": "TOPLEFT"}}], "children": [{"id": 17, "label": "text", "bbox": {"l": 78.843002, "t": 420.69037, "r": 104.85535, "b": 429.59692, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "Model", "bbox": {"l": 78.843002, "t": 420.69037, "r": 104.85535, "b": 429.59692, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 211.2, "t": 414.71237, "r": 236.10649, "b": 423.61893, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "TEDS", "bbox": {"l": 211.2, "t": 414.71237, "r": 236.10649, "b": 423.61893, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 129.338, "t": 426.66736, "r": 159.21584, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "Dataset", "bbox": {"l": 129.338, "t": 426.66736, "r": 159.21584, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 171.17096, "t": 426.66736, "r": 199.40497, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "Simple", "bbox": {"l": 171.17096, "t": 426.66736, "r": 199.40497, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 211.36009, "t": 426.66736, "r": 247.74349999999998, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "Complex", "bbox": {"l": 211.36009, "t": 426.66736, "r": 247.74349999999998, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 264.54044, "t": 426.66736, "r": 277.27264, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "All", "bbox": {"l": 264.54044, "t": 426.66736, "r": 277.27264, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 81.612, "t": 443.62436, "r": 102.08514, "b": 452.53091, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "EDD", "bbox": {"l": 81.612, "t": 443.62436, "r": 102.08514, "b": 452.53091, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 134.87206, "t": 443.62436, "r": 153.69141, "b": 452.53091, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "PTN", "bbox": {"l": 134.87206, "t": 443.62436, "r": 153.69141, "b": 452.53091, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 176.56554, "t": 443.62436, "r": 194.00009, "b": 452.53091, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "91.1", "bbox": {"l": 176.56554, "t": 443.62436, "r": 194.00009, "b": 452.53091, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 220.82938000000001, "t": 443.62436, "r": 238.26393, "b": 452.53091, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "88.7", "bbox": {"l": 220.82938000000001, "t": 443.62436, "r": 238.26393, "b": 452.53091, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 262.18414, "t": 443.62436, "r": 279.61868, "b": 452.53091, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "89.9", "bbox": {"l": 262.18414, "t": 443.62436, "r": 279.61868, "b": 452.53091, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 82.165001, "t": 455.58035, "r": 101.5323, "b": 464.48691, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "GTE", "bbox": {"l": 82.165001, "t": 455.58035, "r": 101.5323, "b": 464.48691, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 134.86716, "t": 455.58035, "r": 153.68651, "b": 464.48691, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "PTN", "bbox": {"l": 134.86716, "t": 455.58035, "r": 153.68651, "b": 464.48691, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 183.62411, "t": 455.58035, "r": 186.94167, "b": 464.48691, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "-", "bbox": {"l": 183.62411, "t": 455.58035, "r": 186.94167, "b": 464.48691, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 227.88795000000002, "t": 455.58035, "r": 231.20551, "b": 464.48691, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "-", "bbox": {"l": 227.88795000000002, "t": 455.58035, "r": 231.20551, "b": 464.48691, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 259.69855, "t": 455.58035, "r": 282.11441, "b": 464.48691, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "93.01", "bbox": {"l": 259.69855, "t": 455.58035, "r": 282.11441, "b": 464.48691, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 66.315002, "t": 468.13336, "r": 117.38329000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 468.13336, "r": 117.38329000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 134.86766, "t": 468.13336, "r": 153.68701, "b": 477.03992, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "PTN", "bbox": {"l": 134.86766, "t": 468.13336, "r": 153.68701, "b": 477.03992, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 176.57111, "t": 468.13336, "r": 194.00566, "b": 477.03992, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "98.5", "bbox": {"l": 176.57111, "t": 468.13336, "r": 194.00566, "b": 477.03992, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 220.83495, "t": 468.13336, "r": 238.26950000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "95.0", "bbox": {"l": 220.83495, "t": 468.13336, "r": 238.26950000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 259.698, "t": 468.01379, "r": 282.11386, "b": 476.97018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "96.75", "bbox": {"l": 259.698, "t": 468.01379, "r": 282.11386, "b": 476.97018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 81.612, "t": 483.32635, "r": 102.08514, "b": 492.23291, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "EDD", "bbox": {"l": 81.612, "t": 483.32635, "r": 102.08514, "b": 492.23291, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 134.87206, "t": 483.32635, "r": 153.69141, "b": 492.23291, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "FTN", "bbox": {"l": 134.87206, "t": 483.32635, "r": 153.69141, "b": 492.23291, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 176.56554, "t": 483.32635, "r": 194.00009, "b": 492.23291, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "88.4", "bbox": {"l": 176.56554, "t": 483.32635, "r": 194.00009, "b": 492.23291, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 218.33870999999996, "t": 483.32635, "r": 240.75455999999997, "b": 492.23291, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "92.08", "bbox": {"l": 218.33870999999996, "t": 483.32635, "r": 240.75455999999997, "b": 492.23291, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 262.18411, "t": 483.32635, "r": 279.61865, "b": 492.23291, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "90.6", "bbox": {"l": 262.18411, "t": 483.32635, "r": 279.61865, "b": 492.23291, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 82.165001, "t": 495.28134, "r": 101.5323, "b": 504.1879, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "GTE", "bbox": {"l": 82.165001, "t": 495.28134, "r": 101.5323, "b": 504.1879, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 134.86716, "t": 495.28134, "r": 153.68651, "b": 504.1879, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "FTN", "bbox": {"l": 134.86716, "t": 495.28134, "r": 153.68651, "b": 504.1879, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 183.62411, "t": 495.28134, "r": 186.94167, "b": 504.1879, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "-", "bbox": {"l": 183.62411, "t": 495.28134, "r": 186.94167, "b": 504.1879, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 227.88795000000002, "t": 495.28134, "r": 231.20551, "b": 504.1879, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "-", "bbox": {"l": 227.88795000000002, "t": 495.28134, "r": 231.20551, "b": 504.1879, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 259.69855, "t": 495.28134, "r": 282.11441, "b": 504.1879, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "87.14", "bbox": {"l": 259.69855, "t": 495.28134, "r": 282.11441, "b": 504.1879, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 71.789001, "t": 507.23633, "r": 111.90838999999998, "b": 516.14288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "GTE (FT)", "bbox": {"l": 71.789001, "t": 507.23633, "r": 111.90838999999998, "b": 516.14288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 134.86221, "t": 507.23633, "r": 153.68156, "b": 516.14288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "FTN", "bbox": {"l": 134.86221, "t": 507.23633, "r": 153.68156, "b": 516.14288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 183.62914, "t": 507.23633, "r": 186.94669, "b": 516.14288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "-", "bbox": {"l": 183.62914, "t": 507.23633, "r": 186.94669, "b": 516.14288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 227.89297, "t": 507.23633, "r": 231.21053000000003, "b": 516.14288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "-", "bbox": {"l": 227.89297, "t": 507.23633, "r": 231.21053000000003, "b": 516.14288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 259.6936, "t": 507.23633, "r": 282.10947, "b": 516.14288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "91.02", "bbox": {"l": 259.6936, "t": 507.23633, "r": 282.10947, "b": 516.14288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 66.315002, "t": 519.1913099999999, "r": 117.38329000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 519.1913099999999, "r": 117.38329000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 134.86766, "t": 519.1913099999999, "r": 153.68701, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "FTN", "bbox": {"l": 134.86766, "t": 519.1913099999999, "r": 153.68701, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 176.57111, "t": 519.1913099999999, "r": 194.00566, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "97.5", "bbox": {"l": 176.57111, "t": 519.1913099999999, "r": 194.00566, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 220.83495, "t": 519.1913099999999, "r": 238.26950000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "96.0", "bbox": {"l": 220.83495, "t": 519.1913099999999, "r": 238.26950000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 262.189, "t": 519.0717500000001, "r": 279.62354, "b": 528.02814, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "96.8", "bbox": {"l": 262.189, "t": 519.0717500000001, "r": 279.62354, "b": 528.02814, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 81.612, "t": 536.49837, "r": 102.08514, "b": 545.40492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "EDD", "bbox": {"l": 81.612, "t": 536.49837, "r": 102.08514, "b": 545.40492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 137.91064, "t": 536.49837, "r": 150.64285, "b": 545.40492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "TB", "bbox": {"l": 137.91064, "t": 536.49837, "r": 150.64285, "b": 545.40492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 176.56554, "t": 536.49837, "r": 194.00009, "b": 545.40492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "86.0", "bbox": {"l": 176.56554, "t": 536.49837, "r": 194.00009, "b": 545.40492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 227.89285, "t": 536.49837, "r": 231.21040000000002, "b": 545.40492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "-", "bbox": {"l": 227.89285, "t": 536.49837, "r": 231.21040000000002, "b": 545.40492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 262.18411, "t": 536.49837, "r": 279.61865, "b": 545.40492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "86.0", "bbox": {"l": 262.18411, "t": 536.49837, "r": 279.61865, "b": 545.40492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 66.315002, "t": 548.45436, "r": 117.38329000000002, "b": 557.36092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 548.45436, "r": 117.38329000000002, "b": 557.36092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 137.90625, "t": 548.45436, "r": 150.63846, "b": 557.36092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "TB", "bbox": {"l": 137.90625, "t": 548.45436, "r": 150.63846, "b": 557.36092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 176.57111, "t": 548.45436, "r": 194.00566, "b": 557.36092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "89.6", "bbox": {"l": 176.57111, "t": 548.45436, "r": 194.00566, "b": 557.36092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 227.88845999999998, "t": 548.45436, "r": 231.20601, "b": 557.36092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "-", "bbox": {"l": 227.88845999999998, "t": 548.45436, "r": 231.20601, "b": 557.36092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 262.189, "t": 548.3348100000001, "r": 279.62354, "b": 557.2911799999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": "89.6", "bbox": {"l": 262.189, "t": 548.3348100000001, "r": 279.62354, "b": 557.2911799999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 66.315002, "t": 568.00237, "r": 117.38329000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 568.00237, "r": 117.38329000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 134.86766, "t": 568.00237, "r": 153.68701, "b": 576.90892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "STN", "bbox": {"l": 134.86766, "t": 568.00237, "r": 153.68701, "b": 576.90892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 176.57111, "t": 568.00237, "r": 194.00566, "b": 576.90892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": "96.9", "bbox": {"l": 176.57111, "t": 568.00237, "r": 194.00566, "b": 576.90892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 220.83495, "t": 568.00237, "r": 238.26950000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 107, "text": "95.7", "bbox": {"l": 220.83495, "t": 568.00237, "r": 238.26950000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 262.1897, "t": 568.00237, "r": 279.62424, "b": 576.90892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 108, "text": "96.7", "bbox": {"l": 262.1897, "t": 568.00237, "r": 279.62424, "b": 576.90892, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 15, "label": "text", "bbox": {"l": 50.112, "t": 592.43336, "r": 286.36511, "b": 613.29492, "coord_origin": "TOPLEFT"}, "confidence": 0.7209173440933228, "cells": [{"id": 109, "text": "Table 2: Structure results on PubTabNet (PTN), FinTabNet", "bbox": {"l": 50.112, "t": 592.43336, "r": 286.36511, "b": 601.33992, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "(FTN), TableBank (TB) and SynthTabNet (STN).", "bbox": {"l": 50.112, "t": 604.38837, "r": 247.46114, "b": 613.29492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 50.112, "t": 616.34337, "r": 261.78732, "b": 625.24992, "coord_origin": "TOPLEFT"}, "confidence": 0.6433312892913818, "cells": [{"id": 111, "text": "FT: Model was trained on PubTabNet then finetuned.", "bbox": {"l": 50.112, "t": 616.34337, "r": 261.78732, "b": 625.24992, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 50.112015, "t": 644.3498099999999, "r": 286.366, "b": 713.151932, "coord_origin": "TOPLEFT"}, "confidence": 0.9854635000228882, "cells": [{"id": 112, "text": "Cell Detection.", "bbox": {"l": 62.067001, "t": 644.3498099999999, "r": 124.72179, "b": 653.30618, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "Like any object detector, our", "bbox": {"l": 128.20401, "t": 644.46936, "r": 242.9333, "b": 653.37592, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "Cell BBox", "bbox": {"l": 245.55401999999998, "t": 644.55902, "r": 286.36084, "b": 653.1467700000001, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "Detector", "bbox": {"l": 50.112015, "t": 656.51402, "r": 84.971146, "b": 665.10178, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "provides bounding boxes that can be improved", "bbox": {"l": 89.515015, "t": 656.42436, "r": 286.366, "b": 665.33092, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "with post-processing during inference. We make use of the", "bbox": {"l": 50.112015, "t": 668.37936, "r": 286.36511, "b": 677.28593, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "grid-like structure of tables to refine the predictions. A de-", "bbox": {"l": 50.112015, "t": 680.33536, "r": 286.36505, "b": 689.24193, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "tailed explanation on the post-processing is available in the", "bbox": {"l": 50.112015, "t": 692.290359, "r": 286.36511, "b": 701.19693, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "supplementary material. As shown in Tab. 3, we evaluate", "bbox": {"l": 50.112015, "t": 704.245361, "r": 286.36508, "b": 713.151932, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "text", "bbox": {"l": 308.862, "t": 75.20836999999995, "r": 545.11517, "b": 227.57709, "coord_origin": "TOPLEFT"}, "confidence": 0.9713197946548462, "cells": [{"id": 121, "text": "our", "bbox": {"l": 308.862, "t": 75.20836999999995, "r": 322.14215, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Cell BBox Decoder", "bbox": {"l": 325.45401, "t": 75.29803000000004, "r": 404.56702, "b": 83.88580000000002, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "accuracy for cells with a class la-", "bbox": {"l": 408.104, "t": 75.20836999999995, "r": 545.10968, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "bel of \u2018content\u2019 only using the PASCAL VOC mAP metric", "bbox": {"l": 308.862, "t": 87.16339000000005, "r": 545.11511, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "for pre-processing and post-processing.", "bbox": {"l": 308.862, "t": 99.11841000000004, "r": 470.22626, "b": 108.02495999999985, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "Note that we do", "bbox": {"l": 477.52884, "t": 99.11841000000004, "r": 545.11511, "b": 108.02495999999985, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "not have post-processing results for SynthTabNet as images", "bbox": {"l": 308.862, "t": 111.07343000000003, "r": 545.11517, "b": 119.97997999999984, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "are only provided. To compare the performance of our pro-", "bbox": {"l": 308.862, "t": 123.02844000000005, "r": 545.11511, "b": 131.93499999999995, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "posed approach, we\u2019ve integrated TableFormer\u2019s", "bbox": {"l": 308.862, "t": 134.98443999999995, "r": 502.01691000000005, "b": 143.89099, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "Cell BBox", "bbox": {"l": 504.47299, "t": 135.07410000000004, "r": 545.11041, "b": 143.66187000000002, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "Decoder", "bbox": {"l": 308.862, "t": 147.02910999999995, "r": 343.16324, "b": 155.61688000000004, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "into EDD architecture. As mentioned previously,", "bbox": {"l": 346.371, "t": 146.93944999999997, "r": 545.11493, "b": 155.84600999999998, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "the Structure Decoder provides the", "bbox": {"l": 308.862, "t": 158.89446999999996, "r": 446.15652, "b": 167.80102999999997, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "Cell BBox Decoder", "bbox": {"l": 448.28998000000007, "t": 158.98413000000005, "r": 525.04181, "b": 167.57190000000003, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "with", "bbox": {"l": 527.39899, "t": 158.89446999999996, "r": 545.11249, "b": 167.80102999999997, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "the features needed to predict the bounding box predictions.", "bbox": {"l": 308.862, "t": 170.84948999999995, "r": 545.11511, "b": 179.75603999999998, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "Therefore, the accuracy of the", "bbox": {"l": 308.862, "t": 182.80449999999996, "r": 432.86642000000006, "b": 191.71105999999997, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "Structure Decoder", "bbox": {"l": 436.39001, "t": 182.89417000000003, "r": 510.93021, "b": 191.48193000000003, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "directly", "bbox": {"l": 514.677, "t": 182.80449999999996, "r": 545.11273, "b": 191.71105999999997, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "influences the accuracy of the", "bbox": {"l": 308.862, "t": 194.75951999999995, "r": 431.17285, "b": 203.66607999999997, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "Cell BBox Decoder", "bbox": {"l": 434.6790199999999, "t": 194.84918000000005, "r": 514.18054, "b": 203.43695000000002, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": ". If the", "bbox": {"l": 514.17603, "t": 194.75951999999995, "r": 545.10992, "b": 203.66607999999997, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "Structure Decoder", "bbox": {"l": 308.86203, "t": 206.80517999999995, "r": 382.35614, "b": 215.39293999999995, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "predicts an extra column, this will result", "bbox": {"l": 385.07501, "t": 206.71551999999997, "r": 545.11426, "b": 215.62207, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "in an extra column of predicted bounding boxes.", "bbox": {"l": 308.862, "t": 218.67052999999999, "r": 501.6981799999999, "b": 227.57709, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "table", "bbox": {"l": 308.4068603515625, "t": 247.87631225585938, "r": 533.6419677734375, "b": 303.8056640625, "coord_origin": "TOPLEFT"}, "confidence": 0.9691730737686157, "cells": [{"id": 146, "text": "Model", "bbox": {"l": 339.323, "t": 253.66436999999996, "r": 365.33536, "b": 262.57092, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "Dataset", "bbox": {"l": 401.04132, "t": 253.66436999999996, "r": 430.91916, "b": 262.57092, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "mAP", "bbox": {"l": 454.10214, "t": 253.66436999999996, "r": 474.58523999999994, "b": 262.57092, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "mAP (PP)", "bbox": {"l": 486.54034, "t": 253.66436999999996, "r": 527.2276, "b": 262.57092, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "EDD+BBox", "bbox": {"l": 327.65601, "t": 270.62134000000003, "r": 377.00076, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "PubTabNet", "bbox": {"l": 393.69809, "t": 270.62134000000003, "r": 438.28073, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "79.2", "bbox": {"l": 455.63559, "t": 270.62134000000003, "r": 473.07013, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "82.7", "bbox": {"l": 498.16592, "t": 270.62134000000003, "r": 515.60046, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "TableFormer", "bbox": {"l": 326.79501, "t": 282.57631999999995, "r": 377.86331, "b": 291.48288, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "PubTabNet", "bbox": {"l": 393.69388, "t": 282.57631999999995, "r": 438.27652, "b": 291.48288, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "82.1", "bbox": {"l": 455.63101, "t": 282.45676, "r": 473.06555000000003, "b": 291.41315, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "86.8", "bbox": {"l": 498.1713, "t": 282.45676, "r": 515.60583, "b": 291.41315, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "TableFormer", "bbox": {"l": 326.79501, "t": 294.53131, "r": 377.86331, "b": 303.43787, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "SynthTabNet", "bbox": {"l": 389.81842, "t": 294.53131, "r": 442.15194999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "87.7", "bbox": {"l": 455.63135, "t": 294.53131, "r": 473.06589, "b": 303.43787, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "-", "bbox": {"l": 505.22515999999996, "t": 294.53131, "r": 508.54268999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}}], "children": [{"id": 73, "label": "text", "bbox": {"l": 339.323, "t": 253.66436999999996, "r": 365.33536, "b": 262.57092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 146, "text": "Model", "bbox": {"l": 339.323, "t": 253.66436999999996, "r": 365.33536, "b": 262.57092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 401.04132, "t": 253.66436999999996, "r": 430.91916, "b": 262.57092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 147, "text": "Dataset", "bbox": {"l": 401.04132, "t": 253.66436999999996, "r": 430.91916, "b": 262.57092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 454.10214, "t": 253.66436999999996, "r": 474.58523999999994, "b": 262.57092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 148, "text": "mAP", "bbox": {"l": 454.10214, "t": 253.66436999999996, "r": 474.58523999999994, "b": 262.57092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 486.54034, "t": 253.66436999999996, "r": 527.2276, "b": 262.57092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 149, "text": "mAP (PP)", "bbox": {"l": 486.54034, "t": 253.66436999999996, "r": 527.2276, "b": 262.57092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 327.65601, "t": 270.62134000000003, "r": 377.00076, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 150, "text": "EDD+BBox", "bbox": {"l": 327.65601, "t": 270.62134000000003, "r": 377.00076, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 393.69809, "t": 270.62134000000003, "r": 438.28073, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 151, "text": "PubTabNet", "bbox": {"l": 393.69809, "t": 270.62134000000003, "r": 438.28073, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 455.63559, "t": 270.62134000000003, "r": 473.07013, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 152, "text": "79.2", "bbox": {"l": 455.63559, "t": 270.62134000000003, "r": 473.07013, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 498.16592, "t": 270.62134000000003, "r": 515.60046, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 153, "text": "82.7", "bbox": {"l": 498.16592, "t": 270.62134000000003, "r": 515.60046, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 326.79501, "t": 282.57631999999995, "r": 377.86331, "b": 291.48288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 154, "text": "TableFormer", "bbox": {"l": 326.79501, "t": 282.57631999999995, "r": 377.86331, "b": 291.48288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 393.69388, "t": 282.57631999999995, "r": 438.27652, "b": 291.48288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 155, "text": "PubTabNet", "bbox": {"l": 393.69388, "t": 282.57631999999995, "r": 438.27652, "b": 291.48288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 455.63101, "t": 282.45676, "r": 473.06555000000003, "b": 291.41315, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 156, "text": "82.1", "bbox": {"l": 455.63101, "t": 282.45676, "r": 473.06555000000003, "b": 291.41315, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 498.1713, "t": 282.45676, "r": 515.60583, "b": 291.41315, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 157, "text": "86.8", "bbox": {"l": 498.1713, "t": 282.45676, "r": 515.60583, "b": 291.41315, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 326.79501, "t": 294.53131, "r": 377.86331, "b": 303.43787, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 158, "text": "TableFormer", "bbox": {"l": 326.79501, "t": 294.53131, "r": 377.86331, "b": 303.43787, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 389.81842, "t": 294.53131, "r": 442.15194999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 159, "text": "SynthTabNet", "bbox": {"l": 389.81842, "t": 294.53131, "r": 442.15194999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 455.63135, "t": 294.53131, "r": 473.06589, "b": 303.43787, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 160, "text": "87.7", "bbox": {"l": 455.63135, "t": 294.53131, "r": 473.06589, "b": 303.43787, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 505.22515999999996, "t": 294.53131, "r": 508.54268999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 161, "text": "-", "bbox": {"l": 505.22515999999996, "t": 294.53131, "r": 508.54268999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 12, "label": "caption", "bbox": {"l": 308.862, "t": 316.44931, "r": 545.11517, "b": 337.3108500000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9519917964935303, "cells": [{"id": 162, "text": "Table 3:", "bbox": {"l": 308.862, "t": 316.44931, "r": 341.49951, "b": 325.35587, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "Cell Bounding Box detection results on PubTab-", "bbox": {"l": 348.60284, "t": 316.44931, "r": 545.11517, "b": 325.35587, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "Net, and FinTabNet. PP: Post-processing.", "bbox": {"l": 308.862, "t": 328.4043, "r": 474.97845, "b": 337.3108500000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "text", "bbox": {"l": 308.86197, "t": 367.6797199999999, "r": 545.11566, "b": 520.16769, "coord_origin": "TOPLEFT"}, "confidence": 0.9835010766983032, "cells": [{"id": 165, "text": "Cell Content.", "bbox": {"l": 320.81699, "t": 367.6797199999999, "r": 378.94876, "b": 376.63611, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "In this section, we evaluate the entire", "bbox": {"l": 387.07898, "t": 367.79929, "r": 545.11566, "b": 376.70584, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "pipeline of recovering a table with content.", "bbox": {"l": 308.86197, "t": 379.75426999999996, "r": 487.19257, "b": 388.66083, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "Here we put", "bbox": {"l": 493.96713, "t": 379.75426999999996, "r": 545.11511, "b": 388.66083, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "our approach to test by capitalizing on extracting content", "bbox": {"l": 308.86197, "t": 391.70926, "r": 545.11505, "b": 400.61581, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "from the PDF cells rather than decoding from images. Tab.", "bbox": {"l": 308.86197, "t": 403.66525, "r": 545.11523, "b": 412.57181, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "4", "bbox": {"l": 308.86197, "t": 415.62024, "r": 314.08096, "b": 424.52679, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "shows the TEDs score of HTML code representing the", "bbox": {"l": 316.69046, "t": 415.62024, "r": 545.11517, "b": 424.52679, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "structure of the table along with the content inserted in the", "bbox": {"l": 308.86197, "t": 427.57523, "r": 545.11505, "b": 436.48177999999996, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "data cell and compared with the ground-truth. Our method", "bbox": {"l": 308.86197, "t": 439.53021, "r": 545.11505, "b": 448.43677, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "achieved a", "bbox": {"l": 308.86197, "t": 451.4852, "r": 350.23666, "b": 460.39175, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "5.3%", "bbox": {"l": 352.17596, "t": 451.36563, "r": 374.59183, "b": 460.32201999999995, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "increase over the state-of-the-art, and com-", "bbox": {"l": 376.53296, "t": 451.4852, "r": 545.11011, "b": 460.39175, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "mercial solutions. We believe our scores would be higher", "bbox": {"l": 308.86197, "t": 463.44019, "r": 545.11511, "b": 472.34674, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "if the HTML ground-truth matched the extracted PDF cell", "bbox": {"l": 308.86197, "t": 475.39618, "r": 545.11517, "b": 484.30273, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "content. Unfortunately, there are small discrepancies such", "bbox": {"l": 308.86197, "t": 487.35117, "r": 545.11511, "b": 496.25772, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "as spacings around words or special characters with various", "bbox": {"l": 308.86197, "t": 499.30615, "r": 545.11505, "b": 508.21271, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "unicode representations.", "bbox": {"l": 308.86197, "t": 511.26114, "r": 405.69846, "b": 520.16769, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "table", "bbox": {"l": 332.9688720703125, "t": 540.2835693359375, "r": 520.942138671875, "b": 643.2697143554688, "coord_origin": "TOPLEFT"}, "confidence": 0.9775567650794983, "cells": [{"id": 183, "text": "Model", "bbox": {"l": 358.01099, "t": 552.23337, "r": 384.02335, "b": 561.1399200000001, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "TEDS", "bbox": {"l": 449.03400000000005, "t": 546.25537, "r": 473.94049000000007, "b": 555.16193, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": "Simple", "bbox": {"l": 408.50598, "t": 558.21037, "r": 436.73999, "b": 567.11693, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "Complex", "bbox": {"l": 448.6951, "t": 558.21037, "r": 485.07849, "b": 567.11693, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "All", "bbox": {"l": 499.3848, "t": 558.21037, "r": 512.117, "b": 567.11693, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": "Tabula", "bbox": {"l": 357.68201, "t": 575.16736, "r": 384.3519, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "78.0", "bbox": {"l": 413.90097, "t": 575.16736, "r": 431.33550999999994, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "57.8", "bbox": {"l": 458.16479000000004, "t": 575.16736, "r": 475.59933000000007, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "67.9", "bbox": {"l": 497.0289, "t": 575.16736, "r": 514.46344, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": "Traprange", "bbox": {"l": 350.72299, "t": 587.12236, "r": 391.31064, "b": 596.02892, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "60.8", "bbox": {"l": 413.90582, "t": 587.12236, "r": 431.34036, "b": 596.02892, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "49.9", "bbox": {"l": 458.16965, "t": 587.12236, "r": 475.60419, "b": 596.02892, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "55.4", "bbox": {"l": 497.03374999999994, "t": 587.12236, "r": 514.46832, "b": 596.02892, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "Camelot", "bbox": {"l": 354.13599, "t": 599.07835, "r": 387.89923, "b": 607.98491, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "80.0", "bbox": {"l": 413.90161, "t": 599.07835, "r": 431.33615, "b": 607.98491, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "66.0", "bbox": {"l": 458.16544, "t": 599.07835, "r": 475.59998, "b": 607.98491, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "73.0", "bbox": {"l": 497.02954000000005, "t": 599.07835, "r": 514.46411, "b": 607.98491, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "Acrobat Pro", "bbox": {"l": 346.55899, "t": 611.03336, "r": 395.47534, "b": 619.93991, "coord_origin": "TOPLEFT"}}, {"id": 201, "text": "68.9", "bbox": {"l": 413.90616, "t": 611.03336, "r": 431.34069999999997, "b": 619.93991, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": "61.8", "bbox": {"l": 458.16998000000007, "t": 611.03336, "r": 475.60452, "b": 619.93991, "coord_origin": "TOPLEFT"}}, {"id": 203, "text": "65.3", "bbox": {"l": 497.03409, "t": 611.03336, "r": 514.46863, "b": 619.93991, "coord_origin": "TOPLEFT"}}, {"id": 204, "text": "EDD", "bbox": {"l": 360.78101, "t": 622.9883600000001, "r": 381.25415, "b": 631.89491, "coord_origin": "TOPLEFT"}}, {"id": 205, "text": "91.2", "bbox": {"l": 413.90158, "t": 622.9883600000001, "r": 431.33612, "b": 631.89491, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": "85.4", "bbox": {"l": 458.16541, "t": 622.9883600000001, "r": 475.59995000000004, "b": 631.89491, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": "88.3", "bbox": {"l": 497.0295100000001, "t": 622.9883600000001, "r": 514.46405, "b": 631.89491, "coord_origin": "TOPLEFT"}}, {"id": 208, "text": "TableFormer", "bbox": {"l": 345.483, "t": 634.94336, "r": 396.5513, "b": 643.84991, "coord_origin": "TOPLEFT"}}, {"id": 209, "text": "95.4", "bbox": {"l": 413.90616, "t": 634.94336, "r": 431.34069999999997, "b": 643.84991, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": "90.1", "bbox": {"l": 458.16998000000007, "t": 634.94336, "r": 475.60452, "b": 643.84991, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "93.6", "bbox": {"l": 497.03400000000005, "t": 634.82381, "r": 514.46857, "b": 643.78018, "coord_origin": "TOPLEFT"}}], "children": [{"id": 89, "label": "text", "bbox": {"l": 358.01099, "t": 552.23337, "r": 384.02335, "b": 561.1399200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 183, "text": "Model", "bbox": {"l": 358.01099, "t": 552.23337, "r": 384.02335, "b": 561.1399200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 449.03400000000005, "t": 546.25537, "r": 473.94049000000007, "b": 555.16193, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 184, "text": "TEDS", "bbox": {"l": 449.03400000000005, "t": 546.25537, "r": 473.94049000000007, "b": 555.16193, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 408.50598, "t": 558.21037, "r": 436.73999, "b": 567.11693, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 185, "text": "Simple", "bbox": {"l": 408.50598, "t": 558.21037, "r": 436.73999, "b": 567.11693, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 448.6951, "t": 558.21037, "r": 485.07849, "b": 567.11693, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 186, "text": "Complex", "bbox": {"l": 448.6951, "t": 558.21037, "r": 485.07849, "b": 567.11693, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 499.3848, "t": 558.21037, "r": 512.117, "b": 567.11693, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 187, "text": "All", "bbox": {"l": 499.3848, "t": 558.21037, "r": 512.117, "b": 567.11693, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 357.68201, "t": 575.16736, "r": 384.3519, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 188, "text": "Tabula", "bbox": {"l": 357.68201, "t": 575.16736, "r": 384.3519, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 413.90097, "t": 575.16736, "r": 431.33550999999994, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 189, "text": "78.0", "bbox": {"l": 413.90097, "t": 575.16736, "r": 431.33550999999994, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 458.16479000000004, "t": 575.16736, "r": 475.59933000000007, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 190, "text": "57.8", "bbox": {"l": 458.16479000000004, "t": 575.16736, "r": 475.59933000000007, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 497.0289, "t": 575.16736, "r": 514.46344, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 191, "text": "67.9", "bbox": {"l": 497.0289, "t": 575.16736, "r": 514.46344, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 350.72299, "t": 587.12236, "r": 391.31064, "b": 596.02892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 192, "text": "Traprange", "bbox": {"l": 350.72299, "t": 587.12236, "r": 391.31064, "b": 596.02892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 413.90582, "t": 587.12236, "r": 431.34036, "b": 596.02892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 193, "text": "60.8", "bbox": {"l": 413.90582, "t": 587.12236, "r": 431.34036, "b": 596.02892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 458.16965, "t": 587.12236, "r": 475.60419, "b": 596.02892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 194, "text": "49.9", "bbox": {"l": 458.16965, "t": 587.12236, "r": 475.60419, "b": 596.02892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 497.03374999999994, "t": 587.12236, "r": 514.46832, "b": 596.02892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 195, "text": "55.4", "bbox": {"l": 497.03374999999994, "t": 587.12236, "r": 514.46832, "b": 596.02892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 354.13599, "t": 599.07835, "r": 387.89923, "b": 607.98491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 196, "text": "Camelot", "bbox": {"l": 354.13599, "t": 599.07835, "r": 387.89923, "b": 607.98491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 413.90161, "t": 599.07835, "r": 431.33615, "b": 607.98491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 197, "text": "80.0", "bbox": {"l": 413.90161, "t": 599.07835, "r": 431.33615, "b": 607.98491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 458.16544, "t": 599.07835, "r": 475.59998, "b": 607.98491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 198, "text": "66.0", "bbox": {"l": 458.16544, "t": 599.07835, "r": 475.59998, "b": 607.98491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 497.02954000000005, "t": 599.07835, "r": 514.46411, "b": 607.98491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 199, "text": "73.0", "bbox": {"l": 497.02954000000005, "t": 599.07835, "r": 514.46411, "b": 607.98491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 346.55899, "t": 611.03336, "r": 395.47534, "b": 619.93991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 200, "text": "Acrobat Pro", "bbox": {"l": 346.55899, "t": 611.03336, "r": 395.47534, "b": 619.93991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 413.90616, "t": 611.03336, "r": 431.34069999999997, "b": 619.93991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 201, "text": "68.9", "bbox": {"l": 413.90616, "t": 611.03336, "r": 431.34069999999997, "b": 619.93991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 458.16998000000007, "t": 611.03336, "r": 475.60452, "b": 619.93991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 202, "text": "61.8", "bbox": {"l": 458.16998000000007, "t": 611.03336, "r": 475.60452, "b": 619.93991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 497.03409, "t": 611.03336, "r": 514.46863, "b": 619.93991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 203, "text": "65.3", "bbox": {"l": 497.03409, "t": 611.03336, "r": 514.46863, "b": 619.93991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 360.78101, "t": 622.9883600000001, "r": 381.25415, "b": 631.89491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 204, "text": "EDD", "bbox": {"l": 360.78101, "t": 622.9883600000001, "r": 381.25415, "b": 631.89491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 413.90158, "t": 622.9883600000001, "r": 431.33612, "b": 631.89491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 205, "text": "91.2", "bbox": {"l": 413.90158, "t": 622.9883600000001, "r": 431.33612, "b": 631.89491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 458.16541, "t": 622.9883600000001, "r": 475.59995000000004, "b": 631.89491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 206, "text": "85.4", "bbox": {"l": 458.16541, "t": 622.9883600000001, "r": 475.59995000000004, "b": 631.89491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 497.0295100000001, "t": 622.9883600000001, "r": 514.46405, "b": 631.89491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 207, "text": "88.3", "bbox": {"l": 497.0295100000001, "t": 622.9883600000001, "r": 514.46405, "b": 631.89491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 114, "label": "text", "bbox": {"l": 345.483, "t": 634.94336, "r": 396.5513, "b": 643.84991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 208, "text": "TableFormer", "bbox": {"l": 345.483, "t": 634.94336, "r": 396.5513, "b": 643.84991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 115, "label": "text", "bbox": {"l": 413.90616, "t": 634.94336, "r": 431.34069999999997, "b": 643.84991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 209, "text": "95.4", "bbox": {"l": 413.90616, "t": 634.94336, "r": 431.34069999999997, "b": 643.84991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 116, "label": "text", "bbox": {"l": 458.16998000000007, "t": 634.94336, "r": 475.60452, "b": 643.84991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 210, "text": "90.1", "bbox": {"l": 458.16998000000007, "t": 634.94336, "r": 475.60452, "b": 643.84991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 117, "label": "text", "bbox": {"l": 497.03400000000005, "t": 634.82381, "r": 514.46857, "b": 643.78018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 211, "text": "93.6", "bbox": {"l": 497.03400000000005, "t": 634.82381, "r": 514.46857, "b": 643.78018, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 11, "label": "caption", "bbox": {"l": 308.862, "t": 656.86136, "r": 545.11517, "b": 689.6779300000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9541404247283936, "cells": [{"id": 212, "text": "Table 4:", "bbox": {"l": 308.862, "t": 656.86136, "r": 341.73862, "b": 665.76792, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "Results of structure with content retrieved using", "bbox": {"l": 349.55927, "t": 656.86136, "r": 545.11517, "b": 665.76792, "coord_origin": "TOPLEFT"}}, {"id": 214, "text": "cell detection on PubTabNet. In all cases the input is PDF", "bbox": {"l": 308.862, "t": 668.81636, "r": 545.11505, "b": 677.7229199999999, "coord_origin": "TOPLEFT"}}, {"id": 215, "text": "documents with cropped tables.", "bbox": {"l": 308.862, "t": 680.77136, "r": 435.03836, "b": 689.6779300000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "page_footer", "bbox": {"l": 295.121, "t": 734.133358, "r": 300.10229, "b": 743.039921, "coord_origin": "TOPLEFT"}, "confidence": 0.8787972331047058, "cells": [{"id": 216, "text": "7", "bbox": {"l": 295.121, "t": 734.133358, "r": 300.10229, "b": 743.039921, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {"0": {"label": "table", "id": 0, "page_no": 6, "cluster": {"id": 0, "label": "table", "bbox": {"l": 53.368526458740234, "t": 409.1357727050781, "r": 283.0443420410156, "b": 582.3977661132812, "coord_origin": "TOPLEFT"}, "confidence": 0.9892510175704956, "cells": [{"id": 53, "text": "Model", "bbox": {"l": 78.843002, "t": 420.69037, "r": 104.85535, "b": 429.59692, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "TEDS", "bbox": {"l": 211.2, "t": 414.71237, "r": 236.10649, "b": 423.61893, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "Dataset", "bbox": {"l": 129.338, "t": 426.66736, "r": 159.21584, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Simple", "bbox": {"l": 171.17096, "t": 426.66736, "r": 199.40497, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Complex", "bbox": {"l": 211.36009, "t": 426.66736, "r": 247.74349999999998, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "All", "bbox": {"l": 264.54044, "t": 426.66736, "r": 277.27264, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "EDD", "bbox": {"l": 81.612, "t": 443.62436, "r": 102.08514, "b": 452.53091, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "PTN", "bbox": {"l": 134.87206, "t": 443.62436, "r": 153.69141, "b": 452.53091, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "91.1", "bbox": {"l": 176.56554, "t": 443.62436, "r": 194.00009, "b": 452.53091, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "88.7", "bbox": {"l": 220.82938000000001, "t": 443.62436, "r": 238.26393, "b": 452.53091, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "89.9", "bbox": {"l": 262.18414, "t": 443.62436, "r": 279.61868, "b": 452.53091, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "GTE", "bbox": {"l": 82.165001, "t": 455.58035, "r": 101.5323, "b": 464.48691, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "PTN", "bbox": {"l": 134.86716, "t": 455.58035, "r": 153.68651, "b": 464.48691, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "-", "bbox": {"l": 183.62411, "t": 455.58035, "r": 186.94167, "b": 464.48691, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "-", "bbox": {"l": 227.88795000000002, "t": 455.58035, "r": 231.20551, "b": 464.48691, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "93.01", "bbox": {"l": 259.69855, "t": 455.58035, "r": 282.11441, "b": 464.48691, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 468.13336, "r": 117.38329000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "PTN", "bbox": {"l": 134.86766, "t": 468.13336, "r": 153.68701, "b": 477.03992, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "98.5", "bbox": {"l": 176.57111, "t": 468.13336, "r": 194.00566, "b": 477.03992, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "95.0", "bbox": {"l": 220.83495, "t": 468.13336, "r": 238.26950000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "96.75", "bbox": {"l": 259.698, "t": 468.01379, "r": 282.11386, "b": 476.97018, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "EDD", "bbox": {"l": 81.612, "t": 483.32635, "r": 102.08514, "b": 492.23291, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "FTN", "bbox": {"l": 134.87206, "t": 483.32635, "r": 153.69141, "b": 492.23291, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "88.4", "bbox": {"l": 176.56554, "t": 483.32635, "r": 194.00009, "b": 492.23291, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "92.08", "bbox": {"l": 218.33870999999996, "t": 483.32635, "r": 240.75455999999997, "b": 492.23291, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "90.6", "bbox": {"l": 262.18411, "t": 483.32635, "r": 279.61865, "b": 492.23291, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "GTE", "bbox": {"l": 82.165001, "t": 495.28134, "r": 101.5323, "b": 504.1879, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "FTN", "bbox": {"l": 134.86716, "t": 495.28134, "r": 153.68651, "b": 504.1879, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "-", "bbox": {"l": 183.62411, "t": 495.28134, "r": 186.94167, "b": 504.1879, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "-", "bbox": {"l": 227.88795000000002, "t": 495.28134, "r": 231.20551, "b": 504.1879, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "87.14", "bbox": {"l": 259.69855, "t": 495.28134, "r": 282.11441, "b": 504.1879, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "GTE (FT)", "bbox": {"l": 71.789001, "t": 507.23633, "r": 111.90838999999998, "b": 516.14288, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "FTN", "bbox": {"l": 134.86221, "t": 507.23633, "r": 153.68156, "b": 516.14288, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "-", "bbox": {"l": 183.62914, "t": 507.23633, "r": 186.94669, "b": 516.14288, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "-", "bbox": {"l": 227.89297, "t": 507.23633, "r": 231.21053000000003, "b": 516.14288, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "91.02", "bbox": {"l": 259.6936, "t": 507.23633, "r": 282.10947, "b": 516.14288, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 519.1913099999999, "r": 117.38329000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "FTN", "bbox": {"l": 134.86766, "t": 519.1913099999999, "r": 153.68701, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "97.5", "bbox": {"l": 176.57111, "t": 519.1913099999999, "r": 194.00566, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "96.0", "bbox": {"l": 220.83495, "t": 519.1913099999999, "r": 238.26950000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "96.8", "bbox": {"l": 262.189, "t": 519.0717500000001, "r": 279.62354, "b": 528.02814, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "EDD", "bbox": {"l": 81.612, "t": 536.49837, "r": 102.08514, "b": 545.40492, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "TB", "bbox": {"l": 137.91064, "t": 536.49837, "r": 150.64285, "b": 545.40492, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "86.0", "bbox": {"l": 176.56554, "t": 536.49837, "r": 194.00009, "b": 545.40492, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "-", "bbox": {"l": 227.89285, "t": 536.49837, "r": 231.21040000000002, "b": 545.40492, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "86.0", "bbox": {"l": 262.18411, "t": 536.49837, "r": 279.61865, "b": 545.40492, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 548.45436, "r": 117.38329000000002, "b": 557.36092, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "TB", "bbox": {"l": 137.90625, "t": 548.45436, "r": 150.63846, "b": 557.36092, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "89.6", "bbox": {"l": 176.57111, "t": 548.45436, "r": 194.00566, "b": 557.36092, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "-", "bbox": {"l": 227.88845999999998, "t": 548.45436, "r": 231.20601, "b": 557.36092, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "89.6", "bbox": {"l": 262.189, "t": 548.3348100000001, "r": 279.62354, "b": 557.2911799999999, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 568.00237, "r": 117.38329000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "STN", "bbox": {"l": 134.86766, "t": 568.00237, "r": 153.68701, "b": 576.90892, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "96.9", "bbox": {"l": 176.57111, "t": 568.00237, "r": 194.00566, "b": 576.90892, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "95.7", "bbox": {"l": 220.83495, "t": 568.00237, "r": 238.26950000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "96.7", "bbox": {"l": 262.1897, "t": 568.00237, "r": 279.62424, "b": 576.90892, "coord_origin": "TOPLEFT"}}], "children": [{"id": 17, "label": "text", "bbox": {"l": 78.843002, "t": 420.69037, "r": 104.85535, "b": 429.59692, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "Model", "bbox": {"l": 78.843002, "t": 420.69037, "r": 104.85535, "b": 429.59692, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 211.2, "t": 414.71237, "r": 236.10649, "b": 423.61893, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "TEDS", "bbox": {"l": 211.2, "t": 414.71237, "r": 236.10649, "b": 423.61893, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 129.338, "t": 426.66736, "r": 159.21584, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "Dataset", "bbox": {"l": 129.338, "t": 426.66736, "r": 159.21584, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 171.17096, "t": 426.66736, "r": 199.40497, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "Simple", "bbox": {"l": 171.17096, "t": 426.66736, "r": 199.40497, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 211.36009, "t": 426.66736, "r": 247.74349999999998, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "Complex", "bbox": {"l": 211.36009, "t": 426.66736, "r": 247.74349999999998, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 264.54044, "t": 426.66736, "r": 277.27264, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "All", "bbox": {"l": 264.54044, "t": 426.66736, "r": 277.27264, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 81.612, "t": 443.62436, "r": 102.08514, "b": 452.53091, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "EDD", "bbox": {"l": 81.612, "t": 443.62436, "r": 102.08514, "b": 452.53091, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 134.87206, "t": 443.62436, "r": 153.69141, "b": 452.53091, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "PTN", "bbox": {"l": 134.87206, "t": 443.62436, "r": 153.69141, "b": 452.53091, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 176.56554, "t": 443.62436, "r": 194.00009, "b": 452.53091, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "91.1", "bbox": {"l": 176.56554, "t": 443.62436, "r": 194.00009, "b": 452.53091, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 220.82938000000001, "t": 443.62436, "r": 238.26393, "b": 452.53091, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "88.7", "bbox": {"l": 220.82938000000001, "t": 443.62436, "r": 238.26393, "b": 452.53091, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 262.18414, "t": 443.62436, "r": 279.61868, "b": 452.53091, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "89.9", "bbox": {"l": 262.18414, "t": 443.62436, "r": 279.61868, "b": 452.53091, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 82.165001, "t": 455.58035, "r": 101.5323, "b": 464.48691, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "GTE", "bbox": {"l": 82.165001, "t": 455.58035, "r": 101.5323, "b": 464.48691, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 134.86716, "t": 455.58035, "r": 153.68651, "b": 464.48691, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "PTN", "bbox": {"l": 134.86716, "t": 455.58035, "r": 153.68651, "b": 464.48691, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 183.62411, "t": 455.58035, "r": 186.94167, "b": 464.48691, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "-", "bbox": {"l": 183.62411, "t": 455.58035, "r": 186.94167, "b": 464.48691, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 227.88795000000002, "t": 455.58035, "r": 231.20551, "b": 464.48691, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "-", "bbox": {"l": 227.88795000000002, "t": 455.58035, "r": 231.20551, "b": 464.48691, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 259.69855, "t": 455.58035, "r": 282.11441, "b": 464.48691, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "93.01", "bbox": {"l": 259.69855, "t": 455.58035, "r": 282.11441, "b": 464.48691, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 66.315002, "t": 468.13336, "r": 117.38329000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 468.13336, "r": 117.38329000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 134.86766, "t": 468.13336, "r": 153.68701, "b": 477.03992, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "PTN", "bbox": {"l": 134.86766, "t": 468.13336, "r": 153.68701, "b": 477.03992, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 176.57111, "t": 468.13336, "r": 194.00566, "b": 477.03992, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "98.5", "bbox": {"l": 176.57111, "t": 468.13336, "r": 194.00566, "b": 477.03992, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 220.83495, "t": 468.13336, "r": 238.26950000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "95.0", "bbox": {"l": 220.83495, "t": 468.13336, "r": 238.26950000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 259.698, "t": 468.01379, "r": 282.11386, "b": 476.97018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "96.75", "bbox": {"l": 259.698, "t": 468.01379, "r": 282.11386, "b": 476.97018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 81.612, "t": 483.32635, "r": 102.08514, "b": 492.23291, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "EDD", "bbox": {"l": 81.612, "t": 483.32635, "r": 102.08514, "b": 492.23291, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 134.87206, "t": 483.32635, "r": 153.69141, "b": 492.23291, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "FTN", "bbox": {"l": 134.87206, "t": 483.32635, "r": 153.69141, "b": 492.23291, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 176.56554, "t": 483.32635, "r": 194.00009, "b": 492.23291, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "88.4", "bbox": {"l": 176.56554, "t": 483.32635, "r": 194.00009, "b": 492.23291, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 218.33870999999996, "t": 483.32635, "r": 240.75455999999997, "b": 492.23291, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "92.08", "bbox": {"l": 218.33870999999996, "t": 483.32635, "r": 240.75455999999997, "b": 492.23291, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 262.18411, "t": 483.32635, "r": 279.61865, "b": 492.23291, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "90.6", "bbox": {"l": 262.18411, "t": 483.32635, "r": 279.61865, "b": 492.23291, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 82.165001, "t": 495.28134, "r": 101.5323, "b": 504.1879, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "GTE", "bbox": {"l": 82.165001, "t": 495.28134, "r": 101.5323, "b": 504.1879, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 134.86716, "t": 495.28134, "r": 153.68651, "b": 504.1879, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "FTN", "bbox": {"l": 134.86716, "t": 495.28134, "r": 153.68651, "b": 504.1879, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 183.62411, "t": 495.28134, "r": 186.94167, "b": 504.1879, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "-", "bbox": {"l": 183.62411, "t": 495.28134, "r": 186.94167, "b": 504.1879, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 227.88795000000002, "t": 495.28134, "r": 231.20551, "b": 504.1879, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "-", "bbox": {"l": 227.88795000000002, "t": 495.28134, "r": 231.20551, "b": 504.1879, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 259.69855, "t": 495.28134, "r": 282.11441, "b": 504.1879, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "87.14", "bbox": {"l": 259.69855, "t": 495.28134, "r": 282.11441, "b": 504.1879, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 71.789001, "t": 507.23633, "r": 111.90838999999998, "b": 516.14288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "GTE (FT)", "bbox": {"l": 71.789001, "t": 507.23633, "r": 111.90838999999998, "b": 516.14288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 134.86221, "t": 507.23633, "r": 153.68156, "b": 516.14288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "FTN", "bbox": {"l": 134.86221, "t": 507.23633, "r": 153.68156, "b": 516.14288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 183.62914, "t": 507.23633, "r": 186.94669, "b": 516.14288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "-", "bbox": {"l": 183.62914, "t": 507.23633, "r": 186.94669, "b": 516.14288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 227.89297, "t": 507.23633, "r": 231.21053000000003, "b": 516.14288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "-", "bbox": {"l": 227.89297, "t": 507.23633, "r": 231.21053000000003, "b": 516.14288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 259.6936, "t": 507.23633, "r": 282.10947, "b": 516.14288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "91.02", "bbox": {"l": 259.6936, "t": 507.23633, "r": 282.10947, "b": 516.14288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 66.315002, "t": 519.1913099999999, "r": 117.38329000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 519.1913099999999, "r": 117.38329000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 134.86766, "t": 519.1913099999999, "r": 153.68701, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "FTN", "bbox": {"l": 134.86766, "t": 519.1913099999999, "r": 153.68701, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 176.57111, "t": 519.1913099999999, "r": 194.00566, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "97.5", "bbox": {"l": 176.57111, "t": 519.1913099999999, "r": 194.00566, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 220.83495, "t": 519.1913099999999, "r": 238.26950000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "96.0", "bbox": {"l": 220.83495, "t": 519.1913099999999, "r": 238.26950000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 262.189, "t": 519.0717500000001, "r": 279.62354, "b": 528.02814, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "96.8", "bbox": {"l": 262.189, "t": 519.0717500000001, "r": 279.62354, "b": 528.02814, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 81.612, "t": 536.49837, "r": 102.08514, "b": 545.40492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "EDD", "bbox": {"l": 81.612, "t": 536.49837, "r": 102.08514, "b": 545.40492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 137.91064, "t": 536.49837, "r": 150.64285, "b": 545.40492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "TB", "bbox": {"l": 137.91064, "t": 536.49837, "r": 150.64285, "b": 545.40492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 176.56554, "t": 536.49837, "r": 194.00009, "b": 545.40492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "86.0", "bbox": {"l": 176.56554, "t": 536.49837, "r": 194.00009, "b": 545.40492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 227.89285, "t": 536.49837, "r": 231.21040000000002, "b": 545.40492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "-", "bbox": {"l": 227.89285, "t": 536.49837, "r": 231.21040000000002, "b": 545.40492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 262.18411, "t": 536.49837, "r": 279.61865, "b": 545.40492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "86.0", "bbox": {"l": 262.18411, "t": 536.49837, "r": 279.61865, "b": 545.40492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 66.315002, "t": 548.45436, "r": 117.38329000000002, "b": 557.36092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 548.45436, "r": 117.38329000000002, "b": 557.36092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 137.90625, "t": 548.45436, "r": 150.63846, "b": 557.36092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "TB", "bbox": {"l": 137.90625, "t": 548.45436, "r": 150.63846, "b": 557.36092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 176.57111, "t": 548.45436, "r": 194.00566, "b": 557.36092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "89.6", "bbox": {"l": 176.57111, "t": 548.45436, "r": 194.00566, "b": 557.36092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 227.88845999999998, "t": 548.45436, "r": 231.20601, "b": 557.36092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "-", "bbox": {"l": 227.88845999999998, "t": 548.45436, "r": 231.20601, "b": 557.36092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 262.189, "t": 548.3348100000001, "r": 279.62354, "b": 557.2911799999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": "89.6", "bbox": {"l": 262.189, "t": 548.3348100000001, "r": 279.62354, "b": 557.2911799999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 66.315002, "t": 568.00237, "r": 117.38329000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 568.00237, "r": 117.38329000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 134.86766, "t": 568.00237, "r": 153.68701, "b": 576.90892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "STN", "bbox": {"l": 134.86766, "t": 568.00237, "r": 153.68701, "b": 576.90892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 176.57111, "t": 568.00237, "r": 194.00566, "b": 576.90892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": "96.9", "bbox": {"l": 176.57111, "t": 568.00237, "r": 194.00566, "b": 576.90892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 220.83495, "t": 568.00237, "r": 238.26950000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 107, "text": "95.7", "bbox": {"l": 220.83495, "t": 568.00237, "r": 238.26950000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 262.1897, "t": 568.00237, "r": 279.62424, "b": 576.90892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 108, "text": "96.7", "bbox": {"l": 262.1897, "t": 568.00237, "r": 279.62424, "b": 576.90892, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 11, "num_cols": 5, "table_cells": [{"bbox": {"l": 78.843002, "t": 420.69037, "r": 104.85535, "b": 429.59692, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Model", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 211.2, "t": 414.71237, "r": 247.74349999999998, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "TEDS Complex", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 129.338, "t": 426.66736, "r": 159.21584, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Dataset", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 171.17096, "t": 426.66736, "r": 199.40497, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Simple", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 264.54044, "t": 426.66736, "r": 277.27264, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "All", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 81.612, "t": 443.62436, "r": 102.08514, "b": 452.53091, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "EDD", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.87206, "t": 443.62436, "r": 153.69141, "b": 452.53091, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "PTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.56554, "t": 443.62436, "r": 194.00009, "b": 452.53091, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "91.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 220.82938000000001, "t": 443.62436, "r": 238.26393, "b": 452.53091, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "88.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 262.18414, "t": 443.62436, "r": 279.61868, "b": 452.53091, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "89.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 82.165001, "t": 455.58035, "r": 101.5323, "b": 464.48691, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "GTE", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.86716, "t": 455.58035, "r": 153.68651, "b": 464.48691, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "PTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 183.62411, "t": 455.58035, "r": 186.94167, "b": 464.48691, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 227.88795000000002, "t": 455.58035, "r": 231.20551, "b": 464.48691, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 259.69855, "t": 455.58035, "r": 282.11441, "b": 464.48691, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "93.01", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 66.315002, "t": 468.13336, "r": 117.38329000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.86766, "t": 468.13336, "r": 153.68701, "b": 477.03992, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "PTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.57111, "t": 468.13336, "r": 194.00566, "b": 477.03992, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "98.5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 220.83495, "t": 468.13336, "r": 238.26950000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "95.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 259.698, "t": 468.01379, "r": 282.11386, "b": 476.97018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "96.75", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 81.612, "t": 483.32635, "r": 102.08514, "b": 492.23291, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "EDD", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.87206, "t": 483.32635, "r": 153.69141, "b": 492.23291, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "FTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.56554, "t": 483.32635, "r": 194.00009, "b": 492.23291, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "88.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 218.33870999999996, "t": 483.32635, "r": 240.75455999999997, "b": 492.23291, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "92.08", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 262.18411, "t": 483.32635, "r": 279.61865, "b": 492.23291, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "90.6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 82.165001, "t": 495.28134, "r": 101.5323, "b": 504.1879, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "GTE", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.86716, "t": 495.28134, "r": 153.68651, "b": 504.1879, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "FTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 183.62411, "t": 495.28134, "r": 186.94167, "b": 504.1879, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 227.88795000000002, "t": 495.28134, "r": 231.20551, "b": 504.1879, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 259.69855, "t": 495.28134, "r": 282.11441, "b": 504.1879, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "87.14", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 71.789001, "t": 507.23633, "r": 111.90838999999998, "b": 516.14288, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "GTE (FT)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.86221, "t": 507.23633, "r": 153.68156, "b": 516.14288, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "FTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 183.62914, "t": 507.23633, "r": 186.94669, "b": 516.14288, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 227.89297, "t": 507.23633, "r": 231.21053000000003, "b": 516.14288, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 259.6936, "t": 507.23633, "r": 282.10947, "b": 516.14288, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "91.02", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 66.315002, "t": 519.1913099999999, "r": 117.38329000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.86766, "t": 519.1913099999999, "r": 153.68701, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "FTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.57111, "t": 519.1913099999999, "r": 194.00566, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "97.5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 220.83495, "t": 519.1913099999999, "r": 238.26950000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "96.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 262.189, "t": 519.0717500000001, "r": 279.62354, "b": 528.02814, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "96.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 81.612, "t": 536.49837, "r": 102.08514, "b": 545.40492, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "EDD", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 137.91064, "t": 536.49837, "r": 150.64285, "b": 545.40492, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "TB", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.56554, "t": 536.49837, "r": 194.00009, "b": 545.40492, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "86.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 227.89285, "t": 536.49837, "r": 231.21040000000002, "b": 545.40492, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 262.18411, "t": 536.49837, "r": 279.61865, "b": 545.40492, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "86.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 66.315002, "t": 548.45436, "r": 117.38329000000002, "b": 557.36092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 137.90625, "t": 548.45436, "r": 150.63846, "b": 557.36092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "TB", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.57111, "t": 548.45436, "r": 194.00566, "b": 557.36092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "89.6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 227.88845999999998, "t": 548.45436, "r": 231.20601, "b": 557.36092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 262.189, "t": 548.3348100000001, "r": 279.62354, "b": 557.2911799999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "89.6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 66.315002, "t": 568.00237, "r": 117.38329000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.86766, "t": 568.00237, "r": 153.68701, "b": 576.90892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "STN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.57111, "t": 568.00237, "r": 194.00566, "b": 576.90892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "96.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 220.83495, "t": 568.00237, "r": 238.26950000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "95.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 262.1897, "t": 568.00237, "r": 279.62424, "b": 576.90892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "96.7", "column_header": false, "row_header": false, "row_section": false}]}, "8": {"label": "table", "id": 8, "page_no": 6, "cluster": {"id": 8, "label": "table", "bbox": {"l": 308.4068603515625, "t": 247.87631225585938, "r": 533.6419677734375, "b": 303.8056640625, "coord_origin": "TOPLEFT"}, "confidence": 0.9691730737686157, "cells": [{"id": 146, "text": "Model", "bbox": {"l": 339.323, "t": 253.66436999999996, "r": 365.33536, "b": 262.57092, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "Dataset", "bbox": {"l": 401.04132, "t": 253.66436999999996, "r": 430.91916, "b": 262.57092, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "mAP", "bbox": {"l": 454.10214, "t": 253.66436999999996, "r": 474.58523999999994, "b": 262.57092, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "mAP (PP)", "bbox": {"l": 486.54034, "t": 253.66436999999996, "r": 527.2276, "b": 262.57092, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "EDD+BBox", "bbox": {"l": 327.65601, "t": 270.62134000000003, "r": 377.00076, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "PubTabNet", "bbox": {"l": 393.69809, "t": 270.62134000000003, "r": 438.28073, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "79.2", "bbox": {"l": 455.63559, "t": 270.62134000000003, "r": 473.07013, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "82.7", "bbox": {"l": 498.16592, "t": 270.62134000000003, "r": 515.60046, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "TableFormer", "bbox": {"l": 326.79501, "t": 282.57631999999995, "r": 377.86331, "b": 291.48288, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "PubTabNet", "bbox": {"l": 393.69388, "t": 282.57631999999995, "r": 438.27652, "b": 291.48288, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "82.1", "bbox": {"l": 455.63101, "t": 282.45676, "r": 473.06555000000003, "b": 291.41315, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "86.8", "bbox": {"l": 498.1713, "t": 282.45676, "r": 515.60583, "b": 291.41315, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "TableFormer", "bbox": {"l": 326.79501, "t": 294.53131, "r": 377.86331, "b": 303.43787, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "SynthTabNet", "bbox": {"l": 389.81842, "t": 294.53131, "r": 442.15194999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "87.7", "bbox": {"l": 455.63135, "t": 294.53131, "r": 473.06589, "b": 303.43787, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "-", "bbox": {"l": 505.22515999999996, "t": 294.53131, "r": 508.54268999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}}], "children": [{"id": 73, "label": "text", "bbox": {"l": 339.323, "t": 253.66436999999996, "r": 365.33536, "b": 262.57092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 146, "text": "Model", "bbox": {"l": 339.323, "t": 253.66436999999996, "r": 365.33536, "b": 262.57092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 401.04132, "t": 253.66436999999996, "r": 430.91916, "b": 262.57092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 147, "text": "Dataset", "bbox": {"l": 401.04132, "t": 253.66436999999996, "r": 430.91916, "b": 262.57092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 454.10214, "t": 253.66436999999996, "r": 474.58523999999994, "b": 262.57092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 148, "text": "mAP", "bbox": {"l": 454.10214, "t": 253.66436999999996, "r": 474.58523999999994, "b": 262.57092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 486.54034, "t": 253.66436999999996, "r": 527.2276, "b": 262.57092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 149, "text": "mAP (PP)", "bbox": {"l": 486.54034, "t": 253.66436999999996, "r": 527.2276, "b": 262.57092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 327.65601, "t": 270.62134000000003, "r": 377.00076, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 150, "text": "EDD+BBox", "bbox": {"l": 327.65601, "t": 270.62134000000003, "r": 377.00076, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 393.69809, "t": 270.62134000000003, "r": 438.28073, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 151, "text": "PubTabNet", "bbox": {"l": 393.69809, "t": 270.62134000000003, "r": 438.28073, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 455.63559, "t": 270.62134000000003, "r": 473.07013, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 152, "text": "79.2", "bbox": {"l": 455.63559, "t": 270.62134000000003, "r": 473.07013, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 498.16592, "t": 270.62134000000003, "r": 515.60046, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 153, "text": "82.7", "bbox": {"l": 498.16592, "t": 270.62134000000003, "r": 515.60046, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 326.79501, "t": 282.57631999999995, "r": 377.86331, "b": 291.48288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 154, "text": "TableFormer", "bbox": {"l": 326.79501, "t": 282.57631999999995, "r": 377.86331, "b": 291.48288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 393.69388, "t": 282.57631999999995, "r": 438.27652, "b": 291.48288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 155, "text": "PubTabNet", "bbox": {"l": 393.69388, "t": 282.57631999999995, "r": 438.27652, "b": 291.48288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 455.63101, "t": 282.45676, "r": 473.06555000000003, "b": 291.41315, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 156, "text": "82.1", "bbox": {"l": 455.63101, "t": 282.45676, "r": 473.06555000000003, "b": 291.41315, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 498.1713, "t": 282.45676, "r": 515.60583, "b": 291.41315, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 157, "text": "86.8", "bbox": {"l": 498.1713, "t": 282.45676, "r": 515.60583, "b": 291.41315, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 326.79501, "t": 294.53131, "r": 377.86331, "b": 303.43787, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 158, "text": "TableFormer", "bbox": {"l": 326.79501, "t": 294.53131, "r": 377.86331, "b": 303.43787, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 389.81842, "t": 294.53131, "r": 442.15194999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 159, "text": "SynthTabNet", "bbox": {"l": 389.81842, "t": 294.53131, "r": 442.15194999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 455.63135, "t": 294.53131, "r": 473.06589, "b": 303.43787, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 160, "text": "87.7", "bbox": {"l": 455.63135, "t": 294.53131, "r": 473.06589, "b": 303.43787, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 505.22515999999996, "t": 294.53131, "r": 508.54268999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 161, "text": "-", "bbox": {"l": 505.22515999999996, "t": 294.53131, "r": 508.54268999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 4, "num_cols": 4, "table_cells": [{"bbox": {"l": 339.323, "t": 253.66436999999996, "r": 365.33536, "b": 262.57092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Model", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 401.04132, "t": 253.66436999999996, "r": 430.91916, "b": 262.57092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Dataset", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 454.10214, "t": 253.66436999999996, "r": 474.58523999999994, "b": 262.57092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "mAP", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 486.54034, "t": 253.66436999999996, "r": 527.2276, "b": 262.57092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "mAP (PP)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 327.65601, "t": 270.62134000000003, "r": 377.00076, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "EDD+BBox", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 393.69809, "t": 270.62134000000003, "r": 438.28073, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "PubTabNet", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 455.63559, "t": 270.62134000000003, "r": 473.07013, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "79.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 498.16592, "t": 270.62134000000003, "r": 515.60046, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "82.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.79501, "t": 282.57631999999995, "r": 377.86331, "b": 291.48288, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 393.69388, "t": 282.57631999999995, "r": 438.27652, "b": 291.48288, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "PubTabNet", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 455.63101, "t": 282.45676, "r": 473.06555000000003, "b": 291.41315, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "82.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 498.1713, "t": 282.45676, "r": 515.60583, "b": 291.41315, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "86.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.79501, "t": 294.53131, "r": 377.86331, "b": 303.43787, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 389.81842, "t": 294.53131, "r": 442.15194999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "SynthTabNet", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 455.63135, "t": 294.53131, "r": 473.06589, "b": 303.43787, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "87.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 505.22515999999996, "t": 294.53131, "r": 508.54268999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}]}, "5": {"label": "table", "id": 5, "page_no": 6, "cluster": {"id": 5, "label": "table", "bbox": {"l": 332.9688720703125, "t": 540.2835693359375, "r": 520.942138671875, "b": 643.2697143554688, "coord_origin": "TOPLEFT"}, "confidence": 0.9775567650794983, "cells": [{"id": 183, "text": "Model", "bbox": {"l": 358.01099, "t": 552.23337, "r": 384.02335, "b": 561.1399200000001, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "TEDS", "bbox": {"l": 449.03400000000005, "t": 546.25537, "r": 473.94049000000007, "b": 555.16193, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": "Simple", "bbox": {"l": 408.50598, "t": 558.21037, "r": 436.73999, "b": 567.11693, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "Complex", "bbox": {"l": 448.6951, "t": 558.21037, "r": 485.07849, "b": 567.11693, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "All", "bbox": {"l": 499.3848, "t": 558.21037, "r": 512.117, "b": 567.11693, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": "Tabula", "bbox": {"l": 357.68201, "t": 575.16736, "r": 384.3519, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "78.0", "bbox": {"l": 413.90097, "t": 575.16736, "r": 431.33550999999994, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "57.8", "bbox": {"l": 458.16479000000004, "t": 575.16736, "r": 475.59933000000007, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "67.9", "bbox": {"l": 497.0289, "t": 575.16736, "r": 514.46344, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": "Traprange", "bbox": {"l": 350.72299, "t": 587.12236, "r": 391.31064, "b": 596.02892, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "60.8", "bbox": {"l": 413.90582, "t": 587.12236, "r": 431.34036, "b": 596.02892, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "49.9", "bbox": {"l": 458.16965, "t": 587.12236, "r": 475.60419, "b": 596.02892, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "55.4", "bbox": {"l": 497.03374999999994, "t": 587.12236, "r": 514.46832, "b": 596.02892, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "Camelot", "bbox": {"l": 354.13599, "t": 599.07835, "r": 387.89923, "b": 607.98491, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "80.0", "bbox": {"l": 413.90161, "t": 599.07835, "r": 431.33615, "b": 607.98491, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "66.0", "bbox": {"l": 458.16544, "t": 599.07835, "r": 475.59998, "b": 607.98491, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "73.0", "bbox": {"l": 497.02954000000005, "t": 599.07835, "r": 514.46411, "b": 607.98491, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "Acrobat Pro", "bbox": {"l": 346.55899, "t": 611.03336, "r": 395.47534, "b": 619.93991, "coord_origin": "TOPLEFT"}}, {"id": 201, "text": "68.9", "bbox": {"l": 413.90616, "t": 611.03336, "r": 431.34069999999997, "b": 619.93991, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": "61.8", "bbox": {"l": 458.16998000000007, "t": 611.03336, "r": 475.60452, "b": 619.93991, "coord_origin": "TOPLEFT"}}, {"id": 203, "text": "65.3", "bbox": {"l": 497.03409, "t": 611.03336, "r": 514.46863, "b": 619.93991, "coord_origin": "TOPLEFT"}}, {"id": 204, "text": "EDD", "bbox": {"l": 360.78101, "t": 622.9883600000001, "r": 381.25415, "b": 631.89491, "coord_origin": "TOPLEFT"}}, {"id": 205, "text": "91.2", "bbox": {"l": 413.90158, "t": 622.9883600000001, "r": 431.33612, "b": 631.89491, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": "85.4", "bbox": {"l": 458.16541, "t": 622.9883600000001, "r": 475.59995000000004, "b": 631.89491, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": "88.3", "bbox": {"l": 497.0295100000001, "t": 622.9883600000001, "r": 514.46405, "b": 631.89491, "coord_origin": "TOPLEFT"}}, {"id": 208, "text": "TableFormer", "bbox": {"l": 345.483, "t": 634.94336, "r": 396.5513, "b": 643.84991, "coord_origin": "TOPLEFT"}}, {"id": 209, "text": "95.4", "bbox": {"l": 413.90616, "t": 634.94336, "r": 431.34069999999997, "b": 643.84991, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": "90.1", "bbox": {"l": 458.16998000000007, "t": 634.94336, "r": 475.60452, "b": 643.84991, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "93.6", "bbox": {"l": 497.03400000000005, "t": 634.82381, "r": 514.46857, "b": 643.78018, "coord_origin": "TOPLEFT"}}], "children": [{"id": 89, "label": "text", "bbox": {"l": 358.01099, "t": 552.23337, "r": 384.02335, "b": 561.1399200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 183, "text": "Model", "bbox": {"l": 358.01099, "t": 552.23337, "r": 384.02335, "b": 561.1399200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 449.03400000000005, "t": 546.25537, "r": 473.94049000000007, "b": 555.16193, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 184, "text": "TEDS", "bbox": {"l": 449.03400000000005, "t": 546.25537, "r": 473.94049000000007, "b": 555.16193, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 408.50598, "t": 558.21037, "r": 436.73999, "b": 567.11693, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 185, "text": "Simple", "bbox": {"l": 408.50598, "t": 558.21037, "r": 436.73999, "b": 567.11693, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 448.6951, "t": 558.21037, "r": 485.07849, "b": 567.11693, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 186, "text": "Complex", "bbox": {"l": 448.6951, "t": 558.21037, "r": 485.07849, "b": 567.11693, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 499.3848, "t": 558.21037, "r": 512.117, "b": 567.11693, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 187, "text": "All", "bbox": {"l": 499.3848, "t": 558.21037, "r": 512.117, "b": 567.11693, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 357.68201, "t": 575.16736, "r": 384.3519, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 188, "text": "Tabula", "bbox": {"l": 357.68201, "t": 575.16736, "r": 384.3519, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 413.90097, "t": 575.16736, "r": 431.33550999999994, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 189, "text": "78.0", "bbox": {"l": 413.90097, "t": 575.16736, "r": 431.33550999999994, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 458.16479000000004, "t": 575.16736, "r": 475.59933000000007, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 190, "text": "57.8", "bbox": {"l": 458.16479000000004, "t": 575.16736, "r": 475.59933000000007, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 497.0289, "t": 575.16736, "r": 514.46344, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 191, "text": "67.9", "bbox": {"l": 497.0289, "t": 575.16736, "r": 514.46344, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 350.72299, "t": 587.12236, "r": 391.31064, "b": 596.02892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 192, "text": "Traprange", "bbox": {"l": 350.72299, "t": 587.12236, "r": 391.31064, "b": 596.02892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 413.90582, "t": 587.12236, "r": 431.34036, "b": 596.02892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 193, "text": "60.8", "bbox": {"l": 413.90582, "t": 587.12236, "r": 431.34036, "b": 596.02892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 458.16965, "t": 587.12236, "r": 475.60419, "b": 596.02892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 194, "text": "49.9", "bbox": {"l": 458.16965, "t": 587.12236, "r": 475.60419, "b": 596.02892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 497.03374999999994, "t": 587.12236, "r": 514.46832, "b": 596.02892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 195, "text": "55.4", "bbox": {"l": 497.03374999999994, "t": 587.12236, "r": 514.46832, "b": 596.02892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 354.13599, "t": 599.07835, "r": 387.89923, "b": 607.98491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 196, "text": "Camelot", "bbox": {"l": 354.13599, "t": 599.07835, "r": 387.89923, "b": 607.98491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 413.90161, "t": 599.07835, "r": 431.33615, "b": 607.98491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 197, "text": "80.0", "bbox": {"l": 413.90161, "t": 599.07835, "r": 431.33615, "b": 607.98491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 458.16544, "t": 599.07835, "r": 475.59998, "b": 607.98491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 198, "text": "66.0", "bbox": {"l": 458.16544, "t": 599.07835, "r": 475.59998, "b": 607.98491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 497.02954000000005, "t": 599.07835, "r": 514.46411, "b": 607.98491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 199, "text": "73.0", "bbox": {"l": 497.02954000000005, "t": 599.07835, "r": 514.46411, "b": 607.98491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 346.55899, "t": 611.03336, "r": 395.47534, "b": 619.93991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 200, "text": "Acrobat Pro", "bbox": {"l": 346.55899, "t": 611.03336, "r": 395.47534, "b": 619.93991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 413.90616, "t": 611.03336, "r": 431.34069999999997, "b": 619.93991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 201, "text": "68.9", "bbox": {"l": 413.90616, "t": 611.03336, "r": 431.34069999999997, "b": 619.93991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 458.16998000000007, "t": 611.03336, "r": 475.60452, "b": 619.93991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 202, "text": "61.8", "bbox": {"l": 458.16998000000007, "t": 611.03336, "r": 475.60452, "b": 619.93991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 497.03409, "t": 611.03336, "r": 514.46863, "b": 619.93991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 203, "text": "65.3", "bbox": {"l": 497.03409, "t": 611.03336, "r": 514.46863, "b": 619.93991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 360.78101, "t": 622.9883600000001, "r": 381.25415, "b": 631.89491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 204, "text": "EDD", "bbox": {"l": 360.78101, "t": 622.9883600000001, "r": 381.25415, "b": 631.89491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 413.90158, "t": 622.9883600000001, "r": 431.33612, "b": 631.89491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 205, "text": "91.2", "bbox": {"l": 413.90158, "t": 622.9883600000001, "r": 431.33612, "b": 631.89491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 458.16541, "t": 622.9883600000001, "r": 475.59995000000004, "b": 631.89491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 206, "text": "85.4", "bbox": {"l": 458.16541, "t": 622.9883600000001, "r": 475.59995000000004, "b": 631.89491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 497.0295100000001, "t": 622.9883600000001, "r": 514.46405, "b": 631.89491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 207, "text": "88.3", "bbox": {"l": 497.0295100000001, "t": 622.9883600000001, "r": 514.46405, "b": 631.89491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 114, "label": "text", "bbox": {"l": 345.483, "t": 634.94336, "r": 396.5513, "b": 643.84991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 208, "text": "TableFormer", "bbox": {"l": 345.483, "t": 634.94336, "r": 396.5513, "b": 643.84991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 115, "label": "text", "bbox": {"l": 413.90616, "t": 634.94336, "r": 431.34069999999997, "b": 643.84991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 209, "text": "95.4", "bbox": {"l": 413.90616, "t": 634.94336, "r": 431.34069999999997, "b": 643.84991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 116, "label": "text", "bbox": {"l": 458.16998000000007, "t": 634.94336, "r": 475.60452, "b": 643.84991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 210, "text": "90.1", "bbox": {"l": 458.16998000000007, "t": 634.94336, "r": 475.60452, "b": 643.84991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 117, "label": "text", "bbox": {"l": 497.03400000000005, "t": 634.82381, "r": 514.46857, "b": 643.78018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 211, "text": "93.6", "bbox": {"l": 497.03400000000005, "t": 634.82381, "r": 514.46857, "b": 643.78018, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["fcel", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "nl"], "num_rows": 7, "num_cols": 4, "table_cells": [{"bbox": {"l": 358.01099, "t": 552.23337, "r": 384.02335, "b": 561.1399200000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Model", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 448.6951, "t": 546.25537, "r": 485.07849, "b": 567.11693, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "TEDS Complex", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 408.50598, "t": 558.21037, "r": 436.73999, "b": 567.11693, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Simple", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 499.3848, "t": 558.21037, "r": 512.117, "b": 567.11693, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "All", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 357.68201, "t": 575.16736, "r": 384.3519, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Tabula", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 413.90097, "t": 575.16736, "r": 431.33550999999994, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "78.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 458.16479000000004, "t": 575.16736, "r": 475.59933000000007, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "57.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 497.0289, "t": 575.16736, "r": 514.46344, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "67.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 350.72299, "t": 587.12236, "r": 391.31064, "b": 596.02892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Traprange", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 413.90582, "t": 587.12236, "r": 431.34036, "b": 596.02892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "60.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 458.16965, "t": 587.12236, "r": 475.60419, "b": 596.02892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "49.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 497.03374999999994, "t": 587.12236, "r": 514.46832, "b": 596.02892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "55.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 354.13599, "t": 599.07835, "r": 387.89923, "b": 607.98491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Camelot", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 413.90161, "t": 599.07835, "r": 431.33615, "b": 607.98491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "80.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 458.16544, "t": 599.07835, "r": 475.59998, "b": 607.98491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "66.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 497.02954000000005, "t": 599.07835, "r": 514.46411, "b": 607.98491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "73.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 346.55899, "t": 611.03336, "r": 395.47534, "b": 619.93991, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Acrobat Pro", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 413.90616, "t": 611.03336, "r": 431.34069999999997, "b": 619.93991, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "68.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 458.16998000000007, "t": 611.03336, "r": 475.60452, "b": 619.93991, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "61.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 497.03409, "t": 611.03336, "r": 514.46863, "b": 619.93991, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "65.3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 360.78101, "t": 622.9883600000001, "r": 381.25415, "b": 631.89491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "EDD", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 413.90158, "t": 622.9883600000001, "r": 431.33612, "b": 631.89491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "91.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 458.16541, "t": 622.9883600000001, "r": 475.59995000000004, "b": 631.89491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "85.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 497.0295100000001, "t": 622.9883600000001, "r": 514.46405, "b": 631.89491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "88.3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 345.483, "t": 634.94336, "r": 396.5513, "b": 643.84991, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 413.90616, "t": 634.94336, "r": 431.34069999999997, "b": 643.84991, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "95.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 458.16998000000007, "t": 634.94336, "r": 475.60452, "b": 643.84991, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "90.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 497.03400000000005, "t": 634.82381, "r": 514.46857, "b": 643.78018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "93.6", "column_header": false, "row_header": false, "row_section": false}]}}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "section_header", "id": 10, "page_no": 6, "cluster": {"id": 10, "label": "section_header", "bbox": {"l": 50.112, "t": 74.40137000000016, "r": 167.89825, "b": 84.25342, "coord_origin": "TOPLEFT"}, "confidence": 0.9554274082183838, "cells": [{"id": 0, "text": "5.3.", "bbox": {"l": 50.112, "t": 74.40137000000016, "r": 63.704811, "b": 84.25342, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Datasets and Metrics", "bbox": {"l": 72.766685, "t": 74.40137000000016, "r": 167.89825, "b": 84.25342, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5.3. Datasets and Metrics"}, {"label": "text", "id": 1, "page_no": 6, "cluster": {"id": 1, "label": "text", "bbox": {"l": 50.112, "t": 93.35039999999992, "r": 286.36511, "b": 138.12298999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9862998127937317, "cells": [{"id": 2, "text": "The Tree-Edit-Distance-Based Similarity (TEDS) met-", "bbox": {"l": 62.067001, "t": 93.35039999999992, "r": 286.36499, "b": 102.25696000000016, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "ric was introduced in [37]. It represents the prediction, and", "bbox": {"l": 50.112, "t": 105.30542000000003, "r": 286.36511, "b": 114.21198000000015, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "ground-truth as a tree structure of HTML tags. This simi-", "bbox": {"l": 50.112, "t": 117.26044000000002, "r": 286.36505, "b": 126.16699000000006, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "larity is calculated as:", "bbox": {"l": 50.112, "t": 129.21642999999995, "r": 136.71687, "b": 138.12298999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The Tree-Edit-Distance-Based Similarity (TEDS) metric was introduced in [37]. It represents the prediction, and ground-truth as a tree structure of HTML tags. This similarity is calculated as:"}, {"label": "formula", "id": 13, "page_no": 6, "cluster": {"id": 13, "label": "formula", "bbox": {"l": 86.218994, "t": 150.31799, "r": 286.3624, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9500409364700317, "cells": [{"id": 6, "text": "TEDS (", "bbox": {"l": 86.218994, "t": 157.05798000000004, "r": 118.8784, "b": 165.90479000000005, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "T$_{a}$, T$_{b}$", "bbox": {"l": 118.87499, "t": 157.05798000000004, "r": 143.26962, "b": 165.90479000000005, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": ") = 1", "bbox": {"l": 143.76799, "t": 157.05798000000004, "r": 165.9019, "b": 165.90479000000005, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "\u2212", "bbox": {"l": 168.12099, "t": 156.50012000000004, "r": 175.8699, "b": 165.90479000000005, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "EditDist (", "bbox": {"l": 179.27899, "t": 150.31799, "r": 221.95677, "b": 159.16479000000004, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "T$_{a}$, T$_{b}$", "bbox": {"l": 221.95200000000003, "t": 150.31799, "r": 246.34663, "b": 159.16479000000004, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": ")", "bbox": {"l": 246.84499999999997, "t": 150.31799, "r": 250.71945, "b": 159.16479000000004, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "max (", "bbox": {"l": 182.21201, "t": 163.89197000000001, "r": 206.29161, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "|", "bbox": {"l": 206.289, "t": 163.33411, "r": 209.05661, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "T$_{a}$", "bbox": {"l": 209.056, "t": 163.89197000000001, "r": 219.19968, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "|", "bbox": {"l": 219.69700999999998, "t": 163.33411, "r": 222.46461000000002, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": ",", "bbox": {"l": 224.125, "t": 163.89197000000001, "r": 226.89261, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "|", "bbox": {"l": 228.55299000000002, "t": 163.33411, "r": 231.3206, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "T$_{b}$", "bbox": {"l": 231.31999, "t": 163.89197000000001, "r": 240.64563, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "|", "bbox": {"l": 241.144, "t": 163.33411, "r": 243.91161, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": ")", "bbox": {"l": 243.911, "t": 163.89197000000001, "r": 247.78545, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "(3)", "bbox": {"l": 274.746, "t": 157.21740999999997, "r": 286.3624, "b": 166.12396, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "TEDS ( T$_{a}$, T$_{b}$ ) = 1 \u2212 EditDist ( T$_{a}$, T$_{b}$ ) max ( | T$_{a}$ | , | T$_{b}$ | ) (3)"}, {"label": "text", "id": 6, "page_no": 6, "cluster": {"id": 6, "label": "text", "bbox": {"l": 50.111984, "t": 181.00298999999995, "r": 286.36285, "b": 213.97900000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9735319018363953, "cells": [{"id": 23, "text": "where", "bbox": {"l": 62.067001, "t": 181.16241000000002, "r": 86.405632, "b": 190.06897000000004, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "T$_{a}$", "bbox": {"l": 88.581001, "t": 181.00298999999995, "r": 98.724663, "b": 189.84978999999998, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "and", "bbox": {"l": 101.399, "t": 181.16241000000002, "r": 115.785, "b": 190.06897000000004, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "T$_{b}$", "bbox": {"l": 117.961, "t": 181.00298999999995, "r": 127.28664, "b": 189.84978999999998, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "represent tables in tree structure HTML", "bbox": {"l": 129.95999, "t": 181.16241000000002, "r": 286.36285, "b": 190.06897000000004, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "format. EditDist denotes the tree-edit distance, and", "bbox": {"l": 50.111992, "t": 193.11743, "r": 252.78116000000003, "b": 202.02399000000003, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "|", "bbox": {"l": 255.18201, "t": 192.40015000000005, "r": 257.94962, "b": 201.80480999999997, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "T", "bbox": {"l": 257.94901, "t": 192.95800999999994, "r": 263.77115, "b": 201.80480999999997, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "|", "bbox": {"l": 265.155, "t": 192.40015000000005, "r": 267.92261, "b": 201.80480999999997, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "rep-", "bbox": {"l": 270.32199, "t": 193.11743, "r": 286.36179, "b": 202.02399000000003, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "resents the number of nodes in", "bbox": {"l": 50.111984, "t": 205.07245, "r": 172.13388, "b": 213.97900000000004, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "T", "bbox": {"l": 174.62399, "t": 204.91301999999996, "r": 180.44614, "b": 213.75982999999997, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": ".", "bbox": {"l": 181.82899, "t": 205.07245, "r": 184.31964, "b": 213.97900000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "where T$_{a}$ and T$_{b}$ represent tables in tree structure HTML format. EditDist denotes the tree-edit distance, and | T | represents the number of nodes in T ."}, {"label": "section_header", "id": 9, "page_no": 6, "cluster": {"id": 9, "label": "section_header", "bbox": {"l": 50.112, "t": 224.81946000000005, "r": 170.45169, "b": 234.67151, "coord_origin": "TOPLEFT"}, "confidence": 0.9588837027549744, "cells": [{"id": 36, "text": "5.4.", "bbox": {"l": 50.112, "t": 224.81946000000005, "r": 64.551605, "b": 234.67151, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "Quantitative Analysis", "bbox": {"l": 74.178009, "t": 224.81946000000005, "r": 170.45169, "b": 234.67151, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5.4. Quantitative Analysis"}, {"label": "text", "id": 2, "page_no": 6, "cluster": {"id": 2, "label": "text", "bbox": {"l": 50.112, "t": 243.6499, "r": 286.36514, "b": 396.13794, "coord_origin": "TOPLEFT"}, "confidence": 0.9855090975761414, "cells": [{"id": 38, "text": "Structure.", "bbox": {"l": 62.067001, "t": 243.6499, "r": 105.32461, "b": 252.60626000000002, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "As shown in Tab.", "bbox": {"l": 112.12600000000002, "t": 243.76946999999996, "r": 184.68361, "b": 252.67602999999997, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "2, TableFormer outper-", "bbox": {"l": 191.4781, "t": 243.76946999999996, "r": 286.36188, "b": 252.67602999999997, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "forms all SOTA methods across different datasets by a large", "bbox": {"l": 50.112, "t": 255.72448999999995, "r": 286.36508, "b": 264.63104, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "margin for predicting the table structure from an image.", "bbox": {"l": 50.112, "t": 267.67949999999996, "r": 286.36508, "b": 276.58606, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "All the more, our model outperforms pre-trained methods.", "bbox": {"l": 50.112, "t": 279.63446, "r": 286.36508, "b": 288.54105, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "During the evaluation we do not apply any table filtering.", "bbox": {"l": 50.112, "t": 291.59048, "r": 286.36514, "b": 300.49704, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "We also provide our baseline results on the SynthTabNet", "bbox": {"l": 50.112, "t": 303.54547, "r": 286.36508, "b": 312.45203000000004, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "dataset. It has been observed that large tables (e.g. tables", "bbox": {"l": 50.112, "t": 315.50046, "r": 286.36505, "b": 324.40700999999996, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "that occupy half of the page or more) yield poor predictions.", "bbox": {"l": 50.112, "t": 327.45544, "r": 286.36508, "b": 336.362, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "We attribute this issue to the image resizing during the pre-", "bbox": {"l": 50.112, "t": 339.41043, "r": 286.36508, "b": 348.31699000000003, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "processing step, that produces downsampled images with", "bbox": {"l": 50.112, "t": 351.36542, "r": 286.36505, "b": 360.27197, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "indistinguishable features. This problem can be addressed", "bbox": {"l": 50.112, "t": 363.32141, "r": 286.36508, "b": 372.2279700000001, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "by treating such big tables with a separate model which ac-", "bbox": {"l": 50.112, "t": 375.2764, "r": 286.36511, "b": 384.18295000000006, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "cepts a large input image size.", "bbox": {"l": 50.112, "t": 387.23138, "r": 170.01187, "b": 396.13794, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Structure. As shown in Tab. 2, TableFormer outperforms all SOTA methods across different datasets by a large margin for predicting the table structure from an image. All the more, our model outperforms pre-trained methods. During the evaluation we do not apply any table filtering. We also provide our baseline results on the SynthTabNet dataset. It has been observed that large tables (e.g. tables that occupy half of the page or more) yield poor predictions. We attribute this issue to the image resizing during the preprocessing step, that produces downsampled images with indistinguishable features. This problem can be addressed by treating such big tables with a separate model which accepts a large input image size."}, {"label": "table", "id": 0, "page_no": 6, "cluster": {"id": 0, "label": "table", "bbox": {"l": 53.368526458740234, "t": 409.1357727050781, "r": 283.0443420410156, "b": 582.3977661132812, "coord_origin": "TOPLEFT"}, "confidence": 0.9892510175704956, "cells": [{"id": 53, "text": "Model", "bbox": {"l": 78.843002, "t": 420.69037, "r": 104.85535, "b": 429.59692, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "TEDS", "bbox": {"l": 211.2, "t": 414.71237, "r": 236.10649, "b": 423.61893, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "Dataset", "bbox": {"l": 129.338, "t": 426.66736, "r": 159.21584, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Simple", "bbox": {"l": 171.17096, "t": 426.66736, "r": 199.40497, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Complex", "bbox": {"l": 211.36009, "t": 426.66736, "r": 247.74349999999998, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "All", "bbox": {"l": 264.54044, "t": 426.66736, "r": 277.27264, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "EDD", "bbox": {"l": 81.612, "t": 443.62436, "r": 102.08514, "b": 452.53091, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "PTN", "bbox": {"l": 134.87206, "t": 443.62436, "r": 153.69141, "b": 452.53091, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "91.1", "bbox": {"l": 176.56554, "t": 443.62436, "r": 194.00009, "b": 452.53091, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "88.7", "bbox": {"l": 220.82938000000001, "t": 443.62436, "r": 238.26393, "b": 452.53091, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "89.9", "bbox": {"l": 262.18414, "t": 443.62436, "r": 279.61868, "b": 452.53091, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "GTE", "bbox": {"l": 82.165001, "t": 455.58035, "r": 101.5323, "b": 464.48691, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "PTN", "bbox": {"l": 134.86716, "t": 455.58035, "r": 153.68651, "b": 464.48691, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "-", "bbox": {"l": 183.62411, "t": 455.58035, "r": 186.94167, "b": 464.48691, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "-", "bbox": {"l": 227.88795000000002, "t": 455.58035, "r": 231.20551, "b": 464.48691, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "93.01", "bbox": {"l": 259.69855, "t": 455.58035, "r": 282.11441, "b": 464.48691, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 468.13336, "r": 117.38329000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "PTN", "bbox": {"l": 134.86766, "t": 468.13336, "r": 153.68701, "b": 477.03992, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "98.5", "bbox": {"l": 176.57111, "t": 468.13336, "r": 194.00566, "b": 477.03992, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "95.0", "bbox": {"l": 220.83495, "t": 468.13336, "r": 238.26950000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "96.75", "bbox": {"l": 259.698, "t": 468.01379, "r": 282.11386, "b": 476.97018, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "EDD", "bbox": {"l": 81.612, "t": 483.32635, "r": 102.08514, "b": 492.23291, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "FTN", "bbox": {"l": 134.87206, "t": 483.32635, "r": 153.69141, "b": 492.23291, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "88.4", "bbox": {"l": 176.56554, "t": 483.32635, "r": 194.00009, "b": 492.23291, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "92.08", "bbox": {"l": 218.33870999999996, "t": 483.32635, "r": 240.75455999999997, "b": 492.23291, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "90.6", "bbox": {"l": 262.18411, "t": 483.32635, "r": 279.61865, "b": 492.23291, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "GTE", "bbox": {"l": 82.165001, "t": 495.28134, "r": 101.5323, "b": 504.1879, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "FTN", "bbox": {"l": 134.86716, "t": 495.28134, "r": 153.68651, "b": 504.1879, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "-", "bbox": {"l": 183.62411, "t": 495.28134, "r": 186.94167, "b": 504.1879, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "-", "bbox": {"l": 227.88795000000002, "t": 495.28134, "r": 231.20551, "b": 504.1879, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "87.14", "bbox": {"l": 259.69855, "t": 495.28134, "r": 282.11441, "b": 504.1879, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "GTE (FT)", "bbox": {"l": 71.789001, "t": 507.23633, "r": 111.90838999999998, "b": 516.14288, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "FTN", "bbox": {"l": 134.86221, "t": 507.23633, "r": 153.68156, "b": 516.14288, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "-", "bbox": {"l": 183.62914, "t": 507.23633, "r": 186.94669, "b": 516.14288, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "-", "bbox": {"l": 227.89297, "t": 507.23633, "r": 231.21053000000003, "b": 516.14288, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "91.02", "bbox": {"l": 259.6936, "t": 507.23633, "r": 282.10947, "b": 516.14288, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 519.1913099999999, "r": 117.38329000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "FTN", "bbox": {"l": 134.86766, "t": 519.1913099999999, "r": 153.68701, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "97.5", "bbox": {"l": 176.57111, "t": 519.1913099999999, "r": 194.00566, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "96.0", "bbox": {"l": 220.83495, "t": 519.1913099999999, "r": 238.26950000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "96.8", "bbox": {"l": 262.189, "t": 519.0717500000001, "r": 279.62354, "b": 528.02814, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "EDD", "bbox": {"l": 81.612, "t": 536.49837, "r": 102.08514, "b": 545.40492, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "TB", "bbox": {"l": 137.91064, "t": 536.49837, "r": 150.64285, "b": 545.40492, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "86.0", "bbox": {"l": 176.56554, "t": 536.49837, "r": 194.00009, "b": 545.40492, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "-", "bbox": {"l": 227.89285, "t": 536.49837, "r": 231.21040000000002, "b": 545.40492, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "86.0", "bbox": {"l": 262.18411, "t": 536.49837, "r": 279.61865, "b": 545.40492, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 548.45436, "r": 117.38329000000002, "b": 557.36092, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "TB", "bbox": {"l": 137.90625, "t": 548.45436, "r": 150.63846, "b": 557.36092, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "89.6", "bbox": {"l": 176.57111, "t": 548.45436, "r": 194.00566, "b": 557.36092, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "-", "bbox": {"l": 227.88845999999998, "t": 548.45436, "r": 231.20601, "b": 557.36092, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "89.6", "bbox": {"l": 262.189, "t": 548.3348100000001, "r": 279.62354, "b": 557.2911799999999, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 568.00237, "r": 117.38329000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "STN", "bbox": {"l": 134.86766, "t": 568.00237, "r": 153.68701, "b": 576.90892, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "96.9", "bbox": {"l": 176.57111, "t": 568.00237, "r": 194.00566, "b": 576.90892, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "95.7", "bbox": {"l": 220.83495, "t": 568.00237, "r": 238.26950000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "96.7", "bbox": {"l": 262.1897, "t": 568.00237, "r": 279.62424, "b": 576.90892, "coord_origin": "TOPLEFT"}}], "children": [{"id": 17, "label": "text", "bbox": {"l": 78.843002, "t": 420.69037, "r": 104.85535, "b": 429.59692, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "Model", "bbox": {"l": 78.843002, "t": 420.69037, "r": 104.85535, "b": 429.59692, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 211.2, "t": 414.71237, "r": 236.10649, "b": 423.61893, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "TEDS", "bbox": {"l": 211.2, "t": 414.71237, "r": 236.10649, "b": 423.61893, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 129.338, "t": 426.66736, "r": 159.21584, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "Dataset", "bbox": {"l": 129.338, "t": 426.66736, "r": 159.21584, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 171.17096, "t": 426.66736, "r": 199.40497, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "Simple", "bbox": {"l": 171.17096, "t": 426.66736, "r": 199.40497, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 211.36009, "t": 426.66736, "r": 247.74349999999998, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "Complex", "bbox": {"l": 211.36009, "t": 426.66736, "r": 247.74349999999998, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 264.54044, "t": 426.66736, "r": 277.27264, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "All", "bbox": {"l": 264.54044, "t": 426.66736, "r": 277.27264, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 81.612, "t": 443.62436, "r": 102.08514, "b": 452.53091, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "EDD", "bbox": {"l": 81.612, "t": 443.62436, "r": 102.08514, "b": 452.53091, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 134.87206, "t": 443.62436, "r": 153.69141, "b": 452.53091, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "PTN", "bbox": {"l": 134.87206, "t": 443.62436, "r": 153.69141, "b": 452.53091, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 176.56554, "t": 443.62436, "r": 194.00009, "b": 452.53091, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "91.1", "bbox": {"l": 176.56554, "t": 443.62436, "r": 194.00009, "b": 452.53091, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 220.82938000000001, "t": 443.62436, "r": 238.26393, "b": 452.53091, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "88.7", "bbox": {"l": 220.82938000000001, "t": 443.62436, "r": 238.26393, "b": 452.53091, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 262.18414, "t": 443.62436, "r": 279.61868, "b": 452.53091, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "89.9", "bbox": {"l": 262.18414, "t": 443.62436, "r": 279.61868, "b": 452.53091, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 82.165001, "t": 455.58035, "r": 101.5323, "b": 464.48691, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "GTE", "bbox": {"l": 82.165001, "t": 455.58035, "r": 101.5323, "b": 464.48691, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 134.86716, "t": 455.58035, "r": 153.68651, "b": 464.48691, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "PTN", "bbox": {"l": 134.86716, "t": 455.58035, "r": 153.68651, "b": 464.48691, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 183.62411, "t": 455.58035, "r": 186.94167, "b": 464.48691, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "-", "bbox": {"l": 183.62411, "t": 455.58035, "r": 186.94167, "b": 464.48691, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 227.88795000000002, "t": 455.58035, "r": 231.20551, "b": 464.48691, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "-", "bbox": {"l": 227.88795000000002, "t": 455.58035, "r": 231.20551, "b": 464.48691, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 259.69855, "t": 455.58035, "r": 282.11441, "b": 464.48691, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "93.01", "bbox": {"l": 259.69855, "t": 455.58035, "r": 282.11441, "b": 464.48691, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 66.315002, "t": 468.13336, "r": 117.38329000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 468.13336, "r": 117.38329000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 134.86766, "t": 468.13336, "r": 153.68701, "b": 477.03992, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "PTN", "bbox": {"l": 134.86766, "t": 468.13336, "r": 153.68701, "b": 477.03992, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 176.57111, "t": 468.13336, "r": 194.00566, "b": 477.03992, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "98.5", "bbox": {"l": 176.57111, "t": 468.13336, "r": 194.00566, "b": 477.03992, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 220.83495, "t": 468.13336, "r": 238.26950000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "95.0", "bbox": {"l": 220.83495, "t": 468.13336, "r": 238.26950000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 259.698, "t": 468.01379, "r": 282.11386, "b": 476.97018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "96.75", "bbox": {"l": 259.698, "t": 468.01379, "r": 282.11386, "b": 476.97018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 81.612, "t": 483.32635, "r": 102.08514, "b": 492.23291, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "EDD", "bbox": {"l": 81.612, "t": 483.32635, "r": 102.08514, "b": 492.23291, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 134.87206, "t": 483.32635, "r": 153.69141, "b": 492.23291, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "FTN", "bbox": {"l": 134.87206, "t": 483.32635, "r": 153.69141, "b": 492.23291, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 176.56554, "t": 483.32635, "r": 194.00009, "b": 492.23291, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "88.4", "bbox": {"l": 176.56554, "t": 483.32635, "r": 194.00009, "b": 492.23291, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 218.33870999999996, "t": 483.32635, "r": 240.75455999999997, "b": 492.23291, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "92.08", "bbox": {"l": 218.33870999999996, "t": 483.32635, "r": 240.75455999999997, "b": 492.23291, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 262.18411, "t": 483.32635, "r": 279.61865, "b": 492.23291, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "90.6", "bbox": {"l": 262.18411, "t": 483.32635, "r": 279.61865, "b": 492.23291, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 82.165001, "t": 495.28134, "r": 101.5323, "b": 504.1879, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "GTE", "bbox": {"l": 82.165001, "t": 495.28134, "r": 101.5323, "b": 504.1879, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 134.86716, "t": 495.28134, "r": 153.68651, "b": 504.1879, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "FTN", "bbox": {"l": 134.86716, "t": 495.28134, "r": 153.68651, "b": 504.1879, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 183.62411, "t": 495.28134, "r": 186.94167, "b": 504.1879, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "-", "bbox": {"l": 183.62411, "t": 495.28134, "r": 186.94167, "b": 504.1879, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 227.88795000000002, "t": 495.28134, "r": 231.20551, "b": 504.1879, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "-", "bbox": {"l": 227.88795000000002, "t": 495.28134, "r": 231.20551, "b": 504.1879, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 259.69855, "t": 495.28134, "r": 282.11441, "b": 504.1879, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "87.14", "bbox": {"l": 259.69855, "t": 495.28134, "r": 282.11441, "b": 504.1879, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 71.789001, "t": 507.23633, "r": 111.90838999999998, "b": 516.14288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "GTE (FT)", "bbox": {"l": 71.789001, "t": 507.23633, "r": 111.90838999999998, "b": 516.14288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 134.86221, "t": 507.23633, "r": 153.68156, "b": 516.14288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "FTN", "bbox": {"l": 134.86221, "t": 507.23633, "r": 153.68156, "b": 516.14288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 183.62914, "t": 507.23633, "r": 186.94669, "b": 516.14288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "-", "bbox": {"l": 183.62914, "t": 507.23633, "r": 186.94669, "b": 516.14288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 227.89297, "t": 507.23633, "r": 231.21053000000003, "b": 516.14288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "-", "bbox": {"l": 227.89297, "t": 507.23633, "r": 231.21053000000003, "b": 516.14288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 259.6936, "t": 507.23633, "r": 282.10947, "b": 516.14288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "91.02", "bbox": {"l": 259.6936, "t": 507.23633, "r": 282.10947, "b": 516.14288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 66.315002, "t": 519.1913099999999, "r": 117.38329000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 519.1913099999999, "r": 117.38329000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 134.86766, "t": 519.1913099999999, "r": 153.68701, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "FTN", "bbox": {"l": 134.86766, "t": 519.1913099999999, "r": 153.68701, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 176.57111, "t": 519.1913099999999, "r": 194.00566, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "97.5", "bbox": {"l": 176.57111, "t": 519.1913099999999, "r": 194.00566, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 220.83495, "t": 519.1913099999999, "r": 238.26950000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "96.0", "bbox": {"l": 220.83495, "t": 519.1913099999999, "r": 238.26950000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 262.189, "t": 519.0717500000001, "r": 279.62354, "b": 528.02814, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "96.8", "bbox": {"l": 262.189, "t": 519.0717500000001, "r": 279.62354, "b": 528.02814, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 81.612, "t": 536.49837, "r": 102.08514, "b": 545.40492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "EDD", "bbox": {"l": 81.612, "t": 536.49837, "r": 102.08514, "b": 545.40492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 137.91064, "t": 536.49837, "r": 150.64285, "b": 545.40492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "TB", "bbox": {"l": 137.91064, "t": 536.49837, "r": 150.64285, "b": 545.40492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 176.56554, "t": 536.49837, "r": 194.00009, "b": 545.40492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "86.0", "bbox": {"l": 176.56554, "t": 536.49837, "r": 194.00009, "b": 545.40492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 227.89285, "t": 536.49837, "r": 231.21040000000002, "b": 545.40492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "-", "bbox": {"l": 227.89285, "t": 536.49837, "r": 231.21040000000002, "b": 545.40492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 262.18411, "t": 536.49837, "r": 279.61865, "b": 545.40492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "86.0", "bbox": {"l": 262.18411, "t": 536.49837, "r": 279.61865, "b": 545.40492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 66.315002, "t": 548.45436, "r": 117.38329000000002, "b": 557.36092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 548.45436, "r": 117.38329000000002, "b": 557.36092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 137.90625, "t": 548.45436, "r": 150.63846, "b": 557.36092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "TB", "bbox": {"l": 137.90625, "t": 548.45436, "r": 150.63846, "b": 557.36092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 176.57111, "t": 548.45436, "r": 194.00566, "b": 557.36092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "89.6", "bbox": {"l": 176.57111, "t": 548.45436, "r": 194.00566, "b": 557.36092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 227.88845999999998, "t": 548.45436, "r": 231.20601, "b": 557.36092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "-", "bbox": {"l": 227.88845999999998, "t": 548.45436, "r": 231.20601, "b": 557.36092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 262.189, "t": 548.3348100000001, "r": 279.62354, "b": 557.2911799999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": "89.6", "bbox": {"l": 262.189, "t": 548.3348100000001, "r": 279.62354, "b": 557.2911799999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 66.315002, "t": 568.00237, "r": 117.38329000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 568.00237, "r": 117.38329000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 134.86766, "t": 568.00237, "r": 153.68701, "b": 576.90892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "STN", "bbox": {"l": 134.86766, "t": 568.00237, "r": 153.68701, "b": 576.90892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 176.57111, "t": 568.00237, "r": 194.00566, "b": 576.90892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": "96.9", "bbox": {"l": 176.57111, "t": 568.00237, "r": 194.00566, "b": 576.90892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 220.83495, "t": 568.00237, "r": 238.26950000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 107, "text": "95.7", "bbox": {"l": 220.83495, "t": 568.00237, "r": 238.26950000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 262.1897, "t": 568.00237, "r": 279.62424, "b": 576.90892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 108, "text": "96.7", "bbox": {"l": 262.1897, "t": 568.00237, "r": 279.62424, "b": 576.90892, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 11, "num_cols": 5, "table_cells": [{"bbox": {"l": 78.843002, "t": 420.69037, "r": 104.85535, "b": 429.59692, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Model", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 211.2, "t": 414.71237, "r": 247.74349999999998, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "TEDS Complex", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 129.338, "t": 426.66736, "r": 159.21584, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Dataset", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 171.17096, "t": 426.66736, "r": 199.40497, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Simple", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 264.54044, "t": 426.66736, "r": 277.27264, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "All", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 81.612, "t": 443.62436, "r": 102.08514, "b": 452.53091, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "EDD", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.87206, "t": 443.62436, "r": 153.69141, "b": 452.53091, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "PTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.56554, "t": 443.62436, "r": 194.00009, "b": 452.53091, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "91.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 220.82938000000001, "t": 443.62436, "r": 238.26393, "b": 452.53091, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "88.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 262.18414, "t": 443.62436, "r": 279.61868, "b": 452.53091, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "89.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 82.165001, "t": 455.58035, "r": 101.5323, "b": 464.48691, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "GTE", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.86716, "t": 455.58035, "r": 153.68651, "b": 464.48691, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "PTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 183.62411, "t": 455.58035, "r": 186.94167, "b": 464.48691, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 227.88795000000002, "t": 455.58035, "r": 231.20551, "b": 464.48691, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 259.69855, "t": 455.58035, "r": 282.11441, "b": 464.48691, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "93.01", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 66.315002, "t": 468.13336, "r": 117.38329000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.86766, "t": 468.13336, "r": 153.68701, "b": 477.03992, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "PTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.57111, "t": 468.13336, "r": 194.00566, "b": 477.03992, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "98.5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 220.83495, "t": 468.13336, "r": 238.26950000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "95.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 259.698, "t": 468.01379, "r": 282.11386, "b": 476.97018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "96.75", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 81.612, "t": 483.32635, "r": 102.08514, "b": 492.23291, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "EDD", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.87206, "t": 483.32635, "r": 153.69141, "b": 492.23291, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "FTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.56554, "t": 483.32635, "r": 194.00009, "b": 492.23291, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "88.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 218.33870999999996, "t": 483.32635, "r": 240.75455999999997, "b": 492.23291, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "92.08", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 262.18411, "t": 483.32635, "r": 279.61865, "b": 492.23291, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "90.6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 82.165001, "t": 495.28134, "r": 101.5323, "b": 504.1879, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "GTE", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.86716, "t": 495.28134, "r": 153.68651, "b": 504.1879, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "FTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 183.62411, "t": 495.28134, "r": 186.94167, "b": 504.1879, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 227.88795000000002, "t": 495.28134, "r": 231.20551, "b": 504.1879, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 259.69855, "t": 495.28134, "r": 282.11441, "b": 504.1879, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "87.14", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 71.789001, "t": 507.23633, "r": 111.90838999999998, "b": 516.14288, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "GTE (FT)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.86221, "t": 507.23633, "r": 153.68156, "b": 516.14288, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "FTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 183.62914, "t": 507.23633, "r": 186.94669, "b": 516.14288, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 227.89297, "t": 507.23633, "r": 231.21053000000003, "b": 516.14288, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 259.6936, "t": 507.23633, "r": 282.10947, "b": 516.14288, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "91.02", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 66.315002, "t": 519.1913099999999, "r": 117.38329000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.86766, "t": 519.1913099999999, "r": 153.68701, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "FTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.57111, "t": 519.1913099999999, "r": 194.00566, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "97.5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 220.83495, "t": 519.1913099999999, "r": 238.26950000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "96.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 262.189, "t": 519.0717500000001, "r": 279.62354, "b": 528.02814, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "96.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 81.612, "t": 536.49837, "r": 102.08514, "b": 545.40492, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "EDD", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 137.91064, "t": 536.49837, "r": 150.64285, "b": 545.40492, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "TB", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.56554, "t": 536.49837, "r": 194.00009, "b": 545.40492, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "86.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 227.89285, "t": 536.49837, "r": 231.21040000000002, "b": 545.40492, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 262.18411, "t": 536.49837, "r": 279.61865, "b": 545.40492, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "86.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 66.315002, "t": 548.45436, "r": 117.38329000000002, "b": 557.36092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 137.90625, "t": 548.45436, "r": 150.63846, "b": 557.36092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "TB", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.57111, "t": 548.45436, "r": 194.00566, "b": 557.36092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "89.6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 227.88845999999998, "t": 548.45436, "r": 231.20601, "b": 557.36092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 262.189, "t": 548.3348100000001, "r": 279.62354, "b": 557.2911799999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "89.6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 66.315002, "t": 568.00237, "r": 117.38329000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.86766, "t": 568.00237, "r": 153.68701, "b": 576.90892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "STN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.57111, "t": 568.00237, "r": 194.00566, "b": 576.90892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "96.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 220.83495, "t": 568.00237, "r": 238.26950000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "95.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 262.1897, "t": 568.00237, "r": 279.62424, "b": 576.90892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "96.7", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "text", "id": 15, "page_no": 6, "cluster": {"id": 15, "label": "text", "bbox": {"l": 50.112, "t": 592.43336, "r": 286.36511, "b": 613.29492, "coord_origin": "TOPLEFT"}, "confidence": 0.7209173440933228, "cells": [{"id": 109, "text": "Table 2: Structure results on PubTabNet (PTN), FinTabNet", "bbox": {"l": 50.112, "t": 592.43336, "r": 286.36511, "b": 601.33992, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "(FTN), TableBank (TB) and SynthTabNet (STN).", "bbox": {"l": 50.112, "t": 604.38837, "r": 247.46114, "b": 613.29492, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 2: Structure results on PubTabNet (PTN), FinTabNet (FTN), TableBank (TB) and SynthTabNet (STN)."}, {"label": "text", "id": 16, "page_no": 6, "cluster": {"id": 16, "label": "text", "bbox": {"l": 50.112, "t": 616.34337, "r": 261.78732, "b": 625.24992, "coord_origin": "TOPLEFT"}, "confidence": 0.6433312892913818, "cells": [{"id": 111, "text": "FT: Model was trained on PubTabNet then finetuned.", "bbox": {"l": 50.112, "t": 616.34337, "r": 261.78732, "b": 625.24992, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "FT: Model was trained on PubTabNet then finetuned."}, {"label": "text", "id": 3, "page_no": 6, "cluster": {"id": 3, "label": "text", "bbox": {"l": 50.112015, "t": 644.3498099999999, "r": 286.366, "b": 713.151932, "coord_origin": "TOPLEFT"}, "confidence": 0.9854635000228882, "cells": [{"id": 112, "text": "Cell Detection.", "bbox": {"l": 62.067001, "t": 644.3498099999999, "r": 124.72179, "b": 653.30618, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "Like any object detector, our", "bbox": {"l": 128.20401, "t": 644.46936, "r": 242.9333, "b": 653.37592, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "Cell BBox", "bbox": {"l": 245.55401999999998, "t": 644.55902, "r": 286.36084, "b": 653.1467700000001, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "Detector", "bbox": {"l": 50.112015, "t": 656.51402, "r": 84.971146, "b": 665.10178, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "provides bounding boxes that can be improved", "bbox": {"l": 89.515015, "t": 656.42436, "r": 286.366, "b": 665.33092, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "with post-processing during inference. We make use of the", "bbox": {"l": 50.112015, "t": 668.37936, "r": 286.36511, "b": 677.28593, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "grid-like structure of tables to refine the predictions. A de-", "bbox": {"l": 50.112015, "t": 680.33536, "r": 286.36505, "b": 689.24193, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "tailed explanation on the post-processing is available in the", "bbox": {"l": 50.112015, "t": 692.290359, "r": 286.36511, "b": 701.19693, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "supplementary material. As shown in Tab. 3, we evaluate", "bbox": {"l": 50.112015, "t": 704.245361, "r": 286.36508, "b": 713.151932, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Cell Detection. Like any object detector, our Cell BBox Detector provides bounding boxes that can be improved with post-processing during inference. We make use of the grid-like structure of tables to refine the predictions. A detailed explanation on the post-processing is available in the supplementary material. As shown in Tab. 3, we evaluate"}, {"label": "text", "id": 7, "page_no": 6, "cluster": {"id": 7, "label": "text", "bbox": {"l": 308.862, "t": 75.20836999999995, "r": 545.11517, "b": 227.57709, "coord_origin": "TOPLEFT"}, "confidence": 0.9713197946548462, "cells": [{"id": 121, "text": "our", "bbox": {"l": 308.862, "t": 75.20836999999995, "r": 322.14215, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Cell BBox Decoder", "bbox": {"l": 325.45401, "t": 75.29803000000004, "r": 404.56702, "b": 83.88580000000002, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "accuracy for cells with a class la-", "bbox": {"l": 408.104, "t": 75.20836999999995, "r": 545.10968, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "bel of \u2018content\u2019 only using the PASCAL VOC mAP metric", "bbox": {"l": 308.862, "t": 87.16339000000005, "r": 545.11511, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "for pre-processing and post-processing.", "bbox": {"l": 308.862, "t": 99.11841000000004, "r": 470.22626, "b": 108.02495999999985, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "Note that we do", "bbox": {"l": 477.52884, "t": 99.11841000000004, "r": 545.11511, "b": 108.02495999999985, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "not have post-processing results for SynthTabNet as images", "bbox": {"l": 308.862, "t": 111.07343000000003, "r": 545.11517, "b": 119.97997999999984, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "are only provided. To compare the performance of our pro-", "bbox": {"l": 308.862, "t": 123.02844000000005, "r": 545.11511, "b": 131.93499999999995, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "posed approach, we\u2019ve integrated TableFormer\u2019s", "bbox": {"l": 308.862, "t": 134.98443999999995, "r": 502.01691000000005, "b": 143.89099, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "Cell BBox", "bbox": {"l": 504.47299, "t": 135.07410000000004, "r": 545.11041, "b": 143.66187000000002, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "Decoder", "bbox": {"l": 308.862, "t": 147.02910999999995, "r": 343.16324, "b": 155.61688000000004, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "into EDD architecture. As mentioned previously,", "bbox": {"l": 346.371, "t": 146.93944999999997, "r": 545.11493, "b": 155.84600999999998, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "the Structure Decoder provides the", "bbox": {"l": 308.862, "t": 158.89446999999996, "r": 446.15652, "b": 167.80102999999997, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "Cell BBox Decoder", "bbox": {"l": 448.28998000000007, "t": 158.98413000000005, "r": 525.04181, "b": 167.57190000000003, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "with", "bbox": {"l": 527.39899, "t": 158.89446999999996, "r": 545.11249, "b": 167.80102999999997, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "the features needed to predict the bounding box predictions.", "bbox": {"l": 308.862, "t": 170.84948999999995, "r": 545.11511, "b": 179.75603999999998, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "Therefore, the accuracy of the", "bbox": {"l": 308.862, "t": 182.80449999999996, "r": 432.86642000000006, "b": 191.71105999999997, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "Structure Decoder", "bbox": {"l": 436.39001, "t": 182.89417000000003, "r": 510.93021, "b": 191.48193000000003, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "directly", "bbox": {"l": 514.677, "t": 182.80449999999996, "r": 545.11273, "b": 191.71105999999997, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "influences the accuracy of the", "bbox": {"l": 308.862, "t": 194.75951999999995, "r": 431.17285, "b": 203.66607999999997, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "Cell BBox Decoder", "bbox": {"l": 434.6790199999999, "t": 194.84918000000005, "r": 514.18054, "b": 203.43695000000002, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": ". If the", "bbox": {"l": 514.17603, "t": 194.75951999999995, "r": 545.10992, "b": 203.66607999999997, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "Structure Decoder", "bbox": {"l": 308.86203, "t": 206.80517999999995, "r": 382.35614, "b": 215.39293999999995, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "predicts an extra column, this will result", "bbox": {"l": 385.07501, "t": 206.71551999999997, "r": 545.11426, "b": 215.62207, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "in an extra column of predicted bounding boxes.", "bbox": {"l": 308.862, "t": 218.67052999999999, "r": 501.6981799999999, "b": 227.57709, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "our Cell BBox Decoder accuracy for cells with a class label of 'content' only using the PASCAL VOC mAP metric for pre-processing and post-processing. Note that we do not have post-processing results for SynthTabNet as images are only provided. To compare the performance of our proposed approach, we've integrated TableFormer's Cell BBox Decoder into EDD architecture. As mentioned previously, the Structure Decoder provides the Cell BBox Decoder with the features needed to predict the bounding box predictions. Therefore, the accuracy of the Structure Decoder directly influences the accuracy of the Cell BBox Decoder . If the Structure Decoder predicts an extra column, this will result in an extra column of predicted bounding boxes."}, {"label": "table", "id": 8, "page_no": 6, "cluster": {"id": 8, "label": "table", "bbox": {"l": 308.4068603515625, "t": 247.87631225585938, "r": 533.6419677734375, "b": 303.8056640625, "coord_origin": "TOPLEFT"}, "confidence": 0.9691730737686157, "cells": [{"id": 146, "text": "Model", "bbox": {"l": 339.323, "t": 253.66436999999996, "r": 365.33536, "b": 262.57092, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "Dataset", "bbox": {"l": 401.04132, "t": 253.66436999999996, "r": 430.91916, "b": 262.57092, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "mAP", "bbox": {"l": 454.10214, "t": 253.66436999999996, "r": 474.58523999999994, "b": 262.57092, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "mAP (PP)", "bbox": {"l": 486.54034, "t": 253.66436999999996, "r": 527.2276, "b": 262.57092, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "EDD+BBox", "bbox": {"l": 327.65601, "t": 270.62134000000003, "r": 377.00076, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "PubTabNet", "bbox": {"l": 393.69809, "t": 270.62134000000003, "r": 438.28073, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "79.2", "bbox": {"l": 455.63559, "t": 270.62134000000003, "r": 473.07013, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "82.7", "bbox": {"l": 498.16592, "t": 270.62134000000003, "r": 515.60046, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "TableFormer", "bbox": {"l": 326.79501, "t": 282.57631999999995, "r": 377.86331, "b": 291.48288, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "PubTabNet", "bbox": {"l": 393.69388, "t": 282.57631999999995, "r": 438.27652, "b": 291.48288, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "82.1", "bbox": {"l": 455.63101, "t": 282.45676, "r": 473.06555000000003, "b": 291.41315, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "86.8", "bbox": {"l": 498.1713, "t": 282.45676, "r": 515.60583, "b": 291.41315, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "TableFormer", "bbox": {"l": 326.79501, "t": 294.53131, "r": 377.86331, "b": 303.43787, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "SynthTabNet", "bbox": {"l": 389.81842, "t": 294.53131, "r": 442.15194999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "87.7", "bbox": {"l": 455.63135, "t": 294.53131, "r": 473.06589, "b": 303.43787, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "-", "bbox": {"l": 505.22515999999996, "t": 294.53131, "r": 508.54268999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}}], "children": [{"id": 73, "label": "text", "bbox": {"l": 339.323, "t": 253.66436999999996, "r": 365.33536, "b": 262.57092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 146, "text": "Model", "bbox": {"l": 339.323, "t": 253.66436999999996, "r": 365.33536, "b": 262.57092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 401.04132, "t": 253.66436999999996, "r": 430.91916, "b": 262.57092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 147, "text": "Dataset", "bbox": {"l": 401.04132, "t": 253.66436999999996, "r": 430.91916, "b": 262.57092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 454.10214, "t": 253.66436999999996, "r": 474.58523999999994, "b": 262.57092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 148, "text": "mAP", "bbox": {"l": 454.10214, "t": 253.66436999999996, "r": 474.58523999999994, "b": 262.57092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 486.54034, "t": 253.66436999999996, "r": 527.2276, "b": 262.57092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 149, "text": "mAP (PP)", "bbox": {"l": 486.54034, "t": 253.66436999999996, "r": 527.2276, "b": 262.57092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 327.65601, "t": 270.62134000000003, "r": 377.00076, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 150, "text": "EDD+BBox", "bbox": {"l": 327.65601, "t": 270.62134000000003, "r": 377.00076, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 393.69809, "t": 270.62134000000003, "r": 438.28073, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 151, "text": "PubTabNet", "bbox": {"l": 393.69809, "t": 270.62134000000003, "r": 438.28073, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 455.63559, "t": 270.62134000000003, "r": 473.07013, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 152, "text": "79.2", "bbox": {"l": 455.63559, "t": 270.62134000000003, "r": 473.07013, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 498.16592, "t": 270.62134000000003, "r": 515.60046, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 153, "text": "82.7", "bbox": {"l": 498.16592, "t": 270.62134000000003, "r": 515.60046, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 326.79501, "t": 282.57631999999995, "r": 377.86331, "b": 291.48288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 154, "text": "TableFormer", "bbox": {"l": 326.79501, "t": 282.57631999999995, "r": 377.86331, "b": 291.48288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 393.69388, "t": 282.57631999999995, "r": 438.27652, "b": 291.48288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 155, "text": "PubTabNet", "bbox": {"l": 393.69388, "t": 282.57631999999995, "r": 438.27652, "b": 291.48288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 455.63101, "t": 282.45676, "r": 473.06555000000003, "b": 291.41315, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 156, "text": "82.1", "bbox": {"l": 455.63101, "t": 282.45676, "r": 473.06555000000003, "b": 291.41315, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 498.1713, "t": 282.45676, "r": 515.60583, "b": 291.41315, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 157, "text": "86.8", "bbox": {"l": 498.1713, "t": 282.45676, "r": 515.60583, "b": 291.41315, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 326.79501, "t": 294.53131, "r": 377.86331, "b": 303.43787, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 158, "text": "TableFormer", "bbox": {"l": 326.79501, "t": 294.53131, "r": 377.86331, "b": 303.43787, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 389.81842, "t": 294.53131, "r": 442.15194999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 159, "text": "SynthTabNet", "bbox": {"l": 389.81842, "t": 294.53131, "r": 442.15194999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 455.63135, "t": 294.53131, "r": 473.06589, "b": 303.43787, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 160, "text": "87.7", "bbox": {"l": 455.63135, "t": 294.53131, "r": 473.06589, "b": 303.43787, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 505.22515999999996, "t": 294.53131, "r": 508.54268999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 161, "text": "-", "bbox": {"l": 505.22515999999996, "t": 294.53131, "r": 508.54268999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 4, "num_cols": 4, "table_cells": [{"bbox": {"l": 339.323, "t": 253.66436999999996, "r": 365.33536, "b": 262.57092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Model", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 401.04132, "t": 253.66436999999996, "r": 430.91916, "b": 262.57092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Dataset", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 454.10214, "t": 253.66436999999996, "r": 474.58523999999994, "b": 262.57092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "mAP", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 486.54034, "t": 253.66436999999996, "r": 527.2276, "b": 262.57092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "mAP (PP)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 327.65601, "t": 270.62134000000003, "r": 377.00076, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "EDD+BBox", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 393.69809, "t": 270.62134000000003, "r": 438.28073, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "PubTabNet", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 455.63559, "t": 270.62134000000003, "r": 473.07013, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "79.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 498.16592, "t": 270.62134000000003, "r": 515.60046, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "82.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.79501, "t": 282.57631999999995, "r": 377.86331, "b": 291.48288, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 393.69388, "t": 282.57631999999995, "r": 438.27652, "b": 291.48288, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "PubTabNet", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 455.63101, "t": 282.45676, "r": 473.06555000000003, "b": 291.41315, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "82.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 498.1713, "t": 282.45676, "r": 515.60583, "b": 291.41315, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "86.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.79501, "t": 294.53131, "r": 377.86331, "b": 303.43787, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 389.81842, "t": 294.53131, "r": 442.15194999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "SynthTabNet", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 455.63135, "t": 294.53131, "r": 473.06589, "b": 303.43787, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "87.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 505.22515999999996, "t": 294.53131, "r": 508.54268999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "caption", "id": 12, "page_no": 6, "cluster": {"id": 12, "label": "caption", "bbox": {"l": 308.862, "t": 316.44931, "r": 545.11517, "b": 337.3108500000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9519917964935303, "cells": [{"id": 162, "text": "Table 3:", "bbox": {"l": 308.862, "t": 316.44931, "r": 341.49951, "b": 325.35587, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "Cell Bounding Box detection results on PubTab-", "bbox": {"l": 348.60284, "t": 316.44931, "r": 545.11517, "b": 325.35587, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "Net, and FinTabNet. PP: Post-processing.", "bbox": {"l": 308.862, "t": 328.4043, "r": 474.97845, "b": 337.3108500000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 3: Cell Bounding Box detection results on PubTabNet, and FinTabNet. PP: Post-processing."}, {"label": "text", "id": 4, "page_no": 6, "cluster": {"id": 4, "label": "text", "bbox": {"l": 308.86197, "t": 367.6797199999999, "r": 545.11566, "b": 520.16769, "coord_origin": "TOPLEFT"}, "confidence": 0.9835010766983032, "cells": [{"id": 165, "text": "Cell Content.", "bbox": {"l": 320.81699, "t": 367.6797199999999, "r": 378.94876, "b": 376.63611, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "In this section, we evaluate the entire", "bbox": {"l": 387.07898, "t": 367.79929, "r": 545.11566, "b": 376.70584, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "pipeline of recovering a table with content.", "bbox": {"l": 308.86197, "t": 379.75426999999996, "r": 487.19257, "b": 388.66083, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "Here we put", "bbox": {"l": 493.96713, "t": 379.75426999999996, "r": 545.11511, "b": 388.66083, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "our approach to test by capitalizing on extracting content", "bbox": {"l": 308.86197, "t": 391.70926, "r": 545.11505, "b": 400.61581, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "from the PDF cells rather than decoding from images. Tab.", "bbox": {"l": 308.86197, "t": 403.66525, "r": 545.11523, "b": 412.57181, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "4", "bbox": {"l": 308.86197, "t": 415.62024, "r": 314.08096, "b": 424.52679, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "shows the TEDs score of HTML code representing the", "bbox": {"l": 316.69046, "t": 415.62024, "r": 545.11517, "b": 424.52679, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "structure of the table along with the content inserted in the", "bbox": {"l": 308.86197, "t": 427.57523, "r": 545.11505, "b": 436.48177999999996, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "data cell and compared with the ground-truth. Our method", "bbox": {"l": 308.86197, "t": 439.53021, "r": 545.11505, "b": 448.43677, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "achieved a", "bbox": {"l": 308.86197, "t": 451.4852, "r": 350.23666, "b": 460.39175, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "5.3%", "bbox": {"l": 352.17596, "t": 451.36563, "r": 374.59183, "b": 460.32201999999995, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "increase over the state-of-the-art, and com-", "bbox": {"l": 376.53296, "t": 451.4852, "r": 545.11011, "b": 460.39175, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "mercial solutions. We believe our scores would be higher", "bbox": {"l": 308.86197, "t": 463.44019, "r": 545.11511, "b": 472.34674, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "if the HTML ground-truth matched the extracted PDF cell", "bbox": {"l": 308.86197, "t": 475.39618, "r": 545.11517, "b": 484.30273, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "content. Unfortunately, there are small discrepancies such", "bbox": {"l": 308.86197, "t": 487.35117, "r": 545.11511, "b": 496.25772, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "as spacings around words or special characters with various", "bbox": {"l": 308.86197, "t": 499.30615, "r": 545.11505, "b": 508.21271, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "unicode representations.", "bbox": {"l": 308.86197, "t": 511.26114, "r": 405.69846, "b": 520.16769, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Cell Content. In this section, we evaluate the entire pipeline of recovering a table with content. Here we put our approach to test by capitalizing on extracting content from the PDF cells rather than decoding from images. Tab. 4 shows the TEDs score of HTML code representing the structure of the table along with the content inserted in the data cell and compared with the ground-truth. Our method achieved a 5.3% increase over the state-of-the-art, and commercial solutions. We believe our scores would be higher if the HTML ground-truth matched the extracted PDF cell content. Unfortunately, there are small discrepancies such as spacings around words or special characters with various unicode representations."}, {"label": "table", "id": 5, "page_no": 6, "cluster": {"id": 5, "label": "table", "bbox": {"l": 332.9688720703125, "t": 540.2835693359375, "r": 520.942138671875, "b": 643.2697143554688, "coord_origin": "TOPLEFT"}, "confidence": 0.9775567650794983, "cells": [{"id": 183, "text": "Model", "bbox": {"l": 358.01099, "t": 552.23337, "r": 384.02335, "b": 561.1399200000001, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "TEDS", "bbox": {"l": 449.03400000000005, "t": 546.25537, "r": 473.94049000000007, "b": 555.16193, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": "Simple", "bbox": {"l": 408.50598, "t": 558.21037, "r": 436.73999, "b": 567.11693, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "Complex", "bbox": {"l": 448.6951, "t": 558.21037, "r": 485.07849, "b": 567.11693, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "All", "bbox": {"l": 499.3848, "t": 558.21037, "r": 512.117, "b": 567.11693, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": "Tabula", "bbox": {"l": 357.68201, "t": 575.16736, "r": 384.3519, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "78.0", "bbox": {"l": 413.90097, "t": 575.16736, "r": 431.33550999999994, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "57.8", "bbox": {"l": 458.16479000000004, "t": 575.16736, "r": 475.59933000000007, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "67.9", "bbox": {"l": 497.0289, "t": 575.16736, "r": 514.46344, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": "Traprange", "bbox": {"l": 350.72299, "t": 587.12236, "r": 391.31064, "b": 596.02892, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "60.8", "bbox": {"l": 413.90582, "t": 587.12236, "r": 431.34036, "b": 596.02892, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "49.9", "bbox": {"l": 458.16965, "t": 587.12236, "r": 475.60419, "b": 596.02892, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "55.4", "bbox": {"l": 497.03374999999994, "t": 587.12236, "r": 514.46832, "b": 596.02892, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "Camelot", "bbox": {"l": 354.13599, "t": 599.07835, "r": 387.89923, "b": 607.98491, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "80.0", "bbox": {"l": 413.90161, "t": 599.07835, "r": 431.33615, "b": 607.98491, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "66.0", "bbox": {"l": 458.16544, "t": 599.07835, "r": 475.59998, "b": 607.98491, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "73.0", "bbox": {"l": 497.02954000000005, "t": 599.07835, "r": 514.46411, "b": 607.98491, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "Acrobat Pro", "bbox": {"l": 346.55899, "t": 611.03336, "r": 395.47534, "b": 619.93991, "coord_origin": "TOPLEFT"}}, {"id": 201, "text": "68.9", "bbox": {"l": 413.90616, "t": 611.03336, "r": 431.34069999999997, "b": 619.93991, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": "61.8", "bbox": {"l": 458.16998000000007, "t": 611.03336, "r": 475.60452, "b": 619.93991, "coord_origin": "TOPLEFT"}}, {"id": 203, "text": "65.3", "bbox": {"l": 497.03409, "t": 611.03336, "r": 514.46863, "b": 619.93991, "coord_origin": "TOPLEFT"}}, {"id": 204, "text": "EDD", "bbox": {"l": 360.78101, "t": 622.9883600000001, "r": 381.25415, "b": 631.89491, "coord_origin": "TOPLEFT"}}, {"id": 205, "text": "91.2", "bbox": {"l": 413.90158, "t": 622.9883600000001, "r": 431.33612, "b": 631.89491, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": "85.4", "bbox": {"l": 458.16541, "t": 622.9883600000001, "r": 475.59995000000004, "b": 631.89491, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": "88.3", "bbox": {"l": 497.0295100000001, "t": 622.9883600000001, "r": 514.46405, "b": 631.89491, "coord_origin": "TOPLEFT"}}, {"id": 208, "text": "TableFormer", "bbox": {"l": 345.483, "t": 634.94336, "r": 396.5513, "b": 643.84991, "coord_origin": "TOPLEFT"}}, {"id": 209, "text": "95.4", "bbox": {"l": 413.90616, "t": 634.94336, "r": 431.34069999999997, "b": 643.84991, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": "90.1", "bbox": {"l": 458.16998000000007, "t": 634.94336, "r": 475.60452, "b": 643.84991, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "93.6", "bbox": {"l": 497.03400000000005, "t": 634.82381, "r": 514.46857, "b": 643.78018, "coord_origin": "TOPLEFT"}}], "children": [{"id": 89, "label": "text", "bbox": {"l": 358.01099, "t": 552.23337, "r": 384.02335, "b": 561.1399200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 183, "text": "Model", "bbox": {"l": 358.01099, "t": 552.23337, "r": 384.02335, "b": 561.1399200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 449.03400000000005, "t": 546.25537, "r": 473.94049000000007, "b": 555.16193, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 184, "text": "TEDS", "bbox": {"l": 449.03400000000005, "t": 546.25537, "r": 473.94049000000007, "b": 555.16193, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 408.50598, "t": 558.21037, "r": 436.73999, "b": 567.11693, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 185, "text": "Simple", "bbox": {"l": 408.50598, "t": 558.21037, "r": 436.73999, "b": 567.11693, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 448.6951, "t": 558.21037, "r": 485.07849, "b": 567.11693, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 186, "text": "Complex", "bbox": {"l": 448.6951, "t": 558.21037, "r": 485.07849, "b": 567.11693, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 499.3848, "t": 558.21037, "r": 512.117, "b": 567.11693, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 187, "text": "All", "bbox": {"l": 499.3848, "t": 558.21037, "r": 512.117, "b": 567.11693, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 357.68201, "t": 575.16736, "r": 384.3519, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 188, "text": "Tabula", "bbox": {"l": 357.68201, "t": 575.16736, "r": 384.3519, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 413.90097, "t": 575.16736, "r": 431.33550999999994, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 189, "text": "78.0", "bbox": {"l": 413.90097, "t": 575.16736, "r": 431.33550999999994, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 458.16479000000004, "t": 575.16736, "r": 475.59933000000007, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 190, "text": "57.8", "bbox": {"l": 458.16479000000004, "t": 575.16736, "r": 475.59933000000007, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 497.0289, "t": 575.16736, "r": 514.46344, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 191, "text": "67.9", "bbox": {"l": 497.0289, "t": 575.16736, "r": 514.46344, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 350.72299, "t": 587.12236, "r": 391.31064, "b": 596.02892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 192, "text": "Traprange", "bbox": {"l": 350.72299, "t": 587.12236, "r": 391.31064, "b": 596.02892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 413.90582, "t": 587.12236, "r": 431.34036, "b": 596.02892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 193, "text": "60.8", "bbox": {"l": 413.90582, "t": 587.12236, "r": 431.34036, "b": 596.02892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 458.16965, "t": 587.12236, "r": 475.60419, "b": 596.02892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 194, "text": "49.9", "bbox": {"l": 458.16965, "t": 587.12236, "r": 475.60419, "b": 596.02892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 497.03374999999994, "t": 587.12236, "r": 514.46832, "b": 596.02892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 195, "text": "55.4", "bbox": {"l": 497.03374999999994, "t": 587.12236, "r": 514.46832, "b": 596.02892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 354.13599, "t": 599.07835, "r": 387.89923, "b": 607.98491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 196, "text": "Camelot", "bbox": {"l": 354.13599, "t": 599.07835, "r": 387.89923, "b": 607.98491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 413.90161, "t": 599.07835, "r": 431.33615, "b": 607.98491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 197, "text": "80.0", "bbox": {"l": 413.90161, "t": 599.07835, "r": 431.33615, "b": 607.98491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 458.16544, "t": 599.07835, "r": 475.59998, "b": 607.98491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 198, "text": "66.0", "bbox": {"l": 458.16544, "t": 599.07835, "r": 475.59998, "b": 607.98491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 497.02954000000005, "t": 599.07835, "r": 514.46411, "b": 607.98491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 199, "text": "73.0", "bbox": {"l": 497.02954000000005, "t": 599.07835, "r": 514.46411, "b": 607.98491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 346.55899, "t": 611.03336, "r": 395.47534, "b": 619.93991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 200, "text": "Acrobat Pro", "bbox": {"l": 346.55899, "t": 611.03336, "r": 395.47534, "b": 619.93991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 413.90616, "t": 611.03336, "r": 431.34069999999997, "b": 619.93991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 201, "text": "68.9", "bbox": {"l": 413.90616, "t": 611.03336, "r": 431.34069999999997, "b": 619.93991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 458.16998000000007, "t": 611.03336, "r": 475.60452, "b": 619.93991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 202, "text": "61.8", "bbox": {"l": 458.16998000000007, "t": 611.03336, "r": 475.60452, "b": 619.93991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 497.03409, "t": 611.03336, "r": 514.46863, "b": 619.93991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 203, "text": "65.3", "bbox": {"l": 497.03409, "t": 611.03336, "r": 514.46863, "b": 619.93991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 360.78101, "t": 622.9883600000001, "r": 381.25415, "b": 631.89491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 204, "text": "EDD", "bbox": {"l": 360.78101, "t": 622.9883600000001, "r": 381.25415, "b": 631.89491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 413.90158, "t": 622.9883600000001, "r": 431.33612, "b": 631.89491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 205, "text": "91.2", "bbox": {"l": 413.90158, "t": 622.9883600000001, "r": 431.33612, "b": 631.89491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 458.16541, "t": 622.9883600000001, "r": 475.59995000000004, "b": 631.89491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 206, "text": "85.4", "bbox": {"l": 458.16541, "t": 622.9883600000001, "r": 475.59995000000004, "b": 631.89491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 497.0295100000001, "t": 622.9883600000001, "r": 514.46405, "b": 631.89491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 207, "text": "88.3", "bbox": {"l": 497.0295100000001, "t": 622.9883600000001, "r": 514.46405, "b": 631.89491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 114, "label": "text", "bbox": {"l": 345.483, "t": 634.94336, "r": 396.5513, "b": 643.84991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 208, "text": "TableFormer", "bbox": {"l": 345.483, "t": 634.94336, "r": 396.5513, "b": 643.84991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 115, "label": "text", "bbox": {"l": 413.90616, "t": 634.94336, "r": 431.34069999999997, "b": 643.84991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 209, "text": "95.4", "bbox": {"l": 413.90616, "t": 634.94336, "r": 431.34069999999997, "b": 643.84991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 116, "label": "text", "bbox": {"l": 458.16998000000007, "t": 634.94336, "r": 475.60452, "b": 643.84991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 210, "text": "90.1", "bbox": {"l": 458.16998000000007, "t": 634.94336, "r": 475.60452, "b": 643.84991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 117, "label": "text", "bbox": {"l": 497.03400000000005, "t": 634.82381, "r": 514.46857, "b": 643.78018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 211, "text": "93.6", "bbox": {"l": 497.03400000000005, "t": 634.82381, "r": 514.46857, "b": 643.78018, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["fcel", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "nl"], "num_rows": 7, "num_cols": 4, "table_cells": [{"bbox": {"l": 358.01099, "t": 552.23337, "r": 384.02335, "b": 561.1399200000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Model", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 448.6951, "t": 546.25537, "r": 485.07849, "b": 567.11693, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "TEDS Complex", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 408.50598, "t": 558.21037, "r": 436.73999, "b": 567.11693, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Simple", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 499.3848, "t": 558.21037, "r": 512.117, "b": 567.11693, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "All", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 357.68201, "t": 575.16736, "r": 384.3519, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Tabula", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 413.90097, "t": 575.16736, "r": 431.33550999999994, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "78.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 458.16479000000004, "t": 575.16736, "r": 475.59933000000007, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "57.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 497.0289, "t": 575.16736, "r": 514.46344, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "67.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 350.72299, "t": 587.12236, "r": 391.31064, "b": 596.02892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Traprange", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 413.90582, "t": 587.12236, "r": 431.34036, "b": 596.02892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "60.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 458.16965, "t": 587.12236, "r": 475.60419, "b": 596.02892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "49.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 497.03374999999994, "t": 587.12236, "r": 514.46832, "b": 596.02892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "55.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 354.13599, "t": 599.07835, "r": 387.89923, "b": 607.98491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Camelot", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 413.90161, "t": 599.07835, "r": 431.33615, "b": 607.98491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "80.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 458.16544, "t": 599.07835, "r": 475.59998, "b": 607.98491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "66.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 497.02954000000005, "t": 599.07835, "r": 514.46411, "b": 607.98491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "73.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 346.55899, "t": 611.03336, "r": 395.47534, "b": 619.93991, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Acrobat Pro", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 413.90616, "t": 611.03336, "r": 431.34069999999997, "b": 619.93991, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "68.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 458.16998000000007, "t": 611.03336, "r": 475.60452, "b": 619.93991, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "61.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 497.03409, "t": 611.03336, "r": 514.46863, "b": 619.93991, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "65.3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 360.78101, "t": 622.9883600000001, "r": 381.25415, "b": 631.89491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "EDD", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 413.90158, "t": 622.9883600000001, "r": 431.33612, "b": 631.89491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "91.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 458.16541, "t": 622.9883600000001, "r": 475.59995000000004, "b": 631.89491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "85.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 497.0295100000001, "t": 622.9883600000001, "r": 514.46405, "b": 631.89491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "88.3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 345.483, "t": 634.94336, "r": 396.5513, "b": 643.84991, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 413.90616, "t": 634.94336, "r": 431.34069999999997, "b": 643.84991, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "95.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 458.16998000000007, "t": 634.94336, "r": 475.60452, "b": 643.84991, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "90.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 497.03400000000005, "t": 634.82381, "r": 514.46857, "b": 643.78018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "93.6", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "caption", "id": 11, "page_no": 6, "cluster": {"id": 11, "label": "caption", "bbox": {"l": 308.862, "t": 656.86136, "r": 545.11517, "b": 689.6779300000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9541404247283936, "cells": [{"id": 212, "text": "Table 4:", "bbox": {"l": 308.862, "t": 656.86136, "r": 341.73862, "b": 665.76792, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "Results of structure with content retrieved using", "bbox": {"l": 349.55927, "t": 656.86136, "r": 545.11517, "b": 665.76792, "coord_origin": "TOPLEFT"}}, {"id": 214, "text": "cell detection on PubTabNet. In all cases the input is PDF", "bbox": {"l": 308.862, "t": 668.81636, "r": 545.11505, "b": 677.7229199999999, "coord_origin": "TOPLEFT"}}, {"id": 215, "text": "documents with cropped tables.", "bbox": {"l": 308.862, "t": 680.77136, "r": 435.03836, "b": 689.6779300000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 4: Results of structure with content retrieved using cell detection on PubTabNet. In all cases the input is PDF documents with cropped tables."}, {"label": "page_footer", "id": 14, "page_no": 6, "cluster": {"id": 14, "label": "page_footer", "bbox": {"l": 295.121, "t": 734.133358, "r": 300.10229, "b": 743.039921, "coord_origin": "TOPLEFT"}, "confidence": 0.8787972331047058, "cells": [{"id": 216, "text": "7", "bbox": {"l": 295.121, "t": 734.133358, "r": 300.10229, "b": 743.039921, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "7"}], "body": [{"label": "section_header", "id": 10, "page_no": 6, "cluster": {"id": 10, "label": "section_header", "bbox": {"l": 50.112, "t": 74.40137000000016, "r": 167.89825, "b": 84.25342, "coord_origin": "TOPLEFT"}, "confidence": 0.9554274082183838, "cells": [{"id": 0, "text": "5.3.", "bbox": {"l": 50.112, "t": 74.40137000000016, "r": 63.704811, "b": 84.25342, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Datasets and Metrics", "bbox": {"l": 72.766685, "t": 74.40137000000016, "r": 167.89825, "b": 84.25342, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5.3. Datasets and Metrics"}, {"label": "text", "id": 1, "page_no": 6, "cluster": {"id": 1, "label": "text", "bbox": {"l": 50.112, "t": 93.35039999999992, "r": 286.36511, "b": 138.12298999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9862998127937317, "cells": [{"id": 2, "text": "The Tree-Edit-Distance-Based Similarity (TEDS) met-", "bbox": {"l": 62.067001, "t": 93.35039999999992, "r": 286.36499, "b": 102.25696000000016, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "ric was introduced in [37]. It represents the prediction, and", "bbox": {"l": 50.112, "t": 105.30542000000003, "r": 286.36511, "b": 114.21198000000015, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "ground-truth as a tree structure of HTML tags. This simi-", "bbox": {"l": 50.112, "t": 117.26044000000002, "r": 286.36505, "b": 126.16699000000006, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "larity is calculated as:", "bbox": {"l": 50.112, "t": 129.21642999999995, "r": 136.71687, "b": 138.12298999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The Tree-Edit-Distance-Based Similarity (TEDS) metric was introduced in [37]. It represents the prediction, and ground-truth as a tree structure of HTML tags. This similarity is calculated as:"}, {"label": "formula", "id": 13, "page_no": 6, "cluster": {"id": 13, "label": "formula", "bbox": {"l": 86.218994, "t": 150.31799, "r": 286.3624, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9500409364700317, "cells": [{"id": 6, "text": "TEDS (", "bbox": {"l": 86.218994, "t": 157.05798000000004, "r": 118.8784, "b": 165.90479000000005, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "T$_{a}$, T$_{b}$", "bbox": {"l": 118.87499, "t": 157.05798000000004, "r": 143.26962, "b": 165.90479000000005, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": ") = 1", "bbox": {"l": 143.76799, "t": 157.05798000000004, "r": 165.9019, "b": 165.90479000000005, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "\u2212", "bbox": {"l": 168.12099, "t": 156.50012000000004, "r": 175.8699, "b": 165.90479000000005, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "EditDist (", "bbox": {"l": 179.27899, "t": 150.31799, "r": 221.95677, "b": 159.16479000000004, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "T$_{a}$, T$_{b}$", "bbox": {"l": 221.95200000000003, "t": 150.31799, "r": 246.34663, "b": 159.16479000000004, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": ")", "bbox": {"l": 246.84499999999997, "t": 150.31799, "r": 250.71945, "b": 159.16479000000004, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "max (", "bbox": {"l": 182.21201, "t": 163.89197000000001, "r": 206.29161, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "|", "bbox": {"l": 206.289, "t": 163.33411, "r": 209.05661, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "T$_{a}$", "bbox": {"l": 209.056, "t": 163.89197000000001, "r": 219.19968, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "|", "bbox": {"l": 219.69700999999998, "t": 163.33411, "r": 222.46461000000002, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": ",", "bbox": {"l": 224.125, "t": 163.89197000000001, "r": 226.89261, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "|", "bbox": {"l": 228.55299000000002, "t": 163.33411, "r": 231.3206, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "T$_{b}$", "bbox": {"l": 231.31999, "t": 163.89197000000001, "r": 240.64563, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "|", "bbox": {"l": 241.144, "t": 163.33411, "r": 243.91161, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": ")", "bbox": {"l": 243.911, "t": 163.89197000000001, "r": 247.78545, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "(3)", "bbox": {"l": 274.746, "t": 157.21740999999997, "r": 286.3624, "b": 166.12396, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "TEDS ( T$_{a}$, T$_{b}$ ) = 1 \u2212 EditDist ( T$_{a}$, T$_{b}$ ) max ( | T$_{a}$ | , | T$_{b}$ | ) (3)"}, {"label": "text", "id": 6, "page_no": 6, "cluster": {"id": 6, "label": "text", "bbox": {"l": 50.111984, "t": 181.00298999999995, "r": 286.36285, "b": 213.97900000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9735319018363953, "cells": [{"id": 23, "text": "where", "bbox": {"l": 62.067001, "t": 181.16241000000002, "r": 86.405632, "b": 190.06897000000004, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "T$_{a}$", "bbox": {"l": 88.581001, "t": 181.00298999999995, "r": 98.724663, "b": 189.84978999999998, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "and", "bbox": {"l": 101.399, "t": 181.16241000000002, "r": 115.785, "b": 190.06897000000004, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "T$_{b}$", "bbox": {"l": 117.961, "t": 181.00298999999995, "r": 127.28664, "b": 189.84978999999998, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "represent tables in tree structure HTML", "bbox": {"l": 129.95999, "t": 181.16241000000002, "r": 286.36285, "b": 190.06897000000004, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "format. EditDist denotes the tree-edit distance, and", "bbox": {"l": 50.111992, "t": 193.11743, "r": 252.78116000000003, "b": 202.02399000000003, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "|", "bbox": {"l": 255.18201, "t": 192.40015000000005, "r": 257.94962, "b": 201.80480999999997, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "T", "bbox": {"l": 257.94901, "t": 192.95800999999994, "r": 263.77115, "b": 201.80480999999997, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "|", "bbox": {"l": 265.155, "t": 192.40015000000005, "r": 267.92261, "b": 201.80480999999997, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "rep-", "bbox": {"l": 270.32199, "t": 193.11743, "r": 286.36179, "b": 202.02399000000003, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "resents the number of nodes in", "bbox": {"l": 50.111984, "t": 205.07245, "r": 172.13388, "b": 213.97900000000004, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "T", "bbox": {"l": 174.62399, "t": 204.91301999999996, "r": 180.44614, "b": 213.75982999999997, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": ".", "bbox": {"l": 181.82899, "t": 205.07245, "r": 184.31964, "b": 213.97900000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "where T$_{a}$ and T$_{b}$ represent tables in tree structure HTML format. EditDist denotes the tree-edit distance, and | T | represents the number of nodes in T ."}, {"label": "section_header", "id": 9, "page_no": 6, "cluster": {"id": 9, "label": "section_header", "bbox": {"l": 50.112, "t": 224.81946000000005, "r": 170.45169, "b": 234.67151, "coord_origin": "TOPLEFT"}, "confidence": 0.9588837027549744, "cells": [{"id": 36, "text": "5.4.", "bbox": {"l": 50.112, "t": 224.81946000000005, "r": 64.551605, "b": 234.67151, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "Quantitative Analysis", "bbox": {"l": 74.178009, "t": 224.81946000000005, "r": 170.45169, "b": 234.67151, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5.4. Quantitative Analysis"}, {"label": "text", "id": 2, "page_no": 6, "cluster": {"id": 2, "label": "text", "bbox": {"l": 50.112, "t": 243.6499, "r": 286.36514, "b": 396.13794, "coord_origin": "TOPLEFT"}, "confidence": 0.9855090975761414, "cells": [{"id": 38, "text": "Structure.", "bbox": {"l": 62.067001, "t": 243.6499, "r": 105.32461, "b": 252.60626000000002, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "As shown in Tab.", "bbox": {"l": 112.12600000000002, "t": 243.76946999999996, "r": 184.68361, "b": 252.67602999999997, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "2, TableFormer outper-", "bbox": {"l": 191.4781, "t": 243.76946999999996, "r": 286.36188, "b": 252.67602999999997, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "forms all SOTA methods across different datasets by a large", "bbox": {"l": 50.112, "t": 255.72448999999995, "r": 286.36508, "b": 264.63104, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "margin for predicting the table structure from an image.", "bbox": {"l": 50.112, "t": 267.67949999999996, "r": 286.36508, "b": 276.58606, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "All the more, our model outperforms pre-trained methods.", "bbox": {"l": 50.112, "t": 279.63446, "r": 286.36508, "b": 288.54105, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "During the evaluation we do not apply any table filtering.", "bbox": {"l": 50.112, "t": 291.59048, "r": 286.36514, "b": 300.49704, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "We also provide our baseline results on the SynthTabNet", "bbox": {"l": 50.112, "t": 303.54547, "r": 286.36508, "b": 312.45203000000004, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "dataset. It has been observed that large tables (e.g. tables", "bbox": {"l": 50.112, "t": 315.50046, "r": 286.36505, "b": 324.40700999999996, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "that occupy half of the page or more) yield poor predictions.", "bbox": {"l": 50.112, "t": 327.45544, "r": 286.36508, "b": 336.362, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "We attribute this issue to the image resizing during the pre-", "bbox": {"l": 50.112, "t": 339.41043, "r": 286.36508, "b": 348.31699000000003, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "processing step, that produces downsampled images with", "bbox": {"l": 50.112, "t": 351.36542, "r": 286.36505, "b": 360.27197, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "indistinguishable features. This problem can be addressed", "bbox": {"l": 50.112, "t": 363.32141, "r": 286.36508, "b": 372.2279700000001, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "by treating such big tables with a separate model which ac-", "bbox": {"l": 50.112, "t": 375.2764, "r": 286.36511, "b": 384.18295000000006, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "cepts a large input image size.", "bbox": {"l": 50.112, "t": 387.23138, "r": 170.01187, "b": 396.13794, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Structure. As shown in Tab. 2, TableFormer outperforms all SOTA methods across different datasets by a large margin for predicting the table structure from an image. All the more, our model outperforms pre-trained methods. During the evaluation we do not apply any table filtering. We also provide our baseline results on the SynthTabNet dataset. It has been observed that large tables (e.g. tables that occupy half of the page or more) yield poor predictions. We attribute this issue to the image resizing during the preprocessing step, that produces downsampled images with indistinguishable features. This problem can be addressed by treating such big tables with a separate model which accepts a large input image size."}, {"label": "table", "id": 0, "page_no": 6, "cluster": {"id": 0, "label": "table", "bbox": {"l": 53.368526458740234, "t": 409.1357727050781, "r": 283.0443420410156, "b": 582.3977661132812, "coord_origin": "TOPLEFT"}, "confidence": 0.9892510175704956, "cells": [{"id": 53, "text": "Model", "bbox": {"l": 78.843002, "t": 420.69037, "r": 104.85535, "b": 429.59692, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "TEDS", "bbox": {"l": 211.2, "t": 414.71237, "r": 236.10649, "b": 423.61893, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "Dataset", "bbox": {"l": 129.338, "t": 426.66736, "r": 159.21584, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Simple", "bbox": {"l": 171.17096, "t": 426.66736, "r": 199.40497, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Complex", "bbox": {"l": 211.36009, "t": 426.66736, "r": 247.74349999999998, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "All", "bbox": {"l": 264.54044, "t": 426.66736, "r": 277.27264, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "EDD", "bbox": {"l": 81.612, "t": 443.62436, "r": 102.08514, "b": 452.53091, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "PTN", "bbox": {"l": 134.87206, "t": 443.62436, "r": 153.69141, "b": 452.53091, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "91.1", "bbox": {"l": 176.56554, "t": 443.62436, "r": 194.00009, "b": 452.53091, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "88.7", "bbox": {"l": 220.82938000000001, "t": 443.62436, "r": 238.26393, "b": 452.53091, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "89.9", "bbox": {"l": 262.18414, "t": 443.62436, "r": 279.61868, "b": 452.53091, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "GTE", "bbox": {"l": 82.165001, "t": 455.58035, "r": 101.5323, "b": 464.48691, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "PTN", "bbox": {"l": 134.86716, "t": 455.58035, "r": 153.68651, "b": 464.48691, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "-", "bbox": {"l": 183.62411, "t": 455.58035, "r": 186.94167, "b": 464.48691, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "-", "bbox": {"l": 227.88795000000002, "t": 455.58035, "r": 231.20551, "b": 464.48691, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "93.01", "bbox": {"l": 259.69855, "t": 455.58035, "r": 282.11441, "b": 464.48691, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 468.13336, "r": 117.38329000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "PTN", "bbox": {"l": 134.86766, "t": 468.13336, "r": 153.68701, "b": 477.03992, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "98.5", "bbox": {"l": 176.57111, "t": 468.13336, "r": 194.00566, "b": 477.03992, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "95.0", "bbox": {"l": 220.83495, "t": 468.13336, "r": 238.26950000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "96.75", "bbox": {"l": 259.698, "t": 468.01379, "r": 282.11386, "b": 476.97018, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "EDD", "bbox": {"l": 81.612, "t": 483.32635, "r": 102.08514, "b": 492.23291, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "FTN", "bbox": {"l": 134.87206, "t": 483.32635, "r": 153.69141, "b": 492.23291, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "88.4", "bbox": {"l": 176.56554, "t": 483.32635, "r": 194.00009, "b": 492.23291, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "92.08", "bbox": {"l": 218.33870999999996, "t": 483.32635, "r": 240.75455999999997, "b": 492.23291, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "90.6", "bbox": {"l": 262.18411, "t": 483.32635, "r": 279.61865, "b": 492.23291, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "GTE", "bbox": {"l": 82.165001, "t": 495.28134, "r": 101.5323, "b": 504.1879, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "FTN", "bbox": {"l": 134.86716, "t": 495.28134, "r": 153.68651, "b": 504.1879, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "-", "bbox": {"l": 183.62411, "t": 495.28134, "r": 186.94167, "b": 504.1879, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "-", "bbox": {"l": 227.88795000000002, "t": 495.28134, "r": 231.20551, "b": 504.1879, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "87.14", "bbox": {"l": 259.69855, "t": 495.28134, "r": 282.11441, "b": 504.1879, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "GTE (FT)", "bbox": {"l": 71.789001, "t": 507.23633, "r": 111.90838999999998, "b": 516.14288, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "FTN", "bbox": {"l": 134.86221, "t": 507.23633, "r": 153.68156, "b": 516.14288, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "-", "bbox": {"l": 183.62914, "t": 507.23633, "r": 186.94669, "b": 516.14288, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "-", "bbox": {"l": 227.89297, "t": 507.23633, "r": 231.21053000000003, "b": 516.14288, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "91.02", "bbox": {"l": 259.6936, "t": 507.23633, "r": 282.10947, "b": 516.14288, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 519.1913099999999, "r": 117.38329000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "FTN", "bbox": {"l": 134.86766, "t": 519.1913099999999, "r": 153.68701, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "97.5", "bbox": {"l": 176.57111, "t": 519.1913099999999, "r": 194.00566, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "96.0", "bbox": {"l": 220.83495, "t": 519.1913099999999, "r": 238.26950000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "96.8", "bbox": {"l": 262.189, "t": 519.0717500000001, "r": 279.62354, "b": 528.02814, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "EDD", "bbox": {"l": 81.612, "t": 536.49837, "r": 102.08514, "b": 545.40492, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "TB", "bbox": {"l": 137.91064, "t": 536.49837, "r": 150.64285, "b": 545.40492, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "86.0", "bbox": {"l": 176.56554, "t": 536.49837, "r": 194.00009, "b": 545.40492, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "-", "bbox": {"l": 227.89285, "t": 536.49837, "r": 231.21040000000002, "b": 545.40492, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "86.0", "bbox": {"l": 262.18411, "t": 536.49837, "r": 279.61865, "b": 545.40492, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 548.45436, "r": 117.38329000000002, "b": 557.36092, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "TB", "bbox": {"l": 137.90625, "t": 548.45436, "r": 150.63846, "b": 557.36092, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "89.6", "bbox": {"l": 176.57111, "t": 548.45436, "r": 194.00566, "b": 557.36092, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "-", "bbox": {"l": 227.88845999999998, "t": 548.45436, "r": 231.20601, "b": 557.36092, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "89.6", "bbox": {"l": 262.189, "t": 548.3348100000001, "r": 279.62354, "b": 557.2911799999999, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 568.00237, "r": 117.38329000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "STN", "bbox": {"l": 134.86766, "t": 568.00237, "r": 153.68701, "b": 576.90892, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "96.9", "bbox": {"l": 176.57111, "t": 568.00237, "r": 194.00566, "b": 576.90892, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "95.7", "bbox": {"l": 220.83495, "t": 568.00237, "r": 238.26950000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "96.7", "bbox": {"l": 262.1897, "t": 568.00237, "r": 279.62424, "b": 576.90892, "coord_origin": "TOPLEFT"}}], "children": [{"id": 17, "label": "text", "bbox": {"l": 78.843002, "t": 420.69037, "r": 104.85535, "b": 429.59692, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "Model", "bbox": {"l": 78.843002, "t": 420.69037, "r": 104.85535, "b": 429.59692, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 211.2, "t": 414.71237, "r": 236.10649, "b": 423.61893, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "TEDS", "bbox": {"l": 211.2, "t": 414.71237, "r": 236.10649, "b": 423.61893, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 129.338, "t": 426.66736, "r": 159.21584, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "Dataset", "bbox": {"l": 129.338, "t": 426.66736, "r": 159.21584, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 171.17096, "t": 426.66736, "r": 199.40497, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "Simple", "bbox": {"l": 171.17096, "t": 426.66736, "r": 199.40497, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 211.36009, "t": 426.66736, "r": 247.74349999999998, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "Complex", "bbox": {"l": 211.36009, "t": 426.66736, "r": 247.74349999999998, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 264.54044, "t": 426.66736, "r": 277.27264, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "All", "bbox": {"l": 264.54044, "t": 426.66736, "r": 277.27264, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 81.612, "t": 443.62436, "r": 102.08514, "b": 452.53091, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "EDD", "bbox": {"l": 81.612, "t": 443.62436, "r": 102.08514, "b": 452.53091, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 134.87206, "t": 443.62436, "r": 153.69141, "b": 452.53091, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "PTN", "bbox": {"l": 134.87206, "t": 443.62436, "r": 153.69141, "b": 452.53091, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 176.56554, "t": 443.62436, "r": 194.00009, "b": 452.53091, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "91.1", "bbox": {"l": 176.56554, "t": 443.62436, "r": 194.00009, "b": 452.53091, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 220.82938000000001, "t": 443.62436, "r": 238.26393, "b": 452.53091, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "88.7", "bbox": {"l": 220.82938000000001, "t": 443.62436, "r": 238.26393, "b": 452.53091, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 262.18414, "t": 443.62436, "r": 279.61868, "b": 452.53091, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "89.9", "bbox": {"l": 262.18414, "t": 443.62436, "r": 279.61868, "b": 452.53091, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 82.165001, "t": 455.58035, "r": 101.5323, "b": 464.48691, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "GTE", "bbox": {"l": 82.165001, "t": 455.58035, "r": 101.5323, "b": 464.48691, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 134.86716, "t": 455.58035, "r": 153.68651, "b": 464.48691, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "PTN", "bbox": {"l": 134.86716, "t": 455.58035, "r": 153.68651, "b": 464.48691, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 183.62411, "t": 455.58035, "r": 186.94167, "b": 464.48691, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "-", "bbox": {"l": 183.62411, "t": 455.58035, "r": 186.94167, "b": 464.48691, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 227.88795000000002, "t": 455.58035, "r": 231.20551, "b": 464.48691, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "-", "bbox": {"l": 227.88795000000002, "t": 455.58035, "r": 231.20551, "b": 464.48691, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 259.69855, "t": 455.58035, "r": 282.11441, "b": 464.48691, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "93.01", "bbox": {"l": 259.69855, "t": 455.58035, "r": 282.11441, "b": 464.48691, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 66.315002, "t": 468.13336, "r": 117.38329000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 468.13336, "r": 117.38329000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 134.86766, "t": 468.13336, "r": 153.68701, "b": 477.03992, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "PTN", "bbox": {"l": 134.86766, "t": 468.13336, "r": 153.68701, "b": 477.03992, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 176.57111, "t": 468.13336, "r": 194.00566, "b": 477.03992, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "98.5", "bbox": {"l": 176.57111, "t": 468.13336, "r": 194.00566, "b": 477.03992, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 220.83495, "t": 468.13336, "r": 238.26950000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "95.0", "bbox": {"l": 220.83495, "t": 468.13336, "r": 238.26950000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 259.698, "t": 468.01379, "r": 282.11386, "b": 476.97018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "96.75", "bbox": {"l": 259.698, "t": 468.01379, "r": 282.11386, "b": 476.97018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 81.612, "t": 483.32635, "r": 102.08514, "b": 492.23291, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "EDD", "bbox": {"l": 81.612, "t": 483.32635, "r": 102.08514, "b": 492.23291, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 134.87206, "t": 483.32635, "r": 153.69141, "b": 492.23291, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "FTN", "bbox": {"l": 134.87206, "t": 483.32635, "r": 153.69141, "b": 492.23291, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 176.56554, "t": 483.32635, "r": 194.00009, "b": 492.23291, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "88.4", "bbox": {"l": 176.56554, "t": 483.32635, "r": 194.00009, "b": 492.23291, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 218.33870999999996, "t": 483.32635, "r": 240.75455999999997, "b": 492.23291, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "92.08", "bbox": {"l": 218.33870999999996, "t": 483.32635, "r": 240.75455999999997, "b": 492.23291, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 262.18411, "t": 483.32635, "r": 279.61865, "b": 492.23291, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "90.6", "bbox": {"l": 262.18411, "t": 483.32635, "r": 279.61865, "b": 492.23291, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 82.165001, "t": 495.28134, "r": 101.5323, "b": 504.1879, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "GTE", "bbox": {"l": 82.165001, "t": 495.28134, "r": 101.5323, "b": 504.1879, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 134.86716, "t": 495.28134, "r": 153.68651, "b": 504.1879, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "FTN", "bbox": {"l": 134.86716, "t": 495.28134, "r": 153.68651, "b": 504.1879, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 183.62411, "t": 495.28134, "r": 186.94167, "b": 504.1879, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "-", "bbox": {"l": 183.62411, "t": 495.28134, "r": 186.94167, "b": 504.1879, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 227.88795000000002, "t": 495.28134, "r": 231.20551, "b": 504.1879, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "-", "bbox": {"l": 227.88795000000002, "t": 495.28134, "r": 231.20551, "b": 504.1879, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 259.69855, "t": 495.28134, "r": 282.11441, "b": 504.1879, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "87.14", "bbox": {"l": 259.69855, "t": 495.28134, "r": 282.11441, "b": 504.1879, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 71.789001, "t": 507.23633, "r": 111.90838999999998, "b": 516.14288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "GTE (FT)", "bbox": {"l": 71.789001, "t": 507.23633, "r": 111.90838999999998, "b": 516.14288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 134.86221, "t": 507.23633, "r": 153.68156, "b": 516.14288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "FTN", "bbox": {"l": 134.86221, "t": 507.23633, "r": 153.68156, "b": 516.14288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 183.62914, "t": 507.23633, "r": 186.94669, "b": 516.14288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "-", "bbox": {"l": 183.62914, "t": 507.23633, "r": 186.94669, "b": 516.14288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 227.89297, "t": 507.23633, "r": 231.21053000000003, "b": 516.14288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "-", "bbox": {"l": 227.89297, "t": 507.23633, "r": 231.21053000000003, "b": 516.14288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 259.6936, "t": 507.23633, "r": 282.10947, "b": 516.14288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "91.02", "bbox": {"l": 259.6936, "t": 507.23633, "r": 282.10947, "b": 516.14288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 66.315002, "t": 519.1913099999999, "r": 117.38329000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 519.1913099999999, "r": 117.38329000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 134.86766, "t": 519.1913099999999, "r": 153.68701, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "FTN", "bbox": {"l": 134.86766, "t": 519.1913099999999, "r": 153.68701, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 176.57111, "t": 519.1913099999999, "r": 194.00566, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "97.5", "bbox": {"l": 176.57111, "t": 519.1913099999999, "r": 194.00566, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 220.83495, "t": 519.1913099999999, "r": 238.26950000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "96.0", "bbox": {"l": 220.83495, "t": 519.1913099999999, "r": 238.26950000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 262.189, "t": 519.0717500000001, "r": 279.62354, "b": 528.02814, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "96.8", "bbox": {"l": 262.189, "t": 519.0717500000001, "r": 279.62354, "b": 528.02814, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 81.612, "t": 536.49837, "r": 102.08514, "b": 545.40492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "EDD", "bbox": {"l": 81.612, "t": 536.49837, "r": 102.08514, "b": 545.40492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 137.91064, "t": 536.49837, "r": 150.64285, "b": 545.40492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "TB", "bbox": {"l": 137.91064, "t": 536.49837, "r": 150.64285, "b": 545.40492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 176.56554, "t": 536.49837, "r": 194.00009, "b": 545.40492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "86.0", "bbox": {"l": 176.56554, "t": 536.49837, "r": 194.00009, "b": 545.40492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 227.89285, "t": 536.49837, "r": 231.21040000000002, "b": 545.40492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "-", "bbox": {"l": 227.89285, "t": 536.49837, "r": 231.21040000000002, "b": 545.40492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 262.18411, "t": 536.49837, "r": 279.61865, "b": 545.40492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "86.0", "bbox": {"l": 262.18411, "t": 536.49837, "r": 279.61865, "b": 545.40492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 66.315002, "t": 548.45436, "r": 117.38329000000002, "b": 557.36092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 548.45436, "r": 117.38329000000002, "b": 557.36092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 137.90625, "t": 548.45436, "r": 150.63846, "b": 557.36092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "TB", "bbox": {"l": 137.90625, "t": 548.45436, "r": 150.63846, "b": 557.36092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 176.57111, "t": 548.45436, "r": 194.00566, "b": 557.36092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "89.6", "bbox": {"l": 176.57111, "t": 548.45436, "r": 194.00566, "b": 557.36092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 227.88845999999998, "t": 548.45436, "r": 231.20601, "b": 557.36092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "-", "bbox": {"l": 227.88845999999998, "t": 548.45436, "r": 231.20601, "b": 557.36092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 262.189, "t": 548.3348100000001, "r": 279.62354, "b": 557.2911799999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": "89.6", "bbox": {"l": 262.189, "t": 548.3348100000001, "r": 279.62354, "b": 557.2911799999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 66.315002, "t": 568.00237, "r": 117.38329000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 568.00237, "r": 117.38329000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 134.86766, "t": 568.00237, "r": 153.68701, "b": 576.90892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "STN", "bbox": {"l": 134.86766, "t": 568.00237, "r": 153.68701, "b": 576.90892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 176.57111, "t": 568.00237, "r": 194.00566, "b": 576.90892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": "96.9", "bbox": {"l": 176.57111, "t": 568.00237, "r": 194.00566, "b": 576.90892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 220.83495, "t": 568.00237, "r": 238.26950000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 107, "text": "95.7", "bbox": {"l": 220.83495, "t": 568.00237, "r": 238.26950000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 262.1897, "t": 568.00237, "r": 279.62424, "b": 576.90892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 108, "text": "96.7", "bbox": {"l": 262.1897, "t": 568.00237, "r": 279.62424, "b": 576.90892, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 11, "num_cols": 5, "table_cells": [{"bbox": {"l": 78.843002, "t": 420.69037, "r": 104.85535, "b": 429.59692, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Model", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 211.2, "t": 414.71237, "r": 247.74349999999998, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "TEDS Complex", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 129.338, "t": 426.66736, "r": 159.21584, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Dataset", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 171.17096, "t": 426.66736, "r": 199.40497, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Simple", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 264.54044, "t": 426.66736, "r": 277.27264, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "All", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 81.612, "t": 443.62436, "r": 102.08514, "b": 452.53091, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "EDD", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.87206, "t": 443.62436, "r": 153.69141, "b": 452.53091, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "PTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.56554, "t": 443.62436, "r": 194.00009, "b": 452.53091, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "91.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 220.82938000000001, "t": 443.62436, "r": 238.26393, "b": 452.53091, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "88.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 262.18414, "t": 443.62436, "r": 279.61868, "b": 452.53091, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "89.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 82.165001, "t": 455.58035, "r": 101.5323, "b": 464.48691, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "GTE", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.86716, "t": 455.58035, "r": 153.68651, "b": 464.48691, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "PTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 183.62411, "t": 455.58035, "r": 186.94167, "b": 464.48691, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 227.88795000000002, "t": 455.58035, "r": 231.20551, "b": 464.48691, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 259.69855, "t": 455.58035, "r": 282.11441, "b": 464.48691, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "93.01", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 66.315002, "t": 468.13336, "r": 117.38329000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.86766, "t": 468.13336, "r": 153.68701, "b": 477.03992, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "PTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.57111, "t": 468.13336, "r": 194.00566, "b": 477.03992, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "98.5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 220.83495, "t": 468.13336, "r": 238.26950000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "95.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 259.698, "t": 468.01379, "r": 282.11386, "b": 476.97018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "96.75", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 81.612, "t": 483.32635, "r": 102.08514, "b": 492.23291, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "EDD", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.87206, "t": 483.32635, "r": 153.69141, "b": 492.23291, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "FTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.56554, "t": 483.32635, "r": 194.00009, "b": 492.23291, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "88.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 218.33870999999996, "t": 483.32635, "r": 240.75455999999997, "b": 492.23291, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "92.08", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 262.18411, "t": 483.32635, "r": 279.61865, "b": 492.23291, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "90.6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 82.165001, "t": 495.28134, "r": 101.5323, "b": 504.1879, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "GTE", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.86716, "t": 495.28134, "r": 153.68651, "b": 504.1879, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "FTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 183.62411, "t": 495.28134, "r": 186.94167, "b": 504.1879, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 227.88795000000002, "t": 495.28134, "r": 231.20551, "b": 504.1879, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 259.69855, "t": 495.28134, "r": 282.11441, "b": 504.1879, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "87.14", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 71.789001, "t": 507.23633, "r": 111.90838999999998, "b": 516.14288, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "GTE (FT)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.86221, "t": 507.23633, "r": 153.68156, "b": 516.14288, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "FTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 183.62914, "t": 507.23633, "r": 186.94669, "b": 516.14288, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 227.89297, "t": 507.23633, "r": 231.21053000000003, "b": 516.14288, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 259.6936, "t": 507.23633, "r": 282.10947, "b": 516.14288, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "91.02", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 66.315002, "t": 519.1913099999999, "r": 117.38329000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.86766, "t": 519.1913099999999, "r": 153.68701, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "FTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.57111, "t": 519.1913099999999, "r": 194.00566, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "97.5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 220.83495, "t": 519.1913099999999, "r": 238.26950000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "96.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 262.189, "t": 519.0717500000001, "r": 279.62354, "b": 528.02814, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "96.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 81.612, "t": 536.49837, "r": 102.08514, "b": 545.40492, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "EDD", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 137.91064, "t": 536.49837, "r": 150.64285, "b": 545.40492, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "TB", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.56554, "t": 536.49837, "r": 194.00009, "b": 545.40492, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "86.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 227.89285, "t": 536.49837, "r": 231.21040000000002, "b": 545.40492, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 262.18411, "t": 536.49837, "r": 279.61865, "b": 545.40492, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "86.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 66.315002, "t": 548.45436, "r": 117.38329000000002, "b": 557.36092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 137.90625, "t": 548.45436, "r": 150.63846, "b": 557.36092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "TB", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.57111, "t": 548.45436, "r": 194.00566, "b": 557.36092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "89.6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 227.88845999999998, "t": 548.45436, "r": 231.20601, "b": 557.36092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 262.189, "t": 548.3348100000001, "r": 279.62354, "b": 557.2911799999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "89.6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 66.315002, "t": 568.00237, "r": 117.38329000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.86766, "t": 568.00237, "r": 153.68701, "b": 576.90892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "STN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.57111, "t": 568.00237, "r": 194.00566, "b": 576.90892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "96.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 220.83495, "t": 568.00237, "r": 238.26950000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "95.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 262.1897, "t": 568.00237, "r": 279.62424, "b": 576.90892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "96.7", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "text", "id": 15, "page_no": 6, "cluster": {"id": 15, "label": "text", "bbox": {"l": 50.112, "t": 592.43336, "r": 286.36511, "b": 613.29492, "coord_origin": "TOPLEFT"}, "confidence": 0.7209173440933228, "cells": [{"id": 109, "text": "Table 2: Structure results on PubTabNet (PTN), FinTabNet", "bbox": {"l": 50.112, "t": 592.43336, "r": 286.36511, "b": 601.33992, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "(FTN), TableBank (TB) and SynthTabNet (STN).", "bbox": {"l": 50.112, "t": 604.38837, "r": 247.46114, "b": 613.29492, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 2: Structure results on PubTabNet (PTN), FinTabNet (FTN), TableBank (TB) and SynthTabNet (STN)."}, {"label": "text", "id": 16, "page_no": 6, "cluster": {"id": 16, "label": "text", "bbox": {"l": 50.112, "t": 616.34337, "r": 261.78732, "b": 625.24992, "coord_origin": "TOPLEFT"}, "confidence": 0.6433312892913818, "cells": [{"id": 111, "text": "FT: Model was trained on PubTabNet then finetuned.", "bbox": {"l": 50.112, "t": 616.34337, "r": 261.78732, "b": 625.24992, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "FT: Model was trained on PubTabNet then finetuned."}, {"label": "text", "id": 3, "page_no": 6, "cluster": {"id": 3, "label": "text", "bbox": {"l": 50.112015, "t": 644.3498099999999, "r": 286.366, "b": 713.151932, "coord_origin": "TOPLEFT"}, "confidence": 0.9854635000228882, "cells": [{"id": 112, "text": "Cell Detection.", "bbox": {"l": 62.067001, "t": 644.3498099999999, "r": 124.72179, "b": 653.30618, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "Like any object detector, our", "bbox": {"l": 128.20401, "t": 644.46936, "r": 242.9333, "b": 653.37592, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "Cell BBox", "bbox": {"l": 245.55401999999998, "t": 644.55902, "r": 286.36084, "b": 653.1467700000001, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "Detector", "bbox": {"l": 50.112015, "t": 656.51402, "r": 84.971146, "b": 665.10178, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "provides bounding boxes that can be improved", "bbox": {"l": 89.515015, "t": 656.42436, "r": 286.366, "b": 665.33092, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "with post-processing during inference. We make use of the", "bbox": {"l": 50.112015, "t": 668.37936, "r": 286.36511, "b": 677.28593, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "grid-like structure of tables to refine the predictions. A de-", "bbox": {"l": 50.112015, "t": 680.33536, "r": 286.36505, "b": 689.24193, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "tailed explanation on the post-processing is available in the", "bbox": {"l": 50.112015, "t": 692.290359, "r": 286.36511, "b": 701.19693, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "supplementary material. As shown in Tab. 3, we evaluate", "bbox": {"l": 50.112015, "t": 704.245361, "r": 286.36508, "b": 713.151932, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Cell Detection. Like any object detector, our Cell BBox Detector provides bounding boxes that can be improved with post-processing during inference. We make use of the grid-like structure of tables to refine the predictions. A detailed explanation on the post-processing is available in the supplementary material. As shown in Tab. 3, we evaluate"}, {"label": "text", "id": 7, "page_no": 6, "cluster": {"id": 7, "label": "text", "bbox": {"l": 308.862, "t": 75.20836999999995, "r": 545.11517, "b": 227.57709, "coord_origin": "TOPLEFT"}, "confidence": 0.9713197946548462, "cells": [{"id": 121, "text": "our", "bbox": {"l": 308.862, "t": 75.20836999999995, "r": 322.14215, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Cell BBox Decoder", "bbox": {"l": 325.45401, "t": 75.29803000000004, "r": 404.56702, "b": 83.88580000000002, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "accuracy for cells with a class la-", "bbox": {"l": 408.104, "t": 75.20836999999995, "r": 545.10968, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "bel of \u2018content\u2019 only using the PASCAL VOC mAP metric", "bbox": {"l": 308.862, "t": 87.16339000000005, "r": 545.11511, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "for pre-processing and post-processing.", "bbox": {"l": 308.862, "t": 99.11841000000004, "r": 470.22626, "b": 108.02495999999985, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "Note that we do", "bbox": {"l": 477.52884, "t": 99.11841000000004, "r": 545.11511, "b": 108.02495999999985, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "not have post-processing results for SynthTabNet as images", "bbox": {"l": 308.862, "t": 111.07343000000003, "r": 545.11517, "b": 119.97997999999984, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "are only provided. To compare the performance of our pro-", "bbox": {"l": 308.862, "t": 123.02844000000005, "r": 545.11511, "b": 131.93499999999995, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "posed approach, we\u2019ve integrated TableFormer\u2019s", "bbox": {"l": 308.862, "t": 134.98443999999995, "r": 502.01691000000005, "b": 143.89099, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "Cell BBox", "bbox": {"l": 504.47299, "t": 135.07410000000004, "r": 545.11041, "b": 143.66187000000002, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "Decoder", "bbox": {"l": 308.862, "t": 147.02910999999995, "r": 343.16324, "b": 155.61688000000004, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "into EDD architecture. As mentioned previously,", "bbox": {"l": 346.371, "t": 146.93944999999997, "r": 545.11493, "b": 155.84600999999998, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "the Structure Decoder provides the", "bbox": {"l": 308.862, "t": 158.89446999999996, "r": 446.15652, "b": 167.80102999999997, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "Cell BBox Decoder", "bbox": {"l": 448.28998000000007, "t": 158.98413000000005, "r": 525.04181, "b": 167.57190000000003, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "with", "bbox": {"l": 527.39899, "t": 158.89446999999996, "r": 545.11249, "b": 167.80102999999997, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "the features needed to predict the bounding box predictions.", "bbox": {"l": 308.862, "t": 170.84948999999995, "r": 545.11511, "b": 179.75603999999998, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "Therefore, the accuracy of the", "bbox": {"l": 308.862, "t": 182.80449999999996, "r": 432.86642000000006, "b": 191.71105999999997, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "Structure Decoder", "bbox": {"l": 436.39001, "t": 182.89417000000003, "r": 510.93021, "b": 191.48193000000003, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "directly", "bbox": {"l": 514.677, "t": 182.80449999999996, "r": 545.11273, "b": 191.71105999999997, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "influences the accuracy of the", "bbox": {"l": 308.862, "t": 194.75951999999995, "r": 431.17285, "b": 203.66607999999997, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "Cell BBox Decoder", "bbox": {"l": 434.6790199999999, "t": 194.84918000000005, "r": 514.18054, "b": 203.43695000000002, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": ". If the", "bbox": {"l": 514.17603, "t": 194.75951999999995, "r": 545.10992, "b": 203.66607999999997, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "Structure Decoder", "bbox": {"l": 308.86203, "t": 206.80517999999995, "r": 382.35614, "b": 215.39293999999995, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "predicts an extra column, this will result", "bbox": {"l": 385.07501, "t": 206.71551999999997, "r": 545.11426, "b": 215.62207, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "in an extra column of predicted bounding boxes.", "bbox": {"l": 308.862, "t": 218.67052999999999, "r": 501.6981799999999, "b": 227.57709, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "our Cell BBox Decoder accuracy for cells with a class label of 'content' only using the PASCAL VOC mAP metric for pre-processing and post-processing. Note that we do not have post-processing results for SynthTabNet as images are only provided. To compare the performance of our proposed approach, we've integrated TableFormer's Cell BBox Decoder into EDD architecture. As mentioned previously, the Structure Decoder provides the Cell BBox Decoder with the features needed to predict the bounding box predictions. Therefore, the accuracy of the Structure Decoder directly influences the accuracy of the Cell BBox Decoder . If the Structure Decoder predicts an extra column, this will result in an extra column of predicted bounding boxes."}, {"label": "table", "id": 8, "page_no": 6, "cluster": {"id": 8, "label": "table", "bbox": {"l": 308.4068603515625, "t": 247.87631225585938, "r": 533.6419677734375, "b": 303.8056640625, "coord_origin": "TOPLEFT"}, "confidence": 0.9691730737686157, "cells": [{"id": 146, "text": "Model", "bbox": {"l": 339.323, "t": 253.66436999999996, "r": 365.33536, "b": 262.57092, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "Dataset", "bbox": {"l": 401.04132, "t": 253.66436999999996, "r": 430.91916, "b": 262.57092, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "mAP", "bbox": {"l": 454.10214, "t": 253.66436999999996, "r": 474.58523999999994, "b": 262.57092, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "mAP (PP)", "bbox": {"l": 486.54034, "t": 253.66436999999996, "r": 527.2276, "b": 262.57092, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "EDD+BBox", "bbox": {"l": 327.65601, "t": 270.62134000000003, "r": 377.00076, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "PubTabNet", "bbox": {"l": 393.69809, "t": 270.62134000000003, "r": 438.28073, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "79.2", "bbox": {"l": 455.63559, "t": 270.62134000000003, "r": 473.07013, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "82.7", "bbox": {"l": 498.16592, "t": 270.62134000000003, "r": 515.60046, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "TableFormer", "bbox": {"l": 326.79501, "t": 282.57631999999995, "r": 377.86331, "b": 291.48288, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "PubTabNet", "bbox": {"l": 393.69388, "t": 282.57631999999995, "r": 438.27652, "b": 291.48288, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "82.1", "bbox": {"l": 455.63101, "t": 282.45676, "r": 473.06555000000003, "b": 291.41315, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "86.8", "bbox": {"l": 498.1713, "t": 282.45676, "r": 515.60583, "b": 291.41315, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "TableFormer", "bbox": {"l": 326.79501, "t": 294.53131, "r": 377.86331, "b": 303.43787, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "SynthTabNet", "bbox": {"l": 389.81842, "t": 294.53131, "r": 442.15194999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "87.7", "bbox": {"l": 455.63135, "t": 294.53131, "r": 473.06589, "b": 303.43787, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "-", "bbox": {"l": 505.22515999999996, "t": 294.53131, "r": 508.54268999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}}], "children": [{"id": 73, "label": "text", "bbox": {"l": 339.323, "t": 253.66436999999996, "r": 365.33536, "b": 262.57092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 146, "text": "Model", "bbox": {"l": 339.323, "t": 253.66436999999996, "r": 365.33536, "b": 262.57092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 401.04132, "t": 253.66436999999996, "r": 430.91916, "b": 262.57092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 147, "text": "Dataset", "bbox": {"l": 401.04132, "t": 253.66436999999996, "r": 430.91916, "b": 262.57092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 454.10214, "t": 253.66436999999996, "r": 474.58523999999994, "b": 262.57092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 148, "text": "mAP", "bbox": {"l": 454.10214, "t": 253.66436999999996, "r": 474.58523999999994, "b": 262.57092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 486.54034, "t": 253.66436999999996, "r": 527.2276, "b": 262.57092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 149, "text": "mAP (PP)", "bbox": {"l": 486.54034, "t": 253.66436999999996, "r": 527.2276, "b": 262.57092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 327.65601, "t": 270.62134000000003, "r": 377.00076, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 150, "text": "EDD+BBox", "bbox": {"l": 327.65601, "t": 270.62134000000003, "r": 377.00076, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 393.69809, "t": 270.62134000000003, "r": 438.28073, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 151, "text": "PubTabNet", "bbox": {"l": 393.69809, "t": 270.62134000000003, "r": 438.28073, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 455.63559, "t": 270.62134000000003, "r": 473.07013, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 152, "text": "79.2", "bbox": {"l": 455.63559, "t": 270.62134000000003, "r": 473.07013, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 498.16592, "t": 270.62134000000003, "r": 515.60046, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 153, "text": "82.7", "bbox": {"l": 498.16592, "t": 270.62134000000003, "r": 515.60046, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 326.79501, "t": 282.57631999999995, "r": 377.86331, "b": 291.48288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 154, "text": "TableFormer", "bbox": {"l": 326.79501, "t": 282.57631999999995, "r": 377.86331, "b": 291.48288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 393.69388, "t": 282.57631999999995, "r": 438.27652, "b": 291.48288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 155, "text": "PubTabNet", "bbox": {"l": 393.69388, "t": 282.57631999999995, "r": 438.27652, "b": 291.48288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 455.63101, "t": 282.45676, "r": 473.06555000000003, "b": 291.41315, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 156, "text": "82.1", "bbox": {"l": 455.63101, "t": 282.45676, "r": 473.06555000000003, "b": 291.41315, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 498.1713, "t": 282.45676, "r": 515.60583, "b": 291.41315, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 157, "text": "86.8", "bbox": {"l": 498.1713, "t": 282.45676, "r": 515.60583, "b": 291.41315, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 326.79501, "t": 294.53131, "r": 377.86331, "b": 303.43787, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 158, "text": "TableFormer", "bbox": {"l": 326.79501, "t": 294.53131, "r": 377.86331, "b": 303.43787, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 389.81842, "t": 294.53131, "r": 442.15194999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 159, "text": "SynthTabNet", "bbox": {"l": 389.81842, "t": 294.53131, "r": 442.15194999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 455.63135, "t": 294.53131, "r": 473.06589, "b": 303.43787, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 160, "text": "87.7", "bbox": {"l": 455.63135, "t": 294.53131, "r": 473.06589, "b": 303.43787, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 505.22515999999996, "t": 294.53131, "r": 508.54268999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 161, "text": "-", "bbox": {"l": 505.22515999999996, "t": 294.53131, "r": 508.54268999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 4, "num_cols": 4, "table_cells": [{"bbox": {"l": 339.323, "t": 253.66436999999996, "r": 365.33536, "b": 262.57092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Model", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 401.04132, "t": 253.66436999999996, "r": 430.91916, "b": 262.57092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Dataset", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 454.10214, "t": 253.66436999999996, "r": 474.58523999999994, "b": 262.57092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "mAP", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 486.54034, "t": 253.66436999999996, "r": 527.2276, "b": 262.57092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "mAP (PP)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 327.65601, "t": 270.62134000000003, "r": 377.00076, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "EDD+BBox", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 393.69809, "t": 270.62134000000003, "r": 438.28073, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "PubTabNet", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 455.63559, "t": 270.62134000000003, "r": 473.07013, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "79.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 498.16592, "t": 270.62134000000003, "r": 515.60046, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "82.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.79501, "t": 282.57631999999995, "r": 377.86331, "b": 291.48288, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 393.69388, "t": 282.57631999999995, "r": 438.27652, "b": 291.48288, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "PubTabNet", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 455.63101, "t": 282.45676, "r": 473.06555000000003, "b": 291.41315, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "82.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 498.1713, "t": 282.45676, "r": 515.60583, "b": 291.41315, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "86.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.79501, "t": 294.53131, "r": 377.86331, "b": 303.43787, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 389.81842, "t": 294.53131, "r": 442.15194999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "SynthTabNet", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 455.63135, "t": 294.53131, "r": 473.06589, "b": 303.43787, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "87.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 505.22515999999996, "t": 294.53131, "r": 508.54268999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "caption", "id": 12, "page_no": 6, "cluster": {"id": 12, "label": "caption", "bbox": {"l": 308.862, "t": 316.44931, "r": 545.11517, "b": 337.3108500000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9519917964935303, "cells": [{"id": 162, "text": "Table 3:", "bbox": {"l": 308.862, "t": 316.44931, "r": 341.49951, "b": 325.35587, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "Cell Bounding Box detection results on PubTab-", "bbox": {"l": 348.60284, "t": 316.44931, "r": 545.11517, "b": 325.35587, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "Net, and FinTabNet. PP: Post-processing.", "bbox": {"l": 308.862, "t": 328.4043, "r": 474.97845, "b": 337.3108500000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 3: Cell Bounding Box detection results on PubTabNet, and FinTabNet. PP: Post-processing."}, {"label": "text", "id": 4, "page_no": 6, "cluster": {"id": 4, "label": "text", "bbox": {"l": 308.86197, "t": 367.6797199999999, "r": 545.11566, "b": 520.16769, "coord_origin": "TOPLEFT"}, "confidence": 0.9835010766983032, "cells": [{"id": 165, "text": "Cell Content.", "bbox": {"l": 320.81699, "t": 367.6797199999999, "r": 378.94876, "b": 376.63611, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "In this section, we evaluate the entire", "bbox": {"l": 387.07898, "t": 367.79929, "r": 545.11566, "b": 376.70584, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "pipeline of recovering a table with content.", "bbox": {"l": 308.86197, "t": 379.75426999999996, "r": 487.19257, "b": 388.66083, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "Here we put", "bbox": {"l": 493.96713, "t": 379.75426999999996, "r": 545.11511, "b": 388.66083, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "our approach to test by capitalizing on extracting content", "bbox": {"l": 308.86197, "t": 391.70926, "r": 545.11505, "b": 400.61581, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "from the PDF cells rather than decoding from images. Tab.", "bbox": {"l": 308.86197, "t": 403.66525, "r": 545.11523, "b": 412.57181, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "4", "bbox": {"l": 308.86197, "t": 415.62024, "r": 314.08096, "b": 424.52679, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "shows the TEDs score of HTML code representing the", "bbox": {"l": 316.69046, "t": 415.62024, "r": 545.11517, "b": 424.52679, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "structure of the table along with the content inserted in the", "bbox": {"l": 308.86197, "t": 427.57523, "r": 545.11505, "b": 436.48177999999996, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "data cell and compared with the ground-truth. Our method", "bbox": {"l": 308.86197, "t": 439.53021, "r": 545.11505, "b": 448.43677, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "achieved a", "bbox": {"l": 308.86197, "t": 451.4852, "r": 350.23666, "b": 460.39175, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "5.3%", "bbox": {"l": 352.17596, "t": 451.36563, "r": 374.59183, "b": 460.32201999999995, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "increase over the state-of-the-art, and com-", "bbox": {"l": 376.53296, "t": 451.4852, "r": 545.11011, "b": 460.39175, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "mercial solutions. We believe our scores would be higher", "bbox": {"l": 308.86197, "t": 463.44019, "r": 545.11511, "b": 472.34674, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "if the HTML ground-truth matched the extracted PDF cell", "bbox": {"l": 308.86197, "t": 475.39618, "r": 545.11517, "b": 484.30273, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "content. Unfortunately, there are small discrepancies such", "bbox": {"l": 308.86197, "t": 487.35117, "r": 545.11511, "b": 496.25772, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "as spacings around words or special characters with various", "bbox": {"l": 308.86197, "t": 499.30615, "r": 545.11505, "b": 508.21271, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "unicode representations.", "bbox": {"l": 308.86197, "t": 511.26114, "r": 405.69846, "b": 520.16769, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Cell Content. In this section, we evaluate the entire pipeline of recovering a table with content. Here we put our approach to test by capitalizing on extracting content from the PDF cells rather than decoding from images. Tab. 4 shows the TEDs score of HTML code representing the structure of the table along with the content inserted in the data cell and compared with the ground-truth. Our method achieved a 5.3% increase over the state-of-the-art, and commercial solutions. We believe our scores would be higher if the HTML ground-truth matched the extracted PDF cell content. Unfortunately, there are small discrepancies such as spacings around words or special characters with various unicode representations."}, {"label": "table", "id": 5, "page_no": 6, "cluster": {"id": 5, "label": "table", "bbox": {"l": 332.9688720703125, "t": 540.2835693359375, "r": 520.942138671875, "b": 643.2697143554688, "coord_origin": "TOPLEFT"}, "confidence": 0.9775567650794983, "cells": [{"id": 183, "text": "Model", "bbox": {"l": 358.01099, "t": 552.23337, "r": 384.02335, "b": 561.1399200000001, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "TEDS", "bbox": {"l": 449.03400000000005, "t": 546.25537, "r": 473.94049000000007, "b": 555.16193, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": "Simple", "bbox": {"l": 408.50598, "t": 558.21037, "r": 436.73999, "b": 567.11693, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "Complex", "bbox": {"l": 448.6951, "t": 558.21037, "r": 485.07849, "b": 567.11693, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "All", "bbox": {"l": 499.3848, "t": 558.21037, "r": 512.117, "b": 567.11693, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": "Tabula", "bbox": {"l": 357.68201, "t": 575.16736, "r": 384.3519, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "78.0", "bbox": {"l": 413.90097, "t": 575.16736, "r": 431.33550999999994, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "57.8", "bbox": {"l": 458.16479000000004, "t": 575.16736, "r": 475.59933000000007, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "67.9", "bbox": {"l": 497.0289, "t": 575.16736, "r": 514.46344, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": "Traprange", "bbox": {"l": 350.72299, "t": 587.12236, "r": 391.31064, "b": 596.02892, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "60.8", "bbox": {"l": 413.90582, "t": 587.12236, "r": 431.34036, "b": 596.02892, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "49.9", "bbox": {"l": 458.16965, "t": 587.12236, "r": 475.60419, "b": 596.02892, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "55.4", "bbox": {"l": 497.03374999999994, "t": 587.12236, "r": 514.46832, "b": 596.02892, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "Camelot", "bbox": {"l": 354.13599, "t": 599.07835, "r": 387.89923, "b": 607.98491, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "80.0", "bbox": {"l": 413.90161, "t": 599.07835, "r": 431.33615, "b": 607.98491, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "66.0", "bbox": {"l": 458.16544, "t": 599.07835, "r": 475.59998, "b": 607.98491, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "73.0", "bbox": {"l": 497.02954000000005, "t": 599.07835, "r": 514.46411, "b": 607.98491, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "Acrobat Pro", "bbox": {"l": 346.55899, "t": 611.03336, "r": 395.47534, "b": 619.93991, "coord_origin": "TOPLEFT"}}, {"id": 201, "text": "68.9", "bbox": {"l": 413.90616, "t": 611.03336, "r": 431.34069999999997, "b": 619.93991, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": "61.8", "bbox": {"l": 458.16998000000007, "t": 611.03336, "r": 475.60452, "b": 619.93991, "coord_origin": "TOPLEFT"}}, {"id": 203, "text": "65.3", "bbox": {"l": 497.03409, "t": 611.03336, "r": 514.46863, "b": 619.93991, "coord_origin": "TOPLEFT"}}, {"id": 204, "text": "EDD", "bbox": {"l": 360.78101, "t": 622.9883600000001, "r": 381.25415, "b": 631.89491, "coord_origin": "TOPLEFT"}}, {"id": 205, "text": "91.2", "bbox": {"l": 413.90158, "t": 622.9883600000001, "r": 431.33612, "b": 631.89491, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": "85.4", "bbox": {"l": 458.16541, "t": 622.9883600000001, "r": 475.59995000000004, "b": 631.89491, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": "88.3", "bbox": {"l": 497.0295100000001, "t": 622.9883600000001, "r": 514.46405, "b": 631.89491, "coord_origin": "TOPLEFT"}}, {"id": 208, "text": "TableFormer", "bbox": {"l": 345.483, "t": 634.94336, "r": 396.5513, "b": 643.84991, "coord_origin": "TOPLEFT"}}, {"id": 209, "text": "95.4", "bbox": {"l": 413.90616, "t": 634.94336, "r": 431.34069999999997, "b": 643.84991, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": "90.1", "bbox": {"l": 458.16998000000007, "t": 634.94336, "r": 475.60452, "b": 643.84991, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "93.6", "bbox": {"l": 497.03400000000005, "t": 634.82381, "r": 514.46857, "b": 643.78018, "coord_origin": "TOPLEFT"}}], "children": [{"id": 89, "label": "text", "bbox": {"l": 358.01099, "t": 552.23337, "r": 384.02335, "b": 561.1399200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 183, "text": "Model", "bbox": {"l": 358.01099, "t": 552.23337, "r": 384.02335, "b": 561.1399200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 449.03400000000005, "t": 546.25537, "r": 473.94049000000007, "b": 555.16193, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 184, "text": "TEDS", "bbox": {"l": 449.03400000000005, "t": 546.25537, "r": 473.94049000000007, "b": 555.16193, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 408.50598, "t": 558.21037, "r": 436.73999, "b": 567.11693, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 185, "text": "Simple", "bbox": {"l": 408.50598, "t": 558.21037, "r": 436.73999, "b": 567.11693, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 448.6951, "t": 558.21037, "r": 485.07849, "b": 567.11693, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 186, "text": "Complex", "bbox": {"l": 448.6951, "t": 558.21037, "r": 485.07849, "b": 567.11693, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 499.3848, "t": 558.21037, "r": 512.117, "b": 567.11693, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 187, "text": "All", "bbox": {"l": 499.3848, "t": 558.21037, "r": 512.117, "b": 567.11693, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 357.68201, "t": 575.16736, "r": 384.3519, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 188, "text": "Tabula", "bbox": {"l": 357.68201, "t": 575.16736, "r": 384.3519, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 413.90097, "t": 575.16736, "r": 431.33550999999994, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 189, "text": "78.0", "bbox": {"l": 413.90097, "t": 575.16736, "r": 431.33550999999994, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 458.16479000000004, "t": 575.16736, "r": 475.59933000000007, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 190, "text": "57.8", "bbox": {"l": 458.16479000000004, "t": 575.16736, "r": 475.59933000000007, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 497.0289, "t": 575.16736, "r": 514.46344, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 191, "text": "67.9", "bbox": {"l": 497.0289, "t": 575.16736, "r": 514.46344, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 350.72299, "t": 587.12236, "r": 391.31064, "b": 596.02892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 192, "text": "Traprange", "bbox": {"l": 350.72299, "t": 587.12236, "r": 391.31064, "b": 596.02892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 413.90582, "t": 587.12236, "r": 431.34036, "b": 596.02892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 193, "text": "60.8", "bbox": {"l": 413.90582, "t": 587.12236, "r": 431.34036, "b": 596.02892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 458.16965, "t": 587.12236, "r": 475.60419, "b": 596.02892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 194, "text": "49.9", "bbox": {"l": 458.16965, "t": 587.12236, "r": 475.60419, "b": 596.02892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 497.03374999999994, "t": 587.12236, "r": 514.46832, "b": 596.02892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 195, "text": "55.4", "bbox": {"l": 497.03374999999994, "t": 587.12236, "r": 514.46832, "b": 596.02892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 354.13599, "t": 599.07835, "r": 387.89923, "b": 607.98491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 196, "text": "Camelot", "bbox": {"l": 354.13599, "t": 599.07835, "r": 387.89923, "b": 607.98491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 413.90161, "t": 599.07835, "r": 431.33615, "b": 607.98491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 197, "text": "80.0", "bbox": {"l": 413.90161, "t": 599.07835, "r": 431.33615, "b": 607.98491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 458.16544, "t": 599.07835, "r": 475.59998, "b": 607.98491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 198, "text": "66.0", "bbox": {"l": 458.16544, "t": 599.07835, "r": 475.59998, "b": 607.98491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 497.02954000000005, "t": 599.07835, "r": 514.46411, "b": 607.98491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 199, "text": "73.0", "bbox": {"l": 497.02954000000005, "t": 599.07835, "r": 514.46411, "b": 607.98491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 346.55899, "t": 611.03336, "r": 395.47534, "b": 619.93991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 200, "text": "Acrobat Pro", "bbox": {"l": 346.55899, "t": 611.03336, "r": 395.47534, "b": 619.93991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 413.90616, "t": 611.03336, "r": 431.34069999999997, "b": 619.93991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 201, "text": "68.9", "bbox": {"l": 413.90616, "t": 611.03336, "r": 431.34069999999997, "b": 619.93991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 458.16998000000007, "t": 611.03336, "r": 475.60452, "b": 619.93991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 202, "text": "61.8", "bbox": {"l": 458.16998000000007, "t": 611.03336, "r": 475.60452, "b": 619.93991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 497.03409, "t": 611.03336, "r": 514.46863, "b": 619.93991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 203, "text": "65.3", "bbox": {"l": 497.03409, "t": 611.03336, "r": 514.46863, "b": 619.93991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 360.78101, "t": 622.9883600000001, "r": 381.25415, "b": 631.89491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 204, "text": "EDD", "bbox": {"l": 360.78101, "t": 622.9883600000001, "r": 381.25415, "b": 631.89491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 413.90158, "t": 622.9883600000001, "r": 431.33612, "b": 631.89491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 205, "text": "91.2", "bbox": {"l": 413.90158, "t": 622.9883600000001, "r": 431.33612, "b": 631.89491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 458.16541, "t": 622.9883600000001, "r": 475.59995000000004, "b": 631.89491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 206, "text": "85.4", "bbox": {"l": 458.16541, "t": 622.9883600000001, "r": 475.59995000000004, "b": 631.89491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 497.0295100000001, "t": 622.9883600000001, "r": 514.46405, "b": 631.89491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 207, "text": "88.3", "bbox": {"l": 497.0295100000001, "t": 622.9883600000001, "r": 514.46405, "b": 631.89491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 114, "label": "text", "bbox": {"l": 345.483, "t": 634.94336, "r": 396.5513, "b": 643.84991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 208, "text": "TableFormer", "bbox": {"l": 345.483, "t": 634.94336, "r": 396.5513, "b": 643.84991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 115, "label": "text", "bbox": {"l": 413.90616, "t": 634.94336, "r": 431.34069999999997, "b": 643.84991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 209, "text": "95.4", "bbox": {"l": 413.90616, "t": 634.94336, "r": 431.34069999999997, "b": 643.84991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 116, "label": "text", "bbox": {"l": 458.16998000000007, "t": 634.94336, "r": 475.60452, "b": 643.84991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 210, "text": "90.1", "bbox": {"l": 458.16998000000007, "t": 634.94336, "r": 475.60452, "b": 643.84991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 117, "label": "text", "bbox": {"l": 497.03400000000005, "t": 634.82381, "r": 514.46857, "b": 643.78018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 211, "text": "93.6", "bbox": {"l": 497.03400000000005, "t": 634.82381, "r": 514.46857, "b": 643.78018, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["fcel", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "nl"], "num_rows": 7, "num_cols": 4, "table_cells": [{"bbox": {"l": 358.01099, "t": 552.23337, "r": 384.02335, "b": 561.1399200000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Model", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 448.6951, "t": 546.25537, "r": 485.07849, "b": 567.11693, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "TEDS Complex", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 408.50598, "t": 558.21037, "r": 436.73999, "b": 567.11693, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Simple", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 499.3848, "t": 558.21037, "r": 512.117, "b": 567.11693, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "All", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 357.68201, "t": 575.16736, "r": 384.3519, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Tabula", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 413.90097, "t": 575.16736, "r": 431.33550999999994, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "78.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 458.16479000000004, "t": 575.16736, "r": 475.59933000000007, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "57.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 497.0289, "t": 575.16736, "r": 514.46344, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "67.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 350.72299, "t": 587.12236, "r": 391.31064, "b": 596.02892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Traprange", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 413.90582, "t": 587.12236, "r": 431.34036, "b": 596.02892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "60.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 458.16965, "t": 587.12236, "r": 475.60419, "b": 596.02892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "49.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 497.03374999999994, "t": 587.12236, "r": 514.46832, "b": 596.02892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "55.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 354.13599, "t": 599.07835, "r": 387.89923, "b": 607.98491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Camelot", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 413.90161, "t": 599.07835, "r": 431.33615, "b": 607.98491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "80.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 458.16544, "t": 599.07835, "r": 475.59998, "b": 607.98491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "66.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 497.02954000000005, "t": 599.07835, "r": 514.46411, "b": 607.98491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "73.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 346.55899, "t": 611.03336, "r": 395.47534, "b": 619.93991, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Acrobat Pro", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 413.90616, "t": 611.03336, "r": 431.34069999999997, "b": 619.93991, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "68.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 458.16998000000007, "t": 611.03336, "r": 475.60452, "b": 619.93991, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "61.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 497.03409, "t": 611.03336, "r": 514.46863, "b": 619.93991, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "65.3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 360.78101, "t": 622.9883600000001, "r": 381.25415, "b": 631.89491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "EDD", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 413.90158, "t": 622.9883600000001, "r": 431.33612, "b": 631.89491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "91.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 458.16541, "t": 622.9883600000001, "r": 475.59995000000004, "b": 631.89491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "85.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 497.0295100000001, "t": 622.9883600000001, "r": 514.46405, "b": 631.89491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "88.3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 345.483, "t": 634.94336, "r": 396.5513, "b": 643.84991, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 413.90616, "t": 634.94336, "r": 431.34069999999997, "b": 643.84991, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "95.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 458.16998000000007, "t": 634.94336, "r": 475.60452, "b": 643.84991, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "90.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 497.03400000000005, "t": 634.82381, "r": 514.46857, "b": 643.78018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "93.6", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "caption", "id": 11, "page_no": 6, "cluster": {"id": 11, "label": "caption", "bbox": {"l": 308.862, "t": 656.86136, "r": 545.11517, "b": 689.6779300000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9541404247283936, "cells": [{"id": 212, "text": "Table 4:", "bbox": {"l": 308.862, "t": 656.86136, "r": 341.73862, "b": 665.76792, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "Results of structure with content retrieved using", "bbox": {"l": 349.55927, "t": 656.86136, "r": 545.11517, "b": 665.76792, "coord_origin": "TOPLEFT"}}, {"id": 214, "text": "cell detection on PubTabNet. In all cases the input is PDF", "bbox": {"l": 308.862, "t": 668.81636, "r": 545.11505, "b": 677.7229199999999, "coord_origin": "TOPLEFT"}}, {"id": 215, "text": "documents with cropped tables.", "bbox": {"l": 308.862, "t": 680.77136, "r": 435.03836, "b": 689.6779300000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 4: Results of structure with content retrieved using cell detection on PubTabNet. In all cases the input is PDF documents with cropped tables."}], "headers": [{"label": "page_footer", "id": 14, "page_no": 6, "cluster": {"id": 14, "label": "page_footer", "bbox": {"l": 295.121, "t": 734.133358, "r": 300.10229, "b": 743.039921, "coord_origin": "TOPLEFT"}, "confidence": 0.8787972331047058, "cells": [{"id": 216, "text": "7", "bbox": {"l": 295.121, "t": 734.133358, "r": 300.10229, "b": 743.039921, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "7"}]}}, {"page_no": 7, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "b.", "bbox": {"l": 53.811783000000005, "t": 208.23328000000004, "r": 62.219952, "b": 216.10645, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Structure predicted by TableFormer, with superimposed matched PDF cell text:", "bbox": {"l": 66.424026, "t": 208.23328000000004, "r": 385.93451, "b": 216.10645, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Japanese language (previously unseen by TableFormer):", "bbox": {"l": 53.811783000000005, "t": 94.28112999999996, "r": 284.34592, "b": 102.15430000000003, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Example table from FinTabNet:", "bbox": {"l": 304.83081, "t": 94.28112999999996, "r": 431.09119, "b": 102.15430000000003, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "a.", "bbox": {"l": 53.286037, "t": 78.68756000000008, "r": 61.550289, "b": 86.56073000000004, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Red - PDF cells, Green - predicted bounding boxes, Blue - post-processed predictions matched to PDF cells", "bbox": {"l": 65.682419, "t": 78.68756000000008, "r": 499.55563, "b": 86.56073000000004, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "\u8ad6\u6587\u30d5\u30a1\u30a4\u30eb", "bbox": {"l": 209.93285, "t": 222.18073000000004, "r": 241.04458999999997, "b": 226.36212, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "\u53c2\u8003\u6587\u732e", "bbox": {"l": 263.76489, "t": 222.18073000000004, "r": 284.50589, "b": 226.36212, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "\u51fa\u5178", "bbox": {"l": 110.24990999999999, "t": 229.66594999999995, "r": 120.62018, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "\u30d5\u30a1\u30a4\u30eb", "bbox": {"l": 175.36609, "t": 229.66594999999995, "r": 196.1071, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "\u6570", "bbox": {"l": 196.10756, "t": 229.66594999999995, "r": 201.29247, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "\u82f1\u8a9e", "bbox": {"l": 209.62408, "t": 229.66594999999995, "r": 219.99435, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "\u65e5\u672c\u8a9e", "bbox": {"l": 229.19814, "t": 229.66594999999995, "r": 244.75377, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "\u82f1\u8a9e", "bbox": {"l": 256.1142, "t": 229.66594999999995, "r": 266.48447, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "\u65e5\u672c\u8a9e", "bbox": {"l": 278.38434, "t": 229.66594999999995, "r": 293.93997, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Association for Computational Linguistics(ACL2003)", "bbox": {"l": 55.53052099999999, "t": 236.42584, "r": 162.7131, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "65", "bbox": {"l": 184.39731, "t": 236.42584, "r": 189.56456, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "65", "bbox": {"l": 208.99026, "t": 236.42584, "r": 214.15752, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "0", "bbox": {"l": 234.87517, "t": 236.42584, "r": 237.45833000000002, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "150", "bbox": {"l": 256.88446, "t": 236.42584, "r": 264.6358, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "0", "bbox": {"l": 284.06134, "t": 236.42584, "r": 286.6445, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Computational Linguistics(COLING2002)", "bbox": {"l": 55.53052099999999, "t": 242.62048000000004, "r": 139.72253, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "140", "bbox": {"l": 183.10536, "t": 242.62048000000004, "r": 190.8567, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "140", "bbox": {"l": 207.69832, "t": 242.62048000000004, "r": 215.44965999999997, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "0", "bbox": {"l": 234.87517, "t": 242.62048000000004, "r": 237.45833000000002, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "150", "bbox": {"l": 256.88446, "t": 242.62048000000004, "r": 264.6358, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "0", "bbox": {"l": 284.06134, "t": 242.62048000000004, "r": 286.6445, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "\u96fb\u6c17\u60c5\u5831\u901a\u4fe1\u5b66\u4f1a", "bbox": {"l": 55.53052099999999, "t": 249.79845999999998, "r": 97.013, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "2003", "bbox": {"l": 92.698288, "t": 249.58942000000002, "r": 103.03371, "b": 253.94732999999997, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "\u5e74\u7dcf\u5408\u5927\u4f1a", "bbox": {"l": 103.03389, "t": 249.79845999999998, "r": 128.96027, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "150", "bbox": {"l": 183.10536, "t": 248.81506000000002, "r": 190.8567, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "8", "bbox": {"l": 210.28223, "t": 248.81506000000002, "r": 212.86539, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "142", "bbox": {"l": 232.29153, "t": 248.81506000000002, "r": 240.04287999999997, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "223", "bbox": {"l": 256.88446, "t": 248.81506000000002, "r": 264.6358, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "147", "bbox": {"l": 281.47742, "t": 248.81506000000002, "r": 289.22876, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "\u60c5\u5831\u51e6\u7406\u5b66\u4f1a\u7b2c", "bbox": {"l": 55.53052099999999, "t": 257.28369, "r": 91.827637, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "65", "bbox": {"l": 88.052673, "t": 257.07465, "r": 93.219925, "b": 261.43255999999997, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "\u56de\u5168\u56fd\u5927\u4f1a", "bbox": {"l": 93.220474, "t": 257.28369, "r": 119.14685, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "(2003)", "bbox": {"l": 116.45073999999998, "t": 257.07465, "r": 129.88177, "b": 261.43255999999997, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "177", "bbox": {"l": 183.10536, "t": 256.30029, "r": 190.8567, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "1", "bbox": {"l": 210.28223, "t": 256.30029, "r": 212.86539, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "176", "bbox": {"l": 232.29153, "t": 256.30029, "r": 240.04287999999997, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "150", "bbox": {"l": 256.88446, "t": 256.30029, "r": 264.6358, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "236", "bbox": {"l": 281.47742, "t": 256.30029, "r": 289.22876, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "\u7b2c", "bbox": {"l": 55.53052099999999, "t": 264.5108, "r": 60.715424, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "17", "bbox": {"l": 60.17654799999999, "t": 264.30175999999994, "r": 65.343796, "b": 268.65967, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "\u56de\u4eba\u5de5\u77e5\u80fd\u5b66\u4f1a\u5168\u56fd\u5927\u4f1a", "bbox": {"l": 65.344376, "t": 264.5108, "r": 122.38297000000001, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "(2003)", "bbox": {"l": 116.45073999999998, "t": 264.30175999999994, "r": 129.88177, "b": 268.65967, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "208", "bbox": {"l": 183.10536, "t": 263.52739999999994, "r": 190.8567, "b": 267.88531, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "5", "bbox": {"l": 210.28223, "t": 263.52739999999994, "r": 212.86539, "b": 267.88531, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "203", "bbox": {"l": 232.29153, "t": 263.52739999999994, "r": 240.04287999999997, "b": 267.88531, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "152", "bbox": {"l": 256.88446, "t": 263.52739999999994, "r": 264.6358, "b": 267.88531, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "244", "bbox": {"l": 281.47742, "t": 263.52739999999994, "r": 289.22876, "b": 267.88531, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "\u81ea\u7136\u8a00\u8a9e\u51e6\u7406\u7814\u7a76\u4f1a\u7b2c", "bbox": {"l": 55.53052099999999, "t": 271.73785, "r": 107.38374, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "146", "bbox": {"l": 101.99034, "t": 271.52881, "r": 109.74168000000002, "b": 275.88671999999997, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "\u301c", "bbox": {"l": 109.74204, "t": 271.73785, "r": 114.92695000000002, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "155", "bbox": {"l": 114.38793, "t": 271.52881, "r": 122.13927, "b": 275.88671999999997, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "\u56de", "bbox": {"l": 122.13963, "t": 271.73785, "r": 127.32454000000001, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "98", "bbox": {"l": 184.39731, "t": 270.75446, "r": 189.56456, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "2", "bbox": {"l": 210.28223, "t": 270.75446, "r": 212.86539, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "96", "bbox": {"l": 233.58348, "t": 270.75446, "r": 238.75072999999998, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "150", "bbox": {"l": 256.88446, "t": 270.75446, "r": 264.6358, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "232", "bbox": {"l": 281.47742, "t": 270.75446, "r": 289.22876, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "WWW", "bbox": {"l": 55.53052099999999, "t": 279.01392, "r": 68.68605, "b": 283.37183, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "\u304b\u3089\u53ce\u96c6\u3057\u305f\u8ad6\u6587", "bbox": {"l": 68.685814, "t": 279.22295999999994, "r": 110.16829999999999, "b": 283.40436, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "107", "bbox": {"l": 183.10536, "t": 277.98157000000003, "r": 190.8567, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "73", "bbox": {"l": 208.99026, "t": 277.98157000000003, "r": 214.15752, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "34", "bbox": {"l": 233.58348, "t": 277.98157000000003, "r": 238.75072999999998, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "147", "bbox": {"l": 256.88446, "t": 277.98157000000003, "r": 264.6358, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "96", "bbox": {"l": 282.76938, "t": 277.98157000000003, "r": 287.93661, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "\u8a08", "bbox": {"l": 169.61508, "t": 286.45004, "r": 174.79999, "b": 290.63141, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "945", "bbox": {"l": 183.10536, "t": 285.46667, "r": 190.8567, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "294", "bbox": {"l": 207.69832, "t": 285.46667, "r": 215.44965999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "651", "bbox": {"l": 232.29153, "t": 285.46667, "r": 240.04287999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "1122", "bbox": {"l": 255.76506, "t": 285.46667, "r": 265.75204, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "955", "bbox": {"l": 281.47742, "t": 285.46667, "r": 289.22876, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "Text is aligned to match original for ease of viewing", "bbox": {"l": 380.42731, "t": 292.30426, "r": 549.42175, "b": 298.60284, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "Weighted Average Grant Date Fair", "bbox": {"l": 459.04861, "t": 221.62415, "r": 542.00018, "b": 226.68933000000004, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "Value", "bbox": {"l": 493.82193, "t": 227.83416999999997, "r": 507.2258, "b": 232.89935000000003, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "RS", "bbox": {"l": 393.2442, "t": 236.74712999999997, "r": 400.74588, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "U", "bbox": {"l": 400.74643, "t": 236.74712999999997, "r": 404.64523, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "s", "bbox": {"l": 404.6463, "t": 236.74712999999997, "r": 407.34631, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "Shares (in millions)", "bbox": {"l": 392.09671, "t": 221.57446000000004, "r": 438.0145, "b": 226.63964999999996, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "PSUs", "bbox": {"l": 427.18323, "t": 236.74712999999997, "r": 440.98778999999996, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "RSUs", "bbox": {"l": 468.38254, "t": 236.74712999999997, "r": 482.48465000000004, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "PSUs", "bbox": {"l": 516.92578, "t": 236.74712999999997, "r": 530.73035, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Nonvested on Janua", "bbox": {"l": 306.11493, "t": 244.61084000000005, "r": 355.6532, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "ry 1", "bbox": {"l": 355.65427, "t": 244.61084000000005, "r": 364.65607, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "1.", "bbox": {"l": 396.24661, "t": 244.91327, "r": 400.75238, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "1", "bbox": {"l": 400.7529, "t": 244.91327, "r": 403.75531, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "0.3", "bbox": {"l": 429.81838999999997, "t": 244.91327, "r": 437.32708999999994, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "90.10", "bbox": {"l": 465.52859, "t": 244.91327, "r": 478.40103, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "$", "bbox": {"l": 480.97552, "t": 244.91327, "r": 483.55001999999996, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "$ 91.19", "bbox": {"l": 513.44824, "t": 244.91327, "r": 531.46967, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "Granted", "bbox": {"l": 306.11493, "t": 253.68451000000005, "r": 325.62674, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "0.", "bbox": {"l": 396.24661, "t": 253.68451000000005, "r": 400.75238, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "5", "bbox": {"l": 400.7529, "t": 253.68451000000005, "r": 403.75531, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "0.1", "bbox": {"l": 429.81838999999997, "t": 253.68451000000005, "r": 437.32708999999994, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "117.44", "bbox": {"l": 466.43579000000005, "t": 253.68451000000005, "r": 482.54831, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "122.41", "bbox": {"l": 514.29065, "t": 253.68451000000005, "r": 530.80981, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "Vested", "bbox": {"l": 306.11493, "t": 261.54822, "r": 322.62866, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "(0.", "bbox": {"l": 394.43222, "t": 261.54822, "r": 400.73563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "5", "bbox": {"l": 400.73456, "t": 261.54822, "r": 403.73697, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": ")", "bbox": {"l": 403.73804, "t": 261.54822, "r": 405.53625, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "(0.1)", "bbox": {"l": 427.7016, "t": 261.54822, "r": 438.80563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "87.08", "bbox": {"l": 468.55533, "t": 261.54822, "r": 482.07043, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "81.14", "bbox": {"l": 516.01862, "t": 261.54822, "r": 529.53375, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "Canceled or forfeited", "bbox": {"l": 306.11493, "t": 269.64148, "r": 356.24771, "b": 274.70667000000003, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "(0.", "bbox": {"l": 394.43222, "t": 270.31946000000005, "r": 400.73563, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "1", "bbox": {"l": 400.73456, "t": 270.31946000000005, "r": 403.73697, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": ")", "bbox": {"l": 403.73804, "t": 270.31946000000005, "r": 405.53625, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "-", "bbox": {"l": 431.02802, "t": 270.31946000000005, "r": 436.4280099999999, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "102.01", "bbox": {"l": 465.83099000000004, "t": 270.31946000000005, "r": 482.35013, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "92.18", "bbox": {"l": 516.01862, "t": 270.31946000000005, "r": 529.53375, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "Nonvested on December 31", "bbox": {"l": 306.11493, "t": 278.48572, "r": 373.35764, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "1.0", "bbox": {"l": 396.24661, "t": 278.48572, "r": 403.75531, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "0.3", "bbox": {"l": 429.51599, "t": 278.48572, "r": 437.02469, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "104.85 $", "bbox": {"l": 463.7142, "t": 278.48572, "r": 484.73965000000004, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "$ 104.51", "bbox": {"l": 512.99463, "t": 278.48572, "r": 534.02008, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "Figure 5:", "bbox": {"l": 50.112, "t": 320.87735, "r": 86.864021, "b": 329.78391, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "One of the benefits of TableFormer is that it is language agnostic, as an example, the left part of the illustration", "bbox": {"l": 93.917542, "t": 320.87735, "r": 545.11371, "b": 329.78391, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "demonstrates TableFormer predictions on previously unseen language (Japanese). Additionally, we see that TableFormer is", "bbox": {"l": 50.112, "t": 332.83233999999993, "r": 545.11371, "b": 341.73889, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "robust to variability in style and content, right side of the illustration shows the example of the TableFormer prediction from", "bbox": {"l": 50.112, "t": 344.78732, "r": 545.11377, "b": 353.69388, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "the FinTabNet dataset.", "bbox": {"l": 50.112, "t": 356.74332, "r": 139.79532, "b": 365.64987, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "Red - PDF cells, Green - predicted bounding boxes", "bbox": {"l": 220.26282, "t": 381.77722, "r": 342.07819, "b": 386.44281, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "Ground Truth", "bbox": {"l": 53.715248, "t": 381.77722, "r": 85.657333, "b": 386.44281, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "16", "bbox": {"l": 437.37939, "t": 400.55295, "r": 443.69870000000003, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "17", "bbox": {"l": 450.33203, "t": 400.55295, "r": 456.6513100000001, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "18", "bbox": {"l": 463.28464, "t": 400.55295, "r": 469.60394, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "19", "bbox": {"l": 476.23724000000004, "t": 400.55295, "r": 482.5565500000001, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "20", "bbox": {"l": 489.18988, "t": 400.55295, "r": 495.50916, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "21", "bbox": {"l": 502.14251999999993, "t": 400.55295, "r": 508.46178999999995, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "22", "bbox": {"l": 515.09509, "t": 400.55295, "r": 521.41443, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "23", "bbox": {"l": 385.2814, "t": 411.03836000000007, "r": 391.60071, "b": 417.35699, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "24", "bbox": {"l": 398.52341, "t": 411.03836000000007, "r": 404.84271, "b": 417.35699, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "25", "bbox": {"l": 411.47604, "t": 411.03836000000007, "r": 417.79535, "b": 417.35699, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "26", "bbox": {"l": 437.37939, "t": 411.03836000000007, "r": 443.69870000000003, "b": 417.35699, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "27", "bbox": {"l": 450.33203, "t": 411.03836000000007, "r": 456.6513100000001, "b": 417.35699, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "28", "bbox": {"l": 463.28464, "t": 411.03836000000007, "r": 469.60394, "b": 417.35699, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "30", "bbox": {"l": 385.2814, "t": 421.0697, "r": 391.60071, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "31", "bbox": {"l": 398.52341, "t": 421.0697, "r": 404.84271, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "32", "bbox": {"l": 411.47604, "t": 421.0697, "r": 417.79532, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "33", "bbox": {"l": 424.42865, "t": 421.0697, "r": 430.74796, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "34", "bbox": {"l": 437.38129, "t": 421.0697, "r": 443.70056, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "35", "bbox": {"l": 450.33389000000005, "t": 421.0697, "r": 456.65319999999997, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "36", "bbox": {"l": 463.2865, "t": 421.0697, "r": 469.6058, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "37", "bbox": {"l": 476.23914, "t": 421.0697, "r": 482.55841, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "38", "bbox": {"l": 489.1917700000001, "t": 421.0697, "r": 495.51105, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "39", "bbox": {"l": 502.14438, "t": 421.0697, "r": 508.46368, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "40", "bbox": {"l": 515.09705, "t": 421.0697, "r": 521.41632, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "41", "bbox": {"l": 528.04962, "t": 421.0697, "r": 534.3689, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "42", "bbox": {"l": 385.2814, "t": 432.04431, "r": 391.60071, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "43", "bbox": {"l": 398.52341, "t": 432.04431, "r": 404.84271, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "44", "bbox": {"l": 411.47604, "t": 432.04431, "r": 417.79532, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "45", "bbox": {"l": 424.42865, "t": 432.04431, "r": 430.74796, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "46", "bbox": {"l": 437.38129, "t": 432.04431, "r": 443.70056, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "47", "bbox": {"l": 450.33389000000005, "t": 432.04431, "r": 456.65319999999997, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "48", "bbox": {"l": 463.2865, "t": 432.04431, "r": 469.6058, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "49", "bbox": {"l": 476.23914, "t": 432.04431, "r": 482.55841, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "50", "bbox": {"l": 489.1917700000001, "t": 432.04431, "r": 495.51105, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "51", "bbox": {"l": 502.14438, "t": 432.04431, "r": 508.46368, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "52", "bbox": {"l": 515.09705, "t": 432.04431, "r": 521.41632, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "53", "bbox": {"l": 528.04962, "t": 432.04431, "r": 534.3689, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "0", "bbox": {"l": 385.2814, "t": 389.20004, "r": 388.44073, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "1", "bbox": {"l": 398.52341, "t": 389.20004, "r": 401.68274, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "2", "bbox": {"l": 411.4754, "t": 389.20004, "r": 414.63474, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "3", "bbox": {"l": 424.4274, "t": 389.20004, "r": 427.58673, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "4", "bbox": {"l": 437.37939, "t": 389.20004, "r": 440.53870000000006, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "5", "bbox": {"l": 450.33136, "t": 389.20004, "r": 453.49069000000003, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "6", "bbox": {"l": 463.28336, "t": 389.20004, "r": 466.44269, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "7", "bbox": {"l": 476.23535, "t": 389.20004, "r": 479.39468, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "8", "bbox": {"l": 489.18735, "t": 389.20004, "r": 492.34668, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "9", "bbox": {"l": 502.13933999999995, "t": 389.20004, "r": 505.29868000000005, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "10", "bbox": {"l": 515.09131, "t": 389.20004, "r": 521.41064, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "11", "bbox": {"l": 528.04364, "t": 389.20004, "r": 534.13104, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "12", "bbox": {"l": 385.2814, "t": 398.97464, "r": 391.60071, "b": 405.29327, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "13", "bbox": {"l": 398.52341, "t": 398.97464, "r": 404.84271, "b": 405.29327, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "14", "bbox": {"l": 411.47604, "t": 398.97464, "r": 417.79535, "b": 405.29327, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "15", "bbox": {"l": 424.42719, "t": 406.77463000000006, "r": 430.74648999999994, "b": 413.09326, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "29", "bbox": {"l": 502.86941999999993, "t": 410.99438, "r": 509.18871999999993, "b": 417.31302, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "Predicted Structure", "bbox": {"l": 384.35437, "t": 381.77722, "r": 430.99261, "b": 386.44281, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "Figure 6: An example of TableFormer predictions (bounding boxes and structure) from generated SynthTabNet table.", "bbox": {"l": 62.595001, "t": 458.72836, "r": 532.63049, "b": 467.63492, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "5.5.", "bbox": {"l": 50.112, "t": 491.39536, "r": 64.448898, "b": 501.24741, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "Qualitative Analysis", "bbox": {"l": 74.006828, "t": 491.39536, "r": 163.7558, "b": 501.24741, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "We showcase several visualizations for the different", "bbox": {"l": 62.067001, "t": 536.87337, "r": 286.36499, "b": 545.77992, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": "components of our network on various", "bbox": {"l": 50.112, "t": 548.82837, "r": 211.15741, "b": 557.73492, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "\u201ccomplex\u201d", "bbox": {"l": 215.10000999999997, "t": 548.91803, "r": 259.17453, "b": 557.50578, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "tables", "bbox": {"l": 263.12, "t": 548.82837, "r": 286.36273, "b": 557.73492, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": "within datasets presented in this work in Fig. 5 and Fig. 6", "bbox": {"l": 50.112, "t": 560.78337, "r": 286.36505, "b": 569.68993, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "As it is shown, our model is able to predict bounding boxes", "bbox": {"l": 50.112, "t": 572.73837, "r": 286.36508, "b": 581.6449299999999, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "for all table cells, even for the empty ones. Additionally,", "bbox": {"l": 50.112, "t": 584.69337, "r": 286.36508, "b": 593.59993, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "our post-processing techniques can extract the cell content", "bbox": {"l": 50.112, "t": 596.64937, "r": 286.36505, "b": 605.55592, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": "by matching the predicted bounding boxes to the PDF cells", "bbox": {"l": 50.112, "t": 608.60437, "r": 286.36508, "b": 617.51093, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "based on their overlap and spatial proximity. The left part", "bbox": {"l": 50.112, "t": 620.55937, "r": 286.36508, "b": 629.46593, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "of Fig. 5 demonstrates also the adaptability of our method", "bbox": {"l": 50.112, "t": 632.51437, "r": 286.36508, "b": 641.42093, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "to any language, as it can successfully extract Japanese", "bbox": {"l": 50.112, "t": 644.46938, "r": 286.36508, "b": 653.37593, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "text, although the training set contains only English content.", "bbox": {"l": 50.112, "t": 656.42438, "r": 286.36511, "b": 665.33094, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "We provide more visualizations including the intermediate", "bbox": {"l": 50.112, "t": 668.38037, "r": 286.36508, "b": 677.28694, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "steps in the supplementary material. Overall these illustra-", "bbox": {"l": 50.112, "t": 680.33537, "r": 286.36511, "b": 689.24194, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "tions justify the versatility of our method across a diverse", "bbox": {"l": 50.112, "t": 692.290375, "r": 286.36511, "b": 701.196945, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "range of table appearances and content type.", "bbox": {"l": 50.112, "t": 704.245377, "r": 226.88833999999997, "b": 713.1519470000001, "coord_origin": "TOPLEFT"}}, {"id": 201, "text": "6.", "bbox": {"l": 308.862, "t": 490.70892, "r": 316.07382, "b": 501.45663, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": "Future Work & Conclusion", "bbox": {"l": 325.68954, "t": 490.70892, "r": 460.84848, "b": 501.45663, "coord_origin": "TOPLEFT"}}, {"id": 203, "text": "In this paper, we presented TableFormer an end-to-end", "bbox": {"l": 320.81699, "t": 512.89337, "r": 545.11505, "b": 521.79993, "coord_origin": "TOPLEFT"}}, {"id": 204, "text": "transformer based approach to predict table structures and", "bbox": {"l": 308.862, "t": 524.84836, "r": 545.11517, "b": 533.75491, "coord_origin": "TOPLEFT"}}, {"id": 205, "text": "bounding boxes of cells from an image. This approach en-", "bbox": {"l": 308.862, "t": 536.80336, "r": 545.11511, "b": 545.70992, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": "ables us to recreate the table structure, and extract the cell", "bbox": {"l": 308.862, "t": 548.75836, "r": 545.11505, "b": 557.6649199999999, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": "content from PDF or OCR by using bounding boxes. Ad-", "bbox": {"l": 308.862, "t": 560.71336, "r": 545.11517, "b": 569.61992, "coord_origin": "TOPLEFT"}}, {"id": 208, "text": "ditionally, it provides the versatility required in real-world", "bbox": {"l": 308.862, "t": 572.66837, "r": 545.11511, "b": 581.57492, "coord_origin": "TOPLEFT"}}, {"id": 209, "text": "scenarios when dealing with various types of PDF docu-", "bbox": {"l": 308.862, "t": 584.62436, "r": 545.11511, "b": 593.53091, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": "ments, and languages.", "bbox": {"l": 308.862, "t": 596.57936, "r": 400.46808, "b": 605.48592, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "Furthermore, our method outper-", "bbox": {"l": 408.37839, "t": 596.57936, "r": 545.11511, "b": 605.48592, "coord_origin": "TOPLEFT"}}, {"id": 212, "text": "forms all state-of-the-arts with a wide margin. Finally, we", "bbox": {"l": 308.862, "t": 608.53436, "r": 545.11505, "b": 617.44092, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "introduce \u201cSynthTabNet\u201d a challenging synthetically gen-", "bbox": {"l": 308.862, "t": 620.48936, "r": 545.11511, "b": 629.3959199999999, "coord_origin": "TOPLEFT"}}, {"id": 214, "text": "erated dataset that reinforces missing characteristics from", "bbox": {"l": 308.862, "t": 632.4443699999999, "r": 545.11505, "b": 641.35092, "coord_origin": "TOPLEFT"}}, {"id": 215, "text": "other datasets.", "bbox": {"l": 308.862, "t": 644.39937, "r": 365.85803, "b": 653.30592, "coord_origin": "TOPLEFT"}}, {"id": 216, "text": "References", "bbox": {"l": 308.862, "t": 672.09892, "r": 364.40585, "b": 682.84664, "coord_origin": "TOPLEFT"}}, {"id": 217, "text": "[1]", "bbox": {"l": 313.345, "t": 693.9617920000001, "r": 323.80792, "b": 701.977753, "coord_origin": "TOPLEFT"}}, {"id": 218, "text": "Nicolas Carion, Francisco Massa, Gabriel Synnaeve, Nicolas", "bbox": {"l": 326.05127, "t": 693.9617920000001, "r": 545.10852, "b": 701.977753, "coord_origin": "TOPLEFT"}}, {"id": 219, "text": "Usunier, Alexander Kirillov, and Sergey Zagoruyko. End-to-", "bbox": {"l": 328.78101, "t": 704.920792, "r": 545.1134, "b": 712.936752, "coord_origin": "TOPLEFT"}}, {"id": 220, "text": "8", "bbox": {"l": 295.121, "t": 734.133366, "r": 300.10229, "b": 743.039928, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 18, "label": "caption", "bbox": {"l": 53.811783000000005, "t": 208.23328000000004, "r": 385.93451, "b": 216.10645, "coord_origin": "TOPLEFT"}, "confidence": 0.5986505746841431, "cells": [{"id": 0, "text": "b.", "bbox": {"l": 53.811783000000005, "t": 208.23328000000004, "r": 62.219952, "b": 216.10645, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Structure predicted by TableFormer, with superimposed matched PDF cell text:", "bbox": {"l": 66.424026, "t": 208.23328000000004, "r": 385.93451, "b": 216.10645, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "section_header", "bbox": {"l": 53.811783000000005, "t": 94.28112999999996, "r": 284.34592, "b": 102.15430000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.46452972292900085, "cells": [{"id": 2, "text": "Japanese language (previously unseen by TableFormer):", "bbox": {"l": 53.811783000000005, "t": 94.28112999999996, "r": 284.34592, "b": 102.15430000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "section_header", "bbox": {"l": 304.83081, "t": 94.28112999999996, "r": 431.09119, "b": 102.15430000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.4629225730895996, "cells": [{"id": 3, "text": "Example table from FinTabNet:", "bbox": {"l": 304.83081, "t": 94.28112999999996, "r": 431.09119, "b": 102.15430000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "list_item", "bbox": {"l": 53.286037, "t": 78.68756000000008, "r": 61.550289, "b": 86.56073000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.5820134282112122, "cells": [{"id": 4, "text": "a.", "bbox": {"l": 53.286037, "t": 78.68756000000008, "r": 61.550289, "b": 86.56073000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "list_item", "bbox": {"l": 65.682419, "t": 78.68756000000008, "r": 499.55563, "b": 86.56073000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.541211724281311, "cells": [{"id": 5, "text": "Red - PDF cells, Green - predicted bounding boxes, Blue - post-processed predictions matched to PDF cells", "bbox": {"l": 65.682419, "t": 78.68756000000008, "r": 499.55563, "b": 86.56073000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "table", "bbox": {"l": 53.62853240966797, "t": 218.94857788085938, "r": 298.5574951171875, "b": 292.39996337890625, "coord_origin": "TOPLEFT"}, "confidence": 0.8824009299278259, "cells": [{"id": 6, "text": "\u8ad6\u6587\u30d5\u30a1\u30a4\u30eb", "bbox": {"l": 209.93285, "t": 222.18073000000004, "r": 241.04458999999997, "b": 226.36212, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "\u53c2\u8003\u6587\u732e", "bbox": {"l": 263.76489, "t": 222.18073000000004, "r": 284.50589, "b": 226.36212, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "\u51fa\u5178", "bbox": {"l": 110.24990999999999, "t": 229.66594999999995, "r": 120.62018, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "\u30d5\u30a1\u30a4\u30eb", "bbox": {"l": 175.36609, "t": 229.66594999999995, "r": 196.1071, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "\u6570", "bbox": {"l": 196.10756, "t": 229.66594999999995, "r": 201.29247, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "\u82f1\u8a9e", "bbox": {"l": 209.62408, "t": 229.66594999999995, "r": 219.99435, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "\u65e5\u672c\u8a9e", "bbox": {"l": 229.19814, "t": 229.66594999999995, "r": 244.75377, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "\u82f1\u8a9e", "bbox": {"l": 256.1142, "t": 229.66594999999995, "r": 266.48447, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "\u65e5\u672c\u8a9e", "bbox": {"l": 278.38434, "t": 229.66594999999995, "r": 293.93997, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Association for Computational Linguistics(ACL2003)", "bbox": {"l": 55.53052099999999, "t": 236.42584, "r": 162.7131, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "65", "bbox": {"l": 184.39731, "t": 236.42584, "r": 189.56456, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "65", "bbox": {"l": 208.99026, "t": 236.42584, "r": 214.15752, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "0", "bbox": {"l": 234.87517, "t": 236.42584, "r": 237.45833000000002, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "150", "bbox": {"l": 256.88446, "t": 236.42584, "r": 264.6358, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "0", "bbox": {"l": 284.06134, "t": 236.42584, "r": 286.6445, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Computational Linguistics(COLING2002)", "bbox": {"l": 55.53052099999999, "t": 242.62048000000004, "r": 139.72253, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "140", "bbox": {"l": 183.10536, "t": 242.62048000000004, "r": 190.8567, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "140", "bbox": {"l": 207.69832, "t": 242.62048000000004, "r": 215.44965999999997, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "0", "bbox": {"l": 234.87517, "t": 242.62048000000004, "r": 237.45833000000002, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "150", "bbox": {"l": 256.88446, "t": 242.62048000000004, "r": 264.6358, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "0", "bbox": {"l": 284.06134, "t": 242.62048000000004, "r": 286.6445, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "\u96fb\u6c17\u60c5\u5831\u901a\u4fe1\u5b66\u4f1a", "bbox": {"l": 55.53052099999999, "t": 249.79845999999998, "r": 97.013, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "2003", "bbox": {"l": 92.698288, "t": 249.58942000000002, "r": 103.03371, "b": 253.94732999999997, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "\u5e74\u7dcf\u5408\u5927\u4f1a", "bbox": {"l": 103.03389, "t": 249.79845999999998, "r": 128.96027, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "150", "bbox": {"l": 183.10536, "t": 248.81506000000002, "r": 190.8567, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "8", "bbox": {"l": 210.28223, "t": 248.81506000000002, "r": 212.86539, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "142", "bbox": {"l": 232.29153, "t": 248.81506000000002, "r": 240.04287999999997, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "223", "bbox": {"l": 256.88446, "t": 248.81506000000002, "r": 264.6358, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "147", "bbox": {"l": 281.47742, "t": 248.81506000000002, "r": 289.22876, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "\u60c5\u5831\u51e6\u7406\u5b66\u4f1a\u7b2c", "bbox": {"l": 55.53052099999999, "t": 257.28369, "r": 91.827637, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "65", "bbox": {"l": 88.052673, "t": 257.07465, "r": 93.219925, "b": 261.43255999999997, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "\u56de\u5168\u56fd\u5927\u4f1a", "bbox": {"l": 93.220474, "t": 257.28369, "r": 119.14685, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "(2003)", "bbox": {"l": 116.45073999999998, "t": 257.07465, "r": 129.88177, "b": 261.43255999999997, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "177", "bbox": {"l": 183.10536, "t": 256.30029, "r": 190.8567, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "1", "bbox": {"l": 210.28223, "t": 256.30029, "r": 212.86539, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "176", "bbox": {"l": 232.29153, "t": 256.30029, "r": 240.04287999999997, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "150", "bbox": {"l": 256.88446, "t": 256.30029, "r": 264.6358, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "236", "bbox": {"l": 281.47742, "t": 256.30029, "r": 289.22876, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "\u7b2c", "bbox": {"l": 55.53052099999999, "t": 264.5108, "r": 60.715424, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "17", "bbox": {"l": 60.17654799999999, "t": 264.30175999999994, "r": 65.343796, "b": 268.65967, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "\u56de\u4eba\u5de5\u77e5\u80fd\u5b66\u4f1a\u5168\u56fd\u5927\u4f1a", "bbox": {"l": 65.344376, "t": 264.5108, "r": 122.38297000000001, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "(2003)", "bbox": {"l": 116.45073999999998, "t": 264.30175999999994, "r": 129.88177, "b": 268.65967, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "208", "bbox": {"l": 183.10536, "t": 263.52739999999994, "r": 190.8567, "b": 267.88531, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "5", "bbox": {"l": 210.28223, "t": 263.52739999999994, "r": 212.86539, "b": 267.88531, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "203", "bbox": {"l": 232.29153, "t": 263.52739999999994, "r": 240.04287999999997, "b": 267.88531, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "152", "bbox": {"l": 256.88446, "t": 263.52739999999994, "r": 264.6358, "b": 267.88531, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "244", "bbox": {"l": 281.47742, "t": 263.52739999999994, "r": 289.22876, "b": 267.88531, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "\u81ea\u7136\u8a00\u8a9e\u51e6\u7406\u7814\u7a76\u4f1a\u7b2c", "bbox": {"l": 55.53052099999999, "t": 271.73785, "r": 107.38374, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "146", "bbox": {"l": 101.99034, "t": 271.52881, "r": 109.74168000000002, "b": 275.88671999999997, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "\u301c", "bbox": {"l": 109.74204, "t": 271.73785, "r": 114.92695000000002, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "155", "bbox": {"l": 114.38793, "t": 271.52881, "r": 122.13927, "b": 275.88671999999997, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "\u56de", "bbox": {"l": 122.13963, "t": 271.73785, "r": 127.32454000000001, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "98", "bbox": {"l": 184.39731, "t": 270.75446, "r": 189.56456, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "2", "bbox": {"l": 210.28223, "t": 270.75446, "r": 212.86539, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "96", "bbox": {"l": 233.58348, "t": 270.75446, "r": 238.75072999999998, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "150", "bbox": {"l": 256.88446, "t": 270.75446, "r": 264.6358, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "232", "bbox": {"l": 281.47742, "t": 270.75446, "r": 289.22876, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "WWW", "bbox": {"l": 55.53052099999999, "t": 279.01392, "r": 68.68605, "b": 283.37183, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "\u304b\u3089\u53ce\u96c6\u3057\u305f\u8ad6\u6587", "bbox": {"l": 68.685814, "t": 279.22295999999994, "r": 110.16829999999999, "b": 283.40436, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "107", "bbox": {"l": 183.10536, "t": 277.98157000000003, "r": 190.8567, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "73", "bbox": {"l": 208.99026, "t": 277.98157000000003, "r": 214.15752, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "34", "bbox": {"l": 233.58348, "t": 277.98157000000003, "r": 238.75072999999998, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "147", "bbox": {"l": 256.88446, "t": 277.98157000000003, "r": 264.6358, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "96", "bbox": {"l": 282.76938, "t": 277.98157000000003, "r": 287.93661, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "\u8a08", "bbox": {"l": 169.61508, "t": 286.45004, "r": 174.79999, "b": 290.63141, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "945", "bbox": {"l": 183.10536, "t": 285.46667, "r": 190.8567, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "294", "bbox": {"l": 207.69832, "t": 285.46667, "r": 215.44965999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "651", "bbox": {"l": 232.29153, "t": 285.46667, "r": 240.04287999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "1122", "bbox": {"l": 255.76506, "t": 285.46667, "r": 265.75204, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "955", "bbox": {"l": 281.47742, "t": 285.46667, "r": 289.22876, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}], "children": [{"id": 32, "label": "text", "bbox": {"l": 209.93285, "t": 222.18073000000004, "r": 241.04458999999997, "b": 226.36212, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": "\u8ad6\u6587\u30d5\u30a1\u30a4\u30eb", "bbox": {"l": 209.93285, "t": 222.18073000000004, "r": 241.04458999999997, "b": 226.36212, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 263.76489, "t": 222.18073000000004, "r": 284.50589, "b": 226.36212, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "\u53c2\u8003\u6587\u732e", "bbox": {"l": 263.76489, "t": 222.18073000000004, "r": 284.50589, "b": 226.36212, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 110.24990999999999, "t": 229.66594999999995, "r": 120.62018, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "\u51fa\u5178", "bbox": {"l": 110.24990999999999, "t": 229.66594999999995, "r": 120.62018, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 175.36609, "t": 229.66594999999995, "r": 196.1071, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "\u30d5\u30a1\u30a4\u30eb", "bbox": {"l": 175.36609, "t": 229.66594999999995, "r": 196.1071, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 196.10756, "t": 229.66594999999995, "r": 201.29247, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "\u6570", "bbox": {"l": 196.10756, "t": 229.66594999999995, "r": 201.29247, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 209.62408, "t": 229.66594999999995, "r": 219.99435, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "\u82f1\u8a9e", "bbox": {"l": 209.62408, "t": 229.66594999999995, "r": 219.99435, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 229.19814, "t": 229.66594999999995, "r": 244.75377, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "\u65e5\u672c\u8a9e", "bbox": {"l": 229.19814, "t": 229.66594999999995, "r": 244.75377, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 256.1142, "t": 229.66594999999995, "r": 266.48447, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "\u82f1\u8a9e", "bbox": {"l": 256.1142, "t": 229.66594999999995, "r": 266.48447, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 278.38434, "t": 229.66594999999995, "r": 293.93997, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "\u65e5\u672c\u8a9e", "bbox": {"l": 278.38434, "t": 229.66594999999995, "r": 293.93997, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 55.53052099999999, "t": 236.42584, "r": 162.7131, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "Association for Computational Linguistics(ACL2003)", "bbox": {"l": 55.53052099999999, "t": 236.42584, "r": 162.7131, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 184.39731, "t": 236.42584, "r": 189.56456, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "65", "bbox": {"l": 184.39731, "t": 236.42584, "r": 189.56456, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 208.99026, "t": 236.42584, "r": 214.15752, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "65", "bbox": {"l": 208.99026, "t": 236.42584, "r": 214.15752, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 234.87517, "t": 236.42584, "r": 237.45833000000002, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "0", "bbox": {"l": 234.87517, "t": 236.42584, "r": 237.45833000000002, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 256.88446, "t": 236.42584, "r": 264.6358, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "150", "bbox": {"l": 256.88446, "t": 236.42584, "r": 264.6358, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 284.06134, "t": 236.42584, "r": 286.6445, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "0", "bbox": {"l": 284.06134, "t": 236.42584, "r": 286.6445, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 55.53052099999999, "t": 242.62048000000004, "r": 139.72253, "b": 246.97839, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "Computational Linguistics(COLING2002)", "bbox": {"l": 55.53052099999999, "t": 242.62048000000004, "r": 139.72253, "b": 246.97839, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 183.10536, "t": 242.62048000000004, "r": 190.8567, "b": 246.97839, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "140", "bbox": {"l": 183.10536, "t": 242.62048000000004, "r": 190.8567, "b": 246.97839, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 207.69832, "t": 242.62048000000004, "r": 215.44965999999997, "b": 246.97839, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "140", "bbox": {"l": 207.69832, "t": 242.62048000000004, "r": 215.44965999999997, "b": 246.97839, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 234.87517, "t": 242.62048000000004, "r": 237.45833000000002, "b": 246.97839, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "0", "bbox": {"l": 234.87517, "t": 242.62048000000004, "r": 237.45833000000002, "b": 246.97839, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 256.88446, "t": 242.62048000000004, "r": 264.6358, "b": 246.97839, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "150", "bbox": {"l": 256.88446, "t": 242.62048000000004, "r": 264.6358, "b": 246.97839, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 284.06134, "t": 242.62048000000004, "r": 286.6445, "b": 246.97839, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "0", "bbox": {"l": 284.06134, "t": 242.62048000000004, "r": 286.6445, "b": 246.97839, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 55.53052099999999, "t": 249.79845999999998, "r": 97.013, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "\u96fb\u6c17\u60c5\u5831\u901a\u4fe1\u5b66\u4f1a", "bbox": {"l": 55.53052099999999, "t": 249.79845999999998, "r": 97.013, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 92.698288, "t": 249.58942000000002, "r": 103.03371, "b": 253.94732999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "2003", "bbox": {"l": 92.698288, "t": 249.58942000000002, "r": 103.03371, "b": 253.94732999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 103.03389, "t": 249.79845999999998, "r": 128.96027, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "\u5e74\u7dcf\u5408\u5927\u4f1a", "bbox": {"l": 103.03389, "t": 249.79845999999998, "r": 128.96027, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 183.10536, "t": 248.81506000000002, "r": 190.8567, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "150", "bbox": {"l": 183.10536, "t": 248.81506000000002, "r": 190.8567, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 210.28223, "t": 248.81506000000002, "r": 212.86539, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "8", "bbox": {"l": 210.28223, "t": 248.81506000000002, "r": 212.86539, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 232.29153, "t": 248.81506000000002, "r": 240.04287999999997, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "142", "bbox": {"l": 232.29153, "t": 248.81506000000002, "r": 240.04287999999997, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 256.88446, "t": 248.81506000000002, "r": 264.6358, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "223", "bbox": {"l": 256.88446, "t": 248.81506000000002, "r": 264.6358, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 281.47742, "t": 248.81506000000002, "r": 289.22876, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "147", "bbox": {"l": 281.47742, "t": 248.81506000000002, "r": 289.22876, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 55.53052099999999, "t": 257.28369, "r": 91.827637, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "\u60c5\u5831\u51e6\u7406\u5b66\u4f1a\u7b2c", "bbox": {"l": 55.53052099999999, "t": 257.28369, "r": 91.827637, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 88.052673, "t": 257.07465, "r": 93.219925, "b": 261.43255999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "65", "bbox": {"l": 88.052673, "t": 257.07465, "r": 93.219925, "b": 261.43255999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 93.220474, "t": 257.28369, "r": 119.14685, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "\u56de\u5168\u56fd\u5927\u4f1a", "bbox": {"l": 93.220474, "t": 257.28369, "r": 119.14685, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 116.45073999999998, "t": 257.07465, "r": 129.88177, "b": 261.43255999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "(2003)", "bbox": {"l": 116.45073999999998, "t": 257.07465, "r": 129.88177, "b": 261.43255999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 183.10536, "t": 256.30029, "r": 190.8567, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "177", "bbox": {"l": 183.10536, "t": 256.30029, "r": 190.8567, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 210.28223, "t": 256.30029, "r": 212.86539, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "1", "bbox": {"l": 210.28223, "t": 256.30029, "r": 212.86539, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 232.29153, "t": 256.30029, "r": 240.04287999999997, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "176", "bbox": {"l": 232.29153, "t": 256.30029, "r": 240.04287999999997, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 256.88446, "t": 256.30029, "r": 264.6358, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "150", "bbox": {"l": 256.88446, "t": 256.30029, "r": 264.6358, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 281.47742, "t": 256.30029, "r": 289.22876, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "236", "bbox": {"l": 281.47742, "t": 256.30029, "r": 289.22876, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 55.53052099999999, "t": 264.5108, "r": 60.715424, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "\u7b2c", "bbox": {"l": 55.53052099999999, "t": 264.5108, "r": 60.715424, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 60.17654799999999, "t": 264.30175999999994, "r": 65.343796, "b": 268.65967, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "17", "bbox": {"l": 60.17654799999999, "t": 264.30175999999994, "r": 65.343796, "b": 268.65967, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 65.344376, "t": 264.5108, "r": 122.38297000000001, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "\u56de\u4eba\u5de5\u77e5\u80fd\u5b66\u4f1a\u5168\u56fd\u5927\u4f1a", "bbox": {"l": 65.344376, "t": 264.5108, "r": 122.38297000000001, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 116.45073999999998, "t": 264.30175999999994, "r": 129.88177, "b": 268.65967, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "(2003)", "bbox": {"l": 116.45073999999998, "t": 264.30175999999994, "r": 129.88177, "b": 268.65967, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 183.10536, "t": 263.52739999999994, "r": 190.8567, "b": 267.88531, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "208", "bbox": {"l": 183.10536, "t": 263.52739999999994, "r": 190.8567, "b": 267.88531, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 210.28223, "t": 263.52739999999994, "r": 212.86539, "b": 267.88531, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "5", "bbox": {"l": 210.28223, "t": 263.52739999999994, "r": 212.86539, "b": 267.88531, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 232.29153, "t": 263.52739999999994, "r": 240.04287999999997, "b": 267.88531, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "203", "bbox": {"l": 232.29153, "t": 263.52739999999994, "r": 240.04287999999997, "b": 267.88531, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 256.88446, "t": 263.52739999999994, "r": 264.6358, "b": 267.88531, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "152", "bbox": {"l": 256.88446, "t": 263.52739999999994, "r": 264.6358, "b": 267.88531, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 281.47742, "t": 263.52739999999994, "r": 289.22876, "b": 267.88531, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "244", "bbox": {"l": 281.47742, "t": 263.52739999999994, "r": 289.22876, "b": 267.88531, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 55.53052099999999, "t": 271.73785, "r": 107.38374, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "\u81ea\u7136\u8a00\u8a9e\u51e6\u7406\u7814\u7a76\u4f1a\u7b2c", "bbox": {"l": 55.53052099999999, "t": 271.73785, "r": 107.38374, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 101.99034, "t": 271.52881, "r": 109.74168000000002, "b": 275.88671999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "146", "bbox": {"l": 101.99034, "t": 271.52881, "r": 109.74168000000002, "b": 275.88671999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 109.74204, "t": 271.73785, "r": 114.92695000000002, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "\u301c", "bbox": {"l": 109.74204, "t": 271.73785, "r": 114.92695000000002, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 114.38793, "t": 271.52881, "r": 122.13927, "b": 275.88671999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "155", "bbox": {"l": 114.38793, "t": 271.52881, "r": 122.13927, "b": 275.88671999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 122.13963, "t": 271.73785, "r": 127.32454000000001, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "\u56de", "bbox": {"l": 122.13963, "t": 271.73785, "r": 127.32454000000001, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 184.39731, "t": 270.75446, "r": 189.56456, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "98", "bbox": {"l": 184.39731, "t": 270.75446, "r": 189.56456, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 210.28223, "t": 270.75446, "r": 212.86539, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "2", "bbox": {"l": 210.28223, "t": 270.75446, "r": 212.86539, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 233.58348, "t": 270.75446, "r": 238.75072999999998, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "96", "bbox": {"l": 233.58348, "t": 270.75446, "r": 238.75072999999998, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 256.88446, "t": 270.75446, "r": 264.6358, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "150", "bbox": {"l": 256.88446, "t": 270.75446, "r": 264.6358, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 281.47742, "t": 270.75446, "r": 289.22876, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "232", "bbox": {"l": 281.47742, "t": 270.75446, "r": 289.22876, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 55.53052099999999, "t": 279.01392, "r": 68.68605, "b": 283.37183, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "WWW", "bbox": {"l": 55.53052099999999, "t": 279.01392, "r": 68.68605, "b": 283.37183, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 68.685814, "t": 279.22295999999994, "r": 110.16829999999999, "b": 283.40436, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "\u304b\u3089\u53ce\u96c6\u3057\u305f\u8ad6\u6587", "bbox": {"l": 68.685814, "t": 279.22295999999994, "r": 110.16829999999999, "b": 283.40436, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 183.10536, "t": 277.98157000000003, "r": 190.8567, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "107", "bbox": {"l": 183.10536, "t": 277.98157000000003, "r": 190.8567, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 208.99026, "t": 277.98157000000003, "r": 214.15752, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "73", "bbox": {"l": 208.99026, "t": 277.98157000000003, "r": 214.15752, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 233.58348, "t": 277.98157000000003, "r": 238.75072999999998, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "34", "bbox": {"l": 233.58348, "t": 277.98157000000003, "r": 238.75072999999998, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 256.88446, "t": 277.98157000000003, "r": 264.6358, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "147", "bbox": {"l": 256.88446, "t": 277.98157000000003, "r": 264.6358, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 282.76938, "t": 277.98157000000003, "r": 287.93661, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "96", "bbox": {"l": 282.76938, "t": 277.98157000000003, "r": 287.93661, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 169.61508, "t": 286.45004, "r": 174.79999, "b": 290.63141, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "\u8a08", "bbox": {"l": 169.61508, "t": 286.45004, "r": 174.79999, "b": 290.63141, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 183.10536, "t": 285.46667, "r": 190.8567, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "945", "bbox": {"l": 183.10536, "t": 285.46667, "r": 190.8567, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 207.69832, "t": 285.46667, "r": 215.44965999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "294", "bbox": {"l": 207.69832, "t": 285.46667, "r": 215.44965999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 232.29153, "t": 285.46667, "r": 240.04287999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "651", "bbox": {"l": 232.29153, "t": 285.46667, "r": 240.04287999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 255.76506, "t": 285.46667, "r": 265.75204, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "1122", "bbox": {"l": 255.76506, "t": 285.46667, "r": 265.75204, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 281.47742, "t": 285.46667, "r": 289.22876, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "955", "bbox": {"l": 281.47742, "t": 285.46667, "r": 289.22876, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 16, "label": "caption", "bbox": {"l": 380.42731, "t": 292.30426, "r": 549.42175, "b": 298.60284, "coord_origin": "TOPLEFT"}, "confidence": 0.7499915957450867, "cells": [{"id": 76, "text": "Text is aligned to match original for ease of viewing", "bbox": {"l": 380.42731, "t": 292.30426, "r": 549.42175, "b": 298.60284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "table", "bbox": {"l": 304.9219970703125, "t": 218.51486206054688, "r": 550.2321166992188, "b": 287.90069580078125, "coord_origin": "TOPLEFT"}, "confidence": 0.8899767994880676, "cells": [{"id": 77, "text": "Weighted Average Grant Date Fair", "bbox": {"l": 459.04861, "t": 221.62415, "r": 542.00018, "b": 226.68933000000004, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "Value", "bbox": {"l": 493.82193, "t": 227.83416999999997, "r": 507.2258, "b": 232.89935000000003, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "RS", "bbox": {"l": 393.2442, "t": 236.74712999999997, "r": 400.74588, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "U", "bbox": {"l": 400.74643, "t": 236.74712999999997, "r": 404.64523, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "s", "bbox": {"l": 404.6463, "t": 236.74712999999997, "r": 407.34631, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "Shares (in millions)", "bbox": {"l": 392.09671, "t": 221.57446000000004, "r": 438.0145, "b": 226.63964999999996, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "PSUs", "bbox": {"l": 427.18323, "t": 236.74712999999997, "r": 440.98778999999996, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "RSUs", "bbox": {"l": 468.38254, "t": 236.74712999999997, "r": 482.48465000000004, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "PSUs", "bbox": {"l": 516.92578, "t": 236.74712999999997, "r": 530.73035, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Nonvested on Janua", "bbox": {"l": 306.11493, "t": 244.61084000000005, "r": 355.6532, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "ry 1", "bbox": {"l": 355.65427, "t": 244.61084000000005, "r": 364.65607, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "1.", "bbox": {"l": 396.24661, "t": 244.91327, "r": 400.75238, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "1", "bbox": {"l": 400.7529, "t": 244.91327, "r": 403.75531, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "0.3", "bbox": {"l": 429.81838999999997, "t": 244.91327, "r": 437.32708999999994, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "90.10", "bbox": {"l": 465.52859, "t": 244.91327, "r": 478.40103, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "$", "bbox": {"l": 480.97552, "t": 244.91327, "r": 483.55001999999996, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "$ 91.19", "bbox": {"l": 513.44824, "t": 244.91327, "r": 531.46967, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "Granted", "bbox": {"l": 306.11493, "t": 253.68451000000005, "r": 325.62674, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "0.", "bbox": {"l": 396.24661, "t": 253.68451000000005, "r": 400.75238, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "5", "bbox": {"l": 400.7529, "t": 253.68451000000005, "r": 403.75531, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "0.1", "bbox": {"l": 429.81838999999997, "t": 253.68451000000005, "r": 437.32708999999994, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "117.44", "bbox": {"l": 466.43579000000005, "t": 253.68451000000005, "r": 482.54831, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "122.41", "bbox": {"l": 514.29065, "t": 253.68451000000005, "r": 530.80981, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "Vested", "bbox": {"l": 306.11493, "t": 261.54822, "r": 322.62866, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "(0.", "bbox": {"l": 394.43222, "t": 261.54822, "r": 400.73563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "5", "bbox": {"l": 400.73456, "t": 261.54822, "r": 403.73697, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": ")", "bbox": {"l": 403.73804, "t": 261.54822, "r": 405.53625, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "(0.1)", "bbox": {"l": 427.7016, "t": 261.54822, "r": 438.80563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "87.08", "bbox": {"l": 468.55533, "t": 261.54822, "r": 482.07043, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "81.14", "bbox": {"l": 516.01862, "t": 261.54822, "r": 529.53375, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "Canceled or forfeited", "bbox": {"l": 306.11493, "t": 269.64148, "r": 356.24771, "b": 274.70667000000003, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "(0.", "bbox": {"l": 394.43222, "t": 270.31946000000005, "r": 400.73563, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "1", "bbox": {"l": 400.73456, "t": 270.31946000000005, "r": 403.73697, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": ")", "bbox": {"l": 403.73804, "t": 270.31946000000005, "r": 405.53625, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "-", "bbox": {"l": 431.02802, "t": 270.31946000000005, "r": 436.4280099999999, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "102.01", "bbox": {"l": 465.83099000000004, "t": 270.31946000000005, "r": 482.35013, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "92.18", "bbox": {"l": 516.01862, "t": 270.31946000000005, "r": 529.53375, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "Nonvested on December 31", "bbox": {"l": 306.11493, "t": 278.48572, "r": 373.35764, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "1.0", "bbox": {"l": 396.24661, "t": 278.48572, "r": 403.75531, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "0.3", "bbox": {"l": 429.51599, "t": 278.48572, "r": 437.02469, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "104.85 $", "bbox": {"l": 463.7142, "t": 278.48572, "r": 484.73965000000004, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "$ 104.51", "bbox": {"l": 512.99463, "t": 278.48572, "r": 534.02008, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}], "children": [{"id": 102, "label": "text", "bbox": {"l": 459.04861, "t": 221.62415, "r": 542.00018, "b": 226.68933000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "Weighted Average Grant Date Fair", "bbox": {"l": 459.04861, "t": 221.62415, "r": 542.00018, "b": 226.68933000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 493.82193, "t": 227.83416999999997, "r": 507.2258, "b": 232.89935000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "Value", "bbox": {"l": 493.82193, "t": 227.83416999999997, "r": 507.2258, "b": 232.89935000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 393.2442, "t": 236.74712999999997, "r": 400.74588, "b": 241.81232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "RS", "bbox": {"l": 393.2442, "t": 236.74712999999997, "r": 400.74588, "b": 241.81232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 400.74643, "t": 236.74712999999997, "r": 404.64523, "b": 241.81232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "U", "bbox": {"l": 400.74643, "t": 236.74712999999997, "r": 404.64523, "b": 241.81232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 404.6463, "t": 236.74712999999997, "r": 407.34631, "b": 241.81232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "s", "bbox": {"l": 404.6463, "t": 236.74712999999997, "r": 407.34631, "b": 241.81232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 392.09671, "t": 221.57446000000004, "r": 438.0145, "b": 226.63964999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "Shares (in millions)", "bbox": {"l": 392.09671, "t": 221.57446000000004, "r": 438.0145, "b": 226.63964999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 427.18323, "t": 236.74712999999997, "r": 440.98778999999996, "b": 241.81232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "PSUs", "bbox": {"l": 427.18323, "t": 236.74712999999997, "r": 440.98778999999996, "b": 241.81232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 468.38254, "t": 236.74712999999997, "r": 482.48465000000004, "b": 241.81232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "RSUs", "bbox": {"l": 468.38254, "t": 236.74712999999997, "r": 482.48465000000004, "b": 241.81232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 516.92578, "t": 236.74712999999997, "r": 530.73035, "b": 241.81232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "PSUs", "bbox": {"l": 516.92578, "t": 236.74712999999997, "r": 530.73035, "b": 241.81232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 306.11493, "t": 244.61084000000005, "r": 355.6532, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "Nonvested on Janua", "bbox": {"l": 306.11493, "t": 244.61084000000005, "r": 355.6532, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 355.65427, "t": 244.61084000000005, "r": 364.65607, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "ry 1", "bbox": {"l": 355.65427, "t": 244.61084000000005, "r": 364.65607, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 396.24661, "t": 244.91327, "r": 400.75238, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "1.", "bbox": {"l": 396.24661, "t": 244.91327, "r": 400.75238, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 114, "label": "text", "bbox": {"l": 400.7529, "t": 244.91327, "r": 403.75531, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "1", "bbox": {"l": 400.7529, "t": 244.91327, "r": 403.75531, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 115, "label": "text", "bbox": {"l": 429.81838999999997, "t": 244.91327, "r": 437.32708999999994, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "0.3", "bbox": {"l": 429.81838999999997, "t": 244.91327, "r": 437.32708999999994, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 116, "label": "text", "bbox": {"l": 465.52859, "t": 244.91327, "r": 478.40103, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "90.10", "bbox": {"l": 465.52859, "t": 244.91327, "r": 478.40103, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 117, "label": "text", "bbox": {"l": 480.97552, "t": 244.91327, "r": 483.55001999999996, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "$", "bbox": {"l": 480.97552, "t": 244.91327, "r": 483.55001999999996, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 118, "label": "text", "bbox": {"l": 513.44824, "t": 244.91327, "r": 531.46967, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "$ 91.19", "bbox": {"l": 513.44824, "t": 244.91327, "r": 531.46967, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 119, "label": "text", "bbox": {"l": 306.11493, "t": 253.68451000000005, "r": 325.62674, "b": 258.74969, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "Granted", "bbox": {"l": 306.11493, "t": 253.68451000000005, "r": 325.62674, "b": 258.74969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 120, "label": "text", "bbox": {"l": 396.24661, "t": 253.68451000000005, "r": 400.75238, "b": 258.74969, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "0.", "bbox": {"l": 396.24661, "t": 253.68451000000005, "r": 400.75238, "b": 258.74969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 121, "label": "text", "bbox": {"l": 400.7529, "t": 253.68451000000005, "r": 403.75531, "b": 258.74969, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "5", "bbox": {"l": 400.7529, "t": 253.68451000000005, "r": 403.75531, "b": 258.74969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 122, "label": "text", "bbox": {"l": 429.81838999999997, "t": 253.68451000000005, "r": 437.32708999999994, "b": 258.74969, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "0.1", "bbox": {"l": 429.81838999999997, "t": 253.68451000000005, "r": 437.32708999999994, "b": 258.74969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 123, "label": "text", "bbox": {"l": 466.43579000000005, "t": 253.68451000000005, "r": 482.54831, "b": 258.74969, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "117.44", "bbox": {"l": 466.43579000000005, "t": 253.68451000000005, "r": 482.54831, "b": 258.74969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 124, "label": "text", "bbox": {"l": 514.29065, "t": 253.68451000000005, "r": 530.80981, "b": 258.74969, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "122.41", "bbox": {"l": 514.29065, "t": 253.68451000000005, "r": 530.80981, "b": 258.74969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 125, "label": "text", "bbox": {"l": 306.11493, "t": 261.54822, "r": 322.62866, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "Vested", "bbox": {"l": 306.11493, "t": 261.54822, "r": 322.62866, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 126, "label": "text", "bbox": {"l": 394.43222, "t": 261.54822, "r": 400.73563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "(0.", "bbox": {"l": 394.43222, "t": 261.54822, "r": 400.73563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 127, "label": "text", "bbox": {"l": 400.73456, "t": 261.54822, "r": 403.73697, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "5", "bbox": {"l": 400.73456, "t": 261.54822, "r": 403.73697, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 128, "label": "text", "bbox": {"l": 403.73804, "t": 261.54822, "r": 405.53625, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": ")", "bbox": {"l": 403.73804, "t": 261.54822, "r": 405.53625, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 129, "label": "text", "bbox": {"l": 427.7016, "t": 261.54822, "r": 438.80563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "(0.1)", "bbox": {"l": 427.7016, "t": 261.54822, "r": 438.80563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 130, "label": "text", "bbox": {"l": 468.55533, "t": 261.54822, "r": 482.07043, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "87.08", "bbox": {"l": 468.55533, "t": 261.54822, "r": 482.07043, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 131, "label": "text", "bbox": {"l": 516.01862, "t": 261.54822, "r": 529.53375, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": "81.14", "bbox": {"l": 516.01862, "t": 261.54822, "r": 529.53375, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 132, "label": "text", "bbox": {"l": 306.11493, "t": 269.64148, "r": 356.24771, "b": 274.70667000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 107, "text": "Canceled or forfeited", "bbox": {"l": 306.11493, "t": 269.64148, "r": 356.24771, "b": 274.70667000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 133, "label": "text", "bbox": {"l": 394.43222, "t": 270.31946000000005, "r": 400.73563, "b": 275.38464, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 108, "text": "(0.", "bbox": {"l": 394.43222, "t": 270.31946000000005, "r": 400.73563, "b": 275.38464, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 134, "label": "text", "bbox": {"l": 400.73456, "t": 270.31946000000005, "r": 403.73697, "b": 275.38464, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 109, "text": "1", "bbox": {"l": 400.73456, "t": 270.31946000000005, "r": 403.73697, "b": 275.38464, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 135, "label": "text", "bbox": {"l": 403.73804, "t": 270.31946000000005, "r": 405.53625, "b": 275.38464, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 110, "text": ")", "bbox": {"l": 403.73804, "t": 270.31946000000005, "r": 405.53625, "b": 275.38464, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 136, "label": "text", "bbox": {"l": 431.02802, "t": 270.31946000000005, "r": 436.4280099999999, "b": 275.38464, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 111, "text": "-", "bbox": {"l": 431.02802, "t": 270.31946000000005, "r": 436.4280099999999, "b": 275.38464, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 137, "label": "text", "bbox": {"l": 465.83099000000004, "t": 270.31946000000005, "r": 482.35013, "b": 275.38464, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 112, "text": "102.01", "bbox": {"l": 465.83099000000004, "t": 270.31946000000005, "r": 482.35013, "b": 275.38464, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 138, "label": "text", "bbox": {"l": 516.01862, "t": 270.31946000000005, "r": 529.53375, "b": 275.38464, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 113, "text": "92.18", "bbox": {"l": 516.01862, "t": 270.31946000000005, "r": 529.53375, "b": 275.38464, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 139, "label": "text", "bbox": {"l": 306.11493, "t": 278.48572, "r": 373.35764, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 114, "text": "Nonvested on December 31", "bbox": {"l": 306.11493, "t": 278.48572, "r": 373.35764, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 140, "label": "text", "bbox": {"l": 396.24661, "t": 278.48572, "r": 403.75531, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 115, "text": "1.0", "bbox": {"l": 396.24661, "t": 278.48572, "r": 403.75531, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 141, "label": "text", "bbox": {"l": 429.51599, "t": 278.48572, "r": 437.02469, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 116, "text": "0.3", "bbox": {"l": 429.51599, "t": 278.48572, "r": 437.02469, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 142, "label": "text", "bbox": {"l": 463.7142, "t": 278.48572, "r": 484.73965000000004, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 117, "text": "104.85 $", "bbox": {"l": 463.7142, "t": 278.48572, "r": 484.73965000000004, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 143, "label": "text", "bbox": {"l": 512.99463, "t": 278.48572, "r": 534.02008, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 118, "text": "$ 104.51", "bbox": {"l": 512.99463, "t": 278.48572, "r": 534.02008, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 6, "label": "caption", "bbox": {"l": 50.112, "t": 320.87735, "r": 545.11377, "b": 365.64987, "coord_origin": "TOPLEFT"}, "confidence": 0.9140303134918213, "cells": [{"id": 119, "text": "Figure 5:", "bbox": {"l": 50.112, "t": 320.87735, "r": 86.864021, "b": 329.78391, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "One of the benefits of TableFormer is that it is language agnostic, as an example, the left part of the illustration", "bbox": {"l": 93.917542, "t": 320.87735, "r": 545.11371, "b": 329.78391, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "demonstrates TableFormer predictions on previously unseen language (Japanese). Additionally, we see that TableFormer is", "bbox": {"l": 50.112, "t": 332.83233999999993, "r": 545.11371, "b": 341.73889, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "robust to variability in style and content, right side of the illustration shows the example of the TableFormer prediction from", "bbox": {"l": 50.112, "t": 344.78732, "r": 545.11377, "b": 353.69388, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "the FinTabNet dataset.", "bbox": {"l": 50.112, "t": 356.74332, "r": 139.79532, "b": 365.64987, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "picture", "bbox": {"l": 216.76925659179688, "t": 380.4906311035156, "r": 375.7829284667969, "b": 443.34698486328125, "coord_origin": "TOPLEFT"}, "confidence": 0.805853009223938, "cells": [{"id": 124, "text": "Red - PDF cells, Green - predicted bounding boxes", "bbox": {"l": 220.26282, "t": 381.77722, "r": 342.07819, "b": 386.44281, "coord_origin": "TOPLEFT"}}], "children": [{"id": 144, "label": "text", "bbox": {"l": 220.26282, "t": 381.77722, "r": 342.07819, "b": 386.44281, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 124, "text": "Red - PDF cells, Green - predicted bounding boxes", "bbox": {"l": 220.26282, "t": 381.77722, "r": 342.07819, "b": 386.44281, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 11, "label": "picture", "bbox": {"l": 51.736167907714844, "t": 380.48065185546875, "r": 211.83778381347656, "b": 443.6580810546875, "coord_origin": "TOPLEFT"}, "confidence": 0.8308426737785339, "cells": [{"id": 125, "text": "Ground Truth", "bbox": {"l": 53.715248, "t": 381.77722, "r": 85.657333, "b": 386.44281, "coord_origin": "TOPLEFT"}}], "children": [{"id": 145, "label": "text", "bbox": {"l": 53.715248, "t": 381.77722, "r": 85.657333, "b": 386.44281, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 125, "text": "Ground Truth", "bbox": {"l": 53.715248, "t": 381.77722, "r": 85.657333, "b": 386.44281, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 13, "label": "picture", "bbox": {"l": 383.1364440917969, "t": 381.2313232421875, "r": 542.1132202148438, "b": 442.7749328613281, "coord_origin": "TOPLEFT"}, "confidence": 0.7881615161895752, "cells": [{"id": 126, "text": "16", "bbox": {"l": 437.37939, "t": 400.55295, "r": 443.69870000000003, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "17", "bbox": {"l": 450.33203, "t": 400.55295, "r": 456.6513100000001, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "18", "bbox": {"l": 463.28464, "t": 400.55295, "r": 469.60394, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "19", "bbox": {"l": 476.23724000000004, "t": 400.55295, "r": 482.5565500000001, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "20", "bbox": {"l": 489.18988, "t": 400.55295, "r": 495.50916, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "21", "bbox": {"l": 502.14251999999993, "t": 400.55295, "r": 508.46178999999995, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "22", "bbox": {"l": 515.09509, "t": 400.55295, "r": 521.41443, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "23", "bbox": {"l": 385.2814, "t": 411.03836000000007, "r": 391.60071, "b": 417.35699, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "24", "bbox": {"l": 398.52341, "t": 411.03836000000007, "r": 404.84271, "b": 417.35699, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "25", "bbox": {"l": 411.47604, "t": 411.03836000000007, "r": 417.79535, "b": 417.35699, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "26", "bbox": {"l": 437.37939, "t": 411.03836000000007, "r": 443.69870000000003, "b": 417.35699, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "27", "bbox": {"l": 450.33203, "t": 411.03836000000007, "r": 456.6513100000001, "b": 417.35699, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "28", "bbox": {"l": 463.28464, "t": 411.03836000000007, "r": 469.60394, "b": 417.35699, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "30", "bbox": {"l": 385.2814, "t": 421.0697, "r": 391.60071, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "31", "bbox": {"l": 398.52341, "t": 421.0697, "r": 404.84271, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "32", "bbox": {"l": 411.47604, "t": 421.0697, "r": 417.79532, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "33", "bbox": {"l": 424.42865, "t": 421.0697, "r": 430.74796, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "34", "bbox": {"l": 437.38129, "t": 421.0697, "r": 443.70056, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "35", "bbox": {"l": 450.33389000000005, "t": 421.0697, "r": 456.65319999999997, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "36", "bbox": {"l": 463.2865, "t": 421.0697, "r": 469.6058, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "37", "bbox": {"l": 476.23914, "t": 421.0697, "r": 482.55841, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "38", "bbox": {"l": 489.1917700000001, "t": 421.0697, "r": 495.51105, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "39", "bbox": {"l": 502.14438, "t": 421.0697, "r": 508.46368, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "40", "bbox": {"l": 515.09705, "t": 421.0697, "r": 521.41632, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "41", "bbox": {"l": 528.04962, "t": 421.0697, "r": 534.3689, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "42", "bbox": {"l": 385.2814, "t": 432.04431, "r": 391.60071, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "43", "bbox": {"l": 398.52341, "t": 432.04431, "r": 404.84271, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "44", "bbox": {"l": 411.47604, "t": 432.04431, "r": 417.79532, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "45", "bbox": {"l": 424.42865, "t": 432.04431, "r": 430.74796, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "46", "bbox": {"l": 437.38129, "t": 432.04431, "r": 443.70056, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "47", "bbox": {"l": 450.33389000000005, "t": 432.04431, "r": 456.65319999999997, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "48", "bbox": {"l": 463.2865, "t": 432.04431, "r": 469.6058, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "49", "bbox": {"l": 476.23914, "t": 432.04431, "r": 482.55841, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "50", "bbox": {"l": 489.1917700000001, "t": 432.04431, "r": 495.51105, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "51", "bbox": {"l": 502.14438, "t": 432.04431, "r": 508.46368, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "52", "bbox": {"l": 515.09705, "t": 432.04431, "r": 521.41632, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "53", "bbox": {"l": 528.04962, "t": 432.04431, "r": 534.3689, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "0", "bbox": {"l": 385.2814, "t": 389.20004, "r": 388.44073, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "1", "bbox": {"l": 398.52341, "t": 389.20004, "r": 401.68274, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "2", "bbox": {"l": 411.4754, "t": 389.20004, "r": 414.63474, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "3", "bbox": {"l": 424.4274, "t": 389.20004, "r": 427.58673, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "4", "bbox": {"l": 437.37939, "t": 389.20004, "r": 440.53870000000006, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "5", "bbox": {"l": 450.33136, "t": 389.20004, "r": 453.49069000000003, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "6", "bbox": {"l": 463.28336, "t": 389.20004, "r": 466.44269, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "7", "bbox": {"l": 476.23535, "t": 389.20004, "r": 479.39468, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "8", "bbox": {"l": 489.18735, "t": 389.20004, "r": 492.34668, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "9", "bbox": {"l": 502.13933999999995, "t": 389.20004, "r": 505.29868000000005, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "10", "bbox": {"l": 515.09131, "t": 389.20004, "r": 521.41064, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "11", "bbox": {"l": 528.04364, "t": 389.20004, "r": 534.13104, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "12", "bbox": {"l": 385.2814, "t": 398.97464, "r": 391.60071, "b": 405.29327, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "13", "bbox": {"l": 398.52341, "t": 398.97464, "r": 404.84271, "b": 405.29327, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "14", "bbox": {"l": 411.47604, "t": 398.97464, "r": 417.79535, "b": 405.29327, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "15", "bbox": {"l": 424.42719, "t": 406.77463000000006, "r": 430.74648999999994, "b": 413.09326, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "29", "bbox": {"l": 502.86941999999993, "t": 410.99438, "r": 509.18871999999993, "b": 417.31302, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "Predicted Structure", "bbox": {"l": 384.35437, "t": 381.77722, "r": 430.99261, "b": 386.44281, "coord_origin": "TOPLEFT"}}], "children": [{"id": 146, "label": "text", "bbox": {"l": 437.37939, "t": 400.55295, "r": 443.69870000000003, "b": 406.87158, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 126, "text": "16", "bbox": {"l": 437.37939, "t": 400.55295, "r": 443.69870000000003, "b": 406.87158, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 147, "label": "text", "bbox": {"l": 450.33203, "t": 400.55295, "r": 456.6513100000001, "b": 406.87158, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 127, "text": "17", "bbox": {"l": 450.33203, "t": 400.55295, "r": 456.6513100000001, "b": 406.87158, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 148, "label": "text", "bbox": {"l": 463.28464, "t": 400.55295, "r": 469.60394, "b": 406.87158, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 128, "text": "18", "bbox": {"l": 463.28464, "t": 400.55295, "r": 469.60394, "b": 406.87158, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 149, "label": "text", "bbox": {"l": 476.23724000000004, "t": 400.55295, "r": 482.5565500000001, "b": 406.87158, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 129, "text": "19", "bbox": {"l": 476.23724000000004, "t": 400.55295, "r": 482.5565500000001, "b": 406.87158, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 150, "label": "text", "bbox": {"l": 489.18988, "t": 400.55295, "r": 495.50916, "b": 406.87158, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 130, "text": "20", "bbox": {"l": 489.18988, "t": 400.55295, "r": 495.50916, "b": 406.87158, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 151, "label": "text", "bbox": {"l": 502.14251999999993, "t": 400.55295, "r": 508.46178999999995, "b": 406.87158, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 131, "text": "21", "bbox": {"l": 502.14251999999993, "t": 400.55295, "r": 508.46178999999995, "b": 406.87158, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 152, "label": "text", "bbox": {"l": 515.09509, "t": 400.55295, "r": 521.41443, "b": 406.87158, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 132, "text": "22", "bbox": {"l": 515.09509, "t": 400.55295, "r": 521.41443, "b": 406.87158, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 153, "label": "text", "bbox": {"l": 385.2814, "t": 411.03836000000007, "r": 391.60071, "b": 417.35699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 133, "text": "23", "bbox": {"l": 385.2814, "t": 411.03836000000007, "r": 391.60071, "b": 417.35699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 154, "label": "text", "bbox": {"l": 398.52341, "t": 411.03836000000007, "r": 404.84271, "b": 417.35699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 134, "text": "24", "bbox": {"l": 398.52341, "t": 411.03836000000007, "r": 404.84271, "b": 417.35699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 155, "label": "text", "bbox": {"l": 411.47604, "t": 411.03836000000007, "r": 417.79535, "b": 417.35699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 135, "text": "25", "bbox": {"l": 411.47604, "t": 411.03836000000007, "r": 417.79535, "b": 417.35699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 156, "label": "text", "bbox": {"l": 437.37939, "t": 411.03836000000007, "r": 443.69870000000003, "b": 417.35699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 136, "text": "26", "bbox": {"l": 437.37939, "t": 411.03836000000007, "r": 443.69870000000003, "b": 417.35699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 157, "label": "text", "bbox": {"l": 450.33203, "t": 411.03836000000007, "r": 456.6513100000001, "b": 417.35699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 137, "text": "27", "bbox": {"l": 450.33203, "t": 411.03836000000007, "r": 456.6513100000001, "b": 417.35699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 158, "label": "text", "bbox": {"l": 463.28464, "t": 411.03836000000007, "r": 469.60394, "b": 417.35699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 138, "text": "28", "bbox": {"l": 463.28464, "t": 411.03836000000007, "r": 469.60394, "b": 417.35699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 159, "label": "text", "bbox": {"l": 385.2814, "t": 421.0697, "r": 391.60071, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 139, "text": "30", "bbox": {"l": 385.2814, "t": 421.0697, "r": 391.60071, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 160, "label": "text", "bbox": {"l": 398.52341, "t": 421.0697, "r": 404.84271, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 140, "text": "31", "bbox": {"l": 398.52341, "t": 421.0697, "r": 404.84271, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 161, "label": "text", "bbox": {"l": 411.47604, "t": 421.0697, "r": 417.79532, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 141, "text": "32", "bbox": {"l": 411.47604, "t": 421.0697, "r": 417.79532, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 162, "label": "text", "bbox": {"l": 424.42865, "t": 421.0697, "r": 430.74796, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 142, "text": "33", "bbox": {"l": 424.42865, "t": 421.0697, "r": 430.74796, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 163, "label": "text", "bbox": {"l": 437.38129, "t": 421.0697, "r": 443.70056, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 143, "text": "34", "bbox": {"l": 437.38129, "t": 421.0697, "r": 443.70056, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 164, "label": "text", "bbox": {"l": 450.33389000000005, "t": 421.0697, "r": 456.65319999999997, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 144, "text": "35", "bbox": {"l": 450.33389000000005, "t": 421.0697, "r": 456.65319999999997, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 165, "label": "text", "bbox": {"l": 463.2865, "t": 421.0697, "r": 469.6058, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 145, "text": "36", "bbox": {"l": 463.2865, "t": 421.0697, "r": 469.6058, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 166, "label": "text", "bbox": {"l": 476.23914, "t": 421.0697, "r": 482.55841, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 146, "text": "37", "bbox": {"l": 476.23914, "t": 421.0697, "r": 482.55841, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 167, "label": "text", "bbox": {"l": 489.1917700000001, "t": 421.0697, "r": 495.51105, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 147, "text": "38", "bbox": {"l": 489.1917700000001, "t": 421.0697, "r": 495.51105, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 168, "label": "text", "bbox": {"l": 502.14438, "t": 421.0697, "r": 508.46368, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 148, "text": "39", "bbox": {"l": 502.14438, "t": 421.0697, "r": 508.46368, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 169, "label": "text", "bbox": {"l": 515.09705, "t": 421.0697, "r": 521.41632, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 149, "text": "40", "bbox": {"l": 515.09705, "t": 421.0697, "r": 521.41632, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 170, "label": "text", "bbox": {"l": 528.04962, "t": 421.0697, "r": 534.3689, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 150, "text": "41", "bbox": {"l": 528.04962, "t": 421.0697, "r": 534.3689, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 171, "label": "text", "bbox": {"l": 385.2814, "t": 432.04431, "r": 391.60071, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 151, "text": "42", "bbox": {"l": 385.2814, "t": 432.04431, "r": 391.60071, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 172, "label": "text", "bbox": {"l": 398.52341, "t": 432.04431, "r": 404.84271, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 152, "text": "43", "bbox": {"l": 398.52341, "t": 432.04431, "r": 404.84271, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 173, "label": "text", "bbox": {"l": 411.47604, "t": 432.04431, "r": 417.79532, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 153, "text": "44", "bbox": {"l": 411.47604, "t": 432.04431, "r": 417.79532, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 174, "label": "text", "bbox": {"l": 424.42865, "t": 432.04431, "r": 430.74796, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 154, "text": "45", "bbox": {"l": 424.42865, "t": 432.04431, "r": 430.74796, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 175, "label": "text", "bbox": {"l": 437.38129, "t": 432.04431, "r": 443.70056, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 155, "text": "46", "bbox": {"l": 437.38129, "t": 432.04431, "r": 443.70056, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 176, "label": "text", "bbox": {"l": 450.33389000000005, "t": 432.04431, "r": 456.65319999999997, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 156, "text": "47", "bbox": {"l": 450.33389000000005, "t": 432.04431, "r": 456.65319999999997, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 177, "label": "text", "bbox": {"l": 463.2865, "t": 432.04431, "r": 469.6058, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 157, "text": "48", "bbox": {"l": 463.2865, "t": 432.04431, "r": 469.6058, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 178, "label": "text", "bbox": {"l": 476.23914, "t": 432.04431, "r": 482.55841, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 158, "text": "49", "bbox": {"l": 476.23914, "t": 432.04431, "r": 482.55841, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 179, "label": "text", "bbox": {"l": 489.1917700000001, "t": 432.04431, "r": 495.51105, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 159, "text": "50", "bbox": {"l": 489.1917700000001, "t": 432.04431, "r": 495.51105, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 180, "label": "text", "bbox": {"l": 502.14438, "t": 432.04431, "r": 508.46368, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 160, "text": "51", "bbox": {"l": 502.14438, "t": 432.04431, "r": 508.46368, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 181, "label": "text", "bbox": {"l": 515.09705, "t": 432.04431, "r": 521.41632, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 161, "text": "52", "bbox": {"l": 515.09705, "t": 432.04431, "r": 521.41632, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 182, "label": "text", "bbox": {"l": 528.04962, "t": 432.04431, "r": 534.3689, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 162, "text": "53", "bbox": {"l": 528.04962, "t": 432.04431, "r": 534.3689, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 183, "label": "text", "bbox": {"l": 385.2814, "t": 389.20004, "r": 388.44073, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 163, "text": "0", "bbox": {"l": 385.2814, "t": 389.20004, "r": 388.44073, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 184, "label": "text", "bbox": {"l": 398.52341, "t": 389.20004, "r": 401.68274, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 164, "text": "1", "bbox": {"l": 398.52341, "t": 389.20004, "r": 401.68274, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 185, "label": "text", "bbox": {"l": 411.4754, "t": 389.20004, "r": 414.63474, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 165, "text": "2", "bbox": {"l": 411.4754, "t": 389.20004, "r": 414.63474, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 186, "label": "text", "bbox": {"l": 424.4274, "t": 389.20004, "r": 427.58673, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 166, "text": "3", "bbox": {"l": 424.4274, "t": 389.20004, "r": 427.58673, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 187, "label": "text", "bbox": {"l": 437.37939, "t": 389.20004, "r": 440.53870000000006, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 167, "text": "4", "bbox": {"l": 437.37939, "t": 389.20004, "r": 440.53870000000006, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 188, "label": "text", "bbox": {"l": 450.33136, "t": 389.20004, "r": 453.49069000000003, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 168, "text": "5", "bbox": {"l": 450.33136, "t": 389.20004, "r": 453.49069000000003, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 189, "label": "text", "bbox": {"l": 463.28336, "t": 389.20004, "r": 466.44269, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 169, "text": "6", "bbox": {"l": 463.28336, "t": 389.20004, "r": 466.44269, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 190, "label": "text", "bbox": {"l": 476.23535, "t": 389.20004, "r": 479.39468, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 170, "text": "7", "bbox": {"l": 476.23535, "t": 389.20004, "r": 479.39468, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 191, "label": "text", "bbox": {"l": 489.18735, "t": 389.20004, "r": 492.34668, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 171, "text": "8", "bbox": {"l": 489.18735, "t": 389.20004, "r": 492.34668, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 192, "label": "text", "bbox": {"l": 502.13933999999995, "t": 389.20004, "r": 505.29868000000005, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 172, "text": "9", "bbox": {"l": 502.13933999999995, "t": 389.20004, "r": 505.29868000000005, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 193, "label": "text", "bbox": {"l": 515.09131, "t": 389.20004, "r": 521.41064, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 173, "text": "10", "bbox": {"l": 515.09131, "t": 389.20004, "r": 521.41064, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 194, "label": "text", "bbox": {"l": 528.04364, "t": 389.20004, "r": 534.13104, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 174, "text": "11", "bbox": {"l": 528.04364, "t": 389.20004, "r": 534.13104, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 195, "label": "text", "bbox": {"l": 385.2814, "t": 398.97464, "r": 391.60071, "b": 405.29327, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 175, "text": "12", "bbox": {"l": 385.2814, "t": 398.97464, "r": 391.60071, "b": 405.29327, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 196, "label": "text", "bbox": {"l": 398.52341, "t": 398.97464, "r": 404.84271, "b": 405.29327, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 176, "text": "13", "bbox": {"l": 398.52341, "t": 398.97464, "r": 404.84271, "b": 405.29327, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 197, "label": "text", "bbox": {"l": 411.47604, "t": 398.97464, "r": 417.79535, "b": 405.29327, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 177, "text": "14", "bbox": {"l": 411.47604, "t": 398.97464, "r": 417.79535, "b": 405.29327, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 198, "label": "text", "bbox": {"l": 424.42719, "t": 406.77463000000006, "r": 430.74648999999994, "b": 413.09326, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 178, "text": "15", "bbox": {"l": 424.42719, "t": 406.77463000000006, "r": 430.74648999999994, "b": 413.09326, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 199, "label": "text", "bbox": {"l": 502.86941999999993, "t": 410.99438, "r": 509.18871999999993, "b": 417.31302, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 179, "text": "29", "bbox": {"l": 502.86941999999993, "t": 410.99438, "r": 509.18871999999993, "b": 417.31302, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 200, "label": "text", "bbox": {"l": 384.35437, "t": 381.77722, "r": 430.99261, "b": 386.44281, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 180, "text": "Predicted Structure", "bbox": {"l": 384.35437, "t": 381.77722, "r": 430.99261, "b": 386.44281, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 5, "label": "caption", "bbox": {"l": 62.595001, "t": 458.72836, "r": 532.63049, "b": 467.63492, "coord_origin": "TOPLEFT"}, "confidence": 0.9153602719306946, "cells": [{"id": 181, "text": "Figure 6: An example of TableFormer predictions (bounding boxes and structure) from generated SynthTabNet table.", "bbox": {"l": 62.595001, "t": 458.72836, "r": 532.63049, "b": 467.63492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "section_header", "bbox": {"l": 50.112, "t": 491.39536, "r": 163.7558, "b": 501.24741, "coord_origin": "TOPLEFT"}, "confidence": 0.9561247229576111, "cells": [{"id": 182, "text": "5.5.", "bbox": {"l": 50.112, "t": 491.39536, "r": 64.448898, "b": 501.24741, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "Qualitative Analysis", "bbox": {"l": 74.006828, "t": 491.39536, "r": 163.7558, "b": 501.24741, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 50.112, "t": 536.87337, "r": 286.36511, "b": 713.1519470000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9852361679077148, "cells": [{"id": 184, "text": "We showcase several visualizations for the different", "bbox": {"l": 62.067001, "t": 536.87337, "r": 286.36499, "b": 545.77992, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": "components of our network on various", "bbox": {"l": 50.112, "t": 548.82837, "r": 211.15741, "b": 557.73492, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "\u201ccomplex\u201d", "bbox": {"l": 215.10000999999997, "t": 548.91803, "r": 259.17453, "b": 557.50578, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "tables", "bbox": {"l": 263.12, "t": 548.82837, "r": 286.36273, "b": 557.73492, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": "within datasets presented in this work in Fig. 5 and Fig. 6", "bbox": {"l": 50.112, "t": 560.78337, "r": 286.36505, "b": 569.68993, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "As it is shown, our model is able to predict bounding boxes", "bbox": {"l": 50.112, "t": 572.73837, "r": 286.36508, "b": 581.6449299999999, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "for all table cells, even for the empty ones. Additionally,", "bbox": {"l": 50.112, "t": 584.69337, "r": 286.36508, "b": 593.59993, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "our post-processing techniques can extract the cell content", "bbox": {"l": 50.112, "t": 596.64937, "r": 286.36505, "b": 605.55592, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": "by matching the predicted bounding boxes to the PDF cells", "bbox": {"l": 50.112, "t": 608.60437, "r": 286.36508, "b": 617.51093, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "based on their overlap and spatial proximity. The left part", "bbox": {"l": 50.112, "t": 620.55937, "r": 286.36508, "b": 629.46593, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "of Fig. 5 demonstrates also the adaptability of our method", "bbox": {"l": 50.112, "t": 632.51437, "r": 286.36508, "b": 641.42093, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "to any language, as it can successfully extract Japanese", "bbox": {"l": 50.112, "t": 644.46938, "r": 286.36508, "b": 653.37593, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "text, although the training set contains only English content.", "bbox": {"l": 50.112, "t": 656.42438, "r": 286.36511, "b": 665.33094, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "We provide more visualizations including the intermediate", "bbox": {"l": 50.112, "t": 668.38037, "r": 286.36508, "b": 677.28694, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "steps in the supplementary material. Overall these illustra-", "bbox": {"l": 50.112, "t": 680.33537, "r": 286.36511, "b": 689.24194, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "tions justify the versatility of our method across a diverse", "bbox": {"l": 50.112, "t": 692.290375, "r": 286.36511, "b": 701.196945, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "range of table appearances and content type.", "bbox": {"l": 50.112, "t": 704.245377, "r": 226.88833999999997, "b": 713.1519470000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "section_header", "bbox": {"l": 308.862, "t": 490.70892, "r": 460.84848, "b": 501.45663, "coord_origin": "TOPLEFT"}, "confidence": 0.9436525702476501, "cells": [{"id": 201, "text": "6.", "bbox": {"l": 308.862, "t": 490.70892, "r": 316.07382, "b": 501.45663, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": "Future Work & Conclusion", "bbox": {"l": 325.68954, "t": 490.70892, "r": 460.84848, "b": 501.45663, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 308.862, "t": 512.89337, "r": 545.11517, "b": 653.30592, "coord_origin": "TOPLEFT"}, "confidence": 0.9875594973564148, "cells": [{"id": 203, "text": "In this paper, we presented TableFormer an end-to-end", "bbox": {"l": 320.81699, "t": 512.89337, "r": 545.11505, "b": 521.79993, "coord_origin": "TOPLEFT"}}, {"id": 204, "text": "transformer based approach to predict table structures and", "bbox": {"l": 308.862, "t": 524.84836, "r": 545.11517, "b": 533.75491, "coord_origin": "TOPLEFT"}}, {"id": 205, "text": "bounding boxes of cells from an image. This approach en-", "bbox": {"l": 308.862, "t": 536.80336, "r": 545.11511, "b": 545.70992, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": "ables us to recreate the table structure, and extract the cell", "bbox": {"l": 308.862, "t": 548.75836, "r": 545.11505, "b": 557.6649199999999, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": "content from PDF or OCR by using bounding boxes. Ad-", "bbox": {"l": 308.862, "t": 560.71336, "r": 545.11517, "b": 569.61992, "coord_origin": "TOPLEFT"}}, {"id": 208, "text": "ditionally, it provides the versatility required in real-world", "bbox": {"l": 308.862, "t": 572.66837, "r": 545.11511, "b": 581.57492, "coord_origin": "TOPLEFT"}}, {"id": 209, "text": "scenarios when dealing with various types of PDF docu-", "bbox": {"l": 308.862, "t": 584.62436, "r": 545.11511, "b": 593.53091, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": "ments, and languages.", "bbox": {"l": 308.862, "t": 596.57936, "r": 400.46808, "b": 605.48592, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "Furthermore, our method outper-", "bbox": {"l": 408.37839, "t": 596.57936, "r": 545.11511, "b": 605.48592, "coord_origin": "TOPLEFT"}}, {"id": 212, "text": "forms all state-of-the-arts with a wide margin. Finally, we", "bbox": {"l": 308.862, "t": 608.53436, "r": 545.11505, "b": 617.44092, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "introduce \u201cSynthTabNet\u201d a challenging synthetically gen-", "bbox": {"l": 308.862, "t": 620.48936, "r": 545.11511, "b": 629.3959199999999, "coord_origin": "TOPLEFT"}}, {"id": 214, "text": "erated dataset that reinforces missing characteristics from", "bbox": {"l": 308.862, "t": 632.4443699999999, "r": 545.11505, "b": 641.35092, "coord_origin": "TOPLEFT"}}, {"id": 215, "text": "other datasets.", "bbox": {"l": 308.862, "t": 644.39937, "r": 365.85803, "b": 653.30592, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "section_header", "bbox": {"l": 308.862, "t": 672.09892, "r": 364.40585, "b": 682.84664, "coord_origin": "TOPLEFT"}, "confidence": 0.9442470073699951, "cells": [{"id": 216, "text": "References", "bbox": {"l": 308.862, "t": 672.09892, "r": 364.40585, "b": 682.84664, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "list_item", "bbox": {"l": 313.345, "t": 693.9617920000001, "r": 545.1134, "b": 712.936752, "coord_origin": "TOPLEFT"}, "confidence": 0.8318753838539124, "cells": [{"id": 217, "text": "[1]", "bbox": {"l": 313.345, "t": 693.9617920000001, "r": 323.80792, "b": 701.977753, "coord_origin": "TOPLEFT"}}, {"id": 218, "text": "Nicolas Carion, Francisco Massa, Gabriel Synnaeve, Nicolas", "bbox": {"l": 326.05127, "t": 693.9617920000001, "r": 545.10852, "b": 701.977753, "coord_origin": "TOPLEFT"}}, {"id": 219, "text": "Usunier, Alexander Kirillov, and Sergey Zagoruyko. End-to-", "bbox": {"l": 328.78101, "t": 704.920792, "r": 545.1134, "b": 712.936752, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "page_footer", "bbox": {"l": 295.121, "t": 734.133366, "r": 300.10229, "b": 743.039928, "coord_origin": "TOPLEFT"}, "confidence": 0.8709858059883118, "cells": [{"id": 220, "text": "8", "bbox": {"l": 295.121, "t": 734.133366, "r": 300.10229, "b": 743.039928, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "picture", "bbox": {"l": 305.5836486816406, "t": 98.65415954589844, "r": 554.8258666992188, "b": 180.6267547607422, "coord_origin": "TOPLEFT"}, "confidence": 0.7699173092842102, "cells": [], "children": []}, {"id": 14, "label": "picture", "bbox": {"l": 49.97503662109375, "t": 103.71266174316406, "r": 301.6335754394531, "b": 187.5789337158203, "coord_origin": "TOPLEFT"}, "confidence": 0.7873926162719727, "cells": [], "children": []}]}, "tablestructure": {"table_map": {"8": {"label": "table", "id": 8, "page_no": 7, "cluster": {"id": 8, "label": "table", "bbox": {"l": 53.62853240966797, "t": 218.94857788085938, "r": 298.5574951171875, "b": 292.39996337890625, "coord_origin": "TOPLEFT"}, "confidence": 0.8824009299278259, "cells": [{"id": 6, "text": "\u8ad6\u6587\u30d5\u30a1\u30a4\u30eb", "bbox": {"l": 209.93285, "t": 222.18073000000004, "r": 241.04458999999997, "b": 226.36212, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "\u53c2\u8003\u6587\u732e", "bbox": {"l": 263.76489, "t": 222.18073000000004, "r": 284.50589, "b": 226.36212, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "\u51fa\u5178", "bbox": {"l": 110.24990999999999, "t": 229.66594999999995, "r": 120.62018, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "\u30d5\u30a1\u30a4\u30eb", "bbox": {"l": 175.36609, "t": 229.66594999999995, "r": 196.1071, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "\u6570", "bbox": {"l": 196.10756, "t": 229.66594999999995, "r": 201.29247, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "\u82f1\u8a9e", "bbox": {"l": 209.62408, "t": 229.66594999999995, "r": 219.99435, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "\u65e5\u672c\u8a9e", "bbox": {"l": 229.19814, "t": 229.66594999999995, "r": 244.75377, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "\u82f1\u8a9e", "bbox": {"l": 256.1142, "t": 229.66594999999995, "r": 266.48447, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "\u65e5\u672c\u8a9e", "bbox": {"l": 278.38434, "t": 229.66594999999995, "r": 293.93997, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Association for Computational Linguistics(ACL2003)", "bbox": {"l": 55.53052099999999, "t": 236.42584, "r": 162.7131, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "65", "bbox": {"l": 184.39731, "t": 236.42584, "r": 189.56456, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "65", "bbox": {"l": 208.99026, "t": 236.42584, "r": 214.15752, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "0", "bbox": {"l": 234.87517, "t": 236.42584, "r": 237.45833000000002, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "150", "bbox": {"l": 256.88446, "t": 236.42584, "r": 264.6358, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "0", "bbox": {"l": 284.06134, "t": 236.42584, "r": 286.6445, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Computational Linguistics(COLING2002)", "bbox": {"l": 55.53052099999999, "t": 242.62048000000004, "r": 139.72253, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "140", "bbox": {"l": 183.10536, "t": 242.62048000000004, "r": 190.8567, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "140", "bbox": {"l": 207.69832, "t": 242.62048000000004, "r": 215.44965999999997, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "0", "bbox": {"l": 234.87517, "t": 242.62048000000004, "r": 237.45833000000002, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "150", "bbox": {"l": 256.88446, "t": 242.62048000000004, "r": 264.6358, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "0", "bbox": {"l": 284.06134, "t": 242.62048000000004, "r": 286.6445, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "\u96fb\u6c17\u60c5\u5831\u901a\u4fe1\u5b66\u4f1a", "bbox": {"l": 55.53052099999999, "t": 249.79845999999998, "r": 97.013, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "2003", "bbox": {"l": 92.698288, "t": 249.58942000000002, "r": 103.03371, "b": 253.94732999999997, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "\u5e74\u7dcf\u5408\u5927\u4f1a", "bbox": {"l": 103.03389, "t": 249.79845999999998, "r": 128.96027, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "150", "bbox": {"l": 183.10536, "t": 248.81506000000002, "r": 190.8567, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "8", "bbox": {"l": 210.28223, "t": 248.81506000000002, "r": 212.86539, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "142", "bbox": {"l": 232.29153, "t": 248.81506000000002, "r": 240.04287999999997, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "223", "bbox": {"l": 256.88446, "t": 248.81506000000002, "r": 264.6358, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "147", "bbox": {"l": 281.47742, "t": 248.81506000000002, "r": 289.22876, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "\u60c5\u5831\u51e6\u7406\u5b66\u4f1a\u7b2c", "bbox": {"l": 55.53052099999999, "t": 257.28369, "r": 91.827637, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "65", "bbox": {"l": 88.052673, "t": 257.07465, "r": 93.219925, "b": 261.43255999999997, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "\u56de\u5168\u56fd\u5927\u4f1a", "bbox": {"l": 93.220474, "t": 257.28369, "r": 119.14685, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "(2003)", "bbox": {"l": 116.45073999999998, "t": 257.07465, "r": 129.88177, "b": 261.43255999999997, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "177", "bbox": {"l": 183.10536, "t": 256.30029, "r": 190.8567, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "1", "bbox": {"l": 210.28223, "t": 256.30029, "r": 212.86539, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "176", "bbox": {"l": 232.29153, "t": 256.30029, "r": 240.04287999999997, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "150", "bbox": {"l": 256.88446, "t": 256.30029, "r": 264.6358, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "236", "bbox": {"l": 281.47742, "t": 256.30029, "r": 289.22876, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "\u7b2c", "bbox": {"l": 55.53052099999999, "t": 264.5108, "r": 60.715424, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "17", "bbox": {"l": 60.17654799999999, "t": 264.30175999999994, "r": 65.343796, "b": 268.65967, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "\u56de\u4eba\u5de5\u77e5\u80fd\u5b66\u4f1a\u5168\u56fd\u5927\u4f1a", "bbox": {"l": 65.344376, "t": 264.5108, "r": 122.38297000000001, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "(2003)", "bbox": {"l": 116.45073999999998, "t": 264.30175999999994, "r": 129.88177, "b": 268.65967, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "208", "bbox": {"l": 183.10536, "t": 263.52739999999994, "r": 190.8567, "b": 267.88531, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "5", "bbox": {"l": 210.28223, "t": 263.52739999999994, "r": 212.86539, "b": 267.88531, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "203", "bbox": {"l": 232.29153, "t": 263.52739999999994, "r": 240.04287999999997, "b": 267.88531, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "152", "bbox": {"l": 256.88446, "t": 263.52739999999994, "r": 264.6358, "b": 267.88531, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "244", "bbox": {"l": 281.47742, "t": 263.52739999999994, "r": 289.22876, "b": 267.88531, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "\u81ea\u7136\u8a00\u8a9e\u51e6\u7406\u7814\u7a76\u4f1a\u7b2c", "bbox": {"l": 55.53052099999999, "t": 271.73785, "r": 107.38374, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "146", "bbox": {"l": 101.99034, "t": 271.52881, "r": 109.74168000000002, "b": 275.88671999999997, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "\u301c", "bbox": {"l": 109.74204, "t": 271.73785, "r": 114.92695000000002, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "155", "bbox": {"l": 114.38793, "t": 271.52881, "r": 122.13927, "b": 275.88671999999997, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "\u56de", "bbox": {"l": 122.13963, "t": 271.73785, "r": 127.32454000000001, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "98", "bbox": {"l": 184.39731, "t": 270.75446, "r": 189.56456, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "2", "bbox": {"l": 210.28223, "t": 270.75446, "r": 212.86539, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "96", "bbox": {"l": 233.58348, "t": 270.75446, "r": 238.75072999999998, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "150", "bbox": {"l": 256.88446, "t": 270.75446, "r": 264.6358, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "232", "bbox": {"l": 281.47742, "t": 270.75446, "r": 289.22876, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "WWW", "bbox": {"l": 55.53052099999999, "t": 279.01392, "r": 68.68605, "b": 283.37183, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "\u304b\u3089\u53ce\u96c6\u3057\u305f\u8ad6\u6587", "bbox": {"l": 68.685814, "t": 279.22295999999994, "r": 110.16829999999999, "b": 283.40436, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "107", "bbox": {"l": 183.10536, "t": 277.98157000000003, "r": 190.8567, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "73", "bbox": {"l": 208.99026, "t": 277.98157000000003, "r": 214.15752, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "34", "bbox": {"l": 233.58348, "t": 277.98157000000003, "r": 238.75072999999998, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "147", "bbox": {"l": 256.88446, "t": 277.98157000000003, "r": 264.6358, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "96", "bbox": {"l": 282.76938, "t": 277.98157000000003, "r": 287.93661, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "\u8a08", "bbox": {"l": 169.61508, "t": 286.45004, "r": 174.79999, "b": 290.63141, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "945", "bbox": {"l": 183.10536, "t": 285.46667, "r": 190.8567, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "294", "bbox": {"l": 207.69832, "t": 285.46667, "r": 215.44965999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "651", "bbox": {"l": 232.29153, "t": 285.46667, "r": 240.04287999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "1122", "bbox": {"l": 255.76506, "t": 285.46667, "r": 265.75204, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "955", "bbox": {"l": 281.47742, "t": 285.46667, "r": 289.22876, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}], "children": [{"id": 32, "label": "text", "bbox": {"l": 209.93285, "t": 222.18073000000004, "r": 241.04458999999997, "b": 226.36212, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": "\u8ad6\u6587\u30d5\u30a1\u30a4\u30eb", "bbox": {"l": 209.93285, "t": 222.18073000000004, "r": 241.04458999999997, "b": 226.36212, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 263.76489, "t": 222.18073000000004, "r": 284.50589, "b": 226.36212, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "\u53c2\u8003\u6587\u732e", "bbox": {"l": 263.76489, "t": 222.18073000000004, "r": 284.50589, "b": 226.36212, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 110.24990999999999, "t": 229.66594999999995, "r": 120.62018, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "\u51fa\u5178", "bbox": {"l": 110.24990999999999, "t": 229.66594999999995, "r": 120.62018, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 175.36609, "t": 229.66594999999995, "r": 196.1071, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "\u30d5\u30a1\u30a4\u30eb", "bbox": {"l": 175.36609, "t": 229.66594999999995, "r": 196.1071, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 196.10756, "t": 229.66594999999995, "r": 201.29247, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "\u6570", "bbox": {"l": 196.10756, "t": 229.66594999999995, "r": 201.29247, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 209.62408, "t": 229.66594999999995, "r": 219.99435, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "\u82f1\u8a9e", "bbox": {"l": 209.62408, "t": 229.66594999999995, "r": 219.99435, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 229.19814, "t": 229.66594999999995, "r": 244.75377, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "\u65e5\u672c\u8a9e", "bbox": {"l": 229.19814, "t": 229.66594999999995, "r": 244.75377, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 256.1142, "t": 229.66594999999995, "r": 266.48447, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "\u82f1\u8a9e", "bbox": {"l": 256.1142, "t": 229.66594999999995, "r": 266.48447, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 278.38434, "t": 229.66594999999995, "r": 293.93997, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "\u65e5\u672c\u8a9e", "bbox": {"l": 278.38434, "t": 229.66594999999995, "r": 293.93997, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 55.53052099999999, "t": 236.42584, "r": 162.7131, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "Association for Computational Linguistics(ACL2003)", "bbox": {"l": 55.53052099999999, "t": 236.42584, "r": 162.7131, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 184.39731, "t": 236.42584, "r": 189.56456, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "65", "bbox": {"l": 184.39731, "t": 236.42584, "r": 189.56456, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 208.99026, "t": 236.42584, "r": 214.15752, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "65", "bbox": {"l": 208.99026, "t": 236.42584, "r": 214.15752, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 234.87517, "t": 236.42584, "r": 237.45833000000002, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "0", "bbox": {"l": 234.87517, "t": 236.42584, "r": 237.45833000000002, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 256.88446, "t": 236.42584, "r": 264.6358, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "150", "bbox": {"l": 256.88446, "t": 236.42584, "r": 264.6358, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 284.06134, "t": 236.42584, "r": 286.6445, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "0", "bbox": {"l": 284.06134, "t": 236.42584, "r": 286.6445, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 55.53052099999999, "t": 242.62048000000004, "r": 139.72253, "b": 246.97839, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "Computational Linguistics(COLING2002)", "bbox": {"l": 55.53052099999999, "t": 242.62048000000004, "r": 139.72253, "b": 246.97839, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 183.10536, "t": 242.62048000000004, "r": 190.8567, "b": 246.97839, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "140", "bbox": {"l": 183.10536, "t": 242.62048000000004, "r": 190.8567, "b": 246.97839, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 207.69832, "t": 242.62048000000004, "r": 215.44965999999997, "b": 246.97839, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "140", "bbox": {"l": 207.69832, "t": 242.62048000000004, "r": 215.44965999999997, "b": 246.97839, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 234.87517, "t": 242.62048000000004, "r": 237.45833000000002, "b": 246.97839, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "0", "bbox": {"l": 234.87517, "t": 242.62048000000004, "r": 237.45833000000002, "b": 246.97839, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 256.88446, "t": 242.62048000000004, "r": 264.6358, "b": 246.97839, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "150", "bbox": {"l": 256.88446, "t": 242.62048000000004, "r": 264.6358, "b": 246.97839, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 284.06134, "t": 242.62048000000004, "r": 286.6445, "b": 246.97839, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "0", "bbox": {"l": 284.06134, "t": 242.62048000000004, "r": 286.6445, "b": 246.97839, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 55.53052099999999, "t": 249.79845999999998, "r": 97.013, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "\u96fb\u6c17\u60c5\u5831\u901a\u4fe1\u5b66\u4f1a", "bbox": {"l": 55.53052099999999, "t": 249.79845999999998, "r": 97.013, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 92.698288, "t": 249.58942000000002, "r": 103.03371, "b": 253.94732999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "2003", "bbox": {"l": 92.698288, "t": 249.58942000000002, "r": 103.03371, "b": 253.94732999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 103.03389, "t": 249.79845999999998, "r": 128.96027, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "\u5e74\u7dcf\u5408\u5927\u4f1a", "bbox": {"l": 103.03389, "t": 249.79845999999998, "r": 128.96027, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 183.10536, "t": 248.81506000000002, "r": 190.8567, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "150", "bbox": {"l": 183.10536, "t": 248.81506000000002, "r": 190.8567, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 210.28223, "t": 248.81506000000002, "r": 212.86539, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "8", "bbox": {"l": 210.28223, "t": 248.81506000000002, "r": 212.86539, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 232.29153, "t": 248.81506000000002, "r": 240.04287999999997, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "142", "bbox": {"l": 232.29153, "t": 248.81506000000002, "r": 240.04287999999997, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 256.88446, "t": 248.81506000000002, "r": 264.6358, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "223", "bbox": {"l": 256.88446, "t": 248.81506000000002, "r": 264.6358, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 281.47742, "t": 248.81506000000002, "r": 289.22876, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "147", "bbox": {"l": 281.47742, "t": 248.81506000000002, "r": 289.22876, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 55.53052099999999, "t": 257.28369, "r": 91.827637, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "\u60c5\u5831\u51e6\u7406\u5b66\u4f1a\u7b2c", "bbox": {"l": 55.53052099999999, "t": 257.28369, "r": 91.827637, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 88.052673, "t": 257.07465, "r": 93.219925, "b": 261.43255999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "65", "bbox": {"l": 88.052673, "t": 257.07465, "r": 93.219925, "b": 261.43255999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 93.220474, "t": 257.28369, "r": 119.14685, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "\u56de\u5168\u56fd\u5927\u4f1a", "bbox": {"l": 93.220474, "t": 257.28369, "r": 119.14685, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 116.45073999999998, "t": 257.07465, "r": 129.88177, "b": 261.43255999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "(2003)", "bbox": {"l": 116.45073999999998, "t": 257.07465, "r": 129.88177, "b": 261.43255999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 183.10536, "t": 256.30029, "r": 190.8567, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "177", "bbox": {"l": 183.10536, "t": 256.30029, "r": 190.8567, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 210.28223, "t": 256.30029, "r": 212.86539, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "1", "bbox": {"l": 210.28223, "t": 256.30029, "r": 212.86539, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 232.29153, "t": 256.30029, "r": 240.04287999999997, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "176", "bbox": {"l": 232.29153, "t": 256.30029, "r": 240.04287999999997, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 256.88446, "t": 256.30029, "r": 264.6358, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "150", "bbox": {"l": 256.88446, "t": 256.30029, "r": 264.6358, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 281.47742, "t": 256.30029, "r": 289.22876, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "236", "bbox": {"l": 281.47742, "t": 256.30029, "r": 289.22876, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 55.53052099999999, "t": 264.5108, "r": 60.715424, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "\u7b2c", "bbox": {"l": 55.53052099999999, "t": 264.5108, "r": 60.715424, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 60.17654799999999, "t": 264.30175999999994, "r": 65.343796, "b": 268.65967, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "17", "bbox": {"l": 60.17654799999999, "t": 264.30175999999994, "r": 65.343796, "b": 268.65967, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 65.344376, "t": 264.5108, "r": 122.38297000000001, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "\u56de\u4eba\u5de5\u77e5\u80fd\u5b66\u4f1a\u5168\u56fd\u5927\u4f1a", "bbox": {"l": 65.344376, "t": 264.5108, "r": 122.38297000000001, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 116.45073999999998, "t": 264.30175999999994, "r": 129.88177, "b": 268.65967, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "(2003)", "bbox": {"l": 116.45073999999998, "t": 264.30175999999994, "r": 129.88177, "b": 268.65967, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 183.10536, "t": 263.52739999999994, "r": 190.8567, "b": 267.88531, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "208", "bbox": {"l": 183.10536, "t": 263.52739999999994, "r": 190.8567, "b": 267.88531, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 210.28223, "t": 263.52739999999994, "r": 212.86539, "b": 267.88531, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "5", "bbox": {"l": 210.28223, "t": 263.52739999999994, "r": 212.86539, "b": 267.88531, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 232.29153, "t": 263.52739999999994, "r": 240.04287999999997, "b": 267.88531, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "203", "bbox": {"l": 232.29153, "t": 263.52739999999994, "r": 240.04287999999997, "b": 267.88531, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 256.88446, "t": 263.52739999999994, "r": 264.6358, "b": 267.88531, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "152", "bbox": {"l": 256.88446, "t": 263.52739999999994, "r": 264.6358, "b": 267.88531, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 281.47742, "t": 263.52739999999994, "r": 289.22876, "b": 267.88531, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "244", "bbox": {"l": 281.47742, "t": 263.52739999999994, "r": 289.22876, "b": 267.88531, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 55.53052099999999, "t": 271.73785, "r": 107.38374, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "\u81ea\u7136\u8a00\u8a9e\u51e6\u7406\u7814\u7a76\u4f1a\u7b2c", "bbox": {"l": 55.53052099999999, "t": 271.73785, "r": 107.38374, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 101.99034, "t": 271.52881, "r": 109.74168000000002, "b": 275.88671999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "146", "bbox": {"l": 101.99034, "t": 271.52881, "r": 109.74168000000002, "b": 275.88671999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 109.74204, "t": 271.73785, "r": 114.92695000000002, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "\u301c", "bbox": {"l": 109.74204, "t": 271.73785, "r": 114.92695000000002, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 114.38793, "t": 271.52881, "r": 122.13927, "b": 275.88671999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "155", "bbox": {"l": 114.38793, "t": 271.52881, "r": 122.13927, "b": 275.88671999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 122.13963, "t": 271.73785, "r": 127.32454000000001, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "\u56de", "bbox": {"l": 122.13963, "t": 271.73785, "r": 127.32454000000001, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 184.39731, "t": 270.75446, "r": 189.56456, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "98", "bbox": {"l": 184.39731, "t": 270.75446, "r": 189.56456, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 210.28223, "t": 270.75446, "r": 212.86539, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "2", "bbox": {"l": 210.28223, "t": 270.75446, "r": 212.86539, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 233.58348, "t": 270.75446, "r": 238.75072999999998, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "96", "bbox": {"l": 233.58348, "t": 270.75446, "r": 238.75072999999998, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 256.88446, "t": 270.75446, "r": 264.6358, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "150", "bbox": {"l": 256.88446, "t": 270.75446, "r": 264.6358, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 281.47742, "t": 270.75446, "r": 289.22876, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "232", "bbox": {"l": 281.47742, "t": 270.75446, "r": 289.22876, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 55.53052099999999, "t": 279.01392, "r": 68.68605, "b": 283.37183, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "WWW", "bbox": {"l": 55.53052099999999, "t": 279.01392, "r": 68.68605, "b": 283.37183, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 68.685814, "t": 279.22295999999994, "r": 110.16829999999999, "b": 283.40436, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "\u304b\u3089\u53ce\u96c6\u3057\u305f\u8ad6\u6587", "bbox": {"l": 68.685814, "t": 279.22295999999994, "r": 110.16829999999999, "b": 283.40436, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 183.10536, "t": 277.98157000000003, "r": 190.8567, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "107", "bbox": {"l": 183.10536, "t": 277.98157000000003, "r": 190.8567, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 208.99026, "t": 277.98157000000003, "r": 214.15752, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "73", "bbox": {"l": 208.99026, "t": 277.98157000000003, "r": 214.15752, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 233.58348, "t": 277.98157000000003, "r": 238.75072999999998, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "34", "bbox": {"l": 233.58348, "t": 277.98157000000003, "r": 238.75072999999998, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 256.88446, "t": 277.98157000000003, "r": 264.6358, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "147", "bbox": {"l": 256.88446, "t": 277.98157000000003, "r": 264.6358, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 282.76938, "t": 277.98157000000003, "r": 287.93661, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "96", "bbox": {"l": 282.76938, "t": 277.98157000000003, "r": 287.93661, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 169.61508, "t": 286.45004, "r": 174.79999, "b": 290.63141, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "\u8a08", "bbox": {"l": 169.61508, "t": 286.45004, "r": 174.79999, "b": 290.63141, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 183.10536, "t": 285.46667, "r": 190.8567, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "945", "bbox": {"l": 183.10536, "t": 285.46667, "r": 190.8567, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 207.69832, "t": 285.46667, "r": 215.44965999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "294", "bbox": {"l": 207.69832, "t": 285.46667, "r": 215.44965999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 232.29153, "t": 285.46667, "r": 240.04287999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "651", "bbox": {"l": 232.29153, "t": 285.46667, "r": 240.04287999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 255.76506, "t": 285.46667, "r": 265.75204, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "1122", "bbox": {"l": 255.76506, "t": 285.46667, "r": 265.75204, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 281.47742, "t": 285.46667, "r": 289.22876, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "955", "bbox": {"l": 281.47742, "t": 285.46667, "r": 289.22876, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "lcel", "ched", "lcel", "nl", "ched", "ched", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 10, "num_cols": 6, "table_cells": [{"bbox": {"l": 209.93285, "t": 222.18073000000004, "r": 241.04458999999997, "b": 226.36212, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 4, "text": "\u8ad6\u6587\u30d5\u30a1\u30a4\u30eb", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 263.76489, "t": 222.18073000000004, "r": 284.50589, "b": 226.36212, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 4, "end_col_offset_idx": 6, "text": "\u53c2\u8003\u6587\u732e", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 110.24990999999999, "t": 229.66594999999995, "r": 120.62018, "b": 233.84735, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "\u51fa\u5178", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 175.36609, "t": 229.66594999999995, "r": 201.29247, "b": 233.84735, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "\u30d5\u30a1\u30a4\u30eb \u6570", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 209.62408, "t": 229.66594999999995, "r": 219.99435, "b": 233.84735, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "\u82f1\u8a9e", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 229.19814, "t": 229.66594999999995, "r": 244.75377, "b": 233.84735, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "\u65e5\u672c\u8a9e", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 256.1142, "t": 229.66594999999995, "r": 266.48447, "b": 233.84735, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "\u82f1\u8a9e", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 278.38434, "t": 229.66594999999995, "r": 293.93997, "b": 233.84735, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "\u65e5\u672c\u8a9e", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 55.53052099999999, "t": 236.42584, "r": 162.7131, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Association for Computational Linguistics(ACL2003)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 184.39731, "t": 236.42584, "r": 189.56456, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "65", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 208.99026, "t": 236.42584, "r": 214.15752, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "65", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 234.87517, "t": 236.42584, "r": 237.45833000000002, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446, "t": 236.42584, "r": 264.6358, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "150", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 284.06134, "t": 236.42584, "r": 286.6445, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 55.53052099999999, "t": 242.62048000000004, "r": 139.72253, "b": 246.97839, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Computational Linguistics(COLING2002)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 183.10536, "t": 242.62048000000004, "r": 190.8567, "b": 246.97839, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "140", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 207.69832, "t": 242.62048000000004, "r": 215.44965999999997, "b": 246.97839, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "140", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 234.87517, "t": 242.62048000000004, "r": 237.45833000000002, "b": 246.97839, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446, "t": 242.62048000000004, "r": 264.6358, "b": 246.97839, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "150", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 284.06134, "t": 242.62048000000004, "r": 286.6445, "b": 246.97839, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 55.53052099999999, "t": 249.58942000000002, "r": 128.96027, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "\u96fb\u6c17\u60c5\u5831\u901a\u4fe1\u5b66\u4f1a 2003 \u5e74\u7dcf\u5408\u5927\u4f1a", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 183.10536, "t": 248.81506000000002, "r": 190.8567, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "150", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 210.28223, "t": 248.81506000000002, "r": 212.86539, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.29153, "t": 248.81506000000002, "r": 240.04287999999997, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "142", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446, "t": 248.81506000000002, "r": 264.6358, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "223", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.47742, "t": 248.81506000000002, "r": 289.22876, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "147", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 55.53052099999999, "t": 257.07465, "r": 129.88177, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "\u60c5\u5831\u51e6\u7406\u5b66\u4f1a\u7b2c 65 \u56de\u5168\u56fd\u5927\u4f1a (2003)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 183.10536, "t": 256.30029, "r": 190.8567, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "177", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 210.28223, "t": 256.30029, "r": 212.86539, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.29153, "t": 256.30029, "r": 240.04287999999997, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "176", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446, "t": 256.30029, "r": 264.6358, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "150", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.47742, "t": 256.30029, "r": 289.22876, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "236", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 55.53052099999999, "t": 264.30175999999994, "r": 129.88177, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "\u7b2c 17 \u56de\u4eba\u5de5\u77e5\u80fd\u5b66\u4f1a\u5168\u56fd\u5927\u4f1a (2003)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 183.10536, "t": 263.52739999999994, "r": 190.8567, "b": 267.88531, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "208", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 210.28223, "t": 263.52739999999994, "r": 212.86539, "b": 267.88531, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.29153, "t": 263.52739999999994, "r": 240.04287999999997, "b": 267.88531, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "203", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446, "t": 263.52739999999994, "r": 264.6358, "b": 267.88531, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "152", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.47742, "t": 263.52739999999994, "r": 289.22876, "b": 267.88531, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "244", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 55.53052099999999, "t": 271.52881, "r": 127.32454000000001, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "\u81ea\u7136\u8a00\u8a9e\u51e6\u7406\u7814\u7a76\u4f1a\u7b2c 146 \u301c 155 \u56de", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 184.39731, "t": 270.75446, "r": 189.56456, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "98", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 210.28223, "t": 270.75446, "r": 212.86539, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 233.58348, "t": 270.75446, "r": 238.75072999999998, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446, "t": 270.75446, "r": 264.6358, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "150", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.47742, "t": 270.75446, "r": 289.22876, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "232", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 55.53052099999999, "t": 279.01392, "r": 110.16829999999999, "b": 283.40436, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "WWW \u304b\u3089\u53ce\u96c6\u3057\u305f\u8ad6\u6587", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 183.10536, "t": 277.98157000000003, "r": 190.8567, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "107", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 208.99026, "t": 277.98157000000003, "r": 214.15752, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "73", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 233.58348, "t": 277.98157000000003, "r": 238.75072999999998, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "34", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446, "t": 277.98157000000003, "r": 264.6358, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "147", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 282.76938, "t": 277.98157000000003, "r": 287.93661, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 183.10536, "t": 285.46667, "r": 190.8567, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "945", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 207.69832, "t": 285.46667, "r": 215.44965999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "294", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.29153, "t": 285.46667, "r": 240.04287999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "651", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 255.76506, "t": 285.46667, "r": 265.75204, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "1122", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.47742, "t": 285.46667, "r": 289.22876, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "955", "column_header": false, "row_header": false, "row_section": false}]}, "7": {"label": "table", "id": 7, "page_no": 7, "cluster": {"id": 7, "label": "table", "bbox": {"l": 304.9219970703125, "t": 218.51486206054688, "r": 550.2321166992188, "b": 287.90069580078125, "coord_origin": "TOPLEFT"}, "confidence": 0.8899767994880676, "cells": [{"id": 77, "text": "Weighted Average Grant Date Fair", "bbox": {"l": 459.04861, "t": 221.62415, "r": 542.00018, "b": 226.68933000000004, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "Value", "bbox": {"l": 493.82193, "t": 227.83416999999997, "r": 507.2258, "b": 232.89935000000003, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "RS", "bbox": {"l": 393.2442, "t": 236.74712999999997, "r": 400.74588, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "U", "bbox": {"l": 400.74643, "t": 236.74712999999997, "r": 404.64523, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "s", "bbox": {"l": 404.6463, "t": 236.74712999999997, "r": 407.34631, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "Shares (in millions)", "bbox": {"l": 392.09671, "t": 221.57446000000004, "r": 438.0145, "b": 226.63964999999996, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "PSUs", "bbox": {"l": 427.18323, "t": 236.74712999999997, "r": 440.98778999999996, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "RSUs", "bbox": {"l": 468.38254, "t": 236.74712999999997, "r": 482.48465000000004, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "PSUs", "bbox": {"l": 516.92578, "t": 236.74712999999997, "r": 530.73035, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Nonvested on Janua", "bbox": {"l": 306.11493, "t": 244.61084000000005, "r": 355.6532, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "ry 1", "bbox": {"l": 355.65427, "t": 244.61084000000005, "r": 364.65607, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "1.", "bbox": {"l": 396.24661, "t": 244.91327, "r": 400.75238, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "1", "bbox": {"l": 400.7529, "t": 244.91327, "r": 403.75531, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "0.3", "bbox": {"l": 429.81838999999997, "t": 244.91327, "r": 437.32708999999994, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "90.10", "bbox": {"l": 465.52859, "t": 244.91327, "r": 478.40103, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "$", "bbox": {"l": 480.97552, "t": 244.91327, "r": 483.55001999999996, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "$ 91.19", "bbox": {"l": 513.44824, "t": 244.91327, "r": 531.46967, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "Granted", "bbox": {"l": 306.11493, "t": 253.68451000000005, "r": 325.62674, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "0.", "bbox": {"l": 396.24661, "t": 253.68451000000005, "r": 400.75238, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "5", "bbox": {"l": 400.7529, "t": 253.68451000000005, "r": 403.75531, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "0.1", "bbox": {"l": 429.81838999999997, "t": 253.68451000000005, "r": 437.32708999999994, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "117.44", "bbox": {"l": 466.43579000000005, "t": 253.68451000000005, "r": 482.54831, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "122.41", "bbox": {"l": 514.29065, "t": 253.68451000000005, "r": 530.80981, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "Vested", "bbox": {"l": 306.11493, "t": 261.54822, "r": 322.62866, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "(0.", "bbox": {"l": 394.43222, "t": 261.54822, "r": 400.73563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "5", "bbox": {"l": 400.73456, "t": 261.54822, "r": 403.73697, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": ")", "bbox": {"l": 403.73804, "t": 261.54822, "r": 405.53625, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "(0.1)", "bbox": {"l": 427.7016, "t": 261.54822, "r": 438.80563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "87.08", "bbox": {"l": 468.55533, "t": 261.54822, "r": 482.07043, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "81.14", "bbox": {"l": 516.01862, "t": 261.54822, "r": 529.53375, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "Canceled or forfeited", "bbox": {"l": 306.11493, "t": 269.64148, "r": 356.24771, "b": 274.70667000000003, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "(0.", "bbox": {"l": 394.43222, "t": 270.31946000000005, "r": 400.73563, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "1", "bbox": {"l": 400.73456, "t": 270.31946000000005, "r": 403.73697, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": ")", "bbox": {"l": 403.73804, "t": 270.31946000000005, "r": 405.53625, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "-", "bbox": {"l": 431.02802, "t": 270.31946000000005, "r": 436.4280099999999, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "102.01", "bbox": {"l": 465.83099000000004, "t": 270.31946000000005, "r": 482.35013, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "92.18", "bbox": {"l": 516.01862, "t": 270.31946000000005, "r": 529.53375, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "Nonvested on December 31", "bbox": {"l": 306.11493, "t": 278.48572, "r": 373.35764, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "1.0", "bbox": {"l": 396.24661, "t": 278.48572, "r": 403.75531, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "0.3", "bbox": {"l": 429.51599, "t": 278.48572, "r": 437.02469, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "104.85 $", "bbox": {"l": 463.7142, "t": 278.48572, "r": 484.73965000000004, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "$ 104.51", "bbox": {"l": 512.99463, "t": 278.48572, "r": 534.02008, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}], "children": [{"id": 102, "label": "text", "bbox": {"l": 459.04861, "t": 221.62415, "r": 542.00018, "b": 226.68933000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "Weighted Average Grant Date Fair", "bbox": {"l": 459.04861, "t": 221.62415, "r": 542.00018, "b": 226.68933000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 493.82193, "t": 227.83416999999997, "r": 507.2258, "b": 232.89935000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "Value", "bbox": {"l": 493.82193, "t": 227.83416999999997, "r": 507.2258, "b": 232.89935000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 393.2442, "t": 236.74712999999997, "r": 400.74588, "b": 241.81232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "RS", "bbox": {"l": 393.2442, "t": 236.74712999999997, "r": 400.74588, "b": 241.81232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 400.74643, "t": 236.74712999999997, "r": 404.64523, "b": 241.81232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "U", "bbox": {"l": 400.74643, "t": 236.74712999999997, "r": 404.64523, "b": 241.81232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 404.6463, "t": 236.74712999999997, "r": 407.34631, "b": 241.81232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "s", "bbox": {"l": 404.6463, "t": 236.74712999999997, "r": 407.34631, "b": 241.81232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 392.09671, "t": 221.57446000000004, "r": 438.0145, "b": 226.63964999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "Shares (in millions)", "bbox": {"l": 392.09671, "t": 221.57446000000004, "r": 438.0145, "b": 226.63964999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 427.18323, "t": 236.74712999999997, "r": 440.98778999999996, "b": 241.81232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "PSUs", "bbox": {"l": 427.18323, "t": 236.74712999999997, "r": 440.98778999999996, "b": 241.81232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 468.38254, "t": 236.74712999999997, "r": 482.48465000000004, "b": 241.81232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "RSUs", "bbox": {"l": 468.38254, "t": 236.74712999999997, "r": 482.48465000000004, "b": 241.81232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 516.92578, "t": 236.74712999999997, "r": 530.73035, "b": 241.81232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "PSUs", "bbox": {"l": 516.92578, "t": 236.74712999999997, "r": 530.73035, "b": 241.81232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 306.11493, "t": 244.61084000000005, "r": 355.6532, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "Nonvested on Janua", "bbox": {"l": 306.11493, "t": 244.61084000000005, "r": 355.6532, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 355.65427, "t": 244.61084000000005, "r": 364.65607, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "ry 1", "bbox": {"l": 355.65427, "t": 244.61084000000005, "r": 364.65607, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 396.24661, "t": 244.91327, "r": 400.75238, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "1.", "bbox": {"l": 396.24661, "t": 244.91327, "r": 400.75238, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 114, "label": "text", "bbox": {"l": 400.7529, "t": 244.91327, "r": 403.75531, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "1", "bbox": {"l": 400.7529, "t": 244.91327, "r": 403.75531, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 115, "label": "text", "bbox": {"l": 429.81838999999997, "t": 244.91327, "r": 437.32708999999994, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "0.3", "bbox": {"l": 429.81838999999997, "t": 244.91327, "r": 437.32708999999994, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 116, "label": "text", "bbox": {"l": 465.52859, "t": 244.91327, "r": 478.40103, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "90.10", "bbox": {"l": 465.52859, "t": 244.91327, "r": 478.40103, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 117, "label": "text", "bbox": {"l": 480.97552, "t": 244.91327, "r": 483.55001999999996, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "$", "bbox": {"l": 480.97552, "t": 244.91327, "r": 483.55001999999996, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 118, "label": "text", "bbox": {"l": 513.44824, "t": 244.91327, "r": 531.46967, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "$ 91.19", "bbox": {"l": 513.44824, "t": 244.91327, "r": 531.46967, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 119, "label": "text", "bbox": {"l": 306.11493, "t": 253.68451000000005, "r": 325.62674, "b": 258.74969, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "Granted", "bbox": {"l": 306.11493, "t": 253.68451000000005, "r": 325.62674, "b": 258.74969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 120, "label": "text", "bbox": {"l": 396.24661, "t": 253.68451000000005, "r": 400.75238, "b": 258.74969, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "0.", "bbox": {"l": 396.24661, "t": 253.68451000000005, "r": 400.75238, "b": 258.74969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 121, "label": "text", "bbox": {"l": 400.7529, "t": 253.68451000000005, "r": 403.75531, "b": 258.74969, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "5", "bbox": {"l": 400.7529, "t": 253.68451000000005, "r": 403.75531, "b": 258.74969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 122, "label": "text", "bbox": {"l": 429.81838999999997, "t": 253.68451000000005, "r": 437.32708999999994, "b": 258.74969, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "0.1", "bbox": {"l": 429.81838999999997, "t": 253.68451000000005, "r": 437.32708999999994, "b": 258.74969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 123, "label": "text", "bbox": {"l": 466.43579000000005, "t": 253.68451000000005, "r": 482.54831, "b": 258.74969, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "117.44", "bbox": {"l": 466.43579000000005, "t": 253.68451000000005, "r": 482.54831, "b": 258.74969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 124, "label": "text", "bbox": {"l": 514.29065, "t": 253.68451000000005, "r": 530.80981, "b": 258.74969, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "122.41", "bbox": {"l": 514.29065, "t": 253.68451000000005, "r": 530.80981, "b": 258.74969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 125, "label": "text", "bbox": {"l": 306.11493, "t": 261.54822, "r": 322.62866, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "Vested", "bbox": {"l": 306.11493, "t": 261.54822, "r": 322.62866, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 126, "label": "text", "bbox": {"l": 394.43222, "t": 261.54822, "r": 400.73563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "(0.", "bbox": {"l": 394.43222, "t": 261.54822, "r": 400.73563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 127, "label": "text", "bbox": {"l": 400.73456, "t": 261.54822, "r": 403.73697, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "5", "bbox": {"l": 400.73456, "t": 261.54822, "r": 403.73697, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 128, "label": "text", "bbox": {"l": 403.73804, "t": 261.54822, "r": 405.53625, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": ")", "bbox": {"l": 403.73804, "t": 261.54822, "r": 405.53625, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 129, "label": "text", "bbox": {"l": 427.7016, "t": 261.54822, "r": 438.80563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "(0.1)", "bbox": {"l": 427.7016, "t": 261.54822, "r": 438.80563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 130, "label": "text", "bbox": {"l": 468.55533, "t": 261.54822, "r": 482.07043, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "87.08", "bbox": {"l": 468.55533, "t": 261.54822, "r": 482.07043, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 131, "label": "text", "bbox": {"l": 516.01862, "t": 261.54822, "r": 529.53375, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": "81.14", "bbox": {"l": 516.01862, "t": 261.54822, "r": 529.53375, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 132, "label": "text", "bbox": {"l": 306.11493, "t": 269.64148, "r": 356.24771, "b": 274.70667000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 107, "text": "Canceled or forfeited", "bbox": {"l": 306.11493, "t": 269.64148, "r": 356.24771, "b": 274.70667000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 133, "label": "text", "bbox": {"l": 394.43222, "t": 270.31946000000005, "r": 400.73563, "b": 275.38464, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 108, "text": "(0.", "bbox": {"l": 394.43222, "t": 270.31946000000005, "r": 400.73563, "b": 275.38464, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 134, "label": "text", "bbox": {"l": 400.73456, "t": 270.31946000000005, "r": 403.73697, "b": 275.38464, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 109, "text": "1", "bbox": {"l": 400.73456, "t": 270.31946000000005, "r": 403.73697, "b": 275.38464, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 135, "label": "text", "bbox": {"l": 403.73804, "t": 270.31946000000005, "r": 405.53625, "b": 275.38464, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 110, "text": ")", "bbox": {"l": 403.73804, "t": 270.31946000000005, "r": 405.53625, "b": 275.38464, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 136, "label": "text", "bbox": {"l": 431.02802, "t": 270.31946000000005, "r": 436.4280099999999, "b": 275.38464, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 111, "text": "-", "bbox": {"l": 431.02802, "t": 270.31946000000005, "r": 436.4280099999999, "b": 275.38464, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 137, "label": "text", "bbox": {"l": 465.83099000000004, "t": 270.31946000000005, "r": 482.35013, "b": 275.38464, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 112, "text": "102.01", "bbox": {"l": 465.83099000000004, "t": 270.31946000000005, "r": 482.35013, "b": 275.38464, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 138, "label": "text", "bbox": {"l": 516.01862, "t": 270.31946000000005, "r": 529.53375, "b": 275.38464, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 113, "text": "92.18", "bbox": {"l": 516.01862, "t": 270.31946000000005, "r": 529.53375, "b": 275.38464, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 139, "label": "text", "bbox": {"l": 306.11493, "t": 278.48572, "r": 373.35764, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 114, "text": "Nonvested on December 31", "bbox": {"l": 306.11493, "t": 278.48572, "r": 373.35764, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 140, "label": "text", "bbox": {"l": 396.24661, "t": 278.48572, "r": 403.75531, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 115, "text": "1.0", "bbox": {"l": 396.24661, "t": 278.48572, "r": 403.75531, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 141, "label": "text", "bbox": {"l": 429.51599, "t": 278.48572, "r": 437.02469, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 116, "text": "0.3", "bbox": {"l": 429.51599, "t": 278.48572, "r": 437.02469, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 142, "label": "text", "bbox": {"l": 463.7142, "t": 278.48572, "r": 484.73965000000004, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 117, "text": "104.85 $", "bbox": {"l": 463.7142, "t": 278.48572, "r": 484.73965000000004, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 143, "label": "text", "bbox": {"l": 512.99463, "t": 278.48572, "r": 534.02008, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 118, "text": "$ 104.51", "bbox": {"l": 512.99463, "t": 278.48572, "r": 534.02008, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ecel", "ched", "lcel", "ched", "lcel", "nl", "ecel", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 7, "num_cols": 5, "table_cells": [{"bbox": {"l": 459.04861, "t": 221.62415, "r": 542.00018, "b": 232.89935000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 5, "text": "Weighted Average Grant Date Fair Value", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 393.2442, "t": 236.74712999999997, "r": 407.34631, "b": 241.81232, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "RS U s", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 392.09671, "t": 221.57446000000004, "r": 438.0145, "b": 226.63964999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 3, "text": "Shares (in millions)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 427.18323, "t": 236.74712999999997, "r": 440.98778999999996, "b": 241.81232, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "PSUs", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 468.38254, "t": 236.74712999999997, "r": 482.48465000000004, "b": 241.81232, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "RSUs", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 516.92578, "t": 236.74712999999997, "r": 530.73035, "b": 241.81232, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "PSUs", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 306.11493, "t": 244.61084000000005, "r": 364.65607, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Nonvested on Janua ry 1", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 396.24661, "t": 244.91327, "r": 403.75531, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "1. 1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 429.81838999999997, "t": 244.91327, "r": 437.32708999999994, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 465.52859, "t": 244.91327, "r": 483.55001999999996, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "90.10 $", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 513.44824, "t": 244.91327, "r": 531.46967, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "$ 91.19", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 306.11493, "t": 253.68451000000005, "r": 325.62674, "b": 258.74969, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Granted", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 396.24661, "t": 253.68451000000005, "r": 403.75531, "b": 258.74969, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "0. 5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 429.81838999999997, "t": 253.68451000000005, "r": 437.32708999999994, "b": 258.74969, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 466.43579000000005, "t": 253.68451000000005, "r": 482.54831, "b": 258.74969, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "117.44", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 514.29065, "t": 253.68451000000005, "r": 530.80981, "b": 258.74969, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "122.41", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 306.11493, "t": 261.54822, "r": 322.62866, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Vested", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 394.43222, "t": 261.54822, "r": 405.53625, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "(0. 5 )", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 427.7016, "t": 261.54822, "r": 438.80563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "(0.1)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 468.55533, "t": 261.54822, "r": 482.07043, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "87.08", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 516.01862, "t": 261.54822, "r": 529.53375, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "81.14", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 306.11493, "t": 269.64148, "r": 356.24771, "b": 274.70667000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Canceled or forfeited", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 394.43222, "t": 270.31946000000005, "r": 405.53625, "b": 275.38464, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "(0. 1 )", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 431.02802, "t": 270.31946000000005, "r": 436.4280099999999, "b": 275.38464, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 465.83099000000004, "t": 270.31946000000005, "r": 482.35013, "b": 275.38464, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "102.01", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 516.01862, "t": 270.31946000000005, "r": 529.53375, "b": 275.38464, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "92.18", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 306.11493, "t": 278.48572, "r": 373.35764, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Nonvested on December 31", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 396.24661, "t": 278.48572, "r": 403.75531, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "1.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 429.51599, "t": 278.48572, "r": 437.02469, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 463.7142, "t": 278.48572, "r": 484.73965000000004, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "104.85 $", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 512.99463, "t": 278.48572, "r": 534.02008, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "$ 104.51", "column_header": false, "row_header": false, "row_section": false}]}}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "caption", "id": 18, "page_no": 7, "cluster": {"id": 18, "label": "caption", "bbox": {"l": 53.811783000000005, "t": 208.23328000000004, "r": 385.93451, "b": 216.10645, "coord_origin": "TOPLEFT"}, "confidence": 0.5986505746841431, "cells": [{"id": 0, "text": "b.", "bbox": {"l": 53.811783000000005, "t": 208.23328000000004, "r": 62.219952, "b": 216.10645, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Structure predicted by TableFormer, with superimposed matched PDF cell text:", "bbox": {"l": 66.424026, "t": 208.23328000000004, "r": 385.93451, "b": 216.10645, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "b. Structure predicted by TableFormer, with superimposed matched PDF cell text:"}, {"label": "section_header", "id": 29, "page_no": 7, "cluster": {"id": 29, "label": "section_header", "bbox": {"l": 53.811783000000005, "t": 94.28112999999996, "r": 284.34592, "b": 102.15430000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.46452972292900085, "cells": [{"id": 2, "text": "Japanese language (previously unseen by TableFormer):", "bbox": {"l": 53.811783000000005, "t": 94.28112999999996, "r": 284.34592, "b": 102.15430000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Japanese language (previously unseen by TableFormer):"}, {"label": "section_header", "id": 31, "page_no": 7, "cluster": {"id": 31, "label": "section_header", "bbox": {"l": 304.83081, "t": 94.28112999999996, "r": 431.09119, "b": 102.15430000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.4629225730895996, "cells": [{"id": 3, "text": "Example table from FinTabNet:", "bbox": {"l": 304.83081, "t": 94.28112999999996, "r": 431.09119, "b": 102.15430000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Example table from FinTabNet:"}, {"label": "list_item", "id": 20, "page_no": 7, "cluster": {"id": 20, "label": "list_item", "bbox": {"l": 53.286037, "t": 78.68756000000008, "r": 61.550289, "b": 86.56073000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.5820134282112122, "cells": [{"id": 4, "text": "a.", "bbox": {"l": 53.286037, "t": 78.68756000000008, "r": 61.550289, "b": 86.56073000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "a."}, {"label": "list_item", "id": 21, "page_no": 7, "cluster": {"id": 21, "label": "list_item", "bbox": {"l": 65.682419, "t": 78.68756000000008, "r": 499.55563, "b": 86.56073000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.541211724281311, "cells": [{"id": 5, "text": "Red - PDF cells, Green - predicted bounding boxes, Blue - post-processed predictions matched to PDF cells", "bbox": {"l": 65.682419, "t": 78.68756000000008, "r": 499.55563, "b": 86.56073000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Red - PDF cells, Green - predicted bounding boxes, Blue - post-processed predictions matched to PDF cells"}, {"label": "table", "id": 8, "page_no": 7, "cluster": {"id": 8, "label": "table", "bbox": {"l": 53.62853240966797, "t": 218.94857788085938, "r": 298.5574951171875, "b": 292.39996337890625, "coord_origin": "TOPLEFT"}, "confidence": 0.8824009299278259, "cells": [{"id": 6, "text": "\u8ad6\u6587\u30d5\u30a1\u30a4\u30eb", "bbox": {"l": 209.93285, "t": 222.18073000000004, "r": 241.04458999999997, "b": 226.36212, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "\u53c2\u8003\u6587\u732e", "bbox": {"l": 263.76489, "t": 222.18073000000004, "r": 284.50589, "b": 226.36212, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "\u51fa\u5178", "bbox": {"l": 110.24990999999999, "t": 229.66594999999995, "r": 120.62018, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "\u30d5\u30a1\u30a4\u30eb", "bbox": {"l": 175.36609, "t": 229.66594999999995, "r": 196.1071, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "\u6570", "bbox": {"l": 196.10756, "t": 229.66594999999995, "r": 201.29247, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "\u82f1\u8a9e", "bbox": {"l": 209.62408, "t": 229.66594999999995, "r": 219.99435, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "\u65e5\u672c\u8a9e", "bbox": {"l": 229.19814, "t": 229.66594999999995, "r": 244.75377, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "\u82f1\u8a9e", "bbox": {"l": 256.1142, "t": 229.66594999999995, "r": 266.48447, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "\u65e5\u672c\u8a9e", "bbox": {"l": 278.38434, "t": 229.66594999999995, "r": 293.93997, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Association for Computational Linguistics(ACL2003)", "bbox": {"l": 55.53052099999999, "t": 236.42584, "r": 162.7131, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "65", "bbox": {"l": 184.39731, "t": 236.42584, "r": 189.56456, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "65", "bbox": {"l": 208.99026, "t": 236.42584, "r": 214.15752, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "0", "bbox": {"l": 234.87517, "t": 236.42584, "r": 237.45833000000002, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "150", "bbox": {"l": 256.88446, "t": 236.42584, "r": 264.6358, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "0", "bbox": {"l": 284.06134, "t": 236.42584, "r": 286.6445, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Computational Linguistics(COLING2002)", "bbox": {"l": 55.53052099999999, "t": 242.62048000000004, "r": 139.72253, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "140", "bbox": {"l": 183.10536, "t": 242.62048000000004, "r": 190.8567, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "140", "bbox": {"l": 207.69832, "t": 242.62048000000004, "r": 215.44965999999997, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "0", "bbox": {"l": 234.87517, "t": 242.62048000000004, "r": 237.45833000000002, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "150", "bbox": {"l": 256.88446, "t": 242.62048000000004, "r": 264.6358, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "0", "bbox": {"l": 284.06134, "t": 242.62048000000004, "r": 286.6445, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "\u96fb\u6c17\u60c5\u5831\u901a\u4fe1\u5b66\u4f1a", "bbox": {"l": 55.53052099999999, "t": 249.79845999999998, "r": 97.013, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "2003", "bbox": {"l": 92.698288, "t": 249.58942000000002, "r": 103.03371, "b": 253.94732999999997, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "\u5e74\u7dcf\u5408\u5927\u4f1a", "bbox": {"l": 103.03389, "t": 249.79845999999998, "r": 128.96027, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "150", "bbox": {"l": 183.10536, "t": 248.81506000000002, "r": 190.8567, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "8", "bbox": {"l": 210.28223, "t": 248.81506000000002, "r": 212.86539, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "142", "bbox": {"l": 232.29153, "t": 248.81506000000002, "r": 240.04287999999997, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "223", "bbox": {"l": 256.88446, "t": 248.81506000000002, "r": 264.6358, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "147", "bbox": {"l": 281.47742, "t": 248.81506000000002, "r": 289.22876, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "\u60c5\u5831\u51e6\u7406\u5b66\u4f1a\u7b2c", "bbox": {"l": 55.53052099999999, "t": 257.28369, "r": 91.827637, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "65", "bbox": {"l": 88.052673, "t": 257.07465, "r": 93.219925, "b": 261.43255999999997, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "\u56de\u5168\u56fd\u5927\u4f1a", "bbox": {"l": 93.220474, "t": 257.28369, "r": 119.14685, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "(2003)", "bbox": {"l": 116.45073999999998, "t": 257.07465, "r": 129.88177, "b": 261.43255999999997, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "177", "bbox": {"l": 183.10536, "t": 256.30029, "r": 190.8567, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "1", "bbox": {"l": 210.28223, "t": 256.30029, "r": 212.86539, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "176", "bbox": {"l": 232.29153, "t": 256.30029, "r": 240.04287999999997, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "150", "bbox": {"l": 256.88446, "t": 256.30029, "r": 264.6358, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "236", "bbox": {"l": 281.47742, "t": 256.30029, "r": 289.22876, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "\u7b2c", "bbox": {"l": 55.53052099999999, "t": 264.5108, "r": 60.715424, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "17", "bbox": {"l": 60.17654799999999, "t": 264.30175999999994, "r": 65.343796, "b": 268.65967, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "\u56de\u4eba\u5de5\u77e5\u80fd\u5b66\u4f1a\u5168\u56fd\u5927\u4f1a", "bbox": {"l": 65.344376, "t": 264.5108, "r": 122.38297000000001, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "(2003)", "bbox": {"l": 116.45073999999998, "t": 264.30175999999994, "r": 129.88177, "b": 268.65967, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "208", "bbox": {"l": 183.10536, "t": 263.52739999999994, "r": 190.8567, "b": 267.88531, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "5", "bbox": {"l": 210.28223, "t": 263.52739999999994, "r": 212.86539, "b": 267.88531, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "203", "bbox": {"l": 232.29153, "t": 263.52739999999994, "r": 240.04287999999997, "b": 267.88531, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "152", "bbox": {"l": 256.88446, "t": 263.52739999999994, "r": 264.6358, "b": 267.88531, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "244", "bbox": {"l": 281.47742, "t": 263.52739999999994, "r": 289.22876, "b": 267.88531, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "\u81ea\u7136\u8a00\u8a9e\u51e6\u7406\u7814\u7a76\u4f1a\u7b2c", "bbox": {"l": 55.53052099999999, "t": 271.73785, "r": 107.38374, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "146", "bbox": {"l": 101.99034, "t": 271.52881, "r": 109.74168000000002, "b": 275.88671999999997, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "\u301c", "bbox": {"l": 109.74204, "t": 271.73785, "r": 114.92695000000002, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "155", "bbox": {"l": 114.38793, "t": 271.52881, "r": 122.13927, "b": 275.88671999999997, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "\u56de", "bbox": {"l": 122.13963, "t": 271.73785, "r": 127.32454000000001, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "98", "bbox": {"l": 184.39731, "t": 270.75446, "r": 189.56456, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "2", "bbox": {"l": 210.28223, "t": 270.75446, "r": 212.86539, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "96", "bbox": {"l": 233.58348, "t": 270.75446, "r": 238.75072999999998, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "150", "bbox": {"l": 256.88446, "t": 270.75446, "r": 264.6358, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "232", "bbox": {"l": 281.47742, "t": 270.75446, "r": 289.22876, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "WWW", "bbox": {"l": 55.53052099999999, "t": 279.01392, "r": 68.68605, "b": 283.37183, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "\u304b\u3089\u53ce\u96c6\u3057\u305f\u8ad6\u6587", "bbox": {"l": 68.685814, "t": 279.22295999999994, "r": 110.16829999999999, "b": 283.40436, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "107", "bbox": {"l": 183.10536, "t": 277.98157000000003, "r": 190.8567, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "73", "bbox": {"l": 208.99026, "t": 277.98157000000003, "r": 214.15752, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "34", "bbox": {"l": 233.58348, "t": 277.98157000000003, "r": 238.75072999999998, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "147", "bbox": {"l": 256.88446, "t": 277.98157000000003, "r": 264.6358, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "96", "bbox": {"l": 282.76938, "t": 277.98157000000003, "r": 287.93661, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "\u8a08", "bbox": {"l": 169.61508, "t": 286.45004, "r": 174.79999, "b": 290.63141, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "945", "bbox": {"l": 183.10536, "t": 285.46667, "r": 190.8567, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "294", "bbox": {"l": 207.69832, "t": 285.46667, "r": 215.44965999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "651", "bbox": {"l": 232.29153, "t": 285.46667, "r": 240.04287999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "1122", "bbox": {"l": 255.76506, "t": 285.46667, "r": 265.75204, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "955", "bbox": {"l": 281.47742, "t": 285.46667, "r": 289.22876, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}], "children": [{"id": 32, "label": "text", "bbox": {"l": 209.93285, "t": 222.18073000000004, "r": 241.04458999999997, "b": 226.36212, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": "\u8ad6\u6587\u30d5\u30a1\u30a4\u30eb", "bbox": {"l": 209.93285, "t": 222.18073000000004, "r": 241.04458999999997, "b": 226.36212, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 263.76489, "t": 222.18073000000004, "r": 284.50589, "b": 226.36212, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "\u53c2\u8003\u6587\u732e", "bbox": {"l": 263.76489, "t": 222.18073000000004, "r": 284.50589, "b": 226.36212, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 110.24990999999999, "t": 229.66594999999995, "r": 120.62018, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "\u51fa\u5178", "bbox": {"l": 110.24990999999999, "t": 229.66594999999995, "r": 120.62018, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 175.36609, "t": 229.66594999999995, "r": 196.1071, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "\u30d5\u30a1\u30a4\u30eb", "bbox": {"l": 175.36609, "t": 229.66594999999995, "r": 196.1071, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 196.10756, "t": 229.66594999999995, "r": 201.29247, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "\u6570", "bbox": {"l": 196.10756, "t": 229.66594999999995, "r": 201.29247, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 209.62408, "t": 229.66594999999995, "r": 219.99435, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "\u82f1\u8a9e", "bbox": {"l": 209.62408, "t": 229.66594999999995, "r": 219.99435, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 229.19814, "t": 229.66594999999995, "r": 244.75377, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "\u65e5\u672c\u8a9e", "bbox": {"l": 229.19814, "t": 229.66594999999995, "r": 244.75377, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 256.1142, "t": 229.66594999999995, "r": 266.48447, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "\u82f1\u8a9e", "bbox": {"l": 256.1142, "t": 229.66594999999995, "r": 266.48447, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 278.38434, "t": 229.66594999999995, "r": 293.93997, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "\u65e5\u672c\u8a9e", "bbox": {"l": 278.38434, "t": 229.66594999999995, "r": 293.93997, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 55.53052099999999, "t": 236.42584, "r": 162.7131, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "Association for Computational Linguistics(ACL2003)", "bbox": {"l": 55.53052099999999, "t": 236.42584, "r": 162.7131, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 184.39731, "t": 236.42584, "r": 189.56456, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "65", "bbox": {"l": 184.39731, "t": 236.42584, "r": 189.56456, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 208.99026, "t": 236.42584, "r": 214.15752, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "65", "bbox": {"l": 208.99026, "t": 236.42584, "r": 214.15752, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 234.87517, "t": 236.42584, "r": 237.45833000000002, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "0", "bbox": {"l": 234.87517, "t": 236.42584, "r": 237.45833000000002, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 256.88446, "t": 236.42584, "r": 264.6358, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "150", "bbox": {"l": 256.88446, "t": 236.42584, "r": 264.6358, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 284.06134, "t": 236.42584, "r": 286.6445, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "0", "bbox": {"l": 284.06134, "t": 236.42584, "r": 286.6445, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 55.53052099999999, "t": 242.62048000000004, "r": 139.72253, "b": 246.97839, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "Computational Linguistics(COLING2002)", "bbox": {"l": 55.53052099999999, "t": 242.62048000000004, "r": 139.72253, "b": 246.97839, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 183.10536, "t": 242.62048000000004, "r": 190.8567, "b": 246.97839, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "140", "bbox": {"l": 183.10536, "t": 242.62048000000004, "r": 190.8567, "b": 246.97839, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 207.69832, "t": 242.62048000000004, "r": 215.44965999999997, "b": 246.97839, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "140", "bbox": {"l": 207.69832, "t": 242.62048000000004, "r": 215.44965999999997, "b": 246.97839, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 234.87517, "t": 242.62048000000004, "r": 237.45833000000002, "b": 246.97839, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "0", "bbox": {"l": 234.87517, "t": 242.62048000000004, "r": 237.45833000000002, "b": 246.97839, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 256.88446, "t": 242.62048000000004, "r": 264.6358, "b": 246.97839, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "150", "bbox": {"l": 256.88446, "t": 242.62048000000004, "r": 264.6358, "b": 246.97839, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 284.06134, "t": 242.62048000000004, "r": 286.6445, "b": 246.97839, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "0", "bbox": {"l": 284.06134, "t": 242.62048000000004, "r": 286.6445, "b": 246.97839, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 55.53052099999999, "t": 249.79845999999998, "r": 97.013, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "\u96fb\u6c17\u60c5\u5831\u901a\u4fe1\u5b66\u4f1a", "bbox": {"l": 55.53052099999999, "t": 249.79845999999998, "r": 97.013, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 92.698288, "t": 249.58942000000002, "r": 103.03371, "b": 253.94732999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "2003", "bbox": {"l": 92.698288, "t": 249.58942000000002, "r": 103.03371, "b": 253.94732999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 103.03389, "t": 249.79845999999998, "r": 128.96027, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "\u5e74\u7dcf\u5408\u5927\u4f1a", "bbox": {"l": 103.03389, "t": 249.79845999999998, "r": 128.96027, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 183.10536, "t": 248.81506000000002, "r": 190.8567, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "150", "bbox": {"l": 183.10536, "t": 248.81506000000002, "r": 190.8567, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 210.28223, "t": 248.81506000000002, "r": 212.86539, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "8", "bbox": {"l": 210.28223, "t": 248.81506000000002, "r": 212.86539, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 232.29153, "t": 248.81506000000002, "r": 240.04287999999997, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "142", "bbox": {"l": 232.29153, "t": 248.81506000000002, "r": 240.04287999999997, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 256.88446, "t": 248.81506000000002, "r": 264.6358, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "223", "bbox": {"l": 256.88446, "t": 248.81506000000002, "r": 264.6358, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 281.47742, "t": 248.81506000000002, "r": 289.22876, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "147", "bbox": {"l": 281.47742, "t": 248.81506000000002, "r": 289.22876, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 55.53052099999999, "t": 257.28369, "r": 91.827637, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "\u60c5\u5831\u51e6\u7406\u5b66\u4f1a\u7b2c", "bbox": {"l": 55.53052099999999, "t": 257.28369, "r": 91.827637, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 88.052673, "t": 257.07465, "r": 93.219925, "b": 261.43255999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "65", "bbox": {"l": 88.052673, "t": 257.07465, "r": 93.219925, "b": 261.43255999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 93.220474, "t": 257.28369, "r": 119.14685, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "\u56de\u5168\u56fd\u5927\u4f1a", "bbox": {"l": 93.220474, "t": 257.28369, "r": 119.14685, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 116.45073999999998, "t": 257.07465, "r": 129.88177, "b": 261.43255999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "(2003)", "bbox": {"l": 116.45073999999998, "t": 257.07465, "r": 129.88177, "b": 261.43255999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 183.10536, "t": 256.30029, "r": 190.8567, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "177", "bbox": {"l": 183.10536, "t": 256.30029, "r": 190.8567, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 210.28223, "t": 256.30029, "r": 212.86539, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "1", "bbox": {"l": 210.28223, "t": 256.30029, "r": 212.86539, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 232.29153, "t": 256.30029, "r": 240.04287999999997, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "176", "bbox": {"l": 232.29153, "t": 256.30029, "r": 240.04287999999997, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 256.88446, "t": 256.30029, "r": 264.6358, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "150", "bbox": {"l": 256.88446, "t": 256.30029, "r": 264.6358, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 281.47742, "t": 256.30029, "r": 289.22876, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "236", "bbox": {"l": 281.47742, "t": 256.30029, "r": 289.22876, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 55.53052099999999, "t": 264.5108, "r": 60.715424, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "\u7b2c", "bbox": {"l": 55.53052099999999, "t": 264.5108, "r": 60.715424, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 60.17654799999999, "t": 264.30175999999994, "r": 65.343796, "b": 268.65967, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "17", "bbox": {"l": 60.17654799999999, "t": 264.30175999999994, "r": 65.343796, "b": 268.65967, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 65.344376, "t": 264.5108, "r": 122.38297000000001, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "\u56de\u4eba\u5de5\u77e5\u80fd\u5b66\u4f1a\u5168\u56fd\u5927\u4f1a", "bbox": {"l": 65.344376, "t": 264.5108, "r": 122.38297000000001, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 116.45073999999998, "t": 264.30175999999994, "r": 129.88177, "b": 268.65967, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "(2003)", "bbox": {"l": 116.45073999999998, "t": 264.30175999999994, "r": 129.88177, "b": 268.65967, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 183.10536, "t": 263.52739999999994, "r": 190.8567, "b": 267.88531, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "208", "bbox": {"l": 183.10536, "t": 263.52739999999994, "r": 190.8567, "b": 267.88531, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 210.28223, "t": 263.52739999999994, "r": 212.86539, "b": 267.88531, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "5", "bbox": {"l": 210.28223, "t": 263.52739999999994, "r": 212.86539, "b": 267.88531, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 232.29153, "t": 263.52739999999994, "r": 240.04287999999997, "b": 267.88531, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "203", "bbox": {"l": 232.29153, "t": 263.52739999999994, "r": 240.04287999999997, "b": 267.88531, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 256.88446, "t": 263.52739999999994, "r": 264.6358, "b": 267.88531, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "152", "bbox": {"l": 256.88446, "t": 263.52739999999994, "r": 264.6358, "b": 267.88531, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 281.47742, "t": 263.52739999999994, "r": 289.22876, "b": 267.88531, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "244", "bbox": {"l": 281.47742, "t": 263.52739999999994, "r": 289.22876, "b": 267.88531, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 55.53052099999999, "t": 271.73785, "r": 107.38374, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "\u81ea\u7136\u8a00\u8a9e\u51e6\u7406\u7814\u7a76\u4f1a\u7b2c", "bbox": {"l": 55.53052099999999, "t": 271.73785, "r": 107.38374, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 101.99034, "t": 271.52881, "r": 109.74168000000002, "b": 275.88671999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "146", "bbox": {"l": 101.99034, "t": 271.52881, "r": 109.74168000000002, "b": 275.88671999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 109.74204, "t": 271.73785, "r": 114.92695000000002, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "\u301c", "bbox": {"l": 109.74204, "t": 271.73785, "r": 114.92695000000002, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 114.38793, "t": 271.52881, "r": 122.13927, "b": 275.88671999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "155", "bbox": {"l": 114.38793, "t": 271.52881, "r": 122.13927, "b": 275.88671999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 122.13963, "t": 271.73785, "r": 127.32454000000001, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "\u56de", "bbox": {"l": 122.13963, "t": 271.73785, "r": 127.32454000000001, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 184.39731, "t": 270.75446, "r": 189.56456, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "98", "bbox": {"l": 184.39731, "t": 270.75446, "r": 189.56456, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 210.28223, "t": 270.75446, "r": 212.86539, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "2", "bbox": {"l": 210.28223, "t": 270.75446, "r": 212.86539, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 233.58348, "t": 270.75446, "r": 238.75072999999998, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "96", "bbox": {"l": 233.58348, "t": 270.75446, "r": 238.75072999999998, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 256.88446, "t": 270.75446, "r": 264.6358, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "150", "bbox": {"l": 256.88446, "t": 270.75446, "r": 264.6358, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 281.47742, "t": 270.75446, "r": 289.22876, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "232", "bbox": {"l": 281.47742, "t": 270.75446, "r": 289.22876, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 55.53052099999999, "t": 279.01392, "r": 68.68605, "b": 283.37183, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "WWW", "bbox": {"l": 55.53052099999999, "t": 279.01392, "r": 68.68605, "b": 283.37183, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 68.685814, "t": 279.22295999999994, "r": 110.16829999999999, "b": 283.40436, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "\u304b\u3089\u53ce\u96c6\u3057\u305f\u8ad6\u6587", "bbox": {"l": 68.685814, "t": 279.22295999999994, "r": 110.16829999999999, "b": 283.40436, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 183.10536, "t": 277.98157000000003, "r": 190.8567, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "107", "bbox": {"l": 183.10536, "t": 277.98157000000003, "r": 190.8567, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 208.99026, "t": 277.98157000000003, "r": 214.15752, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "73", "bbox": {"l": 208.99026, "t": 277.98157000000003, "r": 214.15752, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 233.58348, "t": 277.98157000000003, "r": 238.75072999999998, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "34", "bbox": {"l": 233.58348, "t": 277.98157000000003, "r": 238.75072999999998, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 256.88446, "t": 277.98157000000003, "r": 264.6358, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "147", "bbox": {"l": 256.88446, "t": 277.98157000000003, "r": 264.6358, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 282.76938, "t": 277.98157000000003, "r": 287.93661, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "96", "bbox": {"l": 282.76938, "t": 277.98157000000003, "r": 287.93661, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 169.61508, "t": 286.45004, "r": 174.79999, "b": 290.63141, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "\u8a08", "bbox": {"l": 169.61508, "t": 286.45004, "r": 174.79999, "b": 290.63141, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 183.10536, "t": 285.46667, "r": 190.8567, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "945", "bbox": {"l": 183.10536, "t": 285.46667, "r": 190.8567, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 207.69832, "t": 285.46667, "r": 215.44965999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "294", "bbox": {"l": 207.69832, "t": 285.46667, "r": 215.44965999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 232.29153, "t": 285.46667, "r": 240.04287999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "651", "bbox": {"l": 232.29153, "t": 285.46667, "r": 240.04287999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 255.76506, "t": 285.46667, "r": 265.75204, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "1122", "bbox": {"l": 255.76506, "t": 285.46667, "r": 265.75204, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 281.47742, "t": 285.46667, "r": 289.22876, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "955", "bbox": {"l": 281.47742, "t": 285.46667, "r": 289.22876, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "lcel", "ched", "lcel", "nl", "ched", "ched", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 10, "num_cols": 6, "table_cells": [{"bbox": {"l": 209.93285, "t": 222.18073000000004, "r": 241.04458999999997, "b": 226.36212, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 4, "text": "\u8ad6\u6587\u30d5\u30a1\u30a4\u30eb", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 263.76489, "t": 222.18073000000004, "r": 284.50589, "b": 226.36212, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 4, "end_col_offset_idx": 6, "text": "\u53c2\u8003\u6587\u732e", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 110.24990999999999, "t": 229.66594999999995, "r": 120.62018, "b": 233.84735, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "\u51fa\u5178", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 175.36609, "t": 229.66594999999995, "r": 201.29247, "b": 233.84735, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "\u30d5\u30a1\u30a4\u30eb \u6570", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 209.62408, "t": 229.66594999999995, "r": 219.99435, "b": 233.84735, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "\u82f1\u8a9e", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 229.19814, "t": 229.66594999999995, "r": 244.75377, "b": 233.84735, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "\u65e5\u672c\u8a9e", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 256.1142, "t": 229.66594999999995, "r": 266.48447, "b": 233.84735, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "\u82f1\u8a9e", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 278.38434, "t": 229.66594999999995, "r": 293.93997, "b": 233.84735, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "\u65e5\u672c\u8a9e", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 55.53052099999999, "t": 236.42584, "r": 162.7131, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Association for Computational Linguistics(ACL2003)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 184.39731, "t": 236.42584, "r": 189.56456, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "65", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 208.99026, "t": 236.42584, "r": 214.15752, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "65", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 234.87517, "t": 236.42584, "r": 237.45833000000002, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446, "t": 236.42584, "r": 264.6358, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "150", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 284.06134, "t": 236.42584, "r": 286.6445, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 55.53052099999999, "t": 242.62048000000004, "r": 139.72253, "b": 246.97839, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Computational Linguistics(COLING2002)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 183.10536, "t": 242.62048000000004, "r": 190.8567, "b": 246.97839, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "140", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 207.69832, "t": 242.62048000000004, "r": 215.44965999999997, "b": 246.97839, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "140", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 234.87517, "t": 242.62048000000004, "r": 237.45833000000002, "b": 246.97839, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446, "t": 242.62048000000004, "r": 264.6358, "b": 246.97839, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "150", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 284.06134, "t": 242.62048000000004, "r": 286.6445, "b": 246.97839, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 55.53052099999999, "t": 249.58942000000002, "r": 128.96027, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "\u96fb\u6c17\u60c5\u5831\u901a\u4fe1\u5b66\u4f1a 2003 \u5e74\u7dcf\u5408\u5927\u4f1a", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 183.10536, "t": 248.81506000000002, "r": 190.8567, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "150", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 210.28223, "t": 248.81506000000002, "r": 212.86539, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.29153, "t": 248.81506000000002, "r": 240.04287999999997, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "142", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446, "t": 248.81506000000002, "r": 264.6358, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "223", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.47742, "t": 248.81506000000002, "r": 289.22876, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "147", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 55.53052099999999, "t": 257.07465, "r": 129.88177, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "\u60c5\u5831\u51e6\u7406\u5b66\u4f1a\u7b2c 65 \u56de\u5168\u56fd\u5927\u4f1a (2003)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 183.10536, "t": 256.30029, "r": 190.8567, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "177", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 210.28223, "t": 256.30029, "r": 212.86539, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.29153, "t": 256.30029, "r": 240.04287999999997, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "176", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446, "t": 256.30029, "r": 264.6358, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "150", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.47742, "t": 256.30029, "r": 289.22876, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "236", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 55.53052099999999, "t": 264.30175999999994, "r": 129.88177, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "\u7b2c 17 \u56de\u4eba\u5de5\u77e5\u80fd\u5b66\u4f1a\u5168\u56fd\u5927\u4f1a (2003)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 183.10536, "t": 263.52739999999994, "r": 190.8567, "b": 267.88531, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "208", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 210.28223, "t": 263.52739999999994, "r": 212.86539, "b": 267.88531, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.29153, "t": 263.52739999999994, "r": 240.04287999999997, "b": 267.88531, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "203", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446, "t": 263.52739999999994, "r": 264.6358, "b": 267.88531, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "152", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.47742, "t": 263.52739999999994, "r": 289.22876, "b": 267.88531, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "244", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 55.53052099999999, "t": 271.52881, "r": 127.32454000000001, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "\u81ea\u7136\u8a00\u8a9e\u51e6\u7406\u7814\u7a76\u4f1a\u7b2c 146 \u301c 155 \u56de", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 184.39731, "t": 270.75446, "r": 189.56456, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "98", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 210.28223, "t": 270.75446, "r": 212.86539, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 233.58348, "t": 270.75446, "r": 238.75072999999998, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446, "t": 270.75446, "r": 264.6358, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "150", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.47742, "t": 270.75446, "r": 289.22876, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "232", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 55.53052099999999, "t": 279.01392, "r": 110.16829999999999, "b": 283.40436, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "WWW \u304b\u3089\u53ce\u96c6\u3057\u305f\u8ad6\u6587", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 183.10536, "t": 277.98157000000003, "r": 190.8567, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "107", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 208.99026, "t": 277.98157000000003, "r": 214.15752, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "73", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 233.58348, "t": 277.98157000000003, "r": 238.75072999999998, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "34", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446, "t": 277.98157000000003, "r": 264.6358, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "147", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 282.76938, "t": 277.98157000000003, "r": 287.93661, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 183.10536, "t": 285.46667, "r": 190.8567, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "945", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 207.69832, "t": 285.46667, "r": 215.44965999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "294", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.29153, "t": 285.46667, "r": 240.04287999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "651", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 255.76506, "t": 285.46667, "r": 265.75204, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "1122", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.47742, "t": 285.46667, "r": 289.22876, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "955", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "caption", "id": 16, "page_no": 7, "cluster": {"id": 16, "label": "caption", "bbox": {"l": 380.42731, "t": 292.30426, "r": 549.42175, "b": 298.60284, "coord_origin": "TOPLEFT"}, "confidence": 0.7499915957450867, "cells": [{"id": 76, "text": "Text is aligned to match original for ease of viewing", "bbox": {"l": 380.42731, "t": 292.30426, "r": 549.42175, "b": 298.60284, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Text is aligned to match original for ease of viewing"}, {"label": "table", "id": 7, "page_no": 7, "cluster": {"id": 7, "label": "table", "bbox": {"l": 304.9219970703125, "t": 218.51486206054688, "r": 550.2321166992188, "b": 287.90069580078125, "coord_origin": "TOPLEFT"}, "confidence": 0.8899767994880676, "cells": [{"id": 77, "text": "Weighted Average Grant Date Fair", "bbox": {"l": 459.04861, "t": 221.62415, "r": 542.00018, "b": 226.68933000000004, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "Value", "bbox": {"l": 493.82193, "t": 227.83416999999997, "r": 507.2258, "b": 232.89935000000003, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "RS", "bbox": {"l": 393.2442, "t": 236.74712999999997, "r": 400.74588, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "U", "bbox": {"l": 400.74643, "t": 236.74712999999997, "r": 404.64523, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "s", "bbox": {"l": 404.6463, "t": 236.74712999999997, "r": 407.34631, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "Shares (in millions)", "bbox": {"l": 392.09671, "t": 221.57446000000004, "r": 438.0145, "b": 226.63964999999996, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "PSUs", "bbox": {"l": 427.18323, "t": 236.74712999999997, "r": 440.98778999999996, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "RSUs", "bbox": {"l": 468.38254, "t": 236.74712999999997, "r": 482.48465000000004, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "PSUs", "bbox": {"l": 516.92578, "t": 236.74712999999997, "r": 530.73035, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Nonvested on Janua", "bbox": {"l": 306.11493, "t": 244.61084000000005, "r": 355.6532, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "ry 1", "bbox": {"l": 355.65427, "t": 244.61084000000005, "r": 364.65607, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "1.", "bbox": {"l": 396.24661, "t": 244.91327, "r": 400.75238, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "1", "bbox": {"l": 400.7529, "t": 244.91327, "r": 403.75531, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "0.3", "bbox": {"l": 429.81838999999997, "t": 244.91327, "r": 437.32708999999994, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "90.10", "bbox": {"l": 465.52859, "t": 244.91327, "r": 478.40103, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "$", "bbox": {"l": 480.97552, "t": 244.91327, "r": 483.55001999999996, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "$ 91.19", "bbox": {"l": 513.44824, "t": 244.91327, "r": 531.46967, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "Granted", "bbox": {"l": 306.11493, "t": 253.68451000000005, "r": 325.62674, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "0.", "bbox": {"l": 396.24661, "t": 253.68451000000005, "r": 400.75238, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "5", "bbox": {"l": 400.7529, "t": 253.68451000000005, "r": 403.75531, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "0.1", "bbox": {"l": 429.81838999999997, "t": 253.68451000000005, "r": 437.32708999999994, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "117.44", "bbox": {"l": 466.43579000000005, "t": 253.68451000000005, "r": 482.54831, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "122.41", "bbox": {"l": 514.29065, "t": 253.68451000000005, "r": 530.80981, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "Vested", "bbox": {"l": 306.11493, "t": 261.54822, "r": 322.62866, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "(0.", "bbox": {"l": 394.43222, "t": 261.54822, "r": 400.73563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "5", "bbox": {"l": 400.73456, "t": 261.54822, "r": 403.73697, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": ")", "bbox": {"l": 403.73804, "t": 261.54822, "r": 405.53625, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "(0.1)", "bbox": {"l": 427.7016, "t": 261.54822, "r": 438.80563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "87.08", "bbox": {"l": 468.55533, "t": 261.54822, "r": 482.07043, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "81.14", "bbox": {"l": 516.01862, "t": 261.54822, "r": 529.53375, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "Canceled or forfeited", "bbox": {"l": 306.11493, "t": 269.64148, "r": 356.24771, "b": 274.70667000000003, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "(0.", "bbox": {"l": 394.43222, "t": 270.31946000000005, "r": 400.73563, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "1", "bbox": {"l": 400.73456, "t": 270.31946000000005, "r": 403.73697, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": ")", "bbox": {"l": 403.73804, "t": 270.31946000000005, "r": 405.53625, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "-", "bbox": {"l": 431.02802, "t": 270.31946000000005, "r": 436.4280099999999, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "102.01", "bbox": {"l": 465.83099000000004, "t": 270.31946000000005, "r": 482.35013, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "92.18", "bbox": {"l": 516.01862, "t": 270.31946000000005, "r": 529.53375, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "Nonvested on December 31", "bbox": {"l": 306.11493, "t": 278.48572, "r": 373.35764, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "1.0", "bbox": {"l": 396.24661, "t": 278.48572, "r": 403.75531, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "0.3", "bbox": {"l": 429.51599, "t": 278.48572, "r": 437.02469, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "104.85 $", "bbox": {"l": 463.7142, "t": 278.48572, "r": 484.73965000000004, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "$ 104.51", "bbox": {"l": 512.99463, "t": 278.48572, "r": 534.02008, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}], "children": [{"id": 102, "label": "text", "bbox": {"l": 459.04861, "t": 221.62415, "r": 542.00018, "b": 226.68933000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "Weighted Average Grant Date Fair", "bbox": {"l": 459.04861, "t": 221.62415, "r": 542.00018, "b": 226.68933000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 493.82193, "t": 227.83416999999997, "r": 507.2258, "b": 232.89935000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "Value", "bbox": {"l": 493.82193, "t": 227.83416999999997, "r": 507.2258, "b": 232.89935000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 393.2442, "t": 236.74712999999997, "r": 400.74588, "b": 241.81232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "RS", "bbox": {"l": 393.2442, "t": 236.74712999999997, "r": 400.74588, "b": 241.81232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 400.74643, "t": 236.74712999999997, "r": 404.64523, "b": 241.81232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "U", "bbox": {"l": 400.74643, "t": 236.74712999999997, "r": 404.64523, "b": 241.81232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 404.6463, "t": 236.74712999999997, "r": 407.34631, "b": 241.81232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "s", "bbox": {"l": 404.6463, "t": 236.74712999999997, "r": 407.34631, "b": 241.81232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 392.09671, "t": 221.57446000000004, "r": 438.0145, "b": 226.63964999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "Shares (in millions)", "bbox": {"l": 392.09671, "t": 221.57446000000004, "r": 438.0145, "b": 226.63964999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 427.18323, "t": 236.74712999999997, "r": 440.98778999999996, "b": 241.81232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "PSUs", "bbox": {"l": 427.18323, "t": 236.74712999999997, "r": 440.98778999999996, "b": 241.81232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 468.38254, "t": 236.74712999999997, "r": 482.48465000000004, "b": 241.81232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "RSUs", "bbox": {"l": 468.38254, "t": 236.74712999999997, "r": 482.48465000000004, "b": 241.81232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 516.92578, "t": 236.74712999999997, "r": 530.73035, "b": 241.81232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "PSUs", "bbox": {"l": 516.92578, "t": 236.74712999999997, "r": 530.73035, "b": 241.81232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 306.11493, "t": 244.61084000000005, "r": 355.6532, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "Nonvested on Janua", "bbox": {"l": 306.11493, "t": 244.61084000000005, "r": 355.6532, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 355.65427, "t": 244.61084000000005, "r": 364.65607, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "ry 1", "bbox": {"l": 355.65427, "t": 244.61084000000005, "r": 364.65607, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 396.24661, "t": 244.91327, "r": 400.75238, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "1.", "bbox": {"l": 396.24661, "t": 244.91327, "r": 400.75238, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 114, "label": "text", "bbox": {"l": 400.7529, "t": 244.91327, "r": 403.75531, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "1", "bbox": {"l": 400.7529, "t": 244.91327, "r": 403.75531, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 115, "label": "text", "bbox": {"l": 429.81838999999997, "t": 244.91327, "r": 437.32708999999994, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "0.3", "bbox": {"l": 429.81838999999997, "t": 244.91327, "r": 437.32708999999994, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 116, "label": "text", "bbox": {"l": 465.52859, "t": 244.91327, "r": 478.40103, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "90.10", "bbox": {"l": 465.52859, "t": 244.91327, "r": 478.40103, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 117, "label": "text", "bbox": {"l": 480.97552, "t": 244.91327, "r": 483.55001999999996, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "$", "bbox": {"l": 480.97552, "t": 244.91327, "r": 483.55001999999996, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 118, "label": "text", "bbox": {"l": 513.44824, "t": 244.91327, "r": 531.46967, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "$ 91.19", "bbox": {"l": 513.44824, "t": 244.91327, "r": 531.46967, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 119, "label": "text", "bbox": {"l": 306.11493, "t": 253.68451000000005, "r": 325.62674, "b": 258.74969, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "Granted", "bbox": {"l": 306.11493, "t": 253.68451000000005, "r": 325.62674, "b": 258.74969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 120, "label": "text", "bbox": {"l": 396.24661, "t": 253.68451000000005, "r": 400.75238, "b": 258.74969, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "0.", "bbox": {"l": 396.24661, "t": 253.68451000000005, "r": 400.75238, "b": 258.74969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 121, "label": "text", "bbox": {"l": 400.7529, "t": 253.68451000000005, "r": 403.75531, "b": 258.74969, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "5", "bbox": {"l": 400.7529, "t": 253.68451000000005, "r": 403.75531, "b": 258.74969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 122, "label": "text", "bbox": {"l": 429.81838999999997, "t": 253.68451000000005, "r": 437.32708999999994, "b": 258.74969, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "0.1", "bbox": {"l": 429.81838999999997, "t": 253.68451000000005, "r": 437.32708999999994, "b": 258.74969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 123, "label": "text", "bbox": {"l": 466.43579000000005, "t": 253.68451000000005, "r": 482.54831, "b": 258.74969, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "117.44", "bbox": {"l": 466.43579000000005, "t": 253.68451000000005, "r": 482.54831, "b": 258.74969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 124, "label": "text", "bbox": {"l": 514.29065, "t": 253.68451000000005, "r": 530.80981, "b": 258.74969, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "122.41", "bbox": {"l": 514.29065, "t": 253.68451000000005, "r": 530.80981, "b": 258.74969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 125, "label": "text", "bbox": {"l": 306.11493, "t": 261.54822, "r": 322.62866, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "Vested", "bbox": {"l": 306.11493, "t": 261.54822, "r": 322.62866, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 126, "label": "text", "bbox": {"l": 394.43222, "t": 261.54822, "r": 400.73563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "(0.", "bbox": {"l": 394.43222, "t": 261.54822, "r": 400.73563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 127, "label": "text", "bbox": {"l": 400.73456, "t": 261.54822, "r": 403.73697, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "5", "bbox": {"l": 400.73456, "t": 261.54822, "r": 403.73697, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 128, "label": "text", "bbox": {"l": 403.73804, "t": 261.54822, "r": 405.53625, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": ")", "bbox": {"l": 403.73804, "t": 261.54822, "r": 405.53625, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 129, "label": "text", "bbox": {"l": 427.7016, "t": 261.54822, "r": 438.80563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "(0.1)", "bbox": {"l": 427.7016, "t": 261.54822, "r": 438.80563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 130, "label": "text", "bbox": {"l": 468.55533, "t": 261.54822, "r": 482.07043, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "87.08", "bbox": {"l": 468.55533, "t": 261.54822, "r": 482.07043, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 131, "label": "text", "bbox": {"l": 516.01862, "t": 261.54822, "r": 529.53375, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": "81.14", "bbox": {"l": 516.01862, "t": 261.54822, "r": 529.53375, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 132, "label": "text", "bbox": {"l": 306.11493, "t": 269.64148, "r": 356.24771, "b": 274.70667000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 107, "text": "Canceled or forfeited", "bbox": {"l": 306.11493, "t": 269.64148, "r": 356.24771, "b": 274.70667000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 133, "label": "text", "bbox": {"l": 394.43222, "t": 270.31946000000005, "r": 400.73563, "b": 275.38464, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 108, "text": "(0.", "bbox": {"l": 394.43222, "t": 270.31946000000005, "r": 400.73563, "b": 275.38464, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 134, "label": "text", "bbox": {"l": 400.73456, "t": 270.31946000000005, "r": 403.73697, "b": 275.38464, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 109, "text": "1", "bbox": {"l": 400.73456, "t": 270.31946000000005, "r": 403.73697, "b": 275.38464, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 135, "label": "text", "bbox": {"l": 403.73804, "t": 270.31946000000005, "r": 405.53625, "b": 275.38464, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 110, "text": ")", "bbox": {"l": 403.73804, "t": 270.31946000000005, "r": 405.53625, "b": 275.38464, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 136, "label": "text", "bbox": {"l": 431.02802, "t": 270.31946000000005, "r": 436.4280099999999, "b": 275.38464, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 111, "text": "-", "bbox": {"l": 431.02802, "t": 270.31946000000005, "r": 436.4280099999999, "b": 275.38464, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 137, "label": "text", "bbox": {"l": 465.83099000000004, "t": 270.31946000000005, "r": 482.35013, "b": 275.38464, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 112, "text": "102.01", "bbox": {"l": 465.83099000000004, "t": 270.31946000000005, "r": 482.35013, "b": 275.38464, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 138, "label": "text", "bbox": {"l": 516.01862, "t": 270.31946000000005, "r": 529.53375, "b": 275.38464, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 113, "text": "92.18", "bbox": {"l": 516.01862, "t": 270.31946000000005, "r": 529.53375, "b": 275.38464, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 139, "label": "text", "bbox": {"l": 306.11493, "t": 278.48572, "r": 373.35764, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 114, "text": "Nonvested on December 31", "bbox": {"l": 306.11493, "t": 278.48572, "r": 373.35764, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 140, "label": "text", "bbox": {"l": 396.24661, "t": 278.48572, "r": 403.75531, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 115, "text": "1.0", "bbox": {"l": 396.24661, "t": 278.48572, "r": 403.75531, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 141, "label": "text", "bbox": {"l": 429.51599, "t": 278.48572, "r": 437.02469, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 116, "text": "0.3", "bbox": {"l": 429.51599, "t": 278.48572, "r": 437.02469, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 142, "label": "text", "bbox": {"l": 463.7142, "t": 278.48572, "r": 484.73965000000004, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 117, "text": "104.85 $", "bbox": {"l": 463.7142, "t": 278.48572, "r": 484.73965000000004, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 143, "label": "text", "bbox": {"l": 512.99463, "t": 278.48572, "r": 534.02008, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 118, "text": "$ 104.51", "bbox": {"l": 512.99463, "t": 278.48572, "r": 534.02008, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ecel", "ched", "lcel", "ched", "lcel", "nl", "ecel", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 7, "num_cols": 5, "table_cells": [{"bbox": {"l": 459.04861, "t": 221.62415, "r": 542.00018, "b": 232.89935000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 5, "text": "Weighted Average Grant Date Fair Value", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 393.2442, "t": 236.74712999999997, "r": 407.34631, "b": 241.81232, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "RS U s", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 392.09671, "t": 221.57446000000004, "r": 438.0145, "b": 226.63964999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 3, "text": "Shares (in millions)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 427.18323, "t": 236.74712999999997, "r": 440.98778999999996, "b": 241.81232, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "PSUs", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 468.38254, "t": 236.74712999999997, "r": 482.48465000000004, "b": 241.81232, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "RSUs", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 516.92578, "t": 236.74712999999997, "r": 530.73035, "b": 241.81232, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "PSUs", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 306.11493, "t": 244.61084000000005, "r": 364.65607, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Nonvested on Janua ry 1", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 396.24661, "t": 244.91327, "r": 403.75531, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "1. 1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 429.81838999999997, "t": 244.91327, "r": 437.32708999999994, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 465.52859, "t": 244.91327, "r": 483.55001999999996, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "90.10 $", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 513.44824, "t": 244.91327, "r": 531.46967, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "$ 91.19", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 306.11493, "t": 253.68451000000005, "r": 325.62674, "b": 258.74969, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Granted", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 396.24661, "t": 253.68451000000005, "r": 403.75531, "b": 258.74969, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "0. 5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 429.81838999999997, "t": 253.68451000000005, "r": 437.32708999999994, "b": 258.74969, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 466.43579000000005, "t": 253.68451000000005, "r": 482.54831, "b": 258.74969, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "117.44", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 514.29065, "t": 253.68451000000005, "r": 530.80981, "b": 258.74969, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "122.41", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 306.11493, "t": 261.54822, "r": 322.62866, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Vested", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 394.43222, "t": 261.54822, "r": 405.53625, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "(0. 5 )", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 427.7016, "t": 261.54822, "r": 438.80563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "(0.1)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 468.55533, "t": 261.54822, "r": 482.07043, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "87.08", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 516.01862, "t": 261.54822, "r": 529.53375, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "81.14", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 306.11493, "t": 269.64148, "r": 356.24771, "b": 274.70667000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Canceled or forfeited", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 394.43222, "t": 270.31946000000005, "r": 405.53625, "b": 275.38464, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "(0. 1 )", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 431.02802, "t": 270.31946000000005, "r": 436.4280099999999, "b": 275.38464, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 465.83099000000004, "t": 270.31946000000005, "r": 482.35013, "b": 275.38464, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "102.01", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 516.01862, "t": 270.31946000000005, "r": 529.53375, "b": 275.38464, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "92.18", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 306.11493, "t": 278.48572, "r": 373.35764, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Nonvested on December 31", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 396.24661, "t": 278.48572, "r": 403.75531, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "1.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 429.51599, "t": 278.48572, "r": 437.02469, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 463.7142, "t": 278.48572, "r": 484.73965000000004, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "104.85 $", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 512.99463, "t": 278.48572, "r": 534.02008, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "$ 104.51", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "caption", "id": 6, "page_no": 7, "cluster": {"id": 6, "label": "caption", "bbox": {"l": 50.112, "t": 320.87735, "r": 545.11377, "b": 365.64987, "coord_origin": "TOPLEFT"}, "confidence": 0.9140303134918213, "cells": [{"id": 119, "text": "Figure 5:", "bbox": {"l": 50.112, "t": 320.87735, "r": 86.864021, "b": 329.78391, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "One of the benefits of TableFormer is that it is language agnostic, as an example, the left part of the illustration", "bbox": {"l": 93.917542, "t": 320.87735, "r": 545.11371, "b": 329.78391, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "demonstrates TableFormer predictions on previously unseen language (Japanese). Additionally, we see that TableFormer is", "bbox": {"l": 50.112, "t": 332.83233999999993, "r": 545.11371, "b": 341.73889, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "robust to variability in style and content, right side of the illustration shows the example of the TableFormer prediction from", "bbox": {"l": 50.112, "t": 344.78732, "r": 545.11377, "b": 353.69388, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "the FinTabNet dataset.", "bbox": {"l": 50.112, "t": 356.74332, "r": 139.79532, "b": 365.64987, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 5: One of the benefits of TableFormer is that it is language agnostic, as an example, the left part of the illustration demonstrates TableFormer predictions on previously unseen language (Japanese). Additionally, we see that TableFormer is robust to variability in style and content, right side of the illustration shows the example of the TableFormer prediction from the FinTabNet dataset."}, {"label": "picture", "id": 12, "page_no": 7, "cluster": {"id": 12, "label": "picture", "bbox": {"l": 216.76925659179688, "t": 380.4906311035156, "r": 375.7829284667969, "b": 443.34698486328125, "coord_origin": "TOPLEFT"}, "confidence": 0.805853009223938, "cells": [{"id": 124, "text": "Red - PDF cells, Green - predicted bounding boxes", "bbox": {"l": 220.26282, "t": 381.77722, "r": 342.07819, "b": 386.44281, "coord_origin": "TOPLEFT"}}], "children": [{"id": 144, "label": "text", "bbox": {"l": 220.26282, "t": 381.77722, "r": 342.07819, "b": 386.44281, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 124, "text": "Red - PDF cells, Green - predicted bounding boxes", "bbox": {"l": 220.26282, "t": 381.77722, "r": 342.07819, "b": 386.44281, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "picture", "id": 11, "page_no": 7, "cluster": {"id": 11, "label": "picture", "bbox": {"l": 51.736167907714844, "t": 380.48065185546875, "r": 211.83778381347656, "b": 443.6580810546875, "coord_origin": "TOPLEFT"}, "confidence": 0.8308426737785339, "cells": [{"id": 125, "text": "Ground Truth", "bbox": {"l": 53.715248, "t": 381.77722, "r": 85.657333, "b": 386.44281, "coord_origin": "TOPLEFT"}}], "children": [{"id": 145, "label": "text", "bbox": {"l": 53.715248, "t": 381.77722, "r": 85.657333, "b": 386.44281, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 125, "text": "Ground Truth", "bbox": {"l": 53.715248, "t": 381.77722, "r": 85.657333, "b": 386.44281, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "picture", "id": 13, "page_no": 7, "cluster": {"id": 13, "label": "picture", "bbox": {"l": 383.1364440917969, "t": 381.2313232421875, "r": 542.1132202148438, "b": 442.7749328613281, "coord_origin": "TOPLEFT"}, "confidence": 0.7881615161895752, "cells": [{"id": 126, "text": "16", "bbox": {"l": 437.37939, "t": 400.55295, "r": 443.69870000000003, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "17", "bbox": {"l": 450.33203, "t": 400.55295, "r": 456.6513100000001, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "18", "bbox": {"l": 463.28464, "t": 400.55295, "r": 469.60394, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "19", "bbox": {"l": 476.23724000000004, "t": 400.55295, "r": 482.5565500000001, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "20", "bbox": {"l": 489.18988, "t": 400.55295, "r": 495.50916, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "21", "bbox": {"l": 502.14251999999993, "t": 400.55295, "r": 508.46178999999995, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "22", "bbox": {"l": 515.09509, "t": 400.55295, "r": 521.41443, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "23", "bbox": {"l": 385.2814, "t": 411.03836000000007, "r": 391.60071, "b": 417.35699, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "24", "bbox": {"l": 398.52341, "t": 411.03836000000007, "r": 404.84271, "b": 417.35699, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "25", "bbox": {"l": 411.47604, "t": 411.03836000000007, "r": 417.79535, "b": 417.35699, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "26", "bbox": {"l": 437.37939, "t": 411.03836000000007, "r": 443.69870000000003, "b": 417.35699, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "27", "bbox": {"l": 450.33203, "t": 411.03836000000007, "r": 456.6513100000001, "b": 417.35699, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "28", "bbox": {"l": 463.28464, "t": 411.03836000000007, "r": 469.60394, "b": 417.35699, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "30", "bbox": {"l": 385.2814, "t": 421.0697, "r": 391.60071, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "31", "bbox": {"l": 398.52341, "t": 421.0697, "r": 404.84271, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "32", "bbox": {"l": 411.47604, "t": 421.0697, "r": 417.79532, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "33", "bbox": {"l": 424.42865, "t": 421.0697, "r": 430.74796, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "34", "bbox": {"l": 437.38129, "t": 421.0697, "r": 443.70056, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "35", "bbox": {"l": 450.33389000000005, "t": 421.0697, "r": 456.65319999999997, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "36", "bbox": {"l": 463.2865, "t": 421.0697, "r": 469.6058, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "37", "bbox": {"l": 476.23914, "t": 421.0697, "r": 482.55841, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "38", "bbox": {"l": 489.1917700000001, "t": 421.0697, "r": 495.51105, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "39", "bbox": {"l": 502.14438, "t": 421.0697, "r": 508.46368, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "40", "bbox": {"l": 515.09705, "t": 421.0697, "r": 521.41632, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "41", "bbox": {"l": 528.04962, "t": 421.0697, "r": 534.3689, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "42", "bbox": {"l": 385.2814, "t": 432.04431, "r": 391.60071, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "43", "bbox": {"l": 398.52341, "t": 432.04431, "r": 404.84271, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "44", "bbox": {"l": 411.47604, "t": 432.04431, "r": 417.79532, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "45", "bbox": {"l": 424.42865, "t": 432.04431, "r": 430.74796, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "46", "bbox": {"l": 437.38129, "t": 432.04431, "r": 443.70056, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "47", "bbox": {"l": 450.33389000000005, "t": 432.04431, "r": 456.65319999999997, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "48", "bbox": {"l": 463.2865, "t": 432.04431, "r": 469.6058, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "49", "bbox": {"l": 476.23914, "t": 432.04431, "r": 482.55841, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "50", "bbox": {"l": 489.1917700000001, "t": 432.04431, "r": 495.51105, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "51", "bbox": {"l": 502.14438, "t": 432.04431, "r": 508.46368, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "52", "bbox": {"l": 515.09705, "t": 432.04431, "r": 521.41632, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "53", "bbox": {"l": 528.04962, "t": 432.04431, "r": 534.3689, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "0", "bbox": {"l": 385.2814, "t": 389.20004, "r": 388.44073, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "1", "bbox": {"l": 398.52341, "t": 389.20004, "r": 401.68274, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "2", "bbox": {"l": 411.4754, "t": 389.20004, "r": 414.63474, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "3", "bbox": {"l": 424.4274, "t": 389.20004, "r": 427.58673, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "4", "bbox": {"l": 437.37939, "t": 389.20004, "r": 440.53870000000006, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "5", "bbox": {"l": 450.33136, "t": 389.20004, "r": 453.49069000000003, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "6", "bbox": {"l": 463.28336, "t": 389.20004, "r": 466.44269, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "7", "bbox": {"l": 476.23535, "t": 389.20004, "r": 479.39468, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "8", "bbox": {"l": 489.18735, "t": 389.20004, "r": 492.34668, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "9", "bbox": {"l": 502.13933999999995, "t": 389.20004, "r": 505.29868000000005, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "10", "bbox": {"l": 515.09131, "t": 389.20004, "r": 521.41064, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "11", "bbox": {"l": 528.04364, "t": 389.20004, "r": 534.13104, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "12", "bbox": {"l": 385.2814, "t": 398.97464, "r": 391.60071, "b": 405.29327, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "13", "bbox": {"l": 398.52341, "t": 398.97464, "r": 404.84271, "b": 405.29327, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "14", "bbox": {"l": 411.47604, "t": 398.97464, "r": 417.79535, "b": 405.29327, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "15", "bbox": {"l": 424.42719, "t": 406.77463000000006, "r": 430.74648999999994, "b": 413.09326, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "29", "bbox": {"l": 502.86941999999993, "t": 410.99438, "r": 509.18871999999993, "b": 417.31302, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "Predicted Structure", "bbox": {"l": 384.35437, "t": 381.77722, "r": 430.99261, "b": 386.44281, "coord_origin": "TOPLEFT"}}], "children": [{"id": 146, "label": "text", "bbox": {"l": 437.37939, "t": 400.55295, "r": 443.69870000000003, "b": 406.87158, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 126, "text": "16", "bbox": {"l": 437.37939, "t": 400.55295, "r": 443.69870000000003, "b": 406.87158, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 147, "label": "text", "bbox": {"l": 450.33203, "t": 400.55295, "r": 456.6513100000001, "b": 406.87158, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 127, "text": "17", "bbox": {"l": 450.33203, "t": 400.55295, "r": 456.6513100000001, "b": 406.87158, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 148, "label": "text", "bbox": {"l": 463.28464, "t": 400.55295, "r": 469.60394, "b": 406.87158, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 128, "text": "18", "bbox": {"l": 463.28464, "t": 400.55295, "r": 469.60394, "b": 406.87158, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 149, "label": "text", "bbox": {"l": 476.23724000000004, "t": 400.55295, "r": 482.5565500000001, "b": 406.87158, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 129, "text": "19", "bbox": {"l": 476.23724000000004, "t": 400.55295, "r": 482.5565500000001, "b": 406.87158, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 150, "label": "text", "bbox": {"l": 489.18988, "t": 400.55295, "r": 495.50916, "b": 406.87158, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 130, "text": "20", "bbox": {"l": 489.18988, "t": 400.55295, "r": 495.50916, "b": 406.87158, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 151, "label": "text", "bbox": {"l": 502.14251999999993, "t": 400.55295, "r": 508.46178999999995, "b": 406.87158, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 131, "text": "21", "bbox": {"l": 502.14251999999993, "t": 400.55295, "r": 508.46178999999995, "b": 406.87158, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 152, "label": "text", "bbox": {"l": 515.09509, "t": 400.55295, "r": 521.41443, "b": 406.87158, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 132, "text": "22", "bbox": {"l": 515.09509, "t": 400.55295, "r": 521.41443, "b": 406.87158, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 153, "label": "text", "bbox": {"l": 385.2814, "t": 411.03836000000007, "r": 391.60071, "b": 417.35699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 133, "text": "23", "bbox": {"l": 385.2814, "t": 411.03836000000007, "r": 391.60071, "b": 417.35699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 154, "label": "text", "bbox": {"l": 398.52341, "t": 411.03836000000007, "r": 404.84271, "b": 417.35699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 134, "text": "24", "bbox": {"l": 398.52341, "t": 411.03836000000007, "r": 404.84271, "b": 417.35699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 155, "label": "text", "bbox": {"l": 411.47604, "t": 411.03836000000007, "r": 417.79535, "b": 417.35699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 135, "text": "25", "bbox": {"l": 411.47604, "t": 411.03836000000007, "r": 417.79535, "b": 417.35699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 156, "label": "text", "bbox": {"l": 437.37939, "t": 411.03836000000007, "r": 443.69870000000003, "b": 417.35699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 136, "text": "26", "bbox": {"l": 437.37939, "t": 411.03836000000007, "r": 443.69870000000003, "b": 417.35699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 157, "label": "text", "bbox": {"l": 450.33203, "t": 411.03836000000007, "r": 456.6513100000001, "b": 417.35699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 137, "text": "27", "bbox": {"l": 450.33203, "t": 411.03836000000007, "r": 456.6513100000001, "b": 417.35699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 158, "label": "text", "bbox": {"l": 463.28464, "t": 411.03836000000007, "r": 469.60394, "b": 417.35699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 138, "text": "28", "bbox": {"l": 463.28464, "t": 411.03836000000007, "r": 469.60394, "b": 417.35699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 159, "label": "text", "bbox": {"l": 385.2814, "t": 421.0697, "r": 391.60071, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 139, "text": "30", "bbox": {"l": 385.2814, "t": 421.0697, "r": 391.60071, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 160, "label": "text", "bbox": {"l": 398.52341, "t": 421.0697, "r": 404.84271, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 140, "text": "31", "bbox": {"l": 398.52341, "t": 421.0697, "r": 404.84271, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 161, "label": "text", "bbox": {"l": 411.47604, "t": 421.0697, "r": 417.79532, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 141, "text": "32", "bbox": {"l": 411.47604, "t": 421.0697, "r": 417.79532, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 162, "label": "text", "bbox": {"l": 424.42865, "t": 421.0697, "r": 430.74796, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 142, "text": "33", "bbox": {"l": 424.42865, "t": 421.0697, "r": 430.74796, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 163, "label": "text", "bbox": {"l": 437.38129, "t": 421.0697, "r": 443.70056, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 143, "text": "34", "bbox": {"l": 437.38129, "t": 421.0697, "r": 443.70056, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 164, "label": "text", "bbox": {"l": 450.33389000000005, "t": 421.0697, "r": 456.65319999999997, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 144, "text": "35", "bbox": {"l": 450.33389000000005, "t": 421.0697, "r": 456.65319999999997, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 165, "label": "text", "bbox": {"l": 463.2865, "t": 421.0697, "r": 469.6058, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 145, "text": "36", "bbox": {"l": 463.2865, "t": 421.0697, "r": 469.6058, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 166, "label": "text", "bbox": {"l": 476.23914, "t": 421.0697, "r": 482.55841, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 146, "text": "37", "bbox": {"l": 476.23914, "t": 421.0697, "r": 482.55841, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 167, "label": "text", "bbox": {"l": 489.1917700000001, "t": 421.0697, "r": 495.51105, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 147, "text": "38", "bbox": {"l": 489.1917700000001, "t": 421.0697, "r": 495.51105, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 168, "label": "text", "bbox": {"l": 502.14438, "t": 421.0697, "r": 508.46368, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 148, "text": "39", "bbox": {"l": 502.14438, "t": 421.0697, "r": 508.46368, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 169, "label": "text", "bbox": {"l": 515.09705, "t": 421.0697, "r": 521.41632, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 149, "text": "40", "bbox": {"l": 515.09705, "t": 421.0697, "r": 521.41632, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 170, "label": "text", "bbox": {"l": 528.04962, "t": 421.0697, "r": 534.3689, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 150, "text": "41", "bbox": {"l": 528.04962, "t": 421.0697, "r": 534.3689, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 171, "label": "text", "bbox": {"l": 385.2814, "t": 432.04431, "r": 391.60071, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 151, "text": "42", "bbox": {"l": 385.2814, "t": 432.04431, "r": 391.60071, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 172, "label": "text", "bbox": {"l": 398.52341, "t": 432.04431, "r": 404.84271, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 152, "text": "43", "bbox": {"l": 398.52341, "t": 432.04431, "r": 404.84271, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 173, "label": "text", "bbox": {"l": 411.47604, "t": 432.04431, "r": 417.79532, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 153, "text": "44", "bbox": {"l": 411.47604, "t": 432.04431, "r": 417.79532, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 174, "label": "text", "bbox": {"l": 424.42865, "t": 432.04431, "r": 430.74796, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 154, "text": "45", "bbox": {"l": 424.42865, "t": 432.04431, "r": 430.74796, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 175, "label": "text", "bbox": {"l": 437.38129, "t": 432.04431, "r": 443.70056, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 155, "text": "46", "bbox": {"l": 437.38129, "t": 432.04431, "r": 443.70056, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 176, "label": "text", "bbox": {"l": 450.33389000000005, "t": 432.04431, "r": 456.65319999999997, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 156, "text": "47", "bbox": {"l": 450.33389000000005, "t": 432.04431, "r": 456.65319999999997, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 177, "label": "text", "bbox": {"l": 463.2865, "t": 432.04431, "r": 469.6058, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 157, "text": "48", "bbox": {"l": 463.2865, "t": 432.04431, "r": 469.6058, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 178, "label": "text", "bbox": {"l": 476.23914, "t": 432.04431, "r": 482.55841, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 158, "text": "49", "bbox": {"l": 476.23914, "t": 432.04431, "r": 482.55841, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 179, "label": "text", "bbox": {"l": 489.1917700000001, "t": 432.04431, "r": 495.51105, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 159, "text": "50", "bbox": {"l": 489.1917700000001, "t": 432.04431, "r": 495.51105, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 180, "label": "text", "bbox": {"l": 502.14438, "t": 432.04431, "r": 508.46368, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 160, "text": "51", "bbox": {"l": 502.14438, "t": 432.04431, "r": 508.46368, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 181, "label": "text", "bbox": {"l": 515.09705, "t": 432.04431, "r": 521.41632, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 161, "text": "52", "bbox": {"l": 515.09705, "t": 432.04431, "r": 521.41632, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 182, "label": "text", "bbox": {"l": 528.04962, "t": 432.04431, "r": 534.3689, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 162, "text": "53", "bbox": {"l": 528.04962, "t": 432.04431, "r": 534.3689, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 183, "label": "text", "bbox": {"l": 385.2814, "t": 389.20004, "r": 388.44073, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 163, "text": "0", "bbox": {"l": 385.2814, "t": 389.20004, "r": 388.44073, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 184, "label": "text", "bbox": {"l": 398.52341, "t": 389.20004, "r": 401.68274, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 164, "text": "1", "bbox": {"l": 398.52341, "t": 389.20004, "r": 401.68274, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 185, "label": "text", "bbox": {"l": 411.4754, "t": 389.20004, "r": 414.63474, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 165, "text": "2", "bbox": {"l": 411.4754, "t": 389.20004, "r": 414.63474, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 186, "label": "text", "bbox": {"l": 424.4274, "t": 389.20004, "r": 427.58673, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 166, "text": "3", "bbox": {"l": 424.4274, "t": 389.20004, "r": 427.58673, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 187, "label": "text", "bbox": {"l": 437.37939, "t": 389.20004, "r": 440.53870000000006, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 167, "text": "4", "bbox": {"l": 437.37939, "t": 389.20004, "r": 440.53870000000006, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 188, "label": "text", "bbox": {"l": 450.33136, "t": 389.20004, "r": 453.49069000000003, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 168, "text": "5", "bbox": {"l": 450.33136, "t": 389.20004, "r": 453.49069000000003, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 189, "label": "text", "bbox": {"l": 463.28336, "t": 389.20004, "r": 466.44269, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 169, "text": "6", "bbox": {"l": 463.28336, "t": 389.20004, "r": 466.44269, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 190, "label": "text", "bbox": {"l": 476.23535, "t": 389.20004, "r": 479.39468, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 170, "text": "7", "bbox": {"l": 476.23535, "t": 389.20004, "r": 479.39468, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 191, "label": "text", "bbox": {"l": 489.18735, "t": 389.20004, "r": 492.34668, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 171, "text": "8", "bbox": {"l": 489.18735, "t": 389.20004, "r": 492.34668, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 192, "label": "text", "bbox": {"l": 502.13933999999995, "t": 389.20004, "r": 505.29868000000005, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 172, "text": "9", "bbox": {"l": 502.13933999999995, "t": 389.20004, "r": 505.29868000000005, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 193, "label": "text", "bbox": {"l": 515.09131, "t": 389.20004, "r": 521.41064, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 173, "text": "10", "bbox": {"l": 515.09131, "t": 389.20004, "r": 521.41064, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 194, "label": "text", "bbox": {"l": 528.04364, "t": 389.20004, "r": 534.13104, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 174, "text": "11", "bbox": {"l": 528.04364, "t": 389.20004, "r": 534.13104, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 195, "label": "text", "bbox": {"l": 385.2814, "t": 398.97464, "r": 391.60071, "b": 405.29327, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 175, "text": "12", "bbox": {"l": 385.2814, "t": 398.97464, "r": 391.60071, "b": 405.29327, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 196, "label": "text", "bbox": {"l": 398.52341, "t": 398.97464, "r": 404.84271, "b": 405.29327, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 176, "text": "13", "bbox": {"l": 398.52341, "t": 398.97464, "r": 404.84271, "b": 405.29327, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 197, "label": "text", "bbox": {"l": 411.47604, "t": 398.97464, "r": 417.79535, "b": 405.29327, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 177, "text": "14", "bbox": {"l": 411.47604, "t": 398.97464, "r": 417.79535, "b": 405.29327, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 198, "label": "text", "bbox": {"l": 424.42719, "t": 406.77463000000006, "r": 430.74648999999994, "b": 413.09326, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 178, "text": "15", "bbox": {"l": 424.42719, "t": 406.77463000000006, "r": 430.74648999999994, "b": 413.09326, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 199, "label": "text", "bbox": {"l": 502.86941999999993, "t": 410.99438, "r": 509.18871999999993, "b": 417.31302, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 179, "text": "29", "bbox": {"l": 502.86941999999993, "t": 410.99438, "r": 509.18871999999993, "b": 417.31302, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 200, "label": "text", "bbox": {"l": 384.35437, "t": 381.77722, "r": 430.99261, "b": 386.44281, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 180, "text": "Predicted Structure", "bbox": {"l": 384.35437, "t": 381.77722, "r": 430.99261, "b": 386.44281, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "caption", "id": 5, "page_no": 7, "cluster": {"id": 5, "label": "caption", "bbox": {"l": 62.595001, "t": 458.72836, "r": 532.63049, "b": 467.63492, "coord_origin": "TOPLEFT"}, "confidence": 0.9153602719306946, "cells": [{"id": 181, "text": "Figure 6: An example of TableFormer predictions (bounding boxes and structure) from generated SynthTabNet table.", "bbox": {"l": 62.595001, "t": 458.72836, "r": 532.63049, "b": 467.63492, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 6: An example of TableFormer predictions (bounding boxes and structure) from generated SynthTabNet table."}, {"label": "section_header", "id": 2, "page_no": 7, "cluster": {"id": 2, "label": "section_header", "bbox": {"l": 50.112, "t": 491.39536, "r": 163.7558, "b": 501.24741, "coord_origin": "TOPLEFT"}, "confidence": 0.9561247229576111, "cells": [{"id": 182, "text": "5.5.", "bbox": {"l": 50.112, "t": 491.39536, "r": 64.448898, "b": 501.24741, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "Qualitative Analysis", "bbox": {"l": 74.006828, "t": 491.39536, "r": 163.7558, "b": 501.24741, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5.5. Qualitative Analysis"}, {"label": "text", "id": 1, "page_no": 7, "cluster": {"id": 1, "label": "text", "bbox": {"l": 50.112, "t": 536.87337, "r": 286.36511, "b": 713.1519470000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9852361679077148, "cells": [{"id": 184, "text": "We showcase several visualizations for the different", "bbox": {"l": 62.067001, "t": 536.87337, "r": 286.36499, "b": 545.77992, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": "components of our network on various", "bbox": {"l": 50.112, "t": 548.82837, "r": 211.15741, "b": 557.73492, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "\u201ccomplex\u201d", "bbox": {"l": 215.10000999999997, "t": 548.91803, "r": 259.17453, "b": 557.50578, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "tables", "bbox": {"l": 263.12, "t": 548.82837, "r": 286.36273, "b": 557.73492, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": "within datasets presented in this work in Fig. 5 and Fig. 6", "bbox": {"l": 50.112, "t": 560.78337, "r": 286.36505, "b": 569.68993, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "As it is shown, our model is able to predict bounding boxes", "bbox": {"l": 50.112, "t": 572.73837, "r": 286.36508, "b": 581.6449299999999, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "for all table cells, even for the empty ones. Additionally,", "bbox": {"l": 50.112, "t": 584.69337, "r": 286.36508, "b": 593.59993, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "our post-processing techniques can extract the cell content", "bbox": {"l": 50.112, "t": 596.64937, "r": 286.36505, "b": 605.55592, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": "by matching the predicted bounding boxes to the PDF cells", "bbox": {"l": 50.112, "t": 608.60437, "r": 286.36508, "b": 617.51093, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "based on their overlap and spatial proximity. The left part", "bbox": {"l": 50.112, "t": 620.55937, "r": 286.36508, "b": 629.46593, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "of Fig. 5 demonstrates also the adaptability of our method", "bbox": {"l": 50.112, "t": 632.51437, "r": 286.36508, "b": 641.42093, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "to any language, as it can successfully extract Japanese", "bbox": {"l": 50.112, "t": 644.46938, "r": 286.36508, "b": 653.37593, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "text, although the training set contains only English content.", "bbox": {"l": 50.112, "t": 656.42438, "r": 286.36511, "b": 665.33094, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "We provide more visualizations including the intermediate", "bbox": {"l": 50.112, "t": 668.38037, "r": 286.36508, "b": 677.28694, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "steps in the supplementary material. Overall these illustra-", "bbox": {"l": 50.112, "t": 680.33537, "r": 286.36511, "b": 689.24194, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "tions justify the versatility of our method across a diverse", "bbox": {"l": 50.112, "t": 692.290375, "r": 286.36511, "b": 701.196945, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "range of table appearances and content type.", "bbox": {"l": 50.112, "t": 704.245377, "r": 226.88833999999997, "b": 713.1519470000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "We showcase several visualizations for the different components of our network on various \"complex\" tables within datasets presented in this work in Fig. 5 and Fig. 6 As it is shown, our model is able to predict bounding boxes for all table cells, even for the empty ones. Additionally, our post-processing techniques can extract the cell content by matching the predicted bounding boxes to the PDF cells based on their overlap and spatial proximity. The left part of Fig. 5 demonstrates also the adaptability of our method to any language, as it can successfully extract Japanese text, although the training set contains only English content. We provide more visualizations including the intermediate steps in the supplementary material. Overall these illustrations justify the versatility of our method across a diverse range of table appearances and content type."}, {"label": "section_header", "id": 4, "page_no": 7, "cluster": {"id": 4, "label": "section_header", "bbox": {"l": 308.862, "t": 490.70892, "r": 460.84848, "b": 501.45663, "coord_origin": "TOPLEFT"}, "confidence": 0.9436525702476501, "cells": [{"id": 201, "text": "6.", "bbox": {"l": 308.862, "t": 490.70892, "r": 316.07382, "b": 501.45663, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": "Future Work & Conclusion", "bbox": {"l": 325.68954, "t": 490.70892, "r": 460.84848, "b": 501.45663, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "6. Future Work & Conclusion"}, {"label": "text", "id": 0, "page_no": 7, "cluster": {"id": 0, "label": "text", "bbox": {"l": 308.862, "t": 512.89337, "r": 545.11517, "b": 653.30592, "coord_origin": "TOPLEFT"}, "confidence": 0.9875594973564148, "cells": [{"id": 203, "text": "In this paper, we presented TableFormer an end-to-end", "bbox": {"l": 320.81699, "t": 512.89337, "r": 545.11505, "b": 521.79993, "coord_origin": "TOPLEFT"}}, {"id": 204, "text": "transformer based approach to predict table structures and", "bbox": {"l": 308.862, "t": 524.84836, "r": 545.11517, "b": 533.75491, "coord_origin": "TOPLEFT"}}, {"id": 205, "text": "bounding boxes of cells from an image. This approach en-", "bbox": {"l": 308.862, "t": 536.80336, "r": 545.11511, "b": 545.70992, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": "ables us to recreate the table structure, and extract the cell", "bbox": {"l": 308.862, "t": 548.75836, "r": 545.11505, "b": 557.6649199999999, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": "content from PDF or OCR by using bounding boxes. Ad-", "bbox": {"l": 308.862, "t": 560.71336, "r": 545.11517, "b": 569.61992, "coord_origin": "TOPLEFT"}}, {"id": 208, "text": "ditionally, it provides the versatility required in real-world", "bbox": {"l": 308.862, "t": 572.66837, "r": 545.11511, "b": 581.57492, "coord_origin": "TOPLEFT"}}, {"id": 209, "text": "scenarios when dealing with various types of PDF docu-", "bbox": {"l": 308.862, "t": 584.62436, "r": 545.11511, "b": 593.53091, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": "ments, and languages.", "bbox": {"l": 308.862, "t": 596.57936, "r": 400.46808, "b": 605.48592, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "Furthermore, our method outper-", "bbox": {"l": 408.37839, "t": 596.57936, "r": 545.11511, "b": 605.48592, "coord_origin": "TOPLEFT"}}, {"id": 212, "text": "forms all state-of-the-arts with a wide margin. Finally, we", "bbox": {"l": 308.862, "t": 608.53436, "r": 545.11505, "b": 617.44092, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "introduce \u201cSynthTabNet\u201d a challenging synthetically gen-", "bbox": {"l": 308.862, "t": 620.48936, "r": 545.11511, "b": 629.3959199999999, "coord_origin": "TOPLEFT"}}, {"id": 214, "text": "erated dataset that reinforces missing characteristics from", "bbox": {"l": 308.862, "t": 632.4443699999999, "r": 545.11505, "b": 641.35092, "coord_origin": "TOPLEFT"}}, {"id": 215, "text": "other datasets.", "bbox": {"l": 308.862, "t": 644.39937, "r": 365.85803, "b": 653.30592, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In this paper, we presented TableFormer an end-to-end transformer based approach to predict table structures and bounding boxes of cells from an image. This approach enables us to recreate the table structure, and extract the cell content from PDF or OCR by using bounding boxes. Additionally, it provides the versatility required in real-world scenarios when dealing with various types of PDF documents, and languages. Furthermore, our method outperforms all state-of-the-arts with a wide margin. Finally, we introduce \"SynthTabNet\" a challenging synthetically generated dataset that reinforces missing characteristics from other datasets."}, {"label": "section_header", "id": 3, "page_no": 7, "cluster": {"id": 3, "label": "section_header", "bbox": {"l": 308.862, "t": 672.09892, "r": 364.40585, "b": 682.84664, "coord_origin": "TOPLEFT"}, "confidence": 0.9442470073699951, "cells": [{"id": 216, "text": "References", "bbox": {"l": 308.862, "t": 672.09892, "r": 364.40585, "b": 682.84664, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "References"}, {"label": "list_item", "id": 10, "page_no": 7, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 313.345, "t": 693.9617920000001, "r": 545.1134, "b": 712.936752, "coord_origin": "TOPLEFT"}, "confidence": 0.8318753838539124, "cells": [{"id": 217, "text": "[1]", "bbox": {"l": 313.345, "t": 693.9617920000001, "r": 323.80792, "b": 701.977753, "coord_origin": "TOPLEFT"}}, {"id": 218, "text": "Nicolas Carion, Francisco Massa, Gabriel Synnaeve, Nicolas", "bbox": {"l": 326.05127, "t": 693.9617920000001, "r": 545.10852, "b": 701.977753, "coord_origin": "TOPLEFT"}}, {"id": 219, "text": "Usunier, Alexander Kirillov, and Sergey Zagoruyko. End-to-", "bbox": {"l": 328.78101, "t": 704.920792, "r": 545.1134, "b": 712.936752, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[1] Nicolas Carion, Francisco Massa, Gabriel Synnaeve, Nicolas Usunier, Alexander Kirillov, and Sergey Zagoruyko. End-to-"}, {"label": "page_footer", "id": 9, "page_no": 7, "cluster": {"id": 9, "label": "page_footer", "bbox": {"l": 295.121, "t": 734.133366, "r": 300.10229, "b": 743.039928, "coord_origin": "TOPLEFT"}, "confidence": 0.8709858059883118, "cells": [{"id": 220, "text": "8", "bbox": {"l": 295.121, "t": 734.133366, "r": 300.10229, "b": 743.039928, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "8"}, {"label": "picture", "id": 15, "page_no": 7, "cluster": {"id": 15, "label": "picture", "bbox": {"l": 305.5836486816406, "t": 98.65415954589844, "r": 554.8258666992188, "b": 180.6267547607422, "coord_origin": "TOPLEFT"}, "confidence": 0.7699173092842102, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "picture", "id": 14, "page_no": 7, "cluster": {"id": 14, "label": "picture", "bbox": {"l": 49.97503662109375, "t": 103.71266174316406, "r": 301.6335754394531, "b": 187.5789337158203, "coord_origin": "TOPLEFT"}, "confidence": 0.7873926162719727, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "body": [{"label": "caption", "id": 18, "page_no": 7, "cluster": {"id": 18, "label": "caption", "bbox": {"l": 53.811783000000005, "t": 208.23328000000004, "r": 385.93451, "b": 216.10645, "coord_origin": "TOPLEFT"}, "confidence": 0.5986505746841431, "cells": [{"id": 0, "text": "b.", "bbox": {"l": 53.811783000000005, "t": 208.23328000000004, "r": 62.219952, "b": 216.10645, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Structure predicted by TableFormer, with superimposed matched PDF cell text:", "bbox": {"l": 66.424026, "t": 208.23328000000004, "r": 385.93451, "b": 216.10645, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "b. Structure predicted by TableFormer, with superimposed matched PDF cell text:"}, {"label": "section_header", "id": 29, "page_no": 7, "cluster": {"id": 29, "label": "section_header", "bbox": {"l": 53.811783000000005, "t": 94.28112999999996, "r": 284.34592, "b": 102.15430000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.46452972292900085, "cells": [{"id": 2, "text": "Japanese language (previously unseen by TableFormer):", "bbox": {"l": 53.811783000000005, "t": 94.28112999999996, "r": 284.34592, "b": 102.15430000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Japanese language (previously unseen by TableFormer):"}, {"label": "section_header", "id": 31, "page_no": 7, "cluster": {"id": 31, "label": "section_header", "bbox": {"l": 304.83081, "t": 94.28112999999996, "r": 431.09119, "b": 102.15430000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.4629225730895996, "cells": [{"id": 3, "text": "Example table from FinTabNet:", "bbox": {"l": 304.83081, "t": 94.28112999999996, "r": 431.09119, "b": 102.15430000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Example table from FinTabNet:"}, {"label": "list_item", "id": 20, "page_no": 7, "cluster": {"id": 20, "label": "list_item", "bbox": {"l": 53.286037, "t": 78.68756000000008, "r": 61.550289, "b": 86.56073000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.5820134282112122, "cells": [{"id": 4, "text": "a.", "bbox": {"l": 53.286037, "t": 78.68756000000008, "r": 61.550289, "b": 86.56073000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "a."}, {"label": "list_item", "id": 21, "page_no": 7, "cluster": {"id": 21, "label": "list_item", "bbox": {"l": 65.682419, "t": 78.68756000000008, "r": 499.55563, "b": 86.56073000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.541211724281311, "cells": [{"id": 5, "text": "Red - PDF cells, Green - predicted bounding boxes, Blue - post-processed predictions matched to PDF cells", "bbox": {"l": 65.682419, "t": 78.68756000000008, "r": 499.55563, "b": 86.56073000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Red - PDF cells, Green - predicted bounding boxes, Blue - post-processed predictions matched to PDF cells"}, {"label": "table", "id": 8, "page_no": 7, "cluster": {"id": 8, "label": "table", "bbox": {"l": 53.62853240966797, "t": 218.94857788085938, "r": 298.5574951171875, "b": 292.39996337890625, "coord_origin": "TOPLEFT"}, "confidence": 0.8824009299278259, "cells": [{"id": 6, "text": "\u8ad6\u6587\u30d5\u30a1\u30a4\u30eb", "bbox": {"l": 209.93285, "t": 222.18073000000004, "r": 241.04458999999997, "b": 226.36212, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "\u53c2\u8003\u6587\u732e", "bbox": {"l": 263.76489, "t": 222.18073000000004, "r": 284.50589, "b": 226.36212, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "\u51fa\u5178", "bbox": {"l": 110.24990999999999, "t": 229.66594999999995, "r": 120.62018, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "\u30d5\u30a1\u30a4\u30eb", "bbox": {"l": 175.36609, "t": 229.66594999999995, "r": 196.1071, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "\u6570", "bbox": {"l": 196.10756, "t": 229.66594999999995, "r": 201.29247, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "\u82f1\u8a9e", "bbox": {"l": 209.62408, "t": 229.66594999999995, "r": 219.99435, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "\u65e5\u672c\u8a9e", "bbox": {"l": 229.19814, "t": 229.66594999999995, "r": 244.75377, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "\u82f1\u8a9e", "bbox": {"l": 256.1142, "t": 229.66594999999995, "r": 266.48447, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "\u65e5\u672c\u8a9e", "bbox": {"l": 278.38434, "t": 229.66594999999995, "r": 293.93997, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Association for Computational Linguistics(ACL2003)", "bbox": {"l": 55.53052099999999, "t": 236.42584, "r": 162.7131, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "65", "bbox": {"l": 184.39731, "t": 236.42584, "r": 189.56456, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "65", "bbox": {"l": 208.99026, "t": 236.42584, "r": 214.15752, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "0", "bbox": {"l": 234.87517, "t": 236.42584, "r": 237.45833000000002, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "150", "bbox": {"l": 256.88446, "t": 236.42584, "r": 264.6358, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "0", "bbox": {"l": 284.06134, "t": 236.42584, "r": 286.6445, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Computational Linguistics(COLING2002)", "bbox": {"l": 55.53052099999999, "t": 242.62048000000004, "r": 139.72253, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "140", "bbox": {"l": 183.10536, "t": 242.62048000000004, "r": 190.8567, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "140", "bbox": {"l": 207.69832, "t": 242.62048000000004, "r": 215.44965999999997, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "0", "bbox": {"l": 234.87517, "t": 242.62048000000004, "r": 237.45833000000002, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "150", "bbox": {"l": 256.88446, "t": 242.62048000000004, "r": 264.6358, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "0", "bbox": {"l": 284.06134, "t": 242.62048000000004, "r": 286.6445, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "\u96fb\u6c17\u60c5\u5831\u901a\u4fe1\u5b66\u4f1a", "bbox": {"l": 55.53052099999999, "t": 249.79845999999998, "r": 97.013, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "2003", "bbox": {"l": 92.698288, "t": 249.58942000000002, "r": 103.03371, "b": 253.94732999999997, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "\u5e74\u7dcf\u5408\u5927\u4f1a", "bbox": {"l": 103.03389, "t": 249.79845999999998, "r": 128.96027, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "150", "bbox": {"l": 183.10536, "t": 248.81506000000002, "r": 190.8567, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "8", "bbox": {"l": 210.28223, "t": 248.81506000000002, "r": 212.86539, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "142", "bbox": {"l": 232.29153, "t": 248.81506000000002, "r": 240.04287999999997, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "223", "bbox": {"l": 256.88446, "t": 248.81506000000002, "r": 264.6358, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "147", "bbox": {"l": 281.47742, "t": 248.81506000000002, "r": 289.22876, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "\u60c5\u5831\u51e6\u7406\u5b66\u4f1a\u7b2c", "bbox": {"l": 55.53052099999999, "t": 257.28369, "r": 91.827637, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "65", "bbox": {"l": 88.052673, "t": 257.07465, "r": 93.219925, "b": 261.43255999999997, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "\u56de\u5168\u56fd\u5927\u4f1a", "bbox": {"l": 93.220474, "t": 257.28369, "r": 119.14685, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "(2003)", "bbox": {"l": 116.45073999999998, "t": 257.07465, "r": 129.88177, "b": 261.43255999999997, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "177", "bbox": {"l": 183.10536, "t": 256.30029, "r": 190.8567, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "1", "bbox": {"l": 210.28223, "t": 256.30029, "r": 212.86539, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "176", "bbox": {"l": 232.29153, "t": 256.30029, "r": 240.04287999999997, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "150", "bbox": {"l": 256.88446, "t": 256.30029, "r": 264.6358, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "236", "bbox": {"l": 281.47742, "t": 256.30029, "r": 289.22876, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "\u7b2c", "bbox": {"l": 55.53052099999999, "t": 264.5108, "r": 60.715424, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "17", "bbox": {"l": 60.17654799999999, "t": 264.30175999999994, "r": 65.343796, "b": 268.65967, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "\u56de\u4eba\u5de5\u77e5\u80fd\u5b66\u4f1a\u5168\u56fd\u5927\u4f1a", "bbox": {"l": 65.344376, "t": 264.5108, "r": 122.38297000000001, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "(2003)", "bbox": {"l": 116.45073999999998, "t": 264.30175999999994, "r": 129.88177, "b": 268.65967, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "208", "bbox": {"l": 183.10536, "t": 263.52739999999994, "r": 190.8567, "b": 267.88531, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "5", "bbox": {"l": 210.28223, "t": 263.52739999999994, "r": 212.86539, "b": 267.88531, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "203", "bbox": {"l": 232.29153, "t": 263.52739999999994, "r": 240.04287999999997, "b": 267.88531, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "152", "bbox": {"l": 256.88446, "t": 263.52739999999994, "r": 264.6358, "b": 267.88531, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "244", "bbox": {"l": 281.47742, "t": 263.52739999999994, "r": 289.22876, "b": 267.88531, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "\u81ea\u7136\u8a00\u8a9e\u51e6\u7406\u7814\u7a76\u4f1a\u7b2c", "bbox": {"l": 55.53052099999999, "t": 271.73785, "r": 107.38374, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "146", "bbox": {"l": 101.99034, "t": 271.52881, "r": 109.74168000000002, "b": 275.88671999999997, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "\u301c", "bbox": {"l": 109.74204, "t": 271.73785, "r": 114.92695000000002, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "155", "bbox": {"l": 114.38793, "t": 271.52881, "r": 122.13927, "b": 275.88671999999997, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "\u56de", "bbox": {"l": 122.13963, "t": 271.73785, "r": 127.32454000000001, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "98", "bbox": {"l": 184.39731, "t": 270.75446, "r": 189.56456, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "2", "bbox": {"l": 210.28223, "t": 270.75446, "r": 212.86539, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "96", "bbox": {"l": 233.58348, "t": 270.75446, "r": 238.75072999999998, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "150", "bbox": {"l": 256.88446, "t": 270.75446, "r": 264.6358, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "232", "bbox": {"l": 281.47742, "t": 270.75446, "r": 289.22876, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "WWW", "bbox": {"l": 55.53052099999999, "t": 279.01392, "r": 68.68605, "b": 283.37183, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "\u304b\u3089\u53ce\u96c6\u3057\u305f\u8ad6\u6587", "bbox": {"l": 68.685814, "t": 279.22295999999994, "r": 110.16829999999999, "b": 283.40436, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "107", "bbox": {"l": 183.10536, "t": 277.98157000000003, "r": 190.8567, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "73", "bbox": {"l": 208.99026, "t": 277.98157000000003, "r": 214.15752, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "34", "bbox": {"l": 233.58348, "t": 277.98157000000003, "r": 238.75072999999998, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "147", "bbox": {"l": 256.88446, "t": 277.98157000000003, "r": 264.6358, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "96", "bbox": {"l": 282.76938, "t": 277.98157000000003, "r": 287.93661, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "\u8a08", "bbox": {"l": 169.61508, "t": 286.45004, "r": 174.79999, "b": 290.63141, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "945", "bbox": {"l": 183.10536, "t": 285.46667, "r": 190.8567, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "294", "bbox": {"l": 207.69832, "t": 285.46667, "r": 215.44965999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "651", "bbox": {"l": 232.29153, "t": 285.46667, "r": 240.04287999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "1122", "bbox": {"l": 255.76506, "t": 285.46667, "r": 265.75204, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "955", "bbox": {"l": 281.47742, "t": 285.46667, "r": 289.22876, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}], "children": [{"id": 32, "label": "text", "bbox": {"l": 209.93285, "t": 222.18073000000004, "r": 241.04458999999997, "b": 226.36212, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": "\u8ad6\u6587\u30d5\u30a1\u30a4\u30eb", "bbox": {"l": 209.93285, "t": 222.18073000000004, "r": 241.04458999999997, "b": 226.36212, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 263.76489, "t": 222.18073000000004, "r": 284.50589, "b": 226.36212, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "\u53c2\u8003\u6587\u732e", "bbox": {"l": 263.76489, "t": 222.18073000000004, "r": 284.50589, "b": 226.36212, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 110.24990999999999, "t": 229.66594999999995, "r": 120.62018, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "\u51fa\u5178", "bbox": {"l": 110.24990999999999, "t": 229.66594999999995, "r": 120.62018, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 175.36609, "t": 229.66594999999995, "r": 196.1071, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "\u30d5\u30a1\u30a4\u30eb", "bbox": {"l": 175.36609, "t": 229.66594999999995, "r": 196.1071, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 196.10756, "t": 229.66594999999995, "r": 201.29247, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "\u6570", "bbox": {"l": 196.10756, "t": 229.66594999999995, "r": 201.29247, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 209.62408, "t": 229.66594999999995, "r": 219.99435, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "\u82f1\u8a9e", "bbox": {"l": 209.62408, "t": 229.66594999999995, "r": 219.99435, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 229.19814, "t": 229.66594999999995, "r": 244.75377, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "\u65e5\u672c\u8a9e", "bbox": {"l": 229.19814, "t": 229.66594999999995, "r": 244.75377, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 256.1142, "t": 229.66594999999995, "r": 266.48447, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "\u82f1\u8a9e", "bbox": {"l": 256.1142, "t": 229.66594999999995, "r": 266.48447, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 278.38434, "t": 229.66594999999995, "r": 293.93997, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "\u65e5\u672c\u8a9e", "bbox": {"l": 278.38434, "t": 229.66594999999995, "r": 293.93997, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 55.53052099999999, "t": 236.42584, "r": 162.7131, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "Association for Computational Linguistics(ACL2003)", "bbox": {"l": 55.53052099999999, "t": 236.42584, "r": 162.7131, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 184.39731, "t": 236.42584, "r": 189.56456, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "65", "bbox": {"l": 184.39731, "t": 236.42584, "r": 189.56456, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 208.99026, "t": 236.42584, "r": 214.15752, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "65", "bbox": {"l": 208.99026, "t": 236.42584, "r": 214.15752, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 234.87517, "t": 236.42584, "r": 237.45833000000002, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "0", "bbox": {"l": 234.87517, "t": 236.42584, "r": 237.45833000000002, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 256.88446, "t": 236.42584, "r": 264.6358, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "150", "bbox": {"l": 256.88446, "t": 236.42584, "r": 264.6358, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 284.06134, "t": 236.42584, "r": 286.6445, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "0", "bbox": {"l": 284.06134, "t": 236.42584, "r": 286.6445, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 55.53052099999999, "t": 242.62048000000004, "r": 139.72253, "b": 246.97839, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "Computational Linguistics(COLING2002)", "bbox": {"l": 55.53052099999999, "t": 242.62048000000004, "r": 139.72253, "b": 246.97839, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 183.10536, "t": 242.62048000000004, "r": 190.8567, "b": 246.97839, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "140", "bbox": {"l": 183.10536, "t": 242.62048000000004, "r": 190.8567, "b": 246.97839, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 207.69832, "t": 242.62048000000004, "r": 215.44965999999997, "b": 246.97839, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "140", "bbox": {"l": 207.69832, "t": 242.62048000000004, "r": 215.44965999999997, "b": 246.97839, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 234.87517, "t": 242.62048000000004, "r": 237.45833000000002, "b": 246.97839, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "0", "bbox": {"l": 234.87517, "t": 242.62048000000004, "r": 237.45833000000002, "b": 246.97839, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 256.88446, "t": 242.62048000000004, "r": 264.6358, "b": 246.97839, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "150", "bbox": {"l": 256.88446, "t": 242.62048000000004, "r": 264.6358, "b": 246.97839, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 284.06134, "t": 242.62048000000004, "r": 286.6445, "b": 246.97839, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "0", "bbox": {"l": 284.06134, "t": 242.62048000000004, "r": 286.6445, "b": 246.97839, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 55.53052099999999, "t": 249.79845999999998, "r": 97.013, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "\u96fb\u6c17\u60c5\u5831\u901a\u4fe1\u5b66\u4f1a", "bbox": {"l": 55.53052099999999, "t": 249.79845999999998, "r": 97.013, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 92.698288, "t": 249.58942000000002, "r": 103.03371, "b": 253.94732999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "2003", "bbox": {"l": 92.698288, "t": 249.58942000000002, "r": 103.03371, "b": 253.94732999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 103.03389, "t": 249.79845999999998, "r": 128.96027, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "\u5e74\u7dcf\u5408\u5927\u4f1a", "bbox": {"l": 103.03389, "t": 249.79845999999998, "r": 128.96027, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 183.10536, "t": 248.81506000000002, "r": 190.8567, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "150", "bbox": {"l": 183.10536, "t": 248.81506000000002, "r": 190.8567, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 210.28223, "t": 248.81506000000002, "r": 212.86539, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "8", "bbox": {"l": 210.28223, "t": 248.81506000000002, "r": 212.86539, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 232.29153, "t": 248.81506000000002, "r": 240.04287999999997, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "142", "bbox": {"l": 232.29153, "t": 248.81506000000002, "r": 240.04287999999997, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 256.88446, "t": 248.81506000000002, "r": 264.6358, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "223", "bbox": {"l": 256.88446, "t": 248.81506000000002, "r": 264.6358, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 281.47742, "t": 248.81506000000002, "r": 289.22876, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "147", "bbox": {"l": 281.47742, "t": 248.81506000000002, "r": 289.22876, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 55.53052099999999, "t": 257.28369, "r": 91.827637, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "\u60c5\u5831\u51e6\u7406\u5b66\u4f1a\u7b2c", "bbox": {"l": 55.53052099999999, "t": 257.28369, "r": 91.827637, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 88.052673, "t": 257.07465, "r": 93.219925, "b": 261.43255999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "65", "bbox": {"l": 88.052673, "t": 257.07465, "r": 93.219925, "b": 261.43255999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 93.220474, "t": 257.28369, "r": 119.14685, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "\u56de\u5168\u56fd\u5927\u4f1a", "bbox": {"l": 93.220474, "t": 257.28369, "r": 119.14685, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 116.45073999999998, "t": 257.07465, "r": 129.88177, "b": 261.43255999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "(2003)", "bbox": {"l": 116.45073999999998, "t": 257.07465, "r": 129.88177, "b": 261.43255999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 183.10536, "t": 256.30029, "r": 190.8567, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "177", "bbox": {"l": 183.10536, "t": 256.30029, "r": 190.8567, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 210.28223, "t": 256.30029, "r": 212.86539, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "1", "bbox": {"l": 210.28223, "t": 256.30029, "r": 212.86539, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 232.29153, "t": 256.30029, "r": 240.04287999999997, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "176", "bbox": {"l": 232.29153, "t": 256.30029, "r": 240.04287999999997, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 256.88446, "t": 256.30029, "r": 264.6358, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "150", "bbox": {"l": 256.88446, "t": 256.30029, "r": 264.6358, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 281.47742, "t": 256.30029, "r": 289.22876, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "236", "bbox": {"l": 281.47742, "t": 256.30029, "r": 289.22876, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 55.53052099999999, "t": 264.5108, "r": 60.715424, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "\u7b2c", "bbox": {"l": 55.53052099999999, "t": 264.5108, "r": 60.715424, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 60.17654799999999, "t": 264.30175999999994, "r": 65.343796, "b": 268.65967, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "17", "bbox": {"l": 60.17654799999999, "t": 264.30175999999994, "r": 65.343796, "b": 268.65967, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 65.344376, "t": 264.5108, "r": 122.38297000000001, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "\u56de\u4eba\u5de5\u77e5\u80fd\u5b66\u4f1a\u5168\u56fd\u5927\u4f1a", "bbox": {"l": 65.344376, "t": 264.5108, "r": 122.38297000000001, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 116.45073999999998, "t": 264.30175999999994, "r": 129.88177, "b": 268.65967, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "(2003)", "bbox": {"l": 116.45073999999998, "t": 264.30175999999994, "r": 129.88177, "b": 268.65967, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 183.10536, "t": 263.52739999999994, "r": 190.8567, "b": 267.88531, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "208", "bbox": {"l": 183.10536, "t": 263.52739999999994, "r": 190.8567, "b": 267.88531, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 210.28223, "t": 263.52739999999994, "r": 212.86539, "b": 267.88531, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "5", "bbox": {"l": 210.28223, "t": 263.52739999999994, "r": 212.86539, "b": 267.88531, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 232.29153, "t": 263.52739999999994, "r": 240.04287999999997, "b": 267.88531, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "203", "bbox": {"l": 232.29153, "t": 263.52739999999994, "r": 240.04287999999997, "b": 267.88531, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 256.88446, "t": 263.52739999999994, "r": 264.6358, "b": 267.88531, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "152", "bbox": {"l": 256.88446, "t": 263.52739999999994, "r": 264.6358, "b": 267.88531, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 281.47742, "t": 263.52739999999994, "r": 289.22876, "b": 267.88531, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "244", "bbox": {"l": 281.47742, "t": 263.52739999999994, "r": 289.22876, "b": 267.88531, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 55.53052099999999, "t": 271.73785, "r": 107.38374, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "\u81ea\u7136\u8a00\u8a9e\u51e6\u7406\u7814\u7a76\u4f1a\u7b2c", "bbox": {"l": 55.53052099999999, "t": 271.73785, "r": 107.38374, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 101.99034, "t": 271.52881, "r": 109.74168000000002, "b": 275.88671999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "146", "bbox": {"l": 101.99034, "t": 271.52881, "r": 109.74168000000002, "b": 275.88671999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 109.74204, "t": 271.73785, "r": 114.92695000000002, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "\u301c", "bbox": {"l": 109.74204, "t": 271.73785, "r": 114.92695000000002, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 114.38793, "t": 271.52881, "r": 122.13927, "b": 275.88671999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "155", "bbox": {"l": 114.38793, "t": 271.52881, "r": 122.13927, "b": 275.88671999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 122.13963, "t": 271.73785, "r": 127.32454000000001, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "\u56de", "bbox": {"l": 122.13963, "t": 271.73785, "r": 127.32454000000001, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 184.39731, "t": 270.75446, "r": 189.56456, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "98", "bbox": {"l": 184.39731, "t": 270.75446, "r": 189.56456, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 210.28223, "t": 270.75446, "r": 212.86539, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "2", "bbox": {"l": 210.28223, "t": 270.75446, "r": 212.86539, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 233.58348, "t": 270.75446, "r": 238.75072999999998, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "96", "bbox": {"l": 233.58348, "t": 270.75446, "r": 238.75072999999998, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 256.88446, "t": 270.75446, "r": 264.6358, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "150", "bbox": {"l": 256.88446, "t": 270.75446, "r": 264.6358, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 281.47742, "t": 270.75446, "r": 289.22876, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "232", "bbox": {"l": 281.47742, "t": 270.75446, "r": 289.22876, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 55.53052099999999, "t": 279.01392, "r": 68.68605, "b": 283.37183, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "WWW", "bbox": {"l": 55.53052099999999, "t": 279.01392, "r": 68.68605, "b": 283.37183, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 68.685814, "t": 279.22295999999994, "r": 110.16829999999999, "b": 283.40436, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "\u304b\u3089\u53ce\u96c6\u3057\u305f\u8ad6\u6587", "bbox": {"l": 68.685814, "t": 279.22295999999994, "r": 110.16829999999999, "b": 283.40436, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 183.10536, "t": 277.98157000000003, "r": 190.8567, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "107", "bbox": {"l": 183.10536, "t": 277.98157000000003, "r": 190.8567, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 208.99026, "t": 277.98157000000003, "r": 214.15752, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "73", "bbox": {"l": 208.99026, "t": 277.98157000000003, "r": 214.15752, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 233.58348, "t": 277.98157000000003, "r": 238.75072999999998, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "34", "bbox": {"l": 233.58348, "t": 277.98157000000003, "r": 238.75072999999998, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 256.88446, "t": 277.98157000000003, "r": 264.6358, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "147", "bbox": {"l": 256.88446, "t": 277.98157000000003, "r": 264.6358, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 282.76938, "t": 277.98157000000003, "r": 287.93661, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "96", "bbox": {"l": 282.76938, "t": 277.98157000000003, "r": 287.93661, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 169.61508, "t": 286.45004, "r": 174.79999, "b": 290.63141, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "\u8a08", "bbox": {"l": 169.61508, "t": 286.45004, "r": 174.79999, "b": 290.63141, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 183.10536, "t": 285.46667, "r": 190.8567, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "945", "bbox": {"l": 183.10536, "t": 285.46667, "r": 190.8567, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 207.69832, "t": 285.46667, "r": 215.44965999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "294", "bbox": {"l": 207.69832, "t": 285.46667, "r": 215.44965999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 232.29153, "t": 285.46667, "r": 240.04287999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "651", "bbox": {"l": 232.29153, "t": 285.46667, "r": 240.04287999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 255.76506, "t": 285.46667, "r": 265.75204, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "1122", "bbox": {"l": 255.76506, "t": 285.46667, "r": 265.75204, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 281.47742, "t": 285.46667, "r": 289.22876, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "955", "bbox": {"l": 281.47742, "t": 285.46667, "r": 289.22876, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "lcel", "ched", "lcel", "nl", "ched", "ched", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 10, "num_cols": 6, "table_cells": [{"bbox": {"l": 209.93285, "t": 222.18073000000004, "r": 241.04458999999997, "b": 226.36212, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 4, "text": "\u8ad6\u6587\u30d5\u30a1\u30a4\u30eb", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 263.76489, "t": 222.18073000000004, "r": 284.50589, "b": 226.36212, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 4, "end_col_offset_idx": 6, "text": "\u53c2\u8003\u6587\u732e", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 110.24990999999999, "t": 229.66594999999995, "r": 120.62018, "b": 233.84735, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "\u51fa\u5178", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 175.36609, "t": 229.66594999999995, "r": 201.29247, "b": 233.84735, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "\u30d5\u30a1\u30a4\u30eb \u6570", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 209.62408, "t": 229.66594999999995, "r": 219.99435, "b": 233.84735, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "\u82f1\u8a9e", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 229.19814, "t": 229.66594999999995, "r": 244.75377, "b": 233.84735, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "\u65e5\u672c\u8a9e", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 256.1142, "t": 229.66594999999995, "r": 266.48447, "b": 233.84735, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "\u82f1\u8a9e", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 278.38434, "t": 229.66594999999995, "r": 293.93997, "b": 233.84735, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "\u65e5\u672c\u8a9e", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 55.53052099999999, "t": 236.42584, "r": 162.7131, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Association for Computational Linguistics(ACL2003)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 184.39731, "t": 236.42584, "r": 189.56456, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "65", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 208.99026, "t": 236.42584, "r": 214.15752, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "65", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 234.87517, "t": 236.42584, "r": 237.45833000000002, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446, "t": 236.42584, "r": 264.6358, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "150", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 284.06134, "t": 236.42584, "r": 286.6445, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 55.53052099999999, "t": 242.62048000000004, "r": 139.72253, "b": 246.97839, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Computational Linguistics(COLING2002)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 183.10536, "t": 242.62048000000004, "r": 190.8567, "b": 246.97839, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "140", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 207.69832, "t": 242.62048000000004, "r": 215.44965999999997, "b": 246.97839, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "140", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 234.87517, "t": 242.62048000000004, "r": 237.45833000000002, "b": 246.97839, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446, "t": 242.62048000000004, "r": 264.6358, "b": 246.97839, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "150", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 284.06134, "t": 242.62048000000004, "r": 286.6445, "b": 246.97839, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 55.53052099999999, "t": 249.58942000000002, "r": 128.96027, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "\u96fb\u6c17\u60c5\u5831\u901a\u4fe1\u5b66\u4f1a 2003 \u5e74\u7dcf\u5408\u5927\u4f1a", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 183.10536, "t": 248.81506000000002, "r": 190.8567, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "150", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 210.28223, "t": 248.81506000000002, "r": 212.86539, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.29153, "t": 248.81506000000002, "r": 240.04287999999997, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "142", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446, "t": 248.81506000000002, "r": 264.6358, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "223", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.47742, "t": 248.81506000000002, "r": 289.22876, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "147", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 55.53052099999999, "t": 257.07465, "r": 129.88177, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "\u60c5\u5831\u51e6\u7406\u5b66\u4f1a\u7b2c 65 \u56de\u5168\u56fd\u5927\u4f1a (2003)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 183.10536, "t": 256.30029, "r": 190.8567, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "177", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 210.28223, "t": 256.30029, "r": 212.86539, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.29153, "t": 256.30029, "r": 240.04287999999997, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "176", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446, "t": 256.30029, "r": 264.6358, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "150", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.47742, "t": 256.30029, "r": 289.22876, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "236", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 55.53052099999999, "t": 264.30175999999994, "r": 129.88177, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "\u7b2c 17 \u56de\u4eba\u5de5\u77e5\u80fd\u5b66\u4f1a\u5168\u56fd\u5927\u4f1a (2003)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 183.10536, "t": 263.52739999999994, "r": 190.8567, "b": 267.88531, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "208", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 210.28223, "t": 263.52739999999994, "r": 212.86539, "b": 267.88531, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.29153, "t": 263.52739999999994, "r": 240.04287999999997, "b": 267.88531, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "203", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446, "t": 263.52739999999994, "r": 264.6358, "b": 267.88531, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "152", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.47742, "t": 263.52739999999994, "r": 289.22876, "b": 267.88531, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "244", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 55.53052099999999, "t": 271.52881, "r": 127.32454000000001, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "\u81ea\u7136\u8a00\u8a9e\u51e6\u7406\u7814\u7a76\u4f1a\u7b2c 146 \u301c 155 \u56de", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 184.39731, "t": 270.75446, "r": 189.56456, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "98", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 210.28223, "t": 270.75446, "r": 212.86539, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 233.58348, "t": 270.75446, "r": 238.75072999999998, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446, "t": 270.75446, "r": 264.6358, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "150", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.47742, "t": 270.75446, "r": 289.22876, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "232", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 55.53052099999999, "t": 279.01392, "r": 110.16829999999999, "b": 283.40436, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "WWW \u304b\u3089\u53ce\u96c6\u3057\u305f\u8ad6\u6587", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 183.10536, "t": 277.98157000000003, "r": 190.8567, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "107", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 208.99026, "t": 277.98157000000003, "r": 214.15752, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "73", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 233.58348, "t": 277.98157000000003, "r": 238.75072999999998, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "34", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446, "t": 277.98157000000003, "r": 264.6358, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "147", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 282.76938, "t": 277.98157000000003, "r": 287.93661, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 183.10536, "t": 285.46667, "r": 190.8567, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "945", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 207.69832, "t": 285.46667, "r": 215.44965999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "294", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.29153, "t": 285.46667, "r": 240.04287999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "651", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 255.76506, "t": 285.46667, "r": 265.75204, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "1122", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.47742, "t": 285.46667, "r": 289.22876, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "955", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "caption", "id": 16, "page_no": 7, "cluster": {"id": 16, "label": "caption", "bbox": {"l": 380.42731, "t": 292.30426, "r": 549.42175, "b": 298.60284, "coord_origin": "TOPLEFT"}, "confidence": 0.7499915957450867, "cells": [{"id": 76, "text": "Text is aligned to match original for ease of viewing", "bbox": {"l": 380.42731, "t": 292.30426, "r": 549.42175, "b": 298.60284, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Text is aligned to match original for ease of viewing"}, {"label": "table", "id": 7, "page_no": 7, "cluster": {"id": 7, "label": "table", "bbox": {"l": 304.9219970703125, "t": 218.51486206054688, "r": 550.2321166992188, "b": 287.90069580078125, "coord_origin": "TOPLEFT"}, "confidence": 0.8899767994880676, "cells": [{"id": 77, "text": "Weighted Average Grant Date Fair", "bbox": {"l": 459.04861, "t": 221.62415, "r": 542.00018, "b": 226.68933000000004, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "Value", "bbox": {"l": 493.82193, "t": 227.83416999999997, "r": 507.2258, "b": 232.89935000000003, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "RS", "bbox": {"l": 393.2442, "t": 236.74712999999997, "r": 400.74588, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "U", "bbox": {"l": 400.74643, "t": 236.74712999999997, "r": 404.64523, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "s", "bbox": {"l": 404.6463, "t": 236.74712999999997, "r": 407.34631, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "Shares (in millions)", "bbox": {"l": 392.09671, "t": 221.57446000000004, "r": 438.0145, "b": 226.63964999999996, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "PSUs", "bbox": {"l": 427.18323, "t": 236.74712999999997, "r": 440.98778999999996, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "RSUs", "bbox": {"l": 468.38254, "t": 236.74712999999997, "r": 482.48465000000004, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "PSUs", "bbox": {"l": 516.92578, "t": 236.74712999999997, "r": 530.73035, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Nonvested on Janua", "bbox": {"l": 306.11493, "t": 244.61084000000005, "r": 355.6532, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "ry 1", "bbox": {"l": 355.65427, "t": 244.61084000000005, "r": 364.65607, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "1.", "bbox": {"l": 396.24661, "t": 244.91327, "r": 400.75238, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "1", "bbox": {"l": 400.7529, "t": 244.91327, "r": 403.75531, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "0.3", "bbox": {"l": 429.81838999999997, "t": 244.91327, "r": 437.32708999999994, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "90.10", "bbox": {"l": 465.52859, "t": 244.91327, "r": 478.40103, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "$", "bbox": {"l": 480.97552, "t": 244.91327, "r": 483.55001999999996, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "$ 91.19", "bbox": {"l": 513.44824, "t": 244.91327, "r": 531.46967, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "Granted", "bbox": {"l": 306.11493, "t": 253.68451000000005, "r": 325.62674, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "0.", "bbox": {"l": 396.24661, "t": 253.68451000000005, "r": 400.75238, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "5", "bbox": {"l": 400.7529, "t": 253.68451000000005, "r": 403.75531, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "0.1", "bbox": {"l": 429.81838999999997, "t": 253.68451000000005, "r": 437.32708999999994, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "117.44", "bbox": {"l": 466.43579000000005, "t": 253.68451000000005, "r": 482.54831, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "122.41", "bbox": {"l": 514.29065, "t": 253.68451000000005, "r": 530.80981, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "Vested", "bbox": {"l": 306.11493, "t": 261.54822, "r": 322.62866, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "(0.", "bbox": {"l": 394.43222, "t": 261.54822, "r": 400.73563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "5", "bbox": {"l": 400.73456, "t": 261.54822, "r": 403.73697, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": ")", "bbox": {"l": 403.73804, "t": 261.54822, "r": 405.53625, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "(0.1)", "bbox": {"l": 427.7016, "t": 261.54822, "r": 438.80563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "87.08", "bbox": {"l": 468.55533, "t": 261.54822, "r": 482.07043, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "81.14", "bbox": {"l": 516.01862, "t": 261.54822, "r": 529.53375, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "Canceled or forfeited", "bbox": {"l": 306.11493, "t": 269.64148, "r": 356.24771, "b": 274.70667000000003, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "(0.", "bbox": {"l": 394.43222, "t": 270.31946000000005, "r": 400.73563, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "1", "bbox": {"l": 400.73456, "t": 270.31946000000005, "r": 403.73697, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": ")", "bbox": {"l": 403.73804, "t": 270.31946000000005, "r": 405.53625, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "-", "bbox": {"l": 431.02802, "t": 270.31946000000005, "r": 436.4280099999999, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "102.01", "bbox": {"l": 465.83099000000004, "t": 270.31946000000005, "r": 482.35013, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "92.18", "bbox": {"l": 516.01862, "t": 270.31946000000005, "r": 529.53375, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "Nonvested on December 31", "bbox": {"l": 306.11493, "t": 278.48572, "r": 373.35764, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "1.0", "bbox": {"l": 396.24661, "t": 278.48572, "r": 403.75531, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "0.3", "bbox": {"l": 429.51599, "t": 278.48572, "r": 437.02469, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "104.85 $", "bbox": {"l": 463.7142, "t": 278.48572, "r": 484.73965000000004, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "$ 104.51", "bbox": {"l": 512.99463, "t": 278.48572, "r": 534.02008, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}], "children": [{"id": 102, "label": "text", "bbox": {"l": 459.04861, "t": 221.62415, "r": 542.00018, "b": 226.68933000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "Weighted Average Grant Date Fair", "bbox": {"l": 459.04861, "t": 221.62415, "r": 542.00018, "b": 226.68933000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 493.82193, "t": 227.83416999999997, "r": 507.2258, "b": 232.89935000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "Value", "bbox": {"l": 493.82193, "t": 227.83416999999997, "r": 507.2258, "b": 232.89935000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 393.2442, "t": 236.74712999999997, "r": 400.74588, "b": 241.81232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "RS", "bbox": {"l": 393.2442, "t": 236.74712999999997, "r": 400.74588, "b": 241.81232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 400.74643, "t": 236.74712999999997, "r": 404.64523, "b": 241.81232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "U", "bbox": {"l": 400.74643, "t": 236.74712999999997, "r": 404.64523, "b": 241.81232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 404.6463, "t": 236.74712999999997, "r": 407.34631, "b": 241.81232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "s", "bbox": {"l": 404.6463, "t": 236.74712999999997, "r": 407.34631, "b": 241.81232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 392.09671, "t": 221.57446000000004, "r": 438.0145, "b": 226.63964999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "Shares (in millions)", "bbox": {"l": 392.09671, "t": 221.57446000000004, "r": 438.0145, "b": 226.63964999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 427.18323, "t": 236.74712999999997, "r": 440.98778999999996, "b": 241.81232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "PSUs", "bbox": {"l": 427.18323, "t": 236.74712999999997, "r": 440.98778999999996, "b": 241.81232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 468.38254, "t": 236.74712999999997, "r": 482.48465000000004, "b": 241.81232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "RSUs", "bbox": {"l": 468.38254, "t": 236.74712999999997, "r": 482.48465000000004, "b": 241.81232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 516.92578, "t": 236.74712999999997, "r": 530.73035, "b": 241.81232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "PSUs", "bbox": {"l": 516.92578, "t": 236.74712999999997, "r": 530.73035, "b": 241.81232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 306.11493, "t": 244.61084000000005, "r": 355.6532, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "Nonvested on Janua", "bbox": {"l": 306.11493, "t": 244.61084000000005, "r": 355.6532, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 355.65427, "t": 244.61084000000005, "r": 364.65607, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "ry 1", "bbox": {"l": 355.65427, "t": 244.61084000000005, "r": 364.65607, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 396.24661, "t": 244.91327, "r": 400.75238, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "1.", "bbox": {"l": 396.24661, "t": 244.91327, "r": 400.75238, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 114, "label": "text", "bbox": {"l": 400.7529, "t": 244.91327, "r": 403.75531, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "1", "bbox": {"l": 400.7529, "t": 244.91327, "r": 403.75531, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 115, "label": "text", "bbox": {"l": 429.81838999999997, "t": 244.91327, "r": 437.32708999999994, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "0.3", "bbox": {"l": 429.81838999999997, "t": 244.91327, "r": 437.32708999999994, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 116, "label": "text", "bbox": {"l": 465.52859, "t": 244.91327, "r": 478.40103, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "90.10", "bbox": {"l": 465.52859, "t": 244.91327, "r": 478.40103, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 117, "label": "text", "bbox": {"l": 480.97552, "t": 244.91327, "r": 483.55001999999996, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "$", "bbox": {"l": 480.97552, "t": 244.91327, "r": 483.55001999999996, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 118, "label": "text", "bbox": {"l": 513.44824, "t": 244.91327, "r": 531.46967, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "$ 91.19", "bbox": {"l": 513.44824, "t": 244.91327, "r": 531.46967, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 119, "label": "text", "bbox": {"l": 306.11493, "t": 253.68451000000005, "r": 325.62674, "b": 258.74969, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "Granted", "bbox": {"l": 306.11493, "t": 253.68451000000005, "r": 325.62674, "b": 258.74969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 120, "label": "text", "bbox": {"l": 396.24661, "t": 253.68451000000005, "r": 400.75238, "b": 258.74969, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "0.", "bbox": {"l": 396.24661, "t": 253.68451000000005, "r": 400.75238, "b": 258.74969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 121, "label": "text", "bbox": {"l": 400.7529, "t": 253.68451000000005, "r": 403.75531, "b": 258.74969, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "5", "bbox": {"l": 400.7529, "t": 253.68451000000005, "r": 403.75531, "b": 258.74969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 122, "label": "text", "bbox": {"l": 429.81838999999997, "t": 253.68451000000005, "r": 437.32708999999994, "b": 258.74969, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "0.1", "bbox": {"l": 429.81838999999997, "t": 253.68451000000005, "r": 437.32708999999994, "b": 258.74969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 123, "label": "text", "bbox": {"l": 466.43579000000005, "t": 253.68451000000005, "r": 482.54831, "b": 258.74969, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "117.44", "bbox": {"l": 466.43579000000005, "t": 253.68451000000005, "r": 482.54831, "b": 258.74969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 124, "label": "text", "bbox": {"l": 514.29065, "t": 253.68451000000005, "r": 530.80981, "b": 258.74969, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "122.41", "bbox": {"l": 514.29065, "t": 253.68451000000005, "r": 530.80981, "b": 258.74969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 125, "label": "text", "bbox": {"l": 306.11493, "t": 261.54822, "r": 322.62866, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "Vested", "bbox": {"l": 306.11493, "t": 261.54822, "r": 322.62866, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 126, "label": "text", "bbox": {"l": 394.43222, "t": 261.54822, "r": 400.73563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "(0.", "bbox": {"l": 394.43222, "t": 261.54822, "r": 400.73563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 127, "label": "text", "bbox": {"l": 400.73456, "t": 261.54822, "r": 403.73697, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "5", "bbox": {"l": 400.73456, "t": 261.54822, "r": 403.73697, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 128, "label": "text", "bbox": {"l": 403.73804, "t": 261.54822, "r": 405.53625, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": ")", "bbox": {"l": 403.73804, "t": 261.54822, "r": 405.53625, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 129, "label": "text", "bbox": {"l": 427.7016, "t": 261.54822, "r": 438.80563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "(0.1)", "bbox": {"l": 427.7016, "t": 261.54822, "r": 438.80563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 130, "label": "text", "bbox": {"l": 468.55533, "t": 261.54822, "r": 482.07043, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "87.08", "bbox": {"l": 468.55533, "t": 261.54822, "r": 482.07043, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 131, "label": "text", "bbox": {"l": 516.01862, "t": 261.54822, "r": 529.53375, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": "81.14", "bbox": {"l": 516.01862, "t": 261.54822, "r": 529.53375, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 132, "label": "text", "bbox": {"l": 306.11493, "t": 269.64148, "r": 356.24771, "b": 274.70667000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 107, "text": "Canceled or forfeited", "bbox": {"l": 306.11493, "t": 269.64148, "r": 356.24771, "b": 274.70667000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 133, "label": "text", "bbox": {"l": 394.43222, "t": 270.31946000000005, "r": 400.73563, "b": 275.38464, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 108, "text": "(0.", "bbox": {"l": 394.43222, "t": 270.31946000000005, "r": 400.73563, "b": 275.38464, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 134, "label": "text", "bbox": {"l": 400.73456, "t": 270.31946000000005, "r": 403.73697, "b": 275.38464, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 109, "text": "1", "bbox": {"l": 400.73456, "t": 270.31946000000005, "r": 403.73697, "b": 275.38464, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 135, "label": "text", "bbox": {"l": 403.73804, "t": 270.31946000000005, "r": 405.53625, "b": 275.38464, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 110, "text": ")", "bbox": {"l": 403.73804, "t": 270.31946000000005, "r": 405.53625, "b": 275.38464, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 136, "label": "text", "bbox": {"l": 431.02802, "t": 270.31946000000005, "r": 436.4280099999999, "b": 275.38464, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 111, "text": "-", "bbox": {"l": 431.02802, "t": 270.31946000000005, "r": 436.4280099999999, "b": 275.38464, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 137, "label": "text", "bbox": {"l": 465.83099000000004, "t": 270.31946000000005, "r": 482.35013, "b": 275.38464, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 112, "text": "102.01", "bbox": {"l": 465.83099000000004, "t": 270.31946000000005, "r": 482.35013, "b": 275.38464, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 138, "label": "text", "bbox": {"l": 516.01862, "t": 270.31946000000005, "r": 529.53375, "b": 275.38464, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 113, "text": "92.18", "bbox": {"l": 516.01862, "t": 270.31946000000005, "r": 529.53375, "b": 275.38464, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 139, "label": "text", "bbox": {"l": 306.11493, "t": 278.48572, "r": 373.35764, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 114, "text": "Nonvested on December 31", "bbox": {"l": 306.11493, "t": 278.48572, "r": 373.35764, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 140, "label": "text", "bbox": {"l": 396.24661, "t": 278.48572, "r": 403.75531, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 115, "text": "1.0", "bbox": {"l": 396.24661, "t": 278.48572, "r": 403.75531, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 141, "label": "text", "bbox": {"l": 429.51599, "t": 278.48572, "r": 437.02469, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 116, "text": "0.3", "bbox": {"l": 429.51599, "t": 278.48572, "r": 437.02469, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 142, "label": "text", "bbox": {"l": 463.7142, "t": 278.48572, "r": 484.73965000000004, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 117, "text": "104.85 $", "bbox": {"l": 463.7142, "t": 278.48572, "r": 484.73965000000004, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 143, "label": "text", "bbox": {"l": 512.99463, "t": 278.48572, "r": 534.02008, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 118, "text": "$ 104.51", "bbox": {"l": 512.99463, "t": 278.48572, "r": 534.02008, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ecel", "ched", "lcel", "ched", "lcel", "nl", "ecel", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 7, "num_cols": 5, "table_cells": [{"bbox": {"l": 459.04861, "t": 221.62415, "r": 542.00018, "b": 232.89935000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 5, "text": "Weighted Average Grant Date Fair Value", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 393.2442, "t": 236.74712999999997, "r": 407.34631, "b": 241.81232, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "RS U s", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 392.09671, "t": 221.57446000000004, "r": 438.0145, "b": 226.63964999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 3, "text": "Shares (in millions)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 427.18323, "t": 236.74712999999997, "r": 440.98778999999996, "b": 241.81232, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "PSUs", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 468.38254, "t": 236.74712999999997, "r": 482.48465000000004, "b": 241.81232, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "RSUs", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 516.92578, "t": 236.74712999999997, "r": 530.73035, "b": 241.81232, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "PSUs", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 306.11493, "t": 244.61084000000005, "r": 364.65607, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Nonvested on Janua ry 1", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 396.24661, "t": 244.91327, "r": 403.75531, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "1. 1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 429.81838999999997, "t": 244.91327, "r": 437.32708999999994, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 465.52859, "t": 244.91327, "r": 483.55001999999996, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "90.10 $", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 513.44824, "t": 244.91327, "r": 531.46967, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "$ 91.19", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 306.11493, "t": 253.68451000000005, "r": 325.62674, "b": 258.74969, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Granted", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 396.24661, "t": 253.68451000000005, "r": 403.75531, "b": 258.74969, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "0. 5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 429.81838999999997, "t": 253.68451000000005, "r": 437.32708999999994, "b": 258.74969, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 466.43579000000005, "t": 253.68451000000005, "r": 482.54831, "b": 258.74969, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "117.44", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 514.29065, "t": 253.68451000000005, "r": 530.80981, "b": 258.74969, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "122.41", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 306.11493, "t": 261.54822, "r": 322.62866, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Vested", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 394.43222, "t": 261.54822, "r": 405.53625, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "(0. 5 )", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 427.7016, "t": 261.54822, "r": 438.80563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "(0.1)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 468.55533, "t": 261.54822, "r": 482.07043, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "87.08", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 516.01862, "t": 261.54822, "r": 529.53375, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "81.14", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 306.11493, "t": 269.64148, "r": 356.24771, "b": 274.70667000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Canceled or forfeited", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 394.43222, "t": 270.31946000000005, "r": 405.53625, "b": 275.38464, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "(0. 1 )", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 431.02802, "t": 270.31946000000005, "r": 436.4280099999999, "b": 275.38464, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 465.83099000000004, "t": 270.31946000000005, "r": 482.35013, "b": 275.38464, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "102.01", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 516.01862, "t": 270.31946000000005, "r": 529.53375, "b": 275.38464, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "92.18", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 306.11493, "t": 278.48572, "r": 373.35764, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Nonvested on December 31", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 396.24661, "t": 278.48572, "r": 403.75531, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "1.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 429.51599, "t": 278.48572, "r": 437.02469, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 463.7142, "t": 278.48572, "r": 484.73965000000004, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "104.85 $", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 512.99463, "t": 278.48572, "r": 534.02008, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "$ 104.51", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "caption", "id": 6, "page_no": 7, "cluster": {"id": 6, "label": "caption", "bbox": {"l": 50.112, "t": 320.87735, "r": 545.11377, "b": 365.64987, "coord_origin": "TOPLEFT"}, "confidence": 0.9140303134918213, "cells": [{"id": 119, "text": "Figure 5:", "bbox": {"l": 50.112, "t": 320.87735, "r": 86.864021, "b": 329.78391, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "One of the benefits of TableFormer is that it is language agnostic, as an example, the left part of the illustration", "bbox": {"l": 93.917542, "t": 320.87735, "r": 545.11371, "b": 329.78391, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "demonstrates TableFormer predictions on previously unseen language (Japanese). Additionally, we see that TableFormer is", "bbox": {"l": 50.112, "t": 332.83233999999993, "r": 545.11371, "b": 341.73889, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "robust to variability in style and content, right side of the illustration shows the example of the TableFormer prediction from", "bbox": {"l": 50.112, "t": 344.78732, "r": 545.11377, "b": 353.69388, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "the FinTabNet dataset.", "bbox": {"l": 50.112, "t": 356.74332, "r": 139.79532, "b": 365.64987, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 5: One of the benefits of TableFormer is that it is language agnostic, as an example, the left part of the illustration demonstrates TableFormer predictions on previously unseen language (Japanese). Additionally, we see that TableFormer is robust to variability in style and content, right side of the illustration shows the example of the TableFormer prediction from the FinTabNet dataset."}, {"label": "picture", "id": 12, "page_no": 7, "cluster": {"id": 12, "label": "picture", "bbox": {"l": 216.76925659179688, "t": 380.4906311035156, "r": 375.7829284667969, "b": 443.34698486328125, "coord_origin": "TOPLEFT"}, "confidence": 0.805853009223938, "cells": [{"id": 124, "text": "Red - PDF cells, Green - predicted bounding boxes", "bbox": {"l": 220.26282, "t": 381.77722, "r": 342.07819, "b": 386.44281, "coord_origin": "TOPLEFT"}}], "children": [{"id": 144, "label": "text", "bbox": {"l": 220.26282, "t": 381.77722, "r": 342.07819, "b": 386.44281, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 124, "text": "Red - PDF cells, Green - predicted bounding boxes", "bbox": {"l": 220.26282, "t": 381.77722, "r": 342.07819, "b": 386.44281, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "picture", "id": 11, "page_no": 7, "cluster": {"id": 11, "label": "picture", "bbox": {"l": 51.736167907714844, "t": 380.48065185546875, "r": 211.83778381347656, "b": 443.6580810546875, "coord_origin": "TOPLEFT"}, "confidence": 0.8308426737785339, "cells": [{"id": 125, "text": "Ground Truth", "bbox": {"l": 53.715248, "t": 381.77722, "r": 85.657333, "b": 386.44281, "coord_origin": "TOPLEFT"}}], "children": [{"id": 145, "label": "text", "bbox": {"l": 53.715248, "t": 381.77722, "r": 85.657333, "b": 386.44281, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 125, "text": "Ground Truth", "bbox": {"l": 53.715248, "t": 381.77722, "r": 85.657333, "b": 386.44281, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "picture", "id": 13, "page_no": 7, "cluster": {"id": 13, "label": "picture", "bbox": {"l": 383.1364440917969, "t": 381.2313232421875, "r": 542.1132202148438, "b": 442.7749328613281, "coord_origin": "TOPLEFT"}, "confidence": 0.7881615161895752, "cells": [{"id": 126, "text": "16", "bbox": {"l": 437.37939, "t": 400.55295, "r": 443.69870000000003, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "17", "bbox": {"l": 450.33203, "t": 400.55295, "r": 456.6513100000001, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "18", "bbox": {"l": 463.28464, "t": 400.55295, "r": 469.60394, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "19", "bbox": {"l": 476.23724000000004, "t": 400.55295, "r": 482.5565500000001, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "20", "bbox": {"l": 489.18988, "t": 400.55295, "r": 495.50916, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "21", "bbox": {"l": 502.14251999999993, "t": 400.55295, "r": 508.46178999999995, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "22", "bbox": {"l": 515.09509, "t": 400.55295, "r": 521.41443, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "23", "bbox": {"l": 385.2814, "t": 411.03836000000007, "r": 391.60071, "b": 417.35699, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "24", "bbox": {"l": 398.52341, "t": 411.03836000000007, "r": 404.84271, "b": 417.35699, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "25", "bbox": {"l": 411.47604, "t": 411.03836000000007, "r": 417.79535, "b": 417.35699, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "26", "bbox": {"l": 437.37939, "t": 411.03836000000007, "r": 443.69870000000003, "b": 417.35699, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "27", "bbox": {"l": 450.33203, "t": 411.03836000000007, "r": 456.6513100000001, "b": 417.35699, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "28", "bbox": {"l": 463.28464, "t": 411.03836000000007, "r": 469.60394, "b": 417.35699, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "30", "bbox": {"l": 385.2814, "t": 421.0697, "r": 391.60071, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "31", "bbox": {"l": 398.52341, "t": 421.0697, "r": 404.84271, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "32", "bbox": {"l": 411.47604, "t": 421.0697, "r": 417.79532, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "33", "bbox": {"l": 424.42865, "t": 421.0697, "r": 430.74796, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "34", "bbox": {"l": 437.38129, "t": 421.0697, "r": 443.70056, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "35", "bbox": {"l": 450.33389000000005, "t": 421.0697, "r": 456.65319999999997, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "36", "bbox": {"l": 463.2865, "t": 421.0697, "r": 469.6058, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "37", "bbox": {"l": 476.23914, "t": 421.0697, "r": 482.55841, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "38", "bbox": {"l": 489.1917700000001, "t": 421.0697, "r": 495.51105, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "39", "bbox": {"l": 502.14438, "t": 421.0697, "r": 508.46368, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "40", "bbox": {"l": 515.09705, "t": 421.0697, "r": 521.41632, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "41", "bbox": {"l": 528.04962, "t": 421.0697, "r": 534.3689, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "42", "bbox": {"l": 385.2814, "t": 432.04431, "r": 391.60071, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "43", "bbox": {"l": 398.52341, "t": 432.04431, "r": 404.84271, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "44", "bbox": {"l": 411.47604, "t": 432.04431, "r": 417.79532, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "45", "bbox": {"l": 424.42865, "t": 432.04431, "r": 430.74796, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "46", "bbox": {"l": 437.38129, "t": 432.04431, "r": 443.70056, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "47", "bbox": {"l": 450.33389000000005, "t": 432.04431, "r": 456.65319999999997, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "48", "bbox": {"l": 463.2865, "t": 432.04431, "r": 469.6058, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "49", "bbox": {"l": 476.23914, "t": 432.04431, "r": 482.55841, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "50", "bbox": {"l": 489.1917700000001, "t": 432.04431, "r": 495.51105, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "51", "bbox": {"l": 502.14438, "t": 432.04431, "r": 508.46368, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "52", "bbox": {"l": 515.09705, "t": 432.04431, "r": 521.41632, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "53", "bbox": {"l": 528.04962, "t": 432.04431, "r": 534.3689, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "0", "bbox": {"l": 385.2814, "t": 389.20004, "r": 388.44073, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "1", "bbox": {"l": 398.52341, "t": 389.20004, "r": 401.68274, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "2", "bbox": {"l": 411.4754, "t": 389.20004, "r": 414.63474, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "3", "bbox": {"l": 424.4274, "t": 389.20004, "r": 427.58673, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "4", "bbox": {"l": 437.37939, "t": 389.20004, "r": 440.53870000000006, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "5", "bbox": {"l": 450.33136, "t": 389.20004, "r": 453.49069000000003, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "6", "bbox": {"l": 463.28336, "t": 389.20004, "r": 466.44269, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "7", "bbox": {"l": 476.23535, "t": 389.20004, "r": 479.39468, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "8", "bbox": {"l": 489.18735, "t": 389.20004, "r": 492.34668, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "9", "bbox": {"l": 502.13933999999995, "t": 389.20004, "r": 505.29868000000005, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "10", "bbox": {"l": 515.09131, "t": 389.20004, "r": 521.41064, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "11", "bbox": {"l": 528.04364, "t": 389.20004, "r": 534.13104, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "12", "bbox": {"l": 385.2814, "t": 398.97464, "r": 391.60071, "b": 405.29327, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "13", "bbox": {"l": 398.52341, "t": 398.97464, "r": 404.84271, "b": 405.29327, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "14", "bbox": {"l": 411.47604, "t": 398.97464, "r": 417.79535, "b": 405.29327, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "15", "bbox": {"l": 424.42719, "t": 406.77463000000006, "r": 430.74648999999994, "b": 413.09326, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "29", "bbox": {"l": 502.86941999999993, "t": 410.99438, "r": 509.18871999999993, "b": 417.31302, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "Predicted Structure", "bbox": {"l": 384.35437, "t": 381.77722, "r": 430.99261, "b": 386.44281, "coord_origin": "TOPLEFT"}}], "children": [{"id": 146, "label": "text", "bbox": {"l": 437.37939, "t": 400.55295, "r": 443.69870000000003, "b": 406.87158, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 126, "text": "16", "bbox": {"l": 437.37939, "t": 400.55295, "r": 443.69870000000003, "b": 406.87158, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 147, "label": "text", "bbox": {"l": 450.33203, "t": 400.55295, "r": 456.6513100000001, "b": 406.87158, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 127, "text": "17", "bbox": {"l": 450.33203, "t": 400.55295, "r": 456.6513100000001, "b": 406.87158, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 148, "label": "text", "bbox": {"l": 463.28464, "t": 400.55295, "r": 469.60394, "b": 406.87158, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 128, "text": "18", "bbox": {"l": 463.28464, "t": 400.55295, "r": 469.60394, "b": 406.87158, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 149, "label": "text", "bbox": {"l": 476.23724000000004, "t": 400.55295, "r": 482.5565500000001, "b": 406.87158, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 129, "text": "19", "bbox": {"l": 476.23724000000004, "t": 400.55295, "r": 482.5565500000001, "b": 406.87158, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 150, "label": "text", "bbox": {"l": 489.18988, "t": 400.55295, "r": 495.50916, "b": 406.87158, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 130, "text": "20", "bbox": {"l": 489.18988, "t": 400.55295, "r": 495.50916, "b": 406.87158, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 151, "label": "text", "bbox": {"l": 502.14251999999993, "t": 400.55295, "r": 508.46178999999995, "b": 406.87158, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 131, "text": "21", "bbox": {"l": 502.14251999999993, "t": 400.55295, "r": 508.46178999999995, "b": 406.87158, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 152, "label": "text", "bbox": {"l": 515.09509, "t": 400.55295, "r": 521.41443, "b": 406.87158, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 132, "text": "22", "bbox": {"l": 515.09509, "t": 400.55295, "r": 521.41443, "b": 406.87158, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 153, "label": "text", "bbox": {"l": 385.2814, "t": 411.03836000000007, "r": 391.60071, "b": 417.35699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 133, "text": "23", "bbox": {"l": 385.2814, "t": 411.03836000000007, "r": 391.60071, "b": 417.35699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 154, "label": "text", "bbox": {"l": 398.52341, "t": 411.03836000000007, "r": 404.84271, "b": 417.35699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 134, "text": "24", "bbox": {"l": 398.52341, "t": 411.03836000000007, "r": 404.84271, "b": 417.35699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 155, "label": "text", "bbox": {"l": 411.47604, "t": 411.03836000000007, "r": 417.79535, "b": 417.35699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 135, "text": "25", "bbox": {"l": 411.47604, "t": 411.03836000000007, "r": 417.79535, "b": 417.35699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 156, "label": "text", "bbox": {"l": 437.37939, "t": 411.03836000000007, "r": 443.69870000000003, "b": 417.35699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 136, "text": "26", "bbox": {"l": 437.37939, "t": 411.03836000000007, "r": 443.69870000000003, "b": 417.35699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 157, "label": "text", "bbox": {"l": 450.33203, "t": 411.03836000000007, "r": 456.6513100000001, "b": 417.35699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 137, "text": "27", "bbox": {"l": 450.33203, "t": 411.03836000000007, "r": 456.6513100000001, "b": 417.35699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 158, "label": "text", "bbox": {"l": 463.28464, "t": 411.03836000000007, "r": 469.60394, "b": 417.35699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 138, "text": "28", "bbox": {"l": 463.28464, "t": 411.03836000000007, "r": 469.60394, "b": 417.35699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 159, "label": "text", "bbox": {"l": 385.2814, "t": 421.0697, "r": 391.60071, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 139, "text": "30", "bbox": {"l": 385.2814, "t": 421.0697, "r": 391.60071, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 160, "label": "text", "bbox": {"l": 398.52341, "t": 421.0697, "r": 404.84271, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 140, "text": "31", "bbox": {"l": 398.52341, "t": 421.0697, "r": 404.84271, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 161, "label": "text", "bbox": {"l": 411.47604, "t": 421.0697, "r": 417.79532, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 141, "text": "32", "bbox": {"l": 411.47604, "t": 421.0697, "r": 417.79532, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 162, "label": "text", "bbox": {"l": 424.42865, "t": 421.0697, "r": 430.74796, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 142, "text": "33", "bbox": {"l": 424.42865, "t": 421.0697, "r": 430.74796, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 163, "label": "text", "bbox": {"l": 437.38129, "t": 421.0697, "r": 443.70056, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 143, "text": "34", "bbox": {"l": 437.38129, "t": 421.0697, "r": 443.70056, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 164, "label": "text", "bbox": {"l": 450.33389000000005, "t": 421.0697, "r": 456.65319999999997, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 144, "text": "35", "bbox": {"l": 450.33389000000005, "t": 421.0697, "r": 456.65319999999997, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 165, "label": "text", "bbox": {"l": 463.2865, "t": 421.0697, "r": 469.6058, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 145, "text": "36", "bbox": {"l": 463.2865, "t": 421.0697, "r": 469.6058, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 166, "label": "text", "bbox": {"l": 476.23914, "t": 421.0697, "r": 482.55841, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 146, "text": "37", "bbox": {"l": 476.23914, "t": 421.0697, "r": 482.55841, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 167, "label": "text", "bbox": {"l": 489.1917700000001, "t": 421.0697, "r": 495.51105, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 147, "text": "38", "bbox": {"l": 489.1917700000001, "t": 421.0697, "r": 495.51105, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 168, "label": "text", "bbox": {"l": 502.14438, "t": 421.0697, "r": 508.46368, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 148, "text": "39", "bbox": {"l": 502.14438, "t": 421.0697, "r": 508.46368, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 169, "label": "text", "bbox": {"l": 515.09705, "t": 421.0697, "r": 521.41632, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 149, "text": "40", "bbox": {"l": 515.09705, "t": 421.0697, "r": 521.41632, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 170, "label": "text", "bbox": {"l": 528.04962, "t": 421.0697, "r": 534.3689, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 150, "text": "41", "bbox": {"l": 528.04962, "t": 421.0697, "r": 534.3689, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 171, "label": "text", "bbox": {"l": 385.2814, "t": 432.04431, "r": 391.60071, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 151, "text": "42", "bbox": {"l": 385.2814, "t": 432.04431, "r": 391.60071, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 172, "label": "text", "bbox": {"l": 398.52341, "t": 432.04431, "r": 404.84271, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 152, "text": "43", "bbox": {"l": 398.52341, "t": 432.04431, "r": 404.84271, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 173, "label": "text", "bbox": {"l": 411.47604, "t": 432.04431, "r": 417.79532, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 153, "text": "44", "bbox": {"l": 411.47604, "t": 432.04431, "r": 417.79532, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 174, "label": "text", "bbox": {"l": 424.42865, "t": 432.04431, "r": 430.74796, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 154, "text": "45", "bbox": {"l": 424.42865, "t": 432.04431, "r": 430.74796, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 175, "label": "text", "bbox": {"l": 437.38129, "t": 432.04431, "r": 443.70056, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 155, "text": "46", "bbox": {"l": 437.38129, "t": 432.04431, "r": 443.70056, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 176, "label": "text", "bbox": {"l": 450.33389000000005, "t": 432.04431, "r": 456.65319999999997, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 156, "text": "47", "bbox": {"l": 450.33389000000005, "t": 432.04431, "r": 456.65319999999997, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 177, "label": "text", "bbox": {"l": 463.2865, "t": 432.04431, "r": 469.6058, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 157, "text": "48", "bbox": {"l": 463.2865, "t": 432.04431, "r": 469.6058, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 178, "label": "text", "bbox": {"l": 476.23914, "t": 432.04431, "r": 482.55841, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 158, "text": "49", "bbox": {"l": 476.23914, "t": 432.04431, "r": 482.55841, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 179, "label": "text", "bbox": {"l": 489.1917700000001, "t": 432.04431, "r": 495.51105, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 159, "text": "50", "bbox": {"l": 489.1917700000001, "t": 432.04431, "r": 495.51105, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 180, "label": "text", "bbox": {"l": 502.14438, "t": 432.04431, "r": 508.46368, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 160, "text": "51", "bbox": {"l": 502.14438, "t": 432.04431, "r": 508.46368, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 181, "label": "text", "bbox": {"l": 515.09705, "t": 432.04431, "r": 521.41632, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 161, "text": "52", "bbox": {"l": 515.09705, "t": 432.04431, "r": 521.41632, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 182, "label": "text", "bbox": {"l": 528.04962, "t": 432.04431, "r": 534.3689, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 162, "text": "53", "bbox": {"l": 528.04962, "t": 432.04431, "r": 534.3689, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 183, "label": "text", "bbox": {"l": 385.2814, "t": 389.20004, "r": 388.44073, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 163, "text": "0", "bbox": {"l": 385.2814, "t": 389.20004, "r": 388.44073, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 184, "label": "text", "bbox": {"l": 398.52341, "t": 389.20004, "r": 401.68274, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 164, "text": "1", "bbox": {"l": 398.52341, "t": 389.20004, "r": 401.68274, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 185, "label": "text", "bbox": {"l": 411.4754, "t": 389.20004, "r": 414.63474, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 165, "text": "2", "bbox": {"l": 411.4754, "t": 389.20004, "r": 414.63474, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 186, "label": "text", "bbox": {"l": 424.4274, "t": 389.20004, "r": 427.58673, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 166, "text": "3", "bbox": {"l": 424.4274, "t": 389.20004, "r": 427.58673, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 187, "label": "text", "bbox": {"l": 437.37939, "t": 389.20004, "r": 440.53870000000006, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 167, "text": "4", "bbox": {"l": 437.37939, "t": 389.20004, "r": 440.53870000000006, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 188, "label": "text", "bbox": {"l": 450.33136, "t": 389.20004, "r": 453.49069000000003, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 168, "text": "5", "bbox": {"l": 450.33136, "t": 389.20004, "r": 453.49069000000003, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 189, "label": "text", "bbox": {"l": 463.28336, "t": 389.20004, "r": 466.44269, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 169, "text": "6", "bbox": {"l": 463.28336, "t": 389.20004, "r": 466.44269, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 190, "label": "text", "bbox": {"l": 476.23535, "t": 389.20004, "r": 479.39468, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 170, "text": "7", "bbox": {"l": 476.23535, "t": 389.20004, "r": 479.39468, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 191, "label": "text", "bbox": {"l": 489.18735, "t": 389.20004, "r": 492.34668, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 171, "text": "8", "bbox": {"l": 489.18735, "t": 389.20004, "r": 492.34668, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 192, "label": "text", "bbox": {"l": 502.13933999999995, "t": 389.20004, "r": 505.29868000000005, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 172, "text": "9", "bbox": {"l": 502.13933999999995, "t": 389.20004, "r": 505.29868000000005, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 193, "label": "text", "bbox": {"l": 515.09131, "t": 389.20004, "r": 521.41064, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 173, "text": "10", "bbox": {"l": 515.09131, "t": 389.20004, "r": 521.41064, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 194, "label": "text", "bbox": {"l": 528.04364, "t": 389.20004, "r": 534.13104, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 174, "text": "11", "bbox": {"l": 528.04364, "t": 389.20004, "r": 534.13104, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 195, "label": "text", "bbox": {"l": 385.2814, "t": 398.97464, "r": 391.60071, "b": 405.29327, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 175, "text": "12", "bbox": {"l": 385.2814, "t": 398.97464, "r": 391.60071, "b": 405.29327, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 196, "label": "text", "bbox": {"l": 398.52341, "t": 398.97464, "r": 404.84271, "b": 405.29327, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 176, "text": "13", "bbox": {"l": 398.52341, "t": 398.97464, "r": 404.84271, "b": 405.29327, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 197, "label": "text", "bbox": {"l": 411.47604, "t": 398.97464, "r": 417.79535, "b": 405.29327, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 177, "text": "14", "bbox": {"l": 411.47604, "t": 398.97464, "r": 417.79535, "b": 405.29327, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 198, "label": "text", "bbox": {"l": 424.42719, "t": 406.77463000000006, "r": 430.74648999999994, "b": 413.09326, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 178, "text": "15", "bbox": {"l": 424.42719, "t": 406.77463000000006, "r": 430.74648999999994, "b": 413.09326, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 199, "label": "text", "bbox": {"l": 502.86941999999993, "t": 410.99438, "r": 509.18871999999993, "b": 417.31302, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 179, "text": "29", "bbox": {"l": 502.86941999999993, "t": 410.99438, "r": 509.18871999999993, "b": 417.31302, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 200, "label": "text", "bbox": {"l": 384.35437, "t": 381.77722, "r": 430.99261, "b": 386.44281, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 180, "text": "Predicted Structure", "bbox": {"l": 384.35437, "t": 381.77722, "r": 430.99261, "b": 386.44281, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "caption", "id": 5, "page_no": 7, "cluster": {"id": 5, "label": "caption", "bbox": {"l": 62.595001, "t": 458.72836, "r": 532.63049, "b": 467.63492, "coord_origin": "TOPLEFT"}, "confidence": 0.9153602719306946, "cells": [{"id": 181, "text": "Figure 6: An example of TableFormer predictions (bounding boxes and structure) from generated SynthTabNet table.", "bbox": {"l": 62.595001, "t": 458.72836, "r": 532.63049, "b": 467.63492, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 6: An example of TableFormer predictions (bounding boxes and structure) from generated SynthTabNet table."}, {"label": "section_header", "id": 2, "page_no": 7, "cluster": {"id": 2, "label": "section_header", "bbox": {"l": 50.112, "t": 491.39536, "r": 163.7558, "b": 501.24741, "coord_origin": "TOPLEFT"}, "confidence": 0.9561247229576111, "cells": [{"id": 182, "text": "5.5.", "bbox": {"l": 50.112, "t": 491.39536, "r": 64.448898, "b": 501.24741, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "Qualitative Analysis", "bbox": {"l": 74.006828, "t": 491.39536, "r": 163.7558, "b": 501.24741, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5.5. Qualitative Analysis"}, {"label": "text", "id": 1, "page_no": 7, "cluster": {"id": 1, "label": "text", "bbox": {"l": 50.112, "t": 536.87337, "r": 286.36511, "b": 713.1519470000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9852361679077148, "cells": [{"id": 184, "text": "We showcase several visualizations for the different", "bbox": {"l": 62.067001, "t": 536.87337, "r": 286.36499, "b": 545.77992, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": "components of our network on various", "bbox": {"l": 50.112, "t": 548.82837, "r": 211.15741, "b": 557.73492, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "\u201ccomplex\u201d", "bbox": {"l": 215.10000999999997, "t": 548.91803, "r": 259.17453, "b": 557.50578, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "tables", "bbox": {"l": 263.12, "t": 548.82837, "r": 286.36273, "b": 557.73492, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": "within datasets presented in this work in Fig. 5 and Fig. 6", "bbox": {"l": 50.112, "t": 560.78337, "r": 286.36505, "b": 569.68993, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "As it is shown, our model is able to predict bounding boxes", "bbox": {"l": 50.112, "t": 572.73837, "r": 286.36508, "b": 581.6449299999999, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "for all table cells, even for the empty ones. Additionally,", "bbox": {"l": 50.112, "t": 584.69337, "r": 286.36508, "b": 593.59993, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "our post-processing techniques can extract the cell content", "bbox": {"l": 50.112, "t": 596.64937, "r": 286.36505, "b": 605.55592, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": "by matching the predicted bounding boxes to the PDF cells", "bbox": {"l": 50.112, "t": 608.60437, "r": 286.36508, "b": 617.51093, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "based on their overlap and spatial proximity. The left part", "bbox": {"l": 50.112, "t": 620.55937, "r": 286.36508, "b": 629.46593, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "of Fig. 5 demonstrates also the adaptability of our method", "bbox": {"l": 50.112, "t": 632.51437, "r": 286.36508, "b": 641.42093, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "to any language, as it can successfully extract Japanese", "bbox": {"l": 50.112, "t": 644.46938, "r": 286.36508, "b": 653.37593, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "text, although the training set contains only English content.", "bbox": {"l": 50.112, "t": 656.42438, "r": 286.36511, "b": 665.33094, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "We provide more visualizations including the intermediate", "bbox": {"l": 50.112, "t": 668.38037, "r": 286.36508, "b": 677.28694, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "steps in the supplementary material. Overall these illustra-", "bbox": {"l": 50.112, "t": 680.33537, "r": 286.36511, "b": 689.24194, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "tions justify the versatility of our method across a diverse", "bbox": {"l": 50.112, "t": 692.290375, "r": 286.36511, "b": 701.196945, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "range of table appearances and content type.", "bbox": {"l": 50.112, "t": 704.245377, "r": 226.88833999999997, "b": 713.1519470000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "We showcase several visualizations for the different components of our network on various \"complex\" tables within datasets presented in this work in Fig. 5 and Fig. 6 As it is shown, our model is able to predict bounding boxes for all table cells, even for the empty ones. Additionally, our post-processing techniques can extract the cell content by matching the predicted bounding boxes to the PDF cells based on their overlap and spatial proximity. The left part of Fig. 5 demonstrates also the adaptability of our method to any language, as it can successfully extract Japanese text, although the training set contains only English content. We provide more visualizations including the intermediate steps in the supplementary material. Overall these illustrations justify the versatility of our method across a diverse range of table appearances and content type."}, {"label": "section_header", "id": 4, "page_no": 7, "cluster": {"id": 4, "label": "section_header", "bbox": {"l": 308.862, "t": 490.70892, "r": 460.84848, "b": 501.45663, "coord_origin": "TOPLEFT"}, "confidence": 0.9436525702476501, "cells": [{"id": 201, "text": "6.", "bbox": {"l": 308.862, "t": 490.70892, "r": 316.07382, "b": 501.45663, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": "Future Work & Conclusion", "bbox": {"l": 325.68954, "t": 490.70892, "r": 460.84848, "b": 501.45663, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "6. Future Work & Conclusion"}, {"label": "text", "id": 0, "page_no": 7, "cluster": {"id": 0, "label": "text", "bbox": {"l": 308.862, "t": 512.89337, "r": 545.11517, "b": 653.30592, "coord_origin": "TOPLEFT"}, "confidence": 0.9875594973564148, "cells": [{"id": 203, "text": "In this paper, we presented TableFormer an end-to-end", "bbox": {"l": 320.81699, "t": 512.89337, "r": 545.11505, "b": 521.79993, "coord_origin": "TOPLEFT"}}, {"id": 204, "text": "transformer based approach to predict table structures and", "bbox": {"l": 308.862, "t": 524.84836, "r": 545.11517, "b": 533.75491, "coord_origin": "TOPLEFT"}}, {"id": 205, "text": "bounding boxes of cells from an image. This approach en-", "bbox": {"l": 308.862, "t": 536.80336, "r": 545.11511, "b": 545.70992, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": "ables us to recreate the table structure, and extract the cell", "bbox": {"l": 308.862, "t": 548.75836, "r": 545.11505, "b": 557.6649199999999, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": "content from PDF or OCR by using bounding boxes. Ad-", "bbox": {"l": 308.862, "t": 560.71336, "r": 545.11517, "b": 569.61992, "coord_origin": "TOPLEFT"}}, {"id": 208, "text": "ditionally, it provides the versatility required in real-world", "bbox": {"l": 308.862, "t": 572.66837, "r": 545.11511, "b": 581.57492, "coord_origin": "TOPLEFT"}}, {"id": 209, "text": "scenarios when dealing with various types of PDF docu-", "bbox": {"l": 308.862, "t": 584.62436, "r": 545.11511, "b": 593.53091, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": "ments, and languages.", "bbox": {"l": 308.862, "t": 596.57936, "r": 400.46808, "b": 605.48592, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "Furthermore, our method outper-", "bbox": {"l": 408.37839, "t": 596.57936, "r": 545.11511, "b": 605.48592, "coord_origin": "TOPLEFT"}}, {"id": 212, "text": "forms all state-of-the-arts with a wide margin. Finally, we", "bbox": {"l": 308.862, "t": 608.53436, "r": 545.11505, "b": 617.44092, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "introduce \u201cSynthTabNet\u201d a challenging synthetically gen-", "bbox": {"l": 308.862, "t": 620.48936, "r": 545.11511, "b": 629.3959199999999, "coord_origin": "TOPLEFT"}}, {"id": 214, "text": "erated dataset that reinforces missing characteristics from", "bbox": {"l": 308.862, "t": 632.4443699999999, "r": 545.11505, "b": 641.35092, "coord_origin": "TOPLEFT"}}, {"id": 215, "text": "other datasets.", "bbox": {"l": 308.862, "t": 644.39937, "r": 365.85803, "b": 653.30592, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In this paper, we presented TableFormer an end-to-end transformer based approach to predict table structures and bounding boxes of cells from an image. This approach enables us to recreate the table structure, and extract the cell content from PDF or OCR by using bounding boxes. Additionally, it provides the versatility required in real-world scenarios when dealing with various types of PDF documents, and languages. Furthermore, our method outperforms all state-of-the-arts with a wide margin. Finally, we introduce \"SynthTabNet\" a challenging synthetically generated dataset that reinforces missing characteristics from other datasets."}, {"label": "section_header", "id": 3, "page_no": 7, "cluster": {"id": 3, "label": "section_header", "bbox": {"l": 308.862, "t": 672.09892, "r": 364.40585, "b": 682.84664, "coord_origin": "TOPLEFT"}, "confidence": 0.9442470073699951, "cells": [{"id": 216, "text": "References", "bbox": {"l": 308.862, "t": 672.09892, "r": 364.40585, "b": 682.84664, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "References"}, {"label": "list_item", "id": 10, "page_no": 7, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 313.345, "t": 693.9617920000001, "r": 545.1134, "b": 712.936752, "coord_origin": "TOPLEFT"}, "confidence": 0.8318753838539124, "cells": [{"id": 217, "text": "[1]", "bbox": {"l": 313.345, "t": 693.9617920000001, "r": 323.80792, "b": 701.977753, "coord_origin": "TOPLEFT"}}, {"id": 218, "text": "Nicolas Carion, Francisco Massa, Gabriel Synnaeve, Nicolas", "bbox": {"l": 326.05127, "t": 693.9617920000001, "r": 545.10852, "b": 701.977753, "coord_origin": "TOPLEFT"}}, {"id": 219, "text": "Usunier, Alexander Kirillov, and Sergey Zagoruyko. End-to-", "bbox": {"l": 328.78101, "t": 704.920792, "r": 545.1134, "b": 712.936752, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[1] Nicolas Carion, Francisco Massa, Gabriel Synnaeve, Nicolas Usunier, Alexander Kirillov, and Sergey Zagoruyko. End-to-"}, {"label": "picture", "id": 15, "page_no": 7, "cluster": {"id": 15, "label": "picture", "bbox": {"l": 305.5836486816406, "t": 98.65415954589844, "r": 554.8258666992188, "b": 180.6267547607422, "coord_origin": "TOPLEFT"}, "confidence": 0.7699173092842102, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "picture", "id": 14, "page_no": 7, "cluster": {"id": 14, "label": "picture", "bbox": {"l": 49.97503662109375, "t": 103.71266174316406, "r": 301.6335754394531, "b": 187.5789337158203, "coord_origin": "TOPLEFT"}, "confidence": 0.7873926162719727, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "headers": [{"label": "page_footer", "id": 9, "page_no": 7, "cluster": {"id": 9, "label": "page_footer", "bbox": {"l": 295.121, "t": 734.133366, "r": 300.10229, "b": 743.039928, "coord_origin": "TOPLEFT"}, "confidence": 0.8709858059883118, "cells": [{"id": 220, "text": "8", "bbox": {"l": 295.121, "t": 734.133366, "r": 300.10229, "b": 743.039928, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "8"}]}}, {"page_no": 8, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "end object detection with transformers. In Andrea Vedaldi,", "bbox": {"l": 70.030998, "t": 75.88378999999998, "r": 286.36334, "b": 83.89977999999996, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Horst Bischof, Thomas Brox, and Jan-Michael Frahm, edi-", "bbox": {"l": 70.030998, "t": 86.84276999999997, "r": 286.36331, "b": 94.85875999999996, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "tors,", "bbox": {"l": 70.030998, "t": 97.80078000000003, "r": 85.722198, "b": 105.81677000000002, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Computer Vision - ECCV 2020", "bbox": {"l": 87.889, "t": 97.88147000000004, "r": 199.93315, "b": 105.61053000000004, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": ", pages 213-229, Cham,", "bbox": {"l": 199.936, "t": 97.80078000000003, "r": 286.36313, "b": 105.81677000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "2020. Springer International Publishing. 5", "bbox": {"l": 70.031006, "t": 108.75977, "r": 221.94871999999998, "b": 116.77575999999999, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "[2]", "bbox": {"l": 54.595005, "t": 120.03174000000013, "r": 65.206657, "b": 128.04773, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Zewen Chi, Heyan Huang, Heng-Da Xu, Houjin Yu, Wanx-", "bbox": {"l": 67.481873, "t": 120.03174000000013, "r": 286.35852, "b": 128.04773, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "uan Yin, and Xian-Ling Mao.", "bbox": {"l": 70.031006, "t": 130.99072, "r": 179.67215, "b": 139.00671, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Complicated table structure", "bbox": {"l": 185.58101, "t": 130.99072, "r": 286.36334, "b": 139.00671, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "recognition.", "bbox": {"l": 70.031006, "t": 141.94970999999998, "r": 113.11456, "b": 149.96569999999997, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "arXiv preprint arXiv:1908.04729", "bbox": {"l": 116.34200999999999, "t": 142.0304, "r": 235.3082, "b": 149.75946, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": ", 2019. 3", "bbox": {"l": 235.30701, "t": 141.94970999999998, "r": 267.67572, "b": 149.96569999999997, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "[3]", "bbox": {"l": 54.595001, "t": 153.22168, "r": 65.103195, "b": 161.23766999999998, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Bertrand Couasnon and Aurelie Lemaitre.", "bbox": {"l": 67.356239, "t": 153.22168, "r": 218.77876, "b": 161.23766999999998, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Recognition of Ta-", "bbox": {"l": 220.97999999999996, "t": 153.30237, "r": 286.36301, "b": 161.03143, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "bles and Forms", "bbox": {"l": 70.030991, "t": 164.26135, "r": 125.26401000000001, "b": 171.99041999999997, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": ", pages 647-677. Springer London, London,", "bbox": {"l": 125.26098999999999, "t": 164.18066, "r": 286.36029, "b": 172.19665999999995, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "2014. 2", "bbox": {"l": 70.030991, "t": 175.13867000000005, "r": 97.916496, "b": 183.15466000000004, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "[4]", "bbox": {"l": 54.59499, "t": 186.41063999999994, "r": 65.806984, "b": 194.42664000000002, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Herv\u00b4e D\u00b4ejean, Jean-Luc Meunier, Liangcai Gao, Yilun", "bbox": {"l": 68.210922, "t": 186.41063999999994, "r": 286.36401, "b": 194.42664000000002, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Huang, Yu Fang, Florian Kleber, and Eva-Maria Lang. IC-", "bbox": {"l": 70.030983, "t": 197.36963000000003, "r": 286.36331, "b": 205.38562000000002, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "DAR 2019 Competition on Table Detection and Recognition", "bbox": {"l": 70.030983, "t": 208.32861000000003, "r": 286.36334, "b": 216.3446, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "(cTDaR), Apr. 2019. http://sac.founderit.com/. 2", "bbox": {"l": 70.030983, "t": 219.2876, "r": 245.83519, "b": 227.30358999999999, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "[5]", "bbox": {"l": 54.594982, "t": 230.55957, "r": 65.381134, "b": 238.57556, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "Basilios Gatos, Dimitrios Danatsas, Ioannis Pratikakis, and", "bbox": {"l": 67.693779, "t": 230.55957, "r": 286.35849, "b": 238.57556, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "Stavros J Perantonis. Automatic table detection in document", "bbox": {"l": 70.030983, "t": 241.51855, "r": 286.36334, "b": 249.53454999999997, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "images. In", "bbox": {"l": 70.030983, "t": 252.47655999999995, "r": 108.39821, "b": 260.49255000000005, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "International Conference on Pattern Recognition", "bbox": {"l": 110.64498000000002, "t": 252.55724999999995, "r": 286.3595, "b": 260.28632000000005, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "and Image Analysis", "bbox": {"l": 70.030983, "t": 263.51624000000004, "r": 140.57861, "b": 271.24530000000004, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": ", pages 609-618. Springer, 2005. 2", "bbox": {"l": 140.57797, "t": 263.43555000000003, "r": 266.47522, "b": 271.45154, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "[6]", "bbox": {"l": 54.594971, "t": 274.70758, "r": 64.848648, "b": 282.72351, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Max G\u00a8obel, Tamir Hassan, Ermelinda Oro, and Giorgio Orsi.", "bbox": {"l": 67.047119, "t": 274.70758, "r": 286.36676, "b": 282.72351, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "Icdar 2013 table competition.", "bbox": {"l": 70.030975, "t": 285.66655999999995, "r": 179.57349, "b": 293.68253, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "In", "bbox": {"l": 187.01559, "t": 285.66655999999995, "r": 194.4846, "b": 293.68253, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "2013 12th International", "bbox": {"l": 198.04398, "t": 285.74725, "r": 286.36304, "b": 293.47632, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Conference on Document Analysis and Recognition", "bbox": {"l": 70.030975, "t": 296.70624, "r": 260.19937, "b": 304.43530000000004, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": ", pages", "bbox": {"l": 260.198, "t": 296.62555, "r": 286.36197, "b": 304.64151, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "1449-1453, 2013. 2", "bbox": {"l": 70.030991, "t": 307.5845299999999, "r": 142.74849, "b": 315.6004899999999, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "[7]", "bbox": {"l": 54.59499, "t": 318.85654, "r": 65.61586, "b": 326.8725, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "EA Green and M Krishnamoorthy.", "bbox": {"l": 67.978821, "t": 318.85654, "r": 199.492, "b": 326.8725, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Recognition of tables", "bbox": {"l": 206.98792, "t": 318.85654, "r": 286.35849, "b": 326.8725, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "using table grammars. procs.", "bbox": {"l": 70.030991, "t": 329.8145400000001, "r": 176.28284, "b": 337.83051, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "In", "bbox": {"l": 182.60416, "t": 329.8145400000001, "r": 190.07317, "b": 337.83051, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "Symposium on Document", "bbox": {"l": 193.28299, "t": 329.89522999999997, "r": 286.36319, "b": 337.62429999999995, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Analysis and Recognition (SDAIR\u201995)", "bbox": {"l": 70.030991, "t": 340.85425, "r": 206.34717, "b": 348.58331, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": ", pages 261-277. 2", "bbox": {"l": 206.34599, "t": 340.77356, "r": 274.82239, "b": 348.78952, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "[8]", "bbox": {"l": 54.594986000000006, "t": 352.0455600000001, "r": 65.04657, "b": 360.06152, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Khurram Azeem Hashmi, Alain Pagani, Marcus Liwicki, Di-", "bbox": {"l": 67.287483, "t": 352.0455600000001, "r": 286.35849, "b": 360.06152, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "dier Stricker, and Muhammad Zeshan Afzal.", "bbox": {"l": 70.030983, "t": 363.00458, "r": 234.12507999999997, "b": 371.02054, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Castabdetec-", "bbox": {"l": 240.05186, "t": 363.00458, "r": 286.36331, "b": 371.02054, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "tors: Cascade network for table detection in document im-", "bbox": {"l": 70.030983, "t": 373.96356, "r": 286.36331, "b": 381.97952, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "ages with recursive feature pyramid and switchable atrous", "bbox": {"l": 70.030983, "t": 384.92255, "r": 286.36331, "b": 392.93851, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "convolution.", "bbox": {"l": 70.030983, "t": 395.88153, "r": 114.57605, "b": 403.89749, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "Journal of Imaging", "bbox": {"l": 117.80399000000001, "t": 395.96222, "r": 186.7287, "b": 403.69128, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": ", 7(10), 2021. 1", "bbox": {"l": 186.728, "t": 395.88153, "r": 243.00113999999996, "b": 403.89749, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "[9]", "bbox": {"l": 54.595001, "t": 407.15253000000007, "r": 65.334427, "b": 415.1684900000001, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Kaiming He, Georgia Gkioxari, Piotr Dollar, and Ross Gir-", "bbox": {"l": 67.637054, "t": 407.15253000000007, "r": 286.35852, "b": 415.1684900000001, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "shick. Mask r-cnn. In", "bbox": {"l": 70.030998, "t": 418.11151, "r": 147.13306, "b": 426.12747, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Proceedings of the IEEE International", "bbox": {"l": 149.15601, "t": 418.1922, "r": 286.35989, "b": 425.92126, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Conference on Computer Vision (ICCV)", "bbox": {"l": 70.031006, "t": 429.15118, "r": 213.48445, "b": 436.88025, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": ", Oct 2017. 1", "bbox": {"l": 213.483, "t": 429.07050000000004, "r": 261.04083, "b": 437.08646000000005, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "[10]", "bbox": {"l": 50.112, "t": 440.3424999999999, "r": 65.399307, "b": 448.3584599999999, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "Yelin He, X. Qi, Jiaquan Ye, Peng Gao, Yihao Chen, Bing-", "bbox": {"l": 67.693321, "t": 440.3424999999999, "r": 286.3587, "b": 448.3584599999999, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "cong Li, Xin Tang, and Rong Xiao.", "bbox": {"l": 70.030998, "t": 451.30151, "r": 202.74268, "b": 459.31747, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "Pingan-vcgroup\u2019s so-", "bbox": {"l": 209.00122, "t": 451.30151, "r": 286.36331, "b": 459.31747, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "lution for icdar 2021 competition on scientific table image", "bbox": {"l": 70.030998, "t": 462.2605, "r": 286.36334, "b": 470.27646, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "recognition to latex.", "bbox": {"l": 70.030998, "t": 473.21948, "r": 141.86981, "b": 481.23544, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "ArXiv", "bbox": {"l": 145.097, "t": 473.30017, "r": 166.01561, "b": 481.02924, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": ", abs/2105.01846, 2021. 2", "bbox": {"l": 166.015, "t": 473.21948, "r": 259.90216, "b": 481.23544, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "[11]", "bbox": {"l": 50.112, "t": 484.49048, "r": 66.033806, "b": 492.50644, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Jianying Hu, Ramanujan S Kashi, Daniel P Lopresti, and", "bbox": {"l": 68.423035, "t": 484.49048, "r": 286.35873, "b": 492.50644, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "Gordon Wilfong. Medium-independent table detection. In", "bbox": {"l": 70.030998, "t": 495.44946, "r": 286.36331, "b": 503.46542, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "Document Recognition and Retrieval VII", "bbox": {"l": 70.030998, "t": 506.48914, "r": 227.40926, "b": 514.2182, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": ", volume 3967,", "bbox": {"l": 227.40500000000003, "t": 506.40845, "r": 286.35913, "b": 514.4244100000001, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "pages 291-302. International Society for Optics and Photon-", "bbox": {"l": 70.031006, "t": 517.36743, "r": 286.36328, "b": 525.38339, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "ics, 1999. 2", "bbox": {"l": 70.031006, "t": 528.32642, "r": 112.36138000000001, "b": 536.34238, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "[12]", "bbox": {"l": 50.112007, "t": 539.59842, "r": 65.466705, "b": 547.61438, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "Matthew Hurst. A constraint-based approach to table struc-", "bbox": {"l": 67.770828, "t": 539.59842, "r": 286.35873, "b": 547.61438, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "ture derivation. In", "bbox": {"l": 70.031006, "t": 550.55742, "r": 136.28374, "b": 558.57338, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "Proceedings of the Seventh International", "bbox": {"l": 138.811, "t": 550.63812, "r": 286.36206, "b": 558.36716, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Conference on Document Analysis and Recognition - Volume", "bbox": {"l": 70.031006, "t": 561.5971199999999, "r": 286.36334, "b": 569.32616, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "2", "bbox": {"l": 70.031006, "t": 572.55612, "r": 74.514206, "b": 580.28516, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": ", ICDAR \u201903, page 911, USA, 2003. IEEE Computer Soci-", "bbox": {"l": 74.514008, "t": 572.47542, "r": 286.36313, "b": 580.4913799999999, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "ety. 2", "bbox": {"l": 70.031006, "t": 583.4334100000001, "r": 90.357834, "b": 591.44937, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "[13]", "bbox": {"l": 50.112007, "t": 594.70541, "r": 66.270439, "b": 602.72137, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Thotreingam Kasar, Philippine Barlas, Sebastien Adam,", "bbox": {"l": 68.695168, "t": 594.70541, "r": 286.35873, "b": 602.72137, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Cl\u00b4ement Chatelain, and Thierry Paquet. Learning to detect", "bbox": {"l": 70.031006, "t": 605.66441, "r": 286.3631, "b": 613.68037, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "tables in scanned document images using line information.", "bbox": {"l": 70.031006, "t": 616.62341, "r": 286.36331, "b": 624.63937, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "In", "bbox": {"l": 70.031006, "t": 627.58241, "r": 77.500015, "b": 635.5983699999999, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "2013 12th International Conference on Document Analy-", "bbox": {"l": 79.920006, "t": 627.6631199999999, "r": 286.3624, "b": 635.39215, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "sis and Recognition", "bbox": {"l": 70.031006, "t": 638.62212, "r": 140.67728, "b": 646.35115, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": ", pages 1185-1189. IEEE, 2013. 2", "bbox": {"l": 140.67599, "t": 638.54141, "r": 264.43921, "b": 646.55737, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "[14]", "bbox": {"l": 50.111992, "t": 649.81342, "r": 66.534035, "b": 657.82938, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "Pratik Kayal, Mrinal Anand, Harsh Desai, and Mayank", "bbox": {"l": 68.998329, "t": 649.81342, "r": 286.35873, "b": 657.82938, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "Singh.", "bbox": {"l": 70.030991, "t": 660.77142, "r": 93.200165, "b": 668.78738, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "Icdar 2021 competition on scientific table image", "bbox": {"l": 102.20243, "t": 660.77142, "r": 286.36334, "b": 668.78738, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "recognition to latex, 2021. 2", "bbox": {"l": 70.030991, "t": 671.73042, "r": 171.9969, "b": 679.74638, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "[15]", "bbox": {"l": 50.111992, "t": 683.00243, "r": 65.515968, "b": 691.01839, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "Harold W Kuhn. The hungarian method for the assignment", "bbox": {"l": 67.827499, "t": 683.00243, "r": 286.3587, "b": 691.01839, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "problem.", "bbox": {"l": 70.030991, "t": 693.9614260000001, "r": 102.15761, "b": 701.977386, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "Naval research logistics quarterly", "bbox": {"l": 107.54999, "t": 694.0421220000001, "r": 231.47461, "b": 701.771156, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": ", 2(1-2):83-97,", "bbox": {"l": 231.47598, "t": 693.9614260000001, "r": 286.35931, "b": 701.977386, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "1955. 6", "bbox": {"l": 70.030975, "t": 704.920425, "r": 97.916481, "b": 712.936386, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "[16]", "bbox": {"l": 308.86197, "t": 75.88342000000011, "r": 324.74973, "b": 83.89940999999999, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "Girish Kulkarni, Visruth Premraj, Vicente Ordonez, Sag-", "bbox": {"l": 327.13382, "t": 75.88342000000011, "r": 545.1087, "b": 83.89940999999999, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "nik Dhar, Siming Li, Yejin Choi, Alexander C. Berg, and", "bbox": {"l": 328.78098, "t": 86.84142999999995, "r": 545.1134, "b": 94.85741999999993, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "Tamara L. Berg.", "bbox": {"l": 328.78098, "t": 97.80042000000003, "r": 390.96295, "b": 105.81641000000002, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "Babytalk:", "bbox": {"l": 400.27008, "t": 97.80042000000003, "r": 435.1404099999999, "b": 105.81641000000002, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "Understanding and generat-", "bbox": {"l": 441.71277, "t": 97.80042000000003, "r": 545.11328, "b": 105.81641000000002, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "ing simple image descriptions.", "bbox": {"l": 328.78098, "t": 108.75940000000003, "r": 440.80719, "b": 116.7753899999999, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "IEEE Transactions on Pat-", "bbox": {"l": 446.63498, "t": 108.84009000000003, "r": 545.11304, "b": 116.56914999999992, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "tern Analysis and Machine Intelligence", "bbox": {"l": 328.78098, "t": 119.79907000000003, "r": 471.13153, "b": 127.52814000000001, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": ", 35(12):2891-2903,", "bbox": {"l": 471.13300000000004, "t": 119.71838000000002, "r": 545.11475, "b": 127.73437999999999, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "2013. 4", "bbox": {"l": 328.78101, "t": 130.67737, "r": 356.6665, "b": 138.69335999999998, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "[17]", "bbox": {"l": 308.862, "t": 142.12334999999996, "r": 325.24371, "b": 150.13933999999995, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "Minghao Li, Lei Cui, Shaohan Huang, Furu Wei, Ming", "bbox": {"l": 327.70197, "t": 142.12334999999996, "r": 545.10883, "b": 150.13933999999995, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "Zhou, and Zhoujun Li.", "bbox": {"l": 328.78101, "t": 153.08136000000002, "r": 414.44598, "b": 161.09735, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "Tablebank: A benchmark dataset", "bbox": {"l": 421.82532, "t": 153.08136000000002, "r": 545.1134, "b": 161.09735, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "for table detection and recognition, 2019. 2, 3", "bbox": {"l": 328.78101, "t": 164.04034000000001, "r": 493.62835999999993, "b": 172.05633999999998, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "[18]", "bbox": {"l": 308.862, "t": 175.48632999999995, "r": 324.26599, "b": 183.50232000000005, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "Yiren Li, Zheng Huang, Junchi Yan, Yi Zhou, Fan Ye, and", "bbox": {"l": 326.57751, "t": 175.48632999999995, "r": 545.10876, "b": 183.50232000000005, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Xianhui Liu. Gfte: Graph-based financial table extraction.", "bbox": {"l": 328.78101, "t": 186.44530999999995, "r": 545.11334, "b": 194.46130000000005, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "In Alberto Del Bimbo, Rita Cucchiara, Stan Sclaroff, Gio-", "bbox": {"l": 328.78101, "t": 197.40430000000003, "r": 545.11346, "b": 205.42029000000002, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "vanni Maria Farinella, Tao Mei, Marco Bertini, Hugo Jair", "bbox": {"l": 328.78101, "t": 208.36328000000003, "r": 545.11353, "b": 216.37927000000002, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "Escalante, and Roberto Vezzani, editors,", "bbox": {"l": 328.78101, "t": 219.32227, "r": 479.26413, "b": 227.33826, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "Pattern Recogni-", "bbox": {"l": 483.11902, "t": 219.40295000000003, "r": 545.11273, "b": 227.13202, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "tion. ICPR International Workshops and Challenges", "bbox": {"l": 328.78101, "t": 230.36095999999998, "r": 519.39771, "b": 238.09002999999996, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": ", pages", "bbox": {"l": 519.401, "t": 230.28026999999997, "r": 545.10767, "b": 238.29625999999996, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "644-658, Cham, 2021. Springer International Publishing. 2,", "bbox": {"l": 328.78101, "t": 241.23925999999994, "r": 545.11328, "b": 249.25525000000005, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "3", "bbox": {"l": 328.78101, "t": 252.19824000000006, "r": 333.26422, "b": 260.21423000000004, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "[19]", "bbox": {"l": 308.862, "t": 263.64423, "r": 324.26477, "b": 271.66022, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "Nikolaos Livathinos, Cesar Berrospi, Maksym Lysak, Vik-", "bbox": {"l": 326.57611, "t": 263.64423, "r": 545.10883, "b": 271.66022, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "tor Kuropiatnyk, Ahmed Nassar, Andre Carvalho, Michele", "bbox": {"l": 328.78101, "t": 274.60321, "r": 545.1134, "b": 282.61917000000005, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "Dolfi, Christoph Auer, Kasper Dinkla, and Peter Staar. Ro-", "bbox": {"l": 328.78101, "t": 285.56219, "r": 545.11328, "b": 293.57816, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "bust pdf document conversion using recurrent neural net-", "bbox": {"l": 328.78101, "t": 296.52118, "r": 545.11334, "b": 304.53714, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "works.", "bbox": {"l": 328.78101, "t": 307.47919, "r": 352.84683, "b": 315.49515, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "Proceedings of the AAAI Conference on Artificial", "bbox": {"l": 360.23599, "t": 307.55988, "r": 545.1142, "b": 315.28894, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "Intelligence", "bbox": {"l": 328.78101, "t": 318.51886, "r": 371.02173, "b": 326.24792, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": ", 35(17):15137-15145, May 2021. 1", "bbox": {"l": 371.021, "t": 318.43817, "r": 502.26227, "b": 326.45413, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "[20]", "bbox": {"l": 308.862, "t": 329.88419, "r": 323.82672, "b": 337.90015, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "Rujiao Long, Wen Wang, Nan Xue, Feiyu Gao, Zhibo Yang,", "bbox": {"l": 326.07233, "t": 329.88419, "r": 545.10876, "b": 337.90015, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "Yongpan Wang, and Gui-Song Xia. Parsing table structures", "bbox": {"l": 328.78101, "t": 340.8432, "r": 545.11346, "b": 348.85916, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "in the wild. In", "bbox": {"l": 328.78101, "t": 351.80219000000005, "r": 382.7767, "b": 359.81815000000006, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "Proceedings of the IEEE/CVF International", "bbox": {"l": 385.54102, "t": 351.88287, "r": 545.11609, "b": 359.61194, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "Conference on Computer Vision", "bbox": {"l": 328.78101, "t": 362.84186, "r": 443.59579, "b": 370.57092, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": ", pages 944-952, 2021. 2", "bbox": {"l": 443.59399, "t": 362.76117, "r": 534.48645, "b": 370.77713, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "[21]", "bbox": {"l": 308.862, "t": 374.20618, "r": 324.60281, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "Shubham", "bbox": {"l": 326.96487, "t": 374.20618, "r": 362.6604, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "Singh", "bbox": {"l": 368.69479, "t": 374.20618, "r": 389.6134, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "Paliwal,", "bbox": {"l": 395.6478, "t": 374.20618, "r": 424.56445, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "D", "bbox": {"l": 431.5492899999999, "t": 374.20618, "r": 438.0230399999999, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "Vishwanath,", "bbox": {"l": 444.05743, "t": 374.20618, "r": 488.5038799999999, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "Rohit", "bbox": {"l": 495.47974, "t": 374.20618, "r": 515.41205, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "Rahul,", "bbox": {"l": 521.44641, "t": 374.20618, "r": 545.10876, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "Monika Sharma, and Lovekesh Vig. Tablenet: Deep learn-", "bbox": {"l": 328.78101, "t": 385.16516, "r": 545.1134, "b": 393.18112, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "ing model for end-to-end table detection and tabular data ex-", "bbox": {"l": 328.78101, "t": 396.12415, "r": 545.11346, "b": 404.14011, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "traction from scanned document images.", "bbox": {"l": 328.78101, "t": 407.08313, "r": 478.00881999999996, "b": 415.09909, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "In", "bbox": {"l": 484.0701, "t": 407.08313, "r": 491.53912, "b": 415.09909, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "2019 Interna-", "bbox": {"l": 494.668, "t": 407.16382, "r": 545.11298, "b": 414.89288, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "tional Conference on Document Analysis and Recognition", "bbox": {"l": 328.78101, "t": 418.12280000000004, "r": 545.11334, "b": 425.85187, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "(ICDAR)", "bbox": {"l": 328.78101, "t": 429.08179, "r": 360.83591, "b": 436.8108500000001, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": ", pages 128-133. IEEE, 2019. 1", "bbox": {"l": 360.836, "t": 429.0011, "r": 475.63287, "b": 437.01706, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "[22]", "bbox": {"l": 308.862, "t": 440.44611, "r": 324.57407, "b": 448.46207, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "Adam Paszke, Sam Gross, Francisco Massa, Adam Lerer,", "bbox": {"l": 326.93179, "t": 440.44611, "r": 545.1087, "b": 448.46207, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "James Bradbury, Gregory Chanan, Trevor Killeen, Zeming", "bbox": {"l": 328.78101, "t": 451.40509, "r": 545.11346, "b": 459.42105, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "Lin, Natalia Gimelshein, Luca Antiga, Alban Desmaison,", "bbox": {"l": 328.78101, "t": 462.36407, "r": 545.11328, "b": 470.38004, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "Andreas Kopf, Edward Yang, Zachary DeVito, Martin Rai-", "bbox": {"l": 328.78101, "t": 473.32306, "r": 545.11328, "b": 481.33902, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "son, Alykhan Tejani, Sasank Chilamkurthy, Benoit Steiner,", "bbox": {"l": 328.78101, "t": 484.28204, "r": 545.11328, "b": 492.298, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "Lu Fang, Junjie Bai, and Soumith Chintala. Pytorch: An im-", "bbox": {"l": 328.78101, "t": 495.24103, "r": 545.1134, "b": 503.25699, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "perative style, high-performance deep learning library. In H.", "bbox": {"l": 328.78101, "t": 506.20001, "r": 545.1134, "b": 514.21597, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "Wallach, H. Larochelle, A. Beygelzimer, F. d'Alch\u00b4e-Buc, E.", "bbox": {"l": 328.78101, "t": 517.159, "r": 545.1098, "b": 525.17496, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "Fox, and R. Garnett, editors,", "bbox": {"l": 328.78101, "t": 528.117, "r": 434.56659, "b": 536.13297, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "Advances in Neural Informa-", "bbox": {"l": 437.86401, "t": 528.19769, "r": 545.11115, "b": 535.9267600000001, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "tion Processing Systems 32", "bbox": {"l": 328.78101, "t": 539.15671, "r": 425.73471, "b": 546.8857399999999, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": ", pages 8024-8035. Curran Asso-", "bbox": {"l": 425.73602, "t": 539.076, "r": 545.11475, "b": 547.09196, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "ciates, Inc., 2019. 6", "bbox": {"l": 328.78101, "t": 550.035, "r": 399.74109, "b": 558.05096, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "[23]", "bbox": {"l": 308.862, "t": 561.481, "r": 324.50351, "b": 569.49696, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "Devashish Prasad, Ayan Gadpal, Kshitij Kapadni, Manish", "bbox": {"l": 326.85068, "t": 561.481, "r": 545.10876, "b": 569.49696, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "Visave, and Kavita Sultanpure. Cascadetabnet: An approach", "bbox": {"l": 328.78101, "t": 572.44, "r": 545.1134, "b": 580.45596, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "for end to end table detection and structure recognition from", "bbox": {"l": 328.78101, "t": 583.399, "r": 545.11334, "b": 591.4149600000001, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "image-based documents. In", "bbox": {"l": 328.78101, "t": 594.358, "r": 431.61667, "b": 602.37396, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "Proceedings of the IEEE/CVF", "bbox": {"l": 434.69101000000006, "t": 594.4387099999999, "r": 545.11224, "b": 602.16774, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "Conference on Computer Vision and Pattern Recognition", "bbox": {"l": 328.78101, "t": 605.39671, "r": 545.1134, "b": 613.12575, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "Workshops", "bbox": {"l": 328.78101, "t": 616.35571, "r": 367.8028, "b": 624.08475, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": ", pages 572-573, 2020. 1", "bbox": {"l": 367.802, "t": 616.2750100000001, "r": 458.69446000000005, "b": 624.29097, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "[24]", "bbox": {"l": 308.862, "t": 627.72101, "r": 324.69476, "b": 635.73697, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "Shah Rukh Qasim, Hassan Mahmood, and Faisal Shafait.", "bbox": {"l": 327.07065, "t": 627.72101, "r": 545.1087, "b": 635.73697, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": "Rethinking table recognition using graph neural networks.", "bbox": {"l": 328.78101, "t": 638.68001, "r": 545.11328, "b": 646.69597, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "In", "bbox": {"l": 328.78101, "t": 649.63901, "r": 336.25003, "b": 657.65497, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "2019 International Conference on Document Analysis and", "bbox": {"l": 338.10001, "t": 649.71971, "r": 545.11621, "b": 657.44875, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "Recognition (ICDAR)", "bbox": {"l": 328.78101, "t": 660.67871, "r": 406.32245, "b": 668.40775, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": ", pages 142-147. IEEE, 2019. 3", "bbox": {"l": 406.32202, "t": 660.5980099999999, "r": 521.1189, "b": 668.61398, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "[25]", "bbox": {"l": 308.86203, "t": 672.04301, "r": 324.71329, "b": 680.05898, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "Hamid Rezatofighi, Nathan Tsoi, JunYoung Gwak, Amir", "bbox": {"l": 327.09195, "t": 672.04301, "r": 545.10876, "b": 680.05898, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "Sadeghian, Ian Reid, and Silvio Savarese.", "bbox": {"l": 328.78104, "t": 683.0020099999999, "r": 482.81488, "b": 691.01797, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "Generalized in-", "bbox": {"l": 488.75064, "t": 683.0020099999999, "r": 545.1134, "b": 691.01797, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "tersection over union: A metric and a loss for bounding box", "bbox": {"l": 328.78104, "t": 693.961014, "r": 545.11334, "b": 701.976974, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "regression. In", "bbox": {"l": 328.78104, "t": 704.920013, "r": 379.1543, "b": 712.935974, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "Proceedings of the IEEE/CVF Conference on", "bbox": {"l": 381.61603, "t": 705.00071, "r": 545.10938, "b": 712.729744, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "9", "bbox": {"l": 295.12103, "t": 734.1325870000001, "r": 300.10233, "b": 743.0391500000001, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 25, "label": "list_item", "bbox": {"l": 70.030998, "t": 75.88378999999998, "r": 286.36334, "b": 116.77575999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.7310384511947632, "cells": [{"id": 0, "text": "end object detection with transformers. In Andrea Vedaldi,", "bbox": {"l": 70.030998, "t": 75.88378999999998, "r": 286.36334, "b": 83.89977999999996, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Horst Bischof, Thomas Brox, and Jan-Michael Frahm, edi-", "bbox": {"l": 70.030998, "t": 86.84276999999997, "r": 286.36331, "b": 94.85875999999996, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "tors,", "bbox": {"l": 70.030998, "t": 97.80078000000003, "r": 85.722198, "b": 105.81677000000002, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Computer Vision - ECCV 2020", "bbox": {"l": 87.889, "t": 97.88147000000004, "r": 199.93315, "b": 105.61053000000004, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": ", pages 213-229, Cham,", "bbox": {"l": 199.936, "t": 97.80078000000003, "r": 286.36313, "b": 105.81677000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "2020. Springer International Publishing. 5", "bbox": {"l": 70.031006, "t": 108.75977, "r": 221.94871999999998, "b": 116.77575999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "list_item", "bbox": {"l": 54.595005, "t": 120.03174000000013, "r": 286.36334, "b": 149.96569999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9372755885124207, "cells": [{"id": 6, "text": "[2]", "bbox": {"l": 54.595005, "t": 120.03174000000013, "r": 65.206657, "b": 128.04773, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Zewen Chi, Heyan Huang, Heng-Da Xu, Houjin Yu, Wanx-", "bbox": {"l": 67.481873, "t": 120.03174000000013, "r": 286.35852, "b": 128.04773, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "uan Yin, and Xian-Ling Mao.", "bbox": {"l": 70.031006, "t": 130.99072, "r": 179.67215, "b": 139.00671, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Complicated table structure", "bbox": {"l": 185.58101, "t": 130.99072, "r": 286.36334, "b": 139.00671, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "recognition.", "bbox": {"l": 70.031006, "t": 141.94970999999998, "r": 113.11456, "b": 149.96569999999997, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "arXiv preprint arXiv:1908.04729", "bbox": {"l": 116.34200999999999, "t": 142.0304, "r": 235.3082, "b": 149.75946, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": ", 2019. 3", "bbox": {"l": 235.30701, "t": 141.94970999999998, "r": 267.67572, "b": 149.96569999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "list_item", "bbox": {"l": 54.595001, "t": 153.22168, "r": 286.36301, "b": 183.15466000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9378374218940735, "cells": [{"id": 13, "text": "[3]", "bbox": {"l": 54.595001, "t": 153.22168, "r": 65.103195, "b": 161.23766999999998, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Bertrand Couasnon and Aurelie Lemaitre.", "bbox": {"l": 67.356239, "t": 153.22168, "r": 218.77876, "b": 161.23766999999998, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Recognition of Ta-", "bbox": {"l": 220.97999999999996, "t": 153.30237, "r": 286.36301, "b": 161.03143, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "bles and Forms", "bbox": {"l": 70.030991, "t": 164.26135, "r": 125.26401000000001, "b": 171.99041999999997, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": ", pages 647-677. Springer London, London,", "bbox": {"l": 125.26098999999999, "t": 164.18066, "r": 286.36029, "b": 172.19665999999995, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "2014. 2", "bbox": {"l": 70.030991, "t": 175.13867000000005, "r": 97.916496, "b": 183.15466000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "list_item", "bbox": {"l": 54.59499, "t": 186.41063999999994, "r": 286.36401, "b": 227.30358999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9648825526237488, "cells": [{"id": 19, "text": "[4]", "bbox": {"l": 54.59499, "t": 186.41063999999994, "r": 65.806984, "b": 194.42664000000002, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Herv\u00b4e D\u00b4ejean, Jean-Luc Meunier, Liangcai Gao, Yilun", "bbox": {"l": 68.210922, "t": 186.41063999999994, "r": 286.36401, "b": 194.42664000000002, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Huang, Yu Fang, Florian Kleber, and Eva-Maria Lang. IC-", "bbox": {"l": 70.030983, "t": 197.36963000000003, "r": 286.36331, "b": 205.38562000000002, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "DAR 2019 Competition on Table Detection and Recognition", "bbox": {"l": 70.030983, "t": 208.32861000000003, "r": 286.36334, "b": 216.3446, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "(cTDaR), Apr. 2019. http://sac.founderit.com/. 2", "bbox": {"l": 70.030983, "t": 219.2876, "r": 245.83519, "b": 227.30358999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "list_item", "bbox": {"l": 54.594982, "t": 230.55957, "r": 286.36334, "b": 271.45154, "coord_origin": "TOPLEFT"}, "confidence": 0.9620943069458008, "cells": [{"id": 24, "text": "[5]", "bbox": {"l": 54.594982, "t": 230.55957, "r": 65.381134, "b": 238.57556, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "Basilios Gatos, Dimitrios Danatsas, Ioannis Pratikakis, and", "bbox": {"l": 67.693779, "t": 230.55957, "r": 286.35849, "b": 238.57556, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "Stavros J Perantonis. Automatic table detection in document", "bbox": {"l": 70.030983, "t": 241.51855, "r": 286.36334, "b": 249.53454999999997, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "images. In", "bbox": {"l": 70.030983, "t": 252.47655999999995, "r": 108.39821, "b": 260.49255000000005, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "International Conference on Pattern Recognition", "bbox": {"l": 110.64498000000002, "t": 252.55724999999995, "r": 286.3595, "b": 260.28632000000005, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "and Image Analysis", "bbox": {"l": 70.030983, "t": 263.51624000000004, "r": 140.57861, "b": 271.24530000000004, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": ", pages 609-618. Springer, 2005. 2", "bbox": {"l": 140.57797, "t": 263.43555000000003, "r": 266.47522, "b": 271.45154, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "list_item", "bbox": {"l": 54.594971, "t": 274.70758, "r": 286.36676, "b": 315.6004899999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9555517435073853, "cells": [{"id": 31, "text": "[6]", "bbox": {"l": 54.594971, "t": 274.70758, "r": 64.848648, "b": 282.72351, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Max G\u00a8obel, Tamir Hassan, Ermelinda Oro, and Giorgio Orsi.", "bbox": {"l": 67.047119, "t": 274.70758, "r": 286.36676, "b": 282.72351, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "Icdar 2013 table competition.", "bbox": {"l": 70.030975, "t": 285.66655999999995, "r": 179.57349, "b": 293.68253, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "In", "bbox": {"l": 187.01559, "t": 285.66655999999995, "r": 194.4846, "b": 293.68253, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "2013 12th International", "bbox": {"l": 198.04398, "t": 285.74725, "r": 286.36304, "b": 293.47632, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Conference on Document Analysis and Recognition", "bbox": {"l": 70.030975, "t": 296.70624, "r": 260.19937, "b": 304.43530000000004, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": ", pages", "bbox": {"l": 260.198, "t": 296.62555, "r": 286.36197, "b": 304.64151, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "1449-1453, 2013. 2", "bbox": {"l": 70.030991, "t": 307.5845299999999, "r": 142.74849, "b": 315.6004899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "list_item", "bbox": {"l": 54.59499, "t": 318.85654, "r": 286.36319, "b": 348.78952, "coord_origin": "TOPLEFT"}, "confidence": 0.9479843378067017, "cells": [{"id": 39, "text": "[7]", "bbox": {"l": 54.59499, "t": 318.85654, "r": 65.61586, "b": 326.8725, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "EA Green and M Krishnamoorthy.", "bbox": {"l": 67.978821, "t": 318.85654, "r": 199.492, "b": 326.8725, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Recognition of tables", "bbox": {"l": 206.98792, "t": 318.85654, "r": 286.35849, "b": 326.8725, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "using table grammars. procs.", "bbox": {"l": 70.030991, "t": 329.8145400000001, "r": 176.28284, "b": 337.83051, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "In", "bbox": {"l": 182.60416, "t": 329.8145400000001, "r": 190.07317, "b": 337.83051, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "Symposium on Document", "bbox": {"l": 193.28299, "t": 329.89522999999997, "r": 286.36319, "b": 337.62429999999995, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Analysis and Recognition (SDAIR\u201995)", "bbox": {"l": 70.030991, "t": 340.85425, "r": 206.34717, "b": 348.58331, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": ", pages 261-277. 2", "bbox": {"l": 206.34599, "t": 340.77356, "r": 274.82239, "b": 348.78952, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "list_item", "bbox": {"l": 54.594986000000006, "t": 352.0455600000001, "r": 286.36331, "b": 403.89749, "coord_origin": "TOPLEFT"}, "confidence": 0.9484425187110901, "cells": [{"id": 47, "text": "[8]", "bbox": {"l": 54.594986000000006, "t": 352.0455600000001, "r": 65.04657, "b": 360.06152, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Khurram Azeem Hashmi, Alain Pagani, Marcus Liwicki, Di-", "bbox": {"l": 67.287483, "t": 352.0455600000001, "r": 286.35849, "b": 360.06152, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "dier Stricker, and Muhammad Zeshan Afzal.", "bbox": {"l": 70.030983, "t": 363.00458, "r": 234.12507999999997, "b": 371.02054, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Castabdetec-", "bbox": {"l": 240.05186, "t": 363.00458, "r": 286.36331, "b": 371.02054, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "tors: Cascade network for table detection in document im-", "bbox": {"l": 70.030983, "t": 373.96356, "r": 286.36331, "b": 381.97952, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "ages with recursive feature pyramid and switchable atrous", "bbox": {"l": 70.030983, "t": 384.92255, "r": 286.36331, "b": 392.93851, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "convolution.", "bbox": {"l": 70.030983, "t": 395.88153, "r": 114.57605, "b": 403.89749, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "Journal of Imaging", "bbox": {"l": 117.80399000000001, "t": 395.96222, "r": 186.7287, "b": 403.69128, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": ", 7(10), 2021. 1", "bbox": {"l": 186.728, "t": 395.88153, "r": 243.00113999999996, "b": 403.89749, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "list_item", "bbox": {"l": 54.595001, "t": 407.15253000000007, "r": 286.35989, "b": 437.08646000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9330756664276123, "cells": [{"id": 56, "text": "[9]", "bbox": {"l": 54.595001, "t": 407.15253000000007, "r": 65.334427, "b": 415.1684900000001, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Kaiming He, Georgia Gkioxari, Piotr Dollar, and Ross Gir-", "bbox": {"l": 67.637054, "t": 407.15253000000007, "r": 286.35852, "b": 415.1684900000001, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "shick. Mask r-cnn. In", "bbox": {"l": 70.030998, "t": 418.11151, "r": 147.13306, "b": 426.12747, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Proceedings of the IEEE International", "bbox": {"l": 149.15601, "t": 418.1922, "r": 286.35989, "b": 425.92126, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Conference on Computer Vision (ICCV)", "bbox": {"l": 70.031006, "t": 429.15118, "r": 213.48445, "b": 436.88025, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": ", Oct 2017. 1", "bbox": {"l": 213.483, "t": 429.07050000000004, "r": 261.04083, "b": 437.08646000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "list_item", "bbox": {"l": 50.112, "t": 440.3424999999999, "r": 286.36334, "b": 481.23544, "coord_origin": "TOPLEFT"}, "confidence": 0.9274735450744629, "cells": [{"id": 62, "text": "[10]", "bbox": {"l": 50.112, "t": 440.3424999999999, "r": 65.399307, "b": 448.3584599999999, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "Yelin He, X. Qi, Jiaquan Ye, Peng Gao, Yihao Chen, Bing-", "bbox": {"l": 67.693321, "t": 440.3424999999999, "r": 286.3587, "b": 448.3584599999999, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "cong Li, Xin Tang, and Rong Xiao.", "bbox": {"l": 70.030998, "t": 451.30151, "r": 202.74268, "b": 459.31747, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "Pingan-vcgroup\u2019s so-", "bbox": {"l": 209.00122, "t": 451.30151, "r": 286.36331, "b": 459.31747, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "lution for icdar 2021 competition on scientific table image", "bbox": {"l": 70.030998, "t": 462.2605, "r": 286.36334, "b": 470.27646, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "recognition to latex.", "bbox": {"l": 70.030998, "t": 473.21948, "r": 141.86981, "b": 481.23544, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "ArXiv", "bbox": {"l": 145.097, "t": 473.30017, "r": 166.01561, "b": 481.02924, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": ", abs/2105.01846, 2021. 2", "bbox": {"l": 166.015, "t": 473.21948, "r": 259.90216, "b": 481.23544, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "list_item", "bbox": {"l": 50.112, "t": 484.49048, "r": 286.36331, "b": 536.34238, "coord_origin": "TOPLEFT"}, "confidence": 0.9299950003623962, "cells": [{"id": 70, "text": "[11]", "bbox": {"l": 50.112, "t": 484.49048, "r": 66.033806, "b": 492.50644, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Jianying Hu, Ramanujan S Kashi, Daniel P Lopresti, and", "bbox": {"l": 68.423035, "t": 484.49048, "r": 286.35873, "b": 492.50644, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "Gordon Wilfong. Medium-independent table detection. In", "bbox": {"l": 70.030998, "t": 495.44946, "r": 286.36331, "b": 503.46542, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "Document Recognition and Retrieval VII", "bbox": {"l": 70.030998, "t": 506.48914, "r": 227.40926, "b": 514.2182, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": ", volume 3967,", "bbox": {"l": 227.40500000000003, "t": 506.40845, "r": 286.35913, "b": 514.4244100000001, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "pages 291-302. International Society for Optics and Photon-", "bbox": {"l": 70.031006, "t": 517.36743, "r": 286.36328, "b": 525.38339, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "ics, 1999. 2", "bbox": {"l": 70.031006, "t": 528.32642, "r": 112.36138000000001, "b": 536.34238, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "list_item", "bbox": {"l": 50.112007, "t": 539.59842, "r": 286.36334, "b": 591.44937, "coord_origin": "TOPLEFT"}, "confidence": 0.9394103288650513, "cells": [{"id": 77, "text": "[12]", "bbox": {"l": 50.112007, "t": 539.59842, "r": 65.466705, "b": 547.61438, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "Matthew Hurst. A constraint-based approach to table struc-", "bbox": {"l": 67.770828, "t": 539.59842, "r": 286.35873, "b": 547.61438, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "ture derivation. In", "bbox": {"l": 70.031006, "t": 550.55742, "r": 136.28374, "b": 558.57338, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "Proceedings of the Seventh International", "bbox": {"l": 138.811, "t": 550.63812, "r": 286.36206, "b": 558.36716, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Conference on Document Analysis and Recognition - Volume", "bbox": {"l": 70.031006, "t": 561.5971199999999, "r": 286.36334, "b": 569.32616, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "2", "bbox": {"l": 70.031006, "t": 572.55612, "r": 74.514206, "b": 580.28516, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": ", ICDAR \u201903, page 911, USA, 2003. IEEE Computer Soci-", "bbox": {"l": 74.514008, "t": 572.47542, "r": 286.36313, "b": 580.4913799999999, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "ety. 2", "bbox": {"l": 70.031006, "t": 583.4334100000001, "r": 90.357834, "b": 591.44937, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "list_item", "bbox": {"l": 50.112007, "t": 594.70541, "r": 286.36331, "b": 646.55737, "coord_origin": "TOPLEFT"}, "confidence": 0.9298838973045349, "cells": [{"id": 85, "text": "[13]", "bbox": {"l": 50.112007, "t": 594.70541, "r": 66.270439, "b": 602.72137, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Thotreingam Kasar, Philippine Barlas, Sebastien Adam,", "bbox": {"l": 68.695168, "t": 594.70541, "r": 286.35873, "b": 602.72137, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Cl\u00b4ement Chatelain, and Thierry Paquet. Learning to detect", "bbox": {"l": 70.031006, "t": 605.66441, "r": 286.3631, "b": 613.68037, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "tables in scanned document images using line information.", "bbox": {"l": 70.031006, "t": 616.62341, "r": 286.36331, "b": 624.63937, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "In", "bbox": {"l": 70.031006, "t": 627.58241, "r": 77.500015, "b": 635.5983699999999, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "2013 12th International Conference on Document Analy-", "bbox": {"l": 79.920006, "t": 627.6631199999999, "r": 286.3624, "b": 635.39215, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "sis and Recognition", "bbox": {"l": 70.031006, "t": 638.62212, "r": 140.67728, "b": 646.35115, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": ", pages 1185-1189. IEEE, 2013. 2", "bbox": {"l": 140.67599, "t": 638.54141, "r": 264.43921, "b": 646.55737, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "list_item", "bbox": {"l": 50.111992, "t": 649.81342, "r": 286.36334, "b": 679.74638, "coord_origin": "TOPLEFT"}, "confidence": 0.9115257263183594, "cells": [{"id": 93, "text": "[14]", "bbox": {"l": 50.111992, "t": 649.81342, "r": 66.534035, "b": 657.82938, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "Pratik Kayal, Mrinal Anand, Harsh Desai, and Mayank", "bbox": {"l": 68.998329, "t": 649.81342, "r": 286.35873, "b": 657.82938, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "Singh.", "bbox": {"l": 70.030991, "t": 660.77142, "r": 93.200165, "b": 668.78738, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "Icdar 2021 competition on scientific table image", "bbox": {"l": 102.20243, "t": 660.77142, "r": 286.36334, "b": 668.78738, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "recognition to latex, 2021. 2", "bbox": {"l": 70.030991, "t": 671.73042, "r": 171.9969, "b": 679.74638, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "list_item", "bbox": {"l": 50.111992, "t": 683.00243, "r": 286.35931, "b": 712.936386, "coord_origin": "TOPLEFT"}, "confidence": 0.912230372428894, "cells": [{"id": 98, "text": "[15]", "bbox": {"l": 50.111992, "t": 683.00243, "r": 65.515968, "b": 691.01839, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "Harold W Kuhn. The hungarian method for the assignment", "bbox": {"l": 67.827499, "t": 683.00243, "r": 286.3587, "b": 691.01839, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "problem.", "bbox": {"l": 70.030991, "t": 693.9614260000001, "r": 102.15761, "b": 701.977386, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "Naval research logistics quarterly", "bbox": {"l": 107.54999, "t": 694.0421220000001, "r": 231.47461, "b": 701.771156, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": ", 2(1-2):83-97,", "bbox": {"l": 231.47598, "t": 693.9614260000001, "r": 286.35931, "b": 701.977386, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "1955. 6", "bbox": {"l": 70.030975, "t": 704.920425, "r": 97.916481, "b": 712.936386, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "list_item", "bbox": {"l": 308.86197, "t": 75.88342000000011, "r": 545.11475, "b": 138.69335999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.9389600157737732, "cells": [{"id": 104, "text": "[16]", "bbox": {"l": 308.86197, "t": 75.88342000000011, "r": 324.74973, "b": 83.89940999999999, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "Girish Kulkarni, Visruth Premraj, Vicente Ordonez, Sag-", "bbox": {"l": 327.13382, "t": 75.88342000000011, "r": 545.1087, "b": 83.89940999999999, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "nik Dhar, Siming Li, Yejin Choi, Alexander C. Berg, and", "bbox": {"l": 328.78098, "t": 86.84142999999995, "r": 545.1134, "b": 94.85741999999993, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "Tamara L. Berg.", "bbox": {"l": 328.78098, "t": 97.80042000000003, "r": 390.96295, "b": 105.81641000000002, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "Babytalk:", "bbox": {"l": 400.27008, "t": 97.80042000000003, "r": 435.1404099999999, "b": 105.81641000000002, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "Understanding and generat-", "bbox": {"l": 441.71277, "t": 97.80042000000003, "r": 545.11328, "b": 105.81641000000002, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "ing simple image descriptions.", "bbox": {"l": 328.78098, "t": 108.75940000000003, "r": 440.80719, "b": 116.7753899999999, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "IEEE Transactions on Pat-", "bbox": {"l": 446.63498, "t": 108.84009000000003, "r": 545.11304, "b": 116.56914999999992, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "tern Analysis and Machine Intelligence", "bbox": {"l": 328.78098, "t": 119.79907000000003, "r": 471.13153, "b": 127.52814000000001, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": ", 35(12):2891-2903,", "bbox": {"l": 471.13300000000004, "t": 119.71838000000002, "r": 545.11475, "b": 127.73437999999999, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "2013. 4", "bbox": {"l": 328.78101, "t": 130.67737, "r": 356.6665, "b": 138.69335999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "list_item", "bbox": {"l": 308.862, "t": 142.12334999999996, "r": 545.1134, "b": 172.05633999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.9253129959106445, "cells": [{"id": 115, "text": "[17]", "bbox": {"l": 308.862, "t": 142.12334999999996, "r": 325.24371, "b": 150.13933999999995, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "Minghao Li, Lei Cui, Shaohan Huang, Furu Wei, Ming", "bbox": {"l": 327.70197, "t": 142.12334999999996, "r": 545.10883, "b": 150.13933999999995, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "Zhou, and Zhoujun Li.", "bbox": {"l": 328.78101, "t": 153.08136000000002, "r": 414.44598, "b": 161.09735, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "Tablebank: A benchmark dataset", "bbox": {"l": 421.82532, "t": 153.08136000000002, "r": 545.1134, "b": 161.09735, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "for table detection and recognition, 2019. 2, 3", "bbox": {"l": 328.78101, "t": 164.04034000000001, "r": 493.62835999999993, "b": 172.05633999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "list_item", "bbox": {"l": 308.862, "t": 175.48632999999995, "r": 545.11353, "b": 260.21423000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9299732446670532, "cells": [{"id": 120, "text": "[18]", "bbox": {"l": 308.862, "t": 175.48632999999995, "r": 324.26599, "b": 183.50232000000005, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "Yiren Li, Zheng Huang, Junchi Yan, Yi Zhou, Fan Ye, and", "bbox": {"l": 326.57751, "t": 175.48632999999995, "r": 545.10876, "b": 183.50232000000005, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Xianhui Liu. Gfte: Graph-based financial table extraction.", "bbox": {"l": 328.78101, "t": 186.44530999999995, "r": 545.11334, "b": 194.46130000000005, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "In Alberto Del Bimbo, Rita Cucchiara, Stan Sclaroff, Gio-", "bbox": {"l": 328.78101, "t": 197.40430000000003, "r": 545.11346, "b": 205.42029000000002, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "vanni Maria Farinella, Tao Mei, Marco Bertini, Hugo Jair", "bbox": {"l": 328.78101, "t": 208.36328000000003, "r": 545.11353, "b": 216.37927000000002, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "Escalante, and Roberto Vezzani, editors,", "bbox": {"l": 328.78101, "t": 219.32227, "r": 479.26413, "b": 227.33826, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "Pattern Recogni-", "bbox": {"l": 483.11902, "t": 219.40295000000003, "r": 545.11273, "b": 227.13202, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "tion. ICPR International Workshops and Challenges", "bbox": {"l": 328.78101, "t": 230.36095999999998, "r": 519.39771, "b": 238.09002999999996, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": ", pages", "bbox": {"l": 519.401, "t": 230.28026999999997, "r": 545.10767, "b": 238.29625999999996, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "644-658, Cham, 2021. Springer International Publishing. 2,", "bbox": {"l": 328.78101, "t": 241.23925999999994, "r": 545.11328, "b": 249.25525000000005, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "3", "bbox": {"l": 328.78101, "t": 252.19824000000006, "r": 333.26422, "b": 260.21423000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "list_item", "bbox": {"l": 308.862, "t": 263.64423, "r": 545.1142, "b": 326.45413, "coord_origin": "TOPLEFT"}, "confidence": 0.937321662902832, "cells": [{"id": 131, "text": "[19]", "bbox": {"l": 308.862, "t": 263.64423, "r": 324.26477, "b": 271.66022, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "Nikolaos Livathinos, Cesar Berrospi, Maksym Lysak, Vik-", "bbox": {"l": 326.57611, "t": 263.64423, "r": 545.10883, "b": 271.66022, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "tor Kuropiatnyk, Ahmed Nassar, Andre Carvalho, Michele", "bbox": {"l": 328.78101, "t": 274.60321, "r": 545.1134, "b": 282.61917000000005, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "Dolfi, Christoph Auer, Kasper Dinkla, and Peter Staar. Ro-", "bbox": {"l": 328.78101, "t": 285.56219, "r": 545.11328, "b": 293.57816, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "bust pdf document conversion using recurrent neural net-", "bbox": {"l": 328.78101, "t": 296.52118, "r": 545.11334, "b": 304.53714, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "works.", "bbox": {"l": 328.78101, "t": 307.47919, "r": 352.84683, "b": 315.49515, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "Proceedings of the AAAI Conference on Artificial", "bbox": {"l": 360.23599, "t": 307.55988, "r": 545.1142, "b": 315.28894, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "Intelligence", "bbox": {"l": 328.78101, "t": 318.51886, "r": 371.02173, "b": 326.24792, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": ", 35(17):15137-15145, May 2021. 1", "bbox": {"l": 371.021, "t": 318.43817, "r": 502.26227, "b": 326.45413, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "list_item", "bbox": {"l": 308.862, "t": 329.88419, "r": 545.11609, "b": 370.77713, "coord_origin": "TOPLEFT"}, "confidence": 0.9027292728424072, "cells": [{"id": 140, "text": "[20]", "bbox": {"l": 308.862, "t": 329.88419, "r": 323.82672, "b": 337.90015, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "Rujiao Long, Wen Wang, Nan Xue, Feiyu Gao, Zhibo Yang,", "bbox": {"l": 326.07233, "t": 329.88419, "r": 545.10876, "b": 337.90015, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "Yongpan Wang, and Gui-Song Xia. Parsing table structures", "bbox": {"l": 328.78101, "t": 340.8432, "r": 545.11346, "b": 348.85916, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "in the wild. In", "bbox": {"l": 328.78101, "t": 351.80219000000005, "r": 382.7767, "b": 359.81815000000006, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "Proceedings of the IEEE/CVF International", "bbox": {"l": 385.54102, "t": 351.88287, "r": 545.11609, "b": 359.61194, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "Conference on Computer Vision", "bbox": {"l": 328.78101, "t": 362.84186, "r": 443.59579, "b": 370.57092, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": ", pages 944-952, 2021. 2", "bbox": {"l": 443.59399, "t": 362.76117, "r": 534.48645, "b": 370.77713, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "list_item", "bbox": {"l": 308.862, "t": 374.20618, "r": 545.11346, "b": 437.01706, "coord_origin": "TOPLEFT"}, "confidence": 0.882714569568634, "cells": [{"id": 147, "text": "[21]", "bbox": {"l": 308.862, "t": 374.20618, "r": 324.60281, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "Shubham", "bbox": {"l": 326.96487, "t": 374.20618, "r": 362.6604, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "Singh", "bbox": {"l": 368.69479, "t": 374.20618, "r": 389.6134, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "Paliwal,", "bbox": {"l": 395.6478, "t": 374.20618, "r": 424.56445, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "D", "bbox": {"l": 431.5492899999999, "t": 374.20618, "r": 438.0230399999999, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "Vishwanath,", "bbox": {"l": 444.05743, "t": 374.20618, "r": 488.5038799999999, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "Rohit", "bbox": {"l": 495.47974, "t": 374.20618, "r": 515.41205, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "Rahul,", "bbox": {"l": 521.44641, "t": 374.20618, "r": 545.10876, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "Monika Sharma, and Lovekesh Vig. Tablenet: Deep learn-", "bbox": {"l": 328.78101, "t": 385.16516, "r": 545.1134, "b": 393.18112, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "ing model for end-to-end table detection and tabular data ex-", "bbox": {"l": 328.78101, "t": 396.12415, "r": 545.11346, "b": 404.14011, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "traction from scanned document images.", "bbox": {"l": 328.78101, "t": 407.08313, "r": 478.00881999999996, "b": 415.09909, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "In", "bbox": {"l": 484.0701, "t": 407.08313, "r": 491.53912, "b": 415.09909, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "2019 Interna-", "bbox": {"l": 494.668, "t": 407.16382, "r": 545.11298, "b": 414.89288, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "tional Conference on Document Analysis and Recognition", "bbox": {"l": 328.78101, "t": 418.12280000000004, "r": 545.11334, "b": 425.85187, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "(ICDAR)", "bbox": {"l": 328.78101, "t": 429.08179, "r": 360.83591, "b": 436.8108500000001, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": ", pages 128-133. IEEE, 2019. 1", "bbox": {"l": 360.836, "t": 429.0011, "r": 475.63287, "b": 437.01706, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "list_item", "bbox": {"l": 308.862, "t": 440.44611, "r": 545.11475, "b": 558.05096, "coord_origin": "TOPLEFT"}, "confidence": 0.8896440863609314, "cells": [{"id": 163, "text": "[22]", "bbox": {"l": 308.862, "t": 440.44611, "r": 324.57407, "b": 448.46207, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "Adam Paszke, Sam Gross, Francisco Massa, Adam Lerer,", "bbox": {"l": 326.93179, "t": 440.44611, "r": 545.1087, "b": 448.46207, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "James Bradbury, Gregory Chanan, Trevor Killeen, Zeming", "bbox": {"l": 328.78101, "t": 451.40509, "r": 545.11346, "b": 459.42105, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "Lin, Natalia Gimelshein, Luca Antiga, Alban Desmaison,", "bbox": {"l": 328.78101, "t": 462.36407, "r": 545.11328, "b": 470.38004, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "Andreas Kopf, Edward Yang, Zachary DeVito, Martin Rai-", "bbox": {"l": 328.78101, "t": 473.32306, "r": 545.11328, "b": 481.33902, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "son, Alykhan Tejani, Sasank Chilamkurthy, Benoit Steiner,", "bbox": {"l": 328.78101, "t": 484.28204, "r": 545.11328, "b": 492.298, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "Lu Fang, Junjie Bai, and Soumith Chintala. Pytorch: An im-", "bbox": {"l": 328.78101, "t": 495.24103, "r": 545.1134, "b": 503.25699, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "perative style, high-performance deep learning library. In H.", "bbox": {"l": 328.78101, "t": 506.20001, "r": 545.1134, "b": 514.21597, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "Wallach, H. Larochelle, A. Beygelzimer, F. d'Alch\u00b4e-Buc, E.", "bbox": {"l": 328.78101, "t": 517.159, "r": 545.1098, "b": 525.17496, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "Fox, and R. Garnett, editors,", "bbox": {"l": 328.78101, "t": 528.117, "r": 434.56659, "b": 536.13297, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "Advances in Neural Informa-", "bbox": {"l": 437.86401, "t": 528.19769, "r": 545.11115, "b": 535.9267600000001, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "tion Processing Systems 32", "bbox": {"l": 328.78101, "t": 539.15671, "r": 425.73471, "b": 546.8857399999999, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": ", pages 8024-8035. Curran Asso-", "bbox": {"l": 425.73602, "t": 539.076, "r": 545.11475, "b": 547.09196, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "ciates, Inc., 2019. 6", "bbox": {"l": 328.78101, "t": 550.035, "r": 399.74109, "b": 558.05096, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "list_item", "bbox": {"l": 308.862, "t": 561.481, "r": 545.1134, "b": 624.29097, "coord_origin": "TOPLEFT"}, "confidence": 0.9025435447692871, "cells": [{"id": 177, "text": "[23]", "bbox": {"l": 308.862, "t": 561.481, "r": 324.50351, "b": 569.49696, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "Devashish Prasad, Ayan Gadpal, Kshitij Kapadni, Manish", "bbox": {"l": 326.85068, "t": 561.481, "r": 545.10876, "b": 569.49696, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "Visave, and Kavita Sultanpure. Cascadetabnet: An approach", "bbox": {"l": 328.78101, "t": 572.44, "r": 545.1134, "b": 580.45596, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "for end to end table detection and structure recognition from", "bbox": {"l": 328.78101, "t": 583.399, "r": 545.11334, "b": 591.4149600000001, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "image-based documents. In", "bbox": {"l": 328.78101, "t": 594.358, "r": 431.61667, "b": 602.37396, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "Proceedings of the IEEE/CVF", "bbox": {"l": 434.69101000000006, "t": 594.4387099999999, "r": 545.11224, "b": 602.16774, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "Conference on Computer Vision and Pattern Recognition", "bbox": {"l": 328.78101, "t": 605.39671, "r": 545.1134, "b": 613.12575, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "Workshops", "bbox": {"l": 328.78101, "t": 616.35571, "r": 367.8028, "b": 624.08475, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": ", pages 572-573, 2020. 1", "bbox": {"l": 367.802, "t": 616.2750100000001, "r": 458.69446000000005, "b": 624.29097, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "list_item", "bbox": {"l": 308.862, "t": 627.72101, "r": 545.11621, "b": 668.61398, "coord_origin": "TOPLEFT"}, "confidence": 0.8777532577514648, "cells": [{"id": 186, "text": "[24]", "bbox": {"l": 308.862, "t": 627.72101, "r": 324.69476, "b": 635.73697, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "Shah Rukh Qasim, Hassan Mahmood, and Faisal Shafait.", "bbox": {"l": 327.07065, "t": 627.72101, "r": 545.1087, "b": 635.73697, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": "Rethinking table recognition using graph neural networks.", "bbox": {"l": 328.78101, "t": 638.68001, "r": 545.11328, "b": 646.69597, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "In", "bbox": {"l": 328.78101, "t": 649.63901, "r": 336.25003, "b": 657.65497, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "2019 International Conference on Document Analysis and", "bbox": {"l": 338.10001, "t": 649.71971, "r": 545.11621, "b": 657.44875, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "Recognition (ICDAR)", "bbox": {"l": 328.78101, "t": 660.67871, "r": 406.32245, "b": 668.40775, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": ", pages 142-147. IEEE, 2019. 3", "bbox": {"l": 406.32202, "t": 660.5980099999999, "r": 521.1189, "b": 668.61398, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "list_item", "bbox": {"l": 308.86203, "t": 672.04301, "r": 545.1134, "b": 712.935974, "coord_origin": "TOPLEFT"}, "confidence": 0.8654531240463257, "cells": [{"id": 193, "text": "[25]", "bbox": {"l": 308.86203, "t": 672.04301, "r": 324.71329, "b": 680.05898, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "Hamid Rezatofighi, Nathan Tsoi, JunYoung Gwak, Amir", "bbox": {"l": 327.09195, "t": 672.04301, "r": 545.10876, "b": 680.05898, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "Sadeghian, Ian Reid, and Silvio Savarese.", "bbox": {"l": 328.78104, "t": 683.0020099999999, "r": 482.81488, "b": 691.01797, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "Generalized in-", "bbox": {"l": 488.75064, "t": 683.0020099999999, "r": 545.1134, "b": 691.01797, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "tersection over union: A metric and a loss for bounding box", "bbox": {"l": 328.78104, "t": 693.961014, "r": 545.11334, "b": 701.976974, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "regression. In", "bbox": {"l": 328.78104, "t": 704.920013, "r": 379.1543, "b": 712.935974, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "Proceedings of the IEEE/CVF Conference on", "bbox": {"l": 381.61603, "t": 705.00071, "r": 545.10938, "b": 712.729744, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "page_footer", "bbox": {"l": 295.12103, "t": 734.1325870000001, "r": 300.10233, "b": 743.0391500000001, "coord_origin": "TOPLEFT"}, "confidence": 0.8797808885574341, "cells": [{"id": 200, "text": "9", "bbox": {"l": 295.12103, "t": 734.1325870000001, "r": 300.10233, "b": 743.0391500000001, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "list_item", "id": 25, "page_no": 8, "cluster": {"id": 25, "label": "list_item", "bbox": {"l": 70.030998, "t": 75.88378999999998, "r": 286.36334, "b": 116.77575999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.7310384511947632, "cells": [{"id": 0, "text": "end object detection with transformers. In Andrea Vedaldi,", "bbox": {"l": 70.030998, "t": 75.88378999999998, "r": 286.36334, "b": 83.89977999999996, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Horst Bischof, Thomas Brox, and Jan-Michael Frahm, edi-", "bbox": {"l": 70.030998, "t": 86.84276999999997, "r": 286.36331, "b": 94.85875999999996, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "tors,", "bbox": {"l": 70.030998, "t": 97.80078000000003, "r": 85.722198, "b": 105.81677000000002, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Computer Vision - ECCV 2020", "bbox": {"l": 87.889, "t": 97.88147000000004, "r": 199.93315, "b": 105.61053000000004, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": ", pages 213-229, Cham,", "bbox": {"l": 199.936, "t": 97.80078000000003, "r": 286.36313, "b": 105.81677000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "2020. Springer International Publishing. 5", "bbox": {"l": 70.031006, "t": 108.75977, "r": 221.94871999999998, "b": 116.77575999999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "end object detection with transformers. In Andrea Vedaldi, Horst Bischof, Thomas Brox, and Jan-Michael Frahm, editors, Computer Vision - ECCV 2020 , pages 213-229, Cham, 2020. Springer International Publishing. 5"}, {"label": "list_item", "id": 9, "page_no": 8, "cluster": {"id": 9, "label": "list_item", "bbox": {"l": 54.595005, "t": 120.03174000000013, "r": 286.36334, "b": 149.96569999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9372755885124207, "cells": [{"id": 6, "text": "[2]", "bbox": {"l": 54.595005, "t": 120.03174000000013, "r": 65.206657, "b": 128.04773, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Zewen Chi, Heyan Huang, Heng-Da Xu, Houjin Yu, Wanx-", "bbox": {"l": 67.481873, "t": 120.03174000000013, "r": 286.35852, "b": 128.04773, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "uan Yin, and Xian-Ling Mao.", "bbox": {"l": 70.031006, "t": 130.99072, "r": 179.67215, "b": 139.00671, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Complicated table structure", "bbox": {"l": 185.58101, "t": 130.99072, "r": 286.36334, "b": 139.00671, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "recognition.", "bbox": {"l": 70.031006, "t": 141.94970999999998, "r": 113.11456, "b": 149.96569999999997, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "arXiv preprint arXiv:1908.04729", "bbox": {"l": 116.34200999999999, "t": 142.0304, "r": 235.3082, "b": 149.75946, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": ", 2019. 3", "bbox": {"l": 235.30701, "t": 141.94970999999998, "r": 267.67572, "b": 149.96569999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[2] Zewen Chi, Heyan Huang, Heng-Da Xu, Houjin Yu, Wanxuan Yin, and Xian-Ling Mao. Complicated table structure recognition. arXiv preprint arXiv:1908.04729 , 2019. 3"}, {"label": "list_item", "id": 7, "page_no": 8, "cluster": {"id": 7, "label": "list_item", "bbox": {"l": 54.595001, "t": 153.22168, "r": 286.36301, "b": 183.15466000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9378374218940735, "cells": [{"id": 13, "text": "[3]", "bbox": {"l": 54.595001, "t": 153.22168, "r": 65.103195, "b": 161.23766999999998, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Bertrand Couasnon and Aurelie Lemaitre.", "bbox": {"l": 67.356239, "t": 153.22168, "r": 218.77876, "b": 161.23766999999998, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Recognition of Ta-", "bbox": {"l": 220.97999999999996, "t": 153.30237, "r": 286.36301, "b": 161.03143, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "bles and Forms", "bbox": {"l": 70.030991, "t": 164.26135, "r": 125.26401000000001, "b": 171.99041999999997, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": ", pages 647-677. Springer London, London,", "bbox": {"l": 125.26098999999999, "t": 164.18066, "r": 286.36029, "b": 172.19665999999995, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "2014. 2", "bbox": {"l": 70.030991, "t": 175.13867000000005, "r": 97.916496, "b": 183.15466000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[3] Bertrand Couasnon and Aurelie Lemaitre. Recognition of Tables and Forms , pages 647-677. Springer London, London, 2014. 2"}, {"label": "list_item", "id": 0, "page_no": 8, "cluster": {"id": 0, "label": "list_item", "bbox": {"l": 54.59499, "t": 186.41063999999994, "r": 286.36401, "b": 227.30358999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9648825526237488, "cells": [{"id": 19, "text": "[4]", "bbox": {"l": 54.59499, "t": 186.41063999999994, "r": 65.806984, "b": 194.42664000000002, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Herv\u00b4e D\u00b4ejean, Jean-Luc Meunier, Liangcai Gao, Yilun", "bbox": {"l": 68.210922, "t": 186.41063999999994, "r": 286.36401, "b": 194.42664000000002, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Huang, Yu Fang, Florian Kleber, and Eva-Maria Lang. IC-", "bbox": {"l": 70.030983, "t": 197.36963000000003, "r": 286.36331, "b": 205.38562000000002, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "DAR 2019 Competition on Table Detection and Recognition", "bbox": {"l": 70.030983, "t": 208.32861000000003, "r": 286.36334, "b": 216.3446, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "(cTDaR), Apr. 2019. http://sac.founderit.com/. 2", "bbox": {"l": 70.030983, "t": 219.2876, "r": 245.83519, "b": 227.30358999999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[4] Herv\u00b4e D\u00b4ejean, Jean-Luc Meunier, Liangcai Gao, Yilun Huang, Yu Fang, Florian Kleber, and Eva-Maria Lang. ICDAR 2019 Competition on Table Detection and Recognition (cTDaR), Apr. 2019. http://sac.founderit.com/. 2"}, {"label": "list_item", "id": 1, "page_no": 8, "cluster": {"id": 1, "label": "list_item", "bbox": {"l": 54.594982, "t": 230.55957, "r": 286.36334, "b": 271.45154, "coord_origin": "TOPLEFT"}, "confidence": 0.9620943069458008, "cells": [{"id": 24, "text": "[5]", "bbox": {"l": 54.594982, "t": 230.55957, "r": 65.381134, "b": 238.57556, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "Basilios Gatos, Dimitrios Danatsas, Ioannis Pratikakis, and", "bbox": {"l": 67.693779, "t": 230.55957, "r": 286.35849, "b": 238.57556, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "Stavros J Perantonis. Automatic table detection in document", "bbox": {"l": 70.030983, "t": 241.51855, "r": 286.36334, "b": 249.53454999999997, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "images. In", "bbox": {"l": 70.030983, "t": 252.47655999999995, "r": 108.39821, "b": 260.49255000000005, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "International Conference on Pattern Recognition", "bbox": {"l": 110.64498000000002, "t": 252.55724999999995, "r": 286.3595, "b": 260.28632000000005, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "and Image Analysis", "bbox": {"l": 70.030983, "t": 263.51624000000004, "r": 140.57861, "b": 271.24530000000004, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": ", pages 609-618. Springer, 2005. 2", "bbox": {"l": 140.57797, "t": 263.43555000000003, "r": 266.47522, "b": 271.45154, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[5] Basilios Gatos, Dimitrios Danatsas, Ioannis Pratikakis, and Stavros J Perantonis. Automatic table detection in document images. In International Conference on Pattern Recognition and Image Analysis , pages 609-618. Springer, 2005. 2"}, {"label": "list_item", "id": 2, "page_no": 8, "cluster": {"id": 2, "label": "list_item", "bbox": {"l": 54.594971, "t": 274.70758, "r": 286.36676, "b": 315.6004899999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9555517435073853, "cells": [{"id": 31, "text": "[6]", "bbox": {"l": 54.594971, "t": 274.70758, "r": 64.848648, "b": 282.72351, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Max G\u00a8obel, Tamir Hassan, Ermelinda Oro, and Giorgio Orsi.", "bbox": {"l": 67.047119, "t": 274.70758, "r": 286.36676, "b": 282.72351, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "Icdar 2013 table competition.", "bbox": {"l": 70.030975, "t": 285.66655999999995, "r": 179.57349, "b": 293.68253, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "In", "bbox": {"l": 187.01559, "t": 285.66655999999995, "r": 194.4846, "b": 293.68253, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "2013 12th International", "bbox": {"l": 198.04398, "t": 285.74725, "r": 286.36304, "b": 293.47632, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Conference on Document Analysis and Recognition", "bbox": {"l": 70.030975, "t": 296.70624, "r": 260.19937, "b": 304.43530000000004, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": ", pages", "bbox": {"l": 260.198, "t": 296.62555, "r": 286.36197, "b": 304.64151, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "1449-1453, 2013. 2", "bbox": {"l": 70.030991, "t": 307.5845299999999, "r": 142.74849, "b": 315.6004899999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[6] Max G\u00a8obel, Tamir Hassan, Ermelinda Oro, and Giorgio Orsi. Icdar 2013 table competition. In 2013 12th International Conference on Document Analysis and Recognition , pages 1449-1453, 2013. 2"}, {"label": "list_item", "id": 4, "page_no": 8, "cluster": {"id": 4, "label": "list_item", "bbox": {"l": 54.59499, "t": 318.85654, "r": 286.36319, "b": 348.78952, "coord_origin": "TOPLEFT"}, "confidence": 0.9479843378067017, "cells": [{"id": 39, "text": "[7]", "bbox": {"l": 54.59499, "t": 318.85654, "r": 65.61586, "b": 326.8725, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "EA Green and M Krishnamoorthy.", "bbox": {"l": 67.978821, "t": 318.85654, "r": 199.492, "b": 326.8725, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Recognition of tables", "bbox": {"l": 206.98792, "t": 318.85654, "r": 286.35849, "b": 326.8725, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "using table grammars. procs.", "bbox": {"l": 70.030991, "t": 329.8145400000001, "r": 176.28284, "b": 337.83051, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "In", "bbox": {"l": 182.60416, "t": 329.8145400000001, "r": 190.07317, "b": 337.83051, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "Symposium on Document", "bbox": {"l": 193.28299, "t": 329.89522999999997, "r": 286.36319, "b": 337.62429999999995, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Analysis and Recognition (SDAIR\u201995)", "bbox": {"l": 70.030991, "t": 340.85425, "r": 206.34717, "b": 348.58331, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": ", pages 261-277. 2", "bbox": {"l": 206.34599, "t": 340.77356, "r": 274.82239, "b": 348.78952, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[7] EA Green and M Krishnamoorthy. Recognition of tables using table grammars. procs. In Symposium on Document Analysis and Recognition (SDAIR'95) , pages 261-277. 2"}, {"label": "list_item", "id": 3, "page_no": 8, "cluster": {"id": 3, "label": "list_item", "bbox": {"l": 54.594986000000006, "t": 352.0455600000001, "r": 286.36331, "b": 403.89749, "coord_origin": "TOPLEFT"}, "confidence": 0.9484425187110901, "cells": [{"id": 47, "text": "[8]", "bbox": {"l": 54.594986000000006, "t": 352.0455600000001, "r": 65.04657, "b": 360.06152, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Khurram Azeem Hashmi, Alain Pagani, Marcus Liwicki, Di-", "bbox": {"l": 67.287483, "t": 352.0455600000001, "r": 286.35849, "b": 360.06152, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "dier Stricker, and Muhammad Zeshan Afzal.", "bbox": {"l": 70.030983, "t": 363.00458, "r": 234.12507999999997, "b": 371.02054, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Castabdetec-", "bbox": {"l": 240.05186, "t": 363.00458, "r": 286.36331, "b": 371.02054, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "tors: Cascade network for table detection in document im-", "bbox": {"l": 70.030983, "t": 373.96356, "r": 286.36331, "b": 381.97952, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "ages with recursive feature pyramid and switchable atrous", "bbox": {"l": 70.030983, "t": 384.92255, "r": 286.36331, "b": 392.93851, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "convolution.", "bbox": {"l": 70.030983, "t": 395.88153, "r": 114.57605, "b": 403.89749, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "Journal of Imaging", "bbox": {"l": 117.80399000000001, "t": 395.96222, "r": 186.7287, "b": 403.69128, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": ", 7(10), 2021. 1", "bbox": {"l": 186.728, "t": 395.88153, "r": 243.00113999999996, "b": 403.89749, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[8] Khurram Azeem Hashmi, Alain Pagani, Marcus Liwicki, Didier Stricker, and Muhammad Zeshan Afzal. Castabdetectors: Cascade network for table detection in document images with recursive feature pyramid and switchable atrous convolution. Journal of Imaging , 7(10), 2021. 1"}, {"label": "list_item", "id": 10, "page_no": 8, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 54.595001, "t": 407.15253000000007, "r": 286.35989, "b": 437.08646000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9330756664276123, "cells": [{"id": 56, "text": "[9]", "bbox": {"l": 54.595001, "t": 407.15253000000007, "r": 65.334427, "b": 415.1684900000001, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Kaiming He, Georgia Gkioxari, Piotr Dollar, and Ross Gir-", "bbox": {"l": 67.637054, "t": 407.15253000000007, "r": 286.35852, "b": 415.1684900000001, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "shick. Mask r-cnn. In", "bbox": {"l": 70.030998, "t": 418.11151, "r": 147.13306, "b": 426.12747, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Proceedings of the IEEE International", "bbox": {"l": 149.15601, "t": 418.1922, "r": 286.35989, "b": 425.92126, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Conference on Computer Vision (ICCV)", "bbox": {"l": 70.031006, "t": 429.15118, "r": 213.48445, "b": 436.88025, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": ", Oct 2017. 1", "bbox": {"l": 213.483, "t": 429.07050000000004, "r": 261.04083, "b": 437.08646000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[9] Kaiming He, Georgia Gkioxari, Piotr Dollar, and Ross Girshick. Mask r-cnn. In Proceedings of the IEEE International Conference on Computer Vision (ICCV) , Oct 2017. 1"}, {"label": "list_item", "id": 14, "page_no": 8, "cluster": {"id": 14, "label": "list_item", "bbox": {"l": 50.112, "t": 440.3424999999999, "r": 286.36334, "b": 481.23544, "coord_origin": "TOPLEFT"}, "confidence": 0.9274735450744629, "cells": [{"id": 62, "text": "[10]", "bbox": {"l": 50.112, "t": 440.3424999999999, "r": 65.399307, "b": 448.3584599999999, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "Yelin He, X. Qi, Jiaquan Ye, Peng Gao, Yihao Chen, Bing-", "bbox": {"l": 67.693321, "t": 440.3424999999999, "r": 286.3587, "b": 448.3584599999999, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "cong Li, Xin Tang, and Rong Xiao.", "bbox": {"l": 70.030998, "t": 451.30151, "r": 202.74268, "b": 459.31747, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "Pingan-vcgroup\u2019s so-", "bbox": {"l": 209.00122, "t": 451.30151, "r": 286.36331, "b": 459.31747, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "lution for icdar 2021 competition on scientific table image", "bbox": {"l": 70.030998, "t": 462.2605, "r": 286.36334, "b": 470.27646, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "recognition to latex.", "bbox": {"l": 70.030998, "t": 473.21948, "r": 141.86981, "b": 481.23544, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "ArXiv", "bbox": {"l": 145.097, "t": 473.30017, "r": 166.01561, "b": 481.02924, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": ", abs/2105.01846, 2021. 2", "bbox": {"l": 166.015, "t": 473.21948, "r": 259.90216, "b": 481.23544, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[10] Yelin He, X. Qi, Jiaquan Ye, Peng Gao, Yihao Chen, Bingcong Li, Xin Tang, and Rong Xiao. Pingan-vcgroup's solution for icdar 2021 competition on scientific table image recognition to latex. ArXiv , abs/2105.01846, 2021. 2"}, {"label": "list_item", "id": 11, "page_no": 8, "cluster": {"id": 11, "label": "list_item", "bbox": {"l": 50.112, "t": 484.49048, "r": 286.36331, "b": 536.34238, "coord_origin": "TOPLEFT"}, "confidence": 0.9299950003623962, "cells": [{"id": 70, "text": "[11]", "bbox": {"l": 50.112, "t": 484.49048, "r": 66.033806, "b": 492.50644, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Jianying Hu, Ramanujan S Kashi, Daniel P Lopresti, and", "bbox": {"l": 68.423035, "t": 484.49048, "r": 286.35873, "b": 492.50644, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "Gordon Wilfong. Medium-independent table detection. In", "bbox": {"l": 70.030998, "t": 495.44946, "r": 286.36331, "b": 503.46542, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "Document Recognition and Retrieval VII", "bbox": {"l": 70.030998, "t": 506.48914, "r": 227.40926, "b": 514.2182, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": ", volume 3967,", "bbox": {"l": 227.40500000000003, "t": 506.40845, "r": 286.35913, "b": 514.4244100000001, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "pages 291-302. International Society for Optics and Photon-", "bbox": {"l": 70.031006, "t": 517.36743, "r": 286.36328, "b": 525.38339, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "ics, 1999. 2", "bbox": {"l": 70.031006, "t": 528.32642, "r": 112.36138000000001, "b": 536.34238, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[11] Jianying Hu, Ramanujan S Kashi, Daniel P Lopresti, and Gordon Wilfong. Medium-independent table detection. In Document Recognition and Retrieval VII , volume 3967, pages 291-302. International Society for Optics and Photonics, 1999. 2"}, {"label": "list_item", "id": 5, "page_no": 8, "cluster": {"id": 5, "label": "list_item", "bbox": {"l": 50.112007, "t": 539.59842, "r": 286.36334, "b": 591.44937, "coord_origin": "TOPLEFT"}, "confidence": 0.9394103288650513, "cells": [{"id": 77, "text": "[12]", "bbox": {"l": 50.112007, "t": 539.59842, "r": 65.466705, "b": 547.61438, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "Matthew Hurst. A constraint-based approach to table struc-", "bbox": {"l": 67.770828, "t": 539.59842, "r": 286.35873, "b": 547.61438, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "ture derivation. In", "bbox": {"l": 70.031006, "t": 550.55742, "r": 136.28374, "b": 558.57338, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "Proceedings of the Seventh International", "bbox": {"l": 138.811, "t": 550.63812, "r": 286.36206, "b": 558.36716, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Conference on Document Analysis and Recognition - Volume", "bbox": {"l": 70.031006, "t": 561.5971199999999, "r": 286.36334, "b": 569.32616, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "2", "bbox": {"l": 70.031006, "t": 572.55612, "r": 74.514206, "b": 580.28516, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": ", ICDAR \u201903, page 911, USA, 2003. IEEE Computer Soci-", "bbox": {"l": 74.514008, "t": 572.47542, "r": 286.36313, "b": 580.4913799999999, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "ety. 2", "bbox": {"l": 70.031006, "t": 583.4334100000001, "r": 90.357834, "b": 591.44937, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[12] Matthew Hurst. A constraint-based approach to table structure derivation. In Proceedings of the Seventh International Conference on Document Analysis and Recognition - Volume 2 , ICDAR '03, page 911, USA, 2003. IEEE Computer Society. 2"}, {"label": "list_item", "id": 13, "page_no": 8, "cluster": {"id": 13, "label": "list_item", "bbox": {"l": 50.112007, "t": 594.70541, "r": 286.36331, "b": 646.55737, "coord_origin": "TOPLEFT"}, "confidence": 0.9298838973045349, "cells": [{"id": 85, "text": "[13]", "bbox": {"l": 50.112007, "t": 594.70541, "r": 66.270439, "b": 602.72137, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Thotreingam Kasar, Philippine Barlas, Sebastien Adam,", "bbox": {"l": 68.695168, "t": 594.70541, "r": 286.35873, "b": 602.72137, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Cl\u00b4ement Chatelain, and Thierry Paquet. Learning to detect", "bbox": {"l": 70.031006, "t": 605.66441, "r": 286.3631, "b": 613.68037, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "tables in scanned document images using line information.", "bbox": {"l": 70.031006, "t": 616.62341, "r": 286.36331, "b": 624.63937, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "In", "bbox": {"l": 70.031006, "t": 627.58241, "r": 77.500015, "b": 635.5983699999999, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "2013 12th International Conference on Document Analy-", "bbox": {"l": 79.920006, "t": 627.6631199999999, "r": 286.3624, "b": 635.39215, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "sis and Recognition", "bbox": {"l": 70.031006, "t": 638.62212, "r": 140.67728, "b": 646.35115, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": ", pages 1185-1189. IEEE, 2013. 2", "bbox": {"l": 140.67599, "t": 638.54141, "r": 264.43921, "b": 646.55737, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[13] Thotreingam Kasar, Philippine Barlas, Sebastien Adam, Cl\u00b4ement Chatelain, and Thierry Paquet. Learning to detect tables in scanned document images using line information. In 2013 12th International Conference on Document Analysis and Recognition , pages 1185-1189. IEEE, 2013. 2"}, {"label": "list_item", "id": 17, "page_no": 8, "cluster": {"id": 17, "label": "list_item", "bbox": {"l": 50.111992, "t": 649.81342, "r": 286.36334, "b": 679.74638, "coord_origin": "TOPLEFT"}, "confidence": 0.9115257263183594, "cells": [{"id": 93, "text": "[14]", "bbox": {"l": 50.111992, "t": 649.81342, "r": 66.534035, "b": 657.82938, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "Pratik Kayal, Mrinal Anand, Harsh Desai, and Mayank", "bbox": {"l": 68.998329, "t": 649.81342, "r": 286.35873, "b": 657.82938, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "Singh.", "bbox": {"l": 70.030991, "t": 660.77142, "r": 93.200165, "b": 668.78738, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "Icdar 2021 competition on scientific table image", "bbox": {"l": 102.20243, "t": 660.77142, "r": 286.36334, "b": 668.78738, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "recognition to latex, 2021. 2", "bbox": {"l": 70.030991, "t": 671.73042, "r": 171.9969, "b": 679.74638, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[14] Pratik Kayal, Mrinal Anand, Harsh Desai, and Mayank Singh. Icdar 2021 competition on scientific table image recognition to latex, 2021. 2"}, {"label": "list_item", "id": 16, "page_no": 8, "cluster": {"id": 16, "label": "list_item", "bbox": {"l": 50.111992, "t": 683.00243, "r": 286.35931, "b": 712.936386, "coord_origin": "TOPLEFT"}, "confidence": 0.912230372428894, "cells": [{"id": 98, "text": "[15]", "bbox": {"l": 50.111992, "t": 683.00243, "r": 65.515968, "b": 691.01839, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "Harold W Kuhn. The hungarian method for the assignment", "bbox": {"l": 67.827499, "t": 683.00243, "r": 286.3587, "b": 691.01839, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "problem.", "bbox": {"l": 70.030991, "t": 693.9614260000001, "r": 102.15761, "b": 701.977386, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "Naval research logistics quarterly", "bbox": {"l": 107.54999, "t": 694.0421220000001, "r": 231.47461, "b": 701.771156, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": ", 2(1-2):83-97,", "bbox": {"l": 231.47598, "t": 693.9614260000001, "r": 286.35931, "b": 701.977386, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "1955. 6", "bbox": {"l": 70.030975, "t": 704.920425, "r": 97.916481, "b": 712.936386, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[15] Harold W Kuhn. The hungarian method for the assignment problem. Naval research logistics quarterly , 2(1-2):83-97, 1955. 6"}, {"label": "list_item", "id": 6, "page_no": 8, "cluster": {"id": 6, "label": "list_item", "bbox": {"l": 308.86197, "t": 75.88342000000011, "r": 545.11475, "b": 138.69335999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.9389600157737732, "cells": [{"id": 104, "text": "[16]", "bbox": {"l": 308.86197, "t": 75.88342000000011, "r": 324.74973, "b": 83.89940999999999, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "Girish Kulkarni, Visruth Premraj, Vicente Ordonez, Sag-", "bbox": {"l": 327.13382, "t": 75.88342000000011, "r": 545.1087, "b": 83.89940999999999, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "nik Dhar, Siming Li, Yejin Choi, Alexander C. Berg, and", "bbox": {"l": 328.78098, "t": 86.84142999999995, "r": 545.1134, "b": 94.85741999999993, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "Tamara L. Berg.", "bbox": {"l": 328.78098, "t": 97.80042000000003, "r": 390.96295, "b": 105.81641000000002, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "Babytalk:", "bbox": {"l": 400.27008, "t": 97.80042000000003, "r": 435.1404099999999, "b": 105.81641000000002, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "Understanding and generat-", "bbox": {"l": 441.71277, "t": 97.80042000000003, "r": 545.11328, "b": 105.81641000000002, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "ing simple image descriptions.", "bbox": {"l": 328.78098, "t": 108.75940000000003, "r": 440.80719, "b": 116.7753899999999, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "IEEE Transactions on Pat-", "bbox": {"l": 446.63498, "t": 108.84009000000003, "r": 545.11304, "b": 116.56914999999992, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "tern Analysis and Machine Intelligence", "bbox": {"l": 328.78098, "t": 119.79907000000003, "r": 471.13153, "b": 127.52814000000001, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": ", 35(12):2891-2903,", "bbox": {"l": 471.13300000000004, "t": 119.71838000000002, "r": 545.11475, "b": 127.73437999999999, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "2013. 4", "bbox": {"l": 328.78101, "t": 130.67737, "r": 356.6665, "b": 138.69335999999998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[16] Girish Kulkarni, Visruth Premraj, Vicente Ordonez, Sagnik Dhar, Siming Li, Yejin Choi, Alexander C. Berg, and Tamara L. Berg. Babytalk: Understanding and generating simple image descriptions. IEEE Transactions on Pattern Analysis and Machine Intelligence , 35(12):2891-2903, 2013. 4"}, {"label": "list_item", "id": 15, "page_no": 8, "cluster": {"id": 15, "label": "list_item", "bbox": {"l": 308.862, "t": 142.12334999999996, "r": 545.1134, "b": 172.05633999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.9253129959106445, "cells": [{"id": 115, "text": "[17]", "bbox": {"l": 308.862, "t": 142.12334999999996, "r": 325.24371, "b": 150.13933999999995, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "Minghao Li, Lei Cui, Shaohan Huang, Furu Wei, Ming", "bbox": {"l": 327.70197, "t": 142.12334999999996, "r": 545.10883, "b": 150.13933999999995, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "Zhou, and Zhoujun Li.", "bbox": {"l": 328.78101, "t": 153.08136000000002, "r": 414.44598, "b": 161.09735, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "Tablebank: A benchmark dataset", "bbox": {"l": 421.82532, "t": 153.08136000000002, "r": 545.1134, "b": 161.09735, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "for table detection and recognition, 2019. 2, 3", "bbox": {"l": 328.78101, "t": 164.04034000000001, "r": 493.62835999999993, "b": 172.05633999999998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[17] Minghao Li, Lei Cui, Shaohan Huang, Furu Wei, Ming Zhou, and Zhoujun Li. Tablebank: A benchmark dataset for table detection and recognition, 2019. 2, 3"}, {"label": "list_item", "id": 12, "page_no": 8, "cluster": {"id": 12, "label": "list_item", "bbox": {"l": 308.862, "t": 175.48632999999995, "r": 545.11353, "b": 260.21423000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9299732446670532, "cells": [{"id": 120, "text": "[18]", "bbox": {"l": 308.862, "t": 175.48632999999995, "r": 324.26599, "b": 183.50232000000005, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "Yiren Li, Zheng Huang, Junchi Yan, Yi Zhou, Fan Ye, and", "bbox": {"l": 326.57751, "t": 175.48632999999995, "r": 545.10876, "b": 183.50232000000005, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Xianhui Liu. Gfte: Graph-based financial table extraction.", "bbox": {"l": 328.78101, "t": 186.44530999999995, "r": 545.11334, "b": 194.46130000000005, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "In Alberto Del Bimbo, Rita Cucchiara, Stan Sclaroff, Gio-", "bbox": {"l": 328.78101, "t": 197.40430000000003, "r": 545.11346, "b": 205.42029000000002, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "vanni Maria Farinella, Tao Mei, Marco Bertini, Hugo Jair", "bbox": {"l": 328.78101, "t": 208.36328000000003, "r": 545.11353, "b": 216.37927000000002, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "Escalante, and Roberto Vezzani, editors,", "bbox": {"l": 328.78101, "t": 219.32227, "r": 479.26413, "b": 227.33826, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "Pattern Recogni-", "bbox": {"l": 483.11902, "t": 219.40295000000003, "r": 545.11273, "b": 227.13202, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "tion. ICPR International Workshops and Challenges", "bbox": {"l": 328.78101, "t": 230.36095999999998, "r": 519.39771, "b": 238.09002999999996, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": ", pages", "bbox": {"l": 519.401, "t": 230.28026999999997, "r": 545.10767, "b": 238.29625999999996, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "644-658, Cham, 2021. Springer International Publishing. 2,", "bbox": {"l": 328.78101, "t": 241.23925999999994, "r": 545.11328, "b": 249.25525000000005, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "3", "bbox": {"l": 328.78101, "t": 252.19824000000006, "r": 333.26422, "b": 260.21423000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[18] Yiren Li, Zheng Huang, Junchi Yan, Yi Zhou, Fan Ye, and Xianhui Liu. Gfte: Graph-based financial table extraction. In Alberto Del Bimbo, Rita Cucchiara, Stan Sclaroff, Giovanni Maria Farinella, Tao Mei, Marco Bertini, Hugo Jair Escalante, and Roberto Vezzani, editors, Pattern Recognition. ICPR International Workshops and Challenges , pages 644-658, Cham, 2021. Springer International Publishing. 2, 3"}, {"label": "list_item", "id": 8, "page_no": 8, "cluster": {"id": 8, "label": "list_item", "bbox": {"l": 308.862, "t": 263.64423, "r": 545.1142, "b": 326.45413, "coord_origin": "TOPLEFT"}, "confidence": 0.937321662902832, "cells": [{"id": 131, "text": "[19]", "bbox": {"l": 308.862, "t": 263.64423, "r": 324.26477, "b": 271.66022, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "Nikolaos Livathinos, Cesar Berrospi, Maksym Lysak, Vik-", "bbox": {"l": 326.57611, "t": 263.64423, "r": 545.10883, "b": 271.66022, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "tor Kuropiatnyk, Ahmed Nassar, Andre Carvalho, Michele", "bbox": {"l": 328.78101, "t": 274.60321, "r": 545.1134, "b": 282.61917000000005, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "Dolfi, Christoph Auer, Kasper Dinkla, and Peter Staar. Ro-", "bbox": {"l": 328.78101, "t": 285.56219, "r": 545.11328, "b": 293.57816, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "bust pdf document conversion using recurrent neural net-", "bbox": {"l": 328.78101, "t": 296.52118, "r": 545.11334, "b": 304.53714, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "works.", "bbox": {"l": 328.78101, "t": 307.47919, "r": 352.84683, "b": 315.49515, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "Proceedings of the AAAI Conference on Artificial", "bbox": {"l": 360.23599, "t": 307.55988, "r": 545.1142, "b": 315.28894, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "Intelligence", "bbox": {"l": 328.78101, "t": 318.51886, "r": 371.02173, "b": 326.24792, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": ", 35(17):15137-15145, May 2021. 1", "bbox": {"l": 371.021, "t": 318.43817, "r": 502.26227, "b": 326.45413, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[19] Nikolaos Livathinos, Cesar Berrospi, Maksym Lysak, Viktor Kuropiatnyk, Ahmed Nassar, Andre Carvalho, Michele Dolfi, Christoph Auer, Kasper Dinkla, and Peter Staar. Robust pdf document conversion using recurrent neural networks. Proceedings of the AAAI Conference on Artificial Intelligence , 35(17):15137-15145, May 2021. 1"}, {"label": "list_item", "id": 18, "page_no": 8, "cluster": {"id": 18, "label": "list_item", "bbox": {"l": 308.862, "t": 329.88419, "r": 545.11609, "b": 370.77713, "coord_origin": "TOPLEFT"}, "confidence": 0.9027292728424072, "cells": [{"id": 140, "text": "[20]", "bbox": {"l": 308.862, "t": 329.88419, "r": 323.82672, "b": 337.90015, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "Rujiao Long, Wen Wang, Nan Xue, Feiyu Gao, Zhibo Yang,", "bbox": {"l": 326.07233, "t": 329.88419, "r": 545.10876, "b": 337.90015, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "Yongpan Wang, and Gui-Song Xia. Parsing table structures", "bbox": {"l": 328.78101, "t": 340.8432, "r": 545.11346, "b": 348.85916, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "in the wild. In", "bbox": {"l": 328.78101, "t": 351.80219000000005, "r": 382.7767, "b": 359.81815000000006, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "Proceedings of the IEEE/CVF International", "bbox": {"l": 385.54102, "t": 351.88287, "r": 545.11609, "b": 359.61194, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "Conference on Computer Vision", "bbox": {"l": 328.78101, "t": 362.84186, "r": 443.59579, "b": 370.57092, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": ", pages 944-952, 2021. 2", "bbox": {"l": 443.59399, "t": 362.76117, "r": 534.48645, "b": 370.77713, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[20] Rujiao Long, Wen Wang, Nan Xue, Feiyu Gao, Zhibo Yang, Yongpan Wang, and Gui-Song Xia. Parsing table structures in the wild. In Proceedings of the IEEE/CVF International Conference on Computer Vision , pages 944-952, 2021. 2"}, {"label": "list_item", "id": 21, "page_no": 8, "cluster": {"id": 21, "label": "list_item", "bbox": {"l": 308.862, "t": 374.20618, "r": 545.11346, "b": 437.01706, "coord_origin": "TOPLEFT"}, "confidence": 0.882714569568634, "cells": [{"id": 147, "text": "[21]", "bbox": {"l": 308.862, "t": 374.20618, "r": 324.60281, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "Shubham", "bbox": {"l": 326.96487, "t": 374.20618, "r": 362.6604, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "Singh", "bbox": {"l": 368.69479, "t": 374.20618, "r": 389.6134, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "Paliwal,", "bbox": {"l": 395.6478, "t": 374.20618, "r": 424.56445, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "D", "bbox": {"l": 431.5492899999999, "t": 374.20618, "r": 438.0230399999999, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "Vishwanath,", "bbox": {"l": 444.05743, "t": 374.20618, "r": 488.5038799999999, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "Rohit", "bbox": {"l": 495.47974, "t": 374.20618, "r": 515.41205, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "Rahul,", "bbox": {"l": 521.44641, "t": 374.20618, "r": 545.10876, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "Monika Sharma, and Lovekesh Vig. Tablenet: Deep learn-", "bbox": {"l": 328.78101, "t": 385.16516, "r": 545.1134, "b": 393.18112, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "ing model for end-to-end table detection and tabular data ex-", "bbox": {"l": 328.78101, "t": 396.12415, "r": 545.11346, "b": 404.14011, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "traction from scanned document images.", "bbox": {"l": 328.78101, "t": 407.08313, "r": 478.00881999999996, "b": 415.09909, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "In", "bbox": {"l": 484.0701, "t": 407.08313, "r": 491.53912, "b": 415.09909, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "2019 Interna-", "bbox": {"l": 494.668, "t": 407.16382, "r": 545.11298, "b": 414.89288, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "tional Conference on Document Analysis and Recognition", "bbox": {"l": 328.78101, "t": 418.12280000000004, "r": 545.11334, "b": 425.85187, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "(ICDAR)", "bbox": {"l": 328.78101, "t": 429.08179, "r": 360.83591, "b": 436.8108500000001, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": ", pages 128-133. IEEE, 2019. 1", "bbox": {"l": 360.836, "t": 429.0011, "r": 475.63287, "b": 437.01706, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[21] Shubham Singh Paliwal, D Vishwanath, Rohit Rahul, Monika Sharma, and Lovekesh Vig. Tablenet: Deep learning model for end-to-end table detection and tabular data extraction from scanned document images. In 2019 International Conference on Document Analysis and Recognition (ICDAR) , pages 128-133. IEEE, 2019. 1"}, {"label": "list_item", "id": 20, "page_no": 8, "cluster": {"id": 20, "label": "list_item", "bbox": {"l": 308.862, "t": 440.44611, "r": 545.11475, "b": 558.05096, "coord_origin": "TOPLEFT"}, "confidence": 0.8896440863609314, "cells": [{"id": 163, "text": "[22]", "bbox": {"l": 308.862, "t": 440.44611, "r": 324.57407, "b": 448.46207, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "Adam Paszke, Sam Gross, Francisco Massa, Adam Lerer,", "bbox": {"l": 326.93179, "t": 440.44611, "r": 545.1087, "b": 448.46207, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "James Bradbury, Gregory Chanan, Trevor Killeen, Zeming", "bbox": {"l": 328.78101, "t": 451.40509, "r": 545.11346, "b": 459.42105, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "Lin, Natalia Gimelshein, Luca Antiga, Alban Desmaison,", "bbox": {"l": 328.78101, "t": 462.36407, "r": 545.11328, "b": 470.38004, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "Andreas Kopf, Edward Yang, Zachary DeVito, Martin Rai-", "bbox": {"l": 328.78101, "t": 473.32306, "r": 545.11328, "b": 481.33902, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "son, Alykhan Tejani, Sasank Chilamkurthy, Benoit Steiner,", "bbox": {"l": 328.78101, "t": 484.28204, "r": 545.11328, "b": 492.298, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "Lu Fang, Junjie Bai, and Soumith Chintala. Pytorch: An im-", "bbox": {"l": 328.78101, "t": 495.24103, "r": 545.1134, "b": 503.25699, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "perative style, high-performance deep learning library. In H.", "bbox": {"l": 328.78101, "t": 506.20001, "r": 545.1134, "b": 514.21597, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "Wallach, H. Larochelle, A. Beygelzimer, F. d'Alch\u00b4e-Buc, E.", "bbox": {"l": 328.78101, "t": 517.159, "r": 545.1098, "b": 525.17496, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "Fox, and R. Garnett, editors,", "bbox": {"l": 328.78101, "t": 528.117, "r": 434.56659, "b": 536.13297, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "Advances in Neural Informa-", "bbox": {"l": 437.86401, "t": 528.19769, "r": 545.11115, "b": 535.9267600000001, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "tion Processing Systems 32", "bbox": {"l": 328.78101, "t": 539.15671, "r": 425.73471, "b": 546.8857399999999, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": ", pages 8024-8035. Curran Asso-", "bbox": {"l": 425.73602, "t": 539.076, "r": 545.11475, "b": 547.09196, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "ciates, Inc., 2019. 6", "bbox": {"l": 328.78101, "t": 550.035, "r": 399.74109, "b": 558.05096, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[22] Adam Paszke, Sam Gross, Francisco Massa, Adam Lerer, James Bradbury, Gregory Chanan, Trevor Killeen, Zeming Lin, Natalia Gimelshein, Luca Antiga, Alban Desmaison, Andreas Kopf, Edward Yang, Zachary DeVito, Martin Raison, Alykhan Tejani, Sasank Chilamkurthy, Benoit Steiner, Lu Fang, Junjie Bai, and Soumith Chintala. Pytorch: An imperative style, high-performance deep learning library. In H. Wallach, H. Larochelle, A. Beygelzimer, F. d'Alch\u00b4e-Buc, E. Fox, and R. Garnett, editors, Advances in Neural Information Processing Systems 32 , pages 8024-8035. Curran Associates, Inc., 2019. 6"}, {"label": "list_item", "id": 19, "page_no": 8, "cluster": {"id": 19, "label": "list_item", "bbox": {"l": 308.862, "t": 561.481, "r": 545.1134, "b": 624.29097, "coord_origin": "TOPLEFT"}, "confidence": 0.9025435447692871, "cells": [{"id": 177, "text": "[23]", "bbox": {"l": 308.862, "t": 561.481, "r": 324.50351, "b": 569.49696, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "Devashish Prasad, Ayan Gadpal, Kshitij Kapadni, Manish", "bbox": {"l": 326.85068, "t": 561.481, "r": 545.10876, "b": 569.49696, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "Visave, and Kavita Sultanpure. Cascadetabnet: An approach", "bbox": {"l": 328.78101, "t": 572.44, "r": 545.1134, "b": 580.45596, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "for end to end table detection and structure recognition from", "bbox": {"l": 328.78101, "t": 583.399, "r": 545.11334, "b": 591.4149600000001, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "image-based documents. In", "bbox": {"l": 328.78101, "t": 594.358, "r": 431.61667, "b": 602.37396, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "Proceedings of the IEEE/CVF", "bbox": {"l": 434.69101000000006, "t": 594.4387099999999, "r": 545.11224, "b": 602.16774, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "Conference on Computer Vision and Pattern Recognition", "bbox": {"l": 328.78101, "t": 605.39671, "r": 545.1134, "b": 613.12575, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "Workshops", "bbox": {"l": 328.78101, "t": 616.35571, "r": 367.8028, "b": 624.08475, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": ", pages 572-573, 2020. 1", "bbox": {"l": 367.802, "t": 616.2750100000001, "r": 458.69446000000005, "b": 624.29097, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[23] Devashish Prasad, Ayan Gadpal, Kshitij Kapadni, Manish Visave, and Kavita Sultanpure. Cascadetabnet: An approach for end to end table detection and structure recognition from image-based documents. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition Workshops , pages 572-573, 2020. 1"}, {"label": "list_item", "id": 23, "page_no": 8, "cluster": {"id": 23, "label": "list_item", "bbox": {"l": 308.862, "t": 627.72101, "r": 545.11621, "b": 668.61398, "coord_origin": "TOPLEFT"}, "confidence": 0.8777532577514648, "cells": [{"id": 186, "text": "[24]", "bbox": {"l": 308.862, "t": 627.72101, "r": 324.69476, "b": 635.73697, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "Shah Rukh Qasim, Hassan Mahmood, and Faisal Shafait.", "bbox": {"l": 327.07065, "t": 627.72101, "r": 545.1087, "b": 635.73697, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": "Rethinking table recognition using graph neural networks.", "bbox": {"l": 328.78101, "t": 638.68001, "r": 545.11328, "b": 646.69597, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "In", "bbox": {"l": 328.78101, "t": 649.63901, "r": 336.25003, "b": 657.65497, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "2019 International Conference on Document Analysis and", "bbox": {"l": 338.10001, "t": 649.71971, "r": 545.11621, "b": 657.44875, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "Recognition (ICDAR)", "bbox": {"l": 328.78101, "t": 660.67871, "r": 406.32245, "b": 668.40775, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": ", pages 142-147. IEEE, 2019. 3", "bbox": {"l": 406.32202, "t": 660.5980099999999, "r": 521.1189, "b": 668.61398, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[24] Shah Rukh Qasim, Hassan Mahmood, and Faisal Shafait. Rethinking table recognition using graph neural networks. In 2019 International Conference on Document Analysis and Recognition (ICDAR) , pages 142-147. IEEE, 2019. 3"}, {"label": "list_item", "id": 24, "page_no": 8, "cluster": {"id": 24, "label": "list_item", "bbox": {"l": 308.86203, "t": 672.04301, "r": 545.1134, "b": 712.935974, "coord_origin": "TOPLEFT"}, "confidence": 0.8654531240463257, "cells": [{"id": 193, "text": "[25]", "bbox": {"l": 308.86203, "t": 672.04301, "r": 324.71329, "b": 680.05898, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "Hamid Rezatofighi, Nathan Tsoi, JunYoung Gwak, Amir", "bbox": {"l": 327.09195, "t": 672.04301, "r": 545.10876, "b": 680.05898, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "Sadeghian, Ian Reid, and Silvio Savarese.", "bbox": {"l": 328.78104, "t": 683.0020099999999, "r": 482.81488, "b": 691.01797, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "Generalized in-", "bbox": {"l": 488.75064, "t": 683.0020099999999, "r": 545.1134, "b": 691.01797, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "tersection over union: A metric and a loss for bounding box", "bbox": {"l": 328.78104, "t": 693.961014, "r": 545.11334, "b": 701.976974, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "regression. In", "bbox": {"l": 328.78104, "t": 704.920013, "r": 379.1543, "b": 712.935974, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "Proceedings of the IEEE/CVF Conference on", "bbox": {"l": 381.61603, "t": 705.00071, "r": 545.10938, "b": 712.729744, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[25] Hamid Rezatofighi, Nathan Tsoi, JunYoung Gwak, Amir Sadeghian, Ian Reid, and Silvio Savarese. Generalized intersection over union: A metric and a loss for bounding box regression. In Proceedings of the IEEE/CVF Conference on"}, {"label": "page_footer", "id": 22, "page_no": 8, "cluster": {"id": 22, "label": "page_footer", "bbox": {"l": 295.12103, "t": 734.1325870000001, "r": 300.10233, "b": 743.0391500000001, "coord_origin": "TOPLEFT"}, "confidence": 0.8797808885574341, "cells": [{"id": 200, "text": "9", "bbox": {"l": 295.12103, "t": 734.1325870000001, "r": 300.10233, "b": 743.0391500000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "9"}], "body": [{"label": "list_item", "id": 25, "page_no": 8, "cluster": {"id": 25, "label": "list_item", "bbox": {"l": 70.030998, "t": 75.88378999999998, "r": 286.36334, "b": 116.77575999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.7310384511947632, "cells": [{"id": 0, "text": "end object detection with transformers. In Andrea Vedaldi,", "bbox": {"l": 70.030998, "t": 75.88378999999998, "r": 286.36334, "b": 83.89977999999996, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Horst Bischof, Thomas Brox, and Jan-Michael Frahm, edi-", "bbox": {"l": 70.030998, "t": 86.84276999999997, "r": 286.36331, "b": 94.85875999999996, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "tors,", "bbox": {"l": 70.030998, "t": 97.80078000000003, "r": 85.722198, "b": 105.81677000000002, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Computer Vision - ECCV 2020", "bbox": {"l": 87.889, "t": 97.88147000000004, "r": 199.93315, "b": 105.61053000000004, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": ", pages 213-229, Cham,", "bbox": {"l": 199.936, "t": 97.80078000000003, "r": 286.36313, "b": 105.81677000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "2020. Springer International Publishing. 5", "bbox": {"l": 70.031006, "t": 108.75977, "r": 221.94871999999998, "b": 116.77575999999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "end object detection with transformers. In Andrea Vedaldi, Horst Bischof, Thomas Brox, and Jan-Michael Frahm, editors, Computer Vision - ECCV 2020 , pages 213-229, Cham, 2020. Springer International Publishing. 5"}, {"label": "list_item", "id": 9, "page_no": 8, "cluster": {"id": 9, "label": "list_item", "bbox": {"l": 54.595005, "t": 120.03174000000013, "r": 286.36334, "b": 149.96569999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9372755885124207, "cells": [{"id": 6, "text": "[2]", "bbox": {"l": 54.595005, "t": 120.03174000000013, "r": 65.206657, "b": 128.04773, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Zewen Chi, Heyan Huang, Heng-Da Xu, Houjin Yu, Wanx-", "bbox": {"l": 67.481873, "t": 120.03174000000013, "r": 286.35852, "b": 128.04773, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "uan Yin, and Xian-Ling Mao.", "bbox": {"l": 70.031006, "t": 130.99072, "r": 179.67215, "b": 139.00671, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Complicated table structure", "bbox": {"l": 185.58101, "t": 130.99072, "r": 286.36334, "b": 139.00671, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "recognition.", "bbox": {"l": 70.031006, "t": 141.94970999999998, "r": 113.11456, "b": 149.96569999999997, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "arXiv preprint arXiv:1908.04729", "bbox": {"l": 116.34200999999999, "t": 142.0304, "r": 235.3082, "b": 149.75946, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": ", 2019. 3", "bbox": {"l": 235.30701, "t": 141.94970999999998, "r": 267.67572, "b": 149.96569999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[2] Zewen Chi, Heyan Huang, Heng-Da Xu, Houjin Yu, Wanxuan Yin, and Xian-Ling Mao. Complicated table structure recognition. arXiv preprint arXiv:1908.04729 , 2019. 3"}, {"label": "list_item", "id": 7, "page_no": 8, "cluster": {"id": 7, "label": "list_item", "bbox": {"l": 54.595001, "t": 153.22168, "r": 286.36301, "b": 183.15466000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9378374218940735, "cells": [{"id": 13, "text": "[3]", "bbox": {"l": 54.595001, "t": 153.22168, "r": 65.103195, "b": 161.23766999999998, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Bertrand Couasnon and Aurelie Lemaitre.", "bbox": {"l": 67.356239, "t": 153.22168, "r": 218.77876, "b": 161.23766999999998, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Recognition of Ta-", "bbox": {"l": 220.97999999999996, "t": 153.30237, "r": 286.36301, "b": 161.03143, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "bles and Forms", "bbox": {"l": 70.030991, "t": 164.26135, "r": 125.26401000000001, "b": 171.99041999999997, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": ", pages 647-677. Springer London, London,", "bbox": {"l": 125.26098999999999, "t": 164.18066, "r": 286.36029, "b": 172.19665999999995, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "2014. 2", "bbox": {"l": 70.030991, "t": 175.13867000000005, "r": 97.916496, "b": 183.15466000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[3] Bertrand Couasnon and Aurelie Lemaitre. Recognition of Tables and Forms , pages 647-677. Springer London, London, 2014. 2"}, {"label": "list_item", "id": 0, "page_no": 8, "cluster": {"id": 0, "label": "list_item", "bbox": {"l": 54.59499, "t": 186.41063999999994, "r": 286.36401, "b": 227.30358999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9648825526237488, "cells": [{"id": 19, "text": "[4]", "bbox": {"l": 54.59499, "t": 186.41063999999994, "r": 65.806984, "b": 194.42664000000002, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Herv\u00b4e D\u00b4ejean, Jean-Luc Meunier, Liangcai Gao, Yilun", "bbox": {"l": 68.210922, "t": 186.41063999999994, "r": 286.36401, "b": 194.42664000000002, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Huang, Yu Fang, Florian Kleber, and Eva-Maria Lang. IC-", "bbox": {"l": 70.030983, "t": 197.36963000000003, "r": 286.36331, "b": 205.38562000000002, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "DAR 2019 Competition on Table Detection and Recognition", "bbox": {"l": 70.030983, "t": 208.32861000000003, "r": 286.36334, "b": 216.3446, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "(cTDaR), Apr. 2019. http://sac.founderit.com/. 2", "bbox": {"l": 70.030983, "t": 219.2876, "r": 245.83519, "b": 227.30358999999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[4] Herv\u00b4e D\u00b4ejean, Jean-Luc Meunier, Liangcai Gao, Yilun Huang, Yu Fang, Florian Kleber, and Eva-Maria Lang. ICDAR 2019 Competition on Table Detection and Recognition (cTDaR), Apr. 2019. http://sac.founderit.com/. 2"}, {"label": "list_item", "id": 1, "page_no": 8, "cluster": {"id": 1, "label": "list_item", "bbox": {"l": 54.594982, "t": 230.55957, "r": 286.36334, "b": 271.45154, "coord_origin": "TOPLEFT"}, "confidence": 0.9620943069458008, "cells": [{"id": 24, "text": "[5]", "bbox": {"l": 54.594982, "t": 230.55957, "r": 65.381134, "b": 238.57556, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "Basilios Gatos, Dimitrios Danatsas, Ioannis Pratikakis, and", "bbox": {"l": 67.693779, "t": 230.55957, "r": 286.35849, "b": 238.57556, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "Stavros J Perantonis. Automatic table detection in document", "bbox": {"l": 70.030983, "t": 241.51855, "r": 286.36334, "b": 249.53454999999997, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "images. In", "bbox": {"l": 70.030983, "t": 252.47655999999995, "r": 108.39821, "b": 260.49255000000005, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "International Conference on Pattern Recognition", "bbox": {"l": 110.64498000000002, "t": 252.55724999999995, "r": 286.3595, "b": 260.28632000000005, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "and Image Analysis", "bbox": {"l": 70.030983, "t": 263.51624000000004, "r": 140.57861, "b": 271.24530000000004, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": ", pages 609-618. Springer, 2005. 2", "bbox": {"l": 140.57797, "t": 263.43555000000003, "r": 266.47522, "b": 271.45154, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[5] Basilios Gatos, Dimitrios Danatsas, Ioannis Pratikakis, and Stavros J Perantonis. Automatic table detection in document images. In International Conference on Pattern Recognition and Image Analysis , pages 609-618. Springer, 2005. 2"}, {"label": "list_item", "id": 2, "page_no": 8, "cluster": {"id": 2, "label": "list_item", "bbox": {"l": 54.594971, "t": 274.70758, "r": 286.36676, "b": 315.6004899999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9555517435073853, "cells": [{"id": 31, "text": "[6]", "bbox": {"l": 54.594971, "t": 274.70758, "r": 64.848648, "b": 282.72351, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Max G\u00a8obel, Tamir Hassan, Ermelinda Oro, and Giorgio Orsi.", "bbox": {"l": 67.047119, "t": 274.70758, "r": 286.36676, "b": 282.72351, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "Icdar 2013 table competition.", "bbox": {"l": 70.030975, "t": 285.66655999999995, "r": 179.57349, "b": 293.68253, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "In", "bbox": {"l": 187.01559, "t": 285.66655999999995, "r": 194.4846, "b": 293.68253, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "2013 12th International", "bbox": {"l": 198.04398, "t": 285.74725, "r": 286.36304, "b": 293.47632, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Conference on Document Analysis and Recognition", "bbox": {"l": 70.030975, "t": 296.70624, "r": 260.19937, "b": 304.43530000000004, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": ", pages", "bbox": {"l": 260.198, "t": 296.62555, "r": 286.36197, "b": 304.64151, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "1449-1453, 2013. 2", "bbox": {"l": 70.030991, "t": 307.5845299999999, "r": 142.74849, "b": 315.6004899999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[6] Max G\u00a8obel, Tamir Hassan, Ermelinda Oro, and Giorgio Orsi. Icdar 2013 table competition. In 2013 12th International Conference on Document Analysis and Recognition , pages 1449-1453, 2013. 2"}, {"label": "list_item", "id": 4, "page_no": 8, "cluster": {"id": 4, "label": "list_item", "bbox": {"l": 54.59499, "t": 318.85654, "r": 286.36319, "b": 348.78952, "coord_origin": "TOPLEFT"}, "confidence": 0.9479843378067017, "cells": [{"id": 39, "text": "[7]", "bbox": {"l": 54.59499, "t": 318.85654, "r": 65.61586, "b": 326.8725, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "EA Green and M Krishnamoorthy.", "bbox": {"l": 67.978821, "t": 318.85654, "r": 199.492, "b": 326.8725, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Recognition of tables", "bbox": {"l": 206.98792, "t": 318.85654, "r": 286.35849, "b": 326.8725, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "using table grammars. procs.", "bbox": {"l": 70.030991, "t": 329.8145400000001, "r": 176.28284, "b": 337.83051, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "In", "bbox": {"l": 182.60416, "t": 329.8145400000001, "r": 190.07317, "b": 337.83051, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "Symposium on Document", "bbox": {"l": 193.28299, "t": 329.89522999999997, "r": 286.36319, "b": 337.62429999999995, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Analysis and Recognition (SDAIR\u201995)", "bbox": {"l": 70.030991, "t": 340.85425, "r": 206.34717, "b": 348.58331, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": ", pages 261-277. 2", "bbox": {"l": 206.34599, "t": 340.77356, "r": 274.82239, "b": 348.78952, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[7] EA Green and M Krishnamoorthy. Recognition of tables using table grammars. procs. In Symposium on Document Analysis and Recognition (SDAIR'95) , pages 261-277. 2"}, {"label": "list_item", "id": 3, "page_no": 8, "cluster": {"id": 3, "label": "list_item", "bbox": {"l": 54.594986000000006, "t": 352.0455600000001, "r": 286.36331, "b": 403.89749, "coord_origin": "TOPLEFT"}, "confidence": 0.9484425187110901, "cells": [{"id": 47, "text": "[8]", "bbox": {"l": 54.594986000000006, "t": 352.0455600000001, "r": 65.04657, "b": 360.06152, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Khurram Azeem Hashmi, Alain Pagani, Marcus Liwicki, Di-", "bbox": {"l": 67.287483, "t": 352.0455600000001, "r": 286.35849, "b": 360.06152, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "dier Stricker, and Muhammad Zeshan Afzal.", "bbox": {"l": 70.030983, "t": 363.00458, "r": 234.12507999999997, "b": 371.02054, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Castabdetec-", "bbox": {"l": 240.05186, "t": 363.00458, "r": 286.36331, "b": 371.02054, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "tors: Cascade network for table detection in document im-", "bbox": {"l": 70.030983, "t": 373.96356, "r": 286.36331, "b": 381.97952, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "ages with recursive feature pyramid and switchable atrous", "bbox": {"l": 70.030983, "t": 384.92255, "r": 286.36331, "b": 392.93851, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "convolution.", "bbox": {"l": 70.030983, "t": 395.88153, "r": 114.57605, "b": 403.89749, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "Journal of Imaging", "bbox": {"l": 117.80399000000001, "t": 395.96222, "r": 186.7287, "b": 403.69128, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": ", 7(10), 2021. 1", "bbox": {"l": 186.728, "t": 395.88153, "r": 243.00113999999996, "b": 403.89749, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[8] Khurram Azeem Hashmi, Alain Pagani, Marcus Liwicki, Didier Stricker, and Muhammad Zeshan Afzal. Castabdetectors: Cascade network for table detection in document images with recursive feature pyramid and switchable atrous convolution. Journal of Imaging , 7(10), 2021. 1"}, {"label": "list_item", "id": 10, "page_no": 8, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 54.595001, "t": 407.15253000000007, "r": 286.35989, "b": 437.08646000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9330756664276123, "cells": [{"id": 56, "text": "[9]", "bbox": {"l": 54.595001, "t": 407.15253000000007, "r": 65.334427, "b": 415.1684900000001, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Kaiming He, Georgia Gkioxari, Piotr Dollar, and Ross Gir-", "bbox": {"l": 67.637054, "t": 407.15253000000007, "r": 286.35852, "b": 415.1684900000001, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "shick. Mask r-cnn. In", "bbox": {"l": 70.030998, "t": 418.11151, "r": 147.13306, "b": 426.12747, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Proceedings of the IEEE International", "bbox": {"l": 149.15601, "t": 418.1922, "r": 286.35989, "b": 425.92126, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Conference on Computer Vision (ICCV)", "bbox": {"l": 70.031006, "t": 429.15118, "r": 213.48445, "b": 436.88025, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": ", Oct 2017. 1", "bbox": {"l": 213.483, "t": 429.07050000000004, "r": 261.04083, "b": 437.08646000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[9] Kaiming He, Georgia Gkioxari, Piotr Dollar, and Ross Girshick. Mask r-cnn. In Proceedings of the IEEE International Conference on Computer Vision (ICCV) , Oct 2017. 1"}, {"label": "list_item", "id": 14, "page_no": 8, "cluster": {"id": 14, "label": "list_item", "bbox": {"l": 50.112, "t": 440.3424999999999, "r": 286.36334, "b": 481.23544, "coord_origin": "TOPLEFT"}, "confidence": 0.9274735450744629, "cells": [{"id": 62, "text": "[10]", "bbox": {"l": 50.112, "t": 440.3424999999999, "r": 65.399307, "b": 448.3584599999999, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "Yelin He, X. Qi, Jiaquan Ye, Peng Gao, Yihao Chen, Bing-", "bbox": {"l": 67.693321, "t": 440.3424999999999, "r": 286.3587, "b": 448.3584599999999, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "cong Li, Xin Tang, and Rong Xiao.", "bbox": {"l": 70.030998, "t": 451.30151, "r": 202.74268, "b": 459.31747, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "Pingan-vcgroup\u2019s so-", "bbox": {"l": 209.00122, "t": 451.30151, "r": 286.36331, "b": 459.31747, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "lution for icdar 2021 competition on scientific table image", "bbox": {"l": 70.030998, "t": 462.2605, "r": 286.36334, "b": 470.27646, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "recognition to latex.", "bbox": {"l": 70.030998, "t": 473.21948, "r": 141.86981, "b": 481.23544, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "ArXiv", "bbox": {"l": 145.097, "t": 473.30017, "r": 166.01561, "b": 481.02924, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": ", abs/2105.01846, 2021. 2", "bbox": {"l": 166.015, "t": 473.21948, "r": 259.90216, "b": 481.23544, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[10] Yelin He, X. Qi, Jiaquan Ye, Peng Gao, Yihao Chen, Bingcong Li, Xin Tang, and Rong Xiao. Pingan-vcgroup's solution for icdar 2021 competition on scientific table image recognition to latex. ArXiv , abs/2105.01846, 2021. 2"}, {"label": "list_item", "id": 11, "page_no": 8, "cluster": {"id": 11, "label": "list_item", "bbox": {"l": 50.112, "t": 484.49048, "r": 286.36331, "b": 536.34238, "coord_origin": "TOPLEFT"}, "confidence": 0.9299950003623962, "cells": [{"id": 70, "text": "[11]", "bbox": {"l": 50.112, "t": 484.49048, "r": 66.033806, "b": 492.50644, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Jianying Hu, Ramanujan S Kashi, Daniel P Lopresti, and", "bbox": {"l": 68.423035, "t": 484.49048, "r": 286.35873, "b": 492.50644, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "Gordon Wilfong. Medium-independent table detection. In", "bbox": {"l": 70.030998, "t": 495.44946, "r": 286.36331, "b": 503.46542, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "Document Recognition and Retrieval VII", "bbox": {"l": 70.030998, "t": 506.48914, "r": 227.40926, "b": 514.2182, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": ", volume 3967,", "bbox": {"l": 227.40500000000003, "t": 506.40845, "r": 286.35913, "b": 514.4244100000001, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "pages 291-302. International Society for Optics and Photon-", "bbox": {"l": 70.031006, "t": 517.36743, "r": 286.36328, "b": 525.38339, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "ics, 1999. 2", "bbox": {"l": 70.031006, "t": 528.32642, "r": 112.36138000000001, "b": 536.34238, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[11] Jianying Hu, Ramanujan S Kashi, Daniel P Lopresti, and Gordon Wilfong. Medium-independent table detection. In Document Recognition and Retrieval VII , volume 3967, pages 291-302. International Society for Optics and Photonics, 1999. 2"}, {"label": "list_item", "id": 5, "page_no": 8, "cluster": {"id": 5, "label": "list_item", "bbox": {"l": 50.112007, "t": 539.59842, "r": 286.36334, "b": 591.44937, "coord_origin": "TOPLEFT"}, "confidence": 0.9394103288650513, "cells": [{"id": 77, "text": "[12]", "bbox": {"l": 50.112007, "t": 539.59842, "r": 65.466705, "b": 547.61438, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "Matthew Hurst. A constraint-based approach to table struc-", "bbox": {"l": 67.770828, "t": 539.59842, "r": 286.35873, "b": 547.61438, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "ture derivation. In", "bbox": {"l": 70.031006, "t": 550.55742, "r": 136.28374, "b": 558.57338, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "Proceedings of the Seventh International", "bbox": {"l": 138.811, "t": 550.63812, "r": 286.36206, "b": 558.36716, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Conference on Document Analysis and Recognition - Volume", "bbox": {"l": 70.031006, "t": 561.5971199999999, "r": 286.36334, "b": 569.32616, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "2", "bbox": {"l": 70.031006, "t": 572.55612, "r": 74.514206, "b": 580.28516, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": ", ICDAR \u201903, page 911, USA, 2003. IEEE Computer Soci-", "bbox": {"l": 74.514008, "t": 572.47542, "r": 286.36313, "b": 580.4913799999999, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "ety. 2", "bbox": {"l": 70.031006, "t": 583.4334100000001, "r": 90.357834, "b": 591.44937, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[12] Matthew Hurst. A constraint-based approach to table structure derivation. In Proceedings of the Seventh International Conference on Document Analysis and Recognition - Volume 2 , ICDAR '03, page 911, USA, 2003. IEEE Computer Society. 2"}, {"label": "list_item", "id": 13, "page_no": 8, "cluster": {"id": 13, "label": "list_item", "bbox": {"l": 50.112007, "t": 594.70541, "r": 286.36331, "b": 646.55737, "coord_origin": "TOPLEFT"}, "confidence": 0.9298838973045349, "cells": [{"id": 85, "text": "[13]", "bbox": {"l": 50.112007, "t": 594.70541, "r": 66.270439, "b": 602.72137, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Thotreingam Kasar, Philippine Barlas, Sebastien Adam,", "bbox": {"l": 68.695168, "t": 594.70541, "r": 286.35873, "b": 602.72137, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Cl\u00b4ement Chatelain, and Thierry Paquet. Learning to detect", "bbox": {"l": 70.031006, "t": 605.66441, "r": 286.3631, "b": 613.68037, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "tables in scanned document images using line information.", "bbox": {"l": 70.031006, "t": 616.62341, "r": 286.36331, "b": 624.63937, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "In", "bbox": {"l": 70.031006, "t": 627.58241, "r": 77.500015, "b": 635.5983699999999, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "2013 12th International Conference on Document Analy-", "bbox": {"l": 79.920006, "t": 627.6631199999999, "r": 286.3624, "b": 635.39215, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "sis and Recognition", "bbox": {"l": 70.031006, "t": 638.62212, "r": 140.67728, "b": 646.35115, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": ", pages 1185-1189. IEEE, 2013. 2", "bbox": {"l": 140.67599, "t": 638.54141, "r": 264.43921, "b": 646.55737, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[13] Thotreingam Kasar, Philippine Barlas, Sebastien Adam, Cl\u00b4ement Chatelain, and Thierry Paquet. Learning to detect tables in scanned document images using line information. In 2013 12th International Conference on Document Analysis and Recognition , pages 1185-1189. IEEE, 2013. 2"}, {"label": "list_item", "id": 17, "page_no": 8, "cluster": {"id": 17, "label": "list_item", "bbox": {"l": 50.111992, "t": 649.81342, "r": 286.36334, "b": 679.74638, "coord_origin": "TOPLEFT"}, "confidence": 0.9115257263183594, "cells": [{"id": 93, "text": "[14]", "bbox": {"l": 50.111992, "t": 649.81342, "r": 66.534035, "b": 657.82938, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "Pratik Kayal, Mrinal Anand, Harsh Desai, and Mayank", "bbox": {"l": 68.998329, "t": 649.81342, "r": 286.35873, "b": 657.82938, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "Singh.", "bbox": {"l": 70.030991, "t": 660.77142, "r": 93.200165, "b": 668.78738, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "Icdar 2021 competition on scientific table image", "bbox": {"l": 102.20243, "t": 660.77142, "r": 286.36334, "b": 668.78738, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "recognition to latex, 2021. 2", "bbox": {"l": 70.030991, "t": 671.73042, "r": 171.9969, "b": 679.74638, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[14] Pratik Kayal, Mrinal Anand, Harsh Desai, and Mayank Singh. Icdar 2021 competition on scientific table image recognition to latex, 2021. 2"}, {"label": "list_item", "id": 16, "page_no": 8, "cluster": {"id": 16, "label": "list_item", "bbox": {"l": 50.111992, "t": 683.00243, "r": 286.35931, "b": 712.936386, "coord_origin": "TOPLEFT"}, "confidence": 0.912230372428894, "cells": [{"id": 98, "text": "[15]", "bbox": {"l": 50.111992, "t": 683.00243, "r": 65.515968, "b": 691.01839, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "Harold W Kuhn. The hungarian method for the assignment", "bbox": {"l": 67.827499, "t": 683.00243, "r": 286.3587, "b": 691.01839, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "problem.", "bbox": {"l": 70.030991, "t": 693.9614260000001, "r": 102.15761, "b": 701.977386, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "Naval research logistics quarterly", "bbox": {"l": 107.54999, "t": 694.0421220000001, "r": 231.47461, "b": 701.771156, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": ", 2(1-2):83-97,", "bbox": {"l": 231.47598, "t": 693.9614260000001, "r": 286.35931, "b": 701.977386, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "1955. 6", "bbox": {"l": 70.030975, "t": 704.920425, "r": 97.916481, "b": 712.936386, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[15] Harold W Kuhn. The hungarian method for the assignment problem. Naval research logistics quarterly , 2(1-2):83-97, 1955. 6"}, {"label": "list_item", "id": 6, "page_no": 8, "cluster": {"id": 6, "label": "list_item", "bbox": {"l": 308.86197, "t": 75.88342000000011, "r": 545.11475, "b": 138.69335999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.9389600157737732, "cells": [{"id": 104, "text": "[16]", "bbox": {"l": 308.86197, "t": 75.88342000000011, "r": 324.74973, "b": 83.89940999999999, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "Girish Kulkarni, Visruth Premraj, Vicente Ordonez, Sag-", "bbox": {"l": 327.13382, "t": 75.88342000000011, "r": 545.1087, "b": 83.89940999999999, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "nik Dhar, Siming Li, Yejin Choi, Alexander C. Berg, and", "bbox": {"l": 328.78098, "t": 86.84142999999995, "r": 545.1134, "b": 94.85741999999993, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "Tamara L. Berg.", "bbox": {"l": 328.78098, "t": 97.80042000000003, "r": 390.96295, "b": 105.81641000000002, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "Babytalk:", "bbox": {"l": 400.27008, "t": 97.80042000000003, "r": 435.1404099999999, "b": 105.81641000000002, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "Understanding and generat-", "bbox": {"l": 441.71277, "t": 97.80042000000003, "r": 545.11328, "b": 105.81641000000002, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "ing simple image descriptions.", "bbox": {"l": 328.78098, "t": 108.75940000000003, "r": 440.80719, "b": 116.7753899999999, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "IEEE Transactions on Pat-", "bbox": {"l": 446.63498, "t": 108.84009000000003, "r": 545.11304, "b": 116.56914999999992, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "tern Analysis and Machine Intelligence", "bbox": {"l": 328.78098, "t": 119.79907000000003, "r": 471.13153, "b": 127.52814000000001, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": ", 35(12):2891-2903,", "bbox": {"l": 471.13300000000004, "t": 119.71838000000002, "r": 545.11475, "b": 127.73437999999999, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "2013. 4", "bbox": {"l": 328.78101, "t": 130.67737, "r": 356.6665, "b": 138.69335999999998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[16] Girish Kulkarni, Visruth Premraj, Vicente Ordonez, Sagnik Dhar, Siming Li, Yejin Choi, Alexander C. Berg, and Tamara L. Berg. Babytalk: Understanding and generating simple image descriptions. IEEE Transactions on Pattern Analysis and Machine Intelligence , 35(12):2891-2903, 2013. 4"}, {"label": "list_item", "id": 15, "page_no": 8, "cluster": {"id": 15, "label": "list_item", "bbox": {"l": 308.862, "t": 142.12334999999996, "r": 545.1134, "b": 172.05633999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.9253129959106445, "cells": [{"id": 115, "text": "[17]", "bbox": {"l": 308.862, "t": 142.12334999999996, "r": 325.24371, "b": 150.13933999999995, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "Minghao Li, Lei Cui, Shaohan Huang, Furu Wei, Ming", "bbox": {"l": 327.70197, "t": 142.12334999999996, "r": 545.10883, "b": 150.13933999999995, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "Zhou, and Zhoujun Li.", "bbox": {"l": 328.78101, "t": 153.08136000000002, "r": 414.44598, "b": 161.09735, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "Tablebank: A benchmark dataset", "bbox": {"l": 421.82532, "t": 153.08136000000002, "r": 545.1134, "b": 161.09735, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "for table detection and recognition, 2019. 2, 3", "bbox": {"l": 328.78101, "t": 164.04034000000001, "r": 493.62835999999993, "b": 172.05633999999998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[17] Minghao Li, Lei Cui, Shaohan Huang, Furu Wei, Ming Zhou, and Zhoujun Li. Tablebank: A benchmark dataset for table detection and recognition, 2019. 2, 3"}, {"label": "list_item", "id": 12, "page_no": 8, "cluster": {"id": 12, "label": "list_item", "bbox": {"l": 308.862, "t": 175.48632999999995, "r": 545.11353, "b": 260.21423000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9299732446670532, "cells": [{"id": 120, "text": "[18]", "bbox": {"l": 308.862, "t": 175.48632999999995, "r": 324.26599, "b": 183.50232000000005, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "Yiren Li, Zheng Huang, Junchi Yan, Yi Zhou, Fan Ye, and", "bbox": {"l": 326.57751, "t": 175.48632999999995, "r": 545.10876, "b": 183.50232000000005, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Xianhui Liu. Gfte: Graph-based financial table extraction.", "bbox": {"l": 328.78101, "t": 186.44530999999995, "r": 545.11334, "b": 194.46130000000005, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "In Alberto Del Bimbo, Rita Cucchiara, Stan Sclaroff, Gio-", "bbox": {"l": 328.78101, "t": 197.40430000000003, "r": 545.11346, "b": 205.42029000000002, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "vanni Maria Farinella, Tao Mei, Marco Bertini, Hugo Jair", "bbox": {"l": 328.78101, "t": 208.36328000000003, "r": 545.11353, "b": 216.37927000000002, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "Escalante, and Roberto Vezzani, editors,", "bbox": {"l": 328.78101, "t": 219.32227, "r": 479.26413, "b": 227.33826, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "Pattern Recogni-", "bbox": {"l": 483.11902, "t": 219.40295000000003, "r": 545.11273, "b": 227.13202, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "tion. ICPR International Workshops and Challenges", "bbox": {"l": 328.78101, "t": 230.36095999999998, "r": 519.39771, "b": 238.09002999999996, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": ", pages", "bbox": {"l": 519.401, "t": 230.28026999999997, "r": 545.10767, "b": 238.29625999999996, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "644-658, Cham, 2021. Springer International Publishing. 2,", "bbox": {"l": 328.78101, "t": 241.23925999999994, "r": 545.11328, "b": 249.25525000000005, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "3", "bbox": {"l": 328.78101, "t": 252.19824000000006, "r": 333.26422, "b": 260.21423000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[18] Yiren Li, Zheng Huang, Junchi Yan, Yi Zhou, Fan Ye, and Xianhui Liu. Gfte: Graph-based financial table extraction. In Alberto Del Bimbo, Rita Cucchiara, Stan Sclaroff, Giovanni Maria Farinella, Tao Mei, Marco Bertini, Hugo Jair Escalante, and Roberto Vezzani, editors, Pattern Recognition. ICPR International Workshops and Challenges , pages 644-658, Cham, 2021. Springer International Publishing. 2, 3"}, {"label": "list_item", "id": 8, "page_no": 8, "cluster": {"id": 8, "label": "list_item", "bbox": {"l": 308.862, "t": 263.64423, "r": 545.1142, "b": 326.45413, "coord_origin": "TOPLEFT"}, "confidence": 0.937321662902832, "cells": [{"id": 131, "text": "[19]", "bbox": {"l": 308.862, "t": 263.64423, "r": 324.26477, "b": 271.66022, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "Nikolaos Livathinos, Cesar Berrospi, Maksym Lysak, Vik-", "bbox": {"l": 326.57611, "t": 263.64423, "r": 545.10883, "b": 271.66022, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "tor Kuropiatnyk, Ahmed Nassar, Andre Carvalho, Michele", "bbox": {"l": 328.78101, "t": 274.60321, "r": 545.1134, "b": 282.61917000000005, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "Dolfi, Christoph Auer, Kasper Dinkla, and Peter Staar. Ro-", "bbox": {"l": 328.78101, "t": 285.56219, "r": 545.11328, "b": 293.57816, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "bust pdf document conversion using recurrent neural net-", "bbox": {"l": 328.78101, "t": 296.52118, "r": 545.11334, "b": 304.53714, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "works.", "bbox": {"l": 328.78101, "t": 307.47919, "r": 352.84683, "b": 315.49515, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "Proceedings of the AAAI Conference on Artificial", "bbox": {"l": 360.23599, "t": 307.55988, "r": 545.1142, "b": 315.28894, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "Intelligence", "bbox": {"l": 328.78101, "t": 318.51886, "r": 371.02173, "b": 326.24792, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": ", 35(17):15137-15145, May 2021. 1", "bbox": {"l": 371.021, "t": 318.43817, "r": 502.26227, "b": 326.45413, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[19] Nikolaos Livathinos, Cesar Berrospi, Maksym Lysak, Viktor Kuropiatnyk, Ahmed Nassar, Andre Carvalho, Michele Dolfi, Christoph Auer, Kasper Dinkla, and Peter Staar. Robust pdf document conversion using recurrent neural networks. Proceedings of the AAAI Conference on Artificial Intelligence , 35(17):15137-15145, May 2021. 1"}, {"label": "list_item", "id": 18, "page_no": 8, "cluster": {"id": 18, "label": "list_item", "bbox": {"l": 308.862, "t": 329.88419, "r": 545.11609, "b": 370.77713, "coord_origin": "TOPLEFT"}, "confidence": 0.9027292728424072, "cells": [{"id": 140, "text": "[20]", "bbox": {"l": 308.862, "t": 329.88419, "r": 323.82672, "b": 337.90015, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "Rujiao Long, Wen Wang, Nan Xue, Feiyu Gao, Zhibo Yang,", "bbox": {"l": 326.07233, "t": 329.88419, "r": 545.10876, "b": 337.90015, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "Yongpan Wang, and Gui-Song Xia. Parsing table structures", "bbox": {"l": 328.78101, "t": 340.8432, "r": 545.11346, "b": 348.85916, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "in the wild. In", "bbox": {"l": 328.78101, "t": 351.80219000000005, "r": 382.7767, "b": 359.81815000000006, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "Proceedings of the IEEE/CVF International", "bbox": {"l": 385.54102, "t": 351.88287, "r": 545.11609, "b": 359.61194, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "Conference on Computer Vision", "bbox": {"l": 328.78101, "t": 362.84186, "r": 443.59579, "b": 370.57092, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": ", pages 944-952, 2021. 2", "bbox": {"l": 443.59399, "t": 362.76117, "r": 534.48645, "b": 370.77713, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[20] Rujiao Long, Wen Wang, Nan Xue, Feiyu Gao, Zhibo Yang, Yongpan Wang, and Gui-Song Xia. Parsing table structures in the wild. In Proceedings of the IEEE/CVF International Conference on Computer Vision , pages 944-952, 2021. 2"}, {"label": "list_item", "id": 21, "page_no": 8, "cluster": {"id": 21, "label": "list_item", "bbox": {"l": 308.862, "t": 374.20618, "r": 545.11346, "b": 437.01706, "coord_origin": "TOPLEFT"}, "confidence": 0.882714569568634, "cells": [{"id": 147, "text": "[21]", "bbox": {"l": 308.862, "t": 374.20618, "r": 324.60281, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "Shubham", "bbox": {"l": 326.96487, "t": 374.20618, "r": 362.6604, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "Singh", "bbox": {"l": 368.69479, "t": 374.20618, "r": 389.6134, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "Paliwal,", "bbox": {"l": 395.6478, "t": 374.20618, "r": 424.56445, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "D", "bbox": {"l": 431.5492899999999, "t": 374.20618, "r": 438.0230399999999, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "Vishwanath,", "bbox": {"l": 444.05743, "t": 374.20618, "r": 488.5038799999999, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "Rohit", "bbox": {"l": 495.47974, "t": 374.20618, "r": 515.41205, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "Rahul,", "bbox": {"l": 521.44641, "t": 374.20618, "r": 545.10876, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "Monika Sharma, and Lovekesh Vig. Tablenet: Deep learn-", "bbox": {"l": 328.78101, "t": 385.16516, "r": 545.1134, "b": 393.18112, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "ing model for end-to-end table detection and tabular data ex-", "bbox": {"l": 328.78101, "t": 396.12415, "r": 545.11346, "b": 404.14011, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "traction from scanned document images.", "bbox": {"l": 328.78101, "t": 407.08313, "r": 478.00881999999996, "b": 415.09909, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "In", "bbox": {"l": 484.0701, "t": 407.08313, "r": 491.53912, "b": 415.09909, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "2019 Interna-", "bbox": {"l": 494.668, "t": 407.16382, "r": 545.11298, "b": 414.89288, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "tional Conference on Document Analysis and Recognition", "bbox": {"l": 328.78101, "t": 418.12280000000004, "r": 545.11334, "b": 425.85187, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "(ICDAR)", "bbox": {"l": 328.78101, "t": 429.08179, "r": 360.83591, "b": 436.8108500000001, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": ", pages 128-133. IEEE, 2019. 1", "bbox": {"l": 360.836, "t": 429.0011, "r": 475.63287, "b": 437.01706, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[21] Shubham Singh Paliwal, D Vishwanath, Rohit Rahul, Monika Sharma, and Lovekesh Vig. Tablenet: Deep learning model for end-to-end table detection and tabular data extraction from scanned document images. In 2019 International Conference on Document Analysis and Recognition (ICDAR) , pages 128-133. IEEE, 2019. 1"}, {"label": "list_item", "id": 20, "page_no": 8, "cluster": {"id": 20, "label": "list_item", "bbox": {"l": 308.862, "t": 440.44611, "r": 545.11475, "b": 558.05096, "coord_origin": "TOPLEFT"}, "confidence": 0.8896440863609314, "cells": [{"id": 163, "text": "[22]", "bbox": {"l": 308.862, "t": 440.44611, "r": 324.57407, "b": 448.46207, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "Adam Paszke, Sam Gross, Francisco Massa, Adam Lerer,", "bbox": {"l": 326.93179, "t": 440.44611, "r": 545.1087, "b": 448.46207, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "James Bradbury, Gregory Chanan, Trevor Killeen, Zeming", "bbox": {"l": 328.78101, "t": 451.40509, "r": 545.11346, "b": 459.42105, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "Lin, Natalia Gimelshein, Luca Antiga, Alban Desmaison,", "bbox": {"l": 328.78101, "t": 462.36407, "r": 545.11328, "b": 470.38004, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "Andreas Kopf, Edward Yang, Zachary DeVito, Martin Rai-", "bbox": {"l": 328.78101, "t": 473.32306, "r": 545.11328, "b": 481.33902, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "son, Alykhan Tejani, Sasank Chilamkurthy, Benoit Steiner,", "bbox": {"l": 328.78101, "t": 484.28204, "r": 545.11328, "b": 492.298, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "Lu Fang, Junjie Bai, and Soumith Chintala. Pytorch: An im-", "bbox": {"l": 328.78101, "t": 495.24103, "r": 545.1134, "b": 503.25699, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "perative style, high-performance deep learning library. In H.", "bbox": {"l": 328.78101, "t": 506.20001, "r": 545.1134, "b": 514.21597, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "Wallach, H. Larochelle, A. Beygelzimer, F. d'Alch\u00b4e-Buc, E.", "bbox": {"l": 328.78101, "t": 517.159, "r": 545.1098, "b": 525.17496, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "Fox, and R. Garnett, editors,", "bbox": {"l": 328.78101, "t": 528.117, "r": 434.56659, "b": 536.13297, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "Advances in Neural Informa-", "bbox": {"l": 437.86401, "t": 528.19769, "r": 545.11115, "b": 535.9267600000001, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "tion Processing Systems 32", "bbox": {"l": 328.78101, "t": 539.15671, "r": 425.73471, "b": 546.8857399999999, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": ", pages 8024-8035. Curran Asso-", "bbox": {"l": 425.73602, "t": 539.076, "r": 545.11475, "b": 547.09196, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "ciates, Inc., 2019. 6", "bbox": {"l": 328.78101, "t": 550.035, "r": 399.74109, "b": 558.05096, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[22] Adam Paszke, Sam Gross, Francisco Massa, Adam Lerer, James Bradbury, Gregory Chanan, Trevor Killeen, Zeming Lin, Natalia Gimelshein, Luca Antiga, Alban Desmaison, Andreas Kopf, Edward Yang, Zachary DeVito, Martin Raison, Alykhan Tejani, Sasank Chilamkurthy, Benoit Steiner, Lu Fang, Junjie Bai, and Soumith Chintala. Pytorch: An imperative style, high-performance deep learning library. In H. Wallach, H. Larochelle, A. Beygelzimer, F. d'Alch\u00b4e-Buc, E. Fox, and R. Garnett, editors, Advances in Neural Information Processing Systems 32 , pages 8024-8035. Curran Associates, Inc., 2019. 6"}, {"label": "list_item", "id": 19, "page_no": 8, "cluster": {"id": 19, "label": "list_item", "bbox": {"l": 308.862, "t": 561.481, "r": 545.1134, "b": 624.29097, "coord_origin": "TOPLEFT"}, "confidence": 0.9025435447692871, "cells": [{"id": 177, "text": "[23]", "bbox": {"l": 308.862, "t": 561.481, "r": 324.50351, "b": 569.49696, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "Devashish Prasad, Ayan Gadpal, Kshitij Kapadni, Manish", "bbox": {"l": 326.85068, "t": 561.481, "r": 545.10876, "b": 569.49696, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "Visave, and Kavita Sultanpure. Cascadetabnet: An approach", "bbox": {"l": 328.78101, "t": 572.44, "r": 545.1134, "b": 580.45596, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "for end to end table detection and structure recognition from", "bbox": {"l": 328.78101, "t": 583.399, "r": 545.11334, "b": 591.4149600000001, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "image-based documents. In", "bbox": {"l": 328.78101, "t": 594.358, "r": 431.61667, "b": 602.37396, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "Proceedings of the IEEE/CVF", "bbox": {"l": 434.69101000000006, "t": 594.4387099999999, "r": 545.11224, "b": 602.16774, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "Conference on Computer Vision and Pattern Recognition", "bbox": {"l": 328.78101, "t": 605.39671, "r": 545.1134, "b": 613.12575, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "Workshops", "bbox": {"l": 328.78101, "t": 616.35571, "r": 367.8028, "b": 624.08475, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": ", pages 572-573, 2020. 1", "bbox": {"l": 367.802, "t": 616.2750100000001, "r": 458.69446000000005, "b": 624.29097, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[23] Devashish Prasad, Ayan Gadpal, Kshitij Kapadni, Manish Visave, and Kavita Sultanpure. Cascadetabnet: An approach for end to end table detection and structure recognition from image-based documents. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition Workshops , pages 572-573, 2020. 1"}, {"label": "list_item", "id": 23, "page_no": 8, "cluster": {"id": 23, "label": "list_item", "bbox": {"l": 308.862, "t": 627.72101, "r": 545.11621, "b": 668.61398, "coord_origin": "TOPLEFT"}, "confidence": 0.8777532577514648, "cells": [{"id": 186, "text": "[24]", "bbox": {"l": 308.862, "t": 627.72101, "r": 324.69476, "b": 635.73697, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "Shah Rukh Qasim, Hassan Mahmood, and Faisal Shafait.", "bbox": {"l": 327.07065, "t": 627.72101, "r": 545.1087, "b": 635.73697, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": "Rethinking table recognition using graph neural networks.", "bbox": {"l": 328.78101, "t": 638.68001, "r": 545.11328, "b": 646.69597, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "In", "bbox": {"l": 328.78101, "t": 649.63901, "r": 336.25003, "b": 657.65497, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "2019 International Conference on Document Analysis and", "bbox": {"l": 338.10001, "t": 649.71971, "r": 545.11621, "b": 657.44875, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "Recognition (ICDAR)", "bbox": {"l": 328.78101, "t": 660.67871, "r": 406.32245, "b": 668.40775, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": ", pages 142-147. IEEE, 2019. 3", "bbox": {"l": 406.32202, "t": 660.5980099999999, "r": 521.1189, "b": 668.61398, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[24] Shah Rukh Qasim, Hassan Mahmood, and Faisal Shafait. Rethinking table recognition using graph neural networks. In 2019 International Conference on Document Analysis and Recognition (ICDAR) , pages 142-147. IEEE, 2019. 3"}, {"label": "list_item", "id": 24, "page_no": 8, "cluster": {"id": 24, "label": "list_item", "bbox": {"l": 308.86203, "t": 672.04301, "r": 545.1134, "b": 712.935974, "coord_origin": "TOPLEFT"}, "confidence": 0.8654531240463257, "cells": [{"id": 193, "text": "[25]", "bbox": {"l": 308.86203, "t": 672.04301, "r": 324.71329, "b": 680.05898, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "Hamid Rezatofighi, Nathan Tsoi, JunYoung Gwak, Amir", "bbox": {"l": 327.09195, "t": 672.04301, "r": 545.10876, "b": 680.05898, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "Sadeghian, Ian Reid, and Silvio Savarese.", "bbox": {"l": 328.78104, "t": 683.0020099999999, "r": 482.81488, "b": 691.01797, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "Generalized in-", "bbox": {"l": 488.75064, "t": 683.0020099999999, "r": 545.1134, "b": 691.01797, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "tersection over union: A metric and a loss for bounding box", "bbox": {"l": 328.78104, "t": 693.961014, "r": 545.11334, "b": 701.976974, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "regression. In", "bbox": {"l": 328.78104, "t": 704.920013, "r": 379.1543, "b": 712.935974, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "Proceedings of the IEEE/CVF Conference on", "bbox": {"l": 381.61603, "t": 705.00071, "r": 545.10938, "b": 712.729744, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[25] Hamid Rezatofighi, Nathan Tsoi, JunYoung Gwak, Amir Sadeghian, Ian Reid, and Silvio Savarese. Generalized intersection over union: A metric and a loss for bounding box regression. In Proceedings of the IEEE/CVF Conference on"}], "headers": [{"label": "page_footer", "id": 22, "page_no": 8, "cluster": {"id": 22, "label": "page_footer", "bbox": {"l": 295.12103, "t": 734.1325870000001, "r": 300.10233, "b": 743.0391500000001, "coord_origin": "TOPLEFT"}, "confidence": 0.8797808885574341, "cells": [{"id": 200, "text": "9", "bbox": {"l": 295.12103, "t": 734.1325870000001, "r": 300.10233, "b": 743.0391500000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "9"}]}}, {"page_no": 9, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "Computer Vision and Pattern Recognition", "bbox": {"l": 70.030998, "t": 75.96447999999998, "r": 223.58061, "b": 83.69353999999998, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": ", pages 658-666,", "bbox": {"l": 223.57901, "t": 75.88378999999998, "r": 286.36176, "b": 83.89977999999996, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "2019. 6", "bbox": {"l": 70.031006, "t": 86.84276999999997, "r": 97.916512, "b": 94.85875999999996, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "[26]", "bbox": {"l": 50.112007, "t": 98.16576999999995, "r": 65.534088, "b": 106.18176000000005, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Sebastian Schreiber, Stefan Agne, Ivo Wolf, Andreas Den-", "bbox": {"l": 67.84832, "t": 98.16576999999995, "r": 286.35867, "b": 106.18176000000005, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "gel, and Sheraz Ahmed. Deepdesrt: Deep learning for detec-", "bbox": {"l": 70.031006, "t": 109.12476000000004, "r": 286.36331, "b": 117.14075000000003, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "tion and structure recognition of tables in document images.", "bbox": {"l": 70.031006, "t": 120.08374000000003, "r": 286.36334, "b": 128.0997299999999, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "In", "bbox": {"l": 70.031006, "t": 131.04272000000003, "r": 77.500015, "b": 139.05872, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "2017 14th IAPR International Conference on Document", "bbox": {"l": 80.560005, "t": 131.12341000000004, "r": 286.36578, "b": 138.85248, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Analysis and Recognition (ICDAR)", "bbox": {"l": 70.031006, "t": 142.0824, "r": 195.22885, "b": 149.81146, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": ", volume 01, pages 1162-", "bbox": {"l": 195.231, "t": 142.00171, "r": 286.36548, "b": 150.0177, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "1167, 2017. 1", "bbox": {"l": 70.031006, "t": 152.96069, "r": 120.33251, "b": 160.97668, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "[27]", "bbox": {"l": 50.112007, "t": 164.28467, "r": 65.534088, "b": 172.30066, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Sebastian Schreiber, Stefan Agne, Ivo Wolf, Andreas Den-", "bbox": {"l": 67.84832, "t": 164.28467, "r": 286.35867, "b": 172.30066, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "gel, and Sheraz Ahmed. Deepdesrt: Deep learning for de-", "bbox": {"l": 70.031006, "t": 175.24365, "r": 286.36337, "b": 183.25964, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "tection and structure recognition of tables in document im-", "bbox": {"l": 70.031006, "t": 186.20263999999997, "r": 286.36334, "b": 194.21862999999996, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "ages. In", "bbox": {"l": 70.031006, "t": 197.16161999999997, "r": 101.33271, "b": 205.17760999999996, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "2017 14th IAPR international conference on doc-", "bbox": {"l": 104.33101, "t": 197.24230999999997, "r": 286.35791, "b": 204.97136999999998, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "ument analysis and recognition (ICDAR)", "bbox": {"l": 70.031006, "t": 208.20032000000003, "r": 220.48719999999997, "b": 215.92938000000004, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": ", volume 1, pages", "bbox": {"l": 220.48401000000004, "t": 208.11963000000003, "r": 286.36017, "b": 216.13562000000002, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "1162-1167. IEEE, 2017. 3", "bbox": {"l": 70.031006, "t": 219.07861000000003, "r": 166.65294, "b": 227.0946, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "[28]", "bbox": {"l": 50.112007, "t": 230.40259000000003, "r": 65.650383, "b": 238.41858000000002, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "Faisal Shafait and Ray Smith. Table detection in heteroge-", "bbox": {"l": 67.982063, "t": 230.40259000000003, "r": 286.3587, "b": 238.41858000000002, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "neous documents. In", "bbox": {"l": 70.031006, "t": 241.36157000000003, "r": 147.16895, "b": 249.37756000000002, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "Proceedings of the 9th IAPR Interna-", "bbox": {"l": 149.93301, "t": 241.44226000000003, "r": 286.36578, "b": 249.17133, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "tional Workshop on Document Analysis Systems", "bbox": {"l": 70.031013, "t": 252.40125, "r": 244.6875, "b": 260.13031, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": ", pages 65-", "bbox": {"l": 244.69101, "t": 252.32056, "r": 286.35791, "b": 260.33655, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "72, 2010. 2", "bbox": {"l": 70.031006, "t": 263.27954, "r": 111.36611, "b": 271.29553, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "[29]", "bbox": {"l": 50.112007, "t": 274.60357999999997, "r": 66.023834, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Shoaib", "bbox": {"l": 68.411568, "t": 274.60357999999997, "r": 94.944016, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Ahmed", "bbox": {"l": 100.8708, "t": 274.60357999999997, "r": 127.26788000000002, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Siddiqui,", "bbox": {"l": 133.19467, "t": 274.60357999999997, "r": 165.83237, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Imran", "bbox": {"l": 172.68269, "t": 274.60357999999997, "r": 194.09445, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "Ali", "bbox": {"l": 200.02124, "t": 274.60357999999997, "r": 211.4803, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Fateh,", "bbox": {"l": 217.40708999999998, "t": 274.60357999999997, "r": 239.43755, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "Syed", "bbox": {"l": 246.28787000000003, "t": 274.60357999999997, "r": 264.22067, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Tah-", "bbox": {"l": 270.14746, "t": 274.60357999999997, "r": 286.35873, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "seen Raza Rizvi, Andreas Dengel, and Sheraz Ahmed.", "bbox": {"l": 70.031006, "t": 285.56256, "r": 286.36331, "b": 293.57852, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "Deeptabstr: Deep learning based table structure recognition.", "bbox": {"l": 70.031006, "t": 296.52155, "r": 286.36331, "b": 304.53751, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "In", "bbox": {"l": 70.031006, "t": 307.48053, "r": 77.500015, "b": 315.49649, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "2019 International Conference on Document Analysis and", "bbox": {"l": 79.350006, "t": 307.56122, "r": 286.36627, "b": 315.29028, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Recognition (ICDAR)", "bbox": {"l": 70.031006, "t": 318.51923, "r": 147.57243, "b": 326.24829, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": ", pages 1403-1409. IEEE, 2019. 3", "bbox": {"l": 147.57201, "t": 318.43854, "r": 271.33521, "b": 326.4545, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "[30]", "bbox": {"l": 50.112007, "t": 329.76254, "r": 65.366135, "b": 337.7785, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "Peter W J Staar, Michele Dolfi, Christoph Auer, and Costas", "bbox": {"l": 67.655159, "t": 329.76254, "r": 286.3587, "b": 337.7785, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Bekas. Corpus conversion service: A machine learning plat-", "bbox": {"l": 70.031006, "t": 340.72156000000007, "r": 286.36334, "b": 348.7375200000001, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "form to ingest documents at scale.", "bbox": {"l": 70.031006, "t": 351.68054, "r": 198.82439, "b": 359.6965, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "In", "bbox": {"l": 206.06027, "t": 351.68054, "r": 213.52928, "b": 359.6965, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Proceedings of the", "bbox": {"l": 217.02101, "t": 351.76123, "r": 286.35815, "b": 359.4903, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "24th ACM SIGKDD", "bbox": {"l": 70.031006, "t": 362.72021, "r": 143.08028, "b": 370.44928, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": ", KDD \u201918, pages 774-782, New York,", "bbox": {"l": 143.078, "t": 362.63953000000004, "r": 286.36111, "b": 370.65549000000004, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "NY, USA, 2018. ACM. 1", "bbox": {"l": 70.031006, "t": 373.59851, "r": 161.15652, "b": 381.61447, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "[31]", "bbox": {"l": 50.112007, "t": 384.92252, "r": 65.140724, "b": 392.93848, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Ashish Vaswani, Noam Shazeer, Niki Parmar, Jakob Uszko-", "bbox": {"l": 67.395927, "t": 384.92252, "r": 286.35876, "b": 392.93848, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "reit, Llion Jones, Aidan N Gomez, \u0141 ukasz Kaiser, and Il-", "bbox": {"l": 70.031006, "t": 395.88153, "r": 286.36337, "b": 403.89749, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "lia Polosukhin.", "bbox": {"l": 70.031006, "t": 406.84052, "r": 125.47024999999998, "b": 414.85648, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Attention is all you need.", "bbox": {"l": 133.90764, "t": 406.84052, "r": 230.83444, "b": 414.85648, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "In I. Guyon,", "bbox": {"l": 239.27182, "t": 406.84052, "r": 286.36334, "b": 414.85648, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "U.", "bbox": {"l": 70.031006, "t": 417.7995, "r": 78.958366, "b": 425.81546, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "V. Luxburg, S. Bengio, H. Wallach, R. Fergus, S. Vish-", "bbox": {"l": 81.254494, "t": 417.7995, "r": 286.36334, "b": 425.81546, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "wanathan, and R. Garnett, editors,", "bbox": {"l": 70.031006, "t": 428.75751, "r": 196.7621, "b": 436.7734699999999, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "Advances in Neural In-", "bbox": {"l": 200.20201, "t": 428.8381999999999, "r": 286.36017, "b": 436.56726, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "formation Processing Systems 30", "bbox": {"l": 70.031006, "t": 439.79717999999997, "r": 189.19447, "b": 447.52624999999995, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": ", pages 5998-6008. Curran", "bbox": {"l": 189.19501, "t": 439.71648999999996, "r": 286.36389, "b": 447.73245, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "Associates, Inc., 2017. 5", "bbox": {"l": 70.031006, "t": 450.67548, "r": 158.9239, "b": 458.69144, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "[32]", "bbox": {"l": 50.112007, "t": 461.99948, "r": 65.910469, "b": 470.01544, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "Oriol Vinyals, Alexander Toshev, Samy Bengio, and Du-", "bbox": {"l": 68.281181, "t": 461.99948, "r": 286.35873, "b": 470.01544, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "mitru Erhan.", "bbox": {"l": 70.031006, "t": 472.9585, "r": 116.27969999999999, "b": 480.97446, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "Show and tell: A neural image caption gen-", "bbox": {"l": 122.48445, "t": 472.9585, "r": 286.36334, "b": 480.97446, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "erator. In", "bbox": {"l": 70.031006, "t": 483.91748, "r": 103.30532, "b": 491.93344, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "Proceedings of the IEEE Conference on Computer", "bbox": {"l": 105.51601, "t": 483.99817, "r": 286.35931, "b": 491.72723, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Vision and Pattern Recognition (CVPR)", "bbox": {"l": 70.031006, "t": 494.95715, "r": 212.51607, "b": 502.68622, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": ", June 2015. 2", "bbox": {"l": 212.51401, "t": 494.87646, "r": 263.55975, "b": 502.89243, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "[33]", "bbox": {"l": 50.112015, "t": 506.20047, "r": 65.682777, "b": 514.21643, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "Wenyuan Xue, Qingyong Li, and Dacheng Tao.", "bbox": {"l": 68.019325, "t": 506.20047, "r": 247.37280000000004, "b": 514.21643, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "Res2tim:", "bbox": {"l": 253.97208000000003, "t": 506.20047, "r": 286.3587, "b": 514.21643, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "reconstruct syntactic structures from table images. In", "bbox": {"l": 70.031013, "t": 517.15948, "r": 265.62408, "b": 525.17545, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "2019", "bbox": {"l": 268.42902, "t": 517.24017, "r": 286.36182, "b": 524.96924, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "International Conference on Document Analysis and Recog-", "bbox": {"l": 70.031021, "t": 528.19916, "r": 286.36337, "b": 535.92822, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "nition (ICDAR)", "bbox": {"l": 70.031021, "t": 539.15718, "r": 125.25507999999999, "b": 546.88622, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": ", pages 749-755. IEEE, 2019. 3", "bbox": {"l": 125.25402, "t": 539.07648, "r": 240.05083, "b": 547.09244, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "[34]", "bbox": {"l": 50.112022, "t": 550.40048, "r": 66.037048, "b": 558.41644, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "Wenyuan Xue, Baosheng Yu, Wen Wang, Dacheng Tao,", "bbox": {"l": 68.426765, "t": 550.40048, "r": 286.3587, "b": 558.41644, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "and Qingyong Li.", "bbox": {"l": 70.031021, "t": 561.35948, "r": 137.08176, "b": 569.37544, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "Tgrnet:", "bbox": {"l": 145.9854, "t": 561.35948, "r": 172.38248, "b": 569.37544, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "A table graph reconstruction", "bbox": {"l": 178.7038, "t": 561.35948, "r": 286.36337, "b": 569.37544, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "network for table structure recognition.", "bbox": {"l": 70.031021, "t": 572.31848, "r": 221.00723, "b": 580.33444, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "arXiv preprint", "bbox": {"l": 232.54300999999998, "t": 572.39919, "r": 286.35938, "b": 580.12822, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "arXiv:2106.10598", "bbox": {"l": 70.031021, "t": 583.35818, "r": 135.53058, "b": 591.08722, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": ", 2021. 3", "bbox": {"l": 135.53003, "t": 583.27748, "r": 167.89876, "b": 591.29344, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "[35]", "bbox": {"l": 50.11203, "t": 594.60149, "r": 65.23661, "b": 602.61745, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "Quanzeng You, Hailin Jin, Zhaowen Wang, Chen Fang, and", "bbox": {"l": 67.506203, "t": 594.60149, "r": 286.3587, "b": 602.61745, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Jiebo Luo.", "bbox": {"l": 70.031029, "t": 605.56049, "r": 109.1066, "b": 613.57645, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "Image captioning with semantic attention.", "bbox": {"l": 116.22592, "t": 605.56049, "r": 271.76605, "b": 613.57645, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "In", "bbox": {"l": 278.89435, "t": 605.56049, "r": 286.36337, "b": 613.57645, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "Proceedings of the IEEE conference on computer vision and", "bbox": {"l": 70.031029, "t": 616.60019, "r": 286.3634, "b": 624.32922, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "pattern recognition", "bbox": {"l": 70.031029, "t": 627.55919, "r": 139.09921, "b": 635.28822, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": ", pages 4651-4659, 2016. 4", "bbox": {"l": 139.09802, "t": 627.47849, "r": 238.95683, "b": 635.49445, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "[36]", "bbox": {"l": 50.112022, "t": 638.80249, "r": 65.203552, "b": 646.81845, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "Xinyi Zheng, Doug Burdick, Lucian Popa, Peter Zhong, and", "bbox": {"l": 67.468193, "t": 638.80249, "r": 286.35873, "b": 646.81845, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "Nancy Xin Ru Wang. Global table extractor (gte): A frame-", "bbox": {"l": 70.031021, "t": 649.7605, "r": 286.36337, "b": 657.77646, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "work for joint table identification and cell structure recogni-", "bbox": {"l": 70.031021, "t": 660.7195, "r": 286.36334, "b": 668.73547, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "tion using visual context.", "bbox": {"l": 70.031021, "t": 671.6785, "r": 158.45766, "b": 679.69447, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "Winter Conference for Applications", "bbox": {"l": 160.52802, "t": 671.7592, "r": 286.36249, "b": 679.48824, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "in Computer Vision (WACV)", "bbox": {"l": 70.031013, "t": 682.7182, "r": 171.42305, "b": 690.44724, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": ", 2021. 2, 3", "bbox": {"l": 171.42201, "t": 682.6375, "r": 212.75713, "b": 690.65347, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "[37]", "bbox": {"l": 50.112015, "t": 693.961502, "r": 66.506706, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "Xu", "bbox": {"l": 68.966896, "t": 693.961502, "r": 80.992294, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "Zhong,", "bbox": {"l": 89.062057, "t": 693.961502, "r": 114.71492999999998, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "Elaheh", "bbox": {"l": 124.24621000000002, "t": 693.961502, "r": 149.1459, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "ShafieiBavani,", "bbox": {"l": 157.22462, "t": 693.961502, "r": 209.37321, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "and", "bbox": {"l": 218.9045, "t": 693.961502, "r": 231.85196999999997, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "Antonio", "bbox": {"l": 239.93069, "t": 693.961502, "r": 269.32254, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "Ji-", "bbox": {"l": 277.3923, "t": 693.961502, "r": 286.3587, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "meno Yepes. Image-based table recognition: Data, model,", "bbox": {"l": 70.031013, "t": 704.920502, "r": 286.36334, "b": 712.936462, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "and evaluation. In Andrea Vedaldi, Horst Bischof, Thomas", "bbox": {"l": 328.78101, "t": 75.88347999999996, "r": 545.11346, "b": 83.89948000000015, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "Brox, and Jan-Michael Frahm, editors,", "bbox": {"l": 328.78101, "t": 86.84149000000002, "r": 472.30618, "b": 94.85748000000001, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "Computer Vision -", "bbox": {"l": 475.88501, "t": 86.92218000000003, "r": 545.11456, "b": 94.65125, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "ECCV 2020", "bbox": {"l": 328.78101, "t": 97.88116000000002, "r": 371.92734, "b": 105.61023, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": ", pages 564-580, Cham, 2020. Springer Interna-", "bbox": {"l": 371.92599, "t": 97.80048, "r": 545.11206, "b": 105.81646999999987, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "tional Publishing. 2, 3, 7", "bbox": {"l": 328.78101, "t": 108.75945999999999, "r": 417.70087, "b": 116.77544999999998, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "[38]", "bbox": {"l": 308.862, "t": 120.71447999999998, "r": 324.33197, "b": 128.73046999999997, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Xu Zhong, Jianbin Tang, and Antonio Jimeno Yepes. Pub-", "bbox": {"l": 326.65341, "t": 120.71447999999998, "r": 545.10876, "b": 128.73046999999997, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "laynet: Largest dataset ever for document layout analysis. In", "bbox": {"l": 328.78101, "t": 131.67345999999998, "r": 545.11334, "b": 139.68944999999997, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "2019 International Conference on Document Analysis and", "bbox": {"l": 328.78101, "t": 142.71312999999998, "r": 545.11328, "b": 150.44219999999996, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "Recognition (ICDAR)", "bbox": {"l": 328.78101, "t": 153.67211999999995, "r": 406.32245, "b": 161.40117999999995, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": ", pages 1015-1022, 2019. 1", "bbox": {"l": 406.32202, "t": 153.59142999999995, "r": 506.18085, "b": 161.60742000000005, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "10", "bbox": {"l": 292.63, "t": 734.1329920000001, "r": 302.59259, "b": 743.039555, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 15, "label": "text", "bbox": {"l": 70.030998, "t": 75.88378999999998, "r": 286.36176, "b": 94.85875999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.6886764168739319, "cells": [{"id": 0, "text": "Computer Vision and Pattern Recognition", "bbox": {"l": 70.030998, "t": 75.96447999999998, "r": 223.58061, "b": 83.69353999999998, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": ", pages 658-666,", "bbox": {"l": 223.57901, "t": 75.88378999999998, "r": 286.36176, "b": 83.89977999999996, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "2019. 6", "bbox": {"l": 70.031006, "t": 86.84276999999997, "r": 97.916512, "b": 94.85875999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "list_item", "bbox": {"l": 50.112007, "t": 98.16576999999995, "r": 286.36578, "b": 160.97668, "coord_origin": "TOPLEFT"}, "confidence": 0.7723011374473572, "cells": [{"id": 3, "text": "[26]", "bbox": {"l": 50.112007, "t": 98.16576999999995, "r": 65.534088, "b": 106.18176000000005, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Sebastian Schreiber, Stefan Agne, Ivo Wolf, Andreas Den-", "bbox": {"l": 67.84832, "t": 98.16576999999995, "r": 286.35867, "b": 106.18176000000005, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "gel, and Sheraz Ahmed. Deepdesrt: Deep learning for detec-", "bbox": {"l": 70.031006, "t": 109.12476000000004, "r": 286.36331, "b": 117.14075000000003, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "tion and structure recognition of tables in document images.", "bbox": {"l": 70.031006, "t": 120.08374000000003, "r": 286.36334, "b": 128.0997299999999, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "In", "bbox": {"l": 70.031006, "t": 131.04272000000003, "r": 77.500015, "b": 139.05872, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "2017 14th IAPR International Conference on Document", "bbox": {"l": 80.560005, "t": 131.12341000000004, "r": 286.36578, "b": 138.85248, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Analysis and Recognition (ICDAR)", "bbox": {"l": 70.031006, "t": 142.0824, "r": 195.22885, "b": 149.81146, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": ", volume 01, pages 1162-", "bbox": {"l": 195.231, "t": 142.00171, "r": 286.36548, "b": 150.0177, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "1167, 2017. 1", "bbox": {"l": 70.031006, "t": 152.96069, "r": 120.33251, "b": 160.97668, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "list_item", "bbox": {"l": 50.112007, "t": 164.28467, "r": 286.36337, "b": 227.0946, "coord_origin": "TOPLEFT"}, "confidence": 0.8580600619316101, "cells": [{"id": 12, "text": "[27]", "bbox": {"l": 50.112007, "t": 164.28467, "r": 65.534088, "b": 172.30066, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Sebastian Schreiber, Stefan Agne, Ivo Wolf, Andreas Den-", "bbox": {"l": 67.84832, "t": 164.28467, "r": 286.35867, "b": 172.30066, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "gel, and Sheraz Ahmed. Deepdesrt: Deep learning for de-", "bbox": {"l": 70.031006, "t": 175.24365, "r": 286.36337, "b": 183.25964, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "tection and structure recognition of tables in document im-", "bbox": {"l": 70.031006, "t": 186.20263999999997, "r": 286.36334, "b": 194.21862999999996, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "ages. In", "bbox": {"l": 70.031006, "t": 197.16161999999997, "r": 101.33271, "b": 205.17760999999996, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "2017 14th IAPR international conference on doc-", "bbox": {"l": 104.33101, "t": 197.24230999999997, "r": 286.35791, "b": 204.97136999999998, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "ument analysis and recognition (ICDAR)", "bbox": {"l": 70.031006, "t": 208.20032000000003, "r": 220.48719999999997, "b": 215.92938000000004, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": ", volume 1, pages", "bbox": {"l": 220.48401000000004, "t": 208.11963000000003, "r": 286.36017, "b": 216.13562000000002, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "1162-1167. IEEE, 2017. 3", "bbox": {"l": 70.031006, "t": 219.07861000000003, "r": 166.65294, "b": 227.0946, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "list_item", "bbox": {"l": 50.112007, "t": 230.40259000000003, "r": 286.36578, "b": 271.29553, "coord_origin": "TOPLEFT"}, "confidence": 0.8512731194496155, "cells": [{"id": 21, "text": "[28]", "bbox": {"l": 50.112007, "t": 230.40259000000003, "r": 65.650383, "b": 238.41858000000002, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "Faisal Shafait and Ray Smith. Table detection in heteroge-", "bbox": {"l": 67.982063, "t": 230.40259000000003, "r": 286.3587, "b": 238.41858000000002, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "neous documents. In", "bbox": {"l": 70.031006, "t": 241.36157000000003, "r": 147.16895, "b": 249.37756000000002, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "Proceedings of the 9th IAPR Interna-", "bbox": {"l": 149.93301, "t": 241.44226000000003, "r": 286.36578, "b": 249.17133, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "tional Workshop on Document Analysis Systems", "bbox": {"l": 70.031013, "t": 252.40125, "r": 244.6875, "b": 260.13031, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": ", pages 65-", "bbox": {"l": 244.69101, "t": 252.32056, "r": 286.35791, "b": 260.33655, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "72, 2010. 2", "bbox": {"l": 70.031006, "t": 263.27954, "r": 111.36611, "b": 271.29553, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "list_item", "bbox": {"l": 50.112007, "t": 274.60357999999997, "r": 286.36627, "b": 326.4545, "coord_origin": "TOPLEFT"}, "confidence": 0.8494512438774109, "cells": [{"id": 28, "text": "[29]", "bbox": {"l": 50.112007, "t": 274.60357999999997, "r": 66.023834, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Shoaib", "bbox": {"l": 68.411568, "t": 274.60357999999997, "r": 94.944016, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Ahmed", "bbox": {"l": 100.8708, "t": 274.60357999999997, "r": 127.26788000000002, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Siddiqui,", "bbox": {"l": 133.19467, "t": 274.60357999999997, "r": 165.83237, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Imran", "bbox": {"l": 172.68269, "t": 274.60357999999997, "r": 194.09445, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "Ali", "bbox": {"l": 200.02124, "t": 274.60357999999997, "r": 211.4803, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Fateh,", "bbox": {"l": 217.40708999999998, "t": 274.60357999999997, "r": 239.43755, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "Syed", "bbox": {"l": 246.28787000000003, "t": 274.60357999999997, "r": 264.22067, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Tah-", "bbox": {"l": 270.14746, "t": 274.60357999999997, "r": 286.35873, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "seen Raza Rizvi, Andreas Dengel, and Sheraz Ahmed.", "bbox": {"l": 70.031006, "t": 285.56256, "r": 286.36331, "b": 293.57852, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "Deeptabstr: Deep learning based table structure recognition.", "bbox": {"l": 70.031006, "t": 296.52155, "r": 286.36331, "b": 304.53751, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "In", "bbox": {"l": 70.031006, "t": 307.48053, "r": 77.500015, "b": 315.49649, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "2019 International Conference on Document Analysis and", "bbox": {"l": 79.350006, "t": 307.56122, "r": 286.36627, "b": 315.29028, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Recognition (ICDAR)", "bbox": {"l": 70.031006, "t": 318.51923, "r": 147.57243, "b": 326.24829, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": ", pages 1403-1409. IEEE, 2019. 3", "bbox": {"l": 147.57201, "t": 318.43854, "r": 271.33521, "b": 326.4545, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "list_item", "bbox": {"l": 50.112007, "t": 329.76254, "r": 286.36334, "b": 381.61447, "coord_origin": "TOPLEFT"}, "confidence": 0.8567671179771423, "cells": [{"id": 43, "text": "[30]", "bbox": {"l": 50.112007, "t": 329.76254, "r": 65.366135, "b": 337.7785, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "Peter W J Staar, Michele Dolfi, Christoph Auer, and Costas", "bbox": {"l": 67.655159, "t": 329.76254, "r": 286.3587, "b": 337.7785, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Bekas. Corpus conversion service: A machine learning plat-", "bbox": {"l": 70.031006, "t": 340.72156000000007, "r": 286.36334, "b": 348.7375200000001, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "form to ingest documents at scale.", "bbox": {"l": 70.031006, "t": 351.68054, "r": 198.82439, "b": 359.6965, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "In", "bbox": {"l": 206.06027, "t": 351.68054, "r": 213.52928, "b": 359.6965, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Proceedings of the", "bbox": {"l": 217.02101, "t": 351.76123, "r": 286.35815, "b": 359.4903, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "24th ACM SIGKDD", "bbox": {"l": 70.031006, "t": 362.72021, "r": 143.08028, "b": 370.44928, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": ", KDD \u201918, pages 774-782, New York,", "bbox": {"l": 143.078, "t": 362.63953000000004, "r": 286.36111, "b": 370.65549000000004, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "NY, USA, 2018. ACM. 1", "bbox": {"l": 70.031006, "t": 373.59851, "r": 161.15652, "b": 381.61447, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "list_item", "bbox": {"l": 50.112007, "t": 384.92252, "r": 286.36389, "b": 458.69144, "coord_origin": "TOPLEFT"}, "confidence": 0.8832162618637085, "cells": [{"id": 52, "text": "[31]", "bbox": {"l": 50.112007, "t": 384.92252, "r": 65.140724, "b": 392.93848, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Ashish Vaswani, Noam Shazeer, Niki Parmar, Jakob Uszko-", "bbox": {"l": 67.395927, "t": 384.92252, "r": 286.35876, "b": 392.93848, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "reit, Llion Jones, Aidan N Gomez, \u0141 ukasz Kaiser, and Il-", "bbox": {"l": 70.031006, "t": 395.88153, "r": 286.36337, "b": 403.89749, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "lia Polosukhin.", "bbox": {"l": 70.031006, "t": 406.84052, "r": 125.47024999999998, "b": 414.85648, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Attention is all you need.", "bbox": {"l": 133.90764, "t": 406.84052, "r": 230.83444, "b": 414.85648, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "In I. Guyon,", "bbox": {"l": 239.27182, "t": 406.84052, "r": 286.36334, "b": 414.85648, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "U.", "bbox": {"l": 70.031006, "t": 417.7995, "r": 78.958366, "b": 425.81546, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "V. Luxburg, S. Bengio, H. Wallach, R. Fergus, S. Vish-", "bbox": {"l": 81.254494, "t": 417.7995, "r": 286.36334, "b": 425.81546, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "wanathan, and R. Garnett, editors,", "bbox": {"l": 70.031006, "t": 428.75751, "r": 196.7621, "b": 436.7734699999999, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "Advances in Neural In-", "bbox": {"l": 200.20201, "t": 428.8381999999999, "r": 286.36017, "b": 436.56726, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "formation Processing Systems 30", "bbox": {"l": 70.031006, "t": 439.79717999999997, "r": 189.19447, "b": 447.52624999999995, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": ", pages 5998-6008. Curran", "bbox": {"l": 189.19501, "t": 439.71648999999996, "r": 286.36389, "b": 447.73245, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "Associates, Inc., 2017. 5", "bbox": {"l": 70.031006, "t": 450.67548, "r": 158.9239, "b": 458.69144, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "list_item", "bbox": {"l": 50.112007, "t": 461.99948, "r": 286.36334, "b": 502.89243, "coord_origin": "TOPLEFT"}, "confidence": 0.8431925177574158, "cells": [{"id": 65, "text": "[32]", "bbox": {"l": 50.112007, "t": 461.99948, "r": 65.910469, "b": 470.01544, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "Oriol Vinyals, Alexander Toshev, Samy Bengio, and Du-", "bbox": {"l": 68.281181, "t": 461.99948, "r": 286.35873, "b": 470.01544, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "mitru Erhan.", "bbox": {"l": 70.031006, "t": 472.9585, "r": 116.27969999999999, "b": 480.97446, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "Show and tell: A neural image caption gen-", "bbox": {"l": 122.48445, "t": 472.9585, "r": 286.36334, "b": 480.97446, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "erator. In", "bbox": {"l": 70.031006, "t": 483.91748, "r": 103.30532, "b": 491.93344, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "Proceedings of the IEEE Conference on Computer", "bbox": {"l": 105.51601, "t": 483.99817, "r": 286.35931, "b": 491.72723, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Vision and Pattern Recognition (CVPR)", "bbox": {"l": 70.031006, "t": 494.95715, "r": 212.51607, "b": 502.68622, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": ", June 2015. 2", "bbox": {"l": 212.51401, "t": 494.87646, "r": 263.55975, "b": 502.89243, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "list_item", "bbox": {"l": 50.112015, "t": 506.20047, "r": 286.36337, "b": 547.09244, "coord_origin": "TOPLEFT"}, "confidence": 0.8405635952949524, "cells": [{"id": 73, "text": "[33]", "bbox": {"l": 50.112015, "t": 506.20047, "r": 65.682777, "b": 514.21643, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "Wenyuan Xue, Qingyong Li, and Dacheng Tao.", "bbox": {"l": 68.019325, "t": 506.20047, "r": 247.37280000000004, "b": 514.21643, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "Res2tim:", "bbox": {"l": 253.97208000000003, "t": 506.20047, "r": 286.3587, "b": 514.21643, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "reconstruct syntactic structures from table images. In", "bbox": {"l": 70.031013, "t": 517.15948, "r": 265.62408, "b": 525.17545, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "2019", "bbox": {"l": 268.42902, "t": 517.24017, "r": 286.36182, "b": 524.96924, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "International Conference on Document Analysis and Recog-", "bbox": {"l": 70.031021, "t": 528.19916, "r": 286.36337, "b": 535.92822, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "nition (ICDAR)", "bbox": {"l": 70.031021, "t": 539.15718, "r": 125.25507999999999, "b": 546.88622, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": ", pages 749-755. IEEE, 2019. 3", "bbox": {"l": 125.25402, "t": 539.07648, "r": 240.05083, "b": 547.09244, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "list_item", "bbox": {"l": 50.112022, "t": 550.40048, "r": 286.36337, "b": 591.29344, "coord_origin": "TOPLEFT"}, "confidence": 0.8241521716117859, "cells": [{"id": 81, "text": "[34]", "bbox": {"l": 50.112022, "t": 550.40048, "r": 66.037048, "b": 558.41644, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "Wenyuan Xue, Baosheng Yu, Wen Wang, Dacheng Tao,", "bbox": {"l": 68.426765, "t": 550.40048, "r": 286.3587, "b": 558.41644, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "and Qingyong Li.", "bbox": {"l": 70.031021, "t": 561.35948, "r": 137.08176, "b": 569.37544, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "Tgrnet:", "bbox": {"l": 145.9854, "t": 561.35948, "r": 172.38248, "b": 569.37544, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "A table graph reconstruction", "bbox": {"l": 178.7038, "t": 561.35948, "r": 286.36337, "b": 569.37544, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "network for table structure recognition.", "bbox": {"l": 70.031021, "t": 572.31848, "r": 221.00723, "b": 580.33444, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "arXiv preprint", "bbox": {"l": 232.54300999999998, "t": 572.39919, "r": 286.35938, "b": 580.12822, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "arXiv:2106.10598", "bbox": {"l": 70.031021, "t": 583.35818, "r": 135.53058, "b": 591.08722, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": ", 2021. 3", "bbox": {"l": 135.53003, "t": 583.27748, "r": 167.89876, "b": 591.29344, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "list_item", "bbox": {"l": 50.11203, "t": 594.60149, "r": 286.3634, "b": 635.49445, "coord_origin": "TOPLEFT"}, "confidence": 0.8360886573791504, "cells": [{"id": 90, "text": "[35]", "bbox": {"l": 50.11203, "t": 594.60149, "r": 65.23661, "b": 602.61745, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "Quanzeng You, Hailin Jin, Zhaowen Wang, Chen Fang, and", "bbox": {"l": 67.506203, "t": 594.60149, "r": 286.3587, "b": 602.61745, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Jiebo Luo.", "bbox": {"l": 70.031029, "t": 605.56049, "r": 109.1066, "b": 613.57645, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "Image captioning with semantic attention.", "bbox": {"l": 116.22592, "t": 605.56049, "r": 271.76605, "b": 613.57645, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "In", "bbox": {"l": 278.89435, "t": 605.56049, "r": 286.36337, "b": 613.57645, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "Proceedings of the IEEE conference on computer vision and", "bbox": {"l": 70.031029, "t": 616.60019, "r": 286.3634, "b": 624.32922, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "pattern recognition", "bbox": {"l": 70.031029, "t": 627.55919, "r": 139.09921, "b": 635.28822, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": ", pages 4651-4659, 2016. 4", "bbox": {"l": 139.09802, "t": 627.47849, "r": 238.95683, "b": 635.49445, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "list_item", "bbox": {"l": 50.112022, "t": 638.80249, "r": 286.36337, "b": 690.65347, "coord_origin": "TOPLEFT"}, "confidence": 0.8079474568367004, "cells": [{"id": 98, "text": "[36]", "bbox": {"l": 50.112022, "t": 638.80249, "r": 65.203552, "b": 646.81845, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "Xinyi Zheng, Doug Burdick, Lucian Popa, Peter Zhong, and", "bbox": {"l": 67.468193, "t": 638.80249, "r": 286.35873, "b": 646.81845, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "Nancy Xin Ru Wang. Global table extractor (gte): A frame-", "bbox": {"l": 70.031021, "t": 649.7605, "r": 286.36337, "b": 657.77646, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "work for joint table identification and cell structure recogni-", "bbox": {"l": 70.031021, "t": 660.7195, "r": 286.36334, "b": 668.73547, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "tion using visual context.", "bbox": {"l": 70.031021, "t": 671.6785, "r": 158.45766, "b": 679.69447, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "Winter Conference for Applications", "bbox": {"l": 160.52802, "t": 671.7592, "r": 286.36249, "b": 679.48824, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "in Computer Vision (WACV)", "bbox": {"l": 70.031013, "t": 682.7182, "r": 171.42305, "b": 690.44724, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": ", 2021. 2, 3", "bbox": {"l": 171.42201, "t": 682.6375, "r": 212.75713, "b": 690.65347, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "list_item", "bbox": {"l": 50.112015, "t": 693.961502, "r": 286.36334, "b": 712.936462, "coord_origin": "TOPLEFT"}, "confidence": 0.8385783433914185, "cells": [{"id": 106, "text": "[37]", "bbox": {"l": 50.112015, "t": 693.961502, "r": 66.506706, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "Xu", "bbox": {"l": 68.966896, "t": 693.961502, "r": 80.992294, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "Zhong,", "bbox": {"l": 89.062057, "t": 693.961502, "r": 114.71492999999998, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "Elaheh", "bbox": {"l": 124.24621000000002, "t": 693.961502, "r": 149.1459, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "ShafieiBavani,", "bbox": {"l": 157.22462, "t": 693.961502, "r": 209.37321, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "and", "bbox": {"l": 218.9045, "t": 693.961502, "r": 231.85196999999997, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "Antonio", "bbox": {"l": 239.93069, "t": 693.961502, "r": 269.32254, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "Ji-", "bbox": {"l": 277.3923, "t": 693.961502, "r": 286.3587, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "meno Yepes. Image-based table recognition: Data, model,", "bbox": {"l": 70.031013, "t": 704.920502, "r": 286.36334, "b": 712.936462, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "list_item", "bbox": {"l": 328.78101, "t": 75.88347999999996, "r": 545.11456, "b": 116.77544999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.7556979060173035, "cells": [{"id": 115, "text": "and evaluation. In Andrea Vedaldi, Horst Bischof, Thomas", "bbox": {"l": 328.78101, "t": 75.88347999999996, "r": 545.11346, "b": 83.89948000000015, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "Brox, and Jan-Michael Frahm, editors,", "bbox": {"l": 328.78101, "t": 86.84149000000002, "r": 472.30618, "b": 94.85748000000001, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "Computer Vision -", "bbox": {"l": 475.88501, "t": 86.92218000000003, "r": 545.11456, "b": 94.65125, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "ECCV 2020", "bbox": {"l": 328.78101, "t": 97.88116000000002, "r": 371.92734, "b": 105.61023, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": ", pages 564-580, Cham, 2020. Springer Interna-", "bbox": {"l": 371.92599, "t": 97.80048, "r": 545.11206, "b": 105.81646999999987, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "tional Publishing. 2, 3, 7", "bbox": {"l": 328.78101, "t": 108.75945999999999, "r": 417.70087, "b": 116.77544999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "list_item", "bbox": {"l": 308.862, "t": 120.71447999999998, "r": 545.11334, "b": 161.60742000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.8375797271728516, "cells": [{"id": 121, "text": "[38]", "bbox": {"l": 308.862, "t": 120.71447999999998, "r": 324.33197, "b": 128.73046999999997, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Xu Zhong, Jianbin Tang, and Antonio Jimeno Yepes. Pub-", "bbox": {"l": 326.65341, "t": 120.71447999999998, "r": 545.10876, "b": 128.73046999999997, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "laynet: Largest dataset ever for document layout analysis. In", "bbox": {"l": 328.78101, "t": 131.67345999999998, "r": 545.11334, "b": 139.68944999999997, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "2019 International Conference on Document Analysis and", "bbox": {"l": 328.78101, "t": 142.71312999999998, "r": 545.11328, "b": 150.44219999999996, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "Recognition (ICDAR)", "bbox": {"l": 328.78101, "t": 153.67211999999995, "r": 406.32245, "b": 161.40117999999995, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": ", pages 1015-1022, 2019. 1", "bbox": {"l": 406.32202, "t": 153.59142999999995, "r": 506.18085, "b": 161.60742000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "page_footer", "bbox": {"l": 292.63, "t": 734.1329920000001, "r": 302.59259, "b": 743.039555, "coord_origin": "TOPLEFT"}, "confidence": 0.9069584012031555, "cells": [{"id": 127, "text": "10", "bbox": {"l": 292.63, "t": 734.1329920000001, "r": 302.59259, "b": 743.039555, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "text", "id": 15, "page_no": 9, "cluster": {"id": 15, "label": "text", "bbox": {"l": 70.030998, "t": 75.88378999999998, "r": 286.36176, "b": 94.85875999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.6886764168739319, "cells": [{"id": 0, "text": "Computer Vision and Pattern Recognition", "bbox": {"l": 70.030998, "t": 75.96447999999998, "r": 223.58061, "b": 83.69353999999998, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": ", pages 658-666,", "bbox": {"l": 223.57901, "t": 75.88378999999998, "r": 286.36176, "b": 83.89977999999996, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "2019. 6", "bbox": {"l": 70.031006, "t": 86.84276999999997, "r": 97.916512, "b": 94.85875999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Computer Vision and Pattern Recognition , pages 658-666, 2019. 6"}, {"label": "list_item", "id": 13, "page_no": 9, "cluster": {"id": 13, "label": "list_item", "bbox": {"l": 50.112007, "t": 98.16576999999995, "r": 286.36578, "b": 160.97668, "coord_origin": "TOPLEFT"}, "confidence": 0.7723011374473572, "cells": [{"id": 3, "text": "[26]", "bbox": {"l": 50.112007, "t": 98.16576999999995, "r": 65.534088, "b": 106.18176000000005, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Sebastian Schreiber, Stefan Agne, Ivo Wolf, Andreas Den-", "bbox": {"l": 67.84832, "t": 98.16576999999995, "r": 286.35867, "b": 106.18176000000005, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "gel, and Sheraz Ahmed. Deepdesrt: Deep learning for detec-", "bbox": {"l": 70.031006, "t": 109.12476000000004, "r": 286.36331, "b": 117.14075000000003, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "tion and structure recognition of tables in document images.", "bbox": {"l": 70.031006, "t": 120.08374000000003, "r": 286.36334, "b": 128.0997299999999, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "In", "bbox": {"l": 70.031006, "t": 131.04272000000003, "r": 77.500015, "b": 139.05872, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "2017 14th IAPR International Conference on Document", "bbox": {"l": 80.560005, "t": 131.12341000000004, "r": 286.36578, "b": 138.85248, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Analysis and Recognition (ICDAR)", "bbox": {"l": 70.031006, "t": 142.0824, "r": 195.22885, "b": 149.81146, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": ", volume 01, pages 1162-", "bbox": {"l": 195.231, "t": 142.00171, "r": 286.36548, "b": 150.0177, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "1167, 2017. 1", "bbox": {"l": 70.031006, "t": 152.96069, "r": 120.33251, "b": 160.97668, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[26] Sebastian Schreiber, Stefan Agne, Ivo Wolf, Andreas Dengel, and Sheraz Ahmed. Deepdesrt: Deep learning for detection and structure recognition of tables in document images. In 2017 14th IAPR International Conference on Document Analysis and Recognition (ICDAR) , volume 01, pages 11621167, 2017. 1"}, {"label": "list_item", "id": 2, "page_no": 9, "cluster": {"id": 2, "label": "list_item", "bbox": {"l": 50.112007, "t": 164.28467, "r": 286.36337, "b": 227.0946, "coord_origin": "TOPLEFT"}, "confidence": 0.8580600619316101, "cells": [{"id": 12, "text": "[27]", "bbox": {"l": 50.112007, "t": 164.28467, "r": 65.534088, "b": 172.30066, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Sebastian Schreiber, Stefan Agne, Ivo Wolf, Andreas Den-", "bbox": {"l": 67.84832, "t": 164.28467, "r": 286.35867, "b": 172.30066, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "gel, and Sheraz Ahmed. Deepdesrt: Deep learning for de-", "bbox": {"l": 70.031006, "t": 175.24365, "r": 286.36337, "b": 183.25964, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "tection and structure recognition of tables in document im-", "bbox": {"l": 70.031006, "t": 186.20263999999997, "r": 286.36334, "b": 194.21862999999996, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "ages. In", "bbox": {"l": 70.031006, "t": 197.16161999999997, "r": 101.33271, "b": 205.17760999999996, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "2017 14th IAPR international conference on doc-", "bbox": {"l": 104.33101, "t": 197.24230999999997, "r": 286.35791, "b": 204.97136999999998, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "ument analysis and recognition (ICDAR)", "bbox": {"l": 70.031006, "t": 208.20032000000003, "r": 220.48719999999997, "b": 215.92938000000004, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": ", volume 1, pages", "bbox": {"l": 220.48401000000004, "t": 208.11963000000003, "r": 286.36017, "b": 216.13562000000002, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "1162-1167. IEEE, 2017. 3", "bbox": {"l": 70.031006, "t": 219.07861000000003, "r": 166.65294, "b": 227.0946, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[27] Sebastian Schreiber, Stefan Agne, Ivo Wolf, Andreas Dengel, and Sheraz Ahmed. Deepdesrt: Deep learning for detection and structure recognition of tables in document images. In 2017 14th IAPR international conference on document analysis and recognition (ICDAR) , volume 1, pages 1162-1167. IEEE, 2017. 3"}, {"label": "list_item", "id": 4, "page_no": 9, "cluster": {"id": 4, "label": "list_item", "bbox": {"l": 50.112007, "t": 230.40259000000003, "r": 286.36578, "b": 271.29553, "coord_origin": "TOPLEFT"}, "confidence": 0.8512731194496155, "cells": [{"id": 21, "text": "[28]", "bbox": {"l": 50.112007, "t": 230.40259000000003, "r": 65.650383, "b": 238.41858000000002, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "Faisal Shafait and Ray Smith. Table detection in heteroge-", "bbox": {"l": 67.982063, "t": 230.40259000000003, "r": 286.3587, "b": 238.41858000000002, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "neous documents. In", "bbox": {"l": 70.031006, "t": 241.36157000000003, "r": 147.16895, "b": 249.37756000000002, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "Proceedings of the 9th IAPR Interna-", "bbox": {"l": 149.93301, "t": 241.44226000000003, "r": 286.36578, "b": 249.17133, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "tional Workshop on Document Analysis Systems", "bbox": {"l": 70.031013, "t": 252.40125, "r": 244.6875, "b": 260.13031, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": ", pages 65-", "bbox": {"l": 244.69101, "t": 252.32056, "r": 286.35791, "b": 260.33655, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "72, 2010. 2", "bbox": {"l": 70.031006, "t": 263.27954, "r": 111.36611, "b": 271.29553, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[28] Faisal Shafait and Ray Smith. Table detection in heterogeneous documents. In Proceedings of the 9th IAPR International Workshop on Document Analysis Systems , pages 6572, 2010. 2"}, {"label": "list_item", "id": 5, "page_no": 9, "cluster": {"id": 5, "label": "list_item", "bbox": {"l": 50.112007, "t": 274.60357999999997, "r": 286.36627, "b": 326.4545, "coord_origin": "TOPLEFT"}, "confidence": 0.8494512438774109, "cells": [{"id": 28, "text": "[29]", "bbox": {"l": 50.112007, "t": 274.60357999999997, "r": 66.023834, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Shoaib", "bbox": {"l": 68.411568, "t": 274.60357999999997, "r": 94.944016, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Ahmed", "bbox": {"l": 100.8708, "t": 274.60357999999997, "r": 127.26788000000002, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Siddiqui,", "bbox": {"l": 133.19467, "t": 274.60357999999997, "r": 165.83237, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Imran", "bbox": {"l": 172.68269, "t": 274.60357999999997, "r": 194.09445, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "Ali", "bbox": {"l": 200.02124, "t": 274.60357999999997, "r": 211.4803, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Fateh,", "bbox": {"l": 217.40708999999998, "t": 274.60357999999997, "r": 239.43755, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "Syed", "bbox": {"l": 246.28787000000003, "t": 274.60357999999997, "r": 264.22067, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Tah-", "bbox": {"l": 270.14746, "t": 274.60357999999997, "r": 286.35873, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "seen Raza Rizvi, Andreas Dengel, and Sheraz Ahmed.", "bbox": {"l": 70.031006, "t": 285.56256, "r": 286.36331, "b": 293.57852, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "Deeptabstr: Deep learning based table structure recognition.", "bbox": {"l": 70.031006, "t": 296.52155, "r": 286.36331, "b": 304.53751, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "In", "bbox": {"l": 70.031006, "t": 307.48053, "r": 77.500015, "b": 315.49649, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "2019 International Conference on Document Analysis and", "bbox": {"l": 79.350006, "t": 307.56122, "r": 286.36627, "b": 315.29028, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Recognition (ICDAR)", "bbox": {"l": 70.031006, "t": 318.51923, "r": 147.57243, "b": 326.24829, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": ", pages 1403-1409. IEEE, 2019. 3", "bbox": {"l": 147.57201, "t": 318.43854, "r": 271.33521, "b": 326.4545, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[29] Shoaib Ahmed Siddiqui, Imran Ali Fateh, Syed Tahseen Raza Rizvi, Andreas Dengel, and Sheraz Ahmed. Deeptabstr: Deep learning based table structure recognition. In 2019 International Conference on Document Analysis and Recognition (ICDAR) , pages 1403-1409. IEEE, 2019. 3"}, {"label": "list_item", "id": 3, "page_no": 9, "cluster": {"id": 3, "label": "list_item", "bbox": {"l": 50.112007, "t": 329.76254, "r": 286.36334, "b": 381.61447, "coord_origin": "TOPLEFT"}, "confidence": 0.8567671179771423, "cells": [{"id": 43, "text": "[30]", "bbox": {"l": 50.112007, "t": 329.76254, "r": 65.366135, "b": 337.7785, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "Peter W J Staar, Michele Dolfi, Christoph Auer, and Costas", "bbox": {"l": 67.655159, "t": 329.76254, "r": 286.3587, "b": 337.7785, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Bekas. Corpus conversion service: A machine learning plat-", "bbox": {"l": 70.031006, "t": 340.72156000000007, "r": 286.36334, "b": 348.7375200000001, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "form to ingest documents at scale.", "bbox": {"l": 70.031006, "t": 351.68054, "r": 198.82439, "b": 359.6965, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "In", "bbox": {"l": 206.06027, "t": 351.68054, "r": 213.52928, "b": 359.6965, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Proceedings of the", "bbox": {"l": 217.02101, "t": 351.76123, "r": 286.35815, "b": 359.4903, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "24th ACM SIGKDD", "bbox": {"l": 70.031006, "t": 362.72021, "r": 143.08028, "b": 370.44928, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": ", KDD \u201918, pages 774-782, New York,", "bbox": {"l": 143.078, "t": 362.63953000000004, "r": 286.36111, "b": 370.65549000000004, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "NY, USA, 2018. ACM. 1", "bbox": {"l": 70.031006, "t": 373.59851, "r": 161.15652, "b": 381.61447, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[30] Peter W J Staar, Michele Dolfi, Christoph Auer, and Costas Bekas. Corpus conversion service: A machine learning platform to ingest documents at scale. In Proceedings of the 24th ACM SIGKDD , KDD '18, pages 774-782, New York, NY, USA, 2018. ACM. 1"}, {"label": "list_item", "id": 1, "page_no": 9, "cluster": {"id": 1, "label": "list_item", "bbox": {"l": 50.112007, "t": 384.92252, "r": 286.36389, "b": 458.69144, "coord_origin": "TOPLEFT"}, "confidence": 0.8832162618637085, "cells": [{"id": 52, "text": "[31]", "bbox": {"l": 50.112007, "t": 384.92252, "r": 65.140724, "b": 392.93848, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Ashish Vaswani, Noam Shazeer, Niki Parmar, Jakob Uszko-", "bbox": {"l": 67.395927, "t": 384.92252, "r": 286.35876, "b": 392.93848, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "reit, Llion Jones, Aidan N Gomez, \u0141 ukasz Kaiser, and Il-", "bbox": {"l": 70.031006, "t": 395.88153, "r": 286.36337, "b": 403.89749, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "lia Polosukhin.", "bbox": {"l": 70.031006, "t": 406.84052, "r": 125.47024999999998, "b": 414.85648, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Attention is all you need.", "bbox": {"l": 133.90764, "t": 406.84052, "r": 230.83444, "b": 414.85648, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "In I. Guyon,", "bbox": {"l": 239.27182, "t": 406.84052, "r": 286.36334, "b": 414.85648, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "U.", "bbox": {"l": 70.031006, "t": 417.7995, "r": 78.958366, "b": 425.81546, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "V. Luxburg, S. Bengio, H. Wallach, R. Fergus, S. Vish-", "bbox": {"l": 81.254494, "t": 417.7995, "r": 286.36334, "b": 425.81546, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "wanathan, and R. Garnett, editors,", "bbox": {"l": 70.031006, "t": 428.75751, "r": 196.7621, "b": 436.7734699999999, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "Advances in Neural In-", "bbox": {"l": 200.20201, "t": 428.8381999999999, "r": 286.36017, "b": 436.56726, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "formation Processing Systems 30", "bbox": {"l": 70.031006, "t": 439.79717999999997, "r": 189.19447, "b": 447.52624999999995, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": ", pages 5998-6008. Curran", "bbox": {"l": 189.19501, "t": 439.71648999999996, "r": 286.36389, "b": 447.73245, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "Associates, Inc., 2017. 5", "bbox": {"l": 70.031006, "t": 450.67548, "r": 158.9239, "b": 458.69144, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[31] Ashish Vaswani, Noam Shazeer, Niki Parmar, Jakob Uszkoreit, Llion Jones, Aidan N Gomez, \u0141 ukasz Kaiser, and Illia Polosukhin. Attention is all you need. In I. Guyon, U. V. Luxburg, S. Bengio, H. Wallach, R. Fergus, S. Vishwanathan, and R. Garnett, editors, Advances in Neural Information Processing Systems 30 , pages 5998-6008. Curran Associates, Inc., 2017. 5"}, {"label": "list_item", "id": 6, "page_no": 9, "cluster": {"id": 6, "label": "list_item", "bbox": {"l": 50.112007, "t": 461.99948, "r": 286.36334, "b": 502.89243, "coord_origin": "TOPLEFT"}, "confidence": 0.8431925177574158, "cells": [{"id": 65, "text": "[32]", "bbox": {"l": 50.112007, "t": 461.99948, "r": 65.910469, "b": 470.01544, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "Oriol Vinyals, Alexander Toshev, Samy Bengio, and Du-", "bbox": {"l": 68.281181, "t": 461.99948, "r": 286.35873, "b": 470.01544, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "mitru Erhan.", "bbox": {"l": 70.031006, "t": 472.9585, "r": 116.27969999999999, "b": 480.97446, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "Show and tell: A neural image caption gen-", "bbox": {"l": 122.48445, "t": 472.9585, "r": 286.36334, "b": 480.97446, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "erator. In", "bbox": {"l": 70.031006, "t": 483.91748, "r": 103.30532, "b": 491.93344, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "Proceedings of the IEEE Conference on Computer", "bbox": {"l": 105.51601, "t": 483.99817, "r": 286.35931, "b": 491.72723, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Vision and Pattern Recognition (CVPR)", "bbox": {"l": 70.031006, "t": 494.95715, "r": 212.51607, "b": 502.68622, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": ", June 2015. 2", "bbox": {"l": 212.51401, "t": 494.87646, "r": 263.55975, "b": 502.89243, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[32] Oriol Vinyals, Alexander Toshev, Samy Bengio, and Dumitru Erhan. Show and tell: A neural image caption generator. In Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR) , June 2015. 2"}, {"label": "list_item", "id": 7, "page_no": 9, "cluster": {"id": 7, "label": "list_item", "bbox": {"l": 50.112015, "t": 506.20047, "r": 286.36337, "b": 547.09244, "coord_origin": "TOPLEFT"}, "confidence": 0.8405635952949524, "cells": [{"id": 73, "text": "[33]", "bbox": {"l": 50.112015, "t": 506.20047, "r": 65.682777, "b": 514.21643, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "Wenyuan Xue, Qingyong Li, and Dacheng Tao.", "bbox": {"l": 68.019325, "t": 506.20047, "r": 247.37280000000004, "b": 514.21643, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "Res2tim:", "bbox": {"l": 253.97208000000003, "t": 506.20047, "r": 286.3587, "b": 514.21643, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "reconstruct syntactic structures from table images. In", "bbox": {"l": 70.031013, "t": 517.15948, "r": 265.62408, "b": 525.17545, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "2019", "bbox": {"l": 268.42902, "t": 517.24017, "r": 286.36182, "b": 524.96924, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "International Conference on Document Analysis and Recog-", "bbox": {"l": 70.031021, "t": 528.19916, "r": 286.36337, "b": 535.92822, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "nition (ICDAR)", "bbox": {"l": 70.031021, "t": 539.15718, "r": 125.25507999999999, "b": 546.88622, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": ", pages 749-755. IEEE, 2019. 3", "bbox": {"l": 125.25402, "t": 539.07648, "r": 240.05083, "b": 547.09244, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[33] Wenyuan Xue, Qingyong Li, and Dacheng Tao. Res2tim: reconstruct syntactic structures from table images. In 2019 International Conference on Document Analysis and Recognition (ICDAR) , pages 749-755. IEEE, 2019. 3"}, {"label": "list_item", "id": 11, "page_no": 9, "cluster": {"id": 11, "label": "list_item", "bbox": {"l": 50.112022, "t": 550.40048, "r": 286.36337, "b": 591.29344, "coord_origin": "TOPLEFT"}, "confidence": 0.8241521716117859, "cells": [{"id": 81, "text": "[34]", "bbox": {"l": 50.112022, "t": 550.40048, "r": 66.037048, "b": 558.41644, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "Wenyuan Xue, Baosheng Yu, Wen Wang, Dacheng Tao,", "bbox": {"l": 68.426765, "t": 550.40048, "r": 286.3587, "b": 558.41644, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "and Qingyong Li.", "bbox": {"l": 70.031021, "t": 561.35948, "r": 137.08176, "b": 569.37544, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "Tgrnet:", "bbox": {"l": 145.9854, "t": 561.35948, "r": 172.38248, "b": 569.37544, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "A table graph reconstruction", "bbox": {"l": 178.7038, "t": 561.35948, "r": 286.36337, "b": 569.37544, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "network for table structure recognition.", "bbox": {"l": 70.031021, "t": 572.31848, "r": 221.00723, "b": 580.33444, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "arXiv preprint", "bbox": {"l": 232.54300999999998, "t": 572.39919, "r": 286.35938, "b": 580.12822, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "arXiv:2106.10598", "bbox": {"l": 70.031021, "t": 583.35818, "r": 135.53058, "b": 591.08722, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": ", 2021. 3", "bbox": {"l": 135.53003, "t": 583.27748, "r": 167.89876, "b": 591.29344, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[34] Wenyuan Xue, Baosheng Yu, Wen Wang, Dacheng Tao, and Qingyong Li. Tgrnet: A table graph reconstruction network for table structure recognition. arXiv preprint arXiv:2106.10598 , 2021. 3"}, {"label": "list_item", "id": 10, "page_no": 9, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 50.11203, "t": 594.60149, "r": 286.3634, "b": 635.49445, "coord_origin": "TOPLEFT"}, "confidence": 0.8360886573791504, "cells": [{"id": 90, "text": "[35]", "bbox": {"l": 50.11203, "t": 594.60149, "r": 65.23661, "b": 602.61745, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "Quanzeng You, Hailin Jin, Zhaowen Wang, Chen Fang, and", "bbox": {"l": 67.506203, "t": 594.60149, "r": 286.3587, "b": 602.61745, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Jiebo Luo.", "bbox": {"l": 70.031029, "t": 605.56049, "r": 109.1066, "b": 613.57645, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "Image captioning with semantic attention.", "bbox": {"l": 116.22592, "t": 605.56049, "r": 271.76605, "b": 613.57645, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "In", "bbox": {"l": 278.89435, "t": 605.56049, "r": 286.36337, "b": 613.57645, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "Proceedings of the IEEE conference on computer vision and", "bbox": {"l": 70.031029, "t": 616.60019, "r": 286.3634, "b": 624.32922, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "pattern recognition", "bbox": {"l": 70.031029, "t": 627.55919, "r": 139.09921, "b": 635.28822, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": ", pages 4651-4659, 2016. 4", "bbox": {"l": 139.09802, "t": 627.47849, "r": 238.95683, "b": 635.49445, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[35] Quanzeng You, Hailin Jin, Zhaowen Wang, Chen Fang, and Jiebo Luo. Image captioning with semantic attention. In Proceedings of the IEEE conference on computer vision and pattern recognition , pages 4651-4659, 2016. 4"}, {"label": "list_item", "id": 12, "page_no": 9, "cluster": {"id": 12, "label": "list_item", "bbox": {"l": 50.112022, "t": 638.80249, "r": 286.36337, "b": 690.65347, "coord_origin": "TOPLEFT"}, "confidence": 0.8079474568367004, "cells": [{"id": 98, "text": "[36]", "bbox": {"l": 50.112022, "t": 638.80249, "r": 65.203552, "b": 646.81845, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "Xinyi Zheng, Doug Burdick, Lucian Popa, Peter Zhong, and", "bbox": {"l": 67.468193, "t": 638.80249, "r": 286.35873, "b": 646.81845, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "Nancy Xin Ru Wang. Global table extractor (gte): A frame-", "bbox": {"l": 70.031021, "t": 649.7605, "r": 286.36337, "b": 657.77646, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "work for joint table identification and cell structure recogni-", "bbox": {"l": 70.031021, "t": 660.7195, "r": 286.36334, "b": 668.73547, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "tion using visual context.", "bbox": {"l": 70.031021, "t": 671.6785, "r": 158.45766, "b": 679.69447, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "Winter Conference for Applications", "bbox": {"l": 160.52802, "t": 671.7592, "r": 286.36249, "b": 679.48824, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "in Computer Vision (WACV)", "bbox": {"l": 70.031013, "t": 682.7182, "r": 171.42305, "b": 690.44724, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": ", 2021. 2, 3", "bbox": {"l": 171.42201, "t": 682.6375, "r": 212.75713, "b": 690.65347, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[36] Xinyi Zheng, Doug Burdick, Lucian Popa, Peter Zhong, and Nancy Xin Ru Wang. Global table extractor (gte): A framework for joint table identification and cell structure recognition using visual context. Winter Conference for Applications in Computer Vision (WACV) , 2021. 2, 3"}, {"label": "list_item", "id": 8, "page_no": 9, "cluster": {"id": 8, "label": "list_item", "bbox": {"l": 50.112015, "t": 693.961502, "r": 286.36334, "b": 712.936462, "coord_origin": "TOPLEFT"}, "confidence": 0.8385783433914185, "cells": [{"id": 106, "text": "[37]", "bbox": {"l": 50.112015, "t": 693.961502, "r": 66.506706, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "Xu", "bbox": {"l": 68.966896, "t": 693.961502, "r": 80.992294, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "Zhong,", "bbox": {"l": 89.062057, "t": 693.961502, "r": 114.71492999999998, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "Elaheh", "bbox": {"l": 124.24621000000002, "t": 693.961502, "r": 149.1459, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "ShafieiBavani,", "bbox": {"l": 157.22462, "t": 693.961502, "r": 209.37321, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "and", "bbox": {"l": 218.9045, "t": 693.961502, "r": 231.85196999999997, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "Antonio", "bbox": {"l": 239.93069, "t": 693.961502, "r": 269.32254, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "Ji-", "bbox": {"l": 277.3923, "t": 693.961502, "r": 286.3587, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "meno Yepes. Image-based table recognition: Data, model,", "bbox": {"l": 70.031013, "t": 704.920502, "r": 286.36334, "b": 712.936462, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[37] Xu Zhong, Elaheh ShafieiBavani, and Antonio Jimeno Yepes. Image-based table recognition: Data, model,"}, {"label": "list_item", "id": 14, "page_no": 9, "cluster": {"id": 14, "label": "list_item", "bbox": {"l": 328.78101, "t": 75.88347999999996, "r": 545.11456, "b": 116.77544999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.7556979060173035, "cells": [{"id": 115, "text": "and evaluation. In Andrea Vedaldi, Horst Bischof, Thomas", "bbox": {"l": 328.78101, "t": 75.88347999999996, "r": 545.11346, "b": 83.89948000000015, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "Brox, and Jan-Michael Frahm, editors,", "bbox": {"l": 328.78101, "t": 86.84149000000002, "r": 472.30618, "b": 94.85748000000001, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "Computer Vision -", "bbox": {"l": 475.88501, "t": 86.92218000000003, "r": 545.11456, "b": 94.65125, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "ECCV 2020", "bbox": {"l": 328.78101, "t": 97.88116000000002, "r": 371.92734, "b": 105.61023, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": ", pages 564-580, Cham, 2020. Springer Interna-", "bbox": {"l": 371.92599, "t": 97.80048, "r": 545.11206, "b": 105.81646999999987, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "tional Publishing. 2, 3, 7", "bbox": {"l": 328.78101, "t": 108.75945999999999, "r": 417.70087, "b": 116.77544999999998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "and evaluation. In Andrea Vedaldi, Horst Bischof, Thomas Brox, and Jan-Michael Frahm, editors, Computer Vision ECCV 2020 , pages 564-580, Cham, 2020. Springer International Publishing. 2, 3, 7"}, {"label": "list_item", "id": 9, "page_no": 9, "cluster": {"id": 9, "label": "list_item", "bbox": {"l": 308.862, "t": 120.71447999999998, "r": 545.11334, "b": 161.60742000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.8375797271728516, "cells": [{"id": 121, "text": "[38]", "bbox": {"l": 308.862, "t": 120.71447999999998, "r": 324.33197, "b": 128.73046999999997, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Xu Zhong, Jianbin Tang, and Antonio Jimeno Yepes. Pub-", "bbox": {"l": 326.65341, "t": 120.71447999999998, "r": 545.10876, "b": 128.73046999999997, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "laynet: Largest dataset ever for document layout analysis. In", "bbox": {"l": 328.78101, "t": 131.67345999999998, "r": 545.11334, "b": 139.68944999999997, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "2019 International Conference on Document Analysis and", "bbox": {"l": 328.78101, "t": 142.71312999999998, "r": 545.11328, "b": 150.44219999999996, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "Recognition (ICDAR)", "bbox": {"l": 328.78101, "t": 153.67211999999995, "r": 406.32245, "b": 161.40117999999995, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": ", pages 1015-1022, 2019. 1", "bbox": {"l": 406.32202, "t": 153.59142999999995, "r": 506.18085, "b": 161.60742000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[38] Xu Zhong, Jianbin Tang, and Antonio Jimeno Yepes. Publaynet: Largest dataset ever for document layout analysis. In 2019 International Conference on Document Analysis and Recognition (ICDAR) , pages 1015-1022, 2019. 1"}, {"label": "page_footer", "id": 0, "page_no": 9, "cluster": {"id": 0, "label": "page_footer", "bbox": {"l": 292.63, "t": 734.1329920000001, "r": 302.59259, "b": 743.039555, "coord_origin": "TOPLEFT"}, "confidence": 0.9069584012031555, "cells": [{"id": 127, "text": "10", "bbox": {"l": 292.63, "t": 734.1329920000001, "r": 302.59259, "b": 743.039555, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "10"}], "body": [{"label": "text", "id": 15, "page_no": 9, "cluster": {"id": 15, "label": "text", "bbox": {"l": 70.030998, "t": 75.88378999999998, "r": 286.36176, "b": 94.85875999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.6886764168739319, "cells": [{"id": 0, "text": "Computer Vision and Pattern Recognition", "bbox": {"l": 70.030998, "t": 75.96447999999998, "r": 223.58061, "b": 83.69353999999998, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": ", pages 658-666,", "bbox": {"l": 223.57901, "t": 75.88378999999998, "r": 286.36176, "b": 83.89977999999996, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "2019. 6", "bbox": {"l": 70.031006, "t": 86.84276999999997, "r": 97.916512, "b": 94.85875999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Computer Vision and Pattern Recognition , pages 658-666, 2019. 6"}, {"label": "list_item", "id": 13, "page_no": 9, "cluster": {"id": 13, "label": "list_item", "bbox": {"l": 50.112007, "t": 98.16576999999995, "r": 286.36578, "b": 160.97668, "coord_origin": "TOPLEFT"}, "confidence": 0.7723011374473572, "cells": [{"id": 3, "text": "[26]", "bbox": {"l": 50.112007, "t": 98.16576999999995, "r": 65.534088, "b": 106.18176000000005, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Sebastian Schreiber, Stefan Agne, Ivo Wolf, Andreas Den-", "bbox": {"l": 67.84832, "t": 98.16576999999995, "r": 286.35867, "b": 106.18176000000005, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "gel, and Sheraz Ahmed. Deepdesrt: Deep learning for detec-", "bbox": {"l": 70.031006, "t": 109.12476000000004, "r": 286.36331, "b": 117.14075000000003, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "tion and structure recognition of tables in document images.", "bbox": {"l": 70.031006, "t": 120.08374000000003, "r": 286.36334, "b": 128.0997299999999, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "In", "bbox": {"l": 70.031006, "t": 131.04272000000003, "r": 77.500015, "b": 139.05872, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "2017 14th IAPR International Conference on Document", "bbox": {"l": 80.560005, "t": 131.12341000000004, "r": 286.36578, "b": 138.85248, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Analysis and Recognition (ICDAR)", "bbox": {"l": 70.031006, "t": 142.0824, "r": 195.22885, "b": 149.81146, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": ", volume 01, pages 1162-", "bbox": {"l": 195.231, "t": 142.00171, "r": 286.36548, "b": 150.0177, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "1167, 2017. 1", "bbox": {"l": 70.031006, "t": 152.96069, "r": 120.33251, "b": 160.97668, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[26] Sebastian Schreiber, Stefan Agne, Ivo Wolf, Andreas Dengel, and Sheraz Ahmed. Deepdesrt: Deep learning for detection and structure recognition of tables in document images. In 2017 14th IAPR International Conference on Document Analysis and Recognition (ICDAR) , volume 01, pages 11621167, 2017. 1"}, {"label": "list_item", "id": 2, "page_no": 9, "cluster": {"id": 2, "label": "list_item", "bbox": {"l": 50.112007, "t": 164.28467, "r": 286.36337, "b": 227.0946, "coord_origin": "TOPLEFT"}, "confidence": 0.8580600619316101, "cells": [{"id": 12, "text": "[27]", "bbox": {"l": 50.112007, "t": 164.28467, "r": 65.534088, "b": 172.30066, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Sebastian Schreiber, Stefan Agne, Ivo Wolf, Andreas Den-", "bbox": {"l": 67.84832, "t": 164.28467, "r": 286.35867, "b": 172.30066, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "gel, and Sheraz Ahmed. Deepdesrt: Deep learning for de-", "bbox": {"l": 70.031006, "t": 175.24365, "r": 286.36337, "b": 183.25964, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "tection and structure recognition of tables in document im-", "bbox": {"l": 70.031006, "t": 186.20263999999997, "r": 286.36334, "b": 194.21862999999996, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "ages. In", "bbox": {"l": 70.031006, "t": 197.16161999999997, "r": 101.33271, "b": 205.17760999999996, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "2017 14th IAPR international conference on doc-", "bbox": {"l": 104.33101, "t": 197.24230999999997, "r": 286.35791, "b": 204.97136999999998, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "ument analysis and recognition (ICDAR)", "bbox": {"l": 70.031006, "t": 208.20032000000003, "r": 220.48719999999997, "b": 215.92938000000004, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": ", volume 1, pages", "bbox": {"l": 220.48401000000004, "t": 208.11963000000003, "r": 286.36017, "b": 216.13562000000002, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "1162-1167. IEEE, 2017. 3", "bbox": {"l": 70.031006, "t": 219.07861000000003, "r": 166.65294, "b": 227.0946, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[27] Sebastian Schreiber, Stefan Agne, Ivo Wolf, Andreas Dengel, and Sheraz Ahmed. Deepdesrt: Deep learning for detection and structure recognition of tables in document images. In 2017 14th IAPR international conference on document analysis and recognition (ICDAR) , volume 1, pages 1162-1167. IEEE, 2017. 3"}, {"label": "list_item", "id": 4, "page_no": 9, "cluster": {"id": 4, "label": "list_item", "bbox": {"l": 50.112007, "t": 230.40259000000003, "r": 286.36578, "b": 271.29553, "coord_origin": "TOPLEFT"}, "confidence": 0.8512731194496155, "cells": [{"id": 21, "text": "[28]", "bbox": {"l": 50.112007, "t": 230.40259000000003, "r": 65.650383, "b": 238.41858000000002, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "Faisal Shafait and Ray Smith. Table detection in heteroge-", "bbox": {"l": 67.982063, "t": 230.40259000000003, "r": 286.3587, "b": 238.41858000000002, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "neous documents. In", "bbox": {"l": 70.031006, "t": 241.36157000000003, "r": 147.16895, "b": 249.37756000000002, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "Proceedings of the 9th IAPR Interna-", "bbox": {"l": 149.93301, "t": 241.44226000000003, "r": 286.36578, "b": 249.17133, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "tional Workshop on Document Analysis Systems", "bbox": {"l": 70.031013, "t": 252.40125, "r": 244.6875, "b": 260.13031, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": ", pages 65-", "bbox": {"l": 244.69101, "t": 252.32056, "r": 286.35791, "b": 260.33655, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "72, 2010. 2", "bbox": {"l": 70.031006, "t": 263.27954, "r": 111.36611, "b": 271.29553, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[28] Faisal Shafait and Ray Smith. Table detection in heterogeneous documents. In Proceedings of the 9th IAPR International Workshop on Document Analysis Systems , pages 6572, 2010. 2"}, {"label": "list_item", "id": 5, "page_no": 9, "cluster": {"id": 5, "label": "list_item", "bbox": {"l": 50.112007, "t": 274.60357999999997, "r": 286.36627, "b": 326.4545, "coord_origin": "TOPLEFT"}, "confidence": 0.8494512438774109, "cells": [{"id": 28, "text": "[29]", "bbox": {"l": 50.112007, "t": 274.60357999999997, "r": 66.023834, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Shoaib", "bbox": {"l": 68.411568, "t": 274.60357999999997, "r": 94.944016, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Ahmed", "bbox": {"l": 100.8708, "t": 274.60357999999997, "r": 127.26788000000002, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Siddiqui,", "bbox": {"l": 133.19467, "t": 274.60357999999997, "r": 165.83237, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Imran", "bbox": {"l": 172.68269, "t": 274.60357999999997, "r": 194.09445, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "Ali", "bbox": {"l": 200.02124, "t": 274.60357999999997, "r": 211.4803, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Fateh,", "bbox": {"l": 217.40708999999998, "t": 274.60357999999997, "r": 239.43755, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "Syed", "bbox": {"l": 246.28787000000003, "t": 274.60357999999997, "r": 264.22067, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Tah-", "bbox": {"l": 270.14746, "t": 274.60357999999997, "r": 286.35873, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "seen Raza Rizvi, Andreas Dengel, and Sheraz Ahmed.", "bbox": {"l": 70.031006, "t": 285.56256, "r": 286.36331, "b": 293.57852, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "Deeptabstr: Deep learning based table structure recognition.", "bbox": {"l": 70.031006, "t": 296.52155, "r": 286.36331, "b": 304.53751, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "In", "bbox": {"l": 70.031006, "t": 307.48053, "r": 77.500015, "b": 315.49649, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "2019 International Conference on Document Analysis and", "bbox": {"l": 79.350006, "t": 307.56122, "r": 286.36627, "b": 315.29028, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Recognition (ICDAR)", "bbox": {"l": 70.031006, "t": 318.51923, "r": 147.57243, "b": 326.24829, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": ", pages 1403-1409. IEEE, 2019. 3", "bbox": {"l": 147.57201, "t": 318.43854, "r": 271.33521, "b": 326.4545, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[29] Shoaib Ahmed Siddiqui, Imran Ali Fateh, Syed Tahseen Raza Rizvi, Andreas Dengel, and Sheraz Ahmed. Deeptabstr: Deep learning based table structure recognition. In 2019 International Conference on Document Analysis and Recognition (ICDAR) , pages 1403-1409. IEEE, 2019. 3"}, {"label": "list_item", "id": 3, "page_no": 9, "cluster": {"id": 3, "label": "list_item", "bbox": {"l": 50.112007, "t": 329.76254, "r": 286.36334, "b": 381.61447, "coord_origin": "TOPLEFT"}, "confidence": 0.8567671179771423, "cells": [{"id": 43, "text": "[30]", "bbox": {"l": 50.112007, "t": 329.76254, "r": 65.366135, "b": 337.7785, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "Peter W J Staar, Michele Dolfi, Christoph Auer, and Costas", "bbox": {"l": 67.655159, "t": 329.76254, "r": 286.3587, "b": 337.7785, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Bekas. Corpus conversion service: A machine learning plat-", "bbox": {"l": 70.031006, "t": 340.72156000000007, "r": 286.36334, "b": 348.7375200000001, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "form to ingest documents at scale.", "bbox": {"l": 70.031006, "t": 351.68054, "r": 198.82439, "b": 359.6965, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "In", "bbox": {"l": 206.06027, "t": 351.68054, "r": 213.52928, "b": 359.6965, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Proceedings of the", "bbox": {"l": 217.02101, "t": 351.76123, "r": 286.35815, "b": 359.4903, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "24th ACM SIGKDD", "bbox": {"l": 70.031006, "t": 362.72021, "r": 143.08028, "b": 370.44928, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": ", KDD \u201918, pages 774-782, New York,", "bbox": {"l": 143.078, "t": 362.63953000000004, "r": 286.36111, "b": 370.65549000000004, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "NY, USA, 2018. ACM. 1", "bbox": {"l": 70.031006, "t": 373.59851, "r": 161.15652, "b": 381.61447, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[30] Peter W J Staar, Michele Dolfi, Christoph Auer, and Costas Bekas. Corpus conversion service: A machine learning platform to ingest documents at scale. In Proceedings of the 24th ACM SIGKDD , KDD '18, pages 774-782, New York, NY, USA, 2018. ACM. 1"}, {"label": "list_item", "id": 1, "page_no": 9, "cluster": {"id": 1, "label": "list_item", "bbox": {"l": 50.112007, "t": 384.92252, "r": 286.36389, "b": 458.69144, "coord_origin": "TOPLEFT"}, "confidence": 0.8832162618637085, "cells": [{"id": 52, "text": "[31]", "bbox": {"l": 50.112007, "t": 384.92252, "r": 65.140724, "b": 392.93848, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Ashish Vaswani, Noam Shazeer, Niki Parmar, Jakob Uszko-", "bbox": {"l": 67.395927, "t": 384.92252, "r": 286.35876, "b": 392.93848, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "reit, Llion Jones, Aidan N Gomez, \u0141 ukasz Kaiser, and Il-", "bbox": {"l": 70.031006, "t": 395.88153, "r": 286.36337, "b": 403.89749, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "lia Polosukhin.", "bbox": {"l": 70.031006, "t": 406.84052, "r": 125.47024999999998, "b": 414.85648, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Attention is all you need.", "bbox": {"l": 133.90764, "t": 406.84052, "r": 230.83444, "b": 414.85648, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "In I. Guyon,", "bbox": {"l": 239.27182, "t": 406.84052, "r": 286.36334, "b": 414.85648, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "U.", "bbox": {"l": 70.031006, "t": 417.7995, "r": 78.958366, "b": 425.81546, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "V. Luxburg, S. Bengio, H. Wallach, R. Fergus, S. Vish-", "bbox": {"l": 81.254494, "t": 417.7995, "r": 286.36334, "b": 425.81546, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "wanathan, and R. Garnett, editors,", "bbox": {"l": 70.031006, "t": 428.75751, "r": 196.7621, "b": 436.7734699999999, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "Advances in Neural In-", "bbox": {"l": 200.20201, "t": 428.8381999999999, "r": 286.36017, "b": 436.56726, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "formation Processing Systems 30", "bbox": {"l": 70.031006, "t": 439.79717999999997, "r": 189.19447, "b": 447.52624999999995, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": ", pages 5998-6008. Curran", "bbox": {"l": 189.19501, "t": 439.71648999999996, "r": 286.36389, "b": 447.73245, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "Associates, Inc., 2017. 5", "bbox": {"l": 70.031006, "t": 450.67548, "r": 158.9239, "b": 458.69144, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[31] Ashish Vaswani, Noam Shazeer, Niki Parmar, Jakob Uszkoreit, Llion Jones, Aidan N Gomez, \u0141 ukasz Kaiser, and Illia Polosukhin. Attention is all you need. In I. Guyon, U. V. Luxburg, S. Bengio, H. Wallach, R. Fergus, S. Vishwanathan, and R. Garnett, editors, Advances in Neural Information Processing Systems 30 , pages 5998-6008. Curran Associates, Inc., 2017. 5"}, {"label": "list_item", "id": 6, "page_no": 9, "cluster": {"id": 6, "label": "list_item", "bbox": {"l": 50.112007, "t": 461.99948, "r": 286.36334, "b": 502.89243, "coord_origin": "TOPLEFT"}, "confidence": 0.8431925177574158, "cells": [{"id": 65, "text": "[32]", "bbox": {"l": 50.112007, "t": 461.99948, "r": 65.910469, "b": 470.01544, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "Oriol Vinyals, Alexander Toshev, Samy Bengio, and Du-", "bbox": {"l": 68.281181, "t": 461.99948, "r": 286.35873, "b": 470.01544, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "mitru Erhan.", "bbox": {"l": 70.031006, "t": 472.9585, "r": 116.27969999999999, "b": 480.97446, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "Show and tell: A neural image caption gen-", "bbox": {"l": 122.48445, "t": 472.9585, "r": 286.36334, "b": 480.97446, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "erator. In", "bbox": {"l": 70.031006, "t": 483.91748, "r": 103.30532, "b": 491.93344, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "Proceedings of the IEEE Conference on Computer", "bbox": {"l": 105.51601, "t": 483.99817, "r": 286.35931, "b": 491.72723, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Vision and Pattern Recognition (CVPR)", "bbox": {"l": 70.031006, "t": 494.95715, "r": 212.51607, "b": 502.68622, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": ", June 2015. 2", "bbox": {"l": 212.51401, "t": 494.87646, "r": 263.55975, "b": 502.89243, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[32] Oriol Vinyals, Alexander Toshev, Samy Bengio, and Dumitru Erhan. Show and tell: A neural image caption generator. In Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR) , June 2015. 2"}, {"label": "list_item", "id": 7, "page_no": 9, "cluster": {"id": 7, "label": "list_item", "bbox": {"l": 50.112015, "t": 506.20047, "r": 286.36337, "b": 547.09244, "coord_origin": "TOPLEFT"}, "confidence": 0.8405635952949524, "cells": [{"id": 73, "text": "[33]", "bbox": {"l": 50.112015, "t": 506.20047, "r": 65.682777, "b": 514.21643, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "Wenyuan Xue, Qingyong Li, and Dacheng Tao.", "bbox": {"l": 68.019325, "t": 506.20047, "r": 247.37280000000004, "b": 514.21643, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "Res2tim:", "bbox": {"l": 253.97208000000003, "t": 506.20047, "r": 286.3587, "b": 514.21643, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "reconstruct syntactic structures from table images. In", "bbox": {"l": 70.031013, "t": 517.15948, "r": 265.62408, "b": 525.17545, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "2019", "bbox": {"l": 268.42902, "t": 517.24017, "r": 286.36182, "b": 524.96924, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "International Conference on Document Analysis and Recog-", "bbox": {"l": 70.031021, "t": 528.19916, "r": 286.36337, "b": 535.92822, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "nition (ICDAR)", "bbox": {"l": 70.031021, "t": 539.15718, "r": 125.25507999999999, "b": 546.88622, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": ", pages 749-755. IEEE, 2019. 3", "bbox": {"l": 125.25402, "t": 539.07648, "r": 240.05083, "b": 547.09244, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[33] Wenyuan Xue, Qingyong Li, and Dacheng Tao. Res2tim: reconstruct syntactic structures from table images. In 2019 International Conference on Document Analysis and Recognition (ICDAR) , pages 749-755. IEEE, 2019. 3"}, {"label": "list_item", "id": 11, "page_no": 9, "cluster": {"id": 11, "label": "list_item", "bbox": {"l": 50.112022, "t": 550.40048, "r": 286.36337, "b": 591.29344, "coord_origin": "TOPLEFT"}, "confidence": 0.8241521716117859, "cells": [{"id": 81, "text": "[34]", "bbox": {"l": 50.112022, "t": 550.40048, "r": 66.037048, "b": 558.41644, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "Wenyuan Xue, Baosheng Yu, Wen Wang, Dacheng Tao,", "bbox": {"l": 68.426765, "t": 550.40048, "r": 286.3587, "b": 558.41644, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "and Qingyong Li.", "bbox": {"l": 70.031021, "t": 561.35948, "r": 137.08176, "b": 569.37544, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "Tgrnet:", "bbox": {"l": 145.9854, "t": 561.35948, "r": 172.38248, "b": 569.37544, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "A table graph reconstruction", "bbox": {"l": 178.7038, "t": 561.35948, "r": 286.36337, "b": 569.37544, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "network for table structure recognition.", "bbox": {"l": 70.031021, "t": 572.31848, "r": 221.00723, "b": 580.33444, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "arXiv preprint", "bbox": {"l": 232.54300999999998, "t": 572.39919, "r": 286.35938, "b": 580.12822, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "arXiv:2106.10598", "bbox": {"l": 70.031021, "t": 583.35818, "r": 135.53058, "b": 591.08722, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": ", 2021. 3", "bbox": {"l": 135.53003, "t": 583.27748, "r": 167.89876, "b": 591.29344, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[34] Wenyuan Xue, Baosheng Yu, Wen Wang, Dacheng Tao, and Qingyong Li. Tgrnet: A table graph reconstruction network for table structure recognition. arXiv preprint arXiv:2106.10598 , 2021. 3"}, {"label": "list_item", "id": 10, "page_no": 9, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 50.11203, "t": 594.60149, "r": 286.3634, "b": 635.49445, "coord_origin": "TOPLEFT"}, "confidence": 0.8360886573791504, "cells": [{"id": 90, "text": "[35]", "bbox": {"l": 50.11203, "t": 594.60149, "r": 65.23661, "b": 602.61745, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "Quanzeng You, Hailin Jin, Zhaowen Wang, Chen Fang, and", "bbox": {"l": 67.506203, "t": 594.60149, "r": 286.3587, "b": 602.61745, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Jiebo Luo.", "bbox": {"l": 70.031029, "t": 605.56049, "r": 109.1066, "b": 613.57645, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "Image captioning with semantic attention.", "bbox": {"l": 116.22592, "t": 605.56049, "r": 271.76605, "b": 613.57645, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "In", "bbox": {"l": 278.89435, "t": 605.56049, "r": 286.36337, "b": 613.57645, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "Proceedings of the IEEE conference on computer vision and", "bbox": {"l": 70.031029, "t": 616.60019, "r": 286.3634, "b": 624.32922, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "pattern recognition", "bbox": {"l": 70.031029, "t": 627.55919, "r": 139.09921, "b": 635.28822, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": ", pages 4651-4659, 2016. 4", "bbox": {"l": 139.09802, "t": 627.47849, "r": 238.95683, "b": 635.49445, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[35] Quanzeng You, Hailin Jin, Zhaowen Wang, Chen Fang, and Jiebo Luo. Image captioning with semantic attention. In Proceedings of the IEEE conference on computer vision and pattern recognition , pages 4651-4659, 2016. 4"}, {"label": "list_item", "id": 12, "page_no": 9, "cluster": {"id": 12, "label": "list_item", "bbox": {"l": 50.112022, "t": 638.80249, "r": 286.36337, "b": 690.65347, "coord_origin": "TOPLEFT"}, "confidence": 0.8079474568367004, "cells": [{"id": 98, "text": "[36]", "bbox": {"l": 50.112022, "t": 638.80249, "r": 65.203552, "b": 646.81845, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "Xinyi Zheng, Doug Burdick, Lucian Popa, Peter Zhong, and", "bbox": {"l": 67.468193, "t": 638.80249, "r": 286.35873, "b": 646.81845, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "Nancy Xin Ru Wang. Global table extractor (gte): A frame-", "bbox": {"l": 70.031021, "t": 649.7605, "r": 286.36337, "b": 657.77646, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "work for joint table identification and cell structure recogni-", "bbox": {"l": 70.031021, "t": 660.7195, "r": 286.36334, "b": 668.73547, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "tion using visual context.", "bbox": {"l": 70.031021, "t": 671.6785, "r": 158.45766, "b": 679.69447, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "Winter Conference for Applications", "bbox": {"l": 160.52802, "t": 671.7592, "r": 286.36249, "b": 679.48824, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "in Computer Vision (WACV)", "bbox": {"l": 70.031013, "t": 682.7182, "r": 171.42305, "b": 690.44724, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": ", 2021. 2, 3", "bbox": {"l": 171.42201, "t": 682.6375, "r": 212.75713, "b": 690.65347, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[36] Xinyi Zheng, Doug Burdick, Lucian Popa, Peter Zhong, and Nancy Xin Ru Wang. Global table extractor (gte): A framework for joint table identification and cell structure recognition using visual context. Winter Conference for Applications in Computer Vision (WACV) , 2021. 2, 3"}, {"label": "list_item", "id": 8, "page_no": 9, "cluster": {"id": 8, "label": "list_item", "bbox": {"l": 50.112015, "t": 693.961502, "r": 286.36334, "b": 712.936462, "coord_origin": "TOPLEFT"}, "confidence": 0.8385783433914185, "cells": [{"id": 106, "text": "[37]", "bbox": {"l": 50.112015, "t": 693.961502, "r": 66.506706, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "Xu", "bbox": {"l": 68.966896, "t": 693.961502, "r": 80.992294, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "Zhong,", "bbox": {"l": 89.062057, "t": 693.961502, "r": 114.71492999999998, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "Elaheh", "bbox": {"l": 124.24621000000002, "t": 693.961502, "r": 149.1459, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "ShafieiBavani,", "bbox": {"l": 157.22462, "t": 693.961502, "r": 209.37321, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "and", "bbox": {"l": 218.9045, "t": 693.961502, "r": 231.85196999999997, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "Antonio", "bbox": {"l": 239.93069, "t": 693.961502, "r": 269.32254, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "Ji-", "bbox": {"l": 277.3923, "t": 693.961502, "r": 286.3587, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "meno Yepes. Image-based table recognition: Data, model,", "bbox": {"l": 70.031013, "t": 704.920502, "r": 286.36334, "b": 712.936462, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[37] Xu Zhong, Elaheh ShafieiBavani, and Antonio Jimeno Yepes. Image-based table recognition: Data, model,"}, {"label": "list_item", "id": 14, "page_no": 9, "cluster": {"id": 14, "label": "list_item", "bbox": {"l": 328.78101, "t": 75.88347999999996, "r": 545.11456, "b": 116.77544999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.7556979060173035, "cells": [{"id": 115, "text": "and evaluation. In Andrea Vedaldi, Horst Bischof, Thomas", "bbox": {"l": 328.78101, "t": 75.88347999999996, "r": 545.11346, "b": 83.89948000000015, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "Brox, and Jan-Michael Frahm, editors,", "bbox": {"l": 328.78101, "t": 86.84149000000002, "r": 472.30618, "b": 94.85748000000001, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "Computer Vision -", "bbox": {"l": 475.88501, "t": 86.92218000000003, "r": 545.11456, "b": 94.65125, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "ECCV 2020", "bbox": {"l": 328.78101, "t": 97.88116000000002, "r": 371.92734, "b": 105.61023, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": ", pages 564-580, Cham, 2020. Springer Interna-", "bbox": {"l": 371.92599, "t": 97.80048, "r": 545.11206, "b": 105.81646999999987, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "tional Publishing. 2, 3, 7", "bbox": {"l": 328.78101, "t": 108.75945999999999, "r": 417.70087, "b": 116.77544999999998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "and evaluation. In Andrea Vedaldi, Horst Bischof, Thomas Brox, and Jan-Michael Frahm, editors, Computer Vision ECCV 2020 , pages 564-580, Cham, 2020. Springer International Publishing. 2, 3, 7"}, {"label": "list_item", "id": 9, "page_no": 9, "cluster": {"id": 9, "label": "list_item", "bbox": {"l": 308.862, "t": 120.71447999999998, "r": 545.11334, "b": 161.60742000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.8375797271728516, "cells": [{"id": 121, "text": "[38]", "bbox": {"l": 308.862, "t": 120.71447999999998, "r": 324.33197, "b": 128.73046999999997, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Xu Zhong, Jianbin Tang, and Antonio Jimeno Yepes. Pub-", "bbox": {"l": 326.65341, "t": 120.71447999999998, "r": 545.10876, "b": 128.73046999999997, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "laynet: Largest dataset ever for document layout analysis. In", "bbox": {"l": 328.78101, "t": 131.67345999999998, "r": 545.11334, "b": 139.68944999999997, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "2019 International Conference on Document Analysis and", "bbox": {"l": 328.78101, "t": 142.71312999999998, "r": 545.11328, "b": 150.44219999999996, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "Recognition (ICDAR)", "bbox": {"l": 328.78101, "t": 153.67211999999995, "r": 406.32245, "b": 161.40117999999995, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": ", pages 1015-1022, 2019. 1", "bbox": {"l": 406.32202, "t": 153.59142999999995, "r": 506.18085, "b": 161.60742000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[38] Xu Zhong, Jianbin Tang, and Antonio Jimeno Yepes. Publaynet: Largest dataset ever for document layout analysis. In 2019 International Conference on Document Analysis and Recognition (ICDAR) , pages 1015-1022, 2019. 1"}], "headers": [{"label": "page_footer", "id": 0, "page_no": 9, "cluster": {"id": 0, "label": "page_footer", "bbox": {"l": 292.63, "t": 734.1329920000001, "r": 302.59259, "b": 743.039555, "coord_origin": "TOPLEFT"}, "confidence": 0.9069584012031555, "cells": [{"id": 127, "text": "10", "bbox": {"l": 292.63, "t": 734.1329920000001, "r": 302.59259, "b": 743.039555, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "10"}]}}, {"page_no": 10, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "TableFormer: Table Structure Understanding with Transformers", "bbox": {"l": 132.842, "t": 110.57488999999998, "r": 465.37591999999995, "b": 121.32263, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Supplementary Material", "bbox": {"l": 220.18399, "t": 122.25982999999997, "r": 375.04269, "b": 135.53008999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "1.", "bbox": {"l": 50.111984, "t": 161.16089, "r": 57.089828, "b": 171.90863000000002, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Details on the datasets", "bbox": {"l": 66.393616, "t": 161.16089, "r": 175.96437, "b": 171.90863000000002, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "1.1.", "bbox": {"l": 50.111984, "t": 180.97931000000005, "r": 64.210808, "b": 190.83136000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Data preparation", "bbox": {"l": 73.610023, "t": 180.97931000000005, "r": 150.36401, "b": 190.83136000000002, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "As a first step of our data preparation process, we have", "bbox": {"l": 62.06698600000001, "t": 199.92029000000002, "r": 286.36496, "b": 208.82683999999995, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "calculated statistics over the datasets across the following", "bbox": {"l": 50.111984, "t": 211.87627999999995, "r": 286.36505, "b": 220.78283999999996, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "dimensions: (1) table size measured in the number of rows", "bbox": {"l": 50.111984, "t": 223.83130000000006, "r": 286.36514, "b": 232.73784999999998, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "and columns, (2) complexity of the table, (3) strictness of", "bbox": {"l": 50.111984, "t": 235.78632000000005, "r": 286.36508, "b": 244.69286999999997, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "the provided HTML structure and (4) completeness (i.e. no", "bbox": {"l": 50.111984, "t": 247.74132999999995, "r": 286.36505, "b": 256.64788999999996, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "omitted bounding boxes). A table is considered to be simple", "bbox": {"l": 50.111984, "t": 259.69635000000005, "r": 286.36505, "b": 268.60290999999995, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "if it does not contain row spans or column spans. Addition-", "bbox": {"l": 50.111984, "t": 271.65137000000004, "r": 286.36505, "b": 280.55792, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "ally, a table has a strict HTML structure if every row has the", "bbox": {"l": 50.111984, "t": 283.60736, "r": 286.36502, "b": 292.5139199999999, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "same number of columns after taking into account any row", "bbox": {"l": 50.111984, "t": 295.56235, "r": 286.36505, "b": 304.4689, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "or column spans. Therefore a strict HTML structure looks", "bbox": {"l": 50.111984, "t": 307.5173300000001, "r": 286.36508, "b": 316.42389, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "always rectangular. However, HTML is a lenient encoding", "bbox": {"l": 50.111984, "t": 319.47232, "r": 286.36505, "b": 328.3788799999999, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "format, i.e. tables with rows of different sizes might still", "bbox": {"l": 50.111984, "t": 331.42731000000003, "r": 286.36502, "b": 340.33386, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "be regarded as correct due to implicit display rules. These", "bbox": {"l": 50.111984, "t": 343.3833, "r": 286.36508, "b": 352.28986, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "implicit rules leave room for ambiguity, which we want to", "bbox": {"l": 50.111984, "t": 355.33829, "r": 286.36505, "b": 364.24484000000007, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "avoid. As such, we prefer to have \u201dstrict\u201d tables, i.e. tables", "bbox": {"l": 50.111984, "t": 367.29327, "r": 286.36508, "b": 376.19983, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "where every row has exactly the same length.", "bbox": {"l": 50.111984, "t": 379.24826, "r": 230.80364999999998, "b": 388.15482000000003, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "We have developed a technique that tries to derive a", "bbox": {"l": 62.06698600000001, "t": 391.40527, "r": 286.36499, "b": 400.31183, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "missing bounding box out of its neighbors. As a first step,", "bbox": {"l": 50.111984, "t": 403.36026, "r": 286.36508, "b": 412.26681999999994, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "we use the annotation data to generate the most fine-grained", "bbox": {"l": 50.111984, "t": 415.31525, "r": 286.36505, "b": 424.22180000000003, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "grid that covers the table structure. In case of strict HTML", "bbox": {"l": 50.111984, "t": 427.2712399999999, "r": 286.36505, "b": 436.1778, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "tables, all grid squares are associated with some table cell", "bbox": {"l": 50.111984, "t": 439.22623, "r": 286.36508, "b": 448.1327800000001, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "and in the presence of table spans a cell extends across mul-", "bbox": {"l": 50.111984, "t": 451.18121, "r": 286.36511, "b": 460.08777, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "tiple grid squares. When enough bounding boxes are known", "bbox": {"l": 50.111984, "t": 463.1362, "r": 286.36505, "b": 472.04276, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "for a rectangular table, it is possible to compute the geo-", "bbox": {"l": 50.111984, "t": 475.09119, "r": 286.36508, "b": 483.99774, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "metrical border lines between the grid rows and columns.", "bbox": {"l": 50.111984, "t": 487.04617, "r": 286.36502, "b": 495.95273, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Eventually this information is used to generate the missing", "bbox": {"l": 50.111984, "t": 499.00217, "r": 286.36511, "b": 507.90872, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "bounding boxes. Additionally, the existence of unused grid", "bbox": {"l": 50.111984, "t": 510.95715, "r": 286.36508, "b": 519.8637100000001, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "squares indicates that the table rows have unequal number", "bbox": {"l": 50.111984, "t": 522.91214, "r": 286.36508, "b": 531.8187, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "of columns and the overall structure is non-strict. The gen-", "bbox": {"l": 50.111984, "t": 534.86713, "r": 286.36505, "b": 543.7737, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "eration of missing bounding boxes for non-strict HTML ta-", "bbox": {"l": 50.111984, "t": 546.82214, "r": 286.36502, "b": 555.7287, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "bles is ambiguous and therefore quite challenging.", "bbox": {"l": 50.111984, "t": 558.77814, "r": 257.47351, "b": 567.68469, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "Thus,", "bbox": {"l": 263.94919, "t": 558.77814, "r": 286.36505, "b": 567.68469, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "we have decided to simply discard those tables. In case of", "bbox": {"l": 50.111984, "t": 570.73314, "r": 286.36508, "b": 579.63969, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "PubTabNet we have computed missing bounding boxes for", "bbox": {"l": 50.111984, "t": 582.68814, "r": 286.36511, "b": 591.5947, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "48% of the simple and 69% of the complex tables. Regard-", "bbox": {"l": 50.111984, "t": 594.64314, "r": 286.36511, "b": 603.5497, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "ing FinTabNet, 68% of the simple and 98% of the complex", "bbox": {"l": 50.111984, "t": 606.5981400000001, "r": 286.36505, "b": 615.5047, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "tables require the generation of bounding boxes.", "bbox": {"l": 50.111984, "t": 618.55315, "r": 242.2606, "b": 627.4597, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Figure 7 illustrates the distribution of the tables across", "bbox": {"l": 62.06698600000001, "t": 630.71014, "r": 286.36496, "b": 639.6167, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "different dimensions per dataset.", "bbox": {"l": 50.111984, "t": 642.66614, "r": 179.90472, "b": 651.57269, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "1.2.", "bbox": {"l": 50.111984, "t": 662.39014, "r": 64.297272, "b": 672.24219, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "Synthetic datasets", "bbox": {"l": 73.754135, "t": 662.39014, "r": 153.60785, "b": 672.24219, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "Aiming to train and evaluate our models in a broader", "bbox": {"l": 62.06698600000001, "t": 681.33113, "r": 286.36493, "b": 690.2377, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "spectrum of table data we have synthesized four types of", "bbox": {"l": 50.111984, "t": 693.2861330000001, "r": 286.36505, "b": 702.1927029999999, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "datasets.", "bbox": {"l": 50.111984, "t": 705.241135, "r": 84.144226, "b": 714.147705, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Each one contains tables with different appear-", "bbox": {"l": 91.237595, "t": 705.241135, "r": 286.36505, "b": 714.147705, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "ances in regard to their size, structure, style and content.", "bbox": {"l": 308.862, "t": 162.65515000000005, "r": 545.11511, "b": 171.56170999999995, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Every synthetic dataset contains 150k examples, summing", "bbox": {"l": 308.862, "t": 174.61017000000004, "r": 545.11511, "b": 183.51671999999996, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "up to 600k synthetic examples. All datasets are divided into", "bbox": {"l": 308.862, "t": 186.56519000000003, "r": 545.11511, "b": 195.47173999999995, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "Train, Test and Val splits (80%, 10%, 10%).", "bbox": {"l": 308.862, "t": 198.52117999999996, "r": 484.07434, "b": 207.42773, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "The process of generating a synthetic dataset can be de-", "bbox": {"l": 320.81699, "t": 211.23517000000004, "r": 545.11505, "b": 220.14171999999996, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "composed into the following steps:", "bbox": {"l": 308.862, "t": 223.19019000000003, "r": 448.08939, "b": 232.09673999999995, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "1.", "bbox": {"l": 320.81699, "t": 235.90521, "r": 328.28894, "b": 244.81177000000002, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Prepare styling and content templates: The styling", "bbox": {"l": 335.38232, "t": 235.90521, "r": 545.11499, "b": 244.81177000000002, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "templates have been manually designed and organized into", "bbox": {"l": 308.862, "t": 247.86023, "r": 545.11511, "b": 256.76678000000004, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "groups of scope specific appearances (e.g. financial data,", "bbox": {"l": 308.862, "t": 259.81525, "r": 545.11511, "b": 268.72180000000003, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "marketing data, etc.)", "bbox": {"l": 308.862, "t": 271.77026, "r": 393.3847, "b": 280.67682, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "Additionally, we have prepared cu-", "bbox": {"l": 400.11942, "t": 271.77026, "r": 545.11511, "b": 280.67682, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "rated collections of content templates by extracting the most", "bbox": {"l": 308.862, "t": 283.72524999999996, "r": 545.11505, "b": 292.63181, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "frequently used terms out of non-synthetic datasets (e.g.", "bbox": {"l": 308.862, "t": 295.68124, "r": 545.11511, "b": 304.5878000000001, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "PubTabNet, FinTabNet, etc.).", "bbox": {"l": 308.862, "t": 307.63623, "r": 425.69348, "b": 316.54279, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "2.", "bbox": {"l": 320.81699, "t": 320.35022, "r": 328.4949, "b": 329.25677, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "Generate table structures: The structure of each syn-", "bbox": {"l": 331.05423, "t": 320.35022, "r": 545.11499, "b": 329.25677, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "thetic dataset assumes a horizontal table header which po-", "bbox": {"l": 308.862, "t": 332.30521000000005, "r": 545.11517, "b": 341.21176, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "tentially spans over multiple rows and a table body that", "bbox": {"l": 308.862, "t": 344.26018999999997, "r": 545.11505, "b": 353.16675, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "may contain a combination of row spans and column spans.", "bbox": {"l": 308.862, "t": 356.21619, "r": 545.11511, "b": 365.12273999999996, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "However, spans are not allowed to cross the header - body", "bbox": {"l": 308.862, "t": 368.17117, "r": 545.11511, "b": 377.07773, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "boundary. The table structure is described by the parame-", "bbox": {"l": 308.862, "t": 380.12616, "r": 545.11499, "b": 389.03271, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "ters: Total number of table rows and columns, number of", "bbox": {"l": 308.862, "t": 392.08115, "r": 545.11517, "b": 400.98769999999996, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "header rows, type of spans (header only spans, row only", "bbox": {"l": 308.862, "t": 404.03613000000007, "r": 545.11511, "b": 412.94269, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "spans, column only spans, both row and column spans),", "bbox": {"l": 308.862, "t": 415.99112, "r": 545.11499, "b": 424.89767, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "maximum span size and the ratio of the table area covered", "bbox": {"l": 308.862, "t": 427.94711, "r": 545.11517, "b": 436.85367, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "by spans.", "bbox": {"l": 308.862, "t": 439.9021, "r": 345.94278, "b": 448.80865, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "3.", "bbox": {"l": 320.81699, "t": 452.61609, "r": 328.30341, "b": 461.52264, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "Generate content: Based on the dataset", "bbox": {"l": 330.79889, "t": 452.61609, "r": 485.75772000000006, "b": 461.52264, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "theme", "bbox": {"l": 488.073, "t": 452.70575, "r": 511.86368, "b": 461.29352, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": ", a set of", "bbox": {"l": 511.86301, "t": 452.61609, "r": 545.10815, "b": 461.52264, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "suitable content templates is chosen first. Then, this content", "bbox": {"l": 308.862, "t": 464.57108, "r": 545.11505, "b": 473.47763, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "can be combined with purely random text to produce the", "bbox": {"l": 308.862, "t": 476.52707, "r": 545.11517, "b": 485.43362, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "synthetic content.", "bbox": {"l": 308.862, "t": 488.48206, "r": 379.14816, "b": 497.38861, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "4.", "bbox": {"l": 320.81699, "t": 501.19604, "r": 328.66177, "b": 510.1026, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Apply styling templates: Depending on the domain", "bbox": {"l": 331.2767, "t": 501.19604, "r": 545.11493, "b": 510.1026, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "of the synthetic dataset, a set of styling templates is first", "bbox": {"l": 308.862, "t": 513.15103, "r": 545.1153, "b": 522.05759, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "manually selected.", "bbox": {"l": 308.862, "t": 525.10703, "r": 384.29883, "b": 534.01358, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "Then, a style is randomly selected to", "bbox": {"l": 391.25272, "t": 525.10703, "r": 545.11511, "b": 534.01358, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "format the appearance of the synthesized table.", "bbox": {"l": 308.862, "t": 537.06203, "r": 496.15897000000007, "b": 545.96858, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "5.", "bbox": {"l": 320.81699, "t": 549.77603, "r": 328.28894, "b": 558.68259, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Render the complete tables: The synthetic table is", "bbox": {"l": 335.40222, "t": 549.77603, "r": 545.11499, "b": 558.68259, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "finally rendered by a web browser engine to generate the", "bbox": {"l": 308.862, "t": 561.73103, "r": 545.11517, "b": 570.63759, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "bounding boxes for each table cell. A batching technique is", "bbox": {"l": 308.862, "t": 573.68604, "r": 545.11511, "b": 582.59259, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "utilized to optimize the runtime overhead of the rendering", "bbox": {"l": 308.862, "t": 585.64203, "r": 545.11505, "b": 594.54858, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "process.", "bbox": {"l": 308.862, "t": 597.59703, "r": 341.2305, "b": 606.50359, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "2.", "bbox": {"l": 308.862, "t": 622.2905900000001, "r": 316.76675, "b": 633.03831, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "Prediction post-processing for PDF docu-", "bbox": {"l": 327.30643, "t": 622.2905900000001, "r": 545.10876, "b": 633.03831, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "ments", "bbox": {"l": 326.79501, "t": 636.2385899999999, "r": 357.34055, "b": 646.98631, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "Although TableFormer can predict the table structure and", "bbox": {"l": 320.81702, "t": 657.42104, "r": 545.11499, "b": 666.3276, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "the bounding boxes for tables recognized inside PDF docu-", "bbox": {"l": 308.86203, "t": 669.37604, "r": 545.11511, "b": 678.2826, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "ments, this is not enough when a full reconstruction of the", "bbox": {"l": 308.86203, "t": 681.33104, "r": 545.11517, "b": 690.2376, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "original table is required. This happens mainly due the fol-", "bbox": {"l": 308.86203, "t": 693.286041, "r": 545.11505, "b": 702.1926040000001, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "lowing reasons:", "bbox": {"l": 308.86203, "t": 705.242035, "r": 371.42719, "b": 714.148605, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "11", "bbox": {"l": 292.63104, "t": 734.1330379999999, "r": 302.59363, "b": 743.0396, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 18, "label": "section_header", "bbox": {"l": 132.842, "t": 110.57488999999998, "r": 465.37591999999995, "b": 135.53008999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.6497084498405457, "cells": [{"id": 0, "text": "TableFormer: Table Structure Understanding with Transformers", "bbox": {"l": 132.842, "t": 110.57488999999998, "r": 465.37591999999995, "b": 121.32263, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Supplementary Material", "bbox": {"l": 220.18399, "t": 122.25982999999997, "r": 375.04269, "b": 135.53008999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "section_header", "bbox": {"l": 50.111984, "t": 161.16089, "r": 175.96437, "b": 171.90863000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9454860091209412, "cells": [{"id": 2, "text": "1.", "bbox": {"l": 50.111984, "t": 161.16089, "r": 57.089828, "b": 171.90863000000002, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Details on the datasets", "bbox": {"l": 66.393616, "t": 161.16089, "r": 175.96437, "b": 171.90863000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "section_header", "bbox": {"l": 50.111984, "t": 180.97931000000005, "r": 150.36401, "b": 190.83136000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9535645842552185, "cells": [{"id": 4, "text": "1.1.", "bbox": {"l": 50.111984, "t": 180.97931000000005, "r": 64.210808, "b": 190.83136000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Data preparation", "bbox": {"l": 73.610023, "t": 180.97931000000005, "r": 150.36401, "b": 190.83136000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 50.111984, "t": 199.92029000000002, "r": 286.36514, "b": 388.15482000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9864971041679382, "cells": [{"id": 6, "text": "As a first step of our data preparation process, we have", "bbox": {"l": 62.06698600000001, "t": 199.92029000000002, "r": 286.36496, "b": 208.82683999999995, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "calculated statistics over the datasets across the following", "bbox": {"l": 50.111984, "t": 211.87627999999995, "r": 286.36505, "b": 220.78283999999996, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "dimensions: (1) table size measured in the number of rows", "bbox": {"l": 50.111984, "t": 223.83130000000006, "r": 286.36514, "b": 232.73784999999998, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "and columns, (2) complexity of the table, (3) strictness of", "bbox": {"l": 50.111984, "t": 235.78632000000005, "r": 286.36508, "b": 244.69286999999997, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "the provided HTML structure and (4) completeness (i.e. no", "bbox": {"l": 50.111984, "t": 247.74132999999995, "r": 286.36505, "b": 256.64788999999996, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "omitted bounding boxes). A table is considered to be simple", "bbox": {"l": 50.111984, "t": 259.69635000000005, "r": 286.36505, "b": 268.60290999999995, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "if it does not contain row spans or column spans. Addition-", "bbox": {"l": 50.111984, "t": 271.65137000000004, "r": 286.36505, "b": 280.55792, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "ally, a table has a strict HTML structure if every row has the", "bbox": {"l": 50.111984, "t": 283.60736, "r": 286.36502, "b": 292.5139199999999, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "same number of columns after taking into account any row", "bbox": {"l": 50.111984, "t": 295.56235, "r": 286.36505, "b": 304.4689, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "or column spans. Therefore a strict HTML structure looks", "bbox": {"l": 50.111984, "t": 307.5173300000001, "r": 286.36508, "b": 316.42389, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "always rectangular. However, HTML is a lenient encoding", "bbox": {"l": 50.111984, "t": 319.47232, "r": 286.36505, "b": 328.3788799999999, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "format, i.e. tables with rows of different sizes might still", "bbox": {"l": 50.111984, "t": 331.42731000000003, "r": 286.36502, "b": 340.33386, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "be regarded as correct due to implicit display rules. These", "bbox": {"l": 50.111984, "t": 343.3833, "r": 286.36508, "b": 352.28986, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "implicit rules leave room for ambiguity, which we want to", "bbox": {"l": 50.111984, "t": 355.33829, "r": 286.36505, "b": 364.24484000000007, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "avoid. As such, we prefer to have \u201dstrict\u201d tables, i.e. tables", "bbox": {"l": 50.111984, "t": 367.29327, "r": 286.36508, "b": 376.19983, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "where every row has exactly the same length.", "bbox": {"l": 50.111984, "t": 379.24826, "r": 230.80364999999998, "b": 388.15482000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 50.111984, "t": 391.40527, "r": 286.36511, "b": 627.4597, "coord_origin": "TOPLEFT"}, "confidence": 0.9826022386550903, "cells": [{"id": 22, "text": "We have developed a technique that tries to derive a", "bbox": {"l": 62.06698600000001, "t": 391.40527, "r": 286.36499, "b": 400.31183, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "missing bounding box out of its neighbors. As a first step,", "bbox": {"l": 50.111984, "t": 403.36026, "r": 286.36508, "b": 412.26681999999994, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "we use the annotation data to generate the most fine-grained", "bbox": {"l": 50.111984, "t": 415.31525, "r": 286.36505, "b": 424.22180000000003, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "grid that covers the table structure. In case of strict HTML", "bbox": {"l": 50.111984, "t": 427.2712399999999, "r": 286.36505, "b": 436.1778, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "tables, all grid squares are associated with some table cell", "bbox": {"l": 50.111984, "t": 439.22623, "r": 286.36508, "b": 448.1327800000001, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "and in the presence of table spans a cell extends across mul-", "bbox": {"l": 50.111984, "t": 451.18121, "r": 286.36511, "b": 460.08777, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "tiple grid squares. When enough bounding boxes are known", "bbox": {"l": 50.111984, "t": 463.1362, "r": 286.36505, "b": 472.04276, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "for a rectangular table, it is possible to compute the geo-", "bbox": {"l": 50.111984, "t": 475.09119, "r": 286.36508, "b": 483.99774, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "metrical border lines between the grid rows and columns.", "bbox": {"l": 50.111984, "t": 487.04617, "r": 286.36502, "b": 495.95273, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Eventually this information is used to generate the missing", "bbox": {"l": 50.111984, "t": 499.00217, "r": 286.36511, "b": 507.90872, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "bounding boxes. Additionally, the existence of unused grid", "bbox": {"l": 50.111984, "t": 510.95715, "r": 286.36508, "b": 519.8637100000001, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "squares indicates that the table rows have unequal number", "bbox": {"l": 50.111984, "t": 522.91214, "r": 286.36508, "b": 531.8187, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "of columns and the overall structure is non-strict. The gen-", "bbox": {"l": 50.111984, "t": 534.86713, "r": 286.36505, "b": 543.7737, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "eration of missing bounding boxes for non-strict HTML ta-", "bbox": {"l": 50.111984, "t": 546.82214, "r": 286.36502, "b": 555.7287, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "bles is ambiguous and therefore quite challenging.", "bbox": {"l": 50.111984, "t": 558.77814, "r": 257.47351, "b": 567.68469, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "Thus,", "bbox": {"l": 263.94919, "t": 558.77814, "r": 286.36505, "b": 567.68469, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "we have decided to simply discard those tables. In case of", "bbox": {"l": 50.111984, "t": 570.73314, "r": 286.36508, "b": 579.63969, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "PubTabNet we have computed missing bounding boxes for", "bbox": {"l": 50.111984, "t": 582.68814, "r": 286.36511, "b": 591.5947, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "48% of the simple and 69% of the complex tables. Regard-", "bbox": {"l": 50.111984, "t": 594.64314, "r": 286.36511, "b": 603.5497, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "ing FinTabNet, 68% of the simple and 98% of the complex", "bbox": {"l": 50.111984, "t": 606.5981400000001, "r": 286.36505, "b": 615.5047, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "tables require the generation of bounding boxes.", "bbox": {"l": 50.111984, "t": 618.55315, "r": 242.2606, "b": 627.4597, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 50.111984, "t": 630.71014, "r": 286.36496, "b": 651.57269, "coord_origin": "TOPLEFT"}, "confidence": 0.9335853457450867, "cells": [{"id": 43, "text": "Figure 7 illustrates the distribution of the tables across", "bbox": {"l": 62.06698600000001, "t": 630.71014, "r": 286.36496, "b": 639.6167, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "different dimensions per dataset.", "bbox": {"l": 50.111984, "t": 642.66614, "r": 179.90472, "b": 651.57269, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "section_header", "bbox": {"l": 50.111984, "t": 662.39014, "r": 153.60785, "b": 672.24219, "coord_origin": "TOPLEFT"}, "confidence": 0.9515743255615234, "cells": [{"id": 45, "text": "1.2.", "bbox": {"l": 50.111984, "t": 662.39014, "r": 64.297272, "b": 672.24219, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "Synthetic datasets", "bbox": {"l": 73.754135, "t": 662.39014, "r": 153.60785, "b": 672.24219, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 50.111984, "t": 681.33113, "r": 286.36505, "b": 714.147705, "coord_origin": "TOPLEFT"}, "confidence": 0.9783332347869873, "cells": [{"id": 47, "text": "Aiming to train and evaluate our models in a broader", "bbox": {"l": 62.06698600000001, "t": 681.33113, "r": 286.36493, "b": 690.2377, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "spectrum of table data we have synthesized four types of", "bbox": {"l": 50.111984, "t": 693.2861330000001, "r": 286.36505, "b": 702.1927029999999, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "datasets.", "bbox": {"l": 50.111984, "t": 705.241135, "r": 84.144226, "b": 714.147705, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Each one contains tables with different appear-", "bbox": {"l": 91.237595, "t": 705.241135, "r": 286.36505, "b": 714.147705, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "text", "bbox": {"l": 308.862, "t": 162.65515000000005, "r": 545.11511, "b": 207.42773, "coord_origin": "TOPLEFT"}, "confidence": 0.9596064686775208, "cells": [{"id": 51, "text": "ances in regard to their size, structure, style and content.", "bbox": {"l": 308.862, "t": 162.65515000000005, "r": 545.11511, "b": 171.56170999999995, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Every synthetic dataset contains 150k examples, summing", "bbox": {"l": 308.862, "t": 174.61017000000004, "r": 545.11511, "b": 183.51671999999996, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "up to 600k synthetic examples. All datasets are divided into", "bbox": {"l": 308.862, "t": 186.56519000000003, "r": 545.11511, "b": 195.47173999999995, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "Train, Test and Val splits (80%, 10%, 10%).", "bbox": {"l": 308.862, "t": 198.52117999999996, "r": 484.07434, "b": 207.42773, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 308.862, "t": 211.23517000000004, "r": 545.11505, "b": 232.09673999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9261796474456787, "cells": [{"id": 55, "text": "The process of generating a synthetic dataset can be de-", "bbox": {"l": 320.81699, "t": 211.23517000000004, "r": 545.11505, "b": 220.14171999999996, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "composed into the following steps:", "bbox": {"l": 308.862, "t": 223.19019000000003, "r": 448.08939, "b": 232.09673999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "list_item", "bbox": {"l": 308.862, "t": 235.90521, "r": 545.11511, "b": 316.54279, "coord_origin": "TOPLEFT"}, "confidence": 0.9642952680587769, "cells": [{"id": 57, "text": "1.", "bbox": {"l": 320.81699, "t": 235.90521, "r": 328.28894, "b": 244.81177000000002, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Prepare styling and content templates: The styling", "bbox": {"l": 335.38232, "t": 235.90521, "r": 545.11499, "b": 244.81177000000002, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "templates have been manually designed and organized into", "bbox": {"l": 308.862, "t": 247.86023, "r": 545.11511, "b": 256.76678000000004, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "groups of scope specific appearances (e.g. financial data,", "bbox": {"l": 308.862, "t": 259.81525, "r": 545.11511, "b": 268.72180000000003, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "marketing data, etc.)", "bbox": {"l": 308.862, "t": 271.77026, "r": 393.3847, "b": 280.67682, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "Additionally, we have prepared cu-", "bbox": {"l": 400.11942, "t": 271.77026, "r": 545.11511, "b": 280.67682, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "rated collections of content templates by extracting the most", "bbox": {"l": 308.862, "t": 283.72524999999996, "r": 545.11505, "b": 292.63181, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "frequently used terms out of non-synthetic datasets (e.g.", "bbox": {"l": 308.862, "t": 295.68124, "r": 545.11511, "b": 304.5878000000001, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "PubTabNet, FinTabNet, etc.).", "bbox": {"l": 308.862, "t": 307.63623, "r": 425.69348, "b": 316.54279, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "list_item", "bbox": {"l": 308.862, "t": 320.35022, "r": 545.11517, "b": 448.80865, "coord_origin": "TOPLEFT"}, "confidence": 0.9699994921684265, "cells": [{"id": 66, "text": "2.", "bbox": {"l": 320.81699, "t": 320.35022, "r": 328.4949, "b": 329.25677, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "Generate table structures: The structure of each syn-", "bbox": {"l": 331.05423, "t": 320.35022, "r": 545.11499, "b": 329.25677, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "thetic dataset assumes a horizontal table header which po-", "bbox": {"l": 308.862, "t": 332.30521000000005, "r": 545.11517, "b": 341.21176, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "tentially spans over multiple rows and a table body that", "bbox": {"l": 308.862, "t": 344.26018999999997, "r": 545.11505, "b": 353.16675, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "may contain a combination of row spans and column spans.", "bbox": {"l": 308.862, "t": 356.21619, "r": 545.11511, "b": 365.12273999999996, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "However, spans are not allowed to cross the header - body", "bbox": {"l": 308.862, "t": 368.17117, "r": 545.11511, "b": 377.07773, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "boundary. The table structure is described by the parame-", "bbox": {"l": 308.862, "t": 380.12616, "r": 545.11499, "b": 389.03271, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "ters: Total number of table rows and columns, number of", "bbox": {"l": 308.862, "t": 392.08115, "r": 545.11517, "b": 400.98769999999996, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "header rows, type of spans (header only spans, row only", "bbox": {"l": 308.862, "t": 404.03613000000007, "r": 545.11511, "b": 412.94269, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "spans, column only spans, both row and column spans),", "bbox": {"l": 308.862, "t": 415.99112, "r": 545.11499, "b": 424.89767, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "maximum span size and the ratio of the table area covered", "bbox": {"l": 308.862, "t": 427.94711, "r": 545.11517, "b": 436.85367, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "by spans.", "bbox": {"l": 308.862, "t": 439.9021, "r": 345.94278, "b": 448.80865, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "list_item", "bbox": {"l": 308.862, "t": 452.61609, "r": 545.11517, "b": 497.38861, "coord_origin": "TOPLEFT"}, "confidence": 0.9568928480148315, "cells": [{"id": 78, "text": "3.", "bbox": {"l": 320.81699, "t": 452.61609, "r": 328.30341, "b": 461.52264, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "Generate content: Based on the dataset", "bbox": {"l": 330.79889, "t": 452.61609, "r": 485.75772000000006, "b": 461.52264, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "theme", "bbox": {"l": 488.073, "t": 452.70575, "r": 511.86368, "b": 461.29352, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": ", a set of", "bbox": {"l": 511.86301, "t": 452.61609, "r": 545.10815, "b": 461.52264, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "suitable content templates is chosen first. Then, this content", "bbox": {"l": 308.862, "t": 464.57108, "r": 545.11505, "b": 473.47763, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "can be combined with purely random text to produce the", "bbox": {"l": 308.862, "t": 476.52707, "r": 545.11517, "b": 485.43362, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "synthetic content.", "bbox": {"l": 308.862, "t": 488.48206, "r": 379.14816, "b": 497.38861, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "list_item", "bbox": {"l": 308.862, "t": 501.19604, "r": 545.1153, "b": 545.96858, "coord_origin": "TOPLEFT"}, "confidence": 0.9710659980773926, "cells": [{"id": 85, "text": "4.", "bbox": {"l": 320.81699, "t": 501.19604, "r": 328.66177, "b": 510.1026, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Apply styling templates: Depending on the domain", "bbox": {"l": 331.2767, "t": 501.19604, "r": 545.11493, "b": 510.1026, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "of the synthetic dataset, a set of styling templates is first", "bbox": {"l": 308.862, "t": 513.15103, "r": 545.1153, "b": 522.05759, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "manually selected.", "bbox": {"l": 308.862, "t": 525.10703, "r": 384.29883, "b": 534.01358, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "Then, a style is randomly selected to", "bbox": {"l": 391.25272, "t": 525.10703, "r": 545.11511, "b": 534.01358, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "format the appearance of the synthesized table.", "bbox": {"l": 308.862, "t": 537.06203, "r": 496.15897000000007, "b": 545.96858, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "list_item", "bbox": {"l": 308.862, "t": 549.77603, "r": 545.11517, "b": 606.50359, "coord_origin": "TOPLEFT"}, "confidence": 0.9778757095336914, "cells": [{"id": 91, "text": "5.", "bbox": {"l": 320.81699, "t": 549.77603, "r": 328.28894, "b": 558.68259, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Render the complete tables: The synthetic table is", "bbox": {"l": 335.40222, "t": 549.77603, "r": 545.11499, "b": 558.68259, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "finally rendered by a web browser engine to generate the", "bbox": {"l": 308.862, "t": 561.73103, "r": 545.11517, "b": 570.63759, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "bounding boxes for each table cell. A batching technique is", "bbox": {"l": 308.862, "t": 573.68604, "r": 545.11511, "b": 582.59259, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "utilized to optimize the runtime overhead of the rendering", "bbox": {"l": 308.862, "t": 585.64203, "r": 545.11505, "b": 594.54858, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "process.", "bbox": {"l": 308.862, "t": 597.59703, "r": 341.2305, "b": 606.50359, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "section_header", "bbox": {"l": 308.862, "t": 622.2905900000001, "r": 545.10876, "b": 646.98631, "coord_origin": "TOPLEFT"}, "confidence": 0.954940915107727, "cells": [{"id": 97, "text": "2.", "bbox": {"l": 308.862, "t": 622.2905900000001, "r": 316.76675, "b": 633.03831, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "Prediction post-processing for PDF docu-", "bbox": {"l": 327.30643, "t": 622.2905900000001, "r": 545.10876, "b": 633.03831, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "ments", "bbox": {"l": 326.79501, "t": 636.2385899999999, "r": 357.34055, "b": 646.98631, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 308.86203, "t": 657.42104, "r": 545.11517, "b": 714.148605, "coord_origin": "TOPLEFT"}, "confidence": 0.9829329252243042, "cells": [{"id": 100, "text": "Although TableFormer can predict the table structure and", "bbox": {"l": 320.81702, "t": 657.42104, "r": 545.11499, "b": 666.3276, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "the bounding boxes for tables recognized inside PDF docu-", "bbox": {"l": 308.86203, "t": 669.37604, "r": 545.11511, "b": 678.2826, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "ments, this is not enough when a full reconstruction of the", "bbox": {"l": 308.86203, "t": 681.33104, "r": 545.11517, "b": 690.2376, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "original table is required. This happens mainly due the fol-", "bbox": {"l": 308.86203, "t": 693.286041, "r": 545.11505, "b": 702.1926040000001, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "lowing reasons:", "bbox": {"l": 308.86203, "t": 705.242035, "r": 371.42719, "b": 714.148605, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "page_footer", "bbox": {"l": 292.63104, "t": 734.1330379999999, "r": 302.59363, "b": 743.0396, "coord_origin": "TOPLEFT"}, "confidence": 0.8986663222312927, "cells": [{"id": 105, "text": "11", "bbox": {"l": 292.63104, "t": 734.1330379999999, "r": 302.59363, "b": 743.0396, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "section_header", "id": 18, "page_no": 10, "cluster": {"id": 18, "label": "section_header", "bbox": {"l": 132.842, "t": 110.57488999999998, "r": 465.37591999999995, "b": 135.53008999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.6497084498405457, "cells": [{"id": 0, "text": "TableFormer: Table Structure Understanding with Transformers", "bbox": {"l": 132.842, "t": 110.57488999999998, "r": 465.37591999999995, "b": 121.32263, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Supplementary Material", "bbox": {"l": 220.18399, "t": 122.25982999999997, "r": 375.04269, "b": 135.53008999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "TableFormer: Table Structure Understanding with Transformers Supplementary Material"}, {"label": "section_header", "id": 13, "page_no": 10, "cluster": {"id": 13, "label": "section_header", "bbox": {"l": 50.111984, "t": 161.16089, "r": 175.96437, "b": 171.90863000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9454860091209412, "cells": [{"id": 2, "text": "1.", "bbox": {"l": 50.111984, "t": 161.16089, "r": 57.089828, "b": 171.90863000000002, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Details on the datasets", "bbox": {"l": 66.393616, "t": 161.16089, "r": 175.96437, "b": 171.90863000000002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1. Details on the datasets"}, {"label": "section_header", "id": 11, "page_no": 10, "cluster": {"id": 11, "label": "section_header", "bbox": {"l": 50.111984, "t": 180.97931000000005, "r": 150.36401, "b": 190.83136000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9535645842552185, "cells": [{"id": 4, "text": "1.1.", "bbox": {"l": 50.111984, "t": 180.97931000000005, "r": 64.210808, "b": 190.83136000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Data preparation", "bbox": {"l": 73.610023, "t": 180.97931000000005, "r": 150.36401, "b": 190.83136000000002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1.1. Data preparation"}, {"label": "text", "id": 0, "page_no": 10, "cluster": {"id": 0, "label": "text", "bbox": {"l": 50.111984, "t": 199.92029000000002, "r": 286.36514, "b": 388.15482000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9864971041679382, "cells": [{"id": 6, "text": "As a first step of our data preparation process, we have", "bbox": {"l": 62.06698600000001, "t": 199.92029000000002, "r": 286.36496, "b": 208.82683999999995, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "calculated statistics over the datasets across the following", "bbox": {"l": 50.111984, "t": 211.87627999999995, "r": 286.36505, "b": 220.78283999999996, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "dimensions: (1) table size measured in the number of rows", "bbox": {"l": 50.111984, "t": 223.83130000000006, "r": 286.36514, "b": 232.73784999999998, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "and columns, (2) complexity of the table, (3) strictness of", "bbox": {"l": 50.111984, "t": 235.78632000000005, "r": 286.36508, "b": 244.69286999999997, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "the provided HTML structure and (4) completeness (i.e. no", "bbox": {"l": 50.111984, "t": 247.74132999999995, "r": 286.36505, "b": 256.64788999999996, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "omitted bounding boxes). A table is considered to be simple", "bbox": {"l": 50.111984, "t": 259.69635000000005, "r": 286.36505, "b": 268.60290999999995, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "if it does not contain row spans or column spans. Addition-", "bbox": {"l": 50.111984, "t": 271.65137000000004, "r": 286.36505, "b": 280.55792, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "ally, a table has a strict HTML structure if every row has the", "bbox": {"l": 50.111984, "t": 283.60736, "r": 286.36502, "b": 292.5139199999999, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "same number of columns after taking into account any row", "bbox": {"l": 50.111984, "t": 295.56235, "r": 286.36505, "b": 304.4689, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "or column spans. Therefore a strict HTML structure looks", "bbox": {"l": 50.111984, "t": 307.5173300000001, "r": 286.36508, "b": 316.42389, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "always rectangular. However, HTML is a lenient encoding", "bbox": {"l": 50.111984, "t": 319.47232, "r": 286.36505, "b": 328.3788799999999, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "format, i.e. tables with rows of different sizes might still", "bbox": {"l": 50.111984, "t": 331.42731000000003, "r": 286.36502, "b": 340.33386, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "be regarded as correct due to implicit display rules. These", "bbox": {"l": 50.111984, "t": 343.3833, "r": 286.36508, "b": 352.28986, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "implicit rules leave room for ambiguity, which we want to", "bbox": {"l": 50.111984, "t": 355.33829, "r": 286.36505, "b": 364.24484000000007, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "avoid. As such, we prefer to have \u201dstrict\u201d tables, i.e. tables", "bbox": {"l": 50.111984, "t": 367.29327, "r": 286.36508, "b": 376.19983, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "where every row has exactly the same length.", "bbox": {"l": 50.111984, "t": 379.24826, "r": 230.80364999999998, "b": 388.15482000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "As a first step of our data preparation process, we have calculated statistics over the datasets across the following dimensions: (1) table size measured in the number of rows and columns, (2) complexity of the table, (3) strictness of the provided HTML structure and (4) completeness (i.e. no omitted bounding boxes). A table is considered to be simple if it does not contain row spans or column spans. Additionally, a table has a strict HTML structure if every row has the same number of columns after taking into account any row or column spans. Therefore a strict HTML structure looks always rectangular. However, HTML is a lenient encoding format, i.e. tables with rows of different sizes might still be regarded as correct due to implicit display rules. These implicit rules leave room for ambiguity, which we want to avoid. As such, we prefer to have \"strict\" tables, i.e. tables where every row has exactly the same length."}, {"label": "text", "id": 2, "page_no": 10, "cluster": {"id": 2, "label": "text", "bbox": {"l": 50.111984, "t": 391.40527, "r": 286.36511, "b": 627.4597, "coord_origin": "TOPLEFT"}, "confidence": 0.9826022386550903, "cells": [{"id": 22, "text": "We have developed a technique that tries to derive a", "bbox": {"l": 62.06698600000001, "t": 391.40527, "r": 286.36499, "b": 400.31183, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "missing bounding box out of its neighbors. As a first step,", "bbox": {"l": 50.111984, "t": 403.36026, "r": 286.36508, "b": 412.26681999999994, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "we use the annotation data to generate the most fine-grained", "bbox": {"l": 50.111984, "t": 415.31525, "r": 286.36505, "b": 424.22180000000003, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "grid that covers the table structure. In case of strict HTML", "bbox": {"l": 50.111984, "t": 427.2712399999999, "r": 286.36505, "b": 436.1778, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "tables, all grid squares are associated with some table cell", "bbox": {"l": 50.111984, "t": 439.22623, "r": 286.36508, "b": 448.1327800000001, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "and in the presence of table spans a cell extends across mul-", "bbox": {"l": 50.111984, "t": 451.18121, "r": 286.36511, "b": 460.08777, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "tiple grid squares. When enough bounding boxes are known", "bbox": {"l": 50.111984, "t": 463.1362, "r": 286.36505, "b": 472.04276, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "for a rectangular table, it is possible to compute the geo-", "bbox": {"l": 50.111984, "t": 475.09119, "r": 286.36508, "b": 483.99774, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "metrical border lines between the grid rows and columns.", "bbox": {"l": 50.111984, "t": 487.04617, "r": 286.36502, "b": 495.95273, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Eventually this information is used to generate the missing", "bbox": {"l": 50.111984, "t": 499.00217, "r": 286.36511, "b": 507.90872, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "bounding boxes. Additionally, the existence of unused grid", "bbox": {"l": 50.111984, "t": 510.95715, "r": 286.36508, "b": 519.8637100000001, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "squares indicates that the table rows have unequal number", "bbox": {"l": 50.111984, "t": 522.91214, "r": 286.36508, "b": 531.8187, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "of columns and the overall structure is non-strict. The gen-", "bbox": {"l": 50.111984, "t": 534.86713, "r": 286.36505, "b": 543.7737, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "eration of missing bounding boxes for non-strict HTML ta-", "bbox": {"l": 50.111984, "t": 546.82214, "r": 286.36502, "b": 555.7287, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "bles is ambiguous and therefore quite challenging.", "bbox": {"l": 50.111984, "t": 558.77814, "r": 257.47351, "b": 567.68469, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "Thus,", "bbox": {"l": 263.94919, "t": 558.77814, "r": 286.36505, "b": 567.68469, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "we have decided to simply discard those tables. In case of", "bbox": {"l": 50.111984, "t": 570.73314, "r": 286.36508, "b": 579.63969, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "PubTabNet we have computed missing bounding boxes for", "bbox": {"l": 50.111984, "t": 582.68814, "r": 286.36511, "b": 591.5947, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "48% of the simple and 69% of the complex tables. Regard-", "bbox": {"l": 50.111984, "t": 594.64314, "r": 286.36511, "b": 603.5497, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "ing FinTabNet, 68% of the simple and 98% of the complex", "bbox": {"l": 50.111984, "t": 606.5981400000001, "r": 286.36505, "b": 615.5047, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "tables require the generation of bounding boxes.", "bbox": {"l": 50.111984, "t": 618.55315, "r": 242.2606, "b": 627.4597, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "We have developed a technique that tries to derive a missing bounding box out of its neighbors. As a first step, we use the annotation data to generate the most fine-grained grid that covers the table structure. In case of strict HTML tables, all grid squares are associated with some table cell and in the presence of table spans a cell extends across multiple grid squares. When enough bounding boxes are known for a rectangular table, it is possible to compute the geometrical border lines between the grid rows and columns. Eventually this information is used to generate the missing bounding boxes. Additionally, the existence of unused grid squares indicates that the table rows have unequal number of columns and the overall structure is non-strict. The generation of missing bounding boxes for non-strict HTML tables is ambiguous and therefore quite challenging. Thus, we have decided to simply discard those tables. In case of PubTabNet we have computed missing bounding boxes for 48% of the simple and 69% of the complex tables. Regarding FinTabNet, 68% of the simple and 98% of the complex tables require the generation of bounding boxes."}, {"label": "text", "id": 14, "page_no": 10, "cluster": {"id": 14, "label": "text", "bbox": {"l": 50.111984, "t": 630.71014, "r": 286.36496, "b": 651.57269, "coord_origin": "TOPLEFT"}, "confidence": 0.9335853457450867, "cells": [{"id": 43, "text": "Figure 7 illustrates the distribution of the tables across", "bbox": {"l": 62.06698600000001, "t": 630.71014, "r": 286.36496, "b": 639.6167, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "different dimensions per dataset.", "bbox": {"l": 50.111984, "t": 642.66614, "r": 179.90472, "b": 651.57269, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 7 illustrates the distribution of the tables across different dimensions per dataset."}, {"label": "section_header", "id": 12, "page_no": 10, "cluster": {"id": 12, "label": "section_header", "bbox": {"l": 50.111984, "t": 662.39014, "r": 153.60785, "b": 672.24219, "coord_origin": "TOPLEFT"}, "confidence": 0.9515743255615234, "cells": [{"id": 45, "text": "1.2.", "bbox": {"l": 50.111984, "t": 662.39014, "r": 64.297272, "b": 672.24219, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "Synthetic datasets", "bbox": {"l": 73.754135, "t": 662.39014, "r": 153.60785, "b": 672.24219, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1.2. Synthetic datasets"}, {"label": "text", "id": 3, "page_no": 10, "cluster": {"id": 3, "label": "text", "bbox": {"l": 50.111984, "t": 681.33113, "r": 286.36505, "b": 714.147705, "coord_origin": "TOPLEFT"}, "confidence": 0.9783332347869873, "cells": [{"id": 47, "text": "Aiming to train and evaluate our models in a broader", "bbox": {"l": 62.06698600000001, "t": 681.33113, "r": 286.36493, "b": 690.2377, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "spectrum of table data we have synthesized four types of", "bbox": {"l": 50.111984, "t": 693.2861330000001, "r": 286.36505, "b": 702.1927029999999, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "datasets.", "bbox": {"l": 50.111984, "t": 705.241135, "r": 84.144226, "b": 714.147705, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Each one contains tables with different appear-", "bbox": {"l": 91.237595, "t": 705.241135, "r": 286.36505, "b": 714.147705, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Aiming to train and evaluate our models in a broader spectrum of table data we have synthesized four types of datasets. Each one contains tables with different appear-"}, {"label": "text", "id": 8, "page_no": 10, "cluster": {"id": 8, "label": "text", "bbox": {"l": 308.862, "t": 162.65515000000005, "r": 545.11511, "b": 207.42773, "coord_origin": "TOPLEFT"}, "confidence": 0.9596064686775208, "cells": [{"id": 51, "text": "ances in regard to their size, structure, style and content.", "bbox": {"l": 308.862, "t": 162.65515000000005, "r": 545.11511, "b": 171.56170999999995, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Every synthetic dataset contains 150k examples, summing", "bbox": {"l": 308.862, "t": 174.61017000000004, "r": 545.11511, "b": 183.51671999999996, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "up to 600k synthetic examples. All datasets are divided into", "bbox": {"l": 308.862, "t": 186.56519000000003, "r": 545.11511, "b": 195.47173999999995, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "Train, Test and Val splits (80%, 10%, 10%).", "bbox": {"l": 308.862, "t": 198.52117999999996, "r": 484.07434, "b": 207.42773, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "ances in regard to their size, structure, style and content. Every synthetic dataset contains 150k examples, summing up to 600k synthetic examples. All datasets are divided into Train, Test and Val splits (80%, 10%, 10%)."}, {"label": "text", "id": 15, "page_no": 10, "cluster": {"id": 15, "label": "text", "bbox": {"l": 308.862, "t": 211.23517000000004, "r": 545.11505, "b": 232.09673999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9261796474456787, "cells": [{"id": 55, "text": "The process of generating a synthetic dataset can be de-", "bbox": {"l": 320.81699, "t": 211.23517000000004, "r": 545.11505, "b": 220.14171999999996, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "composed into the following steps:", "bbox": {"l": 308.862, "t": 223.19019000000003, "r": 448.08939, "b": 232.09673999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The process of generating a synthetic dataset can be decomposed into the following steps:"}, {"label": "list_item", "id": 7, "page_no": 10, "cluster": {"id": 7, "label": "list_item", "bbox": {"l": 308.862, "t": 235.90521, "r": 545.11511, "b": 316.54279, "coord_origin": "TOPLEFT"}, "confidence": 0.9642952680587769, "cells": [{"id": 57, "text": "1.", "bbox": {"l": 320.81699, "t": 235.90521, "r": 328.28894, "b": 244.81177000000002, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Prepare styling and content templates: The styling", "bbox": {"l": 335.38232, "t": 235.90521, "r": 545.11499, "b": 244.81177000000002, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "templates have been manually designed and organized into", "bbox": {"l": 308.862, "t": 247.86023, "r": 545.11511, "b": 256.76678000000004, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "groups of scope specific appearances (e.g. financial data,", "bbox": {"l": 308.862, "t": 259.81525, "r": 545.11511, "b": 268.72180000000003, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "marketing data, etc.)", "bbox": {"l": 308.862, "t": 271.77026, "r": 393.3847, "b": 280.67682, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "Additionally, we have prepared cu-", "bbox": {"l": 400.11942, "t": 271.77026, "r": 545.11511, "b": 280.67682, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "rated collections of content templates by extracting the most", "bbox": {"l": 308.862, "t": 283.72524999999996, "r": 545.11505, "b": 292.63181, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "frequently used terms out of non-synthetic datasets (e.g.", "bbox": {"l": 308.862, "t": 295.68124, "r": 545.11511, "b": 304.5878000000001, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "PubTabNet, FinTabNet, etc.).", "bbox": {"l": 308.862, "t": 307.63623, "r": 425.69348, "b": 316.54279, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1. Prepare styling and content templates: The styling templates have been manually designed and organized into groups of scope specific appearances (e.g. financial data, marketing data, etc.) Additionally, we have prepared curated collections of content templates by extracting the most frequently used terms out of non-synthetic datasets (e.g. PubTabNet, FinTabNet, etc.)."}, {"label": "list_item", "id": 6, "page_no": 10, "cluster": {"id": 6, "label": "list_item", "bbox": {"l": 308.862, "t": 320.35022, "r": 545.11517, "b": 448.80865, "coord_origin": "TOPLEFT"}, "confidence": 0.9699994921684265, "cells": [{"id": 66, "text": "2.", "bbox": {"l": 320.81699, "t": 320.35022, "r": 328.4949, "b": 329.25677, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "Generate table structures: The structure of each syn-", "bbox": {"l": 331.05423, "t": 320.35022, "r": 545.11499, "b": 329.25677, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "thetic dataset assumes a horizontal table header which po-", "bbox": {"l": 308.862, "t": 332.30521000000005, "r": 545.11517, "b": 341.21176, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "tentially spans over multiple rows and a table body that", "bbox": {"l": 308.862, "t": 344.26018999999997, "r": 545.11505, "b": 353.16675, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "may contain a combination of row spans and column spans.", "bbox": {"l": 308.862, "t": 356.21619, "r": 545.11511, "b": 365.12273999999996, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "However, spans are not allowed to cross the header - body", "bbox": {"l": 308.862, "t": 368.17117, "r": 545.11511, "b": 377.07773, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "boundary. The table structure is described by the parame-", "bbox": {"l": 308.862, "t": 380.12616, "r": 545.11499, "b": 389.03271, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "ters: Total number of table rows and columns, number of", "bbox": {"l": 308.862, "t": 392.08115, "r": 545.11517, "b": 400.98769999999996, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "header rows, type of spans (header only spans, row only", "bbox": {"l": 308.862, "t": 404.03613000000007, "r": 545.11511, "b": 412.94269, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "spans, column only spans, both row and column spans),", "bbox": {"l": 308.862, "t": 415.99112, "r": 545.11499, "b": 424.89767, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "maximum span size and the ratio of the table area covered", "bbox": {"l": 308.862, "t": 427.94711, "r": 545.11517, "b": 436.85367, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "by spans.", "bbox": {"l": 308.862, "t": 439.9021, "r": 345.94278, "b": 448.80865, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2. Generate table structures: The structure of each synthetic dataset assumes a horizontal table header which potentially spans over multiple rows and a table body that may contain a combination of row spans and column spans. However, spans are not allowed to cross the header - body boundary. The table structure is described by the parameters: Total number of table rows and columns, number of header rows, type of spans (header only spans, row only spans, column only spans, both row and column spans), maximum span size and the ratio of the table area covered by spans."}, {"label": "list_item", "id": 9, "page_no": 10, "cluster": {"id": 9, "label": "list_item", "bbox": {"l": 308.862, "t": 452.61609, "r": 545.11517, "b": 497.38861, "coord_origin": "TOPLEFT"}, "confidence": 0.9568928480148315, "cells": [{"id": 78, "text": "3.", "bbox": {"l": 320.81699, "t": 452.61609, "r": 328.30341, "b": 461.52264, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "Generate content: Based on the dataset", "bbox": {"l": 330.79889, "t": 452.61609, "r": 485.75772000000006, "b": 461.52264, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "theme", "bbox": {"l": 488.073, "t": 452.70575, "r": 511.86368, "b": 461.29352, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": ", a set of", "bbox": {"l": 511.86301, "t": 452.61609, "r": 545.10815, "b": 461.52264, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "suitable content templates is chosen first. Then, this content", "bbox": {"l": 308.862, "t": 464.57108, "r": 545.11505, "b": 473.47763, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "can be combined with purely random text to produce the", "bbox": {"l": 308.862, "t": 476.52707, "r": 545.11517, "b": 485.43362, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "synthetic content.", "bbox": {"l": 308.862, "t": 488.48206, "r": 379.14816, "b": 497.38861, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3. Generate content: Based on the dataset theme , a set of suitable content templates is chosen first. Then, this content can be combined with purely random text to produce the synthetic content."}, {"label": "list_item", "id": 5, "page_no": 10, "cluster": {"id": 5, "label": "list_item", "bbox": {"l": 308.862, "t": 501.19604, "r": 545.1153, "b": 545.96858, "coord_origin": "TOPLEFT"}, "confidence": 0.9710659980773926, "cells": [{"id": 85, "text": "4.", "bbox": {"l": 320.81699, "t": 501.19604, "r": 328.66177, "b": 510.1026, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Apply styling templates: Depending on the domain", "bbox": {"l": 331.2767, "t": 501.19604, "r": 545.11493, "b": 510.1026, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "of the synthetic dataset, a set of styling templates is first", "bbox": {"l": 308.862, "t": 513.15103, "r": 545.1153, "b": 522.05759, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "manually selected.", "bbox": {"l": 308.862, "t": 525.10703, "r": 384.29883, "b": 534.01358, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "Then, a style is randomly selected to", "bbox": {"l": 391.25272, "t": 525.10703, "r": 545.11511, "b": 534.01358, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "format the appearance of the synthesized table.", "bbox": {"l": 308.862, "t": 537.06203, "r": 496.15897000000007, "b": 545.96858, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4. Apply styling templates: Depending on the domain of the synthetic dataset, a set of styling templates is first manually selected. Then, a style is randomly selected to format the appearance of the synthesized table."}, {"label": "list_item", "id": 4, "page_no": 10, "cluster": {"id": 4, "label": "list_item", "bbox": {"l": 308.862, "t": 549.77603, "r": 545.11517, "b": 606.50359, "coord_origin": "TOPLEFT"}, "confidence": 0.9778757095336914, "cells": [{"id": 91, "text": "5.", "bbox": {"l": 320.81699, "t": 549.77603, "r": 328.28894, "b": 558.68259, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Render the complete tables: The synthetic table is", "bbox": {"l": 335.40222, "t": 549.77603, "r": 545.11499, "b": 558.68259, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "finally rendered by a web browser engine to generate the", "bbox": {"l": 308.862, "t": 561.73103, "r": 545.11517, "b": 570.63759, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "bounding boxes for each table cell. A batching technique is", "bbox": {"l": 308.862, "t": 573.68604, "r": 545.11511, "b": 582.59259, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "utilized to optimize the runtime overhead of the rendering", "bbox": {"l": 308.862, "t": 585.64203, "r": 545.11505, "b": 594.54858, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "process.", "bbox": {"l": 308.862, "t": 597.59703, "r": 341.2305, "b": 606.50359, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5. Render the complete tables: The synthetic table is finally rendered by a web browser engine to generate the bounding boxes for each table cell. A batching technique is utilized to optimize the runtime overhead of the rendering process."}, {"label": "section_header", "id": 10, "page_no": 10, "cluster": {"id": 10, "label": "section_header", "bbox": {"l": 308.862, "t": 622.2905900000001, "r": 545.10876, "b": 646.98631, "coord_origin": "TOPLEFT"}, "confidence": 0.954940915107727, "cells": [{"id": 97, "text": "2.", "bbox": {"l": 308.862, "t": 622.2905900000001, "r": 316.76675, "b": 633.03831, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "Prediction post-processing for PDF docu-", "bbox": {"l": 327.30643, "t": 622.2905900000001, "r": 545.10876, "b": 633.03831, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "ments", "bbox": {"l": 326.79501, "t": 636.2385899999999, "r": 357.34055, "b": 646.98631, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2. Prediction post-processing for PDF documents"}, {"label": "text", "id": 1, "page_no": 10, "cluster": {"id": 1, "label": "text", "bbox": {"l": 308.86203, "t": 657.42104, "r": 545.11517, "b": 714.148605, "coord_origin": "TOPLEFT"}, "confidence": 0.9829329252243042, "cells": [{"id": 100, "text": "Although TableFormer can predict the table structure and", "bbox": {"l": 320.81702, "t": 657.42104, "r": 545.11499, "b": 666.3276, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "the bounding boxes for tables recognized inside PDF docu-", "bbox": {"l": 308.86203, "t": 669.37604, "r": 545.11511, "b": 678.2826, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "ments, this is not enough when a full reconstruction of the", "bbox": {"l": 308.86203, "t": 681.33104, "r": 545.11517, "b": 690.2376, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "original table is required. This happens mainly due the fol-", "bbox": {"l": 308.86203, "t": 693.286041, "r": 545.11505, "b": 702.1926040000001, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "lowing reasons:", "bbox": {"l": 308.86203, "t": 705.242035, "r": 371.42719, "b": 714.148605, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Although TableFormer can predict the table structure and the bounding boxes for tables recognized inside PDF documents, this is not enough when a full reconstruction of the original table is required. This happens mainly due the following reasons:"}, {"label": "page_footer", "id": 16, "page_no": 10, "cluster": {"id": 16, "label": "page_footer", "bbox": {"l": 292.63104, "t": 734.1330379999999, "r": 302.59363, "b": 743.0396, "coord_origin": "TOPLEFT"}, "confidence": 0.8986663222312927, "cells": [{"id": 105, "text": "11", "bbox": {"l": 292.63104, "t": 734.1330379999999, "r": 302.59363, "b": 743.0396, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "11"}], "body": [{"label": "section_header", "id": 18, "page_no": 10, "cluster": {"id": 18, "label": "section_header", "bbox": {"l": 132.842, "t": 110.57488999999998, "r": 465.37591999999995, "b": 135.53008999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.6497084498405457, "cells": [{"id": 0, "text": "TableFormer: Table Structure Understanding with Transformers", "bbox": {"l": 132.842, "t": 110.57488999999998, "r": 465.37591999999995, "b": 121.32263, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Supplementary Material", "bbox": {"l": 220.18399, "t": 122.25982999999997, "r": 375.04269, "b": 135.53008999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "TableFormer: Table Structure Understanding with Transformers Supplementary Material"}, {"label": "section_header", "id": 13, "page_no": 10, "cluster": {"id": 13, "label": "section_header", "bbox": {"l": 50.111984, "t": 161.16089, "r": 175.96437, "b": 171.90863000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9454860091209412, "cells": [{"id": 2, "text": "1.", "bbox": {"l": 50.111984, "t": 161.16089, "r": 57.089828, "b": 171.90863000000002, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Details on the datasets", "bbox": {"l": 66.393616, "t": 161.16089, "r": 175.96437, "b": 171.90863000000002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1. Details on the datasets"}, {"label": "section_header", "id": 11, "page_no": 10, "cluster": {"id": 11, "label": "section_header", "bbox": {"l": 50.111984, "t": 180.97931000000005, "r": 150.36401, "b": 190.83136000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9535645842552185, "cells": [{"id": 4, "text": "1.1.", "bbox": {"l": 50.111984, "t": 180.97931000000005, "r": 64.210808, "b": 190.83136000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Data preparation", "bbox": {"l": 73.610023, "t": 180.97931000000005, "r": 150.36401, "b": 190.83136000000002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1.1. Data preparation"}, {"label": "text", "id": 0, "page_no": 10, "cluster": {"id": 0, "label": "text", "bbox": {"l": 50.111984, "t": 199.92029000000002, "r": 286.36514, "b": 388.15482000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9864971041679382, "cells": [{"id": 6, "text": "As a first step of our data preparation process, we have", "bbox": {"l": 62.06698600000001, "t": 199.92029000000002, "r": 286.36496, "b": 208.82683999999995, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "calculated statistics over the datasets across the following", "bbox": {"l": 50.111984, "t": 211.87627999999995, "r": 286.36505, "b": 220.78283999999996, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "dimensions: (1) table size measured in the number of rows", "bbox": {"l": 50.111984, "t": 223.83130000000006, "r": 286.36514, "b": 232.73784999999998, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "and columns, (2) complexity of the table, (3) strictness of", "bbox": {"l": 50.111984, "t": 235.78632000000005, "r": 286.36508, "b": 244.69286999999997, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "the provided HTML structure and (4) completeness (i.e. no", "bbox": {"l": 50.111984, "t": 247.74132999999995, "r": 286.36505, "b": 256.64788999999996, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "omitted bounding boxes). A table is considered to be simple", "bbox": {"l": 50.111984, "t": 259.69635000000005, "r": 286.36505, "b": 268.60290999999995, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "if it does not contain row spans or column spans. Addition-", "bbox": {"l": 50.111984, "t": 271.65137000000004, "r": 286.36505, "b": 280.55792, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "ally, a table has a strict HTML structure if every row has the", "bbox": {"l": 50.111984, "t": 283.60736, "r": 286.36502, "b": 292.5139199999999, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "same number of columns after taking into account any row", "bbox": {"l": 50.111984, "t": 295.56235, "r": 286.36505, "b": 304.4689, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "or column spans. Therefore a strict HTML structure looks", "bbox": {"l": 50.111984, "t": 307.5173300000001, "r": 286.36508, "b": 316.42389, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "always rectangular. However, HTML is a lenient encoding", "bbox": {"l": 50.111984, "t": 319.47232, "r": 286.36505, "b": 328.3788799999999, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "format, i.e. tables with rows of different sizes might still", "bbox": {"l": 50.111984, "t": 331.42731000000003, "r": 286.36502, "b": 340.33386, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "be regarded as correct due to implicit display rules. These", "bbox": {"l": 50.111984, "t": 343.3833, "r": 286.36508, "b": 352.28986, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "implicit rules leave room for ambiguity, which we want to", "bbox": {"l": 50.111984, "t": 355.33829, "r": 286.36505, "b": 364.24484000000007, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "avoid. As such, we prefer to have \u201dstrict\u201d tables, i.e. tables", "bbox": {"l": 50.111984, "t": 367.29327, "r": 286.36508, "b": 376.19983, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "where every row has exactly the same length.", "bbox": {"l": 50.111984, "t": 379.24826, "r": 230.80364999999998, "b": 388.15482000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "As a first step of our data preparation process, we have calculated statistics over the datasets across the following dimensions: (1) table size measured in the number of rows and columns, (2) complexity of the table, (3) strictness of the provided HTML structure and (4) completeness (i.e. no omitted bounding boxes). A table is considered to be simple if it does not contain row spans or column spans. Additionally, a table has a strict HTML structure if every row has the same number of columns after taking into account any row or column spans. Therefore a strict HTML structure looks always rectangular. However, HTML is a lenient encoding format, i.e. tables with rows of different sizes might still be regarded as correct due to implicit display rules. These implicit rules leave room for ambiguity, which we want to avoid. As such, we prefer to have \"strict\" tables, i.e. tables where every row has exactly the same length."}, {"label": "text", "id": 2, "page_no": 10, "cluster": {"id": 2, "label": "text", "bbox": {"l": 50.111984, "t": 391.40527, "r": 286.36511, "b": 627.4597, "coord_origin": "TOPLEFT"}, "confidence": 0.9826022386550903, "cells": [{"id": 22, "text": "We have developed a technique that tries to derive a", "bbox": {"l": 62.06698600000001, "t": 391.40527, "r": 286.36499, "b": 400.31183, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "missing bounding box out of its neighbors. As a first step,", "bbox": {"l": 50.111984, "t": 403.36026, "r": 286.36508, "b": 412.26681999999994, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "we use the annotation data to generate the most fine-grained", "bbox": {"l": 50.111984, "t": 415.31525, "r": 286.36505, "b": 424.22180000000003, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "grid that covers the table structure. In case of strict HTML", "bbox": {"l": 50.111984, "t": 427.2712399999999, "r": 286.36505, "b": 436.1778, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "tables, all grid squares are associated with some table cell", "bbox": {"l": 50.111984, "t": 439.22623, "r": 286.36508, "b": 448.1327800000001, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "and in the presence of table spans a cell extends across mul-", "bbox": {"l": 50.111984, "t": 451.18121, "r": 286.36511, "b": 460.08777, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "tiple grid squares. When enough bounding boxes are known", "bbox": {"l": 50.111984, "t": 463.1362, "r": 286.36505, "b": 472.04276, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "for a rectangular table, it is possible to compute the geo-", "bbox": {"l": 50.111984, "t": 475.09119, "r": 286.36508, "b": 483.99774, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "metrical border lines between the grid rows and columns.", "bbox": {"l": 50.111984, "t": 487.04617, "r": 286.36502, "b": 495.95273, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Eventually this information is used to generate the missing", "bbox": {"l": 50.111984, "t": 499.00217, "r": 286.36511, "b": 507.90872, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "bounding boxes. Additionally, the existence of unused grid", "bbox": {"l": 50.111984, "t": 510.95715, "r": 286.36508, "b": 519.8637100000001, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "squares indicates that the table rows have unequal number", "bbox": {"l": 50.111984, "t": 522.91214, "r": 286.36508, "b": 531.8187, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "of columns and the overall structure is non-strict. The gen-", "bbox": {"l": 50.111984, "t": 534.86713, "r": 286.36505, "b": 543.7737, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "eration of missing bounding boxes for non-strict HTML ta-", "bbox": {"l": 50.111984, "t": 546.82214, "r": 286.36502, "b": 555.7287, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "bles is ambiguous and therefore quite challenging.", "bbox": {"l": 50.111984, "t": 558.77814, "r": 257.47351, "b": 567.68469, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "Thus,", "bbox": {"l": 263.94919, "t": 558.77814, "r": 286.36505, "b": 567.68469, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "we have decided to simply discard those tables. In case of", "bbox": {"l": 50.111984, "t": 570.73314, "r": 286.36508, "b": 579.63969, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "PubTabNet we have computed missing bounding boxes for", "bbox": {"l": 50.111984, "t": 582.68814, "r": 286.36511, "b": 591.5947, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "48% of the simple and 69% of the complex tables. Regard-", "bbox": {"l": 50.111984, "t": 594.64314, "r": 286.36511, "b": 603.5497, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "ing FinTabNet, 68% of the simple and 98% of the complex", "bbox": {"l": 50.111984, "t": 606.5981400000001, "r": 286.36505, "b": 615.5047, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "tables require the generation of bounding boxes.", "bbox": {"l": 50.111984, "t": 618.55315, "r": 242.2606, "b": 627.4597, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "We have developed a technique that tries to derive a missing bounding box out of its neighbors. As a first step, we use the annotation data to generate the most fine-grained grid that covers the table structure. In case of strict HTML tables, all grid squares are associated with some table cell and in the presence of table spans a cell extends across multiple grid squares. When enough bounding boxes are known for a rectangular table, it is possible to compute the geometrical border lines between the grid rows and columns. Eventually this information is used to generate the missing bounding boxes. Additionally, the existence of unused grid squares indicates that the table rows have unequal number of columns and the overall structure is non-strict. The generation of missing bounding boxes for non-strict HTML tables is ambiguous and therefore quite challenging. Thus, we have decided to simply discard those tables. In case of PubTabNet we have computed missing bounding boxes for 48% of the simple and 69% of the complex tables. Regarding FinTabNet, 68% of the simple and 98% of the complex tables require the generation of bounding boxes."}, {"label": "text", "id": 14, "page_no": 10, "cluster": {"id": 14, "label": "text", "bbox": {"l": 50.111984, "t": 630.71014, "r": 286.36496, "b": 651.57269, "coord_origin": "TOPLEFT"}, "confidence": 0.9335853457450867, "cells": [{"id": 43, "text": "Figure 7 illustrates the distribution of the tables across", "bbox": {"l": 62.06698600000001, "t": 630.71014, "r": 286.36496, "b": 639.6167, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "different dimensions per dataset.", "bbox": {"l": 50.111984, "t": 642.66614, "r": 179.90472, "b": 651.57269, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 7 illustrates the distribution of the tables across different dimensions per dataset."}, {"label": "section_header", "id": 12, "page_no": 10, "cluster": {"id": 12, "label": "section_header", "bbox": {"l": 50.111984, "t": 662.39014, "r": 153.60785, "b": 672.24219, "coord_origin": "TOPLEFT"}, "confidence": 0.9515743255615234, "cells": [{"id": 45, "text": "1.2.", "bbox": {"l": 50.111984, "t": 662.39014, "r": 64.297272, "b": 672.24219, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "Synthetic datasets", "bbox": {"l": 73.754135, "t": 662.39014, "r": 153.60785, "b": 672.24219, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1.2. Synthetic datasets"}, {"label": "text", "id": 3, "page_no": 10, "cluster": {"id": 3, "label": "text", "bbox": {"l": 50.111984, "t": 681.33113, "r": 286.36505, "b": 714.147705, "coord_origin": "TOPLEFT"}, "confidence": 0.9783332347869873, "cells": [{"id": 47, "text": "Aiming to train and evaluate our models in a broader", "bbox": {"l": 62.06698600000001, "t": 681.33113, "r": 286.36493, "b": 690.2377, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "spectrum of table data we have synthesized four types of", "bbox": {"l": 50.111984, "t": 693.2861330000001, "r": 286.36505, "b": 702.1927029999999, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "datasets.", "bbox": {"l": 50.111984, "t": 705.241135, "r": 84.144226, "b": 714.147705, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Each one contains tables with different appear-", "bbox": {"l": 91.237595, "t": 705.241135, "r": 286.36505, "b": 714.147705, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Aiming to train and evaluate our models in a broader spectrum of table data we have synthesized four types of datasets. Each one contains tables with different appear-"}, {"label": "text", "id": 8, "page_no": 10, "cluster": {"id": 8, "label": "text", "bbox": {"l": 308.862, "t": 162.65515000000005, "r": 545.11511, "b": 207.42773, "coord_origin": "TOPLEFT"}, "confidence": 0.9596064686775208, "cells": [{"id": 51, "text": "ances in regard to their size, structure, style and content.", "bbox": {"l": 308.862, "t": 162.65515000000005, "r": 545.11511, "b": 171.56170999999995, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Every synthetic dataset contains 150k examples, summing", "bbox": {"l": 308.862, "t": 174.61017000000004, "r": 545.11511, "b": 183.51671999999996, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "up to 600k synthetic examples. All datasets are divided into", "bbox": {"l": 308.862, "t": 186.56519000000003, "r": 545.11511, "b": 195.47173999999995, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "Train, Test and Val splits (80%, 10%, 10%).", "bbox": {"l": 308.862, "t": 198.52117999999996, "r": 484.07434, "b": 207.42773, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "ances in regard to their size, structure, style and content. Every synthetic dataset contains 150k examples, summing up to 600k synthetic examples. All datasets are divided into Train, Test and Val splits (80%, 10%, 10%)."}, {"label": "text", "id": 15, "page_no": 10, "cluster": {"id": 15, "label": "text", "bbox": {"l": 308.862, "t": 211.23517000000004, "r": 545.11505, "b": 232.09673999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9261796474456787, "cells": [{"id": 55, "text": "The process of generating a synthetic dataset can be de-", "bbox": {"l": 320.81699, "t": 211.23517000000004, "r": 545.11505, "b": 220.14171999999996, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "composed into the following steps:", "bbox": {"l": 308.862, "t": 223.19019000000003, "r": 448.08939, "b": 232.09673999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The process of generating a synthetic dataset can be decomposed into the following steps:"}, {"label": "list_item", "id": 7, "page_no": 10, "cluster": {"id": 7, "label": "list_item", "bbox": {"l": 308.862, "t": 235.90521, "r": 545.11511, "b": 316.54279, "coord_origin": "TOPLEFT"}, "confidence": 0.9642952680587769, "cells": [{"id": 57, "text": "1.", "bbox": {"l": 320.81699, "t": 235.90521, "r": 328.28894, "b": 244.81177000000002, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Prepare styling and content templates: The styling", "bbox": {"l": 335.38232, "t": 235.90521, "r": 545.11499, "b": 244.81177000000002, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "templates have been manually designed and organized into", "bbox": {"l": 308.862, "t": 247.86023, "r": 545.11511, "b": 256.76678000000004, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "groups of scope specific appearances (e.g. financial data,", "bbox": {"l": 308.862, "t": 259.81525, "r": 545.11511, "b": 268.72180000000003, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "marketing data, etc.)", "bbox": {"l": 308.862, "t": 271.77026, "r": 393.3847, "b": 280.67682, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "Additionally, we have prepared cu-", "bbox": {"l": 400.11942, "t": 271.77026, "r": 545.11511, "b": 280.67682, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "rated collections of content templates by extracting the most", "bbox": {"l": 308.862, "t": 283.72524999999996, "r": 545.11505, "b": 292.63181, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "frequently used terms out of non-synthetic datasets (e.g.", "bbox": {"l": 308.862, "t": 295.68124, "r": 545.11511, "b": 304.5878000000001, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "PubTabNet, FinTabNet, etc.).", "bbox": {"l": 308.862, "t": 307.63623, "r": 425.69348, "b": 316.54279, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1. Prepare styling and content templates: The styling templates have been manually designed and organized into groups of scope specific appearances (e.g. financial data, marketing data, etc.) Additionally, we have prepared curated collections of content templates by extracting the most frequently used terms out of non-synthetic datasets (e.g. PubTabNet, FinTabNet, etc.)."}, {"label": "list_item", "id": 6, "page_no": 10, "cluster": {"id": 6, "label": "list_item", "bbox": {"l": 308.862, "t": 320.35022, "r": 545.11517, "b": 448.80865, "coord_origin": "TOPLEFT"}, "confidence": 0.9699994921684265, "cells": [{"id": 66, "text": "2.", "bbox": {"l": 320.81699, "t": 320.35022, "r": 328.4949, "b": 329.25677, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "Generate table structures: The structure of each syn-", "bbox": {"l": 331.05423, "t": 320.35022, "r": 545.11499, "b": 329.25677, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "thetic dataset assumes a horizontal table header which po-", "bbox": {"l": 308.862, "t": 332.30521000000005, "r": 545.11517, "b": 341.21176, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "tentially spans over multiple rows and a table body that", "bbox": {"l": 308.862, "t": 344.26018999999997, "r": 545.11505, "b": 353.16675, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "may contain a combination of row spans and column spans.", "bbox": {"l": 308.862, "t": 356.21619, "r": 545.11511, "b": 365.12273999999996, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "However, spans are not allowed to cross the header - body", "bbox": {"l": 308.862, "t": 368.17117, "r": 545.11511, "b": 377.07773, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "boundary. The table structure is described by the parame-", "bbox": {"l": 308.862, "t": 380.12616, "r": 545.11499, "b": 389.03271, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "ters: Total number of table rows and columns, number of", "bbox": {"l": 308.862, "t": 392.08115, "r": 545.11517, "b": 400.98769999999996, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "header rows, type of spans (header only spans, row only", "bbox": {"l": 308.862, "t": 404.03613000000007, "r": 545.11511, "b": 412.94269, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "spans, column only spans, both row and column spans),", "bbox": {"l": 308.862, "t": 415.99112, "r": 545.11499, "b": 424.89767, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "maximum span size and the ratio of the table area covered", "bbox": {"l": 308.862, "t": 427.94711, "r": 545.11517, "b": 436.85367, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "by spans.", "bbox": {"l": 308.862, "t": 439.9021, "r": 345.94278, "b": 448.80865, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2. Generate table structures: The structure of each synthetic dataset assumes a horizontal table header which potentially spans over multiple rows and a table body that may contain a combination of row spans and column spans. However, spans are not allowed to cross the header - body boundary. The table structure is described by the parameters: Total number of table rows and columns, number of header rows, type of spans (header only spans, row only spans, column only spans, both row and column spans), maximum span size and the ratio of the table area covered by spans."}, {"label": "list_item", "id": 9, "page_no": 10, "cluster": {"id": 9, "label": "list_item", "bbox": {"l": 308.862, "t": 452.61609, "r": 545.11517, "b": 497.38861, "coord_origin": "TOPLEFT"}, "confidence": 0.9568928480148315, "cells": [{"id": 78, "text": "3.", "bbox": {"l": 320.81699, "t": 452.61609, "r": 328.30341, "b": 461.52264, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "Generate content: Based on the dataset", "bbox": {"l": 330.79889, "t": 452.61609, "r": 485.75772000000006, "b": 461.52264, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "theme", "bbox": {"l": 488.073, "t": 452.70575, "r": 511.86368, "b": 461.29352, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": ", a set of", "bbox": {"l": 511.86301, "t": 452.61609, "r": 545.10815, "b": 461.52264, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "suitable content templates is chosen first. Then, this content", "bbox": {"l": 308.862, "t": 464.57108, "r": 545.11505, "b": 473.47763, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "can be combined with purely random text to produce the", "bbox": {"l": 308.862, "t": 476.52707, "r": 545.11517, "b": 485.43362, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "synthetic content.", "bbox": {"l": 308.862, "t": 488.48206, "r": 379.14816, "b": 497.38861, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3. Generate content: Based on the dataset theme , a set of suitable content templates is chosen first. Then, this content can be combined with purely random text to produce the synthetic content."}, {"label": "list_item", "id": 5, "page_no": 10, "cluster": {"id": 5, "label": "list_item", "bbox": {"l": 308.862, "t": 501.19604, "r": 545.1153, "b": 545.96858, "coord_origin": "TOPLEFT"}, "confidence": 0.9710659980773926, "cells": [{"id": 85, "text": "4.", "bbox": {"l": 320.81699, "t": 501.19604, "r": 328.66177, "b": 510.1026, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Apply styling templates: Depending on the domain", "bbox": {"l": 331.2767, "t": 501.19604, "r": 545.11493, "b": 510.1026, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "of the synthetic dataset, a set of styling templates is first", "bbox": {"l": 308.862, "t": 513.15103, "r": 545.1153, "b": 522.05759, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "manually selected.", "bbox": {"l": 308.862, "t": 525.10703, "r": 384.29883, "b": 534.01358, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "Then, a style is randomly selected to", "bbox": {"l": 391.25272, "t": 525.10703, "r": 545.11511, "b": 534.01358, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "format the appearance of the synthesized table.", "bbox": {"l": 308.862, "t": 537.06203, "r": 496.15897000000007, "b": 545.96858, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4. Apply styling templates: Depending on the domain of the synthetic dataset, a set of styling templates is first manually selected. Then, a style is randomly selected to format the appearance of the synthesized table."}, {"label": "list_item", "id": 4, "page_no": 10, "cluster": {"id": 4, "label": "list_item", "bbox": {"l": 308.862, "t": 549.77603, "r": 545.11517, "b": 606.50359, "coord_origin": "TOPLEFT"}, "confidence": 0.9778757095336914, "cells": [{"id": 91, "text": "5.", "bbox": {"l": 320.81699, "t": 549.77603, "r": 328.28894, "b": 558.68259, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Render the complete tables: The synthetic table is", "bbox": {"l": 335.40222, "t": 549.77603, "r": 545.11499, "b": 558.68259, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "finally rendered by a web browser engine to generate the", "bbox": {"l": 308.862, "t": 561.73103, "r": 545.11517, "b": 570.63759, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "bounding boxes for each table cell. A batching technique is", "bbox": {"l": 308.862, "t": 573.68604, "r": 545.11511, "b": 582.59259, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "utilized to optimize the runtime overhead of the rendering", "bbox": {"l": 308.862, "t": 585.64203, "r": 545.11505, "b": 594.54858, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "process.", "bbox": {"l": 308.862, "t": 597.59703, "r": 341.2305, "b": 606.50359, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5. Render the complete tables: The synthetic table is finally rendered by a web browser engine to generate the bounding boxes for each table cell. A batching technique is utilized to optimize the runtime overhead of the rendering process."}, {"label": "section_header", "id": 10, "page_no": 10, "cluster": {"id": 10, "label": "section_header", "bbox": {"l": 308.862, "t": 622.2905900000001, "r": 545.10876, "b": 646.98631, "coord_origin": "TOPLEFT"}, "confidence": 0.954940915107727, "cells": [{"id": 97, "text": "2.", "bbox": {"l": 308.862, "t": 622.2905900000001, "r": 316.76675, "b": 633.03831, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "Prediction post-processing for PDF docu-", "bbox": {"l": 327.30643, "t": 622.2905900000001, "r": 545.10876, "b": 633.03831, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "ments", "bbox": {"l": 326.79501, "t": 636.2385899999999, "r": 357.34055, "b": 646.98631, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2. Prediction post-processing for PDF documents"}, {"label": "text", "id": 1, "page_no": 10, "cluster": {"id": 1, "label": "text", "bbox": {"l": 308.86203, "t": 657.42104, "r": 545.11517, "b": 714.148605, "coord_origin": "TOPLEFT"}, "confidence": 0.9829329252243042, "cells": [{"id": 100, "text": "Although TableFormer can predict the table structure and", "bbox": {"l": 320.81702, "t": 657.42104, "r": 545.11499, "b": 666.3276, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "the bounding boxes for tables recognized inside PDF docu-", "bbox": {"l": 308.86203, "t": 669.37604, "r": 545.11511, "b": 678.2826, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "ments, this is not enough when a full reconstruction of the", "bbox": {"l": 308.86203, "t": 681.33104, "r": 545.11517, "b": 690.2376, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "original table is required. This happens mainly due the fol-", "bbox": {"l": 308.86203, "t": 693.286041, "r": 545.11505, "b": 702.1926040000001, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "lowing reasons:", "bbox": {"l": 308.86203, "t": 705.242035, "r": 371.42719, "b": 714.148605, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Although TableFormer can predict the table structure and the bounding boxes for tables recognized inside PDF documents, this is not enough when a full reconstruction of the original table is required. This happens mainly due the following reasons:"}], "headers": [{"label": "page_footer", "id": 16, "page_no": 10, "cluster": {"id": 16, "label": "page_footer", "bbox": {"l": 292.63104, "t": 734.1330379999999, "r": 302.59363, "b": 743.0396, "coord_origin": "TOPLEFT"}, "confidence": 0.8986663222312927, "cells": [{"id": 105, "text": "11", "bbox": {"l": 292.63104, "t": 734.1330379999999, "r": 302.59363, "b": 743.0396, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "11"}]}}, {"page_no": 11, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "PubTabNet", "bbox": {"l": 119.39108, "t": 77.31055000000003, "r": 151.94641, "b": 83.25922000000003, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "b.", "bbox": {"l": 53.345978, "t": 75.19152999999994, "r": 59.327053, "b": 81.14020000000005, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "FinTabNet", "bbox": {"l": 289.5791, "t": 77.45830999999998, "r": 319.8266, "b": 83.40698000000009, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Table Bank", "bbox": {"l": 448.37271, "t": 77.25396999999987, "r": 481.75916, "b": 83.20263999999997, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Train", "bbox": {"l": 82.553436, "t": 141.27617999999995, "r": 94.976013, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Complex", "bbox": {"l": 63.03878399999999, "t": 101.10413000000005, "r": 85.290085, "b": 106.06133999999986, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Simple", "bbox": {"l": 67.76786, "t": 124.39531999999997, "r": 85.231277, "b": 129.35253999999998, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Complex", "bbox": {"l": 227.55121, "t": 102.53992000000005, "r": 249.80251, "b": 107.49712999999997, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Simple", "bbox": {"l": 232.19898999999998, "t": 126.98577999999986, "r": 249.66241, "b": 131.94299, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Simple", "bbox": {"l": 396.2337, "t": 114.04522999999995, "r": 413.69711, "b": 119.00243999999998, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Val", "bbox": {"l": 97.382202, "t": 141.27617999999995, "r": 105.08014, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "100%", "bbox": {"l": 60.93763400000001, "t": 85.73321999999996, "r": 76.151443, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "500K 10K", "bbox": {"l": 82.304901, "t": 86.22351000000003, "r": 106.99162, "b": 91.18073000000015, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Train Test Val", "bbox": {"l": 246.20530999999997, "t": 141.60608000000002, "r": 281.88013, "b": 146.56329000000005, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "100%", "bbox": {"l": 226.69780000000003, "t": 85.73321999999996, "r": 241.91161, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "91K 10K 10K", "bbox": {"l": 249.93848999999997, "t": 86.08801000000005, "r": 282.49384, "b": 91.04522999999995, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Train Test Val", "bbox": {"l": 410.19409, "t": 141.27617999999995, "r": 444.68915, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "100% 130K 5K", "bbox": {"l": 391.37341, "t": 85.73321999999996, "r": 432.6716599999999, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "10K", "bbox": {"l": 435.60571000000004, "t": 86.26140999999996, "r": 445.62414999999993, "b": 91.21862999999996, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Complex", "bbox": {"l": 113.94921, "t": 141.28845, "r": 136.20052, "b": 146.24567000000002, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Non", "bbox": {"l": 116.91554000000001, "t": 94.81853999999998, "r": 127.05433999999998, "b": 99.77575999999999, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Strict", "bbox": {"l": 113.3146, "t": 100.93853999999999, "r": 127.05298, "b": 105.89575000000002, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "HTML", "bbox": {"l": 112.94112, "t": 107.05853000000013, "r": 127.05537, "b": 112.01575000000003, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Strict", "bbox": {"l": 113.22738999999999, "t": 122.61523, "r": 126.96577, "b": 127.57245, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "HTML", "bbox": {"l": 112.85390000000001, "t": 128.73523, "r": 126.96814999999998, "b": 133.69244000000003, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "Simple", "bbox": {"l": 138.57864, "t": 141.43640000000005, "r": 156.04207, "b": 146.39362000000006, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "230K 280K", "bbox": {"l": 122.03101, "t": 86.2713, "r": 151.04185, "b": 91.22852, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "65K", "bbox": {"l": 311.65359, "t": 86.55498999999998, "r": 321.67203, "b": 91.5122100000001, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Complex", "bbox": {"l": 287.89441, "t": 141.71063000000004, "r": 310.14572, "b": 146.66785000000004, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Non", "bbox": {"l": 289.23572, "t": 93.07977000000005, "r": 299.37451, "b": 98.03698999999995, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Strict", "bbox": {"l": 285.63513, "t": 99.19976999999994, "r": 299.3735, "b": 104.15698000000009, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "HTML", "bbox": {"l": 285.26111, "t": 105.31975999999997, "r": 299.37537, "b": 110.27697999999998, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Strict", "bbox": {"l": 285.43109, "t": 120.38995, "r": 299.16946, "b": 125.34717, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "HTML", "bbox": {"l": 285.05713, "t": 126.50995, "r": 299.17139, "b": 131.46716000000004, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Simple", "bbox": {"l": 311.34592, "t": 141.71063000000004, "r": 328.80933, "b": 146.66785000000004, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "47K", "bbox": {"l": 299.58362, "t": 86.69353999999998, "r": 309.60205, "b": 91.65075999999999, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Simple", "bbox": {"l": 466.04077000000007, "t": 141.67169, "r": 483.50418, "b": 146.62891000000002, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "Non", "bbox": {"l": 459.02151, "t": 93.76116999999999, "r": 469.16031000000004, "b": 98.71838000000002, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "Strict", "bbox": {"l": 455.4209, "t": 99.88116000000002, "r": 469.15927000000005, "b": 104.83838000000003, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "HTML", "bbox": {"l": 455.04691, "t": 106.00116000000014, "r": 469.16115999999994, "b": 110.95836999999995, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "145K", "bbox": {"l": 467.39401, "t": 85.57239000000004, "r": 480.6545100000001, "b": 90.52959999999996, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Complex", "bbox": {"l": 160.37672, "t": 141.58385999999996, "r": 182.62802, "b": 146.54107999999997, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "Contain", "bbox": {"l": 153.74265, "t": 94.86481000000003, "r": 173.32664, "b": 99.82201999999995, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Missing", "bbox": {"l": 154.50967, "t": 100.98479999999995, "r": 173.3246, "b": 105.94202000000007, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "bboxes", "bbox": {"l": 155.27162, "t": 107.10479999999995, "r": 173.32664, "b": 112.06200999999987, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Contain", "bbox": {"l": 326.41302, "t": 107.23248000000001, "r": 345.99701, "b": 112.18970000000002, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "Missing", "bbox": {"l": 327.17972, "t": 113.35248000000001, "r": 345.99463, "b": 118.30969000000005, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "bboxes", "bbox": {"l": 327.94131, "t": 119.47247000000004, "r": 345.99634, "b": 124.42969000000005, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Dataset", "bbox": {"l": 488.9942, "t": 104.15374999999983, "r": 508.76384999999993, "b": 109.11095999999998, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "doesn't", "bbox": {"l": 490.1893, "t": 110.27373999999998, "r": 508.76349000000005, "b": 115.2309600000001, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "provide", "bbox": {"l": 489.72009, "t": 116.39373999999998, "r": 508.76758, "b": 121.35095000000013, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "bboxes", "bbox": {"l": 490.71121, "t": 122.51373000000001, "r": 508.76624, "b": 127.47095000000002, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Simple", "bbox": {"l": 185.37759, "t": 141.71118, "r": 202.84102, "b": 146.66840000000002, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "230K 280K", "bbox": {"l": 168.50357, "t": 86.13611000000003, "r": 197.52699, "b": 91.09331999999995, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "65K", "bbox": {"l": 357.3768, "t": 85.99707000000001, "r": 367.39523, "b": 90.95428000000004, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "Complex Simple", "bbox": {"l": 333.73151, "t": 141.62323000000004, "r": 374.92862, "b": 146.58043999999995, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "47K", "bbox": {"l": 345.69101, "t": 86.05591000000004, "r": 355.70944, "b": 91.01312000000007, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Simple", "bbox": {"l": 508.54248, "t": 141.37683000000004, "r": 526.00592, "b": 146.33405000000005, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "145K", "bbox": {"l": 510.44653000000005, "t": 86.09258999999986, "r": 523.70703, "b": 91.0498, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Figure 7: Distribution of the tables across different dimensions per dataset. Simple vs complex tables per dataset and split,", "bbox": {"l": 50.112, "t": 165.50238000000002, "r": 545.11371, "b": 174.40894000000003, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "strict vs non strict html structures per dataset and table complexity, missing bboxes per dataset and table complexity.", "bbox": {"l": 50.112, "t": 177.4574, "r": 513.52234, "b": 186.36395000000005, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "\u2022", "bbox": {"l": 61.569, "t": 210.93140000000005, "r": 71.14743, "b": 219.83794999999998, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "TableFormer output does not include the table cell con-", "bbox": {"l": 73.542038, "t": 210.93140000000005, "r": 286.36511, "b": 219.83794999999998, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "tent.", "bbox": {"l": 70.037003, "t": 222.88640999999996, "r": 87.47155, "b": 231.79296999999997, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "\u2022", "bbox": {"l": 61.569, "t": 244.07141000000001, "r": 71.345718, "b": 252.97797000000003, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "There are occasional inaccuracies in the predictions of", "bbox": {"l": 73.789902, "t": 244.07141000000001, "r": 286.36514, "b": 252.97797000000003, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "the bounding boxes.", "bbox": {"l": 70.037003, "t": 256.02643, "r": 150.41524, "b": 264.93298000000004, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "However, it is possible to mitigate those limitations by", "bbox": {"l": 62.067001, "t": 279.20343, "r": 286.36499, "b": 288.10999, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "combining the TableFormer predictions with the informa-", "bbox": {"l": 50.112, "t": 291.15842, "r": 286.36505, "b": 300.06497, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "tion already present inside a programmatic PDF document.", "bbox": {"l": 50.112, "t": 303.1134, "r": 286.36511, "b": 312.01996, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "More specifically, PDF documents can be seen as a se-", "bbox": {"l": 50.112, "t": 315.06839, "r": 286.36511, "b": 323.97495, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "quence of PDF cells where each cell is described by its con-", "bbox": {"l": 50.112, "t": 327.02438, "r": 286.36511, "b": 335.93093999999996, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "tent and bounding box. If we are able to associate the PDF", "bbox": {"l": 50.112, "t": 338.97937, "r": 286.36505, "b": 347.88593, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "cells with the predicted table cells, we can directly link the", "bbox": {"l": 50.112, "t": 350.93436, "r": 286.36508, "b": 359.84091, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "PDF cell content to the table cell structure and use the PDF", "bbox": {"l": 50.112, "t": 362.88934, "r": 286.36511, "b": 371.7959, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "bounding boxes to correct misalignments in the predicted", "bbox": {"l": 50.112, "t": 374.84433000000007, "r": 286.36508, "b": 383.75089, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "table cell bounding boxes.", "bbox": {"l": 50.112, "t": 386.80032, "r": 154.55988, "b": 395.70688, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "Here is a step-by-step description of the prediction post-", "bbox": {"l": 62.067001, "t": 399.06934, "r": 286.36496, "b": 407.97589, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "processing:", "bbox": {"l": 50.112, "t": 411.02533, "r": 95.491638, "b": 419.93188, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "1.", "bbox": {"l": 62.067001, "t": 423.29532, "r": 69.37281, "b": 432.20187, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "Get the minimal grid dimensions - number of rows and", "bbox": {"l": 71.808075, "t": 423.29532, "r": 286.36502, "b": 432.20187, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "columns for the predicted table structure. This represents", "bbox": {"l": 50.112, "t": 435.25031, "r": 286.36508, "b": 444.15686, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "the most granular grid for the underlying table structure.", "bbox": {"l": 50.112, "t": 447.20529, "r": 274.50958, "b": 456.11185000000006, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "2.", "bbox": {"l": 62.067001, "t": 459.47528, "r": 69.538948, "b": 468.38184, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "Generate pair-wise matches between the bounding", "bbox": {"l": 77.429329, "t": 459.47528, "r": 286.36499, "b": 468.38184, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "boxes of the PDF cells and the predicted cells. The Intersec-", "bbox": {"l": 50.112, "t": 471.43027, "r": 286.36505, "b": 480.33682, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "tion Over Union (IOU) metric is used to evaluate the quality", "bbox": {"l": 50.112, "t": 483.38525, "r": 286.36505, "b": 492.29181, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "of the matches.", "bbox": {"l": 50.112, "t": 495.34024, "r": 110.70452999999999, "b": 504.2468, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "3.", "bbox": {"l": 62.067001, "t": 507.61023, "r": 69.863068, "b": 516.5167799999999, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "Use a carefully selected IOU threshold to designate", "bbox": {"l": 72.461754, "t": 507.61023, "r": 286.36493, "b": 516.5167799999999, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "the matches as \u201cgood\u201d ones and \u201cbad\u201d ones.", "bbox": {"l": 50.112, "t": 519.5662199999999, "r": 226.0714, "b": 528.4727800000001, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "3.a. If all IOU scores in a column are below the thresh-", "bbox": {"l": 62.067001, "t": 531.83521, "r": 286.36496, "b": 540.7417800000001, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "old, discard all predictions (structure and bounding boxes)", "bbox": {"l": 50.112, "t": 543.79121, "r": 286.36511, "b": 552.69777, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "for that column.", "bbox": {"l": 50.112, "t": 555.74622, "r": 114.03204, "b": 564.65277, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "4.", "bbox": {"l": 62.067001, "t": 568.01622, "r": 69.538948, "b": 576.92278, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "Find the best-fitting content alignment for the pre-", "bbox": {"l": 76.731949, "t": 568.01622, "r": 286.36502, "b": 576.92278, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "dicted cells with good IOU per each column. The alignment", "bbox": {"l": 50.112, "t": 579.97122, "r": 286.36508, "b": 588.87778, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "of the column can be identified by the following formula:", "bbox": {"l": 50.112, "t": 591.9262200000001, "r": 278.70383, "b": 600.83278, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "alignment", "bbox": {"l": 112.02799999999999, "t": 623.99382, "r": 157.9516, "b": 632.84061, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "= arg min", "bbox": {"l": 160.715, "t": 623.99382, "r": 203.4964, "b": 632.84061, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "c", "bbox": {"l": 185.58499, "t": 633.98305, "r": 189.14511, "b": 640.17578, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "{", "bbox": {"l": 203.49899, "t": 623.43591, "r": 208.48029, "b": 632.84061, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "D$_{c}$", "bbox": {"l": 208.48099, "t": 623.99382, "r": 220.28911, "b": 632.84061, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "}", "bbox": {"l": 220.78699, "t": 623.43591, "r": 225.76828, "b": 632.84061, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "D$_{c}$", "bbox": {"l": 110.70499, "t": 645.25882, "r": 122.51310999999998, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "=", "bbox": {"l": 125.77899000000001, "t": 645.25882, "r": 133.52791, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "max", "bbox": {"l": 136.295, "t": 645.25882, "r": 156.00201, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "{", "bbox": {"l": 156.00299, "t": 644.70091, "r": 160.98428, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "x$_{c}$", "bbox": {"l": 160.98399, "t": 645.25882, "r": 170.23811, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "} \u2212", "bbox": {"l": 170.73599, "t": 644.70091, "r": 185.6779, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "min", "bbox": {"l": 187.894, "t": 645.25882, "r": 206.05283, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "{", "bbox": {"l": 206.054, "t": 644.70091, "r": 211.03529, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "x$_{c}$", "bbox": {"l": 211.035, "t": 645.25882, "r": 220.28912, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "}", "bbox": {"l": 220.787, "t": 644.70091, "r": 225.76829999999998, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "(4)", "bbox": {"l": 274.746, "t": 634.88522, "r": 286.3624, "b": 643.79178, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "where", "bbox": {"l": 50.112, "t": 668.06522, "r": 74.45063, "b": 676.97179, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "c", "bbox": {"l": 78.335999, "t": 667.90582, "r": 82.647812, "b": 676.75261, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "is one of", "bbox": {"l": 86.532997, "t": 668.06522, "r": 123.63372, "b": 676.97179, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "{", "bbox": {"l": 127.51899999999999, "t": 667.3479199999999, "r": 132.50029, "b": 676.75261, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "left, centroid, right", "bbox": {"l": 132.50099, "t": 668.06522, "r": 210.69743, "b": 676.97179, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "}", "bbox": {"l": 210.69699, "t": 667.3479199999999, "r": 215.67828, "b": 676.75261, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "and", "bbox": {"l": 219.56299, "t": 668.06522, "r": 233.94897000000003, "b": 676.97179, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "x$_{c}$", "bbox": {"l": 237.83499000000003, "t": 667.90582, "r": 247.08911, "b": 676.75261, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "is the x-", "bbox": {"l": 251.47299000000004, "t": 668.06522, "r": 286.362, "b": 676.97179, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "coordinate for the corresponding point.", "bbox": {"l": 50.112, "t": 680.02022, "r": 205.88721, "b": 688.92679, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "5.", "bbox": {"l": 62.067001, "t": 692.290222, "r": 69.538948, "b": 701.196785, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "Use the alignment computed in step 4, to compute", "bbox": {"l": 76.273666, "t": 692.290222, "r": 286.36496, "b": 701.196785, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "the median", "bbox": {"l": 50.112, "t": 704.245224, "r": 94.604973, "b": 713.151787, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "x", "bbox": {"l": 97.598999, "t": 704.085815, "r": 103.29263, "b": 712.93261, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "-coordinate for all table columns and the me-", "bbox": {"l": 103.292, "t": 704.245224, "r": 286.36481, "b": 713.151787, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "dian cell size for all table cells. The usage of median dur-", "bbox": {"l": 308.862, "t": 210.93120999999996, "r": 545.11517, "b": 219.83776999999998, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "ing the computations, helps to eliminate outliers caused by", "bbox": {"l": 308.862, "t": 222.88720999999998, "r": 545.11511, "b": 231.79376000000002, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "occasional column spans which are usually wider than the", "bbox": {"l": 308.862, "t": 234.84222, "r": 545.11511, "b": 243.74878, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "normal.", "bbox": {"l": 308.862, "t": 246.79724, "r": 339.57669, "b": 255.7038, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "6.", "bbox": {"l": 320.81699, "t": 259.10222999999996, "r": 328.28894, "b": 268.00879, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "Snap all cells with bad IOU to their corresponding", "bbox": {"l": 334.88419, "t": 259.10222999999996, "r": 545.11499, "b": 268.00879, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "median", "bbox": {"l": 308.862, "t": 271.05724999999995, "r": 338.19189, "b": 279.96380999999997, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "x", "bbox": {"l": 340.68201, "t": 270.89783, "r": 346.37564, "b": 279.74463000000003, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "-coordinates and cell sizes.", "bbox": {"l": 346.37601, "t": 271.05724999999995, "r": 453.72305000000006, "b": 279.96380999999997, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "7.", "bbox": {"l": 320.81702, "t": 283.36325000000005, "r": 328.38953, "b": 292.26981, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "Generate a new set of pair-wise matches between the", "bbox": {"l": 330.9137, "t": 283.36325000000005, "r": 545.11499, "b": 292.26981, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "corrected bounding boxes and PDF cells. This time use a", "bbox": {"l": 308.86203, "t": 295.31824, "r": 545.11511, "b": 304.22479, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "modified version of the IOU metric, where the area of the", "bbox": {"l": 308.86203, "t": 307.27322, "r": 545.11505, "b": 316.17978, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "intersection between the predicted and PDF cells is divided", "bbox": {"l": 308.86203, "t": 319.22821000000005, "r": 545.11511, "b": 328.13477, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "by the PDF cell area.", "bbox": {"l": 308.86203, "t": 331.1842, "r": 397.19043, "b": 340.09076000000005, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "In case there are multiple matches", "bbox": {"l": 403.65616, "t": 331.1842, "r": 545.11511, "b": 340.09076000000005, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "for the same PDF cell, the prediction with the higher score", "bbox": {"l": 308.86203, "t": 343.13919, "r": 545.11511, "b": 352.04575, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "is preferred. This covers the cases where the PDF cells are", "bbox": {"l": 308.86203, "t": 355.09418, "r": 545.11505, "b": 364.00073, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "smaller than the area of predicted or corrected prediction", "bbox": {"l": 308.86203, "t": 367.04916, "r": 545.11505, "b": 375.95572000000004, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "cells.", "bbox": {"l": 308.86203, "t": 379.00415, "r": 329.61414, "b": 387.91071, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "8.", "bbox": {"l": 320.81702, "t": 391.31015, "r": 328.55356, "b": 400.2167099999999, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "In some rare occasions, we have noticed that Table-", "bbox": {"l": 331.13242, "t": 391.31015, "r": 545.11505, "b": 400.2167099999999, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "Former can confuse a single column as two. When the post-", "bbox": {"l": 308.86203, "t": 403.26514, "r": 545.11517, "b": 412.17169, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "processing steps are applied, this results with two predicted", "bbox": {"l": 308.86203, "t": 415.22012000000007, "r": 545.11511, "b": 424.12668, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "columns pointing to the same PDF column. In such case", "bbox": {"l": 308.86203, "t": 427.17511, "r": 545.11511, "b": 436.0816699999999, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "we must de-duplicate the columns according to highest to-", "bbox": {"l": 308.86203, "t": 439.1301, "r": 545.11505, "b": 448.03665, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "tal column intersection score.", "bbox": {"l": 308.86203, "t": 451.08507999999995, "r": 426.18161, "b": 459.99164, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "9.", "bbox": {"l": 320.81702, "t": 463.39108, "r": 328.67316, "b": 472.29764, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "Pick up the remaining orphan cells. There could be", "bbox": {"l": 331.29187, "t": 463.39108, "r": 545.11499, "b": 472.29764, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "cases, when after applying all the previous post-processing", "bbox": {"l": 308.86203, "t": 475.34607, "r": 545.11505, "b": 484.25262, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "steps, some PDF cells could still remain without any match", "bbox": {"l": 308.86203, "t": 487.30106, "r": 545.11517, "b": 496.20761, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "to predicted cells.", "bbox": {"l": 308.86203, "t": 499.25604, "r": 381.89786, "b": 508.1626, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "However, it is still possible to deduce", "bbox": {"l": 388.7023, "t": 499.25604, "r": 545.11517, "b": 508.1626, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "the correct matching for an orphan PDF cell by mapping its", "bbox": {"l": 308.86203, "t": 511.21204, "r": 545.11511, "b": 520.11859, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "bounding box on the geometry of the grid. This mapping", "bbox": {"l": 308.86203, "t": 523.16702, "r": 545.11505, "b": 532.07358, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "decides if the content of the orphan cell will be appended to", "bbox": {"l": 308.86203, "t": 535.12201, "r": 545.11499, "b": 544.02858, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "an already matched table cell, or a new table cell should be", "bbox": {"l": 308.86203, "t": 547.07703, "r": 545.11517, "b": 555.98358, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "created to match with the orphan.", "bbox": {"l": 308.86203, "t": 559.03203, "r": 442.22147000000007, "b": 567.93858, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "9a. Compute the top and bottom boundary of the hori-", "bbox": {"l": 320.81702, "t": 571.33803, "r": 545.11493, "b": 580.24458, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "zontal band for each grid row (min/max", "bbox": {"l": 308.86203, "t": 583.29303, "r": 471.64093, "b": 592.19958, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "y", "bbox": {"l": 474.83405, "t": 583.1336200000001, "r": 479.71872, "b": 591.98041, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "coordinates per", "bbox": {"l": 483.26903999999996, "t": 583.29303, "r": 545.11688, "b": 592.19958, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "row).", "bbox": {"l": 308.86206, "t": 595.24803, "r": 329.91306, "b": 604.15459, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "9b.", "bbox": {"l": 320.81705, "t": 607.55304, "r": 332.8718, "b": 616.4595899999999, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "Intersect the orphan\u2019s bounding box with the row", "bbox": {"l": 339.92532, "t": 607.55304, "r": 545.11505, "b": 616.4595899999999, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "bands, and map the cell to the closest grid row.", "bbox": {"l": 308.86206, "t": 619.50903, "r": 495.2923, "b": 628.4155900000001, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "9c. Compute the left and right boundary of the vertical", "bbox": {"l": 320.81705, "t": 631.81403, "r": 545.11505, "b": 640.72058, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "band for each grid column (min/max", "bbox": {"l": 308.86206, "t": 643.7690299999999, "r": 455.28238, "b": 652.67558, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "x", "bbox": {"l": 457.77704, "t": 643.60962, "r": 463.47067, "b": 652.45641, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "coordinates per col-", "bbox": {"l": 465.97104, "t": 643.7690299999999, "r": 545.11389, "b": 652.67558, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "umn).", "bbox": {"l": 308.86206, "t": 655.72403, "r": 332.38376, "b": 664.63059, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "9d. Intersect the orphan\u2019s bounding box with the column", "bbox": {"l": 320.81705, "t": 668.03003, "r": 545.11499, "b": 676.93659, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "bands, and map the cell to the closest grid column.", "bbox": {"l": 308.86206, "t": 679.98503, "r": 510.5848700000001, "b": 688.89159, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "9e. If the table cell under the identified row and column", "bbox": {"l": 320.81705, "t": 692.290024, "r": 545.11505, "b": 701.196594, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "is not empty, extend its content with the content of the or-", "bbox": {"l": 308.86206, "t": 704.245026, "r": 545.11517, "b": 713.151596, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": "12", "bbox": {"l": 292.63107, "t": 734.13303, "r": 302.59366, "b": 743.039593, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 30, "label": "picture", "bbox": {"l": 53.54227066040039, "t": 74.74854278564453, "r": 544.938232421875, "b": 147.59091186523438, "coord_origin": "TOPLEFT"}, "confidence": 0.6033818125724792, "cells": [{"id": 0, "text": "PubTabNet", "bbox": {"l": 119.39108, "t": 77.31055000000003, "r": 151.94641, "b": 83.25922000000003, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "b.", "bbox": {"l": 53.345978, "t": 75.19152999999994, "r": 59.327053, "b": 81.14020000000005, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "FinTabNet", "bbox": {"l": 289.5791, "t": 77.45830999999998, "r": 319.8266, "b": 83.40698000000009, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Table Bank", "bbox": {"l": 448.37271, "t": 77.25396999999987, "r": 481.75916, "b": 83.20263999999997, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Train", "bbox": {"l": 82.553436, "t": 141.27617999999995, "r": 94.976013, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Complex", "bbox": {"l": 63.03878399999999, "t": 101.10413000000005, "r": 85.290085, "b": 106.06133999999986, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Simple", "bbox": {"l": 67.76786, "t": 124.39531999999997, "r": 85.231277, "b": 129.35253999999998, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Complex", "bbox": {"l": 227.55121, "t": 102.53992000000005, "r": 249.80251, "b": 107.49712999999997, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Simple", "bbox": {"l": 232.19898999999998, "t": 126.98577999999986, "r": 249.66241, "b": 131.94299, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Simple", "bbox": {"l": 396.2337, "t": 114.04522999999995, "r": 413.69711, "b": 119.00243999999998, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Val", "bbox": {"l": 97.382202, "t": 141.27617999999995, "r": 105.08014, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "100%", "bbox": {"l": 60.93763400000001, "t": 85.73321999999996, "r": 76.151443, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "500K 10K", "bbox": {"l": 82.304901, "t": 86.22351000000003, "r": 106.99162, "b": 91.18073000000015, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Train Test Val", "bbox": {"l": 246.20530999999997, "t": 141.60608000000002, "r": 281.88013, "b": 146.56329000000005, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "100%", "bbox": {"l": 226.69780000000003, "t": 85.73321999999996, "r": 241.91161, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "91K 10K 10K", "bbox": {"l": 249.93848999999997, "t": 86.08801000000005, "r": 282.49384, "b": 91.04522999999995, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Train Test Val", "bbox": {"l": 410.19409, "t": 141.27617999999995, "r": 444.68915, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "100% 130K 5K", "bbox": {"l": 391.37341, "t": 85.73321999999996, "r": 432.6716599999999, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "10K", "bbox": {"l": 435.60571000000004, "t": 86.26140999999996, "r": 445.62414999999993, "b": 91.21862999999996, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Complex", "bbox": {"l": 113.94921, "t": 141.28845, "r": 136.20052, "b": 146.24567000000002, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Non", "bbox": {"l": 116.91554000000001, "t": 94.81853999999998, "r": 127.05433999999998, "b": 99.77575999999999, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Strict", "bbox": {"l": 113.3146, "t": 100.93853999999999, "r": 127.05298, "b": 105.89575000000002, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "HTML", "bbox": {"l": 112.94112, "t": 107.05853000000013, "r": 127.05537, "b": 112.01575000000003, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Strict", "bbox": {"l": 113.22738999999999, "t": 122.61523, "r": 126.96577, "b": 127.57245, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "HTML", "bbox": {"l": 112.85390000000001, "t": 128.73523, "r": 126.96814999999998, "b": 133.69244000000003, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "Simple", "bbox": {"l": 138.57864, "t": 141.43640000000005, "r": 156.04207, "b": 146.39362000000006, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "230K 280K", "bbox": {"l": 122.03101, "t": 86.2713, "r": 151.04185, "b": 91.22852, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "65K", "bbox": {"l": 311.65359, "t": 86.55498999999998, "r": 321.67203, "b": 91.5122100000001, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Complex", "bbox": {"l": 287.89441, "t": 141.71063000000004, "r": 310.14572, "b": 146.66785000000004, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Non", "bbox": {"l": 289.23572, "t": 93.07977000000005, "r": 299.37451, "b": 98.03698999999995, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Strict", "bbox": {"l": 285.63513, "t": 99.19976999999994, "r": 299.3735, "b": 104.15698000000009, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "HTML", "bbox": {"l": 285.26111, "t": 105.31975999999997, "r": 299.37537, "b": 110.27697999999998, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Strict", "bbox": {"l": 285.43109, "t": 120.38995, "r": 299.16946, "b": 125.34717, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "HTML", "bbox": {"l": 285.05713, "t": 126.50995, "r": 299.17139, "b": 131.46716000000004, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Simple", "bbox": {"l": 311.34592, "t": 141.71063000000004, "r": 328.80933, "b": 146.66785000000004, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "47K", "bbox": {"l": 299.58362, "t": 86.69353999999998, "r": 309.60205, "b": 91.65075999999999, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Simple", "bbox": {"l": 466.04077000000007, "t": 141.67169, "r": 483.50418, "b": 146.62891000000002, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "Non", "bbox": {"l": 459.02151, "t": 93.76116999999999, "r": 469.16031000000004, "b": 98.71838000000002, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "Strict", "bbox": {"l": 455.4209, "t": 99.88116000000002, "r": 469.15927000000005, "b": 104.83838000000003, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "HTML", "bbox": {"l": 455.04691, "t": 106.00116000000014, "r": 469.16115999999994, "b": 110.95836999999995, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "145K", "bbox": {"l": 467.39401, "t": 85.57239000000004, "r": 480.6545100000001, "b": 90.52959999999996, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Complex", "bbox": {"l": 160.37672, "t": 141.58385999999996, "r": 182.62802, "b": 146.54107999999997, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "Contain", "bbox": {"l": 153.74265, "t": 94.86481000000003, "r": 173.32664, "b": 99.82201999999995, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Missing", "bbox": {"l": 154.50967, "t": 100.98479999999995, "r": 173.3246, "b": 105.94202000000007, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "bboxes", "bbox": {"l": 155.27162, "t": 107.10479999999995, "r": 173.32664, "b": 112.06200999999987, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Contain", "bbox": {"l": 326.41302, "t": 107.23248000000001, "r": 345.99701, "b": 112.18970000000002, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "Missing", "bbox": {"l": 327.17972, "t": 113.35248000000001, "r": 345.99463, "b": 118.30969000000005, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "bboxes", "bbox": {"l": 327.94131, "t": 119.47247000000004, "r": 345.99634, "b": 124.42969000000005, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Dataset", "bbox": {"l": 488.9942, "t": 104.15374999999983, "r": 508.76384999999993, "b": 109.11095999999998, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "doesn't", "bbox": {"l": 490.1893, "t": 110.27373999999998, "r": 508.76349000000005, "b": 115.2309600000001, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "provide", "bbox": {"l": 489.72009, "t": 116.39373999999998, "r": 508.76758, "b": 121.35095000000013, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "bboxes", "bbox": {"l": 490.71121, "t": 122.51373000000001, "r": 508.76624, "b": 127.47095000000002, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Simple", "bbox": {"l": 185.37759, "t": 141.71118, "r": 202.84102, "b": 146.66840000000002, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "230K 280K", "bbox": {"l": 168.50357, "t": 86.13611000000003, "r": 197.52699, "b": 91.09331999999995, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "65K", "bbox": {"l": 357.3768, "t": 85.99707000000001, "r": 367.39523, "b": 90.95428000000004, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "Complex Simple", "bbox": {"l": 333.73151, "t": 141.62323000000004, "r": 374.92862, "b": 146.58043999999995, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "47K", "bbox": {"l": 345.69101, "t": 86.05591000000004, "r": 355.70944, "b": 91.01312000000007, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Simple", "bbox": {"l": 508.54248, "t": 141.37683000000004, "r": 526.00592, "b": 146.33405000000005, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "145K", "bbox": {"l": 510.44653000000005, "t": 86.09258999999986, "r": 523.70703, "b": 91.0498, "coord_origin": "TOPLEFT"}}], "children": [{"id": 26, "label": "text", "bbox": {"l": 119.39108, "t": 77.31055000000003, "r": 151.94641, "b": 83.25922000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 0, "text": "PubTabNet", "bbox": {"l": 119.39108, "t": 77.31055000000003, "r": 151.94641, "b": 83.25922000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 53.345978, "t": 75.19152999999994, "r": 59.327053, "b": 81.14020000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 1, "text": "b.", "bbox": {"l": 53.345978, "t": 75.19152999999994, "r": 59.327053, "b": 81.14020000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 289.5791, "t": 77.45830999999998, "r": 319.8266, "b": 83.40698000000009, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 2, "text": "FinTabNet", "bbox": {"l": 289.5791, "t": 77.45830999999998, "r": 319.8266, "b": 83.40698000000009, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 448.37271, "t": 77.25396999999987, "r": 481.75916, "b": 83.20263999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 3, "text": "Table Bank", "bbox": {"l": 448.37271, "t": 77.25396999999987, "r": 481.75916, "b": 83.20263999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 82.553436, "t": 141.27617999999995, "r": 94.976013, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 4, "text": "Train", "bbox": {"l": 82.553436, "t": 141.27617999999995, "r": 94.976013, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 63.03878399999999, "t": 101.10413000000005, "r": 85.290085, "b": 106.06133999999986, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 5, "text": "Complex", "bbox": {"l": 63.03878399999999, "t": 101.10413000000005, "r": 85.290085, "b": 106.06133999999986, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 67.76786, "t": 124.39531999999997, "r": 85.231277, "b": 129.35253999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": "Simple", "bbox": {"l": 67.76786, "t": 124.39531999999997, "r": 85.231277, "b": 129.35253999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 227.55121, "t": 102.53992000000005, "r": 249.80251, "b": 107.49712999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "Complex", "bbox": {"l": 227.55121, "t": 102.53992000000005, "r": 249.80251, "b": 107.49712999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 232.19898999999998, "t": 126.98577999999986, "r": 249.66241, "b": 131.94299, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "Simple", "bbox": {"l": 232.19898999999998, "t": 126.98577999999986, "r": 249.66241, "b": 131.94299, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 396.2337, "t": 114.04522999999995, "r": 413.69711, "b": 119.00243999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "Simple", "bbox": {"l": 396.2337, "t": 114.04522999999995, "r": 413.69711, "b": 119.00243999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 97.382202, "t": 141.27617999999995, "r": 105.08014, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "Val", "bbox": {"l": 97.382202, "t": 141.27617999999995, "r": 105.08014, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 60.93763400000001, "t": 85.73321999999996, "r": 76.151443, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "100%", "bbox": {"l": 60.93763400000001, "t": 85.73321999999996, "r": 76.151443, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 82.304901, "t": 86.22351000000003, "r": 106.99162, "b": 91.18073000000015, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "500K 10K", "bbox": {"l": 82.304901, "t": 86.22351000000003, "r": 106.99162, "b": 91.18073000000015, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 246.20530999999997, "t": 141.60608000000002, "r": 281.88013, "b": 146.56329000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "Train Test Val", "bbox": {"l": 246.20530999999997, "t": 141.60608000000002, "r": 281.88013, "b": 146.56329000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 226.69780000000003, "t": 85.73321999999996, "r": 241.91161, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "100%", "bbox": {"l": 226.69780000000003, "t": 85.73321999999996, "r": 241.91161, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 249.93848999999997, "t": 86.08801000000005, "r": 282.49384, "b": 91.04522999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "91K 10K 10K", "bbox": {"l": 249.93848999999997, "t": 86.08801000000005, "r": 282.49384, "b": 91.04522999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 410.19409, "t": 141.27617999999995, "r": 444.68915, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "Train Test Val", "bbox": {"l": 410.19409, "t": 141.27617999999995, "r": 444.68915, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 391.37341, "t": 85.73321999999996, "r": 432.6716599999999, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "100% 130K 5K", "bbox": {"l": 391.37341, "t": 85.73321999999996, "r": 432.6716599999999, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 435.60571000000004, "t": 86.26140999999996, "r": 445.62414999999993, "b": 91.21862999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "10K", "bbox": {"l": 435.60571000000004, "t": 86.26140999999996, "r": 445.62414999999993, "b": 91.21862999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 113.94921, "t": 141.28845, "r": 136.20052, "b": 146.24567000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "Complex", "bbox": {"l": 113.94921, "t": 141.28845, "r": 136.20052, "b": 146.24567000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 116.91554000000001, "t": 94.81853999999998, "r": 127.05433999999998, "b": 99.77575999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "Non", "bbox": {"l": 116.91554000000001, "t": 94.81853999999998, "r": 127.05433999999998, "b": 99.77575999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 113.3146, "t": 100.93853999999999, "r": 127.05298, "b": 105.89575000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "Strict", "bbox": {"l": 113.3146, "t": 100.93853999999999, "r": 127.05298, "b": 105.89575000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 112.94112, "t": 107.05853000000013, "r": 127.05537, "b": 112.01575000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "HTML", "bbox": {"l": 112.94112, "t": 107.05853000000013, "r": 127.05537, "b": 112.01575000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 113.22738999999999, "t": 122.61523, "r": 126.96577, "b": 127.57245, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "Strict", "bbox": {"l": 113.22738999999999, "t": 122.61523, "r": 126.96577, "b": 127.57245, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 112.85390000000001, "t": 128.73523, "r": 126.96814999999998, "b": 133.69244000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "HTML", "bbox": {"l": 112.85390000000001, "t": 128.73523, "r": 126.96814999999998, "b": 133.69244000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 138.57864, "t": 141.43640000000005, "r": 156.04207, "b": 146.39362000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "Simple", "bbox": {"l": 138.57864, "t": 141.43640000000005, "r": 156.04207, "b": 146.39362000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 122.03101, "t": 86.2713, "r": 151.04185, "b": 91.22852, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "230K 280K", "bbox": {"l": 122.03101, "t": 86.2713, "r": 151.04185, "b": 91.22852, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 311.65359, "t": 86.55498999999998, "r": 321.67203, "b": 91.5122100000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "65K", "bbox": {"l": 311.65359, "t": 86.55498999999998, "r": 321.67203, "b": 91.5122100000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 287.89441, "t": 141.71063000000004, "r": 310.14572, "b": 146.66785000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "Complex", "bbox": {"l": 287.89441, "t": 141.71063000000004, "r": 310.14572, "b": 146.66785000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 289.23572, "t": 93.07977000000005, "r": 299.37451, "b": 98.03698999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "Non", "bbox": {"l": 289.23572, "t": 93.07977000000005, "r": 299.37451, "b": 98.03698999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 285.63513, "t": 99.19976999999994, "r": 299.3735, "b": 104.15698000000009, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "Strict", "bbox": {"l": 285.63513, "t": 99.19976999999994, "r": 299.3735, "b": 104.15698000000009, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 285.26111, "t": 105.31975999999997, "r": 299.37537, "b": 110.27697999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "HTML", "bbox": {"l": 285.26111, "t": 105.31975999999997, "r": 299.37537, "b": 110.27697999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 285.43109, "t": 120.38995, "r": 299.16946, "b": 125.34717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "Strict", "bbox": {"l": 285.43109, "t": 120.38995, "r": 299.16946, "b": 125.34717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 285.05713, "t": 126.50995, "r": 299.17139, "b": 131.46716000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "HTML", "bbox": {"l": 285.05713, "t": 126.50995, "r": 299.17139, "b": 131.46716000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 311.34592, "t": 141.71063000000004, "r": 328.80933, "b": 146.66785000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "Simple", "bbox": {"l": 311.34592, "t": 141.71063000000004, "r": 328.80933, "b": 146.66785000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 299.58362, "t": 86.69353999999998, "r": 309.60205, "b": 91.65075999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "47K", "bbox": {"l": 299.58362, "t": 86.69353999999998, "r": 309.60205, "b": 91.65075999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 466.04077000000007, "t": 141.67169, "r": 483.50418, "b": 146.62891000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "Simple", "bbox": {"l": 466.04077000000007, "t": 141.67169, "r": 483.50418, "b": 146.62891000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 459.02151, "t": 93.76116999999999, "r": 469.16031000000004, "b": 98.71838000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "Non", "bbox": {"l": 459.02151, "t": 93.76116999999999, "r": 469.16031000000004, "b": 98.71838000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 455.4209, "t": 99.88116000000002, "r": 469.15927000000005, "b": 104.83838000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "Strict", "bbox": {"l": 455.4209, "t": 99.88116000000002, "r": 469.15927000000005, "b": 104.83838000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 455.04691, "t": 106.00116000000014, "r": 469.16115999999994, "b": 110.95836999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "HTML", "bbox": {"l": 455.04691, "t": 106.00116000000014, "r": 469.16115999999994, "b": 110.95836999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 467.39401, "t": 85.57239000000004, "r": 480.6545100000001, "b": 90.52959999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "145K", "bbox": {"l": 467.39401, "t": 85.57239000000004, "r": 480.6545100000001, "b": 90.52959999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 160.37672, "t": 141.58385999999996, "r": 182.62802, "b": 146.54107999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "Complex", "bbox": {"l": 160.37672, "t": 141.58385999999996, "r": 182.62802, "b": 146.54107999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 153.74265, "t": 94.86481000000003, "r": 173.32664, "b": 99.82201999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "Contain", "bbox": {"l": 153.74265, "t": 94.86481000000003, "r": 173.32664, "b": 99.82201999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 154.50967, "t": 100.98479999999995, "r": 173.3246, "b": 105.94202000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "Missing", "bbox": {"l": 154.50967, "t": 100.98479999999995, "r": 173.3246, "b": 105.94202000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 155.27162, "t": 107.10479999999995, "r": 173.32664, "b": 112.06200999999987, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "bboxes", "bbox": {"l": 155.27162, "t": 107.10479999999995, "r": 173.32664, "b": 112.06200999999987, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 326.41302, "t": 107.23248000000001, "r": 345.99701, "b": 112.18970000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "Contain", "bbox": {"l": 326.41302, "t": 107.23248000000001, "r": 345.99701, "b": 112.18970000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 327.17972, "t": 113.35248000000001, "r": 345.99463, "b": 118.30969000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "Missing", "bbox": {"l": 327.17972, "t": 113.35248000000001, "r": 345.99463, "b": 118.30969000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 327.94131, "t": 119.47247000000004, "r": 345.99634, "b": 124.42969000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "bboxes", "bbox": {"l": 327.94131, "t": 119.47247000000004, "r": 345.99634, "b": 124.42969000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 488.9942, "t": 104.15374999999983, "r": 508.76384999999993, "b": 109.11095999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "Dataset", "bbox": {"l": 488.9942, "t": 104.15374999999983, "r": 508.76384999999993, "b": 109.11095999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 490.1893, "t": 110.27373999999998, "r": 508.76349000000005, "b": 115.2309600000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "doesn't", "bbox": {"l": 490.1893, "t": 110.27373999999998, "r": 508.76349000000005, "b": 115.2309600000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 489.72009, "t": 116.39373999999998, "r": 508.76758, "b": 121.35095000000013, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "provide", "bbox": {"l": 489.72009, "t": 116.39373999999998, "r": 508.76758, "b": 121.35095000000013, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 490.71121, "t": 122.51373000000001, "r": 508.76624, "b": 127.47095000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "bboxes", "bbox": {"l": 490.71121, "t": 122.51373000000001, "r": 508.76624, "b": 127.47095000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 185.37759, "t": 141.71118, "r": 202.84102, "b": 146.66840000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "Simple", "bbox": {"l": 185.37759, "t": 141.71118, "r": 202.84102, "b": 146.66840000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 168.50357, "t": 86.13611000000003, "r": 197.52699, "b": 91.09331999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "230K 280K", "bbox": {"l": 168.50357, "t": 86.13611000000003, "r": 197.52699, "b": 91.09331999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 357.3768, "t": 85.99707000000001, "r": 367.39523, "b": 90.95428000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "65K", "bbox": {"l": 357.3768, "t": 85.99707000000001, "r": 367.39523, "b": 90.95428000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 333.73151, "t": 141.62323000000004, "r": 374.92862, "b": 146.58043999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "Complex Simple", "bbox": {"l": 333.73151, "t": 141.62323000000004, "r": 374.92862, "b": 146.58043999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 345.69101, "t": 86.05591000000004, "r": 355.70944, "b": 91.01312000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "47K", "bbox": {"l": 345.69101, "t": 86.05591000000004, "r": 355.70944, "b": 91.01312000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 508.54248, "t": 141.37683000000004, "r": 526.00592, "b": 146.33405000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "Simple", "bbox": {"l": 508.54248, "t": 141.37683000000004, "r": 526.00592, "b": 146.33405000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 510.44653000000005, "t": 86.09258999999986, "r": 523.70703, "b": 91.0498, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "145K", "bbox": {"l": 510.44653000000005, "t": 86.09258999999986, "r": 523.70703, "b": 91.0498, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 1, "label": "caption", "bbox": {"l": 50.112, "t": 165.50238000000002, "r": 545.11371, "b": 186.36395000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9661495685577393, "cells": [{"id": 59, "text": "Figure 7: Distribution of the tables across different dimensions per dataset. Simple vs complex tables per dataset and split,", "bbox": {"l": 50.112, "t": 165.50238000000002, "r": 545.11371, "b": 174.40894000000003, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "strict vs non strict html structures per dataset and table complexity, missing bboxes per dataset and table complexity.", "bbox": {"l": 50.112, "t": 177.4574, "r": 513.52234, "b": 186.36395000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "list_item", "bbox": {"l": 61.569, "t": 210.93140000000005, "r": 286.36511, "b": 231.79296999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9621952772140503, "cells": [{"id": 61, "text": "\u2022", "bbox": {"l": 61.569, "t": 210.93140000000005, "r": 71.14743, "b": 219.83794999999998, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "TableFormer output does not include the table cell con-", "bbox": {"l": 73.542038, "t": 210.93140000000005, "r": 286.36511, "b": 219.83794999999998, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "tent.", "bbox": {"l": 70.037003, "t": 222.88640999999996, "r": 87.47155, "b": 231.79296999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "list_item", "bbox": {"l": 61.569, "t": 244.07141000000001, "r": 286.36514, "b": 264.93298000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9629555344581604, "cells": [{"id": 64, "text": "\u2022", "bbox": {"l": 61.569, "t": 244.07141000000001, "r": 71.345718, "b": 252.97797000000003, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "There are occasional inaccuracies in the predictions of", "bbox": {"l": 73.789902, "t": 244.07141000000001, "r": 286.36514, "b": 252.97797000000003, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "the bounding boxes.", "bbox": {"l": 70.037003, "t": 256.02643, "r": 150.41524, "b": 264.93298000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 50.112, "t": 279.20343, "r": 286.36511, "b": 395.70688, "coord_origin": "TOPLEFT"}, "confidence": 0.9767085909843445, "cells": [{"id": 67, "text": "However, it is possible to mitigate those limitations by", "bbox": {"l": 62.067001, "t": 279.20343, "r": 286.36499, "b": 288.10999, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "combining the TableFormer predictions with the informa-", "bbox": {"l": 50.112, "t": 291.15842, "r": 286.36505, "b": 300.06497, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "tion already present inside a programmatic PDF document.", "bbox": {"l": 50.112, "t": 303.1134, "r": 286.36511, "b": 312.01996, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "More specifically, PDF documents can be seen as a se-", "bbox": {"l": 50.112, "t": 315.06839, "r": 286.36511, "b": 323.97495, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "quence of PDF cells where each cell is described by its con-", "bbox": {"l": 50.112, "t": 327.02438, "r": 286.36511, "b": 335.93093999999996, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "tent and bounding box. If we are able to associate the PDF", "bbox": {"l": 50.112, "t": 338.97937, "r": 286.36505, "b": 347.88593, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "cells with the predicted table cells, we can directly link the", "bbox": {"l": 50.112, "t": 350.93436, "r": 286.36508, "b": 359.84091, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "PDF cell content to the table cell structure and use the PDF", "bbox": {"l": 50.112, "t": 362.88934, "r": 286.36511, "b": 371.7959, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "bounding boxes to correct misalignments in the predicted", "bbox": {"l": 50.112, "t": 374.84433000000007, "r": 286.36508, "b": 383.75089, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "table cell bounding boxes.", "bbox": {"l": 50.112, "t": 386.80032, "r": 154.55988, "b": 395.70688, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 50.112, "t": 399.06934, "r": 286.36496, "b": 419.93188, "coord_origin": "TOPLEFT"}, "confidence": 0.934766411781311, "cells": [{"id": 77, "text": "Here is a step-by-step description of the prediction post-", "bbox": {"l": 62.067001, "t": 399.06934, "r": 286.36496, "b": 407.97589, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "processing:", "bbox": {"l": 50.112, "t": 411.02533, "r": 95.491638, "b": 419.93188, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "list_item", "bbox": {"l": 50.112, "t": 423.29532, "r": 286.36508, "b": 456.11185000000006, "coord_origin": "TOPLEFT"}, "confidence": 0.8280702233314514, "cells": [{"id": 79, "text": "1.", "bbox": {"l": 62.067001, "t": 423.29532, "r": 69.37281, "b": 432.20187, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "Get the minimal grid dimensions - number of rows and", "bbox": {"l": 71.808075, "t": 423.29532, "r": 286.36502, "b": 432.20187, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "columns for the predicted table structure. This represents", "bbox": {"l": 50.112, "t": 435.25031, "r": 286.36508, "b": 444.15686, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "the most granular grid for the underlying table structure.", "bbox": {"l": 50.112, "t": 447.20529, "r": 274.50958, "b": 456.11185000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "list_item", "bbox": {"l": 50.112, "t": 459.47528, "r": 286.36505, "b": 504.2468, "coord_origin": "TOPLEFT"}, "confidence": 0.9646760821342468, "cells": [{"id": 83, "text": "2.", "bbox": {"l": 62.067001, "t": 459.47528, "r": 69.538948, "b": 468.38184, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "Generate pair-wise matches between the bounding", "bbox": {"l": 77.429329, "t": 459.47528, "r": 286.36499, "b": 468.38184, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "boxes of the PDF cells and the predicted cells. The Intersec-", "bbox": {"l": 50.112, "t": 471.43027, "r": 286.36505, "b": 480.33682, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "tion Over Union (IOU) metric is used to evaluate the quality", "bbox": {"l": 50.112, "t": 483.38525, "r": 286.36505, "b": 492.29181, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "of the matches.", "bbox": {"l": 50.112, "t": 495.34024, "r": 110.70452999999999, "b": 504.2468, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "list_item", "bbox": {"l": 50.112, "t": 507.61023, "r": 286.36493, "b": 528.4727800000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9391399025917053, "cells": [{"id": 88, "text": "3.", "bbox": {"l": 62.067001, "t": 507.61023, "r": 69.863068, "b": 516.5167799999999, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "Use a carefully selected IOU threshold to designate", "bbox": {"l": 72.461754, "t": 507.61023, "r": 286.36493, "b": 516.5167799999999, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "the matches as \u201cgood\u201d ones and \u201cbad\u201d ones.", "bbox": {"l": 50.112, "t": 519.5662199999999, "r": 226.0714, "b": 528.4727800000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "list_item", "bbox": {"l": 50.112, "t": 531.83521, "r": 286.36511, "b": 564.65277, "coord_origin": "TOPLEFT"}, "confidence": 0.9491708874702454, "cells": [{"id": 91, "text": "3.a. If all IOU scores in a column are below the thresh-", "bbox": {"l": 62.067001, "t": 531.83521, "r": 286.36496, "b": 540.7417800000001, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "old, discard all predictions (structure and bounding boxes)", "bbox": {"l": 50.112, "t": 543.79121, "r": 286.36511, "b": 552.69777, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "for that column.", "bbox": {"l": 50.112, "t": 555.74622, "r": 114.03204, "b": 564.65277, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "list_item", "bbox": {"l": 50.112, "t": 568.01622, "r": 286.36508, "b": 600.83278, "coord_origin": "TOPLEFT"}, "confidence": 0.9587163329124451, "cells": [{"id": 94, "text": "4.", "bbox": {"l": 62.067001, "t": 568.01622, "r": 69.538948, "b": 576.92278, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "Find the best-fitting content alignment for the pre-", "bbox": {"l": 76.731949, "t": 568.01622, "r": 286.36502, "b": 576.92278, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "dicted cells with good IOU per each column. The alignment", "bbox": {"l": 50.112, "t": 579.97122, "r": 286.36508, "b": 588.87778, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "of the column can be identified by the following formula:", "bbox": {"l": 50.112, "t": 591.9262200000001, "r": 278.70383, "b": 600.83278, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "formula", "bbox": {"l": 110.70499, "t": 623.43591, "r": 286.3624, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9298412799835205, "cells": [{"id": 98, "text": "alignment", "bbox": {"l": 112.02799999999999, "t": 623.99382, "r": 157.9516, "b": 632.84061, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "= arg min", "bbox": {"l": 160.715, "t": 623.99382, "r": 203.4964, "b": 632.84061, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "c", "bbox": {"l": 185.58499, "t": 633.98305, "r": 189.14511, "b": 640.17578, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "{", "bbox": {"l": 203.49899, "t": 623.43591, "r": 208.48029, "b": 632.84061, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "D$_{c}$", "bbox": {"l": 208.48099, "t": 623.99382, "r": 220.28911, "b": 632.84061, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "}", "bbox": {"l": 220.78699, "t": 623.43591, "r": 225.76828, "b": 632.84061, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "D$_{c}$", "bbox": {"l": 110.70499, "t": 645.25882, "r": 122.51310999999998, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "=", "bbox": {"l": 125.77899000000001, "t": 645.25882, "r": 133.52791, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "max", "bbox": {"l": 136.295, "t": 645.25882, "r": 156.00201, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "{", "bbox": {"l": 156.00299, "t": 644.70091, "r": 160.98428, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "x$_{c}$", "bbox": {"l": 160.98399, "t": 645.25882, "r": 170.23811, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "} \u2212", "bbox": {"l": 170.73599, "t": 644.70091, "r": 185.6779, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "min", "bbox": {"l": 187.894, "t": 645.25882, "r": 206.05283, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "{", "bbox": {"l": 206.054, "t": 644.70091, "r": 211.03529, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "x$_{c}$", "bbox": {"l": 211.035, "t": 645.25882, "r": 220.28912, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "}", "bbox": {"l": 220.787, "t": 644.70091, "r": 225.76829999999998, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "(4)", "bbox": {"l": 274.746, "t": 634.88522, "r": 286.3624, "b": 643.79178, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "text", "bbox": {"l": 50.112, "t": 667.3479199999999, "r": 286.362, "b": 688.92679, "coord_origin": "TOPLEFT"}, "confidence": 0.9545555114746094, "cells": [{"id": 115, "text": "where", "bbox": {"l": 50.112, "t": 668.06522, "r": 74.45063, "b": 676.97179, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "c", "bbox": {"l": 78.335999, "t": 667.90582, "r": 82.647812, "b": 676.75261, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "is one of", "bbox": {"l": 86.532997, "t": 668.06522, "r": 123.63372, "b": 676.97179, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "{", "bbox": {"l": 127.51899999999999, "t": 667.3479199999999, "r": 132.50029, "b": 676.75261, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "left, centroid, right", "bbox": {"l": 132.50099, "t": 668.06522, "r": 210.69743, "b": 676.97179, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "}", "bbox": {"l": 210.69699, "t": 667.3479199999999, "r": 215.67828, "b": 676.75261, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "and", "bbox": {"l": 219.56299, "t": 668.06522, "r": 233.94897000000003, "b": 676.97179, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "x$_{c}$", "bbox": {"l": 237.83499000000003, "t": 667.90582, "r": 247.08911, "b": 676.75261, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "is the x-", "bbox": {"l": 251.47299000000004, "t": 668.06522, "r": 286.362, "b": 676.97179, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "coordinate for the corresponding point.", "bbox": {"l": 50.112, "t": 680.02022, "r": 205.88721, "b": 688.92679, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "list_item", "bbox": {"l": 50.112, "t": 692.290222, "r": 286.36496, "b": 713.151787, "coord_origin": "TOPLEFT"}, "confidence": 0.9260510206222534, "cells": [{"id": 125, "text": "5.", "bbox": {"l": 62.067001, "t": 692.290222, "r": 69.538948, "b": 701.196785, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "Use the alignment computed in step 4, to compute", "bbox": {"l": 76.273666, "t": 692.290222, "r": 286.36496, "b": 701.196785, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "the median", "bbox": {"l": 50.112, "t": 704.245224, "r": 94.604973, "b": 713.151787, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "x", "bbox": {"l": 97.598999, "t": 704.085815, "r": 103.29263, "b": 712.93261, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "-coordinate for all table columns and the me-", "bbox": {"l": 103.292, "t": 704.245224, "r": 286.36481, "b": 713.151787, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 308.862, "t": 210.93120999999996, "r": 545.11517, "b": 255.7038, "coord_origin": "TOPLEFT"}, "confidence": 0.8942298889160156, "cells": [{"id": 130, "text": "dian cell size for all table cells. The usage of median dur-", "bbox": {"l": 308.862, "t": 210.93120999999996, "r": 545.11517, "b": 219.83776999999998, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "ing the computations, helps to eliminate outliers caused by", "bbox": {"l": 308.862, "t": 222.88720999999998, "r": 545.11511, "b": 231.79376000000002, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "occasional column spans which are usually wider than the", "bbox": {"l": 308.862, "t": 234.84222, "r": 545.11511, "b": 243.74878, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "normal.", "bbox": {"l": 308.862, "t": 246.79724, "r": 339.57669, "b": 255.7038, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "list_item", "bbox": {"l": 308.862, "t": 259.10222999999996, "r": 545.11499, "b": 279.96380999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9423392415046692, "cells": [{"id": 134, "text": "6.", "bbox": {"l": 320.81699, "t": 259.10222999999996, "r": 328.28894, "b": 268.00879, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "Snap all cells with bad IOU to their corresponding", "bbox": {"l": 334.88419, "t": 259.10222999999996, "r": 545.11499, "b": 268.00879, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "median", "bbox": {"l": 308.862, "t": 271.05724999999995, "r": 338.19189, "b": 279.96380999999997, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "x", "bbox": {"l": 340.68201, "t": 270.89783, "r": 346.37564, "b": 279.74463000000003, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "-coordinates and cell sizes.", "bbox": {"l": 346.37601, "t": 271.05724999999995, "r": 453.72305000000006, "b": 279.96380999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "list_item", "bbox": {"l": 308.86203, "t": 283.36325000000005, "r": 545.11511, "b": 387.91071, "coord_origin": "TOPLEFT"}, "confidence": 0.9562004804611206, "cells": [{"id": 139, "text": "7.", "bbox": {"l": 320.81702, "t": 283.36325000000005, "r": 328.38953, "b": 292.26981, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "Generate a new set of pair-wise matches between the", "bbox": {"l": 330.9137, "t": 283.36325000000005, "r": 545.11499, "b": 292.26981, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "corrected bounding boxes and PDF cells. This time use a", "bbox": {"l": 308.86203, "t": 295.31824, "r": 545.11511, "b": 304.22479, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "modified version of the IOU metric, where the area of the", "bbox": {"l": 308.86203, "t": 307.27322, "r": 545.11505, "b": 316.17978, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "intersection between the predicted and PDF cells is divided", "bbox": {"l": 308.86203, "t": 319.22821000000005, "r": 545.11511, "b": 328.13477, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "by the PDF cell area.", "bbox": {"l": 308.86203, "t": 331.1842, "r": 397.19043, "b": 340.09076000000005, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "In case there are multiple matches", "bbox": {"l": 403.65616, "t": 331.1842, "r": 545.11511, "b": 340.09076000000005, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "for the same PDF cell, the prediction with the higher score", "bbox": {"l": 308.86203, "t": 343.13919, "r": 545.11511, "b": 352.04575, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "is preferred. This covers the cases where the PDF cells are", "bbox": {"l": 308.86203, "t": 355.09418, "r": 545.11505, "b": 364.00073, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "smaller than the area of predicted or corrected prediction", "bbox": {"l": 308.86203, "t": 367.04916, "r": 545.11505, "b": 375.95572000000004, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "cells.", "bbox": {"l": 308.86203, "t": 379.00415, "r": 329.61414, "b": 387.91071, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "list_item", "bbox": {"l": 308.86203, "t": 391.31015, "r": 545.11517, "b": 459.99164, "coord_origin": "TOPLEFT"}, "confidence": 0.8719939589500427, "cells": [{"id": 150, "text": "8.", "bbox": {"l": 320.81702, "t": 391.31015, "r": 328.55356, "b": 400.2167099999999, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "In some rare occasions, we have noticed that Table-", "bbox": {"l": 331.13242, "t": 391.31015, "r": 545.11505, "b": 400.2167099999999, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "Former can confuse a single column as two. When the post-", "bbox": {"l": 308.86203, "t": 403.26514, "r": 545.11517, "b": 412.17169, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "processing steps are applied, this results with two predicted", "bbox": {"l": 308.86203, "t": 415.22012000000007, "r": 545.11511, "b": 424.12668, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "columns pointing to the same PDF column. In such case", "bbox": {"l": 308.86203, "t": 427.17511, "r": 545.11511, "b": 436.0816699999999, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "we must de-duplicate the columns according to highest to-", "bbox": {"l": 308.86203, "t": 439.1301, "r": 545.11505, "b": 448.03665, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "tal column intersection score.", "bbox": {"l": 308.86203, "t": 451.08507999999995, "r": 426.18161, "b": 459.99164, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "list_item", "bbox": {"l": 308.86203, "t": 463.39108, "r": 545.11517, "b": 567.93858, "coord_origin": "TOPLEFT"}, "confidence": 0.9126082062721252, "cells": [{"id": 157, "text": "9.", "bbox": {"l": 320.81702, "t": 463.39108, "r": 328.67316, "b": 472.29764, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "Pick up the remaining orphan cells. There could be", "bbox": {"l": 331.29187, "t": 463.39108, "r": 545.11499, "b": 472.29764, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "cases, when after applying all the previous post-processing", "bbox": {"l": 308.86203, "t": 475.34607, "r": 545.11505, "b": 484.25262, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "steps, some PDF cells could still remain without any match", "bbox": {"l": 308.86203, "t": 487.30106, "r": 545.11517, "b": 496.20761, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "to predicted cells.", "bbox": {"l": 308.86203, "t": 499.25604, "r": 381.89786, "b": 508.1626, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "However, it is still possible to deduce", "bbox": {"l": 388.7023, "t": 499.25604, "r": 545.11517, "b": 508.1626, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "the correct matching for an orphan PDF cell by mapping its", "bbox": {"l": 308.86203, "t": 511.21204, "r": 545.11511, "b": 520.11859, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "bounding box on the geometry of the grid. This mapping", "bbox": {"l": 308.86203, "t": 523.16702, "r": 545.11505, "b": 532.07358, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "decides if the content of the orphan cell will be appended to", "bbox": {"l": 308.86203, "t": 535.12201, "r": 545.11499, "b": 544.02858, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "an already matched table cell, or a new table cell should be", "bbox": {"l": 308.86203, "t": 547.07703, "r": 545.11517, "b": 555.98358, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "created to match with the orphan.", "bbox": {"l": 308.86203, "t": 559.03203, "r": 442.22147000000007, "b": 567.93858, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 308.86203, "t": 571.33803, "r": 545.11688, "b": 604.15459, "coord_origin": "TOPLEFT"}, "confidence": 0.8459473848342896, "cells": [{"id": 168, "text": "9a. Compute the top and bottom boundary of the hori-", "bbox": {"l": 320.81702, "t": 571.33803, "r": 545.11493, "b": 580.24458, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "zontal band for each grid row (min/max", "bbox": {"l": 308.86203, "t": 583.29303, "r": 471.64093, "b": 592.19958, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "y", "bbox": {"l": 474.83405, "t": 583.1336200000001, "r": 479.71872, "b": 591.98041, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "coordinates per", "bbox": {"l": 483.26903999999996, "t": 583.29303, "r": 545.11688, "b": 592.19958, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "row).", "bbox": {"l": 308.86206, "t": 595.24803, "r": 329.91306, "b": 604.15459, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "list_item", "bbox": {"l": 308.86206, "t": 607.55304, "r": 545.11505, "b": 628.4155900000001, "coord_origin": "TOPLEFT"}, "confidence": 0.7716891169548035, "cells": [{"id": 173, "text": "9b.", "bbox": {"l": 320.81705, "t": 607.55304, "r": 332.8718, "b": 616.4595899999999, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "Intersect the orphan\u2019s bounding box with the row", "bbox": {"l": 339.92532, "t": 607.55304, "r": 545.11505, "b": 616.4595899999999, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "bands, and map the cell to the closest grid row.", "bbox": {"l": 308.86206, "t": 619.50903, "r": 495.2923, "b": 628.4155900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "list_item", "bbox": {"l": 308.86206, "t": 631.81403, "r": 545.11505, "b": 664.63059, "coord_origin": "TOPLEFT"}, "confidence": 0.8584907054901123, "cells": [{"id": 176, "text": "9c. Compute the left and right boundary of the vertical", "bbox": {"l": 320.81705, "t": 631.81403, "r": 545.11505, "b": 640.72058, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "band for each grid column (min/max", "bbox": {"l": 308.86206, "t": 643.7690299999999, "r": 455.28238, "b": 652.67558, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "x", "bbox": {"l": 457.77704, "t": 643.60962, "r": 463.47067, "b": 652.45641, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "coordinates per col-", "bbox": {"l": 465.97104, "t": 643.7690299999999, "r": 545.11389, "b": 652.67558, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "umn).", "bbox": {"l": 308.86206, "t": 655.72403, "r": 332.38376, "b": 664.63059, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "list_item", "bbox": {"l": 308.86206, "t": 668.03003, "r": 545.11499, "b": 688.89159, "coord_origin": "TOPLEFT"}, "confidence": 0.7590745091438293, "cells": [{"id": 181, "text": "9d. Intersect the orphan\u2019s bounding box with the column", "bbox": {"l": 320.81705, "t": 668.03003, "r": 545.11499, "b": 676.93659, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "bands, and map the cell to the closest grid column.", "bbox": {"l": 308.86206, "t": 679.98503, "r": 510.5848700000001, "b": 688.89159, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "list_item", "bbox": {"l": 308.86206, "t": 692.290024, "r": 545.11517, "b": 713.151596, "coord_origin": "TOPLEFT"}, "confidence": 0.6971189975738525, "cells": [{"id": 183, "text": "9e. If the table cell under the identified row and column", "bbox": {"l": 320.81705, "t": 692.290024, "r": 545.11505, "b": 701.196594, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "is not empty, extend its content with the content of the or-", "bbox": {"l": 308.86206, "t": 704.245026, "r": 545.11517, "b": 713.151596, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "page_footer", "bbox": {"l": 292.63107, "t": 734.13303, "r": 302.59366, "b": 743.039593, "coord_origin": "TOPLEFT"}, "confidence": 0.9126598238945007, "cells": [{"id": 185, "text": "12", "bbox": {"l": 292.63107, "t": 734.13303, "r": 302.59366, "b": 743.039593, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "picture", "id": 30, "page_no": 11, "cluster": {"id": 30, "label": "picture", "bbox": {"l": 53.54227066040039, "t": 74.74854278564453, "r": 544.938232421875, "b": 147.59091186523438, "coord_origin": "TOPLEFT"}, "confidence": 0.6033818125724792, "cells": [{"id": 0, "text": "PubTabNet", "bbox": {"l": 119.39108, "t": 77.31055000000003, "r": 151.94641, "b": 83.25922000000003, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "b.", "bbox": {"l": 53.345978, "t": 75.19152999999994, "r": 59.327053, "b": 81.14020000000005, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "FinTabNet", "bbox": {"l": 289.5791, "t": 77.45830999999998, "r": 319.8266, "b": 83.40698000000009, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Table Bank", "bbox": {"l": 448.37271, "t": 77.25396999999987, "r": 481.75916, "b": 83.20263999999997, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Train", "bbox": {"l": 82.553436, "t": 141.27617999999995, "r": 94.976013, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Complex", "bbox": {"l": 63.03878399999999, "t": 101.10413000000005, "r": 85.290085, "b": 106.06133999999986, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Simple", "bbox": {"l": 67.76786, "t": 124.39531999999997, "r": 85.231277, "b": 129.35253999999998, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Complex", "bbox": {"l": 227.55121, "t": 102.53992000000005, "r": 249.80251, "b": 107.49712999999997, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Simple", "bbox": {"l": 232.19898999999998, "t": 126.98577999999986, "r": 249.66241, "b": 131.94299, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Simple", "bbox": {"l": 396.2337, "t": 114.04522999999995, "r": 413.69711, "b": 119.00243999999998, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Val", "bbox": {"l": 97.382202, "t": 141.27617999999995, "r": 105.08014, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "100%", "bbox": {"l": 60.93763400000001, "t": 85.73321999999996, "r": 76.151443, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "500K 10K", "bbox": {"l": 82.304901, "t": 86.22351000000003, "r": 106.99162, "b": 91.18073000000015, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Train Test Val", "bbox": {"l": 246.20530999999997, "t": 141.60608000000002, "r": 281.88013, "b": 146.56329000000005, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "100%", "bbox": {"l": 226.69780000000003, "t": 85.73321999999996, "r": 241.91161, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "91K 10K 10K", "bbox": {"l": 249.93848999999997, "t": 86.08801000000005, "r": 282.49384, "b": 91.04522999999995, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Train Test Val", "bbox": {"l": 410.19409, "t": 141.27617999999995, "r": 444.68915, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "100% 130K 5K", "bbox": {"l": 391.37341, "t": 85.73321999999996, "r": 432.6716599999999, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "10K", "bbox": {"l": 435.60571000000004, "t": 86.26140999999996, "r": 445.62414999999993, "b": 91.21862999999996, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Complex", "bbox": {"l": 113.94921, "t": 141.28845, "r": 136.20052, "b": 146.24567000000002, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Non", "bbox": {"l": 116.91554000000001, "t": 94.81853999999998, "r": 127.05433999999998, "b": 99.77575999999999, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Strict", "bbox": {"l": 113.3146, "t": 100.93853999999999, "r": 127.05298, "b": 105.89575000000002, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "HTML", "bbox": {"l": 112.94112, "t": 107.05853000000013, "r": 127.05537, "b": 112.01575000000003, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Strict", "bbox": {"l": 113.22738999999999, "t": 122.61523, "r": 126.96577, "b": 127.57245, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "HTML", "bbox": {"l": 112.85390000000001, "t": 128.73523, "r": 126.96814999999998, "b": 133.69244000000003, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "Simple", "bbox": {"l": 138.57864, "t": 141.43640000000005, "r": 156.04207, "b": 146.39362000000006, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "230K 280K", "bbox": {"l": 122.03101, "t": 86.2713, "r": 151.04185, "b": 91.22852, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "65K", "bbox": {"l": 311.65359, "t": 86.55498999999998, "r": 321.67203, "b": 91.5122100000001, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Complex", "bbox": {"l": 287.89441, "t": 141.71063000000004, "r": 310.14572, "b": 146.66785000000004, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Non", "bbox": {"l": 289.23572, "t": 93.07977000000005, "r": 299.37451, "b": 98.03698999999995, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Strict", "bbox": {"l": 285.63513, "t": 99.19976999999994, "r": 299.3735, "b": 104.15698000000009, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "HTML", "bbox": {"l": 285.26111, "t": 105.31975999999997, "r": 299.37537, "b": 110.27697999999998, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Strict", "bbox": {"l": 285.43109, "t": 120.38995, "r": 299.16946, "b": 125.34717, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "HTML", "bbox": {"l": 285.05713, "t": 126.50995, "r": 299.17139, "b": 131.46716000000004, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Simple", "bbox": {"l": 311.34592, "t": 141.71063000000004, "r": 328.80933, "b": 146.66785000000004, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "47K", "bbox": {"l": 299.58362, "t": 86.69353999999998, "r": 309.60205, "b": 91.65075999999999, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Simple", "bbox": {"l": 466.04077000000007, "t": 141.67169, "r": 483.50418, "b": 146.62891000000002, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "Non", "bbox": {"l": 459.02151, "t": 93.76116999999999, "r": 469.16031000000004, "b": 98.71838000000002, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "Strict", "bbox": {"l": 455.4209, "t": 99.88116000000002, "r": 469.15927000000005, "b": 104.83838000000003, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "HTML", "bbox": {"l": 455.04691, "t": 106.00116000000014, "r": 469.16115999999994, "b": 110.95836999999995, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "145K", "bbox": {"l": 467.39401, "t": 85.57239000000004, "r": 480.6545100000001, "b": 90.52959999999996, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Complex", "bbox": {"l": 160.37672, "t": 141.58385999999996, "r": 182.62802, "b": 146.54107999999997, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "Contain", "bbox": {"l": 153.74265, "t": 94.86481000000003, "r": 173.32664, "b": 99.82201999999995, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Missing", "bbox": {"l": 154.50967, "t": 100.98479999999995, "r": 173.3246, "b": 105.94202000000007, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "bboxes", "bbox": {"l": 155.27162, "t": 107.10479999999995, "r": 173.32664, "b": 112.06200999999987, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Contain", "bbox": {"l": 326.41302, "t": 107.23248000000001, "r": 345.99701, "b": 112.18970000000002, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "Missing", "bbox": {"l": 327.17972, "t": 113.35248000000001, "r": 345.99463, "b": 118.30969000000005, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "bboxes", "bbox": {"l": 327.94131, "t": 119.47247000000004, "r": 345.99634, "b": 124.42969000000005, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Dataset", "bbox": {"l": 488.9942, "t": 104.15374999999983, "r": 508.76384999999993, "b": 109.11095999999998, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "doesn't", "bbox": {"l": 490.1893, "t": 110.27373999999998, "r": 508.76349000000005, "b": 115.2309600000001, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "provide", "bbox": {"l": 489.72009, "t": 116.39373999999998, "r": 508.76758, "b": 121.35095000000013, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "bboxes", "bbox": {"l": 490.71121, "t": 122.51373000000001, "r": 508.76624, "b": 127.47095000000002, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Simple", "bbox": {"l": 185.37759, "t": 141.71118, "r": 202.84102, "b": 146.66840000000002, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "230K 280K", "bbox": {"l": 168.50357, "t": 86.13611000000003, "r": 197.52699, "b": 91.09331999999995, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "65K", "bbox": {"l": 357.3768, "t": 85.99707000000001, "r": 367.39523, "b": 90.95428000000004, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "Complex Simple", "bbox": {"l": 333.73151, "t": 141.62323000000004, "r": 374.92862, "b": 146.58043999999995, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "47K", "bbox": {"l": 345.69101, "t": 86.05591000000004, "r": 355.70944, "b": 91.01312000000007, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Simple", "bbox": {"l": 508.54248, "t": 141.37683000000004, "r": 526.00592, "b": 146.33405000000005, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "145K", "bbox": {"l": 510.44653000000005, "t": 86.09258999999986, "r": 523.70703, "b": 91.0498, "coord_origin": "TOPLEFT"}}], "children": [{"id": 26, "label": "text", "bbox": {"l": 119.39108, "t": 77.31055000000003, "r": 151.94641, "b": 83.25922000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 0, "text": "PubTabNet", "bbox": {"l": 119.39108, "t": 77.31055000000003, "r": 151.94641, "b": 83.25922000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 53.345978, "t": 75.19152999999994, "r": 59.327053, "b": 81.14020000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 1, "text": "b.", "bbox": {"l": 53.345978, "t": 75.19152999999994, "r": 59.327053, "b": 81.14020000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 289.5791, "t": 77.45830999999998, "r": 319.8266, "b": 83.40698000000009, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 2, "text": "FinTabNet", "bbox": {"l": 289.5791, "t": 77.45830999999998, "r": 319.8266, "b": 83.40698000000009, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 448.37271, "t": 77.25396999999987, "r": 481.75916, "b": 83.20263999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 3, "text": "Table Bank", "bbox": {"l": 448.37271, "t": 77.25396999999987, "r": 481.75916, "b": 83.20263999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 82.553436, "t": 141.27617999999995, "r": 94.976013, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 4, "text": "Train", "bbox": {"l": 82.553436, "t": 141.27617999999995, "r": 94.976013, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 63.03878399999999, "t": 101.10413000000005, "r": 85.290085, "b": 106.06133999999986, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 5, "text": "Complex", "bbox": {"l": 63.03878399999999, "t": 101.10413000000005, "r": 85.290085, "b": 106.06133999999986, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 67.76786, "t": 124.39531999999997, "r": 85.231277, "b": 129.35253999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": "Simple", "bbox": {"l": 67.76786, "t": 124.39531999999997, "r": 85.231277, "b": 129.35253999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 227.55121, "t": 102.53992000000005, "r": 249.80251, "b": 107.49712999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "Complex", "bbox": {"l": 227.55121, "t": 102.53992000000005, "r": 249.80251, "b": 107.49712999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 232.19898999999998, "t": 126.98577999999986, "r": 249.66241, "b": 131.94299, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "Simple", "bbox": {"l": 232.19898999999998, "t": 126.98577999999986, "r": 249.66241, "b": 131.94299, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 396.2337, "t": 114.04522999999995, "r": 413.69711, "b": 119.00243999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "Simple", "bbox": {"l": 396.2337, "t": 114.04522999999995, "r": 413.69711, "b": 119.00243999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 97.382202, "t": 141.27617999999995, "r": 105.08014, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "Val", "bbox": {"l": 97.382202, "t": 141.27617999999995, "r": 105.08014, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 60.93763400000001, "t": 85.73321999999996, "r": 76.151443, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "100%", "bbox": {"l": 60.93763400000001, "t": 85.73321999999996, "r": 76.151443, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 82.304901, "t": 86.22351000000003, "r": 106.99162, "b": 91.18073000000015, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "500K 10K", "bbox": {"l": 82.304901, "t": 86.22351000000003, "r": 106.99162, "b": 91.18073000000015, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 246.20530999999997, "t": 141.60608000000002, "r": 281.88013, "b": 146.56329000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "Train Test Val", "bbox": {"l": 246.20530999999997, "t": 141.60608000000002, "r": 281.88013, "b": 146.56329000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 226.69780000000003, "t": 85.73321999999996, "r": 241.91161, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "100%", "bbox": {"l": 226.69780000000003, "t": 85.73321999999996, "r": 241.91161, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 249.93848999999997, "t": 86.08801000000005, "r": 282.49384, "b": 91.04522999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "91K 10K 10K", "bbox": {"l": 249.93848999999997, "t": 86.08801000000005, "r": 282.49384, "b": 91.04522999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 410.19409, "t": 141.27617999999995, "r": 444.68915, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "Train Test Val", "bbox": {"l": 410.19409, "t": 141.27617999999995, "r": 444.68915, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 391.37341, "t": 85.73321999999996, "r": 432.6716599999999, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "100% 130K 5K", "bbox": {"l": 391.37341, "t": 85.73321999999996, "r": 432.6716599999999, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 435.60571000000004, "t": 86.26140999999996, "r": 445.62414999999993, "b": 91.21862999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "10K", "bbox": {"l": 435.60571000000004, "t": 86.26140999999996, "r": 445.62414999999993, "b": 91.21862999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 113.94921, "t": 141.28845, "r": 136.20052, "b": 146.24567000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "Complex", "bbox": {"l": 113.94921, "t": 141.28845, "r": 136.20052, "b": 146.24567000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 116.91554000000001, "t": 94.81853999999998, "r": 127.05433999999998, "b": 99.77575999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "Non", "bbox": {"l": 116.91554000000001, "t": 94.81853999999998, "r": 127.05433999999998, "b": 99.77575999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 113.3146, "t": 100.93853999999999, "r": 127.05298, "b": 105.89575000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "Strict", "bbox": {"l": 113.3146, "t": 100.93853999999999, "r": 127.05298, "b": 105.89575000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 112.94112, "t": 107.05853000000013, "r": 127.05537, "b": 112.01575000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "HTML", "bbox": {"l": 112.94112, "t": 107.05853000000013, "r": 127.05537, "b": 112.01575000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 113.22738999999999, "t": 122.61523, "r": 126.96577, "b": 127.57245, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "Strict", "bbox": {"l": 113.22738999999999, "t": 122.61523, "r": 126.96577, "b": 127.57245, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 112.85390000000001, "t": 128.73523, "r": 126.96814999999998, "b": 133.69244000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "HTML", "bbox": {"l": 112.85390000000001, "t": 128.73523, "r": 126.96814999999998, "b": 133.69244000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 138.57864, "t": 141.43640000000005, "r": 156.04207, "b": 146.39362000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "Simple", "bbox": {"l": 138.57864, "t": 141.43640000000005, "r": 156.04207, "b": 146.39362000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 122.03101, "t": 86.2713, "r": 151.04185, "b": 91.22852, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "230K 280K", "bbox": {"l": 122.03101, "t": 86.2713, "r": 151.04185, "b": 91.22852, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 311.65359, "t": 86.55498999999998, "r": 321.67203, "b": 91.5122100000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "65K", "bbox": {"l": 311.65359, "t": 86.55498999999998, "r": 321.67203, "b": 91.5122100000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 287.89441, "t": 141.71063000000004, "r": 310.14572, "b": 146.66785000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "Complex", "bbox": {"l": 287.89441, "t": 141.71063000000004, "r": 310.14572, "b": 146.66785000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 289.23572, "t": 93.07977000000005, "r": 299.37451, "b": 98.03698999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "Non", "bbox": {"l": 289.23572, "t": 93.07977000000005, "r": 299.37451, "b": 98.03698999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 285.63513, "t": 99.19976999999994, "r": 299.3735, "b": 104.15698000000009, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "Strict", "bbox": {"l": 285.63513, "t": 99.19976999999994, "r": 299.3735, "b": 104.15698000000009, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 285.26111, "t": 105.31975999999997, "r": 299.37537, "b": 110.27697999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "HTML", "bbox": {"l": 285.26111, "t": 105.31975999999997, "r": 299.37537, "b": 110.27697999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 285.43109, "t": 120.38995, "r": 299.16946, "b": 125.34717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "Strict", "bbox": {"l": 285.43109, "t": 120.38995, "r": 299.16946, "b": 125.34717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 285.05713, "t": 126.50995, "r": 299.17139, "b": 131.46716000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "HTML", "bbox": {"l": 285.05713, "t": 126.50995, "r": 299.17139, "b": 131.46716000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 311.34592, "t": 141.71063000000004, "r": 328.80933, "b": 146.66785000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "Simple", "bbox": {"l": 311.34592, "t": 141.71063000000004, "r": 328.80933, "b": 146.66785000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 299.58362, "t": 86.69353999999998, "r": 309.60205, "b": 91.65075999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "47K", "bbox": {"l": 299.58362, "t": 86.69353999999998, "r": 309.60205, "b": 91.65075999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 466.04077000000007, "t": 141.67169, "r": 483.50418, "b": 146.62891000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "Simple", "bbox": {"l": 466.04077000000007, "t": 141.67169, "r": 483.50418, "b": 146.62891000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 459.02151, "t": 93.76116999999999, "r": 469.16031000000004, "b": 98.71838000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "Non", "bbox": {"l": 459.02151, "t": 93.76116999999999, "r": 469.16031000000004, "b": 98.71838000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 455.4209, "t": 99.88116000000002, "r": 469.15927000000005, "b": 104.83838000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "Strict", "bbox": {"l": 455.4209, "t": 99.88116000000002, "r": 469.15927000000005, "b": 104.83838000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 455.04691, "t": 106.00116000000014, "r": 469.16115999999994, "b": 110.95836999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "HTML", "bbox": {"l": 455.04691, "t": 106.00116000000014, "r": 469.16115999999994, "b": 110.95836999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 467.39401, "t": 85.57239000000004, "r": 480.6545100000001, "b": 90.52959999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "145K", "bbox": {"l": 467.39401, "t": 85.57239000000004, "r": 480.6545100000001, "b": 90.52959999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 160.37672, "t": 141.58385999999996, "r": 182.62802, "b": 146.54107999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "Complex", "bbox": {"l": 160.37672, "t": 141.58385999999996, "r": 182.62802, "b": 146.54107999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 153.74265, "t": 94.86481000000003, "r": 173.32664, "b": 99.82201999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "Contain", "bbox": {"l": 153.74265, "t": 94.86481000000003, "r": 173.32664, "b": 99.82201999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 154.50967, "t": 100.98479999999995, "r": 173.3246, "b": 105.94202000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "Missing", "bbox": {"l": 154.50967, "t": 100.98479999999995, "r": 173.3246, "b": 105.94202000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 155.27162, "t": 107.10479999999995, "r": 173.32664, "b": 112.06200999999987, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "bboxes", "bbox": {"l": 155.27162, "t": 107.10479999999995, "r": 173.32664, "b": 112.06200999999987, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 326.41302, "t": 107.23248000000001, "r": 345.99701, "b": 112.18970000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "Contain", "bbox": {"l": 326.41302, "t": 107.23248000000001, "r": 345.99701, "b": 112.18970000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 327.17972, "t": 113.35248000000001, "r": 345.99463, "b": 118.30969000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "Missing", "bbox": {"l": 327.17972, "t": 113.35248000000001, "r": 345.99463, "b": 118.30969000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 327.94131, "t": 119.47247000000004, "r": 345.99634, "b": 124.42969000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "bboxes", "bbox": {"l": 327.94131, "t": 119.47247000000004, "r": 345.99634, "b": 124.42969000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 488.9942, "t": 104.15374999999983, "r": 508.76384999999993, "b": 109.11095999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "Dataset", "bbox": {"l": 488.9942, "t": 104.15374999999983, "r": 508.76384999999993, "b": 109.11095999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 490.1893, "t": 110.27373999999998, "r": 508.76349000000005, "b": 115.2309600000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "doesn't", "bbox": {"l": 490.1893, "t": 110.27373999999998, "r": 508.76349000000005, "b": 115.2309600000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 489.72009, "t": 116.39373999999998, "r": 508.76758, "b": 121.35095000000013, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "provide", "bbox": {"l": 489.72009, "t": 116.39373999999998, "r": 508.76758, "b": 121.35095000000013, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 490.71121, "t": 122.51373000000001, "r": 508.76624, "b": 127.47095000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "bboxes", "bbox": {"l": 490.71121, "t": 122.51373000000001, "r": 508.76624, "b": 127.47095000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 185.37759, "t": 141.71118, "r": 202.84102, "b": 146.66840000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "Simple", "bbox": {"l": 185.37759, "t": 141.71118, "r": 202.84102, "b": 146.66840000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 168.50357, "t": 86.13611000000003, "r": 197.52699, "b": 91.09331999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "230K 280K", "bbox": {"l": 168.50357, "t": 86.13611000000003, "r": 197.52699, "b": 91.09331999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 357.3768, "t": 85.99707000000001, "r": 367.39523, "b": 90.95428000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "65K", "bbox": {"l": 357.3768, "t": 85.99707000000001, "r": 367.39523, "b": 90.95428000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 333.73151, "t": 141.62323000000004, "r": 374.92862, "b": 146.58043999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "Complex Simple", "bbox": {"l": 333.73151, "t": 141.62323000000004, "r": 374.92862, "b": 146.58043999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 345.69101, "t": 86.05591000000004, "r": 355.70944, "b": 91.01312000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "47K", "bbox": {"l": 345.69101, "t": 86.05591000000004, "r": 355.70944, "b": 91.01312000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 508.54248, "t": 141.37683000000004, "r": 526.00592, "b": 146.33405000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "Simple", "bbox": {"l": 508.54248, "t": 141.37683000000004, "r": 526.00592, "b": 146.33405000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 510.44653000000005, "t": 86.09258999999986, "r": 523.70703, "b": 91.0498, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "145K", "bbox": {"l": 510.44653000000005, "t": 86.09258999999986, "r": 523.70703, "b": 91.0498, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "caption", "id": 1, "page_no": 11, "cluster": {"id": 1, "label": "caption", "bbox": {"l": 50.112, "t": 165.50238000000002, "r": 545.11371, "b": 186.36395000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9661495685577393, "cells": [{"id": 59, "text": "Figure 7: Distribution of the tables across different dimensions per dataset. Simple vs complex tables per dataset and split,", "bbox": {"l": 50.112, "t": 165.50238000000002, "r": 545.11371, "b": 174.40894000000003, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "strict vs non strict html structures per dataset and table complexity, missing bboxes per dataset and table complexity.", "bbox": {"l": 50.112, "t": 177.4574, "r": 513.52234, "b": 186.36395000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 7: Distribution of the tables across different dimensions per dataset. Simple vs complex tables per dataset and split, strict vs non strict html structures per dataset and table complexity, missing bboxes per dataset and table complexity."}, {"label": "list_item", "id": 4, "page_no": 11, "cluster": {"id": 4, "label": "list_item", "bbox": {"l": 61.569, "t": 210.93140000000005, "r": 286.36511, "b": 231.79296999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9621952772140503, "cells": [{"id": 61, "text": "\u2022", "bbox": {"l": 61.569, "t": 210.93140000000005, "r": 71.14743, "b": 219.83794999999998, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "TableFormer output does not include the table cell con-", "bbox": {"l": 73.542038, "t": 210.93140000000005, "r": 286.36511, "b": 219.83794999999998, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "tent.", "bbox": {"l": 70.037003, "t": 222.88640999999996, "r": 87.47155, "b": 231.79296999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u00b7 TableFormer output does not include the table cell content."}, {"label": "list_item", "id": 3, "page_no": 11, "cluster": {"id": 3, "label": "list_item", "bbox": {"l": 61.569, "t": 244.07141000000001, "r": 286.36514, "b": 264.93298000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9629555344581604, "cells": [{"id": 64, "text": "\u2022", "bbox": {"l": 61.569, "t": 244.07141000000001, "r": 71.345718, "b": 252.97797000000003, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "There are occasional inaccuracies in the predictions of", "bbox": {"l": 73.789902, "t": 244.07141000000001, "r": 286.36514, "b": 252.97797000000003, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "the bounding boxes.", "bbox": {"l": 70.037003, "t": 256.02643, "r": 150.41524, "b": 264.93298000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u00b7 There are occasional inaccuracies in the predictions of the bounding boxes."}, {"label": "text", "id": 0, "page_no": 11, "cluster": {"id": 0, "label": "text", "bbox": {"l": 50.112, "t": 279.20343, "r": 286.36511, "b": 395.70688, "coord_origin": "TOPLEFT"}, "confidence": 0.9767085909843445, "cells": [{"id": 67, "text": "However, it is possible to mitigate those limitations by", "bbox": {"l": 62.067001, "t": 279.20343, "r": 286.36499, "b": 288.10999, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "combining the TableFormer predictions with the informa-", "bbox": {"l": 50.112, "t": 291.15842, "r": 286.36505, "b": 300.06497, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "tion already present inside a programmatic PDF document.", "bbox": {"l": 50.112, "t": 303.1134, "r": 286.36511, "b": 312.01996, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "More specifically, PDF documents can be seen as a se-", "bbox": {"l": 50.112, "t": 315.06839, "r": 286.36511, "b": 323.97495, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "quence of PDF cells where each cell is described by its con-", "bbox": {"l": 50.112, "t": 327.02438, "r": 286.36511, "b": 335.93093999999996, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "tent and bounding box. If we are able to associate the PDF", "bbox": {"l": 50.112, "t": 338.97937, "r": 286.36505, "b": 347.88593, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "cells with the predicted table cells, we can directly link the", "bbox": {"l": 50.112, "t": 350.93436, "r": 286.36508, "b": 359.84091, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "PDF cell content to the table cell structure and use the PDF", "bbox": {"l": 50.112, "t": 362.88934, "r": 286.36511, "b": 371.7959, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "bounding boxes to correct misalignments in the predicted", "bbox": {"l": 50.112, "t": 374.84433000000007, "r": 286.36508, "b": 383.75089, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "table cell bounding boxes.", "bbox": {"l": 50.112, "t": 386.80032, "r": 154.55988, "b": 395.70688, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "However, it is possible to mitigate those limitations by combining the TableFormer predictions with the information already present inside a programmatic PDF document. More specifically, PDF documents can be seen as a sequence of PDF cells where each cell is described by its content and bounding box. If we are able to associate the PDF cells with the predicted table cells, we can directly link the PDF cell content to the table cell structure and use the PDF bounding boxes to correct misalignments in the predicted table cell bounding boxes."}, {"label": "text", "id": 11, "page_no": 11, "cluster": {"id": 11, "label": "text", "bbox": {"l": 50.112, "t": 399.06934, "r": 286.36496, "b": 419.93188, "coord_origin": "TOPLEFT"}, "confidence": 0.934766411781311, "cells": [{"id": 77, "text": "Here is a step-by-step description of the prediction post-", "bbox": {"l": 62.067001, "t": 399.06934, "r": 286.36496, "b": 407.97589, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "processing:", "bbox": {"l": 50.112, "t": 411.02533, "r": 95.491638, "b": 419.93188, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Here is a step-by-step description of the prediction postprocessing:"}, {"label": "list_item", "id": 20, "page_no": 11, "cluster": {"id": 20, "label": "list_item", "bbox": {"l": 50.112, "t": 423.29532, "r": 286.36508, "b": 456.11185000000006, "coord_origin": "TOPLEFT"}, "confidence": 0.8280702233314514, "cells": [{"id": 79, "text": "1.", "bbox": {"l": 62.067001, "t": 423.29532, "r": 69.37281, "b": 432.20187, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "Get the minimal grid dimensions - number of rows and", "bbox": {"l": 71.808075, "t": 423.29532, "r": 286.36502, "b": 432.20187, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "columns for the predicted table structure. This represents", "bbox": {"l": 50.112, "t": 435.25031, "r": 286.36508, "b": 444.15686, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "the most granular grid for the underlying table structure.", "bbox": {"l": 50.112, "t": 447.20529, "r": 274.50958, "b": 456.11185000000006, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1. Get the minimal grid dimensions - number of rows and columns for the predicted table structure. This represents the most granular grid for the underlying table structure."}, {"label": "list_item", "id": 2, "page_no": 11, "cluster": {"id": 2, "label": "list_item", "bbox": {"l": 50.112, "t": 459.47528, "r": 286.36505, "b": 504.2468, "coord_origin": "TOPLEFT"}, "confidence": 0.9646760821342468, "cells": [{"id": 83, "text": "2.", "bbox": {"l": 62.067001, "t": 459.47528, "r": 69.538948, "b": 468.38184, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "Generate pair-wise matches between the bounding", "bbox": {"l": 77.429329, "t": 459.47528, "r": 286.36499, "b": 468.38184, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "boxes of the PDF cells and the predicted cells. The Intersec-", "bbox": {"l": 50.112, "t": 471.43027, "r": 286.36505, "b": 480.33682, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "tion Over Union (IOU) metric is used to evaluate the quality", "bbox": {"l": 50.112, "t": 483.38525, "r": 286.36505, "b": 492.29181, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "of the matches.", "bbox": {"l": 50.112, "t": 495.34024, "r": 110.70452999999999, "b": 504.2468, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2. Generate pair-wise matches between the bounding boxes of the PDF cells and the predicted cells. The Intersection Over Union (IOU) metric is used to evaluate the quality of the matches."}, {"label": "list_item", "id": 10, "page_no": 11, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 50.112, "t": 507.61023, "r": 286.36493, "b": 528.4727800000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9391399025917053, "cells": [{"id": 88, "text": "3.", "bbox": {"l": 62.067001, "t": 507.61023, "r": 69.863068, "b": 516.5167799999999, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "Use a carefully selected IOU threshold to designate", "bbox": {"l": 72.461754, "t": 507.61023, "r": 286.36493, "b": 516.5167799999999, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "the matches as \u201cgood\u201d ones and \u201cbad\u201d ones.", "bbox": {"l": 50.112, "t": 519.5662199999999, "r": 226.0714, "b": 528.4727800000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3. Use a carefully selected IOU threshold to designate the matches as \"good\" ones and \"bad\" ones."}, {"label": "list_item", "id": 8, "page_no": 11, "cluster": {"id": 8, "label": "list_item", "bbox": {"l": 50.112, "t": 531.83521, "r": 286.36511, "b": 564.65277, "coord_origin": "TOPLEFT"}, "confidence": 0.9491708874702454, "cells": [{"id": 91, "text": "3.a. If all IOU scores in a column are below the thresh-", "bbox": {"l": 62.067001, "t": 531.83521, "r": 286.36496, "b": 540.7417800000001, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "old, discard all predictions (structure and bounding boxes)", "bbox": {"l": 50.112, "t": 543.79121, "r": 286.36511, "b": 552.69777, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "for that column.", "bbox": {"l": 50.112, "t": 555.74622, "r": 114.03204, "b": 564.65277, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3.a. If all IOU scores in a column are below the threshold, discard all predictions (structure and bounding boxes) for that column."}, {"label": "list_item", "id": 5, "page_no": 11, "cluster": {"id": 5, "label": "list_item", "bbox": {"l": 50.112, "t": 568.01622, "r": 286.36508, "b": 600.83278, "coord_origin": "TOPLEFT"}, "confidence": 0.9587163329124451, "cells": [{"id": 94, "text": "4.", "bbox": {"l": 62.067001, "t": 568.01622, "r": 69.538948, "b": 576.92278, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "Find the best-fitting content alignment for the pre-", "bbox": {"l": 76.731949, "t": 568.01622, "r": 286.36502, "b": 576.92278, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "dicted cells with good IOU per each column. The alignment", "bbox": {"l": 50.112, "t": 579.97122, "r": 286.36508, "b": 588.87778, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "of the column can be identified by the following formula:", "bbox": {"l": 50.112, "t": 591.9262200000001, "r": 278.70383, "b": 600.83278, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4. Find the best-fitting content alignment for the predicted cells with good IOU per each column. The alignment of the column can be identified by the following formula:"}, {"label": "formula", "id": 12, "page_no": 11, "cluster": {"id": 12, "label": "formula", "bbox": {"l": 110.70499, "t": 623.43591, "r": 286.3624, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9298412799835205, "cells": [{"id": 98, "text": "alignment", "bbox": {"l": 112.02799999999999, "t": 623.99382, "r": 157.9516, "b": 632.84061, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "= arg min", "bbox": {"l": 160.715, "t": 623.99382, "r": 203.4964, "b": 632.84061, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "c", "bbox": {"l": 185.58499, "t": 633.98305, "r": 189.14511, "b": 640.17578, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "{", "bbox": {"l": 203.49899, "t": 623.43591, "r": 208.48029, "b": 632.84061, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "D$_{c}$", "bbox": {"l": 208.48099, "t": 623.99382, "r": 220.28911, "b": 632.84061, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "}", "bbox": {"l": 220.78699, "t": 623.43591, "r": 225.76828, "b": 632.84061, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "D$_{c}$", "bbox": {"l": 110.70499, "t": 645.25882, "r": 122.51310999999998, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "=", "bbox": {"l": 125.77899000000001, "t": 645.25882, "r": 133.52791, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "max", "bbox": {"l": 136.295, "t": 645.25882, "r": 156.00201, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "{", "bbox": {"l": 156.00299, "t": 644.70091, "r": 160.98428, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "x$_{c}$", "bbox": {"l": 160.98399, "t": 645.25882, "r": 170.23811, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "} \u2212", "bbox": {"l": 170.73599, "t": 644.70091, "r": 185.6779, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "min", "bbox": {"l": 187.894, "t": 645.25882, "r": 206.05283, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "{", "bbox": {"l": 206.054, "t": 644.70091, "r": 211.03529, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "x$_{c}$", "bbox": {"l": 211.035, "t": 645.25882, "r": 220.28912, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "}", "bbox": {"l": 220.787, "t": 644.70091, "r": 225.76829999999998, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "(4)", "bbox": {"l": 274.746, "t": 634.88522, "r": 286.3624, "b": 643.79178, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "alignment = arg min c { D$_{c}$ } D$_{c}$ = max { x$_{c}$ } \u2212 min { x$_{c}$ } (4)"}, {"label": "text", "id": 7, "page_no": 11, "cluster": {"id": 7, "label": "text", "bbox": {"l": 50.112, "t": 667.3479199999999, "r": 286.362, "b": 688.92679, "coord_origin": "TOPLEFT"}, "confidence": 0.9545555114746094, "cells": [{"id": 115, "text": "where", "bbox": {"l": 50.112, "t": 668.06522, "r": 74.45063, "b": 676.97179, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "c", "bbox": {"l": 78.335999, "t": 667.90582, "r": 82.647812, "b": 676.75261, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "is one of", "bbox": {"l": 86.532997, "t": 668.06522, "r": 123.63372, "b": 676.97179, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "{", "bbox": {"l": 127.51899999999999, "t": 667.3479199999999, "r": 132.50029, "b": 676.75261, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "left, centroid, right", "bbox": {"l": 132.50099, "t": 668.06522, "r": 210.69743, "b": 676.97179, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "}", "bbox": {"l": 210.69699, "t": 667.3479199999999, "r": 215.67828, "b": 676.75261, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "and", "bbox": {"l": 219.56299, "t": 668.06522, "r": 233.94897000000003, "b": 676.97179, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "x$_{c}$", "bbox": {"l": 237.83499000000003, "t": 667.90582, "r": 247.08911, "b": 676.75261, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "is the x-", "bbox": {"l": 251.47299000000004, "t": 668.06522, "r": 286.362, "b": 676.97179, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "coordinate for the corresponding point.", "bbox": {"l": 50.112, "t": 680.02022, "r": 205.88721, "b": 688.92679, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "where c is one of { left, centroid, right } and x$_{c}$ is the xcoordinate for the corresponding point."}, {"label": "list_item", "id": 13, "page_no": 11, "cluster": {"id": 13, "label": "list_item", "bbox": {"l": 50.112, "t": 692.290222, "r": 286.36496, "b": 713.151787, "coord_origin": "TOPLEFT"}, "confidence": 0.9260510206222534, "cells": [{"id": 125, "text": "5.", "bbox": {"l": 62.067001, "t": 692.290222, "r": 69.538948, "b": 701.196785, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "Use the alignment computed in step 4, to compute", "bbox": {"l": 76.273666, "t": 692.290222, "r": 286.36496, "b": 701.196785, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "the median", "bbox": {"l": 50.112, "t": 704.245224, "r": 94.604973, "b": 713.151787, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "x", "bbox": {"l": 97.598999, "t": 704.085815, "r": 103.29263, "b": 712.93261, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "-coordinate for all table columns and the me-", "bbox": {"l": 103.292, "t": 704.245224, "r": 286.36481, "b": 713.151787, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5. Use the alignment computed in step 4, to compute the median x -coordinate for all table columns and the me-"}, {"label": "text", "id": 16, "page_no": 11, "cluster": {"id": 16, "label": "text", "bbox": {"l": 308.862, "t": 210.93120999999996, "r": 545.11517, "b": 255.7038, "coord_origin": "TOPLEFT"}, "confidence": 0.8942298889160156, "cells": [{"id": 130, "text": "dian cell size for all table cells. The usage of median dur-", "bbox": {"l": 308.862, "t": 210.93120999999996, "r": 545.11517, "b": 219.83776999999998, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "ing the computations, helps to eliminate outliers caused by", "bbox": {"l": 308.862, "t": 222.88720999999998, "r": 545.11511, "b": 231.79376000000002, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "occasional column spans which are usually wider than the", "bbox": {"l": 308.862, "t": 234.84222, "r": 545.11511, "b": 243.74878, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "normal.", "bbox": {"l": 308.862, "t": 246.79724, "r": 339.57669, "b": 255.7038, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "dian cell size for all table cells. The usage of median during the computations, helps to eliminate outliers caused by occasional column spans which are usually wider than the normal."}, {"label": "list_item", "id": 9, "page_no": 11, "cluster": {"id": 9, "label": "list_item", "bbox": {"l": 308.862, "t": 259.10222999999996, "r": 545.11499, "b": 279.96380999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9423392415046692, "cells": [{"id": 134, "text": "6.", "bbox": {"l": 320.81699, "t": 259.10222999999996, "r": 328.28894, "b": 268.00879, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "Snap all cells with bad IOU to their corresponding", "bbox": {"l": 334.88419, "t": 259.10222999999996, "r": 545.11499, "b": 268.00879, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "median", "bbox": {"l": 308.862, "t": 271.05724999999995, "r": 338.19189, "b": 279.96380999999997, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "x", "bbox": {"l": 340.68201, "t": 270.89783, "r": 346.37564, "b": 279.74463000000003, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "-coordinates and cell sizes.", "bbox": {"l": 346.37601, "t": 271.05724999999995, "r": 453.72305000000006, "b": 279.96380999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "6. Snap all cells with bad IOU to their corresponding median x -coordinates and cell sizes."}, {"label": "list_item", "id": 6, "page_no": 11, "cluster": {"id": 6, "label": "list_item", "bbox": {"l": 308.86203, "t": 283.36325000000005, "r": 545.11511, "b": 387.91071, "coord_origin": "TOPLEFT"}, "confidence": 0.9562004804611206, "cells": [{"id": 139, "text": "7.", "bbox": {"l": 320.81702, "t": 283.36325000000005, "r": 328.38953, "b": 292.26981, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "Generate a new set of pair-wise matches between the", "bbox": {"l": 330.9137, "t": 283.36325000000005, "r": 545.11499, "b": 292.26981, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "corrected bounding boxes and PDF cells. This time use a", "bbox": {"l": 308.86203, "t": 295.31824, "r": 545.11511, "b": 304.22479, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "modified version of the IOU metric, where the area of the", "bbox": {"l": 308.86203, "t": 307.27322, "r": 545.11505, "b": 316.17978, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "intersection between the predicted and PDF cells is divided", "bbox": {"l": 308.86203, "t": 319.22821000000005, "r": 545.11511, "b": 328.13477, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "by the PDF cell area.", "bbox": {"l": 308.86203, "t": 331.1842, "r": 397.19043, "b": 340.09076000000005, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "In case there are multiple matches", "bbox": {"l": 403.65616, "t": 331.1842, "r": 545.11511, "b": 340.09076000000005, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "for the same PDF cell, the prediction with the higher score", "bbox": {"l": 308.86203, "t": 343.13919, "r": 545.11511, "b": 352.04575, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "is preferred. This covers the cases where the PDF cells are", "bbox": {"l": 308.86203, "t": 355.09418, "r": 545.11505, "b": 364.00073, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "smaller than the area of predicted or corrected prediction", "bbox": {"l": 308.86203, "t": 367.04916, "r": 545.11505, "b": 375.95572000000004, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "cells.", "bbox": {"l": 308.86203, "t": 379.00415, "r": 329.61414, "b": 387.91071, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "7. Generate a new set of pair-wise matches between the corrected bounding boxes and PDF cells. This time use a modified version of the IOU metric, where the area of the intersection between the predicted and PDF cells is divided by the PDF cell area. In case there are multiple matches for the same PDF cell, the prediction with the higher score is preferred. This covers the cases where the PDF cells are smaller than the area of predicted or corrected prediction cells."}, {"label": "list_item", "id": 17, "page_no": 11, "cluster": {"id": 17, "label": "list_item", "bbox": {"l": 308.86203, "t": 391.31015, "r": 545.11517, "b": 459.99164, "coord_origin": "TOPLEFT"}, "confidence": 0.8719939589500427, "cells": [{"id": 150, "text": "8.", "bbox": {"l": 320.81702, "t": 391.31015, "r": 328.55356, "b": 400.2167099999999, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "In some rare occasions, we have noticed that Table-", "bbox": {"l": 331.13242, "t": 391.31015, "r": 545.11505, "b": 400.2167099999999, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "Former can confuse a single column as two. When the post-", "bbox": {"l": 308.86203, "t": 403.26514, "r": 545.11517, "b": 412.17169, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "processing steps are applied, this results with two predicted", "bbox": {"l": 308.86203, "t": 415.22012000000007, "r": 545.11511, "b": 424.12668, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "columns pointing to the same PDF column. In such case", "bbox": {"l": 308.86203, "t": 427.17511, "r": 545.11511, "b": 436.0816699999999, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "we must de-duplicate the columns according to highest to-", "bbox": {"l": 308.86203, "t": 439.1301, "r": 545.11505, "b": 448.03665, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "tal column intersection score.", "bbox": {"l": 308.86203, "t": 451.08507999999995, "r": 426.18161, "b": 459.99164, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "8. In some rare occasions, we have noticed that TableFormer can confuse a single column as two. When the postprocessing steps are applied, this results with two predicted columns pointing to the same PDF column. In such case we must de-duplicate the columns according to highest total column intersection score."}, {"label": "list_item", "id": 15, "page_no": 11, "cluster": {"id": 15, "label": "list_item", "bbox": {"l": 308.86203, "t": 463.39108, "r": 545.11517, "b": 567.93858, "coord_origin": "TOPLEFT"}, "confidence": 0.9126082062721252, "cells": [{"id": 157, "text": "9.", "bbox": {"l": 320.81702, "t": 463.39108, "r": 328.67316, "b": 472.29764, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "Pick up the remaining orphan cells. There could be", "bbox": {"l": 331.29187, "t": 463.39108, "r": 545.11499, "b": 472.29764, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "cases, when after applying all the previous post-processing", "bbox": {"l": 308.86203, "t": 475.34607, "r": 545.11505, "b": 484.25262, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "steps, some PDF cells could still remain without any match", "bbox": {"l": 308.86203, "t": 487.30106, "r": 545.11517, "b": 496.20761, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "to predicted cells.", "bbox": {"l": 308.86203, "t": 499.25604, "r": 381.89786, "b": 508.1626, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "However, it is still possible to deduce", "bbox": {"l": 388.7023, "t": 499.25604, "r": 545.11517, "b": 508.1626, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "the correct matching for an orphan PDF cell by mapping its", "bbox": {"l": 308.86203, "t": 511.21204, "r": 545.11511, "b": 520.11859, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "bounding box on the geometry of the grid. This mapping", "bbox": {"l": 308.86203, "t": 523.16702, "r": 545.11505, "b": 532.07358, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "decides if the content of the orphan cell will be appended to", "bbox": {"l": 308.86203, "t": 535.12201, "r": 545.11499, "b": 544.02858, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "an already matched table cell, or a new table cell should be", "bbox": {"l": 308.86203, "t": 547.07703, "r": 545.11517, "b": 555.98358, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "created to match with the orphan.", "bbox": {"l": 308.86203, "t": 559.03203, "r": 442.22147000000007, "b": 567.93858, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "9. Pick up the remaining orphan cells. There could be cases, when after applying all the previous post-processing steps, some PDF cells could still remain without any match to predicted cells. However, it is still possible to deduce the correct matching for an orphan PDF cell by mapping its bounding box on the geometry of the grid. This mapping decides if the content of the orphan cell will be appended to an already matched table cell, or a new table cell should be created to match with the orphan."}, {"label": "text", "id": 19, "page_no": 11, "cluster": {"id": 19, "label": "text", "bbox": {"l": 308.86203, "t": 571.33803, "r": 545.11688, "b": 604.15459, "coord_origin": "TOPLEFT"}, "confidence": 0.8459473848342896, "cells": [{"id": 168, "text": "9a. Compute the top and bottom boundary of the hori-", "bbox": {"l": 320.81702, "t": 571.33803, "r": 545.11493, "b": 580.24458, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "zontal band for each grid row (min/max", "bbox": {"l": 308.86203, "t": 583.29303, "r": 471.64093, "b": 592.19958, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "y", "bbox": {"l": 474.83405, "t": 583.1336200000001, "r": 479.71872, "b": 591.98041, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "coordinates per", "bbox": {"l": 483.26903999999996, "t": 583.29303, "r": 545.11688, "b": 592.19958, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "row).", "bbox": {"l": 308.86206, "t": 595.24803, "r": 329.91306, "b": 604.15459, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "9a. Compute the top and bottom boundary of the horizontal band for each grid row (min/max y coordinates per row)."}, {"label": "list_item", "id": 21, "page_no": 11, "cluster": {"id": 21, "label": "list_item", "bbox": {"l": 308.86206, "t": 607.55304, "r": 545.11505, "b": 628.4155900000001, "coord_origin": "TOPLEFT"}, "confidence": 0.7716891169548035, "cells": [{"id": 173, "text": "9b.", "bbox": {"l": 320.81705, "t": 607.55304, "r": 332.8718, "b": 616.4595899999999, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "Intersect the orphan\u2019s bounding box with the row", "bbox": {"l": 339.92532, "t": 607.55304, "r": 545.11505, "b": 616.4595899999999, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "bands, and map the cell to the closest grid row.", "bbox": {"l": 308.86206, "t": 619.50903, "r": 495.2923, "b": 628.4155900000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "9b. Intersect the orphan's bounding box with the row bands, and map the cell to the closest grid row."}, {"label": "list_item", "id": 18, "page_no": 11, "cluster": {"id": 18, "label": "list_item", "bbox": {"l": 308.86206, "t": 631.81403, "r": 545.11505, "b": 664.63059, "coord_origin": "TOPLEFT"}, "confidence": 0.8584907054901123, "cells": [{"id": 176, "text": "9c. Compute the left and right boundary of the vertical", "bbox": {"l": 320.81705, "t": 631.81403, "r": 545.11505, "b": 640.72058, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "band for each grid column (min/max", "bbox": {"l": 308.86206, "t": 643.7690299999999, "r": 455.28238, "b": 652.67558, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "x", "bbox": {"l": 457.77704, "t": 643.60962, "r": 463.47067, "b": 652.45641, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "coordinates per col-", "bbox": {"l": 465.97104, "t": 643.7690299999999, "r": 545.11389, "b": 652.67558, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "umn).", "bbox": {"l": 308.86206, "t": 655.72403, "r": 332.38376, "b": 664.63059, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "9c. Compute the left and right boundary of the vertical band for each grid column (min/max x coordinates per column)."}, {"label": "list_item", "id": 22, "page_no": 11, "cluster": {"id": 22, "label": "list_item", "bbox": {"l": 308.86206, "t": 668.03003, "r": 545.11499, "b": 688.89159, "coord_origin": "TOPLEFT"}, "confidence": 0.7590745091438293, "cells": [{"id": 181, "text": "9d. Intersect the orphan\u2019s bounding box with the column", "bbox": {"l": 320.81705, "t": 668.03003, "r": 545.11499, "b": 676.93659, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "bands, and map the cell to the closest grid column.", "bbox": {"l": 308.86206, "t": 679.98503, "r": 510.5848700000001, "b": 688.89159, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "9d. Intersect the orphan's bounding box with the column bands, and map the cell to the closest grid column."}, {"label": "list_item", "id": 25, "page_no": 11, "cluster": {"id": 25, "label": "list_item", "bbox": {"l": 308.86206, "t": 692.290024, "r": 545.11517, "b": 713.151596, "coord_origin": "TOPLEFT"}, "confidence": 0.6971189975738525, "cells": [{"id": 183, "text": "9e. If the table cell under the identified row and column", "bbox": {"l": 320.81705, "t": 692.290024, "r": 545.11505, "b": 701.196594, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "is not empty, extend its content with the content of the or-", "bbox": {"l": 308.86206, "t": 704.245026, "r": 545.11517, "b": 713.151596, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "9e. If the table cell under the identified row and column is not empty, extend its content with the content of the or-"}, {"label": "page_footer", "id": 14, "page_no": 11, "cluster": {"id": 14, "label": "page_footer", "bbox": {"l": 292.63107, "t": 734.13303, "r": 302.59366, "b": 743.039593, "coord_origin": "TOPLEFT"}, "confidence": 0.9126598238945007, "cells": [{"id": 185, "text": "12", "bbox": {"l": 292.63107, "t": 734.13303, "r": 302.59366, "b": 743.039593, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "12"}], "body": [{"label": "picture", "id": 30, "page_no": 11, "cluster": {"id": 30, "label": "picture", "bbox": {"l": 53.54227066040039, "t": 74.74854278564453, "r": 544.938232421875, "b": 147.59091186523438, "coord_origin": "TOPLEFT"}, "confidence": 0.6033818125724792, "cells": [{"id": 0, "text": "PubTabNet", "bbox": {"l": 119.39108, "t": 77.31055000000003, "r": 151.94641, "b": 83.25922000000003, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "b.", "bbox": {"l": 53.345978, "t": 75.19152999999994, "r": 59.327053, "b": 81.14020000000005, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "FinTabNet", "bbox": {"l": 289.5791, "t": 77.45830999999998, "r": 319.8266, "b": 83.40698000000009, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Table Bank", "bbox": {"l": 448.37271, "t": 77.25396999999987, "r": 481.75916, "b": 83.20263999999997, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Train", "bbox": {"l": 82.553436, "t": 141.27617999999995, "r": 94.976013, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Complex", "bbox": {"l": 63.03878399999999, "t": 101.10413000000005, "r": 85.290085, "b": 106.06133999999986, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Simple", "bbox": {"l": 67.76786, "t": 124.39531999999997, "r": 85.231277, "b": 129.35253999999998, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Complex", "bbox": {"l": 227.55121, "t": 102.53992000000005, "r": 249.80251, "b": 107.49712999999997, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Simple", "bbox": {"l": 232.19898999999998, "t": 126.98577999999986, "r": 249.66241, "b": 131.94299, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Simple", "bbox": {"l": 396.2337, "t": 114.04522999999995, "r": 413.69711, "b": 119.00243999999998, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Val", "bbox": {"l": 97.382202, "t": 141.27617999999995, "r": 105.08014, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "100%", "bbox": {"l": 60.93763400000001, "t": 85.73321999999996, "r": 76.151443, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "500K 10K", "bbox": {"l": 82.304901, "t": 86.22351000000003, "r": 106.99162, "b": 91.18073000000015, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Train Test Val", "bbox": {"l": 246.20530999999997, "t": 141.60608000000002, "r": 281.88013, "b": 146.56329000000005, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "100%", "bbox": {"l": 226.69780000000003, "t": 85.73321999999996, "r": 241.91161, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "91K 10K 10K", "bbox": {"l": 249.93848999999997, "t": 86.08801000000005, "r": 282.49384, "b": 91.04522999999995, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Train Test Val", "bbox": {"l": 410.19409, "t": 141.27617999999995, "r": 444.68915, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "100% 130K 5K", "bbox": {"l": 391.37341, "t": 85.73321999999996, "r": 432.6716599999999, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "10K", "bbox": {"l": 435.60571000000004, "t": 86.26140999999996, "r": 445.62414999999993, "b": 91.21862999999996, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Complex", "bbox": {"l": 113.94921, "t": 141.28845, "r": 136.20052, "b": 146.24567000000002, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Non", "bbox": {"l": 116.91554000000001, "t": 94.81853999999998, "r": 127.05433999999998, "b": 99.77575999999999, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Strict", "bbox": {"l": 113.3146, "t": 100.93853999999999, "r": 127.05298, "b": 105.89575000000002, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "HTML", "bbox": {"l": 112.94112, "t": 107.05853000000013, "r": 127.05537, "b": 112.01575000000003, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Strict", "bbox": {"l": 113.22738999999999, "t": 122.61523, "r": 126.96577, "b": 127.57245, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "HTML", "bbox": {"l": 112.85390000000001, "t": 128.73523, "r": 126.96814999999998, "b": 133.69244000000003, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "Simple", "bbox": {"l": 138.57864, "t": 141.43640000000005, "r": 156.04207, "b": 146.39362000000006, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "230K 280K", "bbox": {"l": 122.03101, "t": 86.2713, "r": 151.04185, "b": 91.22852, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "65K", "bbox": {"l": 311.65359, "t": 86.55498999999998, "r": 321.67203, "b": 91.5122100000001, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Complex", "bbox": {"l": 287.89441, "t": 141.71063000000004, "r": 310.14572, "b": 146.66785000000004, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Non", "bbox": {"l": 289.23572, "t": 93.07977000000005, "r": 299.37451, "b": 98.03698999999995, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Strict", "bbox": {"l": 285.63513, "t": 99.19976999999994, "r": 299.3735, "b": 104.15698000000009, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "HTML", "bbox": {"l": 285.26111, "t": 105.31975999999997, "r": 299.37537, "b": 110.27697999999998, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Strict", "bbox": {"l": 285.43109, "t": 120.38995, "r": 299.16946, "b": 125.34717, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "HTML", "bbox": {"l": 285.05713, "t": 126.50995, "r": 299.17139, "b": 131.46716000000004, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Simple", "bbox": {"l": 311.34592, "t": 141.71063000000004, "r": 328.80933, "b": 146.66785000000004, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "47K", "bbox": {"l": 299.58362, "t": 86.69353999999998, "r": 309.60205, "b": 91.65075999999999, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Simple", "bbox": {"l": 466.04077000000007, "t": 141.67169, "r": 483.50418, "b": 146.62891000000002, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "Non", "bbox": {"l": 459.02151, "t": 93.76116999999999, "r": 469.16031000000004, "b": 98.71838000000002, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "Strict", "bbox": {"l": 455.4209, "t": 99.88116000000002, "r": 469.15927000000005, "b": 104.83838000000003, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "HTML", "bbox": {"l": 455.04691, "t": 106.00116000000014, "r": 469.16115999999994, "b": 110.95836999999995, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "145K", "bbox": {"l": 467.39401, "t": 85.57239000000004, "r": 480.6545100000001, "b": 90.52959999999996, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Complex", "bbox": {"l": 160.37672, "t": 141.58385999999996, "r": 182.62802, "b": 146.54107999999997, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "Contain", "bbox": {"l": 153.74265, "t": 94.86481000000003, "r": 173.32664, "b": 99.82201999999995, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Missing", "bbox": {"l": 154.50967, "t": 100.98479999999995, "r": 173.3246, "b": 105.94202000000007, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "bboxes", "bbox": {"l": 155.27162, "t": 107.10479999999995, "r": 173.32664, "b": 112.06200999999987, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Contain", "bbox": {"l": 326.41302, "t": 107.23248000000001, "r": 345.99701, "b": 112.18970000000002, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "Missing", "bbox": {"l": 327.17972, "t": 113.35248000000001, "r": 345.99463, "b": 118.30969000000005, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "bboxes", "bbox": {"l": 327.94131, "t": 119.47247000000004, "r": 345.99634, "b": 124.42969000000005, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Dataset", "bbox": {"l": 488.9942, "t": 104.15374999999983, "r": 508.76384999999993, "b": 109.11095999999998, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "doesn't", "bbox": {"l": 490.1893, "t": 110.27373999999998, "r": 508.76349000000005, "b": 115.2309600000001, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "provide", "bbox": {"l": 489.72009, "t": 116.39373999999998, "r": 508.76758, "b": 121.35095000000013, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "bboxes", "bbox": {"l": 490.71121, "t": 122.51373000000001, "r": 508.76624, "b": 127.47095000000002, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Simple", "bbox": {"l": 185.37759, "t": 141.71118, "r": 202.84102, "b": 146.66840000000002, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "230K 280K", "bbox": {"l": 168.50357, "t": 86.13611000000003, "r": 197.52699, "b": 91.09331999999995, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "65K", "bbox": {"l": 357.3768, "t": 85.99707000000001, "r": 367.39523, "b": 90.95428000000004, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "Complex Simple", "bbox": {"l": 333.73151, "t": 141.62323000000004, "r": 374.92862, "b": 146.58043999999995, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "47K", "bbox": {"l": 345.69101, "t": 86.05591000000004, "r": 355.70944, "b": 91.01312000000007, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Simple", "bbox": {"l": 508.54248, "t": 141.37683000000004, "r": 526.00592, "b": 146.33405000000005, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "145K", "bbox": {"l": 510.44653000000005, "t": 86.09258999999986, "r": 523.70703, "b": 91.0498, "coord_origin": "TOPLEFT"}}], "children": [{"id": 26, "label": "text", "bbox": {"l": 119.39108, "t": 77.31055000000003, "r": 151.94641, "b": 83.25922000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 0, "text": "PubTabNet", "bbox": {"l": 119.39108, "t": 77.31055000000003, "r": 151.94641, "b": 83.25922000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 53.345978, "t": 75.19152999999994, "r": 59.327053, "b": 81.14020000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 1, "text": "b.", "bbox": {"l": 53.345978, "t": 75.19152999999994, "r": 59.327053, "b": 81.14020000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 289.5791, "t": 77.45830999999998, "r": 319.8266, "b": 83.40698000000009, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 2, "text": "FinTabNet", "bbox": {"l": 289.5791, "t": 77.45830999999998, "r": 319.8266, "b": 83.40698000000009, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 448.37271, "t": 77.25396999999987, "r": 481.75916, "b": 83.20263999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 3, "text": "Table Bank", "bbox": {"l": 448.37271, "t": 77.25396999999987, "r": 481.75916, "b": 83.20263999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 82.553436, "t": 141.27617999999995, "r": 94.976013, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 4, "text": "Train", "bbox": {"l": 82.553436, "t": 141.27617999999995, "r": 94.976013, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 63.03878399999999, "t": 101.10413000000005, "r": 85.290085, "b": 106.06133999999986, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 5, "text": "Complex", "bbox": {"l": 63.03878399999999, "t": 101.10413000000005, "r": 85.290085, "b": 106.06133999999986, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 67.76786, "t": 124.39531999999997, "r": 85.231277, "b": 129.35253999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": "Simple", "bbox": {"l": 67.76786, "t": 124.39531999999997, "r": 85.231277, "b": 129.35253999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 227.55121, "t": 102.53992000000005, "r": 249.80251, "b": 107.49712999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "Complex", "bbox": {"l": 227.55121, "t": 102.53992000000005, "r": 249.80251, "b": 107.49712999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 232.19898999999998, "t": 126.98577999999986, "r": 249.66241, "b": 131.94299, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "Simple", "bbox": {"l": 232.19898999999998, "t": 126.98577999999986, "r": 249.66241, "b": 131.94299, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 396.2337, "t": 114.04522999999995, "r": 413.69711, "b": 119.00243999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "Simple", "bbox": {"l": 396.2337, "t": 114.04522999999995, "r": 413.69711, "b": 119.00243999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 97.382202, "t": 141.27617999999995, "r": 105.08014, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "Val", "bbox": {"l": 97.382202, "t": 141.27617999999995, "r": 105.08014, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 60.93763400000001, "t": 85.73321999999996, "r": 76.151443, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "100%", "bbox": {"l": 60.93763400000001, "t": 85.73321999999996, "r": 76.151443, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 82.304901, "t": 86.22351000000003, "r": 106.99162, "b": 91.18073000000015, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "500K 10K", "bbox": {"l": 82.304901, "t": 86.22351000000003, "r": 106.99162, "b": 91.18073000000015, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 246.20530999999997, "t": 141.60608000000002, "r": 281.88013, "b": 146.56329000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "Train Test Val", "bbox": {"l": 246.20530999999997, "t": 141.60608000000002, "r": 281.88013, "b": 146.56329000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 226.69780000000003, "t": 85.73321999999996, "r": 241.91161, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "100%", "bbox": {"l": 226.69780000000003, "t": 85.73321999999996, "r": 241.91161, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 249.93848999999997, "t": 86.08801000000005, "r": 282.49384, "b": 91.04522999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "91K 10K 10K", "bbox": {"l": 249.93848999999997, "t": 86.08801000000005, "r": 282.49384, "b": 91.04522999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 410.19409, "t": 141.27617999999995, "r": 444.68915, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "Train Test Val", "bbox": {"l": 410.19409, "t": 141.27617999999995, "r": 444.68915, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 391.37341, "t": 85.73321999999996, "r": 432.6716599999999, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "100% 130K 5K", "bbox": {"l": 391.37341, "t": 85.73321999999996, "r": 432.6716599999999, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 435.60571000000004, "t": 86.26140999999996, "r": 445.62414999999993, "b": 91.21862999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "10K", "bbox": {"l": 435.60571000000004, "t": 86.26140999999996, "r": 445.62414999999993, "b": 91.21862999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 113.94921, "t": 141.28845, "r": 136.20052, "b": 146.24567000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "Complex", "bbox": {"l": 113.94921, "t": 141.28845, "r": 136.20052, "b": 146.24567000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 116.91554000000001, "t": 94.81853999999998, "r": 127.05433999999998, "b": 99.77575999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "Non", "bbox": {"l": 116.91554000000001, "t": 94.81853999999998, "r": 127.05433999999998, "b": 99.77575999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 113.3146, "t": 100.93853999999999, "r": 127.05298, "b": 105.89575000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "Strict", "bbox": {"l": 113.3146, "t": 100.93853999999999, "r": 127.05298, "b": 105.89575000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 112.94112, "t": 107.05853000000013, "r": 127.05537, "b": 112.01575000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "HTML", "bbox": {"l": 112.94112, "t": 107.05853000000013, "r": 127.05537, "b": 112.01575000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 113.22738999999999, "t": 122.61523, "r": 126.96577, "b": 127.57245, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "Strict", "bbox": {"l": 113.22738999999999, "t": 122.61523, "r": 126.96577, "b": 127.57245, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 112.85390000000001, "t": 128.73523, "r": 126.96814999999998, "b": 133.69244000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "HTML", "bbox": {"l": 112.85390000000001, "t": 128.73523, "r": 126.96814999999998, "b": 133.69244000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 138.57864, "t": 141.43640000000005, "r": 156.04207, "b": 146.39362000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "Simple", "bbox": {"l": 138.57864, "t": 141.43640000000005, "r": 156.04207, "b": 146.39362000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 122.03101, "t": 86.2713, "r": 151.04185, "b": 91.22852, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "230K 280K", "bbox": {"l": 122.03101, "t": 86.2713, "r": 151.04185, "b": 91.22852, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 311.65359, "t": 86.55498999999998, "r": 321.67203, "b": 91.5122100000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "65K", "bbox": {"l": 311.65359, "t": 86.55498999999998, "r": 321.67203, "b": 91.5122100000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 287.89441, "t": 141.71063000000004, "r": 310.14572, "b": 146.66785000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "Complex", "bbox": {"l": 287.89441, "t": 141.71063000000004, "r": 310.14572, "b": 146.66785000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 289.23572, "t": 93.07977000000005, "r": 299.37451, "b": 98.03698999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "Non", "bbox": {"l": 289.23572, "t": 93.07977000000005, "r": 299.37451, "b": 98.03698999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 285.63513, "t": 99.19976999999994, "r": 299.3735, "b": 104.15698000000009, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "Strict", "bbox": {"l": 285.63513, "t": 99.19976999999994, "r": 299.3735, "b": 104.15698000000009, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 285.26111, "t": 105.31975999999997, "r": 299.37537, "b": 110.27697999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "HTML", "bbox": {"l": 285.26111, "t": 105.31975999999997, "r": 299.37537, "b": 110.27697999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 285.43109, "t": 120.38995, "r": 299.16946, "b": 125.34717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "Strict", "bbox": {"l": 285.43109, "t": 120.38995, "r": 299.16946, "b": 125.34717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 285.05713, "t": 126.50995, "r": 299.17139, "b": 131.46716000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "HTML", "bbox": {"l": 285.05713, "t": 126.50995, "r": 299.17139, "b": 131.46716000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 311.34592, "t": 141.71063000000004, "r": 328.80933, "b": 146.66785000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "Simple", "bbox": {"l": 311.34592, "t": 141.71063000000004, "r": 328.80933, "b": 146.66785000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 299.58362, "t": 86.69353999999998, "r": 309.60205, "b": 91.65075999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "47K", "bbox": {"l": 299.58362, "t": 86.69353999999998, "r": 309.60205, "b": 91.65075999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 466.04077000000007, "t": 141.67169, "r": 483.50418, "b": 146.62891000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "Simple", "bbox": {"l": 466.04077000000007, "t": 141.67169, "r": 483.50418, "b": 146.62891000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 459.02151, "t": 93.76116999999999, "r": 469.16031000000004, "b": 98.71838000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "Non", "bbox": {"l": 459.02151, "t": 93.76116999999999, "r": 469.16031000000004, "b": 98.71838000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 455.4209, "t": 99.88116000000002, "r": 469.15927000000005, "b": 104.83838000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "Strict", "bbox": {"l": 455.4209, "t": 99.88116000000002, "r": 469.15927000000005, "b": 104.83838000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 455.04691, "t": 106.00116000000014, "r": 469.16115999999994, "b": 110.95836999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "HTML", "bbox": {"l": 455.04691, "t": 106.00116000000014, "r": 469.16115999999994, "b": 110.95836999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 467.39401, "t": 85.57239000000004, "r": 480.6545100000001, "b": 90.52959999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "145K", "bbox": {"l": 467.39401, "t": 85.57239000000004, "r": 480.6545100000001, "b": 90.52959999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 160.37672, "t": 141.58385999999996, "r": 182.62802, "b": 146.54107999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "Complex", "bbox": {"l": 160.37672, "t": 141.58385999999996, "r": 182.62802, "b": 146.54107999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 153.74265, "t": 94.86481000000003, "r": 173.32664, "b": 99.82201999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "Contain", "bbox": {"l": 153.74265, "t": 94.86481000000003, "r": 173.32664, "b": 99.82201999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 154.50967, "t": 100.98479999999995, "r": 173.3246, "b": 105.94202000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "Missing", "bbox": {"l": 154.50967, "t": 100.98479999999995, "r": 173.3246, "b": 105.94202000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 155.27162, "t": 107.10479999999995, "r": 173.32664, "b": 112.06200999999987, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "bboxes", "bbox": {"l": 155.27162, "t": 107.10479999999995, "r": 173.32664, "b": 112.06200999999987, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 326.41302, "t": 107.23248000000001, "r": 345.99701, "b": 112.18970000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "Contain", "bbox": {"l": 326.41302, "t": 107.23248000000001, "r": 345.99701, "b": 112.18970000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 327.17972, "t": 113.35248000000001, "r": 345.99463, "b": 118.30969000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "Missing", "bbox": {"l": 327.17972, "t": 113.35248000000001, "r": 345.99463, "b": 118.30969000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 327.94131, "t": 119.47247000000004, "r": 345.99634, "b": 124.42969000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "bboxes", "bbox": {"l": 327.94131, "t": 119.47247000000004, "r": 345.99634, "b": 124.42969000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 488.9942, "t": 104.15374999999983, "r": 508.76384999999993, "b": 109.11095999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "Dataset", "bbox": {"l": 488.9942, "t": 104.15374999999983, "r": 508.76384999999993, "b": 109.11095999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 490.1893, "t": 110.27373999999998, "r": 508.76349000000005, "b": 115.2309600000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "doesn't", "bbox": {"l": 490.1893, "t": 110.27373999999998, "r": 508.76349000000005, "b": 115.2309600000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 489.72009, "t": 116.39373999999998, "r": 508.76758, "b": 121.35095000000013, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "provide", "bbox": {"l": 489.72009, "t": 116.39373999999998, "r": 508.76758, "b": 121.35095000000013, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 490.71121, "t": 122.51373000000001, "r": 508.76624, "b": 127.47095000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "bboxes", "bbox": {"l": 490.71121, "t": 122.51373000000001, "r": 508.76624, "b": 127.47095000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 185.37759, "t": 141.71118, "r": 202.84102, "b": 146.66840000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "Simple", "bbox": {"l": 185.37759, "t": 141.71118, "r": 202.84102, "b": 146.66840000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 168.50357, "t": 86.13611000000003, "r": 197.52699, "b": 91.09331999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "230K 280K", "bbox": {"l": 168.50357, "t": 86.13611000000003, "r": 197.52699, "b": 91.09331999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 357.3768, "t": 85.99707000000001, "r": 367.39523, "b": 90.95428000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "65K", "bbox": {"l": 357.3768, "t": 85.99707000000001, "r": 367.39523, "b": 90.95428000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 333.73151, "t": 141.62323000000004, "r": 374.92862, "b": 146.58043999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "Complex Simple", "bbox": {"l": 333.73151, "t": 141.62323000000004, "r": 374.92862, "b": 146.58043999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 345.69101, "t": 86.05591000000004, "r": 355.70944, "b": 91.01312000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "47K", "bbox": {"l": 345.69101, "t": 86.05591000000004, "r": 355.70944, "b": 91.01312000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 508.54248, "t": 141.37683000000004, "r": 526.00592, "b": 146.33405000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "Simple", "bbox": {"l": 508.54248, "t": 141.37683000000004, "r": 526.00592, "b": 146.33405000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 510.44653000000005, "t": 86.09258999999986, "r": 523.70703, "b": 91.0498, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "145K", "bbox": {"l": 510.44653000000005, "t": 86.09258999999986, "r": 523.70703, "b": 91.0498, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "caption", "id": 1, "page_no": 11, "cluster": {"id": 1, "label": "caption", "bbox": {"l": 50.112, "t": 165.50238000000002, "r": 545.11371, "b": 186.36395000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9661495685577393, "cells": [{"id": 59, "text": "Figure 7: Distribution of the tables across different dimensions per dataset. Simple vs complex tables per dataset and split,", "bbox": {"l": 50.112, "t": 165.50238000000002, "r": 545.11371, "b": 174.40894000000003, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "strict vs non strict html structures per dataset and table complexity, missing bboxes per dataset and table complexity.", "bbox": {"l": 50.112, "t": 177.4574, "r": 513.52234, "b": 186.36395000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 7: Distribution of the tables across different dimensions per dataset. Simple vs complex tables per dataset and split, strict vs non strict html structures per dataset and table complexity, missing bboxes per dataset and table complexity."}, {"label": "list_item", "id": 4, "page_no": 11, "cluster": {"id": 4, "label": "list_item", "bbox": {"l": 61.569, "t": 210.93140000000005, "r": 286.36511, "b": 231.79296999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9621952772140503, "cells": [{"id": 61, "text": "\u2022", "bbox": {"l": 61.569, "t": 210.93140000000005, "r": 71.14743, "b": 219.83794999999998, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "TableFormer output does not include the table cell con-", "bbox": {"l": 73.542038, "t": 210.93140000000005, "r": 286.36511, "b": 219.83794999999998, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "tent.", "bbox": {"l": 70.037003, "t": 222.88640999999996, "r": 87.47155, "b": 231.79296999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u00b7 TableFormer output does not include the table cell content."}, {"label": "list_item", "id": 3, "page_no": 11, "cluster": {"id": 3, "label": "list_item", "bbox": {"l": 61.569, "t": 244.07141000000001, "r": 286.36514, "b": 264.93298000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9629555344581604, "cells": [{"id": 64, "text": "\u2022", "bbox": {"l": 61.569, "t": 244.07141000000001, "r": 71.345718, "b": 252.97797000000003, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "There are occasional inaccuracies in the predictions of", "bbox": {"l": 73.789902, "t": 244.07141000000001, "r": 286.36514, "b": 252.97797000000003, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "the bounding boxes.", "bbox": {"l": 70.037003, "t": 256.02643, "r": 150.41524, "b": 264.93298000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u00b7 There are occasional inaccuracies in the predictions of the bounding boxes."}, {"label": "text", "id": 0, "page_no": 11, "cluster": {"id": 0, "label": "text", "bbox": {"l": 50.112, "t": 279.20343, "r": 286.36511, "b": 395.70688, "coord_origin": "TOPLEFT"}, "confidence": 0.9767085909843445, "cells": [{"id": 67, "text": "However, it is possible to mitigate those limitations by", "bbox": {"l": 62.067001, "t": 279.20343, "r": 286.36499, "b": 288.10999, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "combining the TableFormer predictions with the informa-", "bbox": {"l": 50.112, "t": 291.15842, "r": 286.36505, "b": 300.06497, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "tion already present inside a programmatic PDF document.", "bbox": {"l": 50.112, "t": 303.1134, "r": 286.36511, "b": 312.01996, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "More specifically, PDF documents can be seen as a se-", "bbox": {"l": 50.112, "t": 315.06839, "r": 286.36511, "b": 323.97495, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "quence of PDF cells where each cell is described by its con-", "bbox": {"l": 50.112, "t": 327.02438, "r": 286.36511, "b": 335.93093999999996, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "tent and bounding box. If we are able to associate the PDF", "bbox": {"l": 50.112, "t": 338.97937, "r": 286.36505, "b": 347.88593, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "cells with the predicted table cells, we can directly link the", "bbox": {"l": 50.112, "t": 350.93436, "r": 286.36508, "b": 359.84091, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "PDF cell content to the table cell structure and use the PDF", "bbox": {"l": 50.112, "t": 362.88934, "r": 286.36511, "b": 371.7959, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "bounding boxes to correct misalignments in the predicted", "bbox": {"l": 50.112, "t": 374.84433000000007, "r": 286.36508, "b": 383.75089, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "table cell bounding boxes.", "bbox": {"l": 50.112, "t": 386.80032, "r": 154.55988, "b": 395.70688, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "However, it is possible to mitigate those limitations by combining the TableFormer predictions with the information already present inside a programmatic PDF document. More specifically, PDF documents can be seen as a sequence of PDF cells where each cell is described by its content and bounding box. If we are able to associate the PDF cells with the predicted table cells, we can directly link the PDF cell content to the table cell structure and use the PDF bounding boxes to correct misalignments in the predicted table cell bounding boxes."}, {"label": "text", "id": 11, "page_no": 11, "cluster": {"id": 11, "label": "text", "bbox": {"l": 50.112, "t": 399.06934, "r": 286.36496, "b": 419.93188, "coord_origin": "TOPLEFT"}, "confidence": 0.934766411781311, "cells": [{"id": 77, "text": "Here is a step-by-step description of the prediction post-", "bbox": {"l": 62.067001, "t": 399.06934, "r": 286.36496, "b": 407.97589, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "processing:", "bbox": {"l": 50.112, "t": 411.02533, "r": 95.491638, "b": 419.93188, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Here is a step-by-step description of the prediction postprocessing:"}, {"label": "list_item", "id": 20, "page_no": 11, "cluster": {"id": 20, "label": "list_item", "bbox": {"l": 50.112, "t": 423.29532, "r": 286.36508, "b": 456.11185000000006, "coord_origin": "TOPLEFT"}, "confidence": 0.8280702233314514, "cells": [{"id": 79, "text": "1.", "bbox": {"l": 62.067001, "t": 423.29532, "r": 69.37281, "b": 432.20187, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "Get the minimal grid dimensions - number of rows and", "bbox": {"l": 71.808075, "t": 423.29532, "r": 286.36502, "b": 432.20187, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "columns for the predicted table structure. This represents", "bbox": {"l": 50.112, "t": 435.25031, "r": 286.36508, "b": 444.15686, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "the most granular grid for the underlying table structure.", "bbox": {"l": 50.112, "t": 447.20529, "r": 274.50958, "b": 456.11185000000006, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1. Get the minimal grid dimensions - number of rows and columns for the predicted table structure. This represents the most granular grid for the underlying table structure."}, {"label": "list_item", "id": 2, "page_no": 11, "cluster": {"id": 2, "label": "list_item", "bbox": {"l": 50.112, "t": 459.47528, "r": 286.36505, "b": 504.2468, "coord_origin": "TOPLEFT"}, "confidence": 0.9646760821342468, "cells": [{"id": 83, "text": "2.", "bbox": {"l": 62.067001, "t": 459.47528, "r": 69.538948, "b": 468.38184, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "Generate pair-wise matches between the bounding", "bbox": {"l": 77.429329, "t": 459.47528, "r": 286.36499, "b": 468.38184, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "boxes of the PDF cells and the predicted cells. The Intersec-", "bbox": {"l": 50.112, "t": 471.43027, "r": 286.36505, "b": 480.33682, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "tion Over Union (IOU) metric is used to evaluate the quality", "bbox": {"l": 50.112, "t": 483.38525, "r": 286.36505, "b": 492.29181, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "of the matches.", "bbox": {"l": 50.112, "t": 495.34024, "r": 110.70452999999999, "b": 504.2468, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2. Generate pair-wise matches between the bounding boxes of the PDF cells and the predicted cells. The Intersection Over Union (IOU) metric is used to evaluate the quality of the matches."}, {"label": "list_item", "id": 10, "page_no": 11, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 50.112, "t": 507.61023, "r": 286.36493, "b": 528.4727800000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9391399025917053, "cells": [{"id": 88, "text": "3.", "bbox": {"l": 62.067001, "t": 507.61023, "r": 69.863068, "b": 516.5167799999999, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "Use a carefully selected IOU threshold to designate", "bbox": {"l": 72.461754, "t": 507.61023, "r": 286.36493, "b": 516.5167799999999, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "the matches as \u201cgood\u201d ones and \u201cbad\u201d ones.", "bbox": {"l": 50.112, "t": 519.5662199999999, "r": 226.0714, "b": 528.4727800000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3. Use a carefully selected IOU threshold to designate the matches as \"good\" ones and \"bad\" ones."}, {"label": "list_item", "id": 8, "page_no": 11, "cluster": {"id": 8, "label": "list_item", "bbox": {"l": 50.112, "t": 531.83521, "r": 286.36511, "b": 564.65277, "coord_origin": "TOPLEFT"}, "confidence": 0.9491708874702454, "cells": [{"id": 91, "text": "3.a. If all IOU scores in a column are below the thresh-", "bbox": {"l": 62.067001, "t": 531.83521, "r": 286.36496, "b": 540.7417800000001, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "old, discard all predictions (structure and bounding boxes)", "bbox": {"l": 50.112, "t": 543.79121, "r": 286.36511, "b": 552.69777, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "for that column.", "bbox": {"l": 50.112, "t": 555.74622, "r": 114.03204, "b": 564.65277, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3.a. If all IOU scores in a column are below the threshold, discard all predictions (structure and bounding boxes) for that column."}, {"label": "list_item", "id": 5, "page_no": 11, "cluster": {"id": 5, "label": "list_item", "bbox": {"l": 50.112, "t": 568.01622, "r": 286.36508, "b": 600.83278, "coord_origin": "TOPLEFT"}, "confidence": 0.9587163329124451, "cells": [{"id": 94, "text": "4.", "bbox": {"l": 62.067001, "t": 568.01622, "r": 69.538948, "b": 576.92278, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "Find the best-fitting content alignment for the pre-", "bbox": {"l": 76.731949, "t": 568.01622, "r": 286.36502, "b": 576.92278, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "dicted cells with good IOU per each column. The alignment", "bbox": {"l": 50.112, "t": 579.97122, "r": 286.36508, "b": 588.87778, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "of the column can be identified by the following formula:", "bbox": {"l": 50.112, "t": 591.9262200000001, "r": 278.70383, "b": 600.83278, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4. Find the best-fitting content alignment for the predicted cells with good IOU per each column. The alignment of the column can be identified by the following formula:"}, {"label": "formula", "id": 12, "page_no": 11, "cluster": {"id": 12, "label": "formula", "bbox": {"l": 110.70499, "t": 623.43591, "r": 286.3624, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9298412799835205, "cells": [{"id": 98, "text": "alignment", "bbox": {"l": 112.02799999999999, "t": 623.99382, "r": 157.9516, "b": 632.84061, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "= arg min", "bbox": {"l": 160.715, "t": 623.99382, "r": 203.4964, "b": 632.84061, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "c", "bbox": {"l": 185.58499, "t": 633.98305, "r": 189.14511, "b": 640.17578, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "{", "bbox": {"l": 203.49899, "t": 623.43591, "r": 208.48029, "b": 632.84061, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "D$_{c}$", "bbox": {"l": 208.48099, "t": 623.99382, "r": 220.28911, "b": 632.84061, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "}", "bbox": {"l": 220.78699, "t": 623.43591, "r": 225.76828, "b": 632.84061, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "D$_{c}$", "bbox": {"l": 110.70499, "t": 645.25882, "r": 122.51310999999998, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "=", "bbox": {"l": 125.77899000000001, "t": 645.25882, "r": 133.52791, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "max", "bbox": {"l": 136.295, "t": 645.25882, "r": 156.00201, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "{", "bbox": {"l": 156.00299, "t": 644.70091, "r": 160.98428, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "x$_{c}$", "bbox": {"l": 160.98399, "t": 645.25882, "r": 170.23811, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "} \u2212", "bbox": {"l": 170.73599, "t": 644.70091, "r": 185.6779, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "min", "bbox": {"l": 187.894, "t": 645.25882, "r": 206.05283, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "{", "bbox": {"l": 206.054, "t": 644.70091, "r": 211.03529, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "x$_{c}$", "bbox": {"l": 211.035, "t": 645.25882, "r": 220.28912, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "}", "bbox": {"l": 220.787, "t": 644.70091, "r": 225.76829999999998, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "(4)", "bbox": {"l": 274.746, "t": 634.88522, "r": 286.3624, "b": 643.79178, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "alignment = arg min c { D$_{c}$ } D$_{c}$ = max { x$_{c}$ } \u2212 min { x$_{c}$ } (4)"}, {"label": "text", "id": 7, "page_no": 11, "cluster": {"id": 7, "label": "text", "bbox": {"l": 50.112, "t": 667.3479199999999, "r": 286.362, "b": 688.92679, "coord_origin": "TOPLEFT"}, "confidence": 0.9545555114746094, "cells": [{"id": 115, "text": "where", "bbox": {"l": 50.112, "t": 668.06522, "r": 74.45063, "b": 676.97179, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "c", "bbox": {"l": 78.335999, "t": 667.90582, "r": 82.647812, "b": 676.75261, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "is one of", "bbox": {"l": 86.532997, "t": 668.06522, "r": 123.63372, "b": 676.97179, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "{", "bbox": {"l": 127.51899999999999, "t": 667.3479199999999, "r": 132.50029, "b": 676.75261, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "left, centroid, right", "bbox": {"l": 132.50099, "t": 668.06522, "r": 210.69743, "b": 676.97179, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "}", "bbox": {"l": 210.69699, "t": 667.3479199999999, "r": 215.67828, "b": 676.75261, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "and", "bbox": {"l": 219.56299, "t": 668.06522, "r": 233.94897000000003, "b": 676.97179, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "x$_{c}$", "bbox": {"l": 237.83499000000003, "t": 667.90582, "r": 247.08911, "b": 676.75261, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "is the x-", "bbox": {"l": 251.47299000000004, "t": 668.06522, "r": 286.362, "b": 676.97179, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "coordinate for the corresponding point.", "bbox": {"l": 50.112, "t": 680.02022, "r": 205.88721, "b": 688.92679, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "where c is one of { left, centroid, right } and x$_{c}$ is the xcoordinate for the corresponding point."}, {"label": "list_item", "id": 13, "page_no": 11, "cluster": {"id": 13, "label": "list_item", "bbox": {"l": 50.112, "t": 692.290222, "r": 286.36496, "b": 713.151787, "coord_origin": "TOPLEFT"}, "confidence": 0.9260510206222534, "cells": [{"id": 125, "text": "5.", "bbox": {"l": 62.067001, "t": 692.290222, "r": 69.538948, "b": 701.196785, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "Use the alignment computed in step 4, to compute", "bbox": {"l": 76.273666, "t": 692.290222, "r": 286.36496, "b": 701.196785, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "the median", "bbox": {"l": 50.112, "t": 704.245224, "r": 94.604973, "b": 713.151787, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "x", "bbox": {"l": 97.598999, "t": 704.085815, "r": 103.29263, "b": 712.93261, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "-coordinate for all table columns and the me-", "bbox": {"l": 103.292, "t": 704.245224, "r": 286.36481, "b": 713.151787, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5. Use the alignment computed in step 4, to compute the median x -coordinate for all table columns and the me-"}, {"label": "text", "id": 16, "page_no": 11, "cluster": {"id": 16, "label": "text", "bbox": {"l": 308.862, "t": 210.93120999999996, "r": 545.11517, "b": 255.7038, "coord_origin": "TOPLEFT"}, "confidence": 0.8942298889160156, "cells": [{"id": 130, "text": "dian cell size for all table cells. The usage of median dur-", "bbox": {"l": 308.862, "t": 210.93120999999996, "r": 545.11517, "b": 219.83776999999998, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "ing the computations, helps to eliminate outliers caused by", "bbox": {"l": 308.862, "t": 222.88720999999998, "r": 545.11511, "b": 231.79376000000002, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "occasional column spans which are usually wider than the", "bbox": {"l": 308.862, "t": 234.84222, "r": 545.11511, "b": 243.74878, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "normal.", "bbox": {"l": 308.862, "t": 246.79724, "r": 339.57669, "b": 255.7038, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "dian cell size for all table cells. The usage of median during the computations, helps to eliminate outliers caused by occasional column spans which are usually wider than the normal."}, {"label": "list_item", "id": 9, "page_no": 11, "cluster": {"id": 9, "label": "list_item", "bbox": {"l": 308.862, "t": 259.10222999999996, "r": 545.11499, "b": 279.96380999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9423392415046692, "cells": [{"id": 134, "text": "6.", "bbox": {"l": 320.81699, "t": 259.10222999999996, "r": 328.28894, "b": 268.00879, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "Snap all cells with bad IOU to their corresponding", "bbox": {"l": 334.88419, "t": 259.10222999999996, "r": 545.11499, "b": 268.00879, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "median", "bbox": {"l": 308.862, "t": 271.05724999999995, "r": 338.19189, "b": 279.96380999999997, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "x", "bbox": {"l": 340.68201, "t": 270.89783, "r": 346.37564, "b": 279.74463000000003, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "-coordinates and cell sizes.", "bbox": {"l": 346.37601, "t": 271.05724999999995, "r": 453.72305000000006, "b": 279.96380999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "6. Snap all cells with bad IOU to their corresponding median x -coordinates and cell sizes."}, {"label": "list_item", "id": 6, "page_no": 11, "cluster": {"id": 6, "label": "list_item", "bbox": {"l": 308.86203, "t": 283.36325000000005, "r": 545.11511, "b": 387.91071, "coord_origin": "TOPLEFT"}, "confidence": 0.9562004804611206, "cells": [{"id": 139, "text": "7.", "bbox": {"l": 320.81702, "t": 283.36325000000005, "r": 328.38953, "b": 292.26981, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "Generate a new set of pair-wise matches between the", "bbox": {"l": 330.9137, "t": 283.36325000000005, "r": 545.11499, "b": 292.26981, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "corrected bounding boxes and PDF cells. This time use a", "bbox": {"l": 308.86203, "t": 295.31824, "r": 545.11511, "b": 304.22479, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "modified version of the IOU metric, where the area of the", "bbox": {"l": 308.86203, "t": 307.27322, "r": 545.11505, "b": 316.17978, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "intersection between the predicted and PDF cells is divided", "bbox": {"l": 308.86203, "t": 319.22821000000005, "r": 545.11511, "b": 328.13477, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "by the PDF cell area.", "bbox": {"l": 308.86203, "t": 331.1842, "r": 397.19043, "b": 340.09076000000005, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "In case there are multiple matches", "bbox": {"l": 403.65616, "t": 331.1842, "r": 545.11511, "b": 340.09076000000005, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "for the same PDF cell, the prediction with the higher score", "bbox": {"l": 308.86203, "t": 343.13919, "r": 545.11511, "b": 352.04575, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "is preferred. This covers the cases where the PDF cells are", "bbox": {"l": 308.86203, "t": 355.09418, "r": 545.11505, "b": 364.00073, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "smaller than the area of predicted or corrected prediction", "bbox": {"l": 308.86203, "t": 367.04916, "r": 545.11505, "b": 375.95572000000004, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "cells.", "bbox": {"l": 308.86203, "t": 379.00415, "r": 329.61414, "b": 387.91071, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "7. Generate a new set of pair-wise matches between the corrected bounding boxes and PDF cells. This time use a modified version of the IOU metric, where the area of the intersection between the predicted and PDF cells is divided by the PDF cell area. In case there are multiple matches for the same PDF cell, the prediction with the higher score is preferred. This covers the cases where the PDF cells are smaller than the area of predicted or corrected prediction cells."}, {"label": "list_item", "id": 17, "page_no": 11, "cluster": {"id": 17, "label": "list_item", "bbox": {"l": 308.86203, "t": 391.31015, "r": 545.11517, "b": 459.99164, "coord_origin": "TOPLEFT"}, "confidence": 0.8719939589500427, "cells": [{"id": 150, "text": "8.", "bbox": {"l": 320.81702, "t": 391.31015, "r": 328.55356, "b": 400.2167099999999, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "In some rare occasions, we have noticed that Table-", "bbox": {"l": 331.13242, "t": 391.31015, "r": 545.11505, "b": 400.2167099999999, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "Former can confuse a single column as two. When the post-", "bbox": {"l": 308.86203, "t": 403.26514, "r": 545.11517, "b": 412.17169, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "processing steps are applied, this results with two predicted", "bbox": {"l": 308.86203, "t": 415.22012000000007, "r": 545.11511, "b": 424.12668, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "columns pointing to the same PDF column. In such case", "bbox": {"l": 308.86203, "t": 427.17511, "r": 545.11511, "b": 436.0816699999999, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "we must de-duplicate the columns according to highest to-", "bbox": {"l": 308.86203, "t": 439.1301, "r": 545.11505, "b": 448.03665, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "tal column intersection score.", "bbox": {"l": 308.86203, "t": 451.08507999999995, "r": 426.18161, "b": 459.99164, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "8. In some rare occasions, we have noticed that TableFormer can confuse a single column as two. When the postprocessing steps are applied, this results with two predicted columns pointing to the same PDF column. In such case we must de-duplicate the columns according to highest total column intersection score."}, {"label": "list_item", "id": 15, "page_no": 11, "cluster": {"id": 15, "label": "list_item", "bbox": {"l": 308.86203, "t": 463.39108, "r": 545.11517, "b": 567.93858, "coord_origin": "TOPLEFT"}, "confidence": 0.9126082062721252, "cells": [{"id": 157, "text": "9.", "bbox": {"l": 320.81702, "t": 463.39108, "r": 328.67316, "b": 472.29764, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "Pick up the remaining orphan cells. There could be", "bbox": {"l": 331.29187, "t": 463.39108, "r": 545.11499, "b": 472.29764, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "cases, when after applying all the previous post-processing", "bbox": {"l": 308.86203, "t": 475.34607, "r": 545.11505, "b": 484.25262, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "steps, some PDF cells could still remain without any match", "bbox": {"l": 308.86203, "t": 487.30106, "r": 545.11517, "b": 496.20761, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "to predicted cells.", "bbox": {"l": 308.86203, "t": 499.25604, "r": 381.89786, "b": 508.1626, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "However, it is still possible to deduce", "bbox": {"l": 388.7023, "t": 499.25604, "r": 545.11517, "b": 508.1626, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "the correct matching for an orphan PDF cell by mapping its", "bbox": {"l": 308.86203, "t": 511.21204, "r": 545.11511, "b": 520.11859, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "bounding box on the geometry of the grid. This mapping", "bbox": {"l": 308.86203, "t": 523.16702, "r": 545.11505, "b": 532.07358, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "decides if the content of the orphan cell will be appended to", "bbox": {"l": 308.86203, "t": 535.12201, "r": 545.11499, "b": 544.02858, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "an already matched table cell, or a new table cell should be", "bbox": {"l": 308.86203, "t": 547.07703, "r": 545.11517, "b": 555.98358, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "created to match with the orphan.", "bbox": {"l": 308.86203, "t": 559.03203, "r": 442.22147000000007, "b": 567.93858, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "9. Pick up the remaining orphan cells. There could be cases, when after applying all the previous post-processing steps, some PDF cells could still remain without any match to predicted cells. However, it is still possible to deduce the correct matching for an orphan PDF cell by mapping its bounding box on the geometry of the grid. This mapping decides if the content of the orphan cell will be appended to an already matched table cell, or a new table cell should be created to match with the orphan."}, {"label": "text", "id": 19, "page_no": 11, "cluster": {"id": 19, "label": "text", "bbox": {"l": 308.86203, "t": 571.33803, "r": 545.11688, "b": 604.15459, "coord_origin": "TOPLEFT"}, "confidence": 0.8459473848342896, "cells": [{"id": 168, "text": "9a. Compute the top and bottom boundary of the hori-", "bbox": {"l": 320.81702, "t": 571.33803, "r": 545.11493, "b": 580.24458, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "zontal band for each grid row (min/max", "bbox": {"l": 308.86203, "t": 583.29303, "r": 471.64093, "b": 592.19958, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "y", "bbox": {"l": 474.83405, "t": 583.1336200000001, "r": 479.71872, "b": 591.98041, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "coordinates per", "bbox": {"l": 483.26903999999996, "t": 583.29303, "r": 545.11688, "b": 592.19958, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "row).", "bbox": {"l": 308.86206, "t": 595.24803, "r": 329.91306, "b": 604.15459, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "9a. Compute the top and bottom boundary of the horizontal band for each grid row (min/max y coordinates per row)."}, {"label": "list_item", "id": 21, "page_no": 11, "cluster": {"id": 21, "label": "list_item", "bbox": {"l": 308.86206, "t": 607.55304, "r": 545.11505, "b": 628.4155900000001, "coord_origin": "TOPLEFT"}, "confidence": 0.7716891169548035, "cells": [{"id": 173, "text": "9b.", "bbox": {"l": 320.81705, "t": 607.55304, "r": 332.8718, "b": 616.4595899999999, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "Intersect the orphan\u2019s bounding box with the row", "bbox": {"l": 339.92532, "t": 607.55304, "r": 545.11505, "b": 616.4595899999999, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "bands, and map the cell to the closest grid row.", "bbox": {"l": 308.86206, "t": 619.50903, "r": 495.2923, "b": 628.4155900000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "9b. Intersect the orphan's bounding box with the row bands, and map the cell to the closest grid row."}, {"label": "list_item", "id": 18, "page_no": 11, "cluster": {"id": 18, "label": "list_item", "bbox": {"l": 308.86206, "t": 631.81403, "r": 545.11505, "b": 664.63059, "coord_origin": "TOPLEFT"}, "confidence": 0.8584907054901123, "cells": [{"id": 176, "text": "9c. Compute the left and right boundary of the vertical", "bbox": {"l": 320.81705, "t": 631.81403, "r": 545.11505, "b": 640.72058, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "band for each grid column (min/max", "bbox": {"l": 308.86206, "t": 643.7690299999999, "r": 455.28238, "b": 652.67558, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "x", "bbox": {"l": 457.77704, "t": 643.60962, "r": 463.47067, "b": 652.45641, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "coordinates per col-", "bbox": {"l": 465.97104, "t": 643.7690299999999, "r": 545.11389, "b": 652.67558, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "umn).", "bbox": {"l": 308.86206, "t": 655.72403, "r": 332.38376, "b": 664.63059, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "9c. Compute the left and right boundary of the vertical band for each grid column (min/max x coordinates per column)."}, {"label": "list_item", "id": 22, "page_no": 11, "cluster": {"id": 22, "label": "list_item", "bbox": {"l": 308.86206, "t": 668.03003, "r": 545.11499, "b": 688.89159, "coord_origin": "TOPLEFT"}, "confidence": 0.7590745091438293, "cells": [{"id": 181, "text": "9d. Intersect the orphan\u2019s bounding box with the column", "bbox": {"l": 320.81705, "t": 668.03003, "r": 545.11499, "b": 676.93659, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "bands, and map the cell to the closest grid column.", "bbox": {"l": 308.86206, "t": 679.98503, "r": 510.5848700000001, "b": 688.89159, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "9d. Intersect the orphan's bounding box with the column bands, and map the cell to the closest grid column."}, {"label": "list_item", "id": 25, "page_no": 11, "cluster": {"id": 25, "label": "list_item", "bbox": {"l": 308.86206, "t": 692.290024, "r": 545.11517, "b": 713.151596, "coord_origin": "TOPLEFT"}, "confidence": 0.6971189975738525, "cells": [{"id": 183, "text": "9e. If the table cell under the identified row and column", "bbox": {"l": 320.81705, "t": 692.290024, "r": 545.11505, "b": 701.196594, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "is not empty, extend its content with the content of the or-", "bbox": {"l": 308.86206, "t": 704.245026, "r": 545.11517, "b": 713.151596, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "9e. If the table cell under the identified row and column is not empty, extend its content with the content of the or-"}], "headers": [{"label": "page_footer", "id": 14, "page_no": 11, "cluster": {"id": 14, "label": "page_footer", "bbox": {"l": 292.63107, "t": 734.13303, "r": 302.59366, "b": 743.039593, "coord_origin": "TOPLEFT"}, "confidence": 0.9126598238945007, "cells": [{"id": 185, "text": "12", "bbox": {"l": 292.63107, "t": 734.13303, "r": 302.59366, "b": 743.039593, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "12"}]}}, {"page_no": 12, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "phan cell.", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 88.846588, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "9f. Otherwise create a new structural cell and match it", "bbox": {"l": 62.067001, "t": 87.16339000000005, "r": 286.36496, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "wit the orphan cell.", "bbox": {"l": 50.112, "t": 99.11841000000004, "r": 127.03322, "b": 108.02495999999985, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Aditional images with examples of TableFormer predic-", "bbox": {"l": 62.067001, "t": 111.16309000000001, "r": 286.36499, "b": 119.7508499999999, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "tions and post-processing can be found below.", "bbox": {"l": 50.112, "t": 123.11810000000003, "r": 234.06139999999996, "b": 131.70587, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Figure 8: Example of a table with multi-line header.", "bbox": {"l": 63.341, "t": 502.05637, "r": 273.13342, "b": 510.96292, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Figure 9:", "bbox": {"l": 308.862, "t": 306.59836, "r": 345.63397, "b": 315.50491, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Example of a table with big empty distance be-", "bbox": {"l": 352.78711, "t": 306.59836, "r": 545.11511, "b": 315.50491, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "tween cells.", "bbox": {"l": 308.862, "t": 318.55334, "r": 355.89545, "b": 327.45990000000006, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Figure 10: Example of a complex table with empty cells.", "bbox": {"l": 312.34299, "t": 680.4933599999999, "r": 541.63232, "b": 689.39993, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "13", "bbox": {"l": 292.63098, "t": 734.133358, "r": 302.59357, "b": 743.039921, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 14, "label": "text", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 88.846588, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.7545598149299622, "cells": [{"id": 0, "text": "phan cell.", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 88.846588, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 50.112, "t": 87.16339000000005, "r": 286.36496, "b": 108.02495999999985, "coord_origin": "TOPLEFT"}, "confidence": 0.9170762300491333, "cells": [{"id": 1, "text": "9f. Otherwise create a new structural cell and match it", "bbox": {"l": 62.067001, "t": 87.16339000000005, "r": 286.36496, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "wit the orphan cell.", "bbox": {"l": 50.112, "t": 99.11841000000004, "r": 127.03322, "b": 108.02495999999985, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 50.112, "t": 111.16309000000001, "r": 286.36499, "b": 131.70587, "coord_origin": "TOPLEFT"}, "confidence": 0.9454683065414429, "cells": [{"id": 3, "text": "Aditional images with examples of TableFormer predic-", "bbox": {"l": 62.067001, "t": 111.16309000000001, "r": 286.36499, "b": 119.7508499999999, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "tions and post-processing can be found below.", "bbox": {"l": 50.112, "t": 123.11810000000003, "r": 234.06139999999996, "b": 131.70587, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "caption", "bbox": {"l": 63.341, "t": 502.05637, "r": 273.13342, "b": 510.96292, "coord_origin": "TOPLEFT"}, "confidence": 0.8971090316772461, "cells": [{"id": 5, "text": "Figure 8: Example of a table with multi-line header.", "bbox": {"l": 63.341, "t": 502.05637, "r": 273.13342, "b": 510.96292, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "caption", "bbox": {"l": 308.862, "t": 306.59836, "r": 545.11511, "b": 327.45990000000006, "coord_origin": "TOPLEFT"}, "confidence": 0.8773345351219177, "cells": [{"id": 6, "text": "Figure 9:", "bbox": {"l": 308.862, "t": 306.59836, "r": 345.63397, "b": 315.50491, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Example of a table with big empty distance be-", "bbox": {"l": 352.78711, "t": 306.59836, "r": 545.11511, "b": 315.50491, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "tween cells.", "bbox": {"l": 308.862, "t": 318.55334, "r": 355.89545, "b": 327.45990000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "caption", "bbox": {"l": 312.34299, "t": 680.4933599999999, "r": 541.63232, "b": 689.39993, "coord_origin": "TOPLEFT"}, "confidence": 0.9188510179519653, "cells": [{"id": 9, "text": "Figure 10: Example of a complex table with empty cells.", "bbox": {"l": 312.34299, "t": 680.4933599999999, "r": 541.63232, "b": 689.39993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "page_footer", "bbox": {"l": 292.63098, "t": 734.133358, "r": 302.59357, "b": 743.039921, "coord_origin": "TOPLEFT"}, "confidence": 0.9020507335662842, "cells": [{"id": 10, "text": "13", "bbox": {"l": 292.63098, "t": 734.133358, "r": 302.59357, "b": 743.039921, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "table", "bbox": {"l": 310.3294372558594, "t": 101.17767333984375, "r": 555.8338623046875, "b": 136.14752197265625, "coord_origin": "TOPLEFT"}, "confidence": 0.70481276512146, "cells": [], "children": []}, {"id": 32, "label": "table", "bbox": {"l": 309.9566345214844, "t": 154.61448669433594, "r": 555.7466430664062, "b": 184.7225341796875, "coord_origin": "TOPLEFT"}, "confidence": 0.564289927482605, "cells": [], "children": []}, {"id": 9, "label": "table", "bbox": {"l": 84.0283203125, "t": 156.3335418701172, "r": 239.1690673828125, "b": 214.39334106445312, "coord_origin": "TOPLEFT"}, "confidence": 0.8857279419898987, "cells": [], "children": []}, {"id": 21, "label": "table", "bbox": {"l": 309.9635314941406, "t": 195.70541381835938, "r": 555.7054443359375, "b": 233.55145263671875, "coord_origin": "TOPLEFT"}, "confidence": 0.6602518558502197, "cells": [], "children": []}, {"id": 4, "label": "table", "bbox": {"l": 82.92001342773438, "t": 233.7763214111328, "r": 239.1903533935547, "b": 291.283935546875, "coord_origin": "TOPLEFT"}, "confidence": 0.9155725836753845, "cells": [], "children": []}, {"id": 19, "label": "picture", "bbox": {"l": 309.79150390625, "t": 253.90536499023438, "r": 425.9603271484375, "b": 292.39398193359375, "coord_origin": "TOPLEFT"}, "confidence": 0.6956620812416077, "cells": [], "children": []}, {"id": 37, "label": "table", "bbox": {"l": 309.79150390625, "t": 253.90536499023438, "r": 425.9603271484375, "b": 292.39398193359375, "coord_origin": "TOPLEFT"}, "confidence": 0.52826988697052, "cells": [], "children": []}, {"id": 6, "label": "table", "bbox": {"l": 83.94786071777344, "t": 309.0477294921875, "r": 239.17135620117188, "b": 367.9095764160156, "coord_origin": "TOPLEFT"}, "confidence": 0.9085132479667664, "cells": [], "children": []}, {"id": 12, "label": "table", "bbox": {"l": 335.2694091796875, "t": 388.46746826171875, "r": 490.081787109375, "b": 437.02239990234375, "coord_origin": "TOPLEFT"}, "confidence": 0.8486077189445496, "cells": [], "children": []}, {"id": 0, "label": "table", "bbox": {"l": 83.31756591796875, "t": 396.0135498046875, "r": 248.873046875, "b": 487.2569885253906, "coord_origin": "TOPLEFT"}, "confidence": 0.9613965749740601, "cells": [], "children": []}, {"id": 10, "label": "table", "bbox": {"l": 334.9334716796875, "t": 453.9476318359375, "r": 490.0914306640625, "b": 502.7210998535156, "coord_origin": "TOPLEFT"}, "confidence": 0.8815538287162781, "cells": [], "children": []}, {"id": 5, "label": "table", "bbox": {"l": 335.2545471191406, "t": 519.07568359375, "r": 490.22369384765625, "b": 567.6879272460938, "coord_origin": "TOPLEFT"}, "confidence": 0.9096733927726746, "cells": [], "children": []}, {"id": 13, "label": "picture", "bbox": {"l": 333.9573669433594, "t": 593.1134033203125, "r": 518.4768676757812, "b": 665.4903564453125, "coord_origin": "TOPLEFT"}, "confidence": 0.8023569583892822, "cells": [], "children": []}, {"id": 30, "label": "table", "bbox": {"l": 333.9573669433594, "t": 593.1134033203125, "r": 518.4768676757812, "b": 665.4903564453125, "coord_origin": "TOPLEFT"}, "confidence": 0.5930293798446655, "cells": [], "children": []}]}, "tablestructure": {"table_map": {"17": {"label": "table", "id": 17, "page_no": 12, "cluster": {"id": 17, "label": "table", "bbox": {"l": 310.3294372558594, "t": 101.17767333984375, "r": 555.8338623046875, "b": 136.14752197265625, "coord_origin": "TOPLEFT"}, "confidence": 0.70481276512146, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, "32": {"label": "table", "id": 32, "page_no": 12, "cluster": {"id": 32, "label": "table", "bbox": {"l": 309.9566345214844, "t": 154.61448669433594, "r": 555.7466430664062, "b": 184.7225341796875, "coord_origin": "TOPLEFT"}, "confidence": 0.564289927482605, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, "9": {"label": "table", "id": 9, "page_no": 12, "cluster": {"id": 9, "label": "table", "bbox": {"l": 84.0283203125, "t": 156.3335418701172, "r": 239.1690673828125, "b": 214.39334106445312, "coord_origin": "TOPLEFT"}, "confidence": 0.8857279419898987, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, "21": {"label": "table", "id": 21, "page_no": 12, "cluster": {"id": 21, "label": "table", "bbox": {"l": 309.9635314941406, "t": 195.70541381835938, "r": 555.7054443359375, "b": 233.55145263671875, "coord_origin": "TOPLEFT"}, "confidence": 0.6602518558502197, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, "4": {"label": "table", "id": 4, "page_no": 12, "cluster": {"id": 4, "label": "table", "bbox": {"l": 82.92001342773438, "t": 233.7763214111328, "r": 239.1903533935547, "b": 291.283935546875, "coord_origin": "TOPLEFT"}, "confidence": 0.9155725836753845, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, "37": {"label": "table", "id": 37, "page_no": 12, "cluster": {"id": 37, "label": "table", "bbox": {"l": 309.79150390625, "t": 253.90536499023438, "r": 425.9603271484375, "b": 292.39398193359375, "coord_origin": "TOPLEFT"}, "confidence": 0.52826988697052, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, "6": {"label": "table", "id": 6, "page_no": 12, "cluster": {"id": 6, "label": "table", "bbox": {"l": 83.94786071777344, "t": 309.0477294921875, "r": 239.17135620117188, "b": 367.9095764160156, "coord_origin": "TOPLEFT"}, "confidence": 0.9085132479667664, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, "12": {"label": "table", "id": 12, "page_no": 12, "cluster": {"id": 12, "label": "table", "bbox": {"l": 335.2694091796875, "t": 388.46746826171875, "r": 490.081787109375, "b": 437.02239990234375, "coord_origin": "TOPLEFT"}, "confidence": 0.8486077189445496, "cells": [], "children": []}, "text": null, "otsl_seq": ["ecel", "ched", "ched", "lcel", "ched", "nl", "ecel", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, "0": {"label": "table", "id": 0, "page_no": 12, "cluster": {"id": 0, "label": "table", "bbox": {"l": 83.31756591796875, "t": 396.0135498046875, "r": 248.873046875, "b": 487.2569885253906, "coord_origin": "TOPLEFT"}, "confidence": 0.9613965749740601, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "ched", "nl", "fcel", "lcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "lcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, "10": {"label": "table", "id": 10, "page_no": 12, "cluster": {"id": 10, "label": "table", "bbox": {"l": 334.9334716796875, "t": 453.9476318359375, "r": 490.0914306640625, "b": 502.7210998535156, "coord_origin": "TOPLEFT"}, "confidence": 0.8815538287162781, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "lcel", "lcel", "lcel", "nl", "ched", "ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, "5": {"label": "table", "id": 5, "page_no": 12, "cluster": {"id": 5, "label": "table", "bbox": {"l": 335.2545471191406, "t": 519.07568359375, "r": 490.22369384765625, "b": 567.6879272460938, "coord_origin": "TOPLEFT"}, "confidence": 0.9096733927726746, "cells": [], "children": []}, "text": null, "otsl_seq": ["ecel", "ched", "lcel", "lcel", "lcel", "nl", "ecel", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, "30": {"label": "table", "id": 30, "page_no": 12, "cluster": {"id": 30, "label": "table", "bbox": {"l": 333.9573669433594, "t": 593.1134033203125, "r": 518.4768676757812, "b": 665.4903564453125, "coord_origin": "TOPLEFT"}, "confidence": 0.5930293798446655, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "text", "id": 14, "page_no": 12, "cluster": {"id": 14, "label": "text", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 88.846588, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.7545598149299622, "cells": [{"id": 0, "text": "phan cell.", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 88.846588, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "phan cell."}, {"label": "text", "id": 3, "page_no": 12, "cluster": {"id": 3, "label": "text", "bbox": {"l": 50.112, "t": 87.16339000000005, "r": 286.36496, "b": 108.02495999999985, "coord_origin": "TOPLEFT"}, "confidence": 0.9170762300491333, "cells": [{"id": 1, "text": "9f. Otherwise create a new structural cell and match it", "bbox": {"l": 62.067001, "t": 87.16339000000005, "r": 286.36496, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "wit the orphan cell.", "bbox": {"l": 50.112, "t": 99.11841000000004, "r": 127.03322, "b": 108.02495999999985, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "9f. Otherwise create a new structural cell and match it wit the orphan cell."}, {"label": "text", "id": 1, "page_no": 12, "cluster": {"id": 1, "label": "text", "bbox": {"l": 50.112, "t": 111.16309000000001, "r": 286.36499, "b": 131.70587, "coord_origin": "TOPLEFT"}, "confidence": 0.9454683065414429, "cells": [{"id": 3, "text": "Aditional images with examples of TableFormer predic-", "bbox": {"l": 62.067001, "t": 111.16309000000001, "r": 286.36499, "b": 119.7508499999999, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "tions and post-processing can be found below.", "bbox": {"l": 50.112, "t": 123.11810000000003, "r": 234.06139999999996, "b": 131.70587, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Aditional images with examples of TableFormer predictions and post-processing can be found below."}, {"label": "caption", "id": 8, "page_no": 12, "cluster": {"id": 8, "label": "caption", "bbox": {"l": 63.341, "t": 502.05637, "r": 273.13342, "b": 510.96292, "coord_origin": "TOPLEFT"}, "confidence": 0.8971090316772461, "cells": [{"id": 5, "text": "Figure 8: Example of a table with multi-line header.", "bbox": {"l": 63.341, "t": 502.05637, "r": 273.13342, "b": 510.96292, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 8: Example of a table with multi-line header."}, {"label": "caption", "id": 11, "page_no": 12, "cluster": {"id": 11, "label": "caption", "bbox": {"l": 308.862, "t": 306.59836, "r": 545.11511, "b": 327.45990000000006, "coord_origin": "TOPLEFT"}, "confidence": 0.8773345351219177, "cells": [{"id": 6, "text": "Figure 9:", "bbox": {"l": 308.862, "t": 306.59836, "r": 345.63397, "b": 315.50491, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Example of a table with big empty distance be-", "bbox": {"l": 352.78711, "t": 306.59836, "r": 545.11511, "b": 315.50491, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "tween cells.", "bbox": {"l": 308.862, "t": 318.55334, "r": 355.89545, "b": 327.45990000000006, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 9: Example of a table with big empty distance between cells."}, {"label": "caption", "id": 2, "page_no": 12, "cluster": {"id": 2, "label": "caption", "bbox": {"l": 312.34299, "t": 680.4933599999999, "r": 541.63232, "b": 689.39993, "coord_origin": "TOPLEFT"}, "confidence": 0.9188510179519653, "cells": [{"id": 9, "text": "Figure 10: Example of a complex table with empty cells.", "bbox": {"l": 312.34299, "t": 680.4933599999999, "r": 541.63232, "b": 689.39993, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 10: Example of a complex table with empty cells."}, {"label": "page_footer", "id": 7, "page_no": 12, "cluster": {"id": 7, "label": "page_footer", "bbox": {"l": 292.63098, "t": 734.133358, "r": 302.59357, "b": 743.039921, "coord_origin": "TOPLEFT"}, "confidence": 0.9020507335662842, "cells": [{"id": 10, "text": "13", "bbox": {"l": 292.63098, "t": 734.133358, "r": 302.59357, "b": 743.039921, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "13"}, {"label": "table", "id": 17, "page_no": 12, "cluster": {"id": 17, "label": "table", "bbox": {"l": 310.3294372558594, "t": 101.17767333984375, "r": 555.8338623046875, "b": 136.14752197265625, "coord_origin": "TOPLEFT"}, "confidence": 0.70481276512146, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 32, "page_no": 12, "cluster": {"id": 32, "label": "table", "bbox": {"l": 309.9566345214844, "t": 154.61448669433594, "r": 555.7466430664062, "b": 184.7225341796875, "coord_origin": "TOPLEFT"}, "confidence": 0.564289927482605, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 9, "page_no": 12, "cluster": {"id": 9, "label": "table", "bbox": {"l": 84.0283203125, "t": 156.3335418701172, "r": 239.1690673828125, "b": 214.39334106445312, "coord_origin": "TOPLEFT"}, "confidence": 0.8857279419898987, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 21, "page_no": 12, "cluster": {"id": 21, "label": "table", "bbox": {"l": 309.9635314941406, "t": 195.70541381835938, "r": 555.7054443359375, "b": 233.55145263671875, "coord_origin": "TOPLEFT"}, "confidence": 0.6602518558502197, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 4, "page_no": 12, "cluster": {"id": 4, "label": "table", "bbox": {"l": 82.92001342773438, "t": 233.7763214111328, "r": 239.1903533935547, "b": 291.283935546875, "coord_origin": "TOPLEFT"}, "confidence": 0.9155725836753845, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "picture", "id": 19, "page_no": 12, "cluster": {"id": 19, "label": "picture", "bbox": {"l": 309.79150390625, "t": 253.90536499023438, "r": 425.9603271484375, "b": 292.39398193359375, "coord_origin": "TOPLEFT"}, "confidence": 0.6956620812416077, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "table", "id": 37, "page_no": 12, "cluster": {"id": 37, "label": "table", "bbox": {"l": 309.79150390625, "t": 253.90536499023438, "r": 425.9603271484375, "b": 292.39398193359375, "coord_origin": "TOPLEFT"}, "confidence": 0.52826988697052, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 6, "page_no": 12, "cluster": {"id": 6, "label": "table", "bbox": {"l": 83.94786071777344, "t": 309.0477294921875, "r": 239.17135620117188, "b": 367.9095764160156, "coord_origin": "TOPLEFT"}, "confidence": 0.9085132479667664, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 12, "page_no": 12, "cluster": {"id": 12, "label": "table", "bbox": {"l": 335.2694091796875, "t": 388.46746826171875, "r": 490.081787109375, "b": 437.02239990234375, "coord_origin": "TOPLEFT"}, "confidence": 0.8486077189445496, "cells": [], "children": []}, "text": null, "otsl_seq": ["ecel", "ched", "ched", "lcel", "ched", "nl", "ecel", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 0, "page_no": 12, "cluster": {"id": 0, "label": "table", "bbox": {"l": 83.31756591796875, "t": 396.0135498046875, "r": 248.873046875, "b": 487.2569885253906, "coord_origin": "TOPLEFT"}, "confidence": 0.9613965749740601, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "ched", "nl", "fcel", "lcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "lcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 10, "page_no": 12, "cluster": {"id": 10, "label": "table", "bbox": {"l": 334.9334716796875, "t": 453.9476318359375, "r": 490.0914306640625, "b": 502.7210998535156, "coord_origin": "TOPLEFT"}, "confidence": 0.8815538287162781, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "lcel", "lcel", "lcel", "nl", "ched", "ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 5, "page_no": 12, "cluster": {"id": 5, "label": "table", "bbox": {"l": 335.2545471191406, "t": 519.07568359375, "r": 490.22369384765625, "b": 567.6879272460938, "coord_origin": "TOPLEFT"}, "confidence": 0.9096733927726746, "cells": [], "children": []}, "text": null, "otsl_seq": ["ecel", "ched", "lcel", "lcel", "lcel", "nl", "ecel", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "picture", "id": 13, "page_no": 12, "cluster": {"id": 13, "label": "picture", "bbox": {"l": 333.9573669433594, "t": 593.1134033203125, "r": 518.4768676757812, "b": 665.4903564453125, "coord_origin": "TOPLEFT"}, "confidence": 0.8023569583892822, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "table", "id": 30, "page_no": 12, "cluster": {"id": 30, "label": "table", "bbox": {"l": 333.9573669433594, "t": 593.1134033203125, "r": 518.4768676757812, "b": 665.4903564453125, "coord_origin": "TOPLEFT"}, "confidence": 0.5930293798446655, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}], "body": [{"label": "text", "id": 14, "page_no": 12, "cluster": {"id": 14, "label": "text", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 88.846588, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.7545598149299622, "cells": [{"id": 0, "text": "phan cell.", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 88.846588, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "phan cell."}, {"label": "text", "id": 3, "page_no": 12, "cluster": {"id": 3, "label": "text", "bbox": {"l": 50.112, "t": 87.16339000000005, "r": 286.36496, "b": 108.02495999999985, "coord_origin": "TOPLEFT"}, "confidence": 0.9170762300491333, "cells": [{"id": 1, "text": "9f. Otherwise create a new structural cell and match it", "bbox": {"l": 62.067001, "t": 87.16339000000005, "r": 286.36496, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "wit the orphan cell.", "bbox": {"l": 50.112, "t": 99.11841000000004, "r": 127.03322, "b": 108.02495999999985, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "9f. Otherwise create a new structural cell and match it wit the orphan cell."}, {"label": "text", "id": 1, "page_no": 12, "cluster": {"id": 1, "label": "text", "bbox": {"l": 50.112, "t": 111.16309000000001, "r": 286.36499, "b": 131.70587, "coord_origin": "TOPLEFT"}, "confidence": 0.9454683065414429, "cells": [{"id": 3, "text": "Aditional images with examples of TableFormer predic-", "bbox": {"l": 62.067001, "t": 111.16309000000001, "r": 286.36499, "b": 119.7508499999999, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "tions and post-processing can be found below.", "bbox": {"l": 50.112, "t": 123.11810000000003, "r": 234.06139999999996, "b": 131.70587, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Aditional images with examples of TableFormer predictions and post-processing can be found below."}, {"label": "caption", "id": 8, "page_no": 12, "cluster": {"id": 8, "label": "caption", "bbox": {"l": 63.341, "t": 502.05637, "r": 273.13342, "b": 510.96292, "coord_origin": "TOPLEFT"}, "confidence": 0.8971090316772461, "cells": [{"id": 5, "text": "Figure 8: Example of a table with multi-line header.", "bbox": {"l": 63.341, "t": 502.05637, "r": 273.13342, "b": 510.96292, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 8: Example of a table with multi-line header."}, {"label": "caption", "id": 11, "page_no": 12, "cluster": {"id": 11, "label": "caption", "bbox": {"l": 308.862, "t": 306.59836, "r": 545.11511, "b": 327.45990000000006, "coord_origin": "TOPLEFT"}, "confidence": 0.8773345351219177, "cells": [{"id": 6, "text": "Figure 9:", "bbox": {"l": 308.862, "t": 306.59836, "r": 345.63397, "b": 315.50491, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Example of a table with big empty distance be-", "bbox": {"l": 352.78711, "t": 306.59836, "r": 545.11511, "b": 315.50491, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "tween cells.", "bbox": {"l": 308.862, "t": 318.55334, "r": 355.89545, "b": 327.45990000000006, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 9: Example of a table with big empty distance between cells."}, {"label": "caption", "id": 2, "page_no": 12, "cluster": {"id": 2, "label": "caption", "bbox": {"l": 312.34299, "t": 680.4933599999999, "r": 541.63232, "b": 689.39993, "coord_origin": "TOPLEFT"}, "confidence": 0.9188510179519653, "cells": [{"id": 9, "text": "Figure 10: Example of a complex table with empty cells.", "bbox": {"l": 312.34299, "t": 680.4933599999999, "r": 541.63232, "b": 689.39993, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 10: Example of a complex table with empty cells."}, {"label": "table", "id": 17, "page_no": 12, "cluster": {"id": 17, "label": "table", "bbox": {"l": 310.3294372558594, "t": 101.17767333984375, "r": 555.8338623046875, "b": 136.14752197265625, "coord_origin": "TOPLEFT"}, "confidence": 0.70481276512146, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 32, "page_no": 12, "cluster": {"id": 32, "label": "table", "bbox": {"l": 309.9566345214844, "t": 154.61448669433594, "r": 555.7466430664062, "b": 184.7225341796875, "coord_origin": "TOPLEFT"}, "confidence": 0.564289927482605, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 9, "page_no": 12, "cluster": {"id": 9, "label": "table", "bbox": {"l": 84.0283203125, "t": 156.3335418701172, "r": 239.1690673828125, "b": 214.39334106445312, "coord_origin": "TOPLEFT"}, "confidence": 0.8857279419898987, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 21, "page_no": 12, "cluster": {"id": 21, "label": "table", "bbox": {"l": 309.9635314941406, "t": 195.70541381835938, "r": 555.7054443359375, "b": 233.55145263671875, "coord_origin": "TOPLEFT"}, "confidence": 0.6602518558502197, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 4, "page_no": 12, "cluster": {"id": 4, "label": "table", "bbox": {"l": 82.92001342773438, "t": 233.7763214111328, "r": 239.1903533935547, "b": 291.283935546875, "coord_origin": "TOPLEFT"}, "confidence": 0.9155725836753845, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "picture", "id": 19, "page_no": 12, "cluster": {"id": 19, "label": "picture", "bbox": {"l": 309.79150390625, "t": 253.90536499023438, "r": 425.9603271484375, "b": 292.39398193359375, "coord_origin": "TOPLEFT"}, "confidence": 0.6956620812416077, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "table", "id": 37, "page_no": 12, "cluster": {"id": 37, "label": "table", "bbox": {"l": 309.79150390625, "t": 253.90536499023438, "r": 425.9603271484375, "b": 292.39398193359375, "coord_origin": "TOPLEFT"}, "confidence": 0.52826988697052, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 6, "page_no": 12, "cluster": {"id": 6, "label": "table", "bbox": {"l": 83.94786071777344, "t": 309.0477294921875, "r": 239.17135620117188, "b": 367.9095764160156, "coord_origin": "TOPLEFT"}, "confidence": 0.9085132479667664, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 12, "page_no": 12, "cluster": {"id": 12, "label": "table", "bbox": {"l": 335.2694091796875, "t": 388.46746826171875, "r": 490.081787109375, "b": 437.02239990234375, "coord_origin": "TOPLEFT"}, "confidence": 0.8486077189445496, "cells": [], "children": []}, "text": null, "otsl_seq": ["ecel", "ched", "ched", "lcel", "ched", "nl", "ecel", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 0, "page_no": 12, "cluster": {"id": 0, "label": "table", "bbox": {"l": 83.31756591796875, "t": 396.0135498046875, "r": 248.873046875, "b": 487.2569885253906, "coord_origin": "TOPLEFT"}, "confidence": 0.9613965749740601, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "ched", "nl", "fcel", "lcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "lcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 10, "page_no": 12, "cluster": {"id": 10, "label": "table", "bbox": {"l": 334.9334716796875, "t": 453.9476318359375, "r": 490.0914306640625, "b": 502.7210998535156, "coord_origin": "TOPLEFT"}, "confidence": 0.8815538287162781, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "lcel", "lcel", "lcel", "nl", "ched", "ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 5, "page_no": 12, "cluster": {"id": 5, "label": "table", "bbox": {"l": 335.2545471191406, "t": 519.07568359375, "r": 490.22369384765625, "b": 567.6879272460938, "coord_origin": "TOPLEFT"}, "confidence": 0.9096733927726746, "cells": [], "children": []}, "text": null, "otsl_seq": ["ecel", "ched", "lcel", "lcel", "lcel", "nl", "ecel", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "picture", "id": 13, "page_no": 12, "cluster": {"id": 13, "label": "picture", "bbox": {"l": 333.9573669433594, "t": 593.1134033203125, "r": 518.4768676757812, "b": 665.4903564453125, "coord_origin": "TOPLEFT"}, "confidence": 0.8023569583892822, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "table", "id": 30, "page_no": 12, "cluster": {"id": 30, "label": "table", "bbox": {"l": 333.9573669433594, "t": 593.1134033203125, "r": 518.4768676757812, "b": 665.4903564453125, "coord_origin": "TOPLEFT"}, "confidence": 0.5930293798446655, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}], "headers": [{"label": "page_footer", "id": 7, "page_no": 12, "cluster": {"id": 7, "label": "page_footer", "bbox": {"l": 292.63098, "t": 734.133358, "r": 302.59357, "b": 743.039921, "coord_origin": "TOPLEFT"}, "confidence": 0.9020507335662842, "cells": [{"id": 10, "text": "13", "bbox": {"l": 292.63098, "t": 734.133358, "r": 302.59357, "b": 743.039921, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "13"}]}}, {"page_no": 13, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "Figure 11:", "bbox": {"l": 50.112, "t": 356.77036, "r": 93.050797, "b": 365.67691, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Simple table with different style and empty", "bbox": {"l": 103.73071, "t": 356.77036, "r": 286.36508, "b": 365.67691, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "cells.", "bbox": {"l": 50.112, "t": 368.72534, "r": 70.864098, "b": 377.6319, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Figure 12: Simple table predictions and post processing.", "bbox": {"l": 54.618998999999995, "t": 671.81836, "r": 281.8559, "b": 680.72492, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Figure 13: Table predictions example on colorful table.", "bbox": {"l": 315.79001, "t": 371.68436, "r": 538.18524, "b": 380.59091, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Figure 14: Example with multi-line text.", "bbox": {"l": 344.98499, "t": 683.54636, "r": 508.98935000000006, "b": 692.452927, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "14", "bbox": {"l": 292.63098, "t": 734.133362, "r": 302.59357, "b": 743.039925, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 0, "label": "caption", "bbox": {"l": 50.112, "t": 356.77036, "r": 286.36508, "b": 377.6319, "coord_origin": "TOPLEFT"}, "confidence": 0.951069176197052, "cells": [{"id": 0, "text": "Figure 11:", "bbox": {"l": 50.112, "t": 356.77036, "r": 93.050797, "b": 365.67691, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Simple table with different style and empty", "bbox": {"l": 103.73071, "t": 356.77036, "r": 286.36508, "b": 365.67691, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "cells.", "bbox": {"l": 50.112, "t": 368.72534, "r": 70.864098, "b": 377.6319, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "caption", "bbox": {"l": 54.618998999999995, "t": 671.81836, "r": 281.8559, "b": 680.72492, "coord_origin": "TOPLEFT"}, "confidence": 0.926384687423706, "cells": [{"id": 3, "text": "Figure 12: Simple table predictions and post processing.", "bbox": {"l": 54.618998999999995, "t": 671.81836, "r": 281.8559, "b": 680.72492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "caption", "bbox": {"l": 315.79001, "t": 371.68436, "r": 538.18524, "b": 380.59091, "coord_origin": "TOPLEFT"}, "confidence": 0.9178510904312134, "cells": [{"id": 4, "text": "Figure 13: Table predictions example on colorful table.", "bbox": {"l": 315.79001, "t": 371.68436, "r": 538.18524, "b": 380.59091, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "caption", "bbox": {"l": 344.98499, "t": 683.54636, "r": 508.98935000000006, "b": 692.452927, "coord_origin": "TOPLEFT"}, "confidence": 0.9191023111343384, "cells": [{"id": 5, "text": "Figure 14: Example with multi-line text.", "bbox": {"l": 344.98499, "t": 683.54636, "r": 508.98935000000006, "b": 692.452927, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "page_footer", "bbox": {"l": 292.63098, "t": 734.133362, "r": 302.59357, "b": 743.039925, "coord_origin": "TOPLEFT"}, "confidence": 0.887715220451355, "cells": [{"id": 6, "text": "14", "bbox": {"l": 292.63098, "t": 734.133362, "r": 302.59357, "b": 743.039925, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "picture", "bbox": {"l": 318.6332092285156, "t": 90.88423156738281, "r": 534.73583984375, "b": 359.0575866699219, "coord_origin": "TOPLEFT"}, "confidence": 0.5003598928451538, "cells": [], "children": []}, {"id": 30, "label": "picture", "bbox": {"l": 51.15378952026367, "t": 104.30851745605469, "r": 282.8598937988281, "b": 344.90667724609375, "coord_origin": "TOPLEFT"}, "confidence": 0.5613773465156555, "cells": [], "children": []}, {"id": 23, "label": "table", "bbox": {"l": 318.9809265136719, "t": 161.23460388183594, "r": 534.6229248046875, "b": 214.6260528564453, "coord_origin": "TOPLEFT"}, "confidence": 0.6235634684562683, "cells": [], "children": []}, {"id": 33, "label": "table", "bbox": {"l": 319.0057678222656, "t": 226.10633850097656, "r": 534.408935546875, "b": 279.8576965332031, "coord_origin": "TOPLEFT"}, "confidence": 0.5502500534057617, "cells": [], "children": []}, {"id": 27, "label": "table", "bbox": {"l": 51.72642135620117, "t": 273.6092834472656, "r": 283.114013671875, "b": 344.2445068359375, "coord_origin": "TOPLEFT"}, "confidence": 0.5696635246276855, "cells": [], "children": []}, {"id": 38, "label": "table", "bbox": {"l": 328.1381530761719, "t": 288.6817932128906, "r": 523.8916015625, "b": 358.2724304199219, "coord_origin": "TOPLEFT"}, "confidence": 0.5227423310279846, "cells": [], "children": []}, {"id": 10, "label": "table", "bbox": {"l": 319.4707946777344, "t": 430.90301513671875, "r": 518.5693359375, "b": 477.94354248046875, "coord_origin": "TOPLEFT"}, "confidence": 0.8384715914726257, "cells": [], "children": []}, {"id": 9, "label": "table", "bbox": {"l": 51.434879302978516, "t": 453.48748779296875, "r": 310.7267150878906, "b": 491.82025146484375, "coord_origin": "TOPLEFT"}, "confidence": 0.8418155908584595, "cells": [], "children": []}, {"id": 8, "label": "table", "bbox": {"l": 319.982666015625, "t": 489.2437438964844, "r": 519.0963745117188, "b": 535.69580078125, "coord_origin": "TOPLEFT"}, "confidence": 0.8502867221832275, "cells": [], "children": []}, {"id": 4, "label": "table", "bbox": {"l": 50.86823654174805, "t": 504.09625244140625, "r": 310.6080017089844, "b": 542.4459838867188, "coord_origin": "TOPLEFT"}, "confidence": 0.8922696709632874, "cells": [], "children": []}, {"id": 15, "label": "table", "bbox": {"l": 319.8287658691406, "t": 546.4093017578125, "r": 519.6065673828125, "b": 593.1064453125, "coord_origin": "TOPLEFT"}, "confidence": 0.6817973256111145, "cells": [], "children": []}, {"id": 6, "label": "table", "bbox": {"l": 51.27280807495117, "t": 553.728515625, "r": 311.0897216796875, "b": 591.913330078125, "coord_origin": "TOPLEFT"}, "confidence": 0.88722163438797, "cells": [], "children": []}, {"id": 7, "label": "table", "bbox": {"l": 319.06494140625, "t": 609.8408203125, "r": 533.77392578125, "b": 669.1920776367188, "coord_origin": "TOPLEFT"}, "confidence": 0.8717735409736633, "cells": [], "children": []}, {"id": 11, "label": "picture", "bbox": {"l": 50.40477752685547, "t": 611.0038452148438, "r": 177.0564422607422, "b": 656.1609497070312, "coord_origin": "TOPLEFT"}, "confidence": 0.7871124744415283, "cells": [], "children": []}]}, "tablestructure": {"table_map": {"23": {"label": "table", "id": 23, "page_no": 13, "cluster": {"id": 23, "label": "table", "bbox": {"l": 318.9809265136719, "t": 161.23460388183594, "r": 534.6229248046875, "b": 214.6260528564453, "coord_origin": "TOPLEFT"}, "confidence": 0.6235634684562683, "cells": [], "children": []}, "text": null, "otsl_seq": ["fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, "33": {"label": "table", "id": 33, "page_no": 13, "cluster": {"id": 33, "label": "table", "bbox": {"l": 319.0057678222656, "t": 226.10633850097656, "r": 534.408935546875, "b": 279.8576965332031, "coord_origin": "TOPLEFT"}, "confidence": 0.5502500534057617, "cells": [], "children": []}, "text": null, "otsl_seq": ["fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, "27": {"label": "table", "id": 27, "page_no": 13, "cluster": {"id": 27, "label": "table", "bbox": {"l": 51.72642135620117, "t": 273.6092834472656, "r": 283.114013671875, "b": 344.2445068359375, "coord_origin": "TOPLEFT"}, "confidence": 0.5696635246276855, "cells": [], "children": []}, "text": null, "otsl_seq": ["ecel", "ched", "ched", "ched", "nl", "ecel", "fcel", "fcel", "fcel", "nl", "ecel", "fcel", "fcel", "fcel", "nl", "ecel", "fcel", "fcel", "ecel", "nl", "ecel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "ecel", "nl", "rhed", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "ecel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, "38": {"label": "table", "id": 38, "page_no": 13, "cluster": {"id": 38, "label": "table", "bbox": {"l": 328.1381530761719, "t": 288.6817932128906, "r": 523.8916015625, "b": 358.2724304199219, "coord_origin": "TOPLEFT"}, "confidence": 0.5227423310279846, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "ecel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, "10": {"label": "table", "id": 10, "page_no": 13, "cluster": {"id": 10, "label": "table", "bbox": {"l": 319.4707946777344, "t": 430.90301513671875, "r": 518.5693359375, "b": 477.94354248046875, "coord_origin": "TOPLEFT"}, "confidence": 0.8384715914726257, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, "9": {"label": "table", "id": 9, "page_no": 13, "cluster": {"id": 9, "label": "table", "bbox": {"l": 51.434879302978516, "t": 453.48748779296875, "r": 310.7267150878906, "b": 491.82025146484375, "coord_origin": "TOPLEFT"}, "confidence": 0.8418155908584595, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, "8": {"label": "table", "id": 8, "page_no": 13, "cluster": {"id": 8, "label": "table", "bbox": {"l": 319.982666015625, "t": 489.2437438964844, "r": 519.0963745117188, "b": 535.69580078125, "coord_origin": "TOPLEFT"}, "confidence": 0.8502867221832275, "cells": [], "children": []}, "text": null, "otsl_seq": ["fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, "4": {"label": "table", "id": 4, "page_no": 13, "cluster": {"id": 4, "label": "table", "bbox": {"l": 50.86823654174805, "t": 504.09625244140625, "r": 310.6080017089844, "b": 542.4459838867188, "coord_origin": "TOPLEFT"}, "confidence": 0.8922696709632874, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, "15": {"label": "table", "id": 15, "page_no": 13, "cluster": {"id": 15, "label": "table", "bbox": {"l": 319.8287658691406, "t": 546.4093017578125, "r": 519.6065673828125, "b": 593.1064453125, "coord_origin": "TOPLEFT"}, "confidence": 0.6817973256111145, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, "6": {"label": "table", "id": 6, "page_no": 13, "cluster": {"id": 6, "label": "table", "bbox": {"l": 51.27280807495117, "t": 553.728515625, "r": 311.0897216796875, "b": 591.913330078125, "coord_origin": "TOPLEFT"}, "confidence": 0.88722163438797, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, "7": {"label": "table", "id": 7, "page_no": 13, "cluster": {"id": 7, "label": "table", "bbox": {"l": 319.06494140625, "t": 609.8408203125, "r": 533.77392578125, "b": 669.1920776367188, "coord_origin": "TOPLEFT"}, "confidence": 0.8717735409736633, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "caption", "id": 0, "page_no": 13, "cluster": {"id": 0, "label": "caption", "bbox": {"l": 50.112, "t": 356.77036, "r": 286.36508, "b": 377.6319, "coord_origin": "TOPLEFT"}, "confidence": 0.951069176197052, "cells": [{"id": 0, "text": "Figure 11:", "bbox": {"l": 50.112, "t": 356.77036, "r": 93.050797, "b": 365.67691, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Simple table with different style and empty", "bbox": {"l": 103.73071, "t": 356.77036, "r": 286.36508, "b": 365.67691, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "cells.", "bbox": {"l": 50.112, "t": 368.72534, "r": 70.864098, "b": 377.6319, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 11: Simple table with different style and empty cells."}, {"label": "caption", "id": 1, "page_no": 13, "cluster": {"id": 1, "label": "caption", "bbox": {"l": 54.618998999999995, "t": 671.81836, "r": 281.8559, "b": 680.72492, "coord_origin": "TOPLEFT"}, "confidence": 0.926384687423706, "cells": [{"id": 3, "text": "Figure 12: Simple table predictions and post processing.", "bbox": {"l": 54.618998999999995, "t": 671.81836, "r": 281.8559, "b": 680.72492, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 12: Simple table predictions and post processing."}, {"label": "caption", "id": 3, "page_no": 13, "cluster": {"id": 3, "label": "caption", "bbox": {"l": 315.79001, "t": 371.68436, "r": 538.18524, "b": 380.59091, "coord_origin": "TOPLEFT"}, "confidence": 0.9178510904312134, "cells": [{"id": 4, "text": "Figure 13: Table predictions example on colorful table.", "bbox": {"l": 315.79001, "t": 371.68436, "r": 538.18524, "b": 380.59091, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 13: Table predictions example on colorful table."}, {"label": "caption", "id": 2, "page_no": 13, "cluster": {"id": 2, "label": "caption", "bbox": {"l": 344.98499, "t": 683.54636, "r": 508.98935000000006, "b": 692.452927, "coord_origin": "TOPLEFT"}, "confidence": 0.9191023111343384, "cells": [{"id": 5, "text": "Figure 14: Example with multi-line text.", "bbox": {"l": 344.98499, "t": 683.54636, "r": 508.98935000000006, "b": 692.452927, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 14: Example with multi-line text."}, {"label": "page_footer", "id": 5, "page_no": 13, "cluster": {"id": 5, "label": "page_footer", "bbox": {"l": 292.63098, "t": 734.133362, "r": 302.59357, "b": 743.039925, "coord_origin": "TOPLEFT"}, "confidence": 0.887715220451355, "cells": [{"id": 6, "text": "14", "bbox": {"l": 292.63098, "t": 734.133362, "r": 302.59357, "b": 743.039925, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "14"}, {"label": "picture", "id": 41, "page_no": 13, "cluster": {"id": 41, "label": "picture", "bbox": {"l": 318.6332092285156, "t": 90.88423156738281, "r": 534.73583984375, "b": 359.0575866699219, "coord_origin": "TOPLEFT"}, "confidence": 0.5003598928451538, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "picture", "id": 30, "page_no": 13, "cluster": {"id": 30, "label": "picture", "bbox": {"l": 51.15378952026367, "t": 104.30851745605469, "r": 282.8598937988281, "b": 344.90667724609375, "coord_origin": "TOPLEFT"}, "confidence": 0.5613773465156555, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "table", "id": 23, "page_no": 13, "cluster": {"id": 23, "label": "table", "bbox": {"l": 318.9809265136719, "t": 161.23460388183594, "r": 534.6229248046875, "b": 214.6260528564453, "coord_origin": "TOPLEFT"}, "confidence": 0.6235634684562683, "cells": [], "children": []}, "text": null, "otsl_seq": ["fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 33, "page_no": 13, "cluster": {"id": 33, "label": "table", "bbox": {"l": 319.0057678222656, "t": 226.10633850097656, "r": 534.408935546875, "b": 279.8576965332031, "coord_origin": "TOPLEFT"}, "confidence": 0.5502500534057617, "cells": [], "children": []}, "text": null, "otsl_seq": ["fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 27, "page_no": 13, "cluster": {"id": 27, "label": "table", "bbox": {"l": 51.72642135620117, "t": 273.6092834472656, "r": 283.114013671875, "b": 344.2445068359375, "coord_origin": "TOPLEFT"}, "confidence": 0.5696635246276855, "cells": [], "children": []}, "text": null, "otsl_seq": ["ecel", "ched", "ched", "ched", "nl", "ecel", "fcel", "fcel", "fcel", "nl", "ecel", "fcel", "fcel", "fcel", "nl", "ecel", "fcel", "fcel", "ecel", "nl", "ecel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "ecel", "nl", "rhed", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "ecel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 38, "page_no": 13, "cluster": {"id": 38, "label": "table", "bbox": {"l": 328.1381530761719, "t": 288.6817932128906, "r": 523.8916015625, "b": 358.2724304199219, "coord_origin": "TOPLEFT"}, "confidence": 0.5227423310279846, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "ecel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 10, "page_no": 13, "cluster": {"id": 10, "label": "table", "bbox": {"l": 319.4707946777344, "t": 430.90301513671875, "r": 518.5693359375, "b": 477.94354248046875, "coord_origin": "TOPLEFT"}, "confidence": 0.8384715914726257, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 9, "page_no": 13, "cluster": {"id": 9, "label": "table", "bbox": {"l": 51.434879302978516, "t": 453.48748779296875, "r": 310.7267150878906, "b": 491.82025146484375, "coord_origin": "TOPLEFT"}, "confidence": 0.8418155908584595, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 8, "page_no": 13, "cluster": {"id": 8, "label": "table", "bbox": {"l": 319.982666015625, "t": 489.2437438964844, "r": 519.0963745117188, "b": 535.69580078125, "coord_origin": "TOPLEFT"}, "confidence": 0.8502867221832275, "cells": [], "children": []}, "text": null, "otsl_seq": ["fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 4, "page_no": 13, "cluster": {"id": 4, "label": "table", "bbox": {"l": 50.86823654174805, "t": 504.09625244140625, "r": 310.6080017089844, "b": 542.4459838867188, "coord_origin": "TOPLEFT"}, "confidence": 0.8922696709632874, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 15, "page_no": 13, "cluster": {"id": 15, "label": "table", "bbox": {"l": 319.8287658691406, "t": 546.4093017578125, "r": 519.6065673828125, "b": 593.1064453125, "coord_origin": "TOPLEFT"}, "confidence": 0.6817973256111145, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 6, "page_no": 13, "cluster": {"id": 6, "label": "table", "bbox": {"l": 51.27280807495117, "t": 553.728515625, "r": 311.0897216796875, "b": 591.913330078125, "coord_origin": "TOPLEFT"}, "confidence": 0.88722163438797, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 7, "page_no": 13, "cluster": {"id": 7, "label": "table", "bbox": {"l": 319.06494140625, "t": 609.8408203125, "r": 533.77392578125, "b": 669.1920776367188, "coord_origin": "TOPLEFT"}, "confidence": 0.8717735409736633, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "picture", "id": 11, "page_no": 13, "cluster": {"id": 11, "label": "picture", "bbox": {"l": 50.40477752685547, "t": 611.0038452148438, "r": 177.0564422607422, "b": 656.1609497070312, "coord_origin": "TOPLEFT"}, "confidence": 0.7871124744415283, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "body": [{"label": "caption", "id": 0, "page_no": 13, "cluster": {"id": 0, "label": "caption", "bbox": {"l": 50.112, "t": 356.77036, "r": 286.36508, "b": 377.6319, "coord_origin": "TOPLEFT"}, "confidence": 0.951069176197052, "cells": [{"id": 0, "text": "Figure 11:", "bbox": {"l": 50.112, "t": 356.77036, "r": 93.050797, "b": 365.67691, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Simple table with different style and empty", "bbox": {"l": 103.73071, "t": 356.77036, "r": 286.36508, "b": 365.67691, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "cells.", "bbox": {"l": 50.112, "t": 368.72534, "r": 70.864098, "b": 377.6319, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 11: Simple table with different style and empty cells."}, {"label": "caption", "id": 1, "page_no": 13, "cluster": {"id": 1, "label": "caption", "bbox": {"l": 54.618998999999995, "t": 671.81836, "r": 281.8559, "b": 680.72492, "coord_origin": "TOPLEFT"}, "confidence": 0.926384687423706, "cells": [{"id": 3, "text": "Figure 12: Simple table predictions and post processing.", "bbox": {"l": 54.618998999999995, "t": 671.81836, "r": 281.8559, "b": 680.72492, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 12: Simple table predictions and post processing."}, {"label": "caption", "id": 3, "page_no": 13, "cluster": {"id": 3, "label": "caption", "bbox": {"l": 315.79001, "t": 371.68436, "r": 538.18524, "b": 380.59091, "coord_origin": "TOPLEFT"}, "confidence": 0.9178510904312134, "cells": [{"id": 4, "text": "Figure 13: Table predictions example on colorful table.", "bbox": {"l": 315.79001, "t": 371.68436, "r": 538.18524, "b": 380.59091, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 13: Table predictions example on colorful table."}, {"label": "caption", "id": 2, "page_no": 13, "cluster": {"id": 2, "label": "caption", "bbox": {"l": 344.98499, "t": 683.54636, "r": 508.98935000000006, "b": 692.452927, "coord_origin": "TOPLEFT"}, "confidence": 0.9191023111343384, "cells": [{"id": 5, "text": "Figure 14: Example with multi-line text.", "bbox": {"l": 344.98499, "t": 683.54636, "r": 508.98935000000006, "b": 692.452927, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 14: Example with multi-line text."}, {"label": "picture", "id": 41, "page_no": 13, "cluster": {"id": 41, "label": "picture", "bbox": {"l": 318.6332092285156, "t": 90.88423156738281, "r": 534.73583984375, "b": 359.0575866699219, "coord_origin": "TOPLEFT"}, "confidence": 0.5003598928451538, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "picture", "id": 30, "page_no": 13, "cluster": {"id": 30, "label": "picture", "bbox": {"l": 51.15378952026367, "t": 104.30851745605469, "r": 282.8598937988281, "b": 344.90667724609375, "coord_origin": "TOPLEFT"}, "confidence": 0.5613773465156555, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "table", "id": 23, "page_no": 13, "cluster": {"id": 23, "label": "table", "bbox": {"l": 318.9809265136719, "t": 161.23460388183594, "r": 534.6229248046875, "b": 214.6260528564453, "coord_origin": "TOPLEFT"}, "confidence": 0.6235634684562683, "cells": [], "children": []}, "text": null, "otsl_seq": ["fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 33, "page_no": 13, "cluster": {"id": 33, "label": "table", "bbox": {"l": 319.0057678222656, "t": 226.10633850097656, "r": 534.408935546875, "b": 279.8576965332031, "coord_origin": "TOPLEFT"}, "confidence": 0.5502500534057617, "cells": [], "children": []}, "text": null, "otsl_seq": ["fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 27, "page_no": 13, "cluster": {"id": 27, "label": "table", "bbox": {"l": 51.72642135620117, "t": 273.6092834472656, "r": 283.114013671875, "b": 344.2445068359375, "coord_origin": "TOPLEFT"}, "confidence": 0.5696635246276855, "cells": [], "children": []}, "text": null, "otsl_seq": ["ecel", "ched", "ched", "ched", "nl", "ecel", "fcel", "fcel", "fcel", "nl", "ecel", "fcel", "fcel", "fcel", "nl", "ecel", "fcel", "fcel", "ecel", "nl", "ecel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "ecel", "nl", "rhed", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "ecel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 38, "page_no": 13, "cluster": {"id": 38, "label": "table", "bbox": {"l": 328.1381530761719, "t": 288.6817932128906, "r": 523.8916015625, "b": 358.2724304199219, "coord_origin": "TOPLEFT"}, "confidence": 0.5227423310279846, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "ecel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 10, "page_no": 13, "cluster": {"id": 10, "label": "table", "bbox": {"l": 319.4707946777344, "t": 430.90301513671875, "r": 518.5693359375, "b": 477.94354248046875, "coord_origin": "TOPLEFT"}, "confidence": 0.8384715914726257, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 9, "page_no": 13, "cluster": {"id": 9, "label": "table", "bbox": {"l": 51.434879302978516, "t": 453.48748779296875, "r": 310.7267150878906, "b": 491.82025146484375, "coord_origin": "TOPLEFT"}, "confidence": 0.8418155908584595, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 8, "page_no": 13, "cluster": {"id": 8, "label": "table", "bbox": {"l": 319.982666015625, "t": 489.2437438964844, "r": 519.0963745117188, "b": 535.69580078125, "coord_origin": "TOPLEFT"}, "confidence": 0.8502867221832275, "cells": [], "children": []}, "text": null, "otsl_seq": ["fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 4, "page_no": 13, "cluster": {"id": 4, "label": "table", "bbox": {"l": 50.86823654174805, "t": 504.09625244140625, "r": 310.6080017089844, "b": 542.4459838867188, "coord_origin": "TOPLEFT"}, "confidence": 0.8922696709632874, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 15, "page_no": 13, "cluster": {"id": 15, "label": "table", "bbox": {"l": 319.8287658691406, "t": 546.4093017578125, "r": 519.6065673828125, "b": 593.1064453125, "coord_origin": "TOPLEFT"}, "confidence": 0.6817973256111145, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 6, "page_no": 13, "cluster": {"id": 6, "label": "table", "bbox": {"l": 51.27280807495117, "t": 553.728515625, "r": 311.0897216796875, "b": 591.913330078125, "coord_origin": "TOPLEFT"}, "confidence": 0.88722163438797, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 7, "page_no": 13, "cluster": {"id": 7, "label": "table", "bbox": {"l": 319.06494140625, "t": 609.8408203125, "r": 533.77392578125, "b": 669.1920776367188, "coord_origin": "TOPLEFT"}, "confidence": 0.8717735409736633, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "picture", "id": 11, "page_no": 13, "cluster": {"id": 11, "label": "picture", "bbox": {"l": 50.40477752685547, "t": 611.0038452148438, "r": 177.0564422607422, "b": 656.1609497070312, "coord_origin": "TOPLEFT"}, "confidence": 0.7871124744415283, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "headers": [{"label": "page_footer", "id": 5, "page_no": 13, "cluster": {"id": 5, "label": "page_footer", "bbox": {"l": 292.63098, "t": 734.133362, "r": 302.59357, "b": 743.039925, "coord_origin": "TOPLEFT"}, "confidence": 0.887715220451355, "cells": [{"id": 6, "text": "14", "bbox": {"l": 292.63098, "t": 734.133362, "r": 302.59357, "b": 743.039925, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "14"}]}}, {"page_no": 14, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "Figure 15: Example with triangular table.", "bbox": {"l": 84.233002, "t": 644.3513800000001, "r": 252.24225, "b": 653.25793, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Figure 16: Example of how post-processing helps to restore", "bbox": {"l": 308.86197, "t": 652.93535, "r": 545.11511, "b": 661.8419, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "mis-aligned bounding boxes prediction artifact.", "bbox": {"l": 308.86197, "t": 664.89035, "r": 497.60349, "b": 673.79691, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "15", "bbox": {"l": 292.63098, "t": 734.133343, "r": 302.59357, "b": 743.039906, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 0, "label": "caption", "bbox": {"l": 84.233002, "t": 644.3513800000001, "r": 252.24225, "b": 653.25793, "coord_origin": "TOPLEFT"}, "confidence": 0.9257225394248962, "cells": [{"id": 0, "text": "Figure 15: Example with triangular table.", "bbox": {"l": 84.233002, "t": 644.3513800000001, "r": 252.24225, "b": 653.25793, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "caption", "bbox": {"l": 308.86197, "t": 652.93535, "r": 545.11511, "b": 673.79691, "coord_origin": "TOPLEFT"}, "confidence": 0.9134758710861206, "cells": [{"id": 1, "text": "Figure 16: Example of how post-processing helps to restore", "bbox": {"l": 308.86197, "t": 652.93535, "r": 545.11511, "b": 661.8419, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "mis-aligned bounding boxes prediction artifact.", "bbox": {"l": 308.86197, "t": 664.89035, "r": 497.60349, "b": 673.79691, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "page_footer", "bbox": {"l": 292.63098, "t": 734.133343, "r": 302.59357, "b": 743.039906, "coord_origin": "TOPLEFT"}, "confidence": 0.9037020802497864, "cells": [{"id": 3, "text": "15", "bbox": {"l": 292.63098, "t": 734.133343, "r": 302.59357, "b": 743.039906, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "table", "bbox": {"l": 323.0059509277344, "t": 121.54714965820312, "r": 525.95166015625, "b": 222.91140747070312, "coord_origin": "TOPLEFT"}, "confidence": 0.8569068908691406, "cells": [], "children": []}, {"id": 6, "label": "picture", "bbox": {"l": 55.116363525390625, "t": 136.2550048828125, "r": 279.370849609375, "b": 249.3345489501953, "coord_origin": "TOPLEFT"}, "confidence": 0.8099280595779419, "cells": [], "children": []}, {"id": 19, "label": "table", "bbox": {"l": 55.116363525390625, "t": 136.2550048828125, "r": 279.370849609375, "b": 249.3345489501953, "coord_origin": "TOPLEFT"}, "confidence": 0.5584819912910461, "cells": [], "children": []}, {"id": 2, "label": "table", "bbox": {"l": 323.384765625, "t": 241.9729461669922, "r": 526.1268920898438, "b": 344.09210205078125, "coord_origin": "TOPLEFT"}, "confidence": 0.9060239195823669, "cells": [], "children": []}, {"id": 18, "label": "picture", "bbox": {"l": 54.28135299682617, "t": 260.2615661621094, "r": 279.2568359375, "b": 373.5270690917969, "coord_origin": "TOPLEFT"}, "confidence": 0.567050039768219, "cells": [], "children": []}, {"id": 10, "label": "table", "bbox": {"l": 54.28135299682617, "t": 260.2615661621094, "r": 279.2568359375, "b": 373.5270690917969, "coord_origin": "TOPLEFT"}, "confidence": 0.7748245000839233, "cells": [], "children": []}, {"id": 20, "label": "picture", "bbox": {"l": 323.46868896484375, "t": 362.4508361816406, "r": 525.9569091796875, "b": 464.260498046875, "coord_origin": "TOPLEFT"}, "confidence": 0.5515198707580566, "cells": [], "children": []}, {"id": 9, "label": "table", "bbox": {"l": 323.46868896484375, "t": 362.4508361816406, "r": 525.9569091796875, "b": 464.260498046875, "coord_origin": "TOPLEFT"}, "confidence": 0.7755160927772522, "cells": [], "children": []}, {"id": 5, "label": "picture", "bbox": {"l": 55.423954010009766, "t": 384.5550537109375, "r": 280.2310791015625, "b": 497.563720703125, "coord_origin": "TOPLEFT"}, "confidence": 0.8410326838493347, "cells": [], "children": []}, {"id": 22, "label": "picture", "bbox": {"l": 353.6920471191406, "t": 487.405029296875, "r": 495.4288024902344, "b": 635.7732543945312, "coord_origin": "TOPLEFT"}, "confidence": 0.5478786826133728, "cells": [], "children": []}, {"id": 8, "label": "table", "bbox": {"l": 353.6920471191406, "t": 487.405029296875, "r": 495.4288024902344, "b": 635.7732543945312, "coord_origin": "TOPLEFT"}, "confidence": 0.7805566787719727, "cells": [], "children": []}, {"id": 7, "label": "picture", "bbox": {"l": 50.64818572998047, "t": 505.98046875, "r": 319.9103088378906, "b": 631.263671875, "coord_origin": "TOPLEFT"}, "confidence": 0.8057592511177063, "cells": [], "children": []}, {"id": 11, "label": "table", "bbox": {"l": 50.64818572998047, "t": 505.98046875, "r": 319.9103088378906, "b": 631.263671875, "coord_origin": "TOPLEFT"}, "confidence": 0.6835257411003113, "cells": [], "children": []}]}, "tablestructure": {"table_map": {"4": {"label": "table", "id": 4, "page_no": 14, "cluster": {"id": 4, "label": "table", "bbox": {"l": 323.0059509277344, "t": 121.54714965820312, "r": 525.95166015625, "b": 222.91140747070312, "coord_origin": "TOPLEFT"}, "confidence": 0.8569068908691406, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, "19": {"label": "table", "id": 19, "page_no": 14, "cluster": {"id": 19, "label": "table", "bbox": {"l": 55.116363525390625, "t": 136.2550048828125, "r": 279.370849609375, "b": 249.3345489501953, "coord_origin": "TOPLEFT"}, "confidence": 0.5584819912910461, "cells": [], "children": []}, "text": null, "otsl_seq": ["ecel", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, "2": {"label": "table", "id": 2, "page_no": 14, "cluster": {"id": 2, "label": "table", "bbox": {"l": 323.384765625, "t": 241.9729461669922, "r": 526.1268920898438, "b": 344.09210205078125, "coord_origin": "TOPLEFT"}, "confidence": 0.9060239195823669, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, "10": {"label": "table", "id": 10, "page_no": 14, "cluster": {"id": 10, "label": "table", "bbox": {"l": 54.28135299682617, "t": 260.2615661621094, "r": 279.2568359375, "b": 373.5270690917969, "coord_origin": "TOPLEFT"}, "confidence": 0.7748245000839233, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, "9": {"label": "table", "id": 9, "page_no": 14, "cluster": {"id": 9, "label": "table", "bbox": {"l": 323.46868896484375, "t": 362.4508361816406, "r": 525.9569091796875, "b": 464.260498046875, "coord_origin": "TOPLEFT"}, "confidence": 0.7755160927772522, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, "8": {"label": "table", "id": 8, "page_no": 14, "cluster": {"id": 8, "label": "table", "bbox": {"l": 353.6920471191406, "t": 487.405029296875, "r": 495.4288024902344, "b": 635.7732543945312, "coord_origin": "TOPLEFT"}, "confidence": 0.7805566787719727, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, "11": {"label": "table", "id": 11, "page_no": 14, "cluster": {"id": 11, "label": "table", "bbox": {"l": 50.64818572998047, "t": 505.98046875, "r": 319.9103088378906, "b": 631.263671875, "coord_origin": "TOPLEFT"}, "confidence": 0.6835257411003113, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "caption", "id": 0, "page_no": 14, "cluster": {"id": 0, "label": "caption", "bbox": {"l": 84.233002, "t": 644.3513800000001, "r": 252.24225, "b": 653.25793, "coord_origin": "TOPLEFT"}, "confidence": 0.9257225394248962, "cells": [{"id": 0, "text": "Figure 15: Example with triangular table.", "bbox": {"l": 84.233002, "t": 644.3513800000001, "r": 252.24225, "b": 653.25793, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 15: Example with triangular table."}, {"label": "caption", "id": 1, "page_no": 14, "cluster": {"id": 1, "label": "caption", "bbox": {"l": 308.86197, "t": 652.93535, "r": 545.11511, "b": 673.79691, "coord_origin": "TOPLEFT"}, "confidence": 0.9134758710861206, "cells": [{"id": 1, "text": "Figure 16: Example of how post-processing helps to restore", "bbox": {"l": 308.86197, "t": 652.93535, "r": 545.11511, "b": 661.8419, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "mis-aligned bounding boxes prediction artifact.", "bbox": {"l": 308.86197, "t": 664.89035, "r": 497.60349, "b": 673.79691, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 16: Example of how post-processing helps to restore mis-aligned bounding boxes prediction artifact."}, {"label": "page_footer", "id": 3, "page_no": 14, "cluster": {"id": 3, "label": "page_footer", "bbox": {"l": 292.63098, "t": 734.133343, "r": 302.59357, "b": 743.039906, "coord_origin": "TOPLEFT"}, "confidence": 0.9037020802497864, "cells": [{"id": 3, "text": "15", "bbox": {"l": 292.63098, "t": 734.133343, "r": 302.59357, "b": 743.039906, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "15"}, {"label": "table", "id": 4, "page_no": 14, "cluster": {"id": 4, "label": "table", "bbox": {"l": 323.0059509277344, "t": 121.54714965820312, "r": 525.95166015625, "b": 222.91140747070312, "coord_origin": "TOPLEFT"}, "confidence": 0.8569068908691406, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "picture", "id": 6, "page_no": 14, "cluster": {"id": 6, "label": "picture", "bbox": {"l": 55.116363525390625, "t": 136.2550048828125, "r": 279.370849609375, "b": 249.3345489501953, "coord_origin": "TOPLEFT"}, "confidence": 0.8099280595779419, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "table", "id": 19, "page_no": 14, "cluster": {"id": 19, "label": "table", "bbox": {"l": 55.116363525390625, "t": 136.2550048828125, "r": 279.370849609375, "b": 249.3345489501953, "coord_origin": "TOPLEFT"}, "confidence": 0.5584819912910461, "cells": [], "children": []}, "text": null, "otsl_seq": ["ecel", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 2, "page_no": 14, "cluster": {"id": 2, "label": "table", "bbox": {"l": 323.384765625, "t": 241.9729461669922, "r": 526.1268920898438, "b": 344.09210205078125, "coord_origin": "TOPLEFT"}, "confidence": 0.9060239195823669, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "picture", "id": 18, "page_no": 14, "cluster": {"id": 18, "label": "picture", "bbox": {"l": 54.28135299682617, "t": 260.2615661621094, "r": 279.2568359375, "b": 373.5270690917969, "coord_origin": "TOPLEFT"}, "confidence": 0.567050039768219, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "table", "id": 10, "page_no": 14, "cluster": {"id": 10, "label": "table", "bbox": {"l": 54.28135299682617, "t": 260.2615661621094, "r": 279.2568359375, "b": 373.5270690917969, "coord_origin": "TOPLEFT"}, "confidence": 0.7748245000839233, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "picture", "id": 20, "page_no": 14, "cluster": {"id": 20, "label": "picture", "bbox": {"l": 323.46868896484375, "t": 362.4508361816406, "r": 525.9569091796875, "b": 464.260498046875, "coord_origin": "TOPLEFT"}, "confidence": 0.5515198707580566, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "table", "id": 9, "page_no": 14, "cluster": {"id": 9, "label": "table", "bbox": {"l": 323.46868896484375, "t": 362.4508361816406, "r": 525.9569091796875, "b": 464.260498046875, "coord_origin": "TOPLEFT"}, "confidence": 0.7755160927772522, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "picture", "id": 5, "page_no": 14, "cluster": {"id": 5, "label": "picture", "bbox": {"l": 55.423954010009766, "t": 384.5550537109375, "r": 280.2310791015625, "b": 497.563720703125, "coord_origin": "TOPLEFT"}, "confidence": 0.8410326838493347, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "picture", "id": 22, "page_no": 14, "cluster": {"id": 22, "label": "picture", "bbox": {"l": 353.6920471191406, "t": 487.405029296875, "r": 495.4288024902344, "b": 635.7732543945312, "coord_origin": "TOPLEFT"}, "confidence": 0.5478786826133728, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "table", "id": 8, "page_no": 14, "cluster": {"id": 8, "label": "table", "bbox": {"l": 353.6920471191406, "t": 487.405029296875, "r": 495.4288024902344, "b": 635.7732543945312, "coord_origin": "TOPLEFT"}, "confidence": 0.7805566787719727, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "picture", "id": 7, "page_no": 14, "cluster": {"id": 7, "label": "picture", "bbox": {"l": 50.64818572998047, "t": 505.98046875, "r": 319.9103088378906, "b": 631.263671875, "coord_origin": "TOPLEFT"}, "confidence": 0.8057592511177063, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "table", "id": 11, "page_no": 14, "cluster": {"id": 11, "label": "table", "bbox": {"l": 50.64818572998047, "t": 505.98046875, "r": 319.9103088378906, "b": 631.263671875, "coord_origin": "TOPLEFT"}, "confidence": 0.6835257411003113, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}], "body": [{"label": "caption", "id": 0, "page_no": 14, "cluster": {"id": 0, "label": "caption", "bbox": {"l": 84.233002, "t": 644.3513800000001, "r": 252.24225, "b": 653.25793, "coord_origin": "TOPLEFT"}, "confidence": 0.9257225394248962, "cells": [{"id": 0, "text": "Figure 15: Example with triangular table.", "bbox": {"l": 84.233002, "t": 644.3513800000001, "r": 252.24225, "b": 653.25793, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 15: Example with triangular table."}, {"label": "caption", "id": 1, "page_no": 14, "cluster": {"id": 1, "label": "caption", "bbox": {"l": 308.86197, "t": 652.93535, "r": 545.11511, "b": 673.79691, "coord_origin": "TOPLEFT"}, "confidence": 0.9134758710861206, "cells": [{"id": 1, "text": "Figure 16: Example of how post-processing helps to restore", "bbox": {"l": 308.86197, "t": 652.93535, "r": 545.11511, "b": 661.8419, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "mis-aligned bounding boxes prediction artifact.", "bbox": {"l": 308.86197, "t": 664.89035, "r": 497.60349, "b": 673.79691, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 16: Example of how post-processing helps to restore mis-aligned bounding boxes prediction artifact."}, {"label": "table", "id": 4, "page_no": 14, "cluster": {"id": 4, "label": "table", "bbox": {"l": 323.0059509277344, "t": 121.54714965820312, "r": 525.95166015625, "b": 222.91140747070312, "coord_origin": "TOPLEFT"}, "confidence": 0.8569068908691406, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "picture", "id": 6, "page_no": 14, "cluster": {"id": 6, "label": "picture", "bbox": {"l": 55.116363525390625, "t": 136.2550048828125, "r": 279.370849609375, "b": 249.3345489501953, "coord_origin": "TOPLEFT"}, "confidence": 0.8099280595779419, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "table", "id": 19, "page_no": 14, "cluster": {"id": 19, "label": "table", "bbox": {"l": 55.116363525390625, "t": 136.2550048828125, "r": 279.370849609375, "b": 249.3345489501953, "coord_origin": "TOPLEFT"}, "confidence": 0.5584819912910461, "cells": [], "children": []}, "text": null, "otsl_seq": ["ecel", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 2, "page_no": 14, "cluster": {"id": 2, "label": "table", "bbox": {"l": 323.384765625, "t": 241.9729461669922, "r": 526.1268920898438, "b": 344.09210205078125, "coord_origin": "TOPLEFT"}, "confidence": 0.9060239195823669, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "picture", "id": 18, "page_no": 14, "cluster": {"id": 18, "label": "picture", "bbox": {"l": 54.28135299682617, "t": 260.2615661621094, "r": 279.2568359375, "b": 373.5270690917969, "coord_origin": "TOPLEFT"}, "confidence": 0.567050039768219, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "table", "id": 10, "page_no": 14, "cluster": {"id": 10, "label": "table", "bbox": {"l": 54.28135299682617, "t": 260.2615661621094, "r": 279.2568359375, "b": 373.5270690917969, "coord_origin": "TOPLEFT"}, "confidence": 0.7748245000839233, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "picture", "id": 20, "page_no": 14, "cluster": {"id": 20, "label": "picture", "bbox": {"l": 323.46868896484375, "t": 362.4508361816406, "r": 525.9569091796875, "b": 464.260498046875, "coord_origin": "TOPLEFT"}, "confidence": 0.5515198707580566, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "table", "id": 9, "page_no": 14, "cluster": {"id": 9, "label": "table", "bbox": {"l": 323.46868896484375, "t": 362.4508361816406, "r": 525.9569091796875, "b": 464.260498046875, "coord_origin": "TOPLEFT"}, "confidence": 0.7755160927772522, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "picture", "id": 5, "page_no": 14, "cluster": {"id": 5, "label": "picture", "bbox": {"l": 55.423954010009766, "t": 384.5550537109375, "r": 280.2310791015625, "b": 497.563720703125, "coord_origin": "TOPLEFT"}, "confidence": 0.8410326838493347, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "picture", "id": 22, "page_no": 14, "cluster": {"id": 22, "label": "picture", "bbox": {"l": 353.6920471191406, "t": 487.405029296875, "r": 495.4288024902344, "b": 635.7732543945312, "coord_origin": "TOPLEFT"}, "confidence": 0.5478786826133728, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "table", "id": 8, "page_no": 14, "cluster": {"id": 8, "label": "table", "bbox": {"l": 353.6920471191406, "t": 487.405029296875, "r": 495.4288024902344, "b": 635.7732543945312, "coord_origin": "TOPLEFT"}, "confidence": 0.7805566787719727, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "picture", "id": 7, "page_no": 14, "cluster": {"id": 7, "label": "picture", "bbox": {"l": 50.64818572998047, "t": 505.98046875, "r": 319.9103088378906, "b": 631.263671875, "coord_origin": "TOPLEFT"}, "confidence": 0.8057592511177063, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "table", "id": 11, "page_no": 14, "cluster": {"id": 11, "label": "table", "bbox": {"l": 50.64818572998047, "t": 505.98046875, "r": 319.9103088378906, "b": 631.263671875, "coord_origin": "TOPLEFT"}, "confidence": 0.6835257411003113, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}], "headers": [{"label": "page_footer", "id": 3, "page_no": 14, "cluster": {"id": 3, "label": "page_footer", "bbox": {"l": 292.63098, "t": 734.133343, "r": 302.59357, "b": 743.039906, "coord_origin": "TOPLEFT"}, "confidence": 0.9037020802497864, "cells": [{"id": 3, "text": "15", "bbox": {"l": 292.63098, "t": 734.133343, "r": 302.59357, "b": 743.039906, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "15"}]}}, {"page_no": 15, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "Figure 17: Example of long table. End-to-end example from initial PDF cells to prediction of bounding boxes, post process-", "bbox": {"l": 50.112, "t": 508.33737, "r": 545.11383, "b": 517.24393, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "ing and prediction of structure.", "bbox": {"l": 50.112, "t": 520.2923599999999, "r": 173.23975, "b": 529.1989100000001, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "16", "bbox": {"l": 292.63098, "t": 734.133358, "r": 302.59357, "b": 743.039921, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 0, "label": "caption", "bbox": {"l": 50.112, "t": 508.33737, "r": 545.11383, "b": 529.1989100000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9624594449996948, "cells": [{"id": 0, "text": "Figure 17: Example of long table. End-to-end example from initial PDF cells to prediction of bounding boxes, post process-", "bbox": {"l": 50.112, "t": 508.33737, "r": 545.11383, "b": 517.24393, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "ing and prediction of structure.", "bbox": {"l": 50.112, "t": 520.2923599999999, "r": 173.23975, "b": 529.1989100000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "page_footer", "bbox": {"l": 292.63098, "t": 734.133358, "r": 302.59357, "b": 743.039921, "coord_origin": "TOPLEFT"}, "confidence": 0.9134101271629333, "cells": [{"id": 2, "text": "16", "bbox": {"l": 292.63098, "t": 734.133358, "r": 302.59357, "b": 743.039921, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "picture", "bbox": {"l": 66.79948425292969, "t": 253.61631774902344, "r": 528.5565795898438, "b": 498.1383972167969, "coord_origin": "TOPLEFT"}, "confidence": 0.6913455724716187, "cells": [], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "caption", "id": 0, "page_no": 15, "cluster": {"id": 0, "label": "caption", "bbox": {"l": 50.112, "t": 508.33737, "r": 545.11383, "b": 529.1989100000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9624594449996948, "cells": [{"id": 0, "text": "Figure 17: Example of long table. End-to-end example from initial PDF cells to prediction of bounding boxes, post process-", "bbox": {"l": 50.112, "t": 508.33737, "r": 545.11383, "b": 517.24393, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "ing and prediction of structure.", "bbox": {"l": 50.112, "t": 520.2923599999999, "r": 173.23975, "b": 529.1989100000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 17: Example of long table. End-to-end example from initial PDF cells to prediction of bounding boxes, post processing and prediction of structure."}, {"label": "page_footer", "id": 1, "page_no": 15, "cluster": {"id": 1, "label": "page_footer", "bbox": {"l": 292.63098, "t": 734.133358, "r": 302.59357, "b": 743.039921, "coord_origin": "TOPLEFT"}, "confidence": 0.9134101271629333, "cells": [{"id": 2, "text": "16", "bbox": {"l": 292.63098, "t": 734.133358, "r": 302.59357, "b": 743.039921, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "16"}, {"label": "picture", "id": 2, "page_no": 15, "cluster": {"id": 2, "label": "picture", "bbox": {"l": 66.79948425292969, "t": 253.61631774902344, "r": 528.5565795898438, "b": 498.1383972167969, "coord_origin": "TOPLEFT"}, "confidence": 0.6913455724716187, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "body": [{"label": "caption", "id": 0, "page_no": 15, "cluster": {"id": 0, "label": "caption", "bbox": {"l": 50.112, "t": 508.33737, "r": 545.11383, "b": 529.1989100000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9624594449996948, "cells": [{"id": 0, "text": "Figure 17: Example of long table. End-to-end example from initial PDF cells to prediction of bounding boxes, post process-", "bbox": {"l": 50.112, "t": 508.33737, "r": 545.11383, "b": 517.24393, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "ing and prediction of structure.", "bbox": {"l": 50.112, "t": 520.2923599999999, "r": 173.23975, "b": 529.1989100000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 17: Example of long table. End-to-end example from initial PDF cells to prediction of bounding boxes, post processing and prediction of structure."}, {"label": "picture", "id": 2, "page_no": 15, "cluster": {"id": 2, "label": "picture", "bbox": {"l": 66.79948425292969, "t": 253.61631774902344, "r": 528.5565795898438, "b": 498.1383972167969, "coord_origin": "TOPLEFT"}, "confidence": 0.6913455724716187, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "headers": [{"label": "page_footer", "id": 1, "page_no": 15, "cluster": {"id": 1, "label": "page_footer", "bbox": {"l": 292.63098, "t": 734.133358, "r": 302.59357, "b": 743.039921, "coord_origin": "TOPLEFT"}, "confidence": 0.9134101271629333, "cells": [{"id": 2, "text": "16", "bbox": {"l": 292.63098, "t": 734.133358, "r": 302.59357, "b": 743.039921, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "16"}]}}]
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v1/2206.01062.doctags.txt b/tests/data/groundtruth/docling_v1/2206.01062.doctags.txt
index 5cb2e383..e994b097 100644
--- a/tests/data/groundtruth/docling_v1/2206.01062.doctags.txt
+++ b/tests/data/groundtruth/docling_v1/2206.01062.doctags.txt
@@ -10,11 +10,10 @@
 <subtitle-level-1><location><page_1><loc_9><loc_29><loc_22><loc_30></location>CCS CONCEPTS</subtitle-level-1>
 <paragraph><location><page_1><loc_9><loc_25><loc_49><loc_29></location>· Information systems → Document structure ; · Applied computing → Document analysis ; · Computing methodologies → Machine learning ; Computer vision ; Object detection ;</paragraph>
 <paragraph><location><page_1><loc_9><loc_15><loc_48><loc_20></location>Permission to make digital or hard copies of part or all of this work for personal or classroom use is granted without fee provided that copies are not made or distributed for profit or commercial advantage and that copies bear this notice and the full citation on the first page. Copyrights for third-party components of this work must be honored. For all other uses, contact the owner/author(s).</paragraph>
-<paragraph><location><page_1><loc_9><loc_14><loc_32><loc_15></location>KDD '22, August 14-18, 2022, Washington, DC, USA</paragraph>
+<paragraph><location><page_1><loc_9><loc_14><loc_32><loc_15></location>KDD ’22, August 14-18, 2022, Washington, DC, USA</paragraph>
 <paragraph><location><page_1><loc_9><loc_13><loc_31><loc_14></location>© 2022 Copyright held by the owner/author(s).</paragraph>
 <paragraph><location><page_1><loc_9><loc_12><loc_26><loc_13></location>ACM ISBN 978-1-4503-9385-0/22/08.</paragraph>
 <paragraph><location><page_1><loc_9><loc_11><loc_27><loc_12></location>https://doi.org/10.1145/3534678.3539043</paragraph>
-<caption><location><page_1><loc_52><loc_29><loc_91><loc_32></location>Figure 1: Four examples of complex page layouts across different document categories</caption>
 <figure>
 <location><page_1><loc_53><loc_34><loc_90><loc_68></location>
 <caption>Figure 1: Four examples of complex page layouts across different document categories</caption>
@@ -41,7 +40,6 @@
 <subtitle-level-1><location><page_2><loc_52><loc_27><loc_78><loc_29></location>3 THE DOCLAYNET DATASET</subtitle-level-1>
 <paragraph><location><page_2><loc_52><loc_15><loc_91><loc_25></location>DocLayNet contains 80863 PDF pages. Among these, 7059 carry two instances of human annotations, and 1591 carry three. This amounts to 91104 total annotation instances. The annotations provide layout information in the shape of labeled, rectangular boundingboxes. We define 11 distinct labels for layout features, namely Caption , Footnote , Formula , List-item , Page-footer , Page-header , Picture , Section-header , Table , Text , and Title . Our reasoning for picking this particular label set is detailed in Section 4.</paragraph>
 <paragraph><location><page_2><loc_52><loc_11><loc_91><loc_14></location>In addition to open intellectual property constraints for the source documents, we required that the documents in DocLayNet adhere to a few conditions. Firstly, we kept scanned documents</paragraph>
-<caption><location><page_3><loc_9><loc_68><loc_48><loc_70></location>Figure 2: Distribution of DocLayNet pages across document categories.</caption>
 <figure>
 <location><page_3><loc_14><loc_72><loc_43><loc_88></location>
 <caption>Figure 2: Distribution of DocLayNet pages across document categories.</caption>
@@ -55,7 +53,6 @@
 <paragraph><location><page_3><loc_52><loc_26><loc_91><loc_65></location>Despite being cost-intense and far less scalable than automation, human annotation has several benefits over automated groundtruth generation. The first and most obvious reason to leverage human annotations is the freedom to annotate any type of document without requiring a programmatic source. For most PDF documents, the original source document is not available. The latter is not a hard constraint with human annotation, but it is for automated methods. A second reason to use human annotations is that the latter usually provide a more natural interpretation of the page layout. The human-interpreted layout can significantly deviate from the programmatic layout used in typesetting. For example, "invisible" tables might be used solely for aligning text paragraphs on columns. Such typesetting tricks might be interpreted by automated methods incorrectly as an actual table, while the human annotation will interpret it correctly as Text or other styles. The same applies to multi-line text elements, when authors decided to space them as "invisible" list elements without bullet symbols. A third reason to gather ground-truth through human annotation is to estimate a "natural" upper bound on the segmentation accuracy. As we will show in Section 4, certain documents featuring complex layouts can have different but equally acceptable layout interpretations. This natural upper bound for segmentation accuracy can be found by annotating the same pages multiple times by different people and evaluating the inter-annotator agreement. Such a baseline consistency evaluation is very useful to define expectations for a good target accuracy in trained deep neural network models and avoid overfitting (see Table 1). On the flip side, achieving high annotation consistency proved to be a key challenge in human annotation, as we outline in Section 4.</paragraph>
 <subtitle-level-1><location><page_3><loc_52><loc_22><loc_77><loc_23></location>4 ANNOTATION CAMPAIGN</subtitle-level-1>
 <paragraph><location><page_3><loc_52><loc_11><loc_91><loc_20></location>The annotation campaign was carried out in four phases. In phase one, we identified and prepared the data sources for annotation. In phase two, we determined the class labels and how annotations should be done on the documents in order to obtain maximum consistency. The latter was guided by a detailed requirement analysis and exhaustive experiments. In phase three, we trained the annotation staff and performed exams for quality assurance. In phase four,</paragraph>
-<caption><location><page_4><loc_9><loc_85><loc_91><loc_89></location>Table 1: DocLayNet dataset overview. Along with the frequency of each class label, we present the relative occurrence (as % of row "Total") in the train, test and validation sets. The inter-annotator agreement is computed as the mAP@0.5-0.95 metric between pairwise annotations from the triple-annotated pages, from which we obtain accuracy ranges.</caption>
 <table>
 <location><page_4><loc_16><loc_63><loc_84><loc_83></location>
 <caption>Table 1: DocLayNet dataset overview. Along with the frequency of each class label, we present the relative occurrence (as % of row "Total") in the train, test and validation sets. The inter-annotator agreement is computed as the mAP@0.5-0.95 metric between pairwise annotations from the triple-annotated pages, from which we obtain accuracy ranges.</caption>
@@ -74,14 +71,13 @@
 <row_12><col_0><row_header>Title</col_0><col_1><body>5071</col_1><col_2><body>0.47</col_2><col_3><body>0.30</col_3><col_4><body>0.50</col_4><col_5><body>60-72</col_5><col_6><body>24-63</col_6><col_7><body>50-63</col_7><col_8><body>94-100</col_8><col_9><body>82-96</col_9><col_10><body>68-79</col_10><col_11><body>24-56</col_11></row_12>
 <row_13><col_0><row_header>Total</col_0><col_1><body>1107470</col_1><col_2><body>941123</col_2><col_3><body>99816</col_3><col_4><body>66531</col_4><col_5><body>82-83</col_5><col_6><body>71-74</col_6><col_7><body>79-81</col_7><col_8><body>89-94</col_8><col_9><body>86-91</col_9><col_10><body>71-76</col_10><col_11><body>68-85</col_11></row_13>
 </table>
-<caption><location><page_4><loc_9><loc_23><loc_48><loc_30></location>Figure 3: Corpus Conversion Service annotation user interface. The PDF page is shown in the background, with overlaid text-cells (in darker shades). The annotation boxes can be drawn by dragging a rectangle over each segment with the respective label from the palette on the right.</caption>
+<caption><location><page_4><loc_9><loc_85><loc_91><loc_89></location>Table 1: DocLayNet dataset overview. Along with the frequency of each class label, we present the relative occurrence (as % of row "Total") in the train, test and validation sets. The inter-annotator agreement is computed as the mAP@0.5-0.95 metric between pairwise annotations from the triple-annotated pages, from which we obtain accuracy ranges.</caption>
 <figure>
 <location><page_4><loc_9><loc_32><loc_48><loc_61></location>
 <caption>Figure 3: Corpus Conversion Service annotation user interface. The PDF page is shown in the background, with overlaid text-cells (in darker shades). The annotation boxes can be drawn by dragging a rectangle over each segment with the respective label from the palette on the right.</caption>
 </figure>
 <paragraph><location><page_4><loc_9><loc_15><loc_48><loc_20></location>we distributed the annotation workload and performed continuous quality controls. Phase one and two required a small team of experts only. For phases three and four, a group of 40 dedicated annotators were assembled and supervised.</paragraph>
-<paragraph><location><page_4><loc_9><loc_11><loc_48><loc_14></location>Phase 1: Data selection and preparation. Our inclusion criteria for documents were described in Section 3. A large effort went into ensuring that all documents are free to use. The data sources</paragraph>
-<paragraph><location><page_4><loc_52><loc_53><loc_91><loc_61></location>include publication repositories such as arXiv$^{3}$, government offices, company websites as well as data directory services for financial reports and patents. Scanned documents were excluded wherever possible because they can be rotated or skewed. This would not allow us to perform annotation with rectangular bounding-boxes and therefore complicate the annotation process.</paragraph>
+<paragraph><location><page_4><loc_9><loc_11><loc_48><loc_14></location><location><page_4><loc_9><loc_11><loc_48><loc_14></location>Phase 1: Data selection and preparation. Our inclusion criteria for documents were described in Section 3. A large effort went into ensuring that all documents are free to use. The data sources include publication repositories such as arXiv$^{3}$, government offices, company websites as well as data directory services for financial reports and patents. Scanned documents were excluded wherever possible because they can be rotated or skewed. This would not allow us to perform annotation with rectangular bounding-boxes and therefore complicate the annotation process.</paragraph>
 <paragraph><location><page_4><loc_52><loc_36><loc_91><loc_52></location>Preparation work included uploading and parsing the sourced PDF documents in the Corpus Conversion Service (CCS) [22], a cloud-native platform which provides a visual annotation interface and allows for dataset inspection and analysis. The annotation interface of CCS is shown in Figure 3. The desired balance of pages between the different document categories was achieved by selective subsampling of pages with certain desired properties. For example, we made sure to include the title page of each document and bias the remaining page selection to those with figures or tables. The latter was achieved by leveraging pre-trained object detection models from PubLayNet, which helped us estimate how many figures and tables a given page contains.</paragraph>
 <paragraph><location><page_4><loc_52><loc_12><loc_91><loc_36></location>Phase 2: Label selection and guideline. We reviewed the collected documents and identified the most common structural features they exhibit. This was achieved by identifying recurrent layout elements and lead us to the definition of 11 distinct class labels. These 11 class labels are Caption , Footnote , Formula , List-item , Pagefooter , Page-header , Picture , Section-header , Table , Text , and Title . Critical factors that were considered for the choice of these class labels were (1) the overall occurrence of the label, (2) the specificity of the label, (3) recognisability on a single page (i.e. no need for context from previous or next page) and (4) overall coverage of the page. Specificity ensures that the choice of label is not ambiguous, while coverage ensures that all meaningful items on a page can be annotated. We refrained from class labels that are very specific to a document category, such as Abstract in the Scientific Articles category. We also avoided class labels that are tightly linked to the semantics of the text. Labels such as Author and Affiliation , as seen in DocBank, are often only distinguishable by discriminating on</paragraph>
 <paragraph><location><page_5><loc_9><loc_87><loc_48><loc_89></location>the textual content of an element, which goes beyond visual layout recognition, in particular outside the Scientific Articles category.</paragraph>
@@ -95,18 +91,16 @@
 <paragraph><location><page_5><loc_11><loc_34><loc_48><loc_38></location>- (6) Emphasised text (e.g. in italic or bold) at the beginning of a paragraph is not considered a Section-header , unless it appears exclusively on its own line.</paragraph>
 <paragraph><location><page_5><loc_9><loc_27><loc_48><loc_33></location>The complete annotation guideline is over 100 pages long and a detailed description is obviously out of scope for this paper. Nevertheless, it will be made publicly available alongside with DocLayNet for future reference.</paragraph>
 <paragraph><location><page_5><loc_9><loc_11><loc_48><loc_27></location>Phase 3: Training. After a first trial with a small group of people, we realised that providing the annotation guideline and a set of random practice pages did not yield the desired quality level for layout annotation. Therefore we prepared a subset of pages with two different complexity levels, each with a practice and an exam part. 974 pages were reference-annotated by one proficient core team member. Annotation staff were then given the task to annotate the same subsets (blinded from the reference). By comparing the annotations of each staff member with the reference annotations, we could quantify how closely their annotations matched the reference. Only after passing two exam levels with high annotation quality, staff were admitted into the production phase. Practice iterations</paragraph>
-<caption><location><page_5><loc_52><loc_36><loc_91><loc_40></location>Figure 4: Examples of plausible annotation alternatives for the same page. Criteria in our annotation guideline can resolve cases A to C, while the case D remains ambiguous.</caption>
 <figure>
 <location><page_5><loc_52><loc_42><loc_91><loc_89></location>
-<caption>Figure 4: Examples of plausible annotation alternatives for the same page. Criteria in our annotation guideline can resolve cases A to C, while the case D remains ambiguous.</caption>
 </figure>
 <paragraph><location><page_5><loc_65><loc_42><loc_78><loc_42></location>05237a14f2524e3f53c8454b074409d05078038a6a36b770fcc8ec7e540deae0</paragraph>
+<caption><location><page_5><loc_52><loc_36><loc_91><loc_40></location>Figure 4: Examples of plausible annotation alternatives for the same page. Criteria in our annotation guideline can resolve cases A to C, while the case D remains ambiguous.</caption>
 <paragraph><location><page_5><loc_52><loc_31><loc_91><loc_34></location>were carried out over a timeframe of 12 weeks, after which 8 of the 40 initially allocated annotators did not pass the bar.</paragraph>
 <paragraph><location><page_5><loc_52><loc_10><loc_91><loc_31></location>Phase 4: Production annotation. The previously selected 80K pages were annotated with the defined 11 class labels by 32 annotators. This production phase took around three months to complete. All annotations were created online through CCS, which visualises the programmatic PDF text-cells as an overlay on the page. The page annotation are obtained by drawing rectangular bounding-boxes, as shown in Figure 3. With regard to the annotation practices, we implemented a few constraints and capabilities on the tooling level. First, we only allow non-overlapping, vertically oriented, rectangular boxes. For the large majority of documents, this constraint was sufficient and it speeds up the annotation considerably in comparison with arbitrary segmentation shapes. Second, annotator staff were not able to see each other's annotations. This was enforced by design to avoid any bias in the annotation, which could skew the numbers of the inter-annotator agreement (see Table 1). We wanted</paragraph>
-<caption><location><page_6><loc_9><loc_77><loc_48><loc_89></location>Table 2: Prediction performance (mAP@0.5-0.95) of object detection networks on DocLayNet test set. The MRCNN (Mask R-CNN) and FRCNN (Faster R-CNN) models with ResNet-50 or ResNet-101 backbone were trained based on the network architectures from the detectron2 model zoo (Mask R-CNN R50, R101-FPN 3x, Faster R-CNN R101-FPN 3x), with default configurations. The YOLO implementation utilized was YOLOv5x6 [13]. All models were initialised using pre-trained weights from the COCO 2017 dataset.</caption>
+<paragraph><location><page_6><loc_9><loc_77><loc_48><loc_89></location>Table 2: Prediction performance (mAP@0.5-0.95) of object detection networks on DocLayNet test set. The MRCNN (Mask R-CNN) and FRCNN (Faster R-CNN) models with ResNet-50 or ResNet-101 backbone were trained based on the network architectures from the detectron2 model zoo (Mask R-CNN R50, R101-FPN 3x, Faster R-CNN R101-FPN 3x), with default configurations. The YOLO implementation utilized was YOLOv5x6 [13]. All models were initialised using pre-trained weights from the COCO 2017 dataset.</paragraph>
 <table>
 <location><page_6><loc_10><loc_56><loc_47><loc_75></location>
-<caption>Table 2: Prediction performance (mAP@0.5-0.95) of object detection networks on DocLayNet test set. The MRCNN (Mask R-CNN) and FRCNN (Faster R-CNN) models with ResNet-50 or ResNet-101 backbone were trained based on the network architectures from the detectron2 model zoo (Mask R-CNN R50, R101-FPN 3x, Faster R-CNN R101-FPN 3x), with default configurations. The YOLO implementation utilized was YOLOv5x6 [13]. All models were initialised using pre-trained weights from the COCO 2017 dataset.</caption>
 <row_0><col_0><body></col_0><col_1><col_header>human</col_1><col_2><col_header>MRCNN</col_2><col_3><col_header>MRCNN</col_3><col_4><col_header>FRCNN</col_4><col_5><col_header>YOLO</col_5></row_0>
 <row_1><col_0><body></col_0><col_1><col_header>human</col_1><col_2><col_header>R50</col_2><col_3><col_header>R101</col_3><col_4><col_header>R101</col_4><col_5><col_header>v5x6</col_5></row_1>
 <row_2><col_0><row_header>Caption</col_0><col_1><body>84-89</col_1><col_2><body>68.4</col_2><col_3><body>71.5</col_3><col_4><body>70.1</col_4><col_5><body>77.7</col_5></row_2>
@@ -125,7 +119,6 @@
 <paragraph><location><page_6><loc_9><loc_27><loc_48><loc_53></location>to avoid this at any cost in order to have clear, unbiased baseline numbers for human document-layout annotation. Third, we introduced the feature of snapping boxes around text segments to obtain a pixel-accurate annotation and again reduce time and effort. The CCS annotation tool automatically shrinks every user-drawn box to the minimum bounding-box around the enclosed text-cells for all purely text-based segments, which excludes only Table and Picture . For the latter, we instructed annotation staff to minimise inclusion of surrounding whitespace while including all graphical lines. A downside of snapping boxes to enclosed text cells is that some wrongly parsed PDF pages cannot be annotated correctly and need to be skipped. Fourth, we established a way to flag pages as rejected for cases where no valid annotation according to the label guidelines could be achieved. Example cases for this would be PDF pages that render incorrectly or contain layouts that are impossible to capture with non-overlapping rectangles. Such rejected pages are not contained in the final dataset. With all these measures in place, experienced annotation staff managed to annotate a single page in a typical timeframe of 20s to 60s, depending on its complexity.</paragraph>
 <subtitle-level-1><location><page_6><loc_9><loc_24><loc_24><loc_26></location>5 EXPERIMENTS</subtitle-level-1>
 <paragraph><location><page_6><loc_9><loc_10><loc_48><loc_23></location>The primary goal of DocLayNet is to obtain high-quality ML models capable of accurate document-layout analysis on a wide variety of challenging layouts. As discussed in Section 2, object detection models are currently the easiest to use, due to the standardisation of ground-truth data in COCO format [16] and the availability of general frameworks such as detectron2 [17]. Furthermore, baseline numbers in PubLayNet and DocBank were obtained using standard object detection models such as Mask R-CNN and Faster R-CNN. As such, we will relate to these object detection methods in this</paragraph>
-<caption><location><page_6><loc_52><loc_57><loc_91><loc_65></location>Figure 5: Prediction performance (mAP@0.5-0.95) of a Mask R-CNN network with ResNet50 backbone trained on increasing fractions of the DocLayNet dataset. The learning curve flattens around the 80% mark, indicating that increasing the size of the DocLayNet dataset with similar data will not yield significantly better predictions.</caption>
 <figure>
 <location><page_6><loc_53><loc_67><loc_90><loc_89></location>
 <caption>Figure 5: Prediction performance (mAP@0.5-0.95) of a Mask R-CNN network with ResNet50 backbone trained on increasing fractions of the DocLayNet dataset. The learning curve flattens around the 80% mark, indicating that increasing the size of the DocLayNet dataset with similar data will not yield significantly better predictions.</caption>
@@ -135,10 +128,8 @@
 <subtitle-level-1><location><page_6><loc_52><loc_36><loc_76><loc_37></location>Baselines for Object Detection</subtitle-level-1>
 <paragraph><location><page_6><loc_52><loc_11><loc_91><loc_35></location>In Table 2, we present baseline experiments (given in mAP) on Mask R-CNN [12], Faster R-CNN [11], and YOLOv5 [13]. Both training and evaluation were performed on RGB images with dimensions of 1025 × 1025 pixels. For training, we only used one annotation in case of redundantly annotated pages. As one can observe, the variation in mAP between the models is rather low, but overall between 6 and 10% lower than the mAP computed from the pairwise human annotations on triple-annotated pages. This gives a good indication that the DocLayNet dataset poses a worthwhile challenge for the research community to close the gap between human recognition and ML approaches. It is interesting to see that Mask R-CNN and Faster R-CNN produce very comparable mAP scores, indicating that pixel-based image segmentation derived from bounding-boxes does not help to obtain better predictions. On the other hand, the more recent Yolov5x model does very well and even out-performs humans on selected labels such as Text , Table and Picture . This is not entirely surprising, as Text , Table and Picture are abundant and the most visually distinctive in a document.</paragraph>
 <paragraph><location><page_7><loc_9><loc_84><loc_48><loc_89></location>Table 3: Performance of a Mask R-CNN R50 network in mAP@0.5-0.95 scores trained on DocLayNet with different class label sets. The reduced label sets were obtained by either down-mapping or dropping labels.</paragraph>
-<caption><location><page_7><loc_52><loc_84><loc_91><loc_89></location>Table 4: Performance of a Mask R-CNN R50 network with document-wise and page-wise split for different label sets. Naive page-wise split will result in GLYPH<tildelow> 10% point improvement.</caption>
 <table>
 <location><page_7><loc_13><loc_63><loc_44><loc_81></location>
-<caption>Table 4: Performance of a Mask R-CNN R50 network with document-wise and page-wise split for different label sets. Naive page-wise split will result in GLYPH<tildelow> 10% point improvement.</caption>
 <row_0><col_0><col_header>Class-count</col_0><col_1><col_header>11</col_1><col_2><col_header>6</col_2><col_3><col_header>5</col_3><col_4><col_header>4</col_4></row_0>
 <row_1><col_0><row_header>Caption</col_0><col_1><body>68</col_1><col_2><body>Text</col_2><col_3><body>Text</col_3><col_4><body>Text</col_4></row_1>
 <row_2><col_0><row_header>Footnote</col_0><col_1><body>71</col_1><col_2><body>Text</col_2><col_3><body>Text</col_3><col_4><body>Text</col_4></row_2>
@@ -157,6 +148,7 @@
 <paragraph><location><page_7><loc_9><loc_33><loc_48><loc_58></location>One of the fundamental questions related to any dataset is if it is "large enough". To answer this question for DocLayNet, we performed a data ablation study in which we evaluated a Mask R-CNN model trained on increasing fractions of the DocLayNet dataset. As can be seen in Figure 5, the mAP score rises sharply in the beginning and eventually levels out. To estimate the error-bar on the metrics, we ran the training five times on the entire data-set. This resulted in a 1% error-bar, depicted by the shaded area in Figure 5. In the inset of Figure 5, we show the exact same data-points, but with a logarithmic scale on the x-axis. As is expected, the mAP score increases linearly as a function of the data-size in the inset. The curve ultimately flattens out between the 80% and 100% mark, with the 80% mark falling within the error-bars of the 100% mark. This provides a good indication that the model would not improve significantly by yet increasing the data size. Rather, it would probably benefit more from improved data consistency (as discussed in Section 3), data augmentation methods [23], or the addition of more document categories and styles.</paragraph>
 <subtitle-level-1><location><page_7><loc_9><loc_30><loc_27><loc_32></location>Impact of Class Labels</subtitle-level-1>
 <paragraph><location><page_7><loc_9><loc_11><loc_48><loc_30></location>The choice and number of labels can have a significant effect on the overall model performance. Since PubLayNet, DocBank and DocLayNet all have different label sets, it is of particular interest to understand and quantify this influence of the label set on the model performance. We investigate this by either down-mapping labels into more common ones (e.g. Caption → Text ) or excluding them from the annotations entirely. Furthermore, it must be stressed that all mappings and exclusions were performed on the data before model training. In Table 3, we present the mAP scores for a Mask R-CNN R50 network on different label sets. Where a label is down-mapped, we show its corresponding label, otherwise it was excluded. We present three different label sets, with 6, 5 and 4 different labels respectively. The set of 5 labels contains the same labels as PubLayNet. However, due to the different definition of</paragraph>
+<paragraph><location><page_7><loc_52><loc_84><loc_91><loc_89></location>Table 4: Performance of a Mask R-CNN R50 network with document-wise and page-wise split for different label sets. Naive page-wise split will result in GLYPH<tildelow> 10% point improvement.</paragraph>
 <table>
 <location><page_7><loc_58><loc_61><loc_85><loc_81></location>
 <row_0><col_0><body>Class-count</col_0><col_1><col_header>11</col_1><col_2><col_header>11</col_2><col_3><col_header>5</col_3><col_4><col_header>5</col_4></row_0>
@@ -179,10 +171,9 @@
 <paragraph><location><page_7><loc_52><loc_25><loc_91><loc_44></location>Many documents in DocLayNet have a unique styling. In order to avoid overfitting on a particular style, we have split the train-, test- and validation-sets of DocLayNet on document boundaries, i.e. every document contributes pages to only one set. To the best of our knowledge, this was not considered in PubLayNet or DocBank. To quantify how this affects model performance, we trained and evaluated a Mask R-CNN R50 model on a modified dataset version. Here, the train-, test- and validation-sets were obtained by a randomised draw over the individual pages. As can be seen in Table 4, the difference in model performance is surprisingly large: pagewise splitting gains ˜ 10% in mAP over the document-wise splitting. Thus, random page-wise splitting of DocLayNet can easily lead to accidental overestimation of model performance and should be avoided.</paragraph>
 <subtitle-level-1><location><page_7><loc_52><loc_22><loc_68><loc_23></location>Dataset Comparison</subtitle-level-1>
 <paragraph><location><page_7><loc_52><loc_11><loc_91><loc_21></location>Throughout this paper, we claim that DocLayNet's wider variety of document layouts leads to more robust layout detection models. In Table 5, we provide evidence for that. We trained models on each of the available datasets (PubLayNet, DocBank and DocLayNet) and evaluated them on the test sets of the other datasets. Due to the different label sets and annotation styles, a direct comparison is not possible. Hence, we focussed on the common labels among the datasets. Between PubLayNet and DocLayNet, these are Picture ,</paragraph>
-<caption><location><page_8><loc_9><loc_81><loc_48><loc_89></location>Table 5: Prediction Performance (mAP@0.5-0.95) of a Mask R-CNN R50 network across the PubLayNet, DocBank & DocLayNet data-sets. By evaluating on common label classes of each dataset, we observe that the DocLayNet-trained model has much less pronounced variations in performance across all datasets.</caption>
+<paragraph><location><page_8><loc_9><loc_81><loc_48><loc_89></location>Table 5: Prediction Performance (mAP@0.5-0.95) of a Mask R-CNN R50 network across the PubLayNet, DocBank & DocLayNet data-sets. By evaluating on common label classes of each dataset, we observe that the DocLayNet-trained model has much less pronounced variations in performance across all datasets.</paragraph>
 <table>
 <location><page_8><loc_12><loc_57><loc_45><loc_78></location>
-<caption>Table 5: Prediction Performance (mAP@0.5-0.95) of a Mask R-CNN R50 network across the PubLayNet, DocBank & DocLayNet data-sets. By evaluating on common label classes of each dataset, we observe that the DocLayNet-trained model has much less pronounced variations in performance across all datasets.</caption>
 <row_0><col_0><body></col_0><col_1><body></col_1><col_2><col_header>Testing on</col_2><col_3><col_header>Testing on</col_3><col_4><col_header>Testing on</col_4></row_0>
 <row_1><col_0><col_header>Training on</col_0><col_1><col_header>labels</col_1><col_2><col_header>PLN</col_2><col_3><col_header>DB</col_3><col_4><col_header>DLN</col_4></row_1>
 <row_2><col_0><row_header>PubLayNet (PLN)</col_0><col_1><row_header>Figure</col_1><col_2><body>96</col_2><col_3><body>43</col_3><col_4><body>23</col_4></row_2>
@@ -221,20 +212,19 @@
 <paragraph><location><page_8><loc_52><loc_18><loc_91><loc_21></location>- [11] Shaoqing Ren, Kaiming He, Ross Girshick, and Jian Sun. Faster r-cnn: Towards real-time object detection with region proposal networks. IEEE Transactions on Pattern Analysis and Machine Intelligence , 39(6):1137-1149, 2017.</paragraph>
 <paragraph><location><page_8><loc_52><loc_15><loc_91><loc_18></location>- [12] Kaiming He, Georgia Gkioxari, Piotr Dollár, and Ross B. Girshick. Mask R-CNN. In IEEE International Conference on Computer Vision , ICCV, pages 2980-2988. IEEE Computer Society, Oct 2017.</paragraph>
 <paragraph><location><page_8><loc_52><loc_11><loc_91><loc_15></location>- [13] Glenn Jocher, Alex Stoken, Ayush Chaurasia, Jirka Borovec, NanoCode012, TaoXie, Yonghye Kwon, Kalen Michael, Liu Changyu, Jiacong Fang, Abhiram V, Laughing, tkianai, yxNONG, Piotr Skalski, Adam Hogan, Jebastin Nadar, imyhxy, Lorenzo Mammana, Alex Wang, Cristi Fati, Diego Montes, Jan Hajek, Laurentiu</paragraph>
-<caption><location><page_9><loc_10><loc_43><loc_52><loc_44></location>Text Caption List-Item Formula Table Section-Header Picture Page-Header Page-Footer Title</caption>
 <figure>
 <location><page_9><loc_9><loc_44><loc_91><loc_89></location>
 <caption>Text Caption List-Item Formula Table Section-Header Picture Page-Header Page-Footer Title</caption>
 </figure>
 <paragraph><location><page_9><loc_9><loc_36><loc_91><loc_41></location>Figure 6: Example layout predictions on selected pages from the DocLayNet test-set. (A, D) exhibit favourable results on coloured backgrounds. (B, C) show accurate list-item and paragraph differentiation despite densely-spaced lines. (E) demonstrates good table and figure distinction. (F) shows predictions on a Chinese patent with multiple overlaps, label confusion and missing boxes.</paragraph>
 <paragraph><location><page_9><loc_11><loc_31><loc_48><loc_33></location>Diaconu, Mai Thanh Minh, Marc, albinxavi, fatih, oleg, and wanghao yang. ultralytics/yolov5: v6.0 - yolov5n nano models, roboflow integration, tensorflow export, opencv dnn support, October 2021.</paragraph>
+<paragraph><location><page_9><loc_52><loc_32><loc_91><loc_33></location>- [20] Shoubin Li, Xuyan Ma, Shuaiqun Pan, Jun Hu, Lin Shi, and Qing Wang. Vtlayout: Fusion of visual and text features for document layout analysis, 2021.</paragraph>
 <paragraph><location><page_9><loc_9><loc_28><loc_48><loc_30></location>- [14] Nicolas Carion, Francisco Massa, Gabriel Synnaeve, Nicolas Usunier, Alexander Kirillov, and Sergey Zagoruyko. End-to-end object detection with transformers. CoRR , abs/2005.12872, 2020.</paragraph>
 <paragraph><location><page_9><loc_9><loc_26><loc_48><loc_27></location>- [15] Mingxing Tan, Ruoming Pang, and Quoc V. Le. Efficientdet: Scalable and efficient object detection. CoRR , abs/1911.09070, 2019.</paragraph>
 <paragraph><location><page_9><loc_9><loc_23><loc_48><loc_25></location>- [16] Tsung-Yi Lin, Michael Maire, Serge J. Belongie, Lubomir D. Bourdev, Ross B. Girshick, James Hays, Pietro Perona, Deva Ramanan, Piotr Dollár, and C. Lawrence Zitnick. Microsoft COCO: common objects in context, 2014.</paragraph>
 <paragraph><location><page_9><loc_9><loc_21><loc_48><loc_22></location>- [17] Yuxin Wu, Alexander Kirillov, Francisco Massa, Wan-Yen Lo, and Ross Girshick. Detectron2, 2019.</paragraph>
 <paragraph><location><page_9><loc_9><loc_16><loc_48><loc_20></location>- [18] Nikolaos Livathinos, Cesar Berrospi, Maksym Lysak, Viktor Kuropiatnyk, Ahmed Nassar, Andre Carvalho, Michele Dolfi, Christoph Auer, Kasper Dinkla, and Peter W. J. Staar. Robust pdf document conversion using recurrent neural networks. In Proceedings of the 35th Conference on Artificial Intelligence , AAAI, pages 1513715145, feb 2021.</paragraph>
 <paragraph><location><page_9><loc_9><loc_10><loc_48><loc_15></location>- [19] Yiheng Xu, Minghao Li, Lei Cui, Shaohan Huang, Furu Wei, and Ming Zhou. Layoutlm: Pre-training of text and layout for document image understanding. In Proceedings of the 26th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining , KDD, pages 1192-1200, New York, USA, 2020. Association for Computing Machinery.</paragraph>
-<paragraph><location><page_9><loc_52><loc_32><loc_91><loc_33></location>- [20] Shoubin Li, Xuyan Ma, Shuaiqun Pan, Jun Hu, Lin Shi, and Qing Wang. Vtlayout: Fusion of visual and text features for document layout analysis, 2021.</paragraph>
 <paragraph><location><page_9><loc_52><loc_29><loc_91><loc_31></location>- [21] Peng Zhang, Can Li, Liang Qiao, Zhanzhan Cheng, Shiliang Pu, Yi Niu, and Fei Wu. Vsr: A unified framework for document layout analysis combining vision, semantics and relations, 2021.</paragraph>
 <paragraph><location><page_9><loc_52><loc_25><loc_91><loc_28></location>- [22] Peter W J Staar, Michele Dolfi, Christoph Auer, and Costas Bekas. Corpus conversion service: A machine learning platform to ingest documents at scale. In Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining , KDD, pages 774-782. ACM, 2018.</paragraph>
 <paragraph><location><page_9><loc_52><loc_23><loc_91><loc_24></location>- [23] Connor Shorten and Taghi M. Khoshgoftaar. A survey on image data augmentation for deep learning. Journal of Big Data , 6(1):60, 2019.</paragraph>
diff --git a/tests/data/groundtruth/docling_v1/2206.01062.json b/tests/data/groundtruth/docling_v1/2206.01062.json
index 88d92f64..5564166b 100644
--- a/tests/data/groundtruth/docling_v1/2206.01062.json
+++ b/tests/data/groundtruth/docling_v1/2206.01062.json
@@ -1 +1 @@
-{"_name": "", "type": "pdf-document", "description": {"title": null, "abstract": null, "authors": null, "affiliations": null, "subjects": null, "keywords": null, "publication_date": null, "languages": null, "license": null, "publishers": null, "url_refs": null, "references": null, "publication": null, "reference_count": null, "citation_count": null, "citation_date": null, "advanced": null, "analytics": null, "logs": [], "collection": null, "acquisition": null}, "file-info": {"filename": "2206.01062.pdf", "filename-prov": null, "document-hash": "ea5bd3ba45359d9f21632f29ac48cd8d7931b4e3dce1595ac524a1e3e8f17c68", "#-pages": 9, "collection-name": null, "description": null, "page-hashes": [{"hash": "8953a93154d76e567fd12cbedc80fdd96acd7b95f8796fdd99e6323e9b5e62e5", "model": "default", "page": 1}, {"hash": "95fd7493687c826ad61870d95fe51c293e5ff2d0ced3852dccca2724152476ab", "model": "default", "page": 2}, {"hash": "eb5b7ec90656ea3cfa128b31b9432372311744f14c489749e696d6a2eab71cc2", "model": "default", "page": 3}, {"hash": "c21e9c23ddb16c953b61dc355143d0df64f633c9d3e9933811a01475c6361444", "model": "default", "page": 4}, {"hash": "8bdd7d75da6d0379991f2d1ec5d4593ecd41a6423d24b77d6d18f339b22c8fc2", "model": "default", "page": 5}, {"hash": "a32fa49cde50042ed0a0620f5015e210f5ef4c09508fb7a2d801ebeaa36418ba", "model": "default", "page": 6}, {"hash": "874e4b99a0c8e3ade493554d3d3dab9020e212a30b13906b54802e625fec32f8", "model": "default", "page": 7}, {"hash": "fc85d29ecb3220967463748596069586cfb6b5a9ee4196aa4a4a5c7da14cd9ca", "model": "default", "page": 8}, {"hash": "63f84ea4aeecf4daa62599747b3722a22426f99924ca5fef9424a1a7f9ba7be2", "model": "default", "page": 9}]}, "main-text": [{"prov": [{"bbox": [18.3402099609375, 236.99996948242188, 36.33979415893555, 573.6400146484375], "page": 1, "span": [0, 37], "__ref_s3_data": null}], "text": "arXiv:2206.01062v1 [cs.CV] 2 Jun 2022", "type": "page-header", "payload": null, "name": "Page-header", "font": null}, {"prov": [{"bbox": [107.30000305175781, 672.4044189453125, 505.06195068359375, 708.3052978515625], "page": 1, "span": [0, 71], "__ref_s3_data": null}], "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [90.96701049804688, 611.7597045898438, 193.73123168945312, 658.32763671875], "page": 1, "span": [0, 73], "__ref_s3_data": null}], "text": "Birgit Pfitzmann IBM Research Rueschlikon, Switzerland bpf@zurich.ibm.com", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [255.11602783203125, 611.7597045898438, 357.8802490234375, 658.32763671875], "page": 1, "span": [0, 71], "__ref_s3_data": null}], "text": "Christoph Auer IBM Research Rueschlikon, Switzerland cau@zurich.ibm.com", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [419.2650451660156, 611.7597045898438, 522.029296875, 658.32763671875], "page": 1, "span": [0, 70], "__ref_s3_data": null}], "text": "Michele Dolfi IBM Research Rueschlikon, Switzerland dol@zurich.ibm.com", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [172.54302978515625, 553.3746948242188, 275.3072509765625, 599.942626953125], "page": 1, "span": [0, 72], "__ref_s3_data": null}], "text": "Ahmed S. Nassar IBM Research Rueschlikon, Switzerland ahn@zurich.ibm.com", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [336.6930236816406, 553.3746948242188, 439.457275390625, 599.942626953125], "page": 1, "span": [0, 68], "__ref_s3_data": null}], "text": "Peter Staar IBM Research Rueschlikon, Switzerland taa@zurich.ibm.com", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [53.79803466796875, 533.9879760742188, 111.94354248046875, 544.297119140625], "page": 1, "span": [0, 8], "__ref_s3_data": null}], "text": "ABSTRACT", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [53.46699905395508, 257.7068176269531, 295.5601806640625, 529.095458984375], "page": 1, "span": [0, 1595], "__ref_s3_data": null}], "text": "Accurate document layout analysis is a key requirement for highquality PDF document conversion. With the recent availability of public, large ground-truth datasets such as PubLayNet and DocBank, deep-learning models have proven to be very effective at layout detection and segmentation. While these datasets are of adequate size to train such models, they severely lack in layout variability since they are sourced from scientific article repositories such as PubMed and arXiv only. Consequently, the accuracy of the layout segmentation drops significantly when these models are applied on more challenging and diverse layouts. In this paper, we present DocLayNet , a new, publicly available, document-layout annotation dataset in COCO format. It contains 80863 manually annotated pages from diverse data sources to represent a wide variability in layouts. For each PDF page, the layout annotations provide labelled bounding-boxes with a choice of 11 distinct classes. DocLayNet also provides a subset of double- and triple-annotated pages to determine the inter-annotator agreement. In multiple experiments, we provide baseline accuracy scores (in mAP) for a set of popular object detection models. We also demonstrate that these models fall approximately 10% behind the inter-annotator agreement. Furthermore, we provide evidence that DocLayNet is of sufficient size. Lastly, we compare models trained on PubLayNet, DocBank and DocLayNet, showing that layout predictions of the DocLayNettrained models are more robust and thus the preferred choice for general-purpose document-layout analysis.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [53.79800033569336, 230.69398498535156, 134.81988525390625, 241.00308227539062], "page": 1, "span": [0, 12], "__ref_s3_data": null}], "text": "CCS CONCEPTS", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [53.79798889160156, 195.4988555908203, 297.8529357910156, 225.91700744628906], "page": 1, "span": [0, 170], "__ref_s3_data": null}], "text": "\u00b7 Information systems \u2192 Document structure ; \u00b7 Applied computing \u2192 Document analysis ; \u00b7 Computing methodologies \u2192 Machine learning ; Computer vision ; Object detection ;", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [53.79800033569336, 119.2081069946289, 295.11798095703125, 157.60162353515625], "page": 1, "span": [0, 397], "__ref_s3_data": null}], "text": "Permission to make digital or hard copies of part or all of this work for personal or classroom use is granted without fee provided that copies are not made or distributed for profit or commercial advantage and that copies bear this notice and the full citation on the first page. Copyrights for third-party components of this work must be honored. For all other uses, contact the owner/author(s).", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [53.79800033569336, 110.43414306640625, 197.8627471923828, 116.91976928710938], "page": 1, "span": [0, 48], "__ref_s3_data": null}], "text": "KDD '22, August 14-18, 2022, Washington, DC, USA", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [53.31700134277344, 101.67411041259766, 186.74652099609375, 108.18763732910156], "page": 1, "span": [0, 45], "__ref_s3_data": null}], "text": "\u00a9 2022 Copyright held by the owner/author(s).", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [53.55400085449219, 93.70310974121094, 157.03125, 100.21663665771484], "page": 1, "span": [0, 33], "__ref_s3_data": null}], "text": "ACM ISBN 978-1-4503-9385-0/22/08.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [53.79800033569336, 85.73310852050781, 166.94093322753906, 92.24663543701172], "page": 1, "span": [0, 39], "__ref_s3_data": null}], "text": "https://doi.org/10.1145/3534678.3539043", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [317.9549865722656, 232.48475646972656, 559.8057861328125, 251.91700744628906], "page": 1, "span": [0, 84], "__ref_s3_data": null}], "text": "Figure 1: Four examples of complex page layouts across different document categories", "type": "caption", "payload": null, "name": "Caption", "font": null}, {"name": "Picture", "type": "figure", "$ref": "#/figures/0"}, {"prov": [{"bbox": [317.9549865722656, 189.22499084472656, 379.82049560546875, 199.53408813476562], "page": 1, "span": [0, 8], "__ref_s3_data": null}], "text": "KEYWORDS", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [317.9549865722656, 164.9988250732422, 559.1859741210938, 184.3324432373047], "page": 1, "span": [0, 90], "__ref_s3_data": null}], "text": "PDF document conversion, layout segmentation, object-detection, data set, Machine Learning", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [317.65997314453125, 144.41390991210938, 404.6536560058594, 151.94566345214844], "page": 1, "span": [0, 21], "__ref_s3_data": null}], "text": "ACM Reference Format:", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [317.9549865722656, 84.62297058105469, 559.5494995117188, 141.88003540039062], "page": 1, "span": [0, 374], "__ref_s3_data": null}], "text": "Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar. 2022. DocLayNet: A Large Human-Annotated Dataset for DocumentLayout Analysis. In Proceedings of the 28th ACM SIGKDD Conference on Knowledge Discovery and Data Mining (KDD '22), August 14-18, 2022, Washington, DC, USA. ACM, New York, NY, USA, 9 pages. https://doi.org/10.1145/ 3534678.3539043", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [53.79800033569336, 723.4239501953125, 558.202880859375, 731.6909790039062], "page": 2, "span": [0, 130], "__ref_s3_data": null}], "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar", "type": "page-header", "payload": null, "name": "Page-header", "font": null}, {"prov": [{"bbox": [53.79800033569336, 695.8309936523438, 156.52899169921875, 706.14013671875], "page": 2, "span": [0, 14], "__ref_s3_data": null}], "text": "1 INTRODUCTION", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [53.52899932861328, 563.0528564453125, 303.0169677734375, 681.0164794921875], "page": 2, "span": [0, 702], "__ref_s3_data": null}], "text": "Despite the substantial improvements achieved with machine-learning (ML) approaches and deep neural networks in recent years, document conversion remains a challenging problem, as demonstrated by the numerous public competitions held on this topic [1-4]. The challenge originates from the huge variability in PDF documents regarding layout, language and formats (scanned, programmatic or a combination of both). Engineering a single ML model that can be applied on all types of documents and provides high-quality layout segmentation remains to this day extremely challenging [5]. To highlight the variability in document layouts, we show a few example documents from the DocLayNet dataset in Figure 1.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [53.52899932861328, 289.0808410644531, 295.5641174316406, 560.4684448242188], "page": 2, "span": [0, 1580], "__ref_s3_data": null}], "text": "A key problem in the process of document conversion is to understand the structure of a single document page, i.e. which segments of text should be grouped together in a unit. To train models for this task, there are currently two large datasets available to the community, PubLayNet [6] and DocBank [7]. They were introduced in 2019 and 2020 respectively and significantly accelerated the implementation of layout detection and segmentation models due to their sizes of 300K and 500K ground-truth pages. These sizes were achieved by leveraging an automation approach. The benefit of automated ground-truth generation is obvious: one can generate large ground-truth datasets at virtually no cost. However, the automation introduces a constraint on the variability in the dataset, because corresponding structured source data must be available. PubLayNet and DocBank were both generated from scientific document repositories (PubMed and arXiv), which provide XML or L A T E X sources. Those scientific documents present a limited variability in their layouts, because they are typeset in uniform templates provided by the publishers. Obviously, documents such as technical manuals, annual company reports, legal text, government tenders, etc. have very different and partially unique layouts. As a consequence, the layout predictions obtained from models trained on PubLayNet or DocBank is very reasonable when applied on scientific documents. However, for more artistic or free-style layouts, we see sub-par prediction quality from these models, which we demonstrate in Section 5.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [53.59199905395508, 212.36782836914062, 295.56396484375, 286.4964599609375], "page": 2, "span": [0, 462], "__ref_s3_data": null}], "text": "In this paper, we present the DocLayNet dataset. It provides pageby-page layout annotation ground-truth using bounding-boxes for 11 distinct class labels on 80863 unique document pages, of which a fraction carry double- or triple-annotations. DocLayNet is similar in spirit to PubLayNet and DocBank and will likewise be made available to the public 1 in order to stimulate the document-layout analysis community. It distinguishes itself in the following aspects:", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [64.70800018310547, 177.12582397460938, 295.5616455078125, 207.41844177246094], "page": 2, "span": [0, 149], "__ref_s3_data": null}], "text": "- (1) Human Annotation : In contrast to PubLayNet and DocBank, we relied on human annotation instead of automation approaches to generate the data set.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [64.70800018310547, 155.20883178710938, 294.2625427246094, 174.54144287109375], "page": 2, "span": [0, 109], "__ref_s3_data": null}], "text": "- (2) Large Layout Variability : We include diverse and complex layouts from a large variety of public sources.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [64.70800018310547, 122.33183288574219, 294.6838073730469, 152.62445068359375], "page": 2, "span": [0, 180], "__ref_s3_data": null}], "text": "- (3) Detailed Label Set : We define 11 class labels to distinguish layout features in high detail. PubLayNet provides 5 labels; DocBank provides 13, although not a superset of ours.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [64.70800018310547, 100.41383361816406, 295.56439208984375, 119.7474365234375], "page": 2, "span": [0, 115], "__ref_s3_data": null}], "text": "- (4) Redundant Annotations : A fraction of the pages in the DocLayNet data set carry more than one human annotation.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [53.672000885009766, 83.2601089477539, 216.02749633789062, 89.77363586425781], "page": 2, "span": [0, 60], "__ref_s3_data": null}], "text": "$^{1}$https://developer.ibm.com/exchanges/data/all/doclaynet", "type": "footnote", "payload": null, "name": "Footnote", "font": null}, {"prov": [{"bbox": [342.0950012207031, 685.3028564453125, 558.4320068359375, 704.636474609375], "page": 2, "span": [0, 86], "__ref_s3_data": null}], "text": "This enables experimentation with annotation uncertainty and quality control analysis.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [328.8650207519531, 630.5088500976562, 559.7210083007812, 682.718505859375], "page": 2, "span": [0, 280], "__ref_s3_data": null}], "text": "- (5) Pre-defined Train-, Test- & Validation-set : Like DocBank, we provide fixed train-, test- & validation-sets to ensure proportional representation of the class-labels. Further, we prevent leakage of unique layouts across sets, which has a large effect on model accuracy scores.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [317.62298583984375, 571.8138427734375, 559.1903076171875, 624.0244750976562], "page": 2, "span": [0, 297], "__ref_s3_data": null}], "text": "All aspects outlined above are detailed in Section 3. In Section 4, we will elaborate on how we designed and executed this large-scale human annotation campaign. We will also share key insights and lessons learned that might prove helpful for other parties planning to set up annotation campaigns.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [317.7309875488281, 484.142822265625, 559.5819702148438, 569.2294311523438], "page": 2, "span": [0, 506], "__ref_s3_data": null}], "text": "In Section 5, we will present baseline accuracy numbers for a variety of object detection methods (Faster R-CNN, Mask R-CNN and YOLOv5) trained on DocLayNet. We further show how the model performance is impacted by varying the DocLayNet dataset size, reducing the label set and modifying the train/test-split. Last but not least, we compare the performance of models trained on PubLayNet, DocBank and DocLayNet and demonstrate that a model trained on DocLayNet provides overall more robust layout recovery.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [317.9549865722656, 460.4820251464844, 421.7441101074219, 470.7911071777344], "page": 2, "span": [0, 14], "__ref_s3_data": null}], "text": "2 RELATED WORK", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [317.5249938964844, 327.7038269042969, 559.7161254882812, 445.6674499511719], "page": 2, "span": [0, 655], "__ref_s3_data": null}], "text": "While early approaches in document-layout analysis used rulebased algorithms and heuristics [8], the problem is lately addressed with deep learning methods. The most common approach is to leverage object detection models [9-15]. In the last decade, the accuracy and speed of these models has increased dramatically. Furthermore, most state-of-the-art object detection methods can be trained and applied with very little work, thanks to a standardisation effort of the ground-truth data format [16] and common deep-learning frameworks [17]. Reference data sets such as PubLayNet [6] and DocBank provide their data in the commonly accepted COCO format [16].", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [317.9549865722656, 240.03182983398438, 559.1864624023438, 325.1194763183594], "page": 2, "span": [0, 500], "__ref_s3_data": null}], "text": "Lately, new types of ML models for document-layout analysis have emerged in the community [18-21]. These models do not approach the problem of layout analysis purely based on an image representation of the page, as computer vision methods do. Instead, they combine the text tokens and image representation of a page in order to obtain a segmentation. While the reported accuracies appear to be promising, a broadly accepted data format which links geometric and textual features has yet to establish.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [317.9549865722656, 216.37100219726562, 477.4568786621094, 226.6800994873047], "page": 2, "span": [0, 23], "__ref_s3_data": null}], "text": "3 THE DOCLAYNET DATASET", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [317.9549865722656, 116.46983337402344, 559.7131958007812, 201.5564422607422], "page": 2, "span": [0, 522], "__ref_s3_data": null}], "text": "DocLayNet contains 80863 PDF pages. Among these, 7059 carry two instances of human annotations, and 1591 carry three. This amounts to 91104 total annotation instances. The annotations provide layout information in the shape of labeled, rectangular boundingboxes. We define 11 distinct labels for layout features, namely Caption , Footnote , Formula , List-item , Page-footer , Page-header , Picture , Section-header , Table , Text , and Title . Our reasoning for picking this particular label set is detailed in Section 4.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [317.9549865722656, 83.59282684326172, 558.2041015625, 113.88543701171875], "page": 2, "span": [0, 186], "__ref_s3_data": null}], "text": "In addition to open intellectual property constraints for the source documents, we required that the documents in DocLayNet adhere to a few conditions. Firstly, we kept scanned documents", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [53.79800033569336, 723.4239501953125, 347.0172424316406, 731.6909790039062], "page": 3, "span": [0, 71], "__ref_s3_data": null}], "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis", "type": "page-header", "payload": null, "name": "Page-header", "font": null}, {"prov": [{"bbox": [365.75701904296875, 723.4239501953125, 558.2028198242188, 731.6909790039062], "page": 3, "span": [0, 48], "__ref_s3_data": null}], "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "type": "page-header", "payload": null, "name": "Page-header", "font": null}, {"prov": [{"bbox": [53.79800033569336, 536.4527587890625, 294.0437316894531, 555.885009765625], "page": 3, "span": [0, 69], "__ref_s3_data": null}], "text": "Figure 2: Distribution of DocLayNet pages across document categories.", "type": "caption", "payload": null, "name": "Caption", "font": null}, {"name": "Picture", "type": "figure", "$ref": "#/figures/1"}, {"prov": [{"bbox": [53.79800033569336, 425.1098327636719, 294.2738342285156, 510.19647216796875], "page": 3, "span": [0, 513], "__ref_s3_data": null}], "text": "to a minimum, since they introduce difficulties in annotation (see Section 4). As a second condition, we focussed on medium to large documents ( > 10 pages) with technical content, dense in complex tables, figures, plots and captions. Such documents carry a lot of information value, but are often hard to analyse with high accuracy due to their challenging layouts. Counterexamples of documents not included in the dataset are receipts, invoices, hand-written documents or photographs showing \"text in the wild\".", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [53.57400131225586, 282.6438293457031, 295.5604553222656, 422.52545166015625], "page": 3, "span": [0, 810], "__ref_s3_data": null}], "text": "The pages in DocLayNet can be grouped into six distinct categories, namely Financial Reports , Manuals , Scientific Articles , Laws & Regulations , Patents and Government Tenders . Each document category was sourced from various repositories. For example, Financial Reports contain both free-style format annual reports 2 which expose company-specific, artistic layouts as well as the more formal SEC filings. The two largest categories ( Financial Reports and Manuals ) contain a large amount of free-style layouts in order to obtain maximum variability. In the other four categories, we boosted the variability by mixing documents from independent providers, such as different government websites or publishers. In Figure 2, we show the document categories contained in DocLayNet with their respective sizes.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [53.46699905395508, 184.01382446289062, 295.5615539550781, 280.0594482421875], "page": 3, "span": [0, 535], "__ref_s3_data": null}], "text": "We did not control the document selection with regard to language. The vast majority of documents contained in DocLayNet (close to 95%) are published in English language. However, DocLayNet also contains a number of documents in other languages such as German (2.5%), French (1.0%) and Japanese (1.0%). While the document language has negligible impact on the performance of computer vision methods such as object detection and segmentation models, it might prove challenging for layout analysis methods which exploit textual features.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [53.79800033569336, 107.30182647705078, 295.56396484375, 181.429443359375], "page": 3, "span": [0, 413], "__ref_s3_data": null}], "text": "To ensure that future benchmarks in the document-layout analysis community can be easily compared, we have split up DocLayNet into pre-defined train-, test- and validation-sets. In this way, we can avoid spurious variations in the evaluation scores due to random splitting in train-, test- and validation-sets. We also ensured that less frequent labels are represented in train and test sets in equal proportions.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [53.79800033569336, 83.83010864257812, 195.78997802734375, 90.34363555908203], "page": 3, "span": [0, 51], "__ref_s3_data": null}], "text": "$^{2}$e.g. AAPL from https://www.annualreports.com/", "type": "footnote", "payload": null, "name": "Footnote", "font": null}, {"prov": [{"bbox": [317.62298583984375, 630.5088500976562, 559.1918334960938, 704.636474609375], "page": 3, "span": [0, 435], "__ref_s3_data": null}], "text": "Table 1 shows the overall frequency and distribution of the labels among the different sets. Importantly, we ensure that subsets are only split on full-document boundaries. This avoids that pages of the same document are spread over train, test and validation set, which can give an undesired evaluation advantage to models and lead to overestimation of their prediction accuracy. We will show the impact of this decision in Section 5.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [317.9549865722656, 520.9197998046875, 558.4381103515625, 627.9244384765625], "page": 3, "span": [0, 645], "__ref_s3_data": null}], "text": "In order to accommodate the different types of models currently in use by the community, we provide DocLayNet in an augmented COCO format [16]. This entails the standard COCO ground-truth file (in JSON format) with the associated page images (in PNG format, 1025 \u00d7 1025 pixels). Furthermore, custom fields have been added to each COCO record to specify document category, original document filename and page number. In addition, we also provide the original PDF pages, as well as sidecar files containing parsed PDF text and text-cell coordinates (in JSON). All additional files are linked to the primary page images by their matching filenames.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [316.9419860839844, 203.11082458496094, 559.7215576171875, 518.33544921875], "page": 3, "span": [0, 1854], "__ref_s3_data": null}], "text": "Despite being cost-intense and far less scalable than automation, human annotation has several benefits over automated groundtruth generation. The first and most obvious reason to leverage human annotations is the freedom to annotate any type of document without requiring a programmatic source. For most PDF documents, the original source document is not available. The latter is not a hard constraint with human annotation, but it is for automated methods. A second reason to use human annotations is that the latter usually provide a more natural interpretation of the page layout. The human-interpreted layout can significantly deviate from the programmatic layout used in typesetting. For example, \"invisible\" tables might be used solely for aligning text paragraphs on columns. Such typesetting tricks might be interpreted by automated methods incorrectly as an actual table, while the human annotation will interpret it correctly as Text or other styles. The same applies to multi-line text elements, when authors decided to space them as \"invisible\" list elements without bullet symbols. A third reason to gather ground-truth through human annotation is to estimate a \"natural\" upper bound on the segmentation accuracy. As we will show in Section 4, certain documents featuring complex layouts can have different but equally acceptable layout interpretations. This natural upper bound for segmentation accuracy can be found by annotating the same pages multiple times by different people and evaluating the inter-annotator agreement. Such a baseline consistency evaluation is very useful to define expectations for a good target accuracy in trained deep neural network models and avoid overfitting (see Table 1). On the flip side, achieving high annotation consistency proved to be a key challenge in human annotation, as we outline in Section 4.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [317.9549865722656, 174.8409881591797, 470.2132568359375, 185.15008544921875], "page": 3, "span": [0, 21], "__ref_s3_data": null}], "text": "4 ANNOTATION CAMPAIGN", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [317.6860046386719, 85.8978271484375, 559.7138061523438, 160.0264434814453], "page": 3, "span": [0, 457], "__ref_s3_data": null}], "text": "The annotation campaign was carried out in four phases. In phase one, we identified and prepared the data sources for annotation. In phase two, we determined the class labels and how annotations should be done on the documents in order to obtain maximum consistency. The latter was guided by a detailed requirement analysis and exhaustive experiments. In phase three, we trained the annotation staff and performed exams for quality assurance. In phase four,", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [53.79800033569336, 723.4239501953125, 558.202880859375, 731.6909790039062], "page": 4, "span": [0, 130], "__ref_s3_data": null}], "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar", "type": "page-header", "payload": null, "name": "Page-header", "font": null}, {"prov": [{"bbox": [53.50199890136719, 676.65380859375, 558.4896850585938, 707.0450439453125], "page": 4, "span": [0, 348], "__ref_s3_data": null}], "text": "Table 1: DocLayNet dataset overview. Along with the frequency of each class label, we present the relative occurrence (as % of row \"Total\") in the train, test and validation sets. The inter-annotator agreement is computed as the mAP@0.5-0.95 metric between pairwise annotations from the triple-annotated pages, from which we obtain accuracy ranges.", "type": "caption", "payload": null, "name": "Caption", "font": null}, {"name": "Table", "type": "table", "$ref": "#/tables/0"}, {"prov": [{"bbox": [53.79800033569336, 185.68075561523438, 295.64874267578125, 237.99000549316406], "page": 4, "span": [0, 281], "__ref_s3_data": null}], "text": "Figure 3: Corpus Conversion Service annotation user interface. The PDF page is shown in the background, with overlaid text-cells (in darker shades). The annotation boxes can be drawn by dragging a rectangle over each segment with the respective label from the palette on the right.", "type": "caption", "payload": null, "name": "Caption", "font": null}, {"name": "Picture", "type": "figure", "$ref": "#/figures/2"}, {"prov": [{"bbox": [53.46699905395508, 116.45683288574219, 294.0474548339844, 157.7084503173828], "page": 4, "span": [0, 231], "__ref_s3_data": null}], "text": "we distributed the annotation workload and performed continuous quality controls. Phase one and two required a small team of experts only. For phases three and four, a group of 40 dedicated annotators were assembled and supervised.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [53.79800033569336, 83.57982635498047, 295.5584411621094, 113.989013671875], "page": 4, "span": [0, 193], "__ref_s3_data": null}], "text": "Phase 1: Data selection and preparation. Our inclusion criteria for documents were described in Section 3. A large effort went into ensuring that all documents are free to use. The data sources", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [317.9549865722656, 416.7518310546875, 559.1853637695312, 479.92047119140625], "page": 4, "span": [0, 376], "__ref_s3_data": null}], "text": "include publication repositories such as arXiv$^{3}$, government offices, company websites as well as data directory services for financial reports and patents. Scanned documents were excluded wherever possible because they can be rotated or skewed. This would not allow us to perform annotation with rectangular bounding-boxes and therefore complicate the annotation process.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [317.9549865722656, 285.2448425292969, 559.7130737304688, 414.1674499511719], "page": 4, "span": [0, 746], "__ref_s3_data": null}], "text": "Preparation work included uploading and parsing the sourced PDF documents in the Corpus Conversion Service (CCS) [22], a cloud-native platform which provides a visual annotation interface and allows for dataset inspection and analysis. The annotation interface of CCS is shown in Figure 3. The desired balance of pages between the different document categories was achieved by selective subsampling of pages with certain desired properties. For example, we made sure to include the title page of each document and bias the remaining page selection to those with figures or tables. The latter was achieved by leveraging pre-trained object detection models from PubLayNet, which helped us estimate how many figures and tables a given page contains.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [317.62298583984375, 98.9438247680664, 559.7176513671875, 282.7770080566406], "page": 4, "span": [0, 1159], "__ref_s3_data": null}], "text": "Phase 2: Label selection and guideline. We reviewed the collected documents and identified the most common structural features they exhibit. This was achieved by identifying recurrent layout elements and lead us to the definition of 11 distinct class labels. These 11 class labels are Caption , Footnote , Formula , List-item , Pagefooter , Page-header , Picture , Section-header , Table , Text , and Title . Critical factors that were considered for the choice of these class labels were (1) the overall occurrence of the label, (2) the specificity of the label, (3) recognisability on a single page (i.e. no need for context from previous or next page) and (4) overall coverage of the page. Specificity ensures that the choice of label is not ambiguous, while coverage ensures that all meaningful items on a page can be annotated. We refrained from class labels that are very specific to a document category, such as Abstract in the Scientific Articles category. We also avoided class labels that are tightly linked to the semantics of the text. Labels such as Author and Affiliation , as seen in DocBank, are often only distinguishable by discriminating on", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [317.9549865722656, 83.13311004638672, 369.2456970214844, 89.64663696289062], "page": 4, "span": [0, 24], "__ref_s3_data": null}], "text": "$^{3}$https://arxiv.org/", "type": "footnote", "payload": null, "name": "Footnote", "font": null}, {"prov": [{"bbox": [53.79800033569336, 723.4239501953125, 347.0172424316406, 731.6909790039062], "page": 5, "span": [0, 71], "__ref_s3_data": null}], "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis", "type": "page-header", "payload": null, "name": "Page-header", "font": null}, {"prov": [{"bbox": [365.75701904296875, 723.4239501953125, 558.2028198242188, 731.6909790039062], "page": 5, "span": [0, 48], "__ref_s3_data": null}], "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "type": "page-header", "payload": null, "name": "Page-header", "font": null}, {"prov": [{"bbox": [53.79800033569336, 685.2938842773438, 294.04541015625, 704.636474609375], "page": 5, "span": [0, 135], "__ref_s3_data": null}], "text": "the textual content of an element, which goes beyond visual layout recognition, in particular outside the Scientific Articles category.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [53.79800033569336, 542.8378295898438, 295.5592346191406, 682.7184448242188], "page": 5, "span": [0, 812], "__ref_s3_data": null}], "text": "At first sight, the task of visual document-layout interpretation appears intuitive enough to obtain plausible annotations in most cases. However, during early trial-runs in the core team, we observed many cases in which annotators use different annotation styles, especially for documents with challenging layouts. For example, if a figure is presented with subfigures, one annotator might draw a single figure bounding-box, while another might annotate each subfigure separately. The same applies for lists, where one might annotate all list items in one block or each list item separately. In essence, we observed that challenging layouts would be annotated in different but plausible ways. To illustrate this, we show in Figure 4 multiple examples of plausible but inconsistent annotations on the same pages.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [53.79800033569336, 455.16583251953125, 295.56005859375, 540.2534790039062], "page": 5, "span": [0, 465], "__ref_s3_data": null}], "text": "Obviously, this inconsistency in annotations is not desirable for datasets which are intended to be used for model training. To minimise these inconsistencies, we created a detailed annotation guideline. While perfect consistency across 40 annotation staff members is clearly not possible to achieve, we saw a huge improvement in annotation consistency after the introduction of our annotation guideline. A few selected, non-trivial highlights of the guideline are:", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [64.70800018310547, 402.22686767578125, 294.04620361328125, 443.4874572753906], "page": 5, "span": [0, 202], "__ref_s3_data": null}], "text": "- (1) Every list-item is an individual object instance with class label List-item . This definition is different from PubLayNet and DocBank, where all list-items are grouped together into one List object.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [64.70799255371094, 358.39984130859375, 295.563720703125, 399.6514892578125], "page": 5, "span": [0, 208], "__ref_s3_data": null}], "text": "- (2) A List-item is a paragraph with hanging indentation. Singleline elements can qualify as List-item if the neighbour elements expose hanging indentation. Bullet or enumeration symbols are not a requirement.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [64.70800018310547, 336.4728698730469, 294.0472412109375, 355.81549072265625], "page": 5, "span": [0, 82], "__ref_s3_data": null}], "text": "- (3) For every Caption , there must be exactly one corresponding Picture or Table .", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [64.70800018310547, 314.5648193359375, 294.0459899902344, 333.8984680175781], "page": 5, "span": [0, 70], "__ref_s3_data": null}], "text": "- (4) Connected sub-pictures are grouped together in one Picture object.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [64.70800018310547, 303.59686279296875, 264.5057067871094, 311.98046875], "page": 5, "span": [0, 53], "__ref_s3_data": null}], "text": "- (5) Formula numbers are included in a Formula object.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [64.7080078125, 270.72882080078125, 294.0461730957031, 301.021484375], "page": 5, "span": [0, 160], "__ref_s3_data": null}], "text": "- (6) Emphasised text (e.g. in italic or bold) at the beginning of a paragraph is not considered a Section-header , unless it appears exclusively on its own line.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [53.52899932861328, 217.798828125, 295.5625305175781, 259.0494689941406], "page": 5, "span": [0, 221], "__ref_s3_data": null}], "text": "The complete annotation guideline is over 100 pages long and a detailed description is obviously out of scope for this paper. Nevertheless, it will be made publicly available alongside with DocLayNet for future reference.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [53.79800033569336, 86.29182434082031, 295.562255859375, 215.3310089111328], "page": 5, "span": [0, 792], "__ref_s3_data": null}], "text": "Phase 3: Training. After a first trial with a small group of people, we realised that providing the annotation guideline and a set of random practice pages did not yield the desired quality level for layout annotation. Therefore we prepared a subset of pages with two different complexity levels, each with a practice and an exam part. 974 pages were reference-annotated by one proficient core team member. Annotation staff were then given the task to annotate the same subsets (blinded from the reference). By comparing the annotations of each staff member with the reference annotations, we could quantify how closely their annotations matched the reference. Only after passing two exam levels with high annotation quality, staff were admitted into the production phase. Practice iterations", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [317.9549865722656, 288.11480712890625, 559.8057861328125, 318.5060119628906], "page": 5, "span": [0, 173], "__ref_s3_data": null}], "text": "Figure 4: Examples of plausible annotation alternatives for the same page. Criteria in our annotation guideline can resolve cases A to C, while the case D remains ambiguous.", "type": "caption", "payload": null, "name": "Caption", "font": null}, {"name": "Picture", "type": "figure", "$ref": "#/figures/3"}, {"prov": [{"bbox": [400.12841796875, 331.43994140625, 476.331787109375, 333.5567321777344], "page": 5, "span": [0, 64], "__ref_s3_data": null}], "text": "05237a14f2524e3f53c8454b074409d05078038a6a36b770fcc8ec7e540deae0", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [317.62298583984375, 247.1688232421875, 558.204345703125, 266.5024719238281], "page": 5, "span": [0, 123], "__ref_s3_data": null}], "text": "were carried out over a timeframe of 12 weeks, after which 8 of the 40 initially allocated annotators did not pass the bar.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [317.62298583984375, 82.78482818603516, 559.7149047851562, 244.7010040283203], "page": 5, "span": [0, 987], "__ref_s3_data": null}], "text": "Phase 4: Production annotation. The previously selected 80K pages were annotated with the defined 11 class labels by 32 annotators. This production phase took around three months to complete. All annotations were created online through CCS, which visualises the programmatic PDF text-cells as an overlay on the page. The page annotation are obtained by drawing rectangular bounding-boxes, as shown in Figure 3. With regard to the annotation practices, we implemented a few constraints and capabilities on the tooling level. First, we only allow non-overlapping, vertically oriented, rectangular boxes. For the large majority of documents, this constraint was sufficient and it speeds up the annotation considerably in comparison with arbitrary segmentation shapes. Second, annotator staff were not able to see each other's annotations. This was enforced by design to avoid any bias in the annotation, which could skew the numbers of the inter-annotator agreement (see Table 1). We wanted", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [53.79800033569336, 723.4239501953125, 558.202880859375, 731.6909790039062], "page": 6, "span": [0, 130], "__ref_s3_data": null}], "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar", "type": "page-header", "payload": null, "name": "Page-header", "font": null}, {"prov": [{"bbox": [53.50199890136719, 608.98291015625, 295.64874267578125, 705.1270751953125], "page": 6, "span": [0, 489], "__ref_s3_data": null}], "text": "Table 2: Prediction performance (mAP@0.5-0.95) of object detection networks on DocLayNet test set. The MRCNN (Mask R-CNN) and FRCNN (Faster R-CNN) models with ResNet-50 or ResNet-101 backbone were trained based on the network architectures from the detectron2 model zoo (Mask R-CNN R50, R101-FPN 3x, Faster R-CNN R101-FPN 3x), with default configurations. The YOLO implementation utilized was YOLOv5x6 [13]. All models were initialised using pre-trained weights from the COCO 2017 dataset.", "type": "caption", "payload": null, "name": "Caption", "font": null}, {"name": "Table", "type": "table", "$ref": "#/tables/1"}, {"prov": [{"bbox": [53.52899932861328, 215.43682861328125, 295.5561218261719, 421.07244873046875], "page": 6, "span": [0, 1252], "__ref_s3_data": null}], "text": "to avoid this at any cost in order to have clear, unbiased baseline numbers for human document-layout annotation. Third, we introduced the feature of snapping boxes around text segments to obtain a pixel-accurate annotation and again reduce time and effort. The CCS annotation tool automatically shrinks every user-drawn box to the minimum bounding-box around the enclosed text-cells for all purely text-based segments, which excludes only Table and Picture . For the latter, we instructed annotation staff to minimise inclusion of surrounding whitespace while including all graphical lines. A downside of snapping boxes to enclosed text cells is that some wrongly parsed PDF pages cannot be annotated correctly and need to be skipped. Fourth, we established a way to flag pages as rejected for cases where no valid annotation according to the label guidelines could be achieved. Example cases for this would be PDF pages that render incorrectly or contain layouts that are impossible to capture with non-overlapping rectangles. Such rejected pages are not contained in the final dataset. With all these measures in place, experienced annotation staff managed to annotate a single page in a typical timeframe of 20s to 60s, depending on its complexity.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [53.79800033569336, 193.5609893798828, 147.4853515625, 203.87008666992188], "page": 6, "span": [0, 13], "__ref_s3_data": null}], "text": "5 EXPERIMENTS", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [53.48400115966797, 82.7008285522461, 295.4281005859375, 178.74644470214844], "page": 6, "span": [0, 584], "__ref_s3_data": null}], "text": "The primary goal of DocLayNet is to obtain high-quality ML models capable of accurate document-layout analysis on a wide variety of challenging layouts. As discussed in Section 2, object detection models are currently the easiest to use, due to the standardisation of ground-truth data in COCO format [16] and the availability of general frameworks such as detectron2 [17]. Furthermore, baseline numbers in PubLayNet and DocBank were obtained using standard object detection models such as Mask R-CNN and Faster R-CNN. As such, we will relate to these object detection methods in this", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [317.9549865722656, 449.7158203125, 559.8057861328125, 512.9840087890625], "page": 6, "span": [0, 329], "__ref_s3_data": null}], "text": "Figure 5: Prediction performance (mAP@0.5-0.95) of a Mask R-CNN network with ResNet50 backbone trained on increasing fractions of the DocLayNet dataset. The learning curve flattens around the 80% mark, indicating that increasing the size of the DocLayNet dataset with similar data will not yield significantly better predictions.", "type": "caption", "payload": null, "name": "Caption", "font": null}, {"name": "Picture", "type": "figure", "$ref": "#/figures/4"}, {"prov": [{"bbox": [317.9549865722656, 388.6548156738281, 558.2041625976562, 407.98846435546875], "page": 6, "span": [0, 102], "__ref_s3_data": null}], "text": "paper and leave the detailed evaluation of more recent methods mentioned in Section 2 for future work.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [317.6409912109375, 311.9428405761719, 558.4364013671875, 386.0704650878906], "page": 6, "span": [0, 397], "__ref_s3_data": null}], "text": "In this section, we will present several aspects related to the performance of object detection models on DocLayNet. Similarly as in PubLayNet, we will evaluate the quality of their predictions using mean average precision (mAP) with 10 overlaps that range from 0.5 to 0.95 in steps of 0.05 (mAP@0.5-0.95). These scores are computed by leveraging the evaluation code provided by the COCO API [16].", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [317.9549865722656, 284.8690185546875, 466.8532409667969, 295.1781005859375], "page": 6, "span": [0, 30], "__ref_s3_data": null}], "text": "Baselines for Object Detection", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [317.7489929199219, 85.2998275756836, 558.4308471679688, 279.9754638671875], "page": 6, "span": [0, 1146], "__ref_s3_data": null}], "text": "In Table 2, we present baseline experiments (given in mAP) on Mask R-CNN [12], Faster R-CNN [11], and YOLOv5 [13]. Both training and evaluation were performed on RGB images with dimensions of 1025 \u00d7 1025 pixels. For training, we only used one annotation in case of redundantly annotated pages. As one can observe, the variation in mAP between the models is rather low, but overall between 6 and 10% lower than the mAP computed from the pairwise human annotations on triple-annotated pages. This gives a good indication that the DocLayNet dataset poses a worthwhile challenge for the research community to close the gap between human recognition and ML approaches. It is interesting to see that Mask R-CNN and Faster R-CNN produce very comparable mAP scores, indicating that pixel-based image segmentation derived from bounding-boxes does not help to obtain better predictions. On the other hand, the more recent Yolov5x model does very well and even out-performs humans on selected labels such as Text , Table and Picture . This is not entirely surprising, as Text , Table and Picture are abundant and the most visually distinctive in a document.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [53.79800033569336, 723.4239501953125, 347.0172424316406, 731.6909790039062], "page": 7, "span": [0, 71], "__ref_s3_data": null}], "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis", "type": "page-header", "payload": null, "name": "Page-header", "font": null}, {"prov": [{"bbox": [365.75701904296875, 723.4239501953125, 558.2028198242188, 731.6909790039062], "page": 7, "span": [0, 48], "__ref_s3_data": null}], "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "type": "page-header", "payload": null, "name": "Page-header", "font": null}, {"prov": [{"bbox": [53.50199890136719, 663.77685546875, 295.6486511230469, 705.1270751953125], "page": 7, "span": [0, 205], "__ref_s3_data": null}], "text": "Table 3: Performance of a Mask R-CNN R50 network in mAP@0.5-0.95 scores trained on DocLayNet with different class label sets. The reduced label sets were obtained by either down-mapping or dropping labels.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [317.65899658203125, 663.7767944335938, 559.8068237304688, 705.1270141601562], "page": 7, "span": [0, 189], "__ref_s3_data": null}], "text": "Table 4: Performance of a Mask R-CNN R50 network with document-wise and page-wise split for different label sets. Naive page-wise split will result in GLYPH<tildelow> 10% point improvement.", "type": "caption", "payload": null, "name": "Caption", "font": null}, {"name": "Table", "type": "table", "$ref": "#/tables/2"}, {"prov": [{"bbox": [53.79800033569336, 462.1210021972656, 131.05624389648438, 472.4300842285156], "page": 7, "span": [0, 14], "__ref_s3_data": null}], "text": "Learning Curve", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [52.78499984741211, 262.55181884765625, 295.558349609375, 457.22845458984375], "page": 7, "span": [0, 1157], "__ref_s3_data": null}], "text": "One of the fundamental questions related to any dataset is if it is \"large enough\". To answer this question for DocLayNet, we performed a data ablation study in which we evaluated a Mask R-CNN model trained on increasing fractions of the DocLayNet dataset. As can be seen in Figure 5, the mAP score rises sharply in the beginning and eventually levels out. To estimate the error-bar on the metrics, we ran the training five times on the entire data-set. This resulted in a 1% error-bar, depicted by the shaded area in Figure 5. In the inset of Figure 5, we show the exact same data-points, but with a logarithmic scale on the x-axis. As is expected, the mAP score increases linearly as a function of the data-size in the inset. The curve ultimately flattens out between the 80% and 100% mark, with the 80% mark falling within the error-bars of the 100% mark. This provides a good indication that the model would not improve significantly by yet increasing the data size. Rather, it would probably benefit more from improved data consistency (as discussed in Section 3), data augmentation methods [23], or the addition of more document categories and styles.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [53.79800033569336, 239.1809844970703, 164.3289794921875, 249.49008178710938], "page": 7, "span": [0, 22], "__ref_s3_data": null}], "text": "Impact of Class Labels", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [53.46699905395508, 83.44783020019531, 295.5567932128906, 234.2884521484375], "page": 7, "span": [0, 910], "__ref_s3_data": null}], "text": "The choice and number of labels can have a significant effect on the overall model performance. Since PubLayNet, DocBank and DocLayNet all have different label sets, it is of particular interest to understand and quantify this influence of the label set on the model performance. We investigate this by either down-mapping labels into more common ones (e.g. Caption \u2192 Text ) or excluding them from the annotations entirely. Furthermore, it must be stressed that all mappings and exclusions were performed on the data before model training. In Table 3, we present the mAP scores for a Mask R-CNN R50 network on different label sets. Where a label is down-mapped, we show its corresponding label, otherwise it was excluded. We present three different label sets, with 6, 5 and 4 different labels respectively. The set of 5 labels contains the same labels as PubLayNet. However, due to the different definition of", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"name": "Table", "type": "table", "$ref": "#/tables/3"}, {"prov": [{"bbox": [317.6860046386719, 375.50982666015625, 559.5849609375, 460.5964660644531], "page": 7, "span": [0, 469], "__ref_s3_data": null}], "text": "lists in PubLayNet (grouped list-items) versus DocLayNet (separate list-items), the label set of size 4 is the closest to PubLayNet, in the assumption that the List is down-mapped to Text in PubLayNet. The results in Table 3 show that the prediction accuracy on the remaining class labels does not change significantly when other classes are merged into them. The overall macro-average improves by around 5%, in particular when Page-footer and Page-header are excluded.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [317.9549560546875, 352.2960205078125, 549.860595703125, 362.6051025390625], "page": 7, "span": [0, 46], "__ref_s3_data": null}], "text": "Impact of Document Split in Train and Test Set", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [317.62298583984375, 196.5628204345703, 559.7138061523438, 347.4034729003906], "page": 7, "span": [0, 852], "__ref_s3_data": null}], "text": "Many documents in DocLayNet have a unique styling. In order to avoid overfitting on a particular style, we have split the train-, test- and validation-sets of DocLayNet on document boundaries, i.e. every document contributes pages to only one set. To the best of our knowledge, this was not considered in PubLayNet or DocBank. To quantify how this affects model performance, we trained and evaluated a Mask R-CNN R50 model on a modified dataset version. Here, the train-, test- and validation-sets were obtained by a randomised draw over the individual pages. As can be seen in Table 4, the difference in model performance is surprisingly large: pagewise splitting gains \u02dc 10% in mAP over the document-wise splitting. Thus, random page-wise splitting of DocLayNet can easily lead to accidental overestimation of model performance and should be avoided.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [317.9549865722656, 173.34898376464844, 418.5477600097656, 183.6580810546875], "page": 7, "span": [0, 18], "__ref_s3_data": null}], "text": "Dataset Comparison", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [317.6860046386719, 83.35986328125, 559.1881713867188, 168.45645141601562], "page": 7, "span": [0, 521], "__ref_s3_data": null}], "text": "Throughout this paper, we claim that DocLayNet's wider variety of document layouts leads to more robust layout detection models. In Table 5, we provide evidence for that. We trained models on each of the available datasets (PubLayNet, DocBank and DocLayNet) and evaluated them on the test sets of the other datasets. Due to the different label sets and annotation styles, a direct comparison is not possible. Hence, we focussed on the common labels among the datasets. Between PubLayNet and DocLayNet, these are Picture ,", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [53.79800033569336, 723.4239501953125, 558.202880859375, 731.6909790039062], "page": 8, "span": [0, 130], "__ref_s3_data": null}], "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar", "type": "page-header", "payload": null, "name": "Page-header", "font": null}, {"prov": [{"bbox": [53.50199890136719, 641.85888671875, 295.648681640625, 705.1270751953125], "page": 8, "span": [0, 298], "__ref_s3_data": null}], "text": "Table 5: Prediction Performance (mAP@0.5-0.95) of a Mask R-CNN R50 network across the PubLayNet, DocBank & DocLayNet data-sets. By evaluating on common label classes of each dataset, we observe that the DocLayNet-trained model has much less pronounced variations in performance across all datasets.", "type": "caption", "payload": null, "name": "Caption", "font": null}, {"name": "Table", "type": "table", "$ref": "#/tables/4"}, {"prov": [{"bbox": [53.79800033569336, 348.85986328125, 294.047119140625, 401.0794677734375], "page": 8, "span": [0, 295], "__ref_s3_data": null}], "text": "Section-header , Table and Text . Before training, we either mapped or excluded DocLayNet's other labels as specified in table 3, and also PubLayNet's List to Text . Note that the different clustering of lists (by list-element vs. whole list objects) naturally decreases the mAP score for Text .", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [53.46699905395508, 206.40382385253906, 295.55908203125, 346.28546142578125], "page": 8, "span": [0, 793], "__ref_s3_data": null}], "text": "For comparison of DocBank with DocLayNet, we trained only on Picture and Table clusters of each dataset. We had to exclude Text because successive paragraphs are often grouped together into a single object in DocBank. This paragraph grouping is incompatible with the individual paragraphs of DocLayNet. As can be seen in Table 5, DocLayNet trained models yield better performance compared to the previous datasets. It is noteworthy that the models trained on PubLayNet and DocBank perform very well on their own test set, but have a much lower performance on the foreign datasets. While this also applies to DocLayNet, the difference is far less pronounced. Thus we conclude that DocLayNet trained models are overall more robust and will produce better results for challenging, unseen layouts.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [53.79800033569336, 176.62998962402344, 156.00534057617188, 186.9390869140625], "page": 8, "span": [0, 19], "__ref_s3_data": null}], "text": "Example Predictions", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [53.52899932861328, 86.64982604980469, 295.5584411621094, 171.7364501953125], "page": 8, "span": [0, 481], "__ref_s3_data": null}], "text": "To conclude this section, we illustrate the quality of layout predictions one can expect from DocLayNet-trained models by providing a selection of examples without any further post-processing applied. Figure 6 shows selected layout predictions on pages from the test-set of DocLayNet. Results look decent in general across document categories, however one can also observe mistakes such as overlapping clusters of different classes, or entirely missing boxes due to low confidence.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [317.95501708984375, 695.8309936523438, 405.7296142578125, 706.14013671875], "page": 8, "span": [0, 12], "__ref_s3_data": null}], "text": "6 CONCLUSION", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [317.9549865722656, 605.850830078125, 559.7137451171875, 690.9384765625], "page": 8, "span": [0, 507], "__ref_s3_data": null}], "text": "In this paper, we presented the DocLayNet dataset. It provides the document conversion and layout analysis research community a new and challenging dataset to improve and fine-tune novel ML methods on. In contrast to many other datasets, DocLayNet was created by human annotation in order to obtain reliable layout ground-truth on a wide variety of publication- and typesettingstyles. Including a large proportion of documents outside the scientific publishing domain adds significant value in this respect.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [317.6860046386719, 507.2208251953125, 559.717041015625, 603.2664794921875], "page": 8, "span": [0, 573], "__ref_s3_data": null}], "text": "From the dataset, we have derived on the one hand reference metrics for human performance on document-layout annotation (through double and triple annotations) and on the other hand evaluated the baseline performance of commonly used object detection methods. We also illustrated the impact of various dataset-related aspects on model performance through data-ablation experiments, both from a size and class-label perspective. Last but not least, we compared the accuracy of models trained on other public datasets and showed that DocLayNet trained models are more robust.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [317.62298583984375, 474.3438415527344, 558.4346923828125, 504.636474609375], "page": 8, "span": [0, 188], "__ref_s3_data": null}], "text": "To date, there is still a significant gap between human and ML accuracy on the layout interpretation task, and we hope that this work will inspire the research community to close that gap.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [317.9549865722656, 446.5990295410156, 387.3695983886719, 456.9081115722656], "page": 8, "span": [0, 10], "__ref_s3_data": null}], "text": "REFERENCES", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [321.197998046875, 420.8371276855469, 558.2009887695312, 443.29766845703125], "page": 8, "span": [0, 191], "__ref_s3_data": null}], "text": "- [1] Max G\u00f6bel, Tamir Hassan, Ermelinda Oro, and Giorgio Orsi. Icdar 2013 table competition. In 2013 12th International Conference on Document Analysis and Recognition , pages 1449-1453, 2013.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [321.197998046875, 388.9571228027344, 559.3798217773438, 419.38763427734375], "page": 8, "span": [0, 279], "__ref_s3_data": null}], "text": "- [2] Christian Clausner, Apostolos Antonacopoulos, and Stefan Pletschacher. Icdar2017 competition on recognition of documents with complex layouts rdcl2017. In 2017 14th IAPR International Conference on Document Analysis and Recognition (ICDAR) , volume 01, pages 1404-1410, 2017.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [321.197998046875, 365.0531005859375, 558.2001342773438, 387.50762939453125], "page": 8, "span": [0, 213], "__ref_s3_data": null}], "text": "- [3] Herv\u00e9 D\u00e9jean, Jean-Luc Meunier, Liangcai Gao, Yilun Huang, Yu Fang, Florian Kleber, and Eva-Maria Lang. ICDAR 2019 Competition on Table Detection and Recognition (cTDaR), April 2019. http://sac.founderit.com/.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [321.197998046875, 333.173095703125, 559.3787231445312, 363.5966491699219], "page": 8, "span": [0, 251], "__ref_s3_data": null}], "text": "- [4] Antonio Jimeno Yepes, Peter Zhong, and Douglas Burdick. Competition on scientific literature parsing. In Proceedings of the International Conference on Document Analysis and Recognition , ICDAR, pages 605-617. LNCS 12824, SpringerVerlag, sep 2021.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [321.197998046875, 301.2920837402344, 559.0262451171875, 331.7166442871094], "page": 8, "span": [0, 261], "__ref_s3_data": null}], "text": "- [5] Logan Markewich, Hao Zhang, Yubin Xing, Navid Lambert-Shirzad, Jiang Zhexin, Roy Lee, Zhi Li, and Seok-Bum Ko. Segmentation for document layout analysis: not dead yet. International Journal on Document Analysis and Recognition (IJDAR) , pages 1-11, 01 2022.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [321.197998046875, 277.3751220703125, 558.20361328125, 299.83563232421875], "page": 8, "span": [0, 235], "__ref_s3_data": null}], "text": "- [6] Xu Zhong, Jianbin Tang, and Antonio Jimeno-Yepes. Publaynet: Largest dataset ever for document layout analysis. In Proceedings of the International Conference on Document Analysis and Recognition , ICDAR, pages 1015-1022, sep 2019.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [321.1979675292969, 237.53111267089844, 558.9714965820312, 275.9256286621094], "page": 8, "span": [0, 316], "__ref_s3_data": null}], "text": "- [7] Minghao Li, Yiheng Xu, Lei Cui, Shaohan Huang, Furu Wei, Zhoujun Li, and Ming Zhou. Docbank: A benchmark dataset for document layout analysis. In Proceedings of the 28th International Conference on Computational Linguistics , COLING, pages 949-960. International Committee on Computational Linguistics, dec 2020.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [321.197998046875, 213.6141357421875, 558.9022216796875, 236.07464599609375], "page": 8, "span": [0, 172], "__ref_s3_data": null}], "text": "- [8] Riaz Ahmad, Muhammad Tanvir Afzal, and M. Qadir. Information extraction from pdf sources based on rule-based system using integrated formats. In SemWebEval@ESWC , 2016.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [321.197998046875, 181.74110412597656, 559.2744750976562, 212.16464233398438], "page": 8, "span": [0, 271], "__ref_s3_data": null}], "text": "- [9] Ross B. Girshick, Jeff Donahue, Trevor Darrell, and Jitendra Malik. Rich feature hierarchies for accurate object detection and semantic segmentation. In IEEE Conference on Computer Vision and Pattern Recognition , CVPR, pages 580-587. IEEE Computer Society, jun 2014.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [317.9549865722656, 165.7931365966797, 558.2020263671875, 180.28463745117188], "page": 8, "span": [0, 149], "__ref_s3_data": null}], "text": "- [10] Ross B. Girshick. Fast R-CNN. In 2015 IEEE International Conference on Computer Vision , ICCV, pages 1440-1448. IEEE Computer Society, dec 2015.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [317.9549865722656, 141.8831329345703, 558.201416015625, 164.3436279296875], "page": 8, "span": [0, 227], "__ref_s3_data": null}], "text": "- [11] Shaoqing Ren, Kaiming He, Ross Girshick, and Jian Sun. Faster r-cnn: Towards real-time object detection with region proposal networks. IEEE Transactions on Pattern Analysis and Machine Intelligence , 39(6):1137-1149, 2017.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [317.9549865722656, 117.98011016845703, 559.278076171875, 140.43362426757812], "page": 8, "span": [0, 192], "__ref_s3_data": null}], "text": "- [12] Kaiming He, Georgia Gkioxari, Piotr Doll\u00e1r, and Ross B. Girshick. Mask R-CNN. In IEEE International Conference on Computer Vision , ICCV, pages 2980-2988. IEEE Computer Society, Oct 2017.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [317.9549865722656, 86.09910583496094, 558.9715576171875, 116.52364349365234], "page": 8, "span": [0, 305], "__ref_s3_data": null}], "text": "- [13] Glenn Jocher, Alex Stoken, Ayush Chaurasia, Jirka Borovec, NanoCode012, TaoXie, Yonghye Kwon, Kalen Michael, Liu Changyu, Jiacong Fang, Abhiram V, Laughing, tkianai, yxNONG, Piotr Skalski, Adam Hogan, Jebastin Nadar, imyhxy, Lorenzo Mammana, Alex Wang, Cristi Fati, Diego Montes, Jan Hajek, Laurentiu", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [53.79800033569336, 723.4239501953125, 347.0172424316406, 731.6909790039062], "page": 9, "span": [0, 71], "__ref_s3_data": null}], "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis", "type": "page-header", "payload": null, "name": "Page-header", "font": null}, {"prov": [{"bbox": [365.75701904296875, 723.4239501953125, 558.2028198242188, 731.6909790039062], "page": 9, "span": [0, 48], "__ref_s3_data": null}], "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "type": "page-header", "payload": null, "name": "Page-header", "font": null}, {"prov": [{"bbox": [62.323875427246094, 343.73516845703125, 318.5047302246094, 349.7145690917969], "page": 9, "span": [0, 89], "__ref_s3_data": null}], "text": "Text Caption List-Item Formula Table Section-Header Picture Page-Header Page-Footer Title", "type": "caption", "payload": null, "name": "Caption", "font": null}, {"name": "Picture", "type": "figure", "$ref": "#/figures/5"}, {"prov": [{"bbox": [53.79800033569336, 286.16876220703125, 559.807861328125, 327.51800537109375], "page": 9, "span": [0, 386], "__ref_s3_data": null}], "text": "Figure 6: Example layout predictions on selected pages from the DocLayNet test-set. (A, D) exhibit favourable results on coloured backgrounds. (B, C) show accurate list-item and paragraph differentiation despite densely-spaced lines. (E) demonstrates good table and figure distinction. (F) shows predictions on a Chinese patent with multiple overlaps, label confusion and missing boxes.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [69.23400115966797, 242.4801025390625, 295.22406005859375, 264.93365478515625], "page": 9, "span": [0, 195], "__ref_s3_data": null}], "text": "Diaconu, Mai Thanh Minh, Marc, albinxavi, fatih, oleg, and wanghao yang. ultralytics/yolov5: v6.0 - yolov5n nano models, roboflow integration, tensorflow export, opencv dnn support, October 2021.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [53.79800033569336, 218.56314086914062, 295.12176513671875, 241.02362060546875], "page": 9, "span": [0, 190], "__ref_s3_data": null}], "text": "- [14] Nicolas Carion, Francisco Massa, Gabriel Synnaeve, Nicolas Usunier, Alexander Kirillov, and Sergey Zagoruyko. End-to-end object detection with transformers. CoRR , abs/2005.12872, 2020.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [53.79800033569336, 202.62213134765625, 294.042236328125, 217.1136474609375], "page": 9, "span": [0, 132], "__ref_s3_data": null}], "text": "- [15] Mingxing Tan, Ruoming Pang, and Quoc V. Le. Efficientdet: Scalable and efficient object detection. CoRR , abs/1911.09070, 2019.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [53.798004150390625, 178.71910095214844, 295.2226257324219, 201.17263793945312], "page": 9, "span": [0, 219], "__ref_s3_data": null}], "text": "- [16] Tsung-Yi Lin, Michael Maire, Serge J. Belongie, Lubomir D. Bourdev, Ross B. Girshick, James Hays, Pietro Perona, Deva Ramanan, Piotr Doll\u00e1r, and C. Lawrence Zitnick. Microsoft COCO: common objects in context, 2014.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [53.79800033569336, 162.77911376953125, 295.1200866699219, 177.26263427734375], "page": 9, "span": [0, 100], "__ref_s3_data": null}], "text": "- [17] Yuxin Wu, Alexander Kirillov, Francisco Massa, Wan-Yen Lo, and Ross Girshick. Detectron2, 2019.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [53.79800033569336, 122.92810821533203, 294.80889892578125, 161.3226318359375], "page": 9, "span": [0, 339], "__ref_s3_data": null}], "text": "- [18] Nikolaos Livathinos, Cesar Berrospi, Maksym Lysak, Viktor Kuropiatnyk, Ahmed Nassar, Andre Carvalho, Michele Dolfi, Christoph Auer, Kasper Dinkla, and Peter W. J. Staar. Robust pdf document conversion using recurrent neural networks. In Proceedings of the 35th Conference on Artificial Intelligence , AAAI, pages 1513715145, feb 2021.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [53.797996520996094, 83.07810974121094, 295.22174072265625, 121.47162628173828], "page": 9, "span": [0, 336], "__ref_s3_data": null}], "text": "- [19] Yiheng Xu, Minghao Li, Lei Cui, Shaohan Huang, Furu Wei, and Ming Zhou. Layoutlm: Pre-training of text and layout for document image understanding. In Proceedings of the 26th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining , KDD, pages 1192-1200, New York, USA, 2020. Association for Computing Machinery.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [317.9549865722656, 250.45010375976562, 559.0263671875, 264.9336242675781], "page": 9, "span": [0, 153], "__ref_s3_data": null}], "text": "- [20] Shoubin Li, Xuyan Ma, Shuaiqun Pan, Jun Hu, Lin Shi, and Qing Wang. Vtlayout: Fusion of visual and text features for document layout analysis, 2021.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [317.9549865722656, 226.54010009765625, 558.9714965820312, 248.99362182617188], "page": 9, "span": [0, 188], "__ref_s3_data": null}], "text": "- [21] Peng Zhang, Can Li, Liang Qiao, Zhanzhan Cheng, Shiliang Pu, Yi Niu, and Fei Wu. Vsr: A unified framework for document layout analysis combining vision, semantics and relations, 2021.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [317.9549865722656, 194.65213012695312, 559.275390625, 225.08364868164062], "page": 9, "span": [0, 290], "__ref_s3_data": null}], "text": "- [22] Peter W J Staar, Michele Dolfi, Christoph Auer, and Costas Bekas. Corpus conversion service: A machine learning platform to ingest documents at scale. In Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining , KDD, pages 774-782. ACM, 2018.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [317.9549865722656, 178.71212768554688, 559.3782958984375, 193.20263671875], "page": 9, "span": [0, 138], "__ref_s3_data": null}], "text": "- [23] Connor Shorten and Taghi M. Khoshgoftaar. A survey on image data augmentation for deep learning. Journal of Big Data , 6(1):60, 2019.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}], "figures": [{"prov": [{"bbox": [323.408203125, 266.1492919921875, 553.2952270507812, 541.6512451171875], "page": 1, "span": [0, 84], "__ref_s3_data": null}], "text": "Figure 1: Four examples of complex page layouts across different document categories", "type": "figure", "payload": null, "bounding-box": null}, {"prov": [{"bbox": [88.33030700683594, 571.4317626953125, 263.7049560546875, 699.1134643554688], "page": 3, "span": [0, 69], "__ref_s3_data": null}], "text": "Figure 2: Distribution of DocLayNet pages across document categories.", "type": "figure", "payload": null, "bounding-box": null}, {"prov": [{"bbox": [53.05912780761719, 251.135986328125, 295.8506164550781, 481.2087097167969], "page": 4, "span": [0, 281], "__ref_s3_data": null}], "text": "Figure 3: Corpus Conversion Service annotation user interface. The PDF page is shown in the background, with overlaid text-cells (in darker shades). The annotation boxes can be drawn by dragging a rectangle over each segment with the respective label from the palette on the right.", "type": "figure", "payload": null, "bounding-box": null}, {"prov": [{"bbox": [315.960205078125, 332.31915283203125, 559.396484375, 706.6611938476562], "page": 5, "span": [0, 173], "__ref_s3_data": null}], "text": "Figure 4: Examples of plausible annotation alternatives for the same page. Criteria in our annotation guideline can resolve cases A to C, while the case D remains ambiguous.", "type": "figure", "payload": null, "bounding-box": null}, {"prov": [{"bbox": [323.48431396484375, 531.9892578125, 553.5411376953125, 702.1139526367188], "page": 6, "span": [0, 329], "__ref_s3_data": null}], "text": "Figure 5: Prediction performance (mAP@0.5-0.95) of a Mask R-CNN network with ResNet50 backbone trained on increasing fractions of the DocLayNet dataset. The learning curve flattens around the 80% mark, indicating that increasing the size of the DocLayNet dataset with similar data will not yield significantly better predictions.", "type": "figure", "payload": null, "bounding-box": null}, {"prov": [{"bbox": [52.963985443115234, 349.8648986816406, 556.931640625, 707.26416015625], "page": 9, "span": [0, 89], "__ref_s3_data": null}], "text": "Text Caption List-Item Formula Table Section-Header Picture Page-Header Page-Footer Title", "type": "figure", "payload": null, "bounding-box": null}], "tables": [{"prov": [{"bbox": [98.93103790283203, 497.9184875488281, 512.579833984375, 654.5245361328125], "page": 4, "span": [0, 0], "__ref_s3_data": null}], "text": "Table 1: DocLayNet dataset overview. Along with the frequency of each class label, we present the relative occurrence (as % of row \"Total\") in the train, test and validation sets. The inter-annotator agreement is computed as the mAP@0.5-0.95 metric between pairwise annotations from the triple-annotated pages, from which we obtain accuracy ranges.", "type": "table", "payload": null, "#-cols": 12, "#-rows": 14, "data": [[{"bbox": null, "spans": [[0, 0]], "text": "", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": null, "spans": [[0, 1]], "text": "", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [233.94400024414062, 643.40185546875, 270.042724609375, 651.7764892578125], "spans": [[0, 2], [0, 3], [0, 4], [0, 5]], "text": "% of Total", "type": "col_header", "col": 2, "col-header": true, "col-span": [2, 6], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [233.94400024414062, 643.40185546875, 270.042724609375, 651.7764892578125], "spans": [[0, 2], [0, 3], [0, 4], [0, 5]], "text": "% of Total", "type": "col_header", "col": 3, "col-header": true, "col-span": [2, 6], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [233.94400024414062, 643.40185546875, 270.042724609375, 651.7764892578125], "spans": [[0, 2], [0, 3], [0, 4], [0, 5]], "text": "% of Total", "type": "col_header", "col": 4, "col-header": true, "col-span": [2, 6], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [233.94400024414062, 643.40185546875, 270.042724609375, 651.7764892578125], "spans": [[0, 2], [0, 3], [0, 4], [0, 5]], "text": "% of Total", "type": "col_header", "col": 5, "col-header": true, "col-span": [2, 6], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [329.04998779296875, 643.40185546875, 483.39764404296875, 651.7764892578125], "spans": [[0, 6], [0, 7], [0, 8], [0, 9], [0, 10], [0, 11]], "text": "triple inter-annotator mAP @ 0.5-0.95 (%)", "type": "col_header", "col": 6, "col-header": true, "col-span": [6, 12], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [329.04998779296875, 643.40185546875, 483.39764404296875, 651.7764892578125], "spans": [[0, 6], [0, 7], [0, 8], [0, 9], [0, 10], [0, 11]], "text": "triple inter-annotator mAP @ 0.5-0.95 (%)", "type": "col_header", "col": 7, "col-header": true, "col-span": [6, 12], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [329.04998779296875, 643.40185546875, 483.39764404296875, 651.7764892578125], "spans": [[0, 6], [0, 7], [0, 8], [0, 9], [0, 10], [0, 11]], "text": "triple inter-annotator mAP @ 0.5-0.95 (%)", "type": "col_header", "col": 8, "col-header": true, "col-span": [6, 12], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [329.04998779296875, 643.40185546875, 483.39764404296875, 651.7764892578125], "spans": [[0, 6], [0, 7], [0, 8], [0, 9], [0, 10], [0, 11]], "text": "triple inter-annotator mAP @ 0.5-0.95 (%)", "type": "col_header", "col": 9, "col-header": true, "col-span": [6, 12], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [329.04998779296875, 643.40185546875, 483.39764404296875, 651.7764892578125], "spans": [[0, 6], [0, 7], [0, 8], [0, 9], [0, 10], [0, 11]], "text": "triple inter-annotator mAP @ 0.5-0.95 (%)", "type": "col_header", "col": 10, "col-header": true, "col-span": [6, 12], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [329.04998779296875, 643.40185546875, 483.39764404296875, 651.7764892578125], "spans": [[0, 6], [0, 7], [0, 8], [0, 9], [0, 10], [0, 11]], "text": "triple inter-annotator mAP @ 0.5-0.95 (%)", "type": "col_header", "col": 11, "col-header": true, "col-span": [6, 12], "row": 0, "row-header": false, "row-span": [0, 1]}], [{"bbox": [104.82499694824219, 632.4428100585938, 141.7127685546875, 640.8174438476562], "spans": [[1, 0]], "text": "class label", "type": "col_header", "col": 0, "col-header": true, "col-span": [0, 1], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [175.94700622558594, 632.4428100585938, 198.7126922607422, 640.8174438476562], "spans": [[1, 1]], "text": "Count", "type": "col_header", "col": 1, "col-header": true, "col-span": [1, 2], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [213.7949981689453, 632.4428100585938, 233.69143676757812, 640.8174438476562], "spans": [[1, 2]], "text": "Train", "type": "col_header", "col": 2, "col-header": true, "col-span": [2, 3], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [249.37367248535156, 632.4428100585938, 264.5, 640.8174438476562], "spans": [[1, 3]], "text": "Test", "type": "col_header", "col": 3, "col-header": true, "col-span": [3, 4], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [283.5356750488281, 632.4428100585938, 295.3085632324219, 640.8174438476562], "spans": [[1, 4]], "text": "Val", "type": "col_header", "col": 4, "col-header": true, "col-span": [4, 5], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [314.0150146484375, 632.4428100585938, 324.9809265136719, 640.8174438476562], "spans": [[1, 5]], "text": "All", "type": "col_header", "col": 5, "col-header": true, "col-span": [5, 6], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [343.0123596191406, 632.4428100585938, 354.6507568359375, 640.8174438476562], "spans": [[1, 6]], "text": "Fin", "type": "col_header", "col": 6, "col-header": true, "col-span": [6, 7], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [367.84033203125, 632.4428100585938, 384.3205871582031, 640.8174438476562], "spans": [[1, 7]], "text": "Man", "type": "col_header", "col": 7, "col-header": true, "col-span": [7, 8], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [407.5435791015625, 632.4428100585938, 418.1597900390625, 640.8174438476562], "spans": [[1, 8]], "text": "Sci", "type": "col_header", "col": 8, "col-header": true, "col-span": [8, 9], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [432.2998046875, 632.4428100585938, 447.8296203613281, 640.8174438476562], "spans": [[1, 9]], "text": "Law", "type": "col_header", "col": 9, "col-header": true, "col-span": [9, 10], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [465.7265625, 632.4428100585938, 477.5084228515625, 640.8174438476562], "spans": [[1, 10]], "text": "Pat", "type": "col_header", "col": 10, "col-header": true, "col-span": [10, 11], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [493.52239990234375, 632.4428100585938, 507.17822265625, 640.8174438476562], "spans": [[1, 11]], "text": "Ten", "type": "col_header", "col": 11, "col-header": true, "col-span": [11, 12], "row": 1, "row-header": false, "row-span": [1, 2]}], [{"bbox": [104.82499694824219, 621.0858154296875, 134.01063537597656, 629.46044921875], "spans": [[2, 0]], "text": "Caption", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 2, "row-header": true, "row-span": [2, 3]}, {"bbox": [177.86599731445312, 621.0858154296875, 198.71287536621094, 629.46044921875], "spans": [[2, 1]], "text": "22524", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [219.21099853515625, 621.0858154296875, 233.69174194335938, 629.46044921875], "spans": [[2, 2]], "text": "2.04", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [250.01956176757812, 621.0858154296875, 264.50030517578125, 629.46044921875], "spans": [[2, 3]], "text": "1.77", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [280.828125, 621.0858154296875, 295.3088684082031, 629.46044921875], "spans": [[2, 4]], "text": "2.32", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [305.27301025390625, 621.0858154296875, 324.9811706542969, 629.46044921875], "spans": [[2, 5]], "text": "84-89", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [334.9428405761719, 621.0858154296875, 354.6510009765625, 629.46044921875], "spans": [[2, 6]], "text": "40-61", "type": "body", "col": 6, "col-header": false, "col-span": [6, 7], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [364.6126708984375, 621.0858154296875, 384.3208312988281, 629.46044921875], "spans": [[2, 7]], "text": "86-92", "type": "body", "col": 7, "col-header": false, "col-span": [7, 8], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [398.4518737792969, 621.0858154296875, 418.1600341796875, 629.46044921875], "spans": [[2, 8]], "text": "94-99", "type": "body", "col": 8, "col-header": false, "col-span": [8, 9], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [428.1217041015625, 621.0858154296875, 447.8298645019531, 629.46044921875], "spans": [[2, 9]], "text": "95-99", "type": "body", "col": 9, "col-header": false, "col-span": [9, 10], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [457.8005065917969, 621.0858154296875, 477.5086669921875, 629.46044921875], "spans": [[2, 10]], "text": "69-78", "type": "body", "col": 10, "col-header": false, "col-span": [10, 11], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [495.32489013671875, 621.0858154296875, 507.178466796875, 629.46044921875], "spans": [[2, 11]], "text": "n/a", "type": "body", "col": 11, "col-header": false, "col-span": [11, 12], "row": 2, "row-header": false, "row-span": [2, 3]}], [{"bbox": [104.82499694824219, 610.1268310546875, 137.3282012939453, 618.50146484375], "spans": [[3, 0]], "text": "Footnote", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 3, "row-header": true, "row-span": [3, 4]}, {"bbox": [182.03500366210938, 610.1268310546875, 198.71250915527344, 618.50146484375], "spans": [[3, 1]], "text": "6318", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [219.21099853515625, 610.1268310546875, 233.69174194335938, 618.50146484375], "spans": [[3, 2]], "text": "0.60", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [250.01956176757812, 610.1268310546875, 264.50030517578125, 618.50146484375], "spans": [[3, 3]], "text": "0.31", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [280.828125, 610.1268310546875, 295.3088684082031, 618.50146484375], "spans": [[3, 4]], "text": "0.58", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [305.27301025390625, 610.1268310546875, 324.9811706542969, 618.50146484375], "spans": [[3, 5]], "text": "83-91", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [342.7973937988281, 610.1268310546875, 354.6509704589844, 618.50146484375], "spans": [[3, 6]], "text": "n/a", "type": "body", "col": 6, "col-header": false, "col-span": [6, 7], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [371.8126525878906, 610.1268310546875, 384.3207702636719, 618.50146484375], "spans": [[3, 7]], "text": "100", "type": "body", "col": 7, "col-header": false, "col-span": [7, 8], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [398.4518127441406, 610.1268310546875, 418.15997314453125, 618.50146484375], "spans": [[3, 8]], "text": "62-88", "type": "body", "col": 8, "col-header": false, "col-span": [8, 9], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [428.12164306640625, 610.1268310546875, 447.8298034667969, 618.50146484375], "spans": [[3, 9]], "text": "85-94", "type": "body", "col": 9, "col-header": false, "col-span": [9, 10], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [465.6549987792969, 610.1268310546875, 477.5085754394531, 618.50146484375], "spans": [[3, 10]], "text": "n/a", "type": "body", "col": 10, "col-header": false, "col-span": [10, 11], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [487.4702453613281, 610.1268310546875, 507.17840576171875, 618.50146484375], "spans": [[3, 11]], "text": "82-97", "type": "body", "col": 11, "col-header": false, "col-span": [11, 12], "row": 3, "row-header": false, "row-span": [3, 4]}], [{"bbox": [104.82499694824219, 599.1678466796875, 135.33766174316406, 607.54248046875], "spans": [[4, 0]], "text": "Formula", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 4, "row-header": true, "row-span": [4, 5]}, {"bbox": [177.86599731445312, 599.1678466796875, 198.71287536621094, 607.54248046875], "spans": [[4, 1]], "text": "25027", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [219.21099853515625, 599.1678466796875, 233.69174194335938, 607.54248046875], "spans": [[4, 2]], "text": "2.25", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [250.01956176757812, 599.1678466796875, 264.50030517578125, 607.54248046875], "spans": [[4, 3]], "text": "1.90", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [280.828125, 599.1678466796875, 295.3088684082031, 607.54248046875], "spans": [[4, 4]], "text": "2.96", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [305.27301025390625, 599.1678466796875, 324.9811706542969, 607.54248046875], "spans": [[4, 5]], "text": "83-85", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [342.7973937988281, 599.1678466796875, 354.6509704589844, 607.54248046875], "spans": [[4, 6]], "text": "n/a", "type": "body", "col": 6, "col-header": false, "col-span": [6, 7], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [372.4671936035156, 599.1678466796875, 384.3207702636719, 607.54248046875], "spans": [[4, 7]], "text": "n/a", "type": "body", "col": 7, "col-header": false, "col-span": [7, 8], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [398.4518127441406, 599.1678466796875, 418.15997314453125, 607.54248046875], "spans": [[4, 8]], "text": "84-87", "type": "body", "col": 8, "col-header": false, "col-span": [8, 9], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [428.12164306640625, 599.1678466796875, 447.8298034667969, 607.54248046875], "spans": [[4, 9]], "text": "86-96", "type": "body", "col": 9, "col-header": false, "col-span": [9, 10], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [465.6549987792969, 599.1678466796875, 477.5085754394531, 607.54248046875], "spans": [[4, 10]], "text": "n/a", "type": "body", "col": 10, "col-header": false, "col-span": [10, 11], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [495.3247985839844, 599.1678466796875, 507.1783752441406, 607.54248046875], "spans": [[4, 11]], "text": "n/a", "type": "body", "col": 11, "col-header": false, "col-span": [11, 12], "row": 4, "row-header": false, "row-span": [4, 5]}], [{"bbox": [104.82499694824219, 588.2088012695312, 137.7047882080078, 596.5834350585938], "spans": [[5, 0]], "text": "List-item", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 5, "row-header": true, "row-span": [5, 6]}, {"bbox": [173.69700622558594, 588.2088012695312, 198.7132568359375, 596.5834350585938], "spans": [[5, 1]], "text": "185660", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [215.04200744628906, 588.2088012695312, 233.69212341308594, 596.5834350585938], "spans": [[5, 2]], "text": "17.19", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [245.85055541992188, 588.2088012695312, 264.50067138671875, 596.5834350585938], "spans": [[5, 3]], "text": "13.34", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [276.65911865234375, 588.2088012695312, 295.3092346191406, 596.5834350585938], "spans": [[5, 4]], "text": "15.82", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [305.27301025390625, 588.2088012695312, 324.9811706542969, 596.5834350585938], "spans": [[5, 5]], "text": "87-88", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [334.9428405761719, 588.2088012695312, 354.6510009765625, 596.5834350585938], "spans": [[5, 6]], "text": "74-83", "type": "body", "col": 6, "col-header": false, "col-span": [6, 7], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [364.6126708984375, 588.2088012695312, 384.3208312988281, 596.5834350585938], "spans": [[5, 7]], "text": "90-92", "type": "body", "col": 7, "col-header": false, "col-span": [7, 8], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [398.4518737792969, 588.2088012695312, 418.1600341796875, 596.5834350585938], "spans": [[5, 8]], "text": "97-97", "type": "body", "col": 8, "col-header": false, "col-span": [8, 9], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [428.1217041015625, 588.2088012695312, 447.8298645019531, 596.5834350585938], "spans": [[5, 9]], "text": "81-85", "type": "body", "col": 9, "col-header": false, "col-span": [9, 10], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [457.8005065917969, 588.2088012695312, 477.5086669921875, 596.5834350585938], "spans": [[5, 10]], "text": "75-88", "type": "body", "col": 10, "col-header": false, "col-span": [10, 11], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [487.4703369140625, 588.2088012695312, 507.1784973144531, 596.5834350585938], "spans": [[5, 11]], "text": "93-95", "type": "body", "col": 11, "col-header": false, "col-span": [11, 12], "row": 5, "row-header": false, "row-span": [5, 6]}], [{"bbox": [104.82499694824219, 577.2498168945312, 147.3526153564453, 585.6244506835938], "spans": [[6, 0]], "text": "Page-footer", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 6, "row-header": true, "row-span": [6, 7]}, {"bbox": [177.86599731445312, 577.2498168945312, 198.71287536621094, 585.6244506835938], "spans": [[6, 1]], "text": "70878", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [219.21099853515625, 577.2498168945312, 233.69174194335938, 585.6244506835938], "spans": [[6, 2]], "text": "6.51", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [250.01956176757812, 577.2498168945312, 264.50030517578125, 585.6244506835938], "spans": [[6, 3]], "text": "5.58", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [280.828125, 577.2498168945312, 295.3088684082031, 585.6244506835938], "spans": [[6, 4]], "text": "6.00", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [305.27301025390625, 577.2498168945312, 324.9811706542969, 585.6244506835938], "spans": [[6, 5]], "text": "93-94", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [334.9428405761719, 577.2498168945312, 354.6510009765625, 585.6244506835938], "spans": [[6, 6]], "text": "88-90", "type": "body", "col": 6, "col-header": false, "col-span": [6, 7], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [364.6126708984375, 577.2498168945312, 384.3208312988281, 585.6244506835938], "spans": [[6, 7]], "text": "95-96", "type": "body", "col": 7, "col-header": false, "col-span": [7, 8], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [405.6518859863281, 577.2498168945312, 418.1600036621094, 585.6244506835938], "spans": [[6, 8]], "text": "100", "type": "body", "col": 8, "col-header": false, "col-span": [8, 9], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [428.1216735839844, 577.2498168945312, 447.829833984375, 585.6244506835938], "spans": [[6, 9]], "text": "92-97", "type": "body", "col": 9, "col-header": false, "col-span": [9, 10], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [465.00048828125, 577.2498168945312, 477.50860595703125, 585.6244506835938], "spans": [[6, 10]], "text": "100", "type": "body", "col": 10, "col-header": false, "col-span": [10, 11], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [487.47027587890625, 577.2498168945312, 507.1784362792969, 585.6244506835938], "spans": [[6, 11]], "text": "96-98", "type": "body", "col": 11, "col-header": false, "col-span": [11, 12], "row": 6, "row-header": false, "row-span": [6, 7]}], [{"bbox": [104.82499694824219, 566.2908325195312, 150.10531616210938, 574.6654663085938], "spans": [[7, 0]], "text": "Page-header", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 7, "row-header": true, "row-span": [7, 8]}, {"bbox": [177.86599731445312, 566.2908325195312, 198.71287536621094, 574.6654663085938], "spans": [[7, 1]], "text": "58022", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 7, "row-header": false, "row-span": [7, 8]}, {"bbox": [219.21099853515625, 566.2908325195312, 233.69174194335938, 574.6654663085938], "spans": [[7, 2]], "text": "5.10", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 7, "row-header": false, "row-span": [7, 8]}, {"bbox": [250.01956176757812, 566.2908325195312, 264.50030517578125, 574.6654663085938], "spans": [[7, 3]], "text": "6.70", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 7, "row-header": false, "row-span": [7, 8]}, {"bbox": [280.828125, 566.2908325195312, 295.3088684082031, 574.6654663085938], "spans": [[7, 4]], "text": "5.06", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 7, "row-header": false, "row-span": [7, 8]}, {"bbox": [305.27301025390625, 566.2908325195312, 324.9811706542969, 574.6654663085938], "spans": [[7, 5]], "text": "85-89", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 7, "row-header": false, "row-span": [7, 8]}, {"bbox": [334.9428405761719, 566.2908325195312, 354.6510009765625, 574.6654663085938], "spans": [[7, 6]], "text": "66-76", "type": "body", "col": 6, "col-header": false, "col-span": [6, 7], "row": 7, "row-header": false, "row-span": [7, 8]}, {"bbox": [364.6126708984375, 566.2908325195312, 384.3208312988281, 574.6654663085938], "spans": [[7, 7]], "text": "90-94", "type": "body", "col": 7, "col-header": false, "col-span": [7, 8], "row": 7, "row-header": false, "row-span": [7, 8]}, {"bbox": [394.2825012207031, 566.2908325195312, 418.1600341796875, 574.6654663085938], "spans": [[7, 8]], "text": "98-100", "type": "body", "col": 8, "col-header": false, "col-span": [8, 9], "row": 7, "row-header": false, "row-span": [7, 8]}, {"bbox": [428.1217041015625, 566.2908325195312, 447.8298645019531, 574.6654663085938], "spans": [[7, 9]], "text": "91-92", "type": "body", "col": 9, "col-header": false, "col-span": [9, 10], "row": 7, "row-header": false, "row-span": [7, 8]}, {"bbox": [457.8005065917969, 566.2908325195312, 477.5086669921875, 574.6654663085938], "spans": [[7, 10]], "text": "97-99", "type": "body", "col": 10, "col-header": false, "col-span": [10, 11], "row": 7, "row-header": false, "row-span": [7, 8]}, {"bbox": [487.4703369140625, 566.2908325195312, 507.1784973144531, 574.6654663085938], "spans": [[7, 11]], "text": "81-86", "type": "body", "col": 11, "col-header": false, "col-span": [11, 12], "row": 7, "row-header": false, "row-span": [7, 8]}], [{"bbox": [104.82499694824219, 555.3318481445312, 130.80963134765625, 563.7064819335938], "spans": [[8, 0]], "text": "Picture", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 8, "row-header": true, "row-span": [8, 9]}, {"bbox": [177.86599731445312, 555.3318481445312, 198.71287536621094, 563.7064819335938], "spans": [[8, 1]], "text": "45976", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 8, "row-header": false, "row-span": [8, 9]}, {"bbox": [219.21099853515625, 555.3318481445312, 233.69174194335938, 563.7064819335938], "spans": [[8, 2]], "text": "4.21", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 8, "row-header": false, "row-span": [8, 9]}, {"bbox": [250.01956176757812, 555.3318481445312, 264.50030517578125, 563.7064819335938], "spans": [[8, 3]], "text": "2.78", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 8, "row-header": false, "row-span": [8, 9]}, {"bbox": [280.828125, 555.3318481445312, 295.3088684082031, 563.7064819335938], "spans": [[8, 4]], "text": "5.31", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 8, "row-header": false, "row-span": [8, 9]}, {"bbox": [305.27301025390625, 555.3318481445312, 324.9811706542969, 563.7064819335938], "spans": [[8, 5]], "text": "69-71", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 8, "row-header": false, "row-span": [8, 9]}, {"bbox": [334.9428405761719, 555.3318481445312, 354.6510009765625, 563.7064819335938], "spans": [[8, 6]], "text": "56-59", "type": "body", "col": 6, "col-header": false, "col-span": [6, 7], "row": 8, "row-header": false, "row-span": [8, 9]}, {"bbox": [364.6126708984375, 555.3318481445312, 384.3208312988281, 563.7064819335938], "spans": [[8, 7]], "text": "82-86", "type": "body", "col": 7, "col-header": false, "col-span": [7, 8], "row": 8, "row-header": false, "row-span": [8, 9]}, {"bbox": [398.4518737792969, 555.3318481445312, 418.1600341796875, 563.7064819335938], "spans": [[8, 8]], "text": "69-82", "type": "body", "col": 8, "col-header": false, "col-span": [8, 9], "row": 8, "row-header": false, "row-span": [8, 9]}, {"bbox": [428.1217041015625, 555.3318481445312, 447.8298645019531, 563.7064819335938], "spans": [[8, 9]], "text": "80-95", "type": "body", "col": 9, "col-header": false, "col-span": [9, 10], "row": 8, "row-header": false, "row-span": [8, 9]}, {"bbox": [457.8005065917969, 555.3318481445312, 477.5086669921875, 563.7064819335938], "spans": [[8, 10]], "text": "66-71", "type": "body", "col": 10, "col-header": false, "col-span": [10, 11], "row": 8, "row-header": false, "row-span": [8, 9]}, {"bbox": [487.4703369140625, 555.3318481445312, 507.1784973144531, 563.7064819335938], "spans": [[8, 11]], "text": "59-76", "type": "body", "col": 11, "col-header": false, "col-span": [11, 12], "row": 8, "row-header": false, "row-span": [8, 9]}], [{"bbox": [104.82499694824219, 544.372802734375, 159.5648651123047, 552.7474365234375], "spans": [[9, 0]], "text": "Section-header", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 9, "row-header": true, "row-span": [9, 10]}, {"bbox": [173.69700622558594, 544.372802734375, 198.7132568359375, 552.7474365234375], "spans": [[9, 1]], "text": "142884", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 9, "row-header": false, "row-span": [9, 10]}, {"bbox": [215.04200744628906, 544.372802734375, 233.69212341308594, 552.7474365234375], "spans": [[9, 2]], "text": "12.60", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 9, "row-header": false, "row-span": [9, 10]}, {"bbox": [245.85055541992188, 544.372802734375, 264.50067138671875, 552.7474365234375], "spans": [[9, 3]], "text": "15.77", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 9, "row-header": false, "row-span": [9, 10]}, {"bbox": [276.65911865234375, 544.372802734375, 295.3092346191406, 552.7474365234375], "spans": [[9, 4]], "text": "12.85", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 9, "row-header": false, "row-span": [9, 10]}, {"bbox": [305.27301025390625, 544.372802734375, 324.9811706542969, 552.7474365234375], "spans": [[9, 5]], "text": "83-84", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 9, "row-header": false, "row-span": [9, 10]}, {"bbox": [334.9428405761719, 544.372802734375, 354.6510009765625, 552.7474365234375], "spans": [[9, 6]], "text": "76-81", "type": "body", "col": 6, "col-header": false, "col-span": [6, 7], "row": 9, "row-header": false, "row-span": [9, 10]}, {"bbox": [364.6126708984375, 544.372802734375, 384.3208312988281, 552.7474365234375], "spans": [[9, 7]], "text": "90-92", "type": "body", "col": 7, "col-header": false, "col-span": [7, 8], "row": 9, "row-header": false, "row-span": [9, 10]}, {"bbox": [398.4518737792969, 544.372802734375, 418.1600341796875, 552.7474365234375], "spans": [[9, 8]], "text": "94-95", "type": "body", "col": 8, "col-header": false, "col-span": [8, 9], "row": 9, "row-header": false, "row-span": [9, 10]}, {"bbox": [428.1217041015625, 544.372802734375, 447.8298645019531, 552.7474365234375], "spans": [[9, 9]], "text": "87-94", "type": "body", "col": 9, "col-header": false, "col-span": [9, 10], "row": 9, "row-header": false, "row-span": [9, 10]}, {"bbox": [457.8005065917969, 544.372802734375, 477.5086669921875, 552.7474365234375], "spans": [[9, 10]], "text": "69-73", "type": "body", "col": 10, "col-header": false, "col-span": [10, 11], "row": 9, "row-header": false, "row-span": [9, 10]}, {"bbox": [487.4703369140625, 544.372802734375, 507.1784973144531, 552.7474365234375], "spans": [[9, 11]], "text": "78-86", "type": "body", "col": 11, "col-header": false, "col-span": [11, 12], "row": 9, "row-header": false, "row-span": [9, 10]}], [{"bbox": [104.82499694824219, 533.413818359375, 124.63176727294922, 541.7884521484375], "spans": [[10, 0]], "text": "Table", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 10, "row-header": true, "row-span": [10, 11]}, {"bbox": [177.86599731445312, 533.413818359375, 198.71287536621094, 541.7884521484375], "spans": [[10, 1]], "text": "34733", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 10, "row-header": false, "row-span": [10, 11]}, {"bbox": [219.21099853515625, 533.413818359375, 233.69174194335938, 541.7884521484375], "spans": [[10, 2]], "text": "3.20", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 10, "row-header": false, "row-span": [10, 11]}, {"bbox": [250.01956176757812, 533.413818359375, 264.50030517578125, 541.7884521484375], "spans": [[10, 3]], "text": "2.27", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 10, "row-header": false, "row-span": [10, 11]}, {"bbox": [280.828125, 533.413818359375, 295.3088684082031, 541.7884521484375], "spans": [[10, 4]], "text": "3.60", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 10, "row-header": false, "row-span": [10, 11]}, {"bbox": [305.27301025390625, 533.413818359375, 324.9811706542969, 541.7884521484375], "spans": [[10, 5]], "text": "77-81", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 10, "row-header": false, "row-span": [10, 11]}, {"bbox": [334.9428405761719, 533.413818359375, 354.6510009765625, 541.7884521484375], "spans": [[10, 6]], "text": "75-80", "type": "body", "col": 6, "col-header": false, "col-span": [6, 7], "row": 10, "row-header": false, "row-span": [10, 11]}, {"bbox": [364.6126708984375, 533.413818359375, 384.3208312988281, 541.7884521484375], "spans": [[10, 7]], "text": "83-86", "type": "body", "col": 7, "col-header": false, "col-span": [7, 8], "row": 10, "row-header": false, "row-span": [10, 11]}, {"bbox": [398.4518737792969, 533.413818359375, 418.1600341796875, 541.7884521484375], "spans": [[10, 8]], "text": "98-99", "type": "body", "col": 8, "col-header": false, "col-span": [8, 9], "row": 10, "row-header": false, "row-span": [10, 11]}, {"bbox": [428.1217041015625, 533.413818359375, 447.8298645019531, 541.7884521484375], "spans": [[10, 9]], "text": "58-80", "type": "body", "col": 9, "col-header": false, "col-span": [9, 10], "row": 10, "row-header": false, "row-span": [10, 11]}, {"bbox": [457.8005065917969, 533.413818359375, 477.5086669921875, 541.7884521484375], "spans": [[10, 10]], "text": "79-84", "type": "body", "col": 10, "col-header": false, "col-span": [10, 11], "row": 10, "row-header": false, "row-span": [10, 11]}, {"bbox": [487.4703369140625, 533.413818359375, 507.1784973144531, 541.7884521484375], "spans": [[10, 11]], "text": "70-85", "type": "body", "col": 11, "col-header": false, "col-span": [11, 12], "row": 10, "row-header": false, "row-span": [10, 11]}], [{"bbox": [104.82499694824219, 522.455810546875, 120.78518676757812, 530.8304443359375], "spans": [[11, 0]], "text": "Text", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 11, "row-header": true, "row-span": [11, 12]}, {"bbox": [173.69700622558594, 522.455810546875, 198.7132568359375, 530.8304443359375], "spans": [[11, 1]], "text": "510377", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 11, "row-header": false, "row-span": [11, 12]}, {"bbox": [215.04200744628906, 522.455810546875, 233.69212341308594, 530.8304443359375], "spans": [[11, 2]], "text": "45.82", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 11, "row-header": false, "row-span": [11, 12]}, {"bbox": [245.85055541992188, 522.455810546875, 264.50067138671875, 530.8304443359375], "spans": [[11, 3]], "text": "49.28", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 11, "row-header": false, "row-span": [11, 12]}, {"bbox": [276.65911865234375, 522.455810546875, 295.3092346191406, 530.8304443359375], "spans": [[11, 4]], "text": "45.00", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 11, "row-header": false, "row-span": [11, 12]}, {"bbox": [305.27301025390625, 522.455810546875, 324.9811706542969, 530.8304443359375], "spans": [[11, 5]], "text": "84-86", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 11, "row-header": false, "row-span": [11, 12]}, {"bbox": [334.9428405761719, 522.455810546875, 354.6510009765625, 530.8304443359375], "spans": [[11, 6]], "text": "81-86", "type": "body", "col": 6, "col-header": false, "col-span": [6, 7], "row": 11, "row-header": false, "row-span": [11, 12]}, {"bbox": [364.6126708984375, 522.455810546875, 384.3208312988281, 530.8304443359375], "spans": [[11, 7]], "text": "88-93", "type": "body", "col": 7, "col-header": false, "col-span": [7, 8], "row": 11, "row-header": false, "row-span": [11, 12]}, {"bbox": [398.4518737792969, 522.455810546875, 418.1600341796875, 530.8304443359375], "spans": [[11, 8]], "text": "89-93", "type": "body", "col": 8, "col-header": false, "col-span": [8, 9], "row": 11, "row-header": false, "row-span": [11, 12]}, {"bbox": [428.1217041015625, 522.455810546875, 447.8298645019531, 530.8304443359375], "spans": [[11, 9]], "text": "87-92", "type": "body", "col": 9, "col-header": false, "col-span": [9, 10], "row": 11, "row-header": false, "row-span": [11, 12]}, {"bbox": [457.8005065917969, 522.455810546875, 477.5086669921875, 530.8304443359375], "spans": [[11, 10]], "text": "71-79", "type": "body", "col": 10, "col-header": false, "col-span": [10, 11], "row": 11, "row-header": false, "row-span": [11, 12]}, {"bbox": [487.4703369140625, 522.455810546875, 507.1784973144531, 530.8304443359375], "spans": [[11, 11]], "text": "87-95", "type": "body", "col": 11, "col-header": false, "col-span": [11, 12], "row": 11, "row-header": false, "row-span": [11, 12]}], [{"bbox": [104.82499694824219, 511.496826171875, 121.81632995605469, 519.8714599609375], "spans": [[12, 0]], "text": "Title", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 12, "row-header": true, "row-span": [12, 13]}, {"bbox": [182.03500366210938, 511.496826171875, 198.71250915527344, 519.8714599609375], "spans": [[12, 1]], "text": "5071", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 12, "row-header": false, "row-span": [12, 13]}, {"bbox": [219.21099853515625, 511.496826171875, 233.69174194335938, 519.8714599609375], "spans": [[12, 2]], "text": "0.47", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 12, "row-header": false, "row-span": [12, 13]}, {"bbox": [250.01956176757812, 511.496826171875, 264.50030517578125, 519.8714599609375], "spans": [[12, 3]], "text": "0.30", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 12, "row-header": false, "row-span": [12, 13]}, {"bbox": [280.828125, 511.496826171875, 295.3088684082031, 519.8714599609375], "spans": [[12, 4]], "text": "0.50", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 12, "row-header": false, "row-span": [12, 13]}, {"bbox": [305.27301025390625, 511.496826171875, 324.9811706542969, 519.8714599609375], "spans": [[12, 5]], "text": "60-72", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 12, "row-header": false, "row-span": [12, 13]}, {"bbox": [334.9428405761719, 511.496826171875, 354.6510009765625, 519.8714599609375], "spans": [[12, 6]], "text": "24-63", "type": "body", "col": 6, "col-header": false, "col-span": [6, 7], "row": 12, "row-header": false, "row-span": [12, 13]}, {"bbox": [364.6126708984375, 511.496826171875, 384.3208312988281, 519.8714599609375], "spans": [[12, 7]], "text": "50-63", "type": "body", "col": 7, "col-header": false, "col-span": [7, 8], "row": 12, "row-header": false, "row-span": [12, 13]}, {"bbox": [394.2825012207031, 511.496826171875, 418.1600341796875, 519.8714599609375], "spans": [[12, 8]], "text": "94-100", "type": "body", "col": 8, "col-header": false, "col-span": [8, 9], "row": 12, "row-header": false, "row-span": [12, 13]}, {"bbox": [428.1217041015625, 511.496826171875, 447.8298645019531, 519.8714599609375], "spans": [[12, 9]], "text": "82-96", "type": "body", "col": 9, "col-header": false, "col-span": [9, 10], "row": 12, "row-header": false, "row-span": [12, 13]}, {"bbox": [457.8005065917969, 511.496826171875, 477.5086669921875, 519.8714599609375], "spans": [[12, 10]], "text": "68-79", "type": "body", "col": 10, "col-header": false, "col-span": [10, 11], "row": 12, "row-header": false, "row-span": [12, 13]}, {"bbox": [487.4703369140625, 511.496826171875, 507.1784973144531, 519.8714599609375], "spans": [[12, 11]], "text": "24-56", "type": "body", "col": 11, "col-header": false, "col-span": [11, 12], "row": 12, "row-header": false, "row-span": [12, 13]}], [{"bbox": [104.82499694824219, 500.1388244628906, 123.43028259277344, 508.5134582519531], "spans": [[13, 0]], "text": "Total", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 13, "row-header": true, "row-span": [13, 14]}, {"bbox": [169.52699279785156, 500.1388244628906, 198.71263122558594, 508.5134582519531], "spans": [[13, 1]], "text": "1107470", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 13, "row-header": false, "row-span": [13, 14]}, {"bbox": [208.6750030517578, 500.1388244628906, 233.69125366210938, 508.5134582519531], "spans": [[13, 2]], "text": "941123", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 13, "row-header": false, "row-span": [13, 14]}, {"bbox": [243.65292358398438, 500.1388244628906, 264.49981689453125, 508.5134582519531], "spans": [[13, 3]], "text": "99816", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 13, "row-header": false, "row-span": [13, 14]}, {"bbox": [274.46148681640625, 500.1388244628906, 295.3083801269531, 508.5134582519531], "spans": [[13, 4]], "text": "66531", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 13, "row-header": false, "row-span": [13, 14]}, {"bbox": [305.27301025390625, 500.1388244628906, 324.9811706542969, 508.5134582519531], "spans": [[13, 5]], "text": "82-83", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 13, "row-header": false, "row-span": [13, 14]}, {"bbox": [334.9428405761719, 500.1388244628906, 354.6510009765625, 508.5134582519531], "spans": [[13, 6]], "text": "71-74", "type": "body", "col": 6, "col-header": false, "col-span": [6, 7], "row": 13, "row-header": false, "row-span": [13, 14]}, {"bbox": [364.6126708984375, 500.1388244628906, 384.3208312988281, 508.5134582519531], "spans": [[13, 7]], "text": "79-81", "type": "body", "col": 7, "col-header": false, "col-span": [7, 8], "row": 13, "row-header": false, "row-span": [13, 14]}, {"bbox": [398.4518737792969, 500.1388244628906, 418.1600341796875, 508.5134582519531], "spans": [[13, 8]], "text": "89-94", "type": "body", "col": 8, "col-header": false, "col-span": [8, 9], "row": 13, "row-header": false, "row-span": [13, 14]}, {"bbox": [428.1217041015625, 500.1388244628906, 447.8298645019531, 508.5134582519531], "spans": [[13, 9]], "text": "86-91", "type": "body", "col": 9, "col-header": false, "col-span": [9, 10], "row": 13, "row-header": false, "row-span": [13, 14]}, {"bbox": [457.8005065917969, 500.1388244628906, 477.5086669921875, 508.5134582519531], "spans": [[13, 10]], "text": "71-76", "type": "body", "col": 10, "col-header": false, "col-span": [10, 11], "row": 13, "row-header": false, "row-span": [13, 14]}, {"bbox": [487.4703369140625, 500.1388244628906, 507.1784973144531, 508.5134582519531], "spans": [[13, 11]], "text": "68-85", "type": "body", "col": 11, "col-header": false, "col-span": [11, 12], "row": 13, "row-header": false, "row-span": [13, 14]}]], "model": null, "bounding-box": null}, {"prov": [{"bbox": [62.02753829956055, 440.3381042480469, 285.78955078125, 596.3199462890625], "page": 6, "span": [0, 0], "__ref_s3_data": null}], "text": "Table 2: Prediction performance (mAP@0.5-0.95) of object detection networks on DocLayNet test set. The MRCNN (Mask R-CNN) and FRCNN (Faster R-CNN) models with ResNet-50 or ResNet-101 backbone were trained based on the network architectures from the detectron2 model zoo (Mask R-CNN R50, R101-FPN 3x, Faster R-CNN R101-FPN 3x), with default configurations. The YOLO implementation utilized was YOLOv5x6 [13]. All models were initialised using pre-trained weights from the COCO 2017 dataset.", "type": "table", "payload": null, "#-cols": 6, "#-rows": 14, "data": [[{"bbox": null, "spans": [[0, 0]], "text": "", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [132.36500549316406, 585.65185546875, 157.99098205566406, 594.0264892578125], "spans": [[0, 1], [1, 1]], "text": "human", "type": "col_header", "col": 1, "col-header": true, "col-span": [1, 2], "row": 0, "row-header": false, "row-span": [0, 2]}, {"bbox": [173.5050048828125, 585.65185546875, 204.618408203125, 594.0264892578125], "spans": [[0, 2], [0, 3]], "text": "MRCNN", "type": "col_header", "col": 2, "col-header": true, "col-span": [2, 4], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [173.5050048828125, 585.65185546875, 204.618408203125, 594.0264892578125], "spans": [[0, 2], [0, 3]], "text": "MRCNN", "type": "col_header", "col": 3, "col-header": true, "col-span": [2, 4], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [220.13027954101562, 585.65185546875, 248.069580078125, 594.0264892578125], "spans": [[0, 4]], "text": "FRCNN", "type": "col_header", "col": 4, "col-header": true, "col-span": [4, 5], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [258.03125, 585.65185546875, 280.1782531738281, 594.0264892578125], "spans": [[0, 5]], "text": "YOLO", "type": "col_header", "col": 5, "col-header": true, "col-span": [5, 6], "row": 0, "row-header": false, "row-span": [0, 1]}], [{"bbox": null, "spans": [[1, 0]], "text": "", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [132.36500549316406, 585.65185546875, 157.99098205566406, 594.0264892578125], "spans": [[0, 1], [1, 1]], "text": "human", "type": "col_header", "col": 1, "col-header": true, "col-span": [1, 2], "row": 1, "row-header": false, "row-span": [0, 2]}, {"bbox": [168.39300537109375, 574.6928100585938, 181.9950408935547, 583.0674438476562], "spans": [[1, 2]], "text": "R50", "type": "col_header", "col": 2, "col-header": true, "col-span": [2, 3], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [192.39605712890625, 574.6928100585938, 210.16746520996094, 583.0674438476562], "spans": [[1, 3]], "text": "R101", "type": "col_header", "col": 3, "col-header": true, "col-span": [3, 4], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [225.2130889892578, 574.6928100585938, 242.9844970703125, 583.0674438476562], "spans": [[1, 4]], "text": "R101", "type": "col_header", "col": 4, "col-header": true, "col-span": [4, 5], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [260.5137939453125, 574.6928100585938, 277.702392578125, 583.0674438476562], "spans": [[1, 5]], "text": "v5x6", "type": "col_header", "col": 5, "col-header": true, "col-span": [5, 6], "row": 1, "row-header": false, "row-span": [1, 2]}], [{"bbox": [67.66300201416016, 563.3358154296875, 96.8486328125, 571.71044921875], "spans": [[2, 0]], "text": "Caption", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 2, "row-header": true, "row-span": [2, 3]}, {"bbox": [135.32400512695312, 563.3358154296875, 155.0321502685547, 571.71044921875], "spans": [[2, 1]], "text": "84-89", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [167.95399475097656, 563.3358154296875, 182.43472290039062, 571.71044921875], "spans": [[2, 2]], "text": "68.4", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [194.04620361328125, 563.3358154296875, 208.52694702148438, 571.71044921875], "spans": [[2, 3]], "text": "71.5", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [226.8632354736328, 563.3358154296875, 241.34396362304688, 571.71044921875], "spans": [[2, 4]], "text": "70.1", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [261.8680419921875, 563.3358154296875, 276.3487854003906, 571.71044921875], "spans": [[2, 5]], "text": "77.7", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 2, "row-header": false, "row-span": [2, 3]}], [{"bbox": [67.66300201416016, 552.3768310546875, 100.16619873046875, 560.75146484375], "spans": [[3, 0]], "text": "Footnote", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 3, "row-header": true, "row-span": [3, 4]}, {"bbox": [135.32400512695312, 552.3768310546875, 155.0321502685547, 560.75146484375], "spans": [[3, 1]], "text": "83-91", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [167.95399475097656, 552.3768310546875, 182.43472290039062, 560.75146484375], "spans": [[3, 2]], "text": "70.9", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [194.04620361328125, 552.3768310546875, 208.52694702148438, 560.75146484375], "spans": [[3, 3]], "text": "71.8", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [226.8632354736328, 552.3768310546875, 241.34396362304688, 560.75146484375], "spans": [[3, 4]], "text": "73.7", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [261.8680419921875, 552.3768310546875, 276.3487854003906, 560.75146484375], "spans": [[3, 5]], "text": "77.2", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 3, "row-header": false, "row-span": [3, 4]}], [{"bbox": [67.66300201416016, 541.4178466796875, 98.1756591796875, 549.79248046875], "spans": [[4, 0]], "text": "Formula", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 4, "row-header": true, "row-span": [4, 5]}, {"bbox": [135.32400512695312, 541.4178466796875, 155.0321502685547, 549.79248046875], "spans": [[4, 1]], "text": "83-85", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [167.95399475097656, 541.4178466796875, 182.43472290039062, 549.79248046875], "spans": [[4, 2]], "text": "60.1", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [194.04620361328125, 541.4178466796875, 208.52694702148438, 549.79248046875], "spans": [[4, 3]], "text": "63.4", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [226.8632354736328, 541.4178466796875, 241.34396362304688, 549.79248046875], "spans": [[4, 4]], "text": "63.5", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [261.8680419921875, 541.4178466796875, 276.3487854003906, 549.79248046875], "spans": [[4, 5]], "text": "66.2", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 4, "row-header": false, "row-span": [4, 5]}], [{"bbox": [67.66300201416016, 530.4588012695312, 100.54279327392578, 538.8334350585938], "spans": [[5, 0]], "text": "List-item", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 5, "row-header": true, "row-span": [5, 6]}, {"bbox": [135.32400512695312, 530.4588012695312, 155.0321502685547, 538.8334350585938], "spans": [[5, 1]], "text": "87-88", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [167.95399475097656, 530.4588012695312, 182.43472290039062, 538.8334350585938], "spans": [[5, 2]], "text": "81.2", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [194.04620361328125, 530.4588012695312, 208.52694702148438, 538.8334350585938], "spans": [[5, 3]], "text": "80.8", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [226.8632354736328, 530.4588012695312, 241.34396362304688, 538.8334350585938], "spans": [[5, 4]], "text": "81.0", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [261.8680419921875, 530.4588012695312, 276.3487854003906, 538.8334350585938], "spans": [[5, 5]], "text": "86.2", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 5, "row-header": false, "row-span": [5, 6]}], [{"bbox": [67.66300201416016, 519.4998168945312, 110.19064331054688, 527.8744506835938], "spans": [[6, 0]], "text": "Page-footer", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 6, "row-header": true, "row-span": [6, 7]}, {"bbox": [135.32400512695312, 519.4998168945312, 155.0321502685547, 527.8744506835938], "spans": [[6, 1]], "text": "93-94", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [167.95399475097656, 519.4998168945312, 182.43472290039062, 527.8744506835938], "spans": [[6, 2]], "text": "61.6", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [194.04620361328125, 519.4998168945312, 208.52694702148438, 527.8744506835938], "spans": [[6, 3]], "text": "59.3", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [226.8632354736328, 519.4998168945312, 241.34396362304688, 527.8744506835938], "spans": [[6, 4]], "text": "58.9", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [261.8680419921875, 519.4998168945312, 276.3487854003906, 527.8744506835938], "spans": [[6, 5]], "text": "61.1", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 6, "row-header": false, "row-span": [6, 7]}], [{"bbox": [67.66300201416016, 508.54083251953125, 112.94332122802734, 516.9154663085938], "spans": [[7, 0]], "text": "Page-header", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 7, "row-header": true, "row-span": [7, 8]}, {"bbox": [135.32400512695312, 508.54083251953125, 155.0321502685547, 516.9154663085938], "spans": [[7, 1]], "text": "85-89", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 7, "row-header": false, "row-span": [7, 8]}, {"bbox": [167.95399475097656, 508.54083251953125, 182.43472290039062, 516.9154663085938], "spans": [[7, 2]], "text": "71.9", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 7, "row-header": false, "row-span": [7, 8]}, {"bbox": [194.04620361328125, 508.54083251953125, 208.52694702148438, 516.9154663085938], "spans": [[7, 3]], "text": "70.0", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 7, "row-header": false, "row-span": [7, 8]}, {"bbox": [226.8632354736328, 508.54083251953125, 241.34396362304688, 516.9154663085938], "spans": [[7, 4]], "text": "72.0", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 7, "row-header": false, "row-span": [7, 8]}, {"bbox": [261.8680419921875, 508.54083251953125, 276.3487854003906, 516.9154663085938], "spans": [[7, 5]], "text": "67.9", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 7, "row-header": false, "row-span": [7, 8]}], [{"bbox": [67.66300201416016, 497.5818176269531, 93.64762878417969, 505.9564514160156], "spans": [[8, 0]], "text": "Picture", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 8, "row-header": true, "row-span": [8, 9]}, {"bbox": [135.32400512695312, 497.5818176269531, 155.0321502685547, 505.9564514160156], "spans": [[8, 1]], "text": "69-71", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 8, "row-header": false, "row-span": [8, 9]}, {"bbox": [167.95399475097656, 497.5818176269531, 182.43472290039062, 505.9564514160156], "spans": [[8, 2]], "text": "71.7", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 8, "row-header": false, "row-span": [8, 9]}, {"bbox": [194.04620361328125, 497.5818176269531, 208.52694702148438, 505.9564514160156], "spans": [[8, 3]], "text": "72.7", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 8, "row-header": false, "row-span": [8, 9]}, {"bbox": [226.8632354736328, 497.5818176269531, 241.34396362304688, 505.9564514160156], "spans": [[8, 4]], "text": "72.0", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 8, "row-header": false, "row-span": [8, 9]}, {"bbox": [261.8680419921875, 497.5818176269531, 276.3487854003906, 505.9564514160156], "spans": [[8, 5]], "text": "77.1", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 8, "row-header": false, "row-span": [8, 9]}], [{"bbox": [67.66300201416016, 486.6228332519531, 122.40287780761719, 494.9974670410156], "spans": [[9, 0]], "text": "Section-header", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 9, "row-header": true, "row-span": [9, 10]}, {"bbox": [135.32400512695312, 486.6228332519531, 155.0321502685547, 494.9974670410156], "spans": [[9, 1]], "text": "83-84", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 9, "row-header": false, "row-span": [9, 10]}, {"bbox": [167.95399475097656, 486.6228332519531, 182.43472290039062, 494.9974670410156], "spans": [[9, 2]], "text": "67.6", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 9, "row-header": false, "row-span": [9, 10]}, {"bbox": [194.04620361328125, 486.6228332519531, 208.52694702148438, 494.9974670410156], "spans": [[9, 3]], "text": "69.3", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 9, "row-header": false, "row-span": [9, 10]}, {"bbox": [226.8632354736328, 486.6228332519531, 241.34396362304688, 494.9974670410156], "spans": [[9, 4]], "text": "68.4", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 9, "row-header": false, "row-span": [9, 10]}, {"bbox": [261.8680419921875, 486.6228332519531, 276.3487854003906, 494.9974670410156], "spans": [[9, 5]], "text": "74.6", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 9, "row-header": false, "row-span": [9, 10]}], [{"bbox": [67.66300201416016, 475.663818359375, 87.46977996826172, 484.0384521484375], "spans": [[10, 0]], "text": "Table", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 10, "row-header": true, "row-span": [10, 11]}, {"bbox": [135.32400512695312, 475.663818359375, 155.0321502685547, 484.0384521484375], "spans": [[10, 1]], "text": "77-81", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 10, "row-header": false, "row-span": [10, 11]}, {"bbox": [167.95399475097656, 475.663818359375, 182.43472290039062, 484.0384521484375], "spans": [[10, 2]], "text": "82.2", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 10, "row-header": false, "row-span": [10, 11]}, {"bbox": [194.04620361328125, 475.663818359375, 208.52694702148438, 484.0384521484375], "spans": [[10, 3]], "text": "82.9", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 10, "row-header": false, "row-span": [10, 11]}, {"bbox": [226.8632354736328, 475.663818359375, 241.34396362304688, 484.0384521484375], "spans": [[10, 4]], "text": "82.2", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 10, "row-header": false, "row-span": [10, 11]}, {"bbox": [261.8680419921875, 475.663818359375, 276.3487854003906, 484.0384521484375], "spans": [[10, 5]], "text": "86.3", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 10, "row-header": false, "row-span": [10, 11]}], [{"bbox": [67.66300201416016, 464.7058410644531, 83.62319946289062, 473.0804748535156], "spans": [[11, 0]], "text": "Text", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 11, "row-header": true, "row-span": [11, 12]}, {"bbox": [135.32400512695312, 464.7058410644531, 155.0321502685547, 473.0804748535156], "spans": [[11, 1]], "text": "84-86", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 11, "row-header": false, "row-span": [11, 12]}, {"bbox": [167.95399475097656, 464.7058410644531, 182.43472290039062, 473.0804748535156], "spans": [[11, 2]], "text": "84.6", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 11, "row-header": false, "row-span": [11, 12]}, {"bbox": [194.04620361328125, 464.7058410644531, 208.52694702148438, 473.0804748535156], "spans": [[11, 3]], "text": "85.8", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 11, "row-header": false, "row-span": [11, 12]}, {"bbox": [226.8632354736328, 464.7058410644531, 241.34396362304688, 473.0804748535156], "spans": [[11, 4]], "text": "85.4", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 11, "row-header": false, "row-span": [11, 12]}, {"bbox": [261.8680419921875, 464.7058410644531, 276.3487854003906, 473.0804748535156], "spans": [[11, 5]], "text": "88.1", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 11, "row-header": false, "row-span": [11, 12]}], [{"bbox": [67.66300201416016, 453.746826171875, 84.65432739257812, 462.1214599609375], "spans": [[12, 0]], "text": "Title", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 12, "row-header": true, "row-span": [12, 13]}, {"bbox": [135.32400512695312, 453.746826171875, 155.0321502685547, 462.1214599609375], "spans": [[12, 1]], "text": "60-72", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 12, "row-header": false, "row-span": [12, 13]}, {"bbox": [167.95399475097656, 453.746826171875, 182.43472290039062, 462.1214599609375], "spans": [[12, 2]], "text": "76.7", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 12, "row-header": false, "row-span": [12, 13]}, {"bbox": [194.04620361328125, 453.746826171875, 208.52694702148438, 462.1214599609375], "spans": [[12, 3]], "text": "80.4", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 12, "row-header": false, "row-span": [12, 13]}, {"bbox": [226.8632354736328, 453.746826171875, 241.34396362304688, 462.1214599609375], "spans": [[12, 4]], "text": "79.9", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 12, "row-header": false, "row-span": [12, 13]}, {"bbox": [261.8680419921875, 453.746826171875, 276.3487854003906, 462.1214599609375], "spans": [[12, 5]], "text": "82.7", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 12, "row-header": false, "row-span": [12, 13]}], [{"bbox": [67.66300201416016, 442.3888244628906, 78.62890625, 450.7634582519531], "spans": [[13, 0]], "text": "All", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 13, "row-header": true, "row-span": [13, 14]}, {"bbox": [135.32400512695312, 442.3888244628906, 155.0321502685547, 450.7634582519531], "spans": [[13, 1]], "text": "82-83", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 13, "row-header": false, "row-span": [13, 14]}, {"bbox": [167.95399475097656, 442.3888244628906, 182.43472290039062, 450.7634582519531], "spans": [[13, 2]], "text": "72.4", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 13, "row-header": false, "row-span": [13, 14]}, {"bbox": [194.04620361328125, 442.3888244628906, 208.52694702148438, 450.7634582519531], "spans": [[13, 3]], "text": "73.5", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 13, "row-header": false, "row-span": [13, 14]}, {"bbox": [226.8632354736328, 442.3888244628906, 241.34396362304688, 450.7634582519531], "spans": [[13, 4]], "text": "73.4", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 13, "row-header": false, "row-span": [13, 14]}, {"bbox": [261.8680419921875, 442.3888244628906, 276.3487854003906, 450.7634582519531], "spans": [[13, 5]], "text": "76.8", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 13, "row-header": false, "row-span": [13, 14]}]], "model": null, "bounding-box": null}, {"prov": [{"bbox": [80.35525512695312, 496.5545349121094, 267.0082092285156, 641.063720703125], "page": 7, "span": [0, 0], "__ref_s3_data": null}], "text": "Table 4: Performance of a Mask R-CNN R50 network with document-wise and page-wise split for different label sets. Naive page-wise split will result in GLYPH<tildelow> 10% point improvement.", "type": "table", "payload": null, "#-cols": 5, "#-rows": 13, "data": [[{"bbox": [86.37200164794922, 630.5248413085938, 129.4645233154297, 638.8994750976562], "spans": [[0, 0]], "text": "Class-count", "type": "col_header", "col": 0, "col-header": true, "col-span": [0, 1], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [151.07400512695312, 630.5248413085938, 159.41275024414062, 638.8994750976562], "spans": [[0, 1]], "text": "11", "type": "col_header", "col": 1, "col-header": true, "col-span": [1, 2], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [179.3181610107422, 630.5248413085938, 183.48753356933594, 638.8994750976562], "spans": [[0, 2]], "text": "6", "type": "col_header", "col": 2, "col-header": true, "col-span": [2, 3], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [213.33668518066406, 630.5248413085938, 217.5060577392578, 638.8994750976562], "spans": [[0, 3]], "text": "5", "type": "col_header", "col": 3, "col-header": true, "col-span": [3, 4], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [247.35520935058594, 630.5248413085938, 251.5245819091797, 638.8994750976562], "spans": [[0, 4]], "text": "4", "type": "col_header", "col": 4, "col-header": true, "col-span": [4, 5], "row": 0, "row-header": false, "row-span": [0, 1]}], [{"bbox": [86.37200164794922, 619.1678466796875, 115.55763244628906, 627.54248046875], "spans": [[1, 0]], "text": "Caption", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 1, "row-header": true, "row-span": [1, 2]}, {"bbox": [151.07400512695312, 619.1678466796875, 159.41275024414062, 627.54248046875], "spans": [[1, 1]], "text": "68", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [173.42723083496094, 619.1678466796875, 189.38742065429688, 627.54248046875], "spans": [[1, 2]], "text": "Text", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [207.4457550048828, 619.1678466796875, 223.40594482421875, 627.54248046875], "spans": [[1, 3]], "text": "Text", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [241.4642791748047, 619.1678466796875, 257.4244689941406, 627.54248046875], "spans": [[1, 4]], "text": "Text", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 1, "row-header": false, "row-span": [1, 2]}], [{"bbox": [86.37200164794922, 608.2088012695312, 118.87519836425781, 616.5834350585938], "spans": [[2, 0]], "text": "Footnote", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 2, "row-header": true, "row-span": [2, 3]}, {"bbox": [151.07400512695312, 608.2088012695312, 159.41275024414062, 616.5834350585938], "spans": [[2, 1]], "text": "71", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [173.42723083496094, 608.2088012695312, 189.38742065429688, 616.5834350585938], "spans": [[2, 2]], "text": "Text", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [207.4457550048828, 608.2088012695312, 223.40594482421875, 616.5834350585938], "spans": [[2, 3]], "text": "Text", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [241.4642791748047, 608.2088012695312, 257.4244689941406, 616.5834350585938], "spans": [[2, 4]], "text": "Text", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 2, "row-header": false, "row-span": [2, 3]}], [{"bbox": [86.37200164794922, 597.2498168945312, 116.88465881347656, 605.6244506835938], "spans": [[3, 0]], "text": "Formula", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 3, "row-header": true, "row-span": [3, 4]}, {"bbox": [151.07400512695312, 597.2498168945312, 159.41275024414062, 605.6244506835938], "spans": [[3, 1]], "text": "60", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [173.42723083496094, 597.2498168945312, 189.38742065429688, 605.6244506835938], "spans": [[3, 2]], "text": "Text", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [207.4457550048828, 597.2498168945312, 223.40594482421875, 605.6244506835938], "spans": [[3, 3]], "text": "Text", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [241.4642791748047, 597.2498168945312, 257.4244689941406, 605.6244506835938], "spans": [[3, 4]], "text": "Text", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 3, "row-header": false, "row-span": [3, 4]}], [{"bbox": [86.37200164794922, 586.2908325195312, 119.25179290771484, 594.6654663085938], "spans": [[4, 0]], "text": "List-item", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 4, "row-header": true, "row-span": [4, 5]}, {"bbox": [151.07400512695312, 586.2908325195312, 159.41275024414062, 594.6654663085938], "spans": [[4, 1]], "text": "81", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [173.42723083496094, 586.2908325195312, 189.38742065429688, 594.6654663085938], "spans": [[4, 2]], "text": "Text", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [211.2564697265625, 586.2908325195312, 219.59521484375, 594.6654663085938], "spans": [[4, 3]], "text": "82", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [241.46426391601562, 586.2908325195312, 257.4244689941406, 594.6654663085938], "spans": [[4, 4]], "text": "Text", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 4, "row-header": false, "row-span": [4, 5]}], [{"bbox": [86.37200164794922, 575.3318481445312, 128.89964294433594, 583.7064819335938], "spans": [[5, 0]], "text": "Page-footer", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 5, "row-header": true, "row-span": [5, 6]}, {"bbox": [151.07400512695312, 575.3318481445312, 159.41275024414062, 583.7064819335938], "spans": [[5, 1]], "text": "62", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [177.23794555664062, 575.3318481445312, 185.57669067382812, 583.7064819335938], "spans": [[5, 2]], "text": "62", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [213.9105224609375, 575.3318481445312, 216.941162109375, 583.7064819335938], "spans": [[5, 3]], "text": "-", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [247.92904663085938, 575.3318481445312, 250.95968627929688, 583.7064819335938], "spans": [[5, 4]], "text": "-", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 5, "row-header": false, "row-span": [5, 6]}], [{"bbox": [86.37200164794922, 564.372802734375, 131.65231323242188, 572.7474365234375], "spans": [[6, 0]], "text": "Page-header", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 6, "row-header": true, "row-span": [6, 7]}, {"bbox": [151.07400512695312, 564.372802734375, 159.41275024414062, 572.7474365234375], "spans": [[6, 1]], "text": "72", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [177.23794555664062, 564.372802734375, 185.57669067382812, 572.7474365234375], "spans": [[6, 2]], "text": "68", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [213.9105224609375, 564.372802734375, 216.941162109375, 572.7474365234375], "spans": [[6, 3]], "text": "-", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [247.92904663085938, 564.372802734375, 250.95968627929688, 572.7474365234375], "spans": [[6, 4]], "text": "-", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 6, "row-header": false, "row-span": [6, 7]}], [{"bbox": [86.37200164794922, 553.413818359375, 112.35662841796875, 561.7884521484375], "spans": [[7, 0]], "text": "Picture", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 7, "row-header": true, "row-span": [7, 8]}, {"bbox": [151.07400512695312, 553.413818359375, 159.41275024414062, 561.7884521484375], "spans": [[7, 1]], "text": "72", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 7, "row-header": false, "row-span": [7, 8]}, {"bbox": [177.23794555664062, 553.413818359375, 185.57669067382812, 561.7884521484375], "spans": [[7, 2]], "text": "72", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 7, "row-header": false, "row-span": [7, 8]}, {"bbox": [211.25645446777344, 553.413818359375, 219.59519958496094, 561.7884521484375], "spans": [[7, 3]], "text": "72", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 7, "row-header": false, "row-span": [7, 8]}, {"bbox": [245.27496337890625, 553.413818359375, 253.61370849609375, 561.7884521484375], "spans": [[7, 4]], "text": "72", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 7, "row-header": false, "row-span": [7, 8]}], [{"bbox": [86.37200164794922, 542.455810546875, 141.11187744140625, 550.8304443359375], "spans": [[8, 0]], "text": "Section-header", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 8, "row-header": true, "row-span": [8, 9]}, {"bbox": [151.07400512695312, 542.455810546875, 159.41275024414062, 550.8304443359375], "spans": [[8, 1]], "text": "68", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 8, "row-header": false, "row-span": [8, 9]}, {"bbox": [177.23794555664062, 542.455810546875, 185.57669067382812, 550.8304443359375], "spans": [[8, 2]], "text": "67", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 8, "row-header": false, "row-span": [8, 9]}, {"bbox": [211.25645446777344, 542.455810546875, 219.59519958496094, 550.8304443359375], "spans": [[8, 3]], "text": "69", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 8, "row-header": false, "row-span": [8, 9]}, {"bbox": [245.27496337890625, 542.455810546875, 253.61370849609375, 550.8304443359375], "spans": [[8, 4]], "text": "68", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 8, "row-header": false, "row-span": [8, 9]}], [{"bbox": [86.37200164794922, 531.496826171875, 106.17877960205078, 539.8714599609375], "spans": [[9, 0]], "text": "Table", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 9, "row-header": true, "row-span": [9, 10]}, {"bbox": [151.07400512695312, 531.496826171875, 159.41275024414062, 539.8714599609375], "spans": [[9, 1]], "text": "82", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 9, "row-header": false, "row-span": [9, 10]}, {"bbox": [177.23794555664062, 531.496826171875, 185.57669067382812, 539.8714599609375], "spans": [[9, 2]], "text": "83", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 9, "row-header": false, "row-span": [9, 10]}, {"bbox": [211.25645446777344, 531.496826171875, 219.59519958496094, 539.8714599609375], "spans": [[9, 3]], "text": "82", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 9, "row-header": false, "row-span": [9, 10]}, {"bbox": [245.27496337890625, 531.496826171875, 253.61370849609375, 539.8714599609375], "spans": [[9, 4]], "text": "82", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 9, "row-header": false, "row-span": [9, 10]}], [{"bbox": [86.37200164794922, 520.537841796875, 102.33219909667969, 528.9124755859375], "spans": [[10, 0]], "text": "Text", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 10, "row-header": true, "row-span": [10, 11]}, {"bbox": [151.07400512695312, 520.537841796875, 159.41275024414062, 528.9124755859375], "spans": [[10, 1]], "text": "85", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 10, "row-header": false, "row-span": [10, 11]}, {"bbox": [177.23794555664062, 520.537841796875, 185.57669067382812, 528.9124755859375], "spans": [[10, 2]], "text": "84", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 10, "row-header": false, "row-span": [10, 11]}, {"bbox": [211.25645446777344, 520.537841796875, 219.59519958496094, 528.9124755859375], "spans": [[10, 3]], "text": "84", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 10, "row-header": false, "row-span": [10, 11]}, {"bbox": [245.27496337890625, 520.537841796875, 253.61370849609375, 528.9124755859375], "spans": [[10, 4]], "text": "84", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 10, "row-header": false, "row-span": [10, 11]}], [{"bbox": [86.37200164794922, 509.5788269042969, 103.36332702636719, 517.9534301757812], "spans": [[11, 0]], "text": "Title", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 11, "row-header": true, "row-span": [11, 12]}, {"bbox": [151.07400512695312, 509.5788269042969, 159.41275024414062, 517.9534301757812], "spans": [[11, 1]], "text": "77", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 11, "row-header": false, "row-span": [11, 12]}, {"bbox": [169.37442016601562, 509.5788269042969, 193.4312744140625, 517.9534301757812], "spans": [[11, 2]], "text": "Sec.-h.", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 11, "row-header": false, "row-span": [11, 12]}, {"bbox": [203.3929443359375, 509.5788269042969, 227.44979858398438, 517.9534301757812], "spans": [[11, 3]], "text": "Sec.-h.", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 11, "row-header": false, "row-span": [11, 12]}, {"bbox": [237.41146850585938, 509.5788269042969, 261.46832275390625, 517.9534301757812], "spans": [[11, 4]], "text": "Sec.-h.", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 11, "row-header": false, "row-span": [11, 12]}], [{"bbox": [86.37200164794922, 498.2208251953125, 113.3160171508789, 506.595458984375], "spans": [[12, 0]], "text": "Overall", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 12, "row-header": true, "row-span": [12, 13]}, {"bbox": [151.07400512695312, 498.2208251953125, 159.41275024414062, 506.595458984375], "spans": [[12, 1]], "text": "72", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 12, "row-header": false, "row-span": [12, 13]}, {"bbox": [177.23794555664062, 498.2208251953125, 185.57669067382812, 506.595458984375], "spans": [[12, 2]], "text": "73", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 12, "row-header": false, "row-span": [12, 13]}, {"bbox": [211.25645446777344, 498.2208251953125, 219.59519958496094, 506.595458984375], "spans": [[12, 3]], "text": "78", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 12, "row-header": false, "row-span": [12, 13]}, {"bbox": [245.27496337890625, 498.2208251953125, 253.61370849609375, 506.595458984375], "spans": [[12, 4]], "text": "77", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 12, "row-header": false, "row-span": [12, 13]}]], "model": null, "bounding-box": null}, {"prov": [{"bbox": [352.97747802734375, 485.734130859375, 522.9158935546875, 641.208740234375], "page": 7, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "table", "payload": null, "#-cols": 5, "#-rows": 14, "data": [[{"bbox": [358.6390075683594, 630.5248413085938, 401.7315368652344, 638.8994750976562], "spans": [[0, 0]], "text": "Class-count", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [440.2250061035156, 630.5248413085938, 448.5637512207031, 638.8994750976562], "spans": [[0, 1], [0, 2]], "text": "11", "type": "col_header", "col": 1, "col-header": true, "col-span": [1, 3], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [440.2250061035156, 630.5248413085938, 448.5637512207031, 638.8994750976562], "spans": [[0, 1], [0, 2]], "text": "11", "type": "col_header", "col": 2, "col-header": true, "col-span": [1, 3], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [494.3800048828125, 630.5248413085938, 498.54937744140625, 638.8994750976562], "spans": [[0, 3], [0, 4]], "text": "5", "type": "col_header", "col": 3, "col-header": true, "col-span": [3, 5], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [494.3800048828125, 630.5248413085938, 498.54937744140625, 638.8994750976562], "spans": [[0, 3], [0, 4]], "text": "5", "type": "col_header", "col": 4, "col-header": true, "col-span": [3, 5], "row": 0, "row-header": false, "row-span": [0, 1]}], [{"bbox": [358.6390075683594, 619.5658569335938, 375.27166748046875, 627.9404907226562], "spans": [[1, 0]], "text": "Split", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [423.34100341796875, 619.5658569335938, 438.0458984375, 627.9404907226562], "spans": [[1, 1]], "text": "Doc", "type": "col_header", "col": 1, "col-header": true, "col-span": [1, 2], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [448.007568359375, 619.5658569335938, 465.44720458984375, 627.9404907226562], "spans": [[1, 2]], "text": "Page", "type": "col_header", "col": 2, "col-header": true, "col-span": [2, 3], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [475.4110107421875, 619.5658569335938, 490.11590576171875, 627.9404907226562], "spans": [[1, 3]], "text": "Doc", "type": "col_header", "col": 3, "col-header": true, "col-span": [3, 4], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [500.07757568359375, 619.5658569335938, 517.5172119140625, 627.9404907226562], "spans": [[1, 4]], "text": "Page", "type": "col_header", "col": 4, "col-header": true, "col-span": [4, 5], "row": 1, "row-header": false, "row-span": [1, 2]}], [{"bbox": [358.6390075683594, 608.2088012695312, 387.82464599609375, 616.5834350585938], "spans": [[2, 0]], "text": "Caption", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 2, "row-header": true, "row-span": [2, 3]}, {"bbox": [426.52398681640625, 608.2088012695312, 434.86273193359375, 616.5834350585938], "spans": [[2, 1]], "text": "68", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [452.5624084472656, 608.2088012695312, 460.9011535644531, 616.5834350585938], "spans": [[2, 2]], "text": "83", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": null, "spans": [[2, 3]], "text": "", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": null, "spans": [[2, 4]], "text": "", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 2, "row-header": false, "row-span": [2, 3]}], [{"bbox": [358.6390075683594, 597.2498168945312, 391.1422119140625, 605.6244506835938], "spans": [[3, 0]], "text": "Footnote", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 3, "row-header": true, "row-span": [3, 4]}, {"bbox": [426.52398681640625, 597.2498168945312, 434.86273193359375, 605.6244506835938], "spans": [[3, 1]], "text": "71", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [452.5624084472656, 597.2498168945312, 460.9011535644531, 605.6244506835938], "spans": [[3, 2]], "text": "84", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": null, "spans": [[3, 3]], "text": "", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": null, "spans": [[3, 4]], "text": "", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 3, "row-header": false, "row-span": [3, 4]}], [{"bbox": [358.6390075683594, 586.2908325195312, 389.15167236328125, 594.6654663085938], "spans": [[4, 0]], "text": "Formula", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 4, "row-header": true, "row-span": [4, 5]}, {"bbox": [426.52398681640625, 586.2908325195312, 434.86273193359375, 594.6654663085938], "spans": [[4, 1]], "text": "60", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [452.5624084472656, 586.2908325195312, 460.9011535644531, 594.6654663085938], "spans": [[4, 2]], "text": "66", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": null, "spans": [[4, 3]], "text": "", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": null, "spans": [[4, 4]], "text": "", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 4, "row-header": false, "row-span": [4, 5]}], [{"bbox": [358.6390075683594, 575.3318481445312, 391.518798828125, 583.7064819335938], "spans": [[5, 0]], "text": "List-item", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 5, "row-header": true, "row-span": [5, 6]}, {"bbox": [426.52398681640625, 575.3318481445312, 434.86273193359375, 583.7064819335938], "spans": [[5, 1]], "text": "81", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [452.5624084472656, 575.3318481445312, 460.9011535644531, 583.7064819335938], "spans": [[5, 2]], "text": "88", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [478.593994140625, 575.3318481445312, 486.9327392578125, 583.7064819335938], "spans": [[5, 3]], "text": "82", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [504.6324157714844, 575.3318481445312, 512.97119140625, 583.7064819335938], "spans": [[5, 4]], "text": "88", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 5, "row-header": false, "row-span": [5, 6]}], [{"bbox": [358.6390075683594, 564.372802734375, 401.1666564941406, 572.7474365234375], "spans": [[6, 0]], "text": "Page-footer", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 6, "row-header": true, "row-span": [6, 7]}, {"bbox": [426.52398681640625, 564.372802734375, 434.86273193359375, 572.7474365234375], "spans": [[6, 1]], "text": "62", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [452.5624084472656, 564.372802734375, 460.9011535644531, 572.7474365234375], "spans": [[6, 2]], "text": "89", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": null, "spans": [[6, 3]], "text": "", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": null, "spans": [[6, 4]], "text": "", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 6, "row-header": false, "row-span": [6, 7]}], [{"bbox": [358.6390075683594, 553.413818359375, 403.9193115234375, 561.7884521484375], "spans": [[7, 0]], "text": "Page-header", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 7, "row-header": true, "row-span": [7, 8]}, {"bbox": [426.52398681640625, 553.413818359375, 434.86273193359375, 561.7884521484375], "spans": [[7, 1]], "text": "72", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 7, "row-header": false, "row-span": [7, 8]}, {"bbox": [452.5624084472656, 553.413818359375, 460.9011535644531, 561.7884521484375], "spans": [[7, 2]], "text": "90", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 7, "row-header": false, "row-span": [7, 8]}, {"bbox": null, "spans": [[7, 3]], "text": "", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 7, "row-header": false, "row-span": [7, 8]}, {"bbox": null, "spans": [[7, 4]], "text": "", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 7, "row-header": false, "row-span": [7, 8]}], [{"bbox": [358.6390075683594, 542.455810546875, 384.6236572265625, 550.8304443359375], "spans": [[8, 0]], "text": "Picture", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 8, "row-header": true, "row-span": [8, 9]}, {"bbox": [426.52398681640625, 542.455810546875, 434.86273193359375, 550.8304443359375], "spans": [[8, 1]], "text": "72", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 8, "row-header": false, "row-span": [8, 9]}, {"bbox": [452.5624084472656, 542.455810546875, 460.9011535644531, 550.8304443359375], "spans": [[8, 2]], "text": "82", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 8, "row-header": false, "row-span": [8, 9]}, {"bbox": [478.593994140625, 542.455810546875, 486.9327392578125, 550.8304443359375], "spans": [[8, 3]], "text": "72", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 8, "row-header": false, "row-span": [8, 9]}, {"bbox": [504.6324157714844, 542.455810546875, 512.97119140625, 550.8304443359375], "spans": [[8, 4]], "text": "82", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 8, "row-header": false, "row-span": [8, 9]}], [{"bbox": [358.6390075683594, 531.496826171875, 413.37890625, 539.8714599609375], "spans": [[9, 0]], "text": "Section-header", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 9, "row-header": true, "row-span": [9, 10]}, {"bbox": [426.52398681640625, 531.496826171875, 434.86273193359375, 539.8714599609375], "spans": [[9, 1]], "text": "68", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 9, "row-header": false, "row-span": [9, 10]}, {"bbox": [452.5624084472656, 531.496826171875, 460.9011535644531, 539.8714599609375], "spans": [[9, 2]], "text": "83", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 9, "row-header": false, "row-span": [9, 10]}, {"bbox": [478.593994140625, 531.496826171875, 486.9327392578125, 539.8714599609375], "spans": [[9, 3]], "text": "69", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 9, "row-header": false, "row-span": [9, 10]}, {"bbox": [504.6324157714844, 531.496826171875, 512.97119140625, 539.8714599609375], "spans": [[9, 4]], "text": "83", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 9, "row-header": false, "row-span": [9, 10]}], [{"bbox": [358.6390075683594, 520.537841796875, 378.4457702636719, 528.9124755859375], "spans": [[10, 0]], "text": "Table", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 10, "row-header": true, "row-span": [10, 11]}, {"bbox": [426.52398681640625, 520.537841796875, 434.86273193359375, 528.9124755859375], "spans": [[10, 1]], "text": "82", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 10, "row-header": false, "row-span": [10, 11]}, {"bbox": [452.5624084472656, 520.537841796875, 460.9011535644531, 528.9124755859375], "spans": [[10, 2]], "text": "89", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 10, "row-header": false, "row-span": [10, 11]}, {"bbox": [478.593994140625, 520.537841796875, 486.9327392578125, 528.9124755859375], "spans": [[10, 3]], "text": "82", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 10, "row-header": false, "row-span": [10, 11]}, {"bbox": [504.6324157714844, 520.537841796875, 512.97119140625, 528.9124755859375], "spans": [[10, 4]], "text": "90", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 10, "row-header": false, "row-span": [10, 11]}], [{"bbox": [358.6390075683594, 509.5788269042969, 374.5992126464844, 517.9534301757812], "spans": [[11, 0]], "text": "Text", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 11, "row-header": true, "row-span": [11, 12]}, {"bbox": [426.52398681640625, 509.5788269042969, 434.86273193359375, 517.9534301757812], "spans": [[11, 1]], "text": "85", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 11, "row-header": false, "row-span": [11, 12]}, {"bbox": [452.5624084472656, 509.5788269042969, 460.9011535644531, 517.9534301757812], "spans": [[11, 2]], "text": "91", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 11, "row-header": false, "row-span": [11, 12]}, {"bbox": [478.593994140625, 509.5788269042969, 486.9327392578125, 517.9534301757812], "spans": [[11, 3]], "text": "84", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 11, "row-header": false, "row-span": [11, 12]}, {"bbox": [504.6324157714844, 509.5788269042969, 512.97119140625, 517.9534301757812], "spans": [[11, 4]], "text": "90", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 11, "row-header": false, "row-span": [11, 12]}], [{"bbox": [358.6390075683594, 498.6198425292969, 375.6303405761719, 506.9944763183594], "spans": [[12, 0]], "text": "Title", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 12, "row-header": true, "row-span": [12, 13]}, {"bbox": [426.52398681640625, 498.6198425292969, 434.86273193359375, 506.9944763183594], "spans": [[12, 1]], "text": "77", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 12, "row-header": false, "row-span": [12, 13]}, {"bbox": [452.5624084472656, 498.6198425292969, 460.9011535644531, 506.9944763183594], "spans": [[12, 2]], "text": "81", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 12, "row-header": false, "row-span": [12, 13]}, {"bbox": null, "spans": [[12, 3]], "text": "", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 12, "row-header": false, "row-span": [12, 13]}, {"bbox": null, "spans": [[12, 4]], "text": "", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 12, "row-header": false, "row-span": [12, 13]}], [{"bbox": [358.6390075683594, 487.2628173828125, 369.60491943359375, 495.637451171875], "spans": [[13, 0]], "text": "All", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 13, "row-header": true, "row-span": [13, 14]}, {"bbox": [426.52398681640625, 487.2628173828125, 434.86273193359375, 495.637451171875], "spans": [[13, 1]], "text": "72", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 13, "row-header": false, "row-span": [13, 14]}, {"bbox": [452.5624084472656, 487.2628173828125, 460.9011535644531, 495.637451171875], "spans": [[13, 2]], "text": "84", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 13, "row-header": false, "row-span": [13, 14]}, {"bbox": [478.593994140625, 487.2628173828125, 486.9327392578125, 495.637451171875], "spans": [[13, 3]], "text": "78", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 13, "row-header": false, "row-span": [13, 14]}, {"bbox": [504.6324157714844, 487.2628173828125, 512.97119140625, 495.637451171875], "spans": [[13, 4]], "text": "87", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 13, "row-header": false, "row-span": [13, 14]}]], "model": null, "bounding-box": null}, {"prov": [{"bbox": [72.6590347290039, 452.1459655761719, 274.83465576171875, 619.5191650390625], "page": 8, "span": [0, 0], "__ref_s3_data": null}], "text": "Table 5: Prediction Performance (mAP@0.5-0.95) of a Mask R-CNN R50 network across the PubLayNet, DocBank & DocLayNet data-sets. By evaluating on common label classes of each dataset, we observe that the DocLayNet-trained model has much less pronounced variations in performance across all datasets.", "type": "table", "payload": null, "#-cols": 5, "#-rows": 15, "data": [[{"bbox": null, "spans": [[0, 0]], "text": "", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": null, "spans": [[0, 1]], "text": "", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [217.74099731445312, 608.6068115234375, 256.2606506347656, 616.9814453125], "spans": [[0, 2], [0, 3], [0, 4]], "text": "Testing on", "type": "col_header", "col": 2, "col-header": true, "col-span": [2, 5], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [217.74099731445312, 608.6068115234375, 256.2606506347656, 616.9814453125], "spans": [[0, 2], [0, 3], [0, 4]], "text": "Testing on", "type": "col_header", "col": 3, "col-header": true, "col-span": [2, 5], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [217.74099731445312, 608.6068115234375, 256.2606506347656, 616.9814453125], "spans": [[0, 2], [0, 3], [0, 4]], "text": "Testing on", "type": "col_header", "col": 4, "col-header": true, "col-span": [2, 5], "row": 0, "row-header": false, "row-span": [0, 1]}], [{"bbox": [89.9540023803711, 597.6488037109375, 133.24378967285156, 606.0234375], "spans": [[1, 0]], "text": "Training on", "type": "col_header", "col": 0, "col-header": true, "col-span": [0, 1], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [154.62899780273438, 597.6488037109375, 175.4758758544922, 606.0234375], "spans": [[1, 1]], "text": "labels", "type": "col_header", "col": 1, "col-header": true, "col-span": [1, 2], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [204.69000244140625, 597.6488037109375, 220.5426025390625, 606.0234375], "spans": [[1, 2]], "text": "PLN", "type": "col_header", "col": 2, "col-header": true, "col-span": [2, 3], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [230.5042724609375, 597.6488037109375, 242.0619659423828, 606.0234375], "spans": [[1, 3]], "text": "DB", "type": "col_header", "col": 3, "col-header": true, "col-span": [3, 4], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [252.0236358642578, 597.6488037109375, 269.31085205078125, 606.0234375], "spans": [[1, 4]], "text": "DLN", "type": "col_header", "col": 4, "col-header": true, "col-span": [4, 5], "row": 1, "row-header": false, "row-span": [1, 2]}], [{"bbox": [78.53099822998047, 564.372802734375, 142.56005859375, 572.7474365234375], "spans": [[2, 0], [3, 0], [4, 0], [5, 0], [6, 0]], "text": "PubLayNet (PLN)", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 2, "row-header": true, "row-span": [2, 7]}, {"bbox": [154.62899780273438, 586.2908325195312, 177.9237060546875, 594.6654663085938], "spans": [[2, 1]], "text": "Figure", "type": "row_header", "col": 1, "col-header": false, "col-span": [1, 2], "row": 2, "row-header": true, "row-span": [2, 3]}, {"bbox": [208.44700622558594, 586.2908325195312, 216.78575134277344, 594.6654663085938], "spans": [[2, 2]], "text": "96", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [232.11830139160156, 586.2908325195312, 240.45704650878906, 594.6654663085938], "spans": [[2, 3]], "text": "43", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [256.4979248046875, 586.2908325195312, 264.836669921875, 594.6654663085938], "spans": [[2, 4]], "text": "23", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 2, "row-header": false, "row-span": [2, 3]}], [{"bbox": [78.53099822998047, 564.372802734375, 142.56005859375, 572.7474365234375], "spans": [[2, 0], [3, 0], [4, 0], [5, 0], [6, 0]], "text": "PubLayNet (PLN)", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 3, "row-header": true, "row-span": [2, 7]}, {"bbox": [154.62899780273438, 575.3318481445312, 194.72674560546875, 583.7064819335938], "spans": [[3, 1]], "text": "Sec-header", "type": "row_header", "col": 1, "col-header": false, "col-span": [1, 2], "row": 3, "row-header": true, "row-span": [3, 4]}, {"bbox": [208.44700622558594, 575.3318481445312, 216.78575134277344, 583.7064819335938], "spans": [[3, 2]], "text": "87", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [234.77235412597656, 575.3318481445312, 237.80299377441406, 583.7064819335938], "spans": [[3, 3]], "text": "-", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [256.4979248046875, 575.3318481445312, 264.836669921875, 583.7064819335938], "spans": [[3, 4]], "text": "32", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 3, "row-header": false, "row-span": [3, 4]}], [{"bbox": [78.53099822998047, 564.372802734375, 142.56005859375, 572.7474365234375], "spans": [[2, 0], [3, 0], [4, 0], [5, 0], [6, 0]], "text": "PubLayNet (PLN)", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 4, "row-header": true, "row-span": [2, 7]}, {"bbox": [154.62899780273438, 564.372802734375, 174.43577575683594, 572.7474365234375], "spans": [[4, 1]], "text": "Table", "type": "row_header", "col": 1, "col-header": false, "col-span": [1, 2], "row": 4, "row-header": true, "row-span": [4, 5]}, {"bbox": [208.44700622558594, 564.372802734375, 216.78575134277344, 572.7474365234375], "spans": [[4, 2]], "text": "95", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [232.11830139160156, 564.372802734375, 240.45704650878906, 572.7474365234375], "spans": [[4, 3]], "text": "24", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [256.4979248046875, 564.372802734375, 264.836669921875, 572.7474365234375], "spans": [[4, 4]], "text": "49", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 4, "row-header": false, "row-span": [4, 5]}], [{"bbox": [78.53099822998047, 564.372802734375, 142.56005859375, 572.7474365234375], "spans": [[2, 0], [3, 0], [4, 0], [5, 0], [6, 0]], "text": "PubLayNet (PLN)", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 5, "row-header": true, "row-span": [2, 7]}, {"bbox": [154.62899780273438, 553.413818359375, 170.5891876220703, 561.7884521484375], "spans": [[5, 1]], "text": "Text", "type": "row_header", "col": 1, "col-header": false, "col-span": [1, 2], "row": 5, "row-header": true, "row-span": [5, 6]}, {"bbox": [208.44700622558594, 553.413818359375, 216.78575134277344, 561.7884521484375], "spans": [[5, 2]], "text": "96", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [234.77235412597656, 553.413818359375, 237.80299377441406, 561.7884521484375], "spans": [[5, 3]], "text": "-", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [256.4979248046875, 553.413818359375, 264.836669921875, 561.7884521484375], "spans": [[5, 4]], "text": "42", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 5, "row-header": false, "row-span": [5, 6]}], [{"bbox": [78.53099822998047, 564.372802734375, 142.56005859375, 572.7474365234375], "spans": [[2, 0], [3, 0], [4, 0], [5, 0], [6, 0]], "text": "PubLayNet (PLN)", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 6, "row-header": true, "row-span": [2, 7]}, {"bbox": [154.62899780273438, 542.455810546875, 171.27960205078125, 550.8304443359375], "spans": [[6, 1]], "text": "total", "type": "row_header", "col": 1, "col-header": false, "col-span": [1, 2], "row": 6, "row-header": true, "row-span": [6, 7]}, {"bbox": [208.44700622558594, 542.455810546875, 216.78575134277344, 550.8304443359375], "spans": [[6, 2]], "text": "93", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [232.11830139160156, 542.455810546875, 240.45704650878906, 550.8304443359375], "spans": [[6, 3]], "text": "34", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [256.4979248046875, 542.455810546875, 264.836669921875, 550.8304443359375], "spans": [[6, 4]], "text": "30", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 6, "row-header": false, "row-span": [6, 7]}], [{"bbox": [78.53099822998047, 520.1388549804688, 131.1996307373047, 528.5134887695312], "spans": [[7, 0], [8, 0], [9, 0]], "text": "DocBank (DB)", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 7, "row-header": true, "row-span": [7, 10]}, {"bbox": [154.62899780273438, 531.0978393554688, 177.9237060546875, 539.4724731445312], "spans": [[7, 1]], "text": "Figure", "type": "row_header", "col": 1, "col-header": false, "col-span": [1, 2], "row": 7, "row-header": true, "row-span": [7, 8]}, {"bbox": [208.44700622558594, 531.0978393554688, 216.78575134277344, 539.4724731445312], "spans": [[7, 2]], "text": "77", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 7, "row-header": false, "row-span": [7, 8]}, {"bbox": [232.11830139160156, 531.0978393554688, 240.45704650878906, 539.4724731445312], "spans": [[7, 3]], "text": "71", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 7, "row-header": false, "row-span": [7, 8]}, {"bbox": [256.4979248046875, 531.0978393554688, 264.836669921875, 539.4724731445312], "spans": [[7, 4]], "text": "31", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 7, "row-header": false, "row-span": [7, 8]}], [{"bbox": [78.53099822998047, 520.1388549804688, 131.1996307373047, 528.5134887695312], "spans": [[7, 0], [8, 0], [9, 0]], "text": "DocBank (DB)", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 8, "row-header": true, "row-span": [7, 10]}, {"bbox": [154.62899780273438, 520.1388549804688, 174.43577575683594, 528.5134887695312], "spans": [[8, 1]], "text": "Table", "type": "row_header", "col": 1, "col-header": false, "col-span": [1, 2], "row": 8, "row-header": true, "row-span": [8, 9]}, {"bbox": [208.44700622558594, 520.1388549804688, 216.78575134277344, 528.5134887695312], "spans": [[8, 2]], "text": "19", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 8, "row-header": false, "row-span": [8, 9]}, {"bbox": [232.11830139160156, 520.1388549804688, 240.45704650878906, 528.5134887695312], "spans": [[8, 3]], "text": "65", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 8, "row-header": false, "row-span": [8, 9]}, {"bbox": [256.4979248046875, 520.1388549804688, 264.836669921875, 528.5134887695312], "spans": [[8, 4]], "text": "22", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 8, "row-header": false, "row-span": [8, 9]}], [{"bbox": [78.53099822998047, 520.1388549804688, 131.1996307373047, 528.5134887695312], "spans": [[7, 0], [8, 0], [9, 0]], "text": "DocBank (DB)", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 9, "row-header": true, "row-span": [7, 10]}, {"bbox": [154.62899780273438, 509.1798400878906, 171.27960205078125, 517.554443359375], "spans": [[9, 1]], "text": "total", "type": "row_header", "col": 1, "col-header": false, "col-span": [1, 2], "row": 9, "row-header": true, "row-span": [9, 10]}, {"bbox": [208.44700622558594, 509.1798400878906, 216.78575134277344, 517.554443359375], "spans": [[9, 2]], "text": "48", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 9, "row-header": false, "row-span": [9, 10]}, {"bbox": [232.11830139160156, 509.1798400878906, 240.45704650878906, 517.554443359375], "spans": [[9, 3]], "text": "68", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 9, "row-header": false, "row-span": [9, 10]}, {"bbox": [256.4979248046875, 509.1798400878906, 264.836669921875, 517.554443359375], "spans": [[9, 4]], "text": "27", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 9, "row-header": false, "row-span": [9, 10]}], [{"bbox": [78.53099822998047, 475.9048156738281, 144.6671600341797, 484.2794494628906], "spans": [[10, 0], [11, 0], [12, 0], [13, 0], [14, 0]], "text": "DocLayNet (DLN)", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 10, "row-header": true, "row-span": [10, 15]}, {"bbox": [154.62899780273438, 497.82281494140625, 177.9237060546875, 506.19744873046875], "spans": [[10, 1]], "text": "Figure", "type": "row_header", "col": 1, "col-header": false, "col-span": [1, 2], "row": 10, "row-header": true, "row-span": [10, 11]}, {"bbox": [208.44700622558594, 497.82281494140625, 216.78575134277344, 506.19744873046875], "spans": [[10, 2]], "text": "67", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 10, "row-header": false, "row-span": [10, 11]}, {"bbox": [232.11830139160156, 497.82281494140625, 240.45704650878906, 506.19744873046875], "spans": [[10, 3]], "text": "51", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 10, "row-header": false, "row-span": [10, 11]}, {"bbox": [256.4979248046875, 497.82281494140625, 264.836669921875, 506.19744873046875], "spans": [[10, 4]], "text": "72", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 10, "row-header": false, "row-span": [10, 11]}], [{"bbox": [78.53099822998047, 475.9048156738281, 144.6671600341797, 484.2794494628906], "spans": [[10, 0], [11, 0], [12, 0], [13, 0], [14, 0]], "text": "DocLayNet (DLN)", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 11, "row-header": true, "row-span": [10, 15]}, {"bbox": [154.62899780273438, 486.86383056640625, 194.72674560546875, 495.23846435546875], "spans": [[11, 1]], "text": "Sec-header", "type": "row_header", "col": 1, "col-header": false, "col-span": [1, 2], "row": 11, "row-header": true, "row-span": [11, 12]}, {"bbox": [208.44700622558594, 486.86383056640625, 216.78575134277344, 495.23846435546875], "spans": [[11, 2]], "text": "53", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 11, "row-header": false, "row-span": [11, 12]}, {"bbox": [234.77235412597656, 486.86383056640625, 237.80299377441406, 495.23846435546875], "spans": [[11, 3]], "text": "-", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 11, "row-header": false, "row-span": [11, 12]}, {"bbox": [256.4979248046875, 486.86383056640625, 264.836669921875, 495.23846435546875], "spans": [[11, 4]], "text": "68", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 11, "row-header": false, "row-span": [11, 12]}], [{"bbox": [78.53099822998047, 475.9048156738281, 144.6671600341797, 484.2794494628906], "spans": [[10, 0], [11, 0], [12, 0], [13, 0], [14, 0]], "text": "DocLayNet (DLN)", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 12, "row-header": true, "row-span": [10, 15]}, {"bbox": [154.62899780273438, 475.9048156738281, 174.43577575683594, 484.2794494628906], "spans": [[12, 1]], "text": "Table", "type": "row_header", "col": 1, "col-header": false, "col-span": [1, 2], "row": 12, "row-header": true, "row-span": [12, 13]}, {"bbox": [208.44700622558594, 475.9048156738281, 216.78575134277344, 484.2794494628906], "spans": [[12, 2]], "text": "87", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 12, "row-header": false, "row-span": [12, 13]}, {"bbox": [232.11830139160156, 475.9048156738281, 240.45704650878906, 484.2794494628906], "spans": [[12, 3]], "text": "43", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 12, "row-header": false, "row-span": [12, 13]}, {"bbox": [256.4979248046875, 475.9048156738281, 264.836669921875, 484.2794494628906], "spans": [[12, 4]], "text": "82", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 12, "row-header": false, "row-span": [12, 13]}], [{"bbox": [78.53099822998047, 475.9048156738281, 144.6671600341797, 484.2794494628906], "spans": [[10, 0], [11, 0], [12, 0], [13, 0], [14, 0]], "text": "DocLayNet (DLN)", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 13, "row-header": true, "row-span": [10, 15]}, {"bbox": [154.62899780273438, 464.9458312988281, 170.5891876220703, 473.3204650878906], "spans": [[13, 1]], "text": "Text", "type": "row_header", "col": 1, "col-header": false, "col-span": [1, 2], "row": 13, "row-header": true, "row-span": [13, 14]}, {"bbox": [208.44700622558594, 464.9458312988281, 216.78575134277344, 473.3204650878906], "spans": [[13, 2]], "text": "77", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 13, "row-header": false, "row-span": [13, 14]}, {"bbox": [234.77235412597656, 464.9458312988281, 237.80299377441406, 473.3204650878906], "spans": [[13, 3]], "text": "-", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 13, "row-header": false, "row-span": [13, 14]}, {"bbox": [256.4979248046875, 464.9458312988281, 264.836669921875, 473.3204650878906], "spans": [[13, 4]], "text": "84", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 13, "row-header": false, "row-span": [13, 14]}], [{"bbox": [78.53099822998047, 475.9048156738281, 144.6671600341797, 484.2794494628906], "spans": [[10, 0], [11, 0], [12, 0], [13, 0], [14, 0]], "text": "DocLayNet (DLN)", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 14, "row-header": true, "row-span": [10, 15]}, {"bbox": [154.62899780273438, 453.98681640625, 171.27960205078125, 462.3614501953125], "spans": [[14, 1]], "text": "total", "type": "row_header", "col": 1, "col-header": false, "col-span": [1, 2], "row": 14, "row-header": true, "row-span": [14, 15]}, {"bbox": [208.44700622558594, 453.98681640625, 216.78575134277344, 462.3614501953125], "spans": [[14, 2]], "text": "59", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 14, "row-header": false, "row-span": [14, 15]}, {"bbox": [232.11830139160156, 453.98681640625, 240.45704650878906, 462.3614501953125], "spans": [[14, 3]], "text": "47", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 14, "row-header": false, "row-span": [14, 15]}, {"bbox": [256.4979248046875, 453.98681640625, 264.836669921875, 462.3614501953125], "spans": [[14, 4]], "text": "78", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 14, "row-header": false, "row-span": [14, 15]}]], "model": null, "bounding-box": null}], "bitmaps": null, "equations": [], "footnotes": [], "page-dimensions": [{"height": 792.0, "page": 1, "width": 612.0}, {"height": 792.0, "page": 2, "width": 612.0}, {"height": 792.0, "page": 3, "width": 612.0}, {"height": 792.0, "page": 4, "width": 612.0}, {"height": 792.0, "page": 5, "width": 612.0}, {"height": 792.0, "page": 6, "width": 612.0}, {"height": 792.0, "page": 7, "width": 612.0}, {"height": 792.0, "page": 8, "width": 612.0}, {"height": 792.0, "page": 9, "width": 612.0}], "page-footers": [], "page-headers": [], "_s3_data": null, "identifiers": null}
\ No newline at end of file
+{"_name": "", "type": "pdf-document", "description": {"title": null, "abstract": null, "authors": null, "affiliations": null, "subjects": null, "keywords": null, "publication_date": null, "languages": null, "license": null, "publishers": null, "url_refs": null, "references": null, "publication": null, "reference_count": null, "citation_count": null, "citation_date": null, "advanced": null, "analytics": null, "logs": [], "collection": null, "acquisition": null}, "file-info": {"filename": "2206.01062.pdf", "filename-prov": null, "document-hash": "ea5bd3ba45359d9f21632f29ac48cd8d7931b4e3dce1595ac524a1e3e8f17c68", "#-pages": 9, "collection-name": null, "description": null, "page-hashes": [{"hash": "8953a93154d76e567fd12cbedc80fdd96acd7b95f8796fdd99e6323e9b5e62e5", "model": "default", "page": 1}, {"hash": "95fd7493687c826ad61870d95fe51c293e5ff2d0ced3852dccca2724152476ab", "model": "default", "page": 2}, {"hash": "eb5b7ec90656ea3cfa128b31b9432372311744f14c489749e696d6a2eab71cc2", "model": "default", "page": 3}, {"hash": "c21e9c23ddb16c953b61dc355143d0df64f633c9d3e9933811a01475c6361444", "model": "default", "page": 4}, {"hash": "8bdd7d75da6d0379991f2d1ec5d4593ecd41a6423d24b77d6d18f339b22c8fc2", "model": "default", "page": 5}, {"hash": "a32fa49cde50042ed0a0620f5015e210f5ef4c09508fb7a2d801ebeaa36418ba", "model": "default", "page": 6}, {"hash": "874e4b99a0c8e3ade493554d3d3dab9020e212a30b13906b54802e625fec32f8", "model": "default", "page": 7}, {"hash": "fc85d29ecb3220967463748596069586cfb6b5a9ee4196aa4a4a5c7da14cd9ca", "model": "default", "page": 8}, {"hash": "63f84ea4aeecf4daa62599747b3722a22426f99924ca5fef9424a1a7f9ba7be2", "model": "default", "page": 9}]}, "main-text": [{"prov": [{"bbox": [107.29999999999998, 672.4044199999998, 505.06195, 708.3052999999999], "page": 1, "span": [0, 71], "__ref_s3_data": null}], "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [90.96701, 611.7597, 193.73123, 658.32764], "page": 1, "span": [0, 73], "__ref_s3_data": null}], "text": "Birgit Pfitzmann IBM Research Rueschlikon, Switzerland bpf@zurich.ibm.com", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [255.11602999999997, 611.7597, 357.88025, 658.32764], "page": 1, "span": [0, 71], "__ref_s3_data": null}], "text": "Christoph Auer IBM Research Rueschlikon, Switzerland cau@zurich.ibm.com", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [419.26505, 611.7597, 522.0293, 658.32764], "page": 1, "span": [0, 70], "__ref_s3_data": null}], "text": "Michele Dolfi IBM Research Rueschlikon, Switzerland dol@zurich.ibm.com", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [172.54303, 553.37469, 275.30725, 599.94263], "page": 1, "span": [0, 72], "__ref_s3_data": null}], "text": "Ahmed S. Nassar IBM Research Rueschlikon, Switzerland ahn@zurich.ibm.com", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [336.69302, 553.37469, 439.45727999999997, 599.94263], "page": 1, "span": [0, 68], "__ref_s3_data": null}], "text": "Peter Staar IBM Research Rueschlikon, Switzerland taa@zurich.ibm.com", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [53.798035, 533.98798, 111.94354, 544.29712], "page": 1, "span": [0, 8], "__ref_s3_data": null}], "text": "ABSTRACT", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [53.466999, 257.70682, 295.56018, 529.09546], "page": 1, "span": [0, 1595], "__ref_s3_data": null}], "text": "Accurate document layout analysis is a key requirement for highquality PDF document conversion. With the recent availability of public, large ground-truth datasets such as PubLayNet and DocBank, deep-learning models have proven to be very effective at layout detection and segmentation. While these datasets are of adequate size to train such models, they severely lack in layout variability since they are sourced from scientific article repositories such as PubMed and arXiv only. Consequently, the accuracy of the layout segmentation drops significantly when these models are applied on more challenging and diverse layouts. In this paper, we present DocLayNet , a new, publicly available, document-layout annotation dataset in COCO format. It contains 80863 manually annotated pages from diverse data sources to represent a wide variability in layouts. For each PDF page, the layout annotations provide labelled bounding-boxes with a choice of 11 distinct classes. DocLayNet also provides a subset of double- and triple-annotated pages to determine the inter-annotator agreement. In multiple experiments, we provide baseline accuracy scores (in mAP) for a set of popular object detection models. We also demonstrate that these models fall approximately 10% behind the inter-annotator agreement. Furthermore, we provide evidence that DocLayNet is of sufficient size. Lastly, we compare models trained on PubLayNet, DocBank and DocLayNet, showing that layout predictions of the DocLayNettrained models are more robust and thus the preferred choice for general-purpose document-layout analysis.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [53.79800000000001, 230.69398, 134.81989, 241.00307999999995], "page": 1, "span": [0, 12], "__ref_s3_data": null}], "text": "CCS CONCEPTS", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [53.797989, 195.49886000000004, 297.85294, 225.91701], "page": 1, "span": [0, 170], "__ref_s3_data": null}], "text": "\u00b7 Information systems \u2192 Document structure ; \u00b7 Applied computing \u2192 Document analysis ; \u00b7 Computing methodologies \u2192 Machine learning ; Computer vision ; Object detection ;", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [53.79800000000001, 119.20811000000003, 295.11798, 157.60162000000003], "page": 1, "span": [0, 397], "__ref_s3_data": null}], "text": "Permission to make digital or hard copies of part or all of this work for personal or classroom use is granted without fee provided that copies are not made or distributed for profit or commercial advantage and that copies bear this notice and the full citation on the first page. Copyrights for third-party components of this work must be honored. For all other uses, contact the owner/author(s).", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [53.79800000000001, 110.43413999999996, 197.86275, 116.91976999999997], "page": 1, "span": [0, 48], "__ref_s3_data": null}], "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [53.317001, 101.67411000000004, 186.74652, 108.18763999999999], "page": 1, "span": [0, 45], "__ref_s3_data": null}], "text": "\u00a9 2022 Copyright held by the owner/author(s).", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [53.554001, 93.70311000000004, 157.03125, 100.21663999999998], "page": 1, "span": [0, 33], "__ref_s3_data": null}], "text": "ACM ISBN 978-1-4503-9385-0/22/08.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [53.79800000000001, 85.73310900000001, 166.94093, 92.24663499999997], "page": 1, "span": [0, 39], "__ref_s3_data": null}], "text": "https://doi.org/10.1145/3534678.3539043", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"name": "Picture", "type": "figure", "$ref": "#/figures/0"}, {"prov": [{"bbox": [317.95499, 189.22498999999993, 379.8205, 199.53409], "page": 1, "span": [0, 8], "__ref_s3_data": null}], "text": "KEYWORDS", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [317.95499, 164.99883, 559.18597, 184.33244000000002], "page": 1, "span": [0, 90], "__ref_s3_data": null}], "text": "PDF document conversion, layout segmentation, object-detection, data set, Machine Learning", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [317.65997, 144.41391, 404.65366, 151.94565999999998], "page": 1, "span": [0, 21], "__ref_s3_data": null}], "text": "ACM Reference Format:", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [317.95499, 84.622971, 559.5495, 141.88004], "page": 1, "span": [0, 374], "__ref_s3_data": null}], "text": "Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar. 2022. DocLayNet: A Large Human-Annotated Dataset for DocumentLayout Analysis. In Proceedings of the 28th ACM SIGKDD Conference on Knowledge Discovery and Data Mining (KDD '22), August 14-18, 2022, Washington, DC, USA. ACM, New York, NY, USA, 9 pages. https://doi.org/10.1145/ 3534678.3539043", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [53.79800000000001, 695.83099, 156.52899, 706.14014], "page": 2, "span": [0, 14], "__ref_s3_data": null}], "text": "1 INTRODUCTION", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [53.528999, 563.05286, 303.01697, 681.01648], "page": 2, "span": [0, 702], "__ref_s3_data": null}], "text": "Despite the substantial improvements achieved with machine-learning (ML) approaches and deep neural networks in recent years, document conversion remains a challenging problem, as demonstrated by the numerous public competitions held on this topic [1-4]. The challenge originates from the huge variability in PDF documents regarding layout, language and formats (scanned, programmatic or a combination of both). Engineering a single ML model that can be applied on all types of documents and provides high-quality layout segmentation remains to this day extremely challenging [5]. To highlight the variability in document layouts, we show a few example documents from the DocLayNet dataset in Figure 1.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [53.528999, 289.08084, 295.56412, 560.46844], "page": 2, "span": [0, 1580], "__ref_s3_data": null}], "text": "A key problem in the process of document conversion is to understand the structure of a single document page, i.e. which segments of text should be grouped together in a unit. To train models for this task, there are currently two large datasets available to the community, PubLayNet [6] and DocBank [7]. They were introduced in 2019 and 2020 respectively and significantly accelerated the implementation of layout detection and segmentation models due to their sizes of 300K and 500K ground-truth pages. These sizes were achieved by leveraging an automation approach. The benefit of automated ground-truth generation is obvious: one can generate large ground-truth datasets at virtually no cost. However, the automation introduces a constraint on the variability in the dataset, because corresponding structured source data must be available. PubLayNet and DocBank were both generated from scientific document repositories (PubMed and arXiv), which provide XML or L A T E X sources. Those scientific documents present a limited variability in their layouts, because they are typeset in uniform templates provided by the publishers. Obviously, documents such as technical manuals, annual company reports, legal text, government tenders, etc. have very different and partially unique layouts. As a consequence, the layout predictions obtained from models trained on PubLayNet or DocBank is very reasonable when applied on scientific documents. However, for more artistic or free-style layouts, we see sub-par prediction quality from these models, which we demonstrate in Section 5.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [53.591999, 212.36783000000003, 295.56396, 286.49646], "page": 2, "span": [0, 462], "__ref_s3_data": null}], "text": "In this paper, we present the DocLayNet dataset. It provides pageby-page layout annotation ground-truth using bounding-boxes for 11 distinct class labels on 80863 unique document pages, of which a fraction carry double- or triple-annotations. DocLayNet is similar in spirit to PubLayNet and DocBank and will likewise be made available to the public 1 in order to stimulate the document-layout analysis community. It distinguishes itself in the following aspects:", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [64.708, 177.12581999999998, 295.56165, 207.41844000000003], "page": 2, "span": [0, 149], "__ref_s3_data": null}], "text": "- (1) Human Annotation : In contrast to PubLayNet and DocBank, we relied on human annotation instead of automation approaches to generate the data set.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [64.708, 155.20883000000003, 294.26254, 174.54143999999997], "page": 2, "span": [0, 109], "__ref_s3_data": null}], "text": "- (2) Large Layout Variability : We include diverse and complex layouts from a large variety of public sources.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [64.708, 122.33182999999997, 294.68381, 152.62445000000002], "page": 2, "span": [0, 180], "__ref_s3_data": null}], "text": "- (3) Detailed Label Set : We define 11 class labels to distinguish layout features in high detail. PubLayNet provides 5 labels; DocBank provides 13, although not a superset of ours.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [64.708, 100.41382999999996, 295.56439, 119.74743999999998], "page": 2, "span": [0, 115], "__ref_s3_data": null}], "text": "- (4) Redundant Annotations : A fraction of the pages in the DocLayNet data set carry more than one human annotation.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [53.672001, 83.26010900000006, 216.02750000000003, 89.77363600000001], "page": 2, "span": [0, 60], "__ref_s3_data": null}], "text": "$^{1}$https://developer.ibm.com/exchanges/data/all/doclaynet", "type": "footnote", "payload": null, "name": "Footnote", "font": null}, {"prov": [{"bbox": [342.095, 685.30286, 558.43201, 704.63647], "page": 2, "span": [0, 86], "__ref_s3_data": null}], "text": "This enables experimentation with annotation uncertainty and quality control analysis.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [328.86502, 630.50885, 559.72101, 682.71851], "page": 2, "span": [0, 280], "__ref_s3_data": null}], "text": "- (5) Pre-defined Train-, Test- & Validation-set : Like DocBank, we provide fixed train-, test- & validation-sets to ensure proportional representation of the class-labels. Further, we prevent leakage of unique layouts across sets, which has a large effect on model accuracy scores.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [317.62299, 571.81384, 559.19031, 624.02448], "page": 2, "span": [0, 297], "__ref_s3_data": null}], "text": "All aspects outlined above are detailed in Section 3. In Section 4, we will elaborate on how we designed and executed this large-scale human annotation campaign. We will also share key insights and lessons learned that might prove helpful for other parties planning to set up annotation campaigns.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [317.73099, 484.14282, 559.58197, 569.22943], "page": 2, "span": [0, 506], "__ref_s3_data": null}], "text": "In Section 5, we will present baseline accuracy numbers for a variety of object detection methods (Faster R-CNN, Mask R-CNN and YOLOv5) trained on DocLayNet. We further show how the model performance is impacted by varying the DocLayNet dataset size, reducing the label set and modifying the train/test-split. Last but not least, we compare the performance of models trained on PubLayNet, DocBank and DocLayNet and demonstrate that a model trained on DocLayNet provides overall more robust layout recovery.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [317.95499, 460.48203, 421.74411, 470.79111], "page": 2, "span": [0, 14], "__ref_s3_data": null}], "text": "2 RELATED WORK", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [317.52499, 327.70383, 559.71613, 445.6674499999999], "page": 2, "span": [0, 655], "__ref_s3_data": null}], "text": "While early approaches in document-layout analysis used rulebased algorithms and heuristics [8], the problem is lately addressed with deep learning methods. The most common approach is to leverage object detection models [9-15]. In the last decade, the accuracy and speed of these models has increased dramatically. Furthermore, most state-of-the-art object detection methods can be trained and applied with very little work, thanks to a standardisation effort of the ground-truth data format [16] and common deep-learning frameworks [17]. Reference data sets such as PubLayNet [6] and DocBank provide their data in the commonly accepted COCO format [16].", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [317.95499, 240.03183, 559.18646, 325.11948], "page": 2, "span": [0, 500], "__ref_s3_data": null}], "text": "Lately, new types of ML models for document-layout analysis have emerged in the community [18-21]. These models do not approach the problem of layout analysis purely based on an image representation of the page, as computer vision methods do. Instead, they combine the text tokens and image representation of a page in order to obtain a segmentation. While the reported accuracies appear to be promising, a broadly accepted data format which links geometric and textual features has yet to establish.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [317.95499, 216.37099999999998, 477.45688, 226.68010000000004], "page": 2, "span": [0, 23], "__ref_s3_data": null}], "text": "3 THE DOCLAYNET DATASET", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [317.95499, 116.46983, 559.7132, 201.55644000000007], "page": 2, "span": [0, 522], "__ref_s3_data": null}], "text": "DocLayNet contains 80863 PDF pages. Among these, 7059 carry two instances of human annotations, and 1591 carry three. This amounts to 91104 total annotation instances. The annotations provide layout information in the shape of labeled, rectangular boundingboxes. We define 11 distinct labels for layout features, namely Caption , Footnote , Formula , List-item , Page-footer , Page-header , Picture , Section-header , Table , Text , and Title . Our reasoning for picking this particular label set is detailed in Section 4.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [317.95499, 83.59282699999994, 558.2041, 113.88544000000002], "page": 2, "span": [0, 186], "__ref_s3_data": null}], "text": "In addition to open intellectual property constraints for the source documents, we required that the documents in DocLayNet adhere to a few conditions. Firstly, we kept scanned documents", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"name": "Picture", "type": "figure", "$ref": "#/figures/1"}, {"prov": [{"bbox": [53.79800000000001, 425.10983, 294.27383, 510.1964699999999], "page": 3, "span": [0, 513], "__ref_s3_data": null}], "text": "to a minimum, since they introduce difficulties in annotation (see Section 4). As a second condition, we focussed on medium to large documents ( > 10 pages) with technical content, dense in complex tables, figures, plots and captions. Such documents carry a lot of information value, but are often hard to analyse with high accuracy due to their challenging layouts. Counterexamples of documents not included in the dataset are receipts, invoices, hand-written documents or photographs showing \"text in the wild\".", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [53.57400100000001, 282.64383, 295.56046, 422.52545], "page": 3, "span": [0, 810], "__ref_s3_data": null}], "text": "The pages in DocLayNet can be grouped into six distinct categories, namely Financial Reports , Manuals , Scientific Articles , Laws & Regulations , Patents and Government Tenders . Each document category was sourced from various repositories. For example, Financial Reports contain both free-style format annual reports 2 which expose company-specific, artistic layouts as well as the more formal SEC filings. The two largest categories ( Financial Reports and Manuals ) contain a large amount of free-style layouts in order to obtain maximum variability. In the other four categories, we boosted the variability by mixing documents from independent providers, such as different government websites or publishers. In Figure 2, we show the document categories contained in DocLayNet with their respective sizes.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [53.466999, 184.01382, 295.56155, 280.05945], "page": 3, "span": [0, 535], "__ref_s3_data": null}], "text": "We did not control the document selection with regard to language. The vast majority of documents contained in DocLayNet (close to 95%) are published in English language. However, DocLayNet also contains a number of documents in other languages such as German (2.5%), French (1.0%) and Japanese (1.0%). While the document language has negligible impact on the performance of computer vision methods such as object detection and segmentation models, it might prove challenging for layout analysis methods which exploit textual features.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [53.79800000000001, 107.30183, 295.56396, 181.42944], "page": 3, "span": [0, 413], "__ref_s3_data": null}], "text": "To ensure that future benchmarks in the document-layout analysis community can be easily compared, we have split up DocLayNet into pre-defined train-, test- and validation-sets. In this way, we can avoid spurious variations in the evaluation scores due to random splitting in train-, test- and validation-sets. We also ensured that less frequent labels are represented in train and test sets in equal proportions.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [53.79800000000001, 83.830109, 195.78998, 90.34363600000006], "page": 3, "span": [0, 51], "__ref_s3_data": null}], "text": "$^{2}$e.g. AAPL from https://www.annualreports.com/", "type": "footnote", "payload": null, "name": "Footnote", "font": null}, {"prov": [{"bbox": [317.62299, 630.50885, 559.19183, 704.63647], "page": 3, "span": [0, 435], "__ref_s3_data": null}], "text": "Table 1 shows the overall frequency and distribution of the labels among the different sets. Importantly, we ensure that subsets are only split on full-document boundaries. This avoids that pages of the same document are spread over train, test and validation set, which can give an undesired evaluation advantage to models and lead to overestimation of their prediction accuracy. We will show the impact of this decision in Section 5.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [317.95499, 520.9198, 558.43811, 627.92444], "page": 3, "span": [0, 645], "__ref_s3_data": null}], "text": "In order to accommodate the different types of models currently in use by the community, we provide DocLayNet in an augmented COCO format [16]. This entails the standard COCO ground-truth file (in JSON format) with the associated page images (in PNG format, 1025 \u00d7 1025 pixels). Furthermore, custom fields have been added to each COCO record to specify document category, original document filename and page number. In addition, we also provide the original PDF pages, as well as sidecar files containing parsed PDF text and text-cell coordinates (in JSON). All additional files are linked to the primary page images by their matching filenames.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [316.94199, 203.11082, 559.72156, 518.33545], "page": 3, "span": [0, 1854], "__ref_s3_data": null}], "text": "Despite being cost-intense and far less scalable than automation, human annotation has several benefits over automated groundtruth generation. The first and most obvious reason to leverage human annotations is the freedom to annotate any type of document without requiring a programmatic source. For most PDF documents, the original source document is not available. The latter is not a hard constraint with human annotation, but it is for automated methods. A second reason to use human annotations is that the latter usually provide a more natural interpretation of the page layout. The human-interpreted layout can significantly deviate from the programmatic layout used in typesetting. For example, \"invisible\" tables might be used solely for aligning text paragraphs on columns. Such typesetting tricks might be interpreted by automated methods incorrectly as an actual table, while the human annotation will interpret it correctly as Text or other styles. The same applies to multi-line text elements, when authors decided to space them as \"invisible\" list elements without bullet symbols. A third reason to gather ground-truth through human annotation is to estimate a \"natural\" upper bound on the segmentation accuracy. As we will show in Section 4, certain documents featuring complex layouts can have different but equally acceptable layout interpretations. This natural upper bound for segmentation accuracy can be found by annotating the same pages multiple times by different people and evaluating the inter-annotator agreement. Such a baseline consistency evaluation is very useful to define expectations for a good target accuracy in trained deep neural network models and avoid overfitting (see Table 1). On the flip side, achieving high annotation consistency proved to be a key challenge in human annotation, as we outline in Section 4.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [317.95499, 174.84099000000003, 470.21326, 185.15008999999998], "page": 3, "span": [0, 21], "__ref_s3_data": null}], "text": "4 ANNOTATION CAMPAIGN", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [317.686, 85.897827, 559.71381, 160.02643999999998], "page": 3, "span": [0, 457], "__ref_s3_data": null}], "text": "The annotation campaign was carried out in four phases. In phase one, we identified and prepared the data sources for annotation. In phase two, we determined the class labels and how annotations should be done on the documents in order to obtain maximum consistency. The latter was guided by a detailed requirement analysis and exhaustive experiments. In phase three, we trained the annotation staff and performed exams for quality assurance. In phase four,", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"name": "Table", "type": "table", "$ref": "#/tables/0"}, {"prov": [{"bbox": [53.501999, 676.65381, 558.48969, 707.0450400000001], "page": 4, "span": [0, 348], "__ref_s3_data": null}], "text": "Table 1: DocLayNet dataset overview. Along with the frequency of each class label, we present the relative occurrence (as % of row \"Total\") in the train, test and validation sets. The inter-annotator agreement is computed as the mAP@0.5-0.95 metric between pairwise annotations from the triple-annotated pages, from which we obtain accuracy ranges.", "type": "caption", "payload": null, "name": "Caption", "font": null}, {"name": "Picture", "type": "figure", "$ref": "#/figures/2"}, {"prov": [{"bbox": [53.466999, 116.45682999999997, 294.04745, 157.70844999999997], "page": 4, "span": [0, 231], "__ref_s3_data": null}], "text": "we distributed the annotation workload and performed continuous quality controls. Phase one and two required a small team of experts only. For phases three and four, a group of 40 dedicated annotators were assembled and supervised.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [53.79800000000001, 83.57982600000003, 295.55844, 113.98901000000001], "page": 4, "span": [0, 570], "__ref_s3_data": null}, {"bbox": [53.79800000000001, 83.57982600000003, 295.55844, 113.98901000000001], "page": 4, "span": [0, 570], "__ref_s3_data": null}], "text": "Phase 1: Data selection and preparation. Our inclusion criteria for documents were described in Section 3. A large effort went into ensuring that all documents are free to use. The data sources include publication repositories such as arXiv$^{3}$, government offices, company websites as well as data directory services for financial reports and patents. Scanned documents were excluded wherever possible because they can be rotated or skewed. This would not allow us to perform annotation with rectangular bounding-boxes and therefore complicate the annotation process.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [317.95499, 285.24484, 559.71307, 414.1674499999999], "page": 4, "span": [0, 746], "__ref_s3_data": null}], "text": "Preparation work included uploading and parsing the sourced PDF documents in the Corpus Conversion Service (CCS) [22], a cloud-native platform which provides a visual annotation interface and allows for dataset inspection and analysis. The annotation interface of CCS is shown in Figure 3. The desired balance of pages between the different document categories was achieved by selective subsampling of pages with certain desired properties. For example, we made sure to include the title page of each document and bias the remaining page selection to those with figures or tables. The latter was achieved by leveraging pre-trained object detection models from PubLayNet, which helped us estimate how many figures and tables a given page contains.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [317.62299, 98.94382500000006, 559.71765, 282.77701], "page": 4, "span": [0, 1159], "__ref_s3_data": null}], "text": "Phase 2: Label selection and guideline. We reviewed the collected documents and identified the most common structural features they exhibit. This was achieved by identifying recurrent layout elements and lead us to the definition of 11 distinct class labels. These 11 class labels are Caption , Footnote , Formula , List-item , Pagefooter , Page-header , Picture , Section-header , Table , Text , and Title . Critical factors that were considered for the choice of these class labels were (1) the overall occurrence of the label, (2) the specificity of the label, (3) recognisability on a single page (i.e. no need for context from previous or next page) and (4) overall coverage of the page. Specificity ensures that the choice of label is not ambiguous, while coverage ensures that all meaningful items on a page can be annotated. We refrained from class labels that are very specific to a document category, such as Abstract in the Scientific Articles category. We also avoided class labels that are tightly linked to the semantics of the text. Labels such as Author and Affiliation , as seen in DocBank, are often only distinguishable by discriminating on", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [317.95499, 83.13310999999999, 369.2457, 89.64663700000006], "page": 4, "span": [0, 24], "__ref_s3_data": null}], "text": "$^{3}$https://arxiv.org/", "type": "footnote", "payload": null, "name": "Footnote", "font": null}, {"prov": [{"bbox": [53.79800000000001, 685.29388, 294.04541, 704.63647], "page": 5, "span": [0, 135], "__ref_s3_data": null}], "text": "the textual content of an element, which goes beyond visual layout recognition, in particular outside the Scientific Articles category.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [53.79800000000001, 542.83783, 295.55923, 682.71844], "page": 5, "span": [0, 812], "__ref_s3_data": null}], "text": "At first sight, the task of visual document-layout interpretation appears intuitive enough to obtain plausible annotations in most cases. However, during early trial-runs in the core team, we observed many cases in which annotators use different annotation styles, especially for documents with challenging layouts. For example, if a figure is presented with subfigures, one annotator might draw a single figure bounding-box, while another might annotate each subfigure separately. The same applies for lists, where one might annotate all list items in one block or each list item separately. In essence, we observed that challenging layouts would be annotated in different but plausible ways. To illustrate this, we show in Figure 4 multiple examples of plausible but inconsistent annotations on the same pages.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [53.79800000000001, 455.16583, 295.56006, 540.25348], "page": 5, "span": [0, 465], "__ref_s3_data": null}], "text": "Obviously, this inconsistency in annotations is not desirable for datasets which are intended to be used for model training. To minimise these inconsistencies, we created a detailed annotation guideline. While perfect consistency across 40 annotation staff members is clearly not possible to achieve, we saw a huge improvement in annotation consistency after the introduction of our annotation guideline. A few selected, non-trivial highlights of the guideline are:", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [64.708, 402.22687, 294.0462, 443.48746], "page": 5, "span": [0, 202], "__ref_s3_data": null}], "text": "- (1) Every list-item is an individual object instance with class label List-item . This definition is different from PubLayNet and DocBank, where all list-items are grouped together into one List object.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [64.707993, 358.39984, 295.56372, 399.65149], "page": 5, "span": [0, 208], "__ref_s3_data": null}], "text": "- (2) A List-item is a paragraph with hanging indentation. Singleline elements can qualify as List-item if the neighbour elements expose hanging indentation. Bullet or enumeration symbols are not a requirement.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [64.708, 336.47287, 294.04724, 355.81548999999995], "page": 5, "span": [0, 82], "__ref_s3_data": null}], "text": "- (3) For every Caption , there must be exactly one corresponding Picture or Table .", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [64.708, 314.56482, 294.04599, 333.8984699999999], "page": 5, "span": [0, 70], "__ref_s3_data": null}], "text": "- (4) Connected sub-pictures are grouped together in one Picture object.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [64.708, 303.59686, 264.50571, 311.98047], "page": 5, "span": [0, 53], "__ref_s3_data": null}], "text": "- (5) Formula numbers are included in a Formula object.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [64.708008, 270.72882000000004, 294.04617, 301.02148], "page": 5, "span": [0, 160], "__ref_s3_data": null}], "text": "- (6) Emphasised text (e.g. in italic or bold) at the beginning of a paragraph is not considered a Section-header , unless it appears exclusively on its own line.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [53.528999, 217.79882999999995, 295.56253, 259.0494699999999], "page": 5, "span": [0, 221], "__ref_s3_data": null}], "text": "The complete annotation guideline is over 100 pages long and a detailed description is obviously out of scope for this paper. Nevertheless, it will be made publicly available alongside with DocLayNet for future reference.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [53.79800000000001, 86.29182400000002, 295.56226, 215.33101], "page": 5, "span": [0, 792], "__ref_s3_data": null}], "text": "Phase 3: Training. After a first trial with a small group of people, we realised that providing the annotation guideline and a set of random practice pages did not yield the desired quality level for layout annotation. Therefore we prepared a subset of pages with two different complexity levels, each with a practice and an exam part. 974 pages were reference-annotated by one proficient core team member. Annotation staff were then given the task to annotate the same subsets (blinded from the reference). By comparing the annotations of each staff member with the reference annotations, we could quantify how closely their annotations matched the reference. Only after passing two exam levels with high annotation quality, staff were admitted into the production phase. Practice iterations", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"name": "Picture", "type": "figure", "$ref": "#/figures/3"}, {"prov": [{"bbox": [400.12842, 331.4399399999999, 476.33178999999996, 333.55672999999996], "page": 5, "span": [0, 64], "__ref_s3_data": null}], "text": "05237a14f2524e3f53c8454b074409d05078038a6a36b770fcc8ec7e540deae0", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [317.95499, 288.11481, 559.80579, 318.50601], "page": 5, "span": [0, 173], "__ref_s3_data": null}], "text": "Figure 4: Examples of plausible annotation alternatives for the same page. Criteria in our annotation guideline can resolve cases A to C, while the case D remains ambiguous.", "type": "caption", "payload": null, "name": "Caption", "font": null}, {"prov": [{"bbox": [317.62299, 247.16881999999998, 558.20435, 266.50247], "page": 5, "span": [0, 123], "__ref_s3_data": null}], "text": "were carried out over a timeframe of 12 weeks, after which 8 of the 40 initially allocated annotators did not pass the bar.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [317.62299, 82.78482800000006, 559.7149, 244.70100000000002], "page": 5, "span": [0, 987], "__ref_s3_data": null}], "text": "Phase 4: Production annotation. The previously selected 80K pages were annotated with the defined 11 class labels by 32 annotators. This production phase took around three months to complete. All annotations were created online through CCS, which visualises the programmatic PDF text-cells as an overlay on the page. The page annotation are obtained by drawing rectangular bounding-boxes, as shown in Figure 3. With regard to the annotation practices, we implemented a few constraints and capabilities on the tooling level. First, we only allow non-overlapping, vertically oriented, rectangular boxes. For the large majority of documents, this constraint was sufficient and it speeds up the annotation considerably in comparison with arbitrary segmentation shapes. Second, annotator staff were not able to see each other's annotations. This was enforced by design to avoid any bias in the annotation, which could skew the numbers of the inter-annotator agreement (see Table 1). We wanted", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [53.501999, 608.98291, 295.64874, 705.12708], "page": 6, "span": [0, 489], "__ref_s3_data": null}], "text": "Table 2: Prediction performance (mAP@0.5-0.95) of object detection networks on DocLayNet test set. The MRCNN (Mask R-CNN) and FRCNN (Faster R-CNN) models with ResNet-50 or ResNet-101 backbone were trained based on the network architectures from the detectron2 model zoo (Mask R-CNN R50, R101-FPN 3x, Faster R-CNN R101-FPN 3x), with default configurations. The YOLO implementation utilized was YOLOv5x6 [13]. All models were initialised using pre-trained weights from the COCO 2017 dataset.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"name": "Table", "type": "table", "$ref": "#/tables/1"}, {"prov": [{"bbox": [53.528999, 215.43683, 295.55612, 421.07245], "page": 6, "span": [0, 1252], "__ref_s3_data": null}], "text": "to avoid this at any cost in order to have clear, unbiased baseline numbers for human document-layout annotation. Third, we introduced the feature of snapping boxes around text segments to obtain a pixel-accurate annotation and again reduce time and effort. The CCS annotation tool automatically shrinks every user-drawn box to the minimum bounding-box around the enclosed text-cells for all purely text-based segments, which excludes only Table and Picture . For the latter, we instructed annotation staff to minimise inclusion of surrounding whitespace while including all graphical lines. A downside of snapping boxes to enclosed text cells is that some wrongly parsed PDF pages cannot be annotated correctly and need to be skipped. Fourth, we established a way to flag pages as rejected for cases where no valid annotation according to the label guidelines could be achieved. Example cases for this would be PDF pages that render incorrectly or contain layouts that are impossible to capture with non-overlapping rectangles. Such rejected pages are not contained in the final dataset. With all these measures in place, experienced annotation staff managed to annotate a single page in a typical timeframe of 20s to 60s, depending on its complexity.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [53.79800000000001, 193.56098999999995, 147.48535, 203.87009], "page": 6, "span": [0, 13], "__ref_s3_data": null}], "text": "5 EXPERIMENTS", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [53.484001, 82.700829, 295.4281, 178.74644], "page": 6, "span": [0, 584], "__ref_s3_data": null}], "text": "The primary goal of DocLayNet is to obtain high-quality ML models capable of accurate document-layout analysis on a wide variety of challenging layouts. As discussed in Section 2, object detection models are currently the easiest to use, due to the standardisation of ground-truth data in COCO format [16] and the availability of general frameworks such as detectron2 [17]. Furthermore, baseline numbers in PubLayNet and DocBank were obtained using standard object detection models such as Mask R-CNN and Faster R-CNN. As such, we will relate to these object detection methods in this", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"name": "Picture", "type": "figure", "$ref": "#/figures/4"}, {"prov": [{"bbox": [317.95499, 388.65482000000003, 558.20416, 407.98846], "page": 6, "span": [0, 102], "__ref_s3_data": null}], "text": "paper and leave the detailed evaluation of more recent methods mentioned in Section 2 for future work.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [317.64099, 311.94284, 558.4364, 386.07047], "page": 6, "span": [0, 397], "__ref_s3_data": null}], "text": "In this section, we will present several aspects related to the performance of object detection models on DocLayNet. Similarly as in PubLayNet, we will evaluate the quality of their predictions using mean average precision (mAP) with 10 overlaps that range from 0.5 to 0.95 in steps of 0.05 (mAP@0.5-0.95). These scores are computed by leveraging the evaluation code provided by the COCO API [16].", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [317.95499, 284.86902, 466.8532400000001, 295.1781], "page": 6, "span": [0, 30], "__ref_s3_data": null}], "text": "Baselines for Object Detection", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [317.74899, 85.29982800000005, 558.43085, 279.97546], "page": 6, "span": [0, 1146], "__ref_s3_data": null}], "text": "In Table 2, we present baseline experiments (given in mAP) on Mask R-CNN [12], Faster R-CNN [11], and YOLOv5 [13]. Both training and evaluation were performed on RGB images with dimensions of 1025 \u00d7 1025 pixels. For training, we only used one annotation in case of redundantly annotated pages. As one can observe, the variation in mAP between the models is rather low, but overall between 6 and 10% lower than the mAP computed from the pairwise human annotations on triple-annotated pages. This gives a good indication that the DocLayNet dataset poses a worthwhile challenge for the research community to close the gap between human recognition and ML approaches. It is interesting to see that Mask R-CNN and Faster R-CNN produce very comparable mAP scores, indicating that pixel-based image segmentation derived from bounding-boxes does not help to obtain better predictions. On the other hand, the more recent Yolov5x model does very well and even out-performs humans on selected labels such as Text , Table and Picture . This is not entirely surprising, as Text , Table and Picture are abundant and the most visually distinctive in a document.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [53.501999, 663.77686, 295.64865, 705.12708], "page": 7, "span": [0, 205], "__ref_s3_data": null}], "text": "Table 3: Performance of a Mask R-CNN R50 network in mAP@0.5-0.95 scores trained on DocLayNet with different class label sets. The reduced label sets were obtained by either down-mapping or dropping labels.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"name": "Table", "type": "table", "$ref": "#/tables/2"}, {"prov": [{"bbox": [53.79800000000001, 462.121, 131.05624, 472.43008], "page": 7, "span": [0, 14], "__ref_s3_data": null}], "text": "Learning Curve", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [52.785, 262.55182, 295.55835, 457.22845], "page": 7, "span": [0, 1157], "__ref_s3_data": null}], "text": "One of the fundamental questions related to any dataset is if it is \"large enough\". To answer this question for DocLayNet, we performed a data ablation study in which we evaluated a Mask R-CNN model trained on increasing fractions of the DocLayNet dataset. As can be seen in Figure 5, the mAP score rises sharply in the beginning and eventually levels out. To estimate the error-bar on the metrics, we ran the training five times on the entire data-set. This resulted in a 1% error-bar, depicted by the shaded area in Figure 5. In the inset of Figure 5, we show the exact same data-points, but with a logarithmic scale on the x-axis. As is expected, the mAP score increases linearly as a function of the data-size in the inset. The curve ultimately flattens out between the 80% and 100% mark, with the 80% mark falling within the error-bars of the 100% mark. This provides a good indication that the model would not improve significantly by yet increasing the data size. Rather, it would probably benefit more from improved data consistency (as discussed in Section 3), data augmentation methods [23], or the addition of more document categories and styles.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [53.79800000000001, 239.18097999999998, 164.32898, 249.49008000000003], "page": 7, "span": [0, 22], "__ref_s3_data": null}], "text": "Impact of Class Labels", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [53.466999, 83.44782999999995, 295.55679, 234.28845], "page": 7, "span": [0, 910], "__ref_s3_data": null}], "text": "The choice and number of labels can have a significant effect on the overall model performance. Since PubLayNet, DocBank and DocLayNet all have different label sets, it is of particular interest to understand and quantify this influence of the label set on the model performance. We investigate this by either down-mapping labels into more common ones (e.g. Caption \u2192 Text ) or excluding them from the annotations entirely. Furthermore, it must be stressed that all mappings and exclusions were performed on the data before model training. In Table 3, we present the mAP scores for a Mask R-CNN R50 network on different label sets. Where a label is down-mapped, we show its corresponding label, otherwise it was excluded. We present three different label sets, with 6, 5 and 4 different labels respectively. The set of 5 labels contains the same labels as PubLayNet. However, due to the different definition of", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [317.659, 663.77679, 559.80682, 705.12701], "page": 7, "span": [0, 189], "__ref_s3_data": null}], "text": "Table 4: Performance of a Mask R-CNN R50 network with document-wise and page-wise split for different label sets. Naive page-wise split will result in GLYPH<tildelow> 10% point improvement.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"name": "Table", "type": "table", "$ref": "#/tables/3"}, {"prov": [{"bbox": [317.686, 375.50983, 559.58496, 460.59647], "page": 7, "span": [0, 469], "__ref_s3_data": null}], "text": "lists in PubLayNet (grouped list-items) versus DocLayNet (separate list-items), the label set of size 4 is the closest to PubLayNet, in the assumption that the List is down-mapped to Text in PubLayNet. The results in Table 3 show that the prediction accuracy on the remaining class labels does not change significantly when other classes are merged into them. The overall macro-average improves by around 5%, in particular when Page-footer and Page-header are excluded.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [317.95496, 352.29602, 549.8606, 362.6051], "page": 7, "span": [0, 46], "__ref_s3_data": null}], "text": "Impact of Document Split in Train and Test Set", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [317.62299, 196.56282, 559.71381, 347.40347], "page": 7, "span": [0, 852], "__ref_s3_data": null}], "text": "Many documents in DocLayNet have a unique styling. In order to avoid overfitting on a particular style, we have split the train-, test- and validation-sets of DocLayNet on document boundaries, i.e. every document contributes pages to only one set. To the best of our knowledge, this was not considered in PubLayNet or DocBank. To quantify how this affects model performance, we trained and evaluated a Mask R-CNN R50 model on a modified dataset version. Here, the train-, test- and validation-sets were obtained by a randomised draw over the individual pages. As can be seen in Table 4, the difference in model performance is surprisingly large: pagewise splitting gains \u02dc 10% in mAP over the document-wise splitting. Thus, random page-wise splitting of DocLayNet can easily lead to accidental overestimation of model performance and should be avoided.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [317.95499, 173.34897999999998, 418.54776, 183.65808000000004], "page": 7, "span": [0, 18], "__ref_s3_data": null}], "text": "Dataset Comparison", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [317.686, 83.35986300000002, 559.18817, 168.45645000000002], "page": 7, "span": [0, 521], "__ref_s3_data": null}], "text": "Throughout this paper, we claim that DocLayNet's wider variety of document layouts leads to more robust layout detection models. In Table 5, we provide evidence for that. We trained models on each of the available datasets (PubLayNet, DocBank and DocLayNet) and evaluated them on the test sets of the other datasets. Due to the different label sets and annotation styles, a direct comparison is not possible. Hence, we focussed on the common labels among the datasets. Between PubLayNet and DocLayNet, these are Picture ,", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [53.501999, 641.85889, 295.64868, 705.12708], "page": 8, "span": [0, 298], "__ref_s3_data": null}], "text": "Table 5: Prediction Performance (mAP@0.5-0.95) of a Mask R-CNN R50 network across the PubLayNet, DocBank & DocLayNet data-sets. By evaluating on common label classes of each dataset, we observe that the DocLayNet-trained model has much less pronounced variations in performance across all datasets.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"name": "Table", "type": "table", "$ref": "#/tables/4"}, {"prov": [{"bbox": [53.79800000000001, 348.85986, 294.04712, 401.07947], "page": 8, "span": [0, 295], "__ref_s3_data": null}], "text": "Section-header , Table and Text . Before training, we either mapped or excluded DocLayNet's other labels as specified in table 3, and also PubLayNet's List to Text . Note that the different clustering of lists (by list-element vs. whole list objects) naturally decreases the mAP score for Text .", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [53.466999, 206.40382, 295.55908, 346.28546000000006], "page": 8, "span": [0, 793], "__ref_s3_data": null}], "text": "For comparison of DocBank with DocLayNet, we trained only on Picture and Table clusters of each dataset. We had to exclude Text because successive paragraphs are often grouped together into a single object in DocBank. This paragraph grouping is incompatible with the individual paragraphs of DocLayNet. As can be seen in Table 5, DocLayNet trained models yield better performance compared to the previous datasets. It is noteworthy that the models trained on PubLayNet and DocBank perform very well on their own test set, but have a much lower performance on the foreign datasets. While this also applies to DocLayNet, the difference is far less pronounced. Thus we conclude that DocLayNet trained models are overall more robust and will produce better results for challenging, unseen layouts.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [53.79800000000001, 176.62999000000002, 156.00534, 186.93908999999996], "page": 8, "span": [0, 19], "__ref_s3_data": null}], "text": "Example Predictions", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [53.528999, 86.64982599999996, 295.55844, 171.73645], "page": 8, "span": [0, 481], "__ref_s3_data": null}], "text": "To conclude this section, we illustrate the quality of layout predictions one can expect from DocLayNet-trained models by providing a selection of examples without any further post-processing applied. Figure 6 shows selected layout predictions on pages from the test-set of DocLayNet. Results look decent in general across document categories, however one can also observe mistakes such as overlapping clusters of different classes, or entirely missing boxes due to low confidence.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [317.95502, 695.83099, 405.72961, 706.14014], "page": 8, "span": [0, 12], "__ref_s3_data": null}], "text": "6 CONCLUSION", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [317.95499, 605.85083, 559.71375, 690.93848], "page": 8, "span": [0, 507], "__ref_s3_data": null}], "text": "In this paper, we presented the DocLayNet dataset. It provides the document conversion and layout analysis research community a new and challenging dataset to improve and fine-tune novel ML methods on. In contrast to many other datasets, DocLayNet was created by human annotation in order to obtain reliable layout ground-truth on a wide variety of publication- and typesettingstyles. Including a large proportion of documents outside the scientific publishing domain adds significant value in this respect.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [317.686, 507.22083, 559.71704, 603.26648], "page": 8, "span": [0, 573], "__ref_s3_data": null}], "text": "From the dataset, we have derived on the one hand reference metrics for human performance on document-layout annotation (through double and triple annotations) and on the other hand evaluated the baseline performance of commonly used object detection methods. We also illustrated the impact of various dataset-related aspects on model performance through data-ablation experiments, both from a size and class-label perspective. Last but not least, we compared the accuracy of models trained on other public datasets and showed that DocLayNet trained models are more robust.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [317.62299, 474.34383999999994, 558.43469, 504.63647], "page": 8, "span": [0, 188], "__ref_s3_data": null}], "text": "To date, there is still a significant gap between human and ML accuracy on the layout interpretation task, and we hope that this work will inspire the research community to close that gap.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [317.95499, 446.59903, 387.3696, 456.90811], "page": 8, "span": [0, 10], "__ref_s3_data": null}], "text": "REFERENCES", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [321.198, 420.83713000000006, 558.20099, 443.29767], "page": 8, "span": [0, 191], "__ref_s3_data": null}], "text": "- [1] Max G\u00f6bel, Tamir Hassan, Ermelinda Oro, and Giorgio Orsi. Icdar 2013 table competition. In 2013 12th International Conference on Document Analysis and Recognition , pages 1449-1453, 2013.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [321.198, 388.95712000000003, 559.37982, 419.38763], "page": 8, "span": [0, 279], "__ref_s3_data": null}], "text": "- [2] Christian Clausner, Apostolos Antonacopoulos, and Stefan Pletschacher. Icdar2017 competition on recognition of documents with complex layouts rdcl2017. In 2017 14th IAPR International Conference on Document Analysis and Recognition (ICDAR) , volume 01, pages 1404-1410, 2017.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [321.198, 365.05310000000003, 558.20013, 387.50763], "page": 8, "span": [0, 213], "__ref_s3_data": null}], "text": "- [3] Herv\u00e9 D\u00e9jean, Jean-Luc Meunier, Liangcai Gao, Yilun Huang, Yu Fang, Florian Kleber, and Eva-Maria Lang. ICDAR 2019 Competition on Table Detection and Recognition (cTDaR), April 2019. http://sac.founderit.com/.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [321.198, 333.1731, 559.37872, 363.59665], "page": 8, "span": [0, 251], "__ref_s3_data": null}], "text": "- [4] Antonio Jimeno Yepes, Peter Zhong, and Douglas Burdick. Competition on scientific literature parsing. In Proceedings of the International Conference on Document Analysis and Recognition , ICDAR, pages 605-617. LNCS 12824, SpringerVerlag, sep 2021.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [321.198, 301.29208, 559.02625, 331.71664], "page": 8, "span": [0, 261], "__ref_s3_data": null}], "text": "- [5] Logan Markewich, Hao Zhang, Yubin Xing, Navid Lambert-Shirzad, Jiang Zhexin, Roy Lee, Zhi Li, and Seok-Bum Ko. Segmentation for document layout analysis: not dead yet. International Journal on Document Analysis and Recognition (IJDAR) , pages 1-11, 01 2022.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [321.198, 277.3751199999999, 558.20361, 299.83563], "page": 8, "span": [0, 235], "__ref_s3_data": null}], "text": "- [6] Xu Zhong, Jianbin Tang, and Antonio Jimeno-Yepes. Publaynet: Largest dataset ever for document layout analysis. In Proceedings of the International Conference on Document Analysis and Recognition , ICDAR, pages 1015-1022, sep 2019.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [321.19797, 237.53111, 558.9715, 275.92562999999996], "page": 8, "span": [0, 316], "__ref_s3_data": null}], "text": "- [7] Minghao Li, Yiheng Xu, Lei Cui, Shaohan Huang, Furu Wei, Zhoujun Li, and Ming Zhou. Docbank: A benchmark dataset for document layout analysis. In Proceedings of the 28th International Conference on Computational Linguistics , COLING, pages 949-960. International Committee on Computational Linguistics, dec 2020.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [321.198, 213.61414000000002, 558.90222, 236.07465000000002], "page": 8, "span": [0, 172], "__ref_s3_data": null}], "text": "- [8] Riaz Ahmad, Muhammad Tanvir Afzal, and M. Qadir. Information extraction from pdf sources based on rule-based system using integrated formats. In SemWebEval@ESWC , 2016.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [321.198, 181.74109999999996, 559.27448, 212.16463999999996], "page": 8, "span": [0, 271], "__ref_s3_data": null}], "text": "- [9] Ross B. Girshick, Jeff Donahue, Trevor Darrell, and Jitendra Malik. Rich feature hierarchies for accurate object detection and semantic segmentation. In IEEE Conference on Computer Vision and Pattern Recognition , CVPR, pages 580-587. IEEE Computer Society, jun 2014.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [317.95499, 165.79314, 558.20203, 180.28463999999997], "page": 8, "span": [0, 149], "__ref_s3_data": null}], "text": "- [10] Ross B. Girshick. Fast R-CNN. In 2015 IEEE International Conference on Computer Vision , ICCV, pages 1440-1448. IEEE Computer Society, dec 2015.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [317.95499, 141.88312999999994, 558.20142, 164.34362999999996], "page": 8, "span": [0, 227], "__ref_s3_data": null}], "text": "- [11] Shaoqing Ren, Kaiming He, Ross Girshick, and Jian Sun. Faster r-cnn: Towards real-time object detection with region proposal networks. IEEE Transactions on Pattern Analysis and Machine Intelligence , 39(6):1137-1149, 2017.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [317.95499, 117.98010999999997, 559.27808, 140.43362000000002], "page": 8, "span": [0, 192], "__ref_s3_data": null}], "text": "- [12] Kaiming He, Georgia Gkioxari, Piotr Doll\u00e1r, and Ross B. Girshick. Mask R-CNN. In IEEE International Conference on Computer Vision , ICCV, pages 2980-2988. IEEE Computer Society, Oct 2017.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [317.95499, 86.099106, 558.97156, 116.52364], "page": 8, "span": [0, 305], "__ref_s3_data": null}], "text": "- [13] Glenn Jocher, Alex Stoken, Ayush Chaurasia, Jirka Borovec, NanoCode012, TaoXie, Yonghye Kwon, Kalen Michael, Liu Changyu, Jiacong Fang, Abhiram V, Laughing, tkianai, yxNONG, Piotr Skalski, Adam Hogan, Jebastin Nadar, imyhxy, Lorenzo Mammana, Alex Wang, Cristi Fati, Diego Montes, Jan Hajek, Laurentiu", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"name": "Picture", "type": "figure", "$ref": "#/figures/5"}, {"prov": [{"bbox": [53.79800000000001, 286.16876, 559.80786, 327.51801], "page": 9, "span": [0, 386], "__ref_s3_data": null}], "text": "Figure 6: Example layout predictions on selected pages from the DocLayNet test-set. (A, D) exhibit favourable results on coloured backgrounds. (B, C) show accurate list-item and paragraph differentiation despite densely-spaced lines. (E) demonstrates good table and figure distinction. (F) shows predictions on a Chinese patent with multiple overlaps, label confusion and missing boxes.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [69.234001, 242.4801, 295.22406, 264.93364999999994], "page": 9, "span": [0, 195], "__ref_s3_data": null}], "text": "Diaconu, Mai Thanh Minh, Marc, albinxavi, fatih, oleg, and wanghao yang. ultralytics/yolov5: v6.0 - yolov5n nano models, roboflow integration, tensorflow export, opencv dnn support, October 2021.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [317.95499, 250.45010000000002, 559.02637, 264.93362], "page": 9, "span": [0, 153], "__ref_s3_data": null}], "text": "- [20] Shoubin Li, Xuyan Ma, Shuaiqun Pan, Jun Hu, Lin Shi, and Qing Wang. Vtlayout: Fusion of visual and text features for document layout analysis, 2021.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [53.79800000000001, 218.56313999999998, 295.12177, 241.02362000000005], "page": 9, "span": [0, 190], "__ref_s3_data": null}], "text": "- [14] Nicolas Carion, Francisco Massa, Gabriel Synnaeve, Nicolas Usunier, Alexander Kirillov, and Sergey Zagoruyko. End-to-end object detection with transformers. CoRR , abs/2005.12872, 2020.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [53.79800000000001, 202.62212999999997, 294.04224, 217.11365], "page": 9, "span": [0, 132], "__ref_s3_data": null}], "text": "- [15] Mingxing Tan, Ruoming Pang, and Quoc V. Le. Efficientdet: Scalable and efficient object detection. CoRR , abs/1911.09070, 2019.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [53.79800399999999, 178.71910000000003, 295.22263, 201.17264], "page": 9, "span": [0, 219], "__ref_s3_data": null}], "text": "- [16] Tsung-Yi Lin, Michael Maire, Serge J. Belongie, Lubomir D. Bourdev, Ross B. Girshick, James Hays, Pietro Perona, Deva Ramanan, Piotr Doll\u00e1r, and C. Lawrence Zitnick. Microsoft COCO: common objects in context, 2014.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [53.79800000000001, 162.77910999999995, 295.12009, 177.26263000000006], "page": 9, "span": [0, 100], "__ref_s3_data": null}], "text": "- [17] Yuxin Wu, Alexander Kirillov, Francisco Massa, Wan-Yen Lo, and Ross Girshick. Detectron2, 2019.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [53.79800000000001, 122.92811000000006, 294.8089, 161.32263], "page": 9, "span": [0, 339], "__ref_s3_data": null}], "text": "- [18] Nikolaos Livathinos, Cesar Berrospi, Maksym Lysak, Viktor Kuropiatnyk, Ahmed Nassar, Andre Carvalho, Michele Dolfi, Christoph Auer, Kasper Dinkla, and Peter W. J. Staar. Robust pdf document conversion using recurrent neural networks. In Proceedings of the 35th Conference on Artificial Intelligence , AAAI, pages 1513715145, feb 2021.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [53.797997, 83.07811000000004, 295.22174, 121.47163], "page": 9, "span": [0, 336], "__ref_s3_data": null}], "text": "- [19] Yiheng Xu, Minghao Li, Lei Cui, Shaohan Huang, Furu Wei, and Ming Zhou. Layoutlm: Pre-training of text and layout for document image understanding. In Proceedings of the 26th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining , KDD, pages 1192-1200, New York, USA, 2020. Association for Computing Machinery.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [317.95499, 226.54009999999994, 558.9715, 248.99361999999996], "page": 9, "span": [0, 188], "__ref_s3_data": null}], "text": "- [21] Peng Zhang, Can Li, Liang Qiao, Zhanzhan Cheng, Shiliang Pu, Yi Niu, and Fei Wu. Vsr: A unified framework for document layout analysis combining vision, semantics and relations, 2021.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [317.95499, 194.65212999999994, 559.27539, 225.08365000000003], "page": 9, "span": [0, 290], "__ref_s3_data": null}], "text": "- [22] Peter W J Staar, Michele Dolfi, Christoph Auer, and Costas Bekas. Corpus conversion service: A machine learning platform to ingest documents at scale. In Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining , KDD, pages 774-782. ACM, 2018.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [317.95499, 178.71213, 559.3783, 193.20263999999997], "page": 9, "span": [0, 138], "__ref_s3_data": null}], "text": "- [23] Connor Shorten and Taghi M. Khoshgoftaar. A survey on image data augmentation for deep learning. Journal of Big Data , 6(1):60, 2019.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}], "figures": [{"prov": [{"bbox": [323.408203125, 266.1492919921875, 553.2952270507812, 541.6512603759766], "page": 1, "span": [0, 84], "__ref_s3_data": null}], "text": "Figure 1: Four examples of complex page layouts across different document categories", "type": "figure", "payload": null, "bounding-box": null}, {"prov": [{"bbox": [88.33030700683594, 571.4317321777344, 263.7049560546875, 699.1134796142578], "page": 3, "span": [0, 69], "__ref_s3_data": null}], "text": "Figure 2: Distribution of DocLayNet pages across document categories.", "type": "figure", "payload": null, "bounding-box": null}, {"prov": [{"bbox": [53.05912780761719, 251.135986328125, 295.8506164550781, 481.2087097167969], "page": 4, "span": [0, 281], "__ref_s3_data": null}], "text": "Figure 3: Corpus Conversion Service annotation user interface. The PDF page is shown in the background, with overlaid text-cells (in darker shades). The annotation boxes can be drawn by dragging a rectangle over each segment with the respective label from the palette on the right.", "type": "figure", "payload": null, "bounding-box": null}, {"prov": [{"bbox": [315.960205078125, 332.31915283203125, 559.396484375, 706.6611862182617], "page": 5, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "figure", "payload": null, "bounding-box": null}, {"prov": [{"bbox": [323.48431396484375, 531.9892272949219, 553.5411376953125, 702.1139678955078], "page": 6, "span": [0, 329], "__ref_s3_data": null}], "text": "Figure 5: Prediction performance (mAP@0.5-0.95) of a Mask R-CNN network with ResNet50 backbone trained on increasing fractions of the DocLayNet dataset. The learning curve flattens around the 80% mark, indicating that increasing the size of the DocLayNet dataset with similar data will not yield significantly better predictions.", "type": "figure", "payload": null, "bounding-box": null}, {"prov": [{"bbox": [52.963985443115234, 349.8648681640625, 556.931640625, 707.2641143798828], "page": 9, "span": [0, 89], "__ref_s3_data": null}], "text": "Text Caption List-Item Formula Table Section-Header Picture Page-Header Page-Footer Title", "type": "figure", "payload": null, "bounding-box": null}], "tables": [{"prov": [{"bbox": [98.93103790283203, 497.91851806640625, 512.579833984375, 654.5245208740234], "page": 4, "span": [0, 0], "__ref_s3_data": null}], "text": "Table 1: DocLayNet dataset overview. Along with the frequency of each class label, we present the relative occurrence (as % of row \"Total\") in the train, test and validation sets. The inter-annotator agreement is computed as the mAP@0.5-0.95 metric between pairwise annotations from the triple-annotated pages, from which we obtain accuracy ranges.", "type": "table", "payload": null, "#-cols": 12, "#-rows": 14, "data": [[{"bbox": null, "spans": [[0, 0]], "text": "", "type": "body"}, {"bbox": null, "spans": [[0, 1]], "text": "", "type": "body"}, {"bbox": [233.94400000000002, 140.22351000000003, 270.04272, 148.59813999999994], "spans": [[0, 2], [0, 3], [0, 4], [0, 5]], "text": "% of Total", "type": "col_header", "col": 2, "col-header": true, "col-span": [2, 6], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [233.94400000000002, 140.22351000000003, 270.04272, 148.59813999999994], "spans": [[0, 2], [0, 3], [0, 4], [0, 5]], "text": "% of Total", "type": "col_header", "col": 3, "col-header": true, "col-span": [2, 6], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [233.94400000000002, 140.22351000000003, 270.04272, 148.59813999999994], "spans": [[0, 2], [0, 3], [0, 4], [0, 5]], "text": "% of Total", "type": "col_header", "col": 4, "col-header": true, "col-span": [2, 6], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [233.94400000000002, 140.22351000000003, 270.04272, 148.59813999999994], "spans": [[0, 2], [0, 3], [0, 4], [0, 5]], "text": "% of Total", "type": "col_header", "col": 5, "col-header": true, "col-span": [2, 6], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [329.04999, 140.22351000000003, 483.3976400000001, 148.59813999999994], "spans": [[0, 6], [0, 7], [0, 8], [0, 9], [0, 10], [0, 11]], "text": "triple inter-annotator mAP @ 0.5-0.95 (%)", "type": "col_header", "col": 6, "col-header": true, "col-span": [6, 12], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [329.04999, 140.22351000000003, 483.3976400000001, 148.59813999999994], "spans": [[0, 6], [0, 7], [0, 8], [0, 9], [0, 10], [0, 11]], "text": "triple inter-annotator mAP @ 0.5-0.95 (%)", "type": "col_header", "col": 7, "col-header": true, "col-span": [6, 12], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [329.04999, 140.22351000000003, 483.3976400000001, 148.59813999999994], "spans": [[0, 6], [0, 7], [0, 8], [0, 9], [0, 10], [0, 11]], "text": "triple inter-annotator mAP @ 0.5-0.95 (%)", "type": "col_header", "col": 8, "col-header": true, "col-span": [6, 12], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [329.04999, 140.22351000000003, 483.3976400000001, 148.59813999999994], "spans": [[0, 6], [0, 7], [0, 8], [0, 9], [0, 10], [0, 11]], "text": "triple inter-annotator mAP @ 0.5-0.95 (%)", "type": "col_header", "col": 9, "col-header": true, "col-span": [6, 12], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [329.04999, 140.22351000000003, 483.3976400000001, 148.59813999999994], "spans": [[0, 6], [0, 7], [0, 8], [0, 9], [0, 10], [0, 11]], "text": "triple inter-annotator mAP @ 0.5-0.95 (%)", "type": "col_header", "col": 10, "col-header": true, "col-span": [6, 12], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [329.04999, 140.22351000000003, 483.3976400000001, 148.59813999999994], "spans": [[0, 6], [0, 7], [0, 8], [0, 9], [0, 10], [0, 11]], "text": "triple inter-annotator mAP @ 0.5-0.95 (%)", "type": "col_header", "col": 11, "col-header": true, "col-span": [6, 12], "row": 0, "row-header": false, "row-span": [0, 1]}], [{"bbox": [104.825, 151.18255999999997, 141.71277, 159.55719], "spans": [[1, 0]], "text": "class label", "type": "col_header", "col": 0, "col-header": true, "col-span": [0, 1], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [175.94701, 151.18255999999997, 198.71269, 159.55719], "spans": [[1, 1]], "text": "Count", "type": "col_header", "col": 1, "col-header": true, "col-span": [1, 2], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [213.795, 151.18255999999997, 233.69144, 159.55719], "spans": [[1, 2]], "text": "Train", "type": "col_header", "col": 2, "col-header": true, "col-span": [2, 3], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [249.37367, 151.18255999999997, 264.5, 159.55719], "spans": [[1, 3]], "text": "Test", "type": "col_header", "col": 3, "col-header": true, "col-span": [3, 4], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [283.53568, 151.18255999999997, 295.30856, 159.55719], "spans": [[1, 4]], "text": "Val", "type": "col_header", "col": 4, "col-header": true, "col-span": [4, 5], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [314.01501, 151.18255999999997, 324.98093, 159.55719], "spans": [[1, 5]], "text": "All", "type": "col_header", "col": 5, "col-header": true, "col-span": [5, 6], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [343.01236, 151.18255999999997, 354.65076, 159.55719], "spans": [[1, 6]], "text": "Fin", "type": "col_header", "col": 6, "col-header": true, "col-span": [6, 7], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [367.84033, 151.18255999999997, 384.32059, 159.55719], "spans": [[1, 7]], "text": "Man", "type": "col_header", "col": 7, "col-header": true, "col-span": [7, 8], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [407.54358, 151.18255999999997, 418.15979, 159.55719], "spans": [[1, 8]], "text": "Sci", "type": "col_header", "col": 8, "col-header": true, "col-span": [8, 9], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [432.29979999999995, 151.18255999999997, 447.82962, 159.55719], "spans": [[1, 9]], "text": "Law", "type": "col_header", "col": 9, "col-header": true, "col-span": [9, 10], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [465.72656, 151.18255999999997, 477.50842, 159.55719], "spans": [[1, 10]], "text": "Pat", "type": "col_header", "col": 10, "col-header": true, "col-span": [10, 11], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [493.52240000000006, 151.18255999999997, 507.17822, 159.55719], "spans": [[1, 11]], "text": "Ten", "type": "col_header", "col": 11, "col-header": true, "col-span": [11, 12], "row": 1, "row-header": false, "row-span": [1, 2]}], [{"bbox": [104.825, 162.53954999999996, 134.01064, 170.91418], "spans": [[2, 0]], "text": "Caption", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 2, "row-header": true, "row-span": [2, 3]}, {"bbox": [177.866, 162.53954999999996, 198.71288, 170.91418], "spans": [[2, 1]], "text": "22524", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [219.211, 162.53954999999996, 233.69174000000004, 170.91418], "spans": [[2, 2]], "text": "2.04", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [250.01956, 162.53954999999996, 264.50031, 170.91418], "spans": [[2, 3]], "text": "1.77", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [280.82812, 162.53954999999996, 295.30887, 170.91418], "spans": [[2, 4]], "text": "2.32", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [305.27301, 162.53954999999996, 324.98117, 170.91418], "spans": [[2, 5]], "text": "84-89", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [334.94284, 162.53954999999996, 354.651, 170.91418], "spans": [[2, 6]], "text": "40-61", "type": "body", "col": 6, "col-header": false, "col-span": [6, 7], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [364.61267, 162.53954999999996, 384.32083, 170.91418], "spans": [[2, 7]], "text": "86-92", "type": "body", "col": 7, "col-header": false, "col-span": [7, 8], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [398.45187, 162.53954999999996, 418.16003, 170.91418], "spans": [[2, 8]], "text": "94-99", "type": "body", "col": 8, "col-header": false, "col-span": [8, 9], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [428.1217, 162.53954999999996, 447.82986, 170.91418], "spans": [[2, 9]], "text": "95-99", "type": "body", "col": 9, "col-header": false, "col-span": [9, 10], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [457.80051, 162.53954999999996, 477.50867, 170.91418], "spans": [[2, 10]], "text": "69-78", "type": "body", "col": 10, "col-header": false, "col-span": [10, 11], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [495.32489, 162.53954999999996, 507.17846999999995, 170.91418], "spans": [[2, 11]], "text": "n/a", "type": "body", "col": 11, "col-header": false, "col-span": [11, 12], "row": 2, "row-header": false, "row-span": [2, 3]}], [{"bbox": [104.825, 173.49854000000005, 137.3282, 181.87316999999996], "spans": [[3, 0]], "text": "Footnote", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 3, "row-header": true, "row-span": [3, 4]}, {"bbox": [182.035, 173.49854000000005, 198.71251, 181.87316999999996], "spans": [[3, 1]], "text": "6318", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [219.211, 173.49854000000005, 233.69174000000004, 181.87316999999996], "spans": [[3, 2]], "text": "0.60", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [250.01956, 173.49854000000005, 264.50031, 181.87316999999996], "spans": [[3, 3]], "text": "0.31", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [280.82812, 173.49854000000005, 295.30887, 181.87316999999996], "spans": [[3, 4]], "text": "0.58", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [305.27301, 173.49854000000005, 324.98117, 181.87316999999996], "spans": [[3, 5]], "text": "83-91", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [342.79739, 173.49854000000005, 354.65097, 181.87316999999996], "spans": [[3, 6]], "text": "n/a", "type": "body", "col": 6, "col-header": false, "col-span": [6, 7], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [371.81265, 173.49854000000005, 384.32077, 181.87316999999996], "spans": [[3, 7]], "text": "100", "type": "body", "col": 7, "col-header": false, "col-span": [7, 8], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [398.45181, 173.49854000000005, 418.15997, 181.87316999999996], "spans": [[3, 8]], "text": "62-88", "type": "body", "col": 8, "col-header": false, "col-span": [8, 9], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [428.12164, 173.49854000000005, 447.8298, 181.87316999999996], "spans": [[3, 9]], "text": "85-94", "type": "body", "col": 9, "col-header": false, "col-span": [9, 10], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [465.655, 173.49854000000005, 477.50857999999994, 181.87316999999996], "spans": [[3, 10]], "text": "n/a", "type": "body", "col": 10, "col-header": false, "col-span": [10, 11], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [487.47025, 173.49854000000005, 507.17841, 181.87316999999996], "spans": [[3, 11]], "text": "82-97", "type": "body", "col": 11, "col-header": false, "col-span": [11, 12], "row": 3, "row-header": false, "row-span": [3, 4]}], [{"bbox": [104.825, 184.45752000000005, 135.33766, 192.83214999999996], "spans": [[4, 0]], "text": "Formula", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 4, "row-header": true, "row-span": [4, 5]}, {"bbox": [177.866, 184.45752000000005, 198.71288, 192.83214999999996], "spans": [[4, 1]], "text": "25027", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [219.211, 184.45752000000005, 233.69174000000004, 192.83214999999996], "spans": [[4, 2]], "text": "2.25", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [250.01956, 184.45752000000005, 264.50031, 192.83214999999996], "spans": [[4, 3]], "text": "1.90", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [280.82812, 184.45752000000005, 295.30887, 192.83214999999996], "spans": [[4, 4]], "text": "2.96", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [305.27301, 184.45752000000005, 324.98117, 192.83214999999996], "spans": [[4, 5]], "text": "83-85", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [342.79739, 184.45752000000005, 354.65097, 192.83214999999996], "spans": [[4, 6]], "text": "n/a", "type": "body", "col": 6, "col-header": false, "col-span": [6, 7], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [372.46719, 184.45752000000005, 384.32077, 192.83214999999996], "spans": [[4, 7]], "text": "n/a", "type": "body", "col": 7, "col-header": false, "col-span": [7, 8], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [398.45181, 184.45752000000005, 418.15997, 192.83214999999996], "spans": [[4, 8]], "text": "84-87", "type": "body", "col": 8, "col-header": false, "col-span": [8, 9], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [428.12164, 184.45752000000005, 447.8298, 192.83214999999996], "spans": [[4, 9]], "text": "86-96", "type": "body", "col": 9, "col-header": false, "col-span": [9, 10], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [465.655, 184.45752000000005, 477.50857999999994, 192.83214999999996], "spans": [[4, 10]], "text": "n/a", "type": "body", "col": 10, "col-header": false, "col-span": [10, 11], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [495.3248, 184.45752000000005, 507.17838000000006, 192.83214999999996], "spans": [[4, 11]], "text": "n/a", "type": "body", "col": 11, "col-header": false, "col-span": [11, 12], "row": 4, "row-header": false, "row-span": [4, 5]}], [{"bbox": [104.825, 195.41656, 137.70479, 203.7912], "spans": [[5, 0]], "text": "List-item", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 5, "row-header": true, "row-span": [5, 6]}, {"bbox": [173.69701, 195.41656, 198.71326, 203.7912], "spans": [[5, 1]], "text": "185660", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [215.04201, 195.41656, 233.69212, 203.7912], "spans": [[5, 2]], "text": "17.19", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [245.85056, 195.41656, 264.50067, 203.7912], "spans": [[5, 3]], "text": "13.34", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [276.65912, 195.41656, 295.30923, 203.7912], "spans": [[5, 4]], "text": "15.82", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [305.27301, 195.41656, 324.98117, 203.7912], "spans": [[5, 5]], "text": "87-88", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [334.94284, 195.41656, 354.651, 203.7912], "spans": [[5, 6]], "text": "74-83", "type": "body", "col": 6, "col-header": false, "col-span": [6, 7], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [364.61267, 195.41656, 384.32083, 203.7912], "spans": [[5, 7]], "text": "90-92", "type": "body", "col": 7, "col-header": false, "col-span": [7, 8], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [398.45187, 195.41656, 418.16003, 203.7912], "spans": [[5, 8]], "text": "97-97", "type": "body", "col": 8, "col-header": false, "col-span": [8, 9], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [428.1217, 195.41656, 447.82986, 203.7912], "spans": [[5, 9]], "text": "81-85", "type": "body", "col": 9, "col-header": false, "col-span": [9, 10], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [457.80051, 195.41656, 477.50867, 203.7912], "spans": [[5, 10]], "text": "75-88", "type": "body", "col": 10, "col-header": false, "col-span": [10, 11], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [487.47034, 195.41656, 507.17849999999993, 203.7912], "spans": [[5, 11]], "text": "93-95", "type": "body", "col": 11, "col-header": false, "col-span": [11, 12], "row": 5, "row-header": false, "row-span": [5, 6]}], [{"bbox": [104.825, 206.37554999999998, 147.35262, 214.75018], "spans": [[6, 0]], "text": "Page-footer", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 6, "row-header": true, "row-span": [6, 7]}, {"bbox": [177.866, 206.37554999999998, 198.71288, 214.75018], "spans": [[6, 1]], "text": "70878", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [219.211, 206.37554999999998, 233.69174000000004, 214.75018], "spans": [[6, 2]], "text": "6.51", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [250.01956, 206.37554999999998, 264.50031, 214.75018], "spans": [[6, 3]], "text": "5.58", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [280.82812, 206.37554999999998, 295.30887, 214.75018], "spans": [[6, 4]], "text": "6.00", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [305.27301, 206.37554999999998, 324.98117, 214.75018], "spans": [[6, 5]], "text": "93-94", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [334.94284, 206.37554999999998, 354.651, 214.75018], "spans": [[6, 6]], "text": "88-90", "type": "body", "col": 6, "col-header": false, "col-span": [6, 7], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [364.61267, 206.37554999999998, 384.32083, 214.75018], "spans": [[6, 7]], "text": "95-96", "type": "body", "col": 7, "col-header": false, "col-span": [7, 8], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [405.65189, 206.37554999999998, 418.16, 214.75018], "spans": [[6, 8]], "text": "100", "type": "body", "col": 8, "col-header": false, "col-span": [8, 9], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [428.12167, 206.37554999999998, 447.82983, 214.75018], "spans": [[6, 9]], "text": "92-97", "type": "body", "col": 9, "col-header": false, "col-span": [9, 10], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [465.00049, 206.37554999999998, 477.5086099999999, 214.75018], "spans": [[6, 10]], "text": "100", "type": "body", "col": 10, "col-header": false, "col-span": [10, 11], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [487.47028, 206.37554999999998, 507.17843999999997, 214.75018], "spans": [[6, 11]], "text": "96-98", "type": "body", "col": 11, "col-header": false, "col-span": [11, 12], "row": 6, "row-header": false, "row-span": [6, 7]}], [{"bbox": [104.825, 217.33452999999997, 150.10532, 225.70916999999997], "spans": [[7, 0]], "text": "Page-header", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 7, "row-header": true, "row-span": [7, 8]}, {"bbox": [177.866, 217.33452999999997, 198.71288, 225.70916999999997], "spans": [[7, 1]], "text": "58022", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 7, "row-header": false, "row-span": [7, 8]}, {"bbox": [219.211, 217.33452999999997, 233.69174000000004, 225.70916999999997], "spans": [[7, 2]], "text": "5.10", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 7, "row-header": false, "row-span": [7, 8]}, {"bbox": [250.01956, 217.33452999999997, 264.50031, 225.70916999999997], "spans": [[7, 3]], "text": "6.70", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 7, "row-header": false, "row-span": [7, 8]}, {"bbox": [280.82812, 217.33452999999997, 295.30887, 225.70916999999997], "spans": [[7, 4]], "text": "5.06", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 7, "row-header": false, "row-span": [7, 8]}, {"bbox": [305.27301, 217.33452999999997, 324.98117, 225.70916999999997], "spans": [[7, 5]], "text": "85-89", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 7, "row-header": false, "row-span": [7, 8]}, {"bbox": [334.94284, 217.33452999999997, 354.651, 225.70916999999997], "spans": [[7, 6]], "text": "66-76", "type": "body", "col": 6, "col-header": false, "col-span": [6, 7], "row": 7, "row-header": false, "row-span": [7, 8]}, {"bbox": [364.61267, 217.33452999999997, 384.32083, 225.70916999999997], "spans": [[7, 7]], "text": "90-94", "type": "body", "col": 7, "col-header": false, "col-span": [7, 8], "row": 7, "row-header": false, "row-span": [7, 8]}, {"bbox": [394.2825, 217.33452999999997, 418.16003, 225.70916999999997], "spans": [[7, 8]], "text": "98-100", "type": "body", "col": 8, "col-header": false, "col-span": [8, 9], "row": 7, "row-header": false, "row-span": [7, 8]}, {"bbox": [428.1217, 217.33452999999997, 447.82986, 225.70916999999997], "spans": [[7, 9]], "text": "91-92", "type": "body", "col": 9, "col-header": false, "col-span": [9, 10], "row": 7, "row-header": false, "row-span": [7, 8]}, {"bbox": [457.80051, 217.33452999999997, 477.50867, 225.70916999999997], "spans": [[7, 10]], "text": "97-99", "type": "body", "col": 10, "col-header": false, "col-span": [10, 11], "row": 7, "row-header": false, "row-span": [7, 8]}, {"bbox": [487.47034, 217.33452999999997, 507.17849999999993, 225.70916999999997], "spans": [[7, 11]], "text": "81-86", "type": "body", "col": 11, "col-header": false, "col-span": [11, 12], "row": 7, "row-header": false, "row-span": [7, 8]}], [{"bbox": [104.825, 228.29351999999994, 130.80963, 236.66814999999997], "spans": [[8, 0]], "text": "Picture", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 8, "row-header": true, "row-span": [8, 9]}, {"bbox": [177.866, 228.29351999999994, 198.71288, 236.66814999999997], "spans": [[8, 1]], "text": "45976", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 8, "row-header": false, "row-span": [8, 9]}, {"bbox": [219.211, 228.29351999999994, 233.69174000000004, 236.66814999999997], "spans": [[8, 2]], "text": "4.21", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 8, "row-header": false, "row-span": [8, 9]}, {"bbox": [250.01956, 228.29351999999994, 264.50031, 236.66814999999997], "spans": [[8, 3]], "text": "2.78", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 8, "row-header": false, "row-span": [8, 9]}, {"bbox": [280.82812, 228.29351999999994, 295.30887, 236.66814999999997], "spans": [[8, 4]], "text": "5.31", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 8, "row-header": false, "row-span": [8, 9]}, {"bbox": [305.27301, 228.29351999999994, 324.98117, 236.66814999999997], "spans": [[8, 5]], "text": "69-71", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 8, "row-header": false, "row-span": [8, 9]}, {"bbox": [334.94284, 228.29351999999994, 354.651, 236.66814999999997], "spans": [[8, 6]], "text": "56-59", "type": "body", "col": 6, "col-header": false, "col-span": [6, 7], "row": 8, "row-header": false, "row-span": [8, 9]}, {"bbox": [364.61267, 228.29351999999994, 384.32083, 236.66814999999997], "spans": [[8, 7]], "text": "82-86", "type": "body", "col": 7, "col-header": false, "col-span": [7, 8], "row": 8, "row-header": false, "row-span": [8, 9]}, {"bbox": [398.45187, 228.29351999999994, 418.16003, 236.66814999999997], "spans": [[8, 8]], "text": "69-82", "type": "body", "col": 8, "col-header": false, "col-span": [8, 9], "row": 8, "row-header": false, "row-span": [8, 9]}, {"bbox": [428.1217, 228.29351999999994, 447.82986, 236.66814999999997], "spans": [[8, 9]], "text": "80-95", "type": "body", "col": 9, "col-header": false, "col-span": [9, 10], "row": 8, "row-header": false, "row-span": [8, 9]}, {"bbox": [457.80051, 228.29351999999994, 477.50867, 236.66814999999997], "spans": [[8, 10]], "text": "66-71", "type": "body", "col": 10, "col-header": false, "col-span": [10, 11], "row": 8, "row-header": false, "row-span": [8, 9]}, {"bbox": [487.47034, 228.29351999999994, 507.17849999999993, 236.66814999999997], "spans": [[8, 11]], "text": "59-76", "type": "body", "col": 11, "col-header": false, "col-span": [11, 12], "row": 8, "row-header": false, "row-span": [8, 9]}], [{"bbox": [104.825, 239.25256000000002, 159.56487, 247.62720000000002], "spans": [[9, 0]], "text": "Section-header", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 9, "row-header": true, "row-span": [9, 10]}, {"bbox": [173.69701, 239.25256000000002, 198.71326, 247.62720000000002], "spans": [[9, 1]], "text": "142884", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 9, "row-header": false, "row-span": [9, 10]}, {"bbox": [215.04201, 239.25256000000002, 233.69212, 247.62720000000002], "spans": [[9, 2]], "text": "12.60", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 9, "row-header": false, "row-span": [9, 10]}, {"bbox": [245.85056, 239.25256000000002, 264.50067, 247.62720000000002], "spans": [[9, 3]], "text": "15.77", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 9, "row-header": false, "row-span": [9, 10]}, {"bbox": [276.65912, 239.25256000000002, 295.30923, 247.62720000000002], "spans": [[9, 4]], "text": "12.85", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 9, "row-header": false, "row-span": [9, 10]}, {"bbox": [305.27301, 239.25256000000002, 324.98117, 247.62720000000002], "spans": [[9, 5]], "text": "83-84", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 9, "row-header": false, "row-span": [9, 10]}, {"bbox": [334.94284, 239.25256000000002, 354.651, 247.62720000000002], "spans": [[9, 6]], "text": "76-81", "type": "body", "col": 6, "col-header": false, "col-span": [6, 7], "row": 9, "row-header": false, "row-span": [9, 10]}, {"bbox": [364.61267, 239.25256000000002, 384.32083, 247.62720000000002], "spans": [[9, 7]], "text": "90-92", "type": "body", "col": 7, "col-header": false, "col-span": [7, 8], "row": 9, "row-header": false, "row-span": [9, 10]}, {"bbox": [398.45187, 239.25256000000002, 418.16003, 247.62720000000002], "spans": [[9, 8]], "text": "94-95", "type": "body", "col": 8, "col-header": false, "col-span": [8, 9], "row": 9, "row-header": false, "row-span": [9, 10]}, {"bbox": [428.1217, 239.25256000000002, 447.82986, 247.62720000000002], "spans": [[9, 9]], "text": "87-94", "type": "body", "col": 9, "col-header": false, "col-span": [9, 10], "row": 9, "row-header": false, "row-span": [9, 10]}, {"bbox": [457.80051, 239.25256000000002, 477.50867, 247.62720000000002], "spans": [[9, 10]], "text": "69-73", "type": "body", "col": 10, "col-header": false, "col-span": [10, 11], "row": 9, "row-header": false, "row-span": [9, 10]}, {"bbox": [487.47034, 239.25256000000002, 507.17849999999993, 247.62720000000002], "spans": [[9, 11]], "text": "78-86", "type": "body", "col": 11, "col-header": false, "col-span": [11, 12], "row": 9, "row-header": false, "row-span": [9, 10]}], [{"bbox": [104.825, 250.21155, 124.63177, 258.58618], "spans": [[10, 0]], "text": "Table", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 10, "row-header": true, "row-span": [10, 11]}, {"bbox": [177.866, 250.21155, 198.71288, 258.58618], "spans": [[10, 1]], "text": "34733", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 10, "row-header": false, "row-span": [10, 11]}, {"bbox": [219.211, 250.21155, 233.69174000000004, 258.58618], "spans": [[10, 2]], "text": "3.20", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 10, "row-header": false, "row-span": [10, 11]}, {"bbox": [250.01956, 250.21155, 264.50031, 258.58618], "spans": [[10, 3]], "text": "2.27", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 10, "row-header": false, "row-span": [10, 11]}, {"bbox": [280.82812, 250.21155, 295.30887, 258.58618], "spans": [[10, 4]], "text": "3.60", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 10, "row-header": false, "row-span": [10, 11]}, {"bbox": [305.27301, 250.21155, 324.98117, 258.58618], "spans": [[10, 5]], "text": "77-81", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 10, "row-header": false, "row-span": [10, 11]}, {"bbox": [334.94284, 250.21155, 354.651, 258.58618], "spans": [[10, 6]], "text": "75-80", "type": "body", "col": 6, "col-header": false, "col-span": [6, 7], "row": 10, "row-header": false, "row-span": [10, 11]}, {"bbox": [364.61267, 250.21155, 384.32083, 258.58618], "spans": [[10, 7]], "text": "83-86", "type": "body", "col": 7, "col-header": false, "col-span": [7, 8], "row": 10, "row-header": false, "row-span": [10, 11]}, {"bbox": [398.45187, 250.21155, 418.16003, 258.58618], "spans": [[10, 8]], "text": "98-99", "type": "body", "col": 8, "col-header": false, "col-span": [8, 9], "row": 10, "row-header": false, "row-span": [10, 11]}, {"bbox": [428.1217, 250.21155, 447.82986, 258.58618], "spans": [[10, 9]], "text": "58-80", "type": "body", "col": 9, "col-header": false, "col-span": [9, 10], "row": 10, "row-header": false, "row-span": [10, 11]}, {"bbox": [457.80051, 250.21155, 477.50867, 258.58618], "spans": [[10, 10]], "text": "79-84", "type": "body", "col": 10, "col-header": false, "col-span": [10, 11], "row": 10, "row-header": false, "row-span": [10, 11]}, {"bbox": [487.47034, 250.21155, 507.17849999999993, 258.58618], "spans": [[10, 11]], "text": "70-85", "type": "body", "col": 11, "col-header": false, "col-span": [11, 12], "row": 10, "row-header": false, "row-span": [10, 11]}], [{"bbox": [104.825, 261.16956000000005, 120.78519, 269.54418999999996], "spans": [[11, 0]], "text": "Text", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 11, "row-header": true, "row-span": [11, 12]}, {"bbox": [173.69701, 261.16956000000005, 198.71326, 269.54418999999996], "spans": [[11, 1]], "text": "510377", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 11, "row-header": false, "row-span": [11, 12]}, {"bbox": [215.04201, 261.16956000000005, 233.69212, 269.54418999999996], "spans": [[11, 2]], "text": "45.82", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 11, "row-header": false, "row-span": [11, 12]}, {"bbox": [245.85056, 261.16956000000005, 264.50067, 269.54418999999996], "spans": [[11, 3]], "text": "49.28", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 11, "row-header": false, "row-span": [11, 12]}, {"bbox": [276.65912, 261.16956000000005, 295.30923, 269.54418999999996], "spans": [[11, 4]], "text": "45.00", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 11, "row-header": false, "row-span": [11, 12]}, {"bbox": [305.27301, 261.16956000000005, 324.98117, 269.54418999999996], "spans": [[11, 5]], "text": "84-86", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 11, "row-header": false, "row-span": [11, 12]}, {"bbox": [334.94284, 261.16956000000005, 354.651, 269.54418999999996], "spans": [[11, 6]], "text": "81-86", "type": "body", "col": 6, "col-header": false, "col-span": [6, 7], "row": 11, "row-header": false, "row-span": [11, 12]}, {"bbox": [364.61267, 261.16956000000005, 384.32083, 269.54418999999996], "spans": [[11, 7]], "text": "88-93", "type": "body", "col": 7, "col-header": false, "col-span": [7, 8], "row": 11, "row-header": false, "row-span": [11, 12]}, {"bbox": [398.45187, 261.16956000000005, 418.16003, 269.54418999999996], "spans": [[11, 8]], "text": "89-93", "type": "body", "col": 8, "col-header": false, "col-span": [8, 9], "row": 11, "row-header": false, "row-span": [11, 12]}, {"bbox": [428.1217, 261.16956000000005, 447.82986, 269.54418999999996], "spans": [[11, 9]], "text": "87-92", "type": "body", "col": 9, "col-header": false, "col-span": [9, 10], "row": 11, "row-header": false, "row-span": [11, 12]}, {"bbox": [457.80051, 261.16956000000005, 477.50867, 269.54418999999996], "spans": [[11, 10]], "text": "71-79", "type": "body", "col": 10, "col-header": false, "col-span": [10, 11], "row": 11, "row-header": false, "row-span": [11, 12]}, {"bbox": [487.47034, 261.16956000000005, 507.17849999999993, 269.54418999999996], "spans": [[11, 11]], "text": "87-95", "type": "body", "col": 11, "col-header": false, "col-span": [11, 12], "row": 11, "row-header": false, "row-span": [11, 12]}], [{"bbox": [104.825, 272.12854000000004, 121.81633, 280.50317], "spans": [[12, 0]], "text": "Title", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 12, "row-header": true, "row-span": [12, 13]}, {"bbox": [182.035, 272.12854000000004, 198.71251, 280.50317], "spans": [[12, 1]], "text": "5071", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 12, "row-header": false, "row-span": [12, 13]}, {"bbox": [219.211, 272.12854000000004, 233.69174000000004, 280.50317], "spans": [[12, 2]], "text": "0.47", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 12, "row-header": false, "row-span": [12, 13]}, {"bbox": [250.01956, 272.12854000000004, 264.50031, 280.50317], "spans": [[12, 3]], "text": "0.30", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 12, "row-header": false, "row-span": [12, 13]}, {"bbox": [280.82812, 272.12854000000004, 295.30887, 280.50317], "spans": [[12, 4]], "text": "0.50", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 12, "row-header": false, "row-span": [12, 13]}, {"bbox": [305.27301, 272.12854000000004, 324.98117, 280.50317], "spans": [[12, 5]], "text": "60-72", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 12, "row-header": false, "row-span": [12, 13]}, {"bbox": [334.94284, 272.12854000000004, 354.651, 280.50317], "spans": [[12, 6]], "text": "24-63", "type": "body", "col": 6, "col-header": false, "col-span": [6, 7], "row": 12, "row-header": false, "row-span": [12, 13]}, {"bbox": [364.61267, 272.12854000000004, 384.32083, 280.50317], "spans": [[12, 7]], "text": "50-63", "type": "body", "col": 7, "col-header": false, "col-span": [7, 8], "row": 12, "row-header": false, "row-span": [12, 13]}, {"bbox": [394.2825, 272.12854000000004, 418.16003, 280.50317], "spans": [[12, 8]], "text": "94-100", "type": "body", "col": 8, "col-header": false, "col-span": [8, 9], "row": 12, "row-header": false, "row-span": [12, 13]}, {"bbox": [428.1217, 272.12854000000004, 447.82986, 280.50317], "spans": [[12, 9]], "text": "82-96", "type": "body", "col": 9, "col-header": false, "col-span": [9, 10], "row": 12, "row-header": false, "row-span": [12, 13]}, {"bbox": [457.80051, 272.12854000000004, 477.50867, 280.50317], "spans": [[12, 10]], "text": "68-79", "type": "body", "col": 10, "col-header": false, "col-span": [10, 11], "row": 12, "row-header": false, "row-span": [12, 13]}, {"bbox": [487.47034, 272.12854000000004, 507.17849999999993, 280.50317], "spans": [[12, 11]], "text": "24-56", "type": "body", "col": 11, "col-header": false, "col-span": [11, 12], "row": 12, "row-header": false, "row-span": [12, 13]}], [{"bbox": [104.825, 283.48654, 123.43028, 291.86118000000005], "spans": [[13, 0]], "text": "Total", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 13, "row-header": true, "row-span": [13, 14]}, {"bbox": [169.52699, 283.48654, 198.71263, 291.86118000000005], "spans": [[13, 1]], "text": "1107470", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 13, "row-header": false, "row-span": [13, 14]}, {"bbox": [208.675, 283.48654, 233.69124999999997, 291.86118000000005], "spans": [[13, 2]], "text": "941123", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 13, "row-header": false, "row-span": [13, 14]}, {"bbox": [243.65291999999997, 283.48654, 264.49982, 291.86118000000005], "spans": [[13, 3]], "text": "99816", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 13, "row-header": false, "row-span": [13, 14]}, {"bbox": [274.46149, 283.48654, 295.30838, 291.86118000000005], "spans": [[13, 4]], "text": "66531", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 13, "row-header": false, "row-span": [13, 14]}, {"bbox": [305.27301, 283.48654, 324.98117, 291.86118000000005], "spans": [[13, 5]], "text": "82-83", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 13, "row-header": false, "row-span": [13, 14]}, {"bbox": [334.94284, 283.48654, 354.651, 291.86118000000005], "spans": [[13, 6]], "text": "71-74", "type": "body", "col": 6, "col-header": false, "col-span": [6, 7], "row": 13, "row-header": false, "row-span": [13, 14]}, {"bbox": [364.61267, 283.48654, 384.32083, 291.86118000000005], "spans": [[13, 7]], "text": "79-81", "type": "body", "col": 7, "col-header": false, "col-span": [7, 8], "row": 13, "row-header": false, "row-span": [13, 14]}, {"bbox": [398.45187, 283.48654, 418.16003, 291.86118000000005], "spans": [[13, 8]], "text": "89-94", "type": "body", "col": 8, "col-header": false, "col-span": [8, 9], "row": 13, "row-header": false, "row-span": [13, 14]}, {"bbox": [428.1217, 283.48654, 447.82986, 291.86118000000005], "spans": [[13, 9]], "text": "86-91", "type": "body", "col": 9, "col-header": false, "col-span": [9, 10], "row": 13, "row-header": false, "row-span": [13, 14]}, {"bbox": [457.80051, 283.48654, 477.50867, 291.86118000000005], "spans": [[13, 10]], "text": "71-76", "type": "body", "col": 10, "col-header": false, "col-span": [10, 11], "row": 13, "row-header": false, "row-span": [13, 14]}, {"bbox": [487.47034, 283.48654, 507.17849999999993, 291.86118000000005], "spans": [[13, 11]], "text": "68-85", "type": "body", "col": 11, "col-header": false, "col-span": [11, 12], "row": 13, "row-header": false, "row-span": [13, 14]}]], "model": null, "bounding-box": null}, {"prov": [{"bbox": [62.02753829956055, 440.3381042480469, 285.78955078125, 596.3199310302734], "page": 6, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "table", "payload": null, "#-cols": 6, "#-rows": 14, "data": [[{"bbox": null, "spans": [[0, 0]], "text": "", "type": "body"}, {"bbox": [132.36501, 197.97351000000003, 157.99098, 206.34813999999994], "spans": [[0, 1], [1, 1]], "text": "human", "type": "col_header", "col": 1, "col-header": true, "col-span": [1, 2], "row": 0, "row-header": false, "row-span": [0, 2]}, {"bbox": [173.505, 197.97351000000003, 204.61841, 206.34813999999994], "spans": [[0, 2], [0, 3]], "text": "MRCNN", "type": "col_header", "col": 2, "col-header": true, "col-span": [2, 4], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [173.505, 197.97351000000003, 204.61841, 206.34813999999994], "spans": [[0, 2], [0, 3]], "text": "MRCNN", "type": "col_header", "col": 3, "col-header": true, "col-span": [2, 4], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [220.13028, 197.97351000000003, 248.06958, 206.34813999999994], "spans": [[0, 4]], "text": "FRCNN", "type": "col_header", "col": 4, "col-header": true, "col-span": [4, 5], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [258.03125, 197.97351000000003, 280.17825, 206.34813999999994], "spans": [[0, 5]], "text": "YOLO", "type": "col_header", "col": 5, "col-header": true, "col-span": [5, 6], "row": 0, "row-header": false, "row-span": [0, 1]}], [{"bbox": null, "spans": [[1, 0]], "text": "", "type": "body"}, {"bbox": [132.36501, 197.97351000000003, 157.99098, 206.34813999999994], "spans": [[0, 1], [1, 1]], "text": "human", "type": "col_header", "col": 1, "col-header": true, "col-span": [1, 2], "row": 1, "row-header": false, "row-span": [0, 2]}, {"bbox": [168.39301, 208.93255999999997, 181.99504, 217.30719], "spans": [[1, 2]], "text": "R50", "type": "col_header", "col": 2, "col-header": true, "col-span": [2, 3], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [192.39606, 208.93255999999997, 210.16747, 217.30719], "spans": [[1, 3]], "text": "R101", "type": "col_header", "col": 3, "col-header": true, "col-span": [3, 4], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [225.21309, 208.93255999999997, 242.9845, 217.30719], "spans": [[1, 4]], "text": "R101", "type": "col_header", "col": 4, "col-header": true, "col-span": [4, 5], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [260.51379, 208.93255999999997, 277.70239, 217.30719], "spans": [[1, 5]], "text": "v5x6", "type": "col_header", "col": 5, "col-header": true, "col-span": [5, 6], "row": 1, "row-header": false, "row-span": [1, 2]}], [{"bbox": [67.663002, 220.28954999999996, 96.848633, 228.66418], "spans": [[2, 0]], "text": "Caption", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 2, "row-header": true, "row-span": [2, 3]}, {"bbox": [135.32401, 220.28954999999996, 155.03215, 228.66418], "spans": [[2, 1]], "text": "84-89", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [167.95399, 220.28954999999996, 182.43472, 228.66418], "spans": [[2, 2]], "text": "68.4", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [194.0462, 220.28954999999996, 208.52695, 228.66418], "spans": [[2, 3]], "text": "71.5", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [226.86324000000002, 220.28954999999996, 241.34396, 228.66418], "spans": [[2, 4]], "text": "70.1", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [261.86804, 220.28954999999996, 276.34879, 228.66418], "spans": [[2, 5]], "text": "77.7", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 2, "row-header": false, "row-span": [2, 3]}], [{"bbox": [67.663002, 231.24854000000005, 100.1662, 239.62316999999996], "spans": [[3, 0]], "text": "Footnote", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 3, "row-header": true, "row-span": [3, 4]}, {"bbox": [135.32401, 231.24854000000005, 155.03215, 239.62316999999996], "spans": [[3, 1]], "text": "83-91", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [167.95399, 231.24854000000005, 182.43472, 239.62316999999996], "spans": [[3, 2]], "text": "70.9", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [194.0462, 231.24854000000005, 208.52695, 239.62316999999996], "spans": [[3, 3]], "text": "71.8", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [226.86324000000002, 231.24854000000005, 241.34396, 239.62316999999996], "spans": [[3, 4]], "text": "73.7", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [261.86804, 231.24854000000005, 276.34879, 239.62316999999996], "spans": [[3, 5]], "text": "77.2", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 3, "row-header": false, "row-span": [3, 4]}], [{"bbox": [67.663002, 242.20752000000005, 98.175659, 250.58214999999996], "spans": [[4, 0]], "text": "Formula", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 4, "row-header": true, "row-span": [4, 5]}, {"bbox": [135.32401, 242.20752000000005, 155.03215, 250.58214999999996], "spans": [[4, 1]], "text": "83-85", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [167.95399, 242.20752000000005, 182.43472, 250.58214999999996], "spans": [[4, 2]], "text": "60.1", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [194.0462, 242.20752000000005, 208.52695, 250.58214999999996], "spans": [[4, 3]], "text": "63.4", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [226.86324000000002, 242.20752000000005, 241.34396, 250.58214999999996], "spans": [[4, 4]], "text": "63.5", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [261.86804, 242.20752000000005, 276.34879, 250.58214999999996], "spans": [[4, 5]], "text": "66.2", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 4, "row-header": false, "row-span": [4, 5]}], [{"bbox": [67.663002, 253.16656, 100.54279, 261.5412], "spans": [[5, 0]], "text": "List-item", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 5, "row-header": true, "row-span": [5, 6]}, {"bbox": [135.32401, 253.16656, 155.03215, 261.5412], "spans": [[5, 1]], "text": "87-88", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [167.95399, 253.16656, 182.43472, 261.5412], "spans": [[5, 2]], "text": "81.2", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [194.0462, 253.16656, 208.52695, 261.5412], "spans": [[5, 3]], "text": "80.8", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [226.86324000000002, 253.16656, 241.34396, 261.5412], "spans": [[5, 4]], "text": "81.0", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [261.86804, 253.16656, 276.34879, 261.5412], "spans": [[5, 5]], "text": "86.2", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 5, "row-header": false, "row-span": [5, 6]}], [{"bbox": [67.663002, 264.12555, 110.19064, 272.50018], "spans": [[6, 0]], "text": "Page-footer", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 6, "row-header": true, "row-span": [6, 7]}, {"bbox": [135.32401, 264.12555, 155.03215, 272.50018], "spans": [[6, 1]], "text": "93-94", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [167.95399, 264.12555, 182.43472, 272.50018], "spans": [[6, 2]], "text": "61.6", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [194.0462, 264.12555, 208.52695, 272.50018], "spans": [[6, 3]], "text": "59.3", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [226.86324000000002, 264.12555, 241.34396, 272.50018], "spans": [[6, 4]], "text": "58.9", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [261.86804, 264.12555, 276.34879, 272.50018], "spans": [[6, 5]], "text": "61.1", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 6, "row-header": false, "row-span": [6, 7]}], [{"bbox": [67.663002, 275.08453, 112.94331999999999, 283.45917], "spans": [[7, 0]], "text": "Page-header", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 7, "row-header": true, "row-span": [7, 8]}, {"bbox": [135.32401, 275.08453, 155.03215, 283.45917], "spans": [[7, 1]], "text": "85-89", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 7, "row-header": false, "row-span": [7, 8]}, {"bbox": [167.95399, 275.08453, 182.43472, 283.45917], "spans": [[7, 2]], "text": "71.9", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 7, "row-header": false, "row-span": [7, 8]}, {"bbox": [194.0462, 275.08453, 208.52695, 283.45917], "spans": [[7, 3]], "text": "70.0", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 7, "row-header": false, "row-span": [7, 8]}, {"bbox": [226.86324000000002, 275.08453, 241.34396, 283.45917], "spans": [[7, 4]], "text": "72.0", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 7, "row-header": false, "row-span": [7, 8]}, {"bbox": [261.86804, 275.08453, 276.34879, 283.45917], "spans": [[7, 5]], "text": "67.9", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 7, "row-header": false, "row-span": [7, 8]}], [{"bbox": [67.663002, 286.04355000000004, 93.647629, 294.41818], "spans": [[8, 0]], "text": "Picture", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 8, "row-header": true, "row-span": [8, 9]}, {"bbox": [135.32401, 286.04355000000004, 155.03215, 294.41818], "spans": [[8, 1]], "text": "69-71", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 8, "row-header": false, "row-span": [8, 9]}, {"bbox": [167.95399, 286.04355000000004, 182.43472, 294.41818], "spans": [[8, 2]], "text": "71.7", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 8, "row-header": false, "row-span": [8, 9]}, {"bbox": [194.0462, 286.04355000000004, 208.52695, 294.41818], "spans": [[8, 3]], "text": "72.7", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 8, "row-header": false, "row-span": [8, 9]}, {"bbox": [226.86324000000002, 286.04355000000004, 241.34396, 294.41818], "spans": [[8, 4]], "text": "72.0", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 8, "row-header": false, "row-span": [8, 9]}, {"bbox": [261.86804, 286.04355000000004, 276.34879, 294.41818], "spans": [[8, 5]], "text": "77.1", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 8, "row-header": false, "row-span": [8, 9]}], [{"bbox": [67.663002, 297.00253, 122.40287999999998, 305.37717], "spans": [[9, 0]], "text": "Section-header", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 9, "row-header": true, "row-span": [9, 10]}, {"bbox": [135.32401, 297.00253, 155.03215, 305.37717], "spans": [[9, 1]], "text": "83-84", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 9, "row-header": false, "row-span": [9, 10]}, {"bbox": [167.95399, 297.00253, 182.43472, 305.37717], "spans": [[9, 2]], "text": "67.6", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 9, "row-header": false, "row-span": [9, 10]}, {"bbox": [194.0462, 297.00253, 208.52695, 305.37717], "spans": [[9, 3]], "text": "69.3", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 9, "row-header": false, "row-span": [9, 10]}, {"bbox": [226.86324000000002, 297.00253, 241.34396, 305.37717], "spans": [[9, 4]], "text": "68.4", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 9, "row-header": false, "row-span": [9, 10]}, {"bbox": [261.86804, 297.00253, 276.34879, 305.37717], "spans": [[9, 5]], "text": "74.6", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 9, "row-header": false, "row-span": [9, 10]}], [{"bbox": [67.663002, 307.96155, 87.46978, 316.33618], "spans": [[10, 0]], "text": "Table", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 10, "row-header": true, "row-span": [10, 11]}, {"bbox": [135.32401, 307.96155, 155.03215, 316.33618], "spans": [[10, 1]], "text": "77-81", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 10, "row-header": false, "row-span": [10, 11]}, {"bbox": [167.95399, 307.96155, 182.43472, 316.33618], "spans": [[10, 2]], "text": "82.2", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 10, "row-header": false, "row-span": [10, 11]}, {"bbox": [194.0462, 307.96155, 208.52695, 316.33618], "spans": [[10, 3]], "text": "82.9", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 10, "row-header": false, "row-span": [10, 11]}, {"bbox": [226.86324000000002, 307.96155, 241.34396, 316.33618], "spans": [[10, 4]], "text": "82.2", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 10, "row-header": false, "row-span": [10, 11]}, {"bbox": [261.86804, 307.96155, 276.34879, 316.33618], "spans": [[10, 5]], "text": "86.3", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 10, "row-header": false, "row-span": [10, 11]}], [{"bbox": [67.663002, 318.91953, 83.623199, 327.29416], "spans": [[11, 0]], "text": "Text", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 11, "row-header": true, "row-span": [11, 12]}, {"bbox": [135.32401, 318.91953, 155.03215, 327.29416], "spans": [[11, 1]], "text": "84-86", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 11, "row-header": false, "row-span": [11, 12]}, {"bbox": [167.95399, 318.91953, 182.43472, 327.29416], "spans": [[11, 2]], "text": "84.6", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 11, "row-header": false, "row-span": [11, 12]}, {"bbox": [194.0462, 318.91953, 208.52695, 327.29416], "spans": [[11, 3]], "text": "85.8", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 11, "row-header": false, "row-span": [11, 12]}, {"bbox": [226.86324000000002, 318.91953, 241.34396, 327.29416], "spans": [[11, 4]], "text": "85.4", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 11, "row-header": false, "row-span": [11, 12]}, {"bbox": [261.86804, 318.91953, 276.34879, 327.29416], "spans": [[11, 5]], "text": "88.1", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 11, "row-header": false, "row-span": [11, 12]}], [{"bbox": [67.663002, 329.87854, 84.654327, 338.25317], "spans": [[12, 0]], "text": "Title", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 12, "row-header": true, "row-span": [12, 13]}, {"bbox": [135.32401, 329.87854, 155.03215, 338.25317], "spans": [[12, 1]], "text": "60-72", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 12, "row-header": false, "row-span": [12, 13]}, {"bbox": [167.95399, 329.87854, 182.43472, 338.25317], "spans": [[12, 2]], "text": "76.7", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 12, "row-header": false, "row-span": [12, 13]}, {"bbox": [194.0462, 329.87854, 208.52695, 338.25317], "spans": [[12, 3]], "text": "80.4", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 12, "row-header": false, "row-span": [12, 13]}, {"bbox": [226.86324000000002, 329.87854, 241.34396, 338.25317], "spans": [[12, 4]], "text": "79.9", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 12, "row-header": false, "row-span": [12, 13]}, {"bbox": [261.86804, 329.87854, 276.34879, 338.25317], "spans": [[12, 5]], "text": "82.7", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 12, "row-header": false, "row-span": [12, 13]}], [{"bbox": [67.663002, 341.23654, 78.628906, 349.61118000000005], "spans": [[13, 0]], "text": "All", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 13, "row-header": true, "row-span": [13, 14]}, {"bbox": [135.32401, 341.23654, 155.03215, 349.61118000000005], "spans": [[13, 1]], "text": "82-83", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 13, "row-header": false, "row-span": [13, 14]}, {"bbox": [167.95399, 341.23654, 182.43472, 349.61118000000005], "spans": [[13, 2]], "text": "72.4", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 13, "row-header": false, "row-span": [13, 14]}, {"bbox": [194.0462, 341.23654, 208.52695, 349.61118000000005], "spans": [[13, 3]], "text": "73.5", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 13, "row-header": false, "row-span": [13, 14]}, {"bbox": [226.86324000000002, 341.23654, 241.34396, 349.61118000000005], "spans": [[13, 4]], "text": "73.4", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 13, "row-header": false, "row-span": [13, 14]}, {"bbox": [261.86804, 341.23654, 276.34879, 349.61118000000005], "spans": [[13, 5]], "text": "76.8", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 13, "row-header": false, "row-span": [13, 14]}]], "model": null, "bounding-box": null}, {"prov": [{"bbox": [80.35525512695312, 496.5545349121094, 267.0082092285156, 641.0637054443359], "page": 7, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "table", "payload": null, "#-cols": 5, "#-rows": 13, "data": [[{"bbox": [86.372002, 153.10051999999996, 129.46452, 161.47515999999996], "spans": [[0, 0]], "text": "Class-count", "type": "col_header", "col": 0, "col-header": true, "col-span": [0, 1], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [151.07401, 153.10051999999996, 159.41275, 161.47515999999996], "spans": [[0, 1]], "text": "11", "type": "col_header", "col": 1, "col-header": true, "col-span": [1, 2], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [179.31816, 153.10051999999996, 183.48753, 161.47515999999996], "spans": [[0, 2]], "text": "6", "type": "col_header", "col": 2, "col-header": true, "col-span": [2, 3], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [213.33669, 153.10051999999996, 217.50606, 161.47515999999996], "spans": [[0, 3]], "text": "5", "type": "col_header", "col": 3, "col-header": true, "col-span": [3, 4], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [247.35521, 153.10051999999996, 251.52458, 161.47515999999996], "spans": [[0, 4]], "text": "4", "type": "col_header", "col": 4, "col-header": true, "col-span": [4, 5], "row": 0, "row-header": false, "row-span": [0, 1]}], [{"bbox": [86.372002, 164.45752000000005, 115.55763, 172.83214999999996], "spans": [[1, 0]], "text": "Caption", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 1, "row-header": true, "row-span": [1, 2]}, {"bbox": [151.07401, 164.45752000000005, 159.41275, 172.83214999999996], "spans": [[1, 1]], "text": "68", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [173.42723, 164.45752000000005, 189.38742, 172.83214999999996], "spans": [[1, 2]], "text": "Text", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [207.44576, 164.45752000000005, 223.40594000000002, 172.83214999999996], "spans": [[1, 3]], "text": "Text", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [241.46428, 164.45752000000005, 257.42447, 172.83214999999996], "spans": [[1, 4]], "text": "Text", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 1, "row-header": false, "row-span": [1, 2]}], [{"bbox": [86.372002, 175.41656, 118.8752, 183.7912], "spans": [[2, 0]], "text": "Footnote", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 2, "row-header": true, "row-span": [2, 3]}, {"bbox": [151.07401, 175.41656, 159.41275, 183.7912], "spans": [[2, 1]], "text": "71", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [173.42723, 175.41656, 189.38742, 183.7912], "spans": [[2, 2]], "text": "Text", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [207.44576, 175.41656, 223.40594000000002, 183.7912], "spans": [[2, 3]], "text": "Text", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [241.46428, 175.41656, 257.42447, 183.7912], "spans": [[2, 4]], "text": "Text", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 2, "row-header": false, "row-span": [2, 3]}], [{"bbox": [86.372002, 186.37554999999998, 116.88466, 194.75018], "spans": [[3, 0]], "text": "Formula", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 3, "row-header": true, "row-span": [3, 4]}, {"bbox": [151.07401, 186.37554999999998, 159.41275, 194.75018], "spans": [[3, 1]], "text": "60", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [173.42723, 186.37554999999998, 189.38742, 194.75018], "spans": [[3, 2]], "text": "Text", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [207.44576, 186.37554999999998, 223.40594000000002, 194.75018], "spans": [[3, 3]], "text": "Text", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [241.46428, 186.37554999999998, 257.42447, 194.75018], "spans": [[3, 4]], "text": "Text", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 3, "row-header": false, "row-span": [3, 4]}], [{"bbox": [86.372002, 197.33452999999997, 119.25179, 205.70916999999997], "spans": [[4, 0]], "text": "List-item", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 4, "row-header": true, "row-span": [4, 5]}, {"bbox": [151.07401, 197.33452999999997, 159.41275, 205.70916999999997], "spans": [[4, 1]], "text": "81", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [173.42723, 197.33452999999997, 189.38742, 205.70916999999997], "spans": [[4, 2]], "text": "Text", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [211.25647, 197.33452999999997, 219.59521, 205.70916999999997], "spans": [[4, 3]], "text": "82", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [241.46426, 197.33452999999997, 257.42447, 205.70916999999997], "spans": [[4, 4]], "text": "Text", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 4, "row-header": false, "row-span": [4, 5]}], [{"bbox": [86.372002, 208.29351999999994, 128.89964, 216.66814999999997], "spans": [[5, 0]], "text": "Page-footer", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 5, "row-header": true, "row-span": [5, 6]}, {"bbox": [151.07401, 208.29351999999994, 159.41275, 216.66814999999997], "spans": [[5, 1]], "text": "62", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [177.23795, 208.29351999999994, 185.57669, 216.66814999999997], "spans": [[5, 2]], "text": "62", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [213.91052, 208.29351999999994, 216.94116, 216.66814999999997], "spans": [[5, 3]], "text": "-", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [247.92905000000002, 208.29351999999994, 250.95969, 216.66814999999997], "spans": [[5, 4]], "text": "-", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 5, "row-header": false, "row-span": [5, 6]}], [{"bbox": [86.372002, 219.25256000000002, 131.65231, 227.62720000000002], "spans": [[6, 0]], "text": "Page-header", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 6, "row-header": true, "row-span": [6, 7]}, {"bbox": [151.07401, 219.25256000000002, 159.41275, 227.62720000000002], "spans": [[6, 1]], "text": "72", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [177.23795, 219.25256000000002, 185.57669, 227.62720000000002], "spans": [[6, 2]], "text": "68", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [213.91052, 219.25256000000002, 216.94116, 227.62720000000002], "spans": [[6, 3]], "text": "-", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [247.92905000000002, 219.25256000000002, 250.95969, 227.62720000000002], "spans": [[6, 4]], "text": "-", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 6, "row-header": false, "row-span": [6, 7]}], [{"bbox": [86.372002, 230.21155, 112.35663, 238.58618], "spans": [[7, 0]], "text": "Picture", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 7, "row-header": true, "row-span": [7, 8]}, {"bbox": [151.07401, 230.21155, 159.41275, 238.58618], "spans": [[7, 1]], "text": "72", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 7, "row-header": false, "row-span": [7, 8]}, {"bbox": [177.23795, 230.21155, 185.57669, 238.58618], "spans": [[7, 2]], "text": "72", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 7, "row-header": false, "row-span": [7, 8]}, {"bbox": [211.25645, 230.21155, 219.5952, 238.58618], "spans": [[7, 3]], "text": "72", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 7, "row-header": false, "row-span": [7, 8]}, {"bbox": [245.27496, 230.21155, 253.61371, 238.58618], "spans": [[7, 4]], "text": "72", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 7, "row-header": false, "row-span": [7, 8]}], [{"bbox": [86.372002, 241.16956000000005, 141.11188, 249.54418999999996], "spans": [[8, 0]], "text": "Section-header", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 8, "row-header": true, "row-span": [8, 9]}, {"bbox": [151.07401, 241.16956000000005, 159.41275, 249.54418999999996], "spans": [[8, 1]], "text": "68", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 8, "row-header": false, "row-span": [8, 9]}, {"bbox": [177.23795, 241.16956000000005, 185.57669, 249.54418999999996], "spans": [[8, 2]], "text": "67", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 8, "row-header": false, "row-span": [8, 9]}, {"bbox": [211.25645, 241.16956000000005, 219.5952, 249.54418999999996], "spans": [[8, 3]], "text": "69", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 8, "row-header": false, "row-span": [8, 9]}, {"bbox": [245.27496, 241.16956000000005, 253.61371, 249.54418999999996], "spans": [[8, 4]], "text": "68", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 8, "row-header": false, "row-span": [8, 9]}], [{"bbox": [86.372002, 252.12854000000004, 106.17878, 260.50316999999995], "spans": [[9, 0]], "text": "Table", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 9, "row-header": true, "row-span": [9, 10]}, {"bbox": [151.07401, 252.12854000000004, 159.41275, 260.50316999999995], "spans": [[9, 1]], "text": "82", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 9, "row-header": false, "row-span": [9, 10]}, {"bbox": [177.23795, 252.12854000000004, 185.57669, 260.50316999999995], "spans": [[9, 2]], "text": "83", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 9, "row-header": false, "row-span": [9, 10]}, {"bbox": [211.25645, 252.12854000000004, 219.5952, 260.50316999999995], "spans": [[9, 3]], "text": "82", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 9, "row-header": false, "row-span": [9, 10]}, {"bbox": [245.27496, 252.12854000000004, 253.61371, 260.50316999999995], "spans": [[9, 4]], "text": "82", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 9, "row-header": false, "row-span": [9, 10]}], [{"bbox": [86.372002, 263.08752000000004, 102.3322, 271.46216000000004], "spans": [[10, 0]], "text": "Text", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 10, "row-header": true, "row-span": [10, 11]}, {"bbox": [151.07401, 263.08752000000004, 159.41275, 271.46216000000004], "spans": [[10, 1]], "text": "85", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 10, "row-header": false, "row-span": [10, 11]}, {"bbox": [177.23795, 263.08752000000004, 185.57669, 271.46216000000004], "spans": [[10, 2]], "text": "84", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 10, "row-header": false, "row-span": [10, 11]}, {"bbox": [211.25645, 263.08752000000004, 219.5952, 271.46216000000004], "spans": [[10, 3]], "text": "84", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 10, "row-header": false, "row-span": [10, 11]}, {"bbox": [245.27496, 263.08752000000004, 253.61371, 271.46216000000004], "spans": [[10, 4]], "text": "84", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 10, "row-header": false, "row-span": [10, 11]}], [{"bbox": [86.372002, 274.04657, 103.36333, 282.42117], "spans": [[11, 0]], "text": "Title", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 11, "row-header": true, "row-span": [11, 12]}, {"bbox": [151.07401, 274.04657, 159.41275, 282.42117], "spans": [[11, 1]], "text": "77", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 11, "row-header": false, "row-span": [11, 12]}, {"bbox": [169.37442, 274.04657, 193.43127, 282.42117], "spans": [[11, 2]], "text": "Sec.-h.", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 11, "row-header": false, "row-span": [11, 12]}, {"bbox": [203.39294, 274.04657, 227.4498, 282.42117], "spans": [[11, 3]], "text": "Sec.-h.", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 11, "row-header": false, "row-span": [11, 12]}, {"bbox": [237.41147, 274.04657, 261.46832, 282.42117], "spans": [[11, 4]], "text": "Sec.-h.", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 11, "row-header": false, "row-span": [11, 12]}], [{"bbox": [86.372002, 285.40454, 113.31602000000001, 293.77917], "spans": [[12, 0]], "text": "Overall", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 12, "row-header": true, "row-span": [12, 13]}, {"bbox": [151.07401, 285.40454, 159.41275, 293.77917], "spans": [[12, 1]], "text": "72", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 12, "row-header": false, "row-span": [12, 13]}, {"bbox": [177.23795, 285.40454, 185.57669, 293.77917], "spans": [[12, 2]], "text": "73", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 12, "row-header": false, "row-span": [12, 13]}, {"bbox": [211.25645, 285.40454, 219.5952, 293.77917], "spans": [[12, 3]], "text": "78", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 12, "row-header": false, "row-span": [12, 13]}, {"bbox": [245.27496, 285.40454, 253.61371, 293.77917], "spans": [[12, 4]], "text": "77", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 12, "row-header": false, "row-span": [12, 13]}]], "model": null, "bounding-box": null}, {"prov": [{"bbox": [352.97747802734375, 485.7341613769531, 522.9158935546875, 641.208740234375], "page": 7, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "table", "payload": null, "#-cols": 5, "#-rows": 14, "data": [[{"bbox": [358.63901, 153.10051999999996, 401.73154, 161.47515999999996], "spans": [[0, 0]], "text": "Class-count", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [440.22501, 153.10051999999996, 448.56375, 161.47515999999996], "spans": [[0, 1], [0, 2]], "text": "11", "type": "col_header", "col": 1, "col-header": true, "col-span": [1, 3], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [440.22501, 153.10051999999996, 448.56375, 161.47515999999996], "spans": [[0, 1], [0, 2]], "text": "11", "type": "col_header", "col": 2, "col-header": true, "col-span": [1, 3], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [494.38, 153.10051999999996, 498.54938, 161.47515999999996], "spans": [[0, 3], [0, 4]], "text": "5", "type": "col_header", "col": 3, "col-header": true, "col-span": [3, 5], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [494.38, 153.10051999999996, 498.54938, 161.47515999999996], "spans": [[0, 3], [0, 4]], "text": "5", "type": "col_header", "col": 4, "col-header": true, "col-span": [3, 5], "row": 0, "row-header": false, "row-span": [0, 1]}], [{"bbox": [358.63901, 164.05951000000005, 375.27167, 172.43413999999996], "spans": [[1, 0]], "text": "Split", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [423.341, 164.05951000000005, 438.0459, 172.43413999999996], "spans": [[1, 1]], "text": "Doc", "type": "col_header", "col": 1, "col-header": true, "col-span": [1, 2], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [448.00757, 164.05951000000005, 465.4472, 172.43413999999996], "spans": [[1, 2]], "text": "Page", "type": "col_header", "col": 2, "col-header": true, "col-span": [2, 3], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [475.41101, 164.05951000000005, 490.11591, 172.43413999999996], "spans": [[1, 3]], "text": "Doc", "type": "col_header", "col": 3, "col-header": true, "col-span": [3, 4], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [500.07757999999995, 164.05951000000005, 517.51721, 172.43413999999996], "spans": [[1, 4]], "text": "Page", "type": "col_header", "col": 4, "col-header": true, "col-span": [4, 5], "row": 1, "row-header": false, "row-span": [1, 2]}], [{"bbox": [358.63901, 175.41656, 387.82465, 183.7912], "spans": [[2, 0]], "text": "Caption", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 2, "row-header": true, "row-span": [2, 3]}, {"bbox": [426.52399, 175.41656, 434.86273, 183.7912], "spans": [[2, 1]], "text": "68", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [452.56240999999994, 175.41656, 460.90115000000003, 183.7912], "spans": [[2, 2]], "text": "83", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": null, "spans": [[2, 3]], "text": "", "type": "body"}, {"bbox": null, "spans": [[2, 4]], "text": "", "type": "body"}], [{"bbox": [358.63901, 186.37554999999998, 391.14221, 194.75018], "spans": [[3, 0]], "text": "Footnote", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 3, "row-header": true, "row-span": [3, 4]}, {"bbox": [426.52399, 186.37554999999998, 434.86273, 194.75018], "spans": [[3, 1]], "text": "71", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [452.56240999999994, 186.37554999999998, 460.90115000000003, 194.75018], "spans": [[3, 2]], "text": "84", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": null, "spans": [[3, 3]], "text": "", "type": "body"}, {"bbox": null, "spans": [[3, 4]], "text": "", "type": "body"}], [{"bbox": [358.63901, 197.33452999999997, 389.15167, 205.70916999999997], "spans": [[4, 0]], "text": "Formula", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 4, "row-header": true, "row-span": [4, 5]}, {"bbox": [426.52399, 197.33452999999997, 434.86273, 205.70916999999997], "spans": [[4, 1]], "text": "60", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [452.56240999999994, 197.33452999999997, 460.90115000000003, 205.70916999999997], "spans": [[4, 2]], "text": "66", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": null, "spans": [[4, 3]], "text": "", "type": "body"}, {"bbox": null, "spans": [[4, 4]], "text": "", "type": "body"}], [{"bbox": [358.63901, 208.29351999999994, 391.5188, 216.66814999999997], "spans": [[5, 0]], "text": "List-item", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 5, "row-header": true, "row-span": [5, 6]}, {"bbox": [426.52399, 208.29351999999994, 434.86273, 216.66814999999997], "spans": [[5, 1]], "text": "81", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [452.56240999999994, 208.29351999999994, 460.90115000000003, 216.66814999999997], "spans": [[5, 2]], "text": "88", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [478.59399, 208.29351999999994, 486.93274, 216.66814999999997], "spans": [[5, 3]], "text": "82", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [504.6324200000001, 208.29351999999994, 512.97119, 216.66814999999997], "spans": [[5, 4]], "text": "88", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 5, "row-header": false, "row-span": [5, 6]}], [{"bbox": [358.63901, 219.25256000000002, 401.16666, 227.62720000000002], "spans": [[6, 0]], "text": "Page-footer", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 6, "row-header": true, "row-span": [6, 7]}, {"bbox": [426.52399, 219.25256000000002, 434.86273, 227.62720000000002], "spans": [[6, 1]], "text": "62", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [452.56240999999994, 219.25256000000002, 460.90115000000003, 227.62720000000002], "spans": [[6, 2]], "text": "89", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": null, "spans": [[6, 3]], "text": "", "type": "body"}, {"bbox": null, "spans": [[6, 4]], "text": "", "type": "body"}], [{"bbox": [358.63901, 230.21155, 403.91931, 238.58618], "spans": [[7, 0]], "text": "Page-header", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 7, "row-header": true, "row-span": [7, 8]}, {"bbox": [426.52399, 230.21155, 434.86273, 238.58618], "spans": [[7, 1]], "text": "72", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 7, "row-header": false, "row-span": [7, 8]}, {"bbox": [452.56240999999994, 230.21155, 460.90115000000003, 238.58618], "spans": [[7, 2]], "text": "90", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 7, "row-header": false, "row-span": [7, 8]}, {"bbox": null, "spans": [[7, 3]], "text": "", "type": "body"}, {"bbox": null, "spans": [[7, 4]], "text": "", "type": "body"}], [{"bbox": [358.63901, 241.16956000000005, 384.62366, 249.54418999999996], "spans": [[8, 0]], "text": "Picture", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 8, "row-header": true, "row-span": [8, 9]}, {"bbox": [426.52399, 241.16956000000005, 434.86273, 249.54418999999996], "spans": [[8, 1]], "text": "72", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 8, "row-header": false, "row-span": [8, 9]}, {"bbox": [452.56240999999994, 241.16956000000005, 460.90115000000003, 249.54418999999996], "spans": [[8, 2]], "text": "82", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 8, "row-header": false, "row-span": [8, 9]}, {"bbox": [478.59399, 241.16956000000005, 486.93274, 249.54418999999996], "spans": [[8, 3]], "text": "72", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 8, "row-header": false, "row-span": [8, 9]}, {"bbox": [504.6324200000001, 241.16956000000005, 512.97119, 249.54418999999996], "spans": [[8, 4]], "text": "82", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 8, "row-header": false, "row-span": [8, 9]}], [{"bbox": [358.63901, 252.12854000000004, 413.37891, 260.50316999999995], "spans": [[9, 0]], "text": "Section-header", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 9, "row-header": true, "row-span": [9, 10]}, {"bbox": [426.52399, 252.12854000000004, 434.86273, 260.50316999999995], "spans": [[9, 1]], "text": "68", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 9, "row-header": false, "row-span": [9, 10]}, {"bbox": [452.56240999999994, 252.12854000000004, 460.90115000000003, 260.50316999999995], "spans": [[9, 2]], "text": "83", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 9, "row-header": false, "row-span": [9, 10]}, {"bbox": [478.59399, 252.12854000000004, 486.93274, 260.50316999999995], "spans": [[9, 3]], "text": "69", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 9, "row-header": false, "row-span": [9, 10]}, {"bbox": [504.6324200000001, 252.12854000000004, 512.97119, 260.50316999999995], "spans": [[9, 4]], "text": "83", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 9, "row-header": false, "row-span": [9, 10]}], [{"bbox": [358.63901, 263.08752000000004, 378.44577, 271.46216000000004], "spans": [[10, 0]], "text": "Table", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 10, "row-header": true, "row-span": [10, 11]}, {"bbox": [426.52399, 263.08752000000004, 434.86273, 271.46216000000004], "spans": [[10, 1]], "text": "82", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 10, "row-header": false, "row-span": [10, 11]}, {"bbox": [452.56240999999994, 263.08752000000004, 460.90115000000003, 271.46216000000004], "spans": [[10, 2]], "text": "89", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 10, "row-header": false, "row-span": [10, 11]}, {"bbox": [478.59399, 263.08752000000004, 486.93274, 271.46216000000004], "spans": [[10, 3]], "text": "82", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 10, "row-header": false, "row-span": [10, 11]}, {"bbox": [504.6324200000001, 263.08752000000004, 512.97119, 271.46216000000004], "spans": [[10, 4]], "text": "90", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 10, "row-header": false, "row-span": [10, 11]}], [{"bbox": [358.63901, 274.04657, 374.59921, 282.42117], "spans": [[11, 0]], "text": "Text", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 11, "row-header": true, "row-span": [11, 12]}, {"bbox": [426.52399, 274.04657, 434.86273, 282.42117], "spans": [[11, 1]], "text": "85", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 11, "row-header": false, "row-span": [11, 12]}, {"bbox": [452.56240999999994, 274.04657, 460.90115000000003, 282.42117], "spans": [[11, 2]], "text": "91", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 11, "row-header": false, "row-span": [11, 12]}, {"bbox": [478.59399, 274.04657, 486.93274, 282.42117], "spans": [[11, 3]], "text": "84", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 11, "row-header": false, "row-span": [11, 12]}, {"bbox": [504.6324200000001, 274.04657, 512.97119, 282.42117], "spans": [[11, 4]], "text": "90", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 11, "row-header": false, "row-span": [11, 12]}], [{"bbox": [358.63901, 285.00552, 375.63034, 293.38015999999993], "spans": [[12, 0]], "text": "Title", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 12, "row-header": true, "row-span": [12, 13]}, {"bbox": [426.52399, 285.00552, 434.86273, 293.38015999999993], "spans": [[12, 1]], "text": "77", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 12, "row-header": false, "row-span": [12, 13]}, {"bbox": [452.56240999999994, 285.00552, 460.90115000000003, 293.38015999999993], "spans": [[12, 2]], "text": "81", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 12, "row-header": false, "row-span": [12, 13]}, {"bbox": null, "spans": [[12, 3]], "text": "", "type": "body"}, {"bbox": null, "spans": [[12, 4]], "text": "", "type": "body"}], [{"bbox": [358.63901, 296.36255, 369.60492, 304.73718], "spans": [[13, 0]], "text": "All", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 13, "row-header": true, "row-span": [13, 14]}, {"bbox": [426.52399, 296.36255, 434.86273, 304.73718], "spans": [[13, 1]], "text": "72", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 13, "row-header": false, "row-span": [13, 14]}, {"bbox": [452.56240999999994, 296.36255, 460.90115000000003, 304.73718], "spans": [[13, 2]], "text": "84", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 13, "row-header": false, "row-span": [13, 14]}, {"bbox": [478.59399, 296.36255, 486.93274, 304.73718], "spans": [[13, 3]], "text": "78", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 13, "row-header": false, "row-span": [13, 14]}, {"bbox": [504.6324200000001, 296.36255, 512.97119, 304.73718], "spans": [[13, 4]], "text": "87", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 13, "row-header": false, "row-span": [13, 14]}]], "model": null, "bounding-box": null}, {"prov": [{"bbox": [72.6590347290039, 452.1459655761719, 274.83465576171875, 619.5191955566406], "page": 8, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "table", "payload": null, "#-cols": 5, "#-rows": 15, "data": [[{"bbox": null, "spans": [[0, 0]], "text": "", "type": "body"}, {"bbox": null, "spans": [[0, 1]], "text": "", "type": "body"}, {"bbox": [217.74099999999999, 175.01855, 256.26065, 183.39319], "spans": [[0, 2], [0, 3], [0, 4]], "text": "Testing on", "type": "col_header", "col": 2, "col-header": true, "col-span": [2, 5], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [217.74099999999999, 175.01855, 256.26065, 183.39319], "spans": [[0, 2], [0, 3], [0, 4]], "text": "Testing on", "type": "col_header", "col": 3, "col-header": true, "col-span": [2, 5], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [217.74099999999999, 175.01855, 256.26065, 183.39319], "spans": [[0, 2], [0, 3], [0, 4]], "text": "Testing on", "type": "col_header", "col": 4, "col-header": true, "col-span": [2, 5], "row": 0, "row-header": false, "row-span": [0, 1]}], [{"bbox": [89.954002, 185.97655999999995, 133.24379, 194.35119999999995], "spans": [[1, 0]], "text": "Training on", "type": "col_header", "col": 0, "col-header": true, "col-span": [0, 1], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [154.629, 185.97655999999995, 175.47588, 194.35119999999995], "spans": [[1, 1]], "text": "labels", "type": "col_header", "col": 1, "col-header": true, "col-span": [1, 2], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [204.69, 185.97655999999995, 220.54260000000002, 194.35119999999995], "spans": [[1, 2]], "text": "PLN", "type": "col_header", "col": 2, "col-header": true, "col-span": [2, 3], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [230.50427000000002, 185.97655999999995, 242.06197, 194.35119999999995], "spans": [[1, 3]], "text": "DB", "type": "col_header", "col": 3, "col-header": true, "col-span": [3, 4], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [252.02364, 185.97655999999995, 269.31085, 194.35119999999995], "spans": [[1, 4]], "text": "DLN", "type": "col_header", "col": 4, "col-header": true, "col-span": [4, 5], "row": 1, "row-header": false, "row-span": [1, 2]}], [{"bbox": [78.530998, 219.25256000000002, 142.56006, 227.62720000000002], "spans": [[2, 0], [3, 0], [4, 0], [5, 0], [6, 0]], "text": "PubLayNet (PLN)", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 2, "row-header": true, "row-span": [2, 7]}, {"bbox": [154.629, 197.33452999999997, 177.92371, 205.70916999999997], "spans": [[2, 1]], "text": "Figure", "type": "row_header", "col": 1, "col-header": false, "col-span": [1, 2], "row": 2, "row-header": true, "row-span": [2, 3]}, {"bbox": [208.44701, 197.33452999999997, 216.78575000000004, 205.70916999999997], "spans": [[2, 2]], "text": "96", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [232.1183, 197.33452999999997, 240.45705, 205.70916999999997], "spans": [[2, 3]], "text": "43", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [256.49792, 197.33452999999997, 264.83667, 205.70916999999997], "spans": [[2, 4]], "text": "23", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 2, "row-header": false, "row-span": [2, 3]}], [{"bbox": [78.530998, 219.25256000000002, 142.56006, 227.62720000000002], "spans": [[2, 0], [3, 0], [4, 0], [5, 0], [6, 0]], "text": "PubLayNet (PLN)", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 3, "row-header": true, "row-span": [2, 7]}, {"bbox": [154.629, 208.29351999999994, 194.72675, 216.66814999999997], "spans": [[3, 1]], "text": "Sec-header", "type": "row_header", "col": 1, "col-header": false, "col-span": [1, 2], "row": 3, "row-header": true, "row-span": [3, 4]}, {"bbox": [208.44701, 208.29351999999994, 216.78575000000004, 216.66814999999997], "spans": [[3, 2]], "text": "87", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [234.77235, 208.29351999999994, 237.80299000000002, 216.66814999999997], "spans": [[3, 3]], "text": "-", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [256.49792, 208.29351999999994, 264.83667, 216.66814999999997], "spans": [[3, 4]], "text": "32", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 3, "row-header": false, "row-span": [3, 4]}], [{"bbox": [78.530998, 219.25256000000002, 142.56006, 227.62720000000002], "spans": [[2, 0], [3, 0], [4, 0], [5, 0], [6, 0]], "text": "PubLayNet (PLN)", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 4, "row-header": true, "row-span": [2, 7]}, {"bbox": [154.629, 219.25256000000002, 174.43578, 227.62720000000002], "spans": [[4, 1]], "text": "Table", "type": "row_header", "col": 1, "col-header": false, "col-span": [1, 2], "row": 4, "row-header": true, "row-span": [4, 5]}, {"bbox": [208.44701, 219.25256000000002, 216.78575000000004, 227.62720000000002], "spans": [[4, 2]], "text": "95", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [232.1183, 219.25256000000002, 240.45705, 227.62720000000002], "spans": [[4, 3]], "text": "24", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [256.49792, 219.25256000000002, 264.83667, 227.62720000000002], "spans": [[4, 4]], "text": "49", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 4, "row-header": false, "row-span": [4, 5]}], [{"bbox": [78.530998, 219.25256000000002, 142.56006, 227.62720000000002], "spans": [[2, 0], [3, 0], [4, 0], [5, 0], [6, 0]], "text": "PubLayNet (PLN)", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 5, "row-header": true, "row-span": [2, 7]}, {"bbox": [154.629, 230.21155, 170.58919, 238.58618], "spans": [[5, 1]], "text": "Text", "type": "row_header", "col": 1, "col-header": false, "col-span": [1, 2], "row": 5, "row-header": true, "row-span": [5, 6]}, {"bbox": [208.44701, 230.21155, 216.78575000000004, 238.58618], "spans": [[5, 2]], "text": "96", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [234.77235, 230.21155, 237.80299000000002, 238.58618], "spans": [[5, 3]], "text": "-", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [256.49792, 230.21155, 264.83667, 238.58618], "spans": [[5, 4]], "text": "42", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 5, "row-header": false, "row-span": [5, 6]}], [{"bbox": [78.530998, 219.25256000000002, 142.56006, 227.62720000000002], "spans": [[2, 0], [3, 0], [4, 0], [5, 0], [6, 0]], "text": "PubLayNet (PLN)", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 6, "row-header": true, "row-span": [2, 7]}, {"bbox": [154.629, 241.16956000000005, 171.2796, 249.54418999999996], "spans": [[6, 1]], "text": "total", "type": "row_header", "col": 1, "col-header": false, "col-span": [1, 2], "row": 6, "row-header": true, "row-span": [6, 7]}, {"bbox": [208.44701, 241.16956000000005, 216.78575000000004, 249.54418999999996], "spans": [[6, 2]], "text": "93", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [232.1183, 241.16956000000005, 240.45705, 249.54418999999996], "spans": [[6, 3]], "text": "34", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [256.49792, 241.16956000000005, 264.83667, 249.54418999999996], "spans": [[6, 4]], "text": "30", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 6, "row-header": false, "row-span": [6, 7]}], [{"bbox": [78.530998, 263.48650999999995, 131.19963, 271.86114999999995], "spans": [[7, 0], [8, 0], [9, 0]], "text": "DocBank (DB)", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 7, "row-header": true, "row-span": [7, 10]}, {"bbox": [154.629, 252.52752999999996, 177.92371, 260.90216], "spans": [[7, 1]], "text": "Figure", "type": "row_header", "col": 1, "col-header": false, "col-span": [1, 2], "row": 7, "row-header": true, "row-span": [7, 8]}, {"bbox": [208.44701, 252.52752999999996, 216.78575000000004, 260.90216], "spans": [[7, 2]], "text": "77", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 7, "row-header": false, "row-span": [7, 8]}, {"bbox": [232.1183, 252.52752999999996, 240.45705, 260.90216], "spans": [[7, 3]], "text": "71", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 7, "row-header": false, "row-span": [7, 8]}, {"bbox": [256.49792, 252.52752999999996, 264.83667, 260.90216], "spans": [[7, 4]], "text": "31", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 7, "row-header": false, "row-span": [7, 8]}], [{"bbox": [78.530998, 263.48650999999995, 131.19963, 271.86114999999995], "spans": [[7, 0], [8, 0], [9, 0]], "text": "DocBank (DB)", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 8, "row-header": true, "row-span": [7, 10]}, {"bbox": [154.629, 263.48650999999995, 174.43578, 271.86114999999995], "spans": [[8, 1]], "text": "Table", "type": "row_header", "col": 1, "col-header": false, "col-span": [1, 2], "row": 8, "row-header": true, "row-span": [8, 9]}, {"bbox": [208.44701, 263.48650999999995, 216.78575000000004, 271.86114999999995], "spans": [[8, 2]], "text": "19", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 8, "row-header": false, "row-span": [8, 9]}, {"bbox": [232.1183, 263.48650999999995, 240.45705, 271.86114999999995], "spans": [[8, 3]], "text": "65", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 8, "row-header": false, "row-span": [8, 9]}, {"bbox": [256.49792, 263.48650999999995, 264.83667, 271.86114999999995], "spans": [[8, 4]], "text": "22", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 8, "row-header": false, "row-span": [8, 9]}], [{"bbox": [78.530998, 263.48650999999995, 131.19963, 271.86114999999995], "spans": [[7, 0], [8, 0], [9, 0]], "text": "DocBank (DB)", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 9, "row-header": true, "row-span": [7, 10]}, {"bbox": [154.629, 274.44556, 171.2796, 282.82016], "spans": [[9, 1]], "text": "total", "type": "row_header", "col": 1, "col-header": false, "col-span": [1, 2], "row": 9, "row-header": true, "row-span": [9, 10]}, {"bbox": [208.44701, 274.44556, 216.78575000000004, 282.82016], "spans": [[9, 2]], "text": "48", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 9, "row-header": false, "row-span": [9, 10]}, {"bbox": [232.1183, 274.44556, 240.45705, 282.82016], "spans": [[9, 3]], "text": "68", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 9, "row-header": false, "row-span": [9, 10]}, {"bbox": [256.49792, 274.44556, 264.83667, 282.82016], "spans": [[9, 4]], "text": "27", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 9, "row-header": false, "row-span": [9, 10]}], [{"bbox": [78.530998, 307.72055, 144.66716, 316.09517999999997], "spans": [[10, 0], [11, 0], [12, 0], [13, 0], [14, 0]], "text": "DocLayNet (DLN)", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 10, "row-header": true, "row-span": [10, 15]}, {"bbox": [154.629, 285.80255, 177.92371, 294.17719000000005], "spans": [[10, 1]], "text": "Figure", "type": "row_header", "col": 1, "col-header": false, "col-span": [1, 2], "row": 10, "row-header": true, "row-span": [10, 11]}, {"bbox": [208.44701, 285.80255, 216.78575000000004, 294.17719000000005], "spans": [[10, 2]], "text": "67", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 10, "row-header": false, "row-span": [10, 11]}, {"bbox": [232.1183, 285.80255, 240.45705, 294.17719000000005], "spans": [[10, 3]], "text": "51", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 10, "row-header": false, "row-span": [10, 11]}, {"bbox": [256.49792, 285.80255, 264.83667, 294.17719000000005], "spans": [[10, 4]], "text": "72", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 10, "row-header": false, "row-span": [10, 11]}], [{"bbox": [78.530998, 307.72055, 144.66716, 316.09517999999997], "spans": [[10, 0], [11, 0], [12, 0], [13, 0], [14, 0]], "text": "DocLayNet (DLN)", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 11, "row-header": true, "row-span": [10, 15]}, {"bbox": [154.629, 296.76154, 194.72675, 305.13617], "spans": [[11, 1]], "text": "Sec-header", "type": "row_header", "col": 1, "col-header": false, "col-span": [1, 2], "row": 11, "row-header": true, "row-span": [11, 12]}, {"bbox": [208.44701, 296.76154, 216.78575000000004, 305.13617], "spans": [[11, 2]], "text": "53", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 11, "row-header": false, "row-span": [11, 12]}, {"bbox": [234.77235, 296.76154, 237.80299000000002, 305.13617], "spans": [[11, 3]], "text": "-", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 11, "row-header": false, "row-span": [11, 12]}, {"bbox": [256.49792, 296.76154, 264.83667, 305.13617], "spans": [[11, 4]], "text": "68", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 11, "row-header": false, "row-span": [11, 12]}], [{"bbox": [78.530998, 307.72055, 144.66716, 316.09517999999997], "spans": [[10, 0], [11, 0], [12, 0], [13, 0], [14, 0]], "text": "DocLayNet (DLN)", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 12, "row-header": true, "row-span": [10, 15]}, {"bbox": [154.629, 307.72055, 174.43578, 316.09517999999997], "spans": [[12, 1]], "text": "Table", "type": "row_header", "col": 1, "col-header": false, "col-span": [1, 2], "row": 12, "row-header": true, "row-span": [12, 13]}, {"bbox": [208.44701, 307.72055, 216.78575000000004, 316.09517999999997], "spans": [[12, 2]], "text": "87", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 12, "row-header": false, "row-span": [12, 13]}, {"bbox": [232.1183, 307.72055, 240.45705, 316.09517999999997], "spans": [[12, 3]], "text": "43", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 12, "row-header": false, "row-span": [12, 13]}, {"bbox": [256.49792, 307.72055, 264.83667, 316.09517999999997], "spans": [[12, 4]], "text": "82", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 12, "row-header": false, "row-span": [12, 13]}], [{"bbox": [78.530998, 307.72055, 144.66716, 316.09517999999997], "spans": [[10, 0], [11, 0], [12, 0], [13, 0], [14, 0]], "text": "DocLayNet (DLN)", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 13, "row-header": true, "row-span": [10, 15]}, {"bbox": [154.629, 318.67953, 170.58919, 327.05417], "spans": [[13, 1]], "text": "Text", "type": "row_header", "col": 1, "col-header": false, "col-span": [1, 2], "row": 13, "row-header": true, "row-span": [13, 14]}, {"bbox": [208.44701, 318.67953, 216.78575000000004, 327.05417], "spans": [[13, 2]], "text": "77", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 13, "row-header": false, "row-span": [13, 14]}, {"bbox": [234.77235, 318.67953, 237.80299000000002, 327.05417], "spans": [[13, 3]], "text": "-", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 13, "row-header": false, "row-span": [13, 14]}, {"bbox": [256.49792, 318.67953, 264.83667, 327.05417], "spans": [[13, 4]], "text": "84", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 13, "row-header": false, "row-span": [13, 14]}], [{"bbox": [78.530998, 307.72055, 144.66716, 316.09517999999997], "spans": [[10, 0], [11, 0], [12, 0], [13, 0], [14, 0]], "text": "DocLayNet (DLN)", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 14, "row-header": true, "row-span": [10, 15]}, {"bbox": [154.629, 329.63855, 171.2796, 338.01318], "spans": [[14, 1]], "text": "total", "type": "row_header", "col": 1, "col-header": false, "col-span": [1, 2], "row": 14, "row-header": true, "row-span": [14, 15]}, {"bbox": [208.44701, 329.63855, 216.78575000000004, 338.01318], "spans": [[14, 2]], "text": "59", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 14, "row-header": false, "row-span": [14, 15]}, {"bbox": [232.1183, 329.63855, 240.45705, 338.01318], "spans": [[14, 3]], "text": "47", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 14, "row-header": false, "row-span": [14, 15]}, {"bbox": [256.49792, 329.63855, 264.83667, 338.01318], "spans": [[14, 4]], "text": "78", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 14, "row-header": false, "row-span": [14, 15]}]], "model": null, "bounding-box": null}], "bitmaps": null, "equations": [], "footnotes": [], "page-dimensions": [{"height": 792.0, "page": 1, "width": 612.0}, {"height": 792.0, "page": 2, "width": 612.0}, {"height": 792.0, "page": 3, "width": 612.0}, {"height": 792.0, "page": 4, "width": 612.0}, {"height": 792.0, "page": 5, "width": 612.0}, {"height": 792.0, "page": 6, "width": 612.0}, {"height": 792.0, "page": 7, "width": 612.0}, {"height": 792.0, "page": 8, "width": 612.0}, {"height": 792.0, "page": 9, "width": 612.0}], "page-footers": [], "page-headers": [], "_s3_data": null, "identifiers": null}
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v1/2206.01062.md b/tests/data/groundtruth/docling_v1/2206.01062.md
index eabb4dd0..c7ec2d0e 100644
--- a/tests/data/groundtruth/docling_v1/2206.01062.md
+++ b/tests/data/groundtruth/docling_v1/2206.01062.md
@@ -20,7 +20,7 @@ Accurate document layout analysis is a key requirement for highquality PDF docum
 
 Permission to make digital or hard copies of part or all of this work for personal or classroom use is granted without fee provided that copies are not made or distributed for profit or commercial advantage and that copies bear this notice and the full citation on the first page. Copyrights for third-party components of this work must be honored. For all other uses, contact the owner/author(s).
 
-KDD '22, August 14-18, 2022, Washington, DC, USA
+KDD ’22, August 14-18, 2022, Washington, DC, USA
 
 © 2022 Copyright held by the owner/author(s).
 
@@ -119,9 +119,7 @@ Figure 3: Corpus Conversion Service annotation user interface. The PDF page is s
 
 we distributed the annotation workload and performed continuous quality controls. Phase one and two required a small team of experts only. For phases three and four, a group of 40 dedicated annotators were assembled and supervised.
 
-Phase 1: Data selection and preparation. Our inclusion criteria for documents were described in Section 3. A large effort went into ensuring that all documents are free to use. The data sources
-
-include publication repositories such as arXiv$^{3}$, government offices, company websites as well as data directory services for financial reports and patents. Scanned documents were excluded wherever possible because they can be rotated or skewed. This would not allow us to perform annotation with rectangular bounding-boxes and therefore complicate the annotation process.
+Phase 1: Data selection and preparation. Our inclusion criteria for documents were described in Section 3. A large effort went into ensuring that all documents are free to use. The data sources include publication repositories such as arXiv$^{3}$, government offices, company websites as well as data directory services for financial reports and patents. Scanned documents were excluded wherever possible because they can be rotated or skewed. This would not allow us to perform annotation with rectangular bounding-boxes and therefore complicate the annotation process.
 
 Preparation work included uploading and parsing the sourced PDF documents in the Corpus Conversion Service (CCS) [22], a cloud-native platform which provides a visual annotation interface and allows for dataset inspection and analysis. The annotation interface of CCS is shown in Figure 3. The desired balance of pages between the different document categories was achieved by selective subsampling of pages with certain desired properties. For example, we made sure to include the title page of each document and bias the remaining page selection to those with figures or tables. The latter was achieved by leveraging pre-trained object detection models from PubLayNet, which helped us estimate how many figures and tables a given page contains.
 
@@ -149,11 +147,12 @@ The complete annotation guideline is over 100 pages long and a detailed descript
 
 Phase 3: Training. After a first trial with a small group of people, we realised that providing the annotation guideline and a set of random practice pages did not yield the desired quality level for layout annotation. Therefore we prepared a subset of pages with two different complexity levels, each with a practice and an exam part. 974 pages were reference-annotated by one proficient core team member. Annotation staff were then given the task to annotate the same subsets (blinded from the reference). By comparing the annotations of each staff member with the reference annotations, we could quantify how closely their annotations matched the reference. Only after passing two exam levels with high annotation quality, staff were admitted into the production phase. Practice iterations
 
-Figure 4: Examples of plausible annotation alternatives for the same page. Criteria in our annotation guideline can resolve cases A to C, while the case D remains ambiguous.
 <!-- image -->
 
 05237a14f2524e3f53c8454b074409d05078038a6a36b770fcc8ec7e540deae0
 
+Figure 4: Examples of plausible annotation alternatives for the same page. Criteria in our annotation guideline can resolve cases A to C, while the case D remains ambiguous.
+
 were carried out over a timeframe of 12 weeks, after which 8 of the 40 initially allocated annotators did not pass the bar.
 
 Phase 4: Production annotation. The previously selected 80K pages were annotated with the defined 11 class labels by 32 annotators. This production phase took around three months to complete. All annotations were created online through CCS, which visualises the programmatic PDF text-cells as an overlay on the page. The page annotation are obtained by drawing rectangular bounding-boxes, as shown in Figure 3. With regard to the annotation practices, we implemented a few constraints and capabilities on the tooling level. First, we only allow non-overlapping, vertically oriented, rectangular boxes. For the large majority of documents, this constraint was sufficient and it speeds up the annotation considerably in comparison with arbitrary segmentation shapes. Second, annotator staff were not able to see each other's annotations. This was enforced by design to avoid any bias in the annotation, which could skew the numbers of the inter-annotator agreement (see Table 1). We wanted
@@ -195,8 +194,6 @@ In Table 2, we present baseline experiments (given in mAP) on Mask R-CNN [12], F
 
 Table 3: Performance of a Mask R-CNN R50 network in mAP@0.5-0.95 scores trained on DocLayNet with different class label sets. The reduced label sets were obtained by either down-mapping or dropping labels.
 
-Table 4: Performance of a Mask R-CNN R50 network with document-wise and page-wise split for different label sets. Naive page-wise split will result in GLYPH<tildelow> 10% point improvement.
-
 | Class-count    |   11 | 6       | 5       | 4       |
 |----------------|------|---------|---------|---------|
 | Caption        |   68 | Text    | Text    | Text    |
@@ -220,6 +217,8 @@ One of the fundamental questions related to any dataset is if it is "large enoug
 
 The choice and number of labels can have a significant effect on the overall model performance. Since PubLayNet, DocBank and DocLayNet all have different label sets, it is of particular interest to understand and quantify this influence of the label set on the model performance. We investigate this by either down-mapping labels into more common ones (e.g. Caption → Text ) or excluding them from the annotations entirely. Furthermore, it must be stressed that all mappings and exclusions were performed on the data before model training. In Table 3, we present the mAP scores for a Mask R-CNN R50 network on different label sets. Where a label is down-mapped, we show its corresponding label, otherwise it was excluded. We present three different label sets, with 6, 5 and 4 different labels respectively. The set of 5 labels contains the same labels as PubLayNet. However, due to the different definition of
 
+Table 4: Performance of a Mask R-CNN R50 network with document-wise and page-wise split for different label sets. Naive page-wise split will result in GLYPH<tildelow> 10% point improvement.
+
 | Class-count    | 11   | 11   | 5   | 5    |
 |----------------|------|------|-----|------|
 | Split          | Doc  | Page | Doc | Page |
@@ -316,6 +315,8 @@ Figure 6: Example layout predictions on selected pages from the DocLayNet test-s
 
 Diaconu, Mai Thanh Minh, Marc, albinxavi, fatih, oleg, and wanghao yang. ultralytics/yolov5: v6.0 - yolov5n nano models, roboflow integration, tensorflow export, opencv dnn support, October 2021.
 
+- [20] Shoubin Li, Xuyan Ma, Shuaiqun Pan, Jun Hu, Lin Shi, and Qing Wang. Vtlayout: Fusion of visual and text features for document layout analysis, 2021.
+
 - [14] Nicolas Carion, Francisco Massa, Gabriel Synnaeve, Nicolas Usunier, Alexander Kirillov, and Sergey Zagoruyko. End-to-end object detection with transformers. CoRR , abs/2005.12872, 2020.
 
 - [15] Mingxing Tan, Ruoming Pang, and Quoc V. Le. Efficientdet: Scalable and efficient object detection. CoRR , abs/1911.09070, 2019.
@@ -328,8 +329,6 @@ Diaconu, Mai Thanh Minh, Marc, albinxavi, fatih, oleg, and wanghao yang. ultraly
 
 - [19] Yiheng Xu, Minghao Li, Lei Cui, Shaohan Huang, Furu Wei, and Ming Zhou. Layoutlm: Pre-training of text and layout for document image understanding. In Proceedings of the 26th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining , KDD, pages 1192-1200, New York, USA, 2020. Association for Computing Machinery.
 
-- [20] Shoubin Li, Xuyan Ma, Shuaiqun Pan, Jun Hu, Lin Shi, and Qing Wang. Vtlayout: Fusion of visual and text features for document layout analysis, 2021.
-
 - [21] Peng Zhang, Can Li, Liang Qiao, Zhanzhan Cheng, Shiliang Pu, Yi Niu, and Fei Wu. Vsr: A unified framework for document layout analysis combining vision, semantics and relations, 2021.
 
 - [22] Peter W J Staar, Michele Dolfi, Christoph Auer, and Costas Bekas. Corpus conversion service: A machine learning platform to ingest documents at scale. In Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining , KDD, pages 774-782. ACM, 2018.
diff --git a/tests/data/groundtruth/docling_v1/2206.01062.pages.json b/tests/data/groundtruth/docling_v1/2206.01062.pages.json
index f9b8b7bd..f59ac8a0 100644
--- a/tests/data/groundtruth/docling_v1/2206.01062.pages.json
+++ b/tests/data/groundtruth/docling_v1/2206.01062.pages.json
@@ -1 +1 @@
-[{"page_no": 0, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "DocLayNet: A Large Human-Annotated Dataset for", "bbox": {"l": 107.29999999999998, "t": 83.69470000000013, "r": 505.06195, "b": 99.67058999999995, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Document-Layout Analysis", "bbox": {"l": 200.117, "t": 103.6196900000001, "r": 411.88367, "b": 119.59558000000015, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Birgit Pfitzmann", "bbox": {"l": 102.06001, "t": 133.67236000000003, "r": 182.63805, "b": 144.83856000000003, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "IBM Research", "bbox": {"l": 114.29401000000001, "t": 147.02423, "r": 170.40337, "b": 156.32928000000004, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Rueschlikon, Switzerland", "bbox": {"l": 90.96701, "t": 158.97924999999998, "r": 193.73123, "b": 168.28430000000003, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "bpf@zurich.ibm.com", "bbox": {"l": 100.02301, "t": 170.93524000000002, "r": 184.67522, "b": 180.24030000000005, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Christoph Auer", "bbox": {"l": 268.62402, "t": 133.67236000000003, "r": 344.59933, "b": 144.83856000000003, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "IBM Research", "bbox": {"l": 278.44302, "t": 147.02423, "r": 334.55237, "b": 156.32928000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Rueschlikon, Switzerland", "bbox": {"l": 255.11602999999997, "t": 158.97924999999998, "r": 357.88025, "b": 168.28430000000003, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "cau@zurich.ibm.com", "bbox": {"l": 263.70404, "t": 170.93524000000002, "r": 349.29272, "b": 180.24030000000005, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Michele Dolfi", "bbox": {"l": 437.6930500000001, "t": 133.67236000000003, "r": 503.60208, "b": 144.83856000000003, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "IBM Research", "bbox": {"l": 442.59305000000006, "t": 147.02423, "r": 498.7023899999999, "b": 156.32928000000004, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Rueschlikon, Switzerland", "bbox": {"l": 419.26505, "t": 158.97924999999998, "r": 522.0293, "b": 168.28430000000003, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "dol@zurich.ibm.com", "bbox": {"l": 428.56104000000005, "t": 170.93524000000002, "r": 512.73505, "b": 180.24030000000005, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Ahmed S. Nassar", "bbox": {"l": 182.26804, "t": 192.05737, "r": 265.39255, "b": 203.22357, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "IBM Research", "bbox": {"l": 195.87103, "t": 205.40923999999995, "r": 251.98038999999997, "b": 214.71429, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Rueschlikon, Switzerland", "bbox": {"l": 172.54303, "t": 217.36425999999994, "r": 275.30725, "b": 226.66931, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "ahn@zurich.ibm.com", "bbox": {"l": 180.52803, "t": 229.32025, "r": 267.3222, "b": 238.62531, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Peter Staar", "bbox": {"l": 361.52802, "t": 192.05737, "r": 414.84821, "b": 203.22357, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "IBM Research", "bbox": {"l": 360.02002, "t": 205.40923999999995, "r": 416.12939, "b": 214.71429, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Rueschlikon, Switzerland", "bbox": {"l": 336.69302, "t": 217.36425999999994, "r": 439.45727999999997, "b": 226.66931, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "taa@zurich.ibm.com", "bbox": {"l": 346.20703, "t": 229.32025, "r": 429.94269, "b": 238.62531, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "ABSTRACT", "bbox": {"l": 53.798035, "t": 247.70288000000005, "r": 111.94354, "b": 258.01202, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Accurate document layout analysis is a key requirement for high-", "bbox": {"l": 53.484001, "t": 262.90454, "r": 295.55591, "b": 271.27917, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "quality PDF document conversion. With the recent availability of", "bbox": {"l": 53.79800000000001, "t": 273.86352999999997, "r": 294.04199, "b": 282.23816, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "public, large ground-truth datasets such as PubLayNet and DocBank,", "bbox": {"l": 53.79800000000001, "t": 284.82254, "r": 295.34586, "b": 293.19717, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "deep-learning models have proven to be very effective at layout", "bbox": {"l": 53.79800000000001, "t": 295.78152, "r": 294.04709, "b": 304.15616000000006, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "detection and segmentation. While these datasets are of adequate", "bbox": {"l": 53.79800000000001, "t": 306.74053999999995, "r": 294.04645, "b": 315.11517, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "size to train such models, they severely lack in layout variability", "bbox": {"l": 53.79800000000001, "t": 317.69952, "r": 294.27573, "b": 326.07416, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "since they are sourced from scientific article repositories such as", "bbox": {"l": 53.79800000000001, "t": 328.65854, "r": 294.04712, "b": 337.03317, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "PubMed and arXiv only. Consequently, the accuracy of the layout", "bbox": {"l": 53.79800000000001, "t": 339.61755, "r": 294.0437, "b": 347.99219, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "segmentation drops significantly when these models are applied", "bbox": {"l": 53.79800000000001, "t": 350.57654, "r": 294.04715, "b": 358.95117, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "on more challenging and diverse layouts. In this paper, we present", "bbox": {"l": 53.79800000000001, "t": 361.53455, "r": 294.04364, "b": 369.90918000000005, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "DocLayNet", "bbox": {"l": 53.79800000000001, "t": 372.53839, "r": 92.863388, "b": 380.87714000000005, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": ", a new, publicly available, document-layout annotation", "bbox": {"l": 92.863998, "t": 372.49353, "r": 294.04361, "b": 380.86816, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "dataset in COCO format. It contains 80863 manually annotated", "bbox": {"l": 53.79800000000001, "t": 383.45255, "r": 294.04718, "b": 391.82718, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "pages from diverse data sources to represent a wide variability in", "bbox": {"l": 53.79800000000001, "t": 394.41153, "r": 294.0437, "b": 402.78616, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "layouts. For each PDF page, the layout annotations provide labelled", "bbox": {"l": 53.79800000000001, "t": 405.37054, "r": 294.04535, "b": 413.74518, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "bounding-boxes with a choice of 11 distinct classes. DocLayNet", "bbox": {"l": 53.79800000000001, "t": 416.32953, "r": 294.04715, "b": 424.70416000000006, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "also provides a subset of double- and triple-annotated pages to", "bbox": {"l": 53.79800000000001, "t": 427.28853999999995, "r": 294.04712, "b": 435.66318, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "determine the inter-annotator agreement. In multiple experiments,", "bbox": {"l": 53.79800000000001, "t": 438.24753, "r": 295.03, "b": 446.62216, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "we provide baseline accuracy scores (in mAP) for a set of popular", "bbox": {"l": 53.466999, "t": 449.20654, "r": 294.21616, "b": 457.58118, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "object detection models. We also demonstrate that these models", "bbox": {"l": 53.79800000000001, "t": 460.16553, "r": 294.04712, "b": 468.54016, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "fall approximately 10% behind the inter-annotator agreement. Fur-", "bbox": {"l": 53.79800000000001, "t": 471.12354, "r": 295.56018, "b": 479.49817, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "thermore, we provide evidence that DocLayNet is of sufficient size.", "bbox": {"l": 53.79800000000001, "t": 482.08255, "r": 295.42783, "b": 490.45718, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Lastly, we compare models trained on PubLayNet, DocBank and", "bbox": {"l": 53.79800000000001, "t": 493.04153, "r": 294.04715, "b": 501.41617, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "DocLayNet, showing that layout predictions of the DocLayNet-", "bbox": {"l": 53.79800000000001, "t": 504.00055, "r": 295.55618, "b": 512.37518, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "trained models are more robust and thus the preferred choice for", "bbox": {"l": 53.79800000000001, "t": 514.95953, "r": 294.21643, "b": 523.33417, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "general-purpose document-layout analysis.", "bbox": {"l": 53.79800000000001, "t": 525.91855, "r": 212.05495, "b": 534.29318, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "CCS CONCEPTS", "bbox": {"l": 53.79800000000001, "t": 550.99692, "r": 134.81989, "b": 561.30602, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "\u2022", "bbox": {"l": 53.79800000000001, "t": 566.19957, "r": 56.945206000000006, "b": 574.57419, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Information systems", "bbox": {"l": 58.440002, "t": 566.0830100000001, "r": 142.4462, "b": 574.5562600000001, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "\u2192", "bbox": {"l": 143.938, "t": 566.36096, "r": 153.15099, "b": 574.43073, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Document structure", "bbox": {"l": 154.646, "t": 566.0830100000001, "r": 235.46015999999997, "b": 574.5562600000001, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "; \u2022", "bbox": {"l": 235.45700000000002, "t": 566.19955, "r": 242.17419, "b": 574.57417, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "Applied com-", "bbox": {"l": 243.66899, "t": 566.08299, "r": 297.85294, "b": 574.55624, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "puting", "bbox": {"l": 53.797989, "t": 577.0419899999999, "r": 80.661324, "b": 585.51524, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "\u2192", "bbox": {"l": 83.565987, "t": 577.3199500000001, "r": 92.778961, "b": 585.38971, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Document analysis", "bbox": {"l": 95.68399, "t": 577.0419899999999, "r": 173.91583, "b": 585.51524, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "; \u2022", "bbox": {"l": 173.916, "t": 577.15855, "r": 182.1272, "b": 585.53317, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Computing methodologies", "bbox": {"l": 185.032, "t": 577.0419899999999, "r": 294.0455, "b": 585.51524, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "\u2192", "bbox": {"l": 53.79800399999999, "t": 588.27895, "r": 63.01097899999999, "b": 596.34871, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "Machine learning", "bbox": {"l": 65.253006, "t": 588.00099, "r": 136.80487, "b": 596.47424, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": ";", "bbox": {"l": 136.80501, "t": 588.1175499999999, "r": 138.92108, "b": 596.49217, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "Computer vision", "bbox": {"l": 141.162, "t": 588.00099, "r": 209.60254, "b": 596.47424, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": ";", "bbox": {"l": 209.60201, "t": 588.1175499999999, "r": 211.71808, "b": 596.49217, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "Object detection", "bbox": {"l": 213.96001, "t": 588.16238, "r": 270.45728, "b": 596.50114, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": ";", "bbox": {"l": 270.48001, "t": 588.1175499999999, "r": 272.59607, "b": 596.49217, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "Permission to make digital or hard copies of part or all of this work for personal or", "bbox": {"l": 53.79800000000001, "t": 634.39838, "r": 294.17697, "b": 640.9119000000001, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "classroom use is granted without fee provided that copies are not made or distributed", "bbox": {"l": 53.79800000000001, "t": 642.36838, "r": 294.04443, "b": 648.8819, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "for profit or commercial advantage and that copies bear this notice and the full citation", "bbox": {"l": 53.79800000000001, "t": 650.33838, "r": 294.04498, "b": 656.8519, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "on the first page. Copyrights for third-party components of this work must be honored.", "bbox": {"l": 53.79800000000001, "t": 658.3083799999999, "r": 295.11798, "b": 664.8219, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "For all other uses, contact the owner/author(s).", "bbox": {"l": 53.79800000000001, "t": 666.27837, "r": 187.72285, "b": 672.79189, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 53.79800000000001, "t": 675.08023, "r": 197.86275, "b": 681.56586, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "\u00a9 2022 Copyright held by the owner/author(s).", "bbox": {"l": 53.317001, "t": 683.81236, "r": 186.74652, "b": 690.32589, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "ACM ISBN 978-1-4503-9385-0/22/08.", "bbox": {"l": 53.554001, "t": 691.78336, "r": 157.03125, "b": 698.29689, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "https://doi.org/10.1145/3534678.3539043", "bbox": {"l": 53.79800000000001, "t": 699.753365, "r": 166.94093, "b": 706.266891, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "13", "bbox": {"l": 327.86951, "t": 351.78085, "r": 330.41248, "b": 353.95465, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "USING THE VERTICAL TUBE -", "bbox": {"l": 327.83005, "t": 331.57268999999997, "r": 351.16092, "b": 333.31171, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "MODELS AY11230/11234", "bbox": {"l": 327.83005, "t": 333.18292, "r": 348.30536, "b": 334.92194, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "1.", "bbox": {"l": 327.83005, "t": 336.40439, "r": 329.05914, "b": 337.92606, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "The vertical tube can be used for", "bbox": {"l": 329.67368, "t": 336.40439, "r": 349.95349, "b": 337.92606, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "instructional viewing or to photograph", "bbox": {"l": 329.11752, "t": 337.83588, "r": 353.57977, "b": 339.35751000000005, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": " the image with a digital camera or a", "bbox": {"l": 327.77121, "t": 339.26736, "r": 352.4306, "b": 340.789, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": " micro TV unit", "bbox": {"l": 328.15176, "t": 340.69882, "r": 337.91086, "b": 342.22049, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "2.", "bbox": {"l": 327.8313, "t": 342.19043000000005, "r": 329.09155, "b": 343.71207, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Loosen the retention screw, then rotate ", "bbox": {"l": 329.72168, "t": 342.19043000000005, "r": 354.9267, "b": 343.71207, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": " the adjustment ring to change the ", "bbox": {"l": 327.8313, "t": 343.62192, "r": 351.66949, "b": 345.14355, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": " length of the vertical tube.", "bbox": {"l": 328.21185, "t": 345.05338, "r": 346.33179, "b": 346.57504, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "3.", "bbox": {"l": 327.83005, "t": 346.84680000000003, "r": 329.12726, "b": 348.36847, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "Make sure that both the images in", "bbox": {"l": 329.77588, "t": 346.84680000000003, "r": 351.18005, "b": 348.36847, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "OPERATION ", "bbox": {"l": 327.25311, "t": 254.94812000000002, "r": 350.07861, "b": 258.86096, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "(", "bbox": {"l": 350.07861, "t": 254.76782000000003, "r": 351.82651, "b": 258.68066, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "cont.", "bbox": {"l": 351.82651, "t": 254.94812000000002, "r": 360.85242, "b": 258.86096, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": ")", "bbox": {"l": 360.85242, "t": 254.76782000000003, "r": 362.60028, "b": 258.68066, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "SELECTING OBJECTIVE ", "bbox": {"l": 326.88037, "t": 263.49492999999995, "r": 345.84351, "b": 265.23395000000005, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "MAGNIFICATION", "bbox": {"l": 326.88037, "t": 265.10515999999996, "r": 340.54153, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "1.", "bbox": {"l": 326.88037, "t": 266.71533, "r": 328.31903, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "There are two objectives. The lower", "bbox": {"l": 329.03836, "t": 266.71533, "r": 354.21472, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": " magnification objective has a greater", "bbox": {"l": 326.88037, "t": 268.32556, "r": 355.19193, "b": 270.06458, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": " depth of field and view.", "bbox": {"l": 326.88037, "t": 269.93579, "r": 345.80057, "b": 271.6748, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "2.", "bbox": {"l": 326.88037, "t": 271.54602, "r": 328.33862, "b": 273.28503, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "In order to observe the specimen", "bbox": {"l": 329.06775, "t": 271.54602, "r": 352.39969, "b": 273.28503, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": " easily use the lower magnification", "bbox": {"l": 326.88037, "t": 273.15619000000004, "r": 352.90042, "b": 274.89526, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": " objective first. Then, by rotating the", "bbox": {"l": 326.88037, "t": 274.76642000000004, "r": 354.59546, "b": 276.50543000000005, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": " case, the magnification can be", "bbox": {"l": 326.88037, "t": 276.37665000000004, "r": 350.81885, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": " changed.", "bbox": {"l": 326.88037, "t": 277.98688000000004, "r": 335.46707, "b": 279.72589000000005, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "CHANGING THE INTERPUPILLARY ", "bbox": {"l": 326.88037, "t": 281.20728, "r": 354.57755, "b": 282.94632, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "DISTANCE", "bbox": {"l": 326.88037, "t": 282.81750000000005, "r": 335.1752, "b": 284.55652, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "1.", "bbox": {"l": 326.88037, "t": 284.4277, "r": 328.34784, "b": 286.16675, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "The distance between the observer's", "bbox": {"l": 329.08157, "t": 284.4277, "r": 354.76245, "b": 286.16675, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": " pupils is the interpupillary distance.", "bbox": {"l": 326.88037, "t": 286.03793, "r": 354.6499, "b": 287.77695, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "2.", "bbox": {"l": 326.88037, "t": 287.64813, "r": 328.25125, "b": 289.38718, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "To adjust the interpupillary distance", "bbox": {"l": 328.93671, "t": 287.64813, "r": 354.29825, "b": 289.38718, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": " rotate the prism caps until both eyes", "bbox": {"l": 326.88181, "t": 289.25836, "r": 355.02075, "b": 290.99738, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": " coincide with the image in the", "bbox": {"l": 326.88181, "t": 290.86855999999995, "r": 350.82028, "b": 292.6076, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": " eyepiece. ", "bbox": {"l": 326.88181, "t": 292.47879, "r": 336.2067, "b": 294.2178, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "FOCUSING", "bbox": {"l": 326.88181, "t": 295.69922, "r": 335.3941, "b": 297.43823, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "1.", "bbox": {"l": 326.88181, "t": 297.30942, "r": 328.34314, "b": 299.04846, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "Remove the lens protective cover.", "bbox": {"l": 329.07379, "t": 297.30942, "r": 353.18555, "b": 299.04846, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "2.", "bbox": {"l": 326.88324, "t": 298.91965, "r": 328.35919, "b": 300.65866, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "Place the specimen on the working", "bbox": {"l": 329.0972, "t": 298.91965, "r": 353.45065, "b": 300.65866, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": " stage.", "bbox": {"l": 326.88324, "t": 300.52985, "r": 333.32825, "b": 302.26889000000006, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "3.", "bbox": {"l": 326.88324, "t": 302.14008000000007, "r": 328.31296, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "Focus the specimen with the left eye", "bbox": {"l": 329.02783, "t": 302.14008000000007, "r": 354.76303, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": " first while turning the focus knob until", "bbox": {"l": 326.88324, "t": 303.75027, "r": 355.96307, "b": 305.48932, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": " the image appears clear and sharp.", "bbox": {"l": 326.88324, "t": 305.3605, "r": 354.46594, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "4.", "bbox": {"l": 326.88324, "t": 306.9707, "r": 328.25488, "b": 308.70975, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "Rotate the right eyepiece ring until the", "bbox": {"l": 328.9407, "t": 306.9707, "r": 356.37335, "b": 308.70975, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": " images in each eyepiece coincide and", "bbox": {"l": 326.88324, "t": 308.58093, "r": 355.38867, "b": 310.31995, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": " are sharp and clear.", "bbox": {"l": 326.88324, "t": 310.19113, "r": 343.17249, "b": 311.93018, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "CHANGING THE BULB", "bbox": {"l": 326.88324, "t": 313.41156, "r": 344.13388, "b": 315.15059999999994, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "1.", "bbox": {"l": 326.88324, "t": 315.02178999999995, "r": 328.37418, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "Disconnect the power cord.", "bbox": {"l": 329.11963, "t": 315.02178999999995, "r": 348.50162, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "2.", "bbox": {"l": 326.88324, "t": 316.63199, "r": 328.34061, "b": 318.37103, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "When the bulb is cool, remove the", "bbox": {"l": 329.06931, "t": 316.63199, "r": 353.11588, "b": 318.37103, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": " oblique illuminator cap and remove", "bbox": {"l": 326.88464, "t": 318.2422199999999, "r": 353.79517, "b": 319.9812299999999, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": " the halogen bulb with cap.", "bbox": {"l": 326.88464, "t": 319.85242000000005, "r": 348.02094, "b": 321.59146, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "3.", "bbox": {"l": 326.88464, "t": 321.46265, "r": 328.37512, "b": 323.20166, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "Replace with a new halogen bulb.", "bbox": {"l": 329.12036, "t": 321.46265, "r": 352.96808, "b": 323.20166, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "4.", "bbox": {"l": 326.88608, "t": 323.07285, "r": 328.36884, "b": 324.81189, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "Open the window in the base plate and", "bbox": {"l": 329.1102, "t": 323.07285, "r": 356.5412, "b": 324.81189, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": " replace the halogen lamp or ", "bbox": {"l": 326.88608, "t": 324.68307000000004, "r": 350.13828, "b": 326.42209, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": " fluorescent lamp of transmitted", "bbox": {"l": 326.88608, "t": 326.29327, "r": 351.59677, "b": 328.03232, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": " illuminator.", "bbox": {"l": 326.88608, "t": 327.9035, "r": 336.89197, "b": 329.64252, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "FOCUSING", "bbox": {"l": 358.42023, "t": 263.49492999999995, "r": 366.93256, "b": 265.23395000000005, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "1.", "bbox": {"l": 358.42023, "t": 265.10515999999996, "r": 359.89841, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "Turn the focusing knob away or toward", "bbox": {"l": 360.63751, "t": 265.10515999999996, "r": 387.98407, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": " you until a clear image is viewed.", "bbox": {"l": 358.42023, "t": 266.71533, "r": 384.58948, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "2.", "bbox": {"l": 358.42166, "t": 268.32556, "r": 359.78549, "b": 270.06458, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "If the image is unclear, adjust the", "bbox": {"l": 360.46741, "t": 268.32556, "r": 384.33441, "b": 270.06458, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": " height of the elevator up or down,", "bbox": {"l": 358.4231, "t": 269.93579, "r": 384.61502, "b": 271.6748, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": " then turn the focusing knob again.", "bbox": {"l": 358.4231, "t": 271.54602, "r": 385.38922, "b": 273.28503, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "ZOOM MAGNIFICATION", "bbox": {"l": 358.4231, "t": 274.76642000000004, "r": 377.35046, "b": 276.50543000000005, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "1.", "bbox": {"l": 358.4231, "t": 276.37665000000004, "r": 359.89429, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "Turn the zoom magnification knob to", "bbox": {"l": 360.62988, "t": 276.37665000000004, "r": 386.37589, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": " the desired magnification and field of", "bbox": {"l": 358.4231, "t": 277.98688000000004, "r": 386.78732, "b": 279.72589000000005, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": " view.", "bbox": {"l": 358.4231, "t": 279.59704999999997, "r": 364.16855, "b": 281.33609, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "2.", "bbox": {"l": 358.4231, "t": 281.20728, "r": 359.86777, "b": 282.94632, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "In most situations, it is recommended", "bbox": {"l": 360.59012, "t": 281.20728, "r": 387.31656, "b": 282.94632, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": " that you focus at the lowest ", "bbox": {"l": 358.4231, "t": 282.81750000000005, "r": 381.56656, "b": 284.55652, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": " magnification, then move to a higher", "bbox": {"l": 358.4231, "t": 284.4277, "r": 386.63403, "b": 286.16675, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": " magnification and re-focus as ", "bbox": {"l": 358.42453, "t": 286.03793, "r": 382.77115, "b": 287.77695, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": " necessary.", "bbox": {"l": 358.42453, "t": 287.64813, "r": 367.98694, "b": 289.38718, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "3.", "bbox": {"l": 358.42453, "t": 289.25836, "r": 359.80386, "b": 290.99738, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "If the image is not clear to both eyes", "bbox": {"l": 360.49353, "t": 289.25836, "r": 386.70093, "b": 290.99738, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": " at the same time, the diopter ring may", "bbox": {"l": 358.42453, "t": 290.86855999999995, "r": 388.03534, "b": 292.6076, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": " need adjustment.", "bbox": {"l": 358.42453, "t": 292.47879, "r": 373.13724, "b": 294.2178, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "DIOPTER RING ADJUSTMENT", "bbox": {"l": 358.42453, "t": 295.69922, "r": 381.74539, "b": 297.43823, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "1.", "bbox": {"l": 358.42453, "t": 297.30942, "r": 359.83682, "b": 299.04846, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "To adjust the eyepiece for viewing with", "bbox": {"l": 360.54297, "t": 297.30942, "r": 388.08289, "b": 299.04846, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": " or without eyeglasses and for ", "bbox": {"l": 358.42453, "t": 298.91965, "r": 382.73251, "b": 300.65866, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": " differences in acuity between the right", "bbox": {"l": 358.42453, "t": 300.52985, "r": 387.72266, "b": 302.26889000000006, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": " and left eyes, follow the following", "bbox": {"l": 358.42453, "t": 302.14008000000007, "r": 384.1991, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": " steps:", "bbox": {"l": 358.42453, "t": 303.75027, "r": 364.88672, "b": 305.48932, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "a.", "bbox": {"l": 358.42453, "t": 305.3605, "r": 359.95078, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "Observe an image through the left", "bbox": {"l": 361.47699, "t": 305.3605, "r": 386.65988, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": " eyepiece and bring a specific point", "bbox": {"l": 358.42453, "t": 306.9707, "r": 386.7634, "b": 308.70975, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": " into focus using the focus knob.", "bbox": {"l": 358.42453, "t": 308.58093, "r": 385.41354, "b": 310.31995, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "b.", "bbox": {"l": 358.42453, "t": 310.19113, "r": 359.93304, "b": 311.93018, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "By turning the diopter ring ", "bbox": {"l": 361.44156, "t": 310.19113, "r": 382.56085, "b": 311.93018, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": " adjustment for the left eyepiece,", "bbox": {"l": 358.42596, "t": 311.80136, "r": 385.4559, "b": 313.54037, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": " bring the same point into sharp", "bbox": {"l": 358.42596, "t": 313.41156, "r": 384.56122, "b": 315.15059999999994, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": " focus.", "bbox": {"l": 358.42596, "t": 315.02178999999995, "r": 366.74371, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": " c.Then bring the same point into", "bbox": {"l": 358.42596, "t": 316.63199, "r": 383.93884, "b": 318.37103, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": " focus through the right eyepiece", "bbox": {"l": 358.42596, "t": 318.2422199999999, "r": 385.69241, "b": 319.9812299999999, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": " by turning the right diopter ring.", "bbox": {"l": 358.42596, "t": 319.85242000000005, "r": 385.94861, "b": 321.59146, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": " d.With more than one viewer, each", "bbox": {"l": 358.42596, "t": 321.46265, "r": 385.54236, "b": 323.20166, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": " viewer should note their own", "bbox": {"l": 358.42596, "t": 323.07285, "r": 382.98718, "b": 324.81189, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": " diopter ring position for the left", "bbox": {"l": 358.42596, "t": 324.68307000000004, "r": 385.06448, "b": 326.42209, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": " and right eyepieces, then before", "bbox": {"l": 358.42596, "t": 326.29327, "r": 385.20682, "b": 328.03232, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": " viewing set the diopter ring", "bbox": {"l": 358.42596, "t": 327.9035, "r": 382.21964, "b": 329.64252, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": " adjustments to that setting.", "bbox": {"l": 358.42596, "t": 329.5137, "r": 382.63382, "b": 331.25275, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "CHANGING THE BULB", "bbox": {"l": 358.42596, "t": 332.73412999999994, "r": 375.67661, "b": 334.47317999999996, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "1.", "bbox": {"l": 358.42596, "t": 334.34436, "r": 359.90311, "b": 336.08337, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "Disconnect the power cord from the", "bbox": {"l": 360.64169, "t": 334.34436, "r": 385.75333, "b": 336.08337, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": " electrical outlet.", "bbox": {"l": 358.42596, "t": 335.95456, "r": 372.01416, "b": 337.6936, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "2.", "bbox": {"l": 358.42596, "t": 337.56479, "r": 359.88327, "b": 339.3038, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "When the bulb is cool, remove the", "bbox": {"l": 360.61191, "t": 337.56479, "r": 384.65726, "b": 339.3038, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": " oblique illuminator cap and remove", "bbox": {"l": 358.42596, "t": 339.17499, "r": 385.33649, "b": 340.9140300000001, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": " the halogen bulb with cap.", "bbox": {"l": 358.42596, "t": 340.78522, "r": 379.57224, "b": 342.52423, "coord_origin": "TOPLEFT"}}, {"id": 201, "text": "3.", "bbox": {"l": 358.4274, "t": 342.39542, "r": 359.91788, "b": 344.13446000000005, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": "Replace with a new halogen bulb.", "bbox": {"l": 360.66312, "t": 342.39542, "r": 384.5108, "b": 344.13446000000005, "coord_origin": "TOPLEFT"}}, {"id": 203, "text": "4.", "bbox": {"l": 358.42883, "t": 344.00565000000006, "r": 359.92792, "b": 345.74466, "coord_origin": "TOPLEFT"}}, {"id": 204, "text": "Open the window in the base plate", "bbox": {"l": 360.67746, "t": 344.00565000000006, "r": 385.41235, "b": 345.74466, "coord_origin": "TOPLEFT"}}, {"id": 205, "text": " and replace the halogen lamp or", "bbox": {"l": 358.42883, "t": 345.61584, "r": 383.2782, "b": 347.35489, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": " fluorescent lamp of transmitted", "bbox": {"l": 358.42883, "t": 347.22607, "r": 383.13953, "b": 348.96509, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": " illuminator.", "bbox": {"l": 358.42883, "t": 348.83627, "r": 368.43472, "b": 350.57532, "coord_origin": "TOPLEFT"}}, {"id": 208, "text": "Model AY11230", "bbox": {"l": 326.59567, "t": 261.14185, "r": 339.11377, "b": 262.88091999999995, "coord_origin": "TOPLEFT"}}, {"id": 209, "text": "Model AY11234", "bbox": {"l": 358.48605, "t": 261.14185, "r": 371.00415, "b": 262.88091999999995, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": "14", "bbox": {"l": 455.43533, "t": 351.77038999999996, "r": 457.97827000000007, "b": 353.94415, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "Objectives", "bbox": {"l": 408.24518, "t": 275.52673000000004, "r": 414.4234, "b": 276.96020999999996, "coord_origin": "TOPLEFT"}}, {"id": 212, "text": "Revolving Turret", "bbox": {"l": 409.39554, "t": 268.98235999999997, "r": 419.06677, "b": 270.41583, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "Coarse ", "bbox": {"l": 441.3895, "t": 279.12627999999995, "r": 445.87192, "b": 280.55975, "coord_origin": "TOPLEFT"}}, {"id": 214, "text": "Adjustment", "bbox": {"l": 441.3895, "t": 280.30609, "r": 448.22338999999994, "b": 281.7395900000001, "coord_origin": "TOPLEFT"}}, {"id": 215, "text": "Knob", "bbox": {"l": 441.3895, "t": 281.48593, "r": 444.40371999999996, "b": 282.91939999999994, "coord_origin": "TOPLEFT"}}, {"id": 216, "text": "MODEL AY11236", "bbox": {"l": 398.79288, "t": 254.94646999999998, "r": 428.91568, "b": 258.85931000000005, "coord_origin": "TOPLEFT"}}, {"id": 217, "text": "MICROSCOPE USAGE", "bbox": {"l": 398.32535, "t": 305.04291, "r": 435.93542, "b": 308.95572000000004, "coord_origin": "TOPLEFT"}}, {"id": 218, "text": "BARSKA Model AY11236 is a powerful fixed power compound ", "bbox": {"l": 398.08594, "t": 310.35892, "r": 453.72171, "b": 312.53271, "coord_origin": "TOPLEFT"}}, {"id": 219, "text": "microscope designed for biological studies such as specimen ", "bbox": {"l": 398.08594, "t": 312.50586, "r": 453.09939999999995, "b": 314.67966, "coord_origin": "TOPLEFT"}}, {"id": 220, "text": "examination. It can also be used for examining bacteria and", "bbox": {"l": 398.08594, "t": 314.6528, "r": 456.65246999999994, "b": 316.8266, "coord_origin": "TOPLEFT"}}, {"id": 221, "text": "for general clinical and medical studies and other scientific uses. ", "bbox": {"l": 398.08594, "t": 316.79977, "r": 456.73859000000004, "b": 318.97354, "coord_origin": "TOPLEFT"}}, {"id": 222, "text": "CONSTRUCTION", "bbox": {"l": 398.62399, "t": 320.42941, "r": 427.77472, "b": 324.34222000000005, "coord_origin": "TOPLEFT"}}, {"id": 223, "text": "BARSKA Model AY11236 is a fixed power compound microscope.", "bbox": {"l": 398.08594, "t": 326.46069000000006, "r": 456.02639999999997, "b": 328.63449, "coord_origin": "TOPLEFT"}}, {"id": 224, "text": "It is constructed with two optical paths at the same angle. It is ", "bbox": {"l": 398.08414, "t": 328.6076699999999, "r": 455.42238999999995, "b": 330.7814599999999, "coord_origin": "TOPLEFT"}}, {"id": 225, "text": "equipped with transmitted illumination. By using this instrument, ", "bbox": {"l": 398.08414, "t": 330.75461, "r": 457.39844, "b": 332.92841, "coord_origin": "TOPLEFT"}}, {"id": 226, "text": "the user can observe specimens at magnification from 40x to ", "bbox": {"l": 398.08414, "t": 332.90155, "r": 453.97745, "b": 335.07535000000007, "coord_origin": "TOPLEFT"}}, {"id": 227, "text": "1000x by selecting the desired objective lens. Coarse and fine ", "bbox": {"l": 398.08414, "t": 335.04852, "r": 454.70708999999994, "b": 337.22232, "coord_origin": "TOPLEFT"}}, {"id": 228, "text": "focus adjustments provide accuracy and image detail. The rotating ", "bbox": {"l": 398.08414, "t": 337.19547, "r": 458.90240000000006, "b": 339.36926, "coord_origin": "TOPLEFT"}}, {"id": 229, "text": "head allows the user to position the eyepieces for maximum ", "bbox": {"l": 398.08594, "t": 339.34241, "r": 453.0672, "b": 341.5162, "coord_origin": "TOPLEFT"}}, {"id": 230, "text": "viewing comfort and easy access to all adjustment knobs.", "bbox": {"l": 398.08594, "t": 341.48938, "r": 449.63113, "b": 343.66318, "coord_origin": "TOPLEFT"}}, {"id": 231, "text": "Model AY11236", "bbox": {"l": 422.10626, "t": 301.24191, "r": 434.62433000000004, "b": 302.98096, "coord_origin": "TOPLEFT"}}, {"id": 232, "text": "Fine ", "bbox": {"l": 442.01610999999997, "t": 283.08649, "r": 444.8817399999999, "b": 284.51996, "coord_origin": "TOPLEFT"}}, {"id": 233, "text": "Adjustment", "bbox": {"l": 442.01610999999997, "t": 284.2663, "r": 448.85001, "b": 285.69980000000004, "coord_origin": "TOPLEFT"}}, {"id": 234, "text": "Knob", "bbox": {"l": 442.01610999999997, "t": 285.44611, "r": 445.03033000000005, "b": 286.87961, "coord_origin": "TOPLEFT"}}, {"id": 235, "text": "Stage", "bbox": {"l": 408.00577, "t": 279.12579000000005, "r": 411.42212, "b": 280.5593, "coord_origin": "TOPLEFT"}}, {"id": 236, "text": "Condenser ", "bbox": {"l": 404.07172, "t": 280.9144299999999, "r": 410.77707, "b": 282.3479, "coord_origin": "TOPLEFT"}}, {"id": 237, "text": "Focusing", "bbox": {"l": 404.07172, "t": 282.09424, "r": 409.2157, "b": 283.52774, "coord_origin": "TOPLEFT"}}, {"id": 238, "text": "Knob", "bbox": {"l": 404.07172, "t": 283.27408, "r": 407.08594, "b": 284.7075500000001, "coord_origin": "TOPLEFT"}}, {"id": 239, "text": "Eyepiece", "bbox": {"l": 441.81281, "t": 262.32178, "r": 447.03702, "b": 263.75525000000005, "coord_origin": "TOPLEFT"}}, {"id": 240, "text": "Stand", "bbox": {"l": 437.34607, "t": 271.13025000000005, "r": 440.80496, "b": 272.56281, "coord_origin": "TOPLEFT"}}, {"id": 241, "text": "Lamp ", "bbox": {"l": 409.7164, "t": 284.40027, "r": 413.3768, "b": 285.83282, "coord_origin": "TOPLEFT"}}, {"id": 242, "text": "On/Off", "bbox": {"l": 409.7164, "t": 285.83163, "r": 413.68201, "b": 287.26416, "coord_origin": "TOPLEFT"}}, {"id": 243, "text": "Switch", "bbox": {"l": 409.7164, "t": 287.263, "r": 413.6337, "b": 288.69553, "coord_origin": "TOPLEFT"}}, {"id": 244, "text": "Lamp ", "bbox": {"l": 434.8712499999999, "t": 296.7153, "r": 438.53164999999996, "b": 298.14783, "coord_origin": "TOPLEFT"}}, {"id": 245, "text": "Power", "bbox": {"l": 439.52039, "t": 292.18307000000004, "r": 443.08768, "b": 293.61560000000003, "coord_origin": "TOPLEFT"}}, {"id": 246, "text": "Cord", "bbox": {"l": 439.52039, "t": 293.61444, "r": 442.29575, "b": 295.04697, "coord_origin": "TOPLEFT"}}, {"id": 247, "text": "Rotating Head", "bbox": {"l": 413.55829, "t": 264.66089, "r": 421.94913, "b": 266.09344, "coord_origin": "TOPLEFT"}}, {"id": 248, "text": "Stage Clip", "bbox": {"l": 441.84316999999993, "t": 286.90573, "r": 447.87585000000007, "b": 288.33826, "coord_origin": "TOPLEFT"}}, {"id": 249, "text": "Adjustment", "bbox": {"l": 441.84316999999993, "t": 288.3371, "r": 448.67252, "b": 289.76962000000003, "coord_origin": "TOPLEFT"}}, {"id": 250, "text": "Interpupillary Slide Adjustment", "bbox": {"l": 407.2403, "t": 259.86645999999996, "r": 425.79089, "b": 261.29895, "coord_origin": "TOPLEFT"}}, {"id": 251, "text": "Circling Minimums", "bbox": {"l": 449.10074000000003, "t": 378.66302, "r": 466.08835000000005, "b": 380.78412, "coord_origin": "TOPLEFT"}}, {"id": 252, "text": "7", "bbox": {"l": 449.10074000000003, "t": 383.2203999999999, "r": 449.64444, "b": 385.34148999999996, "coord_origin": "TOPLEFT"}}, {"id": 253, "text": "K H U H Z D V D F K D Q J H W R W K H 7 ( 5 3 6 F U L W H U L D L Q W K D W D \u1087H F W V F L U F O L Q J D U H D G L P H Q V L R Q E \\ H [ S D Q G L Q J W K H D U H D V W R S U R Y L G H ", "bbox": {"l": 450.18811, "t": 383.2203999999999, "r": 550.77124, "b": 385.34148999999996, "coord_origin": "TOPLEFT"}}, {"id": 254, "text": "improved obstacle protection. To indicate that the new criteria had been applied to a given procedure, a ", "bbox": {"l": 449.10074000000003, "t": 385.75732, "r": 536.14716, "b": 387.87842, "coord_origin": "TOPLEFT"}}, {"id": 255, "text": " is placed on ", "bbox": {"l": 538.31085, "t": 385.75732, "r": 549.49921, "b": 387.87842, "coord_origin": "TOPLEFT"}}, {"id": 256, "text": "the circling line of minimums. The new circling tables and explanatory information is located in the Legend of the TPP.", "bbox": {"l": 449.10074000000003, "t": 388.03601, "r": 547.58185, "b": 390.1571, "coord_origin": "TOPLEFT"}}, {"id": 257, "text": "7", "bbox": {"l": 449.10074000000003, "t": 393.2128000000001, "r": 449.6163, "b": 395.33386, "coord_origin": "TOPLEFT"}}, {"id": 258, "text": "K H D S S U R D F K H V X V L Q J V W D Q G D U G F L U F O L Q J D S S U R D F K D U H D V F D Q E H L G H Q W L \u00bf H G E \\ W K H D E V H Q F H R I W K H ", "bbox": {"l": 450.1319, "t": 393.2128000000001, "r": 529.53082, "b": 395.33386, "coord_origin": "TOPLEFT"}}, {"id": 259, "text": " on the circling line of ", "bbox": {"l": 532.05829, "t": 393.2128000000001, "r": 550.42261, "b": 395.33386, "coord_origin": "TOPLEFT"}}, {"id": 260, "text": "minima.", "bbox": {"l": 449.10074000000003, "t": 395.49149, "r": 455.74692, "b": 397.61255, "coord_origin": "TOPLEFT"}}, {"id": 261, "text": "$ S S O \\ 6 W D Q G D U G & L U F O L Q J $ S S U R D F K 0 D Q H X Y H U L Q J 5 D G L X V 7 D E O H ", "bbox": {"l": 449.95525999999995, "t": 415.59549, "r": 496.2829, "b": 417.50446, "coord_origin": "TOPLEFT"}}, {"id": 262, "text": "$ S S O \\ ( [ S D Q G H G & L U F O L Q J $ S S U R D F K 0 D Q H X Y H U L Q J $ L U V S D F H 5 D G L X V ", "bbox": {"l": 501.13077, "t": 409.25543, "r": 551.16101, "b": 411.1644, "coord_origin": "TOPLEFT"}}, {"id": 263, "text": "Table", "bbox": {"l": 501.13077, "t": 411.30624, "r": 505.2477999999999, "b": 413.21521, "coord_origin": "TOPLEFT"}}, {"id": 264, "text": "AIRPORT SKETCH", "bbox": {"l": 449.10074000000003, "t": 420.18802, "r": 469.35599, "b": 422.73331, "coord_origin": "TOPLEFT"}}, {"id": 265, "text": "The airport sketch is a depiction of the airport with emphasis on runway pattern and related ", "bbox": {"l": 449.10074000000003, "t": 425.08908, "r": 525.93616, "b": 427.21017, "coord_origin": "TOPLEFT"}}, {"id": 266, "text": "information, positioned in either the lower left or lower right corner of the chart to aid pi-", "bbox": {"l": 449.10074000000003, "t": 427.3678, "r": 522.0343, "b": 429.48886, "coord_origin": "TOPLEFT"}}, {"id": 267, "text": "lot recognition of the airport from the air and to provide some information to aid on ground ", "bbox": {"l": 449.10074000000003, "t": 429.64648, "r": 524.67151, "b": 431.76755, "coord_origin": "TOPLEFT"}}, {"id": 268, "text": "navigation of the airport. The runways are drawn to scale and oriented to true north. Runway ", "bbox": {"l": 449.10074000000003, "t": 431.92514000000006, "r": 527.172, "b": 434.04623, "coord_origin": "TOPLEFT"}}, {"id": 269, "text": "dimensions (length and width) are shown for all active runways.", "bbox": {"l": 449.10074000000003, "t": 434.20383, "r": 502.39545, "b": 436.32492, "coord_origin": "TOPLEFT"}}, {"id": 270, "text": "Runway(s) are depicted based on what type and construction of the runway.", "bbox": {"l": 449.10074000000003, "t": 438.7611999999999, "r": 512.92676, "b": 440.88228999999995, "coord_origin": "TOPLEFT"}}, {"id": 271, "text": "Hard Surface", "bbox": {"l": 449.95525999999995, "t": 444.07001, "r": 460.02307, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}, {"id": 272, "text": "Other Than ", "bbox": {"l": 464.89963, "t": 444.07001, "r": 473.98819, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}, {"id": 273, "text": "Hard Surface", "bbox": {"l": 464.89963, "t": 446.12085, "r": 474.96744, "b": 448.02979, "coord_origin": "TOPLEFT"}}, {"id": 274, "text": "Metal Surface", "bbox": {"l": 478.91357, "t": 444.07001, "r": 489.45648, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}, {"id": 275, "text": "Closed Runway", "bbox": {"l": 493.06420999999995, "t": 444.07001, "r": 505.03076, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}, {"id": 276, "text": "Under Construction", "bbox": {"l": 509.5809, "t": 444.07001, "r": 524.30237, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}, {"id": 277, "text": "Stopways, ", "bbox": {"l": 449.95525999999995, "t": 454.81207, "r": 458.31406, "b": 456.72104, "coord_origin": "TOPLEFT"}}, {"id": 278, "text": "Taxiways, Park-", "bbox": {"l": 449.95525999999995, "t": 456.86288, "r": 461.92083999999994, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}}, {"id": 279, "text": "ing Areas", "bbox": {"l": 449.95525999999995, "t": 458.91373, "r": 457.08014, "b": 460.82268999999997, "coord_origin": "TOPLEFT"}}, {"id": 280, "text": "Displaced ", "bbox": {"l": 464.89963, "t": 454.81207, "r": 472.87732, "b": 456.72104, "coord_origin": "TOPLEFT"}}, {"id": 281, "text": "Threshold", "bbox": {"l": 464.89963, "t": 456.86288, "r": 472.49792, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}}, {"id": 282, "text": "Closed", "bbox": {"l": 478.91357, "t": 454.81207, "r": 483.61584, "b": 456.72104, "coord_origin": "TOPLEFT"}}, {"id": 283, "text": "Pavement", "bbox": {"l": 478.91357, "t": 456.86288, "r": 486.60754000000003, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}}, {"id": 284, "text": "Water Runway", "bbox": {"l": 493.06420999999995, "t": 454.81207, "r": 504.20648, "b": 456.72104, "coord_origin": "TOPLEFT"}}, {"id": 285, "text": "Taxiways and aprons are shaded grey. Other runway features that may be shown are runway numbers, runway dimen-", "bbox": {"l": 449.10074000000003, "t": 469.32974, "r": 548.59674, "b": 471.45081, "coord_origin": "TOPLEFT"}}, {"id": 286, "text": "sions, runway slope, arresting gear, and displaced threshold.", "bbox": {"l": 449.10074000000003, "t": 471.60843, "r": 500.08181999999994, "b": 473.72949, "coord_origin": "TOPLEFT"}}, {"id": 287, "text": "2", "bbox": {"l": 449.10074000000003, "t": 476.16577, "r": 449.59933000000007, "b": 478.28687, "coord_origin": "TOPLEFT"}}, {"id": 288, "text": "W K H U L Q I R U P D W L R Q F R Q F H U Q L Q J O L J K W L Q J \u00bf Q D O D S S U R D F K E H D U L Q J V D L U S R U W E H D F R Q R E V W D F O H V F R Q W U R O W R Z H U 1 $ 9 $ , ' V K H O L ", "bbox": {"l": 450.09796, "t": 476.16577, "r": 547.82562, "b": 478.28687, "coord_origin": "TOPLEFT"}}, {"id": 289, "text": "-", "bbox": {"l": 547.82623, "t": 476.16577, "r": 548.45862, "b": 478.28687, "coord_origin": "TOPLEFT"}}, {"id": 290, "text": "pads may also be shown.", "bbox": {"l": 449.10074000000003, "t": 478.44446, "r": 470.52609000000007, "b": 480.56555, "coord_origin": "TOPLEFT"}}, {"id": 291, "text": "$ L U S R U W ( O H Y D W L R Q D Q G 7 R X F K G R Z Q = R Q H ( O H Y D W L R Q ", "bbox": {"l": 449.10074000000003, "t": 483.00183, "r": 493.37906000000004, "b": 485.12292, "coord_origin": "TOPLEFT"}}, {"id": 292, "text": "The airport elevation is shown enclosed within a box in the upper left corner of the sketch box and the touchdown zone ", "bbox": {"l": 449.10074000000003, "t": 487.5592, "r": 549.16168, "b": 489.6803, "coord_origin": "TOPLEFT"}}, {"id": 293, "text": "elevation (TDZE) is shown in the upper right corner of the sketch box. The airport elevation is the highest point of an ", "bbox": {"l": 449.10074000000003, "t": 489.83789, "r": 546.90881, "b": 491.95898, "coord_origin": "TOPLEFT"}}, {"id": 294, "text": "D L U S R U W \u00b6 V X V D E O H U X Q Z D \\ V P H D V X U H G L Q I H H W I U R P P H D Q V H D O H Y H O 7 K H 7 ' = ( L V W K H K L J K H V W H O H Y D W L R Q L Q W K H \u00bf U V W I H H W R I ", "bbox": {"l": 449.10074000000003, "t": 492.11658, "r": 551.80023, "b": 494.23767, "coord_origin": "TOPLEFT"}}, {"id": 295, "text": "the landing surface. Circling only approaches will not show a TDZE.", "bbox": {"l": 449.10074000000003, "t": 494.39526, "r": 505.85068000000007, "b": 496.51636, "coord_origin": "TOPLEFT"}}, {"id": 296, "text": "114", "bbox": {"l": 498.80661000000003, "t": 515.9437, "r": 502.08792, "b": 519.01764, "coord_origin": "TOPLEFT"}}, {"id": 297, "text": "FAA Chart Users\u2019 Guide - Terminal Procedures Publication (TPP) - Terms", "bbox": {"l": 444.56319999999994, "t": 422.84869, "r": 446.25998, "b": 471.87128, "coord_origin": "TOPLEFT"}}, {"id": 298, "text": "AGL 2013 Financial Calendar", "bbox": {"l": 329.40536, "t": 379.37537, "r": 355.13138, "b": 382.13336, "coord_origin": "TOPLEFT"}}, {"id": 299, "text": "22", "bbox": {"l": 329.40536, "t": 382.30273, "r": 330.96848, "b": 384.55927, "coord_origin": "TOPLEFT"}}, {"id": 300, "text": "August 2012 ", "bbox": {"l": 331.75003, "t": 382.30273, "r": 341.12875, "b": 384.55927, "coord_origin": "TOPLEFT"}}, {"id": 301, "text": "2012 full year result and fi nal dividend announced", "bbox": {"l": 350.4722, "t": 382.30273, "r": 384.81079, "b": 384.55927, "coord_origin": "TOPLEFT"}}, {"id": 302, "text": "30", "bbox": {"l": 329.40536, "t": 384.84552, "r": 330.97336, "b": 387.10205, "coord_origin": "TOPLEFT"}}, {"id": 303, "text": "August 2012 ", "bbox": {"l": 331.75735, "t": 384.84552, "r": 341.16534, "b": 387.10205, "coord_origin": "TOPLEFT"}}, {"id": 304, "text": "Ex-dividend trading commences", "bbox": {"l": 350.4722, "t": 384.84552, "r": 372.90613, "b": 387.10205, "coord_origin": "TOPLEFT"}}, {"id": 305, "text": "5", "bbox": {"l": 329.40536, "t": 387.38828, "r": 330.20337, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}}, {"id": 306, "text": "September 2012 ", "bbox": {"l": 331.00137, "t": 387.38828, "r": 342.9715, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}}, {"id": 307, "text": "Record date for 2012 fi nal dividend", "bbox": {"l": 350.4722, "t": 387.38828, "r": 374.88693, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}}, {"id": 308, "text": "27", "bbox": {"l": 329.40536, "t": 389.93103, "r": 331.0173, "b": 392.18762, "coord_origin": "TOPLEFT"}}, {"id": 309, "text": "September 2012 ", "bbox": {"l": 331.82327, "t": 389.93103, "r": 343.91284, "b": 392.18762, "coord_origin": "TOPLEFT"}}, {"id": 310, "text": "Final dividend payable", "bbox": {"l": 350.4722, "t": 389.93103, "r": 365.65988, "b": 392.18762, "coord_origin": "TOPLEFT"}}, {"id": 311, "text": "23", "bbox": {"l": 329.40536, "t": 392.47382, "r": 330.98804, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}}, {"id": 312, "text": "October 2012 ", "bbox": {"l": 331.77936, "t": 392.47382, "r": 342.06674, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}}, {"id": 313, "text": "Annual General Meeting", "bbox": {"l": 350.4722, "t": 392.47382, "r": 367.22156, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}}, {"id": 314, "text": "27", "bbox": {"l": 329.40536, "t": 395.0166, "r": 330.99741, "b": 397.27313, "coord_origin": "TOPLEFT"}}, {"id": 315, "text": "February 2013", "bbox": {"l": 331.7934, "t": 395.0166, "r": 342.1416, "b": 397.27313, "coord_origin": "TOPLEFT"}}, {"id": 316, "text": " 1", "bbox": {"l": 342.64841, "t": 395.18298, "r": 342.65811, "b": 396.49857000000003, "coord_origin": "TOPLEFT"}}, {"id": 317, "text": "2013 interim result and interim dividend announced", "bbox": {"l": 350.47177, "t": 395.01474, "r": 386.25897, "b": 397.2713, "coord_origin": "TOPLEFT"}}, {"id": 318, "text": "28", "bbox": {"l": 329.40491, "t": 397.55749999999995, "r": 331.02695, "b": 399.81406, "coord_origin": "TOPLEFT"}}, {"id": 319, "text": "August 2013", "bbox": {"l": 331.83795, "t": 397.55749999999995, "r": 340.75909, "b": 399.81406, "coord_origin": "TOPLEFT"}}, {"id": 320, "text": " 1", "bbox": {"l": 341.26437, "t": 397.7254, "r": 341.27408, "b": 399.04095, "coord_origin": "TOPLEFT"}}, {"id": 321, "text": "2013 full year results and fi nal dividend announced ", "bbox": {"l": 350.47144, "t": 397.55713, "r": 385.93265, "b": 399.81369, "coord_origin": "TOPLEFT"}}, {"id": 322, "text": "1", "bbox": {"l": 329.40536, "t": 400.46155, "r": 329.87708, "b": 401.96588, "coord_origin": "TOPLEFT"}}, {"id": 323, "text": "Indicative dates only, subject to change/Board confi rmation", "bbox": {"l": 330.34882, "t": 400.46155, "r": 358.65204, "b": 401.96588, "coord_origin": "TOPLEFT"}}, {"id": 324, "text": "AGL\u2019s Annual General Meeting will be held at the City Recital Hall, Angel Place, Sydney ", "bbox": {"l": 329.40536, "t": 404.34503, "r": 391.771, "b": 406.60156, "coord_origin": "TOPLEFT"}}, {"id": 325, "text": "commencing at 10.30am on Tuesday 23 October 2012.", "bbox": {"l": 329.40536, "t": 406.37857, "r": 369.65308, "b": 408.63513000000006, "coord_origin": "TOPLEFT"}}, {"id": 326, "text": "Ye s te rd ay", "bbox": {"l": 363.54486, "t": 460.53054999999995, "r": 379.25955, "b": 465.54507, "coord_origin": "TOPLEFT"}}, {"id": 327, "text": "Established in Sydney in 1837, and then ", "bbox": {"l": 363.54486, "t": 466.7157, "r": 391.38229, "b": 468.97223, "coord_origin": "TOPLEFT"}}, {"id": 328, "text": "known as The Australian Gas Light Company, ", "bbox": {"l": 363.54486, "t": 468.74924, "r": 395.01788, "b": 471.00577, "coord_origin": "TOPLEFT"}}, {"id": 329, "text": "the AGL business has an established history ", "bbox": {"l": 363.54486, "t": 470.78281, "r": 394.08322, "b": 473.03934, "coord_origin": "TOPLEFT"}}, {"id": 330, "text": "and reputation for serving the gas and ", "bbox": {"l": 363.54486, "t": 472.81635, "r": 390.60727, "b": 475.07288, "coord_origin": "TOPLEFT"}}, {"id": 331, "text": "electricity needs of Australian households. ", "bbox": {"l": 363.54486, "t": 474.84988, "r": 393.49612, "b": 477.10645, "coord_origin": "TOPLEFT"}}, {"id": 332, "text": "In 1841, when AGL supplied the gas to light ", "bbox": {"l": 363.54486, "t": 476.88345, "r": 394.11481, "b": 479.13998, "coord_origin": "TOPLEFT"}}, {"id": 333, "text": "the fi rst public street lamp, it was reported ", "bbox": {"l": 363.54486, "t": 478.91699, "r": 393.75891, "b": 481.17352, "coord_origin": "TOPLEFT"}}, {"id": 334, "text": "in the Sydney Gazette as a \u201cwonderful ", "bbox": {"l": 363.54486, "t": 480.95053, "r": 390.4975, "b": 483.20709, "coord_origin": "TOPLEFT"}}, {"id": 335, "text": "achievement of scientifi c knowledge, assisted ", "bbox": {"l": 363.54486, "t": 482.9841, "r": 395.70975, "b": 485.24063, "coord_origin": "TOPLEFT"}}, {"id": 336, "text": "by mechanical ingenuity.\u201d Within two years, ", "bbox": {"l": 363.54486, "t": 485.01764, "r": 394.27283, "b": 487.2742, "coord_origin": "TOPLEFT"}}, {"id": 337, "text": "165 gas lamps were lighting the City of Sydney.", "bbox": {"l": 363.54486, "t": 487.05121, "r": 396.65939, "b": 489.30774, "coord_origin": "TOPLEFT"}}, {"id": 338, "text": "Looking back on ", "bbox": {"l": 329.4054, "t": 419.93124, "r": 384.19696, "b": 431.09412, "coord_origin": "TOPLEFT"}}, {"id": 339, "text": "175 years of ", "bbox": {"l": 329.4054, "t": 430.10379, "r": 372.16626, "b": 441.26669, "coord_origin": "TOPLEFT"}}, {"id": 340, "text": "looking forward.", "bbox": {"l": 329.4054, "t": 440.27636999999993, "r": 385.3981, "b": 451.43924, "coord_origin": "TOPLEFT"}}, {"id": 341, "text": "AGL Energy Limited ABN 74 115 061 375", "bbox": {"l": 329.40536, "t": 372.16159, "r": 353.36179, "b": 373.91669, "coord_origin": "TOPLEFT"}}, {"id": 342, "text": "29", "bbox": {"l": 546.20587, "t": 360.90448, "r": 548.23407, "b": 362.82242, "coord_origin": "TOPLEFT"}}, {"id": 343, "text": "signs, signals and road markings", "bbox": {"l": 497.77728, "t": 251.43384000000003, "r": 542.8255, "b": 254.94385, "coord_origin": "TOPLEFT"}}, {"id": 344, "text": "3", "bbox": {"l": 490.30679, "t": 251.47478999999998, "r": 492.09982, "b": 254.98479999999995, "coord_origin": "TOPLEFT"}}, {"id": 345, "text": "In ", "bbox": {"l": 498.15335, "t": 263.88922, "r": 500.05637, "b": 265.92719, "coord_origin": "TOPLEFT"}}, {"id": 346, "text": "chapter 2, you and your vehicle", "bbox": {"l": 500.05637, "t": 263.85717999999997, "r": 524.37036, "b": 265.86310000000003, "coord_origin": "TOPLEFT"}}, {"id": 347, "text": ", you learned about ", "bbox": {"l": 524.37036, "t": 263.88922, "r": 539.89124, "b": 265.92719, "coord_origin": "TOPLEFT"}}, {"id": 348, "text": "some of the controls in your vehicle. This chapter is a handy ", "bbox": {"l": 498.15335, "t": 265.93224999999995, "r": 544.50403, "b": 267.97020999999995, "coord_origin": "TOPLEFT"}}, {"id": 349, "text": "reference section that gives examples of the most common ", "bbox": {"l": 498.15335, "t": 267.97533999999996, "r": 544.01343, "b": 270.01331000000005, "coord_origin": "TOPLEFT"}}, {"id": 350, "text": "signs, signals and road markings that keep traffi c organized ", "bbox": {"l": 498.15335, "t": 270.01831000000004, "r": 544.11987, "b": 272.05634, "coord_origin": "TOPLEFT"}}, {"id": 351, "text": "and flowing smoothly. ", "bbox": {"l": 498.15335, "t": 272.06140000000005, "r": 515.41071, "b": 274.09937, "coord_origin": "TOPLEFT"}}, {"id": 352, "text": "Signs", "bbox": {"l": 498.15335, "t": 277.34619, "r": 505.64642000000003, "b": 280.9357, "coord_origin": "TOPLEFT"}}, {"id": 353, "text": "There are three ways to read signs: by their shape, colour and ", "bbox": {"l": 498.15335, "t": 281.82187, "r": 543.92957, "b": 283.85983, "coord_origin": "TOPLEFT"}}, {"id": 354, "text": "the messages printed on them. Understanding these three ways ", "bbox": {"l": 498.15335, "t": 283.8649, "r": 545.67834, "b": 285.90289, "coord_origin": "TOPLEFT"}}, {"id": 355, "text": "of classifying signs will help you figure out the meaning of signs ", "bbox": {"l": 498.15335, "t": 285.90796, "r": 545.26471, "b": 287.94592, "coord_origin": "TOPLEFT"}}, {"id": 356, "text": "that are new to you. ", "bbox": {"l": 498.15335, "t": 287.95099, "r": 513.31335, "b": 289.98895, "coord_origin": "TOPLEFT"}}, {"id": 357, "text": "Stop", "bbox": {"l": 505.43439, "t": 303.07596, "r": 508.53033000000005, "b": 304.89639, "coord_origin": "TOPLEFT"}}, {"id": 358, "text": "Yield the right-of-way", "bbox": {"l": 527.45502, "t": 303.25354, "r": 541.44678, "b": 305.07397, "coord_origin": "TOPLEFT"}}, {"id": 359, "text": "Shows driving", "bbox": {"l": 501.79385, "t": 321.18973, "r": 510.41632, "b": 323.01016, "coord_origin": "TOPLEFT"}}, {"id": 360, "text": "regulations", "bbox": {"l": 501.79385, "t": 322.87731999999994, "r": 509.04268999999994, "b": 324.69775000000004, "coord_origin": "TOPLEFT"}}, {"id": 361, "text": "Explains lane use", "bbox": {"l": 518.66455, "t": 319.59146, "r": 529.80902, "b": 321.41190000000006, "coord_origin": "TOPLEFT"}}, {"id": 362, "text": "School zone signs ", "bbox": {"l": 534.87561, "t": 318.37616, "r": 546.95142, "b": 320.19659, "coord_origin": "TOPLEFT"}}, {"id": 363, "text": "are fl uorescent ", "bbox": {"l": 534.87561, "t": 320.0637500000001, "r": 545.05762, "b": 321.88419, "coord_origin": "TOPLEFT"}}, {"id": 364, "text": "yellow-green", "bbox": {"l": 534.87561, "t": 321.75134, "r": 543.32263, "b": 323.57178, "coord_origin": "TOPLEFT"}}, {"id": 365, "text": "Tells about motorist ", "bbox": {"l": 499.21862999999996, "t": 338.12772, "r": 512.62451, "b": 339.94815, "coord_origin": "TOPLEFT"}}, {"id": 366, "text": "services", "bbox": {"l": 499.21862999999996, "t": 339.81531000000007, "r": 504.39917, "b": 341.63574, "coord_origin": "TOPLEFT"}}, {"id": 367, "text": "Shows a permitted ", "bbox": {"l": 516.97748, "t": 338.06039, "r": 529.77484, "b": 339.88082999999995, "coord_origin": "TOPLEFT"}}, {"id": 368, "text": "action", "bbox": {"l": 516.97748, "t": 339.74799, "r": 520.96399, "b": 341.56842, "coord_origin": "TOPLEFT"}}, {"id": 369, "text": "Shows an action that ", "bbox": {"l": 534.55847, "t": 337.88281, "r": 548.58453, "b": 339.7032500000001, "coord_origin": "TOPLEFT"}}, {"id": 370, "text": "is not permitted", "bbox": {"l": 534.55847, "t": 339.57040000000006, "r": 545.08862, "b": 341.39084, "coord_origin": "TOPLEFT"}}, {"id": 371, "text": "Warns of hazards ", "bbox": {"l": 483.05853, "t": 356.17416, "r": 494.72577, "b": 357.9946, "coord_origin": "TOPLEFT"}}, {"id": 372, "text": "ahead", "bbox": {"l": 483.05853, "t": 357.86179, "r": 487.07525999999996, "b": 359.68222, "coord_origin": "TOPLEFT"}}, {"id": 373, "text": "Warns of", "bbox": {"l": 499.39645, "t": 356.26297000000005, "r": 504.69171, "b": 358.0834, "coord_origin": "TOPLEFT"}}, {"id": 374, "text": "construction zones", "bbox": {"l": 499.39645, "t": 357.95056, "r": 511.69116, "b": 359.77099999999996, "coord_origin": "TOPLEFT"}}, {"id": 375, "text": "Railway crossing", "bbox": {"l": 516.75891, "t": 356.26297000000005, "r": 527.42938, "b": 358.0834, "coord_origin": "TOPLEFT"}}, {"id": 376, "text": "Shows distance and ", "bbox": {"l": 534.5141, "t": 352.92981, "r": 547.89862, "b": 354.75024, "coord_origin": "TOPLEFT"}}, {"id": 377, "text": "direction", "bbox": {"l": 534.5141, "t": 354.6174, "r": 540.2818, "b": 356.43784, "coord_origin": "TOPLEFT"}}, {"id": 378, "text": "\u2022", "bbox": {"l": 478.37466, "t": 270.14075, "r": 479.14251999999993, "b": 272.17877, "coord_origin": "TOPLEFT"}}, {"id": 379, "text": "Signs", "bbox": {"l": 479.91036999999994, "t": 270.14075, "r": 483.74963, "b": 272.17877, "coord_origin": "TOPLEFT"}}, {"id": 380, "text": "- regulatory signs", "bbox": {"l": 479.97293, "t": 272.84717, "r": 492.31219, "b": 274.34888, "coord_origin": "TOPLEFT"}}, {"id": 381, "text": "- school, ", "bbox": {"l": 479.97293, "t": 275.14513999999997, "r": 486.72598000000005, "b": 276.64679, "coord_origin": "TOPLEFT"}}, {"id": 382, "text": "playground and ", "bbox": {"l": 481.21602999999993, "t": 276.77972, "r": 492.93286000000006, "b": 278.81768999999997, "coord_origin": "TOPLEFT"}}, {"id": 383, "text": "crosswalk signs", "bbox": {"l": 481.21602999999993, "t": 278.82275000000004, "r": 491.82938000000007, "b": 280.86075, "coord_origin": "TOPLEFT"}}, {"id": 384, "text": "- lane use signs", "bbox": {"l": 479.97293, "t": 281.52759, "r": 491.00775000000004, "b": 283.02924, "coord_origin": "TOPLEFT"}}, {"id": 385, "text": "- turn control signs", "bbox": {"l": 479.97293, "t": 283.82556, "r": 493.32748, "b": 285.3272099999999, "coord_origin": "TOPLEFT"}}, {"id": 386, "text": "- parking signs", "bbox": {"l": 479.97293, "t": 286.1235, "r": 490.4915199999999, "b": 287.62518, "coord_origin": "TOPLEFT"}}, {"id": 387, "text": "- reserved lane ", "bbox": {"l": 479.97293, "t": 288.42148, "r": 491.17004000000003, "b": 289.92316, "coord_origin": "TOPLEFT"}}, {"id": 388, "text": "signs", "bbox": {"l": 481.21602999999993, "t": 290.05605999999995, "r": 484.77405000000005, "b": 292.09406, "coord_origin": "TOPLEFT"}}, {"id": 389, "text": "- warning signs", "bbox": {"l": 479.97293, "t": 292.76169000000004, "r": 490.83398, "b": 294.26334, "coord_origin": "TOPLEFT"}}, {"id": 390, "text": "- object markers", "bbox": {"l": 479.97293, "t": 295.05963, "r": 491.62692, "b": 296.56131, "coord_origin": "TOPLEFT"}}, {"id": 391, "text": "- construction ", "bbox": {"l": 479.97293, "t": 297.3576, "r": 490.37341, "b": 298.8592499999999, "coord_origin": "TOPLEFT"}}, {"id": 392, "text": "signs", "bbox": {"l": 481.21602999999993, "t": 298.99219, "r": 484.77405000000005, "b": 301.03015, "coord_origin": "TOPLEFT"}}, {"id": 393, "text": "- information and ", "bbox": {"l": 479.97293, "t": 301.69780999999995, "r": 492.93912, "b": 303.19946, "coord_origin": "TOPLEFT"}}, {"id": 394, "text": "destination signs", "bbox": {"l": 481.21602999999993, "t": 303.3324, "r": 493.00525, "b": 305.37036, "coord_origin": "TOPLEFT"}}, {"id": 395, "text": "- railway signs", "bbox": {"l": 479.97293, "t": 306.0379899999999, "r": 489.99047999999993, "b": 307.53967, "coord_origin": "TOPLEFT"}}, {"id": 396, "text": "\u2022", "bbox": {"l": 478.375, "t": 308.24789, "r": 479.1032400000001, "b": 310.28586, "coord_origin": "TOPLEFT"}}, {"id": 397, "text": "Signals", "bbox": {"l": 479.83151, "t": 308.24789, "r": 484.92925999999994, "b": 310.28586, "coord_origin": "TOPLEFT"}}, {"id": 398, "text": "- lane control ", "bbox": {"l": 479.97293, "t": 310.95358, "r": 490.00091999999995, "b": 312.45526, "coord_origin": "TOPLEFT"}}, {"id": 399, "text": "signals", "bbox": {"l": 481.21602999999993, "t": 312.5881999999999, "r": 485.95331, "b": 314.62616, "coord_origin": "TOPLEFT"}}, {"id": 400, "text": "- traffic lights", "bbox": {"l": 479.97293, "t": 315.29379, "r": 489.29876999999993, "b": 316.79544, "coord_origin": "TOPLEFT"}}, {"id": 401, "text": "\u2022", "bbox": {"l": 478.375, "t": 317.50366, "r": 479.18129999999996, "b": 319.5416599999999, "coord_origin": "TOPLEFT"}}, {"id": 402, "text": "Road markings", "bbox": {"l": 479.98761, "t": 317.50366, "r": 490.46960000000007, "b": 319.5416599999999, "coord_origin": "TOPLEFT"}}, {"id": 403, "text": "- yellow lines", "bbox": {"l": 479.97293, "t": 320.20938, "r": 489.26166000000006, "b": 321.71103, "coord_origin": "TOPLEFT"}}, {"id": 404, "text": "- white lines", "bbox": {"l": 479.97293, "t": 322.50732, "r": 488.59189, "b": 324.009, "coord_origin": "TOPLEFT"}}, {"id": 405, "text": "- reserved lane ", "bbox": {"l": 479.97293, "t": 324.8053, "r": 491.17004000000003, "b": 326.30698, "coord_origin": "TOPLEFT"}}, {"id": 406, "text": "markings", "bbox": {"l": 481.21602999999993, "t": 326.43988, "r": 487.58978, "b": 328.47784, "coord_origin": "TOPLEFT"}}, {"id": 407, "text": "- other markings", "bbox": {"l": 479.97293, "t": 329.14551, "r": 491.75177, "b": 330.64716, "coord_origin": "TOPLEFT"}}, {"id": 408, "text": "in this chapter", "bbox": {"l": 478.15246999999994, "t": 265.07030999999995, "r": 493.75586, "b": 268.06872999999996, "coord_origin": "TOPLEFT"}}, {"id": 409, "text": "Figure 1: Four examples of complex page layouts across dif-", "bbox": {"l": 317.95499, "t": 540.08299, "r": 559.80579, "b": 548.55624, "coord_origin": "TOPLEFT"}}, {"id": 410, "text": "ferent document categories", "bbox": {"l": 317.95499, "t": 551.0419899999999, "r": 428.69907, "b": 559.51524, "coord_origin": "TOPLEFT"}}, {"id": 411, "text": "KEYWORDS", "bbox": {"l": 317.95499, "t": 592.46591, "r": 379.8205, "b": 602.7750100000001, "coord_origin": "TOPLEFT"}}, {"id": 412, "text": "PDF document conversion, layout segmentation, object-detection,", "bbox": {"l": 317.95499, "t": 607.66756, "r": 559.18597, "b": 616.04218, "coord_origin": "TOPLEFT"}}, {"id": 413, "text": "data set, Machine Learning", "bbox": {"l": 317.95499, "t": 618.62656, "r": 416.94403, "b": 627.00117, "coord_origin": "TOPLEFT"}}, {"id": 414, "text": "ACM Reference Format:", "bbox": {"l": 317.65997, "t": 640.05434, "r": 404.65366, "b": 647.58609, "coord_origin": "TOPLEFT"}}, {"id": 415, "text": "Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter", "bbox": {"l": 317.95499, "t": 650.11996, "r": 558.35266, "b": 657.56404, "coord_origin": "TOPLEFT"}}, {"id": 416, "text": "Staar. 2022. DocLayNet: A Large Human-Annotated Dataset for Document-", "bbox": {"l": 317.95499, "t": 660.08296, "r": 559.5495, "b": 667.52703, "coord_origin": "TOPLEFT"}}, {"id": 417, "text": "Layout Analysis. In", "bbox": {"l": 317.95499, "t": 670.04497, "r": 383.30807, "b": 677.48904, "coord_origin": "TOPLEFT"}}, {"id": 418, "text": "Proceedings of the 28th ACM SIGKDD Conference on", "bbox": {"l": 385.798, "t": 670.08482, "r": 558.20032, "b": 677.49701, "coord_origin": "TOPLEFT"}}, {"id": 419, "text": "Knowledge Discovery and Data Mining (KDD \u201922), August 14-18, 2022, Wash-", "bbox": {"l": 317.95499, "t": 680.04781, "r": 559.00092, "b": 687.46001, "coord_origin": "TOPLEFT"}}, {"id": 420, "text": "ington, DC, USA.", "bbox": {"l": 317.95499, "t": 690.01081, "r": 370.11481, "b": 697.423004, "coord_origin": "TOPLEFT"}}, {"id": 421, "text": "ACM, New York, NY, USA, 9 pages. https://doi.org/10.1145/", "bbox": {"l": 371.82999, "t": 689.97096, "r": 558.71655, "b": 697.415031, "coord_origin": "TOPLEFT"}}, {"id": 422, "text": "3534678.3539043", "bbox": {"l": 317.95499, "t": 699.932953, "r": 371.59375, "b": 707.377029, "coord_origin": "TOPLEFT"}}, {"id": 423, "text": "arXiv:2206.01062v1 [cs.CV] 2 Jun 2022", "bbox": {"l": 18.34021, "t": 218.35999000000004, "r": 36.339794, "b": 555.00003, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 12, "label": "section_header", "bbox": {"l": 107.29999999999998, "t": 83.69470000000013, "r": 505.06195, "b": 119.59558000000015, "coord_origin": "TOPLEFT"}, "confidence": 0.8416301012039185, "cells": [{"id": 0, "text": "DocLayNet: A Large Human-Annotated Dataset for", "bbox": {"l": 107.29999999999998, "t": 83.69470000000013, "r": 505.06195, "b": 99.67058999999995, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Document-Layout Analysis", "bbox": {"l": 200.117, "t": 103.6196900000001, "r": 411.88367, "b": 119.59558000000015, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "text", "bbox": {"l": 90.96701, "t": 133.67236000000003, "r": 193.73123, "b": 180.24030000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.8637146949768066, "cells": [{"id": 2, "text": "Birgit Pfitzmann", "bbox": {"l": 102.06001, "t": 133.67236000000003, "r": 182.63805, "b": 144.83856000000003, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "IBM Research", "bbox": {"l": 114.29401000000001, "t": 147.02423, "r": 170.40337, "b": 156.32928000000004, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Rueschlikon, Switzerland", "bbox": {"l": 90.96701, "t": 158.97924999999998, "r": 193.73123, "b": 168.28430000000003, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "bpf@zurich.ibm.com", "bbox": {"l": 100.02301, "t": 170.93524000000002, "r": 184.67522, "b": 180.24030000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 255.11602999999997, "t": 133.67236000000003, "r": 357.88025, "b": 180.24030000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.8612666726112366, "cells": [{"id": 6, "text": "Christoph Auer", "bbox": {"l": 268.62402, "t": 133.67236000000003, "r": 344.59933, "b": 144.83856000000003, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "IBM Research", "bbox": {"l": 278.44302, "t": 147.02423, "r": 334.55237, "b": 156.32928000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Rueschlikon, Switzerland", "bbox": {"l": 255.11602999999997, "t": 158.97924999999998, "r": 357.88025, "b": 168.28430000000003, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "cau@zurich.ibm.com", "bbox": {"l": 263.70404, "t": 170.93524000000002, "r": 349.29272, "b": 180.24030000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "text", "bbox": {"l": 419.26505, "t": 133.67236000000003, "r": 522.0293, "b": 180.24030000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.8760607838630676, "cells": [{"id": 10, "text": "Michele Dolfi", "bbox": {"l": 437.6930500000001, "t": 133.67236000000003, "r": 503.60208, "b": 144.83856000000003, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "IBM Research", "bbox": {"l": 442.59305000000006, "t": 147.02423, "r": 498.7023899999999, "b": 156.32928000000004, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Rueschlikon, Switzerland", "bbox": {"l": 419.26505, "t": 158.97924999999998, "r": 522.0293, "b": 168.28430000000003, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "dol@zurich.ibm.com", "bbox": {"l": 428.56104000000005, "t": 170.93524000000002, "r": 512.73505, "b": 180.24030000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 172.54303, "t": 192.05737, "r": 275.30725, "b": 238.62531, "coord_origin": "TOPLEFT"}, "confidence": 0.8319916129112244, "cells": [{"id": 14, "text": "Ahmed S. Nassar", "bbox": {"l": 182.26804, "t": 192.05737, "r": 265.39255, "b": 203.22357, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "IBM Research", "bbox": {"l": 195.87103, "t": 205.40923999999995, "r": 251.98038999999997, "b": 214.71429, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Rueschlikon, Switzerland", "bbox": {"l": 172.54303, "t": 217.36425999999994, "r": 275.30725, "b": 226.66931, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "ahn@zurich.ibm.com", "bbox": {"l": 180.52803, "t": 229.32025, "r": 267.3222, "b": 238.62531, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 336.69302, "t": 192.05737, "r": 439.45727999999997, "b": 238.62531, "coord_origin": "TOPLEFT"}, "confidence": 0.8027974367141724, "cells": [{"id": 18, "text": "Peter Staar", "bbox": {"l": 361.52802, "t": 192.05737, "r": 414.84821, "b": 203.22357, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "IBM Research", "bbox": {"l": 360.02002, "t": 205.40923999999995, "r": 416.12939, "b": 214.71429, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Rueschlikon, Switzerland", "bbox": {"l": 336.69302, "t": 217.36425999999994, "r": 439.45727999999997, "b": 226.66931, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "taa@zurich.ibm.com", "bbox": {"l": 346.20703, "t": 229.32025, "r": 429.94269, "b": 238.62531, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "section_header", "bbox": {"l": 53.798035, "t": 247.70288000000005, "r": 111.94354, "b": 258.01202, "coord_origin": "TOPLEFT"}, "confidence": 0.8876153826713562, "cells": [{"id": 22, "text": "ABSTRACT", "bbox": {"l": 53.798035, "t": 247.70288000000005, "r": 111.94354, "b": 258.01202, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 53.466999, "t": 262.90454, "r": 295.56018, "b": 534.29318, "coord_origin": "TOPLEFT"}, "confidence": 0.9823057055473328, "cells": [{"id": 23, "text": "Accurate document layout analysis is a key requirement for high-", "bbox": {"l": 53.484001, "t": 262.90454, "r": 295.55591, "b": 271.27917, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "quality PDF document conversion. With the recent availability of", "bbox": {"l": 53.79800000000001, "t": 273.86352999999997, "r": 294.04199, "b": 282.23816, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "public, large ground-truth datasets such as PubLayNet and DocBank,", "bbox": {"l": 53.79800000000001, "t": 284.82254, "r": 295.34586, "b": 293.19717, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "deep-learning models have proven to be very effective at layout", "bbox": {"l": 53.79800000000001, "t": 295.78152, "r": 294.04709, "b": 304.15616000000006, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "detection and segmentation. While these datasets are of adequate", "bbox": {"l": 53.79800000000001, "t": 306.74053999999995, "r": 294.04645, "b": 315.11517, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "size to train such models, they severely lack in layout variability", "bbox": {"l": 53.79800000000001, "t": 317.69952, "r": 294.27573, "b": 326.07416, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "since they are sourced from scientific article repositories such as", "bbox": {"l": 53.79800000000001, "t": 328.65854, "r": 294.04712, "b": 337.03317, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "PubMed and arXiv only. Consequently, the accuracy of the layout", "bbox": {"l": 53.79800000000001, "t": 339.61755, "r": 294.0437, "b": 347.99219, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "segmentation drops significantly when these models are applied", "bbox": {"l": 53.79800000000001, "t": 350.57654, "r": 294.04715, "b": 358.95117, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "on more challenging and diverse layouts. In this paper, we present", "bbox": {"l": 53.79800000000001, "t": 361.53455, "r": 294.04364, "b": 369.90918000000005, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "DocLayNet", "bbox": {"l": 53.79800000000001, "t": 372.53839, "r": 92.863388, "b": 380.87714000000005, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": ", a new, publicly available, document-layout annotation", "bbox": {"l": 92.863998, "t": 372.49353, "r": 294.04361, "b": 380.86816, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "dataset in COCO format. It contains 80863 manually annotated", "bbox": {"l": 53.79800000000001, "t": 383.45255, "r": 294.04718, "b": 391.82718, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "pages from diverse data sources to represent a wide variability in", "bbox": {"l": 53.79800000000001, "t": 394.41153, "r": 294.0437, "b": 402.78616, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "layouts. For each PDF page, the layout annotations provide labelled", "bbox": {"l": 53.79800000000001, "t": 405.37054, "r": 294.04535, "b": 413.74518, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "bounding-boxes with a choice of 11 distinct classes. DocLayNet", "bbox": {"l": 53.79800000000001, "t": 416.32953, "r": 294.04715, "b": 424.70416000000006, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "also provides a subset of double- and triple-annotated pages to", "bbox": {"l": 53.79800000000001, "t": 427.28853999999995, "r": 294.04712, "b": 435.66318, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "determine the inter-annotator agreement. In multiple experiments,", "bbox": {"l": 53.79800000000001, "t": 438.24753, "r": 295.03, "b": 446.62216, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "we provide baseline accuracy scores (in mAP) for a set of popular", "bbox": {"l": 53.466999, "t": 449.20654, "r": 294.21616, "b": 457.58118, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "object detection models. We also demonstrate that these models", "bbox": {"l": 53.79800000000001, "t": 460.16553, "r": 294.04712, "b": 468.54016, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "fall approximately 10% behind the inter-annotator agreement. Fur-", "bbox": {"l": 53.79800000000001, "t": 471.12354, "r": 295.56018, "b": 479.49817, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "thermore, we provide evidence that DocLayNet is of sufficient size.", "bbox": {"l": 53.79800000000001, "t": 482.08255, "r": 295.42783, "b": 490.45718, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Lastly, we compare models trained on PubLayNet, DocBank and", "bbox": {"l": 53.79800000000001, "t": 493.04153, "r": 294.04715, "b": 501.41617, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "DocLayNet, showing that layout predictions of the DocLayNet-", "bbox": {"l": 53.79800000000001, "t": 504.00055, "r": 295.55618, "b": 512.37518, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "trained models are more robust and thus the preferred choice for", "bbox": {"l": 53.79800000000001, "t": 514.95953, "r": 294.21643, "b": 523.33417, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "general-purpose document-layout analysis.", "bbox": {"l": 53.79800000000001, "t": 525.91855, "r": 212.05495, "b": 534.29318, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "section_header", "bbox": {"l": 53.79800000000001, "t": 550.99692, "r": 134.81989, "b": 561.30602, "coord_origin": "TOPLEFT"}, "confidence": 0.9149599671363831, "cells": [{"id": 49, "text": "CCS CONCEPTS", "bbox": {"l": 53.79800000000001, "t": 550.99692, "r": 134.81989, "b": 561.30602, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 53.797989, "t": 566.08299, "r": 297.85294, "b": 596.50114, "coord_origin": "TOPLEFT"}, "confidence": 0.8458832502365112, "cells": [{"id": 50, "text": "\u2022", "bbox": {"l": 53.79800000000001, "t": 566.19957, "r": 56.945206000000006, "b": 574.57419, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Information systems", "bbox": {"l": 58.440002, "t": 566.0830100000001, "r": 142.4462, "b": 574.5562600000001, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "\u2192", "bbox": {"l": 143.938, "t": 566.36096, "r": 153.15099, "b": 574.43073, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Document structure", "bbox": {"l": 154.646, "t": 566.0830100000001, "r": 235.46015999999997, "b": 574.5562600000001, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "; \u2022", "bbox": {"l": 235.45700000000002, "t": 566.19955, "r": 242.17419, "b": 574.57417, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "Applied com-", "bbox": {"l": 243.66899, "t": 566.08299, "r": 297.85294, "b": 574.55624, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "puting", "bbox": {"l": 53.797989, "t": 577.0419899999999, "r": 80.661324, "b": 585.51524, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "\u2192", "bbox": {"l": 83.565987, "t": 577.3199500000001, "r": 92.778961, "b": 585.38971, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Document analysis", "bbox": {"l": 95.68399, "t": 577.0419899999999, "r": 173.91583, "b": 585.51524, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "; \u2022", "bbox": {"l": 173.916, "t": 577.15855, "r": 182.1272, "b": 585.53317, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Computing methodologies", "bbox": {"l": 185.032, "t": 577.0419899999999, "r": 294.0455, "b": 585.51524, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "\u2192", "bbox": {"l": 53.79800399999999, "t": 588.27895, "r": 63.01097899999999, "b": 596.34871, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "Machine learning", "bbox": {"l": 65.253006, "t": 588.00099, "r": 136.80487, "b": 596.47424, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": ";", "bbox": {"l": 136.80501, "t": 588.1175499999999, "r": 138.92108, "b": 596.49217, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "Computer vision", "bbox": {"l": 141.162, "t": 588.00099, "r": 209.60254, "b": 596.47424, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": ";", "bbox": {"l": 209.60201, "t": 588.1175499999999, "r": 211.71808, "b": 596.49217, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "Object detection", "bbox": {"l": 213.96001, "t": 588.16238, "r": 270.45728, "b": 596.50114, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": ";", "bbox": {"l": 270.48001, "t": 588.1175499999999, "r": 272.59607, "b": 596.49217, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 53.79800000000001, "t": 634.39838, "r": 295.11798, "b": 672.79189, "coord_origin": "TOPLEFT"}, "confidence": 0.7107343673706055, "cells": [{"id": 68, "text": "Permission to make digital or hard copies of part or all of this work for personal or", "bbox": {"l": 53.79800000000001, "t": 634.39838, "r": 294.17697, "b": 640.9119000000001, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "classroom use is granted without fee provided that copies are not made or distributed", "bbox": {"l": 53.79800000000001, "t": 642.36838, "r": 294.04443, "b": 648.8819, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "for profit or commercial advantage and that copies bear this notice and the full citation", "bbox": {"l": 53.79800000000001, "t": 650.33838, "r": 294.04498, "b": 656.8519, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "on the first page. Copyrights for third-party components of this work must be honored.", "bbox": {"l": 53.79800000000001, "t": 658.3083799999999, "r": 295.11798, "b": 664.8219, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "For all other uses, contact the owner/author(s).", "bbox": {"l": 53.79800000000001, "t": 666.27837, "r": 187.72285, "b": 672.79189, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 53.79800000000001, "t": 675.08023, "r": 197.86275, "b": 681.56586, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 53.79800000000001, "t": 675.08023, "r": 197.86275, "b": 681.56586, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 53.317001, "t": 683.81236, "r": 186.74652, "b": 690.32589, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "\u00a9 2022 Copyright held by the owner/author(s).", "bbox": {"l": 53.317001, "t": 683.81236, "r": 186.74652, "b": 690.32589, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 53.554001, "t": 691.78336, "r": 157.03125, "b": 698.29689, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "ACM ISBN 978-1-4503-9385-0/22/08.", "bbox": {"l": 53.554001, "t": 691.78336, "r": 157.03125, "b": 698.29689, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 53.79800000000001, "t": 699.753365, "r": 166.94093, "b": 706.266891, "coord_origin": "TOPLEFT"}, "confidence": 0.5095879435539246, "cells": [{"id": 76, "text": "https://doi.org/10.1145/3534678.3539043", "bbox": {"l": 53.79800000000001, "t": 699.753365, "r": 166.94093, "b": 706.266891, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "picture", "bbox": {"l": 323.408203125, "t": 250.34873962402344, "r": 553.2952270507812, "b": 525.8507080078125, "coord_origin": "TOPLEFT"}, "confidence": 0.5910214781761169, "cells": [{"id": 77, "text": "13", "bbox": {"l": 327.86951, "t": 351.78085, "r": 330.41248, "b": 353.95465, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "USING THE VERTICAL TUBE -", "bbox": {"l": 327.83005, "t": 331.57268999999997, "r": 351.16092, "b": 333.31171, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "MODELS AY11230/11234", "bbox": {"l": 327.83005, "t": 333.18292, "r": 348.30536, "b": 334.92194, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "1.", "bbox": {"l": 327.83005, "t": 336.40439, "r": 329.05914, "b": 337.92606, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "The vertical tube can be used for", "bbox": {"l": 329.67368, "t": 336.40439, "r": 349.95349, "b": 337.92606, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "instructional viewing or to photograph", "bbox": {"l": 329.11752, "t": 337.83588, "r": 353.57977, "b": 339.35751000000005, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": " the image with a digital camera or a", "bbox": {"l": 327.77121, "t": 339.26736, "r": 352.4306, "b": 340.789, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": " micro TV unit", "bbox": {"l": 328.15176, "t": 340.69882, "r": 337.91086, "b": 342.22049, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "2.", "bbox": {"l": 327.8313, "t": 342.19043000000005, "r": 329.09155, "b": 343.71207, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Loosen the retention screw, then rotate ", "bbox": {"l": 329.72168, "t": 342.19043000000005, "r": 354.9267, "b": 343.71207, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": " the adjustment ring to change the ", "bbox": {"l": 327.8313, "t": 343.62192, "r": 351.66949, "b": 345.14355, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": " length of the vertical tube.", "bbox": {"l": 328.21185, "t": 345.05338, "r": 346.33179, "b": 346.57504, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "3.", "bbox": {"l": 327.83005, "t": 346.84680000000003, "r": 329.12726, "b": 348.36847, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "Make sure that both the images in", "bbox": {"l": 329.77588, "t": 346.84680000000003, "r": 351.18005, "b": 348.36847, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "OPERATION ", "bbox": {"l": 327.25311, "t": 254.94812000000002, "r": 350.07861, "b": 258.86096, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "(", "bbox": {"l": 350.07861, "t": 254.76782000000003, "r": 351.82651, "b": 258.68066, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "cont.", "bbox": {"l": 351.82651, "t": 254.94812000000002, "r": 360.85242, "b": 258.86096, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": ")", "bbox": {"l": 360.85242, "t": 254.76782000000003, "r": 362.60028, "b": 258.68066, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "SELECTING OBJECTIVE ", "bbox": {"l": 326.88037, "t": 263.49492999999995, "r": 345.84351, "b": 265.23395000000005, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "MAGNIFICATION", "bbox": {"l": 326.88037, "t": 265.10515999999996, "r": 340.54153, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "1.", "bbox": {"l": 326.88037, "t": 266.71533, "r": 328.31903, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "There are two objectives. The lower", "bbox": {"l": 329.03836, "t": 266.71533, "r": 354.21472, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": " magnification objective has a greater", "bbox": {"l": 326.88037, "t": 268.32556, "r": 355.19193, "b": 270.06458, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": " depth of field and view.", "bbox": {"l": 326.88037, "t": 269.93579, "r": 345.80057, "b": 271.6748, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "2.", "bbox": {"l": 326.88037, "t": 271.54602, "r": 328.33862, "b": 273.28503, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "In order to observe the specimen", "bbox": {"l": 329.06775, "t": 271.54602, "r": 352.39969, "b": 273.28503, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": " easily use the lower magnification", "bbox": {"l": 326.88037, "t": 273.15619000000004, "r": 352.90042, "b": 274.89526, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": " objective first. Then, by rotating the", "bbox": {"l": 326.88037, "t": 274.76642000000004, "r": 354.59546, "b": 276.50543000000005, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": " case, the magnification can be", "bbox": {"l": 326.88037, "t": 276.37665000000004, "r": 350.81885, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": " changed.", "bbox": {"l": 326.88037, "t": 277.98688000000004, "r": 335.46707, "b": 279.72589000000005, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "CHANGING THE INTERPUPILLARY ", "bbox": {"l": 326.88037, "t": 281.20728, "r": 354.57755, "b": 282.94632, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "DISTANCE", "bbox": {"l": 326.88037, "t": 282.81750000000005, "r": 335.1752, "b": 284.55652, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "1.", "bbox": {"l": 326.88037, "t": 284.4277, "r": 328.34784, "b": 286.16675, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "The distance between the observer's", "bbox": {"l": 329.08157, "t": 284.4277, "r": 354.76245, "b": 286.16675, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": " pupils is the interpupillary distance.", "bbox": {"l": 326.88037, "t": 286.03793, "r": 354.6499, "b": 287.77695, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "2.", "bbox": {"l": 326.88037, "t": 287.64813, "r": 328.25125, "b": 289.38718, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "To adjust the interpupillary distance", "bbox": {"l": 328.93671, "t": 287.64813, "r": 354.29825, "b": 289.38718, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": " rotate the prism caps until both eyes", "bbox": {"l": 326.88181, "t": 289.25836, "r": 355.02075, "b": 290.99738, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": " coincide with the image in the", "bbox": {"l": 326.88181, "t": 290.86855999999995, "r": 350.82028, "b": 292.6076, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": " eyepiece. ", "bbox": {"l": 326.88181, "t": 292.47879, "r": 336.2067, "b": 294.2178, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "FOCUSING", "bbox": {"l": 326.88181, "t": 295.69922, "r": 335.3941, "b": 297.43823, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "1.", "bbox": {"l": 326.88181, "t": 297.30942, "r": 328.34314, "b": 299.04846, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "Remove the lens protective cover.", "bbox": {"l": 329.07379, "t": 297.30942, "r": 353.18555, "b": 299.04846, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "2.", "bbox": {"l": 326.88324, "t": 298.91965, "r": 328.35919, "b": 300.65866, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "Place the specimen on the working", "bbox": {"l": 329.0972, "t": 298.91965, "r": 353.45065, "b": 300.65866, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": " stage.", "bbox": {"l": 326.88324, "t": 300.52985, "r": 333.32825, "b": 302.26889000000006, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "3.", "bbox": {"l": 326.88324, "t": 302.14008000000007, "r": 328.31296, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "Focus the specimen with the left eye", "bbox": {"l": 329.02783, "t": 302.14008000000007, "r": 354.76303, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": " first while turning the focus knob until", "bbox": {"l": 326.88324, "t": 303.75027, "r": 355.96307, "b": 305.48932, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": " the image appears clear and sharp.", "bbox": {"l": 326.88324, "t": 305.3605, "r": 354.46594, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "4.", "bbox": {"l": 326.88324, "t": 306.9707, "r": 328.25488, "b": 308.70975, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "Rotate the right eyepiece ring until the", "bbox": {"l": 328.9407, "t": 306.9707, "r": 356.37335, "b": 308.70975, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": " images in each eyepiece coincide and", "bbox": {"l": 326.88324, "t": 308.58093, "r": 355.38867, "b": 310.31995, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": " are sharp and clear.", "bbox": {"l": 326.88324, "t": 310.19113, "r": 343.17249, "b": 311.93018, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "CHANGING THE BULB", "bbox": {"l": 326.88324, "t": 313.41156, "r": 344.13388, "b": 315.15059999999994, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "1.", "bbox": {"l": 326.88324, "t": 315.02178999999995, "r": 328.37418, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "Disconnect the power cord.", "bbox": {"l": 329.11963, "t": 315.02178999999995, "r": 348.50162, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "2.", "bbox": {"l": 326.88324, "t": 316.63199, "r": 328.34061, "b": 318.37103, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "When the bulb is cool, remove the", "bbox": {"l": 329.06931, "t": 316.63199, "r": 353.11588, "b": 318.37103, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": " oblique illuminator cap and remove", "bbox": {"l": 326.88464, "t": 318.2422199999999, "r": 353.79517, "b": 319.9812299999999, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": " the halogen bulb with cap.", "bbox": {"l": 326.88464, "t": 319.85242000000005, "r": 348.02094, "b": 321.59146, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "3.", "bbox": {"l": 326.88464, "t": 321.46265, "r": 328.37512, "b": 323.20166, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "Replace with a new halogen bulb.", "bbox": {"l": 329.12036, "t": 321.46265, "r": 352.96808, "b": 323.20166, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "4.", "bbox": {"l": 326.88608, "t": 323.07285, "r": 328.36884, "b": 324.81189, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "Open the window in the base plate and", "bbox": {"l": 329.1102, "t": 323.07285, "r": 356.5412, "b": 324.81189, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": " replace the halogen lamp or ", "bbox": {"l": 326.88608, "t": 324.68307000000004, "r": 350.13828, "b": 326.42209, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": " fluorescent lamp of transmitted", "bbox": {"l": 326.88608, "t": 326.29327, "r": 351.59677, "b": 328.03232, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": " illuminator.", "bbox": {"l": 326.88608, "t": 327.9035, "r": 336.89197, "b": 329.64252, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "FOCUSING", "bbox": {"l": 358.42023, "t": 263.49492999999995, "r": 366.93256, "b": 265.23395000000005, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "1.", "bbox": {"l": 358.42023, "t": 265.10515999999996, "r": 359.89841, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "Turn the focusing knob away or toward", "bbox": {"l": 360.63751, "t": 265.10515999999996, "r": 387.98407, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": " you until a clear image is viewed.", "bbox": {"l": 358.42023, "t": 266.71533, "r": 384.58948, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "2.", "bbox": {"l": 358.42166, "t": 268.32556, "r": 359.78549, "b": 270.06458, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "If the image is unclear, adjust the", "bbox": {"l": 360.46741, "t": 268.32556, "r": 384.33441, "b": 270.06458, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": " height of the elevator up or down,", "bbox": {"l": 358.4231, "t": 269.93579, "r": 384.61502, "b": 271.6748, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": " then turn the focusing knob again.", "bbox": {"l": 358.4231, "t": 271.54602, "r": 385.38922, "b": 273.28503, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "ZOOM MAGNIFICATION", "bbox": {"l": 358.4231, "t": 274.76642000000004, "r": 377.35046, "b": 276.50543000000005, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "1.", "bbox": {"l": 358.4231, "t": 276.37665000000004, "r": 359.89429, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "Turn the zoom magnification knob to", "bbox": {"l": 360.62988, "t": 276.37665000000004, "r": 386.37589, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": " the desired magnification and field of", "bbox": {"l": 358.4231, "t": 277.98688000000004, "r": 386.78732, "b": 279.72589000000005, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": " view.", "bbox": {"l": 358.4231, "t": 279.59704999999997, "r": 364.16855, "b": 281.33609, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "2.", "bbox": {"l": 358.4231, "t": 281.20728, "r": 359.86777, "b": 282.94632, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "In most situations, it is recommended", "bbox": {"l": 360.59012, "t": 281.20728, "r": 387.31656, "b": 282.94632, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": " that you focus at the lowest ", "bbox": {"l": 358.4231, "t": 282.81750000000005, "r": 381.56656, "b": 284.55652, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": " magnification, then move to a higher", "bbox": {"l": 358.4231, "t": 284.4277, "r": 386.63403, "b": 286.16675, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": " magnification and re-focus as ", "bbox": {"l": 358.42453, "t": 286.03793, "r": 382.77115, "b": 287.77695, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": " necessary.", "bbox": {"l": 358.42453, "t": 287.64813, "r": 367.98694, "b": 289.38718, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "3.", "bbox": {"l": 358.42453, "t": 289.25836, "r": 359.80386, "b": 290.99738, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "If the image is not clear to both eyes", "bbox": {"l": 360.49353, "t": 289.25836, "r": 386.70093, "b": 290.99738, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": " at the same time, the diopter ring may", "bbox": {"l": 358.42453, "t": 290.86855999999995, "r": 388.03534, "b": 292.6076, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": " need adjustment.", "bbox": {"l": 358.42453, "t": 292.47879, "r": 373.13724, "b": 294.2178, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "DIOPTER RING ADJUSTMENT", "bbox": {"l": 358.42453, "t": 295.69922, "r": 381.74539, "b": 297.43823, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "1.", "bbox": {"l": 358.42453, "t": 297.30942, "r": 359.83682, "b": 299.04846, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "To adjust the eyepiece for viewing with", "bbox": {"l": 360.54297, "t": 297.30942, "r": 388.08289, "b": 299.04846, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": " or without eyeglasses and for ", "bbox": {"l": 358.42453, "t": 298.91965, "r": 382.73251, "b": 300.65866, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": " differences in acuity between the right", "bbox": {"l": 358.42453, "t": 300.52985, "r": 387.72266, "b": 302.26889000000006, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": " and left eyes, follow the following", "bbox": {"l": 358.42453, "t": 302.14008000000007, "r": 384.1991, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": " steps:", "bbox": {"l": 358.42453, "t": 303.75027, "r": 364.88672, "b": 305.48932, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "a.", "bbox": {"l": 358.42453, "t": 305.3605, "r": 359.95078, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "Observe an image through the left", "bbox": {"l": 361.47699, "t": 305.3605, "r": 386.65988, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": " eyepiece and bring a specific point", "bbox": {"l": 358.42453, "t": 306.9707, "r": 386.7634, "b": 308.70975, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": " into focus using the focus knob.", "bbox": {"l": 358.42453, "t": 308.58093, "r": 385.41354, "b": 310.31995, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "b.", "bbox": {"l": 358.42453, "t": 310.19113, "r": 359.93304, "b": 311.93018, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "By turning the diopter ring ", "bbox": {"l": 361.44156, "t": 310.19113, "r": 382.56085, "b": 311.93018, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": " adjustment for the left eyepiece,", "bbox": {"l": 358.42596, "t": 311.80136, "r": 385.4559, "b": 313.54037, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": " bring the same point into sharp", "bbox": {"l": 358.42596, "t": 313.41156, "r": 384.56122, "b": 315.15059999999994, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": " focus.", "bbox": {"l": 358.42596, "t": 315.02178999999995, "r": 366.74371, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": " c.Then bring the same point into", "bbox": {"l": 358.42596, "t": 316.63199, "r": 383.93884, "b": 318.37103, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": " focus through the right eyepiece", "bbox": {"l": 358.42596, "t": 318.2422199999999, "r": 385.69241, "b": 319.9812299999999, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": " by turning the right diopter ring.", "bbox": {"l": 358.42596, "t": 319.85242000000005, "r": 385.94861, "b": 321.59146, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": " d.With more than one viewer, each", "bbox": {"l": 358.42596, "t": 321.46265, "r": 385.54236, "b": 323.20166, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": " viewer should note their own", "bbox": {"l": 358.42596, "t": 323.07285, "r": 382.98718, "b": 324.81189, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": " diopter ring position for the left", "bbox": {"l": 358.42596, "t": 324.68307000000004, "r": 385.06448, "b": 326.42209, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": " and right eyepieces, then before", "bbox": {"l": 358.42596, "t": 326.29327, "r": 385.20682, "b": 328.03232, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": " viewing set the diopter ring", "bbox": {"l": 358.42596, "t": 327.9035, "r": 382.21964, "b": 329.64252, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": " adjustments to that setting.", "bbox": {"l": 358.42596, "t": 329.5137, "r": 382.63382, "b": 331.25275, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "CHANGING THE BULB", "bbox": {"l": 358.42596, "t": 332.73412999999994, "r": 375.67661, "b": 334.47317999999996, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "1.", "bbox": {"l": 358.42596, "t": 334.34436, "r": 359.90311, "b": 336.08337, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "Disconnect the power cord from the", "bbox": {"l": 360.64169, "t": 334.34436, "r": 385.75333, "b": 336.08337, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": " electrical outlet.", "bbox": {"l": 358.42596, "t": 335.95456, "r": 372.01416, "b": 337.6936, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "2.", "bbox": {"l": 358.42596, "t": 337.56479, "r": 359.88327, "b": 339.3038, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "When the bulb is cool, remove the", "bbox": {"l": 360.61191, "t": 337.56479, "r": 384.65726, "b": 339.3038, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": " oblique illuminator cap and remove", "bbox": {"l": 358.42596, "t": 339.17499, "r": 385.33649, "b": 340.9140300000001, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": " the halogen bulb with cap.", "bbox": {"l": 358.42596, "t": 340.78522, "r": 379.57224, "b": 342.52423, "coord_origin": "TOPLEFT"}}, {"id": 201, "text": "3.", "bbox": {"l": 358.4274, "t": 342.39542, "r": 359.91788, "b": 344.13446000000005, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": "Replace with a new halogen bulb.", "bbox": {"l": 360.66312, "t": 342.39542, "r": 384.5108, "b": 344.13446000000005, "coord_origin": "TOPLEFT"}}, {"id": 203, "text": "4.", "bbox": {"l": 358.42883, "t": 344.00565000000006, "r": 359.92792, "b": 345.74466, "coord_origin": "TOPLEFT"}}, {"id": 204, "text": "Open the window in the base plate", "bbox": {"l": 360.67746, "t": 344.00565000000006, "r": 385.41235, "b": 345.74466, "coord_origin": "TOPLEFT"}}, {"id": 205, "text": " and replace the halogen lamp or", "bbox": {"l": 358.42883, "t": 345.61584, "r": 383.2782, "b": 347.35489, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": " fluorescent lamp of transmitted", "bbox": {"l": 358.42883, "t": 347.22607, "r": 383.13953, "b": 348.96509, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": " illuminator.", "bbox": {"l": 358.42883, "t": 348.83627, "r": 368.43472, "b": 350.57532, "coord_origin": "TOPLEFT"}}, {"id": 208, "text": "Model AY11230", "bbox": {"l": 326.59567, "t": 261.14185, "r": 339.11377, "b": 262.88091999999995, "coord_origin": "TOPLEFT"}}, {"id": 209, "text": "Model AY11234", "bbox": {"l": 358.48605, "t": 261.14185, "r": 371.00415, "b": 262.88091999999995, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": "14", "bbox": {"l": 455.43533, "t": 351.77038999999996, "r": 457.97827000000007, "b": 353.94415, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "Objectives", "bbox": {"l": 408.24518, "t": 275.52673000000004, "r": 414.4234, "b": 276.96020999999996, "coord_origin": "TOPLEFT"}}, {"id": 212, "text": "Revolving Turret", "bbox": {"l": 409.39554, "t": 268.98235999999997, "r": 419.06677, "b": 270.41583, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "Coarse ", "bbox": {"l": 441.3895, "t": 279.12627999999995, "r": 445.87192, "b": 280.55975, "coord_origin": "TOPLEFT"}}, {"id": 214, "text": "Adjustment", "bbox": {"l": 441.3895, "t": 280.30609, "r": 448.22338999999994, "b": 281.7395900000001, "coord_origin": "TOPLEFT"}}, {"id": 215, "text": "Knob", "bbox": {"l": 441.3895, "t": 281.48593, "r": 444.40371999999996, "b": 282.91939999999994, "coord_origin": "TOPLEFT"}}, {"id": 216, "text": "MODEL AY11236", "bbox": {"l": 398.79288, "t": 254.94646999999998, "r": 428.91568, "b": 258.85931000000005, "coord_origin": "TOPLEFT"}}, {"id": 217, "text": "MICROSCOPE USAGE", "bbox": {"l": 398.32535, "t": 305.04291, "r": 435.93542, "b": 308.95572000000004, "coord_origin": "TOPLEFT"}}, {"id": 218, "text": "BARSKA Model AY11236 is a powerful fixed power compound ", "bbox": {"l": 398.08594, "t": 310.35892, "r": 453.72171, "b": 312.53271, "coord_origin": "TOPLEFT"}}, {"id": 219, "text": "microscope designed for biological studies such as specimen ", "bbox": {"l": 398.08594, "t": 312.50586, "r": 453.09939999999995, "b": 314.67966, "coord_origin": "TOPLEFT"}}, {"id": 220, "text": "examination. It can also be used for examining bacteria and", "bbox": {"l": 398.08594, "t": 314.6528, "r": 456.65246999999994, "b": 316.8266, "coord_origin": "TOPLEFT"}}, {"id": 221, "text": "for general clinical and medical studies and other scientific uses. ", "bbox": {"l": 398.08594, "t": 316.79977, "r": 456.73859000000004, "b": 318.97354, "coord_origin": "TOPLEFT"}}, {"id": 222, "text": "CONSTRUCTION", "bbox": {"l": 398.62399, "t": 320.42941, "r": 427.77472, "b": 324.34222000000005, "coord_origin": "TOPLEFT"}}, {"id": 223, "text": "BARSKA Model AY11236 is a fixed power compound microscope.", "bbox": {"l": 398.08594, "t": 326.46069000000006, "r": 456.02639999999997, "b": 328.63449, "coord_origin": "TOPLEFT"}}, {"id": 224, "text": "It is constructed with two optical paths at the same angle. It is ", "bbox": {"l": 398.08414, "t": 328.6076699999999, "r": 455.42238999999995, "b": 330.7814599999999, "coord_origin": "TOPLEFT"}}, {"id": 225, "text": "equipped with transmitted illumination. By using this instrument, ", "bbox": {"l": 398.08414, "t": 330.75461, "r": 457.39844, "b": 332.92841, "coord_origin": "TOPLEFT"}}, {"id": 226, "text": "the user can observe specimens at magnification from 40x to ", "bbox": {"l": 398.08414, "t": 332.90155, "r": 453.97745, "b": 335.07535000000007, "coord_origin": "TOPLEFT"}}, {"id": 227, "text": "1000x by selecting the desired objective lens. Coarse and fine ", "bbox": {"l": 398.08414, "t": 335.04852, "r": 454.70708999999994, "b": 337.22232, "coord_origin": "TOPLEFT"}}, {"id": 228, "text": "focus adjustments provide accuracy and image detail. The rotating ", "bbox": {"l": 398.08414, "t": 337.19547, "r": 458.90240000000006, "b": 339.36926, "coord_origin": "TOPLEFT"}}, {"id": 229, "text": "head allows the user to position the eyepieces for maximum ", "bbox": {"l": 398.08594, "t": 339.34241, "r": 453.0672, "b": 341.5162, "coord_origin": "TOPLEFT"}}, {"id": 230, "text": "viewing comfort and easy access to all adjustment knobs.", "bbox": {"l": 398.08594, "t": 341.48938, "r": 449.63113, "b": 343.66318, "coord_origin": "TOPLEFT"}}, {"id": 231, "text": "Model AY11236", "bbox": {"l": 422.10626, "t": 301.24191, "r": 434.62433000000004, "b": 302.98096, "coord_origin": "TOPLEFT"}}, {"id": 232, "text": "Fine ", "bbox": {"l": 442.01610999999997, "t": 283.08649, "r": 444.8817399999999, "b": 284.51996, "coord_origin": "TOPLEFT"}}, {"id": 233, "text": "Adjustment", "bbox": {"l": 442.01610999999997, "t": 284.2663, "r": 448.85001, "b": 285.69980000000004, "coord_origin": "TOPLEFT"}}, {"id": 234, "text": "Knob", "bbox": {"l": 442.01610999999997, "t": 285.44611, "r": 445.03033000000005, "b": 286.87961, "coord_origin": "TOPLEFT"}}, {"id": 235, "text": "Stage", "bbox": {"l": 408.00577, "t": 279.12579000000005, "r": 411.42212, "b": 280.5593, "coord_origin": "TOPLEFT"}}, {"id": 236, "text": "Condenser ", "bbox": {"l": 404.07172, "t": 280.9144299999999, "r": 410.77707, "b": 282.3479, "coord_origin": "TOPLEFT"}}, {"id": 237, "text": "Focusing", "bbox": {"l": 404.07172, "t": 282.09424, "r": 409.2157, "b": 283.52774, "coord_origin": "TOPLEFT"}}, {"id": 238, "text": "Knob", "bbox": {"l": 404.07172, "t": 283.27408, "r": 407.08594, "b": 284.7075500000001, "coord_origin": "TOPLEFT"}}, {"id": 239, "text": "Eyepiece", "bbox": {"l": 441.81281, "t": 262.32178, "r": 447.03702, "b": 263.75525000000005, "coord_origin": "TOPLEFT"}}, {"id": 240, "text": "Stand", "bbox": {"l": 437.34607, "t": 271.13025000000005, "r": 440.80496, "b": 272.56281, "coord_origin": "TOPLEFT"}}, {"id": 241, "text": "Lamp ", "bbox": {"l": 409.7164, "t": 284.40027, "r": 413.3768, "b": 285.83282, "coord_origin": "TOPLEFT"}}, {"id": 242, "text": "On/Off", "bbox": {"l": 409.7164, "t": 285.83163, "r": 413.68201, "b": 287.26416, "coord_origin": "TOPLEFT"}}, {"id": 243, "text": "Switch", "bbox": {"l": 409.7164, "t": 287.263, "r": 413.6337, "b": 288.69553, "coord_origin": "TOPLEFT"}}, {"id": 244, "text": "Lamp ", "bbox": {"l": 434.8712499999999, "t": 296.7153, "r": 438.53164999999996, "b": 298.14783, "coord_origin": "TOPLEFT"}}, {"id": 245, "text": "Power", "bbox": {"l": 439.52039, "t": 292.18307000000004, "r": 443.08768, "b": 293.61560000000003, "coord_origin": "TOPLEFT"}}, {"id": 246, "text": "Cord", "bbox": {"l": 439.52039, "t": 293.61444, "r": 442.29575, "b": 295.04697, "coord_origin": "TOPLEFT"}}, {"id": 247, "text": "Rotating Head", "bbox": {"l": 413.55829, "t": 264.66089, "r": 421.94913, "b": 266.09344, "coord_origin": "TOPLEFT"}}, {"id": 248, "text": "Stage Clip", "bbox": {"l": 441.84316999999993, "t": 286.90573, "r": 447.87585000000007, "b": 288.33826, "coord_origin": "TOPLEFT"}}, {"id": 249, "text": "Adjustment", "bbox": {"l": 441.84316999999993, "t": 288.3371, "r": 448.67252, "b": 289.76962000000003, "coord_origin": "TOPLEFT"}}, {"id": 250, "text": "Interpupillary Slide Adjustment", "bbox": {"l": 407.2403, "t": 259.86645999999996, "r": 425.79089, "b": 261.29895, "coord_origin": "TOPLEFT"}}, {"id": 251, "text": "Circling Minimums", "bbox": {"l": 449.10074000000003, "t": 378.66302, "r": 466.08835000000005, "b": 380.78412, "coord_origin": "TOPLEFT"}}, {"id": 252, "text": "7", "bbox": {"l": 449.10074000000003, "t": 383.2203999999999, "r": 449.64444, "b": 385.34148999999996, "coord_origin": "TOPLEFT"}}, {"id": 253, "text": "K H U H Z D V D F K D Q J H W R W K H 7 ( 5 3 6 F U L W H U L D L Q W K D W D \u1087H F W V F L U F O L Q J D U H D G L P H Q V L R Q E \\ H [ S D Q G L Q J W K H D U H D V W R S U R Y L G H ", "bbox": {"l": 450.18811, "t": 383.2203999999999, "r": 550.77124, "b": 385.34148999999996, "coord_origin": "TOPLEFT"}}, {"id": 254, "text": "improved obstacle protection. To indicate that the new criteria had been applied to a given procedure, a ", "bbox": {"l": 449.10074000000003, "t": 385.75732, "r": 536.14716, "b": 387.87842, "coord_origin": "TOPLEFT"}}, {"id": 255, "text": " is placed on ", "bbox": {"l": 538.31085, "t": 385.75732, "r": 549.49921, "b": 387.87842, "coord_origin": "TOPLEFT"}}, {"id": 256, "text": "the circling line of minimums. The new circling tables and explanatory information is located in the Legend of the TPP.", "bbox": {"l": 449.10074000000003, "t": 388.03601, "r": 547.58185, "b": 390.1571, "coord_origin": "TOPLEFT"}}, {"id": 257, "text": "7", "bbox": {"l": 449.10074000000003, "t": 393.2128000000001, "r": 449.6163, "b": 395.33386, "coord_origin": "TOPLEFT"}}, {"id": 258, "text": "K H D S S U R D F K H V X V L Q J V W D Q G D U G F L U F O L Q J D S S U R D F K D U H D V F D Q E H L G H Q W L \u00bf H G E \\ W K H D E V H Q F H R I W K H ", "bbox": {"l": 450.1319, "t": 393.2128000000001, "r": 529.53082, "b": 395.33386, "coord_origin": "TOPLEFT"}}, {"id": 259, "text": " on the circling line of ", "bbox": {"l": 532.05829, "t": 393.2128000000001, "r": 550.42261, "b": 395.33386, "coord_origin": "TOPLEFT"}}, {"id": 260, "text": "minima.", "bbox": {"l": 449.10074000000003, "t": 395.49149, "r": 455.74692, "b": 397.61255, "coord_origin": "TOPLEFT"}}, {"id": 261, "text": "$ S S O \\ 6 W D Q G D U G & L U F O L Q J $ S S U R D F K 0 D Q H X Y H U L Q J 5 D G L X V 7 D E O H ", "bbox": {"l": 449.95525999999995, "t": 415.59549, "r": 496.2829, "b": 417.50446, "coord_origin": "TOPLEFT"}}, {"id": 262, "text": "$ S S O \\ ( [ S D Q G H G & L U F O L Q J $ S S U R D F K 0 D Q H X Y H U L Q J $ L U V S D F H 5 D G L X V ", "bbox": {"l": 501.13077, "t": 409.25543, "r": 551.16101, "b": 411.1644, "coord_origin": "TOPLEFT"}}, {"id": 263, "text": "Table", "bbox": {"l": 501.13077, "t": 411.30624, "r": 505.2477999999999, "b": 413.21521, "coord_origin": "TOPLEFT"}}, {"id": 264, "text": "AIRPORT SKETCH", "bbox": {"l": 449.10074000000003, "t": 420.18802, "r": 469.35599, "b": 422.73331, "coord_origin": "TOPLEFT"}}, {"id": 265, "text": "The airport sketch is a depiction of the airport with emphasis on runway pattern and related ", "bbox": {"l": 449.10074000000003, "t": 425.08908, "r": 525.93616, "b": 427.21017, "coord_origin": "TOPLEFT"}}, {"id": 266, "text": "information, positioned in either the lower left or lower right corner of the chart to aid pi-", "bbox": {"l": 449.10074000000003, "t": 427.3678, "r": 522.0343, "b": 429.48886, "coord_origin": "TOPLEFT"}}, {"id": 267, "text": "lot recognition of the airport from the air and to provide some information to aid on ground ", "bbox": {"l": 449.10074000000003, "t": 429.64648, "r": 524.67151, "b": 431.76755, "coord_origin": "TOPLEFT"}}, {"id": 268, "text": "navigation of the airport. The runways are drawn to scale and oriented to true north. Runway ", "bbox": {"l": 449.10074000000003, "t": 431.92514000000006, "r": 527.172, "b": 434.04623, "coord_origin": "TOPLEFT"}}, {"id": 269, "text": "dimensions (length and width) are shown for all active runways.", "bbox": {"l": 449.10074000000003, "t": 434.20383, "r": 502.39545, "b": 436.32492, "coord_origin": "TOPLEFT"}}, {"id": 270, "text": "Runway(s) are depicted based on what type and construction of the runway.", "bbox": {"l": 449.10074000000003, "t": 438.7611999999999, "r": 512.92676, "b": 440.88228999999995, "coord_origin": "TOPLEFT"}}, {"id": 271, "text": "Hard Surface", "bbox": {"l": 449.95525999999995, "t": 444.07001, "r": 460.02307, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}, {"id": 272, "text": "Other Than ", "bbox": {"l": 464.89963, "t": 444.07001, "r": 473.98819, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}, {"id": 273, "text": "Hard Surface", "bbox": {"l": 464.89963, "t": 446.12085, "r": 474.96744, "b": 448.02979, "coord_origin": "TOPLEFT"}}, {"id": 274, "text": "Metal Surface", "bbox": {"l": 478.91357, "t": 444.07001, "r": 489.45648, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}, {"id": 275, "text": "Closed Runway", "bbox": {"l": 493.06420999999995, "t": 444.07001, "r": 505.03076, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}, {"id": 276, "text": "Under Construction", "bbox": {"l": 509.5809, "t": 444.07001, "r": 524.30237, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}, {"id": 277, "text": "Stopways, ", "bbox": {"l": 449.95525999999995, "t": 454.81207, "r": 458.31406, "b": 456.72104, "coord_origin": "TOPLEFT"}}, {"id": 278, "text": "Taxiways, Park-", "bbox": {"l": 449.95525999999995, "t": 456.86288, "r": 461.92083999999994, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}}, {"id": 279, "text": "ing Areas", "bbox": {"l": 449.95525999999995, "t": 458.91373, "r": 457.08014, "b": 460.82268999999997, "coord_origin": "TOPLEFT"}}, {"id": 280, "text": "Displaced ", "bbox": {"l": 464.89963, "t": 454.81207, "r": 472.87732, "b": 456.72104, "coord_origin": "TOPLEFT"}}, {"id": 281, "text": "Threshold", "bbox": {"l": 464.89963, "t": 456.86288, "r": 472.49792, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}}, {"id": 282, "text": "Closed", "bbox": {"l": 478.91357, "t": 454.81207, "r": 483.61584, "b": 456.72104, "coord_origin": "TOPLEFT"}}, {"id": 283, "text": "Pavement", "bbox": {"l": 478.91357, "t": 456.86288, "r": 486.60754000000003, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}}, {"id": 284, "text": "Water Runway", "bbox": {"l": 493.06420999999995, "t": 454.81207, "r": 504.20648, "b": 456.72104, "coord_origin": "TOPLEFT"}}, {"id": 285, "text": "Taxiways and aprons are shaded grey. Other runway features that may be shown are runway numbers, runway dimen-", "bbox": {"l": 449.10074000000003, "t": 469.32974, "r": 548.59674, "b": 471.45081, "coord_origin": "TOPLEFT"}}, {"id": 286, "text": "sions, runway slope, arresting gear, and displaced threshold.", "bbox": {"l": 449.10074000000003, "t": 471.60843, "r": 500.08181999999994, "b": 473.72949, "coord_origin": "TOPLEFT"}}, {"id": 287, "text": "2", "bbox": {"l": 449.10074000000003, "t": 476.16577, "r": 449.59933000000007, "b": 478.28687, "coord_origin": "TOPLEFT"}}, {"id": 288, "text": "W K H U L Q I R U P D W L R Q F R Q F H U Q L Q J O L J K W L Q J \u00bf Q D O D S S U R D F K E H D U L Q J V D L U S R U W E H D F R Q R E V W D F O H V F R Q W U R O W R Z H U 1 $ 9 $ , ' V K H O L ", "bbox": {"l": 450.09796, "t": 476.16577, "r": 547.82562, "b": 478.28687, "coord_origin": "TOPLEFT"}}, {"id": 289, "text": "-", "bbox": {"l": 547.82623, "t": 476.16577, "r": 548.45862, "b": 478.28687, "coord_origin": "TOPLEFT"}}, {"id": 290, "text": "pads may also be shown.", "bbox": {"l": 449.10074000000003, "t": 478.44446, "r": 470.52609000000007, "b": 480.56555, "coord_origin": "TOPLEFT"}}, {"id": 291, "text": "$ L U S R U W ( O H Y D W L R Q D Q G 7 R X F K G R Z Q = R Q H ( O H Y D W L R Q ", "bbox": {"l": 449.10074000000003, "t": 483.00183, "r": 493.37906000000004, "b": 485.12292, "coord_origin": "TOPLEFT"}}, {"id": 292, "text": "The airport elevation is shown enclosed within a box in the upper left corner of the sketch box and the touchdown zone ", "bbox": {"l": 449.10074000000003, "t": 487.5592, "r": 549.16168, "b": 489.6803, "coord_origin": "TOPLEFT"}}, {"id": 293, "text": "elevation (TDZE) is shown in the upper right corner of the sketch box. The airport elevation is the highest point of an ", "bbox": {"l": 449.10074000000003, "t": 489.83789, "r": 546.90881, "b": 491.95898, "coord_origin": "TOPLEFT"}}, {"id": 294, "text": "D L U S R U W \u00b6 V X V D E O H U X Q Z D \\ V P H D V X U H G L Q I H H W I U R P P H D Q V H D O H Y H O 7 K H 7 ' = ( L V W K H K L J K H V W H O H Y D W L R Q L Q W K H \u00bf U V W I H H W R I ", "bbox": {"l": 449.10074000000003, "t": 492.11658, "r": 551.80023, "b": 494.23767, "coord_origin": "TOPLEFT"}}, {"id": 295, "text": "the landing surface. Circling only approaches will not show a TDZE.", "bbox": {"l": 449.10074000000003, "t": 494.39526, "r": 505.85068000000007, "b": 496.51636, "coord_origin": "TOPLEFT"}}, {"id": 296, "text": "114", "bbox": {"l": 498.80661000000003, "t": 515.9437, "r": 502.08792, "b": 519.01764, "coord_origin": "TOPLEFT"}}, {"id": 297, "text": "FAA Chart Users\u2019 Guide - Terminal Procedures Publication (TPP) - Terms", "bbox": {"l": 444.56319999999994, "t": 422.84869, "r": 446.25998, "b": 471.87128, "coord_origin": "TOPLEFT"}}, {"id": 298, "text": "AGL 2013 Financial Calendar", "bbox": {"l": 329.40536, "t": 379.37537, "r": 355.13138, "b": 382.13336, "coord_origin": "TOPLEFT"}}, {"id": 299, "text": "22", "bbox": {"l": 329.40536, "t": 382.30273, "r": 330.96848, "b": 384.55927, "coord_origin": "TOPLEFT"}}, {"id": 300, "text": "August 2012 ", "bbox": {"l": 331.75003, "t": 382.30273, "r": 341.12875, "b": 384.55927, "coord_origin": "TOPLEFT"}}, {"id": 301, "text": "2012 full year result and fi nal dividend announced", "bbox": {"l": 350.4722, "t": 382.30273, "r": 384.81079, "b": 384.55927, "coord_origin": "TOPLEFT"}}, {"id": 302, "text": "30", "bbox": {"l": 329.40536, "t": 384.84552, "r": 330.97336, "b": 387.10205, "coord_origin": "TOPLEFT"}}, {"id": 303, "text": "August 2012 ", "bbox": {"l": 331.75735, "t": 384.84552, "r": 341.16534, "b": 387.10205, "coord_origin": "TOPLEFT"}}, {"id": 304, "text": "Ex-dividend trading commences", "bbox": {"l": 350.4722, "t": 384.84552, "r": 372.90613, "b": 387.10205, "coord_origin": "TOPLEFT"}}, {"id": 305, "text": "5", "bbox": {"l": 329.40536, "t": 387.38828, "r": 330.20337, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}}, {"id": 306, "text": "September 2012 ", "bbox": {"l": 331.00137, "t": 387.38828, "r": 342.9715, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}}, {"id": 307, "text": "Record date for 2012 fi nal dividend", "bbox": {"l": 350.4722, "t": 387.38828, "r": 374.88693, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}}, {"id": 308, "text": "27", "bbox": {"l": 329.40536, "t": 389.93103, "r": 331.0173, "b": 392.18762, "coord_origin": "TOPLEFT"}}, {"id": 309, "text": "September 2012 ", "bbox": {"l": 331.82327, "t": 389.93103, "r": 343.91284, "b": 392.18762, "coord_origin": "TOPLEFT"}}, {"id": 310, "text": "Final dividend payable", "bbox": {"l": 350.4722, "t": 389.93103, "r": 365.65988, "b": 392.18762, "coord_origin": "TOPLEFT"}}, {"id": 311, "text": "23", "bbox": {"l": 329.40536, "t": 392.47382, "r": 330.98804, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}}, {"id": 312, "text": "October 2012 ", "bbox": {"l": 331.77936, "t": 392.47382, "r": 342.06674, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}}, {"id": 313, "text": "Annual General Meeting", "bbox": {"l": 350.4722, "t": 392.47382, "r": 367.22156, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}}, {"id": 314, "text": "27", "bbox": {"l": 329.40536, "t": 395.0166, "r": 330.99741, "b": 397.27313, "coord_origin": "TOPLEFT"}}, {"id": 315, "text": "February 2013", "bbox": {"l": 331.7934, "t": 395.0166, "r": 342.1416, "b": 397.27313, "coord_origin": "TOPLEFT"}}, {"id": 316, "text": " 1", "bbox": {"l": 342.64841, "t": 395.18298, "r": 342.65811, "b": 396.49857000000003, "coord_origin": "TOPLEFT"}}, {"id": 317, "text": "2013 interim result and interim dividend announced", "bbox": {"l": 350.47177, "t": 395.01474, "r": 386.25897, "b": 397.2713, "coord_origin": "TOPLEFT"}}, {"id": 318, "text": "28", "bbox": {"l": 329.40491, "t": 397.55749999999995, "r": 331.02695, "b": 399.81406, "coord_origin": "TOPLEFT"}}, {"id": 319, "text": "August 2013", "bbox": {"l": 331.83795, "t": 397.55749999999995, "r": 340.75909, "b": 399.81406, "coord_origin": "TOPLEFT"}}, {"id": 320, "text": " 1", "bbox": {"l": 341.26437, "t": 397.7254, "r": 341.27408, "b": 399.04095, "coord_origin": "TOPLEFT"}}, {"id": 321, "text": "2013 full year results and fi nal dividend announced ", "bbox": {"l": 350.47144, "t": 397.55713, "r": 385.93265, "b": 399.81369, "coord_origin": "TOPLEFT"}}, {"id": 322, "text": "1", "bbox": {"l": 329.40536, "t": 400.46155, "r": 329.87708, "b": 401.96588, "coord_origin": "TOPLEFT"}}, {"id": 323, "text": "Indicative dates only, subject to change/Board confi rmation", "bbox": {"l": 330.34882, "t": 400.46155, "r": 358.65204, "b": 401.96588, "coord_origin": "TOPLEFT"}}, {"id": 324, "text": "AGL\u2019s Annual General Meeting will be held at the City Recital Hall, Angel Place, Sydney ", "bbox": {"l": 329.40536, "t": 404.34503, "r": 391.771, "b": 406.60156, "coord_origin": "TOPLEFT"}}, {"id": 325, "text": "commencing at 10.30am on Tuesday 23 October 2012.", "bbox": {"l": 329.40536, "t": 406.37857, "r": 369.65308, "b": 408.63513000000006, "coord_origin": "TOPLEFT"}}, {"id": 326, "text": "Ye s te rd ay", "bbox": {"l": 363.54486, "t": 460.53054999999995, "r": 379.25955, "b": 465.54507, "coord_origin": "TOPLEFT"}}, {"id": 327, "text": "Established in Sydney in 1837, and then ", "bbox": {"l": 363.54486, "t": 466.7157, "r": 391.38229, "b": 468.97223, "coord_origin": "TOPLEFT"}}, {"id": 328, "text": "known as The Australian Gas Light Company, ", "bbox": {"l": 363.54486, "t": 468.74924, "r": 395.01788, "b": 471.00577, "coord_origin": "TOPLEFT"}}, {"id": 329, "text": "the AGL business has an established history ", "bbox": {"l": 363.54486, "t": 470.78281, "r": 394.08322, "b": 473.03934, "coord_origin": "TOPLEFT"}}, {"id": 330, "text": "and reputation for serving the gas and ", "bbox": {"l": 363.54486, "t": 472.81635, "r": 390.60727, "b": 475.07288, "coord_origin": "TOPLEFT"}}, {"id": 331, "text": "electricity needs of Australian households. ", "bbox": {"l": 363.54486, "t": 474.84988, "r": 393.49612, "b": 477.10645, "coord_origin": "TOPLEFT"}}, {"id": 332, "text": "In 1841, when AGL supplied the gas to light ", "bbox": {"l": 363.54486, "t": 476.88345, "r": 394.11481, "b": 479.13998, "coord_origin": "TOPLEFT"}}, {"id": 333, "text": "the fi rst public street lamp, it was reported ", "bbox": {"l": 363.54486, "t": 478.91699, "r": 393.75891, "b": 481.17352, "coord_origin": "TOPLEFT"}}, {"id": 334, "text": "in the Sydney Gazette as a \u201cwonderful ", "bbox": {"l": 363.54486, "t": 480.95053, "r": 390.4975, "b": 483.20709, "coord_origin": "TOPLEFT"}}, {"id": 335, "text": "achievement of scientifi c knowledge, assisted ", "bbox": {"l": 363.54486, "t": 482.9841, "r": 395.70975, "b": 485.24063, "coord_origin": "TOPLEFT"}}, {"id": 336, "text": "by mechanical ingenuity.\u201d Within two years, ", "bbox": {"l": 363.54486, "t": 485.01764, "r": 394.27283, "b": 487.2742, "coord_origin": "TOPLEFT"}}, {"id": 337, "text": "165 gas lamps were lighting the City of Sydney.", "bbox": {"l": 363.54486, "t": 487.05121, "r": 396.65939, "b": 489.30774, "coord_origin": "TOPLEFT"}}, {"id": 338, "text": "Looking back on ", "bbox": {"l": 329.4054, "t": 419.93124, "r": 384.19696, "b": 431.09412, "coord_origin": "TOPLEFT"}}, {"id": 339, "text": "175 years of ", "bbox": {"l": 329.4054, "t": 430.10379, "r": 372.16626, "b": 441.26669, "coord_origin": "TOPLEFT"}}, {"id": 340, "text": "looking forward.", "bbox": {"l": 329.4054, "t": 440.27636999999993, "r": 385.3981, "b": 451.43924, "coord_origin": "TOPLEFT"}}, {"id": 341, "text": "AGL Energy Limited ABN 74 115 061 375", "bbox": {"l": 329.40536, "t": 372.16159, "r": 353.36179, "b": 373.91669, "coord_origin": "TOPLEFT"}}, {"id": 342, "text": "29", "bbox": {"l": 546.20587, "t": 360.90448, "r": 548.23407, "b": 362.82242, "coord_origin": "TOPLEFT"}}, {"id": 343, "text": "signs, signals and road markings", "bbox": {"l": 497.77728, "t": 251.43384000000003, "r": 542.8255, "b": 254.94385, "coord_origin": "TOPLEFT"}}, {"id": 344, "text": "3", "bbox": {"l": 490.30679, "t": 251.47478999999998, "r": 492.09982, "b": 254.98479999999995, "coord_origin": "TOPLEFT"}}, {"id": 345, "text": "In ", "bbox": {"l": 498.15335, "t": 263.88922, "r": 500.05637, "b": 265.92719, "coord_origin": "TOPLEFT"}}, {"id": 346, "text": "chapter 2, you and your vehicle", "bbox": {"l": 500.05637, "t": 263.85717999999997, "r": 524.37036, "b": 265.86310000000003, "coord_origin": "TOPLEFT"}}, {"id": 347, "text": ", you learned about ", "bbox": {"l": 524.37036, "t": 263.88922, "r": 539.89124, "b": 265.92719, "coord_origin": "TOPLEFT"}}, {"id": 348, "text": "some of the controls in your vehicle. This chapter is a handy ", "bbox": {"l": 498.15335, "t": 265.93224999999995, "r": 544.50403, "b": 267.97020999999995, "coord_origin": "TOPLEFT"}}, {"id": 349, "text": "reference section that gives examples of the most common ", "bbox": {"l": 498.15335, "t": 267.97533999999996, "r": 544.01343, "b": 270.01331000000005, "coord_origin": "TOPLEFT"}}, {"id": 350, "text": "signs, signals and road markings that keep traffi c organized ", "bbox": {"l": 498.15335, "t": 270.01831000000004, "r": 544.11987, "b": 272.05634, "coord_origin": "TOPLEFT"}}, {"id": 351, "text": "and flowing smoothly. ", "bbox": {"l": 498.15335, "t": 272.06140000000005, "r": 515.41071, "b": 274.09937, "coord_origin": "TOPLEFT"}}, {"id": 352, "text": "Signs", "bbox": {"l": 498.15335, "t": 277.34619, "r": 505.64642000000003, "b": 280.9357, "coord_origin": "TOPLEFT"}}, {"id": 353, "text": "There are three ways to read signs: by their shape, colour and ", "bbox": {"l": 498.15335, "t": 281.82187, "r": 543.92957, "b": 283.85983, "coord_origin": "TOPLEFT"}}, {"id": 354, "text": "the messages printed on them. Understanding these three ways ", "bbox": {"l": 498.15335, "t": 283.8649, "r": 545.67834, "b": 285.90289, "coord_origin": "TOPLEFT"}}, {"id": 355, "text": "of classifying signs will help you figure out the meaning of signs ", "bbox": {"l": 498.15335, "t": 285.90796, "r": 545.26471, "b": 287.94592, "coord_origin": "TOPLEFT"}}, {"id": 356, "text": "that are new to you. ", "bbox": {"l": 498.15335, "t": 287.95099, "r": 513.31335, "b": 289.98895, "coord_origin": "TOPLEFT"}}, {"id": 357, "text": "Stop", "bbox": {"l": 505.43439, "t": 303.07596, "r": 508.53033000000005, "b": 304.89639, "coord_origin": "TOPLEFT"}}, {"id": 358, "text": "Yield the right-of-way", "bbox": {"l": 527.45502, "t": 303.25354, "r": 541.44678, "b": 305.07397, "coord_origin": "TOPLEFT"}}, {"id": 359, "text": "Shows driving", "bbox": {"l": 501.79385, "t": 321.18973, "r": 510.41632, "b": 323.01016, "coord_origin": "TOPLEFT"}}, {"id": 360, "text": "regulations", "bbox": {"l": 501.79385, "t": 322.87731999999994, "r": 509.04268999999994, "b": 324.69775000000004, "coord_origin": "TOPLEFT"}}, {"id": 361, "text": "Explains lane use", "bbox": {"l": 518.66455, "t": 319.59146, "r": 529.80902, "b": 321.41190000000006, "coord_origin": "TOPLEFT"}}, {"id": 362, "text": "School zone signs ", "bbox": {"l": 534.87561, "t": 318.37616, "r": 546.95142, "b": 320.19659, "coord_origin": "TOPLEFT"}}, {"id": 363, "text": "are fl uorescent ", "bbox": {"l": 534.87561, "t": 320.0637500000001, "r": 545.05762, "b": 321.88419, "coord_origin": "TOPLEFT"}}, {"id": 364, "text": "yellow-green", "bbox": {"l": 534.87561, "t": 321.75134, "r": 543.32263, "b": 323.57178, "coord_origin": "TOPLEFT"}}, {"id": 365, "text": "Tells about motorist ", "bbox": {"l": 499.21862999999996, "t": 338.12772, "r": 512.62451, "b": 339.94815, "coord_origin": "TOPLEFT"}}, {"id": 366, "text": "services", "bbox": {"l": 499.21862999999996, "t": 339.81531000000007, "r": 504.39917, "b": 341.63574, "coord_origin": "TOPLEFT"}}, {"id": 367, "text": "Shows a permitted ", "bbox": {"l": 516.97748, "t": 338.06039, "r": 529.77484, "b": 339.88082999999995, "coord_origin": "TOPLEFT"}}, {"id": 368, "text": "action", "bbox": {"l": 516.97748, "t": 339.74799, "r": 520.96399, "b": 341.56842, "coord_origin": "TOPLEFT"}}, {"id": 369, "text": "Shows an action that ", "bbox": {"l": 534.55847, "t": 337.88281, "r": 548.58453, "b": 339.7032500000001, "coord_origin": "TOPLEFT"}}, {"id": 370, "text": "is not permitted", "bbox": {"l": 534.55847, "t": 339.57040000000006, "r": 545.08862, "b": 341.39084, "coord_origin": "TOPLEFT"}}, {"id": 371, "text": "Warns of hazards ", "bbox": {"l": 483.05853, "t": 356.17416, "r": 494.72577, "b": 357.9946, "coord_origin": "TOPLEFT"}}, {"id": 372, "text": "ahead", "bbox": {"l": 483.05853, "t": 357.86179, "r": 487.07525999999996, "b": 359.68222, "coord_origin": "TOPLEFT"}}, {"id": 373, "text": "Warns of", "bbox": {"l": 499.39645, "t": 356.26297000000005, "r": 504.69171, "b": 358.0834, "coord_origin": "TOPLEFT"}}, {"id": 374, "text": "construction zones", "bbox": {"l": 499.39645, "t": 357.95056, "r": 511.69116, "b": 359.77099999999996, "coord_origin": "TOPLEFT"}}, {"id": 375, "text": "Railway crossing", "bbox": {"l": 516.75891, "t": 356.26297000000005, "r": 527.42938, "b": 358.0834, "coord_origin": "TOPLEFT"}}, {"id": 376, "text": "Shows distance and ", "bbox": {"l": 534.5141, "t": 352.92981, "r": 547.89862, "b": 354.75024, "coord_origin": "TOPLEFT"}}, {"id": 377, "text": "direction", "bbox": {"l": 534.5141, "t": 354.6174, "r": 540.2818, "b": 356.43784, "coord_origin": "TOPLEFT"}}, {"id": 378, "text": "\u2022", "bbox": {"l": 478.37466, "t": 270.14075, "r": 479.14251999999993, "b": 272.17877, "coord_origin": "TOPLEFT"}}, {"id": 379, "text": "Signs", "bbox": {"l": 479.91036999999994, "t": 270.14075, "r": 483.74963, "b": 272.17877, "coord_origin": "TOPLEFT"}}, {"id": 380, "text": "- regulatory signs", "bbox": {"l": 479.97293, "t": 272.84717, "r": 492.31219, "b": 274.34888, "coord_origin": "TOPLEFT"}}, {"id": 381, "text": "- school, ", "bbox": {"l": 479.97293, "t": 275.14513999999997, "r": 486.72598000000005, "b": 276.64679, "coord_origin": "TOPLEFT"}}, {"id": 382, "text": "playground and ", "bbox": {"l": 481.21602999999993, "t": 276.77972, "r": 492.93286000000006, "b": 278.81768999999997, "coord_origin": "TOPLEFT"}}, {"id": 383, "text": "crosswalk signs", "bbox": {"l": 481.21602999999993, "t": 278.82275000000004, "r": 491.82938000000007, "b": 280.86075, "coord_origin": "TOPLEFT"}}, {"id": 384, "text": "- lane use signs", "bbox": {"l": 479.97293, "t": 281.52759, "r": 491.00775000000004, "b": 283.02924, "coord_origin": "TOPLEFT"}}, {"id": 385, "text": "- turn control signs", "bbox": {"l": 479.97293, "t": 283.82556, "r": 493.32748, "b": 285.3272099999999, "coord_origin": "TOPLEFT"}}, {"id": 386, "text": "- parking signs", "bbox": {"l": 479.97293, "t": 286.1235, "r": 490.4915199999999, "b": 287.62518, "coord_origin": "TOPLEFT"}}, {"id": 387, "text": "- reserved lane ", "bbox": {"l": 479.97293, "t": 288.42148, "r": 491.17004000000003, "b": 289.92316, "coord_origin": "TOPLEFT"}}, {"id": 388, "text": "signs", "bbox": {"l": 481.21602999999993, "t": 290.05605999999995, "r": 484.77405000000005, "b": 292.09406, "coord_origin": "TOPLEFT"}}, {"id": 389, "text": "- warning signs", "bbox": {"l": 479.97293, "t": 292.76169000000004, "r": 490.83398, "b": 294.26334, "coord_origin": "TOPLEFT"}}, {"id": 390, "text": "- object markers", "bbox": {"l": 479.97293, "t": 295.05963, "r": 491.62692, "b": 296.56131, "coord_origin": "TOPLEFT"}}, {"id": 391, "text": "- construction ", "bbox": {"l": 479.97293, "t": 297.3576, "r": 490.37341, "b": 298.8592499999999, "coord_origin": "TOPLEFT"}}, {"id": 392, "text": "signs", "bbox": {"l": 481.21602999999993, "t": 298.99219, "r": 484.77405000000005, "b": 301.03015, "coord_origin": "TOPLEFT"}}, {"id": 393, "text": "- information and ", "bbox": {"l": 479.97293, "t": 301.69780999999995, "r": 492.93912, "b": 303.19946, "coord_origin": "TOPLEFT"}}, {"id": 394, "text": "destination signs", "bbox": {"l": 481.21602999999993, "t": 303.3324, "r": 493.00525, "b": 305.37036, "coord_origin": "TOPLEFT"}}, {"id": 395, "text": "- railway signs", "bbox": {"l": 479.97293, "t": 306.0379899999999, "r": 489.99047999999993, "b": 307.53967, "coord_origin": "TOPLEFT"}}, {"id": 396, "text": "\u2022", "bbox": {"l": 478.375, "t": 308.24789, "r": 479.1032400000001, "b": 310.28586, "coord_origin": "TOPLEFT"}}, {"id": 397, "text": "Signals", "bbox": {"l": 479.83151, "t": 308.24789, "r": 484.92925999999994, "b": 310.28586, "coord_origin": "TOPLEFT"}}, {"id": 398, "text": "- lane control ", "bbox": {"l": 479.97293, "t": 310.95358, "r": 490.00091999999995, "b": 312.45526, "coord_origin": "TOPLEFT"}}, {"id": 399, "text": "signals", "bbox": {"l": 481.21602999999993, "t": 312.5881999999999, "r": 485.95331, "b": 314.62616, "coord_origin": "TOPLEFT"}}, {"id": 400, "text": "- traffic lights", "bbox": {"l": 479.97293, "t": 315.29379, "r": 489.29876999999993, "b": 316.79544, "coord_origin": "TOPLEFT"}}, {"id": 401, "text": "\u2022", "bbox": {"l": 478.375, "t": 317.50366, "r": 479.18129999999996, "b": 319.5416599999999, "coord_origin": "TOPLEFT"}}, {"id": 402, "text": "Road markings", "bbox": {"l": 479.98761, "t": 317.50366, "r": 490.46960000000007, "b": 319.5416599999999, "coord_origin": "TOPLEFT"}}, {"id": 403, "text": "- yellow lines", "bbox": {"l": 479.97293, "t": 320.20938, "r": 489.26166000000006, "b": 321.71103, "coord_origin": "TOPLEFT"}}, {"id": 404, "text": "- white lines", "bbox": {"l": 479.97293, "t": 322.50732, "r": 488.59189, "b": 324.009, "coord_origin": "TOPLEFT"}}, {"id": 405, "text": "- reserved lane ", "bbox": {"l": 479.97293, "t": 324.8053, "r": 491.17004000000003, "b": 326.30698, "coord_origin": "TOPLEFT"}}, {"id": 406, "text": "markings", "bbox": {"l": 481.21602999999993, "t": 326.43988, "r": 487.58978, "b": 328.47784, "coord_origin": "TOPLEFT"}}, {"id": 407, "text": "- other markings", "bbox": {"l": 479.97293, "t": 329.14551, "r": 491.75177, "b": 330.64716, "coord_origin": "TOPLEFT"}}, {"id": 408, "text": "in this chapter", "bbox": {"l": 478.15246999999994, "t": 265.07030999999995, "r": 493.75586, "b": 268.06872999999996, "coord_origin": "TOPLEFT"}}], "children": [{"id": 32, "label": "text", "bbox": {"l": 327.86951, "t": 351.78085, "r": 330.41248, "b": 353.95465, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "13", "bbox": {"l": 327.86951, "t": 351.78085, "r": 330.41248, "b": 353.95465, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 327.83005, "t": 331.57268999999997, "r": 351.16092, "b": 333.31171, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "USING THE VERTICAL TUBE -", "bbox": {"l": 327.83005, "t": 331.57268999999997, "r": 351.16092, "b": 333.31171, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 327.83005, "t": 333.18292, "r": 348.30536, "b": 334.92194, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "MODELS AY11230/11234", "bbox": {"l": 327.83005, "t": 333.18292, "r": 348.30536, "b": 334.92194, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 327.83005, "t": 336.40439, "r": 329.05914, "b": 337.92606, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "1.", "bbox": {"l": 327.83005, "t": 336.40439, "r": 329.05914, "b": 337.92606, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 329.67368, "t": 336.40439, "r": 349.95349, "b": 337.92606, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "The vertical tube can be used for", "bbox": {"l": 329.67368, "t": 336.40439, "r": 349.95349, "b": 337.92606, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 329.11752, "t": 337.83588, "r": 353.57977, "b": 339.35751000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "instructional viewing or to photograph", "bbox": {"l": 329.11752, "t": 337.83588, "r": 353.57977, "b": 339.35751000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 327.77121, "t": 339.26736, "r": 352.4306, "b": 340.789, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": " the image with a digital camera or a", "bbox": {"l": 327.77121, "t": 339.26736, "r": 352.4306, "b": 340.789, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 328.15176, "t": 340.69882, "r": 337.91086, "b": 342.22049, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": " micro TV unit", "bbox": {"l": 328.15176, "t": 340.69882, "r": 337.91086, "b": 342.22049, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 327.8313, "t": 342.19043000000005, "r": 329.09155, "b": 343.71207, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "2.", "bbox": {"l": 327.8313, "t": 342.19043000000005, "r": 329.09155, "b": 343.71207, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 329.72168, "t": 342.19043000000005, "r": 354.9267, "b": 343.71207, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "Loosen the retention screw, then rotate ", "bbox": {"l": 329.72168, "t": 342.19043000000005, "r": 354.9267, "b": 343.71207, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 327.8313, "t": 343.62192, "r": 351.66949, "b": 345.14355, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": " the adjustment ring to change the ", "bbox": {"l": 327.8313, "t": 343.62192, "r": 351.66949, "b": 345.14355, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 328.21185, "t": 345.05338, "r": 346.33179, "b": 346.57504, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": " length of the vertical tube.", "bbox": {"l": 328.21185, "t": 345.05338, "r": 346.33179, "b": 346.57504, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 327.83005, "t": 346.84680000000003, "r": 329.12726, "b": 348.36847, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "3.", "bbox": {"l": 327.83005, "t": 346.84680000000003, "r": 329.12726, "b": 348.36847, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 329.77588, "t": 346.84680000000003, "r": 351.18005, "b": 348.36847, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "Make sure that both the images in", "bbox": {"l": 329.77588, "t": 346.84680000000003, "r": 351.18005, "b": 348.36847, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 327.25311, "t": 254.94812000000002, "r": 350.07861, "b": 258.86096, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "OPERATION ", "bbox": {"l": 327.25311, "t": 254.94812000000002, "r": 350.07861, "b": 258.86096, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 350.07861, "t": 254.76782000000003, "r": 351.82651, "b": 258.68066, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "(", "bbox": {"l": 350.07861, "t": 254.76782000000003, "r": 351.82651, "b": 258.68066, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 351.82651, "t": 254.94812000000002, "r": 360.85242, "b": 258.86096, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "cont.", "bbox": {"l": 351.82651, "t": 254.94812000000002, "r": 360.85242, "b": 258.86096, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 360.85242, "t": 254.76782000000003, "r": 362.60028, "b": 258.68066, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": ")", "bbox": {"l": 360.85242, "t": 254.76782000000003, "r": 362.60028, "b": 258.68066, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 326.88037, "t": 263.49492999999995, "r": 345.84351, "b": 265.23395000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "SELECTING OBJECTIVE ", "bbox": {"l": 326.88037, "t": 263.49492999999995, "r": 345.84351, "b": 265.23395000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 326.88037, "t": 265.10515999999996, "r": 340.54153, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "MAGNIFICATION", "bbox": {"l": 326.88037, "t": 265.10515999999996, "r": 340.54153, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 326.88037, "t": 266.71533, "r": 328.31903, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "1.", "bbox": {"l": 326.88037, "t": 266.71533, "r": 328.31903, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 329.03836, "t": 266.71533, "r": 354.21472, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "There are two objectives. The lower", "bbox": {"l": 329.03836, "t": 266.71533, "r": 354.21472, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 326.88037, "t": 268.32556, "r": 355.19193, "b": 270.06458, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": " magnification objective has a greater", "bbox": {"l": 326.88037, "t": 268.32556, "r": 355.19193, "b": 270.06458, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 326.88037, "t": 269.93579, "r": 345.80057, "b": 271.6748, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": " depth of field and view.", "bbox": {"l": 326.88037, "t": 269.93579, "r": 345.80057, "b": 271.6748, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 326.88037, "t": 271.54602, "r": 328.33862, "b": 273.28503, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "2.", "bbox": {"l": 326.88037, "t": 271.54602, "r": 328.33862, "b": 273.28503, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 329.06775, "t": 271.54602, "r": 352.39969, "b": 273.28503, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "In order to observe the specimen", "bbox": {"l": 329.06775, "t": 271.54602, "r": 352.39969, "b": 273.28503, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 326.88037, "t": 273.15619000000004, "r": 352.90042, "b": 274.89526, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": " easily use the lower magnification", "bbox": {"l": 326.88037, "t": 273.15619000000004, "r": 352.90042, "b": 274.89526, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 326.88037, "t": 274.76642000000004, "r": 354.59546, "b": 276.50543000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": " objective first. Then, by rotating the", "bbox": {"l": 326.88037, "t": 274.76642000000004, "r": 354.59546, "b": 276.50543000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 326.88037, "t": 276.37665000000004, "r": 350.81885, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": " case, the magnification can be", "bbox": {"l": 326.88037, "t": 276.37665000000004, "r": 350.81885, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 326.88037, "t": 277.98688000000004, "r": 335.46707, "b": 279.72589000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": " changed.", "bbox": {"l": 326.88037, "t": 277.98688000000004, "r": 335.46707, "b": 279.72589000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 326.88037, "t": 281.20728, "r": 354.57755, "b": 282.94632, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 107, "text": "CHANGING THE INTERPUPILLARY ", "bbox": {"l": 326.88037, "t": 281.20728, "r": 354.57755, "b": 282.94632, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 326.88037, "t": 282.81750000000005, "r": 335.1752, "b": 284.55652, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 108, "text": "DISTANCE", "bbox": {"l": 326.88037, "t": 282.81750000000005, "r": 335.1752, "b": 284.55652, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 326.88037, "t": 284.4277, "r": 328.34784, "b": 286.16675, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 109, "text": "1.", "bbox": {"l": 326.88037, "t": 284.4277, "r": 328.34784, "b": 286.16675, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 329.08157, "t": 284.4277, "r": 354.76245, "b": 286.16675, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 110, "text": "The distance between the observer's", "bbox": {"l": 329.08157, "t": 284.4277, "r": 354.76245, "b": 286.16675, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 326.88037, "t": 286.03793, "r": 354.6499, "b": 287.77695, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 111, "text": " pupils is the interpupillary distance.", "bbox": {"l": 326.88037, "t": 286.03793, "r": 354.6499, "b": 287.77695, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 326.88037, "t": 287.64813, "r": 328.25125, "b": 289.38718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 112, "text": "2.", "bbox": {"l": 326.88037, "t": 287.64813, "r": 328.25125, "b": 289.38718, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 328.93671, "t": 287.64813, "r": 354.29825, "b": 289.38718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 113, "text": "To adjust the interpupillary distance", "bbox": {"l": 328.93671, "t": 287.64813, "r": 354.29825, "b": 289.38718, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 326.88181, "t": 289.25836, "r": 355.02075, "b": 290.99738, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 114, "text": " rotate the prism caps until both eyes", "bbox": {"l": 326.88181, "t": 289.25836, "r": 355.02075, "b": 290.99738, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 326.88181, "t": 290.86855999999995, "r": 350.82028, "b": 292.6076, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 115, "text": " coincide with the image in the", "bbox": {"l": 326.88181, "t": 290.86855999999995, "r": 350.82028, "b": 292.6076, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 326.88181, "t": 292.47879, "r": 336.2067, "b": 294.2178, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 116, "text": " eyepiece. ", "bbox": {"l": 326.88181, "t": 292.47879, "r": 336.2067, "b": 294.2178, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 326.88181, "t": 295.69922, "r": 335.3941, "b": 297.43823, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 117, "text": "FOCUSING", "bbox": {"l": 326.88181, "t": 295.69922, "r": 335.3941, "b": 297.43823, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 326.88181, "t": 297.30942, "r": 328.34314, "b": 299.04846, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 118, "text": "1.", "bbox": {"l": 326.88181, "t": 297.30942, "r": 328.34314, "b": 299.04846, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 329.07379, "t": 297.30942, "r": 353.18555, "b": 299.04846, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 119, "text": "Remove the lens protective cover.", "bbox": {"l": 329.07379, "t": 297.30942, "r": 353.18555, "b": 299.04846, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 326.88324, "t": 298.91965, "r": 328.35919, "b": 300.65866, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 120, "text": "2.", "bbox": {"l": 326.88324, "t": 298.91965, "r": 328.35919, "b": 300.65866, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 329.0972, "t": 298.91965, "r": 353.45065, "b": 300.65866, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 121, "text": "Place the specimen on the working", "bbox": {"l": 329.0972, "t": 298.91965, "r": 353.45065, "b": 300.65866, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 326.88324, "t": 300.52985, "r": 333.32825, "b": 302.26889000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 122, "text": " stage.", "bbox": {"l": 326.88324, "t": 300.52985, "r": 333.32825, "b": 302.26889000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 326.88324, "t": 302.14008000000007, "r": 328.31296, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 123, "text": "3.", "bbox": {"l": 326.88324, "t": 302.14008000000007, "r": 328.31296, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 329.02783, "t": 302.14008000000007, "r": 354.76303, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 124, "text": "Focus the specimen with the left eye", "bbox": {"l": 329.02783, "t": 302.14008000000007, "r": 354.76303, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 326.88324, "t": 303.75027, "r": 355.96307, "b": 305.48932, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 125, "text": " first while turning the focus knob until", "bbox": {"l": 326.88324, "t": 303.75027, "r": 355.96307, "b": 305.48932, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 326.88324, "t": 305.3605, "r": 354.46594, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 126, "text": " the image appears clear and sharp.", "bbox": {"l": 326.88324, "t": 305.3605, "r": 354.46594, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 326.88324, "t": 306.9707, "r": 328.25488, "b": 308.70975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 127, "text": "4.", "bbox": {"l": 326.88324, "t": 306.9707, "r": 328.25488, "b": 308.70975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 328.9407, "t": 306.9707, "r": 356.37335, "b": 308.70975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 128, "text": "Rotate the right eyepiece ring until the", "bbox": {"l": 328.9407, "t": 306.9707, "r": 356.37335, "b": 308.70975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 326.88324, "t": 308.58093, "r": 355.38867, "b": 310.31995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 129, "text": " images in each eyepiece coincide and", "bbox": {"l": 326.88324, "t": 308.58093, "r": 355.38867, "b": 310.31995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 326.88324, "t": 310.19113, "r": 343.17249, "b": 311.93018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 130, "text": " are sharp and clear.", "bbox": {"l": 326.88324, "t": 310.19113, "r": 343.17249, "b": 311.93018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 326.88324, "t": 313.41156, "r": 344.13388, "b": 315.15059999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 131, "text": "CHANGING THE BULB", "bbox": {"l": 326.88324, "t": 313.41156, "r": 344.13388, "b": 315.15059999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 326.88324, "t": 315.02178999999995, "r": 328.37418, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 132, "text": "1.", "bbox": {"l": 326.88324, "t": 315.02178999999995, "r": 328.37418, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 329.11963, "t": 315.02178999999995, "r": 348.50162, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 133, "text": "Disconnect the power cord.", "bbox": {"l": 329.11963, "t": 315.02178999999995, "r": 348.50162, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 326.88324, "t": 316.63199, "r": 328.34061, "b": 318.37103, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 134, "text": "2.", "bbox": {"l": 326.88324, "t": 316.63199, "r": 328.34061, "b": 318.37103, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 329.06931, "t": 316.63199, "r": 353.11588, "b": 318.37103, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 135, "text": "When the bulb is cool, remove the", "bbox": {"l": 329.06931, "t": 316.63199, "r": 353.11588, "b": 318.37103, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 326.88464, "t": 318.2422199999999, "r": 353.79517, "b": 319.9812299999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 136, "text": " oblique illuminator cap and remove", "bbox": {"l": 326.88464, "t": 318.2422199999999, "r": 353.79517, "b": 319.9812299999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 326.88464, "t": 319.85242000000005, "r": 348.02094, "b": 321.59146, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 137, "text": " the halogen bulb with cap.", "bbox": {"l": 326.88464, "t": 319.85242000000005, "r": 348.02094, "b": 321.59146, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 326.88464, "t": 321.46265, "r": 328.37512, "b": 323.20166, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 138, "text": "3.", "bbox": {"l": 326.88464, "t": 321.46265, "r": 328.37512, "b": 323.20166, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 329.12036, "t": 321.46265, "r": 352.96808, "b": 323.20166, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 139, "text": "Replace with a new halogen bulb.", "bbox": {"l": 329.12036, "t": 321.46265, "r": 352.96808, "b": 323.20166, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 326.88608, "t": 323.07285, "r": 328.36884, "b": 324.81189, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 140, "text": "4.", "bbox": {"l": 326.88608, "t": 323.07285, "r": 328.36884, "b": 324.81189, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 329.1102, "t": 323.07285, "r": 356.5412, "b": 324.81189, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 141, "text": "Open the window in the base plate and", "bbox": {"l": 329.1102, "t": 323.07285, "r": 356.5412, "b": 324.81189, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 326.88608, "t": 324.68307000000004, "r": 350.13828, "b": 326.42209, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 142, "text": " replace the halogen lamp or ", "bbox": {"l": 326.88608, "t": 324.68307000000004, "r": 350.13828, "b": 326.42209, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 326.88608, "t": 326.29327, "r": 351.59677, "b": 328.03232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 143, "text": " fluorescent lamp of transmitted", "bbox": {"l": 326.88608, "t": 326.29327, "r": 351.59677, "b": 328.03232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 326.88608, "t": 327.9035, "r": 336.89197, "b": 329.64252, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 144, "text": " illuminator.", "bbox": {"l": 326.88608, "t": 327.9035, "r": 336.89197, "b": 329.64252, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 358.42023, "t": 263.49492999999995, "r": 366.93256, "b": 265.23395000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 145, "text": "FOCUSING", "bbox": {"l": 358.42023, "t": 263.49492999999995, "r": 366.93256, "b": 265.23395000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 358.42023, "t": 265.10515999999996, "r": 359.89841, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 146, "text": "1.", "bbox": {"l": 358.42023, "t": 265.10515999999996, "r": 359.89841, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 360.63751, "t": 265.10515999999996, "r": 387.98407, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 147, "text": "Turn the focusing knob away or toward", "bbox": {"l": 360.63751, "t": 265.10515999999996, "r": 387.98407, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 358.42023, "t": 266.71533, "r": 384.58948, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 148, "text": " you until a clear image is viewed.", "bbox": {"l": 358.42023, "t": 266.71533, "r": 384.58948, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 358.42166, "t": 268.32556, "r": 359.78549, "b": 270.06458, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 149, "text": "2.", "bbox": {"l": 358.42166, "t": 268.32556, "r": 359.78549, "b": 270.06458, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 360.46741, "t": 268.32556, "r": 384.33441, "b": 270.06458, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 150, "text": "If the image is unclear, adjust the", "bbox": {"l": 360.46741, "t": 268.32556, "r": 384.33441, "b": 270.06458, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 358.4231, "t": 269.93579, "r": 384.61502, "b": 271.6748, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 151, "text": " height of the elevator up or down,", "bbox": {"l": 358.4231, "t": 269.93579, "r": 384.61502, "b": 271.6748, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 358.4231, "t": 271.54602, "r": 385.38922, "b": 273.28503, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 152, "text": " then turn the focusing knob again.", "bbox": {"l": 358.4231, "t": 271.54602, "r": 385.38922, "b": 273.28503, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 358.4231, "t": 274.76642000000004, "r": 377.35046, "b": 276.50543000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 153, "text": "ZOOM MAGNIFICATION", "bbox": {"l": 358.4231, "t": 274.76642000000004, "r": 377.35046, "b": 276.50543000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 358.4231, "t": 276.37665000000004, "r": 359.89429, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 154, "text": "1.", "bbox": {"l": 358.4231, "t": 276.37665000000004, "r": 359.89429, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 360.62988, "t": 276.37665000000004, "r": 386.37589, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 155, "text": "Turn the zoom magnification knob to", "bbox": {"l": 360.62988, "t": 276.37665000000004, "r": 386.37589, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 358.4231, "t": 277.98688000000004, "r": 386.78732, "b": 279.72589000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 156, "text": " the desired magnification and field of", "bbox": {"l": 358.4231, "t": 277.98688000000004, "r": 386.78732, "b": 279.72589000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 358.4231, "t": 279.59704999999997, "r": 364.16855, "b": 281.33609, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 157, "text": " view.", "bbox": {"l": 358.4231, "t": 279.59704999999997, "r": 364.16855, "b": 281.33609, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 358.4231, "t": 281.20728, "r": 359.86777, "b": 282.94632, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 158, "text": "2.", "bbox": {"l": 358.4231, "t": 281.20728, "r": 359.86777, "b": 282.94632, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 114, "label": "text", "bbox": {"l": 360.59012, "t": 281.20728, "r": 387.31656, "b": 282.94632, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 159, "text": "In most situations, it is recommended", "bbox": {"l": 360.59012, "t": 281.20728, "r": 387.31656, "b": 282.94632, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 115, "label": "text", "bbox": {"l": 358.4231, "t": 282.81750000000005, "r": 381.56656, "b": 284.55652, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 160, "text": " that you focus at the lowest ", "bbox": {"l": 358.4231, "t": 282.81750000000005, "r": 381.56656, "b": 284.55652, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 116, "label": "text", "bbox": {"l": 358.4231, "t": 284.4277, "r": 386.63403, "b": 286.16675, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 161, "text": " magnification, then move to a higher", "bbox": {"l": 358.4231, "t": 284.4277, "r": 386.63403, "b": 286.16675, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 117, "label": "text", "bbox": {"l": 358.42453, "t": 286.03793, "r": 382.77115, "b": 287.77695, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 162, "text": " magnification and re-focus as ", "bbox": {"l": 358.42453, "t": 286.03793, "r": 382.77115, "b": 287.77695, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 118, "label": "text", "bbox": {"l": 358.42453, "t": 287.64813, "r": 367.98694, "b": 289.38718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 163, "text": " necessary.", "bbox": {"l": 358.42453, "t": 287.64813, "r": 367.98694, "b": 289.38718, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 119, "label": "text", "bbox": {"l": 358.42453, "t": 289.25836, "r": 359.80386, "b": 290.99738, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 164, "text": "3.", "bbox": {"l": 358.42453, "t": 289.25836, "r": 359.80386, "b": 290.99738, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 120, "label": "text", "bbox": {"l": 360.49353, "t": 289.25836, "r": 386.70093, "b": 290.99738, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 165, "text": "If the image is not clear to both eyes", "bbox": {"l": 360.49353, "t": 289.25836, "r": 386.70093, "b": 290.99738, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 121, "label": "text", "bbox": {"l": 358.42453, "t": 290.86855999999995, "r": 388.03534, "b": 292.6076, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 166, "text": " at the same time, the diopter ring may", "bbox": {"l": 358.42453, "t": 290.86855999999995, "r": 388.03534, "b": 292.6076, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 122, "label": "text", "bbox": {"l": 358.42453, "t": 292.47879, "r": 373.13724, "b": 294.2178, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 167, "text": " need adjustment.", "bbox": {"l": 358.42453, "t": 292.47879, "r": 373.13724, "b": 294.2178, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 123, "label": "text", "bbox": {"l": 358.42453, "t": 295.69922, "r": 381.74539, "b": 297.43823, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 168, "text": "DIOPTER RING ADJUSTMENT", "bbox": {"l": 358.42453, "t": 295.69922, "r": 381.74539, "b": 297.43823, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 124, "label": "text", "bbox": {"l": 358.42453, "t": 297.30942, "r": 359.83682, "b": 299.04846, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 169, "text": "1.", "bbox": {"l": 358.42453, "t": 297.30942, "r": 359.83682, "b": 299.04846, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 125, "label": "text", "bbox": {"l": 360.54297, "t": 297.30942, "r": 388.08289, "b": 299.04846, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 170, "text": "To adjust the eyepiece for viewing with", "bbox": {"l": 360.54297, "t": 297.30942, "r": 388.08289, "b": 299.04846, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 126, "label": "text", "bbox": {"l": 358.42453, "t": 298.91965, "r": 382.73251, "b": 300.65866, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 171, "text": " or without eyeglasses and for ", "bbox": {"l": 358.42453, "t": 298.91965, "r": 382.73251, "b": 300.65866, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 127, "label": "text", "bbox": {"l": 358.42453, "t": 300.52985, "r": 387.72266, "b": 302.26889000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 172, "text": " differences in acuity between the right", "bbox": {"l": 358.42453, "t": 300.52985, "r": 387.72266, "b": 302.26889000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 128, "label": "text", "bbox": {"l": 358.42453, "t": 302.14008000000007, "r": 384.1991, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 173, "text": " and left eyes, follow the following", "bbox": {"l": 358.42453, "t": 302.14008000000007, "r": 384.1991, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 129, "label": "text", "bbox": {"l": 358.42453, "t": 303.75027, "r": 364.88672, "b": 305.48932, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 174, "text": " steps:", "bbox": {"l": 358.42453, "t": 303.75027, "r": 364.88672, "b": 305.48932, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 130, "label": "text", "bbox": {"l": 358.42453, "t": 305.3605, "r": 359.95078, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 175, "text": "a.", "bbox": {"l": 358.42453, "t": 305.3605, "r": 359.95078, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 131, "label": "text", "bbox": {"l": 361.47699, "t": 305.3605, "r": 386.65988, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 176, "text": "Observe an image through the left", "bbox": {"l": 361.47699, "t": 305.3605, "r": 386.65988, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 132, "label": "text", "bbox": {"l": 358.42453, "t": 306.9707, "r": 386.7634, "b": 308.70975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 177, "text": " eyepiece and bring a specific point", "bbox": {"l": 358.42453, "t": 306.9707, "r": 386.7634, "b": 308.70975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 133, "label": "text", "bbox": {"l": 358.42453, "t": 308.58093, "r": 385.41354, "b": 310.31995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 178, "text": " into focus using the focus knob.", "bbox": {"l": 358.42453, "t": 308.58093, "r": 385.41354, "b": 310.31995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 134, "label": "text", "bbox": {"l": 358.42453, "t": 310.19113, "r": 359.93304, "b": 311.93018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 179, "text": "b.", "bbox": {"l": 358.42453, "t": 310.19113, "r": 359.93304, "b": 311.93018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 135, "label": "text", "bbox": {"l": 361.44156, "t": 310.19113, "r": 382.56085, "b": 311.93018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 180, "text": "By turning the diopter ring ", "bbox": {"l": 361.44156, "t": 310.19113, "r": 382.56085, "b": 311.93018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 136, "label": "text", "bbox": {"l": 358.42596, "t": 311.80136, "r": 385.4559, "b": 313.54037, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 181, "text": " adjustment for the left eyepiece,", "bbox": {"l": 358.42596, "t": 311.80136, "r": 385.4559, "b": 313.54037, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 137, "label": "text", "bbox": {"l": 358.42596, "t": 313.41156, "r": 384.56122, "b": 315.15059999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 182, "text": " bring the same point into sharp", "bbox": {"l": 358.42596, "t": 313.41156, "r": 384.56122, "b": 315.15059999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 138, "label": "text", "bbox": {"l": 358.42596, "t": 315.02178999999995, "r": 366.74371, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 183, "text": " focus.", "bbox": {"l": 358.42596, "t": 315.02178999999995, "r": 366.74371, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 139, "label": "text", "bbox": {"l": 358.42596, "t": 316.63199, "r": 383.93884, "b": 318.37103, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 184, "text": " c.Then bring the same point into", "bbox": {"l": 358.42596, "t": 316.63199, "r": 383.93884, "b": 318.37103, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 140, "label": "text", "bbox": {"l": 358.42596, "t": 318.2422199999999, "r": 385.69241, "b": 319.9812299999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 185, "text": " focus through the right eyepiece", "bbox": {"l": 358.42596, "t": 318.2422199999999, "r": 385.69241, "b": 319.9812299999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 141, "label": "text", "bbox": {"l": 358.42596, "t": 319.85242000000005, "r": 385.94861, "b": 321.59146, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 186, "text": " by turning the right diopter ring.", "bbox": {"l": 358.42596, "t": 319.85242000000005, "r": 385.94861, "b": 321.59146, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 142, "label": "text", "bbox": {"l": 358.42596, "t": 321.46265, "r": 385.54236, "b": 323.20166, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 187, "text": " d.With more than one viewer, each", "bbox": {"l": 358.42596, "t": 321.46265, "r": 385.54236, "b": 323.20166, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 143, "label": "text", "bbox": {"l": 358.42596, "t": 323.07285, "r": 382.98718, "b": 324.81189, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 188, "text": " viewer should note their own", "bbox": {"l": 358.42596, "t": 323.07285, "r": 382.98718, "b": 324.81189, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 144, "label": "text", "bbox": {"l": 358.42596, "t": 324.68307000000004, "r": 385.06448, "b": 326.42209, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 189, "text": " diopter ring position for the left", "bbox": {"l": 358.42596, "t": 324.68307000000004, "r": 385.06448, "b": 326.42209, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 145, "label": "text", "bbox": {"l": 358.42596, "t": 326.29327, "r": 385.20682, "b": 328.03232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 190, "text": " and right eyepieces, then before", "bbox": {"l": 358.42596, "t": 326.29327, "r": 385.20682, "b": 328.03232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 146, "label": "text", "bbox": {"l": 358.42596, "t": 327.9035, "r": 382.21964, "b": 329.64252, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 191, "text": " viewing set the diopter ring", "bbox": {"l": 358.42596, "t": 327.9035, "r": 382.21964, "b": 329.64252, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 147, "label": "text", "bbox": {"l": 358.42596, "t": 329.5137, "r": 382.63382, "b": 331.25275, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 192, "text": " adjustments to that setting.", "bbox": {"l": 358.42596, "t": 329.5137, "r": 382.63382, "b": 331.25275, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 148, "label": "text", "bbox": {"l": 358.42596, "t": 332.73412999999994, "r": 375.67661, "b": 334.47317999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 193, "text": "CHANGING THE BULB", "bbox": {"l": 358.42596, "t": 332.73412999999994, "r": 375.67661, "b": 334.47317999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 149, "label": "text", "bbox": {"l": 358.42596, "t": 334.34436, "r": 359.90311, "b": 336.08337, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 194, "text": "1.", "bbox": {"l": 358.42596, "t": 334.34436, "r": 359.90311, "b": 336.08337, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 150, "label": "text", "bbox": {"l": 360.64169, "t": 334.34436, "r": 385.75333, "b": 336.08337, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 195, "text": "Disconnect the power cord from the", "bbox": {"l": 360.64169, "t": 334.34436, "r": 385.75333, "b": 336.08337, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 151, "label": "text", "bbox": {"l": 358.42596, "t": 335.95456, "r": 372.01416, "b": 337.6936, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 196, "text": " electrical outlet.", "bbox": {"l": 358.42596, "t": 335.95456, "r": 372.01416, "b": 337.6936, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 152, "label": "text", "bbox": {"l": 358.42596, "t": 337.56479, "r": 359.88327, "b": 339.3038, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 197, "text": "2.", "bbox": {"l": 358.42596, "t": 337.56479, "r": 359.88327, "b": 339.3038, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 153, "label": "text", "bbox": {"l": 360.61191, "t": 337.56479, "r": 384.65726, "b": 339.3038, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 198, "text": "When the bulb is cool, remove the", "bbox": {"l": 360.61191, "t": 337.56479, "r": 384.65726, "b": 339.3038, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 154, "label": "text", "bbox": {"l": 358.42596, "t": 339.17499, "r": 385.33649, "b": 340.9140300000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 199, "text": " oblique illuminator cap and remove", "bbox": {"l": 358.42596, "t": 339.17499, "r": 385.33649, "b": 340.9140300000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 155, "label": "text", "bbox": {"l": 358.42596, "t": 340.78522, "r": 379.57224, "b": 342.52423, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 200, "text": " the halogen bulb with cap.", "bbox": {"l": 358.42596, "t": 340.78522, "r": 379.57224, "b": 342.52423, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 156, "label": "text", "bbox": {"l": 358.4274, "t": 342.39542, "r": 359.91788, "b": 344.13446000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 201, "text": "3.", "bbox": {"l": 358.4274, "t": 342.39542, "r": 359.91788, "b": 344.13446000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 157, "label": "text", "bbox": {"l": 360.66312, "t": 342.39542, "r": 384.5108, "b": 344.13446000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 202, "text": "Replace with a new halogen bulb.", "bbox": {"l": 360.66312, "t": 342.39542, "r": 384.5108, "b": 344.13446000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 158, "label": "text", "bbox": {"l": 358.42883, "t": 344.00565000000006, "r": 359.92792, "b": 345.74466, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 203, "text": "4.", "bbox": {"l": 358.42883, "t": 344.00565000000006, "r": 359.92792, "b": 345.74466, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 159, "label": "text", "bbox": {"l": 360.67746, "t": 344.00565000000006, "r": 385.41235, "b": 345.74466, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 204, "text": "Open the window in the base plate", "bbox": {"l": 360.67746, "t": 344.00565000000006, "r": 385.41235, "b": 345.74466, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 160, "label": "text", "bbox": {"l": 358.42883, "t": 345.61584, "r": 383.2782, "b": 347.35489, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 205, "text": " and replace the halogen lamp or", "bbox": {"l": 358.42883, "t": 345.61584, "r": 383.2782, "b": 347.35489, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 161, "label": "text", "bbox": {"l": 358.42883, "t": 347.22607, "r": 383.13953, "b": 348.96509, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 206, "text": " fluorescent lamp of transmitted", "bbox": {"l": 358.42883, "t": 347.22607, "r": 383.13953, "b": 348.96509, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 162, "label": "text", "bbox": {"l": 358.42883, "t": 348.83627, "r": 368.43472, "b": 350.57532, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 207, "text": " illuminator.", "bbox": {"l": 358.42883, "t": 348.83627, "r": 368.43472, "b": 350.57532, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 163, "label": "text", "bbox": {"l": 326.59567, "t": 261.14185, "r": 339.11377, "b": 262.88091999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 208, "text": "Model AY11230", "bbox": {"l": 326.59567, "t": 261.14185, "r": 339.11377, "b": 262.88091999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 164, "label": "text", "bbox": {"l": 358.48605, "t": 261.14185, "r": 371.00415, "b": 262.88091999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 209, "text": "Model AY11234", "bbox": {"l": 358.48605, "t": 261.14185, "r": 371.00415, "b": 262.88091999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 165, "label": "text", "bbox": {"l": 455.43533, "t": 351.77038999999996, "r": 457.97827000000007, "b": 353.94415, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 210, "text": "14", "bbox": {"l": 455.43533, "t": 351.77038999999996, "r": 457.97827000000007, "b": 353.94415, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 166, "label": "text", "bbox": {"l": 408.24518, "t": 275.52673000000004, "r": 414.4234, "b": 276.96020999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 211, "text": "Objectives", "bbox": {"l": 408.24518, "t": 275.52673000000004, "r": 414.4234, "b": 276.96020999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 167, "label": "text", "bbox": {"l": 409.39554, "t": 268.98235999999997, "r": 419.06677, "b": 270.41583, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 212, "text": "Revolving Turret", "bbox": {"l": 409.39554, "t": 268.98235999999997, "r": 419.06677, "b": 270.41583, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 168, "label": "text", "bbox": {"l": 441.3895, "t": 279.12627999999995, "r": 445.87192, "b": 280.55975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 213, "text": "Coarse ", "bbox": {"l": 441.3895, "t": 279.12627999999995, "r": 445.87192, "b": 280.55975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 169, "label": "text", "bbox": {"l": 441.3895, "t": 280.30609, "r": 448.22338999999994, "b": 281.7395900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 214, "text": "Adjustment", "bbox": {"l": 441.3895, "t": 280.30609, "r": 448.22338999999994, "b": 281.7395900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 170, "label": "text", "bbox": {"l": 441.3895, "t": 281.48593, "r": 444.40371999999996, "b": 282.91939999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 215, "text": "Knob", "bbox": {"l": 441.3895, "t": 281.48593, "r": 444.40371999999996, "b": 282.91939999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 171, "label": "text", "bbox": {"l": 398.79288, "t": 254.94646999999998, "r": 428.91568, "b": 258.85931000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 216, "text": "MODEL AY11236", "bbox": {"l": 398.79288, "t": 254.94646999999998, "r": 428.91568, "b": 258.85931000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 172, "label": "text", "bbox": {"l": 398.32535, "t": 305.04291, "r": 435.93542, "b": 308.95572000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 217, "text": "MICROSCOPE USAGE", "bbox": {"l": 398.32535, "t": 305.04291, "r": 435.93542, "b": 308.95572000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 173, "label": "text", "bbox": {"l": 398.08594, "t": 310.35892, "r": 453.72171, "b": 312.53271, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 218, "text": "BARSKA Model AY11236 is a powerful fixed power compound ", "bbox": {"l": 398.08594, "t": 310.35892, "r": 453.72171, "b": 312.53271, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 174, "label": "text", "bbox": {"l": 398.08594, "t": 312.50586, "r": 453.09939999999995, "b": 314.67966, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 219, "text": "microscope designed for biological studies such as specimen ", "bbox": {"l": 398.08594, "t": 312.50586, "r": 453.09939999999995, "b": 314.67966, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 175, "label": "text", "bbox": {"l": 398.08594, "t": 314.6528, "r": 456.65246999999994, "b": 316.8266, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 220, "text": "examination. It can also be used for examining bacteria and", "bbox": {"l": 398.08594, "t": 314.6528, "r": 456.65246999999994, "b": 316.8266, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 176, "label": "text", "bbox": {"l": 398.08594, "t": 316.79977, "r": 456.73859000000004, "b": 318.97354, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 221, "text": "for general clinical and medical studies and other scientific uses. ", "bbox": {"l": 398.08594, "t": 316.79977, "r": 456.73859000000004, "b": 318.97354, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 177, "label": "text", "bbox": {"l": 398.62399, "t": 320.42941, "r": 427.77472, "b": 324.34222000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 222, "text": "CONSTRUCTION", "bbox": {"l": 398.62399, "t": 320.42941, "r": 427.77472, "b": 324.34222000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 178, "label": "text", "bbox": {"l": 398.08594, "t": 326.46069000000006, "r": 456.02639999999997, "b": 328.63449, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 223, "text": "BARSKA Model AY11236 is a fixed power compound microscope.", "bbox": {"l": 398.08594, "t": 326.46069000000006, "r": 456.02639999999997, "b": 328.63449, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 179, "label": "text", "bbox": {"l": 398.08414, "t": 328.6076699999999, "r": 455.42238999999995, "b": 330.7814599999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 224, "text": "It is constructed with two optical paths at the same angle. It is ", "bbox": {"l": 398.08414, "t": 328.6076699999999, "r": 455.42238999999995, "b": 330.7814599999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 180, "label": "text", "bbox": {"l": 398.08414, "t": 330.75461, "r": 457.39844, "b": 332.92841, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 225, "text": "equipped with transmitted illumination. By using this instrument, ", "bbox": {"l": 398.08414, "t": 330.75461, "r": 457.39844, "b": 332.92841, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 181, "label": "text", "bbox": {"l": 398.08414, "t": 332.90155, "r": 453.97745, "b": 335.07535000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 226, "text": "the user can observe specimens at magnification from 40x to ", "bbox": {"l": 398.08414, "t": 332.90155, "r": 453.97745, "b": 335.07535000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 182, "label": "text", "bbox": {"l": 398.08414, "t": 335.04852, "r": 454.70708999999994, "b": 337.22232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 227, "text": "1000x by selecting the desired objective lens. Coarse and fine ", "bbox": {"l": 398.08414, "t": 335.04852, "r": 454.70708999999994, "b": 337.22232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 183, "label": "text", "bbox": {"l": 398.08414, "t": 337.19547, "r": 458.90240000000006, "b": 339.36926, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 228, "text": "focus adjustments provide accuracy and image detail. The rotating ", "bbox": {"l": 398.08414, "t": 337.19547, "r": 458.90240000000006, "b": 339.36926, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 184, "label": "text", "bbox": {"l": 398.08594, "t": 339.34241, "r": 453.0672, "b": 341.5162, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 229, "text": "head allows the user to position the eyepieces for maximum ", "bbox": {"l": 398.08594, "t": 339.34241, "r": 453.0672, "b": 341.5162, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 185, "label": "text", "bbox": {"l": 398.08594, "t": 341.48938, "r": 449.63113, "b": 343.66318, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 230, "text": "viewing comfort and easy access to all adjustment knobs.", "bbox": {"l": 398.08594, "t": 341.48938, "r": 449.63113, "b": 343.66318, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 186, "label": "text", "bbox": {"l": 422.10626, "t": 301.24191, "r": 434.62433000000004, "b": 302.98096, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 231, "text": "Model AY11236", "bbox": {"l": 422.10626, "t": 301.24191, "r": 434.62433000000004, "b": 302.98096, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 187, "label": "text", "bbox": {"l": 442.01610999999997, "t": 283.08649, "r": 444.8817399999999, "b": 284.51996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 232, "text": "Fine ", "bbox": {"l": 442.01610999999997, "t": 283.08649, "r": 444.8817399999999, "b": 284.51996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 188, "label": "text", "bbox": {"l": 442.01610999999997, "t": 284.2663, "r": 448.85001, "b": 285.69980000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 233, "text": "Adjustment", "bbox": {"l": 442.01610999999997, "t": 284.2663, "r": 448.85001, "b": 285.69980000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 189, "label": "text", "bbox": {"l": 442.01610999999997, "t": 285.44611, "r": 445.03033000000005, "b": 286.87961, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 234, "text": "Knob", "bbox": {"l": 442.01610999999997, "t": 285.44611, "r": 445.03033000000005, "b": 286.87961, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 190, "label": "text", "bbox": {"l": 408.00577, "t": 279.12579000000005, "r": 411.42212, "b": 280.5593, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 235, "text": "Stage", "bbox": {"l": 408.00577, "t": 279.12579000000005, "r": 411.42212, "b": 280.5593, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 191, "label": "text", "bbox": {"l": 404.07172, "t": 280.9144299999999, "r": 410.77707, "b": 282.3479, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 236, "text": "Condenser ", "bbox": {"l": 404.07172, "t": 280.9144299999999, "r": 410.77707, "b": 282.3479, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 192, "label": "text", "bbox": {"l": 404.07172, "t": 282.09424, "r": 409.2157, "b": 283.52774, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 237, "text": "Focusing", "bbox": {"l": 404.07172, "t": 282.09424, "r": 409.2157, "b": 283.52774, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 193, "label": "text", "bbox": {"l": 404.07172, "t": 283.27408, "r": 407.08594, "b": 284.7075500000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 238, "text": "Knob", "bbox": {"l": 404.07172, "t": 283.27408, "r": 407.08594, "b": 284.7075500000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 194, "label": "text", "bbox": {"l": 441.81281, "t": 262.32178, "r": 447.03702, "b": 263.75525000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 239, "text": "Eyepiece", "bbox": {"l": 441.81281, "t": 262.32178, "r": 447.03702, "b": 263.75525000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 195, "label": "text", "bbox": {"l": 437.34607, "t": 271.13025000000005, "r": 440.80496, "b": 272.56281, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 240, "text": "Stand", "bbox": {"l": 437.34607, "t": 271.13025000000005, "r": 440.80496, "b": 272.56281, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 196, "label": "text", "bbox": {"l": 409.7164, "t": 284.40027, "r": 413.3768, "b": 285.83282, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 241, "text": "Lamp ", "bbox": {"l": 409.7164, "t": 284.40027, "r": 413.3768, "b": 285.83282, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 197, "label": "text", "bbox": {"l": 409.7164, "t": 285.83163, "r": 413.68201, "b": 287.26416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 242, "text": "On/Off", "bbox": {"l": 409.7164, "t": 285.83163, "r": 413.68201, "b": 287.26416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 198, "label": "text", "bbox": {"l": 409.7164, "t": 287.263, "r": 413.6337, "b": 288.69553, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 243, "text": "Switch", "bbox": {"l": 409.7164, "t": 287.263, "r": 413.6337, "b": 288.69553, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 199, "label": "text", "bbox": {"l": 434.8712499999999, "t": 296.7153, "r": 438.53164999999996, "b": 298.14783, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 244, "text": "Lamp ", "bbox": {"l": 434.8712499999999, "t": 296.7153, "r": 438.53164999999996, "b": 298.14783, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 200, "label": "text", "bbox": {"l": 439.52039, "t": 292.18307000000004, "r": 443.08768, "b": 293.61560000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 245, "text": "Power", "bbox": {"l": 439.52039, "t": 292.18307000000004, "r": 443.08768, "b": 293.61560000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 201, "label": "text", "bbox": {"l": 439.52039, "t": 293.61444, "r": 442.29575, "b": 295.04697, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 246, "text": "Cord", "bbox": {"l": 439.52039, "t": 293.61444, "r": 442.29575, "b": 295.04697, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 202, "label": "text", "bbox": {"l": 413.55829, "t": 264.66089, "r": 421.94913, "b": 266.09344, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 247, "text": "Rotating Head", "bbox": {"l": 413.55829, "t": 264.66089, "r": 421.94913, "b": 266.09344, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 203, "label": "text", "bbox": {"l": 441.84316999999993, "t": 286.90573, "r": 447.87585000000007, "b": 288.33826, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 248, "text": "Stage Clip", "bbox": {"l": 441.84316999999993, "t": 286.90573, "r": 447.87585000000007, "b": 288.33826, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 204, "label": "text", "bbox": {"l": 441.84316999999993, "t": 288.3371, "r": 448.67252, "b": 289.76962000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 249, "text": "Adjustment", "bbox": {"l": 441.84316999999993, "t": 288.3371, "r": 448.67252, "b": 289.76962000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 205, "label": "text", "bbox": {"l": 407.2403, "t": 259.86645999999996, "r": 425.79089, "b": 261.29895, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 250, "text": "Interpupillary Slide Adjustment", "bbox": {"l": 407.2403, "t": 259.86645999999996, "r": 425.79089, "b": 261.29895, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 206, "label": "text", "bbox": {"l": 449.10074000000003, "t": 378.66302, "r": 466.08835000000005, "b": 380.78412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 251, "text": "Circling Minimums", "bbox": {"l": 449.10074000000003, "t": 378.66302, "r": 466.08835000000005, "b": 380.78412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 207, "label": "text", "bbox": {"l": 449.10074000000003, "t": 383.2203999999999, "r": 449.64444, "b": 385.34148999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 252, "text": "7", "bbox": {"l": 449.10074000000003, "t": 383.2203999999999, "r": 449.64444, "b": 385.34148999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 208, "label": "text", "bbox": {"l": 450.18811, "t": 383.2203999999999, "r": 550.77124, "b": 385.34148999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 253, "text": "K H U H Z D V D F K D Q J H W R W K H 7 ( 5 3 6 F U L W H U L D L Q W K D W D \u1087H F W V F L U F O L Q J D U H D G L P H Q V L R Q E \\ H [ S D Q G L Q J W K H D U H D V W R S U R Y L G H ", "bbox": {"l": 450.18811, "t": 383.2203999999999, "r": 550.77124, "b": 385.34148999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 209, "label": "text", "bbox": {"l": 449.10074000000003, "t": 385.75732, "r": 536.14716, "b": 387.87842, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 254, "text": "improved obstacle protection. To indicate that the new criteria had been applied to a given procedure, a ", "bbox": {"l": 449.10074000000003, "t": 385.75732, "r": 536.14716, "b": 387.87842, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 210, "label": "text", "bbox": {"l": 538.31085, "t": 385.75732, "r": 549.49921, "b": 387.87842, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 255, "text": " is placed on ", "bbox": {"l": 538.31085, "t": 385.75732, "r": 549.49921, "b": 387.87842, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 211, "label": "text", "bbox": {"l": 449.10074000000003, "t": 388.03601, "r": 547.58185, "b": 390.1571, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 256, "text": "the circling line of minimums. The new circling tables and explanatory information is located in the Legend of the TPP.", "bbox": {"l": 449.10074000000003, "t": 388.03601, "r": 547.58185, "b": 390.1571, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 212, "label": "text", "bbox": {"l": 449.10074000000003, "t": 393.2128000000001, "r": 449.6163, "b": 395.33386, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 257, "text": "7", "bbox": {"l": 449.10074000000003, "t": 393.2128000000001, "r": 449.6163, "b": 395.33386, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 213, "label": "text", "bbox": {"l": 450.1319, "t": 393.2128000000001, "r": 529.53082, "b": 395.33386, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 258, "text": "K H D S S U R D F K H V X V L Q J V W D Q G D U G F L U F O L Q J D S S U R D F K D U H D V F D Q E H L G H Q W L \u00bf H G E \\ W K H D E V H Q F H R I W K H ", "bbox": {"l": 450.1319, "t": 393.2128000000001, "r": 529.53082, "b": 395.33386, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 214, "label": "text", "bbox": {"l": 532.05829, "t": 393.2128000000001, "r": 550.42261, "b": 395.33386, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 259, "text": " on the circling line of ", "bbox": {"l": 532.05829, "t": 393.2128000000001, "r": 550.42261, "b": 395.33386, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 215, "label": "text", "bbox": {"l": 449.10074000000003, "t": 395.49149, "r": 455.74692, "b": 397.61255, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 260, "text": "minima.", "bbox": {"l": 449.10074000000003, "t": 395.49149, "r": 455.74692, "b": 397.61255, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 216, "label": "text", "bbox": {"l": 449.95525999999995, "t": 415.59549, "r": 496.2829, "b": 417.50446, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 261, "text": "$ S S O \\ 6 W D Q G D U G & L U F O L Q J $ S S U R D F K 0 D Q H X Y H U L Q J 5 D G L X V 7 D E O H ", "bbox": {"l": 449.95525999999995, "t": 415.59549, "r": 496.2829, "b": 417.50446, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 217, "label": "text", "bbox": {"l": 501.13077, "t": 409.25543, "r": 551.16101, "b": 411.1644, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 262, "text": "$ S S O \\ ( [ S D Q G H G & L U F O L Q J $ S S U R D F K 0 D Q H X Y H U L Q J $ L U V S D F H 5 D G L X V ", "bbox": {"l": 501.13077, "t": 409.25543, "r": 551.16101, "b": 411.1644, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 218, "label": "text", "bbox": {"l": 501.13077, "t": 411.30624, "r": 505.2477999999999, "b": 413.21521, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 263, "text": "Table", "bbox": {"l": 501.13077, "t": 411.30624, "r": 505.2477999999999, "b": 413.21521, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 219, "label": "text", "bbox": {"l": 449.10074000000003, "t": 420.18802, "r": 469.35599, "b": 422.73331, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 264, "text": "AIRPORT SKETCH", "bbox": {"l": 449.10074000000003, "t": 420.18802, "r": 469.35599, "b": 422.73331, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 220, "label": "text", "bbox": {"l": 449.10074000000003, "t": 425.08908, "r": 525.93616, "b": 427.21017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 265, "text": "The airport sketch is a depiction of the airport with emphasis on runway pattern and related ", "bbox": {"l": 449.10074000000003, "t": 425.08908, "r": 525.93616, "b": 427.21017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 221, "label": "text", "bbox": {"l": 449.10074000000003, "t": 427.3678, "r": 522.0343, "b": 429.48886, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 266, "text": "information, positioned in either the lower left or lower right corner of the chart to aid pi-", "bbox": {"l": 449.10074000000003, "t": 427.3678, "r": 522.0343, "b": 429.48886, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 222, "label": "text", "bbox": {"l": 449.10074000000003, "t": 429.64648, "r": 524.67151, "b": 431.76755, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 267, "text": "lot recognition of the airport from the air and to provide some information to aid on ground ", "bbox": {"l": 449.10074000000003, "t": 429.64648, "r": 524.67151, "b": 431.76755, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 223, "label": "text", "bbox": {"l": 449.10074000000003, "t": 431.92514000000006, "r": 527.172, "b": 434.04623, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 268, "text": "navigation of the airport. The runways are drawn to scale and oriented to true north. Runway ", "bbox": {"l": 449.10074000000003, "t": 431.92514000000006, "r": 527.172, "b": 434.04623, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 224, "label": "text", "bbox": {"l": 449.10074000000003, "t": 434.20383, "r": 502.39545, "b": 436.32492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 269, "text": "dimensions (length and width) are shown for all active runways.", "bbox": {"l": 449.10074000000003, "t": 434.20383, "r": 502.39545, "b": 436.32492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 225, "label": "text", "bbox": {"l": 449.10074000000003, "t": 438.7611999999999, "r": 512.92676, "b": 440.88228999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 270, "text": "Runway(s) are depicted based on what type and construction of the runway.", "bbox": {"l": 449.10074000000003, "t": 438.7611999999999, "r": 512.92676, "b": 440.88228999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 226, "label": "text", "bbox": {"l": 449.95525999999995, "t": 444.07001, "r": 460.02307, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 271, "text": "Hard Surface", "bbox": {"l": 449.95525999999995, "t": 444.07001, "r": 460.02307, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 227, "label": "text", "bbox": {"l": 464.89963, "t": 444.07001, "r": 473.98819, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 272, "text": "Other Than ", "bbox": {"l": 464.89963, "t": 444.07001, "r": 473.98819, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 228, "label": "text", "bbox": {"l": 464.89963, "t": 446.12085, "r": 474.96744, "b": 448.02979, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 273, "text": "Hard Surface", "bbox": {"l": 464.89963, "t": 446.12085, "r": 474.96744, "b": 448.02979, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 229, "label": "text", "bbox": {"l": 478.91357, "t": 444.07001, "r": 489.45648, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 274, "text": "Metal Surface", "bbox": {"l": 478.91357, "t": 444.07001, "r": 489.45648, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 230, "label": "text", "bbox": {"l": 493.06420999999995, "t": 444.07001, "r": 505.03076, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 275, "text": "Closed Runway", "bbox": {"l": 493.06420999999995, "t": 444.07001, "r": 505.03076, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 231, "label": "text", "bbox": {"l": 509.5809, "t": 444.07001, "r": 524.30237, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 276, "text": "Under Construction", "bbox": {"l": 509.5809, "t": 444.07001, "r": 524.30237, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 232, "label": "text", "bbox": {"l": 449.95525999999995, "t": 454.81207, "r": 458.31406, "b": 456.72104, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 277, "text": "Stopways, ", "bbox": {"l": 449.95525999999995, "t": 454.81207, "r": 458.31406, "b": 456.72104, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 233, "label": "text", "bbox": {"l": 449.95525999999995, "t": 456.86288, "r": 461.92083999999994, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 278, "text": "Taxiways, Park-", "bbox": {"l": 449.95525999999995, "t": 456.86288, "r": 461.92083999999994, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 234, "label": "text", "bbox": {"l": 449.95525999999995, "t": 458.91373, "r": 457.08014, "b": 460.82268999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 279, "text": "ing Areas", "bbox": {"l": 449.95525999999995, "t": 458.91373, "r": 457.08014, "b": 460.82268999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 235, "label": "text", "bbox": {"l": 464.89963, "t": 454.81207, "r": 472.87732, "b": 456.72104, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 280, "text": "Displaced ", "bbox": {"l": 464.89963, "t": 454.81207, "r": 472.87732, "b": 456.72104, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 236, "label": "text", "bbox": {"l": 464.89963, "t": 456.86288, "r": 472.49792, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 281, "text": "Threshold", "bbox": {"l": 464.89963, "t": 456.86288, "r": 472.49792, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 237, "label": "text", "bbox": {"l": 478.91357, "t": 454.81207, "r": 483.61584, "b": 456.72104, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 282, "text": "Closed", "bbox": {"l": 478.91357, "t": 454.81207, "r": 483.61584, "b": 456.72104, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 238, "label": "text", "bbox": {"l": 478.91357, "t": 456.86288, "r": 486.60754000000003, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 283, "text": "Pavement", "bbox": {"l": 478.91357, "t": 456.86288, "r": 486.60754000000003, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 239, "label": "text", "bbox": {"l": 493.06420999999995, "t": 454.81207, "r": 504.20648, "b": 456.72104, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 284, "text": "Water Runway", "bbox": {"l": 493.06420999999995, "t": 454.81207, "r": 504.20648, "b": 456.72104, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 240, "label": "text", "bbox": {"l": 449.10074000000003, "t": 469.32974, "r": 548.59674, "b": 471.45081, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 285, "text": "Taxiways and aprons are shaded grey. Other runway features that may be shown are runway numbers, runway dimen-", "bbox": {"l": 449.10074000000003, "t": 469.32974, "r": 548.59674, "b": 471.45081, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 241, "label": "text", "bbox": {"l": 449.10074000000003, "t": 471.60843, "r": 500.08181999999994, "b": 473.72949, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 286, "text": "sions, runway slope, arresting gear, and displaced threshold.", "bbox": {"l": 449.10074000000003, "t": 471.60843, "r": 500.08181999999994, "b": 473.72949, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 242, "label": "text", "bbox": {"l": 449.10074000000003, "t": 476.16577, "r": 449.59933000000007, "b": 478.28687, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 287, "text": "2", "bbox": {"l": 449.10074000000003, "t": 476.16577, "r": 449.59933000000007, "b": 478.28687, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 243, "label": "text", "bbox": {"l": 450.09796, "t": 476.16577, "r": 547.82562, "b": 478.28687, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 288, "text": "W K H U L Q I R U P D W L R Q F R Q F H U Q L Q J O L J K W L Q J \u00bf Q D O D S S U R D F K E H D U L Q J V D L U S R U W E H D F R Q R E V W D F O H V F R Q W U R O W R Z H U 1 $ 9 $ , ' V K H O L ", "bbox": {"l": 450.09796, "t": 476.16577, "r": 547.82562, "b": 478.28687, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 244, "label": "text", "bbox": {"l": 547.82623, "t": 476.16577, "r": 548.45862, "b": 478.28687, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 289, "text": "-", "bbox": {"l": 547.82623, "t": 476.16577, "r": 548.45862, "b": 478.28687, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 245, "label": "text", "bbox": {"l": 449.10074000000003, "t": 478.44446, "r": 470.52609000000007, "b": 480.56555, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 290, "text": "pads may also be shown.", "bbox": {"l": 449.10074000000003, "t": 478.44446, "r": 470.52609000000007, "b": 480.56555, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 246, "label": "text", "bbox": {"l": 449.10074000000003, "t": 483.00183, "r": 493.37906000000004, "b": 485.12292, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 291, "text": "$ L U S R U W ( O H Y D W L R Q D Q G 7 R X F K G R Z Q = R Q H ( O H Y D W L R Q ", "bbox": {"l": 449.10074000000003, "t": 483.00183, "r": 493.37906000000004, "b": 485.12292, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 449.10074000000003, "t": 487.5592, "r": 551.80023, "b": 496.51636, "coord_origin": "TOPLEFT"}, "confidence": 0.5027862787246704, "cells": [{"id": 292, "text": "The airport elevation is shown enclosed within a box in the upper left corner of the sketch box and the touchdown zone ", "bbox": {"l": 449.10074000000003, "t": 487.5592, "r": 549.16168, "b": 489.6803, "coord_origin": "TOPLEFT"}}, {"id": 293, "text": "elevation (TDZE) is shown in the upper right corner of the sketch box. The airport elevation is the highest point of an ", "bbox": {"l": 449.10074000000003, "t": 489.83789, "r": 546.90881, "b": 491.95898, "coord_origin": "TOPLEFT"}}, {"id": 294, "text": "D L U S R U W \u00b6 V X V D E O H U X Q Z D \\ V P H D V X U H G L Q I H H W I U R P P H D Q V H D O H Y H O 7 K H 7 ' = ( L V W K H K L J K H V W H O H Y D W L R Q L Q W K H \u00bf U V W I H H W R I ", "bbox": {"l": 449.10074000000003, "t": 492.11658, "r": 551.80023, "b": 494.23767, "coord_origin": "TOPLEFT"}}, {"id": 295, "text": "the landing surface. Circling only approaches will not show a TDZE.", "bbox": {"l": 449.10074000000003, "t": 494.39526, "r": 505.85068000000007, "b": 496.51636, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 247, "label": "text", "bbox": {"l": 498.80661000000003, "t": 515.9437, "r": 502.08792, "b": 519.01764, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 296, "text": "114", "bbox": {"l": 498.80661000000003, "t": 515.9437, "r": 502.08792, "b": 519.01764, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 248, "label": "text", "bbox": {"l": 444.56319999999994, "t": 422.84869, "r": 446.25998, "b": 471.87128, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 297, "text": "FAA Chart Users\u2019 Guide - Terminal Procedures Publication (TPP) - Terms", "bbox": {"l": 444.56319999999994, "t": 422.84869, "r": 446.25998, "b": 471.87128, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 249, "label": "text", "bbox": {"l": 329.40536, "t": 379.37537, "r": 355.13138, "b": 382.13336, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 298, "text": "AGL 2013 Financial Calendar", "bbox": {"l": 329.40536, "t": 379.37537, "r": 355.13138, "b": 382.13336, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 250, "label": "text", "bbox": {"l": 329.40536, "t": 382.30273, "r": 330.96848, "b": 384.55927, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 299, "text": "22", "bbox": {"l": 329.40536, "t": 382.30273, "r": 330.96848, "b": 384.55927, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 251, "label": "text", "bbox": {"l": 331.75003, "t": 382.30273, "r": 341.12875, "b": 384.55927, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 300, "text": "August 2012 ", "bbox": {"l": 331.75003, "t": 382.30273, "r": 341.12875, "b": 384.55927, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 252, "label": "text", "bbox": {"l": 350.4722, "t": 382.30273, "r": 384.81079, "b": 384.55927, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 301, "text": "2012 full year result and fi nal dividend announced", "bbox": {"l": 350.4722, "t": 382.30273, "r": 384.81079, "b": 384.55927, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 253, "label": "text", "bbox": {"l": 329.40536, "t": 384.84552, "r": 330.97336, "b": 387.10205, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 302, "text": "30", "bbox": {"l": 329.40536, "t": 384.84552, "r": 330.97336, "b": 387.10205, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 254, "label": "text", "bbox": {"l": 331.75735, "t": 384.84552, "r": 341.16534, "b": 387.10205, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 303, "text": "August 2012 ", "bbox": {"l": 331.75735, "t": 384.84552, "r": 341.16534, "b": 387.10205, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 255, "label": "text", "bbox": {"l": 350.4722, "t": 384.84552, "r": 372.90613, "b": 387.10205, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 304, "text": "Ex-dividend trading commences", "bbox": {"l": 350.4722, "t": 384.84552, "r": 372.90613, "b": 387.10205, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 256, "label": "text", "bbox": {"l": 329.40536, "t": 387.38828, "r": 330.20337, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 305, "text": "5", "bbox": {"l": 329.40536, "t": 387.38828, "r": 330.20337, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 257, "label": "text", "bbox": {"l": 331.00137, "t": 387.38828, "r": 342.9715, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 306, "text": "September 2012 ", "bbox": {"l": 331.00137, "t": 387.38828, "r": 342.9715, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 258, "label": "text", "bbox": {"l": 350.4722, "t": 387.38828, "r": 374.88693, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 307, "text": "Record date for 2012 fi nal dividend", "bbox": {"l": 350.4722, "t": 387.38828, "r": 374.88693, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 259, "label": "text", "bbox": {"l": 329.40536, "t": 389.93103, "r": 331.0173, "b": 392.18762, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 308, "text": "27", "bbox": {"l": 329.40536, "t": 389.93103, "r": 331.0173, "b": 392.18762, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 260, "label": "text", "bbox": {"l": 331.82327, "t": 389.93103, "r": 343.91284, "b": 392.18762, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 309, "text": "September 2012 ", "bbox": {"l": 331.82327, "t": 389.93103, "r": 343.91284, "b": 392.18762, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 261, "label": "text", "bbox": {"l": 350.4722, "t": 389.93103, "r": 365.65988, "b": 392.18762, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 310, "text": "Final dividend payable", "bbox": {"l": 350.4722, "t": 389.93103, "r": 365.65988, "b": 392.18762, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 262, "label": "text", "bbox": {"l": 329.40536, "t": 392.47382, "r": 330.98804, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 311, "text": "23", "bbox": {"l": 329.40536, "t": 392.47382, "r": 330.98804, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 263, "label": "text", "bbox": {"l": 331.77936, "t": 392.47382, "r": 342.06674, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 312, "text": "October 2012 ", "bbox": {"l": 331.77936, "t": 392.47382, "r": 342.06674, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 264, "label": "text", "bbox": {"l": 350.4722, "t": 392.47382, "r": 367.22156, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 313, "text": "Annual General Meeting", "bbox": {"l": 350.4722, "t": 392.47382, "r": 367.22156, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 265, "label": "text", "bbox": {"l": 329.40536, "t": 395.0166, "r": 330.99741, "b": 397.27313, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 314, "text": "27", "bbox": {"l": 329.40536, "t": 395.0166, "r": 330.99741, "b": 397.27313, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 266, "label": "text", "bbox": {"l": 331.7934, "t": 395.0166, "r": 342.1416, "b": 397.27313, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 315, "text": "February 2013", "bbox": {"l": 331.7934, "t": 395.0166, "r": 342.1416, "b": 397.27313, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 267, "label": "text", "bbox": {"l": 342.64841, "t": 395.18298, "r": 342.65811, "b": 396.49857000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 316, "text": " 1", "bbox": {"l": 342.64841, "t": 395.18298, "r": 342.65811, "b": 396.49857000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 268, "label": "text", "bbox": {"l": 350.47177, "t": 395.01474, "r": 386.25897, "b": 397.2713, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 317, "text": "2013 interim result and interim dividend announced", "bbox": {"l": 350.47177, "t": 395.01474, "r": 386.25897, "b": 397.2713, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 269, "label": "text", "bbox": {"l": 329.40491, "t": 397.55749999999995, "r": 331.02695, "b": 399.81406, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 318, "text": "28", "bbox": {"l": 329.40491, "t": 397.55749999999995, "r": 331.02695, "b": 399.81406, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 270, "label": "text", "bbox": {"l": 331.83795, "t": 397.55749999999995, "r": 340.75909, "b": 399.81406, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 319, "text": "August 2013", "bbox": {"l": 331.83795, "t": 397.55749999999995, "r": 340.75909, "b": 399.81406, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 271, "label": "text", "bbox": {"l": 341.26437, "t": 397.7254, "r": 341.27408, "b": 399.04095, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 320, "text": " 1", "bbox": {"l": 341.26437, "t": 397.7254, "r": 341.27408, "b": 399.04095, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 272, "label": "text", "bbox": {"l": 350.47144, "t": 397.55713, "r": 385.93265, "b": 399.81369, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 321, "text": "2013 full year results and fi nal dividend announced ", "bbox": {"l": 350.47144, "t": 397.55713, "r": 385.93265, "b": 399.81369, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 273, "label": "text", "bbox": {"l": 329.40536, "t": 400.46155, "r": 329.87708, "b": 401.96588, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 322, "text": "1", "bbox": {"l": 329.40536, "t": 400.46155, "r": 329.87708, "b": 401.96588, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 274, "label": "text", "bbox": {"l": 330.34882, "t": 400.46155, "r": 358.65204, "b": 401.96588, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 323, "text": "Indicative dates only, subject to change/Board confi rmation", "bbox": {"l": 330.34882, "t": 400.46155, "r": 358.65204, "b": 401.96588, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 275, "label": "text", "bbox": {"l": 329.40536, "t": 404.34503, "r": 391.771, "b": 406.60156, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 324, "text": "AGL\u2019s Annual General Meeting will be held at the City Recital Hall, Angel Place, Sydney ", "bbox": {"l": 329.40536, "t": 404.34503, "r": 391.771, "b": 406.60156, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 276, "label": "text", "bbox": {"l": 329.40536, "t": 406.37857, "r": 369.65308, "b": 408.63513000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 325, "text": "commencing at 10.30am on Tuesday 23 October 2012.", "bbox": {"l": 329.40536, "t": 406.37857, "r": 369.65308, "b": 408.63513000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 277, "label": "text", "bbox": {"l": 363.54486, "t": 460.53054999999995, "r": 379.25955, "b": 465.54507, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 326, "text": "Ye s te rd ay", "bbox": {"l": 363.54486, "t": 460.53054999999995, "r": 379.25955, "b": 465.54507, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 278, "label": "text", "bbox": {"l": 363.54486, "t": 466.7157, "r": 391.38229, "b": 468.97223, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 327, "text": "Established in Sydney in 1837, and then ", "bbox": {"l": 363.54486, "t": 466.7157, "r": 391.38229, "b": 468.97223, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 279, "label": "text", "bbox": {"l": 363.54486, "t": 468.74924, "r": 395.01788, "b": 471.00577, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 328, "text": "known as The Australian Gas Light Company, ", "bbox": {"l": 363.54486, "t": 468.74924, "r": 395.01788, "b": 471.00577, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 280, "label": "text", "bbox": {"l": 363.54486, "t": 470.78281, "r": 394.08322, "b": 473.03934, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 329, "text": "the AGL business has an established history ", "bbox": {"l": 363.54486, "t": 470.78281, "r": 394.08322, "b": 473.03934, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 281, "label": "text", "bbox": {"l": 363.54486, "t": 472.81635, "r": 390.60727, "b": 475.07288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 330, "text": "and reputation for serving the gas and ", "bbox": {"l": 363.54486, "t": 472.81635, "r": 390.60727, "b": 475.07288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 282, "label": "text", "bbox": {"l": 363.54486, "t": 474.84988, "r": 393.49612, "b": 477.10645, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 331, "text": "electricity needs of Australian households. ", "bbox": {"l": 363.54486, "t": 474.84988, "r": 393.49612, "b": 477.10645, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 283, "label": "text", "bbox": {"l": 363.54486, "t": 476.88345, "r": 394.11481, "b": 479.13998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 332, "text": "In 1841, when AGL supplied the gas to light ", "bbox": {"l": 363.54486, "t": 476.88345, "r": 394.11481, "b": 479.13998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 284, "label": "text", "bbox": {"l": 363.54486, "t": 478.91699, "r": 393.75891, "b": 481.17352, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 333, "text": "the fi rst public street lamp, it was reported ", "bbox": {"l": 363.54486, "t": 478.91699, "r": 393.75891, "b": 481.17352, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 285, "label": "text", "bbox": {"l": 363.54486, "t": 480.95053, "r": 390.4975, "b": 483.20709, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 334, "text": "in the Sydney Gazette as a \u201cwonderful ", "bbox": {"l": 363.54486, "t": 480.95053, "r": 390.4975, "b": 483.20709, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 286, "label": "text", "bbox": {"l": 363.54486, "t": 482.9841, "r": 395.70975, "b": 485.24063, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 335, "text": "achievement of scientifi c knowledge, assisted ", "bbox": {"l": 363.54486, "t": 482.9841, "r": 395.70975, "b": 485.24063, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 287, "label": "text", "bbox": {"l": 363.54486, "t": 485.01764, "r": 394.27283, "b": 487.2742, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 336, "text": "by mechanical ingenuity.\u201d Within two years, ", "bbox": {"l": 363.54486, "t": 485.01764, "r": 394.27283, "b": 487.2742, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 288, "label": "text", "bbox": {"l": 363.54486, "t": 487.05121, "r": 396.65939, "b": 489.30774, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 337, "text": "165 gas lamps were lighting the City of Sydney.", "bbox": {"l": 363.54486, "t": 487.05121, "r": 396.65939, "b": 489.30774, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 289, "label": "text", "bbox": {"l": 329.4054, "t": 419.93124, "r": 384.19696, "b": 431.09412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 338, "text": "Looking back on ", "bbox": {"l": 329.4054, "t": 419.93124, "r": 384.19696, "b": 431.09412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 290, "label": "text", "bbox": {"l": 329.4054, "t": 430.10379, "r": 372.16626, "b": 441.26669, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 339, "text": "175 years of ", "bbox": {"l": 329.4054, "t": 430.10379, "r": 372.16626, "b": 441.26669, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 291, "label": "text", "bbox": {"l": 329.4054, "t": 440.27636999999993, "r": 385.3981, "b": 451.43924, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 340, "text": "looking forward.", "bbox": {"l": 329.4054, "t": 440.27636999999993, "r": 385.3981, "b": 451.43924, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 292, "label": "text", "bbox": {"l": 329.40536, "t": 372.16159, "r": 353.36179, "b": 373.91669, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 341, "text": "AGL Energy Limited ABN 74 115 061 375", "bbox": {"l": 329.40536, "t": 372.16159, "r": 353.36179, "b": 373.91669, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 293, "label": "text", "bbox": {"l": 546.20587, "t": 360.90448, "r": 548.23407, "b": 362.82242, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 342, "text": "29", "bbox": {"l": 546.20587, "t": 360.90448, "r": 548.23407, "b": 362.82242, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 294, "label": "text", "bbox": {"l": 497.77728, "t": 251.43384000000003, "r": 542.8255, "b": 254.94385, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 343, "text": "signs, signals and road markings", "bbox": {"l": 497.77728, "t": 251.43384000000003, "r": 542.8255, "b": 254.94385, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 295, "label": "text", "bbox": {"l": 490.30679, "t": 251.47478999999998, "r": 492.09982, "b": 254.98479999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 344, "text": "3", "bbox": {"l": 490.30679, "t": 251.47478999999998, "r": 492.09982, "b": 254.98479999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 296, "label": "text", "bbox": {"l": 498.15335, "t": 263.88922, "r": 500.05637, "b": 265.92719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 345, "text": "In ", "bbox": {"l": 498.15335, "t": 263.88922, "r": 500.05637, "b": 265.92719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 297, "label": "text", "bbox": {"l": 500.05637, "t": 263.85717999999997, "r": 524.37036, "b": 265.86310000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 346, "text": "chapter 2, you and your vehicle", "bbox": {"l": 500.05637, "t": 263.85717999999997, "r": 524.37036, "b": 265.86310000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 298, "label": "text", "bbox": {"l": 524.37036, "t": 263.88922, "r": 539.89124, "b": 265.92719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 347, "text": ", you learned about ", "bbox": {"l": 524.37036, "t": 263.88922, "r": 539.89124, "b": 265.92719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 299, "label": "text", "bbox": {"l": 498.15335, "t": 265.93224999999995, "r": 544.50403, "b": 267.97020999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 348, "text": "some of the controls in your vehicle. This chapter is a handy ", "bbox": {"l": 498.15335, "t": 265.93224999999995, "r": 544.50403, "b": 267.97020999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 300, "label": "text", "bbox": {"l": 498.15335, "t": 267.97533999999996, "r": 544.01343, "b": 270.01331000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 349, "text": "reference section that gives examples of the most common ", "bbox": {"l": 498.15335, "t": 267.97533999999996, "r": 544.01343, "b": 270.01331000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 301, "label": "text", "bbox": {"l": 498.15335, "t": 270.01831000000004, "r": 544.11987, "b": 272.05634, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 350, "text": "signs, signals and road markings that keep traffi c organized ", "bbox": {"l": 498.15335, "t": 270.01831000000004, "r": 544.11987, "b": 272.05634, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 302, "label": "text", "bbox": {"l": 498.15335, "t": 272.06140000000005, "r": 515.41071, "b": 274.09937, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 351, "text": "and flowing smoothly. ", "bbox": {"l": 498.15335, "t": 272.06140000000005, "r": 515.41071, "b": 274.09937, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 303, "label": "text", "bbox": {"l": 498.15335, "t": 277.34619, "r": 505.64642000000003, "b": 280.9357, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 352, "text": "Signs", "bbox": {"l": 498.15335, "t": 277.34619, "r": 505.64642000000003, "b": 280.9357, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 304, "label": "text", "bbox": {"l": 498.15335, "t": 281.82187, "r": 543.92957, "b": 283.85983, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 353, "text": "There are three ways to read signs: by their shape, colour and ", "bbox": {"l": 498.15335, "t": 281.82187, "r": 543.92957, "b": 283.85983, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 305, "label": "text", "bbox": {"l": 498.15335, "t": 283.8649, "r": 545.67834, "b": 285.90289, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 354, "text": "the messages printed on them. Understanding these three ways ", "bbox": {"l": 498.15335, "t": 283.8649, "r": 545.67834, "b": 285.90289, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 306, "label": "text", "bbox": {"l": 498.15335, "t": 285.90796, "r": 545.26471, "b": 287.94592, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 355, "text": "of classifying signs will help you figure out the meaning of signs ", "bbox": {"l": 498.15335, "t": 285.90796, "r": 545.26471, "b": 287.94592, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 307, "label": "text", "bbox": {"l": 498.15335, "t": 287.95099, "r": 513.31335, "b": 289.98895, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 356, "text": "that are new to you. ", "bbox": {"l": 498.15335, "t": 287.95099, "r": 513.31335, "b": 289.98895, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 308, "label": "text", "bbox": {"l": 505.43439, "t": 303.07596, "r": 508.53033000000005, "b": 304.89639, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 357, "text": "Stop", "bbox": {"l": 505.43439, "t": 303.07596, "r": 508.53033000000005, "b": 304.89639, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 309, "label": "text", "bbox": {"l": 527.45502, "t": 303.25354, "r": 541.44678, "b": 305.07397, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 358, "text": "Yield the right-of-way", "bbox": {"l": 527.45502, "t": 303.25354, "r": 541.44678, "b": 305.07397, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 310, "label": "text", "bbox": {"l": 501.79385, "t": 321.18973, "r": 510.41632, "b": 323.01016, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 359, "text": "Shows driving", "bbox": {"l": 501.79385, "t": 321.18973, "r": 510.41632, "b": 323.01016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 311, "label": "text", "bbox": {"l": 501.79385, "t": 322.87731999999994, "r": 509.04268999999994, "b": 324.69775000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 360, "text": "regulations", "bbox": {"l": 501.79385, "t": 322.87731999999994, "r": 509.04268999999994, "b": 324.69775000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 312, "label": "text", "bbox": {"l": 518.66455, "t": 319.59146, "r": 529.80902, "b": 321.41190000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 361, "text": "Explains lane use", "bbox": {"l": 518.66455, "t": 319.59146, "r": 529.80902, "b": 321.41190000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 313, "label": "text", "bbox": {"l": 534.87561, "t": 318.37616, "r": 546.95142, "b": 320.19659, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 362, "text": "School zone signs ", "bbox": {"l": 534.87561, "t": 318.37616, "r": 546.95142, "b": 320.19659, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 314, "label": "text", "bbox": {"l": 534.87561, "t": 320.0637500000001, "r": 545.05762, "b": 321.88419, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 363, "text": "are fl uorescent ", "bbox": {"l": 534.87561, "t": 320.0637500000001, "r": 545.05762, "b": 321.88419, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 315, "label": "text", "bbox": {"l": 534.87561, "t": 321.75134, "r": 543.32263, "b": 323.57178, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 364, "text": "yellow-green", "bbox": {"l": 534.87561, "t": 321.75134, "r": 543.32263, "b": 323.57178, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 316, "label": "text", "bbox": {"l": 499.21862999999996, "t": 338.12772, "r": 512.62451, "b": 339.94815, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 365, "text": "Tells about motorist ", "bbox": {"l": 499.21862999999996, "t": 338.12772, "r": 512.62451, "b": 339.94815, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 317, "label": "text", "bbox": {"l": 499.21862999999996, "t": 339.81531000000007, "r": 504.39917, "b": 341.63574, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 366, "text": "services", "bbox": {"l": 499.21862999999996, "t": 339.81531000000007, "r": 504.39917, "b": 341.63574, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 318, "label": "text", "bbox": {"l": 516.97748, "t": 338.06039, "r": 529.77484, "b": 339.88082999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 367, "text": "Shows a permitted ", "bbox": {"l": 516.97748, "t": 338.06039, "r": 529.77484, "b": 339.88082999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 319, "label": "text", "bbox": {"l": 516.97748, "t": 339.74799, "r": 520.96399, "b": 341.56842, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 368, "text": "action", "bbox": {"l": 516.97748, "t": 339.74799, "r": 520.96399, "b": 341.56842, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 320, "label": "text", "bbox": {"l": 534.55847, "t": 337.88281, "r": 548.58453, "b": 339.7032500000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 369, "text": "Shows an action that ", "bbox": {"l": 534.55847, "t": 337.88281, "r": 548.58453, "b": 339.7032500000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 321, "label": "text", "bbox": {"l": 534.55847, "t": 339.57040000000006, "r": 545.08862, "b": 341.39084, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 370, "text": "is not permitted", "bbox": {"l": 534.55847, "t": 339.57040000000006, "r": 545.08862, "b": 341.39084, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 322, "label": "text", "bbox": {"l": 483.05853, "t": 356.17416, "r": 494.72577, "b": 357.9946, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 371, "text": "Warns of hazards ", "bbox": {"l": 483.05853, "t": 356.17416, "r": 494.72577, "b": 357.9946, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 323, "label": "text", "bbox": {"l": 483.05853, "t": 357.86179, "r": 487.07525999999996, "b": 359.68222, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 372, "text": "ahead", "bbox": {"l": 483.05853, "t": 357.86179, "r": 487.07525999999996, "b": 359.68222, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 324, "label": "text", "bbox": {"l": 499.39645, "t": 356.26297000000005, "r": 504.69171, "b": 358.0834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 373, "text": "Warns of", "bbox": {"l": 499.39645, "t": 356.26297000000005, "r": 504.69171, "b": 358.0834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 325, "label": "text", "bbox": {"l": 499.39645, "t": 357.95056, "r": 511.69116, "b": 359.77099999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 374, "text": "construction zones", "bbox": {"l": 499.39645, "t": 357.95056, "r": 511.69116, "b": 359.77099999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 326, "label": "text", "bbox": {"l": 516.75891, "t": 356.26297000000005, "r": 527.42938, "b": 358.0834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 375, "text": "Railway crossing", "bbox": {"l": 516.75891, "t": 356.26297000000005, "r": 527.42938, "b": 358.0834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 327, "label": "text", "bbox": {"l": 534.5141, "t": 352.92981, "r": 547.89862, "b": 354.75024, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 376, "text": "Shows distance and ", "bbox": {"l": 534.5141, "t": 352.92981, "r": 547.89862, "b": 354.75024, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 328, "label": "text", "bbox": {"l": 534.5141, "t": 354.6174, "r": 540.2818, "b": 356.43784, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 377, "text": "direction", "bbox": {"l": 534.5141, "t": 354.6174, "r": 540.2818, "b": 356.43784, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 329, "label": "text", "bbox": {"l": 478.37466, "t": 270.14075, "r": 479.14251999999993, "b": 272.17877, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 378, "text": "\u2022", "bbox": {"l": 478.37466, "t": 270.14075, "r": 479.14251999999993, "b": 272.17877, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 330, "label": "text", "bbox": {"l": 479.91036999999994, "t": 270.14075, "r": 483.74963, "b": 272.17877, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 379, "text": "Signs", "bbox": {"l": 479.91036999999994, "t": 270.14075, "r": 483.74963, "b": 272.17877, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 331, "label": "text", "bbox": {"l": 479.97293, "t": 272.84717, "r": 492.31219, "b": 274.34888, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 380, "text": "- regulatory signs", "bbox": {"l": 479.97293, "t": 272.84717, "r": 492.31219, "b": 274.34888, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 332, "label": "text", "bbox": {"l": 479.97293, "t": 275.14513999999997, "r": 486.72598000000005, "b": 276.64679, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 381, "text": "- school, ", "bbox": {"l": 479.97293, "t": 275.14513999999997, "r": 486.72598000000005, "b": 276.64679, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 333, "label": "text", "bbox": {"l": 481.21602999999993, "t": 276.77972, "r": 492.93286000000006, "b": 278.81768999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 382, "text": "playground and ", "bbox": {"l": 481.21602999999993, "t": 276.77972, "r": 492.93286000000006, "b": 278.81768999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 334, "label": "text", "bbox": {"l": 481.21602999999993, "t": 278.82275000000004, "r": 491.82938000000007, "b": 280.86075, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 383, "text": "crosswalk signs", "bbox": {"l": 481.21602999999993, "t": 278.82275000000004, "r": 491.82938000000007, "b": 280.86075, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 335, "label": "text", "bbox": {"l": 479.97293, "t": 281.52759, "r": 491.00775000000004, "b": 283.02924, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 384, "text": "- lane use signs", "bbox": {"l": 479.97293, "t": 281.52759, "r": 491.00775000000004, "b": 283.02924, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 336, "label": "text", "bbox": {"l": 479.97293, "t": 283.82556, "r": 493.32748, "b": 285.3272099999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 385, "text": "- turn control signs", "bbox": {"l": 479.97293, "t": 283.82556, "r": 493.32748, "b": 285.3272099999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 337, "label": "text", "bbox": {"l": 479.97293, "t": 286.1235, "r": 490.4915199999999, "b": 287.62518, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 386, "text": "- parking signs", "bbox": {"l": 479.97293, "t": 286.1235, "r": 490.4915199999999, "b": 287.62518, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 338, "label": "text", "bbox": {"l": 479.97293, "t": 288.42148, "r": 491.17004000000003, "b": 289.92316, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 387, "text": "- reserved lane ", "bbox": {"l": 479.97293, "t": 288.42148, "r": 491.17004000000003, "b": 289.92316, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 339, "label": "text", "bbox": {"l": 481.21602999999993, "t": 290.05605999999995, "r": 484.77405000000005, "b": 292.09406, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 388, "text": "signs", "bbox": {"l": 481.21602999999993, "t": 290.05605999999995, "r": 484.77405000000005, "b": 292.09406, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 340, "label": "text", "bbox": {"l": 479.97293, "t": 292.76169000000004, "r": 490.83398, "b": 294.26334, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 389, "text": "- warning signs", "bbox": {"l": 479.97293, "t": 292.76169000000004, "r": 490.83398, "b": 294.26334, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 341, "label": "text", "bbox": {"l": 479.97293, "t": 295.05963, "r": 491.62692, "b": 296.56131, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 390, "text": "- object markers", "bbox": {"l": 479.97293, "t": 295.05963, "r": 491.62692, "b": 296.56131, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 342, "label": "text", "bbox": {"l": 479.97293, "t": 297.3576, "r": 490.37341, "b": 298.8592499999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 391, "text": "- construction ", "bbox": {"l": 479.97293, "t": 297.3576, "r": 490.37341, "b": 298.8592499999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 343, "label": "text", "bbox": {"l": 481.21602999999993, "t": 298.99219, "r": 484.77405000000005, "b": 301.03015, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 392, "text": "signs", "bbox": {"l": 481.21602999999993, "t": 298.99219, "r": 484.77405000000005, "b": 301.03015, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 344, "label": "text", "bbox": {"l": 479.97293, "t": 301.69780999999995, "r": 492.93912, "b": 303.19946, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 393, "text": "- information and ", "bbox": {"l": 479.97293, "t": 301.69780999999995, "r": 492.93912, "b": 303.19946, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 345, "label": "text", "bbox": {"l": 481.21602999999993, "t": 303.3324, "r": 493.00525, "b": 305.37036, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 394, "text": "destination signs", "bbox": {"l": 481.21602999999993, "t": 303.3324, "r": 493.00525, "b": 305.37036, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 346, "label": "text", "bbox": {"l": 479.97293, "t": 306.0379899999999, "r": 489.99047999999993, "b": 307.53967, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 395, "text": "- railway signs", "bbox": {"l": 479.97293, "t": 306.0379899999999, "r": 489.99047999999993, "b": 307.53967, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 347, "label": "text", "bbox": {"l": 478.375, "t": 308.24789, "r": 479.1032400000001, "b": 310.28586, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 396, "text": "\u2022", "bbox": {"l": 478.375, "t": 308.24789, "r": 479.1032400000001, "b": 310.28586, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 348, "label": "text", "bbox": {"l": 479.83151, "t": 308.24789, "r": 484.92925999999994, "b": 310.28586, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 397, "text": "Signals", "bbox": {"l": 479.83151, "t": 308.24789, "r": 484.92925999999994, "b": 310.28586, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 349, "label": "text", "bbox": {"l": 479.97293, "t": 310.95358, "r": 490.00091999999995, "b": 312.45526, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 398, "text": "- lane control ", "bbox": {"l": 479.97293, "t": 310.95358, "r": 490.00091999999995, "b": 312.45526, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 350, "label": "text", "bbox": {"l": 481.21602999999993, "t": 312.5881999999999, "r": 485.95331, "b": 314.62616, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 399, "text": "signals", "bbox": {"l": 481.21602999999993, "t": 312.5881999999999, "r": 485.95331, "b": 314.62616, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 351, "label": "text", "bbox": {"l": 479.97293, "t": 315.29379, "r": 489.29876999999993, "b": 316.79544, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 400, "text": "- traffic lights", "bbox": {"l": 479.97293, "t": 315.29379, "r": 489.29876999999993, "b": 316.79544, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 352, "label": "text", "bbox": {"l": 478.375, "t": 317.50366, "r": 479.18129999999996, "b": 319.5416599999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 401, "text": "\u2022", "bbox": {"l": 478.375, "t": 317.50366, "r": 479.18129999999996, "b": 319.5416599999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 353, "label": "text", "bbox": {"l": 479.98761, "t": 317.50366, "r": 490.46960000000007, "b": 319.5416599999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 402, "text": "Road markings", "bbox": {"l": 479.98761, "t": 317.50366, "r": 490.46960000000007, "b": 319.5416599999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 354, "label": "text", "bbox": {"l": 479.97293, "t": 320.20938, "r": 489.26166000000006, "b": 321.71103, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 403, "text": "- yellow lines", "bbox": {"l": 479.97293, "t": 320.20938, "r": 489.26166000000006, "b": 321.71103, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 355, "label": "text", "bbox": {"l": 479.97293, "t": 322.50732, "r": 488.59189, "b": 324.009, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 404, "text": "- white lines", "bbox": {"l": 479.97293, "t": 322.50732, "r": 488.59189, "b": 324.009, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 356, "label": "text", "bbox": {"l": 479.97293, "t": 324.8053, "r": 491.17004000000003, "b": 326.30698, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 405, "text": "- reserved lane ", "bbox": {"l": 479.97293, "t": 324.8053, "r": 491.17004000000003, "b": 326.30698, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 357, "label": "text", "bbox": {"l": 481.21602999999993, "t": 326.43988, "r": 487.58978, "b": 328.47784, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 406, "text": "markings", "bbox": {"l": 481.21602999999993, "t": 326.43988, "r": 487.58978, "b": 328.47784, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 358, "label": "text", "bbox": {"l": 479.97293, "t": 329.14551, "r": 491.75177, "b": 330.64716, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 407, "text": "- other markings", "bbox": {"l": 479.97293, "t": 329.14551, "r": 491.75177, "b": 330.64716, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 359, "label": "text", "bbox": {"l": 478.15246999999994, "t": 265.07030999999995, "r": 493.75586, "b": 268.06872999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 408, "text": "in this chapter", "bbox": {"l": 478.15246999999994, "t": 265.07030999999995, "r": 493.75586, "b": 268.06872999999996, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 16, "label": "caption", "bbox": {"l": 317.95499, "t": 540.08299, "r": 559.80579, "b": 559.51524, "coord_origin": "TOPLEFT"}, "confidence": 0.7793369889259338, "cells": [{"id": 409, "text": "Figure 1: Four examples of complex page layouts across dif-", "bbox": {"l": 317.95499, "t": 540.08299, "r": 559.80579, "b": 548.55624, "coord_origin": "TOPLEFT"}}, {"id": 410, "text": "ferent document categories", "bbox": {"l": 317.95499, "t": 551.0419899999999, "r": 428.69907, "b": 559.51524, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "section_header", "bbox": {"l": 317.95499, "t": 592.46591, "r": 379.8205, "b": 602.7750100000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9208477139472961, "cells": [{"id": 411, "text": "KEYWORDS", "bbox": {"l": 317.95499, "t": 592.46591, "r": 379.8205, "b": 602.7750100000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 317.95499, "t": 607.66756, "r": 559.18597, "b": 627.00117, "coord_origin": "TOPLEFT"}, "confidence": 0.9509093761444092, "cells": [{"id": 412, "text": "PDF document conversion, layout segmentation, object-detection,", "bbox": {"l": 317.95499, "t": 607.66756, "r": 559.18597, "b": 616.04218, "coord_origin": "TOPLEFT"}}, {"id": 413, "text": "data set, Machine Learning", "bbox": {"l": 317.95499, "t": 618.62656, "r": 416.94403, "b": 627.00117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "section_header", "bbox": {"l": 317.65997, "t": 640.05434, "r": 404.65366, "b": 647.58609, "coord_origin": "TOPLEFT"}, "confidence": 0.8721990585327148, "cells": [{"id": 414, "text": "ACM Reference Format:", "bbox": {"l": 317.65997, "t": 640.05434, "r": 404.65366, "b": 647.58609, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 317.95499, "t": 650.11996, "r": 559.5495, "b": 707.377029, "coord_origin": "TOPLEFT"}, "confidence": 0.9455164670944214, "cells": [{"id": 415, "text": "Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter", "bbox": {"l": 317.95499, "t": 650.11996, "r": 558.35266, "b": 657.56404, "coord_origin": "TOPLEFT"}}, {"id": 416, "text": "Staar. 2022. DocLayNet: A Large Human-Annotated Dataset for Document-", "bbox": {"l": 317.95499, "t": 660.08296, "r": 559.5495, "b": 667.52703, "coord_origin": "TOPLEFT"}}, {"id": 417, "text": "Layout Analysis. In", "bbox": {"l": 317.95499, "t": 670.04497, "r": 383.30807, "b": 677.48904, "coord_origin": "TOPLEFT"}}, {"id": 418, "text": "Proceedings of the 28th ACM SIGKDD Conference on", "bbox": {"l": 385.798, "t": 670.08482, "r": 558.20032, "b": 677.49701, "coord_origin": "TOPLEFT"}}, {"id": 419, "text": "Knowledge Discovery and Data Mining (KDD \u201922), August 14-18, 2022, Wash-", "bbox": {"l": 317.95499, "t": 680.04781, "r": 559.00092, "b": 687.46001, "coord_origin": "TOPLEFT"}}, {"id": 420, "text": "ington, DC, USA.", "bbox": {"l": 317.95499, "t": 690.01081, "r": 370.11481, "b": 697.423004, "coord_origin": "TOPLEFT"}}, {"id": 421, "text": "ACM, New York, NY, USA, 9 pages. https://doi.org/10.1145/", "bbox": {"l": 371.82999, "t": 689.97096, "r": 558.71655, "b": 697.415031, "coord_origin": "TOPLEFT"}}, {"id": 422, "text": "3534678.3539043", "bbox": {"l": 317.95499, "t": 699.932953, "r": 371.59375, "b": 707.377029, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "page_header", "bbox": {"l": 18.34021, "t": 218.35999000000004, "r": 36.339794, "b": 555.00003, "coord_origin": "TOPLEFT"}, "confidence": 0.853788435459137, "cells": [{"id": 423, "text": "arXiv:2206.01062v1 [cs.CV] 2 Jun 2022", "bbox": {"l": 18.34021, "t": 218.35999000000004, "r": 36.339794, "b": 555.00003, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "section_header", "id": 12, "page_no": 0, "cluster": {"id": 12, "label": "section_header", "bbox": {"l": 107.29999999999998, "t": 83.69470000000013, "r": 505.06195, "b": 119.59558000000015, "coord_origin": "TOPLEFT"}, "confidence": 0.8416301012039185, "cells": [{"id": 0, "text": "DocLayNet: A Large Human-Annotated Dataset for", "bbox": {"l": 107.29999999999998, "t": 83.69470000000013, "r": 505.06195, "b": 99.67058999999995, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Document-Layout Analysis", "bbox": {"l": 200.117, "t": 103.6196900000001, "r": 411.88367, "b": 119.59558000000015, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis"}, {"label": "text", "id": 8, "page_no": 0, "cluster": {"id": 8, "label": "text", "bbox": {"l": 90.96701, "t": 133.67236000000003, "r": 193.73123, "b": 180.24030000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.8637146949768066, "cells": [{"id": 2, "text": "Birgit Pfitzmann", "bbox": {"l": 102.06001, "t": 133.67236000000003, "r": 182.63805, "b": 144.83856000000003, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "IBM Research", "bbox": {"l": 114.29401000000001, "t": 147.02423, "r": 170.40337, "b": 156.32928000000004, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Rueschlikon, Switzerland", "bbox": {"l": 90.96701, "t": 158.97924999999998, "r": 193.73123, "b": 168.28430000000003, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "bpf@zurich.ibm.com", "bbox": {"l": 100.02301, "t": 170.93524000000002, "r": 184.67522, "b": 180.24030000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Birgit Pfitzmann IBM Research Rueschlikon, Switzerland bpf@zurich.ibm.com"}, {"label": "text", "id": 9, "page_no": 0, "cluster": {"id": 9, "label": "text", "bbox": {"l": 255.11602999999997, "t": 133.67236000000003, "r": 357.88025, "b": 180.24030000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.8612666726112366, "cells": [{"id": 6, "text": "Christoph Auer", "bbox": {"l": 268.62402, "t": 133.67236000000003, "r": 344.59933, "b": 144.83856000000003, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "IBM Research", "bbox": {"l": 278.44302, "t": 147.02423, "r": 334.55237, "b": 156.32928000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Rueschlikon, Switzerland", "bbox": {"l": 255.11602999999997, "t": 158.97924999999998, "r": 357.88025, "b": 168.28430000000003, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "cau@zurich.ibm.com", "bbox": {"l": 263.70404, "t": 170.93524000000002, "r": 349.29272, "b": 180.24030000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Christoph Auer IBM Research Rueschlikon, Switzerland cau@zurich.ibm.com"}, {"label": "text", "id": 6, "page_no": 0, "cluster": {"id": 6, "label": "text", "bbox": {"l": 419.26505, "t": 133.67236000000003, "r": 522.0293, "b": 180.24030000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.8760607838630676, "cells": [{"id": 10, "text": "Michele Dolfi", "bbox": {"l": 437.6930500000001, "t": 133.67236000000003, "r": 503.60208, "b": 144.83856000000003, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "IBM Research", "bbox": {"l": 442.59305000000006, "t": 147.02423, "r": 498.7023899999999, "b": 156.32928000000004, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Rueschlikon, Switzerland", "bbox": {"l": 419.26505, "t": 158.97924999999998, "r": 522.0293, "b": 168.28430000000003, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "dol@zurich.ibm.com", "bbox": {"l": 428.56104000000005, "t": 170.93524000000002, "r": 512.73505, "b": 180.24030000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Michele Dolfi IBM Research Rueschlikon, Switzerland dol@zurich.ibm.com"}, {"label": "text", "id": 13, "page_no": 0, "cluster": {"id": 13, "label": "text", "bbox": {"l": 172.54303, "t": 192.05737, "r": 275.30725, "b": 238.62531, "coord_origin": "TOPLEFT"}, "confidence": 0.8319916129112244, "cells": [{"id": 14, "text": "Ahmed S. Nassar", "bbox": {"l": 182.26804, "t": 192.05737, "r": 265.39255, "b": 203.22357, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "IBM Research", "bbox": {"l": 195.87103, "t": 205.40923999999995, "r": 251.98038999999997, "b": 214.71429, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Rueschlikon, Switzerland", "bbox": {"l": 172.54303, "t": 217.36425999999994, "r": 275.30725, "b": 226.66931, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "ahn@zurich.ibm.com", "bbox": {"l": 180.52803, "t": 229.32025, "r": 267.3222, "b": 238.62531, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Ahmed S. Nassar IBM Research Rueschlikon, Switzerland ahn@zurich.ibm.com"}, {"label": "text", "id": 15, "page_no": 0, "cluster": {"id": 15, "label": "text", "bbox": {"l": 336.69302, "t": 192.05737, "r": 439.45727999999997, "b": 238.62531, "coord_origin": "TOPLEFT"}, "confidence": 0.8027974367141724, "cells": [{"id": 18, "text": "Peter Staar", "bbox": {"l": 361.52802, "t": 192.05737, "r": 414.84821, "b": 203.22357, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "IBM Research", "bbox": {"l": 360.02002, "t": 205.40923999999995, "r": 416.12939, "b": 214.71429, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Rueschlikon, Switzerland", "bbox": {"l": 336.69302, "t": 217.36425999999994, "r": 439.45727999999997, "b": 226.66931, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "taa@zurich.ibm.com", "bbox": {"l": 346.20703, "t": 229.32025, "r": 429.94269, "b": 238.62531, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Peter Staar IBM Research Rueschlikon, Switzerland taa@zurich.ibm.com"}, {"label": "section_header", "id": 5, "page_no": 0, "cluster": {"id": 5, "label": "section_header", "bbox": {"l": 53.798035, "t": 247.70288000000005, "r": 111.94354, "b": 258.01202, "coord_origin": "TOPLEFT"}, "confidence": 0.8876153826713562, "cells": [{"id": 22, "text": "ABSTRACT", "bbox": {"l": 53.798035, "t": 247.70288000000005, "r": 111.94354, "b": 258.01202, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "ABSTRACT"}, {"label": "text", "id": 0, "page_no": 0, "cluster": {"id": 0, "label": "text", "bbox": {"l": 53.466999, "t": 262.90454, "r": 295.56018, "b": 534.29318, "coord_origin": "TOPLEFT"}, "confidence": 0.9823057055473328, "cells": [{"id": 23, "text": "Accurate document layout analysis is a key requirement for high-", "bbox": {"l": 53.484001, "t": 262.90454, "r": 295.55591, "b": 271.27917, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "quality PDF document conversion. With the recent availability of", "bbox": {"l": 53.79800000000001, "t": 273.86352999999997, "r": 294.04199, "b": 282.23816, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "public, large ground-truth datasets such as PubLayNet and DocBank,", "bbox": {"l": 53.79800000000001, "t": 284.82254, "r": 295.34586, "b": 293.19717, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "deep-learning models have proven to be very effective at layout", "bbox": {"l": 53.79800000000001, "t": 295.78152, "r": 294.04709, "b": 304.15616000000006, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "detection and segmentation. While these datasets are of adequate", "bbox": {"l": 53.79800000000001, "t": 306.74053999999995, "r": 294.04645, "b": 315.11517, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "size to train such models, they severely lack in layout variability", "bbox": {"l": 53.79800000000001, "t": 317.69952, "r": 294.27573, "b": 326.07416, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "since they are sourced from scientific article repositories such as", "bbox": {"l": 53.79800000000001, "t": 328.65854, "r": 294.04712, "b": 337.03317, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "PubMed and arXiv only. Consequently, the accuracy of the layout", "bbox": {"l": 53.79800000000001, "t": 339.61755, "r": 294.0437, "b": 347.99219, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "segmentation drops significantly when these models are applied", "bbox": {"l": 53.79800000000001, "t": 350.57654, "r": 294.04715, "b": 358.95117, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "on more challenging and diverse layouts. In this paper, we present", "bbox": {"l": 53.79800000000001, "t": 361.53455, "r": 294.04364, "b": 369.90918000000005, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "DocLayNet", "bbox": {"l": 53.79800000000001, "t": 372.53839, "r": 92.863388, "b": 380.87714000000005, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": ", a new, publicly available, document-layout annotation", "bbox": {"l": 92.863998, "t": 372.49353, "r": 294.04361, "b": 380.86816, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "dataset in COCO format. It contains 80863 manually annotated", "bbox": {"l": 53.79800000000001, "t": 383.45255, "r": 294.04718, "b": 391.82718, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "pages from diverse data sources to represent a wide variability in", "bbox": {"l": 53.79800000000001, "t": 394.41153, "r": 294.0437, "b": 402.78616, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "layouts. For each PDF page, the layout annotations provide labelled", "bbox": {"l": 53.79800000000001, "t": 405.37054, "r": 294.04535, "b": 413.74518, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "bounding-boxes with a choice of 11 distinct classes. DocLayNet", "bbox": {"l": 53.79800000000001, "t": 416.32953, "r": 294.04715, "b": 424.70416000000006, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "also provides a subset of double- and triple-annotated pages to", "bbox": {"l": 53.79800000000001, "t": 427.28853999999995, "r": 294.04712, "b": 435.66318, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "determine the inter-annotator agreement. In multiple experiments,", "bbox": {"l": 53.79800000000001, "t": 438.24753, "r": 295.03, "b": 446.62216, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "we provide baseline accuracy scores (in mAP) for a set of popular", "bbox": {"l": 53.466999, "t": 449.20654, "r": 294.21616, "b": 457.58118, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "object detection models. We also demonstrate that these models", "bbox": {"l": 53.79800000000001, "t": 460.16553, "r": 294.04712, "b": 468.54016, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "fall approximately 10% behind the inter-annotator agreement. Fur-", "bbox": {"l": 53.79800000000001, "t": 471.12354, "r": 295.56018, "b": 479.49817, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "thermore, we provide evidence that DocLayNet is of sufficient size.", "bbox": {"l": 53.79800000000001, "t": 482.08255, "r": 295.42783, "b": 490.45718, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Lastly, we compare models trained on PubLayNet, DocBank and", "bbox": {"l": 53.79800000000001, "t": 493.04153, "r": 294.04715, "b": 501.41617, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "DocLayNet, showing that layout predictions of the DocLayNet-", "bbox": {"l": 53.79800000000001, "t": 504.00055, "r": 295.55618, "b": 512.37518, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "trained models are more robust and thus the preferred choice for", "bbox": {"l": 53.79800000000001, "t": 514.95953, "r": 294.21643, "b": 523.33417, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "general-purpose document-layout analysis.", "bbox": {"l": 53.79800000000001, "t": 525.91855, "r": 212.05495, "b": 534.29318, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Accurate document layout analysis is a key requirement for highquality PDF document conversion. With the recent availability of public, large ground-truth datasets such as PubLayNet and DocBank, deep-learning models have proven to be very effective at layout detection and segmentation. While these datasets are of adequate size to train such models, they severely lack in layout variability since they are sourced from scientific article repositories such as PubMed and arXiv only. Consequently, the accuracy of the layout segmentation drops significantly when these models are applied on more challenging and diverse layouts. In this paper, we present DocLayNet , a new, publicly available, document-layout annotation dataset in COCO format. It contains 80863 manually annotated pages from diverse data sources to represent a wide variability in layouts. For each PDF page, the layout annotations provide labelled bounding-boxes with a choice of 11 distinct classes. DocLayNet also provides a subset of double- and triple-annotated pages to determine the inter-annotator agreement. In multiple experiments, we provide baseline accuracy scores (in mAP) for a set of popular object detection models. We also demonstrate that these models fall approximately 10% behind the inter-annotator agreement. Furthermore, we provide evidence that DocLayNet is of sufficient size. Lastly, we compare models trained on PubLayNet, DocBank and DocLayNet, showing that layout predictions of the DocLayNettrained models are more robust and thus the preferred choice for general-purpose document-layout analysis."}, {"label": "section_header", "id": 4, "page_no": 0, "cluster": {"id": 4, "label": "section_header", "bbox": {"l": 53.79800000000001, "t": 550.99692, "r": 134.81989, "b": 561.30602, "coord_origin": "TOPLEFT"}, "confidence": 0.9149599671363831, "cells": [{"id": 49, "text": "CCS CONCEPTS", "bbox": {"l": 53.79800000000001, "t": 550.99692, "r": 134.81989, "b": 561.30602, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "CCS CONCEPTS"}, {"label": "text", "id": 11, "page_no": 0, "cluster": {"id": 11, "label": "text", "bbox": {"l": 53.797989, "t": 566.08299, "r": 297.85294, "b": 596.50114, "coord_origin": "TOPLEFT"}, "confidence": 0.8458832502365112, "cells": [{"id": 50, "text": "\u2022", "bbox": {"l": 53.79800000000001, "t": 566.19957, "r": 56.945206000000006, "b": 574.57419, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Information systems", "bbox": {"l": 58.440002, "t": 566.0830100000001, "r": 142.4462, "b": 574.5562600000001, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "\u2192", "bbox": {"l": 143.938, "t": 566.36096, "r": 153.15099, "b": 574.43073, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Document structure", "bbox": {"l": 154.646, "t": 566.0830100000001, "r": 235.46015999999997, "b": 574.5562600000001, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "; \u2022", "bbox": {"l": 235.45700000000002, "t": 566.19955, "r": 242.17419, "b": 574.57417, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "Applied com-", "bbox": {"l": 243.66899, "t": 566.08299, "r": 297.85294, "b": 574.55624, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "puting", "bbox": {"l": 53.797989, "t": 577.0419899999999, "r": 80.661324, "b": 585.51524, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "\u2192", "bbox": {"l": 83.565987, "t": 577.3199500000001, "r": 92.778961, "b": 585.38971, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Document analysis", "bbox": {"l": 95.68399, "t": 577.0419899999999, "r": 173.91583, "b": 585.51524, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "; \u2022", "bbox": {"l": 173.916, "t": 577.15855, "r": 182.1272, "b": 585.53317, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Computing methodologies", "bbox": {"l": 185.032, "t": 577.0419899999999, "r": 294.0455, "b": 585.51524, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "\u2192", "bbox": {"l": 53.79800399999999, "t": 588.27895, "r": 63.01097899999999, "b": 596.34871, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "Machine learning", "bbox": {"l": 65.253006, "t": 588.00099, "r": 136.80487, "b": 596.47424, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": ";", "bbox": {"l": 136.80501, "t": 588.1175499999999, "r": 138.92108, "b": 596.49217, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "Computer vision", "bbox": {"l": 141.162, "t": 588.00099, "r": 209.60254, "b": 596.47424, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": ";", "bbox": {"l": 209.60201, "t": 588.1175499999999, "r": 211.71808, "b": 596.49217, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "Object detection", "bbox": {"l": 213.96001, "t": 588.16238, "r": 270.45728, "b": 596.50114, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": ";", "bbox": {"l": 270.48001, "t": 588.1175499999999, "r": 272.59607, "b": 596.49217, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u2022 Information systems \u2192 Document structure ; \u2022 Applied computing \u2192 Document analysis ; \u2022 Computing methodologies \u2192 Machine learning ; Computer vision ; Object detection ;"}, {"label": "text", "id": 17, "page_no": 0, "cluster": {"id": 17, "label": "text", "bbox": {"l": 53.79800000000001, "t": 634.39838, "r": 295.11798, "b": 672.79189, "coord_origin": "TOPLEFT"}, "confidence": 0.7107343673706055, "cells": [{"id": 68, "text": "Permission to make digital or hard copies of part or all of this work for personal or", "bbox": {"l": 53.79800000000001, "t": 634.39838, "r": 294.17697, "b": 640.9119000000001, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "classroom use is granted without fee provided that copies are not made or distributed", "bbox": {"l": 53.79800000000001, "t": 642.36838, "r": 294.04443, "b": 648.8819, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "for profit or commercial advantage and that copies bear this notice and the full citation", "bbox": {"l": 53.79800000000001, "t": 650.33838, "r": 294.04498, "b": 656.8519, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "on the first page. Copyrights for third-party components of this work must be honored.", "bbox": {"l": 53.79800000000001, "t": 658.3083799999999, "r": 295.11798, "b": 664.8219, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "For all other uses, contact the owner/author(s).", "bbox": {"l": 53.79800000000001, "t": 666.27837, "r": 187.72285, "b": 672.79189, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Permission to make digital or hard copies of part or all of this work for personal or classroom use is granted without fee provided that copies are not made or distributed for profit or commercial advantage and that copies bear this notice and the full citation on the first page. Copyrights for third-party components of this work must be honored. For all other uses, contact the owner/author(s)."}, {"label": "text", "id": 29, "page_no": 0, "cluster": {"id": 29, "label": "text", "bbox": {"l": 53.79800000000001, "t": 675.08023, "r": 197.86275, "b": 681.56586, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 53.79800000000001, "t": 675.08023, "r": 197.86275, "b": 681.56586, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA"}, {"label": "text", "id": 30, "page_no": 0, "cluster": {"id": 30, "label": "text", "bbox": {"l": 53.317001, "t": 683.81236, "r": 186.74652, "b": 690.32589, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "\u00a9 2022 Copyright held by the owner/author(s).", "bbox": {"l": 53.317001, "t": 683.81236, "r": 186.74652, "b": 690.32589, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u00a9 2022 Copyright held by the owner/author(s)."}, {"label": "text", "id": 31, "page_no": 0, "cluster": {"id": 31, "label": "text", "bbox": {"l": 53.554001, "t": 691.78336, "r": 157.03125, "b": 698.29689, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "ACM ISBN 978-1-4503-9385-0/22/08.", "bbox": {"l": 53.554001, "t": 691.78336, "r": 157.03125, "b": 698.29689, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "ACM ISBN 978-1-4503-9385-0/22/08."}, {"label": "text", "id": 27, "page_no": 0, "cluster": {"id": 27, "label": "text", "bbox": {"l": 53.79800000000001, "t": 699.753365, "r": 166.94093, "b": 706.266891, "coord_origin": "TOPLEFT"}, "confidence": 0.5095879435539246, "cells": [{"id": 76, "text": "https://doi.org/10.1145/3534678.3539043", "bbox": {"l": 53.79800000000001, "t": 699.753365, "r": 166.94093, "b": 706.266891, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "https://doi.org/10.1145/3534678.3539043"}, {"label": "picture", "id": 20, "page_no": 0, "cluster": {"id": 20, "label": "picture", "bbox": {"l": 323.408203125, "t": 250.34873962402344, "r": 553.2952270507812, "b": 525.8507080078125, "coord_origin": "TOPLEFT"}, "confidence": 0.5910214781761169, "cells": [{"id": 77, "text": "13", "bbox": {"l": 327.86951, "t": 351.78085, "r": 330.41248, "b": 353.95465, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "USING THE VERTICAL TUBE -", "bbox": {"l": 327.83005, "t": 331.57268999999997, "r": 351.16092, "b": 333.31171, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "MODELS AY11230/11234", "bbox": {"l": 327.83005, "t": 333.18292, "r": 348.30536, "b": 334.92194, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "1.", "bbox": {"l": 327.83005, "t": 336.40439, "r": 329.05914, "b": 337.92606, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "The vertical tube can be used for", "bbox": {"l": 329.67368, "t": 336.40439, "r": 349.95349, "b": 337.92606, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "instructional viewing or to photograph", "bbox": {"l": 329.11752, "t": 337.83588, "r": 353.57977, "b": 339.35751000000005, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": " the image with a digital camera or a", "bbox": {"l": 327.77121, "t": 339.26736, "r": 352.4306, "b": 340.789, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": " micro TV unit", "bbox": {"l": 328.15176, "t": 340.69882, "r": 337.91086, "b": 342.22049, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "2.", "bbox": {"l": 327.8313, "t": 342.19043000000005, "r": 329.09155, "b": 343.71207, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Loosen the retention screw, then rotate ", "bbox": {"l": 329.72168, "t": 342.19043000000005, "r": 354.9267, "b": 343.71207, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": " the adjustment ring to change the ", "bbox": {"l": 327.8313, "t": 343.62192, "r": 351.66949, "b": 345.14355, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": " length of the vertical tube.", "bbox": {"l": 328.21185, "t": 345.05338, "r": 346.33179, "b": 346.57504, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "3.", "bbox": {"l": 327.83005, "t": 346.84680000000003, "r": 329.12726, "b": 348.36847, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "Make sure that both the images in", "bbox": {"l": 329.77588, "t": 346.84680000000003, "r": 351.18005, "b": 348.36847, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "OPERATION ", "bbox": {"l": 327.25311, "t": 254.94812000000002, "r": 350.07861, "b": 258.86096, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "(", "bbox": {"l": 350.07861, "t": 254.76782000000003, "r": 351.82651, "b": 258.68066, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "cont.", "bbox": {"l": 351.82651, "t": 254.94812000000002, "r": 360.85242, "b": 258.86096, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": ")", "bbox": {"l": 360.85242, "t": 254.76782000000003, "r": 362.60028, "b": 258.68066, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "SELECTING OBJECTIVE ", "bbox": {"l": 326.88037, "t": 263.49492999999995, "r": 345.84351, "b": 265.23395000000005, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "MAGNIFICATION", "bbox": {"l": 326.88037, "t": 265.10515999999996, "r": 340.54153, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "1.", "bbox": {"l": 326.88037, "t": 266.71533, "r": 328.31903, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "There are two objectives. The lower", "bbox": {"l": 329.03836, "t": 266.71533, "r": 354.21472, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": " magnification objective has a greater", "bbox": {"l": 326.88037, "t": 268.32556, "r": 355.19193, "b": 270.06458, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": " depth of field and view.", "bbox": {"l": 326.88037, "t": 269.93579, "r": 345.80057, "b": 271.6748, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "2.", "bbox": {"l": 326.88037, "t": 271.54602, "r": 328.33862, "b": 273.28503, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "In order to observe the specimen", "bbox": {"l": 329.06775, "t": 271.54602, "r": 352.39969, "b": 273.28503, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": " easily use the lower magnification", "bbox": {"l": 326.88037, "t": 273.15619000000004, "r": 352.90042, "b": 274.89526, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": " objective first. Then, by rotating the", "bbox": {"l": 326.88037, "t": 274.76642000000004, "r": 354.59546, "b": 276.50543000000005, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": " case, the magnification can be", "bbox": {"l": 326.88037, "t": 276.37665000000004, "r": 350.81885, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": " changed.", "bbox": {"l": 326.88037, "t": 277.98688000000004, "r": 335.46707, "b": 279.72589000000005, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "CHANGING THE INTERPUPILLARY ", "bbox": {"l": 326.88037, "t": 281.20728, "r": 354.57755, "b": 282.94632, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "DISTANCE", "bbox": {"l": 326.88037, "t": 282.81750000000005, "r": 335.1752, "b": 284.55652, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "1.", "bbox": {"l": 326.88037, "t": 284.4277, "r": 328.34784, "b": 286.16675, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "The distance between the observer's", "bbox": {"l": 329.08157, "t": 284.4277, "r": 354.76245, "b": 286.16675, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": " pupils is the interpupillary distance.", "bbox": {"l": 326.88037, "t": 286.03793, "r": 354.6499, "b": 287.77695, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "2.", "bbox": {"l": 326.88037, "t": 287.64813, "r": 328.25125, "b": 289.38718, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "To adjust the interpupillary distance", "bbox": {"l": 328.93671, "t": 287.64813, "r": 354.29825, "b": 289.38718, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": " rotate the prism caps until both eyes", "bbox": {"l": 326.88181, "t": 289.25836, "r": 355.02075, "b": 290.99738, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": " coincide with the image in the", "bbox": {"l": 326.88181, "t": 290.86855999999995, "r": 350.82028, "b": 292.6076, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": " eyepiece. ", "bbox": {"l": 326.88181, "t": 292.47879, "r": 336.2067, "b": 294.2178, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "FOCUSING", "bbox": {"l": 326.88181, "t": 295.69922, "r": 335.3941, "b": 297.43823, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "1.", "bbox": {"l": 326.88181, "t": 297.30942, "r": 328.34314, "b": 299.04846, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "Remove the lens protective cover.", "bbox": {"l": 329.07379, "t": 297.30942, "r": 353.18555, "b": 299.04846, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "2.", "bbox": {"l": 326.88324, "t": 298.91965, "r": 328.35919, "b": 300.65866, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "Place the specimen on the working", "bbox": {"l": 329.0972, "t": 298.91965, "r": 353.45065, "b": 300.65866, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": " stage.", "bbox": {"l": 326.88324, "t": 300.52985, "r": 333.32825, "b": 302.26889000000006, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "3.", "bbox": {"l": 326.88324, "t": 302.14008000000007, "r": 328.31296, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "Focus the specimen with the left eye", "bbox": {"l": 329.02783, "t": 302.14008000000007, "r": 354.76303, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": " first while turning the focus knob until", "bbox": {"l": 326.88324, "t": 303.75027, "r": 355.96307, "b": 305.48932, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": " the image appears clear and sharp.", "bbox": {"l": 326.88324, "t": 305.3605, "r": 354.46594, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "4.", "bbox": {"l": 326.88324, "t": 306.9707, "r": 328.25488, "b": 308.70975, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "Rotate the right eyepiece ring until the", "bbox": {"l": 328.9407, "t": 306.9707, "r": 356.37335, "b": 308.70975, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": " images in each eyepiece coincide and", "bbox": {"l": 326.88324, "t": 308.58093, "r": 355.38867, "b": 310.31995, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": " are sharp and clear.", "bbox": {"l": 326.88324, "t": 310.19113, "r": 343.17249, "b": 311.93018, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "CHANGING THE BULB", "bbox": {"l": 326.88324, "t": 313.41156, "r": 344.13388, "b": 315.15059999999994, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "1.", "bbox": {"l": 326.88324, "t": 315.02178999999995, "r": 328.37418, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "Disconnect the power cord.", "bbox": {"l": 329.11963, "t": 315.02178999999995, "r": 348.50162, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "2.", "bbox": {"l": 326.88324, "t": 316.63199, "r": 328.34061, "b": 318.37103, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "When the bulb is cool, remove the", "bbox": {"l": 329.06931, "t": 316.63199, "r": 353.11588, "b": 318.37103, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": " oblique illuminator cap and remove", "bbox": {"l": 326.88464, "t": 318.2422199999999, "r": 353.79517, "b": 319.9812299999999, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": " the halogen bulb with cap.", "bbox": {"l": 326.88464, "t": 319.85242000000005, "r": 348.02094, "b": 321.59146, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "3.", "bbox": {"l": 326.88464, "t": 321.46265, "r": 328.37512, "b": 323.20166, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "Replace with a new halogen bulb.", "bbox": {"l": 329.12036, "t": 321.46265, "r": 352.96808, "b": 323.20166, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "4.", "bbox": {"l": 326.88608, "t": 323.07285, "r": 328.36884, "b": 324.81189, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "Open the window in the base plate and", "bbox": {"l": 329.1102, "t": 323.07285, "r": 356.5412, "b": 324.81189, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": " replace the halogen lamp or ", "bbox": {"l": 326.88608, "t": 324.68307000000004, "r": 350.13828, "b": 326.42209, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": " fluorescent lamp of transmitted", "bbox": {"l": 326.88608, "t": 326.29327, "r": 351.59677, "b": 328.03232, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": " illuminator.", "bbox": {"l": 326.88608, "t": 327.9035, "r": 336.89197, "b": 329.64252, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "FOCUSING", "bbox": {"l": 358.42023, "t": 263.49492999999995, "r": 366.93256, "b": 265.23395000000005, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "1.", "bbox": {"l": 358.42023, "t": 265.10515999999996, "r": 359.89841, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "Turn the focusing knob away or toward", "bbox": {"l": 360.63751, "t": 265.10515999999996, "r": 387.98407, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": " you until a clear image is viewed.", "bbox": {"l": 358.42023, "t": 266.71533, "r": 384.58948, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "2.", "bbox": {"l": 358.42166, "t": 268.32556, "r": 359.78549, "b": 270.06458, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "If the image is unclear, adjust the", "bbox": {"l": 360.46741, "t": 268.32556, "r": 384.33441, "b": 270.06458, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": " height of the elevator up or down,", "bbox": {"l": 358.4231, "t": 269.93579, "r": 384.61502, "b": 271.6748, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": " then turn the focusing knob again.", "bbox": {"l": 358.4231, "t": 271.54602, "r": 385.38922, "b": 273.28503, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "ZOOM MAGNIFICATION", "bbox": {"l": 358.4231, "t": 274.76642000000004, "r": 377.35046, "b": 276.50543000000005, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "1.", "bbox": {"l": 358.4231, "t": 276.37665000000004, "r": 359.89429, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "Turn the zoom magnification knob to", "bbox": {"l": 360.62988, "t": 276.37665000000004, "r": 386.37589, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": " the desired magnification and field of", "bbox": {"l": 358.4231, "t": 277.98688000000004, "r": 386.78732, "b": 279.72589000000005, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": " view.", "bbox": {"l": 358.4231, "t": 279.59704999999997, "r": 364.16855, "b": 281.33609, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "2.", "bbox": {"l": 358.4231, "t": 281.20728, "r": 359.86777, "b": 282.94632, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "In most situations, it is recommended", "bbox": {"l": 360.59012, "t": 281.20728, "r": 387.31656, "b": 282.94632, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": " that you focus at the lowest ", "bbox": {"l": 358.4231, "t": 282.81750000000005, "r": 381.56656, "b": 284.55652, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": " magnification, then move to a higher", "bbox": {"l": 358.4231, "t": 284.4277, "r": 386.63403, "b": 286.16675, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": " magnification and re-focus as ", "bbox": {"l": 358.42453, "t": 286.03793, "r": 382.77115, "b": 287.77695, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": " necessary.", "bbox": {"l": 358.42453, "t": 287.64813, "r": 367.98694, "b": 289.38718, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "3.", "bbox": {"l": 358.42453, "t": 289.25836, "r": 359.80386, "b": 290.99738, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "If the image is not clear to both eyes", "bbox": {"l": 360.49353, "t": 289.25836, "r": 386.70093, "b": 290.99738, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": " at the same time, the diopter ring may", "bbox": {"l": 358.42453, "t": 290.86855999999995, "r": 388.03534, "b": 292.6076, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": " need adjustment.", "bbox": {"l": 358.42453, "t": 292.47879, "r": 373.13724, "b": 294.2178, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "DIOPTER RING ADJUSTMENT", "bbox": {"l": 358.42453, "t": 295.69922, "r": 381.74539, "b": 297.43823, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "1.", "bbox": {"l": 358.42453, "t": 297.30942, "r": 359.83682, "b": 299.04846, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "To adjust the eyepiece for viewing with", "bbox": {"l": 360.54297, "t": 297.30942, "r": 388.08289, "b": 299.04846, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": " or without eyeglasses and for ", "bbox": {"l": 358.42453, "t": 298.91965, "r": 382.73251, "b": 300.65866, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": " differences in acuity between the right", "bbox": {"l": 358.42453, "t": 300.52985, "r": 387.72266, "b": 302.26889000000006, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": " and left eyes, follow the following", "bbox": {"l": 358.42453, "t": 302.14008000000007, "r": 384.1991, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": " steps:", "bbox": {"l": 358.42453, "t": 303.75027, "r": 364.88672, "b": 305.48932, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "a.", "bbox": {"l": 358.42453, "t": 305.3605, "r": 359.95078, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "Observe an image through the left", "bbox": {"l": 361.47699, "t": 305.3605, "r": 386.65988, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": " eyepiece and bring a specific point", "bbox": {"l": 358.42453, "t": 306.9707, "r": 386.7634, "b": 308.70975, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": " into focus using the focus knob.", "bbox": {"l": 358.42453, "t": 308.58093, "r": 385.41354, "b": 310.31995, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "b.", "bbox": {"l": 358.42453, "t": 310.19113, "r": 359.93304, "b": 311.93018, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "By turning the diopter ring ", "bbox": {"l": 361.44156, "t": 310.19113, "r": 382.56085, "b": 311.93018, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": " adjustment for the left eyepiece,", "bbox": {"l": 358.42596, "t": 311.80136, "r": 385.4559, "b": 313.54037, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": " bring the same point into sharp", "bbox": {"l": 358.42596, "t": 313.41156, "r": 384.56122, "b": 315.15059999999994, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": " focus.", "bbox": {"l": 358.42596, "t": 315.02178999999995, "r": 366.74371, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": " c.Then bring the same point into", "bbox": {"l": 358.42596, "t": 316.63199, "r": 383.93884, "b": 318.37103, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": " focus through the right eyepiece", "bbox": {"l": 358.42596, "t": 318.2422199999999, "r": 385.69241, "b": 319.9812299999999, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": " by turning the right diopter ring.", "bbox": {"l": 358.42596, "t": 319.85242000000005, "r": 385.94861, "b": 321.59146, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": " d.With more than one viewer, each", "bbox": {"l": 358.42596, "t": 321.46265, "r": 385.54236, "b": 323.20166, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": " viewer should note their own", "bbox": {"l": 358.42596, "t": 323.07285, "r": 382.98718, "b": 324.81189, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": " diopter ring position for the left", "bbox": {"l": 358.42596, "t": 324.68307000000004, "r": 385.06448, "b": 326.42209, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": " and right eyepieces, then before", "bbox": {"l": 358.42596, "t": 326.29327, "r": 385.20682, "b": 328.03232, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": " viewing set the diopter ring", "bbox": {"l": 358.42596, "t": 327.9035, "r": 382.21964, "b": 329.64252, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": " adjustments to that setting.", "bbox": {"l": 358.42596, "t": 329.5137, "r": 382.63382, "b": 331.25275, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "CHANGING THE BULB", "bbox": {"l": 358.42596, "t": 332.73412999999994, "r": 375.67661, "b": 334.47317999999996, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "1.", "bbox": {"l": 358.42596, "t": 334.34436, "r": 359.90311, "b": 336.08337, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "Disconnect the power cord from the", "bbox": {"l": 360.64169, "t": 334.34436, "r": 385.75333, "b": 336.08337, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": " electrical outlet.", "bbox": {"l": 358.42596, "t": 335.95456, "r": 372.01416, "b": 337.6936, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "2.", "bbox": {"l": 358.42596, "t": 337.56479, "r": 359.88327, "b": 339.3038, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "When the bulb is cool, remove the", "bbox": {"l": 360.61191, "t": 337.56479, "r": 384.65726, "b": 339.3038, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": " oblique illuminator cap and remove", "bbox": {"l": 358.42596, "t": 339.17499, "r": 385.33649, "b": 340.9140300000001, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": " the halogen bulb with cap.", "bbox": {"l": 358.42596, "t": 340.78522, "r": 379.57224, "b": 342.52423, "coord_origin": "TOPLEFT"}}, {"id": 201, "text": "3.", "bbox": {"l": 358.4274, "t": 342.39542, "r": 359.91788, "b": 344.13446000000005, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": "Replace with a new halogen bulb.", "bbox": {"l": 360.66312, "t": 342.39542, "r": 384.5108, "b": 344.13446000000005, "coord_origin": "TOPLEFT"}}, {"id": 203, "text": "4.", "bbox": {"l": 358.42883, "t": 344.00565000000006, "r": 359.92792, "b": 345.74466, "coord_origin": "TOPLEFT"}}, {"id": 204, "text": "Open the window in the base plate", "bbox": {"l": 360.67746, "t": 344.00565000000006, "r": 385.41235, "b": 345.74466, "coord_origin": "TOPLEFT"}}, {"id": 205, "text": " and replace the halogen lamp or", "bbox": {"l": 358.42883, "t": 345.61584, "r": 383.2782, "b": 347.35489, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": " fluorescent lamp of transmitted", "bbox": {"l": 358.42883, "t": 347.22607, "r": 383.13953, "b": 348.96509, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": " illuminator.", "bbox": {"l": 358.42883, "t": 348.83627, "r": 368.43472, "b": 350.57532, "coord_origin": "TOPLEFT"}}, {"id": 208, "text": "Model AY11230", "bbox": {"l": 326.59567, "t": 261.14185, "r": 339.11377, "b": 262.88091999999995, "coord_origin": "TOPLEFT"}}, {"id": 209, "text": "Model AY11234", "bbox": {"l": 358.48605, "t": 261.14185, "r": 371.00415, "b": 262.88091999999995, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": "14", "bbox": {"l": 455.43533, "t": 351.77038999999996, "r": 457.97827000000007, "b": 353.94415, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "Objectives", "bbox": {"l": 408.24518, "t": 275.52673000000004, "r": 414.4234, "b": 276.96020999999996, "coord_origin": "TOPLEFT"}}, {"id": 212, "text": "Revolving Turret", "bbox": {"l": 409.39554, "t": 268.98235999999997, "r": 419.06677, "b": 270.41583, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "Coarse ", "bbox": {"l": 441.3895, "t": 279.12627999999995, "r": 445.87192, "b": 280.55975, "coord_origin": "TOPLEFT"}}, {"id": 214, "text": "Adjustment", "bbox": {"l": 441.3895, "t": 280.30609, "r": 448.22338999999994, "b": 281.7395900000001, "coord_origin": "TOPLEFT"}}, {"id": 215, "text": "Knob", "bbox": {"l": 441.3895, "t": 281.48593, "r": 444.40371999999996, "b": 282.91939999999994, "coord_origin": "TOPLEFT"}}, {"id": 216, "text": "MODEL AY11236", "bbox": {"l": 398.79288, "t": 254.94646999999998, "r": 428.91568, "b": 258.85931000000005, "coord_origin": "TOPLEFT"}}, {"id": 217, "text": "MICROSCOPE USAGE", "bbox": {"l": 398.32535, "t": 305.04291, "r": 435.93542, "b": 308.95572000000004, "coord_origin": "TOPLEFT"}}, {"id": 218, "text": "BARSKA Model AY11236 is a powerful fixed power compound ", "bbox": {"l": 398.08594, "t": 310.35892, "r": 453.72171, "b": 312.53271, "coord_origin": "TOPLEFT"}}, {"id": 219, "text": "microscope designed for biological studies such as specimen ", "bbox": {"l": 398.08594, "t": 312.50586, "r": 453.09939999999995, "b": 314.67966, "coord_origin": "TOPLEFT"}}, {"id": 220, "text": "examination. It can also be used for examining bacteria and", "bbox": {"l": 398.08594, "t": 314.6528, "r": 456.65246999999994, "b": 316.8266, "coord_origin": "TOPLEFT"}}, {"id": 221, "text": "for general clinical and medical studies and other scientific uses. ", "bbox": {"l": 398.08594, "t": 316.79977, "r": 456.73859000000004, "b": 318.97354, "coord_origin": "TOPLEFT"}}, {"id": 222, "text": "CONSTRUCTION", "bbox": {"l": 398.62399, "t": 320.42941, "r": 427.77472, "b": 324.34222000000005, "coord_origin": "TOPLEFT"}}, {"id": 223, "text": "BARSKA Model AY11236 is a fixed power compound microscope.", "bbox": {"l": 398.08594, "t": 326.46069000000006, "r": 456.02639999999997, "b": 328.63449, "coord_origin": "TOPLEFT"}}, {"id": 224, "text": "It is constructed with two optical paths at the same angle. It is ", "bbox": {"l": 398.08414, "t": 328.6076699999999, "r": 455.42238999999995, "b": 330.7814599999999, "coord_origin": "TOPLEFT"}}, {"id": 225, "text": "equipped with transmitted illumination. By using this instrument, ", "bbox": {"l": 398.08414, "t": 330.75461, "r": 457.39844, "b": 332.92841, "coord_origin": "TOPLEFT"}}, {"id": 226, "text": "the user can observe specimens at magnification from 40x to ", "bbox": {"l": 398.08414, "t": 332.90155, "r": 453.97745, "b": 335.07535000000007, "coord_origin": "TOPLEFT"}}, {"id": 227, "text": "1000x by selecting the desired objective lens. Coarse and fine ", "bbox": {"l": 398.08414, "t": 335.04852, "r": 454.70708999999994, "b": 337.22232, "coord_origin": "TOPLEFT"}}, {"id": 228, "text": "focus adjustments provide accuracy and image detail. The rotating ", "bbox": {"l": 398.08414, "t": 337.19547, "r": 458.90240000000006, "b": 339.36926, "coord_origin": "TOPLEFT"}}, {"id": 229, "text": "head allows the user to position the eyepieces for maximum ", "bbox": {"l": 398.08594, "t": 339.34241, "r": 453.0672, "b": 341.5162, "coord_origin": "TOPLEFT"}}, {"id": 230, "text": "viewing comfort and easy access to all adjustment knobs.", "bbox": {"l": 398.08594, "t": 341.48938, "r": 449.63113, "b": 343.66318, "coord_origin": "TOPLEFT"}}, {"id": 231, "text": "Model AY11236", "bbox": {"l": 422.10626, "t": 301.24191, "r": 434.62433000000004, "b": 302.98096, "coord_origin": "TOPLEFT"}}, {"id": 232, "text": "Fine ", "bbox": {"l": 442.01610999999997, "t": 283.08649, "r": 444.8817399999999, "b": 284.51996, "coord_origin": "TOPLEFT"}}, {"id": 233, "text": "Adjustment", "bbox": {"l": 442.01610999999997, "t": 284.2663, "r": 448.85001, "b": 285.69980000000004, "coord_origin": "TOPLEFT"}}, {"id": 234, "text": "Knob", "bbox": {"l": 442.01610999999997, "t": 285.44611, "r": 445.03033000000005, "b": 286.87961, "coord_origin": "TOPLEFT"}}, {"id": 235, "text": "Stage", "bbox": {"l": 408.00577, "t": 279.12579000000005, "r": 411.42212, "b": 280.5593, "coord_origin": "TOPLEFT"}}, {"id": 236, "text": "Condenser ", "bbox": {"l": 404.07172, "t": 280.9144299999999, "r": 410.77707, "b": 282.3479, "coord_origin": "TOPLEFT"}}, {"id": 237, "text": "Focusing", "bbox": {"l": 404.07172, "t": 282.09424, "r": 409.2157, "b": 283.52774, "coord_origin": "TOPLEFT"}}, {"id": 238, "text": "Knob", "bbox": {"l": 404.07172, "t": 283.27408, "r": 407.08594, "b": 284.7075500000001, "coord_origin": "TOPLEFT"}}, {"id": 239, "text": "Eyepiece", "bbox": {"l": 441.81281, "t": 262.32178, "r": 447.03702, "b": 263.75525000000005, "coord_origin": "TOPLEFT"}}, {"id": 240, "text": "Stand", "bbox": {"l": 437.34607, "t": 271.13025000000005, "r": 440.80496, "b": 272.56281, "coord_origin": "TOPLEFT"}}, {"id": 241, "text": "Lamp ", "bbox": {"l": 409.7164, "t": 284.40027, "r": 413.3768, "b": 285.83282, "coord_origin": "TOPLEFT"}}, {"id": 242, "text": "On/Off", "bbox": {"l": 409.7164, "t": 285.83163, "r": 413.68201, "b": 287.26416, "coord_origin": "TOPLEFT"}}, {"id": 243, "text": "Switch", "bbox": {"l": 409.7164, "t": 287.263, "r": 413.6337, "b": 288.69553, "coord_origin": "TOPLEFT"}}, {"id": 244, "text": "Lamp ", "bbox": {"l": 434.8712499999999, "t": 296.7153, "r": 438.53164999999996, "b": 298.14783, "coord_origin": "TOPLEFT"}}, {"id": 245, "text": "Power", "bbox": {"l": 439.52039, "t": 292.18307000000004, "r": 443.08768, "b": 293.61560000000003, "coord_origin": "TOPLEFT"}}, {"id": 246, "text": "Cord", "bbox": {"l": 439.52039, "t": 293.61444, "r": 442.29575, "b": 295.04697, "coord_origin": "TOPLEFT"}}, {"id": 247, "text": "Rotating Head", "bbox": {"l": 413.55829, "t": 264.66089, "r": 421.94913, "b": 266.09344, "coord_origin": "TOPLEFT"}}, {"id": 248, "text": "Stage Clip", "bbox": {"l": 441.84316999999993, "t": 286.90573, "r": 447.87585000000007, "b": 288.33826, "coord_origin": "TOPLEFT"}}, {"id": 249, "text": "Adjustment", "bbox": {"l": 441.84316999999993, "t": 288.3371, "r": 448.67252, "b": 289.76962000000003, "coord_origin": "TOPLEFT"}}, {"id": 250, "text": "Interpupillary Slide Adjustment", "bbox": {"l": 407.2403, "t": 259.86645999999996, "r": 425.79089, "b": 261.29895, "coord_origin": "TOPLEFT"}}, {"id": 251, "text": "Circling Minimums", "bbox": {"l": 449.10074000000003, "t": 378.66302, "r": 466.08835000000005, "b": 380.78412, "coord_origin": "TOPLEFT"}}, {"id": 252, "text": "7", "bbox": {"l": 449.10074000000003, "t": 383.2203999999999, "r": 449.64444, "b": 385.34148999999996, "coord_origin": "TOPLEFT"}}, {"id": 253, "text": "K H U H Z D V D F K D Q J H W R W K H 7 ( 5 3 6 F U L W H U L D L Q W K D W D \u1087H F W V F L U F O L Q J D U H D G L P H Q V L R Q E \\ H [ S D Q G L Q J W K H D U H D V W R S U R Y L G H ", "bbox": {"l": 450.18811, "t": 383.2203999999999, "r": 550.77124, "b": 385.34148999999996, "coord_origin": "TOPLEFT"}}, {"id": 254, "text": "improved obstacle protection. To indicate that the new criteria had been applied to a given procedure, a ", "bbox": {"l": 449.10074000000003, "t": 385.75732, "r": 536.14716, "b": 387.87842, "coord_origin": "TOPLEFT"}}, {"id": 255, "text": " is placed on ", "bbox": {"l": 538.31085, "t": 385.75732, "r": 549.49921, "b": 387.87842, "coord_origin": "TOPLEFT"}}, {"id": 256, "text": "the circling line of minimums. The new circling tables and explanatory information is located in the Legend of the TPP.", "bbox": {"l": 449.10074000000003, "t": 388.03601, "r": 547.58185, "b": 390.1571, "coord_origin": "TOPLEFT"}}, {"id": 257, "text": "7", "bbox": {"l": 449.10074000000003, "t": 393.2128000000001, "r": 449.6163, "b": 395.33386, "coord_origin": "TOPLEFT"}}, {"id": 258, "text": "K H D S S U R D F K H V X V L Q J V W D Q G D U G F L U F O L Q J D S S U R D F K D U H D V F D Q E H L G H Q W L \u00bf H G E \\ W K H D E V H Q F H R I W K H ", "bbox": {"l": 450.1319, "t": 393.2128000000001, "r": 529.53082, "b": 395.33386, "coord_origin": "TOPLEFT"}}, {"id": 259, "text": " on the circling line of ", "bbox": {"l": 532.05829, "t": 393.2128000000001, "r": 550.42261, "b": 395.33386, "coord_origin": "TOPLEFT"}}, {"id": 260, "text": "minima.", "bbox": {"l": 449.10074000000003, "t": 395.49149, "r": 455.74692, "b": 397.61255, "coord_origin": "TOPLEFT"}}, {"id": 261, "text": "$ S S O \\ 6 W D Q G D U G & L U F O L Q J $ S S U R D F K 0 D Q H X Y H U L Q J 5 D G L X V 7 D E O H ", "bbox": {"l": 449.95525999999995, "t": 415.59549, "r": 496.2829, "b": 417.50446, "coord_origin": "TOPLEFT"}}, {"id": 262, "text": "$ S S O \\ ( [ S D Q G H G & L U F O L Q J $ S S U R D F K 0 D Q H X Y H U L Q J $ L U V S D F H 5 D G L X V ", "bbox": {"l": 501.13077, "t": 409.25543, "r": 551.16101, "b": 411.1644, "coord_origin": "TOPLEFT"}}, {"id": 263, "text": "Table", "bbox": {"l": 501.13077, "t": 411.30624, "r": 505.2477999999999, "b": 413.21521, "coord_origin": "TOPLEFT"}}, {"id": 264, "text": "AIRPORT SKETCH", "bbox": {"l": 449.10074000000003, "t": 420.18802, "r": 469.35599, "b": 422.73331, "coord_origin": "TOPLEFT"}}, {"id": 265, "text": "The airport sketch is a depiction of the airport with emphasis on runway pattern and related ", "bbox": {"l": 449.10074000000003, "t": 425.08908, "r": 525.93616, "b": 427.21017, "coord_origin": "TOPLEFT"}}, {"id": 266, "text": "information, positioned in either the lower left or lower right corner of the chart to aid pi-", "bbox": {"l": 449.10074000000003, "t": 427.3678, "r": 522.0343, "b": 429.48886, "coord_origin": "TOPLEFT"}}, {"id": 267, "text": "lot recognition of the airport from the air and to provide some information to aid on ground ", "bbox": {"l": 449.10074000000003, "t": 429.64648, "r": 524.67151, "b": 431.76755, "coord_origin": "TOPLEFT"}}, {"id": 268, "text": "navigation of the airport. The runways are drawn to scale and oriented to true north. Runway ", "bbox": {"l": 449.10074000000003, "t": 431.92514000000006, "r": 527.172, "b": 434.04623, "coord_origin": "TOPLEFT"}}, {"id": 269, "text": "dimensions (length and width) are shown for all active runways.", "bbox": {"l": 449.10074000000003, "t": 434.20383, "r": 502.39545, "b": 436.32492, "coord_origin": "TOPLEFT"}}, {"id": 270, "text": "Runway(s) are depicted based on what type and construction of the runway.", "bbox": {"l": 449.10074000000003, "t": 438.7611999999999, "r": 512.92676, "b": 440.88228999999995, "coord_origin": "TOPLEFT"}}, {"id": 271, "text": "Hard Surface", "bbox": {"l": 449.95525999999995, "t": 444.07001, "r": 460.02307, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}, {"id": 272, "text": "Other Than ", "bbox": {"l": 464.89963, "t": 444.07001, "r": 473.98819, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}, {"id": 273, "text": "Hard Surface", "bbox": {"l": 464.89963, "t": 446.12085, "r": 474.96744, "b": 448.02979, "coord_origin": "TOPLEFT"}}, {"id": 274, "text": "Metal Surface", "bbox": {"l": 478.91357, "t": 444.07001, "r": 489.45648, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}, {"id": 275, "text": "Closed Runway", "bbox": {"l": 493.06420999999995, "t": 444.07001, "r": 505.03076, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}, {"id": 276, "text": "Under Construction", "bbox": {"l": 509.5809, "t": 444.07001, "r": 524.30237, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}, {"id": 277, "text": "Stopways, ", "bbox": {"l": 449.95525999999995, "t": 454.81207, "r": 458.31406, "b": 456.72104, "coord_origin": "TOPLEFT"}}, {"id": 278, "text": "Taxiways, Park-", "bbox": {"l": 449.95525999999995, "t": 456.86288, "r": 461.92083999999994, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}}, {"id": 279, "text": "ing Areas", "bbox": {"l": 449.95525999999995, "t": 458.91373, "r": 457.08014, "b": 460.82268999999997, "coord_origin": "TOPLEFT"}}, {"id": 280, "text": "Displaced ", "bbox": {"l": 464.89963, "t": 454.81207, "r": 472.87732, "b": 456.72104, "coord_origin": "TOPLEFT"}}, {"id": 281, "text": "Threshold", "bbox": {"l": 464.89963, "t": 456.86288, "r": 472.49792, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}}, {"id": 282, "text": "Closed", "bbox": {"l": 478.91357, "t": 454.81207, "r": 483.61584, "b": 456.72104, "coord_origin": "TOPLEFT"}}, {"id": 283, "text": "Pavement", "bbox": {"l": 478.91357, "t": 456.86288, "r": 486.60754000000003, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}}, {"id": 284, "text": "Water Runway", "bbox": {"l": 493.06420999999995, "t": 454.81207, "r": 504.20648, "b": 456.72104, "coord_origin": "TOPLEFT"}}, {"id": 285, "text": "Taxiways and aprons are shaded grey. Other runway features that may be shown are runway numbers, runway dimen-", "bbox": {"l": 449.10074000000003, "t": 469.32974, "r": 548.59674, "b": 471.45081, "coord_origin": "TOPLEFT"}}, {"id": 286, "text": "sions, runway slope, arresting gear, and displaced threshold.", "bbox": {"l": 449.10074000000003, "t": 471.60843, "r": 500.08181999999994, "b": 473.72949, "coord_origin": "TOPLEFT"}}, {"id": 287, "text": "2", "bbox": {"l": 449.10074000000003, "t": 476.16577, "r": 449.59933000000007, "b": 478.28687, "coord_origin": "TOPLEFT"}}, {"id": 288, "text": "W K H U L Q I R U P D W L R Q F R Q F H U Q L Q J O L J K W L Q J \u00bf Q D O D S S U R D F K E H D U L Q J V D L U S R U W E H D F R Q R E V W D F O H V F R Q W U R O W R Z H U 1 $ 9 $ , ' V K H O L ", "bbox": {"l": 450.09796, "t": 476.16577, "r": 547.82562, "b": 478.28687, "coord_origin": "TOPLEFT"}}, {"id": 289, "text": "-", "bbox": {"l": 547.82623, "t": 476.16577, "r": 548.45862, "b": 478.28687, "coord_origin": "TOPLEFT"}}, {"id": 290, "text": "pads may also be shown.", "bbox": {"l": 449.10074000000003, "t": 478.44446, "r": 470.52609000000007, "b": 480.56555, "coord_origin": "TOPLEFT"}}, {"id": 291, "text": "$ L U S R U W ( O H Y D W L R Q D Q G 7 R X F K G R Z Q = R Q H ( O H Y D W L R Q ", "bbox": {"l": 449.10074000000003, "t": 483.00183, "r": 493.37906000000004, "b": 485.12292, "coord_origin": "TOPLEFT"}}, {"id": 292, "text": "The airport elevation is shown enclosed within a box in the upper left corner of the sketch box and the touchdown zone ", "bbox": {"l": 449.10074000000003, "t": 487.5592, "r": 549.16168, "b": 489.6803, "coord_origin": "TOPLEFT"}}, {"id": 293, "text": "elevation (TDZE) is shown in the upper right corner of the sketch box. The airport elevation is the highest point of an ", "bbox": {"l": 449.10074000000003, "t": 489.83789, "r": 546.90881, "b": 491.95898, "coord_origin": "TOPLEFT"}}, {"id": 294, "text": "D L U S R U W \u00b6 V X V D E O H U X Q Z D \\ V P H D V X U H G L Q I H H W I U R P P H D Q V H D O H Y H O 7 K H 7 ' = ( L V W K H K L J K H V W H O H Y D W L R Q L Q W K H \u00bf U V W I H H W R I ", "bbox": {"l": 449.10074000000003, "t": 492.11658, "r": 551.80023, "b": 494.23767, "coord_origin": "TOPLEFT"}}, {"id": 295, "text": "the landing surface. Circling only approaches will not show a TDZE.", "bbox": {"l": 449.10074000000003, "t": 494.39526, "r": 505.85068000000007, "b": 496.51636, "coord_origin": "TOPLEFT"}}, {"id": 296, "text": "114", "bbox": {"l": 498.80661000000003, "t": 515.9437, "r": 502.08792, "b": 519.01764, "coord_origin": "TOPLEFT"}}, {"id": 297, "text": "FAA Chart Users\u2019 Guide - Terminal Procedures Publication (TPP) - Terms", "bbox": {"l": 444.56319999999994, "t": 422.84869, "r": 446.25998, "b": 471.87128, "coord_origin": "TOPLEFT"}}, {"id": 298, "text": "AGL 2013 Financial Calendar", "bbox": {"l": 329.40536, "t": 379.37537, "r": 355.13138, "b": 382.13336, "coord_origin": "TOPLEFT"}}, {"id": 299, "text": "22", "bbox": {"l": 329.40536, "t": 382.30273, "r": 330.96848, "b": 384.55927, "coord_origin": "TOPLEFT"}}, {"id": 300, "text": "August 2012 ", "bbox": {"l": 331.75003, "t": 382.30273, "r": 341.12875, "b": 384.55927, "coord_origin": "TOPLEFT"}}, {"id": 301, "text": "2012 full year result and fi nal dividend announced", "bbox": {"l": 350.4722, "t": 382.30273, "r": 384.81079, "b": 384.55927, "coord_origin": "TOPLEFT"}}, {"id": 302, "text": "30", "bbox": {"l": 329.40536, "t": 384.84552, "r": 330.97336, "b": 387.10205, "coord_origin": "TOPLEFT"}}, {"id": 303, "text": "August 2012 ", "bbox": {"l": 331.75735, "t": 384.84552, "r": 341.16534, "b": 387.10205, "coord_origin": "TOPLEFT"}}, {"id": 304, "text": "Ex-dividend trading commences", "bbox": {"l": 350.4722, "t": 384.84552, "r": 372.90613, "b": 387.10205, "coord_origin": "TOPLEFT"}}, {"id": 305, "text": "5", "bbox": {"l": 329.40536, "t": 387.38828, "r": 330.20337, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}}, {"id": 306, "text": "September 2012 ", "bbox": {"l": 331.00137, "t": 387.38828, "r": 342.9715, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}}, {"id": 307, "text": "Record date for 2012 fi nal dividend", "bbox": {"l": 350.4722, "t": 387.38828, "r": 374.88693, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}}, {"id": 308, "text": "27", "bbox": {"l": 329.40536, "t": 389.93103, "r": 331.0173, "b": 392.18762, "coord_origin": "TOPLEFT"}}, {"id": 309, "text": "September 2012 ", "bbox": {"l": 331.82327, "t": 389.93103, "r": 343.91284, "b": 392.18762, "coord_origin": "TOPLEFT"}}, {"id": 310, "text": "Final dividend payable", "bbox": {"l": 350.4722, "t": 389.93103, "r": 365.65988, "b": 392.18762, "coord_origin": "TOPLEFT"}}, {"id": 311, "text": "23", "bbox": {"l": 329.40536, "t": 392.47382, "r": 330.98804, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}}, {"id": 312, "text": "October 2012 ", "bbox": {"l": 331.77936, "t": 392.47382, "r": 342.06674, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}}, {"id": 313, "text": "Annual General Meeting", "bbox": {"l": 350.4722, "t": 392.47382, "r": 367.22156, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}}, {"id": 314, "text": "27", "bbox": {"l": 329.40536, "t": 395.0166, "r": 330.99741, "b": 397.27313, "coord_origin": "TOPLEFT"}}, {"id": 315, "text": "February 2013", "bbox": {"l": 331.7934, "t": 395.0166, "r": 342.1416, "b": 397.27313, "coord_origin": "TOPLEFT"}}, {"id": 316, "text": " 1", "bbox": {"l": 342.64841, "t": 395.18298, "r": 342.65811, "b": 396.49857000000003, "coord_origin": "TOPLEFT"}}, {"id": 317, "text": "2013 interim result and interim dividend announced", "bbox": {"l": 350.47177, "t": 395.01474, "r": 386.25897, "b": 397.2713, "coord_origin": "TOPLEFT"}}, {"id": 318, "text": "28", "bbox": {"l": 329.40491, "t": 397.55749999999995, "r": 331.02695, "b": 399.81406, "coord_origin": "TOPLEFT"}}, {"id": 319, "text": "August 2013", "bbox": {"l": 331.83795, "t": 397.55749999999995, "r": 340.75909, "b": 399.81406, "coord_origin": "TOPLEFT"}}, {"id": 320, "text": " 1", "bbox": {"l": 341.26437, "t": 397.7254, "r": 341.27408, "b": 399.04095, "coord_origin": "TOPLEFT"}}, {"id": 321, "text": "2013 full year results and fi nal dividend announced ", "bbox": {"l": 350.47144, "t": 397.55713, "r": 385.93265, "b": 399.81369, "coord_origin": "TOPLEFT"}}, {"id": 322, "text": "1", "bbox": {"l": 329.40536, "t": 400.46155, "r": 329.87708, "b": 401.96588, "coord_origin": "TOPLEFT"}}, {"id": 323, "text": "Indicative dates only, subject to change/Board confi rmation", "bbox": {"l": 330.34882, "t": 400.46155, "r": 358.65204, "b": 401.96588, "coord_origin": "TOPLEFT"}}, {"id": 324, "text": "AGL\u2019s Annual General Meeting will be held at the City Recital Hall, Angel Place, Sydney ", "bbox": {"l": 329.40536, "t": 404.34503, "r": 391.771, "b": 406.60156, "coord_origin": "TOPLEFT"}}, {"id": 325, "text": "commencing at 10.30am on Tuesday 23 October 2012.", "bbox": {"l": 329.40536, "t": 406.37857, "r": 369.65308, "b": 408.63513000000006, "coord_origin": "TOPLEFT"}}, {"id": 326, "text": "Ye s te rd ay", "bbox": {"l": 363.54486, "t": 460.53054999999995, "r": 379.25955, "b": 465.54507, "coord_origin": "TOPLEFT"}}, {"id": 327, "text": "Established in Sydney in 1837, and then ", "bbox": {"l": 363.54486, "t": 466.7157, "r": 391.38229, "b": 468.97223, "coord_origin": "TOPLEFT"}}, {"id": 328, "text": "known as The Australian Gas Light Company, ", "bbox": {"l": 363.54486, "t": 468.74924, "r": 395.01788, "b": 471.00577, "coord_origin": "TOPLEFT"}}, {"id": 329, "text": "the AGL business has an established history ", "bbox": {"l": 363.54486, "t": 470.78281, "r": 394.08322, "b": 473.03934, "coord_origin": "TOPLEFT"}}, {"id": 330, "text": "and reputation for serving the gas and ", "bbox": {"l": 363.54486, "t": 472.81635, "r": 390.60727, "b": 475.07288, "coord_origin": "TOPLEFT"}}, {"id": 331, "text": "electricity needs of Australian households. ", "bbox": {"l": 363.54486, "t": 474.84988, "r": 393.49612, "b": 477.10645, "coord_origin": "TOPLEFT"}}, {"id": 332, "text": "In 1841, when AGL supplied the gas to light ", "bbox": {"l": 363.54486, "t": 476.88345, "r": 394.11481, "b": 479.13998, "coord_origin": "TOPLEFT"}}, {"id": 333, "text": "the fi rst public street lamp, it was reported ", "bbox": {"l": 363.54486, "t": 478.91699, "r": 393.75891, "b": 481.17352, "coord_origin": "TOPLEFT"}}, {"id": 334, "text": "in the Sydney Gazette as a \u201cwonderful ", "bbox": {"l": 363.54486, "t": 480.95053, "r": 390.4975, "b": 483.20709, "coord_origin": "TOPLEFT"}}, {"id": 335, "text": "achievement of scientifi c knowledge, assisted ", "bbox": {"l": 363.54486, "t": 482.9841, "r": 395.70975, "b": 485.24063, "coord_origin": "TOPLEFT"}}, {"id": 336, "text": "by mechanical ingenuity.\u201d Within two years, ", "bbox": {"l": 363.54486, "t": 485.01764, "r": 394.27283, "b": 487.2742, "coord_origin": "TOPLEFT"}}, {"id": 337, "text": "165 gas lamps were lighting the City of Sydney.", "bbox": {"l": 363.54486, "t": 487.05121, "r": 396.65939, "b": 489.30774, "coord_origin": "TOPLEFT"}}, {"id": 338, "text": "Looking back on ", "bbox": {"l": 329.4054, "t": 419.93124, "r": 384.19696, "b": 431.09412, "coord_origin": "TOPLEFT"}}, {"id": 339, "text": "175 years of ", "bbox": {"l": 329.4054, "t": 430.10379, "r": 372.16626, "b": 441.26669, "coord_origin": "TOPLEFT"}}, {"id": 340, "text": "looking forward.", "bbox": {"l": 329.4054, "t": 440.27636999999993, "r": 385.3981, "b": 451.43924, "coord_origin": "TOPLEFT"}}, {"id": 341, "text": "AGL Energy Limited ABN 74 115 061 375", "bbox": {"l": 329.40536, "t": 372.16159, "r": 353.36179, "b": 373.91669, "coord_origin": "TOPLEFT"}}, {"id": 342, "text": "29", "bbox": {"l": 546.20587, "t": 360.90448, "r": 548.23407, "b": 362.82242, "coord_origin": "TOPLEFT"}}, {"id": 343, "text": "signs, signals and road markings", "bbox": {"l": 497.77728, "t": 251.43384000000003, "r": 542.8255, "b": 254.94385, "coord_origin": "TOPLEFT"}}, {"id": 344, "text": "3", "bbox": {"l": 490.30679, "t": 251.47478999999998, "r": 492.09982, "b": 254.98479999999995, "coord_origin": "TOPLEFT"}}, {"id": 345, "text": "In ", "bbox": {"l": 498.15335, "t": 263.88922, "r": 500.05637, "b": 265.92719, "coord_origin": "TOPLEFT"}}, {"id": 346, "text": "chapter 2, you and your vehicle", "bbox": {"l": 500.05637, "t": 263.85717999999997, "r": 524.37036, "b": 265.86310000000003, "coord_origin": "TOPLEFT"}}, {"id": 347, "text": ", you learned about ", "bbox": {"l": 524.37036, "t": 263.88922, "r": 539.89124, "b": 265.92719, "coord_origin": "TOPLEFT"}}, {"id": 348, "text": "some of the controls in your vehicle. This chapter is a handy ", "bbox": {"l": 498.15335, "t": 265.93224999999995, "r": 544.50403, "b": 267.97020999999995, "coord_origin": "TOPLEFT"}}, {"id": 349, "text": "reference section that gives examples of the most common ", "bbox": {"l": 498.15335, "t": 267.97533999999996, "r": 544.01343, "b": 270.01331000000005, "coord_origin": "TOPLEFT"}}, {"id": 350, "text": "signs, signals and road markings that keep traffi c organized ", "bbox": {"l": 498.15335, "t": 270.01831000000004, "r": 544.11987, "b": 272.05634, "coord_origin": "TOPLEFT"}}, {"id": 351, "text": "and flowing smoothly. ", "bbox": {"l": 498.15335, "t": 272.06140000000005, "r": 515.41071, "b": 274.09937, "coord_origin": "TOPLEFT"}}, {"id": 352, "text": "Signs", "bbox": {"l": 498.15335, "t": 277.34619, "r": 505.64642000000003, "b": 280.9357, "coord_origin": "TOPLEFT"}}, {"id": 353, "text": "There are three ways to read signs: by their shape, colour and ", "bbox": {"l": 498.15335, "t": 281.82187, "r": 543.92957, "b": 283.85983, "coord_origin": "TOPLEFT"}}, {"id": 354, "text": "the messages printed on them. Understanding these three ways ", "bbox": {"l": 498.15335, "t": 283.8649, "r": 545.67834, "b": 285.90289, "coord_origin": "TOPLEFT"}}, {"id": 355, "text": "of classifying signs will help you figure out the meaning of signs ", "bbox": {"l": 498.15335, "t": 285.90796, "r": 545.26471, "b": 287.94592, "coord_origin": "TOPLEFT"}}, {"id": 356, "text": "that are new to you. ", "bbox": {"l": 498.15335, "t": 287.95099, "r": 513.31335, "b": 289.98895, "coord_origin": "TOPLEFT"}}, {"id": 357, "text": "Stop", "bbox": {"l": 505.43439, "t": 303.07596, "r": 508.53033000000005, "b": 304.89639, "coord_origin": "TOPLEFT"}}, {"id": 358, "text": "Yield the right-of-way", "bbox": {"l": 527.45502, "t": 303.25354, "r": 541.44678, "b": 305.07397, "coord_origin": "TOPLEFT"}}, {"id": 359, "text": "Shows driving", "bbox": {"l": 501.79385, "t": 321.18973, "r": 510.41632, "b": 323.01016, "coord_origin": "TOPLEFT"}}, {"id": 360, "text": "regulations", "bbox": {"l": 501.79385, "t": 322.87731999999994, "r": 509.04268999999994, "b": 324.69775000000004, "coord_origin": "TOPLEFT"}}, {"id": 361, "text": "Explains lane use", "bbox": {"l": 518.66455, "t": 319.59146, "r": 529.80902, "b": 321.41190000000006, "coord_origin": "TOPLEFT"}}, {"id": 362, "text": "School zone signs ", "bbox": {"l": 534.87561, "t": 318.37616, "r": 546.95142, "b": 320.19659, "coord_origin": "TOPLEFT"}}, {"id": 363, "text": "are fl uorescent ", "bbox": {"l": 534.87561, "t": 320.0637500000001, "r": 545.05762, "b": 321.88419, "coord_origin": "TOPLEFT"}}, {"id": 364, "text": "yellow-green", "bbox": {"l": 534.87561, "t": 321.75134, "r": 543.32263, "b": 323.57178, "coord_origin": "TOPLEFT"}}, {"id": 365, "text": "Tells about motorist ", "bbox": {"l": 499.21862999999996, "t": 338.12772, "r": 512.62451, "b": 339.94815, "coord_origin": "TOPLEFT"}}, {"id": 366, "text": "services", "bbox": {"l": 499.21862999999996, "t": 339.81531000000007, "r": 504.39917, "b": 341.63574, "coord_origin": "TOPLEFT"}}, {"id": 367, "text": "Shows a permitted ", "bbox": {"l": 516.97748, "t": 338.06039, "r": 529.77484, "b": 339.88082999999995, "coord_origin": "TOPLEFT"}}, {"id": 368, "text": "action", "bbox": {"l": 516.97748, "t": 339.74799, "r": 520.96399, "b": 341.56842, "coord_origin": "TOPLEFT"}}, {"id": 369, "text": "Shows an action that ", "bbox": {"l": 534.55847, "t": 337.88281, "r": 548.58453, "b": 339.7032500000001, "coord_origin": "TOPLEFT"}}, {"id": 370, "text": "is not permitted", "bbox": {"l": 534.55847, "t": 339.57040000000006, "r": 545.08862, "b": 341.39084, "coord_origin": "TOPLEFT"}}, {"id": 371, "text": "Warns of hazards ", "bbox": {"l": 483.05853, "t": 356.17416, "r": 494.72577, "b": 357.9946, "coord_origin": "TOPLEFT"}}, {"id": 372, "text": "ahead", "bbox": {"l": 483.05853, "t": 357.86179, "r": 487.07525999999996, "b": 359.68222, "coord_origin": "TOPLEFT"}}, {"id": 373, "text": "Warns of", "bbox": {"l": 499.39645, "t": 356.26297000000005, "r": 504.69171, "b": 358.0834, "coord_origin": "TOPLEFT"}}, {"id": 374, "text": "construction zones", "bbox": {"l": 499.39645, "t": 357.95056, "r": 511.69116, "b": 359.77099999999996, "coord_origin": "TOPLEFT"}}, {"id": 375, "text": "Railway crossing", "bbox": {"l": 516.75891, "t": 356.26297000000005, "r": 527.42938, "b": 358.0834, "coord_origin": "TOPLEFT"}}, {"id": 376, "text": "Shows distance and ", "bbox": {"l": 534.5141, "t": 352.92981, "r": 547.89862, "b": 354.75024, "coord_origin": "TOPLEFT"}}, {"id": 377, "text": "direction", "bbox": {"l": 534.5141, "t": 354.6174, "r": 540.2818, "b": 356.43784, "coord_origin": "TOPLEFT"}}, {"id": 378, "text": "\u2022", "bbox": {"l": 478.37466, "t": 270.14075, "r": 479.14251999999993, "b": 272.17877, "coord_origin": "TOPLEFT"}}, {"id": 379, "text": "Signs", "bbox": {"l": 479.91036999999994, "t": 270.14075, "r": 483.74963, "b": 272.17877, "coord_origin": "TOPLEFT"}}, {"id": 380, "text": "- regulatory signs", "bbox": {"l": 479.97293, "t": 272.84717, "r": 492.31219, "b": 274.34888, "coord_origin": "TOPLEFT"}}, {"id": 381, "text": "- school, ", "bbox": {"l": 479.97293, "t": 275.14513999999997, "r": 486.72598000000005, "b": 276.64679, "coord_origin": "TOPLEFT"}}, {"id": 382, "text": "playground and ", "bbox": {"l": 481.21602999999993, "t": 276.77972, "r": 492.93286000000006, "b": 278.81768999999997, "coord_origin": "TOPLEFT"}}, {"id": 383, "text": "crosswalk signs", "bbox": {"l": 481.21602999999993, "t": 278.82275000000004, "r": 491.82938000000007, "b": 280.86075, "coord_origin": "TOPLEFT"}}, {"id": 384, "text": "- lane use signs", "bbox": {"l": 479.97293, "t": 281.52759, "r": 491.00775000000004, "b": 283.02924, "coord_origin": "TOPLEFT"}}, {"id": 385, "text": "- turn control signs", "bbox": {"l": 479.97293, "t": 283.82556, "r": 493.32748, "b": 285.3272099999999, "coord_origin": "TOPLEFT"}}, {"id": 386, "text": "- parking signs", "bbox": {"l": 479.97293, "t": 286.1235, "r": 490.4915199999999, "b": 287.62518, "coord_origin": "TOPLEFT"}}, {"id": 387, "text": "- reserved lane ", "bbox": {"l": 479.97293, "t": 288.42148, "r": 491.17004000000003, "b": 289.92316, "coord_origin": "TOPLEFT"}}, {"id": 388, "text": "signs", "bbox": {"l": 481.21602999999993, "t": 290.05605999999995, "r": 484.77405000000005, "b": 292.09406, "coord_origin": "TOPLEFT"}}, {"id": 389, "text": "- warning signs", "bbox": {"l": 479.97293, "t": 292.76169000000004, "r": 490.83398, "b": 294.26334, "coord_origin": "TOPLEFT"}}, {"id": 390, "text": "- object markers", "bbox": {"l": 479.97293, "t": 295.05963, "r": 491.62692, "b": 296.56131, "coord_origin": "TOPLEFT"}}, {"id": 391, "text": "- construction ", "bbox": {"l": 479.97293, "t": 297.3576, "r": 490.37341, "b": 298.8592499999999, "coord_origin": "TOPLEFT"}}, {"id": 392, "text": "signs", "bbox": {"l": 481.21602999999993, "t": 298.99219, "r": 484.77405000000005, "b": 301.03015, "coord_origin": "TOPLEFT"}}, {"id": 393, "text": "- information and ", "bbox": {"l": 479.97293, "t": 301.69780999999995, "r": 492.93912, "b": 303.19946, "coord_origin": "TOPLEFT"}}, {"id": 394, "text": "destination signs", "bbox": {"l": 481.21602999999993, "t": 303.3324, "r": 493.00525, "b": 305.37036, "coord_origin": "TOPLEFT"}}, {"id": 395, "text": "- railway signs", "bbox": {"l": 479.97293, "t": 306.0379899999999, "r": 489.99047999999993, "b": 307.53967, "coord_origin": "TOPLEFT"}}, {"id": 396, "text": "\u2022", "bbox": {"l": 478.375, "t": 308.24789, "r": 479.1032400000001, "b": 310.28586, "coord_origin": "TOPLEFT"}}, {"id": 397, "text": "Signals", "bbox": {"l": 479.83151, "t": 308.24789, "r": 484.92925999999994, "b": 310.28586, "coord_origin": "TOPLEFT"}}, {"id": 398, "text": "- lane control ", "bbox": {"l": 479.97293, "t": 310.95358, "r": 490.00091999999995, "b": 312.45526, "coord_origin": "TOPLEFT"}}, {"id": 399, "text": "signals", "bbox": {"l": 481.21602999999993, "t": 312.5881999999999, "r": 485.95331, "b": 314.62616, "coord_origin": "TOPLEFT"}}, {"id": 400, "text": "- traffic lights", "bbox": {"l": 479.97293, "t": 315.29379, "r": 489.29876999999993, "b": 316.79544, "coord_origin": "TOPLEFT"}}, {"id": 401, "text": "\u2022", "bbox": {"l": 478.375, "t": 317.50366, "r": 479.18129999999996, "b": 319.5416599999999, "coord_origin": "TOPLEFT"}}, {"id": 402, "text": "Road markings", "bbox": {"l": 479.98761, "t": 317.50366, "r": 490.46960000000007, "b": 319.5416599999999, "coord_origin": "TOPLEFT"}}, {"id": 403, "text": "- yellow lines", "bbox": {"l": 479.97293, "t": 320.20938, "r": 489.26166000000006, "b": 321.71103, "coord_origin": "TOPLEFT"}}, {"id": 404, "text": "- white lines", "bbox": {"l": 479.97293, "t": 322.50732, "r": 488.59189, "b": 324.009, "coord_origin": "TOPLEFT"}}, {"id": 405, "text": "- reserved lane ", "bbox": {"l": 479.97293, "t": 324.8053, "r": 491.17004000000003, "b": 326.30698, "coord_origin": "TOPLEFT"}}, {"id": 406, "text": "markings", "bbox": {"l": 481.21602999999993, "t": 326.43988, "r": 487.58978, "b": 328.47784, "coord_origin": "TOPLEFT"}}, {"id": 407, "text": "- other markings", "bbox": {"l": 479.97293, "t": 329.14551, "r": 491.75177, "b": 330.64716, "coord_origin": "TOPLEFT"}}, {"id": 408, "text": "in this chapter", "bbox": {"l": 478.15246999999994, "t": 265.07030999999995, "r": 493.75586, "b": 268.06872999999996, "coord_origin": "TOPLEFT"}}], "children": [{"id": 32, "label": "text", "bbox": {"l": 327.86951, "t": 351.78085, "r": 330.41248, "b": 353.95465, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "13", "bbox": {"l": 327.86951, "t": 351.78085, "r": 330.41248, "b": 353.95465, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 327.83005, "t": 331.57268999999997, "r": 351.16092, "b": 333.31171, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "USING THE VERTICAL TUBE -", "bbox": {"l": 327.83005, "t": 331.57268999999997, "r": 351.16092, "b": 333.31171, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 327.83005, "t": 333.18292, "r": 348.30536, "b": 334.92194, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "MODELS AY11230/11234", "bbox": {"l": 327.83005, "t": 333.18292, "r": 348.30536, "b": 334.92194, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 327.83005, "t": 336.40439, "r": 329.05914, "b": 337.92606, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "1.", "bbox": {"l": 327.83005, "t": 336.40439, "r": 329.05914, "b": 337.92606, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 329.67368, "t": 336.40439, "r": 349.95349, "b": 337.92606, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "The vertical tube can be used for", "bbox": {"l": 329.67368, "t": 336.40439, "r": 349.95349, "b": 337.92606, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 329.11752, "t": 337.83588, "r": 353.57977, "b": 339.35751000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "instructional viewing or to photograph", "bbox": {"l": 329.11752, "t": 337.83588, "r": 353.57977, "b": 339.35751000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 327.77121, "t": 339.26736, "r": 352.4306, "b": 340.789, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": " the image with a digital camera or a", "bbox": {"l": 327.77121, "t": 339.26736, "r": 352.4306, "b": 340.789, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 328.15176, "t": 340.69882, "r": 337.91086, "b": 342.22049, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": " micro TV unit", "bbox": {"l": 328.15176, "t": 340.69882, "r": 337.91086, "b": 342.22049, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 327.8313, "t": 342.19043000000005, "r": 329.09155, "b": 343.71207, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "2.", "bbox": {"l": 327.8313, "t": 342.19043000000005, "r": 329.09155, "b": 343.71207, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 329.72168, "t": 342.19043000000005, "r": 354.9267, "b": 343.71207, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "Loosen the retention screw, then rotate ", "bbox": {"l": 329.72168, "t": 342.19043000000005, "r": 354.9267, "b": 343.71207, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 327.8313, "t": 343.62192, "r": 351.66949, "b": 345.14355, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": " the adjustment ring to change the ", "bbox": {"l": 327.8313, "t": 343.62192, "r": 351.66949, "b": 345.14355, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 328.21185, "t": 345.05338, "r": 346.33179, "b": 346.57504, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": " length of the vertical tube.", "bbox": {"l": 328.21185, "t": 345.05338, "r": 346.33179, "b": 346.57504, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 327.83005, "t": 346.84680000000003, "r": 329.12726, "b": 348.36847, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "3.", "bbox": {"l": 327.83005, "t": 346.84680000000003, "r": 329.12726, "b": 348.36847, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 329.77588, "t": 346.84680000000003, "r": 351.18005, "b": 348.36847, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "Make sure that both the images in", "bbox": {"l": 329.77588, "t": 346.84680000000003, "r": 351.18005, "b": 348.36847, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 327.25311, "t": 254.94812000000002, "r": 350.07861, "b": 258.86096, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "OPERATION ", "bbox": {"l": 327.25311, "t": 254.94812000000002, "r": 350.07861, "b": 258.86096, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 350.07861, "t": 254.76782000000003, "r": 351.82651, "b": 258.68066, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "(", "bbox": {"l": 350.07861, "t": 254.76782000000003, "r": 351.82651, "b": 258.68066, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 351.82651, "t": 254.94812000000002, "r": 360.85242, "b": 258.86096, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "cont.", "bbox": {"l": 351.82651, "t": 254.94812000000002, "r": 360.85242, "b": 258.86096, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 360.85242, "t": 254.76782000000003, "r": 362.60028, "b": 258.68066, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": ")", "bbox": {"l": 360.85242, "t": 254.76782000000003, "r": 362.60028, "b": 258.68066, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 326.88037, "t": 263.49492999999995, "r": 345.84351, "b": 265.23395000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "SELECTING OBJECTIVE ", "bbox": {"l": 326.88037, "t": 263.49492999999995, "r": 345.84351, "b": 265.23395000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 326.88037, "t": 265.10515999999996, "r": 340.54153, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "MAGNIFICATION", "bbox": {"l": 326.88037, "t": 265.10515999999996, "r": 340.54153, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 326.88037, "t": 266.71533, "r": 328.31903, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "1.", "bbox": {"l": 326.88037, "t": 266.71533, "r": 328.31903, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 329.03836, "t": 266.71533, "r": 354.21472, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "There are two objectives. The lower", "bbox": {"l": 329.03836, "t": 266.71533, "r": 354.21472, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 326.88037, "t": 268.32556, "r": 355.19193, "b": 270.06458, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": " magnification objective has a greater", "bbox": {"l": 326.88037, "t": 268.32556, "r": 355.19193, "b": 270.06458, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 326.88037, "t": 269.93579, "r": 345.80057, "b": 271.6748, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": " depth of field and view.", "bbox": {"l": 326.88037, "t": 269.93579, "r": 345.80057, "b": 271.6748, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 326.88037, "t": 271.54602, "r": 328.33862, "b": 273.28503, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "2.", "bbox": {"l": 326.88037, "t": 271.54602, "r": 328.33862, "b": 273.28503, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 329.06775, "t": 271.54602, "r": 352.39969, "b": 273.28503, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "In order to observe the specimen", "bbox": {"l": 329.06775, "t": 271.54602, "r": 352.39969, "b": 273.28503, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 326.88037, "t": 273.15619000000004, "r": 352.90042, "b": 274.89526, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": " easily use the lower magnification", "bbox": {"l": 326.88037, "t": 273.15619000000004, "r": 352.90042, "b": 274.89526, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 326.88037, "t": 274.76642000000004, "r": 354.59546, "b": 276.50543000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": " objective first. Then, by rotating the", "bbox": {"l": 326.88037, "t": 274.76642000000004, "r": 354.59546, "b": 276.50543000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 326.88037, "t": 276.37665000000004, "r": 350.81885, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": " case, the magnification can be", "bbox": {"l": 326.88037, "t": 276.37665000000004, "r": 350.81885, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 326.88037, "t": 277.98688000000004, "r": 335.46707, "b": 279.72589000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": " changed.", "bbox": {"l": 326.88037, "t": 277.98688000000004, "r": 335.46707, "b": 279.72589000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 326.88037, "t": 281.20728, "r": 354.57755, "b": 282.94632, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 107, "text": "CHANGING THE INTERPUPILLARY ", "bbox": {"l": 326.88037, "t": 281.20728, "r": 354.57755, "b": 282.94632, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 326.88037, "t": 282.81750000000005, "r": 335.1752, "b": 284.55652, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 108, "text": "DISTANCE", "bbox": {"l": 326.88037, "t": 282.81750000000005, "r": 335.1752, "b": 284.55652, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 326.88037, "t": 284.4277, "r": 328.34784, "b": 286.16675, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 109, "text": "1.", "bbox": {"l": 326.88037, "t": 284.4277, "r": 328.34784, "b": 286.16675, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 329.08157, "t": 284.4277, "r": 354.76245, "b": 286.16675, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 110, "text": "The distance between the observer's", "bbox": {"l": 329.08157, "t": 284.4277, "r": 354.76245, "b": 286.16675, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 326.88037, "t": 286.03793, "r": 354.6499, "b": 287.77695, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 111, "text": " pupils is the interpupillary distance.", "bbox": {"l": 326.88037, "t": 286.03793, "r": 354.6499, "b": 287.77695, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 326.88037, "t": 287.64813, "r": 328.25125, "b": 289.38718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 112, "text": "2.", "bbox": {"l": 326.88037, "t": 287.64813, "r": 328.25125, "b": 289.38718, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 328.93671, "t": 287.64813, "r": 354.29825, "b": 289.38718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 113, "text": "To adjust the interpupillary distance", "bbox": {"l": 328.93671, "t": 287.64813, "r": 354.29825, "b": 289.38718, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 326.88181, "t": 289.25836, "r": 355.02075, "b": 290.99738, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 114, "text": " rotate the prism caps until both eyes", "bbox": {"l": 326.88181, "t": 289.25836, "r": 355.02075, "b": 290.99738, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 326.88181, "t": 290.86855999999995, "r": 350.82028, "b": 292.6076, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 115, "text": " coincide with the image in the", "bbox": {"l": 326.88181, "t": 290.86855999999995, "r": 350.82028, "b": 292.6076, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 326.88181, "t": 292.47879, "r": 336.2067, "b": 294.2178, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 116, "text": " eyepiece. ", "bbox": {"l": 326.88181, "t": 292.47879, "r": 336.2067, "b": 294.2178, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 326.88181, "t": 295.69922, "r": 335.3941, "b": 297.43823, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 117, "text": "FOCUSING", "bbox": {"l": 326.88181, "t": 295.69922, "r": 335.3941, "b": 297.43823, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 326.88181, "t": 297.30942, "r": 328.34314, "b": 299.04846, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 118, "text": "1.", "bbox": {"l": 326.88181, "t": 297.30942, "r": 328.34314, "b": 299.04846, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 329.07379, "t": 297.30942, "r": 353.18555, "b": 299.04846, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 119, "text": "Remove the lens protective cover.", "bbox": {"l": 329.07379, "t": 297.30942, "r": 353.18555, "b": 299.04846, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 326.88324, "t": 298.91965, "r": 328.35919, "b": 300.65866, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 120, "text": "2.", "bbox": {"l": 326.88324, "t": 298.91965, "r": 328.35919, "b": 300.65866, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 329.0972, "t": 298.91965, "r": 353.45065, "b": 300.65866, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 121, "text": "Place the specimen on the working", "bbox": {"l": 329.0972, "t": 298.91965, "r": 353.45065, "b": 300.65866, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 326.88324, "t": 300.52985, "r": 333.32825, "b": 302.26889000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 122, "text": " stage.", "bbox": {"l": 326.88324, "t": 300.52985, "r": 333.32825, "b": 302.26889000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 326.88324, "t": 302.14008000000007, "r": 328.31296, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 123, "text": "3.", "bbox": {"l": 326.88324, "t": 302.14008000000007, "r": 328.31296, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 329.02783, "t": 302.14008000000007, "r": 354.76303, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 124, "text": "Focus the specimen with the left eye", "bbox": {"l": 329.02783, "t": 302.14008000000007, "r": 354.76303, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 326.88324, "t": 303.75027, "r": 355.96307, "b": 305.48932, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 125, "text": " first while turning the focus knob until", "bbox": {"l": 326.88324, "t": 303.75027, "r": 355.96307, "b": 305.48932, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 326.88324, "t": 305.3605, "r": 354.46594, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 126, "text": " the image appears clear and sharp.", "bbox": {"l": 326.88324, "t": 305.3605, "r": 354.46594, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 326.88324, "t": 306.9707, "r": 328.25488, "b": 308.70975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 127, "text": "4.", "bbox": {"l": 326.88324, "t": 306.9707, "r": 328.25488, "b": 308.70975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 328.9407, "t": 306.9707, "r": 356.37335, "b": 308.70975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 128, "text": "Rotate the right eyepiece ring until the", "bbox": {"l": 328.9407, "t": 306.9707, "r": 356.37335, "b": 308.70975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 326.88324, "t": 308.58093, "r": 355.38867, "b": 310.31995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 129, "text": " images in each eyepiece coincide and", "bbox": {"l": 326.88324, "t": 308.58093, "r": 355.38867, "b": 310.31995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 326.88324, "t": 310.19113, "r": 343.17249, "b": 311.93018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 130, "text": " are sharp and clear.", "bbox": {"l": 326.88324, "t": 310.19113, "r": 343.17249, "b": 311.93018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 326.88324, "t": 313.41156, "r": 344.13388, "b": 315.15059999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 131, "text": "CHANGING THE BULB", "bbox": {"l": 326.88324, "t": 313.41156, "r": 344.13388, "b": 315.15059999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 326.88324, "t": 315.02178999999995, "r": 328.37418, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 132, "text": "1.", "bbox": {"l": 326.88324, "t": 315.02178999999995, "r": 328.37418, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 329.11963, "t": 315.02178999999995, "r": 348.50162, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 133, "text": "Disconnect the power cord.", "bbox": {"l": 329.11963, "t": 315.02178999999995, "r": 348.50162, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 326.88324, "t": 316.63199, "r": 328.34061, "b": 318.37103, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 134, "text": "2.", "bbox": {"l": 326.88324, "t": 316.63199, "r": 328.34061, "b": 318.37103, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 329.06931, "t": 316.63199, "r": 353.11588, "b": 318.37103, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 135, "text": "When the bulb is cool, remove the", "bbox": {"l": 329.06931, "t": 316.63199, "r": 353.11588, "b": 318.37103, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 326.88464, "t": 318.2422199999999, "r": 353.79517, "b": 319.9812299999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 136, "text": " oblique illuminator cap and remove", "bbox": {"l": 326.88464, "t": 318.2422199999999, "r": 353.79517, "b": 319.9812299999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 326.88464, "t": 319.85242000000005, "r": 348.02094, "b": 321.59146, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 137, "text": " the halogen bulb with cap.", "bbox": {"l": 326.88464, "t": 319.85242000000005, "r": 348.02094, "b": 321.59146, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 326.88464, "t": 321.46265, "r": 328.37512, "b": 323.20166, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 138, "text": "3.", "bbox": {"l": 326.88464, "t": 321.46265, "r": 328.37512, "b": 323.20166, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 329.12036, "t": 321.46265, "r": 352.96808, "b": 323.20166, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 139, "text": "Replace with a new halogen bulb.", "bbox": {"l": 329.12036, "t": 321.46265, "r": 352.96808, "b": 323.20166, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 326.88608, "t": 323.07285, "r": 328.36884, "b": 324.81189, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 140, "text": "4.", "bbox": {"l": 326.88608, "t": 323.07285, "r": 328.36884, "b": 324.81189, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 329.1102, "t": 323.07285, "r": 356.5412, "b": 324.81189, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 141, "text": "Open the window in the base plate and", "bbox": {"l": 329.1102, "t": 323.07285, "r": 356.5412, "b": 324.81189, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 326.88608, "t": 324.68307000000004, "r": 350.13828, "b": 326.42209, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 142, "text": " replace the halogen lamp or ", "bbox": {"l": 326.88608, "t": 324.68307000000004, "r": 350.13828, "b": 326.42209, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 326.88608, "t": 326.29327, "r": 351.59677, "b": 328.03232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 143, "text": " fluorescent lamp of transmitted", "bbox": {"l": 326.88608, "t": 326.29327, "r": 351.59677, "b": 328.03232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 326.88608, "t": 327.9035, "r": 336.89197, "b": 329.64252, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 144, "text": " illuminator.", "bbox": {"l": 326.88608, "t": 327.9035, "r": 336.89197, "b": 329.64252, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 358.42023, "t": 263.49492999999995, "r": 366.93256, "b": 265.23395000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 145, "text": "FOCUSING", "bbox": {"l": 358.42023, "t": 263.49492999999995, "r": 366.93256, "b": 265.23395000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 358.42023, "t": 265.10515999999996, "r": 359.89841, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 146, "text": "1.", "bbox": {"l": 358.42023, "t": 265.10515999999996, "r": 359.89841, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 360.63751, "t": 265.10515999999996, "r": 387.98407, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 147, "text": "Turn the focusing knob away or toward", "bbox": {"l": 360.63751, "t": 265.10515999999996, "r": 387.98407, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 358.42023, "t": 266.71533, "r": 384.58948, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 148, "text": " you until a clear image is viewed.", "bbox": {"l": 358.42023, "t": 266.71533, "r": 384.58948, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 358.42166, "t": 268.32556, "r": 359.78549, "b": 270.06458, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 149, "text": "2.", "bbox": {"l": 358.42166, "t": 268.32556, "r": 359.78549, "b": 270.06458, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 360.46741, "t": 268.32556, "r": 384.33441, "b": 270.06458, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 150, "text": "If the image is unclear, adjust the", "bbox": {"l": 360.46741, "t": 268.32556, "r": 384.33441, "b": 270.06458, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 358.4231, "t": 269.93579, "r": 384.61502, "b": 271.6748, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 151, "text": " height of the elevator up or down,", "bbox": {"l": 358.4231, "t": 269.93579, "r": 384.61502, "b": 271.6748, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 358.4231, "t": 271.54602, "r": 385.38922, "b": 273.28503, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 152, "text": " then turn the focusing knob again.", "bbox": {"l": 358.4231, "t": 271.54602, "r": 385.38922, "b": 273.28503, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 358.4231, "t": 274.76642000000004, "r": 377.35046, "b": 276.50543000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 153, "text": "ZOOM MAGNIFICATION", "bbox": {"l": 358.4231, "t": 274.76642000000004, "r": 377.35046, "b": 276.50543000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 358.4231, "t": 276.37665000000004, "r": 359.89429, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 154, "text": "1.", "bbox": {"l": 358.4231, "t": 276.37665000000004, "r": 359.89429, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 360.62988, "t": 276.37665000000004, "r": 386.37589, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 155, "text": "Turn the zoom magnification knob to", "bbox": {"l": 360.62988, "t": 276.37665000000004, "r": 386.37589, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 358.4231, "t": 277.98688000000004, "r": 386.78732, "b": 279.72589000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 156, "text": " the desired magnification and field of", "bbox": {"l": 358.4231, "t": 277.98688000000004, "r": 386.78732, "b": 279.72589000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 358.4231, "t": 279.59704999999997, "r": 364.16855, "b": 281.33609, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 157, "text": " view.", "bbox": {"l": 358.4231, "t": 279.59704999999997, "r": 364.16855, "b": 281.33609, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 358.4231, "t": 281.20728, "r": 359.86777, "b": 282.94632, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 158, "text": "2.", "bbox": {"l": 358.4231, "t": 281.20728, "r": 359.86777, "b": 282.94632, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 114, "label": "text", "bbox": {"l": 360.59012, "t": 281.20728, "r": 387.31656, "b": 282.94632, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 159, "text": "In most situations, it is recommended", "bbox": {"l": 360.59012, "t": 281.20728, "r": 387.31656, "b": 282.94632, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 115, "label": "text", "bbox": {"l": 358.4231, "t": 282.81750000000005, "r": 381.56656, "b": 284.55652, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 160, "text": " that you focus at the lowest ", "bbox": {"l": 358.4231, "t": 282.81750000000005, "r": 381.56656, "b": 284.55652, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 116, "label": "text", "bbox": {"l": 358.4231, "t": 284.4277, "r": 386.63403, "b": 286.16675, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 161, "text": " magnification, then move to a higher", "bbox": {"l": 358.4231, "t": 284.4277, "r": 386.63403, "b": 286.16675, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 117, "label": "text", "bbox": {"l": 358.42453, "t": 286.03793, "r": 382.77115, "b": 287.77695, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 162, "text": " magnification and re-focus as ", "bbox": {"l": 358.42453, "t": 286.03793, "r": 382.77115, "b": 287.77695, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 118, "label": "text", "bbox": {"l": 358.42453, "t": 287.64813, "r": 367.98694, "b": 289.38718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 163, "text": " necessary.", "bbox": {"l": 358.42453, "t": 287.64813, "r": 367.98694, "b": 289.38718, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 119, "label": "text", "bbox": {"l": 358.42453, "t": 289.25836, "r": 359.80386, "b": 290.99738, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 164, "text": "3.", "bbox": {"l": 358.42453, "t": 289.25836, "r": 359.80386, "b": 290.99738, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 120, "label": "text", "bbox": {"l": 360.49353, "t": 289.25836, "r": 386.70093, "b": 290.99738, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 165, "text": "If the image is not clear to both eyes", "bbox": {"l": 360.49353, "t": 289.25836, "r": 386.70093, "b": 290.99738, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 121, "label": "text", "bbox": {"l": 358.42453, "t": 290.86855999999995, "r": 388.03534, "b": 292.6076, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 166, "text": " at the same time, the diopter ring may", "bbox": {"l": 358.42453, "t": 290.86855999999995, "r": 388.03534, "b": 292.6076, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 122, "label": "text", "bbox": {"l": 358.42453, "t": 292.47879, "r": 373.13724, "b": 294.2178, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 167, "text": " need adjustment.", "bbox": {"l": 358.42453, "t": 292.47879, "r": 373.13724, "b": 294.2178, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 123, "label": "text", "bbox": {"l": 358.42453, "t": 295.69922, "r": 381.74539, "b": 297.43823, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 168, "text": "DIOPTER RING ADJUSTMENT", "bbox": {"l": 358.42453, "t": 295.69922, "r": 381.74539, "b": 297.43823, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 124, "label": "text", "bbox": {"l": 358.42453, "t": 297.30942, "r": 359.83682, "b": 299.04846, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 169, "text": "1.", "bbox": {"l": 358.42453, "t": 297.30942, "r": 359.83682, "b": 299.04846, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 125, "label": "text", "bbox": {"l": 360.54297, "t": 297.30942, "r": 388.08289, "b": 299.04846, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 170, "text": "To adjust the eyepiece for viewing with", "bbox": {"l": 360.54297, "t": 297.30942, "r": 388.08289, "b": 299.04846, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 126, "label": "text", "bbox": {"l": 358.42453, "t": 298.91965, "r": 382.73251, "b": 300.65866, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 171, "text": " or without eyeglasses and for ", "bbox": {"l": 358.42453, "t": 298.91965, "r": 382.73251, "b": 300.65866, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 127, "label": "text", "bbox": {"l": 358.42453, "t": 300.52985, "r": 387.72266, "b": 302.26889000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 172, "text": " differences in acuity between the right", "bbox": {"l": 358.42453, "t": 300.52985, "r": 387.72266, "b": 302.26889000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 128, "label": "text", "bbox": {"l": 358.42453, "t": 302.14008000000007, "r": 384.1991, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 173, "text": " and left eyes, follow the following", "bbox": {"l": 358.42453, "t": 302.14008000000007, "r": 384.1991, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 129, "label": "text", "bbox": {"l": 358.42453, "t": 303.75027, "r": 364.88672, "b": 305.48932, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 174, "text": " steps:", "bbox": {"l": 358.42453, "t": 303.75027, "r": 364.88672, "b": 305.48932, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 130, "label": "text", "bbox": {"l": 358.42453, "t": 305.3605, "r": 359.95078, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 175, "text": "a.", "bbox": {"l": 358.42453, "t": 305.3605, "r": 359.95078, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 131, "label": "text", "bbox": {"l": 361.47699, "t": 305.3605, "r": 386.65988, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 176, "text": "Observe an image through the left", "bbox": {"l": 361.47699, "t": 305.3605, "r": 386.65988, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 132, "label": "text", "bbox": {"l": 358.42453, "t": 306.9707, "r": 386.7634, "b": 308.70975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 177, "text": " eyepiece and bring a specific point", "bbox": {"l": 358.42453, "t": 306.9707, "r": 386.7634, "b": 308.70975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 133, "label": "text", "bbox": {"l": 358.42453, "t": 308.58093, "r": 385.41354, "b": 310.31995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 178, "text": " into focus using the focus knob.", "bbox": {"l": 358.42453, "t": 308.58093, "r": 385.41354, "b": 310.31995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 134, "label": "text", "bbox": {"l": 358.42453, "t": 310.19113, "r": 359.93304, "b": 311.93018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 179, "text": "b.", "bbox": {"l": 358.42453, "t": 310.19113, "r": 359.93304, "b": 311.93018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 135, "label": "text", "bbox": {"l": 361.44156, "t": 310.19113, "r": 382.56085, "b": 311.93018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 180, "text": "By turning the diopter ring ", "bbox": {"l": 361.44156, "t": 310.19113, "r": 382.56085, "b": 311.93018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 136, "label": "text", "bbox": {"l": 358.42596, "t": 311.80136, "r": 385.4559, "b": 313.54037, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 181, "text": " adjustment for the left eyepiece,", "bbox": {"l": 358.42596, "t": 311.80136, "r": 385.4559, "b": 313.54037, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 137, "label": "text", "bbox": {"l": 358.42596, "t": 313.41156, "r": 384.56122, "b": 315.15059999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 182, "text": " bring the same point into sharp", "bbox": {"l": 358.42596, "t": 313.41156, "r": 384.56122, "b": 315.15059999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 138, "label": "text", "bbox": {"l": 358.42596, "t": 315.02178999999995, "r": 366.74371, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 183, "text": " focus.", "bbox": {"l": 358.42596, "t": 315.02178999999995, "r": 366.74371, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 139, "label": "text", "bbox": {"l": 358.42596, "t": 316.63199, "r": 383.93884, "b": 318.37103, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 184, "text": " c.Then bring the same point into", "bbox": {"l": 358.42596, "t": 316.63199, "r": 383.93884, "b": 318.37103, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 140, "label": "text", "bbox": {"l": 358.42596, "t": 318.2422199999999, "r": 385.69241, "b": 319.9812299999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 185, "text": " focus through the right eyepiece", "bbox": {"l": 358.42596, "t": 318.2422199999999, "r": 385.69241, "b": 319.9812299999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 141, "label": "text", "bbox": {"l": 358.42596, "t": 319.85242000000005, "r": 385.94861, "b": 321.59146, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 186, "text": " by turning the right diopter ring.", "bbox": {"l": 358.42596, "t": 319.85242000000005, "r": 385.94861, "b": 321.59146, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 142, "label": "text", "bbox": {"l": 358.42596, "t": 321.46265, "r": 385.54236, "b": 323.20166, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 187, "text": " d.With more than one viewer, each", "bbox": {"l": 358.42596, "t": 321.46265, "r": 385.54236, "b": 323.20166, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 143, "label": "text", "bbox": {"l": 358.42596, "t": 323.07285, "r": 382.98718, "b": 324.81189, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 188, "text": " viewer should note their own", "bbox": {"l": 358.42596, "t": 323.07285, "r": 382.98718, "b": 324.81189, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 144, "label": "text", "bbox": {"l": 358.42596, "t": 324.68307000000004, "r": 385.06448, "b": 326.42209, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 189, "text": " diopter ring position for the left", "bbox": {"l": 358.42596, "t": 324.68307000000004, "r": 385.06448, "b": 326.42209, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 145, "label": "text", "bbox": {"l": 358.42596, "t": 326.29327, "r": 385.20682, "b": 328.03232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 190, "text": " and right eyepieces, then before", "bbox": {"l": 358.42596, "t": 326.29327, "r": 385.20682, "b": 328.03232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 146, "label": "text", "bbox": {"l": 358.42596, "t": 327.9035, "r": 382.21964, "b": 329.64252, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 191, "text": " viewing set the diopter ring", "bbox": {"l": 358.42596, "t": 327.9035, "r": 382.21964, "b": 329.64252, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 147, "label": "text", "bbox": {"l": 358.42596, "t": 329.5137, "r": 382.63382, "b": 331.25275, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 192, "text": " adjustments to that setting.", "bbox": {"l": 358.42596, "t": 329.5137, "r": 382.63382, "b": 331.25275, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 148, "label": "text", "bbox": {"l": 358.42596, "t": 332.73412999999994, "r": 375.67661, "b": 334.47317999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 193, "text": "CHANGING THE BULB", "bbox": {"l": 358.42596, "t": 332.73412999999994, "r": 375.67661, "b": 334.47317999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 149, "label": "text", "bbox": {"l": 358.42596, "t": 334.34436, "r": 359.90311, "b": 336.08337, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 194, "text": "1.", "bbox": {"l": 358.42596, "t": 334.34436, "r": 359.90311, "b": 336.08337, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 150, "label": "text", "bbox": {"l": 360.64169, "t": 334.34436, "r": 385.75333, "b": 336.08337, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 195, "text": "Disconnect the power cord from the", "bbox": {"l": 360.64169, "t": 334.34436, "r": 385.75333, "b": 336.08337, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 151, "label": "text", "bbox": {"l": 358.42596, "t": 335.95456, "r": 372.01416, "b": 337.6936, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 196, "text": " electrical outlet.", "bbox": {"l": 358.42596, "t": 335.95456, "r": 372.01416, "b": 337.6936, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 152, "label": "text", "bbox": {"l": 358.42596, "t": 337.56479, "r": 359.88327, "b": 339.3038, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 197, "text": "2.", "bbox": {"l": 358.42596, "t": 337.56479, "r": 359.88327, "b": 339.3038, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 153, "label": "text", "bbox": {"l": 360.61191, "t": 337.56479, "r": 384.65726, "b": 339.3038, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 198, "text": "When the bulb is cool, remove the", "bbox": {"l": 360.61191, "t": 337.56479, "r": 384.65726, "b": 339.3038, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 154, "label": "text", "bbox": {"l": 358.42596, "t": 339.17499, "r": 385.33649, "b": 340.9140300000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 199, "text": " oblique illuminator cap and remove", "bbox": {"l": 358.42596, "t": 339.17499, "r": 385.33649, "b": 340.9140300000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 155, "label": "text", "bbox": {"l": 358.42596, "t": 340.78522, "r": 379.57224, "b": 342.52423, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 200, "text": " the halogen bulb with cap.", "bbox": {"l": 358.42596, "t": 340.78522, "r": 379.57224, "b": 342.52423, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 156, "label": "text", "bbox": {"l": 358.4274, "t": 342.39542, "r": 359.91788, "b": 344.13446000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 201, "text": "3.", "bbox": {"l": 358.4274, "t": 342.39542, "r": 359.91788, "b": 344.13446000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 157, "label": "text", "bbox": {"l": 360.66312, "t": 342.39542, "r": 384.5108, "b": 344.13446000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 202, "text": "Replace with a new halogen bulb.", "bbox": {"l": 360.66312, "t": 342.39542, "r": 384.5108, "b": 344.13446000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 158, "label": "text", "bbox": {"l": 358.42883, "t": 344.00565000000006, "r": 359.92792, "b": 345.74466, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 203, "text": "4.", "bbox": {"l": 358.42883, "t": 344.00565000000006, "r": 359.92792, "b": 345.74466, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 159, "label": "text", "bbox": {"l": 360.67746, "t": 344.00565000000006, "r": 385.41235, "b": 345.74466, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 204, "text": "Open the window in the base plate", "bbox": {"l": 360.67746, "t": 344.00565000000006, "r": 385.41235, "b": 345.74466, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 160, "label": "text", "bbox": {"l": 358.42883, "t": 345.61584, "r": 383.2782, "b": 347.35489, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 205, "text": " and replace the halogen lamp or", "bbox": {"l": 358.42883, "t": 345.61584, "r": 383.2782, "b": 347.35489, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 161, "label": "text", "bbox": {"l": 358.42883, "t": 347.22607, "r": 383.13953, "b": 348.96509, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 206, "text": " fluorescent lamp of transmitted", "bbox": {"l": 358.42883, "t": 347.22607, "r": 383.13953, "b": 348.96509, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 162, "label": "text", "bbox": {"l": 358.42883, "t": 348.83627, "r": 368.43472, "b": 350.57532, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 207, "text": " illuminator.", "bbox": {"l": 358.42883, "t": 348.83627, "r": 368.43472, "b": 350.57532, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 163, "label": "text", "bbox": {"l": 326.59567, "t": 261.14185, "r": 339.11377, "b": 262.88091999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 208, "text": "Model AY11230", "bbox": {"l": 326.59567, "t": 261.14185, "r": 339.11377, "b": 262.88091999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 164, "label": "text", "bbox": {"l": 358.48605, "t": 261.14185, "r": 371.00415, "b": 262.88091999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 209, "text": "Model AY11234", "bbox": {"l": 358.48605, "t": 261.14185, "r": 371.00415, "b": 262.88091999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 165, "label": "text", "bbox": {"l": 455.43533, "t": 351.77038999999996, "r": 457.97827000000007, "b": 353.94415, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 210, "text": "14", "bbox": {"l": 455.43533, "t": 351.77038999999996, "r": 457.97827000000007, "b": 353.94415, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 166, "label": "text", "bbox": {"l": 408.24518, "t": 275.52673000000004, "r": 414.4234, "b": 276.96020999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 211, "text": "Objectives", "bbox": {"l": 408.24518, "t": 275.52673000000004, "r": 414.4234, "b": 276.96020999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 167, "label": "text", "bbox": {"l": 409.39554, "t": 268.98235999999997, "r": 419.06677, "b": 270.41583, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 212, "text": "Revolving Turret", "bbox": {"l": 409.39554, "t": 268.98235999999997, "r": 419.06677, "b": 270.41583, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 168, "label": "text", "bbox": {"l": 441.3895, "t": 279.12627999999995, "r": 445.87192, "b": 280.55975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 213, "text": "Coarse ", "bbox": {"l": 441.3895, "t": 279.12627999999995, "r": 445.87192, "b": 280.55975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 169, "label": "text", "bbox": {"l": 441.3895, "t": 280.30609, "r": 448.22338999999994, "b": 281.7395900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 214, "text": "Adjustment", "bbox": {"l": 441.3895, "t": 280.30609, "r": 448.22338999999994, "b": 281.7395900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 170, "label": "text", "bbox": {"l": 441.3895, "t": 281.48593, "r": 444.40371999999996, "b": 282.91939999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 215, "text": "Knob", "bbox": {"l": 441.3895, "t": 281.48593, "r": 444.40371999999996, "b": 282.91939999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 171, "label": "text", "bbox": {"l": 398.79288, "t": 254.94646999999998, "r": 428.91568, "b": 258.85931000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 216, "text": "MODEL AY11236", "bbox": {"l": 398.79288, "t": 254.94646999999998, "r": 428.91568, "b": 258.85931000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 172, "label": "text", "bbox": {"l": 398.32535, "t": 305.04291, "r": 435.93542, "b": 308.95572000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 217, "text": "MICROSCOPE USAGE", "bbox": {"l": 398.32535, "t": 305.04291, "r": 435.93542, "b": 308.95572000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 173, "label": "text", "bbox": {"l": 398.08594, "t": 310.35892, "r": 453.72171, "b": 312.53271, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 218, "text": "BARSKA Model AY11236 is a powerful fixed power compound ", "bbox": {"l": 398.08594, "t": 310.35892, "r": 453.72171, "b": 312.53271, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 174, "label": "text", "bbox": {"l": 398.08594, "t": 312.50586, "r": 453.09939999999995, "b": 314.67966, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 219, "text": "microscope designed for biological studies such as specimen ", "bbox": {"l": 398.08594, "t": 312.50586, "r": 453.09939999999995, "b": 314.67966, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 175, "label": "text", "bbox": {"l": 398.08594, "t": 314.6528, "r": 456.65246999999994, "b": 316.8266, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 220, "text": "examination. It can also be used for examining bacteria and", "bbox": {"l": 398.08594, "t": 314.6528, "r": 456.65246999999994, "b": 316.8266, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 176, "label": "text", "bbox": {"l": 398.08594, "t": 316.79977, "r": 456.73859000000004, "b": 318.97354, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 221, "text": "for general clinical and medical studies and other scientific uses. ", "bbox": {"l": 398.08594, "t": 316.79977, "r": 456.73859000000004, "b": 318.97354, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 177, "label": "text", "bbox": {"l": 398.62399, "t": 320.42941, "r": 427.77472, "b": 324.34222000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 222, "text": "CONSTRUCTION", "bbox": {"l": 398.62399, "t": 320.42941, "r": 427.77472, "b": 324.34222000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 178, "label": "text", "bbox": {"l": 398.08594, "t": 326.46069000000006, "r": 456.02639999999997, "b": 328.63449, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 223, "text": "BARSKA Model AY11236 is a fixed power compound microscope.", "bbox": {"l": 398.08594, "t": 326.46069000000006, "r": 456.02639999999997, "b": 328.63449, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 179, "label": "text", "bbox": {"l": 398.08414, "t": 328.6076699999999, "r": 455.42238999999995, "b": 330.7814599999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 224, "text": "It is constructed with two optical paths at the same angle. It is ", "bbox": {"l": 398.08414, "t": 328.6076699999999, "r": 455.42238999999995, "b": 330.7814599999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 180, "label": "text", "bbox": {"l": 398.08414, "t": 330.75461, "r": 457.39844, "b": 332.92841, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 225, "text": "equipped with transmitted illumination. By using this instrument, ", "bbox": {"l": 398.08414, "t": 330.75461, "r": 457.39844, "b": 332.92841, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 181, "label": "text", "bbox": {"l": 398.08414, "t": 332.90155, "r": 453.97745, "b": 335.07535000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 226, "text": "the user can observe specimens at magnification from 40x to ", "bbox": {"l": 398.08414, "t": 332.90155, "r": 453.97745, "b": 335.07535000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 182, "label": "text", "bbox": {"l": 398.08414, "t": 335.04852, "r": 454.70708999999994, "b": 337.22232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 227, "text": "1000x by selecting the desired objective lens. Coarse and fine ", "bbox": {"l": 398.08414, "t": 335.04852, "r": 454.70708999999994, "b": 337.22232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 183, "label": "text", "bbox": {"l": 398.08414, "t": 337.19547, "r": 458.90240000000006, "b": 339.36926, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 228, "text": "focus adjustments provide accuracy and image detail. The rotating ", "bbox": {"l": 398.08414, "t": 337.19547, "r": 458.90240000000006, "b": 339.36926, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 184, "label": "text", "bbox": {"l": 398.08594, "t": 339.34241, "r": 453.0672, "b": 341.5162, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 229, "text": "head allows the user to position the eyepieces for maximum ", "bbox": {"l": 398.08594, "t": 339.34241, "r": 453.0672, "b": 341.5162, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 185, "label": "text", "bbox": {"l": 398.08594, "t": 341.48938, "r": 449.63113, "b": 343.66318, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 230, "text": "viewing comfort and easy access to all adjustment knobs.", "bbox": {"l": 398.08594, "t": 341.48938, "r": 449.63113, "b": 343.66318, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 186, "label": "text", "bbox": {"l": 422.10626, "t": 301.24191, "r": 434.62433000000004, "b": 302.98096, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 231, "text": "Model AY11236", "bbox": {"l": 422.10626, "t": 301.24191, "r": 434.62433000000004, "b": 302.98096, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 187, "label": "text", "bbox": {"l": 442.01610999999997, "t": 283.08649, "r": 444.8817399999999, "b": 284.51996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 232, "text": "Fine ", "bbox": {"l": 442.01610999999997, "t": 283.08649, "r": 444.8817399999999, "b": 284.51996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 188, "label": "text", "bbox": {"l": 442.01610999999997, "t": 284.2663, "r": 448.85001, "b": 285.69980000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 233, "text": "Adjustment", "bbox": {"l": 442.01610999999997, "t": 284.2663, "r": 448.85001, "b": 285.69980000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 189, "label": "text", "bbox": {"l": 442.01610999999997, "t": 285.44611, "r": 445.03033000000005, "b": 286.87961, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 234, "text": "Knob", "bbox": {"l": 442.01610999999997, "t": 285.44611, "r": 445.03033000000005, "b": 286.87961, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 190, "label": "text", "bbox": {"l": 408.00577, "t": 279.12579000000005, "r": 411.42212, "b": 280.5593, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 235, "text": "Stage", "bbox": {"l": 408.00577, "t": 279.12579000000005, "r": 411.42212, "b": 280.5593, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 191, "label": "text", "bbox": {"l": 404.07172, "t": 280.9144299999999, "r": 410.77707, "b": 282.3479, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 236, "text": "Condenser ", "bbox": {"l": 404.07172, "t": 280.9144299999999, "r": 410.77707, "b": 282.3479, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 192, "label": "text", "bbox": {"l": 404.07172, "t": 282.09424, "r": 409.2157, "b": 283.52774, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 237, "text": "Focusing", "bbox": {"l": 404.07172, "t": 282.09424, "r": 409.2157, "b": 283.52774, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 193, "label": "text", "bbox": {"l": 404.07172, "t": 283.27408, "r": 407.08594, "b": 284.7075500000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 238, "text": "Knob", "bbox": {"l": 404.07172, "t": 283.27408, "r": 407.08594, "b": 284.7075500000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 194, "label": "text", "bbox": {"l": 441.81281, "t": 262.32178, "r": 447.03702, "b": 263.75525000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 239, "text": "Eyepiece", "bbox": {"l": 441.81281, "t": 262.32178, "r": 447.03702, "b": 263.75525000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 195, "label": "text", "bbox": {"l": 437.34607, "t": 271.13025000000005, "r": 440.80496, "b": 272.56281, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 240, "text": "Stand", "bbox": {"l": 437.34607, "t": 271.13025000000005, "r": 440.80496, "b": 272.56281, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 196, "label": "text", "bbox": {"l": 409.7164, "t": 284.40027, "r": 413.3768, "b": 285.83282, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 241, "text": "Lamp ", "bbox": {"l": 409.7164, "t": 284.40027, "r": 413.3768, "b": 285.83282, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 197, "label": "text", "bbox": {"l": 409.7164, "t": 285.83163, "r": 413.68201, "b": 287.26416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 242, "text": "On/Off", "bbox": {"l": 409.7164, "t": 285.83163, "r": 413.68201, "b": 287.26416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 198, "label": "text", "bbox": {"l": 409.7164, "t": 287.263, "r": 413.6337, "b": 288.69553, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 243, "text": "Switch", "bbox": {"l": 409.7164, "t": 287.263, "r": 413.6337, "b": 288.69553, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 199, "label": "text", "bbox": {"l": 434.8712499999999, "t": 296.7153, "r": 438.53164999999996, "b": 298.14783, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 244, "text": "Lamp ", "bbox": {"l": 434.8712499999999, "t": 296.7153, "r": 438.53164999999996, "b": 298.14783, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 200, "label": "text", "bbox": {"l": 439.52039, "t": 292.18307000000004, "r": 443.08768, "b": 293.61560000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 245, "text": "Power", "bbox": {"l": 439.52039, "t": 292.18307000000004, "r": 443.08768, "b": 293.61560000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 201, "label": "text", "bbox": {"l": 439.52039, "t": 293.61444, "r": 442.29575, "b": 295.04697, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 246, "text": "Cord", "bbox": {"l": 439.52039, "t": 293.61444, "r": 442.29575, "b": 295.04697, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 202, "label": "text", "bbox": {"l": 413.55829, "t": 264.66089, "r": 421.94913, "b": 266.09344, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 247, "text": "Rotating Head", "bbox": {"l": 413.55829, "t": 264.66089, "r": 421.94913, "b": 266.09344, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 203, "label": "text", "bbox": {"l": 441.84316999999993, "t": 286.90573, "r": 447.87585000000007, "b": 288.33826, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 248, "text": "Stage Clip", "bbox": {"l": 441.84316999999993, "t": 286.90573, "r": 447.87585000000007, "b": 288.33826, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 204, "label": "text", "bbox": {"l": 441.84316999999993, "t": 288.3371, "r": 448.67252, "b": 289.76962000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 249, "text": "Adjustment", "bbox": {"l": 441.84316999999993, "t": 288.3371, "r": 448.67252, "b": 289.76962000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 205, "label": "text", "bbox": {"l": 407.2403, "t": 259.86645999999996, "r": 425.79089, "b": 261.29895, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 250, "text": "Interpupillary Slide Adjustment", "bbox": {"l": 407.2403, "t": 259.86645999999996, "r": 425.79089, "b": 261.29895, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 206, "label": "text", "bbox": {"l": 449.10074000000003, "t": 378.66302, "r": 466.08835000000005, "b": 380.78412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 251, "text": "Circling Minimums", "bbox": {"l": 449.10074000000003, "t": 378.66302, "r": 466.08835000000005, "b": 380.78412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 207, "label": "text", "bbox": {"l": 449.10074000000003, "t": 383.2203999999999, "r": 449.64444, "b": 385.34148999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 252, "text": "7", "bbox": {"l": 449.10074000000003, "t": 383.2203999999999, "r": 449.64444, "b": 385.34148999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 208, "label": "text", "bbox": {"l": 450.18811, "t": 383.2203999999999, "r": 550.77124, "b": 385.34148999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 253, "text": "K H U H Z D V D F K D Q J H W R W K H 7 ( 5 3 6 F U L W H U L D L Q W K D W D \u1087H F W V F L U F O L Q J D U H D G L P H Q V L R Q E \\ H [ S D Q G L Q J W K H D U H D V W R S U R Y L G H ", "bbox": {"l": 450.18811, "t": 383.2203999999999, "r": 550.77124, "b": 385.34148999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 209, "label": "text", "bbox": {"l": 449.10074000000003, "t": 385.75732, "r": 536.14716, "b": 387.87842, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 254, "text": "improved obstacle protection. To indicate that the new criteria had been applied to a given procedure, a ", "bbox": {"l": 449.10074000000003, "t": 385.75732, "r": 536.14716, "b": 387.87842, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 210, "label": "text", "bbox": {"l": 538.31085, "t": 385.75732, "r": 549.49921, "b": 387.87842, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 255, "text": " is placed on ", "bbox": {"l": 538.31085, "t": 385.75732, "r": 549.49921, "b": 387.87842, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 211, "label": "text", "bbox": {"l": 449.10074000000003, "t": 388.03601, "r": 547.58185, "b": 390.1571, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 256, "text": "the circling line of minimums. The new circling tables and explanatory information is located in the Legend of the TPP.", "bbox": {"l": 449.10074000000003, "t": 388.03601, "r": 547.58185, "b": 390.1571, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 212, "label": "text", "bbox": {"l": 449.10074000000003, "t": 393.2128000000001, "r": 449.6163, "b": 395.33386, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 257, "text": "7", "bbox": {"l": 449.10074000000003, "t": 393.2128000000001, "r": 449.6163, "b": 395.33386, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 213, "label": "text", "bbox": {"l": 450.1319, "t": 393.2128000000001, "r": 529.53082, "b": 395.33386, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 258, "text": "K H D S S U R D F K H V X V L Q J V W D Q G D U G F L U F O L Q J D S S U R D F K D U H D V F D Q E H L G H Q W L \u00bf H G E \\ W K H D E V H Q F H R I W K H ", "bbox": {"l": 450.1319, "t": 393.2128000000001, "r": 529.53082, "b": 395.33386, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 214, "label": "text", "bbox": {"l": 532.05829, "t": 393.2128000000001, "r": 550.42261, "b": 395.33386, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 259, "text": " on the circling line of ", "bbox": {"l": 532.05829, "t": 393.2128000000001, "r": 550.42261, "b": 395.33386, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 215, "label": "text", "bbox": {"l": 449.10074000000003, "t": 395.49149, "r": 455.74692, "b": 397.61255, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 260, "text": "minima.", "bbox": {"l": 449.10074000000003, "t": 395.49149, "r": 455.74692, "b": 397.61255, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 216, "label": "text", "bbox": {"l": 449.95525999999995, "t": 415.59549, "r": 496.2829, "b": 417.50446, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 261, "text": "$ S S O \\ 6 W D Q G D U G & L U F O L Q J $ S S U R D F K 0 D Q H X Y H U L Q J 5 D G L X V 7 D E O H ", "bbox": {"l": 449.95525999999995, "t": 415.59549, "r": 496.2829, "b": 417.50446, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 217, "label": "text", "bbox": {"l": 501.13077, "t": 409.25543, "r": 551.16101, "b": 411.1644, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 262, "text": "$ S S O \\ ( [ S D Q G H G & L U F O L Q J $ S S U R D F K 0 D Q H X Y H U L Q J $ L U V S D F H 5 D G L X V ", "bbox": {"l": 501.13077, "t": 409.25543, "r": 551.16101, "b": 411.1644, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 218, "label": "text", "bbox": {"l": 501.13077, "t": 411.30624, "r": 505.2477999999999, "b": 413.21521, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 263, "text": "Table", "bbox": {"l": 501.13077, "t": 411.30624, "r": 505.2477999999999, "b": 413.21521, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 219, "label": "text", "bbox": {"l": 449.10074000000003, "t": 420.18802, "r": 469.35599, "b": 422.73331, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 264, "text": "AIRPORT SKETCH", "bbox": {"l": 449.10074000000003, "t": 420.18802, "r": 469.35599, "b": 422.73331, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 220, "label": "text", "bbox": {"l": 449.10074000000003, "t": 425.08908, "r": 525.93616, "b": 427.21017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 265, "text": "The airport sketch is a depiction of the airport with emphasis on runway pattern and related ", "bbox": {"l": 449.10074000000003, "t": 425.08908, "r": 525.93616, "b": 427.21017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 221, "label": "text", "bbox": {"l": 449.10074000000003, "t": 427.3678, "r": 522.0343, "b": 429.48886, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 266, "text": "information, positioned in either the lower left or lower right corner of the chart to aid pi-", "bbox": {"l": 449.10074000000003, "t": 427.3678, "r": 522.0343, "b": 429.48886, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 222, "label": "text", "bbox": {"l": 449.10074000000003, "t": 429.64648, "r": 524.67151, "b": 431.76755, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 267, "text": "lot recognition of the airport from the air and to provide some information to aid on ground ", "bbox": {"l": 449.10074000000003, "t": 429.64648, "r": 524.67151, "b": 431.76755, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 223, "label": "text", "bbox": {"l": 449.10074000000003, "t": 431.92514000000006, "r": 527.172, "b": 434.04623, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 268, "text": "navigation of the airport. The runways are drawn to scale and oriented to true north. Runway ", "bbox": {"l": 449.10074000000003, "t": 431.92514000000006, "r": 527.172, "b": 434.04623, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 224, "label": "text", "bbox": {"l": 449.10074000000003, "t": 434.20383, "r": 502.39545, "b": 436.32492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 269, "text": "dimensions (length and width) are shown for all active runways.", "bbox": {"l": 449.10074000000003, "t": 434.20383, "r": 502.39545, "b": 436.32492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 225, "label": "text", "bbox": {"l": 449.10074000000003, "t": 438.7611999999999, "r": 512.92676, "b": 440.88228999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 270, "text": "Runway(s) are depicted based on what type and construction of the runway.", "bbox": {"l": 449.10074000000003, "t": 438.7611999999999, "r": 512.92676, "b": 440.88228999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 226, "label": "text", "bbox": {"l": 449.95525999999995, "t": 444.07001, "r": 460.02307, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 271, "text": "Hard Surface", "bbox": {"l": 449.95525999999995, "t": 444.07001, "r": 460.02307, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 227, "label": "text", "bbox": {"l": 464.89963, "t": 444.07001, "r": 473.98819, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 272, "text": "Other Than ", "bbox": {"l": 464.89963, "t": 444.07001, "r": 473.98819, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 228, "label": "text", "bbox": {"l": 464.89963, "t": 446.12085, "r": 474.96744, "b": 448.02979, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 273, "text": "Hard Surface", "bbox": {"l": 464.89963, "t": 446.12085, "r": 474.96744, "b": 448.02979, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 229, "label": "text", "bbox": {"l": 478.91357, "t": 444.07001, "r": 489.45648, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 274, "text": "Metal Surface", "bbox": {"l": 478.91357, "t": 444.07001, "r": 489.45648, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 230, "label": "text", "bbox": {"l": 493.06420999999995, "t": 444.07001, "r": 505.03076, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 275, "text": "Closed Runway", "bbox": {"l": 493.06420999999995, "t": 444.07001, "r": 505.03076, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 231, "label": "text", "bbox": {"l": 509.5809, "t": 444.07001, "r": 524.30237, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 276, "text": "Under Construction", "bbox": {"l": 509.5809, "t": 444.07001, "r": 524.30237, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 232, "label": "text", "bbox": {"l": 449.95525999999995, "t": 454.81207, "r": 458.31406, "b": 456.72104, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 277, "text": "Stopways, ", "bbox": {"l": 449.95525999999995, "t": 454.81207, "r": 458.31406, "b": 456.72104, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 233, "label": "text", "bbox": {"l": 449.95525999999995, "t": 456.86288, "r": 461.92083999999994, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 278, "text": "Taxiways, Park-", "bbox": {"l": 449.95525999999995, "t": 456.86288, "r": 461.92083999999994, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 234, "label": "text", "bbox": {"l": 449.95525999999995, "t": 458.91373, "r": 457.08014, "b": 460.82268999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 279, "text": "ing Areas", "bbox": {"l": 449.95525999999995, "t": 458.91373, "r": 457.08014, "b": 460.82268999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 235, "label": "text", "bbox": {"l": 464.89963, "t": 454.81207, "r": 472.87732, "b": 456.72104, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 280, "text": "Displaced ", "bbox": {"l": 464.89963, "t": 454.81207, "r": 472.87732, "b": 456.72104, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 236, "label": "text", "bbox": {"l": 464.89963, "t": 456.86288, "r": 472.49792, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 281, "text": "Threshold", "bbox": {"l": 464.89963, "t": 456.86288, "r": 472.49792, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 237, "label": "text", "bbox": {"l": 478.91357, "t": 454.81207, "r": 483.61584, "b": 456.72104, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 282, "text": "Closed", "bbox": {"l": 478.91357, "t": 454.81207, "r": 483.61584, "b": 456.72104, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 238, "label": "text", "bbox": {"l": 478.91357, "t": 456.86288, "r": 486.60754000000003, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 283, "text": "Pavement", "bbox": {"l": 478.91357, "t": 456.86288, "r": 486.60754000000003, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 239, "label": "text", "bbox": {"l": 493.06420999999995, "t": 454.81207, "r": 504.20648, "b": 456.72104, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 284, "text": "Water Runway", "bbox": {"l": 493.06420999999995, "t": 454.81207, "r": 504.20648, "b": 456.72104, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 240, "label": "text", "bbox": {"l": 449.10074000000003, "t": 469.32974, "r": 548.59674, "b": 471.45081, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 285, "text": "Taxiways and aprons are shaded grey. Other runway features that may be shown are runway numbers, runway dimen-", "bbox": {"l": 449.10074000000003, "t": 469.32974, "r": 548.59674, "b": 471.45081, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 241, "label": "text", "bbox": {"l": 449.10074000000003, "t": 471.60843, "r": 500.08181999999994, "b": 473.72949, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 286, "text": "sions, runway slope, arresting gear, and displaced threshold.", "bbox": {"l": 449.10074000000003, "t": 471.60843, "r": 500.08181999999994, "b": 473.72949, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 242, "label": "text", "bbox": {"l": 449.10074000000003, "t": 476.16577, "r": 449.59933000000007, "b": 478.28687, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 287, "text": "2", "bbox": {"l": 449.10074000000003, "t": 476.16577, "r": 449.59933000000007, "b": 478.28687, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 243, "label": "text", "bbox": {"l": 450.09796, "t": 476.16577, "r": 547.82562, "b": 478.28687, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 288, "text": "W K H U L Q I R U P D W L R Q F R Q F H U Q L Q J O L J K W L Q J \u00bf Q D O D S S U R D F K E H D U L Q J V D L U S R U W E H D F R Q R E V W D F O H V F R Q W U R O W R Z H U 1 $ 9 $ , ' V K H O L ", "bbox": {"l": 450.09796, "t": 476.16577, "r": 547.82562, "b": 478.28687, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 244, "label": "text", "bbox": {"l": 547.82623, "t": 476.16577, "r": 548.45862, "b": 478.28687, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 289, "text": "-", "bbox": {"l": 547.82623, "t": 476.16577, "r": 548.45862, "b": 478.28687, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 245, "label": "text", "bbox": {"l": 449.10074000000003, "t": 478.44446, "r": 470.52609000000007, "b": 480.56555, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 290, "text": "pads may also be shown.", "bbox": {"l": 449.10074000000003, "t": 478.44446, "r": 470.52609000000007, "b": 480.56555, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 246, "label": "text", "bbox": {"l": 449.10074000000003, "t": 483.00183, "r": 493.37906000000004, "b": 485.12292, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 291, "text": "$ L U S R U W ( O H Y D W L R Q D Q G 7 R X F K G R Z Q = R Q H ( O H Y D W L R Q ", "bbox": {"l": 449.10074000000003, "t": 483.00183, "r": 493.37906000000004, "b": 485.12292, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 449.10074000000003, "t": 487.5592, "r": 551.80023, "b": 496.51636, "coord_origin": "TOPLEFT"}, "confidence": 0.5027862787246704, "cells": [{"id": 292, "text": "The airport elevation is shown enclosed within a box in the upper left corner of the sketch box and the touchdown zone ", "bbox": {"l": 449.10074000000003, "t": 487.5592, "r": 549.16168, "b": 489.6803, "coord_origin": "TOPLEFT"}}, {"id": 293, "text": "elevation (TDZE) is shown in the upper right corner of the sketch box. The airport elevation is the highest point of an ", "bbox": {"l": 449.10074000000003, "t": 489.83789, "r": 546.90881, "b": 491.95898, "coord_origin": "TOPLEFT"}}, {"id": 294, "text": "D L U S R U W \u00b6 V X V D E O H U X Q Z D \\ V P H D V X U H G L Q I H H W I U R P P H D Q V H D O H Y H O 7 K H 7 ' = ( L V W K H K L J K H V W H O H Y D W L R Q L Q W K H \u00bf U V W I H H W R I ", "bbox": {"l": 449.10074000000003, "t": 492.11658, "r": 551.80023, "b": 494.23767, "coord_origin": "TOPLEFT"}}, {"id": 295, "text": "the landing surface. Circling only approaches will not show a TDZE.", "bbox": {"l": 449.10074000000003, "t": 494.39526, "r": 505.85068000000007, "b": 496.51636, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 247, "label": "text", "bbox": {"l": 498.80661000000003, "t": 515.9437, "r": 502.08792, "b": 519.01764, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 296, "text": "114", "bbox": {"l": 498.80661000000003, "t": 515.9437, "r": 502.08792, "b": 519.01764, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 248, "label": "text", "bbox": {"l": 444.56319999999994, "t": 422.84869, "r": 446.25998, "b": 471.87128, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 297, "text": "FAA Chart Users\u2019 Guide - Terminal Procedures Publication (TPP) - Terms", "bbox": {"l": 444.56319999999994, "t": 422.84869, "r": 446.25998, "b": 471.87128, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 249, "label": "text", "bbox": {"l": 329.40536, "t": 379.37537, "r": 355.13138, "b": 382.13336, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 298, "text": "AGL 2013 Financial Calendar", "bbox": {"l": 329.40536, "t": 379.37537, "r": 355.13138, "b": 382.13336, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 250, "label": "text", "bbox": {"l": 329.40536, "t": 382.30273, "r": 330.96848, "b": 384.55927, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 299, "text": "22", "bbox": {"l": 329.40536, "t": 382.30273, "r": 330.96848, "b": 384.55927, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 251, "label": "text", "bbox": {"l": 331.75003, "t": 382.30273, "r": 341.12875, "b": 384.55927, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 300, "text": "August 2012 ", "bbox": {"l": 331.75003, "t": 382.30273, "r": 341.12875, "b": 384.55927, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 252, "label": "text", "bbox": {"l": 350.4722, "t": 382.30273, "r": 384.81079, "b": 384.55927, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 301, "text": "2012 full year result and fi nal dividend announced", "bbox": {"l": 350.4722, "t": 382.30273, "r": 384.81079, "b": 384.55927, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 253, "label": "text", "bbox": {"l": 329.40536, "t": 384.84552, "r": 330.97336, "b": 387.10205, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 302, "text": "30", "bbox": {"l": 329.40536, "t": 384.84552, "r": 330.97336, "b": 387.10205, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 254, "label": "text", "bbox": {"l": 331.75735, "t": 384.84552, "r": 341.16534, "b": 387.10205, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 303, "text": "August 2012 ", "bbox": {"l": 331.75735, "t": 384.84552, "r": 341.16534, "b": 387.10205, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 255, "label": "text", "bbox": {"l": 350.4722, "t": 384.84552, "r": 372.90613, "b": 387.10205, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 304, "text": "Ex-dividend trading commences", "bbox": {"l": 350.4722, "t": 384.84552, "r": 372.90613, "b": 387.10205, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 256, "label": "text", "bbox": {"l": 329.40536, "t": 387.38828, "r": 330.20337, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 305, "text": "5", "bbox": {"l": 329.40536, "t": 387.38828, "r": 330.20337, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 257, "label": "text", "bbox": {"l": 331.00137, "t": 387.38828, "r": 342.9715, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 306, "text": "September 2012 ", "bbox": {"l": 331.00137, "t": 387.38828, "r": 342.9715, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 258, "label": "text", "bbox": {"l": 350.4722, "t": 387.38828, "r": 374.88693, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 307, "text": "Record date for 2012 fi nal dividend", "bbox": {"l": 350.4722, "t": 387.38828, "r": 374.88693, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 259, "label": "text", "bbox": {"l": 329.40536, "t": 389.93103, "r": 331.0173, "b": 392.18762, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 308, "text": "27", "bbox": {"l": 329.40536, "t": 389.93103, "r": 331.0173, "b": 392.18762, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 260, "label": "text", "bbox": {"l": 331.82327, "t": 389.93103, "r": 343.91284, "b": 392.18762, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 309, "text": "September 2012 ", "bbox": {"l": 331.82327, "t": 389.93103, "r": 343.91284, "b": 392.18762, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 261, "label": "text", "bbox": {"l": 350.4722, "t": 389.93103, "r": 365.65988, "b": 392.18762, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 310, "text": "Final dividend payable", "bbox": {"l": 350.4722, "t": 389.93103, "r": 365.65988, "b": 392.18762, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 262, "label": "text", "bbox": {"l": 329.40536, "t": 392.47382, "r": 330.98804, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 311, "text": "23", "bbox": {"l": 329.40536, "t": 392.47382, "r": 330.98804, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 263, "label": "text", "bbox": {"l": 331.77936, "t": 392.47382, "r": 342.06674, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 312, "text": "October 2012 ", "bbox": {"l": 331.77936, "t": 392.47382, "r": 342.06674, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 264, "label": "text", "bbox": {"l": 350.4722, "t": 392.47382, "r": 367.22156, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 313, "text": "Annual General Meeting", "bbox": {"l": 350.4722, "t": 392.47382, "r": 367.22156, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 265, "label": "text", "bbox": {"l": 329.40536, "t": 395.0166, "r": 330.99741, "b": 397.27313, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 314, "text": "27", "bbox": {"l": 329.40536, "t": 395.0166, "r": 330.99741, "b": 397.27313, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 266, "label": "text", "bbox": {"l": 331.7934, "t": 395.0166, "r": 342.1416, "b": 397.27313, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 315, "text": "February 2013", "bbox": {"l": 331.7934, "t": 395.0166, "r": 342.1416, "b": 397.27313, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 267, "label": "text", "bbox": {"l": 342.64841, "t": 395.18298, "r": 342.65811, "b": 396.49857000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 316, "text": " 1", "bbox": {"l": 342.64841, "t": 395.18298, "r": 342.65811, "b": 396.49857000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 268, "label": "text", "bbox": {"l": 350.47177, "t": 395.01474, "r": 386.25897, "b": 397.2713, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 317, "text": "2013 interim result and interim dividend announced", "bbox": {"l": 350.47177, "t": 395.01474, "r": 386.25897, "b": 397.2713, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 269, "label": "text", "bbox": {"l": 329.40491, "t": 397.55749999999995, "r": 331.02695, "b": 399.81406, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 318, "text": "28", "bbox": {"l": 329.40491, "t": 397.55749999999995, "r": 331.02695, "b": 399.81406, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 270, "label": "text", "bbox": {"l": 331.83795, "t": 397.55749999999995, "r": 340.75909, "b": 399.81406, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 319, "text": "August 2013", "bbox": {"l": 331.83795, "t": 397.55749999999995, "r": 340.75909, "b": 399.81406, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 271, "label": "text", "bbox": {"l": 341.26437, "t": 397.7254, "r": 341.27408, "b": 399.04095, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 320, "text": " 1", "bbox": {"l": 341.26437, "t": 397.7254, "r": 341.27408, "b": 399.04095, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 272, "label": "text", "bbox": {"l": 350.47144, "t": 397.55713, "r": 385.93265, "b": 399.81369, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 321, "text": "2013 full year results and fi nal dividend announced ", "bbox": {"l": 350.47144, "t": 397.55713, "r": 385.93265, "b": 399.81369, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 273, "label": "text", "bbox": {"l": 329.40536, "t": 400.46155, "r": 329.87708, "b": 401.96588, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 322, "text": "1", "bbox": {"l": 329.40536, "t": 400.46155, "r": 329.87708, "b": 401.96588, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 274, "label": "text", "bbox": {"l": 330.34882, "t": 400.46155, "r": 358.65204, "b": 401.96588, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 323, "text": "Indicative dates only, subject to change/Board confi rmation", "bbox": {"l": 330.34882, "t": 400.46155, "r": 358.65204, "b": 401.96588, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 275, "label": "text", "bbox": {"l": 329.40536, "t": 404.34503, "r": 391.771, "b": 406.60156, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 324, "text": "AGL\u2019s Annual General Meeting will be held at the City Recital Hall, Angel Place, Sydney ", "bbox": {"l": 329.40536, "t": 404.34503, "r": 391.771, "b": 406.60156, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 276, "label": "text", "bbox": {"l": 329.40536, "t": 406.37857, "r": 369.65308, "b": 408.63513000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 325, "text": "commencing at 10.30am on Tuesday 23 October 2012.", "bbox": {"l": 329.40536, "t": 406.37857, "r": 369.65308, "b": 408.63513000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 277, "label": "text", "bbox": {"l": 363.54486, "t": 460.53054999999995, "r": 379.25955, "b": 465.54507, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 326, "text": "Ye s te rd ay", "bbox": {"l": 363.54486, "t": 460.53054999999995, "r": 379.25955, "b": 465.54507, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 278, "label": "text", "bbox": {"l": 363.54486, "t": 466.7157, "r": 391.38229, "b": 468.97223, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 327, "text": "Established in Sydney in 1837, and then ", "bbox": {"l": 363.54486, "t": 466.7157, "r": 391.38229, "b": 468.97223, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 279, "label": "text", "bbox": {"l": 363.54486, "t": 468.74924, "r": 395.01788, "b": 471.00577, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 328, "text": "known as The Australian Gas Light Company, ", "bbox": {"l": 363.54486, "t": 468.74924, "r": 395.01788, "b": 471.00577, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 280, "label": "text", "bbox": {"l": 363.54486, "t": 470.78281, "r": 394.08322, "b": 473.03934, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 329, "text": "the AGL business has an established history ", "bbox": {"l": 363.54486, "t": 470.78281, "r": 394.08322, "b": 473.03934, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 281, "label": "text", "bbox": {"l": 363.54486, "t": 472.81635, "r": 390.60727, "b": 475.07288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 330, "text": "and reputation for serving the gas and ", "bbox": {"l": 363.54486, "t": 472.81635, "r": 390.60727, "b": 475.07288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 282, "label": "text", "bbox": {"l": 363.54486, "t": 474.84988, "r": 393.49612, "b": 477.10645, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 331, "text": "electricity needs of Australian households. ", "bbox": {"l": 363.54486, "t": 474.84988, "r": 393.49612, "b": 477.10645, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 283, "label": "text", "bbox": {"l": 363.54486, "t": 476.88345, "r": 394.11481, "b": 479.13998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 332, "text": "In 1841, when AGL supplied the gas to light ", "bbox": {"l": 363.54486, "t": 476.88345, "r": 394.11481, "b": 479.13998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 284, "label": "text", "bbox": {"l": 363.54486, "t": 478.91699, "r": 393.75891, "b": 481.17352, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 333, "text": "the fi rst public street lamp, it was reported ", "bbox": {"l": 363.54486, "t": 478.91699, "r": 393.75891, "b": 481.17352, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 285, "label": "text", "bbox": {"l": 363.54486, "t": 480.95053, "r": 390.4975, "b": 483.20709, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 334, "text": "in the Sydney Gazette as a \u201cwonderful ", "bbox": {"l": 363.54486, "t": 480.95053, "r": 390.4975, "b": 483.20709, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 286, "label": "text", "bbox": {"l": 363.54486, "t": 482.9841, "r": 395.70975, "b": 485.24063, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 335, "text": "achievement of scientifi c knowledge, assisted ", "bbox": {"l": 363.54486, "t": 482.9841, "r": 395.70975, "b": 485.24063, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 287, "label": "text", "bbox": {"l": 363.54486, "t": 485.01764, "r": 394.27283, "b": 487.2742, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 336, "text": "by mechanical ingenuity.\u201d Within two years, ", "bbox": {"l": 363.54486, "t": 485.01764, "r": 394.27283, "b": 487.2742, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 288, "label": "text", "bbox": {"l": 363.54486, "t": 487.05121, "r": 396.65939, "b": 489.30774, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 337, "text": "165 gas lamps were lighting the City of Sydney.", "bbox": {"l": 363.54486, "t": 487.05121, "r": 396.65939, "b": 489.30774, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 289, "label": "text", "bbox": {"l": 329.4054, "t": 419.93124, "r": 384.19696, "b": 431.09412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 338, "text": "Looking back on ", "bbox": {"l": 329.4054, "t": 419.93124, "r": 384.19696, "b": 431.09412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 290, "label": "text", "bbox": {"l": 329.4054, "t": 430.10379, "r": 372.16626, "b": 441.26669, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 339, "text": "175 years of ", "bbox": {"l": 329.4054, "t": 430.10379, "r": 372.16626, "b": 441.26669, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 291, "label": "text", "bbox": {"l": 329.4054, "t": 440.27636999999993, "r": 385.3981, "b": 451.43924, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 340, "text": "looking forward.", "bbox": {"l": 329.4054, "t": 440.27636999999993, "r": 385.3981, "b": 451.43924, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 292, "label": "text", "bbox": {"l": 329.40536, "t": 372.16159, "r": 353.36179, "b": 373.91669, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 341, "text": "AGL Energy Limited ABN 74 115 061 375", "bbox": {"l": 329.40536, "t": 372.16159, "r": 353.36179, "b": 373.91669, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 293, "label": "text", "bbox": {"l": 546.20587, "t": 360.90448, "r": 548.23407, "b": 362.82242, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 342, "text": "29", "bbox": {"l": 546.20587, "t": 360.90448, "r": 548.23407, "b": 362.82242, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 294, "label": "text", "bbox": {"l": 497.77728, "t": 251.43384000000003, "r": 542.8255, "b": 254.94385, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 343, "text": "signs, signals and road markings", "bbox": {"l": 497.77728, "t": 251.43384000000003, "r": 542.8255, "b": 254.94385, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 295, "label": "text", "bbox": {"l": 490.30679, "t": 251.47478999999998, "r": 492.09982, "b": 254.98479999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 344, "text": "3", "bbox": {"l": 490.30679, "t": 251.47478999999998, "r": 492.09982, "b": 254.98479999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 296, "label": "text", "bbox": {"l": 498.15335, "t": 263.88922, "r": 500.05637, "b": 265.92719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 345, "text": "In ", "bbox": {"l": 498.15335, "t": 263.88922, "r": 500.05637, "b": 265.92719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 297, "label": "text", "bbox": {"l": 500.05637, "t": 263.85717999999997, "r": 524.37036, "b": 265.86310000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 346, "text": "chapter 2, you and your vehicle", "bbox": {"l": 500.05637, "t": 263.85717999999997, "r": 524.37036, "b": 265.86310000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 298, "label": "text", "bbox": {"l": 524.37036, "t": 263.88922, "r": 539.89124, "b": 265.92719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 347, "text": ", you learned about ", "bbox": {"l": 524.37036, "t": 263.88922, "r": 539.89124, "b": 265.92719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 299, "label": "text", "bbox": {"l": 498.15335, "t": 265.93224999999995, "r": 544.50403, "b": 267.97020999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 348, "text": "some of the controls in your vehicle. This chapter is a handy ", "bbox": {"l": 498.15335, "t": 265.93224999999995, "r": 544.50403, "b": 267.97020999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 300, "label": "text", "bbox": {"l": 498.15335, "t": 267.97533999999996, "r": 544.01343, "b": 270.01331000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 349, "text": "reference section that gives examples of the most common ", "bbox": {"l": 498.15335, "t": 267.97533999999996, "r": 544.01343, "b": 270.01331000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 301, "label": "text", "bbox": {"l": 498.15335, "t": 270.01831000000004, "r": 544.11987, "b": 272.05634, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 350, "text": "signs, signals and road markings that keep traffi c organized ", "bbox": {"l": 498.15335, "t": 270.01831000000004, "r": 544.11987, "b": 272.05634, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 302, "label": "text", "bbox": {"l": 498.15335, "t": 272.06140000000005, "r": 515.41071, "b": 274.09937, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 351, "text": "and flowing smoothly. ", "bbox": {"l": 498.15335, "t": 272.06140000000005, "r": 515.41071, "b": 274.09937, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 303, "label": "text", "bbox": {"l": 498.15335, "t": 277.34619, "r": 505.64642000000003, "b": 280.9357, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 352, "text": "Signs", "bbox": {"l": 498.15335, "t": 277.34619, "r": 505.64642000000003, "b": 280.9357, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 304, "label": "text", "bbox": {"l": 498.15335, "t": 281.82187, "r": 543.92957, "b": 283.85983, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 353, "text": "There are three ways to read signs: by their shape, colour and ", "bbox": {"l": 498.15335, "t": 281.82187, "r": 543.92957, "b": 283.85983, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 305, "label": "text", "bbox": {"l": 498.15335, "t": 283.8649, "r": 545.67834, "b": 285.90289, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 354, "text": "the messages printed on them. Understanding these three ways ", "bbox": {"l": 498.15335, "t": 283.8649, "r": 545.67834, "b": 285.90289, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 306, "label": "text", "bbox": {"l": 498.15335, "t": 285.90796, "r": 545.26471, "b": 287.94592, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 355, "text": "of classifying signs will help you figure out the meaning of signs ", "bbox": {"l": 498.15335, "t": 285.90796, "r": 545.26471, "b": 287.94592, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 307, "label": "text", "bbox": {"l": 498.15335, "t": 287.95099, "r": 513.31335, "b": 289.98895, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 356, "text": "that are new to you. ", "bbox": {"l": 498.15335, "t": 287.95099, "r": 513.31335, "b": 289.98895, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 308, "label": "text", "bbox": {"l": 505.43439, "t": 303.07596, "r": 508.53033000000005, "b": 304.89639, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 357, "text": "Stop", "bbox": {"l": 505.43439, "t": 303.07596, "r": 508.53033000000005, "b": 304.89639, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 309, "label": "text", "bbox": {"l": 527.45502, "t": 303.25354, "r": 541.44678, "b": 305.07397, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 358, "text": "Yield the right-of-way", "bbox": {"l": 527.45502, "t": 303.25354, "r": 541.44678, "b": 305.07397, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 310, "label": "text", "bbox": {"l": 501.79385, "t": 321.18973, "r": 510.41632, "b": 323.01016, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 359, "text": "Shows driving", "bbox": {"l": 501.79385, "t": 321.18973, "r": 510.41632, "b": 323.01016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 311, "label": "text", "bbox": {"l": 501.79385, "t": 322.87731999999994, "r": 509.04268999999994, "b": 324.69775000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 360, "text": "regulations", "bbox": {"l": 501.79385, "t": 322.87731999999994, "r": 509.04268999999994, "b": 324.69775000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 312, "label": "text", "bbox": {"l": 518.66455, "t": 319.59146, "r": 529.80902, "b": 321.41190000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 361, "text": "Explains lane use", "bbox": {"l": 518.66455, "t": 319.59146, "r": 529.80902, "b": 321.41190000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 313, "label": "text", "bbox": {"l": 534.87561, "t": 318.37616, "r": 546.95142, "b": 320.19659, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 362, "text": "School zone signs ", "bbox": {"l": 534.87561, "t": 318.37616, "r": 546.95142, "b": 320.19659, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 314, "label": "text", "bbox": {"l": 534.87561, "t": 320.0637500000001, "r": 545.05762, "b": 321.88419, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 363, "text": "are fl uorescent ", "bbox": {"l": 534.87561, "t": 320.0637500000001, "r": 545.05762, "b": 321.88419, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 315, "label": "text", "bbox": {"l": 534.87561, "t": 321.75134, "r": 543.32263, "b": 323.57178, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 364, "text": "yellow-green", "bbox": {"l": 534.87561, "t": 321.75134, "r": 543.32263, "b": 323.57178, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 316, "label": "text", "bbox": {"l": 499.21862999999996, "t": 338.12772, "r": 512.62451, "b": 339.94815, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 365, "text": "Tells about motorist ", "bbox": {"l": 499.21862999999996, "t": 338.12772, "r": 512.62451, "b": 339.94815, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 317, "label": "text", "bbox": {"l": 499.21862999999996, "t": 339.81531000000007, "r": 504.39917, "b": 341.63574, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 366, "text": "services", "bbox": {"l": 499.21862999999996, "t": 339.81531000000007, "r": 504.39917, "b": 341.63574, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 318, "label": "text", "bbox": {"l": 516.97748, "t": 338.06039, "r": 529.77484, "b": 339.88082999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 367, "text": "Shows a permitted ", "bbox": {"l": 516.97748, "t": 338.06039, "r": 529.77484, "b": 339.88082999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 319, "label": "text", "bbox": {"l": 516.97748, "t": 339.74799, "r": 520.96399, "b": 341.56842, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 368, "text": "action", "bbox": {"l": 516.97748, "t": 339.74799, "r": 520.96399, "b": 341.56842, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 320, "label": "text", "bbox": {"l": 534.55847, "t": 337.88281, "r": 548.58453, "b": 339.7032500000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 369, "text": "Shows an action that ", "bbox": {"l": 534.55847, "t": 337.88281, "r": 548.58453, "b": 339.7032500000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 321, "label": "text", "bbox": {"l": 534.55847, "t": 339.57040000000006, "r": 545.08862, "b": 341.39084, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 370, "text": "is not permitted", "bbox": {"l": 534.55847, "t": 339.57040000000006, "r": 545.08862, "b": 341.39084, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 322, "label": "text", "bbox": {"l": 483.05853, "t": 356.17416, "r": 494.72577, "b": 357.9946, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 371, "text": "Warns of hazards ", "bbox": {"l": 483.05853, "t": 356.17416, "r": 494.72577, "b": 357.9946, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 323, "label": "text", "bbox": {"l": 483.05853, "t": 357.86179, "r": 487.07525999999996, "b": 359.68222, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 372, "text": "ahead", "bbox": {"l": 483.05853, "t": 357.86179, "r": 487.07525999999996, "b": 359.68222, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 324, "label": "text", "bbox": {"l": 499.39645, "t": 356.26297000000005, "r": 504.69171, "b": 358.0834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 373, "text": "Warns of", "bbox": {"l": 499.39645, "t": 356.26297000000005, "r": 504.69171, "b": 358.0834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 325, "label": "text", "bbox": {"l": 499.39645, "t": 357.95056, "r": 511.69116, "b": 359.77099999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 374, "text": "construction zones", "bbox": {"l": 499.39645, "t": 357.95056, "r": 511.69116, "b": 359.77099999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 326, "label": "text", "bbox": {"l": 516.75891, "t": 356.26297000000005, "r": 527.42938, "b": 358.0834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 375, "text": "Railway crossing", "bbox": {"l": 516.75891, "t": 356.26297000000005, "r": 527.42938, "b": 358.0834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 327, "label": "text", "bbox": {"l": 534.5141, "t": 352.92981, "r": 547.89862, "b": 354.75024, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 376, "text": "Shows distance and ", "bbox": {"l": 534.5141, "t": 352.92981, "r": 547.89862, "b": 354.75024, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 328, "label": "text", "bbox": {"l": 534.5141, "t": 354.6174, "r": 540.2818, "b": 356.43784, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 377, "text": "direction", "bbox": {"l": 534.5141, "t": 354.6174, "r": 540.2818, "b": 356.43784, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 329, "label": "text", "bbox": {"l": 478.37466, "t": 270.14075, "r": 479.14251999999993, "b": 272.17877, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 378, "text": "\u2022", "bbox": {"l": 478.37466, "t": 270.14075, "r": 479.14251999999993, "b": 272.17877, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 330, "label": "text", "bbox": {"l": 479.91036999999994, "t": 270.14075, "r": 483.74963, "b": 272.17877, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 379, "text": "Signs", "bbox": {"l": 479.91036999999994, "t": 270.14075, "r": 483.74963, "b": 272.17877, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 331, "label": "text", "bbox": {"l": 479.97293, "t": 272.84717, "r": 492.31219, "b": 274.34888, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 380, "text": "- regulatory signs", "bbox": {"l": 479.97293, "t": 272.84717, "r": 492.31219, "b": 274.34888, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 332, "label": "text", "bbox": {"l": 479.97293, "t": 275.14513999999997, "r": 486.72598000000005, "b": 276.64679, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 381, "text": "- school, ", "bbox": {"l": 479.97293, "t": 275.14513999999997, "r": 486.72598000000005, "b": 276.64679, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 333, "label": "text", "bbox": {"l": 481.21602999999993, "t": 276.77972, "r": 492.93286000000006, "b": 278.81768999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 382, "text": "playground and ", "bbox": {"l": 481.21602999999993, "t": 276.77972, "r": 492.93286000000006, "b": 278.81768999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 334, "label": "text", "bbox": {"l": 481.21602999999993, "t": 278.82275000000004, "r": 491.82938000000007, "b": 280.86075, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 383, "text": "crosswalk signs", "bbox": {"l": 481.21602999999993, "t": 278.82275000000004, "r": 491.82938000000007, "b": 280.86075, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 335, "label": "text", "bbox": {"l": 479.97293, "t": 281.52759, "r": 491.00775000000004, "b": 283.02924, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 384, "text": "- lane use signs", "bbox": {"l": 479.97293, "t": 281.52759, "r": 491.00775000000004, "b": 283.02924, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 336, "label": "text", "bbox": {"l": 479.97293, "t": 283.82556, "r": 493.32748, "b": 285.3272099999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 385, "text": "- turn control signs", "bbox": {"l": 479.97293, "t": 283.82556, "r": 493.32748, "b": 285.3272099999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 337, "label": "text", "bbox": {"l": 479.97293, "t": 286.1235, "r": 490.4915199999999, "b": 287.62518, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 386, "text": "- parking signs", "bbox": {"l": 479.97293, "t": 286.1235, "r": 490.4915199999999, "b": 287.62518, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 338, "label": "text", "bbox": {"l": 479.97293, "t": 288.42148, "r": 491.17004000000003, "b": 289.92316, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 387, "text": "- reserved lane ", "bbox": {"l": 479.97293, "t": 288.42148, "r": 491.17004000000003, "b": 289.92316, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 339, "label": "text", "bbox": {"l": 481.21602999999993, "t": 290.05605999999995, "r": 484.77405000000005, "b": 292.09406, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 388, "text": "signs", "bbox": {"l": 481.21602999999993, "t": 290.05605999999995, "r": 484.77405000000005, "b": 292.09406, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 340, "label": "text", "bbox": {"l": 479.97293, "t": 292.76169000000004, "r": 490.83398, "b": 294.26334, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 389, "text": "- warning signs", "bbox": {"l": 479.97293, "t": 292.76169000000004, "r": 490.83398, "b": 294.26334, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 341, "label": "text", "bbox": {"l": 479.97293, "t": 295.05963, "r": 491.62692, "b": 296.56131, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 390, "text": "- object markers", "bbox": {"l": 479.97293, "t": 295.05963, "r": 491.62692, "b": 296.56131, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 342, "label": "text", "bbox": {"l": 479.97293, "t": 297.3576, "r": 490.37341, "b": 298.8592499999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 391, "text": "- construction ", "bbox": {"l": 479.97293, "t": 297.3576, "r": 490.37341, "b": 298.8592499999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 343, "label": "text", "bbox": {"l": 481.21602999999993, "t": 298.99219, "r": 484.77405000000005, "b": 301.03015, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 392, "text": "signs", "bbox": {"l": 481.21602999999993, "t": 298.99219, "r": 484.77405000000005, "b": 301.03015, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 344, "label": "text", "bbox": {"l": 479.97293, "t": 301.69780999999995, "r": 492.93912, "b": 303.19946, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 393, "text": "- information and ", "bbox": {"l": 479.97293, "t": 301.69780999999995, "r": 492.93912, "b": 303.19946, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 345, "label": "text", "bbox": {"l": 481.21602999999993, "t": 303.3324, "r": 493.00525, "b": 305.37036, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 394, "text": "destination signs", "bbox": {"l": 481.21602999999993, "t": 303.3324, "r": 493.00525, "b": 305.37036, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 346, "label": "text", "bbox": {"l": 479.97293, "t": 306.0379899999999, "r": 489.99047999999993, "b": 307.53967, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 395, "text": "- railway signs", "bbox": {"l": 479.97293, "t": 306.0379899999999, "r": 489.99047999999993, "b": 307.53967, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 347, "label": "text", "bbox": {"l": 478.375, "t": 308.24789, "r": 479.1032400000001, "b": 310.28586, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 396, "text": "\u2022", "bbox": {"l": 478.375, "t": 308.24789, "r": 479.1032400000001, "b": 310.28586, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 348, "label": "text", "bbox": {"l": 479.83151, "t": 308.24789, "r": 484.92925999999994, "b": 310.28586, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 397, "text": "Signals", "bbox": {"l": 479.83151, "t": 308.24789, "r": 484.92925999999994, "b": 310.28586, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 349, "label": "text", "bbox": {"l": 479.97293, "t": 310.95358, "r": 490.00091999999995, "b": 312.45526, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 398, "text": "- lane control ", "bbox": {"l": 479.97293, "t": 310.95358, "r": 490.00091999999995, "b": 312.45526, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 350, "label": "text", "bbox": {"l": 481.21602999999993, "t": 312.5881999999999, "r": 485.95331, "b": 314.62616, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 399, "text": "signals", "bbox": {"l": 481.21602999999993, "t": 312.5881999999999, "r": 485.95331, "b": 314.62616, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 351, "label": "text", "bbox": {"l": 479.97293, "t": 315.29379, "r": 489.29876999999993, "b": 316.79544, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 400, "text": "- traffic lights", "bbox": {"l": 479.97293, "t": 315.29379, "r": 489.29876999999993, "b": 316.79544, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 352, "label": "text", "bbox": {"l": 478.375, "t": 317.50366, "r": 479.18129999999996, "b": 319.5416599999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 401, "text": "\u2022", "bbox": {"l": 478.375, "t": 317.50366, "r": 479.18129999999996, "b": 319.5416599999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 353, "label": "text", "bbox": {"l": 479.98761, "t": 317.50366, "r": 490.46960000000007, "b": 319.5416599999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 402, "text": "Road markings", "bbox": {"l": 479.98761, "t": 317.50366, "r": 490.46960000000007, "b": 319.5416599999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 354, "label": "text", "bbox": {"l": 479.97293, "t": 320.20938, "r": 489.26166000000006, "b": 321.71103, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 403, "text": "- yellow lines", "bbox": {"l": 479.97293, "t": 320.20938, "r": 489.26166000000006, "b": 321.71103, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 355, "label": "text", "bbox": {"l": 479.97293, "t": 322.50732, "r": 488.59189, "b": 324.009, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 404, "text": "- white lines", "bbox": {"l": 479.97293, "t": 322.50732, "r": 488.59189, "b": 324.009, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 356, "label": "text", "bbox": {"l": 479.97293, "t": 324.8053, "r": 491.17004000000003, "b": 326.30698, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 405, "text": "- reserved lane ", "bbox": {"l": 479.97293, "t": 324.8053, "r": 491.17004000000003, "b": 326.30698, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 357, "label": "text", "bbox": {"l": 481.21602999999993, "t": 326.43988, "r": 487.58978, "b": 328.47784, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 406, "text": "markings", "bbox": {"l": 481.21602999999993, "t": 326.43988, "r": 487.58978, "b": 328.47784, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 358, "label": "text", "bbox": {"l": 479.97293, "t": 329.14551, "r": 491.75177, "b": 330.64716, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 407, "text": "- other markings", "bbox": {"l": 479.97293, "t": 329.14551, "r": 491.75177, "b": 330.64716, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 359, "label": "text", "bbox": {"l": 478.15246999999994, "t": 265.07030999999995, "r": 493.75586, "b": 268.06872999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 408, "text": "in this chapter", "bbox": {"l": 478.15246999999994, "t": 265.07030999999995, "r": 493.75586, "b": 268.06872999999996, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "caption", "id": 16, "page_no": 0, "cluster": {"id": 16, "label": "caption", "bbox": {"l": 317.95499, "t": 540.08299, "r": 559.80579, "b": 559.51524, "coord_origin": "TOPLEFT"}, "confidence": 0.7793369889259338, "cells": [{"id": 409, "text": "Figure 1: Four examples of complex page layouts across dif-", "bbox": {"l": 317.95499, "t": 540.08299, "r": 559.80579, "b": 548.55624, "coord_origin": "TOPLEFT"}}, {"id": 410, "text": "ferent document categories", "bbox": {"l": 317.95499, "t": 551.0419899999999, "r": 428.69907, "b": 559.51524, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 1: Four examples of complex page layouts across different document categories"}, {"label": "section_header", "id": 3, "page_no": 0, "cluster": {"id": 3, "label": "section_header", "bbox": {"l": 317.95499, "t": 592.46591, "r": 379.8205, "b": 602.7750100000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9208477139472961, "cells": [{"id": 411, "text": "KEYWORDS", "bbox": {"l": 317.95499, "t": 592.46591, "r": 379.8205, "b": 602.7750100000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "KEYWORDS"}, {"label": "text", "id": 1, "page_no": 0, "cluster": {"id": 1, "label": "text", "bbox": {"l": 317.95499, "t": 607.66756, "r": 559.18597, "b": 627.00117, "coord_origin": "TOPLEFT"}, "confidence": 0.9509093761444092, "cells": [{"id": 412, "text": "PDF document conversion, layout segmentation, object-detection,", "bbox": {"l": 317.95499, "t": 607.66756, "r": 559.18597, "b": 616.04218, "coord_origin": "TOPLEFT"}}, {"id": 413, "text": "data set, Machine Learning", "bbox": {"l": 317.95499, "t": 618.62656, "r": 416.94403, "b": 627.00117, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "PDF document conversion, layout segmentation, object-detection, data set, Machine Learning"}, {"label": "section_header", "id": 7, "page_no": 0, "cluster": {"id": 7, "label": "section_header", "bbox": {"l": 317.65997, "t": 640.05434, "r": 404.65366, "b": 647.58609, "coord_origin": "TOPLEFT"}, "confidence": 0.8721990585327148, "cells": [{"id": 414, "text": "ACM Reference Format:", "bbox": {"l": 317.65997, "t": 640.05434, "r": 404.65366, "b": 647.58609, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "ACM Reference Format:"}, {"label": "text", "id": 2, "page_no": 0, "cluster": {"id": 2, "label": "text", "bbox": {"l": 317.95499, "t": 650.11996, "r": 559.5495, "b": 707.377029, "coord_origin": "TOPLEFT"}, "confidence": 0.9455164670944214, "cells": [{"id": 415, "text": "Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter", "bbox": {"l": 317.95499, "t": 650.11996, "r": 558.35266, "b": 657.56404, "coord_origin": "TOPLEFT"}}, {"id": 416, "text": "Staar. 2022. DocLayNet: A Large Human-Annotated Dataset for Document-", "bbox": {"l": 317.95499, "t": 660.08296, "r": 559.5495, "b": 667.52703, "coord_origin": "TOPLEFT"}}, {"id": 417, "text": "Layout Analysis. In", "bbox": {"l": 317.95499, "t": 670.04497, "r": 383.30807, "b": 677.48904, "coord_origin": "TOPLEFT"}}, {"id": 418, "text": "Proceedings of the 28th ACM SIGKDD Conference on", "bbox": {"l": 385.798, "t": 670.08482, "r": 558.20032, "b": 677.49701, "coord_origin": "TOPLEFT"}}, {"id": 419, "text": "Knowledge Discovery and Data Mining (KDD \u201922), August 14-18, 2022, Wash-", "bbox": {"l": 317.95499, "t": 680.04781, "r": 559.00092, "b": 687.46001, "coord_origin": "TOPLEFT"}}, {"id": 420, "text": "ington, DC, USA.", "bbox": {"l": 317.95499, "t": 690.01081, "r": 370.11481, "b": 697.423004, "coord_origin": "TOPLEFT"}}, {"id": 421, "text": "ACM, New York, NY, USA, 9 pages. https://doi.org/10.1145/", "bbox": {"l": 371.82999, "t": 689.97096, "r": 558.71655, "b": 697.415031, "coord_origin": "TOPLEFT"}}, {"id": 422, "text": "3534678.3539043", "bbox": {"l": 317.95499, "t": 699.932953, "r": 371.59375, "b": 707.377029, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar. 2022. DocLayNet: A Large Human-Annotated Dataset for DocumentLayout Analysis. In Proceedings of the 28th ACM SIGKDD Conference on Knowledge Discovery and Data Mining (KDD \u201922), August 14-18, 2022, Washington, DC, USA. ACM, New York, NY, USA, 9 pages. https://doi.org/10.1145/ 3534678.3539043"}, {"label": "page_header", "id": 10, "page_no": 0, "cluster": {"id": 10, "label": "page_header", "bbox": {"l": 18.34021, "t": 218.35999000000004, "r": 36.339794, "b": 555.00003, "coord_origin": "TOPLEFT"}, "confidence": 0.853788435459137, "cells": [{"id": 423, "text": "arXiv:2206.01062v1 [cs.CV] 2 Jun 2022", "bbox": {"l": 18.34021, "t": 218.35999000000004, "r": 36.339794, "b": 555.00003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "arXiv:2206.01062v1 [cs.CV] 2 Jun 2022"}], "body": [{"label": "section_header", "id": 12, "page_no": 0, "cluster": {"id": 12, "label": "section_header", "bbox": {"l": 107.29999999999998, "t": 83.69470000000013, "r": 505.06195, "b": 119.59558000000015, "coord_origin": "TOPLEFT"}, "confidence": 0.8416301012039185, "cells": [{"id": 0, "text": "DocLayNet: A Large Human-Annotated Dataset for", "bbox": {"l": 107.29999999999998, "t": 83.69470000000013, "r": 505.06195, "b": 99.67058999999995, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Document-Layout Analysis", "bbox": {"l": 200.117, "t": 103.6196900000001, "r": 411.88367, "b": 119.59558000000015, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis"}, {"label": "text", "id": 8, "page_no": 0, "cluster": {"id": 8, "label": "text", "bbox": {"l": 90.96701, "t": 133.67236000000003, "r": 193.73123, "b": 180.24030000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.8637146949768066, "cells": [{"id": 2, "text": "Birgit Pfitzmann", "bbox": {"l": 102.06001, "t": 133.67236000000003, "r": 182.63805, "b": 144.83856000000003, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "IBM Research", "bbox": {"l": 114.29401000000001, "t": 147.02423, "r": 170.40337, "b": 156.32928000000004, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Rueschlikon, Switzerland", "bbox": {"l": 90.96701, "t": 158.97924999999998, "r": 193.73123, "b": 168.28430000000003, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "bpf@zurich.ibm.com", "bbox": {"l": 100.02301, "t": 170.93524000000002, "r": 184.67522, "b": 180.24030000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Birgit Pfitzmann IBM Research Rueschlikon, Switzerland bpf@zurich.ibm.com"}, {"label": "text", "id": 9, "page_no": 0, "cluster": {"id": 9, "label": "text", "bbox": {"l": 255.11602999999997, "t": 133.67236000000003, "r": 357.88025, "b": 180.24030000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.8612666726112366, "cells": [{"id": 6, "text": "Christoph Auer", "bbox": {"l": 268.62402, "t": 133.67236000000003, "r": 344.59933, "b": 144.83856000000003, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "IBM Research", "bbox": {"l": 278.44302, "t": 147.02423, "r": 334.55237, "b": 156.32928000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Rueschlikon, Switzerland", "bbox": {"l": 255.11602999999997, "t": 158.97924999999998, "r": 357.88025, "b": 168.28430000000003, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "cau@zurich.ibm.com", "bbox": {"l": 263.70404, "t": 170.93524000000002, "r": 349.29272, "b": 180.24030000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Christoph Auer IBM Research Rueschlikon, Switzerland cau@zurich.ibm.com"}, {"label": "text", "id": 6, "page_no": 0, "cluster": {"id": 6, "label": "text", "bbox": {"l": 419.26505, "t": 133.67236000000003, "r": 522.0293, "b": 180.24030000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.8760607838630676, "cells": [{"id": 10, "text": "Michele Dolfi", "bbox": {"l": 437.6930500000001, "t": 133.67236000000003, "r": 503.60208, "b": 144.83856000000003, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "IBM Research", "bbox": {"l": 442.59305000000006, "t": 147.02423, "r": 498.7023899999999, "b": 156.32928000000004, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Rueschlikon, Switzerland", "bbox": {"l": 419.26505, "t": 158.97924999999998, "r": 522.0293, "b": 168.28430000000003, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "dol@zurich.ibm.com", "bbox": {"l": 428.56104000000005, "t": 170.93524000000002, "r": 512.73505, "b": 180.24030000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Michele Dolfi IBM Research Rueschlikon, Switzerland dol@zurich.ibm.com"}, {"label": "text", "id": 13, "page_no": 0, "cluster": {"id": 13, "label": "text", "bbox": {"l": 172.54303, "t": 192.05737, "r": 275.30725, "b": 238.62531, "coord_origin": "TOPLEFT"}, "confidence": 0.8319916129112244, "cells": [{"id": 14, "text": "Ahmed S. Nassar", "bbox": {"l": 182.26804, "t": 192.05737, "r": 265.39255, "b": 203.22357, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "IBM Research", "bbox": {"l": 195.87103, "t": 205.40923999999995, "r": 251.98038999999997, "b": 214.71429, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Rueschlikon, Switzerland", "bbox": {"l": 172.54303, "t": 217.36425999999994, "r": 275.30725, "b": 226.66931, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "ahn@zurich.ibm.com", "bbox": {"l": 180.52803, "t": 229.32025, "r": 267.3222, "b": 238.62531, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Ahmed S. Nassar IBM Research Rueschlikon, Switzerland ahn@zurich.ibm.com"}, {"label": "text", "id": 15, "page_no": 0, "cluster": {"id": 15, "label": "text", "bbox": {"l": 336.69302, "t": 192.05737, "r": 439.45727999999997, "b": 238.62531, "coord_origin": "TOPLEFT"}, "confidence": 0.8027974367141724, "cells": [{"id": 18, "text": "Peter Staar", "bbox": {"l": 361.52802, "t": 192.05737, "r": 414.84821, "b": 203.22357, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "IBM Research", "bbox": {"l": 360.02002, "t": 205.40923999999995, "r": 416.12939, "b": 214.71429, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Rueschlikon, Switzerland", "bbox": {"l": 336.69302, "t": 217.36425999999994, "r": 439.45727999999997, "b": 226.66931, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "taa@zurich.ibm.com", "bbox": {"l": 346.20703, "t": 229.32025, "r": 429.94269, "b": 238.62531, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Peter Staar IBM Research Rueschlikon, Switzerland taa@zurich.ibm.com"}, {"label": "section_header", "id": 5, "page_no": 0, "cluster": {"id": 5, "label": "section_header", "bbox": {"l": 53.798035, "t": 247.70288000000005, "r": 111.94354, "b": 258.01202, "coord_origin": "TOPLEFT"}, "confidence": 0.8876153826713562, "cells": [{"id": 22, "text": "ABSTRACT", "bbox": {"l": 53.798035, "t": 247.70288000000005, "r": 111.94354, "b": 258.01202, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "ABSTRACT"}, {"label": "text", "id": 0, "page_no": 0, "cluster": {"id": 0, "label": "text", "bbox": {"l": 53.466999, "t": 262.90454, "r": 295.56018, "b": 534.29318, "coord_origin": "TOPLEFT"}, "confidence": 0.9823057055473328, "cells": [{"id": 23, "text": "Accurate document layout analysis is a key requirement for high-", "bbox": {"l": 53.484001, "t": 262.90454, "r": 295.55591, "b": 271.27917, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "quality PDF document conversion. With the recent availability of", "bbox": {"l": 53.79800000000001, "t": 273.86352999999997, "r": 294.04199, "b": 282.23816, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "public, large ground-truth datasets such as PubLayNet and DocBank,", "bbox": {"l": 53.79800000000001, "t": 284.82254, "r": 295.34586, "b": 293.19717, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "deep-learning models have proven to be very effective at layout", "bbox": {"l": 53.79800000000001, "t": 295.78152, "r": 294.04709, "b": 304.15616000000006, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "detection and segmentation. While these datasets are of adequate", "bbox": {"l": 53.79800000000001, "t": 306.74053999999995, "r": 294.04645, "b": 315.11517, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "size to train such models, they severely lack in layout variability", "bbox": {"l": 53.79800000000001, "t": 317.69952, "r": 294.27573, "b": 326.07416, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "since they are sourced from scientific article repositories such as", "bbox": {"l": 53.79800000000001, "t": 328.65854, "r": 294.04712, "b": 337.03317, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "PubMed and arXiv only. Consequently, the accuracy of the layout", "bbox": {"l": 53.79800000000001, "t": 339.61755, "r": 294.0437, "b": 347.99219, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "segmentation drops significantly when these models are applied", "bbox": {"l": 53.79800000000001, "t": 350.57654, "r": 294.04715, "b": 358.95117, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "on more challenging and diverse layouts. In this paper, we present", "bbox": {"l": 53.79800000000001, "t": 361.53455, "r": 294.04364, "b": 369.90918000000005, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "DocLayNet", "bbox": {"l": 53.79800000000001, "t": 372.53839, "r": 92.863388, "b": 380.87714000000005, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": ", a new, publicly available, document-layout annotation", "bbox": {"l": 92.863998, "t": 372.49353, "r": 294.04361, "b": 380.86816, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "dataset in COCO format. It contains 80863 manually annotated", "bbox": {"l": 53.79800000000001, "t": 383.45255, "r": 294.04718, "b": 391.82718, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "pages from diverse data sources to represent a wide variability in", "bbox": {"l": 53.79800000000001, "t": 394.41153, "r": 294.0437, "b": 402.78616, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "layouts. For each PDF page, the layout annotations provide labelled", "bbox": {"l": 53.79800000000001, "t": 405.37054, "r": 294.04535, "b": 413.74518, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "bounding-boxes with a choice of 11 distinct classes. DocLayNet", "bbox": {"l": 53.79800000000001, "t": 416.32953, "r": 294.04715, "b": 424.70416000000006, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "also provides a subset of double- and triple-annotated pages to", "bbox": {"l": 53.79800000000001, "t": 427.28853999999995, "r": 294.04712, "b": 435.66318, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "determine the inter-annotator agreement. In multiple experiments,", "bbox": {"l": 53.79800000000001, "t": 438.24753, "r": 295.03, "b": 446.62216, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "we provide baseline accuracy scores (in mAP) for a set of popular", "bbox": {"l": 53.466999, "t": 449.20654, "r": 294.21616, "b": 457.58118, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "object detection models. We also demonstrate that these models", "bbox": {"l": 53.79800000000001, "t": 460.16553, "r": 294.04712, "b": 468.54016, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "fall approximately 10% behind the inter-annotator agreement. Fur-", "bbox": {"l": 53.79800000000001, "t": 471.12354, "r": 295.56018, "b": 479.49817, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "thermore, we provide evidence that DocLayNet is of sufficient size.", "bbox": {"l": 53.79800000000001, "t": 482.08255, "r": 295.42783, "b": 490.45718, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Lastly, we compare models trained on PubLayNet, DocBank and", "bbox": {"l": 53.79800000000001, "t": 493.04153, "r": 294.04715, "b": 501.41617, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "DocLayNet, showing that layout predictions of the DocLayNet-", "bbox": {"l": 53.79800000000001, "t": 504.00055, "r": 295.55618, "b": 512.37518, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "trained models are more robust and thus the preferred choice for", "bbox": {"l": 53.79800000000001, "t": 514.95953, "r": 294.21643, "b": 523.33417, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "general-purpose document-layout analysis.", "bbox": {"l": 53.79800000000001, "t": 525.91855, "r": 212.05495, "b": 534.29318, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Accurate document layout analysis is a key requirement for highquality PDF document conversion. With the recent availability of public, large ground-truth datasets such as PubLayNet and DocBank, deep-learning models have proven to be very effective at layout detection and segmentation. While these datasets are of adequate size to train such models, they severely lack in layout variability since they are sourced from scientific article repositories such as PubMed and arXiv only. Consequently, the accuracy of the layout segmentation drops significantly when these models are applied on more challenging and diverse layouts. In this paper, we present DocLayNet , a new, publicly available, document-layout annotation dataset in COCO format. It contains 80863 manually annotated pages from diverse data sources to represent a wide variability in layouts. For each PDF page, the layout annotations provide labelled bounding-boxes with a choice of 11 distinct classes. DocLayNet also provides a subset of double- and triple-annotated pages to determine the inter-annotator agreement. In multiple experiments, we provide baseline accuracy scores (in mAP) for a set of popular object detection models. We also demonstrate that these models fall approximately 10% behind the inter-annotator agreement. Furthermore, we provide evidence that DocLayNet is of sufficient size. Lastly, we compare models trained on PubLayNet, DocBank and DocLayNet, showing that layout predictions of the DocLayNettrained models are more robust and thus the preferred choice for general-purpose document-layout analysis."}, {"label": "section_header", "id": 4, "page_no": 0, "cluster": {"id": 4, "label": "section_header", "bbox": {"l": 53.79800000000001, "t": 550.99692, "r": 134.81989, "b": 561.30602, "coord_origin": "TOPLEFT"}, "confidence": 0.9149599671363831, "cells": [{"id": 49, "text": "CCS CONCEPTS", "bbox": {"l": 53.79800000000001, "t": 550.99692, "r": 134.81989, "b": 561.30602, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "CCS CONCEPTS"}, {"label": "text", "id": 11, "page_no": 0, "cluster": {"id": 11, "label": "text", "bbox": {"l": 53.797989, "t": 566.08299, "r": 297.85294, "b": 596.50114, "coord_origin": "TOPLEFT"}, "confidence": 0.8458832502365112, "cells": [{"id": 50, "text": "\u2022", "bbox": {"l": 53.79800000000001, "t": 566.19957, "r": 56.945206000000006, "b": 574.57419, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Information systems", "bbox": {"l": 58.440002, "t": 566.0830100000001, "r": 142.4462, "b": 574.5562600000001, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "\u2192", "bbox": {"l": 143.938, "t": 566.36096, "r": 153.15099, "b": 574.43073, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Document structure", "bbox": {"l": 154.646, "t": 566.0830100000001, "r": 235.46015999999997, "b": 574.5562600000001, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "; \u2022", "bbox": {"l": 235.45700000000002, "t": 566.19955, "r": 242.17419, "b": 574.57417, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "Applied com-", "bbox": {"l": 243.66899, "t": 566.08299, "r": 297.85294, "b": 574.55624, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "puting", "bbox": {"l": 53.797989, "t": 577.0419899999999, "r": 80.661324, "b": 585.51524, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "\u2192", "bbox": {"l": 83.565987, "t": 577.3199500000001, "r": 92.778961, "b": 585.38971, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Document analysis", "bbox": {"l": 95.68399, "t": 577.0419899999999, "r": 173.91583, "b": 585.51524, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "; \u2022", "bbox": {"l": 173.916, "t": 577.15855, "r": 182.1272, "b": 585.53317, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Computing methodologies", "bbox": {"l": 185.032, "t": 577.0419899999999, "r": 294.0455, "b": 585.51524, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "\u2192", "bbox": {"l": 53.79800399999999, "t": 588.27895, "r": 63.01097899999999, "b": 596.34871, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "Machine learning", "bbox": {"l": 65.253006, "t": 588.00099, "r": 136.80487, "b": 596.47424, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": ";", "bbox": {"l": 136.80501, "t": 588.1175499999999, "r": 138.92108, "b": 596.49217, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "Computer vision", "bbox": {"l": 141.162, "t": 588.00099, "r": 209.60254, "b": 596.47424, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": ";", "bbox": {"l": 209.60201, "t": 588.1175499999999, "r": 211.71808, "b": 596.49217, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "Object detection", "bbox": {"l": 213.96001, "t": 588.16238, "r": 270.45728, "b": 596.50114, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": ";", "bbox": {"l": 270.48001, "t": 588.1175499999999, "r": 272.59607, "b": 596.49217, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u2022 Information systems \u2192 Document structure ; \u2022 Applied computing \u2192 Document analysis ; \u2022 Computing methodologies \u2192 Machine learning ; Computer vision ; Object detection ;"}, {"label": "text", "id": 17, "page_no": 0, "cluster": {"id": 17, "label": "text", "bbox": {"l": 53.79800000000001, "t": 634.39838, "r": 295.11798, "b": 672.79189, "coord_origin": "TOPLEFT"}, "confidence": 0.7107343673706055, "cells": [{"id": 68, "text": "Permission to make digital or hard copies of part or all of this work for personal or", "bbox": {"l": 53.79800000000001, "t": 634.39838, "r": 294.17697, "b": 640.9119000000001, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "classroom use is granted without fee provided that copies are not made or distributed", "bbox": {"l": 53.79800000000001, "t": 642.36838, "r": 294.04443, "b": 648.8819, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "for profit or commercial advantage and that copies bear this notice and the full citation", "bbox": {"l": 53.79800000000001, "t": 650.33838, "r": 294.04498, "b": 656.8519, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "on the first page. Copyrights for third-party components of this work must be honored.", "bbox": {"l": 53.79800000000001, "t": 658.3083799999999, "r": 295.11798, "b": 664.8219, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "For all other uses, contact the owner/author(s).", "bbox": {"l": 53.79800000000001, "t": 666.27837, "r": 187.72285, "b": 672.79189, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Permission to make digital or hard copies of part or all of this work for personal or classroom use is granted without fee provided that copies are not made or distributed for profit or commercial advantage and that copies bear this notice and the full citation on the first page. Copyrights for third-party components of this work must be honored. For all other uses, contact the owner/author(s)."}, {"label": "text", "id": 29, "page_no": 0, "cluster": {"id": 29, "label": "text", "bbox": {"l": 53.79800000000001, "t": 675.08023, "r": 197.86275, "b": 681.56586, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 53.79800000000001, "t": 675.08023, "r": 197.86275, "b": 681.56586, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA"}, {"label": "text", "id": 30, "page_no": 0, "cluster": {"id": 30, "label": "text", "bbox": {"l": 53.317001, "t": 683.81236, "r": 186.74652, "b": 690.32589, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "\u00a9 2022 Copyright held by the owner/author(s).", "bbox": {"l": 53.317001, "t": 683.81236, "r": 186.74652, "b": 690.32589, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u00a9 2022 Copyright held by the owner/author(s)."}, {"label": "text", "id": 31, "page_no": 0, "cluster": {"id": 31, "label": "text", "bbox": {"l": 53.554001, "t": 691.78336, "r": 157.03125, "b": 698.29689, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "ACM ISBN 978-1-4503-9385-0/22/08.", "bbox": {"l": 53.554001, "t": 691.78336, "r": 157.03125, "b": 698.29689, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "ACM ISBN 978-1-4503-9385-0/22/08."}, {"label": "text", "id": 27, "page_no": 0, "cluster": {"id": 27, "label": "text", "bbox": {"l": 53.79800000000001, "t": 699.753365, "r": 166.94093, "b": 706.266891, "coord_origin": "TOPLEFT"}, "confidence": 0.5095879435539246, "cells": [{"id": 76, "text": "https://doi.org/10.1145/3534678.3539043", "bbox": {"l": 53.79800000000001, "t": 699.753365, "r": 166.94093, "b": 706.266891, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "https://doi.org/10.1145/3534678.3539043"}, {"label": "picture", "id": 20, "page_no": 0, "cluster": {"id": 20, "label": "picture", "bbox": {"l": 323.408203125, "t": 250.34873962402344, "r": 553.2952270507812, "b": 525.8507080078125, "coord_origin": "TOPLEFT"}, "confidence": 0.5910214781761169, "cells": [{"id": 77, "text": "13", "bbox": {"l": 327.86951, "t": 351.78085, "r": 330.41248, "b": 353.95465, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "USING THE VERTICAL TUBE -", "bbox": {"l": 327.83005, "t": 331.57268999999997, "r": 351.16092, "b": 333.31171, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "MODELS AY11230/11234", "bbox": {"l": 327.83005, "t": 333.18292, "r": 348.30536, "b": 334.92194, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "1.", "bbox": {"l": 327.83005, "t": 336.40439, "r": 329.05914, "b": 337.92606, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "The vertical tube can be used for", "bbox": {"l": 329.67368, "t": 336.40439, "r": 349.95349, "b": 337.92606, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "instructional viewing or to photograph", "bbox": {"l": 329.11752, "t": 337.83588, "r": 353.57977, "b": 339.35751000000005, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": " the image with a digital camera or a", "bbox": {"l": 327.77121, "t": 339.26736, "r": 352.4306, "b": 340.789, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": " micro TV unit", "bbox": {"l": 328.15176, "t": 340.69882, "r": 337.91086, "b": 342.22049, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "2.", "bbox": {"l": 327.8313, "t": 342.19043000000005, "r": 329.09155, "b": 343.71207, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Loosen the retention screw, then rotate ", "bbox": {"l": 329.72168, "t": 342.19043000000005, "r": 354.9267, "b": 343.71207, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": " the adjustment ring to change the ", "bbox": {"l": 327.8313, "t": 343.62192, "r": 351.66949, "b": 345.14355, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": " length of the vertical tube.", "bbox": {"l": 328.21185, "t": 345.05338, "r": 346.33179, "b": 346.57504, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "3.", "bbox": {"l": 327.83005, "t": 346.84680000000003, "r": 329.12726, "b": 348.36847, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "Make sure that both the images in", "bbox": {"l": 329.77588, "t": 346.84680000000003, "r": 351.18005, "b": 348.36847, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "OPERATION ", "bbox": {"l": 327.25311, "t": 254.94812000000002, "r": 350.07861, "b": 258.86096, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "(", "bbox": {"l": 350.07861, "t": 254.76782000000003, "r": 351.82651, "b": 258.68066, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "cont.", "bbox": {"l": 351.82651, "t": 254.94812000000002, "r": 360.85242, "b": 258.86096, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": ")", "bbox": {"l": 360.85242, "t": 254.76782000000003, "r": 362.60028, "b": 258.68066, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "SELECTING OBJECTIVE ", "bbox": {"l": 326.88037, "t": 263.49492999999995, "r": 345.84351, "b": 265.23395000000005, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "MAGNIFICATION", "bbox": {"l": 326.88037, "t": 265.10515999999996, "r": 340.54153, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "1.", "bbox": {"l": 326.88037, "t": 266.71533, "r": 328.31903, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "There are two objectives. The lower", "bbox": {"l": 329.03836, "t": 266.71533, "r": 354.21472, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": " magnification objective has a greater", "bbox": {"l": 326.88037, "t": 268.32556, "r": 355.19193, "b": 270.06458, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": " depth of field and view.", "bbox": {"l": 326.88037, "t": 269.93579, "r": 345.80057, "b": 271.6748, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "2.", "bbox": {"l": 326.88037, "t": 271.54602, "r": 328.33862, "b": 273.28503, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "In order to observe the specimen", "bbox": {"l": 329.06775, "t": 271.54602, "r": 352.39969, "b": 273.28503, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": " easily use the lower magnification", "bbox": {"l": 326.88037, "t": 273.15619000000004, "r": 352.90042, "b": 274.89526, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": " objective first. Then, by rotating the", "bbox": {"l": 326.88037, "t": 274.76642000000004, "r": 354.59546, "b": 276.50543000000005, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": " case, the magnification can be", "bbox": {"l": 326.88037, "t": 276.37665000000004, "r": 350.81885, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": " changed.", "bbox": {"l": 326.88037, "t": 277.98688000000004, "r": 335.46707, "b": 279.72589000000005, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "CHANGING THE INTERPUPILLARY ", "bbox": {"l": 326.88037, "t": 281.20728, "r": 354.57755, "b": 282.94632, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "DISTANCE", "bbox": {"l": 326.88037, "t": 282.81750000000005, "r": 335.1752, "b": 284.55652, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "1.", "bbox": {"l": 326.88037, "t": 284.4277, "r": 328.34784, "b": 286.16675, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "The distance between the observer's", "bbox": {"l": 329.08157, "t": 284.4277, "r": 354.76245, "b": 286.16675, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": " pupils is the interpupillary distance.", "bbox": {"l": 326.88037, "t": 286.03793, "r": 354.6499, "b": 287.77695, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "2.", "bbox": {"l": 326.88037, "t": 287.64813, "r": 328.25125, "b": 289.38718, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "To adjust the interpupillary distance", "bbox": {"l": 328.93671, "t": 287.64813, "r": 354.29825, "b": 289.38718, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": " rotate the prism caps until both eyes", "bbox": {"l": 326.88181, "t": 289.25836, "r": 355.02075, "b": 290.99738, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": " coincide with the image in the", "bbox": {"l": 326.88181, "t": 290.86855999999995, "r": 350.82028, "b": 292.6076, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": " eyepiece. ", "bbox": {"l": 326.88181, "t": 292.47879, "r": 336.2067, "b": 294.2178, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "FOCUSING", "bbox": {"l": 326.88181, "t": 295.69922, "r": 335.3941, "b": 297.43823, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "1.", "bbox": {"l": 326.88181, "t": 297.30942, "r": 328.34314, "b": 299.04846, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "Remove the lens protective cover.", "bbox": {"l": 329.07379, "t": 297.30942, "r": 353.18555, "b": 299.04846, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "2.", "bbox": {"l": 326.88324, "t": 298.91965, "r": 328.35919, "b": 300.65866, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "Place the specimen on the working", "bbox": {"l": 329.0972, "t": 298.91965, "r": 353.45065, "b": 300.65866, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": " stage.", "bbox": {"l": 326.88324, "t": 300.52985, "r": 333.32825, "b": 302.26889000000006, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "3.", "bbox": {"l": 326.88324, "t": 302.14008000000007, "r": 328.31296, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "Focus the specimen with the left eye", "bbox": {"l": 329.02783, "t": 302.14008000000007, "r": 354.76303, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": " first while turning the focus knob until", "bbox": {"l": 326.88324, "t": 303.75027, "r": 355.96307, "b": 305.48932, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": " the image appears clear and sharp.", "bbox": {"l": 326.88324, "t": 305.3605, "r": 354.46594, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "4.", "bbox": {"l": 326.88324, "t": 306.9707, "r": 328.25488, "b": 308.70975, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "Rotate the right eyepiece ring until the", "bbox": {"l": 328.9407, "t": 306.9707, "r": 356.37335, "b": 308.70975, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": " images in each eyepiece coincide and", "bbox": {"l": 326.88324, "t": 308.58093, "r": 355.38867, "b": 310.31995, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": " are sharp and clear.", "bbox": {"l": 326.88324, "t": 310.19113, "r": 343.17249, "b": 311.93018, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "CHANGING THE BULB", "bbox": {"l": 326.88324, "t": 313.41156, "r": 344.13388, "b": 315.15059999999994, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "1.", "bbox": {"l": 326.88324, "t": 315.02178999999995, "r": 328.37418, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "Disconnect the power cord.", "bbox": {"l": 329.11963, "t": 315.02178999999995, "r": 348.50162, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "2.", "bbox": {"l": 326.88324, "t": 316.63199, "r": 328.34061, "b": 318.37103, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "When the bulb is cool, remove the", "bbox": {"l": 329.06931, "t": 316.63199, "r": 353.11588, "b": 318.37103, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": " oblique illuminator cap and remove", "bbox": {"l": 326.88464, "t": 318.2422199999999, "r": 353.79517, "b": 319.9812299999999, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": " the halogen bulb with cap.", "bbox": {"l": 326.88464, "t": 319.85242000000005, "r": 348.02094, "b": 321.59146, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "3.", "bbox": {"l": 326.88464, "t": 321.46265, "r": 328.37512, "b": 323.20166, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "Replace with a new halogen bulb.", "bbox": {"l": 329.12036, "t": 321.46265, "r": 352.96808, "b": 323.20166, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "4.", "bbox": {"l": 326.88608, "t": 323.07285, "r": 328.36884, "b": 324.81189, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "Open the window in the base plate and", "bbox": {"l": 329.1102, "t": 323.07285, "r": 356.5412, "b": 324.81189, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": " replace the halogen lamp or ", "bbox": {"l": 326.88608, "t": 324.68307000000004, "r": 350.13828, "b": 326.42209, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": " fluorescent lamp of transmitted", "bbox": {"l": 326.88608, "t": 326.29327, "r": 351.59677, "b": 328.03232, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": " illuminator.", "bbox": {"l": 326.88608, "t": 327.9035, "r": 336.89197, "b": 329.64252, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "FOCUSING", "bbox": {"l": 358.42023, "t": 263.49492999999995, "r": 366.93256, "b": 265.23395000000005, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "1.", "bbox": {"l": 358.42023, "t": 265.10515999999996, "r": 359.89841, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "Turn the focusing knob away or toward", "bbox": {"l": 360.63751, "t": 265.10515999999996, "r": 387.98407, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": " you until a clear image is viewed.", "bbox": {"l": 358.42023, "t": 266.71533, "r": 384.58948, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "2.", "bbox": {"l": 358.42166, "t": 268.32556, "r": 359.78549, "b": 270.06458, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "If the image is unclear, adjust the", "bbox": {"l": 360.46741, "t": 268.32556, "r": 384.33441, "b": 270.06458, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": " height of the elevator up or down,", "bbox": {"l": 358.4231, "t": 269.93579, "r": 384.61502, "b": 271.6748, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": " then turn the focusing knob again.", "bbox": {"l": 358.4231, "t": 271.54602, "r": 385.38922, "b": 273.28503, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "ZOOM MAGNIFICATION", "bbox": {"l": 358.4231, "t": 274.76642000000004, "r": 377.35046, "b": 276.50543000000005, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "1.", "bbox": {"l": 358.4231, "t": 276.37665000000004, "r": 359.89429, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "Turn the zoom magnification knob to", "bbox": {"l": 360.62988, "t": 276.37665000000004, "r": 386.37589, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": " the desired magnification and field of", "bbox": {"l": 358.4231, "t": 277.98688000000004, "r": 386.78732, "b": 279.72589000000005, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": " view.", "bbox": {"l": 358.4231, "t": 279.59704999999997, "r": 364.16855, "b": 281.33609, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "2.", "bbox": {"l": 358.4231, "t": 281.20728, "r": 359.86777, "b": 282.94632, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "In most situations, it is recommended", "bbox": {"l": 360.59012, "t": 281.20728, "r": 387.31656, "b": 282.94632, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": " that you focus at the lowest ", "bbox": {"l": 358.4231, "t": 282.81750000000005, "r": 381.56656, "b": 284.55652, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": " magnification, then move to a higher", "bbox": {"l": 358.4231, "t": 284.4277, "r": 386.63403, "b": 286.16675, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": " magnification and re-focus as ", "bbox": {"l": 358.42453, "t": 286.03793, "r": 382.77115, "b": 287.77695, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": " necessary.", "bbox": {"l": 358.42453, "t": 287.64813, "r": 367.98694, "b": 289.38718, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "3.", "bbox": {"l": 358.42453, "t": 289.25836, "r": 359.80386, "b": 290.99738, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "If the image is not clear to both eyes", "bbox": {"l": 360.49353, "t": 289.25836, "r": 386.70093, "b": 290.99738, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": " at the same time, the diopter ring may", "bbox": {"l": 358.42453, "t": 290.86855999999995, "r": 388.03534, "b": 292.6076, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": " need adjustment.", "bbox": {"l": 358.42453, "t": 292.47879, "r": 373.13724, "b": 294.2178, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "DIOPTER RING ADJUSTMENT", "bbox": {"l": 358.42453, "t": 295.69922, "r": 381.74539, "b": 297.43823, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "1.", "bbox": {"l": 358.42453, "t": 297.30942, "r": 359.83682, "b": 299.04846, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "To adjust the eyepiece for viewing with", "bbox": {"l": 360.54297, "t": 297.30942, "r": 388.08289, "b": 299.04846, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": " or without eyeglasses and for ", "bbox": {"l": 358.42453, "t": 298.91965, "r": 382.73251, "b": 300.65866, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": " differences in acuity between the right", "bbox": {"l": 358.42453, "t": 300.52985, "r": 387.72266, "b": 302.26889000000006, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": " and left eyes, follow the following", "bbox": {"l": 358.42453, "t": 302.14008000000007, "r": 384.1991, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": " steps:", "bbox": {"l": 358.42453, "t": 303.75027, "r": 364.88672, "b": 305.48932, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "a.", "bbox": {"l": 358.42453, "t": 305.3605, "r": 359.95078, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "Observe an image through the left", "bbox": {"l": 361.47699, "t": 305.3605, "r": 386.65988, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": " eyepiece and bring a specific point", "bbox": {"l": 358.42453, "t": 306.9707, "r": 386.7634, "b": 308.70975, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": " into focus using the focus knob.", "bbox": {"l": 358.42453, "t": 308.58093, "r": 385.41354, "b": 310.31995, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "b.", "bbox": {"l": 358.42453, "t": 310.19113, "r": 359.93304, "b": 311.93018, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "By turning the diopter ring ", "bbox": {"l": 361.44156, "t": 310.19113, "r": 382.56085, "b": 311.93018, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": " adjustment for the left eyepiece,", "bbox": {"l": 358.42596, "t": 311.80136, "r": 385.4559, "b": 313.54037, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": " bring the same point into sharp", "bbox": {"l": 358.42596, "t": 313.41156, "r": 384.56122, "b": 315.15059999999994, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": " focus.", "bbox": {"l": 358.42596, "t": 315.02178999999995, "r": 366.74371, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": " c.Then bring the same point into", "bbox": {"l": 358.42596, "t": 316.63199, "r": 383.93884, "b": 318.37103, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": " focus through the right eyepiece", "bbox": {"l": 358.42596, "t": 318.2422199999999, "r": 385.69241, "b": 319.9812299999999, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": " by turning the right diopter ring.", "bbox": {"l": 358.42596, "t": 319.85242000000005, "r": 385.94861, "b": 321.59146, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": " d.With more than one viewer, each", "bbox": {"l": 358.42596, "t": 321.46265, "r": 385.54236, "b": 323.20166, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": " viewer should note their own", "bbox": {"l": 358.42596, "t": 323.07285, "r": 382.98718, "b": 324.81189, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": " diopter ring position for the left", "bbox": {"l": 358.42596, "t": 324.68307000000004, "r": 385.06448, "b": 326.42209, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": " and right eyepieces, then before", "bbox": {"l": 358.42596, "t": 326.29327, "r": 385.20682, "b": 328.03232, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": " viewing set the diopter ring", "bbox": {"l": 358.42596, "t": 327.9035, "r": 382.21964, "b": 329.64252, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": " adjustments to that setting.", "bbox": {"l": 358.42596, "t": 329.5137, "r": 382.63382, "b": 331.25275, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "CHANGING THE BULB", "bbox": {"l": 358.42596, "t": 332.73412999999994, "r": 375.67661, "b": 334.47317999999996, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "1.", "bbox": {"l": 358.42596, "t": 334.34436, "r": 359.90311, "b": 336.08337, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "Disconnect the power cord from the", "bbox": {"l": 360.64169, "t": 334.34436, "r": 385.75333, "b": 336.08337, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": " electrical outlet.", "bbox": {"l": 358.42596, "t": 335.95456, "r": 372.01416, "b": 337.6936, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "2.", "bbox": {"l": 358.42596, "t": 337.56479, "r": 359.88327, "b": 339.3038, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "When the bulb is cool, remove the", "bbox": {"l": 360.61191, "t": 337.56479, "r": 384.65726, "b": 339.3038, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": " oblique illuminator cap and remove", "bbox": {"l": 358.42596, "t": 339.17499, "r": 385.33649, "b": 340.9140300000001, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": " the halogen bulb with cap.", "bbox": {"l": 358.42596, "t": 340.78522, "r": 379.57224, "b": 342.52423, "coord_origin": "TOPLEFT"}}, {"id": 201, "text": "3.", "bbox": {"l": 358.4274, "t": 342.39542, "r": 359.91788, "b": 344.13446000000005, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": "Replace with a new halogen bulb.", "bbox": {"l": 360.66312, "t": 342.39542, "r": 384.5108, "b": 344.13446000000005, "coord_origin": "TOPLEFT"}}, {"id": 203, "text": "4.", "bbox": {"l": 358.42883, "t": 344.00565000000006, "r": 359.92792, "b": 345.74466, "coord_origin": "TOPLEFT"}}, {"id": 204, "text": "Open the window in the base plate", "bbox": {"l": 360.67746, "t": 344.00565000000006, "r": 385.41235, "b": 345.74466, "coord_origin": "TOPLEFT"}}, {"id": 205, "text": " and replace the halogen lamp or", "bbox": {"l": 358.42883, "t": 345.61584, "r": 383.2782, "b": 347.35489, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": " fluorescent lamp of transmitted", "bbox": {"l": 358.42883, "t": 347.22607, "r": 383.13953, "b": 348.96509, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": " illuminator.", "bbox": {"l": 358.42883, "t": 348.83627, "r": 368.43472, "b": 350.57532, "coord_origin": "TOPLEFT"}}, {"id": 208, "text": "Model AY11230", "bbox": {"l": 326.59567, "t": 261.14185, "r": 339.11377, "b": 262.88091999999995, "coord_origin": "TOPLEFT"}}, {"id": 209, "text": "Model AY11234", "bbox": {"l": 358.48605, "t": 261.14185, "r": 371.00415, "b": 262.88091999999995, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": "14", "bbox": {"l": 455.43533, "t": 351.77038999999996, "r": 457.97827000000007, "b": 353.94415, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "Objectives", "bbox": {"l": 408.24518, "t": 275.52673000000004, "r": 414.4234, "b": 276.96020999999996, "coord_origin": "TOPLEFT"}}, {"id": 212, "text": "Revolving Turret", "bbox": {"l": 409.39554, "t": 268.98235999999997, "r": 419.06677, "b": 270.41583, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "Coarse ", "bbox": {"l": 441.3895, "t": 279.12627999999995, "r": 445.87192, "b": 280.55975, "coord_origin": "TOPLEFT"}}, {"id": 214, "text": "Adjustment", "bbox": {"l": 441.3895, "t": 280.30609, "r": 448.22338999999994, "b": 281.7395900000001, "coord_origin": "TOPLEFT"}}, {"id": 215, "text": "Knob", "bbox": {"l": 441.3895, "t": 281.48593, "r": 444.40371999999996, "b": 282.91939999999994, "coord_origin": "TOPLEFT"}}, {"id": 216, "text": "MODEL AY11236", "bbox": {"l": 398.79288, "t": 254.94646999999998, "r": 428.91568, "b": 258.85931000000005, "coord_origin": "TOPLEFT"}}, {"id": 217, "text": "MICROSCOPE USAGE", "bbox": {"l": 398.32535, "t": 305.04291, "r": 435.93542, "b": 308.95572000000004, "coord_origin": "TOPLEFT"}}, {"id": 218, "text": "BARSKA Model AY11236 is a powerful fixed power compound ", "bbox": {"l": 398.08594, "t": 310.35892, "r": 453.72171, "b": 312.53271, "coord_origin": "TOPLEFT"}}, {"id": 219, "text": "microscope designed for biological studies such as specimen ", "bbox": {"l": 398.08594, "t": 312.50586, "r": 453.09939999999995, "b": 314.67966, "coord_origin": "TOPLEFT"}}, {"id": 220, "text": "examination. It can also be used for examining bacteria and", "bbox": {"l": 398.08594, "t": 314.6528, "r": 456.65246999999994, "b": 316.8266, "coord_origin": "TOPLEFT"}}, {"id": 221, "text": "for general clinical and medical studies and other scientific uses. ", "bbox": {"l": 398.08594, "t": 316.79977, "r": 456.73859000000004, "b": 318.97354, "coord_origin": "TOPLEFT"}}, {"id": 222, "text": "CONSTRUCTION", "bbox": {"l": 398.62399, "t": 320.42941, "r": 427.77472, "b": 324.34222000000005, "coord_origin": "TOPLEFT"}}, {"id": 223, "text": "BARSKA Model AY11236 is a fixed power compound microscope.", "bbox": {"l": 398.08594, "t": 326.46069000000006, "r": 456.02639999999997, "b": 328.63449, "coord_origin": "TOPLEFT"}}, {"id": 224, "text": "It is constructed with two optical paths at the same angle. It is ", "bbox": {"l": 398.08414, "t": 328.6076699999999, "r": 455.42238999999995, "b": 330.7814599999999, "coord_origin": "TOPLEFT"}}, {"id": 225, "text": "equipped with transmitted illumination. By using this instrument, ", "bbox": {"l": 398.08414, "t": 330.75461, "r": 457.39844, "b": 332.92841, "coord_origin": "TOPLEFT"}}, {"id": 226, "text": "the user can observe specimens at magnification from 40x to ", "bbox": {"l": 398.08414, "t": 332.90155, "r": 453.97745, "b": 335.07535000000007, "coord_origin": "TOPLEFT"}}, {"id": 227, "text": "1000x by selecting the desired objective lens. Coarse and fine ", "bbox": {"l": 398.08414, "t": 335.04852, "r": 454.70708999999994, "b": 337.22232, "coord_origin": "TOPLEFT"}}, {"id": 228, "text": "focus adjustments provide accuracy and image detail. The rotating ", "bbox": {"l": 398.08414, "t": 337.19547, "r": 458.90240000000006, "b": 339.36926, "coord_origin": "TOPLEFT"}}, {"id": 229, "text": "head allows the user to position the eyepieces for maximum ", "bbox": {"l": 398.08594, "t": 339.34241, "r": 453.0672, "b": 341.5162, "coord_origin": "TOPLEFT"}}, {"id": 230, "text": "viewing comfort and easy access to all adjustment knobs.", "bbox": {"l": 398.08594, "t": 341.48938, "r": 449.63113, "b": 343.66318, "coord_origin": "TOPLEFT"}}, {"id": 231, "text": "Model AY11236", "bbox": {"l": 422.10626, "t": 301.24191, "r": 434.62433000000004, "b": 302.98096, "coord_origin": "TOPLEFT"}}, {"id": 232, "text": "Fine ", "bbox": {"l": 442.01610999999997, "t": 283.08649, "r": 444.8817399999999, "b": 284.51996, "coord_origin": "TOPLEFT"}}, {"id": 233, "text": "Adjustment", "bbox": {"l": 442.01610999999997, "t": 284.2663, "r": 448.85001, "b": 285.69980000000004, "coord_origin": "TOPLEFT"}}, {"id": 234, "text": "Knob", "bbox": {"l": 442.01610999999997, "t": 285.44611, "r": 445.03033000000005, "b": 286.87961, "coord_origin": "TOPLEFT"}}, {"id": 235, "text": "Stage", "bbox": {"l": 408.00577, "t": 279.12579000000005, "r": 411.42212, "b": 280.5593, "coord_origin": "TOPLEFT"}}, {"id": 236, "text": "Condenser ", "bbox": {"l": 404.07172, "t": 280.9144299999999, "r": 410.77707, "b": 282.3479, "coord_origin": "TOPLEFT"}}, {"id": 237, "text": "Focusing", "bbox": {"l": 404.07172, "t": 282.09424, "r": 409.2157, "b": 283.52774, "coord_origin": "TOPLEFT"}}, {"id": 238, "text": "Knob", "bbox": {"l": 404.07172, "t": 283.27408, "r": 407.08594, "b": 284.7075500000001, "coord_origin": "TOPLEFT"}}, {"id": 239, "text": "Eyepiece", "bbox": {"l": 441.81281, "t": 262.32178, "r": 447.03702, "b": 263.75525000000005, "coord_origin": "TOPLEFT"}}, {"id": 240, "text": "Stand", "bbox": {"l": 437.34607, "t": 271.13025000000005, "r": 440.80496, "b": 272.56281, "coord_origin": "TOPLEFT"}}, {"id": 241, "text": "Lamp ", "bbox": {"l": 409.7164, "t": 284.40027, "r": 413.3768, "b": 285.83282, "coord_origin": "TOPLEFT"}}, {"id": 242, "text": "On/Off", "bbox": {"l": 409.7164, "t": 285.83163, "r": 413.68201, "b": 287.26416, "coord_origin": "TOPLEFT"}}, {"id": 243, "text": "Switch", "bbox": {"l": 409.7164, "t": 287.263, "r": 413.6337, "b": 288.69553, "coord_origin": "TOPLEFT"}}, {"id": 244, "text": "Lamp ", "bbox": {"l": 434.8712499999999, "t": 296.7153, "r": 438.53164999999996, "b": 298.14783, "coord_origin": "TOPLEFT"}}, {"id": 245, "text": "Power", "bbox": {"l": 439.52039, "t": 292.18307000000004, "r": 443.08768, "b": 293.61560000000003, "coord_origin": "TOPLEFT"}}, {"id": 246, "text": "Cord", "bbox": {"l": 439.52039, "t": 293.61444, "r": 442.29575, "b": 295.04697, "coord_origin": "TOPLEFT"}}, {"id": 247, "text": "Rotating Head", "bbox": {"l": 413.55829, "t": 264.66089, "r": 421.94913, "b": 266.09344, "coord_origin": "TOPLEFT"}}, {"id": 248, "text": "Stage Clip", "bbox": {"l": 441.84316999999993, "t": 286.90573, "r": 447.87585000000007, "b": 288.33826, "coord_origin": "TOPLEFT"}}, {"id": 249, "text": "Adjustment", "bbox": {"l": 441.84316999999993, "t": 288.3371, "r": 448.67252, "b": 289.76962000000003, "coord_origin": "TOPLEFT"}}, {"id": 250, "text": "Interpupillary Slide Adjustment", "bbox": {"l": 407.2403, "t": 259.86645999999996, "r": 425.79089, "b": 261.29895, "coord_origin": "TOPLEFT"}}, {"id": 251, "text": "Circling Minimums", "bbox": {"l": 449.10074000000003, "t": 378.66302, "r": 466.08835000000005, "b": 380.78412, "coord_origin": "TOPLEFT"}}, {"id": 252, "text": "7", "bbox": {"l": 449.10074000000003, "t": 383.2203999999999, "r": 449.64444, "b": 385.34148999999996, "coord_origin": "TOPLEFT"}}, {"id": 253, "text": "K H U H Z D V D F K D Q J H W R W K H 7 ( 5 3 6 F U L W H U L D L Q W K D W D \u1087H F W V F L U F O L Q J D U H D G L P H Q V L R Q E \\ H [ S D Q G L Q J W K H D U H D V W R S U R Y L G H ", "bbox": {"l": 450.18811, "t": 383.2203999999999, "r": 550.77124, "b": 385.34148999999996, "coord_origin": "TOPLEFT"}}, {"id": 254, "text": "improved obstacle protection. To indicate that the new criteria had been applied to a given procedure, a ", "bbox": {"l": 449.10074000000003, "t": 385.75732, "r": 536.14716, "b": 387.87842, "coord_origin": "TOPLEFT"}}, {"id": 255, "text": " is placed on ", "bbox": {"l": 538.31085, "t": 385.75732, "r": 549.49921, "b": 387.87842, "coord_origin": "TOPLEFT"}}, {"id": 256, "text": "the circling line of minimums. The new circling tables and explanatory information is located in the Legend of the TPP.", "bbox": {"l": 449.10074000000003, "t": 388.03601, "r": 547.58185, "b": 390.1571, "coord_origin": "TOPLEFT"}}, {"id": 257, "text": "7", "bbox": {"l": 449.10074000000003, "t": 393.2128000000001, "r": 449.6163, "b": 395.33386, "coord_origin": "TOPLEFT"}}, {"id": 258, "text": "K H D S S U R D F K H V X V L Q J V W D Q G D U G F L U F O L Q J D S S U R D F K D U H D V F D Q E H L G H Q W L \u00bf H G E \\ W K H D E V H Q F H R I W K H ", "bbox": {"l": 450.1319, "t": 393.2128000000001, "r": 529.53082, "b": 395.33386, "coord_origin": "TOPLEFT"}}, {"id": 259, "text": " on the circling line of ", "bbox": {"l": 532.05829, "t": 393.2128000000001, "r": 550.42261, "b": 395.33386, "coord_origin": "TOPLEFT"}}, {"id": 260, "text": "minima.", "bbox": {"l": 449.10074000000003, "t": 395.49149, "r": 455.74692, "b": 397.61255, "coord_origin": "TOPLEFT"}}, {"id": 261, "text": "$ S S O \\ 6 W D Q G D U G & L U F O L Q J $ S S U R D F K 0 D Q H X Y H U L Q J 5 D G L X V 7 D E O H ", "bbox": {"l": 449.95525999999995, "t": 415.59549, "r": 496.2829, "b": 417.50446, "coord_origin": "TOPLEFT"}}, {"id": 262, "text": "$ S S O \\ ( [ S D Q G H G & L U F O L Q J $ S S U R D F K 0 D Q H X Y H U L Q J $ L U V S D F H 5 D G L X V ", "bbox": {"l": 501.13077, "t": 409.25543, "r": 551.16101, "b": 411.1644, "coord_origin": "TOPLEFT"}}, {"id": 263, "text": "Table", "bbox": {"l": 501.13077, "t": 411.30624, "r": 505.2477999999999, "b": 413.21521, "coord_origin": "TOPLEFT"}}, {"id": 264, "text": "AIRPORT SKETCH", "bbox": {"l": 449.10074000000003, "t": 420.18802, "r": 469.35599, "b": 422.73331, "coord_origin": "TOPLEFT"}}, {"id": 265, "text": "The airport sketch is a depiction of the airport with emphasis on runway pattern and related ", "bbox": {"l": 449.10074000000003, "t": 425.08908, "r": 525.93616, "b": 427.21017, "coord_origin": "TOPLEFT"}}, {"id": 266, "text": "information, positioned in either the lower left or lower right corner of the chart to aid pi-", "bbox": {"l": 449.10074000000003, "t": 427.3678, "r": 522.0343, "b": 429.48886, "coord_origin": "TOPLEFT"}}, {"id": 267, "text": "lot recognition of the airport from the air and to provide some information to aid on ground ", "bbox": {"l": 449.10074000000003, "t": 429.64648, "r": 524.67151, "b": 431.76755, "coord_origin": "TOPLEFT"}}, {"id": 268, "text": "navigation of the airport. The runways are drawn to scale and oriented to true north. Runway ", "bbox": {"l": 449.10074000000003, "t": 431.92514000000006, "r": 527.172, "b": 434.04623, "coord_origin": "TOPLEFT"}}, {"id": 269, "text": "dimensions (length and width) are shown for all active runways.", "bbox": {"l": 449.10074000000003, "t": 434.20383, "r": 502.39545, "b": 436.32492, "coord_origin": "TOPLEFT"}}, {"id": 270, "text": "Runway(s) are depicted based on what type and construction of the runway.", "bbox": {"l": 449.10074000000003, "t": 438.7611999999999, "r": 512.92676, "b": 440.88228999999995, "coord_origin": "TOPLEFT"}}, {"id": 271, "text": "Hard Surface", "bbox": {"l": 449.95525999999995, "t": 444.07001, "r": 460.02307, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}, {"id": 272, "text": "Other Than ", "bbox": {"l": 464.89963, "t": 444.07001, "r": 473.98819, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}, {"id": 273, "text": "Hard Surface", "bbox": {"l": 464.89963, "t": 446.12085, "r": 474.96744, "b": 448.02979, "coord_origin": "TOPLEFT"}}, {"id": 274, "text": "Metal Surface", "bbox": {"l": 478.91357, "t": 444.07001, "r": 489.45648, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}, {"id": 275, "text": "Closed Runway", "bbox": {"l": 493.06420999999995, "t": 444.07001, "r": 505.03076, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}, {"id": 276, "text": "Under Construction", "bbox": {"l": 509.5809, "t": 444.07001, "r": 524.30237, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}, {"id": 277, "text": "Stopways, ", "bbox": {"l": 449.95525999999995, "t": 454.81207, "r": 458.31406, "b": 456.72104, "coord_origin": "TOPLEFT"}}, {"id": 278, "text": "Taxiways, Park-", "bbox": {"l": 449.95525999999995, "t": 456.86288, "r": 461.92083999999994, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}}, {"id": 279, "text": "ing Areas", "bbox": {"l": 449.95525999999995, "t": 458.91373, "r": 457.08014, "b": 460.82268999999997, "coord_origin": "TOPLEFT"}}, {"id": 280, "text": "Displaced ", "bbox": {"l": 464.89963, "t": 454.81207, "r": 472.87732, "b": 456.72104, "coord_origin": "TOPLEFT"}}, {"id": 281, "text": "Threshold", "bbox": {"l": 464.89963, "t": 456.86288, "r": 472.49792, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}}, {"id": 282, "text": "Closed", "bbox": {"l": 478.91357, "t": 454.81207, "r": 483.61584, "b": 456.72104, "coord_origin": "TOPLEFT"}}, {"id": 283, "text": "Pavement", "bbox": {"l": 478.91357, "t": 456.86288, "r": 486.60754000000003, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}}, {"id": 284, "text": "Water Runway", "bbox": {"l": 493.06420999999995, "t": 454.81207, "r": 504.20648, "b": 456.72104, "coord_origin": "TOPLEFT"}}, {"id": 285, "text": "Taxiways and aprons are shaded grey. Other runway features that may be shown are runway numbers, runway dimen-", "bbox": {"l": 449.10074000000003, "t": 469.32974, "r": 548.59674, "b": 471.45081, "coord_origin": "TOPLEFT"}}, {"id": 286, "text": "sions, runway slope, arresting gear, and displaced threshold.", "bbox": {"l": 449.10074000000003, "t": 471.60843, "r": 500.08181999999994, "b": 473.72949, "coord_origin": "TOPLEFT"}}, {"id": 287, "text": "2", "bbox": {"l": 449.10074000000003, "t": 476.16577, "r": 449.59933000000007, "b": 478.28687, "coord_origin": "TOPLEFT"}}, {"id": 288, "text": "W K H U L Q I R U P D W L R Q F R Q F H U Q L Q J O L J K W L Q J \u00bf Q D O D S S U R D F K E H D U L Q J V D L U S R U W E H D F R Q R E V W D F O H V F R Q W U R O W R Z H U 1 $ 9 $ , ' V K H O L ", "bbox": {"l": 450.09796, "t": 476.16577, "r": 547.82562, "b": 478.28687, "coord_origin": "TOPLEFT"}}, {"id": 289, "text": "-", "bbox": {"l": 547.82623, "t": 476.16577, "r": 548.45862, "b": 478.28687, "coord_origin": "TOPLEFT"}}, {"id": 290, "text": "pads may also be shown.", "bbox": {"l": 449.10074000000003, "t": 478.44446, "r": 470.52609000000007, "b": 480.56555, "coord_origin": "TOPLEFT"}}, {"id": 291, "text": "$ L U S R U W ( O H Y D W L R Q D Q G 7 R X F K G R Z Q = R Q H ( O H Y D W L R Q ", "bbox": {"l": 449.10074000000003, "t": 483.00183, "r": 493.37906000000004, "b": 485.12292, "coord_origin": "TOPLEFT"}}, {"id": 292, "text": "The airport elevation is shown enclosed within a box in the upper left corner of the sketch box and the touchdown zone ", "bbox": {"l": 449.10074000000003, "t": 487.5592, "r": 549.16168, "b": 489.6803, "coord_origin": "TOPLEFT"}}, {"id": 293, "text": "elevation (TDZE) is shown in the upper right corner of the sketch box. The airport elevation is the highest point of an ", "bbox": {"l": 449.10074000000003, "t": 489.83789, "r": 546.90881, "b": 491.95898, "coord_origin": "TOPLEFT"}}, {"id": 294, "text": "D L U S R U W \u00b6 V X V D E O H U X Q Z D \\ V P H D V X U H G L Q I H H W I U R P P H D Q V H D O H Y H O 7 K H 7 ' = ( L V W K H K L J K H V W H O H Y D W L R Q L Q W K H \u00bf U V W I H H W R I ", "bbox": {"l": 449.10074000000003, "t": 492.11658, "r": 551.80023, "b": 494.23767, "coord_origin": "TOPLEFT"}}, {"id": 295, "text": "the landing surface. Circling only approaches will not show a TDZE.", "bbox": {"l": 449.10074000000003, "t": 494.39526, "r": 505.85068000000007, "b": 496.51636, "coord_origin": "TOPLEFT"}}, {"id": 296, "text": "114", "bbox": {"l": 498.80661000000003, "t": 515.9437, "r": 502.08792, "b": 519.01764, "coord_origin": "TOPLEFT"}}, {"id": 297, "text": "FAA Chart Users\u2019 Guide - Terminal Procedures Publication (TPP) - Terms", "bbox": {"l": 444.56319999999994, "t": 422.84869, "r": 446.25998, "b": 471.87128, "coord_origin": "TOPLEFT"}}, {"id": 298, "text": "AGL 2013 Financial Calendar", "bbox": {"l": 329.40536, "t": 379.37537, "r": 355.13138, "b": 382.13336, "coord_origin": "TOPLEFT"}}, {"id": 299, "text": "22", "bbox": {"l": 329.40536, "t": 382.30273, "r": 330.96848, "b": 384.55927, "coord_origin": "TOPLEFT"}}, {"id": 300, "text": "August 2012 ", "bbox": {"l": 331.75003, "t": 382.30273, "r": 341.12875, "b": 384.55927, "coord_origin": "TOPLEFT"}}, {"id": 301, "text": "2012 full year result and fi nal dividend announced", "bbox": {"l": 350.4722, "t": 382.30273, "r": 384.81079, "b": 384.55927, "coord_origin": "TOPLEFT"}}, {"id": 302, "text": "30", "bbox": {"l": 329.40536, "t": 384.84552, "r": 330.97336, "b": 387.10205, "coord_origin": "TOPLEFT"}}, {"id": 303, "text": "August 2012 ", "bbox": {"l": 331.75735, "t": 384.84552, "r": 341.16534, "b": 387.10205, "coord_origin": "TOPLEFT"}}, {"id": 304, "text": "Ex-dividend trading commences", "bbox": {"l": 350.4722, "t": 384.84552, "r": 372.90613, "b": 387.10205, "coord_origin": "TOPLEFT"}}, {"id": 305, "text": "5", "bbox": {"l": 329.40536, "t": 387.38828, "r": 330.20337, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}}, {"id": 306, "text": "September 2012 ", "bbox": {"l": 331.00137, "t": 387.38828, "r": 342.9715, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}}, {"id": 307, "text": "Record date for 2012 fi nal dividend", "bbox": {"l": 350.4722, "t": 387.38828, "r": 374.88693, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}}, {"id": 308, "text": "27", "bbox": {"l": 329.40536, "t": 389.93103, "r": 331.0173, "b": 392.18762, "coord_origin": "TOPLEFT"}}, {"id": 309, "text": "September 2012 ", "bbox": {"l": 331.82327, "t": 389.93103, "r": 343.91284, "b": 392.18762, "coord_origin": "TOPLEFT"}}, {"id": 310, "text": "Final dividend payable", "bbox": {"l": 350.4722, "t": 389.93103, "r": 365.65988, "b": 392.18762, "coord_origin": "TOPLEFT"}}, {"id": 311, "text": "23", "bbox": {"l": 329.40536, "t": 392.47382, "r": 330.98804, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}}, {"id": 312, "text": "October 2012 ", "bbox": {"l": 331.77936, "t": 392.47382, "r": 342.06674, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}}, {"id": 313, "text": "Annual General Meeting", "bbox": {"l": 350.4722, "t": 392.47382, "r": 367.22156, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}}, {"id": 314, "text": "27", "bbox": {"l": 329.40536, "t": 395.0166, "r": 330.99741, "b": 397.27313, "coord_origin": "TOPLEFT"}}, {"id": 315, "text": "February 2013", "bbox": {"l": 331.7934, "t": 395.0166, "r": 342.1416, "b": 397.27313, "coord_origin": "TOPLEFT"}}, {"id": 316, "text": " 1", "bbox": {"l": 342.64841, "t": 395.18298, "r": 342.65811, "b": 396.49857000000003, "coord_origin": "TOPLEFT"}}, {"id": 317, "text": "2013 interim result and interim dividend announced", "bbox": {"l": 350.47177, "t": 395.01474, "r": 386.25897, "b": 397.2713, "coord_origin": "TOPLEFT"}}, {"id": 318, "text": "28", "bbox": {"l": 329.40491, "t": 397.55749999999995, "r": 331.02695, "b": 399.81406, "coord_origin": "TOPLEFT"}}, {"id": 319, "text": "August 2013", "bbox": {"l": 331.83795, "t": 397.55749999999995, "r": 340.75909, "b": 399.81406, "coord_origin": "TOPLEFT"}}, {"id": 320, "text": " 1", "bbox": {"l": 341.26437, "t": 397.7254, "r": 341.27408, "b": 399.04095, "coord_origin": "TOPLEFT"}}, {"id": 321, "text": "2013 full year results and fi nal dividend announced ", "bbox": {"l": 350.47144, "t": 397.55713, "r": 385.93265, "b": 399.81369, "coord_origin": "TOPLEFT"}}, {"id": 322, "text": "1", "bbox": {"l": 329.40536, "t": 400.46155, "r": 329.87708, "b": 401.96588, "coord_origin": "TOPLEFT"}}, {"id": 323, "text": "Indicative dates only, subject to change/Board confi rmation", "bbox": {"l": 330.34882, "t": 400.46155, "r": 358.65204, "b": 401.96588, "coord_origin": "TOPLEFT"}}, {"id": 324, "text": "AGL\u2019s Annual General Meeting will be held at the City Recital Hall, Angel Place, Sydney ", "bbox": {"l": 329.40536, "t": 404.34503, "r": 391.771, "b": 406.60156, "coord_origin": "TOPLEFT"}}, {"id": 325, "text": "commencing at 10.30am on Tuesday 23 October 2012.", "bbox": {"l": 329.40536, "t": 406.37857, "r": 369.65308, "b": 408.63513000000006, "coord_origin": "TOPLEFT"}}, {"id": 326, "text": "Ye s te rd ay", "bbox": {"l": 363.54486, "t": 460.53054999999995, "r": 379.25955, "b": 465.54507, "coord_origin": "TOPLEFT"}}, {"id": 327, "text": "Established in Sydney in 1837, and then ", "bbox": {"l": 363.54486, "t": 466.7157, "r": 391.38229, "b": 468.97223, "coord_origin": "TOPLEFT"}}, {"id": 328, "text": "known as The Australian Gas Light Company, ", "bbox": {"l": 363.54486, "t": 468.74924, "r": 395.01788, "b": 471.00577, "coord_origin": "TOPLEFT"}}, {"id": 329, "text": "the AGL business has an established history ", "bbox": {"l": 363.54486, "t": 470.78281, "r": 394.08322, "b": 473.03934, "coord_origin": "TOPLEFT"}}, {"id": 330, "text": "and reputation for serving the gas and ", "bbox": {"l": 363.54486, "t": 472.81635, "r": 390.60727, "b": 475.07288, "coord_origin": "TOPLEFT"}}, {"id": 331, "text": "electricity needs of Australian households. ", "bbox": {"l": 363.54486, "t": 474.84988, "r": 393.49612, "b": 477.10645, "coord_origin": "TOPLEFT"}}, {"id": 332, "text": "In 1841, when AGL supplied the gas to light ", "bbox": {"l": 363.54486, "t": 476.88345, "r": 394.11481, "b": 479.13998, "coord_origin": "TOPLEFT"}}, {"id": 333, "text": "the fi rst public street lamp, it was reported ", "bbox": {"l": 363.54486, "t": 478.91699, "r": 393.75891, "b": 481.17352, "coord_origin": "TOPLEFT"}}, {"id": 334, "text": "in the Sydney Gazette as a \u201cwonderful ", "bbox": {"l": 363.54486, "t": 480.95053, "r": 390.4975, "b": 483.20709, "coord_origin": "TOPLEFT"}}, {"id": 335, "text": "achievement of scientifi c knowledge, assisted ", "bbox": {"l": 363.54486, "t": 482.9841, "r": 395.70975, "b": 485.24063, "coord_origin": "TOPLEFT"}}, {"id": 336, "text": "by mechanical ingenuity.\u201d Within two years, ", "bbox": {"l": 363.54486, "t": 485.01764, "r": 394.27283, "b": 487.2742, "coord_origin": "TOPLEFT"}}, {"id": 337, "text": "165 gas lamps were lighting the City of Sydney.", "bbox": {"l": 363.54486, "t": 487.05121, "r": 396.65939, "b": 489.30774, "coord_origin": "TOPLEFT"}}, {"id": 338, "text": "Looking back on ", "bbox": {"l": 329.4054, "t": 419.93124, "r": 384.19696, "b": 431.09412, "coord_origin": "TOPLEFT"}}, {"id": 339, "text": "175 years of ", "bbox": {"l": 329.4054, "t": 430.10379, "r": 372.16626, "b": 441.26669, "coord_origin": "TOPLEFT"}}, {"id": 340, "text": "looking forward.", "bbox": {"l": 329.4054, "t": 440.27636999999993, "r": 385.3981, "b": 451.43924, "coord_origin": "TOPLEFT"}}, {"id": 341, "text": "AGL Energy Limited ABN 74 115 061 375", "bbox": {"l": 329.40536, "t": 372.16159, "r": 353.36179, "b": 373.91669, "coord_origin": "TOPLEFT"}}, {"id": 342, "text": "29", "bbox": {"l": 546.20587, "t": 360.90448, "r": 548.23407, "b": 362.82242, "coord_origin": "TOPLEFT"}}, {"id": 343, "text": "signs, signals and road markings", "bbox": {"l": 497.77728, "t": 251.43384000000003, "r": 542.8255, "b": 254.94385, "coord_origin": "TOPLEFT"}}, {"id": 344, "text": "3", "bbox": {"l": 490.30679, "t": 251.47478999999998, "r": 492.09982, "b": 254.98479999999995, "coord_origin": "TOPLEFT"}}, {"id": 345, "text": "In ", "bbox": {"l": 498.15335, "t": 263.88922, "r": 500.05637, "b": 265.92719, "coord_origin": "TOPLEFT"}}, {"id": 346, "text": "chapter 2, you and your vehicle", "bbox": {"l": 500.05637, "t": 263.85717999999997, "r": 524.37036, "b": 265.86310000000003, "coord_origin": "TOPLEFT"}}, {"id": 347, "text": ", you learned about ", "bbox": {"l": 524.37036, "t": 263.88922, "r": 539.89124, "b": 265.92719, "coord_origin": "TOPLEFT"}}, {"id": 348, "text": "some of the controls in your vehicle. This chapter is a handy ", "bbox": {"l": 498.15335, "t": 265.93224999999995, "r": 544.50403, "b": 267.97020999999995, "coord_origin": "TOPLEFT"}}, {"id": 349, "text": "reference section that gives examples of the most common ", "bbox": {"l": 498.15335, "t": 267.97533999999996, "r": 544.01343, "b": 270.01331000000005, "coord_origin": "TOPLEFT"}}, {"id": 350, "text": "signs, signals and road markings that keep traffi c organized ", "bbox": {"l": 498.15335, "t": 270.01831000000004, "r": 544.11987, "b": 272.05634, "coord_origin": "TOPLEFT"}}, {"id": 351, "text": "and flowing smoothly. ", "bbox": {"l": 498.15335, "t": 272.06140000000005, "r": 515.41071, "b": 274.09937, "coord_origin": "TOPLEFT"}}, {"id": 352, "text": "Signs", "bbox": {"l": 498.15335, "t": 277.34619, "r": 505.64642000000003, "b": 280.9357, "coord_origin": "TOPLEFT"}}, {"id": 353, "text": "There are three ways to read signs: by their shape, colour and ", "bbox": {"l": 498.15335, "t": 281.82187, "r": 543.92957, "b": 283.85983, "coord_origin": "TOPLEFT"}}, {"id": 354, "text": "the messages printed on them. Understanding these three ways ", "bbox": {"l": 498.15335, "t": 283.8649, "r": 545.67834, "b": 285.90289, "coord_origin": "TOPLEFT"}}, {"id": 355, "text": "of classifying signs will help you figure out the meaning of signs ", "bbox": {"l": 498.15335, "t": 285.90796, "r": 545.26471, "b": 287.94592, "coord_origin": "TOPLEFT"}}, {"id": 356, "text": "that are new to you. ", "bbox": {"l": 498.15335, "t": 287.95099, "r": 513.31335, "b": 289.98895, "coord_origin": "TOPLEFT"}}, {"id": 357, "text": "Stop", "bbox": {"l": 505.43439, "t": 303.07596, "r": 508.53033000000005, "b": 304.89639, "coord_origin": "TOPLEFT"}}, {"id": 358, "text": "Yield the right-of-way", "bbox": {"l": 527.45502, "t": 303.25354, "r": 541.44678, "b": 305.07397, "coord_origin": "TOPLEFT"}}, {"id": 359, "text": "Shows driving", "bbox": {"l": 501.79385, "t": 321.18973, "r": 510.41632, "b": 323.01016, "coord_origin": "TOPLEFT"}}, {"id": 360, "text": "regulations", "bbox": {"l": 501.79385, "t": 322.87731999999994, "r": 509.04268999999994, "b": 324.69775000000004, "coord_origin": "TOPLEFT"}}, {"id": 361, "text": "Explains lane use", "bbox": {"l": 518.66455, "t": 319.59146, "r": 529.80902, "b": 321.41190000000006, "coord_origin": "TOPLEFT"}}, {"id": 362, "text": "School zone signs ", "bbox": {"l": 534.87561, "t": 318.37616, "r": 546.95142, "b": 320.19659, "coord_origin": "TOPLEFT"}}, {"id": 363, "text": "are fl uorescent ", "bbox": {"l": 534.87561, "t": 320.0637500000001, "r": 545.05762, "b": 321.88419, "coord_origin": "TOPLEFT"}}, {"id": 364, "text": "yellow-green", "bbox": {"l": 534.87561, "t": 321.75134, "r": 543.32263, "b": 323.57178, "coord_origin": "TOPLEFT"}}, {"id": 365, "text": "Tells about motorist ", "bbox": {"l": 499.21862999999996, "t": 338.12772, "r": 512.62451, "b": 339.94815, "coord_origin": "TOPLEFT"}}, {"id": 366, "text": "services", "bbox": {"l": 499.21862999999996, "t": 339.81531000000007, "r": 504.39917, "b": 341.63574, "coord_origin": "TOPLEFT"}}, {"id": 367, "text": "Shows a permitted ", "bbox": {"l": 516.97748, "t": 338.06039, "r": 529.77484, "b": 339.88082999999995, "coord_origin": "TOPLEFT"}}, {"id": 368, "text": "action", "bbox": {"l": 516.97748, "t": 339.74799, "r": 520.96399, "b": 341.56842, "coord_origin": "TOPLEFT"}}, {"id": 369, "text": "Shows an action that ", "bbox": {"l": 534.55847, "t": 337.88281, "r": 548.58453, "b": 339.7032500000001, "coord_origin": "TOPLEFT"}}, {"id": 370, "text": "is not permitted", "bbox": {"l": 534.55847, "t": 339.57040000000006, "r": 545.08862, "b": 341.39084, "coord_origin": "TOPLEFT"}}, {"id": 371, "text": "Warns of hazards ", "bbox": {"l": 483.05853, "t": 356.17416, "r": 494.72577, "b": 357.9946, "coord_origin": "TOPLEFT"}}, {"id": 372, "text": "ahead", "bbox": {"l": 483.05853, "t": 357.86179, "r": 487.07525999999996, "b": 359.68222, "coord_origin": "TOPLEFT"}}, {"id": 373, "text": "Warns of", "bbox": {"l": 499.39645, "t": 356.26297000000005, "r": 504.69171, "b": 358.0834, "coord_origin": "TOPLEFT"}}, {"id": 374, "text": "construction zones", "bbox": {"l": 499.39645, "t": 357.95056, "r": 511.69116, "b": 359.77099999999996, "coord_origin": "TOPLEFT"}}, {"id": 375, "text": "Railway crossing", "bbox": {"l": 516.75891, "t": 356.26297000000005, "r": 527.42938, "b": 358.0834, "coord_origin": "TOPLEFT"}}, {"id": 376, "text": "Shows distance and ", "bbox": {"l": 534.5141, "t": 352.92981, "r": 547.89862, "b": 354.75024, "coord_origin": "TOPLEFT"}}, {"id": 377, "text": "direction", "bbox": {"l": 534.5141, "t": 354.6174, "r": 540.2818, "b": 356.43784, "coord_origin": "TOPLEFT"}}, {"id": 378, "text": "\u2022", "bbox": {"l": 478.37466, "t": 270.14075, "r": 479.14251999999993, "b": 272.17877, "coord_origin": "TOPLEFT"}}, {"id": 379, "text": "Signs", "bbox": {"l": 479.91036999999994, "t": 270.14075, "r": 483.74963, "b": 272.17877, "coord_origin": "TOPLEFT"}}, {"id": 380, "text": "- regulatory signs", "bbox": {"l": 479.97293, "t": 272.84717, "r": 492.31219, "b": 274.34888, "coord_origin": "TOPLEFT"}}, {"id": 381, "text": "- school, ", "bbox": {"l": 479.97293, "t": 275.14513999999997, "r": 486.72598000000005, "b": 276.64679, "coord_origin": "TOPLEFT"}}, {"id": 382, "text": "playground and ", "bbox": {"l": 481.21602999999993, "t": 276.77972, "r": 492.93286000000006, "b": 278.81768999999997, "coord_origin": "TOPLEFT"}}, {"id": 383, "text": "crosswalk signs", "bbox": {"l": 481.21602999999993, "t": 278.82275000000004, "r": 491.82938000000007, "b": 280.86075, "coord_origin": "TOPLEFT"}}, {"id": 384, "text": "- lane use signs", "bbox": {"l": 479.97293, "t": 281.52759, "r": 491.00775000000004, "b": 283.02924, "coord_origin": "TOPLEFT"}}, {"id": 385, "text": "- turn control signs", "bbox": {"l": 479.97293, "t": 283.82556, "r": 493.32748, "b": 285.3272099999999, "coord_origin": "TOPLEFT"}}, {"id": 386, "text": "- parking signs", "bbox": {"l": 479.97293, "t": 286.1235, "r": 490.4915199999999, "b": 287.62518, "coord_origin": "TOPLEFT"}}, {"id": 387, "text": "- reserved lane ", "bbox": {"l": 479.97293, "t": 288.42148, "r": 491.17004000000003, "b": 289.92316, "coord_origin": "TOPLEFT"}}, {"id": 388, "text": "signs", "bbox": {"l": 481.21602999999993, "t": 290.05605999999995, "r": 484.77405000000005, "b": 292.09406, "coord_origin": "TOPLEFT"}}, {"id": 389, "text": "- warning signs", "bbox": {"l": 479.97293, "t": 292.76169000000004, "r": 490.83398, "b": 294.26334, "coord_origin": "TOPLEFT"}}, {"id": 390, "text": "- object markers", "bbox": {"l": 479.97293, "t": 295.05963, "r": 491.62692, "b": 296.56131, "coord_origin": "TOPLEFT"}}, {"id": 391, "text": "- construction ", "bbox": {"l": 479.97293, "t": 297.3576, "r": 490.37341, "b": 298.8592499999999, "coord_origin": "TOPLEFT"}}, {"id": 392, "text": "signs", "bbox": {"l": 481.21602999999993, "t": 298.99219, "r": 484.77405000000005, "b": 301.03015, "coord_origin": "TOPLEFT"}}, {"id": 393, "text": "- information and ", "bbox": {"l": 479.97293, "t": 301.69780999999995, "r": 492.93912, "b": 303.19946, "coord_origin": "TOPLEFT"}}, {"id": 394, "text": "destination signs", "bbox": {"l": 481.21602999999993, "t": 303.3324, "r": 493.00525, "b": 305.37036, "coord_origin": "TOPLEFT"}}, {"id": 395, "text": "- railway signs", "bbox": {"l": 479.97293, "t": 306.0379899999999, "r": 489.99047999999993, "b": 307.53967, "coord_origin": "TOPLEFT"}}, {"id": 396, "text": "\u2022", "bbox": {"l": 478.375, "t": 308.24789, "r": 479.1032400000001, "b": 310.28586, "coord_origin": "TOPLEFT"}}, {"id": 397, "text": "Signals", "bbox": {"l": 479.83151, "t": 308.24789, "r": 484.92925999999994, "b": 310.28586, "coord_origin": "TOPLEFT"}}, {"id": 398, "text": "- lane control ", "bbox": {"l": 479.97293, "t": 310.95358, "r": 490.00091999999995, "b": 312.45526, "coord_origin": "TOPLEFT"}}, {"id": 399, "text": "signals", "bbox": {"l": 481.21602999999993, "t": 312.5881999999999, "r": 485.95331, "b": 314.62616, "coord_origin": "TOPLEFT"}}, {"id": 400, "text": "- traffic lights", "bbox": {"l": 479.97293, "t": 315.29379, "r": 489.29876999999993, "b": 316.79544, "coord_origin": "TOPLEFT"}}, {"id": 401, "text": "\u2022", "bbox": {"l": 478.375, "t": 317.50366, "r": 479.18129999999996, "b": 319.5416599999999, "coord_origin": "TOPLEFT"}}, {"id": 402, "text": "Road markings", "bbox": {"l": 479.98761, "t": 317.50366, "r": 490.46960000000007, "b": 319.5416599999999, "coord_origin": "TOPLEFT"}}, {"id": 403, "text": "- yellow lines", "bbox": {"l": 479.97293, "t": 320.20938, "r": 489.26166000000006, "b": 321.71103, "coord_origin": "TOPLEFT"}}, {"id": 404, "text": "- white lines", "bbox": {"l": 479.97293, "t": 322.50732, "r": 488.59189, "b": 324.009, "coord_origin": "TOPLEFT"}}, {"id": 405, "text": "- reserved lane ", "bbox": {"l": 479.97293, "t": 324.8053, "r": 491.17004000000003, "b": 326.30698, "coord_origin": "TOPLEFT"}}, {"id": 406, "text": "markings", "bbox": {"l": 481.21602999999993, "t": 326.43988, "r": 487.58978, "b": 328.47784, "coord_origin": "TOPLEFT"}}, {"id": 407, "text": "- other markings", "bbox": {"l": 479.97293, "t": 329.14551, "r": 491.75177, "b": 330.64716, "coord_origin": "TOPLEFT"}}, {"id": 408, "text": "in this chapter", "bbox": {"l": 478.15246999999994, "t": 265.07030999999995, "r": 493.75586, "b": 268.06872999999996, "coord_origin": "TOPLEFT"}}], "children": [{"id": 32, "label": "text", "bbox": {"l": 327.86951, "t": 351.78085, "r": 330.41248, "b": 353.95465, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "13", "bbox": {"l": 327.86951, "t": 351.78085, "r": 330.41248, "b": 353.95465, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 327.83005, "t": 331.57268999999997, "r": 351.16092, "b": 333.31171, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "USING THE VERTICAL TUBE -", "bbox": {"l": 327.83005, "t": 331.57268999999997, "r": 351.16092, "b": 333.31171, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 327.83005, "t": 333.18292, "r": 348.30536, "b": 334.92194, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "MODELS AY11230/11234", "bbox": {"l": 327.83005, "t": 333.18292, "r": 348.30536, "b": 334.92194, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 327.83005, "t": 336.40439, "r": 329.05914, "b": 337.92606, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "1.", "bbox": {"l": 327.83005, "t": 336.40439, "r": 329.05914, "b": 337.92606, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 329.67368, "t": 336.40439, "r": 349.95349, "b": 337.92606, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "The vertical tube can be used for", "bbox": {"l": 329.67368, "t": 336.40439, "r": 349.95349, "b": 337.92606, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 329.11752, "t": 337.83588, "r": 353.57977, "b": 339.35751000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "instructional viewing or to photograph", "bbox": {"l": 329.11752, "t": 337.83588, "r": 353.57977, "b": 339.35751000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 327.77121, "t": 339.26736, "r": 352.4306, "b": 340.789, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": " the image with a digital camera or a", "bbox": {"l": 327.77121, "t": 339.26736, "r": 352.4306, "b": 340.789, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 328.15176, "t": 340.69882, "r": 337.91086, "b": 342.22049, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": " micro TV unit", "bbox": {"l": 328.15176, "t": 340.69882, "r": 337.91086, "b": 342.22049, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 327.8313, "t": 342.19043000000005, "r": 329.09155, "b": 343.71207, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "2.", "bbox": {"l": 327.8313, "t": 342.19043000000005, "r": 329.09155, "b": 343.71207, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 329.72168, "t": 342.19043000000005, "r": 354.9267, "b": 343.71207, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "Loosen the retention screw, then rotate ", "bbox": {"l": 329.72168, "t": 342.19043000000005, "r": 354.9267, "b": 343.71207, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 327.8313, "t": 343.62192, "r": 351.66949, "b": 345.14355, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": " the adjustment ring to change the ", "bbox": {"l": 327.8313, "t": 343.62192, "r": 351.66949, "b": 345.14355, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 328.21185, "t": 345.05338, "r": 346.33179, "b": 346.57504, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": " length of the vertical tube.", "bbox": {"l": 328.21185, "t": 345.05338, "r": 346.33179, "b": 346.57504, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 327.83005, "t": 346.84680000000003, "r": 329.12726, "b": 348.36847, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "3.", "bbox": {"l": 327.83005, "t": 346.84680000000003, "r": 329.12726, "b": 348.36847, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 329.77588, "t": 346.84680000000003, "r": 351.18005, "b": 348.36847, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "Make sure that both the images in", "bbox": {"l": 329.77588, "t": 346.84680000000003, "r": 351.18005, "b": 348.36847, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 327.25311, "t": 254.94812000000002, "r": 350.07861, "b": 258.86096, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "OPERATION ", "bbox": {"l": 327.25311, "t": 254.94812000000002, "r": 350.07861, "b": 258.86096, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 350.07861, "t": 254.76782000000003, "r": 351.82651, "b": 258.68066, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "(", "bbox": {"l": 350.07861, "t": 254.76782000000003, "r": 351.82651, "b": 258.68066, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 351.82651, "t": 254.94812000000002, "r": 360.85242, "b": 258.86096, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "cont.", "bbox": {"l": 351.82651, "t": 254.94812000000002, "r": 360.85242, "b": 258.86096, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 360.85242, "t": 254.76782000000003, "r": 362.60028, "b": 258.68066, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": ")", "bbox": {"l": 360.85242, "t": 254.76782000000003, "r": 362.60028, "b": 258.68066, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 326.88037, "t": 263.49492999999995, "r": 345.84351, "b": 265.23395000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "SELECTING OBJECTIVE ", "bbox": {"l": 326.88037, "t": 263.49492999999995, "r": 345.84351, "b": 265.23395000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 326.88037, "t": 265.10515999999996, "r": 340.54153, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "MAGNIFICATION", "bbox": {"l": 326.88037, "t": 265.10515999999996, "r": 340.54153, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 326.88037, "t": 266.71533, "r": 328.31903, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "1.", "bbox": {"l": 326.88037, "t": 266.71533, "r": 328.31903, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 329.03836, "t": 266.71533, "r": 354.21472, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "There are two objectives. The lower", "bbox": {"l": 329.03836, "t": 266.71533, "r": 354.21472, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 326.88037, "t": 268.32556, "r": 355.19193, "b": 270.06458, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": " magnification objective has a greater", "bbox": {"l": 326.88037, "t": 268.32556, "r": 355.19193, "b": 270.06458, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 326.88037, "t": 269.93579, "r": 345.80057, "b": 271.6748, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": " depth of field and view.", "bbox": {"l": 326.88037, "t": 269.93579, "r": 345.80057, "b": 271.6748, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 326.88037, "t": 271.54602, "r": 328.33862, "b": 273.28503, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "2.", "bbox": {"l": 326.88037, "t": 271.54602, "r": 328.33862, "b": 273.28503, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 329.06775, "t": 271.54602, "r": 352.39969, "b": 273.28503, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "In order to observe the specimen", "bbox": {"l": 329.06775, "t": 271.54602, "r": 352.39969, "b": 273.28503, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 326.88037, "t": 273.15619000000004, "r": 352.90042, "b": 274.89526, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": " easily use the lower magnification", "bbox": {"l": 326.88037, "t": 273.15619000000004, "r": 352.90042, "b": 274.89526, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 326.88037, "t": 274.76642000000004, "r": 354.59546, "b": 276.50543000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": " objective first. Then, by rotating the", "bbox": {"l": 326.88037, "t": 274.76642000000004, "r": 354.59546, "b": 276.50543000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 326.88037, "t": 276.37665000000004, "r": 350.81885, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": " case, the magnification can be", "bbox": {"l": 326.88037, "t": 276.37665000000004, "r": 350.81885, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 326.88037, "t": 277.98688000000004, "r": 335.46707, "b": 279.72589000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": " changed.", "bbox": {"l": 326.88037, "t": 277.98688000000004, "r": 335.46707, "b": 279.72589000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 326.88037, "t": 281.20728, "r": 354.57755, "b": 282.94632, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 107, "text": "CHANGING THE INTERPUPILLARY ", "bbox": {"l": 326.88037, "t": 281.20728, "r": 354.57755, "b": 282.94632, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 326.88037, "t": 282.81750000000005, "r": 335.1752, "b": 284.55652, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 108, "text": "DISTANCE", "bbox": {"l": 326.88037, "t": 282.81750000000005, "r": 335.1752, "b": 284.55652, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 326.88037, "t": 284.4277, "r": 328.34784, "b": 286.16675, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 109, "text": "1.", "bbox": {"l": 326.88037, "t": 284.4277, "r": 328.34784, "b": 286.16675, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 329.08157, "t": 284.4277, "r": 354.76245, "b": 286.16675, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 110, "text": "The distance between the observer's", "bbox": {"l": 329.08157, "t": 284.4277, "r": 354.76245, "b": 286.16675, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 326.88037, "t": 286.03793, "r": 354.6499, "b": 287.77695, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 111, "text": " pupils is the interpupillary distance.", "bbox": {"l": 326.88037, "t": 286.03793, "r": 354.6499, "b": 287.77695, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 326.88037, "t": 287.64813, "r": 328.25125, "b": 289.38718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 112, "text": "2.", "bbox": {"l": 326.88037, "t": 287.64813, "r": 328.25125, "b": 289.38718, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 328.93671, "t": 287.64813, "r": 354.29825, "b": 289.38718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 113, "text": "To adjust the interpupillary distance", "bbox": {"l": 328.93671, "t": 287.64813, "r": 354.29825, "b": 289.38718, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 326.88181, "t": 289.25836, "r": 355.02075, "b": 290.99738, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 114, "text": " rotate the prism caps until both eyes", "bbox": {"l": 326.88181, "t": 289.25836, "r": 355.02075, "b": 290.99738, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 326.88181, "t": 290.86855999999995, "r": 350.82028, "b": 292.6076, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 115, "text": " coincide with the image in the", "bbox": {"l": 326.88181, "t": 290.86855999999995, "r": 350.82028, "b": 292.6076, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 326.88181, "t": 292.47879, "r": 336.2067, "b": 294.2178, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 116, "text": " eyepiece. ", "bbox": {"l": 326.88181, "t": 292.47879, "r": 336.2067, "b": 294.2178, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 326.88181, "t": 295.69922, "r": 335.3941, "b": 297.43823, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 117, "text": "FOCUSING", "bbox": {"l": 326.88181, "t": 295.69922, "r": 335.3941, "b": 297.43823, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 326.88181, "t": 297.30942, "r": 328.34314, "b": 299.04846, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 118, "text": "1.", "bbox": {"l": 326.88181, "t": 297.30942, "r": 328.34314, "b": 299.04846, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 329.07379, "t": 297.30942, "r": 353.18555, "b": 299.04846, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 119, "text": "Remove the lens protective cover.", "bbox": {"l": 329.07379, "t": 297.30942, "r": 353.18555, "b": 299.04846, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 326.88324, "t": 298.91965, "r": 328.35919, "b": 300.65866, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 120, "text": "2.", "bbox": {"l": 326.88324, "t": 298.91965, "r": 328.35919, "b": 300.65866, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 329.0972, "t": 298.91965, "r": 353.45065, "b": 300.65866, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 121, "text": "Place the specimen on the working", "bbox": {"l": 329.0972, "t": 298.91965, "r": 353.45065, "b": 300.65866, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 326.88324, "t": 300.52985, "r": 333.32825, "b": 302.26889000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 122, "text": " stage.", "bbox": {"l": 326.88324, "t": 300.52985, "r": 333.32825, "b": 302.26889000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 326.88324, "t": 302.14008000000007, "r": 328.31296, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 123, "text": "3.", "bbox": {"l": 326.88324, "t": 302.14008000000007, "r": 328.31296, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 329.02783, "t": 302.14008000000007, "r": 354.76303, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 124, "text": "Focus the specimen with the left eye", "bbox": {"l": 329.02783, "t": 302.14008000000007, "r": 354.76303, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 326.88324, "t": 303.75027, "r": 355.96307, "b": 305.48932, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 125, "text": " first while turning the focus knob until", "bbox": {"l": 326.88324, "t": 303.75027, "r": 355.96307, "b": 305.48932, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 326.88324, "t": 305.3605, "r": 354.46594, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 126, "text": " the image appears clear and sharp.", "bbox": {"l": 326.88324, "t": 305.3605, "r": 354.46594, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 326.88324, "t": 306.9707, "r": 328.25488, "b": 308.70975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 127, "text": "4.", "bbox": {"l": 326.88324, "t": 306.9707, "r": 328.25488, "b": 308.70975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 328.9407, "t": 306.9707, "r": 356.37335, "b": 308.70975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 128, "text": "Rotate the right eyepiece ring until the", "bbox": {"l": 328.9407, "t": 306.9707, "r": 356.37335, "b": 308.70975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 326.88324, "t": 308.58093, "r": 355.38867, "b": 310.31995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 129, "text": " images in each eyepiece coincide and", "bbox": {"l": 326.88324, "t": 308.58093, "r": 355.38867, "b": 310.31995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 326.88324, "t": 310.19113, "r": 343.17249, "b": 311.93018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 130, "text": " are sharp and clear.", "bbox": {"l": 326.88324, "t": 310.19113, "r": 343.17249, "b": 311.93018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 326.88324, "t": 313.41156, "r": 344.13388, "b": 315.15059999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 131, "text": "CHANGING THE BULB", "bbox": {"l": 326.88324, "t": 313.41156, "r": 344.13388, "b": 315.15059999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 326.88324, "t": 315.02178999999995, "r": 328.37418, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 132, "text": "1.", "bbox": {"l": 326.88324, "t": 315.02178999999995, "r": 328.37418, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 329.11963, "t": 315.02178999999995, "r": 348.50162, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 133, "text": "Disconnect the power cord.", "bbox": {"l": 329.11963, "t": 315.02178999999995, "r": 348.50162, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 326.88324, "t": 316.63199, "r": 328.34061, "b": 318.37103, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 134, "text": "2.", "bbox": {"l": 326.88324, "t": 316.63199, "r": 328.34061, "b": 318.37103, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 329.06931, "t": 316.63199, "r": 353.11588, "b": 318.37103, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 135, "text": "When the bulb is cool, remove the", "bbox": {"l": 329.06931, "t": 316.63199, "r": 353.11588, "b": 318.37103, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 326.88464, "t": 318.2422199999999, "r": 353.79517, "b": 319.9812299999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 136, "text": " oblique illuminator cap and remove", "bbox": {"l": 326.88464, "t": 318.2422199999999, "r": 353.79517, "b": 319.9812299999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 326.88464, "t": 319.85242000000005, "r": 348.02094, "b": 321.59146, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 137, "text": " the halogen bulb with cap.", "bbox": {"l": 326.88464, "t": 319.85242000000005, "r": 348.02094, "b": 321.59146, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 326.88464, "t": 321.46265, "r": 328.37512, "b": 323.20166, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 138, "text": "3.", "bbox": {"l": 326.88464, "t": 321.46265, "r": 328.37512, "b": 323.20166, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 329.12036, "t": 321.46265, "r": 352.96808, "b": 323.20166, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 139, "text": "Replace with a new halogen bulb.", "bbox": {"l": 329.12036, "t": 321.46265, "r": 352.96808, "b": 323.20166, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 326.88608, "t": 323.07285, "r": 328.36884, "b": 324.81189, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 140, "text": "4.", "bbox": {"l": 326.88608, "t": 323.07285, "r": 328.36884, "b": 324.81189, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 329.1102, "t": 323.07285, "r": 356.5412, "b": 324.81189, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 141, "text": "Open the window in the base plate and", "bbox": {"l": 329.1102, "t": 323.07285, "r": 356.5412, "b": 324.81189, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 326.88608, "t": 324.68307000000004, "r": 350.13828, "b": 326.42209, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 142, "text": " replace the halogen lamp or ", "bbox": {"l": 326.88608, "t": 324.68307000000004, "r": 350.13828, "b": 326.42209, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 326.88608, "t": 326.29327, "r": 351.59677, "b": 328.03232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 143, "text": " fluorescent lamp of transmitted", "bbox": {"l": 326.88608, "t": 326.29327, "r": 351.59677, "b": 328.03232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 326.88608, "t": 327.9035, "r": 336.89197, "b": 329.64252, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 144, "text": " illuminator.", "bbox": {"l": 326.88608, "t": 327.9035, "r": 336.89197, "b": 329.64252, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 358.42023, "t": 263.49492999999995, "r": 366.93256, "b": 265.23395000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 145, "text": "FOCUSING", "bbox": {"l": 358.42023, "t": 263.49492999999995, "r": 366.93256, "b": 265.23395000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 358.42023, "t": 265.10515999999996, "r": 359.89841, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 146, "text": "1.", "bbox": {"l": 358.42023, "t": 265.10515999999996, "r": 359.89841, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 360.63751, "t": 265.10515999999996, "r": 387.98407, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 147, "text": "Turn the focusing knob away or toward", "bbox": {"l": 360.63751, "t": 265.10515999999996, "r": 387.98407, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 358.42023, "t": 266.71533, "r": 384.58948, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 148, "text": " you until a clear image is viewed.", "bbox": {"l": 358.42023, "t": 266.71533, "r": 384.58948, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 358.42166, "t": 268.32556, "r": 359.78549, "b": 270.06458, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 149, "text": "2.", "bbox": {"l": 358.42166, "t": 268.32556, "r": 359.78549, "b": 270.06458, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 360.46741, "t": 268.32556, "r": 384.33441, "b": 270.06458, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 150, "text": "If the image is unclear, adjust the", "bbox": {"l": 360.46741, "t": 268.32556, "r": 384.33441, "b": 270.06458, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 358.4231, "t": 269.93579, "r": 384.61502, "b": 271.6748, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 151, "text": " height of the elevator up or down,", "bbox": {"l": 358.4231, "t": 269.93579, "r": 384.61502, "b": 271.6748, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 358.4231, "t": 271.54602, "r": 385.38922, "b": 273.28503, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 152, "text": " then turn the focusing knob again.", "bbox": {"l": 358.4231, "t": 271.54602, "r": 385.38922, "b": 273.28503, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 358.4231, "t": 274.76642000000004, "r": 377.35046, "b": 276.50543000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 153, "text": "ZOOM MAGNIFICATION", "bbox": {"l": 358.4231, "t": 274.76642000000004, "r": 377.35046, "b": 276.50543000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 358.4231, "t": 276.37665000000004, "r": 359.89429, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 154, "text": "1.", "bbox": {"l": 358.4231, "t": 276.37665000000004, "r": 359.89429, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 360.62988, "t": 276.37665000000004, "r": 386.37589, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 155, "text": "Turn the zoom magnification knob to", "bbox": {"l": 360.62988, "t": 276.37665000000004, "r": 386.37589, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 358.4231, "t": 277.98688000000004, "r": 386.78732, "b": 279.72589000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 156, "text": " the desired magnification and field of", "bbox": {"l": 358.4231, "t": 277.98688000000004, "r": 386.78732, "b": 279.72589000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 358.4231, "t": 279.59704999999997, "r": 364.16855, "b": 281.33609, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 157, "text": " view.", "bbox": {"l": 358.4231, "t": 279.59704999999997, "r": 364.16855, "b": 281.33609, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 358.4231, "t": 281.20728, "r": 359.86777, "b": 282.94632, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 158, "text": "2.", "bbox": {"l": 358.4231, "t": 281.20728, "r": 359.86777, "b": 282.94632, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 114, "label": "text", "bbox": {"l": 360.59012, "t": 281.20728, "r": 387.31656, "b": 282.94632, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 159, "text": "In most situations, it is recommended", "bbox": {"l": 360.59012, "t": 281.20728, "r": 387.31656, "b": 282.94632, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 115, "label": "text", "bbox": {"l": 358.4231, "t": 282.81750000000005, "r": 381.56656, "b": 284.55652, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 160, "text": " that you focus at the lowest ", "bbox": {"l": 358.4231, "t": 282.81750000000005, "r": 381.56656, "b": 284.55652, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 116, "label": "text", "bbox": {"l": 358.4231, "t": 284.4277, "r": 386.63403, "b": 286.16675, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 161, "text": " magnification, then move to a higher", "bbox": {"l": 358.4231, "t": 284.4277, "r": 386.63403, "b": 286.16675, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 117, "label": "text", "bbox": {"l": 358.42453, "t": 286.03793, "r": 382.77115, "b": 287.77695, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 162, "text": " magnification and re-focus as ", "bbox": {"l": 358.42453, "t": 286.03793, "r": 382.77115, "b": 287.77695, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 118, "label": "text", "bbox": {"l": 358.42453, "t": 287.64813, "r": 367.98694, "b": 289.38718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 163, "text": " necessary.", "bbox": {"l": 358.42453, "t": 287.64813, "r": 367.98694, "b": 289.38718, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 119, "label": "text", "bbox": {"l": 358.42453, "t": 289.25836, "r": 359.80386, "b": 290.99738, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 164, "text": "3.", "bbox": {"l": 358.42453, "t": 289.25836, "r": 359.80386, "b": 290.99738, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 120, "label": "text", "bbox": {"l": 360.49353, "t": 289.25836, "r": 386.70093, "b": 290.99738, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 165, "text": "If the image is not clear to both eyes", "bbox": {"l": 360.49353, "t": 289.25836, "r": 386.70093, "b": 290.99738, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 121, "label": "text", "bbox": {"l": 358.42453, "t": 290.86855999999995, "r": 388.03534, "b": 292.6076, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 166, "text": " at the same time, the diopter ring may", "bbox": {"l": 358.42453, "t": 290.86855999999995, "r": 388.03534, "b": 292.6076, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 122, "label": "text", "bbox": {"l": 358.42453, "t": 292.47879, "r": 373.13724, "b": 294.2178, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 167, "text": " need adjustment.", "bbox": {"l": 358.42453, "t": 292.47879, "r": 373.13724, "b": 294.2178, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 123, "label": "text", "bbox": {"l": 358.42453, "t": 295.69922, "r": 381.74539, "b": 297.43823, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 168, "text": "DIOPTER RING ADJUSTMENT", "bbox": {"l": 358.42453, "t": 295.69922, "r": 381.74539, "b": 297.43823, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 124, "label": "text", "bbox": {"l": 358.42453, "t": 297.30942, "r": 359.83682, "b": 299.04846, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 169, "text": "1.", "bbox": {"l": 358.42453, "t": 297.30942, "r": 359.83682, "b": 299.04846, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 125, "label": "text", "bbox": {"l": 360.54297, "t": 297.30942, "r": 388.08289, "b": 299.04846, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 170, "text": "To adjust the eyepiece for viewing with", "bbox": {"l": 360.54297, "t": 297.30942, "r": 388.08289, "b": 299.04846, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 126, "label": "text", "bbox": {"l": 358.42453, "t": 298.91965, "r": 382.73251, "b": 300.65866, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 171, "text": " or without eyeglasses and for ", "bbox": {"l": 358.42453, "t": 298.91965, "r": 382.73251, "b": 300.65866, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 127, "label": "text", "bbox": {"l": 358.42453, "t": 300.52985, "r": 387.72266, "b": 302.26889000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 172, "text": " differences in acuity between the right", "bbox": {"l": 358.42453, "t": 300.52985, "r": 387.72266, "b": 302.26889000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 128, "label": "text", "bbox": {"l": 358.42453, "t": 302.14008000000007, "r": 384.1991, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 173, "text": " and left eyes, follow the following", "bbox": {"l": 358.42453, "t": 302.14008000000007, "r": 384.1991, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 129, "label": "text", "bbox": {"l": 358.42453, "t": 303.75027, "r": 364.88672, "b": 305.48932, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 174, "text": " steps:", "bbox": {"l": 358.42453, "t": 303.75027, "r": 364.88672, "b": 305.48932, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 130, "label": "text", "bbox": {"l": 358.42453, "t": 305.3605, "r": 359.95078, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 175, "text": "a.", "bbox": {"l": 358.42453, "t": 305.3605, "r": 359.95078, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 131, "label": "text", "bbox": {"l": 361.47699, "t": 305.3605, "r": 386.65988, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 176, "text": "Observe an image through the left", "bbox": {"l": 361.47699, "t": 305.3605, "r": 386.65988, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 132, "label": "text", "bbox": {"l": 358.42453, "t": 306.9707, "r": 386.7634, "b": 308.70975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 177, "text": " eyepiece and bring a specific point", "bbox": {"l": 358.42453, "t": 306.9707, "r": 386.7634, "b": 308.70975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 133, "label": "text", "bbox": {"l": 358.42453, "t": 308.58093, "r": 385.41354, "b": 310.31995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 178, "text": " into focus using the focus knob.", "bbox": {"l": 358.42453, "t": 308.58093, "r": 385.41354, "b": 310.31995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 134, "label": "text", "bbox": {"l": 358.42453, "t": 310.19113, "r": 359.93304, "b": 311.93018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 179, "text": "b.", "bbox": {"l": 358.42453, "t": 310.19113, "r": 359.93304, "b": 311.93018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 135, "label": "text", "bbox": {"l": 361.44156, "t": 310.19113, "r": 382.56085, "b": 311.93018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 180, "text": "By turning the diopter ring ", "bbox": {"l": 361.44156, "t": 310.19113, "r": 382.56085, "b": 311.93018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 136, "label": "text", "bbox": {"l": 358.42596, "t": 311.80136, "r": 385.4559, "b": 313.54037, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 181, "text": " adjustment for the left eyepiece,", "bbox": {"l": 358.42596, "t": 311.80136, "r": 385.4559, "b": 313.54037, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 137, "label": "text", "bbox": {"l": 358.42596, "t": 313.41156, "r": 384.56122, "b": 315.15059999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 182, "text": " bring the same point into sharp", "bbox": {"l": 358.42596, "t": 313.41156, "r": 384.56122, "b": 315.15059999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 138, "label": "text", "bbox": {"l": 358.42596, "t": 315.02178999999995, "r": 366.74371, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 183, "text": " focus.", "bbox": {"l": 358.42596, "t": 315.02178999999995, "r": 366.74371, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 139, "label": "text", "bbox": {"l": 358.42596, "t": 316.63199, "r": 383.93884, "b": 318.37103, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 184, "text": " c.Then bring the same point into", "bbox": {"l": 358.42596, "t": 316.63199, "r": 383.93884, "b": 318.37103, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 140, "label": "text", "bbox": {"l": 358.42596, "t": 318.2422199999999, "r": 385.69241, "b": 319.9812299999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 185, "text": " focus through the right eyepiece", "bbox": {"l": 358.42596, "t": 318.2422199999999, "r": 385.69241, "b": 319.9812299999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 141, "label": "text", "bbox": {"l": 358.42596, "t": 319.85242000000005, "r": 385.94861, "b": 321.59146, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 186, "text": " by turning the right diopter ring.", "bbox": {"l": 358.42596, "t": 319.85242000000005, "r": 385.94861, "b": 321.59146, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 142, "label": "text", "bbox": {"l": 358.42596, "t": 321.46265, "r": 385.54236, "b": 323.20166, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 187, "text": " d.With more than one viewer, each", "bbox": {"l": 358.42596, "t": 321.46265, "r": 385.54236, "b": 323.20166, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 143, "label": "text", "bbox": {"l": 358.42596, "t": 323.07285, "r": 382.98718, "b": 324.81189, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 188, "text": " viewer should note their own", "bbox": {"l": 358.42596, "t": 323.07285, "r": 382.98718, "b": 324.81189, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 144, "label": "text", "bbox": {"l": 358.42596, "t": 324.68307000000004, "r": 385.06448, "b": 326.42209, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 189, "text": " diopter ring position for the left", "bbox": {"l": 358.42596, "t": 324.68307000000004, "r": 385.06448, "b": 326.42209, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 145, "label": "text", "bbox": {"l": 358.42596, "t": 326.29327, "r": 385.20682, "b": 328.03232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 190, "text": " and right eyepieces, then before", "bbox": {"l": 358.42596, "t": 326.29327, "r": 385.20682, "b": 328.03232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 146, "label": "text", "bbox": {"l": 358.42596, "t": 327.9035, "r": 382.21964, "b": 329.64252, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 191, "text": " viewing set the diopter ring", "bbox": {"l": 358.42596, "t": 327.9035, "r": 382.21964, "b": 329.64252, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 147, "label": "text", "bbox": {"l": 358.42596, "t": 329.5137, "r": 382.63382, "b": 331.25275, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 192, "text": " adjustments to that setting.", "bbox": {"l": 358.42596, "t": 329.5137, "r": 382.63382, "b": 331.25275, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 148, "label": "text", "bbox": {"l": 358.42596, "t": 332.73412999999994, "r": 375.67661, "b": 334.47317999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 193, "text": "CHANGING THE BULB", "bbox": {"l": 358.42596, "t": 332.73412999999994, "r": 375.67661, "b": 334.47317999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 149, "label": "text", "bbox": {"l": 358.42596, "t": 334.34436, "r": 359.90311, "b": 336.08337, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 194, "text": "1.", "bbox": {"l": 358.42596, "t": 334.34436, "r": 359.90311, "b": 336.08337, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 150, "label": "text", "bbox": {"l": 360.64169, "t": 334.34436, "r": 385.75333, "b": 336.08337, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 195, "text": "Disconnect the power cord from the", "bbox": {"l": 360.64169, "t": 334.34436, "r": 385.75333, "b": 336.08337, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 151, "label": "text", "bbox": {"l": 358.42596, "t": 335.95456, "r": 372.01416, "b": 337.6936, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 196, "text": " electrical outlet.", "bbox": {"l": 358.42596, "t": 335.95456, "r": 372.01416, "b": 337.6936, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 152, "label": "text", "bbox": {"l": 358.42596, "t": 337.56479, "r": 359.88327, "b": 339.3038, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 197, "text": "2.", "bbox": {"l": 358.42596, "t": 337.56479, "r": 359.88327, "b": 339.3038, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 153, "label": "text", "bbox": {"l": 360.61191, "t": 337.56479, "r": 384.65726, "b": 339.3038, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 198, "text": "When the bulb is cool, remove the", "bbox": {"l": 360.61191, "t": 337.56479, "r": 384.65726, "b": 339.3038, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 154, "label": "text", "bbox": {"l": 358.42596, "t": 339.17499, "r": 385.33649, "b": 340.9140300000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 199, "text": " oblique illuminator cap and remove", "bbox": {"l": 358.42596, "t": 339.17499, "r": 385.33649, "b": 340.9140300000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 155, "label": "text", "bbox": {"l": 358.42596, "t": 340.78522, "r": 379.57224, "b": 342.52423, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 200, "text": " the halogen bulb with cap.", "bbox": {"l": 358.42596, "t": 340.78522, "r": 379.57224, "b": 342.52423, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 156, "label": "text", "bbox": {"l": 358.4274, "t": 342.39542, "r": 359.91788, "b": 344.13446000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 201, "text": "3.", "bbox": {"l": 358.4274, "t": 342.39542, "r": 359.91788, "b": 344.13446000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 157, "label": "text", "bbox": {"l": 360.66312, "t": 342.39542, "r": 384.5108, "b": 344.13446000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 202, "text": "Replace with a new halogen bulb.", "bbox": {"l": 360.66312, "t": 342.39542, "r": 384.5108, "b": 344.13446000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 158, "label": "text", "bbox": {"l": 358.42883, "t": 344.00565000000006, "r": 359.92792, "b": 345.74466, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 203, "text": "4.", "bbox": {"l": 358.42883, "t": 344.00565000000006, "r": 359.92792, "b": 345.74466, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 159, "label": "text", "bbox": {"l": 360.67746, "t": 344.00565000000006, "r": 385.41235, "b": 345.74466, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 204, "text": "Open the window in the base plate", "bbox": {"l": 360.67746, "t": 344.00565000000006, "r": 385.41235, "b": 345.74466, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 160, "label": "text", "bbox": {"l": 358.42883, "t": 345.61584, "r": 383.2782, "b": 347.35489, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 205, "text": " and replace the halogen lamp or", "bbox": {"l": 358.42883, "t": 345.61584, "r": 383.2782, "b": 347.35489, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 161, "label": "text", "bbox": {"l": 358.42883, "t": 347.22607, "r": 383.13953, "b": 348.96509, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 206, "text": " fluorescent lamp of transmitted", "bbox": {"l": 358.42883, "t": 347.22607, "r": 383.13953, "b": 348.96509, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 162, "label": "text", "bbox": {"l": 358.42883, "t": 348.83627, "r": 368.43472, "b": 350.57532, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 207, "text": " illuminator.", "bbox": {"l": 358.42883, "t": 348.83627, "r": 368.43472, "b": 350.57532, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 163, "label": "text", "bbox": {"l": 326.59567, "t": 261.14185, "r": 339.11377, "b": 262.88091999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 208, "text": "Model AY11230", "bbox": {"l": 326.59567, "t": 261.14185, "r": 339.11377, "b": 262.88091999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 164, "label": "text", "bbox": {"l": 358.48605, "t": 261.14185, "r": 371.00415, "b": 262.88091999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 209, "text": "Model AY11234", "bbox": {"l": 358.48605, "t": 261.14185, "r": 371.00415, "b": 262.88091999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 165, "label": "text", "bbox": {"l": 455.43533, "t": 351.77038999999996, "r": 457.97827000000007, "b": 353.94415, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 210, "text": "14", "bbox": {"l": 455.43533, "t": 351.77038999999996, "r": 457.97827000000007, "b": 353.94415, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 166, "label": "text", "bbox": {"l": 408.24518, "t": 275.52673000000004, "r": 414.4234, "b": 276.96020999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 211, "text": "Objectives", "bbox": {"l": 408.24518, "t": 275.52673000000004, "r": 414.4234, "b": 276.96020999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 167, "label": "text", "bbox": {"l": 409.39554, "t": 268.98235999999997, "r": 419.06677, "b": 270.41583, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 212, "text": "Revolving Turret", "bbox": {"l": 409.39554, "t": 268.98235999999997, "r": 419.06677, "b": 270.41583, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 168, "label": "text", "bbox": {"l": 441.3895, "t": 279.12627999999995, "r": 445.87192, "b": 280.55975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 213, "text": "Coarse ", "bbox": {"l": 441.3895, "t": 279.12627999999995, "r": 445.87192, "b": 280.55975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 169, "label": "text", "bbox": {"l": 441.3895, "t": 280.30609, "r": 448.22338999999994, "b": 281.7395900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 214, "text": "Adjustment", "bbox": {"l": 441.3895, "t": 280.30609, "r": 448.22338999999994, "b": 281.7395900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 170, "label": "text", "bbox": {"l": 441.3895, "t": 281.48593, "r": 444.40371999999996, "b": 282.91939999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 215, "text": "Knob", "bbox": {"l": 441.3895, "t": 281.48593, "r": 444.40371999999996, "b": 282.91939999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 171, "label": "text", "bbox": {"l": 398.79288, "t": 254.94646999999998, "r": 428.91568, "b": 258.85931000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 216, "text": "MODEL AY11236", "bbox": {"l": 398.79288, "t": 254.94646999999998, "r": 428.91568, "b": 258.85931000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 172, "label": "text", "bbox": {"l": 398.32535, "t": 305.04291, "r": 435.93542, "b": 308.95572000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 217, "text": "MICROSCOPE USAGE", "bbox": {"l": 398.32535, "t": 305.04291, "r": 435.93542, "b": 308.95572000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 173, "label": "text", "bbox": {"l": 398.08594, "t": 310.35892, "r": 453.72171, "b": 312.53271, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 218, "text": "BARSKA Model AY11236 is a powerful fixed power compound ", "bbox": {"l": 398.08594, "t": 310.35892, "r": 453.72171, "b": 312.53271, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 174, "label": "text", "bbox": {"l": 398.08594, "t": 312.50586, "r": 453.09939999999995, "b": 314.67966, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 219, "text": "microscope designed for biological studies such as specimen ", "bbox": {"l": 398.08594, "t": 312.50586, "r": 453.09939999999995, "b": 314.67966, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 175, "label": "text", "bbox": {"l": 398.08594, "t": 314.6528, "r": 456.65246999999994, "b": 316.8266, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 220, "text": "examination. It can also be used for examining bacteria and", "bbox": {"l": 398.08594, "t": 314.6528, "r": 456.65246999999994, "b": 316.8266, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 176, "label": "text", "bbox": {"l": 398.08594, "t": 316.79977, "r": 456.73859000000004, "b": 318.97354, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 221, "text": "for general clinical and medical studies and other scientific uses. ", "bbox": {"l": 398.08594, "t": 316.79977, "r": 456.73859000000004, "b": 318.97354, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 177, "label": "text", "bbox": {"l": 398.62399, "t": 320.42941, "r": 427.77472, "b": 324.34222000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 222, "text": "CONSTRUCTION", "bbox": {"l": 398.62399, "t": 320.42941, "r": 427.77472, "b": 324.34222000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 178, "label": "text", "bbox": {"l": 398.08594, "t": 326.46069000000006, "r": 456.02639999999997, "b": 328.63449, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 223, "text": "BARSKA Model AY11236 is a fixed power compound microscope.", "bbox": {"l": 398.08594, "t": 326.46069000000006, "r": 456.02639999999997, "b": 328.63449, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 179, "label": "text", "bbox": {"l": 398.08414, "t": 328.6076699999999, "r": 455.42238999999995, "b": 330.7814599999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 224, "text": "It is constructed with two optical paths at the same angle. It is ", "bbox": {"l": 398.08414, "t": 328.6076699999999, "r": 455.42238999999995, "b": 330.7814599999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 180, "label": "text", "bbox": {"l": 398.08414, "t": 330.75461, "r": 457.39844, "b": 332.92841, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 225, "text": "equipped with transmitted illumination. By using this instrument, ", "bbox": {"l": 398.08414, "t": 330.75461, "r": 457.39844, "b": 332.92841, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 181, "label": "text", "bbox": {"l": 398.08414, "t": 332.90155, "r": 453.97745, "b": 335.07535000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 226, "text": "the user can observe specimens at magnification from 40x to ", "bbox": {"l": 398.08414, "t": 332.90155, "r": 453.97745, "b": 335.07535000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 182, "label": "text", "bbox": {"l": 398.08414, "t": 335.04852, "r": 454.70708999999994, "b": 337.22232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 227, "text": "1000x by selecting the desired objective lens. Coarse and fine ", "bbox": {"l": 398.08414, "t": 335.04852, "r": 454.70708999999994, "b": 337.22232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 183, "label": "text", "bbox": {"l": 398.08414, "t": 337.19547, "r": 458.90240000000006, "b": 339.36926, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 228, "text": "focus adjustments provide accuracy and image detail. The rotating ", "bbox": {"l": 398.08414, "t": 337.19547, "r": 458.90240000000006, "b": 339.36926, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 184, "label": "text", "bbox": {"l": 398.08594, "t": 339.34241, "r": 453.0672, "b": 341.5162, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 229, "text": "head allows the user to position the eyepieces for maximum ", "bbox": {"l": 398.08594, "t": 339.34241, "r": 453.0672, "b": 341.5162, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 185, "label": "text", "bbox": {"l": 398.08594, "t": 341.48938, "r": 449.63113, "b": 343.66318, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 230, "text": "viewing comfort and easy access to all adjustment knobs.", "bbox": {"l": 398.08594, "t": 341.48938, "r": 449.63113, "b": 343.66318, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 186, "label": "text", "bbox": {"l": 422.10626, "t": 301.24191, "r": 434.62433000000004, "b": 302.98096, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 231, "text": "Model AY11236", "bbox": {"l": 422.10626, "t": 301.24191, "r": 434.62433000000004, "b": 302.98096, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 187, "label": "text", "bbox": {"l": 442.01610999999997, "t": 283.08649, "r": 444.8817399999999, "b": 284.51996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 232, "text": "Fine ", "bbox": {"l": 442.01610999999997, "t": 283.08649, "r": 444.8817399999999, "b": 284.51996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 188, "label": "text", "bbox": {"l": 442.01610999999997, "t": 284.2663, "r": 448.85001, "b": 285.69980000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 233, "text": "Adjustment", "bbox": {"l": 442.01610999999997, "t": 284.2663, "r": 448.85001, "b": 285.69980000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 189, "label": "text", "bbox": {"l": 442.01610999999997, "t": 285.44611, "r": 445.03033000000005, "b": 286.87961, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 234, "text": "Knob", "bbox": {"l": 442.01610999999997, "t": 285.44611, "r": 445.03033000000005, "b": 286.87961, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 190, "label": "text", "bbox": {"l": 408.00577, "t": 279.12579000000005, "r": 411.42212, "b": 280.5593, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 235, "text": "Stage", "bbox": {"l": 408.00577, "t": 279.12579000000005, "r": 411.42212, "b": 280.5593, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 191, "label": "text", "bbox": {"l": 404.07172, "t": 280.9144299999999, "r": 410.77707, "b": 282.3479, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 236, "text": "Condenser ", "bbox": {"l": 404.07172, "t": 280.9144299999999, "r": 410.77707, "b": 282.3479, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 192, "label": "text", "bbox": {"l": 404.07172, "t": 282.09424, "r": 409.2157, "b": 283.52774, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 237, "text": "Focusing", "bbox": {"l": 404.07172, "t": 282.09424, "r": 409.2157, "b": 283.52774, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 193, "label": "text", "bbox": {"l": 404.07172, "t": 283.27408, "r": 407.08594, "b": 284.7075500000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 238, "text": "Knob", "bbox": {"l": 404.07172, "t": 283.27408, "r": 407.08594, "b": 284.7075500000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 194, "label": "text", "bbox": {"l": 441.81281, "t": 262.32178, "r": 447.03702, "b": 263.75525000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 239, "text": "Eyepiece", "bbox": {"l": 441.81281, "t": 262.32178, "r": 447.03702, "b": 263.75525000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 195, "label": "text", "bbox": {"l": 437.34607, "t": 271.13025000000005, "r": 440.80496, "b": 272.56281, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 240, "text": "Stand", "bbox": {"l": 437.34607, "t": 271.13025000000005, "r": 440.80496, "b": 272.56281, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 196, "label": "text", "bbox": {"l": 409.7164, "t": 284.40027, "r": 413.3768, "b": 285.83282, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 241, "text": "Lamp ", "bbox": {"l": 409.7164, "t": 284.40027, "r": 413.3768, "b": 285.83282, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 197, "label": "text", "bbox": {"l": 409.7164, "t": 285.83163, "r": 413.68201, "b": 287.26416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 242, "text": "On/Off", "bbox": {"l": 409.7164, "t": 285.83163, "r": 413.68201, "b": 287.26416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 198, "label": "text", "bbox": {"l": 409.7164, "t": 287.263, "r": 413.6337, "b": 288.69553, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 243, "text": "Switch", "bbox": {"l": 409.7164, "t": 287.263, "r": 413.6337, "b": 288.69553, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 199, "label": "text", "bbox": {"l": 434.8712499999999, "t": 296.7153, "r": 438.53164999999996, "b": 298.14783, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 244, "text": "Lamp ", "bbox": {"l": 434.8712499999999, "t": 296.7153, "r": 438.53164999999996, "b": 298.14783, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 200, "label": "text", "bbox": {"l": 439.52039, "t": 292.18307000000004, "r": 443.08768, "b": 293.61560000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 245, "text": "Power", "bbox": {"l": 439.52039, "t": 292.18307000000004, "r": 443.08768, "b": 293.61560000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 201, "label": "text", "bbox": {"l": 439.52039, "t": 293.61444, "r": 442.29575, "b": 295.04697, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 246, "text": "Cord", "bbox": {"l": 439.52039, "t": 293.61444, "r": 442.29575, "b": 295.04697, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 202, "label": "text", "bbox": {"l": 413.55829, "t": 264.66089, "r": 421.94913, "b": 266.09344, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 247, "text": "Rotating Head", "bbox": {"l": 413.55829, "t": 264.66089, "r": 421.94913, "b": 266.09344, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 203, "label": "text", "bbox": {"l": 441.84316999999993, "t": 286.90573, "r": 447.87585000000007, "b": 288.33826, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 248, "text": "Stage Clip", "bbox": {"l": 441.84316999999993, "t": 286.90573, "r": 447.87585000000007, "b": 288.33826, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 204, "label": "text", "bbox": {"l": 441.84316999999993, "t": 288.3371, "r": 448.67252, "b": 289.76962000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 249, "text": "Adjustment", "bbox": {"l": 441.84316999999993, "t": 288.3371, "r": 448.67252, "b": 289.76962000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 205, "label": "text", "bbox": {"l": 407.2403, "t": 259.86645999999996, "r": 425.79089, "b": 261.29895, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 250, "text": "Interpupillary Slide Adjustment", "bbox": {"l": 407.2403, "t": 259.86645999999996, "r": 425.79089, "b": 261.29895, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 206, "label": "text", "bbox": {"l": 449.10074000000003, "t": 378.66302, "r": 466.08835000000005, "b": 380.78412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 251, "text": "Circling Minimums", "bbox": {"l": 449.10074000000003, "t": 378.66302, "r": 466.08835000000005, "b": 380.78412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 207, "label": "text", "bbox": {"l": 449.10074000000003, "t": 383.2203999999999, "r": 449.64444, "b": 385.34148999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 252, "text": "7", "bbox": {"l": 449.10074000000003, "t": 383.2203999999999, "r": 449.64444, "b": 385.34148999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 208, "label": "text", "bbox": {"l": 450.18811, "t": 383.2203999999999, "r": 550.77124, "b": 385.34148999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 253, "text": "K H U H Z D V D F K D Q J H W R W K H 7 ( 5 3 6 F U L W H U L D L Q W K D W D \u1087H F W V F L U F O L Q J D U H D G L P H Q V L R Q E \\ H [ S D Q G L Q J W K H D U H D V W R S U R Y L G H ", "bbox": {"l": 450.18811, "t": 383.2203999999999, "r": 550.77124, "b": 385.34148999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 209, "label": "text", "bbox": {"l": 449.10074000000003, "t": 385.75732, "r": 536.14716, "b": 387.87842, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 254, "text": "improved obstacle protection. To indicate that the new criteria had been applied to a given procedure, a ", "bbox": {"l": 449.10074000000003, "t": 385.75732, "r": 536.14716, "b": 387.87842, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 210, "label": "text", "bbox": {"l": 538.31085, "t": 385.75732, "r": 549.49921, "b": 387.87842, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 255, "text": " is placed on ", "bbox": {"l": 538.31085, "t": 385.75732, "r": 549.49921, "b": 387.87842, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 211, "label": "text", "bbox": {"l": 449.10074000000003, "t": 388.03601, "r": 547.58185, "b": 390.1571, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 256, "text": "the circling line of minimums. The new circling tables and explanatory information is located in the Legend of the TPP.", "bbox": {"l": 449.10074000000003, "t": 388.03601, "r": 547.58185, "b": 390.1571, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 212, "label": "text", "bbox": {"l": 449.10074000000003, "t": 393.2128000000001, "r": 449.6163, "b": 395.33386, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 257, "text": "7", "bbox": {"l": 449.10074000000003, "t": 393.2128000000001, "r": 449.6163, "b": 395.33386, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 213, "label": "text", "bbox": {"l": 450.1319, "t": 393.2128000000001, "r": 529.53082, "b": 395.33386, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 258, "text": "K H D S S U R D F K H V X V L Q J V W D Q G D U G F L U F O L Q J D S S U R D F K D U H D V F D Q E H L G H Q W L \u00bf H G E \\ W K H D E V H Q F H R I W K H ", "bbox": {"l": 450.1319, "t": 393.2128000000001, "r": 529.53082, "b": 395.33386, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 214, "label": "text", "bbox": {"l": 532.05829, "t": 393.2128000000001, "r": 550.42261, "b": 395.33386, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 259, "text": " on the circling line of ", "bbox": {"l": 532.05829, "t": 393.2128000000001, "r": 550.42261, "b": 395.33386, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 215, "label": "text", "bbox": {"l": 449.10074000000003, "t": 395.49149, "r": 455.74692, "b": 397.61255, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 260, "text": "minima.", "bbox": {"l": 449.10074000000003, "t": 395.49149, "r": 455.74692, "b": 397.61255, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 216, "label": "text", "bbox": {"l": 449.95525999999995, "t": 415.59549, "r": 496.2829, "b": 417.50446, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 261, "text": "$ S S O \\ 6 W D Q G D U G & L U F O L Q J $ S S U R D F K 0 D Q H X Y H U L Q J 5 D G L X V 7 D E O H ", "bbox": {"l": 449.95525999999995, "t": 415.59549, "r": 496.2829, "b": 417.50446, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 217, "label": "text", "bbox": {"l": 501.13077, "t": 409.25543, "r": 551.16101, "b": 411.1644, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 262, "text": "$ S S O \\ ( [ S D Q G H G & L U F O L Q J $ S S U R D F K 0 D Q H X Y H U L Q J $ L U V S D F H 5 D G L X V ", "bbox": {"l": 501.13077, "t": 409.25543, "r": 551.16101, "b": 411.1644, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 218, "label": "text", "bbox": {"l": 501.13077, "t": 411.30624, "r": 505.2477999999999, "b": 413.21521, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 263, "text": "Table", "bbox": {"l": 501.13077, "t": 411.30624, "r": 505.2477999999999, "b": 413.21521, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 219, "label": "text", "bbox": {"l": 449.10074000000003, "t": 420.18802, "r": 469.35599, "b": 422.73331, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 264, "text": "AIRPORT SKETCH", "bbox": {"l": 449.10074000000003, "t": 420.18802, "r": 469.35599, "b": 422.73331, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 220, "label": "text", "bbox": {"l": 449.10074000000003, "t": 425.08908, "r": 525.93616, "b": 427.21017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 265, "text": "The airport sketch is a depiction of the airport with emphasis on runway pattern and related ", "bbox": {"l": 449.10074000000003, "t": 425.08908, "r": 525.93616, "b": 427.21017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 221, "label": "text", "bbox": {"l": 449.10074000000003, "t": 427.3678, "r": 522.0343, "b": 429.48886, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 266, "text": "information, positioned in either the lower left or lower right corner of the chart to aid pi-", "bbox": {"l": 449.10074000000003, "t": 427.3678, "r": 522.0343, "b": 429.48886, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 222, "label": "text", "bbox": {"l": 449.10074000000003, "t": 429.64648, "r": 524.67151, "b": 431.76755, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 267, "text": "lot recognition of the airport from the air and to provide some information to aid on ground ", "bbox": {"l": 449.10074000000003, "t": 429.64648, "r": 524.67151, "b": 431.76755, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 223, "label": "text", "bbox": {"l": 449.10074000000003, "t": 431.92514000000006, "r": 527.172, "b": 434.04623, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 268, "text": "navigation of the airport. The runways are drawn to scale and oriented to true north. Runway ", "bbox": {"l": 449.10074000000003, "t": 431.92514000000006, "r": 527.172, "b": 434.04623, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 224, "label": "text", "bbox": {"l": 449.10074000000003, "t": 434.20383, "r": 502.39545, "b": 436.32492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 269, "text": "dimensions (length and width) are shown for all active runways.", "bbox": {"l": 449.10074000000003, "t": 434.20383, "r": 502.39545, "b": 436.32492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 225, "label": "text", "bbox": {"l": 449.10074000000003, "t": 438.7611999999999, "r": 512.92676, "b": 440.88228999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 270, "text": "Runway(s) are depicted based on what type and construction of the runway.", "bbox": {"l": 449.10074000000003, "t": 438.7611999999999, "r": 512.92676, "b": 440.88228999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 226, "label": "text", "bbox": {"l": 449.95525999999995, "t": 444.07001, "r": 460.02307, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 271, "text": "Hard Surface", "bbox": {"l": 449.95525999999995, "t": 444.07001, "r": 460.02307, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 227, "label": "text", "bbox": {"l": 464.89963, "t": 444.07001, "r": 473.98819, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 272, "text": "Other Than ", "bbox": {"l": 464.89963, "t": 444.07001, "r": 473.98819, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 228, "label": "text", "bbox": {"l": 464.89963, "t": 446.12085, "r": 474.96744, "b": 448.02979, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 273, "text": "Hard Surface", "bbox": {"l": 464.89963, "t": 446.12085, "r": 474.96744, "b": 448.02979, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 229, "label": "text", "bbox": {"l": 478.91357, "t": 444.07001, "r": 489.45648, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 274, "text": "Metal Surface", "bbox": {"l": 478.91357, "t": 444.07001, "r": 489.45648, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 230, "label": "text", "bbox": {"l": 493.06420999999995, "t": 444.07001, "r": 505.03076, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 275, "text": "Closed Runway", "bbox": {"l": 493.06420999999995, "t": 444.07001, "r": 505.03076, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 231, "label": "text", "bbox": {"l": 509.5809, "t": 444.07001, "r": 524.30237, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 276, "text": "Under Construction", "bbox": {"l": 509.5809, "t": 444.07001, "r": 524.30237, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 232, "label": "text", "bbox": {"l": 449.95525999999995, "t": 454.81207, "r": 458.31406, "b": 456.72104, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 277, "text": "Stopways, ", "bbox": {"l": 449.95525999999995, "t": 454.81207, "r": 458.31406, "b": 456.72104, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 233, "label": "text", "bbox": {"l": 449.95525999999995, "t": 456.86288, "r": 461.92083999999994, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 278, "text": "Taxiways, Park-", "bbox": {"l": 449.95525999999995, "t": 456.86288, "r": 461.92083999999994, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 234, "label": "text", "bbox": {"l": 449.95525999999995, "t": 458.91373, "r": 457.08014, "b": 460.82268999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 279, "text": "ing Areas", "bbox": {"l": 449.95525999999995, "t": 458.91373, "r": 457.08014, "b": 460.82268999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 235, "label": "text", "bbox": {"l": 464.89963, "t": 454.81207, "r": 472.87732, "b": 456.72104, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 280, "text": "Displaced ", "bbox": {"l": 464.89963, "t": 454.81207, "r": 472.87732, "b": 456.72104, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 236, "label": "text", "bbox": {"l": 464.89963, "t": 456.86288, "r": 472.49792, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 281, "text": "Threshold", "bbox": {"l": 464.89963, "t": 456.86288, "r": 472.49792, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 237, "label": "text", "bbox": {"l": 478.91357, "t": 454.81207, "r": 483.61584, "b": 456.72104, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 282, "text": "Closed", "bbox": {"l": 478.91357, "t": 454.81207, "r": 483.61584, "b": 456.72104, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 238, "label": "text", "bbox": {"l": 478.91357, "t": 456.86288, "r": 486.60754000000003, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 283, "text": "Pavement", "bbox": {"l": 478.91357, "t": 456.86288, "r": 486.60754000000003, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 239, "label": "text", "bbox": {"l": 493.06420999999995, "t": 454.81207, "r": 504.20648, "b": 456.72104, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 284, "text": "Water Runway", "bbox": {"l": 493.06420999999995, "t": 454.81207, "r": 504.20648, "b": 456.72104, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 240, "label": "text", "bbox": {"l": 449.10074000000003, "t": 469.32974, "r": 548.59674, "b": 471.45081, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 285, "text": "Taxiways and aprons are shaded grey. Other runway features that may be shown are runway numbers, runway dimen-", "bbox": {"l": 449.10074000000003, "t": 469.32974, "r": 548.59674, "b": 471.45081, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 241, "label": "text", "bbox": {"l": 449.10074000000003, "t": 471.60843, "r": 500.08181999999994, "b": 473.72949, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 286, "text": "sions, runway slope, arresting gear, and displaced threshold.", "bbox": {"l": 449.10074000000003, "t": 471.60843, "r": 500.08181999999994, "b": 473.72949, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 242, "label": "text", "bbox": {"l": 449.10074000000003, "t": 476.16577, "r": 449.59933000000007, "b": 478.28687, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 287, "text": "2", "bbox": {"l": 449.10074000000003, "t": 476.16577, "r": 449.59933000000007, "b": 478.28687, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 243, "label": "text", "bbox": {"l": 450.09796, "t": 476.16577, "r": 547.82562, "b": 478.28687, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 288, "text": "W K H U L Q I R U P D W L R Q F R Q F H U Q L Q J O L J K W L Q J \u00bf Q D O D S S U R D F K E H D U L Q J V D L U S R U W E H D F R Q R E V W D F O H V F R Q W U R O W R Z H U 1 $ 9 $ , ' V K H O L ", "bbox": {"l": 450.09796, "t": 476.16577, "r": 547.82562, "b": 478.28687, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 244, "label": "text", "bbox": {"l": 547.82623, "t": 476.16577, "r": 548.45862, "b": 478.28687, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 289, "text": "-", "bbox": {"l": 547.82623, "t": 476.16577, "r": 548.45862, "b": 478.28687, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 245, "label": "text", "bbox": {"l": 449.10074000000003, "t": 478.44446, "r": 470.52609000000007, "b": 480.56555, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 290, "text": "pads may also be shown.", "bbox": {"l": 449.10074000000003, "t": 478.44446, "r": 470.52609000000007, "b": 480.56555, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 246, "label": "text", "bbox": {"l": 449.10074000000003, "t": 483.00183, "r": 493.37906000000004, "b": 485.12292, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 291, "text": "$ L U S R U W ( O H Y D W L R Q D Q G 7 R X F K G R Z Q = R Q H ( O H Y D W L R Q ", "bbox": {"l": 449.10074000000003, "t": 483.00183, "r": 493.37906000000004, "b": 485.12292, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 449.10074000000003, "t": 487.5592, "r": 551.80023, "b": 496.51636, "coord_origin": "TOPLEFT"}, "confidence": 0.5027862787246704, "cells": [{"id": 292, "text": "The airport elevation is shown enclosed within a box in the upper left corner of the sketch box and the touchdown zone ", "bbox": {"l": 449.10074000000003, "t": 487.5592, "r": 549.16168, "b": 489.6803, "coord_origin": "TOPLEFT"}}, {"id": 293, "text": "elevation (TDZE) is shown in the upper right corner of the sketch box. The airport elevation is the highest point of an ", "bbox": {"l": 449.10074000000003, "t": 489.83789, "r": 546.90881, "b": 491.95898, "coord_origin": "TOPLEFT"}}, {"id": 294, "text": "D L U S R U W \u00b6 V X V D E O H U X Q Z D \\ V P H D V X U H G L Q I H H W I U R P P H D Q V H D O H Y H O 7 K H 7 ' = ( L V W K H K L J K H V W H O H Y D W L R Q L Q W K H \u00bf U V W I H H W R I ", "bbox": {"l": 449.10074000000003, "t": 492.11658, "r": 551.80023, "b": 494.23767, "coord_origin": "TOPLEFT"}}, {"id": 295, "text": "the landing surface. Circling only approaches will not show a TDZE.", "bbox": {"l": 449.10074000000003, "t": 494.39526, "r": 505.85068000000007, "b": 496.51636, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 247, "label": "text", "bbox": {"l": 498.80661000000003, "t": 515.9437, "r": 502.08792, "b": 519.01764, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 296, "text": "114", "bbox": {"l": 498.80661000000003, "t": 515.9437, "r": 502.08792, "b": 519.01764, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 248, "label": "text", "bbox": {"l": 444.56319999999994, "t": 422.84869, "r": 446.25998, "b": 471.87128, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 297, "text": "FAA Chart Users\u2019 Guide - Terminal Procedures Publication (TPP) - Terms", "bbox": {"l": 444.56319999999994, "t": 422.84869, "r": 446.25998, "b": 471.87128, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 249, "label": "text", "bbox": {"l": 329.40536, "t": 379.37537, "r": 355.13138, "b": 382.13336, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 298, "text": "AGL 2013 Financial Calendar", "bbox": {"l": 329.40536, "t": 379.37537, "r": 355.13138, "b": 382.13336, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 250, "label": "text", "bbox": {"l": 329.40536, "t": 382.30273, "r": 330.96848, "b": 384.55927, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 299, "text": "22", "bbox": {"l": 329.40536, "t": 382.30273, "r": 330.96848, "b": 384.55927, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 251, "label": "text", "bbox": {"l": 331.75003, "t": 382.30273, "r": 341.12875, "b": 384.55927, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 300, "text": "August 2012 ", "bbox": {"l": 331.75003, "t": 382.30273, "r": 341.12875, "b": 384.55927, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 252, "label": "text", "bbox": {"l": 350.4722, "t": 382.30273, "r": 384.81079, "b": 384.55927, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 301, "text": "2012 full year result and fi nal dividend announced", "bbox": {"l": 350.4722, "t": 382.30273, "r": 384.81079, "b": 384.55927, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 253, "label": "text", "bbox": {"l": 329.40536, "t": 384.84552, "r": 330.97336, "b": 387.10205, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 302, "text": "30", "bbox": {"l": 329.40536, "t": 384.84552, "r": 330.97336, "b": 387.10205, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 254, "label": "text", "bbox": {"l": 331.75735, "t": 384.84552, "r": 341.16534, "b": 387.10205, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 303, "text": "August 2012 ", "bbox": {"l": 331.75735, "t": 384.84552, "r": 341.16534, "b": 387.10205, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 255, "label": "text", "bbox": {"l": 350.4722, "t": 384.84552, "r": 372.90613, "b": 387.10205, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 304, "text": "Ex-dividend trading commences", "bbox": {"l": 350.4722, "t": 384.84552, "r": 372.90613, "b": 387.10205, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 256, "label": "text", "bbox": {"l": 329.40536, "t": 387.38828, "r": 330.20337, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 305, "text": "5", "bbox": {"l": 329.40536, "t": 387.38828, "r": 330.20337, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 257, "label": "text", "bbox": {"l": 331.00137, "t": 387.38828, "r": 342.9715, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 306, "text": "September 2012 ", "bbox": {"l": 331.00137, "t": 387.38828, "r": 342.9715, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 258, "label": "text", "bbox": {"l": 350.4722, "t": 387.38828, "r": 374.88693, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 307, "text": "Record date for 2012 fi nal dividend", "bbox": {"l": 350.4722, "t": 387.38828, "r": 374.88693, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 259, "label": "text", "bbox": {"l": 329.40536, "t": 389.93103, "r": 331.0173, "b": 392.18762, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 308, "text": "27", "bbox": {"l": 329.40536, "t": 389.93103, "r": 331.0173, "b": 392.18762, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 260, "label": "text", "bbox": {"l": 331.82327, "t": 389.93103, "r": 343.91284, "b": 392.18762, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 309, "text": "September 2012 ", "bbox": {"l": 331.82327, "t": 389.93103, "r": 343.91284, "b": 392.18762, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 261, "label": "text", "bbox": {"l": 350.4722, "t": 389.93103, "r": 365.65988, "b": 392.18762, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 310, "text": "Final dividend payable", "bbox": {"l": 350.4722, "t": 389.93103, "r": 365.65988, "b": 392.18762, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 262, "label": "text", "bbox": {"l": 329.40536, "t": 392.47382, "r": 330.98804, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 311, "text": "23", "bbox": {"l": 329.40536, "t": 392.47382, "r": 330.98804, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 263, "label": "text", "bbox": {"l": 331.77936, "t": 392.47382, "r": 342.06674, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 312, "text": "October 2012 ", "bbox": {"l": 331.77936, "t": 392.47382, "r": 342.06674, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 264, "label": "text", "bbox": {"l": 350.4722, "t": 392.47382, "r": 367.22156, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 313, "text": "Annual General Meeting", "bbox": {"l": 350.4722, "t": 392.47382, "r": 367.22156, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 265, "label": "text", "bbox": {"l": 329.40536, "t": 395.0166, "r": 330.99741, "b": 397.27313, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 314, "text": "27", "bbox": {"l": 329.40536, "t": 395.0166, "r": 330.99741, "b": 397.27313, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 266, "label": "text", "bbox": {"l": 331.7934, "t": 395.0166, "r": 342.1416, "b": 397.27313, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 315, "text": "February 2013", "bbox": {"l": 331.7934, "t": 395.0166, "r": 342.1416, "b": 397.27313, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 267, "label": "text", "bbox": {"l": 342.64841, "t": 395.18298, "r": 342.65811, "b": 396.49857000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 316, "text": " 1", "bbox": {"l": 342.64841, "t": 395.18298, "r": 342.65811, "b": 396.49857000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 268, "label": "text", "bbox": {"l": 350.47177, "t": 395.01474, "r": 386.25897, "b": 397.2713, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 317, "text": "2013 interim result and interim dividend announced", "bbox": {"l": 350.47177, "t": 395.01474, "r": 386.25897, "b": 397.2713, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 269, "label": "text", "bbox": {"l": 329.40491, "t": 397.55749999999995, "r": 331.02695, "b": 399.81406, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 318, "text": "28", "bbox": {"l": 329.40491, "t": 397.55749999999995, "r": 331.02695, "b": 399.81406, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 270, "label": "text", "bbox": {"l": 331.83795, "t": 397.55749999999995, "r": 340.75909, "b": 399.81406, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 319, "text": "August 2013", "bbox": {"l": 331.83795, "t": 397.55749999999995, "r": 340.75909, "b": 399.81406, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 271, "label": "text", "bbox": {"l": 341.26437, "t": 397.7254, "r": 341.27408, "b": 399.04095, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 320, "text": " 1", "bbox": {"l": 341.26437, "t": 397.7254, "r": 341.27408, "b": 399.04095, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 272, "label": "text", "bbox": {"l": 350.47144, "t": 397.55713, "r": 385.93265, "b": 399.81369, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 321, "text": "2013 full year results and fi nal dividend announced ", "bbox": {"l": 350.47144, "t": 397.55713, "r": 385.93265, "b": 399.81369, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 273, "label": "text", "bbox": {"l": 329.40536, "t": 400.46155, "r": 329.87708, "b": 401.96588, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 322, "text": "1", "bbox": {"l": 329.40536, "t": 400.46155, "r": 329.87708, "b": 401.96588, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 274, "label": "text", "bbox": {"l": 330.34882, "t": 400.46155, "r": 358.65204, "b": 401.96588, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 323, "text": "Indicative dates only, subject to change/Board confi rmation", "bbox": {"l": 330.34882, "t": 400.46155, "r": 358.65204, "b": 401.96588, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 275, "label": "text", "bbox": {"l": 329.40536, "t": 404.34503, "r": 391.771, "b": 406.60156, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 324, "text": "AGL\u2019s Annual General Meeting will be held at the City Recital Hall, Angel Place, Sydney ", "bbox": {"l": 329.40536, "t": 404.34503, "r": 391.771, "b": 406.60156, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 276, "label": "text", "bbox": {"l": 329.40536, "t": 406.37857, "r": 369.65308, "b": 408.63513000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 325, "text": "commencing at 10.30am on Tuesday 23 October 2012.", "bbox": {"l": 329.40536, "t": 406.37857, "r": 369.65308, "b": 408.63513000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 277, "label": "text", "bbox": {"l": 363.54486, "t": 460.53054999999995, "r": 379.25955, "b": 465.54507, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 326, "text": "Ye s te rd ay", "bbox": {"l": 363.54486, "t": 460.53054999999995, "r": 379.25955, "b": 465.54507, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 278, "label": "text", "bbox": {"l": 363.54486, "t": 466.7157, "r": 391.38229, "b": 468.97223, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 327, "text": "Established in Sydney in 1837, and then ", "bbox": {"l": 363.54486, "t": 466.7157, "r": 391.38229, "b": 468.97223, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 279, "label": "text", "bbox": {"l": 363.54486, "t": 468.74924, "r": 395.01788, "b": 471.00577, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 328, "text": "known as The Australian Gas Light Company, ", "bbox": {"l": 363.54486, "t": 468.74924, "r": 395.01788, "b": 471.00577, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 280, "label": "text", "bbox": {"l": 363.54486, "t": 470.78281, "r": 394.08322, "b": 473.03934, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 329, "text": "the AGL business has an established history ", "bbox": {"l": 363.54486, "t": 470.78281, "r": 394.08322, "b": 473.03934, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 281, "label": "text", "bbox": {"l": 363.54486, "t": 472.81635, "r": 390.60727, "b": 475.07288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 330, "text": "and reputation for serving the gas and ", "bbox": {"l": 363.54486, "t": 472.81635, "r": 390.60727, "b": 475.07288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 282, "label": "text", "bbox": {"l": 363.54486, "t": 474.84988, "r": 393.49612, "b": 477.10645, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 331, "text": "electricity needs of Australian households. ", "bbox": {"l": 363.54486, "t": 474.84988, "r": 393.49612, "b": 477.10645, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 283, "label": "text", "bbox": {"l": 363.54486, "t": 476.88345, "r": 394.11481, "b": 479.13998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 332, "text": "In 1841, when AGL supplied the gas to light ", "bbox": {"l": 363.54486, "t": 476.88345, "r": 394.11481, "b": 479.13998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 284, "label": "text", "bbox": {"l": 363.54486, "t": 478.91699, "r": 393.75891, "b": 481.17352, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 333, "text": "the fi rst public street lamp, it was reported ", "bbox": {"l": 363.54486, "t": 478.91699, "r": 393.75891, "b": 481.17352, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 285, "label": "text", "bbox": {"l": 363.54486, "t": 480.95053, "r": 390.4975, "b": 483.20709, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 334, "text": "in the Sydney Gazette as a \u201cwonderful ", "bbox": {"l": 363.54486, "t": 480.95053, "r": 390.4975, "b": 483.20709, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 286, "label": "text", "bbox": {"l": 363.54486, "t": 482.9841, "r": 395.70975, "b": 485.24063, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 335, "text": "achievement of scientifi c knowledge, assisted ", "bbox": {"l": 363.54486, "t": 482.9841, "r": 395.70975, "b": 485.24063, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 287, "label": "text", "bbox": {"l": 363.54486, "t": 485.01764, "r": 394.27283, "b": 487.2742, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 336, "text": "by mechanical ingenuity.\u201d Within two years, ", "bbox": {"l": 363.54486, "t": 485.01764, "r": 394.27283, "b": 487.2742, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 288, "label": "text", "bbox": {"l": 363.54486, "t": 487.05121, "r": 396.65939, "b": 489.30774, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 337, "text": "165 gas lamps were lighting the City of Sydney.", "bbox": {"l": 363.54486, "t": 487.05121, "r": 396.65939, "b": 489.30774, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 289, "label": "text", "bbox": {"l": 329.4054, "t": 419.93124, "r": 384.19696, "b": 431.09412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 338, "text": "Looking back on ", "bbox": {"l": 329.4054, "t": 419.93124, "r": 384.19696, "b": 431.09412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 290, "label": "text", "bbox": {"l": 329.4054, "t": 430.10379, "r": 372.16626, "b": 441.26669, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 339, "text": "175 years of ", "bbox": {"l": 329.4054, "t": 430.10379, "r": 372.16626, "b": 441.26669, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 291, "label": "text", "bbox": {"l": 329.4054, "t": 440.27636999999993, "r": 385.3981, "b": 451.43924, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 340, "text": "looking forward.", "bbox": {"l": 329.4054, "t": 440.27636999999993, "r": 385.3981, "b": 451.43924, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 292, "label": "text", "bbox": {"l": 329.40536, "t": 372.16159, "r": 353.36179, "b": 373.91669, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 341, "text": "AGL Energy Limited ABN 74 115 061 375", "bbox": {"l": 329.40536, "t": 372.16159, "r": 353.36179, "b": 373.91669, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 293, "label": "text", "bbox": {"l": 546.20587, "t": 360.90448, "r": 548.23407, "b": 362.82242, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 342, "text": "29", "bbox": {"l": 546.20587, "t": 360.90448, "r": 548.23407, "b": 362.82242, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 294, "label": "text", "bbox": {"l": 497.77728, "t": 251.43384000000003, "r": 542.8255, "b": 254.94385, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 343, "text": "signs, signals and road markings", "bbox": {"l": 497.77728, "t": 251.43384000000003, "r": 542.8255, "b": 254.94385, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 295, "label": "text", "bbox": {"l": 490.30679, "t": 251.47478999999998, "r": 492.09982, "b": 254.98479999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 344, "text": "3", "bbox": {"l": 490.30679, "t": 251.47478999999998, "r": 492.09982, "b": 254.98479999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 296, "label": "text", "bbox": {"l": 498.15335, "t": 263.88922, "r": 500.05637, "b": 265.92719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 345, "text": "In ", "bbox": {"l": 498.15335, "t": 263.88922, "r": 500.05637, "b": 265.92719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 297, "label": "text", "bbox": {"l": 500.05637, "t": 263.85717999999997, "r": 524.37036, "b": 265.86310000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 346, "text": "chapter 2, you and your vehicle", "bbox": {"l": 500.05637, "t": 263.85717999999997, "r": 524.37036, "b": 265.86310000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 298, "label": "text", "bbox": {"l": 524.37036, "t": 263.88922, "r": 539.89124, "b": 265.92719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 347, "text": ", you learned about ", "bbox": {"l": 524.37036, "t": 263.88922, "r": 539.89124, "b": 265.92719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 299, "label": "text", "bbox": {"l": 498.15335, "t": 265.93224999999995, "r": 544.50403, "b": 267.97020999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 348, "text": "some of the controls in your vehicle. This chapter is a handy ", "bbox": {"l": 498.15335, "t": 265.93224999999995, "r": 544.50403, "b": 267.97020999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 300, "label": "text", "bbox": {"l": 498.15335, "t": 267.97533999999996, "r": 544.01343, "b": 270.01331000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 349, "text": "reference section that gives examples of the most common ", "bbox": {"l": 498.15335, "t": 267.97533999999996, "r": 544.01343, "b": 270.01331000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 301, "label": "text", "bbox": {"l": 498.15335, "t": 270.01831000000004, "r": 544.11987, "b": 272.05634, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 350, "text": "signs, signals and road markings that keep traffi c organized ", "bbox": {"l": 498.15335, "t": 270.01831000000004, "r": 544.11987, "b": 272.05634, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 302, "label": "text", "bbox": {"l": 498.15335, "t": 272.06140000000005, "r": 515.41071, "b": 274.09937, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 351, "text": "and flowing smoothly. ", "bbox": {"l": 498.15335, "t": 272.06140000000005, "r": 515.41071, "b": 274.09937, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 303, "label": "text", "bbox": {"l": 498.15335, "t": 277.34619, "r": 505.64642000000003, "b": 280.9357, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 352, "text": "Signs", "bbox": {"l": 498.15335, "t": 277.34619, "r": 505.64642000000003, "b": 280.9357, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 304, "label": "text", "bbox": {"l": 498.15335, "t": 281.82187, "r": 543.92957, "b": 283.85983, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 353, "text": "There are three ways to read signs: by their shape, colour and ", "bbox": {"l": 498.15335, "t": 281.82187, "r": 543.92957, "b": 283.85983, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 305, "label": "text", "bbox": {"l": 498.15335, "t": 283.8649, "r": 545.67834, "b": 285.90289, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 354, "text": "the messages printed on them. Understanding these three ways ", "bbox": {"l": 498.15335, "t": 283.8649, "r": 545.67834, "b": 285.90289, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 306, "label": "text", "bbox": {"l": 498.15335, "t": 285.90796, "r": 545.26471, "b": 287.94592, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 355, "text": "of classifying signs will help you figure out the meaning of signs ", "bbox": {"l": 498.15335, "t": 285.90796, "r": 545.26471, "b": 287.94592, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 307, "label": "text", "bbox": {"l": 498.15335, "t": 287.95099, "r": 513.31335, "b": 289.98895, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 356, "text": "that are new to you. ", "bbox": {"l": 498.15335, "t": 287.95099, "r": 513.31335, "b": 289.98895, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 308, "label": "text", "bbox": {"l": 505.43439, "t": 303.07596, "r": 508.53033000000005, "b": 304.89639, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 357, "text": "Stop", "bbox": {"l": 505.43439, "t": 303.07596, "r": 508.53033000000005, "b": 304.89639, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 309, "label": "text", "bbox": {"l": 527.45502, "t": 303.25354, "r": 541.44678, "b": 305.07397, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 358, "text": "Yield the right-of-way", "bbox": {"l": 527.45502, "t": 303.25354, "r": 541.44678, "b": 305.07397, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 310, "label": "text", "bbox": {"l": 501.79385, "t": 321.18973, "r": 510.41632, "b": 323.01016, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 359, "text": "Shows driving", "bbox": {"l": 501.79385, "t": 321.18973, "r": 510.41632, "b": 323.01016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 311, "label": "text", "bbox": {"l": 501.79385, "t": 322.87731999999994, "r": 509.04268999999994, "b": 324.69775000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 360, "text": "regulations", "bbox": {"l": 501.79385, "t": 322.87731999999994, "r": 509.04268999999994, "b": 324.69775000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 312, "label": "text", "bbox": {"l": 518.66455, "t": 319.59146, "r": 529.80902, "b": 321.41190000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 361, "text": "Explains lane use", "bbox": {"l": 518.66455, "t": 319.59146, "r": 529.80902, "b": 321.41190000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 313, "label": "text", "bbox": {"l": 534.87561, "t": 318.37616, "r": 546.95142, "b": 320.19659, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 362, "text": "School zone signs ", "bbox": {"l": 534.87561, "t": 318.37616, "r": 546.95142, "b": 320.19659, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 314, "label": "text", "bbox": {"l": 534.87561, "t": 320.0637500000001, "r": 545.05762, "b": 321.88419, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 363, "text": "are fl uorescent ", "bbox": {"l": 534.87561, "t": 320.0637500000001, "r": 545.05762, "b": 321.88419, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 315, "label": "text", "bbox": {"l": 534.87561, "t": 321.75134, "r": 543.32263, "b": 323.57178, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 364, "text": "yellow-green", "bbox": {"l": 534.87561, "t": 321.75134, "r": 543.32263, "b": 323.57178, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 316, "label": "text", "bbox": {"l": 499.21862999999996, "t": 338.12772, "r": 512.62451, "b": 339.94815, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 365, "text": "Tells about motorist ", "bbox": {"l": 499.21862999999996, "t": 338.12772, "r": 512.62451, "b": 339.94815, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 317, "label": "text", "bbox": {"l": 499.21862999999996, "t": 339.81531000000007, "r": 504.39917, "b": 341.63574, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 366, "text": "services", "bbox": {"l": 499.21862999999996, "t": 339.81531000000007, "r": 504.39917, "b": 341.63574, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 318, "label": "text", "bbox": {"l": 516.97748, "t": 338.06039, "r": 529.77484, "b": 339.88082999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 367, "text": "Shows a permitted ", "bbox": {"l": 516.97748, "t": 338.06039, "r": 529.77484, "b": 339.88082999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 319, "label": "text", "bbox": {"l": 516.97748, "t": 339.74799, "r": 520.96399, "b": 341.56842, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 368, "text": "action", "bbox": {"l": 516.97748, "t": 339.74799, "r": 520.96399, "b": 341.56842, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 320, "label": "text", "bbox": {"l": 534.55847, "t": 337.88281, "r": 548.58453, "b": 339.7032500000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 369, "text": "Shows an action that ", "bbox": {"l": 534.55847, "t": 337.88281, "r": 548.58453, "b": 339.7032500000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 321, "label": "text", "bbox": {"l": 534.55847, "t": 339.57040000000006, "r": 545.08862, "b": 341.39084, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 370, "text": "is not permitted", "bbox": {"l": 534.55847, "t": 339.57040000000006, "r": 545.08862, "b": 341.39084, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 322, "label": "text", "bbox": {"l": 483.05853, "t": 356.17416, "r": 494.72577, "b": 357.9946, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 371, "text": "Warns of hazards ", "bbox": {"l": 483.05853, "t": 356.17416, "r": 494.72577, "b": 357.9946, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 323, "label": "text", "bbox": {"l": 483.05853, "t": 357.86179, "r": 487.07525999999996, "b": 359.68222, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 372, "text": "ahead", "bbox": {"l": 483.05853, "t": 357.86179, "r": 487.07525999999996, "b": 359.68222, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 324, "label": "text", "bbox": {"l": 499.39645, "t": 356.26297000000005, "r": 504.69171, "b": 358.0834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 373, "text": "Warns of", "bbox": {"l": 499.39645, "t": 356.26297000000005, "r": 504.69171, "b": 358.0834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 325, "label": "text", "bbox": {"l": 499.39645, "t": 357.95056, "r": 511.69116, "b": 359.77099999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 374, "text": "construction zones", "bbox": {"l": 499.39645, "t": 357.95056, "r": 511.69116, "b": 359.77099999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 326, "label": "text", "bbox": {"l": 516.75891, "t": 356.26297000000005, "r": 527.42938, "b": 358.0834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 375, "text": "Railway crossing", "bbox": {"l": 516.75891, "t": 356.26297000000005, "r": 527.42938, "b": 358.0834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 327, "label": "text", "bbox": {"l": 534.5141, "t": 352.92981, "r": 547.89862, "b": 354.75024, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 376, "text": "Shows distance and ", "bbox": {"l": 534.5141, "t": 352.92981, "r": 547.89862, "b": 354.75024, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 328, "label": "text", "bbox": {"l": 534.5141, "t": 354.6174, "r": 540.2818, "b": 356.43784, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 377, "text": "direction", "bbox": {"l": 534.5141, "t": 354.6174, "r": 540.2818, "b": 356.43784, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 329, "label": "text", "bbox": {"l": 478.37466, "t": 270.14075, "r": 479.14251999999993, "b": 272.17877, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 378, "text": "\u2022", "bbox": {"l": 478.37466, "t": 270.14075, "r": 479.14251999999993, "b": 272.17877, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 330, "label": "text", "bbox": {"l": 479.91036999999994, "t": 270.14075, "r": 483.74963, "b": 272.17877, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 379, "text": "Signs", "bbox": {"l": 479.91036999999994, "t": 270.14075, "r": 483.74963, "b": 272.17877, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 331, "label": "text", "bbox": {"l": 479.97293, "t": 272.84717, "r": 492.31219, "b": 274.34888, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 380, "text": "- regulatory signs", "bbox": {"l": 479.97293, "t": 272.84717, "r": 492.31219, "b": 274.34888, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 332, "label": "text", "bbox": {"l": 479.97293, "t": 275.14513999999997, "r": 486.72598000000005, "b": 276.64679, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 381, "text": "- school, ", "bbox": {"l": 479.97293, "t": 275.14513999999997, "r": 486.72598000000005, "b": 276.64679, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 333, "label": "text", "bbox": {"l": 481.21602999999993, "t": 276.77972, "r": 492.93286000000006, "b": 278.81768999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 382, "text": "playground and ", "bbox": {"l": 481.21602999999993, "t": 276.77972, "r": 492.93286000000006, "b": 278.81768999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 334, "label": "text", "bbox": {"l": 481.21602999999993, "t": 278.82275000000004, "r": 491.82938000000007, "b": 280.86075, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 383, "text": "crosswalk signs", "bbox": {"l": 481.21602999999993, "t": 278.82275000000004, "r": 491.82938000000007, "b": 280.86075, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 335, "label": "text", "bbox": {"l": 479.97293, "t": 281.52759, "r": 491.00775000000004, "b": 283.02924, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 384, "text": "- lane use signs", "bbox": {"l": 479.97293, "t": 281.52759, "r": 491.00775000000004, "b": 283.02924, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 336, "label": "text", "bbox": {"l": 479.97293, "t": 283.82556, "r": 493.32748, "b": 285.3272099999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 385, "text": "- turn control signs", "bbox": {"l": 479.97293, "t": 283.82556, "r": 493.32748, "b": 285.3272099999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 337, "label": "text", "bbox": {"l": 479.97293, "t": 286.1235, "r": 490.4915199999999, "b": 287.62518, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 386, "text": "- parking signs", "bbox": {"l": 479.97293, "t": 286.1235, "r": 490.4915199999999, "b": 287.62518, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 338, "label": "text", "bbox": {"l": 479.97293, "t": 288.42148, "r": 491.17004000000003, "b": 289.92316, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 387, "text": "- reserved lane ", "bbox": {"l": 479.97293, "t": 288.42148, "r": 491.17004000000003, "b": 289.92316, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 339, "label": "text", "bbox": {"l": 481.21602999999993, "t": 290.05605999999995, "r": 484.77405000000005, "b": 292.09406, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 388, "text": "signs", "bbox": {"l": 481.21602999999993, "t": 290.05605999999995, "r": 484.77405000000005, "b": 292.09406, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 340, "label": "text", "bbox": {"l": 479.97293, "t": 292.76169000000004, "r": 490.83398, "b": 294.26334, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 389, "text": "- warning signs", "bbox": {"l": 479.97293, "t": 292.76169000000004, "r": 490.83398, "b": 294.26334, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 341, "label": "text", "bbox": {"l": 479.97293, "t": 295.05963, "r": 491.62692, "b": 296.56131, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 390, "text": "- object markers", "bbox": {"l": 479.97293, "t": 295.05963, "r": 491.62692, "b": 296.56131, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 342, "label": "text", "bbox": {"l": 479.97293, "t": 297.3576, "r": 490.37341, "b": 298.8592499999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 391, "text": "- construction ", "bbox": {"l": 479.97293, "t": 297.3576, "r": 490.37341, "b": 298.8592499999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 343, "label": "text", "bbox": {"l": 481.21602999999993, "t": 298.99219, "r": 484.77405000000005, "b": 301.03015, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 392, "text": "signs", "bbox": {"l": 481.21602999999993, "t": 298.99219, "r": 484.77405000000005, "b": 301.03015, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 344, "label": "text", "bbox": {"l": 479.97293, "t": 301.69780999999995, "r": 492.93912, "b": 303.19946, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 393, "text": "- information and ", "bbox": {"l": 479.97293, "t": 301.69780999999995, "r": 492.93912, "b": 303.19946, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 345, "label": "text", "bbox": {"l": 481.21602999999993, "t": 303.3324, "r": 493.00525, "b": 305.37036, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 394, "text": "destination signs", "bbox": {"l": 481.21602999999993, "t": 303.3324, "r": 493.00525, "b": 305.37036, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 346, "label": "text", "bbox": {"l": 479.97293, "t": 306.0379899999999, "r": 489.99047999999993, "b": 307.53967, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 395, "text": "- railway signs", "bbox": {"l": 479.97293, "t": 306.0379899999999, "r": 489.99047999999993, "b": 307.53967, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 347, "label": "text", "bbox": {"l": 478.375, "t": 308.24789, "r": 479.1032400000001, "b": 310.28586, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 396, "text": "\u2022", "bbox": {"l": 478.375, "t": 308.24789, "r": 479.1032400000001, "b": 310.28586, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 348, "label": "text", "bbox": {"l": 479.83151, "t": 308.24789, "r": 484.92925999999994, "b": 310.28586, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 397, "text": "Signals", "bbox": {"l": 479.83151, "t": 308.24789, "r": 484.92925999999994, "b": 310.28586, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 349, "label": "text", "bbox": {"l": 479.97293, "t": 310.95358, "r": 490.00091999999995, "b": 312.45526, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 398, "text": "- lane control ", "bbox": {"l": 479.97293, "t": 310.95358, "r": 490.00091999999995, "b": 312.45526, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 350, "label": "text", "bbox": {"l": 481.21602999999993, "t": 312.5881999999999, "r": 485.95331, "b": 314.62616, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 399, "text": "signals", "bbox": {"l": 481.21602999999993, "t": 312.5881999999999, "r": 485.95331, "b": 314.62616, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 351, "label": "text", "bbox": {"l": 479.97293, "t": 315.29379, "r": 489.29876999999993, "b": 316.79544, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 400, "text": "- traffic lights", "bbox": {"l": 479.97293, "t": 315.29379, "r": 489.29876999999993, "b": 316.79544, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 352, "label": "text", "bbox": {"l": 478.375, "t": 317.50366, "r": 479.18129999999996, "b": 319.5416599999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 401, "text": "\u2022", "bbox": {"l": 478.375, "t": 317.50366, "r": 479.18129999999996, "b": 319.5416599999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 353, "label": "text", "bbox": {"l": 479.98761, "t": 317.50366, "r": 490.46960000000007, "b": 319.5416599999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 402, "text": "Road markings", "bbox": {"l": 479.98761, "t": 317.50366, "r": 490.46960000000007, "b": 319.5416599999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 354, "label": "text", "bbox": {"l": 479.97293, "t": 320.20938, "r": 489.26166000000006, "b": 321.71103, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 403, "text": "- yellow lines", "bbox": {"l": 479.97293, "t": 320.20938, "r": 489.26166000000006, "b": 321.71103, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 355, "label": "text", "bbox": {"l": 479.97293, "t": 322.50732, "r": 488.59189, "b": 324.009, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 404, "text": "- white lines", "bbox": {"l": 479.97293, "t": 322.50732, "r": 488.59189, "b": 324.009, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 356, "label": "text", "bbox": {"l": 479.97293, "t": 324.8053, "r": 491.17004000000003, "b": 326.30698, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 405, "text": "- reserved lane ", "bbox": {"l": 479.97293, "t": 324.8053, "r": 491.17004000000003, "b": 326.30698, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 357, "label": "text", "bbox": {"l": 481.21602999999993, "t": 326.43988, "r": 487.58978, "b": 328.47784, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 406, "text": "markings", "bbox": {"l": 481.21602999999993, "t": 326.43988, "r": 487.58978, "b": 328.47784, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 358, "label": "text", "bbox": {"l": 479.97293, "t": 329.14551, "r": 491.75177, "b": 330.64716, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 407, "text": "- other markings", "bbox": {"l": 479.97293, "t": 329.14551, "r": 491.75177, "b": 330.64716, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 359, "label": "text", "bbox": {"l": 478.15246999999994, "t": 265.07030999999995, "r": 493.75586, "b": 268.06872999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 408, "text": "in this chapter", "bbox": {"l": 478.15246999999994, "t": 265.07030999999995, "r": 493.75586, "b": 268.06872999999996, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "caption", "id": 16, "page_no": 0, "cluster": {"id": 16, "label": "caption", "bbox": {"l": 317.95499, "t": 540.08299, "r": 559.80579, "b": 559.51524, "coord_origin": "TOPLEFT"}, "confidence": 0.7793369889259338, "cells": [{"id": 409, "text": "Figure 1: Four examples of complex page layouts across dif-", "bbox": {"l": 317.95499, "t": 540.08299, "r": 559.80579, "b": 548.55624, "coord_origin": "TOPLEFT"}}, {"id": 410, "text": "ferent document categories", "bbox": {"l": 317.95499, "t": 551.0419899999999, "r": 428.69907, "b": 559.51524, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 1: Four examples of complex page layouts across different document categories"}, {"label": "section_header", "id": 3, "page_no": 0, "cluster": {"id": 3, "label": "section_header", "bbox": {"l": 317.95499, "t": 592.46591, "r": 379.8205, "b": 602.7750100000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9208477139472961, "cells": [{"id": 411, "text": "KEYWORDS", "bbox": {"l": 317.95499, "t": 592.46591, "r": 379.8205, "b": 602.7750100000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "KEYWORDS"}, {"label": "text", "id": 1, "page_no": 0, "cluster": {"id": 1, "label": "text", "bbox": {"l": 317.95499, "t": 607.66756, "r": 559.18597, "b": 627.00117, "coord_origin": "TOPLEFT"}, "confidence": 0.9509093761444092, "cells": [{"id": 412, "text": "PDF document conversion, layout segmentation, object-detection,", "bbox": {"l": 317.95499, "t": 607.66756, "r": 559.18597, "b": 616.04218, "coord_origin": "TOPLEFT"}}, {"id": 413, "text": "data set, Machine Learning", "bbox": {"l": 317.95499, "t": 618.62656, "r": 416.94403, "b": 627.00117, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "PDF document conversion, layout segmentation, object-detection, data set, Machine Learning"}, {"label": "section_header", "id": 7, "page_no": 0, "cluster": {"id": 7, "label": "section_header", "bbox": {"l": 317.65997, "t": 640.05434, "r": 404.65366, "b": 647.58609, "coord_origin": "TOPLEFT"}, "confidence": 0.8721990585327148, "cells": [{"id": 414, "text": "ACM Reference Format:", "bbox": {"l": 317.65997, "t": 640.05434, "r": 404.65366, "b": 647.58609, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "ACM Reference Format:"}, {"label": "text", "id": 2, "page_no": 0, "cluster": {"id": 2, "label": "text", "bbox": {"l": 317.95499, "t": 650.11996, "r": 559.5495, "b": 707.377029, "coord_origin": "TOPLEFT"}, "confidence": 0.9455164670944214, "cells": [{"id": 415, "text": "Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter", "bbox": {"l": 317.95499, "t": 650.11996, "r": 558.35266, "b": 657.56404, "coord_origin": "TOPLEFT"}}, {"id": 416, "text": "Staar. 2022. DocLayNet: A Large Human-Annotated Dataset for Document-", "bbox": {"l": 317.95499, "t": 660.08296, "r": 559.5495, "b": 667.52703, "coord_origin": "TOPLEFT"}}, {"id": 417, "text": "Layout Analysis. In", "bbox": {"l": 317.95499, "t": 670.04497, "r": 383.30807, "b": 677.48904, "coord_origin": "TOPLEFT"}}, {"id": 418, "text": "Proceedings of the 28th ACM SIGKDD Conference on", "bbox": {"l": 385.798, "t": 670.08482, "r": 558.20032, "b": 677.49701, "coord_origin": "TOPLEFT"}}, {"id": 419, "text": "Knowledge Discovery and Data Mining (KDD \u201922), August 14-18, 2022, Wash-", "bbox": {"l": 317.95499, "t": 680.04781, "r": 559.00092, "b": 687.46001, "coord_origin": "TOPLEFT"}}, {"id": 420, "text": "ington, DC, USA.", "bbox": {"l": 317.95499, "t": 690.01081, "r": 370.11481, "b": 697.423004, "coord_origin": "TOPLEFT"}}, {"id": 421, "text": "ACM, New York, NY, USA, 9 pages. https://doi.org/10.1145/", "bbox": {"l": 371.82999, "t": 689.97096, "r": 558.71655, "b": 697.415031, "coord_origin": "TOPLEFT"}}, {"id": 422, "text": "3534678.3539043", "bbox": {"l": 317.95499, "t": 699.932953, "r": 371.59375, "b": 707.377029, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar. 2022. DocLayNet: A Large Human-Annotated Dataset for DocumentLayout Analysis. In Proceedings of the 28th ACM SIGKDD Conference on Knowledge Discovery and Data Mining (KDD \u201922), August 14-18, 2022, Washington, DC, USA. ACM, New York, NY, USA, 9 pages. https://doi.org/10.1145/ 3534678.3539043"}], "headers": [{"label": "page_header", "id": 10, "page_no": 0, "cluster": {"id": 10, "label": "page_header", "bbox": {"l": 18.34021, "t": 218.35999000000004, "r": 36.339794, "b": 555.00003, "coord_origin": "TOPLEFT"}, "confidence": 0.853788435459137, "cells": [{"id": 423, "text": "arXiv:2206.01062v1 [cs.CV] 2 Jun 2022", "bbox": {"l": 18.34021, "t": 218.35999000000004, "r": 36.339794, "b": 555.00003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "arXiv:2206.01062v1 [cs.CV] 2 Jun 2022"}]}}, {"page_no": 1, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 246.24382, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar", "bbox": {"l": 253.13897999999998, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "1", "bbox": {"l": 53.79800000000001, "t": 85.85986000000003, "r": 59.427395, "b": 96.16900999999996, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "INTRODUCTION", "bbox": {"l": 70.379532, "t": 85.85986000000003, "r": 156.52899, "b": 96.16900999999996, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Despite the substantial improvements achieved with machine-learning", "bbox": {"l": 53.79800000000001, "t": 110.98352, "r": 303.01697, "b": 119.35815000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "(ML) approaches and deep neural networks in recent years, docu-", "bbox": {"l": 53.528999, "t": 121.94256999999993, "r": 295.55695, "b": 130.31719999999996, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "ment conversion remains a challenging problem, as demonstrated", "bbox": {"l": 53.79800000000001, "t": 132.90155000000004, "r": 294.04642, "b": 141.27617999999995, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "by the numerous public competitions held on this topic [1-4]. The", "bbox": {"l": 53.79800000000001, "t": 143.85956, "r": 294.04733, "b": 152.23419, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "challenge originates from the huge variability in PDF documents", "bbox": {"l": 53.79800000000001, "t": 154.81853999999998, "r": 294.04349, "b": 163.19317999999998, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "regarding layout, language and formats (scanned, programmatic", "bbox": {"l": 53.79800000000001, "t": 165.77752999999996, "r": 294.04718, "b": 174.15215999999998, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "or a combination of both). Engineering a single ML model that can", "bbox": {"l": 53.79800000000001, "t": 176.73650999999995, "r": 294.04919, "b": 185.11114999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "be applied on all types of documents and provides high-quality", "bbox": {"l": 53.79800000000001, "t": 187.69556, "r": 294.27573, "b": 196.07019000000003, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "layout segmentation remains to this day extremely challenging [5].", "bbox": {"l": 53.79800000000001, "t": 198.65454, "r": 295.42569, "b": 207.02917000000002, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "To highlight the variability in document layouts, we show a few", "bbox": {"l": 53.528999, "t": 209.61352999999997, "r": 294.37256, "b": 217.98816, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "example documents from the DocLayNet dataset in Figure 1.", "bbox": {"l": 53.79800000000001, "t": 220.57250999999997, "r": 275.48334, "b": 228.94714, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "A key problem in the process of document conversion is to under-", "bbox": {"l": 63.76100199999999, "t": 231.53156, "r": 295.564, "b": 239.90619000000004, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "stand the structure of a single document page, i.e. which segments", "bbox": {"l": 53.79800000000001, "t": 242.49054, "r": 294.04868, "b": 250.86517000000003, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "of text should be grouped together in a unit. To train models for this", "bbox": {"l": 53.79800000000001, "t": 253.44854999999995, "r": 294.04532, "b": 261.82318, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "task, there are currently two large datasets available to the com-", "bbox": {"l": 53.79800000000001, "t": 264.40752999999995, "r": 295.55618, "b": 272.78216999999995, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "munity, PubLayNet [6] and DocBank [7]. They were introduced", "bbox": {"l": 53.79800000000001, "t": 275.36658, "r": 294.04059, "b": 283.74118, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "in 2019 and 2020 respectively and significantly accelerated the im-", "bbox": {"l": 53.79800000000001, "t": 286.32552999999996, "r": 295.55783, "b": 294.70016, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "plementation of layout detection and segmentation models due to", "bbox": {"l": 53.79800000000001, "t": 297.28455, "r": 294.04538, "b": 305.65918000000005, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "their sizes of 300K and 500K ground-truth pages. These sizes were", "bbox": {"l": 53.79800000000001, "t": 308.24353, "r": 294.043, "b": 316.61816, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "achieved by leveraging an automation approach. The benefit of au-", "bbox": {"l": 53.79800000000001, "t": 319.20255, "r": 295.56412, "b": 327.57718, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "tomated ground-truth generation is obvious: one can generate large", "bbox": {"l": 53.79800000000001, "t": 330.16153, "r": 294.04532, "b": 338.53616, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "ground-truth datasets at virtually no cost. However, the automation", "bbox": {"l": 53.79800000000001, "t": 341.12054, "r": 294.04538, "b": 349.49518, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "introduces a constraint on the variability in the dataset, because", "bbox": {"l": 53.79800000000001, "t": 352.07953, "r": 294.04712, "b": 360.45416000000006, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "corresponding structured source data must be available. PubLayNet", "bbox": {"l": 53.79800000000001, "t": 363.03853999999995, "r": 294.04538, "b": 371.41318, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "and DocBank were both generated from scientific document repos-", "bbox": {"l": 53.79800000000001, "t": 373.99655, "r": 295.55643, "b": 382.37119, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "itories (PubMed and arXiv), which provide XML or L", "bbox": {"l": 53.79800000000001, "t": 384.95554, "r": 246.75909, "b": 393.33017, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "A", "bbox": {"l": 243.53101000000004, "t": 385.03183000000007, "r": 248.58553000000003, "b": 391.82455, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "T", "bbox": {"l": 247.24099999999999, "t": 384.95554, "r": 252.58859, "b": 393.33017, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "E", "bbox": {"l": 251.09398999999996, "t": 386.87954999999994, "r": 256.08829, "b": 395.25418, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "X", "bbox": {"l": 254.967, "t": 384.95554, "r": 261.33725, "b": 393.33017, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "sources.", "bbox": {"l": 263.75021, "t": 384.95554, "r": 295.42773, "b": 393.33017, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "Those scientific documents present a limited variability in their", "bbox": {"l": 53.528999, "t": 395.91455, "r": 294.21713, "b": 404.28918, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "layouts, because they are typeset in uniform templates provided by", "bbox": {"l": 53.79800000000001, "t": 406.87354, "r": 294.27386, "b": 415.24817, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "the publishers. Obviously, documents such as technical manuals,", "bbox": {"l": 53.79800000000001, "t": 417.8325500000001, "r": 295.03488, "b": 426.20717999999994, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "annual company reports, legal text, government tenders, etc. have", "bbox": {"l": 53.79800000000001, "t": 428.79153, "r": 294.04691, "b": 437.16617, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "very different and partially unique layouts. As a consequence, the", "bbox": {"l": 53.57400100000001, "t": 439.75055, "r": 294.04865, "b": 448.12518, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "layout predictions obtained from models trained on PubLayNet or", "bbox": {"l": 53.79800000000001, "t": 450.7095299999999, "r": 294.21643, "b": 459.08417, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "DocBank is very reasonable when applied on scientific documents.", "bbox": {"l": 53.79800000000001, "t": 461.66855, "r": 295.42181, "b": 470.04318, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "However, for more", "bbox": {"l": 53.79800000000001, "t": 472.62753, "r": 125.52795, "b": 481.00217, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "artistic", "bbox": {"l": 128.608, "t": 472.67239, "r": 153.7679, "b": 481.01114, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "or", "bbox": {"l": 157.15199, "t": 472.62753, "r": 165.16365, "b": 481.00217, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "free-style", "bbox": {"l": 168.248, "t": 472.67239, "r": 201.49272, "b": 481.01114, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "layouts, we see sub-par", "bbox": {"l": 204.78799, "t": 472.62753, "r": 294.21494, "b": 481.00217, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "prediction quality from these models, which we demonstrate in", "bbox": {"l": 53.79800000000001, "t": 483.58554, "r": 294.04715, "b": 491.96017, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Section 5.", "bbox": {"l": 53.79800000000001, "t": 494.54453, "r": 89.080788, "b": 502.91916, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "In this paper, we present the DocLayNet dataset. It provides page-", "bbox": {"l": 63.76100199999999, "t": 505.50354, "r": 295.56396, "b": 513.87817, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "by-page layout annotation ground-truth using bounding-boxes for", "bbox": {"l": 53.79800000000001, "t": 516.46252, "r": 294.21271, "b": 524.83716, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "11", "bbox": {"l": 53.591999, "t": 527.42154, "r": 61.92275599999999, "b": 535.7961700000001, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "distinct class labels on 80863 unique document pages, of which", "bbox": {"l": 64.162201, "t": 527.42154, "r": 294.04626, "b": 535.7961700000001, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "a fraction carry double- or triple-annotations. DocLayNet is similar", "bbox": {"l": 53.79800000000001, "t": 538.38055, "r": 294.21228, "b": 546.75517, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "in spirit to PubLayNet and DocBank and will likewise be made", "bbox": {"l": 53.79800000000001, "t": 549.33955, "r": 294.04709, "b": 557.71417, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "available to the public", "bbox": {"l": 53.79800000000001, "t": 560.29855, "r": 134.28951, "b": 568.67317, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "1", "bbox": {"l": 134.29201, "t": 558.23083, "r": 137.67381, "b": 565.0235299999999, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "in order to stimulate the document-layout", "bbox": {"l": 140.418, "t": 560.29855, "r": 294.047, "b": 568.67317, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "analysis community. It distinguishes itself in the following aspects:", "bbox": {"l": 53.79800000000001, "t": 571.25755, "r": 295.10538, "b": 579.63217, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "(1)", "bbox": {"l": 64.708, "t": 584.58156, "r": 74.221352, "b": 592.95618, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Human Annotation", "bbox": {"l": 78.207001, "t": 584.62639, "r": 146.39589, "b": 592.96515, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": ": In contrast to PubLayNet and DocBank,", "bbox": {"l": 146.41701, "t": 584.58156, "r": 295.03036, "b": 592.95618, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "we relied on human annotation instead of automation ap-", "bbox": {"l": 77.875, "t": 595.54056, "r": 295.56165, "b": 603.91518, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "proaches to generate the data set.", "bbox": {"l": 78.207001, "t": 606.49956, "r": 200.6432, "b": 614.87418, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "(2)", "bbox": {"l": 64.708, "t": 617.45856, "r": 74.221352, "b": 625.8331800000001, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "Large Layout Variability", "bbox": {"l": 78.207001, "t": 617.50339, "r": 167.91745, "b": 625.84215, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": ": We include diverse and complex", "bbox": {"l": 168.33501, "t": 617.45856, "r": 294.26254, "b": 625.8331800000001, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "layouts from a large variety of public sources.", "bbox": {"l": 78.207001, "t": 628.41655, "r": 245.45726000000002, "b": 636.79117, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "(3)", "bbox": {"l": 64.708, "t": 639.37555, "r": 74.221352, "b": 647.75017, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "Detailed Label Set", "bbox": {"l": 78.207001, "t": 639.42038, "r": 143.51663, "b": 647.75914, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": ": We define 11 class labels to distinguish", "bbox": {"l": 144.02, "t": 639.37555, "r": 294.04648, "b": 647.75017, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "layout features in high detail. PubLayNet provides 5 labels;", "bbox": {"l": 78.207001, "t": 650.33455, "r": 294.68381, "b": 658.70917, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "DocBank provides 13, although not a superset of ours.", "bbox": {"l": 78.207001, "t": 661.29355, "r": 276.33752, "b": 669.66817, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "(4)", "bbox": {"l": 64.708, "t": 672.25256, "r": 74.221352, "b": 680.62717, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "Redundant Annotations", "bbox": {"l": 78.207001, "t": 672.29739, "r": 163.78357, "b": 680.63614, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": ": A fraction of the pages in the Do-", "bbox": {"l": 163.994, "t": 672.25256, "r": 295.56439, "b": 680.62717, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "cLayNet data set carry more than one human annotation.", "bbox": {"l": 78.207001, "t": 683.21156, "r": 295.42719, "b": 691.58617, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "$^{1}$https://developer.ibm.com/exchanges/data/all/doclaynet", "bbox": {"l": 53.672001, "t": 702.226364, "r": 216.02750000000003, "b": 708.739891, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "This enables experimentation with annotation uncertainty", "bbox": {"l": 342.095, "t": 87.36352999999997, "r": 558.43201, "b": 95.73816, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "and quality control analysis.", "bbox": {"l": 342.36401, "t": 98.32250999999997, "r": 445.83629999999994, "b": 106.69713999999999, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "(5)", "bbox": {"l": 328.86502, "t": 109.28148999999996, "r": 338.37836, "b": 117.65612999999996, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Pre-defined Train-, Test- & Validation-set", "bbox": {"l": 342.36401, "t": 109.32641999999998, "r": 487.25296, "b": 117.66516000000001, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": ": Like DocBank, we", "bbox": {"l": 487.75900000000007, "t": 109.28156000000001, "r": 558.20294, "b": 117.65618999999992, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "provide fixed train-, test- & validation-sets to ensure propor-", "bbox": {"l": 342.36401, "t": 120.24054000000001, "r": 559.72101, "b": 128.61517000000003, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "tional representation of the class-labels. Further, we prevent", "bbox": {"l": 342.36401, "t": 131.19854999999995, "r": 558.20117, "b": 139.57317999999998, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "leakage of unique layouts across sets, which has a large effect", "bbox": {"l": 342.36401, "t": 142.15752999999995, "r": 558.20087, "b": 150.53216999999995, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "on model accuracy scores.", "bbox": {"l": 342.36401, "t": 153.11652000000004, "r": 438.0624399999999, "b": 161.49114999999995, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "All aspects outlined above are detailed in Section 3. In Section 4,", "bbox": {"l": 327.918, "t": 167.97551999999996, "r": 559.19031, "b": 176.35015999999996, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "we will elaborate on how we designed and executed this large-scale", "bbox": {"l": 317.62299, "t": 178.93451000000005, "r": 558.20422, "b": 187.30913999999996, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "human annotation campaign. We will also share key insights and", "bbox": {"l": 317.95499, "t": 189.89355, "r": 558.19763, "b": 198.26819, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "lessons learned that might prove helpful for other parties planning", "bbox": {"l": 317.95499, "t": 200.85253999999998, "r": 558.20612, "b": 209.22717, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "to set up annotation campaigns.", "bbox": {"l": 317.95499, "t": 211.81151999999997, "r": 434.94861, "b": 220.18615999999997, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "In Section 5, we will present baseline accuracy numbers for a", "bbox": {"l": 327.918, "t": 222.77057000000002, "r": 558.19836, "b": 231.14520000000005, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "variety of object detection methods (Faster R-CNN, Mask R-CNN", "bbox": {"l": 317.73099, "t": 233.72955000000002, "r": 558.1991, "b": 242.10419000000002, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "and YOLOv5) trained on DocLayNet. We further show how the", "bbox": {"l": 317.95499, "t": 244.68854, "r": 558.20416, "b": 253.06317, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "model performance is impacted by varying the DocLayNet dataset", "bbox": {"l": 317.95499, "t": 255.64752, "r": 558.20563, "b": 264.02216, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "size, reducing the label set and modifying the train/test-split. Last", "bbox": {"l": 317.95499, "t": 266.60553000000004, "r": 558.19861, "b": 274.98015999999996, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "but not least, we compare the performance of models trained on", "bbox": {"l": 317.95499, "t": 277.56458, "r": 558.20416, "b": 285.93918, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "PubLayNet, DocBank and DocLayNet and demonstrate that a model", "bbox": {"l": 317.95499, "t": 288.52353, "r": 558.20239, "b": 296.89816, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "trained on DocLayNet provides overall more robust layout recovery.", "bbox": {"l": 317.95499, "t": 299.48254, "r": 559.58197, "b": 307.85718, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "2", "bbox": {"l": 317.95499, "t": 321.20889, "r": 323.10388, "b": 331.51797, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "RELATED WORK", "bbox": {"l": 333.12115, "t": 321.20889, "r": 421.74411, "b": 331.51797, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "While early approaches in document-layout analysis used rule-", "bbox": {"l": 317.52499, "t": 346.3325500000001, "r": 559.71301, "b": 354.70717999999994, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "based algorithms and heuristics [8], the problem is lately addressed", "bbox": {"l": 317.95499, "t": 357.29153, "r": 558.20276, "b": 365.66617, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "with deep learning methods. The most common approach is to lever-", "bbox": {"l": 317.62299, "t": 368.25055, "r": 559.71564, "b": 376.62518, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "age object detection models [9-15]. In the last decade, the accuracy", "bbox": {"l": 317.95499, "t": 379.2095299999999, "r": 558.43365, "b": 387.58417, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "and speed of these models has increased dramatically. Furthermore,", "bbox": {"l": 317.95499, "t": 390.16855000000004, "r": 559.18658, "b": 398.54318, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "most state-of-the-art object detection methods can be trained and", "bbox": {"l": 317.95499, "t": 401.12753, "r": 558.20502, "b": 409.50217, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "applied with very little work, thanks to a standardisation effort", "bbox": {"l": 317.95499, "t": 412.08655, "r": 558.20422, "b": 420.46118, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "of the ground-truth data format [16] and common deep-learning", "bbox": {"l": 317.95499, "t": 423.04553, "r": 558.20477, "b": 431.4201699999999, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "frameworks [17]. Reference data sets such as PubLayNet [6] and", "bbox": {"l": 317.95499, "t": 434.00354, "r": 558.19952, "b": 442.37817, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "DocBank provide their data in the commonly accepted COCO for-", "bbox": {"l": 317.95499, "t": 444.96252, "r": 559.71613, "b": 453.33716, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "mat [16].", "bbox": {"l": 317.95499, "t": 455.92154, "r": 350.90652, "b": 464.29617, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "Lately, new types of ML models for document-layout analysis", "bbox": {"l": 327.918, "t": 466.88052, "r": 558.19824, "b": 475.25516, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "have emerged in the community [18-21]. These models do not", "bbox": {"l": 317.95499, "t": 477.83954, "r": 558.20551, "b": 486.21417, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "approach the problem of layout analysis purely based on an image", "bbox": {"l": 317.95499, "t": 488.79855, "r": 558.20575, "b": 497.17319, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "representation of the page, as computer vision methods do. Instead,", "bbox": {"l": 317.95499, "t": 499.75754, "r": 559.18646, "b": 508.13217, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "they combine the text tokens and image representation of a page", "bbox": {"l": 317.95499, "t": 510.71655, "r": 558.2002, "b": 519.09119, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "in order to obtain a segmentation. While the reported accuracies", "bbox": {"l": 317.95499, "t": 521.67554, "r": 558.20618, "b": 530.05017, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "appear to be promising, a broadly accepted data format which links", "bbox": {"l": 317.95499, "t": 532.63455, "r": 558.20239, "b": 541.00917, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "geometric and textual features has yet to establish.", "bbox": {"l": 317.95499, "t": 543.59355, "r": 503.32648, "b": 551.96817, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "3", "bbox": {"l": 317.95499, "t": 565.3199, "r": 322.97391, "b": 575.629, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "THE DOCLAYNET DATASET", "bbox": {"l": 332.73831, "t": 565.3199, "r": 477.45688, "b": 575.629, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "DocLayNet contains 80863 PDF pages. Among these, 7059 carry two", "bbox": {"l": 317.95499, "t": 590.4435599999999, "r": 558.20233, "b": 598.81818, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "instances of human annotations, and 1591 carry three. This amounts", "bbox": {"l": 317.95499, "t": 601.40256, "r": 558.20239, "b": 609.77718, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "to 91104 total annotation instances. The annotations provide lay-", "bbox": {"l": 317.95499, "t": 612.36055, "r": 559.7132, "b": 620.73517, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "out information in the shape of labeled, rectangular bounding-", "bbox": {"l": 317.95499, "t": 623.3195499999999, "r": 559.71313, "b": 631.69417, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "boxes. We define 11 distinct labels for layout features, namely", "bbox": {"l": 317.95499, "t": 634.27855, "r": 539.92047, "b": 642.65317, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "Cap-", "bbox": {"l": 542.15802, "t": 634.32338, "r": 559.09888, "b": 642.66214, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "tion", "bbox": {"l": 317.95499, "t": 645.28238, "r": 331.86273, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": ",", "bbox": {"l": 331.86301, "t": 645.23755, "r": 333.83957, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "Footnote", "bbox": {"l": 336.064, "t": 645.28238, "r": 366.05368, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": ",", "bbox": {"l": 366.05301, "t": 645.23755, "r": 368.02957, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "Formula", "bbox": {"l": 370.254, "t": 645.28238, "r": 400.05502, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": ",", "bbox": {"l": 400.05499, "t": 645.23755, "r": 402.03156, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "List-item", "bbox": {"l": 404.25601, "t": 645.28238, "r": 436.19531, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": ",", "bbox": {"l": 436.19501, "t": 645.23755, "r": 438.17157, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "Page-footer", "bbox": {"l": 440.396, "t": 645.28238, "r": 480.60988999999995, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": ",", "bbox": {"l": 480.60999, "t": 645.23755, "r": 482.58655000000005, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "Page-header", "bbox": {"l": 484.811, "t": 645.28238, "r": 528.37604, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": ",", "bbox": {"l": 528.375, "t": 645.23755, "r": 530.35156, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "Picture", "bbox": {"l": 532.57599, "t": 645.28238, "r": 557.211, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": ",", "bbox": {"l": 557.211, "t": 645.23755, "r": 559.18756, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "Section-header", "bbox": {"l": 317.95499, "t": 656.2413799999999, "r": 368.78821, "b": 664.58013, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": ",", "bbox": {"l": 368.789, "t": 656.19655, "r": 370.72217, "b": 664.5711699999999, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "Table", "bbox": {"l": 372.89999, "t": 656.2413799999999, "r": 391.57254, "b": 664.58013, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": ",", "bbox": {"l": 391.573, "t": 656.19655, "r": 393.50616, "b": 664.5711699999999, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "Text", "bbox": {"l": 395.68399, "t": 656.2413799999999, "r": 410.23538, "b": 664.58013, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": ", and", "bbox": {"l": 410.23099, "t": 656.19655, "r": 427.5679, "b": 664.5711699999999, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "Title", "bbox": {"l": 429.74399, "t": 656.2413799999999, "r": 445.50800000000004, "b": 664.58013, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": ". Our reasoning for picking this", "bbox": {"l": 445.50800000000004, "t": 656.19655, "r": 558.20227, "b": 664.5711699999999, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "particular label set is detailed in Section 4.", "bbox": {"l": 317.95499, "t": 667.15556, "r": 472.22198, "b": 675.53017, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "In addition to open intellectual property constraints for the", "bbox": {"l": 327.918, "t": 678.11456, "r": 558.19843, "b": 686.4891700000001, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "source documents, we required that the documents in DocLayNet", "bbox": {"l": 317.95499, "t": 689.07355, "r": 558.19867, "b": 697.448174, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "adhere to a few conditions. Firstly, we kept scanned documents", "bbox": {"l": 317.95499, "t": 700.032555, "r": 558.2041, "b": 708.4071730000001, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 19, "label": "page_header", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.7682235836982727, "cells": [{"id": 0, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 246.24382, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar", "bbox": {"l": 253.13897999999998, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "section_header", "bbox": {"l": 53.79800000000001, "t": 85.85986000000003, "r": 156.52899, "b": 96.16900999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9367801547050476, "cells": [{"id": 2, "text": "1", "bbox": {"l": 53.79800000000001, "t": 85.85986000000003, "r": 59.427395, "b": 96.16900999999996, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "INTRODUCTION", "bbox": {"l": 70.379532, "t": 85.85986000000003, "r": 156.52899, "b": 96.16900999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "text", "bbox": {"l": 53.528999, "t": 110.98352, "r": 303.01697, "b": 228.94714, "coord_origin": "TOPLEFT"}, "confidence": 0.9802607893943787, "cells": [{"id": 4, "text": "Despite the substantial improvements achieved with machine-learning", "bbox": {"l": 53.79800000000001, "t": 110.98352, "r": 303.01697, "b": 119.35815000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "(ML) approaches and deep neural networks in recent years, docu-", "bbox": {"l": 53.528999, "t": 121.94256999999993, "r": 295.55695, "b": 130.31719999999996, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "ment conversion remains a challenging problem, as demonstrated", "bbox": {"l": 53.79800000000001, "t": 132.90155000000004, "r": 294.04642, "b": 141.27617999999995, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "by the numerous public competitions held on this topic [1-4]. The", "bbox": {"l": 53.79800000000001, "t": 143.85956, "r": 294.04733, "b": 152.23419, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "challenge originates from the huge variability in PDF documents", "bbox": {"l": 53.79800000000001, "t": 154.81853999999998, "r": 294.04349, "b": 163.19317999999998, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "regarding layout, language and formats (scanned, programmatic", "bbox": {"l": 53.79800000000001, "t": 165.77752999999996, "r": 294.04718, "b": 174.15215999999998, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "or a combination of both). Engineering a single ML model that can", "bbox": {"l": 53.79800000000001, "t": 176.73650999999995, "r": 294.04919, "b": 185.11114999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "be applied on all types of documents and provides high-quality", "bbox": {"l": 53.79800000000001, "t": 187.69556, "r": 294.27573, "b": 196.07019000000003, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "layout segmentation remains to this day extremely challenging [5].", "bbox": {"l": 53.79800000000001, "t": 198.65454, "r": 295.42569, "b": 207.02917000000002, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "To highlight the variability in document layouts, we show a few", "bbox": {"l": 53.528999, "t": 209.61352999999997, "r": 294.37256, "b": 217.98816, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "example documents from the DocLayNet dataset in Figure 1.", "bbox": {"l": 53.79800000000001, "t": 220.57250999999997, "r": 275.48334, "b": 228.94714, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "text", "bbox": {"l": 53.528999, "t": 231.53156, "r": 295.56412, "b": 502.91916, "coord_origin": "TOPLEFT"}, "confidence": 0.9793015718460083, "cells": [{"id": 15, "text": "A key problem in the process of document conversion is to under-", "bbox": {"l": 63.76100199999999, "t": 231.53156, "r": 295.564, "b": 239.90619000000004, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "stand the structure of a single document page, i.e. which segments", "bbox": {"l": 53.79800000000001, "t": 242.49054, "r": 294.04868, "b": 250.86517000000003, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "of text should be grouped together in a unit. To train models for this", "bbox": {"l": 53.79800000000001, "t": 253.44854999999995, "r": 294.04532, "b": 261.82318, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "task, there are currently two large datasets available to the com-", "bbox": {"l": 53.79800000000001, "t": 264.40752999999995, "r": 295.55618, "b": 272.78216999999995, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "munity, PubLayNet [6] and DocBank [7]. They were introduced", "bbox": {"l": 53.79800000000001, "t": 275.36658, "r": 294.04059, "b": 283.74118, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "in 2019 and 2020 respectively and significantly accelerated the im-", "bbox": {"l": 53.79800000000001, "t": 286.32552999999996, "r": 295.55783, "b": 294.70016, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "plementation of layout detection and segmentation models due to", "bbox": {"l": 53.79800000000001, "t": 297.28455, "r": 294.04538, "b": 305.65918000000005, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "their sizes of 300K and 500K ground-truth pages. These sizes were", "bbox": {"l": 53.79800000000001, "t": 308.24353, "r": 294.043, "b": 316.61816, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "achieved by leveraging an automation approach. The benefit of au-", "bbox": {"l": 53.79800000000001, "t": 319.20255, "r": 295.56412, "b": 327.57718, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "tomated ground-truth generation is obvious: one can generate large", "bbox": {"l": 53.79800000000001, "t": 330.16153, "r": 294.04532, "b": 338.53616, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "ground-truth datasets at virtually no cost. However, the automation", "bbox": {"l": 53.79800000000001, "t": 341.12054, "r": 294.04538, "b": 349.49518, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "introduces a constraint on the variability in the dataset, because", "bbox": {"l": 53.79800000000001, "t": 352.07953, "r": 294.04712, "b": 360.45416000000006, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "corresponding structured source data must be available. PubLayNet", "bbox": {"l": 53.79800000000001, "t": 363.03853999999995, "r": 294.04538, "b": 371.41318, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "and DocBank were both generated from scientific document repos-", "bbox": {"l": 53.79800000000001, "t": 373.99655, "r": 295.55643, "b": 382.37119, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "itories (PubMed and arXiv), which provide XML or L", "bbox": {"l": 53.79800000000001, "t": 384.95554, "r": 246.75909, "b": 393.33017, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "A", "bbox": {"l": 243.53101000000004, "t": 385.03183000000007, "r": 248.58553000000003, "b": 391.82455, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "T", "bbox": {"l": 247.24099999999999, "t": 384.95554, "r": 252.58859, "b": 393.33017, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "E", "bbox": {"l": 251.09398999999996, "t": 386.87954999999994, "r": 256.08829, "b": 395.25418, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "X", "bbox": {"l": 254.967, "t": 384.95554, "r": 261.33725, "b": 393.33017, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "sources.", "bbox": {"l": 263.75021, "t": 384.95554, "r": 295.42773, "b": 393.33017, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "Those scientific documents present a limited variability in their", "bbox": {"l": 53.528999, "t": 395.91455, "r": 294.21713, "b": 404.28918, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "layouts, because they are typeset in uniform templates provided by", "bbox": {"l": 53.79800000000001, "t": 406.87354, "r": 294.27386, "b": 415.24817, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "the publishers. Obviously, documents such as technical manuals,", "bbox": {"l": 53.79800000000001, "t": 417.8325500000001, "r": 295.03488, "b": 426.20717999999994, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "annual company reports, legal text, government tenders, etc. have", "bbox": {"l": 53.79800000000001, "t": 428.79153, "r": 294.04691, "b": 437.16617, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "very different and partially unique layouts. As a consequence, the", "bbox": {"l": 53.57400100000001, "t": 439.75055, "r": 294.04865, "b": 448.12518, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "layout predictions obtained from models trained on PubLayNet or", "bbox": {"l": 53.79800000000001, "t": 450.7095299999999, "r": 294.21643, "b": 459.08417, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "DocBank is very reasonable when applied on scientific documents.", "bbox": {"l": 53.79800000000001, "t": 461.66855, "r": 295.42181, "b": 470.04318, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "However, for more", "bbox": {"l": 53.79800000000001, "t": 472.62753, "r": 125.52795, "b": 481.00217, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "artistic", "bbox": {"l": 128.608, "t": 472.67239, "r": 153.7679, "b": 481.01114, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "or", "bbox": {"l": 157.15199, "t": 472.62753, "r": 165.16365, "b": 481.00217, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "free-style", "bbox": {"l": 168.248, "t": 472.67239, "r": 201.49272, "b": 481.01114, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "layouts, we see sub-par", "bbox": {"l": 204.78799, "t": 472.62753, "r": 294.21494, "b": 481.00217, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "prediction quality from these models, which we demonstrate in", "bbox": {"l": 53.79800000000001, "t": 483.58554, "r": 294.04715, "b": 491.96017, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Section 5.", "bbox": {"l": 53.79800000000001, "t": 494.54453, "r": 89.080788, "b": 502.91916, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "text", "bbox": {"l": 53.591999, "t": 505.50354, "r": 295.56396, "b": 579.63217, "coord_origin": "TOPLEFT"}, "confidence": 0.9795253276824951, "cells": [{"id": 49, "text": "In this paper, we present the DocLayNet dataset. It provides page-", "bbox": {"l": 63.76100199999999, "t": 505.50354, "r": 295.56396, "b": 513.87817, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "by-page layout annotation ground-truth using bounding-boxes for", "bbox": {"l": 53.79800000000001, "t": 516.46252, "r": 294.21271, "b": 524.83716, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "11", "bbox": {"l": 53.591999, "t": 527.42154, "r": 61.92275599999999, "b": 535.7961700000001, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "distinct class labels on 80863 unique document pages, of which", "bbox": {"l": 64.162201, "t": 527.42154, "r": 294.04626, "b": 535.7961700000001, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "a fraction carry double- or triple-annotations. DocLayNet is similar", "bbox": {"l": 53.79800000000001, "t": 538.38055, "r": 294.21228, "b": 546.75517, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "in spirit to PubLayNet and DocBank and will likewise be made", "bbox": {"l": 53.79800000000001, "t": 549.33955, "r": 294.04709, "b": 557.71417, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "available to the public", "bbox": {"l": 53.79800000000001, "t": 560.29855, "r": 134.28951, "b": 568.67317, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "1", "bbox": {"l": 134.29201, "t": 558.23083, "r": 137.67381, "b": 565.0235299999999, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "in order to stimulate the document-layout", "bbox": {"l": 140.418, "t": 560.29855, "r": 294.047, "b": 568.67317, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "analysis community. It distinguishes itself in the following aspects:", "bbox": {"l": 53.79800000000001, "t": 571.25755, "r": 295.10538, "b": 579.63217, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "list_item", "bbox": {"l": 64.708, "t": 584.58156, "r": 295.56165, "b": 614.87418, "coord_origin": "TOPLEFT"}, "confidence": 0.9687220454216003, "cells": [{"id": 59, "text": "(1)", "bbox": {"l": 64.708, "t": 584.58156, "r": 74.221352, "b": 592.95618, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Human Annotation", "bbox": {"l": 78.207001, "t": 584.62639, "r": 146.39589, "b": 592.96515, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": ": In contrast to PubLayNet and DocBank,", "bbox": {"l": 146.41701, "t": 584.58156, "r": 295.03036, "b": 592.95618, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "we relied on human annotation instead of automation ap-", "bbox": {"l": 77.875, "t": 595.54056, "r": 295.56165, "b": 603.91518, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "proaches to generate the data set.", "bbox": {"l": 78.207001, "t": 606.49956, "r": 200.6432, "b": 614.87418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "list_item", "bbox": {"l": 64.708, "t": 617.45856, "r": 294.26254, "b": 636.79117, "coord_origin": "TOPLEFT"}, "confidence": 0.9594228267669678, "cells": [{"id": 64, "text": "(2)", "bbox": {"l": 64.708, "t": 617.45856, "r": 74.221352, "b": 625.8331800000001, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "Large Layout Variability", "bbox": {"l": 78.207001, "t": 617.50339, "r": 167.91745, "b": 625.84215, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": ": We include diverse and complex", "bbox": {"l": 168.33501, "t": 617.45856, "r": 294.26254, "b": 625.8331800000001, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "layouts from a large variety of public sources.", "bbox": {"l": 78.207001, "t": 628.41655, "r": 245.45726000000002, "b": 636.79117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "list_item", "bbox": {"l": 64.708, "t": 639.37555, "r": 294.68381, "b": 669.66817, "coord_origin": "TOPLEFT"}, "confidence": 0.9615103006362915, "cells": [{"id": 68, "text": "(3)", "bbox": {"l": 64.708, "t": 639.37555, "r": 74.221352, "b": 647.75017, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "Detailed Label Set", "bbox": {"l": 78.207001, "t": 639.42038, "r": 143.51663, "b": 647.75914, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": ": We define 11 class labels to distinguish", "bbox": {"l": 144.02, "t": 639.37555, "r": 294.04648, "b": 647.75017, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "layout features in high detail. PubLayNet provides 5 labels;", "bbox": {"l": 78.207001, "t": 650.33455, "r": 294.68381, "b": 658.70917, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "DocBank provides 13, although not a superset of ours.", "bbox": {"l": 78.207001, "t": 661.29355, "r": 276.33752, "b": 669.66817, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "list_item", "bbox": {"l": 64.708, "t": 672.25256, "r": 295.56439, "b": 691.58617, "coord_origin": "TOPLEFT"}, "confidence": 0.9447500109672546, "cells": [{"id": 73, "text": "(4)", "bbox": {"l": 64.708, "t": 672.25256, "r": 74.221352, "b": 680.62717, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "Redundant Annotations", "bbox": {"l": 78.207001, "t": 672.29739, "r": 163.78357, "b": 680.63614, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": ": A fraction of the pages in the Do-", "bbox": {"l": 163.994, "t": 672.25256, "r": 295.56439, "b": 680.62717, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "cLayNet data set carry more than one human annotation.", "bbox": {"l": 78.207001, "t": 683.21156, "r": 295.42719, "b": 691.58617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "footnote", "bbox": {"l": 53.672001, "t": 702.226364, "r": 216.02750000000003, "b": 708.739891, "coord_origin": "TOPLEFT"}, "confidence": 0.8584772348403931, "cells": [{"id": 77, "text": "$^{1}$https://developer.ibm.com/exchanges/data/all/doclaynet", "bbox": {"l": 53.672001, "t": 702.226364, "r": 216.02750000000003, "b": 708.739891, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 342.095, "t": 87.36352999999997, "r": 558.43201, "b": 106.69713999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.7997144460678101, "cells": [{"id": 78, "text": "This enables experimentation with annotation uncertainty", "bbox": {"l": 342.095, "t": 87.36352999999997, "r": 558.43201, "b": 95.73816, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "and quality control analysis.", "bbox": {"l": 342.36401, "t": 98.32250999999997, "r": 445.83629999999994, "b": 106.69713999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "list_item", "bbox": {"l": 328.86502, "t": 109.28148999999996, "r": 559.72101, "b": 161.49114999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9563500285148621, "cells": [{"id": 80, "text": "(5)", "bbox": {"l": 328.86502, "t": 109.28148999999996, "r": 338.37836, "b": 117.65612999999996, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Pre-defined Train-, Test- & Validation-set", "bbox": {"l": 342.36401, "t": 109.32641999999998, "r": 487.25296, "b": 117.66516000000001, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": ": Like DocBank, we", "bbox": {"l": 487.75900000000007, "t": 109.28156000000001, "r": 558.20294, "b": 117.65618999999992, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "provide fixed train-, test- & validation-sets to ensure propor-", "bbox": {"l": 342.36401, "t": 120.24054000000001, "r": 559.72101, "b": 128.61517000000003, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "tional representation of the class-labels. Further, we prevent", "bbox": {"l": 342.36401, "t": 131.19854999999995, "r": 558.20117, "b": 139.57317999999998, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "leakage of unique layouts across sets, which has a large effect", "bbox": {"l": 342.36401, "t": 142.15752999999995, "r": 558.20087, "b": 150.53216999999995, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "on model accuracy scores.", "bbox": {"l": 342.36401, "t": 153.11652000000004, "r": 438.0624399999999, "b": 161.49114999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "text", "bbox": {"l": 317.62299, "t": 167.97551999999996, "r": 559.19031, "b": 220.18615999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9813902974128723, "cells": [{"id": 87, "text": "All aspects outlined above are detailed in Section 3. In Section 4,", "bbox": {"l": 327.918, "t": 167.97551999999996, "r": 559.19031, "b": 176.35015999999996, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "we will elaborate on how we designed and executed this large-scale", "bbox": {"l": 317.62299, "t": 178.93451000000005, "r": 558.20422, "b": 187.30913999999996, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "human annotation campaign. We will also share key insights and", "bbox": {"l": 317.95499, "t": 189.89355, "r": 558.19763, "b": 198.26819, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "lessons learned that might prove helpful for other parties planning", "bbox": {"l": 317.95499, "t": 200.85253999999998, "r": 558.20612, "b": 209.22717, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "to set up annotation campaigns.", "bbox": {"l": 317.95499, "t": 211.81151999999997, "r": 434.94861, "b": 220.18615999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 317.73099, "t": 222.77057000000002, "r": 559.58197, "b": 307.85718, "coord_origin": "TOPLEFT"}, "confidence": 0.9844218492507935, "cells": [{"id": 92, "text": "In Section 5, we will present baseline accuracy numbers for a", "bbox": {"l": 327.918, "t": 222.77057000000002, "r": 558.19836, "b": 231.14520000000005, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "variety of object detection methods (Faster R-CNN, Mask R-CNN", "bbox": {"l": 317.73099, "t": 233.72955000000002, "r": 558.1991, "b": 242.10419000000002, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "and YOLOv5) trained on DocLayNet. We further show how the", "bbox": {"l": 317.95499, "t": 244.68854, "r": 558.20416, "b": 253.06317, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "model performance is impacted by varying the DocLayNet dataset", "bbox": {"l": 317.95499, "t": 255.64752, "r": 558.20563, "b": 264.02216, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "size, reducing the label set and modifying the train/test-split. Last", "bbox": {"l": 317.95499, "t": 266.60553000000004, "r": 558.19861, "b": 274.98015999999996, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "but not least, we compare the performance of models trained on", "bbox": {"l": 317.95499, "t": 277.56458, "r": 558.20416, "b": 285.93918, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "PubLayNet, DocBank and DocLayNet and demonstrate that a model", "bbox": {"l": 317.95499, "t": 288.52353, "r": 558.20239, "b": 296.89816, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "trained on DocLayNet provides overall more robust layout recovery.", "bbox": {"l": 317.95499, "t": 299.48254, "r": 559.58197, "b": 307.85718, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "section_header", "bbox": {"l": 317.95499, "t": 321.20889, "r": 421.74411, "b": 331.51797, "coord_origin": "TOPLEFT"}, "confidence": 0.9347459077835083, "cells": [{"id": 100, "text": "2", "bbox": {"l": 317.95499, "t": 321.20889, "r": 323.10388, "b": 331.51797, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "RELATED WORK", "bbox": {"l": 333.12115, "t": 321.20889, "r": 421.74411, "b": 331.51797, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 317.52499, "t": 346.3325500000001, "r": 559.71613, "b": 464.29617, "coord_origin": "TOPLEFT"}, "confidence": 0.9860379099845886, "cells": [{"id": 102, "text": "While early approaches in document-layout analysis used rule-", "bbox": {"l": 317.52499, "t": 346.3325500000001, "r": 559.71301, "b": 354.70717999999994, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "based algorithms and heuristics [8], the problem is lately addressed", "bbox": {"l": 317.95499, "t": 357.29153, "r": 558.20276, "b": 365.66617, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "with deep learning methods. The most common approach is to lever-", "bbox": {"l": 317.62299, "t": 368.25055, "r": 559.71564, "b": 376.62518, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "age object detection models [9-15]. In the last decade, the accuracy", "bbox": {"l": 317.95499, "t": 379.2095299999999, "r": 558.43365, "b": 387.58417, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "and speed of these models has increased dramatically. Furthermore,", "bbox": {"l": 317.95499, "t": 390.16855000000004, "r": 559.18658, "b": 398.54318, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "most state-of-the-art object detection methods can be trained and", "bbox": {"l": 317.95499, "t": 401.12753, "r": 558.20502, "b": 409.50217, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "applied with very little work, thanks to a standardisation effort", "bbox": {"l": 317.95499, "t": 412.08655, "r": 558.20422, "b": 420.46118, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "of the ground-truth data format [16] and common deep-learning", "bbox": {"l": 317.95499, "t": 423.04553, "r": 558.20477, "b": 431.4201699999999, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "frameworks [17]. Reference data sets such as PubLayNet [6] and", "bbox": {"l": 317.95499, "t": 434.00354, "r": 558.19952, "b": 442.37817, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "DocBank provide their data in the commonly accepted COCO for-", "bbox": {"l": 317.95499, "t": 444.96252, "r": 559.71613, "b": 453.33716, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "mat [16].", "bbox": {"l": 317.95499, "t": 455.92154, "r": 350.90652, "b": 464.29617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 317.95499, "t": 466.88052, "r": 559.18646, "b": 551.96817, "coord_origin": "TOPLEFT"}, "confidence": 0.9861046671867371, "cells": [{"id": 113, "text": "Lately, new types of ML models for document-layout analysis", "bbox": {"l": 327.918, "t": 466.88052, "r": 558.19824, "b": 475.25516, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "have emerged in the community [18-21]. These models do not", "bbox": {"l": 317.95499, "t": 477.83954, "r": 558.20551, "b": 486.21417, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "approach the problem of layout analysis purely based on an image", "bbox": {"l": 317.95499, "t": 488.79855, "r": 558.20575, "b": 497.17319, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "representation of the page, as computer vision methods do. Instead,", "bbox": {"l": 317.95499, "t": 499.75754, "r": 559.18646, "b": 508.13217, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "they combine the text tokens and image representation of a page", "bbox": {"l": 317.95499, "t": 510.71655, "r": 558.2002, "b": 519.09119, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "in order to obtain a segmentation. While the reported accuracies", "bbox": {"l": 317.95499, "t": 521.67554, "r": 558.20618, "b": 530.05017, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "appear to be promising, a broadly accepted data format which links", "bbox": {"l": 317.95499, "t": 532.63455, "r": 558.20239, "b": 541.00917, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "geometric and textual features has yet to establish.", "bbox": {"l": 317.95499, "t": 543.59355, "r": 503.32648, "b": 551.96817, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "section_header", "bbox": {"l": 317.95499, "t": 565.3199, "r": 477.45688, "b": 575.629, "coord_origin": "TOPLEFT"}, "confidence": 0.9331073760986328, "cells": [{"id": 121, "text": "3", "bbox": {"l": 317.95499, "t": 565.3199, "r": 322.97391, "b": 575.629, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "THE DOCLAYNET DATASET", "bbox": {"l": 332.73831, "t": 565.3199, "r": 477.45688, "b": 575.629, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 317.95499, "t": 590.4435599999999, "r": 559.7132, "b": 675.53017, "coord_origin": "TOPLEFT"}, "confidence": 0.9852980375289917, "cells": [{"id": 123, "text": "DocLayNet contains 80863 PDF pages. Among these, 7059 carry two", "bbox": {"l": 317.95499, "t": 590.4435599999999, "r": 558.20233, "b": 598.81818, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "instances of human annotations, and 1591 carry three. This amounts", "bbox": {"l": 317.95499, "t": 601.40256, "r": 558.20239, "b": 609.77718, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "to 91104 total annotation instances. The annotations provide lay-", "bbox": {"l": 317.95499, "t": 612.36055, "r": 559.7132, "b": 620.73517, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "out information in the shape of labeled, rectangular bounding-", "bbox": {"l": 317.95499, "t": 623.3195499999999, "r": 559.71313, "b": 631.69417, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "boxes. We define 11 distinct labels for layout features, namely", "bbox": {"l": 317.95499, "t": 634.27855, "r": 539.92047, "b": 642.65317, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "Cap-", "bbox": {"l": 542.15802, "t": 634.32338, "r": 559.09888, "b": 642.66214, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "tion", "bbox": {"l": 317.95499, "t": 645.28238, "r": 331.86273, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": ",", "bbox": {"l": 331.86301, "t": 645.23755, "r": 333.83957, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "Footnote", "bbox": {"l": 336.064, "t": 645.28238, "r": 366.05368, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": ",", "bbox": {"l": 366.05301, "t": 645.23755, "r": 368.02957, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "Formula", "bbox": {"l": 370.254, "t": 645.28238, "r": 400.05502, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": ",", "bbox": {"l": 400.05499, "t": 645.23755, "r": 402.03156, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "List-item", "bbox": {"l": 404.25601, "t": 645.28238, "r": 436.19531, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": ",", "bbox": {"l": 436.19501, "t": 645.23755, "r": 438.17157, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "Page-footer", "bbox": {"l": 440.396, "t": 645.28238, "r": 480.60988999999995, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": ",", "bbox": {"l": 480.60999, "t": 645.23755, "r": 482.58655000000005, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "Page-header", "bbox": {"l": 484.811, "t": 645.28238, "r": 528.37604, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": ",", "bbox": {"l": 528.375, "t": 645.23755, "r": 530.35156, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "Picture", "bbox": {"l": 532.57599, "t": 645.28238, "r": 557.211, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": ",", "bbox": {"l": 557.211, "t": 645.23755, "r": 559.18756, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "Section-header", "bbox": {"l": 317.95499, "t": 656.2413799999999, "r": 368.78821, "b": 664.58013, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": ",", "bbox": {"l": 368.789, "t": 656.19655, "r": 370.72217, "b": 664.5711699999999, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "Table", "bbox": {"l": 372.89999, "t": 656.2413799999999, "r": 391.57254, "b": 664.58013, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": ",", "bbox": {"l": 391.573, "t": 656.19655, "r": 393.50616, "b": 664.5711699999999, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "Text", "bbox": {"l": 395.68399, "t": 656.2413799999999, "r": 410.23538, "b": 664.58013, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": ", and", "bbox": {"l": 410.23099, "t": 656.19655, "r": 427.5679, "b": 664.5711699999999, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "Title", "bbox": {"l": 429.74399, "t": 656.2413799999999, "r": 445.50800000000004, "b": 664.58013, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": ". Our reasoning for picking this", "bbox": {"l": 445.50800000000004, "t": 656.19655, "r": 558.20227, "b": 664.5711699999999, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "particular label set is detailed in Section 4.", "bbox": {"l": 317.95499, "t": 667.15556, "r": 472.22198, "b": 675.53017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "text", "bbox": {"l": 317.95499, "t": 678.11456, "r": 558.2041, "b": 708.4071730000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9749757051467896, "cells": [{"id": 152, "text": "In addition to open intellectual property constraints for the", "bbox": {"l": 327.918, "t": 678.11456, "r": 558.19843, "b": 686.4891700000001, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "source documents, we required that the documents in DocLayNet", "bbox": {"l": 317.95499, "t": 689.07355, "r": 558.19867, "b": 697.448174, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "adhere to a few conditions. Firstly, we kept scanned documents", "bbox": {"l": 317.95499, "t": 700.032555, "r": 558.2041, "b": 708.4071730000001, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_header", "id": 19, "page_no": 1, "cluster": {"id": 19, "label": "page_header", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.7682235836982727, "cells": [{"id": 0, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 246.24382, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar", "bbox": {"l": 253.13897999999998, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar"}, {"label": "section_header", "id": 14, "page_no": 1, "cluster": {"id": 14, "label": "section_header", "bbox": {"l": 53.79800000000001, "t": 85.85986000000003, "r": 156.52899, "b": 96.16900999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9367801547050476, "cells": [{"id": 2, "text": "1", "bbox": {"l": 53.79800000000001, "t": 85.85986000000003, "r": 59.427395, "b": 96.16900999999996, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "INTRODUCTION", "bbox": {"l": 70.379532, "t": 85.85986000000003, "r": 156.52899, "b": 96.16900999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1 INTRODUCTION"}, {"label": "text", "id": 5, "page_no": 1, "cluster": {"id": 5, "label": "text", "bbox": {"l": 53.528999, "t": 110.98352, "r": 303.01697, "b": 228.94714, "coord_origin": "TOPLEFT"}, "confidence": 0.9802607893943787, "cells": [{"id": 4, "text": "Despite the substantial improvements achieved with machine-learning", "bbox": {"l": 53.79800000000001, "t": 110.98352, "r": 303.01697, "b": 119.35815000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "(ML) approaches and deep neural networks in recent years, docu-", "bbox": {"l": 53.528999, "t": 121.94256999999993, "r": 295.55695, "b": 130.31719999999996, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "ment conversion remains a challenging problem, as demonstrated", "bbox": {"l": 53.79800000000001, "t": 132.90155000000004, "r": 294.04642, "b": 141.27617999999995, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "by the numerous public competitions held on this topic [1-4]. The", "bbox": {"l": 53.79800000000001, "t": 143.85956, "r": 294.04733, "b": 152.23419, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "challenge originates from the huge variability in PDF documents", "bbox": {"l": 53.79800000000001, "t": 154.81853999999998, "r": 294.04349, "b": 163.19317999999998, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "regarding layout, language and formats (scanned, programmatic", "bbox": {"l": 53.79800000000001, "t": 165.77752999999996, "r": 294.04718, "b": 174.15215999999998, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "or a combination of both). Engineering a single ML model that can", "bbox": {"l": 53.79800000000001, "t": 176.73650999999995, "r": 294.04919, "b": 185.11114999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "be applied on all types of documents and provides high-quality", "bbox": {"l": 53.79800000000001, "t": 187.69556, "r": 294.27573, "b": 196.07019000000003, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "layout segmentation remains to this day extremely challenging [5].", "bbox": {"l": 53.79800000000001, "t": 198.65454, "r": 295.42569, "b": 207.02917000000002, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "To highlight the variability in document layouts, we show a few", "bbox": {"l": 53.528999, "t": 209.61352999999997, "r": 294.37256, "b": 217.98816, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "example documents from the DocLayNet dataset in Figure 1.", "bbox": {"l": 53.79800000000001, "t": 220.57250999999997, "r": 275.48334, "b": 228.94714, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Despite the substantial improvements achieved with machine-learning (ML) approaches and deep neural networks in recent years, document conversion remains a challenging problem, as demonstrated by the numerous public competitions held on this topic [1-4]. The challenge originates from the huge variability in PDF documents regarding layout, language and formats (scanned, programmatic or a combination of both). Engineering a single ML model that can be applied on all types of documents and provides high-quality layout segmentation remains to this day extremely challenging [5]. To highlight the variability in document layouts, we show a few example documents from the DocLayNet dataset in Figure 1."}, {"label": "text", "id": 7, "page_no": 1, "cluster": {"id": 7, "label": "text", "bbox": {"l": 53.528999, "t": 231.53156, "r": 295.56412, "b": 502.91916, "coord_origin": "TOPLEFT"}, "confidence": 0.9793015718460083, "cells": [{"id": 15, "text": "A key problem in the process of document conversion is to under-", "bbox": {"l": 63.76100199999999, "t": 231.53156, "r": 295.564, "b": 239.90619000000004, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "stand the structure of a single document page, i.e. which segments", "bbox": {"l": 53.79800000000001, "t": 242.49054, "r": 294.04868, "b": 250.86517000000003, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "of text should be grouped together in a unit. To train models for this", "bbox": {"l": 53.79800000000001, "t": 253.44854999999995, "r": 294.04532, "b": 261.82318, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "task, there are currently two large datasets available to the com-", "bbox": {"l": 53.79800000000001, "t": 264.40752999999995, "r": 295.55618, "b": 272.78216999999995, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "munity, PubLayNet [6] and DocBank [7]. They were introduced", "bbox": {"l": 53.79800000000001, "t": 275.36658, "r": 294.04059, "b": 283.74118, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "in 2019 and 2020 respectively and significantly accelerated the im-", "bbox": {"l": 53.79800000000001, "t": 286.32552999999996, "r": 295.55783, "b": 294.70016, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "plementation of layout detection and segmentation models due to", "bbox": {"l": 53.79800000000001, "t": 297.28455, "r": 294.04538, "b": 305.65918000000005, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "their sizes of 300K and 500K ground-truth pages. These sizes were", "bbox": {"l": 53.79800000000001, "t": 308.24353, "r": 294.043, "b": 316.61816, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "achieved by leveraging an automation approach. The benefit of au-", "bbox": {"l": 53.79800000000001, "t": 319.20255, "r": 295.56412, "b": 327.57718, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "tomated ground-truth generation is obvious: one can generate large", "bbox": {"l": 53.79800000000001, "t": 330.16153, "r": 294.04532, "b": 338.53616, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "ground-truth datasets at virtually no cost. However, the automation", "bbox": {"l": 53.79800000000001, "t": 341.12054, "r": 294.04538, "b": 349.49518, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "introduces a constraint on the variability in the dataset, because", "bbox": {"l": 53.79800000000001, "t": 352.07953, "r": 294.04712, "b": 360.45416000000006, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "corresponding structured source data must be available. PubLayNet", "bbox": {"l": 53.79800000000001, "t": 363.03853999999995, "r": 294.04538, "b": 371.41318, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "and DocBank were both generated from scientific document repos-", "bbox": {"l": 53.79800000000001, "t": 373.99655, "r": 295.55643, "b": 382.37119, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "itories (PubMed and arXiv), which provide XML or L", "bbox": {"l": 53.79800000000001, "t": 384.95554, "r": 246.75909, "b": 393.33017, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "A", "bbox": {"l": 243.53101000000004, "t": 385.03183000000007, "r": 248.58553000000003, "b": 391.82455, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "T", "bbox": {"l": 247.24099999999999, "t": 384.95554, "r": 252.58859, "b": 393.33017, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "E", "bbox": {"l": 251.09398999999996, "t": 386.87954999999994, "r": 256.08829, "b": 395.25418, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "X", "bbox": {"l": 254.967, "t": 384.95554, "r": 261.33725, "b": 393.33017, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "sources.", "bbox": {"l": 263.75021, "t": 384.95554, "r": 295.42773, "b": 393.33017, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "Those scientific documents present a limited variability in their", "bbox": {"l": 53.528999, "t": 395.91455, "r": 294.21713, "b": 404.28918, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "layouts, because they are typeset in uniform templates provided by", "bbox": {"l": 53.79800000000001, "t": 406.87354, "r": 294.27386, "b": 415.24817, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "the publishers. Obviously, documents such as technical manuals,", "bbox": {"l": 53.79800000000001, "t": 417.8325500000001, "r": 295.03488, "b": 426.20717999999994, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "annual company reports, legal text, government tenders, etc. have", "bbox": {"l": 53.79800000000001, "t": 428.79153, "r": 294.04691, "b": 437.16617, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "very different and partially unique layouts. As a consequence, the", "bbox": {"l": 53.57400100000001, "t": 439.75055, "r": 294.04865, "b": 448.12518, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "layout predictions obtained from models trained on PubLayNet or", "bbox": {"l": 53.79800000000001, "t": 450.7095299999999, "r": 294.21643, "b": 459.08417, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "DocBank is very reasonable when applied on scientific documents.", "bbox": {"l": 53.79800000000001, "t": 461.66855, "r": 295.42181, "b": 470.04318, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "However, for more", "bbox": {"l": 53.79800000000001, "t": 472.62753, "r": 125.52795, "b": 481.00217, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "artistic", "bbox": {"l": 128.608, "t": 472.67239, "r": 153.7679, "b": 481.01114, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "or", "bbox": {"l": 157.15199, "t": 472.62753, "r": 165.16365, "b": 481.00217, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "free-style", "bbox": {"l": 168.248, "t": 472.67239, "r": 201.49272, "b": 481.01114, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "layouts, we see sub-par", "bbox": {"l": 204.78799, "t": 472.62753, "r": 294.21494, "b": 481.00217, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "prediction quality from these models, which we demonstrate in", "bbox": {"l": 53.79800000000001, "t": 483.58554, "r": 294.04715, "b": 491.96017, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Section 5.", "bbox": {"l": 53.79800000000001, "t": 494.54453, "r": 89.080788, "b": 502.91916, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "A key problem in the process of document conversion is to understand the structure of a single document page, i.e. which segments of text should be grouped together in a unit. To train models for this task, there are currently two large datasets available to the community, PubLayNet [6] and DocBank [7]. They were introduced in 2019 and 2020 respectively and significantly accelerated the implementation of layout detection and segmentation models due to their sizes of 300K and 500K ground-truth pages. These sizes were achieved by leveraging an automation approach. The benefit of automated ground-truth generation is obvious: one can generate large ground-truth datasets at virtually no cost. However, the automation introduces a constraint on the variability in the dataset, because corresponding structured source data must be available. PubLayNet and DocBank were both generated from scientific document repositories (PubMed and arXiv), which provide XML or L A T E X sources. Those scientific documents present a limited variability in their layouts, because they are typeset in uniform templates provided by the publishers. Obviously, documents such as technical manuals, annual company reports, legal text, government tenders, etc. have very different and partially unique layouts. As a consequence, the layout predictions obtained from models trained on PubLayNet or DocBank is very reasonable when applied on scientific documents. However, for more artistic or free-style layouts, we see sub-par prediction quality from these models, which we demonstrate in Section 5."}, {"label": "text", "id": 6, "page_no": 1, "cluster": {"id": 6, "label": "text", "bbox": {"l": 53.591999, "t": 505.50354, "r": 295.56396, "b": 579.63217, "coord_origin": "TOPLEFT"}, "confidence": 0.9795253276824951, "cells": [{"id": 49, "text": "In this paper, we present the DocLayNet dataset. It provides page-", "bbox": {"l": 63.76100199999999, "t": 505.50354, "r": 295.56396, "b": 513.87817, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "by-page layout annotation ground-truth using bounding-boxes for", "bbox": {"l": 53.79800000000001, "t": 516.46252, "r": 294.21271, "b": 524.83716, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "11", "bbox": {"l": 53.591999, "t": 527.42154, "r": 61.92275599999999, "b": 535.7961700000001, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "distinct class labels on 80863 unique document pages, of which", "bbox": {"l": 64.162201, "t": 527.42154, "r": 294.04626, "b": 535.7961700000001, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "a fraction carry double- or triple-annotations. DocLayNet is similar", "bbox": {"l": 53.79800000000001, "t": 538.38055, "r": 294.21228, "b": 546.75517, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "in spirit to PubLayNet and DocBank and will likewise be made", "bbox": {"l": 53.79800000000001, "t": 549.33955, "r": 294.04709, "b": 557.71417, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "available to the public", "bbox": {"l": 53.79800000000001, "t": 560.29855, "r": 134.28951, "b": 568.67317, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "1", "bbox": {"l": 134.29201, "t": 558.23083, "r": 137.67381, "b": 565.0235299999999, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "in order to stimulate the document-layout", "bbox": {"l": 140.418, "t": 560.29855, "r": 294.047, "b": 568.67317, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "analysis community. It distinguishes itself in the following aspects:", "bbox": {"l": 53.79800000000001, "t": 571.25755, "r": 295.10538, "b": 579.63217, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In this paper, we present the DocLayNet dataset. It provides pageby-page layout annotation ground-truth using bounding-boxes for 11 distinct class labels on 80863 unique document pages, of which a fraction carry double- or triple-annotations. DocLayNet is similar in spirit to PubLayNet and DocBank and will likewise be made available to the public 1 in order to stimulate the document-layout analysis community. It distinguishes itself in the following aspects:"}, {"label": "list_item", "id": 9, "page_no": 1, "cluster": {"id": 9, "label": "list_item", "bbox": {"l": 64.708, "t": 584.58156, "r": 295.56165, "b": 614.87418, "coord_origin": "TOPLEFT"}, "confidence": 0.9687220454216003, "cells": [{"id": 59, "text": "(1)", "bbox": {"l": 64.708, "t": 584.58156, "r": 74.221352, "b": 592.95618, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Human Annotation", "bbox": {"l": 78.207001, "t": 584.62639, "r": 146.39589, "b": 592.96515, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": ": In contrast to PubLayNet and DocBank,", "bbox": {"l": 146.41701, "t": 584.58156, "r": 295.03036, "b": 592.95618, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "we relied on human annotation instead of automation ap-", "bbox": {"l": 77.875, "t": 595.54056, "r": 295.56165, "b": 603.91518, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "proaches to generate the data set.", "bbox": {"l": 78.207001, "t": 606.49956, "r": 200.6432, "b": 614.87418, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "(1) Human Annotation : In contrast to PubLayNet and DocBank, we relied on human annotation instead of automation approaches to generate the data set."}, {"label": "list_item", "id": 11, "page_no": 1, "cluster": {"id": 11, "label": "list_item", "bbox": {"l": 64.708, "t": 617.45856, "r": 294.26254, "b": 636.79117, "coord_origin": "TOPLEFT"}, "confidence": 0.9594228267669678, "cells": [{"id": 64, "text": "(2)", "bbox": {"l": 64.708, "t": 617.45856, "r": 74.221352, "b": 625.8331800000001, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "Large Layout Variability", "bbox": {"l": 78.207001, "t": 617.50339, "r": 167.91745, "b": 625.84215, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": ": We include diverse and complex", "bbox": {"l": 168.33501, "t": 617.45856, "r": 294.26254, "b": 625.8331800000001, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "layouts from a large variety of public sources.", "bbox": {"l": 78.207001, "t": 628.41655, "r": 245.45726000000002, "b": 636.79117, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "(2) Large Layout Variability : We include diverse and complex layouts from a large variety of public sources."}, {"label": "list_item", "id": 10, "page_no": 1, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 64.708, "t": 639.37555, "r": 294.68381, "b": 669.66817, "coord_origin": "TOPLEFT"}, "confidence": 0.9615103006362915, "cells": [{"id": 68, "text": "(3)", "bbox": {"l": 64.708, "t": 639.37555, "r": 74.221352, "b": 647.75017, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "Detailed Label Set", "bbox": {"l": 78.207001, "t": 639.42038, "r": 143.51663, "b": 647.75914, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": ": We define 11 class labels to distinguish", "bbox": {"l": 144.02, "t": 639.37555, "r": 294.04648, "b": 647.75017, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "layout features in high detail. PubLayNet provides 5 labels;", "bbox": {"l": 78.207001, "t": 650.33455, "r": 294.68381, "b": 658.70917, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "DocBank provides 13, although not a superset of ours.", "bbox": {"l": 78.207001, "t": 661.29355, "r": 276.33752, "b": 669.66817, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "(3) Detailed Label Set : We define 11 class labels to distinguish layout features in high detail. PubLayNet provides 5 labels; DocBank provides 13, although not a superset of ours."}, {"label": "list_item", "id": 13, "page_no": 1, "cluster": {"id": 13, "label": "list_item", "bbox": {"l": 64.708, "t": 672.25256, "r": 295.56439, "b": 691.58617, "coord_origin": "TOPLEFT"}, "confidence": 0.9447500109672546, "cells": [{"id": 73, "text": "(4)", "bbox": {"l": 64.708, "t": 672.25256, "r": 74.221352, "b": 680.62717, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "Redundant Annotations", "bbox": {"l": 78.207001, "t": 672.29739, "r": 163.78357, "b": 680.63614, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": ": A fraction of the pages in the Do-", "bbox": {"l": 163.994, "t": 672.25256, "r": 295.56439, "b": 680.62717, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "cLayNet data set carry more than one human annotation.", "bbox": {"l": 78.207001, "t": 683.21156, "r": 295.42719, "b": 691.58617, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "(4) Redundant Annotations : A fraction of the pages in the DocLayNet data set carry more than one human annotation."}, {"label": "footnote", "id": 17, "page_no": 1, "cluster": {"id": 17, "label": "footnote", "bbox": {"l": 53.672001, "t": 702.226364, "r": 216.02750000000003, "b": 708.739891, "coord_origin": "TOPLEFT"}, "confidence": 0.8584772348403931, "cells": [{"id": 77, "text": "$^{1}$https://developer.ibm.com/exchanges/data/all/doclaynet", "bbox": {"l": 53.672001, "t": 702.226364, "r": 216.02750000000003, "b": 708.739891, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "$^{1}$https://developer.ibm.com/exchanges/data/all/doclaynet"}, {"label": "text", "id": 18, "page_no": 1, "cluster": {"id": 18, "label": "text", "bbox": {"l": 342.095, "t": 87.36352999999997, "r": 558.43201, "b": 106.69713999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.7997144460678101, "cells": [{"id": 78, "text": "This enables experimentation with annotation uncertainty", "bbox": {"l": 342.095, "t": 87.36352999999997, "r": 558.43201, "b": 95.73816, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "and quality control analysis.", "bbox": {"l": 342.36401, "t": 98.32250999999997, "r": 445.83629999999994, "b": 106.69713999999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "This enables experimentation with annotation uncertainty and quality control analysis."}, {"label": "list_item", "id": 12, "page_no": 1, "cluster": {"id": 12, "label": "list_item", "bbox": {"l": 328.86502, "t": 109.28148999999996, "r": 559.72101, "b": 161.49114999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9563500285148621, "cells": [{"id": 80, "text": "(5)", "bbox": {"l": 328.86502, "t": 109.28148999999996, "r": 338.37836, "b": 117.65612999999996, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Pre-defined Train-, Test- & Validation-set", "bbox": {"l": 342.36401, "t": 109.32641999999998, "r": 487.25296, "b": 117.66516000000001, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": ": Like DocBank, we", "bbox": {"l": 487.75900000000007, "t": 109.28156000000001, "r": 558.20294, "b": 117.65618999999992, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "provide fixed train-, test- & validation-sets to ensure propor-", "bbox": {"l": 342.36401, "t": 120.24054000000001, "r": 559.72101, "b": 128.61517000000003, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "tional representation of the class-labels. Further, we prevent", "bbox": {"l": 342.36401, "t": 131.19854999999995, "r": 558.20117, "b": 139.57317999999998, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "leakage of unique layouts across sets, which has a large effect", "bbox": {"l": 342.36401, "t": 142.15752999999995, "r": 558.20087, "b": 150.53216999999995, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "on model accuracy scores.", "bbox": {"l": 342.36401, "t": 153.11652000000004, "r": 438.0624399999999, "b": 161.49114999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "(5) Pre-defined Train-, Test- & Validation-set : Like DocBank, we provide fixed train-, test- & validation-sets to ensure proportional representation of the class-labels. Further, we prevent leakage of unique layouts across sets, which has a large effect on model accuracy scores."}, {"label": "text", "id": 4, "page_no": 1, "cluster": {"id": 4, "label": "text", "bbox": {"l": 317.62299, "t": 167.97551999999996, "r": 559.19031, "b": 220.18615999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9813902974128723, "cells": [{"id": 87, "text": "All aspects outlined above are detailed in Section 3. In Section 4,", "bbox": {"l": 327.918, "t": 167.97551999999996, "r": 559.19031, "b": 176.35015999999996, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "we will elaborate on how we designed and executed this large-scale", "bbox": {"l": 317.62299, "t": 178.93451000000005, "r": 558.20422, "b": 187.30913999999996, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "human annotation campaign. We will also share key insights and", "bbox": {"l": 317.95499, "t": 189.89355, "r": 558.19763, "b": 198.26819, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "lessons learned that might prove helpful for other parties planning", "bbox": {"l": 317.95499, "t": 200.85253999999998, "r": 558.20612, "b": 209.22717, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "to set up annotation campaigns.", "bbox": {"l": 317.95499, "t": 211.81151999999997, "r": 434.94861, "b": 220.18615999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "All aspects outlined above are detailed in Section 3. In Section 4, we will elaborate on how we designed and executed this large-scale human annotation campaign. We will also share key insights and lessons learned that might prove helpful for other parties planning to set up annotation campaigns."}, {"label": "text", "id": 3, "page_no": 1, "cluster": {"id": 3, "label": "text", "bbox": {"l": 317.73099, "t": 222.77057000000002, "r": 559.58197, "b": 307.85718, "coord_origin": "TOPLEFT"}, "confidence": 0.9844218492507935, "cells": [{"id": 92, "text": "In Section 5, we will present baseline accuracy numbers for a", "bbox": {"l": 327.918, "t": 222.77057000000002, "r": 558.19836, "b": 231.14520000000005, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "variety of object detection methods (Faster R-CNN, Mask R-CNN", "bbox": {"l": 317.73099, "t": 233.72955000000002, "r": 558.1991, "b": 242.10419000000002, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "and YOLOv5) trained on DocLayNet. We further show how the", "bbox": {"l": 317.95499, "t": 244.68854, "r": 558.20416, "b": 253.06317, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "model performance is impacted by varying the DocLayNet dataset", "bbox": {"l": 317.95499, "t": 255.64752, "r": 558.20563, "b": 264.02216, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "size, reducing the label set and modifying the train/test-split. Last", "bbox": {"l": 317.95499, "t": 266.60553000000004, "r": 558.19861, "b": 274.98015999999996, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "but not least, we compare the performance of models trained on", "bbox": {"l": 317.95499, "t": 277.56458, "r": 558.20416, "b": 285.93918, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "PubLayNet, DocBank and DocLayNet and demonstrate that a model", "bbox": {"l": 317.95499, "t": 288.52353, "r": 558.20239, "b": 296.89816, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "trained on DocLayNet provides overall more robust layout recovery.", "bbox": {"l": 317.95499, "t": 299.48254, "r": 559.58197, "b": 307.85718, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In Section 5, we will present baseline accuracy numbers for a variety of object detection methods (Faster R-CNN, Mask R-CNN and YOLOv5) trained on DocLayNet. We further show how the model performance is impacted by varying the DocLayNet dataset size, reducing the label set and modifying the train/test-split. Last but not least, we compare the performance of models trained on PubLayNet, DocBank and DocLayNet and demonstrate that a model trained on DocLayNet provides overall more robust layout recovery."}, {"label": "section_header", "id": 15, "page_no": 1, "cluster": {"id": 15, "label": "section_header", "bbox": {"l": 317.95499, "t": 321.20889, "r": 421.74411, "b": 331.51797, "coord_origin": "TOPLEFT"}, "confidence": 0.9347459077835083, "cells": [{"id": 100, "text": "2", "bbox": {"l": 317.95499, "t": 321.20889, "r": 323.10388, "b": 331.51797, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "RELATED WORK", "bbox": {"l": 333.12115, "t": 321.20889, "r": 421.74411, "b": 331.51797, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2 RELATED WORK"}, {"label": "text", "id": 1, "page_no": 1, "cluster": {"id": 1, "label": "text", "bbox": {"l": 317.52499, "t": 346.3325500000001, "r": 559.71613, "b": 464.29617, "coord_origin": "TOPLEFT"}, "confidence": 0.9860379099845886, "cells": [{"id": 102, "text": "While early approaches in document-layout analysis used rule-", "bbox": {"l": 317.52499, "t": 346.3325500000001, "r": 559.71301, "b": 354.70717999999994, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "based algorithms and heuristics [8], the problem is lately addressed", "bbox": {"l": 317.95499, "t": 357.29153, "r": 558.20276, "b": 365.66617, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "with deep learning methods. The most common approach is to lever-", "bbox": {"l": 317.62299, "t": 368.25055, "r": 559.71564, "b": 376.62518, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "age object detection models [9-15]. In the last decade, the accuracy", "bbox": {"l": 317.95499, "t": 379.2095299999999, "r": 558.43365, "b": 387.58417, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "and speed of these models has increased dramatically. Furthermore,", "bbox": {"l": 317.95499, "t": 390.16855000000004, "r": 559.18658, "b": 398.54318, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "most state-of-the-art object detection methods can be trained and", "bbox": {"l": 317.95499, "t": 401.12753, "r": 558.20502, "b": 409.50217, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "applied with very little work, thanks to a standardisation effort", "bbox": {"l": 317.95499, "t": 412.08655, "r": 558.20422, "b": 420.46118, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "of the ground-truth data format [16] and common deep-learning", "bbox": {"l": 317.95499, "t": 423.04553, "r": 558.20477, "b": 431.4201699999999, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "frameworks [17]. Reference data sets such as PubLayNet [6] and", "bbox": {"l": 317.95499, "t": 434.00354, "r": 558.19952, "b": 442.37817, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "DocBank provide their data in the commonly accepted COCO for-", "bbox": {"l": 317.95499, "t": 444.96252, "r": 559.71613, "b": 453.33716, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "mat [16].", "bbox": {"l": 317.95499, "t": 455.92154, "r": 350.90652, "b": 464.29617, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "While early approaches in document-layout analysis used rulebased algorithms and heuristics [8], the problem is lately addressed with deep learning methods. The most common approach is to leverage object detection models [9-15]. In the last decade, the accuracy and speed of these models has increased dramatically. Furthermore, most state-of-the-art object detection methods can be trained and applied with very little work, thanks to a standardisation effort of the ground-truth data format [16] and common deep-learning frameworks [17]. Reference data sets such as PubLayNet [6] and DocBank provide their data in the commonly accepted COCO format [16]."}, {"label": "text", "id": 0, "page_no": 1, "cluster": {"id": 0, "label": "text", "bbox": {"l": 317.95499, "t": 466.88052, "r": 559.18646, "b": 551.96817, "coord_origin": "TOPLEFT"}, "confidence": 0.9861046671867371, "cells": [{"id": 113, "text": "Lately, new types of ML models for document-layout analysis", "bbox": {"l": 327.918, "t": 466.88052, "r": 558.19824, "b": 475.25516, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "have emerged in the community [18-21]. These models do not", "bbox": {"l": 317.95499, "t": 477.83954, "r": 558.20551, "b": 486.21417, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "approach the problem of layout analysis purely based on an image", "bbox": {"l": 317.95499, "t": 488.79855, "r": 558.20575, "b": 497.17319, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "representation of the page, as computer vision methods do. Instead,", "bbox": {"l": 317.95499, "t": 499.75754, "r": 559.18646, "b": 508.13217, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "they combine the text tokens and image representation of a page", "bbox": {"l": 317.95499, "t": 510.71655, "r": 558.2002, "b": 519.09119, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "in order to obtain a segmentation. While the reported accuracies", "bbox": {"l": 317.95499, "t": 521.67554, "r": 558.20618, "b": 530.05017, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "appear to be promising, a broadly accepted data format which links", "bbox": {"l": 317.95499, "t": 532.63455, "r": 558.20239, "b": 541.00917, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "geometric and textual features has yet to establish.", "bbox": {"l": 317.95499, "t": 543.59355, "r": 503.32648, "b": 551.96817, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Lately, new types of ML models for document-layout analysis have emerged in the community [18-21]. These models do not approach the problem of layout analysis purely based on an image representation of the page, as computer vision methods do. Instead, they combine the text tokens and image representation of a page in order to obtain a segmentation. While the reported accuracies appear to be promising, a broadly accepted data format which links geometric and textual features has yet to establish."}, {"label": "section_header", "id": 16, "page_no": 1, "cluster": {"id": 16, "label": "section_header", "bbox": {"l": 317.95499, "t": 565.3199, "r": 477.45688, "b": 575.629, "coord_origin": "TOPLEFT"}, "confidence": 0.9331073760986328, "cells": [{"id": 121, "text": "3", "bbox": {"l": 317.95499, "t": 565.3199, "r": 322.97391, "b": 575.629, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "THE DOCLAYNET DATASET", "bbox": {"l": 332.73831, "t": 565.3199, "r": 477.45688, "b": 575.629, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3 THE DOCLAYNET DATASET"}, {"label": "text", "id": 2, "page_no": 1, "cluster": {"id": 2, "label": "text", "bbox": {"l": 317.95499, "t": 590.4435599999999, "r": 559.7132, "b": 675.53017, "coord_origin": "TOPLEFT"}, "confidence": 0.9852980375289917, "cells": [{"id": 123, "text": "DocLayNet contains 80863 PDF pages. Among these, 7059 carry two", "bbox": {"l": 317.95499, "t": 590.4435599999999, "r": 558.20233, "b": 598.81818, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "instances of human annotations, and 1591 carry three. This amounts", "bbox": {"l": 317.95499, "t": 601.40256, "r": 558.20239, "b": 609.77718, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "to 91104 total annotation instances. The annotations provide lay-", "bbox": {"l": 317.95499, "t": 612.36055, "r": 559.7132, "b": 620.73517, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "out information in the shape of labeled, rectangular bounding-", "bbox": {"l": 317.95499, "t": 623.3195499999999, "r": 559.71313, "b": 631.69417, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "boxes. We define 11 distinct labels for layout features, namely", "bbox": {"l": 317.95499, "t": 634.27855, "r": 539.92047, "b": 642.65317, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "Cap-", "bbox": {"l": 542.15802, "t": 634.32338, "r": 559.09888, "b": 642.66214, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "tion", "bbox": {"l": 317.95499, "t": 645.28238, "r": 331.86273, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": ",", "bbox": {"l": 331.86301, "t": 645.23755, "r": 333.83957, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "Footnote", "bbox": {"l": 336.064, "t": 645.28238, "r": 366.05368, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": ",", "bbox": {"l": 366.05301, "t": 645.23755, "r": 368.02957, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "Formula", "bbox": {"l": 370.254, "t": 645.28238, "r": 400.05502, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": ",", "bbox": {"l": 400.05499, "t": 645.23755, "r": 402.03156, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "List-item", "bbox": {"l": 404.25601, "t": 645.28238, "r": 436.19531, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": ",", "bbox": {"l": 436.19501, "t": 645.23755, "r": 438.17157, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "Page-footer", "bbox": {"l": 440.396, "t": 645.28238, "r": 480.60988999999995, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": ",", "bbox": {"l": 480.60999, "t": 645.23755, "r": 482.58655000000005, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "Page-header", "bbox": {"l": 484.811, "t": 645.28238, "r": 528.37604, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": ",", "bbox": {"l": 528.375, "t": 645.23755, "r": 530.35156, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "Picture", "bbox": {"l": 532.57599, "t": 645.28238, "r": 557.211, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": ",", "bbox": {"l": 557.211, "t": 645.23755, "r": 559.18756, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "Section-header", "bbox": {"l": 317.95499, "t": 656.2413799999999, "r": 368.78821, "b": 664.58013, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": ",", "bbox": {"l": 368.789, "t": 656.19655, "r": 370.72217, "b": 664.5711699999999, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "Table", "bbox": {"l": 372.89999, "t": 656.2413799999999, "r": 391.57254, "b": 664.58013, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": ",", "bbox": {"l": 391.573, "t": 656.19655, "r": 393.50616, "b": 664.5711699999999, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "Text", "bbox": {"l": 395.68399, "t": 656.2413799999999, "r": 410.23538, "b": 664.58013, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": ", and", "bbox": {"l": 410.23099, "t": 656.19655, "r": 427.5679, "b": 664.5711699999999, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "Title", "bbox": {"l": 429.74399, "t": 656.2413799999999, "r": 445.50800000000004, "b": 664.58013, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": ". Our reasoning for picking this", "bbox": {"l": 445.50800000000004, "t": 656.19655, "r": 558.20227, "b": 664.5711699999999, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "particular label set is detailed in Section 4.", "bbox": {"l": 317.95499, "t": 667.15556, "r": 472.22198, "b": 675.53017, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "DocLayNet contains 80863 PDF pages. Among these, 7059 carry two instances of human annotations, and 1591 carry three. This amounts to 91104 total annotation instances. The annotations provide layout information in the shape of labeled, rectangular boundingboxes. We define 11 distinct labels for layout features, namely Caption , Footnote , Formula , List-item , Page-footer , Page-header , Picture , Section-header , Table , Text , and Title . Our reasoning for picking this particular label set is detailed in Section 4."}, {"label": "text", "id": 8, "page_no": 1, "cluster": {"id": 8, "label": "text", "bbox": {"l": 317.95499, "t": 678.11456, "r": 558.2041, "b": 708.4071730000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9749757051467896, "cells": [{"id": 152, "text": "In addition to open intellectual property constraints for the", "bbox": {"l": 327.918, "t": 678.11456, "r": 558.19843, "b": 686.4891700000001, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "source documents, we required that the documents in DocLayNet", "bbox": {"l": 317.95499, "t": 689.07355, "r": 558.19867, "b": 697.448174, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "adhere to a few conditions. Firstly, we kept scanned documents", "bbox": {"l": 317.95499, "t": 700.032555, "r": 558.2041, "b": 708.4071730000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In addition to open intellectual property constraints for the source documents, we required that the documents in DocLayNet adhere to a few conditions. Firstly, we kept scanned documents"}], "body": [{"label": "section_header", "id": 14, "page_no": 1, "cluster": {"id": 14, "label": "section_header", "bbox": {"l": 53.79800000000001, "t": 85.85986000000003, "r": 156.52899, "b": 96.16900999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9367801547050476, "cells": [{"id": 2, "text": "1", "bbox": {"l": 53.79800000000001, "t": 85.85986000000003, "r": 59.427395, "b": 96.16900999999996, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "INTRODUCTION", "bbox": {"l": 70.379532, "t": 85.85986000000003, "r": 156.52899, "b": 96.16900999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1 INTRODUCTION"}, {"label": "text", "id": 5, "page_no": 1, "cluster": {"id": 5, "label": "text", "bbox": {"l": 53.528999, "t": 110.98352, "r": 303.01697, "b": 228.94714, "coord_origin": "TOPLEFT"}, "confidence": 0.9802607893943787, "cells": [{"id": 4, "text": "Despite the substantial improvements achieved with machine-learning", "bbox": {"l": 53.79800000000001, "t": 110.98352, "r": 303.01697, "b": 119.35815000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "(ML) approaches and deep neural networks in recent years, docu-", "bbox": {"l": 53.528999, "t": 121.94256999999993, "r": 295.55695, "b": 130.31719999999996, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "ment conversion remains a challenging problem, as demonstrated", "bbox": {"l": 53.79800000000001, "t": 132.90155000000004, "r": 294.04642, "b": 141.27617999999995, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "by the numerous public competitions held on this topic [1-4]. The", "bbox": {"l": 53.79800000000001, "t": 143.85956, "r": 294.04733, "b": 152.23419, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "challenge originates from the huge variability in PDF documents", "bbox": {"l": 53.79800000000001, "t": 154.81853999999998, "r": 294.04349, "b": 163.19317999999998, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "regarding layout, language and formats (scanned, programmatic", "bbox": {"l": 53.79800000000001, "t": 165.77752999999996, "r": 294.04718, "b": 174.15215999999998, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "or a combination of both). Engineering a single ML model that can", "bbox": {"l": 53.79800000000001, "t": 176.73650999999995, "r": 294.04919, "b": 185.11114999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "be applied on all types of documents and provides high-quality", "bbox": {"l": 53.79800000000001, "t": 187.69556, "r": 294.27573, "b": 196.07019000000003, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "layout segmentation remains to this day extremely challenging [5].", "bbox": {"l": 53.79800000000001, "t": 198.65454, "r": 295.42569, "b": 207.02917000000002, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "To highlight the variability in document layouts, we show a few", "bbox": {"l": 53.528999, "t": 209.61352999999997, "r": 294.37256, "b": 217.98816, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "example documents from the DocLayNet dataset in Figure 1.", "bbox": {"l": 53.79800000000001, "t": 220.57250999999997, "r": 275.48334, "b": 228.94714, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Despite the substantial improvements achieved with machine-learning (ML) approaches and deep neural networks in recent years, document conversion remains a challenging problem, as demonstrated by the numerous public competitions held on this topic [1-4]. The challenge originates from the huge variability in PDF documents regarding layout, language and formats (scanned, programmatic or a combination of both). Engineering a single ML model that can be applied on all types of documents and provides high-quality layout segmentation remains to this day extremely challenging [5]. To highlight the variability in document layouts, we show a few example documents from the DocLayNet dataset in Figure 1."}, {"label": "text", "id": 7, "page_no": 1, "cluster": {"id": 7, "label": "text", "bbox": {"l": 53.528999, "t": 231.53156, "r": 295.56412, "b": 502.91916, "coord_origin": "TOPLEFT"}, "confidence": 0.9793015718460083, "cells": [{"id": 15, "text": "A key problem in the process of document conversion is to under-", "bbox": {"l": 63.76100199999999, "t": 231.53156, "r": 295.564, "b": 239.90619000000004, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "stand the structure of a single document page, i.e. which segments", "bbox": {"l": 53.79800000000001, "t": 242.49054, "r": 294.04868, "b": 250.86517000000003, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "of text should be grouped together in a unit. To train models for this", "bbox": {"l": 53.79800000000001, "t": 253.44854999999995, "r": 294.04532, "b": 261.82318, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "task, there are currently two large datasets available to the com-", "bbox": {"l": 53.79800000000001, "t": 264.40752999999995, "r": 295.55618, "b": 272.78216999999995, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "munity, PubLayNet [6] and DocBank [7]. They were introduced", "bbox": {"l": 53.79800000000001, "t": 275.36658, "r": 294.04059, "b": 283.74118, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "in 2019 and 2020 respectively and significantly accelerated the im-", "bbox": {"l": 53.79800000000001, "t": 286.32552999999996, "r": 295.55783, "b": 294.70016, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "plementation of layout detection and segmentation models due to", "bbox": {"l": 53.79800000000001, "t": 297.28455, "r": 294.04538, "b": 305.65918000000005, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "their sizes of 300K and 500K ground-truth pages. These sizes were", "bbox": {"l": 53.79800000000001, "t": 308.24353, "r": 294.043, "b": 316.61816, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "achieved by leveraging an automation approach. The benefit of au-", "bbox": {"l": 53.79800000000001, "t": 319.20255, "r": 295.56412, "b": 327.57718, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "tomated ground-truth generation is obvious: one can generate large", "bbox": {"l": 53.79800000000001, "t": 330.16153, "r": 294.04532, "b": 338.53616, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "ground-truth datasets at virtually no cost. However, the automation", "bbox": {"l": 53.79800000000001, "t": 341.12054, "r": 294.04538, "b": 349.49518, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "introduces a constraint on the variability in the dataset, because", "bbox": {"l": 53.79800000000001, "t": 352.07953, "r": 294.04712, "b": 360.45416000000006, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "corresponding structured source data must be available. PubLayNet", "bbox": {"l": 53.79800000000001, "t": 363.03853999999995, "r": 294.04538, "b": 371.41318, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "and DocBank were both generated from scientific document repos-", "bbox": {"l": 53.79800000000001, "t": 373.99655, "r": 295.55643, "b": 382.37119, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "itories (PubMed and arXiv), which provide XML or L", "bbox": {"l": 53.79800000000001, "t": 384.95554, "r": 246.75909, "b": 393.33017, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "A", "bbox": {"l": 243.53101000000004, "t": 385.03183000000007, "r": 248.58553000000003, "b": 391.82455, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "T", "bbox": {"l": 247.24099999999999, "t": 384.95554, "r": 252.58859, "b": 393.33017, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "E", "bbox": {"l": 251.09398999999996, "t": 386.87954999999994, "r": 256.08829, "b": 395.25418, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "X", "bbox": {"l": 254.967, "t": 384.95554, "r": 261.33725, "b": 393.33017, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "sources.", "bbox": {"l": 263.75021, "t": 384.95554, "r": 295.42773, "b": 393.33017, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "Those scientific documents present a limited variability in their", "bbox": {"l": 53.528999, "t": 395.91455, "r": 294.21713, "b": 404.28918, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "layouts, because they are typeset in uniform templates provided by", "bbox": {"l": 53.79800000000001, "t": 406.87354, "r": 294.27386, "b": 415.24817, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "the publishers. Obviously, documents such as technical manuals,", "bbox": {"l": 53.79800000000001, "t": 417.8325500000001, "r": 295.03488, "b": 426.20717999999994, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "annual company reports, legal text, government tenders, etc. have", "bbox": {"l": 53.79800000000001, "t": 428.79153, "r": 294.04691, "b": 437.16617, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "very different and partially unique layouts. As a consequence, the", "bbox": {"l": 53.57400100000001, "t": 439.75055, "r": 294.04865, "b": 448.12518, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "layout predictions obtained from models trained on PubLayNet or", "bbox": {"l": 53.79800000000001, "t": 450.7095299999999, "r": 294.21643, "b": 459.08417, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "DocBank is very reasonable when applied on scientific documents.", "bbox": {"l": 53.79800000000001, "t": 461.66855, "r": 295.42181, "b": 470.04318, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "However, for more", "bbox": {"l": 53.79800000000001, "t": 472.62753, "r": 125.52795, "b": 481.00217, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "artistic", "bbox": {"l": 128.608, "t": 472.67239, "r": 153.7679, "b": 481.01114, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "or", "bbox": {"l": 157.15199, "t": 472.62753, "r": 165.16365, "b": 481.00217, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "free-style", "bbox": {"l": 168.248, "t": 472.67239, "r": 201.49272, "b": 481.01114, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "layouts, we see sub-par", "bbox": {"l": 204.78799, "t": 472.62753, "r": 294.21494, "b": 481.00217, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "prediction quality from these models, which we demonstrate in", "bbox": {"l": 53.79800000000001, "t": 483.58554, "r": 294.04715, "b": 491.96017, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Section 5.", "bbox": {"l": 53.79800000000001, "t": 494.54453, "r": 89.080788, "b": 502.91916, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "A key problem in the process of document conversion is to understand the structure of a single document page, i.e. which segments of text should be grouped together in a unit. To train models for this task, there are currently two large datasets available to the community, PubLayNet [6] and DocBank [7]. They were introduced in 2019 and 2020 respectively and significantly accelerated the implementation of layout detection and segmentation models due to their sizes of 300K and 500K ground-truth pages. These sizes were achieved by leveraging an automation approach. The benefit of automated ground-truth generation is obvious: one can generate large ground-truth datasets at virtually no cost. However, the automation introduces a constraint on the variability in the dataset, because corresponding structured source data must be available. PubLayNet and DocBank were both generated from scientific document repositories (PubMed and arXiv), which provide XML or L A T E X sources. Those scientific documents present a limited variability in their layouts, because they are typeset in uniform templates provided by the publishers. Obviously, documents such as technical manuals, annual company reports, legal text, government tenders, etc. have very different and partially unique layouts. As a consequence, the layout predictions obtained from models trained on PubLayNet or DocBank is very reasonable when applied on scientific documents. However, for more artistic or free-style layouts, we see sub-par prediction quality from these models, which we demonstrate in Section 5."}, {"label": "text", "id": 6, "page_no": 1, "cluster": {"id": 6, "label": "text", "bbox": {"l": 53.591999, "t": 505.50354, "r": 295.56396, "b": 579.63217, "coord_origin": "TOPLEFT"}, "confidence": 0.9795253276824951, "cells": [{"id": 49, "text": "In this paper, we present the DocLayNet dataset. It provides page-", "bbox": {"l": 63.76100199999999, "t": 505.50354, "r": 295.56396, "b": 513.87817, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "by-page layout annotation ground-truth using bounding-boxes for", "bbox": {"l": 53.79800000000001, "t": 516.46252, "r": 294.21271, "b": 524.83716, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "11", "bbox": {"l": 53.591999, "t": 527.42154, "r": 61.92275599999999, "b": 535.7961700000001, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "distinct class labels on 80863 unique document pages, of which", "bbox": {"l": 64.162201, "t": 527.42154, "r": 294.04626, "b": 535.7961700000001, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "a fraction carry double- or triple-annotations. DocLayNet is similar", "bbox": {"l": 53.79800000000001, "t": 538.38055, "r": 294.21228, "b": 546.75517, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "in spirit to PubLayNet and DocBank and will likewise be made", "bbox": {"l": 53.79800000000001, "t": 549.33955, "r": 294.04709, "b": 557.71417, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "available to the public", "bbox": {"l": 53.79800000000001, "t": 560.29855, "r": 134.28951, "b": 568.67317, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "1", "bbox": {"l": 134.29201, "t": 558.23083, "r": 137.67381, "b": 565.0235299999999, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "in order to stimulate the document-layout", "bbox": {"l": 140.418, "t": 560.29855, "r": 294.047, "b": 568.67317, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "analysis community. It distinguishes itself in the following aspects:", "bbox": {"l": 53.79800000000001, "t": 571.25755, "r": 295.10538, "b": 579.63217, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In this paper, we present the DocLayNet dataset. It provides pageby-page layout annotation ground-truth using bounding-boxes for 11 distinct class labels on 80863 unique document pages, of which a fraction carry double- or triple-annotations. DocLayNet is similar in spirit to PubLayNet and DocBank and will likewise be made available to the public 1 in order to stimulate the document-layout analysis community. It distinguishes itself in the following aspects:"}, {"label": "list_item", "id": 9, "page_no": 1, "cluster": {"id": 9, "label": "list_item", "bbox": {"l": 64.708, "t": 584.58156, "r": 295.56165, "b": 614.87418, "coord_origin": "TOPLEFT"}, "confidence": 0.9687220454216003, "cells": [{"id": 59, "text": "(1)", "bbox": {"l": 64.708, "t": 584.58156, "r": 74.221352, "b": 592.95618, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Human Annotation", "bbox": {"l": 78.207001, "t": 584.62639, "r": 146.39589, "b": 592.96515, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": ": In contrast to PubLayNet and DocBank,", "bbox": {"l": 146.41701, "t": 584.58156, "r": 295.03036, "b": 592.95618, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "we relied on human annotation instead of automation ap-", "bbox": {"l": 77.875, "t": 595.54056, "r": 295.56165, "b": 603.91518, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "proaches to generate the data set.", "bbox": {"l": 78.207001, "t": 606.49956, "r": 200.6432, "b": 614.87418, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "(1) Human Annotation : In contrast to PubLayNet and DocBank, we relied on human annotation instead of automation approaches to generate the data set."}, {"label": "list_item", "id": 11, "page_no": 1, "cluster": {"id": 11, "label": "list_item", "bbox": {"l": 64.708, "t": 617.45856, "r": 294.26254, "b": 636.79117, "coord_origin": "TOPLEFT"}, "confidence": 0.9594228267669678, "cells": [{"id": 64, "text": "(2)", "bbox": {"l": 64.708, "t": 617.45856, "r": 74.221352, "b": 625.8331800000001, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "Large Layout Variability", "bbox": {"l": 78.207001, "t": 617.50339, "r": 167.91745, "b": 625.84215, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": ": We include diverse and complex", "bbox": {"l": 168.33501, "t": 617.45856, "r": 294.26254, "b": 625.8331800000001, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "layouts from a large variety of public sources.", "bbox": {"l": 78.207001, "t": 628.41655, "r": 245.45726000000002, "b": 636.79117, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "(2) Large Layout Variability : We include diverse and complex layouts from a large variety of public sources."}, {"label": "list_item", "id": 10, "page_no": 1, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 64.708, "t": 639.37555, "r": 294.68381, "b": 669.66817, "coord_origin": "TOPLEFT"}, "confidence": 0.9615103006362915, "cells": [{"id": 68, "text": "(3)", "bbox": {"l": 64.708, "t": 639.37555, "r": 74.221352, "b": 647.75017, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "Detailed Label Set", "bbox": {"l": 78.207001, "t": 639.42038, "r": 143.51663, "b": 647.75914, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": ": We define 11 class labels to distinguish", "bbox": {"l": 144.02, "t": 639.37555, "r": 294.04648, "b": 647.75017, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "layout features in high detail. PubLayNet provides 5 labels;", "bbox": {"l": 78.207001, "t": 650.33455, "r": 294.68381, "b": 658.70917, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "DocBank provides 13, although not a superset of ours.", "bbox": {"l": 78.207001, "t": 661.29355, "r": 276.33752, "b": 669.66817, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "(3) Detailed Label Set : We define 11 class labels to distinguish layout features in high detail. PubLayNet provides 5 labels; DocBank provides 13, although not a superset of ours."}, {"label": "list_item", "id": 13, "page_no": 1, "cluster": {"id": 13, "label": "list_item", "bbox": {"l": 64.708, "t": 672.25256, "r": 295.56439, "b": 691.58617, "coord_origin": "TOPLEFT"}, "confidence": 0.9447500109672546, "cells": [{"id": 73, "text": "(4)", "bbox": {"l": 64.708, "t": 672.25256, "r": 74.221352, "b": 680.62717, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "Redundant Annotations", "bbox": {"l": 78.207001, "t": 672.29739, "r": 163.78357, "b": 680.63614, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": ": A fraction of the pages in the Do-", "bbox": {"l": 163.994, "t": 672.25256, "r": 295.56439, "b": 680.62717, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "cLayNet data set carry more than one human annotation.", "bbox": {"l": 78.207001, "t": 683.21156, "r": 295.42719, "b": 691.58617, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "(4) Redundant Annotations : A fraction of the pages in the DocLayNet data set carry more than one human annotation."}, {"label": "footnote", "id": 17, "page_no": 1, "cluster": {"id": 17, "label": "footnote", "bbox": {"l": 53.672001, "t": 702.226364, "r": 216.02750000000003, "b": 708.739891, "coord_origin": "TOPLEFT"}, "confidence": 0.8584772348403931, "cells": [{"id": 77, "text": "$^{1}$https://developer.ibm.com/exchanges/data/all/doclaynet", "bbox": {"l": 53.672001, "t": 702.226364, "r": 216.02750000000003, "b": 708.739891, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "$^{1}$https://developer.ibm.com/exchanges/data/all/doclaynet"}, {"label": "text", "id": 18, "page_no": 1, "cluster": {"id": 18, "label": "text", "bbox": {"l": 342.095, "t": 87.36352999999997, "r": 558.43201, "b": 106.69713999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.7997144460678101, "cells": [{"id": 78, "text": "This enables experimentation with annotation uncertainty", "bbox": {"l": 342.095, "t": 87.36352999999997, "r": 558.43201, "b": 95.73816, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "and quality control analysis.", "bbox": {"l": 342.36401, "t": 98.32250999999997, "r": 445.83629999999994, "b": 106.69713999999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "This enables experimentation with annotation uncertainty and quality control analysis."}, {"label": "list_item", "id": 12, "page_no": 1, "cluster": {"id": 12, "label": "list_item", "bbox": {"l": 328.86502, "t": 109.28148999999996, "r": 559.72101, "b": 161.49114999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9563500285148621, "cells": [{"id": 80, "text": "(5)", "bbox": {"l": 328.86502, "t": 109.28148999999996, "r": 338.37836, "b": 117.65612999999996, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Pre-defined Train-, Test- & Validation-set", "bbox": {"l": 342.36401, "t": 109.32641999999998, "r": 487.25296, "b": 117.66516000000001, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": ": Like DocBank, we", "bbox": {"l": 487.75900000000007, "t": 109.28156000000001, "r": 558.20294, "b": 117.65618999999992, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "provide fixed train-, test- & validation-sets to ensure propor-", "bbox": {"l": 342.36401, "t": 120.24054000000001, "r": 559.72101, "b": 128.61517000000003, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "tional representation of the class-labels. Further, we prevent", "bbox": {"l": 342.36401, "t": 131.19854999999995, "r": 558.20117, "b": 139.57317999999998, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "leakage of unique layouts across sets, which has a large effect", "bbox": {"l": 342.36401, "t": 142.15752999999995, "r": 558.20087, "b": 150.53216999999995, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "on model accuracy scores.", "bbox": {"l": 342.36401, "t": 153.11652000000004, "r": 438.0624399999999, "b": 161.49114999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "(5) Pre-defined Train-, Test- & Validation-set : Like DocBank, we provide fixed train-, test- & validation-sets to ensure proportional representation of the class-labels. Further, we prevent leakage of unique layouts across sets, which has a large effect on model accuracy scores."}, {"label": "text", "id": 4, "page_no": 1, "cluster": {"id": 4, "label": "text", "bbox": {"l": 317.62299, "t": 167.97551999999996, "r": 559.19031, "b": 220.18615999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9813902974128723, "cells": [{"id": 87, "text": "All aspects outlined above are detailed in Section 3. In Section 4,", "bbox": {"l": 327.918, "t": 167.97551999999996, "r": 559.19031, "b": 176.35015999999996, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "we will elaborate on how we designed and executed this large-scale", "bbox": {"l": 317.62299, "t": 178.93451000000005, "r": 558.20422, "b": 187.30913999999996, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "human annotation campaign. We will also share key insights and", "bbox": {"l": 317.95499, "t": 189.89355, "r": 558.19763, "b": 198.26819, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "lessons learned that might prove helpful for other parties planning", "bbox": {"l": 317.95499, "t": 200.85253999999998, "r": 558.20612, "b": 209.22717, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "to set up annotation campaigns.", "bbox": {"l": 317.95499, "t": 211.81151999999997, "r": 434.94861, "b": 220.18615999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "All aspects outlined above are detailed in Section 3. In Section 4, we will elaborate on how we designed and executed this large-scale human annotation campaign. We will also share key insights and lessons learned that might prove helpful for other parties planning to set up annotation campaigns."}, {"label": "text", "id": 3, "page_no": 1, "cluster": {"id": 3, "label": "text", "bbox": {"l": 317.73099, "t": 222.77057000000002, "r": 559.58197, "b": 307.85718, "coord_origin": "TOPLEFT"}, "confidence": 0.9844218492507935, "cells": [{"id": 92, "text": "In Section 5, we will present baseline accuracy numbers for a", "bbox": {"l": 327.918, "t": 222.77057000000002, "r": 558.19836, "b": 231.14520000000005, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "variety of object detection methods (Faster R-CNN, Mask R-CNN", "bbox": {"l": 317.73099, "t": 233.72955000000002, "r": 558.1991, "b": 242.10419000000002, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "and YOLOv5) trained on DocLayNet. We further show how the", "bbox": {"l": 317.95499, "t": 244.68854, "r": 558.20416, "b": 253.06317, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "model performance is impacted by varying the DocLayNet dataset", "bbox": {"l": 317.95499, "t": 255.64752, "r": 558.20563, "b": 264.02216, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "size, reducing the label set and modifying the train/test-split. Last", "bbox": {"l": 317.95499, "t": 266.60553000000004, "r": 558.19861, "b": 274.98015999999996, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "but not least, we compare the performance of models trained on", "bbox": {"l": 317.95499, "t": 277.56458, "r": 558.20416, "b": 285.93918, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "PubLayNet, DocBank and DocLayNet and demonstrate that a model", "bbox": {"l": 317.95499, "t": 288.52353, "r": 558.20239, "b": 296.89816, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "trained on DocLayNet provides overall more robust layout recovery.", "bbox": {"l": 317.95499, "t": 299.48254, "r": 559.58197, "b": 307.85718, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In Section 5, we will present baseline accuracy numbers for a variety of object detection methods (Faster R-CNN, Mask R-CNN and YOLOv5) trained on DocLayNet. We further show how the model performance is impacted by varying the DocLayNet dataset size, reducing the label set and modifying the train/test-split. Last but not least, we compare the performance of models trained on PubLayNet, DocBank and DocLayNet and demonstrate that a model trained on DocLayNet provides overall more robust layout recovery."}, {"label": "section_header", "id": 15, "page_no": 1, "cluster": {"id": 15, "label": "section_header", "bbox": {"l": 317.95499, "t": 321.20889, "r": 421.74411, "b": 331.51797, "coord_origin": "TOPLEFT"}, "confidence": 0.9347459077835083, "cells": [{"id": 100, "text": "2", "bbox": {"l": 317.95499, "t": 321.20889, "r": 323.10388, "b": 331.51797, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "RELATED WORK", "bbox": {"l": 333.12115, "t": 321.20889, "r": 421.74411, "b": 331.51797, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2 RELATED WORK"}, {"label": "text", "id": 1, "page_no": 1, "cluster": {"id": 1, "label": "text", "bbox": {"l": 317.52499, "t": 346.3325500000001, "r": 559.71613, "b": 464.29617, "coord_origin": "TOPLEFT"}, "confidence": 0.9860379099845886, "cells": [{"id": 102, "text": "While early approaches in document-layout analysis used rule-", "bbox": {"l": 317.52499, "t": 346.3325500000001, "r": 559.71301, "b": 354.70717999999994, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "based algorithms and heuristics [8], the problem is lately addressed", "bbox": {"l": 317.95499, "t": 357.29153, "r": 558.20276, "b": 365.66617, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "with deep learning methods. The most common approach is to lever-", "bbox": {"l": 317.62299, "t": 368.25055, "r": 559.71564, "b": 376.62518, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "age object detection models [9-15]. In the last decade, the accuracy", "bbox": {"l": 317.95499, "t": 379.2095299999999, "r": 558.43365, "b": 387.58417, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "and speed of these models has increased dramatically. Furthermore,", "bbox": {"l": 317.95499, "t": 390.16855000000004, "r": 559.18658, "b": 398.54318, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "most state-of-the-art object detection methods can be trained and", "bbox": {"l": 317.95499, "t": 401.12753, "r": 558.20502, "b": 409.50217, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "applied with very little work, thanks to a standardisation effort", "bbox": {"l": 317.95499, "t": 412.08655, "r": 558.20422, "b": 420.46118, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "of the ground-truth data format [16] and common deep-learning", "bbox": {"l": 317.95499, "t": 423.04553, "r": 558.20477, "b": 431.4201699999999, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "frameworks [17]. Reference data sets such as PubLayNet [6] and", "bbox": {"l": 317.95499, "t": 434.00354, "r": 558.19952, "b": 442.37817, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "DocBank provide their data in the commonly accepted COCO for-", "bbox": {"l": 317.95499, "t": 444.96252, "r": 559.71613, "b": 453.33716, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "mat [16].", "bbox": {"l": 317.95499, "t": 455.92154, "r": 350.90652, "b": 464.29617, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "While early approaches in document-layout analysis used rulebased algorithms and heuristics [8], the problem is lately addressed with deep learning methods. The most common approach is to leverage object detection models [9-15]. In the last decade, the accuracy and speed of these models has increased dramatically. Furthermore, most state-of-the-art object detection methods can be trained and applied with very little work, thanks to a standardisation effort of the ground-truth data format [16] and common deep-learning frameworks [17]. Reference data sets such as PubLayNet [6] and DocBank provide their data in the commonly accepted COCO format [16]."}, {"label": "text", "id": 0, "page_no": 1, "cluster": {"id": 0, "label": "text", "bbox": {"l": 317.95499, "t": 466.88052, "r": 559.18646, "b": 551.96817, "coord_origin": "TOPLEFT"}, "confidence": 0.9861046671867371, "cells": [{"id": 113, "text": "Lately, new types of ML models for document-layout analysis", "bbox": {"l": 327.918, "t": 466.88052, "r": 558.19824, "b": 475.25516, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "have emerged in the community [18-21]. These models do not", "bbox": {"l": 317.95499, "t": 477.83954, "r": 558.20551, "b": 486.21417, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "approach the problem of layout analysis purely based on an image", "bbox": {"l": 317.95499, "t": 488.79855, "r": 558.20575, "b": 497.17319, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "representation of the page, as computer vision methods do. Instead,", "bbox": {"l": 317.95499, "t": 499.75754, "r": 559.18646, "b": 508.13217, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "they combine the text tokens and image representation of a page", "bbox": {"l": 317.95499, "t": 510.71655, "r": 558.2002, "b": 519.09119, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "in order to obtain a segmentation. While the reported accuracies", "bbox": {"l": 317.95499, "t": 521.67554, "r": 558.20618, "b": 530.05017, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "appear to be promising, a broadly accepted data format which links", "bbox": {"l": 317.95499, "t": 532.63455, "r": 558.20239, "b": 541.00917, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "geometric and textual features has yet to establish.", "bbox": {"l": 317.95499, "t": 543.59355, "r": 503.32648, "b": 551.96817, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Lately, new types of ML models for document-layout analysis have emerged in the community [18-21]. These models do not approach the problem of layout analysis purely based on an image representation of the page, as computer vision methods do. Instead, they combine the text tokens and image representation of a page in order to obtain a segmentation. While the reported accuracies appear to be promising, a broadly accepted data format which links geometric and textual features has yet to establish."}, {"label": "section_header", "id": 16, "page_no": 1, "cluster": {"id": 16, "label": "section_header", "bbox": {"l": 317.95499, "t": 565.3199, "r": 477.45688, "b": 575.629, "coord_origin": "TOPLEFT"}, "confidence": 0.9331073760986328, "cells": [{"id": 121, "text": "3", "bbox": {"l": 317.95499, "t": 565.3199, "r": 322.97391, "b": 575.629, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "THE DOCLAYNET DATASET", "bbox": {"l": 332.73831, "t": 565.3199, "r": 477.45688, "b": 575.629, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3 THE DOCLAYNET DATASET"}, {"label": "text", "id": 2, "page_no": 1, "cluster": {"id": 2, "label": "text", "bbox": {"l": 317.95499, "t": 590.4435599999999, "r": 559.7132, "b": 675.53017, "coord_origin": "TOPLEFT"}, "confidence": 0.9852980375289917, "cells": [{"id": 123, "text": "DocLayNet contains 80863 PDF pages. Among these, 7059 carry two", "bbox": {"l": 317.95499, "t": 590.4435599999999, "r": 558.20233, "b": 598.81818, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "instances of human annotations, and 1591 carry three. This amounts", "bbox": {"l": 317.95499, "t": 601.40256, "r": 558.20239, "b": 609.77718, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "to 91104 total annotation instances. The annotations provide lay-", "bbox": {"l": 317.95499, "t": 612.36055, "r": 559.7132, "b": 620.73517, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "out information in the shape of labeled, rectangular bounding-", "bbox": {"l": 317.95499, "t": 623.3195499999999, "r": 559.71313, "b": 631.69417, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "boxes. We define 11 distinct labels for layout features, namely", "bbox": {"l": 317.95499, "t": 634.27855, "r": 539.92047, "b": 642.65317, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "Cap-", "bbox": {"l": 542.15802, "t": 634.32338, "r": 559.09888, "b": 642.66214, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "tion", "bbox": {"l": 317.95499, "t": 645.28238, "r": 331.86273, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": ",", "bbox": {"l": 331.86301, "t": 645.23755, "r": 333.83957, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "Footnote", "bbox": {"l": 336.064, "t": 645.28238, "r": 366.05368, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": ",", "bbox": {"l": 366.05301, "t": 645.23755, "r": 368.02957, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "Formula", "bbox": {"l": 370.254, "t": 645.28238, "r": 400.05502, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": ",", "bbox": {"l": 400.05499, "t": 645.23755, "r": 402.03156, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "List-item", "bbox": {"l": 404.25601, "t": 645.28238, "r": 436.19531, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": ",", "bbox": {"l": 436.19501, "t": 645.23755, "r": 438.17157, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "Page-footer", "bbox": {"l": 440.396, "t": 645.28238, "r": 480.60988999999995, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": ",", "bbox": {"l": 480.60999, "t": 645.23755, "r": 482.58655000000005, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "Page-header", "bbox": {"l": 484.811, "t": 645.28238, "r": 528.37604, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": ",", "bbox": {"l": 528.375, "t": 645.23755, "r": 530.35156, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "Picture", "bbox": {"l": 532.57599, "t": 645.28238, "r": 557.211, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": ",", "bbox": {"l": 557.211, "t": 645.23755, "r": 559.18756, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "Section-header", "bbox": {"l": 317.95499, "t": 656.2413799999999, "r": 368.78821, "b": 664.58013, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": ",", "bbox": {"l": 368.789, "t": 656.19655, "r": 370.72217, "b": 664.5711699999999, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "Table", "bbox": {"l": 372.89999, "t": 656.2413799999999, "r": 391.57254, "b": 664.58013, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": ",", "bbox": {"l": 391.573, "t": 656.19655, "r": 393.50616, "b": 664.5711699999999, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "Text", "bbox": {"l": 395.68399, "t": 656.2413799999999, "r": 410.23538, "b": 664.58013, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": ", and", "bbox": {"l": 410.23099, "t": 656.19655, "r": 427.5679, "b": 664.5711699999999, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "Title", "bbox": {"l": 429.74399, "t": 656.2413799999999, "r": 445.50800000000004, "b": 664.58013, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": ". Our reasoning for picking this", "bbox": {"l": 445.50800000000004, "t": 656.19655, "r": 558.20227, "b": 664.5711699999999, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "particular label set is detailed in Section 4.", "bbox": {"l": 317.95499, "t": 667.15556, "r": 472.22198, "b": 675.53017, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "DocLayNet contains 80863 PDF pages. Among these, 7059 carry two instances of human annotations, and 1591 carry three. This amounts to 91104 total annotation instances. The annotations provide layout information in the shape of labeled, rectangular boundingboxes. We define 11 distinct labels for layout features, namely Caption , Footnote , Formula , List-item , Page-footer , Page-header , Picture , Section-header , Table , Text , and Title . Our reasoning for picking this particular label set is detailed in Section 4."}, {"label": "text", "id": 8, "page_no": 1, "cluster": {"id": 8, "label": "text", "bbox": {"l": 317.95499, "t": 678.11456, "r": 558.2041, "b": 708.4071730000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9749757051467896, "cells": [{"id": 152, "text": "In addition to open intellectual property constraints for the", "bbox": {"l": 327.918, "t": 678.11456, "r": 558.19843, "b": 686.4891700000001, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "source documents, we required that the documents in DocLayNet", "bbox": {"l": 317.95499, "t": 689.07355, "r": 558.19867, "b": 697.448174, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "adhere to a few conditions. Firstly, we kept scanned documents", "bbox": {"l": 317.95499, "t": 700.032555, "r": 558.2041, "b": 708.4071730000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In addition to open intellectual property constraints for the source documents, we required that the documents in DocLayNet adhere to a few conditions. Firstly, we kept scanned documents"}], "headers": [{"label": "page_header", "id": 19, "page_no": 1, "cluster": {"id": 19, "label": "page_header", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.7682235836982727, "cells": [{"id": 0, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 246.24382, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar", "bbox": {"l": 253.13897999999998, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar"}]}}, {"page_no": 2, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Patents", "bbox": {"l": 237.11293, "t": 133.08716000000004, "r": 262.97623, "b": 141.61419999999998, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "8%", "bbox": {"l": 202.87892, "t": 140.46178999999995, "r": 213.89999, "b": 148.98883, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Scientific", "bbox": {"l": 207.13306, "t": 93.1576500000001, "r": 237.64882999999998, "b": 101.68469000000005, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "17%", "bbox": {"l": 184.40349, "t": 118.68206999999995, "r": 199.66519, "b": 127.20911000000001, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Financial", "bbox": {"l": 88.288223, "t": 114.35473999999988, "r": 118.80401, "b": 122.88176999999985, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "32%", "bbox": {"l": 136.24422, "t": 130.24408000000005, "r": 151.50592, "b": 138.77112, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Tenders", "bbox": {"l": 93.973373, "t": 187.65765, "r": 121.11515, "b": 196.18469000000005, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "6%", "bbox": {"l": 139.6235, "t": 170.22748, "r": 150.64458, "b": 178.75451999999996, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Laws", "bbox": {"l": 139.88339, "t": 212.50036999999998, "r": 157.68491, "b": 221.02739999999994, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "16%", "bbox": {"l": 157.43983, "t": 183.77808000000005, "r": 172.70154, "b": 192.30511, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Manuals", "bbox": {"l": 225.47252, "t": 189.29656999999997, "r": 254.29510000000002, "b": 197.82361000000003, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "21%", "bbox": {"l": 194.40683, "t": 171.12145999999996, "r": 209.66853, "b": 179.6485, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Figure 2: Distribution of DocLayNet pages across document", "bbox": {"l": 53.79800000000001, "t": 236.11499000000003, "r": 294.04373, "b": 244.58826, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "categories.", "bbox": {"l": 53.79800000000001, "t": 247.07397000000003, "r": 96.756027, "b": 255.54724, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "to a minimum, since they introduce difficulties in annotation (see", "bbox": {"l": 53.79800000000001, "t": 281.8035300000001, "r": 294.04605, "b": 290.17815999999993, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "Section 4). As a second condition, we focussed on medium to large", "bbox": {"l": 53.79800000000001, "t": 292.76254, "r": 294.04868, "b": 301.13718, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "documents (", "bbox": {"l": 53.79800000000001, "t": 303.72153, "r": 98.881348, "b": 312.09616, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": ">", "bbox": {"l": 99.070999, "t": 306.07971, "r": 104.77363, "b": 310.08768, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "10", "bbox": {"l": 107.46399999999998, "t": 303.72153, "r": 115.83373999999999, "b": 312.09616, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "pages) with technical content, dense in complex", "bbox": {"l": 118.08366, "t": 303.72153, "r": 294.26233, "b": 312.09616, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "tables, figures, plots and captions. Such documents carry a lot of", "bbox": {"l": 53.79800000000001, "t": 314.68054, "r": 294.04715, "b": 323.05518, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "information value, but are often hard to analyse with high accuracy", "bbox": {"l": 53.79800000000001, "t": 325.63855, "r": 294.27383, "b": 334.01318, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "due to their challenging layouts. Counterexamples of documents", "bbox": {"l": 53.79800000000001, "t": 336.59753, "r": 294.0416, "b": 344.97217, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "not included in the dataset are receipts, invoices, hand-written", "bbox": {"l": 53.79800000000001, "t": 347.5565500000001, "r": 294.04712, "b": 355.9311799999999, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "documents or photographs showing \u201ctext in the wild\".", "bbox": {"l": 53.79800000000001, "t": 358.51553, "r": 251.73131, "b": 366.89017, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "The pages in DocLayNet can be grouped into six distinct cate-", "bbox": {"l": 63.76100199999999, "t": 369.47455, "r": 295.55945, "b": 377.84918, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "gories, namely", "bbox": {"l": 53.79800000000001, "t": 380.43353, "r": 105.90533, "b": 388.80816999999996, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Financial Reports", "bbox": {"l": 107.754, "t": 380.47838999999993, "r": 167.4973, "b": 388.81714, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": ",", "bbox": {"l": 167.496, "t": 380.43353, "r": 169.42915, "b": 388.80816999999996, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Manuals", "bbox": {"l": 171.28101, "t": 380.47838999999993, "r": 201.45581, "b": 388.81714, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": ",", "bbox": {"l": 201.455, "t": 380.43353, "r": 203.38815, "b": 388.80816999999996, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "Scientific Articles", "bbox": {"l": 205.24001, "t": 380.47838999999993, "r": 264.55273, "b": 388.81714, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": ",", "bbox": {"l": 264.54901, "t": 380.43353, "r": 266.48218, "b": 388.80816999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "Laws &", "bbox": {"l": 268.33401, "t": 380.47838999999993, "r": 294.36133, "b": 388.81714, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Regulations", "bbox": {"l": 53.79800000000001, "t": 391.43741000000006, "r": 94.899666, "b": 399.77615, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": ",", "bbox": {"l": 94.900002, "t": 391.39255, "r": 96.862747, "b": 399.76718, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "Patents", "bbox": {"l": 99.109001, "t": 391.43741000000006, "r": 124.72282, "b": 399.77615, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "and", "bbox": {"l": 127.17899999999999, "t": 391.39255, "r": 140.60596, "b": 399.76718, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "Government Tenders", "bbox": {"l": 142.853, "t": 391.43741000000006, "r": 215.15340000000003, "b": 399.77615, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": ". Each document cate-", "bbox": {"l": 215.15601000000004, "t": 391.39255, "r": 295.55716, "b": 399.76718, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "gory was sourced from various repositories. For example, Financial", "bbox": {"l": 53.79800000000001, "t": 402.3515300000001, "r": 294.04535, "b": 410.72617, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Reports contain both", "bbox": {"l": 53.79800000000001, "t": 413.31055, "r": 132.19516, "b": 421.68518000000006, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "free-style", "bbox": {"l": 134.528, "t": 413.35541, "r": 167.77272, "b": 421.69415, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "format annual reports", "bbox": {"l": 170.314, "t": 413.31055, "r": 252.36031, "b": 421.68518000000006, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "2", "bbox": {"l": 252.356, "t": 411.24283, "r": 255.73781, "b": 418.03555, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "which ex-", "bbox": {"l": 258.56601, "t": 413.31055, "r": 295.56046, "b": 421.68518000000006, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "pose company-specific, artistic layouts as well as the more formal", "bbox": {"l": 53.79800000000001, "t": 424.26953, "r": 294.04376, "b": 432.6441699999999, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "SEC filings. The two largest categories (", "bbox": {"l": 53.79800000000001, "t": 435.22754000000003, "r": 197.59023, "b": 443.60217, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Financial Reports", "bbox": {"l": 197.591, "t": 435.27240000000006, "r": 258.02774, "b": 443.61115, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "and", "bbox": {"l": 260.48901, "t": 435.22754000000003, "r": 273.78104, "b": 443.60217, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Man-", "bbox": {"l": 276.03201, "t": 435.27240000000006, "r": 294.94113, "b": 443.61115, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "uals", "bbox": {"l": 53.79800000000001, "t": 446.23138, "r": 68.085777, "b": 454.57013, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": ") contain a large amount of free-style layouts in order to obtain", "bbox": {"l": 68.296997, "t": 446.18652, "r": 294.04565, "b": 454.56116, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "maximum variability. In the other four categories, we boosted the", "bbox": {"l": 53.79800000000001, "t": 457.14554, "r": 294.04163, "b": 465.52017, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "variability by mixing documents from independent providers, such", "bbox": {"l": 53.57400100000001, "t": 468.10455, "r": 294.04889, "b": 476.47919, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "as different government websites or publishers. In Figure 2, we", "bbox": {"l": 53.79800000000001, "t": 479.06354, "r": 294.04715, "b": 487.43817, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "show the document categories contained in DocLayNet with their", "bbox": {"l": 53.79800000000001, "t": 490.02255, "r": 294.21643, "b": 498.39719, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "respective sizes.", "bbox": {"l": 53.79800000000001, "t": 500.98154, "r": 112.2948, "b": 509.35617, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "We did not control the document selection with regard to lan-", "bbox": {"l": 63.76100199999999, "t": 511.94055, "r": 295.55954, "b": 520.31519, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "guage. The vast majority of documents contained in DocLayNet", "bbox": {"l": 53.79800000000001, "t": 522.89954, "r": 294.04718, "b": 531.27417, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "(close to 95%) are published in English language. However, Do-", "bbox": {"l": 53.528999, "t": 533.8585499999999, "r": 295.56155, "b": 542.23317, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "cLayNet also contains a number of documents in other languages", "bbox": {"l": 53.79800000000001, "t": 544.81755, "r": 294.04144, "b": 553.19217, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "such as German (2.5%), French (1.0%) and Japanese (1.0%). While", "bbox": {"l": 53.79800000000001, "t": 555.77556, "r": 294.04709, "b": 564.15018, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "the document language has negligible impact on the performance", "bbox": {"l": 53.79800000000001, "t": 566.73456, "r": 294.04163, "b": 575.10918, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "of computer vision methods such as object detection and segmenta-", "bbox": {"l": 53.79800000000001, "t": 577.6935599999999, "r": 295.5567, "b": 586.06818, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "tion models, it might prove challenging for layout analysis methods", "bbox": {"l": 53.79800000000001, "t": 588.65256, "r": 294.04541, "b": 597.02718, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "which exploit textual features.", "bbox": {"l": 53.466999, "t": 599.61156, "r": 164.39928, "b": 607.98618, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "To ensure that future benchmarks in the document-layout analy-", "bbox": {"l": 63.76100199999999, "t": 610.57056, "r": 295.56396, "b": 618.9451799999999, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "sis community can be easily compared, we have split up DocLayNet", "bbox": {"l": 53.79800000000001, "t": 621.52956, "r": 294.04532, "b": 629.90417, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "into pre-defined train-, test- and validation-sets. In this way, we can", "bbox": {"l": 53.79800000000001, "t": 632.48856, "r": 294.04538, "b": 640.86317, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "avoid spurious variations in the evaluation scores due to random", "bbox": {"l": 53.79800000000001, "t": 643.4475600000001, "r": 294.04315, "b": 651.82217, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "splitting in train-, test- and validation-sets. We also ensured that", "bbox": {"l": 53.79800000000001, "t": 654.40656, "r": 294.04712, "b": 662.78117, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "less frequent labels are represented in train and test sets in equal", "bbox": {"l": 53.79800000000001, "t": 665.36456, "r": 294.04333, "b": 673.7391700000001, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "proportions.", "bbox": {"l": 53.79800000000001, "t": 676.32355, "r": 98.916931, "b": 684.69817, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "$^{2}$e.g. AAPL from https://www.annualreports.com/", "bbox": {"l": 53.79800000000001, "t": 701.6563639999999, "r": 195.78998, "b": 708.169891, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "Table 1 shows the overall frequency and distribution of the labels", "bbox": {"l": 327.918, "t": 87.36352999999997, "r": 558.20093, "b": 95.73816, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "among the different sets. Importantly, we ensure that subsets are", "bbox": {"l": 317.95499, "t": 98.32250999999997, "r": 558.20013, "b": 106.69713999999999, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "only split on full-document boundaries. This avoids that pages of", "bbox": {"l": 317.95499, "t": 109.28156000000001, "r": 558.20056, "b": 117.65618999999992, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "the same document are spread over train, test and validation set,", "bbox": {"l": 317.95499, "t": 120.24054000000001, "r": 559.19183, "b": 128.61517000000003, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "which can give an undesired evaluation advantage to models and", "bbox": {"l": 317.62299, "t": 131.19854999999995, "r": 558.20349, "b": 139.57317999999998, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "lead to overestimation of their prediction accuracy. We will show", "bbox": {"l": 317.95499, "t": 142.15752999999995, "r": 558.52936, "b": 150.53216999999995, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "the impact of this decision in Section 5.", "bbox": {"l": 317.95499, "t": 153.11652000000004, "r": 461.6416, "b": 161.49114999999995, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "In order to accommodate the different types of models currently", "bbox": {"l": 327.918, "t": 164.07556, "r": 558.43811, "b": 172.4502, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "in use by the community, we provide DocLayNet in an", "bbox": {"l": 317.95499, "t": 175.03454999999997, "r": 516.8219, "b": 183.40918, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "augmented", "bbox": {"l": 519.07501, "t": 175.07941000000005, "r": 558.20135, "b": 183.41814999999997, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "COCO format [16]. This entails the standard COCO ground-truth", "bbox": {"l": 317.95499, "t": 185.99352999999996, "r": 558.20325, "b": 194.36816, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "file (in JSON format) with the associated page images (in PNG", "bbox": {"l": 317.95499, "t": 196.95250999999996, "r": 558.20404, "b": 205.32714999999996, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "format, 1025", "bbox": {"l": 317.95499, "t": 207.91156, "r": 364.28769, "b": 216.28619000000003, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "\u00d7", "bbox": {"l": 364.28699, "t": 207.85779000000002, "r": 369.98962, "b": 215.55993999999998, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "1025 pixels). Furthermore, custom fields have been", "bbox": {"l": 369.98999, "t": 207.91156, "r": 558.20526, "b": 216.28619000000003, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "added to each COCO record to specify document category, original", "bbox": {"l": 317.95499, "t": 218.87054, "r": 558.20251, "b": 227.24518, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "document filename and page number. In addition, we also provide", "bbox": {"l": 317.95499, "t": 229.82952999999998, "r": 558.203, "b": 238.20416, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "the original PDF pages, as well as sidecar files containing parsed", "bbox": {"l": 317.95499, "t": 240.78754000000004, "r": 558.20404, "b": 249.16216999999995, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "PDF text and text-cell coordinates (in JSON). All additional files are", "bbox": {"l": 317.95499, "t": 251.74652000000003, "r": 558.20227, "b": 260.12114999999994, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "linked to the primary page images by their matching filenames.", "bbox": {"l": 317.95499, "t": 262.70556999999997, "r": 550.36414, "b": 271.0802, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "Despite being cost-intense and far less scalable than automation,", "bbox": {"l": 327.918, "t": 273.66454999999996, "r": 559.18488, "b": 282.03918, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "human annotation has several benefits over automated ground-", "bbox": {"l": 317.95499, "t": 284.62354, "r": 559.7132, "b": 292.99817, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "truth generation. The first and most obvious reason to leverage", "bbox": {"l": 317.95499, "t": 295.5825500000001, "r": 558.20416, "b": 303.95717999999994, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "human annotations is the freedom to annotate any type of doc-", "bbox": {"l": 317.95499, "t": 306.54153, "r": 559.71326, "b": 314.91617, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "ument without requiring a programmatic source. For most PDF", "bbox": {"l": 317.95499, "t": 317.50055, "r": 558.41443, "b": 325.87518, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "documents, the original source document is not available. The lat-", "bbox": {"l": 317.95499, "t": 328.4595299999999, "r": 559.71545, "b": 336.83417, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "ter is not a hard constraint with human annotation, but it is for", "bbox": {"l": 317.95499, "t": 339.41855000000004, "r": 558.36865, "b": 347.79318, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "automated methods. A second reason to use human annotations is", "bbox": {"l": 317.95499, "t": 350.37753, "r": 558.20062, "b": 358.75217, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "that the latter usually provide a more natural interpretation of the", "bbox": {"l": 317.95499, "t": 361.33554, "r": 558.20184, "b": 369.71017, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "page layout. The human-interpreted layout can significantly devi-", "bbox": {"l": 317.95499, "t": 372.29453, "r": 559.71442, "b": 380.66916, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "ate from the programmatic layout used in typesetting. For example,", "bbox": {"l": 317.95499, "t": 383.25354, "r": 559.1864, "b": 391.62817, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "\u201cinvisible\u201d tables might be used solely for aligning text paragraphs", "bbox": {"l": 316.94199, "t": 394.21252, "r": 558.20111, "b": 402.58716, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "on columns. Such typesetting tricks might be interpreted by au-", "bbox": {"l": 317.95499, "t": 405.17154, "r": 559.7132, "b": 413.54617, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "tomated methods incorrectly as an actual table, while the human", "bbox": {"l": 317.95499, "t": 416.13052, "r": 558.20013, "b": 424.50515999999993, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "annotation will interpret it correctly as", "bbox": {"l": 317.95499, "t": 427.08953999999994, "r": 464.50613, "b": 435.46417, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "Text", "bbox": {"l": 466.98199000000005, "t": 427.13439999999997, "r": 482.14560000000006, "b": 435.47313999999994, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "or other styles. The", "bbox": {"l": 485.13199000000003, "t": 427.08953999999994, "r": 558.19727, "b": 435.46417, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "same applies to multi-line text elements, when authors decided to", "bbox": {"l": 317.95499, "t": 438.04855, "r": 558.20221, "b": 446.4231899999999, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "space them as \u201cinvisible\u201d list elements without bullet symbols. A", "bbox": {"l": 317.95499, "t": 449.00754, "r": 558.51501, "b": 457.38217, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "third reason to gather ground-truth through human annotation is", "bbox": {"l": 317.95499, "t": 459.96655000000004, "r": 558.19855, "b": 468.34119, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "to estimate a \u201cnatural\u201d upper bound on the segmentation accuracy.", "bbox": {"l": 317.95499, "t": 470.92453, "r": 559.58215, "b": 479.29916, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "As we will show in Section 4, certain documents featuring complex", "bbox": {"l": 317.64099, "t": 481.88354, "r": 558.41559, "b": 490.25818, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "layouts can have different but equally acceptable layout interpre-", "bbox": {"l": 317.95499, "t": 492.84253, "r": 559.72156, "b": 501.21716, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "tations. This natural upper bound for segmentation accuracy can", "bbox": {"l": 317.95499, "t": 503.80154, "r": 558.19928, "b": 512.1761799999999, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "be found by annotating the same pages multiple times by different", "bbox": {"l": 317.95499, "t": 514.76053, "r": 558.20581, "b": 523.13516, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "people and evaluating the inter-annotator agreement. Such a base-", "bbox": {"l": 317.95499, "t": 525.71954, "r": 559.71729, "b": 534.09418, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "line consistency evaluation is very useful to define expectations", "bbox": {"l": 317.95499, "t": 536.6785600000001, "r": 558.20404, "b": 545.05318, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "for a good target accuracy in trained deep neural network models", "bbox": {"l": 317.95499, "t": 547.63756, "r": 558.20074, "b": 556.01218, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "and avoid overfitting (see Table 1). On the flip side, achieving high", "bbox": {"l": 317.95499, "t": 558.59656, "r": 558.20062, "b": 566.97118, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "annotation consistency proved to be a key challenge in human", "bbox": {"l": 317.95499, "t": 569.55556, "r": 558.20416, "b": 577.9301800000001, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "annotation, as we outline in Section 4.", "bbox": {"l": 317.95499, "t": 580.51456, "r": 457.62469, "b": 588.88918, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "4", "bbox": {"l": 317.95499, "t": 606.84991, "r": 323.56226, "b": 617.15901, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "ANNOTATION CAMPAIGN", "bbox": {"l": 334.47134, "t": 606.84991, "r": 470.21326, "b": 617.15901, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "The annotation campaign was carried out in four phases. In phase", "bbox": {"l": 317.686, "t": 631.97356, "r": 558.20148, "b": 640.34818, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "one, we identified and prepared the data sources for annotation.", "bbox": {"l": 317.95499, "t": 642.93256, "r": 559.58521, "b": 651.30717, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "In phase two, we determined the class labels and how annotations", "bbox": {"l": 317.95499, "t": 653.89156, "r": 558.20007, "b": 662.26617, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "should be done on the documents in order to obtain maximum con-", "bbox": {"l": 317.95499, "t": 664.85056, "r": 559.71375, "b": 673.22517, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "sistency. The latter was guided by a detailed requirement analysis", "bbox": {"l": 317.95499, "t": 675.80956, "r": 558.20233, "b": 684.18417, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "and exhaustive experiments. In phase three, we trained the annota-", "bbox": {"l": 317.95499, "t": 686.76855, "r": 559.71381, "b": 695.143173, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "tion staff and performed exams for quality assurance. In phase four,", "bbox": {"l": 317.95499, "t": 697.7275539999999, "r": 559.1864, "b": 706.102173, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 13, "label": "page_header", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.891997754573822, "cells": [{"id": 0, "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "page_header", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.9104520082473755, "cells": [{"id": 1, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "picture", "bbox": {"l": 88.33030700683594, "t": 92.88655090332031, "r": 263.7049560546875, "b": 220.5682373046875, "coord_origin": "TOPLEFT"}, "confidence": 0.9698190689086914, "cells": [{"id": 2, "text": "Patents", "bbox": {"l": 237.11293, "t": 133.08716000000004, "r": 262.97623, "b": 141.61419999999998, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "8%", "bbox": {"l": 202.87892, "t": 140.46178999999995, "r": 213.89999, "b": 148.98883, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Scientific", "bbox": {"l": 207.13306, "t": 93.1576500000001, "r": 237.64882999999998, "b": 101.68469000000005, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "17%", "bbox": {"l": 184.40349, "t": 118.68206999999995, "r": 199.66519, "b": 127.20911000000001, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Financial", "bbox": {"l": 88.288223, "t": 114.35473999999988, "r": 118.80401, "b": 122.88176999999985, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "32%", "bbox": {"l": 136.24422, "t": 130.24408000000005, "r": 151.50592, "b": 138.77112, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Tenders", "bbox": {"l": 93.973373, "t": 187.65765, "r": 121.11515, "b": 196.18469000000005, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "6%", "bbox": {"l": 139.6235, "t": 170.22748, "r": 150.64458, "b": 178.75451999999996, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Laws", "bbox": {"l": 139.88339, "t": 212.50036999999998, "r": 157.68491, "b": 221.02739999999994, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "16%", "bbox": {"l": 157.43983, "t": 183.77808000000005, "r": 172.70154, "b": 192.30511, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Manuals", "bbox": {"l": 225.47252, "t": 189.29656999999997, "r": 254.29510000000002, "b": 197.82361000000003, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "21%", "bbox": {"l": 194.40683, "t": 171.12145999999996, "r": 209.66853, "b": 179.6485, "coord_origin": "TOPLEFT"}}], "children": [{"id": 14, "label": "text", "bbox": {"l": 237.11293, "t": 133.08716000000004, "r": 262.97623, "b": 141.61419999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 2, "text": "Patents", "bbox": {"l": 237.11293, "t": 133.08716000000004, "r": 262.97623, "b": 141.61419999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 202.87892, "t": 140.46178999999995, "r": 213.89999, "b": 148.98883, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 3, "text": "8%", "bbox": {"l": 202.87892, "t": 140.46178999999995, "r": 213.89999, "b": 148.98883, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 207.13306, "t": 93.1576500000001, "r": 237.64882999999998, "b": 101.68469000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 4, "text": "Scientific", "bbox": {"l": 207.13306, "t": 93.1576500000001, "r": 237.64882999999998, "b": 101.68469000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 184.40349, "t": 118.68206999999995, "r": 199.66519, "b": 127.20911000000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 5, "text": "17%", "bbox": {"l": 184.40349, "t": 118.68206999999995, "r": 199.66519, "b": 127.20911000000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 88.288223, "t": 114.35473999999988, "r": 118.80401, "b": 122.88176999999985, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": "Financial", "bbox": {"l": 88.288223, "t": 114.35473999999988, "r": 118.80401, "b": 122.88176999999985, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 136.24422, "t": 130.24408000000005, "r": 151.50592, "b": 138.77112, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "32%", "bbox": {"l": 136.24422, "t": 130.24408000000005, "r": 151.50592, "b": 138.77112, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 93.973373, "t": 187.65765, "r": 121.11515, "b": 196.18469000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "Tenders", "bbox": {"l": 93.973373, "t": 187.65765, "r": 121.11515, "b": 196.18469000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 139.6235, "t": 170.22748, "r": 150.64458, "b": 178.75451999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "6%", "bbox": {"l": 139.6235, "t": 170.22748, "r": 150.64458, "b": 178.75451999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 139.88339, "t": 212.50036999999998, "r": 157.68491, "b": 221.02739999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "Laws", "bbox": {"l": 139.88339, "t": 212.50036999999998, "r": 157.68491, "b": 221.02739999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 157.43983, "t": 183.77808000000005, "r": 172.70154, "b": 192.30511, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "16%", "bbox": {"l": 157.43983, "t": 183.77808000000005, "r": 172.70154, "b": 192.30511, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 225.47252, "t": 189.29656999999997, "r": 254.29510000000002, "b": 197.82361000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "Manuals", "bbox": {"l": 225.47252, "t": 189.29656999999997, "r": 254.29510000000002, "b": 197.82361000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 194.40683, "t": 171.12145999999996, "r": 209.66853, "b": 179.6485, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "21%", "bbox": {"l": 194.40683, "t": 171.12145999999996, "r": 209.66853, "b": 179.6485, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 9, "label": "caption", "bbox": {"l": 53.79800000000001, "t": 236.11499000000003, "r": 294.04373, "b": 255.54724, "coord_origin": "TOPLEFT"}, "confidence": 0.9425410628318787, "cells": [{"id": 14, "text": "Figure 2: Distribution of DocLayNet pages across document", "bbox": {"l": 53.79800000000001, "t": 236.11499000000003, "r": 294.04373, "b": 244.58826, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "categories.", "bbox": {"l": 53.79800000000001, "t": 247.07397000000003, "r": 96.756027, "b": 255.54724, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "text", "bbox": {"l": 53.79800000000001, "t": 281.8035300000001, "r": 294.27383, "b": 366.89017, "coord_origin": "TOPLEFT"}, "confidence": 0.9866551160812378, "cells": [{"id": 16, "text": "to a minimum, since they introduce difficulties in annotation (see", "bbox": {"l": 53.79800000000001, "t": 281.8035300000001, "r": 294.04605, "b": 290.17815999999993, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "Section 4). As a second condition, we focussed on medium to large", "bbox": {"l": 53.79800000000001, "t": 292.76254, "r": 294.04868, "b": 301.13718, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "documents (", "bbox": {"l": 53.79800000000001, "t": 303.72153, "r": 98.881348, "b": 312.09616, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": ">", "bbox": {"l": 99.070999, "t": 306.07971, "r": 104.77363, "b": 310.08768, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "10", "bbox": {"l": 107.46399999999998, "t": 303.72153, "r": 115.83373999999999, "b": 312.09616, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "pages) with technical content, dense in complex", "bbox": {"l": 118.08366, "t": 303.72153, "r": 294.26233, "b": 312.09616, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "tables, figures, plots and captions. Such documents carry a lot of", "bbox": {"l": 53.79800000000001, "t": 314.68054, "r": 294.04715, "b": 323.05518, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "information value, but are often hard to analyse with high accuracy", "bbox": {"l": 53.79800000000001, "t": 325.63855, "r": 294.27383, "b": 334.01318, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "due to their challenging layouts. Counterexamples of documents", "bbox": {"l": 53.79800000000001, "t": 336.59753, "r": 294.0416, "b": 344.97217, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "not included in the dataset are receipts, invoices, hand-written", "bbox": {"l": 53.79800000000001, "t": 347.5565500000001, "r": 294.04712, "b": 355.9311799999999, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "documents or photographs showing \u201ctext in the wild\".", "bbox": {"l": 53.79800000000001, "t": 358.51553, "r": 251.73131, "b": 366.89017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 53.57400100000001, "t": 369.47455, "r": 295.56046, "b": 509.35617, "coord_origin": "TOPLEFT"}, "confidence": 0.987700879573822, "cells": [{"id": 27, "text": "The pages in DocLayNet can be grouped into six distinct cate-", "bbox": {"l": 63.76100199999999, "t": 369.47455, "r": 295.55945, "b": 377.84918, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "gories, namely", "bbox": {"l": 53.79800000000001, "t": 380.43353, "r": 105.90533, "b": 388.80816999999996, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Financial Reports", "bbox": {"l": 107.754, "t": 380.47838999999993, "r": 167.4973, "b": 388.81714, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": ",", "bbox": {"l": 167.496, "t": 380.43353, "r": 169.42915, "b": 388.80816999999996, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Manuals", "bbox": {"l": 171.28101, "t": 380.47838999999993, "r": 201.45581, "b": 388.81714, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": ",", "bbox": {"l": 201.455, "t": 380.43353, "r": 203.38815, "b": 388.80816999999996, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "Scientific Articles", "bbox": {"l": 205.24001, "t": 380.47838999999993, "r": 264.55273, "b": 388.81714, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": ",", "bbox": {"l": 264.54901, "t": 380.43353, "r": 266.48218, "b": 388.80816999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "Laws &", "bbox": {"l": 268.33401, "t": 380.47838999999993, "r": 294.36133, "b": 388.81714, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Regulations", "bbox": {"l": 53.79800000000001, "t": 391.43741000000006, "r": 94.899666, "b": 399.77615, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": ",", "bbox": {"l": 94.900002, "t": 391.39255, "r": 96.862747, "b": 399.76718, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "Patents", "bbox": {"l": 99.109001, "t": 391.43741000000006, "r": 124.72282, "b": 399.77615, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "and", "bbox": {"l": 127.17899999999999, "t": 391.39255, "r": 140.60596, "b": 399.76718, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "Government Tenders", "bbox": {"l": 142.853, "t": 391.43741000000006, "r": 215.15340000000003, "b": 399.77615, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": ". Each document cate-", "bbox": {"l": 215.15601000000004, "t": 391.39255, "r": 295.55716, "b": 399.76718, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "gory was sourced from various repositories. For example, Financial", "bbox": {"l": 53.79800000000001, "t": 402.3515300000001, "r": 294.04535, "b": 410.72617, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Reports contain both", "bbox": {"l": 53.79800000000001, "t": 413.31055, "r": 132.19516, "b": 421.68518000000006, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "free-style", "bbox": {"l": 134.528, "t": 413.35541, "r": 167.77272, "b": 421.69415, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "format annual reports", "bbox": {"l": 170.314, "t": 413.31055, "r": 252.36031, "b": 421.68518000000006, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "2", "bbox": {"l": 252.356, "t": 411.24283, "r": 255.73781, "b": 418.03555, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "which ex-", "bbox": {"l": 258.56601, "t": 413.31055, "r": 295.56046, "b": 421.68518000000006, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "pose company-specific, artistic layouts as well as the more formal", "bbox": {"l": 53.79800000000001, "t": 424.26953, "r": 294.04376, "b": 432.6441699999999, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "SEC filings. The two largest categories (", "bbox": {"l": 53.79800000000001, "t": 435.22754000000003, "r": 197.59023, "b": 443.60217, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Financial Reports", "bbox": {"l": 197.591, "t": 435.27240000000006, "r": 258.02774, "b": 443.61115, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "and", "bbox": {"l": 260.48901, "t": 435.22754000000003, "r": 273.78104, "b": 443.60217, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Man-", "bbox": {"l": 276.03201, "t": 435.27240000000006, "r": 294.94113, "b": 443.61115, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "uals", "bbox": {"l": 53.79800000000001, "t": 446.23138, "r": 68.085777, "b": 454.57013, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": ") contain a large amount of free-style layouts in order to obtain", "bbox": {"l": 68.296997, "t": 446.18652, "r": 294.04565, "b": 454.56116, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "maximum variability. In the other four categories, we boosted the", "bbox": {"l": 53.79800000000001, "t": 457.14554, "r": 294.04163, "b": 465.52017, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "variability by mixing documents from independent providers, such", "bbox": {"l": 53.57400100000001, "t": 468.10455, "r": 294.04889, "b": 476.47919, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "as different government websites or publishers. In Figure 2, we", "bbox": {"l": 53.79800000000001, "t": 479.06354, "r": 294.04715, "b": 487.43817, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "show the document categories contained in DocLayNet with their", "bbox": {"l": 53.79800000000001, "t": 490.02255, "r": 294.21643, "b": 498.39719, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "respective sizes.", "bbox": {"l": 53.79800000000001, "t": 500.98154, "r": 112.2948, "b": 509.35617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 53.466999, "t": 511.94055, "r": 295.56155, "b": 607.98618, "coord_origin": "TOPLEFT"}, "confidence": 0.9877581000328064, "cells": [{"id": 60, "text": "We did not control the document selection with regard to lan-", "bbox": {"l": 63.76100199999999, "t": 511.94055, "r": 295.55954, "b": 520.31519, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "guage. The vast majority of documents contained in DocLayNet", "bbox": {"l": 53.79800000000001, "t": 522.89954, "r": 294.04718, "b": 531.27417, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "(close to 95%) are published in English language. However, Do-", "bbox": {"l": 53.528999, "t": 533.8585499999999, "r": 295.56155, "b": 542.23317, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "cLayNet also contains a number of documents in other languages", "bbox": {"l": 53.79800000000001, "t": 544.81755, "r": 294.04144, "b": 553.19217, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "such as German (2.5%), French (1.0%) and Japanese (1.0%). While", "bbox": {"l": 53.79800000000001, "t": 555.77556, "r": 294.04709, "b": 564.15018, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "the document language has negligible impact on the performance", "bbox": {"l": 53.79800000000001, "t": 566.73456, "r": 294.04163, "b": 575.10918, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "of computer vision methods such as object detection and segmenta-", "bbox": {"l": 53.79800000000001, "t": 577.6935599999999, "r": 295.5567, "b": 586.06818, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "tion models, it might prove challenging for layout analysis methods", "bbox": {"l": 53.79800000000001, "t": 588.65256, "r": 294.04541, "b": 597.02718, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "which exploit textual features.", "bbox": {"l": 53.466999, "t": 599.61156, "r": 164.39928, "b": 607.98618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 53.79800000000001, "t": 610.57056, "r": 295.56396, "b": 684.69817, "coord_origin": "TOPLEFT"}, "confidence": 0.9880735278129578, "cells": [{"id": 69, "text": "To ensure that future benchmarks in the document-layout analy-", "bbox": {"l": 63.76100199999999, "t": 610.57056, "r": 295.56396, "b": 618.9451799999999, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "sis community can be easily compared, we have split up DocLayNet", "bbox": {"l": 53.79800000000001, "t": 621.52956, "r": 294.04532, "b": 629.90417, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "into pre-defined train-, test- and validation-sets. In this way, we can", "bbox": {"l": 53.79800000000001, "t": 632.48856, "r": 294.04538, "b": 640.86317, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "avoid spurious variations in the evaluation scores due to random", "bbox": {"l": 53.79800000000001, "t": 643.4475600000001, "r": 294.04315, "b": 651.82217, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "splitting in train-, test- and validation-sets. We also ensured that", "bbox": {"l": 53.79800000000001, "t": 654.40656, "r": 294.04712, "b": 662.78117, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "less frequent labels are represented in train and test sets in equal", "bbox": {"l": 53.79800000000001, "t": 665.36456, "r": 294.04333, "b": 673.7391700000001, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "proportions.", "bbox": {"l": 53.79800000000001, "t": 676.32355, "r": 98.916931, "b": 684.69817, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "footnote", "bbox": {"l": 53.79800000000001, "t": 701.6563639999999, "r": 195.78998, "b": 708.169891, "coord_origin": "TOPLEFT"}, "confidence": 0.9048354029655457, "cells": [{"id": 76, "text": "$^{2}$e.g. AAPL from https://www.annualreports.com/", "bbox": {"l": 53.79800000000001, "t": 701.6563639999999, "r": 195.78998, "b": 708.169891, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 317.62299, "t": 87.36352999999997, "r": 559.19183, "b": 161.49114999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.986920952796936, "cells": [{"id": 77, "text": "Table 1 shows the overall frequency and distribution of the labels", "bbox": {"l": 327.918, "t": 87.36352999999997, "r": 558.20093, "b": 95.73816, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "among the different sets. Importantly, we ensure that subsets are", "bbox": {"l": 317.95499, "t": 98.32250999999997, "r": 558.20013, "b": 106.69713999999999, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "only split on full-document boundaries. This avoids that pages of", "bbox": {"l": 317.95499, "t": 109.28156000000001, "r": 558.20056, "b": 117.65618999999992, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "the same document are spread over train, test and validation set,", "bbox": {"l": 317.95499, "t": 120.24054000000001, "r": 559.19183, "b": 128.61517000000003, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "which can give an undesired evaluation advantage to models and", "bbox": {"l": 317.62299, "t": 131.19854999999995, "r": 558.20349, "b": 139.57317999999998, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "lead to overestimation of their prediction accuracy. We will show", "bbox": {"l": 317.95499, "t": 142.15752999999995, "r": 558.52936, "b": 150.53216999999995, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "the impact of this decision in Section 5.", "bbox": {"l": 317.95499, "t": 153.11652000000004, "r": 461.6416, "b": 161.49114999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "text", "bbox": {"l": 317.95499, "t": 164.07556, "r": 558.43811, "b": 271.0802, "coord_origin": "TOPLEFT"}, "confidence": 0.9860605001449585, "cells": [{"id": 84, "text": "In order to accommodate the different types of models currently", "bbox": {"l": 327.918, "t": 164.07556, "r": 558.43811, "b": 172.4502, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "in use by the community, we provide DocLayNet in an", "bbox": {"l": 317.95499, "t": 175.03454999999997, "r": 516.8219, "b": 183.40918, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "augmented", "bbox": {"l": 519.07501, "t": 175.07941000000005, "r": 558.20135, "b": 183.41814999999997, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "COCO format [16]. This entails the standard COCO ground-truth", "bbox": {"l": 317.95499, "t": 185.99352999999996, "r": 558.20325, "b": 194.36816, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "file (in JSON format) with the associated page images (in PNG", "bbox": {"l": 317.95499, "t": 196.95250999999996, "r": 558.20404, "b": 205.32714999999996, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "format, 1025", "bbox": {"l": 317.95499, "t": 207.91156, "r": 364.28769, "b": 216.28619000000003, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "\u00d7", "bbox": {"l": 364.28699, "t": 207.85779000000002, "r": 369.98962, "b": 215.55993999999998, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "1025 pixels). Furthermore, custom fields have been", "bbox": {"l": 369.98999, "t": 207.91156, "r": 558.20526, "b": 216.28619000000003, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "added to each COCO record to specify document category, original", "bbox": {"l": 317.95499, "t": 218.87054, "r": 558.20251, "b": 227.24518, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "document filename and page number. In addition, we also provide", "bbox": {"l": 317.95499, "t": 229.82952999999998, "r": 558.203, "b": 238.20416, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "the original PDF pages, as well as sidecar files containing parsed", "bbox": {"l": 317.95499, "t": 240.78754000000004, "r": 558.20404, "b": 249.16216999999995, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "PDF text and text-cell coordinates (in JSON). All additional files are", "bbox": {"l": 317.95499, "t": 251.74652000000003, "r": 558.20227, "b": 260.12114999999994, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "linked to the primary page images by their matching filenames.", "bbox": {"l": 317.95499, "t": 262.70556999999997, "r": 550.36414, "b": 271.0802, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "text", "bbox": {"l": 316.94199, "t": 273.66454999999996, "r": 559.72156, "b": 588.88918, "coord_origin": "TOPLEFT"}, "confidence": 0.9853296875953674, "cells": [{"id": 97, "text": "Despite being cost-intense and far less scalable than automation,", "bbox": {"l": 327.918, "t": 273.66454999999996, "r": 559.18488, "b": 282.03918, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "human annotation has several benefits over automated ground-", "bbox": {"l": 317.95499, "t": 284.62354, "r": 559.7132, "b": 292.99817, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "truth generation. The first and most obvious reason to leverage", "bbox": {"l": 317.95499, "t": 295.5825500000001, "r": 558.20416, "b": 303.95717999999994, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "human annotations is the freedom to annotate any type of doc-", "bbox": {"l": 317.95499, "t": 306.54153, "r": 559.71326, "b": 314.91617, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "ument without requiring a programmatic source. For most PDF", "bbox": {"l": 317.95499, "t": 317.50055, "r": 558.41443, "b": 325.87518, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "documents, the original source document is not available. The lat-", "bbox": {"l": 317.95499, "t": 328.4595299999999, "r": 559.71545, "b": 336.83417, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "ter is not a hard constraint with human annotation, but it is for", "bbox": {"l": 317.95499, "t": 339.41855000000004, "r": 558.36865, "b": 347.79318, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "automated methods. A second reason to use human annotations is", "bbox": {"l": 317.95499, "t": 350.37753, "r": 558.20062, "b": 358.75217, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "that the latter usually provide a more natural interpretation of the", "bbox": {"l": 317.95499, "t": 361.33554, "r": 558.20184, "b": 369.71017, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "page layout. The human-interpreted layout can significantly devi-", "bbox": {"l": 317.95499, "t": 372.29453, "r": 559.71442, "b": 380.66916, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "ate from the programmatic layout used in typesetting. For example,", "bbox": {"l": 317.95499, "t": 383.25354, "r": 559.1864, "b": 391.62817, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "\u201cinvisible\u201d tables might be used solely for aligning text paragraphs", "bbox": {"l": 316.94199, "t": 394.21252, "r": 558.20111, "b": 402.58716, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "on columns. Such typesetting tricks might be interpreted by au-", "bbox": {"l": 317.95499, "t": 405.17154, "r": 559.7132, "b": 413.54617, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "tomated methods incorrectly as an actual table, while the human", "bbox": {"l": 317.95499, "t": 416.13052, "r": 558.20013, "b": 424.50515999999993, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "annotation will interpret it correctly as", "bbox": {"l": 317.95499, "t": 427.08953999999994, "r": 464.50613, "b": 435.46417, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "Text", "bbox": {"l": 466.98199000000005, "t": 427.13439999999997, "r": 482.14560000000006, "b": 435.47313999999994, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "or other styles. The", "bbox": {"l": 485.13199000000003, "t": 427.08953999999994, "r": 558.19727, "b": 435.46417, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "same applies to multi-line text elements, when authors decided to", "bbox": {"l": 317.95499, "t": 438.04855, "r": 558.20221, "b": 446.4231899999999, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "space them as \u201cinvisible\u201d list elements without bullet symbols. A", "bbox": {"l": 317.95499, "t": 449.00754, "r": 558.51501, "b": 457.38217, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "third reason to gather ground-truth through human annotation is", "bbox": {"l": 317.95499, "t": 459.96655000000004, "r": 558.19855, "b": 468.34119, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "to estimate a \u201cnatural\u201d upper bound on the segmentation accuracy.", "bbox": {"l": 317.95499, "t": 470.92453, "r": 559.58215, "b": 479.29916, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "As we will show in Section 4, certain documents featuring complex", "bbox": {"l": 317.64099, "t": 481.88354, "r": 558.41559, "b": 490.25818, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "layouts can have different but equally acceptable layout interpre-", "bbox": {"l": 317.95499, "t": 492.84253, "r": 559.72156, "b": 501.21716, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "tations. This natural upper bound for segmentation accuracy can", "bbox": {"l": 317.95499, "t": 503.80154, "r": 558.19928, "b": 512.1761799999999, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "be found by annotating the same pages multiple times by different", "bbox": {"l": 317.95499, "t": 514.76053, "r": 558.20581, "b": 523.13516, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "people and evaluating the inter-annotator agreement. Such a base-", "bbox": {"l": 317.95499, "t": 525.71954, "r": 559.71729, "b": 534.09418, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "line consistency evaluation is very useful to define expectations", "bbox": {"l": 317.95499, "t": 536.6785600000001, "r": 558.20404, "b": 545.05318, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "for a good target accuracy in trained deep neural network models", "bbox": {"l": 317.95499, "t": 547.63756, "r": 558.20074, "b": 556.01218, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "and avoid overfitting (see Table 1). On the flip side, achieving high", "bbox": {"l": 317.95499, "t": 558.59656, "r": 558.20062, "b": 566.97118, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "annotation consistency proved to be a key challenge in human", "bbox": {"l": 317.95499, "t": 569.55556, "r": 558.20416, "b": 577.9301800000001, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "annotation, as we outline in Section 4.", "bbox": {"l": 317.95499, "t": 580.51456, "r": 457.62469, "b": 588.88918, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "section_header", "bbox": {"l": 317.95499, "t": 606.84991, "r": 470.21326, "b": 617.15901, "coord_origin": "TOPLEFT"}, "confidence": 0.9422591328620911, "cells": [{"id": 128, "text": "4", "bbox": {"l": 317.95499, "t": 606.84991, "r": 323.56226, "b": 617.15901, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "ANNOTATION CAMPAIGN", "bbox": {"l": 334.47134, "t": 606.84991, "r": 470.21326, "b": 617.15901, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "text", "bbox": {"l": 317.686, "t": 631.97356, "r": 559.71381, "b": 706.102173, "coord_origin": "TOPLEFT"}, "confidence": 0.9863831996917725, "cells": [{"id": 130, "text": "The annotation campaign was carried out in four phases. In phase", "bbox": {"l": 317.686, "t": 631.97356, "r": 558.20148, "b": 640.34818, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "one, we identified and prepared the data sources for annotation.", "bbox": {"l": 317.95499, "t": 642.93256, "r": 559.58521, "b": 651.30717, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "In phase two, we determined the class labels and how annotations", "bbox": {"l": 317.95499, "t": 653.89156, "r": 558.20007, "b": 662.26617, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "should be done on the documents in order to obtain maximum con-", "bbox": {"l": 317.95499, "t": 664.85056, "r": 559.71375, "b": 673.22517, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "sistency. The latter was guided by a detailed requirement analysis", "bbox": {"l": 317.95499, "t": 675.80956, "r": 558.20233, "b": 684.18417, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "and exhaustive experiments. In phase three, we trained the annota-", "bbox": {"l": 317.95499, "t": 686.76855, "r": 559.71381, "b": 695.143173, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "tion staff and performed exams for quality assurance. In phase four,", "bbox": {"l": 317.95499, "t": 697.7275539999999, "r": 559.1864, "b": 706.102173, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_header", "id": 13, "page_no": 2, "cluster": {"id": 13, "label": "page_header", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.891997754573822, "cells": [{"id": 0, "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis"}, {"label": "page_header", "id": 11, "page_no": 2, "cluster": {"id": 11, "label": "page_header", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.9104520082473755, "cells": [{"id": 1, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA"}, {"label": "picture", "id": 8, "page_no": 2, "cluster": {"id": 8, "label": "picture", "bbox": {"l": 88.33030700683594, "t": 92.88655090332031, "r": 263.7049560546875, "b": 220.5682373046875, "coord_origin": "TOPLEFT"}, "confidence": 0.9698190689086914, "cells": [{"id": 2, "text": "Patents", "bbox": {"l": 237.11293, "t": 133.08716000000004, "r": 262.97623, "b": 141.61419999999998, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "8%", "bbox": {"l": 202.87892, "t": 140.46178999999995, "r": 213.89999, "b": 148.98883, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Scientific", "bbox": {"l": 207.13306, "t": 93.1576500000001, "r": 237.64882999999998, "b": 101.68469000000005, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "17%", "bbox": {"l": 184.40349, "t": 118.68206999999995, "r": 199.66519, "b": 127.20911000000001, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Financial", "bbox": {"l": 88.288223, "t": 114.35473999999988, "r": 118.80401, "b": 122.88176999999985, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "32%", "bbox": {"l": 136.24422, "t": 130.24408000000005, "r": 151.50592, "b": 138.77112, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Tenders", "bbox": {"l": 93.973373, "t": 187.65765, "r": 121.11515, "b": 196.18469000000005, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "6%", "bbox": {"l": 139.6235, "t": 170.22748, "r": 150.64458, "b": 178.75451999999996, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Laws", "bbox": {"l": 139.88339, "t": 212.50036999999998, "r": 157.68491, "b": 221.02739999999994, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "16%", "bbox": {"l": 157.43983, "t": 183.77808000000005, "r": 172.70154, "b": 192.30511, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Manuals", "bbox": {"l": 225.47252, "t": 189.29656999999997, "r": 254.29510000000002, "b": 197.82361000000003, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "21%", "bbox": {"l": 194.40683, "t": 171.12145999999996, "r": 209.66853, "b": 179.6485, "coord_origin": "TOPLEFT"}}], "children": [{"id": 14, "label": "text", "bbox": {"l": 237.11293, "t": 133.08716000000004, "r": 262.97623, "b": 141.61419999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 2, "text": "Patents", "bbox": {"l": 237.11293, "t": 133.08716000000004, "r": 262.97623, "b": 141.61419999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 202.87892, "t": 140.46178999999995, "r": 213.89999, "b": 148.98883, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 3, "text": "8%", "bbox": {"l": 202.87892, "t": 140.46178999999995, "r": 213.89999, "b": 148.98883, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 207.13306, "t": 93.1576500000001, "r": 237.64882999999998, "b": 101.68469000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 4, "text": "Scientific", "bbox": {"l": 207.13306, "t": 93.1576500000001, "r": 237.64882999999998, "b": 101.68469000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 184.40349, "t": 118.68206999999995, "r": 199.66519, "b": 127.20911000000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 5, "text": "17%", "bbox": {"l": 184.40349, "t": 118.68206999999995, "r": 199.66519, "b": 127.20911000000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 88.288223, "t": 114.35473999999988, "r": 118.80401, "b": 122.88176999999985, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": "Financial", "bbox": {"l": 88.288223, "t": 114.35473999999988, "r": 118.80401, "b": 122.88176999999985, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 136.24422, "t": 130.24408000000005, "r": 151.50592, "b": 138.77112, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "32%", "bbox": {"l": 136.24422, "t": 130.24408000000005, "r": 151.50592, "b": 138.77112, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 93.973373, "t": 187.65765, "r": 121.11515, "b": 196.18469000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "Tenders", "bbox": {"l": 93.973373, "t": 187.65765, "r": 121.11515, "b": 196.18469000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 139.6235, "t": 170.22748, "r": 150.64458, "b": 178.75451999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "6%", "bbox": {"l": 139.6235, "t": 170.22748, "r": 150.64458, "b": 178.75451999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 139.88339, "t": 212.50036999999998, "r": 157.68491, "b": 221.02739999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "Laws", "bbox": {"l": 139.88339, "t": 212.50036999999998, "r": 157.68491, "b": 221.02739999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 157.43983, "t": 183.77808000000005, "r": 172.70154, "b": 192.30511, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "16%", "bbox": {"l": 157.43983, "t": 183.77808000000005, "r": 172.70154, "b": 192.30511, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 225.47252, "t": 189.29656999999997, "r": 254.29510000000002, "b": 197.82361000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "Manuals", "bbox": {"l": 225.47252, "t": 189.29656999999997, "r": 254.29510000000002, "b": 197.82361000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 194.40683, "t": 171.12145999999996, "r": 209.66853, "b": 179.6485, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "21%", "bbox": {"l": 194.40683, "t": 171.12145999999996, "r": 209.66853, "b": 179.6485, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "caption", "id": 9, "page_no": 2, "cluster": {"id": 9, "label": "caption", "bbox": {"l": 53.79800000000001, "t": 236.11499000000003, "r": 294.04373, "b": 255.54724, "coord_origin": "TOPLEFT"}, "confidence": 0.9425410628318787, "cells": [{"id": 14, "text": "Figure 2: Distribution of DocLayNet pages across document", "bbox": {"l": 53.79800000000001, "t": 236.11499000000003, "r": 294.04373, "b": 244.58826, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "categories.", "bbox": {"l": 53.79800000000001, "t": 247.07397000000003, "r": 96.756027, "b": 255.54724, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 2: Distribution of DocLayNet pages across document categories."}, {"label": "text", "id": 4, "page_no": 2, "cluster": {"id": 4, "label": "text", "bbox": {"l": 53.79800000000001, "t": 281.8035300000001, "r": 294.27383, "b": 366.89017, "coord_origin": "TOPLEFT"}, "confidence": 0.9866551160812378, "cells": [{"id": 16, "text": "to a minimum, since they introduce difficulties in annotation (see", "bbox": {"l": 53.79800000000001, "t": 281.8035300000001, "r": 294.04605, "b": 290.17815999999993, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "Section 4). As a second condition, we focussed on medium to large", "bbox": {"l": 53.79800000000001, "t": 292.76254, "r": 294.04868, "b": 301.13718, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "documents (", "bbox": {"l": 53.79800000000001, "t": 303.72153, "r": 98.881348, "b": 312.09616, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": ">", "bbox": {"l": 99.070999, "t": 306.07971, "r": 104.77363, "b": 310.08768, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "10", "bbox": {"l": 107.46399999999998, "t": 303.72153, "r": 115.83373999999999, "b": 312.09616, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "pages) with technical content, dense in complex", "bbox": {"l": 118.08366, "t": 303.72153, "r": 294.26233, "b": 312.09616, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "tables, figures, plots and captions. Such documents carry a lot of", "bbox": {"l": 53.79800000000001, "t": 314.68054, "r": 294.04715, "b": 323.05518, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "information value, but are often hard to analyse with high accuracy", "bbox": {"l": 53.79800000000001, "t": 325.63855, "r": 294.27383, "b": 334.01318, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "due to their challenging layouts. Counterexamples of documents", "bbox": {"l": 53.79800000000001, "t": 336.59753, "r": 294.0416, "b": 344.97217, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "not included in the dataset are receipts, invoices, hand-written", "bbox": {"l": 53.79800000000001, "t": 347.5565500000001, "r": 294.04712, "b": 355.9311799999999, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "documents or photographs showing \u201ctext in the wild\".", "bbox": {"l": 53.79800000000001, "t": 358.51553, "r": 251.73131, "b": 366.89017, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "to a minimum, since they introduce difficulties in annotation (see Section 4). As a second condition, we focussed on medium to large documents ( > 10 pages) with technical content, dense in complex tables, figures, plots and captions. Such documents carry a lot of information value, but are often hard to analyse with high accuracy due to their challenging layouts. Counterexamples of documents not included in the dataset are receipts, invoices, hand-written documents or photographs showing \u201ctext in the wild\"."}, {"label": "text", "id": 2, "page_no": 2, "cluster": {"id": 2, "label": "text", "bbox": {"l": 53.57400100000001, "t": 369.47455, "r": 295.56046, "b": 509.35617, "coord_origin": "TOPLEFT"}, "confidence": 0.987700879573822, "cells": [{"id": 27, "text": "The pages in DocLayNet can be grouped into six distinct cate-", "bbox": {"l": 63.76100199999999, "t": 369.47455, "r": 295.55945, "b": 377.84918, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "gories, namely", "bbox": {"l": 53.79800000000001, "t": 380.43353, "r": 105.90533, "b": 388.80816999999996, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Financial Reports", "bbox": {"l": 107.754, "t": 380.47838999999993, "r": 167.4973, "b": 388.81714, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": ",", "bbox": {"l": 167.496, "t": 380.43353, "r": 169.42915, "b": 388.80816999999996, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Manuals", "bbox": {"l": 171.28101, "t": 380.47838999999993, "r": 201.45581, "b": 388.81714, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": ",", "bbox": {"l": 201.455, "t": 380.43353, "r": 203.38815, "b": 388.80816999999996, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "Scientific Articles", "bbox": {"l": 205.24001, "t": 380.47838999999993, "r": 264.55273, "b": 388.81714, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": ",", "bbox": {"l": 264.54901, "t": 380.43353, "r": 266.48218, "b": 388.80816999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "Laws &", "bbox": {"l": 268.33401, "t": 380.47838999999993, "r": 294.36133, "b": 388.81714, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Regulations", "bbox": {"l": 53.79800000000001, "t": 391.43741000000006, "r": 94.899666, "b": 399.77615, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": ",", "bbox": {"l": 94.900002, "t": 391.39255, "r": 96.862747, "b": 399.76718, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "Patents", "bbox": {"l": 99.109001, "t": 391.43741000000006, "r": 124.72282, "b": 399.77615, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "and", "bbox": {"l": 127.17899999999999, "t": 391.39255, "r": 140.60596, "b": 399.76718, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "Government Tenders", "bbox": {"l": 142.853, "t": 391.43741000000006, "r": 215.15340000000003, "b": 399.77615, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": ". Each document cate-", "bbox": {"l": 215.15601000000004, "t": 391.39255, "r": 295.55716, "b": 399.76718, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "gory was sourced from various repositories. For example, Financial", "bbox": {"l": 53.79800000000001, "t": 402.3515300000001, "r": 294.04535, "b": 410.72617, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Reports contain both", "bbox": {"l": 53.79800000000001, "t": 413.31055, "r": 132.19516, "b": 421.68518000000006, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "free-style", "bbox": {"l": 134.528, "t": 413.35541, "r": 167.77272, "b": 421.69415, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "format annual reports", "bbox": {"l": 170.314, "t": 413.31055, "r": 252.36031, "b": 421.68518000000006, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "2", "bbox": {"l": 252.356, "t": 411.24283, "r": 255.73781, "b": 418.03555, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "which ex-", "bbox": {"l": 258.56601, "t": 413.31055, "r": 295.56046, "b": 421.68518000000006, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "pose company-specific, artistic layouts as well as the more formal", "bbox": {"l": 53.79800000000001, "t": 424.26953, "r": 294.04376, "b": 432.6441699999999, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "SEC filings. The two largest categories (", "bbox": {"l": 53.79800000000001, "t": 435.22754000000003, "r": 197.59023, "b": 443.60217, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Financial Reports", "bbox": {"l": 197.591, "t": 435.27240000000006, "r": 258.02774, "b": 443.61115, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "and", "bbox": {"l": 260.48901, "t": 435.22754000000003, "r": 273.78104, "b": 443.60217, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Man-", "bbox": {"l": 276.03201, "t": 435.27240000000006, "r": 294.94113, "b": 443.61115, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "uals", "bbox": {"l": 53.79800000000001, "t": 446.23138, "r": 68.085777, "b": 454.57013, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": ") contain a large amount of free-style layouts in order to obtain", "bbox": {"l": 68.296997, "t": 446.18652, "r": 294.04565, "b": 454.56116, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "maximum variability. In the other four categories, we boosted the", "bbox": {"l": 53.79800000000001, "t": 457.14554, "r": 294.04163, "b": 465.52017, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "variability by mixing documents from independent providers, such", "bbox": {"l": 53.57400100000001, "t": 468.10455, "r": 294.04889, "b": 476.47919, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "as different government websites or publishers. In Figure 2, we", "bbox": {"l": 53.79800000000001, "t": 479.06354, "r": 294.04715, "b": 487.43817, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "show the document categories contained in DocLayNet with their", "bbox": {"l": 53.79800000000001, "t": 490.02255, "r": 294.21643, "b": 498.39719, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "respective sizes.", "bbox": {"l": 53.79800000000001, "t": 500.98154, "r": 112.2948, "b": 509.35617, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The pages in DocLayNet can be grouped into six distinct categories, namely Financial Reports , Manuals , Scientific Articles , Laws & Regulations , Patents and Government Tenders . Each document category was sourced from various repositories. For example, Financial Reports contain both free-style format annual reports 2 which expose company-specific, artistic layouts as well as the more formal SEC filings. The two largest categories ( Financial Reports and Manuals ) contain a large amount of free-style layouts in order to obtain maximum variability. In the other four categories, we boosted the variability by mixing documents from independent providers, such as different government websites or publishers. In Figure 2, we show the document categories contained in DocLayNet with their respective sizes."}, {"label": "text", "id": 1, "page_no": 2, "cluster": {"id": 1, "label": "text", "bbox": {"l": 53.466999, "t": 511.94055, "r": 295.56155, "b": 607.98618, "coord_origin": "TOPLEFT"}, "confidence": 0.9877581000328064, "cells": [{"id": 60, "text": "We did not control the document selection with regard to lan-", "bbox": {"l": 63.76100199999999, "t": 511.94055, "r": 295.55954, "b": 520.31519, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "guage. The vast majority of documents contained in DocLayNet", "bbox": {"l": 53.79800000000001, "t": 522.89954, "r": 294.04718, "b": 531.27417, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "(close to 95%) are published in English language. However, Do-", "bbox": {"l": 53.528999, "t": 533.8585499999999, "r": 295.56155, "b": 542.23317, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "cLayNet also contains a number of documents in other languages", "bbox": {"l": 53.79800000000001, "t": 544.81755, "r": 294.04144, "b": 553.19217, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "such as German (2.5%), French (1.0%) and Japanese (1.0%). While", "bbox": {"l": 53.79800000000001, "t": 555.77556, "r": 294.04709, "b": 564.15018, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "the document language has negligible impact on the performance", "bbox": {"l": 53.79800000000001, "t": 566.73456, "r": 294.04163, "b": 575.10918, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "of computer vision methods such as object detection and segmenta-", "bbox": {"l": 53.79800000000001, "t": 577.6935599999999, "r": 295.5567, "b": 586.06818, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "tion models, it might prove challenging for layout analysis methods", "bbox": {"l": 53.79800000000001, "t": 588.65256, "r": 294.04541, "b": 597.02718, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "which exploit textual features.", "bbox": {"l": 53.466999, "t": 599.61156, "r": 164.39928, "b": 607.98618, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "We did not control the document selection with regard to language. The vast majority of documents contained in DocLayNet (close to 95%) are published in English language. However, DocLayNet also contains a number of documents in other languages such as German (2.5%), French (1.0%) and Japanese (1.0%). While the document language has negligible impact on the performance of computer vision methods such as object detection and segmentation models, it might prove challenging for layout analysis methods which exploit textual features."}, {"label": "text", "id": 0, "page_no": 2, "cluster": {"id": 0, "label": "text", "bbox": {"l": 53.79800000000001, "t": 610.57056, "r": 295.56396, "b": 684.69817, "coord_origin": "TOPLEFT"}, "confidence": 0.9880735278129578, "cells": [{"id": 69, "text": "To ensure that future benchmarks in the document-layout analy-", "bbox": {"l": 63.76100199999999, "t": 610.57056, "r": 295.56396, "b": 618.9451799999999, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "sis community can be easily compared, we have split up DocLayNet", "bbox": {"l": 53.79800000000001, "t": 621.52956, "r": 294.04532, "b": 629.90417, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "into pre-defined train-, test- and validation-sets. In this way, we can", "bbox": {"l": 53.79800000000001, "t": 632.48856, "r": 294.04538, "b": 640.86317, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "avoid spurious variations in the evaluation scores due to random", "bbox": {"l": 53.79800000000001, "t": 643.4475600000001, "r": 294.04315, "b": 651.82217, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "splitting in train-, test- and validation-sets. We also ensured that", "bbox": {"l": 53.79800000000001, "t": 654.40656, "r": 294.04712, "b": 662.78117, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "less frequent labels are represented in train and test sets in equal", "bbox": {"l": 53.79800000000001, "t": 665.36456, "r": 294.04333, "b": 673.7391700000001, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "proportions.", "bbox": {"l": 53.79800000000001, "t": 676.32355, "r": 98.916931, "b": 684.69817, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "To ensure that future benchmarks in the document-layout analysis community can be easily compared, we have split up DocLayNet into pre-defined train-, test- and validation-sets. In this way, we can avoid spurious variations in the evaluation scores due to random splitting in train-, test- and validation-sets. We also ensured that less frequent labels are represented in train and test sets in equal proportions."}, {"label": "footnote", "id": 12, "page_no": 2, "cluster": {"id": 12, "label": "footnote", "bbox": {"l": 53.79800000000001, "t": 701.6563639999999, "r": 195.78998, "b": 708.169891, "coord_origin": "TOPLEFT"}, "confidence": 0.9048354029655457, "cells": [{"id": 76, "text": "$^{2}$e.g. AAPL from https://www.annualreports.com/", "bbox": {"l": 53.79800000000001, "t": 701.6563639999999, "r": 195.78998, "b": 708.169891, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "$^{2}$e.g. AAPL from https://www.annualreports.com/"}, {"label": "text", "id": 3, "page_no": 2, "cluster": {"id": 3, "label": "text", "bbox": {"l": 317.62299, "t": 87.36352999999997, "r": 559.19183, "b": 161.49114999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.986920952796936, "cells": [{"id": 77, "text": "Table 1 shows the overall frequency and distribution of the labels", "bbox": {"l": 327.918, "t": 87.36352999999997, "r": 558.20093, "b": 95.73816, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "among the different sets. Importantly, we ensure that subsets are", "bbox": {"l": 317.95499, "t": 98.32250999999997, "r": 558.20013, "b": 106.69713999999999, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "only split on full-document boundaries. This avoids that pages of", "bbox": {"l": 317.95499, "t": 109.28156000000001, "r": 558.20056, "b": 117.65618999999992, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "the same document are spread over train, test and validation set,", "bbox": {"l": 317.95499, "t": 120.24054000000001, "r": 559.19183, "b": 128.61517000000003, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "which can give an undesired evaluation advantage to models and", "bbox": {"l": 317.62299, "t": 131.19854999999995, "r": 558.20349, "b": 139.57317999999998, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "lead to overestimation of their prediction accuracy. We will show", "bbox": {"l": 317.95499, "t": 142.15752999999995, "r": 558.52936, "b": 150.53216999999995, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "the impact of this decision in Section 5.", "bbox": {"l": 317.95499, "t": 153.11652000000004, "r": 461.6416, "b": 161.49114999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 1 shows the overall frequency and distribution of the labels among the different sets. Importantly, we ensure that subsets are only split on full-document boundaries. This avoids that pages of the same document are spread over train, test and validation set, which can give an undesired evaluation advantage to models and lead to overestimation of their prediction accuracy. We will show the impact of this decision in Section 5."}, {"label": "text", "id": 6, "page_no": 2, "cluster": {"id": 6, "label": "text", "bbox": {"l": 317.95499, "t": 164.07556, "r": 558.43811, "b": 271.0802, "coord_origin": "TOPLEFT"}, "confidence": 0.9860605001449585, "cells": [{"id": 84, "text": "In order to accommodate the different types of models currently", "bbox": {"l": 327.918, "t": 164.07556, "r": 558.43811, "b": 172.4502, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "in use by the community, we provide DocLayNet in an", "bbox": {"l": 317.95499, "t": 175.03454999999997, "r": 516.8219, "b": 183.40918, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "augmented", "bbox": {"l": 519.07501, "t": 175.07941000000005, "r": 558.20135, "b": 183.41814999999997, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "COCO format [16]. This entails the standard COCO ground-truth", "bbox": {"l": 317.95499, "t": 185.99352999999996, "r": 558.20325, "b": 194.36816, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "file (in JSON format) with the associated page images (in PNG", "bbox": {"l": 317.95499, "t": 196.95250999999996, "r": 558.20404, "b": 205.32714999999996, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "format, 1025", "bbox": {"l": 317.95499, "t": 207.91156, "r": 364.28769, "b": 216.28619000000003, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "\u00d7", "bbox": {"l": 364.28699, "t": 207.85779000000002, "r": 369.98962, "b": 215.55993999999998, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "1025 pixels). Furthermore, custom fields have been", "bbox": {"l": 369.98999, "t": 207.91156, "r": 558.20526, "b": 216.28619000000003, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "added to each COCO record to specify document category, original", "bbox": {"l": 317.95499, "t": 218.87054, "r": 558.20251, "b": 227.24518, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "document filename and page number. In addition, we also provide", "bbox": {"l": 317.95499, "t": 229.82952999999998, "r": 558.203, "b": 238.20416, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "the original PDF pages, as well as sidecar files containing parsed", "bbox": {"l": 317.95499, "t": 240.78754000000004, "r": 558.20404, "b": 249.16216999999995, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "PDF text and text-cell coordinates (in JSON). All additional files are", "bbox": {"l": 317.95499, "t": 251.74652000000003, "r": 558.20227, "b": 260.12114999999994, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "linked to the primary page images by their matching filenames.", "bbox": {"l": 317.95499, "t": 262.70556999999997, "r": 550.36414, "b": 271.0802, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In order to accommodate the different types of models currently in use by the community, we provide DocLayNet in an augmented COCO format [16]. This entails the standard COCO ground-truth file (in JSON format) with the associated page images (in PNG format, 1025 \u00d7 1025 pixels). Furthermore, custom fields have been added to each COCO record to specify document category, original document filename and page number. In addition, we also provide the original PDF pages, as well as sidecar files containing parsed PDF text and text-cell coordinates (in JSON). All additional files are linked to the primary page images by their matching filenames."}, {"label": "text", "id": 7, "page_no": 2, "cluster": {"id": 7, "label": "text", "bbox": {"l": 316.94199, "t": 273.66454999999996, "r": 559.72156, "b": 588.88918, "coord_origin": "TOPLEFT"}, "confidence": 0.9853296875953674, "cells": [{"id": 97, "text": "Despite being cost-intense and far less scalable than automation,", "bbox": {"l": 327.918, "t": 273.66454999999996, "r": 559.18488, "b": 282.03918, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "human annotation has several benefits over automated ground-", "bbox": {"l": 317.95499, "t": 284.62354, "r": 559.7132, "b": 292.99817, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "truth generation. The first and most obvious reason to leverage", "bbox": {"l": 317.95499, "t": 295.5825500000001, "r": 558.20416, "b": 303.95717999999994, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "human annotations is the freedom to annotate any type of doc-", "bbox": {"l": 317.95499, "t": 306.54153, "r": 559.71326, "b": 314.91617, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "ument without requiring a programmatic source. For most PDF", "bbox": {"l": 317.95499, "t": 317.50055, "r": 558.41443, "b": 325.87518, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "documents, the original source document is not available. The lat-", "bbox": {"l": 317.95499, "t": 328.4595299999999, "r": 559.71545, "b": 336.83417, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "ter is not a hard constraint with human annotation, but it is for", "bbox": {"l": 317.95499, "t": 339.41855000000004, "r": 558.36865, "b": 347.79318, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "automated methods. A second reason to use human annotations is", "bbox": {"l": 317.95499, "t": 350.37753, "r": 558.20062, "b": 358.75217, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "that the latter usually provide a more natural interpretation of the", "bbox": {"l": 317.95499, "t": 361.33554, "r": 558.20184, "b": 369.71017, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "page layout. The human-interpreted layout can significantly devi-", "bbox": {"l": 317.95499, "t": 372.29453, "r": 559.71442, "b": 380.66916, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "ate from the programmatic layout used in typesetting. For example,", "bbox": {"l": 317.95499, "t": 383.25354, "r": 559.1864, "b": 391.62817, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "\u201cinvisible\u201d tables might be used solely for aligning text paragraphs", "bbox": {"l": 316.94199, "t": 394.21252, "r": 558.20111, "b": 402.58716, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "on columns. Such typesetting tricks might be interpreted by au-", "bbox": {"l": 317.95499, "t": 405.17154, "r": 559.7132, "b": 413.54617, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "tomated methods incorrectly as an actual table, while the human", "bbox": {"l": 317.95499, "t": 416.13052, "r": 558.20013, "b": 424.50515999999993, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "annotation will interpret it correctly as", "bbox": {"l": 317.95499, "t": 427.08953999999994, "r": 464.50613, "b": 435.46417, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "Text", "bbox": {"l": 466.98199000000005, "t": 427.13439999999997, "r": 482.14560000000006, "b": 435.47313999999994, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "or other styles. The", "bbox": {"l": 485.13199000000003, "t": 427.08953999999994, "r": 558.19727, "b": 435.46417, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "same applies to multi-line text elements, when authors decided to", "bbox": {"l": 317.95499, "t": 438.04855, "r": 558.20221, "b": 446.4231899999999, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "space them as \u201cinvisible\u201d list elements without bullet symbols. A", "bbox": {"l": 317.95499, "t": 449.00754, "r": 558.51501, "b": 457.38217, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "third reason to gather ground-truth through human annotation is", "bbox": {"l": 317.95499, "t": 459.96655000000004, "r": 558.19855, "b": 468.34119, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "to estimate a \u201cnatural\u201d upper bound on the segmentation accuracy.", "bbox": {"l": 317.95499, "t": 470.92453, "r": 559.58215, "b": 479.29916, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "As we will show in Section 4, certain documents featuring complex", "bbox": {"l": 317.64099, "t": 481.88354, "r": 558.41559, "b": 490.25818, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "layouts can have different but equally acceptable layout interpre-", "bbox": {"l": 317.95499, "t": 492.84253, "r": 559.72156, "b": 501.21716, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "tations. This natural upper bound for segmentation accuracy can", "bbox": {"l": 317.95499, "t": 503.80154, "r": 558.19928, "b": 512.1761799999999, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "be found by annotating the same pages multiple times by different", "bbox": {"l": 317.95499, "t": 514.76053, "r": 558.20581, "b": 523.13516, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "people and evaluating the inter-annotator agreement. Such a base-", "bbox": {"l": 317.95499, "t": 525.71954, "r": 559.71729, "b": 534.09418, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "line consistency evaluation is very useful to define expectations", "bbox": {"l": 317.95499, "t": 536.6785600000001, "r": 558.20404, "b": 545.05318, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "for a good target accuracy in trained deep neural network models", "bbox": {"l": 317.95499, "t": 547.63756, "r": 558.20074, "b": 556.01218, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "and avoid overfitting (see Table 1). On the flip side, achieving high", "bbox": {"l": 317.95499, "t": 558.59656, "r": 558.20062, "b": 566.97118, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "annotation consistency proved to be a key challenge in human", "bbox": {"l": 317.95499, "t": 569.55556, "r": 558.20416, "b": 577.9301800000001, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "annotation, as we outline in Section 4.", "bbox": {"l": 317.95499, "t": 580.51456, "r": 457.62469, "b": 588.88918, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Despite being cost-intense and far less scalable than automation, human annotation has several benefits over automated groundtruth generation. The first and most obvious reason to leverage human annotations is the freedom to annotate any type of document without requiring a programmatic source. For most PDF documents, the original source document is not available. The latter is not a hard constraint with human annotation, but it is for automated methods. A second reason to use human annotations is that the latter usually provide a more natural interpretation of the page layout. The human-interpreted layout can significantly deviate from the programmatic layout used in typesetting. For example, \u201cinvisible\u201d tables might be used solely for aligning text paragraphs on columns. Such typesetting tricks might be interpreted by automated methods incorrectly as an actual table, while the human annotation will interpret it correctly as Text or other styles. The same applies to multi-line text elements, when authors decided to space them as \u201cinvisible\u201d list elements without bullet symbols. A third reason to gather ground-truth through human annotation is to estimate a \u201cnatural\u201d upper bound on the segmentation accuracy. As we will show in Section 4, certain documents featuring complex layouts can have different but equally acceptable layout interpretations. This natural upper bound for segmentation accuracy can be found by annotating the same pages multiple times by different people and evaluating the inter-annotator agreement. Such a baseline consistency evaluation is very useful to define expectations for a good target accuracy in trained deep neural network models and avoid overfitting (see Table 1). On the flip side, achieving high annotation consistency proved to be a key challenge in human annotation, as we outline in Section 4."}, {"label": "section_header", "id": 10, "page_no": 2, "cluster": {"id": 10, "label": "section_header", "bbox": {"l": 317.95499, "t": 606.84991, "r": 470.21326, "b": 617.15901, "coord_origin": "TOPLEFT"}, "confidence": 0.9422591328620911, "cells": [{"id": 128, "text": "4", "bbox": {"l": 317.95499, "t": 606.84991, "r": 323.56226, "b": 617.15901, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "ANNOTATION CAMPAIGN", "bbox": {"l": 334.47134, "t": 606.84991, "r": 470.21326, "b": 617.15901, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4 ANNOTATION CAMPAIGN"}, {"label": "text", "id": 5, "page_no": 2, "cluster": {"id": 5, "label": "text", "bbox": {"l": 317.686, "t": 631.97356, "r": 559.71381, "b": 706.102173, "coord_origin": "TOPLEFT"}, "confidence": 0.9863831996917725, "cells": [{"id": 130, "text": "The annotation campaign was carried out in four phases. In phase", "bbox": {"l": 317.686, "t": 631.97356, "r": 558.20148, "b": 640.34818, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "one, we identified and prepared the data sources for annotation.", "bbox": {"l": 317.95499, "t": 642.93256, "r": 559.58521, "b": 651.30717, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "In phase two, we determined the class labels and how annotations", "bbox": {"l": 317.95499, "t": 653.89156, "r": 558.20007, "b": 662.26617, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "should be done on the documents in order to obtain maximum con-", "bbox": {"l": 317.95499, "t": 664.85056, "r": 559.71375, "b": 673.22517, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "sistency. The latter was guided by a detailed requirement analysis", "bbox": {"l": 317.95499, "t": 675.80956, "r": 558.20233, "b": 684.18417, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "and exhaustive experiments. In phase three, we trained the annota-", "bbox": {"l": 317.95499, "t": 686.76855, "r": 559.71381, "b": 695.143173, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "tion staff and performed exams for quality assurance. In phase four,", "bbox": {"l": 317.95499, "t": 697.7275539999999, "r": 559.1864, "b": 706.102173, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The annotation campaign was carried out in four phases. In phase one, we identified and prepared the data sources for annotation. In phase two, we determined the class labels and how annotations should be done on the documents in order to obtain maximum consistency. The latter was guided by a detailed requirement analysis and exhaustive experiments. In phase three, we trained the annotation staff and performed exams for quality assurance. In phase four,"}], "body": [{"label": "picture", "id": 8, "page_no": 2, "cluster": {"id": 8, "label": "picture", "bbox": {"l": 88.33030700683594, "t": 92.88655090332031, "r": 263.7049560546875, "b": 220.5682373046875, "coord_origin": "TOPLEFT"}, "confidence": 0.9698190689086914, "cells": [{"id": 2, "text": "Patents", "bbox": {"l": 237.11293, "t": 133.08716000000004, "r": 262.97623, "b": 141.61419999999998, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "8%", "bbox": {"l": 202.87892, "t": 140.46178999999995, "r": 213.89999, "b": 148.98883, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Scientific", "bbox": {"l": 207.13306, "t": 93.1576500000001, "r": 237.64882999999998, "b": 101.68469000000005, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "17%", "bbox": {"l": 184.40349, "t": 118.68206999999995, "r": 199.66519, "b": 127.20911000000001, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Financial", "bbox": {"l": 88.288223, "t": 114.35473999999988, "r": 118.80401, "b": 122.88176999999985, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "32%", "bbox": {"l": 136.24422, "t": 130.24408000000005, "r": 151.50592, "b": 138.77112, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Tenders", "bbox": {"l": 93.973373, "t": 187.65765, "r": 121.11515, "b": 196.18469000000005, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "6%", "bbox": {"l": 139.6235, "t": 170.22748, "r": 150.64458, "b": 178.75451999999996, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Laws", "bbox": {"l": 139.88339, "t": 212.50036999999998, "r": 157.68491, "b": 221.02739999999994, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "16%", "bbox": {"l": 157.43983, "t": 183.77808000000005, "r": 172.70154, "b": 192.30511, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Manuals", "bbox": {"l": 225.47252, "t": 189.29656999999997, "r": 254.29510000000002, "b": 197.82361000000003, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "21%", "bbox": {"l": 194.40683, "t": 171.12145999999996, "r": 209.66853, "b": 179.6485, "coord_origin": "TOPLEFT"}}], "children": [{"id": 14, "label": "text", "bbox": {"l": 237.11293, "t": 133.08716000000004, "r": 262.97623, "b": 141.61419999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 2, "text": "Patents", "bbox": {"l": 237.11293, "t": 133.08716000000004, "r": 262.97623, "b": 141.61419999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 202.87892, "t": 140.46178999999995, "r": 213.89999, "b": 148.98883, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 3, "text": "8%", "bbox": {"l": 202.87892, "t": 140.46178999999995, "r": 213.89999, "b": 148.98883, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 207.13306, "t": 93.1576500000001, "r": 237.64882999999998, "b": 101.68469000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 4, "text": "Scientific", "bbox": {"l": 207.13306, "t": 93.1576500000001, "r": 237.64882999999998, "b": 101.68469000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 184.40349, "t": 118.68206999999995, "r": 199.66519, "b": 127.20911000000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 5, "text": "17%", "bbox": {"l": 184.40349, "t": 118.68206999999995, "r": 199.66519, "b": 127.20911000000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 88.288223, "t": 114.35473999999988, "r": 118.80401, "b": 122.88176999999985, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": "Financial", "bbox": {"l": 88.288223, "t": 114.35473999999988, "r": 118.80401, "b": 122.88176999999985, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 136.24422, "t": 130.24408000000005, "r": 151.50592, "b": 138.77112, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "32%", "bbox": {"l": 136.24422, "t": 130.24408000000005, "r": 151.50592, "b": 138.77112, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 93.973373, "t": 187.65765, "r": 121.11515, "b": 196.18469000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "Tenders", "bbox": {"l": 93.973373, "t": 187.65765, "r": 121.11515, "b": 196.18469000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 139.6235, "t": 170.22748, "r": 150.64458, "b": 178.75451999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "6%", "bbox": {"l": 139.6235, "t": 170.22748, "r": 150.64458, "b": 178.75451999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 139.88339, "t": 212.50036999999998, "r": 157.68491, "b": 221.02739999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "Laws", "bbox": {"l": 139.88339, "t": 212.50036999999998, "r": 157.68491, "b": 221.02739999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 157.43983, "t": 183.77808000000005, "r": 172.70154, "b": 192.30511, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "16%", "bbox": {"l": 157.43983, "t": 183.77808000000005, "r": 172.70154, "b": 192.30511, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 225.47252, "t": 189.29656999999997, "r": 254.29510000000002, "b": 197.82361000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "Manuals", "bbox": {"l": 225.47252, "t": 189.29656999999997, "r": 254.29510000000002, "b": 197.82361000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 194.40683, "t": 171.12145999999996, "r": 209.66853, "b": 179.6485, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "21%", "bbox": {"l": 194.40683, "t": 171.12145999999996, "r": 209.66853, "b": 179.6485, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "caption", "id": 9, "page_no": 2, "cluster": {"id": 9, "label": "caption", "bbox": {"l": 53.79800000000001, "t": 236.11499000000003, "r": 294.04373, "b": 255.54724, "coord_origin": "TOPLEFT"}, "confidence": 0.9425410628318787, "cells": [{"id": 14, "text": "Figure 2: Distribution of DocLayNet pages across document", "bbox": {"l": 53.79800000000001, "t": 236.11499000000003, "r": 294.04373, "b": 244.58826, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "categories.", "bbox": {"l": 53.79800000000001, "t": 247.07397000000003, "r": 96.756027, "b": 255.54724, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 2: Distribution of DocLayNet pages across document categories."}, {"label": "text", "id": 4, "page_no": 2, "cluster": {"id": 4, "label": "text", "bbox": {"l": 53.79800000000001, "t": 281.8035300000001, "r": 294.27383, "b": 366.89017, "coord_origin": "TOPLEFT"}, "confidence": 0.9866551160812378, "cells": [{"id": 16, "text": "to a minimum, since they introduce difficulties in annotation (see", "bbox": {"l": 53.79800000000001, "t": 281.8035300000001, "r": 294.04605, "b": 290.17815999999993, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "Section 4). As a second condition, we focussed on medium to large", "bbox": {"l": 53.79800000000001, "t": 292.76254, "r": 294.04868, "b": 301.13718, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "documents (", "bbox": {"l": 53.79800000000001, "t": 303.72153, "r": 98.881348, "b": 312.09616, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": ">", "bbox": {"l": 99.070999, "t": 306.07971, "r": 104.77363, "b": 310.08768, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "10", "bbox": {"l": 107.46399999999998, "t": 303.72153, "r": 115.83373999999999, "b": 312.09616, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "pages) with technical content, dense in complex", "bbox": {"l": 118.08366, "t": 303.72153, "r": 294.26233, "b": 312.09616, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "tables, figures, plots and captions. Such documents carry a lot of", "bbox": {"l": 53.79800000000001, "t": 314.68054, "r": 294.04715, "b": 323.05518, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "information value, but are often hard to analyse with high accuracy", "bbox": {"l": 53.79800000000001, "t": 325.63855, "r": 294.27383, "b": 334.01318, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "due to their challenging layouts. Counterexamples of documents", "bbox": {"l": 53.79800000000001, "t": 336.59753, "r": 294.0416, "b": 344.97217, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "not included in the dataset are receipts, invoices, hand-written", "bbox": {"l": 53.79800000000001, "t": 347.5565500000001, "r": 294.04712, "b": 355.9311799999999, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "documents or photographs showing \u201ctext in the wild\".", "bbox": {"l": 53.79800000000001, "t": 358.51553, "r": 251.73131, "b": 366.89017, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "to a minimum, since they introduce difficulties in annotation (see Section 4). As a second condition, we focussed on medium to large documents ( > 10 pages) with technical content, dense in complex tables, figures, plots and captions. Such documents carry a lot of information value, but are often hard to analyse with high accuracy due to their challenging layouts. Counterexamples of documents not included in the dataset are receipts, invoices, hand-written documents or photographs showing \u201ctext in the wild\"."}, {"label": "text", "id": 2, "page_no": 2, "cluster": {"id": 2, "label": "text", "bbox": {"l": 53.57400100000001, "t": 369.47455, "r": 295.56046, "b": 509.35617, "coord_origin": "TOPLEFT"}, "confidence": 0.987700879573822, "cells": [{"id": 27, "text": "The pages in DocLayNet can be grouped into six distinct cate-", "bbox": {"l": 63.76100199999999, "t": 369.47455, "r": 295.55945, "b": 377.84918, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "gories, namely", "bbox": {"l": 53.79800000000001, "t": 380.43353, "r": 105.90533, "b": 388.80816999999996, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Financial Reports", "bbox": {"l": 107.754, "t": 380.47838999999993, "r": 167.4973, "b": 388.81714, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": ",", "bbox": {"l": 167.496, "t": 380.43353, "r": 169.42915, "b": 388.80816999999996, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Manuals", "bbox": {"l": 171.28101, "t": 380.47838999999993, "r": 201.45581, "b": 388.81714, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": ",", "bbox": {"l": 201.455, "t": 380.43353, "r": 203.38815, "b": 388.80816999999996, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "Scientific Articles", "bbox": {"l": 205.24001, "t": 380.47838999999993, "r": 264.55273, "b": 388.81714, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": ",", "bbox": {"l": 264.54901, "t": 380.43353, "r": 266.48218, "b": 388.80816999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "Laws &", "bbox": {"l": 268.33401, "t": 380.47838999999993, "r": 294.36133, "b": 388.81714, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Regulations", "bbox": {"l": 53.79800000000001, "t": 391.43741000000006, "r": 94.899666, "b": 399.77615, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": ",", "bbox": {"l": 94.900002, "t": 391.39255, "r": 96.862747, "b": 399.76718, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "Patents", "bbox": {"l": 99.109001, "t": 391.43741000000006, "r": 124.72282, "b": 399.77615, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "and", "bbox": {"l": 127.17899999999999, "t": 391.39255, "r": 140.60596, "b": 399.76718, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "Government Tenders", "bbox": {"l": 142.853, "t": 391.43741000000006, "r": 215.15340000000003, "b": 399.77615, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": ". Each document cate-", "bbox": {"l": 215.15601000000004, "t": 391.39255, "r": 295.55716, "b": 399.76718, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "gory was sourced from various repositories. For example, Financial", "bbox": {"l": 53.79800000000001, "t": 402.3515300000001, "r": 294.04535, "b": 410.72617, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Reports contain both", "bbox": {"l": 53.79800000000001, "t": 413.31055, "r": 132.19516, "b": 421.68518000000006, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "free-style", "bbox": {"l": 134.528, "t": 413.35541, "r": 167.77272, "b": 421.69415, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "format annual reports", "bbox": {"l": 170.314, "t": 413.31055, "r": 252.36031, "b": 421.68518000000006, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "2", "bbox": {"l": 252.356, "t": 411.24283, "r": 255.73781, "b": 418.03555, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "which ex-", "bbox": {"l": 258.56601, "t": 413.31055, "r": 295.56046, "b": 421.68518000000006, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "pose company-specific, artistic layouts as well as the more formal", "bbox": {"l": 53.79800000000001, "t": 424.26953, "r": 294.04376, "b": 432.6441699999999, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "SEC filings. The two largest categories (", "bbox": {"l": 53.79800000000001, "t": 435.22754000000003, "r": 197.59023, "b": 443.60217, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Financial Reports", "bbox": {"l": 197.591, "t": 435.27240000000006, "r": 258.02774, "b": 443.61115, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "and", "bbox": {"l": 260.48901, "t": 435.22754000000003, "r": 273.78104, "b": 443.60217, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Man-", "bbox": {"l": 276.03201, "t": 435.27240000000006, "r": 294.94113, "b": 443.61115, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "uals", "bbox": {"l": 53.79800000000001, "t": 446.23138, "r": 68.085777, "b": 454.57013, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": ") contain a large amount of free-style layouts in order to obtain", "bbox": {"l": 68.296997, "t": 446.18652, "r": 294.04565, "b": 454.56116, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "maximum variability. In the other four categories, we boosted the", "bbox": {"l": 53.79800000000001, "t": 457.14554, "r": 294.04163, "b": 465.52017, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "variability by mixing documents from independent providers, such", "bbox": {"l": 53.57400100000001, "t": 468.10455, "r": 294.04889, "b": 476.47919, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "as different government websites or publishers. In Figure 2, we", "bbox": {"l": 53.79800000000001, "t": 479.06354, "r": 294.04715, "b": 487.43817, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "show the document categories contained in DocLayNet with their", "bbox": {"l": 53.79800000000001, "t": 490.02255, "r": 294.21643, "b": 498.39719, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "respective sizes.", "bbox": {"l": 53.79800000000001, "t": 500.98154, "r": 112.2948, "b": 509.35617, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The pages in DocLayNet can be grouped into six distinct categories, namely Financial Reports , Manuals , Scientific Articles , Laws & Regulations , Patents and Government Tenders . Each document category was sourced from various repositories. For example, Financial Reports contain both free-style format annual reports 2 which expose company-specific, artistic layouts as well as the more formal SEC filings. The two largest categories ( Financial Reports and Manuals ) contain a large amount of free-style layouts in order to obtain maximum variability. In the other four categories, we boosted the variability by mixing documents from independent providers, such as different government websites or publishers. In Figure 2, we show the document categories contained in DocLayNet with their respective sizes."}, {"label": "text", "id": 1, "page_no": 2, "cluster": {"id": 1, "label": "text", "bbox": {"l": 53.466999, "t": 511.94055, "r": 295.56155, "b": 607.98618, "coord_origin": "TOPLEFT"}, "confidence": 0.9877581000328064, "cells": [{"id": 60, "text": "We did not control the document selection with regard to lan-", "bbox": {"l": 63.76100199999999, "t": 511.94055, "r": 295.55954, "b": 520.31519, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "guage. The vast majority of documents contained in DocLayNet", "bbox": {"l": 53.79800000000001, "t": 522.89954, "r": 294.04718, "b": 531.27417, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "(close to 95%) are published in English language. However, Do-", "bbox": {"l": 53.528999, "t": 533.8585499999999, "r": 295.56155, "b": 542.23317, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "cLayNet also contains a number of documents in other languages", "bbox": {"l": 53.79800000000001, "t": 544.81755, "r": 294.04144, "b": 553.19217, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "such as German (2.5%), French (1.0%) and Japanese (1.0%). While", "bbox": {"l": 53.79800000000001, "t": 555.77556, "r": 294.04709, "b": 564.15018, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "the document language has negligible impact on the performance", "bbox": {"l": 53.79800000000001, "t": 566.73456, "r": 294.04163, "b": 575.10918, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "of computer vision methods such as object detection and segmenta-", "bbox": {"l": 53.79800000000001, "t": 577.6935599999999, "r": 295.5567, "b": 586.06818, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "tion models, it might prove challenging for layout analysis methods", "bbox": {"l": 53.79800000000001, "t": 588.65256, "r": 294.04541, "b": 597.02718, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "which exploit textual features.", "bbox": {"l": 53.466999, "t": 599.61156, "r": 164.39928, "b": 607.98618, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "We did not control the document selection with regard to language. The vast majority of documents contained in DocLayNet (close to 95%) are published in English language. However, DocLayNet also contains a number of documents in other languages such as German (2.5%), French (1.0%) and Japanese (1.0%). While the document language has negligible impact on the performance of computer vision methods such as object detection and segmentation models, it might prove challenging for layout analysis methods which exploit textual features."}, {"label": "text", "id": 0, "page_no": 2, "cluster": {"id": 0, "label": "text", "bbox": {"l": 53.79800000000001, "t": 610.57056, "r": 295.56396, "b": 684.69817, "coord_origin": "TOPLEFT"}, "confidence": 0.9880735278129578, "cells": [{"id": 69, "text": "To ensure that future benchmarks in the document-layout analy-", "bbox": {"l": 63.76100199999999, "t": 610.57056, "r": 295.56396, "b": 618.9451799999999, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "sis community can be easily compared, we have split up DocLayNet", "bbox": {"l": 53.79800000000001, "t": 621.52956, "r": 294.04532, "b": 629.90417, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "into pre-defined train-, test- and validation-sets. In this way, we can", "bbox": {"l": 53.79800000000001, "t": 632.48856, "r": 294.04538, "b": 640.86317, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "avoid spurious variations in the evaluation scores due to random", "bbox": {"l": 53.79800000000001, "t": 643.4475600000001, "r": 294.04315, "b": 651.82217, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "splitting in train-, test- and validation-sets. We also ensured that", "bbox": {"l": 53.79800000000001, "t": 654.40656, "r": 294.04712, "b": 662.78117, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "less frequent labels are represented in train and test sets in equal", "bbox": {"l": 53.79800000000001, "t": 665.36456, "r": 294.04333, "b": 673.7391700000001, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "proportions.", "bbox": {"l": 53.79800000000001, "t": 676.32355, "r": 98.916931, "b": 684.69817, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "To ensure that future benchmarks in the document-layout analysis community can be easily compared, we have split up DocLayNet into pre-defined train-, test- and validation-sets. In this way, we can avoid spurious variations in the evaluation scores due to random splitting in train-, test- and validation-sets. We also ensured that less frequent labels are represented in train and test sets in equal proportions."}, {"label": "footnote", "id": 12, "page_no": 2, "cluster": {"id": 12, "label": "footnote", "bbox": {"l": 53.79800000000001, "t": 701.6563639999999, "r": 195.78998, "b": 708.169891, "coord_origin": "TOPLEFT"}, "confidence": 0.9048354029655457, "cells": [{"id": 76, "text": "$^{2}$e.g. AAPL from https://www.annualreports.com/", "bbox": {"l": 53.79800000000001, "t": 701.6563639999999, "r": 195.78998, "b": 708.169891, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "$^{2}$e.g. AAPL from https://www.annualreports.com/"}, {"label": "text", "id": 3, "page_no": 2, "cluster": {"id": 3, "label": "text", "bbox": {"l": 317.62299, "t": 87.36352999999997, "r": 559.19183, "b": 161.49114999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.986920952796936, "cells": [{"id": 77, "text": "Table 1 shows the overall frequency and distribution of the labels", "bbox": {"l": 327.918, "t": 87.36352999999997, "r": 558.20093, "b": 95.73816, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "among the different sets. Importantly, we ensure that subsets are", "bbox": {"l": 317.95499, "t": 98.32250999999997, "r": 558.20013, "b": 106.69713999999999, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "only split on full-document boundaries. This avoids that pages of", "bbox": {"l": 317.95499, "t": 109.28156000000001, "r": 558.20056, "b": 117.65618999999992, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "the same document are spread over train, test and validation set,", "bbox": {"l": 317.95499, "t": 120.24054000000001, "r": 559.19183, "b": 128.61517000000003, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "which can give an undesired evaluation advantage to models and", "bbox": {"l": 317.62299, "t": 131.19854999999995, "r": 558.20349, "b": 139.57317999999998, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "lead to overestimation of their prediction accuracy. We will show", "bbox": {"l": 317.95499, "t": 142.15752999999995, "r": 558.52936, "b": 150.53216999999995, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "the impact of this decision in Section 5.", "bbox": {"l": 317.95499, "t": 153.11652000000004, "r": 461.6416, "b": 161.49114999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 1 shows the overall frequency and distribution of the labels among the different sets. Importantly, we ensure that subsets are only split on full-document boundaries. This avoids that pages of the same document are spread over train, test and validation set, which can give an undesired evaluation advantage to models and lead to overestimation of their prediction accuracy. We will show the impact of this decision in Section 5."}, {"label": "text", "id": 6, "page_no": 2, "cluster": {"id": 6, "label": "text", "bbox": {"l": 317.95499, "t": 164.07556, "r": 558.43811, "b": 271.0802, "coord_origin": "TOPLEFT"}, "confidence": 0.9860605001449585, "cells": [{"id": 84, "text": "In order to accommodate the different types of models currently", "bbox": {"l": 327.918, "t": 164.07556, "r": 558.43811, "b": 172.4502, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "in use by the community, we provide DocLayNet in an", "bbox": {"l": 317.95499, "t": 175.03454999999997, "r": 516.8219, "b": 183.40918, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "augmented", "bbox": {"l": 519.07501, "t": 175.07941000000005, "r": 558.20135, "b": 183.41814999999997, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "COCO format [16]. This entails the standard COCO ground-truth", "bbox": {"l": 317.95499, "t": 185.99352999999996, "r": 558.20325, "b": 194.36816, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "file (in JSON format) with the associated page images (in PNG", "bbox": {"l": 317.95499, "t": 196.95250999999996, "r": 558.20404, "b": 205.32714999999996, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "format, 1025", "bbox": {"l": 317.95499, "t": 207.91156, "r": 364.28769, "b": 216.28619000000003, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "\u00d7", "bbox": {"l": 364.28699, "t": 207.85779000000002, "r": 369.98962, "b": 215.55993999999998, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "1025 pixels). Furthermore, custom fields have been", "bbox": {"l": 369.98999, "t": 207.91156, "r": 558.20526, "b": 216.28619000000003, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "added to each COCO record to specify document category, original", "bbox": {"l": 317.95499, "t": 218.87054, "r": 558.20251, "b": 227.24518, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "document filename and page number. In addition, we also provide", "bbox": {"l": 317.95499, "t": 229.82952999999998, "r": 558.203, "b": 238.20416, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "the original PDF pages, as well as sidecar files containing parsed", "bbox": {"l": 317.95499, "t": 240.78754000000004, "r": 558.20404, "b": 249.16216999999995, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "PDF text and text-cell coordinates (in JSON). All additional files are", "bbox": {"l": 317.95499, "t": 251.74652000000003, "r": 558.20227, "b": 260.12114999999994, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "linked to the primary page images by their matching filenames.", "bbox": {"l": 317.95499, "t": 262.70556999999997, "r": 550.36414, "b": 271.0802, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In order to accommodate the different types of models currently in use by the community, we provide DocLayNet in an augmented COCO format [16]. This entails the standard COCO ground-truth file (in JSON format) with the associated page images (in PNG format, 1025 \u00d7 1025 pixels). Furthermore, custom fields have been added to each COCO record to specify document category, original document filename and page number. In addition, we also provide the original PDF pages, as well as sidecar files containing parsed PDF text and text-cell coordinates (in JSON). All additional files are linked to the primary page images by their matching filenames."}, {"label": "text", "id": 7, "page_no": 2, "cluster": {"id": 7, "label": "text", "bbox": {"l": 316.94199, "t": 273.66454999999996, "r": 559.72156, "b": 588.88918, "coord_origin": "TOPLEFT"}, "confidence": 0.9853296875953674, "cells": [{"id": 97, "text": "Despite being cost-intense and far less scalable than automation,", "bbox": {"l": 327.918, "t": 273.66454999999996, "r": 559.18488, "b": 282.03918, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "human annotation has several benefits over automated ground-", "bbox": {"l": 317.95499, "t": 284.62354, "r": 559.7132, "b": 292.99817, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "truth generation. The first and most obvious reason to leverage", "bbox": {"l": 317.95499, "t": 295.5825500000001, "r": 558.20416, "b": 303.95717999999994, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "human annotations is the freedom to annotate any type of doc-", "bbox": {"l": 317.95499, "t": 306.54153, "r": 559.71326, "b": 314.91617, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "ument without requiring a programmatic source. For most PDF", "bbox": {"l": 317.95499, "t": 317.50055, "r": 558.41443, "b": 325.87518, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "documents, the original source document is not available. The lat-", "bbox": {"l": 317.95499, "t": 328.4595299999999, "r": 559.71545, "b": 336.83417, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "ter is not a hard constraint with human annotation, but it is for", "bbox": {"l": 317.95499, "t": 339.41855000000004, "r": 558.36865, "b": 347.79318, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "automated methods. A second reason to use human annotations is", "bbox": {"l": 317.95499, "t": 350.37753, "r": 558.20062, "b": 358.75217, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "that the latter usually provide a more natural interpretation of the", "bbox": {"l": 317.95499, "t": 361.33554, "r": 558.20184, "b": 369.71017, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "page layout. The human-interpreted layout can significantly devi-", "bbox": {"l": 317.95499, "t": 372.29453, "r": 559.71442, "b": 380.66916, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "ate from the programmatic layout used in typesetting. For example,", "bbox": {"l": 317.95499, "t": 383.25354, "r": 559.1864, "b": 391.62817, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "\u201cinvisible\u201d tables might be used solely for aligning text paragraphs", "bbox": {"l": 316.94199, "t": 394.21252, "r": 558.20111, "b": 402.58716, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "on columns. Such typesetting tricks might be interpreted by au-", "bbox": {"l": 317.95499, "t": 405.17154, "r": 559.7132, "b": 413.54617, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "tomated methods incorrectly as an actual table, while the human", "bbox": {"l": 317.95499, "t": 416.13052, "r": 558.20013, "b": 424.50515999999993, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "annotation will interpret it correctly as", "bbox": {"l": 317.95499, "t": 427.08953999999994, "r": 464.50613, "b": 435.46417, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "Text", "bbox": {"l": 466.98199000000005, "t": 427.13439999999997, "r": 482.14560000000006, "b": 435.47313999999994, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "or other styles. The", "bbox": {"l": 485.13199000000003, "t": 427.08953999999994, "r": 558.19727, "b": 435.46417, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "same applies to multi-line text elements, when authors decided to", "bbox": {"l": 317.95499, "t": 438.04855, "r": 558.20221, "b": 446.4231899999999, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "space them as \u201cinvisible\u201d list elements without bullet symbols. A", "bbox": {"l": 317.95499, "t": 449.00754, "r": 558.51501, "b": 457.38217, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "third reason to gather ground-truth through human annotation is", "bbox": {"l": 317.95499, "t": 459.96655000000004, "r": 558.19855, "b": 468.34119, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "to estimate a \u201cnatural\u201d upper bound on the segmentation accuracy.", "bbox": {"l": 317.95499, "t": 470.92453, "r": 559.58215, "b": 479.29916, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "As we will show in Section 4, certain documents featuring complex", "bbox": {"l": 317.64099, "t": 481.88354, "r": 558.41559, "b": 490.25818, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "layouts can have different but equally acceptable layout interpre-", "bbox": {"l": 317.95499, "t": 492.84253, "r": 559.72156, "b": 501.21716, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "tations. This natural upper bound for segmentation accuracy can", "bbox": {"l": 317.95499, "t": 503.80154, "r": 558.19928, "b": 512.1761799999999, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "be found by annotating the same pages multiple times by different", "bbox": {"l": 317.95499, "t": 514.76053, "r": 558.20581, "b": 523.13516, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "people and evaluating the inter-annotator agreement. Such a base-", "bbox": {"l": 317.95499, "t": 525.71954, "r": 559.71729, "b": 534.09418, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "line consistency evaluation is very useful to define expectations", "bbox": {"l": 317.95499, "t": 536.6785600000001, "r": 558.20404, "b": 545.05318, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "for a good target accuracy in trained deep neural network models", "bbox": {"l": 317.95499, "t": 547.63756, "r": 558.20074, "b": 556.01218, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "and avoid overfitting (see Table 1). On the flip side, achieving high", "bbox": {"l": 317.95499, "t": 558.59656, "r": 558.20062, "b": 566.97118, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "annotation consistency proved to be a key challenge in human", "bbox": {"l": 317.95499, "t": 569.55556, "r": 558.20416, "b": 577.9301800000001, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "annotation, as we outline in Section 4.", "bbox": {"l": 317.95499, "t": 580.51456, "r": 457.62469, "b": 588.88918, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Despite being cost-intense and far less scalable than automation, human annotation has several benefits over automated groundtruth generation. The first and most obvious reason to leverage human annotations is the freedom to annotate any type of document without requiring a programmatic source. For most PDF documents, the original source document is not available. The latter is not a hard constraint with human annotation, but it is for automated methods. A second reason to use human annotations is that the latter usually provide a more natural interpretation of the page layout. The human-interpreted layout can significantly deviate from the programmatic layout used in typesetting. For example, \u201cinvisible\u201d tables might be used solely for aligning text paragraphs on columns. Such typesetting tricks might be interpreted by automated methods incorrectly as an actual table, while the human annotation will interpret it correctly as Text or other styles. The same applies to multi-line text elements, when authors decided to space them as \u201cinvisible\u201d list elements without bullet symbols. A third reason to gather ground-truth through human annotation is to estimate a \u201cnatural\u201d upper bound on the segmentation accuracy. As we will show in Section 4, certain documents featuring complex layouts can have different but equally acceptable layout interpretations. This natural upper bound for segmentation accuracy can be found by annotating the same pages multiple times by different people and evaluating the inter-annotator agreement. Such a baseline consistency evaluation is very useful to define expectations for a good target accuracy in trained deep neural network models and avoid overfitting (see Table 1). On the flip side, achieving high annotation consistency proved to be a key challenge in human annotation, as we outline in Section 4."}, {"label": "section_header", "id": 10, "page_no": 2, "cluster": {"id": 10, "label": "section_header", "bbox": {"l": 317.95499, "t": 606.84991, "r": 470.21326, "b": 617.15901, "coord_origin": "TOPLEFT"}, "confidence": 0.9422591328620911, "cells": [{"id": 128, "text": "4", "bbox": {"l": 317.95499, "t": 606.84991, "r": 323.56226, "b": 617.15901, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "ANNOTATION CAMPAIGN", "bbox": {"l": 334.47134, "t": 606.84991, "r": 470.21326, "b": 617.15901, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4 ANNOTATION CAMPAIGN"}, {"label": "text", "id": 5, "page_no": 2, "cluster": {"id": 5, "label": "text", "bbox": {"l": 317.686, "t": 631.97356, "r": 559.71381, "b": 706.102173, "coord_origin": "TOPLEFT"}, "confidence": 0.9863831996917725, "cells": [{"id": 130, "text": "The annotation campaign was carried out in four phases. In phase", "bbox": {"l": 317.686, "t": 631.97356, "r": 558.20148, "b": 640.34818, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "one, we identified and prepared the data sources for annotation.", "bbox": {"l": 317.95499, "t": 642.93256, "r": 559.58521, "b": 651.30717, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "In phase two, we determined the class labels and how annotations", "bbox": {"l": 317.95499, "t": 653.89156, "r": 558.20007, "b": 662.26617, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "should be done on the documents in order to obtain maximum con-", "bbox": {"l": 317.95499, "t": 664.85056, "r": 559.71375, "b": 673.22517, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "sistency. The latter was guided by a detailed requirement analysis", "bbox": {"l": 317.95499, "t": 675.80956, "r": 558.20233, "b": 684.18417, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "and exhaustive experiments. In phase three, we trained the annota-", "bbox": {"l": 317.95499, "t": 686.76855, "r": 559.71381, "b": 695.143173, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "tion staff and performed exams for quality assurance. In phase four,", "bbox": {"l": 317.95499, "t": 697.7275539999999, "r": 559.1864, "b": 706.102173, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The annotation campaign was carried out in four phases. In phase one, we identified and prepared the data sources for annotation. In phase two, we determined the class labels and how annotations should be done on the documents in order to obtain maximum consistency. The latter was guided by a detailed requirement analysis and exhaustive experiments. In phase three, we trained the annotation staff and performed exams for quality assurance. In phase four,"}], "headers": [{"label": "page_header", "id": 13, "page_no": 2, "cluster": {"id": 13, "label": "page_header", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.891997754573822, "cells": [{"id": 0, "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis"}, {"label": "page_header", "id": 11, "page_no": 2, "cluster": {"id": 11, "label": "page_header", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.9104520082473755, "cells": [{"id": 1, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA"}]}}, {"page_no": 3, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 246.24382, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar", "bbox": {"l": 253.13897999999998, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Table 1: DocLayNet dataset overview. Along with the frequency of each class label, we present the relative occurrence (as %", "bbox": {"l": 53.501999, "t": 84.95495999999991, "r": 558.48969, "b": 93.42822000000001, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "of row \u201cTotal\u201d) in the train, test and validation sets. The inter-annotator agreement is computed as the mAP@0.5-0.95 metric", "bbox": {"l": 53.79800000000001, "t": 95.91394000000003, "r": 558.20294, "b": 104.3872100000001, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "between pairwise annotations from the triple-annotated pages, from which we obtain accuracy ranges.", "bbox": {"l": 53.79800000000001, "t": 106.87292000000002, "r": 469.84805000000006, "b": 115.34618999999998, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "% of Total", "bbox": {"l": 233.94400000000002, "t": 140.22351000000003, "r": 270.04272, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "triple inter-annotator mAP @ 0.5-0.95 (%)", "bbox": {"l": 329.04999, "t": 140.22351000000003, "r": 483.3976400000001, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "class label", "bbox": {"l": 104.825, "t": 151.18255999999997, "r": 141.71277, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Count", "bbox": {"l": 175.94701, "t": 151.18255999999997, "r": 198.71269, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Train", "bbox": {"l": 213.795, "t": 151.18255999999997, "r": 233.69144, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Test", "bbox": {"l": 249.37367, "t": 151.18255999999997, "r": 264.5, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Val", "bbox": {"l": 283.53568, "t": 151.18255999999997, "r": 295.30856, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "All", "bbox": {"l": 314.01501, "t": 151.18255999999997, "r": 324.98093, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Fin", "bbox": {"l": 343.01236, "t": 151.18255999999997, "r": 354.65076, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Man", "bbox": {"l": 367.84033, "t": 151.18255999999997, "r": 384.32059, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Sci", "bbox": {"l": 407.54358, "t": 151.18255999999997, "r": 418.15979, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Law", "bbox": {"l": 432.29979999999995, "t": 151.18255999999997, "r": 447.82962, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "Pat", "bbox": {"l": 465.72656, "t": 151.18255999999997, "r": 477.50842, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Ten", "bbox": {"l": 493.52240000000006, "t": 151.18255999999997, "r": 507.17822, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Caption", "bbox": {"l": 104.825, "t": 162.53954999999996, "r": 134.01064, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "22524", "bbox": {"l": 177.866, "t": 162.53954999999996, "r": 198.71288, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "2.04", "bbox": {"l": 219.211, "t": 162.53954999999996, "r": 233.69174000000004, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "1.77", "bbox": {"l": 250.01956, "t": 162.53954999999996, "r": 264.50031, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "2.32", "bbox": {"l": 280.82812, "t": 162.53954999999996, "r": 295.30887, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "84-89", "bbox": {"l": 305.27301, "t": 162.53954999999996, "r": 324.98117, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "40-61", "bbox": {"l": 334.94284, "t": 162.53954999999996, "r": 354.651, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "86-92", "bbox": {"l": 364.61267, "t": 162.53954999999996, "r": 384.32083, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "94-99", "bbox": {"l": 398.45187, "t": 162.53954999999996, "r": 418.16003, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "95-99", "bbox": {"l": 428.1217, "t": 162.53954999999996, "r": 447.82986, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "69-78", "bbox": {"l": 457.80051, "t": 162.53954999999996, "r": 477.50867, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "n/a", "bbox": {"l": 495.32489, "t": 162.53954999999996, "r": 507.17846999999995, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Footnote", "bbox": {"l": 104.825, "t": 173.49854000000005, "r": 137.3282, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "6318", "bbox": {"l": 182.035, "t": 173.49854000000005, "r": 198.71251, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "0.60", "bbox": {"l": 219.211, "t": 173.49854000000005, "r": 233.69174000000004, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "0.31", "bbox": {"l": 250.01956, "t": 173.49854000000005, "r": 264.50031, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "0.58", "bbox": {"l": 280.82812, "t": 173.49854000000005, "r": 295.30887, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "83-91", "bbox": {"l": 305.27301, "t": 173.49854000000005, "r": 324.98117, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "n/a", "bbox": {"l": 342.79739, "t": 173.49854000000005, "r": 354.65097, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "100", "bbox": {"l": 371.81265, "t": 173.49854000000005, "r": 384.32077, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "62-88", "bbox": {"l": 398.45181, "t": 173.49854000000005, "r": 418.15997, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "85-94", "bbox": {"l": 428.12164, "t": 173.49854000000005, "r": 447.8298, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "n/a", "bbox": {"l": 465.655, "t": 173.49854000000005, "r": 477.50857999999994, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "82-97", "bbox": {"l": 487.47025, "t": 173.49854000000005, "r": 507.17841, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Formula", "bbox": {"l": 104.825, "t": 184.45752000000005, "r": 135.33766, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "25027", "bbox": {"l": 177.866, "t": 184.45752000000005, "r": 198.71288, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "2.25", "bbox": {"l": 219.211, "t": 184.45752000000005, "r": 233.69174000000004, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "1.90", "bbox": {"l": 250.01956, "t": 184.45752000000005, "r": 264.50031, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "2.96", "bbox": {"l": 280.82812, "t": 184.45752000000005, "r": 295.30887, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "83-85", "bbox": {"l": 305.27301, "t": 184.45752000000005, "r": 324.98117, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "n/a", "bbox": {"l": 342.79739, "t": 184.45752000000005, "r": 354.65097, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "n/a", "bbox": {"l": 372.46719, "t": 184.45752000000005, "r": 384.32077, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "84-87", "bbox": {"l": 398.45181, "t": 184.45752000000005, "r": 418.15997, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "86-96", "bbox": {"l": 428.12164, "t": 184.45752000000005, "r": 447.8298, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "n/a", "bbox": {"l": 465.655, "t": 184.45752000000005, "r": 477.50857999999994, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "n/a", "bbox": {"l": 495.3248, "t": 184.45752000000005, "r": 507.17838000000006, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "List-item", "bbox": {"l": 104.825, "t": 195.41656, "r": 137.70479, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "185660", "bbox": {"l": 173.69701, "t": 195.41656, "r": 198.71326, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "17.19", "bbox": {"l": 215.04201, "t": 195.41656, "r": 233.69212, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "13.34", "bbox": {"l": 245.85056, "t": 195.41656, "r": 264.50067, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "15.82", "bbox": {"l": 276.65912, "t": 195.41656, "r": 295.30923, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "87-88", "bbox": {"l": 305.27301, "t": 195.41656, "r": 324.98117, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "74-83", "bbox": {"l": 334.94284, "t": 195.41656, "r": 354.651, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "90-92", "bbox": {"l": 364.61267, "t": 195.41656, "r": 384.32083, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "97-97", "bbox": {"l": 398.45187, "t": 195.41656, "r": 418.16003, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "81-85", "bbox": {"l": 428.1217, "t": 195.41656, "r": 447.82986, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "75-88", "bbox": {"l": 457.80051, "t": 195.41656, "r": 477.50867, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "93-95", "bbox": {"l": 487.47034, "t": 195.41656, "r": 507.17849999999993, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "Page-footer", "bbox": {"l": 104.825, "t": 206.37554999999998, "r": 147.35262, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "70878", "bbox": {"l": 177.866, "t": 206.37554999999998, "r": 198.71288, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "6.51", "bbox": {"l": 219.211, "t": 206.37554999999998, "r": 233.69174000000004, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "5.58", "bbox": {"l": 250.01956, "t": 206.37554999999998, "r": 264.50031, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "6.00", "bbox": {"l": 280.82812, "t": 206.37554999999998, "r": 295.30887, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "93-94", "bbox": {"l": 305.27301, "t": 206.37554999999998, "r": 324.98117, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "88-90", "bbox": {"l": 334.94284, "t": 206.37554999999998, "r": 354.651, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "95-96", "bbox": {"l": 364.61267, "t": 206.37554999999998, "r": 384.32083, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "100", "bbox": {"l": 405.65189, "t": 206.37554999999998, "r": 418.16, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "92-97", "bbox": {"l": 428.12167, "t": 206.37554999999998, "r": 447.82983, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "100", "bbox": {"l": 465.00049, "t": 206.37554999999998, "r": 477.5086099999999, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "96-98", "bbox": {"l": 487.47028, "t": 206.37554999999998, "r": 507.17843999999997, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "Page-header", "bbox": {"l": 104.825, "t": 217.33452999999997, "r": 150.10532, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "58022", "bbox": {"l": 177.866, "t": 217.33452999999997, "r": 198.71288, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "5.10", "bbox": {"l": 219.211, "t": 217.33452999999997, "r": 233.69174000000004, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "6.70", "bbox": {"l": 250.01956, "t": 217.33452999999997, "r": 264.50031, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "5.06", "bbox": {"l": 280.82812, "t": 217.33452999999997, "r": 295.30887, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "85-89", "bbox": {"l": 305.27301, "t": 217.33452999999997, "r": 324.98117, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "66-76", "bbox": {"l": 334.94284, "t": 217.33452999999997, "r": 354.651, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "90-94", "bbox": {"l": 364.61267, "t": 217.33452999999997, "r": 384.32083, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "98-100", "bbox": {"l": 394.2825, "t": 217.33452999999997, "r": 418.16003, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "91-92", "bbox": {"l": 428.1217, "t": 217.33452999999997, "r": 447.82986, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "97-99", "bbox": {"l": 457.80051, "t": 217.33452999999997, "r": 477.50867, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "81-86", "bbox": {"l": 487.47034, "t": 217.33452999999997, "r": 507.17849999999993, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "Picture", "bbox": {"l": 104.825, "t": 228.29351999999994, "r": 130.80963, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "45976", "bbox": {"l": 177.866, "t": 228.29351999999994, "r": 198.71288, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "4.21", "bbox": {"l": 219.211, "t": 228.29351999999994, "r": 233.69174000000004, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "2.78", "bbox": {"l": 250.01956, "t": 228.29351999999994, "r": 264.50031, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "5.31", "bbox": {"l": 280.82812, "t": 228.29351999999994, "r": 295.30887, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "69-71", "bbox": {"l": 305.27301, "t": 228.29351999999994, "r": 324.98117, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "56-59", "bbox": {"l": 334.94284, "t": 228.29351999999994, "r": 354.651, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "82-86", "bbox": {"l": 364.61267, "t": 228.29351999999994, "r": 384.32083, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "69-82", "bbox": {"l": 398.45187, "t": 228.29351999999994, "r": 418.16003, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "80-95", "bbox": {"l": 428.1217, "t": 228.29351999999994, "r": 447.82986, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "66-71", "bbox": {"l": 457.80051, "t": 228.29351999999994, "r": 477.50867, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "59-76", "bbox": {"l": 487.47034, "t": 228.29351999999994, "r": 507.17849999999993, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "Section-header", "bbox": {"l": 104.825, "t": 239.25256000000002, "r": 159.56487, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "142884", "bbox": {"l": 173.69701, "t": 239.25256000000002, "r": 198.71326, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "12.60", "bbox": {"l": 215.04201, "t": 239.25256000000002, "r": 233.69212, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "15.77", "bbox": {"l": 245.85056, "t": 239.25256000000002, "r": 264.50067, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "12.85", "bbox": {"l": 276.65912, "t": 239.25256000000002, "r": 295.30923, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "83-84", "bbox": {"l": 305.27301, "t": 239.25256000000002, "r": 324.98117, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "76-81", "bbox": {"l": 334.94284, "t": 239.25256000000002, "r": 354.651, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "90-92", "bbox": {"l": 364.61267, "t": 239.25256000000002, "r": 384.32083, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "94-95", "bbox": {"l": 398.45187, "t": 239.25256000000002, "r": 418.16003, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "87-94", "bbox": {"l": 428.1217, "t": 239.25256000000002, "r": 447.82986, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "69-73", "bbox": {"l": 457.80051, "t": 239.25256000000002, "r": 477.50867, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "78-86", "bbox": {"l": 487.47034, "t": 239.25256000000002, "r": 507.17849999999993, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "Table", "bbox": {"l": 104.825, "t": 250.21155, "r": 124.63177, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "34733", "bbox": {"l": 177.866, "t": 250.21155, "r": 198.71288, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "3.20", "bbox": {"l": 219.211, "t": 250.21155, "r": 233.69174000000004, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "2.27", "bbox": {"l": 250.01956, "t": 250.21155, "r": 264.50031, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "3.60", "bbox": {"l": 280.82812, "t": 250.21155, "r": 295.30887, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "77-81", "bbox": {"l": 305.27301, "t": 250.21155, "r": 324.98117, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "75-80", "bbox": {"l": 334.94284, "t": 250.21155, "r": 354.651, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "83-86", "bbox": {"l": 364.61267, "t": 250.21155, "r": 384.32083, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "98-99", "bbox": {"l": 398.45187, "t": 250.21155, "r": 418.16003, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "58-80", "bbox": {"l": 428.1217, "t": 250.21155, "r": 447.82986, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "79-84", "bbox": {"l": 457.80051, "t": 250.21155, "r": 477.50867, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "70-85", "bbox": {"l": 487.47034, "t": 250.21155, "r": 507.17849999999993, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "Text", "bbox": {"l": 104.825, "t": 261.16956000000005, "r": 120.78519, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "510377", "bbox": {"l": 173.69701, "t": 261.16956000000005, "r": 198.71326, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "45.82", "bbox": {"l": 215.04201, "t": 261.16956000000005, "r": 233.69212, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "49.28", "bbox": {"l": 245.85056, "t": 261.16956000000005, "r": 264.50067, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "45.00", "bbox": {"l": 276.65912, "t": 261.16956000000005, "r": 295.30923, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "84-86", "bbox": {"l": 305.27301, "t": 261.16956000000005, "r": 324.98117, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "81-86", "bbox": {"l": 334.94284, "t": 261.16956000000005, "r": 354.651, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "88-93", "bbox": {"l": 364.61267, "t": 261.16956000000005, "r": 384.32083, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "89-93", "bbox": {"l": 398.45187, "t": 261.16956000000005, "r": 418.16003, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "87-92", "bbox": {"l": 428.1217, "t": 261.16956000000005, "r": 447.82986, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "71-79", "bbox": {"l": 457.80051, "t": 261.16956000000005, "r": 477.50867, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "87-95", "bbox": {"l": 487.47034, "t": 261.16956000000005, "r": 507.17849999999993, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "Title", "bbox": {"l": 104.825, "t": 272.12854000000004, "r": 121.81633, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "5071", "bbox": {"l": 182.035, "t": 272.12854000000004, "r": 198.71251, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "0.47", "bbox": {"l": 219.211, "t": 272.12854000000004, "r": 233.69174000000004, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "0.30", "bbox": {"l": 250.01956, "t": 272.12854000000004, "r": 264.50031, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "0.50", "bbox": {"l": 280.82812, "t": 272.12854000000004, "r": 295.30887, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "60-72", "bbox": {"l": 305.27301, "t": 272.12854000000004, "r": 324.98117, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "24-63", "bbox": {"l": 334.94284, "t": 272.12854000000004, "r": 354.651, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "50-63", "bbox": {"l": 364.61267, "t": 272.12854000000004, "r": 384.32083, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "94-100", "bbox": {"l": 394.2825, "t": 272.12854000000004, "r": 418.16003, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "82-96", "bbox": {"l": 428.1217, "t": 272.12854000000004, "r": 447.82986, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "68-79", "bbox": {"l": 457.80051, "t": 272.12854000000004, "r": 477.50867, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "24-56", "bbox": {"l": 487.47034, "t": 272.12854000000004, "r": 507.17849999999993, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "Total", "bbox": {"l": 104.825, "t": 283.48654, "r": 123.43028, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "1107470", "bbox": {"l": 169.52699, "t": 283.48654, "r": 198.71263, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "941123", "bbox": {"l": 208.675, "t": 283.48654, "r": 233.69124999999997, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "99816", "bbox": {"l": 243.65291999999997, "t": 283.48654, "r": 264.49982, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "66531", "bbox": {"l": 274.46149, "t": 283.48654, "r": 295.30838, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "82-83", "bbox": {"l": 305.27301, "t": 283.48654, "r": 324.98117, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "71-74", "bbox": {"l": 334.94284, "t": 283.48654, "r": 354.651, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "79-81", "bbox": {"l": 364.61267, "t": 283.48654, "r": 384.32083, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "89-94", "bbox": {"l": 398.45187, "t": 283.48654, "r": 418.16003, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "86-91", "bbox": {"l": 428.1217, "t": 283.48654, "r": 447.82986, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "71-76", "bbox": {"l": 457.80051, "t": 283.48654, "r": 477.50867, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "68-85", "bbox": {"l": 487.47034, "t": 283.48654, "r": 507.17849999999993, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "Figure 3: Corpus Conversion Service annotation user inter-", "bbox": {"l": 53.79800000000001, "t": 554.00999, "r": 295.64871, "b": 562.48325, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "face. The PDF page is shown in the background, with over-", "bbox": {"l": 53.79800000000001, "t": 564.96899, "r": 295.64874, "b": 573.44225, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "laid text-cells (in darker shades). The annotation boxes can", "bbox": {"l": 53.79800000000001, "t": 575.92799, "r": 294.04376, "b": 584.40125, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "be drawn by dragging a rectangle over each segment with", "bbox": {"l": 53.79800000000001, "t": 586.88699, "r": 294.04373, "b": 595.36024, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "the respective label from the palette on the right.", "bbox": {"l": 53.79800000000001, "t": 597.84599, "r": 252.78931000000003, "b": 606.31924, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "we distributed the annotation workload and performed continuous", "bbox": {"l": 53.466999, "t": 634.29155, "r": 294.04745, "b": 642.66617, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "quality controls. Phase one and two required a small team of experts", "bbox": {"l": 53.79800000000001, "t": 645.25055, "r": 294.04535, "b": 653.62517, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "only. For phases three and four, a group of 40 dedicated annotators", "bbox": {"l": 53.79800000000001, "t": 656.20955, "r": 294.04422, "b": 664.58417, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "were assembled and supervised.", "bbox": {"l": 53.466999, "t": 667.16856, "r": 170.58611, "b": 675.54317, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "Phase 1: Data selection and preparation.", "bbox": {"l": 63.76099800000001, "t": 678.01099, "r": 226.72533000000004, "b": 686.48424, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "Our inclusion cri-", "bbox": {"l": 229.06900000000002, "t": 678.12756, "r": 295.55844, "b": 686.50217, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "teria for documents were described in Section 3. A large effort went", "bbox": {"l": 53.79800000000001, "t": 689.08656, "r": 294.04538, "b": 697.461174, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "into ensuring that all documents are free to use. The data sources", "bbox": {"l": 53.79800000000001, "t": 700.045555, "r": 294.04642, "b": 708.420174, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "include publication repositories such as arXiv$^{3}$, government offices,", "bbox": {"l": 317.95499, "t": 312.07953, "r": 559.18536, "b": 320.45416000000006, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "company websites as well as data directory services for financial", "bbox": {"l": 317.95499, "t": 323.03754, "r": 558.19843, "b": 331.41217, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "reports and patents. Scanned documents were excluded wherever", "bbox": {"l": 317.95499, "t": 333.99655, "r": 558.36963, "b": 342.37119, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "possible because they can be rotated or skewed. This would not", "bbox": {"l": 317.95499, "t": 344.95554, "r": 558.2041, "b": 353.33017, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "allow us to perform annotation with rectangular bounding-boxes", "bbox": {"l": 317.95499, "t": 355.91455, "r": 558.20294, "b": 364.28918, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "and therefore complicate the annotation process.", "bbox": {"l": 317.95499, "t": 366.87354, "r": 496.71826, "b": 375.24817, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "Preparation work included uploading and parsing the sourced", "bbox": {"l": 327.918, "t": 377.8325500000001, "r": 558.20618, "b": 386.20717999999994, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "PDF documents in the Corpus Conversion Service (CCS) [22], a", "bbox": {"l": 317.95499, "t": 388.79153, "r": 558.2019, "b": 397.16617, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "cloud-native platform which provides a visual annotation interface", "bbox": {"l": 317.95499, "t": 399.75055, "r": 558.20233, "b": 408.12518, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": "and allows for dataset inspection and analysis. The annotation in-", "bbox": {"l": 317.95499, "t": 410.7095299999999, "r": 559.71277, "b": 419.08417, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "terface of CCS is shown in Figure 3. The desired balance of pages", "bbox": {"l": 317.95499, "t": 421.66855000000004, "r": 558.20062, "b": 430.04318, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "between the different document categories was achieved by se-", "bbox": {"l": 317.95499, "t": 432.62753, "r": 559.71307, "b": 441.00217, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": "lective subsampling of pages with certain desired properties. For", "bbox": {"l": 317.95499, "t": 443.58554, "r": 558.36877, "b": 451.96017, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "example, we made sure to include the title page of each document", "bbox": {"l": 317.95499, "t": 454.54453, "r": 558.20428, "b": 462.91916, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "and bias the remaining page selection to those with figures or", "bbox": {"l": 317.95499, "t": 465.50354, "r": 558.36877, "b": 473.87817, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "tables. The latter was achieved by leveraging pre-trained object", "bbox": {"l": 317.95499, "t": 476.46252, "r": 558.20428, "b": 484.83716, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": "detection models from PubLayNet, which helped us estimate how", "bbox": {"l": 317.95499, "t": 487.42154, "r": 558.5307, "b": 495.79617, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "many figures and tables a given page contains.", "bbox": {"l": 317.95499, "t": 498.38052, "r": 488.46914999999996, "b": 506.75516, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "Phase 2: Label selection and guideline.", "bbox": {"l": 327.918, "t": 509.22299, "r": 482.41809, "b": 517.69623, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "We reviewed the col-", "bbox": {"l": 484.474, "t": 509.33954, "r": 559.71765, "b": 517.71417, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "lected documents and identified the most common structural fea-", "bbox": {"l": 317.95499, "t": 520.29855, "r": 559.71619, "b": 528.67319, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "tures they exhibit. This was achieved by identifying recurrent layout", "bbox": {"l": 317.95499, "t": 531.2575400000001, "r": 558.20239, "b": 539.63217, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "elements and lead us to the definition of 11 distinct class labels.", "bbox": {"l": 317.95499, "t": 542.21655, "r": 559.58502, "b": 550.59117, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "These 11 class labels are", "bbox": {"l": 317.686, "t": 553.17456, "r": 404.14197, "b": 561.54918, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "Caption", "bbox": {"l": 406.26599, "t": 553.21939, "r": 433.84860000000003, "b": 561.5581500000001, "coord_origin": "TOPLEFT"}}, {"id": 201, "text": ",", "bbox": {"l": 433.84799, "t": 553.17456, "r": 435.78115999999994, "b": 561.54918, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": "Footnote", "bbox": {"l": 437.9079899999999, "t": 553.21939, "r": 467.23926, "b": 561.5581500000001, "coord_origin": "TOPLEFT"}}, {"id": 203, "text": ",", "bbox": {"l": 467.23999, "t": 553.17456, "r": 469.17316000000005, "b": 561.54918, "coord_origin": "TOPLEFT"}}, {"id": 204, "text": "Formula", "bbox": {"l": 471.29900999999995, "t": 553.21939, "r": 500.44574000000006, "b": 561.5581500000001, "coord_origin": "TOPLEFT"}}, {"id": 205, "text": ",", "bbox": {"l": 500.44601000000006, "t": 553.17456, "r": 502.37918, "b": 561.54918, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": "List-item", "bbox": {"l": 504.505, "t": 553.21939, "r": 535.74304, "b": 561.5581500000001, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": ",", "bbox": {"l": 535.74298, "t": 553.17456, "r": 537.67615, "b": 561.54918, "coord_origin": "TOPLEFT"}}, {"id": 208, "text": "Page-", "bbox": {"l": 539.802, "t": 553.21939, "r": 559.09839, "b": 561.5581500000001, "coord_origin": "TOPLEFT"}}, {"id": 209, "text": "footer", "bbox": {"l": 317.95499, "t": 564.17839, "r": 338.80725, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": ",", "bbox": {"l": 338.806, "t": 564.13356, "r": 340.81805, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "Page-header", "bbox": {"l": 343.61401, "t": 564.17839, "r": 387.96164, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 212, "text": ",", "bbox": {"l": 387.961, "t": 564.13356, "r": 389.97305, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "Picture", "bbox": {"l": 392.76901, "t": 564.17839, "r": 417.84662, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 214, "text": ",", "bbox": {"l": 417.84799, "t": 564.13356, "r": 419.86005, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 215, "text": "Section-header", "bbox": {"l": 422.655, "t": 564.17839, "r": 475.56305, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 216, "text": ",", "bbox": {"l": 475.56201, "t": 564.13356, "r": 477.57407, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 217, "text": "Table", "bbox": {"l": 480.36899, "t": 564.17839, "r": 499.82196, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 218, "text": ",", "bbox": {"l": 499.8219900000001, "t": 564.13356, "r": 501.83405, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 219, "text": "Text", "bbox": {"l": 504.6290000000001, "t": 564.17839, "r": 519.7926, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 220, "text": ", and", "bbox": {"l": 519.79602, "t": 564.13356, "r": 538.37103, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 221, "text": "Title", "bbox": {"l": 541.16302, "t": 564.17839, "r": 557.57043, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 222, "text": ".", "bbox": {"l": 557.57098, "t": 564.13356, "r": 559.58307, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 223, "text": "Critical factors that were considered for the choice of these class", "bbox": {"l": 317.95499, "t": 575.09256, "r": 558.20416, "b": 583.46718, "coord_origin": "TOPLEFT"}}, {"id": 224, "text": "labels were (1) the overall occurrence of the label, (2) the specificity", "bbox": {"l": 317.95499, "t": 586.05156, "r": 558.43091, "b": 594.4261799999999, "coord_origin": "TOPLEFT"}}, {"id": 225, "text": "of the label, (3) recognisability on a single page (i.e. no need for", "bbox": {"l": 317.95499, "t": 597.0105599999999, "r": 558.36871, "b": 605.38518, "coord_origin": "TOPLEFT"}}, {"id": 226, "text": "context from previous or next page) and (4) overall coverage of the", "bbox": {"l": 317.95499, "t": 607.96956, "r": 558.20105, "b": 616.3441799999999, "coord_origin": "TOPLEFT"}}, {"id": 227, "text": "page. Specificity ensures that the choice of label is not ambiguous,", "bbox": {"l": 317.95499, "t": 618.9285600000001, "r": 559.18665, "b": 627.30318, "coord_origin": "TOPLEFT"}}, {"id": 228, "text": "while coverage ensures that all meaningful items on a page can", "bbox": {"l": 317.62299, "t": 629.88756, "r": 558.20142, "b": 638.26218, "coord_origin": "TOPLEFT"}}, {"id": 229, "text": "be annotated. We refrained from class labels that are very specific", "bbox": {"l": 317.95499, "t": 640.84656, "r": 558.20227, "b": 649.22118, "coord_origin": "TOPLEFT"}}, {"id": 230, "text": "to a document category, such as", "bbox": {"l": 317.95499, "t": 651.80556, "r": 436.90649, "b": 660.1801800000001, "coord_origin": "TOPLEFT"}}, {"id": 231, "text": "Abstract", "bbox": {"l": 439.13800000000003, "t": 651.8503900000001, "r": 469.69134999999994, "b": 660.18915, "coord_origin": "TOPLEFT"}}, {"id": 232, "text": "in the", "bbox": {"l": 472.42898999999994, "t": 651.80556, "r": 493.97348, "b": 660.1801800000001, "coord_origin": "TOPLEFT"}}, {"id": 233, "text": "Scientific Articles", "bbox": {"l": 496.207, "t": 651.8503900000001, "r": 558.20001, "b": 660.18915, "coord_origin": "TOPLEFT"}}, {"id": 234, "text": "category. We also avoided class labels that are tightly linked to the", "bbox": {"l": 317.95499, "t": 662.76456, "r": 558.20557, "b": 671.13918, "coord_origin": "TOPLEFT"}}, {"id": 235, "text": "semantics of the text. Labels such as", "bbox": {"l": 317.95499, "t": 673.7225599999999, "r": 447.65221999999994, "b": 682.09718, "coord_origin": "TOPLEFT"}}, {"id": 236, "text": "Author", "bbox": {"l": 449.85999, "t": 673.76739, "r": 474.31439, "b": 682.10614, "coord_origin": "TOPLEFT"}}, {"id": 237, "text": "and", "bbox": {"l": 477.172, "t": 673.7225599999999, "r": 490.39655, "b": 682.09718, "coord_origin": "TOPLEFT"}}, {"id": 238, "text": "Affiliation", "bbox": {"l": 492.60599, "t": 673.76739, "r": 528.29907, "b": 682.10614, "coord_origin": "TOPLEFT"}}, {"id": 239, "text": ", as seen", "bbox": {"l": 528.29901, "t": 673.7225599999999, "r": 558.20148, "b": 682.09718, "coord_origin": "TOPLEFT"}}, {"id": 240, "text": "in DocBank, are often only distinguishable by discriminating on", "bbox": {"l": 317.95499, "t": 684.68156, "r": 558.2041, "b": 693.0561749999999, "coord_origin": "TOPLEFT"}}, {"id": 241, "text": "$^{3}$https://arxiv.org/", "bbox": {"l": 317.95499, "t": 702.353363, "r": 369.2457, "b": 708.86689, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 10, "label": "page_header", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.7625049948692322, "cells": [{"id": 0, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 246.24382, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar", "bbox": {"l": 253.13897999999998, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "caption", "bbox": {"l": 53.501999, "t": 84.95495999999991, "r": 558.48969, "b": 115.34618999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.8906610012054443, "cells": [{"id": 2, "text": "Table 1: DocLayNet dataset overview. Along with the frequency of each class label, we present the relative occurrence (as %", "bbox": {"l": 53.501999, "t": 84.95495999999991, "r": 558.48969, "b": 93.42822000000001, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "of row \u201cTotal\u201d) in the train, test and validation sets. The inter-annotator agreement is computed as the mAP@0.5-0.95 metric", "bbox": {"l": 53.79800000000001, "t": 95.91394000000003, "r": 558.20294, "b": 104.3872100000001, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "between pairwise annotations from the triple-annotated pages, from which we obtain accuracy ranges.", "bbox": {"l": 53.79800000000001, "t": 106.87292000000002, "r": 469.84805000000006, "b": 115.34618999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "table", "bbox": {"l": 98.93103790283203, "t": 137.4754638671875, "r": 512.579833984375, "b": 294.0815124511719, "coord_origin": "TOPLEFT"}, "confidence": 0.9860089421272278, "cells": [{"id": 5, "text": "% of Total", "bbox": {"l": 233.94400000000002, "t": 140.22351000000003, "r": 270.04272, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "triple inter-annotator mAP @ 0.5-0.95 (%)", "bbox": {"l": 329.04999, "t": 140.22351000000003, "r": 483.3976400000001, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "class label", "bbox": {"l": 104.825, "t": 151.18255999999997, "r": 141.71277, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Count", "bbox": {"l": 175.94701, "t": 151.18255999999997, "r": 198.71269, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Train", "bbox": {"l": 213.795, "t": 151.18255999999997, "r": 233.69144, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Test", "bbox": {"l": 249.37367, "t": 151.18255999999997, "r": 264.5, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Val", "bbox": {"l": 283.53568, "t": 151.18255999999997, "r": 295.30856, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "All", "bbox": {"l": 314.01501, "t": 151.18255999999997, "r": 324.98093, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Fin", "bbox": {"l": 343.01236, "t": 151.18255999999997, "r": 354.65076, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Man", "bbox": {"l": 367.84033, "t": 151.18255999999997, "r": 384.32059, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Sci", "bbox": {"l": 407.54358, "t": 151.18255999999997, "r": 418.15979, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Law", "bbox": {"l": 432.29979999999995, "t": 151.18255999999997, "r": 447.82962, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "Pat", "bbox": {"l": 465.72656, "t": 151.18255999999997, "r": 477.50842, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Ten", "bbox": {"l": 493.52240000000006, "t": 151.18255999999997, "r": 507.17822, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Caption", "bbox": {"l": 104.825, "t": 162.53954999999996, "r": 134.01064, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "22524", "bbox": {"l": 177.866, "t": 162.53954999999996, "r": 198.71288, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "2.04", "bbox": {"l": 219.211, "t": 162.53954999999996, "r": 233.69174000000004, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "1.77", "bbox": {"l": 250.01956, "t": 162.53954999999996, "r": 264.50031, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "2.32", "bbox": {"l": 280.82812, "t": 162.53954999999996, "r": 295.30887, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "84-89", "bbox": {"l": 305.27301, "t": 162.53954999999996, "r": 324.98117, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "40-61", "bbox": {"l": 334.94284, "t": 162.53954999999996, "r": 354.651, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "86-92", "bbox": {"l": 364.61267, "t": 162.53954999999996, "r": 384.32083, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "94-99", "bbox": {"l": 398.45187, "t": 162.53954999999996, "r": 418.16003, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "95-99", "bbox": {"l": 428.1217, "t": 162.53954999999996, "r": 447.82986, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "69-78", "bbox": {"l": 457.80051, "t": 162.53954999999996, "r": 477.50867, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "n/a", "bbox": {"l": 495.32489, "t": 162.53954999999996, "r": 507.17846999999995, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Footnote", "bbox": {"l": 104.825, "t": 173.49854000000005, "r": 137.3282, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "6318", "bbox": {"l": 182.035, "t": 173.49854000000005, "r": 198.71251, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "0.60", "bbox": {"l": 219.211, "t": 173.49854000000005, "r": 233.69174000000004, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "0.31", "bbox": {"l": 250.01956, "t": 173.49854000000005, "r": 264.50031, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "0.58", "bbox": {"l": 280.82812, "t": 173.49854000000005, "r": 295.30887, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "83-91", "bbox": {"l": 305.27301, "t": 173.49854000000005, "r": 324.98117, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "n/a", "bbox": {"l": 342.79739, "t": 173.49854000000005, "r": 354.65097, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "100", "bbox": {"l": 371.81265, "t": 173.49854000000005, "r": 384.32077, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "62-88", "bbox": {"l": 398.45181, "t": 173.49854000000005, "r": 418.15997, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "85-94", "bbox": {"l": 428.12164, "t": 173.49854000000005, "r": 447.8298, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "n/a", "bbox": {"l": 465.655, "t": 173.49854000000005, "r": 477.50857999999994, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "82-97", "bbox": {"l": 487.47025, "t": 173.49854000000005, "r": 507.17841, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Formula", "bbox": {"l": 104.825, "t": 184.45752000000005, "r": 135.33766, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "25027", "bbox": {"l": 177.866, "t": 184.45752000000005, "r": 198.71288, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "2.25", "bbox": {"l": 219.211, "t": 184.45752000000005, "r": 233.69174000000004, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "1.90", "bbox": {"l": 250.01956, "t": 184.45752000000005, "r": 264.50031, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "2.96", "bbox": {"l": 280.82812, "t": 184.45752000000005, "r": 295.30887, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "83-85", "bbox": {"l": 305.27301, "t": 184.45752000000005, "r": 324.98117, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "n/a", "bbox": {"l": 342.79739, "t": 184.45752000000005, "r": 354.65097, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "n/a", "bbox": {"l": 372.46719, "t": 184.45752000000005, "r": 384.32077, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "84-87", "bbox": {"l": 398.45181, "t": 184.45752000000005, "r": 418.15997, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "86-96", "bbox": {"l": 428.12164, "t": 184.45752000000005, "r": 447.8298, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "n/a", "bbox": {"l": 465.655, "t": 184.45752000000005, "r": 477.50857999999994, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "n/a", "bbox": {"l": 495.3248, "t": 184.45752000000005, "r": 507.17838000000006, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "List-item", "bbox": {"l": 104.825, "t": 195.41656, "r": 137.70479, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "185660", "bbox": {"l": 173.69701, "t": 195.41656, "r": 198.71326, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "17.19", "bbox": {"l": 215.04201, "t": 195.41656, "r": 233.69212, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "13.34", "bbox": {"l": 245.85056, "t": 195.41656, "r": 264.50067, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "15.82", "bbox": {"l": 276.65912, "t": 195.41656, "r": 295.30923, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "87-88", "bbox": {"l": 305.27301, "t": 195.41656, "r": 324.98117, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "74-83", "bbox": {"l": 334.94284, "t": 195.41656, "r": 354.651, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "90-92", "bbox": {"l": 364.61267, "t": 195.41656, "r": 384.32083, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "97-97", "bbox": {"l": 398.45187, "t": 195.41656, "r": 418.16003, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "81-85", "bbox": {"l": 428.1217, "t": 195.41656, "r": 447.82986, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "75-88", "bbox": {"l": 457.80051, "t": 195.41656, "r": 477.50867, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "93-95", "bbox": {"l": 487.47034, "t": 195.41656, "r": 507.17849999999993, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "Page-footer", "bbox": {"l": 104.825, "t": 206.37554999999998, "r": 147.35262, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "70878", "bbox": {"l": 177.866, "t": 206.37554999999998, "r": 198.71288, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "6.51", "bbox": {"l": 219.211, "t": 206.37554999999998, "r": 233.69174000000004, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "5.58", "bbox": {"l": 250.01956, "t": 206.37554999999998, "r": 264.50031, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "6.00", "bbox": {"l": 280.82812, "t": 206.37554999999998, "r": 295.30887, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "93-94", "bbox": {"l": 305.27301, "t": 206.37554999999998, "r": 324.98117, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "88-90", "bbox": {"l": 334.94284, "t": 206.37554999999998, "r": 354.651, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "95-96", "bbox": {"l": 364.61267, "t": 206.37554999999998, "r": 384.32083, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "100", "bbox": {"l": 405.65189, "t": 206.37554999999998, "r": 418.16, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "92-97", "bbox": {"l": 428.12167, "t": 206.37554999999998, "r": 447.82983, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "100", "bbox": {"l": 465.00049, "t": 206.37554999999998, "r": 477.5086099999999, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "96-98", "bbox": {"l": 487.47028, "t": 206.37554999999998, "r": 507.17843999999997, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "Page-header", "bbox": {"l": 104.825, "t": 217.33452999999997, "r": 150.10532, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "58022", "bbox": {"l": 177.866, "t": 217.33452999999997, "r": 198.71288, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "5.10", "bbox": {"l": 219.211, "t": 217.33452999999997, "r": 233.69174000000004, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "6.70", "bbox": {"l": 250.01956, "t": 217.33452999999997, "r": 264.50031, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "5.06", "bbox": {"l": 280.82812, "t": 217.33452999999997, "r": 295.30887, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "85-89", "bbox": {"l": 305.27301, "t": 217.33452999999997, "r": 324.98117, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "66-76", "bbox": {"l": 334.94284, "t": 217.33452999999997, "r": 354.651, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "90-94", "bbox": {"l": 364.61267, "t": 217.33452999999997, "r": 384.32083, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "98-100", "bbox": {"l": 394.2825, "t": 217.33452999999997, "r": 418.16003, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "91-92", "bbox": {"l": 428.1217, "t": 217.33452999999997, "r": 447.82986, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "97-99", "bbox": {"l": 457.80051, "t": 217.33452999999997, "r": 477.50867, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "81-86", "bbox": {"l": 487.47034, "t": 217.33452999999997, "r": 507.17849999999993, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "Picture", "bbox": {"l": 104.825, "t": 228.29351999999994, "r": 130.80963, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "45976", "bbox": {"l": 177.866, "t": 228.29351999999994, "r": 198.71288, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "4.21", "bbox": {"l": 219.211, "t": 228.29351999999994, "r": 233.69174000000004, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "2.78", "bbox": {"l": 250.01956, "t": 228.29351999999994, "r": 264.50031, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "5.31", "bbox": {"l": 280.82812, "t": 228.29351999999994, "r": 295.30887, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "69-71", "bbox": {"l": 305.27301, "t": 228.29351999999994, "r": 324.98117, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "56-59", "bbox": {"l": 334.94284, "t": 228.29351999999994, "r": 354.651, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "82-86", "bbox": {"l": 364.61267, "t": 228.29351999999994, "r": 384.32083, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "69-82", "bbox": {"l": 398.45187, "t": 228.29351999999994, "r": 418.16003, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "80-95", "bbox": {"l": 428.1217, "t": 228.29351999999994, "r": 447.82986, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "66-71", "bbox": {"l": 457.80051, "t": 228.29351999999994, "r": 477.50867, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "59-76", "bbox": {"l": 487.47034, "t": 228.29351999999994, "r": 507.17849999999993, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "Section-header", "bbox": {"l": 104.825, "t": 239.25256000000002, "r": 159.56487, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "142884", "bbox": {"l": 173.69701, "t": 239.25256000000002, "r": 198.71326, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "12.60", "bbox": {"l": 215.04201, "t": 239.25256000000002, "r": 233.69212, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "15.77", "bbox": {"l": 245.85056, "t": 239.25256000000002, "r": 264.50067, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "12.85", "bbox": {"l": 276.65912, "t": 239.25256000000002, "r": 295.30923, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "83-84", "bbox": {"l": 305.27301, "t": 239.25256000000002, "r": 324.98117, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "76-81", "bbox": {"l": 334.94284, "t": 239.25256000000002, "r": 354.651, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "90-92", "bbox": {"l": 364.61267, "t": 239.25256000000002, "r": 384.32083, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "94-95", "bbox": {"l": 398.45187, "t": 239.25256000000002, "r": 418.16003, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "87-94", "bbox": {"l": 428.1217, "t": 239.25256000000002, "r": 447.82986, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "69-73", "bbox": {"l": 457.80051, "t": 239.25256000000002, "r": 477.50867, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "78-86", "bbox": {"l": 487.47034, "t": 239.25256000000002, "r": 507.17849999999993, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "Table", "bbox": {"l": 104.825, "t": 250.21155, "r": 124.63177, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "34733", "bbox": {"l": 177.866, "t": 250.21155, "r": 198.71288, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "3.20", "bbox": {"l": 219.211, "t": 250.21155, "r": 233.69174000000004, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "2.27", "bbox": {"l": 250.01956, "t": 250.21155, "r": 264.50031, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "3.60", "bbox": {"l": 280.82812, "t": 250.21155, "r": 295.30887, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "77-81", "bbox": {"l": 305.27301, "t": 250.21155, "r": 324.98117, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "75-80", "bbox": {"l": 334.94284, "t": 250.21155, "r": 354.651, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "83-86", "bbox": {"l": 364.61267, "t": 250.21155, "r": 384.32083, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "98-99", "bbox": {"l": 398.45187, "t": 250.21155, "r": 418.16003, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "58-80", "bbox": {"l": 428.1217, "t": 250.21155, "r": 447.82986, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "79-84", "bbox": {"l": 457.80051, "t": 250.21155, "r": 477.50867, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "70-85", "bbox": {"l": 487.47034, "t": 250.21155, "r": 507.17849999999993, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "Text", "bbox": {"l": 104.825, "t": 261.16956000000005, "r": 120.78519, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "510377", "bbox": {"l": 173.69701, "t": 261.16956000000005, "r": 198.71326, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "45.82", "bbox": {"l": 215.04201, "t": 261.16956000000005, "r": 233.69212, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "49.28", "bbox": {"l": 245.85056, "t": 261.16956000000005, "r": 264.50067, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "45.00", "bbox": {"l": 276.65912, "t": 261.16956000000005, "r": 295.30923, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "84-86", "bbox": {"l": 305.27301, "t": 261.16956000000005, "r": 324.98117, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "81-86", "bbox": {"l": 334.94284, "t": 261.16956000000005, "r": 354.651, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "88-93", "bbox": {"l": 364.61267, "t": 261.16956000000005, "r": 384.32083, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "89-93", "bbox": {"l": 398.45187, "t": 261.16956000000005, "r": 418.16003, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "87-92", "bbox": {"l": 428.1217, "t": 261.16956000000005, "r": 447.82986, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "71-79", "bbox": {"l": 457.80051, "t": 261.16956000000005, "r": 477.50867, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "87-95", "bbox": {"l": 487.47034, "t": 261.16956000000005, "r": 507.17849999999993, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "Title", "bbox": {"l": 104.825, "t": 272.12854000000004, "r": 121.81633, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "5071", "bbox": {"l": 182.035, "t": 272.12854000000004, "r": 198.71251, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "0.47", "bbox": {"l": 219.211, "t": 272.12854000000004, "r": 233.69174000000004, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "0.30", "bbox": {"l": 250.01956, "t": 272.12854000000004, "r": 264.50031, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "0.50", "bbox": {"l": 280.82812, "t": 272.12854000000004, "r": 295.30887, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "60-72", "bbox": {"l": 305.27301, "t": 272.12854000000004, "r": 324.98117, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "24-63", "bbox": {"l": 334.94284, "t": 272.12854000000004, "r": 354.651, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "50-63", "bbox": {"l": 364.61267, "t": 272.12854000000004, "r": 384.32083, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "94-100", "bbox": {"l": 394.2825, "t": 272.12854000000004, "r": 418.16003, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "82-96", "bbox": {"l": 428.1217, "t": 272.12854000000004, "r": 447.82986, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "68-79", "bbox": {"l": 457.80051, "t": 272.12854000000004, "r": 477.50867, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "24-56", "bbox": {"l": 487.47034, "t": 272.12854000000004, "r": 507.17849999999993, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "Total", "bbox": {"l": 104.825, "t": 283.48654, "r": 123.43028, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "1107470", "bbox": {"l": 169.52699, "t": 283.48654, "r": 198.71263, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "941123", "bbox": {"l": 208.675, "t": 283.48654, "r": 233.69124999999997, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "99816", "bbox": {"l": 243.65291999999997, "t": 283.48654, "r": 264.49982, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "66531", "bbox": {"l": 274.46149, "t": 283.48654, "r": 295.30838, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "82-83", "bbox": {"l": 305.27301, "t": 283.48654, "r": 324.98117, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "71-74", "bbox": {"l": 334.94284, "t": 283.48654, "r": 354.651, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "79-81", "bbox": {"l": 364.61267, "t": 283.48654, "r": 384.32083, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "89-94", "bbox": {"l": 398.45187, "t": 283.48654, "r": 418.16003, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "86-91", "bbox": {"l": 428.1217, "t": 283.48654, "r": 447.82986, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "71-76", "bbox": {"l": 457.80051, "t": 283.48654, "r": 477.50867, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "68-85", "bbox": {"l": 487.47034, "t": 283.48654, "r": 507.17849999999993, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": [{"id": 11, "label": "text", "bbox": {"l": 233.94400000000002, "t": 140.22351000000003, "r": 270.04272, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 5, "text": "% of Total", "bbox": {"l": 233.94400000000002, "t": 140.22351000000003, "r": 270.04272, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 329.04999, "t": 140.22351000000003, "r": 483.3976400000001, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": "triple inter-annotator mAP @ 0.5-0.95 (%)", "bbox": {"l": 329.04999, "t": 140.22351000000003, "r": 483.3976400000001, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 104.825, "t": 151.18255999999997, "r": 141.71277, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "class label", "bbox": {"l": 104.825, "t": 151.18255999999997, "r": 141.71277, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 175.94701, "t": 151.18255999999997, "r": 198.71269, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "Count", "bbox": {"l": 175.94701, "t": 151.18255999999997, "r": 198.71269, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 213.795, "t": 151.18255999999997, "r": 233.69144, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "Train", "bbox": {"l": 213.795, "t": 151.18255999999997, "r": 233.69144, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 249.37367, "t": 151.18255999999997, "r": 264.5, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "Test", "bbox": {"l": 249.37367, "t": 151.18255999999997, "r": 264.5, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 283.53568, "t": 151.18255999999997, "r": 295.30856, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "Val", "bbox": {"l": 283.53568, "t": 151.18255999999997, "r": 295.30856, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 314.01501, "t": 151.18255999999997, "r": 324.98093, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "All", "bbox": {"l": 314.01501, "t": 151.18255999999997, "r": 324.98093, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 343.01236, "t": 151.18255999999997, "r": 354.65076, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "Fin", "bbox": {"l": 343.01236, "t": 151.18255999999997, "r": 354.65076, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 367.84033, "t": 151.18255999999997, "r": 384.32059, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "Man", "bbox": {"l": 367.84033, "t": 151.18255999999997, "r": 384.32059, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 407.54358, "t": 151.18255999999997, "r": 418.15979, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "Sci", "bbox": {"l": 407.54358, "t": 151.18255999999997, "r": 418.15979, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 432.29979999999995, "t": 151.18255999999997, "r": 447.82962, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "Law", "bbox": {"l": 432.29979999999995, "t": 151.18255999999997, "r": 447.82962, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 465.72656, "t": 151.18255999999997, "r": 477.50842, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "Pat", "bbox": {"l": 465.72656, "t": 151.18255999999997, "r": 477.50842, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 493.52240000000006, "t": 151.18255999999997, "r": 507.17822, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "Ten", "bbox": {"l": 493.52240000000006, "t": 151.18255999999997, "r": 507.17822, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 104.825, "t": 162.53954999999996, "r": 134.01064, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "Caption", "bbox": {"l": 104.825, "t": 162.53954999999996, "r": 134.01064, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 177.866, "t": 162.53954999999996, "r": 198.71288, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "22524", "bbox": {"l": 177.866, "t": 162.53954999999996, "r": 198.71288, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 219.211, "t": 162.53954999999996, "r": 233.69174000000004, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "2.04", "bbox": {"l": 219.211, "t": 162.53954999999996, "r": 233.69174000000004, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 250.01956, "t": 162.53954999999996, "r": 264.50031, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "1.77", "bbox": {"l": 250.01956, "t": 162.53954999999996, "r": 264.50031, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 280.82812, "t": 162.53954999999996, "r": 295.30887, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "2.32", "bbox": {"l": 280.82812, "t": 162.53954999999996, "r": 295.30887, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 305.27301, "t": 162.53954999999996, "r": 324.98117, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "84-89", "bbox": {"l": 305.27301, "t": 162.53954999999996, "r": 324.98117, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 334.94284, "t": 162.53954999999996, "r": 354.651, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "40-61", "bbox": {"l": 334.94284, "t": 162.53954999999996, "r": 354.651, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 364.61267, "t": 162.53954999999996, "r": 384.32083, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "86-92", "bbox": {"l": 364.61267, "t": 162.53954999999996, "r": 384.32083, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 398.45187, "t": 162.53954999999996, "r": 418.16003, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "94-99", "bbox": {"l": 398.45187, "t": 162.53954999999996, "r": 418.16003, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 428.1217, "t": 162.53954999999996, "r": 447.82986, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "95-99", "bbox": {"l": 428.1217, "t": 162.53954999999996, "r": 447.82986, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 457.80051, "t": 162.53954999999996, "r": 477.50867, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "69-78", "bbox": {"l": 457.80051, "t": 162.53954999999996, "r": 477.50867, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 495.32489, "t": 162.53954999999996, "r": 507.17846999999995, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "n/a", "bbox": {"l": 495.32489, "t": 162.53954999999996, "r": 507.17846999999995, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 104.825, "t": 173.49854000000005, "r": 137.3282, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "Footnote", "bbox": {"l": 104.825, "t": 173.49854000000005, "r": 137.3282, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 182.035, "t": 173.49854000000005, "r": 198.71251, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "6318", "bbox": {"l": 182.035, "t": 173.49854000000005, "r": 198.71251, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 219.211, "t": 173.49854000000005, "r": 233.69174000000004, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "0.60", "bbox": {"l": 219.211, "t": 173.49854000000005, "r": 233.69174000000004, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 250.01956, "t": 173.49854000000005, "r": 264.50031, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "0.31", "bbox": {"l": 250.01956, "t": 173.49854000000005, "r": 264.50031, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 280.82812, "t": 173.49854000000005, "r": 295.30887, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "0.58", "bbox": {"l": 280.82812, "t": 173.49854000000005, "r": 295.30887, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 305.27301, "t": 173.49854000000005, "r": 324.98117, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "83-91", "bbox": {"l": 305.27301, "t": 173.49854000000005, "r": 324.98117, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 342.79739, "t": 173.49854000000005, "r": 354.65097, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "n/a", "bbox": {"l": 342.79739, "t": 173.49854000000005, "r": 354.65097, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 371.81265, "t": 173.49854000000005, "r": 384.32077, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "100", "bbox": {"l": 371.81265, "t": 173.49854000000005, "r": 384.32077, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 398.45181, "t": 173.49854000000005, "r": 418.15997, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "62-88", "bbox": {"l": 398.45181, "t": 173.49854000000005, "r": 418.15997, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 428.12164, "t": 173.49854000000005, "r": 447.8298, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "85-94", "bbox": {"l": 428.12164, "t": 173.49854000000005, "r": 447.8298, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 465.655, "t": 173.49854000000005, "r": 477.50857999999994, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "n/a", "bbox": {"l": 465.655, "t": 173.49854000000005, "r": 477.50857999999994, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 487.47025, "t": 173.49854000000005, "r": 507.17841, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "82-97", "bbox": {"l": 487.47025, "t": 173.49854000000005, "r": 507.17841, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 104.825, "t": 184.45752000000005, "r": 135.33766, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "Formula", "bbox": {"l": 104.825, "t": 184.45752000000005, "r": 135.33766, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 177.866, "t": 184.45752000000005, "r": 198.71288, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "25027", "bbox": {"l": 177.866, "t": 184.45752000000005, "r": 198.71288, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 219.211, "t": 184.45752000000005, "r": 233.69174000000004, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "2.25", "bbox": {"l": 219.211, "t": 184.45752000000005, "r": 233.69174000000004, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 250.01956, "t": 184.45752000000005, "r": 264.50031, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "1.90", "bbox": {"l": 250.01956, "t": 184.45752000000005, "r": 264.50031, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 280.82812, "t": 184.45752000000005, "r": 295.30887, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "2.96", "bbox": {"l": 280.82812, "t": 184.45752000000005, "r": 295.30887, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 305.27301, "t": 184.45752000000005, "r": 324.98117, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "83-85", "bbox": {"l": 305.27301, "t": 184.45752000000005, "r": 324.98117, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 342.79739, "t": 184.45752000000005, "r": 354.65097, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "n/a", "bbox": {"l": 342.79739, "t": 184.45752000000005, "r": 354.65097, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 372.46719, "t": 184.45752000000005, "r": 384.32077, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "n/a", "bbox": {"l": 372.46719, "t": 184.45752000000005, "r": 384.32077, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 398.45181, "t": 184.45752000000005, "r": 418.15997, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "84-87", "bbox": {"l": 398.45181, "t": 184.45752000000005, "r": 418.15997, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 428.12164, "t": 184.45752000000005, "r": 447.8298, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "86-96", "bbox": {"l": 428.12164, "t": 184.45752000000005, "r": 447.8298, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 465.655, "t": 184.45752000000005, "r": 477.50857999999994, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "n/a", "bbox": {"l": 465.655, "t": 184.45752000000005, "r": 477.50857999999994, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 495.3248, "t": 184.45752000000005, "r": 507.17838000000006, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "n/a", "bbox": {"l": 495.3248, "t": 184.45752000000005, "r": 507.17838000000006, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 104.825, "t": 195.41656, "r": 137.70479, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "List-item", "bbox": {"l": 104.825, "t": 195.41656, "r": 137.70479, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 173.69701, "t": 195.41656, "r": 198.71326, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "185660", "bbox": {"l": 173.69701, "t": 195.41656, "r": 198.71326, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 215.04201, "t": 195.41656, "r": 233.69212, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "17.19", "bbox": {"l": 215.04201, "t": 195.41656, "r": 233.69212, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 245.85056, "t": 195.41656, "r": 264.50067, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "13.34", "bbox": {"l": 245.85056, "t": 195.41656, "r": 264.50067, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 276.65912, "t": 195.41656, "r": 295.30923, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "15.82", "bbox": {"l": 276.65912, "t": 195.41656, "r": 295.30923, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 305.27301, "t": 195.41656, "r": 324.98117, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "87-88", "bbox": {"l": 305.27301, "t": 195.41656, "r": 324.98117, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 334.94284, "t": 195.41656, "r": 354.651, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "74-83", "bbox": {"l": 334.94284, "t": 195.41656, "r": 354.651, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 364.61267, "t": 195.41656, "r": 384.32083, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "90-92", "bbox": {"l": 364.61267, "t": 195.41656, "r": 384.32083, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 398.45187, "t": 195.41656, "r": 418.16003, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "97-97", "bbox": {"l": 398.45187, "t": 195.41656, "r": 418.16003, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 428.1217, "t": 195.41656, "r": 447.82986, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "81-85", "bbox": {"l": 428.1217, "t": 195.41656, "r": 447.82986, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 457.80051, "t": 195.41656, "r": 477.50867, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "75-88", "bbox": {"l": 457.80051, "t": 195.41656, "r": 477.50867, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 487.47034, "t": 195.41656, "r": 507.17849999999993, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "93-95", "bbox": {"l": 487.47034, "t": 195.41656, "r": 507.17849999999993, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 104.825, "t": 206.37554999999998, "r": 147.35262, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "Page-footer", "bbox": {"l": 104.825, "t": 206.37554999999998, "r": 147.35262, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 177.866, "t": 206.37554999999998, "r": 198.71288, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "70878", "bbox": {"l": 177.866, "t": 206.37554999999998, "r": 198.71288, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 219.211, "t": 206.37554999999998, "r": 233.69174000000004, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "6.51", "bbox": {"l": 219.211, "t": 206.37554999999998, "r": 233.69174000000004, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 250.01956, "t": 206.37554999999998, "r": 264.50031, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "5.58", "bbox": {"l": 250.01956, "t": 206.37554999999998, "r": 264.50031, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 280.82812, "t": 206.37554999999998, "r": 295.30887, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "6.00", "bbox": {"l": 280.82812, "t": 206.37554999999998, "r": 295.30887, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 305.27301, "t": 206.37554999999998, "r": 324.98117, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "93-94", "bbox": {"l": 305.27301, "t": 206.37554999999998, "r": 324.98117, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 334.94284, "t": 206.37554999999998, "r": 354.651, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "88-90", "bbox": {"l": 334.94284, "t": 206.37554999999998, "r": 354.651, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 364.61267, "t": 206.37554999999998, "r": 384.32083, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "95-96", "bbox": {"l": 364.61267, "t": 206.37554999999998, "r": 384.32083, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 405.65189, "t": 206.37554999999998, "r": 418.16, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "100", "bbox": {"l": 405.65189, "t": 206.37554999999998, "r": 418.16, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 428.12167, "t": 206.37554999999998, "r": 447.82983, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "92-97", "bbox": {"l": 428.12167, "t": 206.37554999999998, "r": 447.82983, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 465.00049, "t": 206.37554999999998, "r": 477.5086099999999, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "100", "bbox": {"l": 465.00049, "t": 206.37554999999998, "r": 477.5086099999999, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 487.47028, "t": 206.37554999999998, "r": 507.17843999999997, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "96-98", "bbox": {"l": 487.47028, "t": 206.37554999999998, "r": 507.17843999999997, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 104.825, "t": 217.33452999999997, "r": 150.10532, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "Page-header", "bbox": {"l": 104.825, "t": 217.33452999999997, "r": 150.10532, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 177.866, "t": 217.33452999999997, "r": 198.71288, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "58022", "bbox": {"l": 177.866, "t": 217.33452999999997, "r": 198.71288, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 219.211, "t": 217.33452999999997, "r": 233.69174000000004, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "5.10", "bbox": {"l": 219.211, "t": 217.33452999999997, "r": 233.69174000000004, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 250.01956, "t": 217.33452999999997, "r": 264.50031, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "6.70", "bbox": {"l": 250.01956, "t": 217.33452999999997, "r": 264.50031, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 280.82812, "t": 217.33452999999997, "r": 295.30887, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "5.06", "bbox": {"l": 280.82812, "t": 217.33452999999997, "r": 295.30887, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 305.27301, "t": 217.33452999999997, "r": 324.98117, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "85-89", "bbox": {"l": 305.27301, "t": 217.33452999999997, "r": 324.98117, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 334.94284, "t": 217.33452999999997, "r": 354.651, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "66-76", "bbox": {"l": 334.94284, "t": 217.33452999999997, "r": 354.651, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 364.61267, "t": 217.33452999999997, "r": 384.32083, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "90-94", "bbox": {"l": 364.61267, "t": 217.33452999999997, "r": 384.32083, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 394.2825, "t": 217.33452999999997, "r": 418.16003, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "98-100", "bbox": {"l": 394.2825, "t": 217.33452999999997, "r": 418.16003, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 428.1217, "t": 217.33452999999997, "r": 447.82986, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "91-92", "bbox": {"l": 428.1217, "t": 217.33452999999997, "r": 447.82986, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 457.80051, "t": 217.33452999999997, "r": 477.50867, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "97-99", "bbox": {"l": 457.80051, "t": 217.33452999999997, "r": 477.50867, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 487.47034, "t": 217.33452999999997, "r": 507.17849999999993, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "81-86", "bbox": {"l": 487.47034, "t": 217.33452999999997, "r": 507.17849999999993, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 104.825, "t": 228.29351999999994, "r": 130.80963, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "Picture", "bbox": {"l": 104.825, "t": 228.29351999999994, "r": 130.80963, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 177.866, "t": 228.29351999999994, "r": 198.71288, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "45976", "bbox": {"l": 177.866, "t": 228.29351999999994, "r": 198.71288, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 219.211, "t": 228.29351999999994, "r": 233.69174000000004, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "4.21", "bbox": {"l": 219.211, "t": 228.29351999999994, "r": 233.69174000000004, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 250.01956, "t": 228.29351999999994, "r": 264.50031, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "2.78", "bbox": {"l": 250.01956, "t": 228.29351999999994, "r": 264.50031, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 280.82812, "t": 228.29351999999994, "r": 295.30887, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "5.31", "bbox": {"l": 280.82812, "t": 228.29351999999994, "r": 295.30887, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 305.27301, "t": 228.29351999999994, "r": 324.98117, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "69-71", "bbox": {"l": 305.27301, "t": 228.29351999999994, "r": 324.98117, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 334.94284, "t": 228.29351999999994, "r": 354.651, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "56-59", "bbox": {"l": 334.94284, "t": 228.29351999999994, "r": 354.651, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 364.61267, "t": 228.29351999999994, "r": 384.32083, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "82-86", "bbox": {"l": 364.61267, "t": 228.29351999999994, "r": 384.32083, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 398.45187, "t": 228.29351999999994, "r": 418.16003, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "69-82", "bbox": {"l": 398.45187, "t": 228.29351999999994, "r": 418.16003, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 428.1217, "t": 228.29351999999994, "r": 447.82986, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "80-95", "bbox": {"l": 428.1217, "t": 228.29351999999994, "r": 447.82986, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 457.80051, "t": 228.29351999999994, "r": 477.50867, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "66-71", "bbox": {"l": 457.80051, "t": 228.29351999999994, "r": 477.50867, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 487.47034, "t": 228.29351999999994, "r": 507.17849999999993, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "59-76", "bbox": {"l": 487.47034, "t": 228.29351999999994, "r": 507.17849999999993, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 104.825, "t": 239.25256000000002, "r": 159.56487, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": "Section-header", "bbox": {"l": 104.825, "t": 239.25256000000002, "r": 159.56487, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 173.69701, "t": 239.25256000000002, "r": 198.71326, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "142884", "bbox": {"l": 173.69701, "t": 239.25256000000002, "r": 198.71326, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 215.04201, "t": 239.25256000000002, "r": 233.69212, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "12.60", "bbox": {"l": 215.04201, "t": 239.25256000000002, "r": 233.69212, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 245.85056, "t": 239.25256000000002, "r": 264.50067, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": "15.77", "bbox": {"l": 245.85056, "t": 239.25256000000002, "r": 264.50067, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 276.65912, "t": 239.25256000000002, "r": 295.30923, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 107, "text": "12.85", "bbox": {"l": 276.65912, "t": 239.25256000000002, "r": 295.30923, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 114, "label": "text", "bbox": {"l": 305.27301, "t": 239.25256000000002, "r": 324.98117, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 108, "text": "83-84", "bbox": {"l": 305.27301, "t": 239.25256000000002, "r": 324.98117, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 115, "label": "text", "bbox": {"l": 334.94284, "t": 239.25256000000002, "r": 354.651, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 109, "text": "76-81", "bbox": {"l": 334.94284, "t": 239.25256000000002, "r": 354.651, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 116, "label": "text", "bbox": {"l": 364.61267, "t": 239.25256000000002, "r": 384.32083, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 110, "text": "90-92", "bbox": {"l": 364.61267, "t": 239.25256000000002, "r": 384.32083, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 117, "label": "text", "bbox": {"l": 398.45187, "t": 239.25256000000002, "r": 418.16003, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 111, "text": "94-95", "bbox": {"l": 398.45187, "t": 239.25256000000002, "r": 418.16003, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 118, "label": "text", "bbox": {"l": 428.1217, "t": 239.25256000000002, "r": 447.82986, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 112, "text": "87-94", "bbox": {"l": 428.1217, "t": 239.25256000000002, "r": 447.82986, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 119, "label": "text", "bbox": {"l": 457.80051, "t": 239.25256000000002, "r": 477.50867, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 113, "text": "69-73", "bbox": {"l": 457.80051, "t": 239.25256000000002, "r": 477.50867, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 120, "label": "text", "bbox": {"l": 487.47034, "t": 239.25256000000002, "r": 507.17849999999993, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 114, "text": "78-86", "bbox": {"l": 487.47034, "t": 239.25256000000002, "r": 507.17849999999993, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 121, "label": "text", "bbox": {"l": 104.825, "t": 250.21155, "r": 124.63177, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 115, "text": "Table", "bbox": {"l": 104.825, "t": 250.21155, "r": 124.63177, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 122, "label": "text", "bbox": {"l": 177.866, "t": 250.21155, "r": 198.71288, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 116, "text": "34733", "bbox": {"l": 177.866, "t": 250.21155, "r": 198.71288, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 123, "label": "text", "bbox": {"l": 219.211, "t": 250.21155, "r": 233.69174000000004, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 117, "text": "3.20", "bbox": {"l": 219.211, "t": 250.21155, "r": 233.69174000000004, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 124, "label": "text", "bbox": {"l": 250.01956, "t": 250.21155, "r": 264.50031, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 118, "text": "2.27", "bbox": {"l": 250.01956, "t": 250.21155, "r": 264.50031, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 125, "label": "text", "bbox": {"l": 280.82812, "t": 250.21155, "r": 295.30887, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 119, "text": "3.60", "bbox": {"l": 280.82812, "t": 250.21155, "r": 295.30887, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 126, "label": "text", "bbox": {"l": 305.27301, "t": 250.21155, "r": 324.98117, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 120, "text": "77-81", "bbox": {"l": 305.27301, "t": 250.21155, "r": 324.98117, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 127, "label": "text", "bbox": {"l": 334.94284, "t": 250.21155, "r": 354.651, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 121, "text": "75-80", "bbox": {"l": 334.94284, "t": 250.21155, "r": 354.651, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 128, "label": "text", "bbox": {"l": 364.61267, "t": 250.21155, "r": 384.32083, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 122, "text": "83-86", "bbox": {"l": 364.61267, "t": 250.21155, "r": 384.32083, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 129, "label": "text", "bbox": {"l": 398.45187, "t": 250.21155, "r": 418.16003, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 123, "text": "98-99", "bbox": {"l": 398.45187, "t": 250.21155, "r": 418.16003, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 130, "label": "text", "bbox": {"l": 428.1217, "t": 250.21155, "r": 447.82986, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 124, "text": "58-80", "bbox": {"l": 428.1217, "t": 250.21155, "r": 447.82986, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 131, "label": "text", "bbox": {"l": 457.80051, "t": 250.21155, "r": 477.50867, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 125, "text": "79-84", "bbox": {"l": 457.80051, "t": 250.21155, "r": 477.50867, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 132, "label": "text", "bbox": {"l": 487.47034, "t": 250.21155, "r": 507.17849999999993, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 126, "text": "70-85", "bbox": {"l": 487.47034, "t": 250.21155, "r": 507.17849999999993, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 133, "label": "text", "bbox": {"l": 104.825, "t": 261.16956000000005, "r": 120.78519, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 127, "text": "Text", "bbox": {"l": 104.825, "t": 261.16956000000005, "r": 120.78519, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 134, "label": "text", "bbox": {"l": 173.69701, "t": 261.16956000000005, "r": 198.71326, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 128, "text": "510377", "bbox": {"l": 173.69701, "t": 261.16956000000005, "r": 198.71326, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 135, "label": "text", "bbox": {"l": 215.04201, "t": 261.16956000000005, "r": 233.69212, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 129, "text": "45.82", "bbox": {"l": 215.04201, "t": 261.16956000000005, "r": 233.69212, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 136, "label": "text", "bbox": {"l": 245.85056, "t": 261.16956000000005, "r": 264.50067, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 130, "text": "49.28", "bbox": {"l": 245.85056, "t": 261.16956000000005, "r": 264.50067, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 137, "label": "text", "bbox": {"l": 276.65912, "t": 261.16956000000005, "r": 295.30923, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 131, "text": "45.00", "bbox": {"l": 276.65912, "t": 261.16956000000005, "r": 295.30923, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 138, "label": "text", "bbox": {"l": 305.27301, "t": 261.16956000000005, "r": 324.98117, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 132, "text": "84-86", "bbox": {"l": 305.27301, "t": 261.16956000000005, "r": 324.98117, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 139, "label": "text", "bbox": {"l": 334.94284, "t": 261.16956000000005, "r": 354.651, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 133, "text": "81-86", "bbox": {"l": 334.94284, "t": 261.16956000000005, "r": 354.651, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 140, "label": "text", "bbox": {"l": 364.61267, "t": 261.16956000000005, "r": 384.32083, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 134, "text": "88-93", "bbox": {"l": 364.61267, "t": 261.16956000000005, "r": 384.32083, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 141, "label": "text", "bbox": {"l": 398.45187, "t": 261.16956000000005, "r": 418.16003, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 135, "text": "89-93", "bbox": {"l": 398.45187, "t": 261.16956000000005, "r": 418.16003, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 142, "label": "text", "bbox": {"l": 428.1217, "t": 261.16956000000005, "r": 447.82986, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 136, "text": "87-92", "bbox": {"l": 428.1217, "t": 261.16956000000005, "r": 447.82986, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 143, "label": "text", "bbox": {"l": 457.80051, "t": 261.16956000000005, "r": 477.50867, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 137, "text": "71-79", "bbox": {"l": 457.80051, "t": 261.16956000000005, "r": 477.50867, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 144, "label": "text", "bbox": {"l": 487.47034, "t": 261.16956000000005, "r": 507.17849999999993, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 138, "text": "87-95", "bbox": {"l": 487.47034, "t": 261.16956000000005, "r": 507.17849999999993, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 145, "label": "text", "bbox": {"l": 104.825, "t": 272.12854000000004, "r": 121.81633, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 139, "text": "Title", "bbox": {"l": 104.825, "t": 272.12854000000004, "r": 121.81633, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 146, "label": "text", "bbox": {"l": 182.035, "t": 272.12854000000004, "r": 198.71251, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 140, "text": "5071", "bbox": {"l": 182.035, "t": 272.12854000000004, "r": 198.71251, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 147, "label": "text", "bbox": {"l": 219.211, "t": 272.12854000000004, "r": 233.69174000000004, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 141, "text": "0.47", "bbox": {"l": 219.211, "t": 272.12854000000004, "r": 233.69174000000004, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 148, "label": "text", "bbox": {"l": 250.01956, "t": 272.12854000000004, "r": 264.50031, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 142, "text": "0.30", "bbox": {"l": 250.01956, "t": 272.12854000000004, "r": 264.50031, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 149, "label": "text", "bbox": {"l": 280.82812, "t": 272.12854000000004, "r": 295.30887, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 143, "text": "0.50", "bbox": {"l": 280.82812, "t": 272.12854000000004, "r": 295.30887, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 150, "label": "text", "bbox": {"l": 305.27301, "t": 272.12854000000004, "r": 324.98117, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 144, "text": "60-72", "bbox": {"l": 305.27301, "t": 272.12854000000004, "r": 324.98117, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 151, "label": "text", "bbox": {"l": 334.94284, "t": 272.12854000000004, "r": 354.651, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 145, "text": "24-63", "bbox": {"l": 334.94284, "t": 272.12854000000004, "r": 354.651, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 152, "label": "text", "bbox": {"l": 364.61267, "t": 272.12854000000004, "r": 384.32083, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 146, "text": "50-63", "bbox": {"l": 364.61267, "t": 272.12854000000004, "r": 384.32083, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 153, "label": "text", "bbox": {"l": 394.2825, "t": 272.12854000000004, "r": 418.16003, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 147, "text": "94-100", "bbox": {"l": 394.2825, "t": 272.12854000000004, "r": 418.16003, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 154, "label": "text", "bbox": {"l": 428.1217, "t": 272.12854000000004, "r": 447.82986, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 148, "text": "82-96", "bbox": {"l": 428.1217, "t": 272.12854000000004, "r": 447.82986, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 155, "label": "text", "bbox": {"l": 457.80051, "t": 272.12854000000004, "r": 477.50867, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 149, "text": "68-79", "bbox": {"l": 457.80051, "t": 272.12854000000004, "r": 477.50867, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 156, "label": "text", "bbox": {"l": 487.47034, "t": 272.12854000000004, "r": 507.17849999999993, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 150, "text": "24-56", "bbox": {"l": 487.47034, "t": 272.12854000000004, "r": 507.17849999999993, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 157, "label": "text", "bbox": {"l": 104.825, "t": 283.48654, "r": 123.43028, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 151, "text": "Total", "bbox": {"l": 104.825, "t": 283.48654, "r": 123.43028, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 158, "label": "text", "bbox": {"l": 169.52699, "t": 283.48654, "r": 198.71263, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 152, "text": "1107470", "bbox": {"l": 169.52699, "t": 283.48654, "r": 198.71263, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 159, "label": "text", "bbox": {"l": 208.675, "t": 283.48654, "r": 233.69124999999997, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 153, "text": "941123", "bbox": {"l": 208.675, "t": 283.48654, "r": 233.69124999999997, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 160, "label": "text", "bbox": {"l": 243.65291999999997, "t": 283.48654, "r": 264.49982, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 154, "text": "99816", "bbox": {"l": 243.65291999999997, "t": 283.48654, "r": 264.49982, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 161, "label": "text", "bbox": {"l": 274.46149, "t": 283.48654, "r": 295.30838, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 155, "text": "66531", "bbox": {"l": 274.46149, "t": 283.48654, "r": 295.30838, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 162, "label": "text", "bbox": {"l": 305.27301, "t": 283.48654, "r": 324.98117, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 156, "text": "82-83", "bbox": {"l": 305.27301, "t": 283.48654, "r": 324.98117, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 163, "label": "text", "bbox": {"l": 334.94284, "t": 283.48654, "r": 354.651, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 157, "text": "71-74", "bbox": {"l": 334.94284, "t": 283.48654, "r": 354.651, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 164, "label": "text", "bbox": {"l": 364.61267, "t": 283.48654, "r": 384.32083, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 158, "text": "79-81", "bbox": {"l": 364.61267, "t": 283.48654, "r": 384.32083, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 165, "label": "text", "bbox": {"l": 398.45187, "t": 283.48654, "r": 418.16003, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 159, "text": "89-94", "bbox": {"l": 398.45187, "t": 283.48654, "r": 418.16003, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 166, "label": "text", "bbox": {"l": 428.1217, "t": 283.48654, "r": 447.82986, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 160, "text": "86-91", "bbox": {"l": 428.1217, "t": 283.48654, "r": 447.82986, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 167, "label": "text", "bbox": {"l": 457.80051, "t": 283.48654, "r": 477.50867, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 161, "text": "71-76", "bbox": {"l": 457.80051, "t": 283.48654, "r": 477.50867, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 168, "label": "text", "bbox": {"l": 487.47034, "t": 283.48654, "r": 507.17849999999993, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 162, "text": "68-85", "bbox": {"l": 487.47034, "t": 283.48654, "r": 507.17849999999993, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 9, "label": "caption", "bbox": {"l": 53.79800000000001, "t": 554.00999, "r": 295.64874, "b": 606.31924, "coord_origin": "TOPLEFT"}, "confidence": 0.8104903101921082, "cells": [{"id": 163, "text": "Figure 3: Corpus Conversion Service annotation user inter-", "bbox": {"l": 53.79800000000001, "t": 554.00999, "r": 295.64871, "b": 562.48325, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "face. The PDF page is shown in the background, with over-", "bbox": {"l": 53.79800000000001, "t": 564.96899, "r": 295.64874, "b": 573.44225, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "laid text-cells (in darker shades). The annotation boxes can", "bbox": {"l": 53.79800000000001, "t": 575.92799, "r": 294.04376, "b": 584.40125, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "be drawn by dragging a rectangle over each segment with", "bbox": {"l": 53.79800000000001, "t": 586.88699, "r": 294.04373, "b": 595.36024, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "the respective label from the palette on the right.", "bbox": {"l": 53.79800000000001, "t": 597.84599, "r": 252.78931000000003, "b": 606.31924, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "text", "bbox": {"l": 53.466999, "t": 634.29155, "r": 294.04745, "b": 675.54317, "coord_origin": "TOPLEFT"}, "confidence": 0.9803937673568726, "cells": [{"id": 168, "text": "we distributed the annotation workload and performed continuous", "bbox": {"l": 53.466999, "t": 634.29155, "r": 294.04745, "b": 642.66617, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "quality controls. Phase one and two required a small team of experts", "bbox": {"l": 53.79800000000001, "t": 645.25055, "r": 294.04535, "b": 653.62517, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "only. For phases three and four, a group of 40 dedicated annotators", "bbox": {"l": 53.79800000000001, "t": 656.20955, "r": 294.04422, "b": 664.58417, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "were assembled and supervised.", "bbox": {"l": 53.466999, "t": 667.16856, "r": 170.58611, "b": 675.54317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "text", "bbox": {"l": 53.79800000000001, "t": 678.01099, "r": 295.55844, "b": 708.420174, "coord_origin": "TOPLEFT"}, "confidence": 0.9748397469520569, "cells": [{"id": 172, "text": "Phase 1: Data selection and preparation.", "bbox": {"l": 63.76099800000001, "t": 678.01099, "r": 226.72533000000004, "b": 686.48424, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "Our inclusion cri-", "bbox": {"l": 229.06900000000002, "t": 678.12756, "r": 295.55844, "b": 686.50217, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "teria for documents were described in Section 3. A large effort went", "bbox": {"l": 53.79800000000001, "t": 689.08656, "r": 294.04538, "b": 697.461174, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "into ensuring that all documents are free to use. The data sources", "bbox": {"l": 53.79800000000001, "t": 700.045555, "r": 294.04642, "b": 708.420174, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "text", "bbox": {"l": 317.95499, "t": 312.07953, "r": 559.18536, "b": 375.24817, "coord_origin": "TOPLEFT"}, "confidence": 0.9818483591079712, "cells": [{"id": 176, "text": "include publication repositories such as arXiv$^{3}$, government offices,", "bbox": {"l": 317.95499, "t": 312.07953, "r": 559.18536, "b": 320.45416000000006, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "company websites as well as data directory services for financial", "bbox": {"l": 317.95499, "t": 323.03754, "r": 558.19843, "b": 331.41217, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "reports and patents. Scanned documents were excluded wherever", "bbox": {"l": 317.95499, "t": 333.99655, "r": 558.36963, "b": 342.37119, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "possible because they can be rotated or skewed. This would not", "bbox": {"l": 317.95499, "t": 344.95554, "r": 558.2041, "b": 353.33017, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "allow us to perform annotation with rectangular bounding-boxes", "bbox": {"l": 317.95499, "t": 355.91455, "r": 558.20294, "b": 364.28918, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "and therefore complicate the annotation process.", "bbox": {"l": 317.95499, "t": 366.87354, "r": 496.71826, "b": 375.24817, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 317.95499, "t": 377.8325500000001, "r": 559.71307, "b": 506.75516, "coord_origin": "TOPLEFT"}, "confidence": 0.9866719841957092, "cells": [{"id": 182, "text": "Preparation work included uploading and parsing the sourced", "bbox": {"l": 327.918, "t": 377.8325500000001, "r": 558.20618, "b": 386.20717999999994, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "PDF documents in the Corpus Conversion Service (CCS) [22], a", "bbox": {"l": 317.95499, "t": 388.79153, "r": 558.2019, "b": 397.16617, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "cloud-native platform which provides a visual annotation interface", "bbox": {"l": 317.95499, "t": 399.75055, "r": 558.20233, "b": 408.12518, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": "and allows for dataset inspection and analysis. The annotation in-", "bbox": {"l": 317.95499, "t": 410.7095299999999, "r": 559.71277, "b": 419.08417, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "terface of CCS is shown in Figure 3. The desired balance of pages", "bbox": {"l": 317.95499, "t": 421.66855000000004, "r": 558.20062, "b": 430.04318, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "between the different document categories was achieved by se-", "bbox": {"l": 317.95499, "t": 432.62753, "r": 559.71307, "b": 441.00217, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": "lective subsampling of pages with certain desired properties. For", "bbox": {"l": 317.95499, "t": 443.58554, "r": 558.36877, "b": 451.96017, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "example, we made sure to include the title page of each document", "bbox": {"l": 317.95499, "t": 454.54453, "r": 558.20428, "b": 462.91916, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "and bias the remaining page selection to those with figures or", "bbox": {"l": 317.95499, "t": 465.50354, "r": 558.36877, "b": 473.87817, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "tables. The latter was achieved by leveraging pre-trained object", "bbox": {"l": 317.95499, "t": 476.46252, "r": 558.20428, "b": 484.83716, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": "detection models from PubLayNet, which helped us estimate how", "bbox": {"l": 317.95499, "t": 487.42154, "r": 558.5307, "b": 495.79617, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "many figures and tables a given page contains.", "bbox": {"l": 317.95499, "t": 498.38052, "r": 488.46914999999996, "b": 506.75516, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 317.62299, "t": 509.22299, "r": 559.71765, "b": 693.0561749999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9847555756568909, "cells": [{"id": 194, "text": "Phase 2: Label selection and guideline.", "bbox": {"l": 327.918, "t": 509.22299, "r": 482.41809, "b": 517.69623, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "We reviewed the col-", "bbox": {"l": 484.474, "t": 509.33954, "r": 559.71765, "b": 517.71417, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "lected documents and identified the most common structural fea-", "bbox": {"l": 317.95499, "t": 520.29855, "r": 559.71619, "b": 528.67319, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "tures they exhibit. This was achieved by identifying recurrent layout", "bbox": {"l": 317.95499, "t": 531.2575400000001, "r": 558.20239, "b": 539.63217, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "elements and lead us to the definition of 11 distinct class labels.", "bbox": {"l": 317.95499, "t": 542.21655, "r": 559.58502, "b": 550.59117, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "These 11 class labels are", "bbox": {"l": 317.686, "t": 553.17456, "r": 404.14197, "b": 561.54918, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "Caption", "bbox": {"l": 406.26599, "t": 553.21939, "r": 433.84860000000003, "b": 561.5581500000001, "coord_origin": "TOPLEFT"}}, {"id": 201, "text": ",", "bbox": {"l": 433.84799, "t": 553.17456, "r": 435.78115999999994, "b": 561.54918, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": "Footnote", "bbox": {"l": 437.9079899999999, "t": 553.21939, "r": 467.23926, "b": 561.5581500000001, "coord_origin": "TOPLEFT"}}, {"id": 203, "text": ",", "bbox": {"l": 467.23999, "t": 553.17456, "r": 469.17316000000005, "b": 561.54918, "coord_origin": "TOPLEFT"}}, {"id": 204, "text": "Formula", "bbox": {"l": 471.29900999999995, "t": 553.21939, "r": 500.44574000000006, "b": 561.5581500000001, "coord_origin": "TOPLEFT"}}, {"id": 205, "text": ",", "bbox": {"l": 500.44601000000006, "t": 553.17456, "r": 502.37918, "b": 561.54918, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": "List-item", "bbox": {"l": 504.505, "t": 553.21939, "r": 535.74304, "b": 561.5581500000001, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": ",", "bbox": {"l": 535.74298, "t": 553.17456, "r": 537.67615, "b": 561.54918, "coord_origin": "TOPLEFT"}}, {"id": 208, "text": "Page-", "bbox": {"l": 539.802, "t": 553.21939, "r": 559.09839, "b": 561.5581500000001, "coord_origin": "TOPLEFT"}}, {"id": 209, "text": "footer", "bbox": {"l": 317.95499, "t": 564.17839, "r": 338.80725, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": ",", "bbox": {"l": 338.806, "t": 564.13356, "r": 340.81805, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "Page-header", "bbox": {"l": 343.61401, "t": 564.17839, "r": 387.96164, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 212, "text": ",", "bbox": {"l": 387.961, "t": 564.13356, "r": 389.97305, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "Picture", "bbox": {"l": 392.76901, "t": 564.17839, "r": 417.84662, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 214, "text": ",", "bbox": {"l": 417.84799, "t": 564.13356, "r": 419.86005, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 215, "text": "Section-header", "bbox": {"l": 422.655, "t": 564.17839, "r": 475.56305, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 216, "text": ",", "bbox": {"l": 475.56201, "t": 564.13356, "r": 477.57407, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 217, "text": "Table", "bbox": {"l": 480.36899, "t": 564.17839, "r": 499.82196, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 218, "text": ",", "bbox": {"l": 499.8219900000001, "t": 564.13356, "r": 501.83405, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 219, "text": "Text", "bbox": {"l": 504.6290000000001, "t": 564.17839, "r": 519.7926, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 220, "text": ", and", "bbox": {"l": 519.79602, "t": 564.13356, "r": 538.37103, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 221, "text": "Title", "bbox": {"l": 541.16302, "t": 564.17839, "r": 557.57043, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 222, "text": ".", "bbox": {"l": 557.57098, "t": 564.13356, "r": 559.58307, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 223, "text": "Critical factors that were considered for the choice of these class", "bbox": {"l": 317.95499, "t": 575.09256, "r": 558.20416, "b": 583.46718, "coord_origin": "TOPLEFT"}}, {"id": 224, "text": "labels were (1) the overall occurrence of the label, (2) the specificity", "bbox": {"l": 317.95499, "t": 586.05156, "r": 558.43091, "b": 594.4261799999999, "coord_origin": "TOPLEFT"}}, {"id": 225, "text": "of the label, (3) recognisability on a single page (i.e. no need for", "bbox": {"l": 317.95499, "t": 597.0105599999999, "r": 558.36871, "b": 605.38518, "coord_origin": "TOPLEFT"}}, {"id": 226, "text": "context from previous or next page) and (4) overall coverage of the", "bbox": {"l": 317.95499, "t": 607.96956, "r": 558.20105, "b": 616.3441799999999, "coord_origin": "TOPLEFT"}}, {"id": 227, "text": "page. Specificity ensures that the choice of label is not ambiguous,", "bbox": {"l": 317.95499, "t": 618.9285600000001, "r": 559.18665, "b": 627.30318, "coord_origin": "TOPLEFT"}}, {"id": 228, "text": "while coverage ensures that all meaningful items on a page can", "bbox": {"l": 317.62299, "t": 629.88756, "r": 558.20142, "b": 638.26218, "coord_origin": "TOPLEFT"}}, {"id": 229, "text": "be annotated. We refrained from class labels that are very specific", "bbox": {"l": 317.95499, "t": 640.84656, "r": 558.20227, "b": 649.22118, "coord_origin": "TOPLEFT"}}, {"id": 230, "text": "to a document category, such as", "bbox": {"l": 317.95499, "t": 651.80556, "r": 436.90649, "b": 660.1801800000001, "coord_origin": "TOPLEFT"}}, {"id": 231, "text": "Abstract", "bbox": {"l": 439.13800000000003, "t": 651.8503900000001, "r": 469.69134999999994, "b": 660.18915, "coord_origin": "TOPLEFT"}}, {"id": 232, "text": "in the", "bbox": {"l": 472.42898999999994, "t": 651.80556, "r": 493.97348, "b": 660.1801800000001, "coord_origin": "TOPLEFT"}}, {"id": 233, "text": "Scientific Articles", "bbox": {"l": 496.207, "t": 651.8503900000001, "r": 558.20001, "b": 660.18915, "coord_origin": "TOPLEFT"}}, {"id": 234, "text": "category. We also avoided class labels that are tightly linked to the", "bbox": {"l": 317.95499, "t": 662.76456, "r": 558.20557, "b": 671.13918, "coord_origin": "TOPLEFT"}}, {"id": 235, "text": "semantics of the text. Labels such as", "bbox": {"l": 317.95499, "t": 673.7225599999999, "r": 447.65221999999994, "b": 682.09718, "coord_origin": "TOPLEFT"}}, {"id": 236, "text": "Author", "bbox": {"l": 449.85999, "t": 673.76739, "r": 474.31439, "b": 682.10614, "coord_origin": "TOPLEFT"}}, {"id": 237, "text": "and", "bbox": {"l": 477.172, "t": 673.7225599999999, "r": 490.39655, "b": 682.09718, "coord_origin": "TOPLEFT"}}, {"id": 238, "text": "Affiliation", "bbox": {"l": 492.60599, "t": 673.76739, "r": 528.29907, "b": 682.10614, "coord_origin": "TOPLEFT"}}, {"id": 239, "text": ", as seen", "bbox": {"l": 528.29901, "t": 673.7225599999999, "r": 558.20148, "b": 682.09718, "coord_origin": "TOPLEFT"}}, {"id": 240, "text": "in DocBank, are often only distinguishable by discriminating on", "bbox": {"l": 317.95499, "t": 684.68156, "r": 558.2041, "b": 693.0561749999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "footnote", "bbox": {"l": 317.95499, "t": 702.353363, "r": 369.2457, "b": 708.86689, "coord_origin": "TOPLEFT"}, "confidence": 0.9080349802970886, "cells": [{"id": 241, "text": "$^{3}$https://arxiv.org/", "bbox": {"l": 317.95499, "t": 702.353363, "r": 369.2457, "b": 708.86689, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "picture", "bbox": {"l": 53.05912780761719, "t": 310.7912902832031, "r": 295.8506164550781, "b": 540.864013671875, "coord_origin": "TOPLEFT"}, "confidence": 0.9847870469093323, "cells": [], "children": []}]}, "tablestructure": {"table_map": {"1": {"label": "table", "id": 1, "page_no": 3, "cluster": {"id": 1, "label": "table", "bbox": {"l": 98.93103790283203, "t": 137.4754638671875, "r": 512.579833984375, "b": 294.0815124511719, "coord_origin": "TOPLEFT"}, "confidence": 0.9860089421272278, "cells": [{"id": 5, "text": "% of Total", "bbox": {"l": 233.94400000000002, "t": 140.22351000000003, "r": 270.04272, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "triple inter-annotator mAP @ 0.5-0.95 (%)", "bbox": {"l": 329.04999, "t": 140.22351000000003, "r": 483.3976400000001, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "class label", "bbox": {"l": 104.825, "t": 151.18255999999997, "r": 141.71277, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Count", "bbox": {"l": 175.94701, "t": 151.18255999999997, "r": 198.71269, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Train", "bbox": {"l": 213.795, "t": 151.18255999999997, "r": 233.69144, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Test", "bbox": {"l": 249.37367, "t": 151.18255999999997, "r": 264.5, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Val", "bbox": {"l": 283.53568, "t": 151.18255999999997, "r": 295.30856, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "All", "bbox": {"l": 314.01501, "t": 151.18255999999997, "r": 324.98093, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Fin", "bbox": {"l": 343.01236, "t": 151.18255999999997, "r": 354.65076, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Man", "bbox": {"l": 367.84033, "t": 151.18255999999997, "r": 384.32059, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Sci", "bbox": {"l": 407.54358, "t": 151.18255999999997, "r": 418.15979, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Law", "bbox": {"l": 432.29979999999995, "t": 151.18255999999997, "r": 447.82962, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "Pat", "bbox": {"l": 465.72656, "t": 151.18255999999997, "r": 477.50842, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Ten", "bbox": {"l": 493.52240000000006, "t": 151.18255999999997, "r": 507.17822, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Caption", "bbox": {"l": 104.825, "t": 162.53954999999996, "r": 134.01064, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "22524", "bbox": {"l": 177.866, "t": 162.53954999999996, "r": 198.71288, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "2.04", "bbox": {"l": 219.211, "t": 162.53954999999996, "r": 233.69174000000004, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "1.77", "bbox": {"l": 250.01956, "t": 162.53954999999996, "r": 264.50031, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "2.32", "bbox": {"l": 280.82812, "t": 162.53954999999996, "r": 295.30887, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "84-89", "bbox": {"l": 305.27301, "t": 162.53954999999996, "r": 324.98117, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "40-61", "bbox": {"l": 334.94284, "t": 162.53954999999996, "r": 354.651, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "86-92", "bbox": {"l": 364.61267, "t": 162.53954999999996, "r": 384.32083, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "94-99", "bbox": {"l": 398.45187, "t": 162.53954999999996, "r": 418.16003, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "95-99", "bbox": {"l": 428.1217, "t": 162.53954999999996, "r": 447.82986, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "69-78", "bbox": {"l": 457.80051, "t": 162.53954999999996, "r": 477.50867, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "n/a", "bbox": {"l": 495.32489, "t": 162.53954999999996, "r": 507.17846999999995, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Footnote", "bbox": {"l": 104.825, "t": 173.49854000000005, "r": 137.3282, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "6318", "bbox": {"l": 182.035, "t": 173.49854000000005, "r": 198.71251, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "0.60", "bbox": {"l": 219.211, "t": 173.49854000000005, "r": 233.69174000000004, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "0.31", "bbox": {"l": 250.01956, "t": 173.49854000000005, "r": 264.50031, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "0.58", "bbox": {"l": 280.82812, "t": 173.49854000000005, "r": 295.30887, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "83-91", "bbox": {"l": 305.27301, "t": 173.49854000000005, "r": 324.98117, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "n/a", "bbox": {"l": 342.79739, "t": 173.49854000000005, "r": 354.65097, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "100", "bbox": {"l": 371.81265, "t": 173.49854000000005, "r": 384.32077, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "62-88", "bbox": {"l": 398.45181, "t": 173.49854000000005, "r": 418.15997, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "85-94", "bbox": {"l": 428.12164, "t": 173.49854000000005, "r": 447.8298, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "n/a", "bbox": {"l": 465.655, "t": 173.49854000000005, "r": 477.50857999999994, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "82-97", "bbox": {"l": 487.47025, "t": 173.49854000000005, "r": 507.17841, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Formula", "bbox": {"l": 104.825, "t": 184.45752000000005, "r": 135.33766, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "25027", "bbox": {"l": 177.866, "t": 184.45752000000005, "r": 198.71288, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "2.25", "bbox": {"l": 219.211, "t": 184.45752000000005, "r": 233.69174000000004, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "1.90", "bbox": {"l": 250.01956, "t": 184.45752000000005, "r": 264.50031, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "2.96", "bbox": {"l": 280.82812, "t": 184.45752000000005, "r": 295.30887, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "83-85", "bbox": {"l": 305.27301, "t": 184.45752000000005, "r": 324.98117, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "n/a", "bbox": {"l": 342.79739, "t": 184.45752000000005, "r": 354.65097, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "n/a", "bbox": {"l": 372.46719, "t": 184.45752000000005, "r": 384.32077, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "84-87", "bbox": {"l": 398.45181, "t": 184.45752000000005, "r": 418.15997, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "86-96", "bbox": {"l": 428.12164, "t": 184.45752000000005, "r": 447.8298, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "n/a", "bbox": {"l": 465.655, "t": 184.45752000000005, "r": 477.50857999999994, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "n/a", "bbox": {"l": 495.3248, "t": 184.45752000000005, "r": 507.17838000000006, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "List-item", "bbox": {"l": 104.825, "t": 195.41656, "r": 137.70479, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "185660", "bbox": {"l": 173.69701, "t": 195.41656, "r": 198.71326, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "17.19", "bbox": {"l": 215.04201, "t": 195.41656, "r": 233.69212, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "13.34", "bbox": {"l": 245.85056, "t": 195.41656, "r": 264.50067, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "15.82", "bbox": {"l": 276.65912, "t": 195.41656, "r": 295.30923, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "87-88", "bbox": {"l": 305.27301, "t": 195.41656, "r": 324.98117, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "74-83", "bbox": {"l": 334.94284, "t": 195.41656, "r": 354.651, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "90-92", "bbox": {"l": 364.61267, "t": 195.41656, "r": 384.32083, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "97-97", "bbox": {"l": 398.45187, "t": 195.41656, "r": 418.16003, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "81-85", "bbox": {"l": 428.1217, "t": 195.41656, "r": 447.82986, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "75-88", "bbox": {"l": 457.80051, "t": 195.41656, "r": 477.50867, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "93-95", "bbox": {"l": 487.47034, "t": 195.41656, "r": 507.17849999999993, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "Page-footer", "bbox": {"l": 104.825, "t": 206.37554999999998, "r": 147.35262, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "70878", "bbox": {"l": 177.866, "t": 206.37554999999998, "r": 198.71288, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "6.51", "bbox": {"l": 219.211, "t": 206.37554999999998, "r": 233.69174000000004, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "5.58", "bbox": {"l": 250.01956, "t": 206.37554999999998, "r": 264.50031, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "6.00", "bbox": {"l": 280.82812, "t": 206.37554999999998, "r": 295.30887, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "93-94", "bbox": {"l": 305.27301, "t": 206.37554999999998, "r": 324.98117, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "88-90", "bbox": {"l": 334.94284, "t": 206.37554999999998, "r": 354.651, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "95-96", "bbox": {"l": 364.61267, "t": 206.37554999999998, "r": 384.32083, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "100", "bbox": {"l": 405.65189, "t": 206.37554999999998, "r": 418.16, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "92-97", "bbox": {"l": 428.12167, "t": 206.37554999999998, "r": 447.82983, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "100", "bbox": {"l": 465.00049, "t": 206.37554999999998, "r": 477.5086099999999, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "96-98", "bbox": {"l": 487.47028, "t": 206.37554999999998, "r": 507.17843999999997, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "Page-header", "bbox": {"l": 104.825, "t": 217.33452999999997, "r": 150.10532, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "58022", "bbox": {"l": 177.866, "t": 217.33452999999997, "r": 198.71288, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "5.10", "bbox": {"l": 219.211, "t": 217.33452999999997, "r": 233.69174000000004, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "6.70", "bbox": {"l": 250.01956, "t": 217.33452999999997, "r": 264.50031, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "5.06", "bbox": {"l": 280.82812, "t": 217.33452999999997, "r": 295.30887, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "85-89", "bbox": {"l": 305.27301, "t": 217.33452999999997, "r": 324.98117, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "66-76", "bbox": {"l": 334.94284, "t": 217.33452999999997, "r": 354.651, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "90-94", "bbox": {"l": 364.61267, "t": 217.33452999999997, "r": 384.32083, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "98-100", "bbox": {"l": 394.2825, "t": 217.33452999999997, "r": 418.16003, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "91-92", "bbox": {"l": 428.1217, "t": 217.33452999999997, "r": 447.82986, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "97-99", "bbox": {"l": 457.80051, "t": 217.33452999999997, "r": 477.50867, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "81-86", "bbox": {"l": 487.47034, "t": 217.33452999999997, "r": 507.17849999999993, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "Picture", "bbox": {"l": 104.825, "t": 228.29351999999994, "r": 130.80963, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "45976", "bbox": {"l": 177.866, "t": 228.29351999999994, "r": 198.71288, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "4.21", "bbox": {"l": 219.211, "t": 228.29351999999994, "r": 233.69174000000004, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "2.78", "bbox": {"l": 250.01956, "t": 228.29351999999994, "r": 264.50031, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "5.31", "bbox": {"l": 280.82812, "t": 228.29351999999994, "r": 295.30887, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "69-71", "bbox": {"l": 305.27301, "t": 228.29351999999994, "r": 324.98117, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "56-59", "bbox": {"l": 334.94284, "t": 228.29351999999994, "r": 354.651, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "82-86", "bbox": {"l": 364.61267, "t": 228.29351999999994, "r": 384.32083, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "69-82", "bbox": {"l": 398.45187, "t": 228.29351999999994, "r": 418.16003, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "80-95", "bbox": {"l": 428.1217, "t": 228.29351999999994, "r": 447.82986, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "66-71", "bbox": {"l": 457.80051, "t": 228.29351999999994, "r": 477.50867, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "59-76", "bbox": {"l": 487.47034, "t": 228.29351999999994, "r": 507.17849999999993, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "Section-header", "bbox": {"l": 104.825, "t": 239.25256000000002, "r": 159.56487, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "142884", "bbox": {"l": 173.69701, "t": 239.25256000000002, "r": 198.71326, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "12.60", "bbox": {"l": 215.04201, "t": 239.25256000000002, "r": 233.69212, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "15.77", "bbox": {"l": 245.85056, "t": 239.25256000000002, "r": 264.50067, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "12.85", "bbox": {"l": 276.65912, "t": 239.25256000000002, "r": 295.30923, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "83-84", "bbox": {"l": 305.27301, "t": 239.25256000000002, "r": 324.98117, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "76-81", "bbox": {"l": 334.94284, "t": 239.25256000000002, "r": 354.651, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "90-92", "bbox": {"l": 364.61267, "t": 239.25256000000002, "r": 384.32083, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "94-95", "bbox": {"l": 398.45187, "t": 239.25256000000002, "r": 418.16003, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "87-94", "bbox": {"l": 428.1217, "t": 239.25256000000002, "r": 447.82986, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "69-73", "bbox": {"l": 457.80051, "t": 239.25256000000002, "r": 477.50867, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "78-86", "bbox": {"l": 487.47034, "t": 239.25256000000002, "r": 507.17849999999993, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "Table", "bbox": {"l": 104.825, "t": 250.21155, "r": 124.63177, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "34733", "bbox": {"l": 177.866, "t": 250.21155, "r": 198.71288, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "3.20", "bbox": {"l": 219.211, "t": 250.21155, "r": 233.69174000000004, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "2.27", "bbox": {"l": 250.01956, "t": 250.21155, "r": 264.50031, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "3.60", "bbox": {"l": 280.82812, "t": 250.21155, "r": 295.30887, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "77-81", "bbox": {"l": 305.27301, "t": 250.21155, "r": 324.98117, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "75-80", "bbox": {"l": 334.94284, "t": 250.21155, "r": 354.651, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "83-86", "bbox": {"l": 364.61267, "t": 250.21155, "r": 384.32083, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "98-99", "bbox": {"l": 398.45187, "t": 250.21155, "r": 418.16003, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "58-80", "bbox": {"l": 428.1217, "t": 250.21155, "r": 447.82986, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "79-84", "bbox": {"l": 457.80051, "t": 250.21155, "r": 477.50867, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "70-85", "bbox": {"l": 487.47034, "t": 250.21155, "r": 507.17849999999993, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "Text", "bbox": {"l": 104.825, "t": 261.16956000000005, "r": 120.78519, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "510377", "bbox": {"l": 173.69701, "t": 261.16956000000005, "r": 198.71326, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "45.82", "bbox": {"l": 215.04201, "t": 261.16956000000005, "r": 233.69212, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "49.28", "bbox": {"l": 245.85056, "t": 261.16956000000005, "r": 264.50067, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "45.00", "bbox": {"l": 276.65912, "t": 261.16956000000005, "r": 295.30923, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "84-86", "bbox": {"l": 305.27301, "t": 261.16956000000005, "r": 324.98117, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "81-86", "bbox": {"l": 334.94284, "t": 261.16956000000005, "r": 354.651, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "88-93", "bbox": {"l": 364.61267, "t": 261.16956000000005, "r": 384.32083, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "89-93", "bbox": {"l": 398.45187, "t": 261.16956000000005, "r": 418.16003, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "87-92", "bbox": {"l": 428.1217, "t": 261.16956000000005, "r": 447.82986, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "71-79", "bbox": {"l": 457.80051, "t": 261.16956000000005, "r": 477.50867, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "87-95", "bbox": {"l": 487.47034, "t": 261.16956000000005, "r": 507.17849999999993, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "Title", "bbox": {"l": 104.825, "t": 272.12854000000004, "r": 121.81633, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "5071", "bbox": {"l": 182.035, "t": 272.12854000000004, "r": 198.71251, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "0.47", "bbox": {"l": 219.211, "t": 272.12854000000004, "r": 233.69174000000004, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "0.30", "bbox": {"l": 250.01956, "t": 272.12854000000004, "r": 264.50031, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "0.50", "bbox": {"l": 280.82812, "t": 272.12854000000004, "r": 295.30887, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "60-72", "bbox": {"l": 305.27301, "t": 272.12854000000004, "r": 324.98117, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "24-63", "bbox": {"l": 334.94284, "t": 272.12854000000004, "r": 354.651, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "50-63", "bbox": {"l": 364.61267, "t": 272.12854000000004, "r": 384.32083, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "94-100", "bbox": {"l": 394.2825, "t": 272.12854000000004, "r": 418.16003, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "82-96", "bbox": {"l": 428.1217, "t": 272.12854000000004, "r": 447.82986, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "68-79", "bbox": {"l": 457.80051, "t": 272.12854000000004, "r": 477.50867, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "24-56", "bbox": {"l": 487.47034, "t": 272.12854000000004, "r": 507.17849999999993, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "Total", "bbox": {"l": 104.825, "t": 283.48654, "r": 123.43028, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "1107470", "bbox": {"l": 169.52699, "t": 283.48654, "r": 198.71263, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "941123", "bbox": {"l": 208.675, "t": 283.48654, "r": 233.69124999999997, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "99816", "bbox": {"l": 243.65291999999997, "t": 283.48654, "r": 264.49982, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "66531", "bbox": {"l": 274.46149, "t": 283.48654, "r": 295.30838, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "82-83", "bbox": {"l": 305.27301, "t": 283.48654, "r": 324.98117, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "71-74", "bbox": {"l": 334.94284, "t": 283.48654, "r": 354.651, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "79-81", "bbox": {"l": 364.61267, "t": 283.48654, "r": 384.32083, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "89-94", "bbox": {"l": 398.45187, "t": 283.48654, "r": 418.16003, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "86-91", "bbox": {"l": 428.1217, "t": 283.48654, "r": 447.82986, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "71-76", "bbox": {"l": 457.80051, "t": 283.48654, "r": 477.50867, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "68-85", "bbox": {"l": 487.47034, "t": 283.48654, "r": 507.17849999999993, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": [{"id": 11, "label": "text", "bbox": {"l": 233.94400000000002, "t": 140.22351000000003, "r": 270.04272, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 5, "text": "% of Total", "bbox": {"l": 233.94400000000002, "t": 140.22351000000003, "r": 270.04272, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 329.04999, "t": 140.22351000000003, "r": 483.3976400000001, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": "triple inter-annotator mAP @ 0.5-0.95 (%)", "bbox": {"l": 329.04999, "t": 140.22351000000003, "r": 483.3976400000001, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 104.825, "t": 151.18255999999997, "r": 141.71277, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "class label", "bbox": {"l": 104.825, "t": 151.18255999999997, "r": 141.71277, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 175.94701, "t": 151.18255999999997, "r": 198.71269, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "Count", "bbox": {"l": 175.94701, "t": 151.18255999999997, "r": 198.71269, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 213.795, "t": 151.18255999999997, "r": 233.69144, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "Train", "bbox": {"l": 213.795, "t": 151.18255999999997, "r": 233.69144, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 249.37367, "t": 151.18255999999997, "r": 264.5, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "Test", "bbox": {"l": 249.37367, "t": 151.18255999999997, "r": 264.5, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 283.53568, "t": 151.18255999999997, "r": 295.30856, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "Val", "bbox": {"l": 283.53568, "t": 151.18255999999997, "r": 295.30856, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 314.01501, "t": 151.18255999999997, "r": 324.98093, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "All", "bbox": {"l": 314.01501, "t": 151.18255999999997, "r": 324.98093, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 343.01236, "t": 151.18255999999997, "r": 354.65076, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "Fin", "bbox": {"l": 343.01236, "t": 151.18255999999997, "r": 354.65076, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 367.84033, "t": 151.18255999999997, "r": 384.32059, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "Man", "bbox": {"l": 367.84033, "t": 151.18255999999997, "r": 384.32059, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 407.54358, "t": 151.18255999999997, "r": 418.15979, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "Sci", "bbox": {"l": 407.54358, "t": 151.18255999999997, "r": 418.15979, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 432.29979999999995, "t": 151.18255999999997, "r": 447.82962, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "Law", "bbox": {"l": 432.29979999999995, "t": 151.18255999999997, "r": 447.82962, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 465.72656, "t": 151.18255999999997, "r": 477.50842, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "Pat", "bbox": {"l": 465.72656, "t": 151.18255999999997, "r": 477.50842, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 493.52240000000006, "t": 151.18255999999997, "r": 507.17822, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "Ten", "bbox": {"l": 493.52240000000006, "t": 151.18255999999997, "r": 507.17822, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 104.825, "t": 162.53954999999996, "r": 134.01064, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "Caption", "bbox": {"l": 104.825, "t": 162.53954999999996, "r": 134.01064, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 177.866, "t": 162.53954999999996, "r": 198.71288, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "22524", "bbox": {"l": 177.866, "t": 162.53954999999996, "r": 198.71288, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 219.211, "t": 162.53954999999996, "r": 233.69174000000004, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "2.04", "bbox": {"l": 219.211, "t": 162.53954999999996, "r": 233.69174000000004, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 250.01956, "t": 162.53954999999996, "r": 264.50031, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "1.77", "bbox": {"l": 250.01956, "t": 162.53954999999996, "r": 264.50031, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 280.82812, "t": 162.53954999999996, "r": 295.30887, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "2.32", "bbox": {"l": 280.82812, "t": 162.53954999999996, "r": 295.30887, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 305.27301, "t": 162.53954999999996, "r": 324.98117, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "84-89", "bbox": {"l": 305.27301, "t": 162.53954999999996, "r": 324.98117, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 334.94284, "t": 162.53954999999996, "r": 354.651, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "40-61", "bbox": {"l": 334.94284, "t": 162.53954999999996, "r": 354.651, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 364.61267, "t": 162.53954999999996, "r": 384.32083, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "86-92", "bbox": {"l": 364.61267, "t": 162.53954999999996, "r": 384.32083, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 398.45187, "t": 162.53954999999996, "r": 418.16003, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "94-99", "bbox": {"l": 398.45187, "t": 162.53954999999996, "r": 418.16003, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 428.1217, "t": 162.53954999999996, "r": 447.82986, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "95-99", "bbox": {"l": 428.1217, "t": 162.53954999999996, "r": 447.82986, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 457.80051, "t": 162.53954999999996, "r": 477.50867, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "69-78", "bbox": {"l": 457.80051, "t": 162.53954999999996, "r": 477.50867, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 495.32489, "t": 162.53954999999996, "r": 507.17846999999995, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "n/a", "bbox": {"l": 495.32489, "t": 162.53954999999996, "r": 507.17846999999995, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 104.825, "t": 173.49854000000005, "r": 137.3282, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "Footnote", "bbox": {"l": 104.825, "t": 173.49854000000005, "r": 137.3282, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 182.035, "t": 173.49854000000005, "r": 198.71251, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "6318", "bbox": {"l": 182.035, "t": 173.49854000000005, "r": 198.71251, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 219.211, "t": 173.49854000000005, "r": 233.69174000000004, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "0.60", "bbox": {"l": 219.211, "t": 173.49854000000005, "r": 233.69174000000004, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 250.01956, "t": 173.49854000000005, "r": 264.50031, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "0.31", "bbox": {"l": 250.01956, "t": 173.49854000000005, "r": 264.50031, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 280.82812, "t": 173.49854000000005, "r": 295.30887, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "0.58", "bbox": {"l": 280.82812, "t": 173.49854000000005, "r": 295.30887, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 305.27301, "t": 173.49854000000005, "r": 324.98117, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "83-91", "bbox": {"l": 305.27301, "t": 173.49854000000005, "r": 324.98117, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 342.79739, "t": 173.49854000000005, "r": 354.65097, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "n/a", "bbox": {"l": 342.79739, "t": 173.49854000000005, "r": 354.65097, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 371.81265, "t": 173.49854000000005, "r": 384.32077, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "100", "bbox": {"l": 371.81265, "t": 173.49854000000005, "r": 384.32077, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 398.45181, "t": 173.49854000000005, "r": 418.15997, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "62-88", "bbox": {"l": 398.45181, "t": 173.49854000000005, "r": 418.15997, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 428.12164, "t": 173.49854000000005, "r": 447.8298, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "85-94", "bbox": {"l": 428.12164, "t": 173.49854000000005, "r": 447.8298, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 465.655, "t": 173.49854000000005, "r": 477.50857999999994, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "n/a", "bbox": {"l": 465.655, "t": 173.49854000000005, "r": 477.50857999999994, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 487.47025, "t": 173.49854000000005, "r": 507.17841, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "82-97", "bbox": {"l": 487.47025, "t": 173.49854000000005, "r": 507.17841, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 104.825, "t": 184.45752000000005, "r": 135.33766, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "Formula", "bbox": {"l": 104.825, "t": 184.45752000000005, "r": 135.33766, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 177.866, "t": 184.45752000000005, "r": 198.71288, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "25027", "bbox": {"l": 177.866, "t": 184.45752000000005, "r": 198.71288, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 219.211, "t": 184.45752000000005, "r": 233.69174000000004, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "2.25", "bbox": {"l": 219.211, "t": 184.45752000000005, "r": 233.69174000000004, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 250.01956, "t": 184.45752000000005, "r": 264.50031, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "1.90", "bbox": {"l": 250.01956, "t": 184.45752000000005, "r": 264.50031, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 280.82812, "t": 184.45752000000005, "r": 295.30887, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "2.96", "bbox": {"l": 280.82812, "t": 184.45752000000005, "r": 295.30887, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 305.27301, "t": 184.45752000000005, "r": 324.98117, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "83-85", "bbox": {"l": 305.27301, "t": 184.45752000000005, "r": 324.98117, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 342.79739, "t": 184.45752000000005, "r": 354.65097, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "n/a", "bbox": {"l": 342.79739, "t": 184.45752000000005, "r": 354.65097, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 372.46719, "t": 184.45752000000005, "r": 384.32077, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "n/a", "bbox": {"l": 372.46719, "t": 184.45752000000005, "r": 384.32077, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 398.45181, "t": 184.45752000000005, "r": 418.15997, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "84-87", "bbox": {"l": 398.45181, "t": 184.45752000000005, "r": 418.15997, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 428.12164, "t": 184.45752000000005, "r": 447.8298, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "86-96", "bbox": {"l": 428.12164, "t": 184.45752000000005, "r": 447.8298, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 465.655, "t": 184.45752000000005, "r": 477.50857999999994, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "n/a", "bbox": {"l": 465.655, "t": 184.45752000000005, "r": 477.50857999999994, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 495.3248, "t": 184.45752000000005, "r": 507.17838000000006, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "n/a", "bbox": {"l": 495.3248, "t": 184.45752000000005, "r": 507.17838000000006, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 104.825, "t": 195.41656, "r": 137.70479, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "List-item", "bbox": {"l": 104.825, "t": 195.41656, "r": 137.70479, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 173.69701, "t": 195.41656, "r": 198.71326, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "185660", "bbox": {"l": 173.69701, "t": 195.41656, "r": 198.71326, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 215.04201, "t": 195.41656, "r": 233.69212, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "17.19", "bbox": {"l": 215.04201, "t": 195.41656, "r": 233.69212, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 245.85056, "t": 195.41656, "r": 264.50067, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "13.34", "bbox": {"l": 245.85056, "t": 195.41656, "r": 264.50067, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 276.65912, "t": 195.41656, "r": 295.30923, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "15.82", "bbox": {"l": 276.65912, "t": 195.41656, "r": 295.30923, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 305.27301, "t": 195.41656, "r": 324.98117, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "87-88", "bbox": {"l": 305.27301, "t": 195.41656, "r": 324.98117, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 334.94284, "t": 195.41656, "r": 354.651, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "74-83", "bbox": {"l": 334.94284, "t": 195.41656, "r": 354.651, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 364.61267, "t": 195.41656, "r": 384.32083, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "90-92", "bbox": {"l": 364.61267, "t": 195.41656, "r": 384.32083, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 398.45187, "t": 195.41656, "r": 418.16003, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "97-97", "bbox": {"l": 398.45187, "t": 195.41656, "r": 418.16003, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 428.1217, "t": 195.41656, "r": 447.82986, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "81-85", "bbox": {"l": 428.1217, "t": 195.41656, "r": 447.82986, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 457.80051, "t": 195.41656, "r": 477.50867, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "75-88", "bbox": {"l": 457.80051, "t": 195.41656, "r": 477.50867, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 487.47034, "t": 195.41656, "r": 507.17849999999993, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "93-95", "bbox": {"l": 487.47034, "t": 195.41656, "r": 507.17849999999993, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 104.825, "t": 206.37554999999998, "r": 147.35262, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "Page-footer", "bbox": {"l": 104.825, "t": 206.37554999999998, "r": 147.35262, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 177.866, "t": 206.37554999999998, "r": 198.71288, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "70878", "bbox": {"l": 177.866, "t": 206.37554999999998, "r": 198.71288, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 219.211, "t": 206.37554999999998, "r": 233.69174000000004, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "6.51", "bbox": {"l": 219.211, "t": 206.37554999999998, "r": 233.69174000000004, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 250.01956, "t": 206.37554999999998, "r": 264.50031, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "5.58", "bbox": {"l": 250.01956, "t": 206.37554999999998, "r": 264.50031, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 280.82812, "t": 206.37554999999998, "r": 295.30887, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "6.00", "bbox": {"l": 280.82812, "t": 206.37554999999998, "r": 295.30887, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 305.27301, "t": 206.37554999999998, "r": 324.98117, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "93-94", "bbox": {"l": 305.27301, "t": 206.37554999999998, "r": 324.98117, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 334.94284, "t": 206.37554999999998, "r": 354.651, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "88-90", "bbox": {"l": 334.94284, "t": 206.37554999999998, "r": 354.651, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 364.61267, "t": 206.37554999999998, "r": 384.32083, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "95-96", "bbox": {"l": 364.61267, "t": 206.37554999999998, "r": 384.32083, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 405.65189, "t": 206.37554999999998, "r": 418.16, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "100", "bbox": {"l": 405.65189, "t": 206.37554999999998, "r": 418.16, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 428.12167, "t": 206.37554999999998, "r": 447.82983, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "92-97", "bbox": {"l": 428.12167, "t": 206.37554999999998, "r": 447.82983, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 465.00049, "t": 206.37554999999998, "r": 477.5086099999999, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "100", "bbox": {"l": 465.00049, "t": 206.37554999999998, "r": 477.5086099999999, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 487.47028, "t": 206.37554999999998, "r": 507.17843999999997, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "96-98", "bbox": {"l": 487.47028, "t": 206.37554999999998, "r": 507.17843999999997, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 104.825, "t": 217.33452999999997, "r": 150.10532, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "Page-header", "bbox": {"l": 104.825, "t": 217.33452999999997, "r": 150.10532, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 177.866, "t": 217.33452999999997, "r": 198.71288, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "58022", "bbox": {"l": 177.866, "t": 217.33452999999997, "r": 198.71288, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 219.211, "t": 217.33452999999997, "r": 233.69174000000004, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "5.10", "bbox": {"l": 219.211, "t": 217.33452999999997, "r": 233.69174000000004, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 250.01956, "t": 217.33452999999997, "r": 264.50031, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "6.70", "bbox": {"l": 250.01956, "t": 217.33452999999997, "r": 264.50031, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 280.82812, "t": 217.33452999999997, "r": 295.30887, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "5.06", "bbox": {"l": 280.82812, "t": 217.33452999999997, "r": 295.30887, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 305.27301, "t": 217.33452999999997, "r": 324.98117, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "85-89", "bbox": {"l": 305.27301, "t": 217.33452999999997, "r": 324.98117, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 334.94284, "t": 217.33452999999997, "r": 354.651, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "66-76", "bbox": {"l": 334.94284, "t": 217.33452999999997, "r": 354.651, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 364.61267, "t": 217.33452999999997, "r": 384.32083, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "90-94", "bbox": {"l": 364.61267, "t": 217.33452999999997, "r": 384.32083, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 394.2825, "t": 217.33452999999997, "r": 418.16003, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "98-100", "bbox": {"l": 394.2825, "t": 217.33452999999997, "r": 418.16003, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 428.1217, "t": 217.33452999999997, "r": 447.82986, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "91-92", "bbox": {"l": 428.1217, "t": 217.33452999999997, "r": 447.82986, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 457.80051, "t": 217.33452999999997, "r": 477.50867, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "97-99", "bbox": {"l": 457.80051, "t": 217.33452999999997, "r": 477.50867, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 487.47034, "t": 217.33452999999997, "r": 507.17849999999993, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "81-86", "bbox": {"l": 487.47034, "t": 217.33452999999997, "r": 507.17849999999993, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 104.825, "t": 228.29351999999994, "r": 130.80963, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "Picture", "bbox": {"l": 104.825, "t": 228.29351999999994, "r": 130.80963, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 177.866, "t": 228.29351999999994, "r": 198.71288, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "45976", "bbox": {"l": 177.866, "t": 228.29351999999994, "r": 198.71288, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 219.211, "t": 228.29351999999994, "r": 233.69174000000004, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "4.21", "bbox": {"l": 219.211, "t": 228.29351999999994, "r": 233.69174000000004, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 250.01956, "t": 228.29351999999994, "r": 264.50031, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "2.78", "bbox": {"l": 250.01956, "t": 228.29351999999994, "r": 264.50031, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 280.82812, "t": 228.29351999999994, "r": 295.30887, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "5.31", "bbox": {"l": 280.82812, "t": 228.29351999999994, "r": 295.30887, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 305.27301, "t": 228.29351999999994, "r": 324.98117, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "69-71", "bbox": {"l": 305.27301, "t": 228.29351999999994, "r": 324.98117, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 334.94284, "t": 228.29351999999994, "r": 354.651, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "56-59", "bbox": {"l": 334.94284, "t": 228.29351999999994, "r": 354.651, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 364.61267, "t": 228.29351999999994, "r": 384.32083, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "82-86", "bbox": {"l": 364.61267, "t": 228.29351999999994, "r": 384.32083, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 398.45187, "t": 228.29351999999994, "r": 418.16003, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "69-82", "bbox": {"l": 398.45187, "t": 228.29351999999994, "r": 418.16003, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 428.1217, "t": 228.29351999999994, "r": 447.82986, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "80-95", "bbox": {"l": 428.1217, "t": 228.29351999999994, "r": 447.82986, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 457.80051, "t": 228.29351999999994, "r": 477.50867, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "66-71", "bbox": {"l": 457.80051, "t": 228.29351999999994, "r": 477.50867, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 487.47034, "t": 228.29351999999994, "r": 507.17849999999993, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "59-76", "bbox": {"l": 487.47034, "t": 228.29351999999994, "r": 507.17849999999993, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 104.825, "t": 239.25256000000002, "r": 159.56487, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": "Section-header", "bbox": {"l": 104.825, "t": 239.25256000000002, "r": 159.56487, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 173.69701, "t": 239.25256000000002, "r": 198.71326, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "142884", "bbox": {"l": 173.69701, "t": 239.25256000000002, "r": 198.71326, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 215.04201, "t": 239.25256000000002, "r": 233.69212, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "12.60", "bbox": {"l": 215.04201, "t": 239.25256000000002, "r": 233.69212, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 245.85056, "t": 239.25256000000002, "r": 264.50067, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": "15.77", "bbox": {"l": 245.85056, "t": 239.25256000000002, "r": 264.50067, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 276.65912, "t": 239.25256000000002, "r": 295.30923, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 107, "text": "12.85", "bbox": {"l": 276.65912, "t": 239.25256000000002, "r": 295.30923, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 114, "label": "text", "bbox": {"l": 305.27301, "t": 239.25256000000002, "r": 324.98117, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 108, "text": "83-84", "bbox": {"l": 305.27301, "t": 239.25256000000002, "r": 324.98117, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 115, "label": "text", "bbox": {"l": 334.94284, "t": 239.25256000000002, "r": 354.651, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 109, "text": "76-81", "bbox": {"l": 334.94284, "t": 239.25256000000002, "r": 354.651, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 116, "label": "text", "bbox": {"l": 364.61267, "t": 239.25256000000002, "r": 384.32083, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 110, "text": "90-92", "bbox": {"l": 364.61267, "t": 239.25256000000002, "r": 384.32083, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 117, "label": "text", "bbox": {"l": 398.45187, "t": 239.25256000000002, "r": 418.16003, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 111, "text": "94-95", "bbox": {"l": 398.45187, "t": 239.25256000000002, "r": 418.16003, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 118, "label": "text", "bbox": {"l": 428.1217, "t": 239.25256000000002, "r": 447.82986, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 112, "text": "87-94", "bbox": {"l": 428.1217, "t": 239.25256000000002, "r": 447.82986, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 119, "label": "text", "bbox": {"l": 457.80051, "t": 239.25256000000002, "r": 477.50867, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 113, "text": "69-73", "bbox": {"l": 457.80051, "t": 239.25256000000002, "r": 477.50867, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 120, "label": "text", "bbox": {"l": 487.47034, "t": 239.25256000000002, "r": 507.17849999999993, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 114, "text": "78-86", "bbox": {"l": 487.47034, "t": 239.25256000000002, "r": 507.17849999999993, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 121, "label": "text", "bbox": {"l": 104.825, "t": 250.21155, "r": 124.63177, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 115, "text": "Table", "bbox": {"l": 104.825, "t": 250.21155, "r": 124.63177, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 122, "label": "text", "bbox": {"l": 177.866, "t": 250.21155, "r": 198.71288, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 116, "text": "34733", "bbox": {"l": 177.866, "t": 250.21155, "r": 198.71288, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 123, "label": "text", "bbox": {"l": 219.211, "t": 250.21155, "r": 233.69174000000004, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 117, "text": "3.20", "bbox": {"l": 219.211, "t": 250.21155, "r": 233.69174000000004, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 124, "label": "text", "bbox": {"l": 250.01956, "t": 250.21155, "r": 264.50031, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 118, "text": "2.27", "bbox": {"l": 250.01956, "t": 250.21155, "r": 264.50031, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 125, "label": "text", "bbox": {"l": 280.82812, "t": 250.21155, "r": 295.30887, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 119, "text": "3.60", "bbox": {"l": 280.82812, "t": 250.21155, "r": 295.30887, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 126, "label": "text", "bbox": {"l": 305.27301, "t": 250.21155, "r": 324.98117, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 120, "text": "77-81", "bbox": {"l": 305.27301, "t": 250.21155, "r": 324.98117, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 127, "label": "text", "bbox": {"l": 334.94284, "t": 250.21155, "r": 354.651, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 121, "text": "75-80", "bbox": {"l": 334.94284, "t": 250.21155, "r": 354.651, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 128, "label": "text", "bbox": {"l": 364.61267, "t": 250.21155, "r": 384.32083, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 122, "text": "83-86", "bbox": {"l": 364.61267, "t": 250.21155, "r": 384.32083, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 129, "label": "text", "bbox": {"l": 398.45187, "t": 250.21155, "r": 418.16003, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 123, "text": "98-99", "bbox": {"l": 398.45187, "t": 250.21155, "r": 418.16003, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 130, "label": "text", "bbox": {"l": 428.1217, "t": 250.21155, "r": 447.82986, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 124, "text": "58-80", "bbox": {"l": 428.1217, "t": 250.21155, "r": 447.82986, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 131, "label": "text", "bbox": {"l": 457.80051, "t": 250.21155, "r": 477.50867, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 125, "text": "79-84", "bbox": {"l": 457.80051, "t": 250.21155, "r": 477.50867, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 132, "label": "text", "bbox": {"l": 487.47034, "t": 250.21155, "r": 507.17849999999993, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 126, "text": "70-85", "bbox": {"l": 487.47034, "t": 250.21155, "r": 507.17849999999993, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 133, "label": "text", "bbox": {"l": 104.825, "t": 261.16956000000005, "r": 120.78519, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 127, "text": "Text", "bbox": {"l": 104.825, "t": 261.16956000000005, "r": 120.78519, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 134, "label": "text", "bbox": {"l": 173.69701, "t": 261.16956000000005, "r": 198.71326, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 128, "text": "510377", "bbox": {"l": 173.69701, "t": 261.16956000000005, "r": 198.71326, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 135, "label": "text", "bbox": {"l": 215.04201, "t": 261.16956000000005, "r": 233.69212, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 129, "text": "45.82", "bbox": {"l": 215.04201, "t": 261.16956000000005, "r": 233.69212, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 136, "label": "text", "bbox": {"l": 245.85056, "t": 261.16956000000005, "r": 264.50067, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 130, "text": "49.28", "bbox": {"l": 245.85056, "t": 261.16956000000005, "r": 264.50067, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 137, "label": "text", "bbox": {"l": 276.65912, "t": 261.16956000000005, "r": 295.30923, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 131, "text": "45.00", "bbox": {"l": 276.65912, "t": 261.16956000000005, "r": 295.30923, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 138, "label": "text", "bbox": {"l": 305.27301, "t": 261.16956000000005, "r": 324.98117, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 132, "text": "84-86", "bbox": {"l": 305.27301, "t": 261.16956000000005, "r": 324.98117, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 139, "label": "text", "bbox": {"l": 334.94284, "t": 261.16956000000005, "r": 354.651, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 133, "text": "81-86", "bbox": {"l": 334.94284, "t": 261.16956000000005, "r": 354.651, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 140, "label": "text", "bbox": {"l": 364.61267, "t": 261.16956000000005, "r": 384.32083, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 134, "text": "88-93", "bbox": {"l": 364.61267, "t": 261.16956000000005, "r": 384.32083, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 141, "label": "text", "bbox": {"l": 398.45187, "t": 261.16956000000005, "r": 418.16003, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 135, "text": "89-93", "bbox": {"l": 398.45187, "t": 261.16956000000005, "r": 418.16003, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 142, "label": "text", "bbox": {"l": 428.1217, "t": 261.16956000000005, "r": 447.82986, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 136, "text": "87-92", "bbox": {"l": 428.1217, "t": 261.16956000000005, "r": 447.82986, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 143, "label": "text", "bbox": {"l": 457.80051, "t": 261.16956000000005, "r": 477.50867, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 137, "text": "71-79", "bbox": {"l": 457.80051, "t": 261.16956000000005, "r": 477.50867, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 144, "label": "text", "bbox": {"l": 487.47034, "t": 261.16956000000005, "r": 507.17849999999993, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 138, "text": "87-95", "bbox": {"l": 487.47034, "t": 261.16956000000005, "r": 507.17849999999993, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 145, "label": "text", "bbox": {"l": 104.825, "t": 272.12854000000004, "r": 121.81633, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 139, "text": "Title", "bbox": {"l": 104.825, "t": 272.12854000000004, "r": 121.81633, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 146, "label": "text", "bbox": {"l": 182.035, "t": 272.12854000000004, "r": 198.71251, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 140, "text": "5071", "bbox": {"l": 182.035, "t": 272.12854000000004, "r": 198.71251, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 147, "label": "text", "bbox": {"l": 219.211, "t": 272.12854000000004, "r": 233.69174000000004, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 141, "text": "0.47", "bbox": {"l": 219.211, "t": 272.12854000000004, "r": 233.69174000000004, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 148, "label": "text", "bbox": {"l": 250.01956, "t": 272.12854000000004, "r": 264.50031, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 142, "text": "0.30", "bbox": {"l": 250.01956, "t": 272.12854000000004, "r": 264.50031, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 149, "label": "text", "bbox": {"l": 280.82812, "t": 272.12854000000004, "r": 295.30887, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 143, "text": "0.50", "bbox": {"l": 280.82812, "t": 272.12854000000004, "r": 295.30887, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 150, "label": "text", "bbox": {"l": 305.27301, "t": 272.12854000000004, "r": 324.98117, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 144, "text": "60-72", "bbox": {"l": 305.27301, "t": 272.12854000000004, "r": 324.98117, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 151, "label": "text", "bbox": {"l": 334.94284, "t": 272.12854000000004, "r": 354.651, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 145, "text": "24-63", "bbox": {"l": 334.94284, "t": 272.12854000000004, "r": 354.651, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 152, "label": "text", "bbox": {"l": 364.61267, "t": 272.12854000000004, "r": 384.32083, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 146, "text": "50-63", "bbox": {"l": 364.61267, "t": 272.12854000000004, "r": 384.32083, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 153, "label": "text", "bbox": {"l": 394.2825, "t": 272.12854000000004, "r": 418.16003, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 147, "text": "94-100", "bbox": {"l": 394.2825, "t": 272.12854000000004, "r": 418.16003, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 154, "label": "text", "bbox": {"l": 428.1217, "t": 272.12854000000004, "r": 447.82986, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 148, "text": "82-96", "bbox": {"l": 428.1217, "t": 272.12854000000004, "r": 447.82986, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 155, "label": "text", "bbox": {"l": 457.80051, "t": 272.12854000000004, "r": 477.50867, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 149, "text": "68-79", "bbox": {"l": 457.80051, "t": 272.12854000000004, "r": 477.50867, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 156, "label": "text", "bbox": {"l": 487.47034, "t": 272.12854000000004, "r": 507.17849999999993, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 150, "text": "24-56", "bbox": {"l": 487.47034, "t": 272.12854000000004, "r": 507.17849999999993, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 157, "label": "text", "bbox": {"l": 104.825, "t": 283.48654, "r": 123.43028, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 151, "text": "Total", "bbox": {"l": 104.825, "t": 283.48654, "r": 123.43028, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 158, "label": "text", "bbox": {"l": 169.52699, "t": 283.48654, "r": 198.71263, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 152, "text": "1107470", "bbox": {"l": 169.52699, "t": 283.48654, "r": 198.71263, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 159, "label": "text", "bbox": {"l": 208.675, "t": 283.48654, "r": 233.69124999999997, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 153, "text": "941123", "bbox": {"l": 208.675, "t": 283.48654, "r": 233.69124999999997, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 160, "label": "text", "bbox": {"l": 243.65291999999997, "t": 283.48654, "r": 264.49982, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 154, "text": "99816", "bbox": {"l": 243.65291999999997, "t": 283.48654, "r": 264.49982, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 161, "label": "text", "bbox": {"l": 274.46149, "t": 283.48654, "r": 295.30838, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 155, "text": "66531", "bbox": {"l": 274.46149, "t": 283.48654, "r": 295.30838, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 162, "label": "text", "bbox": {"l": 305.27301, "t": 283.48654, "r": 324.98117, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 156, "text": "82-83", "bbox": {"l": 305.27301, "t": 283.48654, "r": 324.98117, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 163, "label": "text", "bbox": {"l": 334.94284, "t": 283.48654, "r": 354.651, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 157, "text": "71-74", "bbox": {"l": 334.94284, "t": 283.48654, "r": 354.651, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 164, "label": "text", "bbox": {"l": 364.61267, "t": 283.48654, "r": 384.32083, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 158, "text": "79-81", "bbox": {"l": 364.61267, "t": 283.48654, "r": 384.32083, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 165, "label": "text", "bbox": {"l": 398.45187, "t": 283.48654, "r": 418.16003, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 159, "text": "89-94", "bbox": {"l": 398.45187, "t": 283.48654, "r": 418.16003, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 166, "label": "text", "bbox": {"l": 428.1217, "t": 283.48654, "r": 447.82986, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 160, "text": "86-91", "bbox": {"l": 428.1217, "t": 283.48654, "r": 447.82986, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 167, "label": "text", "bbox": {"l": 457.80051, "t": 283.48654, "r": 477.50867, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 161, "text": "71-76", "bbox": {"l": 457.80051, "t": 283.48654, "r": 477.50867, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 168, "label": "text", "bbox": {"l": 487.47034, "t": 283.48654, "r": 507.17849999999993, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 162, "text": "68-85", "bbox": {"l": 487.47034, "t": 283.48654, "r": 507.17849999999993, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "lcel", "lcel", "lcel", "ched", "lcel", "lcel", "lcel", "lcel", "lcel", "nl", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 14, "num_cols": 12, "table_cells": [{"bbox": {"l": 233.94400000000002, "t": 140.22351000000003, "r": 270.04272, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 4, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 6, "text": "% of Total", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 329.04999, "t": 140.22351000000003, "r": 483.3976400000001, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 6, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 6, "end_col_offset_idx": 12, "text": "triple inter-annotator mAP @ 0.5-0.95 (%)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 151.18255999999997, "r": 141.71277, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "class label", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 175.94701, "t": 151.18255999999997, "r": 198.71269, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Count", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 213.795, "t": 151.18255999999997, "r": 233.69144, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Train", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 249.37367, "t": 151.18255999999997, "r": 264.5, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Test", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 283.53568, "t": 151.18255999999997, "r": 295.30856, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Val", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 314.01501, "t": 151.18255999999997, "r": 324.98093, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "All", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 343.01236, "t": 151.18255999999997, "r": 354.65076, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "Fin", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 367.84033, "t": 151.18255999999997, "r": 384.32059, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "Man", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 407.54358, "t": 151.18255999999997, "r": 418.15979, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "Sci", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 432.29979999999995, "t": 151.18255999999997, "r": 447.82962, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "Law", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 465.72656, "t": 151.18255999999997, "r": 477.50842, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "Pat", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 493.52240000000006, "t": 151.18255999999997, "r": 507.17822, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "Ten", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 162.53954999999996, "r": 134.01064, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Caption", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 177.866, "t": 162.53954999999996, "r": 198.71288, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "22524", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 162.53954999999996, "r": 233.69174000000004, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "2.04", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 162.53954999999996, "r": 264.50031, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "1.77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 162.53954999999996, "r": 295.30887, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "2.32", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 162.53954999999996, "r": 324.98117, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "84-89", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 162.53954999999996, "r": 354.651, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "40-61", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 162.53954999999996, "r": 384.32083, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "86-92", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45187, "t": 162.53954999999996, "r": 418.16003, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "94-99", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 162.53954999999996, "r": 447.82986, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "95-99", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 162.53954999999996, "r": 477.50867, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "69-78", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 495.32489, "t": 162.53954999999996, "r": 507.17846999999995, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 173.49854000000005, "r": 137.3282, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Footnote", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 182.035, "t": 173.49854000000005, "r": 198.71251, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "6318", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 173.49854000000005, "r": 233.69174000000004, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.60", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 173.49854000000005, "r": 264.50031, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.31", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 173.49854000000005, "r": 295.30887, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.58", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 173.49854000000005, "r": 324.98117, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "83-91", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 342.79739, "t": 173.49854000000005, "r": 354.65097, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 371.81265, "t": 173.49854000000005, "r": 384.32077, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "100", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45181, "t": 173.49854000000005, "r": 418.15997, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "62-88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.12164, "t": 173.49854000000005, "r": 447.8298, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "85-94", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 465.655, "t": 173.49854000000005, "r": 477.50857999999994, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47025, "t": 173.49854000000005, "r": 507.17841, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "82-97", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 184.45752000000005, "r": 135.33766, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Formula", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 177.866, "t": 184.45752000000005, "r": 198.71288, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "25027", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 184.45752000000005, "r": 233.69174000000004, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "2.25", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 184.45752000000005, "r": 264.50031, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "1.90", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 184.45752000000005, "r": 295.30887, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "2.96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 184.45752000000005, "r": 324.98117, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "83-85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 342.79739, "t": 184.45752000000005, "r": 354.65097, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 372.46719, "t": 184.45752000000005, "r": 384.32077, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45181, "t": 184.45752000000005, "r": 418.15997, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "84-87", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.12164, "t": 184.45752000000005, "r": 447.8298, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "86-96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 465.655, "t": 184.45752000000005, "r": 477.50857999999994, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 495.3248, "t": 184.45752000000005, "r": 507.17838000000006, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 195.41656, "r": 137.70479, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "List-item", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 173.69701, "t": 195.41656, "r": 198.71326, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "185660", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 215.04201, "t": 195.41656, "r": 233.69212, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "17.19", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.85056, "t": 195.41656, "r": 264.50067, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "13.34", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 276.65912, "t": 195.41656, "r": 295.30923, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "15.82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 195.41656, "r": 324.98117, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "87-88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 195.41656, "r": 354.651, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "74-83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 195.41656, "r": 384.32083, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "90-92", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45187, "t": 195.41656, "r": 418.16003, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "97-97", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 195.41656, "r": 447.82986, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "81-85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 195.41656, "r": 477.50867, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "75-88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 195.41656, "r": 507.17849999999993, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "93-95", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 206.37554999999998, "r": 147.35262, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-footer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 177.866, "t": 206.37554999999998, "r": 198.71288, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "70878", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 206.37554999999998, "r": 233.69174000000004, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "6.51", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 206.37554999999998, "r": 264.50031, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "5.58", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 206.37554999999998, "r": 295.30887, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "6.00", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 206.37554999999998, "r": 324.98117, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "93-94", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 206.37554999999998, "r": 354.651, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "88-90", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 206.37554999999998, "r": 384.32083, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "95-96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 405.65189, "t": 206.37554999999998, "r": 418.16, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "100", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.12167, "t": 206.37554999999998, "r": 447.82983, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "92-97", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 465.00049, "t": 206.37554999999998, "r": 477.5086099999999, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "100", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47028, "t": 206.37554999999998, "r": 507.17843999999997, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "96-98", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 217.33452999999997, "r": 150.10532, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 177.866, "t": 217.33452999999997, "r": 198.71288, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "58022", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 217.33452999999997, "r": 233.69174000000004, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "5.10", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 217.33452999999997, "r": 264.50031, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "6.70", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 217.33452999999997, "r": 295.30887, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "5.06", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 217.33452999999997, "r": 324.98117, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "85-89", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 217.33452999999997, "r": 354.651, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "66-76", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 217.33452999999997, "r": 384.32083, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "90-94", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.2825, "t": 217.33452999999997, "r": 418.16003, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "98-100", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 217.33452999999997, "r": 447.82986, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "91-92", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 217.33452999999997, "r": 477.50867, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "97-99", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 217.33452999999997, "r": 507.17849999999993, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "81-86", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 228.29351999999994, "r": 130.80963, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Picture", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 177.866, "t": 228.29351999999994, "r": 198.71288, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "45976", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 228.29351999999994, "r": 233.69174000000004, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "4.21", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 228.29351999999994, "r": 264.50031, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "2.78", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 228.29351999999994, "r": 295.30887, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "5.31", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 228.29351999999994, "r": 324.98117, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "69-71", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 228.29351999999994, "r": 354.651, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "56-59", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 228.29351999999994, "r": 384.32083, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "82-86", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45187, "t": 228.29351999999994, "r": 418.16003, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "69-82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 228.29351999999994, "r": 447.82986, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "80-95", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 228.29351999999994, "r": 477.50867, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "66-71", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 228.29351999999994, "r": 507.17849999999993, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "59-76", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 239.25256000000002, "r": 159.56487, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Section-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 173.69701, "t": 239.25256000000002, "r": 198.71326, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "142884", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 215.04201, "t": 239.25256000000002, "r": 233.69212, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "12.60", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.85056, "t": 239.25256000000002, "r": 264.50067, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "15.77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 276.65912, "t": 239.25256000000002, "r": 295.30923, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "12.85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 239.25256000000002, "r": 324.98117, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "83-84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 239.25256000000002, "r": 354.651, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "76-81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 239.25256000000002, "r": 384.32083, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "90-92", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45187, "t": 239.25256000000002, "r": 418.16003, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "94-95", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 239.25256000000002, "r": 447.82986, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "87-94", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 239.25256000000002, "r": 477.50867, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "69-73", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 239.25256000000002, "r": 507.17849999999993, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "78-86", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 250.21155, "r": 124.63177, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 177.866, "t": 250.21155, "r": 198.71288, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "34733", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 250.21155, "r": 233.69174000000004, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "3.20", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 250.21155, "r": 264.50031, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "2.27", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 250.21155, "r": 295.30887, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "3.60", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 250.21155, "r": 324.98117, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "77-81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 250.21155, "r": 354.651, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "75-80", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 250.21155, "r": 384.32083, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "83-86", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45187, "t": 250.21155, "r": 418.16003, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "98-99", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 250.21155, "r": 447.82986, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "58-80", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 250.21155, "r": 477.50867, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "79-84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 250.21155, "r": 507.17849999999993, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "70-85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 261.16956000000005, "r": 120.78519, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Text", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 173.69701, "t": 261.16956000000005, "r": 198.71326, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "510377", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 215.04201, "t": 261.16956000000005, "r": 233.69212, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "45.82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.85056, "t": 261.16956000000005, "r": 264.50067, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "49.28", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 276.65912, "t": 261.16956000000005, "r": 295.30923, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "45.00", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 261.16956000000005, "r": 324.98117, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "84-86", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 261.16956000000005, "r": 354.651, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "81-86", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 261.16956000000005, "r": 384.32083, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "88-93", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45187, "t": 261.16956000000005, "r": 418.16003, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "89-93", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 261.16956000000005, "r": 447.82986, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "87-92", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 261.16956000000005, "r": 477.50867, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "71-79", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 261.16956000000005, "r": 507.17849999999993, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "87-95", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 272.12854000000004, "r": 121.81633, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Title", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 182.035, "t": 272.12854000000004, "r": 198.71251, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "5071", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 272.12854000000004, "r": 233.69174000000004, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.47", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 272.12854000000004, "r": 264.50031, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.30", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 272.12854000000004, "r": 295.30887, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.50", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 272.12854000000004, "r": 324.98117, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "60-72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 272.12854000000004, "r": 354.651, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "24-63", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 272.12854000000004, "r": 384.32083, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "50-63", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.2825, "t": 272.12854000000004, "r": 418.16003, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "94-100", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 272.12854000000004, "r": 447.82986, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "82-96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 272.12854000000004, "r": 477.50867, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "68-79", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 272.12854000000004, "r": 507.17849999999993, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "24-56", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 283.48654, "r": 123.43028, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Total", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 169.52699, "t": 283.48654, "r": 198.71263, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "1107470", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 208.675, "t": 283.48654, "r": 233.69124999999997, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "941123", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 243.65291999999997, "t": 283.48654, "r": 264.49982, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "99816", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 274.46149, "t": 283.48654, "r": 295.30838, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "66531", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 283.48654, "r": 324.98117, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "82-83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 283.48654, "r": 354.651, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "71-74", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 283.48654, "r": 384.32083, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "79-81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45187, "t": 283.48654, "r": 418.16003, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "89-94", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 283.48654, "r": 447.82986, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "86-91", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 283.48654, "r": 477.50867, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "71-76", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 283.48654, "r": 507.17849999999993, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "68-85", "column_header": false, "row_header": false, "row_section": false}]}}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_header", "id": 10, "page_no": 3, "cluster": {"id": 10, "label": "page_header", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.7625049948692322, "cells": [{"id": 0, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 246.24382, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar", "bbox": {"l": 253.13897999999998, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar"}, {"label": "caption", "id": 8, "page_no": 3, "cluster": {"id": 8, "label": "caption", "bbox": {"l": 53.501999, "t": 84.95495999999991, "r": 558.48969, "b": 115.34618999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.8906610012054443, "cells": [{"id": 2, "text": "Table 1: DocLayNet dataset overview. Along with the frequency of each class label, we present the relative occurrence (as %", "bbox": {"l": 53.501999, "t": 84.95495999999991, "r": 558.48969, "b": 93.42822000000001, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "of row \u201cTotal\u201d) in the train, test and validation sets. The inter-annotator agreement is computed as the mAP@0.5-0.95 metric", "bbox": {"l": 53.79800000000001, "t": 95.91394000000003, "r": 558.20294, "b": 104.3872100000001, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "between pairwise annotations from the triple-annotated pages, from which we obtain accuracy ranges.", "bbox": {"l": 53.79800000000001, "t": 106.87292000000002, "r": 469.84805000000006, "b": 115.34618999999998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 1: DocLayNet dataset overview. Along with the frequency of each class label, we present the relative occurrence (as % of row \u201cTotal\u201d) in the train, test and validation sets. The inter-annotator agreement is computed as the mAP@0.5-0.95 metric between pairwise annotations from the triple-annotated pages, from which we obtain accuracy ranges."}, {"label": "table", "id": 1, "page_no": 3, "cluster": {"id": 1, "label": "table", "bbox": {"l": 98.93103790283203, "t": 137.4754638671875, "r": 512.579833984375, "b": 294.0815124511719, "coord_origin": "TOPLEFT"}, "confidence": 0.9860089421272278, "cells": [{"id": 5, "text": "% of Total", "bbox": {"l": 233.94400000000002, "t": 140.22351000000003, "r": 270.04272, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "triple inter-annotator mAP @ 0.5-0.95 (%)", "bbox": {"l": 329.04999, "t": 140.22351000000003, "r": 483.3976400000001, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "class label", "bbox": {"l": 104.825, "t": 151.18255999999997, "r": 141.71277, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Count", "bbox": {"l": 175.94701, "t": 151.18255999999997, "r": 198.71269, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Train", "bbox": {"l": 213.795, "t": 151.18255999999997, "r": 233.69144, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Test", "bbox": {"l": 249.37367, "t": 151.18255999999997, "r": 264.5, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Val", "bbox": {"l": 283.53568, "t": 151.18255999999997, "r": 295.30856, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "All", "bbox": {"l": 314.01501, "t": 151.18255999999997, "r": 324.98093, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Fin", "bbox": {"l": 343.01236, "t": 151.18255999999997, "r": 354.65076, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Man", "bbox": {"l": 367.84033, "t": 151.18255999999997, "r": 384.32059, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Sci", "bbox": {"l": 407.54358, "t": 151.18255999999997, "r": 418.15979, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Law", "bbox": {"l": 432.29979999999995, "t": 151.18255999999997, "r": 447.82962, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "Pat", "bbox": {"l": 465.72656, "t": 151.18255999999997, "r": 477.50842, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Ten", "bbox": {"l": 493.52240000000006, "t": 151.18255999999997, "r": 507.17822, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Caption", "bbox": {"l": 104.825, "t": 162.53954999999996, "r": 134.01064, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "22524", "bbox": {"l": 177.866, "t": 162.53954999999996, "r": 198.71288, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "2.04", "bbox": {"l": 219.211, "t": 162.53954999999996, "r": 233.69174000000004, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "1.77", "bbox": {"l": 250.01956, "t": 162.53954999999996, "r": 264.50031, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "2.32", "bbox": {"l": 280.82812, "t": 162.53954999999996, "r": 295.30887, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "84-89", "bbox": {"l": 305.27301, "t": 162.53954999999996, "r": 324.98117, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "40-61", "bbox": {"l": 334.94284, "t": 162.53954999999996, "r": 354.651, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "86-92", "bbox": {"l": 364.61267, "t": 162.53954999999996, "r": 384.32083, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "94-99", "bbox": {"l": 398.45187, "t": 162.53954999999996, "r": 418.16003, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "95-99", "bbox": {"l": 428.1217, "t": 162.53954999999996, "r": 447.82986, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "69-78", "bbox": {"l": 457.80051, "t": 162.53954999999996, "r": 477.50867, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "n/a", "bbox": {"l": 495.32489, "t": 162.53954999999996, "r": 507.17846999999995, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Footnote", "bbox": {"l": 104.825, "t": 173.49854000000005, "r": 137.3282, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "6318", "bbox": {"l": 182.035, "t": 173.49854000000005, "r": 198.71251, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "0.60", "bbox": {"l": 219.211, "t": 173.49854000000005, "r": 233.69174000000004, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "0.31", "bbox": {"l": 250.01956, "t": 173.49854000000005, "r": 264.50031, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "0.58", "bbox": {"l": 280.82812, "t": 173.49854000000005, "r": 295.30887, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "83-91", "bbox": {"l": 305.27301, "t": 173.49854000000005, "r": 324.98117, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "n/a", "bbox": {"l": 342.79739, "t": 173.49854000000005, "r": 354.65097, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "100", "bbox": {"l": 371.81265, "t": 173.49854000000005, "r": 384.32077, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "62-88", "bbox": {"l": 398.45181, "t": 173.49854000000005, "r": 418.15997, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "85-94", "bbox": {"l": 428.12164, "t": 173.49854000000005, "r": 447.8298, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "n/a", "bbox": {"l": 465.655, "t": 173.49854000000005, "r": 477.50857999999994, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "82-97", "bbox": {"l": 487.47025, "t": 173.49854000000005, "r": 507.17841, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Formula", "bbox": {"l": 104.825, "t": 184.45752000000005, "r": 135.33766, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "25027", "bbox": {"l": 177.866, "t": 184.45752000000005, "r": 198.71288, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "2.25", "bbox": {"l": 219.211, "t": 184.45752000000005, "r": 233.69174000000004, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "1.90", "bbox": {"l": 250.01956, "t": 184.45752000000005, "r": 264.50031, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "2.96", "bbox": {"l": 280.82812, "t": 184.45752000000005, "r": 295.30887, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "83-85", "bbox": {"l": 305.27301, "t": 184.45752000000005, "r": 324.98117, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "n/a", "bbox": {"l": 342.79739, "t": 184.45752000000005, "r": 354.65097, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "n/a", "bbox": {"l": 372.46719, "t": 184.45752000000005, "r": 384.32077, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "84-87", "bbox": {"l": 398.45181, "t": 184.45752000000005, "r": 418.15997, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "86-96", "bbox": {"l": 428.12164, "t": 184.45752000000005, "r": 447.8298, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "n/a", "bbox": {"l": 465.655, "t": 184.45752000000005, "r": 477.50857999999994, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "n/a", "bbox": {"l": 495.3248, "t": 184.45752000000005, "r": 507.17838000000006, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "List-item", "bbox": {"l": 104.825, "t": 195.41656, "r": 137.70479, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "185660", "bbox": {"l": 173.69701, "t": 195.41656, "r": 198.71326, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "17.19", "bbox": {"l": 215.04201, "t": 195.41656, "r": 233.69212, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "13.34", "bbox": {"l": 245.85056, "t": 195.41656, "r": 264.50067, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "15.82", "bbox": {"l": 276.65912, "t": 195.41656, "r": 295.30923, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "87-88", "bbox": {"l": 305.27301, "t": 195.41656, "r": 324.98117, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "74-83", "bbox": {"l": 334.94284, "t": 195.41656, "r": 354.651, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "90-92", "bbox": {"l": 364.61267, "t": 195.41656, "r": 384.32083, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "97-97", "bbox": {"l": 398.45187, "t": 195.41656, "r": 418.16003, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "81-85", "bbox": {"l": 428.1217, "t": 195.41656, "r": 447.82986, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "75-88", "bbox": {"l": 457.80051, "t": 195.41656, "r": 477.50867, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "93-95", "bbox": {"l": 487.47034, "t": 195.41656, "r": 507.17849999999993, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "Page-footer", "bbox": {"l": 104.825, "t": 206.37554999999998, "r": 147.35262, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "70878", "bbox": {"l": 177.866, "t": 206.37554999999998, "r": 198.71288, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "6.51", "bbox": {"l": 219.211, "t": 206.37554999999998, "r": 233.69174000000004, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "5.58", "bbox": {"l": 250.01956, "t": 206.37554999999998, "r": 264.50031, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "6.00", "bbox": {"l": 280.82812, "t": 206.37554999999998, "r": 295.30887, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "93-94", "bbox": {"l": 305.27301, "t": 206.37554999999998, "r": 324.98117, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "88-90", "bbox": {"l": 334.94284, "t": 206.37554999999998, "r": 354.651, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "95-96", "bbox": {"l": 364.61267, "t": 206.37554999999998, "r": 384.32083, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "100", "bbox": {"l": 405.65189, "t": 206.37554999999998, "r": 418.16, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "92-97", "bbox": {"l": 428.12167, "t": 206.37554999999998, "r": 447.82983, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "100", "bbox": {"l": 465.00049, "t": 206.37554999999998, "r": 477.5086099999999, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "96-98", "bbox": {"l": 487.47028, "t": 206.37554999999998, "r": 507.17843999999997, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "Page-header", "bbox": {"l": 104.825, "t": 217.33452999999997, "r": 150.10532, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "58022", "bbox": {"l": 177.866, "t": 217.33452999999997, "r": 198.71288, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "5.10", "bbox": {"l": 219.211, "t": 217.33452999999997, "r": 233.69174000000004, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "6.70", "bbox": {"l": 250.01956, "t": 217.33452999999997, "r": 264.50031, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "5.06", "bbox": {"l": 280.82812, "t": 217.33452999999997, "r": 295.30887, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "85-89", "bbox": {"l": 305.27301, "t": 217.33452999999997, "r": 324.98117, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "66-76", "bbox": {"l": 334.94284, "t": 217.33452999999997, "r": 354.651, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "90-94", "bbox": {"l": 364.61267, "t": 217.33452999999997, "r": 384.32083, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "98-100", "bbox": {"l": 394.2825, "t": 217.33452999999997, "r": 418.16003, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "91-92", "bbox": {"l": 428.1217, "t": 217.33452999999997, "r": 447.82986, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "97-99", "bbox": {"l": 457.80051, "t": 217.33452999999997, "r": 477.50867, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "81-86", "bbox": {"l": 487.47034, "t": 217.33452999999997, "r": 507.17849999999993, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "Picture", "bbox": {"l": 104.825, "t": 228.29351999999994, "r": 130.80963, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "45976", "bbox": {"l": 177.866, "t": 228.29351999999994, "r": 198.71288, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "4.21", "bbox": {"l": 219.211, "t": 228.29351999999994, "r": 233.69174000000004, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "2.78", "bbox": {"l": 250.01956, "t": 228.29351999999994, "r": 264.50031, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "5.31", "bbox": {"l": 280.82812, "t": 228.29351999999994, "r": 295.30887, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "69-71", "bbox": {"l": 305.27301, "t": 228.29351999999994, "r": 324.98117, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "56-59", "bbox": {"l": 334.94284, "t": 228.29351999999994, "r": 354.651, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "82-86", "bbox": {"l": 364.61267, "t": 228.29351999999994, "r": 384.32083, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "69-82", "bbox": {"l": 398.45187, "t": 228.29351999999994, "r": 418.16003, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "80-95", "bbox": {"l": 428.1217, "t": 228.29351999999994, "r": 447.82986, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "66-71", "bbox": {"l": 457.80051, "t": 228.29351999999994, "r": 477.50867, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "59-76", "bbox": {"l": 487.47034, "t": 228.29351999999994, "r": 507.17849999999993, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "Section-header", "bbox": {"l": 104.825, "t": 239.25256000000002, "r": 159.56487, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "142884", "bbox": {"l": 173.69701, "t": 239.25256000000002, "r": 198.71326, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "12.60", "bbox": {"l": 215.04201, "t": 239.25256000000002, "r": 233.69212, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "15.77", "bbox": {"l": 245.85056, "t": 239.25256000000002, "r": 264.50067, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "12.85", "bbox": {"l": 276.65912, "t": 239.25256000000002, "r": 295.30923, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "83-84", "bbox": {"l": 305.27301, "t": 239.25256000000002, "r": 324.98117, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "76-81", "bbox": {"l": 334.94284, "t": 239.25256000000002, "r": 354.651, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "90-92", "bbox": {"l": 364.61267, "t": 239.25256000000002, "r": 384.32083, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "94-95", "bbox": {"l": 398.45187, "t": 239.25256000000002, "r": 418.16003, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "87-94", "bbox": {"l": 428.1217, "t": 239.25256000000002, "r": 447.82986, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "69-73", "bbox": {"l": 457.80051, "t": 239.25256000000002, "r": 477.50867, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "78-86", "bbox": {"l": 487.47034, "t": 239.25256000000002, "r": 507.17849999999993, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "Table", "bbox": {"l": 104.825, "t": 250.21155, "r": 124.63177, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "34733", "bbox": {"l": 177.866, "t": 250.21155, "r": 198.71288, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "3.20", "bbox": {"l": 219.211, "t": 250.21155, "r": 233.69174000000004, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "2.27", "bbox": {"l": 250.01956, "t": 250.21155, "r": 264.50031, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "3.60", "bbox": {"l": 280.82812, "t": 250.21155, "r": 295.30887, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "77-81", "bbox": {"l": 305.27301, "t": 250.21155, "r": 324.98117, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "75-80", "bbox": {"l": 334.94284, "t": 250.21155, "r": 354.651, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "83-86", "bbox": {"l": 364.61267, "t": 250.21155, "r": 384.32083, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "98-99", "bbox": {"l": 398.45187, "t": 250.21155, "r": 418.16003, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "58-80", "bbox": {"l": 428.1217, "t": 250.21155, "r": 447.82986, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "79-84", "bbox": {"l": 457.80051, "t": 250.21155, "r": 477.50867, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "70-85", "bbox": {"l": 487.47034, "t": 250.21155, "r": 507.17849999999993, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "Text", "bbox": {"l": 104.825, "t": 261.16956000000005, "r": 120.78519, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "510377", "bbox": {"l": 173.69701, "t": 261.16956000000005, "r": 198.71326, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "45.82", "bbox": {"l": 215.04201, "t": 261.16956000000005, "r": 233.69212, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "49.28", "bbox": {"l": 245.85056, "t": 261.16956000000005, "r": 264.50067, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "45.00", "bbox": {"l": 276.65912, "t": 261.16956000000005, "r": 295.30923, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "84-86", "bbox": {"l": 305.27301, "t": 261.16956000000005, "r": 324.98117, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "81-86", "bbox": {"l": 334.94284, "t": 261.16956000000005, "r": 354.651, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "88-93", "bbox": {"l": 364.61267, "t": 261.16956000000005, "r": 384.32083, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "89-93", "bbox": {"l": 398.45187, "t": 261.16956000000005, "r": 418.16003, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "87-92", "bbox": {"l": 428.1217, "t": 261.16956000000005, "r": 447.82986, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "71-79", "bbox": {"l": 457.80051, "t": 261.16956000000005, "r": 477.50867, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "87-95", "bbox": {"l": 487.47034, "t": 261.16956000000005, "r": 507.17849999999993, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "Title", "bbox": {"l": 104.825, "t": 272.12854000000004, "r": 121.81633, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "5071", "bbox": {"l": 182.035, "t": 272.12854000000004, "r": 198.71251, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "0.47", "bbox": {"l": 219.211, "t": 272.12854000000004, "r": 233.69174000000004, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "0.30", "bbox": {"l": 250.01956, "t": 272.12854000000004, "r": 264.50031, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "0.50", "bbox": {"l": 280.82812, "t": 272.12854000000004, "r": 295.30887, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "60-72", "bbox": {"l": 305.27301, "t": 272.12854000000004, "r": 324.98117, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "24-63", "bbox": {"l": 334.94284, "t": 272.12854000000004, "r": 354.651, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "50-63", "bbox": {"l": 364.61267, "t": 272.12854000000004, "r": 384.32083, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "94-100", "bbox": {"l": 394.2825, "t": 272.12854000000004, "r": 418.16003, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "82-96", "bbox": {"l": 428.1217, "t": 272.12854000000004, "r": 447.82986, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "68-79", "bbox": {"l": 457.80051, "t": 272.12854000000004, "r": 477.50867, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "24-56", "bbox": {"l": 487.47034, "t": 272.12854000000004, "r": 507.17849999999993, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "Total", "bbox": {"l": 104.825, "t": 283.48654, "r": 123.43028, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "1107470", "bbox": {"l": 169.52699, "t": 283.48654, "r": 198.71263, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "941123", "bbox": {"l": 208.675, "t": 283.48654, "r": 233.69124999999997, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "99816", "bbox": {"l": 243.65291999999997, "t": 283.48654, "r": 264.49982, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "66531", "bbox": {"l": 274.46149, "t": 283.48654, "r": 295.30838, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "82-83", "bbox": {"l": 305.27301, "t": 283.48654, "r": 324.98117, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "71-74", "bbox": {"l": 334.94284, "t": 283.48654, "r": 354.651, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "79-81", "bbox": {"l": 364.61267, "t": 283.48654, "r": 384.32083, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "89-94", "bbox": {"l": 398.45187, "t": 283.48654, "r": 418.16003, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "86-91", "bbox": {"l": 428.1217, "t": 283.48654, "r": 447.82986, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "71-76", "bbox": {"l": 457.80051, "t": 283.48654, "r": 477.50867, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "68-85", "bbox": {"l": 487.47034, "t": 283.48654, "r": 507.17849999999993, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": [{"id": 11, "label": "text", "bbox": {"l": 233.94400000000002, "t": 140.22351000000003, "r": 270.04272, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 5, "text": "% of Total", "bbox": {"l": 233.94400000000002, "t": 140.22351000000003, "r": 270.04272, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 329.04999, "t": 140.22351000000003, "r": 483.3976400000001, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": "triple inter-annotator mAP @ 0.5-0.95 (%)", "bbox": {"l": 329.04999, "t": 140.22351000000003, "r": 483.3976400000001, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 104.825, "t": 151.18255999999997, "r": 141.71277, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "class label", "bbox": {"l": 104.825, "t": 151.18255999999997, "r": 141.71277, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 175.94701, "t": 151.18255999999997, "r": 198.71269, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "Count", "bbox": {"l": 175.94701, "t": 151.18255999999997, "r": 198.71269, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 213.795, "t": 151.18255999999997, "r": 233.69144, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "Train", "bbox": {"l": 213.795, "t": 151.18255999999997, "r": 233.69144, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 249.37367, "t": 151.18255999999997, "r": 264.5, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "Test", "bbox": {"l": 249.37367, "t": 151.18255999999997, "r": 264.5, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 283.53568, "t": 151.18255999999997, "r": 295.30856, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "Val", "bbox": {"l": 283.53568, "t": 151.18255999999997, "r": 295.30856, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 314.01501, "t": 151.18255999999997, "r": 324.98093, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "All", "bbox": {"l": 314.01501, "t": 151.18255999999997, "r": 324.98093, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 343.01236, "t": 151.18255999999997, "r": 354.65076, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "Fin", "bbox": {"l": 343.01236, "t": 151.18255999999997, "r": 354.65076, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 367.84033, "t": 151.18255999999997, "r": 384.32059, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "Man", "bbox": {"l": 367.84033, "t": 151.18255999999997, "r": 384.32059, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 407.54358, "t": 151.18255999999997, "r": 418.15979, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "Sci", "bbox": {"l": 407.54358, "t": 151.18255999999997, "r": 418.15979, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 432.29979999999995, "t": 151.18255999999997, "r": 447.82962, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "Law", "bbox": {"l": 432.29979999999995, "t": 151.18255999999997, "r": 447.82962, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 465.72656, "t": 151.18255999999997, "r": 477.50842, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "Pat", "bbox": {"l": 465.72656, "t": 151.18255999999997, "r": 477.50842, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 493.52240000000006, "t": 151.18255999999997, "r": 507.17822, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "Ten", "bbox": {"l": 493.52240000000006, "t": 151.18255999999997, "r": 507.17822, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 104.825, "t": 162.53954999999996, "r": 134.01064, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "Caption", "bbox": {"l": 104.825, "t": 162.53954999999996, "r": 134.01064, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 177.866, "t": 162.53954999999996, "r": 198.71288, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "22524", "bbox": {"l": 177.866, "t": 162.53954999999996, "r": 198.71288, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 219.211, "t": 162.53954999999996, "r": 233.69174000000004, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "2.04", "bbox": {"l": 219.211, "t": 162.53954999999996, "r": 233.69174000000004, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 250.01956, "t": 162.53954999999996, "r": 264.50031, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "1.77", "bbox": {"l": 250.01956, "t": 162.53954999999996, "r": 264.50031, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 280.82812, "t": 162.53954999999996, "r": 295.30887, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "2.32", "bbox": {"l": 280.82812, "t": 162.53954999999996, "r": 295.30887, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 305.27301, "t": 162.53954999999996, "r": 324.98117, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "84-89", "bbox": {"l": 305.27301, "t": 162.53954999999996, "r": 324.98117, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 334.94284, "t": 162.53954999999996, "r": 354.651, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "40-61", "bbox": {"l": 334.94284, "t": 162.53954999999996, "r": 354.651, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 364.61267, "t": 162.53954999999996, "r": 384.32083, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "86-92", "bbox": {"l": 364.61267, "t": 162.53954999999996, "r": 384.32083, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 398.45187, "t": 162.53954999999996, "r": 418.16003, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "94-99", "bbox": {"l": 398.45187, "t": 162.53954999999996, "r": 418.16003, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 428.1217, "t": 162.53954999999996, "r": 447.82986, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "95-99", "bbox": {"l": 428.1217, "t": 162.53954999999996, "r": 447.82986, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 457.80051, "t": 162.53954999999996, "r": 477.50867, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "69-78", "bbox": {"l": 457.80051, "t": 162.53954999999996, "r": 477.50867, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 495.32489, "t": 162.53954999999996, "r": 507.17846999999995, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "n/a", "bbox": {"l": 495.32489, "t": 162.53954999999996, "r": 507.17846999999995, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 104.825, "t": 173.49854000000005, "r": 137.3282, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "Footnote", "bbox": {"l": 104.825, "t": 173.49854000000005, "r": 137.3282, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 182.035, "t": 173.49854000000005, "r": 198.71251, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "6318", "bbox": {"l": 182.035, "t": 173.49854000000005, "r": 198.71251, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 219.211, "t": 173.49854000000005, "r": 233.69174000000004, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "0.60", "bbox": {"l": 219.211, "t": 173.49854000000005, "r": 233.69174000000004, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 250.01956, "t": 173.49854000000005, "r": 264.50031, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "0.31", "bbox": {"l": 250.01956, "t": 173.49854000000005, "r": 264.50031, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 280.82812, "t": 173.49854000000005, "r": 295.30887, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "0.58", "bbox": {"l": 280.82812, "t": 173.49854000000005, "r": 295.30887, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 305.27301, "t": 173.49854000000005, "r": 324.98117, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "83-91", "bbox": {"l": 305.27301, "t": 173.49854000000005, "r": 324.98117, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 342.79739, "t": 173.49854000000005, "r": 354.65097, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "n/a", "bbox": {"l": 342.79739, "t": 173.49854000000005, "r": 354.65097, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 371.81265, "t": 173.49854000000005, "r": 384.32077, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "100", "bbox": {"l": 371.81265, "t": 173.49854000000005, "r": 384.32077, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 398.45181, "t": 173.49854000000005, "r": 418.15997, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "62-88", "bbox": {"l": 398.45181, "t": 173.49854000000005, "r": 418.15997, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 428.12164, "t": 173.49854000000005, "r": 447.8298, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "85-94", "bbox": {"l": 428.12164, "t": 173.49854000000005, "r": 447.8298, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 465.655, "t": 173.49854000000005, "r": 477.50857999999994, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "n/a", "bbox": {"l": 465.655, "t": 173.49854000000005, "r": 477.50857999999994, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 487.47025, "t": 173.49854000000005, "r": 507.17841, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "82-97", "bbox": {"l": 487.47025, "t": 173.49854000000005, "r": 507.17841, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 104.825, "t": 184.45752000000005, "r": 135.33766, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "Formula", "bbox": {"l": 104.825, "t": 184.45752000000005, "r": 135.33766, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 177.866, "t": 184.45752000000005, "r": 198.71288, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "25027", "bbox": {"l": 177.866, "t": 184.45752000000005, "r": 198.71288, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 219.211, "t": 184.45752000000005, "r": 233.69174000000004, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "2.25", "bbox": {"l": 219.211, "t": 184.45752000000005, "r": 233.69174000000004, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 250.01956, "t": 184.45752000000005, "r": 264.50031, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "1.90", "bbox": {"l": 250.01956, "t": 184.45752000000005, "r": 264.50031, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 280.82812, "t": 184.45752000000005, "r": 295.30887, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "2.96", "bbox": {"l": 280.82812, "t": 184.45752000000005, "r": 295.30887, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 305.27301, "t": 184.45752000000005, "r": 324.98117, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "83-85", "bbox": {"l": 305.27301, "t": 184.45752000000005, "r": 324.98117, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 342.79739, "t": 184.45752000000005, "r": 354.65097, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "n/a", "bbox": {"l": 342.79739, "t": 184.45752000000005, "r": 354.65097, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 372.46719, "t": 184.45752000000005, "r": 384.32077, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "n/a", "bbox": {"l": 372.46719, "t": 184.45752000000005, "r": 384.32077, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 398.45181, "t": 184.45752000000005, "r": 418.15997, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "84-87", "bbox": {"l": 398.45181, "t": 184.45752000000005, "r": 418.15997, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 428.12164, "t": 184.45752000000005, "r": 447.8298, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "86-96", "bbox": {"l": 428.12164, "t": 184.45752000000005, "r": 447.8298, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 465.655, "t": 184.45752000000005, "r": 477.50857999999994, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "n/a", "bbox": {"l": 465.655, "t": 184.45752000000005, "r": 477.50857999999994, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 495.3248, "t": 184.45752000000005, "r": 507.17838000000006, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "n/a", "bbox": {"l": 495.3248, "t": 184.45752000000005, "r": 507.17838000000006, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 104.825, "t": 195.41656, "r": 137.70479, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "List-item", "bbox": {"l": 104.825, "t": 195.41656, "r": 137.70479, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 173.69701, "t": 195.41656, "r": 198.71326, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "185660", "bbox": {"l": 173.69701, "t": 195.41656, "r": 198.71326, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 215.04201, "t": 195.41656, "r": 233.69212, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "17.19", "bbox": {"l": 215.04201, "t": 195.41656, "r": 233.69212, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 245.85056, "t": 195.41656, "r": 264.50067, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "13.34", "bbox": {"l": 245.85056, "t": 195.41656, "r": 264.50067, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 276.65912, "t": 195.41656, "r": 295.30923, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "15.82", "bbox": {"l": 276.65912, "t": 195.41656, "r": 295.30923, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 305.27301, "t": 195.41656, "r": 324.98117, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "87-88", "bbox": {"l": 305.27301, "t": 195.41656, "r": 324.98117, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 334.94284, "t": 195.41656, "r": 354.651, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "74-83", "bbox": {"l": 334.94284, "t": 195.41656, "r": 354.651, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 364.61267, "t": 195.41656, "r": 384.32083, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "90-92", "bbox": {"l": 364.61267, "t": 195.41656, "r": 384.32083, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 398.45187, "t": 195.41656, "r": 418.16003, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "97-97", "bbox": {"l": 398.45187, "t": 195.41656, "r": 418.16003, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 428.1217, "t": 195.41656, "r": 447.82986, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "81-85", "bbox": {"l": 428.1217, "t": 195.41656, "r": 447.82986, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 457.80051, "t": 195.41656, "r": 477.50867, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "75-88", "bbox": {"l": 457.80051, "t": 195.41656, "r": 477.50867, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 487.47034, "t": 195.41656, "r": 507.17849999999993, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "93-95", "bbox": {"l": 487.47034, "t": 195.41656, "r": 507.17849999999993, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 104.825, "t": 206.37554999999998, "r": 147.35262, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "Page-footer", "bbox": {"l": 104.825, "t": 206.37554999999998, "r": 147.35262, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 177.866, "t": 206.37554999999998, "r": 198.71288, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "70878", "bbox": {"l": 177.866, "t": 206.37554999999998, "r": 198.71288, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 219.211, "t": 206.37554999999998, "r": 233.69174000000004, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "6.51", "bbox": {"l": 219.211, "t": 206.37554999999998, "r": 233.69174000000004, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 250.01956, "t": 206.37554999999998, "r": 264.50031, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "5.58", "bbox": {"l": 250.01956, "t": 206.37554999999998, "r": 264.50031, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 280.82812, "t": 206.37554999999998, "r": 295.30887, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "6.00", "bbox": {"l": 280.82812, "t": 206.37554999999998, "r": 295.30887, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 305.27301, "t": 206.37554999999998, "r": 324.98117, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "93-94", "bbox": {"l": 305.27301, "t": 206.37554999999998, "r": 324.98117, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 334.94284, "t": 206.37554999999998, "r": 354.651, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "88-90", "bbox": {"l": 334.94284, "t": 206.37554999999998, "r": 354.651, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 364.61267, "t": 206.37554999999998, "r": 384.32083, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "95-96", "bbox": {"l": 364.61267, "t": 206.37554999999998, "r": 384.32083, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 405.65189, "t": 206.37554999999998, "r": 418.16, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "100", "bbox": {"l": 405.65189, "t": 206.37554999999998, "r": 418.16, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 428.12167, "t": 206.37554999999998, "r": 447.82983, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "92-97", "bbox": {"l": 428.12167, "t": 206.37554999999998, "r": 447.82983, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 465.00049, "t": 206.37554999999998, "r": 477.5086099999999, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "100", "bbox": {"l": 465.00049, "t": 206.37554999999998, "r": 477.5086099999999, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 487.47028, "t": 206.37554999999998, "r": 507.17843999999997, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "96-98", "bbox": {"l": 487.47028, "t": 206.37554999999998, "r": 507.17843999999997, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 104.825, "t": 217.33452999999997, "r": 150.10532, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "Page-header", "bbox": {"l": 104.825, "t": 217.33452999999997, "r": 150.10532, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 177.866, "t": 217.33452999999997, "r": 198.71288, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "58022", "bbox": {"l": 177.866, "t": 217.33452999999997, "r": 198.71288, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 219.211, "t": 217.33452999999997, "r": 233.69174000000004, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "5.10", "bbox": {"l": 219.211, "t": 217.33452999999997, "r": 233.69174000000004, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 250.01956, "t": 217.33452999999997, "r": 264.50031, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "6.70", "bbox": {"l": 250.01956, "t": 217.33452999999997, "r": 264.50031, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 280.82812, "t": 217.33452999999997, "r": 295.30887, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "5.06", "bbox": {"l": 280.82812, "t": 217.33452999999997, "r": 295.30887, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 305.27301, "t": 217.33452999999997, "r": 324.98117, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "85-89", "bbox": {"l": 305.27301, "t": 217.33452999999997, "r": 324.98117, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 334.94284, "t": 217.33452999999997, "r": 354.651, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "66-76", "bbox": {"l": 334.94284, "t": 217.33452999999997, "r": 354.651, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 364.61267, "t": 217.33452999999997, "r": 384.32083, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "90-94", "bbox": {"l": 364.61267, "t": 217.33452999999997, "r": 384.32083, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 394.2825, "t": 217.33452999999997, "r": 418.16003, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "98-100", "bbox": {"l": 394.2825, "t": 217.33452999999997, "r": 418.16003, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 428.1217, "t": 217.33452999999997, "r": 447.82986, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "91-92", "bbox": {"l": 428.1217, "t": 217.33452999999997, "r": 447.82986, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 457.80051, "t": 217.33452999999997, "r": 477.50867, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "97-99", "bbox": {"l": 457.80051, "t": 217.33452999999997, "r": 477.50867, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 487.47034, "t": 217.33452999999997, "r": 507.17849999999993, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "81-86", "bbox": {"l": 487.47034, "t": 217.33452999999997, "r": 507.17849999999993, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 104.825, "t": 228.29351999999994, "r": 130.80963, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "Picture", "bbox": {"l": 104.825, "t": 228.29351999999994, "r": 130.80963, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 177.866, "t": 228.29351999999994, "r": 198.71288, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "45976", "bbox": {"l": 177.866, "t": 228.29351999999994, "r": 198.71288, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 219.211, "t": 228.29351999999994, "r": 233.69174000000004, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "4.21", "bbox": {"l": 219.211, "t": 228.29351999999994, "r": 233.69174000000004, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 250.01956, "t": 228.29351999999994, "r": 264.50031, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "2.78", "bbox": {"l": 250.01956, "t": 228.29351999999994, "r": 264.50031, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 280.82812, "t": 228.29351999999994, "r": 295.30887, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "5.31", "bbox": {"l": 280.82812, "t": 228.29351999999994, "r": 295.30887, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 305.27301, "t": 228.29351999999994, "r": 324.98117, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "69-71", "bbox": {"l": 305.27301, "t": 228.29351999999994, "r": 324.98117, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 334.94284, "t": 228.29351999999994, "r": 354.651, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "56-59", "bbox": {"l": 334.94284, "t": 228.29351999999994, "r": 354.651, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 364.61267, "t": 228.29351999999994, "r": 384.32083, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "82-86", "bbox": {"l": 364.61267, "t": 228.29351999999994, "r": 384.32083, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 398.45187, "t": 228.29351999999994, "r": 418.16003, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "69-82", "bbox": {"l": 398.45187, "t": 228.29351999999994, "r": 418.16003, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 428.1217, "t": 228.29351999999994, "r": 447.82986, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "80-95", "bbox": {"l": 428.1217, "t": 228.29351999999994, "r": 447.82986, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 457.80051, "t": 228.29351999999994, "r": 477.50867, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "66-71", "bbox": {"l": 457.80051, "t": 228.29351999999994, "r": 477.50867, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 487.47034, "t": 228.29351999999994, "r": 507.17849999999993, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "59-76", "bbox": {"l": 487.47034, "t": 228.29351999999994, "r": 507.17849999999993, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 104.825, "t": 239.25256000000002, "r": 159.56487, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": "Section-header", "bbox": {"l": 104.825, "t": 239.25256000000002, "r": 159.56487, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 173.69701, "t": 239.25256000000002, "r": 198.71326, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "142884", "bbox": {"l": 173.69701, "t": 239.25256000000002, "r": 198.71326, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 215.04201, "t": 239.25256000000002, "r": 233.69212, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "12.60", "bbox": {"l": 215.04201, "t": 239.25256000000002, "r": 233.69212, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 245.85056, "t": 239.25256000000002, "r": 264.50067, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": "15.77", "bbox": {"l": 245.85056, "t": 239.25256000000002, "r": 264.50067, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 276.65912, "t": 239.25256000000002, "r": 295.30923, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 107, "text": "12.85", "bbox": {"l": 276.65912, "t": 239.25256000000002, "r": 295.30923, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 114, "label": "text", "bbox": {"l": 305.27301, "t": 239.25256000000002, "r": 324.98117, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 108, "text": "83-84", "bbox": {"l": 305.27301, "t": 239.25256000000002, "r": 324.98117, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 115, "label": "text", "bbox": {"l": 334.94284, "t": 239.25256000000002, "r": 354.651, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 109, "text": "76-81", "bbox": {"l": 334.94284, "t": 239.25256000000002, "r": 354.651, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 116, "label": "text", "bbox": {"l": 364.61267, "t": 239.25256000000002, "r": 384.32083, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 110, "text": "90-92", "bbox": {"l": 364.61267, "t": 239.25256000000002, "r": 384.32083, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 117, "label": "text", "bbox": {"l": 398.45187, "t": 239.25256000000002, "r": 418.16003, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 111, "text": "94-95", "bbox": {"l": 398.45187, "t": 239.25256000000002, "r": 418.16003, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 118, "label": "text", "bbox": {"l": 428.1217, "t": 239.25256000000002, "r": 447.82986, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 112, "text": "87-94", "bbox": {"l": 428.1217, "t": 239.25256000000002, "r": 447.82986, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 119, "label": "text", "bbox": {"l": 457.80051, "t": 239.25256000000002, "r": 477.50867, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 113, "text": "69-73", "bbox": {"l": 457.80051, "t": 239.25256000000002, "r": 477.50867, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 120, "label": "text", "bbox": {"l": 487.47034, "t": 239.25256000000002, "r": 507.17849999999993, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 114, "text": "78-86", "bbox": {"l": 487.47034, "t": 239.25256000000002, "r": 507.17849999999993, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 121, "label": "text", "bbox": {"l": 104.825, "t": 250.21155, "r": 124.63177, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 115, "text": "Table", "bbox": {"l": 104.825, "t": 250.21155, "r": 124.63177, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 122, "label": "text", "bbox": {"l": 177.866, "t": 250.21155, "r": 198.71288, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 116, "text": "34733", "bbox": {"l": 177.866, "t": 250.21155, "r": 198.71288, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 123, "label": "text", "bbox": {"l": 219.211, "t": 250.21155, "r": 233.69174000000004, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 117, "text": "3.20", "bbox": {"l": 219.211, "t": 250.21155, "r": 233.69174000000004, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 124, "label": "text", "bbox": {"l": 250.01956, "t": 250.21155, "r": 264.50031, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 118, "text": "2.27", "bbox": {"l": 250.01956, "t": 250.21155, "r": 264.50031, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 125, "label": "text", "bbox": {"l": 280.82812, "t": 250.21155, "r": 295.30887, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 119, "text": "3.60", "bbox": {"l": 280.82812, "t": 250.21155, "r": 295.30887, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 126, "label": "text", "bbox": {"l": 305.27301, "t": 250.21155, "r": 324.98117, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 120, "text": "77-81", "bbox": {"l": 305.27301, "t": 250.21155, "r": 324.98117, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 127, "label": "text", "bbox": {"l": 334.94284, "t": 250.21155, "r": 354.651, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 121, "text": "75-80", "bbox": {"l": 334.94284, "t": 250.21155, "r": 354.651, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 128, "label": "text", "bbox": {"l": 364.61267, "t": 250.21155, "r": 384.32083, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 122, "text": "83-86", "bbox": {"l": 364.61267, "t": 250.21155, "r": 384.32083, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 129, "label": "text", "bbox": {"l": 398.45187, "t": 250.21155, "r": 418.16003, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 123, "text": "98-99", "bbox": {"l": 398.45187, "t": 250.21155, "r": 418.16003, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 130, "label": "text", "bbox": {"l": 428.1217, "t": 250.21155, "r": 447.82986, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 124, "text": "58-80", "bbox": {"l": 428.1217, "t": 250.21155, "r": 447.82986, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 131, "label": "text", "bbox": {"l": 457.80051, "t": 250.21155, "r": 477.50867, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 125, "text": "79-84", "bbox": {"l": 457.80051, "t": 250.21155, "r": 477.50867, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 132, "label": "text", "bbox": {"l": 487.47034, "t": 250.21155, "r": 507.17849999999993, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 126, "text": "70-85", "bbox": {"l": 487.47034, "t": 250.21155, "r": 507.17849999999993, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 133, "label": "text", "bbox": {"l": 104.825, "t": 261.16956000000005, "r": 120.78519, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 127, "text": "Text", "bbox": {"l": 104.825, "t": 261.16956000000005, "r": 120.78519, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 134, "label": "text", "bbox": {"l": 173.69701, "t": 261.16956000000005, "r": 198.71326, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 128, "text": "510377", "bbox": {"l": 173.69701, "t": 261.16956000000005, "r": 198.71326, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 135, "label": "text", "bbox": {"l": 215.04201, "t": 261.16956000000005, "r": 233.69212, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 129, "text": "45.82", "bbox": {"l": 215.04201, "t": 261.16956000000005, "r": 233.69212, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 136, "label": "text", "bbox": {"l": 245.85056, "t": 261.16956000000005, "r": 264.50067, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 130, "text": "49.28", "bbox": {"l": 245.85056, "t": 261.16956000000005, "r": 264.50067, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 137, "label": "text", "bbox": {"l": 276.65912, "t": 261.16956000000005, "r": 295.30923, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 131, "text": "45.00", "bbox": {"l": 276.65912, "t": 261.16956000000005, "r": 295.30923, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 138, "label": "text", "bbox": {"l": 305.27301, "t": 261.16956000000005, "r": 324.98117, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 132, "text": "84-86", "bbox": {"l": 305.27301, "t": 261.16956000000005, "r": 324.98117, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 139, "label": "text", "bbox": {"l": 334.94284, "t": 261.16956000000005, "r": 354.651, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 133, "text": "81-86", "bbox": {"l": 334.94284, "t": 261.16956000000005, "r": 354.651, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 140, "label": "text", "bbox": {"l": 364.61267, "t": 261.16956000000005, "r": 384.32083, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 134, "text": "88-93", "bbox": {"l": 364.61267, "t": 261.16956000000005, "r": 384.32083, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 141, "label": "text", "bbox": {"l": 398.45187, "t": 261.16956000000005, "r": 418.16003, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 135, "text": "89-93", "bbox": {"l": 398.45187, "t": 261.16956000000005, "r": 418.16003, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 142, "label": "text", "bbox": {"l": 428.1217, "t": 261.16956000000005, "r": 447.82986, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 136, "text": "87-92", "bbox": {"l": 428.1217, "t": 261.16956000000005, "r": 447.82986, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 143, "label": "text", "bbox": {"l": 457.80051, "t": 261.16956000000005, "r": 477.50867, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 137, "text": "71-79", "bbox": {"l": 457.80051, "t": 261.16956000000005, "r": 477.50867, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 144, "label": "text", "bbox": {"l": 487.47034, "t": 261.16956000000005, "r": 507.17849999999993, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 138, "text": "87-95", "bbox": {"l": 487.47034, "t": 261.16956000000005, "r": 507.17849999999993, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 145, "label": "text", "bbox": {"l": 104.825, "t": 272.12854000000004, "r": 121.81633, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 139, "text": "Title", "bbox": {"l": 104.825, "t": 272.12854000000004, "r": 121.81633, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 146, "label": "text", "bbox": {"l": 182.035, "t": 272.12854000000004, "r": 198.71251, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 140, "text": "5071", "bbox": {"l": 182.035, "t": 272.12854000000004, "r": 198.71251, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 147, "label": "text", "bbox": {"l": 219.211, "t": 272.12854000000004, "r": 233.69174000000004, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 141, "text": "0.47", "bbox": {"l": 219.211, "t": 272.12854000000004, "r": 233.69174000000004, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 148, "label": "text", "bbox": {"l": 250.01956, "t": 272.12854000000004, "r": 264.50031, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 142, "text": "0.30", "bbox": {"l": 250.01956, "t": 272.12854000000004, "r": 264.50031, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 149, "label": "text", "bbox": {"l": 280.82812, "t": 272.12854000000004, "r": 295.30887, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 143, "text": "0.50", "bbox": {"l": 280.82812, "t": 272.12854000000004, "r": 295.30887, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 150, "label": "text", "bbox": {"l": 305.27301, "t": 272.12854000000004, "r": 324.98117, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 144, "text": "60-72", "bbox": {"l": 305.27301, "t": 272.12854000000004, "r": 324.98117, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 151, "label": "text", "bbox": {"l": 334.94284, "t": 272.12854000000004, "r": 354.651, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 145, "text": "24-63", "bbox": {"l": 334.94284, "t": 272.12854000000004, "r": 354.651, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 152, "label": "text", "bbox": {"l": 364.61267, "t": 272.12854000000004, "r": 384.32083, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 146, "text": "50-63", "bbox": {"l": 364.61267, "t": 272.12854000000004, "r": 384.32083, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 153, "label": "text", "bbox": {"l": 394.2825, "t": 272.12854000000004, "r": 418.16003, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 147, "text": "94-100", "bbox": {"l": 394.2825, "t": 272.12854000000004, "r": 418.16003, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 154, "label": "text", "bbox": {"l": 428.1217, "t": 272.12854000000004, "r": 447.82986, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 148, "text": "82-96", "bbox": {"l": 428.1217, "t": 272.12854000000004, "r": 447.82986, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 155, "label": "text", "bbox": {"l": 457.80051, "t": 272.12854000000004, "r": 477.50867, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 149, "text": "68-79", "bbox": {"l": 457.80051, "t": 272.12854000000004, "r": 477.50867, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 156, "label": "text", "bbox": {"l": 487.47034, "t": 272.12854000000004, "r": 507.17849999999993, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 150, "text": "24-56", "bbox": {"l": 487.47034, "t": 272.12854000000004, "r": 507.17849999999993, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 157, "label": "text", "bbox": {"l": 104.825, "t": 283.48654, "r": 123.43028, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 151, "text": "Total", "bbox": {"l": 104.825, "t": 283.48654, "r": 123.43028, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 158, "label": "text", "bbox": {"l": 169.52699, "t": 283.48654, "r": 198.71263, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 152, "text": "1107470", "bbox": {"l": 169.52699, "t": 283.48654, "r": 198.71263, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 159, "label": "text", "bbox": {"l": 208.675, "t": 283.48654, "r": 233.69124999999997, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 153, "text": "941123", "bbox": {"l": 208.675, "t": 283.48654, "r": 233.69124999999997, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 160, "label": "text", "bbox": {"l": 243.65291999999997, "t": 283.48654, "r": 264.49982, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 154, "text": "99816", "bbox": {"l": 243.65291999999997, "t": 283.48654, "r": 264.49982, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 161, "label": "text", "bbox": {"l": 274.46149, "t": 283.48654, "r": 295.30838, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 155, "text": "66531", "bbox": {"l": 274.46149, "t": 283.48654, "r": 295.30838, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 162, "label": "text", "bbox": {"l": 305.27301, "t": 283.48654, "r": 324.98117, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 156, "text": "82-83", "bbox": {"l": 305.27301, "t": 283.48654, "r": 324.98117, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 163, "label": "text", "bbox": {"l": 334.94284, "t": 283.48654, "r": 354.651, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 157, "text": "71-74", "bbox": {"l": 334.94284, "t": 283.48654, "r": 354.651, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 164, "label": "text", "bbox": {"l": 364.61267, "t": 283.48654, "r": 384.32083, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 158, "text": "79-81", "bbox": {"l": 364.61267, "t": 283.48654, "r": 384.32083, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 165, "label": "text", "bbox": {"l": 398.45187, "t": 283.48654, "r": 418.16003, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 159, "text": "89-94", "bbox": {"l": 398.45187, "t": 283.48654, "r": 418.16003, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 166, "label": "text", "bbox": {"l": 428.1217, "t": 283.48654, "r": 447.82986, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 160, "text": "86-91", "bbox": {"l": 428.1217, "t": 283.48654, "r": 447.82986, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 167, "label": "text", "bbox": {"l": 457.80051, "t": 283.48654, "r": 477.50867, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 161, "text": "71-76", "bbox": {"l": 457.80051, "t": 283.48654, "r": 477.50867, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 168, "label": "text", "bbox": {"l": 487.47034, "t": 283.48654, "r": 507.17849999999993, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 162, "text": "68-85", "bbox": {"l": 487.47034, "t": 283.48654, "r": 507.17849999999993, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "lcel", "lcel", "lcel", "ched", "lcel", "lcel", "lcel", "lcel", "lcel", "nl", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 14, "num_cols": 12, "table_cells": [{"bbox": {"l": 233.94400000000002, "t": 140.22351000000003, "r": 270.04272, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 4, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 6, "text": "% of Total", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 329.04999, "t": 140.22351000000003, "r": 483.3976400000001, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 6, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 6, "end_col_offset_idx": 12, "text": "triple inter-annotator mAP @ 0.5-0.95 (%)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 151.18255999999997, "r": 141.71277, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "class label", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 175.94701, "t": 151.18255999999997, "r": 198.71269, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Count", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 213.795, "t": 151.18255999999997, "r": 233.69144, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Train", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 249.37367, "t": 151.18255999999997, "r": 264.5, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Test", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 283.53568, "t": 151.18255999999997, "r": 295.30856, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Val", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 314.01501, "t": 151.18255999999997, "r": 324.98093, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "All", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 343.01236, "t": 151.18255999999997, "r": 354.65076, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "Fin", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 367.84033, "t": 151.18255999999997, "r": 384.32059, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "Man", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 407.54358, "t": 151.18255999999997, "r": 418.15979, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "Sci", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 432.29979999999995, "t": 151.18255999999997, "r": 447.82962, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "Law", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 465.72656, "t": 151.18255999999997, "r": 477.50842, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "Pat", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 493.52240000000006, "t": 151.18255999999997, "r": 507.17822, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "Ten", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 162.53954999999996, "r": 134.01064, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Caption", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 177.866, "t": 162.53954999999996, "r": 198.71288, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "22524", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 162.53954999999996, "r": 233.69174000000004, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "2.04", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 162.53954999999996, "r": 264.50031, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "1.77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 162.53954999999996, "r": 295.30887, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "2.32", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 162.53954999999996, "r": 324.98117, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "84-89", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 162.53954999999996, "r": 354.651, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "40-61", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 162.53954999999996, "r": 384.32083, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "86-92", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45187, "t": 162.53954999999996, "r": 418.16003, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "94-99", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 162.53954999999996, "r": 447.82986, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "95-99", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 162.53954999999996, "r": 477.50867, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "69-78", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 495.32489, "t": 162.53954999999996, "r": 507.17846999999995, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 173.49854000000005, "r": 137.3282, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Footnote", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 182.035, "t": 173.49854000000005, "r": 198.71251, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "6318", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 173.49854000000005, "r": 233.69174000000004, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.60", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 173.49854000000005, "r": 264.50031, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.31", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 173.49854000000005, "r": 295.30887, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.58", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 173.49854000000005, "r": 324.98117, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "83-91", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 342.79739, "t": 173.49854000000005, "r": 354.65097, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 371.81265, "t": 173.49854000000005, "r": 384.32077, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "100", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45181, "t": 173.49854000000005, "r": 418.15997, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "62-88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.12164, "t": 173.49854000000005, "r": 447.8298, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "85-94", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 465.655, "t": 173.49854000000005, "r": 477.50857999999994, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47025, "t": 173.49854000000005, "r": 507.17841, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "82-97", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 184.45752000000005, "r": 135.33766, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Formula", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 177.866, "t": 184.45752000000005, "r": 198.71288, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "25027", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 184.45752000000005, "r": 233.69174000000004, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "2.25", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 184.45752000000005, "r": 264.50031, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "1.90", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 184.45752000000005, "r": 295.30887, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "2.96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 184.45752000000005, "r": 324.98117, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "83-85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 342.79739, "t": 184.45752000000005, "r": 354.65097, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 372.46719, "t": 184.45752000000005, "r": 384.32077, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45181, "t": 184.45752000000005, "r": 418.15997, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "84-87", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.12164, "t": 184.45752000000005, "r": 447.8298, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "86-96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 465.655, "t": 184.45752000000005, "r": 477.50857999999994, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 495.3248, "t": 184.45752000000005, "r": 507.17838000000006, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 195.41656, "r": 137.70479, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "List-item", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 173.69701, "t": 195.41656, "r": 198.71326, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "185660", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 215.04201, "t": 195.41656, "r": 233.69212, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "17.19", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.85056, "t": 195.41656, "r": 264.50067, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "13.34", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 276.65912, "t": 195.41656, "r": 295.30923, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "15.82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 195.41656, "r": 324.98117, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "87-88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 195.41656, "r": 354.651, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "74-83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 195.41656, "r": 384.32083, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "90-92", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45187, "t": 195.41656, "r": 418.16003, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "97-97", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 195.41656, "r": 447.82986, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "81-85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 195.41656, "r": 477.50867, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "75-88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 195.41656, "r": 507.17849999999993, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "93-95", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 206.37554999999998, "r": 147.35262, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-footer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 177.866, "t": 206.37554999999998, "r": 198.71288, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "70878", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 206.37554999999998, "r": 233.69174000000004, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "6.51", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 206.37554999999998, "r": 264.50031, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "5.58", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 206.37554999999998, "r": 295.30887, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "6.00", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 206.37554999999998, "r": 324.98117, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "93-94", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 206.37554999999998, "r": 354.651, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "88-90", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 206.37554999999998, "r": 384.32083, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "95-96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 405.65189, "t": 206.37554999999998, "r": 418.16, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "100", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.12167, "t": 206.37554999999998, "r": 447.82983, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "92-97", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 465.00049, "t": 206.37554999999998, "r": 477.5086099999999, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "100", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47028, "t": 206.37554999999998, "r": 507.17843999999997, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "96-98", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 217.33452999999997, "r": 150.10532, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 177.866, "t": 217.33452999999997, "r": 198.71288, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "58022", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 217.33452999999997, "r": 233.69174000000004, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "5.10", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 217.33452999999997, "r": 264.50031, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "6.70", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 217.33452999999997, "r": 295.30887, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "5.06", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 217.33452999999997, "r": 324.98117, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "85-89", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 217.33452999999997, "r": 354.651, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "66-76", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 217.33452999999997, "r": 384.32083, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "90-94", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.2825, "t": 217.33452999999997, "r": 418.16003, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "98-100", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 217.33452999999997, "r": 447.82986, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "91-92", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 217.33452999999997, "r": 477.50867, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "97-99", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 217.33452999999997, "r": 507.17849999999993, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "81-86", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 228.29351999999994, "r": 130.80963, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Picture", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 177.866, "t": 228.29351999999994, "r": 198.71288, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "45976", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 228.29351999999994, "r": 233.69174000000004, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "4.21", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 228.29351999999994, "r": 264.50031, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "2.78", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 228.29351999999994, "r": 295.30887, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "5.31", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 228.29351999999994, "r": 324.98117, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "69-71", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 228.29351999999994, "r": 354.651, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "56-59", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 228.29351999999994, "r": 384.32083, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "82-86", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45187, "t": 228.29351999999994, "r": 418.16003, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "69-82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 228.29351999999994, "r": 447.82986, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "80-95", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 228.29351999999994, "r": 477.50867, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "66-71", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 228.29351999999994, "r": 507.17849999999993, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "59-76", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 239.25256000000002, "r": 159.56487, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Section-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 173.69701, "t": 239.25256000000002, "r": 198.71326, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "142884", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 215.04201, "t": 239.25256000000002, "r": 233.69212, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "12.60", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.85056, "t": 239.25256000000002, "r": 264.50067, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "15.77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 276.65912, "t": 239.25256000000002, "r": 295.30923, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "12.85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 239.25256000000002, "r": 324.98117, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "83-84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 239.25256000000002, "r": 354.651, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "76-81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 239.25256000000002, "r": 384.32083, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "90-92", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45187, "t": 239.25256000000002, "r": 418.16003, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "94-95", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 239.25256000000002, "r": 447.82986, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "87-94", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 239.25256000000002, "r": 477.50867, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "69-73", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 239.25256000000002, "r": 507.17849999999993, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "78-86", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 250.21155, "r": 124.63177, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 177.866, "t": 250.21155, "r": 198.71288, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "34733", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 250.21155, "r": 233.69174000000004, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "3.20", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 250.21155, "r": 264.50031, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "2.27", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 250.21155, "r": 295.30887, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "3.60", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 250.21155, "r": 324.98117, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "77-81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 250.21155, "r": 354.651, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "75-80", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 250.21155, "r": 384.32083, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "83-86", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45187, "t": 250.21155, "r": 418.16003, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "98-99", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 250.21155, "r": 447.82986, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "58-80", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 250.21155, "r": 477.50867, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "79-84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 250.21155, "r": 507.17849999999993, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "70-85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 261.16956000000005, "r": 120.78519, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Text", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 173.69701, "t": 261.16956000000005, "r": 198.71326, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "510377", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 215.04201, "t": 261.16956000000005, "r": 233.69212, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "45.82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.85056, "t": 261.16956000000005, "r": 264.50067, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "49.28", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 276.65912, "t": 261.16956000000005, "r": 295.30923, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "45.00", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 261.16956000000005, "r": 324.98117, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "84-86", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 261.16956000000005, "r": 354.651, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "81-86", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 261.16956000000005, "r": 384.32083, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "88-93", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45187, "t": 261.16956000000005, "r": 418.16003, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "89-93", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 261.16956000000005, "r": 447.82986, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "87-92", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 261.16956000000005, "r": 477.50867, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "71-79", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 261.16956000000005, "r": 507.17849999999993, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "87-95", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 272.12854000000004, "r": 121.81633, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Title", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 182.035, "t": 272.12854000000004, "r": 198.71251, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "5071", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 272.12854000000004, "r": 233.69174000000004, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.47", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 272.12854000000004, "r": 264.50031, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.30", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 272.12854000000004, "r": 295.30887, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.50", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 272.12854000000004, "r": 324.98117, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "60-72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 272.12854000000004, "r": 354.651, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "24-63", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 272.12854000000004, "r": 384.32083, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "50-63", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.2825, "t": 272.12854000000004, "r": 418.16003, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "94-100", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 272.12854000000004, "r": 447.82986, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "82-96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 272.12854000000004, "r": 477.50867, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "68-79", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 272.12854000000004, "r": 507.17849999999993, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "24-56", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 283.48654, "r": 123.43028, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Total", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 169.52699, "t": 283.48654, "r": 198.71263, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "1107470", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 208.675, "t": 283.48654, "r": 233.69124999999997, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "941123", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 243.65291999999997, "t": 283.48654, "r": 264.49982, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "99816", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 274.46149, "t": 283.48654, "r": 295.30838, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "66531", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 283.48654, "r": 324.98117, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "82-83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 283.48654, "r": 354.651, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "71-74", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 283.48654, "r": 384.32083, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "79-81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45187, "t": 283.48654, "r": 418.16003, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "89-94", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 283.48654, "r": 447.82986, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "86-91", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 283.48654, "r": 477.50867, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "71-76", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 283.48654, "r": 507.17849999999993, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "68-85", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "caption", "id": 9, "page_no": 3, "cluster": {"id": 9, "label": "caption", "bbox": {"l": 53.79800000000001, "t": 554.00999, "r": 295.64874, "b": 606.31924, "coord_origin": "TOPLEFT"}, "confidence": 0.8104903101921082, "cells": [{"id": 163, "text": "Figure 3: Corpus Conversion Service annotation user inter-", "bbox": {"l": 53.79800000000001, "t": 554.00999, "r": 295.64871, "b": 562.48325, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "face. The PDF page is shown in the background, with over-", "bbox": {"l": 53.79800000000001, "t": 564.96899, "r": 295.64874, "b": 573.44225, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "laid text-cells (in darker shades). The annotation boxes can", "bbox": {"l": 53.79800000000001, "t": 575.92799, "r": 294.04376, "b": 584.40125, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "be drawn by dragging a rectangle over each segment with", "bbox": {"l": 53.79800000000001, "t": 586.88699, "r": 294.04373, "b": 595.36024, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "the respective label from the palette on the right.", "bbox": {"l": 53.79800000000001, "t": 597.84599, "r": 252.78931000000003, "b": 606.31924, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 3: Corpus Conversion Service annotation user interface. The PDF page is shown in the background, with overlaid text-cells (in darker shades). The annotation boxes can be drawn by dragging a rectangle over each segment with the respective label from the palette on the right."}, {"label": "text", "id": 5, "page_no": 3, "cluster": {"id": 5, "label": "text", "bbox": {"l": 53.466999, "t": 634.29155, "r": 294.04745, "b": 675.54317, "coord_origin": "TOPLEFT"}, "confidence": 0.9803937673568726, "cells": [{"id": 168, "text": "we distributed the annotation workload and performed continuous", "bbox": {"l": 53.466999, "t": 634.29155, "r": 294.04745, "b": 642.66617, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "quality controls. Phase one and two required a small team of experts", "bbox": {"l": 53.79800000000001, "t": 645.25055, "r": 294.04535, "b": 653.62517, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "only. For phases three and four, a group of 40 dedicated annotators", "bbox": {"l": 53.79800000000001, "t": 656.20955, "r": 294.04422, "b": 664.58417, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "were assembled and supervised.", "bbox": {"l": 53.466999, "t": 667.16856, "r": 170.58611, "b": 675.54317, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "we distributed the annotation workload and performed continuous quality controls. Phase one and two required a small team of experts only. For phases three and four, a group of 40 dedicated annotators were assembled and supervised."}, {"label": "text", "id": 6, "page_no": 3, "cluster": {"id": 6, "label": "text", "bbox": {"l": 53.79800000000001, "t": 678.01099, "r": 295.55844, "b": 708.420174, "coord_origin": "TOPLEFT"}, "confidence": 0.9748397469520569, "cells": [{"id": 172, "text": "Phase 1: Data selection and preparation.", "bbox": {"l": 63.76099800000001, "t": 678.01099, "r": 226.72533000000004, "b": 686.48424, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "Our inclusion cri-", "bbox": {"l": 229.06900000000002, "t": 678.12756, "r": 295.55844, "b": 686.50217, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "teria for documents were described in Section 3. A large effort went", "bbox": {"l": 53.79800000000001, "t": 689.08656, "r": 294.04538, "b": 697.461174, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "into ensuring that all documents are free to use. The data sources", "bbox": {"l": 53.79800000000001, "t": 700.045555, "r": 294.04642, "b": 708.420174, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Phase 1: Data selection and preparation. Our inclusion criteria for documents were described in Section 3. A large effort went into ensuring that all documents are free to use. The data sources"}, {"label": "text", "id": 4, "page_no": 3, "cluster": {"id": 4, "label": "text", "bbox": {"l": 317.95499, "t": 312.07953, "r": 559.18536, "b": 375.24817, "coord_origin": "TOPLEFT"}, "confidence": 0.9818483591079712, "cells": [{"id": 176, "text": "include publication repositories such as arXiv$^{3}$, government offices,", "bbox": {"l": 317.95499, "t": 312.07953, "r": 559.18536, "b": 320.45416000000006, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "company websites as well as data directory services for financial", "bbox": {"l": 317.95499, "t": 323.03754, "r": 558.19843, "b": 331.41217, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "reports and patents. Scanned documents were excluded wherever", "bbox": {"l": 317.95499, "t": 333.99655, "r": 558.36963, "b": 342.37119, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "possible because they can be rotated or skewed. This would not", "bbox": {"l": 317.95499, "t": 344.95554, "r": 558.2041, "b": 353.33017, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "allow us to perform annotation with rectangular bounding-boxes", "bbox": {"l": 317.95499, "t": 355.91455, "r": 558.20294, "b": 364.28918, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "and therefore complicate the annotation process.", "bbox": {"l": 317.95499, "t": 366.87354, "r": 496.71826, "b": 375.24817, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "include publication repositories such as arXiv$^{3}$, government offices, company websites as well as data directory services for financial reports and patents. Scanned documents were excluded wherever possible because they can be rotated or skewed. This would not allow us to perform annotation with rectangular bounding-boxes and therefore complicate the annotation process."}, {"label": "text", "id": 0, "page_no": 3, "cluster": {"id": 0, "label": "text", "bbox": {"l": 317.95499, "t": 377.8325500000001, "r": 559.71307, "b": 506.75516, "coord_origin": "TOPLEFT"}, "confidence": 0.9866719841957092, "cells": [{"id": 182, "text": "Preparation work included uploading and parsing the sourced", "bbox": {"l": 327.918, "t": 377.8325500000001, "r": 558.20618, "b": 386.20717999999994, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "PDF documents in the Corpus Conversion Service (CCS) [22], a", "bbox": {"l": 317.95499, "t": 388.79153, "r": 558.2019, "b": 397.16617, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "cloud-native platform which provides a visual annotation interface", "bbox": {"l": 317.95499, "t": 399.75055, "r": 558.20233, "b": 408.12518, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": "and allows for dataset inspection and analysis. The annotation in-", "bbox": {"l": 317.95499, "t": 410.7095299999999, "r": 559.71277, "b": 419.08417, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "terface of CCS is shown in Figure 3. The desired balance of pages", "bbox": {"l": 317.95499, "t": 421.66855000000004, "r": 558.20062, "b": 430.04318, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "between the different document categories was achieved by se-", "bbox": {"l": 317.95499, "t": 432.62753, "r": 559.71307, "b": 441.00217, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": "lective subsampling of pages with certain desired properties. For", "bbox": {"l": 317.95499, "t": 443.58554, "r": 558.36877, "b": 451.96017, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "example, we made sure to include the title page of each document", "bbox": {"l": 317.95499, "t": 454.54453, "r": 558.20428, "b": 462.91916, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "and bias the remaining page selection to those with figures or", "bbox": {"l": 317.95499, "t": 465.50354, "r": 558.36877, "b": 473.87817, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "tables. The latter was achieved by leveraging pre-trained object", "bbox": {"l": 317.95499, "t": 476.46252, "r": 558.20428, "b": 484.83716, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": "detection models from PubLayNet, which helped us estimate how", "bbox": {"l": 317.95499, "t": 487.42154, "r": 558.5307, "b": 495.79617, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "many figures and tables a given page contains.", "bbox": {"l": 317.95499, "t": 498.38052, "r": 488.46914999999996, "b": 506.75516, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Preparation work included uploading and parsing the sourced PDF documents in the Corpus Conversion Service (CCS) [22], a cloud-native platform which provides a visual annotation interface and allows for dataset inspection and analysis. The annotation interface of CCS is shown in Figure 3. The desired balance of pages between the different document categories was achieved by selective subsampling of pages with certain desired properties. For example, we made sure to include the title page of each document and bias the remaining page selection to those with figures or tables. The latter was achieved by leveraging pre-trained object detection models from PubLayNet, which helped us estimate how many figures and tables a given page contains."}, {"label": "text", "id": 3, "page_no": 3, "cluster": {"id": 3, "label": "text", "bbox": {"l": 317.62299, "t": 509.22299, "r": 559.71765, "b": 693.0561749999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9847555756568909, "cells": [{"id": 194, "text": "Phase 2: Label selection and guideline.", "bbox": {"l": 327.918, "t": 509.22299, "r": 482.41809, "b": 517.69623, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "We reviewed the col-", "bbox": {"l": 484.474, "t": 509.33954, "r": 559.71765, "b": 517.71417, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "lected documents and identified the most common structural fea-", "bbox": {"l": 317.95499, "t": 520.29855, "r": 559.71619, "b": 528.67319, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "tures they exhibit. This was achieved by identifying recurrent layout", "bbox": {"l": 317.95499, "t": 531.2575400000001, "r": 558.20239, "b": 539.63217, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "elements and lead us to the definition of 11 distinct class labels.", "bbox": {"l": 317.95499, "t": 542.21655, "r": 559.58502, "b": 550.59117, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "These 11 class labels are", "bbox": {"l": 317.686, "t": 553.17456, "r": 404.14197, "b": 561.54918, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "Caption", "bbox": {"l": 406.26599, "t": 553.21939, "r": 433.84860000000003, "b": 561.5581500000001, "coord_origin": "TOPLEFT"}}, {"id": 201, "text": ",", "bbox": {"l": 433.84799, "t": 553.17456, "r": 435.78115999999994, "b": 561.54918, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": "Footnote", "bbox": {"l": 437.9079899999999, "t": 553.21939, "r": 467.23926, "b": 561.5581500000001, "coord_origin": "TOPLEFT"}}, {"id": 203, "text": ",", "bbox": {"l": 467.23999, "t": 553.17456, "r": 469.17316000000005, "b": 561.54918, "coord_origin": "TOPLEFT"}}, {"id": 204, "text": "Formula", "bbox": {"l": 471.29900999999995, "t": 553.21939, "r": 500.44574000000006, "b": 561.5581500000001, "coord_origin": "TOPLEFT"}}, {"id": 205, "text": ",", "bbox": {"l": 500.44601000000006, "t": 553.17456, "r": 502.37918, "b": 561.54918, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": "List-item", "bbox": {"l": 504.505, "t": 553.21939, "r": 535.74304, "b": 561.5581500000001, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": ",", "bbox": {"l": 535.74298, "t": 553.17456, "r": 537.67615, "b": 561.54918, "coord_origin": "TOPLEFT"}}, {"id": 208, "text": "Page-", "bbox": {"l": 539.802, "t": 553.21939, "r": 559.09839, "b": 561.5581500000001, "coord_origin": "TOPLEFT"}}, {"id": 209, "text": "footer", "bbox": {"l": 317.95499, "t": 564.17839, "r": 338.80725, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": ",", "bbox": {"l": 338.806, "t": 564.13356, "r": 340.81805, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "Page-header", "bbox": {"l": 343.61401, "t": 564.17839, "r": 387.96164, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 212, "text": ",", "bbox": {"l": 387.961, "t": 564.13356, "r": 389.97305, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "Picture", "bbox": {"l": 392.76901, "t": 564.17839, "r": 417.84662, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 214, "text": ",", "bbox": {"l": 417.84799, "t": 564.13356, "r": 419.86005, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 215, "text": "Section-header", "bbox": {"l": 422.655, "t": 564.17839, "r": 475.56305, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 216, "text": ",", "bbox": {"l": 475.56201, "t": 564.13356, "r": 477.57407, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 217, "text": "Table", "bbox": {"l": 480.36899, "t": 564.17839, "r": 499.82196, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 218, "text": ",", "bbox": {"l": 499.8219900000001, "t": 564.13356, "r": 501.83405, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 219, "text": "Text", "bbox": {"l": 504.6290000000001, "t": 564.17839, "r": 519.7926, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 220, "text": ", and", "bbox": {"l": 519.79602, "t": 564.13356, "r": 538.37103, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 221, "text": "Title", "bbox": {"l": 541.16302, "t": 564.17839, "r": 557.57043, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 222, "text": ".", "bbox": {"l": 557.57098, "t": 564.13356, "r": 559.58307, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 223, "text": "Critical factors that were considered for the choice of these class", "bbox": {"l": 317.95499, "t": 575.09256, "r": 558.20416, "b": 583.46718, "coord_origin": "TOPLEFT"}}, {"id": 224, "text": "labels were (1) the overall occurrence of the label, (2) the specificity", "bbox": {"l": 317.95499, "t": 586.05156, "r": 558.43091, "b": 594.4261799999999, "coord_origin": "TOPLEFT"}}, {"id": 225, "text": "of the label, (3) recognisability on a single page (i.e. no need for", "bbox": {"l": 317.95499, "t": 597.0105599999999, "r": 558.36871, "b": 605.38518, "coord_origin": "TOPLEFT"}}, {"id": 226, "text": "context from previous or next page) and (4) overall coverage of the", "bbox": {"l": 317.95499, "t": 607.96956, "r": 558.20105, "b": 616.3441799999999, "coord_origin": "TOPLEFT"}}, {"id": 227, "text": "page. Specificity ensures that the choice of label is not ambiguous,", "bbox": {"l": 317.95499, "t": 618.9285600000001, "r": 559.18665, "b": 627.30318, "coord_origin": "TOPLEFT"}}, {"id": 228, "text": "while coverage ensures that all meaningful items on a page can", "bbox": {"l": 317.62299, "t": 629.88756, "r": 558.20142, "b": 638.26218, "coord_origin": "TOPLEFT"}}, {"id": 229, "text": "be annotated. We refrained from class labels that are very specific", "bbox": {"l": 317.95499, "t": 640.84656, "r": 558.20227, "b": 649.22118, "coord_origin": "TOPLEFT"}}, {"id": 230, "text": "to a document category, such as", "bbox": {"l": 317.95499, "t": 651.80556, "r": 436.90649, "b": 660.1801800000001, "coord_origin": "TOPLEFT"}}, {"id": 231, "text": "Abstract", "bbox": {"l": 439.13800000000003, "t": 651.8503900000001, "r": 469.69134999999994, "b": 660.18915, "coord_origin": "TOPLEFT"}}, {"id": 232, "text": "in the", "bbox": {"l": 472.42898999999994, "t": 651.80556, "r": 493.97348, "b": 660.1801800000001, "coord_origin": "TOPLEFT"}}, {"id": 233, "text": "Scientific Articles", "bbox": {"l": 496.207, "t": 651.8503900000001, "r": 558.20001, "b": 660.18915, "coord_origin": "TOPLEFT"}}, {"id": 234, "text": "category. We also avoided class labels that are tightly linked to the", "bbox": {"l": 317.95499, "t": 662.76456, "r": 558.20557, "b": 671.13918, "coord_origin": "TOPLEFT"}}, {"id": 235, "text": "semantics of the text. Labels such as", "bbox": {"l": 317.95499, "t": 673.7225599999999, "r": 447.65221999999994, "b": 682.09718, "coord_origin": "TOPLEFT"}}, {"id": 236, "text": "Author", "bbox": {"l": 449.85999, "t": 673.76739, "r": 474.31439, "b": 682.10614, "coord_origin": "TOPLEFT"}}, {"id": 237, "text": "and", "bbox": {"l": 477.172, "t": 673.7225599999999, "r": 490.39655, "b": 682.09718, "coord_origin": "TOPLEFT"}}, {"id": 238, "text": "Affiliation", "bbox": {"l": 492.60599, "t": 673.76739, "r": 528.29907, "b": 682.10614, "coord_origin": "TOPLEFT"}}, {"id": 239, "text": ", as seen", "bbox": {"l": 528.29901, "t": 673.7225599999999, "r": 558.20148, "b": 682.09718, "coord_origin": "TOPLEFT"}}, {"id": 240, "text": "in DocBank, are often only distinguishable by discriminating on", "bbox": {"l": 317.95499, "t": 684.68156, "r": 558.2041, "b": 693.0561749999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Phase 2: Label selection and guideline. We reviewed the collected documents and identified the most common structural features they exhibit. This was achieved by identifying recurrent layout elements and lead us to the definition of 11 distinct class labels. These 11 class labels are Caption , Footnote , Formula , List-item , Pagefooter , Page-header , Picture , Section-header , Table , Text , and Title . Critical factors that were considered for the choice of these class labels were (1) the overall occurrence of the label, (2) the specificity of the label, (3) recognisability on a single page (i.e. no need for context from previous or next page) and (4) overall coverage of the page. Specificity ensures that the choice of label is not ambiguous, while coverage ensures that all meaningful items on a page can be annotated. We refrained from class labels that are very specific to a document category, such as Abstract in the Scientific Articles category. We also avoided class labels that are tightly linked to the semantics of the text. Labels such as Author and Affiliation , as seen in DocBank, are often only distinguishable by discriminating on"}, {"label": "footnote", "id": 7, "page_no": 3, "cluster": {"id": 7, "label": "footnote", "bbox": {"l": 317.95499, "t": 702.353363, "r": 369.2457, "b": 708.86689, "coord_origin": "TOPLEFT"}, "confidence": 0.9080349802970886, "cells": [{"id": 241, "text": "$^{3}$https://arxiv.org/", "bbox": {"l": 317.95499, "t": 702.353363, "r": 369.2457, "b": 708.86689, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "$^{3}$https://arxiv.org/"}, {"label": "picture", "id": 2, "page_no": 3, "cluster": {"id": 2, "label": "picture", "bbox": {"l": 53.05912780761719, "t": 310.7912902832031, "r": 295.8506164550781, "b": 540.864013671875, "coord_origin": "TOPLEFT"}, "confidence": 0.9847870469093323, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "body": [{"label": "caption", "id": 8, "page_no": 3, "cluster": {"id": 8, "label": "caption", "bbox": {"l": 53.501999, "t": 84.95495999999991, "r": 558.48969, "b": 115.34618999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.8906610012054443, "cells": [{"id": 2, "text": "Table 1: DocLayNet dataset overview. Along with the frequency of each class label, we present the relative occurrence (as %", "bbox": {"l": 53.501999, "t": 84.95495999999991, "r": 558.48969, "b": 93.42822000000001, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "of row \u201cTotal\u201d) in the train, test and validation sets. The inter-annotator agreement is computed as the mAP@0.5-0.95 metric", "bbox": {"l": 53.79800000000001, "t": 95.91394000000003, "r": 558.20294, "b": 104.3872100000001, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "between pairwise annotations from the triple-annotated pages, from which we obtain accuracy ranges.", "bbox": {"l": 53.79800000000001, "t": 106.87292000000002, "r": 469.84805000000006, "b": 115.34618999999998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 1: DocLayNet dataset overview. Along with the frequency of each class label, we present the relative occurrence (as % of row \u201cTotal\u201d) in the train, test and validation sets. The inter-annotator agreement is computed as the mAP@0.5-0.95 metric between pairwise annotations from the triple-annotated pages, from which we obtain accuracy ranges."}, {"label": "table", "id": 1, "page_no": 3, "cluster": {"id": 1, "label": "table", "bbox": {"l": 98.93103790283203, "t": 137.4754638671875, "r": 512.579833984375, "b": 294.0815124511719, "coord_origin": "TOPLEFT"}, "confidence": 0.9860089421272278, "cells": [{"id": 5, "text": "% of Total", "bbox": {"l": 233.94400000000002, "t": 140.22351000000003, "r": 270.04272, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "triple inter-annotator mAP @ 0.5-0.95 (%)", "bbox": {"l": 329.04999, "t": 140.22351000000003, "r": 483.3976400000001, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "class label", "bbox": {"l": 104.825, "t": 151.18255999999997, "r": 141.71277, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Count", "bbox": {"l": 175.94701, "t": 151.18255999999997, "r": 198.71269, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Train", "bbox": {"l": 213.795, "t": 151.18255999999997, "r": 233.69144, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Test", "bbox": {"l": 249.37367, "t": 151.18255999999997, "r": 264.5, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Val", "bbox": {"l": 283.53568, "t": 151.18255999999997, "r": 295.30856, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "All", "bbox": {"l": 314.01501, "t": 151.18255999999997, "r": 324.98093, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Fin", "bbox": {"l": 343.01236, "t": 151.18255999999997, "r": 354.65076, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Man", "bbox": {"l": 367.84033, "t": 151.18255999999997, "r": 384.32059, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Sci", "bbox": {"l": 407.54358, "t": 151.18255999999997, "r": 418.15979, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Law", "bbox": {"l": 432.29979999999995, "t": 151.18255999999997, "r": 447.82962, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "Pat", "bbox": {"l": 465.72656, "t": 151.18255999999997, "r": 477.50842, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Ten", "bbox": {"l": 493.52240000000006, "t": 151.18255999999997, "r": 507.17822, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Caption", "bbox": {"l": 104.825, "t": 162.53954999999996, "r": 134.01064, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "22524", "bbox": {"l": 177.866, "t": 162.53954999999996, "r": 198.71288, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "2.04", "bbox": {"l": 219.211, "t": 162.53954999999996, "r": 233.69174000000004, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "1.77", "bbox": {"l": 250.01956, "t": 162.53954999999996, "r": 264.50031, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "2.32", "bbox": {"l": 280.82812, "t": 162.53954999999996, "r": 295.30887, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "84-89", "bbox": {"l": 305.27301, "t": 162.53954999999996, "r": 324.98117, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "40-61", "bbox": {"l": 334.94284, "t": 162.53954999999996, "r": 354.651, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "86-92", "bbox": {"l": 364.61267, "t": 162.53954999999996, "r": 384.32083, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "94-99", "bbox": {"l": 398.45187, "t": 162.53954999999996, "r": 418.16003, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "95-99", "bbox": {"l": 428.1217, "t": 162.53954999999996, "r": 447.82986, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "69-78", "bbox": {"l": 457.80051, "t": 162.53954999999996, "r": 477.50867, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "n/a", "bbox": {"l": 495.32489, "t": 162.53954999999996, "r": 507.17846999999995, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Footnote", "bbox": {"l": 104.825, "t": 173.49854000000005, "r": 137.3282, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "6318", "bbox": {"l": 182.035, "t": 173.49854000000005, "r": 198.71251, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "0.60", "bbox": {"l": 219.211, "t": 173.49854000000005, "r": 233.69174000000004, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "0.31", "bbox": {"l": 250.01956, "t": 173.49854000000005, "r": 264.50031, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "0.58", "bbox": {"l": 280.82812, "t": 173.49854000000005, "r": 295.30887, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "83-91", "bbox": {"l": 305.27301, "t": 173.49854000000005, "r": 324.98117, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "n/a", "bbox": {"l": 342.79739, "t": 173.49854000000005, "r": 354.65097, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "100", "bbox": {"l": 371.81265, "t": 173.49854000000005, "r": 384.32077, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "62-88", "bbox": {"l": 398.45181, "t": 173.49854000000005, "r": 418.15997, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "85-94", "bbox": {"l": 428.12164, "t": 173.49854000000005, "r": 447.8298, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "n/a", "bbox": {"l": 465.655, "t": 173.49854000000005, "r": 477.50857999999994, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "82-97", "bbox": {"l": 487.47025, "t": 173.49854000000005, "r": 507.17841, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Formula", "bbox": {"l": 104.825, "t": 184.45752000000005, "r": 135.33766, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "25027", "bbox": {"l": 177.866, "t": 184.45752000000005, "r": 198.71288, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "2.25", "bbox": {"l": 219.211, "t": 184.45752000000005, "r": 233.69174000000004, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "1.90", "bbox": {"l": 250.01956, "t": 184.45752000000005, "r": 264.50031, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "2.96", "bbox": {"l": 280.82812, "t": 184.45752000000005, "r": 295.30887, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "83-85", "bbox": {"l": 305.27301, "t": 184.45752000000005, "r": 324.98117, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "n/a", "bbox": {"l": 342.79739, "t": 184.45752000000005, "r": 354.65097, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "n/a", "bbox": {"l": 372.46719, "t": 184.45752000000005, "r": 384.32077, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "84-87", "bbox": {"l": 398.45181, "t": 184.45752000000005, "r": 418.15997, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "86-96", "bbox": {"l": 428.12164, "t": 184.45752000000005, "r": 447.8298, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "n/a", "bbox": {"l": 465.655, "t": 184.45752000000005, "r": 477.50857999999994, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "n/a", "bbox": {"l": 495.3248, "t": 184.45752000000005, "r": 507.17838000000006, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "List-item", "bbox": {"l": 104.825, "t": 195.41656, "r": 137.70479, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "185660", "bbox": {"l": 173.69701, "t": 195.41656, "r": 198.71326, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "17.19", "bbox": {"l": 215.04201, "t": 195.41656, "r": 233.69212, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "13.34", "bbox": {"l": 245.85056, "t": 195.41656, "r": 264.50067, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "15.82", "bbox": {"l": 276.65912, "t": 195.41656, "r": 295.30923, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "87-88", "bbox": {"l": 305.27301, "t": 195.41656, "r": 324.98117, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "74-83", "bbox": {"l": 334.94284, "t": 195.41656, "r": 354.651, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "90-92", "bbox": {"l": 364.61267, "t": 195.41656, "r": 384.32083, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "97-97", "bbox": {"l": 398.45187, "t": 195.41656, "r": 418.16003, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "81-85", "bbox": {"l": 428.1217, "t": 195.41656, "r": 447.82986, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "75-88", "bbox": {"l": 457.80051, "t": 195.41656, "r": 477.50867, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "93-95", "bbox": {"l": 487.47034, "t": 195.41656, "r": 507.17849999999993, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "Page-footer", "bbox": {"l": 104.825, "t": 206.37554999999998, "r": 147.35262, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "70878", "bbox": {"l": 177.866, "t": 206.37554999999998, "r": 198.71288, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "6.51", "bbox": {"l": 219.211, "t": 206.37554999999998, "r": 233.69174000000004, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "5.58", "bbox": {"l": 250.01956, "t": 206.37554999999998, "r": 264.50031, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "6.00", "bbox": {"l": 280.82812, "t": 206.37554999999998, "r": 295.30887, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "93-94", "bbox": {"l": 305.27301, "t": 206.37554999999998, "r": 324.98117, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "88-90", "bbox": {"l": 334.94284, "t": 206.37554999999998, "r": 354.651, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "95-96", "bbox": {"l": 364.61267, "t": 206.37554999999998, "r": 384.32083, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "100", "bbox": {"l": 405.65189, "t": 206.37554999999998, "r": 418.16, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "92-97", "bbox": {"l": 428.12167, "t": 206.37554999999998, "r": 447.82983, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "100", "bbox": {"l": 465.00049, "t": 206.37554999999998, "r": 477.5086099999999, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "96-98", "bbox": {"l": 487.47028, "t": 206.37554999999998, "r": 507.17843999999997, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "Page-header", "bbox": {"l": 104.825, "t": 217.33452999999997, "r": 150.10532, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "58022", "bbox": {"l": 177.866, "t": 217.33452999999997, "r": 198.71288, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "5.10", "bbox": {"l": 219.211, "t": 217.33452999999997, "r": 233.69174000000004, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "6.70", "bbox": {"l": 250.01956, "t": 217.33452999999997, "r": 264.50031, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "5.06", "bbox": {"l": 280.82812, "t": 217.33452999999997, "r": 295.30887, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "85-89", "bbox": {"l": 305.27301, "t": 217.33452999999997, "r": 324.98117, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "66-76", "bbox": {"l": 334.94284, "t": 217.33452999999997, "r": 354.651, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "90-94", "bbox": {"l": 364.61267, "t": 217.33452999999997, "r": 384.32083, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "98-100", "bbox": {"l": 394.2825, "t": 217.33452999999997, "r": 418.16003, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "91-92", "bbox": {"l": 428.1217, "t": 217.33452999999997, "r": 447.82986, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "97-99", "bbox": {"l": 457.80051, "t": 217.33452999999997, "r": 477.50867, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "81-86", "bbox": {"l": 487.47034, "t": 217.33452999999997, "r": 507.17849999999993, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "Picture", "bbox": {"l": 104.825, "t": 228.29351999999994, "r": 130.80963, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "45976", "bbox": {"l": 177.866, "t": 228.29351999999994, "r": 198.71288, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "4.21", "bbox": {"l": 219.211, "t": 228.29351999999994, "r": 233.69174000000004, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "2.78", "bbox": {"l": 250.01956, "t": 228.29351999999994, "r": 264.50031, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "5.31", "bbox": {"l": 280.82812, "t": 228.29351999999994, "r": 295.30887, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "69-71", "bbox": {"l": 305.27301, "t": 228.29351999999994, "r": 324.98117, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "56-59", "bbox": {"l": 334.94284, "t": 228.29351999999994, "r": 354.651, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "82-86", "bbox": {"l": 364.61267, "t": 228.29351999999994, "r": 384.32083, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "69-82", "bbox": {"l": 398.45187, "t": 228.29351999999994, "r": 418.16003, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "80-95", "bbox": {"l": 428.1217, "t": 228.29351999999994, "r": 447.82986, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "66-71", "bbox": {"l": 457.80051, "t": 228.29351999999994, "r": 477.50867, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "59-76", "bbox": {"l": 487.47034, "t": 228.29351999999994, "r": 507.17849999999993, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "Section-header", "bbox": {"l": 104.825, "t": 239.25256000000002, "r": 159.56487, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "142884", "bbox": {"l": 173.69701, "t": 239.25256000000002, "r": 198.71326, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "12.60", "bbox": {"l": 215.04201, "t": 239.25256000000002, "r": 233.69212, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "15.77", "bbox": {"l": 245.85056, "t": 239.25256000000002, "r": 264.50067, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "12.85", "bbox": {"l": 276.65912, "t": 239.25256000000002, "r": 295.30923, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "83-84", "bbox": {"l": 305.27301, "t": 239.25256000000002, "r": 324.98117, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "76-81", "bbox": {"l": 334.94284, "t": 239.25256000000002, "r": 354.651, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "90-92", "bbox": {"l": 364.61267, "t": 239.25256000000002, "r": 384.32083, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "94-95", "bbox": {"l": 398.45187, "t": 239.25256000000002, "r": 418.16003, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "87-94", "bbox": {"l": 428.1217, "t": 239.25256000000002, "r": 447.82986, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "69-73", "bbox": {"l": 457.80051, "t": 239.25256000000002, "r": 477.50867, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "78-86", "bbox": {"l": 487.47034, "t": 239.25256000000002, "r": 507.17849999999993, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "Table", "bbox": {"l": 104.825, "t": 250.21155, "r": 124.63177, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "34733", "bbox": {"l": 177.866, "t": 250.21155, "r": 198.71288, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "3.20", "bbox": {"l": 219.211, "t": 250.21155, "r": 233.69174000000004, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "2.27", "bbox": {"l": 250.01956, "t": 250.21155, "r": 264.50031, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "3.60", "bbox": {"l": 280.82812, "t": 250.21155, "r": 295.30887, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "77-81", "bbox": {"l": 305.27301, "t": 250.21155, "r": 324.98117, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "75-80", "bbox": {"l": 334.94284, "t": 250.21155, "r": 354.651, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "83-86", "bbox": {"l": 364.61267, "t": 250.21155, "r": 384.32083, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "98-99", "bbox": {"l": 398.45187, "t": 250.21155, "r": 418.16003, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "58-80", "bbox": {"l": 428.1217, "t": 250.21155, "r": 447.82986, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "79-84", "bbox": {"l": 457.80051, "t": 250.21155, "r": 477.50867, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "70-85", "bbox": {"l": 487.47034, "t": 250.21155, "r": 507.17849999999993, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "Text", "bbox": {"l": 104.825, "t": 261.16956000000005, "r": 120.78519, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "510377", "bbox": {"l": 173.69701, "t": 261.16956000000005, "r": 198.71326, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "45.82", "bbox": {"l": 215.04201, "t": 261.16956000000005, "r": 233.69212, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "49.28", "bbox": {"l": 245.85056, "t": 261.16956000000005, "r": 264.50067, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "45.00", "bbox": {"l": 276.65912, "t": 261.16956000000005, "r": 295.30923, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "84-86", "bbox": {"l": 305.27301, "t": 261.16956000000005, "r": 324.98117, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "81-86", "bbox": {"l": 334.94284, "t": 261.16956000000005, "r": 354.651, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "88-93", "bbox": {"l": 364.61267, "t": 261.16956000000005, "r": 384.32083, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "89-93", "bbox": {"l": 398.45187, "t": 261.16956000000005, "r": 418.16003, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "87-92", "bbox": {"l": 428.1217, "t": 261.16956000000005, "r": 447.82986, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "71-79", "bbox": {"l": 457.80051, "t": 261.16956000000005, "r": 477.50867, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "87-95", "bbox": {"l": 487.47034, "t": 261.16956000000005, "r": 507.17849999999993, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "Title", "bbox": {"l": 104.825, "t": 272.12854000000004, "r": 121.81633, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "5071", "bbox": {"l": 182.035, "t": 272.12854000000004, "r": 198.71251, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "0.47", "bbox": {"l": 219.211, "t": 272.12854000000004, "r": 233.69174000000004, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "0.30", "bbox": {"l": 250.01956, "t": 272.12854000000004, "r": 264.50031, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "0.50", "bbox": {"l": 280.82812, "t": 272.12854000000004, "r": 295.30887, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "60-72", "bbox": {"l": 305.27301, "t": 272.12854000000004, "r": 324.98117, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "24-63", "bbox": {"l": 334.94284, "t": 272.12854000000004, "r": 354.651, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "50-63", "bbox": {"l": 364.61267, "t": 272.12854000000004, "r": 384.32083, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "94-100", "bbox": {"l": 394.2825, "t": 272.12854000000004, "r": 418.16003, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "82-96", "bbox": {"l": 428.1217, "t": 272.12854000000004, "r": 447.82986, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "68-79", "bbox": {"l": 457.80051, "t": 272.12854000000004, "r": 477.50867, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "24-56", "bbox": {"l": 487.47034, "t": 272.12854000000004, "r": 507.17849999999993, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "Total", "bbox": {"l": 104.825, "t": 283.48654, "r": 123.43028, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "1107470", "bbox": {"l": 169.52699, "t": 283.48654, "r": 198.71263, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "941123", "bbox": {"l": 208.675, "t": 283.48654, "r": 233.69124999999997, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "99816", "bbox": {"l": 243.65291999999997, "t": 283.48654, "r": 264.49982, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "66531", "bbox": {"l": 274.46149, "t": 283.48654, "r": 295.30838, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "82-83", "bbox": {"l": 305.27301, "t": 283.48654, "r": 324.98117, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "71-74", "bbox": {"l": 334.94284, "t": 283.48654, "r": 354.651, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "79-81", "bbox": {"l": 364.61267, "t": 283.48654, "r": 384.32083, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "89-94", "bbox": {"l": 398.45187, "t": 283.48654, "r": 418.16003, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "86-91", "bbox": {"l": 428.1217, "t": 283.48654, "r": 447.82986, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "71-76", "bbox": {"l": 457.80051, "t": 283.48654, "r": 477.50867, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "68-85", "bbox": {"l": 487.47034, "t": 283.48654, "r": 507.17849999999993, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": [{"id": 11, "label": "text", "bbox": {"l": 233.94400000000002, "t": 140.22351000000003, "r": 270.04272, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 5, "text": "% of Total", "bbox": {"l": 233.94400000000002, "t": 140.22351000000003, "r": 270.04272, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 329.04999, "t": 140.22351000000003, "r": 483.3976400000001, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": "triple inter-annotator mAP @ 0.5-0.95 (%)", "bbox": {"l": 329.04999, "t": 140.22351000000003, "r": 483.3976400000001, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 104.825, "t": 151.18255999999997, "r": 141.71277, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "class label", "bbox": {"l": 104.825, "t": 151.18255999999997, "r": 141.71277, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 175.94701, "t": 151.18255999999997, "r": 198.71269, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "Count", "bbox": {"l": 175.94701, "t": 151.18255999999997, "r": 198.71269, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 213.795, "t": 151.18255999999997, "r": 233.69144, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "Train", "bbox": {"l": 213.795, "t": 151.18255999999997, "r": 233.69144, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 249.37367, "t": 151.18255999999997, "r": 264.5, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "Test", "bbox": {"l": 249.37367, "t": 151.18255999999997, "r": 264.5, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 283.53568, "t": 151.18255999999997, "r": 295.30856, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "Val", "bbox": {"l": 283.53568, "t": 151.18255999999997, "r": 295.30856, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 314.01501, "t": 151.18255999999997, "r": 324.98093, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "All", "bbox": {"l": 314.01501, "t": 151.18255999999997, "r": 324.98093, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 343.01236, "t": 151.18255999999997, "r": 354.65076, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "Fin", "bbox": {"l": 343.01236, "t": 151.18255999999997, "r": 354.65076, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 367.84033, "t": 151.18255999999997, "r": 384.32059, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "Man", "bbox": {"l": 367.84033, "t": 151.18255999999997, "r": 384.32059, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 407.54358, "t": 151.18255999999997, "r": 418.15979, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "Sci", "bbox": {"l": 407.54358, "t": 151.18255999999997, "r": 418.15979, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 432.29979999999995, "t": 151.18255999999997, "r": 447.82962, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "Law", "bbox": {"l": 432.29979999999995, "t": 151.18255999999997, "r": 447.82962, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 465.72656, "t": 151.18255999999997, "r": 477.50842, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "Pat", "bbox": {"l": 465.72656, "t": 151.18255999999997, "r": 477.50842, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 493.52240000000006, "t": 151.18255999999997, "r": 507.17822, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "Ten", "bbox": {"l": 493.52240000000006, "t": 151.18255999999997, "r": 507.17822, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 104.825, "t": 162.53954999999996, "r": 134.01064, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "Caption", "bbox": {"l": 104.825, "t": 162.53954999999996, "r": 134.01064, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 177.866, "t": 162.53954999999996, "r": 198.71288, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "22524", "bbox": {"l": 177.866, "t": 162.53954999999996, "r": 198.71288, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 219.211, "t": 162.53954999999996, "r": 233.69174000000004, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "2.04", "bbox": {"l": 219.211, "t": 162.53954999999996, "r": 233.69174000000004, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 250.01956, "t": 162.53954999999996, "r": 264.50031, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "1.77", "bbox": {"l": 250.01956, "t": 162.53954999999996, "r": 264.50031, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 280.82812, "t": 162.53954999999996, "r": 295.30887, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "2.32", "bbox": {"l": 280.82812, "t": 162.53954999999996, "r": 295.30887, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 305.27301, "t": 162.53954999999996, "r": 324.98117, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "84-89", "bbox": {"l": 305.27301, "t": 162.53954999999996, "r": 324.98117, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 334.94284, "t": 162.53954999999996, "r": 354.651, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "40-61", "bbox": {"l": 334.94284, "t": 162.53954999999996, "r": 354.651, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 364.61267, "t": 162.53954999999996, "r": 384.32083, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "86-92", "bbox": {"l": 364.61267, "t": 162.53954999999996, "r": 384.32083, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 398.45187, "t": 162.53954999999996, "r": 418.16003, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "94-99", "bbox": {"l": 398.45187, "t": 162.53954999999996, "r": 418.16003, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 428.1217, "t": 162.53954999999996, "r": 447.82986, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "95-99", "bbox": {"l": 428.1217, "t": 162.53954999999996, "r": 447.82986, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 457.80051, "t": 162.53954999999996, "r": 477.50867, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "69-78", "bbox": {"l": 457.80051, "t": 162.53954999999996, "r": 477.50867, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 495.32489, "t": 162.53954999999996, "r": 507.17846999999995, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "n/a", "bbox": {"l": 495.32489, "t": 162.53954999999996, "r": 507.17846999999995, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 104.825, "t": 173.49854000000005, "r": 137.3282, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "Footnote", "bbox": {"l": 104.825, "t": 173.49854000000005, "r": 137.3282, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 182.035, "t": 173.49854000000005, "r": 198.71251, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "6318", "bbox": {"l": 182.035, "t": 173.49854000000005, "r": 198.71251, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 219.211, "t": 173.49854000000005, "r": 233.69174000000004, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "0.60", "bbox": {"l": 219.211, "t": 173.49854000000005, "r": 233.69174000000004, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 250.01956, "t": 173.49854000000005, "r": 264.50031, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "0.31", "bbox": {"l": 250.01956, "t": 173.49854000000005, "r": 264.50031, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 280.82812, "t": 173.49854000000005, "r": 295.30887, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "0.58", "bbox": {"l": 280.82812, "t": 173.49854000000005, "r": 295.30887, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 305.27301, "t": 173.49854000000005, "r": 324.98117, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "83-91", "bbox": {"l": 305.27301, "t": 173.49854000000005, "r": 324.98117, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 342.79739, "t": 173.49854000000005, "r": 354.65097, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "n/a", "bbox": {"l": 342.79739, "t": 173.49854000000005, "r": 354.65097, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 371.81265, "t": 173.49854000000005, "r": 384.32077, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "100", "bbox": {"l": 371.81265, "t": 173.49854000000005, "r": 384.32077, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 398.45181, "t": 173.49854000000005, "r": 418.15997, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "62-88", "bbox": {"l": 398.45181, "t": 173.49854000000005, "r": 418.15997, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 428.12164, "t": 173.49854000000005, "r": 447.8298, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "85-94", "bbox": {"l": 428.12164, "t": 173.49854000000005, "r": 447.8298, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 465.655, "t": 173.49854000000005, "r": 477.50857999999994, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "n/a", "bbox": {"l": 465.655, "t": 173.49854000000005, "r": 477.50857999999994, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 487.47025, "t": 173.49854000000005, "r": 507.17841, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "82-97", "bbox": {"l": 487.47025, "t": 173.49854000000005, "r": 507.17841, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 104.825, "t": 184.45752000000005, "r": 135.33766, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "Formula", "bbox": {"l": 104.825, "t": 184.45752000000005, "r": 135.33766, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 177.866, "t": 184.45752000000005, "r": 198.71288, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "25027", "bbox": {"l": 177.866, "t": 184.45752000000005, "r": 198.71288, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 219.211, "t": 184.45752000000005, "r": 233.69174000000004, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "2.25", "bbox": {"l": 219.211, "t": 184.45752000000005, "r": 233.69174000000004, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 250.01956, "t": 184.45752000000005, "r": 264.50031, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "1.90", "bbox": {"l": 250.01956, "t": 184.45752000000005, "r": 264.50031, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 280.82812, "t": 184.45752000000005, "r": 295.30887, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "2.96", "bbox": {"l": 280.82812, "t": 184.45752000000005, "r": 295.30887, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 305.27301, "t": 184.45752000000005, "r": 324.98117, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "83-85", "bbox": {"l": 305.27301, "t": 184.45752000000005, "r": 324.98117, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 342.79739, "t": 184.45752000000005, "r": 354.65097, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "n/a", "bbox": {"l": 342.79739, "t": 184.45752000000005, "r": 354.65097, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 372.46719, "t": 184.45752000000005, "r": 384.32077, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "n/a", "bbox": {"l": 372.46719, "t": 184.45752000000005, "r": 384.32077, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 398.45181, "t": 184.45752000000005, "r": 418.15997, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "84-87", "bbox": {"l": 398.45181, "t": 184.45752000000005, "r": 418.15997, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 428.12164, "t": 184.45752000000005, "r": 447.8298, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "86-96", "bbox": {"l": 428.12164, "t": 184.45752000000005, "r": 447.8298, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 465.655, "t": 184.45752000000005, "r": 477.50857999999994, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "n/a", "bbox": {"l": 465.655, "t": 184.45752000000005, "r": 477.50857999999994, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 495.3248, "t": 184.45752000000005, "r": 507.17838000000006, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "n/a", "bbox": {"l": 495.3248, "t": 184.45752000000005, "r": 507.17838000000006, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 104.825, "t": 195.41656, "r": 137.70479, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "List-item", "bbox": {"l": 104.825, "t": 195.41656, "r": 137.70479, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 173.69701, "t": 195.41656, "r": 198.71326, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "185660", "bbox": {"l": 173.69701, "t": 195.41656, "r": 198.71326, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 215.04201, "t": 195.41656, "r": 233.69212, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "17.19", "bbox": {"l": 215.04201, "t": 195.41656, "r": 233.69212, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 245.85056, "t": 195.41656, "r": 264.50067, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "13.34", "bbox": {"l": 245.85056, "t": 195.41656, "r": 264.50067, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 276.65912, "t": 195.41656, "r": 295.30923, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "15.82", "bbox": {"l": 276.65912, "t": 195.41656, "r": 295.30923, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 305.27301, "t": 195.41656, "r": 324.98117, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "87-88", "bbox": {"l": 305.27301, "t": 195.41656, "r": 324.98117, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 334.94284, "t": 195.41656, "r": 354.651, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "74-83", "bbox": {"l": 334.94284, "t": 195.41656, "r": 354.651, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 364.61267, "t": 195.41656, "r": 384.32083, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "90-92", "bbox": {"l": 364.61267, "t": 195.41656, "r": 384.32083, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 398.45187, "t": 195.41656, "r": 418.16003, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "97-97", "bbox": {"l": 398.45187, "t": 195.41656, "r": 418.16003, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 428.1217, "t": 195.41656, "r": 447.82986, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "81-85", "bbox": {"l": 428.1217, "t": 195.41656, "r": 447.82986, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 457.80051, "t": 195.41656, "r": 477.50867, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "75-88", "bbox": {"l": 457.80051, "t": 195.41656, "r": 477.50867, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 487.47034, "t": 195.41656, "r": 507.17849999999993, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "93-95", "bbox": {"l": 487.47034, "t": 195.41656, "r": 507.17849999999993, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 104.825, "t": 206.37554999999998, "r": 147.35262, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "Page-footer", "bbox": {"l": 104.825, "t": 206.37554999999998, "r": 147.35262, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 177.866, "t": 206.37554999999998, "r": 198.71288, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "70878", "bbox": {"l": 177.866, "t": 206.37554999999998, "r": 198.71288, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 219.211, "t": 206.37554999999998, "r": 233.69174000000004, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "6.51", "bbox": {"l": 219.211, "t": 206.37554999999998, "r": 233.69174000000004, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 250.01956, "t": 206.37554999999998, "r": 264.50031, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "5.58", "bbox": {"l": 250.01956, "t": 206.37554999999998, "r": 264.50031, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 280.82812, "t": 206.37554999999998, "r": 295.30887, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "6.00", "bbox": {"l": 280.82812, "t": 206.37554999999998, "r": 295.30887, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 305.27301, "t": 206.37554999999998, "r": 324.98117, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "93-94", "bbox": {"l": 305.27301, "t": 206.37554999999998, "r": 324.98117, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 334.94284, "t": 206.37554999999998, "r": 354.651, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "88-90", "bbox": {"l": 334.94284, "t": 206.37554999999998, "r": 354.651, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 364.61267, "t": 206.37554999999998, "r": 384.32083, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "95-96", "bbox": {"l": 364.61267, "t": 206.37554999999998, "r": 384.32083, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 405.65189, "t": 206.37554999999998, "r": 418.16, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "100", "bbox": {"l": 405.65189, "t": 206.37554999999998, "r": 418.16, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 428.12167, "t": 206.37554999999998, "r": 447.82983, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "92-97", "bbox": {"l": 428.12167, "t": 206.37554999999998, "r": 447.82983, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 465.00049, "t": 206.37554999999998, "r": 477.5086099999999, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "100", "bbox": {"l": 465.00049, "t": 206.37554999999998, "r": 477.5086099999999, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 487.47028, "t": 206.37554999999998, "r": 507.17843999999997, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "96-98", "bbox": {"l": 487.47028, "t": 206.37554999999998, "r": 507.17843999999997, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 104.825, "t": 217.33452999999997, "r": 150.10532, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "Page-header", "bbox": {"l": 104.825, "t": 217.33452999999997, "r": 150.10532, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 177.866, "t": 217.33452999999997, "r": 198.71288, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "58022", "bbox": {"l": 177.866, "t": 217.33452999999997, "r": 198.71288, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 219.211, "t": 217.33452999999997, "r": 233.69174000000004, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "5.10", "bbox": {"l": 219.211, "t": 217.33452999999997, "r": 233.69174000000004, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 250.01956, "t": 217.33452999999997, "r": 264.50031, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "6.70", "bbox": {"l": 250.01956, "t": 217.33452999999997, "r": 264.50031, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 280.82812, "t": 217.33452999999997, "r": 295.30887, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "5.06", "bbox": {"l": 280.82812, "t": 217.33452999999997, "r": 295.30887, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 305.27301, "t": 217.33452999999997, "r": 324.98117, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "85-89", "bbox": {"l": 305.27301, "t": 217.33452999999997, "r": 324.98117, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 334.94284, "t": 217.33452999999997, "r": 354.651, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "66-76", "bbox": {"l": 334.94284, "t": 217.33452999999997, "r": 354.651, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 364.61267, "t": 217.33452999999997, "r": 384.32083, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "90-94", "bbox": {"l": 364.61267, "t": 217.33452999999997, "r": 384.32083, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 394.2825, "t": 217.33452999999997, "r": 418.16003, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "98-100", "bbox": {"l": 394.2825, "t": 217.33452999999997, "r": 418.16003, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 428.1217, "t": 217.33452999999997, "r": 447.82986, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "91-92", "bbox": {"l": 428.1217, "t": 217.33452999999997, "r": 447.82986, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 457.80051, "t": 217.33452999999997, "r": 477.50867, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "97-99", "bbox": {"l": 457.80051, "t": 217.33452999999997, "r": 477.50867, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 487.47034, "t": 217.33452999999997, "r": 507.17849999999993, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "81-86", "bbox": {"l": 487.47034, "t": 217.33452999999997, "r": 507.17849999999993, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 104.825, "t": 228.29351999999994, "r": 130.80963, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "Picture", "bbox": {"l": 104.825, "t": 228.29351999999994, "r": 130.80963, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 177.866, "t": 228.29351999999994, "r": 198.71288, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "45976", "bbox": {"l": 177.866, "t": 228.29351999999994, "r": 198.71288, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 219.211, "t": 228.29351999999994, "r": 233.69174000000004, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "4.21", "bbox": {"l": 219.211, "t": 228.29351999999994, "r": 233.69174000000004, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 250.01956, "t": 228.29351999999994, "r": 264.50031, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "2.78", "bbox": {"l": 250.01956, "t": 228.29351999999994, "r": 264.50031, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 280.82812, "t": 228.29351999999994, "r": 295.30887, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "5.31", "bbox": {"l": 280.82812, "t": 228.29351999999994, "r": 295.30887, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 305.27301, "t": 228.29351999999994, "r": 324.98117, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "69-71", "bbox": {"l": 305.27301, "t": 228.29351999999994, "r": 324.98117, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 334.94284, "t": 228.29351999999994, "r": 354.651, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "56-59", "bbox": {"l": 334.94284, "t": 228.29351999999994, "r": 354.651, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 364.61267, "t": 228.29351999999994, "r": 384.32083, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "82-86", "bbox": {"l": 364.61267, "t": 228.29351999999994, "r": 384.32083, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 398.45187, "t": 228.29351999999994, "r": 418.16003, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "69-82", "bbox": {"l": 398.45187, "t": 228.29351999999994, "r": 418.16003, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 428.1217, "t": 228.29351999999994, "r": 447.82986, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "80-95", "bbox": {"l": 428.1217, "t": 228.29351999999994, "r": 447.82986, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 457.80051, "t": 228.29351999999994, "r": 477.50867, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "66-71", "bbox": {"l": 457.80051, "t": 228.29351999999994, "r": 477.50867, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 487.47034, "t": 228.29351999999994, "r": 507.17849999999993, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "59-76", "bbox": {"l": 487.47034, "t": 228.29351999999994, "r": 507.17849999999993, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 104.825, "t": 239.25256000000002, "r": 159.56487, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": "Section-header", "bbox": {"l": 104.825, "t": 239.25256000000002, "r": 159.56487, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 173.69701, "t": 239.25256000000002, "r": 198.71326, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "142884", "bbox": {"l": 173.69701, "t": 239.25256000000002, "r": 198.71326, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 215.04201, "t": 239.25256000000002, "r": 233.69212, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "12.60", "bbox": {"l": 215.04201, "t": 239.25256000000002, "r": 233.69212, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 245.85056, "t": 239.25256000000002, "r": 264.50067, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": "15.77", "bbox": {"l": 245.85056, "t": 239.25256000000002, "r": 264.50067, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 276.65912, "t": 239.25256000000002, "r": 295.30923, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 107, "text": "12.85", "bbox": {"l": 276.65912, "t": 239.25256000000002, "r": 295.30923, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 114, "label": "text", "bbox": {"l": 305.27301, "t": 239.25256000000002, "r": 324.98117, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 108, "text": "83-84", "bbox": {"l": 305.27301, "t": 239.25256000000002, "r": 324.98117, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 115, "label": "text", "bbox": {"l": 334.94284, "t": 239.25256000000002, "r": 354.651, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 109, "text": "76-81", "bbox": {"l": 334.94284, "t": 239.25256000000002, "r": 354.651, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 116, "label": "text", "bbox": {"l": 364.61267, "t": 239.25256000000002, "r": 384.32083, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 110, "text": "90-92", "bbox": {"l": 364.61267, "t": 239.25256000000002, "r": 384.32083, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 117, "label": "text", "bbox": {"l": 398.45187, "t": 239.25256000000002, "r": 418.16003, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 111, "text": "94-95", "bbox": {"l": 398.45187, "t": 239.25256000000002, "r": 418.16003, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 118, "label": "text", "bbox": {"l": 428.1217, "t": 239.25256000000002, "r": 447.82986, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 112, "text": "87-94", "bbox": {"l": 428.1217, "t": 239.25256000000002, "r": 447.82986, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 119, "label": "text", "bbox": {"l": 457.80051, "t": 239.25256000000002, "r": 477.50867, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 113, "text": "69-73", "bbox": {"l": 457.80051, "t": 239.25256000000002, "r": 477.50867, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 120, "label": "text", "bbox": {"l": 487.47034, "t": 239.25256000000002, "r": 507.17849999999993, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 114, "text": "78-86", "bbox": {"l": 487.47034, "t": 239.25256000000002, "r": 507.17849999999993, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 121, "label": "text", "bbox": {"l": 104.825, "t": 250.21155, "r": 124.63177, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 115, "text": "Table", "bbox": {"l": 104.825, "t": 250.21155, "r": 124.63177, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 122, "label": "text", "bbox": {"l": 177.866, "t": 250.21155, "r": 198.71288, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 116, "text": "34733", "bbox": {"l": 177.866, "t": 250.21155, "r": 198.71288, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 123, "label": "text", "bbox": {"l": 219.211, "t": 250.21155, "r": 233.69174000000004, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 117, "text": "3.20", "bbox": {"l": 219.211, "t": 250.21155, "r": 233.69174000000004, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 124, "label": "text", "bbox": {"l": 250.01956, "t": 250.21155, "r": 264.50031, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 118, "text": "2.27", "bbox": {"l": 250.01956, "t": 250.21155, "r": 264.50031, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 125, "label": "text", "bbox": {"l": 280.82812, "t": 250.21155, "r": 295.30887, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 119, "text": "3.60", "bbox": {"l": 280.82812, "t": 250.21155, "r": 295.30887, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 126, "label": "text", "bbox": {"l": 305.27301, "t": 250.21155, "r": 324.98117, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 120, "text": "77-81", "bbox": {"l": 305.27301, "t": 250.21155, "r": 324.98117, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 127, "label": "text", "bbox": {"l": 334.94284, "t": 250.21155, "r": 354.651, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 121, "text": "75-80", "bbox": {"l": 334.94284, "t": 250.21155, "r": 354.651, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 128, "label": "text", "bbox": {"l": 364.61267, "t": 250.21155, "r": 384.32083, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 122, "text": "83-86", "bbox": {"l": 364.61267, "t": 250.21155, "r": 384.32083, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 129, "label": "text", "bbox": {"l": 398.45187, "t": 250.21155, "r": 418.16003, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 123, "text": "98-99", "bbox": {"l": 398.45187, "t": 250.21155, "r": 418.16003, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 130, "label": "text", "bbox": {"l": 428.1217, "t": 250.21155, "r": 447.82986, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 124, "text": "58-80", "bbox": {"l": 428.1217, "t": 250.21155, "r": 447.82986, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 131, "label": "text", "bbox": {"l": 457.80051, "t": 250.21155, "r": 477.50867, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 125, "text": "79-84", "bbox": {"l": 457.80051, "t": 250.21155, "r": 477.50867, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 132, "label": "text", "bbox": {"l": 487.47034, "t": 250.21155, "r": 507.17849999999993, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 126, "text": "70-85", "bbox": {"l": 487.47034, "t": 250.21155, "r": 507.17849999999993, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 133, "label": "text", "bbox": {"l": 104.825, "t": 261.16956000000005, "r": 120.78519, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 127, "text": "Text", "bbox": {"l": 104.825, "t": 261.16956000000005, "r": 120.78519, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 134, "label": "text", "bbox": {"l": 173.69701, "t": 261.16956000000005, "r": 198.71326, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 128, "text": "510377", "bbox": {"l": 173.69701, "t": 261.16956000000005, "r": 198.71326, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 135, "label": "text", "bbox": {"l": 215.04201, "t": 261.16956000000005, "r": 233.69212, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 129, "text": "45.82", "bbox": {"l": 215.04201, "t": 261.16956000000005, "r": 233.69212, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 136, "label": "text", "bbox": {"l": 245.85056, "t": 261.16956000000005, "r": 264.50067, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 130, "text": "49.28", "bbox": {"l": 245.85056, "t": 261.16956000000005, "r": 264.50067, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 137, "label": "text", "bbox": {"l": 276.65912, "t": 261.16956000000005, "r": 295.30923, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 131, "text": "45.00", "bbox": {"l": 276.65912, "t": 261.16956000000005, "r": 295.30923, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 138, "label": "text", "bbox": {"l": 305.27301, "t": 261.16956000000005, "r": 324.98117, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 132, "text": "84-86", "bbox": {"l": 305.27301, "t": 261.16956000000005, "r": 324.98117, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 139, "label": "text", "bbox": {"l": 334.94284, "t": 261.16956000000005, "r": 354.651, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 133, "text": "81-86", "bbox": {"l": 334.94284, "t": 261.16956000000005, "r": 354.651, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 140, "label": "text", "bbox": {"l": 364.61267, "t": 261.16956000000005, "r": 384.32083, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 134, "text": "88-93", "bbox": {"l": 364.61267, "t": 261.16956000000005, "r": 384.32083, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 141, "label": "text", "bbox": {"l": 398.45187, "t": 261.16956000000005, "r": 418.16003, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 135, "text": "89-93", "bbox": {"l": 398.45187, "t": 261.16956000000005, "r": 418.16003, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 142, "label": "text", "bbox": {"l": 428.1217, "t": 261.16956000000005, "r": 447.82986, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 136, "text": "87-92", "bbox": {"l": 428.1217, "t": 261.16956000000005, "r": 447.82986, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 143, "label": "text", "bbox": {"l": 457.80051, "t": 261.16956000000005, "r": 477.50867, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 137, "text": "71-79", "bbox": {"l": 457.80051, "t": 261.16956000000005, "r": 477.50867, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 144, "label": "text", "bbox": {"l": 487.47034, "t": 261.16956000000005, "r": 507.17849999999993, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 138, "text": "87-95", "bbox": {"l": 487.47034, "t": 261.16956000000005, "r": 507.17849999999993, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 145, "label": "text", "bbox": {"l": 104.825, "t": 272.12854000000004, "r": 121.81633, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 139, "text": "Title", "bbox": {"l": 104.825, "t": 272.12854000000004, "r": 121.81633, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 146, "label": "text", "bbox": {"l": 182.035, "t": 272.12854000000004, "r": 198.71251, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 140, "text": "5071", "bbox": {"l": 182.035, "t": 272.12854000000004, "r": 198.71251, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 147, "label": "text", "bbox": {"l": 219.211, "t": 272.12854000000004, "r": 233.69174000000004, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 141, "text": "0.47", "bbox": {"l": 219.211, "t": 272.12854000000004, "r": 233.69174000000004, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 148, "label": "text", "bbox": {"l": 250.01956, "t": 272.12854000000004, "r": 264.50031, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 142, "text": "0.30", "bbox": {"l": 250.01956, "t": 272.12854000000004, "r": 264.50031, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 149, "label": "text", "bbox": {"l": 280.82812, "t": 272.12854000000004, "r": 295.30887, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 143, "text": "0.50", "bbox": {"l": 280.82812, "t": 272.12854000000004, "r": 295.30887, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 150, "label": "text", "bbox": {"l": 305.27301, "t": 272.12854000000004, "r": 324.98117, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 144, "text": "60-72", "bbox": {"l": 305.27301, "t": 272.12854000000004, "r": 324.98117, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 151, "label": "text", "bbox": {"l": 334.94284, "t": 272.12854000000004, "r": 354.651, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 145, "text": "24-63", "bbox": {"l": 334.94284, "t": 272.12854000000004, "r": 354.651, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 152, "label": "text", "bbox": {"l": 364.61267, "t": 272.12854000000004, "r": 384.32083, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 146, "text": "50-63", "bbox": {"l": 364.61267, "t": 272.12854000000004, "r": 384.32083, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 153, "label": "text", "bbox": {"l": 394.2825, "t": 272.12854000000004, "r": 418.16003, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 147, "text": "94-100", "bbox": {"l": 394.2825, "t": 272.12854000000004, "r": 418.16003, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 154, "label": "text", "bbox": {"l": 428.1217, "t": 272.12854000000004, "r": 447.82986, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 148, "text": "82-96", "bbox": {"l": 428.1217, "t": 272.12854000000004, "r": 447.82986, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 155, "label": "text", "bbox": {"l": 457.80051, "t": 272.12854000000004, "r": 477.50867, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 149, "text": "68-79", "bbox": {"l": 457.80051, "t": 272.12854000000004, "r": 477.50867, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 156, "label": "text", "bbox": {"l": 487.47034, "t": 272.12854000000004, "r": 507.17849999999993, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 150, "text": "24-56", "bbox": {"l": 487.47034, "t": 272.12854000000004, "r": 507.17849999999993, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 157, "label": "text", "bbox": {"l": 104.825, "t": 283.48654, "r": 123.43028, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 151, "text": "Total", "bbox": {"l": 104.825, "t": 283.48654, "r": 123.43028, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 158, "label": "text", "bbox": {"l": 169.52699, "t": 283.48654, "r": 198.71263, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 152, "text": "1107470", "bbox": {"l": 169.52699, "t": 283.48654, "r": 198.71263, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 159, "label": "text", "bbox": {"l": 208.675, "t": 283.48654, "r": 233.69124999999997, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 153, "text": "941123", "bbox": {"l": 208.675, "t": 283.48654, "r": 233.69124999999997, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 160, "label": "text", "bbox": {"l": 243.65291999999997, "t": 283.48654, "r": 264.49982, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 154, "text": "99816", "bbox": {"l": 243.65291999999997, "t": 283.48654, "r": 264.49982, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 161, "label": "text", "bbox": {"l": 274.46149, "t": 283.48654, "r": 295.30838, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 155, "text": "66531", "bbox": {"l": 274.46149, "t": 283.48654, "r": 295.30838, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 162, "label": "text", "bbox": {"l": 305.27301, "t": 283.48654, "r": 324.98117, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 156, "text": "82-83", "bbox": {"l": 305.27301, "t": 283.48654, "r": 324.98117, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 163, "label": "text", "bbox": {"l": 334.94284, "t": 283.48654, "r": 354.651, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 157, "text": "71-74", "bbox": {"l": 334.94284, "t": 283.48654, "r": 354.651, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 164, "label": "text", "bbox": {"l": 364.61267, "t": 283.48654, "r": 384.32083, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 158, "text": "79-81", "bbox": {"l": 364.61267, "t": 283.48654, "r": 384.32083, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 165, "label": "text", "bbox": {"l": 398.45187, "t": 283.48654, "r": 418.16003, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 159, "text": "89-94", "bbox": {"l": 398.45187, "t": 283.48654, "r": 418.16003, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 166, "label": "text", "bbox": {"l": 428.1217, "t": 283.48654, "r": 447.82986, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 160, "text": "86-91", "bbox": {"l": 428.1217, "t": 283.48654, "r": 447.82986, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 167, "label": "text", "bbox": {"l": 457.80051, "t": 283.48654, "r": 477.50867, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 161, "text": "71-76", "bbox": {"l": 457.80051, "t": 283.48654, "r": 477.50867, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 168, "label": "text", "bbox": {"l": 487.47034, "t": 283.48654, "r": 507.17849999999993, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 162, "text": "68-85", "bbox": {"l": 487.47034, "t": 283.48654, "r": 507.17849999999993, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "lcel", "lcel", "lcel", "ched", "lcel", "lcel", "lcel", "lcel", "lcel", "nl", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 14, "num_cols": 12, "table_cells": [{"bbox": {"l": 233.94400000000002, "t": 140.22351000000003, "r": 270.04272, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 4, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 6, "text": "% of Total", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 329.04999, "t": 140.22351000000003, "r": 483.3976400000001, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 6, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 6, "end_col_offset_idx": 12, "text": "triple inter-annotator mAP @ 0.5-0.95 (%)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 151.18255999999997, "r": 141.71277, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "class label", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 175.94701, "t": 151.18255999999997, "r": 198.71269, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Count", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 213.795, "t": 151.18255999999997, "r": 233.69144, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Train", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 249.37367, "t": 151.18255999999997, "r": 264.5, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Test", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 283.53568, "t": 151.18255999999997, "r": 295.30856, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Val", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 314.01501, "t": 151.18255999999997, "r": 324.98093, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "All", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 343.01236, "t": 151.18255999999997, "r": 354.65076, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "Fin", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 367.84033, "t": 151.18255999999997, "r": 384.32059, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "Man", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 407.54358, "t": 151.18255999999997, "r": 418.15979, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "Sci", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 432.29979999999995, "t": 151.18255999999997, "r": 447.82962, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "Law", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 465.72656, "t": 151.18255999999997, "r": 477.50842, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "Pat", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 493.52240000000006, "t": 151.18255999999997, "r": 507.17822, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "Ten", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 162.53954999999996, "r": 134.01064, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Caption", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 177.866, "t": 162.53954999999996, "r": 198.71288, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "22524", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 162.53954999999996, "r": 233.69174000000004, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "2.04", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 162.53954999999996, "r": 264.50031, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "1.77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 162.53954999999996, "r": 295.30887, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "2.32", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 162.53954999999996, "r": 324.98117, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "84-89", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 162.53954999999996, "r": 354.651, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "40-61", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 162.53954999999996, "r": 384.32083, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "86-92", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45187, "t": 162.53954999999996, "r": 418.16003, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "94-99", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 162.53954999999996, "r": 447.82986, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "95-99", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 162.53954999999996, "r": 477.50867, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "69-78", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 495.32489, "t": 162.53954999999996, "r": 507.17846999999995, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 173.49854000000005, "r": 137.3282, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Footnote", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 182.035, "t": 173.49854000000005, "r": 198.71251, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "6318", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 173.49854000000005, "r": 233.69174000000004, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.60", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 173.49854000000005, "r": 264.50031, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.31", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 173.49854000000005, "r": 295.30887, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.58", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 173.49854000000005, "r": 324.98117, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "83-91", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 342.79739, "t": 173.49854000000005, "r": 354.65097, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 371.81265, "t": 173.49854000000005, "r": 384.32077, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "100", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45181, "t": 173.49854000000005, "r": 418.15997, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "62-88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.12164, "t": 173.49854000000005, "r": 447.8298, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "85-94", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 465.655, "t": 173.49854000000005, "r": 477.50857999999994, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47025, "t": 173.49854000000005, "r": 507.17841, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "82-97", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 184.45752000000005, "r": 135.33766, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Formula", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 177.866, "t": 184.45752000000005, "r": 198.71288, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "25027", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 184.45752000000005, "r": 233.69174000000004, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "2.25", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 184.45752000000005, "r": 264.50031, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "1.90", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 184.45752000000005, "r": 295.30887, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "2.96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 184.45752000000005, "r": 324.98117, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "83-85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 342.79739, "t": 184.45752000000005, "r": 354.65097, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 372.46719, "t": 184.45752000000005, "r": 384.32077, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45181, "t": 184.45752000000005, "r": 418.15997, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "84-87", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.12164, "t": 184.45752000000005, "r": 447.8298, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "86-96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 465.655, "t": 184.45752000000005, "r": 477.50857999999994, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 495.3248, "t": 184.45752000000005, "r": 507.17838000000006, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 195.41656, "r": 137.70479, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "List-item", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 173.69701, "t": 195.41656, "r": 198.71326, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "185660", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 215.04201, "t": 195.41656, "r": 233.69212, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "17.19", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.85056, "t": 195.41656, "r": 264.50067, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "13.34", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 276.65912, "t": 195.41656, "r": 295.30923, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "15.82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 195.41656, "r": 324.98117, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "87-88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 195.41656, "r": 354.651, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "74-83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 195.41656, "r": 384.32083, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "90-92", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45187, "t": 195.41656, "r": 418.16003, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "97-97", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 195.41656, "r": 447.82986, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "81-85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 195.41656, "r": 477.50867, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "75-88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 195.41656, "r": 507.17849999999993, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "93-95", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 206.37554999999998, "r": 147.35262, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-footer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 177.866, "t": 206.37554999999998, "r": 198.71288, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "70878", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 206.37554999999998, "r": 233.69174000000004, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "6.51", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 206.37554999999998, "r": 264.50031, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "5.58", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 206.37554999999998, "r": 295.30887, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "6.00", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 206.37554999999998, "r": 324.98117, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "93-94", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 206.37554999999998, "r": 354.651, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "88-90", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 206.37554999999998, "r": 384.32083, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "95-96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 405.65189, "t": 206.37554999999998, "r": 418.16, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "100", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.12167, "t": 206.37554999999998, "r": 447.82983, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "92-97", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 465.00049, "t": 206.37554999999998, "r": 477.5086099999999, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "100", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47028, "t": 206.37554999999998, "r": 507.17843999999997, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "96-98", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 217.33452999999997, "r": 150.10532, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 177.866, "t": 217.33452999999997, "r": 198.71288, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "58022", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 217.33452999999997, "r": 233.69174000000004, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "5.10", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 217.33452999999997, "r": 264.50031, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "6.70", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 217.33452999999997, "r": 295.30887, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "5.06", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 217.33452999999997, "r": 324.98117, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "85-89", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 217.33452999999997, "r": 354.651, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "66-76", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 217.33452999999997, "r": 384.32083, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "90-94", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.2825, "t": 217.33452999999997, "r": 418.16003, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "98-100", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 217.33452999999997, "r": 447.82986, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "91-92", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 217.33452999999997, "r": 477.50867, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "97-99", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 217.33452999999997, "r": 507.17849999999993, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "81-86", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 228.29351999999994, "r": 130.80963, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Picture", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 177.866, "t": 228.29351999999994, "r": 198.71288, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "45976", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 228.29351999999994, "r": 233.69174000000004, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "4.21", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 228.29351999999994, "r": 264.50031, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "2.78", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 228.29351999999994, "r": 295.30887, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "5.31", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 228.29351999999994, "r": 324.98117, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "69-71", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 228.29351999999994, "r": 354.651, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "56-59", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 228.29351999999994, "r": 384.32083, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "82-86", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45187, "t": 228.29351999999994, "r": 418.16003, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "69-82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 228.29351999999994, "r": 447.82986, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "80-95", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 228.29351999999994, "r": 477.50867, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "66-71", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 228.29351999999994, "r": 507.17849999999993, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "59-76", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 239.25256000000002, "r": 159.56487, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Section-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 173.69701, "t": 239.25256000000002, "r": 198.71326, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "142884", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 215.04201, "t": 239.25256000000002, "r": 233.69212, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "12.60", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.85056, "t": 239.25256000000002, "r": 264.50067, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "15.77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 276.65912, "t": 239.25256000000002, "r": 295.30923, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "12.85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 239.25256000000002, "r": 324.98117, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "83-84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 239.25256000000002, "r": 354.651, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "76-81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 239.25256000000002, "r": 384.32083, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "90-92", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45187, "t": 239.25256000000002, "r": 418.16003, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "94-95", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 239.25256000000002, "r": 447.82986, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "87-94", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 239.25256000000002, "r": 477.50867, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "69-73", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 239.25256000000002, "r": 507.17849999999993, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "78-86", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 250.21155, "r": 124.63177, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 177.866, "t": 250.21155, "r": 198.71288, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "34733", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 250.21155, "r": 233.69174000000004, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "3.20", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 250.21155, "r": 264.50031, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "2.27", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 250.21155, "r": 295.30887, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "3.60", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 250.21155, "r": 324.98117, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "77-81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 250.21155, "r": 354.651, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "75-80", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 250.21155, "r": 384.32083, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "83-86", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45187, "t": 250.21155, "r": 418.16003, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "98-99", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 250.21155, "r": 447.82986, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "58-80", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 250.21155, "r": 477.50867, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "79-84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 250.21155, "r": 507.17849999999993, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "70-85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 261.16956000000005, "r": 120.78519, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Text", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 173.69701, "t": 261.16956000000005, "r": 198.71326, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "510377", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 215.04201, "t": 261.16956000000005, "r": 233.69212, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "45.82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.85056, "t": 261.16956000000005, "r": 264.50067, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "49.28", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 276.65912, "t": 261.16956000000005, "r": 295.30923, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "45.00", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 261.16956000000005, "r": 324.98117, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "84-86", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 261.16956000000005, "r": 354.651, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "81-86", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 261.16956000000005, "r": 384.32083, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "88-93", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45187, "t": 261.16956000000005, "r": 418.16003, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "89-93", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 261.16956000000005, "r": 447.82986, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "87-92", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 261.16956000000005, "r": 477.50867, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "71-79", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 261.16956000000005, "r": 507.17849999999993, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "87-95", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 272.12854000000004, "r": 121.81633, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Title", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 182.035, "t": 272.12854000000004, "r": 198.71251, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "5071", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 272.12854000000004, "r": 233.69174000000004, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.47", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 272.12854000000004, "r": 264.50031, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.30", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 272.12854000000004, "r": 295.30887, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.50", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 272.12854000000004, "r": 324.98117, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "60-72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 272.12854000000004, "r": 354.651, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "24-63", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 272.12854000000004, "r": 384.32083, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "50-63", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.2825, "t": 272.12854000000004, "r": 418.16003, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "94-100", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 272.12854000000004, "r": 447.82986, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "82-96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 272.12854000000004, "r": 477.50867, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "68-79", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 272.12854000000004, "r": 507.17849999999993, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "24-56", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 283.48654, "r": 123.43028, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Total", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 169.52699, "t": 283.48654, "r": 198.71263, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "1107470", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 208.675, "t": 283.48654, "r": 233.69124999999997, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "941123", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 243.65291999999997, "t": 283.48654, "r": 264.49982, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "99816", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 274.46149, "t": 283.48654, "r": 295.30838, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "66531", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 283.48654, "r": 324.98117, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "82-83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 283.48654, "r": 354.651, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "71-74", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 283.48654, "r": 384.32083, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "79-81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45187, "t": 283.48654, "r": 418.16003, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "89-94", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 283.48654, "r": 447.82986, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "86-91", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 283.48654, "r": 477.50867, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "71-76", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 283.48654, "r": 507.17849999999993, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "68-85", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "caption", "id": 9, "page_no": 3, "cluster": {"id": 9, "label": "caption", "bbox": {"l": 53.79800000000001, "t": 554.00999, "r": 295.64874, "b": 606.31924, "coord_origin": "TOPLEFT"}, "confidence": 0.8104903101921082, "cells": [{"id": 163, "text": "Figure 3: Corpus Conversion Service annotation user inter-", "bbox": {"l": 53.79800000000001, "t": 554.00999, "r": 295.64871, "b": 562.48325, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "face. The PDF page is shown in the background, with over-", "bbox": {"l": 53.79800000000001, "t": 564.96899, "r": 295.64874, "b": 573.44225, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "laid text-cells (in darker shades). The annotation boxes can", "bbox": {"l": 53.79800000000001, "t": 575.92799, "r": 294.04376, "b": 584.40125, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "be drawn by dragging a rectangle over each segment with", "bbox": {"l": 53.79800000000001, "t": 586.88699, "r": 294.04373, "b": 595.36024, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "the respective label from the palette on the right.", "bbox": {"l": 53.79800000000001, "t": 597.84599, "r": 252.78931000000003, "b": 606.31924, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 3: Corpus Conversion Service annotation user interface. The PDF page is shown in the background, with overlaid text-cells (in darker shades). The annotation boxes can be drawn by dragging a rectangle over each segment with the respective label from the palette on the right."}, {"label": "text", "id": 5, "page_no": 3, "cluster": {"id": 5, "label": "text", "bbox": {"l": 53.466999, "t": 634.29155, "r": 294.04745, "b": 675.54317, "coord_origin": "TOPLEFT"}, "confidence": 0.9803937673568726, "cells": [{"id": 168, "text": "we distributed the annotation workload and performed continuous", "bbox": {"l": 53.466999, "t": 634.29155, "r": 294.04745, "b": 642.66617, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "quality controls. Phase one and two required a small team of experts", "bbox": {"l": 53.79800000000001, "t": 645.25055, "r": 294.04535, "b": 653.62517, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "only. For phases three and four, a group of 40 dedicated annotators", "bbox": {"l": 53.79800000000001, "t": 656.20955, "r": 294.04422, "b": 664.58417, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "were assembled and supervised.", "bbox": {"l": 53.466999, "t": 667.16856, "r": 170.58611, "b": 675.54317, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "we distributed the annotation workload and performed continuous quality controls. Phase one and two required a small team of experts only. For phases three and four, a group of 40 dedicated annotators were assembled and supervised."}, {"label": "text", "id": 6, "page_no": 3, "cluster": {"id": 6, "label": "text", "bbox": {"l": 53.79800000000001, "t": 678.01099, "r": 295.55844, "b": 708.420174, "coord_origin": "TOPLEFT"}, "confidence": 0.9748397469520569, "cells": [{"id": 172, "text": "Phase 1: Data selection and preparation.", "bbox": {"l": 63.76099800000001, "t": 678.01099, "r": 226.72533000000004, "b": 686.48424, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "Our inclusion cri-", "bbox": {"l": 229.06900000000002, "t": 678.12756, "r": 295.55844, "b": 686.50217, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "teria for documents were described in Section 3. A large effort went", "bbox": {"l": 53.79800000000001, "t": 689.08656, "r": 294.04538, "b": 697.461174, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "into ensuring that all documents are free to use. The data sources", "bbox": {"l": 53.79800000000001, "t": 700.045555, "r": 294.04642, "b": 708.420174, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Phase 1: Data selection and preparation. Our inclusion criteria for documents were described in Section 3. A large effort went into ensuring that all documents are free to use. The data sources"}, {"label": "text", "id": 4, "page_no": 3, "cluster": {"id": 4, "label": "text", "bbox": {"l": 317.95499, "t": 312.07953, "r": 559.18536, "b": 375.24817, "coord_origin": "TOPLEFT"}, "confidence": 0.9818483591079712, "cells": [{"id": 176, "text": "include publication repositories such as arXiv$^{3}$, government offices,", "bbox": {"l": 317.95499, "t": 312.07953, "r": 559.18536, "b": 320.45416000000006, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "company websites as well as data directory services for financial", "bbox": {"l": 317.95499, "t": 323.03754, "r": 558.19843, "b": 331.41217, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "reports and patents. Scanned documents were excluded wherever", "bbox": {"l": 317.95499, "t": 333.99655, "r": 558.36963, "b": 342.37119, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "possible because they can be rotated or skewed. This would not", "bbox": {"l": 317.95499, "t": 344.95554, "r": 558.2041, "b": 353.33017, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "allow us to perform annotation with rectangular bounding-boxes", "bbox": {"l": 317.95499, "t": 355.91455, "r": 558.20294, "b": 364.28918, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "and therefore complicate the annotation process.", "bbox": {"l": 317.95499, "t": 366.87354, "r": 496.71826, "b": 375.24817, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "include publication repositories such as arXiv$^{3}$, government offices, company websites as well as data directory services for financial reports and patents. Scanned documents were excluded wherever possible because they can be rotated or skewed. This would not allow us to perform annotation with rectangular bounding-boxes and therefore complicate the annotation process."}, {"label": "text", "id": 0, "page_no": 3, "cluster": {"id": 0, "label": "text", "bbox": {"l": 317.95499, "t": 377.8325500000001, "r": 559.71307, "b": 506.75516, "coord_origin": "TOPLEFT"}, "confidence": 0.9866719841957092, "cells": [{"id": 182, "text": "Preparation work included uploading and parsing the sourced", "bbox": {"l": 327.918, "t": 377.8325500000001, "r": 558.20618, "b": 386.20717999999994, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "PDF documents in the Corpus Conversion Service (CCS) [22], a", "bbox": {"l": 317.95499, "t": 388.79153, "r": 558.2019, "b": 397.16617, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "cloud-native platform which provides a visual annotation interface", "bbox": {"l": 317.95499, "t": 399.75055, "r": 558.20233, "b": 408.12518, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": "and allows for dataset inspection and analysis. The annotation in-", "bbox": {"l": 317.95499, "t": 410.7095299999999, "r": 559.71277, "b": 419.08417, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "terface of CCS is shown in Figure 3. The desired balance of pages", "bbox": {"l": 317.95499, "t": 421.66855000000004, "r": 558.20062, "b": 430.04318, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "between the different document categories was achieved by se-", "bbox": {"l": 317.95499, "t": 432.62753, "r": 559.71307, "b": 441.00217, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": "lective subsampling of pages with certain desired properties. For", "bbox": {"l": 317.95499, "t": 443.58554, "r": 558.36877, "b": 451.96017, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "example, we made sure to include the title page of each document", "bbox": {"l": 317.95499, "t": 454.54453, "r": 558.20428, "b": 462.91916, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "and bias the remaining page selection to those with figures or", "bbox": {"l": 317.95499, "t": 465.50354, "r": 558.36877, "b": 473.87817, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "tables. The latter was achieved by leveraging pre-trained object", "bbox": {"l": 317.95499, "t": 476.46252, "r": 558.20428, "b": 484.83716, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": "detection models from PubLayNet, which helped us estimate how", "bbox": {"l": 317.95499, "t": 487.42154, "r": 558.5307, "b": 495.79617, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "many figures and tables a given page contains.", "bbox": {"l": 317.95499, "t": 498.38052, "r": 488.46914999999996, "b": 506.75516, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Preparation work included uploading and parsing the sourced PDF documents in the Corpus Conversion Service (CCS) [22], a cloud-native platform which provides a visual annotation interface and allows for dataset inspection and analysis. The annotation interface of CCS is shown in Figure 3. The desired balance of pages between the different document categories was achieved by selective subsampling of pages with certain desired properties. For example, we made sure to include the title page of each document and bias the remaining page selection to those with figures or tables. The latter was achieved by leveraging pre-trained object detection models from PubLayNet, which helped us estimate how many figures and tables a given page contains."}, {"label": "text", "id": 3, "page_no": 3, "cluster": {"id": 3, "label": "text", "bbox": {"l": 317.62299, "t": 509.22299, "r": 559.71765, "b": 693.0561749999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9847555756568909, "cells": [{"id": 194, "text": "Phase 2: Label selection and guideline.", "bbox": {"l": 327.918, "t": 509.22299, "r": 482.41809, "b": 517.69623, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "We reviewed the col-", "bbox": {"l": 484.474, "t": 509.33954, "r": 559.71765, "b": 517.71417, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "lected documents and identified the most common structural fea-", "bbox": {"l": 317.95499, "t": 520.29855, "r": 559.71619, "b": 528.67319, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "tures they exhibit. This was achieved by identifying recurrent layout", "bbox": {"l": 317.95499, "t": 531.2575400000001, "r": 558.20239, "b": 539.63217, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "elements and lead us to the definition of 11 distinct class labels.", "bbox": {"l": 317.95499, "t": 542.21655, "r": 559.58502, "b": 550.59117, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "These 11 class labels are", "bbox": {"l": 317.686, "t": 553.17456, "r": 404.14197, "b": 561.54918, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "Caption", "bbox": {"l": 406.26599, "t": 553.21939, "r": 433.84860000000003, "b": 561.5581500000001, "coord_origin": "TOPLEFT"}}, {"id": 201, "text": ",", "bbox": {"l": 433.84799, "t": 553.17456, "r": 435.78115999999994, "b": 561.54918, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": "Footnote", "bbox": {"l": 437.9079899999999, "t": 553.21939, "r": 467.23926, "b": 561.5581500000001, "coord_origin": "TOPLEFT"}}, {"id": 203, "text": ",", "bbox": {"l": 467.23999, "t": 553.17456, "r": 469.17316000000005, "b": 561.54918, "coord_origin": "TOPLEFT"}}, {"id": 204, "text": "Formula", "bbox": {"l": 471.29900999999995, "t": 553.21939, "r": 500.44574000000006, "b": 561.5581500000001, "coord_origin": "TOPLEFT"}}, {"id": 205, "text": ",", "bbox": {"l": 500.44601000000006, "t": 553.17456, "r": 502.37918, "b": 561.54918, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": "List-item", "bbox": {"l": 504.505, "t": 553.21939, "r": 535.74304, "b": 561.5581500000001, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": ",", "bbox": {"l": 535.74298, "t": 553.17456, "r": 537.67615, "b": 561.54918, "coord_origin": "TOPLEFT"}}, {"id": 208, "text": "Page-", "bbox": {"l": 539.802, "t": 553.21939, "r": 559.09839, "b": 561.5581500000001, "coord_origin": "TOPLEFT"}}, {"id": 209, "text": "footer", "bbox": {"l": 317.95499, "t": 564.17839, "r": 338.80725, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": ",", "bbox": {"l": 338.806, "t": 564.13356, "r": 340.81805, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "Page-header", "bbox": {"l": 343.61401, "t": 564.17839, "r": 387.96164, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 212, "text": ",", "bbox": {"l": 387.961, "t": 564.13356, "r": 389.97305, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "Picture", "bbox": {"l": 392.76901, "t": 564.17839, "r": 417.84662, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 214, "text": ",", "bbox": {"l": 417.84799, "t": 564.13356, "r": 419.86005, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 215, "text": "Section-header", "bbox": {"l": 422.655, "t": 564.17839, "r": 475.56305, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 216, "text": ",", "bbox": {"l": 475.56201, "t": 564.13356, "r": 477.57407, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 217, "text": "Table", "bbox": {"l": 480.36899, "t": 564.17839, "r": 499.82196, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 218, "text": ",", "bbox": {"l": 499.8219900000001, "t": 564.13356, "r": 501.83405, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 219, "text": "Text", "bbox": {"l": 504.6290000000001, "t": 564.17839, "r": 519.7926, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 220, "text": ", and", "bbox": {"l": 519.79602, "t": 564.13356, "r": 538.37103, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 221, "text": "Title", "bbox": {"l": 541.16302, "t": 564.17839, "r": 557.57043, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 222, "text": ".", "bbox": {"l": 557.57098, "t": 564.13356, "r": 559.58307, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 223, "text": "Critical factors that were considered for the choice of these class", "bbox": {"l": 317.95499, "t": 575.09256, "r": 558.20416, "b": 583.46718, "coord_origin": "TOPLEFT"}}, {"id": 224, "text": "labels were (1) the overall occurrence of the label, (2) the specificity", "bbox": {"l": 317.95499, "t": 586.05156, "r": 558.43091, "b": 594.4261799999999, "coord_origin": "TOPLEFT"}}, {"id": 225, "text": "of the label, (3) recognisability on a single page (i.e. no need for", "bbox": {"l": 317.95499, "t": 597.0105599999999, "r": 558.36871, "b": 605.38518, "coord_origin": "TOPLEFT"}}, {"id": 226, "text": "context from previous or next page) and (4) overall coverage of the", "bbox": {"l": 317.95499, "t": 607.96956, "r": 558.20105, "b": 616.3441799999999, "coord_origin": "TOPLEFT"}}, {"id": 227, "text": "page. Specificity ensures that the choice of label is not ambiguous,", "bbox": {"l": 317.95499, "t": 618.9285600000001, "r": 559.18665, "b": 627.30318, "coord_origin": "TOPLEFT"}}, {"id": 228, "text": "while coverage ensures that all meaningful items on a page can", "bbox": {"l": 317.62299, "t": 629.88756, "r": 558.20142, "b": 638.26218, "coord_origin": "TOPLEFT"}}, {"id": 229, "text": "be annotated. We refrained from class labels that are very specific", "bbox": {"l": 317.95499, "t": 640.84656, "r": 558.20227, "b": 649.22118, "coord_origin": "TOPLEFT"}}, {"id": 230, "text": "to a document category, such as", "bbox": {"l": 317.95499, "t": 651.80556, "r": 436.90649, "b": 660.1801800000001, "coord_origin": "TOPLEFT"}}, {"id": 231, "text": "Abstract", "bbox": {"l": 439.13800000000003, "t": 651.8503900000001, "r": 469.69134999999994, "b": 660.18915, "coord_origin": "TOPLEFT"}}, {"id": 232, "text": "in the", "bbox": {"l": 472.42898999999994, "t": 651.80556, "r": 493.97348, "b": 660.1801800000001, "coord_origin": "TOPLEFT"}}, {"id": 233, "text": "Scientific Articles", "bbox": {"l": 496.207, "t": 651.8503900000001, "r": 558.20001, "b": 660.18915, "coord_origin": "TOPLEFT"}}, {"id": 234, "text": "category. We also avoided class labels that are tightly linked to the", "bbox": {"l": 317.95499, "t": 662.76456, "r": 558.20557, "b": 671.13918, "coord_origin": "TOPLEFT"}}, {"id": 235, "text": "semantics of the text. Labels such as", "bbox": {"l": 317.95499, "t": 673.7225599999999, "r": 447.65221999999994, "b": 682.09718, "coord_origin": "TOPLEFT"}}, {"id": 236, "text": "Author", "bbox": {"l": 449.85999, "t": 673.76739, "r": 474.31439, "b": 682.10614, "coord_origin": "TOPLEFT"}}, {"id": 237, "text": "and", "bbox": {"l": 477.172, "t": 673.7225599999999, "r": 490.39655, "b": 682.09718, "coord_origin": "TOPLEFT"}}, {"id": 238, "text": "Affiliation", "bbox": {"l": 492.60599, "t": 673.76739, "r": 528.29907, "b": 682.10614, "coord_origin": "TOPLEFT"}}, {"id": 239, "text": ", as seen", "bbox": {"l": 528.29901, "t": 673.7225599999999, "r": 558.20148, "b": 682.09718, "coord_origin": "TOPLEFT"}}, {"id": 240, "text": "in DocBank, are often only distinguishable by discriminating on", "bbox": {"l": 317.95499, "t": 684.68156, "r": 558.2041, "b": 693.0561749999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Phase 2: Label selection and guideline. We reviewed the collected documents and identified the most common structural features they exhibit. This was achieved by identifying recurrent layout elements and lead us to the definition of 11 distinct class labels. These 11 class labels are Caption , Footnote , Formula , List-item , Pagefooter , Page-header , Picture , Section-header , Table , Text , and Title . Critical factors that were considered for the choice of these class labels were (1) the overall occurrence of the label, (2) the specificity of the label, (3) recognisability on a single page (i.e. no need for context from previous or next page) and (4) overall coverage of the page. Specificity ensures that the choice of label is not ambiguous, while coverage ensures that all meaningful items on a page can be annotated. We refrained from class labels that are very specific to a document category, such as Abstract in the Scientific Articles category. We also avoided class labels that are tightly linked to the semantics of the text. Labels such as Author and Affiliation , as seen in DocBank, are often only distinguishable by discriminating on"}, {"label": "footnote", "id": 7, "page_no": 3, "cluster": {"id": 7, "label": "footnote", "bbox": {"l": 317.95499, "t": 702.353363, "r": 369.2457, "b": 708.86689, "coord_origin": "TOPLEFT"}, "confidence": 0.9080349802970886, "cells": [{"id": 241, "text": "$^{3}$https://arxiv.org/", "bbox": {"l": 317.95499, "t": 702.353363, "r": 369.2457, "b": 708.86689, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "$^{3}$https://arxiv.org/"}, {"label": "picture", "id": 2, "page_no": 3, "cluster": {"id": 2, "label": "picture", "bbox": {"l": 53.05912780761719, "t": 310.7912902832031, "r": 295.8506164550781, "b": 540.864013671875, "coord_origin": "TOPLEFT"}, "confidence": 0.9847870469093323, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "headers": [{"label": "page_header", "id": 10, "page_no": 3, "cluster": {"id": 10, "label": "page_header", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.7625049948692322, "cells": [{"id": 0, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 246.24382, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar", "bbox": {"l": 253.13897999999998, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar"}]}}, {"page_no": 4, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "the textual content of an element, which goes beyond visual layout", "bbox": {"l": 53.79800000000001, "t": 87.36352999999997, "r": 294.04541, "b": 95.73816, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "recognition, in particular outside the", "bbox": {"l": 53.79800000000001, "t": 98.32250999999997, "r": 188.1326, "b": 106.69713999999999, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Scientific Articles", "bbox": {"l": 190.37401, "t": 98.36737000000005, "r": 251.25586999999996, "b": 106.70612000000006, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "category.", "bbox": {"l": 253.70801, "t": 98.32250999999997, "r": 287.01816, "b": 106.69713999999999, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "At first sight, the task of visual document-layout interpretation", "bbox": {"l": 63.76100199999999, "t": 109.28156000000001, "r": 294.04257, "b": 117.65618999999992, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "appears intuitive enough to obtain plausible annotations in most", "bbox": {"l": 53.79800000000001, "t": 120.24054000000001, "r": 294.04266, "b": 128.61517000000003, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "cases. However, during early trial-runs in the core team, we ob-", "bbox": {"l": 53.79800000000001, "t": 131.19854999999995, "r": 295.55615, "b": 139.57317999999998, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "served many cases in which annotators use different annotation", "bbox": {"l": 53.79800000000001, "t": 142.15752999999995, "r": 294.04715, "b": 150.53216999999995, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "styles, especially for documents with challenging layouts. For ex-", "bbox": {"l": 53.79800000000001, "t": 153.11652000000004, "r": 295.55923, "b": 161.49114999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "ample, if a figure is presented with subfigures, one annotator might", "bbox": {"l": 53.79800000000001, "t": 164.07556, "r": 294.04535, "b": 172.4502, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "draw a single figure bounding-box, while another might annotate", "bbox": {"l": 53.79800000000001, "t": 175.03454999999997, "r": 294.04803, "b": 183.40918, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "each subfigure separately. The same applies for lists, where one", "bbox": {"l": 53.79800000000001, "t": 185.99352999999996, "r": 294.04709, "b": 194.36816, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "might annotate all list items in one block or each list item sep-", "bbox": {"l": 53.79800000000001, "t": 196.95250999999996, "r": 295.55612, "b": 205.32714999999996, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "arately. In essence, we observed that challenging layouts would", "bbox": {"l": 53.79800000000001, "t": 207.91156, "r": 294.04712, "b": 216.28619000000003, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "be annotated in different but plausible ways. To illustrate this, we", "bbox": {"l": 53.79800000000001, "t": 218.87054, "r": 294.04495, "b": 227.24518, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "show in Figure 4 multiple examples of plausible but inconsistent", "bbox": {"l": 53.79800000000001, "t": 229.82952999999998, "r": 294.04712, "b": 238.20416, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "annotations on the same pages.", "bbox": {"l": 53.79800000000001, "t": 240.78754000000004, "r": 168.61276, "b": 249.16216999999995, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Obviously, this inconsistency in annotations is not desirable for", "bbox": {"l": 63.76100199999999, "t": 251.74652000000003, "r": 294.21884, "b": 260.12114999999994, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "datasets which are intended to be used for model training. To min-", "bbox": {"l": 53.79800000000001, "t": 262.70556999999997, "r": 295.56006, "b": 271.0802, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "imise these inconsistencies, we created a detailed annotation guide-", "bbox": {"l": 53.79800000000001, "t": 273.66454999999996, "r": 295.55676, "b": 282.03918, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "line. While perfect consistency across 40 annotation staff members", "bbox": {"l": 53.79800000000001, "t": 284.62354, "r": 294.04922, "b": 292.99817, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "is clearly not possible to achieve, we saw a huge improvement in", "bbox": {"l": 53.79800000000001, "t": 295.5825500000001, "r": 294.04343, "b": 303.95717999999994, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "annotation consistency after the introduction of our annotation", "bbox": {"l": 53.79800000000001, "t": 306.54153, "r": 294.04712, "b": 314.91617, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "guideline. A few selected, non-trivial highlights of the guideline", "bbox": {"l": 53.79800000000001, "t": 317.50055, "r": 294.04718, "b": 325.87518, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "are:", "bbox": {"l": 53.79800000000001, "t": 328.4595299999999, "r": 67.28347, "b": 336.83417, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "(1)", "bbox": {"l": 64.708, "t": 348.51254, "r": 74.626793, "b": 356.88718, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Every list-item is an individual object instance with class", "bbox": {"l": 76.963936, "t": 348.51254, "r": 294.0462, "b": 356.88718, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "label", "bbox": {"l": 78.207001, "t": 359.47153, "r": 95.730484, "b": 367.84616, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "List-item", "bbox": {"l": 97.976997, "t": 359.51639, "r": 130.17131, "b": 367.85513, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": ". This definition is different from PubLayNet", "bbox": {"l": 130.17101, "t": 359.47153, "r": 294.04053, "b": 367.84616, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "and DocBank, where all list-items are grouped together into", "bbox": {"l": 78.207001, "t": 370.43054, "r": 294.04385, "b": 378.80518, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "one", "bbox": {"l": 78.207001, "t": 381.38953000000004, "r": 91.593834, "b": 389.76416, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "List", "bbox": {"l": 93.834999, "t": 381.43439000000006, "r": 106.88111, "b": 389.77313, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "object.", "bbox": {"l": 109.629, "t": 381.38953000000004, "r": 133.72173, "b": 389.76416, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "(2)", "bbox": {"l": 64.707993, "t": 392.34851, "r": 75.097656, "b": 400.72313999999994, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "A", "bbox": {"l": 77.545731, "t": 392.34851, "r": 84.351402, "b": 400.72313999999994, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "List-item", "bbox": {"l": 86.584, "t": 392.39339999999993, "r": 118.01329000000001, "b": 400.73215, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "is a paragraph with hanging indentation. Single-", "bbox": {"l": 120.26899999999999, "t": 392.34854, "r": 295.55695, "b": 400.72317999999996, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "line elements can qualify as", "bbox": {"l": 78.207001, "t": 403.30753, "r": 181.80978, "b": 411.68216, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "List-item", "bbox": {"l": 184.175, "t": 403.35239, "r": 216.68806000000004, "b": 411.69113, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "if the neighbour ele-", "bbox": {"l": 219.078, "t": 403.30753, "r": 295.56372, "b": 411.68216, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "ments expose hanging indentation. Bullet or enumeration", "bbox": {"l": 78.207001, "t": 414.2665400000001, "r": 294.04617, "b": 422.64116999999993, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "symbols are not a requirement.", "bbox": {"l": 78.207001, "t": 425.22552, "r": 192.00853, "b": 433.60016, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "(3)", "bbox": {"l": 64.708, "t": 436.18451000000005, "r": 74.483009, "b": 444.55914, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "For every", "bbox": {"l": 76.786255, "t": 436.18451000000005, "r": 112.61566, "b": 444.55914, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "Caption", "bbox": {"l": 114.861, "t": 436.2294, "r": 142.61249, "b": 444.56815000000006, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": ", there must be exactly one corresponding", "bbox": {"l": 142.612, "t": 436.18454, "r": 294.04724, "b": 444.55917, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "Picture", "bbox": {"l": 78.207001, "t": 447.18839, "r": 102.79287, "b": 455.52713, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "or", "bbox": {"l": 105.245, "t": 447.14352, "r": 113.09956999999999, "b": 455.51815999999997, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Table", "bbox": {"l": 115.341, "t": 447.18839, "r": 134.40356, "b": 455.52713, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": ".", "bbox": {"l": 134.403, "t": 447.14352, "r": 136.37561, "b": 455.51815999999997, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "(4)", "bbox": {"l": 64.708, "t": 458.1015300000001, "r": 74.220215, "b": 466.47617, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "Connected sub-pictures are grouped together in one", "bbox": {"l": 76.461555, "t": 458.1015300000001, "r": 267.46786, "b": 466.47617, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "Picture", "bbox": {"l": 269.70599, "t": 458.14639, "r": 294.04599, "b": 466.48514, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "object.", "bbox": {"l": 78.207001, "t": 469.06055, "r": 102.29972, "b": 477.43518, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "(5)", "bbox": {"l": 64.708, "t": 480.01953, "r": 74.345383, "b": 488.39417, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Formula numbers are included in a", "bbox": {"l": 76.616203, "t": 480.01953, "r": 206.13503, "b": 488.39417, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Formula", "bbox": {"l": 208.38, "t": 480.06439, "r": 238.12155, "b": 488.40314, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "object.", "bbox": {"l": 240.41300999999999, "t": 480.01953, "r": 264.50571, "b": 488.39417, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "(6)", "bbox": {"l": 64.708008, "t": 490.97852, "r": 74.564522, "b": 499.35315, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "Emphasised text (e.g. in italic or bold) at the beginning of", "bbox": {"l": 76.886978, "t": 490.97852, "r": 294.04617, "b": 499.35315, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "a paragraph is not considered a", "bbox": {"l": 78.207001, "t": 501.93753, "r": 200.34819, "b": 510.31216, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "Section-header", "bbox": {"l": 203.66701, "t": 501.98239, "r": 256.57504, "b": 510.32114, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": ", unless it", "bbox": {"l": 256.57401, "t": 501.93753, "r": 294.04401, "b": 510.31216, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "appears exclusively on its own line.", "bbox": {"l": 78.207001, "t": 512.8965499999999, "r": 208.13017, "b": 521.27118, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "The complete annotation guideline is over 100 pages long and a", "bbox": {"l": 53.528999, "t": 532.9505300000001, "r": 294.04337, "b": 541.32516, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "detailed description is obviously out of scope for this paper. Never-", "bbox": {"l": 53.79800000000001, "t": 543.90855, "r": 295.56253, "b": 552.28317, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "theless, it will be made publicly available alongside with DocLayNet", "bbox": {"l": 53.79800000000001, "t": 554.8675499999999, "r": 294.04538, "b": 563.24217, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "for future reference.", "bbox": {"l": 53.79800000000001, "t": 565.82655, "r": 127.2418, "b": 574.20117, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Phase 3: Training.", "bbox": {"l": 63.76100199999999, "t": 576.66899, "r": 136.7744, "b": 585.14224, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "After a first trial with a small group of peo-", "bbox": {"l": 139.008, "t": 576.7855500000001, "r": 295.56226, "b": 585.16017, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "ple, we realised that providing the annotation guideline and a set of", "bbox": {"l": 53.79800000000001, "t": 587.74455, "r": 294.04532, "b": 596.1191699999999, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "random practice pages did not yield the desired quality level for lay-", "bbox": {"l": 53.79800000000001, "t": 598.70355, "r": 295.55676, "b": 607.07817, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "out annotation. Therefore we prepared a subset of pages with two", "bbox": {"l": 53.79800000000001, "t": 609.66255, "r": 294.04605, "b": 618.0371700000001, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "different complexity levels, each with a practice and an exam part.", "bbox": {"l": 53.79800000000001, "t": 620.6215500000001, "r": 295.42377, "b": 628.99617, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "974 pages were reference-annotated by one proficient core team", "bbox": {"l": 53.79800000000001, "t": 631.58055, "r": 294.04712, "b": 639.95517, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "member. Annotation staff were then given the task to annotate the", "bbox": {"l": 53.79800000000001, "t": 642.53955, "r": 294.04922, "b": 650.91417, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "same subsets (blinded from the reference). By comparing the an-", "bbox": {"l": 53.79800000000001, "t": 653.49855, "r": 295.55618, "b": 661.87317, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "notations of each staff member with the reference annotations, we", "bbox": {"l": 53.79800000000001, "t": 664.45655, "r": 294.04874, "b": 672.83117, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "could quantify how closely their annotations matched the reference.", "bbox": {"l": 53.79800000000001, "t": 675.4155499999999, "r": 295.42496, "b": 683.79017, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "Only after passing two exam levels with high annotation quality,", "bbox": {"l": 53.79800000000001, "t": 686.37456, "r": 295.0274, "b": 694.749176, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "staff were admitted into the production phase. Practice iterations", "bbox": {"l": 53.79800000000001, "t": 697.333557, "r": 294.04114, "b": 705.708176, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "1ef23f5e6d7f10d393f9947e8208285dce9ae87250ac483ac4b4a59d51b4e037", "bbox": {"l": 340.00214, "t": 179.79296999999997, "r": 416.20551, "b": 181.90972999999997, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "Compliant with guidelines", "bbox": {"l": 339.38269, "t": 85.19066999999995, "r": 417.83722, "b": 92.28399999999999, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Plausible but invalid alternative", "bbox": {"l": 451.42834, "t": 85.19066999999995, "r": 546.22913, "b": 92.28399999999999, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Borderline case: Two guideline-compliant alternatives", "bbox": {"l": 350.33701, "t": 364.85706, "r": 513.48035, "b": 371.95035000000007, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "03c31a2ee1ed1b583c28957f475ee545d144e1b5a264dc4dd068c8d2f6a64860", "bbox": {"l": 340.00201, "t": 245.07385, "r": 416.20538, "b": 247.19061, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "1a5cd524f1844c1260c8e8c073e1f442423c264583212b0d0b6626fc780e6ed4", "bbox": {"l": 340.00201, "t": 359.12488, "r": 416.20538, "b": 361.24167, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "05237a14f2524e3f53c8454b074409d05078038a6a36b770fcc8ec7e540deae0", "bbox": {"l": 400.12842, "t": 458.44327000000004, "r": 476.33178999999996, "b": 460.5600600000001, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "A", "bbox": {"l": 322.19424, "t": 98.34105999999997, "r": 326.01498, "b": 104.25214000000005, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "B", "bbox": {"l": 322.19424, "t": 186.99103000000002, "r": 326.01498, "b": 192.90204000000006, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "C", "bbox": {"l": 322.19424, "t": 253.54192999999998, "r": 326.01498, "b": 259.453, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "D", "bbox": {"l": 322.19424, "t": 367.08495999999997, "r": 326.01498, "b": 372.996, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "Figure 4: Examples of plausible annotation alternatives for", "bbox": {"l": 317.95499, "t": 473.49399, "r": 558.3891, "b": 481.96722, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "the same page. Criteria in our annotation guideline can re-", "bbox": {"l": 317.95499, "t": 484.45297, "r": 559.80579, "b": 492.92621, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "solve cases A to C, while the case D remains ambiguous.", "bbox": {"l": 317.95499, "t": 495.41196, "r": 544.14148, "b": 503.88519, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "were carried out over a timeframe of 12 weeks, after which 8 of the", "bbox": {"l": 317.62299, "t": 525.49753, "r": 558.20435, "b": 533.87216, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "40", "bbox": {"l": 317.74899, "t": 536.45656, "r": 326.07019, "b": 544.83118, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "initially allocated annotators did not pass the bar.", "bbox": {"l": 328.3071, "t": 536.45656, "r": 509.11896, "b": 544.83118, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "Phase 4: Production annotation.", "bbox": {"l": 327.918, "t": 547.299, "r": 456.80109000000004, "b": 555.77225, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "The previously selected 80K", "bbox": {"l": 458.7120100000001, "t": 547.41556, "r": 558.48926, "b": 555.79018, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "pages were annotated with the defined 11 class labels by 32 annota-", "bbox": {"l": 317.95499, "t": 558.37456, "r": 559.71368, "b": 566.74918, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "tors. This production phase took around three months to complete.", "bbox": {"l": 317.95499, "t": 569.33356, "r": 559.58124, "b": 577.7081800000001, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "All annotations were created online through CCS, which visualises", "bbox": {"l": 317.64099, "t": 580.29256, "r": 558.20386, "b": 588.66718, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "the programmatic PDF text-cells as an overlay on the page. The page", "bbox": {"l": 317.95499, "t": 591.25156, "r": 558.20221, "b": 599.62617, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "annotation are obtained by drawing rectangular bounding-boxes,", "bbox": {"l": 317.95499, "t": 602.20955, "r": 559.18457, "b": 610.58417, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "as shown in Figure 3. With regard to the annotation practices, we", "bbox": {"l": 317.95499, "t": 613.16855, "r": 558.20197, "b": 621.54317, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "implemented a few constraints and capabilities on the tooling level.", "bbox": {"l": 317.95499, "t": 624.12755, "r": 559.58197, "b": 632.50217, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "First, we only allow non-overlapping, vertically oriented, rectangu-", "bbox": {"l": 317.95499, "t": 635.08655, "r": 559.71411, "b": 643.46117, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "lar boxes. For the large majority of documents, this constraint was", "bbox": {"l": 317.95499, "t": 646.04555, "r": 558.20557, "b": 654.42017, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "sufficient and it speeds up the annotation considerably in compar-", "bbox": {"l": 317.95499, "t": 657.00455, "r": 559.7149, "b": 665.3791699999999, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "ison with arbitrary segmentation shapes. Second, annotator staff", "bbox": {"l": 317.95499, "t": 667.9635499999999, "r": 558.19849, "b": 676.33817, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "were not able to see each other\u2019s annotations. This was enforced by", "bbox": {"l": 317.62299, "t": 678.92255, "r": 558.43268, "b": 687.29717, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "design to avoid any bias in the annotation, which could skew the", "bbox": {"l": 317.95499, "t": 689.8815500000001, "r": 558.19806, "b": 698.256172, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "numbers of the inter-annotator agreement (see Table 1). We wanted", "bbox": {"l": 317.95499, "t": 700.840553, "r": 558.20227, "b": 709.2151719999999, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 13, "label": "page_header", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.887782871723175, "cells": [{"id": 0, "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "page_header", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.8534672856330872, "cells": [{"id": 1, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 53.79800000000001, "t": 87.36352999999997, "r": 294.04541, "b": 106.70612000000006, "coord_origin": "TOPLEFT"}, "confidence": 0.902275800704956, "cells": [{"id": 2, "text": "the textual content of an element, which goes beyond visual layout", "bbox": {"l": 53.79800000000001, "t": 87.36352999999997, "r": 294.04541, "b": 95.73816, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "recognition, in particular outside the", "bbox": {"l": 53.79800000000001, "t": 98.32250999999997, "r": 188.1326, "b": 106.69713999999999, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Scientific Articles", "bbox": {"l": 190.37401, "t": 98.36737000000005, "r": 251.25586999999996, "b": 106.70612000000006, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "category.", "bbox": {"l": 253.70801, "t": 98.32250999999997, "r": 287.01816, "b": 106.69713999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "text", "bbox": {"l": 53.79800000000001, "t": 109.28156000000001, "r": 295.55923, "b": 249.16216999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9711344838142395, "cells": [{"id": 6, "text": "At first sight, the task of visual document-layout interpretation", "bbox": {"l": 63.76100199999999, "t": 109.28156000000001, "r": 294.04257, "b": 117.65618999999992, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "appears intuitive enough to obtain plausible annotations in most", "bbox": {"l": 53.79800000000001, "t": 120.24054000000001, "r": 294.04266, "b": 128.61517000000003, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "cases. However, during early trial-runs in the core team, we ob-", "bbox": {"l": 53.79800000000001, "t": 131.19854999999995, "r": 295.55615, "b": 139.57317999999998, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "served many cases in which annotators use different annotation", "bbox": {"l": 53.79800000000001, "t": 142.15752999999995, "r": 294.04715, "b": 150.53216999999995, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "styles, especially for documents with challenging layouts. For ex-", "bbox": {"l": 53.79800000000001, "t": 153.11652000000004, "r": 295.55923, "b": 161.49114999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "ample, if a figure is presented with subfigures, one annotator might", "bbox": {"l": 53.79800000000001, "t": 164.07556, "r": 294.04535, "b": 172.4502, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "draw a single figure bounding-box, while another might annotate", "bbox": {"l": 53.79800000000001, "t": 175.03454999999997, "r": 294.04803, "b": 183.40918, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "each subfigure separately. The same applies for lists, where one", "bbox": {"l": 53.79800000000001, "t": 185.99352999999996, "r": 294.04709, "b": 194.36816, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "might annotate all list items in one block or each list item sep-", "bbox": {"l": 53.79800000000001, "t": 196.95250999999996, "r": 295.55612, "b": 205.32714999999996, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "arately. In essence, we observed that challenging layouts would", "bbox": {"l": 53.79800000000001, "t": 207.91156, "r": 294.04712, "b": 216.28619000000003, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "be annotated in different but plausible ways. To illustrate this, we", "bbox": {"l": 53.79800000000001, "t": 218.87054, "r": 294.04495, "b": 227.24518, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "show in Figure 4 multiple examples of plausible but inconsistent", "bbox": {"l": 53.79800000000001, "t": 229.82952999999998, "r": 294.04712, "b": 238.20416, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "annotations on the same pages.", "bbox": {"l": 53.79800000000001, "t": 240.78754000000004, "r": 168.61276, "b": 249.16216999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 53.79800000000001, "t": 251.74652000000003, "r": 295.56006, "b": 336.83417, "coord_origin": "TOPLEFT"}, "confidence": 0.985905110836029, "cells": [{"id": 19, "text": "Obviously, this inconsistency in annotations is not desirable for", "bbox": {"l": 63.76100199999999, "t": 251.74652000000003, "r": 294.21884, "b": 260.12114999999994, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "datasets which are intended to be used for model training. To min-", "bbox": {"l": 53.79800000000001, "t": 262.70556999999997, "r": 295.56006, "b": 271.0802, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "imise these inconsistencies, we created a detailed annotation guide-", "bbox": {"l": 53.79800000000001, "t": 273.66454999999996, "r": 295.55676, "b": 282.03918, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "line. While perfect consistency across 40 annotation staff members", "bbox": {"l": 53.79800000000001, "t": 284.62354, "r": 294.04922, "b": 292.99817, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "is clearly not possible to achieve, we saw a huge improvement in", "bbox": {"l": 53.79800000000001, "t": 295.5825500000001, "r": 294.04343, "b": 303.95717999999994, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "annotation consistency after the introduction of our annotation", "bbox": {"l": 53.79800000000001, "t": 306.54153, "r": 294.04712, "b": 314.91617, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "guideline. A few selected, non-trivial highlights of the guideline", "bbox": {"l": 53.79800000000001, "t": 317.50055, "r": 294.04718, "b": 325.87518, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "are:", "bbox": {"l": 53.79800000000001, "t": 328.4595299999999, "r": 67.28347, "b": 336.83417, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "list_item", "bbox": {"l": 64.708, "t": 348.51254, "r": 294.0462, "b": 389.77313, "coord_origin": "TOPLEFT"}, "confidence": 0.9691525101661682, "cells": [{"id": 27, "text": "(1)", "bbox": {"l": 64.708, "t": 348.51254, "r": 74.626793, "b": 356.88718, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Every list-item is an individual object instance with class", "bbox": {"l": 76.963936, "t": 348.51254, "r": 294.0462, "b": 356.88718, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "label", "bbox": {"l": 78.207001, "t": 359.47153, "r": 95.730484, "b": 367.84616, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "List-item", "bbox": {"l": 97.976997, "t": 359.51639, "r": 130.17131, "b": 367.85513, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": ". This definition is different from PubLayNet", "bbox": {"l": 130.17101, "t": 359.47153, "r": 294.04053, "b": 367.84616, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "and DocBank, where all list-items are grouped together into", "bbox": {"l": 78.207001, "t": 370.43054, "r": 294.04385, "b": 378.80518, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "one", "bbox": {"l": 78.207001, "t": 381.38953000000004, "r": 91.593834, "b": 389.76416, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "List", "bbox": {"l": 93.834999, "t": 381.43439000000006, "r": 106.88111, "b": 389.77313, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "object.", "bbox": {"l": 109.629, "t": 381.38953000000004, "r": 133.72173, "b": 389.76416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "list_item", "bbox": {"l": 64.707993, "t": 392.34851, "r": 295.56372, "b": 433.60016, "coord_origin": "TOPLEFT"}, "confidence": 0.9591284990310669, "cells": [{"id": 36, "text": "(2)", "bbox": {"l": 64.707993, "t": 392.34851, "r": 75.097656, "b": 400.72313999999994, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "A", "bbox": {"l": 77.545731, "t": 392.34851, "r": 84.351402, "b": 400.72313999999994, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "List-item", "bbox": {"l": 86.584, "t": 392.39339999999993, "r": 118.01329000000001, "b": 400.73215, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "is a paragraph with hanging indentation. Single-", "bbox": {"l": 120.26899999999999, "t": 392.34854, "r": 295.55695, "b": 400.72317999999996, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "line elements can qualify as", "bbox": {"l": 78.207001, "t": 403.30753, "r": 181.80978, "b": 411.68216, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "List-item", "bbox": {"l": 184.175, "t": 403.35239, "r": 216.68806000000004, "b": 411.69113, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "if the neighbour ele-", "bbox": {"l": 219.078, "t": 403.30753, "r": 295.56372, "b": 411.68216, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "ments expose hanging indentation. Bullet or enumeration", "bbox": {"l": 78.207001, "t": 414.2665400000001, "r": 294.04617, "b": 422.64116999999993, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "symbols are not a requirement.", "bbox": {"l": 78.207001, "t": 425.22552, "r": 192.00853, "b": 433.60016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "list_item", "bbox": {"l": 64.708, "t": 436.18451000000005, "r": 294.04724, "b": 455.52713, "coord_origin": "TOPLEFT"}, "confidence": 0.941342830657959, "cells": [{"id": 45, "text": "(3)", "bbox": {"l": 64.708, "t": 436.18451000000005, "r": 74.483009, "b": 444.55914, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "For every", "bbox": {"l": 76.786255, "t": 436.18451000000005, "r": 112.61566, "b": 444.55914, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "Caption", "bbox": {"l": 114.861, "t": 436.2294, "r": 142.61249, "b": 444.56815000000006, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": ", there must be exactly one corresponding", "bbox": {"l": 142.612, "t": 436.18454, "r": 294.04724, "b": 444.55917, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "Picture", "bbox": {"l": 78.207001, "t": 447.18839, "r": 102.79287, "b": 455.52713, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "or", "bbox": {"l": 105.245, "t": 447.14352, "r": 113.09956999999999, "b": 455.51815999999997, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Table", "bbox": {"l": 115.341, "t": 447.18839, "r": 134.40356, "b": 455.52713, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": ".", "bbox": {"l": 134.403, "t": 447.14352, "r": 136.37561, "b": 455.51815999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "list_item", "bbox": {"l": 64.708, "t": 458.1015300000001, "r": 294.04599, "b": 477.43518, "coord_origin": "TOPLEFT"}, "confidence": 0.9426738023757935, "cells": [{"id": 53, "text": "(4)", "bbox": {"l": 64.708, "t": 458.1015300000001, "r": 74.220215, "b": 466.47617, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "Connected sub-pictures are grouped together in one", "bbox": {"l": 76.461555, "t": 458.1015300000001, "r": 267.46786, "b": 466.47617, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "Picture", "bbox": {"l": 269.70599, "t": 458.14639, "r": 294.04599, "b": 466.48514, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "object.", "bbox": {"l": 78.207001, "t": 469.06055, "r": 102.29972, "b": 477.43518, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "list_item", "bbox": {"l": 64.708, "t": 480.01953, "r": 264.50571, "b": 488.40314, "coord_origin": "TOPLEFT"}, "confidence": 0.9147457480430603, "cells": [{"id": 57, "text": "(5)", "bbox": {"l": 64.708, "t": 480.01953, "r": 74.345383, "b": 488.39417, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Formula numbers are included in a", "bbox": {"l": 76.616203, "t": 480.01953, "r": 206.13503, "b": 488.39417, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Formula", "bbox": {"l": 208.38, "t": 480.06439, "r": 238.12155, "b": 488.40314, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "object.", "bbox": {"l": 240.41300999999999, "t": 480.01953, "r": 264.50571, "b": 488.39417, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "list_item", "bbox": {"l": 64.708008, "t": 490.97852, "r": 294.04617, "b": 521.27118, "coord_origin": "TOPLEFT"}, "confidence": 0.9544305205345154, "cells": [{"id": 61, "text": "(6)", "bbox": {"l": 64.708008, "t": 490.97852, "r": 74.564522, "b": 499.35315, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "Emphasised text (e.g. in italic or bold) at the beginning of", "bbox": {"l": 76.886978, "t": 490.97852, "r": 294.04617, "b": 499.35315, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "a paragraph is not considered a", "bbox": {"l": 78.207001, "t": 501.93753, "r": 200.34819, "b": 510.31216, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "Section-header", "bbox": {"l": 203.66701, "t": 501.98239, "r": 256.57504, "b": 510.32114, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": ", unless it", "bbox": {"l": 256.57401, "t": 501.93753, "r": 294.04401, "b": 510.31216, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "appears exclusively on its own line.", "bbox": {"l": 78.207001, "t": 512.8965499999999, "r": 208.13017, "b": 521.27118, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 53.528999, "t": 532.9505300000001, "r": 295.56253, "b": 574.20117, "coord_origin": "TOPLEFT"}, "confidence": 0.9811431169509888, "cells": [{"id": 67, "text": "The complete annotation guideline is over 100 pages long and a", "bbox": {"l": 53.528999, "t": 532.9505300000001, "r": 294.04337, "b": 541.32516, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "detailed description is obviously out of scope for this paper. Never-", "bbox": {"l": 53.79800000000001, "t": 543.90855, "r": 295.56253, "b": 552.28317, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "theless, it will be made publicly available alongside with DocLayNet", "bbox": {"l": 53.79800000000001, "t": 554.8675499999999, "r": 294.04538, "b": 563.24217, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "for future reference.", "bbox": {"l": 53.79800000000001, "t": 565.82655, "r": 127.2418, "b": 574.20117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 53.79800000000001, "t": 576.66899, "r": 295.56226, "b": 705.708176, "coord_origin": "TOPLEFT"}, "confidence": 0.9864389896392822, "cells": [{"id": 71, "text": "Phase 3: Training.", "bbox": {"l": 63.76100199999999, "t": 576.66899, "r": 136.7744, "b": 585.14224, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "After a first trial with a small group of peo-", "bbox": {"l": 139.008, "t": 576.7855500000001, "r": 295.56226, "b": 585.16017, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "ple, we realised that providing the annotation guideline and a set of", "bbox": {"l": 53.79800000000001, "t": 587.74455, "r": 294.04532, "b": 596.1191699999999, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "random practice pages did not yield the desired quality level for lay-", "bbox": {"l": 53.79800000000001, "t": 598.70355, "r": 295.55676, "b": 607.07817, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "out annotation. Therefore we prepared a subset of pages with two", "bbox": {"l": 53.79800000000001, "t": 609.66255, "r": 294.04605, "b": 618.0371700000001, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "different complexity levels, each with a practice and an exam part.", "bbox": {"l": 53.79800000000001, "t": 620.6215500000001, "r": 295.42377, "b": 628.99617, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "974 pages were reference-annotated by one proficient core team", "bbox": {"l": 53.79800000000001, "t": 631.58055, "r": 294.04712, "b": 639.95517, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "member. Annotation staff were then given the task to annotate the", "bbox": {"l": 53.79800000000001, "t": 642.53955, "r": 294.04922, "b": 650.91417, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "same subsets (blinded from the reference). By comparing the an-", "bbox": {"l": 53.79800000000001, "t": 653.49855, "r": 295.55618, "b": 661.87317, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "notations of each staff member with the reference annotations, we", "bbox": {"l": 53.79800000000001, "t": 664.45655, "r": 294.04874, "b": 672.83117, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "could quantify how closely their annotations matched the reference.", "bbox": {"l": 53.79800000000001, "t": 675.4155499999999, "r": 295.42496, "b": 683.79017, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "Only after passing two exam levels with high annotation quality,", "bbox": {"l": 53.79800000000001, "t": 686.37456, "r": 295.0274, "b": 694.749176, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "staff were admitted into the production phase. Practice iterations", "bbox": {"l": 53.79800000000001, "t": 697.333557, "r": 294.04114, "b": 705.708176, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "picture", "bbox": {"l": 315.960205078125, "t": 85.33881378173828, "r": 559.396484375, "b": 459.68084716796875, "coord_origin": "TOPLEFT"}, "confidence": 0.7264117002487183, "cells": [{"id": 84, "text": "1ef23f5e6d7f10d393f9947e8208285dce9ae87250ac483ac4b4a59d51b4e037", "bbox": {"l": 340.00214, "t": 179.79296999999997, "r": 416.20551, "b": 181.90972999999997, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "Compliant with guidelines", "bbox": {"l": 339.38269, "t": 85.19066999999995, "r": 417.83722, "b": 92.28399999999999, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Plausible but invalid alternative", "bbox": {"l": 451.42834, "t": 85.19066999999995, "r": 546.22913, "b": 92.28399999999999, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Borderline case: Two guideline-compliant alternatives", "bbox": {"l": 350.33701, "t": 364.85706, "r": 513.48035, "b": 371.95035000000007, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "03c31a2ee1ed1b583c28957f475ee545d144e1b5a264dc4dd068c8d2f6a64860", "bbox": {"l": 340.00201, "t": 245.07385, "r": 416.20538, "b": 247.19061, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "1a5cd524f1844c1260c8e8c073e1f442423c264583212b0d0b6626fc780e6ed4", "bbox": {"l": 340.00201, "t": 359.12488, "r": 416.20538, "b": 361.24167, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "A", "bbox": {"l": 322.19424, "t": 98.34105999999997, "r": 326.01498, "b": 104.25214000000005, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "B", "bbox": {"l": 322.19424, "t": 186.99103000000002, "r": 326.01498, "b": 192.90204000000006, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "C", "bbox": {"l": 322.19424, "t": 253.54192999999998, "r": 326.01498, "b": 259.453, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "D", "bbox": {"l": 322.19424, "t": 367.08495999999997, "r": 326.01498, "b": 372.996, "coord_origin": "TOPLEFT"}}], "children": [{"id": 16, "label": "text", "bbox": {"l": 340.00214, "t": 179.79296999999997, "r": 416.20551, "b": 181.90972999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "1ef23f5e6d7f10d393f9947e8208285dce9ae87250ac483ac4b4a59d51b4e037", "bbox": {"l": 340.00214, "t": 179.79296999999997, "r": 416.20551, "b": 181.90972999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 339.38269, "t": 85.19066999999995, "r": 417.83722, "b": 92.28399999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "Compliant with guidelines", "bbox": {"l": 339.38269, "t": 85.19066999999995, "r": 417.83722, "b": 92.28399999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 451.42834, "t": 85.19066999999995, "r": 546.22913, "b": 92.28399999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "Plausible but invalid alternative", "bbox": {"l": 451.42834, "t": 85.19066999999995, "r": 546.22913, "b": 92.28399999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 350.33701, "t": 364.85706, "r": 513.48035, "b": 371.95035000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "Borderline case: Two guideline-compliant alternatives", "bbox": {"l": 350.33701, "t": 364.85706, "r": 513.48035, "b": 371.95035000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 340.00201, "t": 245.07385, "r": 416.20538, "b": 247.19061, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "03c31a2ee1ed1b583c28957f475ee545d144e1b5a264dc4dd068c8d2f6a64860", "bbox": {"l": 340.00201, "t": 245.07385, "r": 416.20538, "b": 247.19061, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 340.00201, "t": 359.12488, "r": 416.20538, "b": 361.24167, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "1a5cd524f1844c1260c8e8c073e1f442423c264583212b0d0b6626fc780e6ed4", "bbox": {"l": 340.00201, "t": 359.12488, "r": 416.20538, "b": 361.24167, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 322.19424, "t": 98.34105999999997, "r": 326.01498, "b": 104.25214000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "A", "bbox": {"l": 322.19424, "t": 98.34105999999997, "r": 326.01498, "b": 104.25214000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 322.19424, "t": 186.99103000000002, "r": 326.01498, "b": 192.90204000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "B", "bbox": {"l": 322.19424, "t": 186.99103000000002, "r": 326.01498, "b": 192.90204000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 322.19424, "t": 253.54192999999998, "r": 326.01498, "b": 259.453, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "C", "bbox": {"l": 322.19424, "t": 253.54192999999998, "r": 326.01498, "b": 259.453, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 322.19424, "t": 367.08495999999997, "r": 326.01498, "b": 372.996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "D", "bbox": {"l": 322.19424, "t": 367.08495999999997, "r": 326.01498, "b": 372.996, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 22, "label": "text", "bbox": {"l": 400.12842, "t": 458.44327000000004, "r": 476.33178999999996, "b": 460.5600600000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "05237a14f2524e3f53c8454b074409d05078038a6a36b770fcc8ec7e540deae0", "bbox": {"l": 400.12842, "t": 458.44327000000004, "r": 476.33178999999996, "b": 460.5600600000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "caption", "bbox": {"l": 317.95499, "t": 473.49399, "r": 559.80579, "b": 503.88519, "coord_origin": "TOPLEFT"}, "confidence": 0.8873710632324219, "cells": [{"id": 95, "text": "Figure 4: Examples of plausible annotation alternatives for", "bbox": {"l": 317.95499, "t": 473.49399, "r": 558.3891, "b": 481.96722, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "the same page. Criteria in our annotation guideline can re-", "bbox": {"l": 317.95499, "t": 484.45297, "r": 559.80579, "b": 492.92621, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "solve cases A to C, while the case D remains ambiguous.", "bbox": {"l": 317.95499, "t": 495.41196, "r": 544.14148, "b": 503.88519, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "text", "bbox": {"l": 317.62299, "t": 525.49753, "r": 558.20435, "b": 544.83118, "coord_origin": "TOPLEFT"}, "confidence": 0.9611717462539673, "cells": [{"id": 98, "text": "were carried out over a timeframe of 12 weeks, after which 8 of the", "bbox": {"l": 317.62299, "t": 525.49753, "r": 558.20435, "b": 533.87216, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "40", "bbox": {"l": 317.74899, "t": 536.45656, "r": 326.07019, "b": 544.83118, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "initially allocated annotators did not pass the bar.", "bbox": {"l": 328.3071, "t": 536.45656, "r": 509.11896, "b": 544.83118, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 317.62299, "t": 547.299, "r": 559.7149, "b": 709.2151719999999, "coord_origin": "TOPLEFT"}, "confidence": 0.982954204082489, "cells": [{"id": 101, "text": "Phase 4: Production annotation.", "bbox": {"l": 327.918, "t": 547.299, "r": 456.80109000000004, "b": 555.77225, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "The previously selected 80K", "bbox": {"l": 458.7120100000001, "t": 547.41556, "r": 558.48926, "b": 555.79018, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "pages were annotated with the defined 11 class labels by 32 annota-", "bbox": {"l": 317.95499, "t": 558.37456, "r": 559.71368, "b": 566.74918, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "tors. This production phase took around three months to complete.", "bbox": {"l": 317.95499, "t": 569.33356, "r": 559.58124, "b": 577.7081800000001, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "All annotations were created online through CCS, which visualises", "bbox": {"l": 317.64099, "t": 580.29256, "r": 558.20386, "b": 588.66718, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "the programmatic PDF text-cells as an overlay on the page. The page", "bbox": {"l": 317.95499, "t": 591.25156, "r": 558.20221, "b": 599.62617, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "annotation are obtained by drawing rectangular bounding-boxes,", "bbox": {"l": 317.95499, "t": 602.20955, "r": 559.18457, "b": 610.58417, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "as shown in Figure 3. With regard to the annotation practices, we", "bbox": {"l": 317.95499, "t": 613.16855, "r": 558.20197, "b": 621.54317, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "implemented a few constraints and capabilities on the tooling level.", "bbox": {"l": 317.95499, "t": 624.12755, "r": 559.58197, "b": 632.50217, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "First, we only allow non-overlapping, vertically oriented, rectangu-", "bbox": {"l": 317.95499, "t": 635.08655, "r": 559.71411, "b": 643.46117, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "lar boxes. For the large majority of documents, this constraint was", "bbox": {"l": 317.95499, "t": 646.04555, "r": 558.20557, "b": 654.42017, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "sufficient and it speeds up the annotation considerably in compar-", "bbox": {"l": 317.95499, "t": 657.00455, "r": 559.7149, "b": 665.3791699999999, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "ison with arbitrary segmentation shapes. Second, annotator staff", "bbox": {"l": 317.95499, "t": 667.9635499999999, "r": 558.19849, "b": 676.33817, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "were not able to see each other\u2019s annotations. This was enforced by", "bbox": {"l": 317.62299, "t": 678.92255, "r": 558.43268, "b": 687.29717, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "design to avoid any bias in the annotation, which could skew the", "bbox": {"l": 317.95499, "t": 689.8815500000001, "r": 558.19806, "b": 698.256172, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "numbers of the inter-annotator agreement (see Table 1). We wanted", "bbox": {"l": 317.95499, "t": 700.840553, "r": 558.20227, "b": 709.2151719999999, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_header", "id": 13, "page_no": 4, "cluster": {"id": 13, "label": "page_header", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.887782871723175, "cells": [{"id": 0, "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis"}, {"label": "page_header", "id": 15, "page_no": 4, "cluster": {"id": 15, "label": "page_header", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.8534672856330872, "cells": [{"id": 1, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA"}, {"label": "text", "id": 12, "page_no": 4, "cluster": {"id": 12, "label": "text", "bbox": {"l": 53.79800000000001, "t": 87.36352999999997, "r": 294.04541, "b": 106.70612000000006, "coord_origin": "TOPLEFT"}, "confidence": 0.902275800704956, "cells": [{"id": 2, "text": "the textual content of an element, which goes beyond visual layout", "bbox": {"l": 53.79800000000001, "t": 87.36352999999997, "r": 294.04541, "b": 95.73816, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "recognition, in particular outside the", "bbox": {"l": 53.79800000000001, "t": 98.32250999999997, "r": 188.1326, "b": 106.69713999999999, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Scientific Articles", "bbox": {"l": 190.37401, "t": 98.36737000000005, "r": 251.25586999999996, "b": 106.70612000000006, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "category.", "bbox": {"l": 253.70801, "t": 98.32250999999997, "r": 287.01816, "b": 106.69713999999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "the textual content of an element, which goes beyond visual layout recognition, in particular outside the Scientific Articles category."}, {"label": "text", "id": 4, "page_no": 4, "cluster": {"id": 4, "label": "text", "bbox": {"l": 53.79800000000001, "t": 109.28156000000001, "r": 295.55923, "b": 249.16216999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9711344838142395, "cells": [{"id": 6, "text": "At first sight, the task of visual document-layout interpretation", "bbox": {"l": 63.76100199999999, "t": 109.28156000000001, "r": 294.04257, "b": 117.65618999999992, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "appears intuitive enough to obtain plausible annotations in most", "bbox": {"l": 53.79800000000001, "t": 120.24054000000001, "r": 294.04266, "b": 128.61517000000003, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "cases. However, during early trial-runs in the core team, we ob-", "bbox": {"l": 53.79800000000001, "t": 131.19854999999995, "r": 295.55615, "b": 139.57317999999998, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "served many cases in which annotators use different annotation", "bbox": {"l": 53.79800000000001, "t": 142.15752999999995, "r": 294.04715, "b": 150.53216999999995, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "styles, especially for documents with challenging layouts. For ex-", "bbox": {"l": 53.79800000000001, "t": 153.11652000000004, "r": 295.55923, "b": 161.49114999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "ample, if a figure is presented with subfigures, one annotator might", "bbox": {"l": 53.79800000000001, "t": 164.07556, "r": 294.04535, "b": 172.4502, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "draw a single figure bounding-box, while another might annotate", "bbox": {"l": 53.79800000000001, "t": 175.03454999999997, "r": 294.04803, "b": 183.40918, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "each subfigure separately. The same applies for lists, where one", "bbox": {"l": 53.79800000000001, "t": 185.99352999999996, "r": 294.04709, "b": 194.36816, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "might annotate all list items in one block or each list item sep-", "bbox": {"l": 53.79800000000001, "t": 196.95250999999996, "r": 295.55612, "b": 205.32714999999996, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "arately. In essence, we observed that challenging layouts would", "bbox": {"l": 53.79800000000001, "t": 207.91156, "r": 294.04712, "b": 216.28619000000003, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "be annotated in different but plausible ways. To illustrate this, we", "bbox": {"l": 53.79800000000001, "t": 218.87054, "r": 294.04495, "b": 227.24518, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "show in Figure 4 multiple examples of plausible but inconsistent", "bbox": {"l": 53.79800000000001, "t": 229.82952999999998, "r": 294.04712, "b": 238.20416, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "annotations on the same pages.", "bbox": {"l": 53.79800000000001, "t": 240.78754000000004, "r": 168.61276, "b": 249.16216999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "At first sight, the task of visual document-layout interpretation appears intuitive enough to obtain plausible annotations in most cases. However, during early trial-runs in the core team, we observed many cases in which annotators use different annotation styles, especially for documents with challenging layouts. For example, if a figure is presented with subfigures, one annotator might draw a single figure bounding-box, while another might annotate each subfigure separately. The same applies for lists, where one might annotate all list items in one block or each list item separately. In essence, we observed that challenging layouts would be annotated in different but plausible ways. To illustrate this, we show in Figure 4 multiple examples of plausible but inconsistent annotations on the same pages."}, {"label": "text", "id": 1, "page_no": 4, "cluster": {"id": 1, "label": "text", "bbox": {"l": 53.79800000000001, "t": 251.74652000000003, "r": 295.56006, "b": 336.83417, "coord_origin": "TOPLEFT"}, "confidence": 0.985905110836029, "cells": [{"id": 19, "text": "Obviously, this inconsistency in annotations is not desirable for", "bbox": {"l": 63.76100199999999, "t": 251.74652000000003, "r": 294.21884, "b": 260.12114999999994, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "datasets which are intended to be used for model training. To min-", "bbox": {"l": 53.79800000000001, "t": 262.70556999999997, "r": 295.56006, "b": 271.0802, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "imise these inconsistencies, we created a detailed annotation guide-", "bbox": {"l": 53.79800000000001, "t": 273.66454999999996, "r": 295.55676, "b": 282.03918, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "line. While perfect consistency across 40 annotation staff members", "bbox": {"l": 53.79800000000001, "t": 284.62354, "r": 294.04922, "b": 292.99817, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "is clearly not possible to achieve, we saw a huge improvement in", "bbox": {"l": 53.79800000000001, "t": 295.5825500000001, "r": 294.04343, "b": 303.95717999999994, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "annotation consistency after the introduction of our annotation", "bbox": {"l": 53.79800000000001, "t": 306.54153, "r": 294.04712, "b": 314.91617, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "guideline. A few selected, non-trivial highlights of the guideline", "bbox": {"l": 53.79800000000001, "t": 317.50055, "r": 294.04718, "b": 325.87518, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "are:", "bbox": {"l": 53.79800000000001, "t": 328.4595299999999, "r": 67.28347, "b": 336.83417, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Obviously, this inconsistency in annotations is not desirable for datasets which are intended to be used for model training. To minimise these inconsistencies, we created a detailed annotation guideline. While perfect consistency across 40 annotation staff members is clearly not possible to achieve, we saw a huge improvement in annotation consistency after the introduction of our annotation guideline. A few selected, non-trivial highlights of the guideline are:"}, {"label": "list_item", "id": 5, "page_no": 4, "cluster": {"id": 5, "label": "list_item", "bbox": {"l": 64.708, "t": 348.51254, "r": 294.0462, "b": 389.77313, "coord_origin": "TOPLEFT"}, "confidence": 0.9691525101661682, "cells": [{"id": 27, "text": "(1)", "bbox": {"l": 64.708, "t": 348.51254, "r": 74.626793, "b": 356.88718, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Every list-item is an individual object instance with class", "bbox": {"l": 76.963936, "t": 348.51254, "r": 294.0462, "b": 356.88718, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "label", "bbox": {"l": 78.207001, "t": 359.47153, "r": 95.730484, "b": 367.84616, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "List-item", "bbox": {"l": 97.976997, "t": 359.51639, "r": 130.17131, "b": 367.85513, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": ". This definition is different from PubLayNet", "bbox": {"l": 130.17101, "t": 359.47153, "r": 294.04053, "b": 367.84616, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "and DocBank, where all list-items are grouped together into", "bbox": {"l": 78.207001, "t": 370.43054, "r": 294.04385, "b": 378.80518, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "one", "bbox": {"l": 78.207001, "t": 381.38953000000004, "r": 91.593834, "b": 389.76416, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "List", "bbox": {"l": 93.834999, "t": 381.43439000000006, "r": 106.88111, "b": 389.77313, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "object.", "bbox": {"l": 109.629, "t": 381.38953000000004, "r": 133.72173, "b": 389.76416, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "(1) Every list-item is an individual object instance with class label List-item . This definition is different from PubLayNet and DocBank, where all list-items are grouped together into one List object."}, {"label": "list_item", "id": 7, "page_no": 4, "cluster": {"id": 7, "label": "list_item", "bbox": {"l": 64.707993, "t": 392.34851, "r": 295.56372, "b": 433.60016, "coord_origin": "TOPLEFT"}, "confidence": 0.9591284990310669, "cells": [{"id": 36, "text": "(2)", "bbox": {"l": 64.707993, "t": 392.34851, "r": 75.097656, "b": 400.72313999999994, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "A", "bbox": {"l": 77.545731, "t": 392.34851, "r": 84.351402, "b": 400.72313999999994, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "List-item", "bbox": {"l": 86.584, "t": 392.39339999999993, "r": 118.01329000000001, "b": 400.73215, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "is a paragraph with hanging indentation. Single-", "bbox": {"l": 120.26899999999999, "t": 392.34854, "r": 295.55695, "b": 400.72317999999996, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "line elements can qualify as", "bbox": {"l": 78.207001, "t": 403.30753, "r": 181.80978, "b": 411.68216, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "List-item", "bbox": {"l": 184.175, "t": 403.35239, "r": 216.68806000000004, "b": 411.69113, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "if the neighbour ele-", "bbox": {"l": 219.078, "t": 403.30753, "r": 295.56372, "b": 411.68216, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "ments expose hanging indentation. Bullet or enumeration", "bbox": {"l": 78.207001, "t": 414.2665400000001, "r": 294.04617, "b": 422.64116999999993, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "symbols are not a requirement.", "bbox": {"l": 78.207001, "t": 425.22552, "r": 192.00853, "b": 433.60016, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "(2) A List-item is a paragraph with hanging indentation. Singleline elements can qualify as List-item if the neighbour elements expose hanging indentation. Bullet or enumeration symbols are not a requirement."}, {"label": "list_item", "id": 10, "page_no": 4, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 64.708, "t": 436.18451000000005, "r": 294.04724, "b": 455.52713, "coord_origin": "TOPLEFT"}, "confidence": 0.941342830657959, "cells": [{"id": 45, "text": "(3)", "bbox": {"l": 64.708, "t": 436.18451000000005, "r": 74.483009, "b": 444.55914, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "For every", "bbox": {"l": 76.786255, "t": 436.18451000000005, "r": 112.61566, "b": 444.55914, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "Caption", "bbox": {"l": 114.861, "t": 436.2294, "r": 142.61249, "b": 444.56815000000006, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": ", there must be exactly one corresponding", "bbox": {"l": 142.612, "t": 436.18454, "r": 294.04724, "b": 444.55917, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "Picture", "bbox": {"l": 78.207001, "t": 447.18839, "r": 102.79287, "b": 455.52713, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "or", "bbox": {"l": 105.245, "t": 447.14352, "r": 113.09956999999999, "b": 455.51815999999997, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Table", "bbox": {"l": 115.341, "t": 447.18839, "r": 134.40356, "b": 455.52713, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": ".", "bbox": {"l": 134.403, "t": 447.14352, "r": 136.37561, "b": 455.51815999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "(3) For every Caption , there must be exactly one corresponding Picture or Table ."}, {"label": "list_item", "id": 9, "page_no": 4, "cluster": {"id": 9, "label": "list_item", "bbox": {"l": 64.708, "t": 458.1015300000001, "r": 294.04599, "b": 477.43518, "coord_origin": "TOPLEFT"}, "confidence": 0.9426738023757935, "cells": [{"id": 53, "text": "(4)", "bbox": {"l": 64.708, "t": 458.1015300000001, "r": 74.220215, "b": 466.47617, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "Connected sub-pictures are grouped together in one", "bbox": {"l": 76.461555, "t": 458.1015300000001, "r": 267.46786, "b": 466.47617, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "Picture", "bbox": {"l": 269.70599, "t": 458.14639, "r": 294.04599, "b": 466.48514, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "object.", "bbox": {"l": 78.207001, "t": 469.06055, "r": 102.29972, "b": 477.43518, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "(4) Connected sub-pictures are grouped together in one Picture object."}, {"label": "list_item", "id": 11, "page_no": 4, "cluster": {"id": 11, "label": "list_item", "bbox": {"l": 64.708, "t": 480.01953, "r": 264.50571, "b": 488.40314, "coord_origin": "TOPLEFT"}, "confidence": 0.9147457480430603, "cells": [{"id": 57, "text": "(5)", "bbox": {"l": 64.708, "t": 480.01953, "r": 74.345383, "b": 488.39417, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Formula numbers are included in a", "bbox": {"l": 76.616203, "t": 480.01953, "r": 206.13503, "b": 488.39417, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Formula", "bbox": {"l": 208.38, "t": 480.06439, "r": 238.12155, "b": 488.40314, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "object.", "bbox": {"l": 240.41300999999999, "t": 480.01953, "r": 264.50571, "b": 488.39417, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "(5) Formula numbers are included in a Formula object."}, {"label": "list_item", "id": 8, "page_no": 4, "cluster": {"id": 8, "label": "list_item", "bbox": {"l": 64.708008, "t": 490.97852, "r": 294.04617, "b": 521.27118, "coord_origin": "TOPLEFT"}, "confidence": 0.9544305205345154, "cells": [{"id": 61, "text": "(6)", "bbox": {"l": 64.708008, "t": 490.97852, "r": 74.564522, "b": 499.35315, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "Emphasised text (e.g. in italic or bold) at the beginning of", "bbox": {"l": 76.886978, "t": 490.97852, "r": 294.04617, "b": 499.35315, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "a paragraph is not considered a", "bbox": {"l": 78.207001, "t": 501.93753, "r": 200.34819, "b": 510.31216, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "Section-header", "bbox": {"l": 203.66701, "t": 501.98239, "r": 256.57504, "b": 510.32114, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": ", unless it", "bbox": {"l": 256.57401, "t": 501.93753, "r": 294.04401, "b": 510.31216, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "appears exclusively on its own line.", "bbox": {"l": 78.207001, "t": 512.8965499999999, "r": 208.13017, "b": 521.27118, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "(6) Emphasised text (e.g. in italic or bold) at the beginning of a paragraph is not considered a Section-header , unless it appears exclusively on its own line."}, {"label": "text", "id": 3, "page_no": 4, "cluster": {"id": 3, "label": "text", "bbox": {"l": 53.528999, "t": 532.9505300000001, "r": 295.56253, "b": 574.20117, "coord_origin": "TOPLEFT"}, "confidence": 0.9811431169509888, "cells": [{"id": 67, "text": "The complete annotation guideline is over 100 pages long and a", "bbox": {"l": 53.528999, "t": 532.9505300000001, "r": 294.04337, "b": 541.32516, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "detailed description is obviously out of scope for this paper. Never-", "bbox": {"l": 53.79800000000001, "t": 543.90855, "r": 295.56253, "b": 552.28317, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "theless, it will be made publicly available alongside with DocLayNet", "bbox": {"l": 53.79800000000001, "t": 554.8675499999999, "r": 294.04538, "b": 563.24217, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "for future reference.", "bbox": {"l": 53.79800000000001, "t": 565.82655, "r": 127.2418, "b": 574.20117, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The complete annotation guideline is over 100 pages long and a detailed description is obviously out of scope for this paper. Nevertheless, it will be made publicly available alongside with DocLayNet for future reference."}, {"label": "text", "id": 0, "page_no": 4, "cluster": {"id": 0, "label": "text", "bbox": {"l": 53.79800000000001, "t": 576.66899, "r": 295.56226, "b": 705.708176, "coord_origin": "TOPLEFT"}, "confidence": 0.9864389896392822, "cells": [{"id": 71, "text": "Phase 3: Training.", "bbox": {"l": 63.76100199999999, "t": 576.66899, "r": 136.7744, "b": 585.14224, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "After a first trial with a small group of peo-", "bbox": {"l": 139.008, "t": 576.7855500000001, "r": 295.56226, "b": 585.16017, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "ple, we realised that providing the annotation guideline and a set of", "bbox": {"l": 53.79800000000001, "t": 587.74455, "r": 294.04532, "b": 596.1191699999999, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "random practice pages did not yield the desired quality level for lay-", "bbox": {"l": 53.79800000000001, "t": 598.70355, "r": 295.55676, "b": 607.07817, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "out annotation. Therefore we prepared a subset of pages with two", "bbox": {"l": 53.79800000000001, "t": 609.66255, "r": 294.04605, "b": 618.0371700000001, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "different complexity levels, each with a practice and an exam part.", "bbox": {"l": 53.79800000000001, "t": 620.6215500000001, "r": 295.42377, "b": 628.99617, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "974 pages were reference-annotated by one proficient core team", "bbox": {"l": 53.79800000000001, "t": 631.58055, "r": 294.04712, "b": 639.95517, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "member. Annotation staff were then given the task to annotate the", "bbox": {"l": 53.79800000000001, "t": 642.53955, "r": 294.04922, "b": 650.91417, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "same subsets (blinded from the reference). By comparing the an-", "bbox": {"l": 53.79800000000001, "t": 653.49855, "r": 295.55618, "b": 661.87317, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "notations of each staff member with the reference annotations, we", "bbox": {"l": 53.79800000000001, "t": 664.45655, "r": 294.04874, "b": 672.83117, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "could quantify how closely their annotations matched the reference.", "bbox": {"l": 53.79800000000001, "t": 675.4155499999999, "r": 295.42496, "b": 683.79017, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "Only after passing two exam levels with high annotation quality,", "bbox": {"l": 53.79800000000001, "t": 686.37456, "r": 295.0274, "b": 694.749176, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "staff were admitted into the production phase. Practice iterations", "bbox": {"l": 53.79800000000001, "t": 697.333557, "r": 294.04114, "b": 705.708176, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Phase 3: Training. After a first trial with a small group of people, we realised that providing the annotation guideline and a set of random practice pages did not yield the desired quality level for layout annotation. Therefore we prepared a subset of pages with two different complexity levels, each with a practice and an exam part. 974 pages were reference-annotated by one proficient core team member. Annotation staff were then given the task to annotate the same subsets (blinded from the reference). By comparing the annotations of each staff member with the reference annotations, we could quantify how closely their annotations matched the reference. Only after passing two exam levels with high annotation quality, staff were admitted into the production phase. Practice iterations"}, {"label": "picture", "id": 16, "page_no": 4, "cluster": {"id": 16, "label": "picture", "bbox": {"l": 315.960205078125, "t": 85.33881378173828, "r": 559.396484375, "b": 459.68084716796875, "coord_origin": "TOPLEFT"}, "confidence": 0.7264117002487183, "cells": [{"id": 84, "text": "1ef23f5e6d7f10d393f9947e8208285dce9ae87250ac483ac4b4a59d51b4e037", "bbox": {"l": 340.00214, "t": 179.79296999999997, "r": 416.20551, "b": 181.90972999999997, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "Compliant with guidelines", "bbox": {"l": 339.38269, "t": 85.19066999999995, "r": 417.83722, "b": 92.28399999999999, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Plausible but invalid alternative", "bbox": {"l": 451.42834, "t": 85.19066999999995, "r": 546.22913, "b": 92.28399999999999, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Borderline case: Two guideline-compliant alternatives", "bbox": {"l": 350.33701, "t": 364.85706, "r": 513.48035, "b": 371.95035000000007, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "03c31a2ee1ed1b583c28957f475ee545d144e1b5a264dc4dd068c8d2f6a64860", "bbox": {"l": 340.00201, "t": 245.07385, "r": 416.20538, "b": 247.19061, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "1a5cd524f1844c1260c8e8c073e1f442423c264583212b0d0b6626fc780e6ed4", "bbox": {"l": 340.00201, "t": 359.12488, "r": 416.20538, "b": 361.24167, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "A", "bbox": {"l": 322.19424, "t": 98.34105999999997, "r": 326.01498, "b": 104.25214000000005, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "B", "bbox": {"l": 322.19424, "t": 186.99103000000002, "r": 326.01498, "b": 192.90204000000006, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "C", "bbox": {"l": 322.19424, "t": 253.54192999999998, "r": 326.01498, "b": 259.453, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "D", "bbox": {"l": 322.19424, "t": 367.08495999999997, "r": 326.01498, "b": 372.996, "coord_origin": "TOPLEFT"}}], "children": [{"id": 16, "label": "text", "bbox": {"l": 340.00214, "t": 179.79296999999997, "r": 416.20551, "b": 181.90972999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "1ef23f5e6d7f10d393f9947e8208285dce9ae87250ac483ac4b4a59d51b4e037", "bbox": {"l": 340.00214, "t": 179.79296999999997, "r": 416.20551, "b": 181.90972999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 339.38269, "t": 85.19066999999995, "r": 417.83722, "b": 92.28399999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "Compliant with guidelines", "bbox": {"l": 339.38269, "t": 85.19066999999995, "r": 417.83722, "b": 92.28399999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 451.42834, "t": 85.19066999999995, "r": 546.22913, "b": 92.28399999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "Plausible but invalid alternative", "bbox": {"l": 451.42834, "t": 85.19066999999995, "r": 546.22913, "b": 92.28399999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 350.33701, "t": 364.85706, "r": 513.48035, "b": 371.95035000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "Borderline case: Two guideline-compliant alternatives", "bbox": {"l": 350.33701, "t": 364.85706, "r": 513.48035, "b": 371.95035000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 340.00201, "t": 245.07385, "r": 416.20538, "b": 247.19061, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "03c31a2ee1ed1b583c28957f475ee545d144e1b5a264dc4dd068c8d2f6a64860", "bbox": {"l": 340.00201, "t": 245.07385, "r": 416.20538, "b": 247.19061, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 340.00201, "t": 359.12488, "r": 416.20538, "b": 361.24167, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "1a5cd524f1844c1260c8e8c073e1f442423c264583212b0d0b6626fc780e6ed4", "bbox": {"l": 340.00201, "t": 359.12488, "r": 416.20538, "b": 361.24167, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 322.19424, "t": 98.34105999999997, "r": 326.01498, "b": 104.25214000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "A", "bbox": {"l": 322.19424, "t": 98.34105999999997, "r": 326.01498, "b": 104.25214000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 322.19424, "t": 186.99103000000002, "r": 326.01498, "b": 192.90204000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "B", "bbox": {"l": 322.19424, "t": 186.99103000000002, "r": 326.01498, "b": 192.90204000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 322.19424, "t": 253.54192999999998, "r": 326.01498, "b": 259.453, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "C", "bbox": {"l": 322.19424, "t": 253.54192999999998, "r": 326.01498, "b": 259.453, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 322.19424, "t": 367.08495999999997, "r": 326.01498, "b": 372.996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "D", "bbox": {"l": 322.19424, "t": 367.08495999999997, "r": 326.01498, "b": 372.996, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "text", "id": 22, "page_no": 4, "cluster": {"id": 22, "label": "text", "bbox": {"l": 400.12842, "t": 458.44327000000004, "r": 476.33178999999996, "b": 460.5600600000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "05237a14f2524e3f53c8454b074409d05078038a6a36b770fcc8ec7e540deae0", "bbox": {"l": 400.12842, "t": 458.44327000000004, "r": 476.33178999999996, "b": 460.5600600000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "05237a14f2524e3f53c8454b074409d05078038a6a36b770fcc8ec7e540deae0"}, {"label": "caption", "id": 14, "page_no": 4, "cluster": {"id": 14, "label": "caption", "bbox": {"l": 317.95499, "t": 473.49399, "r": 559.80579, "b": 503.88519, "coord_origin": "TOPLEFT"}, "confidence": 0.8873710632324219, "cells": [{"id": 95, "text": "Figure 4: Examples of plausible annotation alternatives for", "bbox": {"l": 317.95499, "t": 473.49399, "r": 558.3891, "b": 481.96722, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "the same page. Criteria in our annotation guideline can re-", "bbox": {"l": 317.95499, "t": 484.45297, "r": 559.80579, "b": 492.92621, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "solve cases A to C, while the case D remains ambiguous.", "bbox": {"l": 317.95499, "t": 495.41196, "r": 544.14148, "b": 503.88519, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 4: Examples of plausible annotation alternatives for the same page. Criteria in our annotation guideline can resolve cases A to C, while the case D remains ambiguous."}, {"label": "text", "id": 6, "page_no": 4, "cluster": {"id": 6, "label": "text", "bbox": {"l": 317.62299, "t": 525.49753, "r": 558.20435, "b": 544.83118, "coord_origin": "TOPLEFT"}, "confidence": 0.9611717462539673, "cells": [{"id": 98, "text": "were carried out over a timeframe of 12 weeks, after which 8 of the", "bbox": {"l": 317.62299, "t": 525.49753, "r": 558.20435, "b": 533.87216, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "40", "bbox": {"l": 317.74899, "t": 536.45656, "r": 326.07019, "b": 544.83118, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "initially allocated annotators did not pass the bar.", "bbox": {"l": 328.3071, "t": 536.45656, "r": 509.11896, "b": 544.83118, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "were carried out over a timeframe of 12 weeks, after which 8 of the 40 initially allocated annotators did not pass the bar."}, {"label": "text", "id": 2, "page_no": 4, "cluster": {"id": 2, "label": "text", "bbox": {"l": 317.62299, "t": 547.299, "r": 559.7149, "b": 709.2151719999999, "coord_origin": "TOPLEFT"}, "confidence": 0.982954204082489, "cells": [{"id": 101, "text": "Phase 4: Production annotation.", "bbox": {"l": 327.918, "t": 547.299, "r": 456.80109000000004, "b": 555.77225, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "The previously selected 80K", "bbox": {"l": 458.7120100000001, "t": 547.41556, "r": 558.48926, "b": 555.79018, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "pages were annotated with the defined 11 class labels by 32 annota-", "bbox": {"l": 317.95499, "t": 558.37456, "r": 559.71368, "b": 566.74918, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "tors. This production phase took around three months to complete.", "bbox": {"l": 317.95499, "t": 569.33356, "r": 559.58124, "b": 577.7081800000001, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "All annotations were created online through CCS, which visualises", "bbox": {"l": 317.64099, "t": 580.29256, "r": 558.20386, "b": 588.66718, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "the programmatic PDF text-cells as an overlay on the page. The page", "bbox": {"l": 317.95499, "t": 591.25156, "r": 558.20221, "b": 599.62617, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "annotation are obtained by drawing rectangular bounding-boxes,", "bbox": {"l": 317.95499, "t": 602.20955, "r": 559.18457, "b": 610.58417, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "as shown in Figure 3. With regard to the annotation practices, we", "bbox": {"l": 317.95499, "t": 613.16855, "r": 558.20197, "b": 621.54317, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "implemented a few constraints and capabilities on the tooling level.", "bbox": {"l": 317.95499, "t": 624.12755, "r": 559.58197, "b": 632.50217, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "First, we only allow non-overlapping, vertically oriented, rectangu-", "bbox": {"l": 317.95499, "t": 635.08655, "r": 559.71411, "b": 643.46117, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "lar boxes. For the large majority of documents, this constraint was", "bbox": {"l": 317.95499, "t": 646.04555, "r": 558.20557, "b": 654.42017, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "sufficient and it speeds up the annotation considerably in compar-", "bbox": {"l": 317.95499, "t": 657.00455, "r": 559.7149, "b": 665.3791699999999, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "ison with arbitrary segmentation shapes. Second, annotator staff", "bbox": {"l": 317.95499, "t": 667.9635499999999, "r": 558.19849, "b": 676.33817, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "were not able to see each other\u2019s annotations. This was enforced by", "bbox": {"l": 317.62299, "t": 678.92255, "r": 558.43268, "b": 687.29717, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "design to avoid any bias in the annotation, which could skew the", "bbox": {"l": 317.95499, "t": 689.8815500000001, "r": 558.19806, "b": 698.256172, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "numbers of the inter-annotator agreement (see Table 1). We wanted", "bbox": {"l": 317.95499, "t": 700.840553, "r": 558.20227, "b": 709.2151719999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Phase 4: Production annotation. The previously selected 80K pages were annotated with the defined 11 class labels by 32 annotators. This production phase took around three months to complete. All annotations were created online through CCS, which visualises the programmatic PDF text-cells as an overlay on the page. The page annotation are obtained by drawing rectangular bounding-boxes, as shown in Figure 3. With regard to the annotation practices, we implemented a few constraints and capabilities on the tooling level. First, we only allow non-overlapping, vertically oriented, rectangular boxes. For the large majority of documents, this constraint was sufficient and it speeds up the annotation considerably in comparison with arbitrary segmentation shapes. Second, annotator staff were not able to see each other\u2019s annotations. This was enforced by design to avoid any bias in the annotation, which could skew the numbers of the inter-annotator agreement (see Table 1). We wanted"}], "body": [{"label": "text", "id": 12, "page_no": 4, "cluster": {"id": 12, "label": "text", "bbox": {"l": 53.79800000000001, "t": 87.36352999999997, "r": 294.04541, "b": 106.70612000000006, "coord_origin": "TOPLEFT"}, "confidence": 0.902275800704956, "cells": [{"id": 2, "text": "the textual content of an element, which goes beyond visual layout", "bbox": {"l": 53.79800000000001, "t": 87.36352999999997, "r": 294.04541, "b": 95.73816, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "recognition, in particular outside the", "bbox": {"l": 53.79800000000001, "t": 98.32250999999997, "r": 188.1326, "b": 106.69713999999999, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Scientific Articles", "bbox": {"l": 190.37401, "t": 98.36737000000005, "r": 251.25586999999996, "b": 106.70612000000006, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "category.", "bbox": {"l": 253.70801, "t": 98.32250999999997, "r": 287.01816, "b": 106.69713999999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "the textual content of an element, which goes beyond visual layout recognition, in particular outside the Scientific Articles category."}, {"label": "text", "id": 4, "page_no": 4, "cluster": {"id": 4, "label": "text", "bbox": {"l": 53.79800000000001, "t": 109.28156000000001, "r": 295.55923, "b": 249.16216999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9711344838142395, "cells": [{"id": 6, "text": "At first sight, the task of visual document-layout interpretation", "bbox": {"l": 63.76100199999999, "t": 109.28156000000001, "r": 294.04257, "b": 117.65618999999992, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "appears intuitive enough to obtain plausible annotations in most", "bbox": {"l": 53.79800000000001, "t": 120.24054000000001, "r": 294.04266, "b": 128.61517000000003, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "cases. However, during early trial-runs in the core team, we ob-", "bbox": {"l": 53.79800000000001, "t": 131.19854999999995, "r": 295.55615, "b": 139.57317999999998, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "served many cases in which annotators use different annotation", "bbox": {"l": 53.79800000000001, "t": 142.15752999999995, "r": 294.04715, "b": 150.53216999999995, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "styles, especially for documents with challenging layouts. For ex-", "bbox": {"l": 53.79800000000001, "t": 153.11652000000004, "r": 295.55923, "b": 161.49114999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "ample, if a figure is presented with subfigures, one annotator might", "bbox": {"l": 53.79800000000001, "t": 164.07556, "r": 294.04535, "b": 172.4502, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "draw a single figure bounding-box, while another might annotate", "bbox": {"l": 53.79800000000001, "t": 175.03454999999997, "r": 294.04803, "b": 183.40918, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "each subfigure separately. The same applies for lists, where one", "bbox": {"l": 53.79800000000001, "t": 185.99352999999996, "r": 294.04709, "b": 194.36816, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "might annotate all list items in one block or each list item sep-", "bbox": {"l": 53.79800000000001, "t": 196.95250999999996, "r": 295.55612, "b": 205.32714999999996, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "arately. In essence, we observed that challenging layouts would", "bbox": {"l": 53.79800000000001, "t": 207.91156, "r": 294.04712, "b": 216.28619000000003, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "be annotated in different but plausible ways. To illustrate this, we", "bbox": {"l": 53.79800000000001, "t": 218.87054, "r": 294.04495, "b": 227.24518, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "show in Figure 4 multiple examples of plausible but inconsistent", "bbox": {"l": 53.79800000000001, "t": 229.82952999999998, "r": 294.04712, "b": 238.20416, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "annotations on the same pages.", "bbox": {"l": 53.79800000000001, "t": 240.78754000000004, "r": 168.61276, "b": 249.16216999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "At first sight, the task of visual document-layout interpretation appears intuitive enough to obtain plausible annotations in most cases. However, during early trial-runs in the core team, we observed many cases in which annotators use different annotation styles, especially for documents with challenging layouts. For example, if a figure is presented with subfigures, one annotator might draw a single figure bounding-box, while another might annotate each subfigure separately. The same applies for lists, where one might annotate all list items in one block or each list item separately. In essence, we observed that challenging layouts would be annotated in different but plausible ways. To illustrate this, we show in Figure 4 multiple examples of plausible but inconsistent annotations on the same pages."}, {"label": "text", "id": 1, "page_no": 4, "cluster": {"id": 1, "label": "text", "bbox": {"l": 53.79800000000001, "t": 251.74652000000003, "r": 295.56006, "b": 336.83417, "coord_origin": "TOPLEFT"}, "confidence": 0.985905110836029, "cells": [{"id": 19, "text": "Obviously, this inconsistency in annotations is not desirable for", "bbox": {"l": 63.76100199999999, "t": 251.74652000000003, "r": 294.21884, "b": 260.12114999999994, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "datasets which are intended to be used for model training. To min-", "bbox": {"l": 53.79800000000001, "t": 262.70556999999997, "r": 295.56006, "b": 271.0802, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "imise these inconsistencies, we created a detailed annotation guide-", "bbox": {"l": 53.79800000000001, "t": 273.66454999999996, "r": 295.55676, "b": 282.03918, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "line. While perfect consistency across 40 annotation staff members", "bbox": {"l": 53.79800000000001, "t": 284.62354, "r": 294.04922, "b": 292.99817, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "is clearly not possible to achieve, we saw a huge improvement in", "bbox": {"l": 53.79800000000001, "t": 295.5825500000001, "r": 294.04343, "b": 303.95717999999994, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "annotation consistency after the introduction of our annotation", "bbox": {"l": 53.79800000000001, "t": 306.54153, "r": 294.04712, "b": 314.91617, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "guideline. A few selected, non-trivial highlights of the guideline", "bbox": {"l": 53.79800000000001, "t": 317.50055, "r": 294.04718, "b": 325.87518, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "are:", "bbox": {"l": 53.79800000000001, "t": 328.4595299999999, "r": 67.28347, "b": 336.83417, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Obviously, this inconsistency in annotations is not desirable for datasets which are intended to be used for model training. To minimise these inconsistencies, we created a detailed annotation guideline. While perfect consistency across 40 annotation staff members is clearly not possible to achieve, we saw a huge improvement in annotation consistency after the introduction of our annotation guideline. A few selected, non-trivial highlights of the guideline are:"}, {"label": "list_item", "id": 5, "page_no": 4, "cluster": {"id": 5, "label": "list_item", "bbox": {"l": 64.708, "t": 348.51254, "r": 294.0462, "b": 389.77313, "coord_origin": "TOPLEFT"}, "confidence": 0.9691525101661682, "cells": [{"id": 27, "text": "(1)", "bbox": {"l": 64.708, "t": 348.51254, "r": 74.626793, "b": 356.88718, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Every list-item is an individual object instance with class", "bbox": {"l": 76.963936, "t": 348.51254, "r": 294.0462, "b": 356.88718, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "label", "bbox": {"l": 78.207001, "t": 359.47153, "r": 95.730484, "b": 367.84616, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "List-item", "bbox": {"l": 97.976997, "t": 359.51639, "r": 130.17131, "b": 367.85513, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": ". This definition is different from PubLayNet", "bbox": {"l": 130.17101, "t": 359.47153, "r": 294.04053, "b": 367.84616, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "and DocBank, where all list-items are grouped together into", "bbox": {"l": 78.207001, "t": 370.43054, "r": 294.04385, "b": 378.80518, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "one", "bbox": {"l": 78.207001, "t": 381.38953000000004, "r": 91.593834, "b": 389.76416, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "List", "bbox": {"l": 93.834999, "t": 381.43439000000006, "r": 106.88111, "b": 389.77313, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "object.", "bbox": {"l": 109.629, "t": 381.38953000000004, "r": 133.72173, "b": 389.76416, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "(1) Every list-item is an individual object instance with class label List-item . This definition is different from PubLayNet and DocBank, where all list-items are grouped together into one List object."}, {"label": "list_item", "id": 7, "page_no": 4, "cluster": {"id": 7, "label": "list_item", "bbox": {"l": 64.707993, "t": 392.34851, "r": 295.56372, "b": 433.60016, "coord_origin": "TOPLEFT"}, "confidence": 0.9591284990310669, "cells": [{"id": 36, "text": "(2)", "bbox": {"l": 64.707993, "t": 392.34851, "r": 75.097656, "b": 400.72313999999994, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "A", "bbox": {"l": 77.545731, "t": 392.34851, "r": 84.351402, "b": 400.72313999999994, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "List-item", "bbox": {"l": 86.584, "t": 392.39339999999993, "r": 118.01329000000001, "b": 400.73215, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "is a paragraph with hanging indentation. Single-", "bbox": {"l": 120.26899999999999, "t": 392.34854, "r": 295.55695, "b": 400.72317999999996, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "line elements can qualify as", "bbox": {"l": 78.207001, "t": 403.30753, "r": 181.80978, "b": 411.68216, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "List-item", "bbox": {"l": 184.175, "t": 403.35239, "r": 216.68806000000004, "b": 411.69113, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "if the neighbour ele-", "bbox": {"l": 219.078, "t": 403.30753, "r": 295.56372, "b": 411.68216, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "ments expose hanging indentation. Bullet or enumeration", "bbox": {"l": 78.207001, "t": 414.2665400000001, "r": 294.04617, "b": 422.64116999999993, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "symbols are not a requirement.", "bbox": {"l": 78.207001, "t": 425.22552, "r": 192.00853, "b": 433.60016, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "(2) A List-item is a paragraph with hanging indentation. Singleline elements can qualify as List-item if the neighbour elements expose hanging indentation. Bullet or enumeration symbols are not a requirement."}, {"label": "list_item", "id": 10, "page_no": 4, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 64.708, "t": 436.18451000000005, "r": 294.04724, "b": 455.52713, "coord_origin": "TOPLEFT"}, "confidence": 0.941342830657959, "cells": [{"id": 45, "text": "(3)", "bbox": {"l": 64.708, "t": 436.18451000000005, "r": 74.483009, "b": 444.55914, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "For every", "bbox": {"l": 76.786255, "t": 436.18451000000005, "r": 112.61566, "b": 444.55914, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "Caption", "bbox": {"l": 114.861, "t": 436.2294, "r": 142.61249, "b": 444.56815000000006, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": ", there must be exactly one corresponding", "bbox": {"l": 142.612, "t": 436.18454, "r": 294.04724, "b": 444.55917, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "Picture", "bbox": {"l": 78.207001, "t": 447.18839, "r": 102.79287, "b": 455.52713, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "or", "bbox": {"l": 105.245, "t": 447.14352, "r": 113.09956999999999, "b": 455.51815999999997, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Table", "bbox": {"l": 115.341, "t": 447.18839, "r": 134.40356, "b": 455.52713, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": ".", "bbox": {"l": 134.403, "t": 447.14352, "r": 136.37561, "b": 455.51815999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "(3) For every Caption , there must be exactly one corresponding Picture or Table ."}, {"label": "list_item", "id": 9, "page_no": 4, "cluster": {"id": 9, "label": "list_item", "bbox": {"l": 64.708, "t": 458.1015300000001, "r": 294.04599, "b": 477.43518, "coord_origin": "TOPLEFT"}, "confidence": 0.9426738023757935, "cells": [{"id": 53, "text": "(4)", "bbox": {"l": 64.708, "t": 458.1015300000001, "r": 74.220215, "b": 466.47617, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "Connected sub-pictures are grouped together in one", "bbox": {"l": 76.461555, "t": 458.1015300000001, "r": 267.46786, "b": 466.47617, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "Picture", "bbox": {"l": 269.70599, "t": 458.14639, "r": 294.04599, "b": 466.48514, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "object.", "bbox": {"l": 78.207001, "t": 469.06055, "r": 102.29972, "b": 477.43518, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "(4) Connected sub-pictures are grouped together in one Picture object."}, {"label": "list_item", "id": 11, "page_no": 4, "cluster": {"id": 11, "label": "list_item", "bbox": {"l": 64.708, "t": 480.01953, "r": 264.50571, "b": 488.40314, "coord_origin": "TOPLEFT"}, "confidence": 0.9147457480430603, "cells": [{"id": 57, "text": "(5)", "bbox": {"l": 64.708, "t": 480.01953, "r": 74.345383, "b": 488.39417, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Formula numbers are included in a", "bbox": {"l": 76.616203, "t": 480.01953, "r": 206.13503, "b": 488.39417, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Formula", "bbox": {"l": 208.38, "t": 480.06439, "r": 238.12155, "b": 488.40314, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "object.", "bbox": {"l": 240.41300999999999, "t": 480.01953, "r": 264.50571, "b": 488.39417, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "(5) Formula numbers are included in a Formula object."}, {"label": "list_item", "id": 8, "page_no": 4, "cluster": {"id": 8, "label": "list_item", "bbox": {"l": 64.708008, "t": 490.97852, "r": 294.04617, "b": 521.27118, "coord_origin": "TOPLEFT"}, "confidence": 0.9544305205345154, "cells": [{"id": 61, "text": "(6)", "bbox": {"l": 64.708008, "t": 490.97852, "r": 74.564522, "b": 499.35315, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "Emphasised text (e.g. in italic or bold) at the beginning of", "bbox": {"l": 76.886978, "t": 490.97852, "r": 294.04617, "b": 499.35315, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "a paragraph is not considered a", "bbox": {"l": 78.207001, "t": 501.93753, "r": 200.34819, "b": 510.31216, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "Section-header", "bbox": {"l": 203.66701, "t": 501.98239, "r": 256.57504, "b": 510.32114, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": ", unless it", "bbox": {"l": 256.57401, "t": 501.93753, "r": 294.04401, "b": 510.31216, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "appears exclusively on its own line.", "bbox": {"l": 78.207001, "t": 512.8965499999999, "r": 208.13017, "b": 521.27118, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "(6) Emphasised text (e.g. in italic or bold) at the beginning of a paragraph is not considered a Section-header , unless it appears exclusively on its own line."}, {"label": "text", "id": 3, "page_no": 4, "cluster": {"id": 3, "label": "text", "bbox": {"l": 53.528999, "t": 532.9505300000001, "r": 295.56253, "b": 574.20117, "coord_origin": "TOPLEFT"}, "confidence": 0.9811431169509888, "cells": [{"id": 67, "text": "The complete annotation guideline is over 100 pages long and a", "bbox": {"l": 53.528999, "t": 532.9505300000001, "r": 294.04337, "b": 541.32516, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "detailed description is obviously out of scope for this paper. Never-", "bbox": {"l": 53.79800000000001, "t": 543.90855, "r": 295.56253, "b": 552.28317, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "theless, it will be made publicly available alongside with DocLayNet", "bbox": {"l": 53.79800000000001, "t": 554.8675499999999, "r": 294.04538, "b": 563.24217, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "for future reference.", "bbox": {"l": 53.79800000000001, "t": 565.82655, "r": 127.2418, "b": 574.20117, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The complete annotation guideline is over 100 pages long and a detailed description is obviously out of scope for this paper. Nevertheless, it will be made publicly available alongside with DocLayNet for future reference."}, {"label": "text", "id": 0, "page_no": 4, "cluster": {"id": 0, "label": "text", "bbox": {"l": 53.79800000000001, "t": 576.66899, "r": 295.56226, "b": 705.708176, "coord_origin": "TOPLEFT"}, "confidence": 0.9864389896392822, "cells": [{"id": 71, "text": "Phase 3: Training.", "bbox": {"l": 63.76100199999999, "t": 576.66899, "r": 136.7744, "b": 585.14224, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "After a first trial with a small group of peo-", "bbox": {"l": 139.008, "t": 576.7855500000001, "r": 295.56226, "b": 585.16017, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "ple, we realised that providing the annotation guideline and a set of", "bbox": {"l": 53.79800000000001, "t": 587.74455, "r": 294.04532, "b": 596.1191699999999, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "random practice pages did not yield the desired quality level for lay-", "bbox": {"l": 53.79800000000001, "t": 598.70355, "r": 295.55676, "b": 607.07817, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "out annotation. Therefore we prepared a subset of pages with two", "bbox": {"l": 53.79800000000001, "t": 609.66255, "r": 294.04605, "b": 618.0371700000001, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "different complexity levels, each with a practice and an exam part.", "bbox": {"l": 53.79800000000001, "t": 620.6215500000001, "r": 295.42377, "b": 628.99617, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "974 pages were reference-annotated by one proficient core team", "bbox": {"l": 53.79800000000001, "t": 631.58055, "r": 294.04712, "b": 639.95517, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "member. Annotation staff were then given the task to annotate the", "bbox": {"l": 53.79800000000001, "t": 642.53955, "r": 294.04922, "b": 650.91417, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "same subsets (blinded from the reference). By comparing the an-", "bbox": {"l": 53.79800000000001, "t": 653.49855, "r": 295.55618, "b": 661.87317, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "notations of each staff member with the reference annotations, we", "bbox": {"l": 53.79800000000001, "t": 664.45655, "r": 294.04874, "b": 672.83117, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "could quantify how closely their annotations matched the reference.", "bbox": {"l": 53.79800000000001, "t": 675.4155499999999, "r": 295.42496, "b": 683.79017, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "Only after passing two exam levels with high annotation quality,", "bbox": {"l": 53.79800000000001, "t": 686.37456, "r": 295.0274, "b": 694.749176, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "staff were admitted into the production phase. Practice iterations", "bbox": {"l": 53.79800000000001, "t": 697.333557, "r": 294.04114, "b": 705.708176, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Phase 3: Training. After a first trial with a small group of people, we realised that providing the annotation guideline and a set of random practice pages did not yield the desired quality level for layout annotation. Therefore we prepared a subset of pages with two different complexity levels, each with a practice and an exam part. 974 pages were reference-annotated by one proficient core team member. Annotation staff were then given the task to annotate the same subsets (blinded from the reference). By comparing the annotations of each staff member with the reference annotations, we could quantify how closely their annotations matched the reference. Only after passing two exam levels with high annotation quality, staff were admitted into the production phase. Practice iterations"}, {"label": "picture", "id": 16, "page_no": 4, "cluster": {"id": 16, "label": "picture", "bbox": {"l": 315.960205078125, "t": 85.33881378173828, "r": 559.396484375, "b": 459.68084716796875, "coord_origin": "TOPLEFT"}, "confidence": 0.7264117002487183, "cells": [{"id": 84, "text": "1ef23f5e6d7f10d393f9947e8208285dce9ae87250ac483ac4b4a59d51b4e037", "bbox": {"l": 340.00214, "t": 179.79296999999997, "r": 416.20551, "b": 181.90972999999997, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "Compliant with guidelines", "bbox": {"l": 339.38269, "t": 85.19066999999995, "r": 417.83722, "b": 92.28399999999999, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Plausible but invalid alternative", "bbox": {"l": 451.42834, "t": 85.19066999999995, "r": 546.22913, "b": 92.28399999999999, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Borderline case: Two guideline-compliant alternatives", "bbox": {"l": 350.33701, "t": 364.85706, "r": 513.48035, "b": 371.95035000000007, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "03c31a2ee1ed1b583c28957f475ee545d144e1b5a264dc4dd068c8d2f6a64860", "bbox": {"l": 340.00201, "t": 245.07385, "r": 416.20538, "b": 247.19061, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "1a5cd524f1844c1260c8e8c073e1f442423c264583212b0d0b6626fc780e6ed4", "bbox": {"l": 340.00201, "t": 359.12488, "r": 416.20538, "b": 361.24167, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "A", "bbox": {"l": 322.19424, "t": 98.34105999999997, "r": 326.01498, "b": 104.25214000000005, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "B", "bbox": {"l": 322.19424, "t": 186.99103000000002, "r": 326.01498, "b": 192.90204000000006, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "C", "bbox": {"l": 322.19424, "t": 253.54192999999998, "r": 326.01498, "b": 259.453, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "D", "bbox": {"l": 322.19424, "t": 367.08495999999997, "r": 326.01498, "b": 372.996, "coord_origin": "TOPLEFT"}}], "children": [{"id": 16, "label": "text", "bbox": {"l": 340.00214, "t": 179.79296999999997, "r": 416.20551, "b": 181.90972999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "1ef23f5e6d7f10d393f9947e8208285dce9ae87250ac483ac4b4a59d51b4e037", "bbox": {"l": 340.00214, "t": 179.79296999999997, "r": 416.20551, "b": 181.90972999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 339.38269, "t": 85.19066999999995, "r": 417.83722, "b": 92.28399999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "Compliant with guidelines", "bbox": {"l": 339.38269, "t": 85.19066999999995, "r": 417.83722, "b": 92.28399999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 451.42834, "t": 85.19066999999995, "r": 546.22913, "b": 92.28399999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "Plausible but invalid alternative", "bbox": {"l": 451.42834, "t": 85.19066999999995, "r": 546.22913, "b": 92.28399999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 350.33701, "t": 364.85706, "r": 513.48035, "b": 371.95035000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "Borderline case: Two guideline-compliant alternatives", "bbox": {"l": 350.33701, "t": 364.85706, "r": 513.48035, "b": 371.95035000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 340.00201, "t": 245.07385, "r": 416.20538, "b": 247.19061, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "03c31a2ee1ed1b583c28957f475ee545d144e1b5a264dc4dd068c8d2f6a64860", "bbox": {"l": 340.00201, "t": 245.07385, "r": 416.20538, "b": 247.19061, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 340.00201, "t": 359.12488, "r": 416.20538, "b": 361.24167, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "1a5cd524f1844c1260c8e8c073e1f442423c264583212b0d0b6626fc780e6ed4", "bbox": {"l": 340.00201, "t": 359.12488, "r": 416.20538, "b": 361.24167, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 322.19424, "t": 98.34105999999997, "r": 326.01498, "b": 104.25214000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "A", "bbox": {"l": 322.19424, "t": 98.34105999999997, "r": 326.01498, "b": 104.25214000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 322.19424, "t": 186.99103000000002, "r": 326.01498, "b": 192.90204000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "B", "bbox": {"l": 322.19424, "t": 186.99103000000002, "r": 326.01498, "b": 192.90204000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 322.19424, "t": 253.54192999999998, "r": 326.01498, "b": 259.453, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "C", "bbox": {"l": 322.19424, "t": 253.54192999999998, "r": 326.01498, "b": 259.453, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 322.19424, "t": 367.08495999999997, "r": 326.01498, "b": 372.996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "D", "bbox": {"l": 322.19424, "t": 367.08495999999997, "r": 326.01498, "b": 372.996, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "text", "id": 22, "page_no": 4, "cluster": {"id": 22, "label": "text", "bbox": {"l": 400.12842, "t": 458.44327000000004, "r": 476.33178999999996, "b": 460.5600600000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "05237a14f2524e3f53c8454b074409d05078038a6a36b770fcc8ec7e540deae0", "bbox": {"l": 400.12842, "t": 458.44327000000004, "r": 476.33178999999996, "b": 460.5600600000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "05237a14f2524e3f53c8454b074409d05078038a6a36b770fcc8ec7e540deae0"}, {"label": "caption", "id": 14, "page_no": 4, "cluster": {"id": 14, "label": "caption", "bbox": {"l": 317.95499, "t": 473.49399, "r": 559.80579, "b": 503.88519, "coord_origin": "TOPLEFT"}, "confidence": 0.8873710632324219, "cells": [{"id": 95, "text": "Figure 4: Examples of plausible annotation alternatives for", "bbox": {"l": 317.95499, "t": 473.49399, "r": 558.3891, "b": 481.96722, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "the same page. Criteria in our annotation guideline can re-", "bbox": {"l": 317.95499, "t": 484.45297, "r": 559.80579, "b": 492.92621, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "solve cases A to C, while the case D remains ambiguous.", "bbox": {"l": 317.95499, "t": 495.41196, "r": 544.14148, "b": 503.88519, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 4: Examples of plausible annotation alternatives for the same page. Criteria in our annotation guideline can resolve cases A to C, while the case D remains ambiguous."}, {"label": "text", "id": 6, "page_no": 4, "cluster": {"id": 6, "label": "text", "bbox": {"l": 317.62299, "t": 525.49753, "r": 558.20435, "b": 544.83118, "coord_origin": "TOPLEFT"}, "confidence": 0.9611717462539673, "cells": [{"id": 98, "text": "were carried out over a timeframe of 12 weeks, after which 8 of the", "bbox": {"l": 317.62299, "t": 525.49753, "r": 558.20435, "b": 533.87216, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "40", "bbox": {"l": 317.74899, "t": 536.45656, "r": 326.07019, "b": 544.83118, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "initially allocated annotators did not pass the bar.", "bbox": {"l": 328.3071, "t": 536.45656, "r": 509.11896, "b": 544.83118, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "were carried out over a timeframe of 12 weeks, after which 8 of the 40 initially allocated annotators did not pass the bar."}, {"label": "text", "id": 2, "page_no": 4, "cluster": {"id": 2, "label": "text", "bbox": {"l": 317.62299, "t": 547.299, "r": 559.7149, "b": 709.2151719999999, "coord_origin": "TOPLEFT"}, "confidence": 0.982954204082489, "cells": [{"id": 101, "text": "Phase 4: Production annotation.", "bbox": {"l": 327.918, "t": 547.299, "r": 456.80109000000004, "b": 555.77225, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "The previously selected 80K", "bbox": {"l": 458.7120100000001, "t": 547.41556, "r": 558.48926, "b": 555.79018, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "pages were annotated with the defined 11 class labels by 32 annota-", "bbox": {"l": 317.95499, "t": 558.37456, "r": 559.71368, "b": 566.74918, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "tors. This production phase took around three months to complete.", "bbox": {"l": 317.95499, "t": 569.33356, "r": 559.58124, "b": 577.7081800000001, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "All annotations were created online through CCS, which visualises", "bbox": {"l": 317.64099, "t": 580.29256, "r": 558.20386, "b": 588.66718, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "the programmatic PDF text-cells as an overlay on the page. The page", "bbox": {"l": 317.95499, "t": 591.25156, "r": 558.20221, "b": 599.62617, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "annotation are obtained by drawing rectangular bounding-boxes,", "bbox": {"l": 317.95499, "t": 602.20955, "r": 559.18457, "b": 610.58417, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "as shown in Figure 3. With regard to the annotation practices, we", "bbox": {"l": 317.95499, "t": 613.16855, "r": 558.20197, "b": 621.54317, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "implemented a few constraints and capabilities on the tooling level.", "bbox": {"l": 317.95499, "t": 624.12755, "r": 559.58197, "b": 632.50217, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "First, we only allow non-overlapping, vertically oriented, rectangu-", "bbox": {"l": 317.95499, "t": 635.08655, "r": 559.71411, "b": 643.46117, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "lar boxes. For the large majority of documents, this constraint was", "bbox": {"l": 317.95499, "t": 646.04555, "r": 558.20557, "b": 654.42017, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "sufficient and it speeds up the annotation considerably in compar-", "bbox": {"l": 317.95499, "t": 657.00455, "r": 559.7149, "b": 665.3791699999999, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "ison with arbitrary segmentation shapes. Second, annotator staff", "bbox": {"l": 317.95499, "t": 667.9635499999999, "r": 558.19849, "b": 676.33817, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "were not able to see each other\u2019s annotations. This was enforced by", "bbox": {"l": 317.62299, "t": 678.92255, "r": 558.43268, "b": 687.29717, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "design to avoid any bias in the annotation, which could skew the", "bbox": {"l": 317.95499, "t": 689.8815500000001, "r": 558.19806, "b": 698.256172, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "numbers of the inter-annotator agreement (see Table 1). We wanted", "bbox": {"l": 317.95499, "t": 700.840553, "r": 558.20227, "b": 709.2151719999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Phase 4: Production annotation. The previously selected 80K pages were annotated with the defined 11 class labels by 32 annotators. This production phase took around three months to complete. All annotations were created online through CCS, which visualises the programmatic PDF text-cells as an overlay on the page. The page annotation are obtained by drawing rectangular bounding-boxes, as shown in Figure 3. With regard to the annotation practices, we implemented a few constraints and capabilities on the tooling level. First, we only allow non-overlapping, vertically oriented, rectangular boxes. For the large majority of documents, this constraint was sufficient and it speeds up the annotation considerably in comparison with arbitrary segmentation shapes. Second, annotator staff were not able to see each other\u2019s annotations. This was enforced by design to avoid any bias in the annotation, which could skew the numbers of the inter-annotator agreement (see Table 1). We wanted"}], "headers": [{"label": "page_header", "id": 13, "page_no": 4, "cluster": {"id": 13, "label": "page_header", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.887782871723175, "cells": [{"id": 0, "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis"}, {"label": "page_header", "id": 15, "page_no": 4, "cluster": {"id": 15, "label": "page_header", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.8534672856330872, "cells": [{"id": 1, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA"}]}}, {"page_no": 5, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 246.24382, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar", "bbox": {"l": 253.13897999999998, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Table 2: Prediction performance (mAP@0.5-0.95) of object", "bbox": {"l": 53.501999, "t": 86.87292000000002, "r": 294.04361, "b": 95.34618999999998, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "detection networks on DocLayNet test set. The MRCNN", "bbox": {"l": 53.79800000000001, "t": 97.83191, "r": 294.04373, "b": 106.30517999999995, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "(Mask R-CNN) and FRCNN (Faster R-CNN) models with", "bbox": {"l": 53.52, "t": 108.79088999999999, "r": 294.0437, "b": 117.26415999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "ResNet-50 or ResNet-101 backbone were trained based on", "bbox": {"l": 53.79800000000001, "t": 119.74987999999996, "r": 294.04373, "b": 128.22313999999994, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "the network architectures from the", "bbox": {"l": 53.79800000000001, "t": 130.70885999999996, "r": 202.43402, "b": 139.18213000000003, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "detectron2", "bbox": {"l": 206.08501, "t": 130.71783000000005, "r": 247.14215000000002, "b": 139.20905000000005, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "model zoo", "bbox": {"l": 250.95001, "t": 130.70885999999996, "r": 294.04254, "b": 139.18213000000003, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "(Mask R-CNN R50, R101-FPN 3x, Faster R-CNN R101-FPN", "bbox": {"l": 53.52002, "t": 141.66785000000004, "r": 294.04367, "b": 150.14111000000003, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "3x), with default configurations. The YOLO implementation", "bbox": {"l": 53.798019, "t": 152.62683000000004, "r": 294.04373, "b": 161.1001, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "utilized was YOLOv5x6 [13]. All models were initialised us-", "bbox": {"l": 53.798019, "t": 163.58582, "r": 295.64874, "b": 172.05908, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "ing pre-trained weights from the COCO 2017 dataset.", "bbox": {"l": 53.798019, "t": 174.54381999999998, "r": 268.62399, "b": 183.01709000000005, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "human", "bbox": {"l": 132.36501, "t": 197.97351000000003, "r": 157.99098, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "MRCNN", "bbox": {"l": 173.505, "t": 197.97351000000003, "r": 204.61841, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "FRCNN", "bbox": {"l": 220.13028, "t": 197.97351000000003, "r": 248.06958, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "YOLO", "bbox": {"l": 258.03125, "t": 197.97351000000003, "r": 280.17825, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "R50", "bbox": {"l": 168.39301, "t": 208.93255999999997, "r": 181.99504, "b": 217.30719, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "R101", "bbox": {"l": 192.39606, "t": 208.93255999999997, "r": 210.16747, "b": 217.30719, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "R101", "bbox": {"l": 225.21309, "t": 208.93255999999997, "r": 242.9845, "b": 217.30719, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "v5x6", "bbox": {"l": 260.51379, "t": 208.93255999999997, "r": 277.70239, "b": 217.30719, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Caption", "bbox": {"l": 67.663002, "t": 220.28954999999996, "r": 96.848633, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "84-89", "bbox": {"l": 135.32401, "t": 220.28954999999996, "r": 155.03215, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "68.4", "bbox": {"l": 167.95399, "t": 220.28954999999996, "r": 182.43472, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "71.5", "bbox": {"l": 194.0462, "t": 220.28954999999996, "r": 208.52695, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "70.1", "bbox": {"l": 226.86324000000002, "t": 220.28954999999996, "r": 241.34396, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "77.7", "bbox": {"l": 261.86804, "t": 220.28954999999996, "r": 276.34879, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Footnote", "bbox": {"l": 67.663002, "t": 231.24854000000005, "r": 100.1662, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "83-91", "bbox": {"l": 135.32401, "t": 231.24854000000005, "r": 155.03215, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "70.9", "bbox": {"l": 167.95399, "t": 231.24854000000005, "r": 182.43472, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "71.8", "bbox": {"l": 194.0462, "t": 231.24854000000005, "r": 208.52695, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "73.7", "bbox": {"l": 226.86324000000002, "t": 231.24854000000005, "r": 241.34396, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "77.2", "bbox": {"l": 261.86804, "t": 231.24854000000005, "r": 276.34879, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "Formula", "bbox": {"l": 67.663002, "t": 242.20752000000005, "r": 98.175659, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "83-85", "bbox": {"l": 135.32401, "t": 242.20752000000005, "r": 155.03215, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "60.1", "bbox": {"l": 167.95399, "t": 242.20752000000005, "r": 182.43472, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "63.4", "bbox": {"l": 194.0462, "t": 242.20752000000005, "r": 208.52695, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "63.5", "bbox": {"l": 226.86324000000002, "t": 242.20752000000005, "r": 241.34396, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "66.2", "bbox": {"l": 261.86804, "t": 242.20752000000005, "r": 276.34879, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "List-item", "bbox": {"l": 67.663002, "t": 253.16656, "r": 100.54279, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "87-88", "bbox": {"l": 135.32401, "t": 253.16656, "r": 155.03215, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "81.2", "bbox": {"l": 167.95399, "t": 253.16656, "r": 182.43472, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "80.8", "bbox": {"l": 194.0462, "t": 253.16656, "r": 208.52695, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "81.0", "bbox": {"l": 226.86324000000002, "t": 253.16656, "r": 241.34396, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "86.2", "bbox": {"l": 261.86804, "t": 253.16656, "r": 276.34879, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Page-footer", "bbox": {"l": 67.663002, "t": 264.12555, "r": 110.19064, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "93-94", "bbox": {"l": 135.32401, "t": 264.12555, "r": 155.03215, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "61.6", "bbox": {"l": 167.95399, "t": 264.12555, "r": 182.43472, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "59.3", "bbox": {"l": 194.0462, "t": 264.12555, "r": 208.52695, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "58.9", "bbox": {"l": 226.86324000000002, "t": 264.12555, "r": 241.34396, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "61.1", "bbox": {"l": 261.86804, "t": 264.12555, "r": 276.34879, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Page-header", "bbox": {"l": 67.663002, "t": 275.08453, "r": 112.94331999999999, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "85-89", "bbox": {"l": 135.32401, "t": 275.08453, "r": 155.03215, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "71.9", "bbox": {"l": 167.95399, "t": 275.08453, "r": 182.43472, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "70.0", "bbox": {"l": 194.0462, "t": 275.08453, "r": 208.52695, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "72.0", "bbox": {"l": 226.86324000000002, "t": 275.08453, "r": 241.34396, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "67.9", "bbox": {"l": 261.86804, "t": 275.08453, "r": 276.34879, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Picture", "bbox": {"l": 67.663002, "t": 286.04355000000004, "r": 93.647629, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "69-71", "bbox": {"l": 135.32401, "t": 286.04355000000004, "r": 155.03215, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "71.7", "bbox": {"l": 167.95399, "t": 286.04355000000004, "r": 182.43472, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "72.7", "bbox": {"l": 194.0462, "t": 286.04355000000004, "r": 208.52695, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "72.0", "bbox": {"l": 226.86324000000002, "t": 286.04355000000004, "r": 241.34396, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "77.1", "bbox": {"l": 261.86804, "t": 286.04355000000004, "r": 276.34879, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "Section-header", "bbox": {"l": 67.663002, "t": 297.00253, "r": 122.40287999999998, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "83-84", "bbox": {"l": 135.32401, "t": 297.00253, "r": 155.03215, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "67.6", "bbox": {"l": 167.95399, "t": 297.00253, "r": 182.43472, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "69.3", "bbox": {"l": 194.0462, "t": 297.00253, "r": 208.52695, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "68.4", "bbox": {"l": 226.86324000000002, "t": 297.00253, "r": 241.34396, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "74.6", "bbox": {"l": 261.86804, "t": 297.00253, "r": 276.34879, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "Table", "bbox": {"l": 67.663002, "t": 307.96155, "r": 87.46978, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "77-81", "bbox": {"l": 135.32401, "t": 307.96155, "r": 155.03215, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "82.2", "bbox": {"l": 167.95399, "t": 307.96155, "r": 182.43472, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "82.9", "bbox": {"l": 194.0462, "t": 307.96155, "r": 208.52695, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "82.2", "bbox": {"l": 226.86324000000002, "t": 307.96155, "r": 241.34396, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "86.3", "bbox": {"l": 261.86804, "t": 307.96155, "r": 276.34879, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "Text", "bbox": {"l": 67.663002, "t": 318.91953, "r": 83.623199, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "84-86", "bbox": {"l": 135.32401, "t": 318.91953, "r": 155.03215, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "84.6", "bbox": {"l": 167.95399, "t": 318.91953, "r": 182.43472, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "85.8", "bbox": {"l": 194.0462, "t": 318.91953, "r": 208.52695, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "85.4", "bbox": {"l": 226.86324000000002, "t": 318.91953, "r": 241.34396, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "88.1", "bbox": {"l": 261.86804, "t": 318.91953, "r": 276.34879, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Title", "bbox": {"l": 67.663002, "t": 329.87854, "r": 84.654327, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "60-72", "bbox": {"l": 135.32401, "t": 329.87854, "r": 155.03215, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "76.7", "bbox": {"l": 167.95399, "t": 329.87854, "r": 182.43472, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "80.4", "bbox": {"l": 194.0462, "t": 329.87854, "r": 208.52695, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "79.9", "bbox": {"l": 226.86324000000002, "t": 329.87854, "r": 241.34396, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "82.7", "bbox": {"l": 261.86804, "t": 329.87854, "r": 276.34879, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "All", "bbox": {"l": 67.663002, "t": 341.23654, "r": 78.628906, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "82-83", "bbox": {"l": 135.32401, "t": 341.23654, "r": 155.03215, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "72.4", "bbox": {"l": 167.95399, "t": 341.23654, "r": 182.43472, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "73.5", "bbox": {"l": 194.0462, "t": 341.23654, "r": 208.52695, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "73.4", "bbox": {"l": 226.86324000000002, "t": 341.23654, "r": 241.34396, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "76.8", "bbox": {"l": 261.86804, "t": 341.23654, "r": 276.34879, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "to avoid this at any cost in order to have clear, unbiased baseline", "bbox": {"l": 53.79800000000001, "t": 370.92755, "r": 294.04712, "b": 379.30219000000005, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "numbers for human document-layout annotation. Third, we in-", "bbox": {"l": 53.79800000000001, "t": 381.88654, "r": 295.55612, "b": 390.26117, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "troduced the feature of", "bbox": {"l": 53.79800000000001, "t": 392.84555, "r": 140.3623, "b": 401.22017999999997, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "snapping", "bbox": {"l": 142.99001, "t": 392.89041, "r": 175.9695, "b": 401.2291599999999, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "boxes around text segments to", "bbox": {"l": 178.951, "t": 392.84555, "r": 294.04083, "b": 401.22017999999997, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "obtain a pixel-accurate annotation and again reduce time and effort.", "bbox": {"l": 53.79800000000001, "t": 403.80453, "r": 295.42493, "b": 412.17917, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "The CCS annotation tool automatically shrinks every user-drawn", "bbox": {"l": 53.528999, "t": 414.76355, "r": 294.04251, "b": 423.13818, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "box to the minimum bounding-box around the enclosed text-cells", "bbox": {"l": 53.79800000000001, "t": 425.72253, "r": 294.04807, "b": 434.09717, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "for all purely text-based segments, which excludes only", "bbox": {"l": 53.79800000000001, "t": 436.6815500000001, "r": 256.80627, "b": 445.0561799999999, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "Table", "bbox": {"l": 259.04199, "t": 436.72641, "r": 278.10455, "b": 445.06516, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "and", "bbox": {"l": 280.54999, "t": 436.6815500000001, "r": 294.04443, "b": 445.0561799999999, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "Picture", "bbox": {"l": 53.79800000000001, "t": 447.68539, "r": 78.875587, "b": 456.02413999999993, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": ". For the latter, we instructed annotation staff to minimise", "bbox": {"l": 78.876999, "t": 447.64053, "r": 294.04852, "b": 456.01517, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "inclusion of surrounding whitespace while including all graphical", "bbox": {"l": 53.79800000000001, "t": 458.59955, "r": 294.04645, "b": 466.97418, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "lines. A downside of snapping boxes to enclosed text cells is that", "bbox": {"l": 53.79800000000001, "t": 469.55853, "r": 294.0416, "b": 477.93317, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "some wrongly parsed PDF pages cannot be annotated correctly and", "bbox": {"l": 53.79800000000001, "t": 480.51654, "r": 294.04538, "b": 488.89117, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "need to be skipped. Fourth, we established a way to flag pages as", "bbox": {"l": 53.79800000000001, "t": 491.47552, "r": 294.04312, "b": 499.85016, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "rejected", "bbox": {"l": 53.79800000000001, "t": 502.4794, "r": 80.597939, "b": 510.81815, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "for cases where no valid annotation according to the label", "bbox": {"l": 83.366997, "t": 502.43454, "r": 294.04483, "b": 510.80917, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "guidelines could be achieved. Example cases for this would be PDF", "bbox": {"l": 53.79800000000001, "t": 513.3935200000001, "r": 294.25833, "b": 521.7681600000001, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "pages that render incorrectly or contain layouts that are impossible", "bbox": {"l": 53.79800000000001, "t": 524.35254, "r": 294.04535, "b": 532.72717, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "to capture with non-overlapping rectangles. Such rejected pages are", "bbox": {"l": 53.79800000000001, "t": 535.31155, "r": 294.04535, "b": 543.68617, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "not contained in the final dataset. With all these measures in place,", "bbox": {"l": 53.79800000000001, "t": 546.27055, "r": 295.02759, "b": 554.64517, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "experienced annotation staff managed to annotate a single page in", "bbox": {"l": 53.79800000000001, "t": 557.22955, "r": 294.0488, "b": 565.6041700000001, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "a typical timeframe of 20s to 60s, depending on its complexity.", "bbox": {"l": 53.79800000000001, "t": 568.18855, "r": 281.80457, "b": 576.56317, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "5", "bbox": {"l": 53.79800000000001, "t": 588.12991, "r": 59.405277, "b": 598.43901, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "EXPERIMENTS", "bbox": {"l": 70.314377, "t": 588.12991, "r": 147.48535, "b": 598.43901, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "The primary goal of DocLayNet is to obtain high-quality ML models", "bbox": {"l": 53.528999, "t": 613.25356, "r": 294.04871, "b": 621.6281700000001, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "capable of accurate document-layout analysis on a wide variety", "bbox": {"l": 53.79800000000001, "t": 624.21255, "r": 294.27576, "b": 632.58717, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "of challenging layouts. As discussed in Section 2, object detection", "bbox": {"l": 53.79800000000001, "t": 635.17155, "r": 294.04144, "b": 643.54617, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "models are currently the easiest to use, due to the standardisation", "bbox": {"l": 53.79800000000001, "t": 646.13055, "r": 294.04163, "b": 654.50517, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "of ground-truth data in COCO format [16] and the availability of", "bbox": {"l": 53.79800000000001, "t": 657.0885499999999, "r": 294.0412, "b": 665.46317, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "general frameworks such as", "bbox": {"l": 53.79800000000001, "t": 668.04755, "r": 155.01054, "b": 676.42217, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "detectron2", "bbox": {"l": 157.23599, "t": 668.09238, "r": 193.26666, "b": 676.43114, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "[17]. Furthermore, baseline", "bbox": {"l": 195.867, "t": 668.04755, "r": 294.0473, "b": 676.42217, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "numbers in PubLayNet and DocBank were obtained using standard", "bbox": {"l": 53.79800000000001, "t": 679.0065500000001, "r": 294.04538, "b": 687.38117, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "object detection models such as Mask R-CNN and Faster R-CNN.", "bbox": {"l": 53.79800000000001, "t": 689.96555, "r": 295.4281, "b": 698.3401719999999, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "As such, we will relate to these object detection methods in this", "bbox": {"l": 53.484001, "t": 700.9245530000001, "r": 294.04413, "b": 709.299171, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "0", "bbox": {"l": 349.16577, "t": 246.68017999999995, "r": 352.48175, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "20", "bbox": {"l": 385.93698, "t": 246.68017999999995, "r": 392.56894, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "40", "bbox": {"l": 424.366, "t": 246.68017999999995, "r": 430.99796, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "60", "bbox": {"l": 462.79504000000003, "t": 246.68017999999995, "r": 469.427, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "80", "bbox": {"l": 501.22406, "t": 246.68017999999995, "r": 507.85602, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "100", "bbox": {"l": 537.99524, "t": 246.68017999999995, "r": 547.94318, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "% of DocLayNet training set", "bbox": {"l": 410.28143, "t": 253.80840999999998, "r": 483.47278000000006, "b": 259.88251, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "50", "bbox": {"l": 330.93539, "t": 218.38464, "r": 337.56735, "b": 224.45874000000003, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "55", "bbox": {"l": 330.93539, "t": 192.08660999999995, "r": 337.56735, "b": 198.16071, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "60", "bbox": {"l": 330.93539, "t": 165.78864, "r": 337.56735, "b": 171.86273000000006, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "65", "bbox": {"l": 330.93539, "t": 139.49059999999997, "r": 337.56735, "b": 145.56470000000002, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "70", "bbox": {"l": 330.93539, "t": 113.19263000000001, "r": 337.56735, "b": 119.26671999999996, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "mAP 0.50:0.95", "bbox": {"l": 322.92276, "t": 148.37689, "r": 328.99686, "b": 186.79218000000003, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "10", "bbox": {"l": 470.97235, "t": 235.36676, "r": 477.6055, "b": 241.44086000000004, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "1", "bbox": {"l": 477.65662, "t": 234.82390999999996, "r": 479.97778000000005, "b": 239.07581000000005, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "10", "bbox": {"l": 531.55127, "t": 235.41234999999995, "r": 538.18445, "b": 241.48645, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "2", "bbox": {"l": 538.23553, "t": 234.86951, "r": 540.5567, "b": 239.1214, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "50", "bbox": {"l": 404.91125, "t": 216.00005999999996, "r": 411.54321, "b": 222.07416, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "55", "bbox": {"l": 404.91125, "t": 200.22125000000005, "r": 411.54321, "b": 206.29534999999998, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "60", "bbox": {"l": 404.91125, "t": 184.44244000000003, "r": 411.54321, "b": 190.51653999999996, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "65", "bbox": {"l": 404.91125, "t": 168.66364, "r": 411.54321, "b": 174.73773000000006, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "70", "bbox": {"l": 404.91125, "t": 152.88489000000004, "r": 411.54321, "b": 158.95898, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "Figure 5: Prediction performance (mAP@0.5-0.95) of a Mask", "bbox": {"l": 317.95499, "t": 279.01599, "r": 558.47876, "b": 287.48923, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "R-CNN network with ResNet50 backbone trained on increas-", "bbox": {"l": 317.95499, "t": 289.97501, "r": 559.80579, "b": 298.44824, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "ing fractions of the DocLayNet dataset. The learning curve", "bbox": {"l": 317.95499, "t": 300.93399, "r": 558.20068, "b": 309.40723, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "flattens around the 80% mark, indicating that increasing the", "bbox": {"l": 317.95499, "t": 311.89297, "r": 558.20062, "b": 320.36620999999997, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "size of the DocLayNet dataset with similar data will not yield", "bbox": {"l": 317.95499, "t": 322.85196, "r": 558.20074, "b": 331.3252, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "significantly better predictions.", "bbox": {"l": 317.95499, "t": 333.81094, "r": 445.24207, "b": 342.28418000000005, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "paper and leave the detailed evaluation of more recent methods", "bbox": {"l": 317.95499, "t": 384.01154, "r": 558.20416, "b": 392.38617, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "mentioned in Section 2 for future work.", "bbox": {"l": 317.95499, "t": 394.97055, "r": 463.04938, "b": 403.34517999999997, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "In this section, we will present several aspects related to the", "bbox": {"l": 327.918, "t": 405.92953, "r": 558.19836, "b": 414.30417, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "performance of object detection models on DocLayNet. Similarly", "bbox": {"l": 317.95499, "t": 416.88855, "r": 558.4364, "b": 425.26318, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "as in PubLayNet, we will evaluate the quality of their predictions", "bbox": {"l": 317.95499, "t": 427.84653, "r": 558.20563, "b": 436.22116, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "using mean average precision (mAP) with 10 overlaps that range", "bbox": {"l": 317.95499, "t": 438.80554, "r": 558.20044, "b": 447.18018, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "from 0.5 to 0.95 in steps of 0.05 (mAP@0.5-0.95). These scores are", "bbox": {"l": 317.95499, "t": 449.76453000000004, "r": 558.19891, "b": 458.13916, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "computed by leveraging the evaluation code provided by the COCO", "bbox": {"l": 317.95499, "t": 460.72354, "r": 558.20239, "b": 469.09818, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "API [16].", "bbox": {"l": 317.64099, "t": 471.68253, "r": 350.32352, "b": 480.05716, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "Baselines for Object Detection", "bbox": {"l": 317.95499, "t": 496.8219, "r": 466.8532400000001, "b": 507.13098, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "In Table 2, we present baseline experiments (given in mAP) on Mask", "bbox": {"l": 317.95499, "t": 512.02454, "r": 558.43085, "b": 520.39917, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "R-CNN [12], Faster R-CNN [11], and YOLOv5 [13]. Both training", "bbox": {"l": 317.95499, "t": 522.9835499999999, "r": 558.20117, "b": 531.35818, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "and evaluation were performed on RGB images with dimensions of", "bbox": {"l": 317.95499, "t": 533.94254, "r": 558.20233, "b": 542.31717, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "1025", "bbox": {"l": 317.74899, "t": 544.90155, "r": 334.09296, "b": 553.27617, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "\u00d7", "bbox": {"l": 334.81201, "t": 544.84775, "r": 340.51465, "b": 552.5499, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "1025 pixels. For training, we only used one annotation in case", "bbox": {"l": 341.233, "t": 544.90155, "r": 558.20117, "b": 553.27617, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "of redundantly annotated pages. As one can observe, the variation", "bbox": {"l": 317.95499, "t": 555.85956, "r": 558.20392, "b": 564.23418, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "in mAP between the models is rather low, but overall between 6", "bbox": {"l": 317.95499, "t": 566.8185599999999, "r": 558.2041, "b": 575.19318, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "and 10% lower than the mAP computed from the pairwise human", "bbox": {"l": 317.95499, "t": 577.77756, "r": 558.2052, "b": 586.15218, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "annotations on triple-annotated pages. This gives a good indication", "bbox": {"l": 317.95499, "t": 588.73656, "r": 558.20233, "b": 597.11118, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "that the DocLayNet dataset poses a worthwhile challenge for the", "bbox": {"l": 317.95499, "t": 599.69556, "r": 558.1983, "b": 608.0701799999999, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "research community to close the gap between human recognition", "bbox": {"l": 317.95499, "t": 610.65456, "r": 558.20502, "b": 619.02917, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "and ML approaches. It is interesting to see that Mask R-CNN and", "bbox": {"l": 317.95499, "t": 621.61356, "r": 558.20337, "b": 629.98817, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "Faster R-CNN produce very comparable mAP scores, indicating", "bbox": {"l": 317.95499, "t": 632.5725600000001, "r": 558.2041, "b": 640.94717, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "that pixel-based image segmentation derived from bounding-boxes", "bbox": {"l": 317.95499, "t": 643.53156, "r": 558.20245, "b": 651.90617, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "does not help to obtain better predictions. On the other hand, the", "bbox": {"l": 317.95499, "t": 654.49055, "r": 558.19757, "b": 662.86517, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": "more recent Yolov5x model does very well and even out-performs", "bbox": {"l": 317.95499, "t": 665.44855, "r": 558.20404, "b": 673.82317, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "humans on selected labels such as", "bbox": {"l": 317.95499, "t": 676.40755, "r": 444.54102, "b": 684.78217, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "Text", "bbox": {"l": 446.78900000000004, "t": 676.45238, "r": 461.95261000000005, "b": 684.79114, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": ",", "bbox": {"l": 461.95599000000004, "t": 676.40755, "r": 463.96805000000006, "b": 684.78217, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "Table", "bbox": {"l": 466.2170100000001, "t": 676.45238, "r": 485.66998000000007, "b": 684.79114, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "and", "bbox": {"l": 488.1290000000001, "t": 676.40755, "r": 501.89330999999993, "b": 684.78217, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "Picture", "bbox": {"l": 504.142, "t": 676.45238, "r": 529.21954, "b": 684.79114, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": ". This is", "bbox": {"l": 529.22101, "t": 676.40755, "r": 558.20392, "b": 684.78217, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "not entirely surprising, as", "bbox": {"l": 317.95499, "t": 687.36655, "r": 410.81366, "b": 695.741173, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "Text", "bbox": {"l": 413.05301, "t": 687.41138, "r": 427.67865, "b": 695.750137, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": ",", "bbox": {"l": 427.67801, "t": 687.36655, "r": 429.62103, "b": 695.741173, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "Table", "bbox": {"l": 431.86099, "t": 687.41138, "r": 450.62881000000004, "b": 695.750137, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "and", "bbox": {"l": 453.082, "t": 687.36655, "r": 466.37402, "b": 695.741173, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "Picture", "bbox": {"l": 468.61499, "t": 687.41138, "r": 492.83208999999994, "b": 695.750137, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "are abundant and", "bbox": {"l": 495.28201, "t": 687.36655, "r": 558.2005, "b": 695.741173, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "the most visually distinctive in a document.", "bbox": {"l": 317.95499, "t": 698.325554, "r": 477.53903, "b": 706.700172, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 11, "label": "page_header", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.8662874698638916, "cells": [{"id": 0, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 246.24382, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar", "bbox": {"l": 253.13897999999998, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "text", "bbox": {"l": 53.501999, "t": 86.87292000000002, "r": 295.64874, "b": 183.01709000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9782760143280029, "cells": [{"id": 2, "text": "Table 2: Prediction performance (mAP@0.5-0.95) of object", "bbox": {"l": 53.501999, "t": 86.87292000000002, "r": 294.04361, "b": 95.34618999999998, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "detection networks on DocLayNet test set. The MRCNN", "bbox": {"l": 53.79800000000001, "t": 97.83191, "r": 294.04373, "b": 106.30517999999995, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "(Mask R-CNN) and FRCNN (Faster R-CNN) models with", "bbox": {"l": 53.52, "t": 108.79088999999999, "r": 294.0437, "b": 117.26415999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "ResNet-50 or ResNet-101 backbone were trained based on", "bbox": {"l": 53.79800000000001, "t": 119.74987999999996, "r": 294.04373, "b": 128.22313999999994, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "the network architectures from the", "bbox": {"l": 53.79800000000001, "t": 130.70885999999996, "r": 202.43402, "b": 139.18213000000003, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "detectron2", "bbox": {"l": 206.08501, "t": 130.71783000000005, "r": 247.14215000000002, "b": 139.20905000000005, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "model zoo", "bbox": {"l": 250.95001, "t": 130.70885999999996, "r": 294.04254, "b": 139.18213000000003, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "(Mask R-CNN R50, R101-FPN 3x, Faster R-CNN R101-FPN", "bbox": {"l": 53.52002, "t": 141.66785000000004, "r": 294.04367, "b": 150.14111000000003, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "3x), with default configurations. The YOLO implementation", "bbox": {"l": 53.798019, "t": 152.62683000000004, "r": 294.04373, "b": 161.1001, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "utilized was YOLOv5x6 [13]. All models were initialised us-", "bbox": {"l": 53.798019, "t": 163.58582, "r": 295.64874, "b": 172.05908, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "ing pre-trained weights from the COCO 2017 dataset.", "bbox": {"l": 53.798019, "t": 174.54381999999998, "r": 268.62399, "b": 183.01709000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "table", "bbox": {"l": 62.02753829956055, "t": 195.6800537109375, "r": 285.78955078125, "b": 351.6618957519531, "coord_origin": "TOPLEFT"}, "confidence": 0.9883638620376587, "cells": [{"id": 13, "text": "human", "bbox": {"l": 132.36501, "t": 197.97351000000003, "r": 157.99098, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "MRCNN", "bbox": {"l": 173.505, "t": 197.97351000000003, "r": 204.61841, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "FRCNN", "bbox": {"l": 220.13028, "t": 197.97351000000003, "r": 248.06958, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "YOLO", "bbox": {"l": 258.03125, "t": 197.97351000000003, "r": 280.17825, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "R50", "bbox": {"l": 168.39301, "t": 208.93255999999997, "r": 181.99504, "b": 217.30719, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "R101", "bbox": {"l": 192.39606, "t": 208.93255999999997, "r": 210.16747, "b": 217.30719, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "R101", "bbox": {"l": 225.21309, "t": 208.93255999999997, "r": 242.9845, "b": 217.30719, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "v5x6", "bbox": {"l": 260.51379, "t": 208.93255999999997, "r": 277.70239, "b": 217.30719, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Caption", "bbox": {"l": 67.663002, "t": 220.28954999999996, "r": 96.848633, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "84-89", "bbox": {"l": 135.32401, "t": 220.28954999999996, "r": 155.03215, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "68.4", "bbox": {"l": 167.95399, "t": 220.28954999999996, "r": 182.43472, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "71.5", "bbox": {"l": 194.0462, "t": 220.28954999999996, "r": 208.52695, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "70.1", "bbox": {"l": 226.86324000000002, "t": 220.28954999999996, "r": 241.34396, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "77.7", "bbox": {"l": 261.86804, "t": 220.28954999999996, "r": 276.34879, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Footnote", "bbox": {"l": 67.663002, "t": 231.24854000000005, "r": 100.1662, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "83-91", "bbox": {"l": 135.32401, "t": 231.24854000000005, "r": 155.03215, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "70.9", "bbox": {"l": 167.95399, "t": 231.24854000000005, "r": 182.43472, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "71.8", "bbox": {"l": 194.0462, "t": 231.24854000000005, "r": 208.52695, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "73.7", "bbox": {"l": 226.86324000000002, "t": 231.24854000000005, "r": 241.34396, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "77.2", "bbox": {"l": 261.86804, "t": 231.24854000000005, "r": 276.34879, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "Formula", "bbox": {"l": 67.663002, "t": 242.20752000000005, "r": 98.175659, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "83-85", "bbox": {"l": 135.32401, "t": 242.20752000000005, "r": 155.03215, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "60.1", "bbox": {"l": 167.95399, "t": 242.20752000000005, "r": 182.43472, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "63.4", "bbox": {"l": 194.0462, "t": 242.20752000000005, "r": 208.52695, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "63.5", "bbox": {"l": 226.86324000000002, "t": 242.20752000000005, "r": 241.34396, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "66.2", "bbox": {"l": 261.86804, "t": 242.20752000000005, "r": 276.34879, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "List-item", "bbox": {"l": 67.663002, "t": 253.16656, "r": 100.54279, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "87-88", "bbox": {"l": 135.32401, "t": 253.16656, "r": 155.03215, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "81.2", "bbox": {"l": 167.95399, "t": 253.16656, "r": 182.43472, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "80.8", "bbox": {"l": 194.0462, "t": 253.16656, "r": 208.52695, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "81.0", "bbox": {"l": 226.86324000000002, "t": 253.16656, "r": 241.34396, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "86.2", "bbox": {"l": 261.86804, "t": 253.16656, "r": 276.34879, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Page-footer", "bbox": {"l": 67.663002, "t": 264.12555, "r": 110.19064, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "93-94", "bbox": {"l": 135.32401, "t": 264.12555, "r": 155.03215, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "61.6", "bbox": {"l": 167.95399, "t": 264.12555, "r": 182.43472, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "59.3", "bbox": {"l": 194.0462, "t": 264.12555, "r": 208.52695, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "58.9", "bbox": {"l": 226.86324000000002, "t": 264.12555, "r": 241.34396, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "61.1", "bbox": {"l": 261.86804, "t": 264.12555, "r": 276.34879, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Page-header", "bbox": {"l": 67.663002, "t": 275.08453, "r": 112.94331999999999, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "85-89", "bbox": {"l": 135.32401, "t": 275.08453, "r": 155.03215, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "71.9", "bbox": {"l": 167.95399, "t": 275.08453, "r": 182.43472, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "70.0", "bbox": {"l": 194.0462, "t": 275.08453, "r": 208.52695, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "72.0", "bbox": {"l": 226.86324000000002, "t": 275.08453, "r": 241.34396, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "67.9", "bbox": {"l": 261.86804, "t": 275.08453, "r": 276.34879, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Picture", "bbox": {"l": 67.663002, "t": 286.04355000000004, "r": 93.647629, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "69-71", "bbox": {"l": 135.32401, "t": 286.04355000000004, "r": 155.03215, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "71.7", "bbox": {"l": 167.95399, "t": 286.04355000000004, "r": 182.43472, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "72.7", "bbox": {"l": 194.0462, "t": 286.04355000000004, "r": 208.52695, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "72.0", "bbox": {"l": 226.86324000000002, "t": 286.04355000000004, "r": 241.34396, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "77.1", "bbox": {"l": 261.86804, "t": 286.04355000000004, "r": 276.34879, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "Section-header", "bbox": {"l": 67.663002, "t": 297.00253, "r": 122.40287999999998, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "83-84", "bbox": {"l": 135.32401, "t": 297.00253, "r": 155.03215, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "67.6", "bbox": {"l": 167.95399, "t": 297.00253, "r": 182.43472, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "69.3", "bbox": {"l": 194.0462, "t": 297.00253, "r": 208.52695, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "68.4", "bbox": {"l": 226.86324000000002, "t": 297.00253, "r": 241.34396, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "74.6", "bbox": {"l": 261.86804, "t": 297.00253, "r": 276.34879, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "Table", "bbox": {"l": 67.663002, "t": 307.96155, "r": 87.46978, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "77-81", "bbox": {"l": 135.32401, "t": 307.96155, "r": 155.03215, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "82.2", "bbox": {"l": 167.95399, "t": 307.96155, "r": 182.43472, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "82.9", "bbox": {"l": 194.0462, "t": 307.96155, "r": 208.52695, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "82.2", "bbox": {"l": 226.86324000000002, "t": 307.96155, "r": 241.34396, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "86.3", "bbox": {"l": 261.86804, "t": 307.96155, "r": 276.34879, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "Text", "bbox": {"l": 67.663002, "t": 318.91953, "r": 83.623199, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "84-86", "bbox": {"l": 135.32401, "t": 318.91953, "r": 155.03215, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "84.6", "bbox": {"l": 167.95399, "t": 318.91953, "r": 182.43472, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "85.8", "bbox": {"l": 194.0462, "t": 318.91953, "r": 208.52695, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "85.4", "bbox": {"l": 226.86324000000002, "t": 318.91953, "r": 241.34396, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "88.1", "bbox": {"l": 261.86804, "t": 318.91953, "r": 276.34879, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Title", "bbox": {"l": 67.663002, "t": 329.87854, "r": 84.654327, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "60-72", "bbox": {"l": 135.32401, "t": 329.87854, "r": 155.03215, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "76.7", "bbox": {"l": 167.95399, "t": 329.87854, "r": 182.43472, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "80.4", "bbox": {"l": 194.0462, "t": 329.87854, "r": 208.52695, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "79.9", "bbox": {"l": 226.86324000000002, "t": 329.87854, "r": 241.34396, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "82.7", "bbox": {"l": 261.86804, "t": 329.87854, "r": 276.34879, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "All", "bbox": {"l": 67.663002, "t": 341.23654, "r": 78.628906, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "82-83", "bbox": {"l": 135.32401, "t": 341.23654, "r": 155.03215, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "72.4", "bbox": {"l": 167.95399, "t": 341.23654, "r": 182.43472, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "73.5", "bbox": {"l": 194.0462, "t": 341.23654, "r": 208.52695, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "73.4", "bbox": {"l": 226.86324000000002, "t": 341.23654, "r": 241.34396, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "76.8", "bbox": {"l": 261.86804, "t": 341.23654, "r": 276.34879, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": [{"id": 12, "label": "text", "bbox": {"l": 132.36501, "t": 197.97351000000003, "r": 157.99098, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "human", "bbox": {"l": 132.36501, "t": 197.97351000000003, "r": 157.99098, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 173.505, "t": 197.97351000000003, "r": 204.61841, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "MRCNN", "bbox": {"l": 173.505, "t": 197.97351000000003, "r": 204.61841, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 220.13028, "t": 197.97351000000003, "r": 248.06958, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "FRCNN", "bbox": {"l": 220.13028, "t": 197.97351000000003, "r": 248.06958, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 258.03125, "t": 197.97351000000003, "r": 280.17825, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "YOLO", "bbox": {"l": 258.03125, "t": 197.97351000000003, "r": 280.17825, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 168.39301, "t": 208.93255999999997, "r": 181.99504, "b": 217.30719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "R50", "bbox": {"l": 168.39301, "t": 208.93255999999997, "r": 181.99504, "b": 217.30719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 192.39606, "t": 208.93255999999997, "r": 210.16747, "b": 217.30719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "R101", "bbox": {"l": 192.39606, "t": 208.93255999999997, "r": 210.16747, "b": 217.30719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 225.21309, "t": 208.93255999999997, "r": 242.9845, "b": 217.30719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "R101", "bbox": {"l": 225.21309, "t": 208.93255999999997, "r": 242.9845, "b": 217.30719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 260.51379, "t": 208.93255999999997, "r": 277.70239, "b": 217.30719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "v5x6", "bbox": {"l": 260.51379, "t": 208.93255999999997, "r": 277.70239, "b": 217.30719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 67.663002, "t": 220.28954999999996, "r": 96.848633, "b": 228.66418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "Caption", "bbox": {"l": 67.663002, "t": 220.28954999999996, "r": 96.848633, "b": 228.66418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 135.32401, "t": 220.28954999999996, "r": 155.03215, "b": 228.66418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "84-89", "bbox": {"l": 135.32401, "t": 220.28954999999996, "r": 155.03215, "b": 228.66418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 167.95399, "t": 220.28954999999996, "r": 182.43472, "b": 228.66418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "68.4", "bbox": {"l": 167.95399, "t": 220.28954999999996, "r": 182.43472, "b": 228.66418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 194.0462, "t": 220.28954999999996, "r": 208.52695, "b": 228.66418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "71.5", "bbox": {"l": 194.0462, "t": 220.28954999999996, "r": 208.52695, "b": 228.66418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 226.86324000000002, "t": 220.28954999999996, "r": 241.34396, "b": 228.66418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "70.1", "bbox": {"l": 226.86324000000002, "t": 220.28954999999996, "r": 241.34396, "b": 228.66418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 261.86804, "t": 220.28954999999996, "r": 276.34879, "b": 228.66418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "77.7", "bbox": {"l": 261.86804, "t": 220.28954999999996, "r": 276.34879, "b": 228.66418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 67.663002, "t": 231.24854000000005, "r": 100.1662, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "Footnote", "bbox": {"l": 67.663002, "t": 231.24854000000005, "r": 100.1662, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 135.32401, "t": 231.24854000000005, "r": 155.03215, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "83-91", "bbox": {"l": 135.32401, "t": 231.24854000000005, "r": 155.03215, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 167.95399, "t": 231.24854000000005, "r": 182.43472, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "70.9", "bbox": {"l": 167.95399, "t": 231.24854000000005, "r": 182.43472, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 194.0462, "t": 231.24854000000005, "r": 208.52695, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "71.8", "bbox": {"l": 194.0462, "t": 231.24854000000005, "r": 208.52695, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 226.86324000000002, "t": 231.24854000000005, "r": 241.34396, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "73.7", "bbox": {"l": 226.86324000000002, "t": 231.24854000000005, "r": 241.34396, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 261.86804, "t": 231.24854000000005, "r": 276.34879, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "77.2", "bbox": {"l": 261.86804, "t": 231.24854000000005, "r": 276.34879, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 67.663002, "t": 242.20752000000005, "r": 98.175659, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "Formula", "bbox": {"l": 67.663002, "t": 242.20752000000005, "r": 98.175659, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 135.32401, "t": 242.20752000000005, "r": 155.03215, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "83-85", "bbox": {"l": 135.32401, "t": 242.20752000000005, "r": 155.03215, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 167.95399, "t": 242.20752000000005, "r": 182.43472, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "60.1", "bbox": {"l": 167.95399, "t": 242.20752000000005, "r": 182.43472, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 194.0462, "t": 242.20752000000005, "r": 208.52695, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "63.4", "bbox": {"l": 194.0462, "t": 242.20752000000005, "r": 208.52695, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 226.86324000000002, "t": 242.20752000000005, "r": 241.34396, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "63.5", "bbox": {"l": 226.86324000000002, "t": 242.20752000000005, "r": 241.34396, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 261.86804, "t": 242.20752000000005, "r": 276.34879, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "66.2", "bbox": {"l": 261.86804, "t": 242.20752000000005, "r": 276.34879, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 67.663002, "t": 253.16656, "r": 100.54279, "b": 261.5412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "List-item", "bbox": {"l": 67.663002, "t": 253.16656, "r": 100.54279, "b": 261.5412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 135.32401, "t": 253.16656, "r": 155.03215, "b": 261.5412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "87-88", "bbox": {"l": 135.32401, "t": 253.16656, "r": 155.03215, "b": 261.5412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 167.95399, "t": 253.16656, "r": 182.43472, "b": 261.5412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "81.2", "bbox": {"l": 167.95399, "t": 253.16656, "r": 182.43472, "b": 261.5412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 194.0462, "t": 253.16656, "r": 208.52695, "b": 261.5412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "80.8", "bbox": {"l": 194.0462, "t": 253.16656, "r": 208.52695, "b": 261.5412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 226.86324000000002, "t": 253.16656, "r": 241.34396, "b": 261.5412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "81.0", "bbox": {"l": 226.86324000000002, "t": 253.16656, "r": 241.34396, "b": 261.5412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 261.86804, "t": 253.16656, "r": 276.34879, "b": 261.5412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "86.2", "bbox": {"l": 261.86804, "t": 253.16656, "r": 276.34879, "b": 261.5412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 67.663002, "t": 264.12555, "r": 110.19064, "b": 272.50018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "Page-footer", "bbox": {"l": 67.663002, "t": 264.12555, "r": 110.19064, "b": 272.50018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 135.32401, "t": 264.12555, "r": 155.03215, "b": 272.50018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "93-94", "bbox": {"l": 135.32401, "t": 264.12555, "r": 155.03215, "b": 272.50018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 167.95399, "t": 264.12555, "r": 182.43472, "b": 272.50018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "61.6", "bbox": {"l": 167.95399, "t": 264.12555, "r": 182.43472, "b": 272.50018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 194.0462, "t": 264.12555, "r": 208.52695, "b": 272.50018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "59.3", "bbox": {"l": 194.0462, "t": 264.12555, "r": 208.52695, "b": 272.50018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 226.86324000000002, "t": 264.12555, "r": 241.34396, "b": 272.50018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "58.9", "bbox": {"l": 226.86324000000002, "t": 264.12555, "r": 241.34396, "b": 272.50018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 261.86804, "t": 264.12555, "r": 276.34879, "b": 272.50018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "61.1", "bbox": {"l": 261.86804, "t": 264.12555, "r": 276.34879, "b": 272.50018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 67.663002, "t": 275.08453, "r": 112.94331999999999, "b": 283.45917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "Page-header", "bbox": {"l": 67.663002, "t": 275.08453, "r": 112.94331999999999, "b": 283.45917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 135.32401, "t": 275.08453, "r": 155.03215, "b": 283.45917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "85-89", "bbox": {"l": 135.32401, "t": 275.08453, "r": 155.03215, "b": 283.45917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 167.95399, "t": 275.08453, "r": 182.43472, "b": 283.45917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "71.9", "bbox": {"l": 167.95399, "t": 275.08453, "r": 182.43472, "b": 283.45917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 194.0462, "t": 275.08453, "r": 208.52695, "b": 283.45917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "70.0", "bbox": {"l": 194.0462, "t": 275.08453, "r": 208.52695, "b": 283.45917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 226.86324000000002, "t": 275.08453, "r": 241.34396, "b": 283.45917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "72.0", "bbox": {"l": 226.86324000000002, "t": 275.08453, "r": 241.34396, "b": 283.45917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 261.86804, "t": 275.08453, "r": 276.34879, "b": 283.45917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "67.9", "bbox": {"l": 261.86804, "t": 275.08453, "r": 276.34879, "b": 283.45917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 67.663002, "t": 286.04355000000004, "r": 93.647629, "b": 294.41818, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "Picture", "bbox": {"l": 67.663002, "t": 286.04355000000004, "r": 93.647629, "b": 294.41818, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 135.32401, "t": 286.04355000000004, "r": 155.03215, "b": 294.41818, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "69-71", "bbox": {"l": 135.32401, "t": 286.04355000000004, "r": 155.03215, "b": 294.41818, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 167.95399, "t": 286.04355000000004, "r": 182.43472, "b": 294.41818, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "71.7", "bbox": {"l": 167.95399, "t": 286.04355000000004, "r": 182.43472, "b": 294.41818, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 194.0462, "t": 286.04355000000004, "r": 208.52695, "b": 294.41818, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "72.7", "bbox": {"l": 194.0462, "t": 286.04355000000004, "r": 208.52695, "b": 294.41818, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 226.86324000000002, "t": 286.04355000000004, "r": 241.34396, "b": 294.41818, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "72.0", "bbox": {"l": 226.86324000000002, "t": 286.04355000000004, "r": 241.34396, "b": 294.41818, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 261.86804, "t": 286.04355000000004, "r": 276.34879, "b": 294.41818, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "77.1", "bbox": {"l": 261.86804, "t": 286.04355000000004, "r": 276.34879, "b": 294.41818, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 67.663002, "t": 297.00253, "r": 122.40287999999998, "b": 305.37717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "Section-header", "bbox": {"l": 67.663002, "t": 297.00253, "r": 122.40287999999998, "b": 305.37717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 135.32401, "t": 297.00253, "r": 155.03215, "b": 305.37717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "83-84", "bbox": {"l": 135.32401, "t": 297.00253, "r": 155.03215, "b": 305.37717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 167.95399, "t": 297.00253, "r": 182.43472, "b": 305.37717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "67.6", "bbox": {"l": 167.95399, "t": 297.00253, "r": 182.43472, "b": 305.37717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 194.0462, "t": 297.00253, "r": 208.52695, "b": 305.37717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "69.3", "bbox": {"l": 194.0462, "t": 297.00253, "r": 208.52695, "b": 305.37717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 226.86324000000002, "t": 297.00253, "r": 241.34396, "b": 305.37717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "68.4", "bbox": {"l": 226.86324000000002, "t": 297.00253, "r": 241.34396, "b": 305.37717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 261.86804, "t": 297.00253, "r": 276.34879, "b": 305.37717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "74.6", "bbox": {"l": 261.86804, "t": 297.00253, "r": 276.34879, "b": 305.37717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 67.663002, "t": 307.96155, "r": 87.46978, "b": 316.33618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "Table", "bbox": {"l": 67.663002, "t": 307.96155, "r": 87.46978, "b": 316.33618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 135.32401, "t": 307.96155, "r": 155.03215, "b": 316.33618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "77-81", "bbox": {"l": 135.32401, "t": 307.96155, "r": 155.03215, "b": 316.33618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 167.95399, "t": 307.96155, "r": 182.43472, "b": 316.33618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "82.2", "bbox": {"l": 167.95399, "t": 307.96155, "r": 182.43472, "b": 316.33618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 194.0462, "t": 307.96155, "r": 208.52695, "b": 316.33618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "82.9", "bbox": {"l": 194.0462, "t": 307.96155, "r": 208.52695, "b": 316.33618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 226.86324000000002, "t": 307.96155, "r": 241.34396, "b": 316.33618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "82.2", "bbox": {"l": 226.86324000000002, "t": 307.96155, "r": 241.34396, "b": 316.33618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 261.86804, "t": 307.96155, "r": 276.34879, "b": 316.33618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "86.3", "bbox": {"l": 261.86804, "t": 307.96155, "r": 276.34879, "b": 316.33618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 67.663002, "t": 318.91953, "r": 83.623199, "b": 327.29416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "Text", "bbox": {"l": 67.663002, "t": 318.91953, "r": 83.623199, "b": 327.29416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 135.32401, "t": 318.91953, "r": 155.03215, "b": 327.29416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "84-86", "bbox": {"l": 135.32401, "t": 318.91953, "r": 155.03215, "b": 327.29416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 167.95399, "t": 318.91953, "r": 182.43472, "b": 327.29416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "84.6", "bbox": {"l": 167.95399, "t": 318.91953, "r": 182.43472, "b": 327.29416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 194.0462, "t": 318.91953, "r": 208.52695, "b": 327.29416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "85.8", "bbox": {"l": 194.0462, "t": 318.91953, "r": 208.52695, "b": 327.29416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 226.86324000000002, "t": 318.91953, "r": 241.34396, "b": 327.29416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "85.4", "bbox": {"l": 226.86324000000002, "t": 318.91953, "r": 241.34396, "b": 327.29416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 261.86804, "t": 318.91953, "r": 276.34879, "b": 327.29416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "88.1", "bbox": {"l": 261.86804, "t": 318.91953, "r": 276.34879, "b": 327.29416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 67.663002, "t": 329.87854, "r": 84.654327, "b": 338.25317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "Title", "bbox": {"l": 67.663002, "t": 329.87854, "r": 84.654327, "b": 338.25317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 135.32401, "t": 329.87854, "r": 155.03215, "b": 338.25317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "60-72", "bbox": {"l": 135.32401, "t": 329.87854, "r": 155.03215, "b": 338.25317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 167.95399, "t": 329.87854, "r": 182.43472, "b": 338.25317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "76.7", "bbox": {"l": 167.95399, "t": 329.87854, "r": 182.43472, "b": 338.25317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 194.0462, "t": 329.87854, "r": 208.52695, "b": 338.25317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "80.4", "bbox": {"l": 194.0462, "t": 329.87854, "r": 208.52695, "b": 338.25317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 226.86324000000002, "t": 329.87854, "r": 241.34396, "b": 338.25317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "79.9", "bbox": {"l": 226.86324000000002, "t": 329.87854, "r": 241.34396, "b": 338.25317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 261.86804, "t": 329.87854, "r": 276.34879, "b": 338.25317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "82.7", "bbox": {"l": 261.86804, "t": 329.87854, "r": 276.34879, "b": 338.25317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 67.663002, "t": 341.23654, "r": 78.628906, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "All", "bbox": {"l": 67.663002, "t": 341.23654, "r": 78.628906, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 135.32401, "t": 341.23654, "r": 155.03215, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "82-83", "bbox": {"l": 135.32401, "t": 341.23654, "r": 155.03215, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 167.95399, "t": 341.23654, "r": 182.43472, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "72.4", "bbox": {"l": 167.95399, "t": 341.23654, "r": 182.43472, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 194.0462, "t": 341.23654, "r": 208.52695, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "73.5", "bbox": {"l": 194.0462, "t": 341.23654, "r": 208.52695, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 226.86324000000002, "t": 341.23654, "r": 241.34396, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "73.4", "bbox": {"l": 226.86324000000002, "t": 341.23654, "r": 241.34396, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 261.86804, "t": 341.23654, "r": 276.34879, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "76.8", "bbox": {"l": 261.86804, "t": 341.23654, "r": 276.34879, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 4, "label": "text", "bbox": {"l": 53.528999, "t": 370.92755, "r": 295.55612, "b": 576.56317, "coord_origin": "TOPLEFT"}, "confidence": 0.9866557121276855, "cells": [{"id": 93, "text": "to avoid this at any cost in order to have clear, unbiased baseline", "bbox": {"l": 53.79800000000001, "t": 370.92755, "r": 294.04712, "b": 379.30219000000005, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "numbers for human document-layout annotation. Third, we in-", "bbox": {"l": 53.79800000000001, "t": 381.88654, "r": 295.55612, "b": 390.26117, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "troduced the feature of", "bbox": {"l": 53.79800000000001, "t": 392.84555, "r": 140.3623, "b": 401.22017999999997, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "snapping", "bbox": {"l": 142.99001, "t": 392.89041, "r": 175.9695, "b": 401.2291599999999, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "boxes around text segments to", "bbox": {"l": 178.951, "t": 392.84555, "r": 294.04083, "b": 401.22017999999997, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "obtain a pixel-accurate annotation and again reduce time and effort.", "bbox": {"l": 53.79800000000001, "t": 403.80453, "r": 295.42493, "b": 412.17917, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "The CCS annotation tool automatically shrinks every user-drawn", "bbox": {"l": 53.528999, "t": 414.76355, "r": 294.04251, "b": 423.13818, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "box to the minimum bounding-box around the enclosed text-cells", "bbox": {"l": 53.79800000000001, "t": 425.72253, "r": 294.04807, "b": 434.09717, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "for all purely text-based segments, which excludes only", "bbox": {"l": 53.79800000000001, "t": 436.6815500000001, "r": 256.80627, "b": 445.0561799999999, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "Table", "bbox": {"l": 259.04199, "t": 436.72641, "r": 278.10455, "b": 445.06516, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "and", "bbox": {"l": 280.54999, "t": 436.6815500000001, "r": 294.04443, "b": 445.0561799999999, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "Picture", "bbox": {"l": 53.79800000000001, "t": 447.68539, "r": 78.875587, "b": 456.02413999999993, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": ". For the latter, we instructed annotation staff to minimise", "bbox": {"l": 78.876999, "t": 447.64053, "r": 294.04852, "b": 456.01517, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "inclusion of surrounding whitespace while including all graphical", "bbox": {"l": 53.79800000000001, "t": 458.59955, "r": 294.04645, "b": 466.97418, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "lines. A downside of snapping boxes to enclosed text cells is that", "bbox": {"l": 53.79800000000001, "t": 469.55853, "r": 294.0416, "b": 477.93317, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "some wrongly parsed PDF pages cannot be annotated correctly and", "bbox": {"l": 53.79800000000001, "t": 480.51654, "r": 294.04538, "b": 488.89117, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "need to be skipped. Fourth, we established a way to flag pages as", "bbox": {"l": 53.79800000000001, "t": 491.47552, "r": 294.04312, "b": 499.85016, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "rejected", "bbox": {"l": 53.79800000000001, "t": 502.4794, "r": 80.597939, "b": 510.81815, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "for cases where no valid annotation according to the label", "bbox": {"l": 83.366997, "t": 502.43454, "r": 294.04483, "b": 510.80917, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "guidelines could be achieved. Example cases for this would be PDF", "bbox": {"l": 53.79800000000001, "t": 513.3935200000001, "r": 294.25833, "b": 521.7681600000001, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "pages that render incorrectly or contain layouts that are impossible", "bbox": {"l": 53.79800000000001, "t": 524.35254, "r": 294.04535, "b": 532.72717, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "to capture with non-overlapping rectangles. Such rejected pages are", "bbox": {"l": 53.79800000000001, "t": 535.31155, "r": 294.04535, "b": 543.68617, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "not contained in the final dataset. With all these measures in place,", "bbox": {"l": 53.79800000000001, "t": 546.27055, "r": 295.02759, "b": 554.64517, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "experienced annotation staff managed to annotate a single page in", "bbox": {"l": 53.79800000000001, "t": 557.22955, "r": 294.0488, "b": 565.6041700000001, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "a typical timeframe of 20s to 60s, depending on its complexity.", "bbox": {"l": 53.79800000000001, "t": 568.18855, "r": 281.80457, "b": 576.56317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "section_header", "bbox": {"l": 53.79800000000001, "t": 588.12991, "r": 147.48535, "b": 598.43901, "coord_origin": "TOPLEFT"}, "confidence": 0.9419495463371277, "cells": [{"id": 118, "text": "5", "bbox": {"l": 53.79800000000001, "t": 588.12991, "r": 59.405277, "b": 598.43901, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "EXPERIMENTS", "bbox": {"l": 70.314377, "t": 588.12991, "r": 147.48535, "b": 598.43901, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 53.484001, "t": 613.25356, "r": 295.4281, "b": 709.299171, "coord_origin": "TOPLEFT"}, "confidence": 0.987605094909668, "cells": [{"id": 120, "text": "The primary goal of DocLayNet is to obtain high-quality ML models", "bbox": {"l": 53.528999, "t": 613.25356, "r": 294.04871, "b": 621.6281700000001, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "capable of accurate document-layout analysis on a wide variety", "bbox": {"l": 53.79800000000001, "t": 624.21255, "r": 294.27576, "b": 632.58717, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "of challenging layouts. As discussed in Section 2, object detection", "bbox": {"l": 53.79800000000001, "t": 635.17155, "r": 294.04144, "b": 643.54617, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "models are currently the easiest to use, due to the standardisation", "bbox": {"l": 53.79800000000001, "t": 646.13055, "r": 294.04163, "b": 654.50517, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "of ground-truth data in COCO format [16] and the availability of", "bbox": {"l": 53.79800000000001, "t": 657.0885499999999, "r": 294.0412, "b": 665.46317, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "general frameworks such as", "bbox": {"l": 53.79800000000001, "t": 668.04755, "r": 155.01054, "b": 676.42217, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "detectron2", "bbox": {"l": 157.23599, "t": 668.09238, "r": 193.26666, "b": 676.43114, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "[17]. Furthermore, baseline", "bbox": {"l": 195.867, "t": 668.04755, "r": 294.0473, "b": 676.42217, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "numbers in PubLayNet and DocBank were obtained using standard", "bbox": {"l": 53.79800000000001, "t": 679.0065500000001, "r": 294.04538, "b": 687.38117, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "object detection models such as Mask R-CNN and Faster R-CNN.", "bbox": {"l": 53.79800000000001, "t": 689.96555, "r": 295.4281, "b": 698.3401719999999, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "As such, we will relate to these object detection methods in this", "bbox": {"l": 53.484001, "t": 700.9245530000001, "r": 294.04413, "b": 709.299171, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "picture", "bbox": {"l": 323.48431396484375, "t": 89.88603210449219, "r": 553.5411376953125, "b": 260.0107727050781, "coord_origin": "TOPLEFT"}, "confidence": 0.9782690405845642, "cells": [{"id": 131, "text": "0", "bbox": {"l": 349.16577, "t": 246.68017999999995, "r": 352.48175, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "20", "bbox": {"l": 385.93698, "t": 246.68017999999995, "r": 392.56894, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "40", "bbox": {"l": 424.366, "t": 246.68017999999995, "r": 430.99796, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "60", "bbox": {"l": 462.79504000000003, "t": 246.68017999999995, "r": 469.427, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "80", "bbox": {"l": 501.22406, "t": 246.68017999999995, "r": 507.85602, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "100", "bbox": {"l": 537.99524, "t": 246.68017999999995, "r": 547.94318, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "% of DocLayNet training set", "bbox": {"l": 410.28143, "t": 253.80840999999998, "r": 483.47278000000006, "b": 259.88251, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "50", "bbox": {"l": 330.93539, "t": 218.38464, "r": 337.56735, "b": 224.45874000000003, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "55", "bbox": {"l": 330.93539, "t": 192.08660999999995, "r": 337.56735, "b": 198.16071, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "60", "bbox": {"l": 330.93539, "t": 165.78864, "r": 337.56735, "b": 171.86273000000006, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "65", "bbox": {"l": 330.93539, "t": 139.49059999999997, "r": 337.56735, "b": 145.56470000000002, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "70", "bbox": {"l": 330.93539, "t": 113.19263000000001, "r": 337.56735, "b": 119.26671999999996, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "mAP 0.50:0.95", "bbox": {"l": 322.92276, "t": 148.37689, "r": 328.99686, "b": 186.79218000000003, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "10", "bbox": {"l": 470.97235, "t": 235.36676, "r": 477.6055, "b": 241.44086000000004, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "1", "bbox": {"l": 477.65662, "t": 234.82390999999996, "r": 479.97778000000005, "b": 239.07581000000005, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "10", "bbox": {"l": 531.55127, "t": 235.41234999999995, "r": 538.18445, "b": 241.48645, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "2", "bbox": {"l": 538.23553, "t": 234.86951, "r": 540.5567, "b": 239.1214, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "50", "bbox": {"l": 404.91125, "t": 216.00005999999996, "r": 411.54321, "b": 222.07416, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "55", "bbox": {"l": 404.91125, "t": 200.22125000000005, "r": 411.54321, "b": 206.29534999999998, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "60", "bbox": {"l": 404.91125, "t": 184.44244000000003, "r": 411.54321, "b": 190.51653999999996, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "65", "bbox": {"l": 404.91125, "t": 168.66364, "r": 411.54321, "b": 174.73773000000006, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "70", "bbox": {"l": 404.91125, "t": 152.88489000000004, "r": 411.54321, "b": 158.95898, "coord_origin": "TOPLEFT"}}], "children": [{"id": 92, "label": "text", "bbox": {"l": 349.16577, "t": 246.68017999999995, "r": 352.48175, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 131, "text": "0", "bbox": {"l": 349.16577, "t": 246.68017999999995, "r": 352.48175, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 385.93698, "t": 246.68017999999995, "r": 392.56894, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 132, "text": "20", "bbox": {"l": 385.93698, "t": 246.68017999999995, "r": 392.56894, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 424.366, "t": 246.68017999999995, "r": 430.99796, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 133, "text": "40", "bbox": {"l": 424.366, "t": 246.68017999999995, "r": 430.99796, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 462.79504000000003, "t": 246.68017999999995, "r": 469.427, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 134, "text": "60", "bbox": {"l": 462.79504000000003, "t": 246.68017999999995, "r": 469.427, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 501.22406, "t": 246.68017999999995, "r": 507.85602, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 135, "text": "80", "bbox": {"l": 501.22406, "t": 246.68017999999995, "r": 507.85602, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 537.99524, "t": 246.68017999999995, "r": 547.94318, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 136, "text": "100", "bbox": {"l": 537.99524, "t": 246.68017999999995, "r": 547.94318, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 410.28143, "t": 253.80840999999998, "r": 483.47278000000006, "b": 259.88251, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 137, "text": "% of DocLayNet training set", "bbox": {"l": 410.28143, "t": 253.80840999999998, "r": 483.47278000000006, "b": 259.88251, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 330.93539, "t": 218.38464, "r": 337.56735, "b": 224.45874000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 138, "text": "50", "bbox": {"l": 330.93539, "t": 218.38464, "r": 337.56735, "b": 224.45874000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 330.93539, "t": 192.08660999999995, "r": 337.56735, "b": 198.16071, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 139, "text": "55", "bbox": {"l": 330.93539, "t": 192.08660999999995, "r": 337.56735, "b": 198.16071, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 330.93539, "t": 165.78864, "r": 337.56735, "b": 171.86273000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 140, "text": "60", "bbox": {"l": 330.93539, "t": 165.78864, "r": 337.56735, "b": 171.86273000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 330.93539, "t": 139.49059999999997, "r": 337.56735, "b": 145.56470000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 141, "text": "65", "bbox": {"l": 330.93539, "t": 139.49059999999997, "r": 337.56735, "b": 145.56470000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 330.93539, "t": 113.19263000000001, "r": 337.56735, "b": 119.26671999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 142, "text": "70", "bbox": {"l": 330.93539, "t": 113.19263000000001, "r": 337.56735, "b": 119.26671999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 322.92276, "t": 148.37689, "r": 328.99686, "b": 186.79218000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 143, "text": "mAP 0.50:0.95", "bbox": {"l": 322.92276, "t": 148.37689, "r": 328.99686, "b": 186.79218000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 470.97235, "t": 235.36676, "r": 477.6055, "b": 241.44086000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 144, "text": "10", "bbox": {"l": 470.97235, "t": 235.36676, "r": 477.6055, "b": 241.44086000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 477.65662, "t": 234.82390999999996, "r": 479.97778000000005, "b": 239.07581000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 145, "text": "1", "bbox": {"l": 477.65662, "t": 234.82390999999996, "r": 479.97778000000005, "b": 239.07581000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 531.55127, "t": 235.41234999999995, "r": 538.18445, "b": 241.48645, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 146, "text": "10", "bbox": {"l": 531.55127, "t": 235.41234999999995, "r": 538.18445, "b": 241.48645, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 538.23553, "t": 234.86951, "r": 540.5567, "b": 239.1214, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 147, "text": "2", "bbox": {"l": 538.23553, "t": 234.86951, "r": 540.5567, "b": 239.1214, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 404.91125, "t": 216.00005999999996, "r": 411.54321, "b": 222.07416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 148, "text": "50", "bbox": {"l": 404.91125, "t": 216.00005999999996, "r": 411.54321, "b": 222.07416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 404.91125, "t": 200.22125000000005, "r": 411.54321, "b": 206.29534999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 149, "text": "55", "bbox": {"l": 404.91125, "t": 200.22125000000005, "r": 411.54321, "b": 206.29534999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 404.91125, "t": 184.44244000000003, "r": 411.54321, "b": 190.51653999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 150, "text": "60", "bbox": {"l": 404.91125, "t": 184.44244000000003, "r": 411.54321, "b": 190.51653999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 404.91125, "t": 168.66364, "r": 411.54321, "b": 174.73773000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 151, "text": "65", "bbox": {"l": 404.91125, "t": 168.66364, "r": 411.54321, "b": 174.73773000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 404.91125, "t": 152.88489000000004, "r": 411.54321, "b": 158.95898, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 152, "text": "70", "bbox": {"l": 404.91125, "t": 152.88489000000004, "r": 411.54321, "b": 158.95898, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 7, "label": "caption", "bbox": {"l": 317.95499, "t": 279.01599, "r": 559.80579, "b": 342.28418000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9639934301376343, "cells": [{"id": 153, "text": "Figure 5: Prediction performance (mAP@0.5-0.95) of a Mask", "bbox": {"l": 317.95499, "t": 279.01599, "r": 558.47876, "b": 287.48923, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "R-CNN network with ResNet50 backbone trained on increas-", "bbox": {"l": 317.95499, "t": 289.97501, "r": 559.80579, "b": 298.44824, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "ing fractions of the DocLayNet dataset. The learning curve", "bbox": {"l": 317.95499, "t": 300.93399, "r": 558.20068, "b": 309.40723, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "flattens around the 80% mark, indicating that increasing the", "bbox": {"l": 317.95499, "t": 311.89297, "r": 558.20062, "b": 320.36620999999997, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "size of the DocLayNet dataset with similar data will not yield", "bbox": {"l": 317.95499, "t": 322.85196, "r": 558.20074, "b": 331.3252, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "significantly better predictions.", "bbox": {"l": 317.95499, "t": 333.81094, "r": 445.24207, "b": 342.28418000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "text", "bbox": {"l": 317.95499, "t": 384.01154, "r": 558.20416, "b": 403.34517999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9594221711158752, "cells": [{"id": 159, "text": "paper and leave the detailed evaluation of more recent methods", "bbox": {"l": 317.95499, "t": 384.01154, "r": 558.20416, "b": 392.38617, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "mentioned in Section 2 for future work.", "bbox": {"l": 317.95499, "t": 394.97055, "r": 463.04938, "b": 403.34517999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 317.64099, "t": 405.92953, "r": 558.4364, "b": 480.05716, "coord_origin": "TOPLEFT"}, "confidence": 0.9872915148735046, "cells": [{"id": 161, "text": "In this section, we will present several aspects related to the", "bbox": {"l": 327.918, "t": 405.92953, "r": 558.19836, "b": 414.30417, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "performance of object detection models on DocLayNet. Similarly", "bbox": {"l": 317.95499, "t": 416.88855, "r": 558.4364, "b": 425.26318, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "as in PubLayNet, we will evaluate the quality of their predictions", "bbox": {"l": 317.95499, "t": 427.84653, "r": 558.20563, "b": 436.22116, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "using mean average precision (mAP) with 10 overlaps that range", "bbox": {"l": 317.95499, "t": 438.80554, "r": 558.20044, "b": 447.18018, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "from 0.5 to 0.95 in steps of 0.05 (mAP@0.5-0.95). These scores are", "bbox": {"l": 317.95499, "t": 449.76453000000004, "r": 558.19891, "b": 458.13916, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "computed by leveraging the evaluation code provided by the COCO", "bbox": {"l": 317.95499, "t": 460.72354, "r": 558.20239, "b": 469.09818, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "API [16].", "bbox": {"l": 317.64099, "t": 471.68253, "r": 350.32352, "b": 480.05716, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "section_header", "bbox": {"l": 317.95499, "t": 496.8219, "r": 466.8532400000001, "b": 507.13098, "coord_origin": "TOPLEFT"}, "confidence": 0.9579004049301147, "cells": [{"id": 168, "text": "Baselines for Object Detection", "bbox": {"l": 317.95499, "t": 496.8219, "r": 466.8532400000001, "b": 507.13098, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 317.74899, "t": 512.02454, "r": 558.43085, "b": 706.700172, "coord_origin": "TOPLEFT"}, "confidence": 0.987722635269165, "cells": [{"id": 169, "text": "In Table 2, we present baseline experiments (given in mAP) on Mask", "bbox": {"l": 317.95499, "t": 512.02454, "r": 558.43085, "b": 520.39917, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "R-CNN [12], Faster R-CNN [11], and YOLOv5 [13]. Both training", "bbox": {"l": 317.95499, "t": 522.9835499999999, "r": 558.20117, "b": 531.35818, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "and evaluation were performed on RGB images with dimensions of", "bbox": {"l": 317.95499, "t": 533.94254, "r": 558.20233, "b": 542.31717, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "1025", "bbox": {"l": 317.74899, "t": 544.90155, "r": 334.09296, "b": 553.27617, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "\u00d7", "bbox": {"l": 334.81201, "t": 544.84775, "r": 340.51465, "b": 552.5499, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "1025 pixels. For training, we only used one annotation in case", "bbox": {"l": 341.233, "t": 544.90155, "r": 558.20117, "b": 553.27617, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "of redundantly annotated pages. As one can observe, the variation", "bbox": {"l": 317.95499, "t": 555.85956, "r": 558.20392, "b": 564.23418, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "in mAP between the models is rather low, but overall between 6", "bbox": {"l": 317.95499, "t": 566.8185599999999, "r": 558.2041, "b": 575.19318, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "and 10% lower than the mAP computed from the pairwise human", "bbox": {"l": 317.95499, "t": 577.77756, "r": 558.2052, "b": 586.15218, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "annotations on triple-annotated pages. This gives a good indication", "bbox": {"l": 317.95499, "t": 588.73656, "r": 558.20233, "b": 597.11118, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "that the DocLayNet dataset poses a worthwhile challenge for the", "bbox": {"l": 317.95499, "t": 599.69556, "r": 558.1983, "b": 608.0701799999999, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "research community to close the gap between human recognition", "bbox": {"l": 317.95499, "t": 610.65456, "r": 558.20502, "b": 619.02917, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "and ML approaches. It is interesting to see that Mask R-CNN and", "bbox": {"l": 317.95499, "t": 621.61356, "r": 558.20337, "b": 629.98817, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "Faster R-CNN produce very comparable mAP scores, indicating", "bbox": {"l": 317.95499, "t": 632.5725600000001, "r": 558.2041, "b": 640.94717, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "that pixel-based image segmentation derived from bounding-boxes", "bbox": {"l": 317.95499, "t": 643.53156, "r": 558.20245, "b": 651.90617, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "does not help to obtain better predictions. On the other hand, the", "bbox": {"l": 317.95499, "t": 654.49055, "r": 558.19757, "b": 662.86517, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": "more recent Yolov5x model does very well and even out-performs", "bbox": {"l": 317.95499, "t": 665.44855, "r": 558.20404, "b": 673.82317, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "humans on selected labels such as", "bbox": {"l": 317.95499, "t": 676.40755, "r": 444.54102, "b": 684.78217, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "Text", "bbox": {"l": 446.78900000000004, "t": 676.45238, "r": 461.95261000000005, "b": 684.79114, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": ",", "bbox": {"l": 461.95599000000004, "t": 676.40755, "r": 463.96805000000006, "b": 684.78217, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "Table", "bbox": {"l": 466.2170100000001, "t": 676.45238, "r": 485.66998000000007, "b": 684.79114, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "and", "bbox": {"l": 488.1290000000001, "t": 676.40755, "r": 501.89330999999993, "b": 684.78217, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "Picture", "bbox": {"l": 504.142, "t": 676.45238, "r": 529.21954, "b": 684.79114, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": ". This is", "bbox": {"l": 529.22101, "t": 676.40755, "r": 558.20392, "b": 684.78217, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "not entirely surprising, as", "bbox": {"l": 317.95499, "t": 687.36655, "r": 410.81366, "b": 695.741173, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "Text", "bbox": {"l": 413.05301, "t": 687.41138, "r": 427.67865, "b": 695.750137, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": ",", "bbox": {"l": 427.67801, "t": 687.36655, "r": 429.62103, "b": 695.741173, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "Table", "bbox": {"l": 431.86099, "t": 687.41138, "r": 450.62881000000004, "b": 695.750137, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "and", "bbox": {"l": 453.082, "t": 687.36655, "r": 466.37402, "b": 695.741173, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "Picture", "bbox": {"l": 468.61499, "t": 687.41138, "r": 492.83208999999994, "b": 695.750137, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "are abundant and", "bbox": {"l": 495.28201, "t": 687.36655, "r": 558.2005, "b": 695.741173, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "the most visually distinctive in a document.", "bbox": {"l": 317.95499, "t": 698.325554, "r": 477.53903, "b": 706.700172, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {"0": {"label": "table", "id": 0, "page_no": 5, "cluster": {"id": 0, "label": "table", "bbox": {"l": 62.02753829956055, "t": 195.6800537109375, "r": 285.78955078125, "b": 351.6618957519531, "coord_origin": "TOPLEFT"}, "confidence": 0.9883638620376587, "cells": [{"id": 13, "text": "human", "bbox": {"l": 132.36501, "t": 197.97351000000003, "r": 157.99098, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "MRCNN", "bbox": {"l": 173.505, "t": 197.97351000000003, "r": 204.61841, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "FRCNN", "bbox": {"l": 220.13028, "t": 197.97351000000003, "r": 248.06958, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "YOLO", "bbox": {"l": 258.03125, "t": 197.97351000000003, "r": 280.17825, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "R50", "bbox": {"l": 168.39301, "t": 208.93255999999997, "r": 181.99504, "b": 217.30719, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "R101", "bbox": {"l": 192.39606, "t": 208.93255999999997, "r": 210.16747, "b": 217.30719, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "R101", "bbox": {"l": 225.21309, "t": 208.93255999999997, "r": 242.9845, "b": 217.30719, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "v5x6", "bbox": {"l": 260.51379, "t": 208.93255999999997, "r": 277.70239, "b": 217.30719, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Caption", "bbox": {"l": 67.663002, "t": 220.28954999999996, "r": 96.848633, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "84-89", "bbox": {"l": 135.32401, "t": 220.28954999999996, "r": 155.03215, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "68.4", "bbox": {"l": 167.95399, "t": 220.28954999999996, "r": 182.43472, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "71.5", "bbox": {"l": 194.0462, "t": 220.28954999999996, "r": 208.52695, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "70.1", "bbox": {"l": 226.86324000000002, "t": 220.28954999999996, "r": 241.34396, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "77.7", "bbox": {"l": 261.86804, "t": 220.28954999999996, "r": 276.34879, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Footnote", "bbox": {"l": 67.663002, "t": 231.24854000000005, "r": 100.1662, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "83-91", "bbox": {"l": 135.32401, "t": 231.24854000000005, "r": 155.03215, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "70.9", "bbox": {"l": 167.95399, "t": 231.24854000000005, "r": 182.43472, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "71.8", "bbox": {"l": 194.0462, "t": 231.24854000000005, "r": 208.52695, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "73.7", "bbox": {"l": 226.86324000000002, "t": 231.24854000000005, "r": 241.34396, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "77.2", "bbox": {"l": 261.86804, "t": 231.24854000000005, "r": 276.34879, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "Formula", "bbox": {"l": 67.663002, "t": 242.20752000000005, "r": 98.175659, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "83-85", "bbox": {"l": 135.32401, "t": 242.20752000000005, "r": 155.03215, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "60.1", "bbox": {"l": 167.95399, "t": 242.20752000000005, "r": 182.43472, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "63.4", "bbox": {"l": 194.0462, "t": 242.20752000000005, "r": 208.52695, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "63.5", "bbox": {"l": 226.86324000000002, "t": 242.20752000000005, "r": 241.34396, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "66.2", "bbox": {"l": 261.86804, "t": 242.20752000000005, "r": 276.34879, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "List-item", "bbox": {"l": 67.663002, "t": 253.16656, "r": 100.54279, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "87-88", "bbox": {"l": 135.32401, "t": 253.16656, "r": 155.03215, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "81.2", "bbox": {"l": 167.95399, "t": 253.16656, "r": 182.43472, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "80.8", "bbox": {"l": 194.0462, "t": 253.16656, "r": 208.52695, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "81.0", "bbox": {"l": 226.86324000000002, "t": 253.16656, "r": 241.34396, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "86.2", "bbox": {"l": 261.86804, "t": 253.16656, "r": 276.34879, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Page-footer", "bbox": {"l": 67.663002, "t": 264.12555, "r": 110.19064, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "93-94", "bbox": {"l": 135.32401, "t": 264.12555, "r": 155.03215, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "61.6", "bbox": {"l": 167.95399, "t": 264.12555, "r": 182.43472, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "59.3", "bbox": {"l": 194.0462, "t": 264.12555, "r": 208.52695, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "58.9", "bbox": {"l": 226.86324000000002, "t": 264.12555, "r": 241.34396, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "61.1", "bbox": {"l": 261.86804, "t": 264.12555, "r": 276.34879, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Page-header", "bbox": {"l": 67.663002, "t": 275.08453, "r": 112.94331999999999, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "85-89", "bbox": {"l": 135.32401, "t": 275.08453, "r": 155.03215, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "71.9", "bbox": {"l": 167.95399, "t": 275.08453, "r": 182.43472, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "70.0", "bbox": {"l": 194.0462, "t": 275.08453, "r": 208.52695, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "72.0", "bbox": {"l": 226.86324000000002, "t": 275.08453, "r": 241.34396, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "67.9", "bbox": {"l": 261.86804, "t": 275.08453, "r": 276.34879, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Picture", "bbox": {"l": 67.663002, "t": 286.04355000000004, "r": 93.647629, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "69-71", "bbox": {"l": 135.32401, "t": 286.04355000000004, "r": 155.03215, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "71.7", "bbox": {"l": 167.95399, "t": 286.04355000000004, "r": 182.43472, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "72.7", "bbox": {"l": 194.0462, "t": 286.04355000000004, "r": 208.52695, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "72.0", "bbox": {"l": 226.86324000000002, "t": 286.04355000000004, "r": 241.34396, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "77.1", "bbox": {"l": 261.86804, "t": 286.04355000000004, "r": 276.34879, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "Section-header", "bbox": {"l": 67.663002, "t": 297.00253, "r": 122.40287999999998, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "83-84", "bbox": {"l": 135.32401, "t": 297.00253, "r": 155.03215, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "67.6", "bbox": {"l": 167.95399, "t": 297.00253, "r": 182.43472, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "69.3", "bbox": {"l": 194.0462, "t": 297.00253, "r": 208.52695, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "68.4", "bbox": {"l": 226.86324000000002, "t": 297.00253, "r": 241.34396, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "74.6", "bbox": {"l": 261.86804, "t": 297.00253, "r": 276.34879, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "Table", "bbox": {"l": 67.663002, "t": 307.96155, "r": 87.46978, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "77-81", "bbox": {"l": 135.32401, "t": 307.96155, "r": 155.03215, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "82.2", "bbox": {"l": 167.95399, "t": 307.96155, "r": 182.43472, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "82.9", "bbox": {"l": 194.0462, "t": 307.96155, "r": 208.52695, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "82.2", "bbox": {"l": 226.86324000000002, "t": 307.96155, "r": 241.34396, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "86.3", "bbox": {"l": 261.86804, "t": 307.96155, "r": 276.34879, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "Text", "bbox": {"l": 67.663002, "t": 318.91953, "r": 83.623199, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "84-86", "bbox": {"l": 135.32401, "t": 318.91953, "r": 155.03215, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "84.6", "bbox": {"l": 167.95399, "t": 318.91953, "r": 182.43472, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "85.8", "bbox": {"l": 194.0462, "t": 318.91953, "r": 208.52695, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "85.4", "bbox": {"l": 226.86324000000002, "t": 318.91953, "r": 241.34396, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "88.1", "bbox": {"l": 261.86804, "t": 318.91953, "r": 276.34879, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Title", "bbox": {"l": 67.663002, "t": 329.87854, "r": 84.654327, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "60-72", "bbox": {"l": 135.32401, "t": 329.87854, "r": 155.03215, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "76.7", "bbox": {"l": 167.95399, "t": 329.87854, "r": 182.43472, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "80.4", "bbox": {"l": 194.0462, "t": 329.87854, "r": 208.52695, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "79.9", "bbox": {"l": 226.86324000000002, "t": 329.87854, "r": 241.34396, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "82.7", "bbox": {"l": 261.86804, "t": 329.87854, "r": 276.34879, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "All", "bbox": {"l": 67.663002, "t": 341.23654, "r": 78.628906, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "82-83", "bbox": {"l": 135.32401, "t": 341.23654, "r": 155.03215, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "72.4", "bbox": {"l": 167.95399, "t": 341.23654, "r": 182.43472, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "73.5", "bbox": {"l": 194.0462, "t": 341.23654, "r": 208.52695, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "73.4", "bbox": {"l": 226.86324000000002, "t": 341.23654, "r": 241.34396, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "76.8", "bbox": {"l": 261.86804, "t": 341.23654, "r": 276.34879, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": [{"id": 12, "label": "text", "bbox": {"l": 132.36501, "t": 197.97351000000003, "r": 157.99098, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "human", "bbox": {"l": 132.36501, "t": 197.97351000000003, "r": 157.99098, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 173.505, "t": 197.97351000000003, "r": 204.61841, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "MRCNN", "bbox": {"l": 173.505, "t": 197.97351000000003, "r": 204.61841, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 220.13028, "t": 197.97351000000003, "r": 248.06958, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "FRCNN", "bbox": {"l": 220.13028, "t": 197.97351000000003, "r": 248.06958, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 258.03125, "t": 197.97351000000003, "r": 280.17825, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "YOLO", "bbox": {"l": 258.03125, "t": 197.97351000000003, "r": 280.17825, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 168.39301, "t": 208.93255999999997, "r": 181.99504, "b": 217.30719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "R50", "bbox": {"l": 168.39301, "t": 208.93255999999997, "r": 181.99504, "b": 217.30719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 192.39606, "t": 208.93255999999997, "r": 210.16747, "b": 217.30719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "R101", "bbox": {"l": 192.39606, "t": 208.93255999999997, "r": 210.16747, "b": 217.30719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 225.21309, "t": 208.93255999999997, "r": 242.9845, "b": 217.30719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "R101", "bbox": {"l": 225.21309, "t": 208.93255999999997, "r": 242.9845, "b": 217.30719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 260.51379, "t": 208.93255999999997, "r": 277.70239, "b": 217.30719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "v5x6", "bbox": {"l": 260.51379, "t": 208.93255999999997, "r": 277.70239, "b": 217.30719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 67.663002, "t": 220.28954999999996, "r": 96.848633, "b": 228.66418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "Caption", "bbox": {"l": 67.663002, "t": 220.28954999999996, "r": 96.848633, "b": 228.66418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 135.32401, "t": 220.28954999999996, "r": 155.03215, "b": 228.66418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "84-89", "bbox": {"l": 135.32401, "t": 220.28954999999996, "r": 155.03215, "b": 228.66418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 167.95399, "t": 220.28954999999996, "r": 182.43472, "b": 228.66418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "68.4", "bbox": {"l": 167.95399, "t": 220.28954999999996, "r": 182.43472, "b": 228.66418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 194.0462, "t": 220.28954999999996, "r": 208.52695, "b": 228.66418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "71.5", "bbox": {"l": 194.0462, "t": 220.28954999999996, "r": 208.52695, "b": 228.66418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 226.86324000000002, "t": 220.28954999999996, "r": 241.34396, "b": 228.66418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "70.1", "bbox": {"l": 226.86324000000002, "t": 220.28954999999996, "r": 241.34396, "b": 228.66418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 261.86804, "t": 220.28954999999996, "r": 276.34879, "b": 228.66418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "77.7", "bbox": {"l": 261.86804, "t": 220.28954999999996, "r": 276.34879, "b": 228.66418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 67.663002, "t": 231.24854000000005, "r": 100.1662, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "Footnote", "bbox": {"l": 67.663002, "t": 231.24854000000005, "r": 100.1662, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 135.32401, "t": 231.24854000000005, "r": 155.03215, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "83-91", "bbox": {"l": 135.32401, "t": 231.24854000000005, "r": 155.03215, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 167.95399, "t": 231.24854000000005, "r": 182.43472, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "70.9", "bbox": {"l": 167.95399, "t": 231.24854000000005, "r": 182.43472, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 194.0462, "t": 231.24854000000005, "r": 208.52695, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "71.8", "bbox": {"l": 194.0462, "t": 231.24854000000005, "r": 208.52695, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 226.86324000000002, "t": 231.24854000000005, "r": 241.34396, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "73.7", "bbox": {"l": 226.86324000000002, "t": 231.24854000000005, "r": 241.34396, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 261.86804, "t": 231.24854000000005, "r": 276.34879, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "77.2", "bbox": {"l": 261.86804, "t": 231.24854000000005, "r": 276.34879, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 67.663002, "t": 242.20752000000005, "r": 98.175659, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "Formula", "bbox": {"l": 67.663002, "t": 242.20752000000005, "r": 98.175659, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 135.32401, "t": 242.20752000000005, "r": 155.03215, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "83-85", "bbox": {"l": 135.32401, "t": 242.20752000000005, "r": 155.03215, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 167.95399, "t": 242.20752000000005, "r": 182.43472, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "60.1", "bbox": {"l": 167.95399, "t": 242.20752000000005, "r": 182.43472, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 194.0462, "t": 242.20752000000005, "r": 208.52695, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "63.4", "bbox": {"l": 194.0462, "t": 242.20752000000005, "r": 208.52695, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 226.86324000000002, "t": 242.20752000000005, "r": 241.34396, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "63.5", "bbox": {"l": 226.86324000000002, "t": 242.20752000000005, "r": 241.34396, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 261.86804, "t": 242.20752000000005, "r": 276.34879, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "66.2", "bbox": {"l": 261.86804, "t": 242.20752000000005, "r": 276.34879, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 67.663002, "t": 253.16656, "r": 100.54279, "b": 261.5412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "List-item", "bbox": {"l": 67.663002, "t": 253.16656, "r": 100.54279, "b": 261.5412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 135.32401, "t": 253.16656, "r": 155.03215, "b": 261.5412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "87-88", "bbox": {"l": 135.32401, "t": 253.16656, "r": 155.03215, "b": 261.5412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 167.95399, "t": 253.16656, "r": 182.43472, "b": 261.5412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "81.2", "bbox": {"l": 167.95399, "t": 253.16656, "r": 182.43472, "b": 261.5412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 194.0462, "t": 253.16656, "r": 208.52695, "b": 261.5412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "80.8", "bbox": {"l": 194.0462, "t": 253.16656, "r": 208.52695, "b": 261.5412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 226.86324000000002, "t": 253.16656, "r": 241.34396, "b": 261.5412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "81.0", "bbox": {"l": 226.86324000000002, "t": 253.16656, "r": 241.34396, "b": 261.5412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 261.86804, "t": 253.16656, "r": 276.34879, "b": 261.5412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "86.2", "bbox": {"l": 261.86804, "t": 253.16656, "r": 276.34879, "b": 261.5412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 67.663002, "t": 264.12555, "r": 110.19064, "b": 272.50018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "Page-footer", "bbox": {"l": 67.663002, "t": 264.12555, "r": 110.19064, "b": 272.50018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 135.32401, "t": 264.12555, "r": 155.03215, "b": 272.50018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "93-94", "bbox": {"l": 135.32401, "t": 264.12555, "r": 155.03215, "b": 272.50018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 167.95399, "t": 264.12555, "r": 182.43472, "b": 272.50018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "61.6", "bbox": {"l": 167.95399, "t": 264.12555, "r": 182.43472, "b": 272.50018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 194.0462, "t": 264.12555, "r": 208.52695, "b": 272.50018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "59.3", "bbox": {"l": 194.0462, "t": 264.12555, "r": 208.52695, "b": 272.50018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 226.86324000000002, "t": 264.12555, "r": 241.34396, "b": 272.50018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "58.9", "bbox": {"l": 226.86324000000002, "t": 264.12555, "r": 241.34396, "b": 272.50018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 261.86804, "t": 264.12555, "r": 276.34879, "b": 272.50018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "61.1", "bbox": {"l": 261.86804, "t": 264.12555, "r": 276.34879, "b": 272.50018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 67.663002, "t": 275.08453, "r": 112.94331999999999, "b": 283.45917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "Page-header", "bbox": {"l": 67.663002, "t": 275.08453, "r": 112.94331999999999, "b": 283.45917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 135.32401, "t": 275.08453, "r": 155.03215, "b": 283.45917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "85-89", "bbox": {"l": 135.32401, "t": 275.08453, "r": 155.03215, "b": 283.45917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 167.95399, "t": 275.08453, "r": 182.43472, "b": 283.45917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "71.9", "bbox": {"l": 167.95399, "t": 275.08453, "r": 182.43472, "b": 283.45917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 194.0462, "t": 275.08453, "r": 208.52695, "b": 283.45917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "70.0", "bbox": {"l": 194.0462, "t": 275.08453, "r": 208.52695, "b": 283.45917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 226.86324000000002, "t": 275.08453, "r": 241.34396, "b": 283.45917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "72.0", "bbox": {"l": 226.86324000000002, "t": 275.08453, "r": 241.34396, "b": 283.45917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 261.86804, "t": 275.08453, "r": 276.34879, "b": 283.45917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "67.9", "bbox": {"l": 261.86804, "t": 275.08453, "r": 276.34879, "b": 283.45917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 67.663002, "t": 286.04355000000004, "r": 93.647629, "b": 294.41818, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "Picture", "bbox": {"l": 67.663002, "t": 286.04355000000004, "r": 93.647629, "b": 294.41818, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 135.32401, "t": 286.04355000000004, "r": 155.03215, "b": 294.41818, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "69-71", "bbox": {"l": 135.32401, "t": 286.04355000000004, "r": 155.03215, "b": 294.41818, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 167.95399, "t": 286.04355000000004, "r": 182.43472, "b": 294.41818, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "71.7", "bbox": {"l": 167.95399, "t": 286.04355000000004, "r": 182.43472, "b": 294.41818, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 194.0462, "t": 286.04355000000004, "r": 208.52695, "b": 294.41818, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "72.7", "bbox": {"l": 194.0462, "t": 286.04355000000004, "r": 208.52695, "b": 294.41818, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 226.86324000000002, "t": 286.04355000000004, "r": 241.34396, "b": 294.41818, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "72.0", "bbox": {"l": 226.86324000000002, "t": 286.04355000000004, "r": 241.34396, "b": 294.41818, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 261.86804, "t": 286.04355000000004, "r": 276.34879, "b": 294.41818, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "77.1", "bbox": {"l": 261.86804, "t": 286.04355000000004, "r": 276.34879, "b": 294.41818, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 67.663002, "t": 297.00253, "r": 122.40287999999998, "b": 305.37717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "Section-header", "bbox": {"l": 67.663002, "t": 297.00253, "r": 122.40287999999998, "b": 305.37717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 135.32401, "t": 297.00253, "r": 155.03215, "b": 305.37717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "83-84", "bbox": {"l": 135.32401, "t": 297.00253, "r": 155.03215, "b": 305.37717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 167.95399, "t": 297.00253, "r": 182.43472, "b": 305.37717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "67.6", "bbox": {"l": 167.95399, "t": 297.00253, "r": 182.43472, "b": 305.37717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 194.0462, "t": 297.00253, "r": 208.52695, "b": 305.37717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "69.3", "bbox": {"l": 194.0462, "t": 297.00253, "r": 208.52695, "b": 305.37717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 226.86324000000002, "t": 297.00253, "r": 241.34396, "b": 305.37717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "68.4", "bbox": {"l": 226.86324000000002, "t": 297.00253, "r": 241.34396, "b": 305.37717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 261.86804, "t": 297.00253, "r": 276.34879, "b": 305.37717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "74.6", "bbox": {"l": 261.86804, "t": 297.00253, "r": 276.34879, "b": 305.37717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 67.663002, "t": 307.96155, "r": 87.46978, "b": 316.33618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "Table", "bbox": {"l": 67.663002, "t": 307.96155, "r": 87.46978, "b": 316.33618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 135.32401, "t": 307.96155, "r": 155.03215, "b": 316.33618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "77-81", "bbox": {"l": 135.32401, "t": 307.96155, "r": 155.03215, "b": 316.33618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 167.95399, "t": 307.96155, "r": 182.43472, "b": 316.33618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "82.2", "bbox": {"l": 167.95399, "t": 307.96155, "r": 182.43472, "b": 316.33618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 194.0462, "t": 307.96155, "r": 208.52695, "b": 316.33618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "82.9", "bbox": {"l": 194.0462, "t": 307.96155, "r": 208.52695, "b": 316.33618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 226.86324000000002, "t": 307.96155, "r": 241.34396, "b": 316.33618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "82.2", "bbox": {"l": 226.86324000000002, "t": 307.96155, "r": 241.34396, "b": 316.33618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 261.86804, "t": 307.96155, "r": 276.34879, "b": 316.33618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "86.3", "bbox": {"l": 261.86804, "t": 307.96155, "r": 276.34879, "b": 316.33618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 67.663002, "t": 318.91953, "r": 83.623199, "b": 327.29416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "Text", "bbox": {"l": 67.663002, "t": 318.91953, "r": 83.623199, "b": 327.29416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 135.32401, "t": 318.91953, "r": 155.03215, "b": 327.29416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "84-86", "bbox": {"l": 135.32401, "t": 318.91953, "r": 155.03215, "b": 327.29416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 167.95399, "t": 318.91953, "r": 182.43472, "b": 327.29416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "84.6", "bbox": {"l": 167.95399, "t": 318.91953, "r": 182.43472, "b": 327.29416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 194.0462, "t": 318.91953, "r": 208.52695, "b": 327.29416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "85.8", "bbox": {"l": 194.0462, "t": 318.91953, "r": 208.52695, "b": 327.29416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 226.86324000000002, "t": 318.91953, "r": 241.34396, "b": 327.29416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "85.4", "bbox": {"l": 226.86324000000002, "t": 318.91953, "r": 241.34396, "b": 327.29416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 261.86804, "t": 318.91953, "r": 276.34879, "b": 327.29416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "88.1", "bbox": {"l": 261.86804, "t": 318.91953, "r": 276.34879, "b": 327.29416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 67.663002, "t": 329.87854, "r": 84.654327, "b": 338.25317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "Title", "bbox": {"l": 67.663002, "t": 329.87854, "r": 84.654327, "b": 338.25317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 135.32401, "t": 329.87854, "r": 155.03215, "b": 338.25317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "60-72", "bbox": {"l": 135.32401, "t": 329.87854, "r": 155.03215, "b": 338.25317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 167.95399, "t": 329.87854, "r": 182.43472, "b": 338.25317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "76.7", "bbox": {"l": 167.95399, "t": 329.87854, "r": 182.43472, "b": 338.25317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 194.0462, "t": 329.87854, "r": 208.52695, "b": 338.25317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "80.4", "bbox": {"l": 194.0462, "t": 329.87854, "r": 208.52695, "b": 338.25317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 226.86324000000002, "t": 329.87854, "r": 241.34396, "b": 338.25317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "79.9", "bbox": {"l": 226.86324000000002, "t": 329.87854, "r": 241.34396, "b": 338.25317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 261.86804, "t": 329.87854, "r": 276.34879, "b": 338.25317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "82.7", "bbox": {"l": 261.86804, "t": 329.87854, "r": 276.34879, "b": 338.25317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 67.663002, "t": 341.23654, "r": 78.628906, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "All", "bbox": {"l": 67.663002, "t": 341.23654, "r": 78.628906, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 135.32401, "t": 341.23654, "r": 155.03215, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "82-83", "bbox": {"l": 135.32401, "t": 341.23654, "r": 155.03215, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 167.95399, "t": 341.23654, "r": 182.43472, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "72.4", "bbox": {"l": 167.95399, "t": 341.23654, "r": 182.43472, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 194.0462, "t": 341.23654, "r": 208.52695, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "73.5", "bbox": {"l": 194.0462, "t": 341.23654, "r": 208.52695, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 226.86324000000002, "t": 341.23654, "r": 241.34396, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "73.4", "bbox": {"l": 226.86324000000002, "t": 341.23654, "r": 241.34396, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 261.86804, "t": 341.23654, "r": 276.34879, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "76.8", "bbox": {"l": 261.86804, "t": 341.23654, "r": 276.34879, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ecel", "ched", "ched", "lcel", "ched", "ched", "nl", "ecel", "ucel", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 14, "num_cols": 6, "table_cells": [{"bbox": {"l": 132.36501, "t": 197.97351000000003, "r": 157.99098, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "human", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 173.505, "t": 197.97351000000003, "r": 204.61841, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 4, "text": "MRCNN", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 220.13028, "t": 197.97351000000003, "r": 248.06958, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "FRCNN", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 258.03125, "t": 197.97351000000003, "r": 280.17825, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "YOLO", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 168.39301, "t": 208.93255999999997, "r": 181.99504, "b": 217.30719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "R50", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 192.39606, "t": 208.93255999999997, "r": 210.16747, "b": 217.30719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "R101", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 225.21309, "t": 208.93255999999997, "r": 242.9845, "b": 217.30719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "R101", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 260.51379, "t": 208.93255999999997, "r": 277.70239, "b": 217.30719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "v5x6", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 220.28954999999996, "r": 96.848633, "b": 228.66418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Caption", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 220.28954999999996, "r": 155.03215, "b": 228.66418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "84-89", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 220.28954999999996, "r": 182.43472, "b": 228.66418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "68.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 220.28954999999996, "r": 208.52695, "b": 228.66418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "71.5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 220.28954999999996, "r": 241.34396, "b": 228.66418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "70.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 220.28954999999996, "r": 276.34879, "b": 228.66418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "77.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 231.24854000000005, "r": 100.1662, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Footnote", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 231.24854000000005, "r": 155.03215, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "83-91", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 231.24854000000005, "r": 182.43472, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "70.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 231.24854000000005, "r": 208.52695, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "71.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 231.24854000000005, "r": 241.34396, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "73.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 231.24854000000005, "r": 276.34879, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "77.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 242.20752000000005, "r": 98.175659, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Formula", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 242.20752000000005, "r": 155.03215, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "83-85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 242.20752000000005, "r": 182.43472, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "60.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 242.20752000000005, "r": 208.52695, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "63.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 242.20752000000005, "r": 241.34396, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "63.5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 242.20752000000005, "r": 276.34879, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "66.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 253.16656, "r": 100.54279, "b": 261.5412, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "List-item", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 253.16656, "r": 155.03215, "b": 261.5412, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "87-88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 253.16656, "r": 182.43472, "b": 261.5412, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "81.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 253.16656, "r": 208.52695, "b": 261.5412, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "80.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 253.16656, "r": 241.34396, "b": 261.5412, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "81.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 253.16656, "r": 276.34879, "b": 261.5412, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "86.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 264.12555, "r": 110.19064, "b": 272.50018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-footer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 264.12555, "r": 155.03215, "b": 272.50018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "93-94", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 264.12555, "r": 182.43472, "b": 272.50018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "61.6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 264.12555, "r": 208.52695, "b": 272.50018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "59.3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 264.12555, "r": 241.34396, "b": 272.50018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "58.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 264.12555, "r": 276.34879, "b": 272.50018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "61.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 275.08453, "r": 112.94331999999999, "b": 283.45917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 275.08453, "r": 155.03215, "b": 283.45917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "85-89", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 275.08453, "r": 182.43472, "b": 283.45917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "71.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 275.08453, "r": 208.52695, "b": 283.45917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "70.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 275.08453, "r": 241.34396, "b": 283.45917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "72.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 275.08453, "r": 276.34879, "b": 283.45917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "67.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 286.04355000000004, "r": 93.647629, "b": 294.41818, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Picture", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 286.04355000000004, "r": 155.03215, "b": 294.41818, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "69-71", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 286.04355000000004, "r": 182.43472, "b": 294.41818, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "71.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 286.04355000000004, "r": 208.52695, "b": 294.41818, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "72.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 286.04355000000004, "r": 241.34396, "b": 294.41818, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "72.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 286.04355000000004, "r": 276.34879, "b": 294.41818, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "77.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 297.00253, "r": 122.40287999999998, "b": 305.37717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Section-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 297.00253, "r": 155.03215, "b": 305.37717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "83-84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 297.00253, "r": 182.43472, "b": 305.37717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "67.6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 297.00253, "r": 208.52695, "b": 305.37717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "69.3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 297.00253, "r": 241.34396, "b": 305.37717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "68.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 297.00253, "r": 276.34879, "b": 305.37717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "74.6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 307.96155, "r": 87.46978, "b": 316.33618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 307.96155, "r": 155.03215, "b": 316.33618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "77-81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 307.96155, "r": 182.43472, "b": 316.33618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "82.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 307.96155, "r": 208.52695, "b": 316.33618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "82.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 307.96155, "r": 241.34396, "b": 316.33618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "82.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 307.96155, "r": 276.34879, "b": 316.33618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "86.3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 318.91953, "r": 83.623199, "b": 327.29416, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Text", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 318.91953, "r": 155.03215, "b": 327.29416, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "84-86", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 318.91953, "r": 182.43472, "b": 327.29416, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "84.6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 318.91953, "r": 208.52695, "b": 327.29416, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "85.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 318.91953, "r": 241.34396, "b": 327.29416, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "85.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 318.91953, "r": 276.34879, "b": 327.29416, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "88.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 329.87854, "r": 84.654327, "b": 338.25317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Title", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 329.87854, "r": 155.03215, "b": 338.25317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "60-72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 329.87854, "r": 182.43472, "b": 338.25317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "76.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 329.87854, "r": 208.52695, "b": 338.25317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "80.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 329.87854, "r": 241.34396, "b": 338.25317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "79.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 329.87854, "r": 276.34879, "b": 338.25317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "82.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 341.23654, "r": 78.628906, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "All", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 341.23654, "r": 155.03215, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "82-83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 341.23654, "r": 182.43472, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "72.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 341.23654, "r": 208.52695, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "73.5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 341.23654, "r": 241.34396, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "73.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 341.23654, "r": 276.34879, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "76.8", "column_header": false, "row_header": false, "row_section": false}]}}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_header", "id": 11, "page_no": 5, "cluster": {"id": 11, "label": "page_header", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.8662874698638916, "cells": [{"id": 0, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 246.24382, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar", "bbox": {"l": 253.13897999999998, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar"}, {"label": "text", "id": 5, "page_no": 5, "cluster": {"id": 5, "label": "text", "bbox": {"l": 53.501999, "t": 86.87292000000002, "r": 295.64874, "b": 183.01709000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9782760143280029, "cells": [{"id": 2, "text": "Table 2: Prediction performance (mAP@0.5-0.95) of object", "bbox": {"l": 53.501999, "t": 86.87292000000002, "r": 294.04361, "b": 95.34618999999998, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "detection networks on DocLayNet test set. The MRCNN", "bbox": {"l": 53.79800000000001, "t": 97.83191, "r": 294.04373, "b": 106.30517999999995, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "(Mask R-CNN) and FRCNN (Faster R-CNN) models with", "bbox": {"l": 53.52, "t": 108.79088999999999, "r": 294.0437, "b": 117.26415999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "ResNet-50 or ResNet-101 backbone were trained based on", "bbox": {"l": 53.79800000000001, "t": 119.74987999999996, "r": 294.04373, "b": 128.22313999999994, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "the network architectures from the", "bbox": {"l": 53.79800000000001, "t": 130.70885999999996, "r": 202.43402, "b": 139.18213000000003, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "detectron2", "bbox": {"l": 206.08501, "t": 130.71783000000005, "r": 247.14215000000002, "b": 139.20905000000005, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "model zoo", "bbox": {"l": 250.95001, "t": 130.70885999999996, "r": 294.04254, "b": 139.18213000000003, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "(Mask R-CNN R50, R101-FPN 3x, Faster R-CNN R101-FPN", "bbox": {"l": 53.52002, "t": 141.66785000000004, "r": 294.04367, "b": 150.14111000000003, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "3x), with default configurations. The YOLO implementation", "bbox": {"l": 53.798019, "t": 152.62683000000004, "r": 294.04373, "b": 161.1001, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "utilized was YOLOv5x6 [13]. All models were initialised us-", "bbox": {"l": 53.798019, "t": 163.58582, "r": 295.64874, "b": 172.05908, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "ing pre-trained weights from the COCO 2017 dataset.", "bbox": {"l": 53.798019, "t": 174.54381999999998, "r": 268.62399, "b": 183.01709000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 2: Prediction performance (mAP@0.5-0.95) of object detection networks on DocLayNet test set. The MRCNN (Mask R-CNN) and FRCNN (Faster R-CNN) models with ResNet-50 or ResNet-101 backbone were trained based on the network architectures from the detectron2 model zoo (Mask R-CNN R50, R101-FPN 3x, Faster R-CNN R101-FPN 3x), with default configurations. The YOLO implementation utilized was YOLOv5x6 [13]. All models were initialised using pre-trained weights from the COCO 2017 dataset."}, {"label": "table", "id": 0, "page_no": 5, "cluster": {"id": 0, "label": "table", "bbox": {"l": 62.02753829956055, "t": 195.6800537109375, "r": 285.78955078125, "b": 351.6618957519531, "coord_origin": "TOPLEFT"}, "confidence": 0.9883638620376587, "cells": [{"id": 13, "text": "human", "bbox": {"l": 132.36501, "t": 197.97351000000003, "r": 157.99098, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "MRCNN", "bbox": {"l": 173.505, "t": 197.97351000000003, "r": 204.61841, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "FRCNN", "bbox": {"l": 220.13028, "t": 197.97351000000003, "r": 248.06958, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "YOLO", "bbox": {"l": 258.03125, "t": 197.97351000000003, "r": 280.17825, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "R50", "bbox": {"l": 168.39301, "t": 208.93255999999997, "r": 181.99504, "b": 217.30719, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "R101", "bbox": {"l": 192.39606, "t": 208.93255999999997, "r": 210.16747, "b": 217.30719, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "R101", "bbox": {"l": 225.21309, "t": 208.93255999999997, "r": 242.9845, "b": 217.30719, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "v5x6", "bbox": {"l": 260.51379, "t": 208.93255999999997, "r": 277.70239, "b": 217.30719, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Caption", "bbox": {"l": 67.663002, "t": 220.28954999999996, "r": 96.848633, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "84-89", "bbox": {"l": 135.32401, "t": 220.28954999999996, "r": 155.03215, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "68.4", "bbox": {"l": 167.95399, "t": 220.28954999999996, "r": 182.43472, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "71.5", "bbox": {"l": 194.0462, "t": 220.28954999999996, "r": 208.52695, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "70.1", "bbox": {"l": 226.86324000000002, "t": 220.28954999999996, "r": 241.34396, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "77.7", "bbox": {"l": 261.86804, "t": 220.28954999999996, "r": 276.34879, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Footnote", "bbox": {"l": 67.663002, "t": 231.24854000000005, "r": 100.1662, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "83-91", "bbox": {"l": 135.32401, "t": 231.24854000000005, "r": 155.03215, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "70.9", "bbox": {"l": 167.95399, "t": 231.24854000000005, "r": 182.43472, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "71.8", "bbox": {"l": 194.0462, "t": 231.24854000000005, "r": 208.52695, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "73.7", "bbox": {"l": 226.86324000000002, "t": 231.24854000000005, "r": 241.34396, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "77.2", "bbox": {"l": 261.86804, "t": 231.24854000000005, "r": 276.34879, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "Formula", "bbox": {"l": 67.663002, "t": 242.20752000000005, "r": 98.175659, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "83-85", "bbox": {"l": 135.32401, "t": 242.20752000000005, "r": 155.03215, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "60.1", "bbox": {"l": 167.95399, "t": 242.20752000000005, "r": 182.43472, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "63.4", "bbox": {"l": 194.0462, "t": 242.20752000000005, "r": 208.52695, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "63.5", "bbox": {"l": 226.86324000000002, "t": 242.20752000000005, "r": 241.34396, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "66.2", "bbox": {"l": 261.86804, "t": 242.20752000000005, "r": 276.34879, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "List-item", "bbox": {"l": 67.663002, "t": 253.16656, "r": 100.54279, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "87-88", "bbox": {"l": 135.32401, "t": 253.16656, "r": 155.03215, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "81.2", "bbox": {"l": 167.95399, "t": 253.16656, "r": 182.43472, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "80.8", "bbox": {"l": 194.0462, "t": 253.16656, "r": 208.52695, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "81.0", "bbox": {"l": 226.86324000000002, "t": 253.16656, "r": 241.34396, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "86.2", "bbox": {"l": 261.86804, "t": 253.16656, "r": 276.34879, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Page-footer", "bbox": {"l": 67.663002, "t": 264.12555, "r": 110.19064, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "93-94", "bbox": {"l": 135.32401, "t": 264.12555, "r": 155.03215, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "61.6", "bbox": {"l": 167.95399, "t": 264.12555, "r": 182.43472, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "59.3", "bbox": {"l": 194.0462, "t": 264.12555, "r": 208.52695, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "58.9", "bbox": {"l": 226.86324000000002, "t": 264.12555, "r": 241.34396, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "61.1", "bbox": {"l": 261.86804, "t": 264.12555, "r": 276.34879, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Page-header", "bbox": {"l": 67.663002, "t": 275.08453, "r": 112.94331999999999, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "85-89", "bbox": {"l": 135.32401, "t": 275.08453, "r": 155.03215, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "71.9", "bbox": {"l": 167.95399, "t": 275.08453, "r": 182.43472, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "70.0", "bbox": {"l": 194.0462, "t": 275.08453, "r": 208.52695, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "72.0", "bbox": {"l": 226.86324000000002, "t": 275.08453, "r": 241.34396, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "67.9", "bbox": {"l": 261.86804, "t": 275.08453, "r": 276.34879, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Picture", "bbox": {"l": 67.663002, "t": 286.04355000000004, "r": 93.647629, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "69-71", "bbox": {"l": 135.32401, "t": 286.04355000000004, "r": 155.03215, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "71.7", "bbox": {"l": 167.95399, "t": 286.04355000000004, "r": 182.43472, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "72.7", "bbox": {"l": 194.0462, "t": 286.04355000000004, "r": 208.52695, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "72.0", "bbox": {"l": 226.86324000000002, "t": 286.04355000000004, "r": 241.34396, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "77.1", "bbox": {"l": 261.86804, "t": 286.04355000000004, "r": 276.34879, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "Section-header", "bbox": {"l": 67.663002, "t": 297.00253, "r": 122.40287999999998, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "83-84", "bbox": {"l": 135.32401, "t": 297.00253, "r": 155.03215, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "67.6", "bbox": {"l": 167.95399, "t": 297.00253, "r": 182.43472, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "69.3", "bbox": {"l": 194.0462, "t": 297.00253, "r": 208.52695, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "68.4", "bbox": {"l": 226.86324000000002, "t": 297.00253, "r": 241.34396, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "74.6", "bbox": {"l": 261.86804, "t": 297.00253, "r": 276.34879, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "Table", "bbox": {"l": 67.663002, "t": 307.96155, "r": 87.46978, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "77-81", "bbox": {"l": 135.32401, "t": 307.96155, "r": 155.03215, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "82.2", "bbox": {"l": 167.95399, "t": 307.96155, "r": 182.43472, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "82.9", "bbox": {"l": 194.0462, "t": 307.96155, "r": 208.52695, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "82.2", "bbox": {"l": 226.86324000000002, "t": 307.96155, "r": 241.34396, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "86.3", "bbox": {"l": 261.86804, "t": 307.96155, "r": 276.34879, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "Text", "bbox": {"l": 67.663002, "t": 318.91953, "r": 83.623199, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "84-86", "bbox": {"l": 135.32401, "t": 318.91953, "r": 155.03215, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "84.6", "bbox": {"l": 167.95399, "t": 318.91953, "r": 182.43472, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "85.8", "bbox": {"l": 194.0462, "t": 318.91953, "r": 208.52695, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "85.4", "bbox": {"l": 226.86324000000002, "t": 318.91953, "r": 241.34396, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "88.1", "bbox": {"l": 261.86804, "t": 318.91953, "r": 276.34879, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Title", "bbox": {"l": 67.663002, "t": 329.87854, "r": 84.654327, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "60-72", "bbox": {"l": 135.32401, "t": 329.87854, "r": 155.03215, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "76.7", "bbox": {"l": 167.95399, "t": 329.87854, "r": 182.43472, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "80.4", "bbox": {"l": 194.0462, "t": 329.87854, "r": 208.52695, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "79.9", "bbox": {"l": 226.86324000000002, "t": 329.87854, "r": 241.34396, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "82.7", "bbox": {"l": 261.86804, "t": 329.87854, "r": 276.34879, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "All", "bbox": {"l": 67.663002, "t": 341.23654, "r": 78.628906, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "82-83", "bbox": {"l": 135.32401, "t": 341.23654, "r": 155.03215, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "72.4", "bbox": {"l": 167.95399, "t": 341.23654, "r": 182.43472, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "73.5", "bbox": {"l": 194.0462, "t": 341.23654, "r": 208.52695, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "73.4", "bbox": {"l": 226.86324000000002, "t": 341.23654, "r": 241.34396, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "76.8", "bbox": {"l": 261.86804, "t": 341.23654, "r": 276.34879, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": [{"id": 12, "label": "text", "bbox": {"l": 132.36501, "t": 197.97351000000003, "r": 157.99098, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "human", "bbox": {"l": 132.36501, "t": 197.97351000000003, "r": 157.99098, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 173.505, "t": 197.97351000000003, "r": 204.61841, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "MRCNN", "bbox": {"l": 173.505, "t": 197.97351000000003, "r": 204.61841, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 220.13028, "t": 197.97351000000003, "r": 248.06958, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "FRCNN", "bbox": {"l": 220.13028, "t": 197.97351000000003, "r": 248.06958, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 258.03125, "t": 197.97351000000003, "r": 280.17825, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "YOLO", "bbox": {"l": 258.03125, "t": 197.97351000000003, "r": 280.17825, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 168.39301, "t": 208.93255999999997, "r": 181.99504, "b": 217.30719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "R50", "bbox": {"l": 168.39301, "t": 208.93255999999997, "r": 181.99504, "b": 217.30719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 192.39606, "t": 208.93255999999997, "r": 210.16747, "b": 217.30719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "R101", "bbox": {"l": 192.39606, "t": 208.93255999999997, "r": 210.16747, "b": 217.30719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 225.21309, "t": 208.93255999999997, "r": 242.9845, "b": 217.30719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "R101", "bbox": {"l": 225.21309, "t": 208.93255999999997, "r": 242.9845, "b": 217.30719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 260.51379, "t": 208.93255999999997, "r": 277.70239, "b": 217.30719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "v5x6", "bbox": {"l": 260.51379, "t": 208.93255999999997, "r": 277.70239, "b": 217.30719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 67.663002, "t": 220.28954999999996, "r": 96.848633, "b": 228.66418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "Caption", "bbox": {"l": 67.663002, "t": 220.28954999999996, "r": 96.848633, "b": 228.66418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 135.32401, "t": 220.28954999999996, "r": 155.03215, "b": 228.66418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "84-89", "bbox": {"l": 135.32401, "t": 220.28954999999996, "r": 155.03215, "b": 228.66418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 167.95399, "t": 220.28954999999996, "r": 182.43472, "b": 228.66418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "68.4", "bbox": {"l": 167.95399, "t": 220.28954999999996, "r": 182.43472, "b": 228.66418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 194.0462, "t": 220.28954999999996, "r": 208.52695, "b": 228.66418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "71.5", "bbox": {"l": 194.0462, "t": 220.28954999999996, "r": 208.52695, "b": 228.66418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 226.86324000000002, "t": 220.28954999999996, "r": 241.34396, "b": 228.66418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "70.1", "bbox": {"l": 226.86324000000002, "t": 220.28954999999996, "r": 241.34396, "b": 228.66418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 261.86804, "t": 220.28954999999996, "r": 276.34879, "b": 228.66418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "77.7", "bbox": {"l": 261.86804, "t": 220.28954999999996, "r": 276.34879, "b": 228.66418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 67.663002, "t": 231.24854000000005, "r": 100.1662, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "Footnote", "bbox": {"l": 67.663002, "t": 231.24854000000005, "r": 100.1662, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 135.32401, "t": 231.24854000000005, "r": 155.03215, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "83-91", "bbox": {"l": 135.32401, "t": 231.24854000000005, "r": 155.03215, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 167.95399, "t": 231.24854000000005, "r": 182.43472, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "70.9", "bbox": {"l": 167.95399, "t": 231.24854000000005, "r": 182.43472, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 194.0462, "t": 231.24854000000005, "r": 208.52695, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "71.8", "bbox": {"l": 194.0462, "t": 231.24854000000005, "r": 208.52695, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 226.86324000000002, "t": 231.24854000000005, "r": 241.34396, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "73.7", "bbox": {"l": 226.86324000000002, "t": 231.24854000000005, "r": 241.34396, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 261.86804, "t": 231.24854000000005, "r": 276.34879, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "77.2", "bbox": {"l": 261.86804, "t": 231.24854000000005, "r": 276.34879, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 67.663002, "t": 242.20752000000005, "r": 98.175659, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "Formula", "bbox": {"l": 67.663002, "t": 242.20752000000005, "r": 98.175659, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 135.32401, "t": 242.20752000000005, "r": 155.03215, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "83-85", "bbox": {"l": 135.32401, "t": 242.20752000000005, "r": 155.03215, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 167.95399, "t": 242.20752000000005, "r": 182.43472, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "60.1", "bbox": {"l": 167.95399, "t": 242.20752000000005, "r": 182.43472, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 194.0462, "t": 242.20752000000005, "r": 208.52695, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "63.4", "bbox": {"l": 194.0462, "t": 242.20752000000005, "r": 208.52695, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 226.86324000000002, "t": 242.20752000000005, "r": 241.34396, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "63.5", "bbox": {"l": 226.86324000000002, "t": 242.20752000000005, "r": 241.34396, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 261.86804, "t": 242.20752000000005, "r": 276.34879, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "66.2", "bbox": {"l": 261.86804, "t": 242.20752000000005, "r": 276.34879, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 67.663002, "t": 253.16656, "r": 100.54279, "b": 261.5412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "List-item", "bbox": {"l": 67.663002, "t": 253.16656, "r": 100.54279, "b": 261.5412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 135.32401, "t": 253.16656, "r": 155.03215, "b": 261.5412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "87-88", "bbox": {"l": 135.32401, "t": 253.16656, "r": 155.03215, "b": 261.5412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 167.95399, "t": 253.16656, "r": 182.43472, "b": 261.5412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "81.2", "bbox": {"l": 167.95399, "t": 253.16656, "r": 182.43472, "b": 261.5412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 194.0462, "t": 253.16656, "r": 208.52695, "b": 261.5412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "80.8", "bbox": {"l": 194.0462, "t": 253.16656, "r": 208.52695, "b": 261.5412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 226.86324000000002, "t": 253.16656, "r": 241.34396, "b": 261.5412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "81.0", "bbox": {"l": 226.86324000000002, "t": 253.16656, "r": 241.34396, "b": 261.5412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 261.86804, "t": 253.16656, "r": 276.34879, "b": 261.5412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "86.2", "bbox": {"l": 261.86804, "t": 253.16656, "r": 276.34879, "b": 261.5412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 67.663002, "t": 264.12555, "r": 110.19064, "b": 272.50018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "Page-footer", "bbox": {"l": 67.663002, "t": 264.12555, "r": 110.19064, "b": 272.50018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 135.32401, "t": 264.12555, "r": 155.03215, "b": 272.50018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "93-94", "bbox": {"l": 135.32401, "t": 264.12555, "r": 155.03215, "b": 272.50018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 167.95399, "t": 264.12555, "r": 182.43472, "b": 272.50018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "61.6", "bbox": {"l": 167.95399, "t": 264.12555, "r": 182.43472, "b": 272.50018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 194.0462, "t": 264.12555, "r": 208.52695, "b": 272.50018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "59.3", "bbox": {"l": 194.0462, "t": 264.12555, "r": 208.52695, "b": 272.50018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 226.86324000000002, "t": 264.12555, "r": 241.34396, "b": 272.50018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "58.9", "bbox": {"l": 226.86324000000002, "t": 264.12555, "r": 241.34396, "b": 272.50018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 261.86804, "t": 264.12555, "r": 276.34879, "b": 272.50018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "61.1", "bbox": {"l": 261.86804, "t": 264.12555, "r": 276.34879, "b": 272.50018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 67.663002, "t": 275.08453, "r": 112.94331999999999, "b": 283.45917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "Page-header", "bbox": {"l": 67.663002, "t": 275.08453, "r": 112.94331999999999, "b": 283.45917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 135.32401, "t": 275.08453, "r": 155.03215, "b": 283.45917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "85-89", "bbox": {"l": 135.32401, "t": 275.08453, "r": 155.03215, "b": 283.45917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 167.95399, "t": 275.08453, "r": 182.43472, "b": 283.45917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "71.9", "bbox": {"l": 167.95399, "t": 275.08453, "r": 182.43472, "b": 283.45917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 194.0462, "t": 275.08453, "r": 208.52695, "b": 283.45917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "70.0", "bbox": {"l": 194.0462, "t": 275.08453, "r": 208.52695, "b": 283.45917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 226.86324000000002, "t": 275.08453, "r": 241.34396, "b": 283.45917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "72.0", "bbox": {"l": 226.86324000000002, "t": 275.08453, "r": 241.34396, "b": 283.45917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 261.86804, "t": 275.08453, "r": 276.34879, "b": 283.45917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "67.9", "bbox": {"l": 261.86804, "t": 275.08453, "r": 276.34879, "b": 283.45917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 67.663002, "t": 286.04355000000004, "r": 93.647629, "b": 294.41818, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "Picture", "bbox": {"l": 67.663002, "t": 286.04355000000004, "r": 93.647629, "b": 294.41818, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 135.32401, "t": 286.04355000000004, "r": 155.03215, "b": 294.41818, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "69-71", "bbox": {"l": 135.32401, "t": 286.04355000000004, "r": 155.03215, "b": 294.41818, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 167.95399, "t": 286.04355000000004, "r": 182.43472, "b": 294.41818, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "71.7", "bbox": {"l": 167.95399, "t": 286.04355000000004, "r": 182.43472, "b": 294.41818, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 194.0462, "t": 286.04355000000004, "r": 208.52695, "b": 294.41818, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "72.7", "bbox": {"l": 194.0462, "t": 286.04355000000004, "r": 208.52695, "b": 294.41818, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 226.86324000000002, "t": 286.04355000000004, "r": 241.34396, "b": 294.41818, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "72.0", "bbox": {"l": 226.86324000000002, "t": 286.04355000000004, "r": 241.34396, "b": 294.41818, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 261.86804, "t": 286.04355000000004, "r": 276.34879, "b": 294.41818, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "77.1", "bbox": {"l": 261.86804, "t": 286.04355000000004, "r": 276.34879, "b": 294.41818, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 67.663002, "t": 297.00253, "r": 122.40287999999998, "b": 305.37717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "Section-header", "bbox": {"l": 67.663002, "t": 297.00253, "r": 122.40287999999998, "b": 305.37717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 135.32401, "t": 297.00253, "r": 155.03215, "b": 305.37717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "83-84", "bbox": {"l": 135.32401, "t": 297.00253, "r": 155.03215, "b": 305.37717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 167.95399, "t": 297.00253, "r": 182.43472, "b": 305.37717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "67.6", "bbox": {"l": 167.95399, "t": 297.00253, "r": 182.43472, "b": 305.37717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 194.0462, "t": 297.00253, "r": 208.52695, "b": 305.37717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "69.3", "bbox": {"l": 194.0462, "t": 297.00253, "r": 208.52695, "b": 305.37717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 226.86324000000002, "t": 297.00253, "r": 241.34396, "b": 305.37717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "68.4", "bbox": {"l": 226.86324000000002, "t": 297.00253, "r": 241.34396, "b": 305.37717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 261.86804, "t": 297.00253, "r": 276.34879, "b": 305.37717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "74.6", "bbox": {"l": 261.86804, "t": 297.00253, "r": 276.34879, "b": 305.37717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 67.663002, "t": 307.96155, "r": 87.46978, "b": 316.33618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "Table", "bbox": {"l": 67.663002, "t": 307.96155, "r": 87.46978, "b": 316.33618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 135.32401, "t": 307.96155, "r": 155.03215, "b": 316.33618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "77-81", "bbox": {"l": 135.32401, "t": 307.96155, "r": 155.03215, "b": 316.33618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 167.95399, "t": 307.96155, "r": 182.43472, "b": 316.33618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "82.2", "bbox": {"l": 167.95399, "t": 307.96155, "r": 182.43472, "b": 316.33618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 194.0462, "t": 307.96155, "r": 208.52695, "b": 316.33618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "82.9", "bbox": {"l": 194.0462, "t": 307.96155, "r": 208.52695, "b": 316.33618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 226.86324000000002, "t": 307.96155, "r": 241.34396, "b": 316.33618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "82.2", "bbox": {"l": 226.86324000000002, "t": 307.96155, "r": 241.34396, "b": 316.33618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 261.86804, "t": 307.96155, "r": 276.34879, "b": 316.33618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "86.3", "bbox": {"l": 261.86804, "t": 307.96155, "r": 276.34879, "b": 316.33618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 67.663002, "t": 318.91953, "r": 83.623199, "b": 327.29416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "Text", "bbox": {"l": 67.663002, "t": 318.91953, "r": 83.623199, "b": 327.29416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 135.32401, "t": 318.91953, "r": 155.03215, "b": 327.29416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "84-86", "bbox": {"l": 135.32401, "t": 318.91953, "r": 155.03215, "b": 327.29416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 167.95399, "t": 318.91953, "r": 182.43472, "b": 327.29416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "84.6", "bbox": {"l": 167.95399, "t": 318.91953, "r": 182.43472, "b": 327.29416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 194.0462, "t": 318.91953, "r": 208.52695, "b": 327.29416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "85.8", "bbox": {"l": 194.0462, "t": 318.91953, "r": 208.52695, "b": 327.29416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 226.86324000000002, "t": 318.91953, "r": 241.34396, "b": 327.29416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "85.4", "bbox": {"l": 226.86324000000002, "t": 318.91953, "r": 241.34396, "b": 327.29416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 261.86804, "t": 318.91953, "r": 276.34879, "b": 327.29416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "88.1", "bbox": {"l": 261.86804, "t": 318.91953, "r": 276.34879, "b": 327.29416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 67.663002, "t": 329.87854, "r": 84.654327, "b": 338.25317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "Title", "bbox": {"l": 67.663002, "t": 329.87854, "r": 84.654327, "b": 338.25317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 135.32401, "t": 329.87854, "r": 155.03215, "b": 338.25317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "60-72", "bbox": {"l": 135.32401, "t": 329.87854, "r": 155.03215, "b": 338.25317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 167.95399, "t": 329.87854, "r": 182.43472, "b": 338.25317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "76.7", "bbox": {"l": 167.95399, "t": 329.87854, "r": 182.43472, "b": 338.25317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 194.0462, "t": 329.87854, "r": 208.52695, "b": 338.25317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "80.4", "bbox": {"l": 194.0462, "t": 329.87854, "r": 208.52695, "b": 338.25317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 226.86324000000002, "t": 329.87854, "r": 241.34396, "b": 338.25317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "79.9", "bbox": {"l": 226.86324000000002, "t": 329.87854, "r": 241.34396, "b": 338.25317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 261.86804, "t": 329.87854, "r": 276.34879, "b": 338.25317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "82.7", "bbox": {"l": 261.86804, "t": 329.87854, "r": 276.34879, "b": 338.25317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 67.663002, "t": 341.23654, "r": 78.628906, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "All", "bbox": {"l": 67.663002, "t": 341.23654, "r": 78.628906, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 135.32401, "t": 341.23654, "r": 155.03215, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "82-83", "bbox": {"l": 135.32401, "t": 341.23654, "r": 155.03215, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 167.95399, "t": 341.23654, "r": 182.43472, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "72.4", "bbox": {"l": 167.95399, "t": 341.23654, "r": 182.43472, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 194.0462, "t": 341.23654, "r": 208.52695, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "73.5", "bbox": {"l": 194.0462, "t": 341.23654, "r": 208.52695, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 226.86324000000002, "t": 341.23654, "r": 241.34396, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "73.4", "bbox": {"l": 226.86324000000002, "t": 341.23654, "r": 241.34396, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 261.86804, "t": 341.23654, "r": 276.34879, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "76.8", "bbox": {"l": 261.86804, "t": 341.23654, "r": 276.34879, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ecel", "ched", "ched", "lcel", "ched", "ched", "nl", "ecel", "ucel", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 14, "num_cols": 6, "table_cells": [{"bbox": {"l": 132.36501, "t": 197.97351000000003, "r": 157.99098, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "human", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 173.505, "t": 197.97351000000003, "r": 204.61841, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 4, "text": "MRCNN", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 220.13028, "t": 197.97351000000003, "r": 248.06958, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "FRCNN", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 258.03125, "t": 197.97351000000003, "r": 280.17825, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "YOLO", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 168.39301, "t": 208.93255999999997, "r": 181.99504, "b": 217.30719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "R50", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 192.39606, "t": 208.93255999999997, "r": 210.16747, "b": 217.30719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "R101", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 225.21309, "t": 208.93255999999997, "r": 242.9845, "b": 217.30719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "R101", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 260.51379, "t": 208.93255999999997, "r": 277.70239, "b": 217.30719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "v5x6", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 220.28954999999996, "r": 96.848633, "b": 228.66418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Caption", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 220.28954999999996, "r": 155.03215, "b": 228.66418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "84-89", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 220.28954999999996, "r": 182.43472, "b": 228.66418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "68.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 220.28954999999996, "r": 208.52695, "b": 228.66418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "71.5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 220.28954999999996, "r": 241.34396, "b": 228.66418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "70.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 220.28954999999996, "r": 276.34879, "b": 228.66418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "77.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 231.24854000000005, "r": 100.1662, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Footnote", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 231.24854000000005, "r": 155.03215, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "83-91", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 231.24854000000005, "r": 182.43472, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "70.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 231.24854000000005, "r": 208.52695, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "71.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 231.24854000000005, "r": 241.34396, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "73.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 231.24854000000005, "r": 276.34879, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "77.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 242.20752000000005, "r": 98.175659, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Formula", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 242.20752000000005, "r": 155.03215, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "83-85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 242.20752000000005, "r": 182.43472, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "60.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 242.20752000000005, "r": 208.52695, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "63.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 242.20752000000005, "r": 241.34396, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "63.5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 242.20752000000005, "r": 276.34879, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "66.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 253.16656, "r": 100.54279, "b": 261.5412, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "List-item", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 253.16656, "r": 155.03215, "b": 261.5412, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "87-88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 253.16656, "r": 182.43472, "b": 261.5412, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "81.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 253.16656, "r": 208.52695, "b": 261.5412, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "80.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 253.16656, "r": 241.34396, "b": 261.5412, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "81.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 253.16656, "r": 276.34879, "b": 261.5412, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "86.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 264.12555, "r": 110.19064, "b": 272.50018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-footer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 264.12555, "r": 155.03215, "b": 272.50018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "93-94", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 264.12555, "r": 182.43472, "b": 272.50018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "61.6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 264.12555, "r": 208.52695, "b": 272.50018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "59.3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 264.12555, "r": 241.34396, "b": 272.50018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "58.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 264.12555, "r": 276.34879, "b": 272.50018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "61.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 275.08453, "r": 112.94331999999999, "b": 283.45917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 275.08453, "r": 155.03215, "b": 283.45917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "85-89", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 275.08453, "r": 182.43472, "b": 283.45917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "71.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 275.08453, "r": 208.52695, "b": 283.45917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "70.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 275.08453, "r": 241.34396, "b": 283.45917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "72.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 275.08453, "r": 276.34879, "b": 283.45917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "67.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 286.04355000000004, "r": 93.647629, "b": 294.41818, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Picture", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 286.04355000000004, "r": 155.03215, "b": 294.41818, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "69-71", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 286.04355000000004, "r": 182.43472, "b": 294.41818, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "71.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 286.04355000000004, "r": 208.52695, "b": 294.41818, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "72.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 286.04355000000004, "r": 241.34396, "b": 294.41818, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "72.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 286.04355000000004, "r": 276.34879, "b": 294.41818, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "77.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 297.00253, "r": 122.40287999999998, "b": 305.37717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Section-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 297.00253, "r": 155.03215, "b": 305.37717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "83-84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 297.00253, "r": 182.43472, "b": 305.37717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "67.6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 297.00253, "r": 208.52695, "b": 305.37717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "69.3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 297.00253, "r": 241.34396, "b": 305.37717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "68.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 297.00253, "r": 276.34879, "b": 305.37717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "74.6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 307.96155, "r": 87.46978, "b": 316.33618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 307.96155, "r": 155.03215, "b": 316.33618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "77-81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 307.96155, "r": 182.43472, "b": 316.33618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "82.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 307.96155, "r": 208.52695, "b": 316.33618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "82.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 307.96155, "r": 241.34396, "b": 316.33618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "82.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 307.96155, "r": 276.34879, "b": 316.33618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "86.3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 318.91953, "r": 83.623199, "b": 327.29416, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Text", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 318.91953, "r": 155.03215, "b": 327.29416, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "84-86", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 318.91953, "r": 182.43472, "b": 327.29416, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "84.6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 318.91953, "r": 208.52695, "b": 327.29416, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "85.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 318.91953, "r": 241.34396, "b": 327.29416, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "85.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 318.91953, "r": 276.34879, "b": 327.29416, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "88.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 329.87854, "r": 84.654327, "b": 338.25317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Title", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 329.87854, "r": 155.03215, "b": 338.25317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "60-72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 329.87854, "r": 182.43472, "b": 338.25317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "76.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 329.87854, "r": 208.52695, "b": 338.25317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "80.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 329.87854, "r": 241.34396, "b": 338.25317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "79.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 329.87854, "r": 276.34879, "b": 338.25317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "82.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 341.23654, "r": 78.628906, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "All", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 341.23654, "r": 155.03215, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "82-83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 341.23654, "r": 182.43472, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "72.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 341.23654, "r": 208.52695, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "73.5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 341.23654, "r": 241.34396, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "73.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 341.23654, "r": 276.34879, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "76.8", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "text", "id": 4, "page_no": 5, "cluster": {"id": 4, "label": "text", "bbox": {"l": 53.528999, "t": 370.92755, "r": 295.55612, "b": 576.56317, "coord_origin": "TOPLEFT"}, "confidence": 0.9866557121276855, "cells": [{"id": 93, "text": "to avoid this at any cost in order to have clear, unbiased baseline", "bbox": {"l": 53.79800000000001, "t": 370.92755, "r": 294.04712, "b": 379.30219000000005, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "numbers for human document-layout annotation. Third, we in-", "bbox": {"l": 53.79800000000001, "t": 381.88654, "r": 295.55612, "b": 390.26117, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "troduced the feature of", "bbox": {"l": 53.79800000000001, "t": 392.84555, "r": 140.3623, "b": 401.22017999999997, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "snapping", "bbox": {"l": 142.99001, "t": 392.89041, "r": 175.9695, "b": 401.2291599999999, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "boxes around text segments to", "bbox": {"l": 178.951, "t": 392.84555, "r": 294.04083, "b": 401.22017999999997, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "obtain a pixel-accurate annotation and again reduce time and effort.", "bbox": {"l": 53.79800000000001, "t": 403.80453, "r": 295.42493, "b": 412.17917, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "The CCS annotation tool automatically shrinks every user-drawn", "bbox": {"l": 53.528999, "t": 414.76355, "r": 294.04251, "b": 423.13818, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "box to the minimum bounding-box around the enclosed text-cells", "bbox": {"l": 53.79800000000001, "t": 425.72253, "r": 294.04807, "b": 434.09717, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "for all purely text-based segments, which excludes only", "bbox": {"l": 53.79800000000001, "t": 436.6815500000001, "r": 256.80627, "b": 445.0561799999999, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "Table", "bbox": {"l": 259.04199, "t": 436.72641, "r": 278.10455, "b": 445.06516, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "and", "bbox": {"l": 280.54999, "t": 436.6815500000001, "r": 294.04443, "b": 445.0561799999999, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "Picture", "bbox": {"l": 53.79800000000001, "t": 447.68539, "r": 78.875587, "b": 456.02413999999993, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": ". For the latter, we instructed annotation staff to minimise", "bbox": {"l": 78.876999, "t": 447.64053, "r": 294.04852, "b": 456.01517, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "inclusion of surrounding whitespace while including all graphical", "bbox": {"l": 53.79800000000001, "t": 458.59955, "r": 294.04645, "b": 466.97418, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "lines. A downside of snapping boxes to enclosed text cells is that", "bbox": {"l": 53.79800000000001, "t": 469.55853, "r": 294.0416, "b": 477.93317, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "some wrongly parsed PDF pages cannot be annotated correctly and", "bbox": {"l": 53.79800000000001, "t": 480.51654, "r": 294.04538, "b": 488.89117, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "need to be skipped. Fourth, we established a way to flag pages as", "bbox": {"l": 53.79800000000001, "t": 491.47552, "r": 294.04312, "b": 499.85016, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "rejected", "bbox": {"l": 53.79800000000001, "t": 502.4794, "r": 80.597939, "b": 510.81815, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "for cases where no valid annotation according to the label", "bbox": {"l": 83.366997, "t": 502.43454, "r": 294.04483, "b": 510.80917, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "guidelines could be achieved. Example cases for this would be PDF", "bbox": {"l": 53.79800000000001, "t": 513.3935200000001, "r": 294.25833, "b": 521.7681600000001, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "pages that render incorrectly or contain layouts that are impossible", "bbox": {"l": 53.79800000000001, "t": 524.35254, "r": 294.04535, "b": 532.72717, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "to capture with non-overlapping rectangles. Such rejected pages are", "bbox": {"l": 53.79800000000001, "t": 535.31155, "r": 294.04535, "b": 543.68617, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "not contained in the final dataset. With all these measures in place,", "bbox": {"l": 53.79800000000001, "t": 546.27055, "r": 295.02759, "b": 554.64517, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "experienced annotation staff managed to annotate a single page in", "bbox": {"l": 53.79800000000001, "t": 557.22955, "r": 294.0488, "b": 565.6041700000001, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "a typical timeframe of 20s to 60s, depending on its complexity.", "bbox": {"l": 53.79800000000001, "t": 568.18855, "r": 281.80457, "b": 576.56317, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "to avoid this at any cost in order to have clear, unbiased baseline numbers for human document-layout annotation. Third, we introduced the feature of snapping boxes around text segments to obtain a pixel-accurate annotation and again reduce time and effort. The CCS annotation tool automatically shrinks every user-drawn box to the minimum bounding-box around the enclosed text-cells for all purely text-based segments, which excludes only Table and Picture . For the latter, we instructed annotation staff to minimise inclusion of surrounding whitespace while including all graphical lines. A downside of snapping boxes to enclosed text cells is that some wrongly parsed PDF pages cannot be annotated correctly and need to be skipped. Fourth, we established a way to flag pages as rejected for cases where no valid annotation according to the label guidelines could be achieved. Example cases for this would be PDF pages that render incorrectly or contain layouts that are impossible to capture with non-overlapping rectangles. Such rejected pages are not contained in the final dataset. With all these measures in place, experienced annotation staff managed to annotate a single page in a typical timeframe of 20s to 60s, depending on its complexity."}, {"label": "section_header", "id": 10, "page_no": 5, "cluster": {"id": 10, "label": "section_header", "bbox": {"l": 53.79800000000001, "t": 588.12991, "r": 147.48535, "b": 598.43901, "coord_origin": "TOPLEFT"}, "confidence": 0.9419495463371277, "cells": [{"id": 118, "text": "5", "bbox": {"l": 53.79800000000001, "t": 588.12991, "r": 59.405277, "b": 598.43901, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "EXPERIMENTS", "bbox": {"l": 70.314377, "t": 588.12991, "r": 147.48535, "b": 598.43901, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5 EXPERIMENTS"}, {"label": "text", "id": 2, "page_no": 5, "cluster": {"id": 2, "label": "text", "bbox": {"l": 53.484001, "t": 613.25356, "r": 295.4281, "b": 709.299171, "coord_origin": "TOPLEFT"}, "confidence": 0.987605094909668, "cells": [{"id": 120, "text": "The primary goal of DocLayNet is to obtain high-quality ML models", "bbox": {"l": 53.528999, "t": 613.25356, "r": 294.04871, "b": 621.6281700000001, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "capable of accurate document-layout analysis on a wide variety", "bbox": {"l": 53.79800000000001, "t": 624.21255, "r": 294.27576, "b": 632.58717, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "of challenging layouts. As discussed in Section 2, object detection", "bbox": {"l": 53.79800000000001, "t": 635.17155, "r": 294.04144, "b": 643.54617, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "models are currently the easiest to use, due to the standardisation", "bbox": {"l": 53.79800000000001, "t": 646.13055, "r": 294.04163, "b": 654.50517, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "of ground-truth data in COCO format [16] and the availability of", "bbox": {"l": 53.79800000000001, "t": 657.0885499999999, "r": 294.0412, "b": 665.46317, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "general frameworks such as", "bbox": {"l": 53.79800000000001, "t": 668.04755, "r": 155.01054, "b": 676.42217, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "detectron2", "bbox": {"l": 157.23599, "t": 668.09238, "r": 193.26666, "b": 676.43114, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "[17]. Furthermore, baseline", "bbox": {"l": 195.867, "t": 668.04755, "r": 294.0473, "b": 676.42217, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "numbers in PubLayNet and DocBank were obtained using standard", "bbox": {"l": 53.79800000000001, "t": 679.0065500000001, "r": 294.04538, "b": 687.38117, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "object detection models such as Mask R-CNN and Faster R-CNN.", "bbox": {"l": 53.79800000000001, "t": 689.96555, "r": 295.4281, "b": 698.3401719999999, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "As such, we will relate to these object detection methods in this", "bbox": {"l": 53.484001, "t": 700.9245530000001, "r": 294.04413, "b": 709.299171, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The primary goal of DocLayNet is to obtain high-quality ML models capable of accurate document-layout analysis on a wide variety of challenging layouts. As discussed in Section 2, object detection models are currently the easiest to use, due to the standardisation of ground-truth data in COCO format [16] and the availability of general frameworks such as detectron2 [17]. Furthermore, baseline numbers in PubLayNet and DocBank were obtained using standard object detection models such as Mask R-CNN and Faster R-CNN. As such, we will relate to these object detection methods in this"}, {"label": "picture", "id": 6, "page_no": 5, "cluster": {"id": 6, "label": "picture", "bbox": {"l": 323.48431396484375, "t": 89.88603210449219, "r": 553.5411376953125, "b": 260.0107727050781, "coord_origin": "TOPLEFT"}, "confidence": 0.9782690405845642, "cells": [{"id": 131, "text": "0", "bbox": {"l": 349.16577, "t": 246.68017999999995, "r": 352.48175, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "20", "bbox": {"l": 385.93698, "t": 246.68017999999995, "r": 392.56894, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "40", "bbox": {"l": 424.366, "t": 246.68017999999995, "r": 430.99796, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "60", "bbox": {"l": 462.79504000000003, "t": 246.68017999999995, "r": 469.427, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "80", "bbox": {"l": 501.22406, "t": 246.68017999999995, "r": 507.85602, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "100", "bbox": {"l": 537.99524, "t": 246.68017999999995, "r": 547.94318, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "% of DocLayNet training set", "bbox": {"l": 410.28143, "t": 253.80840999999998, "r": 483.47278000000006, "b": 259.88251, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "50", "bbox": {"l": 330.93539, "t": 218.38464, "r": 337.56735, "b": 224.45874000000003, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "55", "bbox": {"l": 330.93539, "t": 192.08660999999995, "r": 337.56735, "b": 198.16071, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "60", "bbox": {"l": 330.93539, "t": 165.78864, "r": 337.56735, "b": 171.86273000000006, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "65", "bbox": {"l": 330.93539, "t": 139.49059999999997, "r": 337.56735, "b": 145.56470000000002, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "70", "bbox": {"l": 330.93539, "t": 113.19263000000001, "r": 337.56735, "b": 119.26671999999996, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "mAP 0.50:0.95", "bbox": {"l": 322.92276, "t": 148.37689, "r": 328.99686, "b": 186.79218000000003, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "10", "bbox": {"l": 470.97235, "t": 235.36676, "r": 477.6055, "b": 241.44086000000004, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "1", "bbox": {"l": 477.65662, "t": 234.82390999999996, "r": 479.97778000000005, "b": 239.07581000000005, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "10", "bbox": {"l": 531.55127, "t": 235.41234999999995, "r": 538.18445, "b": 241.48645, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "2", "bbox": {"l": 538.23553, "t": 234.86951, "r": 540.5567, "b": 239.1214, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "50", "bbox": {"l": 404.91125, "t": 216.00005999999996, "r": 411.54321, "b": 222.07416, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "55", "bbox": {"l": 404.91125, "t": 200.22125000000005, "r": 411.54321, "b": 206.29534999999998, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "60", "bbox": {"l": 404.91125, "t": 184.44244000000003, "r": 411.54321, "b": 190.51653999999996, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "65", "bbox": {"l": 404.91125, "t": 168.66364, "r": 411.54321, "b": 174.73773000000006, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "70", "bbox": {"l": 404.91125, "t": 152.88489000000004, "r": 411.54321, "b": 158.95898, "coord_origin": "TOPLEFT"}}], "children": [{"id": 92, "label": "text", "bbox": {"l": 349.16577, "t": 246.68017999999995, "r": 352.48175, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 131, "text": "0", "bbox": {"l": 349.16577, "t": 246.68017999999995, "r": 352.48175, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 385.93698, "t": 246.68017999999995, "r": 392.56894, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 132, "text": "20", "bbox": {"l": 385.93698, "t": 246.68017999999995, "r": 392.56894, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 424.366, "t": 246.68017999999995, "r": 430.99796, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 133, "text": "40", "bbox": {"l": 424.366, "t": 246.68017999999995, "r": 430.99796, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 462.79504000000003, "t": 246.68017999999995, "r": 469.427, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 134, "text": "60", "bbox": {"l": 462.79504000000003, "t": 246.68017999999995, "r": 469.427, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 501.22406, "t": 246.68017999999995, "r": 507.85602, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 135, "text": "80", "bbox": {"l": 501.22406, "t": 246.68017999999995, "r": 507.85602, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 537.99524, "t": 246.68017999999995, "r": 547.94318, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 136, "text": "100", "bbox": {"l": 537.99524, "t": 246.68017999999995, "r": 547.94318, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 410.28143, "t": 253.80840999999998, "r": 483.47278000000006, "b": 259.88251, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 137, "text": "% of DocLayNet training set", "bbox": {"l": 410.28143, "t": 253.80840999999998, "r": 483.47278000000006, "b": 259.88251, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 330.93539, "t": 218.38464, "r": 337.56735, "b": 224.45874000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 138, "text": "50", "bbox": {"l": 330.93539, "t": 218.38464, "r": 337.56735, "b": 224.45874000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 330.93539, "t": 192.08660999999995, "r": 337.56735, "b": 198.16071, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 139, "text": "55", "bbox": {"l": 330.93539, "t": 192.08660999999995, "r": 337.56735, "b": 198.16071, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 330.93539, "t": 165.78864, "r": 337.56735, "b": 171.86273000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 140, "text": "60", "bbox": {"l": 330.93539, "t": 165.78864, "r": 337.56735, "b": 171.86273000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 330.93539, "t": 139.49059999999997, "r": 337.56735, "b": 145.56470000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 141, "text": "65", "bbox": {"l": 330.93539, "t": 139.49059999999997, "r": 337.56735, "b": 145.56470000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 330.93539, "t": 113.19263000000001, "r": 337.56735, "b": 119.26671999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 142, "text": "70", "bbox": {"l": 330.93539, "t": 113.19263000000001, "r": 337.56735, "b": 119.26671999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 322.92276, "t": 148.37689, "r": 328.99686, "b": 186.79218000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 143, "text": "mAP 0.50:0.95", "bbox": {"l": 322.92276, "t": 148.37689, "r": 328.99686, "b": 186.79218000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 470.97235, "t": 235.36676, "r": 477.6055, "b": 241.44086000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 144, "text": "10", "bbox": {"l": 470.97235, "t": 235.36676, "r": 477.6055, "b": 241.44086000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 477.65662, "t": 234.82390999999996, "r": 479.97778000000005, "b": 239.07581000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 145, "text": "1", "bbox": {"l": 477.65662, "t": 234.82390999999996, "r": 479.97778000000005, "b": 239.07581000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 531.55127, "t": 235.41234999999995, "r": 538.18445, "b": 241.48645, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 146, "text": "10", "bbox": {"l": 531.55127, "t": 235.41234999999995, "r": 538.18445, "b": 241.48645, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 538.23553, "t": 234.86951, "r": 540.5567, "b": 239.1214, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 147, "text": "2", "bbox": {"l": 538.23553, "t": 234.86951, "r": 540.5567, "b": 239.1214, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 404.91125, "t": 216.00005999999996, "r": 411.54321, "b": 222.07416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 148, "text": "50", "bbox": {"l": 404.91125, "t": 216.00005999999996, "r": 411.54321, "b": 222.07416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 404.91125, "t": 200.22125000000005, "r": 411.54321, "b": 206.29534999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 149, "text": "55", "bbox": {"l": 404.91125, "t": 200.22125000000005, "r": 411.54321, "b": 206.29534999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 404.91125, "t": 184.44244000000003, "r": 411.54321, "b": 190.51653999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 150, "text": "60", "bbox": {"l": 404.91125, "t": 184.44244000000003, "r": 411.54321, "b": 190.51653999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 404.91125, "t": 168.66364, "r": 411.54321, "b": 174.73773000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 151, "text": "65", "bbox": {"l": 404.91125, "t": 168.66364, "r": 411.54321, "b": 174.73773000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 404.91125, "t": 152.88489000000004, "r": 411.54321, "b": 158.95898, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 152, "text": "70", "bbox": {"l": 404.91125, "t": 152.88489000000004, "r": 411.54321, "b": 158.95898, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "caption", "id": 7, "page_no": 5, "cluster": {"id": 7, "label": "caption", "bbox": {"l": 317.95499, "t": 279.01599, "r": 559.80579, "b": 342.28418000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9639934301376343, "cells": [{"id": 153, "text": "Figure 5: Prediction performance (mAP@0.5-0.95) of a Mask", "bbox": {"l": 317.95499, "t": 279.01599, "r": 558.47876, "b": 287.48923, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "R-CNN network with ResNet50 backbone trained on increas-", "bbox": {"l": 317.95499, "t": 289.97501, "r": 559.80579, "b": 298.44824, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "ing fractions of the DocLayNet dataset. The learning curve", "bbox": {"l": 317.95499, "t": 300.93399, "r": 558.20068, "b": 309.40723, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "flattens around the 80% mark, indicating that increasing the", "bbox": {"l": 317.95499, "t": 311.89297, "r": 558.20062, "b": 320.36620999999997, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "size of the DocLayNet dataset with similar data will not yield", "bbox": {"l": 317.95499, "t": 322.85196, "r": 558.20074, "b": 331.3252, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "significantly better predictions.", "bbox": {"l": 317.95499, "t": 333.81094, "r": 445.24207, "b": 342.28418000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 5: Prediction performance (mAP@0.5-0.95) of a Mask R-CNN network with ResNet50 backbone trained on increasing fractions of the DocLayNet dataset. The learning curve flattens around the 80% mark, indicating that increasing the size of the DocLayNet dataset with similar data will not yield significantly better predictions."}, {"label": "text", "id": 8, "page_no": 5, "cluster": {"id": 8, "label": "text", "bbox": {"l": 317.95499, "t": 384.01154, "r": 558.20416, "b": 403.34517999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9594221711158752, "cells": [{"id": 159, "text": "paper and leave the detailed evaluation of more recent methods", "bbox": {"l": 317.95499, "t": 384.01154, "r": 558.20416, "b": 392.38617, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "mentioned in Section 2 for future work.", "bbox": {"l": 317.95499, "t": 394.97055, "r": 463.04938, "b": 403.34517999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "paper and leave the detailed evaluation of more recent methods mentioned in Section 2 for future work."}, {"label": "text", "id": 3, "page_no": 5, "cluster": {"id": 3, "label": "text", "bbox": {"l": 317.64099, "t": 405.92953, "r": 558.4364, "b": 480.05716, "coord_origin": "TOPLEFT"}, "confidence": 0.9872915148735046, "cells": [{"id": 161, "text": "In this section, we will present several aspects related to the", "bbox": {"l": 327.918, "t": 405.92953, "r": 558.19836, "b": 414.30417, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "performance of object detection models on DocLayNet. Similarly", "bbox": {"l": 317.95499, "t": 416.88855, "r": 558.4364, "b": 425.26318, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "as in PubLayNet, we will evaluate the quality of their predictions", "bbox": {"l": 317.95499, "t": 427.84653, "r": 558.20563, "b": 436.22116, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "using mean average precision (mAP) with 10 overlaps that range", "bbox": {"l": 317.95499, "t": 438.80554, "r": 558.20044, "b": 447.18018, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "from 0.5 to 0.95 in steps of 0.05 (mAP@0.5-0.95). These scores are", "bbox": {"l": 317.95499, "t": 449.76453000000004, "r": 558.19891, "b": 458.13916, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "computed by leveraging the evaluation code provided by the COCO", "bbox": {"l": 317.95499, "t": 460.72354, "r": 558.20239, "b": 469.09818, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "API [16].", "bbox": {"l": 317.64099, "t": 471.68253, "r": 350.32352, "b": 480.05716, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In this section, we will present several aspects related to the performance of object detection models on DocLayNet. Similarly as in PubLayNet, we will evaluate the quality of their predictions using mean average precision (mAP) with 10 overlaps that range from 0.5 to 0.95 in steps of 0.05 (mAP@0.5-0.95). These scores are computed by leveraging the evaluation code provided by the COCO API [16]."}, {"label": "section_header", "id": 9, "page_no": 5, "cluster": {"id": 9, "label": "section_header", "bbox": {"l": 317.95499, "t": 496.8219, "r": 466.8532400000001, "b": 507.13098, "coord_origin": "TOPLEFT"}, "confidence": 0.9579004049301147, "cells": [{"id": 168, "text": "Baselines for Object Detection", "bbox": {"l": 317.95499, "t": 496.8219, "r": 466.8532400000001, "b": 507.13098, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Baselines for Object Detection"}, {"label": "text", "id": 1, "page_no": 5, "cluster": {"id": 1, "label": "text", "bbox": {"l": 317.74899, "t": 512.02454, "r": 558.43085, "b": 706.700172, "coord_origin": "TOPLEFT"}, "confidence": 0.987722635269165, "cells": [{"id": 169, "text": "In Table 2, we present baseline experiments (given in mAP) on Mask", "bbox": {"l": 317.95499, "t": 512.02454, "r": 558.43085, "b": 520.39917, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "R-CNN [12], Faster R-CNN [11], and YOLOv5 [13]. Both training", "bbox": {"l": 317.95499, "t": 522.9835499999999, "r": 558.20117, "b": 531.35818, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "and evaluation were performed on RGB images with dimensions of", "bbox": {"l": 317.95499, "t": 533.94254, "r": 558.20233, "b": 542.31717, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "1025", "bbox": {"l": 317.74899, "t": 544.90155, "r": 334.09296, "b": 553.27617, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "\u00d7", "bbox": {"l": 334.81201, "t": 544.84775, "r": 340.51465, "b": 552.5499, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "1025 pixels. For training, we only used one annotation in case", "bbox": {"l": 341.233, "t": 544.90155, "r": 558.20117, "b": 553.27617, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "of redundantly annotated pages. As one can observe, the variation", "bbox": {"l": 317.95499, "t": 555.85956, "r": 558.20392, "b": 564.23418, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "in mAP between the models is rather low, but overall between 6", "bbox": {"l": 317.95499, "t": 566.8185599999999, "r": 558.2041, "b": 575.19318, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "and 10% lower than the mAP computed from the pairwise human", "bbox": {"l": 317.95499, "t": 577.77756, "r": 558.2052, "b": 586.15218, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "annotations on triple-annotated pages. This gives a good indication", "bbox": {"l": 317.95499, "t": 588.73656, "r": 558.20233, "b": 597.11118, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "that the DocLayNet dataset poses a worthwhile challenge for the", "bbox": {"l": 317.95499, "t": 599.69556, "r": 558.1983, "b": 608.0701799999999, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "research community to close the gap between human recognition", "bbox": {"l": 317.95499, "t": 610.65456, "r": 558.20502, "b": 619.02917, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "and ML approaches. It is interesting to see that Mask R-CNN and", "bbox": {"l": 317.95499, "t": 621.61356, "r": 558.20337, "b": 629.98817, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "Faster R-CNN produce very comparable mAP scores, indicating", "bbox": {"l": 317.95499, "t": 632.5725600000001, "r": 558.2041, "b": 640.94717, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "that pixel-based image segmentation derived from bounding-boxes", "bbox": {"l": 317.95499, "t": 643.53156, "r": 558.20245, "b": 651.90617, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "does not help to obtain better predictions. On the other hand, the", "bbox": {"l": 317.95499, "t": 654.49055, "r": 558.19757, "b": 662.86517, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": "more recent Yolov5x model does very well and even out-performs", "bbox": {"l": 317.95499, "t": 665.44855, "r": 558.20404, "b": 673.82317, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "humans on selected labels such as", "bbox": {"l": 317.95499, "t": 676.40755, "r": 444.54102, "b": 684.78217, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "Text", "bbox": {"l": 446.78900000000004, "t": 676.45238, "r": 461.95261000000005, "b": 684.79114, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": ",", "bbox": {"l": 461.95599000000004, "t": 676.40755, "r": 463.96805000000006, "b": 684.78217, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "Table", "bbox": {"l": 466.2170100000001, "t": 676.45238, "r": 485.66998000000007, "b": 684.79114, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "and", "bbox": {"l": 488.1290000000001, "t": 676.40755, "r": 501.89330999999993, "b": 684.78217, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "Picture", "bbox": {"l": 504.142, "t": 676.45238, "r": 529.21954, "b": 684.79114, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": ". This is", "bbox": {"l": 529.22101, "t": 676.40755, "r": 558.20392, "b": 684.78217, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "not entirely surprising, as", "bbox": {"l": 317.95499, "t": 687.36655, "r": 410.81366, "b": 695.741173, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "Text", "bbox": {"l": 413.05301, "t": 687.41138, "r": 427.67865, "b": 695.750137, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": ",", "bbox": {"l": 427.67801, "t": 687.36655, "r": 429.62103, "b": 695.741173, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "Table", "bbox": {"l": 431.86099, "t": 687.41138, "r": 450.62881000000004, "b": 695.750137, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "and", "bbox": {"l": 453.082, "t": 687.36655, "r": 466.37402, "b": 695.741173, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "Picture", "bbox": {"l": 468.61499, "t": 687.41138, "r": 492.83208999999994, "b": 695.750137, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "are abundant and", "bbox": {"l": 495.28201, "t": 687.36655, "r": 558.2005, "b": 695.741173, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "the most visually distinctive in a document.", "bbox": {"l": 317.95499, "t": 698.325554, "r": 477.53903, "b": 706.700172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In Table 2, we present baseline experiments (given in mAP) on Mask R-CNN [12], Faster R-CNN [11], and YOLOv5 [13]. Both training and evaluation were performed on RGB images with dimensions of 1025 \u00d7 1025 pixels. For training, we only used one annotation in case of redundantly annotated pages. As one can observe, the variation in mAP between the models is rather low, but overall between 6 and 10% lower than the mAP computed from the pairwise human annotations on triple-annotated pages. This gives a good indication that the DocLayNet dataset poses a worthwhile challenge for the research community to close the gap between human recognition and ML approaches. It is interesting to see that Mask R-CNN and Faster R-CNN produce very comparable mAP scores, indicating that pixel-based image segmentation derived from bounding-boxes does not help to obtain better predictions. On the other hand, the more recent Yolov5x model does very well and even out-performs humans on selected labels such as Text , Table and Picture . This is not entirely surprising, as Text , Table and Picture are abundant and the most visually distinctive in a document."}], "body": [{"label": "text", "id": 5, "page_no": 5, "cluster": {"id": 5, "label": "text", "bbox": {"l": 53.501999, "t": 86.87292000000002, "r": 295.64874, "b": 183.01709000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9782760143280029, "cells": [{"id": 2, "text": "Table 2: Prediction performance (mAP@0.5-0.95) of object", "bbox": {"l": 53.501999, "t": 86.87292000000002, "r": 294.04361, "b": 95.34618999999998, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "detection networks on DocLayNet test set. The MRCNN", "bbox": {"l": 53.79800000000001, "t": 97.83191, "r": 294.04373, "b": 106.30517999999995, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "(Mask R-CNN) and FRCNN (Faster R-CNN) models with", "bbox": {"l": 53.52, "t": 108.79088999999999, "r": 294.0437, "b": 117.26415999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "ResNet-50 or ResNet-101 backbone were trained based on", "bbox": {"l": 53.79800000000001, "t": 119.74987999999996, "r": 294.04373, "b": 128.22313999999994, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "the network architectures from the", "bbox": {"l": 53.79800000000001, "t": 130.70885999999996, "r": 202.43402, "b": 139.18213000000003, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "detectron2", "bbox": {"l": 206.08501, "t": 130.71783000000005, "r": 247.14215000000002, "b": 139.20905000000005, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "model zoo", "bbox": {"l": 250.95001, "t": 130.70885999999996, "r": 294.04254, "b": 139.18213000000003, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "(Mask R-CNN R50, R101-FPN 3x, Faster R-CNN R101-FPN", "bbox": {"l": 53.52002, "t": 141.66785000000004, "r": 294.04367, "b": 150.14111000000003, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "3x), with default configurations. The YOLO implementation", "bbox": {"l": 53.798019, "t": 152.62683000000004, "r": 294.04373, "b": 161.1001, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "utilized was YOLOv5x6 [13]. All models were initialised us-", "bbox": {"l": 53.798019, "t": 163.58582, "r": 295.64874, "b": 172.05908, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "ing pre-trained weights from the COCO 2017 dataset.", "bbox": {"l": 53.798019, "t": 174.54381999999998, "r": 268.62399, "b": 183.01709000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 2: Prediction performance (mAP@0.5-0.95) of object detection networks on DocLayNet test set. The MRCNN (Mask R-CNN) and FRCNN (Faster R-CNN) models with ResNet-50 or ResNet-101 backbone were trained based on the network architectures from the detectron2 model zoo (Mask R-CNN R50, R101-FPN 3x, Faster R-CNN R101-FPN 3x), with default configurations. The YOLO implementation utilized was YOLOv5x6 [13]. All models were initialised using pre-trained weights from the COCO 2017 dataset."}, {"label": "table", "id": 0, "page_no": 5, "cluster": {"id": 0, "label": "table", "bbox": {"l": 62.02753829956055, "t": 195.6800537109375, "r": 285.78955078125, "b": 351.6618957519531, "coord_origin": "TOPLEFT"}, "confidence": 0.9883638620376587, "cells": [{"id": 13, "text": "human", "bbox": {"l": 132.36501, "t": 197.97351000000003, "r": 157.99098, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "MRCNN", "bbox": {"l": 173.505, "t": 197.97351000000003, "r": 204.61841, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "FRCNN", "bbox": {"l": 220.13028, "t": 197.97351000000003, "r": 248.06958, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "YOLO", "bbox": {"l": 258.03125, "t": 197.97351000000003, "r": 280.17825, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "R50", "bbox": {"l": 168.39301, "t": 208.93255999999997, "r": 181.99504, "b": 217.30719, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "R101", "bbox": {"l": 192.39606, "t": 208.93255999999997, "r": 210.16747, "b": 217.30719, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "R101", "bbox": {"l": 225.21309, "t": 208.93255999999997, "r": 242.9845, "b": 217.30719, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "v5x6", "bbox": {"l": 260.51379, "t": 208.93255999999997, "r": 277.70239, "b": 217.30719, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Caption", "bbox": {"l": 67.663002, "t": 220.28954999999996, "r": 96.848633, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "84-89", "bbox": {"l": 135.32401, "t": 220.28954999999996, "r": 155.03215, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "68.4", "bbox": {"l": 167.95399, "t": 220.28954999999996, "r": 182.43472, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "71.5", "bbox": {"l": 194.0462, "t": 220.28954999999996, "r": 208.52695, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "70.1", "bbox": {"l": 226.86324000000002, "t": 220.28954999999996, "r": 241.34396, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "77.7", "bbox": {"l": 261.86804, "t": 220.28954999999996, "r": 276.34879, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Footnote", "bbox": {"l": 67.663002, "t": 231.24854000000005, "r": 100.1662, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "83-91", "bbox": {"l": 135.32401, "t": 231.24854000000005, "r": 155.03215, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "70.9", "bbox": {"l": 167.95399, "t": 231.24854000000005, "r": 182.43472, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "71.8", "bbox": {"l": 194.0462, "t": 231.24854000000005, "r": 208.52695, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "73.7", "bbox": {"l": 226.86324000000002, "t": 231.24854000000005, "r": 241.34396, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "77.2", "bbox": {"l": 261.86804, "t": 231.24854000000005, "r": 276.34879, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "Formula", "bbox": {"l": 67.663002, "t": 242.20752000000005, "r": 98.175659, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "83-85", "bbox": {"l": 135.32401, "t": 242.20752000000005, "r": 155.03215, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "60.1", "bbox": {"l": 167.95399, "t": 242.20752000000005, "r": 182.43472, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "63.4", "bbox": {"l": 194.0462, "t": 242.20752000000005, "r": 208.52695, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "63.5", "bbox": {"l": 226.86324000000002, "t": 242.20752000000005, "r": 241.34396, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "66.2", "bbox": {"l": 261.86804, "t": 242.20752000000005, "r": 276.34879, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "List-item", "bbox": {"l": 67.663002, "t": 253.16656, "r": 100.54279, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "87-88", "bbox": {"l": 135.32401, "t": 253.16656, "r": 155.03215, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "81.2", "bbox": {"l": 167.95399, "t": 253.16656, "r": 182.43472, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "80.8", "bbox": {"l": 194.0462, "t": 253.16656, "r": 208.52695, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "81.0", "bbox": {"l": 226.86324000000002, "t": 253.16656, "r": 241.34396, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "86.2", "bbox": {"l": 261.86804, "t": 253.16656, "r": 276.34879, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Page-footer", "bbox": {"l": 67.663002, "t": 264.12555, "r": 110.19064, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "93-94", "bbox": {"l": 135.32401, "t": 264.12555, "r": 155.03215, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "61.6", "bbox": {"l": 167.95399, "t": 264.12555, "r": 182.43472, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "59.3", "bbox": {"l": 194.0462, "t": 264.12555, "r": 208.52695, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "58.9", "bbox": {"l": 226.86324000000002, "t": 264.12555, "r": 241.34396, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "61.1", "bbox": {"l": 261.86804, "t": 264.12555, "r": 276.34879, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Page-header", "bbox": {"l": 67.663002, "t": 275.08453, "r": 112.94331999999999, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "85-89", "bbox": {"l": 135.32401, "t": 275.08453, "r": 155.03215, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "71.9", "bbox": {"l": 167.95399, "t": 275.08453, "r": 182.43472, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "70.0", "bbox": {"l": 194.0462, "t": 275.08453, "r": 208.52695, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "72.0", "bbox": {"l": 226.86324000000002, "t": 275.08453, "r": 241.34396, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "67.9", "bbox": {"l": 261.86804, "t": 275.08453, "r": 276.34879, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Picture", "bbox": {"l": 67.663002, "t": 286.04355000000004, "r": 93.647629, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "69-71", "bbox": {"l": 135.32401, "t": 286.04355000000004, "r": 155.03215, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "71.7", "bbox": {"l": 167.95399, "t": 286.04355000000004, "r": 182.43472, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "72.7", "bbox": {"l": 194.0462, "t": 286.04355000000004, "r": 208.52695, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "72.0", "bbox": {"l": 226.86324000000002, "t": 286.04355000000004, "r": 241.34396, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "77.1", "bbox": {"l": 261.86804, "t": 286.04355000000004, "r": 276.34879, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "Section-header", "bbox": {"l": 67.663002, "t": 297.00253, "r": 122.40287999999998, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "83-84", "bbox": {"l": 135.32401, "t": 297.00253, "r": 155.03215, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "67.6", "bbox": {"l": 167.95399, "t": 297.00253, "r": 182.43472, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "69.3", "bbox": {"l": 194.0462, "t": 297.00253, "r": 208.52695, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "68.4", "bbox": {"l": 226.86324000000002, "t": 297.00253, "r": 241.34396, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "74.6", "bbox": {"l": 261.86804, "t": 297.00253, "r": 276.34879, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "Table", "bbox": {"l": 67.663002, "t": 307.96155, "r": 87.46978, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "77-81", "bbox": {"l": 135.32401, "t": 307.96155, "r": 155.03215, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "82.2", "bbox": {"l": 167.95399, "t": 307.96155, "r": 182.43472, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "82.9", "bbox": {"l": 194.0462, "t": 307.96155, "r": 208.52695, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "82.2", "bbox": {"l": 226.86324000000002, "t": 307.96155, "r": 241.34396, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "86.3", "bbox": {"l": 261.86804, "t": 307.96155, "r": 276.34879, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "Text", "bbox": {"l": 67.663002, "t": 318.91953, "r": 83.623199, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "84-86", "bbox": {"l": 135.32401, "t": 318.91953, "r": 155.03215, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "84.6", "bbox": {"l": 167.95399, "t": 318.91953, "r": 182.43472, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "85.8", "bbox": {"l": 194.0462, "t": 318.91953, "r": 208.52695, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "85.4", "bbox": {"l": 226.86324000000002, "t": 318.91953, "r": 241.34396, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "88.1", "bbox": {"l": 261.86804, "t": 318.91953, "r": 276.34879, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Title", "bbox": {"l": 67.663002, "t": 329.87854, "r": 84.654327, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "60-72", "bbox": {"l": 135.32401, "t": 329.87854, "r": 155.03215, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "76.7", "bbox": {"l": 167.95399, "t": 329.87854, "r": 182.43472, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "80.4", "bbox": {"l": 194.0462, "t": 329.87854, "r": 208.52695, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "79.9", "bbox": {"l": 226.86324000000002, "t": 329.87854, "r": 241.34396, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "82.7", "bbox": {"l": 261.86804, "t": 329.87854, "r": 276.34879, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "All", "bbox": {"l": 67.663002, "t": 341.23654, "r": 78.628906, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "82-83", "bbox": {"l": 135.32401, "t": 341.23654, "r": 155.03215, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "72.4", "bbox": {"l": 167.95399, "t": 341.23654, "r": 182.43472, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "73.5", "bbox": {"l": 194.0462, "t": 341.23654, "r": 208.52695, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "73.4", "bbox": {"l": 226.86324000000002, "t": 341.23654, "r": 241.34396, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "76.8", "bbox": {"l": 261.86804, "t": 341.23654, "r": 276.34879, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": [{"id": 12, "label": "text", "bbox": {"l": 132.36501, "t": 197.97351000000003, "r": 157.99098, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "human", "bbox": {"l": 132.36501, "t": 197.97351000000003, "r": 157.99098, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 173.505, "t": 197.97351000000003, "r": 204.61841, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "MRCNN", "bbox": {"l": 173.505, "t": 197.97351000000003, "r": 204.61841, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 220.13028, "t": 197.97351000000003, "r": 248.06958, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "FRCNN", "bbox": {"l": 220.13028, "t": 197.97351000000003, "r": 248.06958, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 258.03125, "t": 197.97351000000003, "r": 280.17825, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "YOLO", "bbox": {"l": 258.03125, "t": 197.97351000000003, "r": 280.17825, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 168.39301, "t": 208.93255999999997, "r": 181.99504, "b": 217.30719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "R50", "bbox": {"l": 168.39301, "t": 208.93255999999997, "r": 181.99504, "b": 217.30719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 192.39606, "t": 208.93255999999997, "r": 210.16747, "b": 217.30719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "R101", "bbox": {"l": 192.39606, "t": 208.93255999999997, "r": 210.16747, "b": 217.30719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 225.21309, "t": 208.93255999999997, "r": 242.9845, "b": 217.30719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "R101", "bbox": {"l": 225.21309, "t": 208.93255999999997, "r": 242.9845, "b": 217.30719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 260.51379, "t": 208.93255999999997, "r": 277.70239, "b": 217.30719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "v5x6", "bbox": {"l": 260.51379, "t": 208.93255999999997, "r": 277.70239, "b": 217.30719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 67.663002, "t": 220.28954999999996, "r": 96.848633, "b": 228.66418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "Caption", "bbox": {"l": 67.663002, "t": 220.28954999999996, "r": 96.848633, "b": 228.66418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 135.32401, "t": 220.28954999999996, "r": 155.03215, "b": 228.66418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "84-89", "bbox": {"l": 135.32401, "t": 220.28954999999996, "r": 155.03215, "b": 228.66418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 167.95399, "t": 220.28954999999996, "r": 182.43472, "b": 228.66418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "68.4", "bbox": {"l": 167.95399, "t": 220.28954999999996, "r": 182.43472, "b": 228.66418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 194.0462, "t": 220.28954999999996, "r": 208.52695, "b": 228.66418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "71.5", "bbox": {"l": 194.0462, "t": 220.28954999999996, "r": 208.52695, "b": 228.66418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 226.86324000000002, "t": 220.28954999999996, "r": 241.34396, "b": 228.66418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "70.1", "bbox": {"l": 226.86324000000002, "t": 220.28954999999996, "r": 241.34396, "b": 228.66418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 261.86804, "t": 220.28954999999996, "r": 276.34879, "b": 228.66418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "77.7", "bbox": {"l": 261.86804, "t": 220.28954999999996, "r": 276.34879, "b": 228.66418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 67.663002, "t": 231.24854000000005, "r": 100.1662, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "Footnote", "bbox": {"l": 67.663002, "t": 231.24854000000005, "r": 100.1662, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 135.32401, "t": 231.24854000000005, "r": 155.03215, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "83-91", "bbox": {"l": 135.32401, "t": 231.24854000000005, "r": 155.03215, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 167.95399, "t": 231.24854000000005, "r": 182.43472, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "70.9", "bbox": {"l": 167.95399, "t": 231.24854000000005, "r": 182.43472, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 194.0462, "t": 231.24854000000005, "r": 208.52695, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "71.8", "bbox": {"l": 194.0462, "t": 231.24854000000005, "r": 208.52695, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 226.86324000000002, "t": 231.24854000000005, "r": 241.34396, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "73.7", "bbox": {"l": 226.86324000000002, "t": 231.24854000000005, "r": 241.34396, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 261.86804, "t": 231.24854000000005, "r": 276.34879, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "77.2", "bbox": {"l": 261.86804, "t": 231.24854000000005, "r": 276.34879, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 67.663002, "t": 242.20752000000005, "r": 98.175659, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "Formula", "bbox": {"l": 67.663002, "t": 242.20752000000005, "r": 98.175659, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 135.32401, "t": 242.20752000000005, "r": 155.03215, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "83-85", "bbox": {"l": 135.32401, "t": 242.20752000000005, "r": 155.03215, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 167.95399, "t": 242.20752000000005, "r": 182.43472, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "60.1", "bbox": {"l": 167.95399, "t": 242.20752000000005, "r": 182.43472, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 194.0462, "t": 242.20752000000005, "r": 208.52695, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "63.4", "bbox": {"l": 194.0462, "t": 242.20752000000005, "r": 208.52695, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 226.86324000000002, "t": 242.20752000000005, "r": 241.34396, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "63.5", "bbox": {"l": 226.86324000000002, "t": 242.20752000000005, "r": 241.34396, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 261.86804, "t": 242.20752000000005, "r": 276.34879, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "66.2", "bbox": {"l": 261.86804, "t": 242.20752000000005, "r": 276.34879, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 67.663002, "t": 253.16656, "r": 100.54279, "b": 261.5412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "List-item", "bbox": {"l": 67.663002, "t": 253.16656, "r": 100.54279, "b": 261.5412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 135.32401, "t": 253.16656, "r": 155.03215, "b": 261.5412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "87-88", "bbox": {"l": 135.32401, "t": 253.16656, "r": 155.03215, "b": 261.5412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 167.95399, "t": 253.16656, "r": 182.43472, "b": 261.5412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "81.2", "bbox": {"l": 167.95399, "t": 253.16656, "r": 182.43472, "b": 261.5412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 194.0462, "t": 253.16656, "r": 208.52695, "b": 261.5412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "80.8", "bbox": {"l": 194.0462, "t": 253.16656, "r": 208.52695, "b": 261.5412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 226.86324000000002, "t": 253.16656, "r": 241.34396, "b": 261.5412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "81.0", "bbox": {"l": 226.86324000000002, "t": 253.16656, "r": 241.34396, "b": 261.5412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 261.86804, "t": 253.16656, "r": 276.34879, "b": 261.5412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "86.2", "bbox": {"l": 261.86804, "t": 253.16656, "r": 276.34879, "b": 261.5412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 67.663002, "t": 264.12555, "r": 110.19064, "b": 272.50018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "Page-footer", "bbox": {"l": 67.663002, "t": 264.12555, "r": 110.19064, "b": 272.50018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 135.32401, "t": 264.12555, "r": 155.03215, "b": 272.50018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "93-94", "bbox": {"l": 135.32401, "t": 264.12555, "r": 155.03215, "b": 272.50018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 167.95399, "t": 264.12555, "r": 182.43472, "b": 272.50018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "61.6", "bbox": {"l": 167.95399, "t": 264.12555, "r": 182.43472, "b": 272.50018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 194.0462, "t": 264.12555, "r": 208.52695, "b": 272.50018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "59.3", "bbox": {"l": 194.0462, "t": 264.12555, "r": 208.52695, "b": 272.50018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 226.86324000000002, "t": 264.12555, "r": 241.34396, "b": 272.50018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "58.9", "bbox": {"l": 226.86324000000002, "t": 264.12555, "r": 241.34396, "b": 272.50018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 261.86804, "t": 264.12555, "r": 276.34879, "b": 272.50018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "61.1", "bbox": {"l": 261.86804, "t": 264.12555, "r": 276.34879, "b": 272.50018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 67.663002, "t": 275.08453, "r": 112.94331999999999, "b": 283.45917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "Page-header", "bbox": {"l": 67.663002, "t": 275.08453, "r": 112.94331999999999, "b": 283.45917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 135.32401, "t": 275.08453, "r": 155.03215, "b": 283.45917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "85-89", "bbox": {"l": 135.32401, "t": 275.08453, "r": 155.03215, "b": 283.45917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 167.95399, "t": 275.08453, "r": 182.43472, "b": 283.45917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "71.9", "bbox": {"l": 167.95399, "t": 275.08453, "r": 182.43472, "b": 283.45917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 194.0462, "t": 275.08453, "r": 208.52695, "b": 283.45917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "70.0", "bbox": {"l": 194.0462, "t": 275.08453, "r": 208.52695, "b": 283.45917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 226.86324000000002, "t": 275.08453, "r": 241.34396, "b": 283.45917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "72.0", "bbox": {"l": 226.86324000000002, "t": 275.08453, "r": 241.34396, "b": 283.45917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 261.86804, "t": 275.08453, "r": 276.34879, "b": 283.45917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "67.9", "bbox": {"l": 261.86804, "t": 275.08453, "r": 276.34879, "b": 283.45917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 67.663002, "t": 286.04355000000004, "r": 93.647629, "b": 294.41818, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "Picture", "bbox": {"l": 67.663002, "t": 286.04355000000004, "r": 93.647629, "b": 294.41818, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 135.32401, "t": 286.04355000000004, "r": 155.03215, "b": 294.41818, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "69-71", "bbox": {"l": 135.32401, "t": 286.04355000000004, "r": 155.03215, "b": 294.41818, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 167.95399, "t": 286.04355000000004, "r": 182.43472, "b": 294.41818, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "71.7", "bbox": {"l": 167.95399, "t": 286.04355000000004, "r": 182.43472, "b": 294.41818, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 194.0462, "t": 286.04355000000004, "r": 208.52695, "b": 294.41818, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "72.7", "bbox": {"l": 194.0462, "t": 286.04355000000004, "r": 208.52695, "b": 294.41818, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 226.86324000000002, "t": 286.04355000000004, "r": 241.34396, "b": 294.41818, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "72.0", "bbox": {"l": 226.86324000000002, "t": 286.04355000000004, "r": 241.34396, "b": 294.41818, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 261.86804, "t": 286.04355000000004, "r": 276.34879, "b": 294.41818, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "77.1", "bbox": {"l": 261.86804, "t": 286.04355000000004, "r": 276.34879, "b": 294.41818, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 67.663002, "t": 297.00253, "r": 122.40287999999998, "b": 305.37717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "Section-header", "bbox": {"l": 67.663002, "t": 297.00253, "r": 122.40287999999998, "b": 305.37717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 135.32401, "t": 297.00253, "r": 155.03215, "b": 305.37717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "83-84", "bbox": {"l": 135.32401, "t": 297.00253, "r": 155.03215, "b": 305.37717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 167.95399, "t": 297.00253, "r": 182.43472, "b": 305.37717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "67.6", "bbox": {"l": 167.95399, "t": 297.00253, "r": 182.43472, "b": 305.37717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 194.0462, "t": 297.00253, "r": 208.52695, "b": 305.37717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "69.3", "bbox": {"l": 194.0462, "t": 297.00253, "r": 208.52695, "b": 305.37717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 226.86324000000002, "t": 297.00253, "r": 241.34396, "b": 305.37717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "68.4", "bbox": {"l": 226.86324000000002, "t": 297.00253, "r": 241.34396, "b": 305.37717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 261.86804, "t": 297.00253, "r": 276.34879, "b": 305.37717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "74.6", "bbox": {"l": 261.86804, "t": 297.00253, "r": 276.34879, "b": 305.37717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 67.663002, "t": 307.96155, "r": 87.46978, "b": 316.33618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "Table", "bbox": {"l": 67.663002, "t": 307.96155, "r": 87.46978, "b": 316.33618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 135.32401, "t": 307.96155, "r": 155.03215, "b": 316.33618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "77-81", "bbox": {"l": 135.32401, "t": 307.96155, "r": 155.03215, "b": 316.33618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 167.95399, "t": 307.96155, "r": 182.43472, "b": 316.33618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "82.2", "bbox": {"l": 167.95399, "t": 307.96155, "r": 182.43472, "b": 316.33618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 194.0462, "t": 307.96155, "r": 208.52695, "b": 316.33618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "82.9", "bbox": {"l": 194.0462, "t": 307.96155, "r": 208.52695, "b": 316.33618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 226.86324000000002, "t": 307.96155, "r": 241.34396, "b": 316.33618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "82.2", "bbox": {"l": 226.86324000000002, "t": 307.96155, "r": 241.34396, "b": 316.33618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 261.86804, "t": 307.96155, "r": 276.34879, "b": 316.33618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "86.3", "bbox": {"l": 261.86804, "t": 307.96155, "r": 276.34879, "b": 316.33618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 67.663002, "t": 318.91953, "r": 83.623199, "b": 327.29416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "Text", "bbox": {"l": 67.663002, "t": 318.91953, "r": 83.623199, "b": 327.29416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 135.32401, "t": 318.91953, "r": 155.03215, "b": 327.29416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "84-86", "bbox": {"l": 135.32401, "t": 318.91953, "r": 155.03215, "b": 327.29416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 167.95399, "t": 318.91953, "r": 182.43472, "b": 327.29416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "84.6", "bbox": {"l": 167.95399, "t": 318.91953, "r": 182.43472, "b": 327.29416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 194.0462, "t": 318.91953, "r": 208.52695, "b": 327.29416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "85.8", "bbox": {"l": 194.0462, "t": 318.91953, "r": 208.52695, "b": 327.29416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 226.86324000000002, "t": 318.91953, "r": 241.34396, "b": 327.29416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "85.4", "bbox": {"l": 226.86324000000002, "t": 318.91953, "r": 241.34396, "b": 327.29416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 261.86804, "t": 318.91953, "r": 276.34879, "b": 327.29416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "88.1", "bbox": {"l": 261.86804, "t": 318.91953, "r": 276.34879, "b": 327.29416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 67.663002, "t": 329.87854, "r": 84.654327, "b": 338.25317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "Title", "bbox": {"l": 67.663002, "t": 329.87854, "r": 84.654327, "b": 338.25317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 135.32401, "t": 329.87854, "r": 155.03215, "b": 338.25317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "60-72", "bbox": {"l": 135.32401, "t": 329.87854, "r": 155.03215, "b": 338.25317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 167.95399, "t": 329.87854, "r": 182.43472, "b": 338.25317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "76.7", "bbox": {"l": 167.95399, "t": 329.87854, "r": 182.43472, "b": 338.25317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 194.0462, "t": 329.87854, "r": 208.52695, "b": 338.25317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "80.4", "bbox": {"l": 194.0462, "t": 329.87854, "r": 208.52695, "b": 338.25317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 226.86324000000002, "t": 329.87854, "r": 241.34396, "b": 338.25317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "79.9", "bbox": {"l": 226.86324000000002, "t": 329.87854, "r": 241.34396, "b": 338.25317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 261.86804, "t": 329.87854, "r": 276.34879, "b": 338.25317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "82.7", "bbox": {"l": 261.86804, "t": 329.87854, "r": 276.34879, "b": 338.25317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 67.663002, "t": 341.23654, "r": 78.628906, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "All", "bbox": {"l": 67.663002, "t": 341.23654, "r": 78.628906, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 135.32401, "t": 341.23654, "r": 155.03215, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "82-83", "bbox": {"l": 135.32401, "t": 341.23654, "r": 155.03215, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 167.95399, "t": 341.23654, "r": 182.43472, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "72.4", "bbox": {"l": 167.95399, "t": 341.23654, "r": 182.43472, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 194.0462, "t": 341.23654, "r": 208.52695, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "73.5", "bbox": {"l": 194.0462, "t": 341.23654, "r": 208.52695, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 226.86324000000002, "t": 341.23654, "r": 241.34396, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "73.4", "bbox": {"l": 226.86324000000002, "t": 341.23654, "r": 241.34396, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 261.86804, "t": 341.23654, "r": 276.34879, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "76.8", "bbox": {"l": 261.86804, "t": 341.23654, "r": 276.34879, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ecel", "ched", "ched", "lcel", "ched", "ched", "nl", "ecel", "ucel", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 14, "num_cols": 6, "table_cells": [{"bbox": {"l": 132.36501, "t": 197.97351000000003, "r": 157.99098, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "human", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 173.505, "t": 197.97351000000003, "r": 204.61841, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 4, "text": "MRCNN", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 220.13028, "t": 197.97351000000003, "r": 248.06958, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "FRCNN", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 258.03125, "t": 197.97351000000003, "r": 280.17825, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "YOLO", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 168.39301, "t": 208.93255999999997, "r": 181.99504, "b": 217.30719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "R50", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 192.39606, "t": 208.93255999999997, "r": 210.16747, "b": 217.30719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "R101", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 225.21309, "t": 208.93255999999997, "r": 242.9845, "b": 217.30719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "R101", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 260.51379, "t": 208.93255999999997, "r": 277.70239, "b": 217.30719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "v5x6", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 220.28954999999996, "r": 96.848633, "b": 228.66418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Caption", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 220.28954999999996, "r": 155.03215, "b": 228.66418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "84-89", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 220.28954999999996, "r": 182.43472, "b": 228.66418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "68.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 220.28954999999996, "r": 208.52695, "b": 228.66418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "71.5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 220.28954999999996, "r": 241.34396, "b": 228.66418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "70.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 220.28954999999996, "r": 276.34879, "b": 228.66418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "77.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 231.24854000000005, "r": 100.1662, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Footnote", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 231.24854000000005, "r": 155.03215, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "83-91", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 231.24854000000005, "r": 182.43472, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "70.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 231.24854000000005, "r": 208.52695, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "71.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 231.24854000000005, "r": 241.34396, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "73.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 231.24854000000005, "r": 276.34879, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "77.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 242.20752000000005, "r": 98.175659, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Formula", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 242.20752000000005, "r": 155.03215, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "83-85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 242.20752000000005, "r": 182.43472, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "60.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 242.20752000000005, "r": 208.52695, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "63.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 242.20752000000005, "r": 241.34396, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "63.5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 242.20752000000005, "r": 276.34879, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "66.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 253.16656, "r": 100.54279, "b": 261.5412, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "List-item", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 253.16656, "r": 155.03215, "b": 261.5412, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "87-88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 253.16656, "r": 182.43472, "b": 261.5412, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "81.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 253.16656, "r": 208.52695, "b": 261.5412, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "80.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 253.16656, "r": 241.34396, "b": 261.5412, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "81.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 253.16656, "r": 276.34879, "b": 261.5412, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "86.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 264.12555, "r": 110.19064, "b": 272.50018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-footer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 264.12555, "r": 155.03215, "b": 272.50018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "93-94", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 264.12555, "r": 182.43472, "b": 272.50018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "61.6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 264.12555, "r": 208.52695, "b": 272.50018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "59.3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 264.12555, "r": 241.34396, "b": 272.50018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "58.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 264.12555, "r": 276.34879, "b": 272.50018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "61.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 275.08453, "r": 112.94331999999999, "b": 283.45917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 275.08453, "r": 155.03215, "b": 283.45917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "85-89", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 275.08453, "r": 182.43472, "b": 283.45917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "71.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 275.08453, "r": 208.52695, "b": 283.45917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "70.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 275.08453, "r": 241.34396, "b": 283.45917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "72.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 275.08453, "r": 276.34879, "b": 283.45917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "67.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 286.04355000000004, "r": 93.647629, "b": 294.41818, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Picture", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 286.04355000000004, "r": 155.03215, "b": 294.41818, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "69-71", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 286.04355000000004, "r": 182.43472, "b": 294.41818, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "71.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 286.04355000000004, "r": 208.52695, "b": 294.41818, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "72.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 286.04355000000004, "r": 241.34396, "b": 294.41818, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "72.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 286.04355000000004, "r": 276.34879, "b": 294.41818, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "77.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 297.00253, "r": 122.40287999999998, "b": 305.37717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Section-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 297.00253, "r": 155.03215, "b": 305.37717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "83-84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 297.00253, "r": 182.43472, "b": 305.37717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "67.6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 297.00253, "r": 208.52695, "b": 305.37717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "69.3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 297.00253, "r": 241.34396, "b": 305.37717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "68.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 297.00253, "r": 276.34879, "b": 305.37717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "74.6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 307.96155, "r": 87.46978, "b": 316.33618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 307.96155, "r": 155.03215, "b": 316.33618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "77-81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 307.96155, "r": 182.43472, "b": 316.33618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "82.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 307.96155, "r": 208.52695, "b": 316.33618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "82.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 307.96155, "r": 241.34396, "b": 316.33618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "82.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 307.96155, "r": 276.34879, "b": 316.33618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "86.3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 318.91953, "r": 83.623199, "b": 327.29416, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Text", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 318.91953, "r": 155.03215, "b": 327.29416, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "84-86", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 318.91953, "r": 182.43472, "b": 327.29416, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "84.6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 318.91953, "r": 208.52695, "b": 327.29416, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "85.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 318.91953, "r": 241.34396, "b": 327.29416, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "85.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 318.91953, "r": 276.34879, "b": 327.29416, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "88.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 329.87854, "r": 84.654327, "b": 338.25317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Title", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 329.87854, "r": 155.03215, "b": 338.25317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "60-72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 329.87854, "r": 182.43472, "b": 338.25317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "76.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 329.87854, "r": 208.52695, "b": 338.25317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "80.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 329.87854, "r": 241.34396, "b": 338.25317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "79.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 329.87854, "r": 276.34879, "b": 338.25317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "82.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 341.23654, "r": 78.628906, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "All", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 341.23654, "r": 155.03215, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "82-83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 341.23654, "r": 182.43472, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "72.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 341.23654, "r": 208.52695, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "73.5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 341.23654, "r": 241.34396, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "73.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 341.23654, "r": 276.34879, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "76.8", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "text", "id": 4, "page_no": 5, "cluster": {"id": 4, "label": "text", "bbox": {"l": 53.528999, "t": 370.92755, "r": 295.55612, "b": 576.56317, "coord_origin": "TOPLEFT"}, "confidence": 0.9866557121276855, "cells": [{"id": 93, "text": "to avoid this at any cost in order to have clear, unbiased baseline", "bbox": {"l": 53.79800000000001, "t": 370.92755, "r": 294.04712, "b": 379.30219000000005, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "numbers for human document-layout annotation. Third, we in-", "bbox": {"l": 53.79800000000001, "t": 381.88654, "r": 295.55612, "b": 390.26117, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "troduced the feature of", "bbox": {"l": 53.79800000000001, "t": 392.84555, "r": 140.3623, "b": 401.22017999999997, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "snapping", "bbox": {"l": 142.99001, "t": 392.89041, "r": 175.9695, "b": 401.2291599999999, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "boxes around text segments to", "bbox": {"l": 178.951, "t": 392.84555, "r": 294.04083, "b": 401.22017999999997, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "obtain a pixel-accurate annotation and again reduce time and effort.", "bbox": {"l": 53.79800000000001, "t": 403.80453, "r": 295.42493, "b": 412.17917, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "The CCS annotation tool automatically shrinks every user-drawn", "bbox": {"l": 53.528999, "t": 414.76355, "r": 294.04251, "b": 423.13818, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "box to the minimum bounding-box around the enclosed text-cells", "bbox": {"l": 53.79800000000001, "t": 425.72253, "r": 294.04807, "b": 434.09717, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "for all purely text-based segments, which excludes only", "bbox": {"l": 53.79800000000001, "t": 436.6815500000001, "r": 256.80627, "b": 445.0561799999999, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "Table", "bbox": {"l": 259.04199, "t": 436.72641, "r": 278.10455, "b": 445.06516, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "and", "bbox": {"l": 280.54999, "t": 436.6815500000001, "r": 294.04443, "b": 445.0561799999999, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "Picture", "bbox": {"l": 53.79800000000001, "t": 447.68539, "r": 78.875587, "b": 456.02413999999993, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": ". For the latter, we instructed annotation staff to minimise", "bbox": {"l": 78.876999, "t": 447.64053, "r": 294.04852, "b": 456.01517, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "inclusion of surrounding whitespace while including all graphical", "bbox": {"l": 53.79800000000001, "t": 458.59955, "r": 294.04645, "b": 466.97418, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "lines. A downside of snapping boxes to enclosed text cells is that", "bbox": {"l": 53.79800000000001, "t": 469.55853, "r": 294.0416, "b": 477.93317, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "some wrongly parsed PDF pages cannot be annotated correctly and", "bbox": {"l": 53.79800000000001, "t": 480.51654, "r": 294.04538, "b": 488.89117, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "need to be skipped. Fourth, we established a way to flag pages as", "bbox": {"l": 53.79800000000001, "t": 491.47552, "r": 294.04312, "b": 499.85016, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "rejected", "bbox": {"l": 53.79800000000001, "t": 502.4794, "r": 80.597939, "b": 510.81815, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "for cases where no valid annotation according to the label", "bbox": {"l": 83.366997, "t": 502.43454, "r": 294.04483, "b": 510.80917, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "guidelines could be achieved. Example cases for this would be PDF", "bbox": {"l": 53.79800000000001, "t": 513.3935200000001, "r": 294.25833, "b": 521.7681600000001, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "pages that render incorrectly or contain layouts that are impossible", "bbox": {"l": 53.79800000000001, "t": 524.35254, "r": 294.04535, "b": 532.72717, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "to capture with non-overlapping rectangles. Such rejected pages are", "bbox": {"l": 53.79800000000001, "t": 535.31155, "r": 294.04535, "b": 543.68617, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "not contained in the final dataset. With all these measures in place,", "bbox": {"l": 53.79800000000001, "t": 546.27055, "r": 295.02759, "b": 554.64517, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "experienced annotation staff managed to annotate a single page in", "bbox": {"l": 53.79800000000001, "t": 557.22955, "r": 294.0488, "b": 565.6041700000001, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "a typical timeframe of 20s to 60s, depending on its complexity.", "bbox": {"l": 53.79800000000001, "t": 568.18855, "r": 281.80457, "b": 576.56317, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "to avoid this at any cost in order to have clear, unbiased baseline numbers for human document-layout annotation. Third, we introduced the feature of snapping boxes around text segments to obtain a pixel-accurate annotation and again reduce time and effort. The CCS annotation tool automatically shrinks every user-drawn box to the minimum bounding-box around the enclosed text-cells for all purely text-based segments, which excludes only Table and Picture . For the latter, we instructed annotation staff to minimise inclusion of surrounding whitespace while including all graphical lines. A downside of snapping boxes to enclosed text cells is that some wrongly parsed PDF pages cannot be annotated correctly and need to be skipped. Fourth, we established a way to flag pages as rejected for cases where no valid annotation according to the label guidelines could be achieved. Example cases for this would be PDF pages that render incorrectly or contain layouts that are impossible to capture with non-overlapping rectangles. Such rejected pages are not contained in the final dataset. With all these measures in place, experienced annotation staff managed to annotate a single page in a typical timeframe of 20s to 60s, depending on its complexity."}, {"label": "section_header", "id": 10, "page_no": 5, "cluster": {"id": 10, "label": "section_header", "bbox": {"l": 53.79800000000001, "t": 588.12991, "r": 147.48535, "b": 598.43901, "coord_origin": "TOPLEFT"}, "confidence": 0.9419495463371277, "cells": [{"id": 118, "text": "5", "bbox": {"l": 53.79800000000001, "t": 588.12991, "r": 59.405277, "b": 598.43901, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "EXPERIMENTS", "bbox": {"l": 70.314377, "t": 588.12991, "r": 147.48535, "b": 598.43901, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5 EXPERIMENTS"}, {"label": "text", "id": 2, "page_no": 5, "cluster": {"id": 2, "label": "text", "bbox": {"l": 53.484001, "t": 613.25356, "r": 295.4281, "b": 709.299171, "coord_origin": "TOPLEFT"}, "confidence": 0.987605094909668, "cells": [{"id": 120, "text": "The primary goal of DocLayNet is to obtain high-quality ML models", "bbox": {"l": 53.528999, "t": 613.25356, "r": 294.04871, "b": 621.6281700000001, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "capable of accurate document-layout analysis on a wide variety", "bbox": {"l": 53.79800000000001, "t": 624.21255, "r": 294.27576, "b": 632.58717, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "of challenging layouts. As discussed in Section 2, object detection", "bbox": {"l": 53.79800000000001, "t": 635.17155, "r": 294.04144, "b": 643.54617, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "models are currently the easiest to use, due to the standardisation", "bbox": {"l": 53.79800000000001, "t": 646.13055, "r": 294.04163, "b": 654.50517, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "of ground-truth data in COCO format [16] and the availability of", "bbox": {"l": 53.79800000000001, "t": 657.0885499999999, "r": 294.0412, "b": 665.46317, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "general frameworks such as", "bbox": {"l": 53.79800000000001, "t": 668.04755, "r": 155.01054, "b": 676.42217, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "detectron2", "bbox": {"l": 157.23599, "t": 668.09238, "r": 193.26666, "b": 676.43114, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "[17]. Furthermore, baseline", "bbox": {"l": 195.867, "t": 668.04755, "r": 294.0473, "b": 676.42217, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "numbers in PubLayNet and DocBank were obtained using standard", "bbox": {"l": 53.79800000000001, "t": 679.0065500000001, "r": 294.04538, "b": 687.38117, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "object detection models such as Mask R-CNN and Faster R-CNN.", "bbox": {"l": 53.79800000000001, "t": 689.96555, "r": 295.4281, "b": 698.3401719999999, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "As such, we will relate to these object detection methods in this", "bbox": {"l": 53.484001, "t": 700.9245530000001, "r": 294.04413, "b": 709.299171, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The primary goal of DocLayNet is to obtain high-quality ML models capable of accurate document-layout analysis on a wide variety of challenging layouts. As discussed in Section 2, object detection models are currently the easiest to use, due to the standardisation of ground-truth data in COCO format [16] and the availability of general frameworks such as detectron2 [17]. Furthermore, baseline numbers in PubLayNet and DocBank were obtained using standard object detection models such as Mask R-CNN and Faster R-CNN. As such, we will relate to these object detection methods in this"}, {"label": "picture", "id": 6, "page_no": 5, "cluster": {"id": 6, "label": "picture", "bbox": {"l": 323.48431396484375, "t": 89.88603210449219, "r": 553.5411376953125, "b": 260.0107727050781, "coord_origin": "TOPLEFT"}, "confidence": 0.9782690405845642, "cells": [{"id": 131, "text": "0", "bbox": {"l": 349.16577, "t": 246.68017999999995, "r": 352.48175, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "20", "bbox": {"l": 385.93698, "t": 246.68017999999995, "r": 392.56894, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "40", "bbox": {"l": 424.366, "t": 246.68017999999995, "r": 430.99796, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "60", "bbox": {"l": 462.79504000000003, "t": 246.68017999999995, "r": 469.427, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "80", "bbox": {"l": 501.22406, "t": 246.68017999999995, "r": 507.85602, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "100", "bbox": {"l": 537.99524, "t": 246.68017999999995, "r": 547.94318, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "% of DocLayNet training set", "bbox": {"l": 410.28143, "t": 253.80840999999998, "r": 483.47278000000006, "b": 259.88251, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "50", "bbox": {"l": 330.93539, "t": 218.38464, "r": 337.56735, "b": 224.45874000000003, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "55", "bbox": {"l": 330.93539, "t": 192.08660999999995, "r": 337.56735, "b": 198.16071, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "60", "bbox": {"l": 330.93539, "t": 165.78864, "r": 337.56735, "b": 171.86273000000006, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "65", "bbox": {"l": 330.93539, "t": 139.49059999999997, "r": 337.56735, "b": 145.56470000000002, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "70", "bbox": {"l": 330.93539, "t": 113.19263000000001, "r": 337.56735, "b": 119.26671999999996, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "mAP 0.50:0.95", "bbox": {"l": 322.92276, "t": 148.37689, "r": 328.99686, "b": 186.79218000000003, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "10", "bbox": {"l": 470.97235, "t": 235.36676, "r": 477.6055, "b": 241.44086000000004, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "1", "bbox": {"l": 477.65662, "t": 234.82390999999996, "r": 479.97778000000005, "b": 239.07581000000005, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "10", "bbox": {"l": 531.55127, "t": 235.41234999999995, "r": 538.18445, "b": 241.48645, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "2", "bbox": {"l": 538.23553, "t": 234.86951, "r": 540.5567, "b": 239.1214, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "50", "bbox": {"l": 404.91125, "t": 216.00005999999996, "r": 411.54321, "b": 222.07416, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "55", "bbox": {"l": 404.91125, "t": 200.22125000000005, "r": 411.54321, "b": 206.29534999999998, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "60", "bbox": {"l": 404.91125, "t": 184.44244000000003, "r": 411.54321, "b": 190.51653999999996, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "65", "bbox": {"l": 404.91125, "t": 168.66364, "r": 411.54321, "b": 174.73773000000006, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "70", "bbox": {"l": 404.91125, "t": 152.88489000000004, "r": 411.54321, "b": 158.95898, "coord_origin": "TOPLEFT"}}], "children": [{"id": 92, "label": "text", "bbox": {"l": 349.16577, "t": 246.68017999999995, "r": 352.48175, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 131, "text": "0", "bbox": {"l": 349.16577, "t": 246.68017999999995, "r": 352.48175, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 385.93698, "t": 246.68017999999995, "r": 392.56894, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 132, "text": "20", "bbox": {"l": 385.93698, "t": 246.68017999999995, "r": 392.56894, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 424.366, "t": 246.68017999999995, "r": 430.99796, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 133, "text": "40", "bbox": {"l": 424.366, "t": 246.68017999999995, "r": 430.99796, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 462.79504000000003, "t": 246.68017999999995, "r": 469.427, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 134, "text": "60", "bbox": {"l": 462.79504000000003, "t": 246.68017999999995, "r": 469.427, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 501.22406, "t": 246.68017999999995, "r": 507.85602, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 135, "text": "80", "bbox": {"l": 501.22406, "t": 246.68017999999995, "r": 507.85602, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 537.99524, "t": 246.68017999999995, "r": 547.94318, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 136, "text": "100", "bbox": {"l": 537.99524, "t": 246.68017999999995, "r": 547.94318, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 410.28143, "t": 253.80840999999998, "r": 483.47278000000006, "b": 259.88251, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 137, "text": "% of DocLayNet training set", "bbox": {"l": 410.28143, "t": 253.80840999999998, "r": 483.47278000000006, "b": 259.88251, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 330.93539, "t": 218.38464, "r": 337.56735, "b": 224.45874000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 138, "text": "50", "bbox": {"l": 330.93539, "t": 218.38464, "r": 337.56735, "b": 224.45874000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 330.93539, "t": 192.08660999999995, "r": 337.56735, "b": 198.16071, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 139, "text": "55", "bbox": {"l": 330.93539, "t": 192.08660999999995, "r": 337.56735, "b": 198.16071, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 330.93539, "t": 165.78864, "r": 337.56735, "b": 171.86273000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 140, "text": "60", "bbox": {"l": 330.93539, "t": 165.78864, "r": 337.56735, "b": 171.86273000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 330.93539, "t": 139.49059999999997, "r": 337.56735, "b": 145.56470000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 141, "text": "65", "bbox": {"l": 330.93539, "t": 139.49059999999997, "r": 337.56735, "b": 145.56470000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 330.93539, "t": 113.19263000000001, "r": 337.56735, "b": 119.26671999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 142, "text": "70", "bbox": {"l": 330.93539, "t": 113.19263000000001, "r": 337.56735, "b": 119.26671999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 322.92276, "t": 148.37689, "r": 328.99686, "b": 186.79218000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 143, "text": "mAP 0.50:0.95", "bbox": {"l": 322.92276, "t": 148.37689, "r": 328.99686, "b": 186.79218000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 470.97235, "t": 235.36676, "r": 477.6055, "b": 241.44086000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 144, "text": "10", "bbox": {"l": 470.97235, "t": 235.36676, "r": 477.6055, "b": 241.44086000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 477.65662, "t": 234.82390999999996, "r": 479.97778000000005, "b": 239.07581000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 145, "text": "1", "bbox": {"l": 477.65662, "t": 234.82390999999996, "r": 479.97778000000005, "b": 239.07581000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 531.55127, "t": 235.41234999999995, "r": 538.18445, "b": 241.48645, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 146, "text": "10", "bbox": {"l": 531.55127, "t": 235.41234999999995, "r": 538.18445, "b": 241.48645, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 538.23553, "t": 234.86951, "r": 540.5567, "b": 239.1214, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 147, "text": "2", "bbox": {"l": 538.23553, "t": 234.86951, "r": 540.5567, "b": 239.1214, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 404.91125, "t": 216.00005999999996, "r": 411.54321, "b": 222.07416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 148, "text": "50", "bbox": {"l": 404.91125, "t": 216.00005999999996, "r": 411.54321, "b": 222.07416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 404.91125, "t": 200.22125000000005, "r": 411.54321, "b": 206.29534999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 149, "text": "55", "bbox": {"l": 404.91125, "t": 200.22125000000005, "r": 411.54321, "b": 206.29534999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 404.91125, "t": 184.44244000000003, "r": 411.54321, "b": 190.51653999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 150, "text": "60", "bbox": {"l": 404.91125, "t": 184.44244000000003, "r": 411.54321, "b": 190.51653999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 404.91125, "t": 168.66364, "r": 411.54321, "b": 174.73773000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 151, "text": "65", "bbox": {"l": 404.91125, "t": 168.66364, "r": 411.54321, "b": 174.73773000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 404.91125, "t": 152.88489000000004, "r": 411.54321, "b": 158.95898, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 152, "text": "70", "bbox": {"l": 404.91125, "t": 152.88489000000004, "r": 411.54321, "b": 158.95898, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "caption", "id": 7, "page_no": 5, "cluster": {"id": 7, "label": "caption", "bbox": {"l": 317.95499, "t": 279.01599, "r": 559.80579, "b": 342.28418000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9639934301376343, "cells": [{"id": 153, "text": "Figure 5: Prediction performance (mAP@0.5-0.95) of a Mask", "bbox": {"l": 317.95499, "t": 279.01599, "r": 558.47876, "b": 287.48923, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "R-CNN network with ResNet50 backbone trained on increas-", "bbox": {"l": 317.95499, "t": 289.97501, "r": 559.80579, "b": 298.44824, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "ing fractions of the DocLayNet dataset. The learning curve", "bbox": {"l": 317.95499, "t": 300.93399, "r": 558.20068, "b": 309.40723, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "flattens around the 80% mark, indicating that increasing the", "bbox": {"l": 317.95499, "t": 311.89297, "r": 558.20062, "b": 320.36620999999997, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "size of the DocLayNet dataset with similar data will not yield", "bbox": {"l": 317.95499, "t": 322.85196, "r": 558.20074, "b": 331.3252, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "significantly better predictions.", "bbox": {"l": 317.95499, "t": 333.81094, "r": 445.24207, "b": 342.28418000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 5: Prediction performance (mAP@0.5-0.95) of a Mask R-CNN network with ResNet50 backbone trained on increasing fractions of the DocLayNet dataset. The learning curve flattens around the 80% mark, indicating that increasing the size of the DocLayNet dataset with similar data will not yield significantly better predictions."}, {"label": "text", "id": 8, "page_no": 5, "cluster": {"id": 8, "label": "text", "bbox": {"l": 317.95499, "t": 384.01154, "r": 558.20416, "b": 403.34517999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9594221711158752, "cells": [{"id": 159, "text": "paper and leave the detailed evaluation of more recent methods", "bbox": {"l": 317.95499, "t": 384.01154, "r": 558.20416, "b": 392.38617, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "mentioned in Section 2 for future work.", "bbox": {"l": 317.95499, "t": 394.97055, "r": 463.04938, "b": 403.34517999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "paper and leave the detailed evaluation of more recent methods mentioned in Section 2 for future work."}, {"label": "text", "id": 3, "page_no": 5, "cluster": {"id": 3, "label": "text", "bbox": {"l": 317.64099, "t": 405.92953, "r": 558.4364, "b": 480.05716, "coord_origin": "TOPLEFT"}, "confidence": 0.9872915148735046, "cells": [{"id": 161, "text": "In this section, we will present several aspects related to the", "bbox": {"l": 327.918, "t": 405.92953, "r": 558.19836, "b": 414.30417, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "performance of object detection models on DocLayNet. Similarly", "bbox": {"l": 317.95499, "t": 416.88855, "r": 558.4364, "b": 425.26318, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "as in PubLayNet, we will evaluate the quality of their predictions", "bbox": {"l": 317.95499, "t": 427.84653, "r": 558.20563, "b": 436.22116, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "using mean average precision (mAP) with 10 overlaps that range", "bbox": {"l": 317.95499, "t": 438.80554, "r": 558.20044, "b": 447.18018, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "from 0.5 to 0.95 in steps of 0.05 (mAP@0.5-0.95). These scores are", "bbox": {"l": 317.95499, "t": 449.76453000000004, "r": 558.19891, "b": 458.13916, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "computed by leveraging the evaluation code provided by the COCO", "bbox": {"l": 317.95499, "t": 460.72354, "r": 558.20239, "b": 469.09818, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "API [16].", "bbox": {"l": 317.64099, "t": 471.68253, "r": 350.32352, "b": 480.05716, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In this section, we will present several aspects related to the performance of object detection models on DocLayNet. Similarly as in PubLayNet, we will evaluate the quality of their predictions using mean average precision (mAP) with 10 overlaps that range from 0.5 to 0.95 in steps of 0.05 (mAP@0.5-0.95). These scores are computed by leveraging the evaluation code provided by the COCO API [16]."}, {"label": "section_header", "id": 9, "page_no": 5, "cluster": {"id": 9, "label": "section_header", "bbox": {"l": 317.95499, "t": 496.8219, "r": 466.8532400000001, "b": 507.13098, "coord_origin": "TOPLEFT"}, "confidence": 0.9579004049301147, "cells": [{"id": 168, "text": "Baselines for Object Detection", "bbox": {"l": 317.95499, "t": 496.8219, "r": 466.8532400000001, "b": 507.13098, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Baselines for Object Detection"}, {"label": "text", "id": 1, "page_no": 5, "cluster": {"id": 1, "label": "text", "bbox": {"l": 317.74899, "t": 512.02454, "r": 558.43085, "b": 706.700172, "coord_origin": "TOPLEFT"}, "confidence": 0.987722635269165, "cells": [{"id": 169, "text": "In Table 2, we present baseline experiments (given in mAP) on Mask", "bbox": {"l": 317.95499, "t": 512.02454, "r": 558.43085, "b": 520.39917, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "R-CNN [12], Faster R-CNN [11], and YOLOv5 [13]. Both training", "bbox": {"l": 317.95499, "t": 522.9835499999999, "r": 558.20117, "b": 531.35818, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "and evaluation were performed on RGB images with dimensions of", "bbox": {"l": 317.95499, "t": 533.94254, "r": 558.20233, "b": 542.31717, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "1025", "bbox": {"l": 317.74899, "t": 544.90155, "r": 334.09296, "b": 553.27617, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "\u00d7", "bbox": {"l": 334.81201, "t": 544.84775, "r": 340.51465, "b": 552.5499, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "1025 pixels. For training, we only used one annotation in case", "bbox": {"l": 341.233, "t": 544.90155, "r": 558.20117, "b": 553.27617, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "of redundantly annotated pages. As one can observe, the variation", "bbox": {"l": 317.95499, "t": 555.85956, "r": 558.20392, "b": 564.23418, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "in mAP between the models is rather low, but overall between 6", "bbox": {"l": 317.95499, "t": 566.8185599999999, "r": 558.2041, "b": 575.19318, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "and 10% lower than the mAP computed from the pairwise human", "bbox": {"l": 317.95499, "t": 577.77756, "r": 558.2052, "b": 586.15218, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "annotations on triple-annotated pages. This gives a good indication", "bbox": {"l": 317.95499, "t": 588.73656, "r": 558.20233, "b": 597.11118, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "that the DocLayNet dataset poses a worthwhile challenge for the", "bbox": {"l": 317.95499, "t": 599.69556, "r": 558.1983, "b": 608.0701799999999, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "research community to close the gap between human recognition", "bbox": {"l": 317.95499, "t": 610.65456, "r": 558.20502, "b": 619.02917, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "and ML approaches. It is interesting to see that Mask R-CNN and", "bbox": {"l": 317.95499, "t": 621.61356, "r": 558.20337, "b": 629.98817, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "Faster R-CNN produce very comparable mAP scores, indicating", "bbox": {"l": 317.95499, "t": 632.5725600000001, "r": 558.2041, "b": 640.94717, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "that pixel-based image segmentation derived from bounding-boxes", "bbox": {"l": 317.95499, "t": 643.53156, "r": 558.20245, "b": 651.90617, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "does not help to obtain better predictions. On the other hand, the", "bbox": {"l": 317.95499, "t": 654.49055, "r": 558.19757, "b": 662.86517, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": "more recent Yolov5x model does very well and even out-performs", "bbox": {"l": 317.95499, "t": 665.44855, "r": 558.20404, "b": 673.82317, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "humans on selected labels such as", "bbox": {"l": 317.95499, "t": 676.40755, "r": 444.54102, "b": 684.78217, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "Text", "bbox": {"l": 446.78900000000004, "t": 676.45238, "r": 461.95261000000005, "b": 684.79114, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": ",", "bbox": {"l": 461.95599000000004, "t": 676.40755, "r": 463.96805000000006, "b": 684.78217, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "Table", "bbox": {"l": 466.2170100000001, "t": 676.45238, "r": 485.66998000000007, "b": 684.79114, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "and", "bbox": {"l": 488.1290000000001, "t": 676.40755, "r": 501.89330999999993, "b": 684.78217, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "Picture", "bbox": {"l": 504.142, "t": 676.45238, "r": 529.21954, "b": 684.79114, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": ". This is", "bbox": {"l": 529.22101, "t": 676.40755, "r": 558.20392, "b": 684.78217, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "not entirely surprising, as", "bbox": {"l": 317.95499, "t": 687.36655, "r": 410.81366, "b": 695.741173, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "Text", "bbox": {"l": 413.05301, "t": 687.41138, "r": 427.67865, "b": 695.750137, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": ",", "bbox": {"l": 427.67801, "t": 687.36655, "r": 429.62103, "b": 695.741173, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "Table", "bbox": {"l": 431.86099, "t": 687.41138, "r": 450.62881000000004, "b": 695.750137, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "and", "bbox": {"l": 453.082, "t": 687.36655, "r": 466.37402, "b": 695.741173, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "Picture", "bbox": {"l": 468.61499, "t": 687.41138, "r": 492.83208999999994, "b": 695.750137, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "are abundant and", "bbox": {"l": 495.28201, "t": 687.36655, "r": 558.2005, "b": 695.741173, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "the most visually distinctive in a document.", "bbox": {"l": 317.95499, "t": 698.325554, "r": 477.53903, "b": 706.700172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In Table 2, we present baseline experiments (given in mAP) on Mask R-CNN [12], Faster R-CNN [11], and YOLOv5 [13]. Both training and evaluation were performed on RGB images with dimensions of 1025 \u00d7 1025 pixels. For training, we only used one annotation in case of redundantly annotated pages. As one can observe, the variation in mAP between the models is rather low, but overall between 6 and 10% lower than the mAP computed from the pairwise human annotations on triple-annotated pages. This gives a good indication that the DocLayNet dataset poses a worthwhile challenge for the research community to close the gap between human recognition and ML approaches. It is interesting to see that Mask R-CNN and Faster R-CNN produce very comparable mAP scores, indicating that pixel-based image segmentation derived from bounding-boxes does not help to obtain better predictions. On the other hand, the more recent Yolov5x model does very well and even out-performs humans on selected labels such as Text , Table and Picture . This is not entirely surprising, as Text , Table and Picture are abundant and the most visually distinctive in a document."}], "headers": [{"label": "page_header", "id": 11, "page_no": 5, "cluster": {"id": 11, "label": "page_header", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.8662874698638916, "cells": [{"id": 0, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 246.24382, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar", "bbox": {"l": 253.13897999999998, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar"}]}}, {"page_no": 6, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Table 3: Performance of a Mask R-CNN R50 network in", "bbox": {"l": 53.501999, "t": 86.87292000000002, "r": 294.0437, "b": 95.34618999999998, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "mAP@0.5-0.95 scores trained on DocLayNet with different", "bbox": {"l": 53.79800000000001, "t": 97.83191, "r": 294.04376, "b": 106.30517999999995, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "class label sets. The reduced label sets were obtained by ei-", "bbox": {"l": 53.79800000000001, "t": 108.79088999999999, "r": 295.64865, "b": 117.26415999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "ther down-mapping or dropping labels.", "bbox": {"l": 53.79800000000001, "t": 119.74987999999996, "r": 213.23856, "b": 128.22313999999994, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Class-count", "bbox": {"l": 86.372002, "t": 153.10051999999996, "r": 129.46452, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "11", "bbox": {"l": 151.07401, "t": 153.10051999999996, "r": 159.41275, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "6", "bbox": {"l": 179.31816, "t": 153.10051999999996, "r": 183.48753, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "5", "bbox": {"l": 213.33669, "t": 153.10051999999996, "r": 217.50606, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "4", "bbox": {"l": 247.35521, "t": 153.10051999999996, "r": 251.52458, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Caption", "bbox": {"l": 86.372002, "t": 164.45752000000005, "r": 115.55763, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "68", "bbox": {"l": 151.07401, "t": 164.45752000000005, "r": 159.41275, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Text", "bbox": {"l": 173.42723, "t": 164.45752000000005, "r": 189.38742, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Text", "bbox": {"l": 207.44576, "t": 164.45752000000005, "r": 223.40594000000002, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Text", "bbox": {"l": 241.46428, "t": 164.45752000000005, "r": 257.42447, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Footnote", "bbox": {"l": 86.372002, "t": 175.41656, "r": 118.8752, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "71", "bbox": {"l": 151.07401, "t": 175.41656, "r": 159.41275, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Text", "bbox": {"l": 173.42723, "t": 175.41656, "r": 189.38742, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Text", "bbox": {"l": 207.44576, "t": 175.41656, "r": 223.40594000000002, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Text", "bbox": {"l": 241.46428, "t": 175.41656, "r": 257.42447, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Formula", "bbox": {"l": 86.372002, "t": 186.37554999999998, "r": 116.88466, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "60", "bbox": {"l": 151.07401, "t": 186.37554999999998, "r": 159.41275, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Text", "bbox": {"l": 173.42723, "t": 186.37554999999998, "r": 189.38742, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "Text", "bbox": {"l": 207.44576, "t": 186.37554999999998, "r": 223.40594000000002, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "Text", "bbox": {"l": 241.46428, "t": 186.37554999999998, "r": 257.42447, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "List-item", "bbox": {"l": 86.372002, "t": 197.33452999999997, "r": 119.25179, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "81", "bbox": {"l": 151.07401, "t": 197.33452999999997, "r": 159.41275, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Text", "bbox": {"l": 173.42723, "t": 197.33452999999997, "r": 189.38742, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "82", "bbox": {"l": 211.25647, "t": 197.33452999999997, "r": 219.59521, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Text", "bbox": {"l": 241.46426, "t": 197.33452999999997, "r": 257.42447, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Page-footer", "bbox": {"l": 86.372002, "t": 208.29351999999994, "r": 128.89964, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "62", "bbox": {"l": 151.07401, "t": 208.29351999999994, "r": 159.41275, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "62", "bbox": {"l": 177.23795, "t": 208.29351999999994, "r": 185.57669, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "-", "bbox": {"l": 213.91052, "t": 208.29351999999994, "r": 216.94116, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "-", "bbox": {"l": 247.92905000000002, "t": 208.29351999999994, "r": 250.95969, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Page-header", "bbox": {"l": 86.372002, "t": 219.25256000000002, "r": 131.65231, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "72", "bbox": {"l": 151.07401, "t": 219.25256000000002, "r": 159.41275, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "68", "bbox": {"l": 177.23795, "t": 219.25256000000002, "r": 185.57669, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "-", "bbox": {"l": 213.91052, "t": 219.25256000000002, "r": 216.94116, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "-", "bbox": {"l": 247.92905000000002, "t": 219.25256000000002, "r": 250.95969, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Picture", "bbox": {"l": 86.372002, "t": 230.21155, "r": 112.35663, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "72", "bbox": {"l": 151.07401, "t": 230.21155, "r": 159.41275, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "72", "bbox": {"l": 177.23795, "t": 230.21155, "r": 185.57669, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "72", "bbox": {"l": 211.25645, "t": 230.21155, "r": 219.5952, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "72", "bbox": {"l": 245.27496, "t": 230.21155, "r": 253.61371, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "Section-header", "bbox": {"l": 86.372002, "t": 241.16956000000005, "r": 141.11188, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "68", "bbox": {"l": 151.07401, "t": 241.16956000000005, "r": 159.41275, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "67", "bbox": {"l": 177.23795, "t": 241.16956000000005, "r": 185.57669, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "69", "bbox": {"l": 211.25645, "t": 241.16956000000005, "r": 219.5952, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "68", "bbox": {"l": 245.27496, "t": 241.16956000000005, "r": 253.61371, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Table", "bbox": {"l": 86.372002, "t": 252.12854000000004, "r": 106.17878, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "82", "bbox": {"l": 151.07401, "t": 252.12854000000004, "r": 159.41275, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "83", "bbox": {"l": 177.23795, "t": 252.12854000000004, "r": 185.57669, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "82", "bbox": {"l": 211.25645, "t": 252.12854000000004, "r": 219.5952, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "82", "bbox": {"l": 245.27496, "t": 252.12854000000004, "r": 253.61371, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Text", "bbox": {"l": 86.372002, "t": 263.08752000000004, "r": 102.3322, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "85", "bbox": {"l": 151.07401, "t": 263.08752000000004, "r": 159.41275, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "84", "bbox": {"l": 177.23795, "t": 263.08752000000004, "r": 185.57669, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "84", "bbox": {"l": 211.25645, "t": 263.08752000000004, "r": 219.5952, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "84", "bbox": {"l": 245.27496, "t": 263.08752000000004, "r": 253.61371, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "Title", "bbox": {"l": 86.372002, "t": 274.04657, "r": 103.36333, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "77", "bbox": {"l": 151.07401, "t": 274.04657, "r": 159.41275, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "Sec.-h.", "bbox": {"l": 169.37442, "t": 274.04657, "r": 193.43127, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "Sec.-h.", "bbox": {"l": 203.39294, "t": 274.04657, "r": 227.4498, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "Sec.-h.", "bbox": {"l": 237.41147, "t": 274.04657, "r": 261.46832, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "Overall", "bbox": {"l": 86.372002, "t": 285.40454, "r": 113.31602000000001, "b": 293.77917, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "72", "bbox": {"l": 151.07401, "t": 285.40454, "r": 159.41275, "b": 293.77917, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "73", "bbox": {"l": 177.23795, "t": 285.40454, "r": 185.57669, "b": 293.77917, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "78", "bbox": {"l": 211.25645, "t": 285.40454, "r": 219.5952, "b": 293.77917, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "77", "bbox": {"l": 245.27496, "t": 285.40454, "r": 253.61371, "b": 293.77917, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Learning Curve", "bbox": {"l": 53.79800000000001, "t": 319.56992, "r": 131.05624, "b": 329.879, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "One of the fundamental questions related to any dataset is if it is", "bbox": {"l": 53.79800000000001, "t": 334.77155, "r": 294.04153, "b": 343.14618, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "\u201clarge enough\u201d. To answer this question for DocLayNet, we per-", "bbox": {"l": 52.785, "t": 345.73053, "r": 295.55835, "b": 354.10516000000007, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "formed a data ablation study in which we evaluated a Mask R-CNN", "bbox": {"l": 53.79800000000001, "t": 356.6895400000001, "r": 294.04535, "b": 365.06418, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "model trained on increasing fractions of the DocLayNet dataset.", "bbox": {"l": 53.79800000000001, "t": 367.64853, "r": 295.4281, "b": 376.02316, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "As can be seen in Figure 5, the mAP score rises sharply in the be-", "bbox": {"l": 53.484001, "t": 378.60754, "r": 295.55667, "b": 386.98218, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "ginning and eventually levels out. To estimate the error-bar on the", "bbox": {"l": 53.79800000000001, "t": 389.56653, "r": 294.04865, "b": 397.94116, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "metrics, we ran the training five times on the entire data-set. This", "bbox": {"l": 53.79800000000001, "t": 400.52554000000003, "r": 294.04376, "b": 408.90018, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "resulted in a 1% error-bar, depicted by the shaded area in Figure 5.", "bbox": {"l": 53.79800000000001, "t": 411.48456, "r": 295.42459, "b": 419.85919, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "In the inset of Figure 5, we show the exact same data-points, but", "bbox": {"l": 53.79800000000001, "t": 422.44354, "r": 294.04709, "b": 430.81818, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "with a logarithmic scale on the x-axis. As is expected, the mAP", "bbox": {"l": 53.466999, "t": 433.40253000000007, "r": 294.04535, "b": 441.7771599999999, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "score increases linearly as a function of the data-size in the inset.", "bbox": {"l": 53.79800000000001, "t": 444.36053000000004, "r": 295.42902, "b": 452.73517, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "The curve ultimately flattens out between the 80% and 100% mark,", "bbox": {"l": 53.528999, "t": 455.31955, "r": 295.03122, "b": 463.69418, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "with the 80% mark falling within the error-bars of the 100% mark.", "bbox": {"l": 53.466999, "t": 466.27853, "r": 295.42154, "b": 474.65317, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "This provides a good indication that the model would not improve", "bbox": {"l": 53.528999, "t": 477.23755, "r": 294.04553, "b": 485.61218, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "significantly by yet increasing the data size. Rather, it would prob-", "bbox": {"l": 53.79800000000001, "t": 488.19653, "r": 295.55646, "b": 496.57117, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "ably benefit more from improved data consistency (as discussed", "bbox": {"l": 53.79800000000001, "t": 499.15555, "r": 294.04715, "b": 507.53018, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "in Section 3), data augmentation methods [23], or the addition of", "bbox": {"l": 53.79800000000001, "t": 510.11453, "r": 294.04245, "b": 518.4891700000001, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "more document categories and styles.", "bbox": {"l": 53.79800000000001, "t": 521.0735500000001, "r": 191.47707, "b": 529.44818, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "Impact of Class Labels", "bbox": {"l": 53.79800000000001, "t": 542.50992, "r": 164.32898, "b": 552.81902, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "The choice and number of labels can have a significant effect on", "bbox": {"l": 53.528999, "t": 557.71155, "r": 294.04333, "b": 566.08617, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "the overall model performance. Since PubLayNet, DocBank and", "bbox": {"l": 53.79800000000001, "t": 568.6705499999999, "r": 294.04712, "b": 577.04517, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "DocLayNet all have different label sets, it is of particular interest to", "bbox": {"l": 53.79800000000001, "t": 579.62955, "r": 294.04538, "b": 588.0041699999999, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "understand and quantify this influence of the label set on the model", "bbox": {"l": 53.79800000000001, "t": 590.5885499999999, "r": 294.04535, "b": 598.96317, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "performance. We investigate this by either down-mapping labels", "bbox": {"l": 53.79800000000001, "t": 601.54755, "r": 294.04266, "b": 609.92216, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "into more common ones (e.g.", "bbox": {"l": 53.79800000000001, "t": 612.50656, "r": 163.59247, "b": 620.88118, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "Caption", "bbox": {"l": 166.26401, "t": 612.55139, "r": 194.97244, "b": 620.89015, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "\u2192", "bbox": {"l": 194.994, "t": 612.45276, "r": 204.1756, "b": 620.15491, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "Text", "bbox": {"l": 204.17599, "t": 612.55139, "r": 219.33961000000002, "b": 620.89015, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": ") or excluding them", "bbox": {"l": 219.849, "t": 612.50656, "r": 294.04828, "b": 620.88118, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "from the annotations entirely. Furthermore, it must be stressed", "bbox": {"l": 53.79800000000001, "t": 623.46556, "r": 294.04709, "b": 631.84018, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "that all mappings and exclusions were performed on the data be-", "bbox": {"l": 53.79800000000001, "t": 634.42355, "r": 295.55679, "b": 642.79817, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "fore model training. In Table 3, we present the mAP scores for a", "bbox": {"l": 53.79800000000001, "t": 645.38255, "r": 294.04715, "b": 653.75717, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "Mask R-CNN R50 network on different label sets. Where a label", "bbox": {"l": 53.79800000000001, "t": 656.34155, "r": 294.04715, "b": 664.71617, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "is down-mapped, we show its corresponding label, otherwise it", "bbox": {"l": 53.79800000000001, "t": 667.30055, "r": 294.04712, "b": 675.67517, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "was excluded. We present three different label sets, with 6, 5 and 4", "bbox": {"l": 53.466999, "t": 678.25955, "r": 294.25174, "b": 686.63417, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "different labels respectively. The set of 5 labels contains the same", "bbox": {"l": 53.79800000000001, "t": 689.21855, "r": 294.04639, "b": 697.59317, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "labels as PubLayNet. However, due to the different definition of", "bbox": {"l": 53.79800000000001, "t": 700.177551, "r": 294.04712, "b": 708.55217, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "Table 4: Performance of a Mask R-CNN R50 network with", "bbox": {"l": 317.659, "t": 86.87298999999996, "r": 558.20068, "b": 95.34625000000017, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "document-wise and page-wise split for different label sets.", "bbox": {"l": 317.95499, "t": 97.83196999999996, "r": 559.73401, "b": 106.30524000000003, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "Naive page-wise split will result in", "bbox": {"l": 317.95499, "t": 108.79094999999995, "r": 467.72089, "b": 117.26422000000014, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "GLYPH<tildelow>", "bbox": {"l": 471.90900000000005, "t": 107.12798999999995, "r": 477.53900000000004, "b": 115.19768999999997, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "10% point improve-", "bbox": {"l": 477.54001000000005, "t": 108.79094999999995, "r": 559.80682, "b": 117.26422000000014, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "ment.", "bbox": {"l": 317.95502, "t": 119.74993999999992, "r": 341.37524, "b": 128.22321, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "Class-count", "bbox": {"l": 358.63901, "t": 153.10051999999996, "r": 401.73154, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "11", "bbox": {"l": 440.22501, "t": 153.10051999999996, "r": 448.56375, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "5", "bbox": {"l": 494.38, "t": 153.10051999999996, "r": 498.54938, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "Split", "bbox": {"l": 358.63901, "t": 164.05951000000005, "r": 375.27167, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "Doc", "bbox": {"l": 423.341, "t": 164.05951000000005, "r": 438.0459, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "Page", "bbox": {"l": 448.00757, "t": 164.05951000000005, "r": 465.4472, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "Doc", "bbox": {"l": 475.41101, "t": 164.05951000000005, "r": 490.11591, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Page", "bbox": {"l": 500.07757999999995, "t": 164.05951000000005, "r": 517.51721, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "Caption", "bbox": {"l": 358.63901, "t": 175.41656, "r": 387.82465, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "68", "bbox": {"l": 426.52399, "t": 175.41656, "r": 434.86273, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "83", "bbox": {"l": 452.56240999999994, "t": 175.41656, "r": 460.90115000000003, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "Footnote", "bbox": {"l": 358.63901, "t": 186.37554999999998, "r": 391.14221, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "71", "bbox": {"l": 426.52399, "t": 186.37554999999998, "r": 434.86273, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "84", "bbox": {"l": 452.56240999999994, "t": 186.37554999999998, "r": 460.90115000000003, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "Formula", "bbox": {"l": 358.63901, "t": 197.33452999999997, "r": 389.15167, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "60", "bbox": {"l": 426.52399, "t": 197.33452999999997, "r": 434.86273, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "66", "bbox": {"l": 452.56240999999994, "t": 197.33452999999997, "r": 460.90115000000003, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "List-item", "bbox": {"l": 358.63901, "t": 208.29351999999994, "r": 391.5188, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "81", "bbox": {"l": 426.52399, "t": 208.29351999999994, "r": 434.86273, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "88", "bbox": {"l": 452.56240999999994, "t": 208.29351999999994, "r": 460.90115000000003, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "82", "bbox": {"l": 478.59399, "t": 208.29351999999994, "r": 486.93274, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "88", "bbox": {"l": 504.6324200000001, "t": 208.29351999999994, "r": 512.97119, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "Page-footer", "bbox": {"l": 358.63901, "t": 219.25256000000002, "r": 401.16666, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "62", "bbox": {"l": 426.52399, "t": 219.25256000000002, "r": 434.86273, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "89", "bbox": {"l": 452.56240999999994, "t": 219.25256000000002, "r": 460.90115000000003, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "Page-header", "bbox": {"l": 358.63901, "t": 230.21155, "r": 403.91931, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "72", "bbox": {"l": 426.52399, "t": 230.21155, "r": 434.86273, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "90", "bbox": {"l": 452.56240999999994, "t": 230.21155, "r": 460.90115000000003, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "Picture", "bbox": {"l": 358.63901, "t": 241.16956000000005, "r": 384.62366, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "72", "bbox": {"l": 426.52399, "t": 241.16956000000005, "r": 434.86273, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "82", "bbox": {"l": 452.56240999999994, "t": 241.16956000000005, "r": 460.90115000000003, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "72", "bbox": {"l": 478.59399, "t": 241.16956000000005, "r": 486.93274, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "82", "bbox": {"l": 504.6324200000001, "t": 241.16956000000005, "r": 512.97119, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "Section-header", "bbox": {"l": 358.63901, "t": 252.12854000000004, "r": 413.37891, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "68", "bbox": {"l": 426.52399, "t": 252.12854000000004, "r": 434.86273, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "83", "bbox": {"l": 452.56240999999994, "t": 252.12854000000004, "r": 460.90115000000003, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "69", "bbox": {"l": 478.59399, "t": 252.12854000000004, "r": 486.93274, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "83", "bbox": {"l": 504.6324200000001, "t": 252.12854000000004, "r": 512.97119, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "Table", "bbox": {"l": 358.63901, "t": 263.08752000000004, "r": 378.44577, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "82", "bbox": {"l": 426.52399, "t": 263.08752000000004, "r": 434.86273, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "89", "bbox": {"l": 452.56240999999994, "t": 263.08752000000004, "r": 460.90115000000003, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "82", "bbox": {"l": 478.59399, "t": 263.08752000000004, "r": 486.93274, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "90", "bbox": {"l": 504.6324200000001, "t": 263.08752000000004, "r": 512.97119, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "Text", "bbox": {"l": 358.63901, "t": 274.04657, "r": 374.59921, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "85", "bbox": {"l": 426.52399, "t": 274.04657, "r": 434.86273, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "91", "bbox": {"l": 452.56240999999994, "t": 274.04657, "r": 460.90115000000003, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "84", "bbox": {"l": 478.59399, "t": 274.04657, "r": 486.93274, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "90", "bbox": {"l": 504.6324200000001, "t": 274.04657, "r": 512.97119, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "Title", "bbox": {"l": 358.63901, "t": 285.00552, "r": 375.63034, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "77", "bbox": {"l": 426.52399, "t": 285.00552, "r": 434.86273, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "81", "bbox": {"l": 452.56240999999994, "t": 285.00552, "r": 460.90115000000003, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "All", "bbox": {"l": 358.63901, "t": 296.36255, "r": 369.60492, "b": 304.73718, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "72", "bbox": {"l": 426.52399, "t": 296.36255, "r": 434.86273, "b": 304.73718, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "84", "bbox": {"l": 452.56240999999994, "t": 296.36255, "r": 460.90115000000003, "b": 304.73718, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "78", "bbox": {"l": 478.59399, "t": 296.36255, "r": 486.93274, "b": 304.73718, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "87", "bbox": {"l": 504.6324200000001, "t": 296.36255, "r": 512.97119, "b": 304.73718, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "lists in PubLayNet (grouped list-items) versus DocLayNet (separate", "bbox": {"l": 317.95499, "t": 331.40353, "r": 558.20233, "b": 339.77817, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "list-items), the label set of size 4 is the closest to PubLayNet, in the", "bbox": {"l": 317.95499, "t": 342.36255, "r": 558.2005, "b": 350.73718, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "assumption that the", "bbox": {"l": 317.95499, "t": 353.32153, "r": 393.16028, "b": 361.69617000000005, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "List", "bbox": {"l": 395.84201, "t": 353.36639, "r": 409.14905, "b": 361.70514, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "is down-mapped to", "bbox": {"l": 412.33301, "t": 353.32153, "r": 485.02324999999996, "b": 361.69617000000005, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "Text", "bbox": {"l": 487.70401, "t": 353.36639, "r": 502.86761, "b": 361.70514, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "in PubLayNet.", "bbox": {"l": 506.05499, "t": 353.32153, "r": 559.58496, "b": 361.69617000000005, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "The results in Table 3 show that the prediction accuracy on the", "bbox": {"l": 317.686, "t": 364.28054999999995, "r": 558.2002, "b": 372.65518, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "remaining class labels does not change significantly when other", "bbox": {"l": 317.95499, "t": 375.23853, "r": 558.36877, "b": 383.61316, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "classes are merged into them. The overall macro-average improves", "bbox": {"l": 317.95499, "t": 386.19754, "r": 558.19958, "b": 394.57217, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "by around 5%, in particular when", "bbox": {"l": 317.95499, "t": 397.15652, "r": 439.49454, "b": 405.53116000000006, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "Page-footer", "bbox": {"l": 441.728, "t": 397.20139, "r": 481.8616, "b": 405.54013, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "and", "bbox": {"l": 484.74298, "t": 397.15652, "r": 498.23743, "b": 405.53116000000006, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "Page-header", "bbox": {"l": 500.47299, "t": 397.20139, "r": 543.95105, "b": 405.54013, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": "are", "bbox": {"l": 546.83197, "t": 397.15652, "r": 558.20142, "b": 405.53116000000006, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "excluded.", "bbox": {"l": 317.95496, "t": 408.11553999999995, "r": 352.37698, "b": 416.49017, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "Impact of Document Split in Train and Test Set", "bbox": {"l": 317.95496, "t": 429.3949, "r": 549.8606, "b": 439.70398, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": "Many documents in DocLayNet have a unique styling. In order", "bbox": {"l": 317.95499, "t": 444.59653, "r": 558.36884, "b": 452.97116, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "to avoid overfitting on a particular style, we have split the train-,", "bbox": {"l": 317.95499, "t": 455.55554, "r": 559.19189, "b": 463.93018, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "test- and validation-sets of DocLayNet on document boundaries, i.e.", "bbox": {"l": 317.95499, "t": 466.51453, "r": 559.58185, "b": 474.88916, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "every document contributes pages to only one set. To the best of", "bbox": {"l": 317.95499, "t": 477.47354, "r": 558.20605, "b": 485.84818, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": "our knowledge, this was not considered in PubLayNet or DocBank.", "bbox": {"l": 317.95499, "t": 488.43253, "r": 559.58203, "b": 496.80716, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "To quantify how this affects model performance, we trained and", "bbox": {"l": 317.686, "t": 499.39154, "r": 558.20032, "b": 507.76617, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "evaluated a Mask R-CNN R50 model on a modified dataset version.", "bbox": {"l": 317.95499, "t": 510.35052, "r": 559.5849, "b": 518.72516, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "Here, the train-, test- and validation-sets were obtained by a ran-", "bbox": {"l": 317.95499, "t": 521.30954, "r": 559.71381, "b": 529.68417, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "domised draw over the individual pages. As can be seen in Table 4,", "bbox": {"l": 317.95499, "t": 532.26855, "r": 559.18707, "b": 540.64317, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "the difference in model performance is surprisingly large: page-", "bbox": {"l": 317.95499, "t": 543.22655, "r": 559.71313, "b": 551.60117, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "wise splitting gains", "bbox": {"l": 317.62299, "t": 554.18555, "r": 388.35168, "b": 562.56017, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "\u02dc", "bbox": {"l": 391.36499, "t": 552.50055, "r": 393.98318, "b": 560.87517, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "10% in mAP over the document-wise splitting.", "bbox": {"l": 390.59, "t": 554.18555, "r": 559.58191, "b": 562.56017, "coord_origin": "TOPLEFT"}}, {"id": 201, "text": "Thus, random page-wise splitting of DocLayNet can easily lead", "bbox": {"l": 317.686, "t": 565.14455, "r": 558.20032, "b": 573.51917, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": "to accidental overestimation of model performance and should be", "bbox": {"l": 317.95499, "t": 576.10356, "r": 558.20508, "b": 584.4781800000001, "coord_origin": "TOPLEFT"}}, {"id": 203, "text": "avoided.", "bbox": {"l": 317.95499, "t": 587.06256, "r": 348.50354, "b": 595.43718, "coord_origin": "TOPLEFT"}}, {"id": 204, "text": "Dataset Comparison", "bbox": {"l": 317.95499, "t": 608.34192, "r": 418.54776, "b": 618.65102, "coord_origin": "TOPLEFT"}}, {"id": 205, "text": "Throughout this paper, we claim that DocLayNet\u2019s wider variety of", "bbox": {"l": 317.686, "t": 623.54355, "r": 558.20575, "b": 631.91817, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": "document layouts leads to more robust layout detection models. In", "bbox": {"l": 317.95499, "t": 634.50255, "r": 558.20624, "b": 642.87717, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": "Table 5, we provide evidence for that. We trained models on each", "bbox": {"l": 317.686, "t": 645.46155, "r": 558.20319, "b": 653.83617, "coord_origin": "TOPLEFT"}}, {"id": 208, "text": "of the available datasets (PubLayNet, DocBank and DocLayNet)", "bbox": {"l": 317.95499, "t": 656.42055, "r": 558.74377, "b": 664.79517, "coord_origin": "TOPLEFT"}}, {"id": 209, "text": "and evaluated them on the test sets of the other datasets. Due to", "bbox": {"l": 317.95499, "t": 667.37955, "r": 558.20398, "b": 675.7541699999999, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": "the different label sets and annotation styles, a direct comparison", "bbox": {"l": 317.95499, "t": 678.3385499999999, "r": 558.20062, "b": 686.71317, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "is not possible. Hence, we focussed on the common labels among", "bbox": {"l": 317.95499, "t": 689.29755, "r": 558.20343, "b": 697.672173, "coord_origin": "TOPLEFT"}}, {"id": 212, "text": "the datasets. Between PubLayNet and DocLayNet, these are", "bbox": {"l": 317.95499, "t": 700.256554, "r": 531.07666, "b": 708.631172, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "Picture", "bbox": {"l": 533.16199, "t": 700.301384, "r": 557.2561, "b": 708.640137, "coord_origin": "TOPLEFT"}}, {"id": 214, "text": ",", "bbox": {"l": 557.255, "t": 700.256554, "r": 559.18817, "b": 708.631172, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 12, "label": "page_header", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.9316117763519287, "cells": [{"id": 0, "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "page_header", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.9318180084228516, "cells": [{"id": 1, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 53.501999, "t": 86.87292000000002, "r": 295.64865, "b": 128.22313999999994, "coord_origin": "TOPLEFT"}, "confidence": 0.8296932578086853, "cells": [{"id": 2, "text": "Table 3: Performance of a Mask R-CNN R50 network in", "bbox": {"l": 53.501999, "t": 86.87292000000002, "r": 294.0437, "b": 95.34618999999998, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "mAP@0.5-0.95 scores trained on DocLayNet with different", "bbox": {"l": 53.79800000000001, "t": 97.83191, "r": 294.04376, "b": 106.30517999999995, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "class label sets. The reduced label sets were obtained by ei-", "bbox": {"l": 53.79800000000001, "t": 108.79088999999999, "r": 295.64865, "b": 117.26415999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "ther down-mapping or dropping labels.", "bbox": {"l": 53.79800000000001, "t": 119.74987999999996, "r": 213.23856, "b": 128.22313999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "table", "bbox": {"l": 80.35525512695312, "t": 150.93629455566406, "r": 267.0082092285156, "b": 295.4454650878906, "coord_origin": "TOPLEFT"}, "confidence": 0.9869412779808044, "cells": [{"id": 6, "text": "Class-count", "bbox": {"l": 86.372002, "t": 153.10051999999996, "r": 129.46452, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "11", "bbox": {"l": 151.07401, "t": 153.10051999999996, "r": 159.41275, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "6", "bbox": {"l": 179.31816, "t": 153.10051999999996, "r": 183.48753, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "5", "bbox": {"l": 213.33669, "t": 153.10051999999996, "r": 217.50606, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "4", "bbox": {"l": 247.35521, "t": 153.10051999999996, "r": 251.52458, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Caption", "bbox": {"l": 86.372002, "t": 164.45752000000005, "r": 115.55763, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "68", "bbox": {"l": 151.07401, "t": 164.45752000000005, "r": 159.41275, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Text", "bbox": {"l": 173.42723, "t": 164.45752000000005, "r": 189.38742, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Text", "bbox": {"l": 207.44576, "t": 164.45752000000005, "r": 223.40594000000002, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Text", "bbox": {"l": 241.46428, "t": 164.45752000000005, "r": 257.42447, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Footnote", "bbox": {"l": 86.372002, "t": 175.41656, "r": 118.8752, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "71", "bbox": {"l": 151.07401, "t": 175.41656, "r": 159.41275, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Text", "bbox": {"l": 173.42723, "t": 175.41656, "r": 189.38742, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Text", "bbox": {"l": 207.44576, "t": 175.41656, "r": 223.40594000000002, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Text", "bbox": {"l": 241.46428, "t": 175.41656, "r": 257.42447, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Formula", "bbox": {"l": 86.372002, "t": 186.37554999999998, "r": 116.88466, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "60", "bbox": {"l": 151.07401, "t": 186.37554999999998, "r": 159.41275, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Text", "bbox": {"l": 173.42723, "t": 186.37554999999998, "r": 189.38742, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "Text", "bbox": {"l": 207.44576, "t": 186.37554999999998, "r": 223.40594000000002, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "Text", "bbox": {"l": 241.46428, "t": 186.37554999999998, "r": 257.42447, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "List-item", "bbox": {"l": 86.372002, "t": 197.33452999999997, "r": 119.25179, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "81", "bbox": {"l": 151.07401, "t": 197.33452999999997, "r": 159.41275, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Text", "bbox": {"l": 173.42723, "t": 197.33452999999997, "r": 189.38742, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "82", "bbox": {"l": 211.25647, "t": 197.33452999999997, "r": 219.59521, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Text", "bbox": {"l": 241.46426, "t": 197.33452999999997, "r": 257.42447, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Page-footer", "bbox": {"l": 86.372002, "t": 208.29351999999994, "r": 128.89964, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "62", "bbox": {"l": 151.07401, "t": 208.29351999999994, "r": 159.41275, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "62", "bbox": {"l": 177.23795, "t": 208.29351999999994, "r": 185.57669, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "-", "bbox": {"l": 213.91052, "t": 208.29351999999994, "r": 216.94116, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "-", "bbox": {"l": 247.92905000000002, "t": 208.29351999999994, "r": 250.95969, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Page-header", "bbox": {"l": 86.372002, "t": 219.25256000000002, "r": 131.65231, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "72", "bbox": {"l": 151.07401, "t": 219.25256000000002, "r": 159.41275, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "68", "bbox": {"l": 177.23795, "t": 219.25256000000002, "r": 185.57669, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "-", "bbox": {"l": 213.91052, "t": 219.25256000000002, "r": 216.94116, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "-", "bbox": {"l": 247.92905000000002, "t": 219.25256000000002, "r": 250.95969, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Picture", "bbox": {"l": 86.372002, "t": 230.21155, "r": 112.35663, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "72", "bbox": {"l": 151.07401, "t": 230.21155, "r": 159.41275, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "72", "bbox": {"l": 177.23795, "t": 230.21155, "r": 185.57669, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "72", "bbox": {"l": 211.25645, "t": 230.21155, "r": 219.5952, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "72", "bbox": {"l": 245.27496, "t": 230.21155, "r": 253.61371, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "Section-header", "bbox": {"l": 86.372002, "t": 241.16956000000005, "r": 141.11188, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "68", "bbox": {"l": 151.07401, "t": 241.16956000000005, "r": 159.41275, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "67", "bbox": {"l": 177.23795, "t": 241.16956000000005, "r": 185.57669, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "69", "bbox": {"l": 211.25645, "t": 241.16956000000005, "r": 219.5952, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "68", "bbox": {"l": 245.27496, "t": 241.16956000000005, "r": 253.61371, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Table", "bbox": {"l": 86.372002, "t": 252.12854000000004, "r": 106.17878, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "82", "bbox": {"l": 151.07401, "t": 252.12854000000004, "r": 159.41275, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "83", "bbox": {"l": 177.23795, "t": 252.12854000000004, "r": 185.57669, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "82", "bbox": {"l": 211.25645, "t": 252.12854000000004, "r": 219.5952, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "82", "bbox": {"l": 245.27496, "t": 252.12854000000004, "r": 253.61371, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Text", "bbox": {"l": 86.372002, "t": 263.08752000000004, "r": 102.3322, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "85", "bbox": {"l": 151.07401, "t": 263.08752000000004, "r": 159.41275, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "84", "bbox": {"l": 177.23795, "t": 263.08752000000004, "r": 185.57669, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "84", "bbox": {"l": 211.25645, "t": 263.08752000000004, "r": 219.5952, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "84", "bbox": {"l": 245.27496, "t": 263.08752000000004, "r": 253.61371, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "Title", "bbox": {"l": 86.372002, "t": 274.04657, "r": 103.36333, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "77", "bbox": {"l": 151.07401, "t": 274.04657, "r": 159.41275, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "Sec.-h.", "bbox": {"l": 169.37442, "t": 274.04657, "r": 193.43127, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "Sec.-h.", "bbox": {"l": 203.39294, "t": 274.04657, "r": 227.4498, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "Sec.-h.", "bbox": {"l": 237.41147, "t": 274.04657, "r": 261.46832, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "Overall", "bbox": {"l": 86.372002, "t": 285.40454, "r": 113.31602000000001, "b": 293.77917, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "72", "bbox": {"l": 151.07401, "t": 285.40454, "r": 159.41275, "b": 293.77917, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "73", "bbox": {"l": 177.23795, "t": 285.40454, "r": 185.57669, "b": 293.77917, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "78", "bbox": {"l": 211.25645, "t": 285.40454, "r": 219.5952, "b": 293.77917, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "77", "bbox": {"l": 245.27496, "t": 285.40454, "r": 253.61371, "b": 293.77917, "coord_origin": "TOPLEFT"}}], "children": [{"id": 15, "label": "text", "bbox": {"l": 86.372002, "t": 153.10051999999996, "r": 129.46452, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": "Class-count", "bbox": {"l": 86.372002, "t": 153.10051999999996, "r": 129.46452, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 151.07401, "t": 153.10051999999996, "r": 159.41275, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "11", "bbox": {"l": 151.07401, "t": 153.10051999999996, "r": 159.41275, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 179.31816, "t": 153.10051999999996, "r": 183.48753, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "6", "bbox": {"l": 179.31816, "t": 153.10051999999996, "r": 183.48753, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 213.33669, "t": 153.10051999999996, "r": 217.50606, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "5", "bbox": {"l": 213.33669, "t": 153.10051999999996, "r": 217.50606, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 247.35521, "t": 153.10051999999996, "r": 251.52458, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "4", "bbox": {"l": 247.35521, "t": 153.10051999999996, "r": 251.52458, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 86.372002, "t": 164.45752000000005, "r": 115.55763, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "Caption", "bbox": {"l": 86.372002, "t": 164.45752000000005, "r": 115.55763, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 151.07401, "t": 164.45752000000005, "r": 159.41275, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "68", "bbox": {"l": 151.07401, "t": 164.45752000000005, "r": 159.41275, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 173.42723, "t": 164.45752000000005, "r": 189.38742, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "Text", "bbox": {"l": 173.42723, "t": 164.45752000000005, "r": 189.38742, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 207.44576, "t": 164.45752000000005, "r": 223.40594000000002, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "Text", "bbox": {"l": 207.44576, "t": 164.45752000000005, "r": 223.40594000000002, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 241.46428, "t": 164.45752000000005, "r": 257.42447, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "Text", "bbox": {"l": 241.46428, "t": 164.45752000000005, "r": 257.42447, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 86.372002, "t": 175.41656, "r": 118.8752, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "Footnote", "bbox": {"l": 86.372002, "t": 175.41656, "r": 118.8752, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 151.07401, "t": 175.41656, "r": 159.41275, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "71", "bbox": {"l": 151.07401, "t": 175.41656, "r": 159.41275, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 173.42723, "t": 175.41656, "r": 189.38742, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "Text", "bbox": {"l": 173.42723, "t": 175.41656, "r": 189.38742, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 207.44576, "t": 175.41656, "r": 223.40594000000002, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "Text", "bbox": {"l": 207.44576, "t": 175.41656, "r": 223.40594000000002, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 241.46428, "t": 175.41656, "r": 257.42447, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "Text", "bbox": {"l": 241.46428, "t": 175.41656, "r": 257.42447, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 86.372002, "t": 186.37554999999998, "r": 116.88466, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "Formula", "bbox": {"l": 86.372002, "t": 186.37554999999998, "r": 116.88466, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 151.07401, "t": 186.37554999999998, "r": 159.41275, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "60", "bbox": {"l": 151.07401, "t": 186.37554999999998, "r": 159.41275, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 173.42723, "t": 186.37554999999998, "r": 189.38742, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "Text", "bbox": {"l": 173.42723, "t": 186.37554999999998, "r": 189.38742, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 207.44576, "t": 186.37554999999998, "r": 223.40594000000002, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "Text", "bbox": {"l": 207.44576, "t": 186.37554999999998, "r": 223.40594000000002, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 241.46428, "t": 186.37554999999998, "r": 257.42447, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "Text", "bbox": {"l": 241.46428, "t": 186.37554999999998, "r": 257.42447, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 86.372002, "t": 197.33452999999997, "r": 119.25179, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "List-item", "bbox": {"l": 86.372002, "t": 197.33452999999997, "r": 119.25179, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 151.07401, "t": 197.33452999999997, "r": 159.41275, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "81", "bbox": {"l": 151.07401, "t": 197.33452999999997, "r": 159.41275, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 173.42723, "t": 197.33452999999997, "r": 189.38742, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "Text", "bbox": {"l": 173.42723, "t": 197.33452999999997, "r": 189.38742, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 211.25647, "t": 197.33452999999997, "r": 219.59521, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "82", "bbox": {"l": 211.25647, "t": 197.33452999999997, "r": 219.59521, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 241.46426, "t": 197.33452999999997, "r": 257.42447, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "Text", "bbox": {"l": 241.46426, "t": 197.33452999999997, "r": 257.42447, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 86.372002, "t": 208.29351999999994, "r": 128.89964, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "Page-footer", "bbox": {"l": 86.372002, "t": 208.29351999999994, "r": 128.89964, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 151.07401, "t": 208.29351999999994, "r": 159.41275, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "62", "bbox": {"l": 151.07401, "t": 208.29351999999994, "r": 159.41275, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 177.23795, "t": 208.29351999999994, "r": 185.57669, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "62", "bbox": {"l": 177.23795, "t": 208.29351999999994, "r": 185.57669, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 213.91052, "t": 208.29351999999994, "r": 216.94116, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "-", "bbox": {"l": 213.91052, "t": 208.29351999999994, "r": 216.94116, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 247.92905000000002, "t": 208.29351999999994, "r": 250.95969, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "-", "bbox": {"l": 247.92905000000002, "t": 208.29351999999994, "r": 250.95969, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 86.372002, "t": 219.25256000000002, "r": 131.65231, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "Page-header", "bbox": {"l": 86.372002, "t": 219.25256000000002, "r": 131.65231, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 151.07401, "t": 219.25256000000002, "r": 159.41275, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "72", "bbox": {"l": 151.07401, "t": 219.25256000000002, "r": 159.41275, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 177.23795, "t": 219.25256000000002, "r": 185.57669, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "68", "bbox": {"l": 177.23795, "t": 219.25256000000002, "r": 185.57669, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 213.91052, "t": 219.25256000000002, "r": 216.94116, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "-", "bbox": {"l": 213.91052, "t": 219.25256000000002, "r": 216.94116, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 247.92905000000002, "t": 219.25256000000002, "r": 250.95969, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "-", "bbox": {"l": 247.92905000000002, "t": 219.25256000000002, "r": 250.95969, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 86.372002, "t": 230.21155, "r": 112.35663, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "Picture", "bbox": {"l": 86.372002, "t": 230.21155, "r": 112.35663, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 151.07401, "t": 230.21155, "r": 159.41275, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "72", "bbox": {"l": 151.07401, "t": 230.21155, "r": 159.41275, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 177.23795, "t": 230.21155, "r": 185.57669, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "72", "bbox": {"l": 177.23795, "t": 230.21155, "r": 185.57669, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 211.25645, "t": 230.21155, "r": 219.5952, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "72", "bbox": {"l": 211.25645, "t": 230.21155, "r": 219.5952, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 245.27496, "t": 230.21155, "r": 253.61371, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "72", "bbox": {"l": 245.27496, "t": 230.21155, "r": 253.61371, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 86.372002, "t": 241.16956000000005, "r": 141.11188, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "Section-header", "bbox": {"l": 86.372002, "t": 241.16956000000005, "r": 141.11188, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 151.07401, "t": 241.16956000000005, "r": 159.41275, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "68", "bbox": {"l": 151.07401, "t": 241.16956000000005, "r": 159.41275, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 177.23795, "t": 241.16956000000005, "r": 185.57669, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "67", "bbox": {"l": 177.23795, "t": 241.16956000000005, "r": 185.57669, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 211.25645, "t": 241.16956000000005, "r": 219.5952, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "69", "bbox": {"l": 211.25645, "t": 241.16956000000005, "r": 219.5952, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 245.27496, "t": 241.16956000000005, "r": 253.61371, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "68", "bbox": {"l": 245.27496, "t": 241.16956000000005, "r": 253.61371, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 86.372002, "t": 252.12854000000004, "r": 106.17878, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "Table", "bbox": {"l": 86.372002, "t": 252.12854000000004, "r": 106.17878, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 151.07401, "t": 252.12854000000004, "r": 159.41275, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "82", "bbox": {"l": 151.07401, "t": 252.12854000000004, "r": 159.41275, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 177.23795, "t": 252.12854000000004, "r": 185.57669, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "83", "bbox": {"l": 177.23795, "t": 252.12854000000004, "r": 185.57669, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 211.25645, "t": 252.12854000000004, "r": 219.5952, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "82", "bbox": {"l": 211.25645, "t": 252.12854000000004, "r": 219.5952, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 245.27496, "t": 252.12854000000004, "r": 253.61371, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "82", "bbox": {"l": 245.27496, "t": 252.12854000000004, "r": 253.61371, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 86.372002, "t": 263.08752000000004, "r": 102.3322, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "Text", "bbox": {"l": 86.372002, "t": 263.08752000000004, "r": 102.3322, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 151.07401, "t": 263.08752000000004, "r": 159.41275, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "85", "bbox": {"l": 151.07401, "t": 263.08752000000004, "r": 159.41275, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 177.23795, "t": 263.08752000000004, "r": 185.57669, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "84", "bbox": {"l": 177.23795, "t": 263.08752000000004, "r": 185.57669, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 211.25645, "t": 263.08752000000004, "r": 219.5952, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "84", "bbox": {"l": 211.25645, "t": 263.08752000000004, "r": 219.5952, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 245.27496, "t": 263.08752000000004, "r": 253.61371, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "84", "bbox": {"l": 245.27496, "t": 263.08752000000004, "r": 253.61371, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 86.372002, "t": 274.04657, "r": 103.36333, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "Title", "bbox": {"l": 86.372002, "t": 274.04657, "r": 103.36333, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 151.07401, "t": 274.04657, "r": 159.41275, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "77", "bbox": {"l": 151.07401, "t": 274.04657, "r": 159.41275, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 169.37442, "t": 274.04657, "r": 193.43127, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "Sec.-h.", "bbox": {"l": 169.37442, "t": 274.04657, "r": 193.43127, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 203.39294, "t": 274.04657, "r": 227.4498, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "Sec.-h.", "bbox": {"l": 203.39294, "t": 274.04657, "r": 227.4498, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 237.41147, "t": 274.04657, "r": 261.46832, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "Sec.-h.", "bbox": {"l": 237.41147, "t": 274.04657, "r": 261.46832, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 86.372002, "t": 285.40454, "r": 113.31602000000001, "b": 293.77917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "Overall", "bbox": {"l": 86.372002, "t": 285.40454, "r": 113.31602000000001, "b": 293.77917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 151.07401, "t": 285.40454, "r": 159.41275, "b": 293.77917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "72", "bbox": {"l": 151.07401, "t": 285.40454, "r": 159.41275, "b": 293.77917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 177.23795, "t": 285.40454, "r": 185.57669, "b": 293.77917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "73", "bbox": {"l": 177.23795, "t": 285.40454, "r": 185.57669, "b": 293.77917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 211.25645, "t": 285.40454, "r": 219.5952, "b": 293.77917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "78", "bbox": {"l": 211.25645, "t": 285.40454, "r": 219.5952, "b": 293.77917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 245.27496, "t": 285.40454, "r": 253.61371, "b": 293.77917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "77", "bbox": {"l": 245.27496, "t": 285.40454, "r": 253.61371, "b": 293.77917, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 10, "label": "section_header", "bbox": {"l": 53.79800000000001, "t": 319.56992, "r": 131.05624, "b": 329.879, "coord_origin": "TOPLEFT"}, "confidence": 0.9555687308311462, "cells": [{"id": 71, "text": "Learning Curve", "bbox": {"l": 53.79800000000001, "t": 319.56992, "r": 131.05624, "b": 329.879, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "text", "bbox": {"l": 52.785, "t": 334.77155, "r": 295.55835, "b": 529.44818, "coord_origin": "TOPLEFT"}, "confidence": 0.9857739210128784, "cells": [{"id": 72, "text": "One of the fundamental questions related to any dataset is if it is", "bbox": {"l": 53.79800000000001, "t": 334.77155, "r": 294.04153, "b": 343.14618, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "\u201clarge enough\u201d. To answer this question for DocLayNet, we per-", "bbox": {"l": 52.785, "t": 345.73053, "r": 295.55835, "b": 354.10516000000007, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "formed a data ablation study in which we evaluated a Mask R-CNN", "bbox": {"l": 53.79800000000001, "t": 356.6895400000001, "r": 294.04535, "b": 365.06418, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "model trained on increasing fractions of the DocLayNet dataset.", "bbox": {"l": 53.79800000000001, "t": 367.64853, "r": 295.4281, "b": 376.02316, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "As can be seen in Figure 5, the mAP score rises sharply in the be-", "bbox": {"l": 53.484001, "t": 378.60754, "r": 295.55667, "b": 386.98218, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "ginning and eventually levels out. To estimate the error-bar on the", "bbox": {"l": 53.79800000000001, "t": 389.56653, "r": 294.04865, "b": 397.94116, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "metrics, we ran the training five times on the entire data-set. This", "bbox": {"l": 53.79800000000001, "t": 400.52554000000003, "r": 294.04376, "b": 408.90018, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "resulted in a 1% error-bar, depicted by the shaded area in Figure 5.", "bbox": {"l": 53.79800000000001, "t": 411.48456, "r": 295.42459, "b": 419.85919, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "In the inset of Figure 5, we show the exact same data-points, but", "bbox": {"l": 53.79800000000001, "t": 422.44354, "r": 294.04709, "b": 430.81818, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "with a logarithmic scale on the x-axis. As is expected, the mAP", "bbox": {"l": 53.466999, "t": 433.40253000000007, "r": 294.04535, "b": 441.7771599999999, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "score increases linearly as a function of the data-size in the inset.", "bbox": {"l": 53.79800000000001, "t": 444.36053000000004, "r": 295.42902, "b": 452.73517, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "The curve ultimately flattens out between the 80% and 100% mark,", "bbox": {"l": 53.528999, "t": 455.31955, "r": 295.03122, "b": 463.69418, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "with the 80% mark falling within the error-bars of the 100% mark.", "bbox": {"l": 53.466999, "t": 466.27853, "r": 295.42154, "b": 474.65317, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "This provides a good indication that the model would not improve", "bbox": {"l": 53.528999, "t": 477.23755, "r": 294.04553, "b": 485.61218, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "significantly by yet increasing the data size. Rather, it would prob-", "bbox": {"l": 53.79800000000001, "t": 488.19653, "r": 295.55646, "b": 496.57117, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "ably benefit more from improved data consistency (as discussed", "bbox": {"l": 53.79800000000001, "t": 499.15555, "r": 294.04715, "b": 507.53018, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "in Section 3), data augmentation methods [23], or the addition of", "bbox": {"l": 53.79800000000001, "t": 510.11453, "r": 294.04245, "b": 518.4891700000001, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "more document categories and styles.", "bbox": {"l": 53.79800000000001, "t": 521.0735500000001, "r": 191.47707, "b": 529.44818, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "section_header", "bbox": {"l": 53.79800000000001, "t": 542.50992, "r": 164.32898, "b": 552.81902, "coord_origin": "TOPLEFT"}, "confidence": 0.9572024941444397, "cells": [{"id": 90, "text": "Impact of Class Labels", "bbox": {"l": 53.79800000000001, "t": 542.50992, "r": 164.32898, "b": 552.81902, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 53.466999, "t": 557.71155, "r": 295.55679, "b": 708.55217, "coord_origin": "TOPLEFT"}, "confidence": 0.9876301884651184, "cells": [{"id": 91, "text": "The choice and number of labels can have a significant effect on", "bbox": {"l": 53.528999, "t": 557.71155, "r": 294.04333, "b": 566.08617, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "the overall model performance. Since PubLayNet, DocBank and", "bbox": {"l": 53.79800000000001, "t": 568.6705499999999, "r": 294.04712, "b": 577.04517, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "DocLayNet all have different label sets, it is of particular interest to", "bbox": {"l": 53.79800000000001, "t": 579.62955, "r": 294.04538, "b": 588.0041699999999, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "understand and quantify this influence of the label set on the model", "bbox": {"l": 53.79800000000001, "t": 590.5885499999999, "r": 294.04535, "b": 598.96317, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "performance. We investigate this by either down-mapping labels", "bbox": {"l": 53.79800000000001, "t": 601.54755, "r": 294.04266, "b": 609.92216, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "into more common ones (e.g.", "bbox": {"l": 53.79800000000001, "t": 612.50656, "r": 163.59247, "b": 620.88118, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "Caption", "bbox": {"l": 166.26401, "t": 612.55139, "r": 194.97244, "b": 620.89015, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "\u2192", "bbox": {"l": 194.994, "t": 612.45276, "r": 204.1756, "b": 620.15491, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "Text", "bbox": {"l": 204.17599, "t": 612.55139, "r": 219.33961000000002, "b": 620.89015, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": ") or excluding them", "bbox": {"l": 219.849, "t": 612.50656, "r": 294.04828, "b": 620.88118, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "from the annotations entirely. Furthermore, it must be stressed", "bbox": {"l": 53.79800000000001, "t": 623.46556, "r": 294.04709, "b": 631.84018, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "that all mappings and exclusions were performed on the data be-", "bbox": {"l": 53.79800000000001, "t": 634.42355, "r": 295.55679, "b": 642.79817, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "fore model training. In Table 3, we present the mAP scores for a", "bbox": {"l": 53.79800000000001, "t": 645.38255, "r": 294.04715, "b": 653.75717, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "Mask R-CNN R50 network on different label sets. Where a label", "bbox": {"l": 53.79800000000001, "t": 656.34155, "r": 294.04715, "b": 664.71617, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "is down-mapped, we show its corresponding label, otherwise it", "bbox": {"l": 53.79800000000001, "t": 667.30055, "r": 294.04712, "b": 675.67517, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "was excluded. We present three different label sets, with 6, 5 and 4", "bbox": {"l": 53.466999, "t": 678.25955, "r": 294.25174, "b": 686.63417, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "different labels respectively. The set of 5 labels contains the same", "bbox": {"l": 53.79800000000001, "t": 689.21855, "r": 294.04639, "b": 697.59317, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "labels as PubLayNet. However, due to the different definition of", "bbox": {"l": 53.79800000000001, "t": 700.177551, "r": 294.04712, "b": 708.55217, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 317.659, "t": 86.87298999999996, "r": 559.80682, "b": 128.22321, "coord_origin": "TOPLEFT"}, "confidence": 0.87362140417099, "cells": [{"id": 109, "text": "Table 4: Performance of a Mask R-CNN R50 network with", "bbox": {"l": 317.659, "t": 86.87298999999996, "r": 558.20068, "b": 95.34625000000017, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "document-wise and page-wise split for different label sets.", "bbox": {"l": 317.95499, "t": 97.83196999999996, "r": 559.73401, "b": 106.30524000000003, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "Naive page-wise split will result in", "bbox": {"l": 317.95499, "t": 108.79094999999995, "r": 467.72089, "b": 117.26422000000014, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "GLYPH<tildelow>", "bbox": {"l": 471.90900000000005, "t": 107.12798999999995, "r": 477.53900000000004, "b": 115.19768999999997, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "10% point improve-", "bbox": {"l": 477.54001000000005, "t": 108.79094999999995, "r": 559.80682, "b": 117.26422000000014, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "ment.", "bbox": {"l": 317.95502, "t": 119.74993999999992, "r": 341.37524, "b": 128.22321, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "table", "bbox": {"l": 352.97747802734375, "t": 150.79122924804688, "r": 522.9158935546875, "b": 306.265869140625, "coord_origin": "TOPLEFT"}, "confidence": 0.9879695177078247, "cells": [{"id": 115, "text": "Class-count", "bbox": {"l": 358.63901, "t": 153.10051999999996, "r": 401.73154, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "11", "bbox": {"l": 440.22501, "t": 153.10051999999996, "r": 448.56375, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "5", "bbox": {"l": 494.38, "t": 153.10051999999996, "r": 498.54938, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "Split", "bbox": {"l": 358.63901, "t": 164.05951000000005, "r": 375.27167, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "Doc", "bbox": {"l": 423.341, "t": 164.05951000000005, "r": 438.0459, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "Page", "bbox": {"l": 448.00757, "t": 164.05951000000005, "r": 465.4472, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "Doc", "bbox": {"l": 475.41101, "t": 164.05951000000005, "r": 490.11591, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Page", "bbox": {"l": 500.07757999999995, "t": 164.05951000000005, "r": 517.51721, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "Caption", "bbox": {"l": 358.63901, "t": 175.41656, "r": 387.82465, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "68", "bbox": {"l": 426.52399, "t": 175.41656, "r": 434.86273, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "83", "bbox": {"l": 452.56240999999994, "t": 175.41656, "r": 460.90115000000003, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "Footnote", "bbox": {"l": 358.63901, "t": 186.37554999999998, "r": 391.14221, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "71", "bbox": {"l": 426.52399, "t": 186.37554999999998, "r": 434.86273, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "84", "bbox": {"l": 452.56240999999994, "t": 186.37554999999998, "r": 460.90115000000003, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "Formula", "bbox": {"l": 358.63901, "t": 197.33452999999997, "r": 389.15167, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "60", "bbox": {"l": 426.52399, "t": 197.33452999999997, "r": 434.86273, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "66", "bbox": {"l": 452.56240999999994, "t": 197.33452999999997, "r": 460.90115000000003, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "List-item", "bbox": {"l": 358.63901, "t": 208.29351999999994, "r": 391.5188, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "81", "bbox": {"l": 426.52399, "t": 208.29351999999994, "r": 434.86273, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "88", "bbox": {"l": 452.56240999999994, "t": 208.29351999999994, "r": 460.90115000000003, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "82", "bbox": {"l": 478.59399, "t": 208.29351999999994, "r": 486.93274, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "88", "bbox": {"l": 504.6324200000001, "t": 208.29351999999994, "r": 512.97119, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "Page-footer", "bbox": {"l": 358.63901, "t": 219.25256000000002, "r": 401.16666, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "62", "bbox": {"l": 426.52399, "t": 219.25256000000002, "r": 434.86273, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "89", "bbox": {"l": 452.56240999999994, "t": 219.25256000000002, "r": 460.90115000000003, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "Page-header", "bbox": {"l": 358.63901, "t": 230.21155, "r": 403.91931, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "72", "bbox": {"l": 426.52399, "t": 230.21155, "r": 434.86273, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "90", "bbox": {"l": 452.56240999999994, "t": 230.21155, "r": 460.90115000000003, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "Picture", "bbox": {"l": 358.63901, "t": 241.16956000000005, "r": 384.62366, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "72", "bbox": {"l": 426.52399, "t": 241.16956000000005, "r": 434.86273, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "82", "bbox": {"l": 452.56240999999994, "t": 241.16956000000005, "r": 460.90115000000003, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "72", "bbox": {"l": 478.59399, "t": 241.16956000000005, "r": 486.93274, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "82", "bbox": {"l": 504.6324200000001, "t": 241.16956000000005, "r": 512.97119, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "Section-header", "bbox": {"l": 358.63901, "t": 252.12854000000004, "r": 413.37891, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "68", "bbox": {"l": 426.52399, "t": 252.12854000000004, "r": 434.86273, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "83", "bbox": {"l": 452.56240999999994, "t": 252.12854000000004, "r": 460.90115000000003, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "69", "bbox": {"l": 478.59399, "t": 252.12854000000004, "r": 486.93274, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "83", "bbox": {"l": 504.6324200000001, "t": 252.12854000000004, "r": 512.97119, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "Table", "bbox": {"l": 358.63901, "t": 263.08752000000004, "r": 378.44577, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "82", "bbox": {"l": 426.52399, "t": 263.08752000000004, "r": 434.86273, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "89", "bbox": {"l": 452.56240999999994, "t": 263.08752000000004, "r": 460.90115000000003, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "82", "bbox": {"l": 478.59399, "t": 263.08752000000004, "r": 486.93274, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "90", "bbox": {"l": 504.6324200000001, "t": 263.08752000000004, "r": 512.97119, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "Text", "bbox": {"l": 358.63901, "t": 274.04657, "r": 374.59921, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "85", "bbox": {"l": 426.52399, "t": 274.04657, "r": 434.86273, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "91", "bbox": {"l": 452.56240999999994, "t": 274.04657, "r": 460.90115000000003, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "84", "bbox": {"l": 478.59399, "t": 274.04657, "r": 486.93274, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "90", "bbox": {"l": 504.6324200000001, "t": 274.04657, "r": 512.97119, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "Title", "bbox": {"l": 358.63901, "t": 285.00552, "r": 375.63034, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "77", "bbox": {"l": 426.52399, "t": 285.00552, "r": 434.86273, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "81", "bbox": {"l": 452.56240999999994, "t": 285.00552, "r": 460.90115000000003, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "All", "bbox": {"l": 358.63901, "t": 296.36255, "r": 369.60492, "b": 304.73718, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "72", "bbox": {"l": 426.52399, "t": 296.36255, "r": 434.86273, "b": 304.73718, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "84", "bbox": {"l": 452.56240999999994, "t": 296.36255, "r": 460.90115000000003, "b": 304.73718, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "78", "bbox": {"l": 478.59399, "t": 296.36255, "r": 486.93274, "b": 304.73718, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "87", "bbox": {"l": 504.6324200000001, "t": 296.36255, "r": 512.97119, "b": 304.73718, "coord_origin": "TOPLEFT"}}], "children": [{"id": 80, "label": "text", "bbox": {"l": 358.63901, "t": 153.10051999999996, "r": 401.73154, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 115, "text": "Class-count", "bbox": {"l": 358.63901, "t": 153.10051999999996, "r": 401.73154, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 440.22501, "t": 153.10051999999996, "r": 448.56375, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 116, "text": "11", "bbox": {"l": 440.22501, "t": 153.10051999999996, "r": 448.56375, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 494.38, "t": 153.10051999999996, "r": 498.54938, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 117, "text": "5", "bbox": {"l": 494.38, "t": 153.10051999999996, "r": 498.54938, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 358.63901, "t": 164.05951000000005, "r": 375.27167, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 118, "text": "Split", "bbox": {"l": 358.63901, "t": 164.05951000000005, "r": 375.27167, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 423.341, "t": 164.05951000000005, "r": 438.0459, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 119, "text": "Doc", "bbox": {"l": 423.341, "t": 164.05951000000005, "r": 438.0459, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 448.00757, "t": 164.05951000000005, "r": 465.4472, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 120, "text": "Page", "bbox": {"l": 448.00757, "t": 164.05951000000005, "r": 465.4472, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 475.41101, "t": 164.05951000000005, "r": 490.11591, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 121, "text": "Doc", "bbox": {"l": 475.41101, "t": 164.05951000000005, "r": 490.11591, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 500.07757999999995, "t": 164.05951000000005, "r": 517.51721, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 122, "text": "Page", "bbox": {"l": 500.07757999999995, "t": 164.05951000000005, "r": 517.51721, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 358.63901, "t": 175.41656, "r": 387.82465, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 123, "text": "Caption", "bbox": {"l": 358.63901, "t": 175.41656, "r": 387.82465, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 426.52399, "t": 175.41656, "r": 434.86273, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 124, "text": "68", "bbox": {"l": 426.52399, "t": 175.41656, "r": 434.86273, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 452.56240999999994, "t": 175.41656, "r": 460.90115000000003, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 125, "text": "83", "bbox": {"l": 452.56240999999994, "t": 175.41656, "r": 460.90115000000003, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 358.63901, "t": 186.37554999999998, "r": 391.14221, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 126, "text": "Footnote", "bbox": {"l": 358.63901, "t": 186.37554999999998, "r": 391.14221, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 426.52399, "t": 186.37554999999998, "r": 434.86273, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 127, "text": "71", "bbox": {"l": 426.52399, "t": 186.37554999999998, "r": 434.86273, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 452.56240999999994, "t": 186.37554999999998, "r": 460.90115000000003, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 128, "text": "84", "bbox": {"l": 452.56240999999994, "t": 186.37554999999998, "r": 460.90115000000003, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 358.63901, "t": 197.33452999999997, "r": 389.15167, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 129, "text": "Formula", "bbox": {"l": 358.63901, "t": 197.33452999999997, "r": 389.15167, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 426.52399, "t": 197.33452999999997, "r": 434.86273, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 130, "text": "60", "bbox": {"l": 426.52399, "t": 197.33452999999997, "r": 434.86273, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 452.56240999999994, "t": 197.33452999999997, "r": 460.90115000000003, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 131, "text": "66", "bbox": {"l": 452.56240999999994, "t": 197.33452999999997, "r": 460.90115000000003, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 358.63901, "t": 208.29351999999994, "r": 391.5188, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 132, "text": "List-item", "bbox": {"l": 358.63901, "t": 208.29351999999994, "r": 391.5188, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 426.52399, "t": 208.29351999999994, "r": 434.86273, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 133, "text": "81", "bbox": {"l": 426.52399, "t": 208.29351999999994, "r": 434.86273, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 452.56240999999994, "t": 208.29351999999994, "r": 460.90115000000003, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 134, "text": "88", "bbox": {"l": 452.56240999999994, "t": 208.29351999999994, "r": 460.90115000000003, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 478.59399, "t": 208.29351999999994, "r": 486.93274, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 135, "text": "82", "bbox": {"l": 478.59399, "t": 208.29351999999994, "r": 486.93274, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 504.6324200000001, "t": 208.29351999999994, "r": 512.97119, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 136, "text": "88", "bbox": {"l": 504.6324200000001, "t": 208.29351999999994, "r": 512.97119, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 358.63901, "t": 219.25256000000002, "r": 401.16666, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 137, "text": "Page-footer", "bbox": {"l": 358.63901, "t": 219.25256000000002, "r": 401.16666, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 426.52399, "t": 219.25256000000002, "r": 434.86273, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 138, "text": "62", "bbox": {"l": 426.52399, "t": 219.25256000000002, "r": 434.86273, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 452.56240999999994, "t": 219.25256000000002, "r": 460.90115000000003, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 139, "text": "89", "bbox": {"l": 452.56240999999994, "t": 219.25256000000002, "r": 460.90115000000003, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 358.63901, "t": 230.21155, "r": 403.91931, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 140, "text": "Page-header", "bbox": {"l": 358.63901, "t": 230.21155, "r": 403.91931, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 426.52399, "t": 230.21155, "r": 434.86273, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 141, "text": "72", "bbox": {"l": 426.52399, "t": 230.21155, "r": 434.86273, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 452.56240999999994, "t": 230.21155, "r": 460.90115000000003, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 142, "text": "90", "bbox": {"l": 452.56240999999994, "t": 230.21155, "r": 460.90115000000003, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 358.63901, "t": 241.16956000000005, "r": 384.62366, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 143, "text": "Picture", "bbox": {"l": 358.63901, "t": 241.16956000000005, "r": 384.62366, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 426.52399, "t": 241.16956000000005, "r": 434.86273, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 144, "text": "72", "bbox": {"l": 426.52399, "t": 241.16956000000005, "r": 434.86273, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 452.56240999999994, "t": 241.16956000000005, "r": 460.90115000000003, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 145, "text": "82", "bbox": {"l": 452.56240999999994, "t": 241.16956000000005, "r": 460.90115000000003, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 478.59399, "t": 241.16956000000005, "r": 486.93274, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 146, "text": "72", "bbox": {"l": 478.59399, "t": 241.16956000000005, "r": 486.93274, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 504.6324200000001, "t": 241.16956000000005, "r": 512.97119, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 147, "text": "82", "bbox": {"l": 504.6324200000001, "t": 241.16956000000005, "r": 512.97119, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 358.63901, "t": 252.12854000000004, "r": 413.37891, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 148, "text": "Section-header", "bbox": {"l": 358.63901, "t": 252.12854000000004, "r": 413.37891, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 114, "label": "text", "bbox": {"l": 426.52399, "t": 252.12854000000004, "r": 434.86273, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 149, "text": "68", "bbox": {"l": 426.52399, "t": 252.12854000000004, "r": 434.86273, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 115, "label": "text", "bbox": {"l": 452.56240999999994, "t": 252.12854000000004, "r": 460.90115000000003, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 150, "text": "83", "bbox": {"l": 452.56240999999994, "t": 252.12854000000004, "r": 460.90115000000003, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 116, "label": "text", "bbox": {"l": 478.59399, "t": 252.12854000000004, "r": 486.93274, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 151, "text": "69", "bbox": {"l": 478.59399, "t": 252.12854000000004, "r": 486.93274, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 117, "label": "text", "bbox": {"l": 504.6324200000001, "t": 252.12854000000004, "r": 512.97119, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 152, "text": "83", "bbox": {"l": 504.6324200000001, "t": 252.12854000000004, "r": 512.97119, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 118, "label": "text", "bbox": {"l": 358.63901, "t": 263.08752000000004, "r": 378.44577, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 153, "text": "Table", "bbox": {"l": 358.63901, "t": 263.08752000000004, "r": 378.44577, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 119, "label": "text", "bbox": {"l": 426.52399, "t": 263.08752000000004, "r": 434.86273, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 154, "text": "82", "bbox": {"l": 426.52399, "t": 263.08752000000004, "r": 434.86273, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 120, "label": "text", "bbox": {"l": 452.56240999999994, "t": 263.08752000000004, "r": 460.90115000000003, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 155, "text": "89", "bbox": {"l": 452.56240999999994, "t": 263.08752000000004, "r": 460.90115000000003, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 121, "label": "text", "bbox": {"l": 478.59399, "t": 263.08752000000004, "r": 486.93274, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 156, "text": "82", "bbox": {"l": 478.59399, "t": 263.08752000000004, "r": 486.93274, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 122, "label": "text", "bbox": {"l": 504.6324200000001, "t": 263.08752000000004, "r": 512.97119, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 157, "text": "90", "bbox": {"l": 504.6324200000001, "t": 263.08752000000004, "r": 512.97119, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 123, "label": "text", "bbox": {"l": 358.63901, "t": 274.04657, "r": 374.59921, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 158, "text": "Text", "bbox": {"l": 358.63901, "t": 274.04657, "r": 374.59921, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 124, "label": "text", "bbox": {"l": 426.52399, "t": 274.04657, "r": 434.86273, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 159, "text": "85", "bbox": {"l": 426.52399, "t": 274.04657, "r": 434.86273, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 125, "label": "text", "bbox": {"l": 452.56240999999994, "t": 274.04657, "r": 460.90115000000003, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 160, "text": "91", "bbox": {"l": 452.56240999999994, "t": 274.04657, "r": 460.90115000000003, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 126, "label": "text", "bbox": {"l": 478.59399, "t": 274.04657, "r": 486.93274, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 161, "text": "84", "bbox": {"l": 478.59399, "t": 274.04657, "r": 486.93274, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 127, "label": "text", "bbox": {"l": 504.6324200000001, "t": 274.04657, "r": 512.97119, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 162, "text": "90", "bbox": {"l": 504.6324200000001, "t": 274.04657, "r": 512.97119, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 128, "label": "text", "bbox": {"l": 358.63901, "t": 285.00552, "r": 375.63034, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 163, "text": "Title", "bbox": {"l": 358.63901, "t": 285.00552, "r": 375.63034, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 129, "label": "text", "bbox": {"l": 426.52399, "t": 285.00552, "r": 434.86273, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 164, "text": "77", "bbox": {"l": 426.52399, "t": 285.00552, "r": 434.86273, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 130, "label": "text", "bbox": {"l": 452.56240999999994, "t": 285.00552, "r": 460.90115000000003, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 165, "text": "81", "bbox": {"l": 452.56240999999994, "t": 285.00552, "r": 460.90115000000003, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 131, "label": "text", "bbox": {"l": 358.63901, "t": 296.36255, "r": 369.60492, "b": 304.73718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 166, "text": "All", "bbox": {"l": 358.63901, "t": 296.36255, "r": 369.60492, "b": 304.73718, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 132, "label": "text", "bbox": {"l": 426.52399, "t": 296.36255, "r": 434.86273, "b": 304.73718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 167, "text": "72", "bbox": {"l": 426.52399, "t": 296.36255, "r": 434.86273, "b": 304.73718, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 133, "label": "text", "bbox": {"l": 452.56240999999994, "t": 296.36255, "r": 460.90115000000003, "b": 304.73718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 168, "text": "84", "bbox": {"l": 452.56240999999994, "t": 296.36255, "r": 460.90115000000003, "b": 304.73718, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 134, "label": "text", "bbox": {"l": 478.59399, "t": 296.36255, "r": 486.93274, "b": 304.73718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 169, "text": "78", "bbox": {"l": 478.59399, "t": 296.36255, "r": 486.93274, "b": 304.73718, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 135, "label": "text", "bbox": {"l": 504.6324200000001, "t": 296.36255, "r": 512.97119, "b": 304.73718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 170, "text": "87", "bbox": {"l": 504.6324200000001, "t": 296.36255, "r": 512.97119, "b": 304.73718, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 6, "label": "text", "bbox": {"l": 317.686, "t": 331.40353, "r": 559.58496, "b": 416.49017, "coord_origin": "TOPLEFT"}, "confidence": 0.9740145802497864, "cells": [{"id": 171, "text": "lists in PubLayNet (grouped list-items) versus DocLayNet (separate", "bbox": {"l": 317.95499, "t": 331.40353, "r": 558.20233, "b": 339.77817, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "list-items), the label set of size 4 is the closest to PubLayNet, in the", "bbox": {"l": 317.95499, "t": 342.36255, "r": 558.2005, "b": 350.73718, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "assumption that the", "bbox": {"l": 317.95499, "t": 353.32153, "r": 393.16028, "b": 361.69617000000005, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "List", "bbox": {"l": 395.84201, "t": 353.36639, "r": 409.14905, "b": 361.70514, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "is down-mapped to", "bbox": {"l": 412.33301, "t": 353.32153, "r": 485.02324999999996, "b": 361.69617000000005, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "Text", "bbox": {"l": 487.70401, "t": 353.36639, "r": 502.86761, "b": 361.70514, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "in PubLayNet.", "bbox": {"l": 506.05499, "t": 353.32153, "r": 559.58496, "b": 361.69617000000005, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "The results in Table 3 show that the prediction accuracy on the", "bbox": {"l": 317.686, "t": 364.28054999999995, "r": 558.2002, "b": 372.65518, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "remaining class labels does not change significantly when other", "bbox": {"l": 317.95499, "t": 375.23853, "r": 558.36877, "b": 383.61316, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "classes are merged into them. The overall macro-average improves", "bbox": {"l": 317.95499, "t": 386.19754, "r": 558.19958, "b": 394.57217, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "by around 5%, in particular when", "bbox": {"l": 317.95499, "t": 397.15652, "r": 439.49454, "b": 405.53116000000006, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "Page-footer", "bbox": {"l": 441.728, "t": 397.20139, "r": 481.8616, "b": 405.54013, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "and", "bbox": {"l": 484.74298, "t": 397.15652, "r": 498.23743, "b": 405.53116000000006, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "Page-header", "bbox": {"l": 500.47299, "t": 397.20139, "r": 543.95105, "b": 405.54013, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": "are", "bbox": {"l": 546.83197, "t": 397.15652, "r": 558.20142, "b": 405.53116000000006, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "excluded.", "bbox": {"l": 317.95496, "t": 408.11553999999995, "r": 352.37698, "b": 416.49017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "section_header", "bbox": {"l": 317.95496, "t": 429.3949, "r": 549.8606, "b": 439.70398, "coord_origin": "TOPLEFT"}, "confidence": 0.9562516808509827, "cells": [{"id": 187, "text": "Impact of Document Split in Train and Test Set", "bbox": {"l": 317.95496, "t": 429.3949, "r": 549.8606, "b": 439.70398, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 317.62299, "t": 444.59653, "r": 559.71381, "b": 595.43718, "coord_origin": "TOPLEFT"}, "confidence": 0.9869834184646606, "cells": [{"id": 188, "text": "Many documents in DocLayNet have a unique styling. In order", "bbox": {"l": 317.95499, "t": 444.59653, "r": 558.36884, "b": 452.97116, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "to avoid overfitting on a particular style, we have split the train-,", "bbox": {"l": 317.95499, "t": 455.55554, "r": 559.19189, "b": 463.93018, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "test- and validation-sets of DocLayNet on document boundaries, i.e.", "bbox": {"l": 317.95499, "t": 466.51453, "r": 559.58185, "b": 474.88916, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "every document contributes pages to only one set. To the best of", "bbox": {"l": 317.95499, "t": 477.47354, "r": 558.20605, "b": 485.84818, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": "our knowledge, this was not considered in PubLayNet or DocBank.", "bbox": {"l": 317.95499, "t": 488.43253, "r": 559.58203, "b": 496.80716, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "To quantify how this affects model performance, we trained and", "bbox": {"l": 317.686, "t": 499.39154, "r": 558.20032, "b": 507.76617, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "evaluated a Mask R-CNN R50 model on a modified dataset version.", "bbox": {"l": 317.95499, "t": 510.35052, "r": 559.5849, "b": 518.72516, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "Here, the train-, test- and validation-sets were obtained by a ran-", "bbox": {"l": 317.95499, "t": 521.30954, "r": 559.71381, "b": 529.68417, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "domised draw over the individual pages. As can be seen in Table 4,", "bbox": {"l": 317.95499, "t": 532.26855, "r": 559.18707, "b": 540.64317, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "the difference in model performance is surprisingly large: page-", "bbox": {"l": 317.95499, "t": 543.22655, "r": 559.71313, "b": 551.60117, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "wise splitting gains", "bbox": {"l": 317.62299, "t": 554.18555, "r": 388.35168, "b": 562.56017, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "\u02dc", "bbox": {"l": 391.36499, "t": 552.50055, "r": 393.98318, "b": 560.87517, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "10% in mAP over the document-wise splitting.", "bbox": {"l": 390.59, "t": 554.18555, "r": 559.58191, "b": 562.56017, "coord_origin": "TOPLEFT"}}, {"id": 201, "text": "Thus, random page-wise splitting of DocLayNet can easily lead", "bbox": {"l": 317.686, "t": 565.14455, "r": 558.20032, "b": 573.51917, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": "to accidental overestimation of model performance and should be", "bbox": {"l": 317.95499, "t": 576.10356, "r": 558.20508, "b": 584.4781800000001, "coord_origin": "TOPLEFT"}}, {"id": 203, "text": "avoided.", "bbox": {"l": 317.95499, "t": 587.06256, "r": 348.50354, "b": 595.43718, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "section_header", "bbox": {"l": 317.95499, "t": 608.34192, "r": 418.54776, "b": 618.65102, "coord_origin": "TOPLEFT"}, "confidence": 0.9589216113090515, "cells": [{"id": 204, "text": "Dataset Comparison", "bbox": {"l": 317.95499, "t": 608.34192, "r": 418.54776, "b": 618.65102, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 317.686, "t": 623.54355, "r": 559.18817, "b": 708.640137, "coord_origin": "TOPLEFT"}, "confidence": 0.9872550964355469, "cells": [{"id": 205, "text": "Throughout this paper, we claim that DocLayNet\u2019s wider variety of", "bbox": {"l": 317.686, "t": 623.54355, "r": 558.20575, "b": 631.91817, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": "document layouts leads to more robust layout detection models. In", "bbox": {"l": 317.95499, "t": 634.50255, "r": 558.20624, "b": 642.87717, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": "Table 5, we provide evidence for that. We trained models on each", "bbox": {"l": 317.686, "t": 645.46155, "r": 558.20319, "b": 653.83617, "coord_origin": "TOPLEFT"}}, {"id": 208, "text": "of the available datasets (PubLayNet, DocBank and DocLayNet)", "bbox": {"l": 317.95499, "t": 656.42055, "r": 558.74377, "b": 664.79517, "coord_origin": "TOPLEFT"}}, {"id": 209, "text": "and evaluated them on the test sets of the other datasets. Due to", "bbox": {"l": 317.95499, "t": 667.37955, "r": 558.20398, "b": 675.7541699999999, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": "the different label sets and annotation styles, a direct comparison", "bbox": {"l": 317.95499, "t": 678.3385499999999, "r": 558.20062, "b": 686.71317, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "is not possible. Hence, we focussed on the common labels among", "bbox": {"l": 317.95499, "t": 689.29755, "r": 558.20343, "b": 697.672173, "coord_origin": "TOPLEFT"}}, {"id": 212, "text": "the datasets. Between PubLayNet and DocLayNet, these are", "bbox": {"l": 317.95499, "t": 700.256554, "r": 531.07666, "b": 708.631172, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "Picture", "bbox": {"l": 533.16199, "t": 700.301384, "r": 557.2561, "b": 708.640137, "coord_origin": "TOPLEFT"}}, {"id": 214, "text": ",", "bbox": {"l": 557.255, "t": 700.256554, "r": 559.18817, "b": 708.631172, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {"4": {"label": "table", "id": 4, "page_no": 6, "cluster": {"id": 4, "label": "table", "bbox": {"l": 80.35525512695312, "t": 150.93629455566406, "r": 267.0082092285156, "b": 295.4454650878906, "coord_origin": "TOPLEFT"}, "confidence": 0.9869412779808044, "cells": [{"id": 6, "text": "Class-count", "bbox": {"l": 86.372002, "t": 153.10051999999996, "r": 129.46452, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "11", "bbox": {"l": 151.07401, "t": 153.10051999999996, "r": 159.41275, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "6", "bbox": {"l": 179.31816, "t": 153.10051999999996, "r": 183.48753, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "5", "bbox": {"l": 213.33669, "t": 153.10051999999996, "r": 217.50606, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "4", "bbox": {"l": 247.35521, "t": 153.10051999999996, "r": 251.52458, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Caption", "bbox": {"l": 86.372002, "t": 164.45752000000005, "r": 115.55763, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "68", "bbox": {"l": 151.07401, "t": 164.45752000000005, "r": 159.41275, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Text", "bbox": {"l": 173.42723, "t": 164.45752000000005, "r": 189.38742, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Text", "bbox": {"l": 207.44576, "t": 164.45752000000005, "r": 223.40594000000002, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Text", "bbox": {"l": 241.46428, "t": 164.45752000000005, "r": 257.42447, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Footnote", "bbox": {"l": 86.372002, "t": 175.41656, "r": 118.8752, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "71", "bbox": {"l": 151.07401, "t": 175.41656, "r": 159.41275, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Text", "bbox": {"l": 173.42723, "t": 175.41656, "r": 189.38742, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Text", "bbox": {"l": 207.44576, "t": 175.41656, "r": 223.40594000000002, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Text", "bbox": {"l": 241.46428, "t": 175.41656, "r": 257.42447, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Formula", "bbox": {"l": 86.372002, "t": 186.37554999999998, "r": 116.88466, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "60", "bbox": {"l": 151.07401, "t": 186.37554999999998, "r": 159.41275, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Text", "bbox": {"l": 173.42723, "t": 186.37554999999998, "r": 189.38742, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "Text", "bbox": {"l": 207.44576, "t": 186.37554999999998, "r": 223.40594000000002, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "Text", "bbox": {"l": 241.46428, "t": 186.37554999999998, "r": 257.42447, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "List-item", "bbox": {"l": 86.372002, "t": 197.33452999999997, "r": 119.25179, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "81", "bbox": {"l": 151.07401, "t": 197.33452999999997, "r": 159.41275, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Text", "bbox": {"l": 173.42723, "t": 197.33452999999997, "r": 189.38742, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "82", "bbox": {"l": 211.25647, "t": 197.33452999999997, "r": 219.59521, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Text", "bbox": {"l": 241.46426, "t": 197.33452999999997, "r": 257.42447, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Page-footer", "bbox": {"l": 86.372002, "t": 208.29351999999994, "r": 128.89964, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "62", "bbox": {"l": 151.07401, "t": 208.29351999999994, "r": 159.41275, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "62", "bbox": {"l": 177.23795, "t": 208.29351999999994, "r": 185.57669, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "-", "bbox": {"l": 213.91052, "t": 208.29351999999994, "r": 216.94116, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "-", "bbox": {"l": 247.92905000000002, "t": 208.29351999999994, "r": 250.95969, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Page-header", "bbox": {"l": 86.372002, "t": 219.25256000000002, "r": 131.65231, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "72", "bbox": {"l": 151.07401, "t": 219.25256000000002, "r": 159.41275, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "68", "bbox": {"l": 177.23795, "t": 219.25256000000002, "r": 185.57669, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "-", "bbox": {"l": 213.91052, "t": 219.25256000000002, "r": 216.94116, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "-", "bbox": {"l": 247.92905000000002, "t": 219.25256000000002, "r": 250.95969, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Picture", "bbox": {"l": 86.372002, "t": 230.21155, "r": 112.35663, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "72", "bbox": {"l": 151.07401, "t": 230.21155, "r": 159.41275, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "72", "bbox": {"l": 177.23795, "t": 230.21155, "r": 185.57669, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "72", "bbox": {"l": 211.25645, "t": 230.21155, "r": 219.5952, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "72", "bbox": {"l": 245.27496, "t": 230.21155, "r": 253.61371, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "Section-header", "bbox": {"l": 86.372002, "t": 241.16956000000005, "r": 141.11188, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "68", "bbox": {"l": 151.07401, "t": 241.16956000000005, "r": 159.41275, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "67", "bbox": {"l": 177.23795, "t": 241.16956000000005, "r": 185.57669, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "69", "bbox": {"l": 211.25645, "t": 241.16956000000005, "r": 219.5952, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "68", "bbox": {"l": 245.27496, "t": 241.16956000000005, "r": 253.61371, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Table", "bbox": {"l": 86.372002, "t": 252.12854000000004, "r": 106.17878, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "82", "bbox": {"l": 151.07401, "t": 252.12854000000004, "r": 159.41275, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "83", "bbox": {"l": 177.23795, "t": 252.12854000000004, "r": 185.57669, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "82", "bbox": {"l": 211.25645, "t": 252.12854000000004, "r": 219.5952, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "82", "bbox": {"l": 245.27496, "t": 252.12854000000004, "r": 253.61371, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Text", "bbox": {"l": 86.372002, "t": 263.08752000000004, "r": 102.3322, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "85", "bbox": {"l": 151.07401, "t": 263.08752000000004, "r": 159.41275, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "84", "bbox": {"l": 177.23795, "t": 263.08752000000004, "r": 185.57669, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "84", "bbox": {"l": 211.25645, "t": 263.08752000000004, "r": 219.5952, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "84", "bbox": {"l": 245.27496, "t": 263.08752000000004, "r": 253.61371, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "Title", "bbox": {"l": 86.372002, "t": 274.04657, "r": 103.36333, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "77", "bbox": {"l": 151.07401, "t": 274.04657, "r": 159.41275, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "Sec.-h.", "bbox": {"l": 169.37442, "t": 274.04657, "r": 193.43127, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "Sec.-h.", "bbox": {"l": 203.39294, "t": 274.04657, "r": 227.4498, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "Sec.-h.", "bbox": {"l": 237.41147, "t": 274.04657, "r": 261.46832, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "Overall", "bbox": {"l": 86.372002, "t": 285.40454, "r": 113.31602000000001, "b": 293.77917, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "72", "bbox": {"l": 151.07401, "t": 285.40454, "r": 159.41275, "b": 293.77917, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "73", "bbox": {"l": 177.23795, "t": 285.40454, "r": 185.57669, "b": 293.77917, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "78", "bbox": {"l": 211.25645, "t": 285.40454, "r": 219.5952, "b": 293.77917, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "77", "bbox": {"l": 245.27496, "t": 285.40454, "r": 253.61371, "b": 293.77917, "coord_origin": "TOPLEFT"}}], "children": [{"id": 15, "label": "text", "bbox": {"l": 86.372002, "t": 153.10051999999996, "r": 129.46452, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": "Class-count", "bbox": {"l": 86.372002, "t": 153.10051999999996, "r": 129.46452, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 151.07401, "t": 153.10051999999996, "r": 159.41275, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "11", "bbox": {"l": 151.07401, "t": 153.10051999999996, "r": 159.41275, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 179.31816, "t": 153.10051999999996, "r": 183.48753, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "6", "bbox": {"l": 179.31816, "t": 153.10051999999996, "r": 183.48753, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 213.33669, "t": 153.10051999999996, "r": 217.50606, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "5", "bbox": {"l": 213.33669, "t": 153.10051999999996, "r": 217.50606, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 247.35521, "t": 153.10051999999996, "r": 251.52458, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "4", "bbox": {"l": 247.35521, "t": 153.10051999999996, "r": 251.52458, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 86.372002, "t": 164.45752000000005, "r": 115.55763, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "Caption", "bbox": {"l": 86.372002, "t": 164.45752000000005, "r": 115.55763, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 151.07401, "t": 164.45752000000005, "r": 159.41275, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "68", "bbox": {"l": 151.07401, "t": 164.45752000000005, "r": 159.41275, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 173.42723, "t": 164.45752000000005, "r": 189.38742, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "Text", "bbox": {"l": 173.42723, "t": 164.45752000000005, "r": 189.38742, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 207.44576, "t": 164.45752000000005, "r": 223.40594000000002, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "Text", "bbox": {"l": 207.44576, "t": 164.45752000000005, "r": 223.40594000000002, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 241.46428, "t": 164.45752000000005, "r": 257.42447, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "Text", "bbox": {"l": 241.46428, "t": 164.45752000000005, "r": 257.42447, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 86.372002, "t": 175.41656, "r": 118.8752, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "Footnote", "bbox": {"l": 86.372002, "t": 175.41656, "r": 118.8752, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 151.07401, "t": 175.41656, "r": 159.41275, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "71", "bbox": {"l": 151.07401, "t": 175.41656, "r": 159.41275, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 173.42723, "t": 175.41656, "r": 189.38742, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "Text", "bbox": {"l": 173.42723, "t": 175.41656, "r": 189.38742, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 207.44576, "t": 175.41656, "r": 223.40594000000002, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "Text", "bbox": {"l": 207.44576, "t": 175.41656, "r": 223.40594000000002, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 241.46428, "t": 175.41656, "r": 257.42447, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "Text", "bbox": {"l": 241.46428, "t": 175.41656, "r": 257.42447, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 86.372002, "t": 186.37554999999998, "r": 116.88466, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "Formula", "bbox": {"l": 86.372002, "t": 186.37554999999998, "r": 116.88466, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 151.07401, "t": 186.37554999999998, "r": 159.41275, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "60", "bbox": {"l": 151.07401, "t": 186.37554999999998, "r": 159.41275, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 173.42723, "t": 186.37554999999998, "r": 189.38742, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "Text", "bbox": {"l": 173.42723, "t": 186.37554999999998, "r": 189.38742, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 207.44576, "t": 186.37554999999998, "r": 223.40594000000002, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "Text", "bbox": {"l": 207.44576, "t": 186.37554999999998, "r": 223.40594000000002, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 241.46428, "t": 186.37554999999998, "r": 257.42447, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "Text", "bbox": {"l": 241.46428, "t": 186.37554999999998, "r": 257.42447, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 86.372002, "t": 197.33452999999997, "r": 119.25179, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "List-item", "bbox": {"l": 86.372002, "t": 197.33452999999997, "r": 119.25179, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 151.07401, "t": 197.33452999999997, "r": 159.41275, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "81", "bbox": {"l": 151.07401, "t": 197.33452999999997, "r": 159.41275, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 173.42723, "t": 197.33452999999997, "r": 189.38742, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "Text", "bbox": {"l": 173.42723, "t": 197.33452999999997, "r": 189.38742, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 211.25647, "t": 197.33452999999997, "r": 219.59521, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "82", "bbox": {"l": 211.25647, "t": 197.33452999999997, "r": 219.59521, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 241.46426, "t": 197.33452999999997, "r": 257.42447, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "Text", "bbox": {"l": 241.46426, "t": 197.33452999999997, "r": 257.42447, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 86.372002, "t": 208.29351999999994, "r": 128.89964, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "Page-footer", "bbox": {"l": 86.372002, "t": 208.29351999999994, "r": 128.89964, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 151.07401, "t": 208.29351999999994, "r": 159.41275, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "62", "bbox": {"l": 151.07401, "t": 208.29351999999994, "r": 159.41275, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 177.23795, "t": 208.29351999999994, "r": 185.57669, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "62", "bbox": {"l": 177.23795, "t": 208.29351999999994, "r": 185.57669, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 213.91052, "t": 208.29351999999994, "r": 216.94116, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "-", "bbox": {"l": 213.91052, "t": 208.29351999999994, "r": 216.94116, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 247.92905000000002, "t": 208.29351999999994, "r": 250.95969, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "-", "bbox": {"l": 247.92905000000002, "t": 208.29351999999994, "r": 250.95969, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 86.372002, "t": 219.25256000000002, "r": 131.65231, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "Page-header", "bbox": {"l": 86.372002, "t": 219.25256000000002, "r": 131.65231, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 151.07401, "t": 219.25256000000002, "r": 159.41275, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "72", "bbox": {"l": 151.07401, "t": 219.25256000000002, "r": 159.41275, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 177.23795, "t": 219.25256000000002, "r": 185.57669, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "68", "bbox": {"l": 177.23795, "t": 219.25256000000002, "r": 185.57669, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 213.91052, "t": 219.25256000000002, "r": 216.94116, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "-", "bbox": {"l": 213.91052, "t": 219.25256000000002, "r": 216.94116, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 247.92905000000002, "t": 219.25256000000002, "r": 250.95969, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "-", "bbox": {"l": 247.92905000000002, "t": 219.25256000000002, "r": 250.95969, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 86.372002, "t": 230.21155, "r": 112.35663, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "Picture", "bbox": {"l": 86.372002, "t": 230.21155, "r": 112.35663, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 151.07401, "t": 230.21155, "r": 159.41275, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "72", "bbox": {"l": 151.07401, "t": 230.21155, "r": 159.41275, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 177.23795, "t": 230.21155, "r": 185.57669, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "72", "bbox": {"l": 177.23795, "t": 230.21155, "r": 185.57669, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 211.25645, "t": 230.21155, "r": 219.5952, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "72", "bbox": {"l": 211.25645, "t": 230.21155, "r": 219.5952, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 245.27496, "t": 230.21155, "r": 253.61371, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "72", "bbox": {"l": 245.27496, "t": 230.21155, "r": 253.61371, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 86.372002, "t": 241.16956000000005, "r": 141.11188, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "Section-header", "bbox": {"l": 86.372002, "t": 241.16956000000005, "r": 141.11188, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 151.07401, "t": 241.16956000000005, "r": 159.41275, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "68", "bbox": {"l": 151.07401, "t": 241.16956000000005, "r": 159.41275, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 177.23795, "t": 241.16956000000005, "r": 185.57669, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "67", "bbox": {"l": 177.23795, "t": 241.16956000000005, "r": 185.57669, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 211.25645, "t": 241.16956000000005, "r": 219.5952, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "69", "bbox": {"l": 211.25645, "t": 241.16956000000005, "r": 219.5952, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 245.27496, "t": 241.16956000000005, "r": 253.61371, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "68", "bbox": {"l": 245.27496, "t": 241.16956000000005, "r": 253.61371, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 86.372002, "t": 252.12854000000004, "r": 106.17878, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "Table", "bbox": {"l": 86.372002, "t": 252.12854000000004, "r": 106.17878, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 151.07401, "t": 252.12854000000004, "r": 159.41275, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "82", "bbox": {"l": 151.07401, "t": 252.12854000000004, "r": 159.41275, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 177.23795, "t": 252.12854000000004, "r": 185.57669, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "83", "bbox": {"l": 177.23795, "t": 252.12854000000004, "r": 185.57669, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 211.25645, "t": 252.12854000000004, "r": 219.5952, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "82", "bbox": {"l": 211.25645, "t": 252.12854000000004, "r": 219.5952, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 245.27496, "t": 252.12854000000004, "r": 253.61371, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "82", "bbox": {"l": 245.27496, "t": 252.12854000000004, "r": 253.61371, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 86.372002, "t": 263.08752000000004, "r": 102.3322, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "Text", "bbox": {"l": 86.372002, "t": 263.08752000000004, "r": 102.3322, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 151.07401, "t": 263.08752000000004, "r": 159.41275, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "85", "bbox": {"l": 151.07401, "t": 263.08752000000004, "r": 159.41275, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 177.23795, "t": 263.08752000000004, "r": 185.57669, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "84", "bbox": {"l": 177.23795, "t": 263.08752000000004, "r": 185.57669, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 211.25645, "t": 263.08752000000004, "r": 219.5952, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "84", "bbox": {"l": 211.25645, "t": 263.08752000000004, "r": 219.5952, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 245.27496, "t": 263.08752000000004, "r": 253.61371, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "84", "bbox": {"l": 245.27496, "t": 263.08752000000004, "r": 253.61371, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 86.372002, "t": 274.04657, "r": 103.36333, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "Title", "bbox": {"l": 86.372002, "t": 274.04657, "r": 103.36333, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 151.07401, "t": 274.04657, "r": 159.41275, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "77", "bbox": {"l": 151.07401, "t": 274.04657, "r": 159.41275, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 169.37442, "t": 274.04657, "r": 193.43127, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "Sec.-h.", "bbox": {"l": 169.37442, "t": 274.04657, "r": 193.43127, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 203.39294, "t": 274.04657, "r": 227.4498, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "Sec.-h.", "bbox": {"l": 203.39294, "t": 274.04657, "r": 227.4498, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 237.41147, "t": 274.04657, "r": 261.46832, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "Sec.-h.", "bbox": {"l": 237.41147, "t": 274.04657, "r": 261.46832, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 86.372002, "t": 285.40454, "r": 113.31602000000001, "b": 293.77917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "Overall", "bbox": {"l": 86.372002, "t": 285.40454, "r": 113.31602000000001, "b": 293.77917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 151.07401, "t": 285.40454, "r": 159.41275, "b": 293.77917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "72", "bbox": {"l": 151.07401, "t": 285.40454, "r": 159.41275, "b": 293.77917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 177.23795, "t": 285.40454, "r": 185.57669, "b": 293.77917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "73", "bbox": {"l": 177.23795, "t": 285.40454, "r": 185.57669, "b": 293.77917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 211.25645, "t": 285.40454, "r": 219.5952, "b": 293.77917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "78", "bbox": {"l": 211.25645, "t": 285.40454, "r": 219.5952, "b": 293.77917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 245.27496, "t": 285.40454, "r": 253.61371, "b": 293.77917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "77", "bbox": {"l": 245.27496, "t": 285.40454, "r": 253.61371, "b": 293.77917, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 13, "num_cols": 5, "table_cells": [{"bbox": {"l": 86.372002, "t": 153.10051999999996, "r": 129.46452, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Class-count", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 151.07401, "t": 153.10051999999996, "r": 159.41275, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "11", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 179.31816, "t": 153.10051999999996, "r": 183.48753, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "6", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 213.33669, "t": 153.10051999999996, "r": 217.50606, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "5", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 247.35521, "t": 153.10051999999996, "r": 251.52458, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "4", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 164.45752000000005, "r": 115.55763, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Caption", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 164.45752000000005, "r": 159.41275, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 173.42723, "t": 164.45752000000005, "r": 189.38742, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 207.44576, "t": 164.45752000000005, "r": 223.40594000000002, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 241.46428, "t": 164.45752000000005, "r": 257.42447, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 175.41656, "r": 118.8752, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Footnote", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 175.41656, "r": 159.41275, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "71", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 173.42723, "t": 175.41656, "r": 189.38742, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 207.44576, "t": 175.41656, "r": 223.40594000000002, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 241.46428, "t": 175.41656, "r": 257.42447, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 186.37554999999998, "r": 116.88466, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Formula", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 186.37554999999998, "r": 159.41275, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "60", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 173.42723, "t": 186.37554999999998, "r": 189.38742, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 207.44576, "t": 186.37554999999998, "r": 223.40594000000002, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 241.46428, "t": 186.37554999999998, "r": 257.42447, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 197.33452999999997, "r": 119.25179, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "List-item", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 197.33452999999997, "r": 159.41275, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 173.42723, "t": 197.33452999999997, "r": 189.38742, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 211.25647, "t": 197.33452999999997, "r": 219.59521, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 241.46426, "t": 197.33452999999997, "r": 257.42447, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 208.29351999999994, "r": 128.89964, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-footer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 208.29351999999994, "r": 159.41275, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "62", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23795, "t": 208.29351999999994, "r": 185.57669, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "62", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 213.91052, "t": 208.29351999999994, "r": 216.94116, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 247.92905000000002, "t": 208.29351999999994, "r": 250.95969, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 219.25256000000002, "r": 131.65231, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 219.25256000000002, "r": 159.41275, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23795, "t": 219.25256000000002, "r": 185.57669, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 213.91052, "t": 219.25256000000002, "r": 216.94116, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 247.92905000000002, "t": 219.25256000000002, "r": 250.95969, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 230.21155, "r": 112.35663, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Picture", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 230.21155, "r": 159.41275, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23795, "t": 230.21155, "r": 185.57669, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 211.25645, "t": 230.21155, "r": 219.5952, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.27496, "t": 230.21155, "r": 253.61371, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 241.16956000000005, "r": 141.11188, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Section-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 241.16956000000005, "r": 159.41275, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23795, "t": 241.16956000000005, "r": 185.57669, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "67", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 211.25645, "t": 241.16956000000005, "r": 219.5952, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "69", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.27496, "t": 241.16956000000005, "r": 253.61371, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 252.12854000000004, "r": 106.17878, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 252.12854000000004, "r": 159.41275, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23795, "t": 252.12854000000004, "r": 185.57669, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 211.25645, "t": 252.12854000000004, "r": 219.5952, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.27496, "t": 252.12854000000004, "r": 253.61371, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 263.08752000000004, "r": 102.3322, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Text", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 263.08752000000004, "r": 159.41275, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23795, "t": 263.08752000000004, "r": 185.57669, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 211.25645, "t": 263.08752000000004, "r": 219.5952, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.27496, "t": 263.08752000000004, "r": 253.61371, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 274.04657, "r": 103.36333, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Title", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 274.04657, "r": 159.41275, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 169.37442, "t": 274.04657, "r": 193.43127, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Sec.-h.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 203.39294, "t": 274.04657, "r": 227.4498, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Sec.-h.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 237.41147, "t": 274.04657, "r": 261.46832, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Sec.-h.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 285.40454, "r": 113.31602000000001, "b": 293.77917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Overall", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 285.40454, "r": 159.41275, "b": 293.77917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23795, "t": 285.40454, "r": 185.57669, "b": 293.77917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "73", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 211.25645, "t": 285.40454, "r": 219.5952, "b": 293.77917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "78", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.27496, "t": 285.40454, "r": 253.61371, "b": 293.77917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "77", "column_header": false, "row_header": false, "row_section": false}]}, "0": {"label": "table", "id": 0, "page_no": 6, "cluster": {"id": 0, "label": "table", "bbox": {"l": 352.97747802734375, "t": 150.79122924804688, "r": 522.9158935546875, "b": 306.265869140625, "coord_origin": "TOPLEFT"}, "confidence": 0.9879695177078247, "cells": [{"id": 115, "text": "Class-count", "bbox": {"l": 358.63901, "t": 153.10051999999996, "r": 401.73154, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "11", "bbox": {"l": 440.22501, "t": 153.10051999999996, "r": 448.56375, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "5", "bbox": {"l": 494.38, "t": 153.10051999999996, "r": 498.54938, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "Split", "bbox": {"l": 358.63901, "t": 164.05951000000005, "r": 375.27167, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "Doc", "bbox": {"l": 423.341, "t": 164.05951000000005, "r": 438.0459, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "Page", "bbox": {"l": 448.00757, "t": 164.05951000000005, "r": 465.4472, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "Doc", "bbox": {"l": 475.41101, "t": 164.05951000000005, "r": 490.11591, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Page", "bbox": {"l": 500.07757999999995, "t": 164.05951000000005, "r": 517.51721, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "Caption", "bbox": {"l": 358.63901, "t": 175.41656, "r": 387.82465, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "68", "bbox": {"l": 426.52399, "t": 175.41656, "r": 434.86273, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "83", "bbox": {"l": 452.56240999999994, "t": 175.41656, "r": 460.90115000000003, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "Footnote", "bbox": {"l": 358.63901, "t": 186.37554999999998, "r": 391.14221, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "71", "bbox": {"l": 426.52399, "t": 186.37554999999998, "r": 434.86273, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "84", "bbox": {"l": 452.56240999999994, "t": 186.37554999999998, "r": 460.90115000000003, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "Formula", "bbox": {"l": 358.63901, "t": 197.33452999999997, "r": 389.15167, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "60", "bbox": {"l": 426.52399, "t": 197.33452999999997, "r": 434.86273, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "66", "bbox": {"l": 452.56240999999994, "t": 197.33452999999997, "r": 460.90115000000003, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "List-item", "bbox": {"l": 358.63901, "t": 208.29351999999994, "r": 391.5188, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "81", "bbox": {"l": 426.52399, "t": 208.29351999999994, "r": 434.86273, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "88", "bbox": {"l": 452.56240999999994, "t": 208.29351999999994, "r": 460.90115000000003, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "82", "bbox": {"l": 478.59399, "t": 208.29351999999994, "r": 486.93274, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "88", "bbox": {"l": 504.6324200000001, "t": 208.29351999999994, "r": 512.97119, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "Page-footer", "bbox": {"l": 358.63901, "t": 219.25256000000002, "r": 401.16666, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "62", "bbox": {"l": 426.52399, "t": 219.25256000000002, "r": 434.86273, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "89", "bbox": {"l": 452.56240999999994, "t": 219.25256000000002, "r": 460.90115000000003, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "Page-header", "bbox": {"l": 358.63901, "t": 230.21155, "r": 403.91931, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "72", "bbox": {"l": 426.52399, "t": 230.21155, "r": 434.86273, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "90", "bbox": {"l": 452.56240999999994, "t": 230.21155, "r": 460.90115000000003, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "Picture", "bbox": {"l": 358.63901, "t": 241.16956000000005, "r": 384.62366, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "72", "bbox": {"l": 426.52399, "t": 241.16956000000005, "r": 434.86273, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "82", "bbox": {"l": 452.56240999999994, "t": 241.16956000000005, "r": 460.90115000000003, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "72", "bbox": {"l": 478.59399, "t": 241.16956000000005, "r": 486.93274, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "82", "bbox": {"l": 504.6324200000001, "t": 241.16956000000005, "r": 512.97119, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "Section-header", "bbox": {"l": 358.63901, "t": 252.12854000000004, "r": 413.37891, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "68", "bbox": {"l": 426.52399, "t": 252.12854000000004, "r": 434.86273, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "83", "bbox": {"l": 452.56240999999994, "t": 252.12854000000004, "r": 460.90115000000003, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "69", "bbox": {"l": 478.59399, "t": 252.12854000000004, "r": 486.93274, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "83", "bbox": {"l": 504.6324200000001, "t": 252.12854000000004, "r": 512.97119, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "Table", "bbox": {"l": 358.63901, "t": 263.08752000000004, "r": 378.44577, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "82", "bbox": {"l": 426.52399, "t": 263.08752000000004, "r": 434.86273, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "89", "bbox": {"l": 452.56240999999994, "t": 263.08752000000004, "r": 460.90115000000003, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "82", "bbox": {"l": 478.59399, "t": 263.08752000000004, "r": 486.93274, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "90", "bbox": {"l": 504.6324200000001, "t": 263.08752000000004, "r": 512.97119, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "Text", "bbox": {"l": 358.63901, "t": 274.04657, "r": 374.59921, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "85", "bbox": {"l": 426.52399, "t": 274.04657, "r": 434.86273, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "91", "bbox": {"l": 452.56240999999994, "t": 274.04657, "r": 460.90115000000003, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "84", "bbox": {"l": 478.59399, "t": 274.04657, "r": 486.93274, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "90", "bbox": {"l": 504.6324200000001, "t": 274.04657, "r": 512.97119, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "Title", "bbox": {"l": 358.63901, "t": 285.00552, "r": 375.63034, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "77", "bbox": {"l": 426.52399, "t": 285.00552, "r": 434.86273, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "81", "bbox": {"l": 452.56240999999994, "t": 285.00552, "r": 460.90115000000003, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "All", "bbox": {"l": 358.63901, "t": 296.36255, "r": 369.60492, "b": 304.73718, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "72", "bbox": {"l": 426.52399, "t": 296.36255, "r": 434.86273, "b": 304.73718, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "84", "bbox": {"l": 452.56240999999994, "t": 296.36255, "r": 460.90115000000003, "b": 304.73718, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "78", "bbox": {"l": 478.59399, "t": 296.36255, "r": 486.93274, "b": 304.73718, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "87", "bbox": {"l": 504.6324200000001, "t": 296.36255, "r": 512.97119, "b": 304.73718, "coord_origin": "TOPLEFT"}}], "children": [{"id": 80, "label": "text", "bbox": {"l": 358.63901, "t": 153.10051999999996, "r": 401.73154, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 115, "text": "Class-count", "bbox": {"l": 358.63901, "t": 153.10051999999996, "r": 401.73154, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 440.22501, "t": 153.10051999999996, "r": 448.56375, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 116, "text": "11", "bbox": {"l": 440.22501, "t": 153.10051999999996, "r": 448.56375, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 494.38, "t": 153.10051999999996, "r": 498.54938, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 117, "text": "5", "bbox": {"l": 494.38, "t": 153.10051999999996, "r": 498.54938, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 358.63901, "t": 164.05951000000005, "r": 375.27167, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 118, "text": "Split", "bbox": {"l": 358.63901, "t": 164.05951000000005, "r": 375.27167, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 423.341, "t": 164.05951000000005, "r": 438.0459, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 119, "text": "Doc", "bbox": {"l": 423.341, "t": 164.05951000000005, "r": 438.0459, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 448.00757, "t": 164.05951000000005, "r": 465.4472, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 120, "text": "Page", "bbox": {"l": 448.00757, "t": 164.05951000000005, "r": 465.4472, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 475.41101, "t": 164.05951000000005, "r": 490.11591, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 121, "text": "Doc", "bbox": {"l": 475.41101, "t": 164.05951000000005, "r": 490.11591, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 500.07757999999995, "t": 164.05951000000005, "r": 517.51721, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 122, "text": "Page", "bbox": {"l": 500.07757999999995, "t": 164.05951000000005, "r": 517.51721, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 358.63901, "t": 175.41656, "r": 387.82465, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 123, "text": "Caption", "bbox": {"l": 358.63901, "t": 175.41656, "r": 387.82465, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 426.52399, "t": 175.41656, "r": 434.86273, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 124, "text": "68", "bbox": {"l": 426.52399, "t": 175.41656, "r": 434.86273, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 452.56240999999994, "t": 175.41656, "r": 460.90115000000003, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 125, "text": "83", "bbox": {"l": 452.56240999999994, "t": 175.41656, "r": 460.90115000000003, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 358.63901, "t": 186.37554999999998, "r": 391.14221, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 126, "text": "Footnote", "bbox": {"l": 358.63901, "t": 186.37554999999998, "r": 391.14221, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 426.52399, "t": 186.37554999999998, "r": 434.86273, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 127, "text": "71", "bbox": {"l": 426.52399, "t": 186.37554999999998, "r": 434.86273, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 452.56240999999994, "t": 186.37554999999998, "r": 460.90115000000003, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 128, "text": "84", "bbox": {"l": 452.56240999999994, "t": 186.37554999999998, "r": 460.90115000000003, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 358.63901, "t": 197.33452999999997, "r": 389.15167, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 129, "text": "Formula", "bbox": {"l": 358.63901, "t": 197.33452999999997, "r": 389.15167, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 426.52399, "t": 197.33452999999997, "r": 434.86273, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 130, "text": "60", "bbox": {"l": 426.52399, "t": 197.33452999999997, "r": 434.86273, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 452.56240999999994, "t": 197.33452999999997, "r": 460.90115000000003, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 131, "text": "66", "bbox": {"l": 452.56240999999994, "t": 197.33452999999997, "r": 460.90115000000003, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 358.63901, "t": 208.29351999999994, "r": 391.5188, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 132, "text": "List-item", "bbox": {"l": 358.63901, "t": 208.29351999999994, "r": 391.5188, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 426.52399, "t": 208.29351999999994, "r": 434.86273, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 133, "text": "81", "bbox": {"l": 426.52399, "t": 208.29351999999994, "r": 434.86273, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 452.56240999999994, "t": 208.29351999999994, "r": 460.90115000000003, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 134, "text": "88", "bbox": {"l": 452.56240999999994, "t": 208.29351999999994, "r": 460.90115000000003, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 478.59399, "t": 208.29351999999994, "r": 486.93274, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 135, "text": "82", "bbox": {"l": 478.59399, "t": 208.29351999999994, "r": 486.93274, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 504.6324200000001, "t": 208.29351999999994, "r": 512.97119, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 136, "text": "88", "bbox": {"l": 504.6324200000001, "t": 208.29351999999994, "r": 512.97119, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 358.63901, "t": 219.25256000000002, "r": 401.16666, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 137, "text": "Page-footer", "bbox": {"l": 358.63901, "t": 219.25256000000002, "r": 401.16666, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 426.52399, "t": 219.25256000000002, "r": 434.86273, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 138, "text": "62", "bbox": {"l": 426.52399, "t": 219.25256000000002, "r": 434.86273, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 452.56240999999994, "t": 219.25256000000002, "r": 460.90115000000003, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 139, "text": "89", "bbox": {"l": 452.56240999999994, "t": 219.25256000000002, "r": 460.90115000000003, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 358.63901, "t": 230.21155, "r": 403.91931, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 140, "text": "Page-header", "bbox": {"l": 358.63901, "t": 230.21155, "r": 403.91931, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 426.52399, "t": 230.21155, "r": 434.86273, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 141, "text": "72", "bbox": {"l": 426.52399, "t": 230.21155, "r": 434.86273, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 452.56240999999994, "t": 230.21155, "r": 460.90115000000003, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 142, "text": "90", "bbox": {"l": 452.56240999999994, "t": 230.21155, "r": 460.90115000000003, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 358.63901, "t": 241.16956000000005, "r": 384.62366, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 143, "text": "Picture", "bbox": {"l": 358.63901, "t": 241.16956000000005, "r": 384.62366, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 426.52399, "t": 241.16956000000005, "r": 434.86273, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 144, "text": "72", "bbox": {"l": 426.52399, "t": 241.16956000000005, "r": 434.86273, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 452.56240999999994, "t": 241.16956000000005, "r": 460.90115000000003, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 145, "text": "82", "bbox": {"l": 452.56240999999994, "t": 241.16956000000005, "r": 460.90115000000003, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 478.59399, "t": 241.16956000000005, "r": 486.93274, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 146, "text": "72", "bbox": {"l": 478.59399, "t": 241.16956000000005, "r": 486.93274, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 504.6324200000001, "t": 241.16956000000005, "r": 512.97119, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 147, "text": "82", "bbox": {"l": 504.6324200000001, "t": 241.16956000000005, "r": 512.97119, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 358.63901, "t": 252.12854000000004, "r": 413.37891, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 148, "text": "Section-header", "bbox": {"l": 358.63901, "t": 252.12854000000004, "r": 413.37891, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 114, "label": "text", "bbox": {"l": 426.52399, "t": 252.12854000000004, "r": 434.86273, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 149, "text": "68", "bbox": {"l": 426.52399, "t": 252.12854000000004, "r": 434.86273, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 115, "label": "text", "bbox": {"l": 452.56240999999994, "t": 252.12854000000004, "r": 460.90115000000003, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 150, "text": "83", "bbox": {"l": 452.56240999999994, "t": 252.12854000000004, "r": 460.90115000000003, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 116, "label": "text", "bbox": {"l": 478.59399, "t": 252.12854000000004, "r": 486.93274, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 151, "text": "69", "bbox": {"l": 478.59399, "t": 252.12854000000004, "r": 486.93274, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 117, "label": "text", "bbox": {"l": 504.6324200000001, "t": 252.12854000000004, "r": 512.97119, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 152, "text": "83", "bbox": {"l": 504.6324200000001, "t": 252.12854000000004, "r": 512.97119, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 118, "label": "text", "bbox": {"l": 358.63901, "t": 263.08752000000004, "r": 378.44577, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 153, "text": "Table", "bbox": {"l": 358.63901, "t": 263.08752000000004, "r": 378.44577, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 119, "label": "text", "bbox": {"l": 426.52399, "t": 263.08752000000004, "r": 434.86273, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 154, "text": "82", "bbox": {"l": 426.52399, "t": 263.08752000000004, "r": 434.86273, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 120, "label": "text", "bbox": {"l": 452.56240999999994, "t": 263.08752000000004, "r": 460.90115000000003, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 155, "text": "89", "bbox": {"l": 452.56240999999994, "t": 263.08752000000004, "r": 460.90115000000003, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 121, "label": "text", "bbox": {"l": 478.59399, "t": 263.08752000000004, "r": 486.93274, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 156, "text": "82", "bbox": {"l": 478.59399, "t": 263.08752000000004, "r": 486.93274, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 122, "label": "text", "bbox": {"l": 504.6324200000001, "t": 263.08752000000004, "r": 512.97119, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 157, "text": "90", "bbox": {"l": 504.6324200000001, "t": 263.08752000000004, "r": 512.97119, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 123, "label": "text", "bbox": {"l": 358.63901, "t": 274.04657, "r": 374.59921, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 158, "text": "Text", "bbox": {"l": 358.63901, "t": 274.04657, "r": 374.59921, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 124, "label": "text", "bbox": {"l": 426.52399, "t": 274.04657, "r": 434.86273, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 159, "text": "85", "bbox": {"l": 426.52399, "t": 274.04657, "r": 434.86273, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 125, "label": "text", "bbox": {"l": 452.56240999999994, "t": 274.04657, "r": 460.90115000000003, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 160, "text": "91", "bbox": {"l": 452.56240999999994, "t": 274.04657, "r": 460.90115000000003, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 126, "label": "text", "bbox": {"l": 478.59399, "t": 274.04657, "r": 486.93274, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 161, "text": "84", "bbox": {"l": 478.59399, "t": 274.04657, "r": 486.93274, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 127, "label": "text", "bbox": {"l": 504.6324200000001, "t": 274.04657, "r": 512.97119, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 162, "text": "90", "bbox": {"l": 504.6324200000001, "t": 274.04657, "r": 512.97119, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 128, "label": "text", "bbox": {"l": 358.63901, "t": 285.00552, "r": 375.63034, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 163, "text": "Title", "bbox": {"l": 358.63901, "t": 285.00552, "r": 375.63034, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 129, "label": "text", "bbox": {"l": 426.52399, "t": 285.00552, "r": 434.86273, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 164, "text": "77", "bbox": {"l": 426.52399, "t": 285.00552, "r": 434.86273, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 130, "label": "text", "bbox": {"l": 452.56240999999994, "t": 285.00552, "r": 460.90115000000003, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 165, "text": "81", "bbox": {"l": 452.56240999999994, "t": 285.00552, "r": 460.90115000000003, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 131, "label": "text", "bbox": {"l": 358.63901, "t": 296.36255, "r": 369.60492, "b": 304.73718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 166, "text": "All", "bbox": {"l": 358.63901, "t": 296.36255, "r": 369.60492, "b": 304.73718, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 132, "label": "text", "bbox": {"l": 426.52399, "t": 296.36255, "r": 434.86273, "b": 304.73718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 167, "text": "72", "bbox": {"l": 426.52399, "t": 296.36255, "r": 434.86273, "b": 304.73718, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 133, "label": "text", "bbox": {"l": 452.56240999999994, "t": 296.36255, "r": 460.90115000000003, "b": 304.73718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 168, "text": "84", "bbox": {"l": 452.56240999999994, "t": 296.36255, "r": 460.90115000000003, "b": 304.73718, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 134, "label": "text", "bbox": {"l": 478.59399, "t": 296.36255, "r": 486.93274, "b": 304.73718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 169, "text": "78", "bbox": {"l": 478.59399, "t": 296.36255, "r": 486.93274, "b": 304.73718, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 135, "label": "text", "bbox": {"l": 504.6324200000001, "t": 296.36255, "r": 512.97119, "b": 304.73718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 170, "text": "87", "bbox": {"l": 504.6324200000001, "t": 296.36255, "r": 512.97119, "b": 304.73718, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["fcel", "ched", "lcel", "ched", "lcel", "nl", "fcel", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 14, "num_cols": 5, "table_cells": [{"bbox": {"l": 358.63901, "t": 153.10051999999996, "r": 401.73154, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Class-count", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.22501, "t": 153.10051999999996, "r": 448.56375, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 3, "text": "11", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 494.38, "t": 153.10051999999996, "r": 498.54938, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 5, "text": "5", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 164.05951000000005, "r": 375.27167, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Split", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 423.341, "t": 164.05951000000005, "r": 438.0459, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Doc", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 448.00757, "t": 164.05951000000005, "r": 465.4472, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Page", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 475.41101, "t": 164.05951000000005, "r": 490.11591, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Doc", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 500.07757999999995, "t": 164.05951000000005, "r": 517.51721, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Page", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 175.41656, "r": 387.82465, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Caption", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 175.41656, "r": 434.86273, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 175.41656, "r": 460.90115000000003, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 186.37554999999998, "r": 391.14221, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Footnote", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 186.37554999999998, "r": 434.86273, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "71", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 186.37554999999998, "r": 460.90115000000003, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 197.33452999999997, "r": 389.15167, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Formula", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 197.33452999999997, "r": 434.86273, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "60", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 197.33452999999997, "r": 460.90115000000003, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "66", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 208.29351999999994, "r": 391.5188, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "List-item", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 208.29351999999994, "r": 434.86273, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 208.29351999999994, "r": 460.90115000000003, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 478.59399, "t": 208.29351999999994, "r": 486.93274, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 504.6324200000001, "t": 208.29351999999994, "r": 512.97119, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 219.25256000000002, "r": 401.16666, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-footer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 219.25256000000002, "r": 434.86273, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "62", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 219.25256000000002, "r": 460.90115000000003, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "89", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 230.21155, "r": 403.91931, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 230.21155, "r": 434.86273, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 230.21155, "r": 460.90115000000003, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "90", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 241.16956000000005, "r": 384.62366, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Picture", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 241.16956000000005, "r": 434.86273, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 241.16956000000005, "r": 460.90115000000003, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 478.59399, "t": 241.16956000000005, "r": 486.93274, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 504.6324200000001, "t": 241.16956000000005, "r": 512.97119, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 252.12854000000004, "r": 413.37891, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Section-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 252.12854000000004, "r": 434.86273, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 252.12854000000004, "r": 460.90115000000003, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 478.59399, "t": 252.12854000000004, "r": 486.93274, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "69", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 504.6324200000001, "t": 252.12854000000004, "r": 512.97119, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 263.08752000000004, "r": 378.44577, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 263.08752000000004, "r": 434.86273, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 263.08752000000004, "r": 460.90115000000003, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "89", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 478.59399, "t": 263.08752000000004, "r": 486.93274, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 504.6324200000001, "t": 263.08752000000004, "r": 512.97119, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "90", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 274.04657, "r": 374.59921, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Text", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 274.04657, "r": 434.86273, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 274.04657, "r": 460.90115000000003, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "91", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 478.59399, "t": 274.04657, "r": 486.93274, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 504.6324200000001, "t": 274.04657, "r": 512.97119, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "90", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 285.00552, "r": 375.63034, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Title", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 285.00552, "r": 434.86273, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 285.00552, "r": 460.90115000000003, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 296.36255, "r": 369.60492, "b": 304.73718, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "All", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 296.36255, "r": 434.86273, "b": 304.73718, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 296.36255, "r": 460.90115000000003, "b": 304.73718, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 478.59399, "t": 296.36255, "r": 486.93274, "b": 304.73718, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "78", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 504.6324200000001, "t": 296.36255, "r": 512.97119, "b": 304.73718, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "87", "column_header": false, "row_header": false, "row_section": false}]}}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_header", "id": 12, "page_no": 6, "cluster": {"id": 12, "label": "page_header", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.9316117763519287, "cells": [{"id": 0, "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis"}, {"label": "page_header", "id": 11, "page_no": 6, "cluster": {"id": 11, "label": "page_header", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.9318180084228516, "cells": [{"id": 1, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA"}, {"label": "text", "id": 14, "page_no": 6, "cluster": {"id": 14, "label": "text", "bbox": {"l": 53.501999, "t": 86.87292000000002, "r": 295.64865, "b": 128.22313999999994, "coord_origin": "TOPLEFT"}, "confidence": 0.8296932578086853, "cells": [{"id": 2, "text": "Table 3: Performance of a Mask R-CNN R50 network in", "bbox": {"l": 53.501999, "t": 86.87292000000002, "r": 294.0437, "b": 95.34618999999998, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "mAP@0.5-0.95 scores trained on DocLayNet with different", "bbox": {"l": 53.79800000000001, "t": 97.83191, "r": 294.04376, "b": 106.30517999999995, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "class label sets. The reduced label sets were obtained by ei-", "bbox": {"l": 53.79800000000001, "t": 108.79088999999999, "r": 295.64865, "b": 117.26415999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "ther down-mapping or dropping labels.", "bbox": {"l": 53.79800000000001, "t": 119.74987999999996, "r": 213.23856, "b": 128.22313999999994, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 3: Performance of a Mask R-CNN R50 network in mAP@0.5-0.95 scores trained on DocLayNet with different class label sets. The reduced label sets were obtained by either down-mapping or dropping labels."}, {"label": "table", "id": 4, "page_no": 6, "cluster": {"id": 4, "label": "table", "bbox": {"l": 80.35525512695312, "t": 150.93629455566406, "r": 267.0082092285156, "b": 295.4454650878906, "coord_origin": "TOPLEFT"}, "confidence": 0.9869412779808044, "cells": [{"id": 6, "text": "Class-count", "bbox": {"l": 86.372002, "t": 153.10051999999996, "r": 129.46452, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "11", "bbox": {"l": 151.07401, "t": 153.10051999999996, "r": 159.41275, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "6", "bbox": {"l": 179.31816, "t": 153.10051999999996, "r": 183.48753, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "5", "bbox": {"l": 213.33669, "t": 153.10051999999996, "r": 217.50606, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "4", "bbox": {"l": 247.35521, "t": 153.10051999999996, "r": 251.52458, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Caption", "bbox": {"l": 86.372002, "t": 164.45752000000005, "r": 115.55763, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "68", "bbox": {"l": 151.07401, "t": 164.45752000000005, "r": 159.41275, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Text", "bbox": {"l": 173.42723, "t": 164.45752000000005, "r": 189.38742, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Text", "bbox": {"l": 207.44576, "t": 164.45752000000005, "r": 223.40594000000002, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Text", "bbox": {"l": 241.46428, "t": 164.45752000000005, "r": 257.42447, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Footnote", "bbox": {"l": 86.372002, "t": 175.41656, "r": 118.8752, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "71", "bbox": {"l": 151.07401, "t": 175.41656, "r": 159.41275, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Text", "bbox": {"l": 173.42723, "t": 175.41656, "r": 189.38742, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Text", "bbox": {"l": 207.44576, "t": 175.41656, "r": 223.40594000000002, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Text", "bbox": {"l": 241.46428, "t": 175.41656, "r": 257.42447, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Formula", "bbox": {"l": 86.372002, "t": 186.37554999999998, "r": 116.88466, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "60", "bbox": {"l": 151.07401, "t": 186.37554999999998, "r": 159.41275, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Text", "bbox": {"l": 173.42723, "t": 186.37554999999998, "r": 189.38742, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "Text", "bbox": {"l": 207.44576, "t": 186.37554999999998, "r": 223.40594000000002, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "Text", "bbox": {"l": 241.46428, "t": 186.37554999999998, "r": 257.42447, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "List-item", "bbox": {"l": 86.372002, "t": 197.33452999999997, "r": 119.25179, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "81", "bbox": {"l": 151.07401, "t": 197.33452999999997, "r": 159.41275, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Text", "bbox": {"l": 173.42723, "t": 197.33452999999997, "r": 189.38742, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "82", "bbox": {"l": 211.25647, "t": 197.33452999999997, "r": 219.59521, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Text", "bbox": {"l": 241.46426, "t": 197.33452999999997, "r": 257.42447, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Page-footer", "bbox": {"l": 86.372002, "t": 208.29351999999994, "r": 128.89964, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "62", "bbox": {"l": 151.07401, "t": 208.29351999999994, "r": 159.41275, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "62", "bbox": {"l": 177.23795, "t": 208.29351999999994, "r": 185.57669, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "-", "bbox": {"l": 213.91052, "t": 208.29351999999994, "r": 216.94116, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "-", "bbox": {"l": 247.92905000000002, "t": 208.29351999999994, "r": 250.95969, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Page-header", "bbox": {"l": 86.372002, "t": 219.25256000000002, "r": 131.65231, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "72", "bbox": {"l": 151.07401, "t": 219.25256000000002, "r": 159.41275, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "68", "bbox": {"l": 177.23795, "t": 219.25256000000002, "r": 185.57669, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "-", "bbox": {"l": 213.91052, "t": 219.25256000000002, "r": 216.94116, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "-", "bbox": {"l": 247.92905000000002, "t": 219.25256000000002, "r": 250.95969, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Picture", "bbox": {"l": 86.372002, "t": 230.21155, "r": 112.35663, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "72", "bbox": {"l": 151.07401, "t": 230.21155, "r": 159.41275, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "72", "bbox": {"l": 177.23795, "t": 230.21155, "r": 185.57669, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "72", "bbox": {"l": 211.25645, "t": 230.21155, "r": 219.5952, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "72", "bbox": {"l": 245.27496, "t": 230.21155, "r": 253.61371, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "Section-header", "bbox": {"l": 86.372002, "t": 241.16956000000005, "r": 141.11188, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "68", "bbox": {"l": 151.07401, "t": 241.16956000000005, "r": 159.41275, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "67", "bbox": {"l": 177.23795, "t": 241.16956000000005, "r": 185.57669, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "69", "bbox": {"l": 211.25645, "t": 241.16956000000005, "r": 219.5952, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "68", "bbox": {"l": 245.27496, "t": 241.16956000000005, "r": 253.61371, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Table", "bbox": {"l": 86.372002, "t": 252.12854000000004, "r": 106.17878, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "82", "bbox": {"l": 151.07401, "t": 252.12854000000004, "r": 159.41275, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "83", "bbox": {"l": 177.23795, "t": 252.12854000000004, "r": 185.57669, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "82", "bbox": {"l": 211.25645, "t": 252.12854000000004, "r": 219.5952, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "82", "bbox": {"l": 245.27496, "t": 252.12854000000004, "r": 253.61371, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Text", "bbox": {"l": 86.372002, "t": 263.08752000000004, "r": 102.3322, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "85", "bbox": {"l": 151.07401, "t": 263.08752000000004, "r": 159.41275, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "84", "bbox": {"l": 177.23795, "t": 263.08752000000004, "r": 185.57669, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "84", "bbox": {"l": 211.25645, "t": 263.08752000000004, "r": 219.5952, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "84", "bbox": {"l": 245.27496, "t": 263.08752000000004, "r": 253.61371, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "Title", "bbox": {"l": 86.372002, "t": 274.04657, "r": 103.36333, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "77", "bbox": {"l": 151.07401, "t": 274.04657, "r": 159.41275, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "Sec.-h.", "bbox": {"l": 169.37442, "t": 274.04657, "r": 193.43127, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "Sec.-h.", "bbox": {"l": 203.39294, "t": 274.04657, "r": 227.4498, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "Sec.-h.", "bbox": {"l": 237.41147, "t": 274.04657, "r": 261.46832, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "Overall", "bbox": {"l": 86.372002, "t": 285.40454, "r": 113.31602000000001, "b": 293.77917, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "72", "bbox": {"l": 151.07401, "t": 285.40454, "r": 159.41275, "b": 293.77917, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "73", "bbox": {"l": 177.23795, "t": 285.40454, "r": 185.57669, "b": 293.77917, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "78", "bbox": {"l": 211.25645, "t": 285.40454, "r": 219.5952, "b": 293.77917, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "77", "bbox": {"l": 245.27496, "t": 285.40454, "r": 253.61371, "b": 293.77917, "coord_origin": "TOPLEFT"}}], "children": [{"id": 15, "label": "text", "bbox": {"l": 86.372002, "t": 153.10051999999996, "r": 129.46452, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": "Class-count", "bbox": {"l": 86.372002, "t": 153.10051999999996, "r": 129.46452, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 151.07401, "t": 153.10051999999996, "r": 159.41275, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "11", "bbox": {"l": 151.07401, "t": 153.10051999999996, "r": 159.41275, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 179.31816, "t": 153.10051999999996, "r": 183.48753, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "6", "bbox": {"l": 179.31816, "t": 153.10051999999996, "r": 183.48753, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 213.33669, "t": 153.10051999999996, "r": 217.50606, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "5", "bbox": {"l": 213.33669, "t": 153.10051999999996, "r": 217.50606, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 247.35521, "t": 153.10051999999996, "r": 251.52458, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "4", "bbox": {"l": 247.35521, "t": 153.10051999999996, "r": 251.52458, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 86.372002, "t": 164.45752000000005, "r": 115.55763, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "Caption", "bbox": {"l": 86.372002, "t": 164.45752000000005, "r": 115.55763, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 151.07401, "t": 164.45752000000005, "r": 159.41275, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "68", "bbox": {"l": 151.07401, "t": 164.45752000000005, "r": 159.41275, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 173.42723, "t": 164.45752000000005, "r": 189.38742, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "Text", "bbox": {"l": 173.42723, "t": 164.45752000000005, "r": 189.38742, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 207.44576, "t": 164.45752000000005, "r": 223.40594000000002, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "Text", "bbox": {"l": 207.44576, "t": 164.45752000000005, "r": 223.40594000000002, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 241.46428, "t": 164.45752000000005, "r": 257.42447, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "Text", "bbox": {"l": 241.46428, "t": 164.45752000000005, "r": 257.42447, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 86.372002, "t": 175.41656, "r": 118.8752, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "Footnote", "bbox": {"l": 86.372002, "t": 175.41656, "r": 118.8752, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 151.07401, "t": 175.41656, "r": 159.41275, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "71", "bbox": {"l": 151.07401, "t": 175.41656, "r": 159.41275, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 173.42723, "t": 175.41656, "r": 189.38742, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "Text", "bbox": {"l": 173.42723, "t": 175.41656, "r": 189.38742, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 207.44576, "t": 175.41656, "r": 223.40594000000002, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "Text", "bbox": {"l": 207.44576, "t": 175.41656, "r": 223.40594000000002, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 241.46428, "t": 175.41656, "r": 257.42447, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "Text", "bbox": {"l": 241.46428, "t": 175.41656, "r": 257.42447, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 86.372002, "t": 186.37554999999998, "r": 116.88466, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "Formula", "bbox": {"l": 86.372002, "t": 186.37554999999998, "r": 116.88466, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 151.07401, "t": 186.37554999999998, "r": 159.41275, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "60", "bbox": {"l": 151.07401, "t": 186.37554999999998, "r": 159.41275, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 173.42723, "t": 186.37554999999998, "r": 189.38742, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "Text", "bbox": {"l": 173.42723, "t": 186.37554999999998, "r": 189.38742, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 207.44576, "t": 186.37554999999998, "r": 223.40594000000002, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "Text", "bbox": {"l": 207.44576, "t": 186.37554999999998, "r": 223.40594000000002, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 241.46428, "t": 186.37554999999998, "r": 257.42447, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "Text", "bbox": {"l": 241.46428, "t": 186.37554999999998, "r": 257.42447, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 86.372002, "t": 197.33452999999997, "r": 119.25179, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "List-item", "bbox": {"l": 86.372002, "t": 197.33452999999997, "r": 119.25179, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 151.07401, "t": 197.33452999999997, "r": 159.41275, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "81", "bbox": {"l": 151.07401, "t": 197.33452999999997, "r": 159.41275, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 173.42723, "t": 197.33452999999997, "r": 189.38742, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "Text", "bbox": {"l": 173.42723, "t": 197.33452999999997, "r": 189.38742, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 211.25647, "t": 197.33452999999997, "r": 219.59521, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "82", "bbox": {"l": 211.25647, "t": 197.33452999999997, "r": 219.59521, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 241.46426, "t": 197.33452999999997, "r": 257.42447, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "Text", "bbox": {"l": 241.46426, "t": 197.33452999999997, "r": 257.42447, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 86.372002, "t": 208.29351999999994, "r": 128.89964, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "Page-footer", "bbox": {"l": 86.372002, "t": 208.29351999999994, "r": 128.89964, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 151.07401, "t": 208.29351999999994, "r": 159.41275, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "62", "bbox": {"l": 151.07401, "t": 208.29351999999994, "r": 159.41275, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 177.23795, "t": 208.29351999999994, "r": 185.57669, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "62", "bbox": {"l": 177.23795, "t": 208.29351999999994, "r": 185.57669, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 213.91052, "t": 208.29351999999994, "r": 216.94116, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "-", "bbox": {"l": 213.91052, "t": 208.29351999999994, "r": 216.94116, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 247.92905000000002, "t": 208.29351999999994, "r": 250.95969, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "-", "bbox": {"l": 247.92905000000002, "t": 208.29351999999994, "r": 250.95969, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 86.372002, "t": 219.25256000000002, "r": 131.65231, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "Page-header", "bbox": {"l": 86.372002, "t": 219.25256000000002, "r": 131.65231, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 151.07401, "t": 219.25256000000002, "r": 159.41275, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "72", "bbox": {"l": 151.07401, "t": 219.25256000000002, "r": 159.41275, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 177.23795, "t": 219.25256000000002, "r": 185.57669, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "68", "bbox": {"l": 177.23795, "t": 219.25256000000002, "r": 185.57669, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 213.91052, "t": 219.25256000000002, "r": 216.94116, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "-", "bbox": {"l": 213.91052, "t": 219.25256000000002, "r": 216.94116, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 247.92905000000002, "t": 219.25256000000002, "r": 250.95969, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "-", "bbox": {"l": 247.92905000000002, "t": 219.25256000000002, "r": 250.95969, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 86.372002, "t": 230.21155, "r": 112.35663, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "Picture", "bbox": {"l": 86.372002, "t": 230.21155, "r": 112.35663, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 151.07401, "t": 230.21155, "r": 159.41275, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "72", "bbox": {"l": 151.07401, "t": 230.21155, "r": 159.41275, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 177.23795, "t": 230.21155, "r": 185.57669, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "72", "bbox": {"l": 177.23795, "t": 230.21155, "r": 185.57669, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 211.25645, "t": 230.21155, "r": 219.5952, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "72", "bbox": {"l": 211.25645, "t": 230.21155, "r": 219.5952, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 245.27496, "t": 230.21155, "r": 253.61371, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "72", "bbox": {"l": 245.27496, "t": 230.21155, "r": 253.61371, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 86.372002, "t": 241.16956000000005, "r": 141.11188, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "Section-header", "bbox": {"l": 86.372002, "t": 241.16956000000005, "r": 141.11188, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 151.07401, "t": 241.16956000000005, "r": 159.41275, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "68", "bbox": {"l": 151.07401, "t": 241.16956000000005, "r": 159.41275, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 177.23795, "t": 241.16956000000005, "r": 185.57669, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "67", "bbox": {"l": 177.23795, "t": 241.16956000000005, "r": 185.57669, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 211.25645, "t": 241.16956000000005, "r": 219.5952, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "69", "bbox": {"l": 211.25645, "t": 241.16956000000005, "r": 219.5952, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 245.27496, "t": 241.16956000000005, "r": 253.61371, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "68", "bbox": {"l": 245.27496, "t": 241.16956000000005, "r": 253.61371, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 86.372002, "t": 252.12854000000004, "r": 106.17878, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "Table", "bbox": {"l": 86.372002, "t": 252.12854000000004, "r": 106.17878, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 151.07401, "t": 252.12854000000004, "r": 159.41275, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "82", "bbox": {"l": 151.07401, "t": 252.12854000000004, "r": 159.41275, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 177.23795, "t": 252.12854000000004, "r": 185.57669, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "83", "bbox": {"l": 177.23795, "t": 252.12854000000004, "r": 185.57669, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 211.25645, "t": 252.12854000000004, "r": 219.5952, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "82", "bbox": {"l": 211.25645, "t": 252.12854000000004, "r": 219.5952, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 245.27496, "t": 252.12854000000004, "r": 253.61371, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "82", "bbox": {"l": 245.27496, "t": 252.12854000000004, "r": 253.61371, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 86.372002, "t": 263.08752000000004, "r": 102.3322, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "Text", "bbox": {"l": 86.372002, "t": 263.08752000000004, "r": 102.3322, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 151.07401, "t": 263.08752000000004, "r": 159.41275, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "85", "bbox": {"l": 151.07401, "t": 263.08752000000004, "r": 159.41275, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 177.23795, "t": 263.08752000000004, "r": 185.57669, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "84", "bbox": {"l": 177.23795, "t": 263.08752000000004, "r": 185.57669, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 211.25645, "t": 263.08752000000004, "r": 219.5952, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "84", "bbox": {"l": 211.25645, "t": 263.08752000000004, "r": 219.5952, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 245.27496, "t": 263.08752000000004, "r": 253.61371, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "84", "bbox": {"l": 245.27496, "t": 263.08752000000004, "r": 253.61371, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 86.372002, "t": 274.04657, "r": 103.36333, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "Title", "bbox": {"l": 86.372002, "t": 274.04657, "r": 103.36333, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 151.07401, "t": 274.04657, "r": 159.41275, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "77", "bbox": {"l": 151.07401, "t": 274.04657, "r": 159.41275, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 169.37442, "t": 274.04657, "r": 193.43127, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "Sec.-h.", "bbox": {"l": 169.37442, "t": 274.04657, "r": 193.43127, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 203.39294, "t": 274.04657, "r": 227.4498, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "Sec.-h.", "bbox": {"l": 203.39294, "t": 274.04657, "r": 227.4498, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 237.41147, "t": 274.04657, "r": 261.46832, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "Sec.-h.", "bbox": {"l": 237.41147, "t": 274.04657, "r": 261.46832, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 86.372002, "t": 285.40454, "r": 113.31602000000001, "b": 293.77917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "Overall", "bbox": {"l": 86.372002, "t": 285.40454, "r": 113.31602000000001, "b": 293.77917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 151.07401, "t": 285.40454, "r": 159.41275, "b": 293.77917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "72", "bbox": {"l": 151.07401, "t": 285.40454, "r": 159.41275, "b": 293.77917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 177.23795, "t": 285.40454, "r": 185.57669, "b": 293.77917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "73", "bbox": {"l": 177.23795, "t": 285.40454, "r": 185.57669, "b": 293.77917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 211.25645, "t": 285.40454, "r": 219.5952, "b": 293.77917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "78", "bbox": {"l": 211.25645, "t": 285.40454, "r": 219.5952, "b": 293.77917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 245.27496, "t": 285.40454, "r": 253.61371, "b": 293.77917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "77", "bbox": {"l": 245.27496, "t": 285.40454, "r": 253.61371, "b": 293.77917, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 13, "num_cols": 5, "table_cells": [{"bbox": {"l": 86.372002, "t": 153.10051999999996, "r": 129.46452, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Class-count", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 151.07401, "t": 153.10051999999996, "r": 159.41275, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "11", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 179.31816, "t": 153.10051999999996, "r": 183.48753, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "6", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 213.33669, "t": 153.10051999999996, "r": 217.50606, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "5", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 247.35521, "t": 153.10051999999996, "r": 251.52458, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "4", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 164.45752000000005, "r": 115.55763, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Caption", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 164.45752000000005, "r": 159.41275, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 173.42723, "t": 164.45752000000005, "r": 189.38742, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 207.44576, "t": 164.45752000000005, "r": 223.40594000000002, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 241.46428, "t": 164.45752000000005, "r": 257.42447, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 175.41656, "r": 118.8752, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Footnote", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 175.41656, "r": 159.41275, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "71", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 173.42723, "t": 175.41656, "r": 189.38742, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 207.44576, "t": 175.41656, "r": 223.40594000000002, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 241.46428, "t": 175.41656, "r": 257.42447, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 186.37554999999998, "r": 116.88466, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Formula", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 186.37554999999998, "r": 159.41275, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "60", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 173.42723, "t": 186.37554999999998, "r": 189.38742, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 207.44576, "t": 186.37554999999998, "r": 223.40594000000002, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 241.46428, "t": 186.37554999999998, "r": 257.42447, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 197.33452999999997, "r": 119.25179, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "List-item", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 197.33452999999997, "r": 159.41275, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 173.42723, "t": 197.33452999999997, "r": 189.38742, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 211.25647, "t": 197.33452999999997, "r": 219.59521, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 241.46426, "t": 197.33452999999997, "r": 257.42447, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 208.29351999999994, "r": 128.89964, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-footer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 208.29351999999994, "r": 159.41275, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "62", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23795, "t": 208.29351999999994, "r": 185.57669, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "62", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 213.91052, "t": 208.29351999999994, "r": 216.94116, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 247.92905000000002, "t": 208.29351999999994, "r": 250.95969, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 219.25256000000002, "r": 131.65231, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 219.25256000000002, "r": 159.41275, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23795, "t": 219.25256000000002, "r": 185.57669, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 213.91052, "t": 219.25256000000002, "r": 216.94116, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 247.92905000000002, "t": 219.25256000000002, "r": 250.95969, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 230.21155, "r": 112.35663, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Picture", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 230.21155, "r": 159.41275, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23795, "t": 230.21155, "r": 185.57669, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 211.25645, "t": 230.21155, "r": 219.5952, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.27496, "t": 230.21155, "r": 253.61371, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 241.16956000000005, "r": 141.11188, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Section-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 241.16956000000005, "r": 159.41275, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23795, "t": 241.16956000000005, "r": 185.57669, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "67", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 211.25645, "t": 241.16956000000005, "r": 219.5952, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "69", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.27496, "t": 241.16956000000005, "r": 253.61371, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 252.12854000000004, "r": 106.17878, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 252.12854000000004, "r": 159.41275, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23795, "t": 252.12854000000004, "r": 185.57669, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 211.25645, "t": 252.12854000000004, "r": 219.5952, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.27496, "t": 252.12854000000004, "r": 253.61371, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 263.08752000000004, "r": 102.3322, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Text", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 263.08752000000004, "r": 159.41275, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23795, "t": 263.08752000000004, "r": 185.57669, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 211.25645, "t": 263.08752000000004, "r": 219.5952, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.27496, "t": 263.08752000000004, "r": 253.61371, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 274.04657, "r": 103.36333, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Title", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 274.04657, "r": 159.41275, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 169.37442, "t": 274.04657, "r": 193.43127, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Sec.-h.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 203.39294, "t": 274.04657, "r": 227.4498, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Sec.-h.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 237.41147, "t": 274.04657, "r": 261.46832, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Sec.-h.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 285.40454, "r": 113.31602000000001, "b": 293.77917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Overall", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 285.40454, "r": 159.41275, "b": 293.77917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23795, "t": 285.40454, "r": 185.57669, "b": 293.77917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "73", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 211.25645, "t": 285.40454, "r": 219.5952, "b": 293.77917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "78", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.27496, "t": 285.40454, "r": 253.61371, "b": 293.77917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "77", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "section_header", "id": 10, "page_no": 6, "cluster": {"id": 10, "label": "section_header", "bbox": {"l": 53.79800000000001, "t": 319.56992, "r": 131.05624, "b": 329.879, "coord_origin": "TOPLEFT"}, "confidence": 0.9555687308311462, "cells": [{"id": 71, "text": "Learning Curve", "bbox": {"l": 53.79800000000001, "t": 319.56992, "r": 131.05624, "b": 329.879, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Learning Curve"}, {"label": "text", "id": 5, "page_no": 6, "cluster": {"id": 5, "label": "text", "bbox": {"l": 52.785, "t": 334.77155, "r": 295.55835, "b": 529.44818, "coord_origin": "TOPLEFT"}, "confidence": 0.9857739210128784, "cells": [{"id": 72, "text": "One of the fundamental questions related to any dataset is if it is", "bbox": {"l": 53.79800000000001, "t": 334.77155, "r": 294.04153, "b": 343.14618, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "\u201clarge enough\u201d. To answer this question for DocLayNet, we per-", "bbox": {"l": 52.785, "t": 345.73053, "r": 295.55835, "b": 354.10516000000007, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "formed a data ablation study in which we evaluated a Mask R-CNN", "bbox": {"l": 53.79800000000001, "t": 356.6895400000001, "r": 294.04535, "b": 365.06418, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "model trained on increasing fractions of the DocLayNet dataset.", "bbox": {"l": 53.79800000000001, "t": 367.64853, "r": 295.4281, "b": 376.02316, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "As can be seen in Figure 5, the mAP score rises sharply in the be-", "bbox": {"l": 53.484001, "t": 378.60754, "r": 295.55667, "b": 386.98218, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "ginning and eventually levels out. To estimate the error-bar on the", "bbox": {"l": 53.79800000000001, "t": 389.56653, "r": 294.04865, "b": 397.94116, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "metrics, we ran the training five times on the entire data-set. This", "bbox": {"l": 53.79800000000001, "t": 400.52554000000003, "r": 294.04376, "b": 408.90018, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "resulted in a 1% error-bar, depicted by the shaded area in Figure 5.", "bbox": {"l": 53.79800000000001, "t": 411.48456, "r": 295.42459, "b": 419.85919, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "In the inset of Figure 5, we show the exact same data-points, but", "bbox": {"l": 53.79800000000001, "t": 422.44354, "r": 294.04709, "b": 430.81818, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "with a logarithmic scale on the x-axis. As is expected, the mAP", "bbox": {"l": 53.466999, "t": 433.40253000000007, "r": 294.04535, "b": 441.7771599999999, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "score increases linearly as a function of the data-size in the inset.", "bbox": {"l": 53.79800000000001, "t": 444.36053000000004, "r": 295.42902, "b": 452.73517, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "The curve ultimately flattens out between the 80% and 100% mark,", "bbox": {"l": 53.528999, "t": 455.31955, "r": 295.03122, "b": 463.69418, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "with the 80% mark falling within the error-bars of the 100% mark.", "bbox": {"l": 53.466999, "t": 466.27853, "r": 295.42154, "b": 474.65317, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "This provides a good indication that the model would not improve", "bbox": {"l": 53.528999, "t": 477.23755, "r": 294.04553, "b": 485.61218, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "significantly by yet increasing the data size. Rather, it would prob-", "bbox": {"l": 53.79800000000001, "t": 488.19653, "r": 295.55646, "b": 496.57117, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "ably benefit more from improved data consistency (as discussed", "bbox": {"l": 53.79800000000001, "t": 499.15555, "r": 294.04715, "b": 507.53018, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "in Section 3), data augmentation methods [23], or the addition of", "bbox": {"l": 53.79800000000001, "t": 510.11453, "r": 294.04245, "b": 518.4891700000001, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "more document categories and styles.", "bbox": {"l": 53.79800000000001, "t": 521.0735500000001, "r": 191.47707, "b": 529.44818, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "One of the fundamental questions related to any dataset is if it is \u201clarge enough\u201d. To answer this question for DocLayNet, we performed a data ablation study in which we evaluated a Mask R-CNN model trained on increasing fractions of the DocLayNet dataset. As can be seen in Figure 5, the mAP score rises sharply in the beginning and eventually levels out. To estimate the error-bar on the metrics, we ran the training five times on the entire data-set. This resulted in a 1% error-bar, depicted by the shaded area in Figure 5. In the inset of Figure 5, we show the exact same data-points, but with a logarithmic scale on the x-axis. As is expected, the mAP score increases linearly as a function of the data-size in the inset. The curve ultimately flattens out between the 80% and 100% mark, with the 80% mark falling within the error-bars of the 100% mark. This provides a good indication that the model would not improve significantly by yet increasing the data size. Rather, it would probably benefit more from improved data consistency (as discussed in Section 3), data augmentation methods [23], or the addition of more document categories and styles."}, {"label": "section_header", "id": 8, "page_no": 6, "cluster": {"id": 8, "label": "section_header", "bbox": {"l": 53.79800000000001, "t": 542.50992, "r": 164.32898, "b": 552.81902, "coord_origin": "TOPLEFT"}, "confidence": 0.9572024941444397, "cells": [{"id": 90, "text": "Impact of Class Labels", "bbox": {"l": 53.79800000000001, "t": 542.50992, "r": 164.32898, "b": 552.81902, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Impact of Class Labels"}, {"label": "text", "id": 1, "page_no": 6, "cluster": {"id": 1, "label": "text", "bbox": {"l": 53.466999, "t": 557.71155, "r": 295.55679, "b": 708.55217, "coord_origin": "TOPLEFT"}, "confidence": 0.9876301884651184, "cells": [{"id": 91, "text": "The choice and number of labels can have a significant effect on", "bbox": {"l": 53.528999, "t": 557.71155, "r": 294.04333, "b": 566.08617, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "the overall model performance. Since PubLayNet, DocBank and", "bbox": {"l": 53.79800000000001, "t": 568.6705499999999, "r": 294.04712, "b": 577.04517, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "DocLayNet all have different label sets, it is of particular interest to", "bbox": {"l": 53.79800000000001, "t": 579.62955, "r": 294.04538, "b": 588.0041699999999, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "understand and quantify this influence of the label set on the model", "bbox": {"l": 53.79800000000001, "t": 590.5885499999999, "r": 294.04535, "b": 598.96317, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "performance. We investigate this by either down-mapping labels", "bbox": {"l": 53.79800000000001, "t": 601.54755, "r": 294.04266, "b": 609.92216, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "into more common ones (e.g.", "bbox": {"l": 53.79800000000001, "t": 612.50656, "r": 163.59247, "b": 620.88118, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "Caption", "bbox": {"l": 166.26401, "t": 612.55139, "r": 194.97244, "b": 620.89015, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "\u2192", "bbox": {"l": 194.994, "t": 612.45276, "r": 204.1756, "b": 620.15491, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "Text", "bbox": {"l": 204.17599, "t": 612.55139, "r": 219.33961000000002, "b": 620.89015, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": ") or excluding them", "bbox": {"l": 219.849, "t": 612.50656, "r": 294.04828, "b": 620.88118, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "from the annotations entirely. Furthermore, it must be stressed", "bbox": {"l": 53.79800000000001, "t": 623.46556, "r": 294.04709, "b": 631.84018, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "that all mappings and exclusions were performed on the data be-", "bbox": {"l": 53.79800000000001, "t": 634.42355, "r": 295.55679, "b": 642.79817, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "fore model training. In Table 3, we present the mAP scores for a", "bbox": {"l": 53.79800000000001, "t": 645.38255, "r": 294.04715, "b": 653.75717, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "Mask R-CNN R50 network on different label sets. Where a label", "bbox": {"l": 53.79800000000001, "t": 656.34155, "r": 294.04715, "b": 664.71617, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "is down-mapped, we show its corresponding label, otherwise it", "bbox": {"l": 53.79800000000001, "t": 667.30055, "r": 294.04712, "b": 675.67517, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "was excluded. We present three different label sets, with 6, 5 and 4", "bbox": {"l": 53.466999, "t": 678.25955, "r": 294.25174, "b": 686.63417, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "different labels respectively. The set of 5 labels contains the same", "bbox": {"l": 53.79800000000001, "t": 689.21855, "r": 294.04639, "b": 697.59317, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "labels as PubLayNet. However, due to the different definition of", "bbox": {"l": 53.79800000000001, "t": 700.177551, "r": 294.04712, "b": 708.55217, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The choice and number of labels can have a significant effect on the overall model performance. Since PubLayNet, DocBank and DocLayNet all have different label sets, it is of particular interest to understand and quantify this influence of the label set on the model performance. We investigate this by either down-mapping labels into more common ones (e.g. Caption \u2192 Text ) or excluding them from the annotations entirely. Furthermore, it must be stressed that all mappings and exclusions were performed on the data before model training. In Table 3, we present the mAP scores for a Mask R-CNN R50 network on different label sets. Where a label is down-mapped, we show its corresponding label, otherwise it was excluded. We present three different label sets, with 6, 5 and 4 different labels respectively. The set of 5 labels contains the same labels as PubLayNet. However, due to the different definition of"}, {"label": "text", "id": 13, "page_no": 6, "cluster": {"id": 13, "label": "text", "bbox": {"l": 317.659, "t": 86.87298999999996, "r": 559.80682, "b": 128.22321, "coord_origin": "TOPLEFT"}, "confidence": 0.87362140417099, "cells": [{"id": 109, "text": "Table 4: Performance of a Mask R-CNN R50 network with", "bbox": {"l": 317.659, "t": 86.87298999999996, "r": 558.20068, "b": 95.34625000000017, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "document-wise and page-wise split for different label sets.", "bbox": {"l": 317.95499, "t": 97.83196999999996, "r": 559.73401, "b": 106.30524000000003, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "Naive page-wise split will result in", "bbox": {"l": 317.95499, "t": 108.79094999999995, "r": 467.72089, "b": 117.26422000000014, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "GLYPH<tildelow>", "bbox": {"l": 471.90900000000005, "t": 107.12798999999995, "r": 477.53900000000004, "b": 115.19768999999997, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "10% point improve-", "bbox": {"l": 477.54001000000005, "t": 108.79094999999995, "r": 559.80682, "b": 117.26422000000014, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "ment.", "bbox": {"l": 317.95502, "t": 119.74993999999992, "r": 341.37524, "b": 128.22321, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 4: Performance of a Mask R-CNN R50 network with document-wise and page-wise split for different label sets. Naive page-wise split will result in GLYPH<tildelow> 10% point improvement."}, {"label": "table", "id": 0, "page_no": 6, "cluster": {"id": 0, "label": "table", "bbox": {"l": 352.97747802734375, "t": 150.79122924804688, "r": 522.9158935546875, "b": 306.265869140625, "coord_origin": "TOPLEFT"}, "confidence": 0.9879695177078247, "cells": [{"id": 115, "text": "Class-count", "bbox": {"l": 358.63901, "t": 153.10051999999996, "r": 401.73154, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "11", "bbox": {"l": 440.22501, "t": 153.10051999999996, "r": 448.56375, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "5", "bbox": {"l": 494.38, "t": 153.10051999999996, "r": 498.54938, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "Split", "bbox": {"l": 358.63901, "t": 164.05951000000005, "r": 375.27167, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "Doc", "bbox": {"l": 423.341, "t": 164.05951000000005, "r": 438.0459, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "Page", "bbox": {"l": 448.00757, "t": 164.05951000000005, "r": 465.4472, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "Doc", "bbox": {"l": 475.41101, "t": 164.05951000000005, "r": 490.11591, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Page", "bbox": {"l": 500.07757999999995, "t": 164.05951000000005, "r": 517.51721, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "Caption", "bbox": {"l": 358.63901, "t": 175.41656, "r": 387.82465, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "68", "bbox": {"l": 426.52399, "t": 175.41656, "r": 434.86273, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "83", "bbox": {"l": 452.56240999999994, "t": 175.41656, "r": 460.90115000000003, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "Footnote", "bbox": {"l": 358.63901, "t": 186.37554999999998, "r": 391.14221, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "71", "bbox": {"l": 426.52399, "t": 186.37554999999998, "r": 434.86273, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "84", "bbox": {"l": 452.56240999999994, "t": 186.37554999999998, "r": 460.90115000000003, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "Formula", "bbox": {"l": 358.63901, "t": 197.33452999999997, "r": 389.15167, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "60", "bbox": {"l": 426.52399, "t": 197.33452999999997, "r": 434.86273, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "66", "bbox": {"l": 452.56240999999994, "t": 197.33452999999997, "r": 460.90115000000003, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "List-item", "bbox": {"l": 358.63901, "t": 208.29351999999994, "r": 391.5188, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "81", "bbox": {"l": 426.52399, "t": 208.29351999999994, "r": 434.86273, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "88", "bbox": {"l": 452.56240999999994, "t": 208.29351999999994, "r": 460.90115000000003, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "82", "bbox": {"l": 478.59399, "t": 208.29351999999994, "r": 486.93274, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "88", "bbox": {"l": 504.6324200000001, "t": 208.29351999999994, "r": 512.97119, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "Page-footer", "bbox": {"l": 358.63901, "t": 219.25256000000002, "r": 401.16666, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "62", "bbox": {"l": 426.52399, "t": 219.25256000000002, "r": 434.86273, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "89", "bbox": {"l": 452.56240999999994, "t": 219.25256000000002, "r": 460.90115000000003, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "Page-header", "bbox": {"l": 358.63901, "t": 230.21155, "r": 403.91931, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "72", "bbox": {"l": 426.52399, "t": 230.21155, "r": 434.86273, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "90", "bbox": {"l": 452.56240999999994, "t": 230.21155, "r": 460.90115000000003, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "Picture", "bbox": {"l": 358.63901, "t": 241.16956000000005, "r": 384.62366, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "72", "bbox": {"l": 426.52399, "t": 241.16956000000005, "r": 434.86273, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "82", "bbox": {"l": 452.56240999999994, "t": 241.16956000000005, "r": 460.90115000000003, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "72", "bbox": {"l": 478.59399, "t": 241.16956000000005, "r": 486.93274, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "82", "bbox": {"l": 504.6324200000001, "t": 241.16956000000005, "r": 512.97119, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "Section-header", "bbox": {"l": 358.63901, "t": 252.12854000000004, "r": 413.37891, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "68", "bbox": {"l": 426.52399, "t": 252.12854000000004, "r": 434.86273, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "83", "bbox": {"l": 452.56240999999994, "t": 252.12854000000004, "r": 460.90115000000003, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "69", "bbox": {"l": 478.59399, "t": 252.12854000000004, "r": 486.93274, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "83", "bbox": {"l": 504.6324200000001, "t": 252.12854000000004, "r": 512.97119, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "Table", "bbox": {"l": 358.63901, "t": 263.08752000000004, "r": 378.44577, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "82", "bbox": {"l": 426.52399, "t": 263.08752000000004, "r": 434.86273, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "89", "bbox": {"l": 452.56240999999994, "t": 263.08752000000004, "r": 460.90115000000003, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "82", "bbox": {"l": 478.59399, "t": 263.08752000000004, "r": 486.93274, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "90", "bbox": {"l": 504.6324200000001, "t": 263.08752000000004, "r": 512.97119, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "Text", "bbox": {"l": 358.63901, "t": 274.04657, "r": 374.59921, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "85", "bbox": {"l": 426.52399, "t": 274.04657, "r": 434.86273, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "91", "bbox": {"l": 452.56240999999994, "t": 274.04657, "r": 460.90115000000003, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "84", "bbox": {"l": 478.59399, "t": 274.04657, "r": 486.93274, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "90", "bbox": {"l": 504.6324200000001, "t": 274.04657, "r": 512.97119, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "Title", "bbox": {"l": 358.63901, "t": 285.00552, "r": 375.63034, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "77", "bbox": {"l": 426.52399, "t": 285.00552, "r": 434.86273, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "81", "bbox": {"l": 452.56240999999994, "t": 285.00552, "r": 460.90115000000003, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "All", "bbox": {"l": 358.63901, "t": 296.36255, "r": 369.60492, "b": 304.73718, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "72", "bbox": {"l": 426.52399, "t": 296.36255, "r": 434.86273, "b": 304.73718, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "84", "bbox": {"l": 452.56240999999994, "t": 296.36255, "r": 460.90115000000003, "b": 304.73718, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "78", "bbox": {"l": 478.59399, "t": 296.36255, "r": 486.93274, "b": 304.73718, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "87", "bbox": {"l": 504.6324200000001, "t": 296.36255, "r": 512.97119, "b": 304.73718, "coord_origin": "TOPLEFT"}}], "children": [{"id": 80, "label": "text", "bbox": {"l": 358.63901, "t": 153.10051999999996, "r": 401.73154, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 115, "text": "Class-count", "bbox": {"l": 358.63901, "t": 153.10051999999996, "r": 401.73154, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 440.22501, "t": 153.10051999999996, "r": 448.56375, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 116, "text": "11", "bbox": {"l": 440.22501, "t": 153.10051999999996, "r": 448.56375, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 494.38, "t": 153.10051999999996, "r": 498.54938, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 117, "text": "5", "bbox": {"l": 494.38, "t": 153.10051999999996, "r": 498.54938, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 358.63901, "t": 164.05951000000005, "r": 375.27167, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 118, "text": "Split", "bbox": {"l": 358.63901, "t": 164.05951000000005, "r": 375.27167, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 423.341, "t": 164.05951000000005, "r": 438.0459, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 119, "text": "Doc", "bbox": {"l": 423.341, "t": 164.05951000000005, "r": 438.0459, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 448.00757, "t": 164.05951000000005, "r": 465.4472, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 120, "text": "Page", "bbox": {"l": 448.00757, "t": 164.05951000000005, "r": 465.4472, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 475.41101, "t": 164.05951000000005, "r": 490.11591, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 121, "text": "Doc", "bbox": {"l": 475.41101, "t": 164.05951000000005, "r": 490.11591, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 500.07757999999995, "t": 164.05951000000005, "r": 517.51721, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 122, "text": "Page", "bbox": {"l": 500.07757999999995, "t": 164.05951000000005, "r": 517.51721, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 358.63901, "t": 175.41656, "r": 387.82465, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 123, "text": "Caption", "bbox": {"l": 358.63901, "t": 175.41656, "r": 387.82465, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 426.52399, "t": 175.41656, "r": 434.86273, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 124, "text": "68", "bbox": {"l": 426.52399, "t": 175.41656, "r": 434.86273, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 452.56240999999994, "t": 175.41656, "r": 460.90115000000003, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 125, "text": "83", "bbox": {"l": 452.56240999999994, "t": 175.41656, "r": 460.90115000000003, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 358.63901, "t": 186.37554999999998, "r": 391.14221, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 126, "text": "Footnote", "bbox": {"l": 358.63901, "t": 186.37554999999998, "r": 391.14221, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 426.52399, "t": 186.37554999999998, "r": 434.86273, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 127, "text": "71", "bbox": {"l": 426.52399, "t": 186.37554999999998, "r": 434.86273, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 452.56240999999994, "t": 186.37554999999998, "r": 460.90115000000003, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 128, "text": "84", "bbox": {"l": 452.56240999999994, "t": 186.37554999999998, "r": 460.90115000000003, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 358.63901, "t": 197.33452999999997, "r": 389.15167, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 129, "text": "Formula", "bbox": {"l": 358.63901, "t": 197.33452999999997, "r": 389.15167, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 426.52399, "t": 197.33452999999997, "r": 434.86273, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 130, "text": "60", "bbox": {"l": 426.52399, "t": 197.33452999999997, "r": 434.86273, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 452.56240999999994, "t": 197.33452999999997, "r": 460.90115000000003, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 131, "text": "66", "bbox": {"l": 452.56240999999994, "t": 197.33452999999997, "r": 460.90115000000003, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 358.63901, "t": 208.29351999999994, "r": 391.5188, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 132, "text": "List-item", "bbox": {"l": 358.63901, "t": 208.29351999999994, "r": 391.5188, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 426.52399, "t": 208.29351999999994, "r": 434.86273, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 133, "text": "81", "bbox": {"l": 426.52399, "t": 208.29351999999994, "r": 434.86273, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 452.56240999999994, "t": 208.29351999999994, "r": 460.90115000000003, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 134, "text": "88", "bbox": {"l": 452.56240999999994, "t": 208.29351999999994, "r": 460.90115000000003, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 478.59399, "t": 208.29351999999994, "r": 486.93274, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 135, "text": "82", "bbox": {"l": 478.59399, "t": 208.29351999999994, "r": 486.93274, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 504.6324200000001, "t": 208.29351999999994, "r": 512.97119, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 136, "text": "88", "bbox": {"l": 504.6324200000001, "t": 208.29351999999994, "r": 512.97119, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 358.63901, "t": 219.25256000000002, "r": 401.16666, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 137, "text": "Page-footer", "bbox": {"l": 358.63901, "t": 219.25256000000002, "r": 401.16666, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 426.52399, "t": 219.25256000000002, "r": 434.86273, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 138, "text": "62", "bbox": {"l": 426.52399, "t": 219.25256000000002, "r": 434.86273, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 452.56240999999994, "t": 219.25256000000002, "r": 460.90115000000003, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 139, "text": "89", "bbox": {"l": 452.56240999999994, "t": 219.25256000000002, "r": 460.90115000000003, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 358.63901, "t": 230.21155, "r": 403.91931, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 140, "text": "Page-header", "bbox": {"l": 358.63901, "t": 230.21155, "r": 403.91931, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 426.52399, "t": 230.21155, "r": 434.86273, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 141, "text": "72", "bbox": {"l": 426.52399, "t": 230.21155, "r": 434.86273, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 452.56240999999994, "t": 230.21155, "r": 460.90115000000003, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 142, "text": "90", "bbox": {"l": 452.56240999999994, "t": 230.21155, "r": 460.90115000000003, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 358.63901, "t": 241.16956000000005, "r": 384.62366, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 143, "text": "Picture", "bbox": {"l": 358.63901, "t": 241.16956000000005, "r": 384.62366, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 426.52399, "t": 241.16956000000005, "r": 434.86273, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 144, "text": "72", "bbox": {"l": 426.52399, "t": 241.16956000000005, "r": 434.86273, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 452.56240999999994, "t": 241.16956000000005, "r": 460.90115000000003, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 145, "text": "82", "bbox": {"l": 452.56240999999994, "t": 241.16956000000005, "r": 460.90115000000003, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 478.59399, "t": 241.16956000000005, "r": 486.93274, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 146, "text": "72", "bbox": {"l": 478.59399, "t": 241.16956000000005, "r": 486.93274, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 504.6324200000001, "t": 241.16956000000005, "r": 512.97119, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 147, "text": "82", "bbox": {"l": 504.6324200000001, "t": 241.16956000000005, "r": 512.97119, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 358.63901, "t": 252.12854000000004, "r": 413.37891, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 148, "text": "Section-header", "bbox": {"l": 358.63901, "t": 252.12854000000004, "r": 413.37891, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 114, "label": "text", "bbox": {"l": 426.52399, "t": 252.12854000000004, "r": 434.86273, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 149, "text": "68", "bbox": {"l": 426.52399, "t": 252.12854000000004, "r": 434.86273, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 115, "label": "text", "bbox": {"l": 452.56240999999994, "t": 252.12854000000004, "r": 460.90115000000003, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 150, "text": "83", "bbox": {"l": 452.56240999999994, "t": 252.12854000000004, "r": 460.90115000000003, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 116, "label": "text", "bbox": {"l": 478.59399, "t": 252.12854000000004, "r": 486.93274, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 151, "text": "69", "bbox": {"l": 478.59399, "t": 252.12854000000004, "r": 486.93274, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 117, "label": "text", "bbox": {"l": 504.6324200000001, "t": 252.12854000000004, "r": 512.97119, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 152, "text": "83", "bbox": {"l": 504.6324200000001, "t": 252.12854000000004, "r": 512.97119, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 118, "label": "text", "bbox": {"l": 358.63901, "t": 263.08752000000004, "r": 378.44577, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 153, "text": "Table", "bbox": {"l": 358.63901, "t": 263.08752000000004, "r": 378.44577, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 119, "label": "text", "bbox": {"l": 426.52399, "t": 263.08752000000004, "r": 434.86273, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 154, "text": "82", "bbox": {"l": 426.52399, "t": 263.08752000000004, "r": 434.86273, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 120, "label": "text", "bbox": {"l": 452.56240999999994, "t": 263.08752000000004, "r": 460.90115000000003, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 155, "text": "89", "bbox": {"l": 452.56240999999994, "t": 263.08752000000004, "r": 460.90115000000003, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 121, "label": "text", "bbox": {"l": 478.59399, "t": 263.08752000000004, "r": 486.93274, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 156, "text": "82", "bbox": {"l": 478.59399, "t": 263.08752000000004, "r": 486.93274, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 122, "label": "text", "bbox": {"l": 504.6324200000001, "t": 263.08752000000004, "r": 512.97119, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 157, "text": "90", "bbox": {"l": 504.6324200000001, "t": 263.08752000000004, "r": 512.97119, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 123, "label": "text", "bbox": {"l": 358.63901, "t": 274.04657, "r": 374.59921, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 158, "text": "Text", "bbox": {"l": 358.63901, "t": 274.04657, "r": 374.59921, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 124, "label": "text", "bbox": {"l": 426.52399, "t": 274.04657, "r": 434.86273, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 159, "text": "85", "bbox": {"l": 426.52399, "t": 274.04657, "r": 434.86273, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 125, "label": "text", "bbox": {"l": 452.56240999999994, "t": 274.04657, "r": 460.90115000000003, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 160, "text": "91", "bbox": {"l": 452.56240999999994, "t": 274.04657, "r": 460.90115000000003, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 126, "label": "text", "bbox": {"l": 478.59399, "t": 274.04657, "r": 486.93274, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 161, "text": "84", "bbox": {"l": 478.59399, "t": 274.04657, "r": 486.93274, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 127, "label": "text", "bbox": {"l": 504.6324200000001, "t": 274.04657, "r": 512.97119, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 162, "text": "90", "bbox": {"l": 504.6324200000001, "t": 274.04657, "r": 512.97119, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 128, "label": "text", "bbox": {"l": 358.63901, "t": 285.00552, "r": 375.63034, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 163, "text": "Title", "bbox": {"l": 358.63901, "t": 285.00552, "r": 375.63034, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 129, "label": "text", "bbox": {"l": 426.52399, "t": 285.00552, "r": 434.86273, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 164, "text": "77", "bbox": {"l": 426.52399, "t": 285.00552, "r": 434.86273, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 130, "label": "text", "bbox": {"l": 452.56240999999994, "t": 285.00552, "r": 460.90115000000003, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 165, "text": "81", "bbox": {"l": 452.56240999999994, "t": 285.00552, "r": 460.90115000000003, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 131, "label": "text", "bbox": {"l": 358.63901, "t": 296.36255, "r": 369.60492, "b": 304.73718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 166, "text": "All", "bbox": {"l": 358.63901, "t": 296.36255, "r": 369.60492, "b": 304.73718, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 132, "label": "text", "bbox": {"l": 426.52399, "t": 296.36255, "r": 434.86273, "b": 304.73718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 167, "text": "72", "bbox": {"l": 426.52399, "t": 296.36255, "r": 434.86273, "b": 304.73718, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 133, "label": "text", "bbox": {"l": 452.56240999999994, "t": 296.36255, "r": 460.90115000000003, "b": 304.73718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 168, "text": "84", "bbox": {"l": 452.56240999999994, "t": 296.36255, "r": 460.90115000000003, "b": 304.73718, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 134, "label": "text", "bbox": {"l": 478.59399, "t": 296.36255, "r": 486.93274, "b": 304.73718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 169, "text": "78", "bbox": {"l": 478.59399, "t": 296.36255, "r": 486.93274, "b": 304.73718, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 135, "label": "text", "bbox": {"l": 504.6324200000001, "t": 296.36255, "r": 512.97119, "b": 304.73718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 170, "text": "87", "bbox": {"l": 504.6324200000001, "t": 296.36255, "r": 512.97119, "b": 304.73718, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["fcel", "ched", "lcel", "ched", "lcel", "nl", "fcel", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 14, "num_cols": 5, "table_cells": [{"bbox": {"l": 358.63901, "t": 153.10051999999996, "r": 401.73154, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Class-count", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.22501, "t": 153.10051999999996, "r": 448.56375, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 3, "text": "11", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 494.38, "t": 153.10051999999996, "r": 498.54938, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 5, "text": "5", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 164.05951000000005, "r": 375.27167, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Split", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 423.341, "t": 164.05951000000005, "r": 438.0459, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Doc", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 448.00757, "t": 164.05951000000005, "r": 465.4472, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Page", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 475.41101, "t": 164.05951000000005, "r": 490.11591, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Doc", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 500.07757999999995, "t": 164.05951000000005, "r": 517.51721, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Page", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 175.41656, "r": 387.82465, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Caption", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 175.41656, "r": 434.86273, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 175.41656, "r": 460.90115000000003, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 186.37554999999998, "r": 391.14221, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Footnote", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 186.37554999999998, "r": 434.86273, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "71", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 186.37554999999998, "r": 460.90115000000003, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 197.33452999999997, "r": 389.15167, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Formula", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 197.33452999999997, "r": 434.86273, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "60", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 197.33452999999997, "r": 460.90115000000003, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "66", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 208.29351999999994, "r": 391.5188, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "List-item", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 208.29351999999994, "r": 434.86273, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 208.29351999999994, "r": 460.90115000000003, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 478.59399, "t": 208.29351999999994, "r": 486.93274, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 504.6324200000001, "t": 208.29351999999994, "r": 512.97119, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 219.25256000000002, "r": 401.16666, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-footer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 219.25256000000002, "r": 434.86273, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "62", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 219.25256000000002, "r": 460.90115000000003, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "89", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 230.21155, "r": 403.91931, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 230.21155, "r": 434.86273, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 230.21155, "r": 460.90115000000003, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "90", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 241.16956000000005, "r": 384.62366, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Picture", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 241.16956000000005, "r": 434.86273, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 241.16956000000005, "r": 460.90115000000003, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 478.59399, "t": 241.16956000000005, "r": 486.93274, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 504.6324200000001, "t": 241.16956000000005, "r": 512.97119, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 252.12854000000004, "r": 413.37891, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Section-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 252.12854000000004, "r": 434.86273, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 252.12854000000004, "r": 460.90115000000003, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 478.59399, "t": 252.12854000000004, "r": 486.93274, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "69", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 504.6324200000001, "t": 252.12854000000004, "r": 512.97119, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 263.08752000000004, "r": 378.44577, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 263.08752000000004, "r": 434.86273, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 263.08752000000004, "r": 460.90115000000003, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "89", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 478.59399, "t": 263.08752000000004, "r": 486.93274, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 504.6324200000001, "t": 263.08752000000004, "r": 512.97119, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "90", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 274.04657, "r": 374.59921, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Text", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 274.04657, "r": 434.86273, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 274.04657, "r": 460.90115000000003, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "91", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 478.59399, "t": 274.04657, "r": 486.93274, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 504.6324200000001, "t": 274.04657, "r": 512.97119, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "90", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 285.00552, "r": 375.63034, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Title", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 285.00552, "r": 434.86273, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 285.00552, "r": 460.90115000000003, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 296.36255, "r": 369.60492, "b": 304.73718, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "All", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 296.36255, "r": 434.86273, "b": 304.73718, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 296.36255, "r": 460.90115000000003, "b": 304.73718, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 478.59399, "t": 296.36255, "r": 486.93274, "b": 304.73718, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "78", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 504.6324200000001, "t": 296.36255, "r": 512.97119, "b": 304.73718, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "87", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "text", "id": 6, "page_no": 6, "cluster": {"id": 6, "label": "text", "bbox": {"l": 317.686, "t": 331.40353, "r": 559.58496, "b": 416.49017, "coord_origin": "TOPLEFT"}, "confidence": 0.9740145802497864, "cells": [{"id": 171, "text": "lists in PubLayNet (grouped list-items) versus DocLayNet (separate", "bbox": {"l": 317.95499, "t": 331.40353, "r": 558.20233, "b": 339.77817, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "list-items), the label set of size 4 is the closest to PubLayNet, in the", "bbox": {"l": 317.95499, "t": 342.36255, "r": 558.2005, "b": 350.73718, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "assumption that the", "bbox": {"l": 317.95499, "t": 353.32153, "r": 393.16028, "b": 361.69617000000005, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "List", "bbox": {"l": 395.84201, "t": 353.36639, "r": 409.14905, "b": 361.70514, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "is down-mapped to", "bbox": {"l": 412.33301, "t": 353.32153, "r": 485.02324999999996, "b": 361.69617000000005, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "Text", "bbox": {"l": 487.70401, "t": 353.36639, "r": 502.86761, "b": 361.70514, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "in PubLayNet.", "bbox": {"l": 506.05499, "t": 353.32153, "r": 559.58496, "b": 361.69617000000005, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "The results in Table 3 show that the prediction accuracy on the", "bbox": {"l": 317.686, "t": 364.28054999999995, "r": 558.2002, "b": 372.65518, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "remaining class labels does not change significantly when other", "bbox": {"l": 317.95499, "t": 375.23853, "r": 558.36877, "b": 383.61316, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "classes are merged into them. The overall macro-average improves", "bbox": {"l": 317.95499, "t": 386.19754, "r": 558.19958, "b": 394.57217, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "by around 5%, in particular when", "bbox": {"l": 317.95499, "t": 397.15652, "r": 439.49454, "b": 405.53116000000006, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "Page-footer", "bbox": {"l": 441.728, "t": 397.20139, "r": 481.8616, "b": 405.54013, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "and", "bbox": {"l": 484.74298, "t": 397.15652, "r": 498.23743, "b": 405.53116000000006, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "Page-header", "bbox": {"l": 500.47299, "t": 397.20139, "r": 543.95105, "b": 405.54013, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": "are", "bbox": {"l": 546.83197, "t": 397.15652, "r": 558.20142, "b": 405.53116000000006, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "excluded.", "bbox": {"l": 317.95496, "t": 408.11553999999995, "r": 352.37698, "b": 416.49017, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "lists in PubLayNet (grouped list-items) versus DocLayNet (separate list-items), the label set of size 4 is the closest to PubLayNet, in the assumption that the List is down-mapped to Text in PubLayNet. The results in Table 3 show that the prediction accuracy on the remaining class labels does not change significantly when other classes are merged into them. The overall macro-average improves by around 5%, in particular when Page-footer and Page-header are excluded."}, {"label": "section_header", "id": 9, "page_no": 6, "cluster": {"id": 9, "label": "section_header", "bbox": {"l": 317.95496, "t": 429.3949, "r": 549.8606, "b": 439.70398, "coord_origin": "TOPLEFT"}, "confidence": 0.9562516808509827, "cells": [{"id": 187, "text": "Impact of Document Split in Train and Test Set", "bbox": {"l": 317.95496, "t": 429.3949, "r": 549.8606, "b": 439.70398, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Impact of Document Split in Train and Test Set"}, {"label": "text", "id": 3, "page_no": 6, "cluster": {"id": 3, "label": "text", "bbox": {"l": 317.62299, "t": 444.59653, "r": 559.71381, "b": 595.43718, "coord_origin": "TOPLEFT"}, "confidence": 0.9869834184646606, "cells": [{"id": 188, "text": "Many documents in DocLayNet have a unique styling. In order", "bbox": {"l": 317.95499, "t": 444.59653, "r": 558.36884, "b": 452.97116, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "to avoid overfitting on a particular style, we have split the train-,", "bbox": {"l": 317.95499, "t": 455.55554, "r": 559.19189, "b": 463.93018, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "test- and validation-sets of DocLayNet on document boundaries, i.e.", "bbox": {"l": 317.95499, "t": 466.51453, "r": 559.58185, "b": 474.88916, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "every document contributes pages to only one set. To the best of", "bbox": {"l": 317.95499, "t": 477.47354, "r": 558.20605, "b": 485.84818, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": "our knowledge, this was not considered in PubLayNet or DocBank.", "bbox": {"l": 317.95499, "t": 488.43253, "r": 559.58203, "b": 496.80716, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "To quantify how this affects model performance, we trained and", "bbox": {"l": 317.686, "t": 499.39154, "r": 558.20032, "b": 507.76617, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "evaluated a Mask R-CNN R50 model on a modified dataset version.", "bbox": {"l": 317.95499, "t": 510.35052, "r": 559.5849, "b": 518.72516, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "Here, the train-, test- and validation-sets were obtained by a ran-", "bbox": {"l": 317.95499, "t": 521.30954, "r": 559.71381, "b": 529.68417, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "domised draw over the individual pages. As can be seen in Table 4,", "bbox": {"l": 317.95499, "t": 532.26855, "r": 559.18707, "b": 540.64317, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "the difference in model performance is surprisingly large: page-", "bbox": {"l": 317.95499, "t": 543.22655, "r": 559.71313, "b": 551.60117, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "wise splitting gains", "bbox": {"l": 317.62299, "t": 554.18555, "r": 388.35168, "b": 562.56017, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "\u02dc", "bbox": {"l": 391.36499, "t": 552.50055, "r": 393.98318, "b": 560.87517, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "10% in mAP over the document-wise splitting.", "bbox": {"l": 390.59, "t": 554.18555, "r": 559.58191, "b": 562.56017, "coord_origin": "TOPLEFT"}}, {"id": 201, "text": "Thus, random page-wise splitting of DocLayNet can easily lead", "bbox": {"l": 317.686, "t": 565.14455, "r": 558.20032, "b": 573.51917, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": "to accidental overestimation of model performance and should be", "bbox": {"l": 317.95499, "t": 576.10356, "r": 558.20508, "b": 584.4781800000001, "coord_origin": "TOPLEFT"}}, {"id": 203, "text": "avoided.", "bbox": {"l": 317.95499, "t": 587.06256, "r": 348.50354, "b": 595.43718, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Many documents in DocLayNet have a unique styling. In order to avoid overfitting on a particular style, we have split the train-, test- and validation-sets of DocLayNet on document boundaries, i.e. every document contributes pages to only one set. To the best of our knowledge, this was not considered in PubLayNet or DocBank. To quantify how this affects model performance, we trained and evaluated a Mask R-CNN R50 model on a modified dataset version. Here, the train-, test- and validation-sets were obtained by a randomised draw over the individual pages. As can be seen in Table 4, the difference in model performance is surprisingly large: pagewise splitting gains \u02dc 10% in mAP over the document-wise splitting. Thus, random page-wise splitting of DocLayNet can easily lead to accidental overestimation of model performance and should be avoided."}, {"label": "section_header", "id": 7, "page_no": 6, "cluster": {"id": 7, "label": "section_header", "bbox": {"l": 317.95499, "t": 608.34192, "r": 418.54776, "b": 618.65102, "coord_origin": "TOPLEFT"}, "confidence": 0.9589216113090515, "cells": [{"id": 204, "text": "Dataset Comparison", "bbox": {"l": 317.95499, "t": 608.34192, "r": 418.54776, "b": 618.65102, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Dataset Comparison"}, {"label": "text", "id": 2, "page_no": 6, "cluster": {"id": 2, "label": "text", "bbox": {"l": 317.686, "t": 623.54355, "r": 559.18817, "b": 708.640137, "coord_origin": "TOPLEFT"}, "confidence": 0.9872550964355469, "cells": [{"id": 205, "text": "Throughout this paper, we claim that DocLayNet\u2019s wider variety of", "bbox": {"l": 317.686, "t": 623.54355, "r": 558.20575, "b": 631.91817, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": "document layouts leads to more robust layout detection models. In", "bbox": {"l": 317.95499, "t": 634.50255, "r": 558.20624, "b": 642.87717, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": "Table 5, we provide evidence for that. We trained models on each", "bbox": {"l": 317.686, "t": 645.46155, "r": 558.20319, "b": 653.83617, "coord_origin": "TOPLEFT"}}, {"id": 208, "text": "of the available datasets (PubLayNet, DocBank and DocLayNet)", "bbox": {"l": 317.95499, "t": 656.42055, "r": 558.74377, "b": 664.79517, "coord_origin": "TOPLEFT"}}, {"id": 209, "text": "and evaluated them on the test sets of the other datasets. Due to", "bbox": {"l": 317.95499, "t": 667.37955, "r": 558.20398, "b": 675.7541699999999, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": "the different label sets and annotation styles, a direct comparison", "bbox": {"l": 317.95499, "t": 678.3385499999999, "r": 558.20062, "b": 686.71317, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "is not possible. Hence, we focussed on the common labels among", "bbox": {"l": 317.95499, "t": 689.29755, "r": 558.20343, "b": 697.672173, "coord_origin": "TOPLEFT"}}, {"id": 212, "text": "the datasets. Between PubLayNet and DocLayNet, these are", "bbox": {"l": 317.95499, "t": 700.256554, "r": 531.07666, "b": 708.631172, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "Picture", "bbox": {"l": 533.16199, "t": 700.301384, "r": 557.2561, "b": 708.640137, "coord_origin": "TOPLEFT"}}, {"id": 214, "text": ",", "bbox": {"l": 557.255, "t": 700.256554, "r": 559.18817, "b": 708.631172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Throughout this paper, we claim that DocLayNet\u2019s wider variety of document layouts leads to more robust layout detection models. In Table 5, we provide evidence for that. We trained models on each of the available datasets (PubLayNet, DocBank and DocLayNet) and evaluated them on the test sets of the other datasets. Due to the different label sets and annotation styles, a direct comparison is not possible. Hence, we focussed on the common labels among the datasets. Between PubLayNet and DocLayNet, these are Picture ,"}], "body": [{"label": "text", "id": 14, "page_no": 6, "cluster": {"id": 14, "label": "text", "bbox": {"l": 53.501999, "t": 86.87292000000002, "r": 295.64865, "b": 128.22313999999994, "coord_origin": "TOPLEFT"}, "confidence": 0.8296932578086853, "cells": [{"id": 2, "text": "Table 3: Performance of a Mask R-CNN R50 network in", "bbox": {"l": 53.501999, "t": 86.87292000000002, "r": 294.0437, "b": 95.34618999999998, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "mAP@0.5-0.95 scores trained on DocLayNet with different", "bbox": {"l": 53.79800000000001, "t": 97.83191, "r": 294.04376, "b": 106.30517999999995, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "class label sets. The reduced label sets were obtained by ei-", "bbox": {"l": 53.79800000000001, "t": 108.79088999999999, "r": 295.64865, "b": 117.26415999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "ther down-mapping or dropping labels.", "bbox": {"l": 53.79800000000001, "t": 119.74987999999996, "r": 213.23856, "b": 128.22313999999994, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 3: Performance of a Mask R-CNN R50 network in mAP@0.5-0.95 scores trained on DocLayNet with different class label sets. The reduced label sets were obtained by either down-mapping or dropping labels."}, {"label": "table", "id": 4, "page_no": 6, "cluster": {"id": 4, "label": "table", "bbox": {"l": 80.35525512695312, "t": 150.93629455566406, "r": 267.0082092285156, "b": 295.4454650878906, "coord_origin": "TOPLEFT"}, "confidence": 0.9869412779808044, "cells": [{"id": 6, "text": "Class-count", "bbox": {"l": 86.372002, "t": 153.10051999999996, "r": 129.46452, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "11", "bbox": {"l": 151.07401, "t": 153.10051999999996, "r": 159.41275, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "6", "bbox": {"l": 179.31816, "t": 153.10051999999996, "r": 183.48753, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "5", "bbox": {"l": 213.33669, "t": 153.10051999999996, "r": 217.50606, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "4", "bbox": {"l": 247.35521, "t": 153.10051999999996, "r": 251.52458, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Caption", "bbox": {"l": 86.372002, "t": 164.45752000000005, "r": 115.55763, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "68", "bbox": {"l": 151.07401, "t": 164.45752000000005, "r": 159.41275, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Text", "bbox": {"l": 173.42723, "t": 164.45752000000005, "r": 189.38742, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Text", "bbox": {"l": 207.44576, "t": 164.45752000000005, "r": 223.40594000000002, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Text", "bbox": {"l": 241.46428, "t": 164.45752000000005, "r": 257.42447, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Footnote", "bbox": {"l": 86.372002, "t": 175.41656, "r": 118.8752, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "71", "bbox": {"l": 151.07401, "t": 175.41656, "r": 159.41275, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Text", "bbox": {"l": 173.42723, "t": 175.41656, "r": 189.38742, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Text", "bbox": {"l": 207.44576, "t": 175.41656, "r": 223.40594000000002, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Text", "bbox": {"l": 241.46428, "t": 175.41656, "r": 257.42447, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Formula", "bbox": {"l": 86.372002, "t": 186.37554999999998, "r": 116.88466, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "60", "bbox": {"l": 151.07401, "t": 186.37554999999998, "r": 159.41275, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Text", "bbox": {"l": 173.42723, "t": 186.37554999999998, "r": 189.38742, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "Text", "bbox": {"l": 207.44576, "t": 186.37554999999998, "r": 223.40594000000002, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "Text", "bbox": {"l": 241.46428, "t": 186.37554999999998, "r": 257.42447, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "List-item", "bbox": {"l": 86.372002, "t": 197.33452999999997, "r": 119.25179, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "81", "bbox": {"l": 151.07401, "t": 197.33452999999997, "r": 159.41275, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Text", "bbox": {"l": 173.42723, "t": 197.33452999999997, "r": 189.38742, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "82", "bbox": {"l": 211.25647, "t": 197.33452999999997, "r": 219.59521, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Text", "bbox": {"l": 241.46426, "t": 197.33452999999997, "r": 257.42447, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Page-footer", "bbox": {"l": 86.372002, "t": 208.29351999999994, "r": 128.89964, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "62", "bbox": {"l": 151.07401, "t": 208.29351999999994, "r": 159.41275, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "62", "bbox": {"l": 177.23795, "t": 208.29351999999994, "r": 185.57669, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "-", "bbox": {"l": 213.91052, "t": 208.29351999999994, "r": 216.94116, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "-", "bbox": {"l": 247.92905000000002, "t": 208.29351999999994, "r": 250.95969, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Page-header", "bbox": {"l": 86.372002, "t": 219.25256000000002, "r": 131.65231, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "72", "bbox": {"l": 151.07401, "t": 219.25256000000002, "r": 159.41275, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "68", "bbox": {"l": 177.23795, "t": 219.25256000000002, "r": 185.57669, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "-", "bbox": {"l": 213.91052, "t": 219.25256000000002, "r": 216.94116, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "-", "bbox": {"l": 247.92905000000002, "t": 219.25256000000002, "r": 250.95969, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Picture", "bbox": {"l": 86.372002, "t": 230.21155, "r": 112.35663, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "72", "bbox": {"l": 151.07401, "t": 230.21155, "r": 159.41275, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "72", "bbox": {"l": 177.23795, "t": 230.21155, "r": 185.57669, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "72", "bbox": {"l": 211.25645, "t": 230.21155, "r": 219.5952, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "72", "bbox": {"l": 245.27496, "t": 230.21155, "r": 253.61371, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "Section-header", "bbox": {"l": 86.372002, "t": 241.16956000000005, "r": 141.11188, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "68", "bbox": {"l": 151.07401, "t": 241.16956000000005, "r": 159.41275, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "67", "bbox": {"l": 177.23795, "t": 241.16956000000005, "r": 185.57669, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "69", "bbox": {"l": 211.25645, "t": 241.16956000000005, "r": 219.5952, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "68", "bbox": {"l": 245.27496, "t": 241.16956000000005, "r": 253.61371, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Table", "bbox": {"l": 86.372002, "t": 252.12854000000004, "r": 106.17878, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "82", "bbox": {"l": 151.07401, "t": 252.12854000000004, "r": 159.41275, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "83", "bbox": {"l": 177.23795, "t": 252.12854000000004, "r": 185.57669, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "82", "bbox": {"l": 211.25645, "t": 252.12854000000004, "r": 219.5952, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "82", "bbox": {"l": 245.27496, "t": 252.12854000000004, "r": 253.61371, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Text", "bbox": {"l": 86.372002, "t": 263.08752000000004, "r": 102.3322, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "85", "bbox": {"l": 151.07401, "t": 263.08752000000004, "r": 159.41275, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "84", "bbox": {"l": 177.23795, "t": 263.08752000000004, "r": 185.57669, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "84", "bbox": {"l": 211.25645, "t": 263.08752000000004, "r": 219.5952, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "84", "bbox": {"l": 245.27496, "t": 263.08752000000004, "r": 253.61371, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "Title", "bbox": {"l": 86.372002, "t": 274.04657, "r": 103.36333, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "77", "bbox": {"l": 151.07401, "t": 274.04657, "r": 159.41275, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "Sec.-h.", "bbox": {"l": 169.37442, "t": 274.04657, "r": 193.43127, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "Sec.-h.", "bbox": {"l": 203.39294, "t": 274.04657, "r": 227.4498, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "Sec.-h.", "bbox": {"l": 237.41147, "t": 274.04657, "r": 261.46832, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "Overall", "bbox": {"l": 86.372002, "t": 285.40454, "r": 113.31602000000001, "b": 293.77917, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "72", "bbox": {"l": 151.07401, "t": 285.40454, "r": 159.41275, "b": 293.77917, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "73", "bbox": {"l": 177.23795, "t": 285.40454, "r": 185.57669, "b": 293.77917, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "78", "bbox": {"l": 211.25645, "t": 285.40454, "r": 219.5952, "b": 293.77917, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "77", "bbox": {"l": 245.27496, "t": 285.40454, "r": 253.61371, "b": 293.77917, "coord_origin": "TOPLEFT"}}], "children": [{"id": 15, "label": "text", "bbox": {"l": 86.372002, "t": 153.10051999999996, "r": 129.46452, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": "Class-count", "bbox": {"l": 86.372002, "t": 153.10051999999996, "r": 129.46452, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 151.07401, "t": 153.10051999999996, "r": 159.41275, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "11", "bbox": {"l": 151.07401, "t": 153.10051999999996, "r": 159.41275, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 179.31816, "t": 153.10051999999996, "r": 183.48753, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "6", "bbox": {"l": 179.31816, "t": 153.10051999999996, "r": 183.48753, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 213.33669, "t": 153.10051999999996, "r": 217.50606, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "5", "bbox": {"l": 213.33669, "t": 153.10051999999996, "r": 217.50606, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 247.35521, "t": 153.10051999999996, "r": 251.52458, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "4", "bbox": {"l": 247.35521, "t": 153.10051999999996, "r": 251.52458, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 86.372002, "t": 164.45752000000005, "r": 115.55763, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "Caption", "bbox": {"l": 86.372002, "t": 164.45752000000005, "r": 115.55763, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 151.07401, "t": 164.45752000000005, "r": 159.41275, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "68", "bbox": {"l": 151.07401, "t": 164.45752000000005, "r": 159.41275, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 173.42723, "t": 164.45752000000005, "r": 189.38742, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "Text", "bbox": {"l": 173.42723, "t": 164.45752000000005, "r": 189.38742, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 207.44576, "t": 164.45752000000005, "r": 223.40594000000002, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "Text", "bbox": {"l": 207.44576, "t": 164.45752000000005, "r": 223.40594000000002, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 241.46428, "t": 164.45752000000005, "r": 257.42447, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "Text", "bbox": {"l": 241.46428, "t": 164.45752000000005, "r": 257.42447, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 86.372002, "t": 175.41656, "r": 118.8752, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "Footnote", "bbox": {"l": 86.372002, "t": 175.41656, "r": 118.8752, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 151.07401, "t": 175.41656, "r": 159.41275, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "71", "bbox": {"l": 151.07401, "t": 175.41656, "r": 159.41275, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 173.42723, "t": 175.41656, "r": 189.38742, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "Text", "bbox": {"l": 173.42723, "t": 175.41656, "r": 189.38742, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 207.44576, "t": 175.41656, "r": 223.40594000000002, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "Text", "bbox": {"l": 207.44576, "t": 175.41656, "r": 223.40594000000002, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 241.46428, "t": 175.41656, "r": 257.42447, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "Text", "bbox": {"l": 241.46428, "t": 175.41656, "r": 257.42447, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 86.372002, "t": 186.37554999999998, "r": 116.88466, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "Formula", "bbox": {"l": 86.372002, "t": 186.37554999999998, "r": 116.88466, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 151.07401, "t": 186.37554999999998, "r": 159.41275, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "60", "bbox": {"l": 151.07401, "t": 186.37554999999998, "r": 159.41275, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 173.42723, "t": 186.37554999999998, "r": 189.38742, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "Text", "bbox": {"l": 173.42723, "t": 186.37554999999998, "r": 189.38742, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 207.44576, "t": 186.37554999999998, "r": 223.40594000000002, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "Text", "bbox": {"l": 207.44576, "t": 186.37554999999998, "r": 223.40594000000002, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 241.46428, "t": 186.37554999999998, "r": 257.42447, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "Text", "bbox": {"l": 241.46428, "t": 186.37554999999998, "r": 257.42447, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 86.372002, "t": 197.33452999999997, "r": 119.25179, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "List-item", "bbox": {"l": 86.372002, "t": 197.33452999999997, "r": 119.25179, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 151.07401, "t": 197.33452999999997, "r": 159.41275, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "81", "bbox": {"l": 151.07401, "t": 197.33452999999997, "r": 159.41275, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 173.42723, "t": 197.33452999999997, "r": 189.38742, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "Text", "bbox": {"l": 173.42723, "t": 197.33452999999997, "r": 189.38742, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 211.25647, "t": 197.33452999999997, "r": 219.59521, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "82", "bbox": {"l": 211.25647, "t": 197.33452999999997, "r": 219.59521, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 241.46426, "t": 197.33452999999997, "r": 257.42447, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "Text", "bbox": {"l": 241.46426, "t": 197.33452999999997, "r": 257.42447, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 86.372002, "t": 208.29351999999994, "r": 128.89964, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "Page-footer", "bbox": {"l": 86.372002, "t": 208.29351999999994, "r": 128.89964, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 151.07401, "t": 208.29351999999994, "r": 159.41275, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "62", "bbox": {"l": 151.07401, "t": 208.29351999999994, "r": 159.41275, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 177.23795, "t": 208.29351999999994, "r": 185.57669, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "62", "bbox": {"l": 177.23795, "t": 208.29351999999994, "r": 185.57669, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 213.91052, "t": 208.29351999999994, "r": 216.94116, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "-", "bbox": {"l": 213.91052, "t": 208.29351999999994, "r": 216.94116, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 247.92905000000002, "t": 208.29351999999994, "r": 250.95969, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "-", "bbox": {"l": 247.92905000000002, "t": 208.29351999999994, "r": 250.95969, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 86.372002, "t": 219.25256000000002, "r": 131.65231, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "Page-header", "bbox": {"l": 86.372002, "t": 219.25256000000002, "r": 131.65231, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 151.07401, "t": 219.25256000000002, "r": 159.41275, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "72", "bbox": {"l": 151.07401, "t": 219.25256000000002, "r": 159.41275, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 177.23795, "t": 219.25256000000002, "r": 185.57669, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "68", "bbox": {"l": 177.23795, "t": 219.25256000000002, "r": 185.57669, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 213.91052, "t": 219.25256000000002, "r": 216.94116, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "-", "bbox": {"l": 213.91052, "t": 219.25256000000002, "r": 216.94116, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 247.92905000000002, "t": 219.25256000000002, "r": 250.95969, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "-", "bbox": {"l": 247.92905000000002, "t": 219.25256000000002, "r": 250.95969, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 86.372002, "t": 230.21155, "r": 112.35663, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "Picture", "bbox": {"l": 86.372002, "t": 230.21155, "r": 112.35663, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 151.07401, "t": 230.21155, "r": 159.41275, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "72", "bbox": {"l": 151.07401, "t": 230.21155, "r": 159.41275, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 177.23795, "t": 230.21155, "r": 185.57669, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "72", "bbox": {"l": 177.23795, "t": 230.21155, "r": 185.57669, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 211.25645, "t": 230.21155, "r": 219.5952, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "72", "bbox": {"l": 211.25645, "t": 230.21155, "r": 219.5952, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 245.27496, "t": 230.21155, "r": 253.61371, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "72", "bbox": {"l": 245.27496, "t": 230.21155, "r": 253.61371, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 86.372002, "t": 241.16956000000005, "r": 141.11188, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "Section-header", "bbox": {"l": 86.372002, "t": 241.16956000000005, "r": 141.11188, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 151.07401, "t": 241.16956000000005, "r": 159.41275, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "68", "bbox": {"l": 151.07401, "t": 241.16956000000005, "r": 159.41275, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 177.23795, "t": 241.16956000000005, "r": 185.57669, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "67", "bbox": {"l": 177.23795, "t": 241.16956000000005, "r": 185.57669, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 211.25645, "t": 241.16956000000005, "r": 219.5952, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "69", "bbox": {"l": 211.25645, "t": 241.16956000000005, "r": 219.5952, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 245.27496, "t": 241.16956000000005, "r": 253.61371, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "68", "bbox": {"l": 245.27496, "t": 241.16956000000005, "r": 253.61371, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 86.372002, "t": 252.12854000000004, "r": 106.17878, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "Table", "bbox": {"l": 86.372002, "t": 252.12854000000004, "r": 106.17878, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 151.07401, "t": 252.12854000000004, "r": 159.41275, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "82", "bbox": {"l": 151.07401, "t": 252.12854000000004, "r": 159.41275, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 177.23795, "t": 252.12854000000004, "r": 185.57669, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "83", "bbox": {"l": 177.23795, "t": 252.12854000000004, "r": 185.57669, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 211.25645, "t": 252.12854000000004, "r": 219.5952, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "82", "bbox": {"l": 211.25645, "t": 252.12854000000004, "r": 219.5952, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 245.27496, "t": 252.12854000000004, "r": 253.61371, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "82", "bbox": {"l": 245.27496, "t": 252.12854000000004, "r": 253.61371, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 86.372002, "t": 263.08752000000004, "r": 102.3322, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "Text", "bbox": {"l": 86.372002, "t": 263.08752000000004, "r": 102.3322, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 151.07401, "t": 263.08752000000004, "r": 159.41275, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "85", "bbox": {"l": 151.07401, "t": 263.08752000000004, "r": 159.41275, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 177.23795, "t": 263.08752000000004, "r": 185.57669, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "84", "bbox": {"l": 177.23795, "t": 263.08752000000004, "r": 185.57669, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 211.25645, "t": 263.08752000000004, "r": 219.5952, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "84", "bbox": {"l": 211.25645, "t": 263.08752000000004, "r": 219.5952, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 245.27496, "t": 263.08752000000004, "r": 253.61371, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "84", "bbox": {"l": 245.27496, "t": 263.08752000000004, "r": 253.61371, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 86.372002, "t": 274.04657, "r": 103.36333, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "Title", "bbox": {"l": 86.372002, "t": 274.04657, "r": 103.36333, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 151.07401, "t": 274.04657, "r": 159.41275, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "77", "bbox": {"l": 151.07401, "t": 274.04657, "r": 159.41275, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 169.37442, "t": 274.04657, "r": 193.43127, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "Sec.-h.", "bbox": {"l": 169.37442, "t": 274.04657, "r": 193.43127, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 203.39294, "t": 274.04657, "r": 227.4498, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "Sec.-h.", "bbox": {"l": 203.39294, "t": 274.04657, "r": 227.4498, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 237.41147, "t": 274.04657, "r": 261.46832, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "Sec.-h.", "bbox": {"l": 237.41147, "t": 274.04657, "r": 261.46832, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 86.372002, "t": 285.40454, "r": 113.31602000000001, "b": 293.77917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "Overall", "bbox": {"l": 86.372002, "t": 285.40454, "r": 113.31602000000001, "b": 293.77917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 151.07401, "t": 285.40454, "r": 159.41275, "b": 293.77917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "72", "bbox": {"l": 151.07401, "t": 285.40454, "r": 159.41275, "b": 293.77917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 177.23795, "t": 285.40454, "r": 185.57669, "b": 293.77917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "73", "bbox": {"l": 177.23795, "t": 285.40454, "r": 185.57669, "b": 293.77917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 211.25645, "t": 285.40454, "r": 219.5952, "b": 293.77917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "78", "bbox": {"l": 211.25645, "t": 285.40454, "r": 219.5952, "b": 293.77917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 245.27496, "t": 285.40454, "r": 253.61371, "b": 293.77917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "77", "bbox": {"l": 245.27496, "t": 285.40454, "r": 253.61371, "b": 293.77917, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 13, "num_cols": 5, "table_cells": [{"bbox": {"l": 86.372002, "t": 153.10051999999996, "r": 129.46452, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Class-count", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 151.07401, "t": 153.10051999999996, "r": 159.41275, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "11", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 179.31816, "t": 153.10051999999996, "r": 183.48753, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "6", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 213.33669, "t": 153.10051999999996, "r": 217.50606, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "5", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 247.35521, "t": 153.10051999999996, "r": 251.52458, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "4", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 164.45752000000005, "r": 115.55763, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Caption", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 164.45752000000005, "r": 159.41275, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 173.42723, "t": 164.45752000000005, "r": 189.38742, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 207.44576, "t": 164.45752000000005, "r": 223.40594000000002, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 241.46428, "t": 164.45752000000005, "r": 257.42447, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 175.41656, "r": 118.8752, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Footnote", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 175.41656, "r": 159.41275, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "71", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 173.42723, "t": 175.41656, "r": 189.38742, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 207.44576, "t": 175.41656, "r": 223.40594000000002, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 241.46428, "t": 175.41656, "r": 257.42447, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 186.37554999999998, "r": 116.88466, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Formula", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 186.37554999999998, "r": 159.41275, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "60", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 173.42723, "t": 186.37554999999998, "r": 189.38742, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 207.44576, "t": 186.37554999999998, "r": 223.40594000000002, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 241.46428, "t": 186.37554999999998, "r": 257.42447, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 197.33452999999997, "r": 119.25179, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "List-item", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 197.33452999999997, "r": 159.41275, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 173.42723, "t": 197.33452999999997, "r": 189.38742, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 211.25647, "t": 197.33452999999997, "r": 219.59521, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 241.46426, "t": 197.33452999999997, "r": 257.42447, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 208.29351999999994, "r": 128.89964, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-footer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 208.29351999999994, "r": 159.41275, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "62", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23795, "t": 208.29351999999994, "r": 185.57669, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "62", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 213.91052, "t": 208.29351999999994, "r": 216.94116, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 247.92905000000002, "t": 208.29351999999994, "r": 250.95969, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 219.25256000000002, "r": 131.65231, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 219.25256000000002, "r": 159.41275, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23795, "t": 219.25256000000002, "r": 185.57669, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 213.91052, "t": 219.25256000000002, "r": 216.94116, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 247.92905000000002, "t": 219.25256000000002, "r": 250.95969, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 230.21155, "r": 112.35663, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Picture", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 230.21155, "r": 159.41275, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23795, "t": 230.21155, "r": 185.57669, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 211.25645, "t": 230.21155, "r": 219.5952, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.27496, "t": 230.21155, "r": 253.61371, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 241.16956000000005, "r": 141.11188, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Section-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 241.16956000000005, "r": 159.41275, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23795, "t": 241.16956000000005, "r": 185.57669, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "67", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 211.25645, "t": 241.16956000000005, "r": 219.5952, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "69", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.27496, "t": 241.16956000000005, "r": 253.61371, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 252.12854000000004, "r": 106.17878, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 252.12854000000004, "r": 159.41275, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23795, "t": 252.12854000000004, "r": 185.57669, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 211.25645, "t": 252.12854000000004, "r": 219.5952, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.27496, "t": 252.12854000000004, "r": 253.61371, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 263.08752000000004, "r": 102.3322, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Text", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 263.08752000000004, "r": 159.41275, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23795, "t": 263.08752000000004, "r": 185.57669, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 211.25645, "t": 263.08752000000004, "r": 219.5952, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.27496, "t": 263.08752000000004, "r": 253.61371, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 274.04657, "r": 103.36333, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Title", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 274.04657, "r": 159.41275, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 169.37442, "t": 274.04657, "r": 193.43127, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Sec.-h.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 203.39294, "t": 274.04657, "r": 227.4498, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Sec.-h.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 237.41147, "t": 274.04657, "r": 261.46832, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Sec.-h.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 285.40454, "r": 113.31602000000001, "b": 293.77917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Overall", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 285.40454, "r": 159.41275, "b": 293.77917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23795, "t": 285.40454, "r": 185.57669, "b": 293.77917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "73", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 211.25645, "t": 285.40454, "r": 219.5952, "b": 293.77917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "78", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.27496, "t": 285.40454, "r": 253.61371, "b": 293.77917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "77", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "section_header", "id": 10, "page_no": 6, "cluster": {"id": 10, "label": "section_header", "bbox": {"l": 53.79800000000001, "t": 319.56992, "r": 131.05624, "b": 329.879, "coord_origin": "TOPLEFT"}, "confidence": 0.9555687308311462, "cells": [{"id": 71, "text": "Learning Curve", "bbox": {"l": 53.79800000000001, "t": 319.56992, "r": 131.05624, "b": 329.879, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Learning Curve"}, {"label": "text", "id": 5, "page_no": 6, "cluster": {"id": 5, "label": "text", "bbox": {"l": 52.785, "t": 334.77155, "r": 295.55835, "b": 529.44818, "coord_origin": "TOPLEFT"}, "confidence": 0.9857739210128784, "cells": [{"id": 72, "text": "One of the fundamental questions related to any dataset is if it is", "bbox": {"l": 53.79800000000001, "t": 334.77155, "r": 294.04153, "b": 343.14618, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "\u201clarge enough\u201d. To answer this question for DocLayNet, we per-", "bbox": {"l": 52.785, "t": 345.73053, "r": 295.55835, "b": 354.10516000000007, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "formed a data ablation study in which we evaluated a Mask R-CNN", "bbox": {"l": 53.79800000000001, "t": 356.6895400000001, "r": 294.04535, "b": 365.06418, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "model trained on increasing fractions of the DocLayNet dataset.", "bbox": {"l": 53.79800000000001, "t": 367.64853, "r": 295.4281, "b": 376.02316, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "As can be seen in Figure 5, the mAP score rises sharply in the be-", "bbox": {"l": 53.484001, "t": 378.60754, "r": 295.55667, "b": 386.98218, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "ginning and eventually levels out. To estimate the error-bar on the", "bbox": {"l": 53.79800000000001, "t": 389.56653, "r": 294.04865, "b": 397.94116, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "metrics, we ran the training five times on the entire data-set. This", "bbox": {"l": 53.79800000000001, "t": 400.52554000000003, "r": 294.04376, "b": 408.90018, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "resulted in a 1% error-bar, depicted by the shaded area in Figure 5.", "bbox": {"l": 53.79800000000001, "t": 411.48456, "r": 295.42459, "b": 419.85919, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "In the inset of Figure 5, we show the exact same data-points, but", "bbox": {"l": 53.79800000000001, "t": 422.44354, "r": 294.04709, "b": 430.81818, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "with a logarithmic scale on the x-axis. As is expected, the mAP", "bbox": {"l": 53.466999, "t": 433.40253000000007, "r": 294.04535, "b": 441.7771599999999, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "score increases linearly as a function of the data-size in the inset.", "bbox": {"l": 53.79800000000001, "t": 444.36053000000004, "r": 295.42902, "b": 452.73517, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "The curve ultimately flattens out between the 80% and 100% mark,", "bbox": {"l": 53.528999, "t": 455.31955, "r": 295.03122, "b": 463.69418, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "with the 80% mark falling within the error-bars of the 100% mark.", "bbox": {"l": 53.466999, "t": 466.27853, "r": 295.42154, "b": 474.65317, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "This provides a good indication that the model would not improve", "bbox": {"l": 53.528999, "t": 477.23755, "r": 294.04553, "b": 485.61218, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "significantly by yet increasing the data size. Rather, it would prob-", "bbox": {"l": 53.79800000000001, "t": 488.19653, "r": 295.55646, "b": 496.57117, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "ably benefit more from improved data consistency (as discussed", "bbox": {"l": 53.79800000000001, "t": 499.15555, "r": 294.04715, "b": 507.53018, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "in Section 3), data augmentation methods [23], or the addition of", "bbox": {"l": 53.79800000000001, "t": 510.11453, "r": 294.04245, "b": 518.4891700000001, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "more document categories and styles.", "bbox": {"l": 53.79800000000001, "t": 521.0735500000001, "r": 191.47707, "b": 529.44818, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "One of the fundamental questions related to any dataset is if it is \u201clarge enough\u201d. To answer this question for DocLayNet, we performed a data ablation study in which we evaluated a Mask R-CNN model trained on increasing fractions of the DocLayNet dataset. As can be seen in Figure 5, the mAP score rises sharply in the beginning and eventually levels out. To estimate the error-bar on the metrics, we ran the training five times on the entire data-set. This resulted in a 1% error-bar, depicted by the shaded area in Figure 5. In the inset of Figure 5, we show the exact same data-points, but with a logarithmic scale on the x-axis. As is expected, the mAP score increases linearly as a function of the data-size in the inset. The curve ultimately flattens out between the 80% and 100% mark, with the 80% mark falling within the error-bars of the 100% mark. This provides a good indication that the model would not improve significantly by yet increasing the data size. Rather, it would probably benefit more from improved data consistency (as discussed in Section 3), data augmentation methods [23], or the addition of more document categories and styles."}, {"label": "section_header", "id": 8, "page_no": 6, "cluster": {"id": 8, "label": "section_header", "bbox": {"l": 53.79800000000001, "t": 542.50992, "r": 164.32898, "b": 552.81902, "coord_origin": "TOPLEFT"}, "confidence": 0.9572024941444397, "cells": [{"id": 90, "text": "Impact of Class Labels", "bbox": {"l": 53.79800000000001, "t": 542.50992, "r": 164.32898, "b": 552.81902, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Impact of Class Labels"}, {"label": "text", "id": 1, "page_no": 6, "cluster": {"id": 1, "label": "text", "bbox": {"l": 53.466999, "t": 557.71155, "r": 295.55679, "b": 708.55217, "coord_origin": "TOPLEFT"}, "confidence": 0.9876301884651184, "cells": [{"id": 91, "text": "The choice and number of labels can have a significant effect on", "bbox": {"l": 53.528999, "t": 557.71155, "r": 294.04333, "b": 566.08617, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "the overall model performance. Since PubLayNet, DocBank and", "bbox": {"l": 53.79800000000001, "t": 568.6705499999999, "r": 294.04712, "b": 577.04517, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "DocLayNet all have different label sets, it is of particular interest to", "bbox": {"l": 53.79800000000001, "t": 579.62955, "r": 294.04538, "b": 588.0041699999999, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "understand and quantify this influence of the label set on the model", "bbox": {"l": 53.79800000000001, "t": 590.5885499999999, "r": 294.04535, "b": 598.96317, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "performance. We investigate this by either down-mapping labels", "bbox": {"l": 53.79800000000001, "t": 601.54755, "r": 294.04266, "b": 609.92216, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "into more common ones (e.g.", "bbox": {"l": 53.79800000000001, "t": 612.50656, "r": 163.59247, "b": 620.88118, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "Caption", "bbox": {"l": 166.26401, "t": 612.55139, "r": 194.97244, "b": 620.89015, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "\u2192", "bbox": {"l": 194.994, "t": 612.45276, "r": 204.1756, "b": 620.15491, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "Text", "bbox": {"l": 204.17599, "t": 612.55139, "r": 219.33961000000002, "b": 620.89015, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": ") or excluding them", "bbox": {"l": 219.849, "t": 612.50656, "r": 294.04828, "b": 620.88118, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "from the annotations entirely. Furthermore, it must be stressed", "bbox": {"l": 53.79800000000001, "t": 623.46556, "r": 294.04709, "b": 631.84018, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "that all mappings and exclusions were performed on the data be-", "bbox": {"l": 53.79800000000001, "t": 634.42355, "r": 295.55679, "b": 642.79817, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "fore model training. In Table 3, we present the mAP scores for a", "bbox": {"l": 53.79800000000001, "t": 645.38255, "r": 294.04715, "b": 653.75717, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "Mask R-CNN R50 network on different label sets. Where a label", "bbox": {"l": 53.79800000000001, "t": 656.34155, "r": 294.04715, "b": 664.71617, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "is down-mapped, we show its corresponding label, otherwise it", "bbox": {"l": 53.79800000000001, "t": 667.30055, "r": 294.04712, "b": 675.67517, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "was excluded. We present three different label sets, with 6, 5 and 4", "bbox": {"l": 53.466999, "t": 678.25955, "r": 294.25174, "b": 686.63417, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "different labels respectively. The set of 5 labels contains the same", "bbox": {"l": 53.79800000000001, "t": 689.21855, "r": 294.04639, "b": 697.59317, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "labels as PubLayNet. However, due to the different definition of", "bbox": {"l": 53.79800000000001, "t": 700.177551, "r": 294.04712, "b": 708.55217, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The choice and number of labels can have a significant effect on the overall model performance. Since PubLayNet, DocBank and DocLayNet all have different label sets, it is of particular interest to understand and quantify this influence of the label set on the model performance. We investigate this by either down-mapping labels into more common ones (e.g. Caption \u2192 Text ) or excluding them from the annotations entirely. Furthermore, it must be stressed that all mappings and exclusions were performed on the data before model training. In Table 3, we present the mAP scores for a Mask R-CNN R50 network on different label sets. Where a label is down-mapped, we show its corresponding label, otherwise it was excluded. We present three different label sets, with 6, 5 and 4 different labels respectively. The set of 5 labels contains the same labels as PubLayNet. However, due to the different definition of"}, {"label": "text", "id": 13, "page_no": 6, "cluster": {"id": 13, "label": "text", "bbox": {"l": 317.659, "t": 86.87298999999996, "r": 559.80682, "b": 128.22321, "coord_origin": "TOPLEFT"}, "confidence": 0.87362140417099, "cells": [{"id": 109, "text": "Table 4: Performance of a Mask R-CNN R50 network with", "bbox": {"l": 317.659, "t": 86.87298999999996, "r": 558.20068, "b": 95.34625000000017, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "document-wise and page-wise split for different label sets.", "bbox": {"l": 317.95499, "t": 97.83196999999996, "r": 559.73401, "b": 106.30524000000003, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "Naive page-wise split will result in", "bbox": {"l": 317.95499, "t": 108.79094999999995, "r": 467.72089, "b": 117.26422000000014, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "GLYPH<tildelow>", "bbox": {"l": 471.90900000000005, "t": 107.12798999999995, "r": 477.53900000000004, "b": 115.19768999999997, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "10% point improve-", "bbox": {"l": 477.54001000000005, "t": 108.79094999999995, "r": 559.80682, "b": 117.26422000000014, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "ment.", "bbox": {"l": 317.95502, "t": 119.74993999999992, "r": 341.37524, "b": 128.22321, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 4: Performance of a Mask R-CNN R50 network with document-wise and page-wise split for different label sets. Naive page-wise split will result in GLYPH<tildelow> 10% point improvement."}, {"label": "table", "id": 0, "page_no": 6, "cluster": {"id": 0, "label": "table", "bbox": {"l": 352.97747802734375, "t": 150.79122924804688, "r": 522.9158935546875, "b": 306.265869140625, "coord_origin": "TOPLEFT"}, "confidence": 0.9879695177078247, "cells": [{"id": 115, "text": "Class-count", "bbox": {"l": 358.63901, "t": 153.10051999999996, "r": 401.73154, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "11", "bbox": {"l": 440.22501, "t": 153.10051999999996, "r": 448.56375, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "5", "bbox": {"l": 494.38, "t": 153.10051999999996, "r": 498.54938, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "Split", "bbox": {"l": 358.63901, "t": 164.05951000000005, "r": 375.27167, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "Doc", "bbox": {"l": 423.341, "t": 164.05951000000005, "r": 438.0459, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "Page", "bbox": {"l": 448.00757, "t": 164.05951000000005, "r": 465.4472, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "Doc", "bbox": {"l": 475.41101, "t": 164.05951000000005, "r": 490.11591, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Page", "bbox": {"l": 500.07757999999995, "t": 164.05951000000005, "r": 517.51721, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "Caption", "bbox": {"l": 358.63901, "t": 175.41656, "r": 387.82465, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "68", "bbox": {"l": 426.52399, "t": 175.41656, "r": 434.86273, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "83", "bbox": {"l": 452.56240999999994, "t": 175.41656, "r": 460.90115000000003, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "Footnote", "bbox": {"l": 358.63901, "t": 186.37554999999998, "r": 391.14221, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "71", "bbox": {"l": 426.52399, "t": 186.37554999999998, "r": 434.86273, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "84", "bbox": {"l": 452.56240999999994, "t": 186.37554999999998, "r": 460.90115000000003, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "Formula", "bbox": {"l": 358.63901, "t": 197.33452999999997, "r": 389.15167, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "60", "bbox": {"l": 426.52399, "t": 197.33452999999997, "r": 434.86273, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "66", "bbox": {"l": 452.56240999999994, "t": 197.33452999999997, "r": 460.90115000000003, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "List-item", "bbox": {"l": 358.63901, "t": 208.29351999999994, "r": 391.5188, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "81", "bbox": {"l": 426.52399, "t": 208.29351999999994, "r": 434.86273, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "88", "bbox": {"l": 452.56240999999994, "t": 208.29351999999994, "r": 460.90115000000003, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "82", "bbox": {"l": 478.59399, "t": 208.29351999999994, "r": 486.93274, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "88", "bbox": {"l": 504.6324200000001, "t": 208.29351999999994, "r": 512.97119, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "Page-footer", "bbox": {"l": 358.63901, "t": 219.25256000000002, "r": 401.16666, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "62", "bbox": {"l": 426.52399, "t": 219.25256000000002, "r": 434.86273, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "89", "bbox": {"l": 452.56240999999994, "t": 219.25256000000002, "r": 460.90115000000003, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "Page-header", "bbox": {"l": 358.63901, "t": 230.21155, "r": 403.91931, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "72", "bbox": {"l": 426.52399, "t": 230.21155, "r": 434.86273, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "90", "bbox": {"l": 452.56240999999994, "t": 230.21155, "r": 460.90115000000003, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "Picture", "bbox": {"l": 358.63901, "t": 241.16956000000005, "r": 384.62366, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "72", "bbox": {"l": 426.52399, "t": 241.16956000000005, "r": 434.86273, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "82", "bbox": {"l": 452.56240999999994, "t": 241.16956000000005, "r": 460.90115000000003, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "72", "bbox": {"l": 478.59399, "t": 241.16956000000005, "r": 486.93274, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "82", "bbox": {"l": 504.6324200000001, "t": 241.16956000000005, "r": 512.97119, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "Section-header", "bbox": {"l": 358.63901, "t": 252.12854000000004, "r": 413.37891, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "68", "bbox": {"l": 426.52399, "t": 252.12854000000004, "r": 434.86273, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "83", "bbox": {"l": 452.56240999999994, "t": 252.12854000000004, "r": 460.90115000000003, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "69", "bbox": {"l": 478.59399, "t": 252.12854000000004, "r": 486.93274, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "83", "bbox": {"l": 504.6324200000001, "t": 252.12854000000004, "r": 512.97119, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "Table", "bbox": {"l": 358.63901, "t": 263.08752000000004, "r": 378.44577, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "82", "bbox": {"l": 426.52399, "t": 263.08752000000004, "r": 434.86273, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "89", "bbox": {"l": 452.56240999999994, "t": 263.08752000000004, "r": 460.90115000000003, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "82", "bbox": {"l": 478.59399, "t": 263.08752000000004, "r": 486.93274, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "90", "bbox": {"l": 504.6324200000001, "t": 263.08752000000004, "r": 512.97119, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "Text", "bbox": {"l": 358.63901, "t": 274.04657, "r": 374.59921, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "85", "bbox": {"l": 426.52399, "t": 274.04657, "r": 434.86273, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "91", "bbox": {"l": 452.56240999999994, "t": 274.04657, "r": 460.90115000000003, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "84", "bbox": {"l": 478.59399, "t": 274.04657, "r": 486.93274, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "90", "bbox": {"l": 504.6324200000001, "t": 274.04657, "r": 512.97119, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "Title", "bbox": {"l": 358.63901, "t": 285.00552, "r": 375.63034, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "77", "bbox": {"l": 426.52399, "t": 285.00552, "r": 434.86273, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "81", "bbox": {"l": 452.56240999999994, "t": 285.00552, "r": 460.90115000000003, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "All", "bbox": {"l": 358.63901, "t": 296.36255, "r": 369.60492, "b": 304.73718, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "72", "bbox": {"l": 426.52399, "t": 296.36255, "r": 434.86273, "b": 304.73718, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "84", "bbox": {"l": 452.56240999999994, "t": 296.36255, "r": 460.90115000000003, "b": 304.73718, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "78", "bbox": {"l": 478.59399, "t": 296.36255, "r": 486.93274, "b": 304.73718, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "87", "bbox": {"l": 504.6324200000001, "t": 296.36255, "r": 512.97119, "b": 304.73718, "coord_origin": "TOPLEFT"}}], "children": [{"id": 80, "label": "text", "bbox": {"l": 358.63901, "t": 153.10051999999996, "r": 401.73154, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 115, "text": "Class-count", "bbox": {"l": 358.63901, "t": 153.10051999999996, "r": 401.73154, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 440.22501, "t": 153.10051999999996, "r": 448.56375, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 116, "text": "11", "bbox": {"l": 440.22501, "t": 153.10051999999996, "r": 448.56375, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 494.38, "t": 153.10051999999996, "r": 498.54938, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 117, "text": "5", "bbox": {"l": 494.38, "t": 153.10051999999996, "r": 498.54938, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 358.63901, "t": 164.05951000000005, "r": 375.27167, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 118, "text": "Split", "bbox": {"l": 358.63901, "t": 164.05951000000005, "r": 375.27167, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 423.341, "t": 164.05951000000005, "r": 438.0459, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 119, "text": "Doc", "bbox": {"l": 423.341, "t": 164.05951000000005, "r": 438.0459, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 448.00757, "t": 164.05951000000005, "r": 465.4472, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 120, "text": "Page", "bbox": {"l": 448.00757, "t": 164.05951000000005, "r": 465.4472, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 475.41101, "t": 164.05951000000005, "r": 490.11591, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 121, "text": "Doc", "bbox": {"l": 475.41101, "t": 164.05951000000005, "r": 490.11591, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 500.07757999999995, "t": 164.05951000000005, "r": 517.51721, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 122, "text": "Page", "bbox": {"l": 500.07757999999995, "t": 164.05951000000005, "r": 517.51721, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 358.63901, "t": 175.41656, "r": 387.82465, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 123, "text": "Caption", "bbox": {"l": 358.63901, "t": 175.41656, "r": 387.82465, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 426.52399, "t": 175.41656, "r": 434.86273, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 124, "text": "68", "bbox": {"l": 426.52399, "t": 175.41656, "r": 434.86273, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 452.56240999999994, "t": 175.41656, "r": 460.90115000000003, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 125, "text": "83", "bbox": {"l": 452.56240999999994, "t": 175.41656, "r": 460.90115000000003, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 358.63901, "t": 186.37554999999998, "r": 391.14221, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 126, "text": "Footnote", "bbox": {"l": 358.63901, "t": 186.37554999999998, "r": 391.14221, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 426.52399, "t": 186.37554999999998, "r": 434.86273, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 127, "text": "71", "bbox": {"l": 426.52399, "t": 186.37554999999998, "r": 434.86273, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 452.56240999999994, "t": 186.37554999999998, "r": 460.90115000000003, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 128, "text": "84", "bbox": {"l": 452.56240999999994, "t": 186.37554999999998, "r": 460.90115000000003, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 358.63901, "t": 197.33452999999997, "r": 389.15167, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 129, "text": "Formula", "bbox": {"l": 358.63901, "t": 197.33452999999997, "r": 389.15167, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 426.52399, "t": 197.33452999999997, "r": 434.86273, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 130, "text": "60", "bbox": {"l": 426.52399, "t": 197.33452999999997, "r": 434.86273, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 452.56240999999994, "t": 197.33452999999997, "r": 460.90115000000003, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 131, "text": "66", "bbox": {"l": 452.56240999999994, "t": 197.33452999999997, "r": 460.90115000000003, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 358.63901, "t": 208.29351999999994, "r": 391.5188, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 132, "text": "List-item", "bbox": {"l": 358.63901, "t": 208.29351999999994, "r": 391.5188, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 426.52399, "t": 208.29351999999994, "r": 434.86273, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 133, "text": "81", "bbox": {"l": 426.52399, "t": 208.29351999999994, "r": 434.86273, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 452.56240999999994, "t": 208.29351999999994, "r": 460.90115000000003, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 134, "text": "88", "bbox": {"l": 452.56240999999994, "t": 208.29351999999994, "r": 460.90115000000003, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 478.59399, "t": 208.29351999999994, "r": 486.93274, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 135, "text": "82", "bbox": {"l": 478.59399, "t": 208.29351999999994, "r": 486.93274, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 504.6324200000001, "t": 208.29351999999994, "r": 512.97119, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 136, "text": "88", "bbox": {"l": 504.6324200000001, "t": 208.29351999999994, "r": 512.97119, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 358.63901, "t": 219.25256000000002, "r": 401.16666, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 137, "text": "Page-footer", "bbox": {"l": 358.63901, "t": 219.25256000000002, "r": 401.16666, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 426.52399, "t": 219.25256000000002, "r": 434.86273, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 138, "text": "62", "bbox": {"l": 426.52399, "t": 219.25256000000002, "r": 434.86273, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 452.56240999999994, "t": 219.25256000000002, "r": 460.90115000000003, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 139, "text": "89", "bbox": {"l": 452.56240999999994, "t": 219.25256000000002, "r": 460.90115000000003, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 358.63901, "t": 230.21155, "r": 403.91931, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 140, "text": "Page-header", "bbox": {"l": 358.63901, "t": 230.21155, "r": 403.91931, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 426.52399, "t": 230.21155, "r": 434.86273, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 141, "text": "72", "bbox": {"l": 426.52399, "t": 230.21155, "r": 434.86273, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 452.56240999999994, "t": 230.21155, "r": 460.90115000000003, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 142, "text": "90", "bbox": {"l": 452.56240999999994, "t": 230.21155, "r": 460.90115000000003, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 358.63901, "t": 241.16956000000005, "r": 384.62366, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 143, "text": "Picture", "bbox": {"l": 358.63901, "t": 241.16956000000005, "r": 384.62366, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 426.52399, "t": 241.16956000000005, "r": 434.86273, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 144, "text": "72", "bbox": {"l": 426.52399, "t": 241.16956000000005, "r": 434.86273, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 452.56240999999994, "t": 241.16956000000005, "r": 460.90115000000003, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 145, "text": "82", "bbox": {"l": 452.56240999999994, "t": 241.16956000000005, "r": 460.90115000000003, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 478.59399, "t": 241.16956000000005, "r": 486.93274, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 146, "text": "72", "bbox": {"l": 478.59399, "t": 241.16956000000005, "r": 486.93274, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 504.6324200000001, "t": 241.16956000000005, "r": 512.97119, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 147, "text": "82", "bbox": {"l": 504.6324200000001, "t": 241.16956000000005, "r": 512.97119, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 358.63901, "t": 252.12854000000004, "r": 413.37891, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 148, "text": "Section-header", "bbox": {"l": 358.63901, "t": 252.12854000000004, "r": 413.37891, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 114, "label": "text", "bbox": {"l": 426.52399, "t": 252.12854000000004, "r": 434.86273, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 149, "text": "68", "bbox": {"l": 426.52399, "t": 252.12854000000004, "r": 434.86273, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 115, "label": "text", "bbox": {"l": 452.56240999999994, "t": 252.12854000000004, "r": 460.90115000000003, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 150, "text": "83", "bbox": {"l": 452.56240999999994, "t": 252.12854000000004, "r": 460.90115000000003, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 116, "label": "text", "bbox": {"l": 478.59399, "t": 252.12854000000004, "r": 486.93274, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 151, "text": "69", "bbox": {"l": 478.59399, "t": 252.12854000000004, "r": 486.93274, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 117, "label": "text", "bbox": {"l": 504.6324200000001, "t": 252.12854000000004, "r": 512.97119, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 152, "text": "83", "bbox": {"l": 504.6324200000001, "t": 252.12854000000004, "r": 512.97119, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 118, "label": "text", "bbox": {"l": 358.63901, "t": 263.08752000000004, "r": 378.44577, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 153, "text": "Table", "bbox": {"l": 358.63901, "t": 263.08752000000004, "r": 378.44577, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 119, "label": "text", "bbox": {"l": 426.52399, "t": 263.08752000000004, "r": 434.86273, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 154, "text": "82", "bbox": {"l": 426.52399, "t": 263.08752000000004, "r": 434.86273, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 120, "label": "text", "bbox": {"l": 452.56240999999994, "t": 263.08752000000004, "r": 460.90115000000003, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 155, "text": "89", "bbox": {"l": 452.56240999999994, "t": 263.08752000000004, "r": 460.90115000000003, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 121, "label": "text", "bbox": {"l": 478.59399, "t": 263.08752000000004, "r": 486.93274, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 156, "text": "82", "bbox": {"l": 478.59399, "t": 263.08752000000004, "r": 486.93274, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 122, "label": "text", "bbox": {"l": 504.6324200000001, "t": 263.08752000000004, "r": 512.97119, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 157, "text": "90", "bbox": {"l": 504.6324200000001, "t": 263.08752000000004, "r": 512.97119, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 123, "label": "text", "bbox": {"l": 358.63901, "t": 274.04657, "r": 374.59921, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 158, "text": "Text", "bbox": {"l": 358.63901, "t": 274.04657, "r": 374.59921, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 124, "label": "text", "bbox": {"l": 426.52399, "t": 274.04657, "r": 434.86273, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 159, "text": "85", "bbox": {"l": 426.52399, "t": 274.04657, "r": 434.86273, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 125, "label": "text", "bbox": {"l": 452.56240999999994, "t": 274.04657, "r": 460.90115000000003, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 160, "text": "91", "bbox": {"l": 452.56240999999994, "t": 274.04657, "r": 460.90115000000003, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 126, "label": "text", "bbox": {"l": 478.59399, "t": 274.04657, "r": 486.93274, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 161, "text": "84", "bbox": {"l": 478.59399, "t": 274.04657, "r": 486.93274, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 127, "label": "text", "bbox": {"l": 504.6324200000001, "t": 274.04657, "r": 512.97119, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 162, "text": "90", "bbox": {"l": 504.6324200000001, "t": 274.04657, "r": 512.97119, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 128, "label": "text", "bbox": {"l": 358.63901, "t": 285.00552, "r": 375.63034, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 163, "text": "Title", "bbox": {"l": 358.63901, "t": 285.00552, "r": 375.63034, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 129, "label": "text", "bbox": {"l": 426.52399, "t": 285.00552, "r": 434.86273, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 164, "text": "77", "bbox": {"l": 426.52399, "t": 285.00552, "r": 434.86273, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 130, "label": "text", "bbox": {"l": 452.56240999999994, "t": 285.00552, "r": 460.90115000000003, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 165, "text": "81", "bbox": {"l": 452.56240999999994, "t": 285.00552, "r": 460.90115000000003, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 131, "label": "text", "bbox": {"l": 358.63901, "t": 296.36255, "r": 369.60492, "b": 304.73718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 166, "text": "All", "bbox": {"l": 358.63901, "t": 296.36255, "r": 369.60492, "b": 304.73718, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 132, "label": "text", "bbox": {"l": 426.52399, "t": 296.36255, "r": 434.86273, "b": 304.73718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 167, "text": "72", "bbox": {"l": 426.52399, "t": 296.36255, "r": 434.86273, "b": 304.73718, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 133, "label": "text", "bbox": {"l": 452.56240999999994, "t": 296.36255, "r": 460.90115000000003, "b": 304.73718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 168, "text": "84", "bbox": {"l": 452.56240999999994, "t": 296.36255, "r": 460.90115000000003, "b": 304.73718, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 134, "label": "text", "bbox": {"l": 478.59399, "t": 296.36255, "r": 486.93274, "b": 304.73718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 169, "text": "78", "bbox": {"l": 478.59399, "t": 296.36255, "r": 486.93274, "b": 304.73718, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 135, "label": "text", "bbox": {"l": 504.6324200000001, "t": 296.36255, "r": 512.97119, "b": 304.73718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 170, "text": "87", "bbox": {"l": 504.6324200000001, "t": 296.36255, "r": 512.97119, "b": 304.73718, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["fcel", "ched", "lcel", "ched", "lcel", "nl", "fcel", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 14, "num_cols": 5, "table_cells": [{"bbox": {"l": 358.63901, "t": 153.10051999999996, "r": 401.73154, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Class-count", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.22501, "t": 153.10051999999996, "r": 448.56375, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 3, "text": "11", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 494.38, "t": 153.10051999999996, "r": 498.54938, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 5, "text": "5", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 164.05951000000005, "r": 375.27167, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Split", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 423.341, "t": 164.05951000000005, "r": 438.0459, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Doc", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 448.00757, "t": 164.05951000000005, "r": 465.4472, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Page", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 475.41101, "t": 164.05951000000005, "r": 490.11591, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Doc", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 500.07757999999995, "t": 164.05951000000005, "r": 517.51721, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Page", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 175.41656, "r": 387.82465, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Caption", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 175.41656, "r": 434.86273, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 175.41656, "r": 460.90115000000003, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 186.37554999999998, "r": 391.14221, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Footnote", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 186.37554999999998, "r": 434.86273, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "71", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 186.37554999999998, "r": 460.90115000000003, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 197.33452999999997, "r": 389.15167, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Formula", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 197.33452999999997, "r": 434.86273, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "60", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 197.33452999999997, "r": 460.90115000000003, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "66", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 208.29351999999994, "r": 391.5188, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "List-item", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 208.29351999999994, "r": 434.86273, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 208.29351999999994, "r": 460.90115000000003, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 478.59399, "t": 208.29351999999994, "r": 486.93274, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 504.6324200000001, "t": 208.29351999999994, "r": 512.97119, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 219.25256000000002, "r": 401.16666, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-footer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 219.25256000000002, "r": 434.86273, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "62", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 219.25256000000002, "r": 460.90115000000003, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "89", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 230.21155, "r": 403.91931, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 230.21155, "r": 434.86273, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 230.21155, "r": 460.90115000000003, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "90", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 241.16956000000005, "r": 384.62366, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Picture", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 241.16956000000005, "r": 434.86273, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 241.16956000000005, "r": 460.90115000000003, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 478.59399, "t": 241.16956000000005, "r": 486.93274, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 504.6324200000001, "t": 241.16956000000005, "r": 512.97119, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 252.12854000000004, "r": 413.37891, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Section-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 252.12854000000004, "r": 434.86273, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 252.12854000000004, "r": 460.90115000000003, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 478.59399, "t": 252.12854000000004, "r": 486.93274, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "69", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 504.6324200000001, "t": 252.12854000000004, "r": 512.97119, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 263.08752000000004, "r": 378.44577, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 263.08752000000004, "r": 434.86273, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 263.08752000000004, "r": 460.90115000000003, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "89", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 478.59399, "t": 263.08752000000004, "r": 486.93274, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 504.6324200000001, "t": 263.08752000000004, "r": 512.97119, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "90", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 274.04657, "r": 374.59921, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Text", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 274.04657, "r": 434.86273, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 274.04657, "r": 460.90115000000003, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "91", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 478.59399, "t": 274.04657, "r": 486.93274, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 504.6324200000001, "t": 274.04657, "r": 512.97119, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "90", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 285.00552, "r": 375.63034, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Title", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 285.00552, "r": 434.86273, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 285.00552, "r": 460.90115000000003, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 296.36255, "r": 369.60492, "b": 304.73718, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "All", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 296.36255, "r": 434.86273, "b": 304.73718, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 296.36255, "r": 460.90115000000003, "b": 304.73718, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 478.59399, "t": 296.36255, "r": 486.93274, "b": 304.73718, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "78", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 504.6324200000001, "t": 296.36255, "r": 512.97119, "b": 304.73718, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "87", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "text", "id": 6, "page_no": 6, "cluster": {"id": 6, "label": "text", "bbox": {"l": 317.686, "t": 331.40353, "r": 559.58496, "b": 416.49017, "coord_origin": "TOPLEFT"}, "confidence": 0.9740145802497864, "cells": [{"id": 171, "text": "lists in PubLayNet (grouped list-items) versus DocLayNet (separate", "bbox": {"l": 317.95499, "t": 331.40353, "r": 558.20233, "b": 339.77817, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "list-items), the label set of size 4 is the closest to PubLayNet, in the", "bbox": {"l": 317.95499, "t": 342.36255, "r": 558.2005, "b": 350.73718, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "assumption that the", "bbox": {"l": 317.95499, "t": 353.32153, "r": 393.16028, "b": 361.69617000000005, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "List", "bbox": {"l": 395.84201, "t": 353.36639, "r": 409.14905, "b": 361.70514, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "is down-mapped to", "bbox": {"l": 412.33301, "t": 353.32153, "r": 485.02324999999996, "b": 361.69617000000005, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "Text", "bbox": {"l": 487.70401, "t": 353.36639, "r": 502.86761, "b": 361.70514, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "in PubLayNet.", "bbox": {"l": 506.05499, "t": 353.32153, "r": 559.58496, "b": 361.69617000000005, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "The results in Table 3 show that the prediction accuracy on the", "bbox": {"l": 317.686, "t": 364.28054999999995, "r": 558.2002, "b": 372.65518, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "remaining class labels does not change significantly when other", "bbox": {"l": 317.95499, "t": 375.23853, "r": 558.36877, "b": 383.61316, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "classes are merged into them. The overall macro-average improves", "bbox": {"l": 317.95499, "t": 386.19754, "r": 558.19958, "b": 394.57217, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "by around 5%, in particular when", "bbox": {"l": 317.95499, "t": 397.15652, "r": 439.49454, "b": 405.53116000000006, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "Page-footer", "bbox": {"l": 441.728, "t": 397.20139, "r": 481.8616, "b": 405.54013, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "and", "bbox": {"l": 484.74298, "t": 397.15652, "r": 498.23743, "b": 405.53116000000006, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "Page-header", "bbox": {"l": 500.47299, "t": 397.20139, "r": 543.95105, "b": 405.54013, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": "are", "bbox": {"l": 546.83197, "t": 397.15652, "r": 558.20142, "b": 405.53116000000006, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "excluded.", "bbox": {"l": 317.95496, "t": 408.11553999999995, "r": 352.37698, "b": 416.49017, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "lists in PubLayNet (grouped list-items) versus DocLayNet (separate list-items), the label set of size 4 is the closest to PubLayNet, in the assumption that the List is down-mapped to Text in PubLayNet. The results in Table 3 show that the prediction accuracy on the remaining class labels does not change significantly when other classes are merged into them. The overall macro-average improves by around 5%, in particular when Page-footer and Page-header are excluded."}, {"label": "section_header", "id": 9, "page_no": 6, "cluster": {"id": 9, "label": "section_header", "bbox": {"l": 317.95496, "t": 429.3949, "r": 549.8606, "b": 439.70398, "coord_origin": "TOPLEFT"}, "confidence": 0.9562516808509827, "cells": [{"id": 187, "text": "Impact of Document Split in Train and Test Set", "bbox": {"l": 317.95496, "t": 429.3949, "r": 549.8606, "b": 439.70398, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Impact of Document Split in Train and Test Set"}, {"label": "text", "id": 3, "page_no": 6, "cluster": {"id": 3, "label": "text", "bbox": {"l": 317.62299, "t": 444.59653, "r": 559.71381, "b": 595.43718, "coord_origin": "TOPLEFT"}, "confidence": 0.9869834184646606, "cells": [{"id": 188, "text": "Many documents in DocLayNet have a unique styling. In order", "bbox": {"l": 317.95499, "t": 444.59653, "r": 558.36884, "b": 452.97116, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "to avoid overfitting on a particular style, we have split the train-,", "bbox": {"l": 317.95499, "t": 455.55554, "r": 559.19189, "b": 463.93018, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "test- and validation-sets of DocLayNet on document boundaries, i.e.", "bbox": {"l": 317.95499, "t": 466.51453, "r": 559.58185, "b": 474.88916, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "every document contributes pages to only one set. To the best of", "bbox": {"l": 317.95499, "t": 477.47354, "r": 558.20605, "b": 485.84818, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": "our knowledge, this was not considered in PubLayNet or DocBank.", "bbox": {"l": 317.95499, "t": 488.43253, "r": 559.58203, "b": 496.80716, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "To quantify how this affects model performance, we trained and", "bbox": {"l": 317.686, "t": 499.39154, "r": 558.20032, "b": 507.76617, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "evaluated a Mask R-CNN R50 model on a modified dataset version.", "bbox": {"l": 317.95499, "t": 510.35052, "r": 559.5849, "b": 518.72516, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "Here, the train-, test- and validation-sets were obtained by a ran-", "bbox": {"l": 317.95499, "t": 521.30954, "r": 559.71381, "b": 529.68417, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "domised draw over the individual pages. As can be seen in Table 4,", "bbox": {"l": 317.95499, "t": 532.26855, "r": 559.18707, "b": 540.64317, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "the difference in model performance is surprisingly large: page-", "bbox": {"l": 317.95499, "t": 543.22655, "r": 559.71313, "b": 551.60117, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "wise splitting gains", "bbox": {"l": 317.62299, "t": 554.18555, "r": 388.35168, "b": 562.56017, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "\u02dc", "bbox": {"l": 391.36499, "t": 552.50055, "r": 393.98318, "b": 560.87517, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "10% in mAP over the document-wise splitting.", "bbox": {"l": 390.59, "t": 554.18555, "r": 559.58191, "b": 562.56017, "coord_origin": "TOPLEFT"}}, {"id": 201, "text": "Thus, random page-wise splitting of DocLayNet can easily lead", "bbox": {"l": 317.686, "t": 565.14455, "r": 558.20032, "b": 573.51917, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": "to accidental overestimation of model performance and should be", "bbox": {"l": 317.95499, "t": 576.10356, "r": 558.20508, "b": 584.4781800000001, "coord_origin": "TOPLEFT"}}, {"id": 203, "text": "avoided.", "bbox": {"l": 317.95499, "t": 587.06256, "r": 348.50354, "b": 595.43718, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Many documents in DocLayNet have a unique styling. In order to avoid overfitting on a particular style, we have split the train-, test- and validation-sets of DocLayNet on document boundaries, i.e. every document contributes pages to only one set. To the best of our knowledge, this was not considered in PubLayNet or DocBank. To quantify how this affects model performance, we trained and evaluated a Mask R-CNN R50 model on a modified dataset version. Here, the train-, test- and validation-sets were obtained by a randomised draw over the individual pages. As can be seen in Table 4, the difference in model performance is surprisingly large: pagewise splitting gains \u02dc 10% in mAP over the document-wise splitting. Thus, random page-wise splitting of DocLayNet can easily lead to accidental overestimation of model performance and should be avoided."}, {"label": "section_header", "id": 7, "page_no": 6, "cluster": {"id": 7, "label": "section_header", "bbox": {"l": 317.95499, "t": 608.34192, "r": 418.54776, "b": 618.65102, "coord_origin": "TOPLEFT"}, "confidence": 0.9589216113090515, "cells": [{"id": 204, "text": "Dataset Comparison", "bbox": {"l": 317.95499, "t": 608.34192, "r": 418.54776, "b": 618.65102, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Dataset Comparison"}, {"label": "text", "id": 2, "page_no": 6, "cluster": {"id": 2, "label": "text", "bbox": {"l": 317.686, "t": 623.54355, "r": 559.18817, "b": 708.640137, "coord_origin": "TOPLEFT"}, "confidence": 0.9872550964355469, "cells": [{"id": 205, "text": "Throughout this paper, we claim that DocLayNet\u2019s wider variety of", "bbox": {"l": 317.686, "t": 623.54355, "r": 558.20575, "b": 631.91817, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": "document layouts leads to more robust layout detection models. In", "bbox": {"l": 317.95499, "t": 634.50255, "r": 558.20624, "b": 642.87717, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": "Table 5, we provide evidence for that. We trained models on each", "bbox": {"l": 317.686, "t": 645.46155, "r": 558.20319, "b": 653.83617, "coord_origin": "TOPLEFT"}}, {"id": 208, "text": "of the available datasets (PubLayNet, DocBank and DocLayNet)", "bbox": {"l": 317.95499, "t": 656.42055, "r": 558.74377, "b": 664.79517, "coord_origin": "TOPLEFT"}}, {"id": 209, "text": "and evaluated them on the test sets of the other datasets. Due to", "bbox": {"l": 317.95499, "t": 667.37955, "r": 558.20398, "b": 675.7541699999999, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": "the different label sets and annotation styles, a direct comparison", "bbox": {"l": 317.95499, "t": 678.3385499999999, "r": 558.20062, "b": 686.71317, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "is not possible. Hence, we focussed on the common labels among", "bbox": {"l": 317.95499, "t": 689.29755, "r": 558.20343, "b": 697.672173, "coord_origin": "TOPLEFT"}}, {"id": 212, "text": "the datasets. Between PubLayNet and DocLayNet, these are", "bbox": {"l": 317.95499, "t": 700.256554, "r": 531.07666, "b": 708.631172, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "Picture", "bbox": {"l": 533.16199, "t": 700.301384, "r": 557.2561, "b": 708.640137, "coord_origin": "TOPLEFT"}}, {"id": 214, "text": ",", "bbox": {"l": 557.255, "t": 700.256554, "r": 559.18817, "b": 708.631172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Throughout this paper, we claim that DocLayNet\u2019s wider variety of document layouts leads to more robust layout detection models. In Table 5, we provide evidence for that. We trained models on each of the available datasets (PubLayNet, DocBank and DocLayNet) and evaluated them on the test sets of the other datasets. Due to the different label sets and annotation styles, a direct comparison is not possible. Hence, we focussed on the common labels among the datasets. Between PubLayNet and DocLayNet, these are Picture ,"}], "headers": [{"label": "page_header", "id": 12, "page_no": 6, "cluster": {"id": 12, "label": "page_header", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.9316117763519287, "cells": [{"id": 0, "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis"}, {"label": "page_header", "id": 11, "page_no": 6, "cluster": {"id": 11, "label": "page_header", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.9318180084228516, "cells": [{"id": 1, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA"}]}}, {"page_no": 7, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 246.24382, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar", "bbox": {"l": 253.13897999999998, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Table 5: Prediction Performance (mAP@0.5-0.95) of a Mask", "bbox": {"l": 53.501999, "t": 86.87292000000002, "r": 294.32153, "b": 95.34618999999998, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "R-CNN R50 network across the PubLayNet, DocBank & Do-", "bbox": {"l": 53.79800000000001, "t": 97.83191, "r": 295.64868, "b": 106.30517999999995, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "cLayNet data-sets. By evaluating on common label classes of", "bbox": {"l": 53.79800000000001, "t": 108.79088999999999, "r": 294.0437, "b": 117.26415999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "each dataset, we observe that the DocLayNet-trained model", "bbox": {"l": 53.79800000000001, "t": 119.74987999999996, "r": 294.04373, "b": 128.22313999999994, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "has much less pronounced variations in performance across", "bbox": {"l": 53.79800000000001, "t": 130.70885999999996, "r": 294.0437, "b": 139.18213000000003, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "all datasets.", "bbox": {"l": 53.79800000000001, "t": 141.66785000000004, "r": 101.15852, "b": 150.14111000000003, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Testing on", "bbox": {"l": 217.74099999999999, "t": 175.01855, "r": 256.26065, "b": 183.39319, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Training on", "bbox": {"l": 89.954002, "t": 185.97655999999995, "r": 133.24379, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "labels", "bbox": {"l": 154.629, "t": 185.97655999999995, "r": 175.47588, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "PLN", "bbox": {"l": 204.69, "t": 185.97655999999995, "r": 220.54260000000002, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "DB", "bbox": {"l": 230.50427000000002, "t": 185.97655999999995, "r": 242.06197, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "DLN", "bbox": {"l": 252.02364, "t": 185.97655999999995, "r": 269.31085, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "PubLayNet (PLN)", "bbox": {"l": 78.530998, "t": 219.25256000000002, "r": 142.56006, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Figure", "bbox": {"l": 154.629, "t": 197.33452999999997, "r": 177.92371, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "96", "bbox": {"l": 208.44701, "t": 197.33452999999997, "r": 216.78575000000004, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "43", "bbox": {"l": 232.1183, "t": 197.33452999999997, "r": 240.45705, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "23", "bbox": {"l": 256.49792, "t": 197.33452999999997, "r": 264.83667, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Sec-header", "bbox": {"l": 154.629, "t": 208.29351999999994, "r": 194.72675, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "87", "bbox": {"l": 208.44701, "t": 208.29351999999994, "r": 216.78575000000004, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "-", "bbox": {"l": 234.77235, "t": 208.29351999999994, "r": 237.80299000000002, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "32", "bbox": {"l": 256.49792, "t": 208.29351999999994, "r": 264.83667, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Table", "bbox": {"l": 154.629, "t": 219.25256000000002, "r": 174.43578, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "95", "bbox": {"l": 208.44701, "t": 219.25256000000002, "r": 216.78575000000004, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "24", "bbox": {"l": 232.1183, "t": 219.25256000000002, "r": 240.45705, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "49", "bbox": {"l": 256.49792, "t": 219.25256000000002, "r": 264.83667, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Text", "bbox": {"l": 154.629, "t": 230.21155, "r": 170.58919, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "96", "bbox": {"l": 208.44701, "t": 230.21155, "r": 216.78575000000004, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "-", "bbox": {"l": 234.77235, "t": 230.21155, "r": 237.80299000000002, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "42", "bbox": {"l": 256.49792, "t": 230.21155, "r": 264.83667, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "total", "bbox": {"l": 154.629, "t": 241.16956000000005, "r": 171.2796, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "93", "bbox": {"l": 208.44701, "t": 241.16956000000005, "r": 216.78575000000004, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "34", "bbox": {"l": 232.1183, "t": 241.16956000000005, "r": 240.45705, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "30", "bbox": {"l": 256.49792, "t": 241.16956000000005, "r": 264.83667, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "DocBank (DB)", "bbox": {"l": 78.530998, "t": 263.48650999999995, "r": 131.19963, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Figure", "bbox": {"l": 154.629, "t": 252.52752999999996, "r": 177.92371, "b": 260.90216, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "77", "bbox": {"l": 208.44701, "t": 252.52752999999996, "r": 216.78575000000004, "b": 260.90216, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "71", "bbox": {"l": 232.1183, "t": 252.52752999999996, "r": 240.45705, "b": 260.90216, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "31", "bbox": {"l": 256.49792, "t": 252.52752999999996, "r": 264.83667, "b": 260.90216, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "Table", "bbox": {"l": 154.629, "t": 263.48650999999995, "r": 174.43578, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "19", "bbox": {"l": 208.44701, "t": 263.48650999999995, "r": 216.78575000000004, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "65", "bbox": {"l": 232.1183, "t": 263.48650999999995, "r": 240.45705, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "22", "bbox": {"l": 256.49792, "t": 263.48650999999995, "r": 264.83667, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "total", "bbox": {"l": 154.629, "t": 274.44556, "r": 171.2796, "b": 282.82016, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "48", "bbox": {"l": 208.44701, "t": 274.44556, "r": 216.78575000000004, "b": 282.82016, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "68", "bbox": {"l": 232.1183, "t": 274.44556, "r": 240.45705, "b": 282.82016, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "27", "bbox": {"l": 256.49792, "t": 274.44556, "r": 264.83667, "b": 282.82016, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "DocLayNet (DLN)", "bbox": {"l": 78.530998, "t": 307.72055, "r": 144.66716, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "Figure", "bbox": {"l": 154.629, "t": 285.80255, "r": 177.92371, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "67", "bbox": {"l": 208.44701, "t": 285.80255, "r": 216.78575000000004, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "51", "bbox": {"l": 232.1183, "t": 285.80255, "r": 240.45705, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "72", "bbox": {"l": 256.49792, "t": 285.80255, "r": 264.83667, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Sec-header", "bbox": {"l": 154.629, "t": 296.76154, "r": 194.72675, "b": 305.13617, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "53", "bbox": {"l": 208.44701, "t": 296.76154, "r": 216.78575000000004, "b": 305.13617, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "-", "bbox": {"l": 234.77235, "t": 296.76154, "r": 237.80299000000002, "b": 305.13617, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "68", "bbox": {"l": 256.49792, "t": 296.76154, "r": 264.83667, "b": 305.13617, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Table", "bbox": {"l": 154.629, "t": 307.72055, "r": 174.43578, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "87", "bbox": {"l": 208.44701, "t": 307.72055, "r": 216.78575000000004, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "43", "bbox": {"l": 232.1183, "t": 307.72055, "r": 240.45705, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "82", "bbox": {"l": 256.49792, "t": 307.72055, "r": 264.83667, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "Text", "bbox": {"l": 154.629, "t": 318.67953, "r": 170.58919, "b": 327.05417, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "77", "bbox": {"l": 208.44701, "t": 318.67953, "r": 216.78575000000004, "b": 327.05417, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "-", "bbox": {"l": 234.77235, "t": 318.67953, "r": 237.80299000000002, "b": 327.05417, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "84", "bbox": {"l": 256.49792, "t": 318.67953, "r": 264.83667, "b": 327.05417, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "total", "bbox": {"l": 154.629, "t": 329.63855, "r": 171.2796, "b": 338.01318, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "59", "bbox": {"l": 208.44701, "t": 329.63855, "r": 216.78575000000004, "b": 338.01318, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "47", "bbox": {"l": 232.1183, "t": 329.63855, "r": 240.45705, "b": 338.01318, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "78", "bbox": {"l": 256.49792, "t": 329.63855, "r": 264.83667, "b": 338.01318, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "Section-header", "bbox": {"l": 53.79800000000001, "t": 390.96539, "r": 106.2392, "b": 399.30414, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": ",", "bbox": {"l": 106.239, "t": 390.92053, "r": 108.23331, "b": 399.2951699999999, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Table", "bbox": {"l": 110.482, "t": 390.96539, "r": 129.76332, "b": 399.30414, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "and", "bbox": {"l": 132.21899, "t": 390.92053, "r": 145.86186, "b": 399.2951699999999, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "Text", "bbox": {"l": 148.112, "t": 390.96539, "r": 163.14182, "b": 399.30414, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": ". Before training, we either mapped", "bbox": {"l": 163.13901, "t": 390.92053, "r": 294.04709, "b": 399.2951699999999, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "or excluded DocLayNet\u2019s other labels as specified in table 3, and", "bbox": {"l": 53.79800000000001, "t": 401.87954999999994, "r": 294.04712, "b": 410.25418, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "also PubLayNet\u2019s", "bbox": {"l": 53.79800000000001, "t": 412.83853, "r": 117.12856, "b": 421.21317, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "List", "bbox": {"l": 119.362, "t": 412.88339, "r": 132.4342, "b": 421.22214, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "to", "bbox": {"l": 135.177, "t": 412.83853, "r": 142.54416, "b": 421.21317, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "Text", "bbox": {"l": 144.77901, "t": 412.88339, "r": 159.66605, "b": 421.22214, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": ". Note that the different clustering of", "bbox": {"l": 159.66701, "t": 412.83853, "r": 294.04562, "b": 421.21317, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "lists (by list-element vs. whole list objects) naturally decreases the", "bbox": {"l": 53.79800000000001, "t": 423.79755, "r": 294.04614, "b": 432.17217999999997, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "mAP score for", "bbox": {"l": 53.79800000000001, "t": 434.75653, "r": 106.2066, "b": 443.13116, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "Text", "bbox": {"l": 108.448, "t": 434.80139, "r": 123.30533, "b": 443.14014, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": ".", "bbox": {"l": 123.305, "t": 434.75653, "r": 125.27761000000001, "b": 443.13116, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "For comparison of DocBank with DocLayNet, we trained only", "bbox": {"l": 63.76100199999999, "t": 445.71453999999994, "r": 294.27582, "b": 454.08917, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "on", "bbox": {"l": 53.79800000000001, "t": 456.67355, "r": 62.989277, "b": 465.04819, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Picture", "bbox": {"l": 64.852997, "t": 456.71841, "r": 88.947144, "b": 465.05716, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "and", "bbox": {"l": 91.019997, "t": 456.67355, "r": 104.24454, "b": 465.04819, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "Table", "bbox": {"l": 106.108, "t": 456.71841, "r": 124.78053, "b": 465.05716, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "clusters of each dataset. We had to exclude", "bbox": {"l": 126.85500000000002, "t": 456.67355, "r": 277.63235, "b": 465.04819, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "Text", "bbox": {"l": 279.49701, "t": 456.71841, "r": 294.0484, "b": 465.05716, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "because successive paragraphs are often grouped together into a", "bbox": {"l": 53.79800000000001, "t": 467.63254, "r": 294.04709, "b": 476.00717, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "single object in DocBank. This paragraph grouping is incompatible", "bbox": {"l": 53.79800000000001, "t": 478.59155, "r": 294.04532, "b": 486.96619, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "with the individual paragraphs of DocLayNet. As can be seen in", "bbox": {"l": 53.466999, "t": 489.55054, "r": 294.04538, "b": 497.92517, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "Table 5, DocLayNet trained models yield better performance com-", "bbox": {"l": 53.528999, "t": 500.50955, "r": 295.55908, "b": 508.88419, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "pared to the previous datasets. It is noteworthy that the models", "bbox": {"l": 53.79800000000001, "t": 511.46854, "r": 294.04712, "b": 519.84317, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "trained on PubLayNet and DocBank perform very well on their", "bbox": {"l": 53.79800000000001, "t": 522.42755, "r": 294.21179, "b": 530.80219, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "own test set, but have a much lower performance on the foreign", "bbox": {"l": 53.79800000000001, "t": 533.38654, "r": 294.04712, "b": 541.76117, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "datasets. While this also applies to DocLayNet, the difference is", "bbox": {"l": 53.79800000000001, "t": 544.34555, "r": 294.04715, "b": 552.72017, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "far less pronounced. Thus we conclude that DocLayNet trained", "bbox": {"l": 53.79800000000001, "t": 555.3045500000001, "r": 294.04712, "b": 563.67917, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "models are overall more robust and will produce better results for", "bbox": {"l": 53.79800000000001, "t": 566.26256, "r": 294.21411, "b": 574.63718, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "challenging, unseen layouts.", "bbox": {"l": 53.79800000000001, "t": 577.22156, "r": 157.52132, "b": 585.59618, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "Example Predictions", "bbox": {"l": 53.79800000000001, "t": 605.06091, "r": 156.00534, "b": 615.37001, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "To conclude this section, we illustrate the quality of layout predic-", "bbox": {"l": 53.528999, "t": 620.26355, "r": 295.5571, "b": 628.63817, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "tions one can expect from DocLayNet-trained models by providing", "bbox": {"l": 53.79800000000001, "t": 631.22255, "r": 294.04532, "b": 639.59717, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "a selection of examples without any further post-processing ap-", "bbox": {"l": 53.79800000000001, "t": 642.18155, "r": 295.55618, "b": 650.5561700000001, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "plied. Figure 6 shows selected layout predictions on pages from the", "bbox": {"l": 53.79800000000001, "t": 653.14055, "r": 294.04541, "b": 661.51517, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "test-set of DocLayNet. Results look decent in general across docu-", "bbox": {"l": 53.79800000000001, "t": 664.09956, "r": 295.55844, "b": 672.47417, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "ment categories, however one can also observe mistakes such as", "bbox": {"l": 53.79800000000001, "t": 675.05756, "r": 294.04712, "b": 683.43217, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "overlapping clusters of different classes, or entirely missing boxes", "bbox": {"l": 53.79800000000001, "t": 686.01656, "r": 294.04535, "b": 694.391174, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "due to low confidence.", "bbox": {"l": 53.79800000000001, "t": 696.975555, "r": 136.07368, "b": 705.350174, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "6", "bbox": {"l": 317.95502, "t": 85.85986000000003, "r": 323.56229, "b": 96.16900999999996, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "CONCLUSION", "bbox": {"l": 334.47137, "t": 85.85986000000003, "r": 405.72961, "b": 96.16900999999996, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "In this paper, we presented the DocLayNet dataset. It provides the", "bbox": {"l": 317.95499, "t": 101.06151999999997, "r": 558.2038, "b": 109.43615999999997, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "document conversion and layout analysis research community a", "bbox": {"l": 317.95499, "t": 112.02057000000002, "r": 558.2041, "b": 120.39520000000005, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "new and challenging dataset to improve and fine-tune novel ML", "bbox": {"l": 317.95499, "t": 122.97955000000002, "r": 558.43274, "b": 131.35419000000002, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "methods on. In contrast to many other datasets, DocLayNet was", "bbox": {"l": 317.95499, "t": 133.93854, "r": 558.20416, "b": 142.31317, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "created by human annotation in order to obtain reliable layout", "bbox": {"l": 317.95499, "t": 144.89752, "r": 558.20422, "b": 153.27215999999999, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "ground-truth on a wide variety of publication- and typesetting-", "bbox": {"l": 317.95499, "t": 155.85657000000003, "r": 559.71313, "b": 164.23119999999994, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "styles. Including a large proportion of documents outside the scien-", "bbox": {"l": 317.95499, "t": 166.81555000000003, "r": 559.71375, "b": 175.19019000000003, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "tific publishing domain adds significant value in this respect.", "bbox": {"l": 317.95499, "t": 177.77454, "r": 540.04382, "b": 186.14917000000003, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "From the dataset, we have derived on the one hand reference", "bbox": {"l": 327.918, "t": 188.73352, "r": 558.19836, "b": 197.10815000000002, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "metrics for human performance on document-layout annotation", "bbox": {"l": 317.95499, "t": 199.69257000000005, "r": 558.20404, "b": 208.06719999999996, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "(through double and triple annotations) and on the other hand eval-", "bbox": {"l": 317.686, "t": 210.65155000000004, "r": 559.71704, "b": 219.02617999999995, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "uated the baseline performance of commonly used object detection", "bbox": {"l": 317.95499, "t": 221.60956, "r": 558.20245, "b": 229.98419, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "methods. We also illustrated the impact of various dataset-related", "bbox": {"l": 317.95499, "t": 232.56853999999998, "r": 558.20502, "b": 240.94317999999998, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "aspects on model performance through data-ablation experiments,", "bbox": {"l": 317.95499, "t": 243.52752999999996, "r": 559.18408, "b": 251.90215999999998, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "both from a size and class-label perspective. Last but not least, we", "bbox": {"l": 317.95499, "t": 254.48650999999995, "r": 558.20227, "b": 262.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "compared the accuracy of models trained on other public datasets", "bbox": {"l": 317.95499, "t": 265.44556, "r": 558.20349, "b": 273.82019, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "and showed that DocLayNet trained models are more robust.", "bbox": {"l": 317.95499, "t": 276.40454, "r": 540.99426, "b": 284.77917, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "To date, there is still a significant gap between human and ML", "bbox": {"l": 327.918, "t": 287.36353, "r": 558.43469, "b": 295.73816, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "accuracy on the layout interpretation task, and we hope that this", "bbox": {"l": 317.95499, "t": 298.32254, "r": 558.20013, "b": 306.69717, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "work will inspire the research community to close that gap.", "bbox": {"l": 317.62299, "t": 309.28152, "r": 535.65015, "b": 317.65616000000006, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "REFERENCES", "bbox": {"l": 317.95499, "t": 335.09189, "r": 387.3696, "b": 345.40097, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "[1]", "bbox": {"l": 321.198, "t": 348.70233, "r": 329.72415, "b": 355.21588, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "Max G\u00f6bel, Tamir Hassan, Ermelinda Oro, and Giorgio Orsi. Icdar 2013 table", "bbox": {"l": 331.53516, "t": 348.70233, "r": 558.19904, "b": 355.21588, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "competition. In", "bbox": {"l": 333.39099, "t": 356.67236, "r": 379.36414, "b": 363.18591, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "2013 12th International Conference on Document Analysis and", "bbox": {"l": 381.37201, "t": 356.70724, "r": 558.20099, "b": 363.19287, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "Recognition", "bbox": {"l": 333.39099, "t": 364.67724999999996, "r": 365.59601, "b": 371.16286999999994, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": ", pages 1449-1453, 2013.", "bbox": {"l": 365.59601, "t": 364.64236, "r": 434.29489, "b": 371.15591, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "[2]", "bbox": {"l": 321.198, "t": 372.61237, "r": 329.85956, "b": 379.12592, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "Christian Clausner, Apostolos Antonacopoulos, and Stefan Pletschacher. Ic-", "bbox": {"l": 331.69931, "t": 372.61237, "r": 559.37976, "b": 379.12592, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "dar2017 competition on recognition of documents with complex layouts -", "bbox": {"l": 333.39099, "t": 380.58237, "r": 559.37982, "b": 387.09592, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "rdcl2017. In", "bbox": {"l": 333.39099, "t": 388.55236999999994, "r": 367.4339, "b": 395.06592, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "2017 14th IAPR International Conference on Document Analysis and", "bbox": {"l": 369.17401, "t": 388.58725000000004, "r": 558.20422, "b": 395.07288, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "Recognition (ICDAR)", "bbox": {"l": 333.39099, "t": 396.55725, "r": 390.87601, "b": 403.04287999999997, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": ", volume 01, pages 1404-1410, 2017.", "bbox": {"l": 390.87698, "t": 396.52237, "r": 492.17831, "b": 403.03592, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "[3]", "bbox": {"l": 321.198, "t": 404.49237, "r": 329.53583, "b": 411.00592, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "Herv\u00e9 D\u00e9jean, Jean-Luc Meunier, Liangcai Gao, Yilun Huang, Yu Fang, Florian", "bbox": {"l": 331.30682, "t": 404.49237, "r": 558.19958, "b": 411.00592, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "Kleber, and Eva-Maria Lang. ICDAR 2019 Competition on Table Detection and", "bbox": {"l": 333.39099, "t": 412.46335, "r": 558.20013, "b": 418.9769, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "Recognition (cTDaR), April 2019. http://sac.founderit.com/.", "bbox": {"l": 333.39099, "t": 420.43335, "r": 501.80127, "b": 426.94689999999997, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "[4]", "bbox": {"l": 321.198, "t": 428.40335, "r": 329.91299, "b": 434.9169, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "Antonio Jimeno Yepes, Peter Zhong, and Douglas Burdick. Competition on", "bbox": {"l": 331.7641, "t": 428.40335, "r": 558.19885, "b": 434.9169, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "scientific literature parsing. In", "bbox": {"l": 333.39099, "t": 436.3733500000001, "r": 423.77225, "b": 442.8869, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "Proceedings of the International Conference on", "bbox": {"l": 425.909, "t": 436.40823, "r": 558.20178, "b": 442.89386, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "Document Analysis and Recognition", "bbox": {"l": 333.39099, "t": 444.37823, "r": 429.42697, "b": 450.86386, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": ", ICDAR, pages 605-617. LNCS 12824, Springer-", "bbox": {"l": 429.42400999999995, "t": 444.34335, "r": 559.37872, "b": 450.85689999999994, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "Verlag, sep 2021.", "bbox": {"l": 332.819, "t": 452.31335, "r": 380.01764, "b": 458.8269, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "[5]", "bbox": {"l": 321.198, "t": 460.28336, "r": 329.22977, "b": 466.79691, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "Logan Markewich, Hao Zhang, Yubin Xing, Navid Lambert-Shirzad, Jiang Zhexin,", "bbox": {"l": 330.93576, "t": 460.28336, "r": 558.97156, "b": 466.79691, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "Roy Lee, Zhi Li, and Seok-Bum Ko. Segmentation for document layout analysis:", "bbox": {"l": 333.39099, "t": 468.25336, "r": 559.02625, "b": 474.76691, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "not dead yet.", "bbox": {"l": 333.39099, "t": 476.22437, "r": 368.85431, "b": 482.73792, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "International Journal on Document Analysis and Recognition (IJDAR)", "bbox": {"l": 370.811, "t": 476.25925, "r": 557.46326, "b": 482.74487, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": ",", "bbox": {"l": 557.46503, "t": 476.22437, "r": 558.96857, "b": 482.73792, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "pages 1-11, 01 2022.", "bbox": {"l": 333.39099, "t": 484.19437, "r": 390.82715, "b": 490.70792, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "[6]", "bbox": {"l": 321.198, "t": 492.16437, "r": 329.42145, "b": 498.67792, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "Xu Zhong, Jianbin Tang, and Antonio Jimeno-Yepes. Publaynet: Largest dataset", "bbox": {"l": 331.16812, "t": 492.16437, "r": 558.20361, "b": 498.67792, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "ever for document layout analysis. In", "bbox": {"l": 333.39099, "t": 500.13437, "r": 438.6101100000001, "b": 506.64792, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "Proceedings of the International Conference", "bbox": {"l": 440.349, "t": 500.16925, "r": 558.19958, "b": 506.65488, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "on Document Analysis and Recognition", "bbox": {"l": 333.39099, "t": 508.13925, "r": 441.40118, "b": 514.6248800000001, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": ", ICDAR, pages 1015-1022, sep 2019.", "bbox": {"l": 441.4019799999999, "t": 508.10437, "r": 544.78162, "b": 514.61792, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "[7]", "bbox": {"l": 321.19797, "t": 516.07437, "r": 329.74161, "b": 522.5879199999999, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "Minghao Li, Yiheng Xu, Lei Cui, Shaohan Huang, Furu Wei, Zhoujun Li, and", "bbox": {"l": 331.55634, "t": 516.07437, "r": 558.19897, "b": 522.5879199999999, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "Ming Zhou. Docbank: A benchmark dataset for document layout analysis. In", "bbox": {"l": 333.39099, "t": 524.0443700000001, "r": 558.19891, "b": 530.55792, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "Proceedings of the 28th International Conference on Computational Linguistics", "bbox": {"l": 333.39099, "t": 532.04922, "r": 557.40228, "b": 538.53487, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": ",", "bbox": {"l": 557.40399, "t": 532.01437, "r": 558.96893, "b": 538.5278900000001, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "COLING, pages 949-960. International Committee on Computational Linguistics,", "bbox": {"l": 333.39099, "t": 539.98438, "r": 558.9715, "b": 546.49789, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "dec 2020.", "bbox": {"l": 333.39099, "t": 547.95535, "r": 359.31955, "b": 554.46889, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "[8]", "bbox": {"l": 321.198, "t": 555.92535, "r": 329.7088, "b": 562.43889, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "Riaz Ahmad, Muhammad Tanvir Afzal, and M. Qadir. Information extraction", "bbox": {"l": 331.51654, "t": 555.92535, "r": 558.19891, "b": 562.43889, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "from pdf sources based on rule-based system using integrated formats. In", "bbox": {"l": 333.39099, "t": 563.89536, "r": 535.54352, "b": 570.40889, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "SemWe-", "bbox": {"l": 536.96399, "t": 563.93024, "r": 558.90222, "b": 570.4158600000001, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "bEval@ESWC", "bbox": {"l": 333.39099, "t": 571.9002399999999, "r": 371.94217, "b": 578.38586, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": ", 2016.", "bbox": {"l": 371.94299, "t": 571.86536, "r": 389.72617, "b": 578.3788900000001, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": "[9]", "bbox": {"l": 321.198, "t": 579.83536, "r": 329.45999, "b": 586.34889, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "Ross B. Girshick, Jeff Donahue, Trevor Darrell, and Jitendra Malik. Rich feature", "bbox": {"l": 331.21487, "t": 579.83536, "r": 558.19843, "b": 586.34889, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "hierarchies for accurate object detection and semantic segmentation. In", "bbox": {"l": 333.39099, "t": 587.8053600000001, "r": 543.05487, "b": 594.31889, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": "IEEE", "bbox": {"l": 544.98499, "t": 587.84024, "r": 558.20148, "b": 594.32587, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "Conference on Computer Vision and Pattern Recognition", "bbox": {"l": 333.39099, "t": 595.81024, "r": 491.61166, "b": 602.29587, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": ", CVPR, pages 580-587.", "bbox": {"l": 491.61301, "t": 595.77536, "r": 559.27448, "b": 602.28889, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "IEEE Computer Society, jun 2014.", "bbox": {"l": 333.39099, "t": 603.74536, "r": 428.59726000000006, "b": 610.2589, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": "[10]", "bbox": {"l": 317.95499, "t": 611.71536, "r": 329.54767, "b": 618.2289000000001, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "Ross B. Girshick. Fast R-CNN. In", "bbox": {"l": 331.31268, "t": 611.71536, "r": 425.1554, "b": 618.2289000000001, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "2015 IEEE International Conference on Computer", "bbox": {"l": 426.77802, "t": 611.75024, "r": 558.20203, "b": 618.23587, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "Vision", "bbox": {"l": 333.39099, "t": 619.72124, "r": 350.59537, "b": 626.20686, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": ", ICCV, pages 1440-1448. IEEE Computer Society, dec 2015.", "bbox": {"l": 350.59598, "t": 619.68637, "r": 518.58777, "b": 626.19989, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "[11]", "bbox": {"l": 317.95499, "t": 627.65637, "r": 329.5459, "b": 634.16989, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "Shaoqing Ren, Kaiming He, Ross Girshick, and Jian Sun. Faster r-cnn: Towards", "bbox": {"l": 331.31064, "t": 627.65637, "r": 558.20142, "b": 634.16989, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "real-time object detection with region proposal networks.", "bbox": {"l": 333.39099, "t": 635.62637, "r": 497.50909, "b": 642.13989, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "IEEE Transactions on", "bbox": {"l": 500.01401, "t": 635.66124, "r": 558.19885, "b": 642.14687, "coord_origin": "TOPLEFT"}}, {"id": 201, "text": "Pattern Analysis and Machine Intelligence", "bbox": {"l": 333.39099, "t": 643.6312399999999, "r": 449.38620000000003, "b": 650.1168700000001, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": ", 39(6):1137-1149, 2017.", "bbox": {"l": 449.38699, "t": 643.59637, "r": 515.74268, "b": 650.10989, "coord_origin": "TOPLEFT"}}, {"id": 203, "text": "[12]", "bbox": {"l": 317.95499, "t": 651.56638, "r": 329.41763, "b": 658.0799, "coord_origin": "TOPLEFT"}}, {"id": 204, "text": "Kaiming He, Georgia Gkioxari, Piotr Doll\u00e1r, and Ross B. Girshick. Mask R-CNN.", "bbox": {"l": 331.16287, "t": 651.56638, "r": 559.27808, "b": 658.0799, "coord_origin": "TOPLEFT"}}, {"id": 205, "text": "In", "bbox": {"l": 333.39099, "t": 659.53638, "r": 339.35904, "b": 666.0499, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": "IEEE International Conference on Computer Vision", "bbox": {"l": 341.56299, "t": 659.57124, "r": 485.8273, "b": 666.05687, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": ", ICCV, pages 2980-2988.", "bbox": {"l": 485.82901, "t": 659.53638, "r": 559.27356, "b": 666.0499, "coord_origin": "TOPLEFT"}}, {"id": 208, "text": "IEEE Computer Society, Oct 2017.", "bbox": {"l": 333.39099, "t": 667.50636, "r": 429.30161000000004, "b": 674.01989, "coord_origin": "TOPLEFT"}}, {"id": 209, "text": "[13]", "bbox": {"l": 317.95499, "t": 675.47636, "r": 330.11407, "b": 681.9898900000001, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": "Glenn Jocher, Alex Stoken, Ayush Chaurasia, Jirka Borovec, NanoCode012,", "bbox": {"l": 331.96533, "t": 675.47636, "r": 558.96716, "b": 681.9898900000001, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "TaoXie, Yonghye Kwon, Kalen Michael, Liu Changyu, Jiacong Fang, Abhiram V,", "bbox": {"l": 333.18201, "t": 683.44637, "r": 558.96661, "b": 689.95989, "coord_origin": "TOPLEFT"}}, {"id": 212, "text": "Laughing, tkianai, yxNONG, Piotr Skalski, Adam Hogan, Jebastin Nadar, imyhxy,", "bbox": {"l": 333.39099, "t": 691.41737, "r": 558.97156, "b": 697.930893, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "Lorenzo Mammana, Alex Wang, Cristi Fati, Diego Montes, Jan Hajek, Laurentiu", "bbox": {"l": 333.39099, "t": 699.387367, "r": 558.20001, "b": 705.900894, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 24, "label": "page_header", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.7984204292297363, "cells": [{"id": 0, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 246.24382, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar", "bbox": {"l": 253.13897999999998, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "text", "bbox": {"l": 53.501999, "t": 86.87292000000002, "r": 295.64868, "b": 150.14111000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9824112057685852, "cells": [{"id": 2, "text": "Table 5: Prediction Performance (mAP@0.5-0.95) of a Mask", "bbox": {"l": 53.501999, "t": 86.87292000000002, "r": 294.32153, "b": 95.34618999999998, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "R-CNN R50 network across the PubLayNet, DocBank & Do-", "bbox": {"l": 53.79800000000001, "t": 97.83191, "r": 295.64868, "b": 106.30517999999995, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "cLayNet data-sets. By evaluating on common label classes of", "bbox": {"l": 53.79800000000001, "t": 108.79088999999999, "r": 294.0437, "b": 117.26415999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "each dataset, we observe that the DocLayNet-trained model", "bbox": {"l": 53.79800000000001, "t": 119.74987999999996, "r": 294.04373, "b": 128.22313999999994, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "has much less pronounced variations in performance across", "bbox": {"l": 53.79800000000001, "t": 130.70885999999996, "r": 294.0437, "b": 139.18213000000003, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "all datasets.", "bbox": {"l": 53.79800000000001, "t": 141.66785000000004, "r": 101.15852, "b": 150.14111000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "table", "bbox": {"l": 72.6590347290039, "t": 172.48080444335938, "r": 274.83465576171875, "b": 339.8540344238281, "coord_origin": "TOPLEFT"}, "confidence": 0.9892616271972656, "cells": [{"id": 8, "text": "Testing on", "bbox": {"l": 217.74099999999999, "t": 175.01855, "r": 256.26065, "b": 183.39319, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Training on", "bbox": {"l": 89.954002, "t": 185.97655999999995, "r": 133.24379, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "labels", "bbox": {"l": 154.629, "t": 185.97655999999995, "r": 175.47588, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "PLN", "bbox": {"l": 204.69, "t": 185.97655999999995, "r": 220.54260000000002, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "DB", "bbox": {"l": 230.50427000000002, "t": 185.97655999999995, "r": 242.06197, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "DLN", "bbox": {"l": 252.02364, "t": 185.97655999999995, "r": 269.31085, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "PubLayNet (PLN)", "bbox": {"l": 78.530998, "t": 219.25256000000002, "r": 142.56006, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Figure", "bbox": {"l": 154.629, "t": 197.33452999999997, "r": 177.92371, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "96", "bbox": {"l": 208.44701, "t": 197.33452999999997, "r": 216.78575000000004, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "43", "bbox": {"l": 232.1183, "t": 197.33452999999997, "r": 240.45705, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "23", "bbox": {"l": 256.49792, "t": 197.33452999999997, "r": 264.83667, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Sec-header", "bbox": {"l": 154.629, "t": 208.29351999999994, "r": 194.72675, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "87", "bbox": {"l": 208.44701, "t": 208.29351999999994, "r": 216.78575000000004, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "-", "bbox": {"l": 234.77235, "t": 208.29351999999994, "r": 237.80299000000002, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "32", "bbox": {"l": 256.49792, "t": 208.29351999999994, "r": 264.83667, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Table", "bbox": {"l": 154.629, "t": 219.25256000000002, "r": 174.43578, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "95", "bbox": {"l": 208.44701, "t": 219.25256000000002, "r": 216.78575000000004, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "24", "bbox": {"l": 232.1183, "t": 219.25256000000002, "r": 240.45705, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "49", "bbox": {"l": 256.49792, "t": 219.25256000000002, "r": 264.83667, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Text", "bbox": {"l": 154.629, "t": 230.21155, "r": 170.58919, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "96", "bbox": {"l": 208.44701, "t": 230.21155, "r": 216.78575000000004, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "-", "bbox": {"l": 234.77235, "t": 230.21155, "r": 237.80299000000002, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "42", "bbox": {"l": 256.49792, "t": 230.21155, "r": 264.83667, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "total", "bbox": {"l": 154.629, "t": 241.16956000000005, "r": 171.2796, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "93", "bbox": {"l": 208.44701, "t": 241.16956000000005, "r": 216.78575000000004, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "34", "bbox": {"l": 232.1183, "t": 241.16956000000005, "r": 240.45705, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "30", "bbox": {"l": 256.49792, "t": 241.16956000000005, "r": 264.83667, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "DocBank (DB)", "bbox": {"l": 78.530998, "t": 263.48650999999995, "r": 131.19963, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Figure", "bbox": {"l": 154.629, "t": 252.52752999999996, "r": 177.92371, "b": 260.90216, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "77", "bbox": {"l": 208.44701, "t": 252.52752999999996, "r": 216.78575000000004, "b": 260.90216, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "71", "bbox": {"l": 232.1183, "t": 252.52752999999996, "r": 240.45705, "b": 260.90216, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "31", "bbox": {"l": 256.49792, "t": 252.52752999999996, "r": 264.83667, "b": 260.90216, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "Table", "bbox": {"l": 154.629, "t": 263.48650999999995, "r": 174.43578, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "19", "bbox": {"l": 208.44701, "t": 263.48650999999995, "r": 216.78575000000004, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "65", "bbox": {"l": 232.1183, "t": 263.48650999999995, "r": 240.45705, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "22", "bbox": {"l": 256.49792, "t": 263.48650999999995, "r": 264.83667, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "total", "bbox": {"l": 154.629, "t": 274.44556, "r": 171.2796, "b": 282.82016, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "48", "bbox": {"l": 208.44701, "t": 274.44556, "r": 216.78575000000004, "b": 282.82016, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "68", "bbox": {"l": 232.1183, "t": 274.44556, "r": 240.45705, "b": 282.82016, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "27", "bbox": {"l": 256.49792, "t": 274.44556, "r": 264.83667, "b": 282.82016, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "DocLayNet (DLN)", "bbox": {"l": 78.530998, "t": 307.72055, "r": 144.66716, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "Figure", "bbox": {"l": 154.629, "t": 285.80255, "r": 177.92371, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "67", "bbox": {"l": 208.44701, "t": 285.80255, "r": 216.78575000000004, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "51", "bbox": {"l": 232.1183, "t": 285.80255, "r": 240.45705, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "72", "bbox": {"l": 256.49792, "t": 285.80255, "r": 264.83667, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Sec-header", "bbox": {"l": 154.629, "t": 296.76154, "r": 194.72675, "b": 305.13617, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "53", "bbox": {"l": 208.44701, "t": 296.76154, "r": 216.78575000000004, "b": 305.13617, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "-", "bbox": {"l": 234.77235, "t": 296.76154, "r": 237.80299000000002, "b": 305.13617, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "68", "bbox": {"l": 256.49792, "t": 296.76154, "r": 264.83667, "b": 305.13617, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Table", "bbox": {"l": 154.629, "t": 307.72055, "r": 174.43578, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "87", "bbox": {"l": 208.44701, "t": 307.72055, "r": 216.78575000000004, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "43", "bbox": {"l": 232.1183, "t": 307.72055, "r": 240.45705, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "82", "bbox": {"l": 256.49792, "t": 307.72055, "r": 264.83667, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "Text", "bbox": {"l": 154.629, "t": 318.67953, "r": 170.58919, "b": 327.05417, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "77", "bbox": {"l": 208.44701, "t": 318.67953, "r": 216.78575000000004, "b": 327.05417, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "-", "bbox": {"l": 234.77235, "t": 318.67953, "r": 237.80299000000002, "b": 327.05417, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "84", "bbox": {"l": 256.49792, "t": 318.67953, "r": 264.83667, "b": 327.05417, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "total", "bbox": {"l": 154.629, "t": 329.63855, "r": 171.2796, "b": 338.01318, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "59", "bbox": {"l": 208.44701, "t": 329.63855, "r": 216.78575000000004, "b": 338.01318, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "47", "bbox": {"l": 232.1183, "t": 329.63855, "r": 240.45705, "b": 338.01318, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "78", "bbox": {"l": 256.49792, "t": 329.63855, "r": 264.83667, "b": 338.01318, "coord_origin": "TOPLEFT"}}], "children": [{"id": 25, "label": "text", "bbox": {"l": 217.74099999999999, "t": 175.01855, "r": 256.26065, "b": 183.39319, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "Testing on", "bbox": {"l": 217.74099999999999, "t": 175.01855, "r": 256.26065, "b": 183.39319, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 89.954002, "t": 185.97655999999995, "r": 133.24379, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "Training on", "bbox": {"l": 89.954002, "t": 185.97655999999995, "r": 133.24379, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 154.629, "t": 185.97655999999995, "r": 175.47588, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "labels", "bbox": {"l": 154.629, "t": 185.97655999999995, "r": 175.47588, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 204.69, "t": 185.97655999999995, "r": 220.54260000000002, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "PLN", "bbox": {"l": 204.69, "t": 185.97655999999995, "r": 220.54260000000002, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 230.50427000000002, "t": 185.97655999999995, "r": 242.06197, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "DB", "bbox": {"l": 230.50427000000002, "t": 185.97655999999995, "r": 242.06197, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 252.02364, "t": 185.97655999999995, "r": 269.31085, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "DLN", "bbox": {"l": 252.02364, "t": 185.97655999999995, "r": 269.31085, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 78.530998, "t": 219.25256000000002, "r": 142.56006, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "PubLayNet (PLN)", "bbox": {"l": 78.530998, "t": 219.25256000000002, "r": 142.56006, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 154.629, "t": 197.33452999999997, "r": 177.92371, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "Figure", "bbox": {"l": 154.629, "t": 197.33452999999997, "r": 177.92371, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 208.44701, "t": 197.33452999999997, "r": 216.78575000000004, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "96", "bbox": {"l": 208.44701, "t": 197.33452999999997, "r": 216.78575000000004, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 232.1183, "t": 197.33452999999997, "r": 240.45705, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "43", "bbox": {"l": 232.1183, "t": 197.33452999999997, "r": 240.45705, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 256.49792, "t": 197.33452999999997, "r": 264.83667, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "23", "bbox": {"l": 256.49792, "t": 197.33452999999997, "r": 264.83667, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 154.629, "t": 208.29351999999994, "r": 194.72675, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "Sec-header", "bbox": {"l": 154.629, "t": 208.29351999999994, "r": 194.72675, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 208.44701, "t": 208.29351999999994, "r": 216.78575000000004, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "87", "bbox": {"l": 208.44701, "t": 208.29351999999994, "r": 216.78575000000004, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 234.77235, "t": 208.29351999999994, "r": 237.80299000000002, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "-", "bbox": {"l": 234.77235, "t": 208.29351999999994, "r": 237.80299000000002, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 256.49792, "t": 208.29351999999994, "r": 264.83667, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "32", "bbox": {"l": 256.49792, "t": 208.29351999999994, "r": 264.83667, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 154.629, "t": 219.25256000000002, "r": 174.43578, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "Table", "bbox": {"l": 154.629, "t": 219.25256000000002, "r": 174.43578, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 208.44701, "t": 219.25256000000002, "r": 216.78575000000004, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "95", "bbox": {"l": 208.44701, "t": 219.25256000000002, "r": 216.78575000000004, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 232.1183, "t": 219.25256000000002, "r": 240.45705, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "24", "bbox": {"l": 232.1183, "t": 219.25256000000002, "r": 240.45705, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 256.49792, "t": 219.25256000000002, "r": 264.83667, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "49", "bbox": {"l": 256.49792, "t": 219.25256000000002, "r": 264.83667, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 154.629, "t": 230.21155, "r": 170.58919, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "Text", "bbox": {"l": 154.629, "t": 230.21155, "r": 170.58919, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 208.44701, "t": 230.21155, "r": 216.78575000000004, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "96", "bbox": {"l": 208.44701, "t": 230.21155, "r": 216.78575000000004, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 234.77235, "t": 230.21155, "r": 237.80299000000002, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "-", "bbox": {"l": 234.77235, "t": 230.21155, "r": 237.80299000000002, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 256.49792, "t": 230.21155, "r": 264.83667, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "42", "bbox": {"l": 256.49792, "t": 230.21155, "r": 264.83667, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 154.629, "t": 241.16956000000005, "r": 171.2796, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "total", "bbox": {"l": 154.629, "t": 241.16956000000005, "r": 171.2796, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 208.44701, "t": 241.16956000000005, "r": 216.78575000000004, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "93", "bbox": {"l": 208.44701, "t": 241.16956000000005, "r": 216.78575000000004, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 232.1183, "t": 241.16956000000005, "r": 240.45705, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "34", "bbox": {"l": 232.1183, "t": 241.16956000000005, "r": 240.45705, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 256.49792, "t": 241.16956000000005, "r": 264.83667, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "30", "bbox": {"l": 256.49792, "t": 241.16956000000005, "r": 264.83667, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 78.530998, "t": 263.48650999999995, "r": 131.19963, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "DocBank (DB)", "bbox": {"l": 78.530998, "t": 263.48650999999995, "r": 131.19963, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 154.629, "t": 252.52752999999996, "r": 177.92371, "b": 260.90216, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "Figure", "bbox": {"l": 154.629, "t": 252.52752999999996, "r": 177.92371, "b": 260.90216, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 208.44701, "t": 252.52752999999996, "r": 216.78575000000004, "b": 260.90216, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "77", "bbox": {"l": 208.44701, "t": 252.52752999999996, "r": 216.78575000000004, "b": 260.90216, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 232.1183, "t": 252.52752999999996, "r": 240.45705, "b": 260.90216, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "71", "bbox": {"l": 232.1183, "t": 252.52752999999996, "r": 240.45705, "b": 260.90216, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 256.49792, "t": 252.52752999999996, "r": 264.83667, "b": 260.90216, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "31", "bbox": {"l": 256.49792, "t": 252.52752999999996, "r": 264.83667, "b": 260.90216, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 154.629, "t": 263.48650999999995, "r": 174.43578, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "Table", "bbox": {"l": 154.629, "t": 263.48650999999995, "r": 174.43578, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 208.44701, "t": 263.48650999999995, "r": 216.78575000000004, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "19", "bbox": {"l": 208.44701, "t": 263.48650999999995, "r": 216.78575000000004, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 232.1183, "t": 263.48650999999995, "r": 240.45705, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "65", "bbox": {"l": 232.1183, "t": 263.48650999999995, "r": 240.45705, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 256.49792, "t": 263.48650999999995, "r": 264.83667, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "22", "bbox": {"l": 256.49792, "t": 263.48650999999995, "r": 264.83667, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 154.629, "t": 274.44556, "r": 171.2796, "b": 282.82016, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "total", "bbox": {"l": 154.629, "t": 274.44556, "r": 171.2796, "b": 282.82016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 208.44701, "t": 274.44556, "r": 216.78575000000004, "b": 282.82016, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "48", "bbox": {"l": 208.44701, "t": 274.44556, "r": 216.78575000000004, "b": 282.82016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 232.1183, "t": 274.44556, "r": 240.45705, "b": 282.82016, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "68", "bbox": {"l": 232.1183, "t": 274.44556, "r": 240.45705, "b": 282.82016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 256.49792, "t": 274.44556, "r": 264.83667, "b": 282.82016, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "27", "bbox": {"l": 256.49792, "t": 274.44556, "r": 264.83667, "b": 282.82016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 78.530998, "t": 307.72055, "r": 144.66716, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "DocLayNet (DLN)", "bbox": {"l": 78.530998, "t": 307.72055, "r": 144.66716, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 154.629, "t": 285.80255, "r": 177.92371, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "Figure", "bbox": {"l": 154.629, "t": 285.80255, "r": 177.92371, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 208.44701, "t": 285.80255, "r": 216.78575000000004, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "67", "bbox": {"l": 208.44701, "t": 285.80255, "r": 216.78575000000004, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 232.1183, "t": 285.80255, "r": 240.45705, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "51", "bbox": {"l": 232.1183, "t": 285.80255, "r": 240.45705, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 256.49792, "t": 285.80255, "r": 264.83667, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "72", "bbox": {"l": 256.49792, "t": 285.80255, "r": 264.83667, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 154.629, "t": 296.76154, "r": 194.72675, "b": 305.13617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "Sec-header", "bbox": {"l": 154.629, "t": 296.76154, "r": 194.72675, "b": 305.13617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 208.44701, "t": 296.76154, "r": 216.78575000000004, "b": 305.13617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "53", "bbox": {"l": 208.44701, "t": 296.76154, "r": 216.78575000000004, "b": 305.13617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 234.77235, "t": 296.76154, "r": 237.80299000000002, "b": 305.13617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "-", "bbox": {"l": 234.77235, "t": 296.76154, "r": 237.80299000000002, "b": 305.13617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 256.49792, "t": 296.76154, "r": 264.83667, "b": 305.13617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "68", "bbox": {"l": 256.49792, "t": 296.76154, "r": 264.83667, "b": 305.13617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 154.629, "t": 307.72055, "r": 174.43578, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "Table", "bbox": {"l": 154.629, "t": 307.72055, "r": 174.43578, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 208.44701, "t": 307.72055, "r": 216.78575000000004, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "87", "bbox": {"l": 208.44701, "t": 307.72055, "r": 216.78575000000004, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 232.1183, "t": 307.72055, "r": 240.45705, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "43", "bbox": {"l": 232.1183, "t": 307.72055, "r": 240.45705, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 256.49792, "t": 307.72055, "r": 264.83667, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "82", "bbox": {"l": 256.49792, "t": 307.72055, "r": 264.83667, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 154.629, "t": 318.67953, "r": 170.58919, "b": 327.05417, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "Text", "bbox": {"l": 154.629, "t": 318.67953, "r": 170.58919, "b": 327.05417, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 208.44701, "t": 318.67953, "r": 216.78575000000004, "b": 327.05417, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "77", "bbox": {"l": 208.44701, "t": 318.67953, "r": 216.78575000000004, "b": 327.05417, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 234.77235, "t": 318.67953, "r": 237.80299000000002, "b": 327.05417, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "-", "bbox": {"l": 234.77235, "t": 318.67953, "r": 237.80299000000002, "b": 327.05417, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 256.49792, "t": 318.67953, "r": 264.83667, "b": 327.05417, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "84", "bbox": {"l": 256.49792, "t": 318.67953, "r": 264.83667, "b": 327.05417, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 154.629, "t": 329.63855, "r": 171.2796, "b": 338.01318, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "total", "bbox": {"l": 154.629, "t": 329.63855, "r": 171.2796, "b": 338.01318, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 208.44701, "t": 329.63855, "r": 216.78575000000004, "b": 338.01318, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "59", "bbox": {"l": 208.44701, "t": 329.63855, "r": 216.78575000000004, "b": 338.01318, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 232.1183, "t": 329.63855, "r": 240.45705, "b": 338.01318, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "47", "bbox": {"l": 232.1183, "t": 329.63855, "r": 240.45705, "b": 338.01318, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 256.49792, "t": 329.63855, "r": 264.83667, "b": 338.01318, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "78", "bbox": {"l": 256.49792, "t": 329.63855, "r": 264.83667, "b": 338.01318, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 4, "label": "text", "bbox": {"l": 53.79800000000001, "t": 390.92053, "r": 294.04712, "b": 443.14014, "coord_origin": "TOPLEFT"}, "confidence": 0.9839397668838501, "cells": [{"id": 69, "text": "Section-header", "bbox": {"l": 53.79800000000001, "t": 390.96539, "r": 106.2392, "b": 399.30414, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": ",", "bbox": {"l": 106.239, "t": 390.92053, "r": 108.23331, "b": 399.2951699999999, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Table", "bbox": {"l": 110.482, "t": 390.96539, "r": 129.76332, "b": 399.30414, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "and", "bbox": {"l": 132.21899, "t": 390.92053, "r": 145.86186, "b": 399.2951699999999, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "Text", "bbox": {"l": 148.112, "t": 390.96539, "r": 163.14182, "b": 399.30414, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": ". Before training, we either mapped", "bbox": {"l": 163.13901, "t": 390.92053, "r": 294.04709, "b": 399.2951699999999, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "or excluded DocLayNet\u2019s other labels as specified in table 3, and", "bbox": {"l": 53.79800000000001, "t": 401.87954999999994, "r": 294.04712, "b": 410.25418, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "also PubLayNet\u2019s", "bbox": {"l": 53.79800000000001, "t": 412.83853, "r": 117.12856, "b": 421.21317, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "List", "bbox": {"l": 119.362, "t": 412.88339, "r": 132.4342, "b": 421.22214, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "to", "bbox": {"l": 135.177, "t": 412.83853, "r": 142.54416, "b": 421.21317, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "Text", "bbox": {"l": 144.77901, "t": 412.88339, "r": 159.66605, "b": 421.22214, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": ". Note that the different clustering of", "bbox": {"l": 159.66701, "t": 412.83853, "r": 294.04562, "b": 421.21317, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "lists (by list-element vs. whole list objects) naturally decreases the", "bbox": {"l": 53.79800000000001, "t": 423.79755, "r": 294.04614, "b": 432.17217999999997, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "mAP score for", "bbox": {"l": 53.79800000000001, "t": 434.75653, "r": 106.2066, "b": 443.13116, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "Text", "bbox": {"l": 108.448, "t": 434.80139, "r": 123.30533, "b": 443.14014, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": ".", "bbox": {"l": 123.305, "t": 434.75653, "r": 125.27761000000001, "b": 443.13116, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 53.466999, "t": 445.71453999999994, "r": 295.55908, "b": 585.59618, "coord_origin": "TOPLEFT"}, "confidence": 0.9868056774139404, "cells": [{"id": 85, "text": "For comparison of DocBank with DocLayNet, we trained only", "bbox": {"l": 63.76100199999999, "t": 445.71453999999994, "r": 294.27582, "b": 454.08917, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "on", "bbox": {"l": 53.79800000000001, "t": 456.67355, "r": 62.989277, "b": 465.04819, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Picture", "bbox": {"l": 64.852997, "t": 456.71841, "r": 88.947144, "b": 465.05716, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "and", "bbox": {"l": 91.019997, "t": 456.67355, "r": 104.24454, "b": 465.04819, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "Table", "bbox": {"l": 106.108, "t": 456.71841, "r": 124.78053, "b": 465.05716, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "clusters of each dataset. We had to exclude", "bbox": {"l": 126.85500000000002, "t": 456.67355, "r": 277.63235, "b": 465.04819, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "Text", "bbox": {"l": 279.49701, "t": 456.71841, "r": 294.0484, "b": 465.05716, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "because successive paragraphs are often grouped together into a", "bbox": {"l": 53.79800000000001, "t": 467.63254, "r": 294.04709, "b": 476.00717, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "single object in DocBank. This paragraph grouping is incompatible", "bbox": {"l": 53.79800000000001, "t": 478.59155, "r": 294.04532, "b": 486.96619, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "with the individual paragraphs of DocLayNet. As can be seen in", "bbox": {"l": 53.466999, "t": 489.55054, "r": 294.04538, "b": 497.92517, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "Table 5, DocLayNet trained models yield better performance com-", "bbox": {"l": 53.528999, "t": 500.50955, "r": 295.55908, "b": 508.88419, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "pared to the previous datasets. It is noteworthy that the models", "bbox": {"l": 53.79800000000001, "t": 511.46854, "r": 294.04712, "b": 519.84317, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "trained on PubLayNet and DocBank perform very well on their", "bbox": {"l": 53.79800000000001, "t": 522.42755, "r": 294.21179, "b": 530.80219, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "own test set, but have a much lower performance on the foreign", "bbox": {"l": 53.79800000000001, "t": 533.38654, "r": 294.04712, "b": 541.76117, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "datasets. While this also applies to DocLayNet, the difference is", "bbox": {"l": 53.79800000000001, "t": 544.34555, "r": 294.04715, "b": 552.72017, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "far less pronounced. Thus we conclude that DocLayNet trained", "bbox": {"l": 53.79800000000001, "t": 555.3045500000001, "r": 294.04712, "b": 563.67917, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "models are overall more robust and will produce better results for", "bbox": {"l": 53.79800000000001, "t": 566.26256, "r": 294.21411, "b": 574.63718, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "challenging, unseen layouts.", "bbox": {"l": 53.79800000000001, "t": 577.22156, "r": 157.52132, "b": 585.59618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "section_header", "bbox": {"l": 53.79800000000001, "t": 605.06091, "r": 156.00534, "b": 615.37001, "coord_origin": "TOPLEFT"}, "confidence": 0.9574697613716125, "cells": [{"id": 103, "text": "Example Predictions", "bbox": {"l": 53.79800000000001, "t": 605.06091, "r": 156.00534, "b": 615.37001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 53.528999, "t": 620.26355, "r": 295.55844, "b": 705.350174, "coord_origin": "TOPLEFT"}, "confidence": 0.9859885573387146, "cells": [{"id": 104, "text": "To conclude this section, we illustrate the quality of layout predic-", "bbox": {"l": 53.528999, "t": 620.26355, "r": 295.5571, "b": 628.63817, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "tions one can expect from DocLayNet-trained models by providing", "bbox": {"l": 53.79800000000001, "t": 631.22255, "r": 294.04532, "b": 639.59717, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "a selection of examples without any further post-processing ap-", "bbox": {"l": 53.79800000000001, "t": 642.18155, "r": 295.55618, "b": 650.5561700000001, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "plied. Figure 6 shows selected layout predictions on pages from the", "bbox": {"l": 53.79800000000001, "t": 653.14055, "r": 294.04541, "b": 661.51517, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "test-set of DocLayNet. Results look decent in general across docu-", "bbox": {"l": 53.79800000000001, "t": 664.09956, "r": 295.55844, "b": 672.47417, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "ment categories, however one can also observe mistakes such as", "bbox": {"l": 53.79800000000001, "t": 675.05756, "r": 294.04712, "b": 683.43217, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "overlapping clusters of different classes, or entirely missing boxes", "bbox": {"l": 53.79800000000001, "t": 686.01656, "r": 294.04535, "b": 694.391174, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "due to low confidence.", "bbox": {"l": 53.79800000000001, "t": 696.975555, "r": 136.07368, "b": 705.350174, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "section_header", "bbox": {"l": 317.95502, "t": 85.85986000000003, "r": 405.72961, "b": 96.16900999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9319982528686523, "cells": [{"id": 112, "text": "6", "bbox": {"l": 317.95502, "t": 85.85986000000003, "r": 323.56229, "b": 96.16900999999996, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "CONCLUSION", "bbox": {"l": 334.47137, "t": 85.85986000000003, "r": 405.72961, "b": 96.16900999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 317.95499, "t": 101.06151999999997, "r": 559.71375, "b": 186.14917000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9854928851127625, "cells": [{"id": 114, "text": "In this paper, we presented the DocLayNet dataset. It provides the", "bbox": {"l": 317.95499, "t": 101.06151999999997, "r": 558.2038, "b": 109.43615999999997, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "document conversion and layout analysis research community a", "bbox": {"l": 317.95499, "t": 112.02057000000002, "r": 558.2041, "b": 120.39520000000005, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "new and challenging dataset to improve and fine-tune novel ML", "bbox": {"l": 317.95499, "t": 122.97955000000002, "r": 558.43274, "b": 131.35419000000002, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "methods on. In contrast to many other datasets, DocLayNet was", "bbox": {"l": 317.95499, "t": 133.93854, "r": 558.20416, "b": 142.31317, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "created by human annotation in order to obtain reliable layout", "bbox": {"l": 317.95499, "t": 144.89752, "r": 558.20422, "b": 153.27215999999999, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "ground-truth on a wide variety of publication- and typesetting-", "bbox": {"l": 317.95499, "t": 155.85657000000003, "r": 559.71313, "b": 164.23119999999994, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "styles. Including a large proportion of documents outside the scien-", "bbox": {"l": 317.95499, "t": 166.81555000000003, "r": 559.71375, "b": 175.19019000000003, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "tific publishing domain adds significant value in this respect.", "bbox": {"l": 317.95499, "t": 177.77454, "r": 540.04382, "b": 186.14917000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "text", "bbox": {"l": 317.686, "t": 188.73352, "r": 559.71704, "b": 284.77917, "coord_origin": "TOPLEFT"}, "confidence": 0.9800531268119812, "cells": [{"id": 122, "text": "From the dataset, we have derived on the one hand reference", "bbox": {"l": 327.918, "t": 188.73352, "r": 558.19836, "b": 197.10815000000002, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "metrics for human performance on document-layout annotation", "bbox": {"l": 317.95499, "t": 199.69257000000005, "r": 558.20404, "b": 208.06719999999996, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "(through double and triple annotations) and on the other hand eval-", "bbox": {"l": 317.686, "t": 210.65155000000004, "r": 559.71704, "b": 219.02617999999995, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "uated the baseline performance of commonly used object detection", "bbox": {"l": 317.95499, "t": 221.60956, "r": 558.20245, "b": 229.98419, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "methods. We also illustrated the impact of various dataset-related", "bbox": {"l": 317.95499, "t": 232.56853999999998, "r": 558.20502, "b": 240.94317999999998, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "aspects on model performance through data-ablation experiments,", "bbox": {"l": 317.95499, "t": 243.52752999999996, "r": 559.18408, "b": 251.90215999999998, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "both from a size and class-label perspective. Last but not least, we", "bbox": {"l": 317.95499, "t": 254.48650999999995, "r": 558.20227, "b": 262.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "compared the accuracy of models trained on other public datasets", "bbox": {"l": 317.95499, "t": 265.44556, "r": 558.20349, "b": 273.82019, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "and showed that DocLayNet trained models are more robust.", "bbox": {"l": 317.95499, "t": 276.40454, "r": 540.99426, "b": 284.77917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "text", "bbox": {"l": 317.62299, "t": 287.36353, "r": 558.43469, "b": 317.65616000000006, "coord_origin": "TOPLEFT"}, "confidence": 0.9676100015640259, "cells": [{"id": 131, "text": "To date, there is still a significant gap between human and ML", "bbox": {"l": 327.918, "t": 287.36353, "r": 558.43469, "b": 295.73816, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "accuracy on the layout interpretation task, and we hope that this", "bbox": {"l": 317.95499, "t": 298.32254, "r": 558.20013, "b": 306.69717, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "work will inspire the research community to close that gap.", "bbox": {"l": 317.62299, "t": 309.28152, "r": 535.65015, "b": 317.65616000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "section_header", "bbox": {"l": 317.95499, "t": 335.09189, "r": 387.3696, "b": 345.40097, "coord_origin": "TOPLEFT"}, "confidence": 0.9378752708435059, "cells": [{"id": 134, "text": "REFERENCES", "bbox": {"l": 317.95499, "t": 335.09189, "r": 387.3696, "b": 345.40097, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "list_item", "bbox": {"l": 321.198, "t": 348.70233, "r": 558.20099, "b": 371.16286999999994, "coord_origin": "TOPLEFT"}, "confidence": 0.9372856616973877, "cells": [{"id": 135, "text": "[1]", "bbox": {"l": 321.198, "t": 348.70233, "r": 329.72415, "b": 355.21588, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "Max G\u00f6bel, Tamir Hassan, Ermelinda Oro, and Giorgio Orsi. Icdar 2013 table", "bbox": {"l": 331.53516, "t": 348.70233, "r": 558.19904, "b": 355.21588, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "competition. In", "bbox": {"l": 333.39099, "t": 356.67236, "r": 379.36414, "b": 363.18591, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "2013 12th International Conference on Document Analysis and", "bbox": {"l": 381.37201, "t": 356.70724, "r": 558.20099, "b": 363.19287, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "Recognition", "bbox": {"l": 333.39099, "t": 364.67724999999996, "r": 365.59601, "b": 371.16286999999994, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": ", pages 1449-1453, 2013.", "bbox": {"l": 365.59601, "t": 364.64236, "r": 434.29489, "b": 371.15591, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "list_item", "bbox": {"l": 321.198, "t": 372.61237, "r": 559.37982, "b": 403.04287999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9480945467948914, "cells": [{"id": 141, "text": "[2]", "bbox": {"l": 321.198, "t": 372.61237, "r": 329.85956, "b": 379.12592, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "Christian Clausner, Apostolos Antonacopoulos, and Stefan Pletschacher. Ic-", "bbox": {"l": 331.69931, "t": 372.61237, "r": 559.37976, "b": 379.12592, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "dar2017 competition on recognition of documents with complex layouts -", "bbox": {"l": 333.39099, "t": 380.58237, "r": 559.37982, "b": 387.09592, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "rdcl2017. In", "bbox": {"l": 333.39099, "t": 388.55236999999994, "r": 367.4339, "b": 395.06592, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "2017 14th IAPR International Conference on Document Analysis and", "bbox": {"l": 369.17401, "t": 388.58725000000004, "r": 558.20422, "b": 395.07288, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "Recognition (ICDAR)", "bbox": {"l": 333.39099, "t": 396.55725, "r": 390.87601, "b": 403.04287999999997, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": ", volume 01, pages 1404-1410, 2017.", "bbox": {"l": 390.87698, "t": 396.52237, "r": 492.17831, "b": 403.03592, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "list_item", "bbox": {"l": 321.198, "t": 404.49237, "r": 558.20013, "b": 426.94689999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9257517457008362, "cells": [{"id": 148, "text": "[3]", "bbox": {"l": 321.198, "t": 404.49237, "r": 329.53583, "b": 411.00592, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "Herv\u00e9 D\u00e9jean, Jean-Luc Meunier, Liangcai Gao, Yilun Huang, Yu Fang, Florian", "bbox": {"l": 331.30682, "t": 404.49237, "r": 558.19958, "b": 411.00592, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "Kleber, and Eva-Maria Lang. ICDAR 2019 Competition on Table Detection and", "bbox": {"l": 333.39099, "t": 412.46335, "r": 558.20013, "b": 418.9769, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "Recognition (cTDaR), April 2019. http://sac.founderit.com/.", "bbox": {"l": 333.39099, "t": 420.43335, "r": 501.80127, "b": 426.94689999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "list_item", "bbox": {"l": 321.198, "t": 428.40335, "r": 559.37872, "b": 458.8269, "coord_origin": "TOPLEFT"}, "confidence": 0.9270979762077332, "cells": [{"id": 152, "text": "[4]", "bbox": {"l": 321.198, "t": 428.40335, "r": 329.91299, "b": 434.9169, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "Antonio Jimeno Yepes, Peter Zhong, and Douglas Burdick. Competition on", "bbox": {"l": 331.7641, "t": 428.40335, "r": 558.19885, "b": 434.9169, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "scientific literature parsing. In", "bbox": {"l": 333.39099, "t": 436.3733500000001, "r": 423.77225, "b": 442.8869, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "Proceedings of the International Conference on", "bbox": {"l": 425.909, "t": 436.40823, "r": 558.20178, "b": 442.89386, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "Document Analysis and Recognition", "bbox": {"l": 333.39099, "t": 444.37823, "r": 429.42697, "b": 450.86386, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": ", ICDAR, pages 605-617. LNCS 12824, Springer-", "bbox": {"l": 429.42400999999995, "t": 444.34335, "r": 559.37872, "b": 450.85689999999994, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "Verlag, sep 2021.", "bbox": {"l": 332.819, "t": 452.31335, "r": 380.01764, "b": 458.8269, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "list_item", "bbox": {"l": 321.198, "t": 460.28336, "r": 559.02625, "b": 490.70792, "coord_origin": "TOPLEFT"}, "confidence": 0.9290013313293457, "cells": [{"id": 159, "text": "[5]", "bbox": {"l": 321.198, "t": 460.28336, "r": 329.22977, "b": 466.79691, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "Logan Markewich, Hao Zhang, Yubin Xing, Navid Lambert-Shirzad, Jiang Zhexin,", "bbox": {"l": 330.93576, "t": 460.28336, "r": 558.97156, "b": 466.79691, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "Roy Lee, Zhi Li, and Seok-Bum Ko. Segmentation for document layout analysis:", "bbox": {"l": 333.39099, "t": 468.25336, "r": 559.02625, "b": 474.76691, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "not dead yet.", "bbox": {"l": 333.39099, "t": 476.22437, "r": 368.85431, "b": 482.73792, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "International Journal on Document Analysis and Recognition (IJDAR)", "bbox": {"l": 370.811, "t": 476.25925, "r": 557.46326, "b": 482.74487, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": ",", "bbox": {"l": 557.46503, "t": 476.22437, "r": 558.96857, "b": 482.73792, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "pages 1-11, 01 2022.", "bbox": {"l": 333.39099, "t": 484.19437, "r": 390.82715, "b": 490.70792, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "list_item", "bbox": {"l": 321.198, "t": 492.16437, "r": 558.20361, "b": 514.6248800000001, "coord_origin": "TOPLEFT"}, "confidence": 0.927480161190033, "cells": [{"id": 166, "text": "[6]", "bbox": {"l": 321.198, "t": 492.16437, "r": 329.42145, "b": 498.67792, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "Xu Zhong, Jianbin Tang, and Antonio Jimeno-Yepes. Publaynet: Largest dataset", "bbox": {"l": 331.16812, "t": 492.16437, "r": 558.20361, "b": 498.67792, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "ever for document layout analysis. In", "bbox": {"l": 333.39099, "t": 500.13437, "r": 438.6101100000001, "b": 506.64792, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "Proceedings of the International Conference", "bbox": {"l": 440.349, "t": 500.16925, "r": 558.19958, "b": 506.65488, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "on Document Analysis and Recognition", "bbox": {"l": 333.39099, "t": 508.13925, "r": 441.40118, "b": 514.6248800000001, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": ", ICDAR, pages 1015-1022, sep 2019.", "bbox": {"l": 441.4019799999999, "t": 508.10437, "r": 544.78162, "b": 514.61792, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "list_item", "bbox": {"l": 321.19797, "t": 516.07437, "r": 558.9715, "b": 554.46889, "coord_origin": "TOPLEFT"}, "confidence": 0.9426896572113037, "cells": [{"id": 172, "text": "[7]", "bbox": {"l": 321.19797, "t": 516.07437, "r": 329.74161, "b": 522.5879199999999, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "Minghao Li, Yiheng Xu, Lei Cui, Shaohan Huang, Furu Wei, Zhoujun Li, and", "bbox": {"l": 331.55634, "t": 516.07437, "r": 558.19897, "b": 522.5879199999999, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "Ming Zhou. Docbank: A benchmark dataset for document layout analysis. In", "bbox": {"l": 333.39099, "t": 524.0443700000001, "r": 558.19891, "b": 530.55792, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "Proceedings of the 28th International Conference on Computational Linguistics", "bbox": {"l": 333.39099, "t": 532.04922, "r": 557.40228, "b": 538.53487, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": ",", "bbox": {"l": 557.40399, "t": 532.01437, "r": 558.96893, "b": 538.5278900000001, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "COLING, pages 949-960. International Committee on Computational Linguistics,", "bbox": {"l": 333.39099, "t": 539.98438, "r": 558.9715, "b": 546.49789, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "dec 2020.", "bbox": {"l": 333.39099, "t": 547.95535, "r": 359.31955, "b": 554.46889, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "list_item", "bbox": {"l": 321.198, "t": 555.92535, "r": 558.90222, "b": 578.38586, "coord_origin": "TOPLEFT"}, "confidence": 0.9139690399169922, "cells": [{"id": 179, "text": "[8]", "bbox": {"l": 321.198, "t": 555.92535, "r": 329.7088, "b": 562.43889, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "Riaz Ahmad, Muhammad Tanvir Afzal, and M. Qadir. Information extraction", "bbox": {"l": 331.51654, "t": 555.92535, "r": 558.19891, "b": 562.43889, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "from pdf sources based on rule-based system using integrated formats. In", "bbox": {"l": 333.39099, "t": 563.89536, "r": 535.54352, "b": 570.40889, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "SemWe-", "bbox": {"l": 536.96399, "t": 563.93024, "r": 558.90222, "b": 570.4158600000001, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "bEval@ESWC", "bbox": {"l": 333.39099, "t": 571.9002399999999, "r": 371.94217, "b": 578.38586, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": ", 2016.", "bbox": {"l": 371.94299, "t": 571.86536, "r": 389.72617, "b": 578.3788900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "list_item", "bbox": {"l": 321.198, "t": 579.83536, "r": 559.27448, "b": 610.2589, "coord_origin": "TOPLEFT"}, "confidence": 0.9113105535507202, "cells": [{"id": 185, "text": "[9]", "bbox": {"l": 321.198, "t": 579.83536, "r": 329.45999, "b": 586.34889, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "Ross B. Girshick, Jeff Donahue, Trevor Darrell, and Jitendra Malik. Rich feature", "bbox": {"l": 331.21487, "t": 579.83536, "r": 558.19843, "b": 586.34889, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "hierarchies for accurate object detection and semantic segmentation. In", "bbox": {"l": 333.39099, "t": 587.8053600000001, "r": 543.05487, "b": 594.31889, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": "IEEE", "bbox": {"l": 544.98499, "t": 587.84024, "r": 558.20148, "b": 594.32587, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "Conference on Computer Vision and Pattern Recognition", "bbox": {"l": 333.39099, "t": 595.81024, "r": 491.61166, "b": 602.29587, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": ", CVPR, pages 580-587.", "bbox": {"l": 491.61301, "t": 595.77536, "r": 559.27448, "b": 602.28889, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "IEEE Computer Society, jun 2014.", "bbox": {"l": 333.39099, "t": 603.74536, "r": 428.59726000000006, "b": 610.2589, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "list_item", "bbox": {"l": 317.95499, "t": 611.71536, "r": 558.20203, "b": 626.20686, "coord_origin": "TOPLEFT"}, "confidence": 0.9028770327568054, "cells": [{"id": 192, "text": "[10]", "bbox": {"l": 317.95499, "t": 611.71536, "r": 329.54767, "b": 618.2289000000001, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "Ross B. Girshick. Fast R-CNN. In", "bbox": {"l": 331.31268, "t": 611.71536, "r": 425.1554, "b": 618.2289000000001, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "2015 IEEE International Conference on Computer", "bbox": {"l": 426.77802, "t": 611.75024, "r": 558.20203, "b": 618.23587, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "Vision", "bbox": {"l": 333.39099, "t": 619.72124, "r": 350.59537, "b": 626.20686, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": ", ICCV, pages 1440-1448. IEEE Computer Society, dec 2015.", "bbox": {"l": 350.59598, "t": 619.68637, "r": 518.58777, "b": 626.19989, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "list_item", "bbox": {"l": 317.95499, "t": 627.65637, "r": 558.20142, "b": 650.1168700000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9127691984176636, "cells": [{"id": 197, "text": "[11]", "bbox": {"l": 317.95499, "t": 627.65637, "r": 329.5459, "b": 634.16989, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "Shaoqing Ren, Kaiming He, Ross Girshick, and Jian Sun. Faster r-cnn: Towards", "bbox": {"l": 331.31064, "t": 627.65637, "r": 558.20142, "b": 634.16989, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "real-time object detection with region proposal networks.", "bbox": {"l": 333.39099, "t": 635.62637, "r": 497.50909, "b": 642.13989, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "IEEE Transactions on", "bbox": {"l": 500.01401, "t": 635.66124, "r": 558.19885, "b": 642.14687, "coord_origin": "TOPLEFT"}}, {"id": 201, "text": "Pattern Analysis and Machine Intelligence", "bbox": {"l": 333.39099, "t": 643.6312399999999, "r": 449.38620000000003, "b": 650.1168700000001, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": ", 39(6):1137-1149, 2017.", "bbox": {"l": 449.38699, "t": 643.59637, "r": 515.74268, "b": 650.10989, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "list_item", "bbox": {"l": 317.95499, "t": 651.56638, "r": 559.27808, "b": 674.01989, "coord_origin": "TOPLEFT"}, "confidence": 0.9142462611198425, "cells": [{"id": 203, "text": "[12]", "bbox": {"l": 317.95499, "t": 651.56638, "r": 329.41763, "b": 658.0799, "coord_origin": "TOPLEFT"}}, {"id": 204, "text": "Kaiming He, Georgia Gkioxari, Piotr Doll\u00e1r, and Ross B. Girshick. Mask R-CNN.", "bbox": {"l": 331.16287, "t": 651.56638, "r": 559.27808, "b": 658.0799, "coord_origin": "TOPLEFT"}}, {"id": 205, "text": "In", "bbox": {"l": 333.39099, "t": 659.53638, "r": 339.35904, "b": 666.0499, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": "IEEE International Conference on Computer Vision", "bbox": {"l": 341.56299, "t": 659.57124, "r": 485.8273, "b": 666.05687, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": ", ICCV, pages 2980-2988.", "bbox": {"l": 485.82901, "t": 659.53638, "r": 559.27356, "b": 666.0499, "coord_origin": "TOPLEFT"}}, {"id": 208, "text": "IEEE Computer Society, Oct 2017.", "bbox": {"l": 333.39099, "t": 667.50636, "r": 429.30161000000004, "b": 674.01989, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "list_item", "bbox": {"l": 317.95499, "t": 675.47636, "r": 558.97156, "b": 705.900894, "coord_origin": "TOPLEFT"}, "confidence": 0.8895429372787476, "cells": [{"id": 209, "text": "[13]", "bbox": {"l": 317.95499, "t": 675.47636, "r": 330.11407, "b": 681.9898900000001, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": "Glenn Jocher, Alex Stoken, Ayush Chaurasia, Jirka Borovec, NanoCode012,", "bbox": {"l": 331.96533, "t": 675.47636, "r": 558.96716, "b": 681.9898900000001, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "TaoXie, Yonghye Kwon, Kalen Michael, Liu Changyu, Jiacong Fang, Abhiram V,", "bbox": {"l": 333.18201, "t": 683.44637, "r": 558.96661, "b": 689.95989, "coord_origin": "TOPLEFT"}}, {"id": 212, "text": "Laughing, tkianai, yxNONG, Piotr Skalski, Adam Hogan, Jebastin Nadar, imyhxy,", "bbox": {"l": 333.39099, "t": 691.41737, "r": 558.97156, "b": 697.930893, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "Lorenzo Mammana, Alex Wang, Cristi Fati, Diego Montes, Jan Hajek, Laurentiu", "bbox": {"l": 333.39099, "t": 699.387367, "r": 558.20001, "b": 705.900894, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {"0": {"label": "table", "id": 0, "page_no": 7, "cluster": {"id": 0, "label": "table", "bbox": {"l": 72.6590347290039, "t": 172.48080444335938, "r": 274.83465576171875, "b": 339.8540344238281, "coord_origin": "TOPLEFT"}, "confidence": 0.9892616271972656, "cells": [{"id": 8, "text": "Testing on", "bbox": {"l": 217.74099999999999, "t": 175.01855, "r": 256.26065, "b": 183.39319, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Training on", "bbox": {"l": 89.954002, "t": 185.97655999999995, "r": 133.24379, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "labels", "bbox": {"l": 154.629, "t": 185.97655999999995, "r": 175.47588, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "PLN", "bbox": {"l": 204.69, "t": 185.97655999999995, "r": 220.54260000000002, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "DB", "bbox": {"l": 230.50427000000002, "t": 185.97655999999995, "r": 242.06197, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "DLN", "bbox": {"l": 252.02364, "t": 185.97655999999995, "r": 269.31085, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "PubLayNet (PLN)", "bbox": {"l": 78.530998, "t": 219.25256000000002, "r": 142.56006, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Figure", "bbox": {"l": 154.629, "t": 197.33452999999997, "r": 177.92371, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "96", "bbox": {"l": 208.44701, "t": 197.33452999999997, "r": 216.78575000000004, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "43", "bbox": {"l": 232.1183, "t": 197.33452999999997, "r": 240.45705, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "23", "bbox": {"l": 256.49792, "t": 197.33452999999997, "r": 264.83667, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Sec-header", "bbox": {"l": 154.629, "t": 208.29351999999994, "r": 194.72675, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "87", "bbox": {"l": 208.44701, "t": 208.29351999999994, "r": 216.78575000000004, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "-", "bbox": {"l": 234.77235, "t": 208.29351999999994, "r": 237.80299000000002, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "32", "bbox": {"l": 256.49792, "t": 208.29351999999994, "r": 264.83667, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Table", "bbox": {"l": 154.629, "t": 219.25256000000002, "r": 174.43578, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "95", "bbox": {"l": 208.44701, "t": 219.25256000000002, "r": 216.78575000000004, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "24", "bbox": {"l": 232.1183, "t": 219.25256000000002, "r": 240.45705, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "49", "bbox": {"l": 256.49792, "t": 219.25256000000002, "r": 264.83667, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Text", "bbox": {"l": 154.629, "t": 230.21155, "r": 170.58919, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "96", "bbox": {"l": 208.44701, "t": 230.21155, "r": 216.78575000000004, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "-", "bbox": {"l": 234.77235, "t": 230.21155, "r": 237.80299000000002, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "42", "bbox": {"l": 256.49792, "t": 230.21155, "r": 264.83667, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "total", "bbox": {"l": 154.629, "t": 241.16956000000005, "r": 171.2796, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "93", "bbox": {"l": 208.44701, "t": 241.16956000000005, "r": 216.78575000000004, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "34", "bbox": {"l": 232.1183, "t": 241.16956000000005, "r": 240.45705, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "30", "bbox": {"l": 256.49792, "t": 241.16956000000005, "r": 264.83667, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "DocBank (DB)", "bbox": {"l": 78.530998, "t": 263.48650999999995, "r": 131.19963, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Figure", "bbox": {"l": 154.629, "t": 252.52752999999996, "r": 177.92371, "b": 260.90216, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "77", "bbox": {"l": 208.44701, "t": 252.52752999999996, "r": 216.78575000000004, "b": 260.90216, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "71", "bbox": {"l": 232.1183, "t": 252.52752999999996, "r": 240.45705, "b": 260.90216, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "31", "bbox": {"l": 256.49792, "t": 252.52752999999996, "r": 264.83667, "b": 260.90216, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "Table", "bbox": {"l": 154.629, "t": 263.48650999999995, "r": 174.43578, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "19", "bbox": {"l": 208.44701, "t": 263.48650999999995, "r": 216.78575000000004, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "65", "bbox": {"l": 232.1183, "t": 263.48650999999995, "r": 240.45705, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "22", "bbox": {"l": 256.49792, "t": 263.48650999999995, "r": 264.83667, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "total", "bbox": {"l": 154.629, "t": 274.44556, "r": 171.2796, "b": 282.82016, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "48", "bbox": {"l": 208.44701, "t": 274.44556, "r": 216.78575000000004, "b": 282.82016, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "68", "bbox": {"l": 232.1183, "t": 274.44556, "r": 240.45705, "b": 282.82016, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "27", "bbox": {"l": 256.49792, "t": 274.44556, "r": 264.83667, "b": 282.82016, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "DocLayNet (DLN)", "bbox": {"l": 78.530998, "t": 307.72055, "r": 144.66716, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "Figure", "bbox": {"l": 154.629, "t": 285.80255, "r": 177.92371, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "67", "bbox": {"l": 208.44701, "t": 285.80255, "r": 216.78575000000004, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "51", "bbox": {"l": 232.1183, "t": 285.80255, "r": 240.45705, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "72", "bbox": {"l": 256.49792, "t": 285.80255, "r": 264.83667, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Sec-header", "bbox": {"l": 154.629, "t": 296.76154, "r": 194.72675, "b": 305.13617, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "53", "bbox": {"l": 208.44701, "t": 296.76154, "r": 216.78575000000004, "b": 305.13617, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "-", "bbox": {"l": 234.77235, "t": 296.76154, "r": 237.80299000000002, "b": 305.13617, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "68", "bbox": {"l": 256.49792, "t": 296.76154, "r": 264.83667, "b": 305.13617, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Table", "bbox": {"l": 154.629, "t": 307.72055, "r": 174.43578, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "87", "bbox": {"l": 208.44701, "t": 307.72055, "r": 216.78575000000004, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "43", "bbox": {"l": 232.1183, "t": 307.72055, "r": 240.45705, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "82", "bbox": {"l": 256.49792, "t": 307.72055, "r": 264.83667, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "Text", "bbox": {"l": 154.629, "t": 318.67953, "r": 170.58919, "b": 327.05417, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "77", "bbox": {"l": 208.44701, "t": 318.67953, "r": 216.78575000000004, "b": 327.05417, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "-", "bbox": {"l": 234.77235, "t": 318.67953, "r": 237.80299000000002, "b": 327.05417, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "84", "bbox": {"l": 256.49792, "t": 318.67953, "r": 264.83667, "b": 327.05417, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "total", "bbox": {"l": 154.629, "t": 329.63855, "r": 171.2796, "b": 338.01318, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "59", "bbox": {"l": 208.44701, "t": 329.63855, "r": 216.78575000000004, "b": 338.01318, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "47", "bbox": {"l": 232.1183, "t": 329.63855, "r": 240.45705, "b": 338.01318, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "78", "bbox": {"l": 256.49792, "t": 329.63855, "r": 264.83667, "b": 338.01318, "coord_origin": "TOPLEFT"}}], "children": [{"id": 25, "label": "text", "bbox": {"l": 217.74099999999999, "t": 175.01855, "r": 256.26065, "b": 183.39319, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "Testing on", "bbox": {"l": 217.74099999999999, "t": 175.01855, "r": 256.26065, "b": 183.39319, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 89.954002, "t": 185.97655999999995, "r": 133.24379, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "Training on", "bbox": {"l": 89.954002, "t": 185.97655999999995, "r": 133.24379, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 154.629, "t": 185.97655999999995, "r": 175.47588, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "labels", "bbox": {"l": 154.629, "t": 185.97655999999995, "r": 175.47588, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 204.69, "t": 185.97655999999995, "r": 220.54260000000002, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "PLN", "bbox": {"l": 204.69, "t": 185.97655999999995, "r": 220.54260000000002, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 230.50427000000002, "t": 185.97655999999995, "r": 242.06197, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "DB", "bbox": {"l": 230.50427000000002, "t": 185.97655999999995, "r": 242.06197, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 252.02364, "t": 185.97655999999995, "r": 269.31085, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "DLN", "bbox": {"l": 252.02364, "t": 185.97655999999995, "r": 269.31085, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 78.530998, "t": 219.25256000000002, "r": 142.56006, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "PubLayNet (PLN)", "bbox": {"l": 78.530998, "t": 219.25256000000002, "r": 142.56006, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 154.629, "t": 197.33452999999997, "r": 177.92371, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "Figure", "bbox": {"l": 154.629, "t": 197.33452999999997, "r": 177.92371, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 208.44701, "t": 197.33452999999997, "r": 216.78575000000004, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "96", "bbox": {"l": 208.44701, "t": 197.33452999999997, "r": 216.78575000000004, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 232.1183, "t": 197.33452999999997, "r": 240.45705, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "43", "bbox": {"l": 232.1183, "t": 197.33452999999997, "r": 240.45705, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 256.49792, "t": 197.33452999999997, "r": 264.83667, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "23", "bbox": {"l": 256.49792, "t": 197.33452999999997, "r": 264.83667, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 154.629, "t": 208.29351999999994, "r": 194.72675, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "Sec-header", "bbox": {"l": 154.629, "t": 208.29351999999994, "r": 194.72675, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 208.44701, "t": 208.29351999999994, "r": 216.78575000000004, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "87", "bbox": {"l": 208.44701, "t": 208.29351999999994, "r": 216.78575000000004, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 234.77235, "t": 208.29351999999994, "r": 237.80299000000002, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "-", "bbox": {"l": 234.77235, "t": 208.29351999999994, "r": 237.80299000000002, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 256.49792, "t": 208.29351999999994, "r": 264.83667, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "32", "bbox": {"l": 256.49792, "t": 208.29351999999994, "r": 264.83667, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 154.629, "t": 219.25256000000002, "r": 174.43578, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "Table", "bbox": {"l": 154.629, "t": 219.25256000000002, "r": 174.43578, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 208.44701, "t": 219.25256000000002, "r": 216.78575000000004, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "95", "bbox": {"l": 208.44701, "t": 219.25256000000002, "r": 216.78575000000004, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 232.1183, "t": 219.25256000000002, "r": 240.45705, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "24", "bbox": {"l": 232.1183, "t": 219.25256000000002, "r": 240.45705, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 256.49792, "t": 219.25256000000002, "r": 264.83667, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "49", "bbox": {"l": 256.49792, "t": 219.25256000000002, "r": 264.83667, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 154.629, "t": 230.21155, "r": 170.58919, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "Text", "bbox": {"l": 154.629, "t": 230.21155, "r": 170.58919, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 208.44701, "t": 230.21155, "r": 216.78575000000004, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "96", "bbox": {"l": 208.44701, "t": 230.21155, "r": 216.78575000000004, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 234.77235, "t": 230.21155, "r": 237.80299000000002, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "-", "bbox": {"l": 234.77235, "t": 230.21155, "r": 237.80299000000002, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 256.49792, "t": 230.21155, "r": 264.83667, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "42", "bbox": {"l": 256.49792, "t": 230.21155, "r": 264.83667, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 154.629, "t": 241.16956000000005, "r": 171.2796, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "total", "bbox": {"l": 154.629, "t": 241.16956000000005, "r": 171.2796, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 208.44701, "t": 241.16956000000005, "r": 216.78575000000004, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "93", "bbox": {"l": 208.44701, "t": 241.16956000000005, "r": 216.78575000000004, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 232.1183, "t": 241.16956000000005, "r": 240.45705, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "34", "bbox": {"l": 232.1183, "t": 241.16956000000005, "r": 240.45705, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 256.49792, "t": 241.16956000000005, "r": 264.83667, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "30", "bbox": {"l": 256.49792, "t": 241.16956000000005, "r": 264.83667, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 78.530998, "t": 263.48650999999995, "r": 131.19963, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "DocBank (DB)", "bbox": {"l": 78.530998, "t": 263.48650999999995, "r": 131.19963, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 154.629, "t": 252.52752999999996, "r": 177.92371, "b": 260.90216, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "Figure", "bbox": {"l": 154.629, "t": 252.52752999999996, "r": 177.92371, "b": 260.90216, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 208.44701, "t": 252.52752999999996, "r": 216.78575000000004, "b": 260.90216, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "77", "bbox": {"l": 208.44701, "t": 252.52752999999996, "r": 216.78575000000004, "b": 260.90216, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 232.1183, "t": 252.52752999999996, "r": 240.45705, "b": 260.90216, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "71", "bbox": {"l": 232.1183, "t": 252.52752999999996, "r": 240.45705, "b": 260.90216, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 256.49792, "t": 252.52752999999996, "r": 264.83667, "b": 260.90216, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "31", "bbox": {"l": 256.49792, "t": 252.52752999999996, "r": 264.83667, "b": 260.90216, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 154.629, "t": 263.48650999999995, "r": 174.43578, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "Table", "bbox": {"l": 154.629, "t": 263.48650999999995, "r": 174.43578, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 208.44701, "t": 263.48650999999995, "r": 216.78575000000004, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "19", "bbox": {"l": 208.44701, "t": 263.48650999999995, "r": 216.78575000000004, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 232.1183, "t": 263.48650999999995, "r": 240.45705, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "65", "bbox": {"l": 232.1183, "t": 263.48650999999995, "r": 240.45705, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 256.49792, "t": 263.48650999999995, "r": 264.83667, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "22", "bbox": {"l": 256.49792, "t": 263.48650999999995, "r": 264.83667, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 154.629, "t": 274.44556, "r": 171.2796, "b": 282.82016, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "total", "bbox": {"l": 154.629, "t": 274.44556, "r": 171.2796, "b": 282.82016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 208.44701, "t": 274.44556, "r": 216.78575000000004, "b": 282.82016, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "48", "bbox": {"l": 208.44701, "t": 274.44556, "r": 216.78575000000004, "b": 282.82016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 232.1183, "t": 274.44556, "r": 240.45705, "b": 282.82016, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "68", "bbox": {"l": 232.1183, "t": 274.44556, "r": 240.45705, "b": 282.82016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 256.49792, "t": 274.44556, "r": 264.83667, "b": 282.82016, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "27", "bbox": {"l": 256.49792, "t": 274.44556, "r": 264.83667, "b": 282.82016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 78.530998, "t": 307.72055, "r": 144.66716, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "DocLayNet (DLN)", "bbox": {"l": 78.530998, "t": 307.72055, "r": 144.66716, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 154.629, "t": 285.80255, "r": 177.92371, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "Figure", "bbox": {"l": 154.629, "t": 285.80255, "r": 177.92371, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 208.44701, "t": 285.80255, "r": 216.78575000000004, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "67", "bbox": {"l": 208.44701, "t": 285.80255, "r": 216.78575000000004, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 232.1183, "t": 285.80255, "r": 240.45705, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "51", "bbox": {"l": 232.1183, "t": 285.80255, "r": 240.45705, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 256.49792, "t": 285.80255, "r": 264.83667, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "72", "bbox": {"l": 256.49792, "t": 285.80255, "r": 264.83667, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 154.629, "t": 296.76154, "r": 194.72675, "b": 305.13617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "Sec-header", "bbox": {"l": 154.629, "t": 296.76154, "r": 194.72675, "b": 305.13617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 208.44701, "t": 296.76154, "r": 216.78575000000004, "b": 305.13617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "53", "bbox": {"l": 208.44701, "t": 296.76154, "r": 216.78575000000004, "b": 305.13617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 234.77235, "t": 296.76154, "r": 237.80299000000002, "b": 305.13617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "-", "bbox": {"l": 234.77235, "t": 296.76154, "r": 237.80299000000002, "b": 305.13617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 256.49792, "t": 296.76154, "r": 264.83667, "b": 305.13617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "68", "bbox": {"l": 256.49792, "t": 296.76154, "r": 264.83667, "b": 305.13617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 154.629, "t": 307.72055, "r": 174.43578, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "Table", "bbox": {"l": 154.629, "t": 307.72055, "r": 174.43578, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 208.44701, "t": 307.72055, "r": 216.78575000000004, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "87", "bbox": {"l": 208.44701, "t": 307.72055, "r": 216.78575000000004, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 232.1183, "t": 307.72055, "r": 240.45705, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "43", "bbox": {"l": 232.1183, "t": 307.72055, "r": 240.45705, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 256.49792, "t": 307.72055, "r": 264.83667, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "82", "bbox": {"l": 256.49792, "t": 307.72055, "r": 264.83667, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 154.629, "t": 318.67953, "r": 170.58919, "b": 327.05417, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "Text", "bbox": {"l": 154.629, "t": 318.67953, "r": 170.58919, "b": 327.05417, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 208.44701, "t": 318.67953, "r": 216.78575000000004, "b": 327.05417, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "77", "bbox": {"l": 208.44701, "t": 318.67953, "r": 216.78575000000004, "b": 327.05417, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 234.77235, "t": 318.67953, "r": 237.80299000000002, "b": 327.05417, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "-", "bbox": {"l": 234.77235, "t": 318.67953, "r": 237.80299000000002, "b": 327.05417, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 256.49792, "t": 318.67953, "r": 264.83667, "b": 327.05417, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "84", "bbox": {"l": 256.49792, "t": 318.67953, "r": 264.83667, "b": 327.05417, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 154.629, "t": 329.63855, "r": 171.2796, "b": 338.01318, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "total", "bbox": {"l": 154.629, "t": 329.63855, "r": 171.2796, "b": 338.01318, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 208.44701, "t": 329.63855, "r": 216.78575000000004, "b": 338.01318, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "59", "bbox": {"l": 208.44701, "t": 329.63855, "r": 216.78575000000004, "b": 338.01318, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 232.1183, "t": 329.63855, "r": 240.45705, "b": 338.01318, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "47", "bbox": {"l": 232.1183, "t": 329.63855, "r": 240.45705, "b": 338.01318, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 256.49792, "t": 329.63855, "r": 264.83667, "b": 338.01318, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "78", "bbox": {"l": 256.49792, "t": 329.63855, "r": 264.83667, "b": 338.01318, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "lcel", "lcel", "nl", "ched", "ched", "ched", "ched", "ched", "nl", "rhed", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl", "rhed", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl", "rhed", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl"], "num_rows": 15, "num_cols": 5, "table_cells": [{"bbox": {"l": 217.74099999999999, "t": 175.01855, "r": 256.26065, "b": 183.39319, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 3, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 5, "text": "Testing on", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 89.954002, "t": 185.97655999999995, "r": 133.24379, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Training on", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 185.97655999999995, "r": 175.47588, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "labels", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 204.69, "t": 185.97655999999995, "r": 220.54260000000002, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "PLN", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 230.50427000000002, "t": 185.97655999999995, "r": 242.06197, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "DB", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 252.02364, "t": 185.97655999999995, "r": 269.31085, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "DLN", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 78.530998, "t": 219.25256000000002, "r": 142.56006, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 5, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PubLayNet (PLN)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 154.629, "t": 197.33452999999997, "r": 177.92371, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Figure", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 197.33452999999997, "r": 216.78575000000004, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 197.33452999999997, "r": 240.45705, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "43", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 197.33452999999997, "r": 264.83667, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "23", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 208.29351999999994, "r": 194.72675, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Sec-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 208.29351999999994, "r": 216.78575000000004, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "87", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 234.77235, "t": 208.29351999999994, "r": 237.80299000000002, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 208.29351999999994, "r": 264.83667, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "32", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 219.25256000000002, "r": 174.43578, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 219.25256000000002, "r": 216.78575000000004, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "95", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 219.25256000000002, "r": 240.45705, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "24", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 219.25256000000002, "r": 264.83667, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "49", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 230.21155, "r": 170.58919, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Text", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 230.21155, "r": 216.78575000000004, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 234.77235, "t": 230.21155, "r": 237.80299000000002, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 230.21155, "r": 264.83667, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "42", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 241.16956000000005, "r": 171.2796, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "total", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 241.16956000000005, "r": 216.78575000000004, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "93", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 241.16956000000005, "r": 240.45705, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "34", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 241.16956000000005, "r": 264.83667, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "30", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 78.530998, "t": 263.48650999999995, "r": 131.19963, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "row_span": 3, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "DocBank (DB)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 154.629, "t": 252.52752999999996, "r": 177.92371, "b": 260.90216, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Figure", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 252.52752999999996, "r": 216.78575000000004, "b": 260.90216, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 252.52752999999996, "r": 240.45705, "b": 260.90216, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "71", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 252.52752999999996, "r": 264.83667, "b": 260.90216, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "31", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 263.48650999999995, "r": 174.43578, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 263.48650999999995, "r": 216.78575000000004, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "19", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 263.48650999999995, "r": 240.45705, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "65", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 263.48650999999995, "r": 264.83667, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "22", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 274.44556, "r": 171.2796, "b": 282.82016, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "total", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 274.44556, "r": 216.78575000000004, "b": 282.82016, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "48", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 274.44556, "r": 240.45705, "b": 282.82016, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 274.44556, "r": 264.83667, "b": 282.82016, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "27", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 78.530998, "t": 307.72055, "r": 144.66716, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "row_span": 5, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 15, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "DocLayNet (DLN)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 154.629, "t": 285.80255, "r": 177.92371, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Figure", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 285.80255, "r": 216.78575000000004, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "67", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 285.80255, "r": 240.45705, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "51", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 285.80255, "r": 264.83667, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 296.76154, "r": 194.72675, "b": 305.13617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Sec-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 296.76154, "r": 216.78575000000004, "b": 305.13617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "53", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 234.77235, "t": 296.76154, "r": 237.80299000000002, "b": 305.13617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 296.76154, "r": 264.83667, "b": 305.13617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 307.72055, "r": 174.43578, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 307.72055, "r": 216.78575000000004, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "87", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 307.72055, "r": 240.45705, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "43", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 307.72055, "r": 264.83667, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 318.67953, "r": 170.58919, "b": 327.05417, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Text", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 318.67953, "r": 216.78575000000004, "b": 327.05417, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 234.77235, "t": 318.67953, "r": 237.80299000000002, "b": 327.05417, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 318.67953, "r": 264.83667, "b": 327.05417, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 329.63855, "r": 171.2796, "b": 338.01318, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 14, "end_row_offset_idx": 15, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "total", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 329.63855, "r": 216.78575000000004, "b": 338.01318, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 14, "end_row_offset_idx": 15, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "59", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 329.63855, "r": 240.45705, "b": 338.01318, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 14, "end_row_offset_idx": 15, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "47", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 329.63855, "r": 264.83667, "b": 338.01318, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 14, "end_row_offset_idx": 15, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "78", "column_header": false, "row_header": false, "row_section": false}]}}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_header", "id": 24, "page_no": 7, "cluster": {"id": 24, "label": "page_header", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.7984204292297363, "cells": [{"id": 0, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 246.24382, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar", "bbox": {"l": 253.13897999999998, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar"}, {"label": "text", "id": 5, "page_no": 7, "cluster": {"id": 5, "label": "text", "bbox": {"l": 53.501999, "t": 86.87292000000002, "r": 295.64868, "b": 150.14111000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9824112057685852, "cells": [{"id": 2, "text": "Table 5: Prediction Performance (mAP@0.5-0.95) of a Mask", "bbox": {"l": 53.501999, "t": 86.87292000000002, "r": 294.32153, "b": 95.34618999999998, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "R-CNN R50 network across the PubLayNet, DocBank & Do-", "bbox": {"l": 53.79800000000001, "t": 97.83191, "r": 295.64868, "b": 106.30517999999995, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "cLayNet data-sets. By evaluating on common label classes of", "bbox": {"l": 53.79800000000001, "t": 108.79088999999999, "r": 294.0437, "b": 117.26415999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "each dataset, we observe that the DocLayNet-trained model", "bbox": {"l": 53.79800000000001, "t": 119.74987999999996, "r": 294.04373, "b": 128.22313999999994, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "has much less pronounced variations in performance across", "bbox": {"l": 53.79800000000001, "t": 130.70885999999996, "r": 294.0437, "b": 139.18213000000003, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "all datasets.", "bbox": {"l": 53.79800000000001, "t": 141.66785000000004, "r": 101.15852, "b": 150.14111000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 5: Prediction Performance (mAP@0.5-0.95) of a Mask R-CNN R50 network across the PubLayNet, DocBank & DocLayNet data-sets. By evaluating on common label classes of each dataset, we observe that the DocLayNet-trained model has much less pronounced variations in performance across all datasets."}, {"label": "table", "id": 0, "page_no": 7, "cluster": {"id": 0, "label": "table", "bbox": {"l": 72.6590347290039, "t": 172.48080444335938, "r": 274.83465576171875, "b": 339.8540344238281, "coord_origin": "TOPLEFT"}, "confidence": 0.9892616271972656, "cells": [{"id": 8, "text": "Testing on", "bbox": {"l": 217.74099999999999, "t": 175.01855, "r": 256.26065, "b": 183.39319, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Training on", "bbox": {"l": 89.954002, "t": 185.97655999999995, "r": 133.24379, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "labels", "bbox": {"l": 154.629, "t": 185.97655999999995, "r": 175.47588, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "PLN", "bbox": {"l": 204.69, "t": 185.97655999999995, "r": 220.54260000000002, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "DB", "bbox": {"l": 230.50427000000002, "t": 185.97655999999995, "r": 242.06197, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "DLN", "bbox": {"l": 252.02364, "t": 185.97655999999995, "r": 269.31085, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "PubLayNet (PLN)", "bbox": {"l": 78.530998, "t": 219.25256000000002, "r": 142.56006, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Figure", "bbox": {"l": 154.629, "t": 197.33452999999997, "r": 177.92371, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "96", "bbox": {"l": 208.44701, "t": 197.33452999999997, "r": 216.78575000000004, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "43", "bbox": {"l": 232.1183, "t": 197.33452999999997, "r": 240.45705, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "23", "bbox": {"l": 256.49792, "t": 197.33452999999997, "r": 264.83667, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Sec-header", "bbox": {"l": 154.629, "t": 208.29351999999994, "r": 194.72675, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "87", "bbox": {"l": 208.44701, "t": 208.29351999999994, "r": 216.78575000000004, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "-", "bbox": {"l": 234.77235, "t": 208.29351999999994, "r": 237.80299000000002, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "32", "bbox": {"l": 256.49792, "t": 208.29351999999994, "r": 264.83667, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Table", "bbox": {"l": 154.629, "t": 219.25256000000002, "r": 174.43578, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "95", "bbox": {"l": 208.44701, "t": 219.25256000000002, "r": 216.78575000000004, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "24", "bbox": {"l": 232.1183, "t": 219.25256000000002, "r": 240.45705, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "49", "bbox": {"l": 256.49792, "t": 219.25256000000002, "r": 264.83667, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Text", "bbox": {"l": 154.629, "t": 230.21155, "r": 170.58919, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "96", "bbox": {"l": 208.44701, "t": 230.21155, "r": 216.78575000000004, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "-", "bbox": {"l": 234.77235, "t": 230.21155, "r": 237.80299000000002, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "42", "bbox": {"l": 256.49792, "t": 230.21155, "r": 264.83667, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "total", "bbox": {"l": 154.629, "t": 241.16956000000005, "r": 171.2796, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "93", "bbox": {"l": 208.44701, "t": 241.16956000000005, "r": 216.78575000000004, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "34", "bbox": {"l": 232.1183, "t": 241.16956000000005, "r": 240.45705, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "30", "bbox": {"l": 256.49792, "t": 241.16956000000005, "r": 264.83667, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "DocBank (DB)", "bbox": {"l": 78.530998, "t": 263.48650999999995, "r": 131.19963, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Figure", "bbox": {"l": 154.629, "t": 252.52752999999996, "r": 177.92371, "b": 260.90216, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "77", "bbox": {"l": 208.44701, "t": 252.52752999999996, "r": 216.78575000000004, "b": 260.90216, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "71", "bbox": {"l": 232.1183, "t": 252.52752999999996, "r": 240.45705, "b": 260.90216, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "31", "bbox": {"l": 256.49792, "t": 252.52752999999996, "r": 264.83667, "b": 260.90216, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "Table", "bbox": {"l": 154.629, "t": 263.48650999999995, "r": 174.43578, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "19", "bbox": {"l": 208.44701, "t": 263.48650999999995, "r": 216.78575000000004, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "65", "bbox": {"l": 232.1183, "t": 263.48650999999995, "r": 240.45705, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "22", "bbox": {"l": 256.49792, "t": 263.48650999999995, "r": 264.83667, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "total", "bbox": {"l": 154.629, "t": 274.44556, "r": 171.2796, "b": 282.82016, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "48", "bbox": {"l": 208.44701, "t": 274.44556, "r": 216.78575000000004, "b": 282.82016, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "68", "bbox": {"l": 232.1183, "t": 274.44556, "r": 240.45705, "b": 282.82016, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "27", "bbox": {"l": 256.49792, "t": 274.44556, "r": 264.83667, "b": 282.82016, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "DocLayNet (DLN)", "bbox": {"l": 78.530998, "t": 307.72055, "r": 144.66716, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "Figure", "bbox": {"l": 154.629, "t": 285.80255, "r": 177.92371, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "67", "bbox": {"l": 208.44701, "t": 285.80255, "r": 216.78575000000004, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "51", "bbox": {"l": 232.1183, "t": 285.80255, "r": 240.45705, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "72", "bbox": {"l": 256.49792, "t": 285.80255, "r": 264.83667, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Sec-header", "bbox": {"l": 154.629, "t": 296.76154, "r": 194.72675, "b": 305.13617, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "53", "bbox": {"l": 208.44701, "t": 296.76154, "r": 216.78575000000004, "b": 305.13617, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "-", "bbox": {"l": 234.77235, "t": 296.76154, "r": 237.80299000000002, "b": 305.13617, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "68", "bbox": {"l": 256.49792, "t": 296.76154, "r": 264.83667, "b": 305.13617, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Table", "bbox": {"l": 154.629, "t": 307.72055, "r": 174.43578, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "87", "bbox": {"l": 208.44701, "t": 307.72055, "r": 216.78575000000004, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "43", "bbox": {"l": 232.1183, "t": 307.72055, "r": 240.45705, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "82", "bbox": {"l": 256.49792, "t": 307.72055, "r": 264.83667, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "Text", "bbox": {"l": 154.629, "t": 318.67953, "r": 170.58919, "b": 327.05417, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "77", "bbox": {"l": 208.44701, "t": 318.67953, "r": 216.78575000000004, "b": 327.05417, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "-", "bbox": {"l": 234.77235, "t": 318.67953, "r": 237.80299000000002, "b": 327.05417, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "84", "bbox": {"l": 256.49792, "t": 318.67953, "r": 264.83667, "b": 327.05417, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "total", "bbox": {"l": 154.629, "t": 329.63855, "r": 171.2796, "b": 338.01318, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "59", "bbox": {"l": 208.44701, "t": 329.63855, "r": 216.78575000000004, "b": 338.01318, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "47", "bbox": {"l": 232.1183, "t": 329.63855, "r": 240.45705, "b": 338.01318, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "78", "bbox": {"l": 256.49792, "t": 329.63855, "r": 264.83667, "b": 338.01318, "coord_origin": "TOPLEFT"}}], "children": [{"id": 25, "label": "text", "bbox": {"l": 217.74099999999999, "t": 175.01855, "r": 256.26065, "b": 183.39319, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "Testing on", "bbox": {"l": 217.74099999999999, "t": 175.01855, "r": 256.26065, "b": 183.39319, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 89.954002, "t": 185.97655999999995, "r": 133.24379, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "Training on", "bbox": {"l": 89.954002, "t": 185.97655999999995, "r": 133.24379, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 154.629, "t": 185.97655999999995, "r": 175.47588, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "labels", "bbox": {"l": 154.629, "t": 185.97655999999995, "r": 175.47588, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 204.69, "t": 185.97655999999995, "r": 220.54260000000002, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "PLN", "bbox": {"l": 204.69, "t": 185.97655999999995, "r": 220.54260000000002, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 230.50427000000002, "t": 185.97655999999995, "r": 242.06197, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "DB", "bbox": {"l": 230.50427000000002, "t": 185.97655999999995, "r": 242.06197, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 252.02364, "t": 185.97655999999995, "r": 269.31085, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "DLN", "bbox": {"l": 252.02364, "t": 185.97655999999995, "r": 269.31085, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 78.530998, "t": 219.25256000000002, "r": 142.56006, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "PubLayNet (PLN)", "bbox": {"l": 78.530998, "t": 219.25256000000002, "r": 142.56006, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 154.629, "t": 197.33452999999997, "r": 177.92371, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "Figure", "bbox": {"l": 154.629, "t": 197.33452999999997, "r": 177.92371, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 208.44701, "t": 197.33452999999997, "r": 216.78575000000004, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "96", "bbox": {"l": 208.44701, "t": 197.33452999999997, "r": 216.78575000000004, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 232.1183, "t": 197.33452999999997, "r": 240.45705, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "43", "bbox": {"l": 232.1183, "t": 197.33452999999997, "r": 240.45705, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 256.49792, "t": 197.33452999999997, "r": 264.83667, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "23", "bbox": {"l": 256.49792, "t": 197.33452999999997, "r": 264.83667, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 154.629, "t": 208.29351999999994, "r": 194.72675, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "Sec-header", "bbox": {"l": 154.629, "t": 208.29351999999994, "r": 194.72675, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 208.44701, "t": 208.29351999999994, "r": 216.78575000000004, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "87", "bbox": {"l": 208.44701, "t": 208.29351999999994, "r": 216.78575000000004, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 234.77235, "t": 208.29351999999994, "r": 237.80299000000002, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "-", "bbox": {"l": 234.77235, "t": 208.29351999999994, "r": 237.80299000000002, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 256.49792, "t": 208.29351999999994, "r": 264.83667, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "32", "bbox": {"l": 256.49792, "t": 208.29351999999994, "r": 264.83667, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 154.629, "t": 219.25256000000002, "r": 174.43578, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "Table", "bbox": {"l": 154.629, "t": 219.25256000000002, "r": 174.43578, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 208.44701, "t": 219.25256000000002, "r": 216.78575000000004, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "95", "bbox": {"l": 208.44701, "t": 219.25256000000002, "r": 216.78575000000004, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 232.1183, "t": 219.25256000000002, "r": 240.45705, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "24", "bbox": {"l": 232.1183, "t": 219.25256000000002, "r": 240.45705, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 256.49792, "t": 219.25256000000002, "r": 264.83667, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "49", "bbox": {"l": 256.49792, "t": 219.25256000000002, "r": 264.83667, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 154.629, "t": 230.21155, "r": 170.58919, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "Text", "bbox": {"l": 154.629, "t": 230.21155, "r": 170.58919, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 208.44701, "t": 230.21155, "r": 216.78575000000004, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "96", "bbox": {"l": 208.44701, "t": 230.21155, "r": 216.78575000000004, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 234.77235, "t": 230.21155, "r": 237.80299000000002, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "-", "bbox": {"l": 234.77235, "t": 230.21155, "r": 237.80299000000002, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 256.49792, "t": 230.21155, "r": 264.83667, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "42", "bbox": {"l": 256.49792, "t": 230.21155, "r": 264.83667, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 154.629, "t": 241.16956000000005, "r": 171.2796, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "total", "bbox": {"l": 154.629, "t": 241.16956000000005, "r": 171.2796, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 208.44701, "t": 241.16956000000005, "r": 216.78575000000004, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "93", "bbox": {"l": 208.44701, "t": 241.16956000000005, "r": 216.78575000000004, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 232.1183, "t": 241.16956000000005, "r": 240.45705, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "34", "bbox": {"l": 232.1183, "t": 241.16956000000005, "r": 240.45705, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 256.49792, "t": 241.16956000000005, "r": 264.83667, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "30", "bbox": {"l": 256.49792, "t": 241.16956000000005, "r": 264.83667, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 78.530998, "t": 263.48650999999995, "r": 131.19963, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "DocBank (DB)", "bbox": {"l": 78.530998, "t": 263.48650999999995, "r": 131.19963, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 154.629, "t": 252.52752999999996, "r": 177.92371, "b": 260.90216, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "Figure", "bbox": {"l": 154.629, "t": 252.52752999999996, "r": 177.92371, "b": 260.90216, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 208.44701, "t": 252.52752999999996, "r": 216.78575000000004, "b": 260.90216, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "77", "bbox": {"l": 208.44701, "t": 252.52752999999996, "r": 216.78575000000004, "b": 260.90216, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 232.1183, "t": 252.52752999999996, "r": 240.45705, "b": 260.90216, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "71", "bbox": {"l": 232.1183, "t": 252.52752999999996, "r": 240.45705, "b": 260.90216, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 256.49792, "t": 252.52752999999996, "r": 264.83667, "b": 260.90216, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "31", "bbox": {"l": 256.49792, "t": 252.52752999999996, "r": 264.83667, "b": 260.90216, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 154.629, "t": 263.48650999999995, "r": 174.43578, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "Table", "bbox": {"l": 154.629, "t": 263.48650999999995, "r": 174.43578, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 208.44701, "t": 263.48650999999995, "r": 216.78575000000004, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "19", "bbox": {"l": 208.44701, "t": 263.48650999999995, "r": 216.78575000000004, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 232.1183, "t": 263.48650999999995, "r": 240.45705, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "65", "bbox": {"l": 232.1183, "t": 263.48650999999995, "r": 240.45705, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 256.49792, "t": 263.48650999999995, "r": 264.83667, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "22", "bbox": {"l": 256.49792, "t": 263.48650999999995, "r": 264.83667, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 154.629, "t": 274.44556, "r": 171.2796, "b": 282.82016, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "total", "bbox": {"l": 154.629, "t": 274.44556, "r": 171.2796, "b": 282.82016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 208.44701, "t": 274.44556, "r": 216.78575000000004, "b": 282.82016, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "48", "bbox": {"l": 208.44701, "t": 274.44556, "r": 216.78575000000004, "b": 282.82016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 232.1183, "t": 274.44556, "r": 240.45705, "b": 282.82016, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "68", "bbox": {"l": 232.1183, "t": 274.44556, "r": 240.45705, "b": 282.82016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 256.49792, "t": 274.44556, "r": 264.83667, "b": 282.82016, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "27", "bbox": {"l": 256.49792, "t": 274.44556, "r": 264.83667, "b": 282.82016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 78.530998, "t": 307.72055, "r": 144.66716, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "DocLayNet (DLN)", "bbox": {"l": 78.530998, "t": 307.72055, "r": 144.66716, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 154.629, "t": 285.80255, "r": 177.92371, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "Figure", "bbox": {"l": 154.629, "t": 285.80255, "r": 177.92371, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 208.44701, "t": 285.80255, "r": 216.78575000000004, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "67", "bbox": {"l": 208.44701, "t": 285.80255, "r": 216.78575000000004, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 232.1183, "t": 285.80255, "r": 240.45705, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "51", "bbox": {"l": 232.1183, "t": 285.80255, "r": 240.45705, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 256.49792, "t": 285.80255, "r": 264.83667, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "72", "bbox": {"l": 256.49792, "t": 285.80255, "r": 264.83667, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 154.629, "t": 296.76154, "r": 194.72675, "b": 305.13617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "Sec-header", "bbox": {"l": 154.629, "t": 296.76154, "r": 194.72675, "b": 305.13617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 208.44701, "t": 296.76154, "r": 216.78575000000004, "b": 305.13617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "53", "bbox": {"l": 208.44701, "t": 296.76154, "r": 216.78575000000004, "b": 305.13617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 234.77235, "t": 296.76154, "r": 237.80299000000002, "b": 305.13617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "-", "bbox": {"l": 234.77235, "t": 296.76154, "r": 237.80299000000002, "b": 305.13617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 256.49792, "t": 296.76154, "r": 264.83667, "b": 305.13617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "68", "bbox": {"l": 256.49792, "t": 296.76154, "r": 264.83667, "b": 305.13617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 154.629, "t": 307.72055, "r": 174.43578, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "Table", "bbox": {"l": 154.629, "t": 307.72055, "r": 174.43578, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 208.44701, "t": 307.72055, "r": 216.78575000000004, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "87", "bbox": {"l": 208.44701, "t": 307.72055, "r": 216.78575000000004, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 232.1183, "t": 307.72055, "r": 240.45705, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "43", "bbox": {"l": 232.1183, "t": 307.72055, "r": 240.45705, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 256.49792, "t": 307.72055, "r": 264.83667, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "82", "bbox": {"l": 256.49792, "t": 307.72055, "r": 264.83667, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 154.629, "t": 318.67953, "r": 170.58919, "b": 327.05417, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "Text", "bbox": {"l": 154.629, "t": 318.67953, "r": 170.58919, "b": 327.05417, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 208.44701, "t": 318.67953, "r": 216.78575000000004, "b": 327.05417, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "77", "bbox": {"l": 208.44701, "t": 318.67953, "r": 216.78575000000004, "b": 327.05417, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 234.77235, "t": 318.67953, "r": 237.80299000000002, "b": 327.05417, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "-", "bbox": {"l": 234.77235, "t": 318.67953, "r": 237.80299000000002, "b": 327.05417, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 256.49792, "t": 318.67953, "r": 264.83667, "b": 327.05417, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "84", "bbox": {"l": 256.49792, "t": 318.67953, "r": 264.83667, "b": 327.05417, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 154.629, "t": 329.63855, "r": 171.2796, "b": 338.01318, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "total", "bbox": {"l": 154.629, "t": 329.63855, "r": 171.2796, "b": 338.01318, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 208.44701, "t": 329.63855, "r": 216.78575000000004, "b": 338.01318, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "59", "bbox": {"l": 208.44701, "t": 329.63855, "r": 216.78575000000004, "b": 338.01318, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 232.1183, "t": 329.63855, "r": 240.45705, "b": 338.01318, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "47", "bbox": {"l": 232.1183, "t": 329.63855, "r": 240.45705, "b": 338.01318, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 256.49792, "t": 329.63855, "r": 264.83667, "b": 338.01318, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "78", "bbox": {"l": 256.49792, "t": 329.63855, "r": 264.83667, "b": 338.01318, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "lcel", "lcel", "nl", "ched", "ched", "ched", "ched", "ched", "nl", "rhed", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl", "rhed", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl", "rhed", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl"], "num_rows": 15, "num_cols": 5, "table_cells": [{"bbox": {"l": 217.74099999999999, "t": 175.01855, "r": 256.26065, "b": 183.39319, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 3, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 5, "text": "Testing on", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 89.954002, "t": 185.97655999999995, "r": 133.24379, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Training on", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 185.97655999999995, "r": 175.47588, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "labels", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 204.69, "t": 185.97655999999995, "r": 220.54260000000002, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "PLN", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 230.50427000000002, "t": 185.97655999999995, "r": 242.06197, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "DB", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 252.02364, "t": 185.97655999999995, "r": 269.31085, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "DLN", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 78.530998, "t": 219.25256000000002, "r": 142.56006, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 5, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PubLayNet (PLN)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 154.629, "t": 197.33452999999997, "r": 177.92371, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Figure", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 197.33452999999997, "r": 216.78575000000004, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 197.33452999999997, "r": 240.45705, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "43", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 197.33452999999997, "r": 264.83667, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "23", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 208.29351999999994, "r": 194.72675, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Sec-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 208.29351999999994, "r": 216.78575000000004, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "87", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 234.77235, "t": 208.29351999999994, "r": 237.80299000000002, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 208.29351999999994, "r": 264.83667, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "32", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 219.25256000000002, "r": 174.43578, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 219.25256000000002, "r": 216.78575000000004, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "95", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 219.25256000000002, "r": 240.45705, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "24", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 219.25256000000002, "r": 264.83667, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "49", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 230.21155, "r": 170.58919, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Text", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 230.21155, "r": 216.78575000000004, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 234.77235, "t": 230.21155, "r": 237.80299000000002, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 230.21155, "r": 264.83667, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "42", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 241.16956000000005, "r": 171.2796, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "total", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 241.16956000000005, "r": 216.78575000000004, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "93", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 241.16956000000005, "r": 240.45705, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "34", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 241.16956000000005, "r": 264.83667, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "30", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 78.530998, "t": 263.48650999999995, "r": 131.19963, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "row_span": 3, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "DocBank (DB)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 154.629, "t": 252.52752999999996, "r": 177.92371, "b": 260.90216, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Figure", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 252.52752999999996, "r": 216.78575000000004, "b": 260.90216, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 252.52752999999996, "r": 240.45705, "b": 260.90216, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "71", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 252.52752999999996, "r": 264.83667, "b": 260.90216, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "31", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 263.48650999999995, "r": 174.43578, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 263.48650999999995, "r": 216.78575000000004, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "19", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 263.48650999999995, "r": 240.45705, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "65", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 263.48650999999995, "r": 264.83667, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "22", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 274.44556, "r": 171.2796, "b": 282.82016, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "total", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 274.44556, "r": 216.78575000000004, "b": 282.82016, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "48", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 274.44556, "r": 240.45705, "b": 282.82016, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 274.44556, "r": 264.83667, "b": 282.82016, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "27", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 78.530998, "t": 307.72055, "r": 144.66716, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "row_span": 5, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 15, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "DocLayNet (DLN)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 154.629, "t": 285.80255, "r": 177.92371, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Figure", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 285.80255, "r": 216.78575000000004, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "67", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 285.80255, "r": 240.45705, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "51", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 285.80255, "r": 264.83667, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 296.76154, "r": 194.72675, "b": 305.13617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Sec-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 296.76154, "r": 216.78575000000004, "b": 305.13617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "53", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 234.77235, "t": 296.76154, "r": 237.80299000000002, "b": 305.13617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 296.76154, "r": 264.83667, "b": 305.13617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 307.72055, "r": 174.43578, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 307.72055, "r": 216.78575000000004, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "87", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 307.72055, "r": 240.45705, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "43", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 307.72055, "r": 264.83667, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 318.67953, "r": 170.58919, "b": 327.05417, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Text", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 318.67953, "r": 216.78575000000004, "b": 327.05417, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 234.77235, "t": 318.67953, "r": 237.80299000000002, "b": 327.05417, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 318.67953, "r": 264.83667, "b": 327.05417, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 329.63855, "r": 171.2796, "b": 338.01318, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 14, "end_row_offset_idx": 15, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "total", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 329.63855, "r": 216.78575000000004, "b": 338.01318, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 14, "end_row_offset_idx": 15, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "59", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 329.63855, "r": 240.45705, "b": 338.01318, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 14, "end_row_offset_idx": 15, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "47", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 329.63855, "r": 264.83667, "b": 338.01318, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 14, "end_row_offset_idx": 15, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "78", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "text", "id": 4, "page_no": 7, "cluster": {"id": 4, "label": "text", "bbox": {"l": 53.79800000000001, "t": 390.92053, "r": 294.04712, "b": 443.14014, "coord_origin": "TOPLEFT"}, "confidence": 0.9839397668838501, "cells": [{"id": 69, "text": "Section-header", "bbox": {"l": 53.79800000000001, "t": 390.96539, "r": 106.2392, "b": 399.30414, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": ",", "bbox": {"l": 106.239, "t": 390.92053, "r": 108.23331, "b": 399.2951699999999, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Table", "bbox": {"l": 110.482, "t": 390.96539, "r": 129.76332, "b": 399.30414, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "and", "bbox": {"l": 132.21899, "t": 390.92053, "r": 145.86186, "b": 399.2951699999999, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "Text", "bbox": {"l": 148.112, "t": 390.96539, "r": 163.14182, "b": 399.30414, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": ". Before training, we either mapped", "bbox": {"l": 163.13901, "t": 390.92053, "r": 294.04709, "b": 399.2951699999999, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "or excluded DocLayNet\u2019s other labels as specified in table 3, and", "bbox": {"l": 53.79800000000001, "t": 401.87954999999994, "r": 294.04712, "b": 410.25418, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "also PubLayNet\u2019s", "bbox": {"l": 53.79800000000001, "t": 412.83853, "r": 117.12856, "b": 421.21317, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "List", "bbox": {"l": 119.362, "t": 412.88339, "r": 132.4342, "b": 421.22214, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "to", "bbox": {"l": 135.177, "t": 412.83853, "r": 142.54416, "b": 421.21317, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "Text", "bbox": {"l": 144.77901, "t": 412.88339, "r": 159.66605, "b": 421.22214, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": ". Note that the different clustering of", "bbox": {"l": 159.66701, "t": 412.83853, "r": 294.04562, "b": 421.21317, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "lists (by list-element vs. whole list objects) naturally decreases the", "bbox": {"l": 53.79800000000001, "t": 423.79755, "r": 294.04614, "b": 432.17217999999997, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "mAP score for", "bbox": {"l": 53.79800000000001, "t": 434.75653, "r": 106.2066, "b": 443.13116, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "Text", "bbox": {"l": 108.448, "t": 434.80139, "r": 123.30533, "b": 443.14014, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": ".", "bbox": {"l": 123.305, "t": 434.75653, "r": 125.27761000000001, "b": 443.13116, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Section-header , Table and Text . Before training, we either mapped or excluded DocLayNet\u2019s other labels as specified in table 3, and also PubLayNet\u2019s List to Text . Note that the different clustering of lists (by list-element vs. whole list objects) naturally decreases the mAP score for Text ."}, {"label": "text", "id": 1, "page_no": 7, "cluster": {"id": 1, "label": "text", "bbox": {"l": 53.466999, "t": 445.71453999999994, "r": 295.55908, "b": 585.59618, "coord_origin": "TOPLEFT"}, "confidence": 0.9868056774139404, "cells": [{"id": 85, "text": "For comparison of DocBank with DocLayNet, we trained only", "bbox": {"l": 63.76100199999999, "t": 445.71453999999994, "r": 294.27582, "b": 454.08917, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "on", "bbox": {"l": 53.79800000000001, "t": 456.67355, "r": 62.989277, "b": 465.04819, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Picture", "bbox": {"l": 64.852997, "t": 456.71841, "r": 88.947144, "b": 465.05716, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "and", "bbox": {"l": 91.019997, "t": 456.67355, "r": 104.24454, "b": 465.04819, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "Table", "bbox": {"l": 106.108, "t": 456.71841, "r": 124.78053, "b": 465.05716, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "clusters of each dataset. We had to exclude", "bbox": {"l": 126.85500000000002, "t": 456.67355, "r": 277.63235, "b": 465.04819, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "Text", "bbox": {"l": 279.49701, "t": 456.71841, "r": 294.0484, "b": 465.05716, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "because successive paragraphs are often grouped together into a", "bbox": {"l": 53.79800000000001, "t": 467.63254, "r": 294.04709, "b": 476.00717, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "single object in DocBank. This paragraph grouping is incompatible", "bbox": {"l": 53.79800000000001, "t": 478.59155, "r": 294.04532, "b": 486.96619, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "with the individual paragraphs of DocLayNet. As can be seen in", "bbox": {"l": 53.466999, "t": 489.55054, "r": 294.04538, "b": 497.92517, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "Table 5, DocLayNet trained models yield better performance com-", "bbox": {"l": 53.528999, "t": 500.50955, "r": 295.55908, "b": 508.88419, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "pared to the previous datasets. It is noteworthy that the models", "bbox": {"l": 53.79800000000001, "t": 511.46854, "r": 294.04712, "b": 519.84317, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "trained on PubLayNet and DocBank perform very well on their", "bbox": {"l": 53.79800000000001, "t": 522.42755, "r": 294.21179, "b": 530.80219, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "own test set, but have a much lower performance on the foreign", "bbox": {"l": 53.79800000000001, "t": 533.38654, "r": 294.04712, "b": 541.76117, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "datasets. While this also applies to DocLayNet, the difference is", "bbox": {"l": 53.79800000000001, "t": 544.34555, "r": 294.04715, "b": 552.72017, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "far less pronounced. Thus we conclude that DocLayNet trained", "bbox": {"l": 53.79800000000001, "t": 555.3045500000001, "r": 294.04712, "b": 563.67917, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "models are overall more robust and will produce better results for", "bbox": {"l": 53.79800000000001, "t": 566.26256, "r": 294.21411, "b": 574.63718, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "challenging, unseen layouts.", "bbox": {"l": 53.79800000000001, "t": 577.22156, "r": 157.52132, "b": 585.59618, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "For comparison of DocBank with DocLayNet, we trained only on Picture and Table clusters of each dataset. We had to exclude Text because successive paragraphs are often grouped together into a single object in DocBank. This paragraph grouping is incompatible with the individual paragraphs of DocLayNet. As can be seen in Table 5, DocLayNet trained models yield better performance compared to the previous datasets. It is noteworthy that the models trained on PubLayNet and DocBank perform very well on their own test set, but have a much lower performance on the foreign datasets. While this also applies to DocLayNet, the difference is far less pronounced. Thus we conclude that DocLayNet trained models are overall more robust and will produce better results for challenging, unseen layouts."}, {"label": "section_header", "id": 8, "page_no": 7, "cluster": {"id": 8, "label": "section_header", "bbox": {"l": 53.79800000000001, "t": 605.06091, "r": 156.00534, "b": 615.37001, "coord_origin": "TOPLEFT"}, "confidence": 0.9574697613716125, "cells": [{"id": 103, "text": "Example Predictions", "bbox": {"l": 53.79800000000001, "t": 605.06091, "r": 156.00534, "b": 615.37001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Example Predictions"}, {"label": "text", "id": 2, "page_no": 7, "cluster": {"id": 2, "label": "text", "bbox": {"l": 53.528999, "t": 620.26355, "r": 295.55844, "b": 705.350174, "coord_origin": "TOPLEFT"}, "confidence": 0.9859885573387146, "cells": [{"id": 104, "text": "To conclude this section, we illustrate the quality of layout predic-", "bbox": {"l": 53.528999, "t": 620.26355, "r": 295.5571, "b": 628.63817, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "tions one can expect from DocLayNet-trained models by providing", "bbox": {"l": 53.79800000000001, "t": 631.22255, "r": 294.04532, "b": 639.59717, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "a selection of examples without any further post-processing ap-", "bbox": {"l": 53.79800000000001, "t": 642.18155, "r": 295.55618, "b": 650.5561700000001, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "plied. Figure 6 shows selected layout predictions on pages from the", "bbox": {"l": 53.79800000000001, "t": 653.14055, "r": 294.04541, "b": 661.51517, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "test-set of DocLayNet. Results look decent in general across docu-", "bbox": {"l": 53.79800000000001, "t": 664.09956, "r": 295.55844, "b": 672.47417, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "ment categories, however one can also observe mistakes such as", "bbox": {"l": 53.79800000000001, "t": 675.05756, "r": 294.04712, "b": 683.43217, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "overlapping clusters of different classes, or entirely missing boxes", "bbox": {"l": 53.79800000000001, "t": 686.01656, "r": 294.04535, "b": 694.391174, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "due to low confidence.", "bbox": {"l": 53.79800000000001, "t": 696.975555, "r": 136.07368, "b": 705.350174, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "To conclude this section, we illustrate the quality of layout predictions one can expect from DocLayNet-trained models by providing a selection of examples without any further post-processing applied. Figure 6 shows selected layout predictions on pages from the test-set of DocLayNet. Results look decent in general across document categories, however one can also observe mistakes such as overlapping clusters of different classes, or entirely missing boxes due to low confidence."}, {"label": "section_header", "id": 13, "page_no": 7, "cluster": {"id": 13, "label": "section_header", "bbox": {"l": 317.95502, "t": 85.85986000000003, "r": 405.72961, "b": 96.16900999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9319982528686523, "cells": [{"id": 112, "text": "6", "bbox": {"l": 317.95502, "t": 85.85986000000003, "r": 323.56229, "b": 96.16900999999996, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "CONCLUSION", "bbox": {"l": 334.47137, "t": 85.85986000000003, "r": 405.72961, "b": 96.16900999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "6 CONCLUSION"}, {"label": "text", "id": 3, "page_no": 7, "cluster": {"id": 3, "label": "text", "bbox": {"l": 317.95499, "t": 101.06151999999997, "r": 559.71375, "b": 186.14917000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9854928851127625, "cells": [{"id": 114, "text": "In this paper, we presented the DocLayNet dataset. It provides the", "bbox": {"l": 317.95499, "t": 101.06151999999997, "r": 558.2038, "b": 109.43615999999997, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "document conversion and layout analysis research community a", "bbox": {"l": 317.95499, "t": 112.02057000000002, "r": 558.2041, "b": 120.39520000000005, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "new and challenging dataset to improve and fine-tune novel ML", "bbox": {"l": 317.95499, "t": 122.97955000000002, "r": 558.43274, "b": 131.35419000000002, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "methods on. In contrast to many other datasets, DocLayNet was", "bbox": {"l": 317.95499, "t": 133.93854, "r": 558.20416, "b": 142.31317, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "created by human annotation in order to obtain reliable layout", "bbox": {"l": 317.95499, "t": 144.89752, "r": 558.20422, "b": 153.27215999999999, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "ground-truth on a wide variety of publication- and typesetting-", "bbox": {"l": 317.95499, "t": 155.85657000000003, "r": 559.71313, "b": 164.23119999999994, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "styles. Including a large proportion of documents outside the scien-", "bbox": {"l": 317.95499, "t": 166.81555000000003, "r": 559.71375, "b": 175.19019000000003, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "tific publishing domain adds significant value in this respect.", "bbox": {"l": 317.95499, "t": 177.77454, "r": 540.04382, "b": 186.14917000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In this paper, we presented the DocLayNet dataset. It provides the document conversion and layout analysis research community a new and challenging dataset to improve and fine-tune novel ML methods on. In contrast to many other datasets, DocLayNet was created by human annotation in order to obtain reliable layout ground-truth on a wide variety of publication- and typesettingstyles. Including a large proportion of documents outside the scientific publishing domain adds significant value in this respect."}, {"label": "text", "id": 6, "page_no": 7, "cluster": {"id": 6, "label": "text", "bbox": {"l": 317.686, "t": 188.73352, "r": 559.71704, "b": 284.77917, "coord_origin": "TOPLEFT"}, "confidence": 0.9800531268119812, "cells": [{"id": 122, "text": "From the dataset, we have derived on the one hand reference", "bbox": {"l": 327.918, "t": 188.73352, "r": 558.19836, "b": 197.10815000000002, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "metrics for human performance on document-layout annotation", "bbox": {"l": 317.95499, "t": 199.69257000000005, "r": 558.20404, "b": 208.06719999999996, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "(through double and triple annotations) and on the other hand eval-", "bbox": {"l": 317.686, "t": 210.65155000000004, "r": 559.71704, "b": 219.02617999999995, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "uated the baseline performance of commonly used object detection", "bbox": {"l": 317.95499, "t": 221.60956, "r": 558.20245, "b": 229.98419, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "methods. We also illustrated the impact of various dataset-related", "bbox": {"l": 317.95499, "t": 232.56853999999998, "r": 558.20502, "b": 240.94317999999998, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "aspects on model performance through data-ablation experiments,", "bbox": {"l": 317.95499, "t": 243.52752999999996, "r": 559.18408, "b": 251.90215999999998, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "both from a size and class-label perspective. Last but not least, we", "bbox": {"l": 317.95499, "t": 254.48650999999995, "r": 558.20227, "b": 262.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "compared the accuracy of models trained on other public datasets", "bbox": {"l": 317.95499, "t": 265.44556, "r": 558.20349, "b": 273.82019, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "and showed that DocLayNet trained models are more robust.", "bbox": {"l": 317.95499, "t": 276.40454, "r": 540.99426, "b": 284.77917, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "From the dataset, we have derived on the one hand reference metrics for human performance on document-layout annotation (through double and triple annotations) and on the other hand evaluated the baseline performance of commonly used object detection methods. We also illustrated the impact of various dataset-related aspects on model performance through data-ablation experiments, both from a size and class-label perspective. Last but not least, we compared the accuracy of models trained on other public datasets and showed that DocLayNet trained models are more robust."}, {"label": "text", "id": 7, "page_no": 7, "cluster": {"id": 7, "label": "text", "bbox": {"l": 317.62299, "t": 287.36353, "r": 558.43469, "b": 317.65616000000006, "coord_origin": "TOPLEFT"}, "confidence": 0.9676100015640259, "cells": [{"id": 131, "text": "To date, there is still a significant gap between human and ML", "bbox": {"l": 327.918, "t": 287.36353, "r": 558.43469, "b": 295.73816, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "accuracy on the layout interpretation task, and we hope that this", "bbox": {"l": 317.95499, "t": 298.32254, "r": 558.20013, "b": 306.69717, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "work will inspire the research community to close that gap.", "bbox": {"l": 317.62299, "t": 309.28152, "r": 535.65015, "b": 317.65616000000006, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "To date, there is still a significant gap between human and ML accuracy on the layout interpretation task, and we hope that this work will inspire the research community to close that gap."}, {"label": "section_header", "id": 11, "page_no": 7, "cluster": {"id": 11, "label": "section_header", "bbox": {"l": 317.95499, "t": 335.09189, "r": 387.3696, "b": 345.40097, "coord_origin": "TOPLEFT"}, "confidence": 0.9378752708435059, "cells": [{"id": 134, "text": "REFERENCES", "bbox": {"l": 317.95499, "t": 335.09189, "r": 387.3696, "b": 345.40097, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "REFERENCES"}, {"label": "list_item", "id": 12, "page_no": 7, "cluster": {"id": 12, "label": "list_item", "bbox": {"l": 321.198, "t": 348.70233, "r": 558.20099, "b": 371.16286999999994, "coord_origin": "TOPLEFT"}, "confidence": 0.9372856616973877, "cells": [{"id": 135, "text": "[1]", "bbox": {"l": 321.198, "t": 348.70233, "r": 329.72415, "b": 355.21588, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "Max G\u00f6bel, Tamir Hassan, Ermelinda Oro, and Giorgio Orsi. Icdar 2013 table", "bbox": {"l": 331.53516, "t": 348.70233, "r": 558.19904, "b": 355.21588, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "competition. In", "bbox": {"l": 333.39099, "t": 356.67236, "r": 379.36414, "b": 363.18591, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "2013 12th International Conference on Document Analysis and", "bbox": {"l": 381.37201, "t": 356.70724, "r": 558.20099, "b": 363.19287, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "Recognition", "bbox": {"l": 333.39099, "t": 364.67724999999996, "r": 365.59601, "b": 371.16286999999994, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": ", pages 1449-1453, 2013.", "bbox": {"l": 365.59601, "t": 364.64236, "r": 434.29489, "b": 371.15591, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[1] Max G\u00f6bel, Tamir Hassan, Ermelinda Oro, and Giorgio Orsi. Icdar 2013 table competition. In 2013 12th International Conference on Document Analysis and Recognition , pages 1449-1453, 2013."}, {"label": "list_item", "id": 9, "page_no": 7, "cluster": {"id": 9, "label": "list_item", "bbox": {"l": 321.198, "t": 372.61237, "r": 559.37982, "b": 403.04287999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9480945467948914, "cells": [{"id": 141, "text": "[2]", "bbox": {"l": 321.198, "t": 372.61237, "r": 329.85956, "b": 379.12592, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "Christian Clausner, Apostolos Antonacopoulos, and Stefan Pletschacher. Ic-", "bbox": {"l": 331.69931, "t": 372.61237, "r": 559.37976, "b": 379.12592, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "dar2017 competition on recognition of documents with complex layouts -", "bbox": {"l": 333.39099, "t": 380.58237, "r": 559.37982, "b": 387.09592, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "rdcl2017. In", "bbox": {"l": 333.39099, "t": 388.55236999999994, "r": 367.4339, "b": 395.06592, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "2017 14th IAPR International Conference on Document Analysis and", "bbox": {"l": 369.17401, "t": 388.58725000000004, "r": 558.20422, "b": 395.07288, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "Recognition (ICDAR)", "bbox": {"l": 333.39099, "t": 396.55725, "r": 390.87601, "b": 403.04287999999997, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": ", volume 01, pages 1404-1410, 2017.", "bbox": {"l": 390.87698, "t": 396.52237, "r": 492.17831, "b": 403.03592, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[2] Christian Clausner, Apostolos Antonacopoulos, and Stefan Pletschacher. Icdar2017 competition on recognition of documents with complex layouts rdcl2017. In 2017 14th IAPR International Conference on Document Analysis and Recognition (ICDAR) , volume 01, pages 1404-1410, 2017."}, {"label": "list_item", "id": 17, "page_no": 7, "cluster": {"id": 17, "label": "list_item", "bbox": {"l": 321.198, "t": 404.49237, "r": 558.20013, "b": 426.94689999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9257517457008362, "cells": [{"id": 148, "text": "[3]", "bbox": {"l": 321.198, "t": 404.49237, "r": 329.53583, "b": 411.00592, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "Herv\u00e9 D\u00e9jean, Jean-Luc Meunier, Liangcai Gao, Yilun Huang, Yu Fang, Florian", "bbox": {"l": 331.30682, "t": 404.49237, "r": 558.19958, "b": 411.00592, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "Kleber, and Eva-Maria Lang. ICDAR 2019 Competition on Table Detection and", "bbox": {"l": 333.39099, "t": 412.46335, "r": 558.20013, "b": 418.9769, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "Recognition (cTDaR), April 2019. http://sac.founderit.com/.", "bbox": {"l": 333.39099, "t": 420.43335, "r": 501.80127, "b": 426.94689999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[3] Herv\u00e9 D\u00e9jean, Jean-Luc Meunier, Liangcai Gao, Yilun Huang, Yu Fang, Florian Kleber, and Eva-Maria Lang. ICDAR 2019 Competition on Table Detection and Recognition (cTDaR), April 2019. http://sac.founderit.com/."}, {"label": "list_item", "id": 16, "page_no": 7, "cluster": {"id": 16, "label": "list_item", "bbox": {"l": 321.198, "t": 428.40335, "r": 559.37872, "b": 458.8269, "coord_origin": "TOPLEFT"}, "confidence": 0.9270979762077332, "cells": [{"id": 152, "text": "[4]", "bbox": {"l": 321.198, "t": 428.40335, "r": 329.91299, "b": 434.9169, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "Antonio Jimeno Yepes, Peter Zhong, and Douglas Burdick. Competition on", "bbox": {"l": 331.7641, "t": 428.40335, "r": 558.19885, "b": 434.9169, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "scientific literature parsing. In", "bbox": {"l": 333.39099, "t": 436.3733500000001, "r": 423.77225, "b": 442.8869, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "Proceedings of the International Conference on", "bbox": {"l": 425.909, "t": 436.40823, "r": 558.20178, "b": 442.89386, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "Document Analysis and Recognition", "bbox": {"l": 333.39099, "t": 444.37823, "r": 429.42697, "b": 450.86386, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": ", ICDAR, pages 605-617. LNCS 12824, Springer-", "bbox": {"l": 429.42400999999995, "t": 444.34335, "r": 559.37872, "b": 450.85689999999994, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "Verlag, sep 2021.", "bbox": {"l": 332.819, "t": 452.31335, "r": 380.01764, "b": 458.8269, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[4] Antonio Jimeno Yepes, Peter Zhong, and Douglas Burdick. Competition on scientific literature parsing. In Proceedings of the International Conference on Document Analysis and Recognition , ICDAR, pages 605-617. LNCS 12824, SpringerVerlag, sep 2021."}, {"label": "list_item", "id": 14, "page_no": 7, "cluster": {"id": 14, "label": "list_item", "bbox": {"l": 321.198, "t": 460.28336, "r": 559.02625, "b": 490.70792, "coord_origin": "TOPLEFT"}, "confidence": 0.9290013313293457, "cells": [{"id": 159, "text": "[5]", "bbox": {"l": 321.198, "t": 460.28336, "r": 329.22977, "b": 466.79691, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "Logan Markewich, Hao Zhang, Yubin Xing, Navid Lambert-Shirzad, Jiang Zhexin,", "bbox": {"l": 330.93576, "t": 460.28336, "r": 558.97156, "b": 466.79691, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "Roy Lee, Zhi Li, and Seok-Bum Ko. Segmentation for document layout analysis:", "bbox": {"l": 333.39099, "t": 468.25336, "r": 559.02625, "b": 474.76691, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "not dead yet.", "bbox": {"l": 333.39099, "t": 476.22437, "r": 368.85431, "b": 482.73792, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "International Journal on Document Analysis and Recognition (IJDAR)", "bbox": {"l": 370.811, "t": 476.25925, "r": 557.46326, "b": 482.74487, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": ",", "bbox": {"l": 557.46503, "t": 476.22437, "r": 558.96857, "b": 482.73792, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "pages 1-11, 01 2022.", "bbox": {"l": 333.39099, "t": 484.19437, "r": 390.82715, "b": 490.70792, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[5] Logan Markewich, Hao Zhang, Yubin Xing, Navid Lambert-Shirzad, Jiang Zhexin, Roy Lee, Zhi Li, and Seok-Bum Ko. Segmentation for document layout analysis: not dead yet. International Journal on Document Analysis and Recognition (IJDAR) , pages 1-11, 01 2022."}, {"label": "list_item", "id": 15, "page_no": 7, "cluster": {"id": 15, "label": "list_item", "bbox": {"l": 321.198, "t": 492.16437, "r": 558.20361, "b": 514.6248800000001, "coord_origin": "TOPLEFT"}, "confidence": 0.927480161190033, "cells": [{"id": 166, "text": "[6]", "bbox": {"l": 321.198, "t": 492.16437, "r": 329.42145, "b": 498.67792, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "Xu Zhong, Jianbin Tang, and Antonio Jimeno-Yepes. Publaynet: Largest dataset", "bbox": {"l": 331.16812, "t": 492.16437, "r": 558.20361, "b": 498.67792, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "ever for document layout analysis. In", "bbox": {"l": 333.39099, "t": 500.13437, "r": 438.6101100000001, "b": 506.64792, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "Proceedings of the International Conference", "bbox": {"l": 440.349, "t": 500.16925, "r": 558.19958, "b": 506.65488, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "on Document Analysis and Recognition", "bbox": {"l": 333.39099, "t": 508.13925, "r": 441.40118, "b": 514.6248800000001, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": ", ICDAR, pages 1015-1022, sep 2019.", "bbox": {"l": 441.4019799999999, "t": 508.10437, "r": 544.78162, "b": 514.61792, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[6] Xu Zhong, Jianbin Tang, and Antonio Jimeno-Yepes. Publaynet: Largest dataset ever for document layout analysis. In Proceedings of the International Conference on Document Analysis and Recognition , ICDAR, pages 1015-1022, sep 2019."}, {"label": "list_item", "id": 10, "page_no": 7, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 321.19797, "t": 516.07437, "r": 558.9715, "b": 554.46889, "coord_origin": "TOPLEFT"}, "confidence": 0.9426896572113037, "cells": [{"id": 172, "text": "[7]", "bbox": {"l": 321.19797, "t": 516.07437, "r": 329.74161, "b": 522.5879199999999, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "Minghao Li, Yiheng Xu, Lei Cui, Shaohan Huang, Furu Wei, Zhoujun Li, and", "bbox": {"l": 331.55634, "t": 516.07437, "r": 558.19897, "b": 522.5879199999999, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "Ming Zhou. Docbank: A benchmark dataset for document layout analysis. In", "bbox": {"l": 333.39099, "t": 524.0443700000001, "r": 558.19891, "b": 530.55792, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "Proceedings of the 28th International Conference on Computational Linguistics", "bbox": {"l": 333.39099, "t": 532.04922, "r": 557.40228, "b": 538.53487, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": ",", "bbox": {"l": 557.40399, "t": 532.01437, "r": 558.96893, "b": 538.5278900000001, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "COLING, pages 949-960. International Committee on Computational Linguistics,", "bbox": {"l": 333.39099, "t": 539.98438, "r": 558.9715, "b": 546.49789, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "dec 2020.", "bbox": {"l": 333.39099, "t": 547.95535, "r": 359.31955, "b": 554.46889, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[7] Minghao Li, Yiheng Xu, Lei Cui, Shaohan Huang, Furu Wei, Zhoujun Li, and Ming Zhou. Docbank: A benchmark dataset for document layout analysis. In Proceedings of the 28th International Conference on Computational Linguistics , COLING, pages 949-960. International Committee on Computational Linguistics, dec 2020."}, {"label": "list_item", "id": 19, "page_no": 7, "cluster": {"id": 19, "label": "list_item", "bbox": {"l": 321.198, "t": 555.92535, "r": 558.90222, "b": 578.38586, "coord_origin": "TOPLEFT"}, "confidence": 0.9139690399169922, "cells": [{"id": 179, "text": "[8]", "bbox": {"l": 321.198, "t": 555.92535, "r": 329.7088, "b": 562.43889, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "Riaz Ahmad, Muhammad Tanvir Afzal, and M. Qadir. Information extraction", "bbox": {"l": 331.51654, "t": 555.92535, "r": 558.19891, "b": 562.43889, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "from pdf sources based on rule-based system using integrated formats. In", "bbox": {"l": 333.39099, "t": 563.89536, "r": 535.54352, "b": 570.40889, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "SemWe-", "bbox": {"l": 536.96399, "t": 563.93024, "r": 558.90222, "b": 570.4158600000001, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "bEval@ESWC", "bbox": {"l": 333.39099, "t": 571.9002399999999, "r": 371.94217, "b": 578.38586, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": ", 2016.", "bbox": {"l": 371.94299, "t": 571.86536, "r": 389.72617, "b": 578.3788900000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[8] Riaz Ahmad, Muhammad Tanvir Afzal, and M. Qadir. Information extraction from pdf sources based on rule-based system using integrated formats. In SemWebEval@ESWC , 2016."}, {"label": "list_item", "id": 21, "page_no": 7, "cluster": {"id": 21, "label": "list_item", "bbox": {"l": 321.198, "t": 579.83536, "r": 559.27448, "b": 610.2589, "coord_origin": "TOPLEFT"}, "confidence": 0.9113105535507202, "cells": [{"id": 185, "text": "[9]", "bbox": {"l": 321.198, "t": 579.83536, "r": 329.45999, "b": 586.34889, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "Ross B. Girshick, Jeff Donahue, Trevor Darrell, and Jitendra Malik. Rich feature", "bbox": {"l": 331.21487, "t": 579.83536, "r": 558.19843, "b": 586.34889, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "hierarchies for accurate object detection and semantic segmentation. In", "bbox": {"l": 333.39099, "t": 587.8053600000001, "r": 543.05487, "b": 594.31889, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": "IEEE", "bbox": {"l": 544.98499, "t": 587.84024, "r": 558.20148, "b": 594.32587, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "Conference on Computer Vision and Pattern Recognition", "bbox": {"l": 333.39099, "t": 595.81024, "r": 491.61166, "b": 602.29587, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": ", CVPR, pages 580-587.", "bbox": {"l": 491.61301, "t": 595.77536, "r": 559.27448, "b": 602.28889, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "IEEE Computer Society, jun 2014.", "bbox": {"l": 333.39099, "t": 603.74536, "r": 428.59726000000006, "b": 610.2589, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[9] Ross B. Girshick, Jeff Donahue, Trevor Darrell, and Jitendra Malik. Rich feature hierarchies for accurate object detection and semantic segmentation. In IEEE Conference on Computer Vision and Pattern Recognition , CVPR, pages 580-587. IEEE Computer Society, jun 2014."}, {"label": "list_item", "id": 22, "page_no": 7, "cluster": {"id": 22, "label": "list_item", "bbox": {"l": 317.95499, "t": 611.71536, "r": 558.20203, "b": 626.20686, "coord_origin": "TOPLEFT"}, "confidence": 0.9028770327568054, "cells": [{"id": 192, "text": "[10]", "bbox": {"l": 317.95499, "t": 611.71536, "r": 329.54767, "b": 618.2289000000001, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "Ross B. Girshick. Fast R-CNN. In", "bbox": {"l": 331.31268, "t": 611.71536, "r": 425.1554, "b": 618.2289000000001, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "2015 IEEE International Conference on Computer", "bbox": {"l": 426.77802, "t": 611.75024, "r": 558.20203, "b": 618.23587, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "Vision", "bbox": {"l": 333.39099, "t": 619.72124, "r": 350.59537, "b": 626.20686, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": ", ICCV, pages 1440-1448. IEEE Computer Society, dec 2015.", "bbox": {"l": 350.59598, "t": 619.68637, "r": 518.58777, "b": 626.19989, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[10] Ross B. Girshick. Fast R-CNN. In 2015 IEEE International Conference on Computer Vision , ICCV, pages 1440-1448. IEEE Computer Society, dec 2015."}, {"label": "list_item", "id": 20, "page_no": 7, "cluster": {"id": 20, "label": "list_item", "bbox": {"l": 317.95499, "t": 627.65637, "r": 558.20142, "b": 650.1168700000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9127691984176636, "cells": [{"id": 197, "text": "[11]", "bbox": {"l": 317.95499, "t": 627.65637, "r": 329.5459, "b": 634.16989, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "Shaoqing Ren, Kaiming He, Ross Girshick, and Jian Sun. Faster r-cnn: Towards", "bbox": {"l": 331.31064, "t": 627.65637, "r": 558.20142, "b": 634.16989, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "real-time object detection with region proposal networks.", "bbox": {"l": 333.39099, "t": 635.62637, "r": 497.50909, "b": 642.13989, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "IEEE Transactions on", "bbox": {"l": 500.01401, "t": 635.66124, "r": 558.19885, "b": 642.14687, "coord_origin": "TOPLEFT"}}, {"id": 201, "text": "Pattern Analysis and Machine Intelligence", "bbox": {"l": 333.39099, "t": 643.6312399999999, "r": 449.38620000000003, "b": 650.1168700000001, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": ", 39(6):1137-1149, 2017.", "bbox": {"l": 449.38699, "t": 643.59637, "r": 515.74268, "b": 650.10989, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[11] Shaoqing Ren, Kaiming He, Ross Girshick, and Jian Sun. Faster r-cnn: Towards real-time object detection with region proposal networks. IEEE Transactions on Pattern Analysis and Machine Intelligence , 39(6):1137-1149, 2017."}, {"label": "list_item", "id": 18, "page_no": 7, "cluster": {"id": 18, "label": "list_item", "bbox": {"l": 317.95499, "t": 651.56638, "r": 559.27808, "b": 674.01989, "coord_origin": "TOPLEFT"}, "confidence": 0.9142462611198425, "cells": [{"id": 203, "text": "[12]", "bbox": {"l": 317.95499, "t": 651.56638, "r": 329.41763, "b": 658.0799, "coord_origin": "TOPLEFT"}}, {"id": 204, "text": "Kaiming He, Georgia Gkioxari, Piotr Doll\u00e1r, and Ross B. Girshick. Mask R-CNN.", "bbox": {"l": 331.16287, "t": 651.56638, "r": 559.27808, "b": 658.0799, "coord_origin": "TOPLEFT"}}, {"id": 205, "text": "In", "bbox": {"l": 333.39099, "t": 659.53638, "r": 339.35904, "b": 666.0499, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": "IEEE International Conference on Computer Vision", "bbox": {"l": 341.56299, "t": 659.57124, "r": 485.8273, "b": 666.05687, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": ", ICCV, pages 2980-2988.", "bbox": {"l": 485.82901, "t": 659.53638, "r": 559.27356, "b": 666.0499, "coord_origin": "TOPLEFT"}}, {"id": 208, "text": "IEEE Computer Society, Oct 2017.", "bbox": {"l": 333.39099, "t": 667.50636, "r": 429.30161000000004, "b": 674.01989, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[12] Kaiming He, Georgia Gkioxari, Piotr Doll\u00e1r, and Ross B. Girshick. Mask R-CNN. In IEEE International Conference on Computer Vision , ICCV, pages 2980-2988. IEEE Computer Society, Oct 2017."}, {"label": "list_item", "id": 23, "page_no": 7, "cluster": {"id": 23, "label": "list_item", "bbox": {"l": 317.95499, "t": 675.47636, "r": 558.97156, "b": 705.900894, "coord_origin": "TOPLEFT"}, "confidence": 0.8895429372787476, "cells": [{"id": 209, "text": "[13]", "bbox": {"l": 317.95499, "t": 675.47636, "r": 330.11407, "b": 681.9898900000001, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": "Glenn Jocher, Alex Stoken, Ayush Chaurasia, Jirka Borovec, NanoCode012,", "bbox": {"l": 331.96533, "t": 675.47636, "r": 558.96716, "b": 681.9898900000001, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "TaoXie, Yonghye Kwon, Kalen Michael, Liu Changyu, Jiacong Fang, Abhiram V,", "bbox": {"l": 333.18201, "t": 683.44637, "r": 558.96661, "b": 689.95989, "coord_origin": "TOPLEFT"}}, {"id": 212, "text": "Laughing, tkianai, yxNONG, Piotr Skalski, Adam Hogan, Jebastin Nadar, imyhxy,", "bbox": {"l": 333.39099, "t": 691.41737, "r": 558.97156, "b": 697.930893, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "Lorenzo Mammana, Alex Wang, Cristi Fati, Diego Montes, Jan Hajek, Laurentiu", "bbox": {"l": 333.39099, "t": 699.387367, "r": 558.20001, "b": 705.900894, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[13] Glenn Jocher, Alex Stoken, Ayush Chaurasia, Jirka Borovec, NanoCode012, TaoXie, Yonghye Kwon, Kalen Michael, Liu Changyu, Jiacong Fang, Abhiram V, Laughing, tkianai, yxNONG, Piotr Skalski, Adam Hogan, Jebastin Nadar, imyhxy, Lorenzo Mammana, Alex Wang, Cristi Fati, Diego Montes, Jan Hajek, Laurentiu"}], "body": [{"label": "text", "id": 5, "page_no": 7, "cluster": {"id": 5, "label": "text", "bbox": {"l": 53.501999, "t": 86.87292000000002, "r": 295.64868, "b": 150.14111000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9824112057685852, "cells": [{"id": 2, "text": "Table 5: Prediction Performance (mAP@0.5-0.95) of a Mask", "bbox": {"l": 53.501999, "t": 86.87292000000002, "r": 294.32153, "b": 95.34618999999998, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "R-CNN R50 network across the PubLayNet, DocBank & Do-", "bbox": {"l": 53.79800000000001, "t": 97.83191, "r": 295.64868, "b": 106.30517999999995, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "cLayNet data-sets. By evaluating on common label classes of", "bbox": {"l": 53.79800000000001, "t": 108.79088999999999, "r": 294.0437, "b": 117.26415999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "each dataset, we observe that the DocLayNet-trained model", "bbox": {"l": 53.79800000000001, "t": 119.74987999999996, "r": 294.04373, "b": 128.22313999999994, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "has much less pronounced variations in performance across", "bbox": {"l": 53.79800000000001, "t": 130.70885999999996, "r": 294.0437, "b": 139.18213000000003, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "all datasets.", "bbox": {"l": 53.79800000000001, "t": 141.66785000000004, "r": 101.15852, "b": 150.14111000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 5: Prediction Performance (mAP@0.5-0.95) of a Mask R-CNN R50 network across the PubLayNet, DocBank & DocLayNet data-sets. By evaluating on common label classes of each dataset, we observe that the DocLayNet-trained model has much less pronounced variations in performance across all datasets."}, {"label": "table", "id": 0, "page_no": 7, "cluster": {"id": 0, "label": "table", "bbox": {"l": 72.6590347290039, "t": 172.48080444335938, "r": 274.83465576171875, "b": 339.8540344238281, "coord_origin": "TOPLEFT"}, "confidence": 0.9892616271972656, "cells": [{"id": 8, "text": "Testing on", "bbox": {"l": 217.74099999999999, "t": 175.01855, "r": 256.26065, "b": 183.39319, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Training on", "bbox": {"l": 89.954002, "t": 185.97655999999995, "r": 133.24379, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "labels", "bbox": {"l": 154.629, "t": 185.97655999999995, "r": 175.47588, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "PLN", "bbox": {"l": 204.69, "t": 185.97655999999995, "r": 220.54260000000002, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "DB", "bbox": {"l": 230.50427000000002, "t": 185.97655999999995, "r": 242.06197, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "DLN", "bbox": {"l": 252.02364, "t": 185.97655999999995, "r": 269.31085, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "PubLayNet (PLN)", "bbox": {"l": 78.530998, "t": 219.25256000000002, "r": 142.56006, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Figure", "bbox": {"l": 154.629, "t": 197.33452999999997, "r": 177.92371, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "96", "bbox": {"l": 208.44701, "t": 197.33452999999997, "r": 216.78575000000004, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "43", "bbox": {"l": 232.1183, "t": 197.33452999999997, "r": 240.45705, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "23", "bbox": {"l": 256.49792, "t": 197.33452999999997, "r": 264.83667, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Sec-header", "bbox": {"l": 154.629, "t": 208.29351999999994, "r": 194.72675, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "87", "bbox": {"l": 208.44701, "t": 208.29351999999994, "r": 216.78575000000004, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "-", "bbox": {"l": 234.77235, "t": 208.29351999999994, "r": 237.80299000000002, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "32", "bbox": {"l": 256.49792, "t": 208.29351999999994, "r": 264.83667, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Table", "bbox": {"l": 154.629, "t": 219.25256000000002, "r": 174.43578, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "95", "bbox": {"l": 208.44701, "t": 219.25256000000002, "r": 216.78575000000004, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "24", "bbox": {"l": 232.1183, "t": 219.25256000000002, "r": 240.45705, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "49", "bbox": {"l": 256.49792, "t": 219.25256000000002, "r": 264.83667, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Text", "bbox": {"l": 154.629, "t": 230.21155, "r": 170.58919, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "96", "bbox": {"l": 208.44701, "t": 230.21155, "r": 216.78575000000004, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "-", "bbox": {"l": 234.77235, "t": 230.21155, "r": 237.80299000000002, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "42", "bbox": {"l": 256.49792, "t": 230.21155, "r": 264.83667, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "total", "bbox": {"l": 154.629, "t": 241.16956000000005, "r": 171.2796, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "93", "bbox": {"l": 208.44701, "t": 241.16956000000005, "r": 216.78575000000004, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "34", "bbox": {"l": 232.1183, "t": 241.16956000000005, "r": 240.45705, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "30", "bbox": {"l": 256.49792, "t": 241.16956000000005, "r": 264.83667, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "DocBank (DB)", "bbox": {"l": 78.530998, "t": 263.48650999999995, "r": 131.19963, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Figure", "bbox": {"l": 154.629, "t": 252.52752999999996, "r": 177.92371, "b": 260.90216, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "77", "bbox": {"l": 208.44701, "t": 252.52752999999996, "r": 216.78575000000004, "b": 260.90216, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "71", "bbox": {"l": 232.1183, "t": 252.52752999999996, "r": 240.45705, "b": 260.90216, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "31", "bbox": {"l": 256.49792, "t": 252.52752999999996, "r": 264.83667, "b": 260.90216, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "Table", "bbox": {"l": 154.629, "t": 263.48650999999995, "r": 174.43578, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "19", "bbox": {"l": 208.44701, "t": 263.48650999999995, "r": 216.78575000000004, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "65", "bbox": {"l": 232.1183, "t": 263.48650999999995, "r": 240.45705, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "22", "bbox": {"l": 256.49792, "t": 263.48650999999995, "r": 264.83667, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "total", "bbox": {"l": 154.629, "t": 274.44556, "r": 171.2796, "b": 282.82016, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "48", "bbox": {"l": 208.44701, "t": 274.44556, "r": 216.78575000000004, "b": 282.82016, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "68", "bbox": {"l": 232.1183, "t": 274.44556, "r": 240.45705, "b": 282.82016, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "27", "bbox": {"l": 256.49792, "t": 274.44556, "r": 264.83667, "b": 282.82016, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "DocLayNet (DLN)", "bbox": {"l": 78.530998, "t": 307.72055, "r": 144.66716, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "Figure", "bbox": {"l": 154.629, "t": 285.80255, "r": 177.92371, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "67", "bbox": {"l": 208.44701, "t": 285.80255, "r": 216.78575000000004, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "51", "bbox": {"l": 232.1183, "t": 285.80255, "r": 240.45705, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "72", "bbox": {"l": 256.49792, "t": 285.80255, "r": 264.83667, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Sec-header", "bbox": {"l": 154.629, "t": 296.76154, "r": 194.72675, "b": 305.13617, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "53", "bbox": {"l": 208.44701, "t": 296.76154, "r": 216.78575000000004, "b": 305.13617, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "-", "bbox": {"l": 234.77235, "t": 296.76154, "r": 237.80299000000002, "b": 305.13617, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "68", "bbox": {"l": 256.49792, "t": 296.76154, "r": 264.83667, "b": 305.13617, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Table", "bbox": {"l": 154.629, "t": 307.72055, "r": 174.43578, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "87", "bbox": {"l": 208.44701, "t": 307.72055, "r": 216.78575000000004, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "43", "bbox": {"l": 232.1183, "t": 307.72055, "r": 240.45705, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "82", "bbox": {"l": 256.49792, "t": 307.72055, "r": 264.83667, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "Text", "bbox": {"l": 154.629, "t": 318.67953, "r": 170.58919, "b": 327.05417, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "77", "bbox": {"l": 208.44701, "t": 318.67953, "r": 216.78575000000004, "b": 327.05417, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "-", "bbox": {"l": 234.77235, "t": 318.67953, "r": 237.80299000000002, "b": 327.05417, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "84", "bbox": {"l": 256.49792, "t": 318.67953, "r": 264.83667, "b": 327.05417, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "total", "bbox": {"l": 154.629, "t": 329.63855, "r": 171.2796, "b": 338.01318, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "59", "bbox": {"l": 208.44701, "t": 329.63855, "r": 216.78575000000004, "b": 338.01318, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "47", "bbox": {"l": 232.1183, "t": 329.63855, "r": 240.45705, "b": 338.01318, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "78", "bbox": {"l": 256.49792, "t": 329.63855, "r": 264.83667, "b": 338.01318, "coord_origin": "TOPLEFT"}}], "children": [{"id": 25, "label": "text", "bbox": {"l": 217.74099999999999, "t": 175.01855, "r": 256.26065, "b": 183.39319, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "Testing on", "bbox": {"l": 217.74099999999999, "t": 175.01855, "r": 256.26065, "b": 183.39319, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 89.954002, "t": 185.97655999999995, "r": 133.24379, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "Training on", "bbox": {"l": 89.954002, "t": 185.97655999999995, "r": 133.24379, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 154.629, "t": 185.97655999999995, "r": 175.47588, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "labels", "bbox": {"l": 154.629, "t": 185.97655999999995, "r": 175.47588, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 204.69, "t": 185.97655999999995, "r": 220.54260000000002, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "PLN", "bbox": {"l": 204.69, "t": 185.97655999999995, "r": 220.54260000000002, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 230.50427000000002, "t": 185.97655999999995, "r": 242.06197, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "DB", "bbox": {"l": 230.50427000000002, "t": 185.97655999999995, "r": 242.06197, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 252.02364, "t": 185.97655999999995, "r": 269.31085, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "DLN", "bbox": {"l": 252.02364, "t": 185.97655999999995, "r": 269.31085, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 78.530998, "t": 219.25256000000002, "r": 142.56006, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "PubLayNet (PLN)", "bbox": {"l": 78.530998, "t": 219.25256000000002, "r": 142.56006, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 154.629, "t": 197.33452999999997, "r": 177.92371, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "Figure", "bbox": {"l": 154.629, "t": 197.33452999999997, "r": 177.92371, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 208.44701, "t": 197.33452999999997, "r": 216.78575000000004, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "96", "bbox": {"l": 208.44701, "t": 197.33452999999997, "r": 216.78575000000004, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 232.1183, "t": 197.33452999999997, "r": 240.45705, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "43", "bbox": {"l": 232.1183, "t": 197.33452999999997, "r": 240.45705, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 256.49792, "t": 197.33452999999997, "r": 264.83667, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "23", "bbox": {"l": 256.49792, "t": 197.33452999999997, "r": 264.83667, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 154.629, "t": 208.29351999999994, "r": 194.72675, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "Sec-header", "bbox": {"l": 154.629, "t": 208.29351999999994, "r": 194.72675, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 208.44701, "t": 208.29351999999994, "r": 216.78575000000004, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "87", "bbox": {"l": 208.44701, "t": 208.29351999999994, "r": 216.78575000000004, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 234.77235, "t": 208.29351999999994, "r": 237.80299000000002, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "-", "bbox": {"l": 234.77235, "t": 208.29351999999994, "r": 237.80299000000002, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 256.49792, "t": 208.29351999999994, "r": 264.83667, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "32", "bbox": {"l": 256.49792, "t": 208.29351999999994, "r": 264.83667, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 154.629, "t": 219.25256000000002, "r": 174.43578, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "Table", "bbox": {"l": 154.629, "t": 219.25256000000002, "r": 174.43578, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 208.44701, "t": 219.25256000000002, "r": 216.78575000000004, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "95", "bbox": {"l": 208.44701, "t": 219.25256000000002, "r": 216.78575000000004, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 232.1183, "t": 219.25256000000002, "r": 240.45705, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "24", "bbox": {"l": 232.1183, "t": 219.25256000000002, "r": 240.45705, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 256.49792, "t": 219.25256000000002, "r": 264.83667, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "49", "bbox": {"l": 256.49792, "t": 219.25256000000002, "r": 264.83667, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 154.629, "t": 230.21155, "r": 170.58919, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "Text", "bbox": {"l": 154.629, "t": 230.21155, "r": 170.58919, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 208.44701, "t": 230.21155, "r": 216.78575000000004, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "96", "bbox": {"l": 208.44701, "t": 230.21155, "r": 216.78575000000004, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 234.77235, "t": 230.21155, "r": 237.80299000000002, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "-", "bbox": {"l": 234.77235, "t": 230.21155, "r": 237.80299000000002, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 256.49792, "t": 230.21155, "r": 264.83667, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "42", "bbox": {"l": 256.49792, "t": 230.21155, "r": 264.83667, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 154.629, "t": 241.16956000000005, "r": 171.2796, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "total", "bbox": {"l": 154.629, "t": 241.16956000000005, "r": 171.2796, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 208.44701, "t": 241.16956000000005, "r": 216.78575000000004, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "93", "bbox": {"l": 208.44701, "t": 241.16956000000005, "r": 216.78575000000004, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 232.1183, "t": 241.16956000000005, "r": 240.45705, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "34", "bbox": {"l": 232.1183, "t": 241.16956000000005, "r": 240.45705, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 256.49792, "t": 241.16956000000005, "r": 264.83667, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "30", "bbox": {"l": 256.49792, "t": 241.16956000000005, "r": 264.83667, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 78.530998, "t": 263.48650999999995, "r": 131.19963, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "DocBank (DB)", "bbox": {"l": 78.530998, "t": 263.48650999999995, "r": 131.19963, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 154.629, "t": 252.52752999999996, "r": 177.92371, "b": 260.90216, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "Figure", "bbox": {"l": 154.629, "t": 252.52752999999996, "r": 177.92371, "b": 260.90216, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 208.44701, "t": 252.52752999999996, "r": 216.78575000000004, "b": 260.90216, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "77", "bbox": {"l": 208.44701, "t": 252.52752999999996, "r": 216.78575000000004, "b": 260.90216, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 232.1183, "t": 252.52752999999996, "r": 240.45705, "b": 260.90216, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "71", "bbox": {"l": 232.1183, "t": 252.52752999999996, "r": 240.45705, "b": 260.90216, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 256.49792, "t": 252.52752999999996, "r": 264.83667, "b": 260.90216, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "31", "bbox": {"l": 256.49792, "t": 252.52752999999996, "r": 264.83667, "b": 260.90216, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 154.629, "t": 263.48650999999995, "r": 174.43578, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "Table", "bbox": {"l": 154.629, "t": 263.48650999999995, "r": 174.43578, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 208.44701, "t": 263.48650999999995, "r": 216.78575000000004, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "19", "bbox": {"l": 208.44701, "t": 263.48650999999995, "r": 216.78575000000004, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 232.1183, "t": 263.48650999999995, "r": 240.45705, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "65", "bbox": {"l": 232.1183, "t": 263.48650999999995, "r": 240.45705, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 256.49792, "t": 263.48650999999995, "r": 264.83667, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "22", "bbox": {"l": 256.49792, "t": 263.48650999999995, "r": 264.83667, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 154.629, "t": 274.44556, "r": 171.2796, "b": 282.82016, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "total", "bbox": {"l": 154.629, "t": 274.44556, "r": 171.2796, "b": 282.82016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 208.44701, "t": 274.44556, "r": 216.78575000000004, "b": 282.82016, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "48", "bbox": {"l": 208.44701, "t": 274.44556, "r": 216.78575000000004, "b": 282.82016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 232.1183, "t": 274.44556, "r": 240.45705, "b": 282.82016, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "68", "bbox": {"l": 232.1183, "t": 274.44556, "r": 240.45705, "b": 282.82016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 256.49792, "t": 274.44556, "r": 264.83667, "b": 282.82016, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "27", "bbox": {"l": 256.49792, "t": 274.44556, "r": 264.83667, "b": 282.82016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 78.530998, "t": 307.72055, "r": 144.66716, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "DocLayNet (DLN)", "bbox": {"l": 78.530998, "t": 307.72055, "r": 144.66716, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 154.629, "t": 285.80255, "r": 177.92371, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "Figure", "bbox": {"l": 154.629, "t": 285.80255, "r": 177.92371, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 208.44701, "t": 285.80255, "r": 216.78575000000004, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "67", "bbox": {"l": 208.44701, "t": 285.80255, "r": 216.78575000000004, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 232.1183, "t": 285.80255, "r": 240.45705, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "51", "bbox": {"l": 232.1183, "t": 285.80255, "r": 240.45705, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 256.49792, "t": 285.80255, "r": 264.83667, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "72", "bbox": {"l": 256.49792, "t": 285.80255, "r": 264.83667, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 154.629, "t": 296.76154, "r": 194.72675, "b": 305.13617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "Sec-header", "bbox": {"l": 154.629, "t": 296.76154, "r": 194.72675, "b": 305.13617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 208.44701, "t": 296.76154, "r": 216.78575000000004, "b": 305.13617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "53", "bbox": {"l": 208.44701, "t": 296.76154, "r": 216.78575000000004, "b": 305.13617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 234.77235, "t": 296.76154, "r": 237.80299000000002, "b": 305.13617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "-", "bbox": {"l": 234.77235, "t": 296.76154, "r": 237.80299000000002, "b": 305.13617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 256.49792, "t": 296.76154, "r": 264.83667, "b": 305.13617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "68", "bbox": {"l": 256.49792, "t": 296.76154, "r": 264.83667, "b": 305.13617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 154.629, "t": 307.72055, "r": 174.43578, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "Table", "bbox": {"l": 154.629, "t": 307.72055, "r": 174.43578, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 208.44701, "t": 307.72055, "r": 216.78575000000004, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "87", "bbox": {"l": 208.44701, "t": 307.72055, "r": 216.78575000000004, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 232.1183, "t": 307.72055, "r": 240.45705, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "43", "bbox": {"l": 232.1183, "t": 307.72055, "r": 240.45705, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 256.49792, "t": 307.72055, "r": 264.83667, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "82", "bbox": {"l": 256.49792, "t": 307.72055, "r": 264.83667, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 154.629, "t": 318.67953, "r": 170.58919, "b": 327.05417, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "Text", "bbox": {"l": 154.629, "t": 318.67953, "r": 170.58919, "b": 327.05417, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 208.44701, "t": 318.67953, "r": 216.78575000000004, "b": 327.05417, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "77", "bbox": {"l": 208.44701, "t": 318.67953, "r": 216.78575000000004, "b": 327.05417, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 234.77235, "t": 318.67953, "r": 237.80299000000002, "b": 327.05417, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "-", "bbox": {"l": 234.77235, "t": 318.67953, "r": 237.80299000000002, "b": 327.05417, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 256.49792, "t": 318.67953, "r": 264.83667, "b": 327.05417, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "84", "bbox": {"l": 256.49792, "t": 318.67953, "r": 264.83667, "b": 327.05417, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 154.629, "t": 329.63855, "r": 171.2796, "b": 338.01318, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "total", "bbox": {"l": 154.629, "t": 329.63855, "r": 171.2796, "b": 338.01318, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 208.44701, "t": 329.63855, "r": 216.78575000000004, "b": 338.01318, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "59", "bbox": {"l": 208.44701, "t": 329.63855, "r": 216.78575000000004, "b": 338.01318, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 232.1183, "t": 329.63855, "r": 240.45705, "b": 338.01318, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "47", "bbox": {"l": 232.1183, "t": 329.63855, "r": 240.45705, "b": 338.01318, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 256.49792, "t": 329.63855, "r": 264.83667, "b": 338.01318, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "78", "bbox": {"l": 256.49792, "t": 329.63855, "r": 264.83667, "b": 338.01318, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "lcel", "lcel", "nl", "ched", "ched", "ched", "ched", "ched", "nl", "rhed", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl", "rhed", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl", "rhed", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl"], "num_rows": 15, "num_cols": 5, "table_cells": [{"bbox": {"l": 217.74099999999999, "t": 175.01855, "r": 256.26065, "b": 183.39319, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 3, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 5, "text": "Testing on", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 89.954002, "t": 185.97655999999995, "r": 133.24379, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Training on", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 185.97655999999995, "r": 175.47588, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "labels", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 204.69, "t": 185.97655999999995, "r": 220.54260000000002, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "PLN", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 230.50427000000002, "t": 185.97655999999995, "r": 242.06197, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "DB", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 252.02364, "t": 185.97655999999995, "r": 269.31085, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "DLN", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 78.530998, "t": 219.25256000000002, "r": 142.56006, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 5, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PubLayNet (PLN)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 154.629, "t": 197.33452999999997, "r": 177.92371, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Figure", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 197.33452999999997, "r": 216.78575000000004, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 197.33452999999997, "r": 240.45705, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "43", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 197.33452999999997, "r": 264.83667, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "23", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 208.29351999999994, "r": 194.72675, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Sec-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 208.29351999999994, "r": 216.78575000000004, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "87", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 234.77235, "t": 208.29351999999994, "r": 237.80299000000002, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 208.29351999999994, "r": 264.83667, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "32", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 219.25256000000002, "r": 174.43578, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 219.25256000000002, "r": 216.78575000000004, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "95", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 219.25256000000002, "r": 240.45705, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "24", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 219.25256000000002, "r": 264.83667, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "49", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 230.21155, "r": 170.58919, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Text", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 230.21155, "r": 216.78575000000004, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 234.77235, "t": 230.21155, "r": 237.80299000000002, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 230.21155, "r": 264.83667, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "42", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 241.16956000000005, "r": 171.2796, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "total", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 241.16956000000005, "r": 216.78575000000004, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "93", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 241.16956000000005, "r": 240.45705, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "34", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 241.16956000000005, "r": 264.83667, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "30", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 78.530998, "t": 263.48650999999995, "r": 131.19963, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "row_span": 3, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "DocBank (DB)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 154.629, "t": 252.52752999999996, "r": 177.92371, "b": 260.90216, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Figure", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 252.52752999999996, "r": 216.78575000000004, "b": 260.90216, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 252.52752999999996, "r": 240.45705, "b": 260.90216, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "71", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 252.52752999999996, "r": 264.83667, "b": 260.90216, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "31", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 263.48650999999995, "r": 174.43578, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 263.48650999999995, "r": 216.78575000000004, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "19", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 263.48650999999995, "r": 240.45705, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "65", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 263.48650999999995, "r": 264.83667, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "22", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 274.44556, "r": 171.2796, "b": 282.82016, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "total", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 274.44556, "r": 216.78575000000004, "b": 282.82016, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "48", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 274.44556, "r": 240.45705, "b": 282.82016, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 274.44556, "r": 264.83667, "b": 282.82016, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "27", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 78.530998, "t": 307.72055, "r": 144.66716, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "row_span": 5, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 15, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "DocLayNet (DLN)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 154.629, "t": 285.80255, "r": 177.92371, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Figure", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 285.80255, "r": 216.78575000000004, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "67", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 285.80255, "r": 240.45705, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "51", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 285.80255, "r": 264.83667, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 296.76154, "r": 194.72675, "b": 305.13617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Sec-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 296.76154, "r": 216.78575000000004, "b": 305.13617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "53", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 234.77235, "t": 296.76154, "r": 237.80299000000002, "b": 305.13617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 296.76154, "r": 264.83667, "b": 305.13617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 307.72055, "r": 174.43578, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 307.72055, "r": 216.78575000000004, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "87", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 307.72055, "r": 240.45705, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "43", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 307.72055, "r": 264.83667, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 318.67953, "r": 170.58919, "b": 327.05417, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Text", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 318.67953, "r": 216.78575000000004, "b": 327.05417, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 234.77235, "t": 318.67953, "r": 237.80299000000002, "b": 327.05417, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 318.67953, "r": 264.83667, "b": 327.05417, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 329.63855, "r": 171.2796, "b": 338.01318, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 14, "end_row_offset_idx": 15, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "total", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 329.63855, "r": 216.78575000000004, "b": 338.01318, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 14, "end_row_offset_idx": 15, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "59", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 329.63855, "r": 240.45705, "b": 338.01318, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 14, "end_row_offset_idx": 15, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "47", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 329.63855, "r": 264.83667, "b": 338.01318, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 14, "end_row_offset_idx": 15, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "78", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "text", "id": 4, "page_no": 7, "cluster": {"id": 4, "label": "text", "bbox": {"l": 53.79800000000001, "t": 390.92053, "r": 294.04712, "b": 443.14014, "coord_origin": "TOPLEFT"}, "confidence": 0.9839397668838501, "cells": [{"id": 69, "text": "Section-header", "bbox": {"l": 53.79800000000001, "t": 390.96539, "r": 106.2392, "b": 399.30414, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": ",", "bbox": {"l": 106.239, "t": 390.92053, "r": 108.23331, "b": 399.2951699999999, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Table", "bbox": {"l": 110.482, "t": 390.96539, "r": 129.76332, "b": 399.30414, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "and", "bbox": {"l": 132.21899, "t": 390.92053, "r": 145.86186, "b": 399.2951699999999, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "Text", "bbox": {"l": 148.112, "t": 390.96539, "r": 163.14182, "b": 399.30414, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": ". Before training, we either mapped", "bbox": {"l": 163.13901, "t": 390.92053, "r": 294.04709, "b": 399.2951699999999, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "or excluded DocLayNet\u2019s other labels as specified in table 3, and", "bbox": {"l": 53.79800000000001, "t": 401.87954999999994, "r": 294.04712, "b": 410.25418, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "also PubLayNet\u2019s", "bbox": {"l": 53.79800000000001, "t": 412.83853, "r": 117.12856, "b": 421.21317, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "List", "bbox": {"l": 119.362, "t": 412.88339, "r": 132.4342, "b": 421.22214, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "to", "bbox": {"l": 135.177, "t": 412.83853, "r": 142.54416, "b": 421.21317, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "Text", "bbox": {"l": 144.77901, "t": 412.88339, "r": 159.66605, "b": 421.22214, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": ". Note that the different clustering of", "bbox": {"l": 159.66701, "t": 412.83853, "r": 294.04562, "b": 421.21317, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "lists (by list-element vs. whole list objects) naturally decreases the", "bbox": {"l": 53.79800000000001, "t": 423.79755, "r": 294.04614, "b": 432.17217999999997, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "mAP score for", "bbox": {"l": 53.79800000000001, "t": 434.75653, "r": 106.2066, "b": 443.13116, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "Text", "bbox": {"l": 108.448, "t": 434.80139, "r": 123.30533, "b": 443.14014, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": ".", "bbox": {"l": 123.305, "t": 434.75653, "r": 125.27761000000001, "b": 443.13116, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Section-header , Table and Text . Before training, we either mapped or excluded DocLayNet\u2019s other labels as specified in table 3, and also PubLayNet\u2019s List to Text . Note that the different clustering of lists (by list-element vs. whole list objects) naturally decreases the mAP score for Text ."}, {"label": "text", "id": 1, "page_no": 7, "cluster": {"id": 1, "label": "text", "bbox": {"l": 53.466999, "t": 445.71453999999994, "r": 295.55908, "b": 585.59618, "coord_origin": "TOPLEFT"}, "confidence": 0.9868056774139404, "cells": [{"id": 85, "text": "For comparison of DocBank with DocLayNet, we trained only", "bbox": {"l": 63.76100199999999, "t": 445.71453999999994, "r": 294.27582, "b": 454.08917, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "on", "bbox": {"l": 53.79800000000001, "t": 456.67355, "r": 62.989277, "b": 465.04819, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Picture", "bbox": {"l": 64.852997, "t": 456.71841, "r": 88.947144, "b": 465.05716, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "and", "bbox": {"l": 91.019997, "t": 456.67355, "r": 104.24454, "b": 465.04819, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "Table", "bbox": {"l": 106.108, "t": 456.71841, "r": 124.78053, "b": 465.05716, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "clusters of each dataset. We had to exclude", "bbox": {"l": 126.85500000000002, "t": 456.67355, "r": 277.63235, "b": 465.04819, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "Text", "bbox": {"l": 279.49701, "t": 456.71841, "r": 294.0484, "b": 465.05716, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "because successive paragraphs are often grouped together into a", "bbox": {"l": 53.79800000000001, "t": 467.63254, "r": 294.04709, "b": 476.00717, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "single object in DocBank. This paragraph grouping is incompatible", "bbox": {"l": 53.79800000000001, "t": 478.59155, "r": 294.04532, "b": 486.96619, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "with the individual paragraphs of DocLayNet. As can be seen in", "bbox": {"l": 53.466999, "t": 489.55054, "r": 294.04538, "b": 497.92517, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "Table 5, DocLayNet trained models yield better performance com-", "bbox": {"l": 53.528999, "t": 500.50955, "r": 295.55908, "b": 508.88419, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "pared to the previous datasets. It is noteworthy that the models", "bbox": {"l": 53.79800000000001, "t": 511.46854, "r": 294.04712, "b": 519.84317, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "trained on PubLayNet and DocBank perform very well on their", "bbox": {"l": 53.79800000000001, "t": 522.42755, "r": 294.21179, "b": 530.80219, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "own test set, but have a much lower performance on the foreign", "bbox": {"l": 53.79800000000001, "t": 533.38654, "r": 294.04712, "b": 541.76117, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "datasets. While this also applies to DocLayNet, the difference is", "bbox": {"l": 53.79800000000001, "t": 544.34555, "r": 294.04715, "b": 552.72017, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "far less pronounced. Thus we conclude that DocLayNet trained", "bbox": {"l": 53.79800000000001, "t": 555.3045500000001, "r": 294.04712, "b": 563.67917, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "models are overall more robust and will produce better results for", "bbox": {"l": 53.79800000000001, "t": 566.26256, "r": 294.21411, "b": 574.63718, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "challenging, unseen layouts.", "bbox": {"l": 53.79800000000001, "t": 577.22156, "r": 157.52132, "b": 585.59618, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "For comparison of DocBank with DocLayNet, we trained only on Picture and Table clusters of each dataset. We had to exclude Text because successive paragraphs are often grouped together into a single object in DocBank. This paragraph grouping is incompatible with the individual paragraphs of DocLayNet. As can be seen in Table 5, DocLayNet trained models yield better performance compared to the previous datasets. It is noteworthy that the models trained on PubLayNet and DocBank perform very well on their own test set, but have a much lower performance on the foreign datasets. While this also applies to DocLayNet, the difference is far less pronounced. Thus we conclude that DocLayNet trained models are overall more robust and will produce better results for challenging, unseen layouts."}, {"label": "section_header", "id": 8, "page_no": 7, "cluster": {"id": 8, "label": "section_header", "bbox": {"l": 53.79800000000001, "t": 605.06091, "r": 156.00534, "b": 615.37001, "coord_origin": "TOPLEFT"}, "confidence": 0.9574697613716125, "cells": [{"id": 103, "text": "Example Predictions", "bbox": {"l": 53.79800000000001, "t": 605.06091, "r": 156.00534, "b": 615.37001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Example Predictions"}, {"label": "text", "id": 2, "page_no": 7, "cluster": {"id": 2, "label": "text", "bbox": {"l": 53.528999, "t": 620.26355, "r": 295.55844, "b": 705.350174, "coord_origin": "TOPLEFT"}, "confidence": 0.9859885573387146, "cells": [{"id": 104, "text": "To conclude this section, we illustrate the quality of layout predic-", "bbox": {"l": 53.528999, "t": 620.26355, "r": 295.5571, "b": 628.63817, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "tions one can expect from DocLayNet-trained models by providing", "bbox": {"l": 53.79800000000001, "t": 631.22255, "r": 294.04532, "b": 639.59717, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "a selection of examples without any further post-processing ap-", "bbox": {"l": 53.79800000000001, "t": 642.18155, "r": 295.55618, "b": 650.5561700000001, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "plied. Figure 6 shows selected layout predictions on pages from the", "bbox": {"l": 53.79800000000001, "t": 653.14055, "r": 294.04541, "b": 661.51517, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "test-set of DocLayNet. Results look decent in general across docu-", "bbox": {"l": 53.79800000000001, "t": 664.09956, "r": 295.55844, "b": 672.47417, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "ment categories, however one can also observe mistakes such as", "bbox": {"l": 53.79800000000001, "t": 675.05756, "r": 294.04712, "b": 683.43217, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "overlapping clusters of different classes, or entirely missing boxes", "bbox": {"l": 53.79800000000001, "t": 686.01656, "r": 294.04535, "b": 694.391174, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "due to low confidence.", "bbox": {"l": 53.79800000000001, "t": 696.975555, "r": 136.07368, "b": 705.350174, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "To conclude this section, we illustrate the quality of layout predictions one can expect from DocLayNet-trained models by providing a selection of examples without any further post-processing applied. Figure 6 shows selected layout predictions on pages from the test-set of DocLayNet. Results look decent in general across document categories, however one can also observe mistakes such as overlapping clusters of different classes, or entirely missing boxes due to low confidence."}, {"label": "section_header", "id": 13, "page_no": 7, "cluster": {"id": 13, "label": "section_header", "bbox": {"l": 317.95502, "t": 85.85986000000003, "r": 405.72961, "b": 96.16900999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9319982528686523, "cells": [{"id": 112, "text": "6", "bbox": {"l": 317.95502, "t": 85.85986000000003, "r": 323.56229, "b": 96.16900999999996, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "CONCLUSION", "bbox": {"l": 334.47137, "t": 85.85986000000003, "r": 405.72961, "b": 96.16900999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "6 CONCLUSION"}, {"label": "text", "id": 3, "page_no": 7, "cluster": {"id": 3, "label": "text", "bbox": {"l": 317.95499, "t": 101.06151999999997, "r": 559.71375, "b": 186.14917000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9854928851127625, "cells": [{"id": 114, "text": "In this paper, we presented the DocLayNet dataset. It provides the", "bbox": {"l": 317.95499, "t": 101.06151999999997, "r": 558.2038, "b": 109.43615999999997, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "document conversion and layout analysis research community a", "bbox": {"l": 317.95499, "t": 112.02057000000002, "r": 558.2041, "b": 120.39520000000005, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "new and challenging dataset to improve and fine-tune novel ML", "bbox": {"l": 317.95499, "t": 122.97955000000002, "r": 558.43274, "b": 131.35419000000002, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "methods on. In contrast to many other datasets, DocLayNet was", "bbox": {"l": 317.95499, "t": 133.93854, "r": 558.20416, "b": 142.31317, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "created by human annotation in order to obtain reliable layout", "bbox": {"l": 317.95499, "t": 144.89752, "r": 558.20422, "b": 153.27215999999999, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "ground-truth on a wide variety of publication- and typesetting-", "bbox": {"l": 317.95499, "t": 155.85657000000003, "r": 559.71313, "b": 164.23119999999994, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "styles. Including a large proportion of documents outside the scien-", "bbox": {"l": 317.95499, "t": 166.81555000000003, "r": 559.71375, "b": 175.19019000000003, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "tific publishing domain adds significant value in this respect.", "bbox": {"l": 317.95499, "t": 177.77454, "r": 540.04382, "b": 186.14917000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In this paper, we presented the DocLayNet dataset. It provides the document conversion and layout analysis research community a new and challenging dataset to improve and fine-tune novel ML methods on. In contrast to many other datasets, DocLayNet was created by human annotation in order to obtain reliable layout ground-truth on a wide variety of publication- and typesettingstyles. Including a large proportion of documents outside the scientific publishing domain adds significant value in this respect."}, {"label": "text", "id": 6, "page_no": 7, "cluster": {"id": 6, "label": "text", "bbox": {"l": 317.686, "t": 188.73352, "r": 559.71704, "b": 284.77917, "coord_origin": "TOPLEFT"}, "confidence": 0.9800531268119812, "cells": [{"id": 122, "text": "From the dataset, we have derived on the one hand reference", "bbox": {"l": 327.918, "t": 188.73352, "r": 558.19836, "b": 197.10815000000002, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "metrics for human performance on document-layout annotation", "bbox": {"l": 317.95499, "t": 199.69257000000005, "r": 558.20404, "b": 208.06719999999996, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "(through double and triple annotations) and on the other hand eval-", "bbox": {"l": 317.686, "t": 210.65155000000004, "r": 559.71704, "b": 219.02617999999995, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "uated the baseline performance of commonly used object detection", "bbox": {"l": 317.95499, "t": 221.60956, "r": 558.20245, "b": 229.98419, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "methods. We also illustrated the impact of various dataset-related", "bbox": {"l": 317.95499, "t": 232.56853999999998, "r": 558.20502, "b": 240.94317999999998, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "aspects on model performance through data-ablation experiments,", "bbox": {"l": 317.95499, "t": 243.52752999999996, "r": 559.18408, "b": 251.90215999999998, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "both from a size and class-label perspective. Last but not least, we", "bbox": {"l": 317.95499, "t": 254.48650999999995, "r": 558.20227, "b": 262.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "compared the accuracy of models trained on other public datasets", "bbox": {"l": 317.95499, "t": 265.44556, "r": 558.20349, "b": 273.82019, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "and showed that DocLayNet trained models are more robust.", "bbox": {"l": 317.95499, "t": 276.40454, "r": 540.99426, "b": 284.77917, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "From the dataset, we have derived on the one hand reference metrics for human performance on document-layout annotation (through double and triple annotations) and on the other hand evaluated the baseline performance of commonly used object detection methods. We also illustrated the impact of various dataset-related aspects on model performance through data-ablation experiments, both from a size and class-label perspective. Last but not least, we compared the accuracy of models trained on other public datasets and showed that DocLayNet trained models are more robust."}, {"label": "text", "id": 7, "page_no": 7, "cluster": {"id": 7, "label": "text", "bbox": {"l": 317.62299, "t": 287.36353, "r": 558.43469, "b": 317.65616000000006, "coord_origin": "TOPLEFT"}, "confidence": 0.9676100015640259, "cells": [{"id": 131, "text": "To date, there is still a significant gap between human and ML", "bbox": {"l": 327.918, "t": 287.36353, "r": 558.43469, "b": 295.73816, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "accuracy on the layout interpretation task, and we hope that this", "bbox": {"l": 317.95499, "t": 298.32254, "r": 558.20013, "b": 306.69717, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "work will inspire the research community to close that gap.", "bbox": {"l": 317.62299, "t": 309.28152, "r": 535.65015, "b": 317.65616000000006, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "To date, there is still a significant gap between human and ML accuracy on the layout interpretation task, and we hope that this work will inspire the research community to close that gap."}, {"label": "section_header", "id": 11, "page_no": 7, "cluster": {"id": 11, "label": "section_header", "bbox": {"l": 317.95499, "t": 335.09189, "r": 387.3696, "b": 345.40097, "coord_origin": "TOPLEFT"}, "confidence": 0.9378752708435059, "cells": [{"id": 134, "text": "REFERENCES", "bbox": {"l": 317.95499, "t": 335.09189, "r": 387.3696, "b": 345.40097, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "REFERENCES"}, {"label": "list_item", "id": 12, "page_no": 7, "cluster": {"id": 12, "label": "list_item", "bbox": {"l": 321.198, "t": 348.70233, "r": 558.20099, "b": 371.16286999999994, "coord_origin": "TOPLEFT"}, "confidence": 0.9372856616973877, "cells": [{"id": 135, "text": "[1]", "bbox": {"l": 321.198, "t": 348.70233, "r": 329.72415, "b": 355.21588, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "Max G\u00f6bel, Tamir Hassan, Ermelinda Oro, and Giorgio Orsi. Icdar 2013 table", "bbox": {"l": 331.53516, "t": 348.70233, "r": 558.19904, "b": 355.21588, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "competition. In", "bbox": {"l": 333.39099, "t": 356.67236, "r": 379.36414, "b": 363.18591, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "2013 12th International Conference on Document Analysis and", "bbox": {"l": 381.37201, "t": 356.70724, "r": 558.20099, "b": 363.19287, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "Recognition", "bbox": {"l": 333.39099, "t": 364.67724999999996, "r": 365.59601, "b": 371.16286999999994, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": ", pages 1449-1453, 2013.", "bbox": {"l": 365.59601, "t": 364.64236, "r": 434.29489, "b": 371.15591, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[1] Max G\u00f6bel, Tamir Hassan, Ermelinda Oro, and Giorgio Orsi. Icdar 2013 table competition. In 2013 12th International Conference on Document Analysis and Recognition , pages 1449-1453, 2013."}, {"label": "list_item", "id": 9, "page_no": 7, "cluster": {"id": 9, "label": "list_item", "bbox": {"l": 321.198, "t": 372.61237, "r": 559.37982, "b": 403.04287999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9480945467948914, "cells": [{"id": 141, "text": "[2]", "bbox": {"l": 321.198, "t": 372.61237, "r": 329.85956, "b": 379.12592, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "Christian Clausner, Apostolos Antonacopoulos, and Stefan Pletschacher. Ic-", "bbox": {"l": 331.69931, "t": 372.61237, "r": 559.37976, "b": 379.12592, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "dar2017 competition on recognition of documents with complex layouts -", "bbox": {"l": 333.39099, "t": 380.58237, "r": 559.37982, "b": 387.09592, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "rdcl2017. In", "bbox": {"l": 333.39099, "t": 388.55236999999994, "r": 367.4339, "b": 395.06592, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "2017 14th IAPR International Conference on Document Analysis and", "bbox": {"l": 369.17401, "t": 388.58725000000004, "r": 558.20422, "b": 395.07288, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "Recognition (ICDAR)", "bbox": {"l": 333.39099, "t": 396.55725, "r": 390.87601, "b": 403.04287999999997, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": ", volume 01, pages 1404-1410, 2017.", "bbox": {"l": 390.87698, "t": 396.52237, "r": 492.17831, "b": 403.03592, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[2] Christian Clausner, Apostolos Antonacopoulos, and Stefan Pletschacher. Icdar2017 competition on recognition of documents with complex layouts rdcl2017. In 2017 14th IAPR International Conference on Document Analysis and Recognition (ICDAR) , volume 01, pages 1404-1410, 2017."}, {"label": "list_item", "id": 17, "page_no": 7, "cluster": {"id": 17, "label": "list_item", "bbox": {"l": 321.198, "t": 404.49237, "r": 558.20013, "b": 426.94689999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9257517457008362, "cells": [{"id": 148, "text": "[3]", "bbox": {"l": 321.198, "t": 404.49237, "r": 329.53583, "b": 411.00592, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "Herv\u00e9 D\u00e9jean, Jean-Luc Meunier, Liangcai Gao, Yilun Huang, Yu Fang, Florian", "bbox": {"l": 331.30682, "t": 404.49237, "r": 558.19958, "b": 411.00592, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "Kleber, and Eva-Maria Lang. ICDAR 2019 Competition on Table Detection and", "bbox": {"l": 333.39099, "t": 412.46335, "r": 558.20013, "b": 418.9769, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "Recognition (cTDaR), April 2019. http://sac.founderit.com/.", "bbox": {"l": 333.39099, "t": 420.43335, "r": 501.80127, "b": 426.94689999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[3] Herv\u00e9 D\u00e9jean, Jean-Luc Meunier, Liangcai Gao, Yilun Huang, Yu Fang, Florian Kleber, and Eva-Maria Lang. ICDAR 2019 Competition on Table Detection and Recognition (cTDaR), April 2019. http://sac.founderit.com/."}, {"label": "list_item", "id": 16, "page_no": 7, "cluster": {"id": 16, "label": "list_item", "bbox": {"l": 321.198, "t": 428.40335, "r": 559.37872, "b": 458.8269, "coord_origin": "TOPLEFT"}, "confidence": 0.9270979762077332, "cells": [{"id": 152, "text": "[4]", "bbox": {"l": 321.198, "t": 428.40335, "r": 329.91299, "b": 434.9169, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "Antonio Jimeno Yepes, Peter Zhong, and Douglas Burdick. Competition on", "bbox": {"l": 331.7641, "t": 428.40335, "r": 558.19885, "b": 434.9169, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "scientific literature parsing. In", "bbox": {"l": 333.39099, "t": 436.3733500000001, "r": 423.77225, "b": 442.8869, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "Proceedings of the International Conference on", "bbox": {"l": 425.909, "t": 436.40823, "r": 558.20178, "b": 442.89386, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "Document Analysis and Recognition", "bbox": {"l": 333.39099, "t": 444.37823, "r": 429.42697, "b": 450.86386, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": ", ICDAR, pages 605-617. LNCS 12824, Springer-", "bbox": {"l": 429.42400999999995, "t": 444.34335, "r": 559.37872, "b": 450.85689999999994, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "Verlag, sep 2021.", "bbox": {"l": 332.819, "t": 452.31335, "r": 380.01764, "b": 458.8269, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[4] Antonio Jimeno Yepes, Peter Zhong, and Douglas Burdick. Competition on scientific literature parsing. In Proceedings of the International Conference on Document Analysis and Recognition , ICDAR, pages 605-617. LNCS 12824, SpringerVerlag, sep 2021."}, {"label": "list_item", "id": 14, "page_no": 7, "cluster": {"id": 14, "label": "list_item", "bbox": {"l": 321.198, "t": 460.28336, "r": 559.02625, "b": 490.70792, "coord_origin": "TOPLEFT"}, "confidence": 0.9290013313293457, "cells": [{"id": 159, "text": "[5]", "bbox": {"l": 321.198, "t": 460.28336, "r": 329.22977, "b": 466.79691, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "Logan Markewich, Hao Zhang, Yubin Xing, Navid Lambert-Shirzad, Jiang Zhexin,", "bbox": {"l": 330.93576, "t": 460.28336, "r": 558.97156, "b": 466.79691, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "Roy Lee, Zhi Li, and Seok-Bum Ko. Segmentation for document layout analysis:", "bbox": {"l": 333.39099, "t": 468.25336, "r": 559.02625, "b": 474.76691, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "not dead yet.", "bbox": {"l": 333.39099, "t": 476.22437, "r": 368.85431, "b": 482.73792, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "International Journal on Document Analysis and Recognition (IJDAR)", "bbox": {"l": 370.811, "t": 476.25925, "r": 557.46326, "b": 482.74487, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": ",", "bbox": {"l": 557.46503, "t": 476.22437, "r": 558.96857, "b": 482.73792, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "pages 1-11, 01 2022.", "bbox": {"l": 333.39099, "t": 484.19437, "r": 390.82715, "b": 490.70792, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[5] Logan Markewich, Hao Zhang, Yubin Xing, Navid Lambert-Shirzad, Jiang Zhexin, Roy Lee, Zhi Li, and Seok-Bum Ko. Segmentation for document layout analysis: not dead yet. International Journal on Document Analysis and Recognition (IJDAR) , pages 1-11, 01 2022."}, {"label": "list_item", "id": 15, "page_no": 7, "cluster": {"id": 15, "label": "list_item", "bbox": {"l": 321.198, "t": 492.16437, "r": 558.20361, "b": 514.6248800000001, "coord_origin": "TOPLEFT"}, "confidence": 0.927480161190033, "cells": [{"id": 166, "text": "[6]", "bbox": {"l": 321.198, "t": 492.16437, "r": 329.42145, "b": 498.67792, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "Xu Zhong, Jianbin Tang, and Antonio Jimeno-Yepes. Publaynet: Largest dataset", "bbox": {"l": 331.16812, "t": 492.16437, "r": 558.20361, "b": 498.67792, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "ever for document layout analysis. In", "bbox": {"l": 333.39099, "t": 500.13437, "r": 438.6101100000001, "b": 506.64792, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "Proceedings of the International Conference", "bbox": {"l": 440.349, "t": 500.16925, "r": 558.19958, "b": 506.65488, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "on Document Analysis and Recognition", "bbox": {"l": 333.39099, "t": 508.13925, "r": 441.40118, "b": 514.6248800000001, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": ", ICDAR, pages 1015-1022, sep 2019.", "bbox": {"l": 441.4019799999999, "t": 508.10437, "r": 544.78162, "b": 514.61792, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[6] Xu Zhong, Jianbin Tang, and Antonio Jimeno-Yepes. Publaynet: Largest dataset ever for document layout analysis. In Proceedings of the International Conference on Document Analysis and Recognition , ICDAR, pages 1015-1022, sep 2019."}, {"label": "list_item", "id": 10, "page_no": 7, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 321.19797, "t": 516.07437, "r": 558.9715, "b": 554.46889, "coord_origin": "TOPLEFT"}, "confidence": 0.9426896572113037, "cells": [{"id": 172, "text": "[7]", "bbox": {"l": 321.19797, "t": 516.07437, "r": 329.74161, "b": 522.5879199999999, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "Minghao Li, Yiheng Xu, Lei Cui, Shaohan Huang, Furu Wei, Zhoujun Li, and", "bbox": {"l": 331.55634, "t": 516.07437, "r": 558.19897, "b": 522.5879199999999, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "Ming Zhou. Docbank: A benchmark dataset for document layout analysis. In", "bbox": {"l": 333.39099, "t": 524.0443700000001, "r": 558.19891, "b": 530.55792, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "Proceedings of the 28th International Conference on Computational Linguistics", "bbox": {"l": 333.39099, "t": 532.04922, "r": 557.40228, "b": 538.53487, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": ",", "bbox": {"l": 557.40399, "t": 532.01437, "r": 558.96893, "b": 538.5278900000001, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "COLING, pages 949-960. International Committee on Computational Linguistics,", "bbox": {"l": 333.39099, "t": 539.98438, "r": 558.9715, "b": 546.49789, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "dec 2020.", "bbox": {"l": 333.39099, "t": 547.95535, "r": 359.31955, "b": 554.46889, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[7] Minghao Li, Yiheng Xu, Lei Cui, Shaohan Huang, Furu Wei, Zhoujun Li, and Ming Zhou. Docbank: A benchmark dataset for document layout analysis. In Proceedings of the 28th International Conference on Computational Linguistics , COLING, pages 949-960. International Committee on Computational Linguistics, dec 2020."}, {"label": "list_item", "id": 19, "page_no": 7, "cluster": {"id": 19, "label": "list_item", "bbox": {"l": 321.198, "t": 555.92535, "r": 558.90222, "b": 578.38586, "coord_origin": "TOPLEFT"}, "confidence": 0.9139690399169922, "cells": [{"id": 179, "text": "[8]", "bbox": {"l": 321.198, "t": 555.92535, "r": 329.7088, "b": 562.43889, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "Riaz Ahmad, Muhammad Tanvir Afzal, and M. Qadir. Information extraction", "bbox": {"l": 331.51654, "t": 555.92535, "r": 558.19891, "b": 562.43889, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "from pdf sources based on rule-based system using integrated formats. In", "bbox": {"l": 333.39099, "t": 563.89536, "r": 535.54352, "b": 570.40889, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "SemWe-", "bbox": {"l": 536.96399, "t": 563.93024, "r": 558.90222, "b": 570.4158600000001, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "bEval@ESWC", "bbox": {"l": 333.39099, "t": 571.9002399999999, "r": 371.94217, "b": 578.38586, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": ", 2016.", "bbox": {"l": 371.94299, "t": 571.86536, "r": 389.72617, "b": 578.3788900000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[8] Riaz Ahmad, Muhammad Tanvir Afzal, and M. Qadir. Information extraction from pdf sources based on rule-based system using integrated formats. In SemWebEval@ESWC , 2016."}, {"label": "list_item", "id": 21, "page_no": 7, "cluster": {"id": 21, "label": "list_item", "bbox": {"l": 321.198, "t": 579.83536, "r": 559.27448, "b": 610.2589, "coord_origin": "TOPLEFT"}, "confidence": 0.9113105535507202, "cells": [{"id": 185, "text": "[9]", "bbox": {"l": 321.198, "t": 579.83536, "r": 329.45999, "b": 586.34889, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "Ross B. Girshick, Jeff Donahue, Trevor Darrell, and Jitendra Malik. Rich feature", "bbox": {"l": 331.21487, "t": 579.83536, "r": 558.19843, "b": 586.34889, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "hierarchies for accurate object detection and semantic segmentation. In", "bbox": {"l": 333.39099, "t": 587.8053600000001, "r": 543.05487, "b": 594.31889, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": "IEEE", "bbox": {"l": 544.98499, "t": 587.84024, "r": 558.20148, "b": 594.32587, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "Conference on Computer Vision and Pattern Recognition", "bbox": {"l": 333.39099, "t": 595.81024, "r": 491.61166, "b": 602.29587, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": ", CVPR, pages 580-587.", "bbox": {"l": 491.61301, "t": 595.77536, "r": 559.27448, "b": 602.28889, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "IEEE Computer Society, jun 2014.", "bbox": {"l": 333.39099, "t": 603.74536, "r": 428.59726000000006, "b": 610.2589, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[9] Ross B. Girshick, Jeff Donahue, Trevor Darrell, and Jitendra Malik. Rich feature hierarchies for accurate object detection and semantic segmentation. In IEEE Conference on Computer Vision and Pattern Recognition , CVPR, pages 580-587. IEEE Computer Society, jun 2014."}, {"label": "list_item", "id": 22, "page_no": 7, "cluster": {"id": 22, "label": "list_item", "bbox": {"l": 317.95499, "t": 611.71536, "r": 558.20203, "b": 626.20686, "coord_origin": "TOPLEFT"}, "confidence": 0.9028770327568054, "cells": [{"id": 192, "text": "[10]", "bbox": {"l": 317.95499, "t": 611.71536, "r": 329.54767, "b": 618.2289000000001, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "Ross B. Girshick. Fast R-CNN. In", "bbox": {"l": 331.31268, "t": 611.71536, "r": 425.1554, "b": 618.2289000000001, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "2015 IEEE International Conference on Computer", "bbox": {"l": 426.77802, "t": 611.75024, "r": 558.20203, "b": 618.23587, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "Vision", "bbox": {"l": 333.39099, "t": 619.72124, "r": 350.59537, "b": 626.20686, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": ", ICCV, pages 1440-1448. IEEE Computer Society, dec 2015.", "bbox": {"l": 350.59598, "t": 619.68637, "r": 518.58777, "b": 626.19989, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[10] Ross B. Girshick. Fast R-CNN. In 2015 IEEE International Conference on Computer Vision , ICCV, pages 1440-1448. IEEE Computer Society, dec 2015."}, {"label": "list_item", "id": 20, "page_no": 7, "cluster": {"id": 20, "label": "list_item", "bbox": {"l": 317.95499, "t": 627.65637, "r": 558.20142, "b": 650.1168700000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9127691984176636, "cells": [{"id": 197, "text": "[11]", "bbox": {"l": 317.95499, "t": 627.65637, "r": 329.5459, "b": 634.16989, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "Shaoqing Ren, Kaiming He, Ross Girshick, and Jian Sun. Faster r-cnn: Towards", "bbox": {"l": 331.31064, "t": 627.65637, "r": 558.20142, "b": 634.16989, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "real-time object detection with region proposal networks.", "bbox": {"l": 333.39099, "t": 635.62637, "r": 497.50909, "b": 642.13989, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "IEEE Transactions on", "bbox": {"l": 500.01401, "t": 635.66124, "r": 558.19885, "b": 642.14687, "coord_origin": "TOPLEFT"}}, {"id": 201, "text": "Pattern Analysis and Machine Intelligence", "bbox": {"l": 333.39099, "t": 643.6312399999999, "r": 449.38620000000003, "b": 650.1168700000001, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": ", 39(6):1137-1149, 2017.", "bbox": {"l": 449.38699, "t": 643.59637, "r": 515.74268, "b": 650.10989, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[11] Shaoqing Ren, Kaiming He, Ross Girshick, and Jian Sun. Faster r-cnn: Towards real-time object detection with region proposal networks. IEEE Transactions on Pattern Analysis and Machine Intelligence , 39(6):1137-1149, 2017."}, {"label": "list_item", "id": 18, "page_no": 7, "cluster": {"id": 18, "label": "list_item", "bbox": {"l": 317.95499, "t": 651.56638, "r": 559.27808, "b": 674.01989, "coord_origin": "TOPLEFT"}, "confidence": 0.9142462611198425, "cells": [{"id": 203, "text": "[12]", "bbox": {"l": 317.95499, "t": 651.56638, "r": 329.41763, "b": 658.0799, "coord_origin": "TOPLEFT"}}, {"id": 204, "text": "Kaiming He, Georgia Gkioxari, Piotr Doll\u00e1r, and Ross B. Girshick. Mask R-CNN.", "bbox": {"l": 331.16287, "t": 651.56638, "r": 559.27808, "b": 658.0799, "coord_origin": "TOPLEFT"}}, {"id": 205, "text": "In", "bbox": {"l": 333.39099, "t": 659.53638, "r": 339.35904, "b": 666.0499, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": "IEEE International Conference on Computer Vision", "bbox": {"l": 341.56299, "t": 659.57124, "r": 485.8273, "b": 666.05687, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": ", ICCV, pages 2980-2988.", "bbox": {"l": 485.82901, "t": 659.53638, "r": 559.27356, "b": 666.0499, "coord_origin": "TOPLEFT"}}, {"id": 208, "text": "IEEE Computer Society, Oct 2017.", "bbox": {"l": 333.39099, "t": 667.50636, "r": 429.30161000000004, "b": 674.01989, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[12] Kaiming He, Georgia Gkioxari, Piotr Doll\u00e1r, and Ross B. Girshick. Mask R-CNN. In IEEE International Conference on Computer Vision , ICCV, pages 2980-2988. IEEE Computer Society, Oct 2017."}, {"label": "list_item", "id": 23, "page_no": 7, "cluster": {"id": 23, "label": "list_item", "bbox": {"l": 317.95499, "t": 675.47636, "r": 558.97156, "b": 705.900894, "coord_origin": "TOPLEFT"}, "confidence": 0.8895429372787476, "cells": [{"id": 209, "text": "[13]", "bbox": {"l": 317.95499, "t": 675.47636, "r": 330.11407, "b": 681.9898900000001, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": "Glenn Jocher, Alex Stoken, Ayush Chaurasia, Jirka Borovec, NanoCode012,", "bbox": {"l": 331.96533, "t": 675.47636, "r": 558.96716, "b": 681.9898900000001, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "TaoXie, Yonghye Kwon, Kalen Michael, Liu Changyu, Jiacong Fang, Abhiram V,", "bbox": {"l": 333.18201, "t": 683.44637, "r": 558.96661, "b": 689.95989, "coord_origin": "TOPLEFT"}}, {"id": 212, "text": "Laughing, tkianai, yxNONG, Piotr Skalski, Adam Hogan, Jebastin Nadar, imyhxy,", "bbox": {"l": 333.39099, "t": 691.41737, "r": 558.97156, "b": 697.930893, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "Lorenzo Mammana, Alex Wang, Cristi Fati, Diego Montes, Jan Hajek, Laurentiu", "bbox": {"l": 333.39099, "t": 699.387367, "r": 558.20001, "b": 705.900894, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[13] Glenn Jocher, Alex Stoken, Ayush Chaurasia, Jirka Borovec, NanoCode012, TaoXie, Yonghye Kwon, Kalen Michael, Liu Changyu, Jiacong Fang, Abhiram V, Laughing, tkianai, yxNONG, Piotr Skalski, Adam Hogan, Jebastin Nadar, imyhxy, Lorenzo Mammana, Alex Wang, Cristi Fati, Diego Montes, Jan Hajek, Laurentiu"}], "headers": [{"label": "page_header", "id": 24, "page_no": 7, "cluster": {"id": 24, "label": "page_header", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.7984204292297363, "cells": [{"id": 0, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 246.24382, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar", "bbox": {"l": 253.13897999999998, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar"}]}}, {"page_no": 8, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "4bed2a8aa51ac37058e79605821bbc426d032b0b6ca8bdf3409ed8508ccd8c67", "bbox": {"l": 231.8804, "t": 301.50543, "r": 235.14504999999997, "b": 414.69144, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "2f2a06d08f5ad565d0f5e815f4ddf666365b2cff435cdaeb8850217e8a8efabf", "bbox": {"l": 395.06876, "t": 117.37183000000005, "r": 398.33353, "b": 230.55786, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "7f2fd7293e04bf4f1756ae51f5779764933da1d1d2002e3915356050570fc75b", "bbox": {"l": 55.775887, "t": 301.50543, "r": 59.04052000000001, "b": 414.69144, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "1b81cf65f47456ad4faa725d1eb09879bd633af16cfe2bf8cea661b87907bfac", "bbox": {"l": 232.01364, "t": 117.37183000000005, "r": 235.27841000000004, "b": 230.55786, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "b60da9d26f488cb133e47d101d35fda1bdca2671ade60764d1cd569590270327", "bbox": {"l": 395.20047, "t": 301.50543, "r": 398.46512, "b": 414.69144, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "2b7b8355a42ebef0cf91583aad9f30f7c9fa63c5b05911730ba15275c024965b$^{A}$", "bbox": {"l": 55.775818, "t": 117.37183000000005, "r": 65.409912, "b": 230.55786, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "B", "bbox": {"l": 234.56980999999996, "t": 88.50183000000015, "r": 240.06987, "b": 97.01098999999988, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "C", "bbox": {"l": 397.81934, "t": 88.89355, "r": 403.3194, "b": 97.40270999999996, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "D", "bbox": {"l": 59.909843, "t": 266.75885000000005, "r": 65.409912, "b": 275.26793999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "E", "bbox": {"l": 234.77386, "t": 266.36707, "r": 239.85495000000003, "b": 274.87616, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "F", "bbox": {"l": 398.26144, "t": 266.75885000000005, "r": 402.91592, "b": 275.26793999999995, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Text", "bbox": {"l": 62.323874999999994, "t": 442.28543, "r": 70.895882, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Caption", "bbox": {"l": 80.16581, "t": 442.28543, "r": 95.565453, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "List-Item", "bbox": {"l": 104.94447, "t": 442.28543, "r": 122.38113000000001, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Formula", "bbox": {"l": 131.78354, "t": 442.28543, "r": 148.34625, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "Table", "bbox": {"l": 157.66106, "t": 442.28543, "r": 168.53032, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Section-Header", "bbox": {"l": 201.24315, "t": 442.28543, "r": 232.00499, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Picture", "bbox": {"l": 177.8381, "t": 442.28543, "r": 191.88956, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Page-Header", "bbox": {"l": 240.95844000000002, "t": 442.28543, "r": 266.61908, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Page-Footer", "bbox": {"l": 276.03928, "t": 442.28543, "r": 300.33261, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "Title", "bbox": {"l": 309.74615, "t": 442.28543, "r": 318.50473, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Figure 6: Example layout predictions on selected pages from the DocLayNet test-set. (A, D) exhibit favourable results on", "bbox": {"l": 53.79800000000001, "t": 464.48199, "r": 558.203, "b": 472.95523, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "coloured backgrounds. (B, C) show accurate list-item and paragraph differentiation despite densely-spaced lines. (E) demon-", "bbox": {"l": 53.79800000000001, "t": 475.44101, "r": 559.80786, "b": 483.91425, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "strates good table and figure distinction. (F) shows predictions on a Chinese patent with multiple overlaps, label confusion", "bbox": {"l": 53.79800000000001, "t": 486.39999, "r": 558.20294, "b": 494.87323, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "and missing boxes.", "bbox": {"l": 53.79800000000001, "t": 497.358, "r": 130.37105, "b": 505.83124, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Diaconu, Mai Thanh Minh, Marc, albinxavi, fatih, oleg, and wanghao yang. ul-", "bbox": {"l": 69.234001, "t": 527.06635, "r": 295.22406, "b": 533.5799, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "tralytics/yolov5: v6.0 - yolov5n nano models, roboflow integration, tensorflow", "bbox": {"l": 69.234001, "t": 535.03638, "r": 294.30612, "b": 541.5499, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "export, opencv dnn support, October 2021.", "bbox": {"l": 69.234001, "t": 543.00638, "r": 190.45259, "b": 549.5199, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "[14]", "bbox": {"l": 53.79800000000001, "t": 550.97638, "r": 65.286942, "b": 557.4899, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Nicolas Carion, Francisco Massa, Gabriel Synnaeve, Nicolas Usunier, Alexander", "bbox": {"l": 67.036171, "t": 550.97638, "r": 294.17709, "b": 557.4899, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Kirillov, and Sergey Zagoruyko. End-to-end object detection with transformers.", "bbox": {"l": 69.234001, "t": 558.94638, "r": 295.12177, "b": 565.4599000000001, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "CoRR", "bbox": {"l": 69.234001, "t": 566.95123, "r": 84.388069, "b": 573.43686, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": ", abs/2005.12872, 2020.", "bbox": {"l": 84.388, "t": 566.91635, "r": 147.7659, "b": 573.42989, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "[15]", "bbox": {"l": 53.79800000000001, "t": 574.88635, "r": 64.994034, "b": 581.39989, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Mingxing Tan, Ruoming Pang, and Quoc V. Le. Efficientdet: Scalable and efficient", "bbox": {"l": 66.698669, "t": 574.88635, "r": 294.04224, "b": 581.39989, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "object detection.", "bbox": {"l": 69.234001, "t": 582.85736, "r": 116.1049, "b": 589.3709, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "CoRR", "bbox": {"l": 118.616, "t": 582.89224, "r": 133.77007, "b": 589.37787, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": ", abs/1911.09070, 2019.", "bbox": {"l": 133.77, "t": 582.85736, "r": 197.14792, "b": 589.3709, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "[16]", "bbox": {"l": 53.79800399999999, "t": 590.82736, "r": 65.110367, "b": 597.3409, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Tsung-Yi Lin, Michael Maire, Serge J. Belongie, Lubomir D. Bourdev, Ross B. Gir-", "bbox": {"l": 66.832718, "t": 590.82736, "r": 295.22263, "b": 597.3409, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "shick, James Hays, Pietro Perona, Deva Ramanan, Piotr Doll\u00e1r, and C. Lawrence", "bbox": {"l": 69.234001, "t": 598.79736, "r": 294.04462, "b": 605.3109, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Zitnick. Microsoft COCO: common objects in context, 2014.", "bbox": {"l": 69.234001, "t": 606.76736, "r": 239.71553000000003, "b": 613.2809, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "[17]", "bbox": {"l": 53.79800000000001, "t": 614.7373699999999, "r": 65.177979, "b": 621.2509, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Yuxin Wu, Alexander Kirillov, Francisco Massa, Wan-Yen Lo, and Ross Girshick.", "bbox": {"l": 66.910622, "t": 614.7373699999999, "r": 295.12009, "b": 621.2509, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "Detectron2, 2019.", "bbox": {"l": 69.234001, "t": 622.70737, "r": 118.65732, "b": 629.22089, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "[18]", "bbox": {"l": 53.79800000000001, "t": 630.67737, "r": 65.022064, "b": 637.19089, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Nikolaos Livathinos, Cesar Berrospi, Maksym Lysak, Viktor Kuropiatnyk, Ahmed", "bbox": {"l": 66.730972, "t": 630.67737, "r": 294.04224, "b": 637.19089, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "Nassar, Andre Carvalho, Michele Dolfi, Christoph Auer, Kasper Dinkla, and Peter", "bbox": {"l": 69.234001, "t": 638.64737, "r": 294.17896, "b": 645.16089, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "W.", "bbox": {"l": 68.900002, "t": 646.6173699999999, "r": 76.877083, "b": 653.13089, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "J. Staar. Robust pdf document conversion using recurrent neural networks. In", "bbox": {"l": 78.580124, "t": 646.6173699999999, "r": 294.04312, "b": 653.13089, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Proceedings of the 35th Conference on Artificial Intelligence", "bbox": {"l": 69.234001, "t": 654.62325, "r": 233.43309000000002, "b": 661.10887, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": ", AAAI, pages 15137-", "bbox": {"l": 233.43401000000003, "t": 654.58838, "r": 294.8089, "b": 661.1019, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "15145, feb 2021.", "bbox": {"l": 69.073997, "t": 662.55836, "r": 113.53197, "b": 669.0718899999999, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "[19]", "bbox": {"l": 53.797997, "t": 670.52837, "r": 65.760811, "b": 677.04189, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Yiheng Xu, Minghao Li, Lei Cui, Shaohan Huang, Furu Wei, and Ming Zhou.", "bbox": {"l": 67.582199, "t": 670.52837, "r": 295.11609, "b": 677.04189, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Layoutlm: Pre-training of text and layout for document image understanding.", "bbox": {"l": 69.234001, "t": 678.49837, "r": 295.11606, "b": 685.01189, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "In", "bbox": {"l": 69.234001, "t": 686.46837, "r": 75.155228, "b": 692.981895, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Proceedings of the 26th ACM SIGKDD International Conference on Knowledge", "bbox": {"l": 76.891998, "t": 686.50323, "r": 294.04382, "b": 692.988869, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Discovery and Data Mining", "bbox": {"l": 69.234001, "t": 694.473236, "r": 144.91022, "b": 700.95887, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": ", KDD, pages 1192-1200, New York, USA, 2020. Asso-", "bbox": {"l": 144.908, "t": 694.4383700000001, "r": 295.22174, "b": 700.951897, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "ciation for Computing Machinery.", "bbox": {"l": 69.234001, "t": 702.408363, "r": 166.37207, "b": 708.92189, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "[20]", "bbox": {"l": 317.95499, "t": 527.06638, "r": 329.24017, "b": 533.57993, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "Shoubin Li, Xuyan Ma, Shuaiqun Pan, Jun Hu, Lin Shi, and Qing Wang. Vtlayout:", "bbox": {"l": 330.95837, "t": 527.06638, "r": 559.02637, "b": 533.57993, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "Fusion of visual and text features for document layout analysis, 2021.", "bbox": {"l": 333.39099, "t": 535.03638, "r": 530.03815, "b": 541.5499, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "[21]", "bbox": {"l": 317.95499, "t": 543.00638, "r": 329.54419, "b": 549.5199, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "Peng Zhang, Can Li, Liang Qiao, Zhanzhan Cheng, Shiliang Pu, Yi Niu, and Fei", "bbox": {"l": 331.30869, "t": 543.00638, "r": 558.20135, "b": 549.5199, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "Wu. Vsr: A unified framework for document layout analysis combining vision,", "bbox": {"l": 333.05701, "t": 550.97638, "r": 558.9715, "b": 557.4899, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "semantics and relations, 2021.", "bbox": {"l": 333.39099, "t": 558.94638, "r": 418.05988, "b": 565.4599000000001, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "[22]", "bbox": {"l": 317.95499, "t": 566.91638, "r": 330.14108, "b": 573.4299, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Peter W J Staar, Michele Dolfi, Christoph Auer, and Costas Bekas.", "bbox": {"l": 331.99646, "t": 566.91638, "r": 531.54553, "b": 573.4299, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "Corpus", "bbox": {"l": 537.12946, "t": 566.91635, "r": 558.19897, "b": 573.42989, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "conversion service: A machine learning platform to ingest documents at scale.", "bbox": {"l": 333.39099, "t": 574.88635, "r": 559.27539, "b": 581.39989, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "In", "bbox": {"l": 333.39099, "t": 582.85736, "r": 339.31223, "b": 589.3709, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "Proceedings of the 24th ACM SIGKDD International Conference on Knowledge", "bbox": {"l": 341.04901, "t": 582.89224, "r": 558.20081, "b": 589.37787, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "Discovery and Data Mining", "bbox": {"l": 333.39099, "t": 590.8622399999999, "r": 409.56577, "b": 597.3478700000001, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": ", KDD, pages 774-782. ACM, 2018.", "bbox": {"l": 409.56598, "t": 590.82736, "r": 507.31765999999993, "b": 597.3409, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "[23]", "bbox": {"l": 317.95499, "t": 598.79736, "r": 329.37976, "b": 605.3109, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "Connor Shorten and Taghi M. Khoshgoftaar. A survey on image data augmenta-", "bbox": {"l": 331.11923, "t": 598.79736, "r": 559.3783, "b": 605.3109, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "tion for deep learning.", "bbox": {"l": 333.39099, "t": 606.76736, "r": 396.9223, "b": 613.2809, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Journal of Big Data", "bbox": {"l": 399.43298, "t": 606.80225, "r": 453.66122, "b": 613.28787, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": ", 6(1):60, 2019.", "bbox": {"l": 453.66199, "t": 606.76736, "r": 493.49631, "b": 613.2809, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 13, "label": "page_header", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.8021692037582397, "cells": [{"id": 0, "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "page_header", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.8429245352745056, "cells": [{"id": 1, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "picture", "bbox": {"l": 52.963985443115234, "t": 84.73583984375, "r": 556.931640625, "b": 442.1351013183594, "coord_origin": "TOPLEFT"}, "confidence": 0.8352117538452148, "cells": [{"id": 2, "text": "4bed2a8aa51ac37058e79605821bbc426d032b0b6ca8bdf3409ed8508ccd8c67", "bbox": {"l": 231.8804, "t": 301.50543, "r": 235.14504999999997, "b": 414.69144, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "2f2a06d08f5ad565d0f5e815f4ddf666365b2cff435cdaeb8850217e8a8efabf", "bbox": {"l": 395.06876, "t": 117.37183000000005, "r": 398.33353, "b": 230.55786, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "7f2fd7293e04bf4f1756ae51f5779764933da1d1d2002e3915356050570fc75b", "bbox": {"l": 55.775887, "t": 301.50543, "r": 59.04052000000001, "b": 414.69144, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "1b81cf65f47456ad4faa725d1eb09879bd633af16cfe2bf8cea661b87907bfac", "bbox": {"l": 232.01364, "t": 117.37183000000005, "r": 235.27841000000004, "b": 230.55786, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "b60da9d26f488cb133e47d101d35fda1bdca2671ade60764d1cd569590270327", "bbox": {"l": 395.20047, "t": 301.50543, "r": 398.46512, "b": 414.69144, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "2b7b8355a42ebef0cf91583aad9f30f7c9fa63c5b05911730ba15275c024965b$^{A}$", "bbox": {"l": 55.775818, "t": 117.37183000000005, "r": 65.409912, "b": 230.55786, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "B", "bbox": {"l": 234.56980999999996, "t": 88.50183000000015, "r": 240.06987, "b": 97.01098999999988, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "C", "bbox": {"l": 397.81934, "t": 88.89355, "r": 403.3194, "b": 97.40270999999996, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "D", "bbox": {"l": 59.909843, "t": 266.75885000000005, "r": 65.409912, "b": 275.26793999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "E", "bbox": {"l": 234.77386, "t": 266.36707, "r": 239.85495000000003, "b": 274.87616, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "F", "bbox": {"l": 398.26144, "t": 266.75885000000005, "r": 402.91592, "b": 275.26793999999995, "coord_origin": "TOPLEFT"}}], "children": [{"id": 17, "label": "text", "bbox": {"l": 231.8804, "t": 301.50543, "r": 235.14504999999997, "b": 414.69144, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 2, "text": "4bed2a8aa51ac37058e79605821bbc426d032b0b6ca8bdf3409ed8508ccd8c67", "bbox": {"l": 231.8804, "t": 301.50543, "r": 235.14504999999997, "b": 414.69144, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 395.06876, "t": 117.37183000000005, "r": 398.33353, "b": 230.55786, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 3, "text": "2f2a06d08f5ad565d0f5e815f4ddf666365b2cff435cdaeb8850217e8a8efabf", "bbox": {"l": 395.06876, "t": 117.37183000000005, "r": 398.33353, "b": 230.55786, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 55.775887, "t": 301.50543, "r": 59.04052000000001, "b": 414.69144, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 4, "text": "7f2fd7293e04bf4f1756ae51f5779764933da1d1d2002e3915356050570fc75b", "bbox": {"l": 55.775887, "t": 301.50543, "r": 59.04052000000001, "b": 414.69144, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 232.01364, "t": 117.37183000000005, "r": 235.27841000000004, "b": 230.55786, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 5, "text": "1b81cf65f47456ad4faa725d1eb09879bd633af16cfe2bf8cea661b87907bfac", "bbox": {"l": 232.01364, "t": 117.37183000000005, "r": 235.27841000000004, "b": 230.55786, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 395.20047, "t": 301.50543, "r": 398.46512, "b": 414.69144, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": "b60da9d26f488cb133e47d101d35fda1bdca2671ade60764d1cd569590270327", "bbox": {"l": 395.20047, "t": 301.50543, "r": 398.46512, "b": 414.69144, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 55.775818, "t": 117.37183000000005, "r": 65.409912, "b": 230.55786, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "2b7b8355a42ebef0cf91583aad9f30f7c9fa63c5b05911730ba15275c024965b$^{A}$", "bbox": {"l": 55.775818, "t": 117.37183000000005, "r": 65.409912, "b": 230.55786, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 234.56980999999996, "t": 88.50183000000015, "r": 240.06987, "b": 97.01098999999988, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "B", "bbox": {"l": 234.56980999999996, "t": 88.50183000000015, "r": 240.06987, "b": 97.01098999999988, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 397.81934, "t": 88.89355, "r": 403.3194, "b": 97.40270999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "C", "bbox": {"l": 397.81934, "t": 88.89355, "r": 403.3194, "b": 97.40270999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 59.909843, "t": 266.75885000000005, "r": 65.409912, "b": 275.26793999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "D", "bbox": {"l": 59.909843, "t": 266.75885000000005, "r": 65.409912, "b": 275.26793999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 234.77386, "t": 266.36707, "r": 239.85495000000003, "b": 274.87616, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "E", "bbox": {"l": 234.77386, "t": 266.36707, "r": 239.85495000000003, "b": 274.87616, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 398.26144, "t": 266.75885000000005, "r": 402.91592, "b": 275.26793999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "F", "bbox": {"l": 398.26144, "t": 266.75885000000005, "r": 402.91592, "b": 275.26793999999995, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 16, "label": "caption", "bbox": {"l": 62.323874999999994, "t": 442.28543, "r": 318.50473, "b": 448.26483, "coord_origin": "TOPLEFT"}, "confidence": 0.6248988509178162, "cells": [{"id": 13, "text": "Text", "bbox": {"l": 62.323874999999994, "t": 442.28543, "r": 70.895882, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Caption", "bbox": {"l": 80.16581, "t": 442.28543, "r": 95.565453, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "List-Item", "bbox": {"l": 104.94447, "t": 442.28543, "r": 122.38113000000001, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Formula", "bbox": {"l": 131.78354, "t": 442.28543, "r": 148.34625, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "Table", "bbox": {"l": 157.66106, "t": 442.28543, "r": 168.53032, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Section-Header", "bbox": {"l": 201.24315, "t": 442.28543, "r": 232.00499, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Picture", "bbox": {"l": 177.8381, "t": 442.28543, "r": 191.88956, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Page-Header", "bbox": {"l": 240.95844000000002, "t": 442.28543, "r": 266.61908, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Page-Footer", "bbox": {"l": 276.03928, "t": 442.28543, "r": 300.33261, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "Title", "bbox": {"l": 309.74615, "t": 442.28543, "r": 318.50473, "b": 448.26483, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "text", "bbox": {"l": 53.79800000000001, "t": 464.48199, "r": 559.80786, "b": 505.83124, "coord_origin": "TOPLEFT"}, "confidence": 0.8651238679885864, "cells": [{"id": 23, "text": "Figure 6: Example layout predictions on selected pages from the DocLayNet test-set. (A, D) exhibit favourable results on", "bbox": {"l": 53.79800000000001, "t": 464.48199, "r": 558.203, "b": 472.95523, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "coloured backgrounds. (B, C) show accurate list-item and paragraph differentiation despite densely-spaced lines. (E) demon-", "bbox": {"l": 53.79800000000001, "t": 475.44101, "r": 559.80786, "b": 483.91425, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "strates good table and figure distinction. (F) shows predictions on a Chinese patent with multiple overlaps, label confusion", "bbox": {"l": 53.79800000000001, "t": 486.39999, "r": 558.20294, "b": 494.87323, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "and missing boxes.", "bbox": {"l": 53.79800000000001, "t": 497.358, "r": 130.37105, "b": 505.83124, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "text", "bbox": {"l": 69.234001, "t": 527.06635, "r": 295.22406, "b": 549.5199, "coord_origin": "TOPLEFT"}, "confidence": 0.8445901870727539, "cells": [{"id": 27, "text": "Diaconu, Mai Thanh Minh, Marc, albinxavi, fatih, oleg, and wanghao yang. ul-", "bbox": {"l": 69.234001, "t": 527.06635, "r": 295.22406, "b": 533.5799, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "tralytics/yolov5: v6.0 - yolov5n nano models, roboflow integration, tensorflow", "bbox": {"l": 69.234001, "t": 535.03638, "r": 294.30612, "b": 541.5499, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "export, opencv dnn support, October 2021.", "bbox": {"l": 69.234001, "t": 543.00638, "r": 190.45259, "b": 549.5199, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "list_item", "bbox": {"l": 53.79800000000001, "t": 550.97638, "r": 295.12177, "b": 573.43686, "coord_origin": "TOPLEFT"}, "confidence": 0.8561118841171265, "cells": [{"id": 30, "text": "[14]", "bbox": {"l": 53.79800000000001, "t": 550.97638, "r": 65.286942, "b": 557.4899, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Nicolas Carion, Francisco Massa, Gabriel Synnaeve, Nicolas Usunier, Alexander", "bbox": {"l": 67.036171, "t": 550.97638, "r": 294.17709, "b": 557.4899, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Kirillov, and Sergey Zagoruyko. End-to-end object detection with transformers.", "bbox": {"l": 69.234001, "t": 558.94638, "r": 295.12177, "b": 565.4599000000001, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "CoRR", "bbox": {"l": 69.234001, "t": 566.95123, "r": 84.388069, "b": 573.43686, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": ", abs/2005.12872, 2020.", "bbox": {"l": 84.388, "t": 566.91635, "r": 147.7659, "b": 573.42989, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "list_item", "bbox": {"l": 53.79800000000001, "t": 574.88635, "r": 294.04224, "b": 589.37787, "coord_origin": "TOPLEFT"}, "confidence": 0.8615186810493469, "cells": [{"id": 35, "text": "[15]", "bbox": {"l": 53.79800000000001, "t": 574.88635, "r": 64.994034, "b": 581.39989, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Mingxing Tan, Ruoming Pang, and Quoc V. Le. Efficientdet: Scalable and efficient", "bbox": {"l": 66.698669, "t": 574.88635, "r": 294.04224, "b": 581.39989, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "object detection.", "bbox": {"l": 69.234001, "t": 582.85736, "r": 116.1049, "b": 589.3709, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "CoRR", "bbox": {"l": 118.616, "t": 582.89224, "r": 133.77007, "b": 589.37787, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": ", abs/1911.09070, 2019.", "bbox": {"l": 133.77, "t": 582.85736, "r": 197.14792, "b": 589.3709, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "list_item", "bbox": {"l": 53.79800399999999, "t": 590.82736, "r": 295.22263, "b": 613.2809, "coord_origin": "TOPLEFT"}, "confidence": 0.859420657157898, "cells": [{"id": 40, "text": "[16]", "bbox": {"l": 53.79800399999999, "t": 590.82736, "r": 65.110367, "b": 597.3409, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Tsung-Yi Lin, Michael Maire, Serge J. Belongie, Lubomir D. Bourdev, Ross B. Gir-", "bbox": {"l": 66.832718, "t": 590.82736, "r": 295.22263, "b": 597.3409, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "shick, James Hays, Pietro Perona, Deva Ramanan, Piotr Doll\u00e1r, and C. Lawrence", "bbox": {"l": 69.234001, "t": 598.79736, "r": 294.04462, "b": 605.3109, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Zitnick. Microsoft COCO: common objects in context, 2014.", "bbox": {"l": 69.234001, "t": 606.76736, "r": 239.71553000000003, "b": 613.2809, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "list_item", "bbox": {"l": 53.79800000000001, "t": 614.7373699999999, "r": 295.12009, "b": 629.22089, "coord_origin": "TOPLEFT"}, "confidence": 0.8385180234909058, "cells": [{"id": 44, "text": "[17]", "bbox": {"l": 53.79800000000001, "t": 614.7373699999999, "r": 65.177979, "b": 621.2509, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Yuxin Wu, Alexander Kirillov, Francisco Massa, Wan-Yen Lo, and Ross Girshick.", "bbox": {"l": 66.910622, "t": 614.7373699999999, "r": 295.12009, "b": 621.2509, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "Detectron2, 2019.", "bbox": {"l": 69.234001, "t": 622.70737, "r": 118.65732, "b": 629.22089, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "list_item", "bbox": {"l": 53.79800000000001, "t": 630.67737, "r": 294.8089, "b": 669.0718899999999, "coord_origin": "TOPLEFT"}, "confidence": 0.8362045288085938, "cells": [{"id": 47, "text": "[18]", "bbox": {"l": 53.79800000000001, "t": 630.67737, "r": 65.022064, "b": 637.19089, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Nikolaos Livathinos, Cesar Berrospi, Maksym Lysak, Viktor Kuropiatnyk, Ahmed", "bbox": {"l": 66.730972, "t": 630.67737, "r": 294.04224, "b": 637.19089, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "Nassar, Andre Carvalho, Michele Dolfi, Christoph Auer, Kasper Dinkla, and Peter", "bbox": {"l": 69.234001, "t": 638.64737, "r": 294.17896, "b": 645.16089, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "W.", "bbox": {"l": 68.900002, "t": 646.6173699999999, "r": 76.877083, "b": 653.13089, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "J. Staar. Robust pdf document conversion using recurrent neural networks. In", "bbox": {"l": 78.580124, "t": 646.6173699999999, "r": 294.04312, "b": 653.13089, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Proceedings of the 35th Conference on Artificial Intelligence", "bbox": {"l": 69.234001, "t": 654.62325, "r": 233.43309000000002, "b": 661.10887, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": ", AAAI, pages 15137-", "bbox": {"l": 233.43401000000003, "t": 654.58838, "r": 294.8089, "b": 661.1019, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "15145, feb 2021.", "bbox": {"l": 69.073997, "t": 662.55836, "r": 113.53197, "b": 669.0718899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "list_item", "bbox": {"l": 53.797997, "t": 670.52837, "r": 295.22174, "b": 708.92189, "coord_origin": "TOPLEFT"}, "confidence": 0.7421635389328003, "cells": [{"id": 55, "text": "[19]", "bbox": {"l": 53.797997, "t": 670.52837, "r": 65.760811, "b": 677.04189, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Yiheng Xu, Minghao Li, Lei Cui, Shaohan Huang, Furu Wei, and Ming Zhou.", "bbox": {"l": 67.582199, "t": 670.52837, "r": 295.11609, "b": 677.04189, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Layoutlm: Pre-training of text and layout for document image understanding.", "bbox": {"l": 69.234001, "t": 678.49837, "r": 295.11606, "b": 685.01189, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "In", "bbox": {"l": 69.234001, "t": 686.46837, "r": 75.155228, "b": 692.981895, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Proceedings of the 26th ACM SIGKDD International Conference on Knowledge", "bbox": {"l": 76.891998, "t": 686.50323, "r": 294.04382, "b": 692.988869, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Discovery and Data Mining", "bbox": {"l": 69.234001, "t": 694.473236, "r": 144.91022, "b": 700.95887, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": ", KDD, pages 1192-1200, New York, USA, 2020. Asso-", "bbox": {"l": 144.908, "t": 694.4383700000001, "r": 295.22174, "b": 700.951897, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "ciation for Computing Machinery.", "bbox": {"l": 69.234001, "t": 702.408363, "r": 166.37207, "b": 708.92189, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "list_item", "bbox": {"l": 317.95499, "t": 527.06638, "r": 559.02637, "b": 541.5499, "coord_origin": "TOPLEFT"}, "confidence": 0.9088895320892334, "cells": [{"id": 63, "text": "[20]", "bbox": {"l": 317.95499, "t": 527.06638, "r": 329.24017, "b": 533.57993, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "Shoubin Li, Xuyan Ma, Shuaiqun Pan, Jun Hu, Lin Shi, and Qing Wang. Vtlayout:", "bbox": {"l": 330.95837, "t": 527.06638, "r": 559.02637, "b": 533.57993, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "Fusion of visual and text features for document layout analysis, 2021.", "bbox": {"l": 333.39099, "t": 535.03638, "r": 530.03815, "b": 541.5499, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "list_item", "bbox": {"l": 317.95499, "t": 543.00638, "r": 558.9715, "b": 565.4599000000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9247176647186279, "cells": [{"id": 66, "text": "[21]", "bbox": {"l": 317.95499, "t": 543.00638, "r": 329.54419, "b": 549.5199, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "Peng Zhang, Can Li, Liang Qiao, Zhanzhan Cheng, Shiliang Pu, Yi Niu, and Fei", "bbox": {"l": 331.30869, "t": 543.00638, "r": 558.20135, "b": 549.5199, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "Wu. Vsr: A unified framework for document layout analysis combining vision,", "bbox": {"l": 333.05701, "t": 550.97638, "r": 558.9715, "b": 557.4899, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "semantics and relations, 2021.", "bbox": {"l": 333.39099, "t": 558.94638, "r": 418.05988, "b": 565.4599000000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "list_item", "bbox": {"l": 317.95499, "t": 566.91635, "r": 559.27539, "b": 597.3478700000001, "coord_origin": "TOPLEFT"}, "confidence": 0.8956935405731201, "cells": [{"id": 70, "text": "[22]", "bbox": {"l": 317.95499, "t": 566.91638, "r": 330.14108, "b": 573.4299, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Peter W J Staar, Michele Dolfi, Christoph Auer, and Costas Bekas.", "bbox": {"l": 331.99646, "t": 566.91638, "r": 531.54553, "b": 573.4299, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "Corpus", "bbox": {"l": 537.12946, "t": 566.91635, "r": 558.19897, "b": 573.42989, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "conversion service: A machine learning platform to ingest documents at scale.", "bbox": {"l": 333.39099, "t": 574.88635, "r": 559.27539, "b": 581.39989, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "In", "bbox": {"l": 333.39099, "t": 582.85736, "r": 339.31223, "b": 589.3709, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "Proceedings of the 24th ACM SIGKDD International Conference on Knowledge", "bbox": {"l": 341.04901, "t": 582.89224, "r": 558.20081, "b": 589.37787, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "Discovery and Data Mining", "bbox": {"l": 333.39099, "t": 590.8622399999999, "r": 409.56577, "b": 597.3478700000001, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": ", KDD, pages 774-782. ACM, 2018.", "bbox": {"l": 409.56598, "t": 590.82736, "r": 507.31765999999993, "b": 597.3409, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "list_item", "bbox": {"l": 317.95499, "t": 598.79736, "r": 559.3783, "b": 613.28787, "coord_origin": "TOPLEFT"}, "confidence": 0.897297203540802, "cells": [{"id": 78, "text": "[23]", "bbox": {"l": 317.95499, "t": 598.79736, "r": 329.37976, "b": 605.3109, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "Connor Shorten and Taghi M. Khoshgoftaar. A survey on image data augmenta-", "bbox": {"l": 331.11923, "t": 598.79736, "r": 559.3783, "b": 605.3109, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "tion for deep learning.", "bbox": {"l": 333.39099, "t": 606.76736, "r": 396.9223, "b": 613.2809, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Journal of Big Data", "bbox": {"l": 399.43298, "t": 606.80225, "r": 453.66122, "b": 613.28787, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": ", 6(1):60, 2019.", "bbox": {"l": 453.66199, "t": 606.76736, "r": 493.49631, "b": 613.2809, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_header", "id": 13, "page_no": 8, "cluster": {"id": 13, "label": "page_header", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.8021692037582397, "cells": [{"id": 0, "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis"}, {"label": "page_header", "id": 9, "page_no": 8, "cluster": {"id": 9, "label": "page_header", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.8429245352745056, "cells": [{"id": 1, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA"}, {"label": "picture", "id": 12, "page_no": 8, "cluster": {"id": 12, "label": "picture", "bbox": {"l": 52.963985443115234, "t": 84.73583984375, "r": 556.931640625, "b": 442.1351013183594, "coord_origin": "TOPLEFT"}, "confidence": 0.8352117538452148, "cells": [{"id": 2, "text": "4bed2a8aa51ac37058e79605821bbc426d032b0b6ca8bdf3409ed8508ccd8c67", "bbox": {"l": 231.8804, "t": 301.50543, "r": 235.14504999999997, "b": 414.69144, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "2f2a06d08f5ad565d0f5e815f4ddf666365b2cff435cdaeb8850217e8a8efabf", "bbox": {"l": 395.06876, "t": 117.37183000000005, "r": 398.33353, "b": 230.55786, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "7f2fd7293e04bf4f1756ae51f5779764933da1d1d2002e3915356050570fc75b", "bbox": {"l": 55.775887, "t": 301.50543, "r": 59.04052000000001, "b": 414.69144, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "1b81cf65f47456ad4faa725d1eb09879bd633af16cfe2bf8cea661b87907bfac", "bbox": {"l": 232.01364, "t": 117.37183000000005, "r": 235.27841000000004, "b": 230.55786, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "b60da9d26f488cb133e47d101d35fda1bdca2671ade60764d1cd569590270327", "bbox": {"l": 395.20047, "t": 301.50543, "r": 398.46512, "b": 414.69144, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "2b7b8355a42ebef0cf91583aad9f30f7c9fa63c5b05911730ba15275c024965b$^{A}$", "bbox": {"l": 55.775818, "t": 117.37183000000005, "r": 65.409912, "b": 230.55786, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "B", "bbox": {"l": 234.56980999999996, "t": 88.50183000000015, "r": 240.06987, "b": 97.01098999999988, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "C", "bbox": {"l": 397.81934, "t": 88.89355, "r": 403.3194, "b": 97.40270999999996, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "D", "bbox": {"l": 59.909843, "t": 266.75885000000005, "r": 65.409912, "b": 275.26793999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "E", "bbox": {"l": 234.77386, "t": 266.36707, "r": 239.85495000000003, "b": 274.87616, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "F", "bbox": {"l": 398.26144, "t": 266.75885000000005, "r": 402.91592, "b": 275.26793999999995, "coord_origin": "TOPLEFT"}}], "children": [{"id": 17, "label": "text", "bbox": {"l": 231.8804, "t": 301.50543, "r": 235.14504999999997, "b": 414.69144, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 2, "text": "4bed2a8aa51ac37058e79605821bbc426d032b0b6ca8bdf3409ed8508ccd8c67", "bbox": {"l": 231.8804, "t": 301.50543, "r": 235.14504999999997, "b": 414.69144, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 395.06876, "t": 117.37183000000005, "r": 398.33353, "b": 230.55786, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 3, "text": "2f2a06d08f5ad565d0f5e815f4ddf666365b2cff435cdaeb8850217e8a8efabf", "bbox": {"l": 395.06876, "t": 117.37183000000005, "r": 398.33353, "b": 230.55786, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 55.775887, "t": 301.50543, "r": 59.04052000000001, "b": 414.69144, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 4, "text": "7f2fd7293e04bf4f1756ae51f5779764933da1d1d2002e3915356050570fc75b", "bbox": {"l": 55.775887, "t": 301.50543, "r": 59.04052000000001, "b": 414.69144, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 232.01364, "t": 117.37183000000005, "r": 235.27841000000004, "b": 230.55786, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 5, "text": "1b81cf65f47456ad4faa725d1eb09879bd633af16cfe2bf8cea661b87907bfac", "bbox": {"l": 232.01364, "t": 117.37183000000005, "r": 235.27841000000004, "b": 230.55786, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 395.20047, "t": 301.50543, "r": 398.46512, "b": 414.69144, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": "b60da9d26f488cb133e47d101d35fda1bdca2671ade60764d1cd569590270327", "bbox": {"l": 395.20047, "t": 301.50543, "r": 398.46512, "b": 414.69144, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 55.775818, "t": 117.37183000000005, "r": 65.409912, "b": 230.55786, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "2b7b8355a42ebef0cf91583aad9f30f7c9fa63c5b05911730ba15275c024965b$^{A}$", "bbox": {"l": 55.775818, "t": 117.37183000000005, "r": 65.409912, "b": 230.55786, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 234.56980999999996, "t": 88.50183000000015, "r": 240.06987, "b": 97.01098999999988, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "B", "bbox": {"l": 234.56980999999996, "t": 88.50183000000015, "r": 240.06987, "b": 97.01098999999988, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 397.81934, "t": 88.89355, "r": 403.3194, "b": 97.40270999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "C", "bbox": {"l": 397.81934, "t": 88.89355, "r": 403.3194, "b": 97.40270999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 59.909843, "t": 266.75885000000005, "r": 65.409912, "b": 275.26793999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "D", "bbox": {"l": 59.909843, "t": 266.75885000000005, "r": 65.409912, "b": 275.26793999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 234.77386, "t": 266.36707, "r": 239.85495000000003, "b": 274.87616, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "E", "bbox": {"l": 234.77386, "t": 266.36707, "r": 239.85495000000003, "b": 274.87616, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 398.26144, "t": 266.75885000000005, "r": 402.91592, "b": 275.26793999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "F", "bbox": {"l": 398.26144, "t": 266.75885000000005, "r": 402.91592, "b": 275.26793999999995, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "caption", "id": 16, "page_no": 8, "cluster": {"id": 16, "label": "caption", "bbox": {"l": 62.323874999999994, "t": 442.28543, "r": 318.50473, "b": 448.26483, "coord_origin": "TOPLEFT"}, "confidence": 0.6248988509178162, "cells": [{"id": 13, "text": "Text", "bbox": {"l": 62.323874999999994, "t": 442.28543, "r": 70.895882, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Caption", "bbox": {"l": 80.16581, "t": 442.28543, "r": 95.565453, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "List-Item", "bbox": {"l": 104.94447, "t": 442.28543, "r": 122.38113000000001, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Formula", "bbox": {"l": 131.78354, "t": 442.28543, "r": 148.34625, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "Table", "bbox": {"l": 157.66106, "t": 442.28543, "r": 168.53032, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Section-Header", "bbox": {"l": 201.24315, "t": 442.28543, "r": 232.00499, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Picture", "bbox": {"l": 177.8381, "t": 442.28543, "r": 191.88956, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Page-Header", "bbox": {"l": 240.95844000000002, "t": 442.28543, "r": 266.61908, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Page-Footer", "bbox": {"l": 276.03928, "t": 442.28543, "r": 300.33261, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "Title", "bbox": {"l": 309.74615, "t": 442.28543, "r": 318.50473, "b": 448.26483, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Text Caption List-Item Formula Table Section-Header Picture Page-Header Page-Footer Title"}, {"label": "text", "id": 4, "page_no": 8, "cluster": {"id": 4, "label": "text", "bbox": {"l": 53.79800000000001, "t": 464.48199, "r": 559.80786, "b": 505.83124, "coord_origin": "TOPLEFT"}, "confidence": 0.8651238679885864, "cells": [{"id": 23, "text": "Figure 6: Example layout predictions on selected pages from the DocLayNet test-set. (A, D) exhibit favourable results on", "bbox": {"l": 53.79800000000001, "t": 464.48199, "r": 558.203, "b": 472.95523, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "coloured backgrounds. (B, C) show accurate list-item and paragraph differentiation despite densely-spaced lines. (E) demon-", "bbox": {"l": 53.79800000000001, "t": 475.44101, "r": 559.80786, "b": 483.91425, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "strates good table and figure distinction. (F) shows predictions on a Chinese patent with multiple overlaps, label confusion", "bbox": {"l": 53.79800000000001, "t": 486.39999, "r": 558.20294, "b": 494.87323, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "and missing boxes.", "bbox": {"l": 53.79800000000001, "t": 497.358, "r": 130.37105, "b": 505.83124, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 6: Example layout predictions on selected pages from the DocLayNet test-set. (A, D) exhibit favourable results on coloured backgrounds. (B, C) show accurate list-item and paragraph differentiation despite densely-spaced lines. (E) demonstrates good table and figure distinction. (F) shows predictions on a Chinese patent with multiple overlaps, label confusion and missing boxes."}, {"label": "text", "id": 8, "page_no": 8, "cluster": {"id": 8, "label": "text", "bbox": {"l": 69.234001, "t": 527.06635, "r": 295.22406, "b": 549.5199, "coord_origin": "TOPLEFT"}, "confidence": 0.8445901870727539, "cells": [{"id": 27, "text": "Diaconu, Mai Thanh Minh, Marc, albinxavi, fatih, oleg, and wanghao yang. ul-", "bbox": {"l": 69.234001, "t": 527.06635, "r": 295.22406, "b": 533.5799, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "tralytics/yolov5: v6.0 - yolov5n nano models, roboflow integration, tensorflow", "bbox": {"l": 69.234001, "t": 535.03638, "r": 294.30612, "b": 541.5499, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "export, opencv dnn support, October 2021.", "bbox": {"l": 69.234001, "t": 543.00638, "r": 190.45259, "b": 549.5199, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Diaconu, Mai Thanh Minh, Marc, albinxavi, fatih, oleg, and wanghao yang. ultralytics/yolov5: v6.0 - yolov5n nano models, roboflow integration, tensorflow export, opencv dnn support, October 2021."}, {"label": "list_item", "id": 7, "page_no": 8, "cluster": {"id": 7, "label": "list_item", "bbox": {"l": 53.79800000000001, "t": 550.97638, "r": 295.12177, "b": 573.43686, "coord_origin": "TOPLEFT"}, "confidence": 0.8561118841171265, "cells": [{"id": 30, "text": "[14]", "bbox": {"l": 53.79800000000001, "t": 550.97638, "r": 65.286942, "b": 557.4899, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Nicolas Carion, Francisco Massa, Gabriel Synnaeve, Nicolas Usunier, Alexander", "bbox": {"l": 67.036171, "t": 550.97638, "r": 294.17709, "b": 557.4899, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Kirillov, and Sergey Zagoruyko. End-to-end object detection with transformers.", "bbox": {"l": 69.234001, "t": 558.94638, "r": 295.12177, "b": 565.4599000000001, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "CoRR", "bbox": {"l": 69.234001, "t": 566.95123, "r": 84.388069, "b": 573.43686, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": ", abs/2005.12872, 2020.", "bbox": {"l": 84.388, "t": 566.91635, "r": 147.7659, "b": 573.42989, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[14] Nicolas Carion, Francisco Massa, Gabriel Synnaeve, Nicolas Usunier, Alexander Kirillov, and Sergey Zagoruyko. End-to-end object detection with transformers. CoRR , abs/2005.12872, 2020."}, {"label": "list_item", "id": 5, "page_no": 8, "cluster": {"id": 5, "label": "list_item", "bbox": {"l": 53.79800000000001, "t": 574.88635, "r": 294.04224, "b": 589.37787, "coord_origin": "TOPLEFT"}, "confidence": 0.8615186810493469, "cells": [{"id": 35, "text": "[15]", "bbox": {"l": 53.79800000000001, "t": 574.88635, "r": 64.994034, "b": 581.39989, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Mingxing Tan, Ruoming Pang, and Quoc V. Le. Efficientdet: Scalable and efficient", "bbox": {"l": 66.698669, "t": 574.88635, "r": 294.04224, "b": 581.39989, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "object detection.", "bbox": {"l": 69.234001, "t": 582.85736, "r": 116.1049, "b": 589.3709, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "CoRR", "bbox": {"l": 118.616, "t": 582.89224, "r": 133.77007, "b": 589.37787, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": ", abs/1911.09070, 2019.", "bbox": {"l": 133.77, "t": 582.85736, "r": 197.14792, "b": 589.3709, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[15] Mingxing Tan, Ruoming Pang, and Quoc V. Le. Efficientdet: Scalable and efficient object detection. CoRR , abs/1911.09070, 2019."}, {"label": "list_item", "id": 6, "page_no": 8, "cluster": {"id": 6, "label": "list_item", "bbox": {"l": 53.79800399999999, "t": 590.82736, "r": 295.22263, "b": 613.2809, "coord_origin": "TOPLEFT"}, "confidence": 0.859420657157898, "cells": [{"id": 40, "text": "[16]", "bbox": {"l": 53.79800399999999, "t": 590.82736, "r": 65.110367, "b": 597.3409, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Tsung-Yi Lin, Michael Maire, Serge J. Belongie, Lubomir D. Bourdev, Ross B. Gir-", "bbox": {"l": 66.832718, "t": 590.82736, "r": 295.22263, "b": 597.3409, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "shick, James Hays, Pietro Perona, Deva Ramanan, Piotr Doll\u00e1r, and C. Lawrence", "bbox": {"l": 69.234001, "t": 598.79736, "r": 294.04462, "b": 605.3109, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Zitnick. Microsoft COCO: common objects in context, 2014.", "bbox": {"l": 69.234001, "t": 606.76736, "r": 239.71553000000003, "b": 613.2809, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[16] Tsung-Yi Lin, Michael Maire, Serge J. Belongie, Lubomir D. Bourdev, Ross B. Girshick, James Hays, Pietro Perona, Deva Ramanan, Piotr Doll\u00e1r, and C. Lawrence Zitnick. Microsoft COCO: common objects in context, 2014."}, {"label": "list_item", "id": 10, "page_no": 8, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 53.79800000000001, "t": 614.7373699999999, "r": 295.12009, "b": 629.22089, "coord_origin": "TOPLEFT"}, "confidence": 0.8385180234909058, "cells": [{"id": 44, "text": "[17]", "bbox": {"l": 53.79800000000001, "t": 614.7373699999999, "r": 65.177979, "b": 621.2509, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Yuxin Wu, Alexander Kirillov, Francisco Massa, Wan-Yen Lo, and Ross Girshick.", "bbox": {"l": 66.910622, "t": 614.7373699999999, "r": 295.12009, "b": 621.2509, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "Detectron2, 2019.", "bbox": {"l": 69.234001, "t": 622.70737, "r": 118.65732, "b": 629.22089, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[17] Yuxin Wu, Alexander Kirillov, Francisco Massa, Wan-Yen Lo, and Ross Girshick. Detectron2, 2019."}, {"label": "list_item", "id": 11, "page_no": 8, "cluster": {"id": 11, "label": "list_item", "bbox": {"l": 53.79800000000001, "t": 630.67737, "r": 294.8089, "b": 669.0718899999999, "coord_origin": "TOPLEFT"}, "confidence": 0.8362045288085938, "cells": [{"id": 47, "text": "[18]", "bbox": {"l": 53.79800000000001, "t": 630.67737, "r": 65.022064, "b": 637.19089, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Nikolaos Livathinos, Cesar Berrospi, Maksym Lysak, Viktor Kuropiatnyk, Ahmed", "bbox": {"l": 66.730972, "t": 630.67737, "r": 294.04224, "b": 637.19089, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "Nassar, Andre Carvalho, Michele Dolfi, Christoph Auer, Kasper Dinkla, and Peter", "bbox": {"l": 69.234001, "t": 638.64737, "r": 294.17896, "b": 645.16089, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "W.", "bbox": {"l": 68.900002, "t": 646.6173699999999, "r": 76.877083, "b": 653.13089, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "J. Staar. Robust pdf document conversion using recurrent neural networks. In", "bbox": {"l": 78.580124, "t": 646.6173699999999, "r": 294.04312, "b": 653.13089, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Proceedings of the 35th Conference on Artificial Intelligence", "bbox": {"l": 69.234001, "t": 654.62325, "r": 233.43309000000002, "b": 661.10887, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": ", AAAI, pages 15137-", "bbox": {"l": 233.43401000000003, "t": 654.58838, "r": 294.8089, "b": 661.1019, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "15145, feb 2021.", "bbox": {"l": 69.073997, "t": 662.55836, "r": 113.53197, "b": 669.0718899999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[18] Nikolaos Livathinos, Cesar Berrospi, Maksym Lysak, Viktor Kuropiatnyk, Ahmed Nassar, Andre Carvalho, Michele Dolfi, Christoph Auer, Kasper Dinkla, and Peter W. J. Staar. Robust pdf document conversion using recurrent neural networks. In Proceedings of the 35th Conference on Artificial Intelligence , AAAI, pages 1513715145, feb 2021."}, {"label": "list_item", "id": 14, "page_no": 8, "cluster": {"id": 14, "label": "list_item", "bbox": {"l": 53.797997, "t": 670.52837, "r": 295.22174, "b": 708.92189, "coord_origin": "TOPLEFT"}, "confidence": 0.7421635389328003, "cells": [{"id": 55, "text": "[19]", "bbox": {"l": 53.797997, "t": 670.52837, "r": 65.760811, "b": 677.04189, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Yiheng Xu, Minghao Li, Lei Cui, Shaohan Huang, Furu Wei, and Ming Zhou.", "bbox": {"l": 67.582199, "t": 670.52837, "r": 295.11609, "b": 677.04189, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Layoutlm: Pre-training of text and layout for document image understanding.", "bbox": {"l": 69.234001, "t": 678.49837, "r": 295.11606, "b": 685.01189, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "In", "bbox": {"l": 69.234001, "t": 686.46837, "r": 75.155228, "b": 692.981895, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Proceedings of the 26th ACM SIGKDD International Conference on Knowledge", "bbox": {"l": 76.891998, "t": 686.50323, "r": 294.04382, "b": 692.988869, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Discovery and Data Mining", "bbox": {"l": 69.234001, "t": 694.473236, "r": 144.91022, "b": 700.95887, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": ", KDD, pages 1192-1200, New York, USA, 2020. Asso-", "bbox": {"l": 144.908, "t": 694.4383700000001, "r": 295.22174, "b": 700.951897, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "ciation for Computing Machinery.", "bbox": {"l": 69.234001, "t": 702.408363, "r": 166.37207, "b": 708.92189, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[19] Yiheng Xu, Minghao Li, Lei Cui, Shaohan Huang, Furu Wei, and Ming Zhou. Layoutlm: Pre-training of text and layout for document image understanding. In Proceedings of the 26th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining , KDD, pages 1192-1200, New York, USA, 2020. Association for Computing Machinery."}, {"label": "list_item", "id": 1, "page_no": 8, "cluster": {"id": 1, "label": "list_item", "bbox": {"l": 317.95499, "t": 527.06638, "r": 559.02637, "b": 541.5499, "coord_origin": "TOPLEFT"}, "confidence": 0.9088895320892334, "cells": [{"id": 63, "text": "[20]", "bbox": {"l": 317.95499, "t": 527.06638, "r": 329.24017, "b": 533.57993, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "Shoubin Li, Xuyan Ma, Shuaiqun Pan, Jun Hu, Lin Shi, and Qing Wang. Vtlayout:", "bbox": {"l": 330.95837, "t": 527.06638, "r": 559.02637, "b": 533.57993, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "Fusion of visual and text features for document layout analysis, 2021.", "bbox": {"l": 333.39099, "t": 535.03638, "r": 530.03815, "b": 541.5499, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[20] Shoubin Li, Xuyan Ma, Shuaiqun Pan, Jun Hu, Lin Shi, and Qing Wang. Vtlayout: Fusion of visual and text features for document layout analysis, 2021."}, {"label": "list_item", "id": 0, "page_no": 8, "cluster": {"id": 0, "label": "list_item", "bbox": {"l": 317.95499, "t": 543.00638, "r": 558.9715, "b": 565.4599000000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9247176647186279, "cells": [{"id": 66, "text": "[21]", "bbox": {"l": 317.95499, "t": 543.00638, "r": 329.54419, "b": 549.5199, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "Peng Zhang, Can Li, Liang Qiao, Zhanzhan Cheng, Shiliang Pu, Yi Niu, and Fei", "bbox": {"l": 331.30869, "t": 543.00638, "r": 558.20135, "b": 549.5199, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "Wu. Vsr: A unified framework for document layout analysis combining vision,", "bbox": {"l": 333.05701, "t": 550.97638, "r": 558.9715, "b": 557.4899, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "semantics and relations, 2021.", "bbox": {"l": 333.39099, "t": 558.94638, "r": 418.05988, "b": 565.4599000000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[21] Peng Zhang, Can Li, Liang Qiao, Zhanzhan Cheng, Shiliang Pu, Yi Niu, and Fei Wu. Vsr: A unified framework for document layout analysis combining vision, semantics and relations, 2021."}, {"label": "list_item", "id": 3, "page_no": 8, "cluster": {"id": 3, "label": "list_item", "bbox": {"l": 317.95499, "t": 566.91635, "r": 559.27539, "b": 597.3478700000001, "coord_origin": "TOPLEFT"}, "confidence": 0.8956935405731201, "cells": [{"id": 70, "text": "[22]", "bbox": {"l": 317.95499, "t": 566.91638, "r": 330.14108, "b": 573.4299, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Peter W J Staar, Michele Dolfi, Christoph Auer, and Costas Bekas.", "bbox": {"l": 331.99646, "t": 566.91638, "r": 531.54553, "b": 573.4299, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "Corpus", "bbox": {"l": 537.12946, "t": 566.91635, "r": 558.19897, "b": 573.42989, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "conversion service: A machine learning platform to ingest documents at scale.", "bbox": {"l": 333.39099, "t": 574.88635, "r": 559.27539, "b": 581.39989, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "In", "bbox": {"l": 333.39099, "t": 582.85736, "r": 339.31223, "b": 589.3709, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "Proceedings of the 24th ACM SIGKDD International Conference on Knowledge", "bbox": {"l": 341.04901, "t": 582.89224, "r": 558.20081, "b": 589.37787, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "Discovery and Data Mining", "bbox": {"l": 333.39099, "t": 590.8622399999999, "r": 409.56577, "b": 597.3478700000001, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": ", KDD, pages 774-782. ACM, 2018.", "bbox": {"l": 409.56598, "t": 590.82736, "r": 507.31765999999993, "b": 597.3409, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[22] Peter W J Staar, Michele Dolfi, Christoph Auer, and Costas Bekas. Corpus conversion service: A machine learning platform to ingest documents at scale. In Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining , KDD, pages 774-782. ACM, 2018."}, {"label": "list_item", "id": 2, "page_no": 8, "cluster": {"id": 2, "label": "list_item", "bbox": {"l": 317.95499, "t": 598.79736, "r": 559.3783, "b": 613.28787, "coord_origin": "TOPLEFT"}, "confidence": 0.897297203540802, "cells": [{"id": 78, "text": "[23]", "bbox": {"l": 317.95499, "t": 598.79736, "r": 329.37976, "b": 605.3109, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "Connor Shorten and Taghi M. Khoshgoftaar. A survey on image data augmenta-", "bbox": {"l": 331.11923, "t": 598.79736, "r": 559.3783, "b": 605.3109, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "tion for deep learning.", "bbox": {"l": 333.39099, "t": 606.76736, "r": 396.9223, "b": 613.2809, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Journal of Big Data", "bbox": {"l": 399.43298, "t": 606.80225, "r": 453.66122, "b": 613.28787, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": ", 6(1):60, 2019.", "bbox": {"l": 453.66199, "t": 606.76736, "r": 493.49631, "b": 613.2809, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[23] Connor Shorten and Taghi M. Khoshgoftaar. A survey on image data augmentation for deep learning. Journal of Big Data , 6(1):60, 2019."}], "body": [{"label": "picture", "id": 12, "page_no": 8, "cluster": {"id": 12, "label": "picture", "bbox": {"l": 52.963985443115234, "t": 84.73583984375, "r": 556.931640625, "b": 442.1351013183594, "coord_origin": "TOPLEFT"}, "confidence": 0.8352117538452148, "cells": [{"id": 2, "text": "4bed2a8aa51ac37058e79605821bbc426d032b0b6ca8bdf3409ed8508ccd8c67", "bbox": {"l": 231.8804, "t": 301.50543, "r": 235.14504999999997, "b": 414.69144, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "2f2a06d08f5ad565d0f5e815f4ddf666365b2cff435cdaeb8850217e8a8efabf", "bbox": {"l": 395.06876, "t": 117.37183000000005, "r": 398.33353, "b": 230.55786, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "7f2fd7293e04bf4f1756ae51f5779764933da1d1d2002e3915356050570fc75b", "bbox": {"l": 55.775887, "t": 301.50543, "r": 59.04052000000001, "b": 414.69144, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "1b81cf65f47456ad4faa725d1eb09879bd633af16cfe2bf8cea661b87907bfac", "bbox": {"l": 232.01364, "t": 117.37183000000005, "r": 235.27841000000004, "b": 230.55786, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "b60da9d26f488cb133e47d101d35fda1bdca2671ade60764d1cd569590270327", "bbox": {"l": 395.20047, "t": 301.50543, "r": 398.46512, "b": 414.69144, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "2b7b8355a42ebef0cf91583aad9f30f7c9fa63c5b05911730ba15275c024965b$^{A}$", "bbox": {"l": 55.775818, "t": 117.37183000000005, "r": 65.409912, "b": 230.55786, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "B", "bbox": {"l": 234.56980999999996, "t": 88.50183000000015, "r": 240.06987, "b": 97.01098999999988, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "C", "bbox": {"l": 397.81934, "t": 88.89355, "r": 403.3194, "b": 97.40270999999996, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "D", "bbox": {"l": 59.909843, "t": 266.75885000000005, "r": 65.409912, "b": 275.26793999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "E", "bbox": {"l": 234.77386, "t": 266.36707, "r": 239.85495000000003, "b": 274.87616, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "F", "bbox": {"l": 398.26144, "t": 266.75885000000005, "r": 402.91592, "b": 275.26793999999995, "coord_origin": "TOPLEFT"}}], "children": [{"id": 17, "label": "text", "bbox": {"l": 231.8804, "t": 301.50543, "r": 235.14504999999997, "b": 414.69144, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 2, "text": "4bed2a8aa51ac37058e79605821bbc426d032b0b6ca8bdf3409ed8508ccd8c67", "bbox": {"l": 231.8804, "t": 301.50543, "r": 235.14504999999997, "b": 414.69144, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 395.06876, "t": 117.37183000000005, "r": 398.33353, "b": 230.55786, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 3, "text": "2f2a06d08f5ad565d0f5e815f4ddf666365b2cff435cdaeb8850217e8a8efabf", "bbox": {"l": 395.06876, "t": 117.37183000000005, "r": 398.33353, "b": 230.55786, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 55.775887, "t": 301.50543, "r": 59.04052000000001, "b": 414.69144, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 4, "text": "7f2fd7293e04bf4f1756ae51f5779764933da1d1d2002e3915356050570fc75b", "bbox": {"l": 55.775887, "t": 301.50543, "r": 59.04052000000001, "b": 414.69144, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 232.01364, "t": 117.37183000000005, "r": 235.27841000000004, "b": 230.55786, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 5, "text": "1b81cf65f47456ad4faa725d1eb09879bd633af16cfe2bf8cea661b87907bfac", "bbox": {"l": 232.01364, "t": 117.37183000000005, "r": 235.27841000000004, "b": 230.55786, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 395.20047, "t": 301.50543, "r": 398.46512, "b": 414.69144, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": "b60da9d26f488cb133e47d101d35fda1bdca2671ade60764d1cd569590270327", "bbox": {"l": 395.20047, "t": 301.50543, "r": 398.46512, "b": 414.69144, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 55.775818, "t": 117.37183000000005, "r": 65.409912, "b": 230.55786, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "2b7b8355a42ebef0cf91583aad9f30f7c9fa63c5b05911730ba15275c024965b$^{A}$", "bbox": {"l": 55.775818, "t": 117.37183000000005, "r": 65.409912, "b": 230.55786, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 234.56980999999996, "t": 88.50183000000015, "r": 240.06987, "b": 97.01098999999988, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "B", "bbox": {"l": 234.56980999999996, "t": 88.50183000000015, "r": 240.06987, "b": 97.01098999999988, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 397.81934, "t": 88.89355, "r": 403.3194, "b": 97.40270999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "C", "bbox": {"l": 397.81934, "t": 88.89355, "r": 403.3194, "b": 97.40270999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 59.909843, "t": 266.75885000000005, "r": 65.409912, "b": 275.26793999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "D", "bbox": {"l": 59.909843, "t": 266.75885000000005, "r": 65.409912, "b": 275.26793999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 234.77386, "t": 266.36707, "r": 239.85495000000003, "b": 274.87616, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "E", "bbox": {"l": 234.77386, "t": 266.36707, "r": 239.85495000000003, "b": 274.87616, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 398.26144, "t": 266.75885000000005, "r": 402.91592, "b": 275.26793999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "F", "bbox": {"l": 398.26144, "t": 266.75885000000005, "r": 402.91592, "b": 275.26793999999995, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "caption", "id": 16, "page_no": 8, "cluster": {"id": 16, "label": "caption", "bbox": {"l": 62.323874999999994, "t": 442.28543, "r": 318.50473, "b": 448.26483, "coord_origin": "TOPLEFT"}, "confidence": 0.6248988509178162, "cells": [{"id": 13, "text": "Text", "bbox": {"l": 62.323874999999994, "t": 442.28543, "r": 70.895882, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Caption", "bbox": {"l": 80.16581, "t": 442.28543, "r": 95.565453, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "List-Item", "bbox": {"l": 104.94447, "t": 442.28543, "r": 122.38113000000001, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Formula", "bbox": {"l": 131.78354, "t": 442.28543, "r": 148.34625, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "Table", "bbox": {"l": 157.66106, "t": 442.28543, "r": 168.53032, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Section-Header", "bbox": {"l": 201.24315, "t": 442.28543, "r": 232.00499, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Picture", "bbox": {"l": 177.8381, "t": 442.28543, "r": 191.88956, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Page-Header", "bbox": {"l": 240.95844000000002, "t": 442.28543, "r": 266.61908, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Page-Footer", "bbox": {"l": 276.03928, "t": 442.28543, "r": 300.33261, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "Title", "bbox": {"l": 309.74615, "t": 442.28543, "r": 318.50473, "b": 448.26483, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Text Caption List-Item Formula Table Section-Header Picture Page-Header Page-Footer Title"}, {"label": "text", "id": 4, "page_no": 8, "cluster": {"id": 4, "label": "text", "bbox": {"l": 53.79800000000001, "t": 464.48199, "r": 559.80786, "b": 505.83124, "coord_origin": "TOPLEFT"}, "confidence": 0.8651238679885864, "cells": [{"id": 23, "text": "Figure 6: Example layout predictions on selected pages from the DocLayNet test-set. (A, D) exhibit favourable results on", "bbox": {"l": 53.79800000000001, "t": 464.48199, "r": 558.203, "b": 472.95523, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "coloured backgrounds. (B, C) show accurate list-item and paragraph differentiation despite densely-spaced lines. (E) demon-", "bbox": {"l": 53.79800000000001, "t": 475.44101, "r": 559.80786, "b": 483.91425, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "strates good table and figure distinction. (F) shows predictions on a Chinese patent with multiple overlaps, label confusion", "bbox": {"l": 53.79800000000001, "t": 486.39999, "r": 558.20294, "b": 494.87323, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "and missing boxes.", "bbox": {"l": 53.79800000000001, "t": 497.358, "r": 130.37105, "b": 505.83124, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 6: Example layout predictions on selected pages from the DocLayNet test-set. (A, D) exhibit favourable results on coloured backgrounds. (B, C) show accurate list-item and paragraph differentiation despite densely-spaced lines. (E) demonstrates good table and figure distinction. (F) shows predictions on a Chinese patent with multiple overlaps, label confusion and missing boxes."}, {"label": "text", "id": 8, "page_no": 8, "cluster": {"id": 8, "label": "text", "bbox": {"l": 69.234001, "t": 527.06635, "r": 295.22406, "b": 549.5199, "coord_origin": "TOPLEFT"}, "confidence": 0.8445901870727539, "cells": [{"id": 27, "text": "Diaconu, Mai Thanh Minh, Marc, albinxavi, fatih, oleg, and wanghao yang. ul-", "bbox": {"l": 69.234001, "t": 527.06635, "r": 295.22406, "b": 533.5799, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "tralytics/yolov5: v6.0 - yolov5n nano models, roboflow integration, tensorflow", "bbox": {"l": 69.234001, "t": 535.03638, "r": 294.30612, "b": 541.5499, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "export, opencv dnn support, October 2021.", "bbox": {"l": 69.234001, "t": 543.00638, "r": 190.45259, "b": 549.5199, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Diaconu, Mai Thanh Minh, Marc, albinxavi, fatih, oleg, and wanghao yang. ultralytics/yolov5: v6.0 - yolov5n nano models, roboflow integration, tensorflow export, opencv dnn support, October 2021."}, {"label": "list_item", "id": 7, "page_no": 8, "cluster": {"id": 7, "label": "list_item", "bbox": {"l": 53.79800000000001, "t": 550.97638, "r": 295.12177, "b": 573.43686, "coord_origin": "TOPLEFT"}, "confidence": 0.8561118841171265, "cells": [{"id": 30, "text": "[14]", "bbox": {"l": 53.79800000000001, "t": 550.97638, "r": 65.286942, "b": 557.4899, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Nicolas Carion, Francisco Massa, Gabriel Synnaeve, Nicolas Usunier, Alexander", "bbox": {"l": 67.036171, "t": 550.97638, "r": 294.17709, "b": 557.4899, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Kirillov, and Sergey Zagoruyko. End-to-end object detection with transformers.", "bbox": {"l": 69.234001, "t": 558.94638, "r": 295.12177, "b": 565.4599000000001, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "CoRR", "bbox": {"l": 69.234001, "t": 566.95123, "r": 84.388069, "b": 573.43686, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": ", abs/2005.12872, 2020.", "bbox": {"l": 84.388, "t": 566.91635, "r": 147.7659, "b": 573.42989, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[14] Nicolas Carion, Francisco Massa, Gabriel Synnaeve, Nicolas Usunier, Alexander Kirillov, and Sergey Zagoruyko. End-to-end object detection with transformers. CoRR , abs/2005.12872, 2020."}, {"label": "list_item", "id": 5, "page_no": 8, "cluster": {"id": 5, "label": "list_item", "bbox": {"l": 53.79800000000001, "t": 574.88635, "r": 294.04224, "b": 589.37787, "coord_origin": "TOPLEFT"}, "confidence": 0.8615186810493469, "cells": [{"id": 35, "text": "[15]", "bbox": {"l": 53.79800000000001, "t": 574.88635, "r": 64.994034, "b": 581.39989, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Mingxing Tan, Ruoming Pang, and Quoc V. Le. Efficientdet: Scalable and efficient", "bbox": {"l": 66.698669, "t": 574.88635, "r": 294.04224, "b": 581.39989, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "object detection.", "bbox": {"l": 69.234001, "t": 582.85736, "r": 116.1049, "b": 589.3709, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "CoRR", "bbox": {"l": 118.616, "t": 582.89224, "r": 133.77007, "b": 589.37787, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": ", abs/1911.09070, 2019.", "bbox": {"l": 133.77, "t": 582.85736, "r": 197.14792, "b": 589.3709, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[15] Mingxing Tan, Ruoming Pang, and Quoc V. Le. Efficientdet: Scalable and efficient object detection. CoRR , abs/1911.09070, 2019."}, {"label": "list_item", "id": 6, "page_no": 8, "cluster": {"id": 6, "label": "list_item", "bbox": {"l": 53.79800399999999, "t": 590.82736, "r": 295.22263, "b": 613.2809, "coord_origin": "TOPLEFT"}, "confidence": 0.859420657157898, "cells": [{"id": 40, "text": "[16]", "bbox": {"l": 53.79800399999999, "t": 590.82736, "r": 65.110367, "b": 597.3409, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Tsung-Yi Lin, Michael Maire, Serge J. Belongie, Lubomir D. Bourdev, Ross B. Gir-", "bbox": {"l": 66.832718, "t": 590.82736, "r": 295.22263, "b": 597.3409, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "shick, James Hays, Pietro Perona, Deva Ramanan, Piotr Doll\u00e1r, and C. Lawrence", "bbox": {"l": 69.234001, "t": 598.79736, "r": 294.04462, "b": 605.3109, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Zitnick. Microsoft COCO: common objects in context, 2014.", "bbox": {"l": 69.234001, "t": 606.76736, "r": 239.71553000000003, "b": 613.2809, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[16] Tsung-Yi Lin, Michael Maire, Serge J. Belongie, Lubomir D. Bourdev, Ross B. Girshick, James Hays, Pietro Perona, Deva Ramanan, Piotr Doll\u00e1r, and C. Lawrence Zitnick. Microsoft COCO: common objects in context, 2014."}, {"label": "list_item", "id": 10, "page_no": 8, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 53.79800000000001, "t": 614.7373699999999, "r": 295.12009, "b": 629.22089, "coord_origin": "TOPLEFT"}, "confidence": 0.8385180234909058, "cells": [{"id": 44, "text": "[17]", "bbox": {"l": 53.79800000000001, "t": 614.7373699999999, "r": 65.177979, "b": 621.2509, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Yuxin Wu, Alexander Kirillov, Francisco Massa, Wan-Yen Lo, and Ross Girshick.", "bbox": {"l": 66.910622, "t": 614.7373699999999, "r": 295.12009, "b": 621.2509, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "Detectron2, 2019.", "bbox": {"l": 69.234001, "t": 622.70737, "r": 118.65732, "b": 629.22089, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[17] Yuxin Wu, Alexander Kirillov, Francisco Massa, Wan-Yen Lo, and Ross Girshick. Detectron2, 2019."}, {"label": "list_item", "id": 11, "page_no": 8, "cluster": {"id": 11, "label": "list_item", "bbox": {"l": 53.79800000000001, "t": 630.67737, "r": 294.8089, "b": 669.0718899999999, "coord_origin": "TOPLEFT"}, "confidence": 0.8362045288085938, "cells": [{"id": 47, "text": "[18]", "bbox": {"l": 53.79800000000001, "t": 630.67737, "r": 65.022064, "b": 637.19089, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Nikolaos Livathinos, Cesar Berrospi, Maksym Lysak, Viktor Kuropiatnyk, Ahmed", "bbox": {"l": 66.730972, "t": 630.67737, "r": 294.04224, "b": 637.19089, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "Nassar, Andre Carvalho, Michele Dolfi, Christoph Auer, Kasper Dinkla, and Peter", "bbox": {"l": 69.234001, "t": 638.64737, "r": 294.17896, "b": 645.16089, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "W.", "bbox": {"l": 68.900002, "t": 646.6173699999999, "r": 76.877083, "b": 653.13089, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "J. Staar. Robust pdf document conversion using recurrent neural networks. In", "bbox": {"l": 78.580124, "t": 646.6173699999999, "r": 294.04312, "b": 653.13089, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Proceedings of the 35th Conference on Artificial Intelligence", "bbox": {"l": 69.234001, "t": 654.62325, "r": 233.43309000000002, "b": 661.10887, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": ", AAAI, pages 15137-", "bbox": {"l": 233.43401000000003, "t": 654.58838, "r": 294.8089, "b": 661.1019, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "15145, feb 2021.", "bbox": {"l": 69.073997, "t": 662.55836, "r": 113.53197, "b": 669.0718899999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[18] Nikolaos Livathinos, Cesar Berrospi, Maksym Lysak, Viktor Kuropiatnyk, Ahmed Nassar, Andre Carvalho, Michele Dolfi, Christoph Auer, Kasper Dinkla, and Peter W. J. Staar. Robust pdf document conversion using recurrent neural networks. In Proceedings of the 35th Conference on Artificial Intelligence , AAAI, pages 1513715145, feb 2021."}, {"label": "list_item", "id": 14, "page_no": 8, "cluster": {"id": 14, "label": "list_item", "bbox": {"l": 53.797997, "t": 670.52837, "r": 295.22174, "b": 708.92189, "coord_origin": "TOPLEFT"}, "confidence": 0.7421635389328003, "cells": [{"id": 55, "text": "[19]", "bbox": {"l": 53.797997, "t": 670.52837, "r": 65.760811, "b": 677.04189, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Yiheng Xu, Minghao Li, Lei Cui, Shaohan Huang, Furu Wei, and Ming Zhou.", "bbox": {"l": 67.582199, "t": 670.52837, "r": 295.11609, "b": 677.04189, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Layoutlm: Pre-training of text and layout for document image understanding.", "bbox": {"l": 69.234001, "t": 678.49837, "r": 295.11606, "b": 685.01189, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "In", "bbox": {"l": 69.234001, "t": 686.46837, "r": 75.155228, "b": 692.981895, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Proceedings of the 26th ACM SIGKDD International Conference on Knowledge", "bbox": {"l": 76.891998, "t": 686.50323, "r": 294.04382, "b": 692.988869, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Discovery and Data Mining", "bbox": {"l": 69.234001, "t": 694.473236, "r": 144.91022, "b": 700.95887, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": ", KDD, pages 1192-1200, New York, USA, 2020. Asso-", "bbox": {"l": 144.908, "t": 694.4383700000001, "r": 295.22174, "b": 700.951897, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "ciation for Computing Machinery.", "bbox": {"l": 69.234001, "t": 702.408363, "r": 166.37207, "b": 708.92189, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[19] Yiheng Xu, Minghao Li, Lei Cui, Shaohan Huang, Furu Wei, and Ming Zhou. Layoutlm: Pre-training of text and layout for document image understanding. In Proceedings of the 26th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining , KDD, pages 1192-1200, New York, USA, 2020. Association for Computing Machinery."}, {"label": "list_item", "id": 1, "page_no": 8, "cluster": {"id": 1, "label": "list_item", "bbox": {"l": 317.95499, "t": 527.06638, "r": 559.02637, "b": 541.5499, "coord_origin": "TOPLEFT"}, "confidence": 0.9088895320892334, "cells": [{"id": 63, "text": "[20]", "bbox": {"l": 317.95499, "t": 527.06638, "r": 329.24017, "b": 533.57993, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "Shoubin Li, Xuyan Ma, Shuaiqun Pan, Jun Hu, Lin Shi, and Qing Wang. Vtlayout:", "bbox": {"l": 330.95837, "t": 527.06638, "r": 559.02637, "b": 533.57993, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "Fusion of visual and text features for document layout analysis, 2021.", "bbox": {"l": 333.39099, "t": 535.03638, "r": 530.03815, "b": 541.5499, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[20] Shoubin Li, Xuyan Ma, Shuaiqun Pan, Jun Hu, Lin Shi, and Qing Wang. Vtlayout: Fusion of visual and text features for document layout analysis, 2021."}, {"label": "list_item", "id": 0, "page_no": 8, "cluster": {"id": 0, "label": "list_item", "bbox": {"l": 317.95499, "t": 543.00638, "r": 558.9715, "b": 565.4599000000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9247176647186279, "cells": [{"id": 66, "text": "[21]", "bbox": {"l": 317.95499, "t": 543.00638, "r": 329.54419, "b": 549.5199, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "Peng Zhang, Can Li, Liang Qiao, Zhanzhan Cheng, Shiliang Pu, Yi Niu, and Fei", "bbox": {"l": 331.30869, "t": 543.00638, "r": 558.20135, "b": 549.5199, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "Wu. Vsr: A unified framework for document layout analysis combining vision,", "bbox": {"l": 333.05701, "t": 550.97638, "r": 558.9715, "b": 557.4899, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "semantics and relations, 2021.", "bbox": {"l": 333.39099, "t": 558.94638, "r": 418.05988, "b": 565.4599000000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[21] Peng Zhang, Can Li, Liang Qiao, Zhanzhan Cheng, Shiliang Pu, Yi Niu, and Fei Wu. Vsr: A unified framework for document layout analysis combining vision, semantics and relations, 2021."}, {"label": "list_item", "id": 3, "page_no": 8, "cluster": {"id": 3, "label": "list_item", "bbox": {"l": 317.95499, "t": 566.91635, "r": 559.27539, "b": 597.3478700000001, "coord_origin": "TOPLEFT"}, "confidence": 0.8956935405731201, "cells": [{"id": 70, "text": "[22]", "bbox": {"l": 317.95499, "t": 566.91638, "r": 330.14108, "b": 573.4299, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Peter W J Staar, Michele Dolfi, Christoph Auer, and Costas Bekas.", "bbox": {"l": 331.99646, "t": 566.91638, "r": 531.54553, "b": 573.4299, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "Corpus", "bbox": {"l": 537.12946, "t": 566.91635, "r": 558.19897, "b": 573.42989, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "conversion service: A machine learning platform to ingest documents at scale.", "bbox": {"l": 333.39099, "t": 574.88635, "r": 559.27539, "b": 581.39989, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "In", "bbox": {"l": 333.39099, "t": 582.85736, "r": 339.31223, "b": 589.3709, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "Proceedings of the 24th ACM SIGKDD International Conference on Knowledge", "bbox": {"l": 341.04901, "t": 582.89224, "r": 558.20081, "b": 589.37787, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "Discovery and Data Mining", "bbox": {"l": 333.39099, "t": 590.8622399999999, "r": 409.56577, "b": 597.3478700000001, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": ", KDD, pages 774-782. ACM, 2018.", "bbox": {"l": 409.56598, "t": 590.82736, "r": 507.31765999999993, "b": 597.3409, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[22] Peter W J Staar, Michele Dolfi, Christoph Auer, and Costas Bekas. Corpus conversion service: A machine learning platform to ingest documents at scale. In Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining , KDD, pages 774-782. ACM, 2018."}, {"label": "list_item", "id": 2, "page_no": 8, "cluster": {"id": 2, "label": "list_item", "bbox": {"l": 317.95499, "t": 598.79736, "r": 559.3783, "b": 613.28787, "coord_origin": "TOPLEFT"}, "confidence": 0.897297203540802, "cells": [{"id": 78, "text": "[23]", "bbox": {"l": 317.95499, "t": 598.79736, "r": 329.37976, "b": 605.3109, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "Connor Shorten and Taghi M. Khoshgoftaar. A survey on image data augmenta-", "bbox": {"l": 331.11923, "t": 598.79736, "r": 559.3783, "b": 605.3109, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "tion for deep learning.", "bbox": {"l": 333.39099, "t": 606.76736, "r": 396.9223, "b": 613.2809, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Journal of Big Data", "bbox": {"l": 399.43298, "t": 606.80225, "r": 453.66122, "b": 613.28787, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": ", 6(1):60, 2019.", "bbox": {"l": 453.66199, "t": 606.76736, "r": 493.49631, "b": 613.2809, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[23] Connor Shorten and Taghi M. Khoshgoftaar. A survey on image data augmentation for deep learning. Journal of Big Data , 6(1):60, 2019."}], "headers": [{"label": "page_header", "id": 13, "page_no": 8, "cluster": {"id": 13, "label": "page_header", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.8021692037582397, "cells": [{"id": 0, "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis"}, {"label": "page_header", "id": 9, "page_no": 8, "cluster": {"id": 9, "label": "page_header", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.8429245352745056, "cells": [{"id": 1, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA"}]}}]
\ No newline at end of file
+[{"page_no": 0, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "DocLayNet: A Large Human-Annotated Dataset for", "bbox": {"l": 107.29999999999998, "t": 83.69470000000013, "r": 505.06195, "b": 99.67058999999995, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Document-Layout Analysis", "bbox": {"l": 200.117, "t": 103.6196900000001, "r": 411.88367, "b": 119.59558000000015, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Birgit Pfitzmann", "bbox": {"l": 102.06001, "t": 133.67236000000003, "r": 182.63805, "b": 144.83856000000003, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "IBM Research", "bbox": {"l": 114.29401000000001, "t": 147.02423, "r": 170.40337, "b": 156.32928000000004, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Rueschlikon, Switzerland", "bbox": {"l": 90.96701, "t": 158.97924999999998, "r": 193.73123, "b": 168.28430000000003, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "bpf@zurich.ibm.com", "bbox": {"l": 100.02301, "t": 170.93524000000002, "r": 184.67522, "b": 180.24030000000005, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Christoph Auer", "bbox": {"l": 268.62402, "t": 133.67236000000003, "r": 344.59933, "b": 144.83856000000003, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "IBM Research", "bbox": {"l": 278.44302, "t": 147.02423, "r": 334.55237, "b": 156.32928000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Rueschlikon, Switzerland", "bbox": {"l": 255.11602999999997, "t": 158.97924999999998, "r": 357.88025, "b": 168.28430000000003, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "cau@zurich.ibm.com", "bbox": {"l": 263.70404, "t": 170.93524000000002, "r": 349.29272, "b": 180.24030000000005, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Michele Dolfi", "bbox": {"l": 437.6930500000001, "t": 133.67236000000003, "r": 503.60208, "b": 144.83856000000003, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "IBM Research", "bbox": {"l": 442.59305000000006, "t": 147.02423, "r": 498.7023899999999, "b": 156.32928000000004, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Rueschlikon, Switzerland", "bbox": {"l": 419.26505, "t": 158.97924999999998, "r": 522.0293, "b": 168.28430000000003, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "dol@zurich.ibm.com", "bbox": {"l": 428.56104000000005, "t": 170.93524000000002, "r": 512.73505, "b": 180.24030000000005, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Ahmed S. Nassar", "bbox": {"l": 182.26804, "t": 192.05737, "r": 265.39255, "b": 203.22357, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "IBM Research", "bbox": {"l": 195.87103, "t": 205.40923999999995, "r": 251.98038999999997, "b": 214.71429, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Rueschlikon, Switzerland", "bbox": {"l": 172.54303, "t": 217.36425999999994, "r": 275.30725, "b": 226.66931, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "ahn@zurich.ibm.com", "bbox": {"l": 180.52803, "t": 229.32025, "r": 267.3222, "b": 238.62531, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Peter Staar", "bbox": {"l": 361.52802, "t": 192.05737, "r": 414.84821, "b": 203.22357, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "IBM Research", "bbox": {"l": 360.02002, "t": 205.40923999999995, "r": 416.12939, "b": 214.71429, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Rueschlikon, Switzerland", "bbox": {"l": 336.69302, "t": 217.36425999999994, "r": 439.45727999999997, "b": 226.66931, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "taa@zurich.ibm.com", "bbox": {"l": 346.20703, "t": 229.32025, "r": 429.94269, "b": 238.62531, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "ABSTRACT", "bbox": {"l": 53.798035, "t": 247.70288000000005, "r": 111.94354, "b": 258.01202, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Accurate document layout analysis is a key requirement for high-", "bbox": {"l": 53.484001, "t": 262.90454, "r": 295.55591, "b": 271.27917, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "quality PDF document conversion. With the recent availability of", "bbox": {"l": 53.79800000000001, "t": 273.86352999999997, "r": 294.04199, "b": 282.23816, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "public, large ground-truth datasets such as PubLayNet and DocBank,", "bbox": {"l": 53.79800000000001, "t": 284.82254, "r": 295.34586, "b": 293.19717, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "deep-learning models have proven to be very effective at layout", "bbox": {"l": 53.79800000000001, "t": 295.78152, "r": 294.04709, "b": 304.15616000000006, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "detection and segmentation. While these datasets are of adequate", "bbox": {"l": 53.79800000000001, "t": 306.74053999999995, "r": 294.04645, "b": 315.11517, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "size to train such models, they severely lack in layout variability", "bbox": {"l": 53.79800000000001, "t": 317.69952, "r": 294.27573, "b": 326.07416, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "since they are sourced from scientific article repositories such as", "bbox": {"l": 53.79800000000001, "t": 328.65854, "r": 294.04712, "b": 337.03317, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "PubMed and arXiv only. Consequently, the accuracy of the layout", "bbox": {"l": 53.79800000000001, "t": 339.61755, "r": 294.0437, "b": 347.99219, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "segmentation drops significantly when these models are applied", "bbox": {"l": 53.79800000000001, "t": 350.57654, "r": 294.04715, "b": 358.95117, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "on more challenging and diverse layouts. In this paper, we present", "bbox": {"l": 53.79800000000001, "t": 361.53455, "r": 294.04364, "b": 369.90918000000005, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "DocLayNet", "bbox": {"l": 53.79800000000001, "t": 372.53839, "r": 92.863388, "b": 380.87714000000005, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": ", a new, publicly available, document-layout annotation", "bbox": {"l": 92.863998, "t": 372.49353, "r": 294.04361, "b": 380.86816, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "dataset in COCO format. It contains 80863 manually annotated", "bbox": {"l": 53.79800000000001, "t": 383.45255, "r": 294.04718, "b": 391.82718, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "pages from diverse data sources to represent a wide variability in", "bbox": {"l": 53.79800000000001, "t": 394.41153, "r": 294.0437, "b": 402.78616, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "layouts. For each PDF page, the layout annotations provide labelled", "bbox": {"l": 53.79800000000001, "t": 405.37054, "r": 294.04535, "b": 413.74518, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "bounding-boxes with a choice of 11 distinct classes. DocLayNet", "bbox": {"l": 53.79800000000001, "t": 416.32953, "r": 294.04715, "b": 424.70416000000006, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "also provides a subset of double- and triple-annotated pages to", "bbox": {"l": 53.79800000000001, "t": 427.28853999999995, "r": 294.04712, "b": 435.66318, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "determine the inter-annotator agreement. In multiple experiments,", "bbox": {"l": 53.79800000000001, "t": 438.24753, "r": 295.03, "b": 446.62216, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "we provide baseline accuracy scores (in mAP) for a set of popular", "bbox": {"l": 53.466999, "t": 449.20654, "r": 294.21616, "b": 457.58118, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "object detection models. We also demonstrate that these models", "bbox": {"l": 53.79800000000001, "t": 460.16553, "r": 294.04712, "b": 468.54016, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "fall approximately 10% behind the inter-annotator agreement. Fur-", "bbox": {"l": 53.79800000000001, "t": 471.12354, "r": 295.56018, "b": 479.49817, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "thermore, we provide evidence that DocLayNet is of sufficient size.", "bbox": {"l": 53.79800000000001, "t": 482.08255, "r": 295.42783, "b": 490.45718, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Lastly, we compare models trained on PubLayNet, DocBank and", "bbox": {"l": 53.79800000000001, "t": 493.04153, "r": 294.04715, "b": 501.41617, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "DocLayNet, showing that layout predictions of the DocLayNet-", "bbox": {"l": 53.79800000000001, "t": 504.00055, "r": 295.55618, "b": 512.37518, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "trained models are more robust and thus the preferred choice for", "bbox": {"l": 53.79800000000001, "t": 514.95953, "r": 294.21643, "b": 523.33417, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "general-purpose document-layout analysis.", "bbox": {"l": 53.79800000000001, "t": 525.91855, "r": 212.05495, "b": 534.29318, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "CCS CONCEPTS", "bbox": {"l": 53.79800000000001, "t": 550.99692, "r": 134.81989, "b": 561.30602, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "\u2022", "bbox": {"l": 53.79800000000001, "t": 566.19957, "r": 56.945206000000006, "b": 574.57419, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Information systems", "bbox": {"l": 58.440002, "t": 566.0830100000001, "r": 142.4462, "b": 574.5562600000001, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "\u2192", "bbox": {"l": 143.938, "t": 566.36096, "r": 153.15099, "b": 574.43073, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Document structure", "bbox": {"l": 154.646, "t": 566.0830100000001, "r": 235.46015999999997, "b": 574.5562600000001, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "; \u2022", "bbox": {"l": 235.45700000000002, "t": 566.19955, "r": 242.17419, "b": 574.57417, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "Applied com-", "bbox": {"l": 243.66899, "t": 566.08299, "r": 297.85294, "b": 574.55624, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "puting", "bbox": {"l": 53.797989, "t": 577.0419899999999, "r": 80.661324, "b": 585.51524, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "\u2192", "bbox": {"l": 83.565987, "t": 577.3199500000001, "r": 92.778961, "b": 585.38971, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Document analysis", "bbox": {"l": 95.68399, "t": 577.0419899999999, "r": 173.91583, "b": 585.51524, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "; \u2022", "bbox": {"l": 173.916, "t": 577.15855, "r": 182.1272, "b": 585.53317, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Computing methodologies", "bbox": {"l": 185.032, "t": 577.0419899999999, "r": 294.0455, "b": 585.51524, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "\u2192", "bbox": {"l": 53.79800399999999, "t": 588.27895, "r": 63.01097899999999, "b": 596.34871, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "Machine learning", "bbox": {"l": 65.253006, "t": 588.00099, "r": 136.80487, "b": 596.47424, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": ";", "bbox": {"l": 136.80501, "t": 588.1175499999999, "r": 138.92108, "b": 596.49217, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "Computer vision", "bbox": {"l": 141.162, "t": 588.00099, "r": 209.60254, "b": 596.47424, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": ";", "bbox": {"l": 209.60201, "t": 588.1175499999999, "r": 211.71808, "b": 596.49217, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "Object detection", "bbox": {"l": 213.96001, "t": 588.16238, "r": 270.45728, "b": 596.50114, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": ";", "bbox": {"l": 270.48001, "t": 588.1175499999999, "r": 272.59607, "b": 596.49217, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "Permission to make digital or hard copies of part or all of this work for personal or", "bbox": {"l": 53.79800000000001, "t": 634.39838, "r": 294.17697, "b": 640.9119000000001, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "classroom use is granted without fee provided that copies are not made or distributed", "bbox": {"l": 53.79800000000001, "t": 642.36838, "r": 294.04443, "b": 648.8819, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "for profit or commercial advantage and that copies bear this notice and the full citation", "bbox": {"l": 53.79800000000001, "t": 650.33838, "r": 294.04498, "b": 656.8519, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "on the first page. Copyrights for third-party components of this work must be honored.", "bbox": {"l": 53.79800000000001, "t": 658.3083799999999, "r": 295.11798, "b": 664.8219, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "For all other uses, contact the owner/author(s).", "bbox": {"l": 53.79800000000001, "t": 666.27837, "r": 187.72285, "b": 672.79189, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 53.79800000000001, "t": 675.08023, "r": 197.86275, "b": 681.56586, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "\u00a9 2022 Copyright held by the owner/author(s).", "bbox": {"l": 53.317001, "t": 683.81236, "r": 186.74652, "b": 690.32589, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "ACM ISBN 978-1-4503-9385-0/22/08.", "bbox": {"l": 53.554001, "t": 691.78336, "r": 157.03125, "b": 698.29689, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "https://doi.org/10.1145/3534678.3539043", "bbox": {"l": 53.79800000000001, "t": 699.753365, "r": 166.94093, "b": 706.266891, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "13", "bbox": {"l": 327.86951, "t": 351.78085, "r": 330.41248, "b": 353.95465, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "USING THE VERTICAL TUBE -", "bbox": {"l": 327.83005, "t": 331.57268999999997, "r": 351.16092, "b": 333.31171, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "MODELS AY11230/11234", "bbox": {"l": 327.83005, "t": 333.18292, "r": 348.30536, "b": 334.92194, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "1.", "bbox": {"l": 327.83005, "t": 336.40439, "r": 329.05914, "b": 337.92606, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "The vertical tube can be used for", "bbox": {"l": 329.67368, "t": 336.40439, "r": 349.95349, "b": 337.92606, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "instructional viewing or to photograph", "bbox": {"l": 329.11752, "t": 337.83588, "r": 353.57977, "b": 339.35751000000005, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": " the image with a digital camera or a", "bbox": {"l": 327.77121, "t": 339.26736, "r": 352.4306, "b": 340.789, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": " micro TV unit", "bbox": {"l": 328.15176, "t": 340.69882, "r": 337.91086, "b": 342.22049, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "2.", "bbox": {"l": 327.8313, "t": 342.19043000000005, "r": 329.09155, "b": 343.71207, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Loosen the retention screw, then rotate ", "bbox": {"l": 329.72168, "t": 342.19043000000005, "r": 354.9267, "b": 343.71207, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": " the adjustment ring to change the ", "bbox": {"l": 327.8313, "t": 343.62192, "r": 351.66949, "b": 345.14355, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": " length of the vertical tube.", "bbox": {"l": 328.21185, "t": 345.05338, "r": 346.33179, "b": 346.57504, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "3.", "bbox": {"l": 327.83005, "t": 346.84680000000003, "r": 329.12726, "b": 348.36847, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "Make sure that both the images in", "bbox": {"l": 329.77588, "t": 346.84680000000003, "r": 351.18005, "b": 348.36847, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "OPERATION ", "bbox": {"l": 327.25311, "t": 254.94812000000002, "r": 350.07861, "b": 258.86096, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "(", "bbox": {"l": 350.07861, "t": 254.76782000000003, "r": 351.82651, "b": 258.68066, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "cont.", "bbox": {"l": 351.82651, "t": 254.94812000000002, "r": 360.85242, "b": 258.86096, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": ")", "bbox": {"l": 360.85242, "t": 254.76782000000003, "r": 362.60028, "b": 258.68066, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "SELECTING OBJECTIVE ", "bbox": {"l": 326.88037, "t": 263.49492999999995, "r": 345.84351, "b": 265.23395000000005, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "MAGNIFICATION", "bbox": {"l": 326.88037, "t": 265.10515999999996, "r": 340.54153, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "1.", "bbox": {"l": 326.88037, "t": 266.71533, "r": 328.31903, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "There are two objectives. The lower", "bbox": {"l": 329.03836, "t": 266.71533, "r": 354.21472, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": " magnification objective has a greater", "bbox": {"l": 326.88037, "t": 268.32556, "r": 355.19193, "b": 270.06458, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": " depth of field and view.", "bbox": {"l": 326.88037, "t": 269.93579, "r": 345.80057, "b": 271.6748, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "2.", "bbox": {"l": 326.88037, "t": 271.54602, "r": 328.33862, "b": 273.28503, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "In order to observe the specimen", "bbox": {"l": 329.06775, "t": 271.54602, "r": 352.39969, "b": 273.28503, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": " easily use the lower magnification", "bbox": {"l": 326.88037, "t": 273.15619000000004, "r": 352.90042, "b": 274.89526, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": " objective first. Then, by rotating the", "bbox": {"l": 326.88037, "t": 274.76642000000004, "r": 354.59546, "b": 276.50543000000005, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": " case, the magnification can be", "bbox": {"l": 326.88037, "t": 276.37665000000004, "r": 350.81885, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": " changed.", "bbox": {"l": 326.88037, "t": 277.98688000000004, "r": 335.46707, "b": 279.72589000000005, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "CHANGING THE INTERPUPILLARY ", "bbox": {"l": 326.88037, "t": 281.20728, "r": 354.57755, "b": 282.94632, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "DISTANCE", "bbox": {"l": 326.88037, "t": 282.81750000000005, "r": 335.1752, "b": 284.55652, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "1.", "bbox": {"l": 326.88037, "t": 284.4277, "r": 328.34784, "b": 286.16675, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "The distance between the observer's", "bbox": {"l": 329.08157, "t": 284.4277, "r": 354.76245, "b": 286.16675, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": " pupils is the interpupillary distance.", "bbox": {"l": 326.88037, "t": 286.03793, "r": 354.6499, "b": 287.77695, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "2.", "bbox": {"l": 326.88037, "t": 287.64813, "r": 328.25125, "b": 289.38718, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "To adjust the interpupillary distance", "bbox": {"l": 328.93671, "t": 287.64813, "r": 354.29825, "b": 289.38718, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": " rotate the prism caps until both eyes", "bbox": {"l": 326.88181, "t": 289.25836, "r": 355.02075, "b": 290.99738, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": " coincide with the image in the", "bbox": {"l": 326.88181, "t": 290.86855999999995, "r": 350.82028, "b": 292.6076, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": " eyepiece. ", "bbox": {"l": 326.88181, "t": 292.47879, "r": 336.2067, "b": 294.2178, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "FOCUSING", "bbox": {"l": 326.88181, "t": 295.69922, "r": 335.3941, "b": 297.43823, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "1.", "bbox": {"l": 326.88181, "t": 297.30942, "r": 328.34314, "b": 299.04846, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "Remove the lens protective cover.", "bbox": {"l": 329.07379, "t": 297.30942, "r": 353.18555, "b": 299.04846, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "2.", "bbox": {"l": 326.88324, "t": 298.91965, "r": 328.35919, "b": 300.65866, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "Place the specimen on the working", "bbox": {"l": 329.0972, "t": 298.91965, "r": 353.45065, "b": 300.65866, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": " stage.", "bbox": {"l": 326.88324, "t": 300.52985, "r": 333.32825, "b": 302.26889000000006, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "3.", "bbox": {"l": 326.88324, "t": 302.14008000000007, "r": 328.31296, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "Focus the specimen with the left eye", "bbox": {"l": 329.02783, "t": 302.14008000000007, "r": 354.76303, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": " first while turning the focus knob until", "bbox": {"l": 326.88324, "t": 303.75027, "r": 355.96307, "b": 305.48932, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": " the image appears clear and sharp.", "bbox": {"l": 326.88324, "t": 305.3605, "r": 354.46594, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "4.", "bbox": {"l": 326.88324, "t": 306.9707, "r": 328.25488, "b": 308.70975, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "Rotate the right eyepiece ring until the", "bbox": {"l": 328.9407, "t": 306.9707, "r": 356.37335, "b": 308.70975, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": " images in each eyepiece coincide and", "bbox": {"l": 326.88324, "t": 308.58093, "r": 355.38867, "b": 310.31995, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": " are sharp and clear.", "bbox": {"l": 326.88324, "t": 310.19113, "r": 343.17249, "b": 311.93018, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "CHANGING THE BULB", "bbox": {"l": 326.88324, "t": 313.41156, "r": 344.13388, "b": 315.15059999999994, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "1.", "bbox": {"l": 326.88324, "t": 315.02178999999995, "r": 328.37418, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "Disconnect the power cord.", "bbox": {"l": 329.11963, "t": 315.02178999999995, "r": 348.50162, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "2.", "bbox": {"l": 326.88324, "t": 316.63199, "r": 328.34061, "b": 318.37103, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "When the bulb is cool, remove the", "bbox": {"l": 329.06931, "t": 316.63199, "r": 353.11588, "b": 318.37103, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": " oblique illuminator cap and remove", "bbox": {"l": 326.88464, "t": 318.2422199999999, "r": 353.79517, "b": 319.9812299999999, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": " the halogen bulb with cap.", "bbox": {"l": 326.88464, "t": 319.85242000000005, "r": 348.02094, "b": 321.59146, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "3.", "bbox": {"l": 326.88464, "t": 321.46265, "r": 328.37512, "b": 323.20166, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "Replace with a new halogen bulb.", "bbox": {"l": 329.12036, "t": 321.46265, "r": 352.96808, "b": 323.20166, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "4.", "bbox": {"l": 326.88608, "t": 323.07285, "r": 328.36884, "b": 324.81189, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "Open the window in the base plate and", "bbox": {"l": 329.1102, "t": 323.07285, "r": 356.5412, "b": 324.81189, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": " replace the halogen lamp or ", "bbox": {"l": 326.88608, "t": 324.68307000000004, "r": 350.13828, "b": 326.42209, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": " fluorescent lamp of transmitted", "bbox": {"l": 326.88608, "t": 326.29327, "r": 351.59677, "b": 328.03232, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": " illuminator.", "bbox": {"l": 326.88608, "t": 327.9035, "r": 336.89197, "b": 329.64252, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "FOCUSING", "bbox": {"l": 358.42023, "t": 263.49492999999995, "r": 366.93256, "b": 265.23395000000005, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "1.", "bbox": {"l": 358.42023, "t": 265.10515999999996, "r": 359.89841, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "Turn the focusing knob away or toward", "bbox": {"l": 360.63751, "t": 265.10515999999996, "r": 387.98407, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": " you until a clear image is viewed.", "bbox": {"l": 358.42023, "t": 266.71533, "r": 384.58948, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "2.", "bbox": {"l": 358.42166, "t": 268.32556, "r": 359.78549, "b": 270.06458, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "If the image is unclear, adjust the", "bbox": {"l": 360.46741, "t": 268.32556, "r": 384.33441, "b": 270.06458, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": " height of the elevator up or down,", "bbox": {"l": 358.4231, "t": 269.93579, "r": 384.61502, "b": 271.6748, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": " then turn the focusing knob again.", "bbox": {"l": 358.4231, "t": 271.54602, "r": 385.38922, "b": 273.28503, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "ZOOM MAGNIFICATION", "bbox": {"l": 358.4231, "t": 274.76642000000004, "r": 377.35046, "b": 276.50543000000005, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "1.", "bbox": {"l": 358.4231, "t": 276.37665000000004, "r": 359.89429, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "Turn the zoom magnification knob to", "bbox": {"l": 360.62988, "t": 276.37665000000004, "r": 386.37589, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": " the desired magnification and field of", "bbox": {"l": 358.4231, "t": 277.98688000000004, "r": 386.78732, "b": 279.72589000000005, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": " view.", "bbox": {"l": 358.4231, "t": 279.59704999999997, "r": 364.16855, "b": 281.33609, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "2.", "bbox": {"l": 358.4231, "t": 281.20728, "r": 359.86777, "b": 282.94632, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "In most situations, it is recommended", "bbox": {"l": 360.59012, "t": 281.20728, "r": 387.31656, "b": 282.94632, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": " that you focus at the lowest ", "bbox": {"l": 358.4231, "t": 282.81750000000005, "r": 381.56656, "b": 284.55652, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": " magnification, then move to a higher", "bbox": {"l": 358.4231, "t": 284.4277, "r": 386.63403, "b": 286.16675, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": " magnification and re-focus as ", "bbox": {"l": 358.42453, "t": 286.03793, "r": 382.77115, "b": 287.77695, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": " necessary.", "bbox": {"l": 358.42453, "t": 287.64813, "r": 367.98694, "b": 289.38718, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "3.", "bbox": {"l": 358.42453, "t": 289.25836, "r": 359.80386, "b": 290.99738, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "If the image is not clear to both eyes", "bbox": {"l": 360.49353, "t": 289.25836, "r": 386.70093, "b": 290.99738, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": " at the same time, the diopter ring may", "bbox": {"l": 358.42453, "t": 290.86855999999995, "r": 388.03534, "b": 292.6076, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": " need adjustment.", "bbox": {"l": 358.42453, "t": 292.47879, "r": 373.13724, "b": 294.2178, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "DIOPTER RING ADJUSTMENT", "bbox": {"l": 358.42453, "t": 295.69922, "r": 381.74539, "b": 297.43823, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "1.", "bbox": {"l": 358.42453, "t": 297.30942, "r": 359.83682, "b": 299.04846, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "To adjust the eyepiece for viewing with", "bbox": {"l": 360.54297, "t": 297.30942, "r": 388.08289, "b": 299.04846, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": " or without eyeglasses and for ", "bbox": {"l": 358.42453, "t": 298.91965, "r": 382.73251, "b": 300.65866, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": " differences in acuity between the right", "bbox": {"l": 358.42453, "t": 300.52985, "r": 387.72266, "b": 302.26889000000006, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": " and left eyes, follow the following", "bbox": {"l": 358.42453, "t": 302.14008000000007, "r": 384.1991, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": " steps:", "bbox": {"l": 358.42453, "t": 303.75027, "r": 364.88672, "b": 305.48932, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "a.", "bbox": {"l": 358.42453, "t": 305.3605, "r": 359.95078, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "Observe an image through the left", "bbox": {"l": 361.47699, "t": 305.3605, "r": 386.65988, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": " eyepiece and bring a specific point", "bbox": {"l": 358.42453, "t": 306.9707, "r": 386.7634, "b": 308.70975, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": " into focus using the focus knob.", "bbox": {"l": 358.42453, "t": 308.58093, "r": 385.41354, "b": 310.31995, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "b.", "bbox": {"l": 358.42453, "t": 310.19113, "r": 359.93304, "b": 311.93018, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "By turning the diopter ring ", "bbox": {"l": 361.44156, "t": 310.19113, "r": 382.56085, "b": 311.93018, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": " adjustment for the left eyepiece,", "bbox": {"l": 358.42596, "t": 311.80136, "r": 385.4559, "b": 313.54037, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": " bring the same point into sharp", "bbox": {"l": 358.42596, "t": 313.41156, "r": 384.56122, "b": 315.15059999999994, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": " focus.", "bbox": {"l": 358.42596, "t": 315.02178999999995, "r": 366.74371, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": " c.Then bring the same point into", "bbox": {"l": 358.42596, "t": 316.63199, "r": 383.93884, "b": 318.37103, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": " focus through the right eyepiece", "bbox": {"l": 358.42596, "t": 318.2422199999999, "r": 385.69241, "b": 319.9812299999999, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": " by turning the right diopter ring.", "bbox": {"l": 358.42596, "t": 319.85242000000005, "r": 385.94861, "b": 321.59146, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": " d.With more than one viewer, each", "bbox": {"l": 358.42596, "t": 321.46265, "r": 385.54236, "b": 323.20166, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": " viewer should note their own", "bbox": {"l": 358.42596, "t": 323.07285, "r": 382.98718, "b": 324.81189, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": " diopter ring position for the left", "bbox": {"l": 358.42596, "t": 324.68307000000004, "r": 385.06448, "b": 326.42209, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": " and right eyepieces, then before", "bbox": {"l": 358.42596, "t": 326.29327, "r": 385.20682, "b": 328.03232, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": " viewing set the diopter ring", "bbox": {"l": 358.42596, "t": 327.9035, "r": 382.21964, "b": 329.64252, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": " adjustments to that setting.", "bbox": {"l": 358.42596, "t": 329.5137, "r": 382.63382, "b": 331.25275, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "CHANGING THE BULB", "bbox": {"l": 358.42596, "t": 332.73412999999994, "r": 375.67661, "b": 334.47317999999996, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "1.", "bbox": {"l": 358.42596, "t": 334.34436, "r": 359.90311, "b": 336.08337, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "Disconnect the power cord from the", "bbox": {"l": 360.64169, "t": 334.34436, "r": 385.75333, "b": 336.08337, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": " electrical outlet.", "bbox": {"l": 358.42596, "t": 335.95456, "r": 372.01416, "b": 337.6936, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "2.", "bbox": {"l": 358.42596, "t": 337.56479, "r": 359.88327, "b": 339.3038, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "When the bulb is cool, remove the", "bbox": {"l": 360.61191, "t": 337.56479, "r": 384.65726, "b": 339.3038, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": " oblique illuminator cap and remove", "bbox": {"l": 358.42596, "t": 339.17499, "r": 385.33649, "b": 340.9140300000001, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": " the halogen bulb with cap.", "bbox": {"l": 358.42596, "t": 340.78522, "r": 379.57224, "b": 342.52423, "coord_origin": "TOPLEFT"}}, {"id": 201, "text": "3.", "bbox": {"l": 358.4274, "t": 342.39542, "r": 359.91788, "b": 344.13446000000005, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": "Replace with a new halogen bulb.", "bbox": {"l": 360.66312, "t": 342.39542, "r": 384.5108, "b": 344.13446000000005, "coord_origin": "TOPLEFT"}}, {"id": 203, "text": "4.", "bbox": {"l": 358.42883, "t": 344.00565000000006, "r": 359.92792, "b": 345.74466, "coord_origin": "TOPLEFT"}}, {"id": 204, "text": "Open the window in the base plate", "bbox": {"l": 360.67746, "t": 344.00565000000006, "r": 385.41235, "b": 345.74466, "coord_origin": "TOPLEFT"}}, {"id": 205, "text": " and replace the halogen lamp or", "bbox": {"l": 358.42883, "t": 345.61584, "r": 383.2782, "b": 347.35489, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": " fluorescent lamp of transmitted", "bbox": {"l": 358.42883, "t": 347.22607, "r": 383.13953, "b": 348.96509, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": " illuminator.", "bbox": {"l": 358.42883, "t": 348.83627, "r": 368.43472, "b": 350.57532, "coord_origin": "TOPLEFT"}}, {"id": 208, "text": "Model AY11230", "bbox": {"l": 326.59567, "t": 261.14185, "r": 339.11377, "b": 262.88091999999995, "coord_origin": "TOPLEFT"}}, {"id": 209, "text": "Model AY11234", "bbox": {"l": 358.48605, "t": 261.14185, "r": 371.00415, "b": 262.88091999999995, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": "14", "bbox": {"l": 455.43533, "t": 351.77038999999996, "r": 457.97827000000007, "b": 353.94415, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "Objectives", "bbox": {"l": 408.24518, "t": 275.52673000000004, "r": 414.4234, "b": 276.96020999999996, "coord_origin": "TOPLEFT"}}, {"id": 212, "text": "Revolving Turret", "bbox": {"l": 409.39554, "t": 268.98235999999997, "r": 419.06677, "b": 270.41583, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "Coarse ", "bbox": {"l": 441.3895, "t": 279.12627999999995, "r": 445.87192, "b": 280.55975, "coord_origin": "TOPLEFT"}}, {"id": 214, "text": "Adjustment", "bbox": {"l": 441.3895, "t": 280.30609, "r": 448.22338999999994, "b": 281.7395900000001, "coord_origin": "TOPLEFT"}}, {"id": 215, "text": "Knob", "bbox": {"l": 441.3895, "t": 281.48593, "r": 444.40371999999996, "b": 282.91939999999994, "coord_origin": "TOPLEFT"}}, {"id": 216, "text": "MODEL AY11236", "bbox": {"l": 398.79288, "t": 254.94646999999998, "r": 428.91568, "b": 258.85931000000005, "coord_origin": "TOPLEFT"}}, {"id": 217, "text": "MICROSCOPE USAGE", "bbox": {"l": 398.32535, "t": 305.04291, "r": 435.93542, "b": 308.95572000000004, "coord_origin": "TOPLEFT"}}, {"id": 218, "text": "BARSKA Model AY11236 is a powerful fixed power compound ", "bbox": {"l": 398.08594, "t": 310.35892, "r": 453.72171, "b": 312.53271, "coord_origin": "TOPLEFT"}}, {"id": 219, "text": "microscope designed for biological studies such as specimen ", "bbox": {"l": 398.08594, "t": 312.50586, "r": 453.09939999999995, "b": 314.67966, "coord_origin": "TOPLEFT"}}, {"id": 220, "text": "examination. It can also be used for examining bacteria and", "bbox": {"l": 398.08594, "t": 314.6528, "r": 456.65246999999994, "b": 316.8266, "coord_origin": "TOPLEFT"}}, {"id": 221, "text": "for general clinical and medical studies and other scientific uses. ", "bbox": {"l": 398.08594, "t": 316.79977, "r": 456.73859000000004, "b": 318.97354, "coord_origin": "TOPLEFT"}}, {"id": 222, "text": "CONSTRUCTION", "bbox": {"l": 398.62399, "t": 320.42941, "r": 427.77472, "b": 324.34222000000005, "coord_origin": "TOPLEFT"}}, {"id": 223, "text": "BARSKA Model AY11236 is a fixed power compound microscope.", "bbox": {"l": 398.08594, "t": 326.46069000000006, "r": 456.02639999999997, "b": 328.63449, "coord_origin": "TOPLEFT"}}, {"id": 224, "text": "It is constructed with two optical paths at the same angle. It is ", "bbox": {"l": 398.08414, "t": 328.6076699999999, "r": 455.42238999999995, "b": 330.7814599999999, "coord_origin": "TOPLEFT"}}, {"id": 225, "text": "equipped with transmitted illumination. By using this instrument, ", "bbox": {"l": 398.08414, "t": 330.75461, "r": 457.39844, "b": 332.92841, "coord_origin": "TOPLEFT"}}, {"id": 226, "text": "the user can observe specimens at magnification from 40x to ", "bbox": {"l": 398.08414, "t": 332.90155, "r": 453.97745, "b": 335.07535000000007, "coord_origin": "TOPLEFT"}}, {"id": 227, "text": "1000x by selecting the desired objective lens. Coarse and fine ", "bbox": {"l": 398.08414, "t": 335.04852, "r": 454.70708999999994, "b": 337.22232, "coord_origin": "TOPLEFT"}}, {"id": 228, "text": "focus adjustments provide accuracy and image detail. The rotating ", "bbox": {"l": 398.08414, "t": 337.19547, "r": 458.90240000000006, "b": 339.36926, "coord_origin": "TOPLEFT"}}, {"id": 229, "text": "head allows the user to position the eyepieces for maximum ", "bbox": {"l": 398.08594, "t": 339.34241, "r": 453.0672, "b": 341.5162, "coord_origin": "TOPLEFT"}}, {"id": 230, "text": "viewing comfort and easy access to all adjustment knobs.", "bbox": {"l": 398.08594, "t": 341.48938, "r": 449.63113, "b": 343.66318, "coord_origin": "TOPLEFT"}}, {"id": 231, "text": "Model AY11236", "bbox": {"l": 422.10626, "t": 301.24191, "r": 434.62433000000004, "b": 302.98096, "coord_origin": "TOPLEFT"}}, {"id": 232, "text": "Fine ", "bbox": {"l": 442.01610999999997, "t": 283.08649, "r": 444.8817399999999, "b": 284.51996, "coord_origin": "TOPLEFT"}}, {"id": 233, "text": "Adjustment", "bbox": {"l": 442.01610999999997, "t": 284.2663, "r": 448.85001, "b": 285.69980000000004, "coord_origin": "TOPLEFT"}}, {"id": 234, "text": "Knob", "bbox": {"l": 442.01610999999997, "t": 285.44611, "r": 445.03033000000005, "b": 286.87961, "coord_origin": "TOPLEFT"}}, {"id": 235, "text": "Stage", "bbox": {"l": 408.00577, "t": 279.12579000000005, "r": 411.42212, "b": 280.5593, "coord_origin": "TOPLEFT"}}, {"id": 236, "text": "Condenser ", "bbox": {"l": 404.07172, "t": 280.9144299999999, "r": 410.77707, "b": 282.3479, "coord_origin": "TOPLEFT"}}, {"id": 237, "text": "Focusing", "bbox": {"l": 404.07172, "t": 282.09424, "r": 409.2157, "b": 283.52774, "coord_origin": "TOPLEFT"}}, {"id": 238, "text": "Knob", "bbox": {"l": 404.07172, "t": 283.27408, "r": 407.08594, "b": 284.7075500000001, "coord_origin": "TOPLEFT"}}, {"id": 239, "text": "Eyepiece", "bbox": {"l": 441.81281, "t": 262.32178, "r": 447.03702, "b": 263.75525000000005, "coord_origin": "TOPLEFT"}}, {"id": 240, "text": "Stand", "bbox": {"l": 437.34607, "t": 271.13025000000005, "r": 440.80496, "b": 272.56281, "coord_origin": "TOPLEFT"}}, {"id": 241, "text": "Lamp ", "bbox": {"l": 409.7164, "t": 284.40027, "r": 413.3768, "b": 285.83282, "coord_origin": "TOPLEFT"}}, {"id": 242, "text": "On/Off", "bbox": {"l": 409.7164, "t": 285.83163, "r": 413.68201, "b": 287.26416, "coord_origin": "TOPLEFT"}}, {"id": 243, "text": "Switch", "bbox": {"l": 409.7164, "t": 287.263, "r": 413.6337, "b": 288.69553, "coord_origin": "TOPLEFT"}}, {"id": 244, "text": "Lamp ", "bbox": {"l": 434.8712499999999, "t": 296.7153, "r": 438.53164999999996, "b": 298.14783, "coord_origin": "TOPLEFT"}}, {"id": 245, "text": "Power", "bbox": {"l": 439.52039, "t": 292.18307000000004, "r": 443.08768, "b": 293.61560000000003, "coord_origin": "TOPLEFT"}}, {"id": 246, "text": "Cord", "bbox": {"l": 439.52039, "t": 293.61444, "r": 442.29575, "b": 295.04697, "coord_origin": "TOPLEFT"}}, {"id": 247, "text": "Rotating Head", "bbox": {"l": 413.55829, "t": 264.66089, "r": 421.94913, "b": 266.09344, "coord_origin": "TOPLEFT"}}, {"id": 248, "text": "Stage Clip", "bbox": {"l": 441.84316999999993, "t": 286.90573, "r": 447.87585000000007, "b": 288.33826, "coord_origin": "TOPLEFT"}}, {"id": 249, "text": "Adjustment", "bbox": {"l": 441.84316999999993, "t": 288.3371, "r": 448.67252, "b": 289.76962000000003, "coord_origin": "TOPLEFT"}}, {"id": 250, "text": "Interpupillary Slide Adjustment", "bbox": {"l": 407.2403, "t": 259.86645999999996, "r": 425.79089, "b": 261.29895, "coord_origin": "TOPLEFT"}}, {"id": 251, "text": "Circling Minimums", "bbox": {"l": 449.10074000000003, "t": 378.66302, "r": 466.08835000000005, "b": 380.78412, "coord_origin": "TOPLEFT"}}, {"id": 252, "text": "7", "bbox": {"l": 449.10074000000003, "t": 383.2203999999999, "r": 449.64444, "b": 385.34148999999996, "coord_origin": "TOPLEFT"}}, {"id": 253, "text": "K H U H Z D V D F K D Q J H W R W K H 7 ( 5 3 6 F U L W H U L D L Q W K D W D \u1087H F W V F L U F O L Q J D U H D G L P H Q V L R Q E \\ H [ S D Q G L Q J W K H D U H D V W R S U R Y L G H ", "bbox": {"l": 450.18811, "t": 383.2203999999999, "r": 550.77124, "b": 385.34148999999996, "coord_origin": "TOPLEFT"}}, {"id": 254, "text": "improved obstacle protection. To indicate that the new criteria had been applied to a given procedure, a ", "bbox": {"l": 449.10074000000003, "t": 385.75732, "r": 536.14716, "b": 387.87842, "coord_origin": "TOPLEFT"}}, {"id": 255, "text": " is placed on ", "bbox": {"l": 538.31085, "t": 385.75732, "r": 549.49921, "b": 387.87842, "coord_origin": "TOPLEFT"}}, {"id": 256, "text": "the circling line of minimums. The new circling tables and explanatory information is located in the Legend of the TPP.", "bbox": {"l": 449.10074000000003, "t": 388.03601, "r": 547.58185, "b": 390.1571, "coord_origin": "TOPLEFT"}}, {"id": 257, "text": "7", "bbox": {"l": 449.10074000000003, "t": 393.2128000000001, "r": 449.6163, "b": 395.33386, "coord_origin": "TOPLEFT"}}, {"id": 258, "text": "K H D S S U R D F K H V X V L Q J V W D Q G D U G F L U F O L Q J D S S U R D F K D U H D V F D Q E H L G H Q W L \u00bf H G E \\ W K H D E V H Q F H R I W K H ", "bbox": {"l": 450.1319, "t": 393.2128000000001, "r": 529.53082, "b": 395.33386, "coord_origin": "TOPLEFT"}}, {"id": 259, "text": " on the circling line of ", "bbox": {"l": 532.05829, "t": 393.2128000000001, "r": 550.42261, "b": 395.33386, "coord_origin": "TOPLEFT"}}, {"id": 260, "text": "minima.", "bbox": {"l": 449.10074000000003, "t": 395.49149, "r": 455.74692, "b": 397.61255, "coord_origin": "TOPLEFT"}}, {"id": 261, "text": "$ S S O \\ 6 W D Q G D U G & L U F O L Q J $ S S U R D F K 0 D Q H X Y H U L Q J 5 D G L X V 7 D E O H ", "bbox": {"l": 449.95525999999995, "t": 415.59549, "r": 496.2829, "b": 417.50446, "coord_origin": "TOPLEFT"}}, {"id": 262, "text": "$ S S O \\ ( [ S D Q G H G & L U F O L Q J $ S S U R D F K 0 D Q H X Y H U L Q J $ L U V S D F H 5 D G L X V ", "bbox": {"l": 501.13077, "t": 409.25543, "r": 551.16101, "b": 411.1644, "coord_origin": "TOPLEFT"}}, {"id": 263, "text": "Table", "bbox": {"l": 501.13077, "t": 411.30624, "r": 505.2477999999999, "b": 413.21521, "coord_origin": "TOPLEFT"}}, {"id": 264, "text": "AIRPORT SKETCH", "bbox": {"l": 449.10074000000003, "t": 420.18802, "r": 469.35599, "b": 422.73331, "coord_origin": "TOPLEFT"}}, {"id": 265, "text": "The airport sketch is a depiction of the airport with emphasis on runway pattern and related ", "bbox": {"l": 449.10074000000003, "t": 425.08908, "r": 525.93616, "b": 427.21017, "coord_origin": "TOPLEFT"}}, {"id": 266, "text": "information, positioned in either the lower left or lower right corner of the chart to aid pi-", "bbox": {"l": 449.10074000000003, "t": 427.3678, "r": 522.0343, "b": 429.48886, "coord_origin": "TOPLEFT"}}, {"id": 267, "text": "lot recognition of the airport from the air and to provide some information to aid on ground ", "bbox": {"l": 449.10074000000003, "t": 429.64648, "r": 524.67151, "b": 431.76755, "coord_origin": "TOPLEFT"}}, {"id": 268, "text": "navigation of the airport. The runways are drawn to scale and oriented to true north. Runway ", "bbox": {"l": 449.10074000000003, "t": 431.92514000000006, "r": 527.172, "b": 434.04623, "coord_origin": "TOPLEFT"}}, {"id": 269, "text": "dimensions (length and width) are shown for all active runways.", "bbox": {"l": 449.10074000000003, "t": 434.20383, "r": 502.39545, "b": 436.32492, "coord_origin": "TOPLEFT"}}, {"id": 270, "text": "Runway(s) are depicted based on what type and construction of the runway.", "bbox": {"l": 449.10074000000003, "t": 438.7611999999999, "r": 512.92676, "b": 440.88228999999995, "coord_origin": "TOPLEFT"}}, {"id": 271, "text": "Hard Surface", "bbox": {"l": 449.95525999999995, "t": 444.07001, "r": 460.02307, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}, {"id": 272, "text": "Other Than ", "bbox": {"l": 464.89963, "t": 444.07001, "r": 473.98819, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}, {"id": 273, "text": "Hard Surface", "bbox": {"l": 464.89963, "t": 446.12085, "r": 474.96744, "b": 448.02979, "coord_origin": "TOPLEFT"}}, {"id": 274, "text": "Metal Surface", "bbox": {"l": 478.91357, "t": 444.07001, "r": 489.45648, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}, {"id": 275, "text": "Closed Runway", "bbox": {"l": 493.06420999999995, "t": 444.07001, "r": 505.03076, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}, {"id": 276, "text": "Under Construction", "bbox": {"l": 509.5809, "t": 444.07001, "r": 524.30237, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}, {"id": 277, "text": "Stopways, ", "bbox": {"l": 449.95525999999995, "t": 454.81207, "r": 458.31406, "b": 456.72104, "coord_origin": "TOPLEFT"}}, {"id": 278, "text": "Taxiways, Park-", "bbox": {"l": 449.95525999999995, "t": 456.86288, "r": 461.92083999999994, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}}, {"id": 279, "text": "ing Areas", "bbox": {"l": 449.95525999999995, "t": 458.91373, "r": 457.08014, "b": 460.82268999999997, "coord_origin": "TOPLEFT"}}, {"id": 280, "text": "Displaced ", "bbox": {"l": 464.89963, "t": 454.81207, "r": 472.87732, "b": 456.72104, "coord_origin": "TOPLEFT"}}, {"id": 281, "text": "Threshold", "bbox": {"l": 464.89963, "t": 456.86288, "r": 472.49792, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}}, {"id": 282, "text": "Closed", "bbox": {"l": 478.91357, "t": 454.81207, "r": 483.61584, "b": 456.72104, "coord_origin": "TOPLEFT"}}, {"id": 283, "text": "Pavement", "bbox": {"l": 478.91357, "t": 456.86288, "r": 486.60754000000003, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}}, {"id": 284, "text": "Water Runway", "bbox": {"l": 493.06420999999995, "t": 454.81207, "r": 504.20648, "b": 456.72104, "coord_origin": "TOPLEFT"}}, {"id": 285, "text": "Taxiways and aprons are shaded grey. Other runway features that may be shown are runway numbers, runway dimen-", "bbox": {"l": 449.10074000000003, "t": 469.32974, "r": 548.59674, "b": 471.45081, "coord_origin": "TOPLEFT"}}, {"id": 286, "text": "sions, runway slope, arresting gear, and displaced threshold.", "bbox": {"l": 449.10074000000003, "t": 471.60843, "r": 500.08181999999994, "b": 473.72949, "coord_origin": "TOPLEFT"}}, {"id": 287, "text": "2", "bbox": {"l": 449.10074000000003, "t": 476.16577, "r": 449.59933000000007, "b": 478.28687, "coord_origin": "TOPLEFT"}}, {"id": 288, "text": "W K H U L Q I R U P D W L R Q F R Q F H U Q L Q J O L J K W L Q J \u00bf Q D O D S S U R D F K E H D U L Q J V D L U S R U W E H D F R Q R E V W D F O H V F R Q W U R O W R Z H U 1 $ 9 $ , ' V K H O L ", "bbox": {"l": 450.09796, "t": 476.16577, "r": 547.82562, "b": 478.28687, "coord_origin": "TOPLEFT"}}, {"id": 289, "text": "-", "bbox": {"l": 547.82623, "t": 476.16577, "r": 548.45862, "b": 478.28687, "coord_origin": "TOPLEFT"}}, {"id": 290, "text": "pads may also be shown.", "bbox": {"l": 449.10074000000003, "t": 478.44446, "r": 470.52609000000007, "b": 480.56555, "coord_origin": "TOPLEFT"}}, {"id": 291, "text": "$ L U S R U W ( O H Y D W L R Q D Q G 7 R X F K G R Z Q = R Q H ( O H Y D W L R Q ", "bbox": {"l": 449.10074000000003, "t": 483.00183, "r": 493.37906000000004, "b": 485.12292, "coord_origin": "TOPLEFT"}}, {"id": 292, "text": "The airport elevation is shown enclosed within a box in the upper left corner of the sketch box and the touchdown zone ", "bbox": {"l": 449.10074000000003, "t": 487.5592, "r": 549.16168, "b": 489.6803, "coord_origin": "TOPLEFT"}}, {"id": 293, "text": "elevation (TDZE) is shown in the upper right corner of the sketch box. The airport elevation is the highest point of an ", "bbox": {"l": 449.10074000000003, "t": 489.83789, "r": 546.90881, "b": 491.95898, "coord_origin": "TOPLEFT"}}, {"id": 294, "text": "D L U S R U W \u00b6 V X V D E O H U X Q Z D \\ V P H D V X U H G L Q I H H W I U R P P H D Q V H D O H Y H O 7 K H 7 ' = ( L V W K H K L J K H V W H O H Y D W L R Q L Q W K H \u00bf U V W I H H W R I ", "bbox": {"l": 449.10074000000003, "t": 492.11658, "r": 551.80023, "b": 494.23767, "coord_origin": "TOPLEFT"}}, {"id": 295, "text": "the landing surface. Circling only approaches will not show a TDZE.", "bbox": {"l": 449.10074000000003, "t": 494.39526, "r": 505.85068000000007, "b": 496.51636, "coord_origin": "TOPLEFT"}}, {"id": 296, "text": "114", "bbox": {"l": 498.80661000000003, "t": 515.9437, "r": 502.08792, "b": 519.01764, "coord_origin": "TOPLEFT"}}, {"id": 297, "text": "FAA Chart Users\u2019 Guide - Terminal Procedures Publication (TPP) - Terms", "bbox": {"l": 444.56319999999994, "t": 422.84869, "r": 446.25998, "b": 471.87128, "coord_origin": "TOPLEFT"}}, {"id": 298, "text": "AGL 2013 Financial Calendar", "bbox": {"l": 329.40536, "t": 379.37537, "r": 355.13138, "b": 382.13336, "coord_origin": "TOPLEFT"}}, {"id": 299, "text": "22", "bbox": {"l": 329.40536, "t": 382.30273, "r": 330.96848, "b": 384.55927, "coord_origin": "TOPLEFT"}}, {"id": 300, "text": "August 2012 ", "bbox": {"l": 331.75003, "t": 382.30273, "r": 341.12875, "b": 384.55927, "coord_origin": "TOPLEFT"}}, {"id": 301, "text": "2012 full year result and fi nal dividend announced", "bbox": {"l": 350.4722, "t": 382.30273, "r": 384.81079, "b": 384.55927, "coord_origin": "TOPLEFT"}}, {"id": 302, "text": "30", "bbox": {"l": 329.40536, "t": 384.84552, "r": 330.97336, "b": 387.10205, "coord_origin": "TOPLEFT"}}, {"id": 303, "text": "August 2012 ", "bbox": {"l": 331.75735, "t": 384.84552, "r": 341.16534, "b": 387.10205, "coord_origin": "TOPLEFT"}}, {"id": 304, "text": "Ex-dividend trading commences", "bbox": {"l": 350.4722, "t": 384.84552, "r": 372.90613, "b": 387.10205, "coord_origin": "TOPLEFT"}}, {"id": 305, "text": "5", "bbox": {"l": 329.40536, "t": 387.38828, "r": 330.20337, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}}, {"id": 306, "text": "September 2012 ", "bbox": {"l": 331.00137, "t": 387.38828, "r": 342.9715, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}}, {"id": 307, "text": "Record date for 2012 fi nal dividend", "bbox": {"l": 350.4722, "t": 387.38828, "r": 374.88693, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}}, {"id": 308, "text": "27", "bbox": {"l": 329.40536, "t": 389.93103, "r": 331.0173, "b": 392.18762, "coord_origin": "TOPLEFT"}}, {"id": 309, "text": "September 2012 ", "bbox": {"l": 331.82327, "t": 389.93103, "r": 343.91284, "b": 392.18762, "coord_origin": "TOPLEFT"}}, {"id": 310, "text": "Final dividend payable", "bbox": {"l": 350.4722, "t": 389.93103, "r": 365.65988, "b": 392.18762, "coord_origin": "TOPLEFT"}}, {"id": 311, "text": "23", "bbox": {"l": 329.40536, "t": 392.47382, "r": 330.98804, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}}, {"id": 312, "text": "October 2012 ", "bbox": {"l": 331.77936, "t": 392.47382, "r": 342.06674, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}}, {"id": 313, "text": "Annual General Meeting", "bbox": {"l": 350.4722, "t": 392.47382, "r": 367.22156, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}}, {"id": 314, "text": "27", "bbox": {"l": 329.40536, "t": 395.0166, "r": 330.99741, "b": 397.27313, "coord_origin": "TOPLEFT"}}, {"id": 315, "text": "February 2013", "bbox": {"l": 331.7934, "t": 395.0166, "r": 342.1416, "b": 397.27313, "coord_origin": "TOPLEFT"}}, {"id": 316, "text": " 1", "bbox": {"l": 342.64841, "t": 395.18298, "r": 342.65811, "b": 396.49857000000003, "coord_origin": "TOPLEFT"}}, {"id": 317, "text": "2013 interim result and interim dividend announced", "bbox": {"l": 350.47177, "t": 395.01474, "r": 386.25897, "b": 397.2713, "coord_origin": "TOPLEFT"}}, {"id": 318, "text": "28", "bbox": {"l": 329.40491, "t": 397.55749999999995, "r": 331.02695, "b": 399.81406, "coord_origin": "TOPLEFT"}}, {"id": 319, "text": "August 2013", "bbox": {"l": 331.83795, "t": 397.55749999999995, "r": 340.75909, "b": 399.81406, "coord_origin": "TOPLEFT"}}, {"id": 320, "text": " 1", "bbox": {"l": 341.26437, "t": 397.7254, "r": 341.27408, "b": 399.04095, "coord_origin": "TOPLEFT"}}, {"id": 321, "text": "2013 full year results and fi nal dividend announced ", "bbox": {"l": 350.47144, "t": 397.55713, "r": 385.93265, "b": 399.81369, "coord_origin": "TOPLEFT"}}, {"id": 322, "text": "1", "bbox": {"l": 329.40536, "t": 400.46155, "r": 329.87708, "b": 401.96588, "coord_origin": "TOPLEFT"}}, {"id": 323, "text": "Indicative dates only, subject to change/Board confi rmation", "bbox": {"l": 330.34882, "t": 400.46155, "r": 358.65204, "b": 401.96588, "coord_origin": "TOPLEFT"}}, {"id": 324, "text": "AGL\u2019s Annual General Meeting will be held at the City Recital Hall, Angel Place, Sydney ", "bbox": {"l": 329.40536, "t": 404.34503, "r": 391.771, "b": 406.60156, "coord_origin": "TOPLEFT"}}, {"id": 325, "text": "commencing at 10.30am on Tuesday 23 October 2012.", "bbox": {"l": 329.40536, "t": 406.37857, "r": 369.65308, "b": 408.63513000000006, "coord_origin": "TOPLEFT"}}, {"id": 326, "text": "Ye s te rd ay", "bbox": {"l": 363.54486, "t": 460.53054999999995, "r": 379.25955, "b": 465.54507, "coord_origin": "TOPLEFT"}}, {"id": 327, "text": "Established in Sydney in 1837, and then ", "bbox": {"l": 363.54486, "t": 466.7157, "r": 391.38229, "b": 468.97223, "coord_origin": "TOPLEFT"}}, {"id": 328, "text": "known as The Australian Gas Light Company, ", "bbox": {"l": 363.54486, "t": 468.74924, "r": 395.01788, "b": 471.00577, "coord_origin": "TOPLEFT"}}, {"id": 329, "text": "the AGL business has an established history ", "bbox": {"l": 363.54486, "t": 470.78281, "r": 394.08322, "b": 473.03934, "coord_origin": "TOPLEFT"}}, {"id": 330, "text": "and reputation for serving the gas and ", "bbox": {"l": 363.54486, "t": 472.81635, "r": 390.60727, "b": 475.07288, "coord_origin": "TOPLEFT"}}, {"id": 331, "text": "electricity needs of Australian households. ", "bbox": {"l": 363.54486, "t": 474.84988, "r": 393.49612, "b": 477.10645, "coord_origin": "TOPLEFT"}}, {"id": 332, "text": "In 1841, when AGL supplied the gas to light ", "bbox": {"l": 363.54486, "t": 476.88345, "r": 394.11481, "b": 479.13998, "coord_origin": "TOPLEFT"}}, {"id": 333, "text": "the fi rst public street lamp, it was reported ", "bbox": {"l": 363.54486, "t": 478.91699, "r": 393.75891, "b": 481.17352, "coord_origin": "TOPLEFT"}}, {"id": 334, "text": "in the Sydney Gazette as a \u201cwonderful ", "bbox": {"l": 363.54486, "t": 480.95053, "r": 390.4975, "b": 483.20709, "coord_origin": "TOPLEFT"}}, {"id": 335, "text": "achievement of scientifi c knowledge, assisted ", "bbox": {"l": 363.54486, "t": 482.9841, "r": 395.70975, "b": 485.24063, "coord_origin": "TOPLEFT"}}, {"id": 336, "text": "by mechanical ingenuity.\u201d Within two years, ", "bbox": {"l": 363.54486, "t": 485.01764, "r": 394.27283, "b": 487.2742, "coord_origin": "TOPLEFT"}}, {"id": 337, "text": "165 gas lamps were lighting the City of Sydney.", "bbox": {"l": 363.54486, "t": 487.05121, "r": 396.65939, "b": 489.30774, "coord_origin": "TOPLEFT"}}, {"id": 338, "text": "Looking back on ", "bbox": {"l": 329.4054, "t": 419.93124, "r": 384.19696, "b": 431.09412, "coord_origin": "TOPLEFT"}}, {"id": 339, "text": "175 years of ", "bbox": {"l": 329.4054, "t": 430.10379, "r": 372.16626, "b": 441.26669, "coord_origin": "TOPLEFT"}}, {"id": 340, "text": "looking forward.", "bbox": {"l": 329.4054, "t": 440.27636999999993, "r": 385.3981, "b": 451.43924, "coord_origin": "TOPLEFT"}}, {"id": 341, "text": "AGL Energy Limited ABN 74 115 061 375", "bbox": {"l": 329.40536, "t": 372.16159, "r": 353.36179, "b": 373.91669, "coord_origin": "TOPLEFT"}}, {"id": 342, "text": "29", "bbox": {"l": 546.20587, "t": 360.90448, "r": 548.23407, "b": 362.82242, "coord_origin": "TOPLEFT"}}, {"id": 343, "text": "signs, signals and road markings", "bbox": {"l": 497.77728, "t": 251.43384000000003, "r": 542.8255, "b": 254.94385, "coord_origin": "TOPLEFT"}}, {"id": 344, "text": "3", "bbox": {"l": 490.30679, "t": 251.47478999999998, "r": 492.09982, "b": 254.98479999999995, "coord_origin": "TOPLEFT"}}, {"id": 345, "text": "In ", "bbox": {"l": 498.15335, "t": 263.88922, "r": 500.05637, "b": 265.92719, "coord_origin": "TOPLEFT"}}, {"id": 346, "text": "chapter 2, you and your vehicle", "bbox": {"l": 500.05637, "t": 263.85717999999997, "r": 524.37036, "b": 265.86310000000003, "coord_origin": "TOPLEFT"}}, {"id": 347, "text": ", you learned about ", "bbox": {"l": 524.37036, "t": 263.88922, "r": 539.89124, "b": 265.92719, "coord_origin": "TOPLEFT"}}, {"id": 348, "text": "some of the controls in your vehicle. This chapter is a handy ", "bbox": {"l": 498.15335, "t": 265.93224999999995, "r": 544.50403, "b": 267.97020999999995, "coord_origin": "TOPLEFT"}}, {"id": 349, "text": "reference section that gives examples of the most common ", "bbox": {"l": 498.15335, "t": 267.97533999999996, "r": 544.01343, "b": 270.01331000000005, "coord_origin": "TOPLEFT"}}, {"id": 350, "text": "signs, signals and road markings that keep traffi c organized ", "bbox": {"l": 498.15335, "t": 270.01831000000004, "r": 544.11987, "b": 272.05634, "coord_origin": "TOPLEFT"}}, {"id": 351, "text": "and flowing smoothly. ", "bbox": {"l": 498.15335, "t": 272.06140000000005, "r": 515.41071, "b": 274.09937, "coord_origin": "TOPLEFT"}}, {"id": 352, "text": "Signs", "bbox": {"l": 498.15335, "t": 277.34619, "r": 505.64642000000003, "b": 280.9357, "coord_origin": "TOPLEFT"}}, {"id": 353, "text": "There are three ways to read signs: by their shape, colour and ", "bbox": {"l": 498.15335, "t": 281.82187, "r": 543.92957, "b": 283.85983, "coord_origin": "TOPLEFT"}}, {"id": 354, "text": "the messages printed on them. Understanding these three ways ", "bbox": {"l": 498.15335, "t": 283.8649, "r": 545.67834, "b": 285.90289, "coord_origin": "TOPLEFT"}}, {"id": 355, "text": "of classifying signs will help you figure out the meaning of signs ", "bbox": {"l": 498.15335, "t": 285.90796, "r": 545.26471, "b": 287.94592, "coord_origin": "TOPLEFT"}}, {"id": 356, "text": "that are new to you. ", "bbox": {"l": 498.15335, "t": 287.95099, "r": 513.31335, "b": 289.98895, "coord_origin": "TOPLEFT"}}, {"id": 357, "text": "Stop", "bbox": {"l": 505.43439, "t": 303.07596, "r": 508.53033000000005, "b": 304.89639, "coord_origin": "TOPLEFT"}}, {"id": 358, "text": "Yield the right-of-way", "bbox": {"l": 527.45502, "t": 303.25354, "r": 541.44678, "b": 305.07397, "coord_origin": "TOPLEFT"}}, {"id": 359, "text": "Shows driving", "bbox": {"l": 501.79385, "t": 321.18973, "r": 510.41632, "b": 323.01016, "coord_origin": "TOPLEFT"}}, {"id": 360, "text": "regulations", "bbox": {"l": 501.79385, "t": 322.87731999999994, "r": 509.04268999999994, "b": 324.69775000000004, "coord_origin": "TOPLEFT"}}, {"id": 361, "text": "Explains lane use", "bbox": {"l": 518.66455, "t": 319.59146, "r": 529.80902, "b": 321.41190000000006, "coord_origin": "TOPLEFT"}}, {"id": 362, "text": "School zone signs ", "bbox": {"l": 534.87561, "t": 318.37616, "r": 546.95142, "b": 320.19659, "coord_origin": "TOPLEFT"}}, {"id": 363, "text": "are fl uorescent ", "bbox": {"l": 534.87561, "t": 320.0637500000001, "r": 545.05762, "b": 321.88419, "coord_origin": "TOPLEFT"}}, {"id": 364, "text": "yellow-green", "bbox": {"l": 534.87561, "t": 321.75134, "r": 543.32263, "b": 323.57178, "coord_origin": "TOPLEFT"}}, {"id": 365, "text": "Tells about motorist ", "bbox": {"l": 499.21862999999996, "t": 338.12772, "r": 512.62451, "b": 339.94815, "coord_origin": "TOPLEFT"}}, {"id": 366, "text": "services", "bbox": {"l": 499.21862999999996, "t": 339.81531000000007, "r": 504.39917, "b": 341.63574, "coord_origin": "TOPLEFT"}}, {"id": 367, "text": "Shows a permitted ", "bbox": {"l": 516.97748, "t": 338.06039, "r": 529.77484, "b": 339.88082999999995, "coord_origin": "TOPLEFT"}}, {"id": 368, "text": "action", "bbox": {"l": 516.97748, "t": 339.74799, "r": 520.96399, "b": 341.56842, "coord_origin": "TOPLEFT"}}, {"id": 369, "text": "Shows an action that ", "bbox": {"l": 534.55847, "t": 337.88281, "r": 548.58453, "b": 339.7032500000001, "coord_origin": "TOPLEFT"}}, {"id": 370, "text": "is not permitted", "bbox": {"l": 534.55847, "t": 339.57040000000006, "r": 545.08862, "b": 341.39084, "coord_origin": "TOPLEFT"}}, {"id": 371, "text": "Warns of hazards ", "bbox": {"l": 483.05853, "t": 356.17416, "r": 494.72577, "b": 357.9946, "coord_origin": "TOPLEFT"}}, {"id": 372, "text": "ahead", "bbox": {"l": 483.05853, "t": 357.86179, "r": 487.07525999999996, "b": 359.68222, "coord_origin": "TOPLEFT"}}, {"id": 373, "text": "Warns of", "bbox": {"l": 499.39645, "t": 356.26297000000005, "r": 504.69171, "b": 358.0834, "coord_origin": "TOPLEFT"}}, {"id": 374, "text": "construction zones", "bbox": {"l": 499.39645, "t": 357.95056, "r": 511.69116, "b": 359.77099999999996, "coord_origin": "TOPLEFT"}}, {"id": 375, "text": "Railway crossing", "bbox": {"l": 516.75891, "t": 356.26297000000005, "r": 527.42938, "b": 358.0834, "coord_origin": "TOPLEFT"}}, {"id": 376, "text": "Shows distance and ", "bbox": {"l": 534.5141, "t": 352.92981, "r": 547.89862, "b": 354.75024, "coord_origin": "TOPLEFT"}}, {"id": 377, "text": "direction", "bbox": {"l": 534.5141, "t": 354.6174, "r": 540.2818, "b": 356.43784, "coord_origin": "TOPLEFT"}}, {"id": 378, "text": "\u2022", "bbox": {"l": 478.37466, "t": 270.14075, "r": 479.14251999999993, "b": 272.17877, "coord_origin": "TOPLEFT"}}, {"id": 379, "text": "Signs", "bbox": {"l": 479.91036999999994, "t": 270.14075, "r": 483.74963, "b": 272.17877, "coord_origin": "TOPLEFT"}}, {"id": 380, "text": "- regulatory signs", "bbox": {"l": 479.97293, "t": 272.84717, "r": 492.31219, "b": 274.34888, "coord_origin": "TOPLEFT"}}, {"id": 381, "text": "- school, ", "bbox": {"l": 479.97293, "t": 275.14513999999997, "r": 486.72598000000005, "b": 276.64679, "coord_origin": "TOPLEFT"}}, {"id": 382, "text": "playground and ", "bbox": {"l": 481.21602999999993, "t": 276.77972, "r": 492.93286000000006, "b": 278.81768999999997, "coord_origin": "TOPLEFT"}}, {"id": 383, "text": "crosswalk signs", "bbox": {"l": 481.21602999999993, "t": 278.82275000000004, "r": 491.82938000000007, "b": 280.86075, "coord_origin": "TOPLEFT"}}, {"id": 384, "text": "- lane use signs", "bbox": {"l": 479.97293, "t": 281.52759, "r": 491.00775000000004, "b": 283.02924, "coord_origin": "TOPLEFT"}}, {"id": 385, "text": "- turn control signs", "bbox": {"l": 479.97293, "t": 283.82556, "r": 493.32748, "b": 285.3272099999999, "coord_origin": "TOPLEFT"}}, {"id": 386, "text": "- parking signs", "bbox": {"l": 479.97293, "t": 286.1235, "r": 490.4915199999999, "b": 287.62518, "coord_origin": "TOPLEFT"}}, {"id": 387, "text": "- reserved lane ", "bbox": {"l": 479.97293, "t": 288.42148, "r": 491.17004000000003, "b": 289.92316, "coord_origin": "TOPLEFT"}}, {"id": 388, "text": "signs", "bbox": {"l": 481.21602999999993, "t": 290.05605999999995, "r": 484.77405000000005, "b": 292.09406, "coord_origin": "TOPLEFT"}}, {"id": 389, "text": "- warning signs", "bbox": {"l": 479.97293, "t": 292.76169000000004, "r": 490.83398, "b": 294.26334, "coord_origin": "TOPLEFT"}}, {"id": 390, "text": "- object markers", "bbox": {"l": 479.97293, "t": 295.05963, "r": 491.62692, "b": 296.56131, "coord_origin": "TOPLEFT"}}, {"id": 391, "text": "- construction ", "bbox": {"l": 479.97293, "t": 297.3576, "r": 490.37341, "b": 298.8592499999999, "coord_origin": "TOPLEFT"}}, {"id": 392, "text": "signs", "bbox": {"l": 481.21602999999993, "t": 298.99219, "r": 484.77405000000005, "b": 301.03015, "coord_origin": "TOPLEFT"}}, {"id": 393, "text": "- information and ", "bbox": {"l": 479.97293, "t": 301.69780999999995, "r": 492.93912, "b": 303.19946, "coord_origin": "TOPLEFT"}}, {"id": 394, "text": "destination signs", "bbox": {"l": 481.21602999999993, "t": 303.3324, "r": 493.00525, "b": 305.37036, "coord_origin": "TOPLEFT"}}, {"id": 395, "text": "- railway signs", "bbox": {"l": 479.97293, "t": 306.0379899999999, "r": 489.99047999999993, "b": 307.53967, "coord_origin": "TOPLEFT"}}, {"id": 396, "text": "\u2022", "bbox": {"l": 478.375, "t": 308.24789, "r": 479.1032400000001, "b": 310.28586, "coord_origin": "TOPLEFT"}}, {"id": 397, "text": "Signals", "bbox": {"l": 479.83151, "t": 308.24789, "r": 484.92925999999994, "b": 310.28586, "coord_origin": "TOPLEFT"}}, {"id": 398, "text": "- lane control ", "bbox": {"l": 479.97293, "t": 310.95358, "r": 490.00091999999995, "b": 312.45526, "coord_origin": "TOPLEFT"}}, {"id": 399, "text": "signals", "bbox": {"l": 481.21602999999993, "t": 312.5881999999999, "r": 485.95331, "b": 314.62616, "coord_origin": "TOPLEFT"}}, {"id": 400, "text": "- traffic lights", "bbox": {"l": 479.97293, "t": 315.29379, "r": 489.29876999999993, "b": 316.79544, "coord_origin": "TOPLEFT"}}, {"id": 401, "text": "\u2022", "bbox": {"l": 478.375, "t": 317.50366, "r": 479.18129999999996, "b": 319.5416599999999, "coord_origin": "TOPLEFT"}}, {"id": 402, "text": "Road markings", "bbox": {"l": 479.98761, "t": 317.50366, "r": 490.46960000000007, "b": 319.5416599999999, "coord_origin": "TOPLEFT"}}, {"id": 403, "text": "- yellow lines", "bbox": {"l": 479.97293, "t": 320.20938, "r": 489.26166000000006, "b": 321.71103, "coord_origin": "TOPLEFT"}}, {"id": 404, "text": "- white lines", "bbox": {"l": 479.97293, "t": 322.50732, "r": 488.59189, "b": 324.009, "coord_origin": "TOPLEFT"}}, {"id": 405, "text": "- reserved lane ", "bbox": {"l": 479.97293, "t": 324.8053, "r": 491.17004000000003, "b": 326.30698, "coord_origin": "TOPLEFT"}}, {"id": 406, "text": "markings", "bbox": {"l": 481.21602999999993, "t": 326.43988, "r": 487.58978, "b": 328.47784, "coord_origin": "TOPLEFT"}}, {"id": 407, "text": "- other markings", "bbox": {"l": 479.97293, "t": 329.14551, "r": 491.75177, "b": 330.64716, "coord_origin": "TOPLEFT"}}, {"id": 408, "text": "in this chapter", "bbox": {"l": 478.15246999999994, "t": 265.07030999999995, "r": 493.75586, "b": 268.06872999999996, "coord_origin": "TOPLEFT"}}, {"id": 409, "text": "Figure 1: Four examples of complex page layouts across dif-", "bbox": {"l": 317.95499, "t": 540.08299, "r": 559.80579, "b": 548.55624, "coord_origin": "TOPLEFT"}}, {"id": 410, "text": "ferent document categories", "bbox": {"l": 317.95499, "t": 551.0419899999999, "r": 428.69907, "b": 559.51524, "coord_origin": "TOPLEFT"}}, {"id": 411, "text": "KEYWORDS", "bbox": {"l": 317.95499, "t": 592.46591, "r": 379.8205, "b": 602.7750100000001, "coord_origin": "TOPLEFT"}}, {"id": 412, "text": "PDF document conversion, layout segmentation, object-detection,", "bbox": {"l": 317.95499, "t": 607.66756, "r": 559.18597, "b": 616.04218, "coord_origin": "TOPLEFT"}}, {"id": 413, "text": "data set, Machine Learning", "bbox": {"l": 317.95499, "t": 618.62656, "r": 416.94403, "b": 627.00117, "coord_origin": "TOPLEFT"}}, {"id": 414, "text": "ACM Reference Format:", "bbox": {"l": 317.65997, "t": 640.05434, "r": 404.65366, "b": 647.58609, "coord_origin": "TOPLEFT"}}, {"id": 415, "text": "Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter", "bbox": {"l": 317.95499, "t": 650.11996, "r": 558.35266, "b": 657.56404, "coord_origin": "TOPLEFT"}}, {"id": 416, "text": "Staar. 2022. DocLayNet: A Large Human-Annotated Dataset for Document-", "bbox": {"l": 317.95499, "t": 660.08296, "r": 559.5495, "b": 667.52703, "coord_origin": "TOPLEFT"}}, {"id": 417, "text": "Layout Analysis. In", "bbox": {"l": 317.95499, "t": 670.04497, "r": 383.30807, "b": 677.48904, "coord_origin": "TOPLEFT"}}, {"id": 418, "text": "Proceedings of the 28th ACM SIGKDD Conference on", "bbox": {"l": 385.798, "t": 670.08482, "r": 558.20032, "b": 677.49701, "coord_origin": "TOPLEFT"}}, {"id": 419, "text": "Knowledge Discovery and Data Mining (KDD \u201922), August 14-18, 2022, Wash-", "bbox": {"l": 317.95499, "t": 680.04781, "r": 559.00092, "b": 687.46001, "coord_origin": "TOPLEFT"}}, {"id": 420, "text": "ington, DC, USA.", "bbox": {"l": 317.95499, "t": 690.01081, "r": 370.11481, "b": 697.423004, "coord_origin": "TOPLEFT"}}, {"id": 421, "text": "ACM, New York, NY, USA, 9 pages. https://doi.org/10.1145/", "bbox": {"l": 371.82999, "t": 689.97096, "r": 558.71655, "b": 697.415031, "coord_origin": "TOPLEFT"}}, {"id": 422, "text": "3534678.3539043", "bbox": {"l": 317.95499, "t": 699.932953, "r": 371.59375, "b": 707.377029, "coord_origin": "TOPLEFT"}}, {"id": 423, "text": "arXiv:2206.01062v1 [cs.CV] 2 Jun 2022", "bbox": {"l": 18.34021, "t": 218.35999000000004, "r": 36.339794, "b": 555.00003, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 12, "label": "section_header", "bbox": {"l": 107.29999999999998, "t": 83.69470000000013, "r": 505.06195, "b": 119.59558000000015, "coord_origin": "TOPLEFT"}, "confidence": 0.8416302800178528, "cells": [{"id": 0, "text": "DocLayNet: A Large Human-Annotated Dataset for", "bbox": {"l": 107.29999999999998, "t": 83.69470000000013, "r": 505.06195, "b": 99.67058999999995, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Document-Layout Analysis", "bbox": {"l": 200.117, "t": 103.6196900000001, "r": 411.88367, "b": 119.59558000000015, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "text", "bbox": {"l": 90.96701, "t": 133.67236000000003, "r": 193.73123, "b": 180.24030000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.8637151718139648, "cells": [{"id": 2, "text": "Birgit Pfitzmann", "bbox": {"l": 102.06001, "t": 133.67236000000003, "r": 182.63805, "b": 144.83856000000003, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "IBM Research", "bbox": {"l": 114.29401000000001, "t": 147.02423, "r": 170.40337, "b": 156.32928000000004, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Rueschlikon, Switzerland", "bbox": {"l": 90.96701, "t": 158.97924999999998, "r": 193.73123, "b": 168.28430000000003, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "bpf@zurich.ibm.com", "bbox": {"l": 100.02301, "t": 170.93524000000002, "r": 184.67522, "b": 180.24030000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 255.11602999999997, "t": 133.67236000000003, "r": 357.88025, "b": 180.24030000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.8612664937973022, "cells": [{"id": 6, "text": "Christoph Auer", "bbox": {"l": 268.62402, "t": 133.67236000000003, "r": 344.59933, "b": 144.83856000000003, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "IBM Research", "bbox": {"l": 278.44302, "t": 147.02423, "r": 334.55237, "b": 156.32928000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Rueschlikon, Switzerland", "bbox": {"l": 255.11602999999997, "t": 158.97924999999998, "r": 357.88025, "b": 168.28430000000003, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "cau@zurich.ibm.com", "bbox": {"l": 263.70404, "t": 170.93524000000002, "r": 349.29272, "b": 180.24030000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "text", "bbox": {"l": 419.26505, "t": 133.67236000000003, "r": 522.0293, "b": 180.24030000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.8760607242584229, "cells": [{"id": 10, "text": "Michele Dolfi", "bbox": {"l": 437.6930500000001, "t": 133.67236000000003, "r": 503.60208, "b": 144.83856000000003, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "IBM Research", "bbox": {"l": 442.59305000000006, "t": 147.02423, "r": 498.7023899999999, "b": 156.32928000000004, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Rueschlikon, Switzerland", "bbox": {"l": 419.26505, "t": 158.97924999999998, "r": 522.0293, "b": 168.28430000000003, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "dol@zurich.ibm.com", "bbox": {"l": 428.56104000000005, "t": 170.93524000000002, "r": 512.73505, "b": 180.24030000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 172.54303, "t": 192.05737, "r": 275.30725, "b": 238.62531, "coord_origin": "TOPLEFT"}, "confidence": 0.8319916129112244, "cells": [{"id": 14, "text": "Ahmed S. Nassar", "bbox": {"l": 182.26804, "t": 192.05737, "r": 265.39255, "b": 203.22357, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "IBM Research", "bbox": {"l": 195.87103, "t": 205.40923999999995, "r": 251.98038999999997, "b": 214.71429, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Rueschlikon, Switzerland", "bbox": {"l": 172.54303, "t": 217.36425999999994, "r": 275.30725, "b": 226.66931, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "ahn@zurich.ibm.com", "bbox": {"l": 180.52803, "t": 229.32025, "r": 267.3222, "b": 238.62531, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 336.69302, "t": 192.05737, "r": 439.45727999999997, "b": 238.62531, "coord_origin": "TOPLEFT"}, "confidence": 0.8027974367141724, "cells": [{"id": 18, "text": "Peter Staar", "bbox": {"l": 361.52802, "t": 192.05737, "r": 414.84821, "b": 203.22357, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "IBM Research", "bbox": {"l": 360.02002, "t": 205.40923999999995, "r": 416.12939, "b": 214.71429, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Rueschlikon, Switzerland", "bbox": {"l": 336.69302, "t": 217.36425999999994, "r": 439.45727999999997, "b": 226.66931, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "taa@zurich.ibm.com", "bbox": {"l": 346.20703, "t": 229.32025, "r": 429.94269, "b": 238.62531, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "section_header", "bbox": {"l": 53.798035, "t": 247.70288000000005, "r": 111.94354, "b": 258.01202, "coord_origin": "TOPLEFT"}, "confidence": 0.8876155018806458, "cells": [{"id": 22, "text": "ABSTRACT", "bbox": {"l": 53.798035, "t": 247.70288000000005, "r": 111.94354, "b": 258.01202, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 53.466999, "t": 262.90454, "r": 295.56018, "b": 534.29318, "coord_origin": "TOPLEFT"}, "confidence": 0.9823057055473328, "cells": [{"id": 23, "text": "Accurate document layout analysis is a key requirement for high-", "bbox": {"l": 53.484001, "t": 262.90454, "r": 295.55591, "b": 271.27917, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "quality PDF document conversion. With the recent availability of", "bbox": {"l": 53.79800000000001, "t": 273.86352999999997, "r": 294.04199, "b": 282.23816, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "public, large ground-truth datasets such as PubLayNet and DocBank,", "bbox": {"l": 53.79800000000001, "t": 284.82254, "r": 295.34586, "b": 293.19717, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "deep-learning models have proven to be very effective at layout", "bbox": {"l": 53.79800000000001, "t": 295.78152, "r": 294.04709, "b": 304.15616000000006, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "detection and segmentation. While these datasets are of adequate", "bbox": {"l": 53.79800000000001, "t": 306.74053999999995, "r": 294.04645, "b": 315.11517, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "size to train such models, they severely lack in layout variability", "bbox": {"l": 53.79800000000001, "t": 317.69952, "r": 294.27573, "b": 326.07416, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "since they are sourced from scientific article repositories such as", "bbox": {"l": 53.79800000000001, "t": 328.65854, "r": 294.04712, "b": 337.03317, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "PubMed and arXiv only. Consequently, the accuracy of the layout", "bbox": {"l": 53.79800000000001, "t": 339.61755, "r": 294.0437, "b": 347.99219, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "segmentation drops significantly when these models are applied", "bbox": {"l": 53.79800000000001, "t": 350.57654, "r": 294.04715, "b": 358.95117, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "on more challenging and diverse layouts. In this paper, we present", "bbox": {"l": 53.79800000000001, "t": 361.53455, "r": 294.04364, "b": 369.90918000000005, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "DocLayNet", "bbox": {"l": 53.79800000000001, "t": 372.53839, "r": 92.863388, "b": 380.87714000000005, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": ", a new, publicly available, document-layout annotation", "bbox": {"l": 92.863998, "t": 372.49353, "r": 294.04361, "b": 380.86816, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "dataset in COCO format. It contains 80863 manually annotated", "bbox": {"l": 53.79800000000001, "t": 383.45255, "r": 294.04718, "b": 391.82718, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "pages from diverse data sources to represent a wide variability in", "bbox": {"l": 53.79800000000001, "t": 394.41153, "r": 294.0437, "b": 402.78616, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "layouts. For each PDF page, the layout annotations provide labelled", "bbox": {"l": 53.79800000000001, "t": 405.37054, "r": 294.04535, "b": 413.74518, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "bounding-boxes with a choice of 11 distinct classes. DocLayNet", "bbox": {"l": 53.79800000000001, "t": 416.32953, "r": 294.04715, "b": 424.70416000000006, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "also provides a subset of double- and triple-annotated pages to", "bbox": {"l": 53.79800000000001, "t": 427.28853999999995, "r": 294.04712, "b": 435.66318, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "determine the inter-annotator agreement. In multiple experiments,", "bbox": {"l": 53.79800000000001, "t": 438.24753, "r": 295.03, "b": 446.62216, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "we provide baseline accuracy scores (in mAP) for a set of popular", "bbox": {"l": 53.466999, "t": 449.20654, "r": 294.21616, "b": 457.58118, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "object detection models. We also demonstrate that these models", "bbox": {"l": 53.79800000000001, "t": 460.16553, "r": 294.04712, "b": 468.54016, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "fall approximately 10% behind the inter-annotator agreement. Fur-", "bbox": {"l": 53.79800000000001, "t": 471.12354, "r": 295.56018, "b": 479.49817, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "thermore, we provide evidence that DocLayNet is of sufficient size.", "bbox": {"l": 53.79800000000001, "t": 482.08255, "r": 295.42783, "b": 490.45718, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Lastly, we compare models trained on PubLayNet, DocBank and", "bbox": {"l": 53.79800000000001, "t": 493.04153, "r": 294.04715, "b": 501.41617, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "DocLayNet, showing that layout predictions of the DocLayNet-", "bbox": {"l": 53.79800000000001, "t": 504.00055, "r": 295.55618, "b": 512.37518, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "trained models are more robust and thus the preferred choice for", "bbox": {"l": 53.79800000000001, "t": 514.95953, "r": 294.21643, "b": 523.33417, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "general-purpose document-layout analysis.", "bbox": {"l": 53.79800000000001, "t": 525.91855, "r": 212.05495, "b": 534.29318, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "section_header", "bbox": {"l": 53.79800000000001, "t": 550.99692, "r": 134.81989, "b": 561.30602, "coord_origin": "TOPLEFT"}, "confidence": 0.9149598479270935, "cells": [{"id": 49, "text": "CCS CONCEPTS", "bbox": {"l": 53.79800000000001, "t": 550.99692, "r": 134.81989, "b": 561.30602, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 53.797989, "t": 566.08299, "r": 297.85294, "b": 596.50114, "coord_origin": "TOPLEFT"}, "confidence": 0.8458839058876038, "cells": [{"id": 50, "text": "\u2022", "bbox": {"l": 53.79800000000001, "t": 566.19957, "r": 56.945206000000006, "b": 574.57419, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Information systems", "bbox": {"l": 58.440002, "t": 566.0830100000001, "r": 142.4462, "b": 574.5562600000001, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "\u2192", "bbox": {"l": 143.938, "t": 566.36096, "r": 153.15099, "b": 574.43073, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Document structure", "bbox": {"l": 154.646, "t": 566.0830100000001, "r": 235.46015999999997, "b": 574.5562600000001, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "; \u2022", "bbox": {"l": 235.45700000000002, "t": 566.19955, "r": 242.17419, "b": 574.57417, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "Applied com-", "bbox": {"l": 243.66899, "t": 566.08299, "r": 297.85294, "b": 574.55624, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "puting", "bbox": {"l": 53.797989, "t": 577.0419899999999, "r": 80.661324, "b": 585.51524, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "\u2192", "bbox": {"l": 83.565987, "t": 577.3199500000001, "r": 92.778961, "b": 585.38971, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Document analysis", "bbox": {"l": 95.68399, "t": 577.0419899999999, "r": 173.91583, "b": 585.51524, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "; \u2022", "bbox": {"l": 173.916, "t": 577.15855, "r": 182.1272, "b": 585.53317, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Computing methodologies", "bbox": {"l": 185.032, "t": 577.0419899999999, "r": 294.0455, "b": 585.51524, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "\u2192", "bbox": {"l": 53.79800399999999, "t": 588.27895, "r": 63.01097899999999, "b": 596.34871, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "Machine learning", "bbox": {"l": 65.253006, "t": 588.00099, "r": 136.80487, "b": 596.47424, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": ";", "bbox": {"l": 136.80501, "t": 588.1175499999999, "r": 138.92108, "b": 596.49217, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "Computer vision", "bbox": {"l": 141.162, "t": 588.00099, "r": 209.60254, "b": 596.47424, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": ";", "bbox": {"l": 209.60201, "t": 588.1175499999999, "r": 211.71808, "b": 596.49217, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "Object detection", "bbox": {"l": 213.96001, "t": 588.16238, "r": 270.45728, "b": 596.50114, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": ";", "bbox": {"l": 270.48001, "t": 588.1175499999999, "r": 272.59607, "b": 596.49217, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 53.79800000000001, "t": 634.39838, "r": 295.11798, "b": 672.79189, "coord_origin": "TOPLEFT"}, "confidence": 0.7107349038124084, "cells": [{"id": 68, "text": "Permission to make digital or hard copies of part or all of this work for personal or", "bbox": {"l": 53.79800000000001, "t": 634.39838, "r": 294.17697, "b": 640.9119000000001, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "classroom use is granted without fee provided that copies are not made or distributed", "bbox": {"l": 53.79800000000001, "t": 642.36838, "r": 294.04443, "b": 648.8819, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "for profit or commercial advantage and that copies bear this notice and the full citation", "bbox": {"l": 53.79800000000001, "t": 650.33838, "r": 294.04498, "b": 656.8519, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "on the first page. Copyrights for third-party components of this work must be honored.", "bbox": {"l": 53.79800000000001, "t": 658.3083799999999, "r": 295.11798, "b": 664.8219, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "For all other uses, contact the owner/author(s).", "bbox": {"l": 53.79800000000001, "t": 666.27837, "r": 187.72285, "b": 672.79189, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 53.79800000000001, "t": 675.08023, "r": 197.86275, "b": 681.56586, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 53.79800000000001, "t": 675.08023, "r": 197.86275, "b": 681.56586, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 53.317001, "t": 683.81236, "r": 186.74652, "b": 690.32589, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "\u00a9 2022 Copyright held by the owner/author(s).", "bbox": {"l": 53.317001, "t": 683.81236, "r": 186.74652, "b": 690.32589, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 53.554001, "t": 691.78336, "r": 157.03125, "b": 698.29689, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "ACM ISBN 978-1-4503-9385-0/22/08.", "bbox": {"l": 53.554001, "t": 691.78336, "r": 157.03125, "b": 698.29689, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 53.79800000000001, "t": 699.753365, "r": 166.94093, "b": 706.266891, "coord_origin": "TOPLEFT"}, "confidence": 0.509588360786438, "cells": [{"id": 76, "text": "https://doi.org/10.1145/3534678.3539043", "bbox": {"l": 53.79800000000001, "t": 699.753365, "r": 166.94093, "b": 706.266891, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "picture", "bbox": {"l": 323.408203125, "t": 250.34873962402344, "r": 553.2952270507812, "b": 525.8507080078125, "coord_origin": "TOPLEFT"}, "confidence": 0.5910208821296692, "cells": [{"id": 77, "text": "13", "bbox": {"l": 327.86951, "t": 351.78085, "r": 330.41248, "b": 353.95465, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "USING THE VERTICAL TUBE -", "bbox": {"l": 327.83005, "t": 331.57268999999997, "r": 351.16092, "b": 333.31171, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "MODELS AY11230/11234", "bbox": {"l": 327.83005, "t": 333.18292, "r": 348.30536, "b": 334.92194, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "1.", "bbox": {"l": 327.83005, "t": 336.40439, "r": 329.05914, "b": 337.92606, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "The vertical tube can be used for", "bbox": {"l": 329.67368, "t": 336.40439, "r": 349.95349, "b": 337.92606, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "instructional viewing or to photograph", "bbox": {"l": 329.11752, "t": 337.83588, "r": 353.57977, "b": 339.35751000000005, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": " the image with a digital camera or a", "bbox": {"l": 327.77121, "t": 339.26736, "r": 352.4306, "b": 340.789, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": " micro TV unit", "bbox": {"l": 328.15176, "t": 340.69882, "r": 337.91086, "b": 342.22049, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "2.", "bbox": {"l": 327.8313, "t": 342.19043000000005, "r": 329.09155, "b": 343.71207, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Loosen the retention screw, then rotate ", "bbox": {"l": 329.72168, "t": 342.19043000000005, "r": 354.9267, "b": 343.71207, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": " the adjustment ring to change the ", "bbox": {"l": 327.8313, "t": 343.62192, "r": 351.66949, "b": 345.14355, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": " length of the vertical tube.", "bbox": {"l": 328.21185, "t": 345.05338, "r": 346.33179, "b": 346.57504, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "3.", "bbox": {"l": 327.83005, "t": 346.84680000000003, "r": 329.12726, "b": 348.36847, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "Make sure that both the images in", "bbox": {"l": 329.77588, "t": 346.84680000000003, "r": 351.18005, "b": 348.36847, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "OPERATION ", "bbox": {"l": 327.25311, "t": 254.94812000000002, "r": 350.07861, "b": 258.86096, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "(", "bbox": {"l": 350.07861, "t": 254.76782000000003, "r": 351.82651, "b": 258.68066, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "cont.", "bbox": {"l": 351.82651, "t": 254.94812000000002, "r": 360.85242, "b": 258.86096, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": ")", "bbox": {"l": 360.85242, "t": 254.76782000000003, "r": 362.60028, "b": 258.68066, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "SELECTING OBJECTIVE ", "bbox": {"l": 326.88037, "t": 263.49492999999995, "r": 345.84351, "b": 265.23395000000005, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "MAGNIFICATION", "bbox": {"l": 326.88037, "t": 265.10515999999996, "r": 340.54153, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "1.", "bbox": {"l": 326.88037, "t": 266.71533, "r": 328.31903, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "There are two objectives. The lower", "bbox": {"l": 329.03836, "t": 266.71533, "r": 354.21472, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": " magnification objective has a greater", "bbox": {"l": 326.88037, "t": 268.32556, "r": 355.19193, "b": 270.06458, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": " depth of field and view.", "bbox": {"l": 326.88037, "t": 269.93579, "r": 345.80057, "b": 271.6748, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "2.", "bbox": {"l": 326.88037, "t": 271.54602, "r": 328.33862, "b": 273.28503, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "In order to observe the specimen", "bbox": {"l": 329.06775, "t": 271.54602, "r": 352.39969, "b": 273.28503, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": " easily use the lower magnification", "bbox": {"l": 326.88037, "t": 273.15619000000004, "r": 352.90042, "b": 274.89526, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": " objective first. Then, by rotating the", "bbox": {"l": 326.88037, "t": 274.76642000000004, "r": 354.59546, "b": 276.50543000000005, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": " case, the magnification can be", "bbox": {"l": 326.88037, "t": 276.37665000000004, "r": 350.81885, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": " changed.", "bbox": {"l": 326.88037, "t": 277.98688000000004, "r": 335.46707, "b": 279.72589000000005, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "CHANGING THE INTERPUPILLARY ", "bbox": {"l": 326.88037, "t": 281.20728, "r": 354.57755, "b": 282.94632, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "DISTANCE", "bbox": {"l": 326.88037, "t": 282.81750000000005, "r": 335.1752, "b": 284.55652, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "1.", "bbox": {"l": 326.88037, "t": 284.4277, "r": 328.34784, "b": 286.16675, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "The distance between the observer's", "bbox": {"l": 329.08157, "t": 284.4277, "r": 354.76245, "b": 286.16675, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": " pupils is the interpupillary distance.", "bbox": {"l": 326.88037, "t": 286.03793, "r": 354.6499, "b": 287.77695, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "2.", "bbox": {"l": 326.88037, "t": 287.64813, "r": 328.25125, "b": 289.38718, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "To adjust the interpupillary distance", "bbox": {"l": 328.93671, "t": 287.64813, "r": 354.29825, "b": 289.38718, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": " rotate the prism caps until both eyes", "bbox": {"l": 326.88181, "t": 289.25836, "r": 355.02075, "b": 290.99738, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": " coincide with the image in the", "bbox": {"l": 326.88181, "t": 290.86855999999995, "r": 350.82028, "b": 292.6076, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": " eyepiece. ", "bbox": {"l": 326.88181, "t": 292.47879, "r": 336.2067, "b": 294.2178, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "FOCUSING", "bbox": {"l": 326.88181, "t": 295.69922, "r": 335.3941, "b": 297.43823, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "1.", "bbox": {"l": 326.88181, "t": 297.30942, "r": 328.34314, "b": 299.04846, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "Remove the lens protective cover.", "bbox": {"l": 329.07379, "t": 297.30942, "r": 353.18555, "b": 299.04846, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "2.", "bbox": {"l": 326.88324, "t": 298.91965, "r": 328.35919, "b": 300.65866, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "Place the specimen on the working", "bbox": {"l": 329.0972, "t": 298.91965, "r": 353.45065, "b": 300.65866, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": " stage.", "bbox": {"l": 326.88324, "t": 300.52985, "r": 333.32825, "b": 302.26889000000006, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "3.", "bbox": {"l": 326.88324, "t": 302.14008000000007, "r": 328.31296, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "Focus the specimen with the left eye", "bbox": {"l": 329.02783, "t": 302.14008000000007, "r": 354.76303, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": " first while turning the focus knob until", "bbox": {"l": 326.88324, "t": 303.75027, "r": 355.96307, "b": 305.48932, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": " the image appears clear and sharp.", "bbox": {"l": 326.88324, "t": 305.3605, "r": 354.46594, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "4.", "bbox": {"l": 326.88324, "t": 306.9707, "r": 328.25488, "b": 308.70975, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "Rotate the right eyepiece ring until the", "bbox": {"l": 328.9407, "t": 306.9707, "r": 356.37335, "b": 308.70975, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": " images in each eyepiece coincide and", "bbox": {"l": 326.88324, "t": 308.58093, "r": 355.38867, "b": 310.31995, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": " are sharp and clear.", "bbox": {"l": 326.88324, "t": 310.19113, "r": 343.17249, "b": 311.93018, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "CHANGING THE BULB", "bbox": {"l": 326.88324, "t": 313.41156, "r": 344.13388, "b": 315.15059999999994, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "1.", "bbox": {"l": 326.88324, "t": 315.02178999999995, "r": 328.37418, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "Disconnect the power cord.", "bbox": {"l": 329.11963, "t": 315.02178999999995, "r": 348.50162, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "2.", "bbox": {"l": 326.88324, "t": 316.63199, "r": 328.34061, "b": 318.37103, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "When the bulb is cool, remove the", "bbox": {"l": 329.06931, "t": 316.63199, "r": 353.11588, "b": 318.37103, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": " oblique illuminator cap and remove", "bbox": {"l": 326.88464, "t": 318.2422199999999, "r": 353.79517, "b": 319.9812299999999, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": " the halogen bulb with cap.", "bbox": {"l": 326.88464, "t": 319.85242000000005, "r": 348.02094, "b": 321.59146, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "3.", "bbox": {"l": 326.88464, "t": 321.46265, "r": 328.37512, "b": 323.20166, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "Replace with a new halogen bulb.", "bbox": {"l": 329.12036, "t": 321.46265, "r": 352.96808, "b": 323.20166, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "4.", "bbox": {"l": 326.88608, "t": 323.07285, "r": 328.36884, "b": 324.81189, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "Open the window in the base plate and", "bbox": {"l": 329.1102, "t": 323.07285, "r": 356.5412, "b": 324.81189, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": " replace the halogen lamp or ", "bbox": {"l": 326.88608, "t": 324.68307000000004, "r": 350.13828, "b": 326.42209, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": " fluorescent lamp of transmitted", "bbox": {"l": 326.88608, "t": 326.29327, "r": 351.59677, "b": 328.03232, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": " illuminator.", "bbox": {"l": 326.88608, "t": 327.9035, "r": 336.89197, "b": 329.64252, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "FOCUSING", "bbox": {"l": 358.42023, "t": 263.49492999999995, "r": 366.93256, "b": 265.23395000000005, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "1.", "bbox": {"l": 358.42023, "t": 265.10515999999996, "r": 359.89841, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "Turn the focusing knob away or toward", "bbox": {"l": 360.63751, "t": 265.10515999999996, "r": 387.98407, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": " you until a clear image is viewed.", "bbox": {"l": 358.42023, "t": 266.71533, "r": 384.58948, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "2.", "bbox": {"l": 358.42166, "t": 268.32556, "r": 359.78549, "b": 270.06458, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "If the image is unclear, adjust the", "bbox": {"l": 360.46741, "t": 268.32556, "r": 384.33441, "b": 270.06458, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": " height of the elevator up or down,", "bbox": {"l": 358.4231, "t": 269.93579, "r": 384.61502, "b": 271.6748, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": " then turn the focusing knob again.", "bbox": {"l": 358.4231, "t": 271.54602, "r": 385.38922, "b": 273.28503, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "ZOOM MAGNIFICATION", "bbox": {"l": 358.4231, "t": 274.76642000000004, "r": 377.35046, "b": 276.50543000000005, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "1.", "bbox": {"l": 358.4231, "t": 276.37665000000004, "r": 359.89429, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "Turn the zoom magnification knob to", "bbox": {"l": 360.62988, "t": 276.37665000000004, "r": 386.37589, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": " the desired magnification and field of", "bbox": {"l": 358.4231, "t": 277.98688000000004, "r": 386.78732, "b": 279.72589000000005, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": " view.", "bbox": {"l": 358.4231, "t": 279.59704999999997, "r": 364.16855, "b": 281.33609, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "2.", "bbox": {"l": 358.4231, "t": 281.20728, "r": 359.86777, "b": 282.94632, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "In most situations, it is recommended", "bbox": {"l": 360.59012, "t": 281.20728, "r": 387.31656, "b": 282.94632, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": " that you focus at the lowest ", "bbox": {"l": 358.4231, "t": 282.81750000000005, "r": 381.56656, "b": 284.55652, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": " magnification, then move to a higher", "bbox": {"l": 358.4231, "t": 284.4277, "r": 386.63403, "b": 286.16675, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": " magnification and re-focus as ", "bbox": {"l": 358.42453, "t": 286.03793, "r": 382.77115, "b": 287.77695, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": " necessary.", "bbox": {"l": 358.42453, "t": 287.64813, "r": 367.98694, "b": 289.38718, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "3.", "bbox": {"l": 358.42453, "t": 289.25836, "r": 359.80386, "b": 290.99738, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "If the image is not clear to both eyes", "bbox": {"l": 360.49353, "t": 289.25836, "r": 386.70093, "b": 290.99738, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": " at the same time, the diopter ring may", "bbox": {"l": 358.42453, "t": 290.86855999999995, "r": 388.03534, "b": 292.6076, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": " need adjustment.", "bbox": {"l": 358.42453, "t": 292.47879, "r": 373.13724, "b": 294.2178, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "DIOPTER RING ADJUSTMENT", "bbox": {"l": 358.42453, "t": 295.69922, "r": 381.74539, "b": 297.43823, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "1.", "bbox": {"l": 358.42453, "t": 297.30942, "r": 359.83682, "b": 299.04846, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "To adjust the eyepiece for viewing with", "bbox": {"l": 360.54297, "t": 297.30942, "r": 388.08289, "b": 299.04846, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": " or without eyeglasses and for ", "bbox": {"l": 358.42453, "t": 298.91965, "r": 382.73251, "b": 300.65866, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": " differences in acuity between the right", "bbox": {"l": 358.42453, "t": 300.52985, "r": 387.72266, "b": 302.26889000000006, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": " and left eyes, follow the following", "bbox": {"l": 358.42453, "t": 302.14008000000007, "r": 384.1991, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": " steps:", "bbox": {"l": 358.42453, "t": 303.75027, "r": 364.88672, "b": 305.48932, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "a.", "bbox": {"l": 358.42453, "t": 305.3605, "r": 359.95078, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "Observe an image through the left", "bbox": {"l": 361.47699, "t": 305.3605, "r": 386.65988, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": " eyepiece and bring a specific point", "bbox": {"l": 358.42453, "t": 306.9707, "r": 386.7634, "b": 308.70975, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": " into focus using the focus knob.", "bbox": {"l": 358.42453, "t": 308.58093, "r": 385.41354, "b": 310.31995, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "b.", "bbox": {"l": 358.42453, "t": 310.19113, "r": 359.93304, "b": 311.93018, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "By turning the diopter ring ", "bbox": {"l": 361.44156, "t": 310.19113, "r": 382.56085, "b": 311.93018, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": " adjustment for the left eyepiece,", "bbox": {"l": 358.42596, "t": 311.80136, "r": 385.4559, "b": 313.54037, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": " bring the same point into sharp", "bbox": {"l": 358.42596, "t": 313.41156, "r": 384.56122, "b": 315.15059999999994, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": " focus.", "bbox": {"l": 358.42596, "t": 315.02178999999995, "r": 366.74371, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": " c.Then bring the same point into", "bbox": {"l": 358.42596, "t": 316.63199, "r": 383.93884, "b": 318.37103, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": " focus through the right eyepiece", "bbox": {"l": 358.42596, "t": 318.2422199999999, "r": 385.69241, "b": 319.9812299999999, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": " by turning the right diopter ring.", "bbox": {"l": 358.42596, "t": 319.85242000000005, "r": 385.94861, "b": 321.59146, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": " d.With more than one viewer, each", "bbox": {"l": 358.42596, "t": 321.46265, "r": 385.54236, "b": 323.20166, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": " viewer should note their own", "bbox": {"l": 358.42596, "t": 323.07285, "r": 382.98718, "b": 324.81189, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": " diopter ring position for the left", "bbox": {"l": 358.42596, "t": 324.68307000000004, "r": 385.06448, "b": 326.42209, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": " and right eyepieces, then before", "bbox": {"l": 358.42596, "t": 326.29327, "r": 385.20682, "b": 328.03232, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": " viewing set the diopter ring", "bbox": {"l": 358.42596, "t": 327.9035, "r": 382.21964, "b": 329.64252, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": " adjustments to that setting.", "bbox": {"l": 358.42596, "t": 329.5137, "r": 382.63382, "b": 331.25275, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "CHANGING THE BULB", "bbox": {"l": 358.42596, "t": 332.73412999999994, "r": 375.67661, "b": 334.47317999999996, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "1.", "bbox": {"l": 358.42596, "t": 334.34436, "r": 359.90311, "b": 336.08337, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "Disconnect the power cord from the", "bbox": {"l": 360.64169, "t": 334.34436, "r": 385.75333, "b": 336.08337, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": " electrical outlet.", "bbox": {"l": 358.42596, "t": 335.95456, "r": 372.01416, "b": 337.6936, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "2.", "bbox": {"l": 358.42596, "t": 337.56479, "r": 359.88327, "b": 339.3038, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "When the bulb is cool, remove the", "bbox": {"l": 360.61191, "t": 337.56479, "r": 384.65726, "b": 339.3038, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": " oblique illuminator cap and remove", "bbox": {"l": 358.42596, "t": 339.17499, "r": 385.33649, "b": 340.9140300000001, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": " the halogen bulb with cap.", "bbox": {"l": 358.42596, "t": 340.78522, "r": 379.57224, "b": 342.52423, "coord_origin": "TOPLEFT"}}, {"id": 201, "text": "3.", "bbox": {"l": 358.4274, "t": 342.39542, "r": 359.91788, "b": 344.13446000000005, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": "Replace with a new halogen bulb.", "bbox": {"l": 360.66312, "t": 342.39542, "r": 384.5108, "b": 344.13446000000005, "coord_origin": "TOPLEFT"}}, {"id": 203, "text": "4.", "bbox": {"l": 358.42883, "t": 344.00565000000006, "r": 359.92792, "b": 345.74466, "coord_origin": "TOPLEFT"}}, {"id": 204, "text": "Open the window in the base plate", "bbox": {"l": 360.67746, "t": 344.00565000000006, "r": 385.41235, "b": 345.74466, "coord_origin": "TOPLEFT"}}, {"id": 205, "text": " and replace the halogen lamp or", "bbox": {"l": 358.42883, "t": 345.61584, "r": 383.2782, "b": 347.35489, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": " fluorescent lamp of transmitted", "bbox": {"l": 358.42883, "t": 347.22607, "r": 383.13953, "b": 348.96509, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": " illuminator.", "bbox": {"l": 358.42883, "t": 348.83627, "r": 368.43472, "b": 350.57532, "coord_origin": "TOPLEFT"}}, {"id": 208, "text": "Model AY11230", "bbox": {"l": 326.59567, "t": 261.14185, "r": 339.11377, "b": 262.88091999999995, "coord_origin": "TOPLEFT"}}, {"id": 209, "text": "Model AY11234", "bbox": {"l": 358.48605, "t": 261.14185, "r": 371.00415, "b": 262.88091999999995, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": "14", "bbox": {"l": 455.43533, "t": 351.77038999999996, "r": 457.97827000000007, "b": 353.94415, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "Objectives", "bbox": {"l": 408.24518, "t": 275.52673000000004, "r": 414.4234, "b": 276.96020999999996, "coord_origin": "TOPLEFT"}}, {"id": 212, "text": "Revolving Turret", "bbox": {"l": 409.39554, "t": 268.98235999999997, "r": 419.06677, "b": 270.41583, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "Coarse ", "bbox": {"l": 441.3895, "t": 279.12627999999995, "r": 445.87192, "b": 280.55975, "coord_origin": "TOPLEFT"}}, {"id": 214, "text": "Adjustment", "bbox": {"l": 441.3895, "t": 280.30609, "r": 448.22338999999994, "b": 281.7395900000001, "coord_origin": "TOPLEFT"}}, {"id": 215, "text": "Knob", "bbox": {"l": 441.3895, "t": 281.48593, "r": 444.40371999999996, "b": 282.91939999999994, "coord_origin": "TOPLEFT"}}, {"id": 216, "text": "MODEL AY11236", "bbox": {"l": 398.79288, "t": 254.94646999999998, "r": 428.91568, "b": 258.85931000000005, "coord_origin": "TOPLEFT"}}, {"id": 217, "text": "MICROSCOPE USAGE", "bbox": {"l": 398.32535, "t": 305.04291, "r": 435.93542, "b": 308.95572000000004, "coord_origin": "TOPLEFT"}}, {"id": 218, "text": "BARSKA Model AY11236 is a powerful fixed power compound ", "bbox": {"l": 398.08594, "t": 310.35892, "r": 453.72171, "b": 312.53271, "coord_origin": "TOPLEFT"}}, {"id": 219, "text": "microscope designed for biological studies such as specimen ", "bbox": {"l": 398.08594, "t": 312.50586, "r": 453.09939999999995, "b": 314.67966, "coord_origin": "TOPLEFT"}}, {"id": 220, "text": "examination. It can also be used for examining bacteria and", "bbox": {"l": 398.08594, "t": 314.6528, "r": 456.65246999999994, "b": 316.8266, "coord_origin": "TOPLEFT"}}, {"id": 221, "text": "for general clinical and medical studies and other scientific uses. ", "bbox": {"l": 398.08594, "t": 316.79977, "r": 456.73859000000004, "b": 318.97354, "coord_origin": "TOPLEFT"}}, {"id": 222, "text": "CONSTRUCTION", "bbox": {"l": 398.62399, "t": 320.42941, "r": 427.77472, "b": 324.34222000000005, "coord_origin": "TOPLEFT"}}, {"id": 223, "text": "BARSKA Model AY11236 is a fixed power compound microscope.", "bbox": {"l": 398.08594, "t": 326.46069000000006, "r": 456.02639999999997, "b": 328.63449, "coord_origin": "TOPLEFT"}}, {"id": 224, "text": "It is constructed with two optical paths at the same angle. It is ", "bbox": {"l": 398.08414, "t": 328.6076699999999, "r": 455.42238999999995, "b": 330.7814599999999, "coord_origin": "TOPLEFT"}}, {"id": 225, "text": "equipped with transmitted illumination. By using this instrument, ", "bbox": {"l": 398.08414, "t": 330.75461, "r": 457.39844, "b": 332.92841, "coord_origin": "TOPLEFT"}}, {"id": 226, "text": "the user can observe specimens at magnification from 40x to ", "bbox": {"l": 398.08414, "t": 332.90155, "r": 453.97745, "b": 335.07535000000007, "coord_origin": "TOPLEFT"}}, {"id": 227, "text": "1000x by selecting the desired objective lens. Coarse and fine ", "bbox": {"l": 398.08414, "t": 335.04852, "r": 454.70708999999994, "b": 337.22232, "coord_origin": "TOPLEFT"}}, {"id": 228, "text": "focus adjustments provide accuracy and image detail. The rotating ", "bbox": {"l": 398.08414, "t": 337.19547, "r": 458.90240000000006, "b": 339.36926, "coord_origin": "TOPLEFT"}}, {"id": 229, "text": "head allows the user to position the eyepieces for maximum ", "bbox": {"l": 398.08594, "t": 339.34241, "r": 453.0672, "b": 341.5162, "coord_origin": "TOPLEFT"}}, {"id": 230, "text": "viewing comfort and easy access to all adjustment knobs.", "bbox": {"l": 398.08594, "t": 341.48938, "r": 449.63113, "b": 343.66318, "coord_origin": "TOPLEFT"}}, {"id": 231, "text": "Model AY11236", "bbox": {"l": 422.10626, "t": 301.24191, "r": 434.62433000000004, "b": 302.98096, "coord_origin": "TOPLEFT"}}, {"id": 232, "text": "Fine ", "bbox": {"l": 442.01610999999997, "t": 283.08649, "r": 444.8817399999999, "b": 284.51996, "coord_origin": "TOPLEFT"}}, {"id": 233, "text": "Adjustment", "bbox": {"l": 442.01610999999997, "t": 284.2663, "r": 448.85001, "b": 285.69980000000004, "coord_origin": "TOPLEFT"}}, {"id": 234, "text": "Knob", "bbox": {"l": 442.01610999999997, "t": 285.44611, "r": 445.03033000000005, "b": 286.87961, "coord_origin": "TOPLEFT"}}, {"id": 235, "text": "Stage", "bbox": {"l": 408.00577, "t": 279.12579000000005, "r": 411.42212, "b": 280.5593, "coord_origin": "TOPLEFT"}}, {"id": 236, "text": "Condenser ", "bbox": {"l": 404.07172, "t": 280.9144299999999, "r": 410.77707, "b": 282.3479, "coord_origin": "TOPLEFT"}}, {"id": 237, "text": "Focusing", "bbox": {"l": 404.07172, "t": 282.09424, "r": 409.2157, "b": 283.52774, "coord_origin": "TOPLEFT"}}, {"id": 238, "text": "Knob", "bbox": {"l": 404.07172, "t": 283.27408, "r": 407.08594, "b": 284.7075500000001, "coord_origin": "TOPLEFT"}}, {"id": 239, "text": "Eyepiece", "bbox": {"l": 441.81281, "t": 262.32178, "r": 447.03702, "b": 263.75525000000005, "coord_origin": "TOPLEFT"}}, {"id": 240, "text": "Stand", "bbox": {"l": 437.34607, "t": 271.13025000000005, "r": 440.80496, "b": 272.56281, "coord_origin": "TOPLEFT"}}, {"id": 241, "text": "Lamp ", "bbox": {"l": 409.7164, "t": 284.40027, "r": 413.3768, "b": 285.83282, "coord_origin": "TOPLEFT"}}, {"id": 242, "text": "On/Off", "bbox": {"l": 409.7164, "t": 285.83163, "r": 413.68201, "b": 287.26416, "coord_origin": "TOPLEFT"}}, {"id": 243, "text": "Switch", "bbox": {"l": 409.7164, "t": 287.263, "r": 413.6337, "b": 288.69553, "coord_origin": "TOPLEFT"}}, {"id": 244, "text": "Lamp ", "bbox": {"l": 434.8712499999999, "t": 296.7153, "r": 438.53164999999996, "b": 298.14783, "coord_origin": "TOPLEFT"}}, {"id": 245, "text": "Power", "bbox": {"l": 439.52039, "t": 292.18307000000004, "r": 443.08768, "b": 293.61560000000003, "coord_origin": "TOPLEFT"}}, {"id": 246, "text": "Cord", "bbox": {"l": 439.52039, "t": 293.61444, "r": 442.29575, "b": 295.04697, "coord_origin": "TOPLEFT"}}, {"id": 247, "text": "Rotating Head", "bbox": {"l": 413.55829, "t": 264.66089, "r": 421.94913, "b": 266.09344, "coord_origin": "TOPLEFT"}}, {"id": 248, "text": "Stage Clip", "bbox": {"l": 441.84316999999993, "t": 286.90573, "r": 447.87585000000007, "b": 288.33826, "coord_origin": "TOPLEFT"}}, {"id": 249, "text": "Adjustment", "bbox": {"l": 441.84316999999993, "t": 288.3371, "r": 448.67252, "b": 289.76962000000003, "coord_origin": "TOPLEFT"}}, {"id": 250, "text": "Interpupillary Slide Adjustment", "bbox": {"l": 407.2403, "t": 259.86645999999996, "r": 425.79089, "b": 261.29895, "coord_origin": "TOPLEFT"}}, {"id": 251, "text": "Circling Minimums", "bbox": {"l": 449.10074000000003, "t": 378.66302, "r": 466.08835000000005, "b": 380.78412, "coord_origin": "TOPLEFT"}}, {"id": 252, "text": "7", "bbox": {"l": 449.10074000000003, "t": 383.2203999999999, "r": 449.64444, "b": 385.34148999999996, "coord_origin": "TOPLEFT"}}, {"id": 253, "text": "K H U H Z D V D F K D Q J H W R W K H 7 ( 5 3 6 F U L W H U L D L Q W K D W D \u1087H F W V F L U F O L Q J D U H D G L P H Q V L R Q E \\ H [ S D Q G L Q J W K H D U H D V W R S U R Y L G H ", "bbox": {"l": 450.18811, "t": 383.2203999999999, "r": 550.77124, "b": 385.34148999999996, "coord_origin": "TOPLEFT"}}, {"id": 254, "text": "improved obstacle protection. To indicate that the new criteria had been applied to a given procedure, a ", "bbox": {"l": 449.10074000000003, "t": 385.75732, "r": 536.14716, "b": 387.87842, "coord_origin": "TOPLEFT"}}, {"id": 255, "text": " is placed on ", "bbox": {"l": 538.31085, "t": 385.75732, "r": 549.49921, "b": 387.87842, "coord_origin": "TOPLEFT"}}, {"id": 256, "text": "the circling line of minimums. The new circling tables and explanatory information is located in the Legend of the TPP.", "bbox": {"l": 449.10074000000003, "t": 388.03601, "r": 547.58185, "b": 390.1571, "coord_origin": "TOPLEFT"}}, {"id": 257, "text": "7", "bbox": {"l": 449.10074000000003, "t": 393.2128000000001, "r": 449.6163, "b": 395.33386, "coord_origin": "TOPLEFT"}}, {"id": 258, "text": "K H D S S U R D F K H V X V L Q J V W D Q G D U G F L U F O L Q J D S S U R D F K D U H D V F D Q E H L G H Q W L \u00bf H G E \\ W K H D E V H Q F H R I W K H ", "bbox": {"l": 450.1319, "t": 393.2128000000001, "r": 529.53082, "b": 395.33386, "coord_origin": "TOPLEFT"}}, {"id": 259, "text": " on the circling line of ", "bbox": {"l": 532.05829, "t": 393.2128000000001, "r": 550.42261, "b": 395.33386, "coord_origin": "TOPLEFT"}}, {"id": 260, "text": "minima.", "bbox": {"l": 449.10074000000003, "t": 395.49149, "r": 455.74692, "b": 397.61255, "coord_origin": "TOPLEFT"}}, {"id": 261, "text": "$ S S O \\ 6 W D Q G D U G & L U F O L Q J $ S S U R D F K 0 D Q H X Y H U L Q J 5 D G L X V 7 D E O H ", "bbox": {"l": 449.95525999999995, "t": 415.59549, "r": 496.2829, "b": 417.50446, "coord_origin": "TOPLEFT"}}, {"id": 262, "text": "$ S S O \\ ( [ S D Q G H G & L U F O L Q J $ S S U R D F K 0 D Q H X Y H U L Q J $ L U V S D F H 5 D G L X V ", "bbox": {"l": 501.13077, "t": 409.25543, "r": 551.16101, "b": 411.1644, "coord_origin": "TOPLEFT"}}, {"id": 263, "text": "Table", "bbox": {"l": 501.13077, "t": 411.30624, "r": 505.2477999999999, "b": 413.21521, "coord_origin": "TOPLEFT"}}, {"id": 264, "text": "AIRPORT SKETCH", "bbox": {"l": 449.10074000000003, "t": 420.18802, "r": 469.35599, "b": 422.73331, "coord_origin": "TOPLEFT"}}, {"id": 265, "text": "The airport sketch is a depiction of the airport with emphasis on runway pattern and related ", "bbox": {"l": 449.10074000000003, "t": 425.08908, "r": 525.93616, "b": 427.21017, "coord_origin": "TOPLEFT"}}, {"id": 266, "text": "information, positioned in either the lower left or lower right corner of the chart to aid pi-", "bbox": {"l": 449.10074000000003, "t": 427.3678, "r": 522.0343, "b": 429.48886, "coord_origin": "TOPLEFT"}}, {"id": 267, "text": "lot recognition of the airport from the air and to provide some information to aid on ground ", "bbox": {"l": 449.10074000000003, "t": 429.64648, "r": 524.67151, "b": 431.76755, "coord_origin": "TOPLEFT"}}, {"id": 268, "text": "navigation of the airport. The runways are drawn to scale and oriented to true north. Runway ", "bbox": {"l": 449.10074000000003, "t": 431.92514000000006, "r": 527.172, "b": 434.04623, "coord_origin": "TOPLEFT"}}, {"id": 269, "text": "dimensions (length and width) are shown for all active runways.", "bbox": {"l": 449.10074000000003, "t": 434.20383, "r": 502.39545, "b": 436.32492, "coord_origin": "TOPLEFT"}}, {"id": 270, "text": "Runway(s) are depicted based on what type and construction of the runway.", "bbox": {"l": 449.10074000000003, "t": 438.7611999999999, "r": 512.92676, "b": 440.88228999999995, "coord_origin": "TOPLEFT"}}, {"id": 271, "text": "Hard Surface", "bbox": {"l": 449.95525999999995, "t": 444.07001, "r": 460.02307, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}, {"id": 272, "text": "Other Than ", "bbox": {"l": 464.89963, "t": 444.07001, "r": 473.98819, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}, {"id": 273, "text": "Hard Surface", "bbox": {"l": 464.89963, "t": 446.12085, "r": 474.96744, "b": 448.02979, "coord_origin": "TOPLEFT"}}, {"id": 274, "text": "Metal Surface", "bbox": {"l": 478.91357, "t": 444.07001, "r": 489.45648, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}, {"id": 275, "text": "Closed Runway", "bbox": {"l": 493.06420999999995, "t": 444.07001, "r": 505.03076, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}, {"id": 276, "text": "Under Construction", "bbox": {"l": 509.5809, "t": 444.07001, "r": 524.30237, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}, {"id": 277, "text": "Stopways, ", "bbox": {"l": 449.95525999999995, "t": 454.81207, "r": 458.31406, "b": 456.72104, "coord_origin": "TOPLEFT"}}, {"id": 278, "text": "Taxiways, Park-", "bbox": {"l": 449.95525999999995, "t": 456.86288, "r": 461.92083999999994, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}}, {"id": 279, "text": "ing Areas", "bbox": {"l": 449.95525999999995, "t": 458.91373, "r": 457.08014, "b": 460.82268999999997, "coord_origin": "TOPLEFT"}}, {"id": 280, "text": "Displaced ", "bbox": {"l": 464.89963, "t": 454.81207, "r": 472.87732, "b": 456.72104, "coord_origin": "TOPLEFT"}}, {"id": 281, "text": "Threshold", "bbox": {"l": 464.89963, "t": 456.86288, "r": 472.49792, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}}, {"id": 282, "text": "Closed", "bbox": {"l": 478.91357, "t": 454.81207, "r": 483.61584, "b": 456.72104, "coord_origin": "TOPLEFT"}}, {"id": 283, "text": "Pavement", "bbox": {"l": 478.91357, "t": 456.86288, "r": 486.60754000000003, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}}, {"id": 284, "text": "Water Runway", "bbox": {"l": 493.06420999999995, "t": 454.81207, "r": 504.20648, "b": 456.72104, "coord_origin": "TOPLEFT"}}, {"id": 285, "text": "Taxiways and aprons are shaded grey. Other runway features that may be shown are runway numbers, runway dimen-", "bbox": {"l": 449.10074000000003, "t": 469.32974, "r": 548.59674, "b": 471.45081, "coord_origin": "TOPLEFT"}}, {"id": 286, "text": "sions, runway slope, arresting gear, and displaced threshold.", "bbox": {"l": 449.10074000000003, "t": 471.60843, "r": 500.08181999999994, "b": 473.72949, "coord_origin": "TOPLEFT"}}, {"id": 287, "text": "2", "bbox": {"l": 449.10074000000003, "t": 476.16577, "r": 449.59933000000007, "b": 478.28687, "coord_origin": "TOPLEFT"}}, {"id": 288, "text": "W K H U L Q I R U P D W L R Q F R Q F H U Q L Q J O L J K W L Q J \u00bf Q D O D S S U R D F K E H D U L Q J V D L U S R U W E H D F R Q R E V W D F O H V F R Q W U R O W R Z H U 1 $ 9 $ , ' V K H O L ", "bbox": {"l": 450.09796, "t": 476.16577, "r": 547.82562, "b": 478.28687, "coord_origin": "TOPLEFT"}}, {"id": 289, "text": "-", "bbox": {"l": 547.82623, "t": 476.16577, "r": 548.45862, "b": 478.28687, "coord_origin": "TOPLEFT"}}, {"id": 290, "text": "pads may also be shown.", "bbox": {"l": 449.10074000000003, "t": 478.44446, "r": 470.52609000000007, "b": 480.56555, "coord_origin": "TOPLEFT"}}, {"id": 291, "text": "$ L U S R U W ( O H Y D W L R Q D Q G 7 R X F K G R Z Q = R Q H ( O H Y D W L R Q ", "bbox": {"l": 449.10074000000003, "t": 483.00183, "r": 493.37906000000004, "b": 485.12292, "coord_origin": "TOPLEFT"}}, {"id": 292, "text": "The airport elevation is shown enclosed within a box in the upper left corner of the sketch box and the touchdown zone ", "bbox": {"l": 449.10074000000003, "t": 487.5592, "r": 549.16168, "b": 489.6803, "coord_origin": "TOPLEFT"}}, {"id": 293, "text": "elevation (TDZE) is shown in the upper right corner of the sketch box. The airport elevation is the highest point of an ", "bbox": {"l": 449.10074000000003, "t": 489.83789, "r": 546.90881, "b": 491.95898, "coord_origin": "TOPLEFT"}}, {"id": 294, "text": "D L U S R U W \u00b6 V X V D E O H U X Q Z D \\ V P H D V X U H G L Q I H H W I U R P P H D Q V H D O H Y H O 7 K H 7 ' = ( L V W K H K L J K H V W H O H Y D W L R Q L Q W K H \u00bf U V W I H H W R I ", "bbox": {"l": 449.10074000000003, "t": 492.11658, "r": 551.80023, "b": 494.23767, "coord_origin": "TOPLEFT"}}, {"id": 295, "text": "the landing surface. Circling only approaches will not show a TDZE.", "bbox": {"l": 449.10074000000003, "t": 494.39526, "r": 505.85068000000007, "b": 496.51636, "coord_origin": "TOPLEFT"}}, {"id": 296, "text": "114", "bbox": {"l": 498.80661000000003, "t": 515.9437, "r": 502.08792, "b": 519.01764, "coord_origin": "TOPLEFT"}}, {"id": 297, "text": "FAA Chart Users\u2019 Guide - Terminal Procedures Publication (TPP) - Terms", "bbox": {"l": 444.56319999999994, "t": 422.84869, "r": 446.25998, "b": 471.87128, "coord_origin": "TOPLEFT"}}, {"id": 298, "text": "AGL 2013 Financial Calendar", "bbox": {"l": 329.40536, "t": 379.37537, "r": 355.13138, "b": 382.13336, "coord_origin": "TOPLEFT"}}, {"id": 299, "text": "22", "bbox": {"l": 329.40536, "t": 382.30273, "r": 330.96848, "b": 384.55927, "coord_origin": "TOPLEFT"}}, {"id": 300, "text": "August 2012 ", "bbox": {"l": 331.75003, "t": 382.30273, "r": 341.12875, "b": 384.55927, "coord_origin": "TOPLEFT"}}, {"id": 301, "text": "2012 full year result and fi nal dividend announced", "bbox": {"l": 350.4722, "t": 382.30273, "r": 384.81079, "b": 384.55927, "coord_origin": "TOPLEFT"}}, {"id": 302, "text": "30", "bbox": {"l": 329.40536, "t": 384.84552, "r": 330.97336, "b": 387.10205, "coord_origin": "TOPLEFT"}}, {"id": 303, "text": "August 2012 ", "bbox": {"l": 331.75735, "t": 384.84552, "r": 341.16534, "b": 387.10205, "coord_origin": "TOPLEFT"}}, {"id": 304, "text": "Ex-dividend trading commences", "bbox": {"l": 350.4722, "t": 384.84552, "r": 372.90613, "b": 387.10205, "coord_origin": "TOPLEFT"}}, {"id": 305, "text": "5", "bbox": {"l": 329.40536, "t": 387.38828, "r": 330.20337, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}}, {"id": 306, "text": "September 2012 ", "bbox": {"l": 331.00137, "t": 387.38828, "r": 342.9715, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}}, {"id": 307, "text": "Record date for 2012 fi nal dividend", "bbox": {"l": 350.4722, "t": 387.38828, "r": 374.88693, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}}, {"id": 308, "text": "27", "bbox": {"l": 329.40536, "t": 389.93103, "r": 331.0173, "b": 392.18762, "coord_origin": "TOPLEFT"}}, {"id": 309, "text": "September 2012 ", "bbox": {"l": 331.82327, "t": 389.93103, "r": 343.91284, "b": 392.18762, "coord_origin": "TOPLEFT"}}, {"id": 310, "text": "Final dividend payable", "bbox": {"l": 350.4722, "t": 389.93103, "r": 365.65988, "b": 392.18762, "coord_origin": "TOPLEFT"}}, {"id": 311, "text": "23", "bbox": {"l": 329.40536, "t": 392.47382, "r": 330.98804, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}}, {"id": 312, "text": "October 2012 ", "bbox": {"l": 331.77936, "t": 392.47382, "r": 342.06674, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}}, {"id": 313, "text": "Annual General Meeting", "bbox": {"l": 350.4722, "t": 392.47382, "r": 367.22156, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}}, {"id": 314, "text": "27", "bbox": {"l": 329.40536, "t": 395.0166, "r": 330.99741, "b": 397.27313, "coord_origin": "TOPLEFT"}}, {"id": 315, "text": "February 2013", "bbox": {"l": 331.7934, "t": 395.0166, "r": 342.1416, "b": 397.27313, "coord_origin": "TOPLEFT"}}, {"id": 316, "text": " 1", "bbox": {"l": 342.64841, "t": 395.18298, "r": 342.65811, "b": 396.49857000000003, "coord_origin": "TOPLEFT"}}, {"id": 317, "text": "2013 interim result and interim dividend announced", "bbox": {"l": 350.47177, "t": 395.01474, "r": 386.25897, "b": 397.2713, "coord_origin": "TOPLEFT"}}, {"id": 318, "text": "28", "bbox": {"l": 329.40491, "t": 397.55749999999995, "r": 331.02695, "b": 399.81406, "coord_origin": "TOPLEFT"}}, {"id": 319, "text": "August 2013", "bbox": {"l": 331.83795, "t": 397.55749999999995, "r": 340.75909, "b": 399.81406, "coord_origin": "TOPLEFT"}}, {"id": 320, "text": " 1", "bbox": {"l": 341.26437, "t": 397.7254, "r": 341.27408, "b": 399.04095, "coord_origin": "TOPLEFT"}}, {"id": 321, "text": "2013 full year results and fi nal dividend announced ", "bbox": {"l": 350.47144, "t": 397.55713, "r": 385.93265, "b": 399.81369, "coord_origin": "TOPLEFT"}}, {"id": 322, "text": "1", "bbox": {"l": 329.40536, "t": 400.46155, "r": 329.87708, "b": 401.96588, "coord_origin": "TOPLEFT"}}, {"id": 323, "text": "Indicative dates only, subject to change/Board confi rmation", "bbox": {"l": 330.34882, "t": 400.46155, "r": 358.65204, "b": 401.96588, "coord_origin": "TOPLEFT"}}, {"id": 324, "text": "AGL\u2019s Annual General Meeting will be held at the City Recital Hall, Angel Place, Sydney ", "bbox": {"l": 329.40536, "t": 404.34503, "r": 391.771, "b": 406.60156, "coord_origin": "TOPLEFT"}}, {"id": 325, "text": "commencing at 10.30am on Tuesday 23 October 2012.", "bbox": {"l": 329.40536, "t": 406.37857, "r": 369.65308, "b": 408.63513000000006, "coord_origin": "TOPLEFT"}}, {"id": 326, "text": "Ye s te rd ay", "bbox": {"l": 363.54486, "t": 460.53054999999995, "r": 379.25955, "b": 465.54507, "coord_origin": "TOPLEFT"}}, {"id": 327, "text": "Established in Sydney in 1837, and then ", "bbox": {"l": 363.54486, "t": 466.7157, "r": 391.38229, "b": 468.97223, "coord_origin": "TOPLEFT"}}, {"id": 328, "text": "known as The Australian Gas Light Company, ", "bbox": {"l": 363.54486, "t": 468.74924, "r": 395.01788, "b": 471.00577, "coord_origin": "TOPLEFT"}}, {"id": 329, "text": "the AGL business has an established history ", "bbox": {"l": 363.54486, "t": 470.78281, "r": 394.08322, "b": 473.03934, "coord_origin": "TOPLEFT"}}, {"id": 330, "text": "and reputation for serving the gas and ", "bbox": {"l": 363.54486, "t": 472.81635, "r": 390.60727, "b": 475.07288, "coord_origin": "TOPLEFT"}}, {"id": 331, "text": "electricity needs of Australian households. ", "bbox": {"l": 363.54486, "t": 474.84988, "r": 393.49612, "b": 477.10645, "coord_origin": "TOPLEFT"}}, {"id": 332, "text": "In 1841, when AGL supplied the gas to light ", "bbox": {"l": 363.54486, "t": 476.88345, "r": 394.11481, "b": 479.13998, "coord_origin": "TOPLEFT"}}, {"id": 333, "text": "the fi rst public street lamp, it was reported ", "bbox": {"l": 363.54486, "t": 478.91699, "r": 393.75891, "b": 481.17352, "coord_origin": "TOPLEFT"}}, {"id": 334, "text": "in the Sydney Gazette as a \u201cwonderful ", "bbox": {"l": 363.54486, "t": 480.95053, "r": 390.4975, "b": 483.20709, "coord_origin": "TOPLEFT"}}, {"id": 335, "text": "achievement of scientifi c knowledge, assisted ", "bbox": {"l": 363.54486, "t": 482.9841, "r": 395.70975, "b": 485.24063, "coord_origin": "TOPLEFT"}}, {"id": 336, "text": "by mechanical ingenuity.\u201d Within two years, ", "bbox": {"l": 363.54486, "t": 485.01764, "r": 394.27283, "b": 487.2742, "coord_origin": "TOPLEFT"}}, {"id": 337, "text": "165 gas lamps were lighting the City of Sydney.", "bbox": {"l": 363.54486, "t": 487.05121, "r": 396.65939, "b": 489.30774, "coord_origin": "TOPLEFT"}}, {"id": 338, "text": "Looking back on ", "bbox": {"l": 329.4054, "t": 419.93124, "r": 384.19696, "b": 431.09412, "coord_origin": "TOPLEFT"}}, {"id": 339, "text": "175 years of ", "bbox": {"l": 329.4054, "t": 430.10379, "r": 372.16626, "b": 441.26669, "coord_origin": "TOPLEFT"}}, {"id": 340, "text": "looking forward.", "bbox": {"l": 329.4054, "t": 440.27636999999993, "r": 385.3981, "b": 451.43924, "coord_origin": "TOPLEFT"}}, {"id": 341, "text": "AGL Energy Limited ABN 74 115 061 375", "bbox": {"l": 329.40536, "t": 372.16159, "r": 353.36179, "b": 373.91669, "coord_origin": "TOPLEFT"}}, {"id": 342, "text": "29", "bbox": {"l": 546.20587, "t": 360.90448, "r": 548.23407, "b": 362.82242, "coord_origin": "TOPLEFT"}}, {"id": 343, "text": "signs, signals and road markings", "bbox": {"l": 497.77728, "t": 251.43384000000003, "r": 542.8255, "b": 254.94385, "coord_origin": "TOPLEFT"}}, {"id": 344, "text": "3", "bbox": {"l": 490.30679, "t": 251.47478999999998, "r": 492.09982, "b": 254.98479999999995, "coord_origin": "TOPLEFT"}}, {"id": 345, "text": "In ", "bbox": {"l": 498.15335, "t": 263.88922, "r": 500.05637, "b": 265.92719, "coord_origin": "TOPLEFT"}}, {"id": 346, "text": "chapter 2, you and your vehicle", "bbox": {"l": 500.05637, "t": 263.85717999999997, "r": 524.37036, "b": 265.86310000000003, "coord_origin": "TOPLEFT"}}, {"id": 347, "text": ", you learned about ", "bbox": {"l": 524.37036, "t": 263.88922, "r": 539.89124, "b": 265.92719, "coord_origin": "TOPLEFT"}}, {"id": 348, "text": "some of the controls in your vehicle. This chapter is a handy ", "bbox": {"l": 498.15335, "t": 265.93224999999995, "r": 544.50403, "b": 267.97020999999995, "coord_origin": "TOPLEFT"}}, {"id": 349, "text": "reference section that gives examples of the most common ", "bbox": {"l": 498.15335, "t": 267.97533999999996, "r": 544.01343, "b": 270.01331000000005, "coord_origin": "TOPLEFT"}}, {"id": 350, "text": "signs, signals and road markings that keep traffi c organized ", "bbox": {"l": 498.15335, "t": 270.01831000000004, "r": 544.11987, "b": 272.05634, "coord_origin": "TOPLEFT"}}, {"id": 351, "text": "and flowing smoothly. ", "bbox": {"l": 498.15335, "t": 272.06140000000005, "r": 515.41071, "b": 274.09937, "coord_origin": "TOPLEFT"}}, {"id": 352, "text": "Signs", "bbox": {"l": 498.15335, "t": 277.34619, "r": 505.64642000000003, "b": 280.9357, "coord_origin": "TOPLEFT"}}, {"id": 353, "text": "There are three ways to read signs: by their shape, colour and ", "bbox": {"l": 498.15335, "t": 281.82187, "r": 543.92957, "b": 283.85983, "coord_origin": "TOPLEFT"}}, {"id": 354, "text": "the messages printed on them. Understanding these three ways ", "bbox": {"l": 498.15335, "t": 283.8649, "r": 545.67834, "b": 285.90289, "coord_origin": "TOPLEFT"}}, {"id": 355, "text": "of classifying signs will help you figure out the meaning of signs ", "bbox": {"l": 498.15335, "t": 285.90796, "r": 545.26471, "b": 287.94592, "coord_origin": "TOPLEFT"}}, {"id": 356, "text": "that are new to you. ", "bbox": {"l": 498.15335, "t": 287.95099, "r": 513.31335, "b": 289.98895, "coord_origin": "TOPLEFT"}}, {"id": 357, "text": "Stop", "bbox": {"l": 505.43439, "t": 303.07596, "r": 508.53033000000005, "b": 304.89639, "coord_origin": "TOPLEFT"}}, {"id": 358, "text": "Yield the right-of-way", "bbox": {"l": 527.45502, "t": 303.25354, "r": 541.44678, "b": 305.07397, "coord_origin": "TOPLEFT"}}, {"id": 359, "text": "Shows driving", "bbox": {"l": 501.79385, "t": 321.18973, "r": 510.41632, "b": 323.01016, "coord_origin": "TOPLEFT"}}, {"id": 360, "text": "regulations", "bbox": {"l": 501.79385, "t": 322.87731999999994, "r": 509.04268999999994, "b": 324.69775000000004, "coord_origin": "TOPLEFT"}}, {"id": 361, "text": "Explains lane use", "bbox": {"l": 518.66455, "t": 319.59146, "r": 529.80902, "b": 321.41190000000006, "coord_origin": "TOPLEFT"}}, {"id": 362, "text": "School zone signs ", "bbox": {"l": 534.87561, "t": 318.37616, "r": 546.95142, "b": 320.19659, "coord_origin": "TOPLEFT"}}, {"id": 363, "text": "are fl uorescent ", "bbox": {"l": 534.87561, "t": 320.0637500000001, "r": 545.05762, "b": 321.88419, "coord_origin": "TOPLEFT"}}, {"id": 364, "text": "yellow-green", "bbox": {"l": 534.87561, "t": 321.75134, "r": 543.32263, "b": 323.57178, "coord_origin": "TOPLEFT"}}, {"id": 365, "text": "Tells about motorist ", "bbox": {"l": 499.21862999999996, "t": 338.12772, "r": 512.62451, "b": 339.94815, "coord_origin": "TOPLEFT"}}, {"id": 366, "text": "services", "bbox": {"l": 499.21862999999996, "t": 339.81531000000007, "r": 504.39917, "b": 341.63574, "coord_origin": "TOPLEFT"}}, {"id": 367, "text": "Shows a permitted ", "bbox": {"l": 516.97748, "t": 338.06039, "r": 529.77484, "b": 339.88082999999995, "coord_origin": "TOPLEFT"}}, {"id": 368, "text": "action", "bbox": {"l": 516.97748, "t": 339.74799, "r": 520.96399, "b": 341.56842, "coord_origin": "TOPLEFT"}}, {"id": 369, "text": "Shows an action that ", "bbox": {"l": 534.55847, "t": 337.88281, "r": 548.58453, "b": 339.7032500000001, "coord_origin": "TOPLEFT"}}, {"id": 370, "text": "is not permitted", "bbox": {"l": 534.55847, "t": 339.57040000000006, "r": 545.08862, "b": 341.39084, "coord_origin": "TOPLEFT"}}, {"id": 371, "text": "Warns of hazards ", "bbox": {"l": 483.05853, "t": 356.17416, "r": 494.72577, "b": 357.9946, "coord_origin": "TOPLEFT"}}, {"id": 372, "text": "ahead", "bbox": {"l": 483.05853, "t": 357.86179, "r": 487.07525999999996, "b": 359.68222, "coord_origin": "TOPLEFT"}}, {"id": 373, "text": "Warns of", "bbox": {"l": 499.39645, "t": 356.26297000000005, "r": 504.69171, "b": 358.0834, "coord_origin": "TOPLEFT"}}, {"id": 374, "text": "construction zones", "bbox": {"l": 499.39645, "t": 357.95056, "r": 511.69116, "b": 359.77099999999996, "coord_origin": "TOPLEFT"}}, {"id": 375, "text": "Railway crossing", "bbox": {"l": 516.75891, "t": 356.26297000000005, "r": 527.42938, "b": 358.0834, "coord_origin": "TOPLEFT"}}, {"id": 376, "text": "Shows distance and ", "bbox": {"l": 534.5141, "t": 352.92981, "r": 547.89862, "b": 354.75024, "coord_origin": "TOPLEFT"}}, {"id": 377, "text": "direction", "bbox": {"l": 534.5141, "t": 354.6174, "r": 540.2818, "b": 356.43784, "coord_origin": "TOPLEFT"}}, {"id": 378, "text": "\u2022", "bbox": {"l": 478.37466, "t": 270.14075, "r": 479.14251999999993, "b": 272.17877, "coord_origin": "TOPLEFT"}}, {"id": 379, "text": "Signs", "bbox": {"l": 479.91036999999994, "t": 270.14075, "r": 483.74963, "b": 272.17877, "coord_origin": "TOPLEFT"}}, {"id": 380, "text": "- regulatory signs", "bbox": {"l": 479.97293, "t": 272.84717, "r": 492.31219, "b": 274.34888, "coord_origin": "TOPLEFT"}}, {"id": 381, "text": "- school, ", "bbox": {"l": 479.97293, "t": 275.14513999999997, "r": 486.72598000000005, "b": 276.64679, "coord_origin": "TOPLEFT"}}, {"id": 382, "text": "playground and ", "bbox": {"l": 481.21602999999993, "t": 276.77972, "r": 492.93286000000006, "b": 278.81768999999997, "coord_origin": "TOPLEFT"}}, {"id": 383, "text": "crosswalk signs", "bbox": {"l": 481.21602999999993, "t": 278.82275000000004, "r": 491.82938000000007, "b": 280.86075, "coord_origin": "TOPLEFT"}}, {"id": 384, "text": "- lane use signs", "bbox": {"l": 479.97293, "t": 281.52759, "r": 491.00775000000004, "b": 283.02924, "coord_origin": "TOPLEFT"}}, {"id": 385, "text": "- turn control signs", "bbox": {"l": 479.97293, "t": 283.82556, "r": 493.32748, "b": 285.3272099999999, "coord_origin": "TOPLEFT"}}, {"id": 386, "text": "- parking signs", "bbox": {"l": 479.97293, "t": 286.1235, "r": 490.4915199999999, "b": 287.62518, "coord_origin": "TOPLEFT"}}, {"id": 387, "text": "- reserved lane ", "bbox": {"l": 479.97293, "t": 288.42148, "r": 491.17004000000003, "b": 289.92316, "coord_origin": "TOPLEFT"}}, {"id": 388, "text": "signs", "bbox": {"l": 481.21602999999993, "t": 290.05605999999995, "r": 484.77405000000005, "b": 292.09406, "coord_origin": "TOPLEFT"}}, {"id": 389, "text": "- warning signs", "bbox": {"l": 479.97293, "t": 292.76169000000004, "r": 490.83398, "b": 294.26334, "coord_origin": "TOPLEFT"}}, {"id": 390, "text": "- object markers", "bbox": {"l": 479.97293, "t": 295.05963, "r": 491.62692, "b": 296.56131, "coord_origin": "TOPLEFT"}}, {"id": 391, "text": "- construction ", "bbox": {"l": 479.97293, "t": 297.3576, "r": 490.37341, "b": 298.8592499999999, "coord_origin": "TOPLEFT"}}, {"id": 392, "text": "signs", "bbox": {"l": 481.21602999999993, "t": 298.99219, "r": 484.77405000000005, "b": 301.03015, "coord_origin": "TOPLEFT"}}, {"id": 393, "text": "- information and ", "bbox": {"l": 479.97293, "t": 301.69780999999995, "r": 492.93912, "b": 303.19946, "coord_origin": "TOPLEFT"}}, {"id": 394, "text": "destination signs", "bbox": {"l": 481.21602999999993, "t": 303.3324, "r": 493.00525, "b": 305.37036, "coord_origin": "TOPLEFT"}}, {"id": 395, "text": "- railway signs", "bbox": {"l": 479.97293, "t": 306.0379899999999, "r": 489.99047999999993, "b": 307.53967, "coord_origin": "TOPLEFT"}}, {"id": 396, "text": "\u2022", "bbox": {"l": 478.375, "t": 308.24789, "r": 479.1032400000001, "b": 310.28586, "coord_origin": "TOPLEFT"}}, {"id": 397, "text": "Signals", "bbox": {"l": 479.83151, "t": 308.24789, "r": 484.92925999999994, "b": 310.28586, "coord_origin": "TOPLEFT"}}, {"id": 398, "text": "- lane control ", "bbox": {"l": 479.97293, "t": 310.95358, "r": 490.00091999999995, "b": 312.45526, "coord_origin": "TOPLEFT"}}, {"id": 399, "text": "signals", "bbox": {"l": 481.21602999999993, "t": 312.5881999999999, "r": 485.95331, "b": 314.62616, "coord_origin": "TOPLEFT"}}, {"id": 400, "text": "- traffic lights", "bbox": {"l": 479.97293, "t": 315.29379, "r": 489.29876999999993, "b": 316.79544, "coord_origin": "TOPLEFT"}}, {"id": 401, "text": "\u2022", "bbox": {"l": 478.375, "t": 317.50366, "r": 479.18129999999996, "b": 319.5416599999999, "coord_origin": "TOPLEFT"}}, {"id": 402, "text": "Road markings", "bbox": {"l": 479.98761, "t": 317.50366, "r": 490.46960000000007, "b": 319.5416599999999, "coord_origin": "TOPLEFT"}}, {"id": 403, "text": "- yellow lines", "bbox": {"l": 479.97293, "t": 320.20938, "r": 489.26166000000006, "b": 321.71103, "coord_origin": "TOPLEFT"}}, {"id": 404, "text": "- white lines", "bbox": {"l": 479.97293, "t": 322.50732, "r": 488.59189, "b": 324.009, "coord_origin": "TOPLEFT"}}, {"id": 405, "text": "- reserved lane ", "bbox": {"l": 479.97293, "t": 324.8053, "r": 491.17004000000003, "b": 326.30698, "coord_origin": "TOPLEFT"}}, {"id": 406, "text": "markings", "bbox": {"l": 481.21602999999993, "t": 326.43988, "r": 487.58978, "b": 328.47784, "coord_origin": "TOPLEFT"}}, {"id": 407, "text": "- other markings", "bbox": {"l": 479.97293, "t": 329.14551, "r": 491.75177, "b": 330.64716, "coord_origin": "TOPLEFT"}}, {"id": 408, "text": "in this chapter", "bbox": {"l": 478.15246999999994, "t": 265.07030999999995, "r": 493.75586, "b": 268.06872999999996, "coord_origin": "TOPLEFT"}}], "children": [{"id": 32, "label": "text", "bbox": {"l": 327.86951, "t": 351.78085, "r": 330.41248, "b": 353.95465, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "13", "bbox": {"l": 327.86951, "t": 351.78085, "r": 330.41248, "b": 353.95465, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 327.83005, "t": 331.57268999999997, "r": 351.16092, "b": 333.31171, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "USING THE VERTICAL TUBE -", "bbox": {"l": 327.83005, "t": 331.57268999999997, "r": 351.16092, "b": 333.31171, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 327.83005, "t": 333.18292, "r": 348.30536, "b": 334.92194, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "MODELS AY11230/11234", "bbox": {"l": 327.83005, "t": 333.18292, "r": 348.30536, "b": 334.92194, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 327.83005, "t": 336.40439, "r": 329.05914, "b": 337.92606, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "1.", "bbox": {"l": 327.83005, "t": 336.40439, "r": 329.05914, "b": 337.92606, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 329.67368, "t": 336.40439, "r": 349.95349, "b": 337.92606, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "The vertical tube can be used for", "bbox": {"l": 329.67368, "t": 336.40439, "r": 349.95349, "b": 337.92606, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 329.11752, "t": 337.83588, "r": 353.57977, "b": 339.35751000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "instructional viewing or to photograph", "bbox": {"l": 329.11752, "t": 337.83588, "r": 353.57977, "b": 339.35751000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 327.77121, "t": 339.26736, "r": 352.4306, "b": 340.789, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": " the image with a digital camera or a", "bbox": {"l": 327.77121, "t": 339.26736, "r": 352.4306, "b": 340.789, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 328.15176, "t": 340.69882, "r": 337.91086, "b": 342.22049, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": " micro TV unit", "bbox": {"l": 328.15176, "t": 340.69882, "r": 337.91086, "b": 342.22049, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 327.8313, "t": 342.19043000000005, "r": 329.09155, "b": 343.71207, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "2.", "bbox": {"l": 327.8313, "t": 342.19043000000005, "r": 329.09155, "b": 343.71207, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 329.72168, "t": 342.19043000000005, "r": 354.9267, "b": 343.71207, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "Loosen the retention screw, then rotate ", "bbox": {"l": 329.72168, "t": 342.19043000000005, "r": 354.9267, "b": 343.71207, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 327.8313, "t": 343.62192, "r": 351.66949, "b": 345.14355, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": " the adjustment ring to change the ", "bbox": {"l": 327.8313, "t": 343.62192, "r": 351.66949, "b": 345.14355, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 328.21185, "t": 345.05338, "r": 346.33179, "b": 346.57504, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": " length of the vertical tube.", "bbox": {"l": 328.21185, "t": 345.05338, "r": 346.33179, "b": 346.57504, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 327.83005, "t": 346.84680000000003, "r": 329.12726, "b": 348.36847, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "3.", "bbox": {"l": 327.83005, "t": 346.84680000000003, "r": 329.12726, "b": 348.36847, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 329.77588, "t": 346.84680000000003, "r": 351.18005, "b": 348.36847, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "Make sure that both the images in", "bbox": {"l": 329.77588, "t": 346.84680000000003, "r": 351.18005, "b": 348.36847, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 327.25311, "t": 254.94812000000002, "r": 350.07861, "b": 258.86096, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "OPERATION ", "bbox": {"l": 327.25311, "t": 254.94812000000002, "r": 350.07861, "b": 258.86096, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 350.07861, "t": 254.76782000000003, "r": 351.82651, "b": 258.68066, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "(", "bbox": {"l": 350.07861, "t": 254.76782000000003, "r": 351.82651, "b": 258.68066, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 351.82651, "t": 254.94812000000002, "r": 360.85242, "b": 258.86096, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "cont.", "bbox": {"l": 351.82651, "t": 254.94812000000002, "r": 360.85242, "b": 258.86096, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 360.85242, "t": 254.76782000000003, "r": 362.60028, "b": 258.68066, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": ")", "bbox": {"l": 360.85242, "t": 254.76782000000003, "r": 362.60028, "b": 258.68066, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 326.88037, "t": 263.49492999999995, "r": 345.84351, "b": 265.23395000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "SELECTING OBJECTIVE ", "bbox": {"l": 326.88037, "t": 263.49492999999995, "r": 345.84351, "b": 265.23395000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 326.88037, "t": 265.10515999999996, "r": 340.54153, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "MAGNIFICATION", "bbox": {"l": 326.88037, "t": 265.10515999999996, "r": 340.54153, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 326.88037, "t": 266.71533, "r": 328.31903, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "1.", "bbox": {"l": 326.88037, "t": 266.71533, "r": 328.31903, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 329.03836, "t": 266.71533, "r": 354.21472, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "There are two objectives. The lower", "bbox": {"l": 329.03836, "t": 266.71533, "r": 354.21472, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 326.88037, "t": 268.32556, "r": 355.19193, "b": 270.06458, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": " magnification objective has a greater", "bbox": {"l": 326.88037, "t": 268.32556, "r": 355.19193, "b": 270.06458, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 326.88037, "t": 269.93579, "r": 345.80057, "b": 271.6748, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": " depth of field and view.", "bbox": {"l": 326.88037, "t": 269.93579, "r": 345.80057, "b": 271.6748, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 326.88037, "t": 271.54602, "r": 328.33862, "b": 273.28503, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "2.", "bbox": {"l": 326.88037, "t": 271.54602, "r": 328.33862, "b": 273.28503, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 329.06775, "t": 271.54602, "r": 352.39969, "b": 273.28503, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "In order to observe the specimen", "bbox": {"l": 329.06775, "t": 271.54602, "r": 352.39969, "b": 273.28503, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 326.88037, "t": 273.15619000000004, "r": 352.90042, "b": 274.89526, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": " easily use the lower magnification", "bbox": {"l": 326.88037, "t": 273.15619000000004, "r": 352.90042, "b": 274.89526, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 326.88037, "t": 274.76642000000004, "r": 354.59546, "b": 276.50543000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": " objective first. Then, by rotating the", "bbox": {"l": 326.88037, "t": 274.76642000000004, "r": 354.59546, "b": 276.50543000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 326.88037, "t": 276.37665000000004, "r": 350.81885, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": " case, the magnification can be", "bbox": {"l": 326.88037, "t": 276.37665000000004, "r": 350.81885, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 326.88037, "t": 277.98688000000004, "r": 335.46707, "b": 279.72589000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": " changed.", "bbox": {"l": 326.88037, "t": 277.98688000000004, "r": 335.46707, "b": 279.72589000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 326.88037, "t": 281.20728, "r": 354.57755, "b": 282.94632, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 107, "text": "CHANGING THE INTERPUPILLARY ", "bbox": {"l": 326.88037, "t": 281.20728, "r": 354.57755, "b": 282.94632, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 326.88037, "t": 282.81750000000005, "r": 335.1752, "b": 284.55652, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 108, "text": "DISTANCE", "bbox": {"l": 326.88037, "t": 282.81750000000005, "r": 335.1752, "b": 284.55652, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 326.88037, "t": 284.4277, "r": 328.34784, "b": 286.16675, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 109, "text": "1.", "bbox": {"l": 326.88037, "t": 284.4277, "r": 328.34784, "b": 286.16675, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 329.08157, "t": 284.4277, "r": 354.76245, "b": 286.16675, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 110, "text": "The distance between the observer's", "bbox": {"l": 329.08157, "t": 284.4277, "r": 354.76245, "b": 286.16675, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 326.88037, "t": 286.03793, "r": 354.6499, "b": 287.77695, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 111, "text": " pupils is the interpupillary distance.", "bbox": {"l": 326.88037, "t": 286.03793, "r": 354.6499, "b": 287.77695, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 326.88037, "t": 287.64813, "r": 328.25125, "b": 289.38718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 112, "text": "2.", "bbox": {"l": 326.88037, "t": 287.64813, "r": 328.25125, "b": 289.38718, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 328.93671, "t": 287.64813, "r": 354.29825, "b": 289.38718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 113, "text": "To adjust the interpupillary distance", "bbox": {"l": 328.93671, "t": 287.64813, "r": 354.29825, "b": 289.38718, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 326.88181, "t": 289.25836, "r": 355.02075, "b": 290.99738, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 114, "text": " rotate the prism caps until both eyes", "bbox": {"l": 326.88181, "t": 289.25836, "r": 355.02075, "b": 290.99738, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 326.88181, "t": 290.86855999999995, "r": 350.82028, "b": 292.6076, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 115, "text": " coincide with the image in the", "bbox": {"l": 326.88181, "t": 290.86855999999995, "r": 350.82028, "b": 292.6076, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 326.88181, "t": 292.47879, "r": 336.2067, "b": 294.2178, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 116, "text": " eyepiece. ", "bbox": {"l": 326.88181, "t": 292.47879, "r": 336.2067, "b": 294.2178, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 326.88181, "t": 295.69922, "r": 335.3941, "b": 297.43823, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 117, "text": "FOCUSING", "bbox": {"l": 326.88181, "t": 295.69922, "r": 335.3941, "b": 297.43823, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 326.88181, "t": 297.30942, "r": 328.34314, "b": 299.04846, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 118, "text": "1.", "bbox": {"l": 326.88181, "t": 297.30942, "r": 328.34314, "b": 299.04846, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 329.07379, "t": 297.30942, "r": 353.18555, "b": 299.04846, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 119, "text": "Remove the lens protective cover.", "bbox": {"l": 329.07379, "t": 297.30942, "r": 353.18555, "b": 299.04846, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 326.88324, "t": 298.91965, "r": 328.35919, "b": 300.65866, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 120, "text": "2.", "bbox": {"l": 326.88324, "t": 298.91965, "r": 328.35919, "b": 300.65866, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 329.0972, "t": 298.91965, "r": 353.45065, "b": 300.65866, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 121, "text": "Place the specimen on the working", "bbox": {"l": 329.0972, "t": 298.91965, "r": 353.45065, "b": 300.65866, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 326.88324, "t": 300.52985, "r": 333.32825, "b": 302.26889000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 122, "text": " stage.", "bbox": {"l": 326.88324, "t": 300.52985, "r": 333.32825, "b": 302.26889000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 326.88324, "t": 302.14008000000007, "r": 328.31296, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 123, "text": "3.", "bbox": {"l": 326.88324, "t": 302.14008000000007, "r": 328.31296, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 329.02783, "t": 302.14008000000007, "r": 354.76303, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 124, "text": "Focus the specimen with the left eye", "bbox": {"l": 329.02783, "t": 302.14008000000007, "r": 354.76303, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 326.88324, "t": 303.75027, "r": 355.96307, "b": 305.48932, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 125, "text": " first while turning the focus knob until", "bbox": {"l": 326.88324, "t": 303.75027, "r": 355.96307, "b": 305.48932, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 326.88324, "t": 305.3605, "r": 354.46594, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 126, "text": " the image appears clear and sharp.", "bbox": {"l": 326.88324, "t": 305.3605, "r": 354.46594, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 326.88324, "t": 306.9707, "r": 328.25488, "b": 308.70975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 127, "text": "4.", "bbox": {"l": 326.88324, "t": 306.9707, "r": 328.25488, "b": 308.70975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 328.9407, "t": 306.9707, "r": 356.37335, "b": 308.70975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 128, "text": "Rotate the right eyepiece ring until the", "bbox": {"l": 328.9407, "t": 306.9707, "r": 356.37335, "b": 308.70975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 326.88324, "t": 308.58093, "r": 355.38867, "b": 310.31995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 129, "text": " images in each eyepiece coincide and", "bbox": {"l": 326.88324, "t": 308.58093, "r": 355.38867, "b": 310.31995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 326.88324, "t": 310.19113, "r": 343.17249, "b": 311.93018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 130, "text": " are sharp and clear.", "bbox": {"l": 326.88324, "t": 310.19113, "r": 343.17249, "b": 311.93018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 326.88324, "t": 313.41156, "r": 344.13388, "b": 315.15059999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 131, "text": "CHANGING THE BULB", "bbox": {"l": 326.88324, "t": 313.41156, "r": 344.13388, "b": 315.15059999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 326.88324, "t": 315.02178999999995, "r": 328.37418, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 132, "text": "1.", "bbox": {"l": 326.88324, "t": 315.02178999999995, "r": 328.37418, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 329.11963, "t": 315.02178999999995, "r": 348.50162, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 133, "text": "Disconnect the power cord.", "bbox": {"l": 329.11963, "t": 315.02178999999995, "r": 348.50162, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 326.88324, "t": 316.63199, "r": 328.34061, "b": 318.37103, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 134, "text": "2.", "bbox": {"l": 326.88324, "t": 316.63199, "r": 328.34061, "b": 318.37103, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 329.06931, "t": 316.63199, "r": 353.11588, "b": 318.37103, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 135, "text": "When the bulb is cool, remove the", "bbox": {"l": 329.06931, "t": 316.63199, "r": 353.11588, "b": 318.37103, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 326.88464, "t": 318.2422199999999, "r": 353.79517, "b": 319.9812299999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 136, "text": " oblique illuminator cap and remove", "bbox": {"l": 326.88464, "t": 318.2422199999999, "r": 353.79517, "b": 319.9812299999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 326.88464, "t": 319.85242000000005, "r": 348.02094, "b": 321.59146, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 137, "text": " the halogen bulb with cap.", "bbox": {"l": 326.88464, "t": 319.85242000000005, "r": 348.02094, "b": 321.59146, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 326.88464, "t": 321.46265, "r": 328.37512, "b": 323.20166, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 138, "text": "3.", "bbox": {"l": 326.88464, "t": 321.46265, "r": 328.37512, "b": 323.20166, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 329.12036, "t": 321.46265, "r": 352.96808, "b": 323.20166, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 139, "text": "Replace with a new halogen bulb.", "bbox": {"l": 329.12036, "t": 321.46265, "r": 352.96808, "b": 323.20166, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 326.88608, "t": 323.07285, "r": 328.36884, "b": 324.81189, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 140, "text": "4.", "bbox": {"l": 326.88608, "t": 323.07285, "r": 328.36884, "b": 324.81189, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 329.1102, "t": 323.07285, "r": 356.5412, "b": 324.81189, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 141, "text": "Open the window in the base plate and", "bbox": {"l": 329.1102, "t": 323.07285, "r": 356.5412, "b": 324.81189, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 326.88608, "t": 324.68307000000004, "r": 350.13828, "b": 326.42209, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 142, "text": " replace the halogen lamp or ", "bbox": {"l": 326.88608, "t": 324.68307000000004, "r": 350.13828, "b": 326.42209, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 326.88608, "t": 326.29327, "r": 351.59677, "b": 328.03232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 143, "text": " fluorescent lamp of transmitted", "bbox": {"l": 326.88608, "t": 326.29327, "r": 351.59677, "b": 328.03232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 326.88608, "t": 327.9035, "r": 336.89197, "b": 329.64252, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 144, "text": " illuminator.", "bbox": {"l": 326.88608, "t": 327.9035, "r": 336.89197, "b": 329.64252, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 358.42023, "t": 263.49492999999995, "r": 366.93256, "b": 265.23395000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 145, "text": "FOCUSING", "bbox": {"l": 358.42023, "t": 263.49492999999995, "r": 366.93256, "b": 265.23395000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 358.42023, "t": 265.10515999999996, "r": 359.89841, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 146, "text": "1.", "bbox": {"l": 358.42023, "t": 265.10515999999996, "r": 359.89841, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 360.63751, "t": 265.10515999999996, "r": 387.98407, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 147, "text": "Turn the focusing knob away or toward", "bbox": {"l": 360.63751, "t": 265.10515999999996, "r": 387.98407, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 358.42023, "t": 266.71533, "r": 384.58948, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 148, "text": " you until a clear image is viewed.", "bbox": {"l": 358.42023, "t": 266.71533, "r": 384.58948, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 358.42166, "t": 268.32556, "r": 359.78549, "b": 270.06458, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 149, "text": "2.", "bbox": {"l": 358.42166, "t": 268.32556, "r": 359.78549, "b": 270.06458, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 360.46741, "t": 268.32556, "r": 384.33441, "b": 270.06458, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 150, "text": "If the image is unclear, adjust the", "bbox": {"l": 360.46741, "t": 268.32556, "r": 384.33441, "b": 270.06458, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 358.4231, "t": 269.93579, "r": 384.61502, "b": 271.6748, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 151, "text": " height of the elevator up or down,", "bbox": {"l": 358.4231, "t": 269.93579, "r": 384.61502, "b": 271.6748, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 358.4231, "t": 271.54602, "r": 385.38922, "b": 273.28503, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 152, "text": " then turn the focusing knob again.", "bbox": {"l": 358.4231, "t": 271.54602, "r": 385.38922, "b": 273.28503, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 358.4231, "t": 274.76642000000004, "r": 377.35046, "b": 276.50543000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 153, "text": "ZOOM MAGNIFICATION", "bbox": {"l": 358.4231, "t": 274.76642000000004, "r": 377.35046, "b": 276.50543000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 358.4231, "t": 276.37665000000004, "r": 359.89429, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 154, "text": "1.", "bbox": {"l": 358.4231, "t": 276.37665000000004, "r": 359.89429, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 360.62988, "t": 276.37665000000004, "r": 386.37589, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 155, "text": "Turn the zoom magnification knob to", "bbox": {"l": 360.62988, "t": 276.37665000000004, "r": 386.37589, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 358.4231, "t": 277.98688000000004, "r": 386.78732, "b": 279.72589000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 156, "text": " the desired magnification and field of", "bbox": {"l": 358.4231, "t": 277.98688000000004, "r": 386.78732, "b": 279.72589000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 358.4231, "t": 279.59704999999997, "r": 364.16855, "b": 281.33609, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 157, "text": " view.", "bbox": {"l": 358.4231, "t": 279.59704999999997, "r": 364.16855, "b": 281.33609, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 358.4231, "t": 281.20728, "r": 359.86777, "b": 282.94632, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 158, "text": "2.", "bbox": {"l": 358.4231, "t": 281.20728, "r": 359.86777, "b": 282.94632, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 114, "label": "text", "bbox": {"l": 360.59012, "t": 281.20728, "r": 387.31656, "b": 282.94632, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 159, "text": "In most situations, it is recommended", "bbox": {"l": 360.59012, "t": 281.20728, "r": 387.31656, "b": 282.94632, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 115, "label": "text", "bbox": {"l": 358.4231, "t": 282.81750000000005, "r": 381.56656, "b": 284.55652, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 160, "text": " that you focus at the lowest ", "bbox": {"l": 358.4231, "t": 282.81750000000005, "r": 381.56656, "b": 284.55652, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 116, "label": "text", "bbox": {"l": 358.4231, "t": 284.4277, "r": 386.63403, "b": 286.16675, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 161, "text": " magnification, then move to a higher", "bbox": {"l": 358.4231, "t": 284.4277, "r": 386.63403, "b": 286.16675, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 117, "label": "text", "bbox": {"l": 358.42453, "t": 286.03793, "r": 382.77115, "b": 287.77695, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 162, "text": " magnification and re-focus as ", "bbox": {"l": 358.42453, "t": 286.03793, "r": 382.77115, "b": 287.77695, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 118, "label": "text", "bbox": {"l": 358.42453, "t": 287.64813, "r": 367.98694, "b": 289.38718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 163, "text": " necessary.", "bbox": {"l": 358.42453, "t": 287.64813, "r": 367.98694, "b": 289.38718, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 119, "label": "text", "bbox": {"l": 358.42453, "t": 289.25836, "r": 359.80386, "b": 290.99738, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 164, "text": "3.", "bbox": {"l": 358.42453, "t": 289.25836, "r": 359.80386, "b": 290.99738, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 120, "label": "text", "bbox": {"l": 360.49353, "t": 289.25836, "r": 386.70093, "b": 290.99738, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 165, "text": "If the image is not clear to both eyes", "bbox": {"l": 360.49353, "t": 289.25836, "r": 386.70093, "b": 290.99738, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 121, "label": "text", "bbox": {"l": 358.42453, "t": 290.86855999999995, "r": 388.03534, "b": 292.6076, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 166, "text": " at the same time, the diopter ring may", "bbox": {"l": 358.42453, "t": 290.86855999999995, "r": 388.03534, "b": 292.6076, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 122, "label": "text", "bbox": {"l": 358.42453, "t": 292.47879, "r": 373.13724, "b": 294.2178, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 167, "text": " need adjustment.", "bbox": {"l": 358.42453, "t": 292.47879, "r": 373.13724, "b": 294.2178, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 123, "label": "text", "bbox": {"l": 358.42453, "t": 295.69922, "r": 381.74539, "b": 297.43823, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 168, "text": "DIOPTER RING ADJUSTMENT", "bbox": {"l": 358.42453, "t": 295.69922, "r": 381.74539, "b": 297.43823, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 124, "label": "text", "bbox": {"l": 358.42453, "t": 297.30942, "r": 359.83682, "b": 299.04846, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 169, "text": "1.", "bbox": {"l": 358.42453, "t": 297.30942, "r": 359.83682, "b": 299.04846, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 125, "label": "text", "bbox": {"l": 360.54297, "t": 297.30942, "r": 388.08289, "b": 299.04846, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 170, "text": "To adjust the eyepiece for viewing with", "bbox": {"l": 360.54297, "t": 297.30942, "r": 388.08289, "b": 299.04846, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 126, "label": "text", "bbox": {"l": 358.42453, "t": 298.91965, "r": 382.73251, "b": 300.65866, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 171, "text": " or without eyeglasses and for ", "bbox": {"l": 358.42453, "t": 298.91965, "r": 382.73251, "b": 300.65866, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 127, "label": "text", "bbox": {"l": 358.42453, "t": 300.52985, "r": 387.72266, "b": 302.26889000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 172, "text": " differences in acuity between the right", "bbox": {"l": 358.42453, "t": 300.52985, "r": 387.72266, "b": 302.26889000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 128, "label": "text", "bbox": {"l": 358.42453, "t": 302.14008000000007, "r": 384.1991, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 173, "text": " and left eyes, follow the following", "bbox": {"l": 358.42453, "t": 302.14008000000007, "r": 384.1991, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 129, "label": "text", "bbox": {"l": 358.42453, "t": 303.75027, "r": 364.88672, "b": 305.48932, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 174, "text": " steps:", "bbox": {"l": 358.42453, "t": 303.75027, "r": 364.88672, "b": 305.48932, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 130, "label": "text", "bbox": {"l": 358.42453, "t": 305.3605, "r": 359.95078, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 175, "text": "a.", "bbox": {"l": 358.42453, "t": 305.3605, "r": 359.95078, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 131, "label": "text", "bbox": {"l": 361.47699, "t": 305.3605, "r": 386.65988, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 176, "text": "Observe an image through the left", "bbox": {"l": 361.47699, "t": 305.3605, "r": 386.65988, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 132, "label": "text", "bbox": {"l": 358.42453, "t": 306.9707, "r": 386.7634, "b": 308.70975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 177, "text": " eyepiece and bring a specific point", "bbox": {"l": 358.42453, "t": 306.9707, "r": 386.7634, "b": 308.70975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 133, "label": "text", "bbox": {"l": 358.42453, "t": 308.58093, "r": 385.41354, "b": 310.31995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 178, "text": " into focus using the focus knob.", "bbox": {"l": 358.42453, "t": 308.58093, "r": 385.41354, "b": 310.31995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 134, "label": "text", "bbox": {"l": 358.42453, "t": 310.19113, "r": 359.93304, "b": 311.93018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 179, "text": "b.", "bbox": {"l": 358.42453, "t": 310.19113, "r": 359.93304, "b": 311.93018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 135, "label": "text", "bbox": {"l": 361.44156, "t": 310.19113, "r": 382.56085, "b": 311.93018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 180, "text": "By turning the diopter ring ", "bbox": {"l": 361.44156, "t": 310.19113, "r": 382.56085, "b": 311.93018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 136, "label": "text", "bbox": {"l": 358.42596, "t": 311.80136, "r": 385.4559, "b": 313.54037, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 181, "text": " adjustment for the left eyepiece,", "bbox": {"l": 358.42596, "t": 311.80136, "r": 385.4559, "b": 313.54037, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 137, "label": "text", "bbox": {"l": 358.42596, "t": 313.41156, "r": 384.56122, "b": 315.15059999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 182, "text": " bring the same point into sharp", "bbox": {"l": 358.42596, "t": 313.41156, "r": 384.56122, "b": 315.15059999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 138, "label": "text", "bbox": {"l": 358.42596, "t": 315.02178999999995, "r": 366.74371, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 183, "text": " focus.", "bbox": {"l": 358.42596, "t": 315.02178999999995, "r": 366.74371, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 139, "label": "text", "bbox": {"l": 358.42596, "t": 316.63199, "r": 383.93884, "b": 318.37103, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 184, "text": " c.Then bring the same point into", "bbox": {"l": 358.42596, "t": 316.63199, "r": 383.93884, "b": 318.37103, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 140, "label": "text", "bbox": {"l": 358.42596, "t": 318.2422199999999, "r": 385.69241, "b": 319.9812299999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 185, "text": " focus through the right eyepiece", "bbox": {"l": 358.42596, "t": 318.2422199999999, "r": 385.69241, "b": 319.9812299999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 141, "label": "text", "bbox": {"l": 358.42596, "t": 319.85242000000005, "r": 385.94861, "b": 321.59146, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 186, "text": " by turning the right diopter ring.", "bbox": {"l": 358.42596, "t": 319.85242000000005, "r": 385.94861, "b": 321.59146, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 142, "label": "text", "bbox": {"l": 358.42596, "t": 321.46265, "r": 385.54236, "b": 323.20166, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 187, "text": " d.With more than one viewer, each", "bbox": {"l": 358.42596, "t": 321.46265, "r": 385.54236, "b": 323.20166, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 143, "label": "text", "bbox": {"l": 358.42596, "t": 323.07285, "r": 382.98718, "b": 324.81189, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 188, "text": " viewer should note their own", "bbox": {"l": 358.42596, "t": 323.07285, "r": 382.98718, "b": 324.81189, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 144, "label": "text", "bbox": {"l": 358.42596, "t": 324.68307000000004, "r": 385.06448, "b": 326.42209, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 189, "text": " diopter ring position for the left", "bbox": {"l": 358.42596, "t": 324.68307000000004, "r": 385.06448, "b": 326.42209, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 145, "label": "text", "bbox": {"l": 358.42596, "t": 326.29327, "r": 385.20682, "b": 328.03232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 190, "text": " and right eyepieces, then before", "bbox": {"l": 358.42596, "t": 326.29327, "r": 385.20682, "b": 328.03232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 146, "label": "text", "bbox": {"l": 358.42596, "t": 327.9035, "r": 382.21964, "b": 329.64252, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 191, "text": " viewing set the diopter ring", "bbox": {"l": 358.42596, "t": 327.9035, "r": 382.21964, "b": 329.64252, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 147, "label": "text", "bbox": {"l": 358.42596, "t": 329.5137, "r": 382.63382, "b": 331.25275, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 192, "text": " adjustments to that setting.", "bbox": {"l": 358.42596, "t": 329.5137, "r": 382.63382, "b": 331.25275, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 148, "label": "text", "bbox": {"l": 358.42596, "t": 332.73412999999994, "r": 375.67661, "b": 334.47317999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 193, "text": "CHANGING THE BULB", "bbox": {"l": 358.42596, "t": 332.73412999999994, "r": 375.67661, "b": 334.47317999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 149, "label": "text", "bbox": {"l": 358.42596, "t": 334.34436, "r": 359.90311, "b": 336.08337, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 194, "text": "1.", "bbox": {"l": 358.42596, "t": 334.34436, "r": 359.90311, "b": 336.08337, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 150, "label": "text", "bbox": {"l": 360.64169, "t": 334.34436, "r": 385.75333, "b": 336.08337, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 195, "text": "Disconnect the power cord from the", "bbox": {"l": 360.64169, "t": 334.34436, "r": 385.75333, "b": 336.08337, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 151, "label": "text", "bbox": {"l": 358.42596, "t": 335.95456, "r": 372.01416, "b": 337.6936, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 196, "text": " electrical outlet.", "bbox": {"l": 358.42596, "t": 335.95456, "r": 372.01416, "b": 337.6936, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 152, "label": "text", "bbox": {"l": 358.42596, "t": 337.56479, "r": 359.88327, "b": 339.3038, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 197, "text": "2.", "bbox": {"l": 358.42596, "t": 337.56479, "r": 359.88327, "b": 339.3038, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 153, "label": "text", "bbox": {"l": 360.61191, "t": 337.56479, "r": 384.65726, "b": 339.3038, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 198, "text": "When the bulb is cool, remove the", "bbox": {"l": 360.61191, "t": 337.56479, "r": 384.65726, "b": 339.3038, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 154, "label": "text", "bbox": {"l": 358.42596, "t": 339.17499, "r": 385.33649, "b": 340.9140300000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 199, "text": " oblique illuminator cap and remove", "bbox": {"l": 358.42596, "t": 339.17499, "r": 385.33649, "b": 340.9140300000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 155, "label": "text", "bbox": {"l": 358.42596, "t": 340.78522, "r": 379.57224, "b": 342.52423, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 200, "text": " the halogen bulb with cap.", "bbox": {"l": 358.42596, "t": 340.78522, "r": 379.57224, "b": 342.52423, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 156, "label": "text", "bbox": {"l": 358.4274, "t": 342.39542, "r": 359.91788, "b": 344.13446000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 201, "text": "3.", "bbox": {"l": 358.4274, "t": 342.39542, "r": 359.91788, "b": 344.13446000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 157, "label": "text", "bbox": {"l": 360.66312, "t": 342.39542, "r": 384.5108, "b": 344.13446000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 202, "text": "Replace with a new halogen bulb.", "bbox": {"l": 360.66312, "t": 342.39542, "r": 384.5108, "b": 344.13446000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 158, "label": "text", "bbox": {"l": 358.42883, "t": 344.00565000000006, "r": 359.92792, "b": 345.74466, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 203, "text": "4.", "bbox": {"l": 358.42883, "t": 344.00565000000006, "r": 359.92792, "b": 345.74466, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 159, "label": "text", "bbox": {"l": 360.67746, "t": 344.00565000000006, "r": 385.41235, "b": 345.74466, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 204, "text": "Open the window in the base plate", "bbox": {"l": 360.67746, "t": 344.00565000000006, "r": 385.41235, "b": 345.74466, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 160, "label": "text", "bbox": {"l": 358.42883, "t": 345.61584, "r": 383.2782, "b": 347.35489, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 205, "text": " and replace the halogen lamp or", "bbox": {"l": 358.42883, "t": 345.61584, "r": 383.2782, "b": 347.35489, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 161, "label": "text", "bbox": {"l": 358.42883, "t": 347.22607, "r": 383.13953, "b": 348.96509, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 206, "text": " fluorescent lamp of transmitted", "bbox": {"l": 358.42883, "t": 347.22607, "r": 383.13953, "b": 348.96509, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 162, "label": "text", "bbox": {"l": 358.42883, "t": 348.83627, "r": 368.43472, "b": 350.57532, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 207, "text": " illuminator.", "bbox": {"l": 358.42883, "t": 348.83627, "r": 368.43472, "b": 350.57532, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 163, "label": "text", "bbox": {"l": 326.59567, "t": 261.14185, "r": 339.11377, "b": 262.88091999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 208, "text": "Model AY11230", "bbox": {"l": 326.59567, "t": 261.14185, "r": 339.11377, "b": 262.88091999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 164, "label": "text", "bbox": {"l": 358.48605, "t": 261.14185, "r": 371.00415, "b": 262.88091999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 209, "text": "Model AY11234", "bbox": {"l": 358.48605, "t": 261.14185, "r": 371.00415, "b": 262.88091999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 165, "label": "text", "bbox": {"l": 455.43533, "t": 351.77038999999996, "r": 457.97827000000007, "b": 353.94415, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 210, "text": "14", "bbox": {"l": 455.43533, "t": 351.77038999999996, "r": 457.97827000000007, "b": 353.94415, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 166, "label": "text", "bbox": {"l": 408.24518, "t": 275.52673000000004, "r": 414.4234, "b": 276.96020999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 211, "text": "Objectives", "bbox": {"l": 408.24518, "t": 275.52673000000004, "r": 414.4234, "b": 276.96020999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 167, "label": "text", "bbox": {"l": 409.39554, "t": 268.98235999999997, "r": 419.06677, "b": 270.41583, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 212, "text": "Revolving Turret", "bbox": {"l": 409.39554, "t": 268.98235999999997, "r": 419.06677, "b": 270.41583, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 168, "label": "text", "bbox": {"l": 441.3895, "t": 279.12627999999995, "r": 445.87192, "b": 280.55975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 213, "text": "Coarse ", "bbox": {"l": 441.3895, "t": 279.12627999999995, "r": 445.87192, "b": 280.55975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 169, "label": "text", "bbox": {"l": 441.3895, "t": 280.30609, "r": 448.22338999999994, "b": 281.7395900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 214, "text": "Adjustment", "bbox": {"l": 441.3895, "t": 280.30609, "r": 448.22338999999994, "b": 281.7395900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 170, "label": "text", "bbox": {"l": 441.3895, "t": 281.48593, "r": 444.40371999999996, "b": 282.91939999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 215, "text": "Knob", "bbox": {"l": 441.3895, "t": 281.48593, "r": 444.40371999999996, "b": 282.91939999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 171, "label": "text", "bbox": {"l": 398.79288, "t": 254.94646999999998, "r": 428.91568, "b": 258.85931000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 216, "text": "MODEL AY11236", "bbox": {"l": 398.79288, "t": 254.94646999999998, "r": 428.91568, "b": 258.85931000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 172, "label": "text", "bbox": {"l": 398.32535, "t": 305.04291, "r": 435.93542, "b": 308.95572000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 217, "text": "MICROSCOPE USAGE", "bbox": {"l": 398.32535, "t": 305.04291, "r": 435.93542, "b": 308.95572000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 173, "label": "text", "bbox": {"l": 398.08594, "t": 310.35892, "r": 453.72171, "b": 312.53271, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 218, "text": "BARSKA Model AY11236 is a powerful fixed power compound ", "bbox": {"l": 398.08594, "t": 310.35892, "r": 453.72171, "b": 312.53271, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 174, "label": "text", "bbox": {"l": 398.08594, "t": 312.50586, "r": 453.09939999999995, "b": 314.67966, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 219, "text": "microscope designed for biological studies such as specimen ", "bbox": {"l": 398.08594, "t": 312.50586, "r": 453.09939999999995, "b": 314.67966, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 175, "label": "text", "bbox": {"l": 398.08594, "t": 314.6528, "r": 456.65246999999994, "b": 316.8266, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 220, "text": "examination. It can also be used for examining bacteria and", "bbox": {"l": 398.08594, "t": 314.6528, "r": 456.65246999999994, "b": 316.8266, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 176, "label": "text", "bbox": {"l": 398.08594, "t": 316.79977, "r": 456.73859000000004, "b": 318.97354, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 221, "text": "for general clinical and medical studies and other scientific uses. ", "bbox": {"l": 398.08594, "t": 316.79977, "r": 456.73859000000004, "b": 318.97354, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 177, "label": "text", "bbox": {"l": 398.62399, "t": 320.42941, "r": 427.77472, "b": 324.34222000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 222, "text": "CONSTRUCTION", "bbox": {"l": 398.62399, "t": 320.42941, "r": 427.77472, "b": 324.34222000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 178, "label": "text", "bbox": {"l": 398.08594, "t": 326.46069000000006, "r": 456.02639999999997, "b": 328.63449, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 223, "text": "BARSKA Model AY11236 is a fixed power compound microscope.", "bbox": {"l": 398.08594, "t": 326.46069000000006, "r": 456.02639999999997, "b": 328.63449, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 179, "label": "text", "bbox": {"l": 398.08414, "t": 328.6076699999999, "r": 455.42238999999995, "b": 330.7814599999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 224, "text": "It is constructed with two optical paths at the same angle. It is ", "bbox": {"l": 398.08414, "t": 328.6076699999999, "r": 455.42238999999995, "b": 330.7814599999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 180, "label": "text", "bbox": {"l": 398.08414, "t": 330.75461, "r": 457.39844, "b": 332.92841, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 225, "text": "equipped with transmitted illumination. By using this instrument, ", "bbox": {"l": 398.08414, "t": 330.75461, "r": 457.39844, "b": 332.92841, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 181, "label": "text", "bbox": {"l": 398.08414, "t": 332.90155, "r": 453.97745, "b": 335.07535000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 226, "text": "the user can observe specimens at magnification from 40x to ", "bbox": {"l": 398.08414, "t": 332.90155, "r": 453.97745, "b": 335.07535000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 182, "label": "text", "bbox": {"l": 398.08414, "t": 335.04852, "r": 454.70708999999994, "b": 337.22232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 227, "text": "1000x by selecting the desired objective lens. Coarse and fine ", "bbox": {"l": 398.08414, "t": 335.04852, "r": 454.70708999999994, "b": 337.22232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 183, "label": "text", "bbox": {"l": 398.08414, "t": 337.19547, "r": 458.90240000000006, "b": 339.36926, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 228, "text": "focus adjustments provide accuracy and image detail. The rotating ", "bbox": {"l": 398.08414, "t": 337.19547, "r": 458.90240000000006, "b": 339.36926, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 184, "label": "text", "bbox": {"l": 398.08594, "t": 339.34241, "r": 453.0672, "b": 341.5162, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 229, "text": "head allows the user to position the eyepieces for maximum ", "bbox": {"l": 398.08594, "t": 339.34241, "r": 453.0672, "b": 341.5162, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 185, "label": "text", "bbox": {"l": 398.08594, "t": 341.48938, "r": 449.63113, "b": 343.66318, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 230, "text": "viewing comfort and easy access to all adjustment knobs.", "bbox": {"l": 398.08594, "t": 341.48938, "r": 449.63113, "b": 343.66318, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 186, "label": "text", "bbox": {"l": 422.10626, "t": 301.24191, "r": 434.62433000000004, "b": 302.98096, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 231, "text": "Model AY11236", "bbox": {"l": 422.10626, "t": 301.24191, "r": 434.62433000000004, "b": 302.98096, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 187, "label": "text", "bbox": {"l": 442.01610999999997, "t": 283.08649, "r": 444.8817399999999, "b": 284.51996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 232, "text": "Fine ", "bbox": {"l": 442.01610999999997, "t": 283.08649, "r": 444.8817399999999, "b": 284.51996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 188, "label": "text", "bbox": {"l": 442.01610999999997, "t": 284.2663, "r": 448.85001, "b": 285.69980000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 233, "text": "Adjustment", "bbox": {"l": 442.01610999999997, "t": 284.2663, "r": 448.85001, "b": 285.69980000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 189, "label": "text", "bbox": {"l": 442.01610999999997, "t": 285.44611, "r": 445.03033000000005, "b": 286.87961, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 234, "text": "Knob", "bbox": {"l": 442.01610999999997, "t": 285.44611, "r": 445.03033000000005, "b": 286.87961, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 190, "label": "text", "bbox": {"l": 408.00577, "t": 279.12579000000005, "r": 411.42212, "b": 280.5593, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 235, "text": "Stage", "bbox": {"l": 408.00577, "t": 279.12579000000005, "r": 411.42212, "b": 280.5593, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 191, "label": "text", "bbox": {"l": 404.07172, "t": 280.9144299999999, "r": 410.77707, "b": 282.3479, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 236, "text": "Condenser ", "bbox": {"l": 404.07172, "t": 280.9144299999999, "r": 410.77707, "b": 282.3479, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 192, "label": "text", "bbox": {"l": 404.07172, "t": 282.09424, "r": 409.2157, "b": 283.52774, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 237, "text": "Focusing", "bbox": {"l": 404.07172, "t": 282.09424, "r": 409.2157, "b": 283.52774, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 193, "label": "text", "bbox": {"l": 404.07172, "t": 283.27408, "r": 407.08594, "b": 284.7075500000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 238, "text": "Knob", "bbox": {"l": 404.07172, "t": 283.27408, "r": 407.08594, "b": 284.7075500000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 194, "label": "text", "bbox": {"l": 441.81281, "t": 262.32178, "r": 447.03702, "b": 263.75525000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 239, "text": "Eyepiece", "bbox": {"l": 441.81281, "t": 262.32178, "r": 447.03702, "b": 263.75525000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 195, "label": "text", "bbox": {"l": 437.34607, "t": 271.13025000000005, "r": 440.80496, "b": 272.56281, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 240, "text": "Stand", "bbox": {"l": 437.34607, "t": 271.13025000000005, "r": 440.80496, "b": 272.56281, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 196, "label": "text", "bbox": {"l": 409.7164, "t": 284.40027, "r": 413.3768, "b": 285.83282, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 241, "text": "Lamp ", "bbox": {"l": 409.7164, "t": 284.40027, "r": 413.3768, "b": 285.83282, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 197, "label": "text", "bbox": {"l": 409.7164, "t": 285.83163, "r": 413.68201, "b": 287.26416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 242, "text": "On/Off", "bbox": {"l": 409.7164, "t": 285.83163, "r": 413.68201, "b": 287.26416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 198, "label": "text", "bbox": {"l": 409.7164, "t": 287.263, "r": 413.6337, "b": 288.69553, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 243, "text": "Switch", "bbox": {"l": 409.7164, "t": 287.263, "r": 413.6337, "b": 288.69553, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 199, "label": "text", "bbox": {"l": 434.8712499999999, "t": 296.7153, "r": 438.53164999999996, "b": 298.14783, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 244, "text": "Lamp ", "bbox": {"l": 434.8712499999999, "t": 296.7153, "r": 438.53164999999996, "b": 298.14783, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 200, "label": "text", "bbox": {"l": 439.52039, "t": 292.18307000000004, "r": 443.08768, "b": 293.61560000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 245, "text": "Power", "bbox": {"l": 439.52039, "t": 292.18307000000004, "r": 443.08768, "b": 293.61560000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 201, "label": "text", "bbox": {"l": 439.52039, "t": 293.61444, "r": 442.29575, "b": 295.04697, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 246, "text": "Cord", "bbox": {"l": 439.52039, "t": 293.61444, "r": 442.29575, "b": 295.04697, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 202, "label": "text", "bbox": {"l": 413.55829, "t": 264.66089, "r": 421.94913, "b": 266.09344, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 247, "text": "Rotating Head", "bbox": {"l": 413.55829, "t": 264.66089, "r": 421.94913, "b": 266.09344, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 203, "label": "text", "bbox": {"l": 441.84316999999993, "t": 286.90573, "r": 447.87585000000007, "b": 288.33826, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 248, "text": "Stage Clip", "bbox": {"l": 441.84316999999993, "t": 286.90573, "r": 447.87585000000007, "b": 288.33826, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 204, "label": "text", "bbox": {"l": 441.84316999999993, "t": 288.3371, "r": 448.67252, "b": 289.76962000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 249, "text": "Adjustment", "bbox": {"l": 441.84316999999993, "t": 288.3371, "r": 448.67252, "b": 289.76962000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 205, "label": "text", "bbox": {"l": 407.2403, "t": 259.86645999999996, "r": 425.79089, "b": 261.29895, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 250, "text": "Interpupillary Slide Adjustment", "bbox": {"l": 407.2403, "t": 259.86645999999996, "r": 425.79089, "b": 261.29895, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 206, "label": "text", "bbox": {"l": 449.10074000000003, "t": 378.66302, "r": 466.08835000000005, "b": 380.78412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 251, "text": "Circling Minimums", "bbox": {"l": 449.10074000000003, "t": 378.66302, "r": 466.08835000000005, "b": 380.78412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 207, "label": "text", "bbox": {"l": 449.10074000000003, "t": 383.2203999999999, "r": 449.64444, "b": 385.34148999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 252, "text": "7", "bbox": {"l": 449.10074000000003, "t": 383.2203999999999, "r": 449.64444, "b": 385.34148999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 208, "label": "text", "bbox": {"l": 450.18811, "t": 383.2203999999999, "r": 550.77124, "b": 385.34148999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 253, "text": "K H U H Z D V D F K D Q J H W R W K H 7 ( 5 3 6 F U L W H U L D L Q W K D W D \u1087H F W V F L U F O L Q J D U H D G L P H Q V L R Q E \\ H [ S D Q G L Q J W K H D U H D V W R S U R Y L G H ", "bbox": {"l": 450.18811, "t": 383.2203999999999, "r": 550.77124, "b": 385.34148999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 209, "label": "text", "bbox": {"l": 449.10074000000003, "t": 385.75732, "r": 536.14716, "b": 387.87842, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 254, "text": "improved obstacle protection. To indicate that the new criteria had been applied to a given procedure, a ", "bbox": {"l": 449.10074000000003, "t": 385.75732, "r": 536.14716, "b": 387.87842, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 210, "label": "text", "bbox": {"l": 538.31085, "t": 385.75732, "r": 549.49921, "b": 387.87842, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 255, "text": " is placed on ", "bbox": {"l": 538.31085, "t": 385.75732, "r": 549.49921, "b": 387.87842, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 211, "label": "text", "bbox": {"l": 449.10074000000003, "t": 388.03601, "r": 547.58185, "b": 390.1571, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 256, "text": "the circling line of minimums. The new circling tables and explanatory information is located in the Legend of the TPP.", "bbox": {"l": 449.10074000000003, "t": 388.03601, "r": 547.58185, "b": 390.1571, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 212, "label": "text", "bbox": {"l": 449.10074000000003, "t": 393.2128000000001, "r": 449.6163, "b": 395.33386, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 257, "text": "7", "bbox": {"l": 449.10074000000003, "t": 393.2128000000001, "r": 449.6163, "b": 395.33386, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 213, "label": "text", "bbox": {"l": 450.1319, "t": 393.2128000000001, "r": 529.53082, "b": 395.33386, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 258, "text": "K H D S S U R D F K H V X V L Q J V W D Q G D U G F L U F O L Q J D S S U R D F K D U H D V F D Q E H L G H Q W L \u00bf H G E \\ W K H D E V H Q F H R I W K H ", "bbox": {"l": 450.1319, "t": 393.2128000000001, "r": 529.53082, "b": 395.33386, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 214, "label": "text", "bbox": {"l": 532.05829, "t": 393.2128000000001, "r": 550.42261, "b": 395.33386, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 259, "text": " on the circling line of ", "bbox": {"l": 532.05829, "t": 393.2128000000001, "r": 550.42261, "b": 395.33386, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 215, "label": "text", "bbox": {"l": 449.10074000000003, "t": 395.49149, "r": 455.74692, "b": 397.61255, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 260, "text": "minima.", "bbox": {"l": 449.10074000000003, "t": 395.49149, "r": 455.74692, "b": 397.61255, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 216, "label": "text", "bbox": {"l": 449.95525999999995, "t": 415.59549, "r": 496.2829, "b": 417.50446, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 261, "text": "$ S S O \\ 6 W D Q G D U G & L U F O L Q J $ S S U R D F K 0 D Q H X Y H U L Q J 5 D G L X V 7 D E O H ", "bbox": {"l": 449.95525999999995, "t": 415.59549, "r": 496.2829, "b": 417.50446, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 217, "label": "text", "bbox": {"l": 501.13077, "t": 409.25543, "r": 551.16101, "b": 411.1644, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 262, "text": "$ S S O \\ ( [ S D Q G H G & L U F O L Q J $ S S U R D F K 0 D Q H X Y H U L Q J $ L U V S D F H 5 D G L X V ", "bbox": {"l": 501.13077, "t": 409.25543, "r": 551.16101, "b": 411.1644, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 218, "label": "text", "bbox": {"l": 501.13077, "t": 411.30624, "r": 505.2477999999999, "b": 413.21521, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 263, "text": "Table", "bbox": {"l": 501.13077, "t": 411.30624, "r": 505.2477999999999, "b": 413.21521, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 219, "label": "text", "bbox": {"l": 449.10074000000003, "t": 420.18802, "r": 469.35599, "b": 422.73331, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 264, "text": "AIRPORT SKETCH", "bbox": {"l": 449.10074000000003, "t": 420.18802, "r": 469.35599, "b": 422.73331, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 220, "label": "text", "bbox": {"l": 449.10074000000003, "t": 425.08908, "r": 525.93616, "b": 427.21017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 265, "text": "The airport sketch is a depiction of the airport with emphasis on runway pattern and related ", "bbox": {"l": 449.10074000000003, "t": 425.08908, "r": 525.93616, "b": 427.21017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 221, "label": "text", "bbox": {"l": 449.10074000000003, "t": 427.3678, "r": 522.0343, "b": 429.48886, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 266, "text": "information, positioned in either the lower left or lower right corner of the chart to aid pi-", "bbox": {"l": 449.10074000000003, "t": 427.3678, "r": 522.0343, "b": 429.48886, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 222, "label": "text", "bbox": {"l": 449.10074000000003, "t": 429.64648, "r": 524.67151, "b": 431.76755, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 267, "text": "lot recognition of the airport from the air and to provide some information to aid on ground ", "bbox": {"l": 449.10074000000003, "t": 429.64648, "r": 524.67151, "b": 431.76755, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 223, "label": "text", "bbox": {"l": 449.10074000000003, "t": 431.92514000000006, "r": 527.172, "b": 434.04623, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 268, "text": "navigation of the airport. The runways are drawn to scale and oriented to true north. Runway ", "bbox": {"l": 449.10074000000003, "t": 431.92514000000006, "r": 527.172, "b": 434.04623, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 224, "label": "text", "bbox": {"l": 449.10074000000003, "t": 434.20383, "r": 502.39545, "b": 436.32492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 269, "text": "dimensions (length and width) are shown for all active runways.", "bbox": {"l": 449.10074000000003, "t": 434.20383, "r": 502.39545, "b": 436.32492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 225, "label": "text", "bbox": {"l": 449.10074000000003, "t": 438.7611999999999, "r": 512.92676, "b": 440.88228999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 270, "text": "Runway(s) are depicted based on what type and construction of the runway.", "bbox": {"l": 449.10074000000003, "t": 438.7611999999999, "r": 512.92676, "b": 440.88228999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 226, "label": "text", "bbox": {"l": 449.95525999999995, "t": 444.07001, "r": 460.02307, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 271, "text": "Hard Surface", "bbox": {"l": 449.95525999999995, "t": 444.07001, "r": 460.02307, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 227, "label": "text", "bbox": {"l": 464.89963, "t": 444.07001, "r": 473.98819, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 272, "text": "Other Than ", "bbox": {"l": 464.89963, "t": 444.07001, "r": 473.98819, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 228, "label": "text", "bbox": {"l": 464.89963, "t": 446.12085, "r": 474.96744, "b": 448.02979, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 273, "text": "Hard Surface", "bbox": {"l": 464.89963, "t": 446.12085, "r": 474.96744, "b": 448.02979, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 229, "label": "text", "bbox": {"l": 478.91357, "t": 444.07001, "r": 489.45648, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 274, "text": "Metal Surface", "bbox": {"l": 478.91357, "t": 444.07001, "r": 489.45648, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 230, "label": "text", "bbox": {"l": 493.06420999999995, "t": 444.07001, "r": 505.03076, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 275, "text": "Closed Runway", "bbox": {"l": 493.06420999999995, "t": 444.07001, "r": 505.03076, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 231, "label": "text", "bbox": {"l": 509.5809, "t": 444.07001, "r": 524.30237, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 276, "text": "Under Construction", "bbox": {"l": 509.5809, "t": 444.07001, "r": 524.30237, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 232, "label": "text", "bbox": {"l": 449.95525999999995, "t": 454.81207, "r": 458.31406, "b": 456.72104, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 277, "text": "Stopways, ", "bbox": {"l": 449.95525999999995, "t": 454.81207, "r": 458.31406, "b": 456.72104, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 233, "label": "text", "bbox": {"l": 449.95525999999995, "t": 456.86288, "r": 461.92083999999994, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 278, "text": "Taxiways, Park-", "bbox": {"l": 449.95525999999995, "t": 456.86288, "r": 461.92083999999994, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 234, "label": "text", "bbox": {"l": 449.95525999999995, "t": 458.91373, "r": 457.08014, "b": 460.82268999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 279, "text": "ing Areas", "bbox": {"l": 449.95525999999995, "t": 458.91373, "r": 457.08014, "b": 460.82268999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 235, "label": "text", "bbox": {"l": 464.89963, "t": 454.81207, "r": 472.87732, "b": 456.72104, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 280, "text": "Displaced ", "bbox": {"l": 464.89963, "t": 454.81207, "r": 472.87732, "b": 456.72104, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 236, "label": "text", "bbox": {"l": 464.89963, "t": 456.86288, "r": 472.49792, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 281, "text": "Threshold", "bbox": {"l": 464.89963, "t": 456.86288, "r": 472.49792, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 237, "label": "text", "bbox": {"l": 478.91357, "t": 454.81207, "r": 483.61584, "b": 456.72104, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 282, "text": "Closed", "bbox": {"l": 478.91357, "t": 454.81207, "r": 483.61584, "b": 456.72104, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 238, "label": "text", "bbox": {"l": 478.91357, "t": 456.86288, "r": 486.60754000000003, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 283, "text": "Pavement", "bbox": {"l": 478.91357, "t": 456.86288, "r": 486.60754000000003, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 239, "label": "text", "bbox": {"l": 493.06420999999995, "t": 454.81207, "r": 504.20648, "b": 456.72104, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 284, "text": "Water Runway", "bbox": {"l": 493.06420999999995, "t": 454.81207, "r": 504.20648, "b": 456.72104, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 240, "label": "text", "bbox": {"l": 449.10074000000003, "t": 469.32974, "r": 548.59674, "b": 471.45081, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 285, "text": "Taxiways and aprons are shaded grey. Other runway features that may be shown are runway numbers, runway dimen-", "bbox": {"l": 449.10074000000003, "t": 469.32974, "r": 548.59674, "b": 471.45081, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 241, "label": "text", "bbox": {"l": 449.10074000000003, "t": 471.60843, "r": 500.08181999999994, "b": 473.72949, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 286, "text": "sions, runway slope, arresting gear, and displaced threshold.", "bbox": {"l": 449.10074000000003, "t": 471.60843, "r": 500.08181999999994, "b": 473.72949, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 242, "label": "text", "bbox": {"l": 449.10074000000003, "t": 476.16577, "r": 449.59933000000007, "b": 478.28687, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 287, "text": "2", "bbox": {"l": 449.10074000000003, "t": 476.16577, "r": 449.59933000000007, "b": 478.28687, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 243, "label": "text", "bbox": {"l": 450.09796, "t": 476.16577, "r": 547.82562, "b": 478.28687, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 288, "text": "W K H U L Q I R U P D W L R Q F R Q F H U Q L Q J O L J K W L Q J \u00bf Q D O D S S U R D F K E H D U L Q J V D L U S R U W E H D F R Q R E V W D F O H V F R Q W U R O W R Z H U 1 $ 9 $ , ' V K H O L ", "bbox": {"l": 450.09796, "t": 476.16577, "r": 547.82562, "b": 478.28687, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 244, "label": "text", "bbox": {"l": 547.82623, "t": 476.16577, "r": 548.45862, "b": 478.28687, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 289, "text": "-", "bbox": {"l": 547.82623, "t": 476.16577, "r": 548.45862, "b": 478.28687, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 245, "label": "text", "bbox": {"l": 449.10074000000003, "t": 478.44446, "r": 470.52609000000007, "b": 480.56555, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 290, "text": "pads may also be shown.", "bbox": {"l": 449.10074000000003, "t": 478.44446, "r": 470.52609000000007, "b": 480.56555, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 246, "label": "text", "bbox": {"l": 449.10074000000003, "t": 483.00183, "r": 493.37906000000004, "b": 485.12292, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 291, "text": "$ L U S R U W ( O H Y D W L R Q D Q G 7 R X F K G R Z Q = R Q H ( O H Y D W L R Q ", "bbox": {"l": 449.10074000000003, "t": 483.00183, "r": 493.37906000000004, "b": 485.12292, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 449.10074000000003, "t": 487.5592, "r": 551.80023, "b": 496.51636, "coord_origin": "TOPLEFT"}, "confidence": 0.5027860403060913, "cells": [{"id": 292, "text": "The airport elevation is shown enclosed within a box in the upper left corner of the sketch box and the touchdown zone ", "bbox": {"l": 449.10074000000003, "t": 487.5592, "r": 549.16168, "b": 489.6803, "coord_origin": "TOPLEFT"}}, {"id": 293, "text": "elevation (TDZE) is shown in the upper right corner of the sketch box. The airport elevation is the highest point of an ", "bbox": {"l": 449.10074000000003, "t": 489.83789, "r": 546.90881, "b": 491.95898, "coord_origin": "TOPLEFT"}}, {"id": 294, "text": "D L U S R U W \u00b6 V X V D E O H U X Q Z D \\ V P H D V X U H G L Q I H H W I U R P P H D Q V H D O H Y H O 7 K H 7 ' = ( L V W K H K L J K H V W H O H Y D W L R Q L Q W K H \u00bf U V W I H H W R I ", "bbox": {"l": 449.10074000000003, "t": 492.11658, "r": 551.80023, "b": 494.23767, "coord_origin": "TOPLEFT"}}, {"id": 295, "text": "the landing surface. Circling only approaches will not show a TDZE.", "bbox": {"l": 449.10074000000003, "t": 494.39526, "r": 505.85068000000007, "b": 496.51636, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 247, "label": "text", "bbox": {"l": 498.80661000000003, "t": 515.9437, "r": 502.08792, "b": 519.01764, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 296, "text": "114", "bbox": {"l": 498.80661000000003, "t": 515.9437, "r": 502.08792, "b": 519.01764, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 248, "label": "text", "bbox": {"l": 444.56319999999994, "t": 422.84869, "r": 446.25998, "b": 471.87128, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 297, "text": "FAA Chart Users\u2019 Guide - Terminal Procedures Publication (TPP) - Terms", "bbox": {"l": 444.56319999999994, "t": 422.84869, "r": 446.25998, "b": 471.87128, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 249, "label": "text", "bbox": {"l": 329.40536, "t": 379.37537, "r": 355.13138, "b": 382.13336, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 298, "text": "AGL 2013 Financial Calendar", "bbox": {"l": 329.40536, "t": 379.37537, "r": 355.13138, "b": 382.13336, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 250, "label": "text", "bbox": {"l": 329.40536, "t": 382.30273, "r": 330.96848, "b": 384.55927, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 299, "text": "22", "bbox": {"l": 329.40536, "t": 382.30273, "r": 330.96848, "b": 384.55927, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 251, "label": "text", "bbox": {"l": 331.75003, "t": 382.30273, "r": 341.12875, "b": 384.55927, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 300, "text": "August 2012 ", "bbox": {"l": 331.75003, "t": 382.30273, "r": 341.12875, "b": 384.55927, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 252, "label": "text", "bbox": {"l": 350.4722, "t": 382.30273, "r": 384.81079, "b": 384.55927, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 301, "text": "2012 full year result and fi nal dividend announced", "bbox": {"l": 350.4722, "t": 382.30273, "r": 384.81079, "b": 384.55927, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 253, "label": "text", "bbox": {"l": 329.40536, "t": 384.84552, "r": 330.97336, "b": 387.10205, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 302, "text": "30", "bbox": {"l": 329.40536, "t": 384.84552, "r": 330.97336, "b": 387.10205, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 254, "label": "text", "bbox": {"l": 331.75735, "t": 384.84552, "r": 341.16534, "b": 387.10205, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 303, "text": "August 2012 ", "bbox": {"l": 331.75735, "t": 384.84552, "r": 341.16534, "b": 387.10205, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 255, "label": "text", "bbox": {"l": 350.4722, "t": 384.84552, "r": 372.90613, "b": 387.10205, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 304, "text": "Ex-dividend trading commences", "bbox": {"l": 350.4722, "t": 384.84552, "r": 372.90613, "b": 387.10205, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 256, "label": "text", "bbox": {"l": 329.40536, "t": 387.38828, "r": 330.20337, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 305, "text": "5", "bbox": {"l": 329.40536, "t": 387.38828, "r": 330.20337, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 257, "label": "text", "bbox": {"l": 331.00137, "t": 387.38828, "r": 342.9715, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 306, "text": "September 2012 ", "bbox": {"l": 331.00137, "t": 387.38828, "r": 342.9715, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 258, "label": "text", "bbox": {"l": 350.4722, "t": 387.38828, "r": 374.88693, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 307, "text": "Record date for 2012 fi nal dividend", "bbox": {"l": 350.4722, "t": 387.38828, "r": 374.88693, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 259, "label": "text", "bbox": {"l": 329.40536, "t": 389.93103, "r": 331.0173, "b": 392.18762, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 308, "text": "27", "bbox": {"l": 329.40536, "t": 389.93103, "r": 331.0173, "b": 392.18762, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 260, "label": "text", "bbox": {"l": 331.82327, "t": 389.93103, "r": 343.91284, "b": 392.18762, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 309, "text": "September 2012 ", "bbox": {"l": 331.82327, "t": 389.93103, "r": 343.91284, "b": 392.18762, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 261, "label": "text", "bbox": {"l": 350.4722, "t": 389.93103, "r": 365.65988, "b": 392.18762, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 310, "text": "Final dividend payable", "bbox": {"l": 350.4722, "t": 389.93103, "r": 365.65988, "b": 392.18762, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 262, "label": "text", "bbox": {"l": 329.40536, "t": 392.47382, "r": 330.98804, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 311, "text": "23", "bbox": {"l": 329.40536, "t": 392.47382, "r": 330.98804, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 263, "label": "text", "bbox": {"l": 331.77936, "t": 392.47382, "r": 342.06674, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 312, "text": "October 2012 ", "bbox": {"l": 331.77936, "t": 392.47382, "r": 342.06674, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 264, "label": "text", "bbox": {"l": 350.4722, "t": 392.47382, "r": 367.22156, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 313, "text": "Annual General Meeting", "bbox": {"l": 350.4722, "t": 392.47382, "r": 367.22156, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 265, "label": "text", "bbox": {"l": 329.40536, "t": 395.0166, "r": 330.99741, "b": 397.27313, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 314, "text": "27", "bbox": {"l": 329.40536, "t": 395.0166, "r": 330.99741, "b": 397.27313, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 266, "label": "text", "bbox": {"l": 331.7934, "t": 395.0166, "r": 342.1416, "b": 397.27313, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 315, "text": "February 2013", "bbox": {"l": 331.7934, "t": 395.0166, "r": 342.1416, "b": 397.27313, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 267, "label": "text", "bbox": {"l": 342.64841, "t": 395.18298, "r": 342.65811, "b": 396.49857000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 316, "text": " 1", "bbox": {"l": 342.64841, "t": 395.18298, "r": 342.65811, "b": 396.49857000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 268, "label": "text", "bbox": {"l": 350.47177, "t": 395.01474, "r": 386.25897, "b": 397.2713, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 317, "text": "2013 interim result and interim dividend announced", "bbox": {"l": 350.47177, "t": 395.01474, "r": 386.25897, "b": 397.2713, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 269, "label": "text", "bbox": {"l": 329.40491, "t": 397.55749999999995, "r": 331.02695, "b": 399.81406, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 318, "text": "28", "bbox": {"l": 329.40491, "t": 397.55749999999995, "r": 331.02695, "b": 399.81406, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 270, "label": "text", "bbox": {"l": 331.83795, "t": 397.55749999999995, "r": 340.75909, "b": 399.81406, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 319, "text": "August 2013", "bbox": {"l": 331.83795, "t": 397.55749999999995, "r": 340.75909, "b": 399.81406, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 271, "label": "text", "bbox": {"l": 341.26437, "t": 397.7254, "r": 341.27408, "b": 399.04095, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 320, "text": " 1", "bbox": {"l": 341.26437, "t": 397.7254, "r": 341.27408, "b": 399.04095, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 272, "label": "text", "bbox": {"l": 350.47144, "t": 397.55713, "r": 385.93265, "b": 399.81369, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 321, "text": "2013 full year results and fi nal dividend announced ", "bbox": {"l": 350.47144, "t": 397.55713, "r": 385.93265, "b": 399.81369, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 273, "label": "text", "bbox": {"l": 329.40536, "t": 400.46155, "r": 329.87708, "b": 401.96588, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 322, "text": "1", "bbox": {"l": 329.40536, "t": 400.46155, "r": 329.87708, "b": 401.96588, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 274, "label": "text", "bbox": {"l": 330.34882, "t": 400.46155, "r": 358.65204, "b": 401.96588, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 323, "text": "Indicative dates only, subject to change/Board confi rmation", "bbox": {"l": 330.34882, "t": 400.46155, "r": 358.65204, "b": 401.96588, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 275, "label": "text", "bbox": {"l": 329.40536, "t": 404.34503, "r": 391.771, "b": 406.60156, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 324, "text": "AGL\u2019s Annual General Meeting will be held at the City Recital Hall, Angel Place, Sydney ", "bbox": {"l": 329.40536, "t": 404.34503, "r": 391.771, "b": 406.60156, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 276, "label": "text", "bbox": {"l": 329.40536, "t": 406.37857, "r": 369.65308, "b": 408.63513000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 325, "text": "commencing at 10.30am on Tuesday 23 October 2012.", "bbox": {"l": 329.40536, "t": 406.37857, "r": 369.65308, "b": 408.63513000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 277, "label": "text", "bbox": {"l": 363.54486, "t": 460.53054999999995, "r": 379.25955, "b": 465.54507, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 326, "text": "Ye s te rd ay", "bbox": {"l": 363.54486, "t": 460.53054999999995, "r": 379.25955, "b": 465.54507, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 278, "label": "text", "bbox": {"l": 363.54486, "t": 466.7157, "r": 391.38229, "b": 468.97223, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 327, "text": "Established in Sydney in 1837, and then ", "bbox": {"l": 363.54486, "t": 466.7157, "r": 391.38229, "b": 468.97223, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 279, "label": "text", "bbox": {"l": 363.54486, "t": 468.74924, "r": 395.01788, "b": 471.00577, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 328, "text": "known as The Australian Gas Light Company, ", "bbox": {"l": 363.54486, "t": 468.74924, "r": 395.01788, "b": 471.00577, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 280, "label": "text", "bbox": {"l": 363.54486, "t": 470.78281, "r": 394.08322, "b": 473.03934, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 329, "text": "the AGL business has an established history ", "bbox": {"l": 363.54486, "t": 470.78281, "r": 394.08322, "b": 473.03934, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 281, "label": "text", "bbox": {"l": 363.54486, "t": 472.81635, "r": 390.60727, "b": 475.07288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 330, "text": "and reputation for serving the gas and ", "bbox": {"l": 363.54486, "t": 472.81635, "r": 390.60727, "b": 475.07288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 282, "label": "text", "bbox": {"l": 363.54486, "t": 474.84988, "r": 393.49612, "b": 477.10645, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 331, "text": "electricity needs of Australian households. ", "bbox": {"l": 363.54486, "t": 474.84988, "r": 393.49612, "b": 477.10645, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 283, "label": "text", "bbox": {"l": 363.54486, "t": 476.88345, "r": 394.11481, "b": 479.13998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 332, "text": "In 1841, when AGL supplied the gas to light ", "bbox": {"l": 363.54486, "t": 476.88345, "r": 394.11481, "b": 479.13998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 284, "label": "text", "bbox": {"l": 363.54486, "t": 478.91699, "r": 393.75891, "b": 481.17352, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 333, "text": "the fi rst public street lamp, it was reported ", "bbox": {"l": 363.54486, "t": 478.91699, "r": 393.75891, "b": 481.17352, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 285, "label": "text", "bbox": {"l": 363.54486, "t": 480.95053, "r": 390.4975, "b": 483.20709, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 334, "text": "in the Sydney Gazette as a \u201cwonderful ", "bbox": {"l": 363.54486, "t": 480.95053, "r": 390.4975, "b": 483.20709, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 286, "label": "text", "bbox": {"l": 363.54486, "t": 482.9841, "r": 395.70975, "b": 485.24063, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 335, "text": "achievement of scientifi c knowledge, assisted ", "bbox": {"l": 363.54486, "t": 482.9841, "r": 395.70975, "b": 485.24063, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 287, "label": "text", "bbox": {"l": 363.54486, "t": 485.01764, "r": 394.27283, "b": 487.2742, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 336, "text": "by mechanical ingenuity.\u201d Within two years, ", "bbox": {"l": 363.54486, "t": 485.01764, "r": 394.27283, "b": 487.2742, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 288, "label": "text", "bbox": {"l": 363.54486, "t": 487.05121, "r": 396.65939, "b": 489.30774, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 337, "text": "165 gas lamps were lighting the City of Sydney.", "bbox": {"l": 363.54486, "t": 487.05121, "r": 396.65939, "b": 489.30774, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 289, "label": "text", "bbox": {"l": 329.4054, "t": 419.93124, "r": 384.19696, "b": 431.09412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 338, "text": "Looking back on ", "bbox": {"l": 329.4054, "t": 419.93124, "r": 384.19696, "b": 431.09412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 290, "label": "text", "bbox": {"l": 329.4054, "t": 430.10379, "r": 372.16626, "b": 441.26669, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 339, "text": "175 years of ", "bbox": {"l": 329.4054, "t": 430.10379, "r": 372.16626, "b": 441.26669, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 291, "label": "text", "bbox": {"l": 329.4054, "t": 440.27636999999993, "r": 385.3981, "b": 451.43924, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 340, "text": "looking forward.", "bbox": {"l": 329.4054, "t": 440.27636999999993, "r": 385.3981, "b": 451.43924, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 292, "label": "text", "bbox": {"l": 329.40536, "t": 372.16159, "r": 353.36179, "b": 373.91669, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 341, "text": "AGL Energy Limited ABN 74 115 061 375", "bbox": {"l": 329.40536, "t": 372.16159, "r": 353.36179, "b": 373.91669, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 293, "label": "text", "bbox": {"l": 546.20587, "t": 360.90448, "r": 548.23407, "b": 362.82242, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 342, "text": "29", "bbox": {"l": 546.20587, "t": 360.90448, "r": 548.23407, "b": 362.82242, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 294, "label": "text", "bbox": {"l": 497.77728, "t": 251.43384000000003, "r": 542.8255, "b": 254.94385, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 343, "text": "signs, signals and road markings", "bbox": {"l": 497.77728, "t": 251.43384000000003, "r": 542.8255, "b": 254.94385, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 295, "label": "text", "bbox": {"l": 490.30679, "t": 251.47478999999998, "r": 492.09982, "b": 254.98479999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 344, "text": "3", "bbox": {"l": 490.30679, "t": 251.47478999999998, "r": 492.09982, "b": 254.98479999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 296, "label": "text", "bbox": {"l": 498.15335, "t": 263.88922, "r": 500.05637, "b": 265.92719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 345, "text": "In ", "bbox": {"l": 498.15335, "t": 263.88922, "r": 500.05637, "b": 265.92719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 297, "label": "text", "bbox": {"l": 500.05637, "t": 263.85717999999997, "r": 524.37036, "b": 265.86310000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 346, "text": "chapter 2, you and your vehicle", "bbox": {"l": 500.05637, "t": 263.85717999999997, "r": 524.37036, "b": 265.86310000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 298, "label": "text", "bbox": {"l": 524.37036, "t": 263.88922, "r": 539.89124, "b": 265.92719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 347, "text": ", you learned about ", "bbox": {"l": 524.37036, "t": 263.88922, "r": 539.89124, "b": 265.92719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 299, "label": "text", "bbox": {"l": 498.15335, "t": 265.93224999999995, "r": 544.50403, "b": 267.97020999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 348, "text": "some of the controls in your vehicle. This chapter is a handy ", "bbox": {"l": 498.15335, "t": 265.93224999999995, "r": 544.50403, "b": 267.97020999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 300, "label": "text", "bbox": {"l": 498.15335, "t": 267.97533999999996, "r": 544.01343, "b": 270.01331000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 349, "text": "reference section that gives examples of the most common ", "bbox": {"l": 498.15335, "t": 267.97533999999996, "r": 544.01343, "b": 270.01331000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 301, "label": "text", "bbox": {"l": 498.15335, "t": 270.01831000000004, "r": 544.11987, "b": 272.05634, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 350, "text": "signs, signals and road markings that keep traffi c organized ", "bbox": {"l": 498.15335, "t": 270.01831000000004, "r": 544.11987, "b": 272.05634, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 302, "label": "text", "bbox": {"l": 498.15335, "t": 272.06140000000005, "r": 515.41071, "b": 274.09937, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 351, "text": "and flowing smoothly. ", "bbox": {"l": 498.15335, "t": 272.06140000000005, "r": 515.41071, "b": 274.09937, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 303, "label": "text", "bbox": {"l": 498.15335, "t": 277.34619, "r": 505.64642000000003, "b": 280.9357, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 352, "text": "Signs", "bbox": {"l": 498.15335, "t": 277.34619, "r": 505.64642000000003, "b": 280.9357, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 304, "label": "text", "bbox": {"l": 498.15335, "t": 281.82187, "r": 543.92957, "b": 283.85983, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 353, "text": "There are three ways to read signs: by their shape, colour and ", "bbox": {"l": 498.15335, "t": 281.82187, "r": 543.92957, "b": 283.85983, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 305, "label": "text", "bbox": {"l": 498.15335, "t": 283.8649, "r": 545.67834, "b": 285.90289, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 354, "text": "the messages printed on them. Understanding these three ways ", "bbox": {"l": 498.15335, "t": 283.8649, "r": 545.67834, "b": 285.90289, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 306, "label": "text", "bbox": {"l": 498.15335, "t": 285.90796, "r": 545.26471, "b": 287.94592, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 355, "text": "of classifying signs will help you figure out the meaning of signs ", "bbox": {"l": 498.15335, "t": 285.90796, "r": 545.26471, "b": 287.94592, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 307, "label": "text", "bbox": {"l": 498.15335, "t": 287.95099, "r": 513.31335, "b": 289.98895, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 356, "text": "that are new to you. ", "bbox": {"l": 498.15335, "t": 287.95099, "r": 513.31335, "b": 289.98895, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 308, "label": "text", "bbox": {"l": 505.43439, "t": 303.07596, "r": 508.53033000000005, "b": 304.89639, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 357, "text": "Stop", "bbox": {"l": 505.43439, "t": 303.07596, "r": 508.53033000000005, "b": 304.89639, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 309, "label": "text", "bbox": {"l": 527.45502, "t": 303.25354, "r": 541.44678, "b": 305.07397, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 358, "text": "Yield the right-of-way", "bbox": {"l": 527.45502, "t": 303.25354, "r": 541.44678, "b": 305.07397, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 310, "label": "text", "bbox": {"l": 501.79385, "t": 321.18973, "r": 510.41632, "b": 323.01016, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 359, "text": "Shows driving", "bbox": {"l": 501.79385, "t": 321.18973, "r": 510.41632, "b": 323.01016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 311, "label": "text", "bbox": {"l": 501.79385, "t": 322.87731999999994, "r": 509.04268999999994, "b": 324.69775000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 360, "text": "regulations", "bbox": {"l": 501.79385, "t": 322.87731999999994, "r": 509.04268999999994, "b": 324.69775000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 312, "label": "text", "bbox": {"l": 518.66455, "t": 319.59146, "r": 529.80902, "b": 321.41190000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 361, "text": "Explains lane use", "bbox": {"l": 518.66455, "t": 319.59146, "r": 529.80902, "b": 321.41190000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 313, "label": "text", "bbox": {"l": 534.87561, "t": 318.37616, "r": 546.95142, "b": 320.19659, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 362, "text": "School zone signs ", "bbox": {"l": 534.87561, "t": 318.37616, "r": 546.95142, "b": 320.19659, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 314, "label": "text", "bbox": {"l": 534.87561, "t": 320.0637500000001, "r": 545.05762, "b": 321.88419, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 363, "text": "are fl uorescent ", "bbox": {"l": 534.87561, "t": 320.0637500000001, "r": 545.05762, "b": 321.88419, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 315, "label": "text", "bbox": {"l": 534.87561, "t": 321.75134, "r": 543.32263, "b": 323.57178, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 364, "text": "yellow-green", "bbox": {"l": 534.87561, "t": 321.75134, "r": 543.32263, "b": 323.57178, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 316, "label": "text", "bbox": {"l": 499.21862999999996, "t": 338.12772, "r": 512.62451, "b": 339.94815, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 365, "text": "Tells about motorist ", "bbox": {"l": 499.21862999999996, "t": 338.12772, "r": 512.62451, "b": 339.94815, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 317, "label": "text", "bbox": {"l": 499.21862999999996, "t": 339.81531000000007, "r": 504.39917, "b": 341.63574, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 366, "text": "services", "bbox": {"l": 499.21862999999996, "t": 339.81531000000007, "r": 504.39917, "b": 341.63574, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 318, "label": "text", "bbox": {"l": 516.97748, "t": 338.06039, "r": 529.77484, "b": 339.88082999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 367, "text": "Shows a permitted ", "bbox": {"l": 516.97748, "t": 338.06039, "r": 529.77484, "b": 339.88082999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 319, "label": "text", "bbox": {"l": 516.97748, "t": 339.74799, "r": 520.96399, "b": 341.56842, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 368, "text": "action", "bbox": {"l": 516.97748, "t": 339.74799, "r": 520.96399, "b": 341.56842, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 320, "label": "text", "bbox": {"l": 534.55847, "t": 337.88281, "r": 548.58453, "b": 339.7032500000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 369, "text": "Shows an action that ", "bbox": {"l": 534.55847, "t": 337.88281, "r": 548.58453, "b": 339.7032500000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 321, "label": "text", "bbox": {"l": 534.55847, "t": 339.57040000000006, "r": 545.08862, "b": 341.39084, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 370, "text": "is not permitted", "bbox": {"l": 534.55847, "t": 339.57040000000006, "r": 545.08862, "b": 341.39084, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 322, "label": "text", "bbox": {"l": 483.05853, "t": 356.17416, "r": 494.72577, "b": 357.9946, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 371, "text": "Warns of hazards ", "bbox": {"l": 483.05853, "t": 356.17416, "r": 494.72577, "b": 357.9946, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 323, "label": "text", "bbox": {"l": 483.05853, "t": 357.86179, "r": 487.07525999999996, "b": 359.68222, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 372, "text": "ahead", "bbox": {"l": 483.05853, "t": 357.86179, "r": 487.07525999999996, "b": 359.68222, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 324, "label": "text", "bbox": {"l": 499.39645, "t": 356.26297000000005, "r": 504.69171, "b": 358.0834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 373, "text": "Warns of", "bbox": {"l": 499.39645, "t": 356.26297000000005, "r": 504.69171, "b": 358.0834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 325, "label": "text", "bbox": {"l": 499.39645, "t": 357.95056, "r": 511.69116, "b": 359.77099999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 374, "text": "construction zones", "bbox": {"l": 499.39645, "t": 357.95056, "r": 511.69116, "b": 359.77099999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 326, "label": "text", "bbox": {"l": 516.75891, "t": 356.26297000000005, "r": 527.42938, "b": 358.0834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 375, "text": "Railway crossing", "bbox": {"l": 516.75891, "t": 356.26297000000005, "r": 527.42938, "b": 358.0834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 327, "label": "text", "bbox": {"l": 534.5141, "t": 352.92981, "r": 547.89862, "b": 354.75024, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 376, "text": "Shows distance and ", "bbox": {"l": 534.5141, "t": 352.92981, "r": 547.89862, "b": 354.75024, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 328, "label": "text", "bbox": {"l": 534.5141, "t": 354.6174, "r": 540.2818, "b": 356.43784, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 377, "text": "direction", "bbox": {"l": 534.5141, "t": 354.6174, "r": 540.2818, "b": 356.43784, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 329, "label": "text", "bbox": {"l": 478.37466, "t": 270.14075, "r": 479.14251999999993, "b": 272.17877, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 378, "text": "\u2022", "bbox": {"l": 478.37466, "t": 270.14075, "r": 479.14251999999993, "b": 272.17877, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 330, "label": "text", "bbox": {"l": 479.91036999999994, "t": 270.14075, "r": 483.74963, "b": 272.17877, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 379, "text": "Signs", "bbox": {"l": 479.91036999999994, "t": 270.14075, "r": 483.74963, "b": 272.17877, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 331, "label": "text", "bbox": {"l": 479.97293, "t": 272.84717, "r": 492.31219, "b": 274.34888, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 380, "text": "- regulatory signs", "bbox": {"l": 479.97293, "t": 272.84717, "r": 492.31219, "b": 274.34888, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 332, "label": "text", "bbox": {"l": 479.97293, "t": 275.14513999999997, "r": 486.72598000000005, "b": 276.64679, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 381, "text": "- school, ", "bbox": {"l": 479.97293, "t": 275.14513999999997, "r": 486.72598000000005, "b": 276.64679, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 333, "label": "text", "bbox": {"l": 481.21602999999993, "t": 276.77972, "r": 492.93286000000006, "b": 278.81768999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 382, "text": "playground and ", "bbox": {"l": 481.21602999999993, "t": 276.77972, "r": 492.93286000000006, "b": 278.81768999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 334, "label": "text", "bbox": {"l": 481.21602999999993, "t": 278.82275000000004, "r": 491.82938000000007, "b": 280.86075, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 383, "text": "crosswalk signs", "bbox": {"l": 481.21602999999993, "t": 278.82275000000004, "r": 491.82938000000007, "b": 280.86075, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 335, "label": "text", "bbox": {"l": 479.97293, "t": 281.52759, "r": 491.00775000000004, "b": 283.02924, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 384, "text": "- lane use signs", "bbox": {"l": 479.97293, "t": 281.52759, "r": 491.00775000000004, "b": 283.02924, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 336, "label": "text", "bbox": {"l": 479.97293, "t": 283.82556, "r": 493.32748, "b": 285.3272099999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 385, "text": "- turn control signs", "bbox": {"l": 479.97293, "t": 283.82556, "r": 493.32748, "b": 285.3272099999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 337, "label": "text", "bbox": {"l": 479.97293, "t": 286.1235, "r": 490.4915199999999, "b": 287.62518, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 386, "text": "- parking signs", "bbox": {"l": 479.97293, "t": 286.1235, "r": 490.4915199999999, "b": 287.62518, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 338, "label": "text", "bbox": {"l": 479.97293, "t": 288.42148, "r": 491.17004000000003, "b": 289.92316, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 387, "text": "- reserved lane ", "bbox": {"l": 479.97293, "t": 288.42148, "r": 491.17004000000003, "b": 289.92316, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 339, "label": "text", "bbox": {"l": 481.21602999999993, "t": 290.05605999999995, "r": 484.77405000000005, "b": 292.09406, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 388, "text": "signs", "bbox": {"l": 481.21602999999993, "t": 290.05605999999995, "r": 484.77405000000005, "b": 292.09406, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 340, "label": "text", "bbox": {"l": 479.97293, "t": 292.76169000000004, "r": 490.83398, "b": 294.26334, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 389, "text": "- warning signs", "bbox": {"l": 479.97293, "t": 292.76169000000004, "r": 490.83398, "b": 294.26334, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 341, "label": "text", "bbox": {"l": 479.97293, "t": 295.05963, "r": 491.62692, "b": 296.56131, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 390, "text": "- object markers", "bbox": {"l": 479.97293, "t": 295.05963, "r": 491.62692, "b": 296.56131, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 342, "label": "text", "bbox": {"l": 479.97293, "t": 297.3576, "r": 490.37341, "b": 298.8592499999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 391, "text": "- construction ", "bbox": {"l": 479.97293, "t": 297.3576, "r": 490.37341, "b": 298.8592499999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 343, "label": "text", "bbox": {"l": 481.21602999999993, "t": 298.99219, "r": 484.77405000000005, "b": 301.03015, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 392, "text": "signs", "bbox": {"l": 481.21602999999993, "t": 298.99219, "r": 484.77405000000005, "b": 301.03015, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 344, "label": "text", "bbox": {"l": 479.97293, "t": 301.69780999999995, "r": 492.93912, "b": 303.19946, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 393, "text": "- information and ", "bbox": {"l": 479.97293, "t": 301.69780999999995, "r": 492.93912, "b": 303.19946, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 345, "label": "text", "bbox": {"l": 481.21602999999993, "t": 303.3324, "r": 493.00525, "b": 305.37036, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 394, "text": "destination signs", "bbox": {"l": 481.21602999999993, "t": 303.3324, "r": 493.00525, "b": 305.37036, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 346, "label": "text", "bbox": {"l": 479.97293, "t": 306.0379899999999, "r": 489.99047999999993, "b": 307.53967, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 395, "text": "- railway signs", "bbox": {"l": 479.97293, "t": 306.0379899999999, "r": 489.99047999999993, "b": 307.53967, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 347, "label": "text", "bbox": {"l": 478.375, "t": 308.24789, "r": 479.1032400000001, "b": 310.28586, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 396, "text": "\u2022", "bbox": {"l": 478.375, "t": 308.24789, "r": 479.1032400000001, "b": 310.28586, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 348, "label": "text", "bbox": {"l": 479.83151, "t": 308.24789, "r": 484.92925999999994, "b": 310.28586, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 397, "text": "Signals", "bbox": {"l": 479.83151, "t": 308.24789, "r": 484.92925999999994, "b": 310.28586, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 349, "label": "text", "bbox": {"l": 479.97293, "t": 310.95358, "r": 490.00091999999995, "b": 312.45526, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 398, "text": "- lane control ", "bbox": {"l": 479.97293, "t": 310.95358, "r": 490.00091999999995, "b": 312.45526, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 350, "label": "text", "bbox": {"l": 481.21602999999993, "t": 312.5881999999999, "r": 485.95331, "b": 314.62616, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 399, "text": "signals", "bbox": {"l": 481.21602999999993, "t": 312.5881999999999, "r": 485.95331, "b": 314.62616, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 351, "label": "text", "bbox": {"l": 479.97293, "t": 315.29379, "r": 489.29876999999993, "b": 316.79544, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 400, "text": "- traffic lights", "bbox": {"l": 479.97293, "t": 315.29379, "r": 489.29876999999993, "b": 316.79544, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 352, "label": "text", "bbox": {"l": 478.375, "t": 317.50366, "r": 479.18129999999996, "b": 319.5416599999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 401, "text": "\u2022", "bbox": {"l": 478.375, "t": 317.50366, "r": 479.18129999999996, "b": 319.5416599999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 353, "label": "text", "bbox": {"l": 479.98761, "t": 317.50366, "r": 490.46960000000007, "b": 319.5416599999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 402, "text": "Road markings", "bbox": {"l": 479.98761, "t": 317.50366, "r": 490.46960000000007, "b": 319.5416599999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 354, "label": "text", "bbox": {"l": 479.97293, "t": 320.20938, "r": 489.26166000000006, "b": 321.71103, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 403, "text": "- yellow lines", "bbox": {"l": 479.97293, "t": 320.20938, "r": 489.26166000000006, "b": 321.71103, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 355, "label": "text", "bbox": {"l": 479.97293, "t": 322.50732, "r": 488.59189, "b": 324.009, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 404, "text": "- white lines", "bbox": {"l": 479.97293, "t": 322.50732, "r": 488.59189, "b": 324.009, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 356, "label": "text", "bbox": {"l": 479.97293, "t": 324.8053, "r": 491.17004000000003, "b": 326.30698, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 405, "text": "- reserved lane ", "bbox": {"l": 479.97293, "t": 324.8053, "r": 491.17004000000003, "b": 326.30698, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 357, "label": "text", "bbox": {"l": 481.21602999999993, "t": 326.43988, "r": 487.58978, "b": 328.47784, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 406, "text": "markings", "bbox": {"l": 481.21602999999993, "t": 326.43988, "r": 487.58978, "b": 328.47784, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 358, "label": "text", "bbox": {"l": 479.97293, "t": 329.14551, "r": 491.75177, "b": 330.64716, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 407, "text": "- other markings", "bbox": {"l": 479.97293, "t": 329.14551, "r": 491.75177, "b": 330.64716, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 359, "label": "text", "bbox": {"l": 478.15246999999994, "t": 265.07030999999995, "r": 493.75586, "b": 268.06872999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 408, "text": "in this chapter", "bbox": {"l": 478.15246999999994, "t": 265.07030999999995, "r": 493.75586, "b": 268.06872999999996, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 16, "label": "caption", "bbox": {"l": 317.95499, "t": 540.08299, "r": 559.80579, "b": 559.51524, "coord_origin": "TOPLEFT"}, "confidence": 0.7793365120887756, "cells": [{"id": 409, "text": "Figure 1: Four examples of complex page layouts across dif-", "bbox": {"l": 317.95499, "t": 540.08299, "r": 559.80579, "b": 548.55624, "coord_origin": "TOPLEFT"}}, {"id": 410, "text": "ferent document categories", "bbox": {"l": 317.95499, "t": 551.0419899999999, "r": 428.69907, "b": 559.51524, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "section_header", "bbox": {"l": 317.95499, "t": 592.46591, "r": 379.8205, "b": 602.7750100000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9208476543426514, "cells": [{"id": 411, "text": "KEYWORDS", "bbox": {"l": 317.95499, "t": 592.46591, "r": 379.8205, "b": 602.7750100000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 317.95499, "t": 607.66756, "r": 559.18597, "b": 627.00117, "coord_origin": "TOPLEFT"}, "confidence": 0.9509093761444092, "cells": [{"id": 412, "text": "PDF document conversion, layout segmentation, object-detection,", "bbox": {"l": 317.95499, "t": 607.66756, "r": 559.18597, "b": 616.04218, "coord_origin": "TOPLEFT"}}, {"id": 413, "text": "data set, Machine Learning", "bbox": {"l": 317.95499, "t": 618.62656, "r": 416.94403, "b": 627.00117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "section_header", "bbox": {"l": 317.65997, "t": 640.05434, "r": 404.65366, "b": 647.58609, "coord_origin": "TOPLEFT"}, "confidence": 0.8721988797187805, "cells": [{"id": 414, "text": "ACM Reference Format:", "bbox": {"l": 317.65997, "t": 640.05434, "r": 404.65366, "b": 647.58609, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 317.95499, "t": 650.11996, "r": 559.5495, "b": 707.377029, "coord_origin": "TOPLEFT"}, "confidence": 0.9455165863037109, "cells": [{"id": 415, "text": "Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter", "bbox": {"l": 317.95499, "t": 650.11996, "r": 558.35266, "b": 657.56404, "coord_origin": "TOPLEFT"}}, {"id": 416, "text": "Staar. 2022. DocLayNet: A Large Human-Annotated Dataset for Document-", "bbox": {"l": 317.95499, "t": 660.08296, "r": 559.5495, "b": 667.52703, "coord_origin": "TOPLEFT"}}, {"id": 417, "text": "Layout Analysis. In", "bbox": {"l": 317.95499, "t": 670.04497, "r": 383.30807, "b": 677.48904, "coord_origin": "TOPLEFT"}}, {"id": 418, "text": "Proceedings of the 28th ACM SIGKDD Conference on", "bbox": {"l": 385.798, "t": 670.08482, "r": 558.20032, "b": 677.49701, "coord_origin": "TOPLEFT"}}, {"id": 419, "text": "Knowledge Discovery and Data Mining (KDD \u201922), August 14-18, 2022, Wash-", "bbox": {"l": 317.95499, "t": 680.04781, "r": 559.00092, "b": 687.46001, "coord_origin": "TOPLEFT"}}, {"id": 420, "text": "ington, DC, USA.", "bbox": {"l": 317.95499, "t": 690.01081, "r": 370.11481, "b": 697.423004, "coord_origin": "TOPLEFT"}}, {"id": 421, "text": "ACM, New York, NY, USA, 9 pages. https://doi.org/10.1145/", "bbox": {"l": 371.82999, "t": 689.97096, "r": 558.71655, "b": 697.415031, "coord_origin": "TOPLEFT"}}, {"id": 422, "text": "3534678.3539043", "bbox": {"l": 317.95499, "t": 699.932953, "r": 371.59375, "b": 707.377029, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "page_header", "bbox": {"l": 18.34021, "t": 218.35999000000004, "r": 36.339794, "b": 555.00003, "coord_origin": "TOPLEFT"}, "confidence": 0.8537883758544922, "cells": [{"id": 423, "text": "arXiv:2206.01062v1 [cs.CV] 2 Jun 2022", "bbox": {"l": 18.34021, "t": 218.35999000000004, "r": 36.339794, "b": 555.00003, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "section_header", "id": 12, "page_no": 0, "cluster": {"id": 12, "label": "section_header", "bbox": {"l": 107.29999999999998, "t": 83.69470000000013, "r": 505.06195, "b": 119.59558000000015, "coord_origin": "TOPLEFT"}, "confidence": 0.8416302800178528, "cells": [{"id": 0, "text": "DocLayNet: A Large Human-Annotated Dataset for", "bbox": {"l": 107.29999999999998, "t": 83.69470000000013, "r": 505.06195, "b": 99.67058999999995, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Document-Layout Analysis", "bbox": {"l": 200.117, "t": 103.6196900000001, "r": 411.88367, "b": 119.59558000000015, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis"}, {"label": "text", "id": 8, "page_no": 0, "cluster": {"id": 8, "label": "text", "bbox": {"l": 90.96701, "t": 133.67236000000003, "r": 193.73123, "b": 180.24030000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.8637151718139648, "cells": [{"id": 2, "text": "Birgit Pfitzmann", "bbox": {"l": 102.06001, "t": 133.67236000000003, "r": 182.63805, "b": 144.83856000000003, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "IBM Research", "bbox": {"l": 114.29401000000001, "t": 147.02423, "r": 170.40337, "b": 156.32928000000004, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Rueschlikon, Switzerland", "bbox": {"l": 90.96701, "t": 158.97924999999998, "r": 193.73123, "b": 168.28430000000003, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "bpf@zurich.ibm.com", "bbox": {"l": 100.02301, "t": 170.93524000000002, "r": 184.67522, "b": 180.24030000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Birgit Pfitzmann IBM Research Rueschlikon, Switzerland bpf@zurich.ibm.com"}, {"label": "text", "id": 9, "page_no": 0, "cluster": {"id": 9, "label": "text", "bbox": {"l": 255.11602999999997, "t": 133.67236000000003, "r": 357.88025, "b": 180.24030000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.8612664937973022, "cells": [{"id": 6, "text": "Christoph Auer", "bbox": {"l": 268.62402, "t": 133.67236000000003, "r": 344.59933, "b": 144.83856000000003, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "IBM Research", "bbox": {"l": 278.44302, "t": 147.02423, "r": 334.55237, "b": 156.32928000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Rueschlikon, Switzerland", "bbox": {"l": 255.11602999999997, "t": 158.97924999999998, "r": 357.88025, "b": 168.28430000000003, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "cau@zurich.ibm.com", "bbox": {"l": 263.70404, "t": 170.93524000000002, "r": 349.29272, "b": 180.24030000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Christoph Auer IBM Research Rueschlikon, Switzerland cau@zurich.ibm.com"}, {"label": "text", "id": 6, "page_no": 0, "cluster": {"id": 6, "label": "text", "bbox": {"l": 419.26505, "t": 133.67236000000003, "r": 522.0293, "b": 180.24030000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.8760607242584229, "cells": [{"id": 10, "text": "Michele Dolfi", "bbox": {"l": 437.6930500000001, "t": 133.67236000000003, "r": 503.60208, "b": 144.83856000000003, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "IBM Research", "bbox": {"l": 442.59305000000006, "t": 147.02423, "r": 498.7023899999999, "b": 156.32928000000004, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Rueschlikon, Switzerland", "bbox": {"l": 419.26505, "t": 158.97924999999998, "r": 522.0293, "b": 168.28430000000003, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "dol@zurich.ibm.com", "bbox": {"l": 428.56104000000005, "t": 170.93524000000002, "r": 512.73505, "b": 180.24030000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Michele Dolfi IBM Research Rueschlikon, Switzerland dol@zurich.ibm.com"}, {"label": "text", "id": 13, "page_no": 0, "cluster": {"id": 13, "label": "text", "bbox": {"l": 172.54303, "t": 192.05737, "r": 275.30725, "b": 238.62531, "coord_origin": "TOPLEFT"}, "confidence": 0.8319916129112244, "cells": [{"id": 14, "text": "Ahmed S. Nassar", "bbox": {"l": 182.26804, "t": 192.05737, "r": 265.39255, "b": 203.22357, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "IBM Research", "bbox": {"l": 195.87103, "t": 205.40923999999995, "r": 251.98038999999997, "b": 214.71429, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Rueschlikon, Switzerland", "bbox": {"l": 172.54303, "t": 217.36425999999994, "r": 275.30725, "b": 226.66931, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "ahn@zurich.ibm.com", "bbox": {"l": 180.52803, "t": 229.32025, "r": 267.3222, "b": 238.62531, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Ahmed S. Nassar IBM Research Rueschlikon, Switzerland ahn@zurich.ibm.com"}, {"label": "text", "id": 15, "page_no": 0, "cluster": {"id": 15, "label": "text", "bbox": {"l": 336.69302, "t": 192.05737, "r": 439.45727999999997, "b": 238.62531, "coord_origin": "TOPLEFT"}, "confidence": 0.8027974367141724, "cells": [{"id": 18, "text": "Peter Staar", "bbox": {"l": 361.52802, "t": 192.05737, "r": 414.84821, "b": 203.22357, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "IBM Research", "bbox": {"l": 360.02002, "t": 205.40923999999995, "r": 416.12939, "b": 214.71429, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Rueschlikon, Switzerland", "bbox": {"l": 336.69302, "t": 217.36425999999994, "r": 439.45727999999997, "b": 226.66931, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "taa@zurich.ibm.com", "bbox": {"l": 346.20703, "t": 229.32025, "r": 429.94269, "b": 238.62531, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Peter Staar IBM Research Rueschlikon, Switzerland taa@zurich.ibm.com"}, {"label": "section_header", "id": 5, "page_no": 0, "cluster": {"id": 5, "label": "section_header", "bbox": {"l": 53.798035, "t": 247.70288000000005, "r": 111.94354, "b": 258.01202, "coord_origin": "TOPLEFT"}, "confidence": 0.8876155018806458, "cells": [{"id": 22, "text": "ABSTRACT", "bbox": {"l": 53.798035, "t": 247.70288000000005, "r": 111.94354, "b": 258.01202, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "ABSTRACT"}, {"label": "text", "id": 0, "page_no": 0, "cluster": {"id": 0, "label": "text", "bbox": {"l": 53.466999, "t": 262.90454, "r": 295.56018, "b": 534.29318, "coord_origin": "TOPLEFT"}, "confidence": 0.9823057055473328, "cells": [{"id": 23, "text": "Accurate document layout analysis is a key requirement for high-", "bbox": {"l": 53.484001, "t": 262.90454, "r": 295.55591, "b": 271.27917, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "quality PDF document conversion. With the recent availability of", "bbox": {"l": 53.79800000000001, "t": 273.86352999999997, "r": 294.04199, "b": 282.23816, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "public, large ground-truth datasets such as PubLayNet and DocBank,", "bbox": {"l": 53.79800000000001, "t": 284.82254, "r": 295.34586, "b": 293.19717, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "deep-learning models have proven to be very effective at layout", "bbox": {"l": 53.79800000000001, "t": 295.78152, "r": 294.04709, "b": 304.15616000000006, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "detection and segmentation. While these datasets are of adequate", "bbox": {"l": 53.79800000000001, "t": 306.74053999999995, "r": 294.04645, "b": 315.11517, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "size to train such models, they severely lack in layout variability", "bbox": {"l": 53.79800000000001, "t": 317.69952, "r": 294.27573, "b": 326.07416, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "since they are sourced from scientific article repositories such as", "bbox": {"l": 53.79800000000001, "t": 328.65854, "r": 294.04712, "b": 337.03317, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "PubMed and arXiv only. Consequently, the accuracy of the layout", "bbox": {"l": 53.79800000000001, "t": 339.61755, "r": 294.0437, "b": 347.99219, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "segmentation drops significantly when these models are applied", "bbox": {"l": 53.79800000000001, "t": 350.57654, "r": 294.04715, "b": 358.95117, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "on more challenging and diverse layouts. In this paper, we present", "bbox": {"l": 53.79800000000001, "t": 361.53455, "r": 294.04364, "b": 369.90918000000005, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "DocLayNet", "bbox": {"l": 53.79800000000001, "t": 372.53839, "r": 92.863388, "b": 380.87714000000005, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": ", a new, publicly available, document-layout annotation", "bbox": {"l": 92.863998, "t": 372.49353, "r": 294.04361, "b": 380.86816, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "dataset in COCO format. It contains 80863 manually annotated", "bbox": {"l": 53.79800000000001, "t": 383.45255, "r": 294.04718, "b": 391.82718, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "pages from diverse data sources to represent a wide variability in", "bbox": {"l": 53.79800000000001, "t": 394.41153, "r": 294.0437, "b": 402.78616, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "layouts. For each PDF page, the layout annotations provide labelled", "bbox": {"l": 53.79800000000001, "t": 405.37054, "r": 294.04535, "b": 413.74518, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "bounding-boxes with a choice of 11 distinct classes. DocLayNet", "bbox": {"l": 53.79800000000001, "t": 416.32953, "r": 294.04715, "b": 424.70416000000006, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "also provides a subset of double- and triple-annotated pages to", "bbox": {"l": 53.79800000000001, "t": 427.28853999999995, "r": 294.04712, "b": 435.66318, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "determine the inter-annotator agreement. In multiple experiments,", "bbox": {"l": 53.79800000000001, "t": 438.24753, "r": 295.03, "b": 446.62216, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "we provide baseline accuracy scores (in mAP) for a set of popular", "bbox": {"l": 53.466999, "t": 449.20654, "r": 294.21616, "b": 457.58118, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "object detection models. We also demonstrate that these models", "bbox": {"l": 53.79800000000001, "t": 460.16553, "r": 294.04712, "b": 468.54016, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "fall approximately 10% behind the inter-annotator agreement. Fur-", "bbox": {"l": 53.79800000000001, "t": 471.12354, "r": 295.56018, "b": 479.49817, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "thermore, we provide evidence that DocLayNet is of sufficient size.", "bbox": {"l": 53.79800000000001, "t": 482.08255, "r": 295.42783, "b": 490.45718, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Lastly, we compare models trained on PubLayNet, DocBank and", "bbox": {"l": 53.79800000000001, "t": 493.04153, "r": 294.04715, "b": 501.41617, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "DocLayNet, showing that layout predictions of the DocLayNet-", "bbox": {"l": 53.79800000000001, "t": 504.00055, "r": 295.55618, "b": 512.37518, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "trained models are more robust and thus the preferred choice for", "bbox": {"l": 53.79800000000001, "t": 514.95953, "r": 294.21643, "b": 523.33417, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "general-purpose document-layout analysis.", "bbox": {"l": 53.79800000000001, "t": 525.91855, "r": 212.05495, "b": 534.29318, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Accurate document layout analysis is a key requirement for highquality PDF document conversion. With the recent availability of public, large ground-truth datasets such as PubLayNet and DocBank, deep-learning models have proven to be very effective at layout detection and segmentation. While these datasets are of adequate size to train such models, they severely lack in layout variability since they are sourced from scientific article repositories such as PubMed and arXiv only. Consequently, the accuracy of the layout segmentation drops significantly when these models are applied on more challenging and diverse layouts. In this paper, we present DocLayNet , a new, publicly available, document-layout annotation dataset in COCO format. It contains 80863 manually annotated pages from diverse data sources to represent a wide variability in layouts. For each PDF page, the layout annotations provide labelled bounding-boxes with a choice of 11 distinct classes. DocLayNet also provides a subset of double- and triple-annotated pages to determine the inter-annotator agreement. In multiple experiments, we provide baseline accuracy scores (in mAP) for a set of popular object detection models. We also demonstrate that these models fall approximately 10% behind the inter-annotator agreement. Furthermore, we provide evidence that DocLayNet is of sufficient size. Lastly, we compare models trained on PubLayNet, DocBank and DocLayNet, showing that layout predictions of the DocLayNettrained models are more robust and thus the preferred choice for general-purpose document-layout analysis."}, {"label": "section_header", "id": 4, "page_no": 0, "cluster": {"id": 4, "label": "section_header", "bbox": {"l": 53.79800000000001, "t": 550.99692, "r": 134.81989, "b": 561.30602, "coord_origin": "TOPLEFT"}, "confidence": 0.9149598479270935, "cells": [{"id": 49, "text": "CCS CONCEPTS", "bbox": {"l": 53.79800000000001, "t": 550.99692, "r": 134.81989, "b": 561.30602, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "CCS CONCEPTS"}, {"label": "text", "id": 11, "page_no": 0, "cluster": {"id": 11, "label": "text", "bbox": {"l": 53.797989, "t": 566.08299, "r": 297.85294, "b": 596.50114, "coord_origin": "TOPLEFT"}, "confidence": 0.8458839058876038, "cells": [{"id": 50, "text": "\u2022", "bbox": {"l": 53.79800000000001, "t": 566.19957, "r": 56.945206000000006, "b": 574.57419, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Information systems", "bbox": {"l": 58.440002, "t": 566.0830100000001, "r": 142.4462, "b": 574.5562600000001, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "\u2192", "bbox": {"l": 143.938, "t": 566.36096, "r": 153.15099, "b": 574.43073, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Document structure", "bbox": {"l": 154.646, "t": 566.0830100000001, "r": 235.46015999999997, "b": 574.5562600000001, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "; \u2022", "bbox": {"l": 235.45700000000002, "t": 566.19955, "r": 242.17419, "b": 574.57417, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "Applied com-", "bbox": {"l": 243.66899, "t": 566.08299, "r": 297.85294, "b": 574.55624, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "puting", "bbox": {"l": 53.797989, "t": 577.0419899999999, "r": 80.661324, "b": 585.51524, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "\u2192", "bbox": {"l": 83.565987, "t": 577.3199500000001, "r": 92.778961, "b": 585.38971, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Document analysis", "bbox": {"l": 95.68399, "t": 577.0419899999999, "r": 173.91583, "b": 585.51524, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "; \u2022", "bbox": {"l": 173.916, "t": 577.15855, "r": 182.1272, "b": 585.53317, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Computing methodologies", "bbox": {"l": 185.032, "t": 577.0419899999999, "r": 294.0455, "b": 585.51524, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "\u2192", "bbox": {"l": 53.79800399999999, "t": 588.27895, "r": 63.01097899999999, "b": 596.34871, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "Machine learning", "bbox": {"l": 65.253006, "t": 588.00099, "r": 136.80487, "b": 596.47424, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": ";", "bbox": {"l": 136.80501, "t": 588.1175499999999, "r": 138.92108, "b": 596.49217, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "Computer vision", "bbox": {"l": 141.162, "t": 588.00099, "r": 209.60254, "b": 596.47424, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": ";", "bbox": {"l": 209.60201, "t": 588.1175499999999, "r": 211.71808, "b": 596.49217, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "Object detection", "bbox": {"l": 213.96001, "t": 588.16238, "r": 270.45728, "b": 596.50114, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": ";", "bbox": {"l": 270.48001, "t": 588.1175499999999, "r": 272.59607, "b": 596.49217, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u00b7 Information systems \u2192 Document structure ; \u00b7 Applied computing \u2192 Document analysis ; \u00b7 Computing methodologies \u2192 Machine learning ; Computer vision ; Object detection ;"}, {"label": "text", "id": 17, "page_no": 0, "cluster": {"id": 17, "label": "text", "bbox": {"l": 53.79800000000001, "t": 634.39838, "r": 295.11798, "b": 672.79189, "coord_origin": "TOPLEFT"}, "confidence": 0.7107349038124084, "cells": [{"id": 68, "text": "Permission to make digital or hard copies of part or all of this work for personal or", "bbox": {"l": 53.79800000000001, "t": 634.39838, "r": 294.17697, "b": 640.9119000000001, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "classroom use is granted without fee provided that copies are not made or distributed", "bbox": {"l": 53.79800000000001, "t": 642.36838, "r": 294.04443, "b": 648.8819, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "for profit or commercial advantage and that copies bear this notice and the full citation", "bbox": {"l": 53.79800000000001, "t": 650.33838, "r": 294.04498, "b": 656.8519, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "on the first page. Copyrights for third-party components of this work must be honored.", "bbox": {"l": 53.79800000000001, "t": 658.3083799999999, "r": 295.11798, "b": 664.8219, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "For all other uses, contact the owner/author(s).", "bbox": {"l": 53.79800000000001, "t": 666.27837, "r": 187.72285, "b": 672.79189, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Permission to make digital or hard copies of part or all of this work for personal or classroom use is granted without fee provided that copies are not made or distributed for profit or commercial advantage and that copies bear this notice and the full citation on the first page. Copyrights for third-party components of this work must be honored. For all other uses, contact the owner/author(s)."}, {"label": "text", "id": 29, "page_no": 0, "cluster": {"id": 29, "label": "text", "bbox": {"l": 53.79800000000001, "t": 675.08023, "r": 197.86275, "b": 681.56586, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 53.79800000000001, "t": 675.08023, "r": 197.86275, "b": 681.56586, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA"}, {"label": "text", "id": 30, "page_no": 0, "cluster": {"id": 30, "label": "text", "bbox": {"l": 53.317001, "t": 683.81236, "r": 186.74652, "b": 690.32589, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "\u00a9 2022 Copyright held by the owner/author(s).", "bbox": {"l": 53.317001, "t": 683.81236, "r": 186.74652, "b": 690.32589, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u00a9 2022 Copyright held by the owner/author(s)."}, {"label": "text", "id": 31, "page_no": 0, "cluster": {"id": 31, "label": "text", "bbox": {"l": 53.554001, "t": 691.78336, "r": 157.03125, "b": 698.29689, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "ACM ISBN 978-1-4503-9385-0/22/08.", "bbox": {"l": 53.554001, "t": 691.78336, "r": 157.03125, "b": 698.29689, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "ACM ISBN 978-1-4503-9385-0/22/08."}, {"label": "text", "id": 27, "page_no": 0, "cluster": {"id": 27, "label": "text", "bbox": {"l": 53.79800000000001, "t": 699.753365, "r": 166.94093, "b": 706.266891, "coord_origin": "TOPLEFT"}, "confidence": 0.509588360786438, "cells": [{"id": 76, "text": "https://doi.org/10.1145/3534678.3539043", "bbox": {"l": 53.79800000000001, "t": 699.753365, "r": 166.94093, "b": 706.266891, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "https://doi.org/10.1145/3534678.3539043"}, {"label": "picture", "id": 20, "page_no": 0, "cluster": {"id": 20, "label": "picture", "bbox": {"l": 323.408203125, "t": 250.34873962402344, "r": 553.2952270507812, "b": 525.8507080078125, "coord_origin": "TOPLEFT"}, "confidence": 0.5910208821296692, "cells": [{"id": 77, "text": "13", "bbox": {"l": 327.86951, "t": 351.78085, "r": 330.41248, "b": 353.95465, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "USING THE VERTICAL TUBE -", "bbox": {"l": 327.83005, "t": 331.57268999999997, "r": 351.16092, "b": 333.31171, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "MODELS AY11230/11234", "bbox": {"l": 327.83005, "t": 333.18292, "r": 348.30536, "b": 334.92194, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "1.", "bbox": {"l": 327.83005, "t": 336.40439, "r": 329.05914, "b": 337.92606, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "The vertical tube can be used for", "bbox": {"l": 329.67368, "t": 336.40439, "r": 349.95349, "b": 337.92606, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "instructional viewing or to photograph", "bbox": {"l": 329.11752, "t": 337.83588, "r": 353.57977, "b": 339.35751000000005, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": " the image with a digital camera or a", "bbox": {"l": 327.77121, "t": 339.26736, "r": 352.4306, "b": 340.789, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": " micro TV unit", "bbox": {"l": 328.15176, "t": 340.69882, "r": 337.91086, "b": 342.22049, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "2.", "bbox": {"l": 327.8313, "t": 342.19043000000005, "r": 329.09155, "b": 343.71207, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Loosen the retention screw, then rotate ", "bbox": {"l": 329.72168, "t": 342.19043000000005, "r": 354.9267, "b": 343.71207, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": " the adjustment ring to change the ", "bbox": {"l": 327.8313, "t": 343.62192, "r": 351.66949, "b": 345.14355, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": " length of the vertical tube.", "bbox": {"l": 328.21185, "t": 345.05338, "r": 346.33179, "b": 346.57504, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "3.", "bbox": {"l": 327.83005, "t": 346.84680000000003, "r": 329.12726, "b": 348.36847, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "Make sure that both the images in", "bbox": {"l": 329.77588, "t": 346.84680000000003, "r": 351.18005, "b": 348.36847, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "OPERATION ", "bbox": {"l": 327.25311, "t": 254.94812000000002, "r": 350.07861, "b": 258.86096, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "(", "bbox": {"l": 350.07861, "t": 254.76782000000003, "r": 351.82651, "b": 258.68066, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "cont.", "bbox": {"l": 351.82651, "t": 254.94812000000002, "r": 360.85242, "b": 258.86096, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": ")", "bbox": {"l": 360.85242, "t": 254.76782000000003, "r": 362.60028, "b": 258.68066, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "SELECTING OBJECTIVE ", "bbox": {"l": 326.88037, "t": 263.49492999999995, "r": 345.84351, "b": 265.23395000000005, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "MAGNIFICATION", "bbox": {"l": 326.88037, "t": 265.10515999999996, "r": 340.54153, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "1.", "bbox": {"l": 326.88037, "t": 266.71533, "r": 328.31903, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "There are two objectives. The lower", "bbox": {"l": 329.03836, "t": 266.71533, "r": 354.21472, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": " magnification objective has a greater", "bbox": {"l": 326.88037, "t": 268.32556, "r": 355.19193, "b": 270.06458, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": " depth of field and view.", "bbox": {"l": 326.88037, "t": 269.93579, "r": 345.80057, "b": 271.6748, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "2.", "bbox": {"l": 326.88037, "t": 271.54602, "r": 328.33862, "b": 273.28503, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "In order to observe the specimen", "bbox": {"l": 329.06775, "t": 271.54602, "r": 352.39969, "b": 273.28503, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": " easily use the lower magnification", "bbox": {"l": 326.88037, "t": 273.15619000000004, "r": 352.90042, "b": 274.89526, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": " objective first. Then, by rotating the", "bbox": {"l": 326.88037, "t": 274.76642000000004, "r": 354.59546, "b": 276.50543000000005, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": " case, the magnification can be", "bbox": {"l": 326.88037, "t": 276.37665000000004, "r": 350.81885, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": " changed.", "bbox": {"l": 326.88037, "t": 277.98688000000004, "r": 335.46707, "b": 279.72589000000005, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "CHANGING THE INTERPUPILLARY ", "bbox": {"l": 326.88037, "t": 281.20728, "r": 354.57755, "b": 282.94632, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "DISTANCE", "bbox": {"l": 326.88037, "t": 282.81750000000005, "r": 335.1752, "b": 284.55652, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "1.", "bbox": {"l": 326.88037, "t": 284.4277, "r": 328.34784, "b": 286.16675, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "The distance between the observer's", "bbox": {"l": 329.08157, "t": 284.4277, "r": 354.76245, "b": 286.16675, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": " pupils is the interpupillary distance.", "bbox": {"l": 326.88037, "t": 286.03793, "r": 354.6499, "b": 287.77695, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "2.", "bbox": {"l": 326.88037, "t": 287.64813, "r": 328.25125, "b": 289.38718, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "To adjust the interpupillary distance", "bbox": {"l": 328.93671, "t": 287.64813, "r": 354.29825, "b": 289.38718, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": " rotate the prism caps until both eyes", "bbox": {"l": 326.88181, "t": 289.25836, "r": 355.02075, "b": 290.99738, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": " coincide with the image in the", "bbox": {"l": 326.88181, "t": 290.86855999999995, "r": 350.82028, "b": 292.6076, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": " eyepiece. ", "bbox": {"l": 326.88181, "t": 292.47879, "r": 336.2067, "b": 294.2178, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "FOCUSING", "bbox": {"l": 326.88181, "t": 295.69922, "r": 335.3941, "b": 297.43823, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "1.", "bbox": {"l": 326.88181, "t": 297.30942, "r": 328.34314, "b": 299.04846, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "Remove the lens protective cover.", "bbox": {"l": 329.07379, "t": 297.30942, "r": 353.18555, "b": 299.04846, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "2.", "bbox": {"l": 326.88324, "t": 298.91965, "r": 328.35919, "b": 300.65866, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "Place the specimen on the working", "bbox": {"l": 329.0972, "t": 298.91965, "r": 353.45065, "b": 300.65866, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": " stage.", "bbox": {"l": 326.88324, "t": 300.52985, "r": 333.32825, "b": 302.26889000000006, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "3.", "bbox": {"l": 326.88324, "t": 302.14008000000007, "r": 328.31296, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "Focus the specimen with the left eye", "bbox": {"l": 329.02783, "t": 302.14008000000007, "r": 354.76303, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": " first while turning the focus knob until", "bbox": {"l": 326.88324, "t": 303.75027, "r": 355.96307, "b": 305.48932, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": " the image appears clear and sharp.", "bbox": {"l": 326.88324, "t": 305.3605, "r": 354.46594, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "4.", "bbox": {"l": 326.88324, "t": 306.9707, "r": 328.25488, "b": 308.70975, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "Rotate the right eyepiece ring until the", "bbox": {"l": 328.9407, "t": 306.9707, "r": 356.37335, "b": 308.70975, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": " images in each eyepiece coincide and", "bbox": {"l": 326.88324, "t": 308.58093, "r": 355.38867, "b": 310.31995, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": " are sharp and clear.", "bbox": {"l": 326.88324, "t": 310.19113, "r": 343.17249, "b": 311.93018, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "CHANGING THE BULB", "bbox": {"l": 326.88324, "t": 313.41156, "r": 344.13388, "b": 315.15059999999994, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "1.", "bbox": {"l": 326.88324, "t": 315.02178999999995, "r": 328.37418, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "Disconnect the power cord.", "bbox": {"l": 329.11963, "t": 315.02178999999995, "r": 348.50162, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "2.", "bbox": {"l": 326.88324, "t": 316.63199, "r": 328.34061, "b": 318.37103, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "When the bulb is cool, remove the", "bbox": {"l": 329.06931, "t": 316.63199, "r": 353.11588, "b": 318.37103, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": " oblique illuminator cap and remove", "bbox": {"l": 326.88464, "t": 318.2422199999999, "r": 353.79517, "b": 319.9812299999999, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": " the halogen bulb with cap.", "bbox": {"l": 326.88464, "t": 319.85242000000005, "r": 348.02094, "b": 321.59146, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "3.", "bbox": {"l": 326.88464, "t": 321.46265, "r": 328.37512, "b": 323.20166, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "Replace with a new halogen bulb.", "bbox": {"l": 329.12036, "t": 321.46265, "r": 352.96808, "b": 323.20166, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "4.", "bbox": {"l": 326.88608, "t": 323.07285, "r": 328.36884, "b": 324.81189, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "Open the window in the base plate and", "bbox": {"l": 329.1102, "t": 323.07285, "r": 356.5412, "b": 324.81189, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": " replace the halogen lamp or ", "bbox": {"l": 326.88608, "t": 324.68307000000004, "r": 350.13828, "b": 326.42209, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": " fluorescent lamp of transmitted", "bbox": {"l": 326.88608, "t": 326.29327, "r": 351.59677, "b": 328.03232, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": " illuminator.", "bbox": {"l": 326.88608, "t": 327.9035, "r": 336.89197, "b": 329.64252, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "FOCUSING", "bbox": {"l": 358.42023, "t": 263.49492999999995, "r": 366.93256, "b": 265.23395000000005, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "1.", "bbox": {"l": 358.42023, "t": 265.10515999999996, "r": 359.89841, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "Turn the focusing knob away or toward", "bbox": {"l": 360.63751, "t": 265.10515999999996, "r": 387.98407, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": " you until a clear image is viewed.", "bbox": {"l": 358.42023, "t": 266.71533, "r": 384.58948, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "2.", "bbox": {"l": 358.42166, "t": 268.32556, "r": 359.78549, "b": 270.06458, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "If the image is unclear, adjust the", "bbox": {"l": 360.46741, "t": 268.32556, "r": 384.33441, "b": 270.06458, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": " height of the elevator up or down,", "bbox": {"l": 358.4231, "t": 269.93579, "r": 384.61502, "b": 271.6748, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": " then turn the focusing knob again.", "bbox": {"l": 358.4231, "t": 271.54602, "r": 385.38922, "b": 273.28503, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "ZOOM MAGNIFICATION", "bbox": {"l": 358.4231, "t": 274.76642000000004, "r": 377.35046, "b": 276.50543000000005, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "1.", "bbox": {"l": 358.4231, "t": 276.37665000000004, "r": 359.89429, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "Turn the zoom magnification knob to", "bbox": {"l": 360.62988, "t": 276.37665000000004, "r": 386.37589, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": " the desired magnification and field of", "bbox": {"l": 358.4231, "t": 277.98688000000004, "r": 386.78732, "b": 279.72589000000005, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": " view.", "bbox": {"l": 358.4231, "t": 279.59704999999997, "r": 364.16855, "b": 281.33609, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "2.", "bbox": {"l": 358.4231, "t": 281.20728, "r": 359.86777, "b": 282.94632, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "In most situations, it is recommended", "bbox": {"l": 360.59012, "t": 281.20728, "r": 387.31656, "b": 282.94632, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": " that you focus at the lowest ", "bbox": {"l": 358.4231, "t": 282.81750000000005, "r": 381.56656, "b": 284.55652, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": " magnification, then move to a higher", "bbox": {"l": 358.4231, "t": 284.4277, "r": 386.63403, "b": 286.16675, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": " magnification and re-focus as ", "bbox": {"l": 358.42453, "t": 286.03793, "r": 382.77115, "b": 287.77695, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": " necessary.", "bbox": {"l": 358.42453, "t": 287.64813, "r": 367.98694, "b": 289.38718, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "3.", "bbox": {"l": 358.42453, "t": 289.25836, "r": 359.80386, "b": 290.99738, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "If the image is not clear to both eyes", "bbox": {"l": 360.49353, "t": 289.25836, "r": 386.70093, "b": 290.99738, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": " at the same time, the diopter ring may", "bbox": {"l": 358.42453, "t": 290.86855999999995, "r": 388.03534, "b": 292.6076, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": " need adjustment.", "bbox": {"l": 358.42453, "t": 292.47879, "r": 373.13724, "b": 294.2178, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "DIOPTER RING ADJUSTMENT", "bbox": {"l": 358.42453, "t": 295.69922, "r": 381.74539, "b": 297.43823, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "1.", "bbox": {"l": 358.42453, "t": 297.30942, "r": 359.83682, "b": 299.04846, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "To adjust the eyepiece for viewing with", "bbox": {"l": 360.54297, "t": 297.30942, "r": 388.08289, "b": 299.04846, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": " or without eyeglasses and for ", "bbox": {"l": 358.42453, "t": 298.91965, "r": 382.73251, "b": 300.65866, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": " differences in acuity between the right", "bbox": {"l": 358.42453, "t": 300.52985, "r": 387.72266, "b": 302.26889000000006, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": " and left eyes, follow the following", "bbox": {"l": 358.42453, "t": 302.14008000000007, "r": 384.1991, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": " steps:", "bbox": {"l": 358.42453, "t": 303.75027, "r": 364.88672, "b": 305.48932, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "a.", "bbox": {"l": 358.42453, "t": 305.3605, "r": 359.95078, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "Observe an image through the left", "bbox": {"l": 361.47699, "t": 305.3605, "r": 386.65988, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": " eyepiece and bring a specific point", "bbox": {"l": 358.42453, "t": 306.9707, "r": 386.7634, "b": 308.70975, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": " into focus using the focus knob.", "bbox": {"l": 358.42453, "t": 308.58093, "r": 385.41354, "b": 310.31995, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "b.", "bbox": {"l": 358.42453, "t": 310.19113, "r": 359.93304, "b": 311.93018, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "By turning the diopter ring ", "bbox": {"l": 361.44156, "t": 310.19113, "r": 382.56085, "b": 311.93018, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": " adjustment for the left eyepiece,", "bbox": {"l": 358.42596, "t": 311.80136, "r": 385.4559, "b": 313.54037, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": " bring the same point into sharp", "bbox": {"l": 358.42596, "t": 313.41156, "r": 384.56122, "b": 315.15059999999994, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": " focus.", "bbox": {"l": 358.42596, "t": 315.02178999999995, "r": 366.74371, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": " c.Then bring the same point into", "bbox": {"l": 358.42596, "t": 316.63199, "r": 383.93884, "b": 318.37103, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": " focus through the right eyepiece", "bbox": {"l": 358.42596, "t": 318.2422199999999, "r": 385.69241, "b": 319.9812299999999, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": " by turning the right diopter ring.", "bbox": {"l": 358.42596, "t": 319.85242000000005, "r": 385.94861, "b": 321.59146, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": " d.With more than one viewer, each", "bbox": {"l": 358.42596, "t": 321.46265, "r": 385.54236, "b": 323.20166, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": " viewer should note their own", "bbox": {"l": 358.42596, "t": 323.07285, "r": 382.98718, "b": 324.81189, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": " diopter ring position for the left", "bbox": {"l": 358.42596, "t": 324.68307000000004, "r": 385.06448, "b": 326.42209, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": " and right eyepieces, then before", "bbox": {"l": 358.42596, "t": 326.29327, "r": 385.20682, "b": 328.03232, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": " viewing set the diopter ring", "bbox": {"l": 358.42596, "t": 327.9035, "r": 382.21964, "b": 329.64252, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": " adjustments to that setting.", "bbox": {"l": 358.42596, "t": 329.5137, "r": 382.63382, "b": 331.25275, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "CHANGING THE BULB", "bbox": {"l": 358.42596, "t": 332.73412999999994, "r": 375.67661, "b": 334.47317999999996, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "1.", "bbox": {"l": 358.42596, "t": 334.34436, "r": 359.90311, "b": 336.08337, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "Disconnect the power cord from the", "bbox": {"l": 360.64169, "t": 334.34436, "r": 385.75333, "b": 336.08337, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": " electrical outlet.", "bbox": {"l": 358.42596, "t": 335.95456, "r": 372.01416, "b": 337.6936, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "2.", "bbox": {"l": 358.42596, "t": 337.56479, "r": 359.88327, "b": 339.3038, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "When the bulb is cool, remove the", "bbox": {"l": 360.61191, "t": 337.56479, "r": 384.65726, "b": 339.3038, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": " oblique illuminator cap and remove", "bbox": {"l": 358.42596, "t": 339.17499, "r": 385.33649, "b": 340.9140300000001, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": " the halogen bulb with cap.", "bbox": {"l": 358.42596, "t": 340.78522, "r": 379.57224, "b": 342.52423, "coord_origin": "TOPLEFT"}}, {"id": 201, "text": "3.", "bbox": {"l": 358.4274, "t": 342.39542, "r": 359.91788, "b": 344.13446000000005, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": "Replace with a new halogen bulb.", "bbox": {"l": 360.66312, "t": 342.39542, "r": 384.5108, "b": 344.13446000000005, "coord_origin": "TOPLEFT"}}, {"id": 203, "text": "4.", "bbox": {"l": 358.42883, "t": 344.00565000000006, "r": 359.92792, "b": 345.74466, "coord_origin": "TOPLEFT"}}, {"id": 204, "text": "Open the window in the base plate", "bbox": {"l": 360.67746, "t": 344.00565000000006, "r": 385.41235, "b": 345.74466, "coord_origin": "TOPLEFT"}}, {"id": 205, "text": " and replace the halogen lamp or", "bbox": {"l": 358.42883, "t": 345.61584, "r": 383.2782, "b": 347.35489, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": " fluorescent lamp of transmitted", "bbox": {"l": 358.42883, "t": 347.22607, "r": 383.13953, "b": 348.96509, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": " illuminator.", "bbox": {"l": 358.42883, "t": 348.83627, "r": 368.43472, "b": 350.57532, "coord_origin": "TOPLEFT"}}, {"id": 208, "text": "Model AY11230", "bbox": {"l": 326.59567, "t": 261.14185, "r": 339.11377, "b": 262.88091999999995, "coord_origin": "TOPLEFT"}}, {"id": 209, "text": "Model AY11234", "bbox": {"l": 358.48605, "t": 261.14185, "r": 371.00415, "b": 262.88091999999995, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": "14", "bbox": {"l": 455.43533, "t": 351.77038999999996, "r": 457.97827000000007, "b": 353.94415, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "Objectives", "bbox": {"l": 408.24518, "t": 275.52673000000004, "r": 414.4234, "b": 276.96020999999996, "coord_origin": "TOPLEFT"}}, {"id": 212, "text": "Revolving Turret", "bbox": {"l": 409.39554, "t": 268.98235999999997, "r": 419.06677, "b": 270.41583, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "Coarse ", "bbox": {"l": 441.3895, "t": 279.12627999999995, "r": 445.87192, "b": 280.55975, "coord_origin": "TOPLEFT"}}, {"id": 214, "text": "Adjustment", "bbox": {"l": 441.3895, "t": 280.30609, "r": 448.22338999999994, "b": 281.7395900000001, "coord_origin": "TOPLEFT"}}, {"id": 215, "text": "Knob", "bbox": {"l": 441.3895, "t": 281.48593, "r": 444.40371999999996, "b": 282.91939999999994, "coord_origin": "TOPLEFT"}}, {"id": 216, "text": "MODEL AY11236", "bbox": {"l": 398.79288, "t": 254.94646999999998, "r": 428.91568, "b": 258.85931000000005, "coord_origin": "TOPLEFT"}}, {"id": 217, "text": "MICROSCOPE USAGE", "bbox": {"l": 398.32535, "t": 305.04291, "r": 435.93542, "b": 308.95572000000004, "coord_origin": "TOPLEFT"}}, {"id": 218, "text": "BARSKA Model AY11236 is a powerful fixed power compound ", "bbox": {"l": 398.08594, "t": 310.35892, "r": 453.72171, "b": 312.53271, "coord_origin": "TOPLEFT"}}, {"id": 219, "text": "microscope designed for biological studies such as specimen ", "bbox": {"l": 398.08594, "t": 312.50586, "r": 453.09939999999995, "b": 314.67966, "coord_origin": "TOPLEFT"}}, {"id": 220, "text": "examination. It can also be used for examining bacteria and", "bbox": {"l": 398.08594, "t": 314.6528, "r": 456.65246999999994, "b": 316.8266, "coord_origin": "TOPLEFT"}}, {"id": 221, "text": "for general clinical and medical studies and other scientific uses. ", "bbox": {"l": 398.08594, "t": 316.79977, "r": 456.73859000000004, "b": 318.97354, "coord_origin": "TOPLEFT"}}, {"id": 222, "text": "CONSTRUCTION", "bbox": {"l": 398.62399, "t": 320.42941, "r": 427.77472, "b": 324.34222000000005, "coord_origin": "TOPLEFT"}}, {"id": 223, "text": "BARSKA Model AY11236 is a fixed power compound microscope.", "bbox": {"l": 398.08594, "t": 326.46069000000006, "r": 456.02639999999997, "b": 328.63449, "coord_origin": "TOPLEFT"}}, {"id": 224, "text": "It is constructed with two optical paths at the same angle. It is ", "bbox": {"l": 398.08414, "t": 328.6076699999999, "r": 455.42238999999995, "b": 330.7814599999999, "coord_origin": "TOPLEFT"}}, {"id": 225, "text": "equipped with transmitted illumination. By using this instrument, ", "bbox": {"l": 398.08414, "t": 330.75461, "r": 457.39844, "b": 332.92841, "coord_origin": "TOPLEFT"}}, {"id": 226, "text": "the user can observe specimens at magnification from 40x to ", "bbox": {"l": 398.08414, "t": 332.90155, "r": 453.97745, "b": 335.07535000000007, "coord_origin": "TOPLEFT"}}, {"id": 227, "text": "1000x by selecting the desired objective lens. Coarse and fine ", "bbox": {"l": 398.08414, "t": 335.04852, "r": 454.70708999999994, "b": 337.22232, "coord_origin": "TOPLEFT"}}, {"id": 228, "text": "focus adjustments provide accuracy and image detail. The rotating ", "bbox": {"l": 398.08414, "t": 337.19547, "r": 458.90240000000006, "b": 339.36926, "coord_origin": "TOPLEFT"}}, {"id": 229, "text": "head allows the user to position the eyepieces for maximum ", "bbox": {"l": 398.08594, "t": 339.34241, "r": 453.0672, "b": 341.5162, "coord_origin": "TOPLEFT"}}, {"id": 230, "text": "viewing comfort and easy access to all adjustment knobs.", "bbox": {"l": 398.08594, "t": 341.48938, "r": 449.63113, "b": 343.66318, "coord_origin": "TOPLEFT"}}, {"id": 231, "text": "Model AY11236", "bbox": {"l": 422.10626, "t": 301.24191, "r": 434.62433000000004, "b": 302.98096, "coord_origin": "TOPLEFT"}}, {"id": 232, "text": "Fine ", "bbox": {"l": 442.01610999999997, "t": 283.08649, "r": 444.8817399999999, "b": 284.51996, "coord_origin": "TOPLEFT"}}, {"id": 233, "text": "Adjustment", "bbox": {"l": 442.01610999999997, "t": 284.2663, "r": 448.85001, "b": 285.69980000000004, "coord_origin": "TOPLEFT"}}, {"id": 234, "text": "Knob", "bbox": {"l": 442.01610999999997, "t": 285.44611, "r": 445.03033000000005, "b": 286.87961, "coord_origin": "TOPLEFT"}}, {"id": 235, "text": "Stage", "bbox": {"l": 408.00577, "t": 279.12579000000005, "r": 411.42212, "b": 280.5593, "coord_origin": "TOPLEFT"}}, {"id": 236, "text": "Condenser ", "bbox": {"l": 404.07172, "t": 280.9144299999999, "r": 410.77707, "b": 282.3479, "coord_origin": "TOPLEFT"}}, {"id": 237, "text": "Focusing", "bbox": {"l": 404.07172, "t": 282.09424, "r": 409.2157, "b": 283.52774, "coord_origin": "TOPLEFT"}}, {"id": 238, "text": "Knob", "bbox": {"l": 404.07172, "t": 283.27408, "r": 407.08594, "b": 284.7075500000001, "coord_origin": "TOPLEFT"}}, {"id": 239, "text": "Eyepiece", "bbox": {"l": 441.81281, "t": 262.32178, "r": 447.03702, "b": 263.75525000000005, "coord_origin": "TOPLEFT"}}, {"id": 240, "text": "Stand", "bbox": {"l": 437.34607, "t": 271.13025000000005, "r": 440.80496, "b": 272.56281, "coord_origin": "TOPLEFT"}}, {"id": 241, "text": "Lamp ", "bbox": {"l": 409.7164, "t": 284.40027, "r": 413.3768, "b": 285.83282, "coord_origin": "TOPLEFT"}}, {"id": 242, "text": "On/Off", "bbox": {"l": 409.7164, "t": 285.83163, "r": 413.68201, "b": 287.26416, "coord_origin": "TOPLEFT"}}, {"id": 243, "text": "Switch", "bbox": {"l": 409.7164, "t": 287.263, "r": 413.6337, "b": 288.69553, "coord_origin": "TOPLEFT"}}, {"id": 244, "text": "Lamp ", "bbox": {"l": 434.8712499999999, "t": 296.7153, "r": 438.53164999999996, "b": 298.14783, "coord_origin": "TOPLEFT"}}, {"id": 245, "text": "Power", "bbox": {"l": 439.52039, "t": 292.18307000000004, "r": 443.08768, "b": 293.61560000000003, "coord_origin": "TOPLEFT"}}, {"id": 246, "text": "Cord", "bbox": {"l": 439.52039, "t": 293.61444, "r": 442.29575, "b": 295.04697, "coord_origin": "TOPLEFT"}}, {"id": 247, "text": "Rotating Head", "bbox": {"l": 413.55829, "t": 264.66089, "r": 421.94913, "b": 266.09344, "coord_origin": "TOPLEFT"}}, {"id": 248, "text": "Stage Clip", "bbox": {"l": 441.84316999999993, "t": 286.90573, "r": 447.87585000000007, "b": 288.33826, "coord_origin": "TOPLEFT"}}, {"id": 249, "text": "Adjustment", "bbox": {"l": 441.84316999999993, "t": 288.3371, "r": 448.67252, "b": 289.76962000000003, "coord_origin": "TOPLEFT"}}, {"id": 250, "text": "Interpupillary Slide Adjustment", "bbox": {"l": 407.2403, "t": 259.86645999999996, "r": 425.79089, "b": 261.29895, "coord_origin": "TOPLEFT"}}, {"id": 251, "text": "Circling Minimums", "bbox": {"l": 449.10074000000003, "t": 378.66302, "r": 466.08835000000005, "b": 380.78412, "coord_origin": "TOPLEFT"}}, {"id": 252, "text": "7", "bbox": {"l": 449.10074000000003, "t": 383.2203999999999, "r": 449.64444, "b": 385.34148999999996, "coord_origin": "TOPLEFT"}}, {"id": 253, "text": "K H U H Z D V D F K D Q J H W R W K H 7 ( 5 3 6 F U L W H U L D L Q W K D W D \u1087H F W V F L U F O L Q J D U H D G L P H Q V L R Q E \\ H [ S D Q G L Q J W K H D U H D V W R S U R Y L G H ", "bbox": {"l": 450.18811, "t": 383.2203999999999, "r": 550.77124, "b": 385.34148999999996, "coord_origin": "TOPLEFT"}}, {"id": 254, "text": "improved obstacle protection. To indicate that the new criteria had been applied to a given procedure, a ", "bbox": {"l": 449.10074000000003, "t": 385.75732, "r": 536.14716, "b": 387.87842, "coord_origin": "TOPLEFT"}}, {"id": 255, "text": " is placed on ", "bbox": {"l": 538.31085, "t": 385.75732, "r": 549.49921, "b": 387.87842, "coord_origin": "TOPLEFT"}}, {"id": 256, "text": "the circling line of minimums. The new circling tables and explanatory information is located in the Legend of the TPP.", "bbox": {"l": 449.10074000000003, "t": 388.03601, "r": 547.58185, "b": 390.1571, "coord_origin": "TOPLEFT"}}, {"id": 257, "text": "7", "bbox": {"l": 449.10074000000003, "t": 393.2128000000001, "r": 449.6163, "b": 395.33386, "coord_origin": "TOPLEFT"}}, {"id": 258, "text": "K H D S S U R D F K H V X V L Q J V W D Q G D U G F L U F O L Q J D S S U R D F K D U H D V F D Q E H L G H Q W L \u00bf H G E \\ W K H D E V H Q F H R I W K H ", "bbox": {"l": 450.1319, "t": 393.2128000000001, "r": 529.53082, "b": 395.33386, "coord_origin": "TOPLEFT"}}, {"id": 259, "text": " on the circling line of ", "bbox": {"l": 532.05829, "t": 393.2128000000001, "r": 550.42261, "b": 395.33386, "coord_origin": "TOPLEFT"}}, {"id": 260, "text": "minima.", "bbox": {"l": 449.10074000000003, "t": 395.49149, "r": 455.74692, "b": 397.61255, "coord_origin": "TOPLEFT"}}, {"id": 261, "text": "$ S S O \\ 6 W D Q G D U G & L U F O L Q J $ S S U R D F K 0 D Q H X Y H U L Q J 5 D G L X V 7 D E O H ", "bbox": {"l": 449.95525999999995, "t": 415.59549, "r": 496.2829, "b": 417.50446, "coord_origin": "TOPLEFT"}}, {"id": 262, "text": "$ S S O \\ ( [ S D Q G H G & L U F O L Q J $ S S U R D F K 0 D Q H X Y H U L Q J $ L U V S D F H 5 D G L X V ", "bbox": {"l": 501.13077, "t": 409.25543, "r": 551.16101, "b": 411.1644, "coord_origin": "TOPLEFT"}}, {"id": 263, "text": "Table", "bbox": {"l": 501.13077, "t": 411.30624, "r": 505.2477999999999, "b": 413.21521, "coord_origin": "TOPLEFT"}}, {"id": 264, "text": "AIRPORT SKETCH", "bbox": {"l": 449.10074000000003, "t": 420.18802, "r": 469.35599, "b": 422.73331, "coord_origin": "TOPLEFT"}}, {"id": 265, "text": "The airport sketch is a depiction of the airport with emphasis on runway pattern and related ", "bbox": {"l": 449.10074000000003, "t": 425.08908, "r": 525.93616, "b": 427.21017, "coord_origin": "TOPLEFT"}}, {"id": 266, "text": "information, positioned in either the lower left or lower right corner of the chart to aid pi-", "bbox": {"l": 449.10074000000003, "t": 427.3678, "r": 522.0343, "b": 429.48886, "coord_origin": "TOPLEFT"}}, {"id": 267, "text": "lot recognition of the airport from the air and to provide some information to aid on ground ", "bbox": {"l": 449.10074000000003, "t": 429.64648, "r": 524.67151, "b": 431.76755, "coord_origin": "TOPLEFT"}}, {"id": 268, "text": "navigation of the airport. The runways are drawn to scale and oriented to true north. Runway ", "bbox": {"l": 449.10074000000003, "t": 431.92514000000006, "r": 527.172, "b": 434.04623, "coord_origin": "TOPLEFT"}}, {"id": 269, "text": "dimensions (length and width) are shown for all active runways.", "bbox": {"l": 449.10074000000003, "t": 434.20383, "r": 502.39545, "b": 436.32492, "coord_origin": "TOPLEFT"}}, {"id": 270, "text": "Runway(s) are depicted based on what type and construction of the runway.", "bbox": {"l": 449.10074000000003, "t": 438.7611999999999, "r": 512.92676, "b": 440.88228999999995, "coord_origin": "TOPLEFT"}}, {"id": 271, "text": "Hard Surface", "bbox": {"l": 449.95525999999995, "t": 444.07001, "r": 460.02307, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}, {"id": 272, "text": "Other Than ", "bbox": {"l": 464.89963, "t": 444.07001, "r": 473.98819, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}, {"id": 273, "text": "Hard Surface", "bbox": {"l": 464.89963, "t": 446.12085, "r": 474.96744, "b": 448.02979, "coord_origin": "TOPLEFT"}}, {"id": 274, "text": "Metal Surface", "bbox": {"l": 478.91357, "t": 444.07001, "r": 489.45648, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}, {"id": 275, "text": "Closed Runway", "bbox": {"l": 493.06420999999995, "t": 444.07001, "r": 505.03076, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}, {"id": 276, "text": "Under Construction", "bbox": {"l": 509.5809, "t": 444.07001, "r": 524.30237, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}, {"id": 277, "text": "Stopways, ", "bbox": {"l": 449.95525999999995, "t": 454.81207, "r": 458.31406, "b": 456.72104, "coord_origin": "TOPLEFT"}}, {"id": 278, "text": "Taxiways, Park-", "bbox": {"l": 449.95525999999995, "t": 456.86288, "r": 461.92083999999994, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}}, {"id": 279, "text": "ing Areas", "bbox": {"l": 449.95525999999995, "t": 458.91373, "r": 457.08014, "b": 460.82268999999997, "coord_origin": "TOPLEFT"}}, {"id": 280, "text": "Displaced ", "bbox": {"l": 464.89963, "t": 454.81207, "r": 472.87732, "b": 456.72104, "coord_origin": "TOPLEFT"}}, {"id": 281, "text": "Threshold", "bbox": {"l": 464.89963, "t": 456.86288, "r": 472.49792, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}}, {"id": 282, "text": "Closed", "bbox": {"l": 478.91357, "t": 454.81207, "r": 483.61584, "b": 456.72104, "coord_origin": "TOPLEFT"}}, {"id": 283, "text": "Pavement", "bbox": {"l": 478.91357, "t": 456.86288, "r": 486.60754000000003, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}}, {"id": 284, "text": "Water Runway", "bbox": {"l": 493.06420999999995, "t": 454.81207, "r": 504.20648, "b": 456.72104, "coord_origin": "TOPLEFT"}}, {"id": 285, "text": "Taxiways and aprons are shaded grey. Other runway features that may be shown are runway numbers, runway dimen-", "bbox": {"l": 449.10074000000003, "t": 469.32974, "r": 548.59674, "b": 471.45081, "coord_origin": "TOPLEFT"}}, {"id": 286, "text": "sions, runway slope, arresting gear, and displaced threshold.", "bbox": {"l": 449.10074000000003, "t": 471.60843, "r": 500.08181999999994, "b": 473.72949, "coord_origin": "TOPLEFT"}}, {"id": 287, "text": "2", "bbox": {"l": 449.10074000000003, "t": 476.16577, "r": 449.59933000000007, "b": 478.28687, "coord_origin": "TOPLEFT"}}, {"id": 288, "text": "W K H U L Q I R U P D W L R Q F R Q F H U Q L Q J O L J K W L Q J \u00bf Q D O D S S U R D F K E H D U L Q J V D L U S R U W E H D F R Q R E V W D F O H V F R Q W U R O W R Z H U 1 $ 9 $ , ' V K H O L ", "bbox": {"l": 450.09796, "t": 476.16577, "r": 547.82562, "b": 478.28687, "coord_origin": "TOPLEFT"}}, {"id": 289, "text": "-", "bbox": {"l": 547.82623, "t": 476.16577, "r": 548.45862, "b": 478.28687, "coord_origin": "TOPLEFT"}}, {"id": 290, "text": "pads may also be shown.", "bbox": {"l": 449.10074000000003, "t": 478.44446, "r": 470.52609000000007, "b": 480.56555, "coord_origin": "TOPLEFT"}}, {"id": 291, "text": "$ L U S R U W ( O H Y D W L R Q D Q G 7 R X F K G R Z Q = R Q H ( O H Y D W L R Q ", "bbox": {"l": 449.10074000000003, "t": 483.00183, "r": 493.37906000000004, "b": 485.12292, "coord_origin": "TOPLEFT"}}, {"id": 292, "text": "The airport elevation is shown enclosed within a box in the upper left corner of the sketch box and the touchdown zone ", "bbox": {"l": 449.10074000000003, "t": 487.5592, "r": 549.16168, "b": 489.6803, "coord_origin": "TOPLEFT"}}, {"id": 293, "text": "elevation (TDZE) is shown in the upper right corner of the sketch box. The airport elevation is the highest point of an ", "bbox": {"l": 449.10074000000003, "t": 489.83789, "r": 546.90881, "b": 491.95898, "coord_origin": "TOPLEFT"}}, {"id": 294, "text": "D L U S R U W \u00b6 V X V D E O H U X Q Z D \\ V P H D V X U H G L Q I H H W I U R P P H D Q V H D O H Y H O 7 K H 7 ' = ( L V W K H K L J K H V W H O H Y D W L R Q L Q W K H \u00bf U V W I H H W R I ", "bbox": {"l": 449.10074000000003, "t": 492.11658, "r": 551.80023, "b": 494.23767, "coord_origin": "TOPLEFT"}}, {"id": 295, "text": "the landing surface. Circling only approaches will not show a TDZE.", "bbox": {"l": 449.10074000000003, "t": 494.39526, "r": 505.85068000000007, "b": 496.51636, "coord_origin": "TOPLEFT"}}, {"id": 296, "text": "114", "bbox": {"l": 498.80661000000003, "t": 515.9437, "r": 502.08792, "b": 519.01764, "coord_origin": "TOPLEFT"}}, {"id": 297, "text": "FAA Chart Users\u2019 Guide - Terminal Procedures Publication (TPP) - Terms", "bbox": {"l": 444.56319999999994, "t": 422.84869, "r": 446.25998, "b": 471.87128, "coord_origin": "TOPLEFT"}}, {"id": 298, "text": "AGL 2013 Financial Calendar", "bbox": {"l": 329.40536, "t": 379.37537, "r": 355.13138, "b": 382.13336, "coord_origin": "TOPLEFT"}}, {"id": 299, "text": "22", "bbox": {"l": 329.40536, "t": 382.30273, "r": 330.96848, "b": 384.55927, "coord_origin": "TOPLEFT"}}, {"id": 300, "text": "August 2012 ", "bbox": {"l": 331.75003, "t": 382.30273, "r": 341.12875, "b": 384.55927, "coord_origin": "TOPLEFT"}}, {"id": 301, "text": "2012 full year result and fi nal dividend announced", "bbox": {"l": 350.4722, "t": 382.30273, "r": 384.81079, "b": 384.55927, "coord_origin": "TOPLEFT"}}, {"id": 302, "text": "30", "bbox": {"l": 329.40536, "t": 384.84552, "r": 330.97336, "b": 387.10205, "coord_origin": "TOPLEFT"}}, {"id": 303, "text": "August 2012 ", "bbox": {"l": 331.75735, "t": 384.84552, "r": 341.16534, "b": 387.10205, "coord_origin": "TOPLEFT"}}, {"id": 304, "text": "Ex-dividend trading commences", "bbox": {"l": 350.4722, "t": 384.84552, "r": 372.90613, "b": 387.10205, "coord_origin": "TOPLEFT"}}, {"id": 305, "text": "5", "bbox": {"l": 329.40536, "t": 387.38828, "r": 330.20337, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}}, {"id": 306, "text": "September 2012 ", "bbox": {"l": 331.00137, "t": 387.38828, "r": 342.9715, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}}, {"id": 307, "text": "Record date for 2012 fi nal dividend", "bbox": {"l": 350.4722, "t": 387.38828, "r": 374.88693, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}}, {"id": 308, "text": "27", "bbox": {"l": 329.40536, "t": 389.93103, "r": 331.0173, "b": 392.18762, "coord_origin": "TOPLEFT"}}, {"id": 309, "text": "September 2012 ", "bbox": {"l": 331.82327, "t": 389.93103, "r": 343.91284, "b": 392.18762, "coord_origin": "TOPLEFT"}}, {"id": 310, "text": "Final dividend payable", "bbox": {"l": 350.4722, "t": 389.93103, "r": 365.65988, "b": 392.18762, "coord_origin": "TOPLEFT"}}, {"id": 311, "text": "23", "bbox": {"l": 329.40536, "t": 392.47382, "r": 330.98804, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}}, {"id": 312, "text": "October 2012 ", "bbox": {"l": 331.77936, "t": 392.47382, "r": 342.06674, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}}, {"id": 313, "text": "Annual General Meeting", "bbox": {"l": 350.4722, "t": 392.47382, "r": 367.22156, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}}, {"id": 314, "text": "27", "bbox": {"l": 329.40536, "t": 395.0166, "r": 330.99741, "b": 397.27313, "coord_origin": "TOPLEFT"}}, {"id": 315, "text": "February 2013", "bbox": {"l": 331.7934, "t": 395.0166, "r": 342.1416, "b": 397.27313, "coord_origin": "TOPLEFT"}}, {"id": 316, "text": " 1", "bbox": {"l": 342.64841, "t": 395.18298, "r": 342.65811, "b": 396.49857000000003, "coord_origin": "TOPLEFT"}}, {"id": 317, "text": "2013 interim result and interim dividend announced", "bbox": {"l": 350.47177, "t": 395.01474, "r": 386.25897, "b": 397.2713, "coord_origin": "TOPLEFT"}}, {"id": 318, "text": "28", "bbox": {"l": 329.40491, "t": 397.55749999999995, "r": 331.02695, "b": 399.81406, "coord_origin": "TOPLEFT"}}, {"id": 319, "text": "August 2013", "bbox": {"l": 331.83795, "t": 397.55749999999995, "r": 340.75909, "b": 399.81406, "coord_origin": "TOPLEFT"}}, {"id": 320, "text": " 1", "bbox": {"l": 341.26437, "t": 397.7254, "r": 341.27408, "b": 399.04095, "coord_origin": "TOPLEFT"}}, {"id": 321, "text": "2013 full year results and fi nal dividend announced ", "bbox": {"l": 350.47144, "t": 397.55713, "r": 385.93265, "b": 399.81369, "coord_origin": "TOPLEFT"}}, {"id": 322, "text": "1", "bbox": {"l": 329.40536, "t": 400.46155, "r": 329.87708, "b": 401.96588, "coord_origin": "TOPLEFT"}}, {"id": 323, "text": "Indicative dates only, subject to change/Board confi rmation", "bbox": {"l": 330.34882, "t": 400.46155, "r": 358.65204, "b": 401.96588, "coord_origin": "TOPLEFT"}}, {"id": 324, "text": "AGL\u2019s Annual General Meeting will be held at the City Recital Hall, Angel Place, Sydney ", "bbox": {"l": 329.40536, "t": 404.34503, "r": 391.771, "b": 406.60156, "coord_origin": "TOPLEFT"}}, {"id": 325, "text": "commencing at 10.30am on Tuesday 23 October 2012.", "bbox": {"l": 329.40536, "t": 406.37857, "r": 369.65308, "b": 408.63513000000006, "coord_origin": "TOPLEFT"}}, {"id": 326, "text": "Ye s te rd ay", "bbox": {"l": 363.54486, "t": 460.53054999999995, "r": 379.25955, "b": 465.54507, "coord_origin": "TOPLEFT"}}, {"id": 327, "text": "Established in Sydney in 1837, and then ", "bbox": {"l": 363.54486, "t": 466.7157, "r": 391.38229, "b": 468.97223, "coord_origin": "TOPLEFT"}}, {"id": 328, "text": "known as The Australian Gas Light Company, ", "bbox": {"l": 363.54486, "t": 468.74924, "r": 395.01788, "b": 471.00577, "coord_origin": "TOPLEFT"}}, {"id": 329, "text": "the AGL business has an established history ", "bbox": {"l": 363.54486, "t": 470.78281, "r": 394.08322, "b": 473.03934, "coord_origin": "TOPLEFT"}}, {"id": 330, "text": "and reputation for serving the gas and ", "bbox": {"l": 363.54486, "t": 472.81635, "r": 390.60727, "b": 475.07288, "coord_origin": "TOPLEFT"}}, {"id": 331, "text": "electricity needs of Australian households. ", "bbox": {"l": 363.54486, "t": 474.84988, "r": 393.49612, "b": 477.10645, "coord_origin": "TOPLEFT"}}, {"id": 332, "text": "In 1841, when AGL supplied the gas to light ", "bbox": {"l": 363.54486, "t": 476.88345, "r": 394.11481, "b": 479.13998, "coord_origin": "TOPLEFT"}}, {"id": 333, "text": "the fi rst public street lamp, it was reported ", "bbox": {"l": 363.54486, "t": 478.91699, "r": 393.75891, "b": 481.17352, "coord_origin": "TOPLEFT"}}, {"id": 334, "text": "in the Sydney Gazette as a \u201cwonderful ", "bbox": {"l": 363.54486, "t": 480.95053, "r": 390.4975, "b": 483.20709, "coord_origin": "TOPLEFT"}}, {"id": 335, "text": "achievement of scientifi c knowledge, assisted ", "bbox": {"l": 363.54486, "t": 482.9841, "r": 395.70975, "b": 485.24063, "coord_origin": "TOPLEFT"}}, {"id": 336, "text": "by mechanical ingenuity.\u201d Within two years, ", "bbox": {"l": 363.54486, "t": 485.01764, "r": 394.27283, "b": 487.2742, "coord_origin": "TOPLEFT"}}, {"id": 337, "text": "165 gas lamps were lighting the City of Sydney.", "bbox": {"l": 363.54486, "t": 487.05121, "r": 396.65939, "b": 489.30774, "coord_origin": "TOPLEFT"}}, {"id": 338, "text": "Looking back on ", "bbox": {"l": 329.4054, "t": 419.93124, "r": 384.19696, "b": 431.09412, "coord_origin": "TOPLEFT"}}, {"id": 339, "text": "175 years of ", "bbox": {"l": 329.4054, "t": 430.10379, "r": 372.16626, "b": 441.26669, "coord_origin": "TOPLEFT"}}, {"id": 340, "text": "looking forward.", "bbox": {"l": 329.4054, "t": 440.27636999999993, "r": 385.3981, "b": 451.43924, "coord_origin": "TOPLEFT"}}, {"id": 341, "text": "AGL Energy Limited ABN 74 115 061 375", "bbox": {"l": 329.40536, "t": 372.16159, "r": 353.36179, "b": 373.91669, "coord_origin": "TOPLEFT"}}, {"id": 342, "text": "29", "bbox": {"l": 546.20587, "t": 360.90448, "r": 548.23407, "b": 362.82242, "coord_origin": "TOPLEFT"}}, {"id": 343, "text": "signs, signals and road markings", "bbox": {"l": 497.77728, "t": 251.43384000000003, "r": 542.8255, "b": 254.94385, "coord_origin": "TOPLEFT"}}, {"id": 344, "text": "3", "bbox": {"l": 490.30679, "t": 251.47478999999998, "r": 492.09982, "b": 254.98479999999995, "coord_origin": "TOPLEFT"}}, {"id": 345, "text": "In ", "bbox": {"l": 498.15335, "t": 263.88922, "r": 500.05637, "b": 265.92719, "coord_origin": "TOPLEFT"}}, {"id": 346, "text": "chapter 2, you and your vehicle", "bbox": {"l": 500.05637, "t": 263.85717999999997, "r": 524.37036, "b": 265.86310000000003, "coord_origin": "TOPLEFT"}}, {"id": 347, "text": ", you learned about ", "bbox": {"l": 524.37036, "t": 263.88922, "r": 539.89124, "b": 265.92719, "coord_origin": "TOPLEFT"}}, {"id": 348, "text": "some of the controls in your vehicle. This chapter is a handy ", "bbox": {"l": 498.15335, "t": 265.93224999999995, "r": 544.50403, "b": 267.97020999999995, "coord_origin": "TOPLEFT"}}, {"id": 349, "text": "reference section that gives examples of the most common ", "bbox": {"l": 498.15335, "t": 267.97533999999996, "r": 544.01343, "b": 270.01331000000005, "coord_origin": "TOPLEFT"}}, {"id": 350, "text": "signs, signals and road markings that keep traffi c organized ", "bbox": {"l": 498.15335, "t": 270.01831000000004, "r": 544.11987, "b": 272.05634, "coord_origin": "TOPLEFT"}}, {"id": 351, "text": "and flowing smoothly. ", "bbox": {"l": 498.15335, "t": 272.06140000000005, "r": 515.41071, "b": 274.09937, "coord_origin": "TOPLEFT"}}, {"id": 352, "text": "Signs", "bbox": {"l": 498.15335, "t": 277.34619, "r": 505.64642000000003, "b": 280.9357, "coord_origin": "TOPLEFT"}}, {"id": 353, "text": "There are three ways to read signs: by their shape, colour and ", "bbox": {"l": 498.15335, "t": 281.82187, "r": 543.92957, "b": 283.85983, "coord_origin": "TOPLEFT"}}, {"id": 354, "text": "the messages printed on them. Understanding these three ways ", "bbox": {"l": 498.15335, "t": 283.8649, "r": 545.67834, "b": 285.90289, "coord_origin": "TOPLEFT"}}, {"id": 355, "text": "of classifying signs will help you figure out the meaning of signs ", "bbox": {"l": 498.15335, "t": 285.90796, "r": 545.26471, "b": 287.94592, "coord_origin": "TOPLEFT"}}, {"id": 356, "text": "that are new to you. ", "bbox": {"l": 498.15335, "t": 287.95099, "r": 513.31335, "b": 289.98895, "coord_origin": "TOPLEFT"}}, {"id": 357, "text": "Stop", "bbox": {"l": 505.43439, "t": 303.07596, "r": 508.53033000000005, "b": 304.89639, "coord_origin": "TOPLEFT"}}, {"id": 358, "text": "Yield the right-of-way", "bbox": {"l": 527.45502, "t": 303.25354, "r": 541.44678, "b": 305.07397, "coord_origin": "TOPLEFT"}}, {"id": 359, "text": "Shows driving", "bbox": {"l": 501.79385, "t": 321.18973, "r": 510.41632, "b": 323.01016, "coord_origin": "TOPLEFT"}}, {"id": 360, "text": "regulations", "bbox": {"l": 501.79385, "t": 322.87731999999994, "r": 509.04268999999994, "b": 324.69775000000004, "coord_origin": "TOPLEFT"}}, {"id": 361, "text": "Explains lane use", "bbox": {"l": 518.66455, "t": 319.59146, "r": 529.80902, "b": 321.41190000000006, "coord_origin": "TOPLEFT"}}, {"id": 362, "text": "School zone signs ", "bbox": {"l": 534.87561, "t": 318.37616, "r": 546.95142, "b": 320.19659, "coord_origin": "TOPLEFT"}}, {"id": 363, "text": "are fl uorescent ", "bbox": {"l": 534.87561, "t": 320.0637500000001, "r": 545.05762, "b": 321.88419, "coord_origin": "TOPLEFT"}}, {"id": 364, "text": "yellow-green", "bbox": {"l": 534.87561, "t": 321.75134, "r": 543.32263, "b": 323.57178, "coord_origin": "TOPLEFT"}}, {"id": 365, "text": "Tells about motorist ", "bbox": {"l": 499.21862999999996, "t": 338.12772, "r": 512.62451, "b": 339.94815, "coord_origin": "TOPLEFT"}}, {"id": 366, "text": "services", "bbox": {"l": 499.21862999999996, "t": 339.81531000000007, "r": 504.39917, "b": 341.63574, "coord_origin": "TOPLEFT"}}, {"id": 367, "text": "Shows a permitted ", "bbox": {"l": 516.97748, "t": 338.06039, "r": 529.77484, "b": 339.88082999999995, "coord_origin": "TOPLEFT"}}, {"id": 368, "text": "action", "bbox": {"l": 516.97748, "t": 339.74799, "r": 520.96399, "b": 341.56842, "coord_origin": "TOPLEFT"}}, {"id": 369, "text": "Shows an action that ", "bbox": {"l": 534.55847, "t": 337.88281, "r": 548.58453, "b": 339.7032500000001, "coord_origin": "TOPLEFT"}}, {"id": 370, "text": "is not permitted", "bbox": {"l": 534.55847, "t": 339.57040000000006, "r": 545.08862, "b": 341.39084, "coord_origin": "TOPLEFT"}}, {"id": 371, "text": "Warns of hazards ", "bbox": {"l": 483.05853, "t": 356.17416, "r": 494.72577, "b": 357.9946, "coord_origin": "TOPLEFT"}}, {"id": 372, "text": "ahead", "bbox": {"l": 483.05853, "t": 357.86179, "r": 487.07525999999996, "b": 359.68222, "coord_origin": "TOPLEFT"}}, {"id": 373, "text": "Warns of", "bbox": {"l": 499.39645, "t": 356.26297000000005, "r": 504.69171, "b": 358.0834, "coord_origin": "TOPLEFT"}}, {"id": 374, "text": "construction zones", "bbox": {"l": 499.39645, "t": 357.95056, "r": 511.69116, "b": 359.77099999999996, "coord_origin": "TOPLEFT"}}, {"id": 375, "text": "Railway crossing", "bbox": {"l": 516.75891, "t": 356.26297000000005, "r": 527.42938, "b": 358.0834, "coord_origin": "TOPLEFT"}}, {"id": 376, "text": "Shows distance and ", "bbox": {"l": 534.5141, "t": 352.92981, "r": 547.89862, "b": 354.75024, "coord_origin": "TOPLEFT"}}, {"id": 377, "text": "direction", "bbox": {"l": 534.5141, "t": 354.6174, "r": 540.2818, "b": 356.43784, "coord_origin": "TOPLEFT"}}, {"id": 378, "text": "\u2022", "bbox": {"l": 478.37466, "t": 270.14075, "r": 479.14251999999993, "b": 272.17877, "coord_origin": "TOPLEFT"}}, {"id": 379, "text": "Signs", "bbox": {"l": 479.91036999999994, "t": 270.14075, "r": 483.74963, "b": 272.17877, "coord_origin": "TOPLEFT"}}, {"id": 380, "text": "- regulatory signs", "bbox": {"l": 479.97293, "t": 272.84717, "r": 492.31219, "b": 274.34888, "coord_origin": "TOPLEFT"}}, {"id": 381, "text": "- school, ", "bbox": {"l": 479.97293, "t": 275.14513999999997, "r": 486.72598000000005, "b": 276.64679, "coord_origin": "TOPLEFT"}}, {"id": 382, "text": "playground and ", "bbox": {"l": 481.21602999999993, "t": 276.77972, "r": 492.93286000000006, "b": 278.81768999999997, "coord_origin": "TOPLEFT"}}, {"id": 383, "text": "crosswalk signs", "bbox": {"l": 481.21602999999993, "t": 278.82275000000004, "r": 491.82938000000007, "b": 280.86075, "coord_origin": "TOPLEFT"}}, {"id": 384, "text": "- lane use signs", "bbox": {"l": 479.97293, "t": 281.52759, "r": 491.00775000000004, "b": 283.02924, "coord_origin": "TOPLEFT"}}, {"id": 385, "text": "- turn control signs", "bbox": {"l": 479.97293, "t": 283.82556, "r": 493.32748, "b": 285.3272099999999, "coord_origin": "TOPLEFT"}}, {"id": 386, "text": "- parking signs", "bbox": {"l": 479.97293, "t": 286.1235, "r": 490.4915199999999, "b": 287.62518, "coord_origin": "TOPLEFT"}}, {"id": 387, "text": "- reserved lane ", "bbox": {"l": 479.97293, "t": 288.42148, "r": 491.17004000000003, "b": 289.92316, "coord_origin": "TOPLEFT"}}, {"id": 388, "text": "signs", "bbox": {"l": 481.21602999999993, "t": 290.05605999999995, "r": 484.77405000000005, "b": 292.09406, "coord_origin": "TOPLEFT"}}, {"id": 389, "text": "- warning signs", "bbox": {"l": 479.97293, "t": 292.76169000000004, "r": 490.83398, "b": 294.26334, "coord_origin": "TOPLEFT"}}, {"id": 390, "text": "- object markers", "bbox": {"l": 479.97293, "t": 295.05963, "r": 491.62692, "b": 296.56131, "coord_origin": "TOPLEFT"}}, {"id": 391, "text": "- construction ", "bbox": {"l": 479.97293, "t": 297.3576, "r": 490.37341, "b": 298.8592499999999, "coord_origin": "TOPLEFT"}}, {"id": 392, "text": "signs", "bbox": {"l": 481.21602999999993, "t": 298.99219, "r": 484.77405000000005, "b": 301.03015, "coord_origin": "TOPLEFT"}}, {"id": 393, "text": "- information and ", "bbox": {"l": 479.97293, "t": 301.69780999999995, "r": 492.93912, "b": 303.19946, "coord_origin": "TOPLEFT"}}, {"id": 394, "text": "destination signs", "bbox": {"l": 481.21602999999993, "t": 303.3324, "r": 493.00525, "b": 305.37036, "coord_origin": "TOPLEFT"}}, {"id": 395, "text": "- railway signs", "bbox": {"l": 479.97293, "t": 306.0379899999999, "r": 489.99047999999993, "b": 307.53967, "coord_origin": "TOPLEFT"}}, {"id": 396, "text": "\u2022", "bbox": {"l": 478.375, "t": 308.24789, "r": 479.1032400000001, "b": 310.28586, "coord_origin": "TOPLEFT"}}, {"id": 397, "text": "Signals", "bbox": {"l": 479.83151, "t": 308.24789, "r": 484.92925999999994, "b": 310.28586, "coord_origin": "TOPLEFT"}}, {"id": 398, "text": "- lane control ", "bbox": {"l": 479.97293, "t": 310.95358, "r": 490.00091999999995, "b": 312.45526, "coord_origin": "TOPLEFT"}}, {"id": 399, "text": "signals", "bbox": {"l": 481.21602999999993, "t": 312.5881999999999, "r": 485.95331, "b": 314.62616, "coord_origin": "TOPLEFT"}}, {"id": 400, "text": "- traffic lights", "bbox": {"l": 479.97293, "t": 315.29379, "r": 489.29876999999993, "b": 316.79544, "coord_origin": "TOPLEFT"}}, {"id": 401, "text": "\u2022", "bbox": {"l": 478.375, "t": 317.50366, "r": 479.18129999999996, "b": 319.5416599999999, "coord_origin": "TOPLEFT"}}, {"id": 402, "text": "Road markings", "bbox": {"l": 479.98761, "t": 317.50366, "r": 490.46960000000007, "b": 319.5416599999999, "coord_origin": "TOPLEFT"}}, {"id": 403, "text": "- yellow lines", "bbox": {"l": 479.97293, "t": 320.20938, "r": 489.26166000000006, "b": 321.71103, "coord_origin": "TOPLEFT"}}, {"id": 404, "text": "- white lines", "bbox": {"l": 479.97293, "t": 322.50732, "r": 488.59189, "b": 324.009, "coord_origin": "TOPLEFT"}}, {"id": 405, "text": "- reserved lane ", "bbox": {"l": 479.97293, "t": 324.8053, "r": 491.17004000000003, "b": 326.30698, "coord_origin": "TOPLEFT"}}, {"id": 406, "text": "markings", "bbox": {"l": 481.21602999999993, "t": 326.43988, "r": 487.58978, "b": 328.47784, "coord_origin": "TOPLEFT"}}, {"id": 407, "text": "- other markings", "bbox": {"l": 479.97293, "t": 329.14551, "r": 491.75177, "b": 330.64716, "coord_origin": "TOPLEFT"}}, {"id": 408, "text": "in this chapter", "bbox": {"l": 478.15246999999994, "t": 265.07030999999995, "r": 493.75586, "b": 268.06872999999996, "coord_origin": "TOPLEFT"}}], "children": [{"id": 32, "label": "text", "bbox": {"l": 327.86951, "t": 351.78085, "r": 330.41248, "b": 353.95465, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "13", "bbox": {"l": 327.86951, "t": 351.78085, "r": 330.41248, "b": 353.95465, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 327.83005, "t": 331.57268999999997, "r": 351.16092, "b": 333.31171, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "USING THE VERTICAL TUBE -", "bbox": {"l": 327.83005, "t": 331.57268999999997, "r": 351.16092, "b": 333.31171, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 327.83005, "t": 333.18292, "r": 348.30536, "b": 334.92194, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "MODELS AY11230/11234", "bbox": {"l": 327.83005, "t": 333.18292, "r": 348.30536, "b": 334.92194, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 327.83005, "t": 336.40439, "r": 329.05914, "b": 337.92606, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "1.", "bbox": {"l": 327.83005, "t": 336.40439, "r": 329.05914, "b": 337.92606, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 329.67368, "t": 336.40439, "r": 349.95349, "b": 337.92606, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "The vertical tube can be used for", "bbox": {"l": 329.67368, "t": 336.40439, "r": 349.95349, "b": 337.92606, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 329.11752, "t": 337.83588, "r": 353.57977, "b": 339.35751000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "instructional viewing or to photograph", "bbox": {"l": 329.11752, "t": 337.83588, "r": 353.57977, "b": 339.35751000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 327.77121, "t": 339.26736, "r": 352.4306, "b": 340.789, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": " the image with a digital camera or a", "bbox": {"l": 327.77121, "t": 339.26736, "r": 352.4306, "b": 340.789, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 328.15176, "t": 340.69882, "r": 337.91086, "b": 342.22049, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": " micro TV unit", "bbox": {"l": 328.15176, "t": 340.69882, "r": 337.91086, "b": 342.22049, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 327.8313, "t": 342.19043000000005, "r": 329.09155, "b": 343.71207, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "2.", "bbox": {"l": 327.8313, "t": 342.19043000000005, "r": 329.09155, "b": 343.71207, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 329.72168, "t": 342.19043000000005, "r": 354.9267, "b": 343.71207, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "Loosen the retention screw, then rotate ", "bbox": {"l": 329.72168, "t": 342.19043000000005, "r": 354.9267, "b": 343.71207, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 327.8313, "t": 343.62192, "r": 351.66949, "b": 345.14355, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": " the adjustment ring to change the ", "bbox": {"l": 327.8313, "t": 343.62192, "r": 351.66949, "b": 345.14355, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 328.21185, "t": 345.05338, "r": 346.33179, "b": 346.57504, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": " length of the vertical tube.", "bbox": {"l": 328.21185, "t": 345.05338, "r": 346.33179, "b": 346.57504, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 327.83005, "t": 346.84680000000003, "r": 329.12726, "b": 348.36847, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "3.", "bbox": {"l": 327.83005, "t": 346.84680000000003, "r": 329.12726, "b": 348.36847, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 329.77588, "t": 346.84680000000003, "r": 351.18005, "b": 348.36847, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "Make sure that both the images in", "bbox": {"l": 329.77588, "t": 346.84680000000003, "r": 351.18005, "b": 348.36847, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 327.25311, "t": 254.94812000000002, "r": 350.07861, "b": 258.86096, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "OPERATION ", "bbox": {"l": 327.25311, "t": 254.94812000000002, "r": 350.07861, "b": 258.86096, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 350.07861, "t": 254.76782000000003, "r": 351.82651, "b": 258.68066, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "(", "bbox": {"l": 350.07861, "t": 254.76782000000003, "r": 351.82651, "b": 258.68066, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 351.82651, "t": 254.94812000000002, "r": 360.85242, "b": 258.86096, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "cont.", "bbox": {"l": 351.82651, "t": 254.94812000000002, "r": 360.85242, "b": 258.86096, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 360.85242, "t": 254.76782000000003, "r": 362.60028, "b": 258.68066, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": ")", "bbox": {"l": 360.85242, "t": 254.76782000000003, "r": 362.60028, "b": 258.68066, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 326.88037, "t": 263.49492999999995, "r": 345.84351, "b": 265.23395000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "SELECTING OBJECTIVE ", "bbox": {"l": 326.88037, "t": 263.49492999999995, "r": 345.84351, "b": 265.23395000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 326.88037, "t": 265.10515999999996, "r": 340.54153, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "MAGNIFICATION", "bbox": {"l": 326.88037, "t": 265.10515999999996, "r": 340.54153, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 326.88037, "t": 266.71533, "r": 328.31903, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "1.", "bbox": {"l": 326.88037, "t": 266.71533, "r": 328.31903, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 329.03836, "t": 266.71533, "r": 354.21472, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "There are two objectives. The lower", "bbox": {"l": 329.03836, "t": 266.71533, "r": 354.21472, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 326.88037, "t": 268.32556, "r": 355.19193, "b": 270.06458, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": " magnification objective has a greater", "bbox": {"l": 326.88037, "t": 268.32556, "r": 355.19193, "b": 270.06458, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 326.88037, "t": 269.93579, "r": 345.80057, "b": 271.6748, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": " depth of field and view.", "bbox": {"l": 326.88037, "t": 269.93579, "r": 345.80057, "b": 271.6748, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 326.88037, "t": 271.54602, "r": 328.33862, "b": 273.28503, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "2.", "bbox": {"l": 326.88037, "t": 271.54602, "r": 328.33862, "b": 273.28503, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 329.06775, "t": 271.54602, "r": 352.39969, "b": 273.28503, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "In order to observe the specimen", "bbox": {"l": 329.06775, "t": 271.54602, "r": 352.39969, "b": 273.28503, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 326.88037, "t": 273.15619000000004, "r": 352.90042, "b": 274.89526, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": " easily use the lower magnification", "bbox": {"l": 326.88037, "t": 273.15619000000004, "r": 352.90042, "b": 274.89526, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 326.88037, "t": 274.76642000000004, "r": 354.59546, "b": 276.50543000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": " objective first. Then, by rotating the", "bbox": {"l": 326.88037, "t": 274.76642000000004, "r": 354.59546, "b": 276.50543000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 326.88037, "t": 276.37665000000004, "r": 350.81885, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": " case, the magnification can be", "bbox": {"l": 326.88037, "t": 276.37665000000004, "r": 350.81885, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 326.88037, "t": 277.98688000000004, "r": 335.46707, "b": 279.72589000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": " changed.", "bbox": {"l": 326.88037, "t": 277.98688000000004, "r": 335.46707, "b": 279.72589000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 326.88037, "t": 281.20728, "r": 354.57755, "b": 282.94632, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 107, "text": "CHANGING THE INTERPUPILLARY ", "bbox": {"l": 326.88037, "t": 281.20728, "r": 354.57755, "b": 282.94632, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 326.88037, "t": 282.81750000000005, "r": 335.1752, "b": 284.55652, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 108, "text": "DISTANCE", "bbox": {"l": 326.88037, "t": 282.81750000000005, "r": 335.1752, "b": 284.55652, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 326.88037, "t": 284.4277, "r": 328.34784, "b": 286.16675, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 109, "text": "1.", "bbox": {"l": 326.88037, "t": 284.4277, "r": 328.34784, "b": 286.16675, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 329.08157, "t": 284.4277, "r": 354.76245, "b": 286.16675, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 110, "text": "The distance between the observer's", "bbox": {"l": 329.08157, "t": 284.4277, "r": 354.76245, "b": 286.16675, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 326.88037, "t": 286.03793, "r": 354.6499, "b": 287.77695, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 111, "text": " pupils is the interpupillary distance.", "bbox": {"l": 326.88037, "t": 286.03793, "r": 354.6499, "b": 287.77695, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 326.88037, "t": 287.64813, "r": 328.25125, "b": 289.38718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 112, "text": "2.", "bbox": {"l": 326.88037, "t": 287.64813, "r": 328.25125, "b": 289.38718, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 328.93671, "t": 287.64813, "r": 354.29825, "b": 289.38718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 113, "text": "To adjust the interpupillary distance", "bbox": {"l": 328.93671, "t": 287.64813, "r": 354.29825, "b": 289.38718, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 326.88181, "t": 289.25836, "r": 355.02075, "b": 290.99738, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 114, "text": " rotate the prism caps until both eyes", "bbox": {"l": 326.88181, "t": 289.25836, "r": 355.02075, "b": 290.99738, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 326.88181, "t": 290.86855999999995, "r": 350.82028, "b": 292.6076, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 115, "text": " coincide with the image in the", "bbox": {"l": 326.88181, "t": 290.86855999999995, "r": 350.82028, "b": 292.6076, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 326.88181, "t": 292.47879, "r": 336.2067, "b": 294.2178, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 116, "text": " eyepiece. ", "bbox": {"l": 326.88181, "t": 292.47879, "r": 336.2067, "b": 294.2178, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 326.88181, "t": 295.69922, "r": 335.3941, "b": 297.43823, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 117, "text": "FOCUSING", "bbox": {"l": 326.88181, "t": 295.69922, "r": 335.3941, "b": 297.43823, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 326.88181, "t": 297.30942, "r": 328.34314, "b": 299.04846, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 118, "text": "1.", "bbox": {"l": 326.88181, "t": 297.30942, "r": 328.34314, "b": 299.04846, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 329.07379, "t": 297.30942, "r": 353.18555, "b": 299.04846, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 119, "text": "Remove the lens protective cover.", "bbox": {"l": 329.07379, "t": 297.30942, "r": 353.18555, "b": 299.04846, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 326.88324, "t": 298.91965, "r": 328.35919, "b": 300.65866, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 120, "text": "2.", "bbox": {"l": 326.88324, "t": 298.91965, "r": 328.35919, "b": 300.65866, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 329.0972, "t": 298.91965, "r": 353.45065, "b": 300.65866, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 121, "text": "Place the specimen on the working", "bbox": {"l": 329.0972, "t": 298.91965, "r": 353.45065, "b": 300.65866, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 326.88324, "t": 300.52985, "r": 333.32825, "b": 302.26889000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 122, "text": " stage.", "bbox": {"l": 326.88324, "t": 300.52985, "r": 333.32825, "b": 302.26889000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 326.88324, "t": 302.14008000000007, "r": 328.31296, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 123, "text": "3.", "bbox": {"l": 326.88324, "t": 302.14008000000007, "r": 328.31296, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 329.02783, "t": 302.14008000000007, "r": 354.76303, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 124, "text": "Focus the specimen with the left eye", "bbox": {"l": 329.02783, "t": 302.14008000000007, "r": 354.76303, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 326.88324, "t": 303.75027, "r": 355.96307, "b": 305.48932, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 125, "text": " first while turning the focus knob until", "bbox": {"l": 326.88324, "t": 303.75027, "r": 355.96307, "b": 305.48932, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 326.88324, "t": 305.3605, "r": 354.46594, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 126, "text": " the image appears clear and sharp.", "bbox": {"l": 326.88324, "t": 305.3605, "r": 354.46594, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 326.88324, "t": 306.9707, "r": 328.25488, "b": 308.70975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 127, "text": "4.", "bbox": {"l": 326.88324, "t": 306.9707, "r": 328.25488, "b": 308.70975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 328.9407, "t": 306.9707, "r": 356.37335, "b": 308.70975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 128, "text": "Rotate the right eyepiece ring until the", "bbox": {"l": 328.9407, "t": 306.9707, "r": 356.37335, "b": 308.70975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 326.88324, "t": 308.58093, "r": 355.38867, "b": 310.31995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 129, "text": " images in each eyepiece coincide and", "bbox": {"l": 326.88324, "t": 308.58093, "r": 355.38867, "b": 310.31995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 326.88324, "t": 310.19113, "r": 343.17249, "b": 311.93018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 130, "text": " are sharp and clear.", "bbox": {"l": 326.88324, "t": 310.19113, "r": 343.17249, "b": 311.93018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 326.88324, "t": 313.41156, "r": 344.13388, "b": 315.15059999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 131, "text": "CHANGING THE BULB", "bbox": {"l": 326.88324, "t": 313.41156, "r": 344.13388, "b": 315.15059999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 326.88324, "t": 315.02178999999995, "r": 328.37418, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 132, "text": "1.", "bbox": {"l": 326.88324, "t": 315.02178999999995, "r": 328.37418, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 329.11963, "t": 315.02178999999995, "r": 348.50162, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 133, "text": "Disconnect the power cord.", "bbox": {"l": 329.11963, "t": 315.02178999999995, "r": 348.50162, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 326.88324, "t": 316.63199, "r": 328.34061, "b": 318.37103, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 134, "text": "2.", "bbox": {"l": 326.88324, "t": 316.63199, "r": 328.34061, "b": 318.37103, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 329.06931, "t": 316.63199, "r": 353.11588, "b": 318.37103, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 135, "text": "When the bulb is cool, remove the", "bbox": {"l": 329.06931, "t": 316.63199, "r": 353.11588, "b": 318.37103, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 326.88464, "t": 318.2422199999999, "r": 353.79517, "b": 319.9812299999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 136, "text": " oblique illuminator cap and remove", "bbox": {"l": 326.88464, "t": 318.2422199999999, "r": 353.79517, "b": 319.9812299999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 326.88464, "t": 319.85242000000005, "r": 348.02094, "b": 321.59146, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 137, "text": " the halogen bulb with cap.", "bbox": {"l": 326.88464, "t": 319.85242000000005, "r": 348.02094, "b": 321.59146, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 326.88464, "t": 321.46265, "r": 328.37512, "b": 323.20166, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 138, "text": "3.", "bbox": {"l": 326.88464, "t": 321.46265, "r": 328.37512, "b": 323.20166, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 329.12036, "t": 321.46265, "r": 352.96808, "b": 323.20166, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 139, "text": "Replace with a new halogen bulb.", "bbox": {"l": 329.12036, "t": 321.46265, "r": 352.96808, "b": 323.20166, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 326.88608, "t": 323.07285, "r": 328.36884, "b": 324.81189, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 140, "text": "4.", "bbox": {"l": 326.88608, "t": 323.07285, "r": 328.36884, "b": 324.81189, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 329.1102, "t": 323.07285, "r": 356.5412, "b": 324.81189, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 141, "text": "Open the window in the base plate and", "bbox": {"l": 329.1102, "t": 323.07285, "r": 356.5412, "b": 324.81189, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 326.88608, "t": 324.68307000000004, "r": 350.13828, "b": 326.42209, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 142, "text": " replace the halogen lamp or ", "bbox": {"l": 326.88608, "t": 324.68307000000004, "r": 350.13828, "b": 326.42209, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 326.88608, "t": 326.29327, "r": 351.59677, "b": 328.03232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 143, "text": " fluorescent lamp of transmitted", "bbox": {"l": 326.88608, "t": 326.29327, "r": 351.59677, "b": 328.03232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 326.88608, "t": 327.9035, "r": 336.89197, "b": 329.64252, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 144, "text": " illuminator.", "bbox": {"l": 326.88608, "t": 327.9035, "r": 336.89197, "b": 329.64252, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 358.42023, "t": 263.49492999999995, "r": 366.93256, "b": 265.23395000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 145, "text": "FOCUSING", "bbox": {"l": 358.42023, "t": 263.49492999999995, "r": 366.93256, "b": 265.23395000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 358.42023, "t": 265.10515999999996, "r": 359.89841, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 146, "text": "1.", "bbox": {"l": 358.42023, "t": 265.10515999999996, "r": 359.89841, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 360.63751, "t": 265.10515999999996, "r": 387.98407, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 147, "text": "Turn the focusing knob away or toward", "bbox": {"l": 360.63751, "t": 265.10515999999996, "r": 387.98407, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 358.42023, "t": 266.71533, "r": 384.58948, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 148, "text": " you until a clear image is viewed.", "bbox": {"l": 358.42023, "t": 266.71533, "r": 384.58948, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 358.42166, "t": 268.32556, "r": 359.78549, "b": 270.06458, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 149, "text": "2.", "bbox": {"l": 358.42166, "t": 268.32556, "r": 359.78549, "b": 270.06458, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 360.46741, "t": 268.32556, "r": 384.33441, "b": 270.06458, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 150, "text": "If the image is unclear, adjust the", "bbox": {"l": 360.46741, "t": 268.32556, "r": 384.33441, "b": 270.06458, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 358.4231, "t": 269.93579, "r": 384.61502, "b": 271.6748, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 151, "text": " height of the elevator up or down,", "bbox": {"l": 358.4231, "t": 269.93579, "r": 384.61502, "b": 271.6748, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 358.4231, "t": 271.54602, "r": 385.38922, "b": 273.28503, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 152, "text": " then turn the focusing knob again.", "bbox": {"l": 358.4231, "t": 271.54602, "r": 385.38922, "b": 273.28503, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 358.4231, "t": 274.76642000000004, "r": 377.35046, "b": 276.50543000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 153, "text": "ZOOM MAGNIFICATION", "bbox": {"l": 358.4231, "t": 274.76642000000004, "r": 377.35046, "b": 276.50543000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 358.4231, "t": 276.37665000000004, "r": 359.89429, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 154, "text": "1.", "bbox": {"l": 358.4231, "t": 276.37665000000004, "r": 359.89429, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 360.62988, "t": 276.37665000000004, "r": 386.37589, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 155, "text": "Turn the zoom magnification knob to", "bbox": {"l": 360.62988, "t": 276.37665000000004, "r": 386.37589, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 358.4231, "t": 277.98688000000004, "r": 386.78732, "b": 279.72589000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 156, "text": " the desired magnification and field of", "bbox": {"l": 358.4231, "t": 277.98688000000004, "r": 386.78732, "b": 279.72589000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 358.4231, "t": 279.59704999999997, "r": 364.16855, "b": 281.33609, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 157, "text": " view.", "bbox": {"l": 358.4231, "t": 279.59704999999997, "r": 364.16855, "b": 281.33609, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 358.4231, "t": 281.20728, "r": 359.86777, "b": 282.94632, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 158, "text": "2.", "bbox": {"l": 358.4231, "t": 281.20728, "r": 359.86777, "b": 282.94632, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 114, "label": "text", "bbox": {"l": 360.59012, "t": 281.20728, "r": 387.31656, "b": 282.94632, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 159, "text": "In most situations, it is recommended", "bbox": {"l": 360.59012, "t": 281.20728, "r": 387.31656, "b": 282.94632, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 115, "label": "text", "bbox": {"l": 358.4231, "t": 282.81750000000005, "r": 381.56656, "b": 284.55652, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 160, "text": " that you focus at the lowest ", "bbox": {"l": 358.4231, "t": 282.81750000000005, "r": 381.56656, "b": 284.55652, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 116, "label": "text", "bbox": {"l": 358.4231, "t": 284.4277, "r": 386.63403, "b": 286.16675, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 161, "text": " magnification, then move to a higher", "bbox": {"l": 358.4231, "t": 284.4277, "r": 386.63403, "b": 286.16675, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 117, "label": "text", "bbox": {"l": 358.42453, "t": 286.03793, "r": 382.77115, "b": 287.77695, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 162, "text": " magnification and re-focus as ", "bbox": {"l": 358.42453, "t": 286.03793, "r": 382.77115, "b": 287.77695, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 118, "label": "text", "bbox": {"l": 358.42453, "t": 287.64813, "r": 367.98694, "b": 289.38718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 163, "text": " necessary.", "bbox": {"l": 358.42453, "t": 287.64813, "r": 367.98694, "b": 289.38718, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 119, "label": "text", "bbox": {"l": 358.42453, "t": 289.25836, "r": 359.80386, "b": 290.99738, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 164, "text": "3.", "bbox": {"l": 358.42453, "t": 289.25836, "r": 359.80386, "b": 290.99738, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 120, "label": "text", "bbox": {"l": 360.49353, "t": 289.25836, "r": 386.70093, "b": 290.99738, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 165, "text": "If the image is not clear to both eyes", "bbox": {"l": 360.49353, "t": 289.25836, "r": 386.70093, "b": 290.99738, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 121, "label": "text", "bbox": {"l": 358.42453, "t": 290.86855999999995, "r": 388.03534, "b": 292.6076, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 166, "text": " at the same time, the diopter ring may", "bbox": {"l": 358.42453, "t": 290.86855999999995, "r": 388.03534, "b": 292.6076, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 122, "label": "text", "bbox": {"l": 358.42453, "t": 292.47879, "r": 373.13724, "b": 294.2178, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 167, "text": " need adjustment.", "bbox": {"l": 358.42453, "t": 292.47879, "r": 373.13724, "b": 294.2178, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 123, "label": "text", "bbox": {"l": 358.42453, "t": 295.69922, "r": 381.74539, "b": 297.43823, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 168, "text": "DIOPTER RING ADJUSTMENT", "bbox": {"l": 358.42453, "t": 295.69922, "r": 381.74539, "b": 297.43823, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 124, "label": "text", "bbox": {"l": 358.42453, "t": 297.30942, "r": 359.83682, "b": 299.04846, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 169, "text": "1.", "bbox": {"l": 358.42453, "t": 297.30942, "r": 359.83682, "b": 299.04846, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 125, "label": "text", "bbox": {"l": 360.54297, "t": 297.30942, "r": 388.08289, "b": 299.04846, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 170, "text": "To adjust the eyepiece for viewing with", "bbox": {"l": 360.54297, "t": 297.30942, "r": 388.08289, "b": 299.04846, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 126, "label": "text", "bbox": {"l": 358.42453, "t": 298.91965, "r": 382.73251, "b": 300.65866, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 171, "text": " or without eyeglasses and for ", "bbox": {"l": 358.42453, "t": 298.91965, "r": 382.73251, "b": 300.65866, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 127, "label": "text", "bbox": {"l": 358.42453, "t": 300.52985, "r": 387.72266, "b": 302.26889000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 172, "text": " differences in acuity between the right", "bbox": {"l": 358.42453, "t": 300.52985, "r": 387.72266, "b": 302.26889000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 128, "label": "text", "bbox": {"l": 358.42453, "t": 302.14008000000007, "r": 384.1991, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 173, "text": " and left eyes, follow the following", "bbox": {"l": 358.42453, "t": 302.14008000000007, "r": 384.1991, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 129, "label": "text", "bbox": {"l": 358.42453, "t": 303.75027, "r": 364.88672, "b": 305.48932, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 174, "text": " steps:", "bbox": {"l": 358.42453, "t": 303.75027, "r": 364.88672, "b": 305.48932, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 130, "label": "text", "bbox": {"l": 358.42453, "t": 305.3605, "r": 359.95078, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 175, "text": "a.", "bbox": {"l": 358.42453, "t": 305.3605, "r": 359.95078, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 131, "label": "text", "bbox": {"l": 361.47699, "t": 305.3605, "r": 386.65988, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 176, "text": "Observe an image through the left", "bbox": {"l": 361.47699, "t": 305.3605, "r": 386.65988, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 132, "label": "text", "bbox": {"l": 358.42453, "t": 306.9707, "r": 386.7634, "b": 308.70975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 177, "text": " eyepiece and bring a specific point", "bbox": {"l": 358.42453, "t": 306.9707, "r": 386.7634, "b": 308.70975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 133, "label": "text", "bbox": {"l": 358.42453, "t": 308.58093, "r": 385.41354, "b": 310.31995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 178, "text": " into focus using the focus knob.", "bbox": {"l": 358.42453, "t": 308.58093, "r": 385.41354, "b": 310.31995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 134, "label": "text", "bbox": {"l": 358.42453, "t": 310.19113, "r": 359.93304, "b": 311.93018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 179, "text": "b.", "bbox": {"l": 358.42453, "t": 310.19113, "r": 359.93304, "b": 311.93018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 135, "label": "text", "bbox": {"l": 361.44156, "t": 310.19113, "r": 382.56085, "b": 311.93018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 180, "text": "By turning the diopter ring ", "bbox": {"l": 361.44156, "t": 310.19113, "r": 382.56085, "b": 311.93018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 136, "label": "text", "bbox": {"l": 358.42596, "t": 311.80136, "r": 385.4559, "b": 313.54037, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 181, "text": " adjustment for the left eyepiece,", "bbox": {"l": 358.42596, "t": 311.80136, "r": 385.4559, "b": 313.54037, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 137, "label": "text", "bbox": {"l": 358.42596, "t": 313.41156, "r": 384.56122, "b": 315.15059999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 182, "text": " bring the same point into sharp", "bbox": {"l": 358.42596, "t": 313.41156, "r": 384.56122, "b": 315.15059999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 138, "label": "text", "bbox": {"l": 358.42596, "t": 315.02178999999995, "r": 366.74371, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 183, "text": " focus.", "bbox": {"l": 358.42596, "t": 315.02178999999995, "r": 366.74371, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 139, "label": "text", "bbox": {"l": 358.42596, "t": 316.63199, "r": 383.93884, "b": 318.37103, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 184, "text": " c.Then bring the same point into", "bbox": {"l": 358.42596, "t": 316.63199, "r": 383.93884, "b": 318.37103, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 140, "label": "text", "bbox": {"l": 358.42596, "t": 318.2422199999999, "r": 385.69241, "b": 319.9812299999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 185, "text": " focus through the right eyepiece", "bbox": {"l": 358.42596, "t": 318.2422199999999, "r": 385.69241, "b": 319.9812299999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 141, "label": "text", "bbox": {"l": 358.42596, "t": 319.85242000000005, "r": 385.94861, "b": 321.59146, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 186, "text": " by turning the right diopter ring.", "bbox": {"l": 358.42596, "t": 319.85242000000005, "r": 385.94861, "b": 321.59146, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 142, "label": "text", "bbox": {"l": 358.42596, "t": 321.46265, "r": 385.54236, "b": 323.20166, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 187, "text": " d.With more than one viewer, each", "bbox": {"l": 358.42596, "t": 321.46265, "r": 385.54236, "b": 323.20166, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 143, "label": "text", "bbox": {"l": 358.42596, "t": 323.07285, "r": 382.98718, "b": 324.81189, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 188, "text": " viewer should note their own", "bbox": {"l": 358.42596, "t": 323.07285, "r": 382.98718, "b": 324.81189, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 144, "label": "text", "bbox": {"l": 358.42596, "t": 324.68307000000004, "r": 385.06448, "b": 326.42209, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 189, "text": " diopter ring position for the left", "bbox": {"l": 358.42596, "t": 324.68307000000004, "r": 385.06448, "b": 326.42209, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 145, "label": "text", "bbox": {"l": 358.42596, "t": 326.29327, "r": 385.20682, "b": 328.03232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 190, "text": " and right eyepieces, then before", "bbox": {"l": 358.42596, "t": 326.29327, "r": 385.20682, "b": 328.03232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 146, "label": "text", "bbox": {"l": 358.42596, "t": 327.9035, "r": 382.21964, "b": 329.64252, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 191, "text": " viewing set the diopter ring", "bbox": {"l": 358.42596, "t": 327.9035, "r": 382.21964, "b": 329.64252, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 147, "label": "text", "bbox": {"l": 358.42596, "t": 329.5137, "r": 382.63382, "b": 331.25275, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 192, "text": " adjustments to that setting.", "bbox": {"l": 358.42596, "t": 329.5137, "r": 382.63382, "b": 331.25275, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 148, "label": "text", "bbox": {"l": 358.42596, "t": 332.73412999999994, "r": 375.67661, "b": 334.47317999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 193, "text": "CHANGING THE BULB", "bbox": {"l": 358.42596, "t": 332.73412999999994, "r": 375.67661, "b": 334.47317999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 149, "label": "text", "bbox": {"l": 358.42596, "t": 334.34436, "r": 359.90311, "b": 336.08337, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 194, "text": "1.", "bbox": {"l": 358.42596, "t": 334.34436, "r": 359.90311, "b": 336.08337, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 150, "label": "text", "bbox": {"l": 360.64169, "t": 334.34436, "r": 385.75333, "b": 336.08337, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 195, "text": "Disconnect the power cord from the", "bbox": {"l": 360.64169, "t": 334.34436, "r": 385.75333, "b": 336.08337, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 151, "label": "text", "bbox": {"l": 358.42596, "t": 335.95456, "r": 372.01416, "b": 337.6936, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 196, "text": " electrical outlet.", "bbox": {"l": 358.42596, "t": 335.95456, "r": 372.01416, "b": 337.6936, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 152, "label": "text", "bbox": {"l": 358.42596, "t": 337.56479, "r": 359.88327, "b": 339.3038, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 197, "text": "2.", "bbox": {"l": 358.42596, "t": 337.56479, "r": 359.88327, "b": 339.3038, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 153, "label": "text", "bbox": {"l": 360.61191, "t": 337.56479, "r": 384.65726, "b": 339.3038, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 198, "text": "When the bulb is cool, remove the", "bbox": {"l": 360.61191, "t": 337.56479, "r": 384.65726, "b": 339.3038, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 154, "label": "text", "bbox": {"l": 358.42596, "t": 339.17499, "r": 385.33649, "b": 340.9140300000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 199, "text": " oblique illuminator cap and remove", "bbox": {"l": 358.42596, "t": 339.17499, "r": 385.33649, "b": 340.9140300000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 155, "label": "text", "bbox": {"l": 358.42596, "t": 340.78522, "r": 379.57224, "b": 342.52423, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 200, "text": " the halogen bulb with cap.", "bbox": {"l": 358.42596, "t": 340.78522, "r": 379.57224, "b": 342.52423, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 156, "label": "text", "bbox": {"l": 358.4274, "t": 342.39542, "r": 359.91788, "b": 344.13446000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 201, "text": "3.", "bbox": {"l": 358.4274, "t": 342.39542, "r": 359.91788, "b": 344.13446000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 157, "label": "text", "bbox": {"l": 360.66312, "t": 342.39542, "r": 384.5108, "b": 344.13446000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 202, "text": "Replace with a new halogen bulb.", "bbox": {"l": 360.66312, "t": 342.39542, "r": 384.5108, "b": 344.13446000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 158, "label": "text", "bbox": {"l": 358.42883, "t": 344.00565000000006, "r": 359.92792, "b": 345.74466, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 203, "text": "4.", "bbox": {"l": 358.42883, "t": 344.00565000000006, "r": 359.92792, "b": 345.74466, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 159, "label": "text", "bbox": {"l": 360.67746, "t": 344.00565000000006, "r": 385.41235, "b": 345.74466, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 204, "text": "Open the window in the base plate", "bbox": {"l": 360.67746, "t": 344.00565000000006, "r": 385.41235, "b": 345.74466, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 160, "label": "text", "bbox": {"l": 358.42883, "t": 345.61584, "r": 383.2782, "b": 347.35489, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 205, "text": " and replace the halogen lamp or", "bbox": {"l": 358.42883, "t": 345.61584, "r": 383.2782, "b": 347.35489, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 161, "label": "text", "bbox": {"l": 358.42883, "t": 347.22607, "r": 383.13953, "b": 348.96509, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 206, "text": " fluorescent lamp of transmitted", "bbox": {"l": 358.42883, "t": 347.22607, "r": 383.13953, "b": 348.96509, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 162, "label": "text", "bbox": {"l": 358.42883, "t": 348.83627, "r": 368.43472, "b": 350.57532, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 207, "text": " illuminator.", "bbox": {"l": 358.42883, "t": 348.83627, "r": 368.43472, "b": 350.57532, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 163, "label": "text", "bbox": {"l": 326.59567, "t": 261.14185, "r": 339.11377, "b": 262.88091999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 208, "text": "Model AY11230", "bbox": {"l": 326.59567, "t": 261.14185, "r": 339.11377, "b": 262.88091999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 164, "label": "text", "bbox": {"l": 358.48605, "t": 261.14185, "r": 371.00415, "b": 262.88091999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 209, "text": "Model AY11234", "bbox": {"l": 358.48605, "t": 261.14185, "r": 371.00415, "b": 262.88091999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 165, "label": "text", "bbox": {"l": 455.43533, "t": 351.77038999999996, "r": 457.97827000000007, "b": 353.94415, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 210, "text": "14", "bbox": {"l": 455.43533, "t": 351.77038999999996, "r": 457.97827000000007, "b": 353.94415, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 166, "label": "text", "bbox": {"l": 408.24518, "t": 275.52673000000004, "r": 414.4234, "b": 276.96020999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 211, "text": "Objectives", "bbox": {"l": 408.24518, "t": 275.52673000000004, "r": 414.4234, "b": 276.96020999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 167, "label": "text", "bbox": {"l": 409.39554, "t": 268.98235999999997, "r": 419.06677, "b": 270.41583, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 212, "text": "Revolving Turret", "bbox": {"l": 409.39554, "t": 268.98235999999997, "r": 419.06677, "b": 270.41583, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 168, "label": "text", "bbox": {"l": 441.3895, "t": 279.12627999999995, "r": 445.87192, "b": 280.55975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 213, "text": "Coarse ", "bbox": {"l": 441.3895, "t": 279.12627999999995, "r": 445.87192, "b": 280.55975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 169, "label": "text", "bbox": {"l": 441.3895, "t": 280.30609, "r": 448.22338999999994, "b": 281.7395900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 214, "text": "Adjustment", "bbox": {"l": 441.3895, "t": 280.30609, "r": 448.22338999999994, "b": 281.7395900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 170, "label": "text", "bbox": {"l": 441.3895, "t": 281.48593, "r": 444.40371999999996, "b": 282.91939999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 215, "text": "Knob", "bbox": {"l": 441.3895, "t": 281.48593, "r": 444.40371999999996, "b": 282.91939999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 171, "label": "text", "bbox": {"l": 398.79288, "t": 254.94646999999998, "r": 428.91568, "b": 258.85931000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 216, "text": "MODEL AY11236", "bbox": {"l": 398.79288, "t": 254.94646999999998, "r": 428.91568, "b": 258.85931000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 172, "label": "text", "bbox": {"l": 398.32535, "t": 305.04291, "r": 435.93542, "b": 308.95572000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 217, "text": "MICROSCOPE USAGE", "bbox": {"l": 398.32535, "t": 305.04291, "r": 435.93542, "b": 308.95572000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 173, "label": "text", "bbox": {"l": 398.08594, "t": 310.35892, "r": 453.72171, "b": 312.53271, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 218, "text": "BARSKA Model AY11236 is a powerful fixed power compound ", "bbox": {"l": 398.08594, "t": 310.35892, "r": 453.72171, "b": 312.53271, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 174, "label": "text", "bbox": {"l": 398.08594, "t": 312.50586, "r": 453.09939999999995, "b": 314.67966, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 219, "text": "microscope designed for biological studies such as specimen ", "bbox": {"l": 398.08594, "t": 312.50586, "r": 453.09939999999995, "b": 314.67966, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 175, "label": "text", "bbox": {"l": 398.08594, "t": 314.6528, "r": 456.65246999999994, "b": 316.8266, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 220, "text": "examination. It can also be used for examining bacteria and", "bbox": {"l": 398.08594, "t": 314.6528, "r": 456.65246999999994, "b": 316.8266, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 176, "label": "text", "bbox": {"l": 398.08594, "t": 316.79977, "r": 456.73859000000004, "b": 318.97354, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 221, "text": "for general clinical and medical studies and other scientific uses. ", "bbox": {"l": 398.08594, "t": 316.79977, "r": 456.73859000000004, "b": 318.97354, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 177, "label": "text", "bbox": {"l": 398.62399, "t": 320.42941, "r": 427.77472, "b": 324.34222000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 222, "text": "CONSTRUCTION", "bbox": {"l": 398.62399, "t": 320.42941, "r": 427.77472, "b": 324.34222000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 178, "label": "text", "bbox": {"l": 398.08594, "t": 326.46069000000006, "r": 456.02639999999997, "b": 328.63449, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 223, "text": "BARSKA Model AY11236 is a fixed power compound microscope.", "bbox": {"l": 398.08594, "t": 326.46069000000006, "r": 456.02639999999997, "b": 328.63449, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 179, "label": "text", "bbox": {"l": 398.08414, "t": 328.6076699999999, "r": 455.42238999999995, "b": 330.7814599999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 224, "text": "It is constructed with two optical paths at the same angle. It is ", "bbox": {"l": 398.08414, "t": 328.6076699999999, "r": 455.42238999999995, "b": 330.7814599999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 180, "label": "text", "bbox": {"l": 398.08414, "t": 330.75461, "r": 457.39844, "b": 332.92841, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 225, "text": "equipped with transmitted illumination. By using this instrument, ", "bbox": {"l": 398.08414, "t": 330.75461, "r": 457.39844, "b": 332.92841, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 181, "label": "text", "bbox": {"l": 398.08414, "t": 332.90155, "r": 453.97745, "b": 335.07535000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 226, "text": "the user can observe specimens at magnification from 40x to ", "bbox": {"l": 398.08414, "t": 332.90155, "r": 453.97745, "b": 335.07535000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 182, "label": "text", "bbox": {"l": 398.08414, "t": 335.04852, "r": 454.70708999999994, "b": 337.22232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 227, "text": "1000x by selecting the desired objective lens. Coarse and fine ", "bbox": {"l": 398.08414, "t": 335.04852, "r": 454.70708999999994, "b": 337.22232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 183, "label": "text", "bbox": {"l": 398.08414, "t": 337.19547, "r": 458.90240000000006, "b": 339.36926, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 228, "text": "focus adjustments provide accuracy and image detail. The rotating ", "bbox": {"l": 398.08414, "t": 337.19547, "r": 458.90240000000006, "b": 339.36926, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 184, "label": "text", "bbox": {"l": 398.08594, "t": 339.34241, "r": 453.0672, "b": 341.5162, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 229, "text": "head allows the user to position the eyepieces for maximum ", "bbox": {"l": 398.08594, "t": 339.34241, "r": 453.0672, "b": 341.5162, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 185, "label": "text", "bbox": {"l": 398.08594, "t": 341.48938, "r": 449.63113, "b": 343.66318, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 230, "text": "viewing comfort and easy access to all adjustment knobs.", "bbox": {"l": 398.08594, "t": 341.48938, "r": 449.63113, "b": 343.66318, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 186, "label": "text", "bbox": {"l": 422.10626, "t": 301.24191, "r": 434.62433000000004, "b": 302.98096, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 231, "text": "Model AY11236", "bbox": {"l": 422.10626, "t": 301.24191, "r": 434.62433000000004, "b": 302.98096, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 187, "label": "text", "bbox": {"l": 442.01610999999997, "t": 283.08649, "r": 444.8817399999999, "b": 284.51996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 232, "text": "Fine ", "bbox": {"l": 442.01610999999997, "t": 283.08649, "r": 444.8817399999999, "b": 284.51996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 188, "label": "text", "bbox": {"l": 442.01610999999997, "t": 284.2663, "r": 448.85001, "b": 285.69980000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 233, "text": "Adjustment", "bbox": {"l": 442.01610999999997, "t": 284.2663, "r": 448.85001, "b": 285.69980000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 189, "label": "text", "bbox": {"l": 442.01610999999997, "t": 285.44611, "r": 445.03033000000005, "b": 286.87961, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 234, "text": "Knob", "bbox": {"l": 442.01610999999997, "t": 285.44611, "r": 445.03033000000005, "b": 286.87961, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 190, "label": "text", "bbox": {"l": 408.00577, "t": 279.12579000000005, "r": 411.42212, "b": 280.5593, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 235, "text": "Stage", "bbox": {"l": 408.00577, "t": 279.12579000000005, "r": 411.42212, "b": 280.5593, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 191, "label": "text", "bbox": {"l": 404.07172, "t": 280.9144299999999, "r": 410.77707, "b": 282.3479, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 236, "text": "Condenser ", "bbox": {"l": 404.07172, "t": 280.9144299999999, "r": 410.77707, "b": 282.3479, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 192, "label": "text", "bbox": {"l": 404.07172, "t": 282.09424, "r": 409.2157, "b": 283.52774, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 237, "text": "Focusing", "bbox": {"l": 404.07172, "t": 282.09424, "r": 409.2157, "b": 283.52774, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 193, "label": "text", "bbox": {"l": 404.07172, "t": 283.27408, "r": 407.08594, "b": 284.7075500000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 238, "text": "Knob", "bbox": {"l": 404.07172, "t": 283.27408, "r": 407.08594, "b": 284.7075500000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 194, "label": "text", "bbox": {"l": 441.81281, "t": 262.32178, "r": 447.03702, "b": 263.75525000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 239, "text": "Eyepiece", "bbox": {"l": 441.81281, "t": 262.32178, "r": 447.03702, "b": 263.75525000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 195, "label": "text", "bbox": {"l": 437.34607, "t": 271.13025000000005, "r": 440.80496, "b": 272.56281, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 240, "text": "Stand", "bbox": {"l": 437.34607, "t": 271.13025000000005, "r": 440.80496, "b": 272.56281, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 196, "label": "text", "bbox": {"l": 409.7164, "t": 284.40027, "r": 413.3768, "b": 285.83282, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 241, "text": "Lamp ", "bbox": {"l": 409.7164, "t": 284.40027, "r": 413.3768, "b": 285.83282, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 197, "label": "text", "bbox": {"l": 409.7164, "t": 285.83163, "r": 413.68201, "b": 287.26416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 242, "text": "On/Off", "bbox": {"l": 409.7164, "t": 285.83163, "r": 413.68201, "b": 287.26416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 198, "label": "text", "bbox": {"l": 409.7164, "t": 287.263, "r": 413.6337, "b": 288.69553, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 243, "text": "Switch", "bbox": {"l": 409.7164, "t": 287.263, "r": 413.6337, "b": 288.69553, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 199, "label": "text", "bbox": {"l": 434.8712499999999, "t": 296.7153, "r": 438.53164999999996, "b": 298.14783, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 244, "text": "Lamp ", "bbox": {"l": 434.8712499999999, "t": 296.7153, "r": 438.53164999999996, "b": 298.14783, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 200, "label": "text", "bbox": {"l": 439.52039, "t": 292.18307000000004, "r": 443.08768, "b": 293.61560000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 245, "text": "Power", "bbox": {"l": 439.52039, "t": 292.18307000000004, "r": 443.08768, "b": 293.61560000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 201, "label": "text", "bbox": {"l": 439.52039, "t": 293.61444, "r": 442.29575, "b": 295.04697, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 246, "text": "Cord", "bbox": {"l": 439.52039, "t": 293.61444, "r": 442.29575, "b": 295.04697, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 202, "label": "text", "bbox": {"l": 413.55829, "t": 264.66089, "r": 421.94913, "b": 266.09344, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 247, "text": "Rotating Head", "bbox": {"l": 413.55829, "t": 264.66089, "r": 421.94913, "b": 266.09344, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 203, "label": "text", "bbox": {"l": 441.84316999999993, "t": 286.90573, "r": 447.87585000000007, "b": 288.33826, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 248, "text": "Stage Clip", "bbox": {"l": 441.84316999999993, "t": 286.90573, "r": 447.87585000000007, "b": 288.33826, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 204, "label": "text", "bbox": {"l": 441.84316999999993, "t": 288.3371, "r": 448.67252, "b": 289.76962000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 249, "text": "Adjustment", "bbox": {"l": 441.84316999999993, "t": 288.3371, "r": 448.67252, "b": 289.76962000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 205, "label": "text", "bbox": {"l": 407.2403, "t": 259.86645999999996, "r": 425.79089, "b": 261.29895, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 250, "text": "Interpupillary Slide Adjustment", "bbox": {"l": 407.2403, "t": 259.86645999999996, "r": 425.79089, "b": 261.29895, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 206, "label": "text", "bbox": {"l": 449.10074000000003, "t": 378.66302, "r": 466.08835000000005, "b": 380.78412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 251, "text": "Circling Minimums", "bbox": {"l": 449.10074000000003, "t": 378.66302, "r": 466.08835000000005, "b": 380.78412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 207, "label": "text", "bbox": {"l": 449.10074000000003, "t": 383.2203999999999, "r": 449.64444, "b": 385.34148999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 252, "text": "7", "bbox": {"l": 449.10074000000003, "t": 383.2203999999999, "r": 449.64444, "b": 385.34148999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 208, "label": "text", "bbox": {"l": 450.18811, "t": 383.2203999999999, "r": 550.77124, "b": 385.34148999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 253, "text": "K H U H Z D V D F K D Q J H W R W K H 7 ( 5 3 6 F U L W H U L D L Q W K D W D \u1087H F W V F L U F O L Q J D U H D G L P H Q V L R Q E \\ H [ S D Q G L Q J W K H D U H D V W R S U R Y L G H ", "bbox": {"l": 450.18811, "t": 383.2203999999999, "r": 550.77124, "b": 385.34148999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 209, "label": "text", "bbox": {"l": 449.10074000000003, "t": 385.75732, "r": 536.14716, "b": 387.87842, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 254, "text": "improved obstacle protection. To indicate that the new criteria had been applied to a given procedure, a ", "bbox": {"l": 449.10074000000003, "t": 385.75732, "r": 536.14716, "b": 387.87842, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 210, "label": "text", "bbox": {"l": 538.31085, "t": 385.75732, "r": 549.49921, "b": 387.87842, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 255, "text": " is placed on ", "bbox": {"l": 538.31085, "t": 385.75732, "r": 549.49921, "b": 387.87842, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 211, "label": "text", "bbox": {"l": 449.10074000000003, "t": 388.03601, "r": 547.58185, "b": 390.1571, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 256, "text": "the circling line of minimums. The new circling tables and explanatory information is located in the Legend of the TPP.", "bbox": {"l": 449.10074000000003, "t": 388.03601, "r": 547.58185, "b": 390.1571, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 212, "label": "text", "bbox": {"l": 449.10074000000003, "t": 393.2128000000001, "r": 449.6163, "b": 395.33386, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 257, "text": "7", "bbox": {"l": 449.10074000000003, "t": 393.2128000000001, "r": 449.6163, "b": 395.33386, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 213, "label": "text", "bbox": {"l": 450.1319, "t": 393.2128000000001, "r": 529.53082, "b": 395.33386, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 258, "text": "K H D S S U R D F K H V X V L Q J V W D Q G D U G F L U F O L Q J D S S U R D F K D U H D V F D Q E H L G H Q W L \u00bf H G E \\ W K H D E V H Q F H R I W K H ", "bbox": {"l": 450.1319, "t": 393.2128000000001, "r": 529.53082, "b": 395.33386, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 214, "label": "text", "bbox": {"l": 532.05829, "t": 393.2128000000001, "r": 550.42261, "b": 395.33386, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 259, "text": " on the circling line of ", "bbox": {"l": 532.05829, "t": 393.2128000000001, "r": 550.42261, "b": 395.33386, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 215, "label": "text", "bbox": {"l": 449.10074000000003, "t": 395.49149, "r": 455.74692, "b": 397.61255, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 260, "text": "minima.", "bbox": {"l": 449.10074000000003, "t": 395.49149, "r": 455.74692, "b": 397.61255, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 216, "label": "text", "bbox": {"l": 449.95525999999995, "t": 415.59549, "r": 496.2829, "b": 417.50446, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 261, "text": "$ S S O \\ 6 W D Q G D U G & L U F O L Q J $ S S U R D F K 0 D Q H X Y H U L Q J 5 D G L X V 7 D E O H ", "bbox": {"l": 449.95525999999995, "t": 415.59549, "r": 496.2829, "b": 417.50446, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 217, "label": "text", "bbox": {"l": 501.13077, "t": 409.25543, "r": 551.16101, "b": 411.1644, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 262, "text": "$ S S O \\ ( [ S D Q G H G & L U F O L Q J $ S S U R D F K 0 D Q H X Y H U L Q J $ L U V S D F H 5 D G L X V ", "bbox": {"l": 501.13077, "t": 409.25543, "r": 551.16101, "b": 411.1644, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 218, "label": "text", "bbox": {"l": 501.13077, "t": 411.30624, "r": 505.2477999999999, "b": 413.21521, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 263, "text": "Table", "bbox": {"l": 501.13077, "t": 411.30624, "r": 505.2477999999999, "b": 413.21521, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 219, "label": "text", "bbox": {"l": 449.10074000000003, "t": 420.18802, "r": 469.35599, "b": 422.73331, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 264, "text": "AIRPORT SKETCH", "bbox": {"l": 449.10074000000003, "t": 420.18802, "r": 469.35599, "b": 422.73331, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 220, "label": "text", "bbox": {"l": 449.10074000000003, "t": 425.08908, "r": 525.93616, "b": 427.21017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 265, "text": "The airport sketch is a depiction of the airport with emphasis on runway pattern and related ", "bbox": {"l": 449.10074000000003, "t": 425.08908, "r": 525.93616, "b": 427.21017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 221, "label": "text", "bbox": {"l": 449.10074000000003, "t": 427.3678, "r": 522.0343, "b": 429.48886, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 266, "text": "information, positioned in either the lower left or lower right corner of the chart to aid pi-", "bbox": {"l": 449.10074000000003, "t": 427.3678, "r": 522.0343, "b": 429.48886, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 222, "label": "text", "bbox": {"l": 449.10074000000003, "t": 429.64648, "r": 524.67151, "b": 431.76755, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 267, "text": "lot recognition of the airport from the air and to provide some information to aid on ground ", "bbox": {"l": 449.10074000000003, "t": 429.64648, "r": 524.67151, "b": 431.76755, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 223, "label": "text", "bbox": {"l": 449.10074000000003, "t": 431.92514000000006, "r": 527.172, "b": 434.04623, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 268, "text": "navigation of the airport. The runways are drawn to scale and oriented to true north. Runway ", "bbox": {"l": 449.10074000000003, "t": 431.92514000000006, "r": 527.172, "b": 434.04623, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 224, "label": "text", "bbox": {"l": 449.10074000000003, "t": 434.20383, "r": 502.39545, "b": 436.32492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 269, "text": "dimensions (length and width) are shown for all active runways.", "bbox": {"l": 449.10074000000003, "t": 434.20383, "r": 502.39545, "b": 436.32492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 225, "label": "text", "bbox": {"l": 449.10074000000003, "t": 438.7611999999999, "r": 512.92676, "b": 440.88228999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 270, "text": "Runway(s) are depicted based on what type and construction of the runway.", "bbox": {"l": 449.10074000000003, "t": 438.7611999999999, "r": 512.92676, "b": 440.88228999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 226, "label": "text", "bbox": {"l": 449.95525999999995, "t": 444.07001, "r": 460.02307, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 271, "text": "Hard Surface", "bbox": {"l": 449.95525999999995, "t": 444.07001, "r": 460.02307, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 227, "label": "text", "bbox": {"l": 464.89963, "t": 444.07001, "r": 473.98819, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 272, "text": "Other Than ", "bbox": {"l": 464.89963, "t": 444.07001, "r": 473.98819, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 228, "label": "text", "bbox": {"l": 464.89963, "t": 446.12085, "r": 474.96744, "b": 448.02979, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 273, "text": "Hard Surface", "bbox": {"l": 464.89963, "t": 446.12085, "r": 474.96744, "b": 448.02979, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 229, "label": "text", "bbox": {"l": 478.91357, "t": 444.07001, "r": 489.45648, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 274, "text": "Metal Surface", "bbox": {"l": 478.91357, "t": 444.07001, "r": 489.45648, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 230, "label": "text", "bbox": {"l": 493.06420999999995, "t": 444.07001, "r": 505.03076, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 275, "text": "Closed Runway", "bbox": {"l": 493.06420999999995, "t": 444.07001, "r": 505.03076, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 231, "label": "text", "bbox": {"l": 509.5809, "t": 444.07001, "r": 524.30237, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 276, "text": "Under Construction", "bbox": {"l": 509.5809, "t": 444.07001, "r": 524.30237, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 232, "label": "text", "bbox": {"l": 449.95525999999995, "t": 454.81207, "r": 458.31406, "b": 456.72104, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 277, "text": "Stopways, ", "bbox": {"l": 449.95525999999995, "t": 454.81207, "r": 458.31406, "b": 456.72104, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 233, "label": "text", "bbox": {"l": 449.95525999999995, "t": 456.86288, "r": 461.92083999999994, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 278, "text": "Taxiways, Park-", "bbox": {"l": 449.95525999999995, "t": 456.86288, "r": 461.92083999999994, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 234, "label": "text", "bbox": {"l": 449.95525999999995, "t": 458.91373, "r": 457.08014, "b": 460.82268999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 279, "text": "ing Areas", "bbox": {"l": 449.95525999999995, "t": 458.91373, "r": 457.08014, "b": 460.82268999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 235, "label": "text", "bbox": {"l": 464.89963, "t": 454.81207, "r": 472.87732, "b": 456.72104, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 280, "text": "Displaced ", "bbox": {"l": 464.89963, "t": 454.81207, "r": 472.87732, "b": 456.72104, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 236, "label": "text", "bbox": {"l": 464.89963, "t": 456.86288, "r": 472.49792, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 281, "text": "Threshold", "bbox": {"l": 464.89963, "t": 456.86288, "r": 472.49792, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 237, "label": "text", "bbox": {"l": 478.91357, "t": 454.81207, "r": 483.61584, "b": 456.72104, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 282, "text": "Closed", "bbox": {"l": 478.91357, "t": 454.81207, "r": 483.61584, "b": 456.72104, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 238, "label": "text", "bbox": {"l": 478.91357, "t": 456.86288, "r": 486.60754000000003, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 283, "text": "Pavement", "bbox": {"l": 478.91357, "t": 456.86288, "r": 486.60754000000003, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 239, "label": "text", "bbox": {"l": 493.06420999999995, "t": 454.81207, "r": 504.20648, "b": 456.72104, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 284, "text": "Water Runway", "bbox": {"l": 493.06420999999995, "t": 454.81207, "r": 504.20648, "b": 456.72104, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 240, "label": "text", "bbox": {"l": 449.10074000000003, "t": 469.32974, "r": 548.59674, "b": 471.45081, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 285, "text": "Taxiways and aprons are shaded grey. Other runway features that may be shown are runway numbers, runway dimen-", "bbox": {"l": 449.10074000000003, "t": 469.32974, "r": 548.59674, "b": 471.45081, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 241, "label": "text", "bbox": {"l": 449.10074000000003, "t": 471.60843, "r": 500.08181999999994, "b": 473.72949, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 286, "text": "sions, runway slope, arresting gear, and displaced threshold.", "bbox": {"l": 449.10074000000003, "t": 471.60843, "r": 500.08181999999994, "b": 473.72949, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 242, "label": "text", "bbox": {"l": 449.10074000000003, "t": 476.16577, "r": 449.59933000000007, "b": 478.28687, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 287, "text": "2", "bbox": {"l": 449.10074000000003, "t": 476.16577, "r": 449.59933000000007, "b": 478.28687, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 243, "label": "text", "bbox": {"l": 450.09796, "t": 476.16577, "r": 547.82562, "b": 478.28687, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 288, "text": "W K H U L Q I R U P D W L R Q F R Q F H U Q L Q J O L J K W L Q J \u00bf Q D O D S S U R D F K E H D U L Q J V D L U S R U W E H D F R Q R E V W D F O H V F R Q W U R O W R Z H U 1 $ 9 $ , ' V K H O L ", "bbox": {"l": 450.09796, "t": 476.16577, "r": 547.82562, "b": 478.28687, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 244, "label": "text", "bbox": {"l": 547.82623, "t": 476.16577, "r": 548.45862, "b": 478.28687, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 289, "text": "-", "bbox": {"l": 547.82623, "t": 476.16577, "r": 548.45862, "b": 478.28687, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 245, "label": "text", "bbox": {"l": 449.10074000000003, "t": 478.44446, "r": 470.52609000000007, "b": 480.56555, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 290, "text": "pads may also be shown.", "bbox": {"l": 449.10074000000003, "t": 478.44446, "r": 470.52609000000007, "b": 480.56555, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 246, "label": "text", "bbox": {"l": 449.10074000000003, "t": 483.00183, "r": 493.37906000000004, "b": 485.12292, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 291, "text": "$ L U S R U W ( O H Y D W L R Q D Q G 7 R X F K G R Z Q = R Q H ( O H Y D W L R Q ", "bbox": {"l": 449.10074000000003, "t": 483.00183, "r": 493.37906000000004, "b": 485.12292, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 449.10074000000003, "t": 487.5592, "r": 551.80023, "b": 496.51636, "coord_origin": "TOPLEFT"}, "confidence": 0.5027860403060913, "cells": [{"id": 292, "text": "The airport elevation is shown enclosed within a box in the upper left corner of the sketch box and the touchdown zone ", "bbox": {"l": 449.10074000000003, "t": 487.5592, "r": 549.16168, "b": 489.6803, "coord_origin": "TOPLEFT"}}, {"id": 293, "text": "elevation (TDZE) is shown in the upper right corner of the sketch box. The airport elevation is the highest point of an ", "bbox": {"l": 449.10074000000003, "t": 489.83789, "r": 546.90881, "b": 491.95898, "coord_origin": "TOPLEFT"}}, {"id": 294, "text": "D L U S R U W \u00b6 V X V D E O H U X Q Z D \\ V P H D V X U H G L Q I H H W I U R P P H D Q V H D O H Y H O 7 K H 7 ' = ( L V W K H K L J K H V W H O H Y D W L R Q L Q W K H \u00bf U V W I H H W R I ", "bbox": {"l": 449.10074000000003, "t": 492.11658, "r": 551.80023, "b": 494.23767, "coord_origin": "TOPLEFT"}}, {"id": 295, "text": "the landing surface. Circling only approaches will not show a TDZE.", "bbox": {"l": 449.10074000000003, "t": 494.39526, "r": 505.85068000000007, "b": 496.51636, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 247, "label": "text", "bbox": {"l": 498.80661000000003, "t": 515.9437, "r": 502.08792, "b": 519.01764, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 296, "text": "114", "bbox": {"l": 498.80661000000003, "t": 515.9437, "r": 502.08792, "b": 519.01764, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 248, "label": "text", "bbox": {"l": 444.56319999999994, "t": 422.84869, "r": 446.25998, "b": 471.87128, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 297, "text": "FAA Chart Users\u2019 Guide - Terminal Procedures Publication (TPP) - Terms", "bbox": {"l": 444.56319999999994, "t": 422.84869, "r": 446.25998, "b": 471.87128, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 249, "label": "text", "bbox": {"l": 329.40536, "t": 379.37537, "r": 355.13138, "b": 382.13336, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 298, "text": "AGL 2013 Financial Calendar", "bbox": {"l": 329.40536, "t": 379.37537, "r": 355.13138, "b": 382.13336, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 250, "label": "text", "bbox": {"l": 329.40536, "t": 382.30273, "r": 330.96848, "b": 384.55927, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 299, "text": "22", "bbox": {"l": 329.40536, "t": 382.30273, "r": 330.96848, "b": 384.55927, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 251, "label": "text", "bbox": {"l": 331.75003, "t": 382.30273, "r": 341.12875, "b": 384.55927, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 300, "text": "August 2012 ", "bbox": {"l": 331.75003, "t": 382.30273, "r": 341.12875, "b": 384.55927, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 252, "label": "text", "bbox": {"l": 350.4722, "t": 382.30273, "r": 384.81079, "b": 384.55927, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 301, "text": "2012 full year result and fi nal dividend announced", "bbox": {"l": 350.4722, "t": 382.30273, "r": 384.81079, "b": 384.55927, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 253, "label": "text", "bbox": {"l": 329.40536, "t": 384.84552, "r": 330.97336, "b": 387.10205, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 302, "text": "30", "bbox": {"l": 329.40536, "t": 384.84552, "r": 330.97336, "b": 387.10205, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 254, "label": "text", "bbox": {"l": 331.75735, "t": 384.84552, "r": 341.16534, "b": 387.10205, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 303, "text": "August 2012 ", "bbox": {"l": 331.75735, "t": 384.84552, "r": 341.16534, "b": 387.10205, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 255, "label": "text", "bbox": {"l": 350.4722, "t": 384.84552, "r": 372.90613, "b": 387.10205, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 304, "text": "Ex-dividend trading commences", "bbox": {"l": 350.4722, "t": 384.84552, "r": 372.90613, "b": 387.10205, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 256, "label": "text", "bbox": {"l": 329.40536, "t": 387.38828, "r": 330.20337, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 305, "text": "5", "bbox": {"l": 329.40536, "t": 387.38828, "r": 330.20337, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 257, "label": "text", "bbox": {"l": 331.00137, "t": 387.38828, "r": 342.9715, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 306, "text": "September 2012 ", "bbox": {"l": 331.00137, "t": 387.38828, "r": 342.9715, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 258, "label": "text", "bbox": {"l": 350.4722, "t": 387.38828, "r": 374.88693, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 307, "text": "Record date for 2012 fi nal dividend", "bbox": {"l": 350.4722, "t": 387.38828, "r": 374.88693, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 259, "label": "text", "bbox": {"l": 329.40536, "t": 389.93103, "r": 331.0173, "b": 392.18762, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 308, "text": "27", "bbox": {"l": 329.40536, "t": 389.93103, "r": 331.0173, "b": 392.18762, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 260, "label": "text", "bbox": {"l": 331.82327, "t": 389.93103, "r": 343.91284, "b": 392.18762, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 309, "text": "September 2012 ", "bbox": {"l": 331.82327, "t": 389.93103, "r": 343.91284, "b": 392.18762, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 261, "label": "text", "bbox": {"l": 350.4722, "t": 389.93103, "r": 365.65988, "b": 392.18762, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 310, "text": "Final dividend payable", "bbox": {"l": 350.4722, "t": 389.93103, "r": 365.65988, "b": 392.18762, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 262, "label": "text", "bbox": {"l": 329.40536, "t": 392.47382, "r": 330.98804, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 311, "text": "23", "bbox": {"l": 329.40536, "t": 392.47382, "r": 330.98804, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 263, "label": "text", "bbox": {"l": 331.77936, "t": 392.47382, "r": 342.06674, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 312, "text": "October 2012 ", "bbox": {"l": 331.77936, "t": 392.47382, "r": 342.06674, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 264, "label": "text", "bbox": {"l": 350.4722, "t": 392.47382, "r": 367.22156, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 313, "text": "Annual General Meeting", "bbox": {"l": 350.4722, "t": 392.47382, "r": 367.22156, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 265, "label": "text", "bbox": {"l": 329.40536, "t": 395.0166, "r": 330.99741, "b": 397.27313, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 314, "text": "27", "bbox": {"l": 329.40536, "t": 395.0166, "r": 330.99741, "b": 397.27313, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 266, "label": "text", "bbox": {"l": 331.7934, "t": 395.0166, "r": 342.1416, "b": 397.27313, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 315, "text": "February 2013", "bbox": {"l": 331.7934, "t": 395.0166, "r": 342.1416, "b": 397.27313, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 267, "label": "text", "bbox": {"l": 342.64841, "t": 395.18298, "r": 342.65811, "b": 396.49857000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 316, "text": " 1", "bbox": {"l": 342.64841, "t": 395.18298, "r": 342.65811, "b": 396.49857000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 268, "label": "text", "bbox": {"l": 350.47177, "t": 395.01474, "r": 386.25897, "b": 397.2713, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 317, "text": "2013 interim result and interim dividend announced", "bbox": {"l": 350.47177, "t": 395.01474, "r": 386.25897, "b": 397.2713, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 269, "label": "text", "bbox": {"l": 329.40491, "t": 397.55749999999995, "r": 331.02695, "b": 399.81406, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 318, "text": "28", "bbox": {"l": 329.40491, "t": 397.55749999999995, "r": 331.02695, "b": 399.81406, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 270, "label": "text", "bbox": {"l": 331.83795, "t": 397.55749999999995, "r": 340.75909, "b": 399.81406, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 319, "text": "August 2013", "bbox": {"l": 331.83795, "t": 397.55749999999995, "r": 340.75909, "b": 399.81406, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 271, "label": "text", "bbox": {"l": 341.26437, "t": 397.7254, "r": 341.27408, "b": 399.04095, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 320, "text": " 1", "bbox": {"l": 341.26437, "t": 397.7254, "r": 341.27408, "b": 399.04095, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 272, "label": "text", "bbox": {"l": 350.47144, "t": 397.55713, "r": 385.93265, "b": 399.81369, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 321, "text": "2013 full year results and fi nal dividend announced ", "bbox": {"l": 350.47144, "t": 397.55713, "r": 385.93265, "b": 399.81369, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 273, "label": "text", "bbox": {"l": 329.40536, "t": 400.46155, "r": 329.87708, "b": 401.96588, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 322, "text": "1", "bbox": {"l": 329.40536, "t": 400.46155, "r": 329.87708, "b": 401.96588, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 274, "label": "text", "bbox": {"l": 330.34882, "t": 400.46155, "r": 358.65204, "b": 401.96588, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 323, "text": "Indicative dates only, subject to change/Board confi rmation", "bbox": {"l": 330.34882, "t": 400.46155, "r": 358.65204, "b": 401.96588, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 275, "label": "text", "bbox": {"l": 329.40536, "t": 404.34503, "r": 391.771, "b": 406.60156, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 324, "text": "AGL\u2019s Annual General Meeting will be held at the City Recital Hall, Angel Place, Sydney ", "bbox": {"l": 329.40536, "t": 404.34503, "r": 391.771, "b": 406.60156, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 276, "label": "text", "bbox": {"l": 329.40536, "t": 406.37857, "r": 369.65308, "b": 408.63513000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 325, "text": "commencing at 10.30am on Tuesday 23 October 2012.", "bbox": {"l": 329.40536, "t": 406.37857, "r": 369.65308, "b": 408.63513000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 277, "label": "text", "bbox": {"l": 363.54486, "t": 460.53054999999995, "r": 379.25955, "b": 465.54507, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 326, "text": "Ye s te rd ay", "bbox": {"l": 363.54486, "t": 460.53054999999995, "r": 379.25955, "b": 465.54507, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 278, "label": "text", "bbox": {"l": 363.54486, "t": 466.7157, "r": 391.38229, "b": 468.97223, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 327, "text": "Established in Sydney in 1837, and then ", "bbox": {"l": 363.54486, "t": 466.7157, "r": 391.38229, "b": 468.97223, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 279, "label": "text", "bbox": {"l": 363.54486, "t": 468.74924, "r": 395.01788, "b": 471.00577, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 328, "text": "known as The Australian Gas Light Company, ", "bbox": {"l": 363.54486, "t": 468.74924, "r": 395.01788, "b": 471.00577, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 280, "label": "text", "bbox": {"l": 363.54486, "t": 470.78281, "r": 394.08322, "b": 473.03934, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 329, "text": "the AGL business has an established history ", "bbox": {"l": 363.54486, "t": 470.78281, "r": 394.08322, "b": 473.03934, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 281, "label": "text", "bbox": {"l": 363.54486, "t": 472.81635, "r": 390.60727, "b": 475.07288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 330, "text": "and reputation for serving the gas and ", "bbox": {"l": 363.54486, "t": 472.81635, "r": 390.60727, "b": 475.07288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 282, "label": "text", "bbox": {"l": 363.54486, "t": 474.84988, "r": 393.49612, "b": 477.10645, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 331, "text": "electricity needs of Australian households. ", "bbox": {"l": 363.54486, "t": 474.84988, "r": 393.49612, "b": 477.10645, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 283, "label": "text", "bbox": {"l": 363.54486, "t": 476.88345, "r": 394.11481, "b": 479.13998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 332, "text": "In 1841, when AGL supplied the gas to light ", "bbox": {"l": 363.54486, "t": 476.88345, "r": 394.11481, "b": 479.13998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 284, "label": "text", "bbox": {"l": 363.54486, "t": 478.91699, "r": 393.75891, "b": 481.17352, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 333, "text": "the fi rst public street lamp, it was reported ", "bbox": {"l": 363.54486, "t": 478.91699, "r": 393.75891, "b": 481.17352, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 285, "label": "text", "bbox": {"l": 363.54486, "t": 480.95053, "r": 390.4975, "b": 483.20709, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 334, "text": "in the Sydney Gazette as a \u201cwonderful ", "bbox": {"l": 363.54486, "t": 480.95053, "r": 390.4975, "b": 483.20709, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 286, "label": "text", "bbox": {"l": 363.54486, "t": 482.9841, "r": 395.70975, "b": 485.24063, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 335, "text": "achievement of scientifi c knowledge, assisted ", "bbox": {"l": 363.54486, "t": 482.9841, "r": 395.70975, "b": 485.24063, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 287, "label": "text", "bbox": {"l": 363.54486, "t": 485.01764, "r": 394.27283, "b": 487.2742, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 336, "text": "by mechanical ingenuity.\u201d Within two years, ", "bbox": {"l": 363.54486, "t": 485.01764, "r": 394.27283, "b": 487.2742, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 288, "label": "text", "bbox": {"l": 363.54486, "t": 487.05121, "r": 396.65939, "b": 489.30774, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 337, "text": "165 gas lamps were lighting the City of Sydney.", "bbox": {"l": 363.54486, "t": 487.05121, "r": 396.65939, "b": 489.30774, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 289, "label": "text", "bbox": {"l": 329.4054, "t": 419.93124, "r": 384.19696, "b": 431.09412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 338, "text": "Looking back on ", "bbox": {"l": 329.4054, "t": 419.93124, "r": 384.19696, "b": 431.09412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 290, "label": "text", "bbox": {"l": 329.4054, "t": 430.10379, "r": 372.16626, "b": 441.26669, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 339, "text": "175 years of ", "bbox": {"l": 329.4054, "t": 430.10379, "r": 372.16626, "b": 441.26669, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 291, "label": "text", "bbox": {"l": 329.4054, "t": 440.27636999999993, "r": 385.3981, "b": 451.43924, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 340, "text": "looking forward.", "bbox": {"l": 329.4054, "t": 440.27636999999993, "r": 385.3981, "b": 451.43924, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 292, "label": "text", "bbox": {"l": 329.40536, "t": 372.16159, "r": 353.36179, "b": 373.91669, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 341, "text": "AGL Energy Limited ABN 74 115 061 375", "bbox": {"l": 329.40536, "t": 372.16159, "r": 353.36179, "b": 373.91669, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 293, "label": "text", "bbox": {"l": 546.20587, "t": 360.90448, "r": 548.23407, "b": 362.82242, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 342, "text": "29", "bbox": {"l": 546.20587, "t": 360.90448, "r": 548.23407, "b": 362.82242, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 294, "label": "text", "bbox": {"l": 497.77728, "t": 251.43384000000003, "r": 542.8255, "b": 254.94385, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 343, "text": "signs, signals and road markings", "bbox": {"l": 497.77728, "t": 251.43384000000003, "r": 542.8255, "b": 254.94385, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 295, "label": "text", "bbox": {"l": 490.30679, "t": 251.47478999999998, "r": 492.09982, "b": 254.98479999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 344, "text": "3", "bbox": {"l": 490.30679, "t": 251.47478999999998, "r": 492.09982, "b": 254.98479999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 296, "label": "text", "bbox": {"l": 498.15335, "t": 263.88922, "r": 500.05637, "b": 265.92719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 345, "text": "In ", "bbox": {"l": 498.15335, "t": 263.88922, "r": 500.05637, "b": 265.92719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 297, "label": "text", "bbox": {"l": 500.05637, "t": 263.85717999999997, "r": 524.37036, "b": 265.86310000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 346, "text": "chapter 2, you and your vehicle", "bbox": {"l": 500.05637, "t": 263.85717999999997, "r": 524.37036, "b": 265.86310000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 298, "label": "text", "bbox": {"l": 524.37036, "t": 263.88922, "r": 539.89124, "b": 265.92719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 347, "text": ", you learned about ", "bbox": {"l": 524.37036, "t": 263.88922, "r": 539.89124, "b": 265.92719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 299, "label": "text", "bbox": {"l": 498.15335, "t": 265.93224999999995, "r": 544.50403, "b": 267.97020999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 348, "text": "some of the controls in your vehicle. This chapter is a handy ", "bbox": {"l": 498.15335, "t": 265.93224999999995, "r": 544.50403, "b": 267.97020999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 300, "label": "text", "bbox": {"l": 498.15335, "t": 267.97533999999996, "r": 544.01343, "b": 270.01331000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 349, "text": "reference section that gives examples of the most common ", "bbox": {"l": 498.15335, "t": 267.97533999999996, "r": 544.01343, "b": 270.01331000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 301, "label": "text", "bbox": {"l": 498.15335, "t": 270.01831000000004, "r": 544.11987, "b": 272.05634, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 350, "text": "signs, signals and road markings that keep traffi c organized ", "bbox": {"l": 498.15335, "t": 270.01831000000004, "r": 544.11987, "b": 272.05634, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 302, "label": "text", "bbox": {"l": 498.15335, "t": 272.06140000000005, "r": 515.41071, "b": 274.09937, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 351, "text": "and flowing smoothly. ", "bbox": {"l": 498.15335, "t": 272.06140000000005, "r": 515.41071, "b": 274.09937, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 303, "label": "text", "bbox": {"l": 498.15335, "t": 277.34619, "r": 505.64642000000003, "b": 280.9357, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 352, "text": "Signs", "bbox": {"l": 498.15335, "t": 277.34619, "r": 505.64642000000003, "b": 280.9357, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 304, "label": "text", "bbox": {"l": 498.15335, "t": 281.82187, "r": 543.92957, "b": 283.85983, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 353, "text": "There are three ways to read signs: by their shape, colour and ", "bbox": {"l": 498.15335, "t": 281.82187, "r": 543.92957, "b": 283.85983, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 305, "label": "text", "bbox": {"l": 498.15335, "t": 283.8649, "r": 545.67834, "b": 285.90289, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 354, "text": "the messages printed on them. Understanding these three ways ", "bbox": {"l": 498.15335, "t": 283.8649, "r": 545.67834, "b": 285.90289, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 306, "label": "text", "bbox": {"l": 498.15335, "t": 285.90796, "r": 545.26471, "b": 287.94592, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 355, "text": "of classifying signs will help you figure out the meaning of signs ", "bbox": {"l": 498.15335, "t": 285.90796, "r": 545.26471, "b": 287.94592, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 307, "label": "text", "bbox": {"l": 498.15335, "t": 287.95099, "r": 513.31335, "b": 289.98895, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 356, "text": "that are new to you. ", "bbox": {"l": 498.15335, "t": 287.95099, "r": 513.31335, "b": 289.98895, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 308, "label": "text", "bbox": {"l": 505.43439, "t": 303.07596, "r": 508.53033000000005, "b": 304.89639, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 357, "text": "Stop", "bbox": {"l": 505.43439, "t": 303.07596, "r": 508.53033000000005, "b": 304.89639, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 309, "label": "text", "bbox": {"l": 527.45502, "t": 303.25354, "r": 541.44678, "b": 305.07397, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 358, "text": "Yield the right-of-way", "bbox": {"l": 527.45502, "t": 303.25354, "r": 541.44678, "b": 305.07397, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 310, "label": "text", "bbox": {"l": 501.79385, "t": 321.18973, "r": 510.41632, "b": 323.01016, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 359, "text": "Shows driving", "bbox": {"l": 501.79385, "t": 321.18973, "r": 510.41632, "b": 323.01016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 311, "label": "text", "bbox": {"l": 501.79385, "t": 322.87731999999994, "r": 509.04268999999994, "b": 324.69775000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 360, "text": "regulations", "bbox": {"l": 501.79385, "t": 322.87731999999994, "r": 509.04268999999994, "b": 324.69775000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 312, "label": "text", "bbox": {"l": 518.66455, "t": 319.59146, "r": 529.80902, "b": 321.41190000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 361, "text": "Explains lane use", "bbox": {"l": 518.66455, "t": 319.59146, "r": 529.80902, "b": 321.41190000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 313, "label": "text", "bbox": {"l": 534.87561, "t": 318.37616, "r": 546.95142, "b": 320.19659, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 362, "text": "School zone signs ", "bbox": {"l": 534.87561, "t": 318.37616, "r": 546.95142, "b": 320.19659, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 314, "label": "text", "bbox": {"l": 534.87561, "t": 320.0637500000001, "r": 545.05762, "b": 321.88419, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 363, "text": "are fl uorescent ", "bbox": {"l": 534.87561, "t": 320.0637500000001, "r": 545.05762, "b": 321.88419, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 315, "label": "text", "bbox": {"l": 534.87561, "t": 321.75134, "r": 543.32263, "b": 323.57178, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 364, "text": "yellow-green", "bbox": {"l": 534.87561, "t": 321.75134, "r": 543.32263, "b": 323.57178, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 316, "label": "text", "bbox": {"l": 499.21862999999996, "t": 338.12772, "r": 512.62451, "b": 339.94815, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 365, "text": "Tells about motorist ", "bbox": {"l": 499.21862999999996, "t": 338.12772, "r": 512.62451, "b": 339.94815, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 317, "label": "text", "bbox": {"l": 499.21862999999996, "t": 339.81531000000007, "r": 504.39917, "b": 341.63574, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 366, "text": "services", "bbox": {"l": 499.21862999999996, "t": 339.81531000000007, "r": 504.39917, "b": 341.63574, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 318, "label": "text", "bbox": {"l": 516.97748, "t": 338.06039, "r": 529.77484, "b": 339.88082999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 367, "text": "Shows a permitted ", "bbox": {"l": 516.97748, "t": 338.06039, "r": 529.77484, "b": 339.88082999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 319, "label": "text", "bbox": {"l": 516.97748, "t": 339.74799, "r": 520.96399, "b": 341.56842, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 368, "text": "action", "bbox": {"l": 516.97748, "t": 339.74799, "r": 520.96399, "b": 341.56842, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 320, "label": "text", "bbox": {"l": 534.55847, "t": 337.88281, "r": 548.58453, "b": 339.7032500000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 369, "text": "Shows an action that ", "bbox": {"l": 534.55847, "t": 337.88281, "r": 548.58453, "b": 339.7032500000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 321, "label": "text", "bbox": {"l": 534.55847, "t": 339.57040000000006, "r": 545.08862, "b": 341.39084, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 370, "text": "is not permitted", "bbox": {"l": 534.55847, "t": 339.57040000000006, "r": 545.08862, "b": 341.39084, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 322, "label": "text", "bbox": {"l": 483.05853, "t": 356.17416, "r": 494.72577, "b": 357.9946, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 371, "text": "Warns of hazards ", "bbox": {"l": 483.05853, "t": 356.17416, "r": 494.72577, "b": 357.9946, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 323, "label": "text", "bbox": {"l": 483.05853, "t": 357.86179, "r": 487.07525999999996, "b": 359.68222, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 372, "text": "ahead", "bbox": {"l": 483.05853, "t": 357.86179, "r": 487.07525999999996, "b": 359.68222, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 324, "label": "text", "bbox": {"l": 499.39645, "t": 356.26297000000005, "r": 504.69171, "b": 358.0834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 373, "text": "Warns of", "bbox": {"l": 499.39645, "t": 356.26297000000005, "r": 504.69171, "b": 358.0834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 325, "label": "text", "bbox": {"l": 499.39645, "t": 357.95056, "r": 511.69116, "b": 359.77099999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 374, "text": "construction zones", "bbox": {"l": 499.39645, "t": 357.95056, "r": 511.69116, "b": 359.77099999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 326, "label": "text", "bbox": {"l": 516.75891, "t": 356.26297000000005, "r": 527.42938, "b": 358.0834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 375, "text": "Railway crossing", "bbox": {"l": 516.75891, "t": 356.26297000000005, "r": 527.42938, "b": 358.0834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 327, "label": "text", "bbox": {"l": 534.5141, "t": 352.92981, "r": 547.89862, "b": 354.75024, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 376, "text": "Shows distance and ", "bbox": {"l": 534.5141, "t": 352.92981, "r": 547.89862, "b": 354.75024, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 328, "label": "text", "bbox": {"l": 534.5141, "t": 354.6174, "r": 540.2818, "b": 356.43784, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 377, "text": "direction", "bbox": {"l": 534.5141, "t": 354.6174, "r": 540.2818, "b": 356.43784, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 329, "label": "text", "bbox": {"l": 478.37466, "t": 270.14075, "r": 479.14251999999993, "b": 272.17877, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 378, "text": "\u2022", "bbox": {"l": 478.37466, "t": 270.14075, "r": 479.14251999999993, "b": 272.17877, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 330, "label": "text", "bbox": {"l": 479.91036999999994, "t": 270.14075, "r": 483.74963, "b": 272.17877, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 379, "text": "Signs", "bbox": {"l": 479.91036999999994, "t": 270.14075, "r": 483.74963, "b": 272.17877, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 331, "label": "text", "bbox": {"l": 479.97293, "t": 272.84717, "r": 492.31219, "b": 274.34888, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 380, "text": "- regulatory signs", "bbox": {"l": 479.97293, "t": 272.84717, "r": 492.31219, "b": 274.34888, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 332, "label": "text", "bbox": {"l": 479.97293, "t": 275.14513999999997, "r": 486.72598000000005, "b": 276.64679, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 381, "text": "- school, ", "bbox": {"l": 479.97293, "t": 275.14513999999997, "r": 486.72598000000005, "b": 276.64679, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 333, "label": "text", "bbox": {"l": 481.21602999999993, "t": 276.77972, "r": 492.93286000000006, "b": 278.81768999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 382, "text": "playground and ", "bbox": {"l": 481.21602999999993, "t": 276.77972, "r": 492.93286000000006, "b": 278.81768999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 334, "label": "text", "bbox": {"l": 481.21602999999993, "t": 278.82275000000004, "r": 491.82938000000007, "b": 280.86075, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 383, "text": "crosswalk signs", "bbox": {"l": 481.21602999999993, "t": 278.82275000000004, "r": 491.82938000000007, "b": 280.86075, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 335, "label": "text", "bbox": {"l": 479.97293, "t": 281.52759, "r": 491.00775000000004, "b": 283.02924, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 384, "text": "- lane use signs", "bbox": {"l": 479.97293, "t": 281.52759, "r": 491.00775000000004, "b": 283.02924, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 336, "label": "text", "bbox": {"l": 479.97293, "t": 283.82556, "r": 493.32748, "b": 285.3272099999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 385, "text": "- turn control signs", "bbox": {"l": 479.97293, "t": 283.82556, "r": 493.32748, "b": 285.3272099999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 337, "label": "text", "bbox": {"l": 479.97293, "t": 286.1235, "r": 490.4915199999999, "b": 287.62518, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 386, "text": "- parking signs", "bbox": {"l": 479.97293, "t": 286.1235, "r": 490.4915199999999, "b": 287.62518, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 338, "label": "text", "bbox": {"l": 479.97293, "t": 288.42148, "r": 491.17004000000003, "b": 289.92316, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 387, "text": "- reserved lane ", "bbox": {"l": 479.97293, "t": 288.42148, "r": 491.17004000000003, "b": 289.92316, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 339, "label": "text", "bbox": {"l": 481.21602999999993, "t": 290.05605999999995, "r": 484.77405000000005, "b": 292.09406, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 388, "text": "signs", "bbox": {"l": 481.21602999999993, "t": 290.05605999999995, "r": 484.77405000000005, "b": 292.09406, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 340, "label": "text", "bbox": {"l": 479.97293, "t": 292.76169000000004, "r": 490.83398, "b": 294.26334, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 389, "text": "- warning signs", "bbox": {"l": 479.97293, "t": 292.76169000000004, "r": 490.83398, "b": 294.26334, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 341, "label": "text", "bbox": {"l": 479.97293, "t": 295.05963, "r": 491.62692, "b": 296.56131, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 390, "text": "- object markers", "bbox": {"l": 479.97293, "t": 295.05963, "r": 491.62692, "b": 296.56131, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 342, "label": "text", "bbox": {"l": 479.97293, "t": 297.3576, "r": 490.37341, "b": 298.8592499999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 391, "text": "- construction ", "bbox": {"l": 479.97293, "t": 297.3576, "r": 490.37341, "b": 298.8592499999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 343, "label": "text", "bbox": {"l": 481.21602999999993, "t": 298.99219, "r": 484.77405000000005, "b": 301.03015, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 392, "text": "signs", "bbox": {"l": 481.21602999999993, "t": 298.99219, "r": 484.77405000000005, "b": 301.03015, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 344, "label": "text", "bbox": {"l": 479.97293, "t": 301.69780999999995, "r": 492.93912, "b": 303.19946, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 393, "text": "- information and ", "bbox": {"l": 479.97293, "t": 301.69780999999995, "r": 492.93912, "b": 303.19946, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 345, "label": "text", "bbox": {"l": 481.21602999999993, "t": 303.3324, "r": 493.00525, "b": 305.37036, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 394, "text": "destination signs", "bbox": {"l": 481.21602999999993, "t": 303.3324, "r": 493.00525, "b": 305.37036, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 346, "label": "text", "bbox": {"l": 479.97293, "t": 306.0379899999999, "r": 489.99047999999993, "b": 307.53967, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 395, "text": "- railway signs", "bbox": {"l": 479.97293, "t": 306.0379899999999, "r": 489.99047999999993, "b": 307.53967, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 347, "label": "text", "bbox": {"l": 478.375, "t": 308.24789, "r": 479.1032400000001, "b": 310.28586, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 396, "text": "\u2022", "bbox": {"l": 478.375, "t": 308.24789, "r": 479.1032400000001, "b": 310.28586, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 348, "label": "text", "bbox": {"l": 479.83151, "t": 308.24789, "r": 484.92925999999994, "b": 310.28586, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 397, "text": "Signals", "bbox": {"l": 479.83151, "t": 308.24789, "r": 484.92925999999994, "b": 310.28586, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 349, "label": "text", "bbox": {"l": 479.97293, "t": 310.95358, "r": 490.00091999999995, "b": 312.45526, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 398, "text": "- lane control ", "bbox": {"l": 479.97293, "t": 310.95358, "r": 490.00091999999995, "b": 312.45526, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 350, "label": "text", "bbox": {"l": 481.21602999999993, "t": 312.5881999999999, "r": 485.95331, "b": 314.62616, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 399, "text": "signals", "bbox": {"l": 481.21602999999993, "t": 312.5881999999999, "r": 485.95331, "b": 314.62616, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 351, "label": "text", "bbox": {"l": 479.97293, "t": 315.29379, "r": 489.29876999999993, "b": 316.79544, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 400, "text": "- traffic lights", "bbox": {"l": 479.97293, "t": 315.29379, "r": 489.29876999999993, "b": 316.79544, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 352, "label": "text", "bbox": {"l": 478.375, "t": 317.50366, "r": 479.18129999999996, "b": 319.5416599999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 401, "text": "\u2022", "bbox": {"l": 478.375, "t": 317.50366, "r": 479.18129999999996, "b": 319.5416599999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 353, "label": "text", "bbox": {"l": 479.98761, "t": 317.50366, "r": 490.46960000000007, "b": 319.5416599999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 402, "text": "Road markings", "bbox": {"l": 479.98761, "t": 317.50366, "r": 490.46960000000007, "b": 319.5416599999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 354, "label": "text", "bbox": {"l": 479.97293, "t": 320.20938, "r": 489.26166000000006, "b": 321.71103, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 403, "text": "- yellow lines", "bbox": {"l": 479.97293, "t": 320.20938, "r": 489.26166000000006, "b": 321.71103, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 355, "label": "text", "bbox": {"l": 479.97293, "t": 322.50732, "r": 488.59189, "b": 324.009, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 404, "text": "- white lines", "bbox": {"l": 479.97293, "t": 322.50732, "r": 488.59189, "b": 324.009, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 356, "label": "text", "bbox": {"l": 479.97293, "t": 324.8053, "r": 491.17004000000003, "b": 326.30698, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 405, "text": "- reserved lane ", "bbox": {"l": 479.97293, "t": 324.8053, "r": 491.17004000000003, "b": 326.30698, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 357, "label": "text", "bbox": {"l": 481.21602999999993, "t": 326.43988, "r": 487.58978, "b": 328.47784, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 406, "text": "markings", "bbox": {"l": 481.21602999999993, "t": 326.43988, "r": 487.58978, "b": 328.47784, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 358, "label": "text", "bbox": {"l": 479.97293, "t": 329.14551, "r": 491.75177, "b": 330.64716, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 407, "text": "- other markings", "bbox": {"l": 479.97293, "t": 329.14551, "r": 491.75177, "b": 330.64716, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 359, "label": "text", "bbox": {"l": 478.15246999999994, "t": 265.07030999999995, "r": 493.75586, "b": 268.06872999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 408, "text": "in this chapter", "bbox": {"l": 478.15246999999994, "t": 265.07030999999995, "r": 493.75586, "b": 268.06872999999996, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "caption", "id": 16, "page_no": 0, "cluster": {"id": 16, "label": "caption", "bbox": {"l": 317.95499, "t": 540.08299, "r": 559.80579, "b": 559.51524, "coord_origin": "TOPLEFT"}, "confidence": 0.7793365120887756, "cells": [{"id": 409, "text": "Figure 1: Four examples of complex page layouts across dif-", "bbox": {"l": 317.95499, "t": 540.08299, "r": 559.80579, "b": 548.55624, "coord_origin": "TOPLEFT"}}, {"id": 410, "text": "ferent document categories", "bbox": {"l": 317.95499, "t": 551.0419899999999, "r": 428.69907, "b": 559.51524, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 1: Four examples of complex page layouts across different document categories"}, {"label": "section_header", "id": 3, "page_no": 0, "cluster": {"id": 3, "label": "section_header", "bbox": {"l": 317.95499, "t": 592.46591, "r": 379.8205, "b": 602.7750100000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9208476543426514, "cells": [{"id": 411, "text": "KEYWORDS", "bbox": {"l": 317.95499, "t": 592.46591, "r": 379.8205, "b": 602.7750100000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "KEYWORDS"}, {"label": "text", "id": 1, "page_no": 0, "cluster": {"id": 1, "label": "text", "bbox": {"l": 317.95499, "t": 607.66756, "r": 559.18597, "b": 627.00117, "coord_origin": "TOPLEFT"}, "confidence": 0.9509093761444092, "cells": [{"id": 412, "text": "PDF document conversion, layout segmentation, object-detection,", "bbox": {"l": 317.95499, "t": 607.66756, "r": 559.18597, "b": 616.04218, "coord_origin": "TOPLEFT"}}, {"id": 413, "text": "data set, Machine Learning", "bbox": {"l": 317.95499, "t": 618.62656, "r": 416.94403, "b": 627.00117, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "PDF document conversion, layout segmentation, object-detection, data set, Machine Learning"}, {"label": "section_header", "id": 7, "page_no": 0, "cluster": {"id": 7, "label": "section_header", "bbox": {"l": 317.65997, "t": 640.05434, "r": 404.65366, "b": 647.58609, "coord_origin": "TOPLEFT"}, "confidence": 0.8721988797187805, "cells": [{"id": 414, "text": "ACM Reference Format:", "bbox": {"l": 317.65997, "t": 640.05434, "r": 404.65366, "b": 647.58609, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "ACM Reference Format:"}, {"label": "text", "id": 2, "page_no": 0, "cluster": {"id": 2, "label": "text", "bbox": {"l": 317.95499, "t": 650.11996, "r": 559.5495, "b": 707.377029, "coord_origin": "TOPLEFT"}, "confidence": 0.9455165863037109, "cells": [{"id": 415, "text": "Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter", "bbox": {"l": 317.95499, "t": 650.11996, "r": 558.35266, "b": 657.56404, "coord_origin": "TOPLEFT"}}, {"id": 416, "text": "Staar. 2022. DocLayNet: A Large Human-Annotated Dataset for Document-", "bbox": {"l": 317.95499, "t": 660.08296, "r": 559.5495, "b": 667.52703, "coord_origin": "TOPLEFT"}}, {"id": 417, "text": "Layout Analysis. In", "bbox": {"l": 317.95499, "t": 670.04497, "r": 383.30807, "b": 677.48904, "coord_origin": "TOPLEFT"}}, {"id": 418, "text": "Proceedings of the 28th ACM SIGKDD Conference on", "bbox": {"l": 385.798, "t": 670.08482, "r": 558.20032, "b": 677.49701, "coord_origin": "TOPLEFT"}}, {"id": 419, "text": "Knowledge Discovery and Data Mining (KDD \u201922), August 14-18, 2022, Wash-", "bbox": {"l": 317.95499, "t": 680.04781, "r": 559.00092, "b": 687.46001, "coord_origin": "TOPLEFT"}}, {"id": 420, "text": "ington, DC, USA.", "bbox": {"l": 317.95499, "t": 690.01081, "r": 370.11481, "b": 697.423004, "coord_origin": "TOPLEFT"}}, {"id": 421, "text": "ACM, New York, NY, USA, 9 pages. https://doi.org/10.1145/", "bbox": {"l": 371.82999, "t": 689.97096, "r": 558.71655, "b": 697.415031, "coord_origin": "TOPLEFT"}}, {"id": 422, "text": "3534678.3539043", "bbox": {"l": 317.95499, "t": 699.932953, "r": 371.59375, "b": 707.377029, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar. 2022. DocLayNet: A Large Human-Annotated Dataset for DocumentLayout Analysis. In Proceedings of the 28th ACM SIGKDD Conference on Knowledge Discovery and Data Mining (KDD '22), August 14-18, 2022, Washington, DC, USA. ACM, New York, NY, USA, 9 pages. https://doi.org/10.1145/ 3534678.3539043"}, {"label": "page_header", "id": 10, "page_no": 0, "cluster": {"id": 10, "label": "page_header", "bbox": {"l": 18.34021, "t": 218.35999000000004, "r": 36.339794, "b": 555.00003, "coord_origin": "TOPLEFT"}, "confidence": 0.8537883758544922, "cells": [{"id": 423, "text": "arXiv:2206.01062v1 [cs.CV] 2 Jun 2022", "bbox": {"l": 18.34021, "t": 218.35999000000004, "r": 36.339794, "b": 555.00003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "arXiv:2206.01062v1 [cs.CV] 2 Jun 2022"}], "body": [{"label": "section_header", "id": 12, "page_no": 0, "cluster": {"id": 12, "label": "section_header", "bbox": {"l": 107.29999999999998, "t": 83.69470000000013, "r": 505.06195, "b": 119.59558000000015, "coord_origin": "TOPLEFT"}, "confidence": 0.8416302800178528, "cells": [{"id": 0, "text": "DocLayNet: A Large Human-Annotated Dataset for", "bbox": {"l": 107.29999999999998, "t": 83.69470000000013, "r": 505.06195, "b": 99.67058999999995, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Document-Layout Analysis", "bbox": {"l": 200.117, "t": 103.6196900000001, "r": 411.88367, "b": 119.59558000000015, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis"}, {"label": "text", "id": 8, "page_no": 0, "cluster": {"id": 8, "label": "text", "bbox": {"l": 90.96701, "t": 133.67236000000003, "r": 193.73123, "b": 180.24030000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.8637151718139648, "cells": [{"id": 2, "text": "Birgit Pfitzmann", "bbox": {"l": 102.06001, "t": 133.67236000000003, "r": 182.63805, "b": 144.83856000000003, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "IBM Research", "bbox": {"l": 114.29401000000001, "t": 147.02423, "r": 170.40337, "b": 156.32928000000004, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Rueschlikon, Switzerland", "bbox": {"l": 90.96701, "t": 158.97924999999998, "r": 193.73123, "b": 168.28430000000003, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "bpf@zurich.ibm.com", "bbox": {"l": 100.02301, "t": 170.93524000000002, "r": 184.67522, "b": 180.24030000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Birgit Pfitzmann IBM Research Rueschlikon, Switzerland bpf@zurich.ibm.com"}, {"label": "text", "id": 9, "page_no": 0, "cluster": {"id": 9, "label": "text", "bbox": {"l": 255.11602999999997, "t": 133.67236000000003, "r": 357.88025, "b": 180.24030000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.8612664937973022, "cells": [{"id": 6, "text": "Christoph Auer", "bbox": {"l": 268.62402, "t": 133.67236000000003, "r": 344.59933, "b": 144.83856000000003, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "IBM Research", "bbox": {"l": 278.44302, "t": 147.02423, "r": 334.55237, "b": 156.32928000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Rueschlikon, Switzerland", "bbox": {"l": 255.11602999999997, "t": 158.97924999999998, "r": 357.88025, "b": 168.28430000000003, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "cau@zurich.ibm.com", "bbox": {"l": 263.70404, "t": 170.93524000000002, "r": 349.29272, "b": 180.24030000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Christoph Auer IBM Research Rueschlikon, Switzerland cau@zurich.ibm.com"}, {"label": "text", "id": 6, "page_no": 0, "cluster": {"id": 6, "label": "text", "bbox": {"l": 419.26505, "t": 133.67236000000003, "r": 522.0293, "b": 180.24030000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.8760607242584229, "cells": [{"id": 10, "text": "Michele Dolfi", "bbox": {"l": 437.6930500000001, "t": 133.67236000000003, "r": 503.60208, "b": 144.83856000000003, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "IBM Research", "bbox": {"l": 442.59305000000006, "t": 147.02423, "r": 498.7023899999999, "b": 156.32928000000004, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Rueschlikon, Switzerland", "bbox": {"l": 419.26505, "t": 158.97924999999998, "r": 522.0293, "b": 168.28430000000003, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "dol@zurich.ibm.com", "bbox": {"l": 428.56104000000005, "t": 170.93524000000002, "r": 512.73505, "b": 180.24030000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Michele Dolfi IBM Research Rueschlikon, Switzerland dol@zurich.ibm.com"}, {"label": "text", "id": 13, "page_no": 0, "cluster": {"id": 13, "label": "text", "bbox": {"l": 172.54303, "t": 192.05737, "r": 275.30725, "b": 238.62531, "coord_origin": "TOPLEFT"}, "confidence": 0.8319916129112244, "cells": [{"id": 14, "text": "Ahmed S. Nassar", "bbox": {"l": 182.26804, "t": 192.05737, "r": 265.39255, "b": 203.22357, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "IBM Research", "bbox": {"l": 195.87103, "t": 205.40923999999995, "r": 251.98038999999997, "b": 214.71429, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Rueschlikon, Switzerland", "bbox": {"l": 172.54303, "t": 217.36425999999994, "r": 275.30725, "b": 226.66931, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "ahn@zurich.ibm.com", "bbox": {"l": 180.52803, "t": 229.32025, "r": 267.3222, "b": 238.62531, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Ahmed S. Nassar IBM Research Rueschlikon, Switzerland ahn@zurich.ibm.com"}, {"label": "text", "id": 15, "page_no": 0, "cluster": {"id": 15, "label": "text", "bbox": {"l": 336.69302, "t": 192.05737, "r": 439.45727999999997, "b": 238.62531, "coord_origin": "TOPLEFT"}, "confidence": 0.8027974367141724, "cells": [{"id": 18, "text": "Peter Staar", "bbox": {"l": 361.52802, "t": 192.05737, "r": 414.84821, "b": 203.22357, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "IBM Research", "bbox": {"l": 360.02002, "t": 205.40923999999995, "r": 416.12939, "b": 214.71429, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Rueschlikon, Switzerland", "bbox": {"l": 336.69302, "t": 217.36425999999994, "r": 439.45727999999997, "b": 226.66931, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "taa@zurich.ibm.com", "bbox": {"l": 346.20703, "t": 229.32025, "r": 429.94269, "b": 238.62531, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Peter Staar IBM Research Rueschlikon, Switzerland taa@zurich.ibm.com"}, {"label": "section_header", "id": 5, "page_no": 0, "cluster": {"id": 5, "label": "section_header", "bbox": {"l": 53.798035, "t": 247.70288000000005, "r": 111.94354, "b": 258.01202, "coord_origin": "TOPLEFT"}, "confidence": 0.8876155018806458, "cells": [{"id": 22, "text": "ABSTRACT", "bbox": {"l": 53.798035, "t": 247.70288000000005, "r": 111.94354, "b": 258.01202, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "ABSTRACT"}, {"label": "text", "id": 0, "page_no": 0, "cluster": {"id": 0, "label": "text", "bbox": {"l": 53.466999, "t": 262.90454, "r": 295.56018, "b": 534.29318, "coord_origin": "TOPLEFT"}, "confidence": 0.9823057055473328, "cells": [{"id": 23, "text": "Accurate document layout analysis is a key requirement for high-", "bbox": {"l": 53.484001, "t": 262.90454, "r": 295.55591, "b": 271.27917, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "quality PDF document conversion. With the recent availability of", "bbox": {"l": 53.79800000000001, "t": 273.86352999999997, "r": 294.04199, "b": 282.23816, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "public, large ground-truth datasets such as PubLayNet and DocBank,", "bbox": {"l": 53.79800000000001, "t": 284.82254, "r": 295.34586, "b": 293.19717, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "deep-learning models have proven to be very effective at layout", "bbox": {"l": 53.79800000000001, "t": 295.78152, "r": 294.04709, "b": 304.15616000000006, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "detection and segmentation. While these datasets are of adequate", "bbox": {"l": 53.79800000000001, "t": 306.74053999999995, "r": 294.04645, "b": 315.11517, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "size to train such models, they severely lack in layout variability", "bbox": {"l": 53.79800000000001, "t": 317.69952, "r": 294.27573, "b": 326.07416, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "since they are sourced from scientific article repositories such as", "bbox": {"l": 53.79800000000001, "t": 328.65854, "r": 294.04712, "b": 337.03317, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "PubMed and arXiv only. Consequently, the accuracy of the layout", "bbox": {"l": 53.79800000000001, "t": 339.61755, "r": 294.0437, "b": 347.99219, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "segmentation drops significantly when these models are applied", "bbox": {"l": 53.79800000000001, "t": 350.57654, "r": 294.04715, "b": 358.95117, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "on more challenging and diverse layouts. In this paper, we present", "bbox": {"l": 53.79800000000001, "t": 361.53455, "r": 294.04364, "b": 369.90918000000005, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "DocLayNet", "bbox": {"l": 53.79800000000001, "t": 372.53839, "r": 92.863388, "b": 380.87714000000005, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": ", a new, publicly available, document-layout annotation", "bbox": {"l": 92.863998, "t": 372.49353, "r": 294.04361, "b": 380.86816, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "dataset in COCO format. It contains 80863 manually annotated", "bbox": {"l": 53.79800000000001, "t": 383.45255, "r": 294.04718, "b": 391.82718, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "pages from diverse data sources to represent a wide variability in", "bbox": {"l": 53.79800000000001, "t": 394.41153, "r": 294.0437, "b": 402.78616, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "layouts. For each PDF page, the layout annotations provide labelled", "bbox": {"l": 53.79800000000001, "t": 405.37054, "r": 294.04535, "b": 413.74518, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "bounding-boxes with a choice of 11 distinct classes. DocLayNet", "bbox": {"l": 53.79800000000001, "t": 416.32953, "r": 294.04715, "b": 424.70416000000006, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "also provides a subset of double- and triple-annotated pages to", "bbox": {"l": 53.79800000000001, "t": 427.28853999999995, "r": 294.04712, "b": 435.66318, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "determine the inter-annotator agreement. In multiple experiments,", "bbox": {"l": 53.79800000000001, "t": 438.24753, "r": 295.03, "b": 446.62216, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "we provide baseline accuracy scores (in mAP) for a set of popular", "bbox": {"l": 53.466999, "t": 449.20654, "r": 294.21616, "b": 457.58118, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "object detection models. We also demonstrate that these models", "bbox": {"l": 53.79800000000001, "t": 460.16553, "r": 294.04712, "b": 468.54016, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "fall approximately 10% behind the inter-annotator agreement. Fur-", "bbox": {"l": 53.79800000000001, "t": 471.12354, "r": 295.56018, "b": 479.49817, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "thermore, we provide evidence that DocLayNet is of sufficient size.", "bbox": {"l": 53.79800000000001, "t": 482.08255, "r": 295.42783, "b": 490.45718, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Lastly, we compare models trained on PubLayNet, DocBank and", "bbox": {"l": 53.79800000000001, "t": 493.04153, "r": 294.04715, "b": 501.41617, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "DocLayNet, showing that layout predictions of the DocLayNet-", "bbox": {"l": 53.79800000000001, "t": 504.00055, "r": 295.55618, "b": 512.37518, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "trained models are more robust and thus the preferred choice for", "bbox": {"l": 53.79800000000001, "t": 514.95953, "r": 294.21643, "b": 523.33417, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "general-purpose document-layout analysis.", "bbox": {"l": 53.79800000000001, "t": 525.91855, "r": 212.05495, "b": 534.29318, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Accurate document layout analysis is a key requirement for highquality PDF document conversion. With the recent availability of public, large ground-truth datasets such as PubLayNet and DocBank, deep-learning models have proven to be very effective at layout detection and segmentation. While these datasets are of adequate size to train such models, they severely lack in layout variability since they are sourced from scientific article repositories such as PubMed and arXiv only. Consequently, the accuracy of the layout segmentation drops significantly when these models are applied on more challenging and diverse layouts. In this paper, we present DocLayNet , a new, publicly available, document-layout annotation dataset in COCO format. It contains 80863 manually annotated pages from diverse data sources to represent a wide variability in layouts. For each PDF page, the layout annotations provide labelled bounding-boxes with a choice of 11 distinct classes. DocLayNet also provides a subset of double- and triple-annotated pages to determine the inter-annotator agreement. In multiple experiments, we provide baseline accuracy scores (in mAP) for a set of popular object detection models. We also demonstrate that these models fall approximately 10% behind the inter-annotator agreement. Furthermore, we provide evidence that DocLayNet is of sufficient size. Lastly, we compare models trained on PubLayNet, DocBank and DocLayNet, showing that layout predictions of the DocLayNettrained models are more robust and thus the preferred choice for general-purpose document-layout analysis."}, {"label": "section_header", "id": 4, "page_no": 0, "cluster": {"id": 4, "label": "section_header", "bbox": {"l": 53.79800000000001, "t": 550.99692, "r": 134.81989, "b": 561.30602, "coord_origin": "TOPLEFT"}, "confidence": 0.9149598479270935, "cells": [{"id": 49, "text": "CCS CONCEPTS", "bbox": {"l": 53.79800000000001, "t": 550.99692, "r": 134.81989, "b": 561.30602, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "CCS CONCEPTS"}, {"label": "text", "id": 11, "page_no": 0, "cluster": {"id": 11, "label": "text", "bbox": {"l": 53.797989, "t": 566.08299, "r": 297.85294, "b": 596.50114, "coord_origin": "TOPLEFT"}, "confidence": 0.8458839058876038, "cells": [{"id": 50, "text": "\u2022", "bbox": {"l": 53.79800000000001, "t": 566.19957, "r": 56.945206000000006, "b": 574.57419, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Information systems", "bbox": {"l": 58.440002, "t": 566.0830100000001, "r": 142.4462, "b": 574.5562600000001, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "\u2192", "bbox": {"l": 143.938, "t": 566.36096, "r": 153.15099, "b": 574.43073, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Document structure", "bbox": {"l": 154.646, "t": 566.0830100000001, "r": 235.46015999999997, "b": 574.5562600000001, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "; \u2022", "bbox": {"l": 235.45700000000002, "t": 566.19955, "r": 242.17419, "b": 574.57417, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "Applied com-", "bbox": {"l": 243.66899, "t": 566.08299, "r": 297.85294, "b": 574.55624, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "puting", "bbox": {"l": 53.797989, "t": 577.0419899999999, "r": 80.661324, "b": 585.51524, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "\u2192", "bbox": {"l": 83.565987, "t": 577.3199500000001, "r": 92.778961, "b": 585.38971, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Document analysis", "bbox": {"l": 95.68399, "t": 577.0419899999999, "r": 173.91583, "b": 585.51524, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "; \u2022", "bbox": {"l": 173.916, "t": 577.15855, "r": 182.1272, "b": 585.53317, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Computing methodologies", "bbox": {"l": 185.032, "t": 577.0419899999999, "r": 294.0455, "b": 585.51524, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "\u2192", "bbox": {"l": 53.79800399999999, "t": 588.27895, "r": 63.01097899999999, "b": 596.34871, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "Machine learning", "bbox": {"l": 65.253006, "t": 588.00099, "r": 136.80487, "b": 596.47424, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": ";", "bbox": {"l": 136.80501, "t": 588.1175499999999, "r": 138.92108, "b": 596.49217, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "Computer vision", "bbox": {"l": 141.162, "t": 588.00099, "r": 209.60254, "b": 596.47424, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": ";", "bbox": {"l": 209.60201, "t": 588.1175499999999, "r": 211.71808, "b": 596.49217, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "Object detection", "bbox": {"l": 213.96001, "t": 588.16238, "r": 270.45728, "b": 596.50114, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": ";", "bbox": {"l": 270.48001, "t": 588.1175499999999, "r": 272.59607, "b": 596.49217, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u00b7 Information systems \u2192 Document structure ; \u00b7 Applied computing \u2192 Document analysis ; \u00b7 Computing methodologies \u2192 Machine learning ; Computer vision ; Object detection ;"}, {"label": "text", "id": 17, "page_no": 0, "cluster": {"id": 17, "label": "text", "bbox": {"l": 53.79800000000001, "t": 634.39838, "r": 295.11798, "b": 672.79189, "coord_origin": "TOPLEFT"}, "confidence": 0.7107349038124084, "cells": [{"id": 68, "text": "Permission to make digital or hard copies of part or all of this work for personal or", "bbox": {"l": 53.79800000000001, "t": 634.39838, "r": 294.17697, "b": 640.9119000000001, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "classroom use is granted without fee provided that copies are not made or distributed", "bbox": {"l": 53.79800000000001, "t": 642.36838, "r": 294.04443, "b": 648.8819, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "for profit or commercial advantage and that copies bear this notice and the full citation", "bbox": {"l": 53.79800000000001, "t": 650.33838, "r": 294.04498, "b": 656.8519, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "on the first page. Copyrights for third-party components of this work must be honored.", "bbox": {"l": 53.79800000000001, "t": 658.3083799999999, "r": 295.11798, "b": 664.8219, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "For all other uses, contact the owner/author(s).", "bbox": {"l": 53.79800000000001, "t": 666.27837, "r": 187.72285, "b": 672.79189, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Permission to make digital or hard copies of part or all of this work for personal or classroom use is granted without fee provided that copies are not made or distributed for profit or commercial advantage and that copies bear this notice and the full citation on the first page. Copyrights for third-party components of this work must be honored. For all other uses, contact the owner/author(s)."}, {"label": "text", "id": 29, "page_no": 0, "cluster": {"id": 29, "label": "text", "bbox": {"l": 53.79800000000001, "t": 675.08023, "r": 197.86275, "b": 681.56586, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 53.79800000000001, "t": 675.08023, "r": 197.86275, "b": 681.56586, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA"}, {"label": "text", "id": 30, "page_no": 0, "cluster": {"id": 30, "label": "text", "bbox": {"l": 53.317001, "t": 683.81236, "r": 186.74652, "b": 690.32589, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "\u00a9 2022 Copyright held by the owner/author(s).", "bbox": {"l": 53.317001, "t": 683.81236, "r": 186.74652, "b": 690.32589, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u00a9 2022 Copyright held by the owner/author(s)."}, {"label": "text", "id": 31, "page_no": 0, "cluster": {"id": 31, "label": "text", "bbox": {"l": 53.554001, "t": 691.78336, "r": 157.03125, "b": 698.29689, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "ACM ISBN 978-1-4503-9385-0/22/08.", "bbox": {"l": 53.554001, "t": 691.78336, "r": 157.03125, "b": 698.29689, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "ACM ISBN 978-1-4503-9385-0/22/08."}, {"label": "text", "id": 27, "page_no": 0, "cluster": {"id": 27, "label": "text", "bbox": {"l": 53.79800000000001, "t": 699.753365, "r": 166.94093, "b": 706.266891, "coord_origin": "TOPLEFT"}, "confidence": 0.509588360786438, "cells": [{"id": 76, "text": "https://doi.org/10.1145/3534678.3539043", "bbox": {"l": 53.79800000000001, "t": 699.753365, "r": 166.94093, "b": 706.266891, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "https://doi.org/10.1145/3534678.3539043"}, {"label": "picture", "id": 20, "page_no": 0, "cluster": {"id": 20, "label": "picture", "bbox": {"l": 323.408203125, "t": 250.34873962402344, "r": 553.2952270507812, "b": 525.8507080078125, "coord_origin": "TOPLEFT"}, "confidence": 0.5910208821296692, "cells": [{"id": 77, "text": "13", "bbox": {"l": 327.86951, "t": 351.78085, "r": 330.41248, "b": 353.95465, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "USING THE VERTICAL TUBE -", "bbox": {"l": 327.83005, "t": 331.57268999999997, "r": 351.16092, "b": 333.31171, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "MODELS AY11230/11234", "bbox": {"l": 327.83005, "t": 333.18292, "r": 348.30536, "b": 334.92194, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "1.", "bbox": {"l": 327.83005, "t": 336.40439, "r": 329.05914, "b": 337.92606, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "The vertical tube can be used for", "bbox": {"l": 329.67368, "t": 336.40439, "r": 349.95349, "b": 337.92606, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "instructional viewing or to photograph", "bbox": {"l": 329.11752, "t": 337.83588, "r": 353.57977, "b": 339.35751000000005, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": " the image with a digital camera or a", "bbox": {"l": 327.77121, "t": 339.26736, "r": 352.4306, "b": 340.789, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": " micro TV unit", "bbox": {"l": 328.15176, "t": 340.69882, "r": 337.91086, "b": 342.22049, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "2.", "bbox": {"l": 327.8313, "t": 342.19043000000005, "r": 329.09155, "b": 343.71207, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Loosen the retention screw, then rotate ", "bbox": {"l": 329.72168, "t": 342.19043000000005, "r": 354.9267, "b": 343.71207, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": " the adjustment ring to change the ", "bbox": {"l": 327.8313, "t": 343.62192, "r": 351.66949, "b": 345.14355, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": " length of the vertical tube.", "bbox": {"l": 328.21185, "t": 345.05338, "r": 346.33179, "b": 346.57504, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "3.", "bbox": {"l": 327.83005, "t": 346.84680000000003, "r": 329.12726, "b": 348.36847, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "Make sure that both the images in", "bbox": {"l": 329.77588, "t": 346.84680000000003, "r": 351.18005, "b": 348.36847, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "OPERATION ", "bbox": {"l": 327.25311, "t": 254.94812000000002, "r": 350.07861, "b": 258.86096, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "(", "bbox": {"l": 350.07861, "t": 254.76782000000003, "r": 351.82651, "b": 258.68066, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "cont.", "bbox": {"l": 351.82651, "t": 254.94812000000002, "r": 360.85242, "b": 258.86096, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": ")", "bbox": {"l": 360.85242, "t": 254.76782000000003, "r": 362.60028, "b": 258.68066, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "SELECTING OBJECTIVE ", "bbox": {"l": 326.88037, "t": 263.49492999999995, "r": 345.84351, "b": 265.23395000000005, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "MAGNIFICATION", "bbox": {"l": 326.88037, "t": 265.10515999999996, "r": 340.54153, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "1.", "bbox": {"l": 326.88037, "t": 266.71533, "r": 328.31903, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "There are two objectives. The lower", "bbox": {"l": 329.03836, "t": 266.71533, "r": 354.21472, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": " magnification objective has a greater", "bbox": {"l": 326.88037, "t": 268.32556, "r": 355.19193, "b": 270.06458, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": " depth of field and view.", "bbox": {"l": 326.88037, "t": 269.93579, "r": 345.80057, "b": 271.6748, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "2.", "bbox": {"l": 326.88037, "t": 271.54602, "r": 328.33862, "b": 273.28503, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "In order to observe the specimen", "bbox": {"l": 329.06775, "t": 271.54602, "r": 352.39969, "b": 273.28503, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": " easily use the lower magnification", "bbox": {"l": 326.88037, "t": 273.15619000000004, "r": 352.90042, "b": 274.89526, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": " objective first. Then, by rotating the", "bbox": {"l": 326.88037, "t": 274.76642000000004, "r": 354.59546, "b": 276.50543000000005, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": " case, the magnification can be", "bbox": {"l": 326.88037, "t": 276.37665000000004, "r": 350.81885, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": " changed.", "bbox": {"l": 326.88037, "t": 277.98688000000004, "r": 335.46707, "b": 279.72589000000005, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "CHANGING THE INTERPUPILLARY ", "bbox": {"l": 326.88037, "t": 281.20728, "r": 354.57755, "b": 282.94632, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "DISTANCE", "bbox": {"l": 326.88037, "t": 282.81750000000005, "r": 335.1752, "b": 284.55652, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "1.", "bbox": {"l": 326.88037, "t": 284.4277, "r": 328.34784, "b": 286.16675, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "The distance between the observer's", "bbox": {"l": 329.08157, "t": 284.4277, "r": 354.76245, "b": 286.16675, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": " pupils is the interpupillary distance.", "bbox": {"l": 326.88037, "t": 286.03793, "r": 354.6499, "b": 287.77695, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "2.", "bbox": {"l": 326.88037, "t": 287.64813, "r": 328.25125, "b": 289.38718, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "To adjust the interpupillary distance", "bbox": {"l": 328.93671, "t": 287.64813, "r": 354.29825, "b": 289.38718, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": " rotate the prism caps until both eyes", "bbox": {"l": 326.88181, "t": 289.25836, "r": 355.02075, "b": 290.99738, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": " coincide with the image in the", "bbox": {"l": 326.88181, "t": 290.86855999999995, "r": 350.82028, "b": 292.6076, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": " eyepiece. ", "bbox": {"l": 326.88181, "t": 292.47879, "r": 336.2067, "b": 294.2178, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "FOCUSING", "bbox": {"l": 326.88181, "t": 295.69922, "r": 335.3941, "b": 297.43823, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "1.", "bbox": {"l": 326.88181, "t": 297.30942, "r": 328.34314, "b": 299.04846, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "Remove the lens protective cover.", "bbox": {"l": 329.07379, "t": 297.30942, "r": 353.18555, "b": 299.04846, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "2.", "bbox": {"l": 326.88324, "t": 298.91965, "r": 328.35919, "b": 300.65866, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "Place the specimen on the working", "bbox": {"l": 329.0972, "t": 298.91965, "r": 353.45065, "b": 300.65866, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": " stage.", "bbox": {"l": 326.88324, "t": 300.52985, "r": 333.32825, "b": 302.26889000000006, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "3.", "bbox": {"l": 326.88324, "t": 302.14008000000007, "r": 328.31296, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "Focus the specimen with the left eye", "bbox": {"l": 329.02783, "t": 302.14008000000007, "r": 354.76303, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": " first while turning the focus knob until", "bbox": {"l": 326.88324, "t": 303.75027, "r": 355.96307, "b": 305.48932, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": " the image appears clear and sharp.", "bbox": {"l": 326.88324, "t": 305.3605, "r": 354.46594, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "4.", "bbox": {"l": 326.88324, "t": 306.9707, "r": 328.25488, "b": 308.70975, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "Rotate the right eyepiece ring until the", "bbox": {"l": 328.9407, "t": 306.9707, "r": 356.37335, "b": 308.70975, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": " images in each eyepiece coincide and", "bbox": {"l": 326.88324, "t": 308.58093, "r": 355.38867, "b": 310.31995, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": " are sharp and clear.", "bbox": {"l": 326.88324, "t": 310.19113, "r": 343.17249, "b": 311.93018, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "CHANGING THE BULB", "bbox": {"l": 326.88324, "t": 313.41156, "r": 344.13388, "b": 315.15059999999994, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "1.", "bbox": {"l": 326.88324, "t": 315.02178999999995, "r": 328.37418, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "Disconnect the power cord.", "bbox": {"l": 329.11963, "t": 315.02178999999995, "r": 348.50162, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "2.", "bbox": {"l": 326.88324, "t": 316.63199, "r": 328.34061, "b": 318.37103, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "When the bulb is cool, remove the", "bbox": {"l": 329.06931, "t": 316.63199, "r": 353.11588, "b": 318.37103, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": " oblique illuminator cap and remove", "bbox": {"l": 326.88464, "t": 318.2422199999999, "r": 353.79517, "b": 319.9812299999999, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": " the halogen bulb with cap.", "bbox": {"l": 326.88464, "t": 319.85242000000005, "r": 348.02094, "b": 321.59146, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "3.", "bbox": {"l": 326.88464, "t": 321.46265, "r": 328.37512, "b": 323.20166, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "Replace with a new halogen bulb.", "bbox": {"l": 329.12036, "t": 321.46265, "r": 352.96808, "b": 323.20166, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "4.", "bbox": {"l": 326.88608, "t": 323.07285, "r": 328.36884, "b": 324.81189, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "Open the window in the base plate and", "bbox": {"l": 329.1102, "t": 323.07285, "r": 356.5412, "b": 324.81189, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": " replace the halogen lamp or ", "bbox": {"l": 326.88608, "t": 324.68307000000004, "r": 350.13828, "b": 326.42209, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": " fluorescent lamp of transmitted", "bbox": {"l": 326.88608, "t": 326.29327, "r": 351.59677, "b": 328.03232, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": " illuminator.", "bbox": {"l": 326.88608, "t": 327.9035, "r": 336.89197, "b": 329.64252, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "FOCUSING", "bbox": {"l": 358.42023, "t": 263.49492999999995, "r": 366.93256, "b": 265.23395000000005, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "1.", "bbox": {"l": 358.42023, "t": 265.10515999999996, "r": 359.89841, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "Turn the focusing knob away or toward", "bbox": {"l": 360.63751, "t": 265.10515999999996, "r": 387.98407, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": " you until a clear image is viewed.", "bbox": {"l": 358.42023, "t": 266.71533, "r": 384.58948, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "2.", "bbox": {"l": 358.42166, "t": 268.32556, "r": 359.78549, "b": 270.06458, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "If the image is unclear, adjust the", "bbox": {"l": 360.46741, "t": 268.32556, "r": 384.33441, "b": 270.06458, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": " height of the elevator up or down,", "bbox": {"l": 358.4231, "t": 269.93579, "r": 384.61502, "b": 271.6748, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": " then turn the focusing knob again.", "bbox": {"l": 358.4231, "t": 271.54602, "r": 385.38922, "b": 273.28503, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "ZOOM MAGNIFICATION", "bbox": {"l": 358.4231, "t": 274.76642000000004, "r": 377.35046, "b": 276.50543000000005, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "1.", "bbox": {"l": 358.4231, "t": 276.37665000000004, "r": 359.89429, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "Turn the zoom magnification knob to", "bbox": {"l": 360.62988, "t": 276.37665000000004, "r": 386.37589, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": " the desired magnification and field of", "bbox": {"l": 358.4231, "t": 277.98688000000004, "r": 386.78732, "b": 279.72589000000005, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": " view.", "bbox": {"l": 358.4231, "t": 279.59704999999997, "r": 364.16855, "b": 281.33609, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "2.", "bbox": {"l": 358.4231, "t": 281.20728, "r": 359.86777, "b": 282.94632, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "In most situations, it is recommended", "bbox": {"l": 360.59012, "t": 281.20728, "r": 387.31656, "b": 282.94632, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": " that you focus at the lowest ", "bbox": {"l": 358.4231, "t": 282.81750000000005, "r": 381.56656, "b": 284.55652, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": " magnification, then move to a higher", "bbox": {"l": 358.4231, "t": 284.4277, "r": 386.63403, "b": 286.16675, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": " magnification and re-focus as ", "bbox": {"l": 358.42453, "t": 286.03793, "r": 382.77115, "b": 287.77695, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": " necessary.", "bbox": {"l": 358.42453, "t": 287.64813, "r": 367.98694, "b": 289.38718, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "3.", "bbox": {"l": 358.42453, "t": 289.25836, "r": 359.80386, "b": 290.99738, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "If the image is not clear to both eyes", "bbox": {"l": 360.49353, "t": 289.25836, "r": 386.70093, "b": 290.99738, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": " at the same time, the diopter ring may", "bbox": {"l": 358.42453, "t": 290.86855999999995, "r": 388.03534, "b": 292.6076, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": " need adjustment.", "bbox": {"l": 358.42453, "t": 292.47879, "r": 373.13724, "b": 294.2178, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "DIOPTER RING ADJUSTMENT", "bbox": {"l": 358.42453, "t": 295.69922, "r": 381.74539, "b": 297.43823, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "1.", "bbox": {"l": 358.42453, "t": 297.30942, "r": 359.83682, "b": 299.04846, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "To adjust the eyepiece for viewing with", "bbox": {"l": 360.54297, "t": 297.30942, "r": 388.08289, "b": 299.04846, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": " or without eyeglasses and for ", "bbox": {"l": 358.42453, "t": 298.91965, "r": 382.73251, "b": 300.65866, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": " differences in acuity between the right", "bbox": {"l": 358.42453, "t": 300.52985, "r": 387.72266, "b": 302.26889000000006, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": " and left eyes, follow the following", "bbox": {"l": 358.42453, "t": 302.14008000000007, "r": 384.1991, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": " steps:", "bbox": {"l": 358.42453, "t": 303.75027, "r": 364.88672, "b": 305.48932, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "a.", "bbox": {"l": 358.42453, "t": 305.3605, "r": 359.95078, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "Observe an image through the left", "bbox": {"l": 361.47699, "t": 305.3605, "r": 386.65988, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": " eyepiece and bring a specific point", "bbox": {"l": 358.42453, "t": 306.9707, "r": 386.7634, "b": 308.70975, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": " into focus using the focus knob.", "bbox": {"l": 358.42453, "t": 308.58093, "r": 385.41354, "b": 310.31995, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "b.", "bbox": {"l": 358.42453, "t": 310.19113, "r": 359.93304, "b": 311.93018, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "By turning the diopter ring ", "bbox": {"l": 361.44156, "t": 310.19113, "r": 382.56085, "b": 311.93018, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": " adjustment for the left eyepiece,", "bbox": {"l": 358.42596, "t": 311.80136, "r": 385.4559, "b": 313.54037, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": " bring the same point into sharp", "bbox": {"l": 358.42596, "t": 313.41156, "r": 384.56122, "b": 315.15059999999994, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": " focus.", "bbox": {"l": 358.42596, "t": 315.02178999999995, "r": 366.74371, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": " c.Then bring the same point into", "bbox": {"l": 358.42596, "t": 316.63199, "r": 383.93884, "b": 318.37103, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": " focus through the right eyepiece", "bbox": {"l": 358.42596, "t": 318.2422199999999, "r": 385.69241, "b": 319.9812299999999, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": " by turning the right diopter ring.", "bbox": {"l": 358.42596, "t": 319.85242000000005, "r": 385.94861, "b": 321.59146, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": " d.With more than one viewer, each", "bbox": {"l": 358.42596, "t": 321.46265, "r": 385.54236, "b": 323.20166, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": " viewer should note their own", "bbox": {"l": 358.42596, "t": 323.07285, "r": 382.98718, "b": 324.81189, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": " diopter ring position for the left", "bbox": {"l": 358.42596, "t": 324.68307000000004, "r": 385.06448, "b": 326.42209, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": " and right eyepieces, then before", "bbox": {"l": 358.42596, "t": 326.29327, "r": 385.20682, "b": 328.03232, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": " viewing set the diopter ring", "bbox": {"l": 358.42596, "t": 327.9035, "r": 382.21964, "b": 329.64252, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": " adjustments to that setting.", "bbox": {"l": 358.42596, "t": 329.5137, "r": 382.63382, "b": 331.25275, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "CHANGING THE BULB", "bbox": {"l": 358.42596, "t": 332.73412999999994, "r": 375.67661, "b": 334.47317999999996, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "1.", "bbox": {"l": 358.42596, "t": 334.34436, "r": 359.90311, "b": 336.08337, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "Disconnect the power cord from the", "bbox": {"l": 360.64169, "t": 334.34436, "r": 385.75333, "b": 336.08337, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": " electrical outlet.", "bbox": {"l": 358.42596, "t": 335.95456, "r": 372.01416, "b": 337.6936, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "2.", "bbox": {"l": 358.42596, "t": 337.56479, "r": 359.88327, "b": 339.3038, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "When the bulb is cool, remove the", "bbox": {"l": 360.61191, "t": 337.56479, "r": 384.65726, "b": 339.3038, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": " oblique illuminator cap and remove", "bbox": {"l": 358.42596, "t": 339.17499, "r": 385.33649, "b": 340.9140300000001, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": " the halogen bulb with cap.", "bbox": {"l": 358.42596, "t": 340.78522, "r": 379.57224, "b": 342.52423, "coord_origin": "TOPLEFT"}}, {"id": 201, "text": "3.", "bbox": {"l": 358.4274, "t": 342.39542, "r": 359.91788, "b": 344.13446000000005, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": "Replace with a new halogen bulb.", "bbox": {"l": 360.66312, "t": 342.39542, "r": 384.5108, "b": 344.13446000000005, "coord_origin": "TOPLEFT"}}, {"id": 203, "text": "4.", "bbox": {"l": 358.42883, "t": 344.00565000000006, "r": 359.92792, "b": 345.74466, "coord_origin": "TOPLEFT"}}, {"id": 204, "text": "Open the window in the base plate", "bbox": {"l": 360.67746, "t": 344.00565000000006, "r": 385.41235, "b": 345.74466, "coord_origin": "TOPLEFT"}}, {"id": 205, "text": " and replace the halogen lamp or", "bbox": {"l": 358.42883, "t": 345.61584, "r": 383.2782, "b": 347.35489, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": " fluorescent lamp of transmitted", "bbox": {"l": 358.42883, "t": 347.22607, "r": 383.13953, "b": 348.96509, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": " illuminator.", "bbox": {"l": 358.42883, "t": 348.83627, "r": 368.43472, "b": 350.57532, "coord_origin": "TOPLEFT"}}, {"id": 208, "text": "Model AY11230", "bbox": {"l": 326.59567, "t": 261.14185, "r": 339.11377, "b": 262.88091999999995, "coord_origin": "TOPLEFT"}}, {"id": 209, "text": "Model AY11234", "bbox": {"l": 358.48605, "t": 261.14185, "r": 371.00415, "b": 262.88091999999995, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": "14", "bbox": {"l": 455.43533, "t": 351.77038999999996, "r": 457.97827000000007, "b": 353.94415, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "Objectives", "bbox": {"l": 408.24518, "t": 275.52673000000004, "r": 414.4234, "b": 276.96020999999996, "coord_origin": "TOPLEFT"}}, {"id": 212, "text": "Revolving Turret", "bbox": {"l": 409.39554, "t": 268.98235999999997, "r": 419.06677, "b": 270.41583, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "Coarse ", "bbox": {"l": 441.3895, "t": 279.12627999999995, "r": 445.87192, "b": 280.55975, "coord_origin": "TOPLEFT"}}, {"id": 214, "text": "Adjustment", "bbox": {"l": 441.3895, "t": 280.30609, "r": 448.22338999999994, "b": 281.7395900000001, "coord_origin": "TOPLEFT"}}, {"id": 215, "text": "Knob", "bbox": {"l": 441.3895, "t": 281.48593, "r": 444.40371999999996, "b": 282.91939999999994, "coord_origin": "TOPLEFT"}}, {"id": 216, "text": "MODEL AY11236", "bbox": {"l": 398.79288, "t": 254.94646999999998, "r": 428.91568, "b": 258.85931000000005, "coord_origin": "TOPLEFT"}}, {"id": 217, "text": "MICROSCOPE USAGE", "bbox": {"l": 398.32535, "t": 305.04291, "r": 435.93542, "b": 308.95572000000004, "coord_origin": "TOPLEFT"}}, {"id": 218, "text": "BARSKA Model AY11236 is a powerful fixed power compound ", "bbox": {"l": 398.08594, "t": 310.35892, "r": 453.72171, "b": 312.53271, "coord_origin": "TOPLEFT"}}, {"id": 219, "text": "microscope designed for biological studies such as specimen ", "bbox": {"l": 398.08594, "t": 312.50586, "r": 453.09939999999995, "b": 314.67966, "coord_origin": "TOPLEFT"}}, {"id": 220, "text": "examination. It can also be used for examining bacteria and", "bbox": {"l": 398.08594, "t": 314.6528, "r": 456.65246999999994, "b": 316.8266, "coord_origin": "TOPLEFT"}}, {"id": 221, "text": "for general clinical and medical studies and other scientific uses. ", "bbox": {"l": 398.08594, "t": 316.79977, "r": 456.73859000000004, "b": 318.97354, "coord_origin": "TOPLEFT"}}, {"id": 222, "text": "CONSTRUCTION", "bbox": {"l": 398.62399, "t": 320.42941, "r": 427.77472, "b": 324.34222000000005, "coord_origin": "TOPLEFT"}}, {"id": 223, "text": "BARSKA Model AY11236 is a fixed power compound microscope.", "bbox": {"l": 398.08594, "t": 326.46069000000006, "r": 456.02639999999997, "b": 328.63449, "coord_origin": "TOPLEFT"}}, {"id": 224, "text": "It is constructed with two optical paths at the same angle. It is ", "bbox": {"l": 398.08414, "t": 328.6076699999999, "r": 455.42238999999995, "b": 330.7814599999999, "coord_origin": "TOPLEFT"}}, {"id": 225, "text": "equipped with transmitted illumination. By using this instrument, ", "bbox": {"l": 398.08414, "t": 330.75461, "r": 457.39844, "b": 332.92841, "coord_origin": "TOPLEFT"}}, {"id": 226, "text": "the user can observe specimens at magnification from 40x to ", "bbox": {"l": 398.08414, "t": 332.90155, "r": 453.97745, "b": 335.07535000000007, "coord_origin": "TOPLEFT"}}, {"id": 227, "text": "1000x by selecting the desired objective lens. Coarse and fine ", "bbox": {"l": 398.08414, "t": 335.04852, "r": 454.70708999999994, "b": 337.22232, "coord_origin": "TOPLEFT"}}, {"id": 228, "text": "focus adjustments provide accuracy and image detail. The rotating ", "bbox": {"l": 398.08414, "t": 337.19547, "r": 458.90240000000006, "b": 339.36926, "coord_origin": "TOPLEFT"}}, {"id": 229, "text": "head allows the user to position the eyepieces for maximum ", "bbox": {"l": 398.08594, "t": 339.34241, "r": 453.0672, "b": 341.5162, "coord_origin": "TOPLEFT"}}, {"id": 230, "text": "viewing comfort and easy access to all adjustment knobs.", "bbox": {"l": 398.08594, "t": 341.48938, "r": 449.63113, "b": 343.66318, "coord_origin": "TOPLEFT"}}, {"id": 231, "text": "Model AY11236", "bbox": {"l": 422.10626, "t": 301.24191, "r": 434.62433000000004, "b": 302.98096, "coord_origin": "TOPLEFT"}}, {"id": 232, "text": "Fine ", "bbox": {"l": 442.01610999999997, "t": 283.08649, "r": 444.8817399999999, "b": 284.51996, "coord_origin": "TOPLEFT"}}, {"id": 233, "text": "Adjustment", "bbox": {"l": 442.01610999999997, "t": 284.2663, "r": 448.85001, "b": 285.69980000000004, "coord_origin": "TOPLEFT"}}, {"id": 234, "text": "Knob", "bbox": {"l": 442.01610999999997, "t": 285.44611, "r": 445.03033000000005, "b": 286.87961, "coord_origin": "TOPLEFT"}}, {"id": 235, "text": "Stage", "bbox": {"l": 408.00577, "t": 279.12579000000005, "r": 411.42212, "b": 280.5593, "coord_origin": "TOPLEFT"}}, {"id": 236, "text": "Condenser ", "bbox": {"l": 404.07172, "t": 280.9144299999999, "r": 410.77707, "b": 282.3479, "coord_origin": "TOPLEFT"}}, {"id": 237, "text": "Focusing", "bbox": {"l": 404.07172, "t": 282.09424, "r": 409.2157, "b": 283.52774, "coord_origin": "TOPLEFT"}}, {"id": 238, "text": "Knob", "bbox": {"l": 404.07172, "t": 283.27408, "r": 407.08594, "b": 284.7075500000001, "coord_origin": "TOPLEFT"}}, {"id": 239, "text": "Eyepiece", "bbox": {"l": 441.81281, "t": 262.32178, "r": 447.03702, "b": 263.75525000000005, "coord_origin": "TOPLEFT"}}, {"id": 240, "text": "Stand", "bbox": {"l": 437.34607, "t": 271.13025000000005, "r": 440.80496, "b": 272.56281, "coord_origin": "TOPLEFT"}}, {"id": 241, "text": "Lamp ", "bbox": {"l": 409.7164, "t": 284.40027, "r": 413.3768, "b": 285.83282, "coord_origin": "TOPLEFT"}}, {"id": 242, "text": "On/Off", "bbox": {"l": 409.7164, "t": 285.83163, "r": 413.68201, "b": 287.26416, "coord_origin": "TOPLEFT"}}, {"id": 243, "text": "Switch", "bbox": {"l": 409.7164, "t": 287.263, "r": 413.6337, "b": 288.69553, "coord_origin": "TOPLEFT"}}, {"id": 244, "text": "Lamp ", "bbox": {"l": 434.8712499999999, "t": 296.7153, "r": 438.53164999999996, "b": 298.14783, "coord_origin": "TOPLEFT"}}, {"id": 245, "text": "Power", "bbox": {"l": 439.52039, "t": 292.18307000000004, "r": 443.08768, "b": 293.61560000000003, "coord_origin": "TOPLEFT"}}, {"id": 246, "text": "Cord", "bbox": {"l": 439.52039, "t": 293.61444, "r": 442.29575, "b": 295.04697, "coord_origin": "TOPLEFT"}}, {"id": 247, "text": "Rotating Head", "bbox": {"l": 413.55829, "t": 264.66089, "r": 421.94913, "b": 266.09344, "coord_origin": "TOPLEFT"}}, {"id": 248, "text": "Stage Clip", "bbox": {"l": 441.84316999999993, "t": 286.90573, "r": 447.87585000000007, "b": 288.33826, "coord_origin": "TOPLEFT"}}, {"id": 249, "text": "Adjustment", "bbox": {"l": 441.84316999999993, "t": 288.3371, "r": 448.67252, "b": 289.76962000000003, "coord_origin": "TOPLEFT"}}, {"id": 250, "text": "Interpupillary Slide Adjustment", "bbox": {"l": 407.2403, "t": 259.86645999999996, "r": 425.79089, "b": 261.29895, "coord_origin": "TOPLEFT"}}, {"id": 251, "text": "Circling Minimums", "bbox": {"l": 449.10074000000003, "t": 378.66302, "r": 466.08835000000005, "b": 380.78412, "coord_origin": "TOPLEFT"}}, {"id": 252, "text": "7", "bbox": {"l": 449.10074000000003, "t": 383.2203999999999, "r": 449.64444, "b": 385.34148999999996, "coord_origin": "TOPLEFT"}}, {"id": 253, "text": "K H U H Z D V D F K D Q J H W R W K H 7 ( 5 3 6 F U L W H U L D L Q W K D W D \u1087H F W V F L U F O L Q J D U H D G L P H Q V L R Q E \\ H [ S D Q G L Q J W K H D U H D V W R S U R Y L G H ", "bbox": {"l": 450.18811, "t": 383.2203999999999, "r": 550.77124, "b": 385.34148999999996, "coord_origin": "TOPLEFT"}}, {"id": 254, "text": "improved obstacle protection. To indicate that the new criteria had been applied to a given procedure, a ", "bbox": {"l": 449.10074000000003, "t": 385.75732, "r": 536.14716, "b": 387.87842, "coord_origin": "TOPLEFT"}}, {"id": 255, "text": " is placed on ", "bbox": {"l": 538.31085, "t": 385.75732, "r": 549.49921, "b": 387.87842, "coord_origin": "TOPLEFT"}}, {"id": 256, "text": "the circling line of minimums. The new circling tables and explanatory information is located in the Legend of the TPP.", "bbox": {"l": 449.10074000000003, "t": 388.03601, "r": 547.58185, "b": 390.1571, "coord_origin": "TOPLEFT"}}, {"id": 257, "text": "7", "bbox": {"l": 449.10074000000003, "t": 393.2128000000001, "r": 449.6163, "b": 395.33386, "coord_origin": "TOPLEFT"}}, {"id": 258, "text": "K H D S S U R D F K H V X V L Q J V W D Q G D U G F L U F O L Q J D S S U R D F K D U H D V F D Q E H L G H Q W L \u00bf H G E \\ W K H D E V H Q F H R I W K H ", "bbox": {"l": 450.1319, "t": 393.2128000000001, "r": 529.53082, "b": 395.33386, "coord_origin": "TOPLEFT"}}, {"id": 259, "text": " on the circling line of ", "bbox": {"l": 532.05829, "t": 393.2128000000001, "r": 550.42261, "b": 395.33386, "coord_origin": "TOPLEFT"}}, {"id": 260, "text": "minima.", "bbox": {"l": 449.10074000000003, "t": 395.49149, "r": 455.74692, "b": 397.61255, "coord_origin": "TOPLEFT"}}, {"id": 261, "text": "$ S S O \\ 6 W D Q G D U G & L U F O L Q J $ S S U R D F K 0 D Q H X Y H U L Q J 5 D G L X V 7 D E O H ", "bbox": {"l": 449.95525999999995, "t": 415.59549, "r": 496.2829, "b": 417.50446, "coord_origin": "TOPLEFT"}}, {"id": 262, "text": "$ S S O \\ ( [ S D Q G H G & L U F O L Q J $ S S U R D F K 0 D Q H X Y H U L Q J $ L U V S D F H 5 D G L X V ", "bbox": {"l": 501.13077, "t": 409.25543, "r": 551.16101, "b": 411.1644, "coord_origin": "TOPLEFT"}}, {"id": 263, "text": "Table", "bbox": {"l": 501.13077, "t": 411.30624, "r": 505.2477999999999, "b": 413.21521, "coord_origin": "TOPLEFT"}}, {"id": 264, "text": "AIRPORT SKETCH", "bbox": {"l": 449.10074000000003, "t": 420.18802, "r": 469.35599, "b": 422.73331, "coord_origin": "TOPLEFT"}}, {"id": 265, "text": "The airport sketch is a depiction of the airport with emphasis on runway pattern and related ", "bbox": {"l": 449.10074000000003, "t": 425.08908, "r": 525.93616, "b": 427.21017, "coord_origin": "TOPLEFT"}}, {"id": 266, "text": "information, positioned in either the lower left or lower right corner of the chart to aid pi-", "bbox": {"l": 449.10074000000003, "t": 427.3678, "r": 522.0343, "b": 429.48886, "coord_origin": "TOPLEFT"}}, {"id": 267, "text": "lot recognition of the airport from the air and to provide some information to aid on ground ", "bbox": {"l": 449.10074000000003, "t": 429.64648, "r": 524.67151, "b": 431.76755, "coord_origin": "TOPLEFT"}}, {"id": 268, "text": "navigation of the airport. The runways are drawn to scale and oriented to true north. Runway ", "bbox": {"l": 449.10074000000003, "t": 431.92514000000006, "r": 527.172, "b": 434.04623, "coord_origin": "TOPLEFT"}}, {"id": 269, "text": "dimensions (length and width) are shown for all active runways.", "bbox": {"l": 449.10074000000003, "t": 434.20383, "r": 502.39545, "b": 436.32492, "coord_origin": "TOPLEFT"}}, {"id": 270, "text": "Runway(s) are depicted based on what type and construction of the runway.", "bbox": {"l": 449.10074000000003, "t": 438.7611999999999, "r": 512.92676, "b": 440.88228999999995, "coord_origin": "TOPLEFT"}}, {"id": 271, "text": "Hard Surface", "bbox": {"l": 449.95525999999995, "t": 444.07001, "r": 460.02307, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}, {"id": 272, "text": "Other Than ", "bbox": {"l": 464.89963, "t": 444.07001, "r": 473.98819, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}, {"id": 273, "text": "Hard Surface", "bbox": {"l": 464.89963, "t": 446.12085, "r": 474.96744, "b": 448.02979, "coord_origin": "TOPLEFT"}}, {"id": 274, "text": "Metal Surface", "bbox": {"l": 478.91357, "t": 444.07001, "r": 489.45648, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}, {"id": 275, "text": "Closed Runway", "bbox": {"l": 493.06420999999995, "t": 444.07001, "r": 505.03076, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}, {"id": 276, "text": "Under Construction", "bbox": {"l": 509.5809, "t": 444.07001, "r": 524.30237, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}, {"id": 277, "text": "Stopways, ", "bbox": {"l": 449.95525999999995, "t": 454.81207, "r": 458.31406, "b": 456.72104, "coord_origin": "TOPLEFT"}}, {"id": 278, "text": "Taxiways, Park-", "bbox": {"l": 449.95525999999995, "t": 456.86288, "r": 461.92083999999994, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}}, {"id": 279, "text": "ing Areas", "bbox": {"l": 449.95525999999995, "t": 458.91373, "r": 457.08014, "b": 460.82268999999997, "coord_origin": "TOPLEFT"}}, {"id": 280, "text": "Displaced ", "bbox": {"l": 464.89963, "t": 454.81207, "r": 472.87732, "b": 456.72104, "coord_origin": "TOPLEFT"}}, {"id": 281, "text": "Threshold", "bbox": {"l": 464.89963, "t": 456.86288, "r": 472.49792, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}}, {"id": 282, "text": "Closed", "bbox": {"l": 478.91357, "t": 454.81207, "r": 483.61584, "b": 456.72104, "coord_origin": "TOPLEFT"}}, {"id": 283, "text": "Pavement", "bbox": {"l": 478.91357, "t": 456.86288, "r": 486.60754000000003, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}}, {"id": 284, "text": "Water Runway", "bbox": {"l": 493.06420999999995, "t": 454.81207, "r": 504.20648, "b": 456.72104, "coord_origin": "TOPLEFT"}}, {"id": 285, "text": "Taxiways and aprons are shaded grey. Other runway features that may be shown are runway numbers, runway dimen-", "bbox": {"l": 449.10074000000003, "t": 469.32974, "r": 548.59674, "b": 471.45081, "coord_origin": "TOPLEFT"}}, {"id": 286, "text": "sions, runway slope, arresting gear, and displaced threshold.", "bbox": {"l": 449.10074000000003, "t": 471.60843, "r": 500.08181999999994, "b": 473.72949, "coord_origin": "TOPLEFT"}}, {"id": 287, "text": "2", "bbox": {"l": 449.10074000000003, "t": 476.16577, "r": 449.59933000000007, "b": 478.28687, "coord_origin": "TOPLEFT"}}, {"id": 288, "text": "W K H U L Q I R U P D W L R Q F R Q F H U Q L Q J O L J K W L Q J \u00bf Q D O D S S U R D F K E H D U L Q J V D L U S R U W E H D F R Q R E V W D F O H V F R Q W U R O W R Z H U 1 $ 9 $ , ' V K H O L ", "bbox": {"l": 450.09796, "t": 476.16577, "r": 547.82562, "b": 478.28687, "coord_origin": "TOPLEFT"}}, {"id": 289, "text": "-", "bbox": {"l": 547.82623, "t": 476.16577, "r": 548.45862, "b": 478.28687, "coord_origin": "TOPLEFT"}}, {"id": 290, "text": "pads may also be shown.", "bbox": {"l": 449.10074000000003, "t": 478.44446, "r": 470.52609000000007, "b": 480.56555, "coord_origin": "TOPLEFT"}}, {"id": 291, "text": "$ L U S R U W ( O H Y D W L R Q D Q G 7 R X F K G R Z Q = R Q H ( O H Y D W L R Q ", "bbox": {"l": 449.10074000000003, "t": 483.00183, "r": 493.37906000000004, "b": 485.12292, "coord_origin": "TOPLEFT"}}, {"id": 292, "text": "The airport elevation is shown enclosed within a box in the upper left corner of the sketch box and the touchdown zone ", "bbox": {"l": 449.10074000000003, "t": 487.5592, "r": 549.16168, "b": 489.6803, "coord_origin": "TOPLEFT"}}, {"id": 293, "text": "elevation (TDZE) is shown in the upper right corner of the sketch box. The airport elevation is the highest point of an ", "bbox": {"l": 449.10074000000003, "t": 489.83789, "r": 546.90881, "b": 491.95898, "coord_origin": "TOPLEFT"}}, {"id": 294, "text": "D L U S R U W \u00b6 V X V D E O H U X Q Z D \\ V P H D V X U H G L Q I H H W I U R P P H D Q V H D O H Y H O 7 K H 7 ' = ( L V W K H K L J K H V W H O H Y D W L R Q L Q W K H \u00bf U V W I H H W R I ", "bbox": {"l": 449.10074000000003, "t": 492.11658, "r": 551.80023, "b": 494.23767, "coord_origin": "TOPLEFT"}}, {"id": 295, "text": "the landing surface. Circling only approaches will not show a TDZE.", "bbox": {"l": 449.10074000000003, "t": 494.39526, "r": 505.85068000000007, "b": 496.51636, "coord_origin": "TOPLEFT"}}, {"id": 296, "text": "114", "bbox": {"l": 498.80661000000003, "t": 515.9437, "r": 502.08792, "b": 519.01764, "coord_origin": "TOPLEFT"}}, {"id": 297, "text": "FAA Chart Users\u2019 Guide - Terminal Procedures Publication (TPP) - Terms", "bbox": {"l": 444.56319999999994, "t": 422.84869, "r": 446.25998, "b": 471.87128, "coord_origin": "TOPLEFT"}}, {"id": 298, "text": "AGL 2013 Financial Calendar", "bbox": {"l": 329.40536, "t": 379.37537, "r": 355.13138, "b": 382.13336, "coord_origin": "TOPLEFT"}}, {"id": 299, "text": "22", "bbox": {"l": 329.40536, "t": 382.30273, "r": 330.96848, "b": 384.55927, "coord_origin": "TOPLEFT"}}, {"id": 300, "text": "August 2012 ", "bbox": {"l": 331.75003, "t": 382.30273, "r": 341.12875, "b": 384.55927, "coord_origin": "TOPLEFT"}}, {"id": 301, "text": "2012 full year result and fi nal dividend announced", "bbox": {"l": 350.4722, "t": 382.30273, "r": 384.81079, "b": 384.55927, "coord_origin": "TOPLEFT"}}, {"id": 302, "text": "30", "bbox": {"l": 329.40536, "t": 384.84552, "r": 330.97336, "b": 387.10205, "coord_origin": "TOPLEFT"}}, {"id": 303, "text": "August 2012 ", "bbox": {"l": 331.75735, "t": 384.84552, "r": 341.16534, "b": 387.10205, "coord_origin": "TOPLEFT"}}, {"id": 304, "text": "Ex-dividend trading commences", "bbox": {"l": 350.4722, "t": 384.84552, "r": 372.90613, "b": 387.10205, "coord_origin": "TOPLEFT"}}, {"id": 305, "text": "5", "bbox": {"l": 329.40536, "t": 387.38828, "r": 330.20337, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}}, {"id": 306, "text": "September 2012 ", "bbox": {"l": 331.00137, "t": 387.38828, "r": 342.9715, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}}, {"id": 307, "text": "Record date for 2012 fi nal dividend", "bbox": {"l": 350.4722, "t": 387.38828, "r": 374.88693, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}}, {"id": 308, "text": "27", "bbox": {"l": 329.40536, "t": 389.93103, "r": 331.0173, "b": 392.18762, "coord_origin": "TOPLEFT"}}, {"id": 309, "text": "September 2012 ", "bbox": {"l": 331.82327, "t": 389.93103, "r": 343.91284, "b": 392.18762, "coord_origin": "TOPLEFT"}}, {"id": 310, "text": "Final dividend payable", "bbox": {"l": 350.4722, "t": 389.93103, "r": 365.65988, "b": 392.18762, "coord_origin": "TOPLEFT"}}, {"id": 311, "text": "23", "bbox": {"l": 329.40536, "t": 392.47382, "r": 330.98804, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}}, {"id": 312, "text": "October 2012 ", "bbox": {"l": 331.77936, "t": 392.47382, "r": 342.06674, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}}, {"id": 313, "text": "Annual General Meeting", "bbox": {"l": 350.4722, "t": 392.47382, "r": 367.22156, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}}, {"id": 314, "text": "27", "bbox": {"l": 329.40536, "t": 395.0166, "r": 330.99741, "b": 397.27313, "coord_origin": "TOPLEFT"}}, {"id": 315, "text": "February 2013", "bbox": {"l": 331.7934, "t": 395.0166, "r": 342.1416, "b": 397.27313, "coord_origin": "TOPLEFT"}}, {"id": 316, "text": " 1", "bbox": {"l": 342.64841, "t": 395.18298, "r": 342.65811, "b": 396.49857000000003, "coord_origin": "TOPLEFT"}}, {"id": 317, "text": "2013 interim result and interim dividend announced", "bbox": {"l": 350.47177, "t": 395.01474, "r": 386.25897, "b": 397.2713, "coord_origin": "TOPLEFT"}}, {"id": 318, "text": "28", "bbox": {"l": 329.40491, "t": 397.55749999999995, "r": 331.02695, "b": 399.81406, "coord_origin": "TOPLEFT"}}, {"id": 319, "text": "August 2013", "bbox": {"l": 331.83795, "t": 397.55749999999995, "r": 340.75909, "b": 399.81406, "coord_origin": "TOPLEFT"}}, {"id": 320, "text": " 1", "bbox": {"l": 341.26437, "t": 397.7254, "r": 341.27408, "b": 399.04095, "coord_origin": "TOPLEFT"}}, {"id": 321, "text": "2013 full year results and fi nal dividend announced ", "bbox": {"l": 350.47144, "t": 397.55713, "r": 385.93265, "b": 399.81369, "coord_origin": "TOPLEFT"}}, {"id": 322, "text": "1", "bbox": {"l": 329.40536, "t": 400.46155, "r": 329.87708, "b": 401.96588, "coord_origin": "TOPLEFT"}}, {"id": 323, "text": "Indicative dates only, subject to change/Board confi rmation", "bbox": {"l": 330.34882, "t": 400.46155, "r": 358.65204, "b": 401.96588, "coord_origin": "TOPLEFT"}}, {"id": 324, "text": "AGL\u2019s Annual General Meeting will be held at the City Recital Hall, Angel Place, Sydney ", "bbox": {"l": 329.40536, "t": 404.34503, "r": 391.771, "b": 406.60156, "coord_origin": "TOPLEFT"}}, {"id": 325, "text": "commencing at 10.30am on Tuesday 23 October 2012.", "bbox": {"l": 329.40536, "t": 406.37857, "r": 369.65308, "b": 408.63513000000006, "coord_origin": "TOPLEFT"}}, {"id": 326, "text": "Ye s te rd ay", "bbox": {"l": 363.54486, "t": 460.53054999999995, "r": 379.25955, "b": 465.54507, "coord_origin": "TOPLEFT"}}, {"id": 327, "text": "Established in Sydney in 1837, and then ", "bbox": {"l": 363.54486, "t": 466.7157, "r": 391.38229, "b": 468.97223, "coord_origin": "TOPLEFT"}}, {"id": 328, "text": "known as The Australian Gas Light Company, ", "bbox": {"l": 363.54486, "t": 468.74924, "r": 395.01788, "b": 471.00577, "coord_origin": "TOPLEFT"}}, {"id": 329, "text": "the AGL business has an established history ", "bbox": {"l": 363.54486, "t": 470.78281, "r": 394.08322, "b": 473.03934, "coord_origin": "TOPLEFT"}}, {"id": 330, "text": "and reputation for serving the gas and ", "bbox": {"l": 363.54486, "t": 472.81635, "r": 390.60727, "b": 475.07288, "coord_origin": "TOPLEFT"}}, {"id": 331, "text": "electricity needs of Australian households. ", "bbox": {"l": 363.54486, "t": 474.84988, "r": 393.49612, "b": 477.10645, "coord_origin": "TOPLEFT"}}, {"id": 332, "text": "In 1841, when AGL supplied the gas to light ", "bbox": {"l": 363.54486, "t": 476.88345, "r": 394.11481, "b": 479.13998, "coord_origin": "TOPLEFT"}}, {"id": 333, "text": "the fi rst public street lamp, it was reported ", "bbox": {"l": 363.54486, "t": 478.91699, "r": 393.75891, "b": 481.17352, "coord_origin": "TOPLEFT"}}, {"id": 334, "text": "in the Sydney Gazette as a \u201cwonderful ", "bbox": {"l": 363.54486, "t": 480.95053, "r": 390.4975, "b": 483.20709, "coord_origin": "TOPLEFT"}}, {"id": 335, "text": "achievement of scientifi c knowledge, assisted ", "bbox": {"l": 363.54486, "t": 482.9841, "r": 395.70975, "b": 485.24063, "coord_origin": "TOPLEFT"}}, {"id": 336, "text": "by mechanical ingenuity.\u201d Within two years, ", "bbox": {"l": 363.54486, "t": 485.01764, "r": 394.27283, "b": 487.2742, "coord_origin": "TOPLEFT"}}, {"id": 337, "text": "165 gas lamps were lighting the City of Sydney.", "bbox": {"l": 363.54486, "t": 487.05121, "r": 396.65939, "b": 489.30774, "coord_origin": "TOPLEFT"}}, {"id": 338, "text": "Looking back on ", "bbox": {"l": 329.4054, "t": 419.93124, "r": 384.19696, "b": 431.09412, "coord_origin": "TOPLEFT"}}, {"id": 339, "text": "175 years of ", "bbox": {"l": 329.4054, "t": 430.10379, "r": 372.16626, "b": 441.26669, "coord_origin": "TOPLEFT"}}, {"id": 340, "text": "looking forward.", "bbox": {"l": 329.4054, "t": 440.27636999999993, "r": 385.3981, "b": 451.43924, "coord_origin": "TOPLEFT"}}, {"id": 341, "text": "AGL Energy Limited ABN 74 115 061 375", "bbox": {"l": 329.40536, "t": 372.16159, "r": 353.36179, "b": 373.91669, "coord_origin": "TOPLEFT"}}, {"id": 342, "text": "29", "bbox": {"l": 546.20587, "t": 360.90448, "r": 548.23407, "b": 362.82242, "coord_origin": "TOPLEFT"}}, {"id": 343, "text": "signs, signals and road markings", "bbox": {"l": 497.77728, "t": 251.43384000000003, "r": 542.8255, "b": 254.94385, "coord_origin": "TOPLEFT"}}, {"id": 344, "text": "3", "bbox": {"l": 490.30679, "t": 251.47478999999998, "r": 492.09982, "b": 254.98479999999995, "coord_origin": "TOPLEFT"}}, {"id": 345, "text": "In ", "bbox": {"l": 498.15335, "t": 263.88922, "r": 500.05637, "b": 265.92719, "coord_origin": "TOPLEFT"}}, {"id": 346, "text": "chapter 2, you and your vehicle", "bbox": {"l": 500.05637, "t": 263.85717999999997, "r": 524.37036, "b": 265.86310000000003, "coord_origin": "TOPLEFT"}}, {"id": 347, "text": ", you learned about ", "bbox": {"l": 524.37036, "t": 263.88922, "r": 539.89124, "b": 265.92719, "coord_origin": "TOPLEFT"}}, {"id": 348, "text": "some of the controls in your vehicle. This chapter is a handy ", "bbox": {"l": 498.15335, "t": 265.93224999999995, "r": 544.50403, "b": 267.97020999999995, "coord_origin": "TOPLEFT"}}, {"id": 349, "text": "reference section that gives examples of the most common ", "bbox": {"l": 498.15335, "t": 267.97533999999996, "r": 544.01343, "b": 270.01331000000005, "coord_origin": "TOPLEFT"}}, {"id": 350, "text": "signs, signals and road markings that keep traffi c organized ", "bbox": {"l": 498.15335, "t": 270.01831000000004, "r": 544.11987, "b": 272.05634, "coord_origin": "TOPLEFT"}}, {"id": 351, "text": "and flowing smoothly. ", "bbox": {"l": 498.15335, "t": 272.06140000000005, "r": 515.41071, "b": 274.09937, "coord_origin": "TOPLEFT"}}, {"id": 352, "text": "Signs", "bbox": {"l": 498.15335, "t": 277.34619, "r": 505.64642000000003, "b": 280.9357, "coord_origin": "TOPLEFT"}}, {"id": 353, "text": "There are three ways to read signs: by their shape, colour and ", "bbox": {"l": 498.15335, "t": 281.82187, "r": 543.92957, "b": 283.85983, "coord_origin": "TOPLEFT"}}, {"id": 354, "text": "the messages printed on them. Understanding these three ways ", "bbox": {"l": 498.15335, "t": 283.8649, "r": 545.67834, "b": 285.90289, "coord_origin": "TOPLEFT"}}, {"id": 355, "text": "of classifying signs will help you figure out the meaning of signs ", "bbox": {"l": 498.15335, "t": 285.90796, "r": 545.26471, "b": 287.94592, "coord_origin": "TOPLEFT"}}, {"id": 356, "text": "that are new to you. ", "bbox": {"l": 498.15335, "t": 287.95099, "r": 513.31335, "b": 289.98895, "coord_origin": "TOPLEFT"}}, {"id": 357, "text": "Stop", "bbox": {"l": 505.43439, "t": 303.07596, "r": 508.53033000000005, "b": 304.89639, "coord_origin": "TOPLEFT"}}, {"id": 358, "text": "Yield the right-of-way", "bbox": {"l": 527.45502, "t": 303.25354, "r": 541.44678, "b": 305.07397, "coord_origin": "TOPLEFT"}}, {"id": 359, "text": "Shows driving", "bbox": {"l": 501.79385, "t": 321.18973, "r": 510.41632, "b": 323.01016, "coord_origin": "TOPLEFT"}}, {"id": 360, "text": "regulations", "bbox": {"l": 501.79385, "t": 322.87731999999994, "r": 509.04268999999994, "b": 324.69775000000004, "coord_origin": "TOPLEFT"}}, {"id": 361, "text": "Explains lane use", "bbox": {"l": 518.66455, "t": 319.59146, "r": 529.80902, "b": 321.41190000000006, "coord_origin": "TOPLEFT"}}, {"id": 362, "text": "School zone signs ", "bbox": {"l": 534.87561, "t": 318.37616, "r": 546.95142, "b": 320.19659, "coord_origin": "TOPLEFT"}}, {"id": 363, "text": "are fl uorescent ", "bbox": {"l": 534.87561, "t": 320.0637500000001, "r": 545.05762, "b": 321.88419, "coord_origin": "TOPLEFT"}}, {"id": 364, "text": "yellow-green", "bbox": {"l": 534.87561, "t": 321.75134, "r": 543.32263, "b": 323.57178, "coord_origin": "TOPLEFT"}}, {"id": 365, "text": "Tells about motorist ", "bbox": {"l": 499.21862999999996, "t": 338.12772, "r": 512.62451, "b": 339.94815, "coord_origin": "TOPLEFT"}}, {"id": 366, "text": "services", "bbox": {"l": 499.21862999999996, "t": 339.81531000000007, "r": 504.39917, "b": 341.63574, "coord_origin": "TOPLEFT"}}, {"id": 367, "text": "Shows a permitted ", "bbox": {"l": 516.97748, "t": 338.06039, "r": 529.77484, "b": 339.88082999999995, "coord_origin": "TOPLEFT"}}, {"id": 368, "text": "action", "bbox": {"l": 516.97748, "t": 339.74799, "r": 520.96399, "b": 341.56842, "coord_origin": "TOPLEFT"}}, {"id": 369, "text": "Shows an action that ", "bbox": {"l": 534.55847, "t": 337.88281, "r": 548.58453, "b": 339.7032500000001, "coord_origin": "TOPLEFT"}}, {"id": 370, "text": "is not permitted", "bbox": {"l": 534.55847, "t": 339.57040000000006, "r": 545.08862, "b": 341.39084, "coord_origin": "TOPLEFT"}}, {"id": 371, "text": "Warns of hazards ", "bbox": {"l": 483.05853, "t": 356.17416, "r": 494.72577, "b": 357.9946, "coord_origin": "TOPLEFT"}}, {"id": 372, "text": "ahead", "bbox": {"l": 483.05853, "t": 357.86179, "r": 487.07525999999996, "b": 359.68222, "coord_origin": "TOPLEFT"}}, {"id": 373, "text": "Warns of", "bbox": {"l": 499.39645, "t": 356.26297000000005, "r": 504.69171, "b": 358.0834, "coord_origin": "TOPLEFT"}}, {"id": 374, "text": "construction zones", "bbox": {"l": 499.39645, "t": 357.95056, "r": 511.69116, "b": 359.77099999999996, "coord_origin": "TOPLEFT"}}, {"id": 375, "text": "Railway crossing", "bbox": {"l": 516.75891, "t": 356.26297000000005, "r": 527.42938, "b": 358.0834, "coord_origin": "TOPLEFT"}}, {"id": 376, "text": "Shows distance and ", "bbox": {"l": 534.5141, "t": 352.92981, "r": 547.89862, "b": 354.75024, "coord_origin": "TOPLEFT"}}, {"id": 377, "text": "direction", "bbox": {"l": 534.5141, "t": 354.6174, "r": 540.2818, "b": 356.43784, "coord_origin": "TOPLEFT"}}, {"id": 378, "text": "\u2022", "bbox": {"l": 478.37466, "t": 270.14075, "r": 479.14251999999993, "b": 272.17877, "coord_origin": "TOPLEFT"}}, {"id": 379, "text": "Signs", "bbox": {"l": 479.91036999999994, "t": 270.14075, "r": 483.74963, "b": 272.17877, "coord_origin": "TOPLEFT"}}, {"id": 380, "text": "- regulatory signs", "bbox": {"l": 479.97293, "t": 272.84717, "r": 492.31219, "b": 274.34888, "coord_origin": "TOPLEFT"}}, {"id": 381, "text": "- school, ", "bbox": {"l": 479.97293, "t": 275.14513999999997, "r": 486.72598000000005, "b": 276.64679, "coord_origin": "TOPLEFT"}}, {"id": 382, "text": "playground and ", "bbox": {"l": 481.21602999999993, "t": 276.77972, "r": 492.93286000000006, "b": 278.81768999999997, "coord_origin": "TOPLEFT"}}, {"id": 383, "text": "crosswalk signs", "bbox": {"l": 481.21602999999993, "t": 278.82275000000004, "r": 491.82938000000007, "b": 280.86075, "coord_origin": "TOPLEFT"}}, {"id": 384, "text": "- lane use signs", "bbox": {"l": 479.97293, "t": 281.52759, "r": 491.00775000000004, "b": 283.02924, "coord_origin": "TOPLEFT"}}, {"id": 385, "text": "- turn control signs", "bbox": {"l": 479.97293, "t": 283.82556, "r": 493.32748, "b": 285.3272099999999, "coord_origin": "TOPLEFT"}}, {"id": 386, "text": "- parking signs", "bbox": {"l": 479.97293, "t": 286.1235, "r": 490.4915199999999, "b": 287.62518, "coord_origin": "TOPLEFT"}}, {"id": 387, "text": "- reserved lane ", "bbox": {"l": 479.97293, "t": 288.42148, "r": 491.17004000000003, "b": 289.92316, "coord_origin": "TOPLEFT"}}, {"id": 388, "text": "signs", "bbox": {"l": 481.21602999999993, "t": 290.05605999999995, "r": 484.77405000000005, "b": 292.09406, "coord_origin": "TOPLEFT"}}, {"id": 389, "text": "- warning signs", "bbox": {"l": 479.97293, "t": 292.76169000000004, "r": 490.83398, "b": 294.26334, "coord_origin": "TOPLEFT"}}, {"id": 390, "text": "- object markers", "bbox": {"l": 479.97293, "t": 295.05963, "r": 491.62692, "b": 296.56131, "coord_origin": "TOPLEFT"}}, {"id": 391, "text": "- construction ", "bbox": {"l": 479.97293, "t": 297.3576, "r": 490.37341, "b": 298.8592499999999, "coord_origin": "TOPLEFT"}}, {"id": 392, "text": "signs", "bbox": {"l": 481.21602999999993, "t": 298.99219, "r": 484.77405000000005, "b": 301.03015, "coord_origin": "TOPLEFT"}}, {"id": 393, "text": "- information and ", "bbox": {"l": 479.97293, "t": 301.69780999999995, "r": 492.93912, "b": 303.19946, "coord_origin": "TOPLEFT"}}, {"id": 394, "text": "destination signs", "bbox": {"l": 481.21602999999993, "t": 303.3324, "r": 493.00525, "b": 305.37036, "coord_origin": "TOPLEFT"}}, {"id": 395, "text": "- railway signs", "bbox": {"l": 479.97293, "t": 306.0379899999999, "r": 489.99047999999993, "b": 307.53967, "coord_origin": "TOPLEFT"}}, {"id": 396, "text": "\u2022", "bbox": {"l": 478.375, "t": 308.24789, "r": 479.1032400000001, "b": 310.28586, "coord_origin": "TOPLEFT"}}, {"id": 397, "text": "Signals", "bbox": {"l": 479.83151, "t": 308.24789, "r": 484.92925999999994, "b": 310.28586, "coord_origin": "TOPLEFT"}}, {"id": 398, "text": "- lane control ", "bbox": {"l": 479.97293, "t": 310.95358, "r": 490.00091999999995, "b": 312.45526, "coord_origin": "TOPLEFT"}}, {"id": 399, "text": "signals", "bbox": {"l": 481.21602999999993, "t": 312.5881999999999, "r": 485.95331, "b": 314.62616, "coord_origin": "TOPLEFT"}}, {"id": 400, "text": "- traffic lights", "bbox": {"l": 479.97293, "t": 315.29379, "r": 489.29876999999993, "b": 316.79544, "coord_origin": "TOPLEFT"}}, {"id": 401, "text": "\u2022", "bbox": {"l": 478.375, "t": 317.50366, "r": 479.18129999999996, "b": 319.5416599999999, "coord_origin": "TOPLEFT"}}, {"id": 402, "text": "Road markings", "bbox": {"l": 479.98761, "t": 317.50366, "r": 490.46960000000007, "b": 319.5416599999999, "coord_origin": "TOPLEFT"}}, {"id": 403, "text": "- yellow lines", "bbox": {"l": 479.97293, "t": 320.20938, "r": 489.26166000000006, "b": 321.71103, "coord_origin": "TOPLEFT"}}, {"id": 404, "text": "- white lines", "bbox": {"l": 479.97293, "t": 322.50732, "r": 488.59189, "b": 324.009, "coord_origin": "TOPLEFT"}}, {"id": 405, "text": "- reserved lane ", "bbox": {"l": 479.97293, "t": 324.8053, "r": 491.17004000000003, "b": 326.30698, "coord_origin": "TOPLEFT"}}, {"id": 406, "text": "markings", "bbox": {"l": 481.21602999999993, "t": 326.43988, "r": 487.58978, "b": 328.47784, "coord_origin": "TOPLEFT"}}, {"id": 407, "text": "- other markings", "bbox": {"l": 479.97293, "t": 329.14551, "r": 491.75177, "b": 330.64716, "coord_origin": "TOPLEFT"}}, {"id": 408, "text": "in this chapter", "bbox": {"l": 478.15246999999994, "t": 265.07030999999995, "r": 493.75586, "b": 268.06872999999996, "coord_origin": "TOPLEFT"}}], "children": [{"id": 32, "label": "text", "bbox": {"l": 327.86951, "t": 351.78085, "r": 330.41248, "b": 353.95465, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "13", "bbox": {"l": 327.86951, "t": 351.78085, "r": 330.41248, "b": 353.95465, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 327.83005, "t": 331.57268999999997, "r": 351.16092, "b": 333.31171, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "USING THE VERTICAL TUBE -", "bbox": {"l": 327.83005, "t": 331.57268999999997, "r": 351.16092, "b": 333.31171, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 327.83005, "t": 333.18292, "r": 348.30536, "b": 334.92194, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "MODELS AY11230/11234", "bbox": {"l": 327.83005, "t": 333.18292, "r": 348.30536, "b": 334.92194, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 327.83005, "t": 336.40439, "r": 329.05914, "b": 337.92606, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "1.", "bbox": {"l": 327.83005, "t": 336.40439, "r": 329.05914, "b": 337.92606, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 329.67368, "t": 336.40439, "r": 349.95349, "b": 337.92606, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "The vertical tube can be used for", "bbox": {"l": 329.67368, "t": 336.40439, "r": 349.95349, "b": 337.92606, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 329.11752, "t": 337.83588, "r": 353.57977, "b": 339.35751000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "instructional viewing or to photograph", "bbox": {"l": 329.11752, "t": 337.83588, "r": 353.57977, "b": 339.35751000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 327.77121, "t": 339.26736, "r": 352.4306, "b": 340.789, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": " the image with a digital camera or a", "bbox": {"l": 327.77121, "t": 339.26736, "r": 352.4306, "b": 340.789, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 328.15176, "t": 340.69882, "r": 337.91086, "b": 342.22049, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": " micro TV unit", "bbox": {"l": 328.15176, "t": 340.69882, "r": 337.91086, "b": 342.22049, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 327.8313, "t": 342.19043000000005, "r": 329.09155, "b": 343.71207, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "2.", "bbox": {"l": 327.8313, "t": 342.19043000000005, "r": 329.09155, "b": 343.71207, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 329.72168, "t": 342.19043000000005, "r": 354.9267, "b": 343.71207, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "Loosen the retention screw, then rotate ", "bbox": {"l": 329.72168, "t": 342.19043000000005, "r": 354.9267, "b": 343.71207, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 327.8313, "t": 343.62192, "r": 351.66949, "b": 345.14355, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": " the adjustment ring to change the ", "bbox": {"l": 327.8313, "t": 343.62192, "r": 351.66949, "b": 345.14355, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 328.21185, "t": 345.05338, "r": 346.33179, "b": 346.57504, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": " length of the vertical tube.", "bbox": {"l": 328.21185, "t": 345.05338, "r": 346.33179, "b": 346.57504, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 327.83005, "t": 346.84680000000003, "r": 329.12726, "b": 348.36847, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "3.", "bbox": {"l": 327.83005, "t": 346.84680000000003, "r": 329.12726, "b": 348.36847, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 329.77588, "t": 346.84680000000003, "r": 351.18005, "b": 348.36847, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "Make sure that both the images in", "bbox": {"l": 329.77588, "t": 346.84680000000003, "r": 351.18005, "b": 348.36847, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 327.25311, "t": 254.94812000000002, "r": 350.07861, "b": 258.86096, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "OPERATION ", "bbox": {"l": 327.25311, "t": 254.94812000000002, "r": 350.07861, "b": 258.86096, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 350.07861, "t": 254.76782000000003, "r": 351.82651, "b": 258.68066, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "(", "bbox": {"l": 350.07861, "t": 254.76782000000003, "r": 351.82651, "b": 258.68066, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 351.82651, "t": 254.94812000000002, "r": 360.85242, "b": 258.86096, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "cont.", "bbox": {"l": 351.82651, "t": 254.94812000000002, "r": 360.85242, "b": 258.86096, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 360.85242, "t": 254.76782000000003, "r": 362.60028, "b": 258.68066, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": ")", "bbox": {"l": 360.85242, "t": 254.76782000000003, "r": 362.60028, "b": 258.68066, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 326.88037, "t": 263.49492999999995, "r": 345.84351, "b": 265.23395000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "SELECTING OBJECTIVE ", "bbox": {"l": 326.88037, "t": 263.49492999999995, "r": 345.84351, "b": 265.23395000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 326.88037, "t": 265.10515999999996, "r": 340.54153, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "MAGNIFICATION", "bbox": {"l": 326.88037, "t": 265.10515999999996, "r": 340.54153, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 326.88037, "t": 266.71533, "r": 328.31903, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "1.", "bbox": {"l": 326.88037, "t": 266.71533, "r": 328.31903, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 329.03836, "t": 266.71533, "r": 354.21472, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "There are two objectives. The lower", "bbox": {"l": 329.03836, "t": 266.71533, "r": 354.21472, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 326.88037, "t": 268.32556, "r": 355.19193, "b": 270.06458, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": " magnification objective has a greater", "bbox": {"l": 326.88037, "t": 268.32556, "r": 355.19193, "b": 270.06458, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 326.88037, "t": 269.93579, "r": 345.80057, "b": 271.6748, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": " depth of field and view.", "bbox": {"l": 326.88037, "t": 269.93579, "r": 345.80057, "b": 271.6748, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 326.88037, "t": 271.54602, "r": 328.33862, "b": 273.28503, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "2.", "bbox": {"l": 326.88037, "t": 271.54602, "r": 328.33862, "b": 273.28503, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 329.06775, "t": 271.54602, "r": 352.39969, "b": 273.28503, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "In order to observe the specimen", "bbox": {"l": 329.06775, "t": 271.54602, "r": 352.39969, "b": 273.28503, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 326.88037, "t": 273.15619000000004, "r": 352.90042, "b": 274.89526, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": " easily use the lower magnification", "bbox": {"l": 326.88037, "t": 273.15619000000004, "r": 352.90042, "b": 274.89526, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 326.88037, "t": 274.76642000000004, "r": 354.59546, "b": 276.50543000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": " objective first. Then, by rotating the", "bbox": {"l": 326.88037, "t": 274.76642000000004, "r": 354.59546, "b": 276.50543000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 326.88037, "t": 276.37665000000004, "r": 350.81885, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": " case, the magnification can be", "bbox": {"l": 326.88037, "t": 276.37665000000004, "r": 350.81885, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 326.88037, "t": 277.98688000000004, "r": 335.46707, "b": 279.72589000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": " changed.", "bbox": {"l": 326.88037, "t": 277.98688000000004, "r": 335.46707, "b": 279.72589000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 326.88037, "t": 281.20728, "r": 354.57755, "b": 282.94632, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 107, "text": "CHANGING THE INTERPUPILLARY ", "bbox": {"l": 326.88037, "t": 281.20728, "r": 354.57755, "b": 282.94632, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 326.88037, "t": 282.81750000000005, "r": 335.1752, "b": 284.55652, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 108, "text": "DISTANCE", "bbox": {"l": 326.88037, "t": 282.81750000000005, "r": 335.1752, "b": 284.55652, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 326.88037, "t": 284.4277, "r": 328.34784, "b": 286.16675, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 109, "text": "1.", "bbox": {"l": 326.88037, "t": 284.4277, "r": 328.34784, "b": 286.16675, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 329.08157, "t": 284.4277, "r": 354.76245, "b": 286.16675, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 110, "text": "The distance between the observer's", "bbox": {"l": 329.08157, "t": 284.4277, "r": 354.76245, "b": 286.16675, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 326.88037, "t": 286.03793, "r": 354.6499, "b": 287.77695, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 111, "text": " pupils is the interpupillary distance.", "bbox": {"l": 326.88037, "t": 286.03793, "r": 354.6499, "b": 287.77695, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 326.88037, "t": 287.64813, "r": 328.25125, "b": 289.38718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 112, "text": "2.", "bbox": {"l": 326.88037, "t": 287.64813, "r": 328.25125, "b": 289.38718, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 328.93671, "t": 287.64813, "r": 354.29825, "b": 289.38718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 113, "text": "To adjust the interpupillary distance", "bbox": {"l": 328.93671, "t": 287.64813, "r": 354.29825, "b": 289.38718, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 326.88181, "t": 289.25836, "r": 355.02075, "b": 290.99738, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 114, "text": " rotate the prism caps until both eyes", "bbox": {"l": 326.88181, "t": 289.25836, "r": 355.02075, "b": 290.99738, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 326.88181, "t": 290.86855999999995, "r": 350.82028, "b": 292.6076, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 115, "text": " coincide with the image in the", "bbox": {"l": 326.88181, "t": 290.86855999999995, "r": 350.82028, "b": 292.6076, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 326.88181, "t": 292.47879, "r": 336.2067, "b": 294.2178, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 116, "text": " eyepiece. ", "bbox": {"l": 326.88181, "t": 292.47879, "r": 336.2067, "b": 294.2178, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 326.88181, "t": 295.69922, "r": 335.3941, "b": 297.43823, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 117, "text": "FOCUSING", "bbox": {"l": 326.88181, "t": 295.69922, "r": 335.3941, "b": 297.43823, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 326.88181, "t": 297.30942, "r": 328.34314, "b": 299.04846, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 118, "text": "1.", "bbox": {"l": 326.88181, "t": 297.30942, "r": 328.34314, "b": 299.04846, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 329.07379, "t": 297.30942, "r": 353.18555, "b": 299.04846, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 119, "text": "Remove the lens protective cover.", "bbox": {"l": 329.07379, "t": 297.30942, "r": 353.18555, "b": 299.04846, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 326.88324, "t": 298.91965, "r": 328.35919, "b": 300.65866, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 120, "text": "2.", "bbox": {"l": 326.88324, "t": 298.91965, "r": 328.35919, "b": 300.65866, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 329.0972, "t": 298.91965, "r": 353.45065, "b": 300.65866, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 121, "text": "Place the specimen on the working", "bbox": {"l": 329.0972, "t": 298.91965, "r": 353.45065, "b": 300.65866, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 326.88324, "t": 300.52985, "r": 333.32825, "b": 302.26889000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 122, "text": " stage.", "bbox": {"l": 326.88324, "t": 300.52985, "r": 333.32825, "b": 302.26889000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 326.88324, "t": 302.14008000000007, "r": 328.31296, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 123, "text": "3.", "bbox": {"l": 326.88324, "t": 302.14008000000007, "r": 328.31296, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 329.02783, "t": 302.14008000000007, "r": 354.76303, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 124, "text": "Focus the specimen with the left eye", "bbox": {"l": 329.02783, "t": 302.14008000000007, "r": 354.76303, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 326.88324, "t": 303.75027, "r": 355.96307, "b": 305.48932, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 125, "text": " first while turning the focus knob until", "bbox": {"l": 326.88324, "t": 303.75027, "r": 355.96307, "b": 305.48932, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 326.88324, "t": 305.3605, "r": 354.46594, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 126, "text": " the image appears clear and sharp.", "bbox": {"l": 326.88324, "t": 305.3605, "r": 354.46594, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 326.88324, "t": 306.9707, "r": 328.25488, "b": 308.70975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 127, "text": "4.", "bbox": {"l": 326.88324, "t": 306.9707, "r": 328.25488, "b": 308.70975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 328.9407, "t": 306.9707, "r": 356.37335, "b": 308.70975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 128, "text": "Rotate the right eyepiece ring until the", "bbox": {"l": 328.9407, "t": 306.9707, "r": 356.37335, "b": 308.70975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 326.88324, "t": 308.58093, "r": 355.38867, "b": 310.31995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 129, "text": " images in each eyepiece coincide and", "bbox": {"l": 326.88324, "t": 308.58093, "r": 355.38867, "b": 310.31995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 326.88324, "t": 310.19113, "r": 343.17249, "b": 311.93018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 130, "text": " are sharp and clear.", "bbox": {"l": 326.88324, "t": 310.19113, "r": 343.17249, "b": 311.93018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 326.88324, "t": 313.41156, "r": 344.13388, "b": 315.15059999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 131, "text": "CHANGING THE BULB", "bbox": {"l": 326.88324, "t": 313.41156, "r": 344.13388, "b": 315.15059999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 326.88324, "t": 315.02178999999995, "r": 328.37418, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 132, "text": "1.", "bbox": {"l": 326.88324, "t": 315.02178999999995, "r": 328.37418, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 329.11963, "t": 315.02178999999995, "r": 348.50162, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 133, "text": "Disconnect the power cord.", "bbox": {"l": 329.11963, "t": 315.02178999999995, "r": 348.50162, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 326.88324, "t": 316.63199, "r": 328.34061, "b": 318.37103, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 134, "text": "2.", "bbox": {"l": 326.88324, "t": 316.63199, "r": 328.34061, "b": 318.37103, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 329.06931, "t": 316.63199, "r": 353.11588, "b": 318.37103, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 135, "text": "When the bulb is cool, remove the", "bbox": {"l": 329.06931, "t": 316.63199, "r": 353.11588, "b": 318.37103, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 326.88464, "t": 318.2422199999999, "r": 353.79517, "b": 319.9812299999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 136, "text": " oblique illuminator cap and remove", "bbox": {"l": 326.88464, "t": 318.2422199999999, "r": 353.79517, "b": 319.9812299999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 326.88464, "t": 319.85242000000005, "r": 348.02094, "b": 321.59146, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 137, "text": " the halogen bulb with cap.", "bbox": {"l": 326.88464, "t": 319.85242000000005, "r": 348.02094, "b": 321.59146, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 326.88464, "t": 321.46265, "r": 328.37512, "b": 323.20166, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 138, "text": "3.", "bbox": {"l": 326.88464, "t": 321.46265, "r": 328.37512, "b": 323.20166, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 329.12036, "t": 321.46265, "r": 352.96808, "b": 323.20166, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 139, "text": "Replace with a new halogen bulb.", "bbox": {"l": 329.12036, "t": 321.46265, "r": 352.96808, "b": 323.20166, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 326.88608, "t": 323.07285, "r": 328.36884, "b": 324.81189, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 140, "text": "4.", "bbox": {"l": 326.88608, "t": 323.07285, "r": 328.36884, "b": 324.81189, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 329.1102, "t": 323.07285, "r": 356.5412, "b": 324.81189, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 141, "text": "Open the window in the base plate and", "bbox": {"l": 329.1102, "t": 323.07285, "r": 356.5412, "b": 324.81189, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 326.88608, "t": 324.68307000000004, "r": 350.13828, "b": 326.42209, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 142, "text": " replace the halogen lamp or ", "bbox": {"l": 326.88608, "t": 324.68307000000004, "r": 350.13828, "b": 326.42209, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 326.88608, "t": 326.29327, "r": 351.59677, "b": 328.03232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 143, "text": " fluorescent lamp of transmitted", "bbox": {"l": 326.88608, "t": 326.29327, "r": 351.59677, "b": 328.03232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 326.88608, "t": 327.9035, "r": 336.89197, "b": 329.64252, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 144, "text": " illuminator.", "bbox": {"l": 326.88608, "t": 327.9035, "r": 336.89197, "b": 329.64252, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 358.42023, "t": 263.49492999999995, "r": 366.93256, "b": 265.23395000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 145, "text": "FOCUSING", "bbox": {"l": 358.42023, "t": 263.49492999999995, "r": 366.93256, "b": 265.23395000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 358.42023, "t": 265.10515999999996, "r": 359.89841, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 146, "text": "1.", "bbox": {"l": 358.42023, "t": 265.10515999999996, "r": 359.89841, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 360.63751, "t": 265.10515999999996, "r": 387.98407, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 147, "text": "Turn the focusing knob away or toward", "bbox": {"l": 360.63751, "t": 265.10515999999996, "r": 387.98407, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 358.42023, "t": 266.71533, "r": 384.58948, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 148, "text": " you until a clear image is viewed.", "bbox": {"l": 358.42023, "t": 266.71533, "r": 384.58948, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 358.42166, "t": 268.32556, "r": 359.78549, "b": 270.06458, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 149, "text": "2.", "bbox": {"l": 358.42166, "t": 268.32556, "r": 359.78549, "b": 270.06458, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 360.46741, "t": 268.32556, "r": 384.33441, "b": 270.06458, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 150, "text": "If the image is unclear, adjust the", "bbox": {"l": 360.46741, "t": 268.32556, "r": 384.33441, "b": 270.06458, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 358.4231, "t": 269.93579, "r": 384.61502, "b": 271.6748, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 151, "text": " height of the elevator up or down,", "bbox": {"l": 358.4231, "t": 269.93579, "r": 384.61502, "b": 271.6748, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 358.4231, "t": 271.54602, "r": 385.38922, "b": 273.28503, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 152, "text": " then turn the focusing knob again.", "bbox": {"l": 358.4231, "t": 271.54602, "r": 385.38922, "b": 273.28503, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 358.4231, "t": 274.76642000000004, "r": 377.35046, "b": 276.50543000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 153, "text": "ZOOM MAGNIFICATION", "bbox": {"l": 358.4231, "t": 274.76642000000004, "r": 377.35046, "b": 276.50543000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 358.4231, "t": 276.37665000000004, "r": 359.89429, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 154, "text": "1.", "bbox": {"l": 358.4231, "t": 276.37665000000004, "r": 359.89429, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 360.62988, "t": 276.37665000000004, "r": 386.37589, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 155, "text": "Turn the zoom magnification knob to", "bbox": {"l": 360.62988, "t": 276.37665000000004, "r": 386.37589, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 358.4231, "t": 277.98688000000004, "r": 386.78732, "b": 279.72589000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 156, "text": " the desired magnification and field of", "bbox": {"l": 358.4231, "t": 277.98688000000004, "r": 386.78732, "b": 279.72589000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 358.4231, "t": 279.59704999999997, "r": 364.16855, "b": 281.33609, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 157, "text": " view.", "bbox": {"l": 358.4231, "t": 279.59704999999997, "r": 364.16855, "b": 281.33609, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 358.4231, "t": 281.20728, "r": 359.86777, "b": 282.94632, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 158, "text": "2.", "bbox": {"l": 358.4231, "t": 281.20728, "r": 359.86777, "b": 282.94632, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 114, "label": "text", "bbox": {"l": 360.59012, "t": 281.20728, "r": 387.31656, "b": 282.94632, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 159, "text": "In most situations, it is recommended", "bbox": {"l": 360.59012, "t": 281.20728, "r": 387.31656, "b": 282.94632, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 115, "label": "text", "bbox": {"l": 358.4231, "t": 282.81750000000005, "r": 381.56656, "b": 284.55652, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 160, "text": " that you focus at the lowest ", "bbox": {"l": 358.4231, "t": 282.81750000000005, "r": 381.56656, "b": 284.55652, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 116, "label": "text", "bbox": {"l": 358.4231, "t": 284.4277, "r": 386.63403, "b": 286.16675, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 161, "text": " magnification, then move to a higher", "bbox": {"l": 358.4231, "t": 284.4277, "r": 386.63403, "b": 286.16675, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 117, "label": "text", "bbox": {"l": 358.42453, "t": 286.03793, "r": 382.77115, "b": 287.77695, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 162, "text": " magnification and re-focus as ", "bbox": {"l": 358.42453, "t": 286.03793, "r": 382.77115, "b": 287.77695, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 118, "label": "text", "bbox": {"l": 358.42453, "t": 287.64813, "r": 367.98694, "b": 289.38718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 163, "text": " necessary.", "bbox": {"l": 358.42453, "t": 287.64813, "r": 367.98694, "b": 289.38718, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 119, "label": "text", "bbox": {"l": 358.42453, "t": 289.25836, "r": 359.80386, "b": 290.99738, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 164, "text": "3.", "bbox": {"l": 358.42453, "t": 289.25836, "r": 359.80386, "b": 290.99738, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 120, "label": "text", "bbox": {"l": 360.49353, "t": 289.25836, "r": 386.70093, "b": 290.99738, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 165, "text": "If the image is not clear to both eyes", "bbox": {"l": 360.49353, "t": 289.25836, "r": 386.70093, "b": 290.99738, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 121, "label": "text", "bbox": {"l": 358.42453, "t": 290.86855999999995, "r": 388.03534, "b": 292.6076, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 166, "text": " at the same time, the diopter ring may", "bbox": {"l": 358.42453, "t": 290.86855999999995, "r": 388.03534, "b": 292.6076, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 122, "label": "text", "bbox": {"l": 358.42453, "t": 292.47879, "r": 373.13724, "b": 294.2178, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 167, "text": " need adjustment.", "bbox": {"l": 358.42453, "t": 292.47879, "r": 373.13724, "b": 294.2178, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 123, "label": "text", "bbox": {"l": 358.42453, "t": 295.69922, "r": 381.74539, "b": 297.43823, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 168, "text": "DIOPTER RING ADJUSTMENT", "bbox": {"l": 358.42453, "t": 295.69922, "r": 381.74539, "b": 297.43823, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 124, "label": "text", "bbox": {"l": 358.42453, "t": 297.30942, "r": 359.83682, "b": 299.04846, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 169, "text": "1.", "bbox": {"l": 358.42453, "t": 297.30942, "r": 359.83682, "b": 299.04846, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 125, "label": "text", "bbox": {"l": 360.54297, "t": 297.30942, "r": 388.08289, "b": 299.04846, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 170, "text": "To adjust the eyepiece for viewing with", "bbox": {"l": 360.54297, "t": 297.30942, "r": 388.08289, "b": 299.04846, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 126, "label": "text", "bbox": {"l": 358.42453, "t": 298.91965, "r": 382.73251, "b": 300.65866, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 171, "text": " or without eyeglasses and for ", "bbox": {"l": 358.42453, "t": 298.91965, "r": 382.73251, "b": 300.65866, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 127, "label": "text", "bbox": {"l": 358.42453, "t": 300.52985, "r": 387.72266, "b": 302.26889000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 172, "text": " differences in acuity between the right", "bbox": {"l": 358.42453, "t": 300.52985, "r": 387.72266, "b": 302.26889000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 128, "label": "text", "bbox": {"l": 358.42453, "t": 302.14008000000007, "r": 384.1991, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 173, "text": " and left eyes, follow the following", "bbox": {"l": 358.42453, "t": 302.14008000000007, "r": 384.1991, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 129, "label": "text", "bbox": {"l": 358.42453, "t": 303.75027, "r": 364.88672, "b": 305.48932, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 174, "text": " steps:", "bbox": {"l": 358.42453, "t": 303.75027, "r": 364.88672, "b": 305.48932, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 130, "label": "text", "bbox": {"l": 358.42453, "t": 305.3605, "r": 359.95078, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 175, "text": "a.", "bbox": {"l": 358.42453, "t": 305.3605, "r": 359.95078, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 131, "label": "text", "bbox": {"l": 361.47699, "t": 305.3605, "r": 386.65988, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 176, "text": "Observe an image through the left", "bbox": {"l": 361.47699, "t": 305.3605, "r": 386.65988, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 132, "label": "text", "bbox": {"l": 358.42453, "t": 306.9707, "r": 386.7634, "b": 308.70975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 177, "text": " eyepiece and bring a specific point", "bbox": {"l": 358.42453, "t": 306.9707, "r": 386.7634, "b": 308.70975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 133, "label": "text", "bbox": {"l": 358.42453, "t": 308.58093, "r": 385.41354, "b": 310.31995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 178, "text": " into focus using the focus knob.", "bbox": {"l": 358.42453, "t": 308.58093, "r": 385.41354, "b": 310.31995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 134, "label": "text", "bbox": {"l": 358.42453, "t": 310.19113, "r": 359.93304, "b": 311.93018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 179, "text": "b.", "bbox": {"l": 358.42453, "t": 310.19113, "r": 359.93304, "b": 311.93018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 135, "label": "text", "bbox": {"l": 361.44156, "t": 310.19113, "r": 382.56085, "b": 311.93018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 180, "text": "By turning the diopter ring ", "bbox": {"l": 361.44156, "t": 310.19113, "r": 382.56085, "b": 311.93018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 136, "label": "text", "bbox": {"l": 358.42596, "t": 311.80136, "r": 385.4559, "b": 313.54037, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 181, "text": " adjustment for the left eyepiece,", "bbox": {"l": 358.42596, "t": 311.80136, "r": 385.4559, "b": 313.54037, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 137, "label": "text", "bbox": {"l": 358.42596, "t": 313.41156, "r": 384.56122, "b": 315.15059999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 182, "text": " bring the same point into sharp", "bbox": {"l": 358.42596, "t": 313.41156, "r": 384.56122, "b": 315.15059999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 138, "label": "text", "bbox": {"l": 358.42596, "t": 315.02178999999995, "r": 366.74371, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 183, "text": " focus.", "bbox": {"l": 358.42596, "t": 315.02178999999995, "r": 366.74371, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 139, "label": "text", "bbox": {"l": 358.42596, "t": 316.63199, "r": 383.93884, "b": 318.37103, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 184, "text": " c.Then bring the same point into", "bbox": {"l": 358.42596, "t": 316.63199, "r": 383.93884, "b": 318.37103, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 140, "label": "text", "bbox": {"l": 358.42596, "t": 318.2422199999999, "r": 385.69241, "b": 319.9812299999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 185, "text": " focus through the right eyepiece", "bbox": {"l": 358.42596, "t": 318.2422199999999, "r": 385.69241, "b": 319.9812299999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 141, "label": "text", "bbox": {"l": 358.42596, "t": 319.85242000000005, "r": 385.94861, "b": 321.59146, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 186, "text": " by turning the right diopter ring.", "bbox": {"l": 358.42596, "t": 319.85242000000005, "r": 385.94861, "b": 321.59146, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 142, "label": "text", "bbox": {"l": 358.42596, "t": 321.46265, "r": 385.54236, "b": 323.20166, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 187, "text": " d.With more than one viewer, each", "bbox": {"l": 358.42596, "t": 321.46265, "r": 385.54236, "b": 323.20166, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 143, "label": "text", "bbox": {"l": 358.42596, "t": 323.07285, "r": 382.98718, "b": 324.81189, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 188, "text": " viewer should note their own", "bbox": {"l": 358.42596, "t": 323.07285, "r": 382.98718, "b": 324.81189, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 144, "label": "text", "bbox": {"l": 358.42596, "t": 324.68307000000004, "r": 385.06448, "b": 326.42209, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 189, "text": " diopter ring position for the left", "bbox": {"l": 358.42596, "t": 324.68307000000004, "r": 385.06448, "b": 326.42209, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 145, "label": "text", "bbox": {"l": 358.42596, "t": 326.29327, "r": 385.20682, "b": 328.03232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 190, "text": " and right eyepieces, then before", "bbox": {"l": 358.42596, "t": 326.29327, "r": 385.20682, "b": 328.03232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 146, "label": "text", "bbox": {"l": 358.42596, "t": 327.9035, "r": 382.21964, "b": 329.64252, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 191, "text": " viewing set the diopter ring", "bbox": {"l": 358.42596, "t": 327.9035, "r": 382.21964, "b": 329.64252, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 147, "label": "text", "bbox": {"l": 358.42596, "t": 329.5137, "r": 382.63382, "b": 331.25275, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 192, "text": " adjustments to that setting.", "bbox": {"l": 358.42596, "t": 329.5137, "r": 382.63382, "b": 331.25275, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 148, "label": "text", "bbox": {"l": 358.42596, "t": 332.73412999999994, "r": 375.67661, "b": 334.47317999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 193, "text": "CHANGING THE BULB", "bbox": {"l": 358.42596, "t": 332.73412999999994, "r": 375.67661, "b": 334.47317999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 149, "label": "text", "bbox": {"l": 358.42596, "t": 334.34436, "r": 359.90311, "b": 336.08337, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 194, "text": "1.", "bbox": {"l": 358.42596, "t": 334.34436, "r": 359.90311, "b": 336.08337, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 150, "label": "text", "bbox": {"l": 360.64169, "t": 334.34436, "r": 385.75333, "b": 336.08337, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 195, "text": "Disconnect the power cord from the", "bbox": {"l": 360.64169, "t": 334.34436, "r": 385.75333, "b": 336.08337, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 151, "label": "text", "bbox": {"l": 358.42596, "t": 335.95456, "r": 372.01416, "b": 337.6936, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 196, "text": " electrical outlet.", "bbox": {"l": 358.42596, "t": 335.95456, "r": 372.01416, "b": 337.6936, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 152, "label": "text", "bbox": {"l": 358.42596, "t": 337.56479, "r": 359.88327, "b": 339.3038, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 197, "text": "2.", "bbox": {"l": 358.42596, "t": 337.56479, "r": 359.88327, "b": 339.3038, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 153, "label": "text", "bbox": {"l": 360.61191, "t": 337.56479, "r": 384.65726, "b": 339.3038, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 198, "text": "When the bulb is cool, remove the", "bbox": {"l": 360.61191, "t": 337.56479, "r": 384.65726, "b": 339.3038, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 154, "label": "text", "bbox": {"l": 358.42596, "t": 339.17499, "r": 385.33649, "b": 340.9140300000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 199, "text": " oblique illuminator cap and remove", "bbox": {"l": 358.42596, "t": 339.17499, "r": 385.33649, "b": 340.9140300000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 155, "label": "text", "bbox": {"l": 358.42596, "t": 340.78522, "r": 379.57224, "b": 342.52423, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 200, "text": " the halogen bulb with cap.", "bbox": {"l": 358.42596, "t": 340.78522, "r": 379.57224, "b": 342.52423, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 156, "label": "text", "bbox": {"l": 358.4274, "t": 342.39542, "r": 359.91788, "b": 344.13446000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 201, "text": "3.", "bbox": {"l": 358.4274, "t": 342.39542, "r": 359.91788, "b": 344.13446000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 157, "label": "text", "bbox": {"l": 360.66312, "t": 342.39542, "r": 384.5108, "b": 344.13446000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 202, "text": "Replace with a new halogen bulb.", "bbox": {"l": 360.66312, "t": 342.39542, "r": 384.5108, "b": 344.13446000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 158, "label": "text", "bbox": {"l": 358.42883, "t": 344.00565000000006, "r": 359.92792, "b": 345.74466, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 203, "text": "4.", "bbox": {"l": 358.42883, "t": 344.00565000000006, "r": 359.92792, "b": 345.74466, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 159, "label": "text", "bbox": {"l": 360.67746, "t": 344.00565000000006, "r": 385.41235, "b": 345.74466, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 204, "text": "Open the window in the base plate", "bbox": {"l": 360.67746, "t": 344.00565000000006, "r": 385.41235, "b": 345.74466, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 160, "label": "text", "bbox": {"l": 358.42883, "t": 345.61584, "r": 383.2782, "b": 347.35489, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 205, "text": " and replace the halogen lamp or", "bbox": {"l": 358.42883, "t": 345.61584, "r": 383.2782, "b": 347.35489, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 161, "label": "text", "bbox": {"l": 358.42883, "t": 347.22607, "r": 383.13953, "b": 348.96509, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 206, "text": " fluorescent lamp of transmitted", "bbox": {"l": 358.42883, "t": 347.22607, "r": 383.13953, "b": 348.96509, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 162, "label": "text", "bbox": {"l": 358.42883, "t": 348.83627, "r": 368.43472, "b": 350.57532, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 207, "text": " illuminator.", "bbox": {"l": 358.42883, "t": 348.83627, "r": 368.43472, "b": 350.57532, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 163, "label": "text", "bbox": {"l": 326.59567, "t": 261.14185, "r": 339.11377, "b": 262.88091999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 208, "text": "Model AY11230", "bbox": {"l": 326.59567, "t": 261.14185, "r": 339.11377, "b": 262.88091999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 164, "label": "text", "bbox": {"l": 358.48605, "t": 261.14185, "r": 371.00415, "b": 262.88091999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 209, "text": "Model AY11234", "bbox": {"l": 358.48605, "t": 261.14185, "r": 371.00415, "b": 262.88091999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 165, "label": "text", "bbox": {"l": 455.43533, "t": 351.77038999999996, "r": 457.97827000000007, "b": 353.94415, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 210, "text": "14", "bbox": {"l": 455.43533, "t": 351.77038999999996, "r": 457.97827000000007, "b": 353.94415, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 166, "label": "text", "bbox": {"l": 408.24518, "t": 275.52673000000004, "r": 414.4234, "b": 276.96020999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 211, "text": "Objectives", "bbox": {"l": 408.24518, "t": 275.52673000000004, "r": 414.4234, "b": 276.96020999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 167, "label": "text", "bbox": {"l": 409.39554, "t": 268.98235999999997, "r": 419.06677, "b": 270.41583, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 212, "text": "Revolving Turret", "bbox": {"l": 409.39554, "t": 268.98235999999997, "r": 419.06677, "b": 270.41583, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 168, "label": "text", "bbox": {"l": 441.3895, "t": 279.12627999999995, "r": 445.87192, "b": 280.55975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 213, "text": "Coarse ", "bbox": {"l": 441.3895, "t": 279.12627999999995, "r": 445.87192, "b": 280.55975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 169, "label": "text", "bbox": {"l": 441.3895, "t": 280.30609, "r": 448.22338999999994, "b": 281.7395900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 214, "text": "Adjustment", "bbox": {"l": 441.3895, "t": 280.30609, "r": 448.22338999999994, "b": 281.7395900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 170, "label": "text", "bbox": {"l": 441.3895, "t": 281.48593, "r": 444.40371999999996, "b": 282.91939999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 215, "text": "Knob", "bbox": {"l": 441.3895, "t": 281.48593, "r": 444.40371999999996, "b": 282.91939999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 171, "label": "text", "bbox": {"l": 398.79288, "t": 254.94646999999998, "r": 428.91568, "b": 258.85931000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 216, "text": "MODEL AY11236", "bbox": {"l": 398.79288, "t": 254.94646999999998, "r": 428.91568, "b": 258.85931000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 172, "label": "text", "bbox": {"l": 398.32535, "t": 305.04291, "r": 435.93542, "b": 308.95572000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 217, "text": "MICROSCOPE USAGE", "bbox": {"l": 398.32535, "t": 305.04291, "r": 435.93542, "b": 308.95572000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 173, "label": "text", "bbox": {"l": 398.08594, "t": 310.35892, "r": 453.72171, "b": 312.53271, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 218, "text": "BARSKA Model AY11236 is a powerful fixed power compound ", "bbox": {"l": 398.08594, "t": 310.35892, "r": 453.72171, "b": 312.53271, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 174, "label": "text", "bbox": {"l": 398.08594, "t": 312.50586, "r": 453.09939999999995, "b": 314.67966, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 219, "text": "microscope designed for biological studies such as specimen ", "bbox": {"l": 398.08594, "t": 312.50586, "r": 453.09939999999995, "b": 314.67966, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 175, "label": "text", "bbox": {"l": 398.08594, "t": 314.6528, "r": 456.65246999999994, "b": 316.8266, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 220, "text": "examination. It can also be used for examining bacteria and", "bbox": {"l": 398.08594, "t": 314.6528, "r": 456.65246999999994, "b": 316.8266, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 176, "label": "text", "bbox": {"l": 398.08594, "t": 316.79977, "r": 456.73859000000004, "b": 318.97354, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 221, "text": "for general clinical and medical studies and other scientific uses. ", "bbox": {"l": 398.08594, "t": 316.79977, "r": 456.73859000000004, "b": 318.97354, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 177, "label": "text", "bbox": {"l": 398.62399, "t": 320.42941, "r": 427.77472, "b": 324.34222000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 222, "text": "CONSTRUCTION", "bbox": {"l": 398.62399, "t": 320.42941, "r": 427.77472, "b": 324.34222000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 178, "label": "text", "bbox": {"l": 398.08594, "t": 326.46069000000006, "r": 456.02639999999997, "b": 328.63449, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 223, "text": "BARSKA Model AY11236 is a fixed power compound microscope.", "bbox": {"l": 398.08594, "t": 326.46069000000006, "r": 456.02639999999997, "b": 328.63449, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 179, "label": "text", "bbox": {"l": 398.08414, "t": 328.6076699999999, "r": 455.42238999999995, "b": 330.7814599999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 224, "text": "It is constructed with two optical paths at the same angle. It is ", "bbox": {"l": 398.08414, "t": 328.6076699999999, "r": 455.42238999999995, "b": 330.7814599999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 180, "label": "text", "bbox": {"l": 398.08414, "t": 330.75461, "r": 457.39844, "b": 332.92841, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 225, "text": "equipped with transmitted illumination. By using this instrument, ", "bbox": {"l": 398.08414, "t": 330.75461, "r": 457.39844, "b": 332.92841, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 181, "label": "text", "bbox": {"l": 398.08414, "t": 332.90155, "r": 453.97745, "b": 335.07535000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 226, "text": "the user can observe specimens at magnification from 40x to ", "bbox": {"l": 398.08414, "t": 332.90155, "r": 453.97745, "b": 335.07535000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 182, "label": "text", "bbox": {"l": 398.08414, "t": 335.04852, "r": 454.70708999999994, "b": 337.22232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 227, "text": "1000x by selecting the desired objective lens. Coarse and fine ", "bbox": {"l": 398.08414, "t": 335.04852, "r": 454.70708999999994, "b": 337.22232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 183, "label": "text", "bbox": {"l": 398.08414, "t": 337.19547, "r": 458.90240000000006, "b": 339.36926, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 228, "text": "focus adjustments provide accuracy and image detail. The rotating ", "bbox": {"l": 398.08414, "t": 337.19547, "r": 458.90240000000006, "b": 339.36926, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 184, "label": "text", "bbox": {"l": 398.08594, "t": 339.34241, "r": 453.0672, "b": 341.5162, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 229, "text": "head allows the user to position the eyepieces for maximum ", "bbox": {"l": 398.08594, "t": 339.34241, "r": 453.0672, "b": 341.5162, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 185, "label": "text", "bbox": {"l": 398.08594, "t": 341.48938, "r": 449.63113, "b": 343.66318, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 230, "text": "viewing comfort and easy access to all adjustment knobs.", "bbox": {"l": 398.08594, "t": 341.48938, "r": 449.63113, "b": 343.66318, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 186, "label": "text", "bbox": {"l": 422.10626, "t": 301.24191, "r": 434.62433000000004, "b": 302.98096, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 231, "text": "Model AY11236", "bbox": {"l": 422.10626, "t": 301.24191, "r": 434.62433000000004, "b": 302.98096, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 187, "label": "text", "bbox": {"l": 442.01610999999997, "t": 283.08649, "r": 444.8817399999999, "b": 284.51996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 232, "text": "Fine ", "bbox": {"l": 442.01610999999997, "t": 283.08649, "r": 444.8817399999999, "b": 284.51996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 188, "label": "text", "bbox": {"l": 442.01610999999997, "t": 284.2663, "r": 448.85001, "b": 285.69980000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 233, "text": "Adjustment", "bbox": {"l": 442.01610999999997, "t": 284.2663, "r": 448.85001, "b": 285.69980000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 189, "label": "text", "bbox": {"l": 442.01610999999997, "t": 285.44611, "r": 445.03033000000005, "b": 286.87961, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 234, "text": "Knob", "bbox": {"l": 442.01610999999997, "t": 285.44611, "r": 445.03033000000005, "b": 286.87961, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 190, "label": "text", "bbox": {"l": 408.00577, "t": 279.12579000000005, "r": 411.42212, "b": 280.5593, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 235, "text": "Stage", "bbox": {"l": 408.00577, "t": 279.12579000000005, "r": 411.42212, "b": 280.5593, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 191, "label": "text", "bbox": {"l": 404.07172, "t": 280.9144299999999, "r": 410.77707, "b": 282.3479, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 236, "text": "Condenser ", "bbox": {"l": 404.07172, "t": 280.9144299999999, "r": 410.77707, "b": 282.3479, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 192, "label": "text", "bbox": {"l": 404.07172, "t": 282.09424, "r": 409.2157, "b": 283.52774, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 237, "text": "Focusing", "bbox": {"l": 404.07172, "t": 282.09424, "r": 409.2157, "b": 283.52774, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 193, "label": "text", "bbox": {"l": 404.07172, "t": 283.27408, "r": 407.08594, "b": 284.7075500000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 238, "text": "Knob", "bbox": {"l": 404.07172, "t": 283.27408, "r": 407.08594, "b": 284.7075500000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 194, "label": "text", "bbox": {"l": 441.81281, "t": 262.32178, "r": 447.03702, "b": 263.75525000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 239, "text": "Eyepiece", "bbox": {"l": 441.81281, "t": 262.32178, "r": 447.03702, "b": 263.75525000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 195, "label": "text", "bbox": {"l": 437.34607, "t": 271.13025000000005, "r": 440.80496, "b": 272.56281, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 240, "text": "Stand", "bbox": {"l": 437.34607, "t": 271.13025000000005, "r": 440.80496, "b": 272.56281, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 196, "label": "text", "bbox": {"l": 409.7164, "t": 284.40027, "r": 413.3768, "b": 285.83282, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 241, "text": "Lamp ", "bbox": {"l": 409.7164, "t": 284.40027, "r": 413.3768, "b": 285.83282, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 197, "label": "text", "bbox": {"l": 409.7164, "t": 285.83163, "r": 413.68201, "b": 287.26416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 242, "text": "On/Off", "bbox": {"l": 409.7164, "t": 285.83163, "r": 413.68201, "b": 287.26416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 198, "label": "text", "bbox": {"l": 409.7164, "t": 287.263, "r": 413.6337, "b": 288.69553, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 243, "text": "Switch", "bbox": {"l": 409.7164, "t": 287.263, "r": 413.6337, "b": 288.69553, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 199, "label": "text", "bbox": {"l": 434.8712499999999, "t": 296.7153, "r": 438.53164999999996, "b": 298.14783, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 244, "text": "Lamp ", "bbox": {"l": 434.8712499999999, "t": 296.7153, "r": 438.53164999999996, "b": 298.14783, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 200, "label": "text", "bbox": {"l": 439.52039, "t": 292.18307000000004, "r": 443.08768, "b": 293.61560000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 245, "text": "Power", "bbox": {"l": 439.52039, "t": 292.18307000000004, "r": 443.08768, "b": 293.61560000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 201, "label": "text", "bbox": {"l": 439.52039, "t": 293.61444, "r": 442.29575, "b": 295.04697, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 246, "text": "Cord", "bbox": {"l": 439.52039, "t": 293.61444, "r": 442.29575, "b": 295.04697, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 202, "label": "text", "bbox": {"l": 413.55829, "t": 264.66089, "r": 421.94913, "b": 266.09344, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 247, "text": "Rotating Head", "bbox": {"l": 413.55829, "t": 264.66089, "r": 421.94913, "b": 266.09344, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 203, "label": "text", "bbox": {"l": 441.84316999999993, "t": 286.90573, "r": 447.87585000000007, "b": 288.33826, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 248, "text": "Stage Clip", "bbox": {"l": 441.84316999999993, "t": 286.90573, "r": 447.87585000000007, "b": 288.33826, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 204, "label": "text", "bbox": {"l": 441.84316999999993, "t": 288.3371, "r": 448.67252, "b": 289.76962000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 249, "text": "Adjustment", "bbox": {"l": 441.84316999999993, "t": 288.3371, "r": 448.67252, "b": 289.76962000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 205, "label": "text", "bbox": {"l": 407.2403, "t": 259.86645999999996, "r": 425.79089, "b": 261.29895, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 250, "text": "Interpupillary Slide Adjustment", "bbox": {"l": 407.2403, "t": 259.86645999999996, "r": 425.79089, "b": 261.29895, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 206, "label": "text", "bbox": {"l": 449.10074000000003, "t": 378.66302, "r": 466.08835000000005, "b": 380.78412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 251, "text": "Circling Minimums", "bbox": {"l": 449.10074000000003, "t": 378.66302, "r": 466.08835000000005, "b": 380.78412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 207, "label": "text", "bbox": {"l": 449.10074000000003, "t": 383.2203999999999, "r": 449.64444, "b": 385.34148999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 252, "text": "7", "bbox": {"l": 449.10074000000003, "t": 383.2203999999999, "r": 449.64444, "b": 385.34148999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 208, "label": "text", "bbox": {"l": 450.18811, "t": 383.2203999999999, "r": 550.77124, "b": 385.34148999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 253, "text": "K H U H Z D V D F K D Q J H W R W K H 7 ( 5 3 6 F U L W H U L D L Q W K D W D \u1087H F W V F L U F O L Q J D U H D G L P H Q V L R Q E \\ H [ S D Q G L Q J W K H D U H D V W R S U R Y L G H ", "bbox": {"l": 450.18811, "t": 383.2203999999999, "r": 550.77124, "b": 385.34148999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 209, "label": "text", "bbox": {"l": 449.10074000000003, "t": 385.75732, "r": 536.14716, "b": 387.87842, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 254, "text": "improved obstacle protection. To indicate that the new criteria had been applied to a given procedure, a ", "bbox": {"l": 449.10074000000003, "t": 385.75732, "r": 536.14716, "b": 387.87842, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 210, "label": "text", "bbox": {"l": 538.31085, "t": 385.75732, "r": 549.49921, "b": 387.87842, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 255, "text": " is placed on ", "bbox": {"l": 538.31085, "t": 385.75732, "r": 549.49921, "b": 387.87842, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 211, "label": "text", "bbox": {"l": 449.10074000000003, "t": 388.03601, "r": 547.58185, "b": 390.1571, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 256, "text": "the circling line of minimums. The new circling tables and explanatory information is located in the Legend of the TPP.", "bbox": {"l": 449.10074000000003, "t": 388.03601, "r": 547.58185, "b": 390.1571, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 212, "label": "text", "bbox": {"l": 449.10074000000003, "t": 393.2128000000001, "r": 449.6163, "b": 395.33386, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 257, "text": "7", "bbox": {"l": 449.10074000000003, "t": 393.2128000000001, "r": 449.6163, "b": 395.33386, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 213, "label": "text", "bbox": {"l": 450.1319, "t": 393.2128000000001, "r": 529.53082, "b": 395.33386, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 258, "text": "K H D S S U R D F K H V X V L Q J V W D Q G D U G F L U F O L Q J D S S U R D F K D U H D V F D Q E H L G H Q W L \u00bf H G E \\ W K H D E V H Q F H R I W K H ", "bbox": {"l": 450.1319, "t": 393.2128000000001, "r": 529.53082, "b": 395.33386, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 214, "label": "text", "bbox": {"l": 532.05829, "t": 393.2128000000001, "r": 550.42261, "b": 395.33386, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 259, "text": " on the circling line of ", "bbox": {"l": 532.05829, "t": 393.2128000000001, "r": 550.42261, "b": 395.33386, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 215, "label": "text", "bbox": {"l": 449.10074000000003, "t": 395.49149, "r": 455.74692, "b": 397.61255, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 260, "text": "minima.", "bbox": {"l": 449.10074000000003, "t": 395.49149, "r": 455.74692, "b": 397.61255, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 216, "label": "text", "bbox": {"l": 449.95525999999995, "t": 415.59549, "r": 496.2829, "b": 417.50446, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 261, "text": "$ S S O \\ 6 W D Q G D U G & L U F O L Q J $ S S U R D F K 0 D Q H X Y H U L Q J 5 D G L X V 7 D E O H ", "bbox": {"l": 449.95525999999995, "t": 415.59549, "r": 496.2829, "b": 417.50446, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 217, "label": "text", "bbox": {"l": 501.13077, "t": 409.25543, "r": 551.16101, "b": 411.1644, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 262, "text": "$ S S O \\ ( [ S D Q G H G & L U F O L Q J $ S S U R D F K 0 D Q H X Y H U L Q J $ L U V S D F H 5 D G L X V ", "bbox": {"l": 501.13077, "t": 409.25543, "r": 551.16101, "b": 411.1644, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 218, "label": "text", "bbox": {"l": 501.13077, "t": 411.30624, "r": 505.2477999999999, "b": 413.21521, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 263, "text": "Table", "bbox": {"l": 501.13077, "t": 411.30624, "r": 505.2477999999999, "b": 413.21521, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 219, "label": "text", "bbox": {"l": 449.10074000000003, "t": 420.18802, "r": 469.35599, "b": 422.73331, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 264, "text": "AIRPORT SKETCH", "bbox": {"l": 449.10074000000003, "t": 420.18802, "r": 469.35599, "b": 422.73331, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 220, "label": "text", "bbox": {"l": 449.10074000000003, "t": 425.08908, "r": 525.93616, "b": 427.21017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 265, "text": "The airport sketch is a depiction of the airport with emphasis on runway pattern and related ", "bbox": {"l": 449.10074000000003, "t": 425.08908, "r": 525.93616, "b": 427.21017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 221, "label": "text", "bbox": {"l": 449.10074000000003, "t": 427.3678, "r": 522.0343, "b": 429.48886, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 266, "text": "information, positioned in either the lower left or lower right corner of the chart to aid pi-", "bbox": {"l": 449.10074000000003, "t": 427.3678, "r": 522.0343, "b": 429.48886, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 222, "label": "text", "bbox": {"l": 449.10074000000003, "t": 429.64648, "r": 524.67151, "b": 431.76755, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 267, "text": "lot recognition of the airport from the air and to provide some information to aid on ground ", "bbox": {"l": 449.10074000000003, "t": 429.64648, "r": 524.67151, "b": 431.76755, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 223, "label": "text", "bbox": {"l": 449.10074000000003, "t": 431.92514000000006, "r": 527.172, "b": 434.04623, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 268, "text": "navigation of the airport. The runways are drawn to scale and oriented to true north. Runway ", "bbox": {"l": 449.10074000000003, "t": 431.92514000000006, "r": 527.172, "b": 434.04623, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 224, "label": "text", "bbox": {"l": 449.10074000000003, "t": 434.20383, "r": 502.39545, "b": 436.32492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 269, "text": "dimensions (length and width) are shown for all active runways.", "bbox": {"l": 449.10074000000003, "t": 434.20383, "r": 502.39545, "b": 436.32492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 225, "label": "text", "bbox": {"l": 449.10074000000003, "t": 438.7611999999999, "r": 512.92676, "b": 440.88228999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 270, "text": "Runway(s) are depicted based on what type and construction of the runway.", "bbox": {"l": 449.10074000000003, "t": 438.7611999999999, "r": 512.92676, "b": 440.88228999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 226, "label": "text", "bbox": {"l": 449.95525999999995, "t": 444.07001, "r": 460.02307, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 271, "text": "Hard Surface", "bbox": {"l": 449.95525999999995, "t": 444.07001, "r": 460.02307, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 227, "label": "text", "bbox": {"l": 464.89963, "t": 444.07001, "r": 473.98819, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 272, "text": "Other Than ", "bbox": {"l": 464.89963, "t": 444.07001, "r": 473.98819, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 228, "label": "text", "bbox": {"l": 464.89963, "t": 446.12085, "r": 474.96744, "b": 448.02979, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 273, "text": "Hard Surface", "bbox": {"l": 464.89963, "t": 446.12085, "r": 474.96744, "b": 448.02979, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 229, "label": "text", "bbox": {"l": 478.91357, "t": 444.07001, "r": 489.45648, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 274, "text": "Metal Surface", "bbox": {"l": 478.91357, "t": 444.07001, "r": 489.45648, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 230, "label": "text", "bbox": {"l": 493.06420999999995, "t": 444.07001, "r": 505.03076, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 275, "text": "Closed Runway", "bbox": {"l": 493.06420999999995, "t": 444.07001, "r": 505.03076, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 231, "label": "text", "bbox": {"l": 509.5809, "t": 444.07001, "r": 524.30237, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 276, "text": "Under Construction", "bbox": {"l": 509.5809, "t": 444.07001, "r": 524.30237, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 232, "label": "text", "bbox": {"l": 449.95525999999995, "t": 454.81207, "r": 458.31406, "b": 456.72104, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 277, "text": "Stopways, ", "bbox": {"l": 449.95525999999995, "t": 454.81207, "r": 458.31406, "b": 456.72104, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 233, "label": "text", "bbox": {"l": 449.95525999999995, "t": 456.86288, "r": 461.92083999999994, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 278, "text": "Taxiways, Park-", "bbox": {"l": 449.95525999999995, "t": 456.86288, "r": 461.92083999999994, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 234, "label": "text", "bbox": {"l": 449.95525999999995, "t": 458.91373, "r": 457.08014, "b": 460.82268999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 279, "text": "ing Areas", "bbox": {"l": 449.95525999999995, "t": 458.91373, "r": 457.08014, "b": 460.82268999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 235, "label": "text", "bbox": {"l": 464.89963, "t": 454.81207, "r": 472.87732, "b": 456.72104, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 280, "text": "Displaced ", "bbox": {"l": 464.89963, "t": 454.81207, "r": 472.87732, "b": 456.72104, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 236, "label": "text", "bbox": {"l": 464.89963, "t": 456.86288, "r": 472.49792, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 281, "text": "Threshold", "bbox": {"l": 464.89963, "t": 456.86288, "r": 472.49792, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 237, "label": "text", "bbox": {"l": 478.91357, "t": 454.81207, "r": 483.61584, "b": 456.72104, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 282, "text": "Closed", "bbox": {"l": 478.91357, "t": 454.81207, "r": 483.61584, "b": 456.72104, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 238, "label": "text", "bbox": {"l": 478.91357, "t": 456.86288, "r": 486.60754000000003, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 283, "text": "Pavement", "bbox": {"l": 478.91357, "t": 456.86288, "r": 486.60754000000003, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 239, "label": "text", "bbox": {"l": 493.06420999999995, "t": 454.81207, "r": 504.20648, "b": 456.72104, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 284, "text": "Water Runway", "bbox": {"l": 493.06420999999995, "t": 454.81207, "r": 504.20648, "b": 456.72104, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 240, "label": "text", "bbox": {"l": 449.10074000000003, "t": 469.32974, "r": 548.59674, "b": 471.45081, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 285, "text": "Taxiways and aprons are shaded grey. Other runway features that may be shown are runway numbers, runway dimen-", "bbox": {"l": 449.10074000000003, "t": 469.32974, "r": 548.59674, "b": 471.45081, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 241, "label": "text", "bbox": {"l": 449.10074000000003, "t": 471.60843, "r": 500.08181999999994, "b": 473.72949, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 286, "text": "sions, runway slope, arresting gear, and displaced threshold.", "bbox": {"l": 449.10074000000003, "t": 471.60843, "r": 500.08181999999994, "b": 473.72949, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 242, "label": "text", "bbox": {"l": 449.10074000000003, "t": 476.16577, "r": 449.59933000000007, "b": 478.28687, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 287, "text": "2", "bbox": {"l": 449.10074000000003, "t": 476.16577, "r": 449.59933000000007, "b": 478.28687, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 243, "label": "text", "bbox": {"l": 450.09796, "t": 476.16577, "r": 547.82562, "b": 478.28687, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 288, "text": "W K H U L Q I R U P D W L R Q F R Q F H U Q L Q J O L J K W L Q J \u00bf Q D O D S S U R D F K E H D U L Q J V D L U S R U W E H D F R Q R E V W D F O H V F R Q W U R O W R Z H U 1 $ 9 $ , ' V K H O L ", "bbox": {"l": 450.09796, "t": 476.16577, "r": 547.82562, "b": 478.28687, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 244, "label": "text", "bbox": {"l": 547.82623, "t": 476.16577, "r": 548.45862, "b": 478.28687, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 289, "text": "-", "bbox": {"l": 547.82623, "t": 476.16577, "r": 548.45862, "b": 478.28687, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 245, "label": "text", "bbox": {"l": 449.10074000000003, "t": 478.44446, "r": 470.52609000000007, "b": 480.56555, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 290, "text": "pads may also be shown.", "bbox": {"l": 449.10074000000003, "t": 478.44446, "r": 470.52609000000007, "b": 480.56555, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 246, "label": "text", "bbox": {"l": 449.10074000000003, "t": 483.00183, "r": 493.37906000000004, "b": 485.12292, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 291, "text": "$ L U S R U W ( O H Y D W L R Q D Q G 7 R X F K G R Z Q = R Q H ( O H Y D W L R Q ", "bbox": {"l": 449.10074000000003, "t": 483.00183, "r": 493.37906000000004, "b": 485.12292, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 449.10074000000003, "t": 487.5592, "r": 551.80023, "b": 496.51636, "coord_origin": "TOPLEFT"}, "confidence": 0.5027860403060913, "cells": [{"id": 292, "text": "The airport elevation is shown enclosed within a box in the upper left corner of the sketch box and the touchdown zone ", "bbox": {"l": 449.10074000000003, "t": 487.5592, "r": 549.16168, "b": 489.6803, "coord_origin": "TOPLEFT"}}, {"id": 293, "text": "elevation (TDZE) is shown in the upper right corner of the sketch box. The airport elevation is the highest point of an ", "bbox": {"l": 449.10074000000003, "t": 489.83789, "r": 546.90881, "b": 491.95898, "coord_origin": "TOPLEFT"}}, {"id": 294, "text": "D L U S R U W \u00b6 V X V D E O H U X Q Z D \\ V P H D V X U H G L Q I H H W I U R P P H D Q V H D O H Y H O 7 K H 7 ' = ( L V W K H K L J K H V W H O H Y D W L R Q L Q W K H \u00bf U V W I H H W R I ", "bbox": {"l": 449.10074000000003, "t": 492.11658, "r": 551.80023, "b": 494.23767, "coord_origin": "TOPLEFT"}}, {"id": 295, "text": "the landing surface. Circling only approaches will not show a TDZE.", "bbox": {"l": 449.10074000000003, "t": 494.39526, "r": 505.85068000000007, "b": 496.51636, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 247, "label": "text", "bbox": {"l": 498.80661000000003, "t": 515.9437, "r": 502.08792, "b": 519.01764, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 296, "text": "114", "bbox": {"l": 498.80661000000003, "t": 515.9437, "r": 502.08792, "b": 519.01764, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 248, "label": "text", "bbox": {"l": 444.56319999999994, "t": 422.84869, "r": 446.25998, "b": 471.87128, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 297, "text": "FAA Chart Users\u2019 Guide - Terminal Procedures Publication (TPP) - Terms", "bbox": {"l": 444.56319999999994, "t": 422.84869, "r": 446.25998, "b": 471.87128, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 249, "label": "text", "bbox": {"l": 329.40536, "t": 379.37537, "r": 355.13138, "b": 382.13336, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 298, "text": "AGL 2013 Financial Calendar", "bbox": {"l": 329.40536, "t": 379.37537, "r": 355.13138, "b": 382.13336, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 250, "label": "text", "bbox": {"l": 329.40536, "t": 382.30273, "r": 330.96848, "b": 384.55927, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 299, "text": "22", "bbox": {"l": 329.40536, "t": 382.30273, "r": 330.96848, "b": 384.55927, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 251, "label": "text", "bbox": {"l": 331.75003, "t": 382.30273, "r": 341.12875, "b": 384.55927, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 300, "text": "August 2012 ", "bbox": {"l": 331.75003, "t": 382.30273, "r": 341.12875, "b": 384.55927, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 252, "label": "text", "bbox": {"l": 350.4722, "t": 382.30273, "r": 384.81079, "b": 384.55927, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 301, "text": "2012 full year result and fi nal dividend announced", "bbox": {"l": 350.4722, "t": 382.30273, "r": 384.81079, "b": 384.55927, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 253, "label": "text", "bbox": {"l": 329.40536, "t": 384.84552, "r": 330.97336, "b": 387.10205, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 302, "text": "30", "bbox": {"l": 329.40536, "t": 384.84552, "r": 330.97336, "b": 387.10205, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 254, "label": "text", "bbox": {"l": 331.75735, "t": 384.84552, "r": 341.16534, "b": 387.10205, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 303, "text": "August 2012 ", "bbox": {"l": 331.75735, "t": 384.84552, "r": 341.16534, "b": 387.10205, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 255, "label": "text", "bbox": {"l": 350.4722, "t": 384.84552, "r": 372.90613, "b": 387.10205, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 304, "text": "Ex-dividend trading commences", "bbox": {"l": 350.4722, "t": 384.84552, "r": 372.90613, "b": 387.10205, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 256, "label": "text", "bbox": {"l": 329.40536, "t": 387.38828, "r": 330.20337, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 305, "text": "5", "bbox": {"l": 329.40536, "t": 387.38828, "r": 330.20337, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 257, "label": "text", "bbox": {"l": 331.00137, "t": 387.38828, "r": 342.9715, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 306, "text": "September 2012 ", "bbox": {"l": 331.00137, "t": 387.38828, "r": 342.9715, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 258, "label": "text", "bbox": {"l": 350.4722, "t": 387.38828, "r": 374.88693, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 307, "text": "Record date for 2012 fi nal dividend", "bbox": {"l": 350.4722, "t": 387.38828, "r": 374.88693, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 259, "label": "text", "bbox": {"l": 329.40536, "t": 389.93103, "r": 331.0173, "b": 392.18762, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 308, "text": "27", "bbox": {"l": 329.40536, "t": 389.93103, "r": 331.0173, "b": 392.18762, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 260, "label": "text", "bbox": {"l": 331.82327, "t": 389.93103, "r": 343.91284, "b": 392.18762, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 309, "text": "September 2012 ", "bbox": {"l": 331.82327, "t": 389.93103, "r": 343.91284, "b": 392.18762, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 261, "label": "text", "bbox": {"l": 350.4722, "t": 389.93103, "r": 365.65988, "b": 392.18762, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 310, "text": "Final dividend payable", "bbox": {"l": 350.4722, "t": 389.93103, "r": 365.65988, "b": 392.18762, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 262, "label": "text", "bbox": {"l": 329.40536, "t": 392.47382, "r": 330.98804, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 311, "text": "23", "bbox": {"l": 329.40536, "t": 392.47382, "r": 330.98804, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 263, "label": "text", "bbox": {"l": 331.77936, "t": 392.47382, "r": 342.06674, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 312, "text": "October 2012 ", "bbox": {"l": 331.77936, "t": 392.47382, "r": 342.06674, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 264, "label": "text", "bbox": {"l": 350.4722, "t": 392.47382, "r": 367.22156, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 313, "text": "Annual General Meeting", "bbox": {"l": 350.4722, "t": 392.47382, "r": 367.22156, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 265, "label": "text", "bbox": {"l": 329.40536, "t": 395.0166, "r": 330.99741, "b": 397.27313, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 314, "text": "27", "bbox": {"l": 329.40536, "t": 395.0166, "r": 330.99741, "b": 397.27313, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 266, "label": "text", "bbox": {"l": 331.7934, "t": 395.0166, "r": 342.1416, "b": 397.27313, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 315, "text": "February 2013", "bbox": {"l": 331.7934, "t": 395.0166, "r": 342.1416, "b": 397.27313, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 267, "label": "text", "bbox": {"l": 342.64841, "t": 395.18298, "r": 342.65811, "b": 396.49857000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 316, "text": " 1", "bbox": {"l": 342.64841, "t": 395.18298, "r": 342.65811, "b": 396.49857000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 268, "label": "text", "bbox": {"l": 350.47177, "t": 395.01474, "r": 386.25897, "b": 397.2713, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 317, "text": "2013 interim result and interim dividend announced", "bbox": {"l": 350.47177, "t": 395.01474, "r": 386.25897, "b": 397.2713, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 269, "label": "text", "bbox": {"l": 329.40491, "t": 397.55749999999995, "r": 331.02695, "b": 399.81406, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 318, "text": "28", "bbox": {"l": 329.40491, "t": 397.55749999999995, "r": 331.02695, "b": 399.81406, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 270, "label": "text", "bbox": {"l": 331.83795, "t": 397.55749999999995, "r": 340.75909, "b": 399.81406, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 319, "text": "August 2013", "bbox": {"l": 331.83795, "t": 397.55749999999995, "r": 340.75909, "b": 399.81406, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 271, "label": "text", "bbox": {"l": 341.26437, "t": 397.7254, "r": 341.27408, "b": 399.04095, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 320, "text": " 1", "bbox": {"l": 341.26437, "t": 397.7254, "r": 341.27408, "b": 399.04095, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 272, "label": "text", "bbox": {"l": 350.47144, "t": 397.55713, "r": 385.93265, "b": 399.81369, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 321, "text": "2013 full year results and fi nal dividend announced ", "bbox": {"l": 350.47144, "t": 397.55713, "r": 385.93265, "b": 399.81369, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 273, "label": "text", "bbox": {"l": 329.40536, "t": 400.46155, "r": 329.87708, "b": 401.96588, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 322, "text": "1", "bbox": {"l": 329.40536, "t": 400.46155, "r": 329.87708, "b": 401.96588, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 274, "label": "text", "bbox": {"l": 330.34882, "t": 400.46155, "r": 358.65204, "b": 401.96588, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 323, "text": "Indicative dates only, subject to change/Board confi rmation", "bbox": {"l": 330.34882, "t": 400.46155, "r": 358.65204, "b": 401.96588, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 275, "label": "text", "bbox": {"l": 329.40536, "t": 404.34503, "r": 391.771, "b": 406.60156, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 324, "text": "AGL\u2019s Annual General Meeting will be held at the City Recital Hall, Angel Place, Sydney ", "bbox": {"l": 329.40536, "t": 404.34503, "r": 391.771, "b": 406.60156, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 276, "label": "text", "bbox": {"l": 329.40536, "t": 406.37857, "r": 369.65308, "b": 408.63513000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 325, "text": "commencing at 10.30am on Tuesday 23 October 2012.", "bbox": {"l": 329.40536, "t": 406.37857, "r": 369.65308, "b": 408.63513000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 277, "label": "text", "bbox": {"l": 363.54486, "t": 460.53054999999995, "r": 379.25955, "b": 465.54507, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 326, "text": "Ye s te rd ay", "bbox": {"l": 363.54486, "t": 460.53054999999995, "r": 379.25955, "b": 465.54507, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 278, "label": "text", "bbox": {"l": 363.54486, "t": 466.7157, "r": 391.38229, "b": 468.97223, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 327, "text": "Established in Sydney in 1837, and then ", "bbox": {"l": 363.54486, "t": 466.7157, "r": 391.38229, "b": 468.97223, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 279, "label": "text", "bbox": {"l": 363.54486, "t": 468.74924, "r": 395.01788, "b": 471.00577, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 328, "text": "known as The Australian Gas Light Company, ", "bbox": {"l": 363.54486, "t": 468.74924, "r": 395.01788, "b": 471.00577, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 280, "label": "text", "bbox": {"l": 363.54486, "t": 470.78281, "r": 394.08322, "b": 473.03934, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 329, "text": "the AGL business has an established history ", "bbox": {"l": 363.54486, "t": 470.78281, "r": 394.08322, "b": 473.03934, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 281, "label": "text", "bbox": {"l": 363.54486, "t": 472.81635, "r": 390.60727, "b": 475.07288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 330, "text": "and reputation for serving the gas and ", "bbox": {"l": 363.54486, "t": 472.81635, "r": 390.60727, "b": 475.07288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 282, "label": "text", "bbox": {"l": 363.54486, "t": 474.84988, "r": 393.49612, "b": 477.10645, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 331, "text": "electricity needs of Australian households. ", "bbox": {"l": 363.54486, "t": 474.84988, "r": 393.49612, "b": 477.10645, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 283, "label": "text", "bbox": {"l": 363.54486, "t": 476.88345, "r": 394.11481, "b": 479.13998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 332, "text": "In 1841, when AGL supplied the gas to light ", "bbox": {"l": 363.54486, "t": 476.88345, "r": 394.11481, "b": 479.13998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 284, "label": "text", "bbox": {"l": 363.54486, "t": 478.91699, "r": 393.75891, "b": 481.17352, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 333, "text": "the fi rst public street lamp, it was reported ", "bbox": {"l": 363.54486, "t": 478.91699, "r": 393.75891, "b": 481.17352, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 285, "label": "text", "bbox": {"l": 363.54486, "t": 480.95053, "r": 390.4975, "b": 483.20709, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 334, "text": "in the Sydney Gazette as a \u201cwonderful ", "bbox": {"l": 363.54486, "t": 480.95053, "r": 390.4975, "b": 483.20709, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 286, "label": "text", "bbox": {"l": 363.54486, "t": 482.9841, "r": 395.70975, "b": 485.24063, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 335, "text": "achievement of scientifi c knowledge, assisted ", "bbox": {"l": 363.54486, "t": 482.9841, "r": 395.70975, "b": 485.24063, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 287, "label": "text", "bbox": {"l": 363.54486, "t": 485.01764, "r": 394.27283, "b": 487.2742, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 336, "text": "by mechanical ingenuity.\u201d Within two years, ", "bbox": {"l": 363.54486, "t": 485.01764, "r": 394.27283, "b": 487.2742, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 288, "label": "text", "bbox": {"l": 363.54486, "t": 487.05121, "r": 396.65939, "b": 489.30774, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 337, "text": "165 gas lamps were lighting the City of Sydney.", "bbox": {"l": 363.54486, "t": 487.05121, "r": 396.65939, "b": 489.30774, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 289, "label": "text", "bbox": {"l": 329.4054, "t": 419.93124, "r": 384.19696, "b": 431.09412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 338, "text": "Looking back on ", "bbox": {"l": 329.4054, "t": 419.93124, "r": 384.19696, "b": 431.09412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 290, "label": "text", "bbox": {"l": 329.4054, "t": 430.10379, "r": 372.16626, "b": 441.26669, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 339, "text": "175 years of ", "bbox": {"l": 329.4054, "t": 430.10379, "r": 372.16626, "b": 441.26669, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 291, "label": "text", "bbox": {"l": 329.4054, "t": 440.27636999999993, "r": 385.3981, "b": 451.43924, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 340, "text": "looking forward.", "bbox": {"l": 329.4054, "t": 440.27636999999993, "r": 385.3981, "b": 451.43924, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 292, "label": "text", "bbox": {"l": 329.40536, "t": 372.16159, "r": 353.36179, "b": 373.91669, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 341, "text": "AGL Energy Limited ABN 74 115 061 375", "bbox": {"l": 329.40536, "t": 372.16159, "r": 353.36179, "b": 373.91669, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 293, "label": "text", "bbox": {"l": 546.20587, "t": 360.90448, "r": 548.23407, "b": 362.82242, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 342, "text": "29", "bbox": {"l": 546.20587, "t": 360.90448, "r": 548.23407, "b": 362.82242, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 294, "label": "text", "bbox": {"l": 497.77728, "t": 251.43384000000003, "r": 542.8255, "b": 254.94385, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 343, "text": "signs, signals and road markings", "bbox": {"l": 497.77728, "t": 251.43384000000003, "r": 542.8255, "b": 254.94385, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 295, "label": "text", "bbox": {"l": 490.30679, "t": 251.47478999999998, "r": 492.09982, "b": 254.98479999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 344, "text": "3", "bbox": {"l": 490.30679, "t": 251.47478999999998, "r": 492.09982, "b": 254.98479999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 296, "label": "text", "bbox": {"l": 498.15335, "t": 263.88922, "r": 500.05637, "b": 265.92719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 345, "text": "In ", "bbox": {"l": 498.15335, "t": 263.88922, "r": 500.05637, "b": 265.92719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 297, "label": "text", "bbox": {"l": 500.05637, "t": 263.85717999999997, "r": 524.37036, "b": 265.86310000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 346, "text": "chapter 2, you and your vehicle", "bbox": {"l": 500.05637, "t": 263.85717999999997, "r": 524.37036, "b": 265.86310000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 298, "label": "text", "bbox": {"l": 524.37036, "t": 263.88922, "r": 539.89124, "b": 265.92719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 347, "text": ", you learned about ", "bbox": {"l": 524.37036, "t": 263.88922, "r": 539.89124, "b": 265.92719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 299, "label": "text", "bbox": {"l": 498.15335, "t": 265.93224999999995, "r": 544.50403, "b": 267.97020999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 348, "text": "some of the controls in your vehicle. This chapter is a handy ", "bbox": {"l": 498.15335, "t": 265.93224999999995, "r": 544.50403, "b": 267.97020999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 300, "label": "text", "bbox": {"l": 498.15335, "t": 267.97533999999996, "r": 544.01343, "b": 270.01331000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 349, "text": "reference section that gives examples of the most common ", "bbox": {"l": 498.15335, "t": 267.97533999999996, "r": 544.01343, "b": 270.01331000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 301, "label": "text", "bbox": {"l": 498.15335, "t": 270.01831000000004, "r": 544.11987, "b": 272.05634, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 350, "text": "signs, signals and road markings that keep traffi c organized ", "bbox": {"l": 498.15335, "t": 270.01831000000004, "r": 544.11987, "b": 272.05634, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 302, "label": "text", "bbox": {"l": 498.15335, "t": 272.06140000000005, "r": 515.41071, "b": 274.09937, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 351, "text": "and flowing smoothly. ", "bbox": {"l": 498.15335, "t": 272.06140000000005, "r": 515.41071, "b": 274.09937, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 303, "label": "text", "bbox": {"l": 498.15335, "t": 277.34619, "r": 505.64642000000003, "b": 280.9357, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 352, "text": "Signs", "bbox": {"l": 498.15335, "t": 277.34619, "r": 505.64642000000003, "b": 280.9357, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 304, "label": "text", "bbox": {"l": 498.15335, "t": 281.82187, "r": 543.92957, "b": 283.85983, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 353, "text": "There are three ways to read signs: by their shape, colour and ", "bbox": {"l": 498.15335, "t": 281.82187, "r": 543.92957, "b": 283.85983, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 305, "label": "text", "bbox": {"l": 498.15335, "t": 283.8649, "r": 545.67834, "b": 285.90289, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 354, "text": "the messages printed on them. Understanding these three ways ", "bbox": {"l": 498.15335, "t": 283.8649, "r": 545.67834, "b": 285.90289, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 306, "label": "text", "bbox": {"l": 498.15335, "t": 285.90796, "r": 545.26471, "b": 287.94592, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 355, "text": "of classifying signs will help you figure out the meaning of signs ", "bbox": {"l": 498.15335, "t": 285.90796, "r": 545.26471, "b": 287.94592, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 307, "label": "text", "bbox": {"l": 498.15335, "t": 287.95099, "r": 513.31335, "b": 289.98895, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 356, "text": "that are new to you. ", "bbox": {"l": 498.15335, "t": 287.95099, "r": 513.31335, "b": 289.98895, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 308, "label": "text", "bbox": {"l": 505.43439, "t": 303.07596, "r": 508.53033000000005, "b": 304.89639, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 357, "text": "Stop", "bbox": {"l": 505.43439, "t": 303.07596, "r": 508.53033000000005, "b": 304.89639, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 309, "label": "text", "bbox": {"l": 527.45502, "t": 303.25354, "r": 541.44678, "b": 305.07397, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 358, "text": "Yield the right-of-way", "bbox": {"l": 527.45502, "t": 303.25354, "r": 541.44678, "b": 305.07397, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 310, "label": "text", "bbox": {"l": 501.79385, "t": 321.18973, "r": 510.41632, "b": 323.01016, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 359, "text": "Shows driving", "bbox": {"l": 501.79385, "t": 321.18973, "r": 510.41632, "b": 323.01016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 311, "label": "text", "bbox": {"l": 501.79385, "t": 322.87731999999994, "r": 509.04268999999994, "b": 324.69775000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 360, "text": "regulations", "bbox": {"l": 501.79385, "t": 322.87731999999994, "r": 509.04268999999994, "b": 324.69775000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 312, "label": "text", "bbox": {"l": 518.66455, "t": 319.59146, "r": 529.80902, "b": 321.41190000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 361, "text": "Explains lane use", "bbox": {"l": 518.66455, "t": 319.59146, "r": 529.80902, "b": 321.41190000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 313, "label": "text", "bbox": {"l": 534.87561, "t": 318.37616, "r": 546.95142, "b": 320.19659, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 362, "text": "School zone signs ", "bbox": {"l": 534.87561, "t": 318.37616, "r": 546.95142, "b": 320.19659, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 314, "label": "text", "bbox": {"l": 534.87561, "t": 320.0637500000001, "r": 545.05762, "b": 321.88419, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 363, "text": "are fl uorescent ", "bbox": {"l": 534.87561, "t": 320.0637500000001, "r": 545.05762, "b": 321.88419, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 315, "label": "text", "bbox": {"l": 534.87561, "t": 321.75134, "r": 543.32263, "b": 323.57178, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 364, "text": "yellow-green", "bbox": {"l": 534.87561, "t": 321.75134, "r": 543.32263, "b": 323.57178, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 316, "label": "text", "bbox": {"l": 499.21862999999996, "t": 338.12772, "r": 512.62451, "b": 339.94815, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 365, "text": "Tells about motorist ", "bbox": {"l": 499.21862999999996, "t": 338.12772, "r": 512.62451, "b": 339.94815, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 317, "label": "text", "bbox": {"l": 499.21862999999996, "t": 339.81531000000007, "r": 504.39917, "b": 341.63574, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 366, "text": "services", "bbox": {"l": 499.21862999999996, "t": 339.81531000000007, "r": 504.39917, "b": 341.63574, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 318, "label": "text", "bbox": {"l": 516.97748, "t": 338.06039, "r": 529.77484, "b": 339.88082999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 367, "text": "Shows a permitted ", "bbox": {"l": 516.97748, "t": 338.06039, "r": 529.77484, "b": 339.88082999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 319, "label": "text", "bbox": {"l": 516.97748, "t": 339.74799, "r": 520.96399, "b": 341.56842, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 368, "text": "action", "bbox": {"l": 516.97748, "t": 339.74799, "r": 520.96399, "b": 341.56842, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 320, "label": "text", "bbox": {"l": 534.55847, "t": 337.88281, "r": 548.58453, "b": 339.7032500000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 369, "text": "Shows an action that ", "bbox": {"l": 534.55847, "t": 337.88281, "r": 548.58453, "b": 339.7032500000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 321, "label": "text", "bbox": {"l": 534.55847, "t": 339.57040000000006, "r": 545.08862, "b": 341.39084, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 370, "text": "is not permitted", "bbox": {"l": 534.55847, "t": 339.57040000000006, "r": 545.08862, "b": 341.39084, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 322, "label": "text", "bbox": {"l": 483.05853, "t": 356.17416, "r": 494.72577, "b": 357.9946, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 371, "text": "Warns of hazards ", "bbox": {"l": 483.05853, "t": 356.17416, "r": 494.72577, "b": 357.9946, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 323, "label": "text", "bbox": {"l": 483.05853, "t": 357.86179, "r": 487.07525999999996, "b": 359.68222, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 372, "text": "ahead", "bbox": {"l": 483.05853, "t": 357.86179, "r": 487.07525999999996, "b": 359.68222, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 324, "label": "text", "bbox": {"l": 499.39645, "t": 356.26297000000005, "r": 504.69171, "b": 358.0834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 373, "text": "Warns of", "bbox": {"l": 499.39645, "t": 356.26297000000005, "r": 504.69171, "b": 358.0834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 325, "label": "text", "bbox": {"l": 499.39645, "t": 357.95056, "r": 511.69116, "b": 359.77099999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 374, "text": "construction zones", "bbox": {"l": 499.39645, "t": 357.95056, "r": 511.69116, "b": 359.77099999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 326, "label": "text", "bbox": {"l": 516.75891, "t": 356.26297000000005, "r": 527.42938, "b": 358.0834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 375, "text": "Railway crossing", "bbox": {"l": 516.75891, "t": 356.26297000000005, "r": 527.42938, "b": 358.0834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 327, "label": "text", "bbox": {"l": 534.5141, "t": 352.92981, "r": 547.89862, "b": 354.75024, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 376, "text": "Shows distance and ", "bbox": {"l": 534.5141, "t": 352.92981, "r": 547.89862, "b": 354.75024, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 328, "label": "text", "bbox": {"l": 534.5141, "t": 354.6174, "r": 540.2818, "b": 356.43784, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 377, "text": "direction", "bbox": {"l": 534.5141, "t": 354.6174, "r": 540.2818, "b": 356.43784, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 329, "label": "text", "bbox": {"l": 478.37466, "t": 270.14075, "r": 479.14251999999993, "b": 272.17877, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 378, "text": "\u2022", "bbox": {"l": 478.37466, "t": 270.14075, "r": 479.14251999999993, "b": 272.17877, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 330, "label": "text", "bbox": {"l": 479.91036999999994, "t": 270.14075, "r": 483.74963, "b": 272.17877, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 379, "text": "Signs", "bbox": {"l": 479.91036999999994, "t": 270.14075, "r": 483.74963, "b": 272.17877, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 331, "label": "text", "bbox": {"l": 479.97293, "t": 272.84717, "r": 492.31219, "b": 274.34888, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 380, "text": "- regulatory signs", "bbox": {"l": 479.97293, "t": 272.84717, "r": 492.31219, "b": 274.34888, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 332, "label": "text", "bbox": {"l": 479.97293, "t": 275.14513999999997, "r": 486.72598000000005, "b": 276.64679, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 381, "text": "- school, ", "bbox": {"l": 479.97293, "t": 275.14513999999997, "r": 486.72598000000005, "b": 276.64679, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 333, "label": "text", "bbox": {"l": 481.21602999999993, "t": 276.77972, "r": 492.93286000000006, "b": 278.81768999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 382, "text": "playground and ", "bbox": {"l": 481.21602999999993, "t": 276.77972, "r": 492.93286000000006, "b": 278.81768999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 334, "label": "text", "bbox": {"l": 481.21602999999993, "t": 278.82275000000004, "r": 491.82938000000007, "b": 280.86075, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 383, "text": "crosswalk signs", "bbox": {"l": 481.21602999999993, "t": 278.82275000000004, "r": 491.82938000000007, "b": 280.86075, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 335, "label": "text", "bbox": {"l": 479.97293, "t": 281.52759, "r": 491.00775000000004, "b": 283.02924, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 384, "text": "- lane use signs", "bbox": {"l": 479.97293, "t": 281.52759, "r": 491.00775000000004, "b": 283.02924, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 336, "label": "text", "bbox": {"l": 479.97293, "t": 283.82556, "r": 493.32748, "b": 285.3272099999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 385, "text": "- turn control signs", "bbox": {"l": 479.97293, "t": 283.82556, "r": 493.32748, "b": 285.3272099999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 337, "label": "text", "bbox": {"l": 479.97293, "t": 286.1235, "r": 490.4915199999999, "b": 287.62518, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 386, "text": "- parking signs", "bbox": {"l": 479.97293, "t": 286.1235, "r": 490.4915199999999, "b": 287.62518, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 338, "label": "text", "bbox": {"l": 479.97293, "t": 288.42148, "r": 491.17004000000003, "b": 289.92316, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 387, "text": "- reserved lane ", "bbox": {"l": 479.97293, "t": 288.42148, "r": 491.17004000000003, "b": 289.92316, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 339, "label": "text", "bbox": {"l": 481.21602999999993, "t": 290.05605999999995, "r": 484.77405000000005, "b": 292.09406, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 388, "text": "signs", "bbox": {"l": 481.21602999999993, "t": 290.05605999999995, "r": 484.77405000000005, "b": 292.09406, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 340, "label": "text", "bbox": {"l": 479.97293, "t": 292.76169000000004, "r": 490.83398, "b": 294.26334, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 389, "text": "- warning signs", "bbox": {"l": 479.97293, "t": 292.76169000000004, "r": 490.83398, "b": 294.26334, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 341, "label": "text", "bbox": {"l": 479.97293, "t": 295.05963, "r": 491.62692, "b": 296.56131, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 390, "text": "- object markers", "bbox": {"l": 479.97293, "t": 295.05963, "r": 491.62692, "b": 296.56131, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 342, "label": "text", "bbox": {"l": 479.97293, "t": 297.3576, "r": 490.37341, "b": 298.8592499999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 391, "text": "- construction ", "bbox": {"l": 479.97293, "t": 297.3576, "r": 490.37341, "b": 298.8592499999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 343, "label": "text", "bbox": {"l": 481.21602999999993, "t": 298.99219, "r": 484.77405000000005, "b": 301.03015, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 392, "text": "signs", "bbox": {"l": 481.21602999999993, "t": 298.99219, "r": 484.77405000000005, "b": 301.03015, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 344, "label": "text", "bbox": {"l": 479.97293, "t": 301.69780999999995, "r": 492.93912, "b": 303.19946, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 393, "text": "- information and ", "bbox": {"l": 479.97293, "t": 301.69780999999995, "r": 492.93912, "b": 303.19946, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 345, "label": "text", "bbox": {"l": 481.21602999999993, "t": 303.3324, "r": 493.00525, "b": 305.37036, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 394, "text": "destination signs", "bbox": {"l": 481.21602999999993, "t": 303.3324, "r": 493.00525, "b": 305.37036, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 346, "label": "text", "bbox": {"l": 479.97293, "t": 306.0379899999999, "r": 489.99047999999993, "b": 307.53967, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 395, "text": "- railway signs", "bbox": {"l": 479.97293, "t": 306.0379899999999, "r": 489.99047999999993, "b": 307.53967, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 347, "label": "text", "bbox": {"l": 478.375, "t": 308.24789, "r": 479.1032400000001, "b": 310.28586, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 396, "text": "\u2022", "bbox": {"l": 478.375, "t": 308.24789, "r": 479.1032400000001, "b": 310.28586, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 348, "label": "text", "bbox": {"l": 479.83151, "t": 308.24789, "r": 484.92925999999994, "b": 310.28586, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 397, "text": "Signals", "bbox": {"l": 479.83151, "t": 308.24789, "r": 484.92925999999994, "b": 310.28586, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 349, "label": "text", "bbox": {"l": 479.97293, "t": 310.95358, "r": 490.00091999999995, "b": 312.45526, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 398, "text": "- lane control ", "bbox": {"l": 479.97293, "t": 310.95358, "r": 490.00091999999995, "b": 312.45526, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 350, "label": "text", "bbox": {"l": 481.21602999999993, "t": 312.5881999999999, "r": 485.95331, "b": 314.62616, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 399, "text": "signals", "bbox": {"l": 481.21602999999993, "t": 312.5881999999999, "r": 485.95331, "b": 314.62616, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 351, "label": "text", "bbox": {"l": 479.97293, "t": 315.29379, "r": 489.29876999999993, "b": 316.79544, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 400, "text": "- traffic lights", "bbox": {"l": 479.97293, "t": 315.29379, "r": 489.29876999999993, "b": 316.79544, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 352, "label": "text", "bbox": {"l": 478.375, "t": 317.50366, "r": 479.18129999999996, "b": 319.5416599999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 401, "text": "\u2022", "bbox": {"l": 478.375, "t": 317.50366, "r": 479.18129999999996, "b": 319.5416599999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 353, "label": "text", "bbox": {"l": 479.98761, "t": 317.50366, "r": 490.46960000000007, "b": 319.5416599999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 402, "text": "Road markings", "bbox": {"l": 479.98761, "t": 317.50366, "r": 490.46960000000007, "b": 319.5416599999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 354, "label": "text", "bbox": {"l": 479.97293, "t": 320.20938, "r": 489.26166000000006, "b": 321.71103, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 403, "text": "- yellow lines", "bbox": {"l": 479.97293, "t": 320.20938, "r": 489.26166000000006, "b": 321.71103, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 355, "label": "text", "bbox": {"l": 479.97293, "t": 322.50732, "r": 488.59189, "b": 324.009, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 404, "text": "- white lines", "bbox": {"l": 479.97293, "t": 322.50732, "r": 488.59189, "b": 324.009, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 356, "label": "text", "bbox": {"l": 479.97293, "t": 324.8053, "r": 491.17004000000003, "b": 326.30698, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 405, "text": "- reserved lane ", "bbox": {"l": 479.97293, "t": 324.8053, "r": 491.17004000000003, "b": 326.30698, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 357, "label": "text", "bbox": {"l": 481.21602999999993, "t": 326.43988, "r": 487.58978, "b": 328.47784, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 406, "text": "markings", "bbox": {"l": 481.21602999999993, "t": 326.43988, "r": 487.58978, "b": 328.47784, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 358, "label": "text", "bbox": {"l": 479.97293, "t": 329.14551, "r": 491.75177, "b": 330.64716, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 407, "text": "- other markings", "bbox": {"l": 479.97293, "t": 329.14551, "r": 491.75177, "b": 330.64716, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 359, "label": "text", "bbox": {"l": 478.15246999999994, "t": 265.07030999999995, "r": 493.75586, "b": 268.06872999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 408, "text": "in this chapter", "bbox": {"l": 478.15246999999994, "t": 265.07030999999995, "r": 493.75586, "b": 268.06872999999996, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "caption", "id": 16, "page_no": 0, "cluster": {"id": 16, "label": "caption", "bbox": {"l": 317.95499, "t": 540.08299, "r": 559.80579, "b": 559.51524, "coord_origin": "TOPLEFT"}, "confidence": 0.7793365120887756, "cells": [{"id": 409, "text": "Figure 1: Four examples of complex page layouts across dif-", "bbox": {"l": 317.95499, "t": 540.08299, "r": 559.80579, "b": 548.55624, "coord_origin": "TOPLEFT"}}, {"id": 410, "text": "ferent document categories", "bbox": {"l": 317.95499, "t": 551.0419899999999, "r": 428.69907, "b": 559.51524, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 1: Four examples of complex page layouts across different document categories"}, {"label": "section_header", "id": 3, "page_no": 0, "cluster": {"id": 3, "label": "section_header", "bbox": {"l": 317.95499, "t": 592.46591, "r": 379.8205, "b": 602.7750100000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9208476543426514, "cells": [{"id": 411, "text": "KEYWORDS", "bbox": {"l": 317.95499, "t": 592.46591, "r": 379.8205, "b": 602.7750100000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "KEYWORDS"}, {"label": "text", "id": 1, "page_no": 0, "cluster": {"id": 1, "label": "text", "bbox": {"l": 317.95499, "t": 607.66756, "r": 559.18597, "b": 627.00117, "coord_origin": "TOPLEFT"}, "confidence": 0.9509093761444092, "cells": [{"id": 412, "text": "PDF document conversion, layout segmentation, object-detection,", "bbox": {"l": 317.95499, "t": 607.66756, "r": 559.18597, "b": 616.04218, "coord_origin": "TOPLEFT"}}, {"id": 413, "text": "data set, Machine Learning", "bbox": {"l": 317.95499, "t": 618.62656, "r": 416.94403, "b": 627.00117, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "PDF document conversion, layout segmentation, object-detection, data set, Machine Learning"}, {"label": "section_header", "id": 7, "page_no": 0, "cluster": {"id": 7, "label": "section_header", "bbox": {"l": 317.65997, "t": 640.05434, "r": 404.65366, "b": 647.58609, "coord_origin": "TOPLEFT"}, "confidence": 0.8721988797187805, "cells": [{"id": 414, "text": "ACM Reference Format:", "bbox": {"l": 317.65997, "t": 640.05434, "r": 404.65366, "b": 647.58609, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "ACM Reference Format:"}, {"label": "text", "id": 2, "page_no": 0, "cluster": {"id": 2, "label": "text", "bbox": {"l": 317.95499, "t": 650.11996, "r": 559.5495, "b": 707.377029, "coord_origin": "TOPLEFT"}, "confidence": 0.9455165863037109, "cells": [{"id": 415, "text": "Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter", "bbox": {"l": 317.95499, "t": 650.11996, "r": 558.35266, "b": 657.56404, "coord_origin": "TOPLEFT"}}, {"id": 416, "text": "Staar. 2022. DocLayNet: A Large Human-Annotated Dataset for Document-", "bbox": {"l": 317.95499, "t": 660.08296, "r": 559.5495, "b": 667.52703, "coord_origin": "TOPLEFT"}}, {"id": 417, "text": "Layout Analysis. In", "bbox": {"l": 317.95499, "t": 670.04497, "r": 383.30807, "b": 677.48904, "coord_origin": "TOPLEFT"}}, {"id": 418, "text": "Proceedings of the 28th ACM SIGKDD Conference on", "bbox": {"l": 385.798, "t": 670.08482, "r": 558.20032, "b": 677.49701, "coord_origin": "TOPLEFT"}}, {"id": 419, "text": "Knowledge Discovery and Data Mining (KDD \u201922), August 14-18, 2022, Wash-", "bbox": {"l": 317.95499, "t": 680.04781, "r": 559.00092, "b": 687.46001, "coord_origin": "TOPLEFT"}}, {"id": 420, "text": "ington, DC, USA.", "bbox": {"l": 317.95499, "t": 690.01081, "r": 370.11481, "b": 697.423004, "coord_origin": "TOPLEFT"}}, {"id": 421, "text": "ACM, New York, NY, USA, 9 pages. https://doi.org/10.1145/", "bbox": {"l": 371.82999, "t": 689.97096, "r": 558.71655, "b": 697.415031, "coord_origin": "TOPLEFT"}}, {"id": 422, "text": "3534678.3539043", "bbox": {"l": 317.95499, "t": 699.932953, "r": 371.59375, "b": 707.377029, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar. 2022. DocLayNet: A Large Human-Annotated Dataset for DocumentLayout Analysis. In Proceedings of the 28th ACM SIGKDD Conference on Knowledge Discovery and Data Mining (KDD '22), August 14-18, 2022, Washington, DC, USA. ACM, New York, NY, USA, 9 pages. https://doi.org/10.1145/ 3534678.3539043"}], "headers": [{"label": "page_header", "id": 10, "page_no": 0, "cluster": {"id": 10, "label": "page_header", "bbox": {"l": 18.34021, "t": 218.35999000000004, "r": 36.339794, "b": 555.00003, "coord_origin": "TOPLEFT"}, "confidence": 0.8537883758544922, "cells": [{"id": 423, "text": "arXiv:2206.01062v1 [cs.CV] 2 Jun 2022", "bbox": {"l": 18.34021, "t": 218.35999000000004, "r": 36.339794, "b": 555.00003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "arXiv:2206.01062v1 [cs.CV] 2 Jun 2022"}]}}, {"page_no": 1, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 246.24382, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar", "bbox": {"l": 253.13897999999998, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "1", "bbox": {"l": 53.79800000000001, "t": 85.85986000000003, "r": 59.427395, "b": 96.16900999999996, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "INTRODUCTION", "bbox": {"l": 70.379532, "t": 85.85986000000003, "r": 156.52899, "b": 96.16900999999996, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Despite the substantial improvements achieved with machine-learning", "bbox": {"l": 53.79800000000001, "t": 110.98352, "r": 303.01697, "b": 119.35815000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "(ML) approaches and deep neural networks in recent years, docu-", "bbox": {"l": 53.528999, "t": 121.94256999999993, "r": 295.55695, "b": 130.31719999999996, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "ment conversion remains a challenging problem, as demonstrated", "bbox": {"l": 53.79800000000001, "t": 132.90155000000004, "r": 294.04642, "b": 141.27617999999995, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "by the numerous public competitions held on this topic [1-4]. The", "bbox": {"l": 53.79800000000001, "t": 143.85956, "r": 294.04733, "b": 152.23419, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "challenge originates from the huge variability in PDF documents", "bbox": {"l": 53.79800000000001, "t": 154.81853999999998, "r": 294.04349, "b": 163.19317999999998, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "regarding layout, language and formats (scanned, programmatic", "bbox": {"l": 53.79800000000001, "t": 165.77752999999996, "r": 294.04718, "b": 174.15215999999998, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "or a combination of both). Engineering a single ML model that can", "bbox": {"l": 53.79800000000001, "t": 176.73650999999995, "r": 294.04919, "b": 185.11114999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "be applied on all types of documents and provides high-quality", "bbox": {"l": 53.79800000000001, "t": 187.69556, "r": 294.27573, "b": 196.07019000000003, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "layout segmentation remains to this day extremely challenging [5].", "bbox": {"l": 53.79800000000001, "t": 198.65454, "r": 295.42569, "b": 207.02917000000002, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "To highlight the variability in document layouts, we show a few", "bbox": {"l": 53.528999, "t": 209.61352999999997, "r": 294.37256, "b": 217.98816, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "example documents from the DocLayNet dataset in Figure 1.", "bbox": {"l": 53.79800000000001, "t": 220.57250999999997, "r": 275.48334, "b": 228.94714, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "A key problem in the process of document conversion is to under-", "bbox": {"l": 63.76100199999999, "t": 231.53156, "r": 295.564, "b": 239.90619000000004, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "stand the structure of a single document page, i.e. which segments", "bbox": {"l": 53.79800000000001, "t": 242.49054, "r": 294.04868, "b": 250.86517000000003, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "of text should be grouped together in a unit. To train models for this", "bbox": {"l": 53.79800000000001, "t": 253.44854999999995, "r": 294.04532, "b": 261.82318, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "task, there are currently two large datasets available to the com-", "bbox": {"l": 53.79800000000001, "t": 264.40752999999995, "r": 295.55618, "b": 272.78216999999995, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "munity, PubLayNet [6] and DocBank [7]. They were introduced", "bbox": {"l": 53.79800000000001, "t": 275.36658, "r": 294.04059, "b": 283.74118, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "in 2019 and 2020 respectively and significantly accelerated the im-", "bbox": {"l": 53.79800000000001, "t": 286.32552999999996, "r": 295.55783, "b": 294.70016, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "plementation of layout detection and segmentation models due to", "bbox": {"l": 53.79800000000001, "t": 297.28455, "r": 294.04538, "b": 305.65918000000005, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "their sizes of 300K and 500K ground-truth pages. These sizes were", "bbox": {"l": 53.79800000000001, "t": 308.24353, "r": 294.043, "b": 316.61816, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "achieved by leveraging an automation approach. The benefit of au-", "bbox": {"l": 53.79800000000001, "t": 319.20255, "r": 295.56412, "b": 327.57718, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "tomated ground-truth generation is obvious: one can generate large", "bbox": {"l": 53.79800000000001, "t": 330.16153, "r": 294.04532, "b": 338.53616, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "ground-truth datasets at virtually no cost. However, the automation", "bbox": {"l": 53.79800000000001, "t": 341.12054, "r": 294.04538, "b": 349.49518, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "introduces a constraint on the variability in the dataset, because", "bbox": {"l": 53.79800000000001, "t": 352.07953, "r": 294.04712, "b": 360.45416000000006, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "corresponding structured source data must be available. PubLayNet", "bbox": {"l": 53.79800000000001, "t": 363.03853999999995, "r": 294.04538, "b": 371.41318, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "and DocBank were both generated from scientific document repos-", "bbox": {"l": 53.79800000000001, "t": 373.99655, "r": 295.55643, "b": 382.37119, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "itories (PubMed and arXiv), which provide XML or L", "bbox": {"l": 53.79800000000001, "t": 384.95554, "r": 246.75909, "b": 393.33017, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "A", "bbox": {"l": 243.53101000000004, "t": 385.03183000000007, "r": 248.58553000000003, "b": 391.82455, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "T", "bbox": {"l": 247.24099999999999, "t": 384.95554, "r": 252.58859, "b": 393.33017, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "E", "bbox": {"l": 251.09398999999996, "t": 386.87954999999994, "r": 256.08829, "b": 395.25418, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "X", "bbox": {"l": 254.967, "t": 384.95554, "r": 261.33725, "b": 393.33017, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "sources.", "bbox": {"l": 263.75021, "t": 384.95554, "r": 295.42773, "b": 393.33017, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "Those scientific documents present a limited variability in their", "bbox": {"l": 53.528999, "t": 395.91455, "r": 294.21713, "b": 404.28918, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "layouts, because they are typeset in uniform templates provided by", "bbox": {"l": 53.79800000000001, "t": 406.87354, "r": 294.27386, "b": 415.24817, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "the publishers. Obviously, documents such as technical manuals,", "bbox": {"l": 53.79800000000001, "t": 417.8325500000001, "r": 295.03488, "b": 426.20717999999994, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "annual company reports, legal text, government tenders, etc. have", "bbox": {"l": 53.79800000000001, "t": 428.79153, "r": 294.04691, "b": 437.16617, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "very different and partially unique layouts. As a consequence, the", "bbox": {"l": 53.57400100000001, "t": 439.75055, "r": 294.04865, "b": 448.12518, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "layout predictions obtained from models trained on PubLayNet or", "bbox": {"l": 53.79800000000001, "t": 450.7095299999999, "r": 294.21643, "b": 459.08417, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "DocBank is very reasonable when applied on scientific documents.", "bbox": {"l": 53.79800000000001, "t": 461.66855, "r": 295.42181, "b": 470.04318, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "However, for more", "bbox": {"l": 53.79800000000001, "t": 472.62753, "r": 125.52795, "b": 481.00217, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "artistic", "bbox": {"l": 128.608, "t": 472.67239, "r": 153.7679, "b": 481.01114, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "or", "bbox": {"l": 157.15199, "t": 472.62753, "r": 165.16365, "b": 481.00217, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "free-style", "bbox": {"l": 168.248, "t": 472.67239, "r": 201.49272, "b": 481.01114, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "layouts, we see sub-par", "bbox": {"l": 204.78799, "t": 472.62753, "r": 294.21494, "b": 481.00217, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "prediction quality from these models, which we demonstrate in", "bbox": {"l": 53.79800000000001, "t": 483.58554, "r": 294.04715, "b": 491.96017, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Section 5.", "bbox": {"l": 53.79800000000001, "t": 494.54453, "r": 89.080788, "b": 502.91916, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "In this paper, we present the DocLayNet dataset. It provides page-", "bbox": {"l": 63.76100199999999, "t": 505.50354, "r": 295.56396, "b": 513.87817, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "by-page layout annotation ground-truth using bounding-boxes for", "bbox": {"l": 53.79800000000001, "t": 516.46252, "r": 294.21271, "b": 524.83716, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "11", "bbox": {"l": 53.591999, "t": 527.42154, "r": 61.92275599999999, "b": 535.7961700000001, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "distinct class labels on 80863 unique document pages, of which", "bbox": {"l": 64.162201, "t": 527.42154, "r": 294.04626, "b": 535.7961700000001, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "a fraction carry double- or triple-annotations. DocLayNet is similar", "bbox": {"l": 53.79800000000001, "t": 538.38055, "r": 294.21228, "b": 546.75517, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "in spirit to PubLayNet and DocBank and will likewise be made", "bbox": {"l": 53.79800000000001, "t": 549.33955, "r": 294.04709, "b": 557.71417, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "available to the public", "bbox": {"l": 53.79800000000001, "t": 560.29855, "r": 134.28951, "b": 568.67317, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "1", "bbox": {"l": 134.29201, "t": 558.23083, "r": 137.67381, "b": 565.0235299999999, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "in order to stimulate the document-layout", "bbox": {"l": 140.418, "t": 560.29855, "r": 294.047, "b": 568.67317, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "analysis community. It distinguishes itself in the following aspects:", "bbox": {"l": 53.79800000000001, "t": 571.25755, "r": 295.10538, "b": 579.63217, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "(1)", "bbox": {"l": 64.708, "t": 584.58156, "r": 74.221352, "b": 592.95618, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Human Annotation", "bbox": {"l": 78.207001, "t": 584.62639, "r": 146.39589, "b": 592.96515, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": ": In contrast to PubLayNet and DocBank,", "bbox": {"l": 146.41701, "t": 584.58156, "r": 295.03036, "b": 592.95618, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "we relied on human annotation instead of automation ap-", "bbox": {"l": 77.875, "t": 595.54056, "r": 295.56165, "b": 603.91518, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "proaches to generate the data set.", "bbox": {"l": 78.207001, "t": 606.49956, "r": 200.6432, "b": 614.87418, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "(2)", "bbox": {"l": 64.708, "t": 617.45856, "r": 74.221352, "b": 625.8331800000001, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "Large Layout Variability", "bbox": {"l": 78.207001, "t": 617.50339, "r": 167.91745, "b": 625.84215, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": ": We include diverse and complex", "bbox": {"l": 168.33501, "t": 617.45856, "r": 294.26254, "b": 625.8331800000001, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "layouts from a large variety of public sources.", "bbox": {"l": 78.207001, "t": 628.41655, "r": 245.45726000000002, "b": 636.79117, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "(3)", "bbox": {"l": 64.708, "t": 639.37555, "r": 74.221352, "b": 647.75017, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "Detailed Label Set", "bbox": {"l": 78.207001, "t": 639.42038, "r": 143.51663, "b": 647.75914, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": ": We define 11 class labels to distinguish", "bbox": {"l": 144.02, "t": 639.37555, "r": 294.04648, "b": 647.75017, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "layout features in high detail. PubLayNet provides 5 labels;", "bbox": {"l": 78.207001, "t": 650.33455, "r": 294.68381, "b": 658.70917, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "DocBank provides 13, although not a superset of ours.", "bbox": {"l": 78.207001, "t": 661.29355, "r": 276.33752, "b": 669.66817, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "(4)", "bbox": {"l": 64.708, "t": 672.25256, "r": 74.221352, "b": 680.62717, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "Redundant Annotations", "bbox": {"l": 78.207001, "t": 672.29739, "r": 163.78357, "b": 680.63614, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": ": A fraction of the pages in the Do-", "bbox": {"l": 163.994, "t": 672.25256, "r": 295.56439, "b": 680.62717, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "cLayNet data set carry more than one human annotation.", "bbox": {"l": 78.207001, "t": 683.21156, "r": 295.42719, "b": 691.58617, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "$^{1}$https://developer.ibm.com/exchanges/data/all/doclaynet", "bbox": {"l": 53.672001, "t": 702.226364, "r": 216.02750000000003, "b": 708.739891, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "This enables experimentation with annotation uncertainty", "bbox": {"l": 342.095, "t": 87.36352999999997, "r": 558.43201, "b": 95.73816, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "and quality control analysis.", "bbox": {"l": 342.36401, "t": 98.32250999999997, "r": 445.83629999999994, "b": 106.69713999999999, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "(5)", "bbox": {"l": 328.86502, "t": 109.28148999999996, "r": 338.37836, "b": 117.65612999999996, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Pre-defined Train-, Test- & Validation-set", "bbox": {"l": 342.36401, "t": 109.32641999999998, "r": 487.25296, "b": 117.66516000000001, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": ": Like DocBank, we", "bbox": {"l": 487.75900000000007, "t": 109.28156000000001, "r": 558.20294, "b": 117.65618999999992, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "provide fixed train-, test- & validation-sets to ensure propor-", "bbox": {"l": 342.36401, "t": 120.24054000000001, "r": 559.72101, "b": 128.61517000000003, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "tional representation of the class-labels. Further, we prevent", "bbox": {"l": 342.36401, "t": 131.19854999999995, "r": 558.20117, "b": 139.57317999999998, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "leakage of unique layouts across sets, which has a large effect", "bbox": {"l": 342.36401, "t": 142.15752999999995, "r": 558.20087, "b": 150.53216999999995, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "on model accuracy scores.", "bbox": {"l": 342.36401, "t": 153.11652000000004, "r": 438.0624399999999, "b": 161.49114999999995, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "All aspects outlined above are detailed in Section 3. In Section 4,", "bbox": {"l": 327.918, "t": 167.97551999999996, "r": 559.19031, "b": 176.35015999999996, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "we will elaborate on how we designed and executed this large-scale", "bbox": {"l": 317.62299, "t": 178.93451000000005, "r": 558.20422, "b": 187.30913999999996, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "human annotation campaign. We will also share key insights and", "bbox": {"l": 317.95499, "t": 189.89355, "r": 558.19763, "b": 198.26819, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "lessons learned that might prove helpful for other parties planning", "bbox": {"l": 317.95499, "t": 200.85253999999998, "r": 558.20612, "b": 209.22717, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "to set up annotation campaigns.", "bbox": {"l": 317.95499, "t": 211.81151999999997, "r": 434.94861, "b": 220.18615999999997, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "In Section 5, we will present baseline accuracy numbers for a", "bbox": {"l": 327.918, "t": 222.77057000000002, "r": 558.19836, "b": 231.14520000000005, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "variety of object detection methods (Faster R-CNN, Mask R-CNN", "bbox": {"l": 317.73099, "t": 233.72955000000002, "r": 558.1991, "b": 242.10419000000002, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "and YOLOv5) trained on DocLayNet. We further show how the", "bbox": {"l": 317.95499, "t": 244.68854, "r": 558.20416, "b": 253.06317, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "model performance is impacted by varying the DocLayNet dataset", "bbox": {"l": 317.95499, "t": 255.64752, "r": 558.20563, "b": 264.02216, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "size, reducing the label set and modifying the train/test-split. Last", "bbox": {"l": 317.95499, "t": 266.60553000000004, "r": 558.19861, "b": 274.98015999999996, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "but not least, we compare the performance of models trained on", "bbox": {"l": 317.95499, "t": 277.56458, "r": 558.20416, "b": 285.93918, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "PubLayNet, DocBank and DocLayNet and demonstrate that a model", "bbox": {"l": 317.95499, "t": 288.52353, "r": 558.20239, "b": 296.89816, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "trained on DocLayNet provides overall more robust layout recovery.", "bbox": {"l": 317.95499, "t": 299.48254, "r": 559.58197, "b": 307.85718, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "2", "bbox": {"l": 317.95499, "t": 321.20889, "r": 323.10388, "b": 331.51797, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "RELATED WORK", "bbox": {"l": 333.12115, "t": 321.20889, "r": 421.74411, "b": 331.51797, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "While early approaches in document-layout analysis used rule-", "bbox": {"l": 317.52499, "t": 346.3325500000001, "r": 559.71301, "b": 354.70717999999994, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "based algorithms and heuristics [8], the problem is lately addressed", "bbox": {"l": 317.95499, "t": 357.29153, "r": 558.20276, "b": 365.66617, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "with deep learning methods. The most common approach is to lever-", "bbox": {"l": 317.62299, "t": 368.25055, "r": 559.71564, "b": 376.62518, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "age object detection models [9-15]. In the last decade, the accuracy", "bbox": {"l": 317.95499, "t": 379.2095299999999, "r": 558.43365, "b": 387.58417, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "and speed of these models has increased dramatically. Furthermore,", "bbox": {"l": 317.95499, "t": 390.16855000000004, "r": 559.18658, "b": 398.54318, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "most state-of-the-art object detection methods can be trained and", "bbox": {"l": 317.95499, "t": 401.12753, "r": 558.20502, "b": 409.50217, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "applied with very little work, thanks to a standardisation effort", "bbox": {"l": 317.95499, "t": 412.08655, "r": 558.20422, "b": 420.46118, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "of the ground-truth data format [16] and common deep-learning", "bbox": {"l": 317.95499, "t": 423.04553, "r": 558.20477, "b": 431.4201699999999, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "frameworks [17]. Reference data sets such as PubLayNet [6] and", "bbox": {"l": 317.95499, "t": 434.00354, "r": 558.19952, "b": 442.37817, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "DocBank provide their data in the commonly accepted COCO for-", "bbox": {"l": 317.95499, "t": 444.96252, "r": 559.71613, "b": 453.33716, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "mat [16].", "bbox": {"l": 317.95499, "t": 455.92154, "r": 350.90652, "b": 464.29617, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "Lately, new types of ML models for document-layout analysis", "bbox": {"l": 327.918, "t": 466.88052, "r": 558.19824, "b": 475.25516, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "have emerged in the community [18-21]. These models do not", "bbox": {"l": 317.95499, "t": 477.83954, "r": 558.20551, "b": 486.21417, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "approach the problem of layout analysis purely based on an image", "bbox": {"l": 317.95499, "t": 488.79855, "r": 558.20575, "b": 497.17319, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "representation of the page, as computer vision methods do. Instead,", "bbox": {"l": 317.95499, "t": 499.75754, "r": 559.18646, "b": 508.13217, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "they combine the text tokens and image representation of a page", "bbox": {"l": 317.95499, "t": 510.71655, "r": 558.2002, "b": 519.09119, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "in order to obtain a segmentation. While the reported accuracies", "bbox": {"l": 317.95499, "t": 521.67554, "r": 558.20618, "b": 530.05017, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "appear to be promising, a broadly accepted data format which links", "bbox": {"l": 317.95499, "t": 532.63455, "r": 558.20239, "b": 541.00917, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "geometric and textual features has yet to establish.", "bbox": {"l": 317.95499, "t": 543.59355, "r": 503.32648, "b": 551.96817, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "3", "bbox": {"l": 317.95499, "t": 565.3199, "r": 322.97391, "b": 575.629, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "THE DOCLAYNET DATASET", "bbox": {"l": 332.73831, "t": 565.3199, "r": 477.45688, "b": 575.629, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "DocLayNet contains 80863 PDF pages. Among these, 7059 carry two", "bbox": {"l": 317.95499, "t": 590.4435599999999, "r": 558.20233, "b": 598.81818, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "instances of human annotations, and 1591 carry three. This amounts", "bbox": {"l": 317.95499, "t": 601.40256, "r": 558.20239, "b": 609.77718, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "to 91104 total annotation instances. The annotations provide lay-", "bbox": {"l": 317.95499, "t": 612.36055, "r": 559.7132, "b": 620.73517, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "out information in the shape of labeled, rectangular bounding-", "bbox": {"l": 317.95499, "t": 623.3195499999999, "r": 559.71313, "b": 631.69417, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "boxes. We define 11 distinct labels for layout features, namely", "bbox": {"l": 317.95499, "t": 634.27855, "r": 539.92047, "b": 642.65317, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "Cap-", "bbox": {"l": 542.15802, "t": 634.32338, "r": 559.09888, "b": 642.66214, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "tion", "bbox": {"l": 317.95499, "t": 645.28238, "r": 331.86273, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": ",", "bbox": {"l": 331.86301, "t": 645.23755, "r": 333.83957, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "Footnote", "bbox": {"l": 336.064, "t": 645.28238, "r": 366.05368, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": ",", "bbox": {"l": 366.05301, "t": 645.23755, "r": 368.02957, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "Formula", "bbox": {"l": 370.254, "t": 645.28238, "r": 400.05502, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": ",", "bbox": {"l": 400.05499, "t": 645.23755, "r": 402.03156, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "List-item", "bbox": {"l": 404.25601, "t": 645.28238, "r": 436.19531, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": ",", "bbox": {"l": 436.19501, "t": 645.23755, "r": 438.17157, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "Page-footer", "bbox": {"l": 440.396, "t": 645.28238, "r": 480.60988999999995, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": ",", "bbox": {"l": 480.60999, "t": 645.23755, "r": 482.58655000000005, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "Page-header", "bbox": {"l": 484.811, "t": 645.28238, "r": 528.37604, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": ",", "bbox": {"l": 528.375, "t": 645.23755, "r": 530.35156, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "Picture", "bbox": {"l": 532.57599, "t": 645.28238, "r": 557.211, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": ",", "bbox": {"l": 557.211, "t": 645.23755, "r": 559.18756, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "Section-header", "bbox": {"l": 317.95499, "t": 656.2413799999999, "r": 368.78821, "b": 664.58013, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": ",", "bbox": {"l": 368.789, "t": 656.19655, "r": 370.72217, "b": 664.5711699999999, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "Table", "bbox": {"l": 372.89999, "t": 656.2413799999999, "r": 391.57254, "b": 664.58013, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": ",", "bbox": {"l": 391.573, "t": 656.19655, "r": 393.50616, "b": 664.5711699999999, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "Text", "bbox": {"l": 395.68399, "t": 656.2413799999999, "r": 410.23538, "b": 664.58013, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": ", and", "bbox": {"l": 410.23099, "t": 656.19655, "r": 427.5679, "b": 664.5711699999999, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "Title", "bbox": {"l": 429.74399, "t": 656.2413799999999, "r": 445.50800000000004, "b": 664.58013, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": ". Our reasoning for picking this", "bbox": {"l": 445.50800000000004, "t": 656.19655, "r": 558.20227, "b": 664.5711699999999, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "particular label set is detailed in Section 4.", "bbox": {"l": 317.95499, "t": 667.15556, "r": 472.22198, "b": 675.53017, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "In addition to open intellectual property constraints for the", "bbox": {"l": 327.918, "t": 678.11456, "r": 558.19843, "b": 686.4891700000001, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "source documents, we required that the documents in DocLayNet", "bbox": {"l": 317.95499, "t": 689.07355, "r": 558.19867, "b": 697.448174, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "adhere to a few conditions. Firstly, we kept scanned documents", "bbox": {"l": 317.95499, "t": 700.032555, "r": 558.2041, "b": 708.4071730000001, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 19, "label": "page_header", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.7682238221168518, "cells": [{"id": 0, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 246.24382, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar", "bbox": {"l": 253.13897999999998, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "section_header", "bbox": {"l": 53.79800000000001, "t": 85.85986000000003, "r": 156.52899, "b": 96.16900999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9367801547050476, "cells": [{"id": 2, "text": "1", "bbox": {"l": 53.79800000000001, "t": 85.85986000000003, "r": 59.427395, "b": 96.16900999999996, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "INTRODUCTION", "bbox": {"l": 70.379532, "t": 85.85986000000003, "r": 156.52899, "b": 96.16900999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "text", "bbox": {"l": 53.528999, "t": 110.98352, "r": 303.01697, "b": 228.94714, "coord_origin": "TOPLEFT"}, "confidence": 0.9802607893943787, "cells": [{"id": 4, "text": "Despite the substantial improvements achieved with machine-learning", "bbox": {"l": 53.79800000000001, "t": 110.98352, "r": 303.01697, "b": 119.35815000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "(ML) approaches and deep neural networks in recent years, docu-", "bbox": {"l": 53.528999, "t": 121.94256999999993, "r": 295.55695, "b": 130.31719999999996, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "ment conversion remains a challenging problem, as demonstrated", "bbox": {"l": 53.79800000000001, "t": 132.90155000000004, "r": 294.04642, "b": 141.27617999999995, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "by the numerous public competitions held on this topic [1-4]. The", "bbox": {"l": 53.79800000000001, "t": 143.85956, "r": 294.04733, "b": 152.23419, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "challenge originates from the huge variability in PDF documents", "bbox": {"l": 53.79800000000001, "t": 154.81853999999998, "r": 294.04349, "b": 163.19317999999998, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "regarding layout, language and formats (scanned, programmatic", "bbox": {"l": 53.79800000000001, "t": 165.77752999999996, "r": 294.04718, "b": 174.15215999999998, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "or a combination of both). Engineering a single ML model that can", "bbox": {"l": 53.79800000000001, "t": 176.73650999999995, "r": 294.04919, "b": 185.11114999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "be applied on all types of documents and provides high-quality", "bbox": {"l": 53.79800000000001, "t": 187.69556, "r": 294.27573, "b": 196.07019000000003, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "layout segmentation remains to this day extremely challenging [5].", "bbox": {"l": 53.79800000000001, "t": 198.65454, "r": 295.42569, "b": 207.02917000000002, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "To highlight the variability in document layouts, we show a few", "bbox": {"l": 53.528999, "t": 209.61352999999997, "r": 294.37256, "b": 217.98816, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "example documents from the DocLayNet dataset in Figure 1.", "bbox": {"l": 53.79800000000001, "t": 220.57250999999997, "r": 275.48334, "b": 228.94714, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "text", "bbox": {"l": 53.528999, "t": 231.53156, "r": 295.56412, "b": 502.91916, "coord_origin": "TOPLEFT"}, "confidence": 0.9793015718460083, "cells": [{"id": 15, "text": "A key problem in the process of document conversion is to under-", "bbox": {"l": 63.76100199999999, "t": 231.53156, "r": 295.564, "b": 239.90619000000004, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "stand the structure of a single document page, i.e. which segments", "bbox": {"l": 53.79800000000001, "t": 242.49054, "r": 294.04868, "b": 250.86517000000003, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "of text should be grouped together in a unit. To train models for this", "bbox": {"l": 53.79800000000001, "t": 253.44854999999995, "r": 294.04532, "b": 261.82318, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "task, there are currently two large datasets available to the com-", "bbox": {"l": 53.79800000000001, "t": 264.40752999999995, "r": 295.55618, "b": 272.78216999999995, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "munity, PubLayNet [6] and DocBank [7]. They were introduced", "bbox": {"l": 53.79800000000001, "t": 275.36658, "r": 294.04059, "b": 283.74118, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "in 2019 and 2020 respectively and significantly accelerated the im-", "bbox": {"l": 53.79800000000001, "t": 286.32552999999996, "r": 295.55783, "b": 294.70016, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "plementation of layout detection and segmentation models due to", "bbox": {"l": 53.79800000000001, "t": 297.28455, "r": 294.04538, "b": 305.65918000000005, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "their sizes of 300K and 500K ground-truth pages. These sizes were", "bbox": {"l": 53.79800000000001, "t": 308.24353, "r": 294.043, "b": 316.61816, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "achieved by leveraging an automation approach. The benefit of au-", "bbox": {"l": 53.79800000000001, "t": 319.20255, "r": 295.56412, "b": 327.57718, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "tomated ground-truth generation is obvious: one can generate large", "bbox": {"l": 53.79800000000001, "t": 330.16153, "r": 294.04532, "b": 338.53616, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "ground-truth datasets at virtually no cost. However, the automation", "bbox": {"l": 53.79800000000001, "t": 341.12054, "r": 294.04538, "b": 349.49518, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "introduces a constraint on the variability in the dataset, because", "bbox": {"l": 53.79800000000001, "t": 352.07953, "r": 294.04712, "b": 360.45416000000006, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "corresponding structured source data must be available. PubLayNet", "bbox": {"l": 53.79800000000001, "t": 363.03853999999995, "r": 294.04538, "b": 371.41318, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "and DocBank were both generated from scientific document repos-", "bbox": {"l": 53.79800000000001, "t": 373.99655, "r": 295.55643, "b": 382.37119, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "itories (PubMed and arXiv), which provide XML or L", "bbox": {"l": 53.79800000000001, "t": 384.95554, "r": 246.75909, "b": 393.33017, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "A", "bbox": {"l": 243.53101000000004, "t": 385.03183000000007, "r": 248.58553000000003, "b": 391.82455, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "T", "bbox": {"l": 247.24099999999999, "t": 384.95554, "r": 252.58859, "b": 393.33017, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "E", "bbox": {"l": 251.09398999999996, "t": 386.87954999999994, "r": 256.08829, "b": 395.25418, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "X", "bbox": {"l": 254.967, "t": 384.95554, "r": 261.33725, "b": 393.33017, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "sources.", "bbox": {"l": 263.75021, "t": 384.95554, "r": 295.42773, "b": 393.33017, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "Those scientific documents present a limited variability in their", "bbox": {"l": 53.528999, "t": 395.91455, "r": 294.21713, "b": 404.28918, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "layouts, because they are typeset in uniform templates provided by", "bbox": {"l": 53.79800000000001, "t": 406.87354, "r": 294.27386, "b": 415.24817, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "the publishers. Obviously, documents such as technical manuals,", "bbox": {"l": 53.79800000000001, "t": 417.8325500000001, "r": 295.03488, "b": 426.20717999999994, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "annual company reports, legal text, government tenders, etc. have", "bbox": {"l": 53.79800000000001, "t": 428.79153, "r": 294.04691, "b": 437.16617, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "very different and partially unique layouts. As a consequence, the", "bbox": {"l": 53.57400100000001, "t": 439.75055, "r": 294.04865, "b": 448.12518, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "layout predictions obtained from models trained on PubLayNet or", "bbox": {"l": 53.79800000000001, "t": 450.7095299999999, "r": 294.21643, "b": 459.08417, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "DocBank is very reasonable when applied on scientific documents.", "bbox": {"l": 53.79800000000001, "t": 461.66855, "r": 295.42181, "b": 470.04318, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "However, for more", "bbox": {"l": 53.79800000000001, "t": 472.62753, "r": 125.52795, "b": 481.00217, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "artistic", "bbox": {"l": 128.608, "t": 472.67239, "r": 153.7679, "b": 481.01114, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "or", "bbox": {"l": 157.15199, "t": 472.62753, "r": 165.16365, "b": 481.00217, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "free-style", "bbox": {"l": 168.248, "t": 472.67239, "r": 201.49272, "b": 481.01114, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "layouts, we see sub-par", "bbox": {"l": 204.78799, "t": 472.62753, "r": 294.21494, "b": 481.00217, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "prediction quality from these models, which we demonstrate in", "bbox": {"l": 53.79800000000001, "t": 483.58554, "r": 294.04715, "b": 491.96017, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Section 5.", "bbox": {"l": 53.79800000000001, "t": 494.54453, "r": 89.080788, "b": 502.91916, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "text", "bbox": {"l": 53.591999, "t": 505.50354, "r": 295.56396, "b": 579.63217, "coord_origin": "TOPLEFT"}, "confidence": 0.9795253276824951, "cells": [{"id": 49, "text": "In this paper, we present the DocLayNet dataset. It provides page-", "bbox": {"l": 63.76100199999999, "t": 505.50354, "r": 295.56396, "b": 513.87817, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "by-page layout annotation ground-truth using bounding-boxes for", "bbox": {"l": 53.79800000000001, "t": 516.46252, "r": 294.21271, "b": 524.83716, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "11", "bbox": {"l": 53.591999, "t": 527.42154, "r": 61.92275599999999, "b": 535.7961700000001, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "distinct class labels on 80863 unique document pages, of which", "bbox": {"l": 64.162201, "t": 527.42154, "r": 294.04626, "b": 535.7961700000001, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "a fraction carry double- or triple-annotations. DocLayNet is similar", "bbox": {"l": 53.79800000000001, "t": 538.38055, "r": 294.21228, "b": 546.75517, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "in spirit to PubLayNet and DocBank and will likewise be made", "bbox": {"l": 53.79800000000001, "t": 549.33955, "r": 294.04709, "b": 557.71417, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "available to the public", "bbox": {"l": 53.79800000000001, "t": 560.29855, "r": 134.28951, "b": 568.67317, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "1", "bbox": {"l": 134.29201, "t": 558.23083, "r": 137.67381, "b": 565.0235299999999, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "in order to stimulate the document-layout", "bbox": {"l": 140.418, "t": 560.29855, "r": 294.047, "b": 568.67317, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "analysis community. It distinguishes itself in the following aspects:", "bbox": {"l": 53.79800000000001, "t": 571.25755, "r": 295.10538, "b": 579.63217, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "list_item", "bbox": {"l": 64.708, "t": 584.58156, "r": 295.56165, "b": 614.87418, "coord_origin": "TOPLEFT"}, "confidence": 0.9687220454216003, "cells": [{"id": 59, "text": "(1)", "bbox": {"l": 64.708, "t": 584.58156, "r": 74.221352, "b": 592.95618, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Human Annotation", "bbox": {"l": 78.207001, "t": 584.62639, "r": 146.39589, "b": 592.96515, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": ": In contrast to PubLayNet and DocBank,", "bbox": {"l": 146.41701, "t": 584.58156, "r": 295.03036, "b": 592.95618, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "we relied on human annotation instead of automation ap-", "bbox": {"l": 77.875, "t": 595.54056, "r": 295.56165, "b": 603.91518, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "proaches to generate the data set.", "bbox": {"l": 78.207001, "t": 606.49956, "r": 200.6432, "b": 614.87418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "list_item", "bbox": {"l": 64.708, "t": 617.45856, "r": 294.26254, "b": 636.79117, "coord_origin": "TOPLEFT"}, "confidence": 0.9594229459762573, "cells": [{"id": 64, "text": "(2)", "bbox": {"l": 64.708, "t": 617.45856, "r": 74.221352, "b": 625.8331800000001, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "Large Layout Variability", "bbox": {"l": 78.207001, "t": 617.50339, "r": 167.91745, "b": 625.84215, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": ": We include diverse and complex", "bbox": {"l": 168.33501, "t": 617.45856, "r": 294.26254, "b": 625.8331800000001, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "layouts from a large variety of public sources.", "bbox": {"l": 78.207001, "t": 628.41655, "r": 245.45726000000002, "b": 636.79117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "list_item", "bbox": {"l": 64.708, "t": 639.37555, "r": 294.68381, "b": 669.66817, "coord_origin": "TOPLEFT"}, "confidence": 0.9615103006362915, "cells": [{"id": 68, "text": "(3)", "bbox": {"l": 64.708, "t": 639.37555, "r": 74.221352, "b": 647.75017, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "Detailed Label Set", "bbox": {"l": 78.207001, "t": 639.42038, "r": 143.51663, "b": 647.75914, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": ": We define 11 class labels to distinguish", "bbox": {"l": 144.02, "t": 639.37555, "r": 294.04648, "b": 647.75017, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "layout features in high detail. PubLayNet provides 5 labels;", "bbox": {"l": 78.207001, "t": 650.33455, "r": 294.68381, "b": 658.70917, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "DocBank provides 13, although not a superset of ours.", "bbox": {"l": 78.207001, "t": 661.29355, "r": 276.33752, "b": 669.66817, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "list_item", "bbox": {"l": 64.708, "t": 672.25256, "r": 295.56439, "b": 691.58617, "coord_origin": "TOPLEFT"}, "confidence": 0.9447500109672546, "cells": [{"id": 73, "text": "(4)", "bbox": {"l": 64.708, "t": 672.25256, "r": 74.221352, "b": 680.62717, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "Redundant Annotations", "bbox": {"l": 78.207001, "t": 672.29739, "r": 163.78357, "b": 680.63614, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": ": A fraction of the pages in the Do-", "bbox": {"l": 163.994, "t": 672.25256, "r": 295.56439, "b": 680.62717, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "cLayNet data set carry more than one human annotation.", "bbox": {"l": 78.207001, "t": 683.21156, "r": 295.42719, "b": 691.58617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "footnote", "bbox": {"l": 53.672001, "t": 702.226364, "r": 216.02750000000003, "b": 708.739891, "coord_origin": "TOPLEFT"}, "confidence": 0.8584771752357483, "cells": [{"id": 77, "text": "$^{1}$https://developer.ibm.com/exchanges/data/all/doclaynet", "bbox": {"l": 53.672001, "t": 702.226364, "r": 216.02750000000003, "b": 708.739891, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 342.095, "t": 87.36352999999997, "r": 558.43201, "b": 106.69713999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.7997146844863892, "cells": [{"id": 78, "text": "This enables experimentation with annotation uncertainty", "bbox": {"l": 342.095, "t": 87.36352999999997, "r": 558.43201, "b": 95.73816, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "and quality control analysis.", "bbox": {"l": 342.36401, "t": 98.32250999999997, "r": 445.83629999999994, "b": 106.69713999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "list_item", "bbox": {"l": 328.86502, "t": 109.28148999999996, "r": 559.72101, "b": 161.49114999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9563499093055725, "cells": [{"id": 80, "text": "(5)", "bbox": {"l": 328.86502, "t": 109.28148999999996, "r": 338.37836, "b": 117.65612999999996, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Pre-defined Train-, Test- & Validation-set", "bbox": {"l": 342.36401, "t": 109.32641999999998, "r": 487.25296, "b": 117.66516000000001, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": ": Like DocBank, we", "bbox": {"l": 487.75900000000007, "t": 109.28156000000001, "r": 558.20294, "b": 117.65618999999992, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "provide fixed train-, test- & validation-sets to ensure propor-", "bbox": {"l": 342.36401, "t": 120.24054000000001, "r": 559.72101, "b": 128.61517000000003, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "tional representation of the class-labels. Further, we prevent", "bbox": {"l": 342.36401, "t": 131.19854999999995, "r": 558.20117, "b": 139.57317999999998, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "leakage of unique layouts across sets, which has a large effect", "bbox": {"l": 342.36401, "t": 142.15752999999995, "r": 558.20087, "b": 150.53216999999995, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "on model accuracy scores.", "bbox": {"l": 342.36401, "t": 153.11652000000004, "r": 438.0624399999999, "b": 161.49114999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "text", "bbox": {"l": 317.62299, "t": 167.97551999999996, "r": 559.19031, "b": 220.18615999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9813903570175171, "cells": [{"id": 87, "text": "All aspects outlined above are detailed in Section 3. In Section 4,", "bbox": {"l": 327.918, "t": 167.97551999999996, "r": 559.19031, "b": 176.35015999999996, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "we will elaborate on how we designed and executed this large-scale", "bbox": {"l": 317.62299, "t": 178.93451000000005, "r": 558.20422, "b": 187.30913999999996, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "human annotation campaign. We will also share key insights and", "bbox": {"l": 317.95499, "t": 189.89355, "r": 558.19763, "b": 198.26819, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "lessons learned that might prove helpful for other parties planning", "bbox": {"l": 317.95499, "t": 200.85253999999998, "r": 558.20612, "b": 209.22717, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "to set up annotation campaigns.", "bbox": {"l": 317.95499, "t": 211.81151999999997, "r": 434.94861, "b": 220.18615999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 317.73099, "t": 222.77057000000002, "r": 559.58197, "b": 307.85718, "coord_origin": "TOPLEFT"}, "confidence": 0.9844217300415039, "cells": [{"id": 92, "text": "In Section 5, we will present baseline accuracy numbers for a", "bbox": {"l": 327.918, "t": 222.77057000000002, "r": 558.19836, "b": 231.14520000000005, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "variety of object detection methods (Faster R-CNN, Mask R-CNN", "bbox": {"l": 317.73099, "t": 233.72955000000002, "r": 558.1991, "b": 242.10419000000002, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "and YOLOv5) trained on DocLayNet. We further show how the", "bbox": {"l": 317.95499, "t": 244.68854, "r": 558.20416, "b": 253.06317, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "model performance is impacted by varying the DocLayNet dataset", "bbox": {"l": 317.95499, "t": 255.64752, "r": 558.20563, "b": 264.02216, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "size, reducing the label set and modifying the train/test-split. Last", "bbox": {"l": 317.95499, "t": 266.60553000000004, "r": 558.19861, "b": 274.98015999999996, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "but not least, we compare the performance of models trained on", "bbox": {"l": 317.95499, "t": 277.56458, "r": 558.20416, "b": 285.93918, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "PubLayNet, DocBank and DocLayNet and demonstrate that a model", "bbox": {"l": 317.95499, "t": 288.52353, "r": 558.20239, "b": 296.89816, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "trained on DocLayNet provides overall more robust layout recovery.", "bbox": {"l": 317.95499, "t": 299.48254, "r": 559.58197, "b": 307.85718, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "section_header", "bbox": {"l": 317.95499, "t": 321.20889, "r": 421.74411, "b": 331.51797, "coord_origin": "TOPLEFT"}, "confidence": 0.9347459077835083, "cells": [{"id": 100, "text": "2", "bbox": {"l": 317.95499, "t": 321.20889, "r": 323.10388, "b": 331.51797, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "RELATED WORK", "bbox": {"l": 333.12115, "t": 321.20889, "r": 421.74411, "b": 331.51797, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 317.52499, "t": 346.3325500000001, "r": 559.71613, "b": 464.29617, "coord_origin": "TOPLEFT"}, "confidence": 0.9860377907752991, "cells": [{"id": 102, "text": "While early approaches in document-layout analysis used rule-", "bbox": {"l": 317.52499, "t": 346.3325500000001, "r": 559.71301, "b": 354.70717999999994, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "based algorithms and heuristics [8], the problem is lately addressed", "bbox": {"l": 317.95499, "t": 357.29153, "r": 558.20276, "b": 365.66617, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "with deep learning methods. The most common approach is to lever-", "bbox": {"l": 317.62299, "t": 368.25055, "r": 559.71564, "b": 376.62518, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "age object detection models [9-15]. In the last decade, the accuracy", "bbox": {"l": 317.95499, "t": 379.2095299999999, "r": 558.43365, "b": 387.58417, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "and speed of these models has increased dramatically. Furthermore,", "bbox": {"l": 317.95499, "t": 390.16855000000004, "r": 559.18658, "b": 398.54318, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "most state-of-the-art object detection methods can be trained and", "bbox": {"l": 317.95499, "t": 401.12753, "r": 558.20502, "b": 409.50217, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "applied with very little work, thanks to a standardisation effort", "bbox": {"l": 317.95499, "t": 412.08655, "r": 558.20422, "b": 420.46118, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "of the ground-truth data format [16] and common deep-learning", "bbox": {"l": 317.95499, "t": 423.04553, "r": 558.20477, "b": 431.4201699999999, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "frameworks [17]. Reference data sets such as PubLayNet [6] and", "bbox": {"l": 317.95499, "t": 434.00354, "r": 558.19952, "b": 442.37817, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "DocBank provide their data in the commonly accepted COCO for-", "bbox": {"l": 317.95499, "t": 444.96252, "r": 559.71613, "b": 453.33716, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "mat [16].", "bbox": {"l": 317.95499, "t": 455.92154, "r": 350.90652, "b": 464.29617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 317.95499, "t": 466.88052, "r": 559.18646, "b": 551.96817, "coord_origin": "TOPLEFT"}, "confidence": 0.9861046671867371, "cells": [{"id": 113, "text": "Lately, new types of ML models for document-layout analysis", "bbox": {"l": 327.918, "t": 466.88052, "r": 558.19824, "b": 475.25516, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "have emerged in the community [18-21]. These models do not", "bbox": {"l": 317.95499, "t": 477.83954, "r": 558.20551, "b": 486.21417, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "approach the problem of layout analysis purely based on an image", "bbox": {"l": 317.95499, "t": 488.79855, "r": 558.20575, "b": 497.17319, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "representation of the page, as computer vision methods do. Instead,", "bbox": {"l": 317.95499, "t": 499.75754, "r": 559.18646, "b": 508.13217, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "they combine the text tokens and image representation of a page", "bbox": {"l": 317.95499, "t": 510.71655, "r": 558.2002, "b": 519.09119, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "in order to obtain a segmentation. While the reported accuracies", "bbox": {"l": 317.95499, "t": 521.67554, "r": 558.20618, "b": 530.05017, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "appear to be promising, a broadly accepted data format which links", "bbox": {"l": 317.95499, "t": 532.63455, "r": 558.20239, "b": 541.00917, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "geometric and textual features has yet to establish.", "bbox": {"l": 317.95499, "t": 543.59355, "r": 503.32648, "b": 551.96817, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "section_header", "bbox": {"l": 317.95499, "t": 565.3199, "r": 477.45688, "b": 575.629, "coord_origin": "TOPLEFT"}, "confidence": 0.9331073760986328, "cells": [{"id": 121, "text": "3", "bbox": {"l": 317.95499, "t": 565.3199, "r": 322.97391, "b": 575.629, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "THE DOCLAYNET DATASET", "bbox": {"l": 332.73831, "t": 565.3199, "r": 477.45688, "b": 575.629, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 317.95499, "t": 590.4435599999999, "r": 559.7132, "b": 675.53017, "coord_origin": "TOPLEFT"}, "confidence": 0.9852981567382812, "cells": [{"id": 123, "text": "DocLayNet contains 80863 PDF pages. Among these, 7059 carry two", "bbox": {"l": 317.95499, "t": 590.4435599999999, "r": 558.20233, "b": 598.81818, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "instances of human annotations, and 1591 carry three. This amounts", "bbox": {"l": 317.95499, "t": 601.40256, "r": 558.20239, "b": 609.77718, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "to 91104 total annotation instances. The annotations provide lay-", "bbox": {"l": 317.95499, "t": 612.36055, "r": 559.7132, "b": 620.73517, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "out information in the shape of labeled, rectangular bounding-", "bbox": {"l": 317.95499, "t": 623.3195499999999, "r": 559.71313, "b": 631.69417, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "boxes. We define 11 distinct labels for layout features, namely", "bbox": {"l": 317.95499, "t": 634.27855, "r": 539.92047, "b": 642.65317, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "Cap-", "bbox": {"l": 542.15802, "t": 634.32338, "r": 559.09888, "b": 642.66214, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "tion", "bbox": {"l": 317.95499, "t": 645.28238, "r": 331.86273, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": ",", "bbox": {"l": 331.86301, "t": 645.23755, "r": 333.83957, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "Footnote", "bbox": {"l": 336.064, "t": 645.28238, "r": 366.05368, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": ",", "bbox": {"l": 366.05301, "t": 645.23755, "r": 368.02957, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "Formula", "bbox": {"l": 370.254, "t": 645.28238, "r": 400.05502, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": ",", "bbox": {"l": 400.05499, "t": 645.23755, "r": 402.03156, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "List-item", "bbox": {"l": 404.25601, "t": 645.28238, "r": 436.19531, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": ",", "bbox": {"l": 436.19501, "t": 645.23755, "r": 438.17157, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "Page-footer", "bbox": {"l": 440.396, "t": 645.28238, "r": 480.60988999999995, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": ",", "bbox": {"l": 480.60999, "t": 645.23755, "r": 482.58655000000005, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "Page-header", "bbox": {"l": 484.811, "t": 645.28238, "r": 528.37604, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": ",", "bbox": {"l": 528.375, "t": 645.23755, "r": 530.35156, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "Picture", "bbox": {"l": 532.57599, "t": 645.28238, "r": 557.211, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": ",", "bbox": {"l": 557.211, "t": 645.23755, "r": 559.18756, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "Section-header", "bbox": {"l": 317.95499, "t": 656.2413799999999, "r": 368.78821, "b": 664.58013, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": ",", "bbox": {"l": 368.789, "t": 656.19655, "r": 370.72217, "b": 664.5711699999999, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "Table", "bbox": {"l": 372.89999, "t": 656.2413799999999, "r": 391.57254, "b": 664.58013, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": ",", "bbox": {"l": 391.573, "t": 656.19655, "r": 393.50616, "b": 664.5711699999999, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "Text", "bbox": {"l": 395.68399, "t": 656.2413799999999, "r": 410.23538, "b": 664.58013, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": ", and", "bbox": {"l": 410.23099, "t": 656.19655, "r": 427.5679, "b": 664.5711699999999, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "Title", "bbox": {"l": 429.74399, "t": 656.2413799999999, "r": 445.50800000000004, "b": 664.58013, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": ". Our reasoning for picking this", "bbox": {"l": 445.50800000000004, "t": 656.19655, "r": 558.20227, "b": 664.5711699999999, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "particular label set is detailed in Section 4.", "bbox": {"l": 317.95499, "t": 667.15556, "r": 472.22198, "b": 675.53017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "text", "bbox": {"l": 317.95499, "t": 678.11456, "r": 558.2041, "b": 708.4071730000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9749757051467896, "cells": [{"id": 152, "text": "In addition to open intellectual property constraints for the", "bbox": {"l": 327.918, "t": 678.11456, "r": 558.19843, "b": 686.4891700000001, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "source documents, we required that the documents in DocLayNet", "bbox": {"l": 317.95499, "t": 689.07355, "r": 558.19867, "b": 697.448174, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "adhere to a few conditions. Firstly, we kept scanned documents", "bbox": {"l": 317.95499, "t": 700.032555, "r": 558.2041, "b": 708.4071730000001, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_header", "id": 19, "page_no": 1, "cluster": {"id": 19, "label": "page_header", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.7682238221168518, "cells": [{"id": 0, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 246.24382, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar", "bbox": {"l": 253.13897999999998, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "KDD '22, August 14-18, 2022, Washington, DC, USA Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar"}, {"label": "section_header", "id": 14, "page_no": 1, "cluster": {"id": 14, "label": "section_header", "bbox": {"l": 53.79800000000001, "t": 85.85986000000003, "r": 156.52899, "b": 96.16900999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9367801547050476, "cells": [{"id": 2, "text": "1", "bbox": {"l": 53.79800000000001, "t": 85.85986000000003, "r": 59.427395, "b": 96.16900999999996, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "INTRODUCTION", "bbox": {"l": 70.379532, "t": 85.85986000000003, "r": 156.52899, "b": 96.16900999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1 INTRODUCTION"}, {"label": "text", "id": 5, "page_no": 1, "cluster": {"id": 5, "label": "text", "bbox": {"l": 53.528999, "t": 110.98352, "r": 303.01697, "b": 228.94714, "coord_origin": "TOPLEFT"}, "confidence": 0.9802607893943787, "cells": [{"id": 4, "text": "Despite the substantial improvements achieved with machine-learning", "bbox": {"l": 53.79800000000001, "t": 110.98352, "r": 303.01697, "b": 119.35815000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "(ML) approaches and deep neural networks in recent years, docu-", "bbox": {"l": 53.528999, "t": 121.94256999999993, "r": 295.55695, "b": 130.31719999999996, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "ment conversion remains a challenging problem, as demonstrated", "bbox": {"l": 53.79800000000001, "t": 132.90155000000004, "r": 294.04642, "b": 141.27617999999995, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "by the numerous public competitions held on this topic [1-4]. The", "bbox": {"l": 53.79800000000001, "t": 143.85956, "r": 294.04733, "b": 152.23419, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "challenge originates from the huge variability in PDF documents", "bbox": {"l": 53.79800000000001, "t": 154.81853999999998, "r": 294.04349, "b": 163.19317999999998, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "regarding layout, language and formats (scanned, programmatic", "bbox": {"l": 53.79800000000001, "t": 165.77752999999996, "r": 294.04718, "b": 174.15215999999998, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "or a combination of both). Engineering a single ML model that can", "bbox": {"l": 53.79800000000001, "t": 176.73650999999995, "r": 294.04919, "b": 185.11114999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "be applied on all types of documents and provides high-quality", "bbox": {"l": 53.79800000000001, "t": 187.69556, "r": 294.27573, "b": 196.07019000000003, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "layout segmentation remains to this day extremely challenging [5].", "bbox": {"l": 53.79800000000001, "t": 198.65454, "r": 295.42569, "b": 207.02917000000002, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "To highlight the variability in document layouts, we show a few", "bbox": {"l": 53.528999, "t": 209.61352999999997, "r": 294.37256, "b": 217.98816, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "example documents from the DocLayNet dataset in Figure 1.", "bbox": {"l": 53.79800000000001, "t": 220.57250999999997, "r": 275.48334, "b": 228.94714, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Despite the substantial improvements achieved with machine-learning (ML) approaches and deep neural networks in recent years, document conversion remains a challenging problem, as demonstrated by the numerous public competitions held on this topic [1-4]. The challenge originates from the huge variability in PDF documents regarding layout, language and formats (scanned, programmatic or a combination of both). Engineering a single ML model that can be applied on all types of documents and provides high-quality layout segmentation remains to this day extremely challenging [5]. To highlight the variability in document layouts, we show a few example documents from the DocLayNet dataset in Figure 1."}, {"label": "text", "id": 7, "page_no": 1, "cluster": {"id": 7, "label": "text", "bbox": {"l": 53.528999, "t": 231.53156, "r": 295.56412, "b": 502.91916, "coord_origin": "TOPLEFT"}, "confidence": 0.9793015718460083, "cells": [{"id": 15, "text": "A key problem in the process of document conversion is to under-", "bbox": {"l": 63.76100199999999, "t": 231.53156, "r": 295.564, "b": 239.90619000000004, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "stand the structure of a single document page, i.e. which segments", "bbox": {"l": 53.79800000000001, "t": 242.49054, "r": 294.04868, "b": 250.86517000000003, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "of text should be grouped together in a unit. To train models for this", "bbox": {"l": 53.79800000000001, "t": 253.44854999999995, "r": 294.04532, "b": 261.82318, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "task, there are currently two large datasets available to the com-", "bbox": {"l": 53.79800000000001, "t": 264.40752999999995, "r": 295.55618, "b": 272.78216999999995, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "munity, PubLayNet [6] and DocBank [7]. They were introduced", "bbox": {"l": 53.79800000000001, "t": 275.36658, "r": 294.04059, "b": 283.74118, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "in 2019 and 2020 respectively and significantly accelerated the im-", "bbox": {"l": 53.79800000000001, "t": 286.32552999999996, "r": 295.55783, "b": 294.70016, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "plementation of layout detection and segmentation models due to", "bbox": {"l": 53.79800000000001, "t": 297.28455, "r": 294.04538, "b": 305.65918000000005, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "their sizes of 300K and 500K ground-truth pages. These sizes were", "bbox": {"l": 53.79800000000001, "t": 308.24353, "r": 294.043, "b": 316.61816, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "achieved by leveraging an automation approach. The benefit of au-", "bbox": {"l": 53.79800000000001, "t": 319.20255, "r": 295.56412, "b": 327.57718, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "tomated ground-truth generation is obvious: one can generate large", "bbox": {"l": 53.79800000000001, "t": 330.16153, "r": 294.04532, "b": 338.53616, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "ground-truth datasets at virtually no cost. However, the automation", "bbox": {"l": 53.79800000000001, "t": 341.12054, "r": 294.04538, "b": 349.49518, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "introduces a constraint on the variability in the dataset, because", "bbox": {"l": 53.79800000000001, "t": 352.07953, "r": 294.04712, "b": 360.45416000000006, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "corresponding structured source data must be available. PubLayNet", "bbox": {"l": 53.79800000000001, "t": 363.03853999999995, "r": 294.04538, "b": 371.41318, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "and DocBank were both generated from scientific document repos-", "bbox": {"l": 53.79800000000001, "t": 373.99655, "r": 295.55643, "b": 382.37119, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "itories (PubMed and arXiv), which provide XML or L", "bbox": {"l": 53.79800000000001, "t": 384.95554, "r": 246.75909, "b": 393.33017, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "A", "bbox": {"l": 243.53101000000004, "t": 385.03183000000007, "r": 248.58553000000003, "b": 391.82455, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "T", "bbox": {"l": 247.24099999999999, "t": 384.95554, "r": 252.58859, "b": 393.33017, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "E", "bbox": {"l": 251.09398999999996, "t": 386.87954999999994, "r": 256.08829, "b": 395.25418, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "X", "bbox": {"l": 254.967, "t": 384.95554, "r": 261.33725, "b": 393.33017, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "sources.", "bbox": {"l": 263.75021, "t": 384.95554, "r": 295.42773, "b": 393.33017, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "Those scientific documents present a limited variability in their", "bbox": {"l": 53.528999, "t": 395.91455, "r": 294.21713, "b": 404.28918, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "layouts, because they are typeset in uniform templates provided by", "bbox": {"l": 53.79800000000001, "t": 406.87354, "r": 294.27386, "b": 415.24817, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "the publishers. Obviously, documents such as technical manuals,", "bbox": {"l": 53.79800000000001, "t": 417.8325500000001, "r": 295.03488, "b": 426.20717999999994, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "annual company reports, legal text, government tenders, etc. have", "bbox": {"l": 53.79800000000001, "t": 428.79153, "r": 294.04691, "b": 437.16617, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "very different and partially unique layouts. As a consequence, the", "bbox": {"l": 53.57400100000001, "t": 439.75055, "r": 294.04865, "b": 448.12518, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "layout predictions obtained from models trained on PubLayNet or", "bbox": {"l": 53.79800000000001, "t": 450.7095299999999, "r": 294.21643, "b": 459.08417, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "DocBank is very reasonable when applied on scientific documents.", "bbox": {"l": 53.79800000000001, "t": 461.66855, "r": 295.42181, "b": 470.04318, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "However, for more", "bbox": {"l": 53.79800000000001, "t": 472.62753, "r": 125.52795, "b": 481.00217, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "artistic", "bbox": {"l": 128.608, "t": 472.67239, "r": 153.7679, "b": 481.01114, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "or", "bbox": {"l": 157.15199, "t": 472.62753, "r": 165.16365, "b": 481.00217, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "free-style", "bbox": {"l": 168.248, "t": 472.67239, "r": 201.49272, "b": 481.01114, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "layouts, we see sub-par", "bbox": {"l": 204.78799, "t": 472.62753, "r": 294.21494, "b": 481.00217, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "prediction quality from these models, which we demonstrate in", "bbox": {"l": 53.79800000000001, "t": 483.58554, "r": 294.04715, "b": 491.96017, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Section 5.", "bbox": {"l": 53.79800000000001, "t": 494.54453, "r": 89.080788, "b": 502.91916, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "A key problem in the process of document conversion is to understand the structure of a single document page, i.e. which segments of text should be grouped together in a unit. To train models for this task, there are currently two large datasets available to the community, PubLayNet [6] and DocBank [7]. They were introduced in 2019 and 2020 respectively and significantly accelerated the implementation of layout detection and segmentation models due to their sizes of 300K and 500K ground-truth pages. These sizes were achieved by leveraging an automation approach. The benefit of automated ground-truth generation is obvious: one can generate large ground-truth datasets at virtually no cost. However, the automation introduces a constraint on the variability in the dataset, because corresponding structured source data must be available. PubLayNet and DocBank were both generated from scientific document repositories (PubMed and arXiv), which provide XML or L A T E X sources. Those scientific documents present a limited variability in their layouts, because they are typeset in uniform templates provided by the publishers. Obviously, documents such as technical manuals, annual company reports, legal text, government tenders, etc. have very different and partially unique layouts. As a consequence, the layout predictions obtained from models trained on PubLayNet or DocBank is very reasonable when applied on scientific documents. However, for more artistic or free-style layouts, we see sub-par prediction quality from these models, which we demonstrate in Section 5."}, {"label": "text", "id": 6, "page_no": 1, "cluster": {"id": 6, "label": "text", "bbox": {"l": 53.591999, "t": 505.50354, "r": 295.56396, "b": 579.63217, "coord_origin": "TOPLEFT"}, "confidence": 0.9795253276824951, "cells": [{"id": 49, "text": "In this paper, we present the DocLayNet dataset. It provides page-", "bbox": {"l": 63.76100199999999, "t": 505.50354, "r": 295.56396, "b": 513.87817, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "by-page layout annotation ground-truth using bounding-boxes for", "bbox": {"l": 53.79800000000001, "t": 516.46252, "r": 294.21271, "b": 524.83716, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "11", "bbox": {"l": 53.591999, "t": 527.42154, "r": 61.92275599999999, "b": 535.7961700000001, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "distinct class labels on 80863 unique document pages, of which", "bbox": {"l": 64.162201, "t": 527.42154, "r": 294.04626, "b": 535.7961700000001, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "a fraction carry double- or triple-annotations. DocLayNet is similar", "bbox": {"l": 53.79800000000001, "t": 538.38055, "r": 294.21228, "b": 546.75517, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "in spirit to PubLayNet and DocBank and will likewise be made", "bbox": {"l": 53.79800000000001, "t": 549.33955, "r": 294.04709, "b": 557.71417, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "available to the public", "bbox": {"l": 53.79800000000001, "t": 560.29855, "r": 134.28951, "b": 568.67317, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "1", "bbox": {"l": 134.29201, "t": 558.23083, "r": 137.67381, "b": 565.0235299999999, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "in order to stimulate the document-layout", "bbox": {"l": 140.418, "t": 560.29855, "r": 294.047, "b": 568.67317, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "analysis community. It distinguishes itself in the following aspects:", "bbox": {"l": 53.79800000000001, "t": 571.25755, "r": 295.10538, "b": 579.63217, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In this paper, we present the DocLayNet dataset. It provides pageby-page layout annotation ground-truth using bounding-boxes for 11 distinct class labels on 80863 unique document pages, of which a fraction carry double- or triple-annotations. DocLayNet is similar in spirit to PubLayNet and DocBank and will likewise be made available to the public 1 in order to stimulate the document-layout analysis community. It distinguishes itself in the following aspects:"}, {"label": "list_item", "id": 9, "page_no": 1, "cluster": {"id": 9, "label": "list_item", "bbox": {"l": 64.708, "t": 584.58156, "r": 295.56165, "b": 614.87418, "coord_origin": "TOPLEFT"}, "confidence": 0.9687220454216003, "cells": [{"id": 59, "text": "(1)", "bbox": {"l": 64.708, "t": 584.58156, "r": 74.221352, "b": 592.95618, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Human Annotation", "bbox": {"l": 78.207001, "t": 584.62639, "r": 146.39589, "b": 592.96515, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": ": In contrast to PubLayNet and DocBank,", "bbox": {"l": 146.41701, "t": 584.58156, "r": 295.03036, "b": 592.95618, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "we relied on human annotation instead of automation ap-", "bbox": {"l": 77.875, "t": 595.54056, "r": 295.56165, "b": 603.91518, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "proaches to generate the data set.", "bbox": {"l": 78.207001, "t": 606.49956, "r": 200.6432, "b": 614.87418, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "(1) Human Annotation : In contrast to PubLayNet and DocBank, we relied on human annotation instead of automation approaches to generate the data set."}, {"label": "list_item", "id": 11, "page_no": 1, "cluster": {"id": 11, "label": "list_item", "bbox": {"l": 64.708, "t": 617.45856, "r": 294.26254, "b": 636.79117, "coord_origin": "TOPLEFT"}, "confidence": 0.9594229459762573, "cells": [{"id": 64, "text": "(2)", "bbox": {"l": 64.708, "t": 617.45856, "r": 74.221352, "b": 625.8331800000001, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "Large Layout Variability", "bbox": {"l": 78.207001, "t": 617.50339, "r": 167.91745, "b": 625.84215, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": ": We include diverse and complex", "bbox": {"l": 168.33501, "t": 617.45856, "r": 294.26254, "b": 625.8331800000001, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "layouts from a large variety of public sources.", "bbox": {"l": 78.207001, "t": 628.41655, "r": 245.45726000000002, "b": 636.79117, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "(2) Large Layout Variability : We include diverse and complex layouts from a large variety of public sources."}, {"label": "list_item", "id": 10, "page_no": 1, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 64.708, "t": 639.37555, "r": 294.68381, "b": 669.66817, "coord_origin": "TOPLEFT"}, "confidence": 0.9615103006362915, "cells": [{"id": 68, "text": "(3)", "bbox": {"l": 64.708, "t": 639.37555, "r": 74.221352, "b": 647.75017, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "Detailed Label Set", "bbox": {"l": 78.207001, "t": 639.42038, "r": 143.51663, "b": 647.75914, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": ": We define 11 class labels to distinguish", "bbox": {"l": 144.02, "t": 639.37555, "r": 294.04648, "b": 647.75017, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "layout features in high detail. PubLayNet provides 5 labels;", "bbox": {"l": 78.207001, "t": 650.33455, "r": 294.68381, "b": 658.70917, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "DocBank provides 13, although not a superset of ours.", "bbox": {"l": 78.207001, "t": 661.29355, "r": 276.33752, "b": 669.66817, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "(3) Detailed Label Set : We define 11 class labels to distinguish layout features in high detail. PubLayNet provides 5 labels; DocBank provides 13, although not a superset of ours."}, {"label": "list_item", "id": 13, "page_no": 1, "cluster": {"id": 13, "label": "list_item", "bbox": {"l": 64.708, "t": 672.25256, "r": 295.56439, "b": 691.58617, "coord_origin": "TOPLEFT"}, "confidence": 0.9447500109672546, "cells": [{"id": 73, "text": "(4)", "bbox": {"l": 64.708, "t": 672.25256, "r": 74.221352, "b": 680.62717, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "Redundant Annotations", "bbox": {"l": 78.207001, "t": 672.29739, "r": 163.78357, "b": 680.63614, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": ": A fraction of the pages in the Do-", "bbox": {"l": 163.994, "t": 672.25256, "r": 295.56439, "b": 680.62717, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "cLayNet data set carry more than one human annotation.", "bbox": {"l": 78.207001, "t": 683.21156, "r": 295.42719, "b": 691.58617, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "(4) Redundant Annotations : A fraction of the pages in the DocLayNet data set carry more than one human annotation."}, {"label": "footnote", "id": 17, "page_no": 1, "cluster": {"id": 17, "label": "footnote", "bbox": {"l": 53.672001, "t": 702.226364, "r": 216.02750000000003, "b": 708.739891, "coord_origin": "TOPLEFT"}, "confidence": 0.8584771752357483, "cells": [{"id": 77, "text": "$^{1}$https://developer.ibm.com/exchanges/data/all/doclaynet", "bbox": {"l": 53.672001, "t": 702.226364, "r": 216.02750000000003, "b": 708.739891, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "$^{1}$https://developer.ibm.com/exchanges/data/all/doclaynet"}, {"label": "text", "id": 18, "page_no": 1, "cluster": {"id": 18, "label": "text", "bbox": {"l": 342.095, "t": 87.36352999999997, "r": 558.43201, "b": 106.69713999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.7997146844863892, "cells": [{"id": 78, "text": "This enables experimentation with annotation uncertainty", "bbox": {"l": 342.095, "t": 87.36352999999997, "r": 558.43201, "b": 95.73816, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "and quality control analysis.", "bbox": {"l": 342.36401, "t": 98.32250999999997, "r": 445.83629999999994, "b": 106.69713999999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "This enables experimentation with annotation uncertainty and quality control analysis."}, {"label": "list_item", "id": 12, "page_no": 1, "cluster": {"id": 12, "label": "list_item", "bbox": {"l": 328.86502, "t": 109.28148999999996, "r": 559.72101, "b": 161.49114999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9563499093055725, "cells": [{"id": 80, "text": "(5)", "bbox": {"l": 328.86502, "t": 109.28148999999996, "r": 338.37836, "b": 117.65612999999996, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Pre-defined Train-, Test- & Validation-set", "bbox": {"l": 342.36401, "t": 109.32641999999998, "r": 487.25296, "b": 117.66516000000001, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": ": Like DocBank, we", "bbox": {"l": 487.75900000000007, "t": 109.28156000000001, "r": 558.20294, "b": 117.65618999999992, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "provide fixed train-, test- & validation-sets to ensure propor-", "bbox": {"l": 342.36401, "t": 120.24054000000001, "r": 559.72101, "b": 128.61517000000003, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "tional representation of the class-labels. Further, we prevent", "bbox": {"l": 342.36401, "t": 131.19854999999995, "r": 558.20117, "b": 139.57317999999998, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "leakage of unique layouts across sets, which has a large effect", "bbox": {"l": 342.36401, "t": 142.15752999999995, "r": 558.20087, "b": 150.53216999999995, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "on model accuracy scores.", "bbox": {"l": 342.36401, "t": 153.11652000000004, "r": 438.0624399999999, "b": 161.49114999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "(5) Pre-defined Train-, Test- & Validation-set : Like DocBank, we provide fixed train-, test- & validation-sets to ensure proportional representation of the class-labels. Further, we prevent leakage of unique layouts across sets, which has a large effect on model accuracy scores."}, {"label": "text", "id": 4, "page_no": 1, "cluster": {"id": 4, "label": "text", "bbox": {"l": 317.62299, "t": 167.97551999999996, "r": 559.19031, "b": 220.18615999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9813903570175171, "cells": [{"id": 87, "text": "All aspects outlined above are detailed in Section 3. In Section 4,", "bbox": {"l": 327.918, "t": 167.97551999999996, "r": 559.19031, "b": 176.35015999999996, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "we will elaborate on how we designed and executed this large-scale", "bbox": {"l": 317.62299, "t": 178.93451000000005, "r": 558.20422, "b": 187.30913999999996, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "human annotation campaign. We will also share key insights and", "bbox": {"l": 317.95499, "t": 189.89355, "r": 558.19763, "b": 198.26819, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "lessons learned that might prove helpful for other parties planning", "bbox": {"l": 317.95499, "t": 200.85253999999998, "r": 558.20612, "b": 209.22717, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "to set up annotation campaigns.", "bbox": {"l": 317.95499, "t": 211.81151999999997, "r": 434.94861, "b": 220.18615999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "All aspects outlined above are detailed in Section 3. In Section 4, we will elaborate on how we designed and executed this large-scale human annotation campaign. We will also share key insights and lessons learned that might prove helpful for other parties planning to set up annotation campaigns."}, {"label": "text", "id": 3, "page_no": 1, "cluster": {"id": 3, "label": "text", "bbox": {"l": 317.73099, "t": 222.77057000000002, "r": 559.58197, "b": 307.85718, "coord_origin": "TOPLEFT"}, "confidence": 0.9844217300415039, "cells": [{"id": 92, "text": "In Section 5, we will present baseline accuracy numbers for a", "bbox": {"l": 327.918, "t": 222.77057000000002, "r": 558.19836, "b": 231.14520000000005, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "variety of object detection methods (Faster R-CNN, Mask R-CNN", "bbox": {"l": 317.73099, "t": 233.72955000000002, "r": 558.1991, "b": 242.10419000000002, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "and YOLOv5) trained on DocLayNet. We further show how the", "bbox": {"l": 317.95499, "t": 244.68854, "r": 558.20416, "b": 253.06317, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "model performance is impacted by varying the DocLayNet dataset", "bbox": {"l": 317.95499, "t": 255.64752, "r": 558.20563, "b": 264.02216, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "size, reducing the label set and modifying the train/test-split. Last", "bbox": {"l": 317.95499, "t": 266.60553000000004, "r": 558.19861, "b": 274.98015999999996, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "but not least, we compare the performance of models trained on", "bbox": {"l": 317.95499, "t": 277.56458, "r": 558.20416, "b": 285.93918, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "PubLayNet, DocBank and DocLayNet and demonstrate that a model", "bbox": {"l": 317.95499, "t": 288.52353, "r": 558.20239, "b": 296.89816, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "trained on DocLayNet provides overall more robust layout recovery.", "bbox": {"l": 317.95499, "t": 299.48254, "r": 559.58197, "b": 307.85718, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In Section 5, we will present baseline accuracy numbers for a variety of object detection methods (Faster R-CNN, Mask R-CNN and YOLOv5) trained on DocLayNet. We further show how the model performance is impacted by varying the DocLayNet dataset size, reducing the label set and modifying the train/test-split. Last but not least, we compare the performance of models trained on PubLayNet, DocBank and DocLayNet and demonstrate that a model trained on DocLayNet provides overall more robust layout recovery."}, {"label": "section_header", "id": 15, "page_no": 1, "cluster": {"id": 15, "label": "section_header", "bbox": {"l": 317.95499, "t": 321.20889, "r": 421.74411, "b": 331.51797, "coord_origin": "TOPLEFT"}, "confidence": 0.9347459077835083, "cells": [{"id": 100, "text": "2", "bbox": {"l": 317.95499, "t": 321.20889, "r": 323.10388, "b": 331.51797, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "RELATED WORK", "bbox": {"l": 333.12115, "t": 321.20889, "r": 421.74411, "b": 331.51797, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2 RELATED WORK"}, {"label": "text", "id": 1, "page_no": 1, "cluster": {"id": 1, "label": "text", "bbox": {"l": 317.52499, "t": 346.3325500000001, "r": 559.71613, "b": 464.29617, "coord_origin": "TOPLEFT"}, "confidence": 0.9860377907752991, "cells": [{"id": 102, "text": "While early approaches in document-layout analysis used rule-", "bbox": {"l": 317.52499, "t": 346.3325500000001, "r": 559.71301, "b": 354.70717999999994, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "based algorithms and heuristics [8], the problem is lately addressed", "bbox": {"l": 317.95499, "t": 357.29153, "r": 558.20276, "b": 365.66617, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "with deep learning methods. The most common approach is to lever-", "bbox": {"l": 317.62299, "t": 368.25055, "r": 559.71564, "b": 376.62518, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "age object detection models [9-15]. In the last decade, the accuracy", "bbox": {"l": 317.95499, "t": 379.2095299999999, "r": 558.43365, "b": 387.58417, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "and speed of these models has increased dramatically. Furthermore,", "bbox": {"l": 317.95499, "t": 390.16855000000004, "r": 559.18658, "b": 398.54318, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "most state-of-the-art object detection methods can be trained and", "bbox": {"l": 317.95499, "t": 401.12753, "r": 558.20502, "b": 409.50217, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "applied with very little work, thanks to a standardisation effort", "bbox": {"l": 317.95499, "t": 412.08655, "r": 558.20422, "b": 420.46118, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "of the ground-truth data format [16] and common deep-learning", "bbox": {"l": 317.95499, "t": 423.04553, "r": 558.20477, "b": 431.4201699999999, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "frameworks [17]. Reference data sets such as PubLayNet [6] and", "bbox": {"l": 317.95499, "t": 434.00354, "r": 558.19952, "b": 442.37817, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "DocBank provide their data in the commonly accepted COCO for-", "bbox": {"l": 317.95499, "t": 444.96252, "r": 559.71613, "b": 453.33716, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "mat [16].", "bbox": {"l": 317.95499, "t": 455.92154, "r": 350.90652, "b": 464.29617, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "While early approaches in document-layout analysis used rulebased algorithms and heuristics [8], the problem is lately addressed with deep learning methods. The most common approach is to leverage object detection models [9-15]. In the last decade, the accuracy and speed of these models has increased dramatically. Furthermore, most state-of-the-art object detection methods can be trained and applied with very little work, thanks to a standardisation effort of the ground-truth data format [16] and common deep-learning frameworks [17]. Reference data sets such as PubLayNet [6] and DocBank provide their data in the commonly accepted COCO format [16]."}, {"label": "text", "id": 0, "page_no": 1, "cluster": {"id": 0, "label": "text", "bbox": {"l": 317.95499, "t": 466.88052, "r": 559.18646, "b": 551.96817, "coord_origin": "TOPLEFT"}, "confidence": 0.9861046671867371, "cells": [{"id": 113, "text": "Lately, new types of ML models for document-layout analysis", "bbox": {"l": 327.918, "t": 466.88052, "r": 558.19824, "b": 475.25516, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "have emerged in the community [18-21]. These models do not", "bbox": {"l": 317.95499, "t": 477.83954, "r": 558.20551, "b": 486.21417, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "approach the problem of layout analysis purely based on an image", "bbox": {"l": 317.95499, "t": 488.79855, "r": 558.20575, "b": 497.17319, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "representation of the page, as computer vision methods do. Instead,", "bbox": {"l": 317.95499, "t": 499.75754, "r": 559.18646, "b": 508.13217, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "they combine the text tokens and image representation of a page", "bbox": {"l": 317.95499, "t": 510.71655, "r": 558.2002, "b": 519.09119, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "in order to obtain a segmentation. While the reported accuracies", "bbox": {"l": 317.95499, "t": 521.67554, "r": 558.20618, "b": 530.05017, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "appear to be promising, a broadly accepted data format which links", "bbox": {"l": 317.95499, "t": 532.63455, "r": 558.20239, "b": 541.00917, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "geometric and textual features has yet to establish.", "bbox": {"l": 317.95499, "t": 543.59355, "r": 503.32648, "b": 551.96817, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Lately, new types of ML models for document-layout analysis have emerged in the community [18-21]. These models do not approach the problem of layout analysis purely based on an image representation of the page, as computer vision methods do. Instead, they combine the text tokens and image representation of a page in order to obtain a segmentation. While the reported accuracies appear to be promising, a broadly accepted data format which links geometric and textual features has yet to establish."}, {"label": "section_header", "id": 16, "page_no": 1, "cluster": {"id": 16, "label": "section_header", "bbox": {"l": 317.95499, "t": 565.3199, "r": 477.45688, "b": 575.629, "coord_origin": "TOPLEFT"}, "confidence": 0.9331073760986328, "cells": [{"id": 121, "text": "3", "bbox": {"l": 317.95499, "t": 565.3199, "r": 322.97391, "b": 575.629, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "THE DOCLAYNET DATASET", "bbox": {"l": 332.73831, "t": 565.3199, "r": 477.45688, "b": 575.629, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3 THE DOCLAYNET DATASET"}, {"label": "text", "id": 2, "page_no": 1, "cluster": {"id": 2, "label": "text", "bbox": {"l": 317.95499, "t": 590.4435599999999, "r": 559.7132, "b": 675.53017, "coord_origin": "TOPLEFT"}, "confidence": 0.9852981567382812, "cells": [{"id": 123, "text": "DocLayNet contains 80863 PDF pages. Among these, 7059 carry two", "bbox": {"l": 317.95499, "t": 590.4435599999999, "r": 558.20233, "b": 598.81818, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "instances of human annotations, and 1591 carry three. This amounts", "bbox": {"l": 317.95499, "t": 601.40256, "r": 558.20239, "b": 609.77718, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "to 91104 total annotation instances. The annotations provide lay-", "bbox": {"l": 317.95499, "t": 612.36055, "r": 559.7132, "b": 620.73517, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "out information in the shape of labeled, rectangular bounding-", "bbox": {"l": 317.95499, "t": 623.3195499999999, "r": 559.71313, "b": 631.69417, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "boxes. We define 11 distinct labels for layout features, namely", "bbox": {"l": 317.95499, "t": 634.27855, "r": 539.92047, "b": 642.65317, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "Cap-", "bbox": {"l": 542.15802, "t": 634.32338, "r": 559.09888, "b": 642.66214, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "tion", "bbox": {"l": 317.95499, "t": 645.28238, "r": 331.86273, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": ",", "bbox": {"l": 331.86301, "t": 645.23755, "r": 333.83957, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "Footnote", "bbox": {"l": 336.064, "t": 645.28238, "r": 366.05368, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": ",", "bbox": {"l": 366.05301, "t": 645.23755, "r": 368.02957, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "Formula", "bbox": {"l": 370.254, "t": 645.28238, "r": 400.05502, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": ",", "bbox": {"l": 400.05499, "t": 645.23755, "r": 402.03156, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "List-item", "bbox": {"l": 404.25601, "t": 645.28238, "r": 436.19531, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": ",", "bbox": {"l": 436.19501, "t": 645.23755, "r": 438.17157, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "Page-footer", "bbox": {"l": 440.396, "t": 645.28238, "r": 480.60988999999995, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": ",", "bbox": {"l": 480.60999, "t": 645.23755, "r": 482.58655000000005, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "Page-header", "bbox": {"l": 484.811, "t": 645.28238, "r": 528.37604, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": ",", "bbox": {"l": 528.375, "t": 645.23755, "r": 530.35156, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "Picture", "bbox": {"l": 532.57599, "t": 645.28238, "r": 557.211, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": ",", "bbox": {"l": 557.211, "t": 645.23755, "r": 559.18756, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "Section-header", "bbox": {"l": 317.95499, "t": 656.2413799999999, "r": 368.78821, "b": 664.58013, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": ",", "bbox": {"l": 368.789, "t": 656.19655, "r": 370.72217, "b": 664.5711699999999, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "Table", "bbox": {"l": 372.89999, "t": 656.2413799999999, "r": 391.57254, "b": 664.58013, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": ",", "bbox": {"l": 391.573, "t": 656.19655, "r": 393.50616, "b": 664.5711699999999, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "Text", "bbox": {"l": 395.68399, "t": 656.2413799999999, "r": 410.23538, "b": 664.58013, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": ", and", "bbox": {"l": 410.23099, "t": 656.19655, "r": 427.5679, "b": 664.5711699999999, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "Title", "bbox": {"l": 429.74399, "t": 656.2413799999999, "r": 445.50800000000004, "b": 664.58013, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": ". Our reasoning for picking this", "bbox": {"l": 445.50800000000004, "t": 656.19655, "r": 558.20227, "b": 664.5711699999999, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "particular label set is detailed in Section 4.", "bbox": {"l": 317.95499, "t": 667.15556, "r": 472.22198, "b": 675.53017, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "DocLayNet contains 80863 PDF pages. Among these, 7059 carry two instances of human annotations, and 1591 carry three. This amounts to 91104 total annotation instances. The annotations provide layout information in the shape of labeled, rectangular boundingboxes. We define 11 distinct labels for layout features, namely Caption , Footnote , Formula , List-item , Page-footer , Page-header , Picture , Section-header , Table , Text , and Title . Our reasoning for picking this particular label set is detailed in Section 4."}, {"label": "text", "id": 8, "page_no": 1, "cluster": {"id": 8, "label": "text", "bbox": {"l": 317.95499, "t": 678.11456, "r": 558.2041, "b": 708.4071730000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9749757051467896, "cells": [{"id": 152, "text": "In addition to open intellectual property constraints for the", "bbox": {"l": 327.918, "t": 678.11456, "r": 558.19843, "b": 686.4891700000001, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "source documents, we required that the documents in DocLayNet", "bbox": {"l": 317.95499, "t": 689.07355, "r": 558.19867, "b": 697.448174, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "adhere to a few conditions. Firstly, we kept scanned documents", "bbox": {"l": 317.95499, "t": 700.032555, "r": 558.2041, "b": 708.4071730000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In addition to open intellectual property constraints for the source documents, we required that the documents in DocLayNet adhere to a few conditions. Firstly, we kept scanned documents"}], "body": [{"label": "section_header", "id": 14, "page_no": 1, "cluster": {"id": 14, "label": "section_header", "bbox": {"l": 53.79800000000001, "t": 85.85986000000003, "r": 156.52899, "b": 96.16900999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9367801547050476, "cells": [{"id": 2, "text": "1", "bbox": {"l": 53.79800000000001, "t": 85.85986000000003, "r": 59.427395, "b": 96.16900999999996, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "INTRODUCTION", "bbox": {"l": 70.379532, "t": 85.85986000000003, "r": 156.52899, "b": 96.16900999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1 INTRODUCTION"}, {"label": "text", "id": 5, "page_no": 1, "cluster": {"id": 5, "label": "text", "bbox": {"l": 53.528999, "t": 110.98352, "r": 303.01697, "b": 228.94714, "coord_origin": "TOPLEFT"}, "confidence": 0.9802607893943787, "cells": [{"id": 4, "text": "Despite the substantial improvements achieved with machine-learning", "bbox": {"l": 53.79800000000001, "t": 110.98352, "r": 303.01697, "b": 119.35815000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "(ML) approaches and deep neural networks in recent years, docu-", "bbox": {"l": 53.528999, "t": 121.94256999999993, "r": 295.55695, "b": 130.31719999999996, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "ment conversion remains a challenging problem, as demonstrated", "bbox": {"l": 53.79800000000001, "t": 132.90155000000004, "r": 294.04642, "b": 141.27617999999995, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "by the numerous public competitions held on this topic [1-4]. The", "bbox": {"l": 53.79800000000001, "t": 143.85956, "r": 294.04733, "b": 152.23419, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "challenge originates from the huge variability in PDF documents", "bbox": {"l": 53.79800000000001, "t": 154.81853999999998, "r": 294.04349, "b": 163.19317999999998, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "regarding layout, language and formats (scanned, programmatic", "bbox": {"l": 53.79800000000001, "t": 165.77752999999996, "r": 294.04718, "b": 174.15215999999998, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "or a combination of both). Engineering a single ML model that can", "bbox": {"l": 53.79800000000001, "t": 176.73650999999995, "r": 294.04919, "b": 185.11114999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "be applied on all types of documents and provides high-quality", "bbox": {"l": 53.79800000000001, "t": 187.69556, "r": 294.27573, "b": 196.07019000000003, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "layout segmentation remains to this day extremely challenging [5].", "bbox": {"l": 53.79800000000001, "t": 198.65454, "r": 295.42569, "b": 207.02917000000002, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "To highlight the variability in document layouts, we show a few", "bbox": {"l": 53.528999, "t": 209.61352999999997, "r": 294.37256, "b": 217.98816, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "example documents from the DocLayNet dataset in Figure 1.", "bbox": {"l": 53.79800000000001, "t": 220.57250999999997, "r": 275.48334, "b": 228.94714, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Despite the substantial improvements achieved with machine-learning (ML) approaches and deep neural networks in recent years, document conversion remains a challenging problem, as demonstrated by the numerous public competitions held on this topic [1-4]. The challenge originates from the huge variability in PDF documents regarding layout, language and formats (scanned, programmatic or a combination of both). Engineering a single ML model that can be applied on all types of documents and provides high-quality layout segmentation remains to this day extremely challenging [5]. To highlight the variability in document layouts, we show a few example documents from the DocLayNet dataset in Figure 1."}, {"label": "text", "id": 7, "page_no": 1, "cluster": {"id": 7, "label": "text", "bbox": {"l": 53.528999, "t": 231.53156, "r": 295.56412, "b": 502.91916, "coord_origin": "TOPLEFT"}, "confidence": 0.9793015718460083, "cells": [{"id": 15, "text": "A key problem in the process of document conversion is to under-", "bbox": {"l": 63.76100199999999, "t": 231.53156, "r": 295.564, "b": 239.90619000000004, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "stand the structure of a single document page, i.e. which segments", "bbox": {"l": 53.79800000000001, "t": 242.49054, "r": 294.04868, "b": 250.86517000000003, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "of text should be grouped together in a unit. To train models for this", "bbox": {"l": 53.79800000000001, "t": 253.44854999999995, "r": 294.04532, "b": 261.82318, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "task, there are currently two large datasets available to the com-", "bbox": {"l": 53.79800000000001, "t": 264.40752999999995, "r": 295.55618, "b": 272.78216999999995, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "munity, PubLayNet [6] and DocBank [7]. They were introduced", "bbox": {"l": 53.79800000000001, "t": 275.36658, "r": 294.04059, "b": 283.74118, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "in 2019 and 2020 respectively and significantly accelerated the im-", "bbox": {"l": 53.79800000000001, "t": 286.32552999999996, "r": 295.55783, "b": 294.70016, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "plementation of layout detection and segmentation models due to", "bbox": {"l": 53.79800000000001, "t": 297.28455, "r": 294.04538, "b": 305.65918000000005, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "their sizes of 300K and 500K ground-truth pages. These sizes were", "bbox": {"l": 53.79800000000001, "t": 308.24353, "r": 294.043, "b": 316.61816, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "achieved by leveraging an automation approach. The benefit of au-", "bbox": {"l": 53.79800000000001, "t": 319.20255, "r": 295.56412, "b": 327.57718, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "tomated ground-truth generation is obvious: one can generate large", "bbox": {"l": 53.79800000000001, "t": 330.16153, "r": 294.04532, "b": 338.53616, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "ground-truth datasets at virtually no cost. However, the automation", "bbox": {"l": 53.79800000000001, "t": 341.12054, "r": 294.04538, "b": 349.49518, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "introduces a constraint on the variability in the dataset, because", "bbox": {"l": 53.79800000000001, "t": 352.07953, "r": 294.04712, "b": 360.45416000000006, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "corresponding structured source data must be available. PubLayNet", "bbox": {"l": 53.79800000000001, "t": 363.03853999999995, "r": 294.04538, "b": 371.41318, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "and DocBank were both generated from scientific document repos-", "bbox": {"l": 53.79800000000001, "t": 373.99655, "r": 295.55643, "b": 382.37119, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "itories (PubMed and arXiv), which provide XML or L", "bbox": {"l": 53.79800000000001, "t": 384.95554, "r": 246.75909, "b": 393.33017, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "A", "bbox": {"l": 243.53101000000004, "t": 385.03183000000007, "r": 248.58553000000003, "b": 391.82455, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "T", "bbox": {"l": 247.24099999999999, "t": 384.95554, "r": 252.58859, "b": 393.33017, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "E", "bbox": {"l": 251.09398999999996, "t": 386.87954999999994, "r": 256.08829, "b": 395.25418, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "X", "bbox": {"l": 254.967, "t": 384.95554, "r": 261.33725, "b": 393.33017, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "sources.", "bbox": {"l": 263.75021, "t": 384.95554, "r": 295.42773, "b": 393.33017, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "Those scientific documents present a limited variability in their", "bbox": {"l": 53.528999, "t": 395.91455, "r": 294.21713, "b": 404.28918, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "layouts, because they are typeset in uniform templates provided by", "bbox": {"l": 53.79800000000001, "t": 406.87354, "r": 294.27386, "b": 415.24817, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "the publishers. Obviously, documents such as technical manuals,", "bbox": {"l": 53.79800000000001, "t": 417.8325500000001, "r": 295.03488, "b": 426.20717999999994, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "annual company reports, legal text, government tenders, etc. have", "bbox": {"l": 53.79800000000001, "t": 428.79153, "r": 294.04691, "b": 437.16617, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "very different and partially unique layouts. As a consequence, the", "bbox": {"l": 53.57400100000001, "t": 439.75055, "r": 294.04865, "b": 448.12518, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "layout predictions obtained from models trained on PubLayNet or", "bbox": {"l": 53.79800000000001, "t": 450.7095299999999, "r": 294.21643, "b": 459.08417, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "DocBank is very reasonable when applied on scientific documents.", "bbox": {"l": 53.79800000000001, "t": 461.66855, "r": 295.42181, "b": 470.04318, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "However, for more", "bbox": {"l": 53.79800000000001, "t": 472.62753, "r": 125.52795, "b": 481.00217, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "artistic", "bbox": {"l": 128.608, "t": 472.67239, "r": 153.7679, "b": 481.01114, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "or", "bbox": {"l": 157.15199, "t": 472.62753, "r": 165.16365, "b": 481.00217, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "free-style", "bbox": {"l": 168.248, "t": 472.67239, "r": 201.49272, "b": 481.01114, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "layouts, we see sub-par", "bbox": {"l": 204.78799, "t": 472.62753, "r": 294.21494, "b": 481.00217, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "prediction quality from these models, which we demonstrate in", "bbox": {"l": 53.79800000000001, "t": 483.58554, "r": 294.04715, "b": 491.96017, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Section 5.", "bbox": {"l": 53.79800000000001, "t": 494.54453, "r": 89.080788, "b": 502.91916, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "A key problem in the process of document conversion is to understand the structure of a single document page, i.e. which segments of text should be grouped together in a unit. To train models for this task, there are currently two large datasets available to the community, PubLayNet [6] and DocBank [7]. They were introduced in 2019 and 2020 respectively and significantly accelerated the implementation of layout detection and segmentation models due to their sizes of 300K and 500K ground-truth pages. These sizes were achieved by leveraging an automation approach. The benefit of automated ground-truth generation is obvious: one can generate large ground-truth datasets at virtually no cost. However, the automation introduces a constraint on the variability in the dataset, because corresponding structured source data must be available. PubLayNet and DocBank were both generated from scientific document repositories (PubMed and arXiv), which provide XML or L A T E X sources. Those scientific documents present a limited variability in their layouts, because they are typeset in uniform templates provided by the publishers. Obviously, documents such as technical manuals, annual company reports, legal text, government tenders, etc. have very different and partially unique layouts. As a consequence, the layout predictions obtained from models trained on PubLayNet or DocBank is very reasonable when applied on scientific documents. However, for more artistic or free-style layouts, we see sub-par prediction quality from these models, which we demonstrate in Section 5."}, {"label": "text", "id": 6, "page_no": 1, "cluster": {"id": 6, "label": "text", "bbox": {"l": 53.591999, "t": 505.50354, "r": 295.56396, "b": 579.63217, "coord_origin": "TOPLEFT"}, "confidence": 0.9795253276824951, "cells": [{"id": 49, "text": "In this paper, we present the DocLayNet dataset. It provides page-", "bbox": {"l": 63.76100199999999, "t": 505.50354, "r": 295.56396, "b": 513.87817, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "by-page layout annotation ground-truth using bounding-boxes for", "bbox": {"l": 53.79800000000001, "t": 516.46252, "r": 294.21271, "b": 524.83716, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "11", "bbox": {"l": 53.591999, "t": 527.42154, "r": 61.92275599999999, "b": 535.7961700000001, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "distinct class labels on 80863 unique document pages, of which", "bbox": {"l": 64.162201, "t": 527.42154, "r": 294.04626, "b": 535.7961700000001, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "a fraction carry double- or triple-annotations. DocLayNet is similar", "bbox": {"l": 53.79800000000001, "t": 538.38055, "r": 294.21228, "b": 546.75517, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "in spirit to PubLayNet and DocBank and will likewise be made", "bbox": {"l": 53.79800000000001, "t": 549.33955, "r": 294.04709, "b": 557.71417, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "available to the public", "bbox": {"l": 53.79800000000001, "t": 560.29855, "r": 134.28951, "b": 568.67317, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "1", "bbox": {"l": 134.29201, "t": 558.23083, "r": 137.67381, "b": 565.0235299999999, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "in order to stimulate the document-layout", "bbox": {"l": 140.418, "t": 560.29855, "r": 294.047, "b": 568.67317, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "analysis community. It distinguishes itself in the following aspects:", "bbox": {"l": 53.79800000000001, "t": 571.25755, "r": 295.10538, "b": 579.63217, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In this paper, we present the DocLayNet dataset. It provides pageby-page layout annotation ground-truth using bounding-boxes for 11 distinct class labels on 80863 unique document pages, of which a fraction carry double- or triple-annotations. DocLayNet is similar in spirit to PubLayNet and DocBank and will likewise be made available to the public 1 in order to stimulate the document-layout analysis community. It distinguishes itself in the following aspects:"}, {"label": "list_item", "id": 9, "page_no": 1, "cluster": {"id": 9, "label": "list_item", "bbox": {"l": 64.708, "t": 584.58156, "r": 295.56165, "b": 614.87418, "coord_origin": "TOPLEFT"}, "confidence": 0.9687220454216003, "cells": [{"id": 59, "text": "(1)", "bbox": {"l": 64.708, "t": 584.58156, "r": 74.221352, "b": 592.95618, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Human Annotation", "bbox": {"l": 78.207001, "t": 584.62639, "r": 146.39589, "b": 592.96515, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": ": In contrast to PubLayNet and DocBank,", "bbox": {"l": 146.41701, "t": 584.58156, "r": 295.03036, "b": 592.95618, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "we relied on human annotation instead of automation ap-", "bbox": {"l": 77.875, "t": 595.54056, "r": 295.56165, "b": 603.91518, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "proaches to generate the data set.", "bbox": {"l": 78.207001, "t": 606.49956, "r": 200.6432, "b": 614.87418, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "(1) Human Annotation : In contrast to PubLayNet and DocBank, we relied on human annotation instead of automation approaches to generate the data set."}, {"label": "list_item", "id": 11, "page_no": 1, "cluster": {"id": 11, "label": "list_item", "bbox": {"l": 64.708, "t": 617.45856, "r": 294.26254, "b": 636.79117, "coord_origin": "TOPLEFT"}, "confidence": 0.9594229459762573, "cells": [{"id": 64, "text": "(2)", "bbox": {"l": 64.708, "t": 617.45856, "r": 74.221352, "b": 625.8331800000001, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "Large Layout Variability", "bbox": {"l": 78.207001, "t": 617.50339, "r": 167.91745, "b": 625.84215, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": ": We include diverse and complex", "bbox": {"l": 168.33501, "t": 617.45856, "r": 294.26254, "b": 625.8331800000001, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "layouts from a large variety of public sources.", "bbox": {"l": 78.207001, "t": 628.41655, "r": 245.45726000000002, "b": 636.79117, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "(2) Large Layout Variability : We include diverse and complex layouts from a large variety of public sources."}, {"label": "list_item", "id": 10, "page_no": 1, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 64.708, "t": 639.37555, "r": 294.68381, "b": 669.66817, "coord_origin": "TOPLEFT"}, "confidence": 0.9615103006362915, "cells": [{"id": 68, "text": "(3)", "bbox": {"l": 64.708, "t": 639.37555, "r": 74.221352, "b": 647.75017, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "Detailed Label Set", "bbox": {"l": 78.207001, "t": 639.42038, "r": 143.51663, "b": 647.75914, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": ": We define 11 class labels to distinguish", "bbox": {"l": 144.02, "t": 639.37555, "r": 294.04648, "b": 647.75017, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "layout features in high detail. PubLayNet provides 5 labels;", "bbox": {"l": 78.207001, "t": 650.33455, "r": 294.68381, "b": 658.70917, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "DocBank provides 13, although not a superset of ours.", "bbox": {"l": 78.207001, "t": 661.29355, "r": 276.33752, "b": 669.66817, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "(3) Detailed Label Set : We define 11 class labels to distinguish layout features in high detail. PubLayNet provides 5 labels; DocBank provides 13, although not a superset of ours."}, {"label": "list_item", "id": 13, "page_no": 1, "cluster": {"id": 13, "label": "list_item", "bbox": {"l": 64.708, "t": 672.25256, "r": 295.56439, "b": 691.58617, "coord_origin": "TOPLEFT"}, "confidence": 0.9447500109672546, "cells": [{"id": 73, "text": "(4)", "bbox": {"l": 64.708, "t": 672.25256, "r": 74.221352, "b": 680.62717, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "Redundant Annotations", "bbox": {"l": 78.207001, "t": 672.29739, "r": 163.78357, "b": 680.63614, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": ": A fraction of the pages in the Do-", "bbox": {"l": 163.994, "t": 672.25256, "r": 295.56439, "b": 680.62717, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "cLayNet data set carry more than one human annotation.", "bbox": {"l": 78.207001, "t": 683.21156, "r": 295.42719, "b": 691.58617, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "(4) Redundant Annotations : A fraction of the pages in the DocLayNet data set carry more than one human annotation."}, {"label": "footnote", "id": 17, "page_no": 1, "cluster": {"id": 17, "label": "footnote", "bbox": {"l": 53.672001, "t": 702.226364, "r": 216.02750000000003, "b": 708.739891, "coord_origin": "TOPLEFT"}, "confidence": 0.8584771752357483, "cells": [{"id": 77, "text": "$^{1}$https://developer.ibm.com/exchanges/data/all/doclaynet", "bbox": {"l": 53.672001, "t": 702.226364, "r": 216.02750000000003, "b": 708.739891, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "$^{1}$https://developer.ibm.com/exchanges/data/all/doclaynet"}, {"label": "text", "id": 18, "page_no": 1, "cluster": {"id": 18, "label": "text", "bbox": {"l": 342.095, "t": 87.36352999999997, "r": 558.43201, "b": 106.69713999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.7997146844863892, "cells": [{"id": 78, "text": "This enables experimentation with annotation uncertainty", "bbox": {"l": 342.095, "t": 87.36352999999997, "r": 558.43201, "b": 95.73816, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "and quality control analysis.", "bbox": {"l": 342.36401, "t": 98.32250999999997, "r": 445.83629999999994, "b": 106.69713999999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "This enables experimentation with annotation uncertainty and quality control analysis."}, {"label": "list_item", "id": 12, "page_no": 1, "cluster": {"id": 12, "label": "list_item", "bbox": {"l": 328.86502, "t": 109.28148999999996, "r": 559.72101, "b": 161.49114999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9563499093055725, "cells": [{"id": 80, "text": "(5)", "bbox": {"l": 328.86502, "t": 109.28148999999996, "r": 338.37836, "b": 117.65612999999996, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Pre-defined Train-, Test- & Validation-set", "bbox": {"l": 342.36401, "t": 109.32641999999998, "r": 487.25296, "b": 117.66516000000001, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": ": Like DocBank, we", "bbox": {"l": 487.75900000000007, "t": 109.28156000000001, "r": 558.20294, "b": 117.65618999999992, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "provide fixed train-, test- & validation-sets to ensure propor-", "bbox": {"l": 342.36401, "t": 120.24054000000001, "r": 559.72101, "b": 128.61517000000003, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "tional representation of the class-labels. Further, we prevent", "bbox": {"l": 342.36401, "t": 131.19854999999995, "r": 558.20117, "b": 139.57317999999998, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "leakage of unique layouts across sets, which has a large effect", "bbox": {"l": 342.36401, "t": 142.15752999999995, "r": 558.20087, "b": 150.53216999999995, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "on model accuracy scores.", "bbox": {"l": 342.36401, "t": 153.11652000000004, "r": 438.0624399999999, "b": 161.49114999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "(5) Pre-defined Train-, Test- & Validation-set : Like DocBank, we provide fixed train-, test- & validation-sets to ensure proportional representation of the class-labels. Further, we prevent leakage of unique layouts across sets, which has a large effect on model accuracy scores."}, {"label": "text", "id": 4, "page_no": 1, "cluster": {"id": 4, "label": "text", "bbox": {"l": 317.62299, "t": 167.97551999999996, "r": 559.19031, "b": 220.18615999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9813903570175171, "cells": [{"id": 87, "text": "All aspects outlined above are detailed in Section 3. In Section 4,", "bbox": {"l": 327.918, "t": 167.97551999999996, "r": 559.19031, "b": 176.35015999999996, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "we will elaborate on how we designed and executed this large-scale", "bbox": {"l": 317.62299, "t": 178.93451000000005, "r": 558.20422, "b": 187.30913999999996, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "human annotation campaign. We will also share key insights and", "bbox": {"l": 317.95499, "t": 189.89355, "r": 558.19763, "b": 198.26819, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "lessons learned that might prove helpful for other parties planning", "bbox": {"l": 317.95499, "t": 200.85253999999998, "r": 558.20612, "b": 209.22717, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "to set up annotation campaigns.", "bbox": {"l": 317.95499, "t": 211.81151999999997, "r": 434.94861, "b": 220.18615999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "All aspects outlined above are detailed in Section 3. In Section 4, we will elaborate on how we designed and executed this large-scale human annotation campaign. We will also share key insights and lessons learned that might prove helpful for other parties planning to set up annotation campaigns."}, {"label": "text", "id": 3, "page_no": 1, "cluster": {"id": 3, "label": "text", "bbox": {"l": 317.73099, "t": 222.77057000000002, "r": 559.58197, "b": 307.85718, "coord_origin": "TOPLEFT"}, "confidence": 0.9844217300415039, "cells": [{"id": 92, "text": "In Section 5, we will present baseline accuracy numbers for a", "bbox": {"l": 327.918, "t": 222.77057000000002, "r": 558.19836, "b": 231.14520000000005, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "variety of object detection methods (Faster R-CNN, Mask R-CNN", "bbox": {"l": 317.73099, "t": 233.72955000000002, "r": 558.1991, "b": 242.10419000000002, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "and YOLOv5) trained on DocLayNet. We further show how the", "bbox": {"l": 317.95499, "t": 244.68854, "r": 558.20416, "b": 253.06317, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "model performance is impacted by varying the DocLayNet dataset", "bbox": {"l": 317.95499, "t": 255.64752, "r": 558.20563, "b": 264.02216, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "size, reducing the label set and modifying the train/test-split. Last", "bbox": {"l": 317.95499, "t": 266.60553000000004, "r": 558.19861, "b": 274.98015999999996, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "but not least, we compare the performance of models trained on", "bbox": {"l": 317.95499, "t": 277.56458, "r": 558.20416, "b": 285.93918, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "PubLayNet, DocBank and DocLayNet and demonstrate that a model", "bbox": {"l": 317.95499, "t": 288.52353, "r": 558.20239, "b": 296.89816, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "trained on DocLayNet provides overall more robust layout recovery.", "bbox": {"l": 317.95499, "t": 299.48254, "r": 559.58197, "b": 307.85718, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In Section 5, we will present baseline accuracy numbers for a variety of object detection methods (Faster R-CNN, Mask R-CNN and YOLOv5) trained on DocLayNet. We further show how the model performance is impacted by varying the DocLayNet dataset size, reducing the label set and modifying the train/test-split. Last but not least, we compare the performance of models trained on PubLayNet, DocBank and DocLayNet and demonstrate that a model trained on DocLayNet provides overall more robust layout recovery."}, {"label": "section_header", "id": 15, "page_no": 1, "cluster": {"id": 15, "label": "section_header", "bbox": {"l": 317.95499, "t": 321.20889, "r": 421.74411, "b": 331.51797, "coord_origin": "TOPLEFT"}, "confidence": 0.9347459077835083, "cells": [{"id": 100, "text": "2", "bbox": {"l": 317.95499, "t": 321.20889, "r": 323.10388, "b": 331.51797, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "RELATED WORK", "bbox": {"l": 333.12115, "t": 321.20889, "r": 421.74411, "b": 331.51797, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2 RELATED WORK"}, {"label": "text", "id": 1, "page_no": 1, "cluster": {"id": 1, "label": "text", "bbox": {"l": 317.52499, "t": 346.3325500000001, "r": 559.71613, "b": 464.29617, "coord_origin": "TOPLEFT"}, "confidence": 0.9860377907752991, "cells": [{"id": 102, "text": "While early approaches in document-layout analysis used rule-", "bbox": {"l": 317.52499, "t": 346.3325500000001, "r": 559.71301, "b": 354.70717999999994, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "based algorithms and heuristics [8], the problem is lately addressed", "bbox": {"l": 317.95499, "t": 357.29153, "r": 558.20276, "b": 365.66617, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "with deep learning methods. The most common approach is to lever-", "bbox": {"l": 317.62299, "t": 368.25055, "r": 559.71564, "b": 376.62518, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "age object detection models [9-15]. In the last decade, the accuracy", "bbox": {"l": 317.95499, "t": 379.2095299999999, "r": 558.43365, "b": 387.58417, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "and speed of these models has increased dramatically. Furthermore,", "bbox": {"l": 317.95499, "t": 390.16855000000004, "r": 559.18658, "b": 398.54318, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "most state-of-the-art object detection methods can be trained and", "bbox": {"l": 317.95499, "t": 401.12753, "r": 558.20502, "b": 409.50217, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "applied with very little work, thanks to a standardisation effort", "bbox": {"l": 317.95499, "t": 412.08655, "r": 558.20422, "b": 420.46118, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "of the ground-truth data format [16] and common deep-learning", "bbox": {"l": 317.95499, "t": 423.04553, "r": 558.20477, "b": 431.4201699999999, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "frameworks [17]. Reference data sets such as PubLayNet [6] and", "bbox": {"l": 317.95499, "t": 434.00354, "r": 558.19952, "b": 442.37817, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "DocBank provide their data in the commonly accepted COCO for-", "bbox": {"l": 317.95499, "t": 444.96252, "r": 559.71613, "b": 453.33716, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "mat [16].", "bbox": {"l": 317.95499, "t": 455.92154, "r": 350.90652, "b": 464.29617, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "While early approaches in document-layout analysis used rulebased algorithms and heuristics [8], the problem is lately addressed with deep learning methods. The most common approach is to leverage object detection models [9-15]. In the last decade, the accuracy and speed of these models has increased dramatically. Furthermore, most state-of-the-art object detection methods can be trained and applied with very little work, thanks to a standardisation effort of the ground-truth data format [16] and common deep-learning frameworks [17]. Reference data sets such as PubLayNet [6] and DocBank provide their data in the commonly accepted COCO format [16]."}, {"label": "text", "id": 0, "page_no": 1, "cluster": {"id": 0, "label": "text", "bbox": {"l": 317.95499, "t": 466.88052, "r": 559.18646, "b": 551.96817, "coord_origin": "TOPLEFT"}, "confidence": 0.9861046671867371, "cells": [{"id": 113, "text": "Lately, new types of ML models for document-layout analysis", "bbox": {"l": 327.918, "t": 466.88052, "r": 558.19824, "b": 475.25516, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "have emerged in the community [18-21]. These models do not", "bbox": {"l": 317.95499, "t": 477.83954, "r": 558.20551, "b": 486.21417, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "approach the problem of layout analysis purely based on an image", "bbox": {"l": 317.95499, "t": 488.79855, "r": 558.20575, "b": 497.17319, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "representation of the page, as computer vision methods do. Instead,", "bbox": {"l": 317.95499, "t": 499.75754, "r": 559.18646, "b": 508.13217, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "they combine the text tokens and image representation of a page", "bbox": {"l": 317.95499, "t": 510.71655, "r": 558.2002, "b": 519.09119, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "in order to obtain a segmentation. While the reported accuracies", "bbox": {"l": 317.95499, "t": 521.67554, "r": 558.20618, "b": 530.05017, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "appear to be promising, a broadly accepted data format which links", "bbox": {"l": 317.95499, "t": 532.63455, "r": 558.20239, "b": 541.00917, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "geometric and textual features has yet to establish.", "bbox": {"l": 317.95499, "t": 543.59355, "r": 503.32648, "b": 551.96817, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Lately, new types of ML models for document-layout analysis have emerged in the community [18-21]. These models do not approach the problem of layout analysis purely based on an image representation of the page, as computer vision methods do. Instead, they combine the text tokens and image representation of a page in order to obtain a segmentation. While the reported accuracies appear to be promising, a broadly accepted data format which links geometric and textual features has yet to establish."}, {"label": "section_header", "id": 16, "page_no": 1, "cluster": {"id": 16, "label": "section_header", "bbox": {"l": 317.95499, "t": 565.3199, "r": 477.45688, "b": 575.629, "coord_origin": "TOPLEFT"}, "confidence": 0.9331073760986328, "cells": [{"id": 121, "text": "3", "bbox": {"l": 317.95499, "t": 565.3199, "r": 322.97391, "b": 575.629, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "THE DOCLAYNET DATASET", "bbox": {"l": 332.73831, "t": 565.3199, "r": 477.45688, "b": 575.629, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3 THE DOCLAYNET DATASET"}, {"label": "text", "id": 2, "page_no": 1, "cluster": {"id": 2, "label": "text", "bbox": {"l": 317.95499, "t": 590.4435599999999, "r": 559.7132, "b": 675.53017, "coord_origin": "TOPLEFT"}, "confidence": 0.9852981567382812, "cells": [{"id": 123, "text": "DocLayNet contains 80863 PDF pages. Among these, 7059 carry two", "bbox": {"l": 317.95499, "t": 590.4435599999999, "r": 558.20233, "b": 598.81818, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "instances of human annotations, and 1591 carry three. This amounts", "bbox": {"l": 317.95499, "t": 601.40256, "r": 558.20239, "b": 609.77718, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "to 91104 total annotation instances. The annotations provide lay-", "bbox": {"l": 317.95499, "t": 612.36055, "r": 559.7132, "b": 620.73517, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "out information in the shape of labeled, rectangular bounding-", "bbox": {"l": 317.95499, "t": 623.3195499999999, "r": 559.71313, "b": 631.69417, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "boxes. We define 11 distinct labels for layout features, namely", "bbox": {"l": 317.95499, "t": 634.27855, "r": 539.92047, "b": 642.65317, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "Cap-", "bbox": {"l": 542.15802, "t": 634.32338, "r": 559.09888, "b": 642.66214, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "tion", "bbox": {"l": 317.95499, "t": 645.28238, "r": 331.86273, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": ",", "bbox": {"l": 331.86301, "t": 645.23755, "r": 333.83957, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "Footnote", "bbox": {"l": 336.064, "t": 645.28238, "r": 366.05368, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": ",", "bbox": {"l": 366.05301, "t": 645.23755, "r": 368.02957, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "Formula", "bbox": {"l": 370.254, "t": 645.28238, "r": 400.05502, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": ",", "bbox": {"l": 400.05499, "t": 645.23755, "r": 402.03156, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "List-item", "bbox": {"l": 404.25601, "t": 645.28238, "r": 436.19531, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": ",", "bbox": {"l": 436.19501, "t": 645.23755, "r": 438.17157, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "Page-footer", "bbox": {"l": 440.396, "t": 645.28238, "r": 480.60988999999995, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": ",", "bbox": {"l": 480.60999, "t": 645.23755, "r": 482.58655000000005, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "Page-header", "bbox": {"l": 484.811, "t": 645.28238, "r": 528.37604, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": ",", "bbox": {"l": 528.375, "t": 645.23755, "r": 530.35156, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "Picture", "bbox": {"l": 532.57599, "t": 645.28238, "r": 557.211, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": ",", "bbox": {"l": 557.211, "t": 645.23755, "r": 559.18756, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "Section-header", "bbox": {"l": 317.95499, "t": 656.2413799999999, "r": 368.78821, "b": 664.58013, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": ",", "bbox": {"l": 368.789, "t": 656.19655, "r": 370.72217, "b": 664.5711699999999, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "Table", "bbox": {"l": 372.89999, "t": 656.2413799999999, "r": 391.57254, "b": 664.58013, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": ",", "bbox": {"l": 391.573, "t": 656.19655, "r": 393.50616, "b": 664.5711699999999, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "Text", "bbox": {"l": 395.68399, "t": 656.2413799999999, "r": 410.23538, "b": 664.58013, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": ", and", "bbox": {"l": 410.23099, "t": 656.19655, "r": 427.5679, "b": 664.5711699999999, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "Title", "bbox": {"l": 429.74399, "t": 656.2413799999999, "r": 445.50800000000004, "b": 664.58013, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": ". Our reasoning for picking this", "bbox": {"l": 445.50800000000004, "t": 656.19655, "r": 558.20227, "b": 664.5711699999999, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "particular label set is detailed in Section 4.", "bbox": {"l": 317.95499, "t": 667.15556, "r": 472.22198, "b": 675.53017, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "DocLayNet contains 80863 PDF pages. Among these, 7059 carry two instances of human annotations, and 1591 carry three. This amounts to 91104 total annotation instances. The annotations provide layout information in the shape of labeled, rectangular boundingboxes. We define 11 distinct labels for layout features, namely Caption , Footnote , Formula , List-item , Page-footer , Page-header , Picture , Section-header , Table , Text , and Title . Our reasoning for picking this particular label set is detailed in Section 4."}, {"label": "text", "id": 8, "page_no": 1, "cluster": {"id": 8, "label": "text", "bbox": {"l": 317.95499, "t": 678.11456, "r": 558.2041, "b": 708.4071730000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9749757051467896, "cells": [{"id": 152, "text": "In addition to open intellectual property constraints for the", "bbox": {"l": 327.918, "t": 678.11456, "r": 558.19843, "b": 686.4891700000001, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "source documents, we required that the documents in DocLayNet", "bbox": {"l": 317.95499, "t": 689.07355, "r": 558.19867, "b": 697.448174, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "adhere to a few conditions. Firstly, we kept scanned documents", "bbox": {"l": 317.95499, "t": 700.032555, "r": 558.2041, "b": 708.4071730000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In addition to open intellectual property constraints for the source documents, we required that the documents in DocLayNet adhere to a few conditions. Firstly, we kept scanned documents"}], "headers": [{"label": "page_header", "id": 19, "page_no": 1, "cluster": {"id": 19, "label": "page_header", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.7682238221168518, "cells": [{"id": 0, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 246.24382, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar", "bbox": {"l": 253.13897999999998, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "KDD '22, August 14-18, 2022, Washington, DC, USA Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar"}]}}, {"page_no": 2, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Patents", "bbox": {"l": 237.11293, "t": 133.08716000000004, "r": 262.97623, "b": 141.61419999999998, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "8%", "bbox": {"l": 202.87892, "t": 140.46178999999995, "r": 213.89999, "b": 148.98883, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Scientific", "bbox": {"l": 207.13306, "t": 93.1576500000001, "r": 237.64882999999998, "b": 101.68469000000005, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "17%", "bbox": {"l": 184.40349, "t": 118.68206999999995, "r": 199.66519, "b": 127.20911000000001, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Financial", "bbox": {"l": 88.288223, "t": 114.35473999999988, "r": 118.80401, "b": 122.88176999999985, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "32%", "bbox": {"l": 136.24422, "t": 130.24408000000005, "r": 151.50592, "b": 138.77112, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Tenders", "bbox": {"l": 93.973373, "t": 187.65765, "r": 121.11515, "b": 196.18469000000005, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "6%", "bbox": {"l": 139.6235, "t": 170.22748, "r": 150.64458, "b": 178.75451999999996, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Laws", "bbox": {"l": 139.88339, "t": 212.50036999999998, "r": 157.68491, "b": 221.02739999999994, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "16%", "bbox": {"l": 157.43983, "t": 183.77808000000005, "r": 172.70154, "b": 192.30511, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Manuals", "bbox": {"l": 225.47252, "t": 189.29656999999997, "r": 254.29510000000002, "b": 197.82361000000003, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "21%", "bbox": {"l": 194.40683, "t": 171.12145999999996, "r": 209.66853, "b": 179.6485, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Figure 2: Distribution of DocLayNet pages across document", "bbox": {"l": 53.79800000000001, "t": 236.11499000000003, "r": 294.04373, "b": 244.58826, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "categories.", "bbox": {"l": 53.79800000000001, "t": 247.07397000000003, "r": 96.756027, "b": 255.54724, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "to a minimum, since they introduce difficulties in annotation (see", "bbox": {"l": 53.79800000000001, "t": 281.8035300000001, "r": 294.04605, "b": 290.17815999999993, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "Section 4). As a second condition, we focussed on medium to large", "bbox": {"l": 53.79800000000001, "t": 292.76254, "r": 294.04868, "b": 301.13718, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "documents (", "bbox": {"l": 53.79800000000001, "t": 303.72153, "r": 98.881348, "b": 312.09616, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": ">", "bbox": {"l": 99.070999, "t": 306.07971, "r": 104.77363, "b": 310.08768, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "10", "bbox": {"l": 107.46399999999998, "t": 303.72153, "r": 115.83373999999999, "b": 312.09616, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "pages) with technical content, dense in complex", "bbox": {"l": 118.08366, "t": 303.72153, "r": 294.26233, "b": 312.09616, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "tables, figures, plots and captions. Such documents carry a lot of", "bbox": {"l": 53.79800000000001, "t": 314.68054, "r": 294.04715, "b": 323.05518, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "information value, but are often hard to analyse with high accuracy", "bbox": {"l": 53.79800000000001, "t": 325.63855, "r": 294.27383, "b": 334.01318, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "due to their challenging layouts. Counterexamples of documents", "bbox": {"l": 53.79800000000001, "t": 336.59753, "r": 294.0416, "b": 344.97217, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "not included in the dataset are receipts, invoices, hand-written", "bbox": {"l": 53.79800000000001, "t": 347.5565500000001, "r": 294.04712, "b": 355.9311799999999, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "documents or photographs showing \u201ctext in the wild\".", "bbox": {"l": 53.79800000000001, "t": 358.51553, "r": 251.73131, "b": 366.89017, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "The pages in DocLayNet can be grouped into six distinct cate-", "bbox": {"l": 63.76100199999999, "t": 369.47455, "r": 295.55945, "b": 377.84918, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "gories, namely", "bbox": {"l": 53.79800000000001, "t": 380.43353, "r": 105.90533, "b": 388.80816999999996, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Financial Reports", "bbox": {"l": 107.754, "t": 380.47838999999993, "r": 167.4973, "b": 388.81714, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": ",", "bbox": {"l": 167.496, "t": 380.43353, "r": 169.42915, "b": 388.80816999999996, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Manuals", "bbox": {"l": 171.28101, "t": 380.47838999999993, "r": 201.45581, "b": 388.81714, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": ",", "bbox": {"l": 201.455, "t": 380.43353, "r": 203.38815, "b": 388.80816999999996, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "Scientific Articles", "bbox": {"l": 205.24001, "t": 380.47838999999993, "r": 264.55273, "b": 388.81714, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": ",", "bbox": {"l": 264.54901, "t": 380.43353, "r": 266.48218, "b": 388.80816999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "Laws &", "bbox": {"l": 268.33401, "t": 380.47838999999993, "r": 294.36133, "b": 388.81714, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Regulations", "bbox": {"l": 53.79800000000001, "t": 391.43741000000006, "r": 94.899666, "b": 399.77615, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": ",", "bbox": {"l": 94.900002, "t": 391.39255, "r": 96.862747, "b": 399.76718, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "Patents", "bbox": {"l": 99.109001, "t": 391.43741000000006, "r": 124.72282, "b": 399.77615, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "and", "bbox": {"l": 127.17899999999999, "t": 391.39255, "r": 140.60596, "b": 399.76718, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "Government Tenders", "bbox": {"l": 142.853, "t": 391.43741000000006, "r": 215.15340000000003, "b": 399.77615, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": ". Each document cate-", "bbox": {"l": 215.15601000000004, "t": 391.39255, "r": 295.55716, "b": 399.76718, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "gory was sourced from various repositories. For example, Financial", "bbox": {"l": 53.79800000000001, "t": 402.3515300000001, "r": 294.04535, "b": 410.72617, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Reports contain both", "bbox": {"l": 53.79800000000001, "t": 413.31055, "r": 132.19516, "b": 421.68518000000006, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "free-style", "bbox": {"l": 134.528, "t": 413.35541, "r": 167.77272, "b": 421.69415, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "format annual reports", "bbox": {"l": 170.314, "t": 413.31055, "r": 252.36031, "b": 421.68518000000006, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "2", "bbox": {"l": 252.356, "t": 411.24283, "r": 255.73781, "b": 418.03555, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "which ex-", "bbox": {"l": 258.56601, "t": 413.31055, "r": 295.56046, "b": 421.68518000000006, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "pose company-specific, artistic layouts as well as the more formal", "bbox": {"l": 53.79800000000001, "t": 424.26953, "r": 294.04376, "b": 432.6441699999999, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "SEC filings. The two largest categories (", "bbox": {"l": 53.79800000000001, "t": 435.22754000000003, "r": 197.59023, "b": 443.60217, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Financial Reports", "bbox": {"l": 197.591, "t": 435.27240000000006, "r": 258.02774, "b": 443.61115, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "and", "bbox": {"l": 260.48901, "t": 435.22754000000003, "r": 273.78104, "b": 443.60217, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Man-", "bbox": {"l": 276.03201, "t": 435.27240000000006, "r": 294.94113, "b": 443.61115, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "uals", "bbox": {"l": 53.79800000000001, "t": 446.23138, "r": 68.085777, "b": 454.57013, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": ") contain a large amount of free-style layouts in order to obtain", "bbox": {"l": 68.296997, "t": 446.18652, "r": 294.04565, "b": 454.56116, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "maximum variability. In the other four categories, we boosted the", "bbox": {"l": 53.79800000000001, "t": 457.14554, "r": 294.04163, "b": 465.52017, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "variability by mixing documents from independent providers, such", "bbox": {"l": 53.57400100000001, "t": 468.10455, "r": 294.04889, "b": 476.47919, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "as different government websites or publishers. In Figure 2, we", "bbox": {"l": 53.79800000000001, "t": 479.06354, "r": 294.04715, "b": 487.43817, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "show the document categories contained in DocLayNet with their", "bbox": {"l": 53.79800000000001, "t": 490.02255, "r": 294.21643, "b": 498.39719, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "respective sizes.", "bbox": {"l": 53.79800000000001, "t": 500.98154, "r": 112.2948, "b": 509.35617, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "We did not control the document selection with regard to lan-", "bbox": {"l": 63.76100199999999, "t": 511.94055, "r": 295.55954, "b": 520.31519, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "guage. The vast majority of documents contained in DocLayNet", "bbox": {"l": 53.79800000000001, "t": 522.89954, "r": 294.04718, "b": 531.27417, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "(close to 95%) are published in English language. However, Do-", "bbox": {"l": 53.528999, "t": 533.8585499999999, "r": 295.56155, "b": 542.23317, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "cLayNet also contains a number of documents in other languages", "bbox": {"l": 53.79800000000001, "t": 544.81755, "r": 294.04144, "b": 553.19217, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "such as German (2.5%), French (1.0%) and Japanese (1.0%). While", "bbox": {"l": 53.79800000000001, "t": 555.77556, "r": 294.04709, "b": 564.15018, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "the document language has negligible impact on the performance", "bbox": {"l": 53.79800000000001, "t": 566.73456, "r": 294.04163, "b": 575.10918, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "of computer vision methods such as object detection and segmenta-", "bbox": {"l": 53.79800000000001, "t": 577.6935599999999, "r": 295.5567, "b": 586.06818, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "tion models, it might prove challenging for layout analysis methods", "bbox": {"l": 53.79800000000001, "t": 588.65256, "r": 294.04541, "b": 597.02718, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "which exploit textual features.", "bbox": {"l": 53.466999, "t": 599.61156, "r": 164.39928, "b": 607.98618, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "To ensure that future benchmarks in the document-layout analy-", "bbox": {"l": 63.76100199999999, "t": 610.57056, "r": 295.56396, "b": 618.9451799999999, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "sis community can be easily compared, we have split up DocLayNet", "bbox": {"l": 53.79800000000001, "t": 621.52956, "r": 294.04532, "b": 629.90417, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "into pre-defined train-, test- and validation-sets. In this way, we can", "bbox": {"l": 53.79800000000001, "t": 632.48856, "r": 294.04538, "b": 640.86317, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "avoid spurious variations in the evaluation scores due to random", "bbox": {"l": 53.79800000000001, "t": 643.4475600000001, "r": 294.04315, "b": 651.82217, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "splitting in train-, test- and validation-sets. We also ensured that", "bbox": {"l": 53.79800000000001, "t": 654.40656, "r": 294.04712, "b": 662.78117, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "less frequent labels are represented in train and test sets in equal", "bbox": {"l": 53.79800000000001, "t": 665.36456, "r": 294.04333, "b": 673.7391700000001, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "proportions.", "bbox": {"l": 53.79800000000001, "t": 676.32355, "r": 98.916931, "b": 684.69817, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "$^{2}$e.g. AAPL from https://www.annualreports.com/", "bbox": {"l": 53.79800000000001, "t": 701.6563639999999, "r": 195.78998, "b": 708.169891, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "Table 1 shows the overall frequency and distribution of the labels", "bbox": {"l": 327.918, "t": 87.36352999999997, "r": 558.20093, "b": 95.73816, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "among the different sets. Importantly, we ensure that subsets are", "bbox": {"l": 317.95499, "t": 98.32250999999997, "r": 558.20013, "b": 106.69713999999999, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "only split on full-document boundaries. This avoids that pages of", "bbox": {"l": 317.95499, "t": 109.28156000000001, "r": 558.20056, "b": 117.65618999999992, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "the same document are spread over train, test and validation set,", "bbox": {"l": 317.95499, "t": 120.24054000000001, "r": 559.19183, "b": 128.61517000000003, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "which can give an undesired evaluation advantage to models and", "bbox": {"l": 317.62299, "t": 131.19854999999995, "r": 558.20349, "b": 139.57317999999998, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "lead to overestimation of their prediction accuracy. We will show", "bbox": {"l": 317.95499, "t": 142.15752999999995, "r": 558.52936, "b": 150.53216999999995, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "the impact of this decision in Section 5.", "bbox": {"l": 317.95499, "t": 153.11652000000004, "r": 461.6416, "b": 161.49114999999995, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "In order to accommodate the different types of models currently", "bbox": {"l": 327.918, "t": 164.07556, "r": 558.43811, "b": 172.4502, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "in use by the community, we provide DocLayNet in an", "bbox": {"l": 317.95499, "t": 175.03454999999997, "r": 516.8219, "b": 183.40918, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "augmented", "bbox": {"l": 519.07501, "t": 175.07941000000005, "r": 558.20135, "b": 183.41814999999997, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "COCO format [16]. This entails the standard COCO ground-truth", "bbox": {"l": 317.95499, "t": 185.99352999999996, "r": 558.20325, "b": 194.36816, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "file (in JSON format) with the associated page images (in PNG", "bbox": {"l": 317.95499, "t": 196.95250999999996, "r": 558.20404, "b": 205.32714999999996, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "format, 1025", "bbox": {"l": 317.95499, "t": 207.91156, "r": 364.28769, "b": 216.28619000000003, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "\u00d7", "bbox": {"l": 364.28699, "t": 207.85779000000002, "r": 369.98962, "b": 215.55993999999998, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "1025 pixels). Furthermore, custom fields have been", "bbox": {"l": 369.98999, "t": 207.91156, "r": 558.20526, "b": 216.28619000000003, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "added to each COCO record to specify document category, original", "bbox": {"l": 317.95499, "t": 218.87054, "r": 558.20251, "b": 227.24518, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "document filename and page number. In addition, we also provide", "bbox": {"l": 317.95499, "t": 229.82952999999998, "r": 558.203, "b": 238.20416, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "the original PDF pages, as well as sidecar files containing parsed", "bbox": {"l": 317.95499, "t": 240.78754000000004, "r": 558.20404, "b": 249.16216999999995, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "PDF text and text-cell coordinates (in JSON). All additional files are", "bbox": {"l": 317.95499, "t": 251.74652000000003, "r": 558.20227, "b": 260.12114999999994, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "linked to the primary page images by their matching filenames.", "bbox": {"l": 317.95499, "t": 262.70556999999997, "r": 550.36414, "b": 271.0802, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "Despite being cost-intense and far less scalable than automation,", "bbox": {"l": 327.918, "t": 273.66454999999996, "r": 559.18488, "b": 282.03918, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "human annotation has several benefits over automated ground-", "bbox": {"l": 317.95499, "t": 284.62354, "r": 559.7132, "b": 292.99817, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "truth generation. The first and most obvious reason to leverage", "bbox": {"l": 317.95499, "t": 295.5825500000001, "r": 558.20416, "b": 303.95717999999994, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "human annotations is the freedom to annotate any type of doc-", "bbox": {"l": 317.95499, "t": 306.54153, "r": 559.71326, "b": 314.91617, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "ument without requiring a programmatic source. For most PDF", "bbox": {"l": 317.95499, "t": 317.50055, "r": 558.41443, "b": 325.87518, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "documents, the original source document is not available. The lat-", "bbox": {"l": 317.95499, "t": 328.4595299999999, "r": 559.71545, "b": 336.83417, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "ter is not a hard constraint with human annotation, but it is for", "bbox": {"l": 317.95499, "t": 339.41855000000004, "r": 558.36865, "b": 347.79318, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "automated methods. A second reason to use human annotations is", "bbox": {"l": 317.95499, "t": 350.37753, "r": 558.20062, "b": 358.75217, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "that the latter usually provide a more natural interpretation of the", "bbox": {"l": 317.95499, "t": 361.33554, "r": 558.20184, "b": 369.71017, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "page layout. The human-interpreted layout can significantly devi-", "bbox": {"l": 317.95499, "t": 372.29453, "r": 559.71442, "b": 380.66916, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "ate from the programmatic layout used in typesetting. For example,", "bbox": {"l": 317.95499, "t": 383.25354, "r": 559.1864, "b": 391.62817, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "\u201cinvisible\u201d tables might be used solely for aligning text paragraphs", "bbox": {"l": 316.94199, "t": 394.21252, "r": 558.20111, "b": 402.58716, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "on columns. Such typesetting tricks might be interpreted by au-", "bbox": {"l": 317.95499, "t": 405.17154, "r": 559.7132, "b": 413.54617, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "tomated methods incorrectly as an actual table, while the human", "bbox": {"l": 317.95499, "t": 416.13052, "r": 558.20013, "b": 424.50515999999993, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "annotation will interpret it correctly as", "bbox": {"l": 317.95499, "t": 427.08953999999994, "r": 464.50613, "b": 435.46417, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "Text", "bbox": {"l": 466.98199000000005, "t": 427.13439999999997, "r": 482.14560000000006, "b": 435.47313999999994, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "or other styles. The", "bbox": {"l": 485.13199000000003, "t": 427.08953999999994, "r": 558.19727, "b": 435.46417, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "same applies to multi-line text elements, when authors decided to", "bbox": {"l": 317.95499, "t": 438.04855, "r": 558.20221, "b": 446.4231899999999, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "space them as \u201cinvisible\u201d list elements without bullet symbols. A", "bbox": {"l": 317.95499, "t": 449.00754, "r": 558.51501, "b": 457.38217, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "third reason to gather ground-truth through human annotation is", "bbox": {"l": 317.95499, "t": 459.96655000000004, "r": 558.19855, "b": 468.34119, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "to estimate a \u201cnatural\u201d upper bound on the segmentation accuracy.", "bbox": {"l": 317.95499, "t": 470.92453, "r": 559.58215, "b": 479.29916, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "As we will show in Section 4, certain documents featuring complex", "bbox": {"l": 317.64099, "t": 481.88354, "r": 558.41559, "b": 490.25818, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "layouts can have different but equally acceptable layout interpre-", "bbox": {"l": 317.95499, "t": 492.84253, "r": 559.72156, "b": 501.21716, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "tations. This natural upper bound for segmentation accuracy can", "bbox": {"l": 317.95499, "t": 503.80154, "r": 558.19928, "b": 512.1761799999999, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "be found by annotating the same pages multiple times by different", "bbox": {"l": 317.95499, "t": 514.76053, "r": 558.20581, "b": 523.13516, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "people and evaluating the inter-annotator agreement. Such a base-", "bbox": {"l": 317.95499, "t": 525.71954, "r": 559.71729, "b": 534.09418, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "line consistency evaluation is very useful to define expectations", "bbox": {"l": 317.95499, "t": 536.6785600000001, "r": 558.20404, "b": 545.05318, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "for a good target accuracy in trained deep neural network models", "bbox": {"l": 317.95499, "t": 547.63756, "r": 558.20074, "b": 556.01218, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "and avoid overfitting (see Table 1). On the flip side, achieving high", "bbox": {"l": 317.95499, "t": 558.59656, "r": 558.20062, "b": 566.97118, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "annotation consistency proved to be a key challenge in human", "bbox": {"l": 317.95499, "t": 569.55556, "r": 558.20416, "b": 577.9301800000001, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "annotation, as we outline in Section 4.", "bbox": {"l": 317.95499, "t": 580.51456, "r": 457.62469, "b": 588.88918, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "4", "bbox": {"l": 317.95499, "t": 606.84991, "r": 323.56226, "b": 617.15901, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "ANNOTATION CAMPAIGN", "bbox": {"l": 334.47134, "t": 606.84991, "r": 470.21326, "b": 617.15901, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "The annotation campaign was carried out in four phases. In phase", "bbox": {"l": 317.686, "t": 631.97356, "r": 558.20148, "b": 640.34818, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "one, we identified and prepared the data sources for annotation.", "bbox": {"l": 317.95499, "t": 642.93256, "r": 559.58521, "b": 651.30717, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "In phase two, we determined the class labels and how annotations", "bbox": {"l": 317.95499, "t": 653.89156, "r": 558.20007, "b": 662.26617, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "should be done on the documents in order to obtain maximum con-", "bbox": {"l": 317.95499, "t": 664.85056, "r": 559.71375, "b": 673.22517, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "sistency. The latter was guided by a detailed requirement analysis", "bbox": {"l": 317.95499, "t": 675.80956, "r": 558.20233, "b": 684.18417, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "and exhaustive experiments. In phase three, we trained the annota-", "bbox": {"l": 317.95499, "t": 686.76855, "r": 559.71381, "b": 695.143173, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "tion staff and performed exams for quality assurance. In phase four,", "bbox": {"l": 317.95499, "t": 697.7275539999999, "r": 559.1864, "b": 706.102173, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 13, "label": "page_header", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.8919971585273743, "cells": [{"id": 0, "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "page_header", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.9104517102241516, "cells": [{"id": 1, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "picture", "bbox": {"l": 88.33030700683594, "t": 92.88652038574219, "r": 263.7049560546875, "b": 220.56826782226562, "coord_origin": "TOPLEFT"}, "confidence": 0.9698190689086914, "cells": [{"id": 2, "text": "Patents", "bbox": {"l": 237.11293, "t": 133.08716000000004, "r": 262.97623, "b": 141.61419999999998, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "8%", "bbox": {"l": 202.87892, "t": 140.46178999999995, "r": 213.89999, "b": 148.98883, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Scientific", "bbox": {"l": 207.13306, "t": 93.1576500000001, "r": 237.64882999999998, "b": 101.68469000000005, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "17%", "bbox": {"l": 184.40349, "t": 118.68206999999995, "r": 199.66519, "b": 127.20911000000001, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Financial", "bbox": {"l": 88.288223, "t": 114.35473999999988, "r": 118.80401, "b": 122.88176999999985, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "32%", "bbox": {"l": 136.24422, "t": 130.24408000000005, "r": 151.50592, "b": 138.77112, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Tenders", "bbox": {"l": 93.973373, "t": 187.65765, "r": 121.11515, "b": 196.18469000000005, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "6%", "bbox": {"l": 139.6235, "t": 170.22748, "r": 150.64458, "b": 178.75451999999996, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Laws", "bbox": {"l": 139.88339, "t": 212.50036999999998, "r": 157.68491, "b": 221.02739999999994, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "16%", "bbox": {"l": 157.43983, "t": 183.77808000000005, "r": 172.70154, "b": 192.30511, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Manuals", "bbox": {"l": 225.47252, "t": 189.29656999999997, "r": 254.29510000000002, "b": 197.82361000000003, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "21%", "bbox": {"l": 194.40683, "t": 171.12145999999996, "r": 209.66853, "b": 179.6485, "coord_origin": "TOPLEFT"}}], "children": [{"id": 14, "label": "text", "bbox": {"l": 237.11293, "t": 133.08716000000004, "r": 262.97623, "b": 141.61419999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 2, "text": "Patents", "bbox": {"l": 237.11293, "t": 133.08716000000004, "r": 262.97623, "b": 141.61419999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 202.87892, "t": 140.46178999999995, "r": 213.89999, "b": 148.98883, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 3, "text": "8%", "bbox": {"l": 202.87892, "t": 140.46178999999995, "r": 213.89999, "b": 148.98883, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 207.13306, "t": 93.1576500000001, "r": 237.64882999999998, "b": 101.68469000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 4, "text": "Scientific", "bbox": {"l": 207.13306, "t": 93.1576500000001, "r": 237.64882999999998, "b": 101.68469000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 184.40349, "t": 118.68206999999995, "r": 199.66519, "b": 127.20911000000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 5, "text": "17%", "bbox": {"l": 184.40349, "t": 118.68206999999995, "r": 199.66519, "b": 127.20911000000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 88.288223, "t": 114.35473999999988, "r": 118.80401, "b": 122.88176999999985, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": "Financial", "bbox": {"l": 88.288223, "t": 114.35473999999988, "r": 118.80401, "b": 122.88176999999985, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 136.24422, "t": 130.24408000000005, "r": 151.50592, "b": 138.77112, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "32%", "bbox": {"l": 136.24422, "t": 130.24408000000005, "r": 151.50592, "b": 138.77112, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 93.973373, "t": 187.65765, "r": 121.11515, "b": 196.18469000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "Tenders", "bbox": {"l": 93.973373, "t": 187.65765, "r": 121.11515, "b": 196.18469000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 139.6235, "t": 170.22748, "r": 150.64458, "b": 178.75451999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "6%", "bbox": {"l": 139.6235, "t": 170.22748, "r": 150.64458, "b": 178.75451999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 139.88339, "t": 212.50036999999998, "r": 157.68491, "b": 221.02739999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "Laws", "bbox": {"l": 139.88339, "t": 212.50036999999998, "r": 157.68491, "b": 221.02739999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 157.43983, "t": 183.77808000000005, "r": 172.70154, "b": 192.30511, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "16%", "bbox": {"l": 157.43983, "t": 183.77808000000005, "r": 172.70154, "b": 192.30511, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 225.47252, "t": 189.29656999999997, "r": 254.29510000000002, "b": 197.82361000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "Manuals", "bbox": {"l": 225.47252, "t": 189.29656999999997, "r": 254.29510000000002, "b": 197.82361000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 194.40683, "t": 171.12145999999996, "r": 209.66853, "b": 179.6485, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "21%", "bbox": {"l": 194.40683, "t": 171.12145999999996, "r": 209.66853, "b": 179.6485, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 9, "label": "caption", "bbox": {"l": 53.79800000000001, "t": 236.11499000000003, "r": 294.04373, "b": 255.54724, "coord_origin": "TOPLEFT"}, "confidence": 0.9425410628318787, "cells": [{"id": 14, "text": "Figure 2: Distribution of DocLayNet pages across document", "bbox": {"l": 53.79800000000001, "t": 236.11499000000003, "r": 294.04373, "b": 244.58826, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "categories.", "bbox": {"l": 53.79800000000001, "t": 247.07397000000003, "r": 96.756027, "b": 255.54724, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "text", "bbox": {"l": 53.79800000000001, "t": 281.8035300000001, "r": 294.27383, "b": 366.89017, "coord_origin": "TOPLEFT"}, "confidence": 0.9866552352905273, "cells": [{"id": 16, "text": "to a minimum, since they introduce difficulties in annotation (see", "bbox": {"l": 53.79800000000001, "t": 281.8035300000001, "r": 294.04605, "b": 290.17815999999993, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "Section 4). As a second condition, we focussed on medium to large", "bbox": {"l": 53.79800000000001, "t": 292.76254, "r": 294.04868, "b": 301.13718, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "documents (", "bbox": {"l": 53.79800000000001, "t": 303.72153, "r": 98.881348, "b": 312.09616, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": ">", "bbox": {"l": 99.070999, "t": 306.07971, "r": 104.77363, "b": 310.08768, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "10", "bbox": {"l": 107.46399999999998, "t": 303.72153, "r": 115.83373999999999, "b": 312.09616, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "pages) with technical content, dense in complex", "bbox": {"l": 118.08366, "t": 303.72153, "r": 294.26233, "b": 312.09616, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "tables, figures, plots and captions. Such documents carry a lot of", "bbox": {"l": 53.79800000000001, "t": 314.68054, "r": 294.04715, "b": 323.05518, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "information value, but are often hard to analyse with high accuracy", "bbox": {"l": 53.79800000000001, "t": 325.63855, "r": 294.27383, "b": 334.01318, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "due to their challenging layouts. Counterexamples of documents", "bbox": {"l": 53.79800000000001, "t": 336.59753, "r": 294.0416, "b": 344.97217, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "not included in the dataset are receipts, invoices, hand-written", "bbox": {"l": 53.79800000000001, "t": 347.5565500000001, "r": 294.04712, "b": 355.9311799999999, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "documents or photographs showing \u201ctext in the wild\".", "bbox": {"l": 53.79800000000001, "t": 358.51553, "r": 251.73131, "b": 366.89017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 53.57400100000001, "t": 369.47455, "r": 295.56046, "b": 509.35617, "coord_origin": "TOPLEFT"}, "confidence": 0.987700879573822, "cells": [{"id": 27, "text": "The pages in DocLayNet can be grouped into six distinct cate-", "bbox": {"l": 63.76100199999999, "t": 369.47455, "r": 295.55945, "b": 377.84918, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "gories, namely", "bbox": {"l": 53.79800000000001, "t": 380.43353, "r": 105.90533, "b": 388.80816999999996, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Financial Reports", "bbox": {"l": 107.754, "t": 380.47838999999993, "r": 167.4973, "b": 388.81714, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": ",", "bbox": {"l": 167.496, "t": 380.43353, "r": 169.42915, "b": 388.80816999999996, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Manuals", "bbox": {"l": 171.28101, "t": 380.47838999999993, "r": 201.45581, "b": 388.81714, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": ",", "bbox": {"l": 201.455, "t": 380.43353, "r": 203.38815, "b": 388.80816999999996, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "Scientific Articles", "bbox": {"l": 205.24001, "t": 380.47838999999993, "r": 264.55273, "b": 388.81714, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": ",", "bbox": {"l": 264.54901, "t": 380.43353, "r": 266.48218, "b": 388.80816999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "Laws &", "bbox": {"l": 268.33401, "t": 380.47838999999993, "r": 294.36133, "b": 388.81714, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Regulations", "bbox": {"l": 53.79800000000001, "t": 391.43741000000006, "r": 94.899666, "b": 399.77615, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": ",", "bbox": {"l": 94.900002, "t": 391.39255, "r": 96.862747, "b": 399.76718, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "Patents", "bbox": {"l": 99.109001, "t": 391.43741000000006, "r": 124.72282, "b": 399.77615, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "and", "bbox": {"l": 127.17899999999999, "t": 391.39255, "r": 140.60596, "b": 399.76718, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "Government Tenders", "bbox": {"l": 142.853, "t": 391.43741000000006, "r": 215.15340000000003, "b": 399.77615, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": ". Each document cate-", "bbox": {"l": 215.15601000000004, "t": 391.39255, "r": 295.55716, "b": 399.76718, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "gory was sourced from various repositories. For example, Financial", "bbox": {"l": 53.79800000000001, "t": 402.3515300000001, "r": 294.04535, "b": 410.72617, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Reports contain both", "bbox": {"l": 53.79800000000001, "t": 413.31055, "r": 132.19516, "b": 421.68518000000006, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "free-style", "bbox": {"l": 134.528, "t": 413.35541, "r": 167.77272, "b": 421.69415, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "format annual reports", "bbox": {"l": 170.314, "t": 413.31055, "r": 252.36031, "b": 421.68518000000006, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "2", "bbox": {"l": 252.356, "t": 411.24283, "r": 255.73781, "b": 418.03555, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "which ex-", "bbox": {"l": 258.56601, "t": 413.31055, "r": 295.56046, "b": 421.68518000000006, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "pose company-specific, artistic layouts as well as the more formal", "bbox": {"l": 53.79800000000001, "t": 424.26953, "r": 294.04376, "b": 432.6441699999999, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "SEC filings. The two largest categories (", "bbox": {"l": 53.79800000000001, "t": 435.22754000000003, "r": 197.59023, "b": 443.60217, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Financial Reports", "bbox": {"l": 197.591, "t": 435.27240000000006, "r": 258.02774, "b": 443.61115, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "and", "bbox": {"l": 260.48901, "t": 435.22754000000003, "r": 273.78104, "b": 443.60217, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Man-", "bbox": {"l": 276.03201, "t": 435.27240000000006, "r": 294.94113, "b": 443.61115, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "uals", "bbox": {"l": 53.79800000000001, "t": 446.23138, "r": 68.085777, "b": 454.57013, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": ") contain a large amount of free-style layouts in order to obtain", "bbox": {"l": 68.296997, "t": 446.18652, "r": 294.04565, "b": 454.56116, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "maximum variability. In the other four categories, we boosted the", "bbox": {"l": 53.79800000000001, "t": 457.14554, "r": 294.04163, "b": 465.52017, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "variability by mixing documents from independent providers, such", "bbox": {"l": 53.57400100000001, "t": 468.10455, "r": 294.04889, "b": 476.47919, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "as different government websites or publishers. In Figure 2, we", "bbox": {"l": 53.79800000000001, "t": 479.06354, "r": 294.04715, "b": 487.43817, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "show the document categories contained in DocLayNet with their", "bbox": {"l": 53.79800000000001, "t": 490.02255, "r": 294.21643, "b": 498.39719, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "respective sizes.", "bbox": {"l": 53.79800000000001, "t": 500.98154, "r": 112.2948, "b": 509.35617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 53.466999, "t": 511.94055, "r": 295.56155, "b": 607.98618, "coord_origin": "TOPLEFT"}, "confidence": 0.9877581000328064, "cells": [{"id": 60, "text": "We did not control the document selection with regard to lan-", "bbox": {"l": 63.76100199999999, "t": 511.94055, "r": 295.55954, "b": 520.31519, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "guage. The vast majority of documents contained in DocLayNet", "bbox": {"l": 53.79800000000001, "t": 522.89954, "r": 294.04718, "b": 531.27417, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "(close to 95%) are published in English language. However, Do-", "bbox": {"l": 53.528999, "t": 533.8585499999999, "r": 295.56155, "b": 542.23317, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "cLayNet also contains a number of documents in other languages", "bbox": {"l": 53.79800000000001, "t": 544.81755, "r": 294.04144, "b": 553.19217, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "such as German (2.5%), French (1.0%) and Japanese (1.0%). While", "bbox": {"l": 53.79800000000001, "t": 555.77556, "r": 294.04709, "b": 564.15018, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "the document language has negligible impact on the performance", "bbox": {"l": 53.79800000000001, "t": 566.73456, "r": 294.04163, "b": 575.10918, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "of computer vision methods such as object detection and segmenta-", "bbox": {"l": 53.79800000000001, "t": 577.6935599999999, "r": 295.5567, "b": 586.06818, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "tion models, it might prove challenging for layout analysis methods", "bbox": {"l": 53.79800000000001, "t": 588.65256, "r": 294.04541, "b": 597.02718, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "which exploit textual features.", "bbox": {"l": 53.466999, "t": 599.61156, "r": 164.39928, "b": 607.98618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 53.79800000000001, "t": 610.57056, "r": 295.56396, "b": 684.69817, "coord_origin": "TOPLEFT"}, "confidence": 0.9880735278129578, "cells": [{"id": 69, "text": "To ensure that future benchmarks in the document-layout analy-", "bbox": {"l": 63.76100199999999, "t": 610.57056, "r": 295.56396, "b": 618.9451799999999, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "sis community can be easily compared, we have split up DocLayNet", "bbox": {"l": 53.79800000000001, "t": 621.52956, "r": 294.04532, "b": 629.90417, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "into pre-defined train-, test- and validation-sets. In this way, we can", "bbox": {"l": 53.79800000000001, "t": 632.48856, "r": 294.04538, "b": 640.86317, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "avoid spurious variations in the evaluation scores due to random", "bbox": {"l": 53.79800000000001, "t": 643.4475600000001, "r": 294.04315, "b": 651.82217, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "splitting in train-, test- and validation-sets. We also ensured that", "bbox": {"l": 53.79800000000001, "t": 654.40656, "r": 294.04712, "b": 662.78117, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "less frequent labels are represented in train and test sets in equal", "bbox": {"l": 53.79800000000001, "t": 665.36456, "r": 294.04333, "b": 673.7391700000001, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "proportions.", "bbox": {"l": 53.79800000000001, "t": 676.32355, "r": 98.916931, "b": 684.69817, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "footnote", "bbox": {"l": 53.79800000000001, "t": 701.6563639999999, "r": 195.78998, "b": 708.169891, "coord_origin": "TOPLEFT"}, "confidence": 0.9048352241516113, "cells": [{"id": 76, "text": "$^{2}$e.g. AAPL from https://www.annualreports.com/", "bbox": {"l": 53.79800000000001, "t": 701.6563639999999, "r": 195.78998, "b": 708.169891, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 317.62299, "t": 87.36352999999997, "r": 559.19183, "b": 161.49114999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.986920952796936, "cells": [{"id": 77, "text": "Table 1 shows the overall frequency and distribution of the labels", "bbox": {"l": 327.918, "t": 87.36352999999997, "r": 558.20093, "b": 95.73816, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "among the different sets. Importantly, we ensure that subsets are", "bbox": {"l": 317.95499, "t": 98.32250999999997, "r": 558.20013, "b": 106.69713999999999, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "only split on full-document boundaries. This avoids that pages of", "bbox": {"l": 317.95499, "t": 109.28156000000001, "r": 558.20056, "b": 117.65618999999992, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "the same document are spread over train, test and validation set,", "bbox": {"l": 317.95499, "t": 120.24054000000001, "r": 559.19183, "b": 128.61517000000003, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "which can give an undesired evaluation advantage to models and", "bbox": {"l": 317.62299, "t": 131.19854999999995, "r": 558.20349, "b": 139.57317999999998, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "lead to overestimation of their prediction accuracy. We will show", "bbox": {"l": 317.95499, "t": 142.15752999999995, "r": 558.52936, "b": 150.53216999999995, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "the impact of this decision in Section 5.", "bbox": {"l": 317.95499, "t": 153.11652000000004, "r": 461.6416, "b": 161.49114999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "text", "bbox": {"l": 317.95499, "t": 164.07556, "r": 558.43811, "b": 271.0802, "coord_origin": "TOPLEFT"}, "confidence": 0.9860605001449585, "cells": [{"id": 84, "text": "In order to accommodate the different types of models currently", "bbox": {"l": 327.918, "t": 164.07556, "r": 558.43811, "b": 172.4502, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "in use by the community, we provide DocLayNet in an", "bbox": {"l": 317.95499, "t": 175.03454999999997, "r": 516.8219, "b": 183.40918, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "augmented", "bbox": {"l": 519.07501, "t": 175.07941000000005, "r": 558.20135, "b": 183.41814999999997, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "COCO format [16]. This entails the standard COCO ground-truth", "bbox": {"l": 317.95499, "t": 185.99352999999996, "r": 558.20325, "b": 194.36816, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "file (in JSON format) with the associated page images (in PNG", "bbox": {"l": 317.95499, "t": 196.95250999999996, "r": 558.20404, "b": 205.32714999999996, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "format, 1025", "bbox": {"l": 317.95499, "t": 207.91156, "r": 364.28769, "b": 216.28619000000003, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "\u00d7", "bbox": {"l": 364.28699, "t": 207.85779000000002, "r": 369.98962, "b": 215.55993999999998, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "1025 pixels). Furthermore, custom fields have been", "bbox": {"l": 369.98999, "t": 207.91156, "r": 558.20526, "b": 216.28619000000003, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "added to each COCO record to specify document category, original", "bbox": {"l": 317.95499, "t": 218.87054, "r": 558.20251, "b": 227.24518, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "document filename and page number. In addition, we also provide", "bbox": {"l": 317.95499, "t": 229.82952999999998, "r": 558.203, "b": 238.20416, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "the original PDF pages, as well as sidecar files containing parsed", "bbox": {"l": 317.95499, "t": 240.78754000000004, "r": 558.20404, "b": 249.16216999999995, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "PDF text and text-cell coordinates (in JSON). All additional files are", "bbox": {"l": 317.95499, "t": 251.74652000000003, "r": 558.20227, "b": 260.12114999999994, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "linked to the primary page images by their matching filenames.", "bbox": {"l": 317.95499, "t": 262.70556999999997, "r": 550.36414, "b": 271.0802, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "text", "bbox": {"l": 316.94199, "t": 273.66454999999996, "r": 559.72156, "b": 588.88918, "coord_origin": "TOPLEFT"}, "confidence": 0.9853296875953674, "cells": [{"id": 97, "text": "Despite being cost-intense and far less scalable than automation,", "bbox": {"l": 327.918, "t": 273.66454999999996, "r": 559.18488, "b": 282.03918, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "human annotation has several benefits over automated ground-", "bbox": {"l": 317.95499, "t": 284.62354, "r": 559.7132, "b": 292.99817, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "truth generation. The first and most obvious reason to leverage", "bbox": {"l": 317.95499, "t": 295.5825500000001, "r": 558.20416, "b": 303.95717999999994, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "human annotations is the freedom to annotate any type of doc-", "bbox": {"l": 317.95499, "t": 306.54153, "r": 559.71326, "b": 314.91617, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "ument without requiring a programmatic source. For most PDF", "bbox": {"l": 317.95499, "t": 317.50055, "r": 558.41443, "b": 325.87518, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "documents, the original source document is not available. The lat-", "bbox": {"l": 317.95499, "t": 328.4595299999999, "r": 559.71545, "b": 336.83417, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "ter is not a hard constraint with human annotation, but it is for", "bbox": {"l": 317.95499, "t": 339.41855000000004, "r": 558.36865, "b": 347.79318, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "automated methods. A second reason to use human annotations is", "bbox": {"l": 317.95499, "t": 350.37753, "r": 558.20062, "b": 358.75217, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "that the latter usually provide a more natural interpretation of the", "bbox": {"l": 317.95499, "t": 361.33554, "r": 558.20184, "b": 369.71017, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "page layout. The human-interpreted layout can significantly devi-", "bbox": {"l": 317.95499, "t": 372.29453, "r": 559.71442, "b": 380.66916, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "ate from the programmatic layout used in typesetting. For example,", "bbox": {"l": 317.95499, "t": 383.25354, "r": 559.1864, "b": 391.62817, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "\u201cinvisible\u201d tables might be used solely for aligning text paragraphs", "bbox": {"l": 316.94199, "t": 394.21252, "r": 558.20111, "b": 402.58716, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "on columns. Such typesetting tricks might be interpreted by au-", "bbox": {"l": 317.95499, "t": 405.17154, "r": 559.7132, "b": 413.54617, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "tomated methods incorrectly as an actual table, while the human", "bbox": {"l": 317.95499, "t": 416.13052, "r": 558.20013, "b": 424.50515999999993, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "annotation will interpret it correctly as", "bbox": {"l": 317.95499, "t": 427.08953999999994, "r": 464.50613, "b": 435.46417, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "Text", "bbox": {"l": 466.98199000000005, "t": 427.13439999999997, "r": 482.14560000000006, "b": 435.47313999999994, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "or other styles. The", "bbox": {"l": 485.13199000000003, "t": 427.08953999999994, "r": 558.19727, "b": 435.46417, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "same applies to multi-line text elements, when authors decided to", "bbox": {"l": 317.95499, "t": 438.04855, "r": 558.20221, "b": 446.4231899999999, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "space them as \u201cinvisible\u201d list elements without bullet symbols. A", "bbox": {"l": 317.95499, "t": 449.00754, "r": 558.51501, "b": 457.38217, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "third reason to gather ground-truth through human annotation is", "bbox": {"l": 317.95499, "t": 459.96655000000004, "r": 558.19855, "b": 468.34119, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "to estimate a \u201cnatural\u201d upper bound on the segmentation accuracy.", "bbox": {"l": 317.95499, "t": 470.92453, "r": 559.58215, "b": 479.29916, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "As we will show in Section 4, certain documents featuring complex", "bbox": {"l": 317.64099, "t": 481.88354, "r": 558.41559, "b": 490.25818, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "layouts can have different but equally acceptable layout interpre-", "bbox": {"l": 317.95499, "t": 492.84253, "r": 559.72156, "b": 501.21716, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "tations. This natural upper bound for segmentation accuracy can", "bbox": {"l": 317.95499, "t": 503.80154, "r": 558.19928, "b": 512.1761799999999, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "be found by annotating the same pages multiple times by different", "bbox": {"l": 317.95499, "t": 514.76053, "r": 558.20581, "b": 523.13516, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "people and evaluating the inter-annotator agreement. Such a base-", "bbox": {"l": 317.95499, "t": 525.71954, "r": 559.71729, "b": 534.09418, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "line consistency evaluation is very useful to define expectations", "bbox": {"l": 317.95499, "t": 536.6785600000001, "r": 558.20404, "b": 545.05318, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "for a good target accuracy in trained deep neural network models", "bbox": {"l": 317.95499, "t": 547.63756, "r": 558.20074, "b": 556.01218, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "and avoid overfitting (see Table 1). On the flip side, achieving high", "bbox": {"l": 317.95499, "t": 558.59656, "r": 558.20062, "b": 566.97118, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "annotation consistency proved to be a key challenge in human", "bbox": {"l": 317.95499, "t": 569.55556, "r": 558.20416, "b": 577.9301800000001, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "annotation, as we outline in Section 4.", "bbox": {"l": 317.95499, "t": 580.51456, "r": 457.62469, "b": 588.88918, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "section_header", "bbox": {"l": 317.95499, "t": 606.84991, "r": 470.21326, "b": 617.15901, "coord_origin": "TOPLEFT"}, "confidence": 0.9422592520713806, "cells": [{"id": 128, "text": "4", "bbox": {"l": 317.95499, "t": 606.84991, "r": 323.56226, "b": 617.15901, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "ANNOTATION CAMPAIGN", "bbox": {"l": 334.47134, "t": 606.84991, "r": 470.21326, "b": 617.15901, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "text", "bbox": {"l": 317.686, "t": 631.97356, "r": 559.71381, "b": 706.102173, "coord_origin": "TOPLEFT"}, "confidence": 0.9863831996917725, "cells": [{"id": 130, "text": "The annotation campaign was carried out in four phases. In phase", "bbox": {"l": 317.686, "t": 631.97356, "r": 558.20148, "b": 640.34818, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "one, we identified and prepared the data sources for annotation.", "bbox": {"l": 317.95499, "t": 642.93256, "r": 559.58521, "b": 651.30717, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "In phase two, we determined the class labels and how annotations", "bbox": {"l": 317.95499, "t": 653.89156, "r": 558.20007, "b": 662.26617, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "should be done on the documents in order to obtain maximum con-", "bbox": {"l": 317.95499, "t": 664.85056, "r": 559.71375, "b": 673.22517, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "sistency. The latter was guided by a detailed requirement analysis", "bbox": {"l": 317.95499, "t": 675.80956, "r": 558.20233, "b": 684.18417, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "and exhaustive experiments. In phase three, we trained the annota-", "bbox": {"l": 317.95499, "t": 686.76855, "r": 559.71381, "b": 695.143173, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "tion staff and performed exams for quality assurance. In phase four,", "bbox": {"l": 317.95499, "t": 697.7275539999999, "r": 559.1864, "b": 706.102173, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_header", "id": 13, "page_no": 2, "cluster": {"id": 13, "label": "page_header", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.8919971585273743, "cells": [{"id": 0, "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis"}, {"label": "page_header", "id": 11, "page_no": 2, "cluster": {"id": 11, "label": "page_header", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.9104517102241516, "cells": [{"id": 1, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA"}, {"label": "picture", "id": 8, "page_no": 2, "cluster": {"id": 8, "label": "picture", "bbox": {"l": 88.33030700683594, "t": 92.88652038574219, "r": 263.7049560546875, "b": 220.56826782226562, "coord_origin": "TOPLEFT"}, "confidence": 0.9698190689086914, "cells": [{"id": 2, "text": "Patents", "bbox": {"l": 237.11293, "t": 133.08716000000004, "r": 262.97623, "b": 141.61419999999998, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "8%", "bbox": {"l": 202.87892, "t": 140.46178999999995, "r": 213.89999, "b": 148.98883, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Scientific", "bbox": {"l": 207.13306, "t": 93.1576500000001, "r": 237.64882999999998, "b": 101.68469000000005, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "17%", "bbox": {"l": 184.40349, "t": 118.68206999999995, "r": 199.66519, "b": 127.20911000000001, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Financial", "bbox": {"l": 88.288223, "t": 114.35473999999988, "r": 118.80401, "b": 122.88176999999985, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "32%", "bbox": {"l": 136.24422, "t": 130.24408000000005, "r": 151.50592, "b": 138.77112, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Tenders", "bbox": {"l": 93.973373, "t": 187.65765, "r": 121.11515, "b": 196.18469000000005, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "6%", "bbox": {"l": 139.6235, "t": 170.22748, "r": 150.64458, "b": 178.75451999999996, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Laws", "bbox": {"l": 139.88339, "t": 212.50036999999998, "r": 157.68491, "b": 221.02739999999994, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "16%", "bbox": {"l": 157.43983, "t": 183.77808000000005, "r": 172.70154, "b": 192.30511, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Manuals", "bbox": {"l": 225.47252, "t": 189.29656999999997, "r": 254.29510000000002, "b": 197.82361000000003, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "21%", "bbox": {"l": 194.40683, "t": 171.12145999999996, "r": 209.66853, "b": 179.6485, "coord_origin": "TOPLEFT"}}], "children": [{"id": 14, "label": "text", "bbox": {"l": 237.11293, "t": 133.08716000000004, "r": 262.97623, "b": 141.61419999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 2, "text": "Patents", "bbox": {"l": 237.11293, "t": 133.08716000000004, "r": 262.97623, "b": 141.61419999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 202.87892, "t": 140.46178999999995, "r": 213.89999, "b": 148.98883, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 3, "text": "8%", "bbox": {"l": 202.87892, "t": 140.46178999999995, "r": 213.89999, "b": 148.98883, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 207.13306, "t": 93.1576500000001, "r": 237.64882999999998, "b": 101.68469000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 4, "text": "Scientific", "bbox": {"l": 207.13306, "t": 93.1576500000001, "r": 237.64882999999998, "b": 101.68469000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 184.40349, "t": 118.68206999999995, "r": 199.66519, "b": 127.20911000000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 5, "text": "17%", "bbox": {"l": 184.40349, "t": 118.68206999999995, "r": 199.66519, "b": 127.20911000000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 88.288223, "t": 114.35473999999988, "r": 118.80401, "b": 122.88176999999985, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": "Financial", "bbox": {"l": 88.288223, "t": 114.35473999999988, "r": 118.80401, "b": 122.88176999999985, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 136.24422, "t": 130.24408000000005, "r": 151.50592, "b": 138.77112, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "32%", "bbox": {"l": 136.24422, "t": 130.24408000000005, "r": 151.50592, "b": 138.77112, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 93.973373, "t": 187.65765, "r": 121.11515, "b": 196.18469000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "Tenders", "bbox": {"l": 93.973373, "t": 187.65765, "r": 121.11515, "b": 196.18469000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 139.6235, "t": 170.22748, "r": 150.64458, "b": 178.75451999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "6%", "bbox": {"l": 139.6235, "t": 170.22748, "r": 150.64458, "b": 178.75451999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 139.88339, "t": 212.50036999999998, "r": 157.68491, "b": 221.02739999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "Laws", "bbox": {"l": 139.88339, "t": 212.50036999999998, "r": 157.68491, "b": 221.02739999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 157.43983, "t": 183.77808000000005, "r": 172.70154, "b": 192.30511, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "16%", "bbox": {"l": 157.43983, "t": 183.77808000000005, "r": 172.70154, "b": 192.30511, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 225.47252, "t": 189.29656999999997, "r": 254.29510000000002, "b": 197.82361000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "Manuals", "bbox": {"l": 225.47252, "t": 189.29656999999997, "r": 254.29510000000002, "b": 197.82361000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 194.40683, "t": 171.12145999999996, "r": 209.66853, "b": 179.6485, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "21%", "bbox": {"l": 194.40683, "t": 171.12145999999996, "r": 209.66853, "b": 179.6485, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "caption", "id": 9, "page_no": 2, "cluster": {"id": 9, "label": "caption", "bbox": {"l": 53.79800000000001, "t": 236.11499000000003, "r": 294.04373, "b": 255.54724, "coord_origin": "TOPLEFT"}, "confidence": 0.9425410628318787, "cells": [{"id": 14, "text": "Figure 2: Distribution of DocLayNet pages across document", "bbox": {"l": 53.79800000000001, "t": 236.11499000000003, "r": 294.04373, "b": 244.58826, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "categories.", "bbox": {"l": 53.79800000000001, "t": 247.07397000000003, "r": 96.756027, "b": 255.54724, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 2: Distribution of DocLayNet pages across document categories."}, {"label": "text", "id": 4, "page_no": 2, "cluster": {"id": 4, "label": "text", "bbox": {"l": 53.79800000000001, "t": 281.8035300000001, "r": 294.27383, "b": 366.89017, "coord_origin": "TOPLEFT"}, "confidence": 0.9866552352905273, "cells": [{"id": 16, "text": "to a minimum, since they introduce difficulties in annotation (see", "bbox": {"l": 53.79800000000001, "t": 281.8035300000001, "r": 294.04605, "b": 290.17815999999993, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "Section 4). As a second condition, we focussed on medium to large", "bbox": {"l": 53.79800000000001, "t": 292.76254, "r": 294.04868, "b": 301.13718, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "documents (", "bbox": {"l": 53.79800000000001, "t": 303.72153, "r": 98.881348, "b": 312.09616, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": ">", "bbox": {"l": 99.070999, "t": 306.07971, "r": 104.77363, "b": 310.08768, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "10", "bbox": {"l": 107.46399999999998, "t": 303.72153, "r": 115.83373999999999, "b": 312.09616, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "pages) with technical content, dense in complex", "bbox": {"l": 118.08366, "t": 303.72153, "r": 294.26233, "b": 312.09616, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "tables, figures, plots and captions. Such documents carry a lot of", "bbox": {"l": 53.79800000000001, "t": 314.68054, "r": 294.04715, "b": 323.05518, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "information value, but are often hard to analyse with high accuracy", "bbox": {"l": 53.79800000000001, "t": 325.63855, "r": 294.27383, "b": 334.01318, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "due to their challenging layouts. Counterexamples of documents", "bbox": {"l": 53.79800000000001, "t": 336.59753, "r": 294.0416, "b": 344.97217, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "not included in the dataset are receipts, invoices, hand-written", "bbox": {"l": 53.79800000000001, "t": 347.5565500000001, "r": 294.04712, "b": 355.9311799999999, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "documents or photographs showing \u201ctext in the wild\".", "bbox": {"l": 53.79800000000001, "t": 358.51553, "r": 251.73131, "b": 366.89017, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "to a minimum, since they introduce difficulties in annotation (see Section 4). As a second condition, we focussed on medium to large documents ( > 10 pages) with technical content, dense in complex tables, figures, plots and captions. Such documents carry a lot of information value, but are often hard to analyse with high accuracy due to their challenging layouts. Counterexamples of documents not included in the dataset are receipts, invoices, hand-written documents or photographs showing \"text in the wild\"."}, {"label": "text", "id": 2, "page_no": 2, "cluster": {"id": 2, "label": "text", "bbox": {"l": 53.57400100000001, "t": 369.47455, "r": 295.56046, "b": 509.35617, "coord_origin": "TOPLEFT"}, "confidence": 0.987700879573822, "cells": [{"id": 27, "text": "The pages in DocLayNet can be grouped into six distinct cate-", "bbox": {"l": 63.76100199999999, "t": 369.47455, "r": 295.55945, "b": 377.84918, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "gories, namely", "bbox": {"l": 53.79800000000001, "t": 380.43353, "r": 105.90533, "b": 388.80816999999996, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Financial Reports", "bbox": {"l": 107.754, "t": 380.47838999999993, "r": 167.4973, "b": 388.81714, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": ",", "bbox": {"l": 167.496, "t": 380.43353, "r": 169.42915, "b": 388.80816999999996, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Manuals", "bbox": {"l": 171.28101, "t": 380.47838999999993, "r": 201.45581, "b": 388.81714, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": ",", "bbox": {"l": 201.455, "t": 380.43353, "r": 203.38815, "b": 388.80816999999996, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "Scientific Articles", "bbox": {"l": 205.24001, "t": 380.47838999999993, "r": 264.55273, "b": 388.81714, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": ",", "bbox": {"l": 264.54901, "t": 380.43353, "r": 266.48218, "b": 388.80816999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "Laws &", "bbox": {"l": 268.33401, "t": 380.47838999999993, "r": 294.36133, "b": 388.81714, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Regulations", "bbox": {"l": 53.79800000000001, "t": 391.43741000000006, "r": 94.899666, "b": 399.77615, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": ",", "bbox": {"l": 94.900002, "t": 391.39255, "r": 96.862747, "b": 399.76718, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "Patents", "bbox": {"l": 99.109001, "t": 391.43741000000006, "r": 124.72282, "b": 399.77615, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "and", "bbox": {"l": 127.17899999999999, "t": 391.39255, "r": 140.60596, "b": 399.76718, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "Government Tenders", "bbox": {"l": 142.853, "t": 391.43741000000006, "r": 215.15340000000003, "b": 399.77615, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": ". Each document cate-", "bbox": {"l": 215.15601000000004, "t": 391.39255, "r": 295.55716, "b": 399.76718, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "gory was sourced from various repositories. For example, Financial", "bbox": {"l": 53.79800000000001, "t": 402.3515300000001, "r": 294.04535, "b": 410.72617, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Reports contain both", "bbox": {"l": 53.79800000000001, "t": 413.31055, "r": 132.19516, "b": 421.68518000000006, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "free-style", "bbox": {"l": 134.528, "t": 413.35541, "r": 167.77272, "b": 421.69415, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "format annual reports", "bbox": {"l": 170.314, "t": 413.31055, "r": 252.36031, "b": 421.68518000000006, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "2", "bbox": {"l": 252.356, "t": 411.24283, "r": 255.73781, "b": 418.03555, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "which ex-", "bbox": {"l": 258.56601, "t": 413.31055, "r": 295.56046, "b": 421.68518000000006, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "pose company-specific, artistic layouts as well as the more formal", "bbox": {"l": 53.79800000000001, "t": 424.26953, "r": 294.04376, "b": 432.6441699999999, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "SEC filings. The two largest categories (", "bbox": {"l": 53.79800000000001, "t": 435.22754000000003, "r": 197.59023, "b": 443.60217, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Financial Reports", "bbox": {"l": 197.591, "t": 435.27240000000006, "r": 258.02774, "b": 443.61115, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "and", "bbox": {"l": 260.48901, "t": 435.22754000000003, "r": 273.78104, "b": 443.60217, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Man-", "bbox": {"l": 276.03201, "t": 435.27240000000006, "r": 294.94113, "b": 443.61115, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "uals", "bbox": {"l": 53.79800000000001, "t": 446.23138, "r": 68.085777, "b": 454.57013, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": ") contain a large amount of free-style layouts in order to obtain", "bbox": {"l": 68.296997, "t": 446.18652, "r": 294.04565, "b": 454.56116, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "maximum variability. In the other four categories, we boosted the", "bbox": {"l": 53.79800000000001, "t": 457.14554, "r": 294.04163, "b": 465.52017, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "variability by mixing documents from independent providers, such", "bbox": {"l": 53.57400100000001, "t": 468.10455, "r": 294.04889, "b": 476.47919, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "as different government websites or publishers. In Figure 2, we", "bbox": {"l": 53.79800000000001, "t": 479.06354, "r": 294.04715, "b": 487.43817, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "show the document categories contained in DocLayNet with their", "bbox": {"l": 53.79800000000001, "t": 490.02255, "r": 294.21643, "b": 498.39719, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "respective sizes.", "bbox": {"l": 53.79800000000001, "t": 500.98154, "r": 112.2948, "b": 509.35617, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The pages in DocLayNet can be grouped into six distinct categories, namely Financial Reports , Manuals , Scientific Articles , Laws & Regulations , Patents and Government Tenders . Each document category was sourced from various repositories. For example, Financial Reports contain both free-style format annual reports 2 which expose company-specific, artistic layouts as well as the more formal SEC filings. The two largest categories ( Financial Reports and Manuals ) contain a large amount of free-style layouts in order to obtain maximum variability. In the other four categories, we boosted the variability by mixing documents from independent providers, such as different government websites or publishers. In Figure 2, we show the document categories contained in DocLayNet with their respective sizes."}, {"label": "text", "id": 1, "page_no": 2, "cluster": {"id": 1, "label": "text", "bbox": {"l": 53.466999, "t": 511.94055, "r": 295.56155, "b": 607.98618, "coord_origin": "TOPLEFT"}, "confidence": 0.9877581000328064, "cells": [{"id": 60, "text": "We did not control the document selection with regard to lan-", "bbox": {"l": 63.76100199999999, "t": 511.94055, "r": 295.55954, "b": 520.31519, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "guage. The vast majority of documents contained in DocLayNet", "bbox": {"l": 53.79800000000001, "t": 522.89954, "r": 294.04718, "b": 531.27417, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "(close to 95%) are published in English language. However, Do-", "bbox": {"l": 53.528999, "t": 533.8585499999999, "r": 295.56155, "b": 542.23317, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "cLayNet also contains a number of documents in other languages", "bbox": {"l": 53.79800000000001, "t": 544.81755, "r": 294.04144, "b": 553.19217, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "such as German (2.5%), French (1.0%) and Japanese (1.0%). While", "bbox": {"l": 53.79800000000001, "t": 555.77556, "r": 294.04709, "b": 564.15018, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "the document language has negligible impact on the performance", "bbox": {"l": 53.79800000000001, "t": 566.73456, "r": 294.04163, "b": 575.10918, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "of computer vision methods such as object detection and segmenta-", "bbox": {"l": 53.79800000000001, "t": 577.6935599999999, "r": 295.5567, "b": 586.06818, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "tion models, it might prove challenging for layout analysis methods", "bbox": {"l": 53.79800000000001, "t": 588.65256, "r": 294.04541, "b": 597.02718, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "which exploit textual features.", "bbox": {"l": 53.466999, "t": 599.61156, "r": 164.39928, "b": 607.98618, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "We did not control the document selection with regard to language. The vast majority of documents contained in DocLayNet (close to 95%) are published in English language. However, DocLayNet also contains a number of documents in other languages such as German (2.5%), French (1.0%) and Japanese (1.0%). While the document language has negligible impact on the performance of computer vision methods such as object detection and segmentation models, it might prove challenging for layout analysis methods which exploit textual features."}, {"label": "text", "id": 0, "page_no": 2, "cluster": {"id": 0, "label": "text", "bbox": {"l": 53.79800000000001, "t": 610.57056, "r": 295.56396, "b": 684.69817, "coord_origin": "TOPLEFT"}, "confidence": 0.9880735278129578, "cells": [{"id": 69, "text": "To ensure that future benchmarks in the document-layout analy-", "bbox": {"l": 63.76100199999999, "t": 610.57056, "r": 295.56396, "b": 618.9451799999999, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "sis community can be easily compared, we have split up DocLayNet", "bbox": {"l": 53.79800000000001, "t": 621.52956, "r": 294.04532, "b": 629.90417, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "into pre-defined train-, test- and validation-sets. In this way, we can", "bbox": {"l": 53.79800000000001, "t": 632.48856, "r": 294.04538, "b": 640.86317, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "avoid spurious variations in the evaluation scores due to random", "bbox": {"l": 53.79800000000001, "t": 643.4475600000001, "r": 294.04315, "b": 651.82217, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "splitting in train-, test- and validation-sets. We also ensured that", "bbox": {"l": 53.79800000000001, "t": 654.40656, "r": 294.04712, "b": 662.78117, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "less frequent labels are represented in train and test sets in equal", "bbox": {"l": 53.79800000000001, "t": 665.36456, "r": 294.04333, "b": 673.7391700000001, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "proportions.", "bbox": {"l": 53.79800000000001, "t": 676.32355, "r": 98.916931, "b": 684.69817, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "To ensure that future benchmarks in the document-layout analysis community can be easily compared, we have split up DocLayNet into pre-defined train-, test- and validation-sets. In this way, we can avoid spurious variations in the evaluation scores due to random splitting in train-, test- and validation-sets. We also ensured that less frequent labels are represented in train and test sets in equal proportions."}, {"label": "footnote", "id": 12, "page_no": 2, "cluster": {"id": 12, "label": "footnote", "bbox": {"l": 53.79800000000001, "t": 701.6563639999999, "r": 195.78998, "b": 708.169891, "coord_origin": "TOPLEFT"}, "confidence": 0.9048352241516113, "cells": [{"id": 76, "text": "$^{2}$e.g. AAPL from https://www.annualreports.com/", "bbox": {"l": 53.79800000000001, "t": 701.6563639999999, "r": 195.78998, "b": 708.169891, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "$^{2}$e.g. AAPL from https://www.annualreports.com/"}, {"label": "text", "id": 3, "page_no": 2, "cluster": {"id": 3, "label": "text", "bbox": {"l": 317.62299, "t": 87.36352999999997, "r": 559.19183, "b": 161.49114999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.986920952796936, "cells": [{"id": 77, "text": "Table 1 shows the overall frequency and distribution of the labels", "bbox": {"l": 327.918, "t": 87.36352999999997, "r": 558.20093, "b": 95.73816, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "among the different sets. Importantly, we ensure that subsets are", "bbox": {"l": 317.95499, "t": 98.32250999999997, "r": 558.20013, "b": 106.69713999999999, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "only split on full-document boundaries. This avoids that pages of", "bbox": {"l": 317.95499, "t": 109.28156000000001, "r": 558.20056, "b": 117.65618999999992, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "the same document are spread over train, test and validation set,", "bbox": {"l": 317.95499, "t": 120.24054000000001, "r": 559.19183, "b": 128.61517000000003, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "which can give an undesired evaluation advantage to models and", "bbox": {"l": 317.62299, "t": 131.19854999999995, "r": 558.20349, "b": 139.57317999999998, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "lead to overestimation of their prediction accuracy. We will show", "bbox": {"l": 317.95499, "t": 142.15752999999995, "r": 558.52936, "b": 150.53216999999995, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "the impact of this decision in Section 5.", "bbox": {"l": 317.95499, "t": 153.11652000000004, "r": 461.6416, "b": 161.49114999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 1 shows the overall frequency and distribution of the labels among the different sets. Importantly, we ensure that subsets are only split on full-document boundaries. This avoids that pages of the same document are spread over train, test and validation set, which can give an undesired evaluation advantage to models and lead to overestimation of their prediction accuracy. We will show the impact of this decision in Section 5."}, {"label": "text", "id": 6, "page_no": 2, "cluster": {"id": 6, "label": "text", "bbox": {"l": 317.95499, "t": 164.07556, "r": 558.43811, "b": 271.0802, "coord_origin": "TOPLEFT"}, "confidence": 0.9860605001449585, "cells": [{"id": 84, "text": "In order to accommodate the different types of models currently", "bbox": {"l": 327.918, "t": 164.07556, "r": 558.43811, "b": 172.4502, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "in use by the community, we provide DocLayNet in an", "bbox": {"l": 317.95499, "t": 175.03454999999997, "r": 516.8219, "b": 183.40918, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "augmented", "bbox": {"l": 519.07501, "t": 175.07941000000005, "r": 558.20135, "b": 183.41814999999997, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "COCO format [16]. This entails the standard COCO ground-truth", "bbox": {"l": 317.95499, "t": 185.99352999999996, "r": 558.20325, "b": 194.36816, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "file (in JSON format) with the associated page images (in PNG", "bbox": {"l": 317.95499, "t": 196.95250999999996, "r": 558.20404, "b": 205.32714999999996, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "format, 1025", "bbox": {"l": 317.95499, "t": 207.91156, "r": 364.28769, "b": 216.28619000000003, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "\u00d7", "bbox": {"l": 364.28699, "t": 207.85779000000002, "r": 369.98962, "b": 215.55993999999998, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "1025 pixels). Furthermore, custom fields have been", "bbox": {"l": 369.98999, "t": 207.91156, "r": 558.20526, "b": 216.28619000000003, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "added to each COCO record to specify document category, original", "bbox": {"l": 317.95499, "t": 218.87054, "r": 558.20251, "b": 227.24518, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "document filename and page number. In addition, we also provide", "bbox": {"l": 317.95499, "t": 229.82952999999998, "r": 558.203, "b": 238.20416, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "the original PDF pages, as well as sidecar files containing parsed", "bbox": {"l": 317.95499, "t": 240.78754000000004, "r": 558.20404, "b": 249.16216999999995, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "PDF text and text-cell coordinates (in JSON). All additional files are", "bbox": {"l": 317.95499, "t": 251.74652000000003, "r": 558.20227, "b": 260.12114999999994, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "linked to the primary page images by their matching filenames.", "bbox": {"l": 317.95499, "t": 262.70556999999997, "r": 550.36414, "b": 271.0802, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In order to accommodate the different types of models currently in use by the community, we provide DocLayNet in an augmented COCO format [16]. This entails the standard COCO ground-truth file (in JSON format) with the associated page images (in PNG format, 1025 \u00d7 1025 pixels). Furthermore, custom fields have been added to each COCO record to specify document category, original document filename and page number. In addition, we also provide the original PDF pages, as well as sidecar files containing parsed PDF text and text-cell coordinates (in JSON). All additional files are linked to the primary page images by their matching filenames."}, {"label": "text", "id": 7, "page_no": 2, "cluster": {"id": 7, "label": "text", "bbox": {"l": 316.94199, "t": 273.66454999999996, "r": 559.72156, "b": 588.88918, "coord_origin": "TOPLEFT"}, "confidence": 0.9853296875953674, "cells": [{"id": 97, "text": "Despite being cost-intense and far less scalable than automation,", "bbox": {"l": 327.918, "t": 273.66454999999996, "r": 559.18488, "b": 282.03918, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "human annotation has several benefits over automated ground-", "bbox": {"l": 317.95499, "t": 284.62354, "r": 559.7132, "b": 292.99817, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "truth generation. The first and most obvious reason to leverage", "bbox": {"l": 317.95499, "t": 295.5825500000001, "r": 558.20416, "b": 303.95717999999994, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "human annotations is the freedom to annotate any type of doc-", "bbox": {"l": 317.95499, "t": 306.54153, "r": 559.71326, "b": 314.91617, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "ument without requiring a programmatic source. For most PDF", "bbox": {"l": 317.95499, "t": 317.50055, "r": 558.41443, "b": 325.87518, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "documents, the original source document is not available. The lat-", "bbox": {"l": 317.95499, "t": 328.4595299999999, "r": 559.71545, "b": 336.83417, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "ter is not a hard constraint with human annotation, but it is for", "bbox": {"l": 317.95499, "t": 339.41855000000004, "r": 558.36865, "b": 347.79318, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "automated methods. A second reason to use human annotations is", "bbox": {"l": 317.95499, "t": 350.37753, "r": 558.20062, "b": 358.75217, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "that the latter usually provide a more natural interpretation of the", "bbox": {"l": 317.95499, "t": 361.33554, "r": 558.20184, "b": 369.71017, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "page layout. The human-interpreted layout can significantly devi-", "bbox": {"l": 317.95499, "t": 372.29453, "r": 559.71442, "b": 380.66916, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "ate from the programmatic layout used in typesetting. For example,", "bbox": {"l": 317.95499, "t": 383.25354, "r": 559.1864, "b": 391.62817, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "\u201cinvisible\u201d tables might be used solely for aligning text paragraphs", "bbox": {"l": 316.94199, "t": 394.21252, "r": 558.20111, "b": 402.58716, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "on columns. Such typesetting tricks might be interpreted by au-", "bbox": {"l": 317.95499, "t": 405.17154, "r": 559.7132, "b": 413.54617, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "tomated methods incorrectly as an actual table, while the human", "bbox": {"l": 317.95499, "t": 416.13052, "r": 558.20013, "b": 424.50515999999993, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "annotation will interpret it correctly as", "bbox": {"l": 317.95499, "t": 427.08953999999994, "r": 464.50613, "b": 435.46417, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "Text", "bbox": {"l": 466.98199000000005, "t": 427.13439999999997, "r": 482.14560000000006, "b": 435.47313999999994, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "or other styles. The", "bbox": {"l": 485.13199000000003, "t": 427.08953999999994, "r": 558.19727, "b": 435.46417, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "same applies to multi-line text elements, when authors decided to", "bbox": {"l": 317.95499, "t": 438.04855, "r": 558.20221, "b": 446.4231899999999, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "space them as \u201cinvisible\u201d list elements without bullet symbols. A", "bbox": {"l": 317.95499, "t": 449.00754, "r": 558.51501, "b": 457.38217, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "third reason to gather ground-truth through human annotation is", "bbox": {"l": 317.95499, "t": 459.96655000000004, "r": 558.19855, "b": 468.34119, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "to estimate a \u201cnatural\u201d upper bound on the segmentation accuracy.", "bbox": {"l": 317.95499, "t": 470.92453, "r": 559.58215, "b": 479.29916, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "As we will show in Section 4, certain documents featuring complex", "bbox": {"l": 317.64099, "t": 481.88354, "r": 558.41559, "b": 490.25818, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "layouts can have different but equally acceptable layout interpre-", "bbox": {"l": 317.95499, "t": 492.84253, "r": 559.72156, "b": 501.21716, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "tations. This natural upper bound for segmentation accuracy can", "bbox": {"l": 317.95499, "t": 503.80154, "r": 558.19928, "b": 512.1761799999999, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "be found by annotating the same pages multiple times by different", "bbox": {"l": 317.95499, "t": 514.76053, "r": 558.20581, "b": 523.13516, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "people and evaluating the inter-annotator agreement. Such a base-", "bbox": {"l": 317.95499, "t": 525.71954, "r": 559.71729, "b": 534.09418, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "line consistency evaluation is very useful to define expectations", "bbox": {"l": 317.95499, "t": 536.6785600000001, "r": 558.20404, "b": 545.05318, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "for a good target accuracy in trained deep neural network models", "bbox": {"l": 317.95499, "t": 547.63756, "r": 558.20074, "b": 556.01218, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "and avoid overfitting (see Table 1). On the flip side, achieving high", "bbox": {"l": 317.95499, "t": 558.59656, "r": 558.20062, "b": 566.97118, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "annotation consistency proved to be a key challenge in human", "bbox": {"l": 317.95499, "t": 569.55556, "r": 558.20416, "b": 577.9301800000001, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "annotation, as we outline in Section 4.", "bbox": {"l": 317.95499, "t": 580.51456, "r": 457.62469, "b": 588.88918, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Despite being cost-intense and far less scalable than automation, human annotation has several benefits over automated groundtruth generation. The first and most obvious reason to leverage human annotations is the freedom to annotate any type of document without requiring a programmatic source. For most PDF documents, the original source document is not available. The latter is not a hard constraint with human annotation, but it is for automated methods. A second reason to use human annotations is that the latter usually provide a more natural interpretation of the page layout. The human-interpreted layout can significantly deviate from the programmatic layout used in typesetting. For example, \"invisible\" tables might be used solely for aligning text paragraphs on columns. Such typesetting tricks might be interpreted by automated methods incorrectly as an actual table, while the human annotation will interpret it correctly as Text or other styles. The same applies to multi-line text elements, when authors decided to space them as \"invisible\" list elements without bullet symbols. A third reason to gather ground-truth through human annotation is to estimate a \"natural\" upper bound on the segmentation accuracy. As we will show in Section 4, certain documents featuring complex layouts can have different but equally acceptable layout interpretations. This natural upper bound for segmentation accuracy can be found by annotating the same pages multiple times by different people and evaluating the inter-annotator agreement. Such a baseline consistency evaluation is very useful to define expectations for a good target accuracy in trained deep neural network models and avoid overfitting (see Table 1). On the flip side, achieving high annotation consistency proved to be a key challenge in human annotation, as we outline in Section 4."}, {"label": "section_header", "id": 10, "page_no": 2, "cluster": {"id": 10, "label": "section_header", "bbox": {"l": 317.95499, "t": 606.84991, "r": 470.21326, "b": 617.15901, "coord_origin": "TOPLEFT"}, "confidence": 0.9422592520713806, "cells": [{"id": 128, "text": "4", "bbox": {"l": 317.95499, "t": 606.84991, "r": 323.56226, "b": 617.15901, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "ANNOTATION CAMPAIGN", "bbox": {"l": 334.47134, "t": 606.84991, "r": 470.21326, "b": 617.15901, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4 ANNOTATION CAMPAIGN"}, {"label": "text", "id": 5, "page_no": 2, "cluster": {"id": 5, "label": "text", "bbox": {"l": 317.686, "t": 631.97356, "r": 559.71381, "b": 706.102173, "coord_origin": "TOPLEFT"}, "confidence": 0.9863831996917725, "cells": [{"id": 130, "text": "The annotation campaign was carried out in four phases. In phase", "bbox": {"l": 317.686, "t": 631.97356, "r": 558.20148, "b": 640.34818, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "one, we identified and prepared the data sources for annotation.", "bbox": {"l": 317.95499, "t": 642.93256, "r": 559.58521, "b": 651.30717, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "In phase two, we determined the class labels and how annotations", "bbox": {"l": 317.95499, "t": 653.89156, "r": 558.20007, "b": 662.26617, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "should be done on the documents in order to obtain maximum con-", "bbox": {"l": 317.95499, "t": 664.85056, "r": 559.71375, "b": 673.22517, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "sistency. The latter was guided by a detailed requirement analysis", "bbox": {"l": 317.95499, "t": 675.80956, "r": 558.20233, "b": 684.18417, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "and exhaustive experiments. In phase three, we trained the annota-", "bbox": {"l": 317.95499, "t": 686.76855, "r": 559.71381, "b": 695.143173, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "tion staff and performed exams for quality assurance. In phase four,", "bbox": {"l": 317.95499, "t": 697.7275539999999, "r": 559.1864, "b": 706.102173, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The annotation campaign was carried out in four phases. In phase one, we identified and prepared the data sources for annotation. In phase two, we determined the class labels and how annotations should be done on the documents in order to obtain maximum consistency. The latter was guided by a detailed requirement analysis and exhaustive experiments. In phase three, we trained the annotation staff and performed exams for quality assurance. In phase four,"}], "body": [{"label": "picture", "id": 8, "page_no": 2, "cluster": {"id": 8, "label": "picture", "bbox": {"l": 88.33030700683594, "t": 92.88652038574219, "r": 263.7049560546875, "b": 220.56826782226562, "coord_origin": "TOPLEFT"}, "confidence": 0.9698190689086914, "cells": [{"id": 2, "text": "Patents", "bbox": {"l": 237.11293, "t": 133.08716000000004, "r": 262.97623, "b": 141.61419999999998, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "8%", "bbox": {"l": 202.87892, "t": 140.46178999999995, "r": 213.89999, "b": 148.98883, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Scientific", "bbox": {"l": 207.13306, "t": 93.1576500000001, "r": 237.64882999999998, "b": 101.68469000000005, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "17%", "bbox": {"l": 184.40349, "t": 118.68206999999995, "r": 199.66519, "b": 127.20911000000001, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Financial", "bbox": {"l": 88.288223, "t": 114.35473999999988, "r": 118.80401, "b": 122.88176999999985, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "32%", "bbox": {"l": 136.24422, "t": 130.24408000000005, "r": 151.50592, "b": 138.77112, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Tenders", "bbox": {"l": 93.973373, "t": 187.65765, "r": 121.11515, "b": 196.18469000000005, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "6%", "bbox": {"l": 139.6235, "t": 170.22748, "r": 150.64458, "b": 178.75451999999996, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Laws", "bbox": {"l": 139.88339, "t": 212.50036999999998, "r": 157.68491, "b": 221.02739999999994, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "16%", "bbox": {"l": 157.43983, "t": 183.77808000000005, "r": 172.70154, "b": 192.30511, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Manuals", "bbox": {"l": 225.47252, "t": 189.29656999999997, "r": 254.29510000000002, "b": 197.82361000000003, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "21%", "bbox": {"l": 194.40683, "t": 171.12145999999996, "r": 209.66853, "b": 179.6485, "coord_origin": "TOPLEFT"}}], "children": [{"id": 14, "label": "text", "bbox": {"l": 237.11293, "t": 133.08716000000004, "r": 262.97623, "b": 141.61419999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 2, "text": "Patents", "bbox": {"l": 237.11293, "t": 133.08716000000004, "r": 262.97623, "b": 141.61419999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 202.87892, "t": 140.46178999999995, "r": 213.89999, "b": 148.98883, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 3, "text": "8%", "bbox": {"l": 202.87892, "t": 140.46178999999995, "r": 213.89999, "b": 148.98883, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 207.13306, "t": 93.1576500000001, "r": 237.64882999999998, "b": 101.68469000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 4, "text": "Scientific", "bbox": {"l": 207.13306, "t": 93.1576500000001, "r": 237.64882999999998, "b": 101.68469000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 184.40349, "t": 118.68206999999995, "r": 199.66519, "b": 127.20911000000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 5, "text": "17%", "bbox": {"l": 184.40349, "t": 118.68206999999995, "r": 199.66519, "b": 127.20911000000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 88.288223, "t": 114.35473999999988, "r": 118.80401, "b": 122.88176999999985, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": "Financial", "bbox": {"l": 88.288223, "t": 114.35473999999988, "r": 118.80401, "b": 122.88176999999985, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 136.24422, "t": 130.24408000000005, "r": 151.50592, "b": 138.77112, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "32%", "bbox": {"l": 136.24422, "t": 130.24408000000005, "r": 151.50592, "b": 138.77112, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 93.973373, "t": 187.65765, "r": 121.11515, "b": 196.18469000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "Tenders", "bbox": {"l": 93.973373, "t": 187.65765, "r": 121.11515, "b": 196.18469000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 139.6235, "t": 170.22748, "r": 150.64458, "b": 178.75451999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "6%", "bbox": {"l": 139.6235, "t": 170.22748, "r": 150.64458, "b": 178.75451999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 139.88339, "t": 212.50036999999998, "r": 157.68491, "b": 221.02739999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "Laws", "bbox": {"l": 139.88339, "t": 212.50036999999998, "r": 157.68491, "b": 221.02739999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 157.43983, "t": 183.77808000000005, "r": 172.70154, "b": 192.30511, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "16%", "bbox": {"l": 157.43983, "t": 183.77808000000005, "r": 172.70154, "b": 192.30511, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 225.47252, "t": 189.29656999999997, "r": 254.29510000000002, "b": 197.82361000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "Manuals", "bbox": {"l": 225.47252, "t": 189.29656999999997, "r": 254.29510000000002, "b": 197.82361000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 194.40683, "t": 171.12145999999996, "r": 209.66853, "b": 179.6485, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "21%", "bbox": {"l": 194.40683, "t": 171.12145999999996, "r": 209.66853, "b": 179.6485, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "caption", "id": 9, "page_no": 2, "cluster": {"id": 9, "label": "caption", "bbox": {"l": 53.79800000000001, "t": 236.11499000000003, "r": 294.04373, "b": 255.54724, "coord_origin": "TOPLEFT"}, "confidence": 0.9425410628318787, "cells": [{"id": 14, "text": "Figure 2: Distribution of DocLayNet pages across document", "bbox": {"l": 53.79800000000001, "t": 236.11499000000003, "r": 294.04373, "b": 244.58826, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "categories.", "bbox": {"l": 53.79800000000001, "t": 247.07397000000003, "r": 96.756027, "b": 255.54724, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 2: Distribution of DocLayNet pages across document categories."}, {"label": "text", "id": 4, "page_no": 2, "cluster": {"id": 4, "label": "text", "bbox": {"l": 53.79800000000001, "t": 281.8035300000001, "r": 294.27383, "b": 366.89017, "coord_origin": "TOPLEFT"}, "confidence": 0.9866552352905273, "cells": [{"id": 16, "text": "to a minimum, since they introduce difficulties in annotation (see", "bbox": {"l": 53.79800000000001, "t": 281.8035300000001, "r": 294.04605, "b": 290.17815999999993, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "Section 4). As a second condition, we focussed on medium to large", "bbox": {"l": 53.79800000000001, "t": 292.76254, "r": 294.04868, "b": 301.13718, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "documents (", "bbox": {"l": 53.79800000000001, "t": 303.72153, "r": 98.881348, "b": 312.09616, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": ">", "bbox": {"l": 99.070999, "t": 306.07971, "r": 104.77363, "b": 310.08768, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "10", "bbox": {"l": 107.46399999999998, "t": 303.72153, "r": 115.83373999999999, "b": 312.09616, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "pages) with technical content, dense in complex", "bbox": {"l": 118.08366, "t": 303.72153, "r": 294.26233, "b": 312.09616, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "tables, figures, plots and captions. Such documents carry a lot of", "bbox": {"l": 53.79800000000001, "t": 314.68054, "r": 294.04715, "b": 323.05518, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "information value, but are often hard to analyse with high accuracy", "bbox": {"l": 53.79800000000001, "t": 325.63855, "r": 294.27383, "b": 334.01318, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "due to their challenging layouts. Counterexamples of documents", "bbox": {"l": 53.79800000000001, "t": 336.59753, "r": 294.0416, "b": 344.97217, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "not included in the dataset are receipts, invoices, hand-written", "bbox": {"l": 53.79800000000001, "t": 347.5565500000001, "r": 294.04712, "b": 355.9311799999999, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "documents or photographs showing \u201ctext in the wild\".", "bbox": {"l": 53.79800000000001, "t": 358.51553, "r": 251.73131, "b": 366.89017, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "to a minimum, since they introduce difficulties in annotation (see Section 4). As a second condition, we focussed on medium to large documents ( > 10 pages) with technical content, dense in complex tables, figures, plots and captions. Such documents carry a lot of information value, but are often hard to analyse with high accuracy due to their challenging layouts. Counterexamples of documents not included in the dataset are receipts, invoices, hand-written documents or photographs showing \"text in the wild\"."}, {"label": "text", "id": 2, "page_no": 2, "cluster": {"id": 2, "label": "text", "bbox": {"l": 53.57400100000001, "t": 369.47455, "r": 295.56046, "b": 509.35617, "coord_origin": "TOPLEFT"}, "confidence": 0.987700879573822, "cells": [{"id": 27, "text": "The pages in DocLayNet can be grouped into six distinct cate-", "bbox": {"l": 63.76100199999999, "t": 369.47455, "r": 295.55945, "b": 377.84918, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "gories, namely", "bbox": {"l": 53.79800000000001, "t": 380.43353, "r": 105.90533, "b": 388.80816999999996, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Financial Reports", "bbox": {"l": 107.754, "t": 380.47838999999993, "r": 167.4973, "b": 388.81714, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": ",", "bbox": {"l": 167.496, "t": 380.43353, "r": 169.42915, "b": 388.80816999999996, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Manuals", "bbox": {"l": 171.28101, "t": 380.47838999999993, "r": 201.45581, "b": 388.81714, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": ",", "bbox": {"l": 201.455, "t": 380.43353, "r": 203.38815, "b": 388.80816999999996, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "Scientific Articles", "bbox": {"l": 205.24001, "t": 380.47838999999993, "r": 264.55273, "b": 388.81714, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": ",", "bbox": {"l": 264.54901, "t": 380.43353, "r": 266.48218, "b": 388.80816999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "Laws &", "bbox": {"l": 268.33401, "t": 380.47838999999993, "r": 294.36133, "b": 388.81714, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Regulations", "bbox": {"l": 53.79800000000001, "t": 391.43741000000006, "r": 94.899666, "b": 399.77615, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": ",", "bbox": {"l": 94.900002, "t": 391.39255, "r": 96.862747, "b": 399.76718, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "Patents", "bbox": {"l": 99.109001, "t": 391.43741000000006, "r": 124.72282, "b": 399.77615, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "and", "bbox": {"l": 127.17899999999999, "t": 391.39255, "r": 140.60596, "b": 399.76718, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "Government Tenders", "bbox": {"l": 142.853, "t": 391.43741000000006, "r": 215.15340000000003, "b": 399.77615, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": ". Each document cate-", "bbox": {"l": 215.15601000000004, "t": 391.39255, "r": 295.55716, "b": 399.76718, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "gory was sourced from various repositories. For example, Financial", "bbox": {"l": 53.79800000000001, "t": 402.3515300000001, "r": 294.04535, "b": 410.72617, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Reports contain both", "bbox": {"l": 53.79800000000001, "t": 413.31055, "r": 132.19516, "b": 421.68518000000006, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "free-style", "bbox": {"l": 134.528, "t": 413.35541, "r": 167.77272, "b": 421.69415, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "format annual reports", "bbox": {"l": 170.314, "t": 413.31055, "r": 252.36031, "b": 421.68518000000006, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "2", "bbox": {"l": 252.356, "t": 411.24283, "r": 255.73781, "b": 418.03555, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "which ex-", "bbox": {"l": 258.56601, "t": 413.31055, "r": 295.56046, "b": 421.68518000000006, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "pose company-specific, artistic layouts as well as the more formal", "bbox": {"l": 53.79800000000001, "t": 424.26953, "r": 294.04376, "b": 432.6441699999999, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "SEC filings. The two largest categories (", "bbox": {"l": 53.79800000000001, "t": 435.22754000000003, "r": 197.59023, "b": 443.60217, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Financial Reports", "bbox": {"l": 197.591, "t": 435.27240000000006, "r": 258.02774, "b": 443.61115, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "and", "bbox": {"l": 260.48901, "t": 435.22754000000003, "r": 273.78104, "b": 443.60217, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Man-", "bbox": {"l": 276.03201, "t": 435.27240000000006, "r": 294.94113, "b": 443.61115, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "uals", "bbox": {"l": 53.79800000000001, "t": 446.23138, "r": 68.085777, "b": 454.57013, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": ") contain a large amount of free-style layouts in order to obtain", "bbox": {"l": 68.296997, "t": 446.18652, "r": 294.04565, "b": 454.56116, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "maximum variability. In the other four categories, we boosted the", "bbox": {"l": 53.79800000000001, "t": 457.14554, "r": 294.04163, "b": 465.52017, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "variability by mixing documents from independent providers, such", "bbox": {"l": 53.57400100000001, "t": 468.10455, "r": 294.04889, "b": 476.47919, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "as different government websites or publishers. In Figure 2, we", "bbox": {"l": 53.79800000000001, "t": 479.06354, "r": 294.04715, "b": 487.43817, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "show the document categories contained in DocLayNet with their", "bbox": {"l": 53.79800000000001, "t": 490.02255, "r": 294.21643, "b": 498.39719, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "respective sizes.", "bbox": {"l": 53.79800000000001, "t": 500.98154, "r": 112.2948, "b": 509.35617, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The pages in DocLayNet can be grouped into six distinct categories, namely Financial Reports , Manuals , Scientific Articles , Laws & Regulations , Patents and Government Tenders . Each document category was sourced from various repositories. For example, Financial Reports contain both free-style format annual reports 2 which expose company-specific, artistic layouts as well as the more formal SEC filings. The two largest categories ( Financial Reports and Manuals ) contain a large amount of free-style layouts in order to obtain maximum variability. In the other four categories, we boosted the variability by mixing documents from independent providers, such as different government websites or publishers. In Figure 2, we show the document categories contained in DocLayNet with their respective sizes."}, {"label": "text", "id": 1, "page_no": 2, "cluster": {"id": 1, "label": "text", "bbox": {"l": 53.466999, "t": 511.94055, "r": 295.56155, "b": 607.98618, "coord_origin": "TOPLEFT"}, "confidence": 0.9877581000328064, "cells": [{"id": 60, "text": "We did not control the document selection with regard to lan-", "bbox": {"l": 63.76100199999999, "t": 511.94055, "r": 295.55954, "b": 520.31519, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "guage. The vast majority of documents contained in DocLayNet", "bbox": {"l": 53.79800000000001, "t": 522.89954, "r": 294.04718, "b": 531.27417, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "(close to 95%) are published in English language. However, Do-", "bbox": {"l": 53.528999, "t": 533.8585499999999, "r": 295.56155, "b": 542.23317, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "cLayNet also contains a number of documents in other languages", "bbox": {"l": 53.79800000000001, "t": 544.81755, "r": 294.04144, "b": 553.19217, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "such as German (2.5%), French (1.0%) and Japanese (1.0%). While", "bbox": {"l": 53.79800000000001, "t": 555.77556, "r": 294.04709, "b": 564.15018, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "the document language has negligible impact on the performance", "bbox": {"l": 53.79800000000001, "t": 566.73456, "r": 294.04163, "b": 575.10918, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "of computer vision methods such as object detection and segmenta-", "bbox": {"l": 53.79800000000001, "t": 577.6935599999999, "r": 295.5567, "b": 586.06818, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "tion models, it might prove challenging for layout analysis methods", "bbox": {"l": 53.79800000000001, "t": 588.65256, "r": 294.04541, "b": 597.02718, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "which exploit textual features.", "bbox": {"l": 53.466999, "t": 599.61156, "r": 164.39928, "b": 607.98618, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "We did not control the document selection with regard to language. The vast majority of documents contained in DocLayNet (close to 95%) are published in English language. However, DocLayNet also contains a number of documents in other languages such as German (2.5%), French (1.0%) and Japanese (1.0%). While the document language has negligible impact on the performance of computer vision methods such as object detection and segmentation models, it might prove challenging for layout analysis methods which exploit textual features."}, {"label": "text", "id": 0, "page_no": 2, "cluster": {"id": 0, "label": "text", "bbox": {"l": 53.79800000000001, "t": 610.57056, "r": 295.56396, "b": 684.69817, "coord_origin": "TOPLEFT"}, "confidence": 0.9880735278129578, "cells": [{"id": 69, "text": "To ensure that future benchmarks in the document-layout analy-", "bbox": {"l": 63.76100199999999, "t": 610.57056, "r": 295.56396, "b": 618.9451799999999, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "sis community can be easily compared, we have split up DocLayNet", "bbox": {"l": 53.79800000000001, "t": 621.52956, "r": 294.04532, "b": 629.90417, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "into pre-defined train-, test- and validation-sets. In this way, we can", "bbox": {"l": 53.79800000000001, "t": 632.48856, "r": 294.04538, "b": 640.86317, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "avoid spurious variations in the evaluation scores due to random", "bbox": {"l": 53.79800000000001, "t": 643.4475600000001, "r": 294.04315, "b": 651.82217, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "splitting in train-, test- and validation-sets. We also ensured that", "bbox": {"l": 53.79800000000001, "t": 654.40656, "r": 294.04712, "b": 662.78117, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "less frequent labels are represented in train and test sets in equal", "bbox": {"l": 53.79800000000001, "t": 665.36456, "r": 294.04333, "b": 673.7391700000001, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "proportions.", "bbox": {"l": 53.79800000000001, "t": 676.32355, "r": 98.916931, "b": 684.69817, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "To ensure that future benchmarks in the document-layout analysis community can be easily compared, we have split up DocLayNet into pre-defined train-, test- and validation-sets. In this way, we can avoid spurious variations in the evaluation scores due to random splitting in train-, test- and validation-sets. We also ensured that less frequent labels are represented in train and test sets in equal proportions."}, {"label": "footnote", "id": 12, "page_no": 2, "cluster": {"id": 12, "label": "footnote", "bbox": {"l": 53.79800000000001, "t": 701.6563639999999, "r": 195.78998, "b": 708.169891, "coord_origin": "TOPLEFT"}, "confidence": 0.9048352241516113, "cells": [{"id": 76, "text": "$^{2}$e.g. AAPL from https://www.annualreports.com/", "bbox": {"l": 53.79800000000001, "t": 701.6563639999999, "r": 195.78998, "b": 708.169891, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "$^{2}$e.g. AAPL from https://www.annualreports.com/"}, {"label": "text", "id": 3, "page_no": 2, "cluster": {"id": 3, "label": "text", "bbox": {"l": 317.62299, "t": 87.36352999999997, "r": 559.19183, "b": 161.49114999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.986920952796936, "cells": [{"id": 77, "text": "Table 1 shows the overall frequency and distribution of the labels", "bbox": {"l": 327.918, "t": 87.36352999999997, "r": 558.20093, "b": 95.73816, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "among the different sets. Importantly, we ensure that subsets are", "bbox": {"l": 317.95499, "t": 98.32250999999997, "r": 558.20013, "b": 106.69713999999999, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "only split on full-document boundaries. This avoids that pages of", "bbox": {"l": 317.95499, "t": 109.28156000000001, "r": 558.20056, "b": 117.65618999999992, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "the same document are spread over train, test and validation set,", "bbox": {"l": 317.95499, "t": 120.24054000000001, "r": 559.19183, "b": 128.61517000000003, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "which can give an undesired evaluation advantage to models and", "bbox": {"l": 317.62299, "t": 131.19854999999995, "r": 558.20349, "b": 139.57317999999998, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "lead to overestimation of their prediction accuracy. We will show", "bbox": {"l": 317.95499, "t": 142.15752999999995, "r": 558.52936, "b": 150.53216999999995, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "the impact of this decision in Section 5.", "bbox": {"l": 317.95499, "t": 153.11652000000004, "r": 461.6416, "b": 161.49114999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 1 shows the overall frequency and distribution of the labels among the different sets. Importantly, we ensure that subsets are only split on full-document boundaries. This avoids that pages of the same document are spread over train, test and validation set, which can give an undesired evaluation advantage to models and lead to overestimation of their prediction accuracy. We will show the impact of this decision in Section 5."}, {"label": "text", "id": 6, "page_no": 2, "cluster": {"id": 6, "label": "text", "bbox": {"l": 317.95499, "t": 164.07556, "r": 558.43811, "b": 271.0802, "coord_origin": "TOPLEFT"}, "confidence": 0.9860605001449585, "cells": [{"id": 84, "text": "In order to accommodate the different types of models currently", "bbox": {"l": 327.918, "t": 164.07556, "r": 558.43811, "b": 172.4502, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "in use by the community, we provide DocLayNet in an", "bbox": {"l": 317.95499, "t": 175.03454999999997, "r": 516.8219, "b": 183.40918, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "augmented", "bbox": {"l": 519.07501, "t": 175.07941000000005, "r": 558.20135, "b": 183.41814999999997, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "COCO format [16]. This entails the standard COCO ground-truth", "bbox": {"l": 317.95499, "t": 185.99352999999996, "r": 558.20325, "b": 194.36816, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "file (in JSON format) with the associated page images (in PNG", "bbox": {"l": 317.95499, "t": 196.95250999999996, "r": 558.20404, "b": 205.32714999999996, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "format, 1025", "bbox": {"l": 317.95499, "t": 207.91156, "r": 364.28769, "b": 216.28619000000003, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "\u00d7", "bbox": {"l": 364.28699, "t": 207.85779000000002, "r": 369.98962, "b": 215.55993999999998, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "1025 pixels). Furthermore, custom fields have been", "bbox": {"l": 369.98999, "t": 207.91156, "r": 558.20526, "b": 216.28619000000003, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "added to each COCO record to specify document category, original", "bbox": {"l": 317.95499, "t": 218.87054, "r": 558.20251, "b": 227.24518, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "document filename and page number. In addition, we also provide", "bbox": {"l": 317.95499, "t": 229.82952999999998, "r": 558.203, "b": 238.20416, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "the original PDF pages, as well as sidecar files containing parsed", "bbox": {"l": 317.95499, "t": 240.78754000000004, "r": 558.20404, "b": 249.16216999999995, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "PDF text and text-cell coordinates (in JSON). All additional files are", "bbox": {"l": 317.95499, "t": 251.74652000000003, "r": 558.20227, "b": 260.12114999999994, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "linked to the primary page images by their matching filenames.", "bbox": {"l": 317.95499, "t": 262.70556999999997, "r": 550.36414, "b": 271.0802, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In order to accommodate the different types of models currently in use by the community, we provide DocLayNet in an augmented COCO format [16]. This entails the standard COCO ground-truth file (in JSON format) with the associated page images (in PNG format, 1025 \u00d7 1025 pixels). Furthermore, custom fields have been added to each COCO record to specify document category, original document filename and page number. In addition, we also provide the original PDF pages, as well as sidecar files containing parsed PDF text and text-cell coordinates (in JSON). All additional files are linked to the primary page images by their matching filenames."}, {"label": "text", "id": 7, "page_no": 2, "cluster": {"id": 7, "label": "text", "bbox": {"l": 316.94199, "t": 273.66454999999996, "r": 559.72156, "b": 588.88918, "coord_origin": "TOPLEFT"}, "confidence": 0.9853296875953674, "cells": [{"id": 97, "text": "Despite being cost-intense and far less scalable than automation,", "bbox": {"l": 327.918, "t": 273.66454999999996, "r": 559.18488, "b": 282.03918, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "human annotation has several benefits over automated ground-", "bbox": {"l": 317.95499, "t": 284.62354, "r": 559.7132, "b": 292.99817, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "truth generation. The first and most obvious reason to leverage", "bbox": {"l": 317.95499, "t": 295.5825500000001, "r": 558.20416, "b": 303.95717999999994, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "human annotations is the freedom to annotate any type of doc-", "bbox": {"l": 317.95499, "t": 306.54153, "r": 559.71326, "b": 314.91617, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "ument without requiring a programmatic source. For most PDF", "bbox": {"l": 317.95499, "t": 317.50055, "r": 558.41443, "b": 325.87518, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "documents, the original source document is not available. The lat-", "bbox": {"l": 317.95499, "t": 328.4595299999999, "r": 559.71545, "b": 336.83417, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "ter is not a hard constraint with human annotation, but it is for", "bbox": {"l": 317.95499, "t": 339.41855000000004, "r": 558.36865, "b": 347.79318, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "automated methods. A second reason to use human annotations is", "bbox": {"l": 317.95499, "t": 350.37753, "r": 558.20062, "b": 358.75217, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "that the latter usually provide a more natural interpretation of the", "bbox": {"l": 317.95499, "t": 361.33554, "r": 558.20184, "b": 369.71017, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "page layout. The human-interpreted layout can significantly devi-", "bbox": {"l": 317.95499, "t": 372.29453, "r": 559.71442, "b": 380.66916, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "ate from the programmatic layout used in typesetting. For example,", "bbox": {"l": 317.95499, "t": 383.25354, "r": 559.1864, "b": 391.62817, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "\u201cinvisible\u201d tables might be used solely for aligning text paragraphs", "bbox": {"l": 316.94199, "t": 394.21252, "r": 558.20111, "b": 402.58716, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "on columns. Such typesetting tricks might be interpreted by au-", "bbox": {"l": 317.95499, "t": 405.17154, "r": 559.7132, "b": 413.54617, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "tomated methods incorrectly as an actual table, while the human", "bbox": {"l": 317.95499, "t": 416.13052, "r": 558.20013, "b": 424.50515999999993, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "annotation will interpret it correctly as", "bbox": {"l": 317.95499, "t": 427.08953999999994, "r": 464.50613, "b": 435.46417, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "Text", "bbox": {"l": 466.98199000000005, "t": 427.13439999999997, "r": 482.14560000000006, "b": 435.47313999999994, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "or other styles. The", "bbox": {"l": 485.13199000000003, "t": 427.08953999999994, "r": 558.19727, "b": 435.46417, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "same applies to multi-line text elements, when authors decided to", "bbox": {"l": 317.95499, "t": 438.04855, "r": 558.20221, "b": 446.4231899999999, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "space them as \u201cinvisible\u201d list elements without bullet symbols. A", "bbox": {"l": 317.95499, "t": 449.00754, "r": 558.51501, "b": 457.38217, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "third reason to gather ground-truth through human annotation is", "bbox": {"l": 317.95499, "t": 459.96655000000004, "r": 558.19855, "b": 468.34119, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "to estimate a \u201cnatural\u201d upper bound on the segmentation accuracy.", "bbox": {"l": 317.95499, "t": 470.92453, "r": 559.58215, "b": 479.29916, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "As we will show in Section 4, certain documents featuring complex", "bbox": {"l": 317.64099, "t": 481.88354, "r": 558.41559, "b": 490.25818, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "layouts can have different but equally acceptable layout interpre-", "bbox": {"l": 317.95499, "t": 492.84253, "r": 559.72156, "b": 501.21716, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "tations. This natural upper bound for segmentation accuracy can", "bbox": {"l": 317.95499, "t": 503.80154, "r": 558.19928, "b": 512.1761799999999, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "be found by annotating the same pages multiple times by different", "bbox": {"l": 317.95499, "t": 514.76053, "r": 558.20581, "b": 523.13516, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "people and evaluating the inter-annotator agreement. Such a base-", "bbox": {"l": 317.95499, "t": 525.71954, "r": 559.71729, "b": 534.09418, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "line consistency evaluation is very useful to define expectations", "bbox": {"l": 317.95499, "t": 536.6785600000001, "r": 558.20404, "b": 545.05318, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "for a good target accuracy in trained deep neural network models", "bbox": {"l": 317.95499, "t": 547.63756, "r": 558.20074, "b": 556.01218, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "and avoid overfitting (see Table 1). On the flip side, achieving high", "bbox": {"l": 317.95499, "t": 558.59656, "r": 558.20062, "b": 566.97118, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "annotation consistency proved to be a key challenge in human", "bbox": {"l": 317.95499, "t": 569.55556, "r": 558.20416, "b": 577.9301800000001, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "annotation, as we outline in Section 4.", "bbox": {"l": 317.95499, "t": 580.51456, "r": 457.62469, "b": 588.88918, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Despite being cost-intense and far less scalable than automation, human annotation has several benefits over automated groundtruth generation. The first and most obvious reason to leverage human annotations is the freedom to annotate any type of document without requiring a programmatic source. For most PDF documents, the original source document is not available. The latter is not a hard constraint with human annotation, but it is for automated methods. A second reason to use human annotations is that the latter usually provide a more natural interpretation of the page layout. The human-interpreted layout can significantly deviate from the programmatic layout used in typesetting. For example, \"invisible\" tables might be used solely for aligning text paragraphs on columns. Such typesetting tricks might be interpreted by automated methods incorrectly as an actual table, while the human annotation will interpret it correctly as Text or other styles. The same applies to multi-line text elements, when authors decided to space them as \"invisible\" list elements without bullet symbols. A third reason to gather ground-truth through human annotation is to estimate a \"natural\" upper bound on the segmentation accuracy. As we will show in Section 4, certain documents featuring complex layouts can have different but equally acceptable layout interpretations. This natural upper bound for segmentation accuracy can be found by annotating the same pages multiple times by different people and evaluating the inter-annotator agreement. Such a baseline consistency evaluation is very useful to define expectations for a good target accuracy in trained deep neural network models and avoid overfitting (see Table 1). On the flip side, achieving high annotation consistency proved to be a key challenge in human annotation, as we outline in Section 4."}, {"label": "section_header", "id": 10, "page_no": 2, "cluster": {"id": 10, "label": "section_header", "bbox": {"l": 317.95499, "t": 606.84991, "r": 470.21326, "b": 617.15901, "coord_origin": "TOPLEFT"}, "confidence": 0.9422592520713806, "cells": [{"id": 128, "text": "4", "bbox": {"l": 317.95499, "t": 606.84991, "r": 323.56226, "b": 617.15901, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "ANNOTATION CAMPAIGN", "bbox": {"l": 334.47134, "t": 606.84991, "r": 470.21326, "b": 617.15901, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4 ANNOTATION CAMPAIGN"}, {"label": "text", "id": 5, "page_no": 2, "cluster": {"id": 5, "label": "text", "bbox": {"l": 317.686, "t": 631.97356, "r": 559.71381, "b": 706.102173, "coord_origin": "TOPLEFT"}, "confidence": 0.9863831996917725, "cells": [{"id": 130, "text": "The annotation campaign was carried out in four phases. In phase", "bbox": {"l": 317.686, "t": 631.97356, "r": 558.20148, "b": 640.34818, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "one, we identified and prepared the data sources for annotation.", "bbox": {"l": 317.95499, "t": 642.93256, "r": 559.58521, "b": 651.30717, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "In phase two, we determined the class labels and how annotations", "bbox": {"l": 317.95499, "t": 653.89156, "r": 558.20007, "b": 662.26617, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "should be done on the documents in order to obtain maximum con-", "bbox": {"l": 317.95499, "t": 664.85056, "r": 559.71375, "b": 673.22517, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "sistency. The latter was guided by a detailed requirement analysis", "bbox": {"l": 317.95499, "t": 675.80956, "r": 558.20233, "b": 684.18417, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "and exhaustive experiments. In phase three, we trained the annota-", "bbox": {"l": 317.95499, "t": 686.76855, "r": 559.71381, "b": 695.143173, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "tion staff and performed exams for quality assurance. In phase four,", "bbox": {"l": 317.95499, "t": 697.7275539999999, "r": 559.1864, "b": 706.102173, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The annotation campaign was carried out in four phases. In phase one, we identified and prepared the data sources for annotation. In phase two, we determined the class labels and how annotations should be done on the documents in order to obtain maximum consistency. The latter was guided by a detailed requirement analysis and exhaustive experiments. In phase three, we trained the annotation staff and performed exams for quality assurance. In phase four,"}], "headers": [{"label": "page_header", "id": 13, "page_no": 2, "cluster": {"id": 13, "label": "page_header", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.8919971585273743, "cells": [{"id": 0, "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis"}, {"label": "page_header", "id": 11, "page_no": 2, "cluster": {"id": 11, "label": "page_header", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.9104517102241516, "cells": [{"id": 1, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA"}]}}, {"page_no": 3, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 246.24382, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar", "bbox": {"l": 253.13897999999998, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Table 1: DocLayNet dataset overview. Along with the frequency of each class label, we present the relative occurrence (as %", "bbox": {"l": 53.501999, "t": 84.95495999999991, "r": 558.48969, "b": 93.42822000000001, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "of row \u201cTotal\u201d) in the train, test and validation sets. The inter-annotator agreement is computed as the mAP@0.5-0.95 metric", "bbox": {"l": 53.79800000000001, "t": 95.91394000000003, "r": 558.20294, "b": 104.3872100000001, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "between pairwise annotations from the triple-annotated pages, from which we obtain accuracy ranges.", "bbox": {"l": 53.79800000000001, "t": 106.87292000000002, "r": 469.84805000000006, "b": 115.34618999999998, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "% of Total", "bbox": {"l": 233.94400000000002, "t": 140.22351000000003, "r": 270.04272, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "triple inter-annotator mAP @ 0.5-0.95 (%)", "bbox": {"l": 329.04999, "t": 140.22351000000003, "r": 483.3976400000001, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "class label", "bbox": {"l": 104.825, "t": 151.18255999999997, "r": 141.71277, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Count", "bbox": {"l": 175.94701, "t": 151.18255999999997, "r": 198.71269, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Train", "bbox": {"l": 213.795, "t": 151.18255999999997, "r": 233.69144, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Test", "bbox": {"l": 249.37367, "t": 151.18255999999997, "r": 264.5, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Val", "bbox": {"l": 283.53568, "t": 151.18255999999997, "r": 295.30856, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "All", "bbox": {"l": 314.01501, "t": 151.18255999999997, "r": 324.98093, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Fin", "bbox": {"l": 343.01236, "t": 151.18255999999997, "r": 354.65076, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Man", "bbox": {"l": 367.84033, "t": 151.18255999999997, "r": 384.32059, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Sci", "bbox": {"l": 407.54358, "t": 151.18255999999997, "r": 418.15979, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Law", "bbox": {"l": 432.29979999999995, "t": 151.18255999999997, "r": 447.82962, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "Pat", "bbox": {"l": 465.72656, "t": 151.18255999999997, "r": 477.50842, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Ten", "bbox": {"l": 493.52240000000006, "t": 151.18255999999997, "r": 507.17822, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Caption", "bbox": {"l": 104.825, "t": 162.53954999999996, "r": 134.01064, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "22524", "bbox": {"l": 177.866, "t": 162.53954999999996, "r": 198.71288, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "2.04", "bbox": {"l": 219.211, "t": 162.53954999999996, "r": 233.69174000000004, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "1.77", "bbox": {"l": 250.01956, "t": 162.53954999999996, "r": 264.50031, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "2.32", "bbox": {"l": 280.82812, "t": 162.53954999999996, "r": 295.30887, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "84-89", "bbox": {"l": 305.27301, "t": 162.53954999999996, "r": 324.98117, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "40-61", "bbox": {"l": 334.94284, "t": 162.53954999999996, "r": 354.651, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "86-92", "bbox": {"l": 364.61267, "t": 162.53954999999996, "r": 384.32083, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "94-99", "bbox": {"l": 398.45187, "t": 162.53954999999996, "r": 418.16003, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "95-99", "bbox": {"l": 428.1217, "t": 162.53954999999996, "r": 447.82986, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "69-78", "bbox": {"l": 457.80051, "t": 162.53954999999996, "r": 477.50867, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "n/a", "bbox": {"l": 495.32489, "t": 162.53954999999996, "r": 507.17846999999995, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Footnote", "bbox": {"l": 104.825, "t": 173.49854000000005, "r": 137.3282, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "6318", "bbox": {"l": 182.035, "t": 173.49854000000005, "r": 198.71251, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "0.60", "bbox": {"l": 219.211, "t": 173.49854000000005, "r": 233.69174000000004, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "0.31", "bbox": {"l": 250.01956, "t": 173.49854000000005, "r": 264.50031, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "0.58", "bbox": {"l": 280.82812, "t": 173.49854000000005, "r": 295.30887, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "83-91", "bbox": {"l": 305.27301, "t": 173.49854000000005, "r": 324.98117, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "n/a", "bbox": {"l": 342.79739, "t": 173.49854000000005, "r": 354.65097, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "100", "bbox": {"l": 371.81265, "t": 173.49854000000005, "r": 384.32077, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "62-88", "bbox": {"l": 398.45181, "t": 173.49854000000005, "r": 418.15997, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "85-94", "bbox": {"l": 428.12164, "t": 173.49854000000005, "r": 447.8298, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "n/a", "bbox": {"l": 465.655, "t": 173.49854000000005, "r": 477.50857999999994, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "82-97", "bbox": {"l": 487.47025, "t": 173.49854000000005, "r": 507.17841, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Formula", "bbox": {"l": 104.825, "t": 184.45752000000005, "r": 135.33766, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "25027", "bbox": {"l": 177.866, "t": 184.45752000000005, "r": 198.71288, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "2.25", "bbox": {"l": 219.211, "t": 184.45752000000005, "r": 233.69174000000004, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "1.90", "bbox": {"l": 250.01956, "t": 184.45752000000005, "r": 264.50031, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "2.96", "bbox": {"l": 280.82812, "t": 184.45752000000005, "r": 295.30887, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "83-85", "bbox": {"l": 305.27301, "t": 184.45752000000005, "r": 324.98117, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "n/a", "bbox": {"l": 342.79739, "t": 184.45752000000005, "r": 354.65097, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "n/a", "bbox": {"l": 372.46719, "t": 184.45752000000005, "r": 384.32077, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "84-87", "bbox": {"l": 398.45181, "t": 184.45752000000005, "r": 418.15997, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "86-96", "bbox": {"l": 428.12164, "t": 184.45752000000005, "r": 447.8298, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "n/a", "bbox": {"l": 465.655, "t": 184.45752000000005, "r": 477.50857999999994, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "n/a", "bbox": {"l": 495.3248, "t": 184.45752000000005, "r": 507.17838000000006, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "List-item", "bbox": {"l": 104.825, "t": 195.41656, "r": 137.70479, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "185660", "bbox": {"l": 173.69701, "t": 195.41656, "r": 198.71326, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "17.19", "bbox": {"l": 215.04201, "t": 195.41656, "r": 233.69212, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "13.34", "bbox": {"l": 245.85056, "t": 195.41656, "r": 264.50067, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "15.82", "bbox": {"l": 276.65912, "t": 195.41656, "r": 295.30923, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "87-88", "bbox": {"l": 305.27301, "t": 195.41656, "r": 324.98117, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "74-83", "bbox": {"l": 334.94284, "t": 195.41656, "r": 354.651, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "90-92", "bbox": {"l": 364.61267, "t": 195.41656, "r": 384.32083, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "97-97", "bbox": {"l": 398.45187, "t": 195.41656, "r": 418.16003, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "81-85", "bbox": {"l": 428.1217, "t": 195.41656, "r": 447.82986, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "75-88", "bbox": {"l": 457.80051, "t": 195.41656, "r": 477.50867, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "93-95", "bbox": {"l": 487.47034, "t": 195.41656, "r": 507.17849999999993, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "Page-footer", "bbox": {"l": 104.825, "t": 206.37554999999998, "r": 147.35262, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "70878", "bbox": {"l": 177.866, "t": 206.37554999999998, "r": 198.71288, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "6.51", "bbox": {"l": 219.211, "t": 206.37554999999998, "r": 233.69174000000004, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "5.58", "bbox": {"l": 250.01956, "t": 206.37554999999998, "r": 264.50031, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "6.00", "bbox": {"l": 280.82812, "t": 206.37554999999998, "r": 295.30887, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "93-94", "bbox": {"l": 305.27301, "t": 206.37554999999998, "r": 324.98117, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "88-90", "bbox": {"l": 334.94284, "t": 206.37554999999998, "r": 354.651, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "95-96", "bbox": {"l": 364.61267, "t": 206.37554999999998, "r": 384.32083, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "100", "bbox": {"l": 405.65189, "t": 206.37554999999998, "r": 418.16, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "92-97", "bbox": {"l": 428.12167, "t": 206.37554999999998, "r": 447.82983, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "100", "bbox": {"l": 465.00049, "t": 206.37554999999998, "r": 477.5086099999999, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "96-98", "bbox": {"l": 487.47028, "t": 206.37554999999998, "r": 507.17843999999997, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "Page-header", "bbox": {"l": 104.825, "t": 217.33452999999997, "r": 150.10532, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "58022", "bbox": {"l": 177.866, "t": 217.33452999999997, "r": 198.71288, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "5.10", "bbox": {"l": 219.211, "t": 217.33452999999997, "r": 233.69174000000004, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "6.70", "bbox": {"l": 250.01956, "t": 217.33452999999997, "r": 264.50031, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "5.06", "bbox": {"l": 280.82812, "t": 217.33452999999997, "r": 295.30887, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "85-89", "bbox": {"l": 305.27301, "t": 217.33452999999997, "r": 324.98117, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "66-76", "bbox": {"l": 334.94284, "t": 217.33452999999997, "r": 354.651, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "90-94", "bbox": {"l": 364.61267, "t": 217.33452999999997, "r": 384.32083, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "98-100", "bbox": {"l": 394.2825, "t": 217.33452999999997, "r": 418.16003, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "91-92", "bbox": {"l": 428.1217, "t": 217.33452999999997, "r": 447.82986, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "97-99", "bbox": {"l": 457.80051, "t": 217.33452999999997, "r": 477.50867, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "81-86", "bbox": {"l": 487.47034, "t": 217.33452999999997, "r": 507.17849999999993, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "Picture", "bbox": {"l": 104.825, "t": 228.29351999999994, "r": 130.80963, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "45976", "bbox": {"l": 177.866, "t": 228.29351999999994, "r": 198.71288, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "4.21", "bbox": {"l": 219.211, "t": 228.29351999999994, "r": 233.69174000000004, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "2.78", "bbox": {"l": 250.01956, "t": 228.29351999999994, "r": 264.50031, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "5.31", "bbox": {"l": 280.82812, "t": 228.29351999999994, "r": 295.30887, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "69-71", "bbox": {"l": 305.27301, "t": 228.29351999999994, "r": 324.98117, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "56-59", "bbox": {"l": 334.94284, "t": 228.29351999999994, "r": 354.651, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "82-86", "bbox": {"l": 364.61267, "t": 228.29351999999994, "r": 384.32083, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "69-82", "bbox": {"l": 398.45187, "t": 228.29351999999994, "r": 418.16003, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "80-95", "bbox": {"l": 428.1217, "t": 228.29351999999994, "r": 447.82986, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "66-71", "bbox": {"l": 457.80051, "t": 228.29351999999994, "r": 477.50867, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "59-76", "bbox": {"l": 487.47034, "t": 228.29351999999994, "r": 507.17849999999993, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "Section-header", "bbox": {"l": 104.825, "t": 239.25256000000002, "r": 159.56487, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "142884", "bbox": {"l": 173.69701, "t": 239.25256000000002, "r": 198.71326, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "12.60", "bbox": {"l": 215.04201, "t": 239.25256000000002, "r": 233.69212, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "15.77", "bbox": {"l": 245.85056, "t": 239.25256000000002, "r": 264.50067, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "12.85", "bbox": {"l": 276.65912, "t": 239.25256000000002, "r": 295.30923, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "83-84", "bbox": {"l": 305.27301, "t": 239.25256000000002, "r": 324.98117, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "76-81", "bbox": {"l": 334.94284, "t": 239.25256000000002, "r": 354.651, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "90-92", "bbox": {"l": 364.61267, "t": 239.25256000000002, "r": 384.32083, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "94-95", "bbox": {"l": 398.45187, "t": 239.25256000000002, "r": 418.16003, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "87-94", "bbox": {"l": 428.1217, "t": 239.25256000000002, "r": 447.82986, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "69-73", "bbox": {"l": 457.80051, "t": 239.25256000000002, "r": 477.50867, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "78-86", "bbox": {"l": 487.47034, "t": 239.25256000000002, "r": 507.17849999999993, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "Table", "bbox": {"l": 104.825, "t": 250.21155, "r": 124.63177, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "34733", "bbox": {"l": 177.866, "t": 250.21155, "r": 198.71288, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "3.20", "bbox": {"l": 219.211, "t": 250.21155, "r": 233.69174000000004, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "2.27", "bbox": {"l": 250.01956, "t": 250.21155, "r": 264.50031, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "3.60", "bbox": {"l": 280.82812, "t": 250.21155, "r": 295.30887, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "77-81", "bbox": {"l": 305.27301, "t": 250.21155, "r": 324.98117, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "75-80", "bbox": {"l": 334.94284, "t": 250.21155, "r": 354.651, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "83-86", "bbox": {"l": 364.61267, "t": 250.21155, "r": 384.32083, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "98-99", "bbox": {"l": 398.45187, "t": 250.21155, "r": 418.16003, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "58-80", "bbox": {"l": 428.1217, "t": 250.21155, "r": 447.82986, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "79-84", "bbox": {"l": 457.80051, "t": 250.21155, "r": 477.50867, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "70-85", "bbox": {"l": 487.47034, "t": 250.21155, "r": 507.17849999999993, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "Text", "bbox": {"l": 104.825, "t": 261.16956000000005, "r": 120.78519, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "510377", "bbox": {"l": 173.69701, "t": 261.16956000000005, "r": 198.71326, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "45.82", "bbox": {"l": 215.04201, "t": 261.16956000000005, "r": 233.69212, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "49.28", "bbox": {"l": 245.85056, "t": 261.16956000000005, "r": 264.50067, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "45.00", "bbox": {"l": 276.65912, "t": 261.16956000000005, "r": 295.30923, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "84-86", "bbox": {"l": 305.27301, "t": 261.16956000000005, "r": 324.98117, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "81-86", "bbox": {"l": 334.94284, "t": 261.16956000000005, "r": 354.651, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "88-93", "bbox": {"l": 364.61267, "t": 261.16956000000005, "r": 384.32083, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "89-93", "bbox": {"l": 398.45187, "t": 261.16956000000005, "r": 418.16003, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "87-92", "bbox": {"l": 428.1217, "t": 261.16956000000005, "r": 447.82986, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "71-79", "bbox": {"l": 457.80051, "t": 261.16956000000005, "r": 477.50867, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "87-95", "bbox": {"l": 487.47034, "t": 261.16956000000005, "r": 507.17849999999993, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "Title", "bbox": {"l": 104.825, "t": 272.12854000000004, "r": 121.81633, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "5071", "bbox": {"l": 182.035, "t": 272.12854000000004, "r": 198.71251, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "0.47", "bbox": {"l": 219.211, "t": 272.12854000000004, "r": 233.69174000000004, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "0.30", "bbox": {"l": 250.01956, "t": 272.12854000000004, "r": 264.50031, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "0.50", "bbox": {"l": 280.82812, "t": 272.12854000000004, "r": 295.30887, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "60-72", "bbox": {"l": 305.27301, "t": 272.12854000000004, "r": 324.98117, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "24-63", "bbox": {"l": 334.94284, "t": 272.12854000000004, "r": 354.651, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "50-63", "bbox": {"l": 364.61267, "t": 272.12854000000004, "r": 384.32083, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "94-100", "bbox": {"l": 394.2825, "t": 272.12854000000004, "r": 418.16003, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "82-96", "bbox": {"l": 428.1217, "t": 272.12854000000004, "r": 447.82986, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "68-79", "bbox": {"l": 457.80051, "t": 272.12854000000004, "r": 477.50867, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "24-56", "bbox": {"l": 487.47034, "t": 272.12854000000004, "r": 507.17849999999993, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "Total", "bbox": {"l": 104.825, "t": 283.48654, "r": 123.43028, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "1107470", "bbox": {"l": 169.52699, "t": 283.48654, "r": 198.71263, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "941123", "bbox": {"l": 208.675, "t": 283.48654, "r": 233.69124999999997, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "99816", "bbox": {"l": 243.65291999999997, "t": 283.48654, "r": 264.49982, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "66531", "bbox": {"l": 274.46149, "t": 283.48654, "r": 295.30838, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "82-83", "bbox": {"l": 305.27301, "t": 283.48654, "r": 324.98117, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "71-74", "bbox": {"l": 334.94284, "t": 283.48654, "r": 354.651, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "79-81", "bbox": {"l": 364.61267, "t": 283.48654, "r": 384.32083, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "89-94", "bbox": {"l": 398.45187, "t": 283.48654, "r": 418.16003, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "86-91", "bbox": {"l": 428.1217, "t": 283.48654, "r": 447.82986, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "71-76", "bbox": {"l": 457.80051, "t": 283.48654, "r": 477.50867, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "68-85", "bbox": {"l": 487.47034, "t": 283.48654, "r": 507.17849999999993, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "Figure 3: Corpus Conversion Service annotation user inter-", "bbox": {"l": 53.79800000000001, "t": 554.00999, "r": 295.64871, "b": 562.48325, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "face. The PDF page is shown in the background, with over-", "bbox": {"l": 53.79800000000001, "t": 564.96899, "r": 295.64874, "b": 573.44225, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "laid text-cells (in darker shades). The annotation boxes can", "bbox": {"l": 53.79800000000001, "t": 575.92799, "r": 294.04376, "b": 584.40125, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "be drawn by dragging a rectangle over each segment with", "bbox": {"l": 53.79800000000001, "t": 586.88699, "r": 294.04373, "b": 595.36024, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "the respective label from the palette on the right.", "bbox": {"l": 53.79800000000001, "t": 597.84599, "r": 252.78931000000003, "b": 606.31924, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "we distributed the annotation workload and performed continuous", "bbox": {"l": 53.466999, "t": 634.29155, "r": 294.04745, "b": 642.66617, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "quality controls. Phase one and two required a small team of experts", "bbox": {"l": 53.79800000000001, "t": 645.25055, "r": 294.04535, "b": 653.62517, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "only. For phases three and four, a group of 40 dedicated annotators", "bbox": {"l": 53.79800000000001, "t": 656.20955, "r": 294.04422, "b": 664.58417, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "were assembled and supervised.", "bbox": {"l": 53.466999, "t": 667.16856, "r": 170.58611, "b": 675.54317, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "Phase 1: Data selection and preparation.", "bbox": {"l": 63.76099800000001, "t": 678.01099, "r": 226.72533000000004, "b": 686.48424, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "Our inclusion cri-", "bbox": {"l": 229.06900000000002, "t": 678.12756, "r": 295.55844, "b": 686.50217, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "teria for documents were described in Section 3. A large effort went", "bbox": {"l": 53.79800000000001, "t": 689.08656, "r": 294.04538, "b": 697.461174, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "into ensuring that all documents are free to use. The data sources", "bbox": {"l": 53.79800000000001, "t": 700.045555, "r": 294.04642, "b": 708.420174, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "include publication repositories such as arXiv$^{3}$, government offices,", "bbox": {"l": 317.95499, "t": 312.07953, "r": 559.18536, "b": 320.45416000000006, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "company websites as well as data directory services for financial", "bbox": {"l": 317.95499, "t": 323.03754, "r": 558.19843, "b": 331.41217, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "reports and patents. Scanned documents were excluded wherever", "bbox": {"l": 317.95499, "t": 333.99655, "r": 558.36963, "b": 342.37119, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "possible because they can be rotated or skewed. This would not", "bbox": {"l": 317.95499, "t": 344.95554, "r": 558.2041, "b": 353.33017, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "allow us to perform annotation with rectangular bounding-boxes", "bbox": {"l": 317.95499, "t": 355.91455, "r": 558.20294, "b": 364.28918, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "and therefore complicate the annotation process.", "bbox": {"l": 317.95499, "t": 366.87354, "r": 496.71826, "b": 375.24817, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "Preparation work included uploading and parsing the sourced", "bbox": {"l": 327.918, "t": 377.8325500000001, "r": 558.20618, "b": 386.20717999999994, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "PDF documents in the Corpus Conversion Service (CCS) [22], a", "bbox": {"l": 317.95499, "t": 388.79153, "r": 558.2019, "b": 397.16617, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "cloud-native platform which provides a visual annotation interface", "bbox": {"l": 317.95499, "t": 399.75055, "r": 558.20233, "b": 408.12518, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": "and allows for dataset inspection and analysis. The annotation in-", "bbox": {"l": 317.95499, "t": 410.7095299999999, "r": 559.71277, "b": 419.08417, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "terface of CCS is shown in Figure 3. The desired balance of pages", "bbox": {"l": 317.95499, "t": 421.66855000000004, "r": 558.20062, "b": 430.04318, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "between the different document categories was achieved by se-", "bbox": {"l": 317.95499, "t": 432.62753, "r": 559.71307, "b": 441.00217, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": "lective subsampling of pages with certain desired properties. For", "bbox": {"l": 317.95499, "t": 443.58554, "r": 558.36877, "b": 451.96017, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "example, we made sure to include the title page of each document", "bbox": {"l": 317.95499, "t": 454.54453, "r": 558.20428, "b": 462.91916, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "and bias the remaining page selection to those with figures or", "bbox": {"l": 317.95499, "t": 465.50354, "r": 558.36877, "b": 473.87817, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "tables. The latter was achieved by leveraging pre-trained object", "bbox": {"l": 317.95499, "t": 476.46252, "r": 558.20428, "b": 484.83716, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": "detection models from PubLayNet, which helped us estimate how", "bbox": {"l": 317.95499, "t": 487.42154, "r": 558.5307, "b": 495.79617, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "many figures and tables a given page contains.", "bbox": {"l": 317.95499, "t": 498.38052, "r": 488.46914999999996, "b": 506.75516, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "Phase 2: Label selection and guideline.", "bbox": {"l": 327.918, "t": 509.22299, "r": 482.41809, "b": 517.69623, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "We reviewed the col-", "bbox": {"l": 484.474, "t": 509.33954, "r": 559.71765, "b": 517.71417, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "lected documents and identified the most common structural fea-", "bbox": {"l": 317.95499, "t": 520.29855, "r": 559.71619, "b": 528.67319, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "tures they exhibit. This was achieved by identifying recurrent layout", "bbox": {"l": 317.95499, "t": 531.2575400000001, "r": 558.20239, "b": 539.63217, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "elements and lead us to the definition of 11 distinct class labels.", "bbox": {"l": 317.95499, "t": 542.21655, "r": 559.58502, "b": 550.59117, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "These 11 class labels are", "bbox": {"l": 317.686, "t": 553.17456, "r": 404.14197, "b": 561.54918, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "Caption", "bbox": {"l": 406.26599, "t": 553.21939, "r": 433.84860000000003, "b": 561.5581500000001, "coord_origin": "TOPLEFT"}}, {"id": 201, "text": ",", "bbox": {"l": 433.84799, "t": 553.17456, "r": 435.78115999999994, "b": 561.54918, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": "Footnote", "bbox": {"l": 437.9079899999999, "t": 553.21939, "r": 467.23926, "b": 561.5581500000001, "coord_origin": "TOPLEFT"}}, {"id": 203, "text": ",", "bbox": {"l": 467.23999, "t": 553.17456, "r": 469.17316000000005, "b": 561.54918, "coord_origin": "TOPLEFT"}}, {"id": 204, "text": "Formula", "bbox": {"l": 471.29900999999995, "t": 553.21939, "r": 500.44574000000006, "b": 561.5581500000001, "coord_origin": "TOPLEFT"}}, {"id": 205, "text": ",", "bbox": {"l": 500.44601000000006, "t": 553.17456, "r": 502.37918, "b": 561.54918, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": "List-item", "bbox": {"l": 504.505, "t": 553.21939, "r": 535.74304, "b": 561.5581500000001, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": ",", "bbox": {"l": 535.74298, "t": 553.17456, "r": 537.67615, "b": 561.54918, "coord_origin": "TOPLEFT"}}, {"id": 208, "text": "Page-", "bbox": {"l": 539.802, "t": 553.21939, "r": 559.09839, "b": 561.5581500000001, "coord_origin": "TOPLEFT"}}, {"id": 209, "text": "footer", "bbox": {"l": 317.95499, "t": 564.17839, "r": 338.80725, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": ",", "bbox": {"l": 338.806, "t": 564.13356, "r": 340.81805, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "Page-header", "bbox": {"l": 343.61401, "t": 564.17839, "r": 387.96164, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 212, "text": ",", "bbox": {"l": 387.961, "t": 564.13356, "r": 389.97305, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "Picture", "bbox": {"l": 392.76901, "t": 564.17839, "r": 417.84662, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 214, "text": ",", "bbox": {"l": 417.84799, "t": 564.13356, "r": 419.86005, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 215, "text": "Section-header", "bbox": {"l": 422.655, "t": 564.17839, "r": 475.56305, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 216, "text": ",", "bbox": {"l": 475.56201, "t": 564.13356, "r": 477.57407, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 217, "text": "Table", "bbox": {"l": 480.36899, "t": 564.17839, "r": 499.82196, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 218, "text": ",", "bbox": {"l": 499.8219900000001, "t": 564.13356, "r": 501.83405, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 219, "text": "Text", "bbox": {"l": 504.6290000000001, "t": 564.17839, "r": 519.7926, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 220, "text": ", and", "bbox": {"l": 519.79602, "t": 564.13356, "r": 538.37103, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 221, "text": "Title", "bbox": {"l": 541.16302, "t": 564.17839, "r": 557.57043, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 222, "text": ".", "bbox": {"l": 557.57098, "t": 564.13356, "r": 559.58307, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 223, "text": "Critical factors that were considered for the choice of these class", "bbox": {"l": 317.95499, "t": 575.09256, "r": 558.20416, "b": 583.46718, "coord_origin": "TOPLEFT"}}, {"id": 224, "text": "labels were (1) the overall occurrence of the label, (2) the specificity", "bbox": {"l": 317.95499, "t": 586.05156, "r": 558.43091, "b": 594.4261799999999, "coord_origin": "TOPLEFT"}}, {"id": 225, "text": "of the label, (3) recognisability on a single page (i.e. no need for", "bbox": {"l": 317.95499, "t": 597.0105599999999, "r": 558.36871, "b": 605.38518, "coord_origin": "TOPLEFT"}}, {"id": 226, "text": "context from previous or next page) and (4) overall coverage of the", "bbox": {"l": 317.95499, "t": 607.96956, "r": 558.20105, "b": 616.3441799999999, "coord_origin": "TOPLEFT"}}, {"id": 227, "text": "page. Specificity ensures that the choice of label is not ambiguous,", "bbox": {"l": 317.95499, "t": 618.9285600000001, "r": 559.18665, "b": 627.30318, "coord_origin": "TOPLEFT"}}, {"id": 228, "text": "while coverage ensures that all meaningful items on a page can", "bbox": {"l": 317.62299, "t": 629.88756, "r": 558.20142, "b": 638.26218, "coord_origin": "TOPLEFT"}}, {"id": 229, "text": "be annotated. We refrained from class labels that are very specific", "bbox": {"l": 317.95499, "t": 640.84656, "r": 558.20227, "b": 649.22118, "coord_origin": "TOPLEFT"}}, {"id": 230, "text": "to a document category, such as", "bbox": {"l": 317.95499, "t": 651.80556, "r": 436.90649, "b": 660.1801800000001, "coord_origin": "TOPLEFT"}}, {"id": 231, "text": "Abstract", "bbox": {"l": 439.13800000000003, "t": 651.8503900000001, "r": 469.69134999999994, "b": 660.18915, "coord_origin": "TOPLEFT"}}, {"id": 232, "text": "in the", "bbox": {"l": 472.42898999999994, "t": 651.80556, "r": 493.97348, "b": 660.1801800000001, "coord_origin": "TOPLEFT"}}, {"id": 233, "text": "Scientific Articles", "bbox": {"l": 496.207, "t": 651.8503900000001, "r": 558.20001, "b": 660.18915, "coord_origin": "TOPLEFT"}}, {"id": 234, "text": "category. We also avoided class labels that are tightly linked to the", "bbox": {"l": 317.95499, "t": 662.76456, "r": 558.20557, "b": 671.13918, "coord_origin": "TOPLEFT"}}, {"id": 235, "text": "semantics of the text. Labels such as", "bbox": {"l": 317.95499, "t": 673.7225599999999, "r": 447.65221999999994, "b": 682.09718, "coord_origin": "TOPLEFT"}}, {"id": 236, "text": "Author", "bbox": {"l": 449.85999, "t": 673.76739, "r": 474.31439, "b": 682.10614, "coord_origin": "TOPLEFT"}}, {"id": 237, "text": "and", "bbox": {"l": 477.172, "t": 673.7225599999999, "r": 490.39655, "b": 682.09718, "coord_origin": "TOPLEFT"}}, {"id": 238, "text": "Affiliation", "bbox": {"l": 492.60599, "t": 673.76739, "r": 528.29907, "b": 682.10614, "coord_origin": "TOPLEFT"}}, {"id": 239, "text": ", as seen", "bbox": {"l": 528.29901, "t": 673.7225599999999, "r": 558.20148, "b": 682.09718, "coord_origin": "TOPLEFT"}}, {"id": 240, "text": "in DocBank, are often only distinguishable by discriminating on", "bbox": {"l": 317.95499, "t": 684.68156, "r": 558.2041, "b": 693.0561749999999, "coord_origin": "TOPLEFT"}}, {"id": 241, "text": "$^{3}$https://arxiv.org/", "bbox": {"l": 317.95499, "t": 702.353363, "r": 369.2457, "b": 708.86689, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 10, "label": "page_header", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.7625049948692322, "cells": [{"id": 0, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 246.24382, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar", "bbox": {"l": 253.13897999999998, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "caption", "bbox": {"l": 53.501999, "t": 84.95495999999991, "r": 558.48969, "b": 115.34618999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.8906616568565369, "cells": [{"id": 2, "text": "Table 1: DocLayNet dataset overview. Along with the frequency of each class label, we present the relative occurrence (as %", "bbox": {"l": 53.501999, "t": 84.95495999999991, "r": 558.48969, "b": 93.42822000000001, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "of row \u201cTotal\u201d) in the train, test and validation sets. The inter-annotator agreement is computed as the mAP@0.5-0.95 metric", "bbox": {"l": 53.79800000000001, "t": 95.91394000000003, "r": 558.20294, "b": 104.3872100000001, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "between pairwise annotations from the triple-annotated pages, from which we obtain accuracy ranges.", "bbox": {"l": 53.79800000000001, "t": 106.87292000000002, "r": 469.84805000000006, "b": 115.34618999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "table", "bbox": {"l": 98.93103790283203, "t": 137.47547912597656, "r": 512.579833984375, "b": 294.08148193359375, "coord_origin": "TOPLEFT"}, "confidence": 0.9860090613365173, "cells": [{"id": 5, "text": "% of Total", "bbox": {"l": 233.94400000000002, "t": 140.22351000000003, "r": 270.04272, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "triple inter-annotator mAP @ 0.5-0.95 (%)", "bbox": {"l": 329.04999, "t": 140.22351000000003, "r": 483.3976400000001, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "class label", "bbox": {"l": 104.825, "t": 151.18255999999997, "r": 141.71277, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Count", "bbox": {"l": 175.94701, "t": 151.18255999999997, "r": 198.71269, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Train", "bbox": {"l": 213.795, "t": 151.18255999999997, "r": 233.69144, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Test", "bbox": {"l": 249.37367, "t": 151.18255999999997, "r": 264.5, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Val", "bbox": {"l": 283.53568, "t": 151.18255999999997, "r": 295.30856, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "All", "bbox": {"l": 314.01501, "t": 151.18255999999997, "r": 324.98093, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Fin", "bbox": {"l": 343.01236, "t": 151.18255999999997, "r": 354.65076, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Man", "bbox": {"l": 367.84033, "t": 151.18255999999997, "r": 384.32059, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Sci", "bbox": {"l": 407.54358, "t": 151.18255999999997, "r": 418.15979, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Law", "bbox": {"l": 432.29979999999995, "t": 151.18255999999997, "r": 447.82962, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "Pat", "bbox": {"l": 465.72656, "t": 151.18255999999997, "r": 477.50842, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Ten", "bbox": {"l": 493.52240000000006, "t": 151.18255999999997, "r": 507.17822, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Caption", "bbox": {"l": 104.825, "t": 162.53954999999996, "r": 134.01064, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "22524", "bbox": {"l": 177.866, "t": 162.53954999999996, "r": 198.71288, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "2.04", "bbox": {"l": 219.211, "t": 162.53954999999996, "r": 233.69174000000004, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "1.77", "bbox": {"l": 250.01956, "t": 162.53954999999996, "r": 264.50031, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "2.32", "bbox": {"l": 280.82812, "t": 162.53954999999996, "r": 295.30887, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "84-89", "bbox": {"l": 305.27301, "t": 162.53954999999996, "r": 324.98117, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "40-61", "bbox": {"l": 334.94284, "t": 162.53954999999996, "r": 354.651, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "86-92", "bbox": {"l": 364.61267, "t": 162.53954999999996, "r": 384.32083, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "94-99", "bbox": {"l": 398.45187, "t": 162.53954999999996, "r": 418.16003, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "95-99", "bbox": {"l": 428.1217, "t": 162.53954999999996, "r": 447.82986, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "69-78", "bbox": {"l": 457.80051, "t": 162.53954999999996, "r": 477.50867, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "n/a", "bbox": {"l": 495.32489, "t": 162.53954999999996, "r": 507.17846999999995, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Footnote", "bbox": {"l": 104.825, "t": 173.49854000000005, "r": 137.3282, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "6318", "bbox": {"l": 182.035, "t": 173.49854000000005, "r": 198.71251, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "0.60", "bbox": {"l": 219.211, "t": 173.49854000000005, "r": 233.69174000000004, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "0.31", "bbox": {"l": 250.01956, "t": 173.49854000000005, "r": 264.50031, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "0.58", "bbox": {"l": 280.82812, "t": 173.49854000000005, "r": 295.30887, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "83-91", "bbox": {"l": 305.27301, "t": 173.49854000000005, "r": 324.98117, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "n/a", "bbox": {"l": 342.79739, "t": 173.49854000000005, "r": 354.65097, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "100", "bbox": {"l": 371.81265, "t": 173.49854000000005, "r": 384.32077, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "62-88", "bbox": {"l": 398.45181, "t": 173.49854000000005, "r": 418.15997, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "85-94", "bbox": {"l": 428.12164, "t": 173.49854000000005, "r": 447.8298, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "n/a", "bbox": {"l": 465.655, "t": 173.49854000000005, "r": 477.50857999999994, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "82-97", "bbox": {"l": 487.47025, "t": 173.49854000000005, "r": 507.17841, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Formula", "bbox": {"l": 104.825, "t": 184.45752000000005, "r": 135.33766, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "25027", "bbox": {"l": 177.866, "t": 184.45752000000005, "r": 198.71288, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "2.25", "bbox": {"l": 219.211, "t": 184.45752000000005, "r": 233.69174000000004, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "1.90", "bbox": {"l": 250.01956, "t": 184.45752000000005, "r": 264.50031, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "2.96", "bbox": {"l": 280.82812, "t": 184.45752000000005, "r": 295.30887, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "83-85", "bbox": {"l": 305.27301, "t": 184.45752000000005, "r": 324.98117, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "n/a", "bbox": {"l": 342.79739, "t": 184.45752000000005, "r": 354.65097, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "n/a", "bbox": {"l": 372.46719, "t": 184.45752000000005, "r": 384.32077, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "84-87", "bbox": {"l": 398.45181, "t": 184.45752000000005, "r": 418.15997, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "86-96", "bbox": {"l": 428.12164, "t": 184.45752000000005, "r": 447.8298, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "n/a", "bbox": {"l": 465.655, "t": 184.45752000000005, "r": 477.50857999999994, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "n/a", "bbox": {"l": 495.3248, "t": 184.45752000000005, "r": 507.17838000000006, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "List-item", "bbox": {"l": 104.825, "t": 195.41656, "r": 137.70479, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "185660", "bbox": {"l": 173.69701, "t": 195.41656, "r": 198.71326, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "17.19", "bbox": {"l": 215.04201, "t": 195.41656, "r": 233.69212, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "13.34", "bbox": {"l": 245.85056, "t": 195.41656, "r": 264.50067, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "15.82", "bbox": {"l": 276.65912, "t": 195.41656, "r": 295.30923, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "87-88", "bbox": {"l": 305.27301, "t": 195.41656, "r": 324.98117, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "74-83", "bbox": {"l": 334.94284, "t": 195.41656, "r": 354.651, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "90-92", "bbox": {"l": 364.61267, "t": 195.41656, "r": 384.32083, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "97-97", "bbox": {"l": 398.45187, "t": 195.41656, "r": 418.16003, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "81-85", "bbox": {"l": 428.1217, "t": 195.41656, "r": 447.82986, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "75-88", "bbox": {"l": 457.80051, "t": 195.41656, "r": 477.50867, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "93-95", "bbox": {"l": 487.47034, "t": 195.41656, "r": 507.17849999999993, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "Page-footer", "bbox": {"l": 104.825, "t": 206.37554999999998, "r": 147.35262, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "70878", "bbox": {"l": 177.866, "t": 206.37554999999998, "r": 198.71288, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "6.51", "bbox": {"l": 219.211, "t": 206.37554999999998, "r": 233.69174000000004, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "5.58", "bbox": {"l": 250.01956, "t": 206.37554999999998, "r": 264.50031, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "6.00", "bbox": {"l": 280.82812, "t": 206.37554999999998, "r": 295.30887, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "93-94", "bbox": {"l": 305.27301, "t": 206.37554999999998, "r": 324.98117, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "88-90", "bbox": {"l": 334.94284, "t": 206.37554999999998, "r": 354.651, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "95-96", "bbox": {"l": 364.61267, "t": 206.37554999999998, "r": 384.32083, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "100", "bbox": {"l": 405.65189, "t": 206.37554999999998, "r": 418.16, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "92-97", "bbox": {"l": 428.12167, "t": 206.37554999999998, "r": 447.82983, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "100", "bbox": {"l": 465.00049, "t": 206.37554999999998, "r": 477.5086099999999, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "96-98", "bbox": {"l": 487.47028, "t": 206.37554999999998, "r": 507.17843999999997, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "Page-header", "bbox": {"l": 104.825, "t": 217.33452999999997, "r": 150.10532, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "58022", "bbox": {"l": 177.866, "t": 217.33452999999997, "r": 198.71288, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "5.10", "bbox": {"l": 219.211, "t": 217.33452999999997, "r": 233.69174000000004, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "6.70", "bbox": {"l": 250.01956, "t": 217.33452999999997, "r": 264.50031, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "5.06", "bbox": {"l": 280.82812, "t": 217.33452999999997, "r": 295.30887, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "85-89", "bbox": {"l": 305.27301, "t": 217.33452999999997, "r": 324.98117, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "66-76", "bbox": {"l": 334.94284, "t": 217.33452999999997, "r": 354.651, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "90-94", "bbox": {"l": 364.61267, "t": 217.33452999999997, "r": 384.32083, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "98-100", "bbox": {"l": 394.2825, "t": 217.33452999999997, "r": 418.16003, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "91-92", "bbox": {"l": 428.1217, "t": 217.33452999999997, "r": 447.82986, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "97-99", "bbox": {"l": 457.80051, "t": 217.33452999999997, "r": 477.50867, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "81-86", "bbox": {"l": 487.47034, "t": 217.33452999999997, "r": 507.17849999999993, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "Picture", "bbox": {"l": 104.825, "t": 228.29351999999994, "r": 130.80963, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "45976", "bbox": {"l": 177.866, "t": 228.29351999999994, "r": 198.71288, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "4.21", "bbox": {"l": 219.211, "t": 228.29351999999994, "r": 233.69174000000004, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "2.78", "bbox": {"l": 250.01956, "t": 228.29351999999994, "r": 264.50031, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "5.31", "bbox": {"l": 280.82812, "t": 228.29351999999994, "r": 295.30887, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "69-71", "bbox": {"l": 305.27301, "t": 228.29351999999994, "r": 324.98117, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "56-59", "bbox": {"l": 334.94284, "t": 228.29351999999994, "r": 354.651, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "82-86", "bbox": {"l": 364.61267, "t": 228.29351999999994, "r": 384.32083, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "69-82", "bbox": {"l": 398.45187, "t": 228.29351999999994, "r": 418.16003, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "80-95", "bbox": {"l": 428.1217, "t": 228.29351999999994, "r": 447.82986, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "66-71", "bbox": {"l": 457.80051, "t": 228.29351999999994, "r": 477.50867, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "59-76", "bbox": {"l": 487.47034, "t": 228.29351999999994, "r": 507.17849999999993, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "Section-header", "bbox": {"l": 104.825, "t": 239.25256000000002, "r": 159.56487, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "142884", "bbox": {"l": 173.69701, "t": 239.25256000000002, "r": 198.71326, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "12.60", "bbox": {"l": 215.04201, "t": 239.25256000000002, "r": 233.69212, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "15.77", "bbox": {"l": 245.85056, "t": 239.25256000000002, "r": 264.50067, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "12.85", "bbox": {"l": 276.65912, "t": 239.25256000000002, "r": 295.30923, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "83-84", "bbox": {"l": 305.27301, "t": 239.25256000000002, "r": 324.98117, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "76-81", "bbox": {"l": 334.94284, "t": 239.25256000000002, "r": 354.651, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "90-92", "bbox": {"l": 364.61267, "t": 239.25256000000002, "r": 384.32083, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "94-95", "bbox": {"l": 398.45187, "t": 239.25256000000002, "r": 418.16003, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "87-94", "bbox": {"l": 428.1217, "t": 239.25256000000002, "r": 447.82986, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "69-73", "bbox": {"l": 457.80051, "t": 239.25256000000002, "r": 477.50867, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "78-86", "bbox": {"l": 487.47034, "t": 239.25256000000002, "r": 507.17849999999993, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "Table", "bbox": {"l": 104.825, "t": 250.21155, "r": 124.63177, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "34733", "bbox": {"l": 177.866, "t": 250.21155, "r": 198.71288, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "3.20", "bbox": {"l": 219.211, "t": 250.21155, "r": 233.69174000000004, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "2.27", "bbox": {"l": 250.01956, "t": 250.21155, "r": 264.50031, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "3.60", "bbox": {"l": 280.82812, "t": 250.21155, "r": 295.30887, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "77-81", "bbox": {"l": 305.27301, "t": 250.21155, "r": 324.98117, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "75-80", "bbox": {"l": 334.94284, "t": 250.21155, "r": 354.651, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "83-86", "bbox": {"l": 364.61267, "t": 250.21155, "r": 384.32083, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "98-99", "bbox": {"l": 398.45187, "t": 250.21155, "r": 418.16003, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "58-80", "bbox": {"l": 428.1217, "t": 250.21155, "r": 447.82986, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "79-84", "bbox": {"l": 457.80051, "t": 250.21155, "r": 477.50867, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "70-85", "bbox": {"l": 487.47034, "t": 250.21155, "r": 507.17849999999993, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "Text", "bbox": {"l": 104.825, "t": 261.16956000000005, "r": 120.78519, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "510377", "bbox": {"l": 173.69701, "t": 261.16956000000005, "r": 198.71326, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "45.82", "bbox": {"l": 215.04201, "t": 261.16956000000005, "r": 233.69212, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "49.28", "bbox": {"l": 245.85056, "t": 261.16956000000005, "r": 264.50067, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "45.00", "bbox": {"l": 276.65912, "t": 261.16956000000005, "r": 295.30923, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "84-86", "bbox": {"l": 305.27301, "t": 261.16956000000005, "r": 324.98117, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "81-86", "bbox": {"l": 334.94284, "t": 261.16956000000005, "r": 354.651, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "88-93", "bbox": {"l": 364.61267, "t": 261.16956000000005, "r": 384.32083, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "89-93", "bbox": {"l": 398.45187, "t": 261.16956000000005, "r": 418.16003, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "87-92", "bbox": {"l": 428.1217, "t": 261.16956000000005, "r": 447.82986, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "71-79", "bbox": {"l": 457.80051, "t": 261.16956000000005, "r": 477.50867, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "87-95", "bbox": {"l": 487.47034, "t": 261.16956000000005, "r": 507.17849999999993, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "Title", "bbox": {"l": 104.825, "t": 272.12854000000004, "r": 121.81633, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "5071", "bbox": {"l": 182.035, "t": 272.12854000000004, "r": 198.71251, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "0.47", "bbox": {"l": 219.211, "t": 272.12854000000004, "r": 233.69174000000004, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "0.30", "bbox": {"l": 250.01956, "t": 272.12854000000004, "r": 264.50031, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "0.50", "bbox": {"l": 280.82812, "t": 272.12854000000004, "r": 295.30887, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "60-72", "bbox": {"l": 305.27301, "t": 272.12854000000004, "r": 324.98117, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "24-63", "bbox": {"l": 334.94284, "t": 272.12854000000004, "r": 354.651, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "50-63", "bbox": {"l": 364.61267, "t": 272.12854000000004, "r": 384.32083, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "94-100", "bbox": {"l": 394.2825, "t": 272.12854000000004, "r": 418.16003, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "82-96", "bbox": {"l": 428.1217, "t": 272.12854000000004, "r": 447.82986, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "68-79", "bbox": {"l": 457.80051, "t": 272.12854000000004, "r": 477.50867, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "24-56", "bbox": {"l": 487.47034, "t": 272.12854000000004, "r": 507.17849999999993, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "Total", "bbox": {"l": 104.825, "t": 283.48654, "r": 123.43028, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "1107470", "bbox": {"l": 169.52699, "t": 283.48654, "r": 198.71263, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "941123", "bbox": {"l": 208.675, "t": 283.48654, "r": 233.69124999999997, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "99816", "bbox": {"l": 243.65291999999997, "t": 283.48654, "r": 264.49982, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "66531", "bbox": {"l": 274.46149, "t": 283.48654, "r": 295.30838, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "82-83", "bbox": {"l": 305.27301, "t": 283.48654, "r": 324.98117, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "71-74", "bbox": {"l": 334.94284, "t": 283.48654, "r": 354.651, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "79-81", "bbox": {"l": 364.61267, "t": 283.48654, "r": 384.32083, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "89-94", "bbox": {"l": 398.45187, "t": 283.48654, "r": 418.16003, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "86-91", "bbox": {"l": 428.1217, "t": 283.48654, "r": 447.82986, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "71-76", "bbox": {"l": 457.80051, "t": 283.48654, "r": 477.50867, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "68-85", "bbox": {"l": 487.47034, "t": 283.48654, "r": 507.17849999999993, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": [{"id": 11, "label": "text", "bbox": {"l": 233.94400000000002, "t": 140.22351000000003, "r": 270.04272, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 5, "text": "% of Total", "bbox": {"l": 233.94400000000002, "t": 140.22351000000003, "r": 270.04272, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 329.04999, "t": 140.22351000000003, "r": 483.3976400000001, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": "triple inter-annotator mAP @ 0.5-0.95 (%)", "bbox": {"l": 329.04999, "t": 140.22351000000003, "r": 483.3976400000001, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 104.825, "t": 151.18255999999997, "r": 141.71277, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "class label", "bbox": {"l": 104.825, "t": 151.18255999999997, "r": 141.71277, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 175.94701, "t": 151.18255999999997, "r": 198.71269, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "Count", "bbox": {"l": 175.94701, "t": 151.18255999999997, "r": 198.71269, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 213.795, "t": 151.18255999999997, "r": 233.69144, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "Train", "bbox": {"l": 213.795, "t": 151.18255999999997, "r": 233.69144, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 249.37367, "t": 151.18255999999997, "r": 264.5, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "Test", "bbox": {"l": 249.37367, "t": 151.18255999999997, "r": 264.5, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 283.53568, "t": 151.18255999999997, "r": 295.30856, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "Val", "bbox": {"l": 283.53568, "t": 151.18255999999997, "r": 295.30856, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 314.01501, "t": 151.18255999999997, "r": 324.98093, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "All", "bbox": {"l": 314.01501, "t": 151.18255999999997, "r": 324.98093, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 343.01236, "t": 151.18255999999997, "r": 354.65076, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "Fin", "bbox": {"l": 343.01236, "t": 151.18255999999997, "r": 354.65076, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 367.84033, "t": 151.18255999999997, "r": 384.32059, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "Man", "bbox": {"l": 367.84033, "t": 151.18255999999997, "r": 384.32059, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 407.54358, "t": 151.18255999999997, "r": 418.15979, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "Sci", "bbox": {"l": 407.54358, "t": 151.18255999999997, "r": 418.15979, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 432.29979999999995, "t": 151.18255999999997, "r": 447.82962, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "Law", "bbox": {"l": 432.29979999999995, "t": 151.18255999999997, "r": 447.82962, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 465.72656, "t": 151.18255999999997, "r": 477.50842, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "Pat", "bbox": {"l": 465.72656, "t": 151.18255999999997, "r": 477.50842, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 493.52240000000006, "t": 151.18255999999997, "r": 507.17822, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "Ten", "bbox": {"l": 493.52240000000006, "t": 151.18255999999997, "r": 507.17822, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 104.825, "t": 162.53954999999996, "r": 134.01064, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "Caption", "bbox": {"l": 104.825, "t": 162.53954999999996, "r": 134.01064, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 177.866, "t": 162.53954999999996, "r": 198.71288, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "22524", "bbox": {"l": 177.866, "t": 162.53954999999996, "r": 198.71288, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 219.211, "t": 162.53954999999996, "r": 233.69174000000004, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "2.04", "bbox": {"l": 219.211, "t": 162.53954999999996, "r": 233.69174000000004, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 250.01956, "t": 162.53954999999996, "r": 264.50031, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "1.77", "bbox": {"l": 250.01956, "t": 162.53954999999996, "r": 264.50031, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 280.82812, "t": 162.53954999999996, "r": 295.30887, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "2.32", "bbox": {"l": 280.82812, "t": 162.53954999999996, "r": 295.30887, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 305.27301, "t": 162.53954999999996, "r": 324.98117, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "84-89", "bbox": {"l": 305.27301, "t": 162.53954999999996, "r": 324.98117, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 334.94284, "t": 162.53954999999996, "r": 354.651, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "40-61", "bbox": {"l": 334.94284, "t": 162.53954999999996, "r": 354.651, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 364.61267, "t": 162.53954999999996, "r": 384.32083, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "86-92", "bbox": {"l": 364.61267, "t": 162.53954999999996, "r": 384.32083, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 398.45187, "t": 162.53954999999996, "r": 418.16003, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "94-99", "bbox": {"l": 398.45187, "t": 162.53954999999996, "r": 418.16003, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 428.1217, "t": 162.53954999999996, "r": 447.82986, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "95-99", "bbox": {"l": 428.1217, "t": 162.53954999999996, "r": 447.82986, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 457.80051, "t": 162.53954999999996, "r": 477.50867, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "69-78", "bbox": {"l": 457.80051, "t": 162.53954999999996, "r": 477.50867, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 495.32489, "t": 162.53954999999996, "r": 507.17846999999995, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "n/a", "bbox": {"l": 495.32489, "t": 162.53954999999996, "r": 507.17846999999995, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 104.825, "t": 173.49854000000005, "r": 137.3282, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "Footnote", "bbox": {"l": 104.825, "t": 173.49854000000005, "r": 137.3282, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 182.035, "t": 173.49854000000005, "r": 198.71251, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "6318", "bbox": {"l": 182.035, "t": 173.49854000000005, "r": 198.71251, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 219.211, "t": 173.49854000000005, "r": 233.69174000000004, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "0.60", "bbox": {"l": 219.211, "t": 173.49854000000005, "r": 233.69174000000004, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 250.01956, "t": 173.49854000000005, "r": 264.50031, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "0.31", "bbox": {"l": 250.01956, "t": 173.49854000000005, "r": 264.50031, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 280.82812, "t": 173.49854000000005, "r": 295.30887, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "0.58", "bbox": {"l": 280.82812, "t": 173.49854000000005, "r": 295.30887, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 305.27301, "t": 173.49854000000005, "r": 324.98117, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "83-91", "bbox": {"l": 305.27301, "t": 173.49854000000005, "r": 324.98117, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 342.79739, "t": 173.49854000000005, "r": 354.65097, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "n/a", "bbox": {"l": 342.79739, "t": 173.49854000000005, "r": 354.65097, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 371.81265, "t": 173.49854000000005, "r": 384.32077, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "100", "bbox": {"l": 371.81265, "t": 173.49854000000005, "r": 384.32077, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 398.45181, "t": 173.49854000000005, "r": 418.15997, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "62-88", "bbox": {"l": 398.45181, "t": 173.49854000000005, "r": 418.15997, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 428.12164, "t": 173.49854000000005, "r": 447.8298, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "85-94", "bbox": {"l": 428.12164, "t": 173.49854000000005, "r": 447.8298, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 465.655, "t": 173.49854000000005, "r": 477.50857999999994, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "n/a", "bbox": {"l": 465.655, "t": 173.49854000000005, "r": 477.50857999999994, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 487.47025, "t": 173.49854000000005, "r": 507.17841, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "82-97", "bbox": {"l": 487.47025, "t": 173.49854000000005, "r": 507.17841, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 104.825, "t": 184.45752000000005, "r": 135.33766, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "Formula", "bbox": {"l": 104.825, "t": 184.45752000000005, "r": 135.33766, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 177.866, "t": 184.45752000000005, "r": 198.71288, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "25027", "bbox": {"l": 177.866, "t": 184.45752000000005, "r": 198.71288, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 219.211, "t": 184.45752000000005, "r": 233.69174000000004, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "2.25", "bbox": {"l": 219.211, "t": 184.45752000000005, "r": 233.69174000000004, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 250.01956, "t": 184.45752000000005, "r": 264.50031, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "1.90", "bbox": {"l": 250.01956, "t": 184.45752000000005, "r": 264.50031, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 280.82812, "t": 184.45752000000005, "r": 295.30887, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "2.96", "bbox": {"l": 280.82812, "t": 184.45752000000005, "r": 295.30887, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 305.27301, "t": 184.45752000000005, "r": 324.98117, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "83-85", "bbox": {"l": 305.27301, "t": 184.45752000000005, "r": 324.98117, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 342.79739, "t": 184.45752000000005, "r": 354.65097, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "n/a", "bbox": {"l": 342.79739, "t": 184.45752000000005, "r": 354.65097, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 372.46719, "t": 184.45752000000005, "r": 384.32077, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "n/a", "bbox": {"l": 372.46719, "t": 184.45752000000005, "r": 384.32077, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 398.45181, "t": 184.45752000000005, "r": 418.15997, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "84-87", "bbox": {"l": 398.45181, "t": 184.45752000000005, "r": 418.15997, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 428.12164, "t": 184.45752000000005, "r": 447.8298, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "86-96", "bbox": {"l": 428.12164, "t": 184.45752000000005, "r": 447.8298, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 465.655, "t": 184.45752000000005, "r": 477.50857999999994, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "n/a", "bbox": {"l": 465.655, "t": 184.45752000000005, "r": 477.50857999999994, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 495.3248, "t": 184.45752000000005, "r": 507.17838000000006, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "n/a", "bbox": {"l": 495.3248, "t": 184.45752000000005, "r": 507.17838000000006, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 104.825, "t": 195.41656, "r": 137.70479, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "List-item", "bbox": {"l": 104.825, "t": 195.41656, "r": 137.70479, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 173.69701, "t": 195.41656, "r": 198.71326, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "185660", "bbox": {"l": 173.69701, "t": 195.41656, "r": 198.71326, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 215.04201, "t": 195.41656, "r": 233.69212, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "17.19", "bbox": {"l": 215.04201, "t": 195.41656, "r": 233.69212, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 245.85056, "t": 195.41656, "r": 264.50067, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "13.34", "bbox": {"l": 245.85056, "t": 195.41656, "r": 264.50067, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 276.65912, "t": 195.41656, "r": 295.30923, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "15.82", "bbox": {"l": 276.65912, "t": 195.41656, "r": 295.30923, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 305.27301, "t": 195.41656, "r": 324.98117, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "87-88", "bbox": {"l": 305.27301, "t": 195.41656, "r": 324.98117, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 334.94284, "t": 195.41656, "r": 354.651, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "74-83", "bbox": {"l": 334.94284, "t": 195.41656, "r": 354.651, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 364.61267, "t": 195.41656, "r": 384.32083, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "90-92", "bbox": {"l": 364.61267, "t": 195.41656, "r": 384.32083, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 398.45187, "t": 195.41656, "r": 418.16003, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "97-97", "bbox": {"l": 398.45187, "t": 195.41656, "r": 418.16003, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 428.1217, "t": 195.41656, "r": 447.82986, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "81-85", "bbox": {"l": 428.1217, "t": 195.41656, "r": 447.82986, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 457.80051, "t": 195.41656, "r": 477.50867, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "75-88", "bbox": {"l": 457.80051, "t": 195.41656, "r": 477.50867, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 487.47034, "t": 195.41656, "r": 507.17849999999993, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "93-95", "bbox": {"l": 487.47034, "t": 195.41656, "r": 507.17849999999993, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 104.825, "t": 206.37554999999998, "r": 147.35262, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "Page-footer", "bbox": {"l": 104.825, "t": 206.37554999999998, "r": 147.35262, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 177.866, "t": 206.37554999999998, "r": 198.71288, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "70878", "bbox": {"l": 177.866, "t": 206.37554999999998, "r": 198.71288, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 219.211, "t": 206.37554999999998, "r": 233.69174000000004, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "6.51", "bbox": {"l": 219.211, "t": 206.37554999999998, "r": 233.69174000000004, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 250.01956, "t": 206.37554999999998, "r": 264.50031, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "5.58", "bbox": {"l": 250.01956, "t": 206.37554999999998, "r": 264.50031, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 280.82812, "t": 206.37554999999998, "r": 295.30887, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "6.00", "bbox": {"l": 280.82812, "t": 206.37554999999998, "r": 295.30887, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 305.27301, "t": 206.37554999999998, "r": 324.98117, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "93-94", "bbox": {"l": 305.27301, "t": 206.37554999999998, "r": 324.98117, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 334.94284, "t": 206.37554999999998, "r": 354.651, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "88-90", "bbox": {"l": 334.94284, "t": 206.37554999999998, "r": 354.651, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 364.61267, "t": 206.37554999999998, "r": 384.32083, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "95-96", "bbox": {"l": 364.61267, "t": 206.37554999999998, "r": 384.32083, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 405.65189, "t": 206.37554999999998, "r": 418.16, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "100", "bbox": {"l": 405.65189, "t": 206.37554999999998, "r": 418.16, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 428.12167, "t": 206.37554999999998, "r": 447.82983, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "92-97", "bbox": {"l": 428.12167, "t": 206.37554999999998, "r": 447.82983, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 465.00049, "t": 206.37554999999998, "r": 477.5086099999999, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "100", "bbox": {"l": 465.00049, "t": 206.37554999999998, "r": 477.5086099999999, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 487.47028, "t": 206.37554999999998, "r": 507.17843999999997, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "96-98", "bbox": {"l": 487.47028, "t": 206.37554999999998, "r": 507.17843999999997, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 104.825, "t": 217.33452999999997, "r": 150.10532, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "Page-header", "bbox": {"l": 104.825, "t": 217.33452999999997, "r": 150.10532, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 177.866, "t": 217.33452999999997, "r": 198.71288, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "58022", "bbox": {"l": 177.866, "t": 217.33452999999997, "r": 198.71288, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 219.211, "t": 217.33452999999997, "r": 233.69174000000004, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "5.10", "bbox": {"l": 219.211, "t": 217.33452999999997, "r": 233.69174000000004, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 250.01956, "t": 217.33452999999997, "r": 264.50031, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "6.70", "bbox": {"l": 250.01956, "t": 217.33452999999997, "r": 264.50031, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 280.82812, "t": 217.33452999999997, "r": 295.30887, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "5.06", "bbox": {"l": 280.82812, "t": 217.33452999999997, "r": 295.30887, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 305.27301, "t": 217.33452999999997, "r": 324.98117, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "85-89", "bbox": {"l": 305.27301, "t": 217.33452999999997, "r": 324.98117, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 334.94284, "t": 217.33452999999997, "r": 354.651, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "66-76", "bbox": {"l": 334.94284, "t": 217.33452999999997, "r": 354.651, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 364.61267, "t": 217.33452999999997, "r": 384.32083, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "90-94", "bbox": {"l": 364.61267, "t": 217.33452999999997, "r": 384.32083, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 394.2825, "t": 217.33452999999997, "r": 418.16003, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "98-100", "bbox": {"l": 394.2825, "t": 217.33452999999997, "r": 418.16003, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 428.1217, "t": 217.33452999999997, "r": 447.82986, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "91-92", "bbox": {"l": 428.1217, "t": 217.33452999999997, "r": 447.82986, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 457.80051, "t": 217.33452999999997, "r": 477.50867, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "97-99", "bbox": {"l": 457.80051, "t": 217.33452999999997, "r": 477.50867, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 487.47034, "t": 217.33452999999997, "r": 507.17849999999993, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "81-86", "bbox": {"l": 487.47034, "t": 217.33452999999997, "r": 507.17849999999993, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 104.825, "t": 228.29351999999994, "r": 130.80963, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "Picture", "bbox": {"l": 104.825, "t": 228.29351999999994, "r": 130.80963, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 177.866, "t": 228.29351999999994, "r": 198.71288, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "45976", "bbox": {"l": 177.866, "t": 228.29351999999994, "r": 198.71288, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 219.211, "t": 228.29351999999994, "r": 233.69174000000004, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "4.21", "bbox": {"l": 219.211, "t": 228.29351999999994, "r": 233.69174000000004, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 250.01956, "t": 228.29351999999994, "r": 264.50031, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "2.78", "bbox": {"l": 250.01956, "t": 228.29351999999994, "r": 264.50031, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 280.82812, "t": 228.29351999999994, "r": 295.30887, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "5.31", "bbox": {"l": 280.82812, "t": 228.29351999999994, "r": 295.30887, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 305.27301, "t": 228.29351999999994, "r": 324.98117, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "69-71", "bbox": {"l": 305.27301, "t": 228.29351999999994, "r": 324.98117, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 334.94284, "t": 228.29351999999994, "r": 354.651, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "56-59", "bbox": {"l": 334.94284, "t": 228.29351999999994, "r": 354.651, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 364.61267, "t": 228.29351999999994, "r": 384.32083, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "82-86", "bbox": {"l": 364.61267, "t": 228.29351999999994, "r": 384.32083, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 398.45187, "t": 228.29351999999994, "r": 418.16003, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "69-82", "bbox": {"l": 398.45187, "t": 228.29351999999994, "r": 418.16003, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 428.1217, "t": 228.29351999999994, "r": 447.82986, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "80-95", "bbox": {"l": 428.1217, "t": 228.29351999999994, "r": 447.82986, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 457.80051, "t": 228.29351999999994, "r": 477.50867, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "66-71", "bbox": {"l": 457.80051, "t": 228.29351999999994, "r": 477.50867, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 487.47034, "t": 228.29351999999994, "r": 507.17849999999993, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "59-76", "bbox": {"l": 487.47034, "t": 228.29351999999994, "r": 507.17849999999993, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 104.825, "t": 239.25256000000002, "r": 159.56487, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": "Section-header", "bbox": {"l": 104.825, "t": 239.25256000000002, "r": 159.56487, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 173.69701, "t": 239.25256000000002, "r": 198.71326, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "142884", "bbox": {"l": 173.69701, "t": 239.25256000000002, "r": 198.71326, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 215.04201, "t": 239.25256000000002, "r": 233.69212, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "12.60", "bbox": {"l": 215.04201, "t": 239.25256000000002, "r": 233.69212, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 245.85056, "t": 239.25256000000002, "r": 264.50067, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": "15.77", "bbox": {"l": 245.85056, "t": 239.25256000000002, "r": 264.50067, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 276.65912, "t": 239.25256000000002, "r": 295.30923, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 107, "text": "12.85", "bbox": {"l": 276.65912, "t": 239.25256000000002, "r": 295.30923, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 114, "label": "text", "bbox": {"l": 305.27301, "t": 239.25256000000002, "r": 324.98117, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 108, "text": "83-84", "bbox": {"l": 305.27301, "t": 239.25256000000002, "r": 324.98117, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 115, "label": "text", "bbox": {"l": 334.94284, "t": 239.25256000000002, "r": 354.651, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 109, "text": "76-81", "bbox": {"l": 334.94284, "t": 239.25256000000002, "r": 354.651, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 116, "label": "text", "bbox": {"l": 364.61267, "t": 239.25256000000002, "r": 384.32083, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 110, "text": "90-92", "bbox": {"l": 364.61267, "t": 239.25256000000002, "r": 384.32083, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 117, "label": "text", "bbox": {"l": 398.45187, "t": 239.25256000000002, "r": 418.16003, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 111, "text": "94-95", "bbox": {"l": 398.45187, "t": 239.25256000000002, "r": 418.16003, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 118, "label": "text", "bbox": {"l": 428.1217, "t": 239.25256000000002, "r": 447.82986, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 112, "text": "87-94", "bbox": {"l": 428.1217, "t": 239.25256000000002, "r": 447.82986, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 119, "label": "text", "bbox": {"l": 457.80051, "t": 239.25256000000002, "r": 477.50867, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 113, "text": "69-73", "bbox": {"l": 457.80051, "t": 239.25256000000002, "r": 477.50867, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 120, "label": "text", "bbox": {"l": 487.47034, "t": 239.25256000000002, "r": 507.17849999999993, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 114, "text": "78-86", "bbox": {"l": 487.47034, "t": 239.25256000000002, "r": 507.17849999999993, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 121, "label": "text", "bbox": {"l": 104.825, "t": 250.21155, "r": 124.63177, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 115, "text": "Table", "bbox": {"l": 104.825, "t": 250.21155, "r": 124.63177, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 122, "label": "text", "bbox": {"l": 177.866, "t": 250.21155, "r": 198.71288, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 116, "text": "34733", "bbox": {"l": 177.866, "t": 250.21155, "r": 198.71288, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 123, "label": "text", "bbox": {"l": 219.211, "t": 250.21155, "r": 233.69174000000004, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 117, "text": "3.20", "bbox": {"l": 219.211, "t": 250.21155, "r": 233.69174000000004, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 124, "label": "text", "bbox": {"l": 250.01956, "t": 250.21155, "r": 264.50031, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 118, "text": "2.27", "bbox": {"l": 250.01956, "t": 250.21155, "r": 264.50031, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 125, "label": "text", "bbox": {"l": 280.82812, "t": 250.21155, "r": 295.30887, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 119, "text": "3.60", "bbox": {"l": 280.82812, "t": 250.21155, "r": 295.30887, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 126, "label": "text", "bbox": {"l": 305.27301, "t": 250.21155, "r": 324.98117, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 120, "text": "77-81", "bbox": {"l": 305.27301, "t": 250.21155, "r": 324.98117, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 127, "label": "text", "bbox": {"l": 334.94284, "t": 250.21155, "r": 354.651, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 121, "text": "75-80", "bbox": {"l": 334.94284, "t": 250.21155, "r": 354.651, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 128, "label": "text", "bbox": {"l": 364.61267, "t": 250.21155, "r": 384.32083, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 122, "text": "83-86", "bbox": {"l": 364.61267, "t": 250.21155, "r": 384.32083, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 129, "label": "text", "bbox": {"l": 398.45187, "t": 250.21155, "r": 418.16003, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 123, "text": "98-99", "bbox": {"l": 398.45187, "t": 250.21155, "r": 418.16003, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 130, "label": "text", "bbox": {"l": 428.1217, "t": 250.21155, "r": 447.82986, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 124, "text": "58-80", "bbox": {"l": 428.1217, "t": 250.21155, "r": 447.82986, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 131, "label": "text", "bbox": {"l": 457.80051, "t": 250.21155, "r": 477.50867, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 125, "text": "79-84", "bbox": {"l": 457.80051, "t": 250.21155, "r": 477.50867, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 132, "label": "text", "bbox": {"l": 487.47034, "t": 250.21155, "r": 507.17849999999993, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 126, "text": "70-85", "bbox": {"l": 487.47034, "t": 250.21155, "r": 507.17849999999993, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 133, "label": "text", "bbox": {"l": 104.825, "t": 261.16956000000005, "r": 120.78519, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 127, "text": "Text", "bbox": {"l": 104.825, "t": 261.16956000000005, "r": 120.78519, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 134, "label": "text", "bbox": {"l": 173.69701, "t": 261.16956000000005, "r": 198.71326, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 128, "text": "510377", "bbox": {"l": 173.69701, "t": 261.16956000000005, "r": 198.71326, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 135, "label": "text", "bbox": {"l": 215.04201, "t": 261.16956000000005, "r": 233.69212, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 129, "text": "45.82", "bbox": {"l": 215.04201, "t": 261.16956000000005, "r": 233.69212, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 136, "label": "text", "bbox": {"l": 245.85056, "t": 261.16956000000005, "r": 264.50067, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 130, "text": "49.28", "bbox": {"l": 245.85056, "t": 261.16956000000005, "r": 264.50067, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 137, "label": "text", "bbox": {"l": 276.65912, "t": 261.16956000000005, "r": 295.30923, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 131, "text": "45.00", "bbox": {"l": 276.65912, "t": 261.16956000000005, "r": 295.30923, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 138, "label": "text", "bbox": {"l": 305.27301, "t": 261.16956000000005, "r": 324.98117, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 132, "text": "84-86", "bbox": {"l": 305.27301, "t": 261.16956000000005, "r": 324.98117, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 139, "label": "text", "bbox": {"l": 334.94284, "t": 261.16956000000005, "r": 354.651, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 133, "text": "81-86", "bbox": {"l": 334.94284, "t": 261.16956000000005, "r": 354.651, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 140, "label": "text", "bbox": {"l": 364.61267, "t": 261.16956000000005, "r": 384.32083, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 134, "text": "88-93", "bbox": {"l": 364.61267, "t": 261.16956000000005, "r": 384.32083, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 141, "label": "text", "bbox": {"l": 398.45187, "t": 261.16956000000005, "r": 418.16003, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 135, "text": "89-93", "bbox": {"l": 398.45187, "t": 261.16956000000005, "r": 418.16003, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 142, "label": "text", "bbox": {"l": 428.1217, "t": 261.16956000000005, "r": 447.82986, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 136, "text": "87-92", "bbox": {"l": 428.1217, "t": 261.16956000000005, "r": 447.82986, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 143, "label": "text", "bbox": {"l": 457.80051, "t": 261.16956000000005, "r": 477.50867, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 137, "text": "71-79", "bbox": {"l": 457.80051, "t": 261.16956000000005, "r": 477.50867, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 144, "label": "text", "bbox": {"l": 487.47034, "t": 261.16956000000005, "r": 507.17849999999993, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 138, "text": "87-95", "bbox": {"l": 487.47034, "t": 261.16956000000005, "r": 507.17849999999993, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 145, "label": "text", "bbox": {"l": 104.825, "t": 272.12854000000004, "r": 121.81633, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 139, "text": "Title", "bbox": {"l": 104.825, "t": 272.12854000000004, "r": 121.81633, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 146, "label": "text", "bbox": {"l": 182.035, "t": 272.12854000000004, "r": 198.71251, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 140, "text": "5071", "bbox": {"l": 182.035, "t": 272.12854000000004, "r": 198.71251, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 147, "label": "text", "bbox": {"l": 219.211, "t": 272.12854000000004, "r": 233.69174000000004, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 141, "text": "0.47", "bbox": {"l": 219.211, "t": 272.12854000000004, "r": 233.69174000000004, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 148, "label": "text", "bbox": {"l": 250.01956, "t": 272.12854000000004, "r": 264.50031, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 142, "text": "0.30", "bbox": {"l": 250.01956, "t": 272.12854000000004, "r": 264.50031, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 149, "label": "text", "bbox": {"l": 280.82812, "t": 272.12854000000004, "r": 295.30887, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 143, "text": "0.50", "bbox": {"l": 280.82812, "t": 272.12854000000004, "r": 295.30887, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 150, "label": "text", "bbox": {"l": 305.27301, "t": 272.12854000000004, "r": 324.98117, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 144, "text": "60-72", "bbox": {"l": 305.27301, "t": 272.12854000000004, "r": 324.98117, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 151, "label": "text", "bbox": {"l": 334.94284, "t": 272.12854000000004, "r": 354.651, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 145, "text": "24-63", "bbox": {"l": 334.94284, "t": 272.12854000000004, "r": 354.651, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 152, "label": "text", "bbox": {"l": 364.61267, "t": 272.12854000000004, "r": 384.32083, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 146, "text": "50-63", "bbox": {"l": 364.61267, "t": 272.12854000000004, "r": 384.32083, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 153, "label": "text", "bbox": {"l": 394.2825, "t": 272.12854000000004, "r": 418.16003, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 147, "text": "94-100", "bbox": {"l": 394.2825, "t": 272.12854000000004, "r": 418.16003, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 154, "label": "text", "bbox": {"l": 428.1217, "t": 272.12854000000004, "r": 447.82986, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 148, "text": "82-96", "bbox": {"l": 428.1217, "t": 272.12854000000004, "r": 447.82986, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 155, "label": "text", "bbox": {"l": 457.80051, "t": 272.12854000000004, "r": 477.50867, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 149, "text": "68-79", "bbox": {"l": 457.80051, "t": 272.12854000000004, "r": 477.50867, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 156, "label": "text", "bbox": {"l": 487.47034, "t": 272.12854000000004, "r": 507.17849999999993, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 150, "text": "24-56", "bbox": {"l": 487.47034, "t": 272.12854000000004, "r": 507.17849999999993, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 157, "label": "text", "bbox": {"l": 104.825, "t": 283.48654, "r": 123.43028, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 151, "text": "Total", "bbox": {"l": 104.825, "t": 283.48654, "r": 123.43028, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 158, "label": "text", "bbox": {"l": 169.52699, "t": 283.48654, "r": 198.71263, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 152, "text": "1107470", "bbox": {"l": 169.52699, "t": 283.48654, "r": 198.71263, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 159, "label": "text", "bbox": {"l": 208.675, "t": 283.48654, "r": 233.69124999999997, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 153, "text": "941123", "bbox": {"l": 208.675, "t": 283.48654, "r": 233.69124999999997, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 160, "label": "text", "bbox": {"l": 243.65291999999997, "t": 283.48654, "r": 264.49982, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 154, "text": "99816", "bbox": {"l": 243.65291999999997, "t": 283.48654, "r": 264.49982, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 161, "label": "text", "bbox": {"l": 274.46149, "t": 283.48654, "r": 295.30838, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 155, "text": "66531", "bbox": {"l": 274.46149, "t": 283.48654, "r": 295.30838, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 162, "label": "text", "bbox": {"l": 305.27301, "t": 283.48654, "r": 324.98117, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 156, "text": "82-83", "bbox": {"l": 305.27301, "t": 283.48654, "r": 324.98117, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 163, "label": "text", "bbox": {"l": 334.94284, "t": 283.48654, "r": 354.651, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 157, "text": "71-74", "bbox": {"l": 334.94284, "t": 283.48654, "r": 354.651, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 164, "label": "text", "bbox": {"l": 364.61267, "t": 283.48654, "r": 384.32083, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 158, "text": "79-81", "bbox": {"l": 364.61267, "t": 283.48654, "r": 384.32083, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 165, "label": "text", "bbox": {"l": 398.45187, "t": 283.48654, "r": 418.16003, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 159, "text": "89-94", "bbox": {"l": 398.45187, "t": 283.48654, "r": 418.16003, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 166, "label": "text", "bbox": {"l": 428.1217, "t": 283.48654, "r": 447.82986, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 160, "text": "86-91", "bbox": {"l": 428.1217, "t": 283.48654, "r": 447.82986, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 167, "label": "text", "bbox": {"l": 457.80051, "t": 283.48654, "r": 477.50867, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 161, "text": "71-76", "bbox": {"l": 457.80051, "t": 283.48654, "r": 477.50867, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 168, "label": "text", "bbox": {"l": 487.47034, "t": 283.48654, "r": 507.17849999999993, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 162, "text": "68-85", "bbox": {"l": 487.47034, "t": 283.48654, "r": 507.17849999999993, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 9, "label": "caption", "bbox": {"l": 53.79800000000001, "t": 554.00999, "r": 295.64874, "b": 606.31924, "coord_origin": "TOPLEFT"}, "confidence": 0.810490071773529, "cells": [{"id": 163, "text": "Figure 3: Corpus Conversion Service annotation user inter-", "bbox": {"l": 53.79800000000001, "t": 554.00999, "r": 295.64871, "b": 562.48325, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "face. The PDF page is shown in the background, with over-", "bbox": {"l": 53.79800000000001, "t": 564.96899, "r": 295.64874, "b": 573.44225, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "laid text-cells (in darker shades). The annotation boxes can", "bbox": {"l": 53.79800000000001, "t": 575.92799, "r": 294.04376, "b": 584.40125, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "be drawn by dragging a rectangle over each segment with", "bbox": {"l": 53.79800000000001, "t": 586.88699, "r": 294.04373, "b": 595.36024, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "the respective label from the palette on the right.", "bbox": {"l": 53.79800000000001, "t": 597.84599, "r": 252.78931000000003, "b": 606.31924, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "text", "bbox": {"l": 53.466999, "t": 634.29155, "r": 294.04745, "b": 675.54317, "coord_origin": "TOPLEFT"}, "confidence": 0.980393648147583, "cells": [{"id": 168, "text": "we distributed the annotation workload and performed continuous", "bbox": {"l": 53.466999, "t": 634.29155, "r": 294.04745, "b": 642.66617, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "quality controls. Phase one and two required a small team of experts", "bbox": {"l": 53.79800000000001, "t": 645.25055, "r": 294.04535, "b": 653.62517, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "only. For phases three and four, a group of 40 dedicated annotators", "bbox": {"l": 53.79800000000001, "t": 656.20955, "r": 294.04422, "b": 664.58417, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "were assembled and supervised.", "bbox": {"l": 53.466999, "t": 667.16856, "r": 170.58611, "b": 675.54317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "text", "bbox": {"l": 53.79800000000001, "t": 678.01099, "r": 295.55844, "b": 708.420174, "coord_origin": "TOPLEFT"}, "confidence": 0.9748398661613464, "cells": [{"id": 172, "text": "Phase 1: Data selection and preparation.", "bbox": {"l": 63.76099800000001, "t": 678.01099, "r": 226.72533000000004, "b": 686.48424, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "Our inclusion cri-", "bbox": {"l": 229.06900000000002, "t": 678.12756, "r": 295.55844, "b": 686.50217, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "teria for documents were described in Section 3. A large effort went", "bbox": {"l": 53.79800000000001, "t": 689.08656, "r": 294.04538, "b": 697.461174, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "into ensuring that all documents are free to use. The data sources", "bbox": {"l": 53.79800000000001, "t": 700.045555, "r": 294.04642, "b": 708.420174, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "text", "bbox": {"l": 317.95499, "t": 312.07953, "r": 559.18536, "b": 375.24817, "coord_origin": "TOPLEFT"}, "confidence": 0.9818483591079712, "cells": [{"id": 176, "text": "include publication repositories such as arXiv$^{3}$, government offices,", "bbox": {"l": 317.95499, "t": 312.07953, "r": 559.18536, "b": 320.45416000000006, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "company websites as well as data directory services for financial", "bbox": {"l": 317.95499, "t": 323.03754, "r": 558.19843, "b": 331.41217, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "reports and patents. Scanned documents were excluded wherever", "bbox": {"l": 317.95499, "t": 333.99655, "r": 558.36963, "b": 342.37119, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "possible because they can be rotated or skewed. This would not", "bbox": {"l": 317.95499, "t": 344.95554, "r": 558.2041, "b": 353.33017, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "allow us to perform annotation with rectangular bounding-boxes", "bbox": {"l": 317.95499, "t": 355.91455, "r": 558.20294, "b": 364.28918, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "and therefore complicate the annotation process.", "bbox": {"l": 317.95499, "t": 366.87354, "r": 496.71826, "b": 375.24817, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 317.95499, "t": 377.8325500000001, "r": 559.71307, "b": 506.75516, "coord_origin": "TOPLEFT"}, "confidence": 0.9866719841957092, "cells": [{"id": 182, "text": "Preparation work included uploading and parsing the sourced", "bbox": {"l": 327.918, "t": 377.8325500000001, "r": 558.20618, "b": 386.20717999999994, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "PDF documents in the Corpus Conversion Service (CCS) [22], a", "bbox": {"l": 317.95499, "t": 388.79153, "r": 558.2019, "b": 397.16617, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "cloud-native platform which provides a visual annotation interface", "bbox": {"l": 317.95499, "t": 399.75055, "r": 558.20233, "b": 408.12518, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": "and allows for dataset inspection and analysis. The annotation in-", "bbox": {"l": 317.95499, "t": 410.7095299999999, "r": 559.71277, "b": 419.08417, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "terface of CCS is shown in Figure 3. The desired balance of pages", "bbox": {"l": 317.95499, "t": 421.66855000000004, "r": 558.20062, "b": 430.04318, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "between the different document categories was achieved by se-", "bbox": {"l": 317.95499, "t": 432.62753, "r": 559.71307, "b": 441.00217, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": "lective subsampling of pages with certain desired properties. For", "bbox": {"l": 317.95499, "t": 443.58554, "r": 558.36877, "b": 451.96017, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "example, we made sure to include the title page of each document", "bbox": {"l": 317.95499, "t": 454.54453, "r": 558.20428, "b": 462.91916, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "and bias the remaining page selection to those with figures or", "bbox": {"l": 317.95499, "t": 465.50354, "r": 558.36877, "b": 473.87817, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "tables. The latter was achieved by leveraging pre-trained object", "bbox": {"l": 317.95499, "t": 476.46252, "r": 558.20428, "b": 484.83716, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": "detection models from PubLayNet, which helped us estimate how", "bbox": {"l": 317.95499, "t": 487.42154, "r": 558.5307, "b": 495.79617, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "many figures and tables a given page contains.", "bbox": {"l": 317.95499, "t": 498.38052, "r": 488.46914999999996, "b": 506.75516, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 317.62299, "t": 509.22299, "r": 559.71765, "b": 693.0561749999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9847556948661804, "cells": [{"id": 194, "text": "Phase 2: Label selection and guideline.", "bbox": {"l": 327.918, "t": 509.22299, "r": 482.41809, "b": 517.69623, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "We reviewed the col-", "bbox": {"l": 484.474, "t": 509.33954, "r": 559.71765, "b": 517.71417, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "lected documents and identified the most common structural fea-", "bbox": {"l": 317.95499, "t": 520.29855, "r": 559.71619, "b": 528.67319, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "tures they exhibit. This was achieved by identifying recurrent layout", "bbox": {"l": 317.95499, "t": 531.2575400000001, "r": 558.20239, "b": 539.63217, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "elements and lead us to the definition of 11 distinct class labels.", "bbox": {"l": 317.95499, "t": 542.21655, "r": 559.58502, "b": 550.59117, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "These 11 class labels are", "bbox": {"l": 317.686, "t": 553.17456, "r": 404.14197, "b": 561.54918, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "Caption", "bbox": {"l": 406.26599, "t": 553.21939, "r": 433.84860000000003, "b": 561.5581500000001, "coord_origin": "TOPLEFT"}}, {"id": 201, "text": ",", "bbox": {"l": 433.84799, "t": 553.17456, "r": 435.78115999999994, "b": 561.54918, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": "Footnote", "bbox": {"l": 437.9079899999999, "t": 553.21939, "r": 467.23926, "b": 561.5581500000001, "coord_origin": "TOPLEFT"}}, {"id": 203, "text": ",", "bbox": {"l": 467.23999, "t": 553.17456, "r": 469.17316000000005, "b": 561.54918, "coord_origin": "TOPLEFT"}}, {"id": 204, "text": "Formula", "bbox": {"l": 471.29900999999995, "t": 553.21939, "r": 500.44574000000006, "b": 561.5581500000001, "coord_origin": "TOPLEFT"}}, {"id": 205, "text": ",", "bbox": {"l": 500.44601000000006, "t": 553.17456, "r": 502.37918, "b": 561.54918, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": "List-item", "bbox": {"l": 504.505, "t": 553.21939, "r": 535.74304, "b": 561.5581500000001, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": ",", "bbox": {"l": 535.74298, "t": 553.17456, "r": 537.67615, "b": 561.54918, "coord_origin": "TOPLEFT"}}, {"id": 208, "text": "Page-", "bbox": {"l": 539.802, "t": 553.21939, "r": 559.09839, "b": 561.5581500000001, "coord_origin": "TOPLEFT"}}, {"id": 209, "text": "footer", "bbox": {"l": 317.95499, "t": 564.17839, "r": 338.80725, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": ",", "bbox": {"l": 338.806, "t": 564.13356, "r": 340.81805, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "Page-header", "bbox": {"l": 343.61401, "t": 564.17839, "r": 387.96164, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 212, "text": ",", "bbox": {"l": 387.961, "t": 564.13356, "r": 389.97305, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "Picture", "bbox": {"l": 392.76901, "t": 564.17839, "r": 417.84662, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 214, "text": ",", "bbox": {"l": 417.84799, "t": 564.13356, "r": 419.86005, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 215, "text": "Section-header", "bbox": {"l": 422.655, "t": 564.17839, "r": 475.56305, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 216, "text": ",", "bbox": {"l": 475.56201, "t": 564.13356, "r": 477.57407, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 217, "text": "Table", "bbox": {"l": 480.36899, "t": 564.17839, "r": 499.82196, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 218, "text": ",", "bbox": {"l": 499.8219900000001, "t": 564.13356, "r": 501.83405, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 219, "text": "Text", "bbox": {"l": 504.6290000000001, "t": 564.17839, "r": 519.7926, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 220, "text": ", and", "bbox": {"l": 519.79602, "t": 564.13356, "r": 538.37103, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 221, "text": "Title", "bbox": {"l": 541.16302, "t": 564.17839, "r": 557.57043, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 222, "text": ".", "bbox": {"l": 557.57098, "t": 564.13356, "r": 559.58307, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 223, "text": "Critical factors that were considered for the choice of these class", "bbox": {"l": 317.95499, "t": 575.09256, "r": 558.20416, "b": 583.46718, "coord_origin": "TOPLEFT"}}, {"id": 224, "text": "labels were (1) the overall occurrence of the label, (2) the specificity", "bbox": {"l": 317.95499, "t": 586.05156, "r": 558.43091, "b": 594.4261799999999, "coord_origin": "TOPLEFT"}}, {"id": 225, "text": "of the label, (3) recognisability on a single page (i.e. no need for", "bbox": {"l": 317.95499, "t": 597.0105599999999, "r": 558.36871, "b": 605.38518, "coord_origin": "TOPLEFT"}}, {"id": 226, "text": "context from previous or next page) and (4) overall coverage of the", "bbox": {"l": 317.95499, "t": 607.96956, "r": 558.20105, "b": 616.3441799999999, "coord_origin": "TOPLEFT"}}, {"id": 227, "text": "page. Specificity ensures that the choice of label is not ambiguous,", "bbox": {"l": 317.95499, "t": 618.9285600000001, "r": 559.18665, "b": 627.30318, "coord_origin": "TOPLEFT"}}, {"id": 228, "text": "while coverage ensures that all meaningful items on a page can", "bbox": {"l": 317.62299, "t": 629.88756, "r": 558.20142, "b": 638.26218, "coord_origin": "TOPLEFT"}}, {"id": 229, "text": "be annotated. We refrained from class labels that are very specific", "bbox": {"l": 317.95499, "t": 640.84656, "r": 558.20227, "b": 649.22118, "coord_origin": "TOPLEFT"}}, {"id": 230, "text": "to a document category, such as", "bbox": {"l": 317.95499, "t": 651.80556, "r": 436.90649, "b": 660.1801800000001, "coord_origin": "TOPLEFT"}}, {"id": 231, "text": "Abstract", "bbox": {"l": 439.13800000000003, "t": 651.8503900000001, "r": 469.69134999999994, "b": 660.18915, "coord_origin": "TOPLEFT"}}, {"id": 232, "text": "in the", "bbox": {"l": 472.42898999999994, "t": 651.80556, "r": 493.97348, "b": 660.1801800000001, "coord_origin": "TOPLEFT"}}, {"id": 233, "text": "Scientific Articles", "bbox": {"l": 496.207, "t": 651.8503900000001, "r": 558.20001, "b": 660.18915, "coord_origin": "TOPLEFT"}}, {"id": 234, "text": "category. We also avoided class labels that are tightly linked to the", "bbox": {"l": 317.95499, "t": 662.76456, "r": 558.20557, "b": 671.13918, "coord_origin": "TOPLEFT"}}, {"id": 235, "text": "semantics of the text. Labels such as", "bbox": {"l": 317.95499, "t": 673.7225599999999, "r": 447.65221999999994, "b": 682.09718, "coord_origin": "TOPLEFT"}}, {"id": 236, "text": "Author", "bbox": {"l": 449.85999, "t": 673.76739, "r": 474.31439, "b": 682.10614, "coord_origin": "TOPLEFT"}}, {"id": 237, "text": "and", "bbox": {"l": 477.172, "t": 673.7225599999999, "r": 490.39655, "b": 682.09718, "coord_origin": "TOPLEFT"}}, {"id": 238, "text": "Affiliation", "bbox": {"l": 492.60599, "t": 673.76739, "r": 528.29907, "b": 682.10614, "coord_origin": "TOPLEFT"}}, {"id": 239, "text": ", as seen", "bbox": {"l": 528.29901, "t": 673.7225599999999, "r": 558.20148, "b": 682.09718, "coord_origin": "TOPLEFT"}}, {"id": 240, "text": "in DocBank, are often only distinguishable by discriminating on", "bbox": {"l": 317.95499, "t": 684.68156, "r": 558.2041, "b": 693.0561749999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "footnote", "bbox": {"l": 317.95499, "t": 702.353363, "r": 369.2457, "b": 708.86689, "coord_origin": "TOPLEFT"}, "confidence": 0.9080352783203125, "cells": [{"id": 241, "text": "$^{3}$https://arxiv.org/", "bbox": {"l": 317.95499, "t": 702.353363, "r": 369.2457, "b": 708.86689, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "picture", "bbox": {"l": 53.05912780761719, "t": 310.7912902832031, "r": 295.8506164550781, "b": 540.864013671875, "coord_origin": "TOPLEFT"}, "confidence": 0.9847871661186218, "cells": [], "children": []}]}, "tablestructure": {"table_map": {"1": {"label": "table", "id": 1, "page_no": 3, "cluster": {"id": 1, "label": "table", "bbox": {"l": 98.93103790283203, "t": 137.47547912597656, "r": 512.579833984375, "b": 294.08148193359375, "coord_origin": "TOPLEFT"}, "confidence": 0.9860090613365173, "cells": [{"id": 5, "text": "% of Total", "bbox": {"l": 233.94400000000002, "t": 140.22351000000003, "r": 270.04272, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "triple inter-annotator mAP @ 0.5-0.95 (%)", "bbox": {"l": 329.04999, "t": 140.22351000000003, "r": 483.3976400000001, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "class label", "bbox": {"l": 104.825, "t": 151.18255999999997, "r": 141.71277, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Count", "bbox": {"l": 175.94701, "t": 151.18255999999997, "r": 198.71269, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Train", "bbox": {"l": 213.795, "t": 151.18255999999997, "r": 233.69144, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Test", "bbox": {"l": 249.37367, "t": 151.18255999999997, "r": 264.5, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Val", "bbox": {"l": 283.53568, "t": 151.18255999999997, "r": 295.30856, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "All", "bbox": {"l": 314.01501, "t": 151.18255999999997, "r": 324.98093, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Fin", "bbox": {"l": 343.01236, "t": 151.18255999999997, "r": 354.65076, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Man", "bbox": {"l": 367.84033, "t": 151.18255999999997, "r": 384.32059, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Sci", "bbox": {"l": 407.54358, "t": 151.18255999999997, "r": 418.15979, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Law", "bbox": {"l": 432.29979999999995, "t": 151.18255999999997, "r": 447.82962, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "Pat", "bbox": {"l": 465.72656, "t": 151.18255999999997, "r": 477.50842, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Ten", "bbox": {"l": 493.52240000000006, "t": 151.18255999999997, "r": 507.17822, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Caption", "bbox": {"l": 104.825, "t": 162.53954999999996, "r": 134.01064, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "22524", "bbox": {"l": 177.866, "t": 162.53954999999996, "r": 198.71288, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "2.04", "bbox": {"l": 219.211, "t": 162.53954999999996, "r": 233.69174000000004, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "1.77", "bbox": {"l": 250.01956, "t": 162.53954999999996, "r": 264.50031, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "2.32", "bbox": {"l": 280.82812, "t": 162.53954999999996, "r": 295.30887, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "84-89", "bbox": {"l": 305.27301, "t": 162.53954999999996, "r": 324.98117, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "40-61", "bbox": {"l": 334.94284, "t": 162.53954999999996, "r": 354.651, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "86-92", "bbox": {"l": 364.61267, "t": 162.53954999999996, "r": 384.32083, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "94-99", "bbox": {"l": 398.45187, "t": 162.53954999999996, "r": 418.16003, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "95-99", "bbox": {"l": 428.1217, "t": 162.53954999999996, "r": 447.82986, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "69-78", "bbox": {"l": 457.80051, "t": 162.53954999999996, "r": 477.50867, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "n/a", "bbox": {"l": 495.32489, "t": 162.53954999999996, "r": 507.17846999999995, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Footnote", "bbox": {"l": 104.825, "t": 173.49854000000005, "r": 137.3282, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "6318", "bbox": {"l": 182.035, "t": 173.49854000000005, "r": 198.71251, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "0.60", "bbox": {"l": 219.211, "t": 173.49854000000005, "r": 233.69174000000004, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "0.31", "bbox": {"l": 250.01956, "t": 173.49854000000005, "r": 264.50031, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "0.58", "bbox": {"l": 280.82812, "t": 173.49854000000005, "r": 295.30887, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "83-91", "bbox": {"l": 305.27301, "t": 173.49854000000005, "r": 324.98117, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "n/a", "bbox": {"l": 342.79739, "t": 173.49854000000005, "r": 354.65097, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "100", "bbox": {"l": 371.81265, "t": 173.49854000000005, "r": 384.32077, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "62-88", "bbox": {"l": 398.45181, "t": 173.49854000000005, "r": 418.15997, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "85-94", "bbox": {"l": 428.12164, "t": 173.49854000000005, "r": 447.8298, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "n/a", "bbox": {"l": 465.655, "t": 173.49854000000005, "r": 477.50857999999994, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "82-97", "bbox": {"l": 487.47025, "t": 173.49854000000005, "r": 507.17841, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Formula", "bbox": {"l": 104.825, "t": 184.45752000000005, "r": 135.33766, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "25027", "bbox": {"l": 177.866, "t": 184.45752000000005, "r": 198.71288, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "2.25", "bbox": {"l": 219.211, "t": 184.45752000000005, "r": 233.69174000000004, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "1.90", "bbox": {"l": 250.01956, "t": 184.45752000000005, "r": 264.50031, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "2.96", "bbox": {"l": 280.82812, "t": 184.45752000000005, "r": 295.30887, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "83-85", "bbox": {"l": 305.27301, "t": 184.45752000000005, "r": 324.98117, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "n/a", "bbox": {"l": 342.79739, "t": 184.45752000000005, "r": 354.65097, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "n/a", "bbox": {"l": 372.46719, "t": 184.45752000000005, "r": 384.32077, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "84-87", "bbox": {"l": 398.45181, "t": 184.45752000000005, "r": 418.15997, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "86-96", "bbox": {"l": 428.12164, "t": 184.45752000000005, "r": 447.8298, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "n/a", "bbox": {"l": 465.655, "t": 184.45752000000005, "r": 477.50857999999994, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "n/a", "bbox": {"l": 495.3248, "t": 184.45752000000005, "r": 507.17838000000006, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "List-item", "bbox": {"l": 104.825, "t": 195.41656, "r": 137.70479, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "185660", "bbox": {"l": 173.69701, "t": 195.41656, "r": 198.71326, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "17.19", "bbox": {"l": 215.04201, "t": 195.41656, "r": 233.69212, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "13.34", "bbox": {"l": 245.85056, "t": 195.41656, "r": 264.50067, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "15.82", "bbox": {"l": 276.65912, "t": 195.41656, "r": 295.30923, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "87-88", "bbox": {"l": 305.27301, "t": 195.41656, "r": 324.98117, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "74-83", "bbox": {"l": 334.94284, "t": 195.41656, "r": 354.651, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "90-92", "bbox": {"l": 364.61267, "t": 195.41656, "r": 384.32083, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "97-97", "bbox": {"l": 398.45187, "t": 195.41656, "r": 418.16003, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "81-85", "bbox": {"l": 428.1217, "t": 195.41656, "r": 447.82986, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "75-88", "bbox": {"l": 457.80051, "t": 195.41656, "r": 477.50867, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "93-95", "bbox": {"l": 487.47034, "t": 195.41656, "r": 507.17849999999993, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "Page-footer", "bbox": {"l": 104.825, "t": 206.37554999999998, "r": 147.35262, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "70878", "bbox": {"l": 177.866, "t": 206.37554999999998, "r": 198.71288, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "6.51", "bbox": {"l": 219.211, "t": 206.37554999999998, "r": 233.69174000000004, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "5.58", "bbox": {"l": 250.01956, "t": 206.37554999999998, "r": 264.50031, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "6.00", "bbox": {"l": 280.82812, "t": 206.37554999999998, "r": 295.30887, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "93-94", "bbox": {"l": 305.27301, "t": 206.37554999999998, "r": 324.98117, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "88-90", "bbox": {"l": 334.94284, "t": 206.37554999999998, "r": 354.651, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "95-96", "bbox": {"l": 364.61267, "t": 206.37554999999998, "r": 384.32083, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "100", "bbox": {"l": 405.65189, "t": 206.37554999999998, "r": 418.16, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "92-97", "bbox": {"l": 428.12167, "t": 206.37554999999998, "r": 447.82983, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "100", "bbox": {"l": 465.00049, "t": 206.37554999999998, "r": 477.5086099999999, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "96-98", "bbox": {"l": 487.47028, "t": 206.37554999999998, "r": 507.17843999999997, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "Page-header", "bbox": {"l": 104.825, "t": 217.33452999999997, "r": 150.10532, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "58022", "bbox": {"l": 177.866, "t": 217.33452999999997, "r": 198.71288, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "5.10", "bbox": {"l": 219.211, "t": 217.33452999999997, "r": 233.69174000000004, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "6.70", "bbox": {"l": 250.01956, "t": 217.33452999999997, "r": 264.50031, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "5.06", "bbox": {"l": 280.82812, "t": 217.33452999999997, "r": 295.30887, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "85-89", "bbox": {"l": 305.27301, "t": 217.33452999999997, "r": 324.98117, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "66-76", "bbox": {"l": 334.94284, "t": 217.33452999999997, "r": 354.651, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "90-94", "bbox": {"l": 364.61267, "t": 217.33452999999997, "r": 384.32083, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "98-100", "bbox": {"l": 394.2825, "t": 217.33452999999997, "r": 418.16003, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "91-92", "bbox": {"l": 428.1217, "t": 217.33452999999997, "r": 447.82986, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "97-99", "bbox": {"l": 457.80051, "t": 217.33452999999997, "r": 477.50867, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "81-86", "bbox": {"l": 487.47034, "t": 217.33452999999997, "r": 507.17849999999993, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "Picture", "bbox": {"l": 104.825, "t": 228.29351999999994, "r": 130.80963, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "45976", "bbox": {"l": 177.866, "t": 228.29351999999994, "r": 198.71288, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "4.21", "bbox": {"l": 219.211, "t": 228.29351999999994, "r": 233.69174000000004, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "2.78", "bbox": {"l": 250.01956, "t": 228.29351999999994, "r": 264.50031, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "5.31", "bbox": {"l": 280.82812, "t": 228.29351999999994, "r": 295.30887, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "69-71", "bbox": {"l": 305.27301, "t": 228.29351999999994, "r": 324.98117, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "56-59", "bbox": {"l": 334.94284, "t": 228.29351999999994, "r": 354.651, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "82-86", "bbox": {"l": 364.61267, "t": 228.29351999999994, "r": 384.32083, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "69-82", "bbox": {"l": 398.45187, "t": 228.29351999999994, "r": 418.16003, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "80-95", "bbox": {"l": 428.1217, "t": 228.29351999999994, "r": 447.82986, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "66-71", "bbox": {"l": 457.80051, "t": 228.29351999999994, "r": 477.50867, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "59-76", "bbox": {"l": 487.47034, "t": 228.29351999999994, "r": 507.17849999999993, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "Section-header", "bbox": {"l": 104.825, "t": 239.25256000000002, "r": 159.56487, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "142884", "bbox": {"l": 173.69701, "t": 239.25256000000002, "r": 198.71326, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "12.60", "bbox": {"l": 215.04201, "t": 239.25256000000002, "r": 233.69212, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "15.77", "bbox": {"l": 245.85056, "t": 239.25256000000002, "r": 264.50067, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "12.85", "bbox": {"l": 276.65912, "t": 239.25256000000002, "r": 295.30923, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "83-84", "bbox": {"l": 305.27301, "t": 239.25256000000002, "r": 324.98117, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "76-81", "bbox": {"l": 334.94284, "t": 239.25256000000002, "r": 354.651, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "90-92", "bbox": {"l": 364.61267, "t": 239.25256000000002, "r": 384.32083, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "94-95", "bbox": {"l": 398.45187, "t": 239.25256000000002, "r": 418.16003, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "87-94", "bbox": {"l": 428.1217, "t": 239.25256000000002, "r": 447.82986, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "69-73", "bbox": {"l": 457.80051, "t": 239.25256000000002, "r": 477.50867, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "78-86", "bbox": {"l": 487.47034, "t": 239.25256000000002, "r": 507.17849999999993, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "Table", "bbox": {"l": 104.825, "t": 250.21155, "r": 124.63177, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "34733", "bbox": {"l": 177.866, "t": 250.21155, "r": 198.71288, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "3.20", "bbox": {"l": 219.211, "t": 250.21155, "r": 233.69174000000004, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "2.27", "bbox": {"l": 250.01956, "t": 250.21155, "r": 264.50031, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "3.60", "bbox": {"l": 280.82812, "t": 250.21155, "r": 295.30887, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "77-81", "bbox": {"l": 305.27301, "t": 250.21155, "r": 324.98117, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "75-80", "bbox": {"l": 334.94284, "t": 250.21155, "r": 354.651, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "83-86", "bbox": {"l": 364.61267, "t": 250.21155, "r": 384.32083, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "98-99", "bbox": {"l": 398.45187, "t": 250.21155, "r": 418.16003, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "58-80", "bbox": {"l": 428.1217, "t": 250.21155, "r": 447.82986, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "79-84", "bbox": {"l": 457.80051, "t": 250.21155, "r": 477.50867, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "70-85", "bbox": {"l": 487.47034, "t": 250.21155, "r": 507.17849999999993, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "Text", "bbox": {"l": 104.825, "t": 261.16956000000005, "r": 120.78519, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "510377", "bbox": {"l": 173.69701, "t": 261.16956000000005, "r": 198.71326, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "45.82", "bbox": {"l": 215.04201, "t": 261.16956000000005, "r": 233.69212, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "49.28", "bbox": {"l": 245.85056, "t": 261.16956000000005, "r": 264.50067, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "45.00", "bbox": {"l": 276.65912, "t": 261.16956000000005, "r": 295.30923, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "84-86", "bbox": {"l": 305.27301, "t": 261.16956000000005, "r": 324.98117, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "81-86", "bbox": {"l": 334.94284, "t": 261.16956000000005, "r": 354.651, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "88-93", "bbox": {"l": 364.61267, "t": 261.16956000000005, "r": 384.32083, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "89-93", "bbox": {"l": 398.45187, "t": 261.16956000000005, "r": 418.16003, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "87-92", "bbox": {"l": 428.1217, "t": 261.16956000000005, "r": 447.82986, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "71-79", "bbox": {"l": 457.80051, "t": 261.16956000000005, "r": 477.50867, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "87-95", "bbox": {"l": 487.47034, "t": 261.16956000000005, "r": 507.17849999999993, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "Title", "bbox": {"l": 104.825, "t": 272.12854000000004, "r": 121.81633, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "5071", "bbox": {"l": 182.035, "t": 272.12854000000004, "r": 198.71251, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "0.47", "bbox": {"l": 219.211, "t": 272.12854000000004, "r": 233.69174000000004, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "0.30", "bbox": {"l": 250.01956, "t": 272.12854000000004, "r": 264.50031, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "0.50", "bbox": {"l": 280.82812, "t": 272.12854000000004, "r": 295.30887, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "60-72", "bbox": {"l": 305.27301, "t": 272.12854000000004, "r": 324.98117, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "24-63", "bbox": {"l": 334.94284, "t": 272.12854000000004, "r": 354.651, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "50-63", "bbox": {"l": 364.61267, "t": 272.12854000000004, "r": 384.32083, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "94-100", "bbox": {"l": 394.2825, "t": 272.12854000000004, "r": 418.16003, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "82-96", "bbox": {"l": 428.1217, "t": 272.12854000000004, "r": 447.82986, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "68-79", "bbox": {"l": 457.80051, "t": 272.12854000000004, "r": 477.50867, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "24-56", "bbox": {"l": 487.47034, "t": 272.12854000000004, "r": 507.17849999999993, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "Total", "bbox": {"l": 104.825, "t": 283.48654, "r": 123.43028, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "1107470", "bbox": {"l": 169.52699, "t": 283.48654, "r": 198.71263, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "941123", "bbox": {"l": 208.675, "t": 283.48654, "r": 233.69124999999997, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "99816", "bbox": {"l": 243.65291999999997, "t": 283.48654, "r": 264.49982, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "66531", "bbox": {"l": 274.46149, "t": 283.48654, "r": 295.30838, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "82-83", "bbox": {"l": 305.27301, "t": 283.48654, "r": 324.98117, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "71-74", "bbox": {"l": 334.94284, "t": 283.48654, "r": 354.651, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "79-81", "bbox": {"l": 364.61267, "t": 283.48654, "r": 384.32083, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "89-94", "bbox": {"l": 398.45187, "t": 283.48654, "r": 418.16003, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "86-91", "bbox": {"l": 428.1217, "t": 283.48654, "r": 447.82986, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "71-76", "bbox": {"l": 457.80051, "t": 283.48654, "r": 477.50867, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "68-85", "bbox": {"l": 487.47034, "t": 283.48654, "r": 507.17849999999993, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": [{"id": 11, "label": "text", "bbox": {"l": 233.94400000000002, "t": 140.22351000000003, "r": 270.04272, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 5, "text": "% of Total", "bbox": {"l": 233.94400000000002, "t": 140.22351000000003, "r": 270.04272, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 329.04999, "t": 140.22351000000003, "r": 483.3976400000001, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": "triple inter-annotator mAP @ 0.5-0.95 (%)", "bbox": {"l": 329.04999, "t": 140.22351000000003, "r": 483.3976400000001, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 104.825, "t": 151.18255999999997, "r": 141.71277, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "class label", "bbox": {"l": 104.825, "t": 151.18255999999997, "r": 141.71277, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 175.94701, "t": 151.18255999999997, "r": 198.71269, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "Count", "bbox": {"l": 175.94701, "t": 151.18255999999997, "r": 198.71269, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 213.795, "t": 151.18255999999997, "r": 233.69144, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "Train", "bbox": {"l": 213.795, "t": 151.18255999999997, "r": 233.69144, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 249.37367, "t": 151.18255999999997, "r": 264.5, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "Test", "bbox": {"l": 249.37367, "t": 151.18255999999997, "r": 264.5, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 283.53568, "t": 151.18255999999997, "r": 295.30856, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "Val", "bbox": {"l": 283.53568, "t": 151.18255999999997, "r": 295.30856, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 314.01501, "t": 151.18255999999997, "r": 324.98093, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "All", "bbox": {"l": 314.01501, "t": 151.18255999999997, "r": 324.98093, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 343.01236, "t": 151.18255999999997, "r": 354.65076, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "Fin", "bbox": {"l": 343.01236, "t": 151.18255999999997, "r": 354.65076, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 367.84033, "t": 151.18255999999997, "r": 384.32059, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "Man", "bbox": {"l": 367.84033, "t": 151.18255999999997, "r": 384.32059, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 407.54358, "t": 151.18255999999997, "r": 418.15979, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "Sci", "bbox": {"l": 407.54358, "t": 151.18255999999997, "r": 418.15979, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 432.29979999999995, "t": 151.18255999999997, "r": 447.82962, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "Law", "bbox": {"l": 432.29979999999995, "t": 151.18255999999997, "r": 447.82962, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 465.72656, "t": 151.18255999999997, "r": 477.50842, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "Pat", "bbox": {"l": 465.72656, "t": 151.18255999999997, "r": 477.50842, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 493.52240000000006, "t": 151.18255999999997, "r": 507.17822, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "Ten", "bbox": {"l": 493.52240000000006, "t": 151.18255999999997, "r": 507.17822, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 104.825, "t": 162.53954999999996, "r": 134.01064, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "Caption", "bbox": {"l": 104.825, "t": 162.53954999999996, "r": 134.01064, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 177.866, "t": 162.53954999999996, "r": 198.71288, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "22524", "bbox": {"l": 177.866, "t": 162.53954999999996, "r": 198.71288, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 219.211, "t": 162.53954999999996, "r": 233.69174000000004, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "2.04", "bbox": {"l": 219.211, "t": 162.53954999999996, "r": 233.69174000000004, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 250.01956, "t": 162.53954999999996, "r": 264.50031, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "1.77", "bbox": {"l": 250.01956, "t": 162.53954999999996, "r": 264.50031, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 280.82812, "t": 162.53954999999996, "r": 295.30887, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "2.32", "bbox": {"l": 280.82812, "t": 162.53954999999996, "r": 295.30887, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 305.27301, "t": 162.53954999999996, "r": 324.98117, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "84-89", "bbox": {"l": 305.27301, "t": 162.53954999999996, "r": 324.98117, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 334.94284, "t": 162.53954999999996, "r": 354.651, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "40-61", "bbox": {"l": 334.94284, "t": 162.53954999999996, "r": 354.651, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 364.61267, "t": 162.53954999999996, "r": 384.32083, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "86-92", "bbox": {"l": 364.61267, "t": 162.53954999999996, "r": 384.32083, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 398.45187, "t": 162.53954999999996, "r": 418.16003, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "94-99", "bbox": {"l": 398.45187, "t": 162.53954999999996, "r": 418.16003, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 428.1217, "t": 162.53954999999996, "r": 447.82986, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "95-99", "bbox": {"l": 428.1217, "t": 162.53954999999996, "r": 447.82986, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 457.80051, "t": 162.53954999999996, "r": 477.50867, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "69-78", "bbox": {"l": 457.80051, "t": 162.53954999999996, "r": 477.50867, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 495.32489, "t": 162.53954999999996, "r": 507.17846999999995, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "n/a", "bbox": {"l": 495.32489, "t": 162.53954999999996, "r": 507.17846999999995, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 104.825, "t": 173.49854000000005, "r": 137.3282, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "Footnote", "bbox": {"l": 104.825, "t": 173.49854000000005, "r": 137.3282, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 182.035, "t": 173.49854000000005, "r": 198.71251, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "6318", "bbox": {"l": 182.035, "t": 173.49854000000005, "r": 198.71251, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 219.211, "t": 173.49854000000005, "r": 233.69174000000004, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "0.60", "bbox": {"l": 219.211, "t": 173.49854000000005, "r": 233.69174000000004, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 250.01956, "t": 173.49854000000005, "r": 264.50031, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "0.31", "bbox": {"l": 250.01956, "t": 173.49854000000005, "r": 264.50031, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 280.82812, "t": 173.49854000000005, "r": 295.30887, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "0.58", "bbox": {"l": 280.82812, "t": 173.49854000000005, "r": 295.30887, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 305.27301, "t": 173.49854000000005, "r": 324.98117, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "83-91", "bbox": {"l": 305.27301, "t": 173.49854000000005, "r": 324.98117, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 342.79739, "t": 173.49854000000005, "r": 354.65097, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "n/a", "bbox": {"l": 342.79739, "t": 173.49854000000005, "r": 354.65097, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 371.81265, "t": 173.49854000000005, "r": 384.32077, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "100", "bbox": {"l": 371.81265, "t": 173.49854000000005, "r": 384.32077, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 398.45181, "t": 173.49854000000005, "r": 418.15997, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "62-88", "bbox": {"l": 398.45181, "t": 173.49854000000005, "r": 418.15997, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 428.12164, "t": 173.49854000000005, "r": 447.8298, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "85-94", "bbox": {"l": 428.12164, "t": 173.49854000000005, "r": 447.8298, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 465.655, "t": 173.49854000000005, "r": 477.50857999999994, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "n/a", "bbox": {"l": 465.655, "t": 173.49854000000005, "r": 477.50857999999994, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 487.47025, "t": 173.49854000000005, "r": 507.17841, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "82-97", "bbox": {"l": 487.47025, "t": 173.49854000000005, "r": 507.17841, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 104.825, "t": 184.45752000000005, "r": 135.33766, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "Formula", "bbox": {"l": 104.825, "t": 184.45752000000005, "r": 135.33766, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 177.866, "t": 184.45752000000005, "r": 198.71288, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "25027", "bbox": {"l": 177.866, "t": 184.45752000000005, "r": 198.71288, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 219.211, "t": 184.45752000000005, "r": 233.69174000000004, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "2.25", "bbox": {"l": 219.211, "t": 184.45752000000005, "r": 233.69174000000004, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 250.01956, "t": 184.45752000000005, "r": 264.50031, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "1.90", "bbox": {"l": 250.01956, "t": 184.45752000000005, "r": 264.50031, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 280.82812, "t": 184.45752000000005, "r": 295.30887, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "2.96", "bbox": {"l": 280.82812, "t": 184.45752000000005, "r": 295.30887, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 305.27301, "t": 184.45752000000005, "r": 324.98117, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "83-85", "bbox": {"l": 305.27301, "t": 184.45752000000005, "r": 324.98117, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 342.79739, "t": 184.45752000000005, "r": 354.65097, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "n/a", "bbox": {"l": 342.79739, "t": 184.45752000000005, "r": 354.65097, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 372.46719, "t": 184.45752000000005, "r": 384.32077, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "n/a", "bbox": {"l": 372.46719, "t": 184.45752000000005, "r": 384.32077, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 398.45181, "t": 184.45752000000005, "r": 418.15997, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "84-87", "bbox": {"l": 398.45181, "t": 184.45752000000005, "r": 418.15997, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 428.12164, "t": 184.45752000000005, "r": 447.8298, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "86-96", "bbox": {"l": 428.12164, "t": 184.45752000000005, "r": 447.8298, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 465.655, "t": 184.45752000000005, "r": 477.50857999999994, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "n/a", "bbox": {"l": 465.655, "t": 184.45752000000005, "r": 477.50857999999994, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 495.3248, "t": 184.45752000000005, "r": 507.17838000000006, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "n/a", "bbox": {"l": 495.3248, "t": 184.45752000000005, "r": 507.17838000000006, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 104.825, "t": 195.41656, "r": 137.70479, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "List-item", "bbox": {"l": 104.825, "t": 195.41656, "r": 137.70479, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 173.69701, "t": 195.41656, "r": 198.71326, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "185660", "bbox": {"l": 173.69701, "t": 195.41656, "r": 198.71326, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 215.04201, "t": 195.41656, "r": 233.69212, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "17.19", "bbox": {"l": 215.04201, "t": 195.41656, "r": 233.69212, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 245.85056, "t": 195.41656, "r": 264.50067, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "13.34", "bbox": {"l": 245.85056, "t": 195.41656, "r": 264.50067, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 276.65912, "t": 195.41656, "r": 295.30923, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "15.82", "bbox": {"l": 276.65912, "t": 195.41656, "r": 295.30923, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 305.27301, "t": 195.41656, "r": 324.98117, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "87-88", "bbox": {"l": 305.27301, "t": 195.41656, "r": 324.98117, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 334.94284, "t": 195.41656, "r": 354.651, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "74-83", "bbox": {"l": 334.94284, "t": 195.41656, "r": 354.651, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 364.61267, "t": 195.41656, "r": 384.32083, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "90-92", "bbox": {"l": 364.61267, "t": 195.41656, "r": 384.32083, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 398.45187, "t": 195.41656, "r": 418.16003, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "97-97", "bbox": {"l": 398.45187, "t": 195.41656, "r": 418.16003, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 428.1217, "t": 195.41656, "r": 447.82986, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "81-85", "bbox": {"l": 428.1217, "t": 195.41656, "r": 447.82986, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 457.80051, "t": 195.41656, "r": 477.50867, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "75-88", "bbox": {"l": 457.80051, "t": 195.41656, "r": 477.50867, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 487.47034, "t": 195.41656, "r": 507.17849999999993, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "93-95", "bbox": {"l": 487.47034, "t": 195.41656, "r": 507.17849999999993, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 104.825, "t": 206.37554999999998, "r": 147.35262, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "Page-footer", "bbox": {"l": 104.825, "t": 206.37554999999998, "r": 147.35262, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 177.866, "t": 206.37554999999998, "r": 198.71288, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "70878", "bbox": {"l": 177.866, "t": 206.37554999999998, "r": 198.71288, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 219.211, "t": 206.37554999999998, "r": 233.69174000000004, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "6.51", "bbox": {"l": 219.211, "t": 206.37554999999998, "r": 233.69174000000004, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 250.01956, "t": 206.37554999999998, "r": 264.50031, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "5.58", "bbox": {"l": 250.01956, "t": 206.37554999999998, "r": 264.50031, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 280.82812, "t": 206.37554999999998, "r": 295.30887, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "6.00", "bbox": {"l": 280.82812, "t": 206.37554999999998, "r": 295.30887, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 305.27301, "t": 206.37554999999998, "r": 324.98117, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "93-94", "bbox": {"l": 305.27301, "t": 206.37554999999998, "r": 324.98117, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 334.94284, "t": 206.37554999999998, "r": 354.651, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "88-90", "bbox": {"l": 334.94284, "t": 206.37554999999998, "r": 354.651, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 364.61267, "t": 206.37554999999998, "r": 384.32083, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "95-96", "bbox": {"l": 364.61267, "t": 206.37554999999998, "r": 384.32083, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 405.65189, "t": 206.37554999999998, "r": 418.16, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "100", "bbox": {"l": 405.65189, "t": 206.37554999999998, "r": 418.16, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 428.12167, "t": 206.37554999999998, "r": 447.82983, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "92-97", "bbox": {"l": 428.12167, "t": 206.37554999999998, "r": 447.82983, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 465.00049, "t": 206.37554999999998, "r": 477.5086099999999, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "100", "bbox": {"l": 465.00049, "t": 206.37554999999998, "r": 477.5086099999999, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 487.47028, "t": 206.37554999999998, "r": 507.17843999999997, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "96-98", "bbox": {"l": 487.47028, "t": 206.37554999999998, "r": 507.17843999999997, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 104.825, "t": 217.33452999999997, "r": 150.10532, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "Page-header", "bbox": {"l": 104.825, "t": 217.33452999999997, "r": 150.10532, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 177.866, "t": 217.33452999999997, "r": 198.71288, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "58022", "bbox": {"l": 177.866, "t": 217.33452999999997, "r": 198.71288, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 219.211, "t": 217.33452999999997, "r": 233.69174000000004, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "5.10", "bbox": {"l": 219.211, "t": 217.33452999999997, "r": 233.69174000000004, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 250.01956, "t": 217.33452999999997, "r": 264.50031, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "6.70", "bbox": {"l": 250.01956, "t": 217.33452999999997, "r": 264.50031, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 280.82812, "t": 217.33452999999997, "r": 295.30887, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "5.06", "bbox": {"l": 280.82812, "t": 217.33452999999997, "r": 295.30887, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 305.27301, "t": 217.33452999999997, "r": 324.98117, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "85-89", "bbox": {"l": 305.27301, "t": 217.33452999999997, "r": 324.98117, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 334.94284, "t": 217.33452999999997, "r": 354.651, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "66-76", "bbox": {"l": 334.94284, "t": 217.33452999999997, "r": 354.651, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 364.61267, "t": 217.33452999999997, "r": 384.32083, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "90-94", "bbox": {"l": 364.61267, "t": 217.33452999999997, "r": 384.32083, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 394.2825, "t": 217.33452999999997, "r": 418.16003, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "98-100", "bbox": {"l": 394.2825, "t": 217.33452999999997, "r": 418.16003, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 428.1217, "t": 217.33452999999997, "r": 447.82986, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "91-92", "bbox": {"l": 428.1217, "t": 217.33452999999997, "r": 447.82986, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 457.80051, "t": 217.33452999999997, "r": 477.50867, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "97-99", "bbox": {"l": 457.80051, "t": 217.33452999999997, "r": 477.50867, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 487.47034, "t": 217.33452999999997, "r": 507.17849999999993, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "81-86", "bbox": {"l": 487.47034, "t": 217.33452999999997, "r": 507.17849999999993, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 104.825, "t": 228.29351999999994, "r": 130.80963, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "Picture", "bbox": {"l": 104.825, "t": 228.29351999999994, "r": 130.80963, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 177.866, "t": 228.29351999999994, "r": 198.71288, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "45976", "bbox": {"l": 177.866, "t": 228.29351999999994, "r": 198.71288, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 219.211, "t": 228.29351999999994, "r": 233.69174000000004, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "4.21", "bbox": {"l": 219.211, "t": 228.29351999999994, "r": 233.69174000000004, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 250.01956, "t": 228.29351999999994, "r": 264.50031, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "2.78", "bbox": {"l": 250.01956, "t": 228.29351999999994, "r": 264.50031, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 280.82812, "t": 228.29351999999994, "r": 295.30887, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "5.31", "bbox": {"l": 280.82812, "t": 228.29351999999994, "r": 295.30887, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 305.27301, "t": 228.29351999999994, "r": 324.98117, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "69-71", "bbox": {"l": 305.27301, "t": 228.29351999999994, "r": 324.98117, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 334.94284, "t": 228.29351999999994, "r": 354.651, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "56-59", "bbox": {"l": 334.94284, "t": 228.29351999999994, "r": 354.651, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 364.61267, "t": 228.29351999999994, "r": 384.32083, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "82-86", "bbox": {"l": 364.61267, "t": 228.29351999999994, "r": 384.32083, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 398.45187, "t": 228.29351999999994, "r": 418.16003, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "69-82", "bbox": {"l": 398.45187, "t": 228.29351999999994, "r": 418.16003, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 428.1217, "t": 228.29351999999994, "r": 447.82986, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "80-95", "bbox": {"l": 428.1217, "t": 228.29351999999994, "r": 447.82986, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 457.80051, "t": 228.29351999999994, "r": 477.50867, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "66-71", "bbox": {"l": 457.80051, "t": 228.29351999999994, "r": 477.50867, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 487.47034, "t": 228.29351999999994, "r": 507.17849999999993, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "59-76", "bbox": {"l": 487.47034, "t": 228.29351999999994, "r": 507.17849999999993, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 104.825, "t": 239.25256000000002, "r": 159.56487, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": "Section-header", "bbox": {"l": 104.825, "t": 239.25256000000002, "r": 159.56487, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 173.69701, "t": 239.25256000000002, "r": 198.71326, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "142884", "bbox": {"l": 173.69701, "t": 239.25256000000002, "r": 198.71326, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 215.04201, "t": 239.25256000000002, "r": 233.69212, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "12.60", "bbox": {"l": 215.04201, "t": 239.25256000000002, "r": 233.69212, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 245.85056, "t": 239.25256000000002, "r": 264.50067, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": "15.77", "bbox": {"l": 245.85056, "t": 239.25256000000002, "r": 264.50067, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 276.65912, "t": 239.25256000000002, "r": 295.30923, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 107, "text": "12.85", "bbox": {"l": 276.65912, "t": 239.25256000000002, "r": 295.30923, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 114, "label": "text", "bbox": {"l": 305.27301, "t": 239.25256000000002, "r": 324.98117, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 108, "text": "83-84", "bbox": {"l": 305.27301, "t": 239.25256000000002, "r": 324.98117, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 115, "label": "text", "bbox": {"l": 334.94284, "t": 239.25256000000002, "r": 354.651, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 109, "text": "76-81", "bbox": {"l": 334.94284, "t": 239.25256000000002, "r": 354.651, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 116, "label": "text", "bbox": {"l": 364.61267, "t": 239.25256000000002, "r": 384.32083, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 110, "text": "90-92", "bbox": {"l": 364.61267, "t": 239.25256000000002, "r": 384.32083, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 117, "label": "text", "bbox": {"l": 398.45187, "t": 239.25256000000002, "r": 418.16003, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 111, "text": "94-95", "bbox": {"l": 398.45187, "t": 239.25256000000002, "r": 418.16003, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 118, "label": "text", "bbox": {"l": 428.1217, "t": 239.25256000000002, "r": 447.82986, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 112, "text": "87-94", "bbox": {"l": 428.1217, "t": 239.25256000000002, "r": 447.82986, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 119, "label": "text", "bbox": {"l": 457.80051, "t": 239.25256000000002, "r": 477.50867, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 113, "text": "69-73", "bbox": {"l": 457.80051, "t": 239.25256000000002, "r": 477.50867, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 120, "label": "text", "bbox": {"l": 487.47034, "t": 239.25256000000002, "r": 507.17849999999993, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 114, "text": "78-86", "bbox": {"l": 487.47034, "t": 239.25256000000002, "r": 507.17849999999993, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 121, "label": "text", "bbox": {"l": 104.825, "t": 250.21155, "r": 124.63177, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 115, "text": "Table", "bbox": {"l": 104.825, "t": 250.21155, "r": 124.63177, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 122, "label": "text", "bbox": {"l": 177.866, "t": 250.21155, "r": 198.71288, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 116, "text": "34733", "bbox": {"l": 177.866, "t": 250.21155, "r": 198.71288, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 123, "label": "text", "bbox": {"l": 219.211, "t": 250.21155, "r": 233.69174000000004, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 117, "text": "3.20", "bbox": {"l": 219.211, "t": 250.21155, "r": 233.69174000000004, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 124, "label": "text", "bbox": {"l": 250.01956, "t": 250.21155, "r": 264.50031, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 118, "text": "2.27", "bbox": {"l": 250.01956, "t": 250.21155, "r": 264.50031, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 125, "label": "text", "bbox": {"l": 280.82812, "t": 250.21155, "r": 295.30887, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 119, "text": "3.60", "bbox": {"l": 280.82812, "t": 250.21155, "r": 295.30887, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 126, "label": "text", "bbox": {"l": 305.27301, "t": 250.21155, "r": 324.98117, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 120, "text": "77-81", "bbox": {"l": 305.27301, "t": 250.21155, "r": 324.98117, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 127, "label": "text", "bbox": {"l": 334.94284, "t": 250.21155, "r": 354.651, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 121, "text": "75-80", "bbox": {"l": 334.94284, "t": 250.21155, "r": 354.651, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 128, "label": "text", "bbox": {"l": 364.61267, "t": 250.21155, "r": 384.32083, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 122, "text": "83-86", "bbox": {"l": 364.61267, "t": 250.21155, "r": 384.32083, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 129, "label": "text", "bbox": {"l": 398.45187, "t": 250.21155, "r": 418.16003, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 123, "text": "98-99", "bbox": {"l": 398.45187, "t": 250.21155, "r": 418.16003, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 130, "label": "text", "bbox": {"l": 428.1217, "t": 250.21155, "r": 447.82986, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 124, "text": "58-80", "bbox": {"l": 428.1217, "t": 250.21155, "r": 447.82986, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 131, "label": "text", "bbox": {"l": 457.80051, "t": 250.21155, "r": 477.50867, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 125, "text": "79-84", "bbox": {"l": 457.80051, "t": 250.21155, "r": 477.50867, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 132, "label": "text", "bbox": {"l": 487.47034, "t": 250.21155, "r": 507.17849999999993, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 126, "text": "70-85", "bbox": {"l": 487.47034, "t": 250.21155, "r": 507.17849999999993, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 133, "label": "text", "bbox": {"l": 104.825, "t": 261.16956000000005, "r": 120.78519, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 127, "text": "Text", "bbox": {"l": 104.825, "t": 261.16956000000005, "r": 120.78519, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 134, "label": "text", "bbox": {"l": 173.69701, "t": 261.16956000000005, "r": 198.71326, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 128, "text": "510377", "bbox": {"l": 173.69701, "t": 261.16956000000005, "r": 198.71326, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 135, "label": "text", "bbox": {"l": 215.04201, "t": 261.16956000000005, "r": 233.69212, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 129, "text": "45.82", "bbox": {"l": 215.04201, "t": 261.16956000000005, "r": 233.69212, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 136, "label": "text", "bbox": {"l": 245.85056, "t": 261.16956000000005, "r": 264.50067, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 130, "text": "49.28", "bbox": {"l": 245.85056, "t": 261.16956000000005, "r": 264.50067, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 137, "label": "text", "bbox": {"l": 276.65912, "t": 261.16956000000005, "r": 295.30923, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 131, "text": "45.00", "bbox": {"l": 276.65912, "t": 261.16956000000005, "r": 295.30923, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 138, "label": "text", "bbox": {"l": 305.27301, "t": 261.16956000000005, "r": 324.98117, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 132, "text": "84-86", "bbox": {"l": 305.27301, "t": 261.16956000000005, "r": 324.98117, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 139, "label": "text", "bbox": {"l": 334.94284, "t": 261.16956000000005, "r": 354.651, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 133, "text": "81-86", "bbox": {"l": 334.94284, "t": 261.16956000000005, "r": 354.651, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 140, "label": "text", "bbox": {"l": 364.61267, "t": 261.16956000000005, "r": 384.32083, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 134, "text": "88-93", "bbox": {"l": 364.61267, "t": 261.16956000000005, "r": 384.32083, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 141, "label": "text", "bbox": {"l": 398.45187, "t": 261.16956000000005, "r": 418.16003, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 135, "text": "89-93", "bbox": {"l": 398.45187, "t": 261.16956000000005, "r": 418.16003, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 142, "label": "text", "bbox": {"l": 428.1217, "t": 261.16956000000005, "r": 447.82986, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 136, "text": "87-92", "bbox": {"l": 428.1217, "t": 261.16956000000005, "r": 447.82986, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 143, "label": "text", "bbox": {"l": 457.80051, "t": 261.16956000000005, "r": 477.50867, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 137, "text": "71-79", "bbox": {"l": 457.80051, "t": 261.16956000000005, "r": 477.50867, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 144, "label": "text", "bbox": {"l": 487.47034, "t": 261.16956000000005, "r": 507.17849999999993, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 138, "text": "87-95", "bbox": {"l": 487.47034, "t": 261.16956000000005, "r": 507.17849999999993, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 145, "label": "text", "bbox": {"l": 104.825, "t": 272.12854000000004, "r": 121.81633, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 139, "text": "Title", "bbox": {"l": 104.825, "t": 272.12854000000004, "r": 121.81633, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 146, "label": "text", "bbox": {"l": 182.035, "t": 272.12854000000004, "r": 198.71251, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 140, "text": "5071", "bbox": {"l": 182.035, "t": 272.12854000000004, "r": 198.71251, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 147, "label": "text", "bbox": {"l": 219.211, "t": 272.12854000000004, "r": 233.69174000000004, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 141, "text": "0.47", "bbox": {"l": 219.211, "t": 272.12854000000004, "r": 233.69174000000004, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 148, "label": "text", "bbox": {"l": 250.01956, "t": 272.12854000000004, "r": 264.50031, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 142, "text": "0.30", "bbox": {"l": 250.01956, "t": 272.12854000000004, "r": 264.50031, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 149, "label": "text", "bbox": {"l": 280.82812, "t": 272.12854000000004, "r": 295.30887, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 143, "text": "0.50", "bbox": {"l": 280.82812, "t": 272.12854000000004, "r": 295.30887, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 150, "label": "text", "bbox": {"l": 305.27301, "t": 272.12854000000004, "r": 324.98117, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 144, "text": "60-72", "bbox": {"l": 305.27301, "t": 272.12854000000004, "r": 324.98117, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 151, "label": "text", "bbox": {"l": 334.94284, "t": 272.12854000000004, "r": 354.651, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 145, "text": "24-63", "bbox": {"l": 334.94284, "t": 272.12854000000004, "r": 354.651, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 152, "label": "text", "bbox": {"l": 364.61267, "t": 272.12854000000004, "r": 384.32083, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 146, "text": "50-63", "bbox": {"l": 364.61267, "t": 272.12854000000004, "r": 384.32083, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 153, "label": "text", "bbox": {"l": 394.2825, "t": 272.12854000000004, "r": 418.16003, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 147, "text": "94-100", "bbox": {"l": 394.2825, "t": 272.12854000000004, "r": 418.16003, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 154, "label": "text", "bbox": {"l": 428.1217, "t": 272.12854000000004, "r": 447.82986, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 148, "text": "82-96", "bbox": {"l": 428.1217, "t": 272.12854000000004, "r": 447.82986, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 155, "label": "text", "bbox": {"l": 457.80051, "t": 272.12854000000004, "r": 477.50867, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 149, "text": "68-79", "bbox": {"l": 457.80051, "t": 272.12854000000004, "r": 477.50867, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 156, "label": "text", "bbox": {"l": 487.47034, "t": 272.12854000000004, "r": 507.17849999999993, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 150, "text": "24-56", "bbox": {"l": 487.47034, "t": 272.12854000000004, "r": 507.17849999999993, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 157, "label": "text", "bbox": {"l": 104.825, "t": 283.48654, "r": 123.43028, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 151, "text": "Total", "bbox": {"l": 104.825, "t": 283.48654, "r": 123.43028, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 158, "label": "text", "bbox": {"l": 169.52699, "t": 283.48654, "r": 198.71263, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 152, "text": "1107470", "bbox": {"l": 169.52699, "t": 283.48654, "r": 198.71263, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 159, "label": "text", "bbox": {"l": 208.675, "t": 283.48654, "r": 233.69124999999997, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 153, "text": "941123", "bbox": {"l": 208.675, "t": 283.48654, "r": 233.69124999999997, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 160, "label": "text", "bbox": {"l": 243.65291999999997, "t": 283.48654, "r": 264.49982, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 154, "text": "99816", "bbox": {"l": 243.65291999999997, "t": 283.48654, "r": 264.49982, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 161, "label": "text", "bbox": {"l": 274.46149, "t": 283.48654, "r": 295.30838, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 155, "text": "66531", "bbox": {"l": 274.46149, "t": 283.48654, "r": 295.30838, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 162, "label": "text", "bbox": {"l": 305.27301, "t": 283.48654, "r": 324.98117, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 156, "text": "82-83", "bbox": {"l": 305.27301, "t": 283.48654, "r": 324.98117, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 163, "label": "text", "bbox": {"l": 334.94284, "t": 283.48654, "r": 354.651, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 157, "text": "71-74", "bbox": {"l": 334.94284, "t": 283.48654, "r": 354.651, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 164, "label": "text", "bbox": {"l": 364.61267, "t": 283.48654, "r": 384.32083, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 158, "text": "79-81", "bbox": {"l": 364.61267, "t": 283.48654, "r": 384.32083, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 165, "label": "text", "bbox": {"l": 398.45187, "t": 283.48654, "r": 418.16003, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 159, "text": "89-94", "bbox": {"l": 398.45187, "t": 283.48654, "r": 418.16003, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 166, "label": "text", "bbox": {"l": 428.1217, "t": 283.48654, "r": 447.82986, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 160, "text": "86-91", "bbox": {"l": 428.1217, "t": 283.48654, "r": 447.82986, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 167, "label": "text", "bbox": {"l": 457.80051, "t": 283.48654, "r": 477.50867, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 161, "text": "71-76", "bbox": {"l": 457.80051, "t": 283.48654, "r": 477.50867, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 168, "label": "text", "bbox": {"l": 487.47034, "t": 283.48654, "r": 507.17849999999993, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 162, "text": "68-85", "bbox": {"l": 487.47034, "t": 283.48654, "r": 507.17849999999993, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "lcel", "lcel", "lcel", "ched", "lcel", "lcel", "lcel", "lcel", "lcel", "nl", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 14, "num_cols": 12, "table_cells": [{"bbox": {"l": 233.94400000000002, "t": 140.22351000000003, "r": 270.04272, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 4, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 6, "text": "% of Total", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 329.04999, "t": 140.22351000000003, "r": 483.3976400000001, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 6, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 6, "end_col_offset_idx": 12, "text": "triple inter-annotator mAP @ 0.5-0.95 (%)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 151.18255999999997, "r": 141.71277, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "class label", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 175.94701, "t": 151.18255999999997, "r": 198.71269, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Count", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 213.795, "t": 151.18255999999997, "r": 233.69144, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Train", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 249.37367, "t": 151.18255999999997, "r": 264.5, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Test", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 283.53568, "t": 151.18255999999997, "r": 295.30856, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Val", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 314.01501, "t": 151.18255999999997, "r": 324.98093, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "All", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 343.01236, "t": 151.18255999999997, "r": 354.65076, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "Fin", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 367.84033, "t": 151.18255999999997, "r": 384.32059, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "Man", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 407.54358, "t": 151.18255999999997, "r": 418.15979, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "Sci", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 432.29979999999995, "t": 151.18255999999997, "r": 447.82962, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "Law", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 465.72656, "t": 151.18255999999997, "r": 477.50842, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "Pat", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 493.52240000000006, "t": 151.18255999999997, "r": 507.17822, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "Ten", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 162.53954999999996, "r": 134.01064, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Caption", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 177.866, "t": 162.53954999999996, "r": 198.71288, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "22524", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 162.53954999999996, "r": 233.69174000000004, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "2.04", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 162.53954999999996, "r": 264.50031, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "1.77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 162.53954999999996, "r": 295.30887, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "2.32", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 162.53954999999996, "r": 324.98117, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "84-89", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 162.53954999999996, "r": 354.651, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "40-61", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 162.53954999999996, "r": 384.32083, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "86-92", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45187, "t": 162.53954999999996, "r": 418.16003, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "94-99", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 162.53954999999996, "r": 447.82986, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "95-99", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 162.53954999999996, "r": 477.50867, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "69-78", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 495.32489, "t": 162.53954999999996, "r": 507.17846999999995, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 173.49854000000005, "r": 137.3282, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Footnote", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 182.035, "t": 173.49854000000005, "r": 198.71251, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "6318", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 173.49854000000005, "r": 233.69174000000004, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.60", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 173.49854000000005, "r": 264.50031, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.31", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 173.49854000000005, "r": 295.30887, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.58", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 173.49854000000005, "r": 324.98117, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "83-91", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 342.79739, "t": 173.49854000000005, "r": 354.65097, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 371.81265, "t": 173.49854000000005, "r": 384.32077, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "100", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45181, "t": 173.49854000000005, "r": 418.15997, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "62-88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.12164, "t": 173.49854000000005, "r": 447.8298, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "85-94", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 465.655, "t": 173.49854000000005, "r": 477.50857999999994, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47025, "t": 173.49854000000005, "r": 507.17841, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "82-97", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 184.45752000000005, "r": 135.33766, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Formula", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 177.866, "t": 184.45752000000005, "r": 198.71288, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "25027", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 184.45752000000005, "r": 233.69174000000004, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "2.25", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 184.45752000000005, "r": 264.50031, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "1.90", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 184.45752000000005, "r": 295.30887, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "2.96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 184.45752000000005, "r": 324.98117, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "83-85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 342.79739, "t": 184.45752000000005, "r": 354.65097, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 372.46719, "t": 184.45752000000005, "r": 384.32077, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45181, "t": 184.45752000000005, "r": 418.15997, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "84-87", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.12164, "t": 184.45752000000005, "r": 447.8298, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "86-96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 465.655, "t": 184.45752000000005, "r": 477.50857999999994, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 495.3248, "t": 184.45752000000005, "r": 507.17838000000006, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 195.41656, "r": 137.70479, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "List-item", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 173.69701, "t": 195.41656, "r": 198.71326, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "185660", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 215.04201, "t": 195.41656, "r": 233.69212, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "17.19", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.85056, "t": 195.41656, "r": 264.50067, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "13.34", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 276.65912, "t": 195.41656, "r": 295.30923, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "15.82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 195.41656, "r": 324.98117, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "87-88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 195.41656, "r": 354.651, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "74-83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 195.41656, "r": 384.32083, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "90-92", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45187, "t": 195.41656, "r": 418.16003, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "97-97", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 195.41656, "r": 447.82986, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "81-85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 195.41656, "r": 477.50867, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "75-88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 195.41656, "r": 507.17849999999993, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "93-95", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 206.37554999999998, "r": 147.35262, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-footer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 177.866, "t": 206.37554999999998, "r": 198.71288, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "70878", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 206.37554999999998, "r": 233.69174000000004, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "6.51", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 206.37554999999998, "r": 264.50031, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "5.58", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 206.37554999999998, "r": 295.30887, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "6.00", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 206.37554999999998, "r": 324.98117, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "93-94", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 206.37554999999998, "r": 354.651, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "88-90", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 206.37554999999998, "r": 384.32083, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "95-96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 405.65189, "t": 206.37554999999998, "r": 418.16, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "100", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.12167, "t": 206.37554999999998, "r": 447.82983, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "92-97", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 465.00049, "t": 206.37554999999998, "r": 477.5086099999999, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "100", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47028, "t": 206.37554999999998, "r": 507.17843999999997, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "96-98", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 217.33452999999997, "r": 150.10532, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 177.866, "t": 217.33452999999997, "r": 198.71288, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "58022", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 217.33452999999997, "r": 233.69174000000004, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "5.10", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 217.33452999999997, "r": 264.50031, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "6.70", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 217.33452999999997, "r": 295.30887, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "5.06", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 217.33452999999997, "r": 324.98117, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "85-89", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 217.33452999999997, "r": 354.651, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "66-76", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 217.33452999999997, "r": 384.32083, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "90-94", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.2825, "t": 217.33452999999997, "r": 418.16003, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "98-100", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 217.33452999999997, "r": 447.82986, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "91-92", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 217.33452999999997, "r": 477.50867, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "97-99", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 217.33452999999997, "r": 507.17849999999993, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "81-86", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 228.29351999999994, "r": 130.80963, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Picture", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 177.866, "t": 228.29351999999994, "r": 198.71288, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "45976", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 228.29351999999994, "r": 233.69174000000004, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "4.21", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 228.29351999999994, "r": 264.50031, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "2.78", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 228.29351999999994, "r": 295.30887, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "5.31", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 228.29351999999994, "r": 324.98117, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "69-71", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 228.29351999999994, "r": 354.651, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "56-59", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 228.29351999999994, "r": 384.32083, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "82-86", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45187, "t": 228.29351999999994, "r": 418.16003, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "69-82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 228.29351999999994, "r": 447.82986, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "80-95", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 228.29351999999994, "r": 477.50867, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "66-71", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 228.29351999999994, "r": 507.17849999999993, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "59-76", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 239.25256000000002, "r": 159.56487, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Section-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 173.69701, "t": 239.25256000000002, "r": 198.71326, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "142884", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 215.04201, "t": 239.25256000000002, "r": 233.69212, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "12.60", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.85056, "t": 239.25256000000002, "r": 264.50067, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "15.77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 276.65912, "t": 239.25256000000002, "r": 295.30923, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "12.85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 239.25256000000002, "r": 324.98117, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "83-84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 239.25256000000002, "r": 354.651, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "76-81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 239.25256000000002, "r": 384.32083, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "90-92", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45187, "t": 239.25256000000002, "r": 418.16003, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "94-95", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 239.25256000000002, "r": 447.82986, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "87-94", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 239.25256000000002, "r": 477.50867, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "69-73", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 239.25256000000002, "r": 507.17849999999993, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "78-86", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 250.21155, "r": 124.63177, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 177.866, "t": 250.21155, "r": 198.71288, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "34733", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 250.21155, "r": 233.69174000000004, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "3.20", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 250.21155, "r": 264.50031, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "2.27", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 250.21155, "r": 295.30887, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "3.60", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 250.21155, "r": 324.98117, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "77-81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 250.21155, "r": 354.651, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "75-80", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 250.21155, "r": 384.32083, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "83-86", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45187, "t": 250.21155, "r": 418.16003, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "98-99", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 250.21155, "r": 447.82986, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "58-80", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 250.21155, "r": 477.50867, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "79-84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 250.21155, "r": 507.17849999999993, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "70-85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 261.16956000000005, "r": 120.78519, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Text", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 173.69701, "t": 261.16956000000005, "r": 198.71326, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "510377", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 215.04201, "t": 261.16956000000005, "r": 233.69212, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "45.82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.85056, "t": 261.16956000000005, "r": 264.50067, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "49.28", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 276.65912, "t": 261.16956000000005, "r": 295.30923, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "45.00", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 261.16956000000005, "r": 324.98117, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "84-86", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 261.16956000000005, "r": 354.651, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "81-86", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 261.16956000000005, "r": 384.32083, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "88-93", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45187, "t": 261.16956000000005, "r": 418.16003, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "89-93", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 261.16956000000005, "r": 447.82986, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "87-92", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 261.16956000000005, "r": 477.50867, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "71-79", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 261.16956000000005, "r": 507.17849999999993, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "87-95", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 272.12854000000004, "r": 121.81633, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Title", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 182.035, "t": 272.12854000000004, "r": 198.71251, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "5071", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 272.12854000000004, "r": 233.69174000000004, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.47", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 272.12854000000004, "r": 264.50031, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.30", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 272.12854000000004, "r": 295.30887, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.50", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 272.12854000000004, "r": 324.98117, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "60-72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 272.12854000000004, "r": 354.651, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "24-63", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 272.12854000000004, "r": 384.32083, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "50-63", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.2825, "t": 272.12854000000004, "r": 418.16003, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "94-100", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 272.12854000000004, "r": 447.82986, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "82-96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 272.12854000000004, "r": 477.50867, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "68-79", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 272.12854000000004, "r": 507.17849999999993, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "24-56", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 283.48654, "r": 123.43028, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Total", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 169.52699, "t": 283.48654, "r": 198.71263, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "1107470", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 208.675, "t": 283.48654, "r": 233.69124999999997, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "941123", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 243.65291999999997, "t": 283.48654, "r": 264.49982, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "99816", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 274.46149, "t": 283.48654, "r": 295.30838, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "66531", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 283.48654, "r": 324.98117, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "82-83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 283.48654, "r": 354.651, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "71-74", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 283.48654, "r": 384.32083, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "79-81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45187, "t": 283.48654, "r": 418.16003, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "89-94", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 283.48654, "r": 447.82986, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "86-91", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 283.48654, "r": 477.50867, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "71-76", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 283.48654, "r": 507.17849999999993, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "68-85", "column_header": false, "row_header": false, "row_section": false}]}}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_header", "id": 10, "page_no": 3, "cluster": {"id": 10, "label": "page_header", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.7625049948692322, "cells": [{"id": 0, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 246.24382, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar", "bbox": {"l": 253.13897999999998, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "KDD '22, August 14-18, 2022, Washington, DC, USA Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar"}, {"label": "caption", "id": 8, "page_no": 3, "cluster": {"id": 8, "label": "caption", "bbox": {"l": 53.501999, "t": 84.95495999999991, "r": 558.48969, "b": 115.34618999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.8906616568565369, "cells": [{"id": 2, "text": "Table 1: DocLayNet dataset overview. Along with the frequency of each class label, we present the relative occurrence (as %", "bbox": {"l": 53.501999, "t": 84.95495999999991, "r": 558.48969, "b": 93.42822000000001, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "of row \u201cTotal\u201d) in the train, test and validation sets. The inter-annotator agreement is computed as the mAP@0.5-0.95 metric", "bbox": {"l": 53.79800000000001, "t": 95.91394000000003, "r": 558.20294, "b": 104.3872100000001, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "between pairwise annotations from the triple-annotated pages, from which we obtain accuracy ranges.", "bbox": {"l": 53.79800000000001, "t": 106.87292000000002, "r": 469.84805000000006, "b": 115.34618999999998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 1: DocLayNet dataset overview. Along with the frequency of each class label, we present the relative occurrence (as % of row \"Total\") in the train, test and validation sets. The inter-annotator agreement is computed as the mAP@0.5-0.95 metric between pairwise annotations from the triple-annotated pages, from which we obtain accuracy ranges."}, {"label": "table", "id": 1, "page_no": 3, "cluster": {"id": 1, "label": "table", "bbox": {"l": 98.93103790283203, "t": 137.47547912597656, "r": 512.579833984375, "b": 294.08148193359375, "coord_origin": "TOPLEFT"}, "confidence": 0.9860090613365173, "cells": [{"id": 5, "text": "% of Total", "bbox": {"l": 233.94400000000002, "t": 140.22351000000003, "r": 270.04272, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "triple inter-annotator mAP @ 0.5-0.95 (%)", "bbox": {"l": 329.04999, "t": 140.22351000000003, "r": 483.3976400000001, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "class label", "bbox": {"l": 104.825, "t": 151.18255999999997, "r": 141.71277, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Count", "bbox": {"l": 175.94701, "t": 151.18255999999997, "r": 198.71269, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Train", "bbox": {"l": 213.795, "t": 151.18255999999997, "r": 233.69144, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Test", "bbox": {"l": 249.37367, "t": 151.18255999999997, "r": 264.5, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Val", "bbox": {"l": 283.53568, "t": 151.18255999999997, "r": 295.30856, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "All", "bbox": {"l": 314.01501, "t": 151.18255999999997, "r": 324.98093, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Fin", "bbox": {"l": 343.01236, "t": 151.18255999999997, "r": 354.65076, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Man", "bbox": {"l": 367.84033, "t": 151.18255999999997, "r": 384.32059, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Sci", "bbox": {"l": 407.54358, "t": 151.18255999999997, "r": 418.15979, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Law", "bbox": {"l": 432.29979999999995, "t": 151.18255999999997, "r": 447.82962, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "Pat", "bbox": {"l": 465.72656, "t": 151.18255999999997, "r": 477.50842, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Ten", "bbox": {"l": 493.52240000000006, "t": 151.18255999999997, "r": 507.17822, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Caption", "bbox": {"l": 104.825, "t": 162.53954999999996, "r": 134.01064, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "22524", "bbox": {"l": 177.866, "t": 162.53954999999996, "r": 198.71288, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "2.04", "bbox": {"l": 219.211, "t": 162.53954999999996, "r": 233.69174000000004, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "1.77", "bbox": {"l": 250.01956, "t": 162.53954999999996, "r": 264.50031, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "2.32", "bbox": {"l": 280.82812, "t": 162.53954999999996, "r": 295.30887, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "84-89", "bbox": {"l": 305.27301, "t": 162.53954999999996, "r": 324.98117, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "40-61", "bbox": {"l": 334.94284, "t": 162.53954999999996, "r": 354.651, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "86-92", "bbox": {"l": 364.61267, "t": 162.53954999999996, "r": 384.32083, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "94-99", "bbox": {"l": 398.45187, "t": 162.53954999999996, "r": 418.16003, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "95-99", "bbox": {"l": 428.1217, "t": 162.53954999999996, "r": 447.82986, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "69-78", "bbox": {"l": 457.80051, "t": 162.53954999999996, "r": 477.50867, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "n/a", "bbox": {"l": 495.32489, "t": 162.53954999999996, "r": 507.17846999999995, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Footnote", "bbox": {"l": 104.825, "t": 173.49854000000005, "r": 137.3282, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "6318", "bbox": {"l": 182.035, "t": 173.49854000000005, "r": 198.71251, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "0.60", "bbox": {"l": 219.211, "t": 173.49854000000005, "r": 233.69174000000004, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "0.31", "bbox": {"l": 250.01956, "t": 173.49854000000005, "r": 264.50031, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "0.58", "bbox": {"l": 280.82812, "t": 173.49854000000005, "r": 295.30887, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "83-91", "bbox": {"l": 305.27301, "t": 173.49854000000005, "r": 324.98117, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "n/a", "bbox": {"l": 342.79739, "t": 173.49854000000005, "r": 354.65097, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "100", "bbox": {"l": 371.81265, "t": 173.49854000000005, "r": 384.32077, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "62-88", "bbox": {"l": 398.45181, "t": 173.49854000000005, "r": 418.15997, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "85-94", "bbox": {"l": 428.12164, "t": 173.49854000000005, "r": 447.8298, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "n/a", "bbox": {"l": 465.655, "t": 173.49854000000005, "r": 477.50857999999994, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "82-97", "bbox": {"l": 487.47025, "t": 173.49854000000005, "r": 507.17841, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Formula", "bbox": {"l": 104.825, "t": 184.45752000000005, "r": 135.33766, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "25027", "bbox": {"l": 177.866, "t": 184.45752000000005, "r": 198.71288, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "2.25", "bbox": {"l": 219.211, "t": 184.45752000000005, "r": 233.69174000000004, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "1.90", "bbox": {"l": 250.01956, "t": 184.45752000000005, "r": 264.50031, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "2.96", "bbox": {"l": 280.82812, "t": 184.45752000000005, "r": 295.30887, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "83-85", "bbox": {"l": 305.27301, "t": 184.45752000000005, "r": 324.98117, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "n/a", "bbox": {"l": 342.79739, "t": 184.45752000000005, "r": 354.65097, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "n/a", "bbox": {"l": 372.46719, "t": 184.45752000000005, "r": 384.32077, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "84-87", "bbox": {"l": 398.45181, "t": 184.45752000000005, "r": 418.15997, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "86-96", "bbox": {"l": 428.12164, "t": 184.45752000000005, "r": 447.8298, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "n/a", "bbox": {"l": 465.655, "t": 184.45752000000005, "r": 477.50857999999994, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "n/a", "bbox": {"l": 495.3248, "t": 184.45752000000005, "r": 507.17838000000006, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "List-item", "bbox": {"l": 104.825, "t": 195.41656, "r": 137.70479, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "185660", "bbox": {"l": 173.69701, "t": 195.41656, "r": 198.71326, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "17.19", "bbox": {"l": 215.04201, "t": 195.41656, "r": 233.69212, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "13.34", "bbox": {"l": 245.85056, "t": 195.41656, "r": 264.50067, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "15.82", "bbox": {"l": 276.65912, "t": 195.41656, "r": 295.30923, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "87-88", "bbox": {"l": 305.27301, "t": 195.41656, "r": 324.98117, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "74-83", "bbox": {"l": 334.94284, "t": 195.41656, "r": 354.651, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "90-92", "bbox": {"l": 364.61267, "t": 195.41656, "r": 384.32083, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "97-97", "bbox": {"l": 398.45187, "t": 195.41656, "r": 418.16003, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "81-85", "bbox": {"l": 428.1217, "t": 195.41656, "r": 447.82986, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "75-88", "bbox": {"l": 457.80051, "t": 195.41656, "r": 477.50867, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "93-95", "bbox": {"l": 487.47034, "t": 195.41656, "r": 507.17849999999993, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "Page-footer", "bbox": {"l": 104.825, "t": 206.37554999999998, "r": 147.35262, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "70878", "bbox": {"l": 177.866, "t": 206.37554999999998, "r": 198.71288, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "6.51", "bbox": {"l": 219.211, "t": 206.37554999999998, "r": 233.69174000000004, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "5.58", "bbox": {"l": 250.01956, "t": 206.37554999999998, "r": 264.50031, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "6.00", "bbox": {"l": 280.82812, "t": 206.37554999999998, "r": 295.30887, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "93-94", "bbox": {"l": 305.27301, "t": 206.37554999999998, "r": 324.98117, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "88-90", "bbox": {"l": 334.94284, "t": 206.37554999999998, "r": 354.651, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "95-96", "bbox": {"l": 364.61267, "t": 206.37554999999998, "r": 384.32083, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "100", "bbox": {"l": 405.65189, "t": 206.37554999999998, "r": 418.16, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "92-97", "bbox": {"l": 428.12167, "t": 206.37554999999998, "r": 447.82983, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "100", "bbox": {"l": 465.00049, "t": 206.37554999999998, "r": 477.5086099999999, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "96-98", "bbox": {"l": 487.47028, "t": 206.37554999999998, "r": 507.17843999999997, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "Page-header", "bbox": {"l": 104.825, "t": 217.33452999999997, "r": 150.10532, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "58022", "bbox": {"l": 177.866, "t": 217.33452999999997, "r": 198.71288, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "5.10", "bbox": {"l": 219.211, "t": 217.33452999999997, "r": 233.69174000000004, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "6.70", "bbox": {"l": 250.01956, "t": 217.33452999999997, "r": 264.50031, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "5.06", "bbox": {"l": 280.82812, "t": 217.33452999999997, "r": 295.30887, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "85-89", "bbox": {"l": 305.27301, "t": 217.33452999999997, "r": 324.98117, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "66-76", "bbox": {"l": 334.94284, "t": 217.33452999999997, "r": 354.651, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "90-94", "bbox": {"l": 364.61267, "t": 217.33452999999997, "r": 384.32083, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "98-100", "bbox": {"l": 394.2825, "t": 217.33452999999997, "r": 418.16003, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "91-92", "bbox": {"l": 428.1217, "t": 217.33452999999997, "r": 447.82986, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "97-99", "bbox": {"l": 457.80051, "t": 217.33452999999997, "r": 477.50867, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "81-86", "bbox": {"l": 487.47034, "t": 217.33452999999997, "r": 507.17849999999993, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "Picture", "bbox": {"l": 104.825, "t": 228.29351999999994, "r": 130.80963, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "45976", "bbox": {"l": 177.866, "t": 228.29351999999994, "r": 198.71288, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "4.21", "bbox": {"l": 219.211, "t": 228.29351999999994, "r": 233.69174000000004, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "2.78", "bbox": {"l": 250.01956, "t": 228.29351999999994, "r": 264.50031, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "5.31", "bbox": {"l": 280.82812, "t": 228.29351999999994, "r": 295.30887, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "69-71", "bbox": {"l": 305.27301, "t": 228.29351999999994, "r": 324.98117, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "56-59", "bbox": {"l": 334.94284, "t": 228.29351999999994, "r": 354.651, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "82-86", "bbox": {"l": 364.61267, "t": 228.29351999999994, "r": 384.32083, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "69-82", "bbox": {"l": 398.45187, "t": 228.29351999999994, "r": 418.16003, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "80-95", "bbox": {"l": 428.1217, "t": 228.29351999999994, "r": 447.82986, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "66-71", "bbox": {"l": 457.80051, "t": 228.29351999999994, "r": 477.50867, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "59-76", "bbox": {"l": 487.47034, "t": 228.29351999999994, "r": 507.17849999999993, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "Section-header", "bbox": {"l": 104.825, "t": 239.25256000000002, "r": 159.56487, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "142884", "bbox": {"l": 173.69701, "t": 239.25256000000002, "r": 198.71326, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "12.60", "bbox": {"l": 215.04201, "t": 239.25256000000002, "r": 233.69212, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "15.77", "bbox": {"l": 245.85056, "t": 239.25256000000002, "r": 264.50067, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "12.85", "bbox": {"l": 276.65912, "t": 239.25256000000002, "r": 295.30923, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "83-84", "bbox": {"l": 305.27301, "t": 239.25256000000002, "r": 324.98117, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "76-81", "bbox": {"l": 334.94284, "t": 239.25256000000002, "r": 354.651, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "90-92", "bbox": {"l": 364.61267, "t": 239.25256000000002, "r": 384.32083, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "94-95", "bbox": {"l": 398.45187, "t": 239.25256000000002, "r": 418.16003, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "87-94", "bbox": {"l": 428.1217, "t": 239.25256000000002, "r": 447.82986, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "69-73", "bbox": {"l": 457.80051, "t": 239.25256000000002, "r": 477.50867, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "78-86", "bbox": {"l": 487.47034, "t": 239.25256000000002, "r": 507.17849999999993, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "Table", "bbox": {"l": 104.825, "t": 250.21155, "r": 124.63177, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "34733", "bbox": {"l": 177.866, "t": 250.21155, "r": 198.71288, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "3.20", "bbox": {"l": 219.211, "t": 250.21155, "r": 233.69174000000004, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "2.27", "bbox": {"l": 250.01956, "t": 250.21155, "r": 264.50031, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "3.60", "bbox": {"l": 280.82812, "t": 250.21155, "r": 295.30887, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "77-81", "bbox": {"l": 305.27301, "t": 250.21155, "r": 324.98117, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "75-80", "bbox": {"l": 334.94284, "t": 250.21155, "r": 354.651, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "83-86", "bbox": {"l": 364.61267, "t": 250.21155, "r": 384.32083, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "98-99", "bbox": {"l": 398.45187, "t": 250.21155, "r": 418.16003, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "58-80", "bbox": {"l": 428.1217, "t": 250.21155, "r": 447.82986, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "79-84", "bbox": {"l": 457.80051, "t": 250.21155, "r": 477.50867, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "70-85", "bbox": {"l": 487.47034, "t": 250.21155, "r": 507.17849999999993, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "Text", "bbox": {"l": 104.825, "t": 261.16956000000005, "r": 120.78519, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "510377", "bbox": {"l": 173.69701, "t": 261.16956000000005, "r": 198.71326, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "45.82", "bbox": {"l": 215.04201, "t": 261.16956000000005, "r": 233.69212, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "49.28", "bbox": {"l": 245.85056, "t": 261.16956000000005, "r": 264.50067, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "45.00", "bbox": {"l": 276.65912, "t": 261.16956000000005, "r": 295.30923, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "84-86", "bbox": {"l": 305.27301, "t": 261.16956000000005, "r": 324.98117, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "81-86", "bbox": {"l": 334.94284, "t": 261.16956000000005, "r": 354.651, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "88-93", "bbox": {"l": 364.61267, "t": 261.16956000000005, "r": 384.32083, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "89-93", "bbox": {"l": 398.45187, "t": 261.16956000000005, "r": 418.16003, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "87-92", "bbox": {"l": 428.1217, "t": 261.16956000000005, "r": 447.82986, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "71-79", "bbox": {"l": 457.80051, "t": 261.16956000000005, "r": 477.50867, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "87-95", "bbox": {"l": 487.47034, "t": 261.16956000000005, "r": 507.17849999999993, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "Title", "bbox": {"l": 104.825, "t": 272.12854000000004, "r": 121.81633, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "5071", "bbox": {"l": 182.035, "t": 272.12854000000004, "r": 198.71251, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "0.47", "bbox": {"l": 219.211, "t": 272.12854000000004, "r": 233.69174000000004, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "0.30", "bbox": {"l": 250.01956, "t": 272.12854000000004, "r": 264.50031, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "0.50", "bbox": {"l": 280.82812, "t": 272.12854000000004, "r": 295.30887, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "60-72", "bbox": {"l": 305.27301, "t": 272.12854000000004, "r": 324.98117, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "24-63", "bbox": {"l": 334.94284, "t": 272.12854000000004, "r": 354.651, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "50-63", "bbox": {"l": 364.61267, "t": 272.12854000000004, "r": 384.32083, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "94-100", "bbox": {"l": 394.2825, "t": 272.12854000000004, "r": 418.16003, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "82-96", "bbox": {"l": 428.1217, "t": 272.12854000000004, "r": 447.82986, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "68-79", "bbox": {"l": 457.80051, "t": 272.12854000000004, "r": 477.50867, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "24-56", "bbox": {"l": 487.47034, "t": 272.12854000000004, "r": 507.17849999999993, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "Total", "bbox": {"l": 104.825, "t": 283.48654, "r": 123.43028, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "1107470", "bbox": {"l": 169.52699, "t": 283.48654, "r": 198.71263, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "941123", "bbox": {"l": 208.675, "t": 283.48654, "r": 233.69124999999997, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "99816", "bbox": {"l": 243.65291999999997, "t": 283.48654, "r": 264.49982, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "66531", "bbox": {"l": 274.46149, "t": 283.48654, "r": 295.30838, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "82-83", "bbox": {"l": 305.27301, "t": 283.48654, "r": 324.98117, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "71-74", "bbox": {"l": 334.94284, "t": 283.48654, "r": 354.651, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "79-81", "bbox": {"l": 364.61267, "t": 283.48654, "r": 384.32083, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "89-94", "bbox": {"l": 398.45187, "t": 283.48654, "r": 418.16003, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "86-91", "bbox": {"l": 428.1217, "t": 283.48654, "r": 447.82986, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "71-76", "bbox": {"l": 457.80051, "t": 283.48654, "r": 477.50867, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "68-85", "bbox": {"l": 487.47034, "t": 283.48654, "r": 507.17849999999993, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": [{"id": 11, "label": "text", "bbox": {"l": 233.94400000000002, "t": 140.22351000000003, "r": 270.04272, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 5, "text": "% of Total", "bbox": {"l": 233.94400000000002, "t": 140.22351000000003, "r": 270.04272, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 329.04999, "t": 140.22351000000003, "r": 483.3976400000001, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": "triple inter-annotator mAP @ 0.5-0.95 (%)", "bbox": {"l": 329.04999, "t": 140.22351000000003, "r": 483.3976400000001, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 104.825, "t": 151.18255999999997, "r": 141.71277, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "class label", "bbox": {"l": 104.825, "t": 151.18255999999997, "r": 141.71277, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 175.94701, "t": 151.18255999999997, "r": 198.71269, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "Count", "bbox": {"l": 175.94701, "t": 151.18255999999997, "r": 198.71269, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 213.795, "t": 151.18255999999997, "r": 233.69144, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "Train", "bbox": {"l": 213.795, "t": 151.18255999999997, "r": 233.69144, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 249.37367, "t": 151.18255999999997, "r": 264.5, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "Test", "bbox": {"l": 249.37367, "t": 151.18255999999997, "r": 264.5, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 283.53568, "t": 151.18255999999997, "r": 295.30856, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "Val", "bbox": {"l": 283.53568, "t": 151.18255999999997, "r": 295.30856, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 314.01501, "t": 151.18255999999997, "r": 324.98093, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "All", "bbox": {"l": 314.01501, "t": 151.18255999999997, "r": 324.98093, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 343.01236, "t": 151.18255999999997, "r": 354.65076, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "Fin", "bbox": {"l": 343.01236, "t": 151.18255999999997, "r": 354.65076, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 367.84033, "t": 151.18255999999997, "r": 384.32059, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "Man", "bbox": {"l": 367.84033, "t": 151.18255999999997, "r": 384.32059, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 407.54358, "t": 151.18255999999997, "r": 418.15979, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "Sci", "bbox": {"l": 407.54358, "t": 151.18255999999997, "r": 418.15979, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 432.29979999999995, "t": 151.18255999999997, "r": 447.82962, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "Law", "bbox": {"l": 432.29979999999995, "t": 151.18255999999997, "r": 447.82962, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 465.72656, "t": 151.18255999999997, "r": 477.50842, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "Pat", "bbox": {"l": 465.72656, "t": 151.18255999999997, "r": 477.50842, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 493.52240000000006, "t": 151.18255999999997, "r": 507.17822, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "Ten", "bbox": {"l": 493.52240000000006, "t": 151.18255999999997, "r": 507.17822, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 104.825, "t": 162.53954999999996, "r": 134.01064, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "Caption", "bbox": {"l": 104.825, "t": 162.53954999999996, "r": 134.01064, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 177.866, "t": 162.53954999999996, "r": 198.71288, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "22524", "bbox": {"l": 177.866, "t": 162.53954999999996, "r": 198.71288, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 219.211, "t": 162.53954999999996, "r": 233.69174000000004, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "2.04", "bbox": {"l": 219.211, "t": 162.53954999999996, "r": 233.69174000000004, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 250.01956, "t": 162.53954999999996, "r": 264.50031, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "1.77", "bbox": {"l": 250.01956, "t": 162.53954999999996, "r": 264.50031, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 280.82812, "t": 162.53954999999996, "r": 295.30887, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "2.32", "bbox": {"l": 280.82812, "t": 162.53954999999996, "r": 295.30887, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 305.27301, "t": 162.53954999999996, "r": 324.98117, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "84-89", "bbox": {"l": 305.27301, "t": 162.53954999999996, "r": 324.98117, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 334.94284, "t": 162.53954999999996, "r": 354.651, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "40-61", "bbox": {"l": 334.94284, "t": 162.53954999999996, "r": 354.651, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 364.61267, "t": 162.53954999999996, "r": 384.32083, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "86-92", "bbox": {"l": 364.61267, "t": 162.53954999999996, "r": 384.32083, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 398.45187, "t": 162.53954999999996, "r": 418.16003, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "94-99", "bbox": {"l": 398.45187, "t": 162.53954999999996, "r": 418.16003, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 428.1217, "t": 162.53954999999996, "r": 447.82986, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "95-99", "bbox": {"l": 428.1217, "t": 162.53954999999996, "r": 447.82986, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 457.80051, "t": 162.53954999999996, "r": 477.50867, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "69-78", "bbox": {"l": 457.80051, "t": 162.53954999999996, "r": 477.50867, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 495.32489, "t": 162.53954999999996, "r": 507.17846999999995, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "n/a", "bbox": {"l": 495.32489, "t": 162.53954999999996, "r": 507.17846999999995, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 104.825, "t": 173.49854000000005, "r": 137.3282, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "Footnote", "bbox": {"l": 104.825, "t": 173.49854000000005, "r": 137.3282, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 182.035, "t": 173.49854000000005, "r": 198.71251, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "6318", "bbox": {"l": 182.035, "t": 173.49854000000005, "r": 198.71251, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 219.211, "t": 173.49854000000005, "r": 233.69174000000004, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "0.60", "bbox": {"l": 219.211, "t": 173.49854000000005, "r": 233.69174000000004, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 250.01956, "t": 173.49854000000005, "r": 264.50031, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "0.31", "bbox": {"l": 250.01956, "t": 173.49854000000005, "r": 264.50031, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 280.82812, "t": 173.49854000000005, "r": 295.30887, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "0.58", "bbox": {"l": 280.82812, "t": 173.49854000000005, "r": 295.30887, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 305.27301, "t": 173.49854000000005, "r": 324.98117, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "83-91", "bbox": {"l": 305.27301, "t": 173.49854000000005, "r": 324.98117, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 342.79739, "t": 173.49854000000005, "r": 354.65097, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "n/a", "bbox": {"l": 342.79739, "t": 173.49854000000005, "r": 354.65097, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 371.81265, "t": 173.49854000000005, "r": 384.32077, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "100", "bbox": {"l": 371.81265, "t": 173.49854000000005, "r": 384.32077, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 398.45181, "t": 173.49854000000005, "r": 418.15997, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "62-88", "bbox": {"l": 398.45181, "t": 173.49854000000005, "r": 418.15997, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 428.12164, "t": 173.49854000000005, "r": 447.8298, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "85-94", "bbox": {"l": 428.12164, "t": 173.49854000000005, "r": 447.8298, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 465.655, "t": 173.49854000000005, "r": 477.50857999999994, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "n/a", "bbox": {"l": 465.655, "t": 173.49854000000005, "r": 477.50857999999994, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 487.47025, "t": 173.49854000000005, "r": 507.17841, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "82-97", "bbox": {"l": 487.47025, "t": 173.49854000000005, "r": 507.17841, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 104.825, "t": 184.45752000000005, "r": 135.33766, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "Formula", "bbox": {"l": 104.825, "t": 184.45752000000005, "r": 135.33766, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 177.866, "t": 184.45752000000005, "r": 198.71288, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "25027", "bbox": {"l": 177.866, "t": 184.45752000000005, "r": 198.71288, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 219.211, "t": 184.45752000000005, "r": 233.69174000000004, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "2.25", "bbox": {"l": 219.211, "t": 184.45752000000005, "r": 233.69174000000004, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 250.01956, "t": 184.45752000000005, "r": 264.50031, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "1.90", "bbox": {"l": 250.01956, "t": 184.45752000000005, "r": 264.50031, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 280.82812, "t": 184.45752000000005, "r": 295.30887, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "2.96", "bbox": {"l": 280.82812, "t": 184.45752000000005, "r": 295.30887, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 305.27301, "t": 184.45752000000005, "r": 324.98117, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "83-85", "bbox": {"l": 305.27301, "t": 184.45752000000005, "r": 324.98117, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 342.79739, "t": 184.45752000000005, "r": 354.65097, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "n/a", "bbox": {"l": 342.79739, "t": 184.45752000000005, "r": 354.65097, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 372.46719, "t": 184.45752000000005, "r": 384.32077, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "n/a", "bbox": {"l": 372.46719, "t": 184.45752000000005, "r": 384.32077, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 398.45181, "t": 184.45752000000005, "r": 418.15997, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "84-87", "bbox": {"l": 398.45181, "t": 184.45752000000005, "r": 418.15997, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 428.12164, "t": 184.45752000000005, "r": 447.8298, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "86-96", "bbox": {"l": 428.12164, "t": 184.45752000000005, "r": 447.8298, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 465.655, "t": 184.45752000000005, "r": 477.50857999999994, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "n/a", "bbox": {"l": 465.655, "t": 184.45752000000005, "r": 477.50857999999994, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 495.3248, "t": 184.45752000000005, "r": 507.17838000000006, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "n/a", "bbox": {"l": 495.3248, "t": 184.45752000000005, "r": 507.17838000000006, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 104.825, "t": 195.41656, "r": 137.70479, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "List-item", "bbox": {"l": 104.825, "t": 195.41656, "r": 137.70479, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 173.69701, "t": 195.41656, "r": 198.71326, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "185660", "bbox": {"l": 173.69701, "t": 195.41656, "r": 198.71326, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 215.04201, "t": 195.41656, "r": 233.69212, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "17.19", "bbox": {"l": 215.04201, "t": 195.41656, "r": 233.69212, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 245.85056, "t": 195.41656, "r": 264.50067, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "13.34", "bbox": {"l": 245.85056, "t": 195.41656, "r": 264.50067, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 276.65912, "t": 195.41656, "r": 295.30923, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "15.82", "bbox": {"l": 276.65912, "t": 195.41656, "r": 295.30923, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 305.27301, "t": 195.41656, "r": 324.98117, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "87-88", "bbox": {"l": 305.27301, "t": 195.41656, "r": 324.98117, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 334.94284, "t": 195.41656, "r": 354.651, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "74-83", "bbox": {"l": 334.94284, "t": 195.41656, "r": 354.651, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 364.61267, "t": 195.41656, "r": 384.32083, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "90-92", "bbox": {"l": 364.61267, "t": 195.41656, "r": 384.32083, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 398.45187, "t": 195.41656, "r": 418.16003, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "97-97", "bbox": {"l": 398.45187, "t": 195.41656, "r": 418.16003, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 428.1217, "t": 195.41656, "r": 447.82986, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "81-85", "bbox": {"l": 428.1217, "t": 195.41656, "r": 447.82986, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 457.80051, "t": 195.41656, "r": 477.50867, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "75-88", "bbox": {"l": 457.80051, "t": 195.41656, "r": 477.50867, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 487.47034, "t": 195.41656, "r": 507.17849999999993, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "93-95", "bbox": {"l": 487.47034, "t": 195.41656, "r": 507.17849999999993, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 104.825, "t": 206.37554999999998, "r": 147.35262, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "Page-footer", "bbox": {"l": 104.825, "t": 206.37554999999998, "r": 147.35262, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 177.866, "t": 206.37554999999998, "r": 198.71288, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "70878", "bbox": {"l": 177.866, "t": 206.37554999999998, "r": 198.71288, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 219.211, "t": 206.37554999999998, "r": 233.69174000000004, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "6.51", "bbox": {"l": 219.211, "t": 206.37554999999998, "r": 233.69174000000004, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 250.01956, "t": 206.37554999999998, "r": 264.50031, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "5.58", "bbox": {"l": 250.01956, "t": 206.37554999999998, "r": 264.50031, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 280.82812, "t": 206.37554999999998, "r": 295.30887, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "6.00", "bbox": {"l": 280.82812, "t": 206.37554999999998, "r": 295.30887, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 305.27301, "t": 206.37554999999998, "r": 324.98117, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "93-94", "bbox": {"l": 305.27301, "t": 206.37554999999998, "r": 324.98117, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 334.94284, "t": 206.37554999999998, "r": 354.651, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "88-90", "bbox": {"l": 334.94284, "t": 206.37554999999998, "r": 354.651, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 364.61267, "t": 206.37554999999998, "r": 384.32083, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "95-96", "bbox": {"l": 364.61267, "t": 206.37554999999998, "r": 384.32083, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 405.65189, "t": 206.37554999999998, "r": 418.16, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "100", "bbox": {"l": 405.65189, "t": 206.37554999999998, "r": 418.16, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 428.12167, "t": 206.37554999999998, "r": 447.82983, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "92-97", "bbox": {"l": 428.12167, "t": 206.37554999999998, "r": 447.82983, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 465.00049, "t": 206.37554999999998, "r": 477.5086099999999, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "100", "bbox": {"l": 465.00049, "t": 206.37554999999998, "r": 477.5086099999999, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 487.47028, "t": 206.37554999999998, "r": 507.17843999999997, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "96-98", "bbox": {"l": 487.47028, "t": 206.37554999999998, "r": 507.17843999999997, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 104.825, "t": 217.33452999999997, "r": 150.10532, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "Page-header", "bbox": {"l": 104.825, "t": 217.33452999999997, "r": 150.10532, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 177.866, "t": 217.33452999999997, "r": 198.71288, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "58022", "bbox": {"l": 177.866, "t": 217.33452999999997, "r": 198.71288, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 219.211, "t": 217.33452999999997, "r": 233.69174000000004, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "5.10", "bbox": {"l": 219.211, "t": 217.33452999999997, "r": 233.69174000000004, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 250.01956, "t": 217.33452999999997, "r": 264.50031, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "6.70", "bbox": {"l": 250.01956, "t": 217.33452999999997, "r": 264.50031, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 280.82812, "t": 217.33452999999997, "r": 295.30887, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "5.06", "bbox": {"l": 280.82812, "t": 217.33452999999997, "r": 295.30887, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 305.27301, "t": 217.33452999999997, "r": 324.98117, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "85-89", "bbox": {"l": 305.27301, "t": 217.33452999999997, "r": 324.98117, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 334.94284, "t": 217.33452999999997, "r": 354.651, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "66-76", "bbox": {"l": 334.94284, "t": 217.33452999999997, "r": 354.651, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 364.61267, "t": 217.33452999999997, "r": 384.32083, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "90-94", "bbox": {"l": 364.61267, "t": 217.33452999999997, "r": 384.32083, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 394.2825, "t": 217.33452999999997, "r": 418.16003, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "98-100", "bbox": {"l": 394.2825, "t": 217.33452999999997, "r": 418.16003, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 428.1217, "t": 217.33452999999997, "r": 447.82986, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "91-92", "bbox": {"l": 428.1217, "t": 217.33452999999997, "r": 447.82986, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 457.80051, "t": 217.33452999999997, "r": 477.50867, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "97-99", "bbox": {"l": 457.80051, "t": 217.33452999999997, "r": 477.50867, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 487.47034, "t": 217.33452999999997, "r": 507.17849999999993, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "81-86", "bbox": {"l": 487.47034, "t": 217.33452999999997, "r": 507.17849999999993, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 104.825, "t": 228.29351999999994, "r": 130.80963, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "Picture", "bbox": {"l": 104.825, "t": 228.29351999999994, "r": 130.80963, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 177.866, "t": 228.29351999999994, "r": 198.71288, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "45976", "bbox": {"l": 177.866, "t": 228.29351999999994, "r": 198.71288, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 219.211, "t": 228.29351999999994, "r": 233.69174000000004, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "4.21", "bbox": {"l": 219.211, "t": 228.29351999999994, "r": 233.69174000000004, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 250.01956, "t": 228.29351999999994, "r": 264.50031, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "2.78", "bbox": {"l": 250.01956, "t": 228.29351999999994, "r": 264.50031, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 280.82812, "t": 228.29351999999994, "r": 295.30887, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "5.31", "bbox": {"l": 280.82812, "t": 228.29351999999994, "r": 295.30887, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 305.27301, "t": 228.29351999999994, "r": 324.98117, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "69-71", "bbox": {"l": 305.27301, "t": 228.29351999999994, "r": 324.98117, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 334.94284, "t": 228.29351999999994, "r": 354.651, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "56-59", "bbox": {"l": 334.94284, "t": 228.29351999999994, "r": 354.651, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 364.61267, "t": 228.29351999999994, "r": 384.32083, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "82-86", "bbox": {"l": 364.61267, "t": 228.29351999999994, "r": 384.32083, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 398.45187, "t": 228.29351999999994, "r": 418.16003, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "69-82", "bbox": {"l": 398.45187, "t": 228.29351999999994, "r": 418.16003, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 428.1217, "t": 228.29351999999994, "r": 447.82986, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "80-95", "bbox": {"l": 428.1217, "t": 228.29351999999994, "r": 447.82986, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 457.80051, "t": 228.29351999999994, "r": 477.50867, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "66-71", "bbox": {"l": 457.80051, "t": 228.29351999999994, "r": 477.50867, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 487.47034, "t": 228.29351999999994, "r": 507.17849999999993, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "59-76", "bbox": {"l": 487.47034, "t": 228.29351999999994, "r": 507.17849999999993, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 104.825, "t": 239.25256000000002, "r": 159.56487, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": "Section-header", "bbox": {"l": 104.825, "t": 239.25256000000002, "r": 159.56487, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 173.69701, "t": 239.25256000000002, "r": 198.71326, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "142884", "bbox": {"l": 173.69701, "t": 239.25256000000002, "r": 198.71326, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 215.04201, "t": 239.25256000000002, "r": 233.69212, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "12.60", "bbox": {"l": 215.04201, "t": 239.25256000000002, "r": 233.69212, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 245.85056, "t": 239.25256000000002, "r": 264.50067, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": "15.77", "bbox": {"l": 245.85056, "t": 239.25256000000002, "r": 264.50067, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 276.65912, "t": 239.25256000000002, "r": 295.30923, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 107, "text": "12.85", "bbox": {"l": 276.65912, "t": 239.25256000000002, "r": 295.30923, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 114, "label": "text", "bbox": {"l": 305.27301, "t": 239.25256000000002, "r": 324.98117, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 108, "text": "83-84", "bbox": {"l": 305.27301, "t": 239.25256000000002, "r": 324.98117, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 115, "label": "text", "bbox": {"l": 334.94284, "t": 239.25256000000002, "r": 354.651, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 109, "text": "76-81", "bbox": {"l": 334.94284, "t": 239.25256000000002, "r": 354.651, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 116, "label": "text", "bbox": {"l": 364.61267, "t": 239.25256000000002, "r": 384.32083, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 110, "text": "90-92", "bbox": {"l": 364.61267, "t": 239.25256000000002, "r": 384.32083, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 117, "label": "text", "bbox": {"l": 398.45187, "t": 239.25256000000002, "r": 418.16003, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 111, "text": "94-95", "bbox": {"l": 398.45187, "t": 239.25256000000002, "r": 418.16003, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 118, "label": "text", "bbox": {"l": 428.1217, "t": 239.25256000000002, "r": 447.82986, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 112, "text": "87-94", "bbox": {"l": 428.1217, "t": 239.25256000000002, "r": 447.82986, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 119, "label": "text", "bbox": {"l": 457.80051, "t": 239.25256000000002, "r": 477.50867, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 113, "text": "69-73", "bbox": {"l": 457.80051, "t": 239.25256000000002, "r": 477.50867, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 120, "label": "text", "bbox": {"l": 487.47034, "t": 239.25256000000002, "r": 507.17849999999993, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 114, "text": "78-86", "bbox": {"l": 487.47034, "t": 239.25256000000002, "r": 507.17849999999993, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 121, "label": "text", "bbox": {"l": 104.825, "t": 250.21155, "r": 124.63177, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 115, "text": "Table", "bbox": {"l": 104.825, "t": 250.21155, "r": 124.63177, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 122, "label": "text", "bbox": {"l": 177.866, "t": 250.21155, "r": 198.71288, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 116, "text": "34733", "bbox": {"l": 177.866, "t": 250.21155, "r": 198.71288, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 123, "label": "text", "bbox": {"l": 219.211, "t": 250.21155, "r": 233.69174000000004, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 117, "text": "3.20", "bbox": {"l": 219.211, "t": 250.21155, "r": 233.69174000000004, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 124, "label": "text", "bbox": {"l": 250.01956, "t": 250.21155, "r": 264.50031, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 118, "text": "2.27", "bbox": {"l": 250.01956, "t": 250.21155, "r": 264.50031, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 125, "label": "text", "bbox": {"l": 280.82812, "t": 250.21155, "r": 295.30887, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 119, "text": "3.60", "bbox": {"l": 280.82812, "t": 250.21155, "r": 295.30887, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 126, "label": "text", "bbox": {"l": 305.27301, "t": 250.21155, "r": 324.98117, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 120, "text": "77-81", "bbox": {"l": 305.27301, "t": 250.21155, "r": 324.98117, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 127, "label": "text", "bbox": {"l": 334.94284, "t": 250.21155, "r": 354.651, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 121, "text": "75-80", "bbox": {"l": 334.94284, "t": 250.21155, "r": 354.651, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 128, "label": "text", "bbox": {"l": 364.61267, "t": 250.21155, "r": 384.32083, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 122, "text": "83-86", "bbox": {"l": 364.61267, "t": 250.21155, "r": 384.32083, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 129, "label": "text", "bbox": {"l": 398.45187, "t": 250.21155, "r": 418.16003, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 123, "text": "98-99", "bbox": {"l": 398.45187, "t": 250.21155, "r": 418.16003, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 130, "label": "text", "bbox": {"l": 428.1217, "t": 250.21155, "r": 447.82986, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 124, "text": "58-80", "bbox": {"l": 428.1217, "t": 250.21155, "r": 447.82986, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 131, "label": "text", "bbox": {"l": 457.80051, "t": 250.21155, "r": 477.50867, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 125, "text": "79-84", "bbox": {"l": 457.80051, "t": 250.21155, "r": 477.50867, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 132, "label": "text", "bbox": {"l": 487.47034, "t": 250.21155, "r": 507.17849999999993, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 126, "text": "70-85", "bbox": {"l": 487.47034, "t": 250.21155, "r": 507.17849999999993, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 133, "label": "text", "bbox": {"l": 104.825, "t": 261.16956000000005, "r": 120.78519, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 127, "text": "Text", "bbox": {"l": 104.825, "t": 261.16956000000005, "r": 120.78519, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 134, "label": "text", "bbox": {"l": 173.69701, "t": 261.16956000000005, "r": 198.71326, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 128, "text": "510377", "bbox": {"l": 173.69701, "t": 261.16956000000005, "r": 198.71326, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 135, "label": "text", "bbox": {"l": 215.04201, "t": 261.16956000000005, "r": 233.69212, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 129, "text": "45.82", "bbox": {"l": 215.04201, "t": 261.16956000000005, "r": 233.69212, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 136, "label": "text", "bbox": {"l": 245.85056, "t": 261.16956000000005, "r": 264.50067, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 130, "text": "49.28", "bbox": {"l": 245.85056, "t": 261.16956000000005, "r": 264.50067, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 137, "label": "text", "bbox": {"l": 276.65912, "t": 261.16956000000005, "r": 295.30923, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 131, "text": "45.00", "bbox": {"l": 276.65912, "t": 261.16956000000005, "r": 295.30923, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 138, "label": "text", "bbox": {"l": 305.27301, "t": 261.16956000000005, "r": 324.98117, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 132, "text": "84-86", "bbox": {"l": 305.27301, "t": 261.16956000000005, "r": 324.98117, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 139, "label": "text", "bbox": {"l": 334.94284, "t": 261.16956000000005, "r": 354.651, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 133, "text": "81-86", "bbox": {"l": 334.94284, "t": 261.16956000000005, "r": 354.651, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 140, "label": "text", "bbox": {"l": 364.61267, "t": 261.16956000000005, "r": 384.32083, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 134, "text": "88-93", "bbox": {"l": 364.61267, "t": 261.16956000000005, "r": 384.32083, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 141, "label": "text", "bbox": {"l": 398.45187, "t": 261.16956000000005, "r": 418.16003, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 135, "text": "89-93", "bbox": {"l": 398.45187, "t": 261.16956000000005, "r": 418.16003, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 142, "label": "text", "bbox": {"l": 428.1217, "t": 261.16956000000005, "r": 447.82986, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 136, "text": "87-92", "bbox": {"l": 428.1217, "t": 261.16956000000005, "r": 447.82986, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 143, "label": "text", "bbox": {"l": 457.80051, "t": 261.16956000000005, "r": 477.50867, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 137, "text": "71-79", "bbox": {"l": 457.80051, "t": 261.16956000000005, "r": 477.50867, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 144, "label": "text", "bbox": {"l": 487.47034, "t": 261.16956000000005, "r": 507.17849999999993, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 138, "text": "87-95", "bbox": {"l": 487.47034, "t": 261.16956000000005, "r": 507.17849999999993, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 145, "label": "text", "bbox": {"l": 104.825, "t": 272.12854000000004, "r": 121.81633, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 139, "text": "Title", "bbox": {"l": 104.825, "t": 272.12854000000004, "r": 121.81633, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 146, "label": "text", "bbox": {"l": 182.035, "t": 272.12854000000004, "r": 198.71251, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 140, "text": "5071", "bbox": {"l": 182.035, "t": 272.12854000000004, "r": 198.71251, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 147, "label": "text", "bbox": {"l": 219.211, "t": 272.12854000000004, "r": 233.69174000000004, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 141, "text": "0.47", "bbox": {"l": 219.211, "t": 272.12854000000004, "r": 233.69174000000004, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 148, "label": "text", "bbox": {"l": 250.01956, "t": 272.12854000000004, "r": 264.50031, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 142, "text": "0.30", "bbox": {"l": 250.01956, "t": 272.12854000000004, "r": 264.50031, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 149, "label": "text", "bbox": {"l": 280.82812, "t": 272.12854000000004, "r": 295.30887, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 143, "text": "0.50", "bbox": {"l": 280.82812, "t": 272.12854000000004, "r": 295.30887, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 150, "label": "text", "bbox": {"l": 305.27301, "t": 272.12854000000004, "r": 324.98117, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 144, "text": "60-72", "bbox": {"l": 305.27301, "t": 272.12854000000004, "r": 324.98117, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 151, "label": "text", "bbox": {"l": 334.94284, "t": 272.12854000000004, "r": 354.651, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 145, "text": "24-63", "bbox": {"l": 334.94284, "t": 272.12854000000004, "r": 354.651, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 152, "label": "text", "bbox": {"l": 364.61267, "t": 272.12854000000004, "r": 384.32083, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 146, "text": "50-63", "bbox": {"l": 364.61267, "t": 272.12854000000004, "r": 384.32083, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 153, "label": "text", "bbox": {"l": 394.2825, "t": 272.12854000000004, "r": 418.16003, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 147, "text": "94-100", "bbox": {"l": 394.2825, "t": 272.12854000000004, "r": 418.16003, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 154, "label": "text", "bbox": {"l": 428.1217, "t": 272.12854000000004, "r": 447.82986, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 148, "text": "82-96", "bbox": {"l": 428.1217, "t": 272.12854000000004, "r": 447.82986, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 155, "label": "text", "bbox": {"l": 457.80051, "t": 272.12854000000004, "r": 477.50867, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 149, "text": "68-79", "bbox": {"l": 457.80051, "t": 272.12854000000004, "r": 477.50867, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 156, "label": "text", "bbox": {"l": 487.47034, "t": 272.12854000000004, "r": 507.17849999999993, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 150, "text": "24-56", "bbox": {"l": 487.47034, "t": 272.12854000000004, "r": 507.17849999999993, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 157, "label": "text", "bbox": {"l": 104.825, "t": 283.48654, "r": 123.43028, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 151, "text": "Total", "bbox": {"l": 104.825, "t": 283.48654, "r": 123.43028, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 158, "label": "text", "bbox": {"l": 169.52699, "t": 283.48654, "r": 198.71263, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 152, "text": "1107470", "bbox": {"l": 169.52699, "t": 283.48654, "r": 198.71263, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 159, "label": "text", "bbox": {"l": 208.675, "t": 283.48654, "r": 233.69124999999997, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 153, "text": "941123", "bbox": {"l": 208.675, "t": 283.48654, "r": 233.69124999999997, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 160, "label": "text", "bbox": {"l": 243.65291999999997, "t": 283.48654, "r": 264.49982, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 154, "text": "99816", "bbox": {"l": 243.65291999999997, "t": 283.48654, "r": 264.49982, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 161, "label": "text", "bbox": {"l": 274.46149, "t": 283.48654, "r": 295.30838, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 155, "text": "66531", "bbox": {"l": 274.46149, "t": 283.48654, "r": 295.30838, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 162, "label": "text", "bbox": {"l": 305.27301, "t": 283.48654, "r": 324.98117, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 156, "text": "82-83", "bbox": {"l": 305.27301, "t": 283.48654, "r": 324.98117, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 163, "label": "text", "bbox": {"l": 334.94284, "t": 283.48654, "r": 354.651, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 157, "text": "71-74", "bbox": {"l": 334.94284, "t": 283.48654, "r": 354.651, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 164, "label": "text", "bbox": {"l": 364.61267, "t": 283.48654, "r": 384.32083, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 158, "text": "79-81", "bbox": {"l": 364.61267, "t": 283.48654, "r": 384.32083, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 165, "label": "text", "bbox": {"l": 398.45187, "t": 283.48654, "r": 418.16003, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 159, "text": "89-94", "bbox": {"l": 398.45187, "t": 283.48654, "r": 418.16003, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 166, "label": "text", "bbox": {"l": 428.1217, "t": 283.48654, "r": 447.82986, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 160, "text": "86-91", "bbox": {"l": 428.1217, "t": 283.48654, "r": 447.82986, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 167, "label": "text", "bbox": {"l": 457.80051, "t": 283.48654, "r": 477.50867, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 161, "text": "71-76", "bbox": {"l": 457.80051, "t": 283.48654, "r": 477.50867, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 168, "label": "text", "bbox": {"l": 487.47034, "t": 283.48654, "r": 507.17849999999993, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 162, "text": "68-85", "bbox": {"l": 487.47034, "t": 283.48654, "r": 507.17849999999993, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "lcel", "lcel", "lcel", "ched", "lcel", "lcel", "lcel", "lcel", "lcel", "nl", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 14, "num_cols": 12, "table_cells": [{"bbox": {"l": 233.94400000000002, "t": 140.22351000000003, "r": 270.04272, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 4, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 6, "text": "% of Total", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 329.04999, "t": 140.22351000000003, "r": 483.3976400000001, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 6, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 6, "end_col_offset_idx": 12, "text": "triple inter-annotator mAP @ 0.5-0.95 (%)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 151.18255999999997, "r": 141.71277, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "class label", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 175.94701, "t": 151.18255999999997, "r": 198.71269, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Count", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 213.795, "t": 151.18255999999997, "r": 233.69144, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Train", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 249.37367, "t": 151.18255999999997, "r": 264.5, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Test", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 283.53568, "t": 151.18255999999997, "r": 295.30856, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Val", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 314.01501, "t": 151.18255999999997, "r": 324.98093, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "All", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 343.01236, "t": 151.18255999999997, "r": 354.65076, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "Fin", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 367.84033, "t": 151.18255999999997, "r": 384.32059, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "Man", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 407.54358, "t": 151.18255999999997, "r": 418.15979, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "Sci", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 432.29979999999995, "t": 151.18255999999997, "r": 447.82962, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "Law", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 465.72656, "t": 151.18255999999997, "r": 477.50842, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "Pat", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 493.52240000000006, "t": 151.18255999999997, "r": 507.17822, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "Ten", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 162.53954999999996, "r": 134.01064, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Caption", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 177.866, "t": 162.53954999999996, "r": 198.71288, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "22524", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 162.53954999999996, "r": 233.69174000000004, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "2.04", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 162.53954999999996, "r": 264.50031, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "1.77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 162.53954999999996, "r": 295.30887, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "2.32", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 162.53954999999996, "r": 324.98117, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "84-89", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 162.53954999999996, "r": 354.651, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "40-61", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 162.53954999999996, "r": 384.32083, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "86-92", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45187, "t": 162.53954999999996, "r": 418.16003, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "94-99", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 162.53954999999996, "r": 447.82986, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "95-99", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 162.53954999999996, "r": 477.50867, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "69-78", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 495.32489, "t": 162.53954999999996, "r": 507.17846999999995, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 173.49854000000005, "r": 137.3282, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Footnote", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 182.035, "t": 173.49854000000005, "r": 198.71251, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "6318", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 173.49854000000005, "r": 233.69174000000004, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.60", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 173.49854000000005, "r": 264.50031, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.31", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 173.49854000000005, "r": 295.30887, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.58", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 173.49854000000005, "r": 324.98117, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "83-91", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 342.79739, "t": 173.49854000000005, "r": 354.65097, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 371.81265, "t": 173.49854000000005, "r": 384.32077, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "100", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45181, "t": 173.49854000000005, "r": 418.15997, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "62-88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.12164, "t": 173.49854000000005, "r": 447.8298, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "85-94", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 465.655, "t": 173.49854000000005, "r": 477.50857999999994, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47025, "t": 173.49854000000005, "r": 507.17841, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "82-97", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 184.45752000000005, "r": 135.33766, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Formula", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 177.866, "t": 184.45752000000005, "r": 198.71288, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "25027", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 184.45752000000005, "r": 233.69174000000004, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "2.25", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 184.45752000000005, "r": 264.50031, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "1.90", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 184.45752000000005, "r": 295.30887, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "2.96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 184.45752000000005, "r": 324.98117, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "83-85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 342.79739, "t": 184.45752000000005, "r": 354.65097, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 372.46719, "t": 184.45752000000005, "r": 384.32077, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45181, "t": 184.45752000000005, "r": 418.15997, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "84-87", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.12164, "t": 184.45752000000005, "r": 447.8298, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "86-96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 465.655, "t": 184.45752000000005, "r": 477.50857999999994, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 495.3248, "t": 184.45752000000005, "r": 507.17838000000006, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 195.41656, "r": 137.70479, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "List-item", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 173.69701, "t": 195.41656, "r": 198.71326, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "185660", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 215.04201, "t": 195.41656, "r": 233.69212, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "17.19", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.85056, "t": 195.41656, "r": 264.50067, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "13.34", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 276.65912, "t": 195.41656, "r": 295.30923, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "15.82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 195.41656, "r": 324.98117, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "87-88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 195.41656, "r": 354.651, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "74-83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 195.41656, "r": 384.32083, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "90-92", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45187, "t": 195.41656, "r": 418.16003, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "97-97", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 195.41656, "r": 447.82986, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "81-85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 195.41656, "r": 477.50867, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "75-88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 195.41656, "r": 507.17849999999993, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "93-95", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 206.37554999999998, "r": 147.35262, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-footer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 177.866, "t": 206.37554999999998, "r": 198.71288, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "70878", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 206.37554999999998, "r": 233.69174000000004, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "6.51", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 206.37554999999998, "r": 264.50031, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "5.58", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 206.37554999999998, "r": 295.30887, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "6.00", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 206.37554999999998, "r": 324.98117, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "93-94", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 206.37554999999998, "r": 354.651, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "88-90", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 206.37554999999998, "r": 384.32083, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "95-96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 405.65189, "t": 206.37554999999998, "r": 418.16, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "100", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.12167, "t": 206.37554999999998, "r": 447.82983, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "92-97", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 465.00049, "t": 206.37554999999998, "r": 477.5086099999999, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "100", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47028, "t": 206.37554999999998, "r": 507.17843999999997, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "96-98", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 217.33452999999997, "r": 150.10532, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 177.866, "t": 217.33452999999997, "r": 198.71288, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "58022", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 217.33452999999997, "r": 233.69174000000004, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "5.10", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 217.33452999999997, "r": 264.50031, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "6.70", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 217.33452999999997, "r": 295.30887, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "5.06", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 217.33452999999997, "r": 324.98117, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "85-89", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 217.33452999999997, "r": 354.651, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "66-76", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 217.33452999999997, "r": 384.32083, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "90-94", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.2825, "t": 217.33452999999997, "r": 418.16003, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "98-100", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 217.33452999999997, "r": 447.82986, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "91-92", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 217.33452999999997, "r": 477.50867, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "97-99", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 217.33452999999997, "r": 507.17849999999993, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "81-86", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 228.29351999999994, "r": 130.80963, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Picture", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 177.866, "t": 228.29351999999994, "r": 198.71288, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "45976", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 228.29351999999994, "r": 233.69174000000004, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "4.21", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 228.29351999999994, "r": 264.50031, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "2.78", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 228.29351999999994, "r": 295.30887, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "5.31", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 228.29351999999994, "r": 324.98117, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "69-71", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 228.29351999999994, "r": 354.651, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "56-59", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 228.29351999999994, "r": 384.32083, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "82-86", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45187, "t": 228.29351999999994, "r": 418.16003, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "69-82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 228.29351999999994, "r": 447.82986, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "80-95", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 228.29351999999994, "r": 477.50867, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "66-71", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 228.29351999999994, "r": 507.17849999999993, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "59-76", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 239.25256000000002, "r": 159.56487, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Section-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 173.69701, "t": 239.25256000000002, "r": 198.71326, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "142884", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 215.04201, "t": 239.25256000000002, "r": 233.69212, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "12.60", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.85056, "t": 239.25256000000002, "r": 264.50067, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "15.77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 276.65912, "t": 239.25256000000002, "r": 295.30923, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "12.85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 239.25256000000002, "r": 324.98117, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "83-84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 239.25256000000002, "r": 354.651, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "76-81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 239.25256000000002, "r": 384.32083, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "90-92", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45187, "t": 239.25256000000002, "r": 418.16003, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "94-95", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 239.25256000000002, "r": 447.82986, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "87-94", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 239.25256000000002, "r": 477.50867, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "69-73", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 239.25256000000002, "r": 507.17849999999993, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "78-86", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 250.21155, "r": 124.63177, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 177.866, "t": 250.21155, "r": 198.71288, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "34733", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 250.21155, "r": 233.69174000000004, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "3.20", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 250.21155, "r": 264.50031, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "2.27", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 250.21155, "r": 295.30887, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "3.60", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 250.21155, "r": 324.98117, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "77-81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 250.21155, "r": 354.651, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "75-80", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 250.21155, "r": 384.32083, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "83-86", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45187, "t": 250.21155, "r": 418.16003, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "98-99", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 250.21155, "r": 447.82986, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "58-80", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 250.21155, "r": 477.50867, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "79-84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 250.21155, "r": 507.17849999999993, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "70-85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 261.16956000000005, "r": 120.78519, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Text", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 173.69701, "t": 261.16956000000005, "r": 198.71326, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "510377", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 215.04201, "t": 261.16956000000005, "r": 233.69212, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "45.82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.85056, "t": 261.16956000000005, "r": 264.50067, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "49.28", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 276.65912, "t": 261.16956000000005, "r": 295.30923, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "45.00", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 261.16956000000005, "r": 324.98117, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "84-86", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 261.16956000000005, "r": 354.651, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "81-86", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 261.16956000000005, "r": 384.32083, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "88-93", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45187, "t": 261.16956000000005, "r": 418.16003, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "89-93", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 261.16956000000005, "r": 447.82986, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "87-92", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 261.16956000000005, "r": 477.50867, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "71-79", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 261.16956000000005, "r": 507.17849999999993, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "87-95", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 272.12854000000004, "r": 121.81633, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Title", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 182.035, "t": 272.12854000000004, "r": 198.71251, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "5071", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 272.12854000000004, "r": 233.69174000000004, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.47", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 272.12854000000004, "r": 264.50031, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.30", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 272.12854000000004, "r": 295.30887, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.50", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 272.12854000000004, "r": 324.98117, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "60-72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 272.12854000000004, "r": 354.651, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "24-63", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 272.12854000000004, "r": 384.32083, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "50-63", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.2825, "t": 272.12854000000004, "r": 418.16003, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "94-100", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 272.12854000000004, "r": 447.82986, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "82-96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 272.12854000000004, "r": 477.50867, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "68-79", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 272.12854000000004, "r": 507.17849999999993, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "24-56", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 283.48654, "r": 123.43028, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Total", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 169.52699, "t": 283.48654, "r": 198.71263, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "1107470", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 208.675, "t": 283.48654, "r": 233.69124999999997, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "941123", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 243.65291999999997, "t": 283.48654, "r": 264.49982, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "99816", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 274.46149, "t": 283.48654, "r": 295.30838, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "66531", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 283.48654, "r": 324.98117, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "82-83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 283.48654, "r": 354.651, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "71-74", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 283.48654, "r": 384.32083, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "79-81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45187, "t": 283.48654, "r": 418.16003, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "89-94", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 283.48654, "r": 447.82986, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "86-91", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 283.48654, "r": 477.50867, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "71-76", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 283.48654, "r": 507.17849999999993, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "68-85", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "caption", "id": 9, "page_no": 3, "cluster": {"id": 9, "label": "caption", "bbox": {"l": 53.79800000000001, "t": 554.00999, "r": 295.64874, "b": 606.31924, "coord_origin": "TOPLEFT"}, "confidence": 0.810490071773529, "cells": [{"id": 163, "text": "Figure 3: Corpus Conversion Service annotation user inter-", "bbox": {"l": 53.79800000000001, "t": 554.00999, "r": 295.64871, "b": 562.48325, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "face. The PDF page is shown in the background, with over-", "bbox": {"l": 53.79800000000001, "t": 564.96899, "r": 295.64874, "b": 573.44225, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "laid text-cells (in darker shades). The annotation boxes can", "bbox": {"l": 53.79800000000001, "t": 575.92799, "r": 294.04376, "b": 584.40125, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "be drawn by dragging a rectangle over each segment with", "bbox": {"l": 53.79800000000001, "t": 586.88699, "r": 294.04373, "b": 595.36024, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "the respective label from the palette on the right.", "bbox": {"l": 53.79800000000001, "t": 597.84599, "r": 252.78931000000003, "b": 606.31924, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 3: Corpus Conversion Service annotation user interface. The PDF page is shown in the background, with overlaid text-cells (in darker shades). The annotation boxes can be drawn by dragging a rectangle over each segment with the respective label from the palette on the right."}, {"label": "text", "id": 5, "page_no": 3, "cluster": {"id": 5, "label": "text", "bbox": {"l": 53.466999, "t": 634.29155, "r": 294.04745, "b": 675.54317, "coord_origin": "TOPLEFT"}, "confidence": 0.980393648147583, "cells": [{"id": 168, "text": "we distributed the annotation workload and performed continuous", "bbox": {"l": 53.466999, "t": 634.29155, "r": 294.04745, "b": 642.66617, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "quality controls. Phase one and two required a small team of experts", "bbox": {"l": 53.79800000000001, "t": 645.25055, "r": 294.04535, "b": 653.62517, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "only. For phases three and four, a group of 40 dedicated annotators", "bbox": {"l": 53.79800000000001, "t": 656.20955, "r": 294.04422, "b": 664.58417, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "were assembled and supervised.", "bbox": {"l": 53.466999, "t": 667.16856, "r": 170.58611, "b": 675.54317, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "we distributed the annotation workload and performed continuous quality controls. Phase one and two required a small team of experts only. For phases three and four, a group of 40 dedicated annotators were assembled and supervised."}, {"label": "text", "id": 6, "page_no": 3, "cluster": {"id": 6, "label": "text", "bbox": {"l": 53.79800000000001, "t": 678.01099, "r": 295.55844, "b": 708.420174, "coord_origin": "TOPLEFT"}, "confidence": 0.9748398661613464, "cells": [{"id": 172, "text": "Phase 1: Data selection and preparation.", "bbox": {"l": 63.76099800000001, "t": 678.01099, "r": 226.72533000000004, "b": 686.48424, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "Our inclusion cri-", "bbox": {"l": 229.06900000000002, "t": 678.12756, "r": 295.55844, "b": 686.50217, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "teria for documents were described in Section 3. A large effort went", "bbox": {"l": 53.79800000000001, "t": 689.08656, "r": 294.04538, "b": 697.461174, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "into ensuring that all documents are free to use. The data sources", "bbox": {"l": 53.79800000000001, "t": 700.045555, "r": 294.04642, "b": 708.420174, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Phase 1: Data selection and preparation. Our inclusion criteria for documents were described in Section 3. A large effort went into ensuring that all documents are free to use. The data sources"}, {"label": "text", "id": 4, "page_no": 3, "cluster": {"id": 4, "label": "text", "bbox": {"l": 317.95499, "t": 312.07953, "r": 559.18536, "b": 375.24817, "coord_origin": "TOPLEFT"}, "confidence": 0.9818483591079712, "cells": [{"id": 176, "text": "include publication repositories such as arXiv$^{3}$, government offices,", "bbox": {"l": 317.95499, "t": 312.07953, "r": 559.18536, "b": 320.45416000000006, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "company websites as well as data directory services for financial", "bbox": {"l": 317.95499, "t": 323.03754, "r": 558.19843, "b": 331.41217, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "reports and patents. Scanned documents were excluded wherever", "bbox": {"l": 317.95499, "t": 333.99655, "r": 558.36963, "b": 342.37119, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "possible because they can be rotated or skewed. This would not", "bbox": {"l": 317.95499, "t": 344.95554, "r": 558.2041, "b": 353.33017, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "allow us to perform annotation with rectangular bounding-boxes", "bbox": {"l": 317.95499, "t": 355.91455, "r": 558.20294, "b": 364.28918, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "and therefore complicate the annotation process.", "bbox": {"l": 317.95499, "t": 366.87354, "r": 496.71826, "b": 375.24817, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "include publication repositories such as arXiv$^{3}$, government offices, company websites as well as data directory services for financial reports and patents. Scanned documents were excluded wherever possible because they can be rotated or skewed. This would not allow us to perform annotation with rectangular bounding-boxes and therefore complicate the annotation process."}, {"label": "text", "id": 0, "page_no": 3, "cluster": {"id": 0, "label": "text", "bbox": {"l": 317.95499, "t": 377.8325500000001, "r": 559.71307, "b": 506.75516, "coord_origin": "TOPLEFT"}, "confidence": 0.9866719841957092, "cells": [{"id": 182, "text": "Preparation work included uploading and parsing the sourced", "bbox": {"l": 327.918, "t": 377.8325500000001, "r": 558.20618, "b": 386.20717999999994, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "PDF documents in the Corpus Conversion Service (CCS) [22], a", "bbox": {"l": 317.95499, "t": 388.79153, "r": 558.2019, "b": 397.16617, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "cloud-native platform which provides a visual annotation interface", "bbox": {"l": 317.95499, "t": 399.75055, "r": 558.20233, "b": 408.12518, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": "and allows for dataset inspection and analysis. The annotation in-", "bbox": {"l": 317.95499, "t": 410.7095299999999, "r": 559.71277, "b": 419.08417, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "terface of CCS is shown in Figure 3. The desired balance of pages", "bbox": {"l": 317.95499, "t": 421.66855000000004, "r": 558.20062, "b": 430.04318, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "between the different document categories was achieved by se-", "bbox": {"l": 317.95499, "t": 432.62753, "r": 559.71307, "b": 441.00217, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": "lective subsampling of pages with certain desired properties. For", "bbox": {"l": 317.95499, "t": 443.58554, "r": 558.36877, "b": 451.96017, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "example, we made sure to include the title page of each document", "bbox": {"l": 317.95499, "t": 454.54453, "r": 558.20428, "b": 462.91916, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "and bias the remaining page selection to those with figures or", "bbox": {"l": 317.95499, "t": 465.50354, "r": 558.36877, "b": 473.87817, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "tables. The latter was achieved by leveraging pre-trained object", "bbox": {"l": 317.95499, "t": 476.46252, "r": 558.20428, "b": 484.83716, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": "detection models from PubLayNet, which helped us estimate how", "bbox": {"l": 317.95499, "t": 487.42154, "r": 558.5307, "b": 495.79617, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "many figures and tables a given page contains.", "bbox": {"l": 317.95499, "t": 498.38052, "r": 488.46914999999996, "b": 506.75516, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Preparation work included uploading and parsing the sourced PDF documents in the Corpus Conversion Service (CCS) [22], a cloud-native platform which provides a visual annotation interface and allows for dataset inspection and analysis. The annotation interface of CCS is shown in Figure 3. The desired balance of pages between the different document categories was achieved by selective subsampling of pages with certain desired properties. For example, we made sure to include the title page of each document and bias the remaining page selection to those with figures or tables. The latter was achieved by leveraging pre-trained object detection models from PubLayNet, which helped us estimate how many figures and tables a given page contains."}, {"label": "text", "id": 3, "page_no": 3, "cluster": {"id": 3, "label": "text", "bbox": {"l": 317.62299, "t": 509.22299, "r": 559.71765, "b": 693.0561749999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9847556948661804, "cells": [{"id": 194, "text": "Phase 2: Label selection and guideline.", "bbox": {"l": 327.918, "t": 509.22299, "r": 482.41809, "b": 517.69623, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "We reviewed the col-", "bbox": {"l": 484.474, "t": 509.33954, "r": 559.71765, "b": 517.71417, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "lected documents and identified the most common structural fea-", "bbox": {"l": 317.95499, "t": 520.29855, "r": 559.71619, "b": 528.67319, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "tures they exhibit. This was achieved by identifying recurrent layout", "bbox": {"l": 317.95499, "t": 531.2575400000001, "r": 558.20239, "b": 539.63217, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "elements and lead us to the definition of 11 distinct class labels.", "bbox": {"l": 317.95499, "t": 542.21655, "r": 559.58502, "b": 550.59117, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "These 11 class labels are", "bbox": {"l": 317.686, "t": 553.17456, "r": 404.14197, "b": 561.54918, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "Caption", "bbox": {"l": 406.26599, "t": 553.21939, "r": 433.84860000000003, "b": 561.5581500000001, "coord_origin": "TOPLEFT"}}, {"id": 201, "text": ",", "bbox": {"l": 433.84799, "t": 553.17456, "r": 435.78115999999994, "b": 561.54918, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": "Footnote", "bbox": {"l": 437.9079899999999, "t": 553.21939, "r": 467.23926, "b": 561.5581500000001, "coord_origin": "TOPLEFT"}}, {"id": 203, "text": ",", "bbox": {"l": 467.23999, "t": 553.17456, "r": 469.17316000000005, "b": 561.54918, "coord_origin": "TOPLEFT"}}, {"id": 204, "text": "Formula", "bbox": {"l": 471.29900999999995, "t": 553.21939, "r": 500.44574000000006, "b": 561.5581500000001, "coord_origin": "TOPLEFT"}}, {"id": 205, "text": ",", "bbox": {"l": 500.44601000000006, "t": 553.17456, "r": 502.37918, "b": 561.54918, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": "List-item", "bbox": {"l": 504.505, "t": 553.21939, "r": 535.74304, "b": 561.5581500000001, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": ",", "bbox": {"l": 535.74298, "t": 553.17456, "r": 537.67615, "b": 561.54918, "coord_origin": "TOPLEFT"}}, {"id": 208, "text": "Page-", "bbox": {"l": 539.802, "t": 553.21939, "r": 559.09839, "b": 561.5581500000001, "coord_origin": "TOPLEFT"}}, {"id": 209, "text": "footer", "bbox": {"l": 317.95499, "t": 564.17839, "r": 338.80725, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": ",", "bbox": {"l": 338.806, "t": 564.13356, "r": 340.81805, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "Page-header", "bbox": {"l": 343.61401, "t": 564.17839, "r": 387.96164, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 212, "text": ",", "bbox": {"l": 387.961, "t": 564.13356, "r": 389.97305, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "Picture", "bbox": {"l": 392.76901, "t": 564.17839, "r": 417.84662, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 214, "text": ",", "bbox": {"l": 417.84799, "t": 564.13356, "r": 419.86005, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 215, "text": "Section-header", "bbox": {"l": 422.655, "t": 564.17839, "r": 475.56305, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 216, "text": ",", "bbox": {"l": 475.56201, "t": 564.13356, "r": 477.57407, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 217, "text": "Table", "bbox": {"l": 480.36899, "t": 564.17839, "r": 499.82196, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 218, "text": ",", "bbox": {"l": 499.8219900000001, "t": 564.13356, "r": 501.83405, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 219, "text": "Text", "bbox": {"l": 504.6290000000001, "t": 564.17839, "r": 519.7926, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 220, "text": ", and", "bbox": {"l": 519.79602, "t": 564.13356, "r": 538.37103, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 221, "text": "Title", "bbox": {"l": 541.16302, "t": 564.17839, "r": 557.57043, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 222, "text": ".", "bbox": {"l": 557.57098, "t": 564.13356, "r": 559.58307, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 223, "text": "Critical factors that were considered for the choice of these class", "bbox": {"l": 317.95499, "t": 575.09256, "r": 558.20416, "b": 583.46718, "coord_origin": "TOPLEFT"}}, {"id": 224, "text": "labels were (1) the overall occurrence of the label, (2) the specificity", "bbox": {"l": 317.95499, "t": 586.05156, "r": 558.43091, "b": 594.4261799999999, "coord_origin": "TOPLEFT"}}, {"id": 225, "text": "of the label, (3) recognisability on a single page (i.e. no need for", "bbox": {"l": 317.95499, "t": 597.0105599999999, "r": 558.36871, "b": 605.38518, "coord_origin": "TOPLEFT"}}, {"id": 226, "text": "context from previous or next page) and (4) overall coverage of the", "bbox": {"l": 317.95499, "t": 607.96956, "r": 558.20105, "b": 616.3441799999999, "coord_origin": "TOPLEFT"}}, {"id": 227, "text": "page. Specificity ensures that the choice of label is not ambiguous,", "bbox": {"l": 317.95499, "t": 618.9285600000001, "r": 559.18665, "b": 627.30318, "coord_origin": "TOPLEFT"}}, {"id": 228, "text": "while coverage ensures that all meaningful items on a page can", "bbox": {"l": 317.62299, "t": 629.88756, "r": 558.20142, "b": 638.26218, "coord_origin": "TOPLEFT"}}, {"id": 229, "text": "be annotated. We refrained from class labels that are very specific", "bbox": {"l": 317.95499, "t": 640.84656, "r": 558.20227, "b": 649.22118, "coord_origin": "TOPLEFT"}}, {"id": 230, "text": "to a document category, such as", "bbox": {"l": 317.95499, "t": 651.80556, "r": 436.90649, "b": 660.1801800000001, "coord_origin": "TOPLEFT"}}, {"id": 231, "text": "Abstract", "bbox": {"l": 439.13800000000003, "t": 651.8503900000001, "r": 469.69134999999994, "b": 660.18915, "coord_origin": "TOPLEFT"}}, {"id": 232, "text": "in the", "bbox": {"l": 472.42898999999994, "t": 651.80556, "r": 493.97348, "b": 660.1801800000001, "coord_origin": "TOPLEFT"}}, {"id": 233, "text": "Scientific Articles", "bbox": {"l": 496.207, "t": 651.8503900000001, "r": 558.20001, "b": 660.18915, "coord_origin": "TOPLEFT"}}, {"id": 234, "text": "category. We also avoided class labels that are tightly linked to the", "bbox": {"l": 317.95499, "t": 662.76456, "r": 558.20557, "b": 671.13918, "coord_origin": "TOPLEFT"}}, {"id": 235, "text": "semantics of the text. Labels such as", "bbox": {"l": 317.95499, "t": 673.7225599999999, "r": 447.65221999999994, "b": 682.09718, "coord_origin": "TOPLEFT"}}, {"id": 236, "text": "Author", "bbox": {"l": 449.85999, "t": 673.76739, "r": 474.31439, "b": 682.10614, "coord_origin": "TOPLEFT"}}, {"id": 237, "text": "and", "bbox": {"l": 477.172, "t": 673.7225599999999, "r": 490.39655, "b": 682.09718, "coord_origin": "TOPLEFT"}}, {"id": 238, "text": "Affiliation", "bbox": {"l": 492.60599, "t": 673.76739, "r": 528.29907, "b": 682.10614, "coord_origin": "TOPLEFT"}}, {"id": 239, "text": ", as seen", "bbox": {"l": 528.29901, "t": 673.7225599999999, "r": 558.20148, "b": 682.09718, "coord_origin": "TOPLEFT"}}, {"id": 240, "text": "in DocBank, are often only distinguishable by discriminating on", "bbox": {"l": 317.95499, "t": 684.68156, "r": 558.2041, "b": 693.0561749999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Phase 2: Label selection and guideline. We reviewed the collected documents and identified the most common structural features they exhibit. This was achieved by identifying recurrent layout elements and lead us to the definition of 11 distinct class labels. These 11 class labels are Caption , Footnote , Formula , List-item , Pagefooter , Page-header , Picture , Section-header , Table , Text , and Title . Critical factors that were considered for the choice of these class labels were (1) the overall occurrence of the label, (2) the specificity of the label, (3) recognisability on a single page (i.e. no need for context from previous or next page) and (4) overall coverage of the page. Specificity ensures that the choice of label is not ambiguous, while coverage ensures that all meaningful items on a page can be annotated. We refrained from class labels that are very specific to a document category, such as Abstract in the Scientific Articles category. We also avoided class labels that are tightly linked to the semantics of the text. Labels such as Author and Affiliation , as seen in DocBank, are often only distinguishable by discriminating on"}, {"label": "footnote", "id": 7, "page_no": 3, "cluster": {"id": 7, "label": "footnote", "bbox": {"l": 317.95499, "t": 702.353363, "r": 369.2457, "b": 708.86689, "coord_origin": "TOPLEFT"}, "confidence": 0.9080352783203125, "cells": [{"id": 241, "text": "$^{3}$https://arxiv.org/", "bbox": {"l": 317.95499, "t": 702.353363, "r": 369.2457, "b": 708.86689, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "$^{3}$https://arxiv.org/"}, {"label": "picture", "id": 2, "page_no": 3, "cluster": {"id": 2, "label": "picture", "bbox": {"l": 53.05912780761719, "t": 310.7912902832031, "r": 295.8506164550781, "b": 540.864013671875, "coord_origin": "TOPLEFT"}, "confidence": 0.9847871661186218, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "body": [{"label": "caption", "id": 8, "page_no": 3, "cluster": {"id": 8, "label": "caption", "bbox": {"l": 53.501999, "t": 84.95495999999991, "r": 558.48969, "b": 115.34618999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.8906616568565369, "cells": [{"id": 2, "text": "Table 1: DocLayNet dataset overview. Along with the frequency of each class label, we present the relative occurrence (as %", "bbox": {"l": 53.501999, "t": 84.95495999999991, "r": 558.48969, "b": 93.42822000000001, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "of row \u201cTotal\u201d) in the train, test and validation sets. The inter-annotator agreement is computed as the mAP@0.5-0.95 metric", "bbox": {"l": 53.79800000000001, "t": 95.91394000000003, "r": 558.20294, "b": 104.3872100000001, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "between pairwise annotations from the triple-annotated pages, from which we obtain accuracy ranges.", "bbox": {"l": 53.79800000000001, "t": 106.87292000000002, "r": 469.84805000000006, "b": 115.34618999999998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 1: DocLayNet dataset overview. Along with the frequency of each class label, we present the relative occurrence (as % of row \"Total\") in the train, test and validation sets. The inter-annotator agreement is computed as the mAP@0.5-0.95 metric between pairwise annotations from the triple-annotated pages, from which we obtain accuracy ranges."}, {"label": "table", "id": 1, "page_no": 3, "cluster": {"id": 1, "label": "table", "bbox": {"l": 98.93103790283203, "t": 137.47547912597656, "r": 512.579833984375, "b": 294.08148193359375, "coord_origin": "TOPLEFT"}, "confidence": 0.9860090613365173, "cells": [{"id": 5, "text": "% of Total", "bbox": {"l": 233.94400000000002, "t": 140.22351000000003, "r": 270.04272, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "triple inter-annotator mAP @ 0.5-0.95 (%)", "bbox": {"l": 329.04999, "t": 140.22351000000003, "r": 483.3976400000001, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "class label", "bbox": {"l": 104.825, "t": 151.18255999999997, "r": 141.71277, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Count", "bbox": {"l": 175.94701, "t": 151.18255999999997, "r": 198.71269, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Train", "bbox": {"l": 213.795, "t": 151.18255999999997, "r": 233.69144, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Test", "bbox": {"l": 249.37367, "t": 151.18255999999997, "r": 264.5, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Val", "bbox": {"l": 283.53568, "t": 151.18255999999997, "r": 295.30856, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "All", "bbox": {"l": 314.01501, "t": 151.18255999999997, "r": 324.98093, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Fin", "bbox": {"l": 343.01236, "t": 151.18255999999997, "r": 354.65076, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Man", "bbox": {"l": 367.84033, "t": 151.18255999999997, "r": 384.32059, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Sci", "bbox": {"l": 407.54358, "t": 151.18255999999997, "r": 418.15979, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Law", "bbox": {"l": 432.29979999999995, "t": 151.18255999999997, "r": 447.82962, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "Pat", "bbox": {"l": 465.72656, "t": 151.18255999999997, "r": 477.50842, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Ten", "bbox": {"l": 493.52240000000006, "t": 151.18255999999997, "r": 507.17822, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Caption", "bbox": {"l": 104.825, "t": 162.53954999999996, "r": 134.01064, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "22524", "bbox": {"l": 177.866, "t": 162.53954999999996, "r": 198.71288, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "2.04", "bbox": {"l": 219.211, "t": 162.53954999999996, "r": 233.69174000000004, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "1.77", "bbox": {"l": 250.01956, "t": 162.53954999999996, "r": 264.50031, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "2.32", "bbox": {"l": 280.82812, "t": 162.53954999999996, "r": 295.30887, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "84-89", "bbox": {"l": 305.27301, "t": 162.53954999999996, "r": 324.98117, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "40-61", "bbox": {"l": 334.94284, "t": 162.53954999999996, "r": 354.651, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "86-92", "bbox": {"l": 364.61267, "t": 162.53954999999996, "r": 384.32083, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "94-99", "bbox": {"l": 398.45187, "t": 162.53954999999996, "r": 418.16003, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "95-99", "bbox": {"l": 428.1217, "t": 162.53954999999996, "r": 447.82986, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "69-78", "bbox": {"l": 457.80051, "t": 162.53954999999996, "r": 477.50867, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "n/a", "bbox": {"l": 495.32489, "t": 162.53954999999996, "r": 507.17846999999995, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Footnote", "bbox": {"l": 104.825, "t": 173.49854000000005, "r": 137.3282, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "6318", "bbox": {"l": 182.035, "t": 173.49854000000005, "r": 198.71251, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "0.60", "bbox": {"l": 219.211, "t": 173.49854000000005, "r": 233.69174000000004, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "0.31", "bbox": {"l": 250.01956, "t": 173.49854000000005, "r": 264.50031, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "0.58", "bbox": {"l": 280.82812, "t": 173.49854000000005, "r": 295.30887, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "83-91", "bbox": {"l": 305.27301, "t": 173.49854000000005, "r": 324.98117, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "n/a", "bbox": {"l": 342.79739, "t": 173.49854000000005, "r": 354.65097, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "100", "bbox": {"l": 371.81265, "t": 173.49854000000005, "r": 384.32077, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "62-88", "bbox": {"l": 398.45181, "t": 173.49854000000005, "r": 418.15997, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "85-94", "bbox": {"l": 428.12164, "t": 173.49854000000005, "r": 447.8298, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "n/a", "bbox": {"l": 465.655, "t": 173.49854000000005, "r": 477.50857999999994, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "82-97", "bbox": {"l": 487.47025, "t": 173.49854000000005, "r": 507.17841, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Formula", "bbox": {"l": 104.825, "t": 184.45752000000005, "r": 135.33766, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "25027", "bbox": {"l": 177.866, "t": 184.45752000000005, "r": 198.71288, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "2.25", "bbox": {"l": 219.211, "t": 184.45752000000005, "r": 233.69174000000004, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "1.90", "bbox": {"l": 250.01956, "t": 184.45752000000005, "r": 264.50031, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "2.96", "bbox": {"l": 280.82812, "t": 184.45752000000005, "r": 295.30887, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "83-85", "bbox": {"l": 305.27301, "t": 184.45752000000005, "r": 324.98117, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "n/a", "bbox": {"l": 342.79739, "t": 184.45752000000005, "r": 354.65097, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "n/a", "bbox": {"l": 372.46719, "t": 184.45752000000005, "r": 384.32077, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "84-87", "bbox": {"l": 398.45181, "t": 184.45752000000005, "r": 418.15997, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "86-96", "bbox": {"l": 428.12164, "t": 184.45752000000005, "r": 447.8298, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "n/a", "bbox": {"l": 465.655, "t": 184.45752000000005, "r": 477.50857999999994, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "n/a", "bbox": {"l": 495.3248, "t": 184.45752000000005, "r": 507.17838000000006, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "List-item", "bbox": {"l": 104.825, "t": 195.41656, "r": 137.70479, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "185660", "bbox": {"l": 173.69701, "t": 195.41656, "r": 198.71326, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "17.19", "bbox": {"l": 215.04201, "t": 195.41656, "r": 233.69212, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "13.34", "bbox": {"l": 245.85056, "t": 195.41656, "r": 264.50067, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "15.82", "bbox": {"l": 276.65912, "t": 195.41656, "r": 295.30923, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "87-88", "bbox": {"l": 305.27301, "t": 195.41656, "r": 324.98117, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "74-83", "bbox": {"l": 334.94284, "t": 195.41656, "r": 354.651, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "90-92", "bbox": {"l": 364.61267, "t": 195.41656, "r": 384.32083, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "97-97", "bbox": {"l": 398.45187, "t": 195.41656, "r": 418.16003, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "81-85", "bbox": {"l": 428.1217, "t": 195.41656, "r": 447.82986, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "75-88", "bbox": {"l": 457.80051, "t": 195.41656, "r": 477.50867, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "93-95", "bbox": {"l": 487.47034, "t": 195.41656, "r": 507.17849999999993, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "Page-footer", "bbox": {"l": 104.825, "t": 206.37554999999998, "r": 147.35262, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "70878", "bbox": {"l": 177.866, "t": 206.37554999999998, "r": 198.71288, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "6.51", "bbox": {"l": 219.211, "t": 206.37554999999998, "r": 233.69174000000004, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "5.58", "bbox": {"l": 250.01956, "t": 206.37554999999998, "r": 264.50031, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "6.00", "bbox": {"l": 280.82812, "t": 206.37554999999998, "r": 295.30887, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "93-94", "bbox": {"l": 305.27301, "t": 206.37554999999998, "r": 324.98117, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "88-90", "bbox": {"l": 334.94284, "t": 206.37554999999998, "r": 354.651, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "95-96", "bbox": {"l": 364.61267, "t": 206.37554999999998, "r": 384.32083, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "100", "bbox": {"l": 405.65189, "t": 206.37554999999998, "r": 418.16, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "92-97", "bbox": {"l": 428.12167, "t": 206.37554999999998, "r": 447.82983, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "100", "bbox": {"l": 465.00049, "t": 206.37554999999998, "r": 477.5086099999999, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "96-98", "bbox": {"l": 487.47028, "t": 206.37554999999998, "r": 507.17843999999997, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "Page-header", "bbox": {"l": 104.825, "t": 217.33452999999997, "r": 150.10532, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "58022", "bbox": {"l": 177.866, "t": 217.33452999999997, "r": 198.71288, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "5.10", "bbox": {"l": 219.211, "t": 217.33452999999997, "r": 233.69174000000004, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "6.70", "bbox": {"l": 250.01956, "t": 217.33452999999997, "r": 264.50031, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "5.06", "bbox": {"l": 280.82812, "t": 217.33452999999997, "r": 295.30887, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "85-89", "bbox": {"l": 305.27301, "t": 217.33452999999997, "r": 324.98117, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "66-76", "bbox": {"l": 334.94284, "t": 217.33452999999997, "r": 354.651, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "90-94", "bbox": {"l": 364.61267, "t": 217.33452999999997, "r": 384.32083, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "98-100", "bbox": {"l": 394.2825, "t": 217.33452999999997, "r": 418.16003, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "91-92", "bbox": {"l": 428.1217, "t": 217.33452999999997, "r": 447.82986, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "97-99", "bbox": {"l": 457.80051, "t": 217.33452999999997, "r": 477.50867, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "81-86", "bbox": {"l": 487.47034, "t": 217.33452999999997, "r": 507.17849999999993, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "Picture", "bbox": {"l": 104.825, "t": 228.29351999999994, "r": 130.80963, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "45976", "bbox": {"l": 177.866, "t": 228.29351999999994, "r": 198.71288, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "4.21", "bbox": {"l": 219.211, "t": 228.29351999999994, "r": 233.69174000000004, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "2.78", "bbox": {"l": 250.01956, "t": 228.29351999999994, "r": 264.50031, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "5.31", "bbox": {"l": 280.82812, "t": 228.29351999999994, "r": 295.30887, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "69-71", "bbox": {"l": 305.27301, "t": 228.29351999999994, "r": 324.98117, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "56-59", "bbox": {"l": 334.94284, "t": 228.29351999999994, "r": 354.651, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "82-86", "bbox": {"l": 364.61267, "t": 228.29351999999994, "r": 384.32083, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "69-82", "bbox": {"l": 398.45187, "t": 228.29351999999994, "r": 418.16003, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "80-95", "bbox": {"l": 428.1217, "t": 228.29351999999994, "r": 447.82986, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "66-71", "bbox": {"l": 457.80051, "t": 228.29351999999994, "r": 477.50867, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "59-76", "bbox": {"l": 487.47034, "t": 228.29351999999994, "r": 507.17849999999993, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "Section-header", "bbox": {"l": 104.825, "t": 239.25256000000002, "r": 159.56487, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "142884", "bbox": {"l": 173.69701, "t": 239.25256000000002, "r": 198.71326, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "12.60", "bbox": {"l": 215.04201, "t": 239.25256000000002, "r": 233.69212, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "15.77", "bbox": {"l": 245.85056, "t": 239.25256000000002, "r": 264.50067, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "12.85", "bbox": {"l": 276.65912, "t": 239.25256000000002, "r": 295.30923, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "83-84", "bbox": {"l": 305.27301, "t": 239.25256000000002, "r": 324.98117, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "76-81", "bbox": {"l": 334.94284, "t": 239.25256000000002, "r": 354.651, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "90-92", "bbox": {"l": 364.61267, "t": 239.25256000000002, "r": 384.32083, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "94-95", "bbox": {"l": 398.45187, "t": 239.25256000000002, "r": 418.16003, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "87-94", "bbox": {"l": 428.1217, "t": 239.25256000000002, "r": 447.82986, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "69-73", "bbox": {"l": 457.80051, "t": 239.25256000000002, "r": 477.50867, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "78-86", "bbox": {"l": 487.47034, "t": 239.25256000000002, "r": 507.17849999999993, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "Table", "bbox": {"l": 104.825, "t": 250.21155, "r": 124.63177, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "34733", "bbox": {"l": 177.866, "t": 250.21155, "r": 198.71288, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "3.20", "bbox": {"l": 219.211, "t": 250.21155, "r": 233.69174000000004, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "2.27", "bbox": {"l": 250.01956, "t": 250.21155, "r": 264.50031, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "3.60", "bbox": {"l": 280.82812, "t": 250.21155, "r": 295.30887, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "77-81", "bbox": {"l": 305.27301, "t": 250.21155, "r": 324.98117, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "75-80", "bbox": {"l": 334.94284, "t": 250.21155, "r": 354.651, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "83-86", "bbox": {"l": 364.61267, "t": 250.21155, "r": 384.32083, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "98-99", "bbox": {"l": 398.45187, "t": 250.21155, "r": 418.16003, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "58-80", "bbox": {"l": 428.1217, "t": 250.21155, "r": 447.82986, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "79-84", "bbox": {"l": 457.80051, "t": 250.21155, "r": 477.50867, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "70-85", "bbox": {"l": 487.47034, "t": 250.21155, "r": 507.17849999999993, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "Text", "bbox": {"l": 104.825, "t": 261.16956000000005, "r": 120.78519, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "510377", "bbox": {"l": 173.69701, "t": 261.16956000000005, "r": 198.71326, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "45.82", "bbox": {"l": 215.04201, "t": 261.16956000000005, "r": 233.69212, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "49.28", "bbox": {"l": 245.85056, "t": 261.16956000000005, "r": 264.50067, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "45.00", "bbox": {"l": 276.65912, "t": 261.16956000000005, "r": 295.30923, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "84-86", "bbox": {"l": 305.27301, "t": 261.16956000000005, "r": 324.98117, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "81-86", "bbox": {"l": 334.94284, "t": 261.16956000000005, "r": 354.651, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "88-93", "bbox": {"l": 364.61267, "t": 261.16956000000005, "r": 384.32083, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "89-93", "bbox": {"l": 398.45187, "t": 261.16956000000005, "r": 418.16003, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "87-92", "bbox": {"l": 428.1217, "t": 261.16956000000005, "r": 447.82986, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "71-79", "bbox": {"l": 457.80051, "t": 261.16956000000005, "r": 477.50867, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "87-95", "bbox": {"l": 487.47034, "t": 261.16956000000005, "r": 507.17849999999993, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "Title", "bbox": {"l": 104.825, "t": 272.12854000000004, "r": 121.81633, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "5071", "bbox": {"l": 182.035, "t": 272.12854000000004, "r": 198.71251, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "0.47", "bbox": {"l": 219.211, "t": 272.12854000000004, "r": 233.69174000000004, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "0.30", "bbox": {"l": 250.01956, "t": 272.12854000000004, "r": 264.50031, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "0.50", "bbox": {"l": 280.82812, "t": 272.12854000000004, "r": 295.30887, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "60-72", "bbox": {"l": 305.27301, "t": 272.12854000000004, "r": 324.98117, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "24-63", "bbox": {"l": 334.94284, "t": 272.12854000000004, "r": 354.651, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "50-63", "bbox": {"l": 364.61267, "t": 272.12854000000004, "r": 384.32083, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "94-100", "bbox": {"l": 394.2825, "t": 272.12854000000004, "r": 418.16003, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "82-96", "bbox": {"l": 428.1217, "t": 272.12854000000004, "r": 447.82986, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "68-79", "bbox": {"l": 457.80051, "t": 272.12854000000004, "r": 477.50867, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "24-56", "bbox": {"l": 487.47034, "t": 272.12854000000004, "r": 507.17849999999993, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "Total", "bbox": {"l": 104.825, "t": 283.48654, "r": 123.43028, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "1107470", "bbox": {"l": 169.52699, "t": 283.48654, "r": 198.71263, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "941123", "bbox": {"l": 208.675, "t": 283.48654, "r": 233.69124999999997, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "99816", "bbox": {"l": 243.65291999999997, "t": 283.48654, "r": 264.49982, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "66531", "bbox": {"l": 274.46149, "t": 283.48654, "r": 295.30838, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "82-83", "bbox": {"l": 305.27301, "t": 283.48654, "r": 324.98117, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "71-74", "bbox": {"l": 334.94284, "t": 283.48654, "r": 354.651, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "79-81", "bbox": {"l": 364.61267, "t": 283.48654, "r": 384.32083, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "89-94", "bbox": {"l": 398.45187, "t": 283.48654, "r": 418.16003, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "86-91", "bbox": {"l": 428.1217, "t": 283.48654, "r": 447.82986, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "71-76", "bbox": {"l": 457.80051, "t": 283.48654, "r": 477.50867, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "68-85", "bbox": {"l": 487.47034, "t": 283.48654, "r": 507.17849999999993, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": [{"id": 11, "label": "text", "bbox": {"l": 233.94400000000002, "t": 140.22351000000003, "r": 270.04272, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 5, "text": "% of Total", "bbox": {"l": 233.94400000000002, "t": 140.22351000000003, "r": 270.04272, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 329.04999, "t": 140.22351000000003, "r": 483.3976400000001, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": "triple inter-annotator mAP @ 0.5-0.95 (%)", "bbox": {"l": 329.04999, "t": 140.22351000000003, "r": 483.3976400000001, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 104.825, "t": 151.18255999999997, "r": 141.71277, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "class label", "bbox": {"l": 104.825, "t": 151.18255999999997, "r": 141.71277, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 175.94701, "t": 151.18255999999997, "r": 198.71269, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "Count", "bbox": {"l": 175.94701, "t": 151.18255999999997, "r": 198.71269, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 213.795, "t": 151.18255999999997, "r": 233.69144, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "Train", "bbox": {"l": 213.795, "t": 151.18255999999997, "r": 233.69144, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 249.37367, "t": 151.18255999999997, "r": 264.5, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "Test", "bbox": {"l": 249.37367, "t": 151.18255999999997, "r": 264.5, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 283.53568, "t": 151.18255999999997, "r": 295.30856, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "Val", "bbox": {"l": 283.53568, "t": 151.18255999999997, "r": 295.30856, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 314.01501, "t": 151.18255999999997, "r": 324.98093, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "All", "bbox": {"l": 314.01501, "t": 151.18255999999997, "r": 324.98093, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 343.01236, "t": 151.18255999999997, "r": 354.65076, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "Fin", "bbox": {"l": 343.01236, "t": 151.18255999999997, "r": 354.65076, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 367.84033, "t": 151.18255999999997, "r": 384.32059, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "Man", "bbox": {"l": 367.84033, "t": 151.18255999999997, "r": 384.32059, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 407.54358, "t": 151.18255999999997, "r": 418.15979, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "Sci", "bbox": {"l": 407.54358, "t": 151.18255999999997, "r": 418.15979, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 432.29979999999995, "t": 151.18255999999997, "r": 447.82962, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "Law", "bbox": {"l": 432.29979999999995, "t": 151.18255999999997, "r": 447.82962, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 465.72656, "t": 151.18255999999997, "r": 477.50842, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "Pat", "bbox": {"l": 465.72656, "t": 151.18255999999997, "r": 477.50842, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 493.52240000000006, "t": 151.18255999999997, "r": 507.17822, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "Ten", "bbox": {"l": 493.52240000000006, "t": 151.18255999999997, "r": 507.17822, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 104.825, "t": 162.53954999999996, "r": 134.01064, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "Caption", "bbox": {"l": 104.825, "t": 162.53954999999996, "r": 134.01064, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 177.866, "t": 162.53954999999996, "r": 198.71288, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "22524", "bbox": {"l": 177.866, "t": 162.53954999999996, "r": 198.71288, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 219.211, "t": 162.53954999999996, "r": 233.69174000000004, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "2.04", "bbox": {"l": 219.211, "t": 162.53954999999996, "r": 233.69174000000004, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 250.01956, "t": 162.53954999999996, "r": 264.50031, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "1.77", "bbox": {"l": 250.01956, "t": 162.53954999999996, "r": 264.50031, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 280.82812, "t": 162.53954999999996, "r": 295.30887, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "2.32", "bbox": {"l": 280.82812, "t": 162.53954999999996, "r": 295.30887, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 305.27301, "t": 162.53954999999996, "r": 324.98117, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "84-89", "bbox": {"l": 305.27301, "t": 162.53954999999996, "r": 324.98117, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 334.94284, "t": 162.53954999999996, "r": 354.651, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "40-61", "bbox": {"l": 334.94284, "t": 162.53954999999996, "r": 354.651, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 364.61267, "t": 162.53954999999996, "r": 384.32083, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "86-92", "bbox": {"l": 364.61267, "t": 162.53954999999996, "r": 384.32083, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 398.45187, "t": 162.53954999999996, "r": 418.16003, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "94-99", "bbox": {"l": 398.45187, "t": 162.53954999999996, "r": 418.16003, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 428.1217, "t": 162.53954999999996, "r": 447.82986, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "95-99", "bbox": {"l": 428.1217, "t": 162.53954999999996, "r": 447.82986, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 457.80051, "t": 162.53954999999996, "r": 477.50867, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "69-78", "bbox": {"l": 457.80051, "t": 162.53954999999996, "r": 477.50867, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 495.32489, "t": 162.53954999999996, "r": 507.17846999999995, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "n/a", "bbox": {"l": 495.32489, "t": 162.53954999999996, "r": 507.17846999999995, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 104.825, "t": 173.49854000000005, "r": 137.3282, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "Footnote", "bbox": {"l": 104.825, "t": 173.49854000000005, "r": 137.3282, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 182.035, "t": 173.49854000000005, "r": 198.71251, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "6318", "bbox": {"l": 182.035, "t": 173.49854000000005, "r": 198.71251, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 219.211, "t": 173.49854000000005, "r": 233.69174000000004, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "0.60", "bbox": {"l": 219.211, "t": 173.49854000000005, "r": 233.69174000000004, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 250.01956, "t": 173.49854000000005, "r": 264.50031, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "0.31", "bbox": {"l": 250.01956, "t": 173.49854000000005, "r": 264.50031, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 280.82812, "t": 173.49854000000005, "r": 295.30887, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "0.58", "bbox": {"l": 280.82812, "t": 173.49854000000005, "r": 295.30887, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 305.27301, "t": 173.49854000000005, "r": 324.98117, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "83-91", "bbox": {"l": 305.27301, "t": 173.49854000000005, "r": 324.98117, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 342.79739, "t": 173.49854000000005, "r": 354.65097, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "n/a", "bbox": {"l": 342.79739, "t": 173.49854000000005, "r": 354.65097, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 371.81265, "t": 173.49854000000005, "r": 384.32077, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "100", "bbox": {"l": 371.81265, "t": 173.49854000000005, "r": 384.32077, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 398.45181, "t": 173.49854000000005, "r": 418.15997, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "62-88", "bbox": {"l": 398.45181, "t": 173.49854000000005, "r": 418.15997, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 428.12164, "t": 173.49854000000005, "r": 447.8298, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "85-94", "bbox": {"l": 428.12164, "t": 173.49854000000005, "r": 447.8298, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 465.655, "t": 173.49854000000005, "r": 477.50857999999994, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "n/a", "bbox": {"l": 465.655, "t": 173.49854000000005, "r": 477.50857999999994, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 487.47025, "t": 173.49854000000005, "r": 507.17841, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "82-97", "bbox": {"l": 487.47025, "t": 173.49854000000005, "r": 507.17841, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 104.825, "t": 184.45752000000005, "r": 135.33766, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "Formula", "bbox": {"l": 104.825, "t": 184.45752000000005, "r": 135.33766, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 177.866, "t": 184.45752000000005, "r": 198.71288, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "25027", "bbox": {"l": 177.866, "t": 184.45752000000005, "r": 198.71288, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 219.211, "t": 184.45752000000005, "r": 233.69174000000004, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "2.25", "bbox": {"l": 219.211, "t": 184.45752000000005, "r": 233.69174000000004, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 250.01956, "t": 184.45752000000005, "r": 264.50031, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "1.90", "bbox": {"l": 250.01956, "t": 184.45752000000005, "r": 264.50031, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 280.82812, "t": 184.45752000000005, "r": 295.30887, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "2.96", "bbox": {"l": 280.82812, "t": 184.45752000000005, "r": 295.30887, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 305.27301, "t": 184.45752000000005, "r": 324.98117, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "83-85", "bbox": {"l": 305.27301, "t": 184.45752000000005, "r": 324.98117, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 342.79739, "t": 184.45752000000005, "r": 354.65097, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "n/a", "bbox": {"l": 342.79739, "t": 184.45752000000005, "r": 354.65097, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 372.46719, "t": 184.45752000000005, "r": 384.32077, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "n/a", "bbox": {"l": 372.46719, "t": 184.45752000000005, "r": 384.32077, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 398.45181, "t": 184.45752000000005, "r": 418.15997, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "84-87", "bbox": {"l": 398.45181, "t": 184.45752000000005, "r": 418.15997, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 428.12164, "t": 184.45752000000005, "r": 447.8298, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "86-96", "bbox": {"l": 428.12164, "t": 184.45752000000005, "r": 447.8298, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 465.655, "t": 184.45752000000005, "r": 477.50857999999994, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "n/a", "bbox": {"l": 465.655, "t": 184.45752000000005, "r": 477.50857999999994, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 495.3248, "t": 184.45752000000005, "r": 507.17838000000006, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "n/a", "bbox": {"l": 495.3248, "t": 184.45752000000005, "r": 507.17838000000006, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 104.825, "t": 195.41656, "r": 137.70479, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "List-item", "bbox": {"l": 104.825, "t": 195.41656, "r": 137.70479, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 173.69701, "t": 195.41656, "r": 198.71326, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "185660", "bbox": {"l": 173.69701, "t": 195.41656, "r": 198.71326, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 215.04201, "t": 195.41656, "r": 233.69212, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "17.19", "bbox": {"l": 215.04201, "t": 195.41656, "r": 233.69212, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 245.85056, "t": 195.41656, "r": 264.50067, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "13.34", "bbox": {"l": 245.85056, "t": 195.41656, "r": 264.50067, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 276.65912, "t": 195.41656, "r": 295.30923, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "15.82", "bbox": {"l": 276.65912, "t": 195.41656, "r": 295.30923, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 305.27301, "t": 195.41656, "r": 324.98117, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "87-88", "bbox": {"l": 305.27301, "t": 195.41656, "r": 324.98117, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 334.94284, "t": 195.41656, "r": 354.651, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "74-83", "bbox": {"l": 334.94284, "t": 195.41656, "r": 354.651, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 364.61267, "t": 195.41656, "r": 384.32083, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "90-92", "bbox": {"l": 364.61267, "t": 195.41656, "r": 384.32083, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 398.45187, "t": 195.41656, "r": 418.16003, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "97-97", "bbox": {"l": 398.45187, "t": 195.41656, "r": 418.16003, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 428.1217, "t": 195.41656, "r": 447.82986, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "81-85", "bbox": {"l": 428.1217, "t": 195.41656, "r": 447.82986, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 457.80051, "t": 195.41656, "r": 477.50867, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "75-88", "bbox": {"l": 457.80051, "t": 195.41656, "r": 477.50867, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 487.47034, "t": 195.41656, "r": 507.17849999999993, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "93-95", "bbox": {"l": 487.47034, "t": 195.41656, "r": 507.17849999999993, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 104.825, "t": 206.37554999999998, "r": 147.35262, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "Page-footer", "bbox": {"l": 104.825, "t": 206.37554999999998, "r": 147.35262, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 177.866, "t": 206.37554999999998, "r": 198.71288, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "70878", "bbox": {"l": 177.866, "t": 206.37554999999998, "r": 198.71288, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 219.211, "t": 206.37554999999998, "r": 233.69174000000004, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "6.51", "bbox": {"l": 219.211, "t": 206.37554999999998, "r": 233.69174000000004, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 250.01956, "t": 206.37554999999998, "r": 264.50031, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "5.58", "bbox": {"l": 250.01956, "t": 206.37554999999998, "r": 264.50031, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 280.82812, "t": 206.37554999999998, "r": 295.30887, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "6.00", "bbox": {"l": 280.82812, "t": 206.37554999999998, "r": 295.30887, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 305.27301, "t": 206.37554999999998, "r": 324.98117, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "93-94", "bbox": {"l": 305.27301, "t": 206.37554999999998, "r": 324.98117, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 334.94284, "t": 206.37554999999998, "r": 354.651, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "88-90", "bbox": {"l": 334.94284, "t": 206.37554999999998, "r": 354.651, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 364.61267, "t": 206.37554999999998, "r": 384.32083, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "95-96", "bbox": {"l": 364.61267, "t": 206.37554999999998, "r": 384.32083, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 405.65189, "t": 206.37554999999998, "r": 418.16, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "100", "bbox": {"l": 405.65189, "t": 206.37554999999998, "r": 418.16, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 428.12167, "t": 206.37554999999998, "r": 447.82983, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "92-97", "bbox": {"l": 428.12167, "t": 206.37554999999998, "r": 447.82983, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 465.00049, "t": 206.37554999999998, "r": 477.5086099999999, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "100", "bbox": {"l": 465.00049, "t": 206.37554999999998, "r": 477.5086099999999, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 487.47028, "t": 206.37554999999998, "r": 507.17843999999997, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "96-98", "bbox": {"l": 487.47028, "t": 206.37554999999998, "r": 507.17843999999997, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 104.825, "t": 217.33452999999997, "r": 150.10532, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "Page-header", "bbox": {"l": 104.825, "t": 217.33452999999997, "r": 150.10532, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 177.866, "t": 217.33452999999997, "r": 198.71288, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "58022", "bbox": {"l": 177.866, "t": 217.33452999999997, "r": 198.71288, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 219.211, "t": 217.33452999999997, "r": 233.69174000000004, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "5.10", "bbox": {"l": 219.211, "t": 217.33452999999997, "r": 233.69174000000004, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 250.01956, "t": 217.33452999999997, "r": 264.50031, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "6.70", "bbox": {"l": 250.01956, "t": 217.33452999999997, "r": 264.50031, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 280.82812, "t": 217.33452999999997, "r": 295.30887, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "5.06", "bbox": {"l": 280.82812, "t": 217.33452999999997, "r": 295.30887, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 305.27301, "t": 217.33452999999997, "r": 324.98117, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "85-89", "bbox": {"l": 305.27301, "t": 217.33452999999997, "r": 324.98117, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 334.94284, "t": 217.33452999999997, "r": 354.651, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "66-76", "bbox": {"l": 334.94284, "t": 217.33452999999997, "r": 354.651, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 364.61267, "t": 217.33452999999997, "r": 384.32083, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "90-94", "bbox": {"l": 364.61267, "t": 217.33452999999997, "r": 384.32083, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 394.2825, "t": 217.33452999999997, "r": 418.16003, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "98-100", "bbox": {"l": 394.2825, "t": 217.33452999999997, "r": 418.16003, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 428.1217, "t": 217.33452999999997, "r": 447.82986, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "91-92", "bbox": {"l": 428.1217, "t": 217.33452999999997, "r": 447.82986, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 457.80051, "t": 217.33452999999997, "r": 477.50867, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "97-99", "bbox": {"l": 457.80051, "t": 217.33452999999997, "r": 477.50867, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 487.47034, "t": 217.33452999999997, "r": 507.17849999999993, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "81-86", "bbox": {"l": 487.47034, "t": 217.33452999999997, "r": 507.17849999999993, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 104.825, "t": 228.29351999999994, "r": 130.80963, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "Picture", "bbox": {"l": 104.825, "t": 228.29351999999994, "r": 130.80963, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 177.866, "t": 228.29351999999994, "r": 198.71288, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "45976", "bbox": {"l": 177.866, "t": 228.29351999999994, "r": 198.71288, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 219.211, "t": 228.29351999999994, "r": 233.69174000000004, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "4.21", "bbox": {"l": 219.211, "t": 228.29351999999994, "r": 233.69174000000004, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 250.01956, "t": 228.29351999999994, "r": 264.50031, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "2.78", "bbox": {"l": 250.01956, "t": 228.29351999999994, "r": 264.50031, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 280.82812, "t": 228.29351999999994, "r": 295.30887, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "5.31", "bbox": {"l": 280.82812, "t": 228.29351999999994, "r": 295.30887, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 305.27301, "t": 228.29351999999994, "r": 324.98117, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "69-71", "bbox": {"l": 305.27301, "t": 228.29351999999994, "r": 324.98117, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 334.94284, "t": 228.29351999999994, "r": 354.651, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "56-59", "bbox": {"l": 334.94284, "t": 228.29351999999994, "r": 354.651, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 364.61267, "t": 228.29351999999994, "r": 384.32083, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "82-86", "bbox": {"l": 364.61267, "t": 228.29351999999994, "r": 384.32083, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 398.45187, "t": 228.29351999999994, "r": 418.16003, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "69-82", "bbox": {"l": 398.45187, "t": 228.29351999999994, "r": 418.16003, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 428.1217, "t": 228.29351999999994, "r": 447.82986, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "80-95", "bbox": {"l": 428.1217, "t": 228.29351999999994, "r": 447.82986, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 457.80051, "t": 228.29351999999994, "r": 477.50867, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "66-71", "bbox": {"l": 457.80051, "t": 228.29351999999994, "r": 477.50867, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 487.47034, "t": 228.29351999999994, "r": 507.17849999999993, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "59-76", "bbox": {"l": 487.47034, "t": 228.29351999999994, "r": 507.17849999999993, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 104.825, "t": 239.25256000000002, "r": 159.56487, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": "Section-header", "bbox": {"l": 104.825, "t": 239.25256000000002, "r": 159.56487, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 173.69701, "t": 239.25256000000002, "r": 198.71326, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "142884", "bbox": {"l": 173.69701, "t": 239.25256000000002, "r": 198.71326, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 215.04201, "t": 239.25256000000002, "r": 233.69212, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "12.60", "bbox": {"l": 215.04201, "t": 239.25256000000002, "r": 233.69212, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 245.85056, "t": 239.25256000000002, "r": 264.50067, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": "15.77", "bbox": {"l": 245.85056, "t": 239.25256000000002, "r": 264.50067, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 276.65912, "t": 239.25256000000002, "r": 295.30923, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 107, "text": "12.85", "bbox": {"l": 276.65912, "t": 239.25256000000002, "r": 295.30923, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 114, "label": "text", "bbox": {"l": 305.27301, "t": 239.25256000000002, "r": 324.98117, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 108, "text": "83-84", "bbox": {"l": 305.27301, "t": 239.25256000000002, "r": 324.98117, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 115, "label": "text", "bbox": {"l": 334.94284, "t": 239.25256000000002, "r": 354.651, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 109, "text": "76-81", "bbox": {"l": 334.94284, "t": 239.25256000000002, "r": 354.651, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 116, "label": "text", "bbox": {"l": 364.61267, "t": 239.25256000000002, "r": 384.32083, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 110, "text": "90-92", "bbox": {"l": 364.61267, "t": 239.25256000000002, "r": 384.32083, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 117, "label": "text", "bbox": {"l": 398.45187, "t": 239.25256000000002, "r": 418.16003, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 111, "text": "94-95", "bbox": {"l": 398.45187, "t": 239.25256000000002, "r": 418.16003, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 118, "label": "text", "bbox": {"l": 428.1217, "t": 239.25256000000002, "r": 447.82986, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 112, "text": "87-94", "bbox": {"l": 428.1217, "t": 239.25256000000002, "r": 447.82986, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 119, "label": "text", "bbox": {"l": 457.80051, "t": 239.25256000000002, "r": 477.50867, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 113, "text": "69-73", "bbox": {"l": 457.80051, "t": 239.25256000000002, "r": 477.50867, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 120, "label": "text", "bbox": {"l": 487.47034, "t": 239.25256000000002, "r": 507.17849999999993, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 114, "text": "78-86", "bbox": {"l": 487.47034, "t": 239.25256000000002, "r": 507.17849999999993, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 121, "label": "text", "bbox": {"l": 104.825, "t": 250.21155, "r": 124.63177, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 115, "text": "Table", "bbox": {"l": 104.825, "t": 250.21155, "r": 124.63177, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 122, "label": "text", "bbox": {"l": 177.866, "t": 250.21155, "r": 198.71288, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 116, "text": "34733", "bbox": {"l": 177.866, "t": 250.21155, "r": 198.71288, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 123, "label": "text", "bbox": {"l": 219.211, "t": 250.21155, "r": 233.69174000000004, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 117, "text": "3.20", "bbox": {"l": 219.211, "t": 250.21155, "r": 233.69174000000004, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 124, "label": "text", "bbox": {"l": 250.01956, "t": 250.21155, "r": 264.50031, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 118, "text": "2.27", "bbox": {"l": 250.01956, "t": 250.21155, "r": 264.50031, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 125, "label": "text", "bbox": {"l": 280.82812, "t": 250.21155, "r": 295.30887, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 119, "text": "3.60", "bbox": {"l": 280.82812, "t": 250.21155, "r": 295.30887, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 126, "label": "text", "bbox": {"l": 305.27301, "t": 250.21155, "r": 324.98117, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 120, "text": "77-81", "bbox": {"l": 305.27301, "t": 250.21155, "r": 324.98117, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 127, "label": "text", "bbox": {"l": 334.94284, "t": 250.21155, "r": 354.651, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 121, "text": "75-80", "bbox": {"l": 334.94284, "t": 250.21155, "r": 354.651, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 128, "label": "text", "bbox": {"l": 364.61267, "t": 250.21155, "r": 384.32083, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 122, "text": "83-86", "bbox": {"l": 364.61267, "t": 250.21155, "r": 384.32083, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 129, "label": "text", "bbox": {"l": 398.45187, "t": 250.21155, "r": 418.16003, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 123, "text": "98-99", "bbox": {"l": 398.45187, "t": 250.21155, "r": 418.16003, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 130, "label": "text", "bbox": {"l": 428.1217, "t": 250.21155, "r": 447.82986, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 124, "text": "58-80", "bbox": {"l": 428.1217, "t": 250.21155, "r": 447.82986, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 131, "label": "text", "bbox": {"l": 457.80051, "t": 250.21155, "r": 477.50867, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 125, "text": "79-84", "bbox": {"l": 457.80051, "t": 250.21155, "r": 477.50867, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 132, "label": "text", "bbox": {"l": 487.47034, "t": 250.21155, "r": 507.17849999999993, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 126, "text": "70-85", "bbox": {"l": 487.47034, "t": 250.21155, "r": 507.17849999999993, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 133, "label": "text", "bbox": {"l": 104.825, "t": 261.16956000000005, "r": 120.78519, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 127, "text": "Text", "bbox": {"l": 104.825, "t": 261.16956000000005, "r": 120.78519, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 134, "label": "text", "bbox": {"l": 173.69701, "t": 261.16956000000005, "r": 198.71326, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 128, "text": "510377", "bbox": {"l": 173.69701, "t": 261.16956000000005, "r": 198.71326, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 135, "label": "text", "bbox": {"l": 215.04201, "t": 261.16956000000005, "r": 233.69212, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 129, "text": "45.82", "bbox": {"l": 215.04201, "t": 261.16956000000005, "r": 233.69212, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 136, "label": "text", "bbox": {"l": 245.85056, "t": 261.16956000000005, "r": 264.50067, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 130, "text": "49.28", "bbox": {"l": 245.85056, "t": 261.16956000000005, "r": 264.50067, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 137, "label": "text", "bbox": {"l": 276.65912, "t": 261.16956000000005, "r": 295.30923, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 131, "text": "45.00", "bbox": {"l": 276.65912, "t": 261.16956000000005, "r": 295.30923, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 138, "label": "text", "bbox": {"l": 305.27301, "t": 261.16956000000005, "r": 324.98117, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 132, "text": "84-86", "bbox": {"l": 305.27301, "t": 261.16956000000005, "r": 324.98117, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 139, "label": "text", "bbox": {"l": 334.94284, "t": 261.16956000000005, "r": 354.651, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 133, "text": "81-86", "bbox": {"l": 334.94284, "t": 261.16956000000005, "r": 354.651, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 140, "label": "text", "bbox": {"l": 364.61267, "t": 261.16956000000005, "r": 384.32083, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 134, "text": "88-93", "bbox": {"l": 364.61267, "t": 261.16956000000005, "r": 384.32083, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 141, "label": "text", "bbox": {"l": 398.45187, "t": 261.16956000000005, "r": 418.16003, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 135, "text": "89-93", "bbox": {"l": 398.45187, "t": 261.16956000000005, "r": 418.16003, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 142, "label": "text", "bbox": {"l": 428.1217, "t": 261.16956000000005, "r": 447.82986, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 136, "text": "87-92", "bbox": {"l": 428.1217, "t": 261.16956000000005, "r": 447.82986, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 143, "label": "text", "bbox": {"l": 457.80051, "t": 261.16956000000005, "r": 477.50867, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 137, "text": "71-79", "bbox": {"l": 457.80051, "t": 261.16956000000005, "r": 477.50867, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 144, "label": "text", "bbox": {"l": 487.47034, "t": 261.16956000000005, "r": 507.17849999999993, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 138, "text": "87-95", "bbox": {"l": 487.47034, "t": 261.16956000000005, "r": 507.17849999999993, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 145, "label": "text", "bbox": {"l": 104.825, "t": 272.12854000000004, "r": 121.81633, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 139, "text": "Title", "bbox": {"l": 104.825, "t": 272.12854000000004, "r": 121.81633, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 146, "label": "text", "bbox": {"l": 182.035, "t": 272.12854000000004, "r": 198.71251, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 140, "text": "5071", "bbox": {"l": 182.035, "t": 272.12854000000004, "r": 198.71251, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 147, "label": "text", "bbox": {"l": 219.211, "t": 272.12854000000004, "r": 233.69174000000004, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 141, "text": "0.47", "bbox": {"l": 219.211, "t": 272.12854000000004, "r": 233.69174000000004, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 148, "label": "text", "bbox": {"l": 250.01956, "t": 272.12854000000004, "r": 264.50031, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 142, "text": "0.30", "bbox": {"l": 250.01956, "t": 272.12854000000004, "r": 264.50031, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 149, "label": "text", "bbox": {"l": 280.82812, "t": 272.12854000000004, "r": 295.30887, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 143, "text": "0.50", "bbox": {"l": 280.82812, "t": 272.12854000000004, "r": 295.30887, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 150, "label": "text", "bbox": {"l": 305.27301, "t": 272.12854000000004, "r": 324.98117, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 144, "text": "60-72", "bbox": {"l": 305.27301, "t": 272.12854000000004, "r": 324.98117, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 151, "label": "text", "bbox": {"l": 334.94284, "t": 272.12854000000004, "r": 354.651, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 145, "text": "24-63", "bbox": {"l": 334.94284, "t": 272.12854000000004, "r": 354.651, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 152, "label": "text", "bbox": {"l": 364.61267, "t": 272.12854000000004, "r": 384.32083, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 146, "text": "50-63", "bbox": {"l": 364.61267, "t": 272.12854000000004, "r": 384.32083, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 153, "label": "text", "bbox": {"l": 394.2825, "t": 272.12854000000004, "r": 418.16003, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 147, "text": "94-100", "bbox": {"l": 394.2825, "t": 272.12854000000004, "r": 418.16003, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 154, "label": "text", "bbox": {"l": 428.1217, "t": 272.12854000000004, "r": 447.82986, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 148, "text": "82-96", "bbox": {"l": 428.1217, "t": 272.12854000000004, "r": 447.82986, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 155, "label": "text", "bbox": {"l": 457.80051, "t": 272.12854000000004, "r": 477.50867, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 149, "text": "68-79", "bbox": {"l": 457.80051, "t": 272.12854000000004, "r": 477.50867, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 156, "label": "text", "bbox": {"l": 487.47034, "t": 272.12854000000004, "r": 507.17849999999993, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 150, "text": "24-56", "bbox": {"l": 487.47034, "t": 272.12854000000004, "r": 507.17849999999993, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 157, "label": "text", "bbox": {"l": 104.825, "t": 283.48654, "r": 123.43028, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 151, "text": "Total", "bbox": {"l": 104.825, "t": 283.48654, "r": 123.43028, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 158, "label": "text", "bbox": {"l": 169.52699, "t": 283.48654, "r": 198.71263, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 152, "text": "1107470", "bbox": {"l": 169.52699, "t": 283.48654, "r": 198.71263, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 159, "label": "text", "bbox": {"l": 208.675, "t": 283.48654, "r": 233.69124999999997, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 153, "text": "941123", "bbox": {"l": 208.675, "t": 283.48654, "r": 233.69124999999997, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 160, "label": "text", "bbox": {"l": 243.65291999999997, "t": 283.48654, "r": 264.49982, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 154, "text": "99816", "bbox": {"l": 243.65291999999997, "t": 283.48654, "r": 264.49982, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 161, "label": "text", "bbox": {"l": 274.46149, "t": 283.48654, "r": 295.30838, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 155, "text": "66531", "bbox": {"l": 274.46149, "t": 283.48654, "r": 295.30838, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 162, "label": "text", "bbox": {"l": 305.27301, "t": 283.48654, "r": 324.98117, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 156, "text": "82-83", "bbox": {"l": 305.27301, "t": 283.48654, "r": 324.98117, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 163, "label": "text", "bbox": {"l": 334.94284, "t": 283.48654, "r": 354.651, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 157, "text": "71-74", "bbox": {"l": 334.94284, "t": 283.48654, "r": 354.651, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 164, "label": "text", "bbox": {"l": 364.61267, "t": 283.48654, "r": 384.32083, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 158, "text": "79-81", "bbox": {"l": 364.61267, "t": 283.48654, "r": 384.32083, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 165, "label": "text", "bbox": {"l": 398.45187, "t": 283.48654, "r": 418.16003, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 159, "text": "89-94", "bbox": {"l": 398.45187, "t": 283.48654, "r": 418.16003, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 166, "label": "text", "bbox": {"l": 428.1217, "t": 283.48654, "r": 447.82986, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 160, "text": "86-91", "bbox": {"l": 428.1217, "t": 283.48654, "r": 447.82986, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 167, "label": "text", "bbox": {"l": 457.80051, "t": 283.48654, "r": 477.50867, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 161, "text": "71-76", "bbox": {"l": 457.80051, "t": 283.48654, "r": 477.50867, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 168, "label": "text", "bbox": {"l": 487.47034, "t": 283.48654, "r": 507.17849999999993, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 162, "text": "68-85", "bbox": {"l": 487.47034, "t": 283.48654, "r": 507.17849999999993, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "lcel", "lcel", "lcel", "ched", "lcel", "lcel", "lcel", "lcel", "lcel", "nl", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 14, "num_cols": 12, "table_cells": [{"bbox": {"l": 233.94400000000002, "t": 140.22351000000003, "r": 270.04272, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 4, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 6, "text": "% of Total", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 329.04999, "t": 140.22351000000003, "r": 483.3976400000001, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 6, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 6, "end_col_offset_idx": 12, "text": "triple inter-annotator mAP @ 0.5-0.95 (%)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 151.18255999999997, "r": 141.71277, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "class label", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 175.94701, "t": 151.18255999999997, "r": 198.71269, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Count", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 213.795, "t": 151.18255999999997, "r": 233.69144, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Train", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 249.37367, "t": 151.18255999999997, "r": 264.5, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Test", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 283.53568, "t": 151.18255999999997, "r": 295.30856, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Val", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 314.01501, "t": 151.18255999999997, "r": 324.98093, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "All", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 343.01236, "t": 151.18255999999997, "r": 354.65076, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "Fin", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 367.84033, "t": 151.18255999999997, "r": 384.32059, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "Man", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 407.54358, "t": 151.18255999999997, "r": 418.15979, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "Sci", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 432.29979999999995, "t": 151.18255999999997, "r": 447.82962, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "Law", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 465.72656, "t": 151.18255999999997, "r": 477.50842, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "Pat", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 493.52240000000006, "t": 151.18255999999997, "r": 507.17822, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "Ten", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 162.53954999999996, "r": 134.01064, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Caption", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 177.866, "t": 162.53954999999996, "r": 198.71288, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "22524", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 162.53954999999996, "r": 233.69174000000004, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "2.04", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 162.53954999999996, "r": 264.50031, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "1.77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 162.53954999999996, "r": 295.30887, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "2.32", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 162.53954999999996, "r": 324.98117, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "84-89", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 162.53954999999996, "r": 354.651, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "40-61", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 162.53954999999996, "r": 384.32083, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "86-92", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45187, "t": 162.53954999999996, "r": 418.16003, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "94-99", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 162.53954999999996, "r": 447.82986, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "95-99", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 162.53954999999996, "r": 477.50867, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "69-78", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 495.32489, "t": 162.53954999999996, "r": 507.17846999999995, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 173.49854000000005, "r": 137.3282, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Footnote", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 182.035, "t": 173.49854000000005, "r": 198.71251, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "6318", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 173.49854000000005, "r": 233.69174000000004, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.60", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 173.49854000000005, "r": 264.50031, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.31", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 173.49854000000005, "r": 295.30887, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.58", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 173.49854000000005, "r": 324.98117, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "83-91", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 342.79739, "t": 173.49854000000005, "r": 354.65097, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 371.81265, "t": 173.49854000000005, "r": 384.32077, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "100", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45181, "t": 173.49854000000005, "r": 418.15997, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "62-88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.12164, "t": 173.49854000000005, "r": 447.8298, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "85-94", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 465.655, "t": 173.49854000000005, "r": 477.50857999999994, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47025, "t": 173.49854000000005, "r": 507.17841, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "82-97", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 184.45752000000005, "r": 135.33766, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Formula", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 177.866, "t": 184.45752000000005, "r": 198.71288, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "25027", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 184.45752000000005, "r": 233.69174000000004, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "2.25", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 184.45752000000005, "r": 264.50031, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "1.90", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 184.45752000000005, "r": 295.30887, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "2.96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 184.45752000000005, "r": 324.98117, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "83-85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 342.79739, "t": 184.45752000000005, "r": 354.65097, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 372.46719, "t": 184.45752000000005, "r": 384.32077, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45181, "t": 184.45752000000005, "r": 418.15997, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "84-87", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.12164, "t": 184.45752000000005, "r": 447.8298, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "86-96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 465.655, "t": 184.45752000000005, "r": 477.50857999999994, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 495.3248, "t": 184.45752000000005, "r": 507.17838000000006, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 195.41656, "r": 137.70479, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "List-item", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 173.69701, "t": 195.41656, "r": 198.71326, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "185660", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 215.04201, "t": 195.41656, "r": 233.69212, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "17.19", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.85056, "t": 195.41656, "r": 264.50067, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "13.34", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 276.65912, "t": 195.41656, "r": 295.30923, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "15.82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 195.41656, "r": 324.98117, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "87-88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 195.41656, "r": 354.651, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "74-83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 195.41656, "r": 384.32083, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "90-92", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45187, "t": 195.41656, "r": 418.16003, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "97-97", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 195.41656, "r": 447.82986, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "81-85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 195.41656, "r": 477.50867, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "75-88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 195.41656, "r": 507.17849999999993, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "93-95", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 206.37554999999998, "r": 147.35262, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-footer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 177.866, "t": 206.37554999999998, "r": 198.71288, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "70878", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 206.37554999999998, "r": 233.69174000000004, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "6.51", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 206.37554999999998, "r": 264.50031, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "5.58", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 206.37554999999998, "r": 295.30887, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "6.00", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 206.37554999999998, "r": 324.98117, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "93-94", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 206.37554999999998, "r": 354.651, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "88-90", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 206.37554999999998, "r": 384.32083, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "95-96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 405.65189, "t": 206.37554999999998, "r": 418.16, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "100", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.12167, "t": 206.37554999999998, "r": 447.82983, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "92-97", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 465.00049, "t": 206.37554999999998, "r": 477.5086099999999, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "100", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47028, "t": 206.37554999999998, "r": 507.17843999999997, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "96-98", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 217.33452999999997, "r": 150.10532, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 177.866, "t": 217.33452999999997, "r": 198.71288, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "58022", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 217.33452999999997, "r": 233.69174000000004, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "5.10", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 217.33452999999997, "r": 264.50031, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "6.70", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 217.33452999999997, "r": 295.30887, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "5.06", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 217.33452999999997, "r": 324.98117, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "85-89", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 217.33452999999997, "r": 354.651, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "66-76", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 217.33452999999997, "r": 384.32083, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "90-94", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.2825, "t": 217.33452999999997, "r": 418.16003, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "98-100", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 217.33452999999997, "r": 447.82986, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "91-92", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 217.33452999999997, "r": 477.50867, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "97-99", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 217.33452999999997, "r": 507.17849999999993, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "81-86", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 228.29351999999994, "r": 130.80963, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Picture", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 177.866, "t": 228.29351999999994, "r": 198.71288, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "45976", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 228.29351999999994, "r": 233.69174000000004, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "4.21", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 228.29351999999994, "r": 264.50031, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "2.78", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 228.29351999999994, "r": 295.30887, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "5.31", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 228.29351999999994, "r": 324.98117, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "69-71", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 228.29351999999994, "r": 354.651, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "56-59", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 228.29351999999994, "r": 384.32083, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "82-86", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45187, "t": 228.29351999999994, "r": 418.16003, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "69-82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 228.29351999999994, "r": 447.82986, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "80-95", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 228.29351999999994, "r": 477.50867, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "66-71", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 228.29351999999994, "r": 507.17849999999993, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "59-76", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 239.25256000000002, "r": 159.56487, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Section-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 173.69701, "t": 239.25256000000002, "r": 198.71326, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "142884", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 215.04201, "t": 239.25256000000002, "r": 233.69212, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "12.60", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.85056, "t": 239.25256000000002, "r": 264.50067, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "15.77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 276.65912, "t": 239.25256000000002, "r": 295.30923, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "12.85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 239.25256000000002, "r": 324.98117, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "83-84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 239.25256000000002, "r": 354.651, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "76-81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 239.25256000000002, "r": 384.32083, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "90-92", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45187, "t": 239.25256000000002, "r": 418.16003, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "94-95", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 239.25256000000002, "r": 447.82986, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "87-94", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 239.25256000000002, "r": 477.50867, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "69-73", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 239.25256000000002, "r": 507.17849999999993, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "78-86", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 250.21155, "r": 124.63177, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 177.866, "t": 250.21155, "r": 198.71288, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "34733", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 250.21155, "r": 233.69174000000004, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "3.20", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 250.21155, "r": 264.50031, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "2.27", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 250.21155, "r": 295.30887, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "3.60", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 250.21155, "r": 324.98117, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "77-81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 250.21155, "r": 354.651, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "75-80", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 250.21155, "r": 384.32083, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "83-86", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45187, "t": 250.21155, "r": 418.16003, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "98-99", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 250.21155, "r": 447.82986, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "58-80", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 250.21155, "r": 477.50867, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "79-84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 250.21155, "r": 507.17849999999993, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "70-85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 261.16956000000005, "r": 120.78519, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Text", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 173.69701, "t": 261.16956000000005, "r": 198.71326, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "510377", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 215.04201, "t": 261.16956000000005, "r": 233.69212, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "45.82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.85056, "t": 261.16956000000005, "r": 264.50067, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "49.28", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 276.65912, "t": 261.16956000000005, "r": 295.30923, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "45.00", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 261.16956000000005, "r": 324.98117, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "84-86", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 261.16956000000005, "r": 354.651, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "81-86", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 261.16956000000005, "r": 384.32083, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "88-93", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45187, "t": 261.16956000000005, "r": 418.16003, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "89-93", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 261.16956000000005, "r": 447.82986, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "87-92", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 261.16956000000005, "r": 477.50867, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "71-79", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 261.16956000000005, "r": 507.17849999999993, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "87-95", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 272.12854000000004, "r": 121.81633, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Title", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 182.035, "t": 272.12854000000004, "r": 198.71251, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "5071", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 272.12854000000004, "r": 233.69174000000004, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.47", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 272.12854000000004, "r": 264.50031, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.30", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 272.12854000000004, "r": 295.30887, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.50", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 272.12854000000004, "r": 324.98117, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "60-72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 272.12854000000004, "r": 354.651, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "24-63", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 272.12854000000004, "r": 384.32083, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "50-63", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.2825, "t": 272.12854000000004, "r": 418.16003, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "94-100", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 272.12854000000004, "r": 447.82986, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "82-96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 272.12854000000004, "r": 477.50867, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "68-79", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 272.12854000000004, "r": 507.17849999999993, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "24-56", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 283.48654, "r": 123.43028, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Total", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 169.52699, "t": 283.48654, "r": 198.71263, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "1107470", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 208.675, "t": 283.48654, "r": 233.69124999999997, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "941123", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 243.65291999999997, "t": 283.48654, "r": 264.49982, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "99816", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 274.46149, "t": 283.48654, "r": 295.30838, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "66531", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 283.48654, "r": 324.98117, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "82-83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 283.48654, "r": 354.651, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "71-74", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 283.48654, "r": 384.32083, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "79-81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45187, "t": 283.48654, "r": 418.16003, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "89-94", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 283.48654, "r": 447.82986, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "86-91", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 283.48654, "r": 477.50867, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "71-76", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 283.48654, "r": 507.17849999999993, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "68-85", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "caption", "id": 9, "page_no": 3, "cluster": {"id": 9, "label": "caption", "bbox": {"l": 53.79800000000001, "t": 554.00999, "r": 295.64874, "b": 606.31924, "coord_origin": "TOPLEFT"}, "confidence": 0.810490071773529, "cells": [{"id": 163, "text": "Figure 3: Corpus Conversion Service annotation user inter-", "bbox": {"l": 53.79800000000001, "t": 554.00999, "r": 295.64871, "b": 562.48325, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "face. The PDF page is shown in the background, with over-", "bbox": {"l": 53.79800000000001, "t": 564.96899, "r": 295.64874, "b": 573.44225, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "laid text-cells (in darker shades). The annotation boxes can", "bbox": {"l": 53.79800000000001, "t": 575.92799, "r": 294.04376, "b": 584.40125, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "be drawn by dragging a rectangle over each segment with", "bbox": {"l": 53.79800000000001, "t": 586.88699, "r": 294.04373, "b": 595.36024, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "the respective label from the palette on the right.", "bbox": {"l": 53.79800000000001, "t": 597.84599, "r": 252.78931000000003, "b": 606.31924, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 3: Corpus Conversion Service annotation user interface. The PDF page is shown in the background, with overlaid text-cells (in darker shades). The annotation boxes can be drawn by dragging a rectangle over each segment with the respective label from the palette on the right."}, {"label": "text", "id": 5, "page_no": 3, "cluster": {"id": 5, "label": "text", "bbox": {"l": 53.466999, "t": 634.29155, "r": 294.04745, "b": 675.54317, "coord_origin": "TOPLEFT"}, "confidence": 0.980393648147583, "cells": [{"id": 168, "text": "we distributed the annotation workload and performed continuous", "bbox": {"l": 53.466999, "t": 634.29155, "r": 294.04745, "b": 642.66617, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "quality controls. Phase one and two required a small team of experts", "bbox": {"l": 53.79800000000001, "t": 645.25055, "r": 294.04535, "b": 653.62517, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "only. For phases three and four, a group of 40 dedicated annotators", "bbox": {"l": 53.79800000000001, "t": 656.20955, "r": 294.04422, "b": 664.58417, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "were assembled and supervised.", "bbox": {"l": 53.466999, "t": 667.16856, "r": 170.58611, "b": 675.54317, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "we distributed the annotation workload and performed continuous quality controls. Phase one and two required a small team of experts only. For phases three and four, a group of 40 dedicated annotators were assembled and supervised."}, {"label": "text", "id": 6, "page_no": 3, "cluster": {"id": 6, "label": "text", "bbox": {"l": 53.79800000000001, "t": 678.01099, "r": 295.55844, "b": 708.420174, "coord_origin": "TOPLEFT"}, "confidence": 0.9748398661613464, "cells": [{"id": 172, "text": "Phase 1: Data selection and preparation.", "bbox": {"l": 63.76099800000001, "t": 678.01099, "r": 226.72533000000004, "b": 686.48424, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "Our inclusion cri-", "bbox": {"l": 229.06900000000002, "t": 678.12756, "r": 295.55844, "b": 686.50217, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "teria for documents were described in Section 3. A large effort went", "bbox": {"l": 53.79800000000001, "t": 689.08656, "r": 294.04538, "b": 697.461174, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "into ensuring that all documents are free to use. The data sources", "bbox": {"l": 53.79800000000001, "t": 700.045555, "r": 294.04642, "b": 708.420174, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Phase 1: Data selection and preparation. Our inclusion criteria for documents were described in Section 3. A large effort went into ensuring that all documents are free to use. The data sources"}, {"label": "text", "id": 4, "page_no": 3, "cluster": {"id": 4, "label": "text", "bbox": {"l": 317.95499, "t": 312.07953, "r": 559.18536, "b": 375.24817, "coord_origin": "TOPLEFT"}, "confidence": 0.9818483591079712, "cells": [{"id": 176, "text": "include publication repositories such as arXiv$^{3}$, government offices,", "bbox": {"l": 317.95499, "t": 312.07953, "r": 559.18536, "b": 320.45416000000006, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "company websites as well as data directory services for financial", "bbox": {"l": 317.95499, "t": 323.03754, "r": 558.19843, "b": 331.41217, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "reports and patents. Scanned documents were excluded wherever", "bbox": {"l": 317.95499, "t": 333.99655, "r": 558.36963, "b": 342.37119, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "possible because they can be rotated or skewed. This would not", "bbox": {"l": 317.95499, "t": 344.95554, "r": 558.2041, "b": 353.33017, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "allow us to perform annotation with rectangular bounding-boxes", "bbox": {"l": 317.95499, "t": 355.91455, "r": 558.20294, "b": 364.28918, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "and therefore complicate the annotation process.", "bbox": {"l": 317.95499, "t": 366.87354, "r": 496.71826, "b": 375.24817, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "include publication repositories such as arXiv$^{3}$, government offices, company websites as well as data directory services for financial reports and patents. Scanned documents were excluded wherever possible because they can be rotated or skewed. This would not allow us to perform annotation with rectangular bounding-boxes and therefore complicate the annotation process."}, {"label": "text", "id": 0, "page_no": 3, "cluster": {"id": 0, "label": "text", "bbox": {"l": 317.95499, "t": 377.8325500000001, "r": 559.71307, "b": 506.75516, "coord_origin": "TOPLEFT"}, "confidence": 0.9866719841957092, "cells": [{"id": 182, "text": "Preparation work included uploading and parsing the sourced", "bbox": {"l": 327.918, "t": 377.8325500000001, "r": 558.20618, "b": 386.20717999999994, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "PDF documents in the Corpus Conversion Service (CCS) [22], a", "bbox": {"l": 317.95499, "t": 388.79153, "r": 558.2019, "b": 397.16617, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "cloud-native platform which provides a visual annotation interface", "bbox": {"l": 317.95499, "t": 399.75055, "r": 558.20233, "b": 408.12518, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": "and allows for dataset inspection and analysis. The annotation in-", "bbox": {"l": 317.95499, "t": 410.7095299999999, "r": 559.71277, "b": 419.08417, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "terface of CCS is shown in Figure 3. The desired balance of pages", "bbox": {"l": 317.95499, "t": 421.66855000000004, "r": 558.20062, "b": 430.04318, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "between the different document categories was achieved by se-", "bbox": {"l": 317.95499, "t": 432.62753, "r": 559.71307, "b": 441.00217, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": "lective subsampling of pages with certain desired properties. For", "bbox": {"l": 317.95499, "t": 443.58554, "r": 558.36877, "b": 451.96017, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "example, we made sure to include the title page of each document", "bbox": {"l": 317.95499, "t": 454.54453, "r": 558.20428, "b": 462.91916, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "and bias the remaining page selection to those with figures or", "bbox": {"l": 317.95499, "t": 465.50354, "r": 558.36877, "b": 473.87817, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "tables. The latter was achieved by leveraging pre-trained object", "bbox": {"l": 317.95499, "t": 476.46252, "r": 558.20428, "b": 484.83716, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": "detection models from PubLayNet, which helped us estimate how", "bbox": {"l": 317.95499, "t": 487.42154, "r": 558.5307, "b": 495.79617, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "many figures and tables a given page contains.", "bbox": {"l": 317.95499, "t": 498.38052, "r": 488.46914999999996, "b": 506.75516, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Preparation work included uploading and parsing the sourced PDF documents in the Corpus Conversion Service (CCS) [22], a cloud-native platform which provides a visual annotation interface and allows for dataset inspection and analysis. The annotation interface of CCS is shown in Figure 3. The desired balance of pages between the different document categories was achieved by selective subsampling of pages with certain desired properties. For example, we made sure to include the title page of each document and bias the remaining page selection to those with figures or tables. The latter was achieved by leveraging pre-trained object detection models from PubLayNet, which helped us estimate how many figures and tables a given page contains."}, {"label": "text", "id": 3, "page_no": 3, "cluster": {"id": 3, "label": "text", "bbox": {"l": 317.62299, "t": 509.22299, "r": 559.71765, "b": 693.0561749999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9847556948661804, "cells": [{"id": 194, "text": "Phase 2: Label selection and guideline.", "bbox": {"l": 327.918, "t": 509.22299, "r": 482.41809, "b": 517.69623, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "We reviewed the col-", "bbox": {"l": 484.474, "t": 509.33954, "r": 559.71765, "b": 517.71417, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "lected documents and identified the most common structural fea-", "bbox": {"l": 317.95499, "t": 520.29855, "r": 559.71619, "b": 528.67319, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "tures they exhibit. This was achieved by identifying recurrent layout", "bbox": {"l": 317.95499, "t": 531.2575400000001, "r": 558.20239, "b": 539.63217, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "elements and lead us to the definition of 11 distinct class labels.", "bbox": {"l": 317.95499, "t": 542.21655, "r": 559.58502, "b": 550.59117, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "These 11 class labels are", "bbox": {"l": 317.686, "t": 553.17456, "r": 404.14197, "b": 561.54918, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "Caption", "bbox": {"l": 406.26599, "t": 553.21939, "r": 433.84860000000003, "b": 561.5581500000001, "coord_origin": "TOPLEFT"}}, {"id": 201, "text": ",", "bbox": {"l": 433.84799, "t": 553.17456, "r": 435.78115999999994, "b": 561.54918, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": "Footnote", "bbox": {"l": 437.9079899999999, "t": 553.21939, "r": 467.23926, "b": 561.5581500000001, "coord_origin": "TOPLEFT"}}, {"id": 203, "text": ",", "bbox": {"l": 467.23999, "t": 553.17456, "r": 469.17316000000005, "b": 561.54918, "coord_origin": "TOPLEFT"}}, {"id": 204, "text": "Formula", "bbox": {"l": 471.29900999999995, "t": 553.21939, "r": 500.44574000000006, "b": 561.5581500000001, "coord_origin": "TOPLEFT"}}, {"id": 205, "text": ",", "bbox": {"l": 500.44601000000006, "t": 553.17456, "r": 502.37918, "b": 561.54918, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": "List-item", "bbox": {"l": 504.505, "t": 553.21939, "r": 535.74304, "b": 561.5581500000001, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": ",", "bbox": {"l": 535.74298, "t": 553.17456, "r": 537.67615, "b": 561.54918, "coord_origin": "TOPLEFT"}}, {"id": 208, "text": "Page-", "bbox": {"l": 539.802, "t": 553.21939, "r": 559.09839, "b": 561.5581500000001, "coord_origin": "TOPLEFT"}}, {"id": 209, "text": "footer", "bbox": {"l": 317.95499, "t": 564.17839, "r": 338.80725, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": ",", "bbox": {"l": 338.806, "t": 564.13356, "r": 340.81805, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "Page-header", "bbox": {"l": 343.61401, "t": 564.17839, "r": 387.96164, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 212, "text": ",", "bbox": {"l": 387.961, "t": 564.13356, "r": 389.97305, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "Picture", "bbox": {"l": 392.76901, "t": 564.17839, "r": 417.84662, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 214, "text": ",", "bbox": {"l": 417.84799, "t": 564.13356, "r": 419.86005, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 215, "text": "Section-header", "bbox": {"l": 422.655, "t": 564.17839, "r": 475.56305, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 216, "text": ",", "bbox": {"l": 475.56201, "t": 564.13356, "r": 477.57407, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 217, "text": "Table", "bbox": {"l": 480.36899, "t": 564.17839, "r": 499.82196, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 218, "text": ",", "bbox": {"l": 499.8219900000001, "t": 564.13356, "r": 501.83405, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 219, "text": "Text", "bbox": {"l": 504.6290000000001, "t": 564.17839, "r": 519.7926, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 220, "text": ", and", "bbox": {"l": 519.79602, "t": 564.13356, "r": 538.37103, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 221, "text": "Title", "bbox": {"l": 541.16302, "t": 564.17839, "r": 557.57043, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 222, "text": ".", "bbox": {"l": 557.57098, "t": 564.13356, "r": 559.58307, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 223, "text": "Critical factors that were considered for the choice of these class", "bbox": {"l": 317.95499, "t": 575.09256, "r": 558.20416, "b": 583.46718, "coord_origin": "TOPLEFT"}}, {"id": 224, "text": "labels were (1) the overall occurrence of the label, (2) the specificity", "bbox": {"l": 317.95499, "t": 586.05156, "r": 558.43091, "b": 594.4261799999999, "coord_origin": "TOPLEFT"}}, {"id": 225, "text": "of the label, (3) recognisability on a single page (i.e. no need for", "bbox": {"l": 317.95499, "t": 597.0105599999999, "r": 558.36871, "b": 605.38518, "coord_origin": "TOPLEFT"}}, {"id": 226, "text": "context from previous or next page) and (4) overall coverage of the", "bbox": {"l": 317.95499, "t": 607.96956, "r": 558.20105, "b": 616.3441799999999, "coord_origin": "TOPLEFT"}}, {"id": 227, "text": "page. Specificity ensures that the choice of label is not ambiguous,", "bbox": {"l": 317.95499, "t": 618.9285600000001, "r": 559.18665, "b": 627.30318, "coord_origin": "TOPLEFT"}}, {"id": 228, "text": "while coverage ensures that all meaningful items on a page can", "bbox": {"l": 317.62299, "t": 629.88756, "r": 558.20142, "b": 638.26218, "coord_origin": "TOPLEFT"}}, {"id": 229, "text": "be annotated. We refrained from class labels that are very specific", "bbox": {"l": 317.95499, "t": 640.84656, "r": 558.20227, "b": 649.22118, "coord_origin": "TOPLEFT"}}, {"id": 230, "text": "to a document category, such as", "bbox": {"l": 317.95499, "t": 651.80556, "r": 436.90649, "b": 660.1801800000001, "coord_origin": "TOPLEFT"}}, {"id": 231, "text": "Abstract", "bbox": {"l": 439.13800000000003, "t": 651.8503900000001, "r": 469.69134999999994, "b": 660.18915, "coord_origin": "TOPLEFT"}}, {"id": 232, "text": "in the", "bbox": {"l": 472.42898999999994, "t": 651.80556, "r": 493.97348, "b": 660.1801800000001, "coord_origin": "TOPLEFT"}}, {"id": 233, "text": "Scientific Articles", "bbox": {"l": 496.207, "t": 651.8503900000001, "r": 558.20001, "b": 660.18915, "coord_origin": "TOPLEFT"}}, {"id": 234, "text": "category. We also avoided class labels that are tightly linked to the", "bbox": {"l": 317.95499, "t": 662.76456, "r": 558.20557, "b": 671.13918, "coord_origin": "TOPLEFT"}}, {"id": 235, "text": "semantics of the text. Labels such as", "bbox": {"l": 317.95499, "t": 673.7225599999999, "r": 447.65221999999994, "b": 682.09718, "coord_origin": "TOPLEFT"}}, {"id": 236, "text": "Author", "bbox": {"l": 449.85999, "t": 673.76739, "r": 474.31439, "b": 682.10614, "coord_origin": "TOPLEFT"}}, {"id": 237, "text": "and", "bbox": {"l": 477.172, "t": 673.7225599999999, "r": 490.39655, "b": 682.09718, "coord_origin": "TOPLEFT"}}, {"id": 238, "text": "Affiliation", "bbox": {"l": 492.60599, "t": 673.76739, "r": 528.29907, "b": 682.10614, "coord_origin": "TOPLEFT"}}, {"id": 239, "text": ", as seen", "bbox": {"l": 528.29901, "t": 673.7225599999999, "r": 558.20148, "b": 682.09718, "coord_origin": "TOPLEFT"}}, {"id": 240, "text": "in DocBank, are often only distinguishable by discriminating on", "bbox": {"l": 317.95499, "t": 684.68156, "r": 558.2041, "b": 693.0561749999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Phase 2: Label selection and guideline. We reviewed the collected documents and identified the most common structural features they exhibit. This was achieved by identifying recurrent layout elements and lead us to the definition of 11 distinct class labels. These 11 class labels are Caption , Footnote , Formula , List-item , Pagefooter , Page-header , Picture , Section-header , Table , Text , and Title . Critical factors that were considered for the choice of these class labels were (1) the overall occurrence of the label, (2) the specificity of the label, (3) recognisability on a single page (i.e. no need for context from previous or next page) and (4) overall coverage of the page. Specificity ensures that the choice of label is not ambiguous, while coverage ensures that all meaningful items on a page can be annotated. We refrained from class labels that are very specific to a document category, such as Abstract in the Scientific Articles category. We also avoided class labels that are tightly linked to the semantics of the text. Labels such as Author and Affiliation , as seen in DocBank, are often only distinguishable by discriminating on"}, {"label": "footnote", "id": 7, "page_no": 3, "cluster": {"id": 7, "label": "footnote", "bbox": {"l": 317.95499, "t": 702.353363, "r": 369.2457, "b": 708.86689, "coord_origin": "TOPLEFT"}, "confidence": 0.9080352783203125, "cells": [{"id": 241, "text": "$^{3}$https://arxiv.org/", "bbox": {"l": 317.95499, "t": 702.353363, "r": 369.2457, "b": 708.86689, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "$^{3}$https://arxiv.org/"}, {"label": "picture", "id": 2, "page_no": 3, "cluster": {"id": 2, "label": "picture", "bbox": {"l": 53.05912780761719, "t": 310.7912902832031, "r": 295.8506164550781, "b": 540.864013671875, "coord_origin": "TOPLEFT"}, "confidence": 0.9847871661186218, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "headers": [{"label": "page_header", "id": 10, "page_no": 3, "cluster": {"id": 10, "label": "page_header", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.7625049948692322, "cells": [{"id": 0, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 246.24382, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar", "bbox": {"l": 253.13897999999998, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "KDD '22, August 14-18, 2022, Washington, DC, USA Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar"}]}}, {"page_no": 4, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "the textual content of an element, which goes beyond visual layout", "bbox": {"l": 53.79800000000001, "t": 87.36352999999997, "r": 294.04541, "b": 95.73816, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "recognition, in particular outside the", "bbox": {"l": 53.79800000000001, "t": 98.32250999999997, "r": 188.1326, "b": 106.69713999999999, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Scientific Articles", "bbox": {"l": 190.37401, "t": 98.36737000000005, "r": 251.25586999999996, "b": 106.70612000000006, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "category.", "bbox": {"l": 253.70801, "t": 98.32250999999997, "r": 287.01816, "b": 106.69713999999999, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "At first sight, the task of visual document-layout interpretation", "bbox": {"l": 63.76100199999999, "t": 109.28156000000001, "r": 294.04257, "b": 117.65618999999992, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "appears intuitive enough to obtain plausible annotations in most", "bbox": {"l": 53.79800000000001, "t": 120.24054000000001, "r": 294.04266, "b": 128.61517000000003, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "cases. However, during early trial-runs in the core team, we ob-", "bbox": {"l": 53.79800000000001, "t": 131.19854999999995, "r": 295.55615, "b": 139.57317999999998, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "served many cases in which annotators use different annotation", "bbox": {"l": 53.79800000000001, "t": 142.15752999999995, "r": 294.04715, "b": 150.53216999999995, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "styles, especially for documents with challenging layouts. For ex-", "bbox": {"l": 53.79800000000001, "t": 153.11652000000004, "r": 295.55923, "b": 161.49114999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "ample, if a figure is presented with subfigures, one annotator might", "bbox": {"l": 53.79800000000001, "t": 164.07556, "r": 294.04535, "b": 172.4502, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "draw a single figure bounding-box, while another might annotate", "bbox": {"l": 53.79800000000001, "t": 175.03454999999997, "r": 294.04803, "b": 183.40918, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "each subfigure separately. The same applies for lists, where one", "bbox": {"l": 53.79800000000001, "t": 185.99352999999996, "r": 294.04709, "b": 194.36816, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "might annotate all list items in one block or each list item sep-", "bbox": {"l": 53.79800000000001, "t": 196.95250999999996, "r": 295.55612, "b": 205.32714999999996, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "arately. In essence, we observed that challenging layouts would", "bbox": {"l": 53.79800000000001, "t": 207.91156, "r": 294.04712, "b": 216.28619000000003, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "be annotated in different but plausible ways. To illustrate this, we", "bbox": {"l": 53.79800000000001, "t": 218.87054, "r": 294.04495, "b": 227.24518, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "show in Figure 4 multiple examples of plausible but inconsistent", "bbox": {"l": 53.79800000000001, "t": 229.82952999999998, "r": 294.04712, "b": 238.20416, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "annotations on the same pages.", "bbox": {"l": 53.79800000000001, "t": 240.78754000000004, "r": 168.61276, "b": 249.16216999999995, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Obviously, this inconsistency in annotations is not desirable for", "bbox": {"l": 63.76100199999999, "t": 251.74652000000003, "r": 294.21884, "b": 260.12114999999994, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "datasets which are intended to be used for model training. To min-", "bbox": {"l": 53.79800000000001, "t": 262.70556999999997, "r": 295.56006, "b": 271.0802, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "imise these inconsistencies, we created a detailed annotation guide-", "bbox": {"l": 53.79800000000001, "t": 273.66454999999996, "r": 295.55676, "b": 282.03918, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "line. While perfect consistency across 40 annotation staff members", "bbox": {"l": 53.79800000000001, "t": 284.62354, "r": 294.04922, "b": 292.99817, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "is clearly not possible to achieve, we saw a huge improvement in", "bbox": {"l": 53.79800000000001, "t": 295.5825500000001, "r": 294.04343, "b": 303.95717999999994, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "annotation consistency after the introduction of our annotation", "bbox": {"l": 53.79800000000001, "t": 306.54153, "r": 294.04712, "b": 314.91617, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "guideline. A few selected, non-trivial highlights of the guideline", "bbox": {"l": 53.79800000000001, "t": 317.50055, "r": 294.04718, "b": 325.87518, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "are:", "bbox": {"l": 53.79800000000001, "t": 328.4595299999999, "r": 67.28347, "b": 336.83417, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "(1)", "bbox": {"l": 64.708, "t": 348.51254, "r": 74.626793, "b": 356.88718, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Every list-item is an individual object instance with class", "bbox": {"l": 76.963936, "t": 348.51254, "r": 294.0462, "b": 356.88718, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "label", "bbox": {"l": 78.207001, "t": 359.47153, "r": 95.730484, "b": 367.84616, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "List-item", "bbox": {"l": 97.976997, "t": 359.51639, "r": 130.17131, "b": 367.85513, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": ". This definition is different from PubLayNet", "bbox": {"l": 130.17101, "t": 359.47153, "r": 294.04053, "b": 367.84616, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "and DocBank, where all list-items are grouped together into", "bbox": {"l": 78.207001, "t": 370.43054, "r": 294.04385, "b": 378.80518, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "one", "bbox": {"l": 78.207001, "t": 381.38953000000004, "r": 91.593834, "b": 389.76416, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "List", "bbox": {"l": 93.834999, "t": 381.43439000000006, "r": 106.88111, "b": 389.77313, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "object.", "bbox": {"l": 109.629, "t": 381.38953000000004, "r": 133.72173, "b": 389.76416, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "(2)", "bbox": {"l": 64.707993, "t": 392.34851, "r": 75.097656, "b": 400.72313999999994, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "A", "bbox": {"l": 77.545731, "t": 392.34851, "r": 84.351402, "b": 400.72313999999994, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "List-item", "bbox": {"l": 86.584, "t": 392.39339999999993, "r": 118.01329000000001, "b": 400.73215, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "is a paragraph with hanging indentation. Single-", "bbox": {"l": 120.26899999999999, "t": 392.34854, "r": 295.55695, "b": 400.72317999999996, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "line elements can qualify as", "bbox": {"l": 78.207001, "t": 403.30753, "r": 181.80978, "b": 411.68216, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "List-item", "bbox": {"l": 184.175, "t": 403.35239, "r": 216.68806000000004, "b": 411.69113, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "if the neighbour ele-", "bbox": {"l": 219.078, "t": 403.30753, "r": 295.56372, "b": 411.68216, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "ments expose hanging indentation. Bullet or enumeration", "bbox": {"l": 78.207001, "t": 414.2665400000001, "r": 294.04617, "b": 422.64116999999993, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "symbols are not a requirement.", "bbox": {"l": 78.207001, "t": 425.22552, "r": 192.00853, "b": 433.60016, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "(3)", "bbox": {"l": 64.708, "t": 436.18451000000005, "r": 74.483009, "b": 444.55914, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "For every", "bbox": {"l": 76.786255, "t": 436.18451000000005, "r": 112.61566, "b": 444.55914, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "Caption", "bbox": {"l": 114.861, "t": 436.2294, "r": 142.61249, "b": 444.56815000000006, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": ", there must be exactly one corresponding", "bbox": {"l": 142.612, "t": 436.18454, "r": 294.04724, "b": 444.55917, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "Picture", "bbox": {"l": 78.207001, "t": 447.18839, "r": 102.79287, "b": 455.52713, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "or", "bbox": {"l": 105.245, "t": 447.14352, "r": 113.09956999999999, "b": 455.51815999999997, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Table", "bbox": {"l": 115.341, "t": 447.18839, "r": 134.40356, "b": 455.52713, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": ".", "bbox": {"l": 134.403, "t": 447.14352, "r": 136.37561, "b": 455.51815999999997, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "(4)", "bbox": {"l": 64.708, "t": 458.1015300000001, "r": 74.220215, "b": 466.47617, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "Connected sub-pictures are grouped together in one", "bbox": {"l": 76.461555, "t": 458.1015300000001, "r": 267.46786, "b": 466.47617, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "Picture", "bbox": {"l": 269.70599, "t": 458.14639, "r": 294.04599, "b": 466.48514, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "object.", "bbox": {"l": 78.207001, "t": 469.06055, "r": 102.29972, "b": 477.43518, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "(5)", "bbox": {"l": 64.708, "t": 480.01953, "r": 74.345383, "b": 488.39417, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Formula numbers are included in a", "bbox": {"l": 76.616203, "t": 480.01953, "r": 206.13503, "b": 488.39417, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Formula", "bbox": {"l": 208.38, "t": 480.06439, "r": 238.12155, "b": 488.40314, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "object.", "bbox": {"l": 240.41300999999999, "t": 480.01953, "r": 264.50571, "b": 488.39417, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "(6)", "bbox": {"l": 64.708008, "t": 490.97852, "r": 74.564522, "b": 499.35315, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "Emphasised text (e.g. in italic or bold) at the beginning of", "bbox": {"l": 76.886978, "t": 490.97852, "r": 294.04617, "b": 499.35315, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "a paragraph is not considered a", "bbox": {"l": 78.207001, "t": 501.93753, "r": 200.34819, "b": 510.31216, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "Section-header", "bbox": {"l": 203.66701, "t": 501.98239, "r": 256.57504, "b": 510.32114, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": ", unless it", "bbox": {"l": 256.57401, "t": 501.93753, "r": 294.04401, "b": 510.31216, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "appears exclusively on its own line.", "bbox": {"l": 78.207001, "t": 512.8965499999999, "r": 208.13017, "b": 521.27118, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "The complete annotation guideline is over 100 pages long and a", "bbox": {"l": 53.528999, "t": 532.9505300000001, "r": 294.04337, "b": 541.32516, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "detailed description is obviously out of scope for this paper. Never-", "bbox": {"l": 53.79800000000001, "t": 543.90855, "r": 295.56253, "b": 552.28317, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "theless, it will be made publicly available alongside with DocLayNet", "bbox": {"l": 53.79800000000001, "t": 554.8675499999999, "r": 294.04538, "b": 563.24217, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "for future reference.", "bbox": {"l": 53.79800000000001, "t": 565.82655, "r": 127.2418, "b": 574.20117, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Phase 3: Training.", "bbox": {"l": 63.76100199999999, "t": 576.66899, "r": 136.7744, "b": 585.14224, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "After a first trial with a small group of peo-", "bbox": {"l": 139.008, "t": 576.7855500000001, "r": 295.56226, "b": 585.16017, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "ple, we realised that providing the annotation guideline and a set of", "bbox": {"l": 53.79800000000001, "t": 587.74455, "r": 294.04532, "b": 596.1191699999999, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "random practice pages did not yield the desired quality level for lay-", "bbox": {"l": 53.79800000000001, "t": 598.70355, "r": 295.55676, "b": 607.07817, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "out annotation. Therefore we prepared a subset of pages with two", "bbox": {"l": 53.79800000000001, "t": 609.66255, "r": 294.04605, "b": 618.0371700000001, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "different complexity levels, each with a practice and an exam part.", "bbox": {"l": 53.79800000000001, "t": 620.6215500000001, "r": 295.42377, "b": 628.99617, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "974 pages were reference-annotated by one proficient core team", "bbox": {"l": 53.79800000000001, "t": 631.58055, "r": 294.04712, "b": 639.95517, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "member. Annotation staff were then given the task to annotate the", "bbox": {"l": 53.79800000000001, "t": 642.53955, "r": 294.04922, "b": 650.91417, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "same subsets (blinded from the reference). By comparing the an-", "bbox": {"l": 53.79800000000001, "t": 653.49855, "r": 295.55618, "b": 661.87317, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "notations of each staff member with the reference annotations, we", "bbox": {"l": 53.79800000000001, "t": 664.45655, "r": 294.04874, "b": 672.83117, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "could quantify how closely their annotations matched the reference.", "bbox": {"l": 53.79800000000001, "t": 675.4155499999999, "r": 295.42496, "b": 683.79017, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "Only after passing two exam levels with high annotation quality,", "bbox": {"l": 53.79800000000001, "t": 686.37456, "r": 295.0274, "b": 694.749176, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "staff were admitted into the production phase. Practice iterations", "bbox": {"l": 53.79800000000001, "t": 697.333557, "r": 294.04114, "b": 705.708176, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "1ef23f5e6d7f10d393f9947e8208285dce9ae87250ac483ac4b4a59d51b4e037", "bbox": {"l": 340.00214, "t": 179.79296999999997, "r": 416.20551, "b": 181.90972999999997, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "Compliant with guidelines", "bbox": {"l": 339.38269, "t": 85.19066999999995, "r": 417.83722, "b": 92.28399999999999, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Plausible but invalid alternative", "bbox": {"l": 451.42834, "t": 85.19066999999995, "r": 546.22913, "b": 92.28399999999999, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Borderline case: Two guideline-compliant alternatives", "bbox": {"l": 350.33701, "t": 364.85706, "r": 513.48035, "b": 371.95035000000007, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "03c31a2ee1ed1b583c28957f475ee545d144e1b5a264dc4dd068c8d2f6a64860", "bbox": {"l": 340.00201, "t": 245.07385, "r": 416.20538, "b": 247.19061, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "1a5cd524f1844c1260c8e8c073e1f442423c264583212b0d0b6626fc780e6ed4", "bbox": {"l": 340.00201, "t": 359.12488, "r": 416.20538, "b": 361.24167, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "05237a14f2524e3f53c8454b074409d05078038a6a36b770fcc8ec7e540deae0", "bbox": {"l": 400.12842, "t": 458.44327000000004, "r": 476.33178999999996, "b": 460.5600600000001, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "A", "bbox": {"l": 322.19424, "t": 98.34105999999997, "r": 326.01498, "b": 104.25214000000005, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "B", "bbox": {"l": 322.19424, "t": 186.99103000000002, "r": 326.01498, "b": 192.90204000000006, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "C", "bbox": {"l": 322.19424, "t": 253.54192999999998, "r": 326.01498, "b": 259.453, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "D", "bbox": {"l": 322.19424, "t": 367.08495999999997, "r": 326.01498, "b": 372.996, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "Figure 4: Examples of plausible annotation alternatives for", "bbox": {"l": 317.95499, "t": 473.49399, "r": 558.3891, "b": 481.96722, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "the same page. Criteria in our annotation guideline can re-", "bbox": {"l": 317.95499, "t": 484.45297, "r": 559.80579, "b": 492.92621, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "solve cases A to C, while the case D remains ambiguous.", "bbox": {"l": 317.95499, "t": 495.41196, "r": 544.14148, "b": 503.88519, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "were carried out over a timeframe of 12 weeks, after which 8 of the", "bbox": {"l": 317.62299, "t": 525.49753, "r": 558.20435, "b": 533.87216, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "40", "bbox": {"l": 317.74899, "t": 536.45656, "r": 326.07019, "b": 544.83118, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "initially allocated annotators did not pass the bar.", "bbox": {"l": 328.3071, "t": 536.45656, "r": 509.11896, "b": 544.83118, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "Phase 4: Production annotation.", "bbox": {"l": 327.918, "t": 547.299, "r": 456.80109000000004, "b": 555.77225, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "The previously selected 80K", "bbox": {"l": 458.7120100000001, "t": 547.41556, "r": 558.48926, "b": 555.79018, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "pages were annotated with the defined 11 class labels by 32 annota-", "bbox": {"l": 317.95499, "t": 558.37456, "r": 559.71368, "b": 566.74918, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "tors. This production phase took around three months to complete.", "bbox": {"l": 317.95499, "t": 569.33356, "r": 559.58124, "b": 577.7081800000001, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "All annotations were created online through CCS, which visualises", "bbox": {"l": 317.64099, "t": 580.29256, "r": 558.20386, "b": 588.66718, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "the programmatic PDF text-cells as an overlay on the page. The page", "bbox": {"l": 317.95499, "t": 591.25156, "r": 558.20221, "b": 599.62617, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "annotation are obtained by drawing rectangular bounding-boxes,", "bbox": {"l": 317.95499, "t": 602.20955, "r": 559.18457, "b": 610.58417, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "as shown in Figure 3. With regard to the annotation practices, we", "bbox": {"l": 317.95499, "t": 613.16855, "r": 558.20197, "b": 621.54317, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "implemented a few constraints and capabilities on the tooling level.", "bbox": {"l": 317.95499, "t": 624.12755, "r": 559.58197, "b": 632.50217, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "First, we only allow non-overlapping, vertically oriented, rectangu-", "bbox": {"l": 317.95499, "t": 635.08655, "r": 559.71411, "b": 643.46117, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "lar boxes. For the large majority of documents, this constraint was", "bbox": {"l": 317.95499, "t": 646.04555, "r": 558.20557, "b": 654.42017, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "sufficient and it speeds up the annotation considerably in compar-", "bbox": {"l": 317.95499, "t": 657.00455, "r": 559.7149, "b": 665.3791699999999, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "ison with arbitrary segmentation shapes. Second, annotator staff", "bbox": {"l": 317.95499, "t": 667.9635499999999, "r": 558.19849, "b": 676.33817, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "were not able to see each other\u2019s annotations. This was enforced by", "bbox": {"l": 317.62299, "t": 678.92255, "r": 558.43268, "b": 687.29717, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "design to avoid any bias in the annotation, which could skew the", "bbox": {"l": 317.95499, "t": 689.8815500000001, "r": 558.19806, "b": 698.256172, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "numbers of the inter-annotator agreement (see Table 1). We wanted", "bbox": {"l": 317.95499, "t": 700.840553, "r": 558.20227, "b": 709.2151719999999, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 13, "label": "page_header", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.8877827525138855, "cells": [{"id": 0, "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "page_header", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.8534670472145081, "cells": [{"id": 1, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 53.79800000000001, "t": 87.36352999999997, "r": 294.04541, "b": 106.70612000000006, "coord_origin": "TOPLEFT"}, "confidence": 0.9022762179374695, "cells": [{"id": 2, "text": "the textual content of an element, which goes beyond visual layout", "bbox": {"l": 53.79800000000001, "t": 87.36352999999997, "r": 294.04541, "b": 95.73816, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "recognition, in particular outside the", "bbox": {"l": 53.79800000000001, "t": 98.32250999999997, "r": 188.1326, "b": 106.69713999999999, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Scientific Articles", "bbox": {"l": 190.37401, "t": 98.36737000000005, "r": 251.25586999999996, "b": 106.70612000000006, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "category.", "bbox": {"l": 253.70801, "t": 98.32250999999997, "r": 287.01816, "b": 106.69713999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "text", "bbox": {"l": 53.79800000000001, "t": 109.28156000000001, "r": 295.55923, "b": 249.16216999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9711344838142395, "cells": [{"id": 6, "text": "At first sight, the task of visual document-layout interpretation", "bbox": {"l": 63.76100199999999, "t": 109.28156000000001, "r": 294.04257, "b": 117.65618999999992, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "appears intuitive enough to obtain plausible annotations in most", "bbox": {"l": 53.79800000000001, "t": 120.24054000000001, "r": 294.04266, "b": 128.61517000000003, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "cases. However, during early trial-runs in the core team, we ob-", "bbox": {"l": 53.79800000000001, "t": 131.19854999999995, "r": 295.55615, "b": 139.57317999999998, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "served many cases in which annotators use different annotation", "bbox": {"l": 53.79800000000001, "t": 142.15752999999995, "r": 294.04715, "b": 150.53216999999995, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "styles, especially for documents with challenging layouts. For ex-", "bbox": {"l": 53.79800000000001, "t": 153.11652000000004, "r": 295.55923, "b": 161.49114999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "ample, if a figure is presented with subfigures, one annotator might", "bbox": {"l": 53.79800000000001, "t": 164.07556, "r": 294.04535, "b": 172.4502, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "draw a single figure bounding-box, while another might annotate", "bbox": {"l": 53.79800000000001, "t": 175.03454999999997, "r": 294.04803, "b": 183.40918, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "each subfigure separately. The same applies for lists, where one", "bbox": {"l": 53.79800000000001, "t": 185.99352999999996, "r": 294.04709, "b": 194.36816, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "might annotate all list items in one block or each list item sep-", "bbox": {"l": 53.79800000000001, "t": 196.95250999999996, "r": 295.55612, "b": 205.32714999999996, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "arately. In essence, we observed that challenging layouts would", "bbox": {"l": 53.79800000000001, "t": 207.91156, "r": 294.04712, "b": 216.28619000000003, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "be annotated in different but plausible ways. To illustrate this, we", "bbox": {"l": 53.79800000000001, "t": 218.87054, "r": 294.04495, "b": 227.24518, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "show in Figure 4 multiple examples of plausible but inconsistent", "bbox": {"l": 53.79800000000001, "t": 229.82952999999998, "r": 294.04712, "b": 238.20416, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "annotations on the same pages.", "bbox": {"l": 53.79800000000001, "t": 240.78754000000004, "r": 168.61276, "b": 249.16216999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 53.79800000000001, "t": 251.74652000000003, "r": 295.56006, "b": 336.83417, "coord_origin": "TOPLEFT"}, "confidence": 0.985905110836029, "cells": [{"id": 19, "text": "Obviously, this inconsistency in annotations is not desirable for", "bbox": {"l": 63.76100199999999, "t": 251.74652000000003, "r": 294.21884, "b": 260.12114999999994, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "datasets which are intended to be used for model training. To min-", "bbox": {"l": 53.79800000000001, "t": 262.70556999999997, "r": 295.56006, "b": 271.0802, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "imise these inconsistencies, we created a detailed annotation guide-", "bbox": {"l": 53.79800000000001, "t": 273.66454999999996, "r": 295.55676, "b": 282.03918, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "line. While perfect consistency across 40 annotation staff members", "bbox": {"l": 53.79800000000001, "t": 284.62354, "r": 294.04922, "b": 292.99817, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "is clearly not possible to achieve, we saw a huge improvement in", "bbox": {"l": 53.79800000000001, "t": 295.5825500000001, "r": 294.04343, "b": 303.95717999999994, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "annotation consistency after the introduction of our annotation", "bbox": {"l": 53.79800000000001, "t": 306.54153, "r": 294.04712, "b": 314.91617, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "guideline. A few selected, non-trivial highlights of the guideline", "bbox": {"l": 53.79800000000001, "t": 317.50055, "r": 294.04718, "b": 325.87518, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "are:", "bbox": {"l": 53.79800000000001, "t": 328.4595299999999, "r": 67.28347, "b": 336.83417, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "list_item", "bbox": {"l": 64.708, "t": 348.51254, "r": 294.0462, "b": 389.77313, "coord_origin": "TOPLEFT"}, "confidence": 0.9691526293754578, "cells": [{"id": 27, "text": "(1)", "bbox": {"l": 64.708, "t": 348.51254, "r": 74.626793, "b": 356.88718, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Every list-item is an individual object instance with class", "bbox": {"l": 76.963936, "t": 348.51254, "r": 294.0462, "b": 356.88718, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "label", "bbox": {"l": 78.207001, "t": 359.47153, "r": 95.730484, "b": 367.84616, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "List-item", "bbox": {"l": 97.976997, "t": 359.51639, "r": 130.17131, "b": 367.85513, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": ". This definition is different from PubLayNet", "bbox": {"l": 130.17101, "t": 359.47153, "r": 294.04053, "b": 367.84616, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "and DocBank, where all list-items are grouped together into", "bbox": {"l": 78.207001, "t": 370.43054, "r": 294.04385, "b": 378.80518, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "one", "bbox": {"l": 78.207001, "t": 381.38953000000004, "r": 91.593834, "b": 389.76416, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "List", "bbox": {"l": 93.834999, "t": 381.43439000000006, "r": 106.88111, "b": 389.77313, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "object.", "bbox": {"l": 109.629, "t": 381.38953000000004, "r": 133.72173, "b": 389.76416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "list_item", "bbox": {"l": 64.707993, "t": 392.34851, "r": 295.56372, "b": 433.60016, "coord_origin": "TOPLEFT"}, "confidence": 0.9591284990310669, "cells": [{"id": 36, "text": "(2)", "bbox": {"l": 64.707993, "t": 392.34851, "r": 75.097656, "b": 400.72313999999994, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "A", "bbox": {"l": 77.545731, "t": 392.34851, "r": 84.351402, "b": 400.72313999999994, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "List-item", "bbox": {"l": 86.584, "t": 392.39339999999993, "r": 118.01329000000001, "b": 400.73215, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "is a paragraph with hanging indentation. Single-", "bbox": {"l": 120.26899999999999, "t": 392.34854, "r": 295.55695, "b": 400.72317999999996, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "line elements can qualify as", "bbox": {"l": 78.207001, "t": 403.30753, "r": 181.80978, "b": 411.68216, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "List-item", "bbox": {"l": 184.175, "t": 403.35239, "r": 216.68806000000004, "b": 411.69113, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "if the neighbour ele-", "bbox": {"l": 219.078, "t": 403.30753, "r": 295.56372, "b": 411.68216, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "ments expose hanging indentation. Bullet or enumeration", "bbox": {"l": 78.207001, "t": 414.2665400000001, "r": 294.04617, "b": 422.64116999999993, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "symbols are not a requirement.", "bbox": {"l": 78.207001, "t": 425.22552, "r": 192.00853, "b": 433.60016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "list_item", "bbox": {"l": 64.708, "t": 436.18451000000005, "r": 294.04724, "b": 455.52713, "coord_origin": "TOPLEFT"}, "confidence": 0.9413429498672485, "cells": [{"id": 45, "text": "(3)", "bbox": {"l": 64.708, "t": 436.18451000000005, "r": 74.483009, "b": 444.55914, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "For every", "bbox": {"l": 76.786255, "t": 436.18451000000005, "r": 112.61566, "b": 444.55914, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "Caption", "bbox": {"l": 114.861, "t": 436.2294, "r": 142.61249, "b": 444.56815000000006, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": ", there must be exactly one corresponding", "bbox": {"l": 142.612, "t": 436.18454, "r": 294.04724, "b": 444.55917, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "Picture", "bbox": {"l": 78.207001, "t": 447.18839, "r": 102.79287, "b": 455.52713, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "or", "bbox": {"l": 105.245, "t": 447.14352, "r": 113.09956999999999, "b": 455.51815999999997, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Table", "bbox": {"l": 115.341, "t": 447.18839, "r": 134.40356, "b": 455.52713, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": ".", "bbox": {"l": 134.403, "t": 447.14352, "r": 136.37561, "b": 455.51815999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "list_item", "bbox": {"l": 64.708, "t": 458.1015300000001, "r": 294.04599, "b": 477.43518, "coord_origin": "TOPLEFT"}, "confidence": 0.9426738023757935, "cells": [{"id": 53, "text": "(4)", "bbox": {"l": 64.708, "t": 458.1015300000001, "r": 74.220215, "b": 466.47617, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "Connected sub-pictures are grouped together in one", "bbox": {"l": 76.461555, "t": 458.1015300000001, "r": 267.46786, "b": 466.47617, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "Picture", "bbox": {"l": 269.70599, "t": 458.14639, "r": 294.04599, "b": 466.48514, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "object.", "bbox": {"l": 78.207001, "t": 469.06055, "r": 102.29972, "b": 477.43518, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "list_item", "bbox": {"l": 64.708, "t": 480.01953, "r": 264.50571, "b": 488.40314, "coord_origin": "TOPLEFT"}, "confidence": 0.9147457480430603, "cells": [{"id": 57, "text": "(5)", "bbox": {"l": 64.708, "t": 480.01953, "r": 74.345383, "b": 488.39417, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Formula numbers are included in a", "bbox": {"l": 76.616203, "t": 480.01953, "r": 206.13503, "b": 488.39417, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Formula", "bbox": {"l": 208.38, "t": 480.06439, "r": 238.12155, "b": 488.40314, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "object.", "bbox": {"l": 240.41300999999999, "t": 480.01953, "r": 264.50571, "b": 488.39417, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "list_item", "bbox": {"l": 64.708008, "t": 490.97852, "r": 294.04617, "b": 521.27118, "coord_origin": "TOPLEFT"}, "confidence": 0.9544308185577393, "cells": [{"id": 61, "text": "(6)", "bbox": {"l": 64.708008, "t": 490.97852, "r": 74.564522, "b": 499.35315, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "Emphasised text (e.g. in italic or bold) at the beginning of", "bbox": {"l": 76.886978, "t": 490.97852, "r": 294.04617, "b": 499.35315, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "a paragraph is not considered a", "bbox": {"l": 78.207001, "t": 501.93753, "r": 200.34819, "b": 510.31216, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "Section-header", "bbox": {"l": 203.66701, "t": 501.98239, "r": 256.57504, "b": 510.32114, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": ", unless it", "bbox": {"l": 256.57401, "t": 501.93753, "r": 294.04401, "b": 510.31216, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "appears exclusively on its own line.", "bbox": {"l": 78.207001, "t": 512.8965499999999, "r": 208.13017, "b": 521.27118, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 53.528999, "t": 532.9505300000001, "r": 295.56253, "b": 574.20117, "coord_origin": "TOPLEFT"}, "confidence": 0.9811431169509888, "cells": [{"id": 67, "text": "The complete annotation guideline is over 100 pages long and a", "bbox": {"l": 53.528999, "t": 532.9505300000001, "r": 294.04337, "b": 541.32516, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "detailed description is obviously out of scope for this paper. Never-", "bbox": {"l": 53.79800000000001, "t": 543.90855, "r": 295.56253, "b": 552.28317, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "theless, it will be made publicly available alongside with DocLayNet", "bbox": {"l": 53.79800000000001, "t": 554.8675499999999, "r": 294.04538, "b": 563.24217, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "for future reference.", "bbox": {"l": 53.79800000000001, "t": 565.82655, "r": 127.2418, "b": 574.20117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 53.79800000000001, "t": 576.66899, "r": 295.56226, "b": 705.708176, "coord_origin": "TOPLEFT"}, "confidence": 0.9864389896392822, "cells": [{"id": 71, "text": "Phase 3: Training.", "bbox": {"l": 63.76100199999999, "t": 576.66899, "r": 136.7744, "b": 585.14224, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "After a first trial with a small group of peo-", "bbox": {"l": 139.008, "t": 576.7855500000001, "r": 295.56226, "b": 585.16017, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "ple, we realised that providing the annotation guideline and a set of", "bbox": {"l": 53.79800000000001, "t": 587.74455, "r": 294.04532, "b": 596.1191699999999, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "random practice pages did not yield the desired quality level for lay-", "bbox": {"l": 53.79800000000001, "t": 598.70355, "r": 295.55676, "b": 607.07817, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "out annotation. Therefore we prepared a subset of pages with two", "bbox": {"l": 53.79800000000001, "t": 609.66255, "r": 294.04605, "b": 618.0371700000001, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "different complexity levels, each with a practice and an exam part.", "bbox": {"l": 53.79800000000001, "t": 620.6215500000001, "r": 295.42377, "b": 628.99617, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "974 pages were reference-annotated by one proficient core team", "bbox": {"l": 53.79800000000001, "t": 631.58055, "r": 294.04712, "b": 639.95517, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "member. Annotation staff were then given the task to annotate the", "bbox": {"l": 53.79800000000001, "t": 642.53955, "r": 294.04922, "b": 650.91417, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "same subsets (blinded from the reference). By comparing the an-", "bbox": {"l": 53.79800000000001, "t": 653.49855, "r": 295.55618, "b": 661.87317, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "notations of each staff member with the reference annotations, we", "bbox": {"l": 53.79800000000001, "t": 664.45655, "r": 294.04874, "b": 672.83117, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "could quantify how closely their annotations matched the reference.", "bbox": {"l": 53.79800000000001, "t": 675.4155499999999, "r": 295.42496, "b": 683.79017, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "Only after passing two exam levels with high annotation quality,", "bbox": {"l": 53.79800000000001, "t": 686.37456, "r": 295.0274, "b": 694.749176, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "staff were admitted into the production phase. Practice iterations", "bbox": {"l": 53.79800000000001, "t": 697.333557, "r": 294.04114, "b": 705.708176, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "picture", "bbox": {"l": 315.960205078125, "t": 85.33881378173828, "r": 559.396484375, "b": 459.68084716796875, "coord_origin": "TOPLEFT"}, "confidence": 0.7264115214347839, "cells": [{"id": 84, "text": "1ef23f5e6d7f10d393f9947e8208285dce9ae87250ac483ac4b4a59d51b4e037", "bbox": {"l": 340.00214, "t": 179.79296999999997, "r": 416.20551, "b": 181.90972999999997, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "Compliant with guidelines", "bbox": {"l": 339.38269, "t": 85.19066999999995, "r": 417.83722, "b": 92.28399999999999, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Plausible but invalid alternative", "bbox": {"l": 451.42834, "t": 85.19066999999995, "r": 546.22913, "b": 92.28399999999999, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Borderline case: Two guideline-compliant alternatives", "bbox": {"l": 350.33701, "t": 364.85706, "r": 513.48035, "b": 371.95035000000007, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "03c31a2ee1ed1b583c28957f475ee545d144e1b5a264dc4dd068c8d2f6a64860", "bbox": {"l": 340.00201, "t": 245.07385, "r": 416.20538, "b": 247.19061, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "1a5cd524f1844c1260c8e8c073e1f442423c264583212b0d0b6626fc780e6ed4", "bbox": {"l": 340.00201, "t": 359.12488, "r": 416.20538, "b": 361.24167, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "A", "bbox": {"l": 322.19424, "t": 98.34105999999997, "r": 326.01498, "b": 104.25214000000005, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "B", "bbox": {"l": 322.19424, "t": 186.99103000000002, "r": 326.01498, "b": 192.90204000000006, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "C", "bbox": {"l": 322.19424, "t": 253.54192999999998, "r": 326.01498, "b": 259.453, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "D", "bbox": {"l": 322.19424, "t": 367.08495999999997, "r": 326.01498, "b": 372.996, "coord_origin": "TOPLEFT"}}], "children": [{"id": 16, "label": "text", "bbox": {"l": 340.00214, "t": 179.79296999999997, "r": 416.20551, "b": 181.90972999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "1ef23f5e6d7f10d393f9947e8208285dce9ae87250ac483ac4b4a59d51b4e037", "bbox": {"l": 340.00214, "t": 179.79296999999997, "r": 416.20551, "b": 181.90972999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 339.38269, "t": 85.19066999999995, "r": 417.83722, "b": 92.28399999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "Compliant with guidelines", "bbox": {"l": 339.38269, "t": 85.19066999999995, "r": 417.83722, "b": 92.28399999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 451.42834, "t": 85.19066999999995, "r": 546.22913, "b": 92.28399999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "Plausible but invalid alternative", "bbox": {"l": 451.42834, "t": 85.19066999999995, "r": 546.22913, "b": 92.28399999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 350.33701, "t": 364.85706, "r": 513.48035, "b": 371.95035000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "Borderline case: Two guideline-compliant alternatives", "bbox": {"l": 350.33701, "t": 364.85706, "r": 513.48035, "b": 371.95035000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 340.00201, "t": 245.07385, "r": 416.20538, "b": 247.19061, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "03c31a2ee1ed1b583c28957f475ee545d144e1b5a264dc4dd068c8d2f6a64860", "bbox": {"l": 340.00201, "t": 245.07385, "r": 416.20538, "b": 247.19061, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 340.00201, "t": 359.12488, "r": 416.20538, "b": 361.24167, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "1a5cd524f1844c1260c8e8c073e1f442423c264583212b0d0b6626fc780e6ed4", "bbox": {"l": 340.00201, "t": 359.12488, "r": 416.20538, "b": 361.24167, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 322.19424, "t": 98.34105999999997, "r": 326.01498, "b": 104.25214000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "A", "bbox": {"l": 322.19424, "t": 98.34105999999997, "r": 326.01498, "b": 104.25214000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 322.19424, "t": 186.99103000000002, "r": 326.01498, "b": 192.90204000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "B", "bbox": {"l": 322.19424, "t": 186.99103000000002, "r": 326.01498, "b": 192.90204000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 322.19424, "t": 253.54192999999998, "r": 326.01498, "b": 259.453, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "C", "bbox": {"l": 322.19424, "t": 253.54192999999998, "r": 326.01498, "b": 259.453, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 322.19424, "t": 367.08495999999997, "r": 326.01498, "b": 372.996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "D", "bbox": {"l": 322.19424, "t": 367.08495999999997, "r": 326.01498, "b": 372.996, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 22, "label": "text", "bbox": {"l": 400.12842, "t": 458.44327000000004, "r": 476.33178999999996, "b": 460.5600600000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "05237a14f2524e3f53c8454b074409d05078038a6a36b770fcc8ec7e540deae0", "bbox": {"l": 400.12842, "t": 458.44327000000004, "r": 476.33178999999996, "b": 460.5600600000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "caption", "bbox": {"l": 317.95499, "t": 473.49399, "r": 559.80579, "b": 503.88519, "coord_origin": "TOPLEFT"}, "confidence": 0.8873711824417114, "cells": [{"id": 95, "text": "Figure 4: Examples of plausible annotation alternatives for", "bbox": {"l": 317.95499, "t": 473.49399, "r": 558.3891, "b": 481.96722, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "the same page. Criteria in our annotation guideline can re-", "bbox": {"l": 317.95499, "t": 484.45297, "r": 559.80579, "b": 492.92621, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "solve cases A to C, while the case D remains ambiguous.", "bbox": {"l": 317.95499, "t": 495.41196, "r": 544.14148, "b": 503.88519, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "text", "bbox": {"l": 317.62299, "t": 525.49753, "r": 558.20435, "b": 544.83118, "coord_origin": "TOPLEFT"}, "confidence": 0.9611718654632568, "cells": [{"id": 98, "text": "were carried out over a timeframe of 12 weeks, after which 8 of the", "bbox": {"l": 317.62299, "t": 525.49753, "r": 558.20435, "b": 533.87216, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "40", "bbox": {"l": 317.74899, "t": 536.45656, "r": 326.07019, "b": 544.83118, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "initially allocated annotators did not pass the bar.", "bbox": {"l": 328.3071, "t": 536.45656, "r": 509.11896, "b": 544.83118, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 317.62299, "t": 547.299, "r": 559.7149, "b": 709.2151719999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9829543232917786, "cells": [{"id": 101, "text": "Phase 4: Production annotation.", "bbox": {"l": 327.918, "t": 547.299, "r": 456.80109000000004, "b": 555.77225, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "The previously selected 80K", "bbox": {"l": 458.7120100000001, "t": 547.41556, "r": 558.48926, "b": 555.79018, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "pages were annotated with the defined 11 class labels by 32 annota-", "bbox": {"l": 317.95499, "t": 558.37456, "r": 559.71368, "b": 566.74918, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "tors. This production phase took around three months to complete.", "bbox": {"l": 317.95499, "t": 569.33356, "r": 559.58124, "b": 577.7081800000001, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "All annotations were created online through CCS, which visualises", "bbox": {"l": 317.64099, "t": 580.29256, "r": 558.20386, "b": 588.66718, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "the programmatic PDF text-cells as an overlay on the page. The page", "bbox": {"l": 317.95499, "t": 591.25156, "r": 558.20221, "b": 599.62617, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "annotation are obtained by drawing rectangular bounding-boxes,", "bbox": {"l": 317.95499, "t": 602.20955, "r": 559.18457, "b": 610.58417, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "as shown in Figure 3. With regard to the annotation practices, we", "bbox": {"l": 317.95499, "t": 613.16855, "r": 558.20197, "b": 621.54317, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "implemented a few constraints and capabilities on the tooling level.", "bbox": {"l": 317.95499, "t": 624.12755, "r": 559.58197, "b": 632.50217, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "First, we only allow non-overlapping, vertically oriented, rectangu-", "bbox": {"l": 317.95499, "t": 635.08655, "r": 559.71411, "b": 643.46117, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "lar boxes. For the large majority of documents, this constraint was", "bbox": {"l": 317.95499, "t": 646.04555, "r": 558.20557, "b": 654.42017, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "sufficient and it speeds up the annotation considerably in compar-", "bbox": {"l": 317.95499, "t": 657.00455, "r": 559.7149, "b": 665.3791699999999, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "ison with arbitrary segmentation shapes. Second, annotator staff", "bbox": {"l": 317.95499, "t": 667.9635499999999, "r": 558.19849, "b": 676.33817, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "were not able to see each other\u2019s annotations. This was enforced by", "bbox": {"l": 317.62299, "t": 678.92255, "r": 558.43268, "b": 687.29717, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "design to avoid any bias in the annotation, which could skew the", "bbox": {"l": 317.95499, "t": 689.8815500000001, "r": 558.19806, "b": 698.256172, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "numbers of the inter-annotator agreement (see Table 1). We wanted", "bbox": {"l": 317.95499, "t": 700.840553, "r": 558.20227, "b": 709.2151719999999, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_header", "id": 13, "page_no": 4, "cluster": {"id": 13, "label": "page_header", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.8877827525138855, "cells": [{"id": 0, "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis"}, {"label": "page_header", "id": 15, "page_no": 4, "cluster": {"id": 15, "label": "page_header", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.8534670472145081, "cells": [{"id": 1, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA"}, {"label": "text", "id": 12, "page_no": 4, "cluster": {"id": 12, "label": "text", "bbox": {"l": 53.79800000000001, "t": 87.36352999999997, "r": 294.04541, "b": 106.70612000000006, "coord_origin": "TOPLEFT"}, "confidence": 0.9022762179374695, "cells": [{"id": 2, "text": "the textual content of an element, which goes beyond visual layout", "bbox": {"l": 53.79800000000001, "t": 87.36352999999997, "r": 294.04541, "b": 95.73816, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "recognition, in particular outside the", "bbox": {"l": 53.79800000000001, "t": 98.32250999999997, "r": 188.1326, "b": 106.69713999999999, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Scientific Articles", "bbox": {"l": 190.37401, "t": 98.36737000000005, "r": 251.25586999999996, "b": 106.70612000000006, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "category.", "bbox": {"l": 253.70801, "t": 98.32250999999997, "r": 287.01816, "b": 106.69713999999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "the textual content of an element, which goes beyond visual layout recognition, in particular outside the Scientific Articles category."}, {"label": "text", "id": 4, "page_no": 4, "cluster": {"id": 4, "label": "text", "bbox": {"l": 53.79800000000001, "t": 109.28156000000001, "r": 295.55923, "b": 249.16216999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9711344838142395, "cells": [{"id": 6, "text": "At first sight, the task of visual document-layout interpretation", "bbox": {"l": 63.76100199999999, "t": 109.28156000000001, "r": 294.04257, "b": 117.65618999999992, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "appears intuitive enough to obtain plausible annotations in most", "bbox": {"l": 53.79800000000001, "t": 120.24054000000001, "r": 294.04266, "b": 128.61517000000003, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "cases. However, during early trial-runs in the core team, we ob-", "bbox": {"l": 53.79800000000001, "t": 131.19854999999995, "r": 295.55615, "b": 139.57317999999998, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "served many cases in which annotators use different annotation", "bbox": {"l": 53.79800000000001, "t": 142.15752999999995, "r": 294.04715, "b": 150.53216999999995, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "styles, especially for documents with challenging layouts. For ex-", "bbox": {"l": 53.79800000000001, "t": 153.11652000000004, "r": 295.55923, "b": 161.49114999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "ample, if a figure is presented with subfigures, one annotator might", "bbox": {"l": 53.79800000000001, "t": 164.07556, "r": 294.04535, "b": 172.4502, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "draw a single figure bounding-box, while another might annotate", "bbox": {"l": 53.79800000000001, "t": 175.03454999999997, "r": 294.04803, "b": 183.40918, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "each subfigure separately. The same applies for lists, where one", "bbox": {"l": 53.79800000000001, "t": 185.99352999999996, "r": 294.04709, "b": 194.36816, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "might annotate all list items in one block or each list item sep-", "bbox": {"l": 53.79800000000001, "t": 196.95250999999996, "r": 295.55612, "b": 205.32714999999996, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "arately. In essence, we observed that challenging layouts would", "bbox": {"l": 53.79800000000001, "t": 207.91156, "r": 294.04712, "b": 216.28619000000003, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "be annotated in different but plausible ways. To illustrate this, we", "bbox": {"l": 53.79800000000001, "t": 218.87054, "r": 294.04495, "b": 227.24518, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "show in Figure 4 multiple examples of plausible but inconsistent", "bbox": {"l": 53.79800000000001, "t": 229.82952999999998, "r": 294.04712, "b": 238.20416, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "annotations on the same pages.", "bbox": {"l": 53.79800000000001, "t": 240.78754000000004, "r": 168.61276, "b": 249.16216999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "At first sight, the task of visual document-layout interpretation appears intuitive enough to obtain plausible annotations in most cases. However, during early trial-runs in the core team, we observed many cases in which annotators use different annotation styles, especially for documents with challenging layouts. For example, if a figure is presented with subfigures, one annotator might draw a single figure bounding-box, while another might annotate each subfigure separately. The same applies for lists, where one might annotate all list items in one block or each list item separately. In essence, we observed that challenging layouts would be annotated in different but plausible ways. To illustrate this, we show in Figure 4 multiple examples of plausible but inconsistent annotations on the same pages."}, {"label": "text", "id": 1, "page_no": 4, "cluster": {"id": 1, "label": "text", "bbox": {"l": 53.79800000000001, "t": 251.74652000000003, "r": 295.56006, "b": 336.83417, "coord_origin": "TOPLEFT"}, "confidence": 0.985905110836029, "cells": [{"id": 19, "text": "Obviously, this inconsistency in annotations is not desirable for", "bbox": {"l": 63.76100199999999, "t": 251.74652000000003, "r": 294.21884, "b": 260.12114999999994, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "datasets which are intended to be used for model training. To min-", "bbox": {"l": 53.79800000000001, "t": 262.70556999999997, "r": 295.56006, "b": 271.0802, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "imise these inconsistencies, we created a detailed annotation guide-", "bbox": {"l": 53.79800000000001, "t": 273.66454999999996, "r": 295.55676, "b": 282.03918, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "line. While perfect consistency across 40 annotation staff members", "bbox": {"l": 53.79800000000001, "t": 284.62354, "r": 294.04922, "b": 292.99817, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "is clearly not possible to achieve, we saw a huge improvement in", "bbox": {"l": 53.79800000000001, "t": 295.5825500000001, "r": 294.04343, "b": 303.95717999999994, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "annotation consistency after the introduction of our annotation", "bbox": {"l": 53.79800000000001, "t": 306.54153, "r": 294.04712, "b": 314.91617, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "guideline. A few selected, non-trivial highlights of the guideline", "bbox": {"l": 53.79800000000001, "t": 317.50055, "r": 294.04718, "b": 325.87518, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "are:", "bbox": {"l": 53.79800000000001, "t": 328.4595299999999, "r": 67.28347, "b": 336.83417, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Obviously, this inconsistency in annotations is not desirable for datasets which are intended to be used for model training. To minimise these inconsistencies, we created a detailed annotation guideline. While perfect consistency across 40 annotation staff members is clearly not possible to achieve, we saw a huge improvement in annotation consistency after the introduction of our annotation guideline. A few selected, non-trivial highlights of the guideline are:"}, {"label": "list_item", "id": 5, "page_no": 4, "cluster": {"id": 5, "label": "list_item", "bbox": {"l": 64.708, "t": 348.51254, "r": 294.0462, "b": 389.77313, "coord_origin": "TOPLEFT"}, "confidence": 0.9691526293754578, "cells": [{"id": 27, "text": "(1)", "bbox": {"l": 64.708, "t": 348.51254, "r": 74.626793, "b": 356.88718, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Every list-item is an individual object instance with class", "bbox": {"l": 76.963936, "t": 348.51254, "r": 294.0462, "b": 356.88718, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "label", "bbox": {"l": 78.207001, "t": 359.47153, "r": 95.730484, "b": 367.84616, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "List-item", "bbox": {"l": 97.976997, "t": 359.51639, "r": 130.17131, "b": 367.85513, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": ". This definition is different from PubLayNet", "bbox": {"l": 130.17101, "t": 359.47153, "r": 294.04053, "b": 367.84616, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "and DocBank, where all list-items are grouped together into", "bbox": {"l": 78.207001, "t": 370.43054, "r": 294.04385, "b": 378.80518, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "one", "bbox": {"l": 78.207001, "t": 381.38953000000004, "r": 91.593834, "b": 389.76416, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "List", "bbox": {"l": 93.834999, "t": 381.43439000000006, "r": 106.88111, "b": 389.77313, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "object.", "bbox": {"l": 109.629, "t": 381.38953000000004, "r": 133.72173, "b": 389.76416, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "(1) Every list-item is an individual object instance with class label List-item . This definition is different from PubLayNet and DocBank, where all list-items are grouped together into one List object."}, {"label": "list_item", "id": 7, "page_no": 4, "cluster": {"id": 7, "label": "list_item", "bbox": {"l": 64.707993, "t": 392.34851, "r": 295.56372, "b": 433.60016, "coord_origin": "TOPLEFT"}, "confidence": 0.9591284990310669, "cells": [{"id": 36, "text": "(2)", "bbox": {"l": 64.707993, "t": 392.34851, "r": 75.097656, "b": 400.72313999999994, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "A", "bbox": {"l": 77.545731, "t": 392.34851, "r": 84.351402, "b": 400.72313999999994, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "List-item", "bbox": {"l": 86.584, "t": 392.39339999999993, "r": 118.01329000000001, "b": 400.73215, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "is a paragraph with hanging indentation. Single-", "bbox": {"l": 120.26899999999999, "t": 392.34854, "r": 295.55695, "b": 400.72317999999996, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "line elements can qualify as", "bbox": {"l": 78.207001, "t": 403.30753, "r": 181.80978, "b": 411.68216, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "List-item", "bbox": {"l": 184.175, "t": 403.35239, "r": 216.68806000000004, "b": 411.69113, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "if the neighbour ele-", "bbox": {"l": 219.078, "t": 403.30753, "r": 295.56372, "b": 411.68216, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "ments expose hanging indentation. Bullet or enumeration", "bbox": {"l": 78.207001, "t": 414.2665400000001, "r": 294.04617, "b": 422.64116999999993, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "symbols are not a requirement.", "bbox": {"l": 78.207001, "t": 425.22552, "r": 192.00853, "b": 433.60016, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "(2) A List-item is a paragraph with hanging indentation. Singleline elements can qualify as List-item if the neighbour elements expose hanging indentation. Bullet or enumeration symbols are not a requirement."}, {"label": "list_item", "id": 10, "page_no": 4, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 64.708, "t": 436.18451000000005, "r": 294.04724, "b": 455.52713, "coord_origin": "TOPLEFT"}, "confidence": 0.9413429498672485, "cells": [{"id": 45, "text": "(3)", "bbox": {"l": 64.708, "t": 436.18451000000005, "r": 74.483009, "b": 444.55914, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "For every", "bbox": {"l": 76.786255, "t": 436.18451000000005, "r": 112.61566, "b": 444.55914, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "Caption", "bbox": {"l": 114.861, "t": 436.2294, "r": 142.61249, "b": 444.56815000000006, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": ", there must be exactly one corresponding", "bbox": {"l": 142.612, "t": 436.18454, "r": 294.04724, "b": 444.55917, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "Picture", "bbox": {"l": 78.207001, "t": 447.18839, "r": 102.79287, "b": 455.52713, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "or", "bbox": {"l": 105.245, "t": 447.14352, "r": 113.09956999999999, "b": 455.51815999999997, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Table", "bbox": {"l": 115.341, "t": 447.18839, "r": 134.40356, "b": 455.52713, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": ".", "bbox": {"l": 134.403, "t": 447.14352, "r": 136.37561, "b": 455.51815999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "(3) For every Caption , there must be exactly one corresponding Picture or Table ."}, {"label": "list_item", "id": 9, "page_no": 4, "cluster": {"id": 9, "label": "list_item", "bbox": {"l": 64.708, "t": 458.1015300000001, "r": 294.04599, "b": 477.43518, "coord_origin": "TOPLEFT"}, "confidence": 0.9426738023757935, "cells": [{"id": 53, "text": "(4)", "bbox": {"l": 64.708, "t": 458.1015300000001, "r": 74.220215, "b": 466.47617, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "Connected sub-pictures are grouped together in one", "bbox": {"l": 76.461555, "t": 458.1015300000001, "r": 267.46786, "b": 466.47617, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "Picture", "bbox": {"l": 269.70599, "t": 458.14639, "r": 294.04599, "b": 466.48514, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "object.", "bbox": {"l": 78.207001, "t": 469.06055, "r": 102.29972, "b": 477.43518, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "(4) Connected sub-pictures are grouped together in one Picture object."}, {"label": "list_item", "id": 11, "page_no": 4, "cluster": {"id": 11, "label": "list_item", "bbox": {"l": 64.708, "t": 480.01953, "r": 264.50571, "b": 488.40314, "coord_origin": "TOPLEFT"}, "confidence": 0.9147457480430603, "cells": [{"id": 57, "text": "(5)", "bbox": {"l": 64.708, "t": 480.01953, "r": 74.345383, "b": 488.39417, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Formula numbers are included in a", "bbox": {"l": 76.616203, "t": 480.01953, "r": 206.13503, "b": 488.39417, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Formula", "bbox": {"l": 208.38, "t": 480.06439, "r": 238.12155, "b": 488.40314, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "object.", "bbox": {"l": 240.41300999999999, "t": 480.01953, "r": 264.50571, "b": 488.39417, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "(5) Formula numbers are included in a Formula object."}, {"label": "list_item", "id": 8, "page_no": 4, "cluster": {"id": 8, "label": "list_item", "bbox": {"l": 64.708008, "t": 490.97852, "r": 294.04617, "b": 521.27118, "coord_origin": "TOPLEFT"}, "confidence": 0.9544308185577393, "cells": [{"id": 61, "text": "(6)", "bbox": {"l": 64.708008, "t": 490.97852, "r": 74.564522, "b": 499.35315, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "Emphasised text (e.g. in italic or bold) at the beginning of", "bbox": {"l": 76.886978, "t": 490.97852, "r": 294.04617, "b": 499.35315, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "a paragraph is not considered a", "bbox": {"l": 78.207001, "t": 501.93753, "r": 200.34819, "b": 510.31216, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "Section-header", "bbox": {"l": 203.66701, "t": 501.98239, "r": 256.57504, "b": 510.32114, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": ", unless it", "bbox": {"l": 256.57401, "t": 501.93753, "r": 294.04401, "b": 510.31216, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "appears exclusively on its own line.", "bbox": {"l": 78.207001, "t": 512.8965499999999, "r": 208.13017, "b": 521.27118, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "(6) Emphasised text (e.g. in italic or bold) at the beginning of a paragraph is not considered a Section-header , unless it appears exclusively on its own line."}, {"label": "text", "id": 3, "page_no": 4, "cluster": {"id": 3, "label": "text", "bbox": {"l": 53.528999, "t": 532.9505300000001, "r": 295.56253, "b": 574.20117, "coord_origin": "TOPLEFT"}, "confidence": 0.9811431169509888, "cells": [{"id": 67, "text": "The complete annotation guideline is over 100 pages long and a", "bbox": {"l": 53.528999, "t": 532.9505300000001, "r": 294.04337, "b": 541.32516, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "detailed description is obviously out of scope for this paper. Never-", "bbox": {"l": 53.79800000000001, "t": 543.90855, "r": 295.56253, "b": 552.28317, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "theless, it will be made publicly available alongside with DocLayNet", "bbox": {"l": 53.79800000000001, "t": 554.8675499999999, "r": 294.04538, "b": 563.24217, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "for future reference.", "bbox": {"l": 53.79800000000001, "t": 565.82655, "r": 127.2418, "b": 574.20117, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The complete annotation guideline is over 100 pages long and a detailed description is obviously out of scope for this paper. Nevertheless, it will be made publicly available alongside with DocLayNet for future reference."}, {"label": "text", "id": 0, "page_no": 4, "cluster": {"id": 0, "label": "text", "bbox": {"l": 53.79800000000001, "t": 576.66899, "r": 295.56226, "b": 705.708176, "coord_origin": "TOPLEFT"}, "confidence": 0.9864389896392822, "cells": [{"id": 71, "text": "Phase 3: Training.", "bbox": {"l": 63.76100199999999, "t": 576.66899, "r": 136.7744, "b": 585.14224, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "After a first trial with a small group of peo-", "bbox": {"l": 139.008, "t": 576.7855500000001, "r": 295.56226, "b": 585.16017, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "ple, we realised that providing the annotation guideline and a set of", "bbox": {"l": 53.79800000000001, "t": 587.74455, "r": 294.04532, "b": 596.1191699999999, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "random practice pages did not yield the desired quality level for lay-", "bbox": {"l": 53.79800000000001, "t": 598.70355, "r": 295.55676, "b": 607.07817, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "out annotation. Therefore we prepared a subset of pages with two", "bbox": {"l": 53.79800000000001, "t": 609.66255, "r": 294.04605, "b": 618.0371700000001, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "different complexity levels, each with a practice and an exam part.", "bbox": {"l": 53.79800000000001, "t": 620.6215500000001, "r": 295.42377, "b": 628.99617, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "974 pages were reference-annotated by one proficient core team", "bbox": {"l": 53.79800000000001, "t": 631.58055, "r": 294.04712, "b": 639.95517, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "member. Annotation staff were then given the task to annotate the", "bbox": {"l": 53.79800000000001, "t": 642.53955, "r": 294.04922, "b": 650.91417, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "same subsets (blinded from the reference). By comparing the an-", "bbox": {"l": 53.79800000000001, "t": 653.49855, "r": 295.55618, "b": 661.87317, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "notations of each staff member with the reference annotations, we", "bbox": {"l": 53.79800000000001, "t": 664.45655, "r": 294.04874, "b": 672.83117, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "could quantify how closely their annotations matched the reference.", "bbox": {"l": 53.79800000000001, "t": 675.4155499999999, "r": 295.42496, "b": 683.79017, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "Only after passing two exam levels with high annotation quality,", "bbox": {"l": 53.79800000000001, "t": 686.37456, "r": 295.0274, "b": 694.749176, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "staff were admitted into the production phase. Practice iterations", "bbox": {"l": 53.79800000000001, "t": 697.333557, "r": 294.04114, "b": 705.708176, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Phase 3: Training. After a first trial with a small group of people, we realised that providing the annotation guideline and a set of random practice pages did not yield the desired quality level for layout annotation. Therefore we prepared a subset of pages with two different complexity levels, each with a practice and an exam part. 974 pages were reference-annotated by one proficient core team member. Annotation staff were then given the task to annotate the same subsets (blinded from the reference). By comparing the annotations of each staff member with the reference annotations, we could quantify how closely their annotations matched the reference. Only after passing two exam levels with high annotation quality, staff were admitted into the production phase. Practice iterations"}, {"label": "picture", "id": 16, "page_no": 4, "cluster": {"id": 16, "label": "picture", "bbox": {"l": 315.960205078125, "t": 85.33881378173828, "r": 559.396484375, "b": 459.68084716796875, "coord_origin": "TOPLEFT"}, "confidence": 0.7264115214347839, "cells": [{"id": 84, "text": "1ef23f5e6d7f10d393f9947e8208285dce9ae87250ac483ac4b4a59d51b4e037", "bbox": {"l": 340.00214, "t": 179.79296999999997, "r": 416.20551, "b": 181.90972999999997, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "Compliant with guidelines", "bbox": {"l": 339.38269, "t": 85.19066999999995, "r": 417.83722, "b": 92.28399999999999, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Plausible but invalid alternative", "bbox": {"l": 451.42834, "t": 85.19066999999995, "r": 546.22913, "b": 92.28399999999999, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Borderline case: Two guideline-compliant alternatives", "bbox": {"l": 350.33701, "t": 364.85706, "r": 513.48035, "b": 371.95035000000007, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "03c31a2ee1ed1b583c28957f475ee545d144e1b5a264dc4dd068c8d2f6a64860", "bbox": {"l": 340.00201, "t": 245.07385, "r": 416.20538, "b": 247.19061, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "1a5cd524f1844c1260c8e8c073e1f442423c264583212b0d0b6626fc780e6ed4", "bbox": {"l": 340.00201, "t": 359.12488, "r": 416.20538, "b": 361.24167, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "A", "bbox": {"l": 322.19424, "t": 98.34105999999997, "r": 326.01498, "b": 104.25214000000005, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "B", "bbox": {"l": 322.19424, "t": 186.99103000000002, "r": 326.01498, "b": 192.90204000000006, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "C", "bbox": {"l": 322.19424, "t": 253.54192999999998, "r": 326.01498, "b": 259.453, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "D", "bbox": {"l": 322.19424, "t": 367.08495999999997, "r": 326.01498, "b": 372.996, "coord_origin": "TOPLEFT"}}], "children": [{"id": 16, "label": "text", "bbox": {"l": 340.00214, "t": 179.79296999999997, "r": 416.20551, "b": 181.90972999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "1ef23f5e6d7f10d393f9947e8208285dce9ae87250ac483ac4b4a59d51b4e037", "bbox": {"l": 340.00214, "t": 179.79296999999997, "r": 416.20551, "b": 181.90972999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 339.38269, "t": 85.19066999999995, "r": 417.83722, "b": 92.28399999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "Compliant with guidelines", "bbox": {"l": 339.38269, "t": 85.19066999999995, "r": 417.83722, "b": 92.28399999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 451.42834, "t": 85.19066999999995, "r": 546.22913, "b": 92.28399999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "Plausible but invalid alternative", "bbox": {"l": 451.42834, "t": 85.19066999999995, "r": 546.22913, "b": 92.28399999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 350.33701, "t": 364.85706, "r": 513.48035, "b": 371.95035000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "Borderline case: Two guideline-compliant alternatives", "bbox": {"l": 350.33701, "t": 364.85706, "r": 513.48035, "b": 371.95035000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 340.00201, "t": 245.07385, "r": 416.20538, "b": 247.19061, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "03c31a2ee1ed1b583c28957f475ee545d144e1b5a264dc4dd068c8d2f6a64860", "bbox": {"l": 340.00201, "t": 245.07385, "r": 416.20538, "b": 247.19061, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 340.00201, "t": 359.12488, "r": 416.20538, "b": 361.24167, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "1a5cd524f1844c1260c8e8c073e1f442423c264583212b0d0b6626fc780e6ed4", "bbox": {"l": 340.00201, "t": 359.12488, "r": 416.20538, "b": 361.24167, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 322.19424, "t": 98.34105999999997, "r": 326.01498, "b": 104.25214000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "A", "bbox": {"l": 322.19424, "t": 98.34105999999997, "r": 326.01498, "b": 104.25214000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 322.19424, "t": 186.99103000000002, "r": 326.01498, "b": 192.90204000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "B", "bbox": {"l": 322.19424, "t": 186.99103000000002, "r": 326.01498, "b": 192.90204000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 322.19424, "t": 253.54192999999998, "r": 326.01498, "b": 259.453, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "C", "bbox": {"l": 322.19424, "t": 253.54192999999998, "r": 326.01498, "b": 259.453, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 322.19424, "t": 367.08495999999997, "r": 326.01498, "b": 372.996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "D", "bbox": {"l": 322.19424, "t": 367.08495999999997, "r": 326.01498, "b": 372.996, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "text", "id": 22, "page_no": 4, "cluster": {"id": 22, "label": "text", "bbox": {"l": 400.12842, "t": 458.44327000000004, "r": 476.33178999999996, "b": 460.5600600000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "05237a14f2524e3f53c8454b074409d05078038a6a36b770fcc8ec7e540deae0", "bbox": {"l": 400.12842, "t": 458.44327000000004, "r": 476.33178999999996, "b": 460.5600600000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "05237a14f2524e3f53c8454b074409d05078038a6a36b770fcc8ec7e540deae0"}, {"label": "caption", "id": 14, "page_no": 4, "cluster": {"id": 14, "label": "caption", "bbox": {"l": 317.95499, "t": 473.49399, "r": 559.80579, "b": 503.88519, "coord_origin": "TOPLEFT"}, "confidence": 0.8873711824417114, "cells": [{"id": 95, "text": "Figure 4: Examples of plausible annotation alternatives for", "bbox": {"l": 317.95499, "t": 473.49399, "r": 558.3891, "b": 481.96722, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "the same page. Criteria in our annotation guideline can re-", "bbox": {"l": 317.95499, "t": 484.45297, "r": 559.80579, "b": 492.92621, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "solve cases A to C, while the case D remains ambiguous.", "bbox": {"l": 317.95499, "t": 495.41196, "r": 544.14148, "b": 503.88519, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 4: Examples of plausible annotation alternatives for the same page. Criteria in our annotation guideline can resolve cases A to C, while the case D remains ambiguous."}, {"label": "text", "id": 6, "page_no": 4, "cluster": {"id": 6, "label": "text", "bbox": {"l": 317.62299, "t": 525.49753, "r": 558.20435, "b": 544.83118, "coord_origin": "TOPLEFT"}, "confidence": 0.9611718654632568, "cells": [{"id": 98, "text": "were carried out over a timeframe of 12 weeks, after which 8 of the", "bbox": {"l": 317.62299, "t": 525.49753, "r": 558.20435, "b": 533.87216, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "40", "bbox": {"l": 317.74899, "t": 536.45656, "r": 326.07019, "b": 544.83118, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "initially allocated annotators did not pass the bar.", "bbox": {"l": 328.3071, "t": 536.45656, "r": 509.11896, "b": 544.83118, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "were carried out over a timeframe of 12 weeks, after which 8 of the 40 initially allocated annotators did not pass the bar."}, {"label": "text", "id": 2, "page_no": 4, "cluster": {"id": 2, "label": "text", "bbox": {"l": 317.62299, "t": 547.299, "r": 559.7149, "b": 709.2151719999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9829543232917786, "cells": [{"id": 101, "text": "Phase 4: Production annotation.", "bbox": {"l": 327.918, "t": 547.299, "r": 456.80109000000004, "b": 555.77225, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "The previously selected 80K", "bbox": {"l": 458.7120100000001, "t": 547.41556, "r": 558.48926, "b": 555.79018, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "pages were annotated with the defined 11 class labels by 32 annota-", "bbox": {"l": 317.95499, "t": 558.37456, "r": 559.71368, "b": 566.74918, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "tors. This production phase took around three months to complete.", "bbox": {"l": 317.95499, "t": 569.33356, "r": 559.58124, "b": 577.7081800000001, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "All annotations were created online through CCS, which visualises", "bbox": {"l": 317.64099, "t": 580.29256, "r": 558.20386, "b": 588.66718, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "the programmatic PDF text-cells as an overlay on the page. The page", "bbox": {"l": 317.95499, "t": 591.25156, "r": 558.20221, "b": 599.62617, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "annotation are obtained by drawing rectangular bounding-boxes,", "bbox": {"l": 317.95499, "t": 602.20955, "r": 559.18457, "b": 610.58417, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "as shown in Figure 3. With regard to the annotation practices, we", "bbox": {"l": 317.95499, "t": 613.16855, "r": 558.20197, "b": 621.54317, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "implemented a few constraints and capabilities on the tooling level.", "bbox": {"l": 317.95499, "t": 624.12755, "r": 559.58197, "b": 632.50217, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "First, we only allow non-overlapping, vertically oriented, rectangu-", "bbox": {"l": 317.95499, "t": 635.08655, "r": 559.71411, "b": 643.46117, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "lar boxes. For the large majority of documents, this constraint was", "bbox": {"l": 317.95499, "t": 646.04555, "r": 558.20557, "b": 654.42017, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "sufficient and it speeds up the annotation considerably in compar-", "bbox": {"l": 317.95499, "t": 657.00455, "r": 559.7149, "b": 665.3791699999999, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "ison with arbitrary segmentation shapes. Second, annotator staff", "bbox": {"l": 317.95499, "t": 667.9635499999999, "r": 558.19849, "b": 676.33817, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "were not able to see each other\u2019s annotations. This was enforced by", "bbox": {"l": 317.62299, "t": 678.92255, "r": 558.43268, "b": 687.29717, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "design to avoid any bias in the annotation, which could skew the", "bbox": {"l": 317.95499, "t": 689.8815500000001, "r": 558.19806, "b": 698.256172, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "numbers of the inter-annotator agreement (see Table 1). We wanted", "bbox": {"l": 317.95499, "t": 700.840553, "r": 558.20227, "b": 709.2151719999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Phase 4: Production annotation. The previously selected 80K pages were annotated with the defined 11 class labels by 32 annotators. This production phase took around three months to complete. All annotations were created online through CCS, which visualises the programmatic PDF text-cells as an overlay on the page. The page annotation are obtained by drawing rectangular bounding-boxes, as shown in Figure 3. With regard to the annotation practices, we implemented a few constraints and capabilities on the tooling level. First, we only allow non-overlapping, vertically oriented, rectangular boxes. For the large majority of documents, this constraint was sufficient and it speeds up the annotation considerably in comparison with arbitrary segmentation shapes. Second, annotator staff were not able to see each other's annotations. This was enforced by design to avoid any bias in the annotation, which could skew the numbers of the inter-annotator agreement (see Table 1). We wanted"}], "body": [{"label": "text", "id": 12, "page_no": 4, "cluster": {"id": 12, "label": "text", "bbox": {"l": 53.79800000000001, "t": 87.36352999999997, "r": 294.04541, "b": 106.70612000000006, "coord_origin": "TOPLEFT"}, "confidence": 0.9022762179374695, "cells": [{"id": 2, "text": "the textual content of an element, which goes beyond visual layout", "bbox": {"l": 53.79800000000001, "t": 87.36352999999997, "r": 294.04541, "b": 95.73816, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "recognition, in particular outside the", "bbox": {"l": 53.79800000000001, "t": 98.32250999999997, "r": 188.1326, "b": 106.69713999999999, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Scientific Articles", "bbox": {"l": 190.37401, "t": 98.36737000000005, "r": 251.25586999999996, "b": 106.70612000000006, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "category.", "bbox": {"l": 253.70801, "t": 98.32250999999997, "r": 287.01816, "b": 106.69713999999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "the textual content of an element, which goes beyond visual layout recognition, in particular outside the Scientific Articles category."}, {"label": "text", "id": 4, "page_no": 4, "cluster": {"id": 4, "label": "text", "bbox": {"l": 53.79800000000001, "t": 109.28156000000001, "r": 295.55923, "b": 249.16216999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9711344838142395, "cells": [{"id": 6, "text": "At first sight, the task of visual document-layout interpretation", "bbox": {"l": 63.76100199999999, "t": 109.28156000000001, "r": 294.04257, "b": 117.65618999999992, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "appears intuitive enough to obtain plausible annotations in most", "bbox": {"l": 53.79800000000001, "t": 120.24054000000001, "r": 294.04266, "b": 128.61517000000003, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "cases. However, during early trial-runs in the core team, we ob-", "bbox": {"l": 53.79800000000001, "t": 131.19854999999995, "r": 295.55615, "b": 139.57317999999998, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "served many cases in which annotators use different annotation", "bbox": {"l": 53.79800000000001, "t": 142.15752999999995, "r": 294.04715, "b": 150.53216999999995, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "styles, especially for documents with challenging layouts. For ex-", "bbox": {"l": 53.79800000000001, "t": 153.11652000000004, "r": 295.55923, "b": 161.49114999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "ample, if a figure is presented with subfigures, one annotator might", "bbox": {"l": 53.79800000000001, "t": 164.07556, "r": 294.04535, "b": 172.4502, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "draw a single figure bounding-box, while another might annotate", "bbox": {"l": 53.79800000000001, "t": 175.03454999999997, "r": 294.04803, "b": 183.40918, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "each subfigure separately. The same applies for lists, where one", "bbox": {"l": 53.79800000000001, "t": 185.99352999999996, "r": 294.04709, "b": 194.36816, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "might annotate all list items in one block or each list item sep-", "bbox": {"l": 53.79800000000001, "t": 196.95250999999996, "r": 295.55612, "b": 205.32714999999996, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "arately. In essence, we observed that challenging layouts would", "bbox": {"l": 53.79800000000001, "t": 207.91156, "r": 294.04712, "b": 216.28619000000003, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "be annotated in different but plausible ways. To illustrate this, we", "bbox": {"l": 53.79800000000001, "t": 218.87054, "r": 294.04495, "b": 227.24518, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "show in Figure 4 multiple examples of plausible but inconsistent", "bbox": {"l": 53.79800000000001, "t": 229.82952999999998, "r": 294.04712, "b": 238.20416, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "annotations on the same pages.", "bbox": {"l": 53.79800000000001, "t": 240.78754000000004, "r": 168.61276, "b": 249.16216999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "At first sight, the task of visual document-layout interpretation appears intuitive enough to obtain plausible annotations in most cases. However, during early trial-runs in the core team, we observed many cases in which annotators use different annotation styles, especially for documents with challenging layouts. For example, if a figure is presented with subfigures, one annotator might draw a single figure bounding-box, while another might annotate each subfigure separately. The same applies for lists, where one might annotate all list items in one block or each list item separately. In essence, we observed that challenging layouts would be annotated in different but plausible ways. To illustrate this, we show in Figure 4 multiple examples of plausible but inconsistent annotations on the same pages."}, {"label": "text", "id": 1, "page_no": 4, "cluster": {"id": 1, "label": "text", "bbox": {"l": 53.79800000000001, "t": 251.74652000000003, "r": 295.56006, "b": 336.83417, "coord_origin": "TOPLEFT"}, "confidence": 0.985905110836029, "cells": [{"id": 19, "text": "Obviously, this inconsistency in annotations is not desirable for", "bbox": {"l": 63.76100199999999, "t": 251.74652000000003, "r": 294.21884, "b": 260.12114999999994, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "datasets which are intended to be used for model training. To min-", "bbox": {"l": 53.79800000000001, "t": 262.70556999999997, "r": 295.56006, "b": 271.0802, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "imise these inconsistencies, we created a detailed annotation guide-", "bbox": {"l": 53.79800000000001, "t": 273.66454999999996, "r": 295.55676, "b": 282.03918, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "line. While perfect consistency across 40 annotation staff members", "bbox": {"l": 53.79800000000001, "t": 284.62354, "r": 294.04922, "b": 292.99817, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "is clearly not possible to achieve, we saw a huge improvement in", "bbox": {"l": 53.79800000000001, "t": 295.5825500000001, "r": 294.04343, "b": 303.95717999999994, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "annotation consistency after the introduction of our annotation", "bbox": {"l": 53.79800000000001, "t": 306.54153, "r": 294.04712, "b": 314.91617, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "guideline. A few selected, non-trivial highlights of the guideline", "bbox": {"l": 53.79800000000001, "t": 317.50055, "r": 294.04718, "b": 325.87518, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "are:", "bbox": {"l": 53.79800000000001, "t": 328.4595299999999, "r": 67.28347, "b": 336.83417, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Obviously, this inconsistency in annotations is not desirable for datasets which are intended to be used for model training. To minimise these inconsistencies, we created a detailed annotation guideline. While perfect consistency across 40 annotation staff members is clearly not possible to achieve, we saw a huge improvement in annotation consistency after the introduction of our annotation guideline. A few selected, non-trivial highlights of the guideline are:"}, {"label": "list_item", "id": 5, "page_no": 4, "cluster": {"id": 5, "label": "list_item", "bbox": {"l": 64.708, "t": 348.51254, "r": 294.0462, "b": 389.77313, "coord_origin": "TOPLEFT"}, "confidence": 0.9691526293754578, "cells": [{"id": 27, "text": "(1)", "bbox": {"l": 64.708, "t": 348.51254, "r": 74.626793, "b": 356.88718, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Every list-item is an individual object instance with class", "bbox": {"l": 76.963936, "t": 348.51254, "r": 294.0462, "b": 356.88718, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "label", "bbox": {"l": 78.207001, "t": 359.47153, "r": 95.730484, "b": 367.84616, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "List-item", "bbox": {"l": 97.976997, "t": 359.51639, "r": 130.17131, "b": 367.85513, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": ". This definition is different from PubLayNet", "bbox": {"l": 130.17101, "t": 359.47153, "r": 294.04053, "b": 367.84616, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "and DocBank, where all list-items are grouped together into", "bbox": {"l": 78.207001, "t": 370.43054, "r": 294.04385, "b": 378.80518, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "one", "bbox": {"l": 78.207001, "t": 381.38953000000004, "r": 91.593834, "b": 389.76416, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "List", "bbox": {"l": 93.834999, "t": 381.43439000000006, "r": 106.88111, "b": 389.77313, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "object.", "bbox": {"l": 109.629, "t": 381.38953000000004, "r": 133.72173, "b": 389.76416, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "(1) Every list-item is an individual object instance with class label List-item . This definition is different from PubLayNet and DocBank, where all list-items are grouped together into one List object."}, {"label": "list_item", "id": 7, "page_no": 4, "cluster": {"id": 7, "label": "list_item", "bbox": {"l": 64.707993, "t": 392.34851, "r": 295.56372, "b": 433.60016, "coord_origin": "TOPLEFT"}, "confidence": 0.9591284990310669, "cells": [{"id": 36, "text": "(2)", "bbox": {"l": 64.707993, "t": 392.34851, "r": 75.097656, "b": 400.72313999999994, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "A", "bbox": {"l": 77.545731, "t": 392.34851, "r": 84.351402, "b": 400.72313999999994, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "List-item", "bbox": {"l": 86.584, "t": 392.39339999999993, "r": 118.01329000000001, "b": 400.73215, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "is a paragraph with hanging indentation. Single-", "bbox": {"l": 120.26899999999999, "t": 392.34854, "r": 295.55695, "b": 400.72317999999996, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "line elements can qualify as", "bbox": {"l": 78.207001, "t": 403.30753, "r": 181.80978, "b": 411.68216, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "List-item", "bbox": {"l": 184.175, "t": 403.35239, "r": 216.68806000000004, "b": 411.69113, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "if the neighbour ele-", "bbox": {"l": 219.078, "t": 403.30753, "r": 295.56372, "b": 411.68216, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "ments expose hanging indentation. Bullet or enumeration", "bbox": {"l": 78.207001, "t": 414.2665400000001, "r": 294.04617, "b": 422.64116999999993, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "symbols are not a requirement.", "bbox": {"l": 78.207001, "t": 425.22552, "r": 192.00853, "b": 433.60016, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "(2) A List-item is a paragraph with hanging indentation. Singleline elements can qualify as List-item if the neighbour elements expose hanging indentation. Bullet or enumeration symbols are not a requirement."}, {"label": "list_item", "id": 10, "page_no": 4, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 64.708, "t": 436.18451000000005, "r": 294.04724, "b": 455.52713, "coord_origin": "TOPLEFT"}, "confidence": 0.9413429498672485, "cells": [{"id": 45, "text": "(3)", "bbox": {"l": 64.708, "t": 436.18451000000005, "r": 74.483009, "b": 444.55914, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "For every", "bbox": {"l": 76.786255, "t": 436.18451000000005, "r": 112.61566, "b": 444.55914, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "Caption", "bbox": {"l": 114.861, "t": 436.2294, "r": 142.61249, "b": 444.56815000000006, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": ", there must be exactly one corresponding", "bbox": {"l": 142.612, "t": 436.18454, "r": 294.04724, "b": 444.55917, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "Picture", "bbox": {"l": 78.207001, "t": 447.18839, "r": 102.79287, "b": 455.52713, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "or", "bbox": {"l": 105.245, "t": 447.14352, "r": 113.09956999999999, "b": 455.51815999999997, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Table", "bbox": {"l": 115.341, "t": 447.18839, "r": 134.40356, "b": 455.52713, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": ".", "bbox": {"l": 134.403, "t": 447.14352, "r": 136.37561, "b": 455.51815999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "(3) For every Caption , there must be exactly one corresponding Picture or Table ."}, {"label": "list_item", "id": 9, "page_no": 4, "cluster": {"id": 9, "label": "list_item", "bbox": {"l": 64.708, "t": 458.1015300000001, "r": 294.04599, "b": 477.43518, "coord_origin": "TOPLEFT"}, "confidence": 0.9426738023757935, "cells": [{"id": 53, "text": "(4)", "bbox": {"l": 64.708, "t": 458.1015300000001, "r": 74.220215, "b": 466.47617, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "Connected sub-pictures are grouped together in one", "bbox": {"l": 76.461555, "t": 458.1015300000001, "r": 267.46786, "b": 466.47617, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "Picture", "bbox": {"l": 269.70599, "t": 458.14639, "r": 294.04599, "b": 466.48514, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "object.", "bbox": {"l": 78.207001, "t": 469.06055, "r": 102.29972, "b": 477.43518, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "(4) Connected sub-pictures are grouped together in one Picture object."}, {"label": "list_item", "id": 11, "page_no": 4, "cluster": {"id": 11, "label": "list_item", "bbox": {"l": 64.708, "t": 480.01953, "r": 264.50571, "b": 488.40314, "coord_origin": "TOPLEFT"}, "confidence": 0.9147457480430603, "cells": [{"id": 57, "text": "(5)", "bbox": {"l": 64.708, "t": 480.01953, "r": 74.345383, "b": 488.39417, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Formula numbers are included in a", "bbox": {"l": 76.616203, "t": 480.01953, "r": 206.13503, "b": 488.39417, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Formula", "bbox": {"l": 208.38, "t": 480.06439, "r": 238.12155, "b": 488.40314, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "object.", "bbox": {"l": 240.41300999999999, "t": 480.01953, "r": 264.50571, "b": 488.39417, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "(5) Formula numbers are included in a Formula object."}, {"label": "list_item", "id": 8, "page_no": 4, "cluster": {"id": 8, "label": "list_item", "bbox": {"l": 64.708008, "t": 490.97852, "r": 294.04617, "b": 521.27118, "coord_origin": "TOPLEFT"}, "confidence": 0.9544308185577393, "cells": [{"id": 61, "text": "(6)", "bbox": {"l": 64.708008, "t": 490.97852, "r": 74.564522, "b": 499.35315, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "Emphasised text (e.g. in italic or bold) at the beginning of", "bbox": {"l": 76.886978, "t": 490.97852, "r": 294.04617, "b": 499.35315, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "a paragraph is not considered a", "bbox": {"l": 78.207001, "t": 501.93753, "r": 200.34819, "b": 510.31216, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "Section-header", "bbox": {"l": 203.66701, "t": 501.98239, "r": 256.57504, "b": 510.32114, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": ", unless it", "bbox": {"l": 256.57401, "t": 501.93753, "r": 294.04401, "b": 510.31216, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "appears exclusively on its own line.", "bbox": {"l": 78.207001, "t": 512.8965499999999, "r": 208.13017, "b": 521.27118, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "(6) Emphasised text (e.g. in italic or bold) at the beginning of a paragraph is not considered a Section-header , unless it appears exclusively on its own line."}, {"label": "text", "id": 3, "page_no": 4, "cluster": {"id": 3, "label": "text", "bbox": {"l": 53.528999, "t": 532.9505300000001, "r": 295.56253, "b": 574.20117, "coord_origin": "TOPLEFT"}, "confidence": 0.9811431169509888, "cells": [{"id": 67, "text": "The complete annotation guideline is over 100 pages long and a", "bbox": {"l": 53.528999, "t": 532.9505300000001, "r": 294.04337, "b": 541.32516, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "detailed description is obviously out of scope for this paper. Never-", "bbox": {"l": 53.79800000000001, "t": 543.90855, "r": 295.56253, "b": 552.28317, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "theless, it will be made publicly available alongside with DocLayNet", "bbox": {"l": 53.79800000000001, "t": 554.8675499999999, "r": 294.04538, "b": 563.24217, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "for future reference.", "bbox": {"l": 53.79800000000001, "t": 565.82655, "r": 127.2418, "b": 574.20117, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The complete annotation guideline is over 100 pages long and a detailed description is obviously out of scope for this paper. Nevertheless, it will be made publicly available alongside with DocLayNet for future reference."}, {"label": "text", "id": 0, "page_no": 4, "cluster": {"id": 0, "label": "text", "bbox": {"l": 53.79800000000001, "t": 576.66899, "r": 295.56226, "b": 705.708176, "coord_origin": "TOPLEFT"}, "confidence": 0.9864389896392822, "cells": [{"id": 71, "text": "Phase 3: Training.", "bbox": {"l": 63.76100199999999, "t": 576.66899, "r": 136.7744, "b": 585.14224, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "After a first trial with a small group of peo-", "bbox": {"l": 139.008, "t": 576.7855500000001, "r": 295.56226, "b": 585.16017, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "ple, we realised that providing the annotation guideline and a set of", "bbox": {"l": 53.79800000000001, "t": 587.74455, "r": 294.04532, "b": 596.1191699999999, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "random practice pages did not yield the desired quality level for lay-", "bbox": {"l": 53.79800000000001, "t": 598.70355, "r": 295.55676, "b": 607.07817, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "out annotation. Therefore we prepared a subset of pages with two", "bbox": {"l": 53.79800000000001, "t": 609.66255, "r": 294.04605, "b": 618.0371700000001, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "different complexity levels, each with a practice and an exam part.", "bbox": {"l": 53.79800000000001, "t": 620.6215500000001, "r": 295.42377, "b": 628.99617, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "974 pages were reference-annotated by one proficient core team", "bbox": {"l": 53.79800000000001, "t": 631.58055, "r": 294.04712, "b": 639.95517, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "member. Annotation staff were then given the task to annotate the", "bbox": {"l": 53.79800000000001, "t": 642.53955, "r": 294.04922, "b": 650.91417, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "same subsets (blinded from the reference). By comparing the an-", "bbox": {"l": 53.79800000000001, "t": 653.49855, "r": 295.55618, "b": 661.87317, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "notations of each staff member with the reference annotations, we", "bbox": {"l": 53.79800000000001, "t": 664.45655, "r": 294.04874, "b": 672.83117, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "could quantify how closely their annotations matched the reference.", "bbox": {"l": 53.79800000000001, "t": 675.4155499999999, "r": 295.42496, "b": 683.79017, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "Only after passing two exam levels with high annotation quality,", "bbox": {"l": 53.79800000000001, "t": 686.37456, "r": 295.0274, "b": 694.749176, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "staff were admitted into the production phase. Practice iterations", "bbox": {"l": 53.79800000000001, "t": 697.333557, "r": 294.04114, "b": 705.708176, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Phase 3: Training. After a first trial with a small group of people, we realised that providing the annotation guideline and a set of random practice pages did not yield the desired quality level for layout annotation. Therefore we prepared a subset of pages with two different complexity levels, each with a practice and an exam part. 974 pages were reference-annotated by one proficient core team member. Annotation staff were then given the task to annotate the same subsets (blinded from the reference). By comparing the annotations of each staff member with the reference annotations, we could quantify how closely their annotations matched the reference. Only after passing two exam levels with high annotation quality, staff were admitted into the production phase. Practice iterations"}, {"label": "picture", "id": 16, "page_no": 4, "cluster": {"id": 16, "label": "picture", "bbox": {"l": 315.960205078125, "t": 85.33881378173828, "r": 559.396484375, "b": 459.68084716796875, "coord_origin": "TOPLEFT"}, "confidence": 0.7264115214347839, "cells": [{"id": 84, "text": "1ef23f5e6d7f10d393f9947e8208285dce9ae87250ac483ac4b4a59d51b4e037", "bbox": {"l": 340.00214, "t": 179.79296999999997, "r": 416.20551, "b": 181.90972999999997, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "Compliant with guidelines", "bbox": {"l": 339.38269, "t": 85.19066999999995, "r": 417.83722, "b": 92.28399999999999, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Plausible but invalid alternative", "bbox": {"l": 451.42834, "t": 85.19066999999995, "r": 546.22913, "b": 92.28399999999999, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Borderline case: Two guideline-compliant alternatives", "bbox": {"l": 350.33701, "t": 364.85706, "r": 513.48035, "b": 371.95035000000007, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "03c31a2ee1ed1b583c28957f475ee545d144e1b5a264dc4dd068c8d2f6a64860", "bbox": {"l": 340.00201, "t": 245.07385, "r": 416.20538, "b": 247.19061, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "1a5cd524f1844c1260c8e8c073e1f442423c264583212b0d0b6626fc780e6ed4", "bbox": {"l": 340.00201, "t": 359.12488, "r": 416.20538, "b": 361.24167, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "A", "bbox": {"l": 322.19424, "t": 98.34105999999997, "r": 326.01498, "b": 104.25214000000005, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "B", "bbox": {"l": 322.19424, "t": 186.99103000000002, "r": 326.01498, "b": 192.90204000000006, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "C", "bbox": {"l": 322.19424, "t": 253.54192999999998, "r": 326.01498, "b": 259.453, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "D", "bbox": {"l": 322.19424, "t": 367.08495999999997, "r": 326.01498, "b": 372.996, "coord_origin": "TOPLEFT"}}], "children": [{"id": 16, "label": "text", "bbox": {"l": 340.00214, "t": 179.79296999999997, "r": 416.20551, "b": 181.90972999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "1ef23f5e6d7f10d393f9947e8208285dce9ae87250ac483ac4b4a59d51b4e037", "bbox": {"l": 340.00214, "t": 179.79296999999997, "r": 416.20551, "b": 181.90972999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 339.38269, "t": 85.19066999999995, "r": 417.83722, "b": 92.28399999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "Compliant with guidelines", "bbox": {"l": 339.38269, "t": 85.19066999999995, "r": 417.83722, "b": 92.28399999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 451.42834, "t": 85.19066999999995, "r": 546.22913, "b": 92.28399999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "Plausible but invalid alternative", "bbox": {"l": 451.42834, "t": 85.19066999999995, "r": 546.22913, "b": 92.28399999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 350.33701, "t": 364.85706, "r": 513.48035, "b": 371.95035000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "Borderline case: Two guideline-compliant alternatives", "bbox": {"l": 350.33701, "t": 364.85706, "r": 513.48035, "b": 371.95035000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 340.00201, "t": 245.07385, "r": 416.20538, "b": 247.19061, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "03c31a2ee1ed1b583c28957f475ee545d144e1b5a264dc4dd068c8d2f6a64860", "bbox": {"l": 340.00201, "t": 245.07385, "r": 416.20538, "b": 247.19061, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 340.00201, "t": 359.12488, "r": 416.20538, "b": 361.24167, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "1a5cd524f1844c1260c8e8c073e1f442423c264583212b0d0b6626fc780e6ed4", "bbox": {"l": 340.00201, "t": 359.12488, "r": 416.20538, "b": 361.24167, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 322.19424, "t": 98.34105999999997, "r": 326.01498, "b": 104.25214000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "A", "bbox": {"l": 322.19424, "t": 98.34105999999997, "r": 326.01498, "b": 104.25214000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 322.19424, "t": 186.99103000000002, "r": 326.01498, "b": 192.90204000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "B", "bbox": {"l": 322.19424, "t": 186.99103000000002, "r": 326.01498, "b": 192.90204000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 322.19424, "t": 253.54192999999998, "r": 326.01498, "b": 259.453, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "C", "bbox": {"l": 322.19424, "t": 253.54192999999998, "r": 326.01498, "b": 259.453, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 322.19424, "t": 367.08495999999997, "r": 326.01498, "b": 372.996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "D", "bbox": {"l": 322.19424, "t": 367.08495999999997, "r": 326.01498, "b": 372.996, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "text", "id": 22, "page_no": 4, "cluster": {"id": 22, "label": "text", "bbox": {"l": 400.12842, "t": 458.44327000000004, "r": 476.33178999999996, "b": 460.5600600000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "05237a14f2524e3f53c8454b074409d05078038a6a36b770fcc8ec7e540deae0", "bbox": {"l": 400.12842, "t": 458.44327000000004, "r": 476.33178999999996, "b": 460.5600600000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "05237a14f2524e3f53c8454b074409d05078038a6a36b770fcc8ec7e540deae0"}, {"label": "caption", "id": 14, "page_no": 4, "cluster": {"id": 14, "label": "caption", "bbox": {"l": 317.95499, "t": 473.49399, "r": 559.80579, "b": 503.88519, "coord_origin": "TOPLEFT"}, "confidence": 0.8873711824417114, "cells": [{"id": 95, "text": "Figure 4: Examples of plausible annotation alternatives for", "bbox": {"l": 317.95499, "t": 473.49399, "r": 558.3891, "b": 481.96722, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "the same page. Criteria in our annotation guideline can re-", "bbox": {"l": 317.95499, "t": 484.45297, "r": 559.80579, "b": 492.92621, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "solve cases A to C, while the case D remains ambiguous.", "bbox": {"l": 317.95499, "t": 495.41196, "r": 544.14148, "b": 503.88519, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 4: Examples of plausible annotation alternatives for the same page. Criteria in our annotation guideline can resolve cases A to C, while the case D remains ambiguous."}, {"label": "text", "id": 6, "page_no": 4, "cluster": {"id": 6, "label": "text", "bbox": {"l": 317.62299, "t": 525.49753, "r": 558.20435, "b": 544.83118, "coord_origin": "TOPLEFT"}, "confidence": 0.9611718654632568, "cells": [{"id": 98, "text": "were carried out over a timeframe of 12 weeks, after which 8 of the", "bbox": {"l": 317.62299, "t": 525.49753, "r": 558.20435, "b": 533.87216, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "40", "bbox": {"l": 317.74899, "t": 536.45656, "r": 326.07019, "b": 544.83118, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "initially allocated annotators did not pass the bar.", "bbox": {"l": 328.3071, "t": 536.45656, "r": 509.11896, "b": 544.83118, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "were carried out over a timeframe of 12 weeks, after which 8 of the 40 initially allocated annotators did not pass the bar."}, {"label": "text", "id": 2, "page_no": 4, "cluster": {"id": 2, "label": "text", "bbox": {"l": 317.62299, "t": 547.299, "r": 559.7149, "b": 709.2151719999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9829543232917786, "cells": [{"id": 101, "text": "Phase 4: Production annotation.", "bbox": {"l": 327.918, "t": 547.299, "r": 456.80109000000004, "b": 555.77225, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "The previously selected 80K", "bbox": {"l": 458.7120100000001, "t": 547.41556, "r": 558.48926, "b": 555.79018, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "pages were annotated with the defined 11 class labels by 32 annota-", "bbox": {"l": 317.95499, "t": 558.37456, "r": 559.71368, "b": 566.74918, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "tors. This production phase took around three months to complete.", "bbox": {"l": 317.95499, "t": 569.33356, "r": 559.58124, "b": 577.7081800000001, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "All annotations were created online through CCS, which visualises", "bbox": {"l": 317.64099, "t": 580.29256, "r": 558.20386, "b": 588.66718, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "the programmatic PDF text-cells as an overlay on the page. The page", "bbox": {"l": 317.95499, "t": 591.25156, "r": 558.20221, "b": 599.62617, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "annotation are obtained by drawing rectangular bounding-boxes,", "bbox": {"l": 317.95499, "t": 602.20955, "r": 559.18457, "b": 610.58417, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "as shown in Figure 3. With regard to the annotation practices, we", "bbox": {"l": 317.95499, "t": 613.16855, "r": 558.20197, "b": 621.54317, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "implemented a few constraints and capabilities on the tooling level.", "bbox": {"l": 317.95499, "t": 624.12755, "r": 559.58197, "b": 632.50217, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "First, we only allow non-overlapping, vertically oriented, rectangu-", "bbox": {"l": 317.95499, "t": 635.08655, "r": 559.71411, "b": 643.46117, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "lar boxes. For the large majority of documents, this constraint was", "bbox": {"l": 317.95499, "t": 646.04555, "r": 558.20557, "b": 654.42017, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "sufficient and it speeds up the annotation considerably in compar-", "bbox": {"l": 317.95499, "t": 657.00455, "r": 559.7149, "b": 665.3791699999999, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "ison with arbitrary segmentation shapes. Second, annotator staff", "bbox": {"l": 317.95499, "t": 667.9635499999999, "r": 558.19849, "b": 676.33817, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "were not able to see each other\u2019s annotations. This was enforced by", "bbox": {"l": 317.62299, "t": 678.92255, "r": 558.43268, "b": 687.29717, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "design to avoid any bias in the annotation, which could skew the", "bbox": {"l": 317.95499, "t": 689.8815500000001, "r": 558.19806, "b": 698.256172, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "numbers of the inter-annotator agreement (see Table 1). We wanted", "bbox": {"l": 317.95499, "t": 700.840553, "r": 558.20227, "b": 709.2151719999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Phase 4: Production annotation. The previously selected 80K pages were annotated with the defined 11 class labels by 32 annotators. This production phase took around three months to complete. All annotations were created online through CCS, which visualises the programmatic PDF text-cells as an overlay on the page. The page annotation are obtained by drawing rectangular bounding-boxes, as shown in Figure 3. With regard to the annotation practices, we implemented a few constraints and capabilities on the tooling level. First, we only allow non-overlapping, vertically oriented, rectangular boxes. For the large majority of documents, this constraint was sufficient and it speeds up the annotation considerably in comparison with arbitrary segmentation shapes. Second, annotator staff were not able to see each other's annotations. This was enforced by design to avoid any bias in the annotation, which could skew the numbers of the inter-annotator agreement (see Table 1). We wanted"}], "headers": [{"label": "page_header", "id": 13, "page_no": 4, "cluster": {"id": 13, "label": "page_header", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.8877827525138855, "cells": [{"id": 0, "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis"}, {"label": "page_header", "id": 15, "page_no": 4, "cluster": {"id": 15, "label": "page_header", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.8534670472145081, "cells": [{"id": 1, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA"}]}}, {"page_no": 5, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 246.24382, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar", "bbox": {"l": 253.13897999999998, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Table 2: Prediction performance (mAP@0.5-0.95) of object", "bbox": {"l": 53.501999, "t": 86.87292000000002, "r": 294.04361, "b": 95.34618999999998, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "detection networks on DocLayNet test set. The MRCNN", "bbox": {"l": 53.79800000000001, "t": 97.83191, "r": 294.04373, "b": 106.30517999999995, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "(Mask R-CNN) and FRCNN (Faster R-CNN) models with", "bbox": {"l": 53.52, "t": 108.79088999999999, "r": 294.0437, "b": 117.26415999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "ResNet-50 or ResNet-101 backbone were trained based on", "bbox": {"l": 53.79800000000001, "t": 119.74987999999996, "r": 294.04373, "b": 128.22313999999994, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "the network architectures from the", "bbox": {"l": 53.79800000000001, "t": 130.70885999999996, "r": 202.43402, "b": 139.18213000000003, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "detectron2", "bbox": {"l": 206.08501, "t": 130.71783000000005, "r": 247.14215000000002, "b": 139.20905000000005, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "model zoo", "bbox": {"l": 250.95001, "t": 130.70885999999996, "r": 294.04254, "b": 139.18213000000003, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "(Mask R-CNN R50, R101-FPN 3x, Faster R-CNN R101-FPN", "bbox": {"l": 53.52002, "t": 141.66785000000004, "r": 294.04367, "b": 150.14111000000003, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "3x), with default configurations. The YOLO implementation", "bbox": {"l": 53.798019, "t": 152.62683000000004, "r": 294.04373, "b": 161.1001, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "utilized was YOLOv5x6 [13]. All models were initialised us-", "bbox": {"l": 53.798019, "t": 163.58582, "r": 295.64874, "b": 172.05908, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "ing pre-trained weights from the COCO 2017 dataset.", "bbox": {"l": 53.798019, "t": 174.54381999999998, "r": 268.62399, "b": 183.01709000000005, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "human", "bbox": {"l": 132.36501, "t": 197.97351000000003, "r": 157.99098, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "MRCNN", "bbox": {"l": 173.505, "t": 197.97351000000003, "r": 204.61841, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "FRCNN", "bbox": {"l": 220.13028, "t": 197.97351000000003, "r": 248.06958, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "YOLO", "bbox": {"l": 258.03125, "t": 197.97351000000003, "r": 280.17825, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "R50", "bbox": {"l": 168.39301, "t": 208.93255999999997, "r": 181.99504, "b": 217.30719, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "R101", "bbox": {"l": 192.39606, "t": 208.93255999999997, "r": 210.16747, "b": 217.30719, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "R101", "bbox": {"l": 225.21309, "t": 208.93255999999997, "r": 242.9845, "b": 217.30719, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "v5x6", "bbox": {"l": 260.51379, "t": 208.93255999999997, "r": 277.70239, "b": 217.30719, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Caption", "bbox": {"l": 67.663002, "t": 220.28954999999996, "r": 96.848633, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "84-89", "bbox": {"l": 135.32401, "t": 220.28954999999996, "r": 155.03215, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "68.4", "bbox": {"l": 167.95399, "t": 220.28954999999996, "r": 182.43472, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "71.5", "bbox": {"l": 194.0462, "t": 220.28954999999996, "r": 208.52695, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "70.1", "bbox": {"l": 226.86324000000002, "t": 220.28954999999996, "r": 241.34396, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "77.7", "bbox": {"l": 261.86804, "t": 220.28954999999996, "r": 276.34879, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Footnote", "bbox": {"l": 67.663002, "t": 231.24854000000005, "r": 100.1662, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "83-91", "bbox": {"l": 135.32401, "t": 231.24854000000005, "r": 155.03215, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "70.9", "bbox": {"l": 167.95399, "t": 231.24854000000005, "r": 182.43472, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "71.8", "bbox": {"l": 194.0462, "t": 231.24854000000005, "r": 208.52695, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "73.7", "bbox": {"l": 226.86324000000002, "t": 231.24854000000005, "r": 241.34396, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "77.2", "bbox": {"l": 261.86804, "t": 231.24854000000005, "r": 276.34879, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "Formula", "bbox": {"l": 67.663002, "t": 242.20752000000005, "r": 98.175659, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "83-85", "bbox": {"l": 135.32401, "t": 242.20752000000005, "r": 155.03215, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "60.1", "bbox": {"l": 167.95399, "t": 242.20752000000005, "r": 182.43472, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "63.4", "bbox": {"l": 194.0462, "t": 242.20752000000005, "r": 208.52695, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "63.5", "bbox": {"l": 226.86324000000002, "t": 242.20752000000005, "r": 241.34396, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "66.2", "bbox": {"l": 261.86804, "t": 242.20752000000005, "r": 276.34879, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "List-item", "bbox": {"l": 67.663002, "t": 253.16656, "r": 100.54279, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "87-88", "bbox": {"l": 135.32401, "t": 253.16656, "r": 155.03215, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "81.2", "bbox": {"l": 167.95399, "t": 253.16656, "r": 182.43472, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "80.8", "bbox": {"l": 194.0462, "t": 253.16656, "r": 208.52695, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "81.0", "bbox": {"l": 226.86324000000002, "t": 253.16656, "r": 241.34396, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "86.2", "bbox": {"l": 261.86804, "t": 253.16656, "r": 276.34879, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Page-footer", "bbox": {"l": 67.663002, "t": 264.12555, "r": 110.19064, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "93-94", "bbox": {"l": 135.32401, "t": 264.12555, "r": 155.03215, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "61.6", "bbox": {"l": 167.95399, "t": 264.12555, "r": 182.43472, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "59.3", "bbox": {"l": 194.0462, "t": 264.12555, "r": 208.52695, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "58.9", "bbox": {"l": 226.86324000000002, "t": 264.12555, "r": 241.34396, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "61.1", "bbox": {"l": 261.86804, "t": 264.12555, "r": 276.34879, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Page-header", "bbox": {"l": 67.663002, "t": 275.08453, "r": 112.94331999999999, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "85-89", "bbox": {"l": 135.32401, "t": 275.08453, "r": 155.03215, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "71.9", "bbox": {"l": 167.95399, "t": 275.08453, "r": 182.43472, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "70.0", "bbox": {"l": 194.0462, "t": 275.08453, "r": 208.52695, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "72.0", "bbox": {"l": 226.86324000000002, "t": 275.08453, "r": 241.34396, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "67.9", "bbox": {"l": 261.86804, "t": 275.08453, "r": 276.34879, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Picture", "bbox": {"l": 67.663002, "t": 286.04355000000004, "r": 93.647629, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "69-71", "bbox": {"l": 135.32401, "t": 286.04355000000004, "r": 155.03215, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "71.7", "bbox": {"l": 167.95399, "t": 286.04355000000004, "r": 182.43472, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "72.7", "bbox": {"l": 194.0462, "t": 286.04355000000004, "r": 208.52695, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "72.0", "bbox": {"l": 226.86324000000002, "t": 286.04355000000004, "r": 241.34396, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "77.1", "bbox": {"l": 261.86804, "t": 286.04355000000004, "r": 276.34879, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "Section-header", "bbox": {"l": 67.663002, "t": 297.00253, "r": 122.40287999999998, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "83-84", "bbox": {"l": 135.32401, "t": 297.00253, "r": 155.03215, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "67.6", "bbox": {"l": 167.95399, "t": 297.00253, "r": 182.43472, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "69.3", "bbox": {"l": 194.0462, "t": 297.00253, "r": 208.52695, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "68.4", "bbox": {"l": 226.86324000000002, "t": 297.00253, "r": 241.34396, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "74.6", "bbox": {"l": 261.86804, "t": 297.00253, "r": 276.34879, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "Table", "bbox": {"l": 67.663002, "t": 307.96155, "r": 87.46978, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "77-81", "bbox": {"l": 135.32401, "t": 307.96155, "r": 155.03215, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "82.2", "bbox": {"l": 167.95399, "t": 307.96155, "r": 182.43472, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "82.9", "bbox": {"l": 194.0462, "t": 307.96155, "r": 208.52695, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "82.2", "bbox": {"l": 226.86324000000002, "t": 307.96155, "r": 241.34396, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "86.3", "bbox": {"l": 261.86804, "t": 307.96155, "r": 276.34879, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "Text", "bbox": {"l": 67.663002, "t": 318.91953, "r": 83.623199, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "84-86", "bbox": {"l": 135.32401, "t": 318.91953, "r": 155.03215, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "84.6", "bbox": {"l": 167.95399, "t": 318.91953, "r": 182.43472, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "85.8", "bbox": {"l": 194.0462, "t": 318.91953, "r": 208.52695, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "85.4", "bbox": {"l": 226.86324000000002, "t": 318.91953, "r": 241.34396, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "88.1", "bbox": {"l": 261.86804, "t": 318.91953, "r": 276.34879, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Title", "bbox": {"l": 67.663002, "t": 329.87854, "r": 84.654327, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "60-72", "bbox": {"l": 135.32401, "t": 329.87854, "r": 155.03215, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "76.7", "bbox": {"l": 167.95399, "t": 329.87854, "r": 182.43472, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "80.4", "bbox": {"l": 194.0462, "t": 329.87854, "r": 208.52695, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "79.9", "bbox": {"l": 226.86324000000002, "t": 329.87854, "r": 241.34396, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "82.7", "bbox": {"l": 261.86804, "t": 329.87854, "r": 276.34879, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "All", "bbox": {"l": 67.663002, "t": 341.23654, "r": 78.628906, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "82-83", "bbox": {"l": 135.32401, "t": 341.23654, "r": 155.03215, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "72.4", "bbox": {"l": 167.95399, "t": 341.23654, "r": 182.43472, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "73.5", "bbox": {"l": 194.0462, "t": 341.23654, "r": 208.52695, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "73.4", "bbox": {"l": 226.86324000000002, "t": 341.23654, "r": 241.34396, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "76.8", "bbox": {"l": 261.86804, "t": 341.23654, "r": 276.34879, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "to avoid this at any cost in order to have clear, unbiased baseline", "bbox": {"l": 53.79800000000001, "t": 370.92755, "r": 294.04712, "b": 379.30219000000005, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "numbers for human document-layout annotation. Third, we in-", "bbox": {"l": 53.79800000000001, "t": 381.88654, "r": 295.55612, "b": 390.26117, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "troduced the feature of", "bbox": {"l": 53.79800000000001, "t": 392.84555, "r": 140.3623, "b": 401.22017999999997, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "snapping", "bbox": {"l": 142.99001, "t": 392.89041, "r": 175.9695, "b": 401.2291599999999, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "boxes around text segments to", "bbox": {"l": 178.951, "t": 392.84555, "r": 294.04083, "b": 401.22017999999997, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "obtain a pixel-accurate annotation and again reduce time and effort.", "bbox": {"l": 53.79800000000001, "t": 403.80453, "r": 295.42493, "b": 412.17917, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "The CCS annotation tool automatically shrinks every user-drawn", "bbox": {"l": 53.528999, "t": 414.76355, "r": 294.04251, "b": 423.13818, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "box to the minimum bounding-box around the enclosed text-cells", "bbox": {"l": 53.79800000000001, "t": 425.72253, "r": 294.04807, "b": 434.09717, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "for all purely text-based segments, which excludes only", "bbox": {"l": 53.79800000000001, "t": 436.6815500000001, "r": 256.80627, "b": 445.0561799999999, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "Table", "bbox": {"l": 259.04199, "t": 436.72641, "r": 278.10455, "b": 445.06516, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "and", "bbox": {"l": 280.54999, "t": 436.6815500000001, "r": 294.04443, "b": 445.0561799999999, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "Picture", "bbox": {"l": 53.79800000000001, "t": 447.68539, "r": 78.875587, "b": 456.02413999999993, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": ". For the latter, we instructed annotation staff to minimise", "bbox": {"l": 78.876999, "t": 447.64053, "r": 294.04852, "b": 456.01517, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "inclusion of surrounding whitespace while including all graphical", "bbox": {"l": 53.79800000000001, "t": 458.59955, "r": 294.04645, "b": 466.97418, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "lines. A downside of snapping boxes to enclosed text cells is that", "bbox": {"l": 53.79800000000001, "t": 469.55853, "r": 294.0416, "b": 477.93317, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "some wrongly parsed PDF pages cannot be annotated correctly and", "bbox": {"l": 53.79800000000001, "t": 480.51654, "r": 294.04538, "b": 488.89117, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "need to be skipped. Fourth, we established a way to flag pages as", "bbox": {"l": 53.79800000000001, "t": 491.47552, "r": 294.04312, "b": 499.85016, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "rejected", "bbox": {"l": 53.79800000000001, "t": 502.4794, "r": 80.597939, "b": 510.81815, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "for cases where no valid annotation according to the label", "bbox": {"l": 83.366997, "t": 502.43454, "r": 294.04483, "b": 510.80917, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "guidelines could be achieved. Example cases for this would be PDF", "bbox": {"l": 53.79800000000001, "t": 513.3935200000001, "r": 294.25833, "b": 521.7681600000001, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "pages that render incorrectly or contain layouts that are impossible", "bbox": {"l": 53.79800000000001, "t": 524.35254, "r": 294.04535, "b": 532.72717, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "to capture with non-overlapping rectangles. Such rejected pages are", "bbox": {"l": 53.79800000000001, "t": 535.31155, "r": 294.04535, "b": 543.68617, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "not contained in the final dataset. With all these measures in place,", "bbox": {"l": 53.79800000000001, "t": 546.27055, "r": 295.02759, "b": 554.64517, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "experienced annotation staff managed to annotate a single page in", "bbox": {"l": 53.79800000000001, "t": 557.22955, "r": 294.0488, "b": 565.6041700000001, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "a typical timeframe of 20s to 60s, depending on its complexity.", "bbox": {"l": 53.79800000000001, "t": 568.18855, "r": 281.80457, "b": 576.56317, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "5", "bbox": {"l": 53.79800000000001, "t": 588.12991, "r": 59.405277, "b": 598.43901, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "EXPERIMENTS", "bbox": {"l": 70.314377, "t": 588.12991, "r": 147.48535, "b": 598.43901, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "The primary goal of DocLayNet is to obtain high-quality ML models", "bbox": {"l": 53.528999, "t": 613.25356, "r": 294.04871, "b": 621.6281700000001, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "capable of accurate document-layout analysis on a wide variety", "bbox": {"l": 53.79800000000001, "t": 624.21255, "r": 294.27576, "b": 632.58717, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "of challenging layouts. As discussed in Section 2, object detection", "bbox": {"l": 53.79800000000001, "t": 635.17155, "r": 294.04144, "b": 643.54617, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "models are currently the easiest to use, due to the standardisation", "bbox": {"l": 53.79800000000001, "t": 646.13055, "r": 294.04163, "b": 654.50517, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "of ground-truth data in COCO format [16] and the availability of", "bbox": {"l": 53.79800000000001, "t": 657.0885499999999, "r": 294.0412, "b": 665.46317, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "general frameworks such as", "bbox": {"l": 53.79800000000001, "t": 668.04755, "r": 155.01054, "b": 676.42217, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "detectron2", "bbox": {"l": 157.23599, "t": 668.09238, "r": 193.26666, "b": 676.43114, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "[17]. Furthermore, baseline", "bbox": {"l": 195.867, "t": 668.04755, "r": 294.0473, "b": 676.42217, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "numbers in PubLayNet and DocBank were obtained using standard", "bbox": {"l": 53.79800000000001, "t": 679.0065500000001, "r": 294.04538, "b": 687.38117, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "object detection models such as Mask R-CNN and Faster R-CNN.", "bbox": {"l": 53.79800000000001, "t": 689.96555, "r": 295.4281, "b": 698.3401719999999, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "As such, we will relate to these object detection methods in this", "bbox": {"l": 53.484001, "t": 700.9245530000001, "r": 294.04413, "b": 709.299171, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "0", "bbox": {"l": 349.16577, "t": 246.68017999999995, "r": 352.48175, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "20", "bbox": {"l": 385.93698, "t": 246.68017999999995, "r": 392.56894, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "40", "bbox": {"l": 424.366, "t": 246.68017999999995, "r": 430.99796, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "60", "bbox": {"l": 462.79504000000003, "t": 246.68017999999995, "r": 469.427, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "80", "bbox": {"l": 501.22406, "t": 246.68017999999995, "r": 507.85602, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "100", "bbox": {"l": 537.99524, "t": 246.68017999999995, "r": 547.94318, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "% of DocLayNet training set", "bbox": {"l": 410.28143, "t": 253.80840999999998, "r": 483.47278000000006, "b": 259.88251, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "50", "bbox": {"l": 330.93539, "t": 218.38464, "r": 337.56735, "b": 224.45874000000003, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "55", "bbox": {"l": 330.93539, "t": 192.08660999999995, "r": 337.56735, "b": 198.16071, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "60", "bbox": {"l": 330.93539, "t": 165.78864, "r": 337.56735, "b": 171.86273000000006, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "65", "bbox": {"l": 330.93539, "t": 139.49059999999997, "r": 337.56735, "b": 145.56470000000002, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "70", "bbox": {"l": 330.93539, "t": 113.19263000000001, "r": 337.56735, "b": 119.26671999999996, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "mAP 0.50:0.95", "bbox": {"l": 322.92276, "t": 148.37689, "r": 328.99686, "b": 186.79218000000003, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "10", "bbox": {"l": 470.97235, "t": 235.36676, "r": 477.6055, "b": 241.44086000000004, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "1", "bbox": {"l": 477.65662, "t": 234.82390999999996, "r": 479.97778000000005, "b": 239.07581000000005, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "10", "bbox": {"l": 531.55127, "t": 235.41234999999995, "r": 538.18445, "b": 241.48645, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "2", "bbox": {"l": 538.23553, "t": 234.86951, "r": 540.5567, "b": 239.1214, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "50", "bbox": {"l": 404.91125, "t": 216.00005999999996, "r": 411.54321, "b": 222.07416, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "55", "bbox": {"l": 404.91125, "t": 200.22125000000005, "r": 411.54321, "b": 206.29534999999998, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "60", "bbox": {"l": 404.91125, "t": 184.44244000000003, "r": 411.54321, "b": 190.51653999999996, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "65", "bbox": {"l": 404.91125, "t": 168.66364, "r": 411.54321, "b": 174.73773000000006, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "70", "bbox": {"l": 404.91125, "t": 152.88489000000004, "r": 411.54321, "b": 158.95898, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "Figure 5: Prediction performance (mAP@0.5-0.95) of a Mask", "bbox": {"l": 317.95499, "t": 279.01599, "r": 558.47876, "b": 287.48923, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "R-CNN network with ResNet50 backbone trained on increas-", "bbox": {"l": 317.95499, "t": 289.97501, "r": 559.80579, "b": 298.44824, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "ing fractions of the DocLayNet dataset. The learning curve", "bbox": {"l": 317.95499, "t": 300.93399, "r": 558.20068, "b": 309.40723, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "flattens around the 80% mark, indicating that increasing the", "bbox": {"l": 317.95499, "t": 311.89297, "r": 558.20062, "b": 320.36620999999997, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "size of the DocLayNet dataset with similar data will not yield", "bbox": {"l": 317.95499, "t": 322.85196, "r": 558.20074, "b": 331.3252, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "significantly better predictions.", "bbox": {"l": 317.95499, "t": 333.81094, "r": 445.24207, "b": 342.28418000000005, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "paper and leave the detailed evaluation of more recent methods", "bbox": {"l": 317.95499, "t": 384.01154, "r": 558.20416, "b": 392.38617, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "mentioned in Section 2 for future work.", "bbox": {"l": 317.95499, "t": 394.97055, "r": 463.04938, "b": 403.34517999999997, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "In this section, we will present several aspects related to the", "bbox": {"l": 327.918, "t": 405.92953, "r": 558.19836, "b": 414.30417, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "performance of object detection models on DocLayNet. Similarly", "bbox": {"l": 317.95499, "t": 416.88855, "r": 558.4364, "b": 425.26318, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "as in PubLayNet, we will evaluate the quality of their predictions", "bbox": {"l": 317.95499, "t": 427.84653, "r": 558.20563, "b": 436.22116, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "using mean average precision (mAP) with 10 overlaps that range", "bbox": {"l": 317.95499, "t": 438.80554, "r": 558.20044, "b": 447.18018, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "from 0.5 to 0.95 in steps of 0.05 (mAP@0.5-0.95). These scores are", "bbox": {"l": 317.95499, "t": 449.76453000000004, "r": 558.19891, "b": 458.13916, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "computed by leveraging the evaluation code provided by the COCO", "bbox": {"l": 317.95499, "t": 460.72354, "r": 558.20239, "b": 469.09818, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "API [16].", "bbox": {"l": 317.64099, "t": 471.68253, "r": 350.32352, "b": 480.05716, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "Baselines for Object Detection", "bbox": {"l": 317.95499, "t": 496.8219, "r": 466.8532400000001, "b": 507.13098, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "In Table 2, we present baseline experiments (given in mAP) on Mask", "bbox": {"l": 317.95499, "t": 512.02454, "r": 558.43085, "b": 520.39917, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "R-CNN [12], Faster R-CNN [11], and YOLOv5 [13]. Both training", "bbox": {"l": 317.95499, "t": 522.9835499999999, "r": 558.20117, "b": 531.35818, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "and evaluation were performed on RGB images with dimensions of", "bbox": {"l": 317.95499, "t": 533.94254, "r": 558.20233, "b": 542.31717, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "1025", "bbox": {"l": 317.74899, "t": 544.90155, "r": 334.09296, "b": 553.27617, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "\u00d7", "bbox": {"l": 334.81201, "t": 544.84775, "r": 340.51465, "b": 552.5499, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "1025 pixels. For training, we only used one annotation in case", "bbox": {"l": 341.233, "t": 544.90155, "r": 558.20117, "b": 553.27617, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "of redundantly annotated pages. As one can observe, the variation", "bbox": {"l": 317.95499, "t": 555.85956, "r": 558.20392, "b": 564.23418, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "in mAP between the models is rather low, but overall between 6", "bbox": {"l": 317.95499, "t": 566.8185599999999, "r": 558.2041, "b": 575.19318, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "and 10% lower than the mAP computed from the pairwise human", "bbox": {"l": 317.95499, "t": 577.77756, "r": 558.2052, "b": 586.15218, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "annotations on triple-annotated pages. This gives a good indication", "bbox": {"l": 317.95499, "t": 588.73656, "r": 558.20233, "b": 597.11118, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "that the DocLayNet dataset poses a worthwhile challenge for the", "bbox": {"l": 317.95499, "t": 599.69556, "r": 558.1983, "b": 608.0701799999999, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "research community to close the gap between human recognition", "bbox": {"l": 317.95499, "t": 610.65456, "r": 558.20502, "b": 619.02917, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "and ML approaches. It is interesting to see that Mask R-CNN and", "bbox": {"l": 317.95499, "t": 621.61356, "r": 558.20337, "b": 629.98817, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "Faster R-CNN produce very comparable mAP scores, indicating", "bbox": {"l": 317.95499, "t": 632.5725600000001, "r": 558.2041, "b": 640.94717, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "that pixel-based image segmentation derived from bounding-boxes", "bbox": {"l": 317.95499, "t": 643.53156, "r": 558.20245, "b": 651.90617, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "does not help to obtain better predictions. On the other hand, the", "bbox": {"l": 317.95499, "t": 654.49055, "r": 558.19757, "b": 662.86517, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": "more recent Yolov5x model does very well and even out-performs", "bbox": {"l": 317.95499, "t": 665.44855, "r": 558.20404, "b": 673.82317, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "humans on selected labels such as", "bbox": {"l": 317.95499, "t": 676.40755, "r": 444.54102, "b": 684.78217, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "Text", "bbox": {"l": 446.78900000000004, "t": 676.45238, "r": 461.95261000000005, "b": 684.79114, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": ",", "bbox": {"l": 461.95599000000004, "t": 676.40755, "r": 463.96805000000006, "b": 684.78217, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "Table", "bbox": {"l": 466.2170100000001, "t": 676.45238, "r": 485.66998000000007, "b": 684.79114, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "and", "bbox": {"l": 488.1290000000001, "t": 676.40755, "r": 501.89330999999993, "b": 684.78217, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "Picture", "bbox": {"l": 504.142, "t": 676.45238, "r": 529.21954, "b": 684.79114, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": ". This is", "bbox": {"l": 529.22101, "t": 676.40755, "r": 558.20392, "b": 684.78217, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "not entirely surprising, as", "bbox": {"l": 317.95499, "t": 687.36655, "r": 410.81366, "b": 695.741173, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "Text", "bbox": {"l": 413.05301, "t": 687.41138, "r": 427.67865, "b": 695.750137, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": ",", "bbox": {"l": 427.67801, "t": 687.36655, "r": 429.62103, "b": 695.741173, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "Table", "bbox": {"l": 431.86099, "t": 687.41138, "r": 450.62881000000004, "b": 695.750137, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "and", "bbox": {"l": 453.082, "t": 687.36655, "r": 466.37402, "b": 695.741173, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "Picture", "bbox": {"l": 468.61499, "t": 687.41138, "r": 492.83208999999994, "b": 695.750137, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "are abundant and", "bbox": {"l": 495.28201, "t": 687.36655, "r": 558.2005, "b": 695.741173, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "the most visually distinctive in a document.", "bbox": {"l": 317.95499, "t": 698.325554, "r": 477.53903, "b": 706.700172, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 11, "label": "page_header", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.8662876486778259, "cells": [{"id": 0, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 246.24382, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar", "bbox": {"l": 253.13897999999998, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "text", "bbox": {"l": 53.501999, "t": 86.87292000000002, "r": 295.64874, "b": 183.01709000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9782760143280029, "cells": [{"id": 2, "text": "Table 2: Prediction performance (mAP@0.5-0.95) of object", "bbox": {"l": 53.501999, "t": 86.87292000000002, "r": 294.04361, "b": 95.34618999999998, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "detection networks on DocLayNet test set. The MRCNN", "bbox": {"l": 53.79800000000001, "t": 97.83191, "r": 294.04373, "b": 106.30517999999995, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "(Mask R-CNN) and FRCNN (Faster R-CNN) models with", "bbox": {"l": 53.52, "t": 108.79088999999999, "r": 294.0437, "b": 117.26415999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "ResNet-50 or ResNet-101 backbone were trained based on", "bbox": {"l": 53.79800000000001, "t": 119.74987999999996, "r": 294.04373, "b": 128.22313999999994, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "the network architectures from the", "bbox": {"l": 53.79800000000001, "t": 130.70885999999996, "r": 202.43402, "b": 139.18213000000003, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "detectron2", "bbox": {"l": 206.08501, "t": 130.71783000000005, "r": 247.14215000000002, "b": 139.20905000000005, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "model zoo", "bbox": {"l": 250.95001, "t": 130.70885999999996, "r": 294.04254, "b": 139.18213000000003, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "(Mask R-CNN R50, R101-FPN 3x, Faster R-CNN R101-FPN", "bbox": {"l": 53.52002, "t": 141.66785000000004, "r": 294.04367, "b": 150.14111000000003, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "3x), with default configurations. The YOLO implementation", "bbox": {"l": 53.798019, "t": 152.62683000000004, "r": 294.04373, "b": 161.1001, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "utilized was YOLOv5x6 [13]. All models were initialised us-", "bbox": {"l": 53.798019, "t": 163.58582, "r": 295.64874, "b": 172.05908, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "ing pre-trained weights from the COCO 2017 dataset.", "bbox": {"l": 53.798019, "t": 174.54381999999998, "r": 268.62399, "b": 183.01709000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "table", "bbox": {"l": 62.02753829956055, "t": 195.68006896972656, "r": 285.78955078125, "b": 351.6618957519531, "coord_origin": "TOPLEFT"}, "confidence": 0.9883638620376587, "cells": [{"id": 13, "text": "human", "bbox": {"l": 132.36501, "t": 197.97351000000003, "r": 157.99098, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "MRCNN", "bbox": {"l": 173.505, "t": 197.97351000000003, "r": 204.61841, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "FRCNN", "bbox": {"l": 220.13028, "t": 197.97351000000003, "r": 248.06958, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "YOLO", "bbox": {"l": 258.03125, "t": 197.97351000000003, "r": 280.17825, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "R50", "bbox": {"l": 168.39301, "t": 208.93255999999997, "r": 181.99504, "b": 217.30719, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "R101", "bbox": {"l": 192.39606, "t": 208.93255999999997, "r": 210.16747, "b": 217.30719, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "R101", "bbox": {"l": 225.21309, "t": 208.93255999999997, "r": 242.9845, "b": 217.30719, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "v5x6", "bbox": {"l": 260.51379, "t": 208.93255999999997, "r": 277.70239, "b": 217.30719, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Caption", "bbox": {"l": 67.663002, "t": 220.28954999999996, "r": 96.848633, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "84-89", "bbox": {"l": 135.32401, "t": 220.28954999999996, "r": 155.03215, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "68.4", "bbox": {"l": 167.95399, "t": 220.28954999999996, "r": 182.43472, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "71.5", "bbox": {"l": 194.0462, "t": 220.28954999999996, "r": 208.52695, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "70.1", "bbox": {"l": 226.86324000000002, "t": 220.28954999999996, "r": 241.34396, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "77.7", "bbox": {"l": 261.86804, "t": 220.28954999999996, "r": 276.34879, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Footnote", "bbox": {"l": 67.663002, "t": 231.24854000000005, "r": 100.1662, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "83-91", "bbox": {"l": 135.32401, "t": 231.24854000000005, "r": 155.03215, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "70.9", "bbox": {"l": 167.95399, "t": 231.24854000000005, "r": 182.43472, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "71.8", "bbox": {"l": 194.0462, "t": 231.24854000000005, "r": 208.52695, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "73.7", "bbox": {"l": 226.86324000000002, "t": 231.24854000000005, "r": 241.34396, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "77.2", "bbox": {"l": 261.86804, "t": 231.24854000000005, "r": 276.34879, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "Formula", "bbox": {"l": 67.663002, "t": 242.20752000000005, "r": 98.175659, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "83-85", "bbox": {"l": 135.32401, "t": 242.20752000000005, "r": 155.03215, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "60.1", "bbox": {"l": 167.95399, "t": 242.20752000000005, "r": 182.43472, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "63.4", "bbox": {"l": 194.0462, "t": 242.20752000000005, "r": 208.52695, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "63.5", "bbox": {"l": 226.86324000000002, "t": 242.20752000000005, "r": 241.34396, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "66.2", "bbox": {"l": 261.86804, "t": 242.20752000000005, "r": 276.34879, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "List-item", "bbox": {"l": 67.663002, "t": 253.16656, "r": 100.54279, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "87-88", "bbox": {"l": 135.32401, "t": 253.16656, "r": 155.03215, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "81.2", "bbox": {"l": 167.95399, "t": 253.16656, "r": 182.43472, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "80.8", "bbox": {"l": 194.0462, "t": 253.16656, "r": 208.52695, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "81.0", "bbox": {"l": 226.86324000000002, "t": 253.16656, "r": 241.34396, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "86.2", "bbox": {"l": 261.86804, "t": 253.16656, "r": 276.34879, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Page-footer", "bbox": {"l": 67.663002, "t": 264.12555, "r": 110.19064, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "93-94", "bbox": {"l": 135.32401, "t": 264.12555, "r": 155.03215, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "61.6", "bbox": {"l": 167.95399, "t": 264.12555, "r": 182.43472, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "59.3", "bbox": {"l": 194.0462, "t": 264.12555, "r": 208.52695, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "58.9", "bbox": {"l": 226.86324000000002, "t": 264.12555, "r": 241.34396, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "61.1", "bbox": {"l": 261.86804, "t": 264.12555, "r": 276.34879, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Page-header", "bbox": {"l": 67.663002, "t": 275.08453, "r": 112.94331999999999, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "85-89", "bbox": {"l": 135.32401, "t": 275.08453, "r": 155.03215, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "71.9", "bbox": {"l": 167.95399, "t": 275.08453, "r": 182.43472, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "70.0", "bbox": {"l": 194.0462, "t": 275.08453, "r": 208.52695, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "72.0", "bbox": {"l": 226.86324000000002, "t": 275.08453, "r": 241.34396, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "67.9", "bbox": {"l": 261.86804, "t": 275.08453, "r": 276.34879, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Picture", "bbox": {"l": 67.663002, "t": 286.04355000000004, "r": 93.647629, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "69-71", "bbox": {"l": 135.32401, "t": 286.04355000000004, "r": 155.03215, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "71.7", "bbox": {"l": 167.95399, "t": 286.04355000000004, "r": 182.43472, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "72.7", "bbox": {"l": 194.0462, "t": 286.04355000000004, "r": 208.52695, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "72.0", "bbox": {"l": 226.86324000000002, "t": 286.04355000000004, "r": 241.34396, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "77.1", "bbox": {"l": 261.86804, "t": 286.04355000000004, "r": 276.34879, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "Section-header", "bbox": {"l": 67.663002, "t": 297.00253, "r": 122.40287999999998, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "83-84", "bbox": {"l": 135.32401, "t": 297.00253, "r": 155.03215, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "67.6", "bbox": {"l": 167.95399, "t": 297.00253, "r": 182.43472, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "69.3", "bbox": {"l": 194.0462, "t": 297.00253, "r": 208.52695, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "68.4", "bbox": {"l": 226.86324000000002, "t": 297.00253, "r": 241.34396, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "74.6", "bbox": {"l": 261.86804, "t": 297.00253, "r": 276.34879, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "Table", "bbox": {"l": 67.663002, "t": 307.96155, "r": 87.46978, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "77-81", "bbox": {"l": 135.32401, "t": 307.96155, "r": 155.03215, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "82.2", "bbox": {"l": 167.95399, "t": 307.96155, "r": 182.43472, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "82.9", "bbox": {"l": 194.0462, "t": 307.96155, "r": 208.52695, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "82.2", "bbox": {"l": 226.86324000000002, "t": 307.96155, "r": 241.34396, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "86.3", "bbox": {"l": 261.86804, "t": 307.96155, "r": 276.34879, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "Text", "bbox": {"l": 67.663002, "t": 318.91953, "r": 83.623199, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "84-86", "bbox": {"l": 135.32401, "t": 318.91953, "r": 155.03215, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "84.6", "bbox": {"l": 167.95399, "t": 318.91953, "r": 182.43472, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "85.8", "bbox": {"l": 194.0462, "t": 318.91953, "r": 208.52695, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "85.4", "bbox": {"l": 226.86324000000002, "t": 318.91953, "r": 241.34396, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "88.1", "bbox": {"l": 261.86804, "t": 318.91953, "r": 276.34879, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Title", "bbox": {"l": 67.663002, "t": 329.87854, "r": 84.654327, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "60-72", "bbox": {"l": 135.32401, "t": 329.87854, "r": 155.03215, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "76.7", "bbox": {"l": 167.95399, "t": 329.87854, "r": 182.43472, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "80.4", "bbox": {"l": 194.0462, "t": 329.87854, "r": 208.52695, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "79.9", "bbox": {"l": 226.86324000000002, "t": 329.87854, "r": 241.34396, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "82.7", "bbox": {"l": 261.86804, "t": 329.87854, "r": 276.34879, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "All", "bbox": {"l": 67.663002, "t": 341.23654, "r": 78.628906, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "82-83", "bbox": {"l": 135.32401, "t": 341.23654, "r": 155.03215, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "72.4", "bbox": {"l": 167.95399, "t": 341.23654, "r": 182.43472, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "73.5", "bbox": {"l": 194.0462, "t": 341.23654, "r": 208.52695, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "73.4", "bbox": {"l": 226.86324000000002, "t": 341.23654, "r": 241.34396, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "76.8", "bbox": {"l": 261.86804, "t": 341.23654, "r": 276.34879, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": [{"id": 12, "label": "text", "bbox": {"l": 132.36501, "t": 197.97351000000003, "r": 157.99098, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "human", "bbox": {"l": 132.36501, "t": 197.97351000000003, "r": 157.99098, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 173.505, "t": 197.97351000000003, "r": 204.61841, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "MRCNN", "bbox": {"l": 173.505, "t": 197.97351000000003, "r": 204.61841, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 220.13028, "t": 197.97351000000003, "r": 248.06958, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "FRCNN", "bbox": {"l": 220.13028, "t": 197.97351000000003, "r": 248.06958, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 258.03125, "t": 197.97351000000003, "r": 280.17825, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "YOLO", "bbox": {"l": 258.03125, "t": 197.97351000000003, "r": 280.17825, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 168.39301, "t": 208.93255999999997, "r": 181.99504, "b": 217.30719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "R50", "bbox": {"l": 168.39301, "t": 208.93255999999997, "r": 181.99504, "b": 217.30719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 192.39606, "t": 208.93255999999997, "r": 210.16747, "b": 217.30719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "R101", "bbox": {"l": 192.39606, "t": 208.93255999999997, "r": 210.16747, "b": 217.30719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 225.21309, "t": 208.93255999999997, "r": 242.9845, "b": 217.30719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "R101", "bbox": {"l": 225.21309, "t": 208.93255999999997, "r": 242.9845, "b": 217.30719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 260.51379, "t": 208.93255999999997, "r": 277.70239, "b": 217.30719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "v5x6", "bbox": {"l": 260.51379, "t": 208.93255999999997, "r": 277.70239, "b": 217.30719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 67.663002, "t": 220.28954999999996, "r": 96.848633, "b": 228.66418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "Caption", "bbox": {"l": 67.663002, "t": 220.28954999999996, "r": 96.848633, "b": 228.66418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 135.32401, "t": 220.28954999999996, "r": 155.03215, "b": 228.66418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "84-89", "bbox": {"l": 135.32401, "t": 220.28954999999996, "r": 155.03215, "b": 228.66418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 167.95399, "t": 220.28954999999996, "r": 182.43472, "b": 228.66418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "68.4", "bbox": {"l": 167.95399, "t": 220.28954999999996, "r": 182.43472, "b": 228.66418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 194.0462, "t": 220.28954999999996, "r": 208.52695, "b": 228.66418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "71.5", "bbox": {"l": 194.0462, "t": 220.28954999999996, "r": 208.52695, "b": 228.66418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 226.86324000000002, "t": 220.28954999999996, "r": 241.34396, "b": 228.66418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "70.1", "bbox": {"l": 226.86324000000002, "t": 220.28954999999996, "r": 241.34396, "b": 228.66418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 261.86804, "t": 220.28954999999996, "r": 276.34879, "b": 228.66418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "77.7", "bbox": {"l": 261.86804, "t": 220.28954999999996, "r": 276.34879, "b": 228.66418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 67.663002, "t": 231.24854000000005, "r": 100.1662, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "Footnote", "bbox": {"l": 67.663002, "t": 231.24854000000005, "r": 100.1662, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 135.32401, "t": 231.24854000000005, "r": 155.03215, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "83-91", "bbox": {"l": 135.32401, "t": 231.24854000000005, "r": 155.03215, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 167.95399, "t": 231.24854000000005, "r": 182.43472, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "70.9", "bbox": {"l": 167.95399, "t": 231.24854000000005, "r": 182.43472, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 194.0462, "t": 231.24854000000005, "r": 208.52695, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "71.8", "bbox": {"l": 194.0462, "t": 231.24854000000005, "r": 208.52695, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 226.86324000000002, "t": 231.24854000000005, "r": 241.34396, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "73.7", "bbox": {"l": 226.86324000000002, "t": 231.24854000000005, "r": 241.34396, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 261.86804, "t": 231.24854000000005, "r": 276.34879, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "77.2", "bbox": {"l": 261.86804, "t": 231.24854000000005, "r": 276.34879, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 67.663002, "t": 242.20752000000005, "r": 98.175659, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "Formula", "bbox": {"l": 67.663002, "t": 242.20752000000005, "r": 98.175659, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 135.32401, "t": 242.20752000000005, "r": 155.03215, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "83-85", "bbox": {"l": 135.32401, "t": 242.20752000000005, "r": 155.03215, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 167.95399, "t": 242.20752000000005, "r": 182.43472, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "60.1", "bbox": {"l": 167.95399, "t": 242.20752000000005, "r": 182.43472, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 194.0462, "t": 242.20752000000005, "r": 208.52695, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "63.4", "bbox": {"l": 194.0462, "t": 242.20752000000005, "r": 208.52695, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 226.86324000000002, "t": 242.20752000000005, "r": 241.34396, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "63.5", "bbox": {"l": 226.86324000000002, "t": 242.20752000000005, "r": 241.34396, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 261.86804, "t": 242.20752000000005, "r": 276.34879, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "66.2", "bbox": {"l": 261.86804, "t": 242.20752000000005, "r": 276.34879, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 67.663002, "t": 253.16656, "r": 100.54279, "b": 261.5412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "List-item", "bbox": {"l": 67.663002, "t": 253.16656, "r": 100.54279, "b": 261.5412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 135.32401, "t": 253.16656, "r": 155.03215, "b": 261.5412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "87-88", "bbox": {"l": 135.32401, "t": 253.16656, "r": 155.03215, "b": 261.5412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 167.95399, "t": 253.16656, "r": 182.43472, "b": 261.5412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "81.2", "bbox": {"l": 167.95399, "t": 253.16656, "r": 182.43472, "b": 261.5412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 194.0462, "t": 253.16656, "r": 208.52695, "b": 261.5412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "80.8", "bbox": {"l": 194.0462, "t": 253.16656, "r": 208.52695, "b": 261.5412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 226.86324000000002, "t": 253.16656, "r": 241.34396, "b": 261.5412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "81.0", "bbox": {"l": 226.86324000000002, "t": 253.16656, "r": 241.34396, "b": 261.5412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 261.86804, "t": 253.16656, "r": 276.34879, "b": 261.5412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "86.2", "bbox": {"l": 261.86804, "t": 253.16656, "r": 276.34879, "b": 261.5412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 67.663002, "t": 264.12555, "r": 110.19064, "b": 272.50018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "Page-footer", "bbox": {"l": 67.663002, "t": 264.12555, "r": 110.19064, "b": 272.50018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 135.32401, "t": 264.12555, "r": 155.03215, "b": 272.50018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "93-94", "bbox": {"l": 135.32401, "t": 264.12555, "r": 155.03215, "b": 272.50018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 167.95399, "t": 264.12555, "r": 182.43472, "b": 272.50018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "61.6", "bbox": {"l": 167.95399, "t": 264.12555, "r": 182.43472, "b": 272.50018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 194.0462, "t": 264.12555, "r": 208.52695, "b": 272.50018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "59.3", "bbox": {"l": 194.0462, "t": 264.12555, "r": 208.52695, "b": 272.50018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 226.86324000000002, "t": 264.12555, "r": 241.34396, "b": 272.50018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "58.9", "bbox": {"l": 226.86324000000002, "t": 264.12555, "r": 241.34396, "b": 272.50018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 261.86804, "t": 264.12555, "r": 276.34879, "b": 272.50018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "61.1", "bbox": {"l": 261.86804, "t": 264.12555, "r": 276.34879, "b": 272.50018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 67.663002, "t": 275.08453, "r": 112.94331999999999, "b": 283.45917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "Page-header", "bbox": {"l": 67.663002, "t": 275.08453, "r": 112.94331999999999, "b": 283.45917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 135.32401, "t": 275.08453, "r": 155.03215, "b": 283.45917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "85-89", "bbox": {"l": 135.32401, "t": 275.08453, "r": 155.03215, "b": 283.45917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 167.95399, "t": 275.08453, "r": 182.43472, "b": 283.45917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "71.9", "bbox": {"l": 167.95399, "t": 275.08453, "r": 182.43472, "b": 283.45917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 194.0462, "t": 275.08453, "r": 208.52695, "b": 283.45917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "70.0", "bbox": {"l": 194.0462, "t": 275.08453, "r": 208.52695, "b": 283.45917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 226.86324000000002, "t": 275.08453, "r": 241.34396, "b": 283.45917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "72.0", "bbox": {"l": 226.86324000000002, "t": 275.08453, "r": 241.34396, "b": 283.45917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 261.86804, "t": 275.08453, "r": 276.34879, "b": 283.45917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "67.9", "bbox": {"l": 261.86804, "t": 275.08453, "r": 276.34879, "b": 283.45917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 67.663002, "t": 286.04355000000004, "r": 93.647629, "b": 294.41818, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "Picture", "bbox": {"l": 67.663002, "t": 286.04355000000004, "r": 93.647629, "b": 294.41818, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 135.32401, "t": 286.04355000000004, "r": 155.03215, "b": 294.41818, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "69-71", "bbox": {"l": 135.32401, "t": 286.04355000000004, "r": 155.03215, "b": 294.41818, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 167.95399, "t": 286.04355000000004, "r": 182.43472, "b": 294.41818, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "71.7", "bbox": {"l": 167.95399, "t": 286.04355000000004, "r": 182.43472, "b": 294.41818, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 194.0462, "t": 286.04355000000004, "r": 208.52695, "b": 294.41818, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "72.7", "bbox": {"l": 194.0462, "t": 286.04355000000004, "r": 208.52695, "b": 294.41818, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 226.86324000000002, "t": 286.04355000000004, "r": 241.34396, "b": 294.41818, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "72.0", "bbox": {"l": 226.86324000000002, "t": 286.04355000000004, "r": 241.34396, "b": 294.41818, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 261.86804, "t": 286.04355000000004, "r": 276.34879, "b": 294.41818, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "77.1", "bbox": {"l": 261.86804, "t": 286.04355000000004, "r": 276.34879, "b": 294.41818, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 67.663002, "t": 297.00253, "r": 122.40287999999998, "b": 305.37717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "Section-header", "bbox": {"l": 67.663002, "t": 297.00253, "r": 122.40287999999998, "b": 305.37717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 135.32401, "t": 297.00253, "r": 155.03215, "b": 305.37717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "83-84", "bbox": {"l": 135.32401, "t": 297.00253, "r": 155.03215, "b": 305.37717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 167.95399, "t": 297.00253, "r": 182.43472, "b": 305.37717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "67.6", "bbox": {"l": 167.95399, "t": 297.00253, "r": 182.43472, "b": 305.37717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 194.0462, "t": 297.00253, "r": 208.52695, "b": 305.37717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "69.3", "bbox": {"l": 194.0462, "t": 297.00253, "r": 208.52695, "b": 305.37717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 226.86324000000002, "t": 297.00253, "r": 241.34396, "b": 305.37717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "68.4", "bbox": {"l": 226.86324000000002, "t": 297.00253, "r": 241.34396, "b": 305.37717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 261.86804, "t": 297.00253, "r": 276.34879, "b": 305.37717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "74.6", "bbox": {"l": 261.86804, "t": 297.00253, "r": 276.34879, "b": 305.37717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 67.663002, "t": 307.96155, "r": 87.46978, "b": 316.33618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "Table", "bbox": {"l": 67.663002, "t": 307.96155, "r": 87.46978, "b": 316.33618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 135.32401, "t": 307.96155, "r": 155.03215, "b": 316.33618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "77-81", "bbox": {"l": 135.32401, "t": 307.96155, "r": 155.03215, "b": 316.33618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 167.95399, "t": 307.96155, "r": 182.43472, "b": 316.33618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "82.2", "bbox": {"l": 167.95399, "t": 307.96155, "r": 182.43472, "b": 316.33618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 194.0462, "t": 307.96155, "r": 208.52695, "b": 316.33618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "82.9", "bbox": {"l": 194.0462, "t": 307.96155, "r": 208.52695, "b": 316.33618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 226.86324000000002, "t": 307.96155, "r": 241.34396, "b": 316.33618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "82.2", "bbox": {"l": 226.86324000000002, "t": 307.96155, "r": 241.34396, "b": 316.33618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 261.86804, "t": 307.96155, "r": 276.34879, "b": 316.33618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "86.3", "bbox": {"l": 261.86804, "t": 307.96155, "r": 276.34879, "b": 316.33618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 67.663002, "t": 318.91953, "r": 83.623199, "b": 327.29416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "Text", "bbox": {"l": 67.663002, "t": 318.91953, "r": 83.623199, "b": 327.29416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 135.32401, "t": 318.91953, "r": 155.03215, "b": 327.29416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "84-86", "bbox": {"l": 135.32401, "t": 318.91953, "r": 155.03215, "b": 327.29416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 167.95399, "t": 318.91953, "r": 182.43472, "b": 327.29416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "84.6", "bbox": {"l": 167.95399, "t": 318.91953, "r": 182.43472, "b": 327.29416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 194.0462, "t": 318.91953, "r": 208.52695, "b": 327.29416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "85.8", "bbox": {"l": 194.0462, "t": 318.91953, "r": 208.52695, "b": 327.29416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 226.86324000000002, "t": 318.91953, "r": 241.34396, "b": 327.29416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "85.4", "bbox": {"l": 226.86324000000002, "t": 318.91953, "r": 241.34396, "b": 327.29416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 261.86804, "t": 318.91953, "r": 276.34879, "b": 327.29416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "88.1", "bbox": {"l": 261.86804, "t": 318.91953, "r": 276.34879, "b": 327.29416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 67.663002, "t": 329.87854, "r": 84.654327, "b": 338.25317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "Title", "bbox": {"l": 67.663002, "t": 329.87854, "r": 84.654327, "b": 338.25317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 135.32401, "t": 329.87854, "r": 155.03215, "b": 338.25317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "60-72", "bbox": {"l": 135.32401, "t": 329.87854, "r": 155.03215, "b": 338.25317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 167.95399, "t": 329.87854, "r": 182.43472, "b": 338.25317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "76.7", "bbox": {"l": 167.95399, "t": 329.87854, "r": 182.43472, "b": 338.25317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 194.0462, "t": 329.87854, "r": 208.52695, "b": 338.25317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "80.4", "bbox": {"l": 194.0462, "t": 329.87854, "r": 208.52695, "b": 338.25317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 226.86324000000002, "t": 329.87854, "r": 241.34396, "b": 338.25317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "79.9", "bbox": {"l": 226.86324000000002, "t": 329.87854, "r": 241.34396, "b": 338.25317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 261.86804, "t": 329.87854, "r": 276.34879, "b": 338.25317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "82.7", "bbox": {"l": 261.86804, "t": 329.87854, "r": 276.34879, "b": 338.25317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 67.663002, "t": 341.23654, "r": 78.628906, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "All", "bbox": {"l": 67.663002, "t": 341.23654, "r": 78.628906, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 135.32401, "t": 341.23654, "r": 155.03215, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "82-83", "bbox": {"l": 135.32401, "t": 341.23654, "r": 155.03215, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 167.95399, "t": 341.23654, "r": 182.43472, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "72.4", "bbox": {"l": 167.95399, "t": 341.23654, "r": 182.43472, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 194.0462, "t": 341.23654, "r": 208.52695, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "73.5", "bbox": {"l": 194.0462, "t": 341.23654, "r": 208.52695, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 226.86324000000002, "t": 341.23654, "r": 241.34396, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "73.4", "bbox": {"l": 226.86324000000002, "t": 341.23654, "r": 241.34396, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 261.86804, "t": 341.23654, "r": 276.34879, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "76.8", "bbox": {"l": 261.86804, "t": 341.23654, "r": 276.34879, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 4, "label": "text", "bbox": {"l": 53.528999, "t": 370.92755, "r": 295.55612, "b": 576.56317, "coord_origin": "TOPLEFT"}, "confidence": 0.9866557121276855, "cells": [{"id": 93, "text": "to avoid this at any cost in order to have clear, unbiased baseline", "bbox": {"l": 53.79800000000001, "t": 370.92755, "r": 294.04712, "b": 379.30219000000005, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "numbers for human document-layout annotation. Third, we in-", "bbox": {"l": 53.79800000000001, "t": 381.88654, "r": 295.55612, "b": 390.26117, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "troduced the feature of", "bbox": {"l": 53.79800000000001, "t": 392.84555, "r": 140.3623, "b": 401.22017999999997, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "snapping", "bbox": {"l": 142.99001, "t": 392.89041, "r": 175.9695, "b": 401.2291599999999, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "boxes around text segments to", "bbox": {"l": 178.951, "t": 392.84555, "r": 294.04083, "b": 401.22017999999997, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "obtain a pixel-accurate annotation and again reduce time and effort.", "bbox": {"l": 53.79800000000001, "t": 403.80453, "r": 295.42493, "b": 412.17917, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "The CCS annotation tool automatically shrinks every user-drawn", "bbox": {"l": 53.528999, "t": 414.76355, "r": 294.04251, "b": 423.13818, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "box to the minimum bounding-box around the enclosed text-cells", "bbox": {"l": 53.79800000000001, "t": 425.72253, "r": 294.04807, "b": 434.09717, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "for all purely text-based segments, which excludes only", "bbox": {"l": 53.79800000000001, "t": 436.6815500000001, "r": 256.80627, "b": 445.0561799999999, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "Table", "bbox": {"l": 259.04199, "t": 436.72641, "r": 278.10455, "b": 445.06516, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "and", "bbox": {"l": 280.54999, "t": 436.6815500000001, "r": 294.04443, "b": 445.0561799999999, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "Picture", "bbox": {"l": 53.79800000000001, "t": 447.68539, "r": 78.875587, "b": 456.02413999999993, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": ". For the latter, we instructed annotation staff to minimise", "bbox": {"l": 78.876999, "t": 447.64053, "r": 294.04852, "b": 456.01517, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "inclusion of surrounding whitespace while including all graphical", "bbox": {"l": 53.79800000000001, "t": 458.59955, "r": 294.04645, "b": 466.97418, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "lines. A downside of snapping boxes to enclosed text cells is that", "bbox": {"l": 53.79800000000001, "t": 469.55853, "r": 294.0416, "b": 477.93317, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "some wrongly parsed PDF pages cannot be annotated correctly and", "bbox": {"l": 53.79800000000001, "t": 480.51654, "r": 294.04538, "b": 488.89117, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "need to be skipped. Fourth, we established a way to flag pages as", "bbox": {"l": 53.79800000000001, "t": 491.47552, "r": 294.04312, "b": 499.85016, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "rejected", "bbox": {"l": 53.79800000000001, "t": 502.4794, "r": 80.597939, "b": 510.81815, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "for cases where no valid annotation according to the label", "bbox": {"l": 83.366997, "t": 502.43454, "r": 294.04483, "b": 510.80917, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "guidelines could be achieved. Example cases for this would be PDF", "bbox": {"l": 53.79800000000001, "t": 513.3935200000001, "r": 294.25833, "b": 521.7681600000001, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "pages that render incorrectly or contain layouts that are impossible", "bbox": {"l": 53.79800000000001, "t": 524.35254, "r": 294.04535, "b": 532.72717, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "to capture with non-overlapping rectangles. Such rejected pages are", "bbox": {"l": 53.79800000000001, "t": 535.31155, "r": 294.04535, "b": 543.68617, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "not contained in the final dataset. With all these measures in place,", "bbox": {"l": 53.79800000000001, "t": 546.27055, "r": 295.02759, "b": 554.64517, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "experienced annotation staff managed to annotate a single page in", "bbox": {"l": 53.79800000000001, "t": 557.22955, "r": 294.0488, "b": 565.6041700000001, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "a typical timeframe of 20s to 60s, depending on its complexity.", "bbox": {"l": 53.79800000000001, "t": 568.18855, "r": 281.80457, "b": 576.56317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "section_header", "bbox": {"l": 53.79800000000001, "t": 588.12991, "r": 147.48535, "b": 598.43901, "coord_origin": "TOPLEFT"}, "confidence": 0.9419495463371277, "cells": [{"id": 118, "text": "5", "bbox": {"l": 53.79800000000001, "t": 588.12991, "r": 59.405277, "b": 598.43901, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "EXPERIMENTS", "bbox": {"l": 70.314377, "t": 588.12991, "r": 147.48535, "b": 598.43901, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 53.484001, "t": 613.25356, "r": 295.4281, "b": 709.299171, "coord_origin": "TOPLEFT"}, "confidence": 0.987605094909668, "cells": [{"id": 120, "text": "The primary goal of DocLayNet is to obtain high-quality ML models", "bbox": {"l": 53.528999, "t": 613.25356, "r": 294.04871, "b": 621.6281700000001, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "capable of accurate document-layout analysis on a wide variety", "bbox": {"l": 53.79800000000001, "t": 624.21255, "r": 294.27576, "b": 632.58717, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "of challenging layouts. As discussed in Section 2, object detection", "bbox": {"l": 53.79800000000001, "t": 635.17155, "r": 294.04144, "b": 643.54617, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "models are currently the easiest to use, due to the standardisation", "bbox": {"l": 53.79800000000001, "t": 646.13055, "r": 294.04163, "b": 654.50517, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "of ground-truth data in COCO format [16] and the availability of", "bbox": {"l": 53.79800000000001, "t": 657.0885499999999, "r": 294.0412, "b": 665.46317, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "general frameworks such as", "bbox": {"l": 53.79800000000001, "t": 668.04755, "r": 155.01054, "b": 676.42217, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "detectron2", "bbox": {"l": 157.23599, "t": 668.09238, "r": 193.26666, "b": 676.43114, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "[17]. Furthermore, baseline", "bbox": {"l": 195.867, "t": 668.04755, "r": 294.0473, "b": 676.42217, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "numbers in PubLayNet and DocBank were obtained using standard", "bbox": {"l": 53.79800000000001, "t": 679.0065500000001, "r": 294.04538, "b": 687.38117, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "object detection models such as Mask R-CNN and Faster R-CNN.", "bbox": {"l": 53.79800000000001, "t": 689.96555, "r": 295.4281, "b": 698.3401719999999, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "As such, we will relate to these object detection methods in this", "bbox": {"l": 53.484001, "t": 700.9245530000001, "r": 294.04413, "b": 709.299171, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "picture", "bbox": {"l": 323.48431396484375, "t": 89.88603210449219, "r": 553.5411376953125, "b": 260.0107727050781, "coord_origin": "TOPLEFT"}, "confidence": 0.9782691597938538, "cells": [{"id": 131, "text": "0", "bbox": {"l": 349.16577, "t": 246.68017999999995, "r": 352.48175, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "20", "bbox": {"l": 385.93698, "t": 246.68017999999995, "r": 392.56894, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "40", "bbox": {"l": 424.366, "t": 246.68017999999995, "r": 430.99796, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "60", "bbox": {"l": 462.79504000000003, "t": 246.68017999999995, "r": 469.427, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "80", "bbox": {"l": 501.22406, "t": 246.68017999999995, "r": 507.85602, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "100", "bbox": {"l": 537.99524, "t": 246.68017999999995, "r": 547.94318, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "% of DocLayNet training set", "bbox": {"l": 410.28143, "t": 253.80840999999998, "r": 483.47278000000006, "b": 259.88251, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "50", "bbox": {"l": 330.93539, "t": 218.38464, "r": 337.56735, "b": 224.45874000000003, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "55", "bbox": {"l": 330.93539, "t": 192.08660999999995, "r": 337.56735, "b": 198.16071, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "60", "bbox": {"l": 330.93539, "t": 165.78864, "r": 337.56735, "b": 171.86273000000006, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "65", "bbox": {"l": 330.93539, "t": 139.49059999999997, "r": 337.56735, "b": 145.56470000000002, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "70", "bbox": {"l": 330.93539, "t": 113.19263000000001, "r": 337.56735, "b": 119.26671999999996, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "mAP 0.50:0.95", "bbox": {"l": 322.92276, "t": 148.37689, "r": 328.99686, "b": 186.79218000000003, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "10", "bbox": {"l": 470.97235, "t": 235.36676, "r": 477.6055, "b": 241.44086000000004, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "1", "bbox": {"l": 477.65662, "t": 234.82390999999996, "r": 479.97778000000005, "b": 239.07581000000005, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "10", "bbox": {"l": 531.55127, "t": 235.41234999999995, "r": 538.18445, "b": 241.48645, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "2", "bbox": {"l": 538.23553, "t": 234.86951, "r": 540.5567, "b": 239.1214, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "50", "bbox": {"l": 404.91125, "t": 216.00005999999996, "r": 411.54321, "b": 222.07416, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "55", "bbox": {"l": 404.91125, "t": 200.22125000000005, "r": 411.54321, "b": 206.29534999999998, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "60", "bbox": {"l": 404.91125, "t": 184.44244000000003, "r": 411.54321, "b": 190.51653999999996, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "65", "bbox": {"l": 404.91125, "t": 168.66364, "r": 411.54321, "b": 174.73773000000006, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "70", "bbox": {"l": 404.91125, "t": 152.88489000000004, "r": 411.54321, "b": 158.95898, "coord_origin": "TOPLEFT"}}], "children": [{"id": 92, "label": "text", "bbox": {"l": 349.16577, "t": 246.68017999999995, "r": 352.48175, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 131, "text": "0", "bbox": {"l": 349.16577, "t": 246.68017999999995, "r": 352.48175, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 385.93698, "t": 246.68017999999995, "r": 392.56894, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 132, "text": "20", "bbox": {"l": 385.93698, "t": 246.68017999999995, "r": 392.56894, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 424.366, "t": 246.68017999999995, "r": 430.99796, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 133, "text": "40", "bbox": {"l": 424.366, "t": 246.68017999999995, "r": 430.99796, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 462.79504000000003, "t": 246.68017999999995, "r": 469.427, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 134, "text": "60", "bbox": {"l": 462.79504000000003, "t": 246.68017999999995, "r": 469.427, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 501.22406, "t": 246.68017999999995, "r": 507.85602, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 135, "text": "80", "bbox": {"l": 501.22406, "t": 246.68017999999995, "r": 507.85602, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 537.99524, "t": 246.68017999999995, "r": 547.94318, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 136, "text": "100", "bbox": {"l": 537.99524, "t": 246.68017999999995, "r": 547.94318, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 410.28143, "t": 253.80840999999998, "r": 483.47278000000006, "b": 259.88251, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 137, "text": "% of DocLayNet training set", "bbox": {"l": 410.28143, "t": 253.80840999999998, "r": 483.47278000000006, "b": 259.88251, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 330.93539, "t": 218.38464, "r": 337.56735, "b": 224.45874000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 138, "text": "50", "bbox": {"l": 330.93539, "t": 218.38464, "r": 337.56735, "b": 224.45874000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 330.93539, "t": 192.08660999999995, "r": 337.56735, "b": 198.16071, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 139, "text": "55", "bbox": {"l": 330.93539, "t": 192.08660999999995, "r": 337.56735, "b": 198.16071, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 330.93539, "t": 165.78864, "r": 337.56735, "b": 171.86273000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 140, "text": "60", "bbox": {"l": 330.93539, "t": 165.78864, "r": 337.56735, "b": 171.86273000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 330.93539, "t": 139.49059999999997, "r": 337.56735, "b": 145.56470000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 141, "text": "65", "bbox": {"l": 330.93539, "t": 139.49059999999997, "r": 337.56735, "b": 145.56470000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 330.93539, "t": 113.19263000000001, "r": 337.56735, "b": 119.26671999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 142, "text": "70", "bbox": {"l": 330.93539, "t": 113.19263000000001, "r": 337.56735, "b": 119.26671999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 322.92276, "t": 148.37689, "r": 328.99686, "b": 186.79218000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 143, "text": "mAP 0.50:0.95", "bbox": {"l": 322.92276, "t": 148.37689, "r": 328.99686, "b": 186.79218000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 470.97235, "t": 235.36676, "r": 477.6055, "b": 241.44086000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 144, "text": "10", "bbox": {"l": 470.97235, "t": 235.36676, "r": 477.6055, "b": 241.44086000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 477.65662, "t": 234.82390999999996, "r": 479.97778000000005, "b": 239.07581000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 145, "text": "1", "bbox": {"l": 477.65662, "t": 234.82390999999996, "r": 479.97778000000005, "b": 239.07581000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 531.55127, "t": 235.41234999999995, "r": 538.18445, "b": 241.48645, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 146, "text": "10", "bbox": {"l": 531.55127, "t": 235.41234999999995, "r": 538.18445, "b": 241.48645, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 538.23553, "t": 234.86951, "r": 540.5567, "b": 239.1214, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 147, "text": "2", "bbox": {"l": 538.23553, "t": 234.86951, "r": 540.5567, "b": 239.1214, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 404.91125, "t": 216.00005999999996, "r": 411.54321, "b": 222.07416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 148, "text": "50", "bbox": {"l": 404.91125, "t": 216.00005999999996, "r": 411.54321, "b": 222.07416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 404.91125, "t": 200.22125000000005, "r": 411.54321, "b": 206.29534999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 149, "text": "55", "bbox": {"l": 404.91125, "t": 200.22125000000005, "r": 411.54321, "b": 206.29534999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 404.91125, "t": 184.44244000000003, "r": 411.54321, "b": 190.51653999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 150, "text": "60", "bbox": {"l": 404.91125, "t": 184.44244000000003, "r": 411.54321, "b": 190.51653999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 404.91125, "t": 168.66364, "r": 411.54321, "b": 174.73773000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 151, "text": "65", "bbox": {"l": 404.91125, "t": 168.66364, "r": 411.54321, "b": 174.73773000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 404.91125, "t": 152.88489000000004, "r": 411.54321, "b": 158.95898, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 152, "text": "70", "bbox": {"l": 404.91125, "t": 152.88489000000004, "r": 411.54321, "b": 158.95898, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 7, "label": "caption", "bbox": {"l": 317.95499, "t": 279.01599, "r": 559.80579, "b": 342.28418000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9639935493469238, "cells": [{"id": 153, "text": "Figure 5: Prediction performance (mAP@0.5-0.95) of a Mask", "bbox": {"l": 317.95499, "t": 279.01599, "r": 558.47876, "b": 287.48923, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "R-CNN network with ResNet50 backbone trained on increas-", "bbox": {"l": 317.95499, "t": 289.97501, "r": 559.80579, "b": 298.44824, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "ing fractions of the DocLayNet dataset. The learning curve", "bbox": {"l": 317.95499, "t": 300.93399, "r": 558.20068, "b": 309.40723, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "flattens around the 80% mark, indicating that increasing the", "bbox": {"l": 317.95499, "t": 311.89297, "r": 558.20062, "b": 320.36620999999997, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "size of the DocLayNet dataset with similar data will not yield", "bbox": {"l": 317.95499, "t": 322.85196, "r": 558.20074, "b": 331.3252, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "significantly better predictions.", "bbox": {"l": 317.95499, "t": 333.81094, "r": 445.24207, "b": 342.28418000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "text", "bbox": {"l": 317.95499, "t": 384.01154, "r": 558.20416, "b": 403.34517999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9594221711158752, "cells": [{"id": 159, "text": "paper and leave the detailed evaluation of more recent methods", "bbox": {"l": 317.95499, "t": 384.01154, "r": 558.20416, "b": 392.38617, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "mentioned in Section 2 for future work.", "bbox": {"l": 317.95499, "t": 394.97055, "r": 463.04938, "b": 403.34517999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 317.64099, "t": 405.92953, "r": 558.4364, "b": 480.05716, "coord_origin": "TOPLEFT"}, "confidence": 0.9872915148735046, "cells": [{"id": 161, "text": "In this section, we will present several aspects related to the", "bbox": {"l": 327.918, "t": 405.92953, "r": 558.19836, "b": 414.30417, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "performance of object detection models on DocLayNet. Similarly", "bbox": {"l": 317.95499, "t": 416.88855, "r": 558.4364, "b": 425.26318, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "as in PubLayNet, we will evaluate the quality of their predictions", "bbox": {"l": 317.95499, "t": 427.84653, "r": 558.20563, "b": 436.22116, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "using mean average precision (mAP) with 10 overlaps that range", "bbox": {"l": 317.95499, "t": 438.80554, "r": 558.20044, "b": 447.18018, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "from 0.5 to 0.95 in steps of 0.05 (mAP@0.5-0.95). These scores are", "bbox": {"l": 317.95499, "t": 449.76453000000004, "r": 558.19891, "b": 458.13916, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "computed by leveraging the evaluation code provided by the COCO", "bbox": {"l": 317.95499, "t": 460.72354, "r": 558.20239, "b": 469.09818, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "API [16].", "bbox": {"l": 317.64099, "t": 471.68253, "r": 350.32352, "b": 480.05716, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "section_header", "bbox": {"l": 317.95499, "t": 496.8219, "r": 466.8532400000001, "b": 507.13098, "coord_origin": "TOPLEFT"}, "confidence": 0.9579005241394043, "cells": [{"id": 168, "text": "Baselines for Object Detection", "bbox": {"l": 317.95499, "t": 496.8219, "r": 466.8532400000001, "b": 507.13098, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 317.74899, "t": 512.02454, "r": 558.43085, "b": 706.700172, "coord_origin": "TOPLEFT"}, "confidence": 0.987722635269165, "cells": [{"id": 169, "text": "In Table 2, we present baseline experiments (given in mAP) on Mask", "bbox": {"l": 317.95499, "t": 512.02454, "r": 558.43085, "b": 520.39917, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "R-CNN [12], Faster R-CNN [11], and YOLOv5 [13]. Both training", "bbox": {"l": 317.95499, "t": 522.9835499999999, "r": 558.20117, "b": 531.35818, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "and evaluation were performed on RGB images with dimensions of", "bbox": {"l": 317.95499, "t": 533.94254, "r": 558.20233, "b": 542.31717, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "1025", "bbox": {"l": 317.74899, "t": 544.90155, "r": 334.09296, "b": 553.27617, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "\u00d7", "bbox": {"l": 334.81201, "t": 544.84775, "r": 340.51465, "b": 552.5499, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "1025 pixels. For training, we only used one annotation in case", "bbox": {"l": 341.233, "t": 544.90155, "r": 558.20117, "b": 553.27617, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "of redundantly annotated pages. As one can observe, the variation", "bbox": {"l": 317.95499, "t": 555.85956, "r": 558.20392, "b": 564.23418, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "in mAP between the models is rather low, but overall between 6", "bbox": {"l": 317.95499, "t": 566.8185599999999, "r": 558.2041, "b": 575.19318, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "and 10% lower than the mAP computed from the pairwise human", "bbox": {"l": 317.95499, "t": 577.77756, "r": 558.2052, "b": 586.15218, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "annotations on triple-annotated pages. This gives a good indication", "bbox": {"l": 317.95499, "t": 588.73656, "r": 558.20233, "b": 597.11118, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "that the DocLayNet dataset poses a worthwhile challenge for the", "bbox": {"l": 317.95499, "t": 599.69556, "r": 558.1983, "b": 608.0701799999999, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "research community to close the gap between human recognition", "bbox": {"l": 317.95499, "t": 610.65456, "r": 558.20502, "b": 619.02917, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "and ML approaches. It is interesting to see that Mask R-CNN and", "bbox": {"l": 317.95499, "t": 621.61356, "r": 558.20337, "b": 629.98817, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "Faster R-CNN produce very comparable mAP scores, indicating", "bbox": {"l": 317.95499, "t": 632.5725600000001, "r": 558.2041, "b": 640.94717, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "that pixel-based image segmentation derived from bounding-boxes", "bbox": {"l": 317.95499, "t": 643.53156, "r": 558.20245, "b": 651.90617, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "does not help to obtain better predictions. On the other hand, the", "bbox": {"l": 317.95499, "t": 654.49055, "r": 558.19757, "b": 662.86517, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": "more recent Yolov5x model does very well and even out-performs", "bbox": {"l": 317.95499, "t": 665.44855, "r": 558.20404, "b": 673.82317, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "humans on selected labels such as", "bbox": {"l": 317.95499, "t": 676.40755, "r": 444.54102, "b": 684.78217, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "Text", "bbox": {"l": 446.78900000000004, "t": 676.45238, "r": 461.95261000000005, "b": 684.79114, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": ",", "bbox": {"l": 461.95599000000004, "t": 676.40755, "r": 463.96805000000006, "b": 684.78217, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "Table", "bbox": {"l": 466.2170100000001, "t": 676.45238, "r": 485.66998000000007, "b": 684.79114, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "and", "bbox": {"l": 488.1290000000001, "t": 676.40755, "r": 501.89330999999993, "b": 684.78217, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "Picture", "bbox": {"l": 504.142, "t": 676.45238, "r": 529.21954, "b": 684.79114, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": ". This is", "bbox": {"l": 529.22101, "t": 676.40755, "r": 558.20392, "b": 684.78217, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "not entirely surprising, as", "bbox": {"l": 317.95499, "t": 687.36655, "r": 410.81366, "b": 695.741173, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "Text", "bbox": {"l": 413.05301, "t": 687.41138, "r": 427.67865, "b": 695.750137, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": ",", "bbox": {"l": 427.67801, "t": 687.36655, "r": 429.62103, "b": 695.741173, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "Table", "bbox": {"l": 431.86099, "t": 687.41138, "r": 450.62881000000004, "b": 695.750137, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "and", "bbox": {"l": 453.082, "t": 687.36655, "r": 466.37402, "b": 695.741173, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "Picture", "bbox": {"l": 468.61499, "t": 687.41138, "r": 492.83208999999994, "b": 695.750137, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "are abundant and", "bbox": {"l": 495.28201, "t": 687.36655, "r": 558.2005, "b": 695.741173, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "the most visually distinctive in a document.", "bbox": {"l": 317.95499, "t": 698.325554, "r": 477.53903, "b": 706.700172, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {"0": {"label": "table", "id": 0, "page_no": 5, "cluster": {"id": 0, "label": "table", "bbox": {"l": 62.02753829956055, "t": 195.68006896972656, "r": 285.78955078125, "b": 351.6618957519531, "coord_origin": "TOPLEFT"}, "confidence": 0.9883638620376587, "cells": [{"id": 13, "text": "human", "bbox": {"l": 132.36501, "t": 197.97351000000003, "r": 157.99098, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "MRCNN", "bbox": {"l": 173.505, "t": 197.97351000000003, "r": 204.61841, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "FRCNN", "bbox": {"l": 220.13028, "t": 197.97351000000003, "r": 248.06958, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "YOLO", "bbox": {"l": 258.03125, "t": 197.97351000000003, "r": 280.17825, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "R50", "bbox": {"l": 168.39301, "t": 208.93255999999997, "r": 181.99504, "b": 217.30719, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "R101", "bbox": {"l": 192.39606, "t": 208.93255999999997, "r": 210.16747, "b": 217.30719, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "R101", "bbox": {"l": 225.21309, "t": 208.93255999999997, "r": 242.9845, "b": 217.30719, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "v5x6", "bbox": {"l": 260.51379, "t": 208.93255999999997, "r": 277.70239, "b": 217.30719, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Caption", "bbox": {"l": 67.663002, "t": 220.28954999999996, "r": 96.848633, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "84-89", "bbox": {"l": 135.32401, "t": 220.28954999999996, "r": 155.03215, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "68.4", "bbox": {"l": 167.95399, "t": 220.28954999999996, "r": 182.43472, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "71.5", "bbox": {"l": 194.0462, "t": 220.28954999999996, "r": 208.52695, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "70.1", "bbox": {"l": 226.86324000000002, "t": 220.28954999999996, "r": 241.34396, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "77.7", "bbox": {"l": 261.86804, "t": 220.28954999999996, "r": 276.34879, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Footnote", "bbox": {"l": 67.663002, "t": 231.24854000000005, "r": 100.1662, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "83-91", "bbox": {"l": 135.32401, "t": 231.24854000000005, "r": 155.03215, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "70.9", "bbox": {"l": 167.95399, "t": 231.24854000000005, "r": 182.43472, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "71.8", "bbox": {"l": 194.0462, "t": 231.24854000000005, "r": 208.52695, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "73.7", "bbox": {"l": 226.86324000000002, "t": 231.24854000000005, "r": 241.34396, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "77.2", "bbox": {"l": 261.86804, "t": 231.24854000000005, "r": 276.34879, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "Formula", "bbox": {"l": 67.663002, "t": 242.20752000000005, "r": 98.175659, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "83-85", "bbox": {"l": 135.32401, "t": 242.20752000000005, "r": 155.03215, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "60.1", "bbox": {"l": 167.95399, "t": 242.20752000000005, "r": 182.43472, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "63.4", "bbox": {"l": 194.0462, "t": 242.20752000000005, "r": 208.52695, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "63.5", "bbox": {"l": 226.86324000000002, "t": 242.20752000000005, "r": 241.34396, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "66.2", "bbox": {"l": 261.86804, "t": 242.20752000000005, "r": 276.34879, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "List-item", "bbox": {"l": 67.663002, "t": 253.16656, "r": 100.54279, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "87-88", "bbox": {"l": 135.32401, "t": 253.16656, "r": 155.03215, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "81.2", "bbox": {"l": 167.95399, "t": 253.16656, "r": 182.43472, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "80.8", "bbox": {"l": 194.0462, "t": 253.16656, "r": 208.52695, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "81.0", "bbox": {"l": 226.86324000000002, "t": 253.16656, "r": 241.34396, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "86.2", "bbox": {"l": 261.86804, "t": 253.16656, "r": 276.34879, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Page-footer", "bbox": {"l": 67.663002, "t": 264.12555, "r": 110.19064, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "93-94", "bbox": {"l": 135.32401, "t": 264.12555, "r": 155.03215, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "61.6", "bbox": {"l": 167.95399, "t": 264.12555, "r": 182.43472, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "59.3", "bbox": {"l": 194.0462, "t": 264.12555, "r": 208.52695, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "58.9", "bbox": {"l": 226.86324000000002, "t": 264.12555, "r": 241.34396, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "61.1", "bbox": {"l": 261.86804, "t": 264.12555, "r": 276.34879, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Page-header", "bbox": {"l": 67.663002, "t": 275.08453, "r": 112.94331999999999, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "85-89", "bbox": {"l": 135.32401, "t": 275.08453, "r": 155.03215, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "71.9", "bbox": {"l": 167.95399, "t": 275.08453, "r": 182.43472, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "70.0", "bbox": {"l": 194.0462, "t": 275.08453, "r": 208.52695, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "72.0", "bbox": {"l": 226.86324000000002, "t": 275.08453, "r": 241.34396, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "67.9", "bbox": {"l": 261.86804, "t": 275.08453, "r": 276.34879, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Picture", "bbox": {"l": 67.663002, "t": 286.04355000000004, "r": 93.647629, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "69-71", "bbox": {"l": 135.32401, "t": 286.04355000000004, "r": 155.03215, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "71.7", "bbox": {"l": 167.95399, "t": 286.04355000000004, "r": 182.43472, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "72.7", "bbox": {"l": 194.0462, "t": 286.04355000000004, "r": 208.52695, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "72.0", "bbox": {"l": 226.86324000000002, "t": 286.04355000000004, "r": 241.34396, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "77.1", "bbox": {"l": 261.86804, "t": 286.04355000000004, "r": 276.34879, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "Section-header", "bbox": {"l": 67.663002, "t": 297.00253, "r": 122.40287999999998, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "83-84", "bbox": {"l": 135.32401, "t": 297.00253, "r": 155.03215, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "67.6", "bbox": {"l": 167.95399, "t": 297.00253, "r": 182.43472, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "69.3", "bbox": {"l": 194.0462, "t": 297.00253, "r": 208.52695, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "68.4", "bbox": {"l": 226.86324000000002, "t": 297.00253, "r": 241.34396, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "74.6", "bbox": {"l": 261.86804, "t": 297.00253, "r": 276.34879, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "Table", "bbox": {"l": 67.663002, "t": 307.96155, "r": 87.46978, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "77-81", "bbox": {"l": 135.32401, "t": 307.96155, "r": 155.03215, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "82.2", "bbox": {"l": 167.95399, "t": 307.96155, "r": 182.43472, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "82.9", "bbox": {"l": 194.0462, "t": 307.96155, "r": 208.52695, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "82.2", "bbox": {"l": 226.86324000000002, "t": 307.96155, "r": 241.34396, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "86.3", "bbox": {"l": 261.86804, "t": 307.96155, "r": 276.34879, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "Text", "bbox": {"l": 67.663002, "t": 318.91953, "r": 83.623199, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "84-86", "bbox": {"l": 135.32401, "t": 318.91953, "r": 155.03215, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "84.6", "bbox": {"l": 167.95399, "t": 318.91953, "r": 182.43472, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "85.8", "bbox": {"l": 194.0462, "t": 318.91953, "r": 208.52695, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "85.4", "bbox": {"l": 226.86324000000002, "t": 318.91953, "r": 241.34396, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "88.1", "bbox": {"l": 261.86804, "t": 318.91953, "r": 276.34879, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Title", "bbox": {"l": 67.663002, "t": 329.87854, "r": 84.654327, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "60-72", "bbox": {"l": 135.32401, "t": 329.87854, "r": 155.03215, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "76.7", "bbox": {"l": 167.95399, "t": 329.87854, "r": 182.43472, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "80.4", "bbox": {"l": 194.0462, "t": 329.87854, "r": 208.52695, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "79.9", "bbox": {"l": 226.86324000000002, "t": 329.87854, "r": 241.34396, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "82.7", "bbox": {"l": 261.86804, "t": 329.87854, "r": 276.34879, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "All", "bbox": {"l": 67.663002, "t": 341.23654, "r": 78.628906, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "82-83", "bbox": {"l": 135.32401, "t": 341.23654, "r": 155.03215, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "72.4", "bbox": {"l": 167.95399, "t": 341.23654, "r": 182.43472, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "73.5", "bbox": {"l": 194.0462, "t": 341.23654, "r": 208.52695, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "73.4", "bbox": {"l": 226.86324000000002, "t": 341.23654, "r": 241.34396, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "76.8", "bbox": {"l": 261.86804, "t": 341.23654, "r": 276.34879, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": [{"id": 12, "label": "text", "bbox": {"l": 132.36501, "t": 197.97351000000003, "r": 157.99098, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "human", "bbox": {"l": 132.36501, "t": 197.97351000000003, "r": 157.99098, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 173.505, "t": 197.97351000000003, "r": 204.61841, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "MRCNN", "bbox": {"l": 173.505, "t": 197.97351000000003, "r": 204.61841, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 220.13028, "t": 197.97351000000003, "r": 248.06958, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "FRCNN", "bbox": {"l": 220.13028, "t": 197.97351000000003, "r": 248.06958, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 258.03125, "t": 197.97351000000003, "r": 280.17825, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "YOLO", "bbox": {"l": 258.03125, "t": 197.97351000000003, "r": 280.17825, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 168.39301, "t": 208.93255999999997, "r": 181.99504, "b": 217.30719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "R50", "bbox": {"l": 168.39301, "t": 208.93255999999997, "r": 181.99504, "b": 217.30719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 192.39606, "t": 208.93255999999997, "r": 210.16747, "b": 217.30719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "R101", "bbox": {"l": 192.39606, "t": 208.93255999999997, "r": 210.16747, "b": 217.30719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 225.21309, "t": 208.93255999999997, "r": 242.9845, "b": 217.30719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "R101", "bbox": {"l": 225.21309, "t": 208.93255999999997, "r": 242.9845, "b": 217.30719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 260.51379, "t": 208.93255999999997, "r": 277.70239, "b": 217.30719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "v5x6", "bbox": {"l": 260.51379, "t": 208.93255999999997, "r": 277.70239, "b": 217.30719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 67.663002, "t": 220.28954999999996, "r": 96.848633, "b": 228.66418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "Caption", "bbox": {"l": 67.663002, "t": 220.28954999999996, "r": 96.848633, "b": 228.66418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 135.32401, "t": 220.28954999999996, "r": 155.03215, "b": 228.66418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "84-89", "bbox": {"l": 135.32401, "t": 220.28954999999996, "r": 155.03215, "b": 228.66418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 167.95399, "t": 220.28954999999996, "r": 182.43472, "b": 228.66418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "68.4", "bbox": {"l": 167.95399, "t": 220.28954999999996, "r": 182.43472, "b": 228.66418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 194.0462, "t": 220.28954999999996, "r": 208.52695, "b": 228.66418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "71.5", "bbox": {"l": 194.0462, "t": 220.28954999999996, "r": 208.52695, "b": 228.66418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 226.86324000000002, "t": 220.28954999999996, "r": 241.34396, "b": 228.66418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "70.1", "bbox": {"l": 226.86324000000002, "t": 220.28954999999996, "r": 241.34396, "b": 228.66418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 261.86804, "t": 220.28954999999996, "r": 276.34879, "b": 228.66418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "77.7", "bbox": {"l": 261.86804, "t": 220.28954999999996, "r": 276.34879, "b": 228.66418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 67.663002, "t": 231.24854000000005, "r": 100.1662, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "Footnote", "bbox": {"l": 67.663002, "t": 231.24854000000005, "r": 100.1662, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 135.32401, "t": 231.24854000000005, "r": 155.03215, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "83-91", "bbox": {"l": 135.32401, "t": 231.24854000000005, "r": 155.03215, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 167.95399, "t": 231.24854000000005, "r": 182.43472, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "70.9", "bbox": {"l": 167.95399, "t": 231.24854000000005, "r": 182.43472, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 194.0462, "t": 231.24854000000005, "r": 208.52695, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "71.8", "bbox": {"l": 194.0462, "t": 231.24854000000005, "r": 208.52695, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 226.86324000000002, "t": 231.24854000000005, "r": 241.34396, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "73.7", "bbox": {"l": 226.86324000000002, "t": 231.24854000000005, "r": 241.34396, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 261.86804, "t": 231.24854000000005, "r": 276.34879, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "77.2", "bbox": {"l": 261.86804, "t": 231.24854000000005, "r": 276.34879, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 67.663002, "t": 242.20752000000005, "r": 98.175659, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "Formula", "bbox": {"l": 67.663002, "t": 242.20752000000005, "r": 98.175659, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 135.32401, "t": 242.20752000000005, "r": 155.03215, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "83-85", "bbox": {"l": 135.32401, "t": 242.20752000000005, "r": 155.03215, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 167.95399, "t": 242.20752000000005, "r": 182.43472, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "60.1", "bbox": {"l": 167.95399, "t": 242.20752000000005, "r": 182.43472, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 194.0462, "t": 242.20752000000005, "r": 208.52695, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "63.4", "bbox": {"l": 194.0462, "t": 242.20752000000005, "r": 208.52695, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 226.86324000000002, "t": 242.20752000000005, "r": 241.34396, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "63.5", "bbox": {"l": 226.86324000000002, "t": 242.20752000000005, "r": 241.34396, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 261.86804, "t": 242.20752000000005, "r": 276.34879, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "66.2", "bbox": {"l": 261.86804, "t": 242.20752000000005, "r": 276.34879, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 67.663002, "t": 253.16656, "r": 100.54279, "b": 261.5412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "List-item", "bbox": {"l": 67.663002, "t": 253.16656, "r": 100.54279, "b": 261.5412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 135.32401, "t": 253.16656, "r": 155.03215, "b": 261.5412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "87-88", "bbox": {"l": 135.32401, "t": 253.16656, "r": 155.03215, "b": 261.5412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 167.95399, "t": 253.16656, "r": 182.43472, "b": 261.5412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "81.2", "bbox": {"l": 167.95399, "t": 253.16656, "r": 182.43472, "b": 261.5412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 194.0462, "t": 253.16656, "r": 208.52695, "b": 261.5412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "80.8", "bbox": {"l": 194.0462, "t": 253.16656, "r": 208.52695, "b": 261.5412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 226.86324000000002, "t": 253.16656, "r": 241.34396, "b": 261.5412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "81.0", "bbox": {"l": 226.86324000000002, "t": 253.16656, "r": 241.34396, "b": 261.5412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 261.86804, "t": 253.16656, "r": 276.34879, "b": 261.5412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "86.2", "bbox": {"l": 261.86804, "t": 253.16656, "r": 276.34879, "b": 261.5412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 67.663002, "t": 264.12555, "r": 110.19064, "b": 272.50018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "Page-footer", "bbox": {"l": 67.663002, "t": 264.12555, "r": 110.19064, "b": 272.50018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 135.32401, "t": 264.12555, "r": 155.03215, "b": 272.50018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "93-94", "bbox": {"l": 135.32401, "t": 264.12555, "r": 155.03215, "b": 272.50018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 167.95399, "t": 264.12555, "r": 182.43472, "b": 272.50018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "61.6", "bbox": {"l": 167.95399, "t": 264.12555, "r": 182.43472, "b": 272.50018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 194.0462, "t": 264.12555, "r": 208.52695, "b": 272.50018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "59.3", "bbox": {"l": 194.0462, "t": 264.12555, "r": 208.52695, "b": 272.50018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 226.86324000000002, "t": 264.12555, "r": 241.34396, "b": 272.50018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "58.9", "bbox": {"l": 226.86324000000002, "t": 264.12555, "r": 241.34396, "b": 272.50018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 261.86804, "t": 264.12555, "r": 276.34879, "b": 272.50018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "61.1", "bbox": {"l": 261.86804, "t": 264.12555, "r": 276.34879, "b": 272.50018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 67.663002, "t": 275.08453, "r": 112.94331999999999, "b": 283.45917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "Page-header", "bbox": {"l": 67.663002, "t": 275.08453, "r": 112.94331999999999, "b": 283.45917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 135.32401, "t": 275.08453, "r": 155.03215, "b": 283.45917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "85-89", "bbox": {"l": 135.32401, "t": 275.08453, "r": 155.03215, "b": 283.45917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 167.95399, "t": 275.08453, "r": 182.43472, "b": 283.45917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "71.9", "bbox": {"l": 167.95399, "t": 275.08453, "r": 182.43472, "b": 283.45917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 194.0462, "t": 275.08453, "r": 208.52695, "b": 283.45917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "70.0", "bbox": {"l": 194.0462, "t": 275.08453, "r": 208.52695, "b": 283.45917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 226.86324000000002, "t": 275.08453, "r": 241.34396, "b": 283.45917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "72.0", "bbox": {"l": 226.86324000000002, "t": 275.08453, "r": 241.34396, "b": 283.45917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 261.86804, "t": 275.08453, "r": 276.34879, "b": 283.45917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "67.9", "bbox": {"l": 261.86804, "t": 275.08453, "r": 276.34879, "b": 283.45917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 67.663002, "t": 286.04355000000004, "r": 93.647629, "b": 294.41818, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "Picture", "bbox": {"l": 67.663002, "t": 286.04355000000004, "r": 93.647629, "b": 294.41818, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 135.32401, "t": 286.04355000000004, "r": 155.03215, "b": 294.41818, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "69-71", "bbox": {"l": 135.32401, "t": 286.04355000000004, "r": 155.03215, "b": 294.41818, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 167.95399, "t": 286.04355000000004, "r": 182.43472, "b": 294.41818, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "71.7", "bbox": {"l": 167.95399, "t": 286.04355000000004, "r": 182.43472, "b": 294.41818, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 194.0462, "t": 286.04355000000004, "r": 208.52695, "b": 294.41818, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "72.7", "bbox": {"l": 194.0462, "t": 286.04355000000004, "r": 208.52695, "b": 294.41818, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 226.86324000000002, "t": 286.04355000000004, "r": 241.34396, "b": 294.41818, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "72.0", "bbox": {"l": 226.86324000000002, "t": 286.04355000000004, "r": 241.34396, "b": 294.41818, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 261.86804, "t": 286.04355000000004, "r": 276.34879, "b": 294.41818, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "77.1", "bbox": {"l": 261.86804, "t": 286.04355000000004, "r": 276.34879, "b": 294.41818, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 67.663002, "t": 297.00253, "r": 122.40287999999998, "b": 305.37717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "Section-header", "bbox": {"l": 67.663002, "t": 297.00253, "r": 122.40287999999998, "b": 305.37717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 135.32401, "t": 297.00253, "r": 155.03215, "b": 305.37717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "83-84", "bbox": {"l": 135.32401, "t": 297.00253, "r": 155.03215, "b": 305.37717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 167.95399, "t": 297.00253, "r": 182.43472, "b": 305.37717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "67.6", "bbox": {"l": 167.95399, "t": 297.00253, "r": 182.43472, "b": 305.37717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 194.0462, "t": 297.00253, "r": 208.52695, "b": 305.37717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "69.3", "bbox": {"l": 194.0462, "t": 297.00253, "r": 208.52695, "b": 305.37717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 226.86324000000002, "t": 297.00253, "r": 241.34396, "b": 305.37717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "68.4", "bbox": {"l": 226.86324000000002, "t": 297.00253, "r": 241.34396, "b": 305.37717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 261.86804, "t": 297.00253, "r": 276.34879, "b": 305.37717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "74.6", "bbox": {"l": 261.86804, "t": 297.00253, "r": 276.34879, "b": 305.37717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 67.663002, "t": 307.96155, "r": 87.46978, "b": 316.33618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "Table", "bbox": {"l": 67.663002, "t": 307.96155, "r": 87.46978, "b": 316.33618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 135.32401, "t": 307.96155, "r": 155.03215, "b": 316.33618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "77-81", "bbox": {"l": 135.32401, "t": 307.96155, "r": 155.03215, "b": 316.33618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 167.95399, "t": 307.96155, "r": 182.43472, "b": 316.33618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "82.2", "bbox": {"l": 167.95399, "t": 307.96155, "r": 182.43472, "b": 316.33618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 194.0462, "t": 307.96155, "r": 208.52695, "b": 316.33618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "82.9", "bbox": {"l": 194.0462, "t": 307.96155, "r": 208.52695, "b": 316.33618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 226.86324000000002, "t": 307.96155, "r": 241.34396, "b": 316.33618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "82.2", "bbox": {"l": 226.86324000000002, "t": 307.96155, "r": 241.34396, "b": 316.33618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 261.86804, "t": 307.96155, "r": 276.34879, "b": 316.33618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "86.3", "bbox": {"l": 261.86804, "t": 307.96155, "r": 276.34879, "b": 316.33618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 67.663002, "t": 318.91953, "r": 83.623199, "b": 327.29416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "Text", "bbox": {"l": 67.663002, "t": 318.91953, "r": 83.623199, "b": 327.29416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 135.32401, "t": 318.91953, "r": 155.03215, "b": 327.29416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "84-86", "bbox": {"l": 135.32401, "t": 318.91953, "r": 155.03215, "b": 327.29416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 167.95399, "t": 318.91953, "r": 182.43472, "b": 327.29416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "84.6", "bbox": {"l": 167.95399, "t": 318.91953, "r": 182.43472, "b": 327.29416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 194.0462, "t": 318.91953, "r": 208.52695, "b": 327.29416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "85.8", "bbox": {"l": 194.0462, "t": 318.91953, "r": 208.52695, "b": 327.29416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 226.86324000000002, "t": 318.91953, "r": 241.34396, "b": 327.29416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "85.4", "bbox": {"l": 226.86324000000002, "t": 318.91953, "r": 241.34396, "b": 327.29416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 261.86804, "t": 318.91953, "r": 276.34879, "b": 327.29416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "88.1", "bbox": {"l": 261.86804, "t": 318.91953, "r": 276.34879, "b": 327.29416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 67.663002, "t": 329.87854, "r": 84.654327, "b": 338.25317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "Title", "bbox": {"l": 67.663002, "t": 329.87854, "r": 84.654327, "b": 338.25317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 135.32401, "t": 329.87854, "r": 155.03215, "b": 338.25317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "60-72", "bbox": {"l": 135.32401, "t": 329.87854, "r": 155.03215, "b": 338.25317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 167.95399, "t": 329.87854, "r": 182.43472, "b": 338.25317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "76.7", "bbox": {"l": 167.95399, "t": 329.87854, "r": 182.43472, "b": 338.25317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 194.0462, "t": 329.87854, "r": 208.52695, "b": 338.25317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "80.4", "bbox": {"l": 194.0462, "t": 329.87854, "r": 208.52695, "b": 338.25317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 226.86324000000002, "t": 329.87854, "r": 241.34396, "b": 338.25317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "79.9", "bbox": {"l": 226.86324000000002, "t": 329.87854, "r": 241.34396, "b": 338.25317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 261.86804, "t": 329.87854, "r": 276.34879, "b": 338.25317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "82.7", "bbox": {"l": 261.86804, "t": 329.87854, "r": 276.34879, "b": 338.25317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 67.663002, "t": 341.23654, "r": 78.628906, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "All", "bbox": {"l": 67.663002, "t": 341.23654, "r": 78.628906, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 135.32401, "t": 341.23654, "r": 155.03215, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "82-83", "bbox": {"l": 135.32401, "t": 341.23654, "r": 155.03215, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 167.95399, "t": 341.23654, "r": 182.43472, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "72.4", "bbox": {"l": 167.95399, "t": 341.23654, "r": 182.43472, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 194.0462, "t": 341.23654, "r": 208.52695, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "73.5", "bbox": {"l": 194.0462, "t": 341.23654, "r": 208.52695, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 226.86324000000002, "t": 341.23654, "r": 241.34396, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "73.4", "bbox": {"l": 226.86324000000002, "t": 341.23654, "r": 241.34396, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 261.86804, "t": 341.23654, "r": 276.34879, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "76.8", "bbox": {"l": 261.86804, "t": 341.23654, "r": 276.34879, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ecel", "ched", "ched", "lcel", "ched", "ched", "nl", "ecel", "ucel", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 14, "num_cols": 6, "table_cells": [{"bbox": {"l": 132.36501, "t": 197.97351000000003, "r": 157.99098, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "human", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 173.505, "t": 197.97351000000003, "r": 204.61841, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 4, "text": "MRCNN", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 220.13028, "t": 197.97351000000003, "r": 248.06958, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "FRCNN", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 258.03125, "t": 197.97351000000003, "r": 280.17825, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "YOLO", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 168.39301, "t": 208.93255999999997, "r": 181.99504, "b": 217.30719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "R50", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 192.39606, "t": 208.93255999999997, "r": 210.16747, "b": 217.30719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "R101", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 225.21309, "t": 208.93255999999997, "r": 242.9845, "b": 217.30719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "R101", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 260.51379, "t": 208.93255999999997, "r": 277.70239, "b": 217.30719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "v5x6", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 220.28954999999996, "r": 96.848633, "b": 228.66418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Caption", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 220.28954999999996, "r": 155.03215, "b": 228.66418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "84-89", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 220.28954999999996, "r": 182.43472, "b": 228.66418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "68.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 220.28954999999996, "r": 208.52695, "b": 228.66418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "71.5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 220.28954999999996, "r": 241.34396, "b": 228.66418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "70.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 220.28954999999996, "r": 276.34879, "b": 228.66418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "77.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 231.24854000000005, "r": 100.1662, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Footnote", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 231.24854000000005, "r": 155.03215, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "83-91", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 231.24854000000005, "r": 182.43472, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "70.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 231.24854000000005, "r": 208.52695, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "71.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 231.24854000000005, "r": 241.34396, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "73.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 231.24854000000005, "r": 276.34879, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "77.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 242.20752000000005, "r": 98.175659, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Formula", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 242.20752000000005, "r": 155.03215, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "83-85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 242.20752000000005, "r": 182.43472, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "60.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 242.20752000000005, "r": 208.52695, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "63.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 242.20752000000005, "r": 241.34396, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "63.5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 242.20752000000005, "r": 276.34879, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "66.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 253.16656, "r": 100.54279, "b": 261.5412, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "List-item", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 253.16656, "r": 155.03215, "b": 261.5412, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "87-88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 253.16656, "r": 182.43472, "b": 261.5412, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "81.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 253.16656, "r": 208.52695, "b": 261.5412, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "80.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 253.16656, "r": 241.34396, "b": 261.5412, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "81.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 253.16656, "r": 276.34879, "b": 261.5412, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "86.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 264.12555, "r": 110.19064, "b": 272.50018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-footer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 264.12555, "r": 155.03215, "b": 272.50018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "93-94", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 264.12555, "r": 182.43472, "b": 272.50018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "61.6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 264.12555, "r": 208.52695, "b": 272.50018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "59.3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 264.12555, "r": 241.34396, "b": 272.50018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "58.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 264.12555, "r": 276.34879, "b": 272.50018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "61.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 275.08453, "r": 112.94331999999999, "b": 283.45917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 275.08453, "r": 155.03215, "b": 283.45917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "85-89", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 275.08453, "r": 182.43472, "b": 283.45917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "71.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 275.08453, "r": 208.52695, "b": 283.45917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "70.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 275.08453, "r": 241.34396, "b": 283.45917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "72.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 275.08453, "r": 276.34879, "b": 283.45917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "67.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 286.04355000000004, "r": 93.647629, "b": 294.41818, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Picture", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 286.04355000000004, "r": 155.03215, "b": 294.41818, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "69-71", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 286.04355000000004, "r": 182.43472, "b": 294.41818, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "71.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 286.04355000000004, "r": 208.52695, "b": 294.41818, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "72.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 286.04355000000004, "r": 241.34396, "b": 294.41818, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "72.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 286.04355000000004, "r": 276.34879, "b": 294.41818, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "77.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 297.00253, "r": 122.40287999999998, "b": 305.37717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Section-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 297.00253, "r": 155.03215, "b": 305.37717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "83-84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 297.00253, "r": 182.43472, "b": 305.37717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "67.6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 297.00253, "r": 208.52695, "b": 305.37717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "69.3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 297.00253, "r": 241.34396, "b": 305.37717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "68.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 297.00253, "r": 276.34879, "b": 305.37717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "74.6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 307.96155, "r": 87.46978, "b": 316.33618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 307.96155, "r": 155.03215, "b": 316.33618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "77-81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 307.96155, "r": 182.43472, "b": 316.33618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "82.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 307.96155, "r": 208.52695, "b": 316.33618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "82.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 307.96155, "r": 241.34396, "b": 316.33618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "82.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 307.96155, "r": 276.34879, "b": 316.33618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "86.3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 318.91953, "r": 83.623199, "b": 327.29416, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Text", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 318.91953, "r": 155.03215, "b": 327.29416, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "84-86", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 318.91953, "r": 182.43472, "b": 327.29416, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "84.6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 318.91953, "r": 208.52695, "b": 327.29416, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "85.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 318.91953, "r": 241.34396, "b": 327.29416, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "85.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 318.91953, "r": 276.34879, "b": 327.29416, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "88.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 329.87854, "r": 84.654327, "b": 338.25317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Title", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 329.87854, "r": 155.03215, "b": 338.25317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "60-72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 329.87854, "r": 182.43472, "b": 338.25317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "76.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 329.87854, "r": 208.52695, "b": 338.25317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "80.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 329.87854, "r": 241.34396, "b": 338.25317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "79.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 329.87854, "r": 276.34879, "b": 338.25317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "82.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 341.23654, "r": 78.628906, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "All", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 341.23654, "r": 155.03215, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "82-83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 341.23654, "r": 182.43472, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "72.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 341.23654, "r": 208.52695, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "73.5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 341.23654, "r": 241.34396, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "73.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 341.23654, "r": 276.34879, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "76.8", "column_header": false, "row_header": false, "row_section": false}]}}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_header", "id": 11, "page_no": 5, "cluster": {"id": 11, "label": "page_header", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.8662876486778259, "cells": [{"id": 0, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 246.24382, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar", "bbox": {"l": 253.13897999999998, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "KDD '22, August 14-18, 2022, Washington, DC, USA Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar"}, {"label": "text", "id": 5, "page_no": 5, "cluster": {"id": 5, "label": "text", "bbox": {"l": 53.501999, "t": 86.87292000000002, "r": 295.64874, "b": 183.01709000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9782760143280029, "cells": [{"id": 2, "text": "Table 2: Prediction performance (mAP@0.5-0.95) of object", "bbox": {"l": 53.501999, "t": 86.87292000000002, "r": 294.04361, "b": 95.34618999999998, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "detection networks on DocLayNet test set. The MRCNN", "bbox": {"l": 53.79800000000001, "t": 97.83191, "r": 294.04373, "b": 106.30517999999995, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "(Mask R-CNN) and FRCNN (Faster R-CNN) models with", "bbox": {"l": 53.52, "t": 108.79088999999999, "r": 294.0437, "b": 117.26415999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "ResNet-50 or ResNet-101 backbone were trained based on", "bbox": {"l": 53.79800000000001, "t": 119.74987999999996, "r": 294.04373, "b": 128.22313999999994, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "the network architectures from the", "bbox": {"l": 53.79800000000001, "t": 130.70885999999996, "r": 202.43402, "b": 139.18213000000003, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "detectron2", "bbox": {"l": 206.08501, "t": 130.71783000000005, "r": 247.14215000000002, "b": 139.20905000000005, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "model zoo", "bbox": {"l": 250.95001, "t": 130.70885999999996, "r": 294.04254, "b": 139.18213000000003, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "(Mask R-CNN R50, R101-FPN 3x, Faster R-CNN R101-FPN", "bbox": {"l": 53.52002, "t": 141.66785000000004, "r": 294.04367, "b": 150.14111000000003, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "3x), with default configurations. The YOLO implementation", "bbox": {"l": 53.798019, "t": 152.62683000000004, "r": 294.04373, "b": 161.1001, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "utilized was YOLOv5x6 [13]. All models were initialised us-", "bbox": {"l": 53.798019, "t": 163.58582, "r": 295.64874, "b": 172.05908, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "ing pre-trained weights from the COCO 2017 dataset.", "bbox": {"l": 53.798019, "t": 174.54381999999998, "r": 268.62399, "b": 183.01709000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 2: Prediction performance (mAP@0.5-0.95) of object detection networks on DocLayNet test set. The MRCNN (Mask R-CNN) and FRCNN (Faster R-CNN) models with ResNet-50 or ResNet-101 backbone were trained based on the network architectures from the detectron2 model zoo (Mask R-CNN R50, R101-FPN 3x, Faster R-CNN R101-FPN 3x), with default configurations. The YOLO implementation utilized was YOLOv5x6 [13]. All models were initialised using pre-trained weights from the COCO 2017 dataset."}, {"label": "table", "id": 0, "page_no": 5, "cluster": {"id": 0, "label": "table", "bbox": {"l": 62.02753829956055, "t": 195.68006896972656, "r": 285.78955078125, "b": 351.6618957519531, "coord_origin": "TOPLEFT"}, "confidence": 0.9883638620376587, "cells": [{"id": 13, "text": "human", "bbox": {"l": 132.36501, "t": 197.97351000000003, "r": 157.99098, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "MRCNN", "bbox": {"l": 173.505, "t": 197.97351000000003, "r": 204.61841, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "FRCNN", "bbox": {"l": 220.13028, "t": 197.97351000000003, "r": 248.06958, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "YOLO", "bbox": {"l": 258.03125, "t": 197.97351000000003, "r": 280.17825, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "R50", "bbox": {"l": 168.39301, "t": 208.93255999999997, "r": 181.99504, "b": 217.30719, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "R101", "bbox": {"l": 192.39606, "t": 208.93255999999997, "r": 210.16747, "b": 217.30719, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "R101", "bbox": {"l": 225.21309, "t": 208.93255999999997, "r": 242.9845, "b": 217.30719, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "v5x6", "bbox": {"l": 260.51379, "t": 208.93255999999997, "r": 277.70239, "b": 217.30719, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Caption", "bbox": {"l": 67.663002, "t": 220.28954999999996, "r": 96.848633, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "84-89", "bbox": {"l": 135.32401, "t": 220.28954999999996, "r": 155.03215, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "68.4", "bbox": {"l": 167.95399, "t": 220.28954999999996, "r": 182.43472, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "71.5", "bbox": {"l": 194.0462, "t": 220.28954999999996, "r": 208.52695, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "70.1", "bbox": {"l": 226.86324000000002, "t": 220.28954999999996, "r": 241.34396, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "77.7", "bbox": {"l": 261.86804, "t": 220.28954999999996, "r": 276.34879, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Footnote", "bbox": {"l": 67.663002, "t": 231.24854000000005, "r": 100.1662, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "83-91", "bbox": {"l": 135.32401, "t": 231.24854000000005, "r": 155.03215, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "70.9", "bbox": {"l": 167.95399, "t": 231.24854000000005, "r": 182.43472, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "71.8", "bbox": {"l": 194.0462, "t": 231.24854000000005, "r": 208.52695, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "73.7", "bbox": {"l": 226.86324000000002, "t": 231.24854000000005, "r": 241.34396, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "77.2", "bbox": {"l": 261.86804, "t": 231.24854000000005, "r": 276.34879, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "Formula", "bbox": {"l": 67.663002, "t": 242.20752000000005, "r": 98.175659, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "83-85", "bbox": {"l": 135.32401, "t": 242.20752000000005, "r": 155.03215, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "60.1", "bbox": {"l": 167.95399, "t": 242.20752000000005, "r": 182.43472, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "63.4", "bbox": {"l": 194.0462, "t": 242.20752000000005, "r": 208.52695, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "63.5", "bbox": {"l": 226.86324000000002, "t": 242.20752000000005, "r": 241.34396, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "66.2", "bbox": {"l": 261.86804, "t": 242.20752000000005, "r": 276.34879, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "List-item", "bbox": {"l": 67.663002, "t": 253.16656, "r": 100.54279, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "87-88", "bbox": {"l": 135.32401, "t": 253.16656, "r": 155.03215, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "81.2", "bbox": {"l": 167.95399, "t": 253.16656, "r": 182.43472, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "80.8", "bbox": {"l": 194.0462, "t": 253.16656, "r": 208.52695, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "81.0", "bbox": {"l": 226.86324000000002, "t": 253.16656, "r": 241.34396, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "86.2", "bbox": {"l": 261.86804, "t": 253.16656, "r": 276.34879, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Page-footer", "bbox": {"l": 67.663002, "t": 264.12555, "r": 110.19064, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "93-94", "bbox": {"l": 135.32401, "t": 264.12555, "r": 155.03215, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "61.6", "bbox": {"l": 167.95399, "t": 264.12555, "r": 182.43472, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "59.3", "bbox": {"l": 194.0462, "t": 264.12555, "r": 208.52695, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "58.9", "bbox": {"l": 226.86324000000002, "t": 264.12555, "r": 241.34396, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "61.1", "bbox": {"l": 261.86804, "t": 264.12555, "r": 276.34879, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Page-header", "bbox": {"l": 67.663002, "t": 275.08453, "r": 112.94331999999999, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "85-89", "bbox": {"l": 135.32401, "t": 275.08453, "r": 155.03215, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "71.9", "bbox": {"l": 167.95399, "t": 275.08453, "r": 182.43472, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "70.0", "bbox": {"l": 194.0462, "t": 275.08453, "r": 208.52695, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "72.0", "bbox": {"l": 226.86324000000002, "t": 275.08453, "r": 241.34396, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "67.9", "bbox": {"l": 261.86804, "t": 275.08453, "r": 276.34879, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Picture", "bbox": {"l": 67.663002, "t": 286.04355000000004, "r": 93.647629, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "69-71", "bbox": {"l": 135.32401, "t": 286.04355000000004, "r": 155.03215, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "71.7", "bbox": {"l": 167.95399, "t": 286.04355000000004, "r": 182.43472, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "72.7", "bbox": {"l": 194.0462, "t": 286.04355000000004, "r": 208.52695, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "72.0", "bbox": {"l": 226.86324000000002, "t": 286.04355000000004, "r": 241.34396, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "77.1", "bbox": {"l": 261.86804, "t": 286.04355000000004, "r": 276.34879, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "Section-header", "bbox": {"l": 67.663002, "t": 297.00253, "r": 122.40287999999998, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "83-84", "bbox": {"l": 135.32401, "t": 297.00253, "r": 155.03215, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "67.6", "bbox": {"l": 167.95399, "t": 297.00253, "r": 182.43472, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "69.3", "bbox": {"l": 194.0462, "t": 297.00253, "r": 208.52695, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "68.4", "bbox": {"l": 226.86324000000002, "t": 297.00253, "r": 241.34396, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "74.6", "bbox": {"l": 261.86804, "t": 297.00253, "r": 276.34879, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "Table", "bbox": {"l": 67.663002, "t": 307.96155, "r": 87.46978, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "77-81", "bbox": {"l": 135.32401, "t": 307.96155, "r": 155.03215, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "82.2", "bbox": {"l": 167.95399, "t": 307.96155, "r": 182.43472, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "82.9", "bbox": {"l": 194.0462, "t": 307.96155, "r": 208.52695, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "82.2", "bbox": {"l": 226.86324000000002, "t": 307.96155, "r": 241.34396, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "86.3", "bbox": {"l": 261.86804, "t": 307.96155, "r": 276.34879, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "Text", "bbox": {"l": 67.663002, "t": 318.91953, "r": 83.623199, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "84-86", "bbox": {"l": 135.32401, "t": 318.91953, "r": 155.03215, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "84.6", "bbox": {"l": 167.95399, "t": 318.91953, "r": 182.43472, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "85.8", "bbox": {"l": 194.0462, "t": 318.91953, "r": 208.52695, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "85.4", "bbox": {"l": 226.86324000000002, "t": 318.91953, "r": 241.34396, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "88.1", "bbox": {"l": 261.86804, "t": 318.91953, "r": 276.34879, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Title", "bbox": {"l": 67.663002, "t": 329.87854, "r": 84.654327, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "60-72", "bbox": {"l": 135.32401, "t": 329.87854, "r": 155.03215, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "76.7", "bbox": {"l": 167.95399, "t": 329.87854, "r": 182.43472, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "80.4", "bbox": {"l": 194.0462, "t": 329.87854, "r": 208.52695, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "79.9", "bbox": {"l": 226.86324000000002, "t": 329.87854, "r": 241.34396, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "82.7", "bbox": {"l": 261.86804, "t": 329.87854, "r": 276.34879, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "All", "bbox": {"l": 67.663002, "t": 341.23654, "r": 78.628906, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "82-83", "bbox": {"l": 135.32401, "t": 341.23654, "r": 155.03215, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "72.4", "bbox": {"l": 167.95399, "t": 341.23654, "r": 182.43472, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "73.5", "bbox": {"l": 194.0462, "t": 341.23654, "r": 208.52695, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "73.4", "bbox": {"l": 226.86324000000002, "t": 341.23654, "r": 241.34396, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "76.8", "bbox": {"l": 261.86804, "t": 341.23654, "r": 276.34879, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": [{"id": 12, "label": "text", "bbox": {"l": 132.36501, "t": 197.97351000000003, "r": 157.99098, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "human", "bbox": {"l": 132.36501, "t": 197.97351000000003, "r": 157.99098, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 173.505, "t": 197.97351000000003, "r": 204.61841, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "MRCNN", "bbox": {"l": 173.505, "t": 197.97351000000003, "r": 204.61841, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 220.13028, "t": 197.97351000000003, "r": 248.06958, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "FRCNN", "bbox": {"l": 220.13028, "t": 197.97351000000003, "r": 248.06958, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 258.03125, "t": 197.97351000000003, "r": 280.17825, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "YOLO", "bbox": {"l": 258.03125, "t": 197.97351000000003, "r": 280.17825, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 168.39301, "t": 208.93255999999997, "r": 181.99504, "b": 217.30719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "R50", "bbox": {"l": 168.39301, "t": 208.93255999999997, "r": 181.99504, "b": 217.30719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 192.39606, "t": 208.93255999999997, "r": 210.16747, "b": 217.30719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "R101", "bbox": {"l": 192.39606, "t": 208.93255999999997, "r": 210.16747, "b": 217.30719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 225.21309, "t": 208.93255999999997, "r": 242.9845, "b": 217.30719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "R101", "bbox": {"l": 225.21309, "t": 208.93255999999997, "r": 242.9845, "b": 217.30719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 260.51379, "t": 208.93255999999997, "r": 277.70239, "b": 217.30719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "v5x6", "bbox": {"l": 260.51379, "t": 208.93255999999997, "r": 277.70239, "b": 217.30719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 67.663002, "t": 220.28954999999996, "r": 96.848633, "b": 228.66418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "Caption", "bbox": {"l": 67.663002, "t": 220.28954999999996, "r": 96.848633, "b": 228.66418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 135.32401, "t": 220.28954999999996, "r": 155.03215, "b": 228.66418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "84-89", "bbox": {"l": 135.32401, "t": 220.28954999999996, "r": 155.03215, "b": 228.66418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 167.95399, "t": 220.28954999999996, "r": 182.43472, "b": 228.66418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "68.4", "bbox": {"l": 167.95399, "t": 220.28954999999996, "r": 182.43472, "b": 228.66418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 194.0462, "t": 220.28954999999996, "r": 208.52695, "b": 228.66418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "71.5", "bbox": {"l": 194.0462, "t": 220.28954999999996, "r": 208.52695, "b": 228.66418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 226.86324000000002, "t": 220.28954999999996, "r": 241.34396, "b": 228.66418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "70.1", "bbox": {"l": 226.86324000000002, "t": 220.28954999999996, "r": 241.34396, "b": 228.66418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 261.86804, "t": 220.28954999999996, "r": 276.34879, "b": 228.66418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "77.7", "bbox": {"l": 261.86804, "t": 220.28954999999996, "r": 276.34879, "b": 228.66418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 67.663002, "t": 231.24854000000005, "r": 100.1662, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "Footnote", "bbox": {"l": 67.663002, "t": 231.24854000000005, "r": 100.1662, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 135.32401, "t": 231.24854000000005, "r": 155.03215, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "83-91", "bbox": {"l": 135.32401, "t": 231.24854000000005, "r": 155.03215, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 167.95399, "t": 231.24854000000005, "r": 182.43472, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "70.9", "bbox": {"l": 167.95399, "t": 231.24854000000005, "r": 182.43472, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 194.0462, "t": 231.24854000000005, "r": 208.52695, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "71.8", "bbox": {"l": 194.0462, "t": 231.24854000000005, "r": 208.52695, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 226.86324000000002, "t": 231.24854000000005, "r": 241.34396, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "73.7", "bbox": {"l": 226.86324000000002, "t": 231.24854000000005, "r": 241.34396, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 261.86804, "t": 231.24854000000005, "r": 276.34879, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "77.2", "bbox": {"l": 261.86804, "t": 231.24854000000005, "r": 276.34879, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 67.663002, "t": 242.20752000000005, "r": 98.175659, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "Formula", "bbox": {"l": 67.663002, "t": 242.20752000000005, "r": 98.175659, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 135.32401, "t": 242.20752000000005, "r": 155.03215, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "83-85", "bbox": {"l": 135.32401, "t": 242.20752000000005, "r": 155.03215, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 167.95399, "t": 242.20752000000005, "r": 182.43472, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "60.1", "bbox": {"l": 167.95399, "t": 242.20752000000005, "r": 182.43472, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 194.0462, "t": 242.20752000000005, "r": 208.52695, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "63.4", "bbox": {"l": 194.0462, "t": 242.20752000000005, "r": 208.52695, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 226.86324000000002, "t": 242.20752000000005, "r": 241.34396, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "63.5", "bbox": {"l": 226.86324000000002, "t": 242.20752000000005, "r": 241.34396, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 261.86804, "t": 242.20752000000005, "r": 276.34879, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "66.2", "bbox": {"l": 261.86804, "t": 242.20752000000005, "r": 276.34879, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 67.663002, "t": 253.16656, "r": 100.54279, "b": 261.5412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "List-item", "bbox": {"l": 67.663002, "t": 253.16656, "r": 100.54279, "b": 261.5412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 135.32401, "t": 253.16656, "r": 155.03215, "b": 261.5412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "87-88", "bbox": {"l": 135.32401, "t": 253.16656, "r": 155.03215, "b": 261.5412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 167.95399, "t": 253.16656, "r": 182.43472, "b": 261.5412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "81.2", "bbox": {"l": 167.95399, "t": 253.16656, "r": 182.43472, "b": 261.5412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 194.0462, "t": 253.16656, "r": 208.52695, "b": 261.5412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "80.8", "bbox": {"l": 194.0462, "t": 253.16656, "r": 208.52695, "b": 261.5412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 226.86324000000002, "t": 253.16656, "r": 241.34396, "b": 261.5412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "81.0", "bbox": {"l": 226.86324000000002, "t": 253.16656, "r": 241.34396, "b": 261.5412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 261.86804, "t": 253.16656, "r": 276.34879, "b": 261.5412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "86.2", "bbox": {"l": 261.86804, "t": 253.16656, "r": 276.34879, "b": 261.5412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 67.663002, "t": 264.12555, "r": 110.19064, "b": 272.50018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "Page-footer", "bbox": {"l": 67.663002, "t": 264.12555, "r": 110.19064, "b": 272.50018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 135.32401, "t": 264.12555, "r": 155.03215, "b": 272.50018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "93-94", "bbox": {"l": 135.32401, "t": 264.12555, "r": 155.03215, "b": 272.50018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 167.95399, "t": 264.12555, "r": 182.43472, "b": 272.50018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "61.6", "bbox": {"l": 167.95399, "t": 264.12555, "r": 182.43472, "b": 272.50018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 194.0462, "t": 264.12555, "r": 208.52695, "b": 272.50018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "59.3", "bbox": {"l": 194.0462, "t": 264.12555, "r": 208.52695, "b": 272.50018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 226.86324000000002, "t": 264.12555, "r": 241.34396, "b": 272.50018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "58.9", "bbox": {"l": 226.86324000000002, "t": 264.12555, "r": 241.34396, "b": 272.50018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 261.86804, "t": 264.12555, "r": 276.34879, "b": 272.50018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "61.1", "bbox": {"l": 261.86804, "t": 264.12555, "r": 276.34879, "b": 272.50018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 67.663002, "t": 275.08453, "r": 112.94331999999999, "b": 283.45917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "Page-header", "bbox": {"l": 67.663002, "t": 275.08453, "r": 112.94331999999999, "b": 283.45917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 135.32401, "t": 275.08453, "r": 155.03215, "b": 283.45917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "85-89", "bbox": {"l": 135.32401, "t": 275.08453, "r": 155.03215, "b": 283.45917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 167.95399, "t": 275.08453, "r": 182.43472, "b": 283.45917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "71.9", "bbox": {"l": 167.95399, "t": 275.08453, "r": 182.43472, "b": 283.45917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 194.0462, "t": 275.08453, "r": 208.52695, "b": 283.45917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "70.0", "bbox": {"l": 194.0462, "t": 275.08453, "r": 208.52695, "b": 283.45917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 226.86324000000002, "t": 275.08453, "r": 241.34396, "b": 283.45917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "72.0", "bbox": {"l": 226.86324000000002, "t": 275.08453, "r": 241.34396, "b": 283.45917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 261.86804, "t": 275.08453, "r": 276.34879, "b": 283.45917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "67.9", "bbox": {"l": 261.86804, "t": 275.08453, "r": 276.34879, "b": 283.45917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 67.663002, "t": 286.04355000000004, "r": 93.647629, "b": 294.41818, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "Picture", "bbox": {"l": 67.663002, "t": 286.04355000000004, "r": 93.647629, "b": 294.41818, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 135.32401, "t": 286.04355000000004, "r": 155.03215, "b": 294.41818, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "69-71", "bbox": {"l": 135.32401, "t": 286.04355000000004, "r": 155.03215, "b": 294.41818, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 167.95399, "t": 286.04355000000004, "r": 182.43472, "b": 294.41818, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "71.7", "bbox": {"l": 167.95399, "t": 286.04355000000004, "r": 182.43472, "b": 294.41818, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 194.0462, "t": 286.04355000000004, "r": 208.52695, "b": 294.41818, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "72.7", "bbox": {"l": 194.0462, "t": 286.04355000000004, "r": 208.52695, "b": 294.41818, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 226.86324000000002, "t": 286.04355000000004, "r": 241.34396, "b": 294.41818, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "72.0", "bbox": {"l": 226.86324000000002, "t": 286.04355000000004, "r": 241.34396, "b": 294.41818, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 261.86804, "t": 286.04355000000004, "r": 276.34879, "b": 294.41818, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "77.1", "bbox": {"l": 261.86804, "t": 286.04355000000004, "r": 276.34879, "b": 294.41818, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 67.663002, "t": 297.00253, "r": 122.40287999999998, "b": 305.37717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "Section-header", "bbox": {"l": 67.663002, "t": 297.00253, "r": 122.40287999999998, "b": 305.37717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 135.32401, "t": 297.00253, "r": 155.03215, "b": 305.37717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "83-84", "bbox": {"l": 135.32401, "t": 297.00253, "r": 155.03215, "b": 305.37717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 167.95399, "t": 297.00253, "r": 182.43472, "b": 305.37717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "67.6", "bbox": {"l": 167.95399, "t": 297.00253, "r": 182.43472, "b": 305.37717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 194.0462, "t": 297.00253, "r": 208.52695, "b": 305.37717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "69.3", "bbox": {"l": 194.0462, "t": 297.00253, "r": 208.52695, "b": 305.37717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 226.86324000000002, "t": 297.00253, "r": 241.34396, "b": 305.37717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "68.4", "bbox": {"l": 226.86324000000002, "t": 297.00253, "r": 241.34396, "b": 305.37717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 261.86804, "t": 297.00253, "r": 276.34879, "b": 305.37717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "74.6", "bbox": {"l": 261.86804, "t": 297.00253, "r": 276.34879, "b": 305.37717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 67.663002, "t": 307.96155, "r": 87.46978, "b": 316.33618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "Table", "bbox": {"l": 67.663002, "t": 307.96155, "r": 87.46978, "b": 316.33618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 135.32401, "t": 307.96155, "r": 155.03215, "b": 316.33618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "77-81", "bbox": {"l": 135.32401, "t": 307.96155, "r": 155.03215, "b": 316.33618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 167.95399, "t": 307.96155, "r": 182.43472, "b": 316.33618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "82.2", "bbox": {"l": 167.95399, "t": 307.96155, "r": 182.43472, "b": 316.33618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 194.0462, "t": 307.96155, "r": 208.52695, "b": 316.33618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "82.9", "bbox": {"l": 194.0462, "t": 307.96155, "r": 208.52695, "b": 316.33618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 226.86324000000002, "t": 307.96155, "r": 241.34396, "b": 316.33618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "82.2", "bbox": {"l": 226.86324000000002, "t": 307.96155, "r": 241.34396, "b": 316.33618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 261.86804, "t": 307.96155, "r": 276.34879, "b": 316.33618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "86.3", "bbox": {"l": 261.86804, "t": 307.96155, "r": 276.34879, "b": 316.33618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 67.663002, "t": 318.91953, "r": 83.623199, "b": 327.29416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "Text", "bbox": {"l": 67.663002, "t": 318.91953, "r": 83.623199, "b": 327.29416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 135.32401, "t": 318.91953, "r": 155.03215, "b": 327.29416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "84-86", "bbox": {"l": 135.32401, "t": 318.91953, "r": 155.03215, "b": 327.29416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 167.95399, "t": 318.91953, "r": 182.43472, "b": 327.29416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "84.6", "bbox": {"l": 167.95399, "t": 318.91953, "r": 182.43472, "b": 327.29416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 194.0462, "t": 318.91953, "r": 208.52695, "b": 327.29416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "85.8", "bbox": {"l": 194.0462, "t": 318.91953, "r": 208.52695, "b": 327.29416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 226.86324000000002, "t": 318.91953, "r": 241.34396, "b": 327.29416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "85.4", "bbox": {"l": 226.86324000000002, "t": 318.91953, "r": 241.34396, "b": 327.29416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 261.86804, "t": 318.91953, "r": 276.34879, "b": 327.29416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "88.1", "bbox": {"l": 261.86804, "t": 318.91953, "r": 276.34879, "b": 327.29416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 67.663002, "t": 329.87854, "r": 84.654327, "b": 338.25317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "Title", "bbox": {"l": 67.663002, "t": 329.87854, "r": 84.654327, "b": 338.25317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 135.32401, "t": 329.87854, "r": 155.03215, "b": 338.25317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "60-72", "bbox": {"l": 135.32401, "t": 329.87854, "r": 155.03215, "b": 338.25317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 167.95399, "t": 329.87854, "r": 182.43472, "b": 338.25317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "76.7", "bbox": {"l": 167.95399, "t": 329.87854, "r": 182.43472, "b": 338.25317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 194.0462, "t": 329.87854, "r": 208.52695, "b": 338.25317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "80.4", "bbox": {"l": 194.0462, "t": 329.87854, "r": 208.52695, "b": 338.25317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 226.86324000000002, "t": 329.87854, "r": 241.34396, "b": 338.25317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "79.9", "bbox": {"l": 226.86324000000002, "t": 329.87854, "r": 241.34396, "b": 338.25317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 261.86804, "t": 329.87854, "r": 276.34879, "b": 338.25317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "82.7", "bbox": {"l": 261.86804, "t": 329.87854, "r": 276.34879, "b": 338.25317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 67.663002, "t": 341.23654, "r": 78.628906, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "All", "bbox": {"l": 67.663002, "t": 341.23654, "r": 78.628906, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 135.32401, "t": 341.23654, "r": 155.03215, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "82-83", "bbox": {"l": 135.32401, "t": 341.23654, "r": 155.03215, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 167.95399, "t": 341.23654, "r": 182.43472, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "72.4", "bbox": {"l": 167.95399, "t": 341.23654, "r": 182.43472, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 194.0462, "t": 341.23654, "r": 208.52695, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "73.5", "bbox": {"l": 194.0462, "t": 341.23654, "r": 208.52695, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 226.86324000000002, "t": 341.23654, "r": 241.34396, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "73.4", "bbox": {"l": 226.86324000000002, "t": 341.23654, "r": 241.34396, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 261.86804, "t": 341.23654, "r": 276.34879, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "76.8", "bbox": {"l": 261.86804, "t": 341.23654, "r": 276.34879, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ecel", "ched", "ched", "lcel", "ched", "ched", "nl", "ecel", "ucel", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 14, "num_cols": 6, "table_cells": [{"bbox": {"l": 132.36501, "t": 197.97351000000003, "r": 157.99098, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "human", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 173.505, "t": 197.97351000000003, "r": 204.61841, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 4, "text": "MRCNN", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 220.13028, "t": 197.97351000000003, "r": 248.06958, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "FRCNN", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 258.03125, "t": 197.97351000000003, "r": 280.17825, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "YOLO", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 168.39301, "t": 208.93255999999997, "r": 181.99504, "b": 217.30719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "R50", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 192.39606, "t": 208.93255999999997, "r": 210.16747, "b": 217.30719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "R101", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 225.21309, "t": 208.93255999999997, "r": 242.9845, "b": 217.30719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "R101", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 260.51379, "t": 208.93255999999997, "r": 277.70239, "b": 217.30719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "v5x6", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 220.28954999999996, "r": 96.848633, "b": 228.66418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Caption", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 220.28954999999996, "r": 155.03215, "b": 228.66418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "84-89", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 220.28954999999996, "r": 182.43472, "b": 228.66418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "68.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 220.28954999999996, "r": 208.52695, "b": 228.66418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "71.5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 220.28954999999996, "r": 241.34396, "b": 228.66418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "70.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 220.28954999999996, "r": 276.34879, "b": 228.66418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "77.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 231.24854000000005, "r": 100.1662, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Footnote", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 231.24854000000005, "r": 155.03215, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "83-91", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 231.24854000000005, "r": 182.43472, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "70.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 231.24854000000005, "r": 208.52695, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "71.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 231.24854000000005, "r": 241.34396, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "73.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 231.24854000000005, "r": 276.34879, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "77.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 242.20752000000005, "r": 98.175659, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Formula", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 242.20752000000005, "r": 155.03215, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "83-85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 242.20752000000005, "r": 182.43472, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "60.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 242.20752000000005, "r": 208.52695, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "63.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 242.20752000000005, "r": 241.34396, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "63.5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 242.20752000000005, "r": 276.34879, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "66.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 253.16656, "r": 100.54279, "b": 261.5412, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "List-item", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 253.16656, "r": 155.03215, "b": 261.5412, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "87-88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 253.16656, "r": 182.43472, "b": 261.5412, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "81.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 253.16656, "r": 208.52695, "b": 261.5412, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "80.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 253.16656, "r": 241.34396, "b": 261.5412, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "81.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 253.16656, "r": 276.34879, "b": 261.5412, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "86.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 264.12555, "r": 110.19064, "b": 272.50018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-footer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 264.12555, "r": 155.03215, "b": 272.50018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "93-94", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 264.12555, "r": 182.43472, "b": 272.50018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "61.6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 264.12555, "r": 208.52695, "b": 272.50018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "59.3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 264.12555, "r": 241.34396, "b": 272.50018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "58.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 264.12555, "r": 276.34879, "b": 272.50018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "61.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 275.08453, "r": 112.94331999999999, "b": 283.45917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 275.08453, "r": 155.03215, "b": 283.45917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "85-89", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 275.08453, "r": 182.43472, "b": 283.45917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "71.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 275.08453, "r": 208.52695, "b": 283.45917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "70.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 275.08453, "r": 241.34396, "b": 283.45917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "72.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 275.08453, "r": 276.34879, "b": 283.45917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "67.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 286.04355000000004, "r": 93.647629, "b": 294.41818, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Picture", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 286.04355000000004, "r": 155.03215, "b": 294.41818, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "69-71", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 286.04355000000004, "r": 182.43472, "b": 294.41818, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "71.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 286.04355000000004, "r": 208.52695, "b": 294.41818, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "72.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 286.04355000000004, "r": 241.34396, "b": 294.41818, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "72.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 286.04355000000004, "r": 276.34879, "b": 294.41818, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "77.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 297.00253, "r": 122.40287999999998, "b": 305.37717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Section-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 297.00253, "r": 155.03215, "b": 305.37717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "83-84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 297.00253, "r": 182.43472, "b": 305.37717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "67.6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 297.00253, "r": 208.52695, "b": 305.37717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "69.3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 297.00253, "r": 241.34396, "b": 305.37717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "68.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 297.00253, "r": 276.34879, "b": 305.37717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "74.6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 307.96155, "r": 87.46978, "b": 316.33618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 307.96155, "r": 155.03215, "b": 316.33618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "77-81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 307.96155, "r": 182.43472, "b": 316.33618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "82.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 307.96155, "r": 208.52695, "b": 316.33618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "82.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 307.96155, "r": 241.34396, "b": 316.33618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "82.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 307.96155, "r": 276.34879, "b": 316.33618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "86.3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 318.91953, "r": 83.623199, "b": 327.29416, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Text", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 318.91953, "r": 155.03215, "b": 327.29416, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "84-86", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 318.91953, "r": 182.43472, "b": 327.29416, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "84.6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 318.91953, "r": 208.52695, "b": 327.29416, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "85.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 318.91953, "r": 241.34396, "b": 327.29416, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "85.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 318.91953, "r": 276.34879, "b": 327.29416, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "88.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 329.87854, "r": 84.654327, "b": 338.25317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Title", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 329.87854, "r": 155.03215, "b": 338.25317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "60-72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 329.87854, "r": 182.43472, "b": 338.25317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "76.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 329.87854, "r": 208.52695, "b": 338.25317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "80.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 329.87854, "r": 241.34396, "b": 338.25317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "79.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 329.87854, "r": 276.34879, "b": 338.25317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "82.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 341.23654, "r": 78.628906, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "All", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 341.23654, "r": 155.03215, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "82-83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 341.23654, "r": 182.43472, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "72.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 341.23654, "r": 208.52695, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "73.5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 341.23654, "r": 241.34396, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "73.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 341.23654, "r": 276.34879, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "76.8", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "text", "id": 4, "page_no": 5, "cluster": {"id": 4, "label": "text", "bbox": {"l": 53.528999, "t": 370.92755, "r": 295.55612, "b": 576.56317, "coord_origin": "TOPLEFT"}, "confidence": 0.9866557121276855, "cells": [{"id": 93, "text": "to avoid this at any cost in order to have clear, unbiased baseline", "bbox": {"l": 53.79800000000001, "t": 370.92755, "r": 294.04712, "b": 379.30219000000005, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "numbers for human document-layout annotation. Third, we in-", "bbox": {"l": 53.79800000000001, "t": 381.88654, "r": 295.55612, "b": 390.26117, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "troduced the feature of", "bbox": {"l": 53.79800000000001, "t": 392.84555, "r": 140.3623, "b": 401.22017999999997, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "snapping", "bbox": {"l": 142.99001, "t": 392.89041, "r": 175.9695, "b": 401.2291599999999, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "boxes around text segments to", "bbox": {"l": 178.951, "t": 392.84555, "r": 294.04083, "b": 401.22017999999997, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "obtain a pixel-accurate annotation and again reduce time and effort.", "bbox": {"l": 53.79800000000001, "t": 403.80453, "r": 295.42493, "b": 412.17917, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "The CCS annotation tool automatically shrinks every user-drawn", "bbox": {"l": 53.528999, "t": 414.76355, "r": 294.04251, "b": 423.13818, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "box to the minimum bounding-box around the enclosed text-cells", "bbox": {"l": 53.79800000000001, "t": 425.72253, "r": 294.04807, "b": 434.09717, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "for all purely text-based segments, which excludes only", "bbox": {"l": 53.79800000000001, "t": 436.6815500000001, "r": 256.80627, "b": 445.0561799999999, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "Table", "bbox": {"l": 259.04199, "t": 436.72641, "r": 278.10455, "b": 445.06516, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "and", "bbox": {"l": 280.54999, "t": 436.6815500000001, "r": 294.04443, "b": 445.0561799999999, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "Picture", "bbox": {"l": 53.79800000000001, "t": 447.68539, "r": 78.875587, "b": 456.02413999999993, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": ". For the latter, we instructed annotation staff to minimise", "bbox": {"l": 78.876999, "t": 447.64053, "r": 294.04852, "b": 456.01517, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "inclusion of surrounding whitespace while including all graphical", "bbox": {"l": 53.79800000000001, "t": 458.59955, "r": 294.04645, "b": 466.97418, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "lines. A downside of snapping boxes to enclosed text cells is that", "bbox": {"l": 53.79800000000001, "t": 469.55853, "r": 294.0416, "b": 477.93317, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "some wrongly parsed PDF pages cannot be annotated correctly and", "bbox": {"l": 53.79800000000001, "t": 480.51654, "r": 294.04538, "b": 488.89117, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "need to be skipped. Fourth, we established a way to flag pages as", "bbox": {"l": 53.79800000000001, "t": 491.47552, "r": 294.04312, "b": 499.85016, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "rejected", "bbox": {"l": 53.79800000000001, "t": 502.4794, "r": 80.597939, "b": 510.81815, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "for cases where no valid annotation according to the label", "bbox": {"l": 83.366997, "t": 502.43454, "r": 294.04483, "b": 510.80917, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "guidelines could be achieved. Example cases for this would be PDF", "bbox": {"l": 53.79800000000001, "t": 513.3935200000001, "r": 294.25833, "b": 521.7681600000001, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "pages that render incorrectly or contain layouts that are impossible", "bbox": {"l": 53.79800000000001, "t": 524.35254, "r": 294.04535, "b": 532.72717, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "to capture with non-overlapping rectangles. Such rejected pages are", "bbox": {"l": 53.79800000000001, "t": 535.31155, "r": 294.04535, "b": 543.68617, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "not contained in the final dataset. With all these measures in place,", "bbox": {"l": 53.79800000000001, "t": 546.27055, "r": 295.02759, "b": 554.64517, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "experienced annotation staff managed to annotate a single page in", "bbox": {"l": 53.79800000000001, "t": 557.22955, "r": 294.0488, "b": 565.6041700000001, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "a typical timeframe of 20s to 60s, depending on its complexity.", "bbox": {"l": 53.79800000000001, "t": 568.18855, "r": 281.80457, "b": 576.56317, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "to avoid this at any cost in order to have clear, unbiased baseline numbers for human document-layout annotation. Third, we introduced the feature of snapping boxes around text segments to obtain a pixel-accurate annotation and again reduce time and effort. The CCS annotation tool automatically shrinks every user-drawn box to the minimum bounding-box around the enclosed text-cells for all purely text-based segments, which excludes only Table and Picture . For the latter, we instructed annotation staff to minimise inclusion of surrounding whitespace while including all graphical lines. A downside of snapping boxes to enclosed text cells is that some wrongly parsed PDF pages cannot be annotated correctly and need to be skipped. Fourth, we established a way to flag pages as rejected for cases where no valid annotation according to the label guidelines could be achieved. Example cases for this would be PDF pages that render incorrectly or contain layouts that are impossible to capture with non-overlapping rectangles. Such rejected pages are not contained in the final dataset. With all these measures in place, experienced annotation staff managed to annotate a single page in a typical timeframe of 20s to 60s, depending on its complexity."}, {"label": "section_header", "id": 10, "page_no": 5, "cluster": {"id": 10, "label": "section_header", "bbox": {"l": 53.79800000000001, "t": 588.12991, "r": 147.48535, "b": 598.43901, "coord_origin": "TOPLEFT"}, "confidence": 0.9419495463371277, "cells": [{"id": 118, "text": "5", "bbox": {"l": 53.79800000000001, "t": 588.12991, "r": 59.405277, "b": 598.43901, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "EXPERIMENTS", "bbox": {"l": 70.314377, "t": 588.12991, "r": 147.48535, "b": 598.43901, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5 EXPERIMENTS"}, {"label": "text", "id": 2, "page_no": 5, "cluster": {"id": 2, "label": "text", "bbox": {"l": 53.484001, "t": 613.25356, "r": 295.4281, "b": 709.299171, "coord_origin": "TOPLEFT"}, "confidence": 0.987605094909668, "cells": [{"id": 120, "text": "The primary goal of DocLayNet is to obtain high-quality ML models", "bbox": {"l": 53.528999, "t": 613.25356, "r": 294.04871, "b": 621.6281700000001, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "capable of accurate document-layout analysis on a wide variety", "bbox": {"l": 53.79800000000001, "t": 624.21255, "r": 294.27576, "b": 632.58717, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "of challenging layouts. As discussed in Section 2, object detection", "bbox": {"l": 53.79800000000001, "t": 635.17155, "r": 294.04144, "b": 643.54617, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "models are currently the easiest to use, due to the standardisation", "bbox": {"l": 53.79800000000001, "t": 646.13055, "r": 294.04163, "b": 654.50517, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "of ground-truth data in COCO format [16] and the availability of", "bbox": {"l": 53.79800000000001, "t": 657.0885499999999, "r": 294.0412, "b": 665.46317, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "general frameworks such as", "bbox": {"l": 53.79800000000001, "t": 668.04755, "r": 155.01054, "b": 676.42217, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "detectron2", "bbox": {"l": 157.23599, "t": 668.09238, "r": 193.26666, "b": 676.43114, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "[17]. Furthermore, baseline", "bbox": {"l": 195.867, "t": 668.04755, "r": 294.0473, "b": 676.42217, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "numbers in PubLayNet and DocBank were obtained using standard", "bbox": {"l": 53.79800000000001, "t": 679.0065500000001, "r": 294.04538, "b": 687.38117, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "object detection models such as Mask R-CNN and Faster R-CNN.", "bbox": {"l": 53.79800000000001, "t": 689.96555, "r": 295.4281, "b": 698.3401719999999, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "As such, we will relate to these object detection methods in this", "bbox": {"l": 53.484001, "t": 700.9245530000001, "r": 294.04413, "b": 709.299171, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The primary goal of DocLayNet is to obtain high-quality ML models capable of accurate document-layout analysis on a wide variety of challenging layouts. As discussed in Section 2, object detection models are currently the easiest to use, due to the standardisation of ground-truth data in COCO format [16] and the availability of general frameworks such as detectron2 [17]. Furthermore, baseline numbers in PubLayNet and DocBank were obtained using standard object detection models such as Mask R-CNN and Faster R-CNN. As such, we will relate to these object detection methods in this"}, {"label": "picture", "id": 6, "page_no": 5, "cluster": {"id": 6, "label": "picture", "bbox": {"l": 323.48431396484375, "t": 89.88603210449219, "r": 553.5411376953125, "b": 260.0107727050781, "coord_origin": "TOPLEFT"}, "confidence": 0.9782691597938538, "cells": [{"id": 131, "text": "0", "bbox": {"l": 349.16577, "t": 246.68017999999995, "r": 352.48175, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "20", "bbox": {"l": 385.93698, "t": 246.68017999999995, "r": 392.56894, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "40", "bbox": {"l": 424.366, "t": 246.68017999999995, "r": 430.99796, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "60", "bbox": {"l": 462.79504000000003, "t": 246.68017999999995, "r": 469.427, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "80", "bbox": {"l": 501.22406, "t": 246.68017999999995, "r": 507.85602, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "100", "bbox": {"l": 537.99524, "t": 246.68017999999995, "r": 547.94318, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "% of DocLayNet training set", "bbox": {"l": 410.28143, "t": 253.80840999999998, "r": 483.47278000000006, "b": 259.88251, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "50", "bbox": {"l": 330.93539, "t": 218.38464, "r": 337.56735, "b": 224.45874000000003, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "55", "bbox": {"l": 330.93539, "t": 192.08660999999995, "r": 337.56735, "b": 198.16071, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "60", "bbox": {"l": 330.93539, "t": 165.78864, "r": 337.56735, "b": 171.86273000000006, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "65", "bbox": {"l": 330.93539, "t": 139.49059999999997, "r": 337.56735, "b": 145.56470000000002, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "70", "bbox": {"l": 330.93539, "t": 113.19263000000001, "r": 337.56735, "b": 119.26671999999996, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "mAP 0.50:0.95", "bbox": {"l": 322.92276, "t": 148.37689, "r": 328.99686, "b": 186.79218000000003, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "10", "bbox": {"l": 470.97235, "t": 235.36676, "r": 477.6055, "b": 241.44086000000004, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "1", "bbox": {"l": 477.65662, "t": 234.82390999999996, "r": 479.97778000000005, "b": 239.07581000000005, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "10", "bbox": {"l": 531.55127, "t": 235.41234999999995, "r": 538.18445, "b": 241.48645, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "2", "bbox": {"l": 538.23553, "t": 234.86951, "r": 540.5567, "b": 239.1214, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "50", "bbox": {"l": 404.91125, "t": 216.00005999999996, "r": 411.54321, "b": 222.07416, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "55", "bbox": {"l": 404.91125, "t": 200.22125000000005, "r": 411.54321, "b": 206.29534999999998, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "60", "bbox": {"l": 404.91125, "t": 184.44244000000003, "r": 411.54321, "b": 190.51653999999996, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "65", "bbox": {"l": 404.91125, "t": 168.66364, "r": 411.54321, "b": 174.73773000000006, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "70", "bbox": {"l": 404.91125, "t": 152.88489000000004, "r": 411.54321, "b": 158.95898, "coord_origin": "TOPLEFT"}}], "children": [{"id": 92, "label": "text", "bbox": {"l": 349.16577, "t": 246.68017999999995, "r": 352.48175, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 131, "text": "0", "bbox": {"l": 349.16577, "t": 246.68017999999995, "r": 352.48175, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 385.93698, "t": 246.68017999999995, "r": 392.56894, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 132, "text": "20", "bbox": {"l": 385.93698, "t": 246.68017999999995, "r": 392.56894, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 424.366, "t": 246.68017999999995, "r": 430.99796, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 133, "text": "40", "bbox": {"l": 424.366, "t": 246.68017999999995, "r": 430.99796, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 462.79504000000003, "t": 246.68017999999995, "r": 469.427, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 134, "text": "60", "bbox": {"l": 462.79504000000003, "t": 246.68017999999995, "r": 469.427, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 501.22406, "t": 246.68017999999995, "r": 507.85602, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 135, "text": "80", "bbox": {"l": 501.22406, "t": 246.68017999999995, "r": 507.85602, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 537.99524, "t": 246.68017999999995, "r": 547.94318, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 136, "text": "100", "bbox": {"l": 537.99524, "t": 246.68017999999995, "r": 547.94318, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 410.28143, "t": 253.80840999999998, "r": 483.47278000000006, "b": 259.88251, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 137, "text": "% of DocLayNet training set", "bbox": {"l": 410.28143, "t": 253.80840999999998, "r": 483.47278000000006, "b": 259.88251, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 330.93539, "t": 218.38464, "r": 337.56735, "b": 224.45874000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 138, "text": "50", "bbox": {"l": 330.93539, "t": 218.38464, "r": 337.56735, "b": 224.45874000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 330.93539, "t": 192.08660999999995, "r": 337.56735, "b": 198.16071, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 139, "text": "55", "bbox": {"l": 330.93539, "t": 192.08660999999995, "r": 337.56735, "b": 198.16071, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 330.93539, "t": 165.78864, "r": 337.56735, "b": 171.86273000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 140, "text": "60", "bbox": {"l": 330.93539, "t": 165.78864, "r": 337.56735, "b": 171.86273000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 330.93539, "t": 139.49059999999997, "r": 337.56735, "b": 145.56470000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 141, "text": "65", "bbox": {"l": 330.93539, "t": 139.49059999999997, "r": 337.56735, "b": 145.56470000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 330.93539, "t": 113.19263000000001, "r": 337.56735, "b": 119.26671999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 142, "text": "70", "bbox": {"l": 330.93539, "t": 113.19263000000001, "r": 337.56735, "b": 119.26671999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 322.92276, "t": 148.37689, "r": 328.99686, "b": 186.79218000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 143, "text": "mAP 0.50:0.95", "bbox": {"l": 322.92276, "t": 148.37689, "r": 328.99686, "b": 186.79218000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 470.97235, "t": 235.36676, "r": 477.6055, "b": 241.44086000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 144, "text": "10", "bbox": {"l": 470.97235, "t": 235.36676, "r": 477.6055, "b": 241.44086000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 477.65662, "t": 234.82390999999996, "r": 479.97778000000005, "b": 239.07581000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 145, "text": "1", "bbox": {"l": 477.65662, "t": 234.82390999999996, "r": 479.97778000000005, "b": 239.07581000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 531.55127, "t": 235.41234999999995, "r": 538.18445, "b": 241.48645, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 146, "text": "10", "bbox": {"l": 531.55127, "t": 235.41234999999995, "r": 538.18445, "b": 241.48645, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 538.23553, "t": 234.86951, "r": 540.5567, "b": 239.1214, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 147, "text": "2", "bbox": {"l": 538.23553, "t": 234.86951, "r": 540.5567, "b": 239.1214, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 404.91125, "t": 216.00005999999996, "r": 411.54321, "b": 222.07416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 148, "text": "50", "bbox": {"l": 404.91125, "t": 216.00005999999996, "r": 411.54321, "b": 222.07416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 404.91125, "t": 200.22125000000005, "r": 411.54321, "b": 206.29534999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 149, "text": "55", "bbox": {"l": 404.91125, "t": 200.22125000000005, "r": 411.54321, "b": 206.29534999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 404.91125, "t": 184.44244000000003, "r": 411.54321, "b": 190.51653999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 150, "text": "60", "bbox": {"l": 404.91125, "t": 184.44244000000003, "r": 411.54321, "b": 190.51653999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 404.91125, "t": 168.66364, "r": 411.54321, "b": 174.73773000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 151, "text": "65", "bbox": {"l": 404.91125, "t": 168.66364, "r": 411.54321, "b": 174.73773000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 404.91125, "t": 152.88489000000004, "r": 411.54321, "b": 158.95898, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 152, "text": "70", "bbox": {"l": 404.91125, "t": 152.88489000000004, "r": 411.54321, "b": 158.95898, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "caption", "id": 7, "page_no": 5, "cluster": {"id": 7, "label": "caption", "bbox": {"l": 317.95499, "t": 279.01599, "r": 559.80579, "b": 342.28418000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9639935493469238, "cells": [{"id": 153, "text": "Figure 5: Prediction performance (mAP@0.5-0.95) of a Mask", "bbox": {"l": 317.95499, "t": 279.01599, "r": 558.47876, "b": 287.48923, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "R-CNN network with ResNet50 backbone trained on increas-", "bbox": {"l": 317.95499, "t": 289.97501, "r": 559.80579, "b": 298.44824, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "ing fractions of the DocLayNet dataset. The learning curve", "bbox": {"l": 317.95499, "t": 300.93399, "r": 558.20068, "b": 309.40723, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "flattens around the 80% mark, indicating that increasing the", "bbox": {"l": 317.95499, "t": 311.89297, "r": 558.20062, "b": 320.36620999999997, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "size of the DocLayNet dataset with similar data will not yield", "bbox": {"l": 317.95499, "t": 322.85196, "r": 558.20074, "b": 331.3252, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "significantly better predictions.", "bbox": {"l": 317.95499, "t": 333.81094, "r": 445.24207, "b": 342.28418000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 5: Prediction performance (mAP@0.5-0.95) of a Mask R-CNN network with ResNet50 backbone trained on increasing fractions of the DocLayNet dataset. The learning curve flattens around the 80% mark, indicating that increasing the size of the DocLayNet dataset with similar data will not yield significantly better predictions."}, {"label": "text", "id": 8, "page_no": 5, "cluster": {"id": 8, "label": "text", "bbox": {"l": 317.95499, "t": 384.01154, "r": 558.20416, "b": 403.34517999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9594221711158752, "cells": [{"id": 159, "text": "paper and leave the detailed evaluation of more recent methods", "bbox": {"l": 317.95499, "t": 384.01154, "r": 558.20416, "b": 392.38617, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "mentioned in Section 2 for future work.", "bbox": {"l": 317.95499, "t": 394.97055, "r": 463.04938, "b": 403.34517999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "paper and leave the detailed evaluation of more recent methods mentioned in Section 2 for future work."}, {"label": "text", "id": 3, "page_no": 5, "cluster": {"id": 3, "label": "text", "bbox": {"l": 317.64099, "t": 405.92953, "r": 558.4364, "b": 480.05716, "coord_origin": "TOPLEFT"}, "confidence": 0.9872915148735046, "cells": [{"id": 161, "text": "In this section, we will present several aspects related to the", "bbox": {"l": 327.918, "t": 405.92953, "r": 558.19836, "b": 414.30417, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "performance of object detection models on DocLayNet. Similarly", "bbox": {"l": 317.95499, "t": 416.88855, "r": 558.4364, "b": 425.26318, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "as in PubLayNet, we will evaluate the quality of their predictions", "bbox": {"l": 317.95499, "t": 427.84653, "r": 558.20563, "b": 436.22116, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "using mean average precision (mAP) with 10 overlaps that range", "bbox": {"l": 317.95499, "t": 438.80554, "r": 558.20044, "b": 447.18018, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "from 0.5 to 0.95 in steps of 0.05 (mAP@0.5-0.95). These scores are", "bbox": {"l": 317.95499, "t": 449.76453000000004, "r": 558.19891, "b": 458.13916, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "computed by leveraging the evaluation code provided by the COCO", "bbox": {"l": 317.95499, "t": 460.72354, "r": 558.20239, "b": 469.09818, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "API [16].", "bbox": {"l": 317.64099, "t": 471.68253, "r": 350.32352, "b": 480.05716, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In this section, we will present several aspects related to the performance of object detection models on DocLayNet. Similarly as in PubLayNet, we will evaluate the quality of their predictions using mean average precision (mAP) with 10 overlaps that range from 0.5 to 0.95 in steps of 0.05 (mAP@0.5-0.95). These scores are computed by leveraging the evaluation code provided by the COCO API [16]."}, {"label": "section_header", "id": 9, "page_no": 5, "cluster": {"id": 9, "label": "section_header", "bbox": {"l": 317.95499, "t": 496.8219, "r": 466.8532400000001, "b": 507.13098, "coord_origin": "TOPLEFT"}, "confidence": 0.9579005241394043, "cells": [{"id": 168, "text": "Baselines for Object Detection", "bbox": {"l": 317.95499, "t": 496.8219, "r": 466.8532400000001, "b": 507.13098, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Baselines for Object Detection"}, {"label": "text", "id": 1, "page_no": 5, "cluster": {"id": 1, "label": "text", "bbox": {"l": 317.74899, "t": 512.02454, "r": 558.43085, "b": 706.700172, "coord_origin": "TOPLEFT"}, "confidence": 0.987722635269165, "cells": [{"id": 169, "text": "In Table 2, we present baseline experiments (given in mAP) on Mask", "bbox": {"l": 317.95499, "t": 512.02454, "r": 558.43085, "b": 520.39917, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "R-CNN [12], Faster R-CNN [11], and YOLOv5 [13]. Both training", "bbox": {"l": 317.95499, "t": 522.9835499999999, "r": 558.20117, "b": 531.35818, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "and evaluation were performed on RGB images with dimensions of", "bbox": {"l": 317.95499, "t": 533.94254, "r": 558.20233, "b": 542.31717, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "1025", "bbox": {"l": 317.74899, "t": 544.90155, "r": 334.09296, "b": 553.27617, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "\u00d7", "bbox": {"l": 334.81201, "t": 544.84775, "r": 340.51465, "b": 552.5499, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "1025 pixels. For training, we only used one annotation in case", "bbox": {"l": 341.233, "t": 544.90155, "r": 558.20117, "b": 553.27617, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "of redundantly annotated pages. As one can observe, the variation", "bbox": {"l": 317.95499, "t": 555.85956, "r": 558.20392, "b": 564.23418, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "in mAP between the models is rather low, but overall between 6", "bbox": {"l": 317.95499, "t": 566.8185599999999, "r": 558.2041, "b": 575.19318, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "and 10% lower than the mAP computed from the pairwise human", "bbox": {"l": 317.95499, "t": 577.77756, "r": 558.2052, "b": 586.15218, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "annotations on triple-annotated pages. This gives a good indication", "bbox": {"l": 317.95499, "t": 588.73656, "r": 558.20233, "b": 597.11118, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "that the DocLayNet dataset poses a worthwhile challenge for the", "bbox": {"l": 317.95499, "t": 599.69556, "r": 558.1983, "b": 608.0701799999999, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "research community to close the gap between human recognition", "bbox": {"l": 317.95499, "t": 610.65456, "r": 558.20502, "b": 619.02917, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "and ML approaches. It is interesting to see that Mask R-CNN and", "bbox": {"l": 317.95499, "t": 621.61356, "r": 558.20337, "b": 629.98817, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "Faster R-CNN produce very comparable mAP scores, indicating", "bbox": {"l": 317.95499, "t": 632.5725600000001, "r": 558.2041, "b": 640.94717, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "that pixel-based image segmentation derived from bounding-boxes", "bbox": {"l": 317.95499, "t": 643.53156, "r": 558.20245, "b": 651.90617, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "does not help to obtain better predictions. On the other hand, the", "bbox": {"l": 317.95499, "t": 654.49055, "r": 558.19757, "b": 662.86517, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": "more recent Yolov5x model does very well and even out-performs", "bbox": {"l": 317.95499, "t": 665.44855, "r": 558.20404, "b": 673.82317, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "humans on selected labels such as", "bbox": {"l": 317.95499, "t": 676.40755, "r": 444.54102, "b": 684.78217, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "Text", "bbox": {"l": 446.78900000000004, "t": 676.45238, "r": 461.95261000000005, "b": 684.79114, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": ",", "bbox": {"l": 461.95599000000004, "t": 676.40755, "r": 463.96805000000006, "b": 684.78217, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "Table", "bbox": {"l": 466.2170100000001, "t": 676.45238, "r": 485.66998000000007, "b": 684.79114, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "and", "bbox": {"l": 488.1290000000001, "t": 676.40755, "r": 501.89330999999993, "b": 684.78217, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "Picture", "bbox": {"l": 504.142, "t": 676.45238, "r": 529.21954, "b": 684.79114, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": ". This is", "bbox": {"l": 529.22101, "t": 676.40755, "r": 558.20392, "b": 684.78217, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "not entirely surprising, as", "bbox": {"l": 317.95499, "t": 687.36655, "r": 410.81366, "b": 695.741173, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "Text", "bbox": {"l": 413.05301, "t": 687.41138, "r": 427.67865, "b": 695.750137, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": ",", "bbox": {"l": 427.67801, "t": 687.36655, "r": 429.62103, "b": 695.741173, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "Table", "bbox": {"l": 431.86099, "t": 687.41138, "r": 450.62881000000004, "b": 695.750137, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "and", "bbox": {"l": 453.082, "t": 687.36655, "r": 466.37402, "b": 695.741173, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "Picture", "bbox": {"l": 468.61499, "t": 687.41138, "r": 492.83208999999994, "b": 695.750137, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "are abundant and", "bbox": {"l": 495.28201, "t": 687.36655, "r": 558.2005, "b": 695.741173, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "the most visually distinctive in a document.", "bbox": {"l": 317.95499, "t": 698.325554, "r": 477.53903, "b": 706.700172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In Table 2, we present baseline experiments (given in mAP) on Mask R-CNN [12], Faster R-CNN [11], and YOLOv5 [13]. Both training and evaluation were performed on RGB images with dimensions of 1025 \u00d7 1025 pixels. For training, we only used one annotation in case of redundantly annotated pages. As one can observe, the variation in mAP between the models is rather low, but overall between 6 and 10% lower than the mAP computed from the pairwise human annotations on triple-annotated pages. This gives a good indication that the DocLayNet dataset poses a worthwhile challenge for the research community to close the gap between human recognition and ML approaches. It is interesting to see that Mask R-CNN and Faster R-CNN produce very comparable mAP scores, indicating that pixel-based image segmentation derived from bounding-boxes does not help to obtain better predictions. On the other hand, the more recent Yolov5x model does very well and even out-performs humans on selected labels such as Text , Table and Picture . This is not entirely surprising, as Text , Table and Picture are abundant and the most visually distinctive in a document."}], "body": [{"label": "text", "id": 5, "page_no": 5, "cluster": {"id": 5, "label": "text", "bbox": {"l": 53.501999, "t": 86.87292000000002, "r": 295.64874, "b": 183.01709000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9782760143280029, "cells": [{"id": 2, "text": "Table 2: Prediction performance (mAP@0.5-0.95) of object", "bbox": {"l": 53.501999, "t": 86.87292000000002, "r": 294.04361, "b": 95.34618999999998, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "detection networks on DocLayNet test set. The MRCNN", "bbox": {"l": 53.79800000000001, "t": 97.83191, "r": 294.04373, "b": 106.30517999999995, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "(Mask R-CNN) and FRCNN (Faster R-CNN) models with", "bbox": {"l": 53.52, "t": 108.79088999999999, "r": 294.0437, "b": 117.26415999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "ResNet-50 or ResNet-101 backbone were trained based on", "bbox": {"l": 53.79800000000001, "t": 119.74987999999996, "r": 294.04373, "b": 128.22313999999994, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "the network architectures from the", "bbox": {"l": 53.79800000000001, "t": 130.70885999999996, "r": 202.43402, "b": 139.18213000000003, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "detectron2", "bbox": {"l": 206.08501, "t": 130.71783000000005, "r": 247.14215000000002, "b": 139.20905000000005, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "model zoo", "bbox": {"l": 250.95001, "t": 130.70885999999996, "r": 294.04254, "b": 139.18213000000003, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "(Mask R-CNN R50, R101-FPN 3x, Faster R-CNN R101-FPN", "bbox": {"l": 53.52002, "t": 141.66785000000004, "r": 294.04367, "b": 150.14111000000003, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "3x), with default configurations. The YOLO implementation", "bbox": {"l": 53.798019, "t": 152.62683000000004, "r": 294.04373, "b": 161.1001, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "utilized was YOLOv5x6 [13]. All models were initialised us-", "bbox": {"l": 53.798019, "t": 163.58582, "r": 295.64874, "b": 172.05908, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "ing pre-trained weights from the COCO 2017 dataset.", "bbox": {"l": 53.798019, "t": 174.54381999999998, "r": 268.62399, "b": 183.01709000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 2: Prediction performance (mAP@0.5-0.95) of object detection networks on DocLayNet test set. The MRCNN (Mask R-CNN) and FRCNN (Faster R-CNN) models with ResNet-50 or ResNet-101 backbone were trained based on the network architectures from the detectron2 model zoo (Mask R-CNN R50, R101-FPN 3x, Faster R-CNN R101-FPN 3x), with default configurations. The YOLO implementation utilized was YOLOv5x6 [13]. All models were initialised using pre-trained weights from the COCO 2017 dataset."}, {"label": "table", "id": 0, "page_no": 5, "cluster": {"id": 0, "label": "table", "bbox": {"l": 62.02753829956055, "t": 195.68006896972656, "r": 285.78955078125, "b": 351.6618957519531, "coord_origin": "TOPLEFT"}, "confidence": 0.9883638620376587, "cells": [{"id": 13, "text": "human", "bbox": {"l": 132.36501, "t": 197.97351000000003, "r": 157.99098, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "MRCNN", "bbox": {"l": 173.505, "t": 197.97351000000003, "r": 204.61841, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "FRCNN", "bbox": {"l": 220.13028, "t": 197.97351000000003, "r": 248.06958, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "YOLO", "bbox": {"l": 258.03125, "t": 197.97351000000003, "r": 280.17825, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "R50", "bbox": {"l": 168.39301, "t": 208.93255999999997, "r": 181.99504, "b": 217.30719, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "R101", "bbox": {"l": 192.39606, "t": 208.93255999999997, "r": 210.16747, "b": 217.30719, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "R101", "bbox": {"l": 225.21309, "t": 208.93255999999997, "r": 242.9845, "b": 217.30719, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "v5x6", "bbox": {"l": 260.51379, "t": 208.93255999999997, "r": 277.70239, "b": 217.30719, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Caption", "bbox": {"l": 67.663002, "t": 220.28954999999996, "r": 96.848633, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "84-89", "bbox": {"l": 135.32401, "t": 220.28954999999996, "r": 155.03215, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "68.4", "bbox": {"l": 167.95399, "t": 220.28954999999996, "r": 182.43472, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "71.5", "bbox": {"l": 194.0462, "t": 220.28954999999996, "r": 208.52695, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "70.1", "bbox": {"l": 226.86324000000002, "t": 220.28954999999996, "r": 241.34396, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "77.7", "bbox": {"l": 261.86804, "t": 220.28954999999996, "r": 276.34879, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Footnote", "bbox": {"l": 67.663002, "t": 231.24854000000005, "r": 100.1662, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "83-91", "bbox": {"l": 135.32401, "t": 231.24854000000005, "r": 155.03215, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "70.9", "bbox": {"l": 167.95399, "t": 231.24854000000005, "r": 182.43472, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "71.8", "bbox": {"l": 194.0462, "t": 231.24854000000005, "r": 208.52695, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "73.7", "bbox": {"l": 226.86324000000002, "t": 231.24854000000005, "r": 241.34396, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "77.2", "bbox": {"l": 261.86804, "t": 231.24854000000005, "r": 276.34879, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "Formula", "bbox": {"l": 67.663002, "t": 242.20752000000005, "r": 98.175659, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "83-85", "bbox": {"l": 135.32401, "t": 242.20752000000005, "r": 155.03215, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "60.1", "bbox": {"l": 167.95399, "t": 242.20752000000005, "r": 182.43472, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "63.4", "bbox": {"l": 194.0462, "t": 242.20752000000005, "r": 208.52695, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "63.5", "bbox": {"l": 226.86324000000002, "t": 242.20752000000005, "r": 241.34396, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "66.2", "bbox": {"l": 261.86804, "t": 242.20752000000005, "r": 276.34879, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "List-item", "bbox": {"l": 67.663002, "t": 253.16656, "r": 100.54279, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "87-88", "bbox": {"l": 135.32401, "t": 253.16656, "r": 155.03215, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "81.2", "bbox": {"l": 167.95399, "t": 253.16656, "r": 182.43472, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "80.8", "bbox": {"l": 194.0462, "t": 253.16656, "r": 208.52695, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "81.0", "bbox": {"l": 226.86324000000002, "t": 253.16656, "r": 241.34396, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "86.2", "bbox": {"l": 261.86804, "t": 253.16656, "r": 276.34879, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Page-footer", "bbox": {"l": 67.663002, "t": 264.12555, "r": 110.19064, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "93-94", "bbox": {"l": 135.32401, "t": 264.12555, "r": 155.03215, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "61.6", "bbox": {"l": 167.95399, "t": 264.12555, "r": 182.43472, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "59.3", "bbox": {"l": 194.0462, "t": 264.12555, "r": 208.52695, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "58.9", "bbox": {"l": 226.86324000000002, "t": 264.12555, "r": 241.34396, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "61.1", "bbox": {"l": 261.86804, "t": 264.12555, "r": 276.34879, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Page-header", "bbox": {"l": 67.663002, "t": 275.08453, "r": 112.94331999999999, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "85-89", "bbox": {"l": 135.32401, "t": 275.08453, "r": 155.03215, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "71.9", "bbox": {"l": 167.95399, "t": 275.08453, "r": 182.43472, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "70.0", "bbox": {"l": 194.0462, "t": 275.08453, "r": 208.52695, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "72.0", "bbox": {"l": 226.86324000000002, "t": 275.08453, "r": 241.34396, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "67.9", "bbox": {"l": 261.86804, "t": 275.08453, "r": 276.34879, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Picture", "bbox": {"l": 67.663002, "t": 286.04355000000004, "r": 93.647629, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "69-71", "bbox": {"l": 135.32401, "t": 286.04355000000004, "r": 155.03215, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "71.7", "bbox": {"l": 167.95399, "t": 286.04355000000004, "r": 182.43472, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "72.7", "bbox": {"l": 194.0462, "t": 286.04355000000004, "r": 208.52695, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "72.0", "bbox": {"l": 226.86324000000002, "t": 286.04355000000004, "r": 241.34396, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "77.1", "bbox": {"l": 261.86804, "t": 286.04355000000004, "r": 276.34879, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "Section-header", "bbox": {"l": 67.663002, "t": 297.00253, "r": 122.40287999999998, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "83-84", "bbox": {"l": 135.32401, "t": 297.00253, "r": 155.03215, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "67.6", "bbox": {"l": 167.95399, "t": 297.00253, "r": 182.43472, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "69.3", "bbox": {"l": 194.0462, "t": 297.00253, "r": 208.52695, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "68.4", "bbox": {"l": 226.86324000000002, "t": 297.00253, "r": 241.34396, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "74.6", "bbox": {"l": 261.86804, "t": 297.00253, "r": 276.34879, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "Table", "bbox": {"l": 67.663002, "t": 307.96155, "r": 87.46978, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "77-81", "bbox": {"l": 135.32401, "t": 307.96155, "r": 155.03215, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "82.2", "bbox": {"l": 167.95399, "t": 307.96155, "r": 182.43472, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "82.9", "bbox": {"l": 194.0462, "t": 307.96155, "r": 208.52695, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "82.2", "bbox": {"l": 226.86324000000002, "t": 307.96155, "r": 241.34396, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "86.3", "bbox": {"l": 261.86804, "t": 307.96155, "r": 276.34879, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "Text", "bbox": {"l": 67.663002, "t": 318.91953, "r": 83.623199, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "84-86", "bbox": {"l": 135.32401, "t": 318.91953, "r": 155.03215, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "84.6", "bbox": {"l": 167.95399, "t": 318.91953, "r": 182.43472, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "85.8", "bbox": {"l": 194.0462, "t": 318.91953, "r": 208.52695, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "85.4", "bbox": {"l": 226.86324000000002, "t": 318.91953, "r": 241.34396, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "88.1", "bbox": {"l": 261.86804, "t": 318.91953, "r": 276.34879, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Title", "bbox": {"l": 67.663002, "t": 329.87854, "r": 84.654327, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "60-72", "bbox": {"l": 135.32401, "t": 329.87854, "r": 155.03215, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "76.7", "bbox": {"l": 167.95399, "t": 329.87854, "r": 182.43472, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "80.4", "bbox": {"l": 194.0462, "t": 329.87854, "r": 208.52695, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "79.9", "bbox": {"l": 226.86324000000002, "t": 329.87854, "r": 241.34396, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "82.7", "bbox": {"l": 261.86804, "t": 329.87854, "r": 276.34879, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "All", "bbox": {"l": 67.663002, "t": 341.23654, "r": 78.628906, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "82-83", "bbox": {"l": 135.32401, "t": 341.23654, "r": 155.03215, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "72.4", "bbox": {"l": 167.95399, "t": 341.23654, "r": 182.43472, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "73.5", "bbox": {"l": 194.0462, "t": 341.23654, "r": 208.52695, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "73.4", "bbox": {"l": 226.86324000000002, "t": 341.23654, "r": 241.34396, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "76.8", "bbox": {"l": 261.86804, "t": 341.23654, "r": 276.34879, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": [{"id": 12, "label": "text", "bbox": {"l": 132.36501, "t": 197.97351000000003, "r": 157.99098, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "human", "bbox": {"l": 132.36501, "t": 197.97351000000003, "r": 157.99098, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 173.505, "t": 197.97351000000003, "r": 204.61841, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "MRCNN", "bbox": {"l": 173.505, "t": 197.97351000000003, "r": 204.61841, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 220.13028, "t": 197.97351000000003, "r": 248.06958, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "FRCNN", "bbox": {"l": 220.13028, "t": 197.97351000000003, "r": 248.06958, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 258.03125, "t": 197.97351000000003, "r": 280.17825, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "YOLO", "bbox": {"l": 258.03125, "t": 197.97351000000003, "r": 280.17825, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 168.39301, "t": 208.93255999999997, "r": 181.99504, "b": 217.30719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "R50", "bbox": {"l": 168.39301, "t": 208.93255999999997, "r": 181.99504, "b": 217.30719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 192.39606, "t": 208.93255999999997, "r": 210.16747, "b": 217.30719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "R101", "bbox": {"l": 192.39606, "t": 208.93255999999997, "r": 210.16747, "b": 217.30719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 225.21309, "t": 208.93255999999997, "r": 242.9845, "b": 217.30719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "R101", "bbox": {"l": 225.21309, "t": 208.93255999999997, "r": 242.9845, "b": 217.30719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 260.51379, "t": 208.93255999999997, "r": 277.70239, "b": 217.30719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "v5x6", "bbox": {"l": 260.51379, "t": 208.93255999999997, "r": 277.70239, "b": 217.30719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 67.663002, "t": 220.28954999999996, "r": 96.848633, "b": 228.66418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "Caption", "bbox": {"l": 67.663002, "t": 220.28954999999996, "r": 96.848633, "b": 228.66418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 135.32401, "t": 220.28954999999996, "r": 155.03215, "b": 228.66418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "84-89", "bbox": {"l": 135.32401, "t": 220.28954999999996, "r": 155.03215, "b": 228.66418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 167.95399, "t": 220.28954999999996, "r": 182.43472, "b": 228.66418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "68.4", "bbox": {"l": 167.95399, "t": 220.28954999999996, "r": 182.43472, "b": 228.66418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 194.0462, "t": 220.28954999999996, "r": 208.52695, "b": 228.66418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "71.5", "bbox": {"l": 194.0462, "t": 220.28954999999996, "r": 208.52695, "b": 228.66418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 226.86324000000002, "t": 220.28954999999996, "r": 241.34396, "b": 228.66418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "70.1", "bbox": {"l": 226.86324000000002, "t": 220.28954999999996, "r": 241.34396, "b": 228.66418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 261.86804, "t": 220.28954999999996, "r": 276.34879, "b": 228.66418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "77.7", "bbox": {"l": 261.86804, "t": 220.28954999999996, "r": 276.34879, "b": 228.66418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 67.663002, "t": 231.24854000000005, "r": 100.1662, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "Footnote", "bbox": {"l": 67.663002, "t": 231.24854000000005, "r": 100.1662, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 135.32401, "t": 231.24854000000005, "r": 155.03215, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "83-91", "bbox": {"l": 135.32401, "t": 231.24854000000005, "r": 155.03215, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 167.95399, "t": 231.24854000000005, "r": 182.43472, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "70.9", "bbox": {"l": 167.95399, "t": 231.24854000000005, "r": 182.43472, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 194.0462, "t": 231.24854000000005, "r": 208.52695, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "71.8", "bbox": {"l": 194.0462, "t": 231.24854000000005, "r": 208.52695, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 226.86324000000002, "t": 231.24854000000005, "r": 241.34396, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "73.7", "bbox": {"l": 226.86324000000002, "t": 231.24854000000005, "r": 241.34396, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 261.86804, "t": 231.24854000000005, "r": 276.34879, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "77.2", "bbox": {"l": 261.86804, "t": 231.24854000000005, "r": 276.34879, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 67.663002, "t": 242.20752000000005, "r": 98.175659, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "Formula", "bbox": {"l": 67.663002, "t": 242.20752000000005, "r": 98.175659, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 135.32401, "t": 242.20752000000005, "r": 155.03215, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "83-85", "bbox": {"l": 135.32401, "t": 242.20752000000005, "r": 155.03215, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 167.95399, "t": 242.20752000000005, "r": 182.43472, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "60.1", "bbox": {"l": 167.95399, "t": 242.20752000000005, "r": 182.43472, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 194.0462, "t": 242.20752000000005, "r": 208.52695, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "63.4", "bbox": {"l": 194.0462, "t": 242.20752000000005, "r": 208.52695, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 226.86324000000002, "t": 242.20752000000005, "r": 241.34396, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "63.5", "bbox": {"l": 226.86324000000002, "t": 242.20752000000005, "r": 241.34396, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 261.86804, "t": 242.20752000000005, "r": 276.34879, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "66.2", "bbox": {"l": 261.86804, "t": 242.20752000000005, "r": 276.34879, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 67.663002, "t": 253.16656, "r": 100.54279, "b": 261.5412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "List-item", "bbox": {"l": 67.663002, "t": 253.16656, "r": 100.54279, "b": 261.5412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 135.32401, "t": 253.16656, "r": 155.03215, "b": 261.5412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "87-88", "bbox": {"l": 135.32401, "t": 253.16656, "r": 155.03215, "b": 261.5412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 167.95399, "t": 253.16656, "r": 182.43472, "b": 261.5412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "81.2", "bbox": {"l": 167.95399, "t": 253.16656, "r": 182.43472, "b": 261.5412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 194.0462, "t": 253.16656, "r": 208.52695, "b": 261.5412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "80.8", "bbox": {"l": 194.0462, "t": 253.16656, "r": 208.52695, "b": 261.5412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 226.86324000000002, "t": 253.16656, "r": 241.34396, "b": 261.5412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "81.0", "bbox": {"l": 226.86324000000002, "t": 253.16656, "r": 241.34396, "b": 261.5412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 261.86804, "t": 253.16656, "r": 276.34879, "b": 261.5412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "86.2", "bbox": {"l": 261.86804, "t": 253.16656, "r": 276.34879, "b": 261.5412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 67.663002, "t": 264.12555, "r": 110.19064, "b": 272.50018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "Page-footer", "bbox": {"l": 67.663002, "t": 264.12555, "r": 110.19064, "b": 272.50018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 135.32401, "t": 264.12555, "r": 155.03215, "b": 272.50018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "93-94", "bbox": {"l": 135.32401, "t": 264.12555, "r": 155.03215, "b": 272.50018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 167.95399, "t": 264.12555, "r": 182.43472, "b": 272.50018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "61.6", "bbox": {"l": 167.95399, "t": 264.12555, "r": 182.43472, "b": 272.50018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 194.0462, "t": 264.12555, "r": 208.52695, "b": 272.50018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "59.3", "bbox": {"l": 194.0462, "t": 264.12555, "r": 208.52695, "b": 272.50018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 226.86324000000002, "t": 264.12555, "r": 241.34396, "b": 272.50018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "58.9", "bbox": {"l": 226.86324000000002, "t": 264.12555, "r": 241.34396, "b": 272.50018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 261.86804, "t": 264.12555, "r": 276.34879, "b": 272.50018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "61.1", "bbox": {"l": 261.86804, "t": 264.12555, "r": 276.34879, "b": 272.50018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 67.663002, "t": 275.08453, "r": 112.94331999999999, "b": 283.45917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "Page-header", "bbox": {"l": 67.663002, "t": 275.08453, "r": 112.94331999999999, "b": 283.45917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 135.32401, "t": 275.08453, "r": 155.03215, "b": 283.45917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "85-89", "bbox": {"l": 135.32401, "t": 275.08453, "r": 155.03215, "b": 283.45917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 167.95399, "t": 275.08453, "r": 182.43472, "b": 283.45917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "71.9", "bbox": {"l": 167.95399, "t": 275.08453, "r": 182.43472, "b": 283.45917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 194.0462, "t": 275.08453, "r": 208.52695, "b": 283.45917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "70.0", "bbox": {"l": 194.0462, "t": 275.08453, "r": 208.52695, "b": 283.45917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 226.86324000000002, "t": 275.08453, "r": 241.34396, "b": 283.45917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "72.0", "bbox": {"l": 226.86324000000002, "t": 275.08453, "r": 241.34396, "b": 283.45917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 261.86804, "t": 275.08453, "r": 276.34879, "b": 283.45917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "67.9", "bbox": {"l": 261.86804, "t": 275.08453, "r": 276.34879, "b": 283.45917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 67.663002, "t": 286.04355000000004, "r": 93.647629, "b": 294.41818, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "Picture", "bbox": {"l": 67.663002, "t": 286.04355000000004, "r": 93.647629, "b": 294.41818, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 135.32401, "t": 286.04355000000004, "r": 155.03215, "b": 294.41818, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "69-71", "bbox": {"l": 135.32401, "t": 286.04355000000004, "r": 155.03215, "b": 294.41818, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 167.95399, "t": 286.04355000000004, "r": 182.43472, "b": 294.41818, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "71.7", "bbox": {"l": 167.95399, "t": 286.04355000000004, "r": 182.43472, "b": 294.41818, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 194.0462, "t": 286.04355000000004, "r": 208.52695, "b": 294.41818, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "72.7", "bbox": {"l": 194.0462, "t": 286.04355000000004, "r": 208.52695, "b": 294.41818, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 226.86324000000002, "t": 286.04355000000004, "r": 241.34396, "b": 294.41818, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "72.0", "bbox": {"l": 226.86324000000002, "t": 286.04355000000004, "r": 241.34396, "b": 294.41818, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 261.86804, "t": 286.04355000000004, "r": 276.34879, "b": 294.41818, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "77.1", "bbox": {"l": 261.86804, "t": 286.04355000000004, "r": 276.34879, "b": 294.41818, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 67.663002, "t": 297.00253, "r": 122.40287999999998, "b": 305.37717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "Section-header", "bbox": {"l": 67.663002, "t": 297.00253, "r": 122.40287999999998, "b": 305.37717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 135.32401, "t": 297.00253, "r": 155.03215, "b": 305.37717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "83-84", "bbox": {"l": 135.32401, "t": 297.00253, "r": 155.03215, "b": 305.37717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 167.95399, "t": 297.00253, "r": 182.43472, "b": 305.37717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "67.6", "bbox": {"l": 167.95399, "t": 297.00253, "r": 182.43472, "b": 305.37717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 194.0462, "t": 297.00253, "r": 208.52695, "b": 305.37717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "69.3", "bbox": {"l": 194.0462, "t": 297.00253, "r": 208.52695, "b": 305.37717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 226.86324000000002, "t": 297.00253, "r": 241.34396, "b": 305.37717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "68.4", "bbox": {"l": 226.86324000000002, "t": 297.00253, "r": 241.34396, "b": 305.37717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 261.86804, "t": 297.00253, "r": 276.34879, "b": 305.37717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "74.6", "bbox": {"l": 261.86804, "t": 297.00253, "r": 276.34879, "b": 305.37717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 67.663002, "t": 307.96155, "r": 87.46978, "b": 316.33618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "Table", "bbox": {"l": 67.663002, "t": 307.96155, "r": 87.46978, "b": 316.33618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 135.32401, "t": 307.96155, "r": 155.03215, "b": 316.33618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "77-81", "bbox": {"l": 135.32401, "t": 307.96155, "r": 155.03215, "b": 316.33618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 167.95399, "t": 307.96155, "r": 182.43472, "b": 316.33618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "82.2", "bbox": {"l": 167.95399, "t": 307.96155, "r": 182.43472, "b": 316.33618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 194.0462, "t": 307.96155, "r": 208.52695, "b": 316.33618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "82.9", "bbox": {"l": 194.0462, "t": 307.96155, "r": 208.52695, "b": 316.33618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 226.86324000000002, "t": 307.96155, "r": 241.34396, "b": 316.33618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "82.2", "bbox": {"l": 226.86324000000002, "t": 307.96155, "r": 241.34396, "b": 316.33618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 261.86804, "t": 307.96155, "r": 276.34879, "b": 316.33618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "86.3", "bbox": {"l": 261.86804, "t": 307.96155, "r": 276.34879, "b": 316.33618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 67.663002, "t": 318.91953, "r": 83.623199, "b": 327.29416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "Text", "bbox": {"l": 67.663002, "t": 318.91953, "r": 83.623199, "b": 327.29416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 135.32401, "t": 318.91953, "r": 155.03215, "b": 327.29416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "84-86", "bbox": {"l": 135.32401, "t": 318.91953, "r": 155.03215, "b": 327.29416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 167.95399, "t": 318.91953, "r": 182.43472, "b": 327.29416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "84.6", "bbox": {"l": 167.95399, "t": 318.91953, "r": 182.43472, "b": 327.29416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 194.0462, "t": 318.91953, "r": 208.52695, "b": 327.29416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "85.8", "bbox": {"l": 194.0462, "t": 318.91953, "r": 208.52695, "b": 327.29416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 226.86324000000002, "t": 318.91953, "r": 241.34396, "b": 327.29416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "85.4", "bbox": {"l": 226.86324000000002, "t": 318.91953, "r": 241.34396, "b": 327.29416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 261.86804, "t": 318.91953, "r": 276.34879, "b": 327.29416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "88.1", "bbox": {"l": 261.86804, "t": 318.91953, "r": 276.34879, "b": 327.29416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 67.663002, "t": 329.87854, "r": 84.654327, "b": 338.25317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "Title", "bbox": {"l": 67.663002, "t": 329.87854, "r": 84.654327, "b": 338.25317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 135.32401, "t": 329.87854, "r": 155.03215, "b": 338.25317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "60-72", "bbox": {"l": 135.32401, "t": 329.87854, "r": 155.03215, "b": 338.25317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 167.95399, "t": 329.87854, "r": 182.43472, "b": 338.25317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "76.7", "bbox": {"l": 167.95399, "t": 329.87854, "r": 182.43472, "b": 338.25317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 194.0462, "t": 329.87854, "r": 208.52695, "b": 338.25317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "80.4", "bbox": {"l": 194.0462, "t": 329.87854, "r": 208.52695, "b": 338.25317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 226.86324000000002, "t": 329.87854, "r": 241.34396, "b": 338.25317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "79.9", "bbox": {"l": 226.86324000000002, "t": 329.87854, "r": 241.34396, "b": 338.25317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 261.86804, "t": 329.87854, "r": 276.34879, "b": 338.25317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "82.7", "bbox": {"l": 261.86804, "t": 329.87854, "r": 276.34879, "b": 338.25317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 67.663002, "t": 341.23654, "r": 78.628906, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "All", "bbox": {"l": 67.663002, "t": 341.23654, "r": 78.628906, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 135.32401, "t": 341.23654, "r": 155.03215, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "82-83", "bbox": {"l": 135.32401, "t": 341.23654, "r": 155.03215, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 167.95399, "t": 341.23654, "r": 182.43472, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "72.4", "bbox": {"l": 167.95399, "t": 341.23654, "r": 182.43472, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 194.0462, "t": 341.23654, "r": 208.52695, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "73.5", "bbox": {"l": 194.0462, "t": 341.23654, "r": 208.52695, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 226.86324000000002, "t": 341.23654, "r": 241.34396, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "73.4", "bbox": {"l": 226.86324000000002, "t": 341.23654, "r": 241.34396, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 261.86804, "t": 341.23654, "r": 276.34879, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "76.8", "bbox": {"l": 261.86804, "t": 341.23654, "r": 276.34879, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ecel", "ched", "ched", "lcel", "ched", "ched", "nl", "ecel", "ucel", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 14, "num_cols": 6, "table_cells": [{"bbox": {"l": 132.36501, "t": 197.97351000000003, "r": 157.99098, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "human", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 173.505, "t": 197.97351000000003, "r": 204.61841, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 4, "text": "MRCNN", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 220.13028, "t": 197.97351000000003, "r": 248.06958, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "FRCNN", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 258.03125, "t": 197.97351000000003, "r": 280.17825, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "YOLO", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 168.39301, "t": 208.93255999999997, "r": 181.99504, "b": 217.30719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "R50", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 192.39606, "t": 208.93255999999997, "r": 210.16747, "b": 217.30719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "R101", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 225.21309, "t": 208.93255999999997, "r": 242.9845, "b": 217.30719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "R101", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 260.51379, "t": 208.93255999999997, "r": 277.70239, "b": 217.30719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "v5x6", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 220.28954999999996, "r": 96.848633, "b": 228.66418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Caption", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 220.28954999999996, "r": 155.03215, "b": 228.66418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "84-89", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 220.28954999999996, "r": 182.43472, "b": 228.66418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "68.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 220.28954999999996, "r": 208.52695, "b": 228.66418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "71.5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 220.28954999999996, "r": 241.34396, "b": 228.66418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "70.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 220.28954999999996, "r": 276.34879, "b": 228.66418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "77.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 231.24854000000005, "r": 100.1662, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Footnote", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 231.24854000000005, "r": 155.03215, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "83-91", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 231.24854000000005, "r": 182.43472, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "70.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 231.24854000000005, "r": 208.52695, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "71.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 231.24854000000005, "r": 241.34396, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "73.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 231.24854000000005, "r": 276.34879, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "77.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 242.20752000000005, "r": 98.175659, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Formula", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 242.20752000000005, "r": 155.03215, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "83-85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 242.20752000000005, "r": 182.43472, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "60.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 242.20752000000005, "r": 208.52695, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "63.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 242.20752000000005, "r": 241.34396, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "63.5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 242.20752000000005, "r": 276.34879, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "66.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 253.16656, "r": 100.54279, "b": 261.5412, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "List-item", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 253.16656, "r": 155.03215, "b": 261.5412, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "87-88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 253.16656, "r": 182.43472, "b": 261.5412, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "81.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 253.16656, "r": 208.52695, "b": 261.5412, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "80.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 253.16656, "r": 241.34396, "b": 261.5412, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "81.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 253.16656, "r": 276.34879, "b": 261.5412, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "86.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 264.12555, "r": 110.19064, "b": 272.50018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-footer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 264.12555, "r": 155.03215, "b": 272.50018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "93-94", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 264.12555, "r": 182.43472, "b": 272.50018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "61.6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 264.12555, "r": 208.52695, "b": 272.50018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "59.3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 264.12555, "r": 241.34396, "b": 272.50018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "58.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 264.12555, "r": 276.34879, "b": 272.50018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "61.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 275.08453, "r": 112.94331999999999, "b": 283.45917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 275.08453, "r": 155.03215, "b": 283.45917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "85-89", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 275.08453, "r": 182.43472, "b": 283.45917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "71.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 275.08453, "r": 208.52695, "b": 283.45917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "70.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 275.08453, "r": 241.34396, "b": 283.45917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "72.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 275.08453, "r": 276.34879, "b": 283.45917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "67.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 286.04355000000004, "r": 93.647629, "b": 294.41818, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Picture", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 286.04355000000004, "r": 155.03215, "b": 294.41818, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "69-71", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 286.04355000000004, "r": 182.43472, "b": 294.41818, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "71.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 286.04355000000004, "r": 208.52695, "b": 294.41818, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "72.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 286.04355000000004, "r": 241.34396, "b": 294.41818, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "72.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 286.04355000000004, "r": 276.34879, "b": 294.41818, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "77.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 297.00253, "r": 122.40287999999998, "b": 305.37717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Section-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 297.00253, "r": 155.03215, "b": 305.37717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "83-84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 297.00253, "r": 182.43472, "b": 305.37717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "67.6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 297.00253, "r": 208.52695, "b": 305.37717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "69.3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 297.00253, "r": 241.34396, "b": 305.37717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "68.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 297.00253, "r": 276.34879, "b": 305.37717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "74.6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 307.96155, "r": 87.46978, "b": 316.33618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 307.96155, "r": 155.03215, "b": 316.33618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "77-81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 307.96155, "r": 182.43472, "b": 316.33618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "82.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 307.96155, "r": 208.52695, "b": 316.33618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "82.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 307.96155, "r": 241.34396, "b": 316.33618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "82.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 307.96155, "r": 276.34879, "b": 316.33618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "86.3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 318.91953, "r": 83.623199, "b": 327.29416, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Text", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 318.91953, "r": 155.03215, "b": 327.29416, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "84-86", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 318.91953, "r": 182.43472, "b": 327.29416, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "84.6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 318.91953, "r": 208.52695, "b": 327.29416, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "85.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 318.91953, "r": 241.34396, "b": 327.29416, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "85.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 318.91953, "r": 276.34879, "b": 327.29416, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "88.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 329.87854, "r": 84.654327, "b": 338.25317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Title", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 329.87854, "r": 155.03215, "b": 338.25317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "60-72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 329.87854, "r": 182.43472, "b": 338.25317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "76.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 329.87854, "r": 208.52695, "b": 338.25317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "80.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 329.87854, "r": 241.34396, "b": 338.25317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "79.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 329.87854, "r": 276.34879, "b": 338.25317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "82.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 341.23654, "r": 78.628906, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "All", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 341.23654, "r": 155.03215, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "82-83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 341.23654, "r": 182.43472, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "72.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 341.23654, "r": 208.52695, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "73.5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 341.23654, "r": 241.34396, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "73.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 341.23654, "r": 276.34879, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "76.8", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "text", "id": 4, "page_no": 5, "cluster": {"id": 4, "label": "text", "bbox": {"l": 53.528999, "t": 370.92755, "r": 295.55612, "b": 576.56317, "coord_origin": "TOPLEFT"}, "confidence": 0.9866557121276855, "cells": [{"id": 93, "text": "to avoid this at any cost in order to have clear, unbiased baseline", "bbox": {"l": 53.79800000000001, "t": 370.92755, "r": 294.04712, "b": 379.30219000000005, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "numbers for human document-layout annotation. Third, we in-", "bbox": {"l": 53.79800000000001, "t": 381.88654, "r": 295.55612, "b": 390.26117, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "troduced the feature of", "bbox": {"l": 53.79800000000001, "t": 392.84555, "r": 140.3623, "b": 401.22017999999997, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "snapping", "bbox": {"l": 142.99001, "t": 392.89041, "r": 175.9695, "b": 401.2291599999999, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "boxes around text segments to", "bbox": {"l": 178.951, "t": 392.84555, "r": 294.04083, "b": 401.22017999999997, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "obtain a pixel-accurate annotation and again reduce time and effort.", "bbox": {"l": 53.79800000000001, "t": 403.80453, "r": 295.42493, "b": 412.17917, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "The CCS annotation tool automatically shrinks every user-drawn", "bbox": {"l": 53.528999, "t": 414.76355, "r": 294.04251, "b": 423.13818, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "box to the minimum bounding-box around the enclosed text-cells", "bbox": {"l": 53.79800000000001, "t": 425.72253, "r": 294.04807, "b": 434.09717, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "for all purely text-based segments, which excludes only", "bbox": {"l": 53.79800000000001, "t": 436.6815500000001, "r": 256.80627, "b": 445.0561799999999, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "Table", "bbox": {"l": 259.04199, "t": 436.72641, "r": 278.10455, "b": 445.06516, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "and", "bbox": {"l": 280.54999, "t": 436.6815500000001, "r": 294.04443, "b": 445.0561799999999, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "Picture", "bbox": {"l": 53.79800000000001, "t": 447.68539, "r": 78.875587, "b": 456.02413999999993, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": ". For the latter, we instructed annotation staff to minimise", "bbox": {"l": 78.876999, "t": 447.64053, "r": 294.04852, "b": 456.01517, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "inclusion of surrounding whitespace while including all graphical", "bbox": {"l": 53.79800000000001, "t": 458.59955, "r": 294.04645, "b": 466.97418, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "lines. A downside of snapping boxes to enclosed text cells is that", "bbox": {"l": 53.79800000000001, "t": 469.55853, "r": 294.0416, "b": 477.93317, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "some wrongly parsed PDF pages cannot be annotated correctly and", "bbox": {"l": 53.79800000000001, "t": 480.51654, "r": 294.04538, "b": 488.89117, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "need to be skipped. Fourth, we established a way to flag pages as", "bbox": {"l": 53.79800000000001, "t": 491.47552, "r": 294.04312, "b": 499.85016, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "rejected", "bbox": {"l": 53.79800000000001, "t": 502.4794, "r": 80.597939, "b": 510.81815, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "for cases where no valid annotation according to the label", "bbox": {"l": 83.366997, "t": 502.43454, "r": 294.04483, "b": 510.80917, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "guidelines could be achieved. Example cases for this would be PDF", "bbox": {"l": 53.79800000000001, "t": 513.3935200000001, "r": 294.25833, "b": 521.7681600000001, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "pages that render incorrectly or contain layouts that are impossible", "bbox": {"l": 53.79800000000001, "t": 524.35254, "r": 294.04535, "b": 532.72717, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "to capture with non-overlapping rectangles. Such rejected pages are", "bbox": {"l": 53.79800000000001, "t": 535.31155, "r": 294.04535, "b": 543.68617, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "not contained in the final dataset. With all these measures in place,", "bbox": {"l": 53.79800000000001, "t": 546.27055, "r": 295.02759, "b": 554.64517, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "experienced annotation staff managed to annotate a single page in", "bbox": {"l": 53.79800000000001, "t": 557.22955, "r": 294.0488, "b": 565.6041700000001, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "a typical timeframe of 20s to 60s, depending on its complexity.", "bbox": {"l": 53.79800000000001, "t": 568.18855, "r": 281.80457, "b": 576.56317, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "to avoid this at any cost in order to have clear, unbiased baseline numbers for human document-layout annotation. Third, we introduced the feature of snapping boxes around text segments to obtain a pixel-accurate annotation and again reduce time and effort. The CCS annotation tool automatically shrinks every user-drawn box to the minimum bounding-box around the enclosed text-cells for all purely text-based segments, which excludes only Table and Picture . For the latter, we instructed annotation staff to minimise inclusion of surrounding whitespace while including all graphical lines. A downside of snapping boxes to enclosed text cells is that some wrongly parsed PDF pages cannot be annotated correctly and need to be skipped. Fourth, we established a way to flag pages as rejected for cases where no valid annotation according to the label guidelines could be achieved. Example cases for this would be PDF pages that render incorrectly or contain layouts that are impossible to capture with non-overlapping rectangles. Such rejected pages are not contained in the final dataset. With all these measures in place, experienced annotation staff managed to annotate a single page in a typical timeframe of 20s to 60s, depending on its complexity."}, {"label": "section_header", "id": 10, "page_no": 5, "cluster": {"id": 10, "label": "section_header", "bbox": {"l": 53.79800000000001, "t": 588.12991, "r": 147.48535, "b": 598.43901, "coord_origin": "TOPLEFT"}, "confidence": 0.9419495463371277, "cells": [{"id": 118, "text": "5", "bbox": {"l": 53.79800000000001, "t": 588.12991, "r": 59.405277, "b": 598.43901, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "EXPERIMENTS", "bbox": {"l": 70.314377, "t": 588.12991, "r": 147.48535, "b": 598.43901, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5 EXPERIMENTS"}, {"label": "text", "id": 2, "page_no": 5, "cluster": {"id": 2, "label": "text", "bbox": {"l": 53.484001, "t": 613.25356, "r": 295.4281, "b": 709.299171, "coord_origin": "TOPLEFT"}, "confidence": 0.987605094909668, "cells": [{"id": 120, "text": "The primary goal of DocLayNet is to obtain high-quality ML models", "bbox": {"l": 53.528999, "t": 613.25356, "r": 294.04871, "b": 621.6281700000001, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "capable of accurate document-layout analysis on a wide variety", "bbox": {"l": 53.79800000000001, "t": 624.21255, "r": 294.27576, "b": 632.58717, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "of challenging layouts. As discussed in Section 2, object detection", "bbox": {"l": 53.79800000000001, "t": 635.17155, "r": 294.04144, "b": 643.54617, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "models are currently the easiest to use, due to the standardisation", "bbox": {"l": 53.79800000000001, "t": 646.13055, "r": 294.04163, "b": 654.50517, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "of ground-truth data in COCO format [16] and the availability of", "bbox": {"l": 53.79800000000001, "t": 657.0885499999999, "r": 294.0412, "b": 665.46317, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "general frameworks such as", "bbox": {"l": 53.79800000000001, "t": 668.04755, "r": 155.01054, "b": 676.42217, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "detectron2", "bbox": {"l": 157.23599, "t": 668.09238, "r": 193.26666, "b": 676.43114, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "[17]. Furthermore, baseline", "bbox": {"l": 195.867, "t": 668.04755, "r": 294.0473, "b": 676.42217, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "numbers in PubLayNet and DocBank were obtained using standard", "bbox": {"l": 53.79800000000001, "t": 679.0065500000001, "r": 294.04538, "b": 687.38117, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "object detection models such as Mask R-CNN and Faster R-CNN.", "bbox": {"l": 53.79800000000001, "t": 689.96555, "r": 295.4281, "b": 698.3401719999999, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "As such, we will relate to these object detection methods in this", "bbox": {"l": 53.484001, "t": 700.9245530000001, "r": 294.04413, "b": 709.299171, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The primary goal of DocLayNet is to obtain high-quality ML models capable of accurate document-layout analysis on a wide variety of challenging layouts. As discussed in Section 2, object detection models are currently the easiest to use, due to the standardisation of ground-truth data in COCO format [16] and the availability of general frameworks such as detectron2 [17]. Furthermore, baseline numbers in PubLayNet and DocBank were obtained using standard object detection models such as Mask R-CNN and Faster R-CNN. As such, we will relate to these object detection methods in this"}, {"label": "picture", "id": 6, "page_no": 5, "cluster": {"id": 6, "label": "picture", "bbox": {"l": 323.48431396484375, "t": 89.88603210449219, "r": 553.5411376953125, "b": 260.0107727050781, "coord_origin": "TOPLEFT"}, "confidence": 0.9782691597938538, "cells": [{"id": 131, "text": "0", "bbox": {"l": 349.16577, "t": 246.68017999999995, "r": 352.48175, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "20", "bbox": {"l": 385.93698, "t": 246.68017999999995, "r": 392.56894, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "40", "bbox": {"l": 424.366, "t": 246.68017999999995, "r": 430.99796, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "60", "bbox": {"l": 462.79504000000003, "t": 246.68017999999995, "r": 469.427, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "80", "bbox": {"l": 501.22406, "t": 246.68017999999995, "r": 507.85602, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "100", "bbox": {"l": 537.99524, "t": 246.68017999999995, "r": 547.94318, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "% of DocLayNet training set", "bbox": {"l": 410.28143, "t": 253.80840999999998, "r": 483.47278000000006, "b": 259.88251, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "50", "bbox": {"l": 330.93539, "t": 218.38464, "r": 337.56735, "b": 224.45874000000003, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "55", "bbox": {"l": 330.93539, "t": 192.08660999999995, "r": 337.56735, "b": 198.16071, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "60", "bbox": {"l": 330.93539, "t": 165.78864, "r": 337.56735, "b": 171.86273000000006, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "65", "bbox": {"l": 330.93539, "t": 139.49059999999997, "r": 337.56735, "b": 145.56470000000002, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "70", "bbox": {"l": 330.93539, "t": 113.19263000000001, "r": 337.56735, "b": 119.26671999999996, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "mAP 0.50:0.95", "bbox": {"l": 322.92276, "t": 148.37689, "r": 328.99686, "b": 186.79218000000003, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "10", "bbox": {"l": 470.97235, "t": 235.36676, "r": 477.6055, "b": 241.44086000000004, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "1", "bbox": {"l": 477.65662, "t": 234.82390999999996, "r": 479.97778000000005, "b": 239.07581000000005, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "10", "bbox": {"l": 531.55127, "t": 235.41234999999995, "r": 538.18445, "b": 241.48645, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "2", "bbox": {"l": 538.23553, "t": 234.86951, "r": 540.5567, "b": 239.1214, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "50", "bbox": {"l": 404.91125, "t": 216.00005999999996, "r": 411.54321, "b": 222.07416, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "55", "bbox": {"l": 404.91125, "t": 200.22125000000005, "r": 411.54321, "b": 206.29534999999998, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "60", "bbox": {"l": 404.91125, "t": 184.44244000000003, "r": 411.54321, "b": 190.51653999999996, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "65", "bbox": {"l": 404.91125, "t": 168.66364, "r": 411.54321, "b": 174.73773000000006, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "70", "bbox": {"l": 404.91125, "t": 152.88489000000004, "r": 411.54321, "b": 158.95898, "coord_origin": "TOPLEFT"}}], "children": [{"id": 92, "label": "text", "bbox": {"l": 349.16577, "t": 246.68017999999995, "r": 352.48175, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 131, "text": "0", "bbox": {"l": 349.16577, "t": 246.68017999999995, "r": 352.48175, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 385.93698, "t": 246.68017999999995, "r": 392.56894, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 132, "text": "20", "bbox": {"l": 385.93698, "t": 246.68017999999995, "r": 392.56894, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 424.366, "t": 246.68017999999995, "r": 430.99796, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 133, "text": "40", "bbox": {"l": 424.366, "t": 246.68017999999995, "r": 430.99796, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 462.79504000000003, "t": 246.68017999999995, "r": 469.427, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 134, "text": "60", "bbox": {"l": 462.79504000000003, "t": 246.68017999999995, "r": 469.427, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 501.22406, "t": 246.68017999999995, "r": 507.85602, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 135, "text": "80", "bbox": {"l": 501.22406, "t": 246.68017999999995, "r": 507.85602, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 537.99524, "t": 246.68017999999995, "r": 547.94318, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 136, "text": "100", "bbox": {"l": 537.99524, "t": 246.68017999999995, "r": 547.94318, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 410.28143, "t": 253.80840999999998, "r": 483.47278000000006, "b": 259.88251, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 137, "text": "% of DocLayNet training set", "bbox": {"l": 410.28143, "t": 253.80840999999998, "r": 483.47278000000006, "b": 259.88251, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 330.93539, "t": 218.38464, "r": 337.56735, "b": 224.45874000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 138, "text": "50", "bbox": {"l": 330.93539, "t": 218.38464, "r": 337.56735, "b": 224.45874000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 330.93539, "t": 192.08660999999995, "r": 337.56735, "b": 198.16071, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 139, "text": "55", "bbox": {"l": 330.93539, "t": 192.08660999999995, "r": 337.56735, "b": 198.16071, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 330.93539, "t": 165.78864, "r": 337.56735, "b": 171.86273000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 140, "text": "60", "bbox": {"l": 330.93539, "t": 165.78864, "r": 337.56735, "b": 171.86273000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 330.93539, "t": 139.49059999999997, "r": 337.56735, "b": 145.56470000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 141, "text": "65", "bbox": {"l": 330.93539, "t": 139.49059999999997, "r": 337.56735, "b": 145.56470000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 330.93539, "t": 113.19263000000001, "r": 337.56735, "b": 119.26671999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 142, "text": "70", "bbox": {"l": 330.93539, "t": 113.19263000000001, "r": 337.56735, "b": 119.26671999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 322.92276, "t": 148.37689, "r": 328.99686, "b": 186.79218000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 143, "text": "mAP 0.50:0.95", "bbox": {"l": 322.92276, "t": 148.37689, "r": 328.99686, "b": 186.79218000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 470.97235, "t": 235.36676, "r": 477.6055, "b": 241.44086000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 144, "text": "10", "bbox": {"l": 470.97235, "t": 235.36676, "r": 477.6055, "b": 241.44086000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 477.65662, "t": 234.82390999999996, "r": 479.97778000000005, "b": 239.07581000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 145, "text": "1", "bbox": {"l": 477.65662, "t": 234.82390999999996, "r": 479.97778000000005, "b": 239.07581000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 531.55127, "t": 235.41234999999995, "r": 538.18445, "b": 241.48645, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 146, "text": "10", "bbox": {"l": 531.55127, "t": 235.41234999999995, "r": 538.18445, "b": 241.48645, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 538.23553, "t": 234.86951, "r": 540.5567, "b": 239.1214, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 147, "text": "2", "bbox": {"l": 538.23553, "t": 234.86951, "r": 540.5567, "b": 239.1214, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 404.91125, "t": 216.00005999999996, "r": 411.54321, "b": 222.07416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 148, "text": "50", "bbox": {"l": 404.91125, "t": 216.00005999999996, "r": 411.54321, "b": 222.07416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 404.91125, "t": 200.22125000000005, "r": 411.54321, "b": 206.29534999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 149, "text": "55", "bbox": {"l": 404.91125, "t": 200.22125000000005, "r": 411.54321, "b": 206.29534999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 404.91125, "t": 184.44244000000003, "r": 411.54321, "b": 190.51653999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 150, "text": "60", "bbox": {"l": 404.91125, "t": 184.44244000000003, "r": 411.54321, "b": 190.51653999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 404.91125, "t": 168.66364, "r": 411.54321, "b": 174.73773000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 151, "text": "65", "bbox": {"l": 404.91125, "t": 168.66364, "r": 411.54321, "b": 174.73773000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 404.91125, "t": 152.88489000000004, "r": 411.54321, "b": 158.95898, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 152, "text": "70", "bbox": {"l": 404.91125, "t": 152.88489000000004, "r": 411.54321, "b": 158.95898, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "caption", "id": 7, "page_no": 5, "cluster": {"id": 7, "label": "caption", "bbox": {"l": 317.95499, "t": 279.01599, "r": 559.80579, "b": 342.28418000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9639935493469238, "cells": [{"id": 153, "text": "Figure 5: Prediction performance (mAP@0.5-0.95) of a Mask", "bbox": {"l": 317.95499, "t": 279.01599, "r": 558.47876, "b": 287.48923, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "R-CNN network with ResNet50 backbone trained on increas-", "bbox": {"l": 317.95499, "t": 289.97501, "r": 559.80579, "b": 298.44824, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "ing fractions of the DocLayNet dataset. The learning curve", "bbox": {"l": 317.95499, "t": 300.93399, "r": 558.20068, "b": 309.40723, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "flattens around the 80% mark, indicating that increasing the", "bbox": {"l": 317.95499, "t": 311.89297, "r": 558.20062, "b": 320.36620999999997, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "size of the DocLayNet dataset with similar data will not yield", "bbox": {"l": 317.95499, "t": 322.85196, "r": 558.20074, "b": 331.3252, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "significantly better predictions.", "bbox": {"l": 317.95499, "t": 333.81094, "r": 445.24207, "b": 342.28418000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 5: Prediction performance (mAP@0.5-0.95) of a Mask R-CNN network with ResNet50 backbone trained on increasing fractions of the DocLayNet dataset. The learning curve flattens around the 80% mark, indicating that increasing the size of the DocLayNet dataset with similar data will not yield significantly better predictions."}, {"label": "text", "id": 8, "page_no": 5, "cluster": {"id": 8, "label": "text", "bbox": {"l": 317.95499, "t": 384.01154, "r": 558.20416, "b": 403.34517999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9594221711158752, "cells": [{"id": 159, "text": "paper and leave the detailed evaluation of more recent methods", "bbox": {"l": 317.95499, "t": 384.01154, "r": 558.20416, "b": 392.38617, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "mentioned in Section 2 for future work.", "bbox": {"l": 317.95499, "t": 394.97055, "r": 463.04938, "b": 403.34517999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "paper and leave the detailed evaluation of more recent methods mentioned in Section 2 for future work."}, {"label": "text", "id": 3, "page_no": 5, "cluster": {"id": 3, "label": "text", "bbox": {"l": 317.64099, "t": 405.92953, "r": 558.4364, "b": 480.05716, "coord_origin": "TOPLEFT"}, "confidence": 0.9872915148735046, "cells": [{"id": 161, "text": "In this section, we will present several aspects related to the", "bbox": {"l": 327.918, "t": 405.92953, "r": 558.19836, "b": 414.30417, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "performance of object detection models on DocLayNet. Similarly", "bbox": {"l": 317.95499, "t": 416.88855, "r": 558.4364, "b": 425.26318, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "as in PubLayNet, we will evaluate the quality of their predictions", "bbox": {"l": 317.95499, "t": 427.84653, "r": 558.20563, "b": 436.22116, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "using mean average precision (mAP) with 10 overlaps that range", "bbox": {"l": 317.95499, "t": 438.80554, "r": 558.20044, "b": 447.18018, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "from 0.5 to 0.95 in steps of 0.05 (mAP@0.5-0.95). These scores are", "bbox": {"l": 317.95499, "t": 449.76453000000004, "r": 558.19891, "b": 458.13916, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "computed by leveraging the evaluation code provided by the COCO", "bbox": {"l": 317.95499, "t": 460.72354, "r": 558.20239, "b": 469.09818, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "API [16].", "bbox": {"l": 317.64099, "t": 471.68253, "r": 350.32352, "b": 480.05716, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In this section, we will present several aspects related to the performance of object detection models on DocLayNet. Similarly as in PubLayNet, we will evaluate the quality of their predictions using mean average precision (mAP) with 10 overlaps that range from 0.5 to 0.95 in steps of 0.05 (mAP@0.5-0.95). These scores are computed by leveraging the evaluation code provided by the COCO API [16]."}, {"label": "section_header", "id": 9, "page_no": 5, "cluster": {"id": 9, "label": "section_header", "bbox": {"l": 317.95499, "t": 496.8219, "r": 466.8532400000001, "b": 507.13098, "coord_origin": "TOPLEFT"}, "confidence": 0.9579005241394043, "cells": [{"id": 168, "text": "Baselines for Object Detection", "bbox": {"l": 317.95499, "t": 496.8219, "r": 466.8532400000001, "b": 507.13098, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Baselines for Object Detection"}, {"label": "text", "id": 1, "page_no": 5, "cluster": {"id": 1, "label": "text", "bbox": {"l": 317.74899, "t": 512.02454, "r": 558.43085, "b": 706.700172, "coord_origin": "TOPLEFT"}, "confidence": 0.987722635269165, "cells": [{"id": 169, "text": "In Table 2, we present baseline experiments (given in mAP) on Mask", "bbox": {"l": 317.95499, "t": 512.02454, "r": 558.43085, "b": 520.39917, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "R-CNN [12], Faster R-CNN [11], and YOLOv5 [13]. Both training", "bbox": {"l": 317.95499, "t": 522.9835499999999, "r": 558.20117, "b": 531.35818, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "and evaluation were performed on RGB images with dimensions of", "bbox": {"l": 317.95499, "t": 533.94254, "r": 558.20233, "b": 542.31717, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "1025", "bbox": {"l": 317.74899, "t": 544.90155, "r": 334.09296, "b": 553.27617, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "\u00d7", "bbox": {"l": 334.81201, "t": 544.84775, "r": 340.51465, "b": 552.5499, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "1025 pixels. For training, we only used one annotation in case", "bbox": {"l": 341.233, "t": 544.90155, "r": 558.20117, "b": 553.27617, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "of redundantly annotated pages. As one can observe, the variation", "bbox": {"l": 317.95499, "t": 555.85956, "r": 558.20392, "b": 564.23418, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "in mAP between the models is rather low, but overall between 6", "bbox": {"l": 317.95499, "t": 566.8185599999999, "r": 558.2041, "b": 575.19318, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "and 10% lower than the mAP computed from the pairwise human", "bbox": {"l": 317.95499, "t": 577.77756, "r": 558.2052, "b": 586.15218, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "annotations on triple-annotated pages. This gives a good indication", "bbox": {"l": 317.95499, "t": 588.73656, "r": 558.20233, "b": 597.11118, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "that the DocLayNet dataset poses a worthwhile challenge for the", "bbox": {"l": 317.95499, "t": 599.69556, "r": 558.1983, "b": 608.0701799999999, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "research community to close the gap between human recognition", "bbox": {"l": 317.95499, "t": 610.65456, "r": 558.20502, "b": 619.02917, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "and ML approaches. It is interesting to see that Mask R-CNN and", "bbox": {"l": 317.95499, "t": 621.61356, "r": 558.20337, "b": 629.98817, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "Faster R-CNN produce very comparable mAP scores, indicating", "bbox": {"l": 317.95499, "t": 632.5725600000001, "r": 558.2041, "b": 640.94717, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "that pixel-based image segmentation derived from bounding-boxes", "bbox": {"l": 317.95499, "t": 643.53156, "r": 558.20245, "b": 651.90617, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "does not help to obtain better predictions. On the other hand, the", "bbox": {"l": 317.95499, "t": 654.49055, "r": 558.19757, "b": 662.86517, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": "more recent Yolov5x model does very well and even out-performs", "bbox": {"l": 317.95499, "t": 665.44855, "r": 558.20404, "b": 673.82317, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "humans on selected labels such as", "bbox": {"l": 317.95499, "t": 676.40755, "r": 444.54102, "b": 684.78217, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "Text", "bbox": {"l": 446.78900000000004, "t": 676.45238, "r": 461.95261000000005, "b": 684.79114, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": ",", "bbox": {"l": 461.95599000000004, "t": 676.40755, "r": 463.96805000000006, "b": 684.78217, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "Table", "bbox": {"l": 466.2170100000001, "t": 676.45238, "r": 485.66998000000007, "b": 684.79114, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "and", "bbox": {"l": 488.1290000000001, "t": 676.40755, "r": 501.89330999999993, "b": 684.78217, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "Picture", "bbox": {"l": 504.142, "t": 676.45238, "r": 529.21954, "b": 684.79114, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": ". This is", "bbox": {"l": 529.22101, "t": 676.40755, "r": 558.20392, "b": 684.78217, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "not entirely surprising, as", "bbox": {"l": 317.95499, "t": 687.36655, "r": 410.81366, "b": 695.741173, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "Text", "bbox": {"l": 413.05301, "t": 687.41138, "r": 427.67865, "b": 695.750137, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": ",", "bbox": {"l": 427.67801, "t": 687.36655, "r": 429.62103, "b": 695.741173, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "Table", "bbox": {"l": 431.86099, "t": 687.41138, "r": 450.62881000000004, "b": 695.750137, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "and", "bbox": {"l": 453.082, "t": 687.36655, "r": 466.37402, "b": 695.741173, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "Picture", "bbox": {"l": 468.61499, "t": 687.41138, "r": 492.83208999999994, "b": 695.750137, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "are abundant and", "bbox": {"l": 495.28201, "t": 687.36655, "r": 558.2005, "b": 695.741173, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "the most visually distinctive in a document.", "bbox": {"l": 317.95499, "t": 698.325554, "r": 477.53903, "b": 706.700172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In Table 2, we present baseline experiments (given in mAP) on Mask R-CNN [12], Faster R-CNN [11], and YOLOv5 [13]. Both training and evaluation were performed on RGB images with dimensions of 1025 \u00d7 1025 pixels. For training, we only used one annotation in case of redundantly annotated pages. As one can observe, the variation in mAP between the models is rather low, but overall between 6 and 10% lower than the mAP computed from the pairwise human annotations on triple-annotated pages. This gives a good indication that the DocLayNet dataset poses a worthwhile challenge for the research community to close the gap between human recognition and ML approaches. It is interesting to see that Mask R-CNN and Faster R-CNN produce very comparable mAP scores, indicating that pixel-based image segmentation derived from bounding-boxes does not help to obtain better predictions. On the other hand, the more recent Yolov5x model does very well and even out-performs humans on selected labels such as Text , Table and Picture . This is not entirely surprising, as Text , Table and Picture are abundant and the most visually distinctive in a document."}], "headers": [{"label": "page_header", "id": 11, "page_no": 5, "cluster": {"id": 11, "label": "page_header", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.8662876486778259, "cells": [{"id": 0, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 246.24382, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar", "bbox": {"l": 253.13897999999998, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "KDD '22, August 14-18, 2022, Washington, DC, USA Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar"}]}}, {"page_no": 6, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Table 3: Performance of a Mask R-CNN R50 network in", "bbox": {"l": 53.501999, "t": 86.87292000000002, "r": 294.0437, "b": 95.34618999999998, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "mAP@0.5-0.95 scores trained on DocLayNet with different", "bbox": {"l": 53.79800000000001, "t": 97.83191, "r": 294.04376, "b": 106.30517999999995, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "class label sets. The reduced label sets were obtained by ei-", "bbox": {"l": 53.79800000000001, "t": 108.79088999999999, "r": 295.64865, "b": 117.26415999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "ther down-mapping or dropping labels.", "bbox": {"l": 53.79800000000001, "t": 119.74987999999996, "r": 213.23856, "b": 128.22313999999994, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Class-count", "bbox": {"l": 86.372002, "t": 153.10051999999996, "r": 129.46452, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "11", "bbox": {"l": 151.07401, "t": 153.10051999999996, "r": 159.41275, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "6", "bbox": {"l": 179.31816, "t": 153.10051999999996, "r": 183.48753, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "5", "bbox": {"l": 213.33669, "t": 153.10051999999996, "r": 217.50606, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "4", "bbox": {"l": 247.35521, "t": 153.10051999999996, "r": 251.52458, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Caption", "bbox": {"l": 86.372002, "t": 164.45752000000005, "r": 115.55763, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "68", "bbox": {"l": 151.07401, "t": 164.45752000000005, "r": 159.41275, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Text", "bbox": {"l": 173.42723, "t": 164.45752000000005, "r": 189.38742, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Text", "bbox": {"l": 207.44576, "t": 164.45752000000005, "r": 223.40594000000002, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Text", "bbox": {"l": 241.46428, "t": 164.45752000000005, "r": 257.42447, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Footnote", "bbox": {"l": 86.372002, "t": 175.41656, "r": 118.8752, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "71", "bbox": {"l": 151.07401, "t": 175.41656, "r": 159.41275, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Text", "bbox": {"l": 173.42723, "t": 175.41656, "r": 189.38742, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Text", "bbox": {"l": 207.44576, "t": 175.41656, "r": 223.40594000000002, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Text", "bbox": {"l": 241.46428, "t": 175.41656, "r": 257.42447, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Formula", "bbox": {"l": 86.372002, "t": 186.37554999999998, "r": 116.88466, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "60", "bbox": {"l": 151.07401, "t": 186.37554999999998, "r": 159.41275, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Text", "bbox": {"l": 173.42723, "t": 186.37554999999998, "r": 189.38742, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "Text", "bbox": {"l": 207.44576, "t": 186.37554999999998, "r": 223.40594000000002, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "Text", "bbox": {"l": 241.46428, "t": 186.37554999999998, "r": 257.42447, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "List-item", "bbox": {"l": 86.372002, "t": 197.33452999999997, "r": 119.25179, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "81", "bbox": {"l": 151.07401, "t": 197.33452999999997, "r": 159.41275, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Text", "bbox": {"l": 173.42723, "t": 197.33452999999997, "r": 189.38742, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "82", "bbox": {"l": 211.25647, "t": 197.33452999999997, "r": 219.59521, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Text", "bbox": {"l": 241.46426, "t": 197.33452999999997, "r": 257.42447, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Page-footer", "bbox": {"l": 86.372002, "t": 208.29351999999994, "r": 128.89964, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "62", "bbox": {"l": 151.07401, "t": 208.29351999999994, "r": 159.41275, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "62", "bbox": {"l": 177.23795, "t": 208.29351999999994, "r": 185.57669, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "-", "bbox": {"l": 213.91052, "t": 208.29351999999994, "r": 216.94116, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "-", "bbox": {"l": 247.92905000000002, "t": 208.29351999999994, "r": 250.95969, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Page-header", "bbox": {"l": 86.372002, "t": 219.25256000000002, "r": 131.65231, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "72", "bbox": {"l": 151.07401, "t": 219.25256000000002, "r": 159.41275, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "68", "bbox": {"l": 177.23795, "t": 219.25256000000002, "r": 185.57669, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "-", "bbox": {"l": 213.91052, "t": 219.25256000000002, "r": 216.94116, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "-", "bbox": {"l": 247.92905000000002, "t": 219.25256000000002, "r": 250.95969, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Picture", "bbox": {"l": 86.372002, "t": 230.21155, "r": 112.35663, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "72", "bbox": {"l": 151.07401, "t": 230.21155, "r": 159.41275, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "72", "bbox": {"l": 177.23795, "t": 230.21155, "r": 185.57669, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "72", "bbox": {"l": 211.25645, "t": 230.21155, "r": 219.5952, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "72", "bbox": {"l": 245.27496, "t": 230.21155, "r": 253.61371, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "Section-header", "bbox": {"l": 86.372002, "t": 241.16956000000005, "r": 141.11188, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "68", "bbox": {"l": 151.07401, "t": 241.16956000000005, "r": 159.41275, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "67", "bbox": {"l": 177.23795, "t": 241.16956000000005, "r": 185.57669, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "69", "bbox": {"l": 211.25645, "t": 241.16956000000005, "r": 219.5952, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "68", "bbox": {"l": 245.27496, "t": 241.16956000000005, "r": 253.61371, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Table", "bbox": {"l": 86.372002, "t": 252.12854000000004, "r": 106.17878, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "82", "bbox": {"l": 151.07401, "t": 252.12854000000004, "r": 159.41275, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "83", "bbox": {"l": 177.23795, "t": 252.12854000000004, "r": 185.57669, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "82", "bbox": {"l": 211.25645, "t": 252.12854000000004, "r": 219.5952, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "82", "bbox": {"l": 245.27496, "t": 252.12854000000004, "r": 253.61371, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Text", "bbox": {"l": 86.372002, "t": 263.08752000000004, "r": 102.3322, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "85", "bbox": {"l": 151.07401, "t": 263.08752000000004, "r": 159.41275, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "84", "bbox": {"l": 177.23795, "t": 263.08752000000004, "r": 185.57669, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "84", "bbox": {"l": 211.25645, "t": 263.08752000000004, "r": 219.5952, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "84", "bbox": {"l": 245.27496, "t": 263.08752000000004, "r": 253.61371, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "Title", "bbox": {"l": 86.372002, "t": 274.04657, "r": 103.36333, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "77", "bbox": {"l": 151.07401, "t": 274.04657, "r": 159.41275, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "Sec.-h.", "bbox": {"l": 169.37442, "t": 274.04657, "r": 193.43127, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "Sec.-h.", "bbox": {"l": 203.39294, "t": 274.04657, "r": 227.4498, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "Sec.-h.", "bbox": {"l": 237.41147, "t": 274.04657, "r": 261.46832, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "Overall", "bbox": {"l": 86.372002, "t": 285.40454, "r": 113.31602000000001, "b": 293.77917, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "72", "bbox": {"l": 151.07401, "t": 285.40454, "r": 159.41275, "b": 293.77917, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "73", "bbox": {"l": 177.23795, "t": 285.40454, "r": 185.57669, "b": 293.77917, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "78", "bbox": {"l": 211.25645, "t": 285.40454, "r": 219.5952, "b": 293.77917, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "77", "bbox": {"l": 245.27496, "t": 285.40454, "r": 253.61371, "b": 293.77917, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Learning Curve", "bbox": {"l": 53.79800000000001, "t": 319.56992, "r": 131.05624, "b": 329.879, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "One of the fundamental questions related to any dataset is if it is", "bbox": {"l": 53.79800000000001, "t": 334.77155, "r": 294.04153, "b": 343.14618, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "\u201clarge enough\u201d. To answer this question for DocLayNet, we per-", "bbox": {"l": 52.785, "t": 345.73053, "r": 295.55835, "b": 354.10516000000007, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "formed a data ablation study in which we evaluated a Mask R-CNN", "bbox": {"l": 53.79800000000001, "t": 356.6895400000001, "r": 294.04535, "b": 365.06418, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "model trained on increasing fractions of the DocLayNet dataset.", "bbox": {"l": 53.79800000000001, "t": 367.64853, "r": 295.4281, "b": 376.02316, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "As can be seen in Figure 5, the mAP score rises sharply in the be-", "bbox": {"l": 53.484001, "t": 378.60754, "r": 295.55667, "b": 386.98218, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "ginning and eventually levels out. To estimate the error-bar on the", "bbox": {"l": 53.79800000000001, "t": 389.56653, "r": 294.04865, "b": 397.94116, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "metrics, we ran the training five times on the entire data-set. This", "bbox": {"l": 53.79800000000001, "t": 400.52554000000003, "r": 294.04376, "b": 408.90018, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "resulted in a 1% error-bar, depicted by the shaded area in Figure 5.", "bbox": {"l": 53.79800000000001, "t": 411.48456, "r": 295.42459, "b": 419.85919, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "In the inset of Figure 5, we show the exact same data-points, but", "bbox": {"l": 53.79800000000001, "t": 422.44354, "r": 294.04709, "b": 430.81818, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "with a logarithmic scale on the x-axis. As is expected, the mAP", "bbox": {"l": 53.466999, "t": 433.40253000000007, "r": 294.04535, "b": 441.7771599999999, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "score increases linearly as a function of the data-size in the inset.", "bbox": {"l": 53.79800000000001, "t": 444.36053000000004, "r": 295.42902, "b": 452.73517, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "The curve ultimately flattens out between the 80% and 100% mark,", "bbox": {"l": 53.528999, "t": 455.31955, "r": 295.03122, "b": 463.69418, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "with the 80% mark falling within the error-bars of the 100% mark.", "bbox": {"l": 53.466999, "t": 466.27853, "r": 295.42154, "b": 474.65317, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "This provides a good indication that the model would not improve", "bbox": {"l": 53.528999, "t": 477.23755, "r": 294.04553, "b": 485.61218, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "significantly by yet increasing the data size. Rather, it would prob-", "bbox": {"l": 53.79800000000001, "t": 488.19653, "r": 295.55646, "b": 496.57117, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "ably benefit more from improved data consistency (as discussed", "bbox": {"l": 53.79800000000001, "t": 499.15555, "r": 294.04715, "b": 507.53018, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "in Section 3), data augmentation methods [23], or the addition of", "bbox": {"l": 53.79800000000001, "t": 510.11453, "r": 294.04245, "b": 518.4891700000001, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "more document categories and styles.", "bbox": {"l": 53.79800000000001, "t": 521.0735500000001, "r": 191.47707, "b": 529.44818, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "Impact of Class Labels", "bbox": {"l": 53.79800000000001, "t": 542.50992, "r": 164.32898, "b": 552.81902, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "The choice and number of labels can have a significant effect on", "bbox": {"l": 53.528999, "t": 557.71155, "r": 294.04333, "b": 566.08617, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "the overall model performance. Since PubLayNet, DocBank and", "bbox": {"l": 53.79800000000001, "t": 568.6705499999999, "r": 294.04712, "b": 577.04517, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "DocLayNet all have different label sets, it is of particular interest to", "bbox": {"l": 53.79800000000001, "t": 579.62955, "r": 294.04538, "b": 588.0041699999999, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "understand and quantify this influence of the label set on the model", "bbox": {"l": 53.79800000000001, "t": 590.5885499999999, "r": 294.04535, "b": 598.96317, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "performance. We investigate this by either down-mapping labels", "bbox": {"l": 53.79800000000001, "t": 601.54755, "r": 294.04266, "b": 609.92216, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "into more common ones (e.g.", "bbox": {"l": 53.79800000000001, "t": 612.50656, "r": 163.59247, "b": 620.88118, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "Caption", "bbox": {"l": 166.26401, "t": 612.55139, "r": 194.97244, "b": 620.89015, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "\u2192", "bbox": {"l": 194.994, "t": 612.45276, "r": 204.1756, "b": 620.15491, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "Text", "bbox": {"l": 204.17599, "t": 612.55139, "r": 219.33961000000002, "b": 620.89015, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": ") or excluding them", "bbox": {"l": 219.849, "t": 612.50656, "r": 294.04828, "b": 620.88118, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "from the annotations entirely. Furthermore, it must be stressed", "bbox": {"l": 53.79800000000001, "t": 623.46556, "r": 294.04709, "b": 631.84018, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "that all mappings and exclusions were performed on the data be-", "bbox": {"l": 53.79800000000001, "t": 634.42355, "r": 295.55679, "b": 642.79817, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "fore model training. In Table 3, we present the mAP scores for a", "bbox": {"l": 53.79800000000001, "t": 645.38255, "r": 294.04715, "b": 653.75717, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "Mask R-CNN R50 network on different label sets. Where a label", "bbox": {"l": 53.79800000000001, "t": 656.34155, "r": 294.04715, "b": 664.71617, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "is down-mapped, we show its corresponding label, otherwise it", "bbox": {"l": 53.79800000000001, "t": 667.30055, "r": 294.04712, "b": 675.67517, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "was excluded. We present three different label sets, with 6, 5 and 4", "bbox": {"l": 53.466999, "t": 678.25955, "r": 294.25174, "b": 686.63417, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "different labels respectively. The set of 5 labels contains the same", "bbox": {"l": 53.79800000000001, "t": 689.21855, "r": 294.04639, "b": 697.59317, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "labels as PubLayNet. However, due to the different definition of", "bbox": {"l": 53.79800000000001, "t": 700.177551, "r": 294.04712, "b": 708.55217, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "Table 4: Performance of a Mask R-CNN R50 network with", "bbox": {"l": 317.659, "t": 86.87298999999996, "r": 558.20068, "b": 95.34625000000017, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "document-wise and page-wise split for different label sets.", "bbox": {"l": 317.95499, "t": 97.83196999999996, "r": 559.73401, "b": 106.30524000000003, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "Naive page-wise split will result in", "bbox": {"l": 317.95499, "t": 108.79094999999995, "r": 467.72089, "b": 117.26422000000014, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "GLYPH<tildelow>", "bbox": {"l": 471.90900000000005, "t": 107.12798999999995, "r": 477.53900000000004, "b": 115.19768999999997, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "10% point improve-", "bbox": {"l": 477.54001000000005, "t": 108.79094999999995, "r": 559.80682, "b": 117.26422000000014, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "ment.", "bbox": {"l": 317.95502, "t": 119.74993999999992, "r": 341.37524, "b": 128.22321, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "Class-count", "bbox": {"l": 358.63901, "t": 153.10051999999996, "r": 401.73154, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "11", "bbox": {"l": 440.22501, "t": 153.10051999999996, "r": 448.56375, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "5", "bbox": {"l": 494.38, "t": 153.10051999999996, "r": 498.54938, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "Split", "bbox": {"l": 358.63901, "t": 164.05951000000005, "r": 375.27167, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "Doc", "bbox": {"l": 423.341, "t": 164.05951000000005, "r": 438.0459, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "Page", "bbox": {"l": 448.00757, "t": 164.05951000000005, "r": 465.4472, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "Doc", "bbox": {"l": 475.41101, "t": 164.05951000000005, "r": 490.11591, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Page", "bbox": {"l": 500.07757999999995, "t": 164.05951000000005, "r": 517.51721, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "Caption", "bbox": {"l": 358.63901, "t": 175.41656, "r": 387.82465, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "68", "bbox": {"l": 426.52399, "t": 175.41656, "r": 434.86273, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "83", "bbox": {"l": 452.56240999999994, "t": 175.41656, "r": 460.90115000000003, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "Footnote", "bbox": {"l": 358.63901, "t": 186.37554999999998, "r": 391.14221, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "71", "bbox": {"l": 426.52399, "t": 186.37554999999998, "r": 434.86273, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "84", "bbox": {"l": 452.56240999999994, "t": 186.37554999999998, "r": 460.90115000000003, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "Formula", "bbox": {"l": 358.63901, "t": 197.33452999999997, "r": 389.15167, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "60", "bbox": {"l": 426.52399, "t": 197.33452999999997, "r": 434.86273, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "66", "bbox": {"l": 452.56240999999994, "t": 197.33452999999997, "r": 460.90115000000003, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "List-item", "bbox": {"l": 358.63901, "t": 208.29351999999994, "r": 391.5188, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "81", "bbox": {"l": 426.52399, "t": 208.29351999999994, "r": 434.86273, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "88", "bbox": {"l": 452.56240999999994, "t": 208.29351999999994, "r": 460.90115000000003, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "82", "bbox": {"l": 478.59399, "t": 208.29351999999994, "r": 486.93274, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "88", "bbox": {"l": 504.6324200000001, "t": 208.29351999999994, "r": 512.97119, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "Page-footer", "bbox": {"l": 358.63901, "t": 219.25256000000002, "r": 401.16666, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "62", "bbox": {"l": 426.52399, "t": 219.25256000000002, "r": 434.86273, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "89", "bbox": {"l": 452.56240999999994, "t": 219.25256000000002, "r": 460.90115000000003, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "Page-header", "bbox": {"l": 358.63901, "t": 230.21155, "r": 403.91931, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "72", "bbox": {"l": 426.52399, "t": 230.21155, "r": 434.86273, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "90", "bbox": {"l": 452.56240999999994, "t": 230.21155, "r": 460.90115000000003, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "Picture", "bbox": {"l": 358.63901, "t": 241.16956000000005, "r": 384.62366, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "72", "bbox": {"l": 426.52399, "t": 241.16956000000005, "r": 434.86273, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "82", "bbox": {"l": 452.56240999999994, "t": 241.16956000000005, "r": 460.90115000000003, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "72", "bbox": {"l": 478.59399, "t": 241.16956000000005, "r": 486.93274, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "82", "bbox": {"l": 504.6324200000001, "t": 241.16956000000005, "r": 512.97119, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "Section-header", "bbox": {"l": 358.63901, "t": 252.12854000000004, "r": 413.37891, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "68", "bbox": {"l": 426.52399, "t": 252.12854000000004, "r": 434.86273, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "83", "bbox": {"l": 452.56240999999994, "t": 252.12854000000004, "r": 460.90115000000003, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "69", "bbox": {"l": 478.59399, "t": 252.12854000000004, "r": 486.93274, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "83", "bbox": {"l": 504.6324200000001, "t": 252.12854000000004, "r": 512.97119, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "Table", "bbox": {"l": 358.63901, "t": 263.08752000000004, "r": 378.44577, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "82", "bbox": {"l": 426.52399, "t": 263.08752000000004, "r": 434.86273, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "89", "bbox": {"l": 452.56240999999994, "t": 263.08752000000004, "r": 460.90115000000003, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "82", "bbox": {"l": 478.59399, "t": 263.08752000000004, "r": 486.93274, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "90", "bbox": {"l": 504.6324200000001, "t": 263.08752000000004, "r": 512.97119, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "Text", "bbox": {"l": 358.63901, "t": 274.04657, "r": 374.59921, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "85", "bbox": {"l": 426.52399, "t": 274.04657, "r": 434.86273, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "91", "bbox": {"l": 452.56240999999994, "t": 274.04657, "r": 460.90115000000003, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "84", "bbox": {"l": 478.59399, "t": 274.04657, "r": 486.93274, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "90", "bbox": {"l": 504.6324200000001, "t": 274.04657, "r": 512.97119, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "Title", "bbox": {"l": 358.63901, "t": 285.00552, "r": 375.63034, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "77", "bbox": {"l": 426.52399, "t": 285.00552, "r": 434.86273, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "81", "bbox": {"l": 452.56240999999994, "t": 285.00552, "r": 460.90115000000003, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "All", "bbox": {"l": 358.63901, "t": 296.36255, "r": 369.60492, "b": 304.73718, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "72", "bbox": {"l": 426.52399, "t": 296.36255, "r": 434.86273, "b": 304.73718, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "84", "bbox": {"l": 452.56240999999994, "t": 296.36255, "r": 460.90115000000003, "b": 304.73718, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "78", "bbox": {"l": 478.59399, "t": 296.36255, "r": 486.93274, "b": 304.73718, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "87", "bbox": {"l": 504.6324200000001, "t": 296.36255, "r": 512.97119, "b": 304.73718, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "lists in PubLayNet (grouped list-items) versus DocLayNet (separate", "bbox": {"l": 317.95499, "t": 331.40353, "r": 558.20233, "b": 339.77817, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "list-items), the label set of size 4 is the closest to PubLayNet, in the", "bbox": {"l": 317.95499, "t": 342.36255, "r": 558.2005, "b": 350.73718, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "assumption that the", "bbox": {"l": 317.95499, "t": 353.32153, "r": 393.16028, "b": 361.69617000000005, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "List", "bbox": {"l": 395.84201, "t": 353.36639, "r": 409.14905, "b": 361.70514, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "is down-mapped to", "bbox": {"l": 412.33301, "t": 353.32153, "r": 485.02324999999996, "b": 361.69617000000005, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "Text", "bbox": {"l": 487.70401, "t": 353.36639, "r": 502.86761, "b": 361.70514, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "in PubLayNet.", "bbox": {"l": 506.05499, "t": 353.32153, "r": 559.58496, "b": 361.69617000000005, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "The results in Table 3 show that the prediction accuracy on the", "bbox": {"l": 317.686, "t": 364.28054999999995, "r": 558.2002, "b": 372.65518, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "remaining class labels does not change significantly when other", "bbox": {"l": 317.95499, "t": 375.23853, "r": 558.36877, "b": 383.61316, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "classes are merged into them. The overall macro-average improves", "bbox": {"l": 317.95499, "t": 386.19754, "r": 558.19958, "b": 394.57217, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "by around 5%, in particular when", "bbox": {"l": 317.95499, "t": 397.15652, "r": 439.49454, "b": 405.53116000000006, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "Page-footer", "bbox": {"l": 441.728, "t": 397.20139, "r": 481.8616, "b": 405.54013, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "and", "bbox": {"l": 484.74298, "t": 397.15652, "r": 498.23743, "b": 405.53116000000006, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "Page-header", "bbox": {"l": 500.47299, "t": 397.20139, "r": 543.95105, "b": 405.54013, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": "are", "bbox": {"l": 546.83197, "t": 397.15652, "r": 558.20142, "b": 405.53116000000006, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "excluded.", "bbox": {"l": 317.95496, "t": 408.11553999999995, "r": 352.37698, "b": 416.49017, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "Impact of Document Split in Train and Test Set", "bbox": {"l": 317.95496, "t": 429.3949, "r": 549.8606, "b": 439.70398, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": "Many documents in DocLayNet have a unique styling. In order", "bbox": {"l": 317.95499, "t": 444.59653, "r": 558.36884, "b": 452.97116, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "to avoid overfitting on a particular style, we have split the train-,", "bbox": {"l": 317.95499, "t": 455.55554, "r": 559.19189, "b": 463.93018, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "test- and validation-sets of DocLayNet on document boundaries, i.e.", "bbox": {"l": 317.95499, "t": 466.51453, "r": 559.58185, "b": 474.88916, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "every document contributes pages to only one set. To the best of", "bbox": {"l": 317.95499, "t": 477.47354, "r": 558.20605, "b": 485.84818, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": "our knowledge, this was not considered in PubLayNet or DocBank.", "bbox": {"l": 317.95499, "t": 488.43253, "r": 559.58203, "b": 496.80716, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "To quantify how this affects model performance, we trained and", "bbox": {"l": 317.686, "t": 499.39154, "r": 558.20032, "b": 507.76617, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "evaluated a Mask R-CNN R50 model on a modified dataset version.", "bbox": {"l": 317.95499, "t": 510.35052, "r": 559.5849, "b": 518.72516, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "Here, the train-, test- and validation-sets were obtained by a ran-", "bbox": {"l": 317.95499, "t": 521.30954, "r": 559.71381, "b": 529.68417, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "domised draw over the individual pages. As can be seen in Table 4,", "bbox": {"l": 317.95499, "t": 532.26855, "r": 559.18707, "b": 540.64317, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "the difference in model performance is surprisingly large: page-", "bbox": {"l": 317.95499, "t": 543.22655, "r": 559.71313, "b": 551.60117, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "wise splitting gains", "bbox": {"l": 317.62299, "t": 554.18555, "r": 388.35168, "b": 562.56017, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "\u02dc", "bbox": {"l": 391.36499, "t": 552.50055, "r": 393.98318, "b": 560.87517, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "10% in mAP over the document-wise splitting.", "bbox": {"l": 390.59, "t": 554.18555, "r": 559.58191, "b": 562.56017, "coord_origin": "TOPLEFT"}}, {"id": 201, "text": "Thus, random page-wise splitting of DocLayNet can easily lead", "bbox": {"l": 317.686, "t": 565.14455, "r": 558.20032, "b": 573.51917, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": "to accidental overestimation of model performance and should be", "bbox": {"l": 317.95499, "t": 576.10356, "r": 558.20508, "b": 584.4781800000001, "coord_origin": "TOPLEFT"}}, {"id": 203, "text": "avoided.", "bbox": {"l": 317.95499, "t": 587.06256, "r": 348.50354, "b": 595.43718, "coord_origin": "TOPLEFT"}}, {"id": 204, "text": "Dataset Comparison", "bbox": {"l": 317.95499, "t": 608.34192, "r": 418.54776, "b": 618.65102, "coord_origin": "TOPLEFT"}}, {"id": 205, "text": "Throughout this paper, we claim that DocLayNet\u2019s wider variety of", "bbox": {"l": 317.686, "t": 623.54355, "r": 558.20575, "b": 631.91817, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": "document layouts leads to more robust layout detection models. In", "bbox": {"l": 317.95499, "t": 634.50255, "r": 558.20624, "b": 642.87717, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": "Table 5, we provide evidence for that. We trained models on each", "bbox": {"l": 317.686, "t": 645.46155, "r": 558.20319, "b": 653.83617, "coord_origin": "TOPLEFT"}}, {"id": 208, "text": "of the available datasets (PubLayNet, DocBank and DocLayNet)", "bbox": {"l": 317.95499, "t": 656.42055, "r": 558.74377, "b": 664.79517, "coord_origin": "TOPLEFT"}}, {"id": 209, "text": "and evaluated them on the test sets of the other datasets. Due to", "bbox": {"l": 317.95499, "t": 667.37955, "r": 558.20398, "b": 675.7541699999999, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": "the different label sets and annotation styles, a direct comparison", "bbox": {"l": 317.95499, "t": 678.3385499999999, "r": 558.20062, "b": 686.71317, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "is not possible. Hence, we focussed on the common labels among", "bbox": {"l": 317.95499, "t": 689.29755, "r": 558.20343, "b": 697.672173, "coord_origin": "TOPLEFT"}}, {"id": 212, "text": "the datasets. Between PubLayNet and DocLayNet, these are", "bbox": {"l": 317.95499, "t": 700.256554, "r": 531.07666, "b": 708.631172, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "Picture", "bbox": {"l": 533.16199, "t": 700.301384, "r": 557.2561, "b": 708.640137, "coord_origin": "TOPLEFT"}}, {"id": 214, "text": ",", "bbox": {"l": 557.255, "t": 700.256554, "r": 559.18817, "b": 708.631172, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 12, "label": "page_header", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.9316118955612183, "cells": [{"id": 0, "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "page_header", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.9318180084228516, "cells": [{"id": 1, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 53.501999, "t": 86.87292000000002, "r": 295.64865, "b": 128.22313999999994, "coord_origin": "TOPLEFT"}, "confidence": 0.8296934366226196, "cells": [{"id": 2, "text": "Table 3: Performance of a Mask R-CNN R50 network in", "bbox": {"l": 53.501999, "t": 86.87292000000002, "r": 294.0437, "b": 95.34618999999998, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "mAP@0.5-0.95 scores trained on DocLayNet with different", "bbox": {"l": 53.79800000000001, "t": 97.83191, "r": 294.04376, "b": 106.30517999999995, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "class label sets. The reduced label sets were obtained by ei-", "bbox": {"l": 53.79800000000001, "t": 108.79088999999999, "r": 295.64865, "b": 117.26415999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "ther down-mapping or dropping labels.", "bbox": {"l": 53.79800000000001, "t": 119.74987999999996, "r": 213.23856, "b": 128.22313999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "table", "bbox": {"l": 80.35525512695312, "t": 150.93629455566406, "r": 267.0082092285156, "b": 295.4454650878906, "coord_origin": "TOPLEFT"}, "confidence": 0.9869412779808044, "cells": [{"id": 6, "text": "Class-count", "bbox": {"l": 86.372002, "t": 153.10051999999996, "r": 129.46452, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "11", "bbox": {"l": 151.07401, "t": 153.10051999999996, "r": 159.41275, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "6", "bbox": {"l": 179.31816, "t": 153.10051999999996, "r": 183.48753, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "5", "bbox": {"l": 213.33669, "t": 153.10051999999996, "r": 217.50606, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "4", "bbox": {"l": 247.35521, "t": 153.10051999999996, "r": 251.52458, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Caption", "bbox": {"l": 86.372002, "t": 164.45752000000005, "r": 115.55763, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "68", "bbox": {"l": 151.07401, "t": 164.45752000000005, "r": 159.41275, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Text", "bbox": {"l": 173.42723, "t": 164.45752000000005, "r": 189.38742, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Text", "bbox": {"l": 207.44576, "t": 164.45752000000005, "r": 223.40594000000002, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Text", "bbox": {"l": 241.46428, "t": 164.45752000000005, "r": 257.42447, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Footnote", "bbox": {"l": 86.372002, "t": 175.41656, "r": 118.8752, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "71", "bbox": {"l": 151.07401, "t": 175.41656, "r": 159.41275, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Text", "bbox": {"l": 173.42723, "t": 175.41656, "r": 189.38742, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Text", "bbox": {"l": 207.44576, "t": 175.41656, "r": 223.40594000000002, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Text", "bbox": {"l": 241.46428, "t": 175.41656, "r": 257.42447, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Formula", "bbox": {"l": 86.372002, "t": 186.37554999999998, "r": 116.88466, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "60", "bbox": {"l": 151.07401, "t": 186.37554999999998, "r": 159.41275, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Text", "bbox": {"l": 173.42723, "t": 186.37554999999998, "r": 189.38742, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "Text", "bbox": {"l": 207.44576, "t": 186.37554999999998, "r": 223.40594000000002, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "Text", "bbox": {"l": 241.46428, "t": 186.37554999999998, "r": 257.42447, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "List-item", "bbox": {"l": 86.372002, "t": 197.33452999999997, "r": 119.25179, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "81", "bbox": {"l": 151.07401, "t": 197.33452999999997, "r": 159.41275, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Text", "bbox": {"l": 173.42723, "t": 197.33452999999997, "r": 189.38742, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "82", "bbox": {"l": 211.25647, "t": 197.33452999999997, "r": 219.59521, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Text", "bbox": {"l": 241.46426, "t": 197.33452999999997, "r": 257.42447, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Page-footer", "bbox": {"l": 86.372002, "t": 208.29351999999994, "r": 128.89964, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "62", "bbox": {"l": 151.07401, "t": 208.29351999999994, "r": 159.41275, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "62", "bbox": {"l": 177.23795, "t": 208.29351999999994, "r": 185.57669, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "-", "bbox": {"l": 213.91052, "t": 208.29351999999994, "r": 216.94116, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "-", "bbox": {"l": 247.92905000000002, "t": 208.29351999999994, "r": 250.95969, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Page-header", "bbox": {"l": 86.372002, "t": 219.25256000000002, "r": 131.65231, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "72", "bbox": {"l": 151.07401, "t": 219.25256000000002, "r": 159.41275, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "68", "bbox": {"l": 177.23795, "t": 219.25256000000002, "r": 185.57669, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "-", "bbox": {"l": 213.91052, "t": 219.25256000000002, "r": 216.94116, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "-", "bbox": {"l": 247.92905000000002, "t": 219.25256000000002, "r": 250.95969, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Picture", "bbox": {"l": 86.372002, "t": 230.21155, "r": 112.35663, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "72", "bbox": {"l": 151.07401, "t": 230.21155, "r": 159.41275, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "72", "bbox": {"l": 177.23795, "t": 230.21155, "r": 185.57669, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "72", "bbox": {"l": 211.25645, "t": 230.21155, "r": 219.5952, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "72", "bbox": {"l": 245.27496, "t": 230.21155, "r": 253.61371, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "Section-header", "bbox": {"l": 86.372002, "t": 241.16956000000005, "r": 141.11188, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "68", "bbox": {"l": 151.07401, "t": 241.16956000000005, "r": 159.41275, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "67", "bbox": {"l": 177.23795, "t": 241.16956000000005, "r": 185.57669, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "69", "bbox": {"l": 211.25645, "t": 241.16956000000005, "r": 219.5952, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "68", "bbox": {"l": 245.27496, "t": 241.16956000000005, "r": 253.61371, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Table", "bbox": {"l": 86.372002, "t": 252.12854000000004, "r": 106.17878, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "82", "bbox": {"l": 151.07401, "t": 252.12854000000004, "r": 159.41275, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "83", "bbox": {"l": 177.23795, "t": 252.12854000000004, "r": 185.57669, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "82", "bbox": {"l": 211.25645, "t": 252.12854000000004, "r": 219.5952, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "82", "bbox": {"l": 245.27496, "t": 252.12854000000004, "r": 253.61371, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Text", "bbox": {"l": 86.372002, "t": 263.08752000000004, "r": 102.3322, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "85", "bbox": {"l": 151.07401, "t": 263.08752000000004, "r": 159.41275, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "84", "bbox": {"l": 177.23795, "t": 263.08752000000004, "r": 185.57669, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "84", "bbox": {"l": 211.25645, "t": 263.08752000000004, "r": 219.5952, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "84", "bbox": {"l": 245.27496, "t": 263.08752000000004, "r": 253.61371, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "Title", "bbox": {"l": 86.372002, "t": 274.04657, "r": 103.36333, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "77", "bbox": {"l": 151.07401, "t": 274.04657, "r": 159.41275, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "Sec.-h.", "bbox": {"l": 169.37442, "t": 274.04657, "r": 193.43127, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "Sec.-h.", "bbox": {"l": 203.39294, "t": 274.04657, "r": 227.4498, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "Sec.-h.", "bbox": {"l": 237.41147, "t": 274.04657, "r": 261.46832, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "Overall", "bbox": {"l": 86.372002, "t": 285.40454, "r": 113.31602000000001, "b": 293.77917, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "72", "bbox": {"l": 151.07401, "t": 285.40454, "r": 159.41275, "b": 293.77917, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "73", "bbox": {"l": 177.23795, "t": 285.40454, "r": 185.57669, "b": 293.77917, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "78", "bbox": {"l": 211.25645, "t": 285.40454, "r": 219.5952, "b": 293.77917, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "77", "bbox": {"l": 245.27496, "t": 285.40454, "r": 253.61371, "b": 293.77917, "coord_origin": "TOPLEFT"}}], "children": [{"id": 15, "label": "text", "bbox": {"l": 86.372002, "t": 153.10051999999996, "r": 129.46452, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": "Class-count", "bbox": {"l": 86.372002, "t": 153.10051999999996, "r": 129.46452, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 151.07401, "t": 153.10051999999996, "r": 159.41275, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "11", "bbox": {"l": 151.07401, "t": 153.10051999999996, "r": 159.41275, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 179.31816, "t": 153.10051999999996, "r": 183.48753, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "6", "bbox": {"l": 179.31816, "t": 153.10051999999996, "r": 183.48753, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 213.33669, "t": 153.10051999999996, "r": 217.50606, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "5", "bbox": {"l": 213.33669, "t": 153.10051999999996, "r": 217.50606, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 247.35521, "t": 153.10051999999996, "r": 251.52458, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "4", "bbox": {"l": 247.35521, "t": 153.10051999999996, "r": 251.52458, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 86.372002, "t": 164.45752000000005, "r": 115.55763, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "Caption", "bbox": {"l": 86.372002, "t": 164.45752000000005, "r": 115.55763, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 151.07401, "t": 164.45752000000005, "r": 159.41275, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "68", "bbox": {"l": 151.07401, "t": 164.45752000000005, "r": 159.41275, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 173.42723, "t": 164.45752000000005, "r": 189.38742, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "Text", "bbox": {"l": 173.42723, "t": 164.45752000000005, "r": 189.38742, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 207.44576, "t": 164.45752000000005, "r": 223.40594000000002, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "Text", "bbox": {"l": 207.44576, "t": 164.45752000000005, "r": 223.40594000000002, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 241.46428, "t": 164.45752000000005, "r": 257.42447, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "Text", "bbox": {"l": 241.46428, "t": 164.45752000000005, "r": 257.42447, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 86.372002, "t": 175.41656, "r": 118.8752, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "Footnote", "bbox": {"l": 86.372002, "t": 175.41656, "r": 118.8752, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 151.07401, "t": 175.41656, "r": 159.41275, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "71", "bbox": {"l": 151.07401, "t": 175.41656, "r": 159.41275, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 173.42723, "t": 175.41656, "r": 189.38742, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "Text", "bbox": {"l": 173.42723, "t": 175.41656, "r": 189.38742, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 207.44576, "t": 175.41656, "r": 223.40594000000002, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "Text", "bbox": {"l": 207.44576, "t": 175.41656, "r": 223.40594000000002, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 241.46428, "t": 175.41656, "r": 257.42447, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "Text", "bbox": {"l": 241.46428, "t": 175.41656, "r": 257.42447, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 86.372002, "t": 186.37554999999998, "r": 116.88466, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "Formula", "bbox": {"l": 86.372002, "t": 186.37554999999998, "r": 116.88466, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 151.07401, "t": 186.37554999999998, "r": 159.41275, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "60", "bbox": {"l": 151.07401, "t": 186.37554999999998, "r": 159.41275, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 173.42723, "t": 186.37554999999998, "r": 189.38742, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "Text", "bbox": {"l": 173.42723, "t": 186.37554999999998, "r": 189.38742, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 207.44576, "t": 186.37554999999998, "r": 223.40594000000002, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "Text", "bbox": {"l": 207.44576, "t": 186.37554999999998, "r": 223.40594000000002, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 241.46428, "t": 186.37554999999998, "r": 257.42447, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "Text", "bbox": {"l": 241.46428, "t": 186.37554999999998, "r": 257.42447, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 86.372002, "t": 197.33452999999997, "r": 119.25179, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "List-item", "bbox": {"l": 86.372002, "t": 197.33452999999997, "r": 119.25179, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 151.07401, "t": 197.33452999999997, "r": 159.41275, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "81", "bbox": {"l": 151.07401, "t": 197.33452999999997, "r": 159.41275, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 173.42723, "t": 197.33452999999997, "r": 189.38742, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "Text", "bbox": {"l": 173.42723, "t": 197.33452999999997, "r": 189.38742, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 211.25647, "t": 197.33452999999997, "r": 219.59521, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "82", "bbox": {"l": 211.25647, "t": 197.33452999999997, "r": 219.59521, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 241.46426, "t": 197.33452999999997, "r": 257.42447, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "Text", "bbox": {"l": 241.46426, "t": 197.33452999999997, "r": 257.42447, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 86.372002, "t": 208.29351999999994, "r": 128.89964, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "Page-footer", "bbox": {"l": 86.372002, "t": 208.29351999999994, "r": 128.89964, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 151.07401, "t": 208.29351999999994, "r": 159.41275, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "62", "bbox": {"l": 151.07401, "t": 208.29351999999994, "r": 159.41275, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 177.23795, "t": 208.29351999999994, "r": 185.57669, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "62", "bbox": {"l": 177.23795, "t": 208.29351999999994, "r": 185.57669, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 213.91052, "t": 208.29351999999994, "r": 216.94116, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "-", "bbox": {"l": 213.91052, "t": 208.29351999999994, "r": 216.94116, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 247.92905000000002, "t": 208.29351999999994, "r": 250.95969, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "-", "bbox": {"l": 247.92905000000002, "t": 208.29351999999994, "r": 250.95969, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 86.372002, "t": 219.25256000000002, "r": 131.65231, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "Page-header", "bbox": {"l": 86.372002, "t": 219.25256000000002, "r": 131.65231, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 151.07401, "t": 219.25256000000002, "r": 159.41275, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "72", "bbox": {"l": 151.07401, "t": 219.25256000000002, "r": 159.41275, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 177.23795, "t": 219.25256000000002, "r": 185.57669, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "68", "bbox": {"l": 177.23795, "t": 219.25256000000002, "r": 185.57669, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 213.91052, "t": 219.25256000000002, "r": 216.94116, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "-", "bbox": {"l": 213.91052, "t": 219.25256000000002, "r": 216.94116, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 247.92905000000002, "t": 219.25256000000002, "r": 250.95969, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "-", "bbox": {"l": 247.92905000000002, "t": 219.25256000000002, "r": 250.95969, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 86.372002, "t": 230.21155, "r": 112.35663, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "Picture", "bbox": {"l": 86.372002, "t": 230.21155, "r": 112.35663, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 151.07401, "t": 230.21155, "r": 159.41275, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "72", "bbox": {"l": 151.07401, "t": 230.21155, "r": 159.41275, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 177.23795, "t": 230.21155, "r": 185.57669, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "72", "bbox": {"l": 177.23795, "t": 230.21155, "r": 185.57669, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 211.25645, "t": 230.21155, "r": 219.5952, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "72", "bbox": {"l": 211.25645, "t": 230.21155, "r": 219.5952, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 245.27496, "t": 230.21155, "r": 253.61371, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "72", "bbox": {"l": 245.27496, "t": 230.21155, "r": 253.61371, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 86.372002, "t": 241.16956000000005, "r": 141.11188, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "Section-header", "bbox": {"l": 86.372002, "t": 241.16956000000005, "r": 141.11188, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 151.07401, "t": 241.16956000000005, "r": 159.41275, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "68", "bbox": {"l": 151.07401, "t": 241.16956000000005, "r": 159.41275, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 177.23795, "t": 241.16956000000005, "r": 185.57669, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "67", "bbox": {"l": 177.23795, "t": 241.16956000000005, "r": 185.57669, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 211.25645, "t": 241.16956000000005, "r": 219.5952, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "69", "bbox": {"l": 211.25645, "t": 241.16956000000005, "r": 219.5952, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 245.27496, "t": 241.16956000000005, "r": 253.61371, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "68", "bbox": {"l": 245.27496, "t": 241.16956000000005, "r": 253.61371, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 86.372002, "t": 252.12854000000004, "r": 106.17878, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "Table", "bbox": {"l": 86.372002, "t": 252.12854000000004, "r": 106.17878, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 151.07401, "t": 252.12854000000004, "r": 159.41275, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "82", "bbox": {"l": 151.07401, "t": 252.12854000000004, "r": 159.41275, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 177.23795, "t": 252.12854000000004, "r": 185.57669, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "83", "bbox": {"l": 177.23795, "t": 252.12854000000004, "r": 185.57669, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 211.25645, "t": 252.12854000000004, "r": 219.5952, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "82", "bbox": {"l": 211.25645, "t": 252.12854000000004, "r": 219.5952, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 245.27496, "t": 252.12854000000004, "r": 253.61371, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "82", "bbox": {"l": 245.27496, "t": 252.12854000000004, "r": 253.61371, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 86.372002, "t": 263.08752000000004, "r": 102.3322, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "Text", "bbox": {"l": 86.372002, "t": 263.08752000000004, "r": 102.3322, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 151.07401, "t": 263.08752000000004, "r": 159.41275, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "85", "bbox": {"l": 151.07401, "t": 263.08752000000004, "r": 159.41275, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 177.23795, "t": 263.08752000000004, "r": 185.57669, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "84", "bbox": {"l": 177.23795, "t": 263.08752000000004, "r": 185.57669, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 211.25645, "t": 263.08752000000004, "r": 219.5952, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "84", "bbox": {"l": 211.25645, "t": 263.08752000000004, "r": 219.5952, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 245.27496, "t": 263.08752000000004, "r": 253.61371, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "84", "bbox": {"l": 245.27496, "t": 263.08752000000004, "r": 253.61371, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 86.372002, "t": 274.04657, "r": 103.36333, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "Title", "bbox": {"l": 86.372002, "t": 274.04657, "r": 103.36333, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 151.07401, "t": 274.04657, "r": 159.41275, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "77", "bbox": {"l": 151.07401, "t": 274.04657, "r": 159.41275, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 169.37442, "t": 274.04657, "r": 193.43127, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "Sec.-h.", "bbox": {"l": 169.37442, "t": 274.04657, "r": 193.43127, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 203.39294, "t": 274.04657, "r": 227.4498, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "Sec.-h.", "bbox": {"l": 203.39294, "t": 274.04657, "r": 227.4498, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 237.41147, "t": 274.04657, "r": 261.46832, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "Sec.-h.", "bbox": {"l": 237.41147, "t": 274.04657, "r": 261.46832, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 86.372002, "t": 285.40454, "r": 113.31602000000001, "b": 293.77917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "Overall", "bbox": {"l": 86.372002, "t": 285.40454, "r": 113.31602000000001, "b": 293.77917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 151.07401, "t": 285.40454, "r": 159.41275, "b": 293.77917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "72", "bbox": {"l": 151.07401, "t": 285.40454, "r": 159.41275, "b": 293.77917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 177.23795, "t": 285.40454, "r": 185.57669, "b": 293.77917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "73", "bbox": {"l": 177.23795, "t": 285.40454, "r": 185.57669, "b": 293.77917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 211.25645, "t": 285.40454, "r": 219.5952, "b": 293.77917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "78", "bbox": {"l": 211.25645, "t": 285.40454, "r": 219.5952, "b": 293.77917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 245.27496, "t": 285.40454, "r": 253.61371, "b": 293.77917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "77", "bbox": {"l": 245.27496, "t": 285.40454, "r": 253.61371, "b": 293.77917, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 10, "label": "section_header", "bbox": {"l": 53.79800000000001, "t": 319.56992, "r": 131.05624, "b": 329.879, "coord_origin": "TOPLEFT"}, "confidence": 0.9555686116218567, "cells": [{"id": 71, "text": "Learning Curve", "bbox": {"l": 53.79800000000001, "t": 319.56992, "r": 131.05624, "b": 329.879, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "text", "bbox": {"l": 52.785, "t": 334.77155, "r": 295.55835, "b": 529.44818, "coord_origin": "TOPLEFT"}, "confidence": 0.9857739210128784, "cells": [{"id": 72, "text": "One of the fundamental questions related to any dataset is if it is", "bbox": {"l": 53.79800000000001, "t": 334.77155, "r": 294.04153, "b": 343.14618, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "\u201clarge enough\u201d. To answer this question for DocLayNet, we per-", "bbox": {"l": 52.785, "t": 345.73053, "r": 295.55835, "b": 354.10516000000007, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "formed a data ablation study in which we evaluated a Mask R-CNN", "bbox": {"l": 53.79800000000001, "t": 356.6895400000001, "r": 294.04535, "b": 365.06418, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "model trained on increasing fractions of the DocLayNet dataset.", "bbox": {"l": 53.79800000000001, "t": 367.64853, "r": 295.4281, "b": 376.02316, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "As can be seen in Figure 5, the mAP score rises sharply in the be-", "bbox": {"l": 53.484001, "t": 378.60754, "r": 295.55667, "b": 386.98218, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "ginning and eventually levels out. To estimate the error-bar on the", "bbox": {"l": 53.79800000000001, "t": 389.56653, "r": 294.04865, "b": 397.94116, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "metrics, we ran the training five times on the entire data-set. This", "bbox": {"l": 53.79800000000001, "t": 400.52554000000003, "r": 294.04376, "b": 408.90018, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "resulted in a 1% error-bar, depicted by the shaded area in Figure 5.", "bbox": {"l": 53.79800000000001, "t": 411.48456, "r": 295.42459, "b": 419.85919, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "In the inset of Figure 5, we show the exact same data-points, but", "bbox": {"l": 53.79800000000001, "t": 422.44354, "r": 294.04709, "b": 430.81818, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "with a logarithmic scale on the x-axis. As is expected, the mAP", "bbox": {"l": 53.466999, "t": 433.40253000000007, "r": 294.04535, "b": 441.7771599999999, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "score increases linearly as a function of the data-size in the inset.", "bbox": {"l": 53.79800000000001, "t": 444.36053000000004, "r": 295.42902, "b": 452.73517, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "The curve ultimately flattens out between the 80% and 100% mark,", "bbox": {"l": 53.528999, "t": 455.31955, "r": 295.03122, "b": 463.69418, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "with the 80% mark falling within the error-bars of the 100% mark.", "bbox": {"l": 53.466999, "t": 466.27853, "r": 295.42154, "b": 474.65317, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "This provides a good indication that the model would not improve", "bbox": {"l": 53.528999, "t": 477.23755, "r": 294.04553, "b": 485.61218, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "significantly by yet increasing the data size. Rather, it would prob-", "bbox": {"l": 53.79800000000001, "t": 488.19653, "r": 295.55646, "b": 496.57117, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "ably benefit more from improved data consistency (as discussed", "bbox": {"l": 53.79800000000001, "t": 499.15555, "r": 294.04715, "b": 507.53018, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "in Section 3), data augmentation methods [23], or the addition of", "bbox": {"l": 53.79800000000001, "t": 510.11453, "r": 294.04245, "b": 518.4891700000001, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "more document categories and styles.", "bbox": {"l": 53.79800000000001, "t": 521.0735500000001, "r": 191.47707, "b": 529.44818, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "section_header", "bbox": {"l": 53.79800000000001, "t": 542.50992, "r": 164.32898, "b": 552.81902, "coord_origin": "TOPLEFT"}, "confidence": 0.9572026133537292, "cells": [{"id": 90, "text": "Impact of Class Labels", "bbox": {"l": 53.79800000000001, "t": 542.50992, "r": 164.32898, "b": 552.81902, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 53.466999, "t": 557.71155, "r": 295.55679, "b": 708.55217, "coord_origin": "TOPLEFT"}, "confidence": 0.9876301884651184, "cells": [{"id": 91, "text": "The choice and number of labels can have a significant effect on", "bbox": {"l": 53.528999, "t": 557.71155, "r": 294.04333, "b": 566.08617, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "the overall model performance. Since PubLayNet, DocBank and", "bbox": {"l": 53.79800000000001, "t": 568.6705499999999, "r": 294.04712, "b": 577.04517, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "DocLayNet all have different label sets, it is of particular interest to", "bbox": {"l": 53.79800000000001, "t": 579.62955, "r": 294.04538, "b": 588.0041699999999, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "understand and quantify this influence of the label set on the model", "bbox": {"l": 53.79800000000001, "t": 590.5885499999999, "r": 294.04535, "b": 598.96317, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "performance. We investigate this by either down-mapping labels", "bbox": {"l": 53.79800000000001, "t": 601.54755, "r": 294.04266, "b": 609.92216, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "into more common ones (e.g.", "bbox": {"l": 53.79800000000001, "t": 612.50656, "r": 163.59247, "b": 620.88118, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "Caption", "bbox": {"l": 166.26401, "t": 612.55139, "r": 194.97244, "b": 620.89015, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "\u2192", "bbox": {"l": 194.994, "t": 612.45276, "r": 204.1756, "b": 620.15491, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "Text", "bbox": {"l": 204.17599, "t": 612.55139, "r": 219.33961000000002, "b": 620.89015, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": ") or excluding them", "bbox": {"l": 219.849, "t": 612.50656, "r": 294.04828, "b": 620.88118, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "from the annotations entirely. Furthermore, it must be stressed", "bbox": {"l": 53.79800000000001, "t": 623.46556, "r": 294.04709, "b": 631.84018, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "that all mappings and exclusions were performed on the data be-", "bbox": {"l": 53.79800000000001, "t": 634.42355, "r": 295.55679, "b": 642.79817, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "fore model training. In Table 3, we present the mAP scores for a", "bbox": {"l": 53.79800000000001, "t": 645.38255, "r": 294.04715, "b": 653.75717, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "Mask R-CNN R50 network on different label sets. Where a label", "bbox": {"l": 53.79800000000001, "t": 656.34155, "r": 294.04715, "b": 664.71617, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "is down-mapped, we show its corresponding label, otherwise it", "bbox": {"l": 53.79800000000001, "t": 667.30055, "r": 294.04712, "b": 675.67517, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "was excluded. We present three different label sets, with 6, 5 and 4", "bbox": {"l": 53.466999, "t": 678.25955, "r": 294.25174, "b": 686.63417, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "different labels respectively. The set of 5 labels contains the same", "bbox": {"l": 53.79800000000001, "t": 689.21855, "r": 294.04639, "b": 697.59317, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "labels as PubLayNet. However, due to the different definition of", "bbox": {"l": 53.79800000000001, "t": 700.177551, "r": 294.04712, "b": 708.55217, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 317.659, "t": 86.87298999999996, "r": 559.80682, "b": 128.22321, "coord_origin": "TOPLEFT"}, "confidence": 0.8736215829849243, "cells": [{"id": 109, "text": "Table 4: Performance of a Mask R-CNN R50 network with", "bbox": {"l": 317.659, "t": 86.87298999999996, "r": 558.20068, "b": 95.34625000000017, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "document-wise and page-wise split for different label sets.", "bbox": {"l": 317.95499, "t": 97.83196999999996, "r": 559.73401, "b": 106.30524000000003, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "Naive page-wise split will result in", "bbox": {"l": 317.95499, "t": 108.79094999999995, "r": 467.72089, "b": 117.26422000000014, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "GLYPH<tildelow>", "bbox": {"l": 471.90900000000005, "t": 107.12798999999995, "r": 477.53900000000004, "b": 115.19768999999997, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "10% point improve-", "bbox": {"l": 477.54001000000005, "t": 108.79094999999995, "r": 559.80682, "b": 117.26422000000014, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "ment.", "bbox": {"l": 317.95502, "t": 119.74993999999992, "r": 341.37524, "b": 128.22321, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "table", "bbox": {"l": 352.97747802734375, "t": 150.791259765625, "r": 522.9158935546875, "b": 306.2658386230469, "coord_origin": "TOPLEFT"}, "confidence": 0.9879696369171143, "cells": [{"id": 115, "text": "Class-count", "bbox": {"l": 358.63901, "t": 153.10051999999996, "r": 401.73154, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "11", "bbox": {"l": 440.22501, "t": 153.10051999999996, "r": 448.56375, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "5", "bbox": {"l": 494.38, "t": 153.10051999999996, "r": 498.54938, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "Split", "bbox": {"l": 358.63901, "t": 164.05951000000005, "r": 375.27167, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "Doc", "bbox": {"l": 423.341, "t": 164.05951000000005, "r": 438.0459, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "Page", "bbox": {"l": 448.00757, "t": 164.05951000000005, "r": 465.4472, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "Doc", "bbox": {"l": 475.41101, "t": 164.05951000000005, "r": 490.11591, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Page", "bbox": {"l": 500.07757999999995, "t": 164.05951000000005, "r": 517.51721, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "Caption", "bbox": {"l": 358.63901, "t": 175.41656, "r": 387.82465, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "68", "bbox": {"l": 426.52399, "t": 175.41656, "r": 434.86273, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "83", "bbox": {"l": 452.56240999999994, "t": 175.41656, "r": 460.90115000000003, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "Footnote", "bbox": {"l": 358.63901, "t": 186.37554999999998, "r": 391.14221, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "71", "bbox": {"l": 426.52399, "t": 186.37554999999998, "r": 434.86273, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "84", "bbox": {"l": 452.56240999999994, "t": 186.37554999999998, "r": 460.90115000000003, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "Formula", "bbox": {"l": 358.63901, "t": 197.33452999999997, "r": 389.15167, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "60", "bbox": {"l": 426.52399, "t": 197.33452999999997, "r": 434.86273, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "66", "bbox": {"l": 452.56240999999994, "t": 197.33452999999997, "r": 460.90115000000003, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "List-item", "bbox": {"l": 358.63901, "t": 208.29351999999994, "r": 391.5188, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "81", "bbox": {"l": 426.52399, "t": 208.29351999999994, "r": 434.86273, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "88", "bbox": {"l": 452.56240999999994, "t": 208.29351999999994, "r": 460.90115000000003, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "82", "bbox": {"l": 478.59399, "t": 208.29351999999994, "r": 486.93274, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "88", "bbox": {"l": 504.6324200000001, "t": 208.29351999999994, "r": 512.97119, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "Page-footer", "bbox": {"l": 358.63901, "t": 219.25256000000002, "r": 401.16666, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "62", "bbox": {"l": 426.52399, "t": 219.25256000000002, "r": 434.86273, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "89", "bbox": {"l": 452.56240999999994, "t": 219.25256000000002, "r": 460.90115000000003, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "Page-header", "bbox": {"l": 358.63901, "t": 230.21155, "r": 403.91931, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "72", "bbox": {"l": 426.52399, "t": 230.21155, "r": 434.86273, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "90", "bbox": {"l": 452.56240999999994, "t": 230.21155, "r": 460.90115000000003, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "Picture", "bbox": {"l": 358.63901, "t": 241.16956000000005, "r": 384.62366, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "72", "bbox": {"l": 426.52399, "t": 241.16956000000005, "r": 434.86273, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "82", "bbox": {"l": 452.56240999999994, "t": 241.16956000000005, "r": 460.90115000000003, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "72", "bbox": {"l": 478.59399, "t": 241.16956000000005, "r": 486.93274, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "82", "bbox": {"l": 504.6324200000001, "t": 241.16956000000005, "r": 512.97119, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "Section-header", "bbox": {"l": 358.63901, "t": 252.12854000000004, "r": 413.37891, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "68", "bbox": {"l": 426.52399, "t": 252.12854000000004, "r": 434.86273, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "83", "bbox": {"l": 452.56240999999994, "t": 252.12854000000004, "r": 460.90115000000003, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "69", "bbox": {"l": 478.59399, "t": 252.12854000000004, "r": 486.93274, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "83", "bbox": {"l": 504.6324200000001, "t": 252.12854000000004, "r": 512.97119, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "Table", "bbox": {"l": 358.63901, "t": 263.08752000000004, "r": 378.44577, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "82", "bbox": {"l": 426.52399, "t": 263.08752000000004, "r": 434.86273, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "89", "bbox": {"l": 452.56240999999994, "t": 263.08752000000004, "r": 460.90115000000003, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "82", "bbox": {"l": 478.59399, "t": 263.08752000000004, "r": 486.93274, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "90", "bbox": {"l": 504.6324200000001, "t": 263.08752000000004, "r": 512.97119, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "Text", "bbox": {"l": 358.63901, "t": 274.04657, "r": 374.59921, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "85", "bbox": {"l": 426.52399, "t": 274.04657, "r": 434.86273, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "91", "bbox": {"l": 452.56240999999994, "t": 274.04657, "r": 460.90115000000003, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "84", "bbox": {"l": 478.59399, "t": 274.04657, "r": 486.93274, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "90", "bbox": {"l": 504.6324200000001, "t": 274.04657, "r": 512.97119, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "Title", "bbox": {"l": 358.63901, "t": 285.00552, "r": 375.63034, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "77", "bbox": {"l": 426.52399, "t": 285.00552, "r": 434.86273, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "81", "bbox": {"l": 452.56240999999994, "t": 285.00552, "r": 460.90115000000003, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "All", "bbox": {"l": 358.63901, "t": 296.36255, "r": 369.60492, "b": 304.73718, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "72", "bbox": {"l": 426.52399, "t": 296.36255, "r": 434.86273, "b": 304.73718, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "84", "bbox": {"l": 452.56240999999994, "t": 296.36255, "r": 460.90115000000003, "b": 304.73718, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "78", "bbox": {"l": 478.59399, "t": 296.36255, "r": 486.93274, "b": 304.73718, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "87", "bbox": {"l": 504.6324200000001, "t": 296.36255, "r": 512.97119, "b": 304.73718, "coord_origin": "TOPLEFT"}}], "children": [{"id": 80, "label": "text", "bbox": {"l": 358.63901, "t": 153.10051999999996, "r": 401.73154, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 115, "text": "Class-count", "bbox": {"l": 358.63901, "t": 153.10051999999996, "r": 401.73154, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 440.22501, "t": 153.10051999999996, "r": 448.56375, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 116, "text": "11", "bbox": {"l": 440.22501, "t": 153.10051999999996, "r": 448.56375, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 494.38, "t": 153.10051999999996, "r": 498.54938, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 117, "text": "5", "bbox": {"l": 494.38, "t": 153.10051999999996, "r": 498.54938, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 358.63901, "t": 164.05951000000005, "r": 375.27167, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 118, "text": "Split", "bbox": {"l": 358.63901, "t": 164.05951000000005, "r": 375.27167, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 423.341, "t": 164.05951000000005, "r": 438.0459, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 119, "text": "Doc", "bbox": {"l": 423.341, "t": 164.05951000000005, "r": 438.0459, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 448.00757, "t": 164.05951000000005, "r": 465.4472, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 120, "text": "Page", "bbox": {"l": 448.00757, "t": 164.05951000000005, "r": 465.4472, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 475.41101, "t": 164.05951000000005, "r": 490.11591, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 121, "text": "Doc", "bbox": {"l": 475.41101, "t": 164.05951000000005, "r": 490.11591, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 500.07757999999995, "t": 164.05951000000005, "r": 517.51721, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 122, "text": "Page", "bbox": {"l": 500.07757999999995, "t": 164.05951000000005, "r": 517.51721, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 358.63901, "t": 175.41656, "r": 387.82465, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 123, "text": "Caption", "bbox": {"l": 358.63901, "t": 175.41656, "r": 387.82465, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 426.52399, "t": 175.41656, "r": 434.86273, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 124, "text": "68", "bbox": {"l": 426.52399, "t": 175.41656, "r": 434.86273, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 452.56240999999994, "t": 175.41656, "r": 460.90115000000003, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 125, "text": "83", "bbox": {"l": 452.56240999999994, "t": 175.41656, "r": 460.90115000000003, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 358.63901, "t": 186.37554999999998, "r": 391.14221, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 126, "text": "Footnote", "bbox": {"l": 358.63901, "t": 186.37554999999998, "r": 391.14221, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 426.52399, "t": 186.37554999999998, "r": 434.86273, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 127, "text": "71", "bbox": {"l": 426.52399, "t": 186.37554999999998, "r": 434.86273, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 452.56240999999994, "t": 186.37554999999998, "r": 460.90115000000003, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 128, "text": "84", "bbox": {"l": 452.56240999999994, "t": 186.37554999999998, "r": 460.90115000000003, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 358.63901, "t": 197.33452999999997, "r": 389.15167, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 129, "text": "Formula", "bbox": {"l": 358.63901, "t": 197.33452999999997, "r": 389.15167, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 426.52399, "t": 197.33452999999997, "r": 434.86273, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 130, "text": "60", "bbox": {"l": 426.52399, "t": 197.33452999999997, "r": 434.86273, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 452.56240999999994, "t": 197.33452999999997, "r": 460.90115000000003, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 131, "text": "66", "bbox": {"l": 452.56240999999994, "t": 197.33452999999997, "r": 460.90115000000003, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 358.63901, "t": 208.29351999999994, "r": 391.5188, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 132, "text": "List-item", "bbox": {"l": 358.63901, "t": 208.29351999999994, "r": 391.5188, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 426.52399, "t": 208.29351999999994, "r": 434.86273, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 133, "text": "81", "bbox": {"l": 426.52399, "t": 208.29351999999994, "r": 434.86273, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 452.56240999999994, "t": 208.29351999999994, "r": 460.90115000000003, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 134, "text": "88", "bbox": {"l": 452.56240999999994, "t": 208.29351999999994, "r": 460.90115000000003, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 478.59399, "t": 208.29351999999994, "r": 486.93274, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 135, "text": "82", "bbox": {"l": 478.59399, "t": 208.29351999999994, "r": 486.93274, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 504.6324200000001, "t": 208.29351999999994, "r": 512.97119, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 136, "text": "88", "bbox": {"l": 504.6324200000001, "t": 208.29351999999994, "r": 512.97119, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 358.63901, "t": 219.25256000000002, "r": 401.16666, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 137, "text": "Page-footer", "bbox": {"l": 358.63901, "t": 219.25256000000002, "r": 401.16666, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 426.52399, "t": 219.25256000000002, "r": 434.86273, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 138, "text": "62", "bbox": {"l": 426.52399, "t": 219.25256000000002, "r": 434.86273, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 452.56240999999994, "t": 219.25256000000002, "r": 460.90115000000003, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 139, "text": "89", "bbox": {"l": 452.56240999999994, "t": 219.25256000000002, "r": 460.90115000000003, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 358.63901, "t": 230.21155, "r": 403.91931, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 140, "text": "Page-header", "bbox": {"l": 358.63901, "t": 230.21155, "r": 403.91931, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 426.52399, "t": 230.21155, "r": 434.86273, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 141, "text": "72", "bbox": {"l": 426.52399, "t": 230.21155, "r": 434.86273, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 452.56240999999994, "t": 230.21155, "r": 460.90115000000003, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 142, "text": "90", "bbox": {"l": 452.56240999999994, "t": 230.21155, "r": 460.90115000000003, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 358.63901, "t": 241.16956000000005, "r": 384.62366, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 143, "text": "Picture", "bbox": {"l": 358.63901, "t": 241.16956000000005, "r": 384.62366, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 426.52399, "t": 241.16956000000005, "r": 434.86273, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 144, "text": "72", "bbox": {"l": 426.52399, "t": 241.16956000000005, "r": 434.86273, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 452.56240999999994, "t": 241.16956000000005, "r": 460.90115000000003, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 145, "text": "82", "bbox": {"l": 452.56240999999994, "t": 241.16956000000005, "r": 460.90115000000003, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 478.59399, "t": 241.16956000000005, "r": 486.93274, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 146, "text": "72", "bbox": {"l": 478.59399, "t": 241.16956000000005, "r": 486.93274, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 504.6324200000001, "t": 241.16956000000005, "r": 512.97119, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 147, "text": "82", "bbox": {"l": 504.6324200000001, "t": 241.16956000000005, "r": 512.97119, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 358.63901, "t": 252.12854000000004, "r": 413.37891, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 148, "text": "Section-header", "bbox": {"l": 358.63901, "t": 252.12854000000004, "r": 413.37891, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 114, "label": "text", "bbox": {"l": 426.52399, "t": 252.12854000000004, "r": 434.86273, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 149, "text": "68", "bbox": {"l": 426.52399, "t": 252.12854000000004, "r": 434.86273, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 115, "label": "text", "bbox": {"l": 452.56240999999994, "t": 252.12854000000004, "r": 460.90115000000003, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 150, "text": "83", "bbox": {"l": 452.56240999999994, "t": 252.12854000000004, "r": 460.90115000000003, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 116, "label": "text", "bbox": {"l": 478.59399, "t": 252.12854000000004, "r": 486.93274, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 151, "text": "69", "bbox": {"l": 478.59399, "t": 252.12854000000004, "r": 486.93274, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 117, "label": "text", "bbox": {"l": 504.6324200000001, "t": 252.12854000000004, "r": 512.97119, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 152, "text": "83", "bbox": {"l": 504.6324200000001, "t": 252.12854000000004, "r": 512.97119, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 118, "label": "text", "bbox": {"l": 358.63901, "t": 263.08752000000004, "r": 378.44577, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 153, "text": "Table", "bbox": {"l": 358.63901, "t": 263.08752000000004, "r": 378.44577, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 119, "label": "text", "bbox": {"l": 426.52399, "t": 263.08752000000004, "r": 434.86273, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 154, "text": "82", "bbox": {"l": 426.52399, "t": 263.08752000000004, "r": 434.86273, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 120, "label": "text", "bbox": {"l": 452.56240999999994, "t": 263.08752000000004, "r": 460.90115000000003, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 155, "text": "89", "bbox": {"l": 452.56240999999994, "t": 263.08752000000004, "r": 460.90115000000003, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 121, "label": "text", "bbox": {"l": 478.59399, "t": 263.08752000000004, "r": 486.93274, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 156, "text": "82", "bbox": {"l": 478.59399, "t": 263.08752000000004, "r": 486.93274, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 122, "label": "text", "bbox": {"l": 504.6324200000001, "t": 263.08752000000004, "r": 512.97119, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 157, "text": "90", "bbox": {"l": 504.6324200000001, "t": 263.08752000000004, "r": 512.97119, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 123, "label": "text", "bbox": {"l": 358.63901, "t": 274.04657, "r": 374.59921, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 158, "text": "Text", "bbox": {"l": 358.63901, "t": 274.04657, "r": 374.59921, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 124, "label": "text", "bbox": {"l": 426.52399, "t": 274.04657, "r": 434.86273, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 159, "text": "85", "bbox": {"l": 426.52399, "t": 274.04657, "r": 434.86273, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 125, "label": "text", "bbox": {"l": 452.56240999999994, "t": 274.04657, "r": 460.90115000000003, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 160, "text": "91", "bbox": {"l": 452.56240999999994, "t": 274.04657, "r": 460.90115000000003, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 126, "label": "text", "bbox": {"l": 478.59399, "t": 274.04657, "r": 486.93274, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 161, "text": "84", "bbox": {"l": 478.59399, "t": 274.04657, "r": 486.93274, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 127, "label": "text", "bbox": {"l": 504.6324200000001, "t": 274.04657, "r": 512.97119, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 162, "text": "90", "bbox": {"l": 504.6324200000001, "t": 274.04657, "r": 512.97119, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 128, "label": "text", "bbox": {"l": 358.63901, "t": 285.00552, "r": 375.63034, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 163, "text": "Title", "bbox": {"l": 358.63901, "t": 285.00552, "r": 375.63034, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 129, "label": "text", "bbox": {"l": 426.52399, "t": 285.00552, "r": 434.86273, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 164, "text": "77", "bbox": {"l": 426.52399, "t": 285.00552, "r": 434.86273, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 130, "label": "text", "bbox": {"l": 452.56240999999994, "t": 285.00552, "r": 460.90115000000003, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 165, "text": "81", "bbox": {"l": 452.56240999999994, "t": 285.00552, "r": 460.90115000000003, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 131, "label": "text", "bbox": {"l": 358.63901, "t": 296.36255, "r": 369.60492, "b": 304.73718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 166, "text": "All", "bbox": {"l": 358.63901, "t": 296.36255, "r": 369.60492, "b": 304.73718, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 132, "label": "text", "bbox": {"l": 426.52399, "t": 296.36255, "r": 434.86273, "b": 304.73718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 167, "text": "72", "bbox": {"l": 426.52399, "t": 296.36255, "r": 434.86273, "b": 304.73718, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 133, "label": "text", "bbox": {"l": 452.56240999999994, "t": 296.36255, "r": 460.90115000000003, "b": 304.73718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 168, "text": "84", "bbox": {"l": 452.56240999999994, "t": 296.36255, "r": 460.90115000000003, "b": 304.73718, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 134, "label": "text", "bbox": {"l": 478.59399, "t": 296.36255, "r": 486.93274, "b": 304.73718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 169, "text": "78", "bbox": {"l": 478.59399, "t": 296.36255, "r": 486.93274, "b": 304.73718, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 135, "label": "text", "bbox": {"l": 504.6324200000001, "t": 296.36255, "r": 512.97119, "b": 304.73718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 170, "text": "87", "bbox": {"l": 504.6324200000001, "t": 296.36255, "r": 512.97119, "b": 304.73718, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 6, "label": "text", "bbox": {"l": 317.686, "t": 331.40353, "r": 559.58496, "b": 416.49017, "coord_origin": "TOPLEFT"}, "confidence": 0.9740146994590759, "cells": [{"id": 171, "text": "lists in PubLayNet (grouped list-items) versus DocLayNet (separate", "bbox": {"l": 317.95499, "t": 331.40353, "r": 558.20233, "b": 339.77817, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "list-items), the label set of size 4 is the closest to PubLayNet, in the", "bbox": {"l": 317.95499, "t": 342.36255, "r": 558.2005, "b": 350.73718, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "assumption that the", "bbox": {"l": 317.95499, "t": 353.32153, "r": 393.16028, "b": 361.69617000000005, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "List", "bbox": {"l": 395.84201, "t": 353.36639, "r": 409.14905, "b": 361.70514, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "is down-mapped to", "bbox": {"l": 412.33301, "t": 353.32153, "r": 485.02324999999996, "b": 361.69617000000005, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "Text", "bbox": {"l": 487.70401, "t": 353.36639, "r": 502.86761, "b": 361.70514, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "in PubLayNet.", "bbox": {"l": 506.05499, "t": 353.32153, "r": 559.58496, "b": 361.69617000000005, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "The results in Table 3 show that the prediction accuracy on the", "bbox": {"l": 317.686, "t": 364.28054999999995, "r": 558.2002, "b": 372.65518, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "remaining class labels does not change significantly when other", "bbox": {"l": 317.95499, "t": 375.23853, "r": 558.36877, "b": 383.61316, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "classes are merged into them. The overall macro-average improves", "bbox": {"l": 317.95499, "t": 386.19754, "r": 558.19958, "b": 394.57217, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "by around 5%, in particular when", "bbox": {"l": 317.95499, "t": 397.15652, "r": 439.49454, "b": 405.53116000000006, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "Page-footer", "bbox": {"l": 441.728, "t": 397.20139, "r": 481.8616, "b": 405.54013, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "and", "bbox": {"l": 484.74298, "t": 397.15652, "r": 498.23743, "b": 405.53116000000006, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "Page-header", "bbox": {"l": 500.47299, "t": 397.20139, "r": 543.95105, "b": 405.54013, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": "are", "bbox": {"l": 546.83197, "t": 397.15652, "r": 558.20142, "b": 405.53116000000006, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "excluded.", "bbox": {"l": 317.95496, "t": 408.11553999999995, "r": 352.37698, "b": 416.49017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "section_header", "bbox": {"l": 317.95496, "t": 429.3949, "r": 549.8606, "b": 439.70398, "coord_origin": "TOPLEFT"}, "confidence": 0.9562516808509827, "cells": [{"id": 187, "text": "Impact of Document Split in Train and Test Set", "bbox": {"l": 317.95496, "t": 429.3949, "r": 549.8606, "b": 439.70398, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 317.62299, "t": 444.59653, "r": 559.71381, "b": 595.43718, "coord_origin": "TOPLEFT"}, "confidence": 0.9869834184646606, "cells": [{"id": 188, "text": "Many documents in DocLayNet have a unique styling. In order", "bbox": {"l": 317.95499, "t": 444.59653, "r": 558.36884, "b": 452.97116, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "to avoid overfitting on a particular style, we have split the train-,", "bbox": {"l": 317.95499, "t": 455.55554, "r": 559.19189, "b": 463.93018, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "test- and validation-sets of DocLayNet on document boundaries, i.e.", "bbox": {"l": 317.95499, "t": 466.51453, "r": 559.58185, "b": 474.88916, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "every document contributes pages to only one set. To the best of", "bbox": {"l": 317.95499, "t": 477.47354, "r": 558.20605, "b": 485.84818, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": "our knowledge, this was not considered in PubLayNet or DocBank.", "bbox": {"l": 317.95499, "t": 488.43253, "r": 559.58203, "b": 496.80716, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "To quantify how this affects model performance, we trained and", "bbox": {"l": 317.686, "t": 499.39154, "r": 558.20032, "b": 507.76617, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "evaluated a Mask R-CNN R50 model on a modified dataset version.", "bbox": {"l": 317.95499, "t": 510.35052, "r": 559.5849, "b": 518.72516, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "Here, the train-, test- and validation-sets were obtained by a ran-", "bbox": {"l": 317.95499, "t": 521.30954, "r": 559.71381, "b": 529.68417, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "domised draw over the individual pages. As can be seen in Table 4,", "bbox": {"l": 317.95499, "t": 532.26855, "r": 559.18707, "b": 540.64317, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "the difference in model performance is surprisingly large: page-", "bbox": {"l": 317.95499, "t": 543.22655, "r": 559.71313, "b": 551.60117, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "wise splitting gains", "bbox": {"l": 317.62299, "t": 554.18555, "r": 388.35168, "b": 562.56017, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "\u02dc", "bbox": {"l": 391.36499, "t": 552.50055, "r": 393.98318, "b": 560.87517, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "10% in mAP over the document-wise splitting.", "bbox": {"l": 390.59, "t": 554.18555, "r": 559.58191, "b": 562.56017, "coord_origin": "TOPLEFT"}}, {"id": 201, "text": "Thus, random page-wise splitting of DocLayNet can easily lead", "bbox": {"l": 317.686, "t": 565.14455, "r": 558.20032, "b": 573.51917, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": "to accidental overestimation of model performance and should be", "bbox": {"l": 317.95499, "t": 576.10356, "r": 558.20508, "b": 584.4781800000001, "coord_origin": "TOPLEFT"}}, {"id": 203, "text": "avoided.", "bbox": {"l": 317.95499, "t": 587.06256, "r": 348.50354, "b": 595.43718, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "section_header", "bbox": {"l": 317.95499, "t": 608.34192, "r": 418.54776, "b": 618.65102, "coord_origin": "TOPLEFT"}, "confidence": 0.9589217305183411, "cells": [{"id": 204, "text": "Dataset Comparison", "bbox": {"l": 317.95499, "t": 608.34192, "r": 418.54776, "b": 618.65102, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 317.686, "t": 623.54355, "r": 559.18817, "b": 708.640137, "coord_origin": "TOPLEFT"}, "confidence": 0.9872549772262573, "cells": [{"id": 205, "text": "Throughout this paper, we claim that DocLayNet\u2019s wider variety of", "bbox": {"l": 317.686, "t": 623.54355, "r": 558.20575, "b": 631.91817, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": "document layouts leads to more robust layout detection models. In", "bbox": {"l": 317.95499, "t": 634.50255, "r": 558.20624, "b": 642.87717, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": "Table 5, we provide evidence for that. We trained models on each", "bbox": {"l": 317.686, "t": 645.46155, "r": 558.20319, "b": 653.83617, "coord_origin": "TOPLEFT"}}, {"id": 208, "text": "of the available datasets (PubLayNet, DocBank and DocLayNet)", "bbox": {"l": 317.95499, "t": 656.42055, "r": 558.74377, "b": 664.79517, "coord_origin": "TOPLEFT"}}, {"id": 209, "text": "and evaluated them on the test sets of the other datasets. Due to", "bbox": {"l": 317.95499, "t": 667.37955, "r": 558.20398, "b": 675.7541699999999, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": "the different label sets and annotation styles, a direct comparison", "bbox": {"l": 317.95499, "t": 678.3385499999999, "r": 558.20062, "b": 686.71317, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "is not possible. Hence, we focussed on the common labels among", "bbox": {"l": 317.95499, "t": 689.29755, "r": 558.20343, "b": 697.672173, "coord_origin": "TOPLEFT"}}, {"id": 212, "text": "the datasets. Between PubLayNet and DocLayNet, these are", "bbox": {"l": 317.95499, "t": 700.256554, "r": 531.07666, "b": 708.631172, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "Picture", "bbox": {"l": 533.16199, "t": 700.301384, "r": 557.2561, "b": 708.640137, "coord_origin": "TOPLEFT"}}, {"id": 214, "text": ",", "bbox": {"l": 557.255, "t": 700.256554, "r": 559.18817, "b": 708.631172, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {"4": {"label": "table", "id": 4, "page_no": 6, "cluster": {"id": 4, "label": "table", "bbox": {"l": 80.35525512695312, "t": 150.93629455566406, "r": 267.0082092285156, "b": 295.4454650878906, "coord_origin": "TOPLEFT"}, "confidence": 0.9869412779808044, "cells": [{"id": 6, "text": "Class-count", "bbox": {"l": 86.372002, "t": 153.10051999999996, "r": 129.46452, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "11", "bbox": {"l": 151.07401, "t": 153.10051999999996, "r": 159.41275, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "6", "bbox": {"l": 179.31816, "t": 153.10051999999996, "r": 183.48753, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "5", "bbox": {"l": 213.33669, "t": 153.10051999999996, "r": 217.50606, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "4", "bbox": {"l": 247.35521, "t": 153.10051999999996, "r": 251.52458, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Caption", "bbox": {"l": 86.372002, "t": 164.45752000000005, "r": 115.55763, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "68", "bbox": {"l": 151.07401, "t": 164.45752000000005, "r": 159.41275, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Text", "bbox": {"l": 173.42723, "t": 164.45752000000005, "r": 189.38742, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Text", "bbox": {"l": 207.44576, "t": 164.45752000000005, "r": 223.40594000000002, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Text", "bbox": {"l": 241.46428, "t": 164.45752000000005, "r": 257.42447, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Footnote", "bbox": {"l": 86.372002, "t": 175.41656, "r": 118.8752, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "71", "bbox": {"l": 151.07401, "t": 175.41656, "r": 159.41275, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Text", "bbox": {"l": 173.42723, "t": 175.41656, "r": 189.38742, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Text", "bbox": {"l": 207.44576, "t": 175.41656, "r": 223.40594000000002, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Text", "bbox": {"l": 241.46428, "t": 175.41656, "r": 257.42447, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Formula", "bbox": {"l": 86.372002, "t": 186.37554999999998, "r": 116.88466, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "60", "bbox": {"l": 151.07401, "t": 186.37554999999998, "r": 159.41275, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Text", "bbox": {"l": 173.42723, "t": 186.37554999999998, "r": 189.38742, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "Text", "bbox": {"l": 207.44576, "t": 186.37554999999998, "r": 223.40594000000002, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "Text", "bbox": {"l": 241.46428, "t": 186.37554999999998, "r": 257.42447, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "List-item", "bbox": {"l": 86.372002, "t": 197.33452999999997, "r": 119.25179, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "81", "bbox": {"l": 151.07401, "t": 197.33452999999997, "r": 159.41275, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Text", "bbox": {"l": 173.42723, "t": 197.33452999999997, "r": 189.38742, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "82", "bbox": {"l": 211.25647, "t": 197.33452999999997, "r": 219.59521, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Text", "bbox": {"l": 241.46426, "t": 197.33452999999997, "r": 257.42447, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Page-footer", "bbox": {"l": 86.372002, "t": 208.29351999999994, "r": 128.89964, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "62", "bbox": {"l": 151.07401, "t": 208.29351999999994, "r": 159.41275, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "62", "bbox": {"l": 177.23795, "t": 208.29351999999994, "r": 185.57669, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "-", "bbox": {"l": 213.91052, "t": 208.29351999999994, "r": 216.94116, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "-", "bbox": {"l": 247.92905000000002, "t": 208.29351999999994, "r": 250.95969, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Page-header", "bbox": {"l": 86.372002, "t": 219.25256000000002, "r": 131.65231, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "72", "bbox": {"l": 151.07401, "t": 219.25256000000002, "r": 159.41275, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "68", "bbox": {"l": 177.23795, "t": 219.25256000000002, "r": 185.57669, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "-", "bbox": {"l": 213.91052, "t": 219.25256000000002, "r": 216.94116, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "-", "bbox": {"l": 247.92905000000002, "t": 219.25256000000002, "r": 250.95969, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Picture", "bbox": {"l": 86.372002, "t": 230.21155, "r": 112.35663, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "72", "bbox": {"l": 151.07401, "t": 230.21155, "r": 159.41275, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "72", "bbox": {"l": 177.23795, "t": 230.21155, "r": 185.57669, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "72", "bbox": {"l": 211.25645, "t": 230.21155, "r": 219.5952, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "72", "bbox": {"l": 245.27496, "t": 230.21155, "r": 253.61371, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "Section-header", "bbox": {"l": 86.372002, "t": 241.16956000000005, "r": 141.11188, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "68", "bbox": {"l": 151.07401, "t": 241.16956000000005, "r": 159.41275, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "67", "bbox": {"l": 177.23795, "t": 241.16956000000005, "r": 185.57669, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "69", "bbox": {"l": 211.25645, "t": 241.16956000000005, "r": 219.5952, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "68", "bbox": {"l": 245.27496, "t": 241.16956000000005, "r": 253.61371, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Table", "bbox": {"l": 86.372002, "t": 252.12854000000004, "r": 106.17878, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "82", "bbox": {"l": 151.07401, "t": 252.12854000000004, "r": 159.41275, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "83", "bbox": {"l": 177.23795, "t": 252.12854000000004, "r": 185.57669, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "82", "bbox": {"l": 211.25645, "t": 252.12854000000004, "r": 219.5952, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "82", "bbox": {"l": 245.27496, "t": 252.12854000000004, "r": 253.61371, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Text", "bbox": {"l": 86.372002, "t": 263.08752000000004, "r": 102.3322, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "85", "bbox": {"l": 151.07401, "t": 263.08752000000004, "r": 159.41275, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "84", "bbox": {"l": 177.23795, "t": 263.08752000000004, "r": 185.57669, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "84", "bbox": {"l": 211.25645, "t": 263.08752000000004, "r": 219.5952, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "84", "bbox": {"l": 245.27496, "t": 263.08752000000004, "r": 253.61371, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "Title", "bbox": {"l": 86.372002, "t": 274.04657, "r": 103.36333, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "77", "bbox": {"l": 151.07401, "t": 274.04657, "r": 159.41275, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "Sec.-h.", "bbox": {"l": 169.37442, "t": 274.04657, "r": 193.43127, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "Sec.-h.", "bbox": {"l": 203.39294, "t": 274.04657, "r": 227.4498, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "Sec.-h.", "bbox": {"l": 237.41147, "t": 274.04657, "r": 261.46832, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "Overall", "bbox": {"l": 86.372002, "t": 285.40454, "r": 113.31602000000001, "b": 293.77917, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "72", "bbox": {"l": 151.07401, "t": 285.40454, "r": 159.41275, "b": 293.77917, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "73", "bbox": {"l": 177.23795, "t": 285.40454, "r": 185.57669, "b": 293.77917, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "78", "bbox": {"l": 211.25645, "t": 285.40454, "r": 219.5952, "b": 293.77917, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "77", "bbox": {"l": 245.27496, "t": 285.40454, "r": 253.61371, "b": 293.77917, "coord_origin": "TOPLEFT"}}], "children": [{"id": 15, "label": "text", "bbox": {"l": 86.372002, "t": 153.10051999999996, "r": 129.46452, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": "Class-count", "bbox": {"l": 86.372002, "t": 153.10051999999996, "r": 129.46452, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 151.07401, "t": 153.10051999999996, "r": 159.41275, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "11", "bbox": {"l": 151.07401, "t": 153.10051999999996, "r": 159.41275, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 179.31816, "t": 153.10051999999996, "r": 183.48753, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "6", "bbox": {"l": 179.31816, "t": 153.10051999999996, "r": 183.48753, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 213.33669, "t": 153.10051999999996, "r": 217.50606, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "5", "bbox": {"l": 213.33669, "t": 153.10051999999996, "r": 217.50606, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 247.35521, "t": 153.10051999999996, "r": 251.52458, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "4", "bbox": {"l": 247.35521, "t": 153.10051999999996, "r": 251.52458, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 86.372002, "t": 164.45752000000005, "r": 115.55763, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "Caption", "bbox": {"l": 86.372002, "t": 164.45752000000005, "r": 115.55763, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 151.07401, "t": 164.45752000000005, "r": 159.41275, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "68", "bbox": {"l": 151.07401, "t": 164.45752000000005, "r": 159.41275, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 173.42723, "t": 164.45752000000005, "r": 189.38742, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "Text", "bbox": {"l": 173.42723, "t": 164.45752000000005, "r": 189.38742, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 207.44576, "t": 164.45752000000005, "r": 223.40594000000002, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "Text", "bbox": {"l": 207.44576, "t": 164.45752000000005, "r": 223.40594000000002, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 241.46428, "t": 164.45752000000005, "r": 257.42447, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "Text", "bbox": {"l": 241.46428, "t": 164.45752000000005, "r": 257.42447, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 86.372002, "t": 175.41656, "r": 118.8752, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "Footnote", "bbox": {"l": 86.372002, "t": 175.41656, "r": 118.8752, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 151.07401, "t": 175.41656, "r": 159.41275, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "71", "bbox": {"l": 151.07401, "t": 175.41656, "r": 159.41275, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 173.42723, "t": 175.41656, "r": 189.38742, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "Text", "bbox": {"l": 173.42723, "t": 175.41656, "r": 189.38742, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 207.44576, "t": 175.41656, "r": 223.40594000000002, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "Text", "bbox": {"l": 207.44576, "t": 175.41656, "r": 223.40594000000002, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 241.46428, "t": 175.41656, "r": 257.42447, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "Text", "bbox": {"l": 241.46428, "t": 175.41656, "r": 257.42447, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 86.372002, "t": 186.37554999999998, "r": 116.88466, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "Formula", "bbox": {"l": 86.372002, "t": 186.37554999999998, "r": 116.88466, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 151.07401, "t": 186.37554999999998, "r": 159.41275, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "60", "bbox": {"l": 151.07401, "t": 186.37554999999998, "r": 159.41275, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 173.42723, "t": 186.37554999999998, "r": 189.38742, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "Text", "bbox": {"l": 173.42723, "t": 186.37554999999998, "r": 189.38742, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 207.44576, "t": 186.37554999999998, "r": 223.40594000000002, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "Text", "bbox": {"l": 207.44576, "t": 186.37554999999998, "r": 223.40594000000002, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 241.46428, "t": 186.37554999999998, "r": 257.42447, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "Text", "bbox": {"l": 241.46428, "t": 186.37554999999998, "r": 257.42447, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 86.372002, "t": 197.33452999999997, "r": 119.25179, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "List-item", "bbox": {"l": 86.372002, "t": 197.33452999999997, "r": 119.25179, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 151.07401, "t": 197.33452999999997, "r": 159.41275, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "81", "bbox": {"l": 151.07401, "t": 197.33452999999997, "r": 159.41275, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 173.42723, "t": 197.33452999999997, "r": 189.38742, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "Text", "bbox": {"l": 173.42723, "t": 197.33452999999997, "r": 189.38742, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 211.25647, "t": 197.33452999999997, "r": 219.59521, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "82", "bbox": {"l": 211.25647, "t": 197.33452999999997, "r": 219.59521, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 241.46426, "t": 197.33452999999997, "r": 257.42447, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "Text", "bbox": {"l": 241.46426, "t": 197.33452999999997, "r": 257.42447, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 86.372002, "t": 208.29351999999994, "r": 128.89964, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "Page-footer", "bbox": {"l": 86.372002, "t": 208.29351999999994, "r": 128.89964, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 151.07401, "t": 208.29351999999994, "r": 159.41275, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "62", "bbox": {"l": 151.07401, "t": 208.29351999999994, "r": 159.41275, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 177.23795, "t": 208.29351999999994, "r": 185.57669, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "62", "bbox": {"l": 177.23795, "t": 208.29351999999994, "r": 185.57669, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 213.91052, "t": 208.29351999999994, "r": 216.94116, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "-", "bbox": {"l": 213.91052, "t": 208.29351999999994, "r": 216.94116, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 247.92905000000002, "t": 208.29351999999994, "r": 250.95969, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "-", "bbox": {"l": 247.92905000000002, "t": 208.29351999999994, "r": 250.95969, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 86.372002, "t": 219.25256000000002, "r": 131.65231, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "Page-header", "bbox": {"l": 86.372002, "t": 219.25256000000002, "r": 131.65231, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 151.07401, "t": 219.25256000000002, "r": 159.41275, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "72", "bbox": {"l": 151.07401, "t": 219.25256000000002, "r": 159.41275, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 177.23795, "t": 219.25256000000002, "r": 185.57669, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "68", "bbox": {"l": 177.23795, "t": 219.25256000000002, "r": 185.57669, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 213.91052, "t": 219.25256000000002, "r": 216.94116, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "-", "bbox": {"l": 213.91052, "t": 219.25256000000002, "r": 216.94116, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 247.92905000000002, "t": 219.25256000000002, "r": 250.95969, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "-", "bbox": {"l": 247.92905000000002, "t": 219.25256000000002, "r": 250.95969, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 86.372002, "t": 230.21155, "r": 112.35663, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "Picture", "bbox": {"l": 86.372002, "t": 230.21155, "r": 112.35663, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 151.07401, "t": 230.21155, "r": 159.41275, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "72", "bbox": {"l": 151.07401, "t": 230.21155, "r": 159.41275, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 177.23795, "t": 230.21155, "r": 185.57669, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "72", "bbox": {"l": 177.23795, "t": 230.21155, "r": 185.57669, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 211.25645, "t": 230.21155, "r": 219.5952, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "72", "bbox": {"l": 211.25645, "t": 230.21155, "r": 219.5952, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 245.27496, "t": 230.21155, "r": 253.61371, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "72", "bbox": {"l": 245.27496, "t": 230.21155, "r": 253.61371, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 86.372002, "t": 241.16956000000005, "r": 141.11188, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "Section-header", "bbox": {"l": 86.372002, "t": 241.16956000000005, "r": 141.11188, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 151.07401, "t": 241.16956000000005, "r": 159.41275, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "68", "bbox": {"l": 151.07401, "t": 241.16956000000005, "r": 159.41275, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 177.23795, "t": 241.16956000000005, "r": 185.57669, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "67", "bbox": {"l": 177.23795, "t": 241.16956000000005, "r": 185.57669, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 211.25645, "t": 241.16956000000005, "r": 219.5952, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "69", "bbox": {"l": 211.25645, "t": 241.16956000000005, "r": 219.5952, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 245.27496, "t": 241.16956000000005, "r": 253.61371, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "68", "bbox": {"l": 245.27496, "t": 241.16956000000005, "r": 253.61371, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 86.372002, "t": 252.12854000000004, "r": 106.17878, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "Table", "bbox": {"l": 86.372002, "t": 252.12854000000004, "r": 106.17878, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 151.07401, "t": 252.12854000000004, "r": 159.41275, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "82", "bbox": {"l": 151.07401, "t": 252.12854000000004, "r": 159.41275, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 177.23795, "t": 252.12854000000004, "r": 185.57669, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "83", "bbox": {"l": 177.23795, "t": 252.12854000000004, "r": 185.57669, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 211.25645, "t": 252.12854000000004, "r": 219.5952, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "82", "bbox": {"l": 211.25645, "t": 252.12854000000004, "r": 219.5952, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 245.27496, "t": 252.12854000000004, "r": 253.61371, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "82", "bbox": {"l": 245.27496, "t": 252.12854000000004, "r": 253.61371, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 86.372002, "t": 263.08752000000004, "r": 102.3322, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "Text", "bbox": {"l": 86.372002, "t": 263.08752000000004, "r": 102.3322, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 151.07401, "t": 263.08752000000004, "r": 159.41275, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "85", "bbox": {"l": 151.07401, "t": 263.08752000000004, "r": 159.41275, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 177.23795, "t": 263.08752000000004, "r": 185.57669, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "84", "bbox": {"l": 177.23795, "t": 263.08752000000004, "r": 185.57669, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 211.25645, "t": 263.08752000000004, "r": 219.5952, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "84", "bbox": {"l": 211.25645, "t": 263.08752000000004, "r": 219.5952, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 245.27496, "t": 263.08752000000004, "r": 253.61371, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "84", "bbox": {"l": 245.27496, "t": 263.08752000000004, "r": 253.61371, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 86.372002, "t": 274.04657, "r": 103.36333, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "Title", "bbox": {"l": 86.372002, "t": 274.04657, "r": 103.36333, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 151.07401, "t": 274.04657, "r": 159.41275, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "77", "bbox": {"l": 151.07401, "t": 274.04657, "r": 159.41275, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 169.37442, "t": 274.04657, "r": 193.43127, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "Sec.-h.", "bbox": {"l": 169.37442, "t": 274.04657, "r": 193.43127, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 203.39294, "t": 274.04657, "r": 227.4498, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "Sec.-h.", "bbox": {"l": 203.39294, "t": 274.04657, "r": 227.4498, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 237.41147, "t": 274.04657, "r": 261.46832, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "Sec.-h.", "bbox": {"l": 237.41147, "t": 274.04657, "r": 261.46832, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 86.372002, "t": 285.40454, "r": 113.31602000000001, "b": 293.77917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "Overall", "bbox": {"l": 86.372002, "t": 285.40454, "r": 113.31602000000001, "b": 293.77917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 151.07401, "t": 285.40454, "r": 159.41275, "b": 293.77917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "72", "bbox": {"l": 151.07401, "t": 285.40454, "r": 159.41275, "b": 293.77917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 177.23795, "t": 285.40454, "r": 185.57669, "b": 293.77917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "73", "bbox": {"l": 177.23795, "t": 285.40454, "r": 185.57669, "b": 293.77917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 211.25645, "t": 285.40454, "r": 219.5952, "b": 293.77917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "78", "bbox": {"l": 211.25645, "t": 285.40454, "r": 219.5952, "b": 293.77917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 245.27496, "t": 285.40454, "r": 253.61371, "b": 293.77917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "77", "bbox": {"l": 245.27496, "t": 285.40454, "r": 253.61371, "b": 293.77917, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 13, "num_cols": 5, "table_cells": [{"bbox": {"l": 86.372002, "t": 153.10051999999996, "r": 129.46452, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Class-count", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 151.07401, "t": 153.10051999999996, "r": 159.41275, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "11", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 179.31816, "t": 153.10051999999996, "r": 183.48753, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "6", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 213.33669, "t": 153.10051999999996, "r": 217.50606, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "5", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 247.35521, "t": 153.10051999999996, "r": 251.52458, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "4", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 164.45752000000005, "r": 115.55763, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Caption", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 164.45752000000005, "r": 159.41275, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 173.42723, "t": 164.45752000000005, "r": 189.38742, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 207.44576, "t": 164.45752000000005, "r": 223.40594000000002, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 241.46428, "t": 164.45752000000005, "r": 257.42447, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 175.41656, "r": 118.8752, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Footnote", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 175.41656, "r": 159.41275, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "71", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 173.42723, "t": 175.41656, "r": 189.38742, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 207.44576, "t": 175.41656, "r": 223.40594000000002, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 241.46428, "t": 175.41656, "r": 257.42447, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 186.37554999999998, "r": 116.88466, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Formula", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 186.37554999999998, "r": 159.41275, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "60", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 173.42723, "t": 186.37554999999998, "r": 189.38742, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 207.44576, "t": 186.37554999999998, "r": 223.40594000000002, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 241.46428, "t": 186.37554999999998, "r": 257.42447, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 197.33452999999997, "r": 119.25179, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "List-item", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 197.33452999999997, "r": 159.41275, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 173.42723, "t": 197.33452999999997, "r": 189.38742, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 211.25647, "t": 197.33452999999997, "r": 219.59521, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 241.46426, "t": 197.33452999999997, "r": 257.42447, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 208.29351999999994, "r": 128.89964, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-footer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 208.29351999999994, "r": 159.41275, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "62", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23795, "t": 208.29351999999994, "r": 185.57669, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "62", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 213.91052, "t": 208.29351999999994, "r": 216.94116, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 247.92905000000002, "t": 208.29351999999994, "r": 250.95969, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 219.25256000000002, "r": 131.65231, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 219.25256000000002, "r": 159.41275, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23795, "t": 219.25256000000002, "r": 185.57669, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 213.91052, "t": 219.25256000000002, "r": 216.94116, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 247.92905000000002, "t": 219.25256000000002, "r": 250.95969, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 230.21155, "r": 112.35663, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Picture", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 230.21155, "r": 159.41275, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23795, "t": 230.21155, "r": 185.57669, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 211.25645, "t": 230.21155, "r": 219.5952, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.27496, "t": 230.21155, "r": 253.61371, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 241.16956000000005, "r": 141.11188, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Section-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 241.16956000000005, "r": 159.41275, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23795, "t": 241.16956000000005, "r": 185.57669, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "67", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 211.25645, "t": 241.16956000000005, "r": 219.5952, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "69", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.27496, "t": 241.16956000000005, "r": 253.61371, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 252.12854000000004, "r": 106.17878, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 252.12854000000004, "r": 159.41275, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23795, "t": 252.12854000000004, "r": 185.57669, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 211.25645, "t": 252.12854000000004, "r": 219.5952, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.27496, "t": 252.12854000000004, "r": 253.61371, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 263.08752000000004, "r": 102.3322, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Text", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 263.08752000000004, "r": 159.41275, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23795, "t": 263.08752000000004, "r": 185.57669, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 211.25645, "t": 263.08752000000004, "r": 219.5952, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.27496, "t": 263.08752000000004, "r": 253.61371, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 274.04657, "r": 103.36333, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Title", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 274.04657, "r": 159.41275, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 169.37442, "t": 274.04657, "r": 193.43127, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Sec.-h.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 203.39294, "t": 274.04657, "r": 227.4498, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Sec.-h.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 237.41147, "t": 274.04657, "r": 261.46832, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Sec.-h.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 285.40454, "r": 113.31602000000001, "b": 293.77917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Overall", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 285.40454, "r": 159.41275, "b": 293.77917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23795, "t": 285.40454, "r": 185.57669, "b": 293.77917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "73", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 211.25645, "t": 285.40454, "r": 219.5952, "b": 293.77917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "78", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.27496, "t": 285.40454, "r": 253.61371, "b": 293.77917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "77", "column_header": false, "row_header": false, "row_section": false}]}, "0": {"label": "table", "id": 0, "page_no": 6, "cluster": {"id": 0, "label": "table", "bbox": {"l": 352.97747802734375, "t": 150.791259765625, "r": 522.9158935546875, "b": 306.2658386230469, "coord_origin": "TOPLEFT"}, "confidence": 0.9879696369171143, "cells": [{"id": 115, "text": "Class-count", "bbox": {"l": 358.63901, "t": 153.10051999999996, "r": 401.73154, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "11", "bbox": {"l": 440.22501, "t": 153.10051999999996, "r": 448.56375, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "5", "bbox": {"l": 494.38, "t": 153.10051999999996, "r": 498.54938, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "Split", "bbox": {"l": 358.63901, "t": 164.05951000000005, "r": 375.27167, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "Doc", "bbox": {"l": 423.341, "t": 164.05951000000005, "r": 438.0459, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "Page", "bbox": {"l": 448.00757, "t": 164.05951000000005, "r": 465.4472, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "Doc", "bbox": {"l": 475.41101, "t": 164.05951000000005, "r": 490.11591, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Page", "bbox": {"l": 500.07757999999995, "t": 164.05951000000005, "r": 517.51721, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "Caption", "bbox": {"l": 358.63901, "t": 175.41656, "r": 387.82465, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "68", "bbox": {"l": 426.52399, "t": 175.41656, "r": 434.86273, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "83", "bbox": {"l": 452.56240999999994, "t": 175.41656, "r": 460.90115000000003, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "Footnote", "bbox": {"l": 358.63901, "t": 186.37554999999998, "r": 391.14221, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "71", "bbox": {"l": 426.52399, "t": 186.37554999999998, "r": 434.86273, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "84", "bbox": {"l": 452.56240999999994, "t": 186.37554999999998, "r": 460.90115000000003, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "Formula", "bbox": {"l": 358.63901, "t": 197.33452999999997, "r": 389.15167, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "60", "bbox": {"l": 426.52399, "t": 197.33452999999997, "r": 434.86273, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "66", "bbox": {"l": 452.56240999999994, "t": 197.33452999999997, "r": 460.90115000000003, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "List-item", "bbox": {"l": 358.63901, "t": 208.29351999999994, "r": 391.5188, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "81", "bbox": {"l": 426.52399, "t": 208.29351999999994, "r": 434.86273, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "88", "bbox": {"l": 452.56240999999994, "t": 208.29351999999994, "r": 460.90115000000003, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "82", "bbox": {"l": 478.59399, "t": 208.29351999999994, "r": 486.93274, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "88", "bbox": {"l": 504.6324200000001, "t": 208.29351999999994, "r": 512.97119, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "Page-footer", "bbox": {"l": 358.63901, "t": 219.25256000000002, "r": 401.16666, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "62", "bbox": {"l": 426.52399, "t": 219.25256000000002, "r": 434.86273, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "89", "bbox": {"l": 452.56240999999994, "t": 219.25256000000002, "r": 460.90115000000003, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "Page-header", "bbox": {"l": 358.63901, "t": 230.21155, "r": 403.91931, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "72", "bbox": {"l": 426.52399, "t": 230.21155, "r": 434.86273, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "90", "bbox": {"l": 452.56240999999994, "t": 230.21155, "r": 460.90115000000003, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "Picture", "bbox": {"l": 358.63901, "t": 241.16956000000005, "r": 384.62366, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "72", "bbox": {"l": 426.52399, "t": 241.16956000000005, "r": 434.86273, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "82", "bbox": {"l": 452.56240999999994, "t": 241.16956000000005, "r": 460.90115000000003, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "72", "bbox": {"l": 478.59399, "t": 241.16956000000005, "r": 486.93274, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "82", "bbox": {"l": 504.6324200000001, "t": 241.16956000000005, "r": 512.97119, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "Section-header", "bbox": {"l": 358.63901, "t": 252.12854000000004, "r": 413.37891, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "68", "bbox": {"l": 426.52399, "t": 252.12854000000004, "r": 434.86273, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "83", "bbox": {"l": 452.56240999999994, "t": 252.12854000000004, "r": 460.90115000000003, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "69", "bbox": {"l": 478.59399, "t": 252.12854000000004, "r": 486.93274, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "83", "bbox": {"l": 504.6324200000001, "t": 252.12854000000004, "r": 512.97119, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "Table", "bbox": {"l": 358.63901, "t": 263.08752000000004, "r": 378.44577, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "82", "bbox": {"l": 426.52399, "t": 263.08752000000004, "r": 434.86273, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "89", "bbox": {"l": 452.56240999999994, "t": 263.08752000000004, "r": 460.90115000000003, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "82", "bbox": {"l": 478.59399, "t": 263.08752000000004, "r": 486.93274, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "90", "bbox": {"l": 504.6324200000001, "t": 263.08752000000004, "r": 512.97119, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "Text", "bbox": {"l": 358.63901, "t": 274.04657, "r": 374.59921, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "85", "bbox": {"l": 426.52399, "t": 274.04657, "r": 434.86273, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "91", "bbox": {"l": 452.56240999999994, "t": 274.04657, "r": 460.90115000000003, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "84", "bbox": {"l": 478.59399, "t": 274.04657, "r": 486.93274, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "90", "bbox": {"l": 504.6324200000001, "t": 274.04657, "r": 512.97119, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "Title", "bbox": {"l": 358.63901, "t": 285.00552, "r": 375.63034, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "77", "bbox": {"l": 426.52399, "t": 285.00552, "r": 434.86273, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "81", "bbox": {"l": 452.56240999999994, "t": 285.00552, "r": 460.90115000000003, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "All", "bbox": {"l": 358.63901, "t": 296.36255, "r": 369.60492, "b": 304.73718, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "72", "bbox": {"l": 426.52399, "t": 296.36255, "r": 434.86273, "b": 304.73718, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "84", "bbox": {"l": 452.56240999999994, "t": 296.36255, "r": 460.90115000000003, "b": 304.73718, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "78", "bbox": {"l": 478.59399, "t": 296.36255, "r": 486.93274, "b": 304.73718, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "87", "bbox": {"l": 504.6324200000001, "t": 296.36255, "r": 512.97119, "b": 304.73718, "coord_origin": "TOPLEFT"}}], "children": [{"id": 80, "label": "text", "bbox": {"l": 358.63901, "t": 153.10051999999996, "r": 401.73154, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 115, "text": "Class-count", "bbox": {"l": 358.63901, "t": 153.10051999999996, "r": 401.73154, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 440.22501, "t": 153.10051999999996, "r": 448.56375, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 116, "text": "11", "bbox": {"l": 440.22501, "t": 153.10051999999996, "r": 448.56375, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 494.38, "t": 153.10051999999996, "r": 498.54938, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 117, "text": "5", "bbox": {"l": 494.38, "t": 153.10051999999996, "r": 498.54938, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 358.63901, "t": 164.05951000000005, "r": 375.27167, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 118, "text": "Split", "bbox": {"l": 358.63901, "t": 164.05951000000005, "r": 375.27167, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 423.341, "t": 164.05951000000005, "r": 438.0459, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 119, "text": "Doc", "bbox": {"l": 423.341, "t": 164.05951000000005, "r": 438.0459, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 448.00757, "t": 164.05951000000005, "r": 465.4472, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 120, "text": "Page", "bbox": {"l": 448.00757, "t": 164.05951000000005, "r": 465.4472, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 475.41101, "t": 164.05951000000005, "r": 490.11591, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 121, "text": "Doc", "bbox": {"l": 475.41101, "t": 164.05951000000005, "r": 490.11591, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 500.07757999999995, "t": 164.05951000000005, "r": 517.51721, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 122, "text": "Page", "bbox": {"l": 500.07757999999995, "t": 164.05951000000005, "r": 517.51721, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 358.63901, "t": 175.41656, "r": 387.82465, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 123, "text": "Caption", "bbox": {"l": 358.63901, "t": 175.41656, "r": 387.82465, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 426.52399, "t": 175.41656, "r": 434.86273, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 124, "text": "68", "bbox": {"l": 426.52399, "t": 175.41656, "r": 434.86273, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 452.56240999999994, "t": 175.41656, "r": 460.90115000000003, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 125, "text": "83", "bbox": {"l": 452.56240999999994, "t": 175.41656, "r": 460.90115000000003, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 358.63901, "t": 186.37554999999998, "r": 391.14221, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 126, "text": "Footnote", "bbox": {"l": 358.63901, "t": 186.37554999999998, "r": 391.14221, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 426.52399, "t": 186.37554999999998, "r": 434.86273, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 127, "text": "71", "bbox": {"l": 426.52399, "t": 186.37554999999998, "r": 434.86273, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 452.56240999999994, "t": 186.37554999999998, "r": 460.90115000000003, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 128, "text": "84", "bbox": {"l": 452.56240999999994, "t": 186.37554999999998, "r": 460.90115000000003, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 358.63901, "t": 197.33452999999997, "r": 389.15167, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 129, "text": "Formula", "bbox": {"l": 358.63901, "t": 197.33452999999997, "r": 389.15167, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 426.52399, "t": 197.33452999999997, "r": 434.86273, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 130, "text": "60", "bbox": {"l": 426.52399, "t": 197.33452999999997, "r": 434.86273, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 452.56240999999994, "t": 197.33452999999997, "r": 460.90115000000003, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 131, "text": "66", "bbox": {"l": 452.56240999999994, "t": 197.33452999999997, "r": 460.90115000000003, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 358.63901, "t": 208.29351999999994, "r": 391.5188, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 132, "text": "List-item", "bbox": {"l": 358.63901, "t": 208.29351999999994, "r": 391.5188, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 426.52399, "t": 208.29351999999994, "r": 434.86273, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 133, "text": "81", "bbox": {"l": 426.52399, "t": 208.29351999999994, "r": 434.86273, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 452.56240999999994, "t": 208.29351999999994, "r": 460.90115000000003, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 134, "text": "88", "bbox": {"l": 452.56240999999994, "t": 208.29351999999994, "r": 460.90115000000003, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 478.59399, "t": 208.29351999999994, "r": 486.93274, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 135, "text": "82", "bbox": {"l": 478.59399, "t": 208.29351999999994, "r": 486.93274, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 504.6324200000001, "t": 208.29351999999994, "r": 512.97119, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 136, "text": "88", "bbox": {"l": 504.6324200000001, "t": 208.29351999999994, "r": 512.97119, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 358.63901, "t": 219.25256000000002, "r": 401.16666, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 137, "text": "Page-footer", "bbox": {"l": 358.63901, "t": 219.25256000000002, "r": 401.16666, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 426.52399, "t": 219.25256000000002, "r": 434.86273, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 138, "text": "62", "bbox": {"l": 426.52399, "t": 219.25256000000002, "r": 434.86273, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 452.56240999999994, "t": 219.25256000000002, "r": 460.90115000000003, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 139, "text": "89", "bbox": {"l": 452.56240999999994, "t": 219.25256000000002, "r": 460.90115000000003, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 358.63901, "t": 230.21155, "r": 403.91931, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 140, "text": "Page-header", "bbox": {"l": 358.63901, "t": 230.21155, "r": 403.91931, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 426.52399, "t": 230.21155, "r": 434.86273, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 141, "text": "72", "bbox": {"l": 426.52399, "t": 230.21155, "r": 434.86273, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 452.56240999999994, "t": 230.21155, "r": 460.90115000000003, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 142, "text": "90", "bbox": {"l": 452.56240999999994, "t": 230.21155, "r": 460.90115000000003, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 358.63901, "t": 241.16956000000005, "r": 384.62366, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 143, "text": "Picture", "bbox": {"l": 358.63901, "t": 241.16956000000005, "r": 384.62366, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 426.52399, "t": 241.16956000000005, "r": 434.86273, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 144, "text": "72", "bbox": {"l": 426.52399, "t": 241.16956000000005, "r": 434.86273, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 452.56240999999994, "t": 241.16956000000005, "r": 460.90115000000003, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 145, "text": "82", "bbox": {"l": 452.56240999999994, "t": 241.16956000000005, "r": 460.90115000000003, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 478.59399, "t": 241.16956000000005, "r": 486.93274, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 146, "text": "72", "bbox": {"l": 478.59399, "t": 241.16956000000005, "r": 486.93274, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 504.6324200000001, "t": 241.16956000000005, "r": 512.97119, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 147, "text": "82", "bbox": {"l": 504.6324200000001, "t": 241.16956000000005, "r": 512.97119, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 358.63901, "t": 252.12854000000004, "r": 413.37891, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 148, "text": "Section-header", "bbox": {"l": 358.63901, "t": 252.12854000000004, "r": 413.37891, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 114, "label": "text", "bbox": {"l": 426.52399, "t": 252.12854000000004, "r": 434.86273, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 149, "text": "68", "bbox": {"l": 426.52399, "t": 252.12854000000004, "r": 434.86273, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 115, "label": "text", "bbox": {"l": 452.56240999999994, "t": 252.12854000000004, "r": 460.90115000000003, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 150, "text": "83", "bbox": {"l": 452.56240999999994, "t": 252.12854000000004, "r": 460.90115000000003, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 116, "label": "text", "bbox": {"l": 478.59399, "t": 252.12854000000004, "r": 486.93274, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 151, "text": "69", "bbox": {"l": 478.59399, "t": 252.12854000000004, "r": 486.93274, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 117, "label": "text", "bbox": {"l": 504.6324200000001, "t": 252.12854000000004, "r": 512.97119, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 152, "text": "83", "bbox": {"l": 504.6324200000001, "t": 252.12854000000004, "r": 512.97119, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 118, "label": "text", "bbox": {"l": 358.63901, "t": 263.08752000000004, "r": 378.44577, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 153, "text": "Table", "bbox": {"l": 358.63901, "t": 263.08752000000004, "r": 378.44577, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 119, "label": "text", "bbox": {"l": 426.52399, "t": 263.08752000000004, "r": 434.86273, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 154, "text": "82", "bbox": {"l": 426.52399, "t": 263.08752000000004, "r": 434.86273, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 120, "label": "text", "bbox": {"l": 452.56240999999994, "t": 263.08752000000004, "r": 460.90115000000003, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 155, "text": "89", "bbox": {"l": 452.56240999999994, "t": 263.08752000000004, "r": 460.90115000000003, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 121, "label": "text", "bbox": {"l": 478.59399, "t": 263.08752000000004, "r": 486.93274, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 156, "text": "82", "bbox": {"l": 478.59399, "t": 263.08752000000004, "r": 486.93274, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 122, "label": "text", "bbox": {"l": 504.6324200000001, "t": 263.08752000000004, "r": 512.97119, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 157, "text": "90", "bbox": {"l": 504.6324200000001, "t": 263.08752000000004, "r": 512.97119, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 123, "label": "text", "bbox": {"l": 358.63901, "t": 274.04657, "r": 374.59921, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 158, "text": "Text", "bbox": {"l": 358.63901, "t": 274.04657, "r": 374.59921, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 124, "label": "text", "bbox": {"l": 426.52399, "t": 274.04657, "r": 434.86273, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 159, "text": "85", "bbox": {"l": 426.52399, "t": 274.04657, "r": 434.86273, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 125, "label": "text", "bbox": {"l": 452.56240999999994, "t": 274.04657, "r": 460.90115000000003, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 160, "text": "91", "bbox": {"l": 452.56240999999994, "t": 274.04657, "r": 460.90115000000003, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 126, "label": "text", "bbox": {"l": 478.59399, "t": 274.04657, "r": 486.93274, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 161, "text": "84", "bbox": {"l": 478.59399, "t": 274.04657, "r": 486.93274, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 127, "label": "text", "bbox": {"l": 504.6324200000001, "t": 274.04657, "r": 512.97119, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 162, "text": "90", "bbox": {"l": 504.6324200000001, "t": 274.04657, "r": 512.97119, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 128, "label": "text", "bbox": {"l": 358.63901, "t": 285.00552, "r": 375.63034, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 163, "text": "Title", "bbox": {"l": 358.63901, "t": 285.00552, "r": 375.63034, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 129, "label": "text", "bbox": {"l": 426.52399, "t": 285.00552, "r": 434.86273, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 164, "text": "77", "bbox": {"l": 426.52399, "t": 285.00552, "r": 434.86273, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 130, "label": "text", "bbox": {"l": 452.56240999999994, "t": 285.00552, "r": 460.90115000000003, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 165, "text": "81", "bbox": {"l": 452.56240999999994, "t": 285.00552, "r": 460.90115000000003, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 131, "label": "text", "bbox": {"l": 358.63901, "t": 296.36255, "r": 369.60492, "b": 304.73718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 166, "text": "All", "bbox": {"l": 358.63901, "t": 296.36255, "r": 369.60492, "b": 304.73718, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 132, "label": "text", "bbox": {"l": 426.52399, "t": 296.36255, "r": 434.86273, "b": 304.73718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 167, "text": "72", "bbox": {"l": 426.52399, "t": 296.36255, "r": 434.86273, "b": 304.73718, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 133, "label": "text", "bbox": {"l": 452.56240999999994, "t": 296.36255, "r": 460.90115000000003, "b": 304.73718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 168, "text": "84", "bbox": {"l": 452.56240999999994, "t": 296.36255, "r": 460.90115000000003, "b": 304.73718, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 134, "label": "text", "bbox": {"l": 478.59399, "t": 296.36255, "r": 486.93274, "b": 304.73718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 169, "text": "78", "bbox": {"l": 478.59399, "t": 296.36255, "r": 486.93274, "b": 304.73718, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 135, "label": "text", "bbox": {"l": 504.6324200000001, "t": 296.36255, "r": 512.97119, "b": 304.73718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 170, "text": "87", "bbox": {"l": 504.6324200000001, "t": 296.36255, "r": 512.97119, "b": 304.73718, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["fcel", "ched", "lcel", "ched", "lcel", "nl", "fcel", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 14, "num_cols": 5, "table_cells": [{"bbox": {"l": 358.63901, "t": 153.10051999999996, "r": 401.73154, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Class-count", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.22501, "t": 153.10051999999996, "r": 448.56375, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 3, "text": "11", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 494.38, "t": 153.10051999999996, "r": 498.54938, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 5, "text": "5", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 164.05951000000005, "r": 375.27167, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Split", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 423.341, "t": 164.05951000000005, "r": 438.0459, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Doc", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 448.00757, "t": 164.05951000000005, "r": 465.4472, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Page", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 475.41101, "t": 164.05951000000005, "r": 490.11591, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Doc", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 500.07757999999995, "t": 164.05951000000005, "r": 517.51721, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Page", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 175.41656, "r": 387.82465, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Caption", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 175.41656, "r": 434.86273, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 175.41656, "r": 460.90115000000003, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 186.37554999999998, "r": 391.14221, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Footnote", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 186.37554999999998, "r": 434.86273, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "71", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 186.37554999999998, "r": 460.90115000000003, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 197.33452999999997, "r": 389.15167, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Formula", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 197.33452999999997, "r": 434.86273, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "60", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 197.33452999999997, "r": 460.90115000000003, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "66", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 208.29351999999994, "r": 391.5188, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "List-item", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 208.29351999999994, "r": 434.86273, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 208.29351999999994, "r": 460.90115000000003, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 478.59399, "t": 208.29351999999994, "r": 486.93274, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 504.6324200000001, "t": 208.29351999999994, "r": 512.97119, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 219.25256000000002, "r": 401.16666, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-footer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 219.25256000000002, "r": 434.86273, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "62", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 219.25256000000002, "r": 460.90115000000003, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "89", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 230.21155, "r": 403.91931, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 230.21155, "r": 434.86273, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 230.21155, "r": 460.90115000000003, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "90", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 241.16956000000005, "r": 384.62366, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Picture", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 241.16956000000005, "r": 434.86273, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 241.16956000000005, "r": 460.90115000000003, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 478.59399, "t": 241.16956000000005, "r": 486.93274, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 504.6324200000001, "t": 241.16956000000005, "r": 512.97119, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 252.12854000000004, "r": 413.37891, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Section-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 252.12854000000004, "r": 434.86273, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 252.12854000000004, "r": 460.90115000000003, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 478.59399, "t": 252.12854000000004, "r": 486.93274, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "69", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 504.6324200000001, "t": 252.12854000000004, "r": 512.97119, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 263.08752000000004, "r": 378.44577, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 263.08752000000004, "r": 434.86273, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 263.08752000000004, "r": 460.90115000000003, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "89", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 478.59399, "t": 263.08752000000004, "r": 486.93274, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 504.6324200000001, "t": 263.08752000000004, "r": 512.97119, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "90", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 274.04657, "r": 374.59921, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Text", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 274.04657, "r": 434.86273, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 274.04657, "r": 460.90115000000003, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "91", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 478.59399, "t": 274.04657, "r": 486.93274, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 504.6324200000001, "t": 274.04657, "r": 512.97119, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "90", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 285.00552, "r": 375.63034, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Title", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 285.00552, "r": 434.86273, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 285.00552, "r": 460.90115000000003, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 296.36255, "r": 369.60492, "b": 304.73718, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "All", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 296.36255, "r": 434.86273, "b": 304.73718, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 296.36255, "r": 460.90115000000003, "b": 304.73718, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 478.59399, "t": 296.36255, "r": 486.93274, "b": 304.73718, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "78", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 504.6324200000001, "t": 296.36255, "r": 512.97119, "b": 304.73718, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "87", "column_header": false, "row_header": false, "row_section": false}]}}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_header", "id": 12, "page_no": 6, "cluster": {"id": 12, "label": "page_header", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.9316118955612183, "cells": [{"id": 0, "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis"}, {"label": "page_header", "id": 11, "page_no": 6, "cluster": {"id": 11, "label": "page_header", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.9318180084228516, "cells": [{"id": 1, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA"}, {"label": "text", "id": 14, "page_no": 6, "cluster": {"id": 14, "label": "text", "bbox": {"l": 53.501999, "t": 86.87292000000002, "r": 295.64865, "b": 128.22313999999994, "coord_origin": "TOPLEFT"}, "confidence": 0.8296934366226196, "cells": [{"id": 2, "text": "Table 3: Performance of a Mask R-CNN R50 network in", "bbox": {"l": 53.501999, "t": 86.87292000000002, "r": 294.0437, "b": 95.34618999999998, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "mAP@0.5-0.95 scores trained on DocLayNet with different", "bbox": {"l": 53.79800000000001, "t": 97.83191, "r": 294.04376, "b": 106.30517999999995, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "class label sets. The reduced label sets were obtained by ei-", "bbox": {"l": 53.79800000000001, "t": 108.79088999999999, "r": 295.64865, "b": 117.26415999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "ther down-mapping or dropping labels.", "bbox": {"l": 53.79800000000001, "t": 119.74987999999996, "r": 213.23856, "b": 128.22313999999994, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 3: Performance of a Mask R-CNN R50 network in mAP@0.5-0.95 scores trained on DocLayNet with different class label sets. The reduced label sets were obtained by either down-mapping or dropping labels."}, {"label": "table", "id": 4, "page_no": 6, "cluster": {"id": 4, "label": "table", "bbox": {"l": 80.35525512695312, "t": 150.93629455566406, "r": 267.0082092285156, "b": 295.4454650878906, "coord_origin": "TOPLEFT"}, "confidence": 0.9869412779808044, "cells": [{"id": 6, "text": "Class-count", "bbox": {"l": 86.372002, "t": 153.10051999999996, "r": 129.46452, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "11", "bbox": {"l": 151.07401, "t": 153.10051999999996, "r": 159.41275, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "6", "bbox": {"l": 179.31816, "t": 153.10051999999996, "r": 183.48753, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "5", "bbox": {"l": 213.33669, "t": 153.10051999999996, "r": 217.50606, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "4", "bbox": {"l": 247.35521, "t": 153.10051999999996, "r": 251.52458, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Caption", "bbox": {"l": 86.372002, "t": 164.45752000000005, "r": 115.55763, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "68", "bbox": {"l": 151.07401, "t": 164.45752000000005, "r": 159.41275, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Text", "bbox": {"l": 173.42723, "t": 164.45752000000005, "r": 189.38742, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Text", "bbox": {"l": 207.44576, "t": 164.45752000000005, "r": 223.40594000000002, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Text", "bbox": {"l": 241.46428, "t": 164.45752000000005, "r": 257.42447, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Footnote", "bbox": {"l": 86.372002, "t": 175.41656, "r": 118.8752, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "71", "bbox": {"l": 151.07401, "t": 175.41656, "r": 159.41275, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Text", "bbox": {"l": 173.42723, "t": 175.41656, "r": 189.38742, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Text", "bbox": {"l": 207.44576, "t": 175.41656, "r": 223.40594000000002, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Text", "bbox": {"l": 241.46428, "t": 175.41656, "r": 257.42447, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Formula", "bbox": {"l": 86.372002, "t": 186.37554999999998, "r": 116.88466, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "60", "bbox": {"l": 151.07401, "t": 186.37554999999998, "r": 159.41275, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Text", "bbox": {"l": 173.42723, "t": 186.37554999999998, "r": 189.38742, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "Text", "bbox": {"l": 207.44576, "t": 186.37554999999998, "r": 223.40594000000002, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "Text", "bbox": {"l": 241.46428, "t": 186.37554999999998, "r": 257.42447, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "List-item", "bbox": {"l": 86.372002, "t": 197.33452999999997, "r": 119.25179, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "81", "bbox": {"l": 151.07401, "t": 197.33452999999997, "r": 159.41275, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Text", "bbox": {"l": 173.42723, "t": 197.33452999999997, "r": 189.38742, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "82", "bbox": {"l": 211.25647, "t": 197.33452999999997, "r": 219.59521, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Text", "bbox": {"l": 241.46426, "t": 197.33452999999997, "r": 257.42447, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Page-footer", "bbox": {"l": 86.372002, "t": 208.29351999999994, "r": 128.89964, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "62", "bbox": {"l": 151.07401, "t": 208.29351999999994, "r": 159.41275, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "62", "bbox": {"l": 177.23795, "t": 208.29351999999994, "r": 185.57669, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "-", "bbox": {"l": 213.91052, "t": 208.29351999999994, "r": 216.94116, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "-", "bbox": {"l": 247.92905000000002, "t": 208.29351999999994, "r": 250.95969, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Page-header", "bbox": {"l": 86.372002, "t": 219.25256000000002, "r": 131.65231, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "72", "bbox": {"l": 151.07401, "t": 219.25256000000002, "r": 159.41275, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "68", "bbox": {"l": 177.23795, "t": 219.25256000000002, "r": 185.57669, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "-", "bbox": {"l": 213.91052, "t": 219.25256000000002, "r": 216.94116, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "-", "bbox": {"l": 247.92905000000002, "t": 219.25256000000002, "r": 250.95969, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Picture", "bbox": {"l": 86.372002, "t": 230.21155, "r": 112.35663, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "72", "bbox": {"l": 151.07401, "t": 230.21155, "r": 159.41275, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "72", "bbox": {"l": 177.23795, "t": 230.21155, "r": 185.57669, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "72", "bbox": {"l": 211.25645, "t": 230.21155, "r": 219.5952, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "72", "bbox": {"l": 245.27496, "t": 230.21155, "r": 253.61371, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "Section-header", "bbox": {"l": 86.372002, "t": 241.16956000000005, "r": 141.11188, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "68", "bbox": {"l": 151.07401, "t": 241.16956000000005, "r": 159.41275, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "67", "bbox": {"l": 177.23795, "t": 241.16956000000005, "r": 185.57669, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "69", "bbox": {"l": 211.25645, "t": 241.16956000000005, "r": 219.5952, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "68", "bbox": {"l": 245.27496, "t": 241.16956000000005, "r": 253.61371, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Table", "bbox": {"l": 86.372002, "t": 252.12854000000004, "r": 106.17878, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "82", "bbox": {"l": 151.07401, "t": 252.12854000000004, "r": 159.41275, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "83", "bbox": {"l": 177.23795, "t": 252.12854000000004, "r": 185.57669, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "82", "bbox": {"l": 211.25645, "t": 252.12854000000004, "r": 219.5952, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "82", "bbox": {"l": 245.27496, "t": 252.12854000000004, "r": 253.61371, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Text", "bbox": {"l": 86.372002, "t": 263.08752000000004, "r": 102.3322, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "85", "bbox": {"l": 151.07401, "t": 263.08752000000004, "r": 159.41275, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "84", "bbox": {"l": 177.23795, "t": 263.08752000000004, "r": 185.57669, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "84", "bbox": {"l": 211.25645, "t": 263.08752000000004, "r": 219.5952, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "84", "bbox": {"l": 245.27496, "t": 263.08752000000004, "r": 253.61371, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "Title", "bbox": {"l": 86.372002, "t": 274.04657, "r": 103.36333, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "77", "bbox": {"l": 151.07401, "t": 274.04657, "r": 159.41275, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "Sec.-h.", "bbox": {"l": 169.37442, "t": 274.04657, "r": 193.43127, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "Sec.-h.", "bbox": {"l": 203.39294, "t": 274.04657, "r": 227.4498, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "Sec.-h.", "bbox": {"l": 237.41147, "t": 274.04657, "r": 261.46832, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "Overall", "bbox": {"l": 86.372002, "t": 285.40454, "r": 113.31602000000001, "b": 293.77917, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "72", "bbox": {"l": 151.07401, "t": 285.40454, "r": 159.41275, "b": 293.77917, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "73", "bbox": {"l": 177.23795, "t": 285.40454, "r": 185.57669, "b": 293.77917, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "78", "bbox": {"l": 211.25645, "t": 285.40454, "r": 219.5952, "b": 293.77917, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "77", "bbox": {"l": 245.27496, "t": 285.40454, "r": 253.61371, "b": 293.77917, "coord_origin": "TOPLEFT"}}], "children": [{"id": 15, "label": "text", "bbox": {"l": 86.372002, "t": 153.10051999999996, "r": 129.46452, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": "Class-count", "bbox": {"l": 86.372002, "t": 153.10051999999996, "r": 129.46452, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 151.07401, "t": 153.10051999999996, "r": 159.41275, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "11", "bbox": {"l": 151.07401, "t": 153.10051999999996, "r": 159.41275, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 179.31816, "t": 153.10051999999996, "r": 183.48753, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "6", "bbox": {"l": 179.31816, "t": 153.10051999999996, "r": 183.48753, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 213.33669, "t": 153.10051999999996, "r": 217.50606, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "5", "bbox": {"l": 213.33669, "t": 153.10051999999996, "r": 217.50606, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 247.35521, "t": 153.10051999999996, "r": 251.52458, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "4", "bbox": {"l": 247.35521, "t": 153.10051999999996, "r": 251.52458, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 86.372002, "t": 164.45752000000005, "r": 115.55763, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "Caption", "bbox": {"l": 86.372002, "t": 164.45752000000005, "r": 115.55763, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 151.07401, "t": 164.45752000000005, "r": 159.41275, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "68", "bbox": {"l": 151.07401, "t": 164.45752000000005, "r": 159.41275, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 173.42723, "t": 164.45752000000005, "r": 189.38742, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "Text", "bbox": {"l": 173.42723, "t": 164.45752000000005, "r": 189.38742, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 207.44576, "t": 164.45752000000005, "r": 223.40594000000002, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "Text", "bbox": {"l": 207.44576, "t": 164.45752000000005, "r": 223.40594000000002, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 241.46428, "t": 164.45752000000005, "r": 257.42447, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "Text", "bbox": {"l": 241.46428, "t": 164.45752000000005, "r": 257.42447, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 86.372002, "t": 175.41656, "r": 118.8752, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "Footnote", "bbox": {"l": 86.372002, "t": 175.41656, "r": 118.8752, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 151.07401, "t": 175.41656, "r": 159.41275, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "71", "bbox": {"l": 151.07401, "t": 175.41656, "r": 159.41275, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 173.42723, "t": 175.41656, "r": 189.38742, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "Text", "bbox": {"l": 173.42723, "t": 175.41656, "r": 189.38742, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 207.44576, "t": 175.41656, "r": 223.40594000000002, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "Text", "bbox": {"l": 207.44576, "t": 175.41656, "r": 223.40594000000002, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 241.46428, "t": 175.41656, "r": 257.42447, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "Text", "bbox": {"l": 241.46428, "t": 175.41656, "r": 257.42447, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 86.372002, "t": 186.37554999999998, "r": 116.88466, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "Formula", "bbox": {"l": 86.372002, "t": 186.37554999999998, "r": 116.88466, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 151.07401, "t": 186.37554999999998, "r": 159.41275, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "60", "bbox": {"l": 151.07401, "t": 186.37554999999998, "r": 159.41275, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 173.42723, "t": 186.37554999999998, "r": 189.38742, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "Text", "bbox": {"l": 173.42723, "t": 186.37554999999998, "r": 189.38742, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 207.44576, "t": 186.37554999999998, "r": 223.40594000000002, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "Text", "bbox": {"l": 207.44576, "t": 186.37554999999998, "r": 223.40594000000002, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 241.46428, "t": 186.37554999999998, "r": 257.42447, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "Text", "bbox": {"l": 241.46428, "t": 186.37554999999998, "r": 257.42447, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 86.372002, "t": 197.33452999999997, "r": 119.25179, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "List-item", "bbox": {"l": 86.372002, "t": 197.33452999999997, "r": 119.25179, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 151.07401, "t": 197.33452999999997, "r": 159.41275, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "81", "bbox": {"l": 151.07401, "t": 197.33452999999997, "r": 159.41275, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 173.42723, "t": 197.33452999999997, "r": 189.38742, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "Text", "bbox": {"l": 173.42723, "t": 197.33452999999997, "r": 189.38742, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 211.25647, "t": 197.33452999999997, "r": 219.59521, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "82", "bbox": {"l": 211.25647, "t": 197.33452999999997, "r": 219.59521, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 241.46426, "t": 197.33452999999997, "r": 257.42447, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "Text", "bbox": {"l": 241.46426, "t": 197.33452999999997, "r": 257.42447, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 86.372002, "t": 208.29351999999994, "r": 128.89964, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "Page-footer", "bbox": {"l": 86.372002, "t": 208.29351999999994, "r": 128.89964, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 151.07401, "t": 208.29351999999994, "r": 159.41275, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "62", "bbox": {"l": 151.07401, "t": 208.29351999999994, "r": 159.41275, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 177.23795, "t": 208.29351999999994, "r": 185.57669, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "62", "bbox": {"l": 177.23795, "t": 208.29351999999994, "r": 185.57669, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 213.91052, "t": 208.29351999999994, "r": 216.94116, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "-", "bbox": {"l": 213.91052, "t": 208.29351999999994, "r": 216.94116, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 247.92905000000002, "t": 208.29351999999994, "r": 250.95969, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "-", "bbox": {"l": 247.92905000000002, "t": 208.29351999999994, "r": 250.95969, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 86.372002, "t": 219.25256000000002, "r": 131.65231, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "Page-header", "bbox": {"l": 86.372002, "t": 219.25256000000002, "r": 131.65231, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 151.07401, "t": 219.25256000000002, "r": 159.41275, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "72", "bbox": {"l": 151.07401, "t": 219.25256000000002, "r": 159.41275, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 177.23795, "t": 219.25256000000002, "r": 185.57669, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "68", "bbox": {"l": 177.23795, "t": 219.25256000000002, "r": 185.57669, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 213.91052, "t": 219.25256000000002, "r": 216.94116, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "-", "bbox": {"l": 213.91052, "t": 219.25256000000002, "r": 216.94116, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 247.92905000000002, "t": 219.25256000000002, "r": 250.95969, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "-", "bbox": {"l": 247.92905000000002, "t": 219.25256000000002, "r": 250.95969, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 86.372002, "t": 230.21155, "r": 112.35663, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "Picture", "bbox": {"l": 86.372002, "t": 230.21155, "r": 112.35663, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 151.07401, "t": 230.21155, "r": 159.41275, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "72", "bbox": {"l": 151.07401, "t": 230.21155, "r": 159.41275, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 177.23795, "t": 230.21155, "r": 185.57669, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "72", "bbox": {"l": 177.23795, "t": 230.21155, "r": 185.57669, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 211.25645, "t": 230.21155, "r": 219.5952, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "72", "bbox": {"l": 211.25645, "t": 230.21155, "r": 219.5952, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 245.27496, "t": 230.21155, "r": 253.61371, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "72", "bbox": {"l": 245.27496, "t": 230.21155, "r": 253.61371, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 86.372002, "t": 241.16956000000005, "r": 141.11188, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "Section-header", "bbox": {"l": 86.372002, "t": 241.16956000000005, "r": 141.11188, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 151.07401, "t": 241.16956000000005, "r": 159.41275, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "68", "bbox": {"l": 151.07401, "t": 241.16956000000005, "r": 159.41275, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 177.23795, "t": 241.16956000000005, "r": 185.57669, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "67", "bbox": {"l": 177.23795, "t": 241.16956000000005, "r": 185.57669, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 211.25645, "t": 241.16956000000005, "r": 219.5952, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "69", "bbox": {"l": 211.25645, "t": 241.16956000000005, "r": 219.5952, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 245.27496, "t": 241.16956000000005, "r": 253.61371, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "68", "bbox": {"l": 245.27496, "t": 241.16956000000005, "r": 253.61371, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 86.372002, "t": 252.12854000000004, "r": 106.17878, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "Table", "bbox": {"l": 86.372002, "t": 252.12854000000004, "r": 106.17878, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 151.07401, "t": 252.12854000000004, "r": 159.41275, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "82", "bbox": {"l": 151.07401, "t": 252.12854000000004, "r": 159.41275, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 177.23795, "t": 252.12854000000004, "r": 185.57669, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "83", "bbox": {"l": 177.23795, "t": 252.12854000000004, "r": 185.57669, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 211.25645, "t": 252.12854000000004, "r": 219.5952, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "82", "bbox": {"l": 211.25645, "t": 252.12854000000004, "r": 219.5952, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 245.27496, "t": 252.12854000000004, "r": 253.61371, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "82", "bbox": {"l": 245.27496, "t": 252.12854000000004, "r": 253.61371, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 86.372002, "t": 263.08752000000004, "r": 102.3322, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "Text", "bbox": {"l": 86.372002, "t": 263.08752000000004, "r": 102.3322, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 151.07401, "t": 263.08752000000004, "r": 159.41275, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "85", "bbox": {"l": 151.07401, "t": 263.08752000000004, "r": 159.41275, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 177.23795, "t": 263.08752000000004, "r": 185.57669, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "84", "bbox": {"l": 177.23795, "t": 263.08752000000004, "r": 185.57669, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 211.25645, "t": 263.08752000000004, "r": 219.5952, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "84", "bbox": {"l": 211.25645, "t": 263.08752000000004, "r": 219.5952, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 245.27496, "t": 263.08752000000004, "r": 253.61371, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "84", "bbox": {"l": 245.27496, "t": 263.08752000000004, "r": 253.61371, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 86.372002, "t": 274.04657, "r": 103.36333, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "Title", "bbox": {"l": 86.372002, "t": 274.04657, "r": 103.36333, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 151.07401, "t": 274.04657, "r": 159.41275, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "77", "bbox": {"l": 151.07401, "t": 274.04657, "r": 159.41275, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 169.37442, "t": 274.04657, "r": 193.43127, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "Sec.-h.", "bbox": {"l": 169.37442, "t": 274.04657, "r": 193.43127, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 203.39294, "t": 274.04657, "r": 227.4498, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "Sec.-h.", "bbox": {"l": 203.39294, "t": 274.04657, "r": 227.4498, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 237.41147, "t": 274.04657, "r": 261.46832, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "Sec.-h.", "bbox": {"l": 237.41147, "t": 274.04657, "r": 261.46832, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 86.372002, "t": 285.40454, "r": 113.31602000000001, "b": 293.77917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "Overall", "bbox": {"l": 86.372002, "t": 285.40454, "r": 113.31602000000001, "b": 293.77917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 151.07401, "t": 285.40454, "r": 159.41275, "b": 293.77917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "72", "bbox": {"l": 151.07401, "t": 285.40454, "r": 159.41275, "b": 293.77917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 177.23795, "t": 285.40454, "r": 185.57669, "b": 293.77917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "73", "bbox": {"l": 177.23795, "t": 285.40454, "r": 185.57669, "b": 293.77917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 211.25645, "t": 285.40454, "r": 219.5952, "b": 293.77917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "78", "bbox": {"l": 211.25645, "t": 285.40454, "r": 219.5952, "b": 293.77917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 245.27496, "t": 285.40454, "r": 253.61371, "b": 293.77917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "77", "bbox": {"l": 245.27496, "t": 285.40454, "r": 253.61371, "b": 293.77917, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 13, "num_cols": 5, "table_cells": [{"bbox": {"l": 86.372002, "t": 153.10051999999996, "r": 129.46452, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Class-count", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 151.07401, "t": 153.10051999999996, "r": 159.41275, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "11", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 179.31816, "t": 153.10051999999996, "r": 183.48753, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "6", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 213.33669, "t": 153.10051999999996, "r": 217.50606, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "5", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 247.35521, "t": 153.10051999999996, "r": 251.52458, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "4", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 164.45752000000005, "r": 115.55763, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Caption", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 164.45752000000005, "r": 159.41275, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 173.42723, "t": 164.45752000000005, "r": 189.38742, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 207.44576, "t": 164.45752000000005, "r": 223.40594000000002, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 241.46428, "t": 164.45752000000005, "r": 257.42447, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 175.41656, "r": 118.8752, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Footnote", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 175.41656, "r": 159.41275, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "71", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 173.42723, "t": 175.41656, "r": 189.38742, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 207.44576, "t": 175.41656, "r": 223.40594000000002, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 241.46428, "t": 175.41656, "r": 257.42447, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 186.37554999999998, "r": 116.88466, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Formula", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 186.37554999999998, "r": 159.41275, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "60", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 173.42723, "t": 186.37554999999998, "r": 189.38742, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 207.44576, "t": 186.37554999999998, "r": 223.40594000000002, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 241.46428, "t": 186.37554999999998, "r": 257.42447, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 197.33452999999997, "r": 119.25179, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "List-item", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 197.33452999999997, "r": 159.41275, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 173.42723, "t": 197.33452999999997, "r": 189.38742, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 211.25647, "t": 197.33452999999997, "r": 219.59521, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 241.46426, "t": 197.33452999999997, "r": 257.42447, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 208.29351999999994, "r": 128.89964, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-footer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 208.29351999999994, "r": 159.41275, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "62", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23795, "t": 208.29351999999994, "r": 185.57669, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "62", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 213.91052, "t": 208.29351999999994, "r": 216.94116, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 247.92905000000002, "t": 208.29351999999994, "r": 250.95969, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 219.25256000000002, "r": 131.65231, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 219.25256000000002, "r": 159.41275, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23795, "t": 219.25256000000002, "r": 185.57669, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 213.91052, "t": 219.25256000000002, "r": 216.94116, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 247.92905000000002, "t": 219.25256000000002, "r": 250.95969, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 230.21155, "r": 112.35663, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Picture", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 230.21155, "r": 159.41275, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23795, "t": 230.21155, "r": 185.57669, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 211.25645, "t": 230.21155, "r": 219.5952, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.27496, "t": 230.21155, "r": 253.61371, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 241.16956000000005, "r": 141.11188, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Section-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 241.16956000000005, "r": 159.41275, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23795, "t": 241.16956000000005, "r": 185.57669, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "67", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 211.25645, "t": 241.16956000000005, "r": 219.5952, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "69", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.27496, "t": 241.16956000000005, "r": 253.61371, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 252.12854000000004, "r": 106.17878, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 252.12854000000004, "r": 159.41275, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23795, "t": 252.12854000000004, "r": 185.57669, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 211.25645, "t": 252.12854000000004, "r": 219.5952, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.27496, "t": 252.12854000000004, "r": 253.61371, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 263.08752000000004, "r": 102.3322, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Text", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 263.08752000000004, "r": 159.41275, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23795, "t": 263.08752000000004, "r": 185.57669, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 211.25645, "t": 263.08752000000004, "r": 219.5952, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.27496, "t": 263.08752000000004, "r": 253.61371, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 274.04657, "r": 103.36333, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Title", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 274.04657, "r": 159.41275, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 169.37442, "t": 274.04657, "r": 193.43127, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Sec.-h.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 203.39294, "t": 274.04657, "r": 227.4498, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Sec.-h.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 237.41147, "t": 274.04657, "r": 261.46832, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Sec.-h.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 285.40454, "r": 113.31602000000001, "b": 293.77917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Overall", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 285.40454, "r": 159.41275, "b": 293.77917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23795, "t": 285.40454, "r": 185.57669, "b": 293.77917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "73", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 211.25645, "t": 285.40454, "r": 219.5952, "b": 293.77917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "78", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.27496, "t": 285.40454, "r": 253.61371, "b": 293.77917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "77", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "section_header", "id": 10, "page_no": 6, "cluster": {"id": 10, "label": "section_header", "bbox": {"l": 53.79800000000001, "t": 319.56992, "r": 131.05624, "b": 329.879, "coord_origin": "TOPLEFT"}, "confidence": 0.9555686116218567, "cells": [{"id": 71, "text": "Learning Curve", "bbox": {"l": 53.79800000000001, "t": 319.56992, "r": 131.05624, "b": 329.879, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Learning Curve"}, {"label": "text", "id": 5, "page_no": 6, "cluster": {"id": 5, "label": "text", "bbox": {"l": 52.785, "t": 334.77155, "r": 295.55835, "b": 529.44818, "coord_origin": "TOPLEFT"}, "confidence": 0.9857739210128784, "cells": [{"id": 72, "text": "One of the fundamental questions related to any dataset is if it is", "bbox": {"l": 53.79800000000001, "t": 334.77155, "r": 294.04153, "b": 343.14618, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "\u201clarge enough\u201d. To answer this question for DocLayNet, we per-", "bbox": {"l": 52.785, "t": 345.73053, "r": 295.55835, "b": 354.10516000000007, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "formed a data ablation study in which we evaluated a Mask R-CNN", "bbox": {"l": 53.79800000000001, "t": 356.6895400000001, "r": 294.04535, "b": 365.06418, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "model trained on increasing fractions of the DocLayNet dataset.", "bbox": {"l": 53.79800000000001, "t": 367.64853, "r": 295.4281, "b": 376.02316, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "As can be seen in Figure 5, the mAP score rises sharply in the be-", "bbox": {"l": 53.484001, "t": 378.60754, "r": 295.55667, "b": 386.98218, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "ginning and eventually levels out. To estimate the error-bar on the", "bbox": {"l": 53.79800000000001, "t": 389.56653, "r": 294.04865, "b": 397.94116, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "metrics, we ran the training five times on the entire data-set. This", "bbox": {"l": 53.79800000000001, "t": 400.52554000000003, "r": 294.04376, "b": 408.90018, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "resulted in a 1% error-bar, depicted by the shaded area in Figure 5.", "bbox": {"l": 53.79800000000001, "t": 411.48456, "r": 295.42459, "b": 419.85919, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "In the inset of Figure 5, we show the exact same data-points, but", "bbox": {"l": 53.79800000000001, "t": 422.44354, "r": 294.04709, "b": 430.81818, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "with a logarithmic scale on the x-axis. As is expected, the mAP", "bbox": {"l": 53.466999, "t": 433.40253000000007, "r": 294.04535, "b": 441.7771599999999, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "score increases linearly as a function of the data-size in the inset.", "bbox": {"l": 53.79800000000001, "t": 444.36053000000004, "r": 295.42902, "b": 452.73517, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "The curve ultimately flattens out between the 80% and 100% mark,", "bbox": {"l": 53.528999, "t": 455.31955, "r": 295.03122, "b": 463.69418, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "with the 80% mark falling within the error-bars of the 100% mark.", "bbox": {"l": 53.466999, "t": 466.27853, "r": 295.42154, "b": 474.65317, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "This provides a good indication that the model would not improve", "bbox": {"l": 53.528999, "t": 477.23755, "r": 294.04553, "b": 485.61218, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "significantly by yet increasing the data size. Rather, it would prob-", "bbox": {"l": 53.79800000000001, "t": 488.19653, "r": 295.55646, "b": 496.57117, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "ably benefit more from improved data consistency (as discussed", "bbox": {"l": 53.79800000000001, "t": 499.15555, "r": 294.04715, "b": 507.53018, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "in Section 3), data augmentation methods [23], or the addition of", "bbox": {"l": 53.79800000000001, "t": 510.11453, "r": 294.04245, "b": 518.4891700000001, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "more document categories and styles.", "bbox": {"l": 53.79800000000001, "t": 521.0735500000001, "r": 191.47707, "b": 529.44818, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "One of the fundamental questions related to any dataset is if it is \"large enough\". To answer this question for DocLayNet, we performed a data ablation study in which we evaluated a Mask R-CNN model trained on increasing fractions of the DocLayNet dataset. As can be seen in Figure 5, the mAP score rises sharply in the beginning and eventually levels out. To estimate the error-bar on the metrics, we ran the training five times on the entire data-set. This resulted in a 1% error-bar, depicted by the shaded area in Figure 5. In the inset of Figure 5, we show the exact same data-points, but with a logarithmic scale on the x-axis. As is expected, the mAP score increases linearly as a function of the data-size in the inset. The curve ultimately flattens out between the 80% and 100% mark, with the 80% mark falling within the error-bars of the 100% mark. This provides a good indication that the model would not improve significantly by yet increasing the data size. Rather, it would probably benefit more from improved data consistency (as discussed in Section 3), data augmentation methods [23], or the addition of more document categories and styles."}, {"label": "section_header", "id": 8, "page_no": 6, "cluster": {"id": 8, "label": "section_header", "bbox": {"l": 53.79800000000001, "t": 542.50992, "r": 164.32898, "b": 552.81902, "coord_origin": "TOPLEFT"}, "confidence": 0.9572026133537292, "cells": [{"id": 90, "text": "Impact of Class Labels", "bbox": {"l": 53.79800000000001, "t": 542.50992, "r": 164.32898, "b": 552.81902, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Impact of Class Labels"}, {"label": "text", "id": 1, "page_no": 6, "cluster": {"id": 1, "label": "text", "bbox": {"l": 53.466999, "t": 557.71155, "r": 295.55679, "b": 708.55217, "coord_origin": "TOPLEFT"}, "confidence": 0.9876301884651184, "cells": [{"id": 91, "text": "The choice and number of labels can have a significant effect on", "bbox": {"l": 53.528999, "t": 557.71155, "r": 294.04333, "b": 566.08617, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "the overall model performance. Since PubLayNet, DocBank and", "bbox": {"l": 53.79800000000001, "t": 568.6705499999999, "r": 294.04712, "b": 577.04517, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "DocLayNet all have different label sets, it is of particular interest to", "bbox": {"l": 53.79800000000001, "t": 579.62955, "r": 294.04538, "b": 588.0041699999999, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "understand and quantify this influence of the label set on the model", "bbox": {"l": 53.79800000000001, "t": 590.5885499999999, "r": 294.04535, "b": 598.96317, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "performance. We investigate this by either down-mapping labels", "bbox": {"l": 53.79800000000001, "t": 601.54755, "r": 294.04266, "b": 609.92216, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "into more common ones (e.g.", "bbox": {"l": 53.79800000000001, "t": 612.50656, "r": 163.59247, "b": 620.88118, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "Caption", "bbox": {"l": 166.26401, "t": 612.55139, "r": 194.97244, "b": 620.89015, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "\u2192", "bbox": {"l": 194.994, "t": 612.45276, "r": 204.1756, "b": 620.15491, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "Text", "bbox": {"l": 204.17599, "t": 612.55139, "r": 219.33961000000002, "b": 620.89015, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": ") or excluding them", "bbox": {"l": 219.849, "t": 612.50656, "r": 294.04828, "b": 620.88118, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "from the annotations entirely. Furthermore, it must be stressed", "bbox": {"l": 53.79800000000001, "t": 623.46556, "r": 294.04709, "b": 631.84018, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "that all mappings and exclusions were performed on the data be-", "bbox": {"l": 53.79800000000001, "t": 634.42355, "r": 295.55679, "b": 642.79817, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "fore model training. In Table 3, we present the mAP scores for a", "bbox": {"l": 53.79800000000001, "t": 645.38255, "r": 294.04715, "b": 653.75717, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "Mask R-CNN R50 network on different label sets. Where a label", "bbox": {"l": 53.79800000000001, "t": 656.34155, "r": 294.04715, "b": 664.71617, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "is down-mapped, we show its corresponding label, otherwise it", "bbox": {"l": 53.79800000000001, "t": 667.30055, "r": 294.04712, "b": 675.67517, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "was excluded. We present three different label sets, with 6, 5 and 4", "bbox": {"l": 53.466999, "t": 678.25955, "r": 294.25174, "b": 686.63417, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "different labels respectively. The set of 5 labels contains the same", "bbox": {"l": 53.79800000000001, "t": 689.21855, "r": 294.04639, "b": 697.59317, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "labels as PubLayNet. However, due to the different definition of", "bbox": {"l": 53.79800000000001, "t": 700.177551, "r": 294.04712, "b": 708.55217, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The choice and number of labels can have a significant effect on the overall model performance. Since PubLayNet, DocBank and DocLayNet all have different label sets, it is of particular interest to understand and quantify this influence of the label set on the model performance. We investigate this by either down-mapping labels into more common ones (e.g. Caption \u2192 Text ) or excluding them from the annotations entirely. Furthermore, it must be stressed that all mappings and exclusions were performed on the data before model training. In Table 3, we present the mAP scores for a Mask R-CNN R50 network on different label sets. Where a label is down-mapped, we show its corresponding label, otherwise it was excluded. We present three different label sets, with 6, 5 and 4 different labels respectively. The set of 5 labels contains the same labels as PubLayNet. However, due to the different definition of"}, {"label": "text", "id": 13, "page_no": 6, "cluster": {"id": 13, "label": "text", "bbox": {"l": 317.659, "t": 86.87298999999996, "r": 559.80682, "b": 128.22321, "coord_origin": "TOPLEFT"}, "confidence": 0.8736215829849243, "cells": [{"id": 109, "text": "Table 4: Performance of a Mask R-CNN R50 network with", "bbox": {"l": 317.659, "t": 86.87298999999996, "r": 558.20068, "b": 95.34625000000017, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "document-wise and page-wise split for different label sets.", "bbox": {"l": 317.95499, "t": 97.83196999999996, "r": 559.73401, "b": 106.30524000000003, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "Naive page-wise split will result in", "bbox": {"l": 317.95499, "t": 108.79094999999995, "r": 467.72089, "b": 117.26422000000014, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "GLYPH<tildelow>", "bbox": {"l": 471.90900000000005, "t": 107.12798999999995, "r": 477.53900000000004, "b": 115.19768999999997, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "10% point improve-", "bbox": {"l": 477.54001000000005, "t": 108.79094999999995, "r": 559.80682, "b": 117.26422000000014, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "ment.", "bbox": {"l": 317.95502, "t": 119.74993999999992, "r": 341.37524, "b": 128.22321, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 4: Performance of a Mask R-CNN R50 network with document-wise and page-wise split for different label sets. Naive page-wise split will result in GLYPH<tildelow> 10% point improvement."}, {"label": "table", "id": 0, "page_no": 6, "cluster": {"id": 0, "label": "table", "bbox": {"l": 352.97747802734375, "t": 150.791259765625, "r": 522.9158935546875, "b": 306.2658386230469, "coord_origin": "TOPLEFT"}, "confidence": 0.9879696369171143, "cells": [{"id": 115, "text": "Class-count", "bbox": {"l": 358.63901, "t": 153.10051999999996, "r": 401.73154, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "11", "bbox": {"l": 440.22501, "t": 153.10051999999996, "r": 448.56375, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "5", "bbox": {"l": 494.38, "t": 153.10051999999996, "r": 498.54938, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "Split", "bbox": {"l": 358.63901, "t": 164.05951000000005, "r": 375.27167, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "Doc", "bbox": {"l": 423.341, "t": 164.05951000000005, "r": 438.0459, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "Page", "bbox": {"l": 448.00757, "t": 164.05951000000005, "r": 465.4472, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "Doc", "bbox": {"l": 475.41101, "t": 164.05951000000005, "r": 490.11591, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Page", "bbox": {"l": 500.07757999999995, "t": 164.05951000000005, "r": 517.51721, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "Caption", "bbox": {"l": 358.63901, "t": 175.41656, "r": 387.82465, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "68", "bbox": {"l": 426.52399, "t": 175.41656, "r": 434.86273, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "83", "bbox": {"l": 452.56240999999994, "t": 175.41656, "r": 460.90115000000003, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "Footnote", "bbox": {"l": 358.63901, "t": 186.37554999999998, "r": 391.14221, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "71", "bbox": {"l": 426.52399, "t": 186.37554999999998, "r": 434.86273, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "84", "bbox": {"l": 452.56240999999994, "t": 186.37554999999998, "r": 460.90115000000003, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "Formula", "bbox": {"l": 358.63901, "t": 197.33452999999997, "r": 389.15167, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "60", "bbox": {"l": 426.52399, "t": 197.33452999999997, "r": 434.86273, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "66", "bbox": {"l": 452.56240999999994, "t": 197.33452999999997, "r": 460.90115000000003, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "List-item", "bbox": {"l": 358.63901, "t": 208.29351999999994, "r": 391.5188, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "81", "bbox": {"l": 426.52399, "t": 208.29351999999994, "r": 434.86273, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "88", "bbox": {"l": 452.56240999999994, "t": 208.29351999999994, "r": 460.90115000000003, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "82", "bbox": {"l": 478.59399, "t": 208.29351999999994, "r": 486.93274, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "88", "bbox": {"l": 504.6324200000001, "t": 208.29351999999994, "r": 512.97119, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "Page-footer", "bbox": {"l": 358.63901, "t": 219.25256000000002, "r": 401.16666, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "62", "bbox": {"l": 426.52399, "t": 219.25256000000002, "r": 434.86273, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "89", "bbox": {"l": 452.56240999999994, "t": 219.25256000000002, "r": 460.90115000000003, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "Page-header", "bbox": {"l": 358.63901, "t": 230.21155, "r": 403.91931, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "72", "bbox": {"l": 426.52399, "t": 230.21155, "r": 434.86273, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "90", "bbox": {"l": 452.56240999999994, "t": 230.21155, "r": 460.90115000000003, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "Picture", "bbox": {"l": 358.63901, "t": 241.16956000000005, "r": 384.62366, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "72", "bbox": {"l": 426.52399, "t": 241.16956000000005, "r": 434.86273, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "82", "bbox": {"l": 452.56240999999994, "t": 241.16956000000005, "r": 460.90115000000003, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "72", "bbox": {"l": 478.59399, "t": 241.16956000000005, "r": 486.93274, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "82", "bbox": {"l": 504.6324200000001, "t": 241.16956000000005, "r": 512.97119, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "Section-header", "bbox": {"l": 358.63901, "t": 252.12854000000004, "r": 413.37891, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "68", "bbox": {"l": 426.52399, "t": 252.12854000000004, "r": 434.86273, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "83", "bbox": {"l": 452.56240999999994, "t": 252.12854000000004, "r": 460.90115000000003, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "69", "bbox": {"l": 478.59399, "t": 252.12854000000004, "r": 486.93274, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "83", "bbox": {"l": 504.6324200000001, "t": 252.12854000000004, "r": 512.97119, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "Table", "bbox": {"l": 358.63901, "t": 263.08752000000004, "r": 378.44577, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "82", "bbox": {"l": 426.52399, "t": 263.08752000000004, "r": 434.86273, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "89", "bbox": {"l": 452.56240999999994, "t": 263.08752000000004, "r": 460.90115000000003, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "82", "bbox": {"l": 478.59399, "t": 263.08752000000004, "r": 486.93274, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "90", "bbox": {"l": 504.6324200000001, "t": 263.08752000000004, "r": 512.97119, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "Text", "bbox": {"l": 358.63901, "t": 274.04657, "r": 374.59921, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "85", "bbox": {"l": 426.52399, "t": 274.04657, "r": 434.86273, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "91", "bbox": {"l": 452.56240999999994, "t": 274.04657, "r": 460.90115000000003, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "84", "bbox": {"l": 478.59399, "t": 274.04657, "r": 486.93274, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "90", "bbox": {"l": 504.6324200000001, "t": 274.04657, "r": 512.97119, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "Title", "bbox": {"l": 358.63901, "t": 285.00552, "r": 375.63034, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "77", "bbox": {"l": 426.52399, "t": 285.00552, "r": 434.86273, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "81", "bbox": {"l": 452.56240999999994, "t": 285.00552, "r": 460.90115000000003, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "All", "bbox": {"l": 358.63901, "t": 296.36255, "r": 369.60492, "b": 304.73718, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "72", "bbox": {"l": 426.52399, "t": 296.36255, "r": 434.86273, "b": 304.73718, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "84", "bbox": {"l": 452.56240999999994, "t": 296.36255, "r": 460.90115000000003, "b": 304.73718, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "78", "bbox": {"l": 478.59399, "t": 296.36255, "r": 486.93274, "b": 304.73718, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "87", "bbox": {"l": 504.6324200000001, "t": 296.36255, "r": 512.97119, "b": 304.73718, "coord_origin": "TOPLEFT"}}], "children": [{"id": 80, "label": "text", "bbox": {"l": 358.63901, "t": 153.10051999999996, "r": 401.73154, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 115, "text": "Class-count", "bbox": {"l": 358.63901, "t": 153.10051999999996, "r": 401.73154, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 440.22501, "t": 153.10051999999996, "r": 448.56375, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 116, "text": "11", "bbox": {"l": 440.22501, "t": 153.10051999999996, "r": 448.56375, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 494.38, "t": 153.10051999999996, "r": 498.54938, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 117, "text": "5", "bbox": {"l": 494.38, "t": 153.10051999999996, "r": 498.54938, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 358.63901, "t": 164.05951000000005, "r": 375.27167, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 118, "text": "Split", "bbox": {"l": 358.63901, "t": 164.05951000000005, "r": 375.27167, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 423.341, "t": 164.05951000000005, "r": 438.0459, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 119, "text": "Doc", "bbox": {"l": 423.341, "t": 164.05951000000005, "r": 438.0459, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 448.00757, "t": 164.05951000000005, "r": 465.4472, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 120, "text": "Page", "bbox": {"l": 448.00757, "t": 164.05951000000005, "r": 465.4472, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 475.41101, "t": 164.05951000000005, "r": 490.11591, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 121, "text": "Doc", "bbox": {"l": 475.41101, "t": 164.05951000000005, "r": 490.11591, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 500.07757999999995, "t": 164.05951000000005, "r": 517.51721, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 122, "text": "Page", "bbox": {"l": 500.07757999999995, "t": 164.05951000000005, "r": 517.51721, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 358.63901, "t": 175.41656, "r": 387.82465, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 123, "text": "Caption", "bbox": {"l": 358.63901, "t": 175.41656, "r": 387.82465, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 426.52399, "t": 175.41656, "r": 434.86273, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 124, "text": "68", "bbox": {"l": 426.52399, "t": 175.41656, "r": 434.86273, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 452.56240999999994, "t": 175.41656, "r": 460.90115000000003, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 125, "text": "83", "bbox": {"l": 452.56240999999994, "t": 175.41656, "r": 460.90115000000003, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 358.63901, "t": 186.37554999999998, "r": 391.14221, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 126, "text": "Footnote", "bbox": {"l": 358.63901, "t": 186.37554999999998, "r": 391.14221, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 426.52399, "t": 186.37554999999998, "r": 434.86273, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 127, "text": "71", "bbox": {"l": 426.52399, "t": 186.37554999999998, "r": 434.86273, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 452.56240999999994, "t": 186.37554999999998, "r": 460.90115000000003, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 128, "text": "84", "bbox": {"l": 452.56240999999994, "t": 186.37554999999998, "r": 460.90115000000003, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 358.63901, "t": 197.33452999999997, "r": 389.15167, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 129, "text": "Formula", "bbox": {"l": 358.63901, "t": 197.33452999999997, "r": 389.15167, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 426.52399, "t": 197.33452999999997, "r": 434.86273, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 130, "text": "60", "bbox": {"l": 426.52399, "t": 197.33452999999997, "r": 434.86273, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 452.56240999999994, "t": 197.33452999999997, "r": 460.90115000000003, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 131, "text": "66", "bbox": {"l": 452.56240999999994, "t": 197.33452999999997, "r": 460.90115000000003, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 358.63901, "t": 208.29351999999994, "r": 391.5188, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 132, "text": "List-item", "bbox": {"l": 358.63901, "t": 208.29351999999994, "r": 391.5188, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 426.52399, "t": 208.29351999999994, "r": 434.86273, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 133, "text": "81", "bbox": {"l": 426.52399, "t": 208.29351999999994, "r": 434.86273, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 452.56240999999994, "t": 208.29351999999994, "r": 460.90115000000003, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 134, "text": "88", "bbox": {"l": 452.56240999999994, "t": 208.29351999999994, "r": 460.90115000000003, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 478.59399, "t": 208.29351999999994, "r": 486.93274, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 135, "text": "82", "bbox": {"l": 478.59399, "t": 208.29351999999994, "r": 486.93274, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 504.6324200000001, "t": 208.29351999999994, "r": 512.97119, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 136, "text": "88", "bbox": {"l": 504.6324200000001, "t": 208.29351999999994, "r": 512.97119, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 358.63901, "t": 219.25256000000002, "r": 401.16666, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 137, "text": "Page-footer", "bbox": {"l": 358.63901, "t": 219.25256000000002, "r": 401.16666, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 426.52399, "t": 219.25256000000002, "r": 434.86273, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 138, "text": "62", "bbox": {"l": 426.52399, "t": 219.25256000000002, "r": 434.86273, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 452.56240999999994, "t": 219.25256000000002, "r": 460.90115000000003, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 139, "text": "89", "bbox": {"l": 452.56240999999994, "t": 219.25256000000002, "r": 460.90115000000003, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 358.63901, "t": 230.21155, "r": 403.91931, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 140, "text": "Page-header", "bbox": {"l": 358.63901, "t": 230.21155, "r": 403.91931, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 426.52399, "t": 230.21155, "r": 434.86273, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 141, "text": "72", "bbox": {"l": 426.52399, "t": 230.21155, "r": 434.86273, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 452.56240999999994, "t": 230.21155, "r": 460.90115000000003, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 142, "text": "90", "bbox": {"l": 452.56240999999994, "t": 230.21155, "r": 460.90115000000003, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 358.63901, "t": 241.16956000000005, "r": 384.62366, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 143, "text": "Picture", "bbox": {"l": 358.63901, "t": 241.16956000000005, "r": 384.62366, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 426.52399, "t": 241.16956000000005, "r": 434.86273, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 144, "text": "72", "bbox": {"l": 426.52399, "t": 241.16956000000005, "r": 434.86273, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 452.56240999999994, "t": 241.16956000000005, "r": 460.90115000000003, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 145, "text": "82", "bbox": {"l": 452.56240999999994, "t": 241.16956000000005, "r": 460.90115000000003, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 478.59399, "t": 241.16956000000005, "r": 486.93274, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 146, "text": "72", "bbox": {"l": 478.59399, "t": 241.16956000000005, "r": 486.93274, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 504.6324200000001, "t": 241.16956000000005, "r": 512.97119, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 147, "text": "82", "bbox": {"l": 504.6324200000001, "t": 241.16956000000005, "r": 512.97119, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 358.63901, "t": 252.12854000000004, "r": 413.37891, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 148, "text": "Section-header", "bbox": {"l": 358.63901, "t": 252.12854000000004, "r": 413.37891, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 114, "label": "text", "bbox": {"l": 426.52399, "t": 252.12854000000004, "r": 434.86273, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 149, "text": "68", "bbox": {"l": 426.52399, "t": 252.12854000000004, "r": 434.86273, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 115, "label": "text", "bbox": {"l": 452.56240999999994, "t": 252.12854000000004, "r": 460.90115000000003, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 150, "text": "83", "bbox": {"l": 452.56240999999994, "t": 252.12854000000004, "r": 460.90115000000003, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 116, "label": "text", "bbox": {"l": 478.59399, "t": 252.12854000000004, "r": 486.93274, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 151, "text": "69", "bbox": {"l": 478.59399, "t": 252.12854000000004, "r": 486.93274, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 117, "label": "text", "bbox": {"l": 504.6324200000001, "t": 252.12854000000004, "r": 512.97119, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 152, "text": "83", "bbox": {"l": 504.6324200000001, "t": 252.12854000000004, "r": 512.97119, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 118, "label": "text", "bbox": {"l": 358.63901, "t": 263.08752000000004, "r": 378.44577, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 153, "text": "Table", "bbox": {"l": 358.63901, "t": 263.08752000000004, "r": 378.44577, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 119, "label": "text", "bbox": {"l": 426.52399, "t": 263.08752000000004, "r": 434.86273, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 154, "text": "82", "bbox": {"l": 426.52399, "t": 263.08752000000004, "r": 434.86273, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 120, "label": "text", "bbox": {"l": 452.56240999999994, "t": 263.08752000000004, "r": 460.90115000000003, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 155, "text": "89", "bbox": {"l": 452.56240999999994, "t": 263.08752000000004, "r": 460.90115000000003, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 121, "label": "text", "bbox": {"l": 478.59399, "t": 263.08752000000004, "r": 486.93274, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 156, "text": "82", "bbox": {"l": 478.59399, "t": 263.08752000000004, "r": 486.93274, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 122, "label": "text", "bbox": {"l": 504.6324200000001, "t": 263.08752000000004, "r": 512.97119, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 157, "text": "90", "bbox": {"l": 504.6324200000001, "t": 263.08752000000004, "r": 512.97119, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 123, "label": "text", "bbox": {"l": 358.63901, "t": 274.04657, "r": 374.59921, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 158, "text": "Text", "bbox": {"l": 358.63901, "t": 274.04657, "r": 374.59921, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 124, "label": "text", "bbox": {"l": 426.52399, "t": 274.04657, "r": 434.86273, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 159, "text": "85", "bbox": {"l": 426.52399, "t": 274.04657, "r": 434.86273, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 125, "label": "text", "bbox": {"l": 452.56240999999994, "t": 274.04657, "r": 460.90115000000003, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 160, "text": "91", "bbox": {"l": 452.56240999999994, "t": 274.04657, "r": 460.90115000000003, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 126, "label": "text", "bbox": {"l": 478.59399, "t": 274.04657, "r": 486.93274, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 161, "text": "84", "bbox": {"l": 478.59399, "t": 274.04657, "r": 486.93274, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 127, "label": "text", "bbox": {"l": 504.6324200000001, "t": 274.04657, "r": 512.97119, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 162, "text": "90", "bbox": {"l": 504.6324200000001, "t": 274.04657, "r": 512.97119, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 128, "label": "text", "bbox": {"l": 358.63901, "t": 285.00552, "r": 375.63034, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 163, "text": "Title", "bbox": {"l": 358.63901, "t": 285.00552, "r": 375.63034, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 129, "label": "text", "bbox": {"l": 426.52399, "t": 285.00552, "r": 434.86273, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 164, "text": "77", "bbox": {"l": 426.52399, "t": 285.00552, "r": 434.86273, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 130, "label": "text", "bbox": {"l": 452.56240999999994, "t": 285.00552, "r": 460.90115000000003, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 165, "text": "81", "bbox": {"l": 452.56240999999994, "t": 285.00552, "r": 460.90115000000003, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 131, "label": "text", "bbox": {"l": 358.63901, "t": 296.36255, "r": 369.60492, "b": 304.73718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 166, "text": "All", "bbox": {"l": 358.63901, "t": 296.36255, "r": 369.60492, "b": 304.73718, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 132, "label": "text", "bbox": {"l": 426.52399, "t": 296.36255, "r": 434.86273, "b": 304.73718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 167, "text": "72", "bbox": {"l": 426.52399, "t": 296.36255, "r": 434.86273, "b": 304.73718, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 133, "label": "text", "bbox": {"l": 452.56240999999994, "t": 296.36255, "r": 460.90115000000003, "b": 304.73718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 168, "text": "84", "bbox": {"l": 452.56240999999994, "t": 296.36255, "r": 460.90115000000003, "b": 304.73718, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 134, "label": "text", "bbox": {"l": 478.59399, "t": 296.36255, "r": 486.93274, "b": 304.73718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 169, "text": "78", "bbox": {"l": 478.59399, "t": 296.36255, "r": 486.93274, "b": 304.73718, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 135, "label": "text", "bbox": {"l": 504.6324200000001, "t": 296.36255, "r": 512.97119, "b": 304.73718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 170, "text": "87", "bbox": {"l": 504.6324200000001, "t": 296.36255, "r": 512.97119, "b": 304.73718, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["fcel", "ched", "lcel", "ched", "lcel", "nl", "fcel", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 14, "num_cols": 5, "table_cells": [{"bbox": {"l": 358.63901, "t": 153.10051999999996, "r": 401.73154, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Class-count", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.22501, "t": 153.10051999999996, "r": 448.56375, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 3, "text": "11", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 494.38, "t": 153.10051999999996, "r": 498.54938, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 5, "text": "5", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 164.05951000000005, "r": 375.27167, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Split", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 423.341, "t": 164.05951000000005, "r": 438.0459, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Doc", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 448.00757, "t": 164.05951000000005, "r": 465.4472, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Page", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 475.41101, "t": 164.05951000000005, "r": 490.11591, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Doc", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 500.07757999999995, "t": 164.05951000000005, "r": 517.51721, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Page", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 175.41656, "r": 387.82465, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Caption", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 175.41656, "r": 434.86273, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 175.41656, "r": 460.90115000000003, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 186.37554999999998, "r": 391.14221, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Footnote", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 186.37554999999998, "r": 434.86273, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "71", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 186.37554999999998, "r": 460.90115000000003, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 197.33452999999997, "r": 389.15167, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Formula", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 197.33452999999997, "r": 434.86273, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "60", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 197.33452999999997, "r": 460.90115000000003, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "66", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 208.29351999999994, "r": 391.5188, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "List-item", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 208.29351999999994, "r": 434.86273, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 208.29351999999994, "r": 460.90115000000003, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 478.59399, "t": 208.29351999999994, "r": 486.93274, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 504.6324200000001, "t": 208.29351999999994, "r": 512.97119, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 219.25256000000002, "r": 401.16666, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-footer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 219.25256000000002, "r": 434.86273, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "62", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 219.25256000000002, "r": 460.90115000000003, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "89", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 230.21155, "r": 403.91931, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 230.21155, "r": 434.86273, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 230.21155, "r": 460.90115000000003, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "90", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 241.16956000000005, "r": 384.62366, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Picture", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 241.16956000000005, "r": 434.86273, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 241.16956000000005, "r": 460.90115000000003, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 478.59399, "t": 241.16956000000005, "r": 486.93274, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 504.6324200000001, "t": 241.16956000000005, "r": 512.97119, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 252.12854000000004, "r": 413.37891, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Section-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 252.12854000000004, "r": 434.86273, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 252.12854000000004, "r": 460.90115000000003, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 478.59399, "t": 252.12854000000004, "r": 486.93274, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "69", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 504.6324200000001, "t": 252.12854000000004, "r": 512.97119, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 263.08752000000004, "r": 378.44577, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 263.08752000000004, "r": 434.86273, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 263.08752000000004, "r": 460.90115000000003, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "89", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 478.59399, "t": 263.08752000000004, "r": 486.93274, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 504.6324200000001, "t": 263.08752000000004, "r": 512.97119, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "90", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 274.04657, "r": 374.59921, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Text", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 274.04657, "r": 434.86273, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 274.04657, "r": 460.90115000000003, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "91", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 478.59399, "t": 274.04657, "r": 486.93274, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 504.6324200000001, "t": 274.04657, "r": 512.97119, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "90", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 285.00552, "r": 375.63034, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Title", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 285.00552, "r": 434.86273, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 285.00552, "r": 460.90115000000003, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 296.36255, "r": 369.60492, "b": 304.73718, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "All", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 296.36255, "r": 434.86273, "b": 304.73718, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 296.36255, "r": 460.90115000000003, "b": 304.73718, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 478.59399, "t": 296.36255, "r": 486.93274, "b": 304.73718, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "78", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 504.6324200000001, "t": 296.36255, "r": 512.97119, "b": 304.73718, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "87", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "text", "id": 6, "page_no": 6, "cluster": {"id": 6, "label": "text", "bbox": {"l": 317.686, "t": 331.40353, "r": 559.58496, "b": 416.49017, "coord_origin": "TOPLEFT"}, "confidence": 0.9740146994590759, "cells": [{"id": 171, "text": "lists in PubLayNet (grouped list-items) versus DocLayNet (separate", "bbox": {"l": 317.95499, "t": 331.40353, "r": 558.20233, "b": 339.77817, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "list-items), the label set of size 4 is the closest to PubLayNet, in the", "bbox": {"l": 317.95499, "t": 342.36255, "r": 558.2005, "b": 350.73718, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "assumption that the", "bbox": {"l": 317.95499, "t": 353.32153, "r": 393.16028, "b": 361.69617000000005, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "List", "bbox": {"l": 395.84201, "t": 353.36639, "r": 409.14905, "b": 361.70514, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "is down-mapped to", "bbox": {"l": 412.33301, "t": 353.32153, "r": 485.02324999999996, "b": 361.69617000000005, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "Text", "bbox": {"l": 487.70401, "t": 353.36639, "r": 502.86761, "b": 361.70514, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "in PubLayNet.", "bbox": {"l": 506.05499, "t": 353.32153, "r": 559.58496, "b": 361.69617000000005, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "The results in Table 3 show that the prediction accuracy on the", "bbox": {"l": 317.686, "t": 364.28054999999995, "r": 558.2002, "b": 372.65518, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "remaining class labels does not change significantly when other", "bbox": {"l": 317.95499, "t": 375.23853, "r": 558.36877, "b": 383.61316, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "classes are merged into them. The overall macro-average improves", "bbox": {"l": 317.95499, "t": 386.19754, "r": 558.19958, "b": 394.57217, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "by around 5%, in particular when", "bbox": {"l": 317.95499, "t": 397.15652, "r": 439.49454, "b": 405.53116000000006, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "Page-footer", "bbox": {"l": 441.728, "t": 397.20139, "r": 481.8616, "b": 405.54013, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "and", "bbox": {"l": 484.74298, "t": 397.15652, "r": 498.23743, "b": 405.53116000000006, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "Page-header", "bbox": {"l": 500.47299, "t": 397.20139, "r": 543.95105, "b": 405.54013, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": "are", "bbox": {"l": 546.83197, "t": 397.15652, "r": 558.20142, "b": 405.53116000000006, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "excluded.", "bbox": {"l": 317.95496, "t": 408.11553999999995, "r": 352.37698, "b": 416.49017, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "lists in PubLayNet (grouped list-items) versus DocLayNet (separate list-items), the label set of size 4 is the closest to PubLayNet, in the assumption that the List is down-mapped to Text in PubLayNet. The results in Table 3 show that the prediction accuracy on the remaining class labels does not change significantly when other classes are merged into them. The overall macro-average improves by around 5%, in particular when Page-footer and Page-header are excluded."}, {"label": "section_header", "id": 9, "page_no": 6, "cluster": {"id": 9, "label": "section_header", "bbox": {"l": 317.95496, "t": 429.3949, "r": 549.8606, "b": 439.70398, "coord_origin": "TOPLEFT"}, "confidence": 0.9562516808509827, "cells": [{"id": 187, "text": "Impact of Document Split in Train and Test Set", "bbox": {"l": 317.95496, "t": 429.3949, "r": 549.8606, "b": 439.70398, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Impact of Document Split in Train and Test Set"}, {"label": "text", "id": 3, "page_no": 6, "cluster": {"id": 3, "label": "text", "bbox": {"l": 317.62299, "t": 444.59653, "r": 559.71381, "b": 595.43718, "coord_origin": "TOPLEFT"}, "confidence": 0.9869834184646606, "cells": [{"id": 188, "text": "Many documents in DocLayNet have a unique styling. In order", "bbox": {"l": 317.95499, "t": 444.59653, "r": 558.36884, "b": 452.97116, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "to avoid overfitting on a particular style, we have split the train-,", "bbox": {"l": 317.95499, "t": 455.55554, "r": 559.19189, "b": 463.93018, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "test- and validation-sets of DocLayNet on document boundaries, i.e.", "bbox": {"l": 317.95499, "t": 466.51453, "r": 559.58185, "b": 474.88916, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "every document contributes pages to only one set. To the best of", "bbox": {"l": 317.95499, "t": 477.47354, "r": 558.20605, "b": 485.84818, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": "our knowledge, this was not considered in PubLayNet or DocBank.", "bbox": {"l": 317.95499, "t": 488.43253, "r": 559.58203, "b": 496.80716, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "To quantify how this affects model performance, we trained and", "bbox": {"l": 317.686, "t": 499.39154, "r": 558.20032, "b": 507.76617, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "evaluated a Mask R-CNN R50 model on a modified dataset version.", "bbox": {"l": 317.95499, "t": 510.35052, "r": 559.5849, "b": 518.72516, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "Here, the train-, test- and validation-sets were obtained by a ran-", "bbox": {"l": 317.95499, "t": 521.30954, "r": 559.71381, "b": 529.68417, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "domised draw over the individual pages. As can be seen in Table 4,", "bbox": {"l": 317.95499, "t": 532.26855, "r": 559.18707, "b": 540.64317, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "the difference in model performance is surprisingly large: page-", "bbox": {"l": 317.95499, "t": 543.22655, "r": 559.71313, "b": 551.60117, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "wise splitting gains", "bbox": {"l": 317.62299, "t": 554.18555, "r": 388.35168, "b": 562.56017, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "\u02dc", "bbox": {"l": 391.36499, "t": 552.50055, "r": 393.98318, "b": 560.87517, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "10% in mAP over the document-wise splitting.", "bbox": {"l": 390.59, "t": 554.18555, "r": 559.58191, "b": 562.56017, "coord_origin": "TOPLEFT"}}, {"id": 201, "text": "Thus, random page-wise splitting of DocLayNet can easily lead", "bbox": {"l": 317.686, "t": 565.14455, "r": 558.20032, "b": 573.51917, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": "to accidental overestimation of model performance and should be", "bbox": {"l": 317.95499, "t": 576.10356, "r": 558.20508, "b": 584.4781800000001, "coord_origin": "TOPLEFT"}}, {"id": 203, "text": "avoided.", "bbox": {"l": 317.95499, "t": 587.06256, "r": 348.50354, "b": 595.43718, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Many documents in DocLayNet have a unique styling. In order to avoid overfitting on a particular style, we have split the train-, test- and validation-sets of DocLayNet on document boundaries, i.e. every document contributes pages to only one set. To the best of our knowledge, this was not considered in PubLayNet or DocBank. To quantify how this affects model performance, we trained and evaluated a Mask R-CNN R50 model on a modified dataset version. Here, the train-, test- and validation-sets were obtained by a randomised draw over the individual pages. As can be seen in Table 4, the difference in model performance is surprisingly large: pagewise splitting gains \u02dc 10% in mAP over the document-wise splitting. Thus, random page-wise splitting of DocLayNet can easily lead to accidental overestimation of model performance and should be avoided."}, {"label": "section_header", "id": 7, "page_no": 6, "cluster": {"id": 7, "label": "section_header", "bbox": {"l": 317.95499, "t": 608.34192, "r": 418.54776, "b": 618.65102, "coord_origin": "TOPLEFT"}, "confidence": 0.9589217305183411, "cells": [{"id": 204, "text": "Dataset Comparison", "bbox": {"l": 317.95499, "t": 608.34192, "r": 418.54776, "b": 618.65102, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Dataset Comparison"}, {"label": "text", "id": 2, "page_no": 6, "cluster": {"id": 2, "label": "text", "bbox": {"l": 317.686, "t": 623.54355, "r": 559.18817, "b": 708.640137, "coord_origin": "TOPLEFT"}, "confidence": 0.9872549772262573, "cells": [{"id": 205, "text": "Throughout this paper, we claim that DocLayNet\u2019s wider variety of", "bbox": {"l": 317.686, "t": 623.54355, "r": 558.20575, "b": 631.91817, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": "document layouts leads to more robust layout detection models. In", "bbox": {"l": 317.95499, "t": 634.50255, "r": 558.20624, "b": 642.87717, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": "Table 5, we provide evidence for that. We trained models on each", "bbox": {"l": 317.686, "t": 645.46155, "r": 558.20319, "b": 653.83617, "coord_origin": "TOPLEFT"}}, {"id": 208, "text": "of the available datasets (PubLayNet, DocBank and DocLayNet)", "bbox": {"l": 317.95499, "t": 656.42055, "r": 558.74377, "b": 664.79517, "coord_origin": "TOPLEFT"}}, {"id": 209, "text": "and evaluated them on the test sets of the other datasets. Due to", "bbox": {"l": 317.95499, "t": 667.37955, "r": 558.20398, "b": 675.7541699999999, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": "the different label sets and annotation styles, a direct comparison", "bbox": {"l": 317.95499, "t": 678.3385499999999, "r": 558.20062, "b": 686.71317, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "is not possible. Hence, we focussed on the common labels among", "bbox": {"l": 317.95499, "t": 689.29755, "r": 558.20343, "b": 697.672173, "coord_origin": "TOPLEFT"}}, {"id": 212, "text": "the datasets. Between PubLayNet and DocLayNet, these are", "bbox": {"l": 317.95499, "t": 700.256554, "r": 531.07666, "b": 708.631172, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "Picture", "bbox": {"l": 533.16199, "t": 700.301384, "r": 557.2561, "b": 708.640137, "coord_origin": "TOPLEFT"}}, {"id": 214, "text": ",", "bbox": {"l": 557.255, "t": 700.256554, "r": 559.18817, "b": 708.631172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Throughout this paper, we claim that DocLayNet's wider variety of document layouts leads to more robust layout detection models. In Table 5, we provide evidence for that. We trained models on each of the available datasets (PubLayNet, DocBank and DocLayNet) and evaluated them on the test sets of the other datasets. Due to the different label sets and annotation styles, a direct comparison is not possible. Hence, we focussed on the common labels among the datasets. Between PubLayNet and DocLayNet, these are Picture ,"}], "body": [{"label": "text", "id": 14, "page_no": 6, "cluster": {"id": 14, "label": "text", "bbox": {"l": 53.501999, "t": 86.87292000000002, "r": 295.64865, "b": 128.22313999999994, "coord_origin": "TOPLEFT"}, "confidence": 0.8296934366226196, "cells": [{"id": 2, "text": "Table 3: Performance of a Mask R-CNN R50 network in", "bbox": {"l": 53.501999, "t": 86.87292000000002, "r": 294.0437, "b": 95.34618999999998, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "mAP@0.5-0.95 scores trained on DocLayNet with different", "bbox": {"l": 53.79800000000001, "t": 97.83191, "r": 294.04376, "b": 106.30517999999995, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "class label sets. The reduced label sets were obtained by ei-", "bbox": {"l": 53.79800000000001, "t": 108.79088999999999, "r": 295.64865, "b": 117.26415999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "ther down-mapping or dropping labels.", "bbox": {"l": 53.79800000000001, "t": 119.74987999999996, "r": 213.23856, "b": 128.22313999999994, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 3: Performance of a Mask R-CNN R50 network in mAP@0.5-0.95 scores trained on DocLayNet with different class label sets. The reduced label sets were obtained by either down-mapping or dropping labels."}, {"label": "table", "id": 4, "page_no": 6, "cluster": {"id": 4, "label": "table", "bbox": {"l": 80.35525512695312, "t": 150.93629455566406, "r": 267.0082092285156, "b": 295.4454650878906, "coord_origin": "TOPLEFT"}, "confidence": 0.9869412779808044, "cells": [{"id": 6, "text": "Class-count", "bbox": {"l": 86.372002, "t": 153.10051999999996, "r": 129.46452, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "11", "bbox": {"l": 151.07401, "t": 153.10051999999996, "r": 159.41275, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "6", "bbox": {"l": 179.31816, "t": 153.10051999999996, "r": 183.48753, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "5", "bbox": {"l": 213.33669, "t": 153.10051999999996, "r": 217.50606, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "4", "bbox": {"l": 247.35521, "t": 153.10051999999996, "r": 251.52458, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Caption", "bbox": {"l": 86.372002, "t": 164.45752000000005, "r": 115.55763, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "68", "bbox": {"l": 151.07401, "t": 164.45752000000005, "r": 159.41275, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Text", "bbox": {"l": 173.42723, "t": 164.45752000000005, "r": 189.38742, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Text", "bbox": {"l": 207.44576, "t": 164.45752000000005, "r": 223.40594000000002, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Text", "bbox": {"l": 241.46428, "t": 164.45752000000005, "r": 257.42447, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Footnote", "bbox": {"l": 86.372002, "t": 175.41656, "r": 118.8752, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "71", "bbox": {"l": 151.07401, "t": 175.41656, "r": 159.41275, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Text", "bbox": {"l": 173.42723, "t": 175.41656, "r": 189.38742, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Text", "bbox": {"l": 207.44576, "t": 175.41656, "r": 223.40594000000002, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Text", "bbox": {"l": 241.46428, "t": 175.41656, "r": 257.42447, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Formula", "bbox": {"l": 86.372002, "t": 186.37554999999998, "r": 116.88466, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "60", "bbox": {"l": 151.07401, "t": 186.37554999999998, "r": 159.41275, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Text", "bbox": {"l": 173.42723, "t": 186.37554999999998, "r": 189.38742, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "Text", "bbox": {"l": 207.44576, "t": 186.37554999999998, "r": 223.40594000000002, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "Text", "bbox": {"l": 241.46428, "t": 186.37554999999998, "r": 257.42447, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "List-item", "bbox": {"l": 86.372002, "t": 197.33452999999997, "r": 119.25179, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "81", "bbox": {"l": 151.07401, "t": 197.33452999999997, "r": 159.41275, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Text", "bbox": {"l": 173.42723, "t": 197.33452999999997, "r": 189.38742, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "82", "bbox": {"l": 211.25647, "t": 197.33452999999997, "r": 219.59521, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Text", "bbox": {"l": 241.46426, "t": 197.33452999999997, "r": 257.42447, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Page-footer", "bbox": {"l": 86.372002, "t": 208.29351999999994, "r": 128.89964, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "62", "bbox": {"l": 151.07401, "t": 208.29351999999994, "r": 159.41275, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "62", "bbox": {"l": 177.23795, "t": 208.29351999999994, "r": 185.57669, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "-", "bbox": {"l": 213.91052, "t": 208.29351999999994, "r": 216.94116, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "-", "bbox": {"l": 247.92905000000002, "t": 208.29351999999994, "r": 250.95969, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Page-header", "bbox": {"l": 86.372002, "t": 219.25256000000002, "r": 131.65231, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "72", "bbox": {"l": 151.07401, "t": 219.25256000000002, "r": 159.41275, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "68", "bbox": {"l": 177.23795, "t": 219.25256000000002, "r": 185.57669, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "-", "bbox": {"l": 213.91052, "t": 219.25256000000002, "r": 216.94116, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "-", "bbox": {"l": 247.92905000000002, "t": 219.25256000000002, "r": 250.95969, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Picture", "bbox": {"l": 86.372002, "t": 230.21155, "r": 112.35663, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "72", "bbox": {"l": 151.07401, "t": 230.21155, "r": 159.41275, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "72", "bbox": {"l": 177.23795, "t": 230.21155, "r": 185.57669, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "72", "bbox": {"l": 211.25645, "t": 230.21155, "r": 219.5952, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "72", "bbox": {"l": 245.27496, "t": 230.21155, "r": 253.61371, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "Section-header", "bbox": {"l": 86.372002, "t": 241.16956000000005, "r": 141.11188, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "68", "bbox": {"l": 151.07401, "t": 241.16956000000005, "r": 159.41275, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "67", "bbox": {"l": 177.23795, "t": 241.16956000000005, "r": 185.57669, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "69", "bbox": {"l": 211.25645, "t": 241.16956000000005, "r": 219.5952, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "68", "bbox": {"l": 245.27496, "t": 241.16956000000005, "r": 253.61371, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Table", "bbox": {"l": 86.372002, "t": 252.12854000000004, "r": 106.17878, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "82", "bbox": {"l": 151.07401, "t": 252.12854000000004, "r": 159.41275, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "83", "bbox": {"l": 177.23795, "t": 252.12854000000004, "r": 185.57669, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "82", "bbox": {"l": 211.25645, "t": 252.12854000000004, "r": 219.5952, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "82", "bbox": {"l": 245.27496, "t": 252.12854000000004, "r": 253.61371, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Text", "bbox": {"l": 86.372002, "t": 263.08752000000004, "r": 102.3322, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "85", "bbox": {"l": 151.07401, "t": 263.08752000000004, "r": 159.41275, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "84", "bbox": {"l": 177.23795, "t": 263.08752000000004, "r": 185.57669, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "84", "bbox": {"l": 211.25645, "t": 263.08752000000004, "r": 219.5952, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "84", "bbox": {"l": 245.27496, "t": 263.08752000000004, "r": 253.61371, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "Title", "bbox": {"l": 86.372002, "t": 274.04657, "r": 103.36333, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "77", "bbox": {"l": 151.07401, "t": 274.04657, "r": 159.41275, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "Sec.-h.", "bbox": {"l": 169.37442, "t": 274.04657, "r": 193.43127, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "Sec.-h.", "bbox": {"l": 203.39294, "t": 274.04657, "r": 227.4498, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "Sec.-h.", "bbox": {"l": 237.41147, "t": 274.04657, "r": 261.46832, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "Overall", "bbox": {"l": 86.372002, "t": 285.40454, "r": 113.31602000000001, "b": 293.77917, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "72", "bbox": {"l": 151.07401, "t": 285.40454, "r": 159.41275, "b": 293.77917, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "73", "bbox": {"l": 177.23795, "t": 285.40454, "r": 185.57669, "b": 293.77917, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "78", "bbox": {"l": 211.25645, "t": 285.40454, "r": 219.5952, "b": 293.77917, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "77", "bbox": {"l": 245.27496, "t": 285.40454, "r": 253.61371, "b": 293.77917, "coord_origin": "TOPLEFT"}}], "children": [{"id": 15, "label": "text", "bbox": {"l": 86.372002, "t": 153.10051999999996, "r": 129.46452, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": "Class-count", "bbox": {"l": 86.372002, "t": 153.10051999999996, "r": 129.46452, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 151.07401, "t": 153.10051999999996, "r": 159.41275, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "11", "bbox": {"l": 151.07401, "t": 153.10051999999996, "r": 159.41275, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 179.31816, "t": 153.10051999999996, "r": 183.48753, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "6", "bbox": {"l": 179.31816, "t": 153.10051999999996, "r": 183.48753, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 213.33669, "t": 153.10051999999996, "r": 217.50606, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "5", "bbox": {"l": 213.33669, "t": 153.10051999999996, "r": 217.50606, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 247.35521, "t": 153.10051999999996, "r": 251.52458, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "4", "bbox": {"l": 247.35521, "t": 153.10051999999996, "r": 251.52458, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 86.372002, "t": 164.45752000000005, "r": 115.55763, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "Caption", "bbox": {"l": 86.372002, "t": 164.45752000000005, "r": 115.55763, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 151.07401, "t": 164.45752000000005, "r": 159.41275, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "68", "bbox": {"l": 151.07401, "t": 164.45752000000005, "r": 159.41275, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 173.42723, "t": 164.45752000000005, "r": 189.38742, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "Text", "bbox": {"l": 173.42723, "t": 164.45752000000005, "r": 189.38742, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 207.44576, "t": 164.45752000000005, "r": 223.40594000000002, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "Text", "bbox": {"l": 207.44576, "t": 164.45752000000005, "r": 223.40594000000002, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 241.46428, "t": 164.45752000000005, "r": 257.42447, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "Text", "bbox": {"l": 241.46428, "t": 164.45752000000005, "r": 257.42447, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 86.372002, "t": 175.41656, "r": 118.8752, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "Footnote", "bbox": {"l": 86.372002, "t": 175.41656, "r": 118.8752, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 151.07401, "t": 175.41656, "r": 159.41275, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "71", "bbox": {"l": 151.07401, "t": 175.41656, "r": 159.41275, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 173.42723, "t": 175.41656, "r": 189.38742, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "Text", "bbox": {"l": 173.42723, "t": 175.41656, "r": 189.38742, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 207.44576, "t": 175.41656, "r": 223.40594000000002, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "Text", "bbox": {"l": 207.44576, "t": 175.41656, "r": 223.40594000000002, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 241.46428, "t": 175.41656, "r": 257.42447, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "Text", "bbox": {"l": 241.46428, "t": 175.41656, "r": 257.42447, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 86.372002, "t": 186.37554999999998, "r": 116.88466, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "Formula", "bbox": {"l": 86.372002, "t": 186.37554999999998, "r": 116.88466, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 151.07401, "t": 186.37554999999998, "r": 159.41275, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "60", "bbox": {"l": 151.07401, "t": 186.37554999999998, "r": 159.41275, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 173.42723, "t": 186.37554999999998, "r": 189.38742, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "Text", "bbox": {"l": 173.42723, "t": 186.37554999999998, "r": 189.38742, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 207.44576, "t": 186.37554999999998, "r": 223.40594000000002, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "Text", "bbox": {"l": 207.44576, "t": 186.37554999999998, "r": 223.40594000000002, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 241.46428, "t": 186.37554999999998, "r": 257.42447, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "Text", "bbox": {"l": 241.46428, "t": 186.37554999999998, "r": 257.42447, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 86.372002, "t": 197.33452999999997, "r": 119.25179, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "List-item", "bbox": {"l": 86.372002, "t": 197.33452999999997, "r": 119.25179, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 151.07401, "t": 197.33452999999997, "r": 159.41275, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "81", "bbox": {"l": 151.07401, "t": 197.33452999999997, "r": 159.41275, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 173.42723, "t": 197.33452999999997, "r": 189.38742, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "Text", "bbox": {"l": 173.42723, "t": 197.33452999999997, "r": 189.38742, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 211.25647, "t": 197.33452999999997, "r": 219.59521, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "82", "bbox": {"l": 211.25647, "t": 197.33452999999997, "r": 219.59521, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 241.46426, "t": 197.33452999999997, "r": 257.42447, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "Text", "bbox": {"l": 241.46426, "t": 197.33452999999997, "r": 257.42447, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 86.372002, "t": 208.29351999999994, "r": 128.89964, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "Page-footer", "bbox": {"l": 86.372002, "t": 208.29351999999994, "r": 128.89964, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 151.07401, "t": 208.29351999999994, "r": 159.41275, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "62", "bbox": {"l": 151.07401, "t": 208.29351999999994, "r": 159.41275, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 177.23795, "t": 208.29351999999994, "r": 185.57669, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "62", "bbox": {"l": 177.23795, "t": 208.29351999999994, "r": 185.57669, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 213.91052, "t": 208.29351999999994, "r": 216.94116, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "-", "bbox": {"l": 213.91052, "t": 208.29351999999994, "r": 216.94116, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 247.92905000000002, "t": 208.29351999999994, "r": 250.95969, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "-", "bbox": {"l": 247.92905000000002, "t": 208.29351999999994, "r": 250.95969, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 86.372002, "t": 219.25256000000002, "r": 131.65231, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "Page-header", "bbox": {"l": 86.372002, "t": 219.25256000000002, "r": 131.65231, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 151.07401, "t": 219.25256000000002, "r": 159.41275, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "72", "bbox": {"l": 151.07401, "t": 219.25256000000002, "r": 159.41275, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 177.23795, "t": 219.25256000000002, "r": 185.57669, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "68", "bbox": {"l": 177.23795, "t": 219.25256000000002, "r": 185.57669, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 213.91052, "t": 219.25256000000002, "r": 216.94116, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "-", "bbox": {"l": 213.91052, "t": 219.25256000000002, "r": 216.94116, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 247.92905000000002, "t": 219.25256000000002, "r": 250.95969, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "-", "bbox": {"l": 247.92905000000002, "t": 219.25256000000002, "r": 250.95969, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 86.372002, "t": 230.21155, "r": 112.35663, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "Picture", "bbox": {"l": 86.372002, "t": 230.21155, "r": 112.35663, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 151.07401, "t": 230.21155, "r": 159.41275, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "72", "bbox": {"l": 151.07401, "t": 230.21155, "r": 159.41275, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 177.23795, "t": 230.21155, "r": 185.57669, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "72", "bbox": {"l": 177.23795, "t": 230.21155, "r": 185.57669, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 211.25645, "t": 230.21155, "r": 219.5952, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "72", "bbox": {"l": 211.25645, "t": 230.21155, "r": 219.5952, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 245.27496, "t": 230.21155, "r": 253.61371, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "72", "bbox": {"l": 245.27496, "t": 230.21155, "r": 253.61371, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 86.372002, "t": 241.16956000000005, "r": 141.11188, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "Section-header", "bbox": {"l": 86.372002, "t": 241.16956000000005, "r": 141.11188, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 151.07401, "t": 241.16956000000005, "r": 159.41275, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "68", "bbox": {"l": 151.07401, "t": 241.16956000000005, "r": 159.41275, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 177.23795, "t": 241.16956000000005, "r": 185.57669, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "67", "bbox": {"l": 177.23795, "t": 241.16956000000005, "r": 185.57669, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 211.25645, "t": 241.16956000000005, "r": 219.5952, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "69", "bbox": {"l": 211.25645, "t": 241.16956000000005, "r": 219.5952, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 245.27496, "t": 241.16956000000005, "r": 253.61371, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "68", "bbox": {"l": 245.27496, "t": 241.16956000000005, "r": 253.61371, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 86.372002, "t": 252.12854000000004, "r": 106.17878, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "Table", "bbox": {"l": 86.372002, "t": 252.12854000000004, "r": 106.17878, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 151.07401, "t": 252.12854000000004, "r": 159.41275, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "82", "bbox": {"l": 151.07401, "t": 252.12854000000004, "r": 159.41275, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 177.23795, "t": 252.12854000000004, "r": 185.57669, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "83", "bbox": {"l": 177.23795, "t": 252.12854000000004, "r": 185.57669, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 211.25645, "t": 252.12854000000004, "r": 219.5952, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "82", "bbox": {"l": 211.25645, "t": 252.12854000000004, "r": 219.5952, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 245.27496, "t": 252.12854000000004, "r": 253.61371, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "82", "bbox": {"l": 245.27496, "t": 252.12854000000004, "r": 253.61371, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 86.372002, "t": 263.08752000000004, "r": 102.3322, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "Text", "bbox": {"l": 86.372002, "t": 263.08752000000004, "r": 102.3322, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 151.07401, "t": 263.08752000000004, "r": 159.41275, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "85", "bbox": {"l": 151.07401, "t": 263.08752000000004, "r": 159.41275, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 177.23795, "t": 263.08752000000004, "r": 185.57669, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "84", "bbox": {"l": 177.23795, "t": 263.08752000000004, "r": 185.57669, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 211.25645, "t": 263.08752000000004, "r": 219.5952, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "84", "bbox": {"l": 211.25645, "t": 263.08752000000004, "r": 219.5952, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 245.27496, "t": 263.08752000000004, "r": 253.61371, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "84", "bbox": {"l": 245.27496, "t": 263.08752000000004, "r": 253.61371, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 86.372002, "t": 274.04657, "r": 103.36333, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "Title", "bbox": {"l": 86.372002, "t": 274.04657, "r": 103.36333, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 151.07401, "t": 274.04657, "r": 159.41275, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "77", "bbox": {"l": 151.07401, "t": 274.04657, "r": 159.41275, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 169.37442, "t": 274.04657, "r": 193.43127, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "Sec.-h.", "bbox": {"l": 169.37442, "t": 274.04657, "r": 193.43127, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 203.39294, "t": 274.04657, "r": 227.4498, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "Sec.-h.", "bbox": {"l": 203.39294, "t": 274.04657, "r": 227.4498, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 237.41147, "t": 274.04657, "r": 261.46832, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "Sec.-h.", "bbox": {"l": 237.41147, "t": 274.04657, "r": 261.46832, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 86.372002, "t": 285.40454, "r": 113.31602000000001, "b": 293.77917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "Overall", "bbox": {"l": 86.372002, "t": 285.40454, "r": 113.31602000000001, "b": 293.77917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 151.07401, "t": 285.40454, "r": 159.41275, "b": 293.77917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "72", "bbox": {"l": 151.07401, "t": 285.40454, "r": 159.41275, "b": 293.77917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 177.23795, "t": 285.40454, "r": 185.57669, "b": 293.77917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "73", "bbox": {"l": 177.23795, "t": 285.40454, "r": 185.57669, "b": 293.77917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 211.25645, "t": 285.40454, "r": 219.5952, "b": 293.77917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "78", "bbox": {"l": 211.25645, "t": 285.40454, "r": 219.5952, "b": 293.77917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 245.27496, "t": 285.40454, "r": 253.61371, "b": 293.77917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "77", "bbox": {"l": 245.27496, "t": 285.40454, "r": 253.61371, "b": 293.77917, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 13, "num_cols": 5, "table_cells": [{"bbox": {"l": 86.372002, "t": 153.10051999999996, "r": 129.46452, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Class-count", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 151.07401, "t": 153.10051999999996, "r": 159.41275, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "11", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 179.31816, "t": 153.10051999999996, "r": 183.48753, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "6", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 213.33669, "t": 153.10051999999996, "r": 217.50606, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "5", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 247.35521, "t": 153.10051999999996, "r": 251.52458, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "4", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 164.45752000000005, "r": 115.55763, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Caption", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 164.45752000000005, "r": 159.41275, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 173.42723, "t": 164.45752000000005, "r": 189.38742, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 207.44576, "t": 164.45752000000005, "r": 223.40594000000002, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 241.46428, "t": 164.45752000000005, "r": 257.42447, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 175.41656, "r": 118.8752, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Footnote", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 175.41656, "r": 159.41275, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "71", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 173.42723, "t": 175.41656, "r": 189.38742, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 207.44576, "t": 175.41656, "r": 223.40594000000002, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 241.46428, "t": 175.41656, "r": 257.42447, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 186.37554999999998, "r": 116.88466, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Formula", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 186.37554999999998, "r": 159.41275, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "60", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 173.42723, "t": 186.37554999999998, "r": 189.38742, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 207.44576, "t": 186.37554999999998, "r": 223.40594000000002, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 241.46428, "t": 186.37554999999998, "r": 257.42447, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 197.33452999999997, "r": 119.25179, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "List-item", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 197.33452999999997, "r": 159.41275, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 173.42723, "t": 197.33452999999997, "r": 189.38742, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 211.25647, "t": 197.33452999999997, "r": 219.59521, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 241.46426, "t": 197.33452999999997, "r": 257.42447, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 208.29351999999994, "r": 128.89964, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-footer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 208.29351999999994, "r": 159.41275, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "62", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23795, "t": 208.29351999999994, "r": 185.57669, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "62", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 213.91052, "t": 208.29351999999994, "r": 216.94116, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 247.92905000000002, "t": 208.29351999999994, "r": 250.95969, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 219.25256000000002, "r": 131.65231, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 219.25256000000002, "r": 159.41275, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23795, "t": 219.25256000000002, "r": 185.57669, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 213.91052, "t": 219.25256000000002, "r": 216.94116, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 247.92905000000002, "t": 219.25256000000002, "r": 250.95969, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 230.21155, "r": 112.35663, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Picture", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 230.21155, "r": 159.41275, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23795, "t": 230.21155, "r": 185.57669, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 211.25645, "t": 230.21155, "r": 219.5952, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.27496, "t": 230.21155, "r": 253.61371, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 241.16956000000005, "r": 141.11188, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Section-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 241.16956000000005, "r": 159.41275, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23795, "t": 241.16956000000005, "r": 185.57669, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "67", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 211.25645, "t": 241.16956000000005, "r": 219.5952, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "69", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.27496, "t": 241.16956000000005, "r": 253.61371, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 252.12854000000004, "r": 106.17878, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 252.12854000000004, "r": 159.41275, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23795, "t": 252.12854000000004, "r": 185.57669, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 211.25645, "t": 252.12854000000004, "r": 219.5952, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.27496, "t": 252.12854000000004, "r": 253.61371, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 263.08752000000004, "r": 102.3322, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Text", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 263.08752000000004, "r": 159.41275, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23795, "t": 263.08752000000004, "r": 185.57669, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 211.25645, "t": 263.08752000000004, "r": 219.5952, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.27496, "t": 263.08752000000004, "r": 253.61371, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 274.04657, "r": 103.36333, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Title", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 274.04657, "r": 159.41275, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 169.37442, "t": 274.04657, "r": 193.43127, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Sec.-h.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 203.39294, "t": 274.04657, "r": 227.4498, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Sec.-h.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 237.41147, "t": 274.04657, "r": 261.46832, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Sec.-h.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 285.40454, "r": 113.31602000000001, "b": 293.77917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Overall", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 285.40454, "r": 159.41275, "b": 293.77917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23795, "t": 285.40454, "r": 185.57669, "b": 293.77917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "73", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 211.25645, "t": 285.40454, "r": 219.5952, "b": 293.77917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "78", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.27496, "t": 285.40454, "r": 253.61371, "b": 293.77917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "77", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "section_header", "id": 10, "page_no": 6, "cluster": {"id": 10, "label": "section_header", "bbox": {"l": 53.79800000000001, "t": 319.56992, "r": 131.05624, "b": 329.879, "coord_origin": "TOPLEFT"}, "confidence": 0.9555686116218567, "cells": [{"id": 71, "text": "Learning Curve", "bbox": {"l": 53.79800000000001, "t": 319.56992, "r": 131.05624, "b": 329.879, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Learning Curve"}, {"label": "text", "id": 5, "page_no": 6, "cluster": {"id": 5, "label": "text", "bbox": {"l": 52.785, "t": 334.77155, "r": 295.55835, "b": 529.44818, "coord_origin": "TOPLEFT"}, "confidence": 0.9857739210128784, "cells": [{"id": 72, "text": "One of the fundamental questions related to any dataset is if it is", "bbox": {"l": 53.79800000000001, "t": 334.77155, "r": 294.04153, "b": 343.14618, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "\u201clarge enough\u201d. To answer this question for DocLayNet, we per-", "bbox": {"l": 52.785, "t": 345.73053, "r": 295.55835, "b": 354.10516000000007, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "formed a data ablation study in which we evaluated a Mask R-CNN", "bbox": {"l": 53.79800000000001, "t": 356.6895400000001, "r": 294.04535, "b": 365.06418, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "model trained on increasing fractions of the DocLayNet dataset.", "bbox": {"l": 53.79800000000001, "t": 367.64853, "r": 295.4281, "b": 376.02316, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "As can be seen in Figure 5, the mAP score rises sharply in the be-", "bbox": {"l": 53.484001, "t": 378.60754, "r": 295.55667, "b": 386.98218, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "ginning and eventually levels out. To estimate the error-bar on the", "bbox": {"l": 53.79800000000001, "t": 389.56653, "r": 294.04865, "b": 397.94116, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "metrics, we ran the training five times on the entire data-set. This", "bbox": {"l": 53.79800000000001, "t": 400.52554000000003, "r": 294.04376, "b": 408.90018, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "resulted in a 1% error-bar, depicted by the shaded area in Figure 5.", "bbox": {"l": 53.79800000000001, "t": 411.48456, "r": 295.42459, "b": 419.85919, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "In the inset of Figure 5, we show the exact same data-points, but", "bbox": {"l": 53.79800000000001, "t": 422.44354, "r": 294.04709, "b": 430.81818, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "with a logarithmic scale on the x-axis. As is expected, the mAP", "bbox": {"l": 53.466999, "t": 433.40253000000007, "r": 294.04535, "b": 441.7771599999999, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "score increases linearly as a function of the data-size in the inset.", "bbox": {"l": 53.79800000000001, "t": 444.36053000000004, "r": 295.42902, "b": 452.73517, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "The curve ultimately flattens out between the 80% and 100% mark,", "bbox": {"l": 53.528999, "t": 455.31955, "r": 295.03122, "b": 463.69418, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "with the 80% mark falling within the error-bars of the 100% mark.", "bbox": {"l": 53.466999, "t": 466.27853, "r": 295.42154, "b": 474.65317, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "This provides a good indication that the model would not improve", "bbox": {"l": 53.528999, "t": 477.23755, "r": 294.04553, "b": 485.61218, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "significantly by yet increasing the data size. Rather, it would prob-", "bbox": {"l": 53.79800000000001, "t": 488.19653, "r": 295.55646, "b": 496.57117, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "ably benefit more from improved data consistency (as discussed", "bbox": {"l": 53.79800000000001, "t": 499.15555, "r": 294.04715, "b": 507.53018, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "in Section 3), data augmentation methods [23], or the addition of", "bbox": {"l": 53.79800000000001, "t": 510.11453, "r": 294.04245, "b": 518.4891700000001, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "more document categories and styles.", "bbox": {"l": 53.79800000000001, "t": 521.0735500000001, "r": 191.47707, "b": 529.44818, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "One of the fundamental questions related to any dataset is if it is \"large enough\". To answer this question for DocLayNet, we performed a data ablation study in which we evaluated a Mask R-CNN model trained on increasing fractions of the DocLayNet dataset. As can be seen in Figure 5, the mAP score rises sharply in the beginning and eventually levels out. To estimate the error-bar on the metrics, we ran the training five times on the entire data-set. This resulted in a 1% error-bar, depicted by the shaded area in Figure 5. In the inset of Figure 5, we show the exact same data-points, but with a logarithmic scale on the x-axis. As is expected, the mAP score increases linearly as a function of the data-size in the inset. The curve ultimately flattens out between the 80% and 100% mark, with the 80% mark falling within the error-bars of the 100% mark. This provides a good indication that the model would not improve significantly by yet increasing the data size. Rather, it would probably benefit more from improved data consistency (as discussed in Section 3), data augmentation methods [23], or the addition of more document categories and styles."}, {"label": "section_header", "id": 8, "page_no": 6, "cluster": {"id": 8, "label": "section_header", "bbox": {"l": 53.79800000000001, "t": 542.50992, "r": 164.32898, "b": 552.81902, "coord_origin": "TOPLEFT"}, "confidence": 0.9572026133537292, "cells": [{"id": 90, "text": "Impact of Class Labels", "bbox": {"l": 53.79800000000001, "t": 542.50992, "r": 164.32898, "b": 552.81902, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Impact of Class Labels"}, {"label": "text", "id": 1, "page_no": 6, "cluster": {"id": 1, "label": "text", "bbox": {"l": 53.466999, "t": 557.71155, "r": 295.55679, "b": 708.55217, "coord_origin": "TOPLEFT"}, "confidence": 0.9876301884651184, "cells": [{"id": 91, "text": "The choice and number of labels can have a significant effect on", "bbox": {"l": 53.528999, "t": 557.71155, "r": 294.04333, "b": 566.08617, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "the overall model performance. Since PubLayNet, DocBank and", "bbox": {"l": 53.79800000000001, "t": 568.6705499999999, "r": 294.04712, "b": 577.04517, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "DocLayNet all have different label sets, it is of particular interest to", "bbox": {"l": 53.79800000000001, "t": 579.62955, "r": 294.04538, "b": 588.0041699999999, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "understand and quantify this influence of the label set on the model", "bbox": {"l": 53.79800000000001, "t": 590.5885499999999, "r": 294.04535, "b": 598.96317, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "performance. We investigate this by either down-mapping labels", "bbox": {"l": 53.79800000000001, "t": 601.54755, "r": 294.04266, "b": 609.92216, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "into more common ones (e.g.", "bbox": {"l": 53.79800000000001, "t": 612.50656, "r": 163.59247, "b": 620.88118, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "Caption", "bbox": {"l": 166.26401, "t": 612.55139, "r": 194.97244, "b": 620.89015, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "\u2192", "bbox": {"l": 194.994, "t": 612.45276, "r": 204.1756, "b": 620.15491, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "Text", "bbox": {"l": 204.17599, "t": 612.55139, "r": 219.33961000000002, "b": 620.89015, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": ") or excluding them", "bbox": {"l": 219.849, "t": 612.50656, "r": 294.04828, "b": 620.88118, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "from the annotations entirely. Furthermore, it must be stressed", "bbox": {"l": 53.79800000000001, "t": 623.46556, "r": 294.04709, "b": 631.84018, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "that all mappings and exclusions were performed on the data be-", "bbox": {"l": 53.79800000000001, "t": 634.42355, "r": 295.55679, "b": 642.79817, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "fore model training. In Table 3, we present the mAP scores for a", "bbox": {"l": 53.79800000000001, "t": 645.38255, "r": 294.04715, "b": 653.75717, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "Mask R-CNN R50 network on different label sets. Where a label", "bbox": {"l": 53.79800000000001, "t": 656.34155, "r": 294.04715, "b": 664.71617, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "is down-mapped, we show its corresponding label, otherwise it", "bbox": {"l": 53.79800000000001, "t": 667.30055, "r": 294.04712, "b": 675.67517, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "was excluded. We present three different label sets, with 6, 5 and 4", "bbox": {"l": 53.466999, "t": 678.25955, "r": 294.25174, "b": 686.63417, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "different labels respectively. The set of 5 labels contains the same", "bbox": {"l": 53.79800000000001, "t": 689.21855, "r": 294.04639, "b": 697.59317, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "labels as PubLayNet. However, due to the different definition of", "bbox": {"l": 53.79800000000001, "t": 700.177551, "r": 294.04712, "b": 708.55217, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The choice and number of labels can have a significant effect on the overall model performance. Since PubLayNet, DocBank and DocLayNet all have different label sets, it is of particular interest to understand and quantify this influence of the label set on the model performance. We investigate this by either down-mapping labels into more common ones (e.g. Caption \u2192 Text ) or excluding them from the annotations entirely. Furthermore, it must be stressed that all mappings and exclusions were performed on the data before model training. In Table 3, we present the mAP scores for a Mask R-CNN R50 network on different label sets. Where a label is down-mapped, we show its corresponding label, otherwise it was excluded. We present three different label sets, with 6, 5 and 4 different labels respectively. The set of 5 labels contains the same labels as PubLayNet. However, due to the different definition of"}, {"label": "text", "id": 13, "page_no": 6, "cluster": {"id": 13, "label": "text", "bbox": {"l": 317.659, "t": 86.87298999999996, "r": 559.80682, "b": 128.22321, "coord_origin": "TOPLEFT"}, "confidence": 0.8736215829849243, "cells": [{"id": 109, "text": "Table 4: Performance of a Mask R-CNN R50 network with", "bbox": {"l": 317.659, "t": 86.87298999999996, "r": 558.20068, "b": 95.34625000000017, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "document-wise and page-wise split for different label sets.", "bbox": {"l": 317.95499, "t": 97.83196999999996, "r": 559.73401, "b": 106.30524000000003, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "Naive page-wise split will result in", "bbox": {"l": 317.95499, "t": 108.79094999999995, "r": 467.72089, "b": 117.26422000000014, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "GLYPH<tildelow>", "bbox": {"l": 471.90900000000005, "t": 107.12798999999995, "r": 477.53900000000004, "b": 115.19768999999997, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "10% point improve-", "bbox": {"l": 477.54001000000005, "t": 108.79094999999995, "r": 559.80682, "b": 117.26422000000014, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "ment.", "bbox": {"l": 317.95502, "t": 119.74993999999992, "r": 341.37524, "b": 128.22321, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 4: Performance of a Mask R-CNN R50 network with document-wise and page-wise split for different label sets. Naive page-wise split will result in GLYPH<tildelow> 10% point improvement."}, {"label": "table", "id": 0, "page_no": 6, "cluster": {"id": 0, "label": "table", "bbox": {"l": 352.97747802734375, "t": 150.791259765625, "r": 522.9158935546875, "b": 306.2658386230469, "coord_origin": "TOPLEFT"}, "confidence": 0.9879696369171143, "cells": [{"id": 115, "text": "Class-count", "bbox": {"l": 358.63901, "t": 153.10051999999996, "r": 401.73154, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "11", "bbox": {"l": 440.22501, "t": 153.10051999999996, "r": 448.56375, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "5", "bbox": {"l": 494.38, "t": 153.10051999999996, "r": 498.54938, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "Split", "bbox": {"l": 358.63901, "t": 164.05951000000005, "r": 375.27167, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "Doc", "bbox": {"l": 423.341, "t": 164.05951000000005, "r": 438.0459, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "Page", "bbox": {"l": 448.00757, "t": 164.05951000000005, "r": 465.4472, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "Doc", "bbox": {"l": 475.41101, "t": 164.05951000000005, "r": 490.11591, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Page", "bbox": {"l": 500.07757999999995, "t": 164.05951000000005, "r": 517.51721, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "Caption", "bbox": {"l": 358.63901, "t": 175.41656, "r": 387.82465, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "68", "bbox": {"l": 426.52399, "t": 175.41656, "r": 434.86273, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "83", "bbox": {"l": 452.56240999999994, "t": 175.41656, "r": 460.90115000000003, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "Footnote", "bbox": {"l": 358.63901, "t": 186.37554999999998, "r": 391.14221, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "71", "bbox": {"l": 426.52399, "t": 186.37554999999998, "r": 434.86273, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "84", "bbox": {"l": 452.56240999999994, "t": 186.37554999999998, "r": 460.90115000000003, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "Formula", "bbox": {"l": 358.63901, "t": 197.33452999999997, "r": 389.15167, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "60", "bbox": {"l": 426.52399, "t": 197.33452999999997, "r": 434.86273, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "66", "bbox": {"l": 452.56240999999994, "t": 197.33452999999997, "r": 460.90115000000003, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "List-item", "bbox": {"l": 358.63901, "t": 208.29351999999994, "r": 391.5188, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "81", "bbox": {"l": 426.52399, "t": 208.29351999999994, "r": 434.86273, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "88", "bbox": {"l": 452.56240999999994, "t": 208.29351999999994, "r": 460.90115000000003, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "82", "bbox": {"l": 478.59399, "t": 208.29351999999994, "r": 486.93274, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "88", "bbox": {"l": 504.6324200000001, "t": 208.29351999999994, "r": 512.97119, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "Page-footer", "bbox": {"l": 358.63901, "t": 219.25256000000002, "r": 401.16666, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "62", "bbox": {"l": 426.52399, "t": 219.25256000000002, "r": 434.86273, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "89", "bbox": {"l": 452.56240999999994, "t": 219.25256000000002, "r": 460.90115000000003, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "Page-header", "bbox": {"l": 358.63901, "t": 230.21155, "r": 403.91931, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "72", "bbox": {"l": 426.52399, "t": 230.21155, "r": 434.86273, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "90", "bbox": {"l": 452.56240999999994, "t": 230.21155, "r": 460.90115000000003, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "Picture", "bbox": {"l": 358.63901, "t": 241.16956000000005, "r": 384.62366, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "72", "bbox": {"l": 426.52399, "t": 241.16956000000005, "r": 434.86273, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "82", "bbox": {"l": 452.56240999999994, "t": 241.16956000000005, "r": 460.90115000000003, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "72", "bbox": {"l": 478.59399, "t": 241.16956000000005, "r": 486.93274, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "82", "bbox": {"l": 504.6324200000001, "t": 241.16956000000005, "r": 512.97119, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "Section-header", "bbox": {"l": 358.63901, "t": 252.12854000000004, "r": 413.37891, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "68", "bbox": {"l": 426.52399, "t": 252.12854000000004, "r": 434.86273, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "83", "bbox": {"l": 452.56240999999994, "t": 252.12854000000004, "r": 460.90115000000003, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "69", "bbox": {"l": 478.59399, "t": 252.12854000000004, "r": 486.93274, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "83", "bbox": {"l": 504.6324200000001, "t": 252.12854000000004, "r": 512.97119, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "Table", "bbox": {"l": 358.63901, "t": 263.08752000000004, "r": 378.44577, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "82", "bbox": {"l": 426.52399, "t": 263.08752000000004, "r": 434.86273, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "89", "bbox": {"l": 452.56240999999994, "t": 263.08752000000004, "r": 460.90115000000003, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "82", "bbox": {"l": 478.59399, "t": 263.08752000000004, "r": 486.93274, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "90", "bbox": {"l": 504.6324200000001, "t": 263.08752000000004, "r": 512.97119, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "Text", "bbox": {"l": 358.63901, "t": 274.04657, "r": 374.59921, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "85", "bbox": {"l": 426.52399, "t": 274.04657, "r": 434.86273, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "91", "bbox": {"l": 452.56240999999994, "t": 274.04657, "r": 460.90115000000003, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "84", "bbox": {"l": 478.59399, "t": 274.04657, "r": 486.93274, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "90", "bbox": {"l": 504.6324200000001, "t": 274.04657, "r": 512.97119, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "Title", "bbox": {"l": 358.63901, "t": 285.00552, "r": 375.63034, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "77", "bbox": {"l": 426.52399, "t": 285.00552, "r": 434.86273, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "81", "bbox": {"l": 452.56240999999994, "t": 285.00552, "r": 460.90115000000003, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "All", "bbox": {"l": 358.63901, "t": 296.36255, "r": 369.60492, "b": 304.73718, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "72", "bbox": {"l": 426.52399, "t": 296.36255, "r": 434.86273, "b": 304.73718, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "84", "bbox": {"l": 452.56240999999994, "t": 296.36255, "r": 460.90115000000003, "b": 304.73718, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "78", "bbox": {"l": 478.59399, "t": 296.36255, "r": 486.93274, "b": 304.73718, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "87", "bbox": {"l": 504.6324200000001, "t": 296.36255, "r": 512.97119, "b": 304.73718, "coord_origin": "TOPLEFT"}}], "children": [{"id": 80, "label": "text", "bbox": {"l": 358.63901, "t": 153.10051999999996, "r": 401.73154, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 115, "text": "Class-count", "bbox": {"l": 358.63901, "t": 153.10051999999996, "r": 401.73154, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 440.22501, "t": 153.10051999999996, "r": 448.56375, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 116, "text": "11", "bbox": {"l": 440.22501, "t": 153.10051999999996, "r": 448.56375, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 494.38, "t": 153.10051999999996, "r": 498.54938, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 117, "text": "5", "bbox": {"l": 494.38, "t": 153.10051999999996, "r": 498.54938, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 358.63901, "t": 164.05951000000005, "r": 375.27167, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 118, "text": "Split", "bbox": {"l": 358.63901, "t": 164.05951000000005, "r": 375.27167, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 423.341, "t": 164.05951000000005, "r": 438.0459, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 119, "text": "Doc", "bbox": {"l": 423.341, "t": 164.05951000000005, "r": 438.0459, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 448.00757, "t": 164.05951000000005, "r": 465.4472, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 120, "text": "Page", "bbox": {"l": 448.00757, "t": 164.05951000000005, "r": 465.4472, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 475.41101, "t": 164.05951000000005, "r": 490.11591, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 121, "text": "Doc", "bbox": {"l": 475.41101, "t": 164.05951000000005, "r": 490.11591, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 500.07757999999995, "t": 164.05951000000005, "r": 517.51721, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 122, "text": "Page", "bbox": {"l": 500.07757999999995, "t": 164.05951000000005, "r": 517.51721, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 358.63901, "t": 175.41656, "r": 387.82465, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 123, "text": "Caption", "bbox": {"l": 358.63901, "t": 175.41656, "r": 387.82465, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 426.52399, "t": 175.41656, "r": 434.86273, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 124, "text": "68", "bbox": {"l": 426.52399, "t": 175.41656, "r": 434.86273, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 452.56240999999994, "t": 175.41656, "r": 460.90115000000003, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 125, "text": "83", "bbox": {"l": 452.56240999999994, "t": 175.41656, "r": 460.90115000000003, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 358.63901, "t": 186.37554999999998, "r": 391.14221, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 126, "text": "Footnote", "bbox": {"l": 358.63901, "t": 186.37554999999998, "r": 391.14221, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 426.52399, "t": 186.37554999999998, "r": 434.86273, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 127, "text": "71", "bbox": {"l": 426.52399, "t": 186.37554999999998, "r": 434.86273, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 452.56240999999994, "t": 186.37554999999998, "r": 460.90115000000003, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 128, "text": "84", "bbox": {"l": 452.56240999999994, "t": 186.37554999999998, "r": 460.90115000000003, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 358.63901, "t": 197.33452999999997, "r": 389.15167, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 129, "text": "Formula", "bbox": {"l": 358.63901, "t": 197.33452999999997, "r": 389.15167, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 426.52399, "t": 197.33452999999997, "r": 434.86273, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 130, "text": "60", "bbox": {"l": 426.52399, "t": 197.33452999999997, "r": 434.86273, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 452.56240999999994, "t": 197.33452999999997, "r": 460.90115000000003, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 131, "text": "66", "bbox": {"l": 452.56240999999994, "t": 197.33452999999997, "r": 460.90115000000003, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 358.63901, "t": 208.29351999999994, "r": 391.5188, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 132, "text": "List-item", "bbox": {"l": 358.63901, "t": 208.29351999999994, "r": 391.5188, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 426.52399, "t": 208.29351999999994, "r": 434.86273, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 133, "text": "81", "bbox": {"l": 426.52399, "t": 208.29351999999994, "r": 434.86273, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 452.56240999999994, "t": 208.29351999999994, "r": 460.90115000000003, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 134, "text": "88", "bbox": {"l": 452.56240999999994, "t": 208.29351999999994, "r": 460.90115000000003, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 478.59399, "t": 208.29351999999994, "r": 486.93274, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 135, "text": "82", "bbox": {"l": 478.59399, "t": 208.29351999999994, "r": 486.93274, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 504.6324200000001, "t": 208.29351999999994, "r": 512.97119, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 136, "text": "88", "bbox": {"l": 504.6324200000001, "t": 208.29351999999994, "r": 512.97119, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 358.63901, "t": 219.25256000000002, "r": 401.16666, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 137, "text": "Page-footer", "bbox": {"l": 358.63901, "t": 219.25256000000002, "r": 401.16666, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 426.52399, "t": 219.25256000000002, "r": 434.86273, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 138, "text": "62", "bbox": {"l": 426.52399, "t": 219.25256000000002, "r": 434.86273, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 452.56240999999994, "t": 219.25256000000002, "r": 460.90115000000003, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 139, "text": "89", "bbox": {"l": 452.56240999999994, "t": 219.25256000000002, "r": 460.90115000000003, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 358.63901, "t": 230.21155, "r": 403.91931, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 140, "text": "Page-header", "bbox": {"l": 358.63901, "t": 230.21155, "r": 403.91931, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 426.52399, "t": 230.21155, "r": 434.86273, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 141, "text": "72", "bbox": {"l": 426.52399, "t": 230.21155, "r": 434.86273, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 452.56240999999994, "t": 230.21155, "r": 460.90115000000003, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 142, "text": "90", "bbox": {"l": 452.56240999999994, "t": 230.21155, "r": 460.90115000000003, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 358.63901, "t": 241.16956000000005, "r": 384.62366, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 143, "text": "Picture", "bbox": {"l": 358.63901, "t": 241.16956000000005, "r": 384.62366, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 426.52399, "t": 241.16956000000005, "r": 434.86273, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 144, "text": "72", "bbox": {"l": 426.52399, "t": 241.16956000000005, "r": 434.86273, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 452.56240999999994, "t": 241.16956000000005, "r": 460.90115000000003, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 145, "text": "82", "bbox": {"l": 452.56240999999994, "t": 241.16956000000005, "r": 460.90115000000003, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 478.59399, "t": 241.16956000000005, "r": 486.93274, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 146, "text": "72", "bbox": {"l": 478.59399, "t": 241.16956000000005, "r": 486.93274, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 504.6324200000001, "t": 241.16956000000005, "r": 512.97119, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 147, "text": "82", "bbox": {"l": 504.6324200000001, "t": 241.16956000000005, "r": 512.97119, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 358.63901, "t": 252.12854000000004, "r": 413.37891, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 148, "text": "Section-header", "bbox": {"l": 358.63901, "t": 252.12854000000004, "r": 413.37891, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 114, "label": "text", "bbox": {"l": 426.52399, "t": 252.12854000000004, "r": 434.86273, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 149, "text": "68", "bbox": {"l": 426.52399, "t": 252.12854000000004, "r": 434.86273, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 115, "label": "text", "bbox": {"l": 452.56240999999994, "t": 252.12854000000004, "r": 460.90115000000003, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 150, "text": "83", "bbox": {"l": 452.56240999999994, "t": 252.12854000000004, "r": 460.90115000000003, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 116, "label": "text", "bbox": {"l": 478.59399, "t": 252.12854000000004, "r": 486.93274, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 151, "text": "69", "bbox": {"l": 478.59399, "t": 252.12854000000004, "r": 486.93274, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 117, "label": "text", "bbox": {"l": 504.6324200000001, "t": 252.12854000000004, "r": 512.97119, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 152, "text": "83", "bbox": {"l": 504.6324200000001, "t": 252.12854000000004, "r": 512.97119, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 118, "label": "text", "bbox": {"l": 358.63901, "t": 263.08752000000004, "r": 378.44577, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 153, "text": "Table", "bbox": {"l": 358.63901, "t": 263.08752000000004, "r": 378.44577, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 119, "label": "text", "bbox": {"l": 426.52399, "t": 263.08752000000004, "r": 434.86273, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 154, "text": "82", "bbox": {"l": 426.52399, "t": 263.08752000000004, "r": 434.86273, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 120, "label": "text", "bbox": {"l": 452.56240999999994, "t": 263.08752000000004, "r": 460.90115000000003, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 155, "text": "89", "bbox": {"l": 452.56240999999994, "t": 263.08752000000004, "r": 460.90115000000003, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 121, "label": "text", "bbox": {"l": 478.59399, "t": 263.08752000000004, "r": 486.93274, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 156, "text": "82", "bbox": {"l": 478.59399, "t": 263.08752000000004, "r": 486.93274, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 122, "label": "text", "bbox": {"l": 504.6324200000001, "t": 263.08752000000004, "r": 512.97119, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 157, "text": "90", "bbox": {"l": 504.6324200000001, "t": 263.08752000000004, "r": 512.97119, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 123, "label": "text", "bbox": {"l": 358.63901, "t": 274.04657, "r": 374.59921, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 158, "text": "Text", "bbox": {"l": 358.63901, "t": 274.04657, "r": 374.59921, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 124, "label": "text", "bbox": {"l": 426.52399, "t": 274.04657, "r": 434.86273, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 159, "text": "85", "bbox": {"l": 426.52399, "t": 274.04657, "r": 434.86273, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 125, "label": "text", "bbox": {"l": 452.56240999999994, "t": 274.04657, "r": 460.90115000000003, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 160, "text": "91", "bbox": {"l": 452.56240999999994, "t": 274.04657, "r": 460.90115000000003, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 126, "label": "text", "bbox": {"l": 478.59399, "t": 274.04657, "r": 486.93274, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 161, "text": "84", "bbox": {"l": 478.59399, "t": 274.04657, "r": 486.93274, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 127, "label": "text", "bbox": {"l": 504.6324200000001, "t": 274.04657, "r": 512.97119, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 162, "text": "90", "bbox": {"l": 504.6324200000001, "t": 274.04657, "r": 512.97119, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 128, "label": "text", "bbox": {"l": 358.63901, "t": 285.00552, "r": 375.63034, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 163, "text": "Title", "bbox": {"l": 358.63901, "t": 285.00552, "r": 375.63034, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 129, "label": "text", "bbox": {"l": 426.52399, "t": 285.00552, "r": 434.86273, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 164, "text": "77", "bbox": {"l": 426.52399, "t": 285.00552, "r": 434.86273, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 130, "label": "text", "bbox": {"l": 452.56240999999994, "t": 285.00552, "r": 460.90115000000003, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 165, "text": "81", "bbox": {"l": 452.56240999999994, "t": 285.00552, "r": 460.90115000000003, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 131, "label": "text", "bbox": {"l": 358.63901, "t": 296.36255, "r": 369.60492, "b": 304.73718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 166, "text": "All", "bbox": {"l": 358.63901, "t": 296.36255, "r": 369.60492, "b": 304.73718, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 132, "label": "text", "bbox": {"l": 426.52399, "t": 296.36255, "r": 434.86273, "b": 304.73718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 167, "text": "72", "bbox": {"l": 426.52399, "t": 296.36255, "r": 434.86273, "b": 304.73718, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 133, "label": "text", "bbox": {"l": 452.56240999999994, "t": 296.36255, "r": 460.90115000000003, "b": 304.73718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 168, "text": "84", "bbox": {"l": 452.56240999999994, "t": 296.36255, "r": 460.90115000000003, "b": 304.73718, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 134, "label": "text", "bbox": {"l": 478.59399, "t": 296.36255, "r": 486.93274, "b": 304.73718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 169, "text": "78", "bbox": {"l": 478.59399, "t": 296.36255, "r": 486.93274, "b": 304.73718, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 135, "label": "text", "bbox": {"l": 504.6324200000001, "t": 296.36255, "r": 512.97119, "b": 304.73718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 170, "text": "87", "bbox": {"l": 504.6324200000001, "t": 296.36255, "r": 512.97119, "b": 304.73718, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["fcel", "ched", "lcel", "ched", "lcel", "nl", "fcel", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 14, "num_cols": 5, "table_cells": [{"bbox": {"l": 358.63901, "t": 153.10051999999996, "r": 401.73154, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Class-count", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.22501, "t": 153.10051999999996, "r": 448.56375, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 3, "text": "11", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 494.38, "t": 153.10051999999996, "r": 498.54938, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 5, "text": "5", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 164.05951000000005, "r": 375.27167, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Split", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 423.341, "t": 164.05951000000005, "r": 438.0459, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Doc", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 448.00757, "t": 164.05951000000005, "r": 465.4472, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Page", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 475.41101, "t": 164.05951000000005, "r": 490.11591, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Doc", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 500.07757999999995, "t": 164.05951000000005, "r": 517.51721, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Page", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 175.41656, "r": 387.82465, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Caption", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 175.41656, "r": 434.86273, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 175.41656, "r": 460.90115000000003, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 186.37554999999998, "r": 391.14221, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Footnote", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 186.37554999999998, "r": 434.86273, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "71", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 186.37554999999998, "r": 460.90115000000003, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 197.33452999999997, "r": 389.15167, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Formula", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 197.33452999999997, "r": 434.86273, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "60", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 197.33452999999997, "r": 460.90115000000003, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "66", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 208.29351999999994, "r": 391.5188, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "List-item", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 208.29351999999994, "r": 434.86273, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 208.29351999999994, "r": 460.90115000000003, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 478.59399, "t": 208.29351999999994, "r": 486.93274, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 504.6324200000001, "t": 208.29351999999994, "r": 512.97119, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 219.25256000000002, "r": 401.16666, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-footer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 219.25256000000002, "r": 434.86273, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "62", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 219.25256000000002, "r": 460.90115000000003, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "89", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 230.21155, "r": 403.91931, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 230.21155, "r": 434.86273, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 230.21155, "r": 460.90115000000003, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "90", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 241.16956000000005, "r": 384.62366, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Picture", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 241.16956000000005, "r": 434.86273, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 241.16956000000005, "r": 460.90115000000003, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 478.59399, "t": 241.16956000000005, "r": 486.93274, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 504.6324200000001, "t": 241.16956000000005, "r": 512.97119, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 252.12854000000004, "r": 413.37891, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Section-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 252.12854000000004, "r": 434.86273, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 252.12854000000004, "r": 460.90115000000003, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 478.59399, "t": 252.12854000000004, "r": 486.93274, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "69", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 504.6324200000001, "t": 252.12854000000004, "r": 512.97119, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 263.08752000000004, "r": 378.44577, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 263.08752000000004, "r": 434.86273, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 263.08752000000004, "r": 460.90115000000003, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "89", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 478.59399, "t": 263.08752000000004, "r": 486.93274, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 504.6324200000001, "t": 263.08752000000004, "r": 512.97119, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "90", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 274.04657, "r": 374.59921, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Text", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 274.04657, "r": 434.86273, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 274.04657, "r": 460.90115000000003, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "91", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 478.59399, "t": 274.04657, "r": 486.93274, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 504.6324200000001, "t": 274.04657, "r": 512.97119, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "90", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 285.00552, "r": 375.63034, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Title", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 285.00552, "r": 434.86273, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 285.00552, "r": 460.90115000000003, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 296.36255, "r": 369.60492, "b": 304.73718, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "All", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 296.36255, "r": 434.86273, "b": 304.73718, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 296.36255, "r": 460.90115000000003, "b": 304.73718, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 478.59399, "t": 296.36255, "r": 486.93274, "b": 304.73718, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "78", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 504.6324200000001, "t": 296.36255, "r": 512.97119, "b": 304.73718, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "87", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "text", "id": 6, "page_no": 6, "cluster": {"id": 6, "label": "text", "bbox": {"l": 317.686, "t": 331.40353, "r": 559.58496, "b": 416.49017, "coord_origin": "TOPLEFT"}, "confidence": 0.9740146994590759, "cells": [{"id": 171, "text": "lists in PubLayNet (grouped list-items) versus DocLayNet (separate", "bbox": {"l": 317.95499, "t": 331.40353, "r": 558.20233, "b": 339.77817, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "list-items), the label set of size 4 is the closest to PubLayNet, in the", "bbox": {"l": 317.95499, "t": 342.36255, "r": 558.2005, "b": 350.73718, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "assumption that the", "bbox": {"l": 317.95499, "t": 353.32153, "r": 393.16028, "b": 361.69617000000005, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "List", "bbox": {"l": 395.84201, "t": 353.36639, "r": 409.14905, "b": 361.70514, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "is down-mapped to", "bbox": {"l": 412.33301, "t": 353.32153, "r": 485.02324999999996, "b": 361.69617000000005, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "Text", "bbox": {"l": 487.70401, "t": 353.36639, "r": 502.86761, "b": 361.70514, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "in PubLayNet.", "bbox": {"l": 506.05499, "t": 353.32153, "r": 559.58496, "b": 361.69617000000005, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "The results in Table 3 show that the prediction accuracy on the", "bbox": {"l": 317.686, "t": 364.28054999999995, "r": 558.2002, "b": 372.65518, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "remaining class labels does not change significantly when other", "bbox": {"l": 317.95499, "t": 375.23853, "r": 558.36877, "b": 383.61316, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "classes are merged into them. The overall macro-average improves", "bbox": {"l": 317.95499, "t": 386.19754, "r": 558.19958, "b": 394.57217, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "by around 5%, in particular when", "bbox": {"l": 317.95499, "t": 397.15652, "r": 439.49454, "b": 405.53116000000006, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "Page-footer", "bbox": {"l": 441.728, "t": 397.20139, "r": 481.8616, "b": 405.54013, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "and", "bbox": {"l": 484.74298, "t": 397.15652, "r": 498.23743, "b": 405.53116000000006, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "Page-header", "bbox": {"l": 500.47299, "t": 397.20139, "r": 543.95105, "b": 405.54013, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": "are", "bbox": {"l": 546.83197, "t": 397.15652, "r": 558.20142, "b": 405.53116000000006, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "excluded.", "bbox": {"l": 317.95496, "t": 408.11553999999995, "r": 352.37698, "b": 416.49017, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "lists in PubLayNet (grouped list-items) versus DocLayNet (separate list-items), the label set of size 4 is the closest to PubLayNet, in the assumption that the List is down-mapped to Text in PubLayNet. The results in Table 3 show that the prediction accuracy on the remaining class labels does not change significantly when other classes are merged into them. The overall macro-average improves by around 5%, in particular when Page-footer and Page-header are excluded."}, {"label": "section_header", "id": 9, "page_no": 6, "cluster": {"id": 9, "label": "section_header", "bbox": {"l": 317.95496, "t": 429.3949, "r": 549.8606, "b": 439.70398, "coord_origin": "TOPLEFT"}, "confidence": 0.9562516808509827, "cells": [{"id": 187, "text": "Impact of Document Split in Train and Test Set", "bbox": {"l": 317.95496, "t": 429.3949, "r": 549.8606, "b": 439.70398, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Impact of Document Split in Train and Test Set"}, {"label": "text", "id": 3, "page_no": 6, "cluster": {"id": 3, "label": "text", "bbox": {"l": 317.62299, "t": 444.59653, "r": 559.71381, "b": 595.43718, "coord_origin": "TOPLEFT"}, "confidence": 0.9869834184646606, "cells": [{"id": 188, "text": "Many documents in DocLayNet have a unique styling. In order", "bbox": {"l": 317.95499, "t": 444.59653, "r": 558.36884, "b": 452.97116, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "to avoid overfitting on a particular style, we have split the train-,", "bbox": {"l": 317.95499, "t": 455.55554, "r": 559.19189, "b": 463.93018, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "test- and validation-sets of DocLayNet on document boundaries, i.e.", "bbox": {"l": 317.95499, "t": 466.51453, "r": 559.58185, "b": 474.88916, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "every document contributes pages to only one set. To the best of", "bbox": {"l": 317.95499, "t": 477.47354, "r": 558.20605, "b": 485.84818, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": "our knowledge, this was not considered in PubLayNet or DocBank.", "bbox": {"l": 317.95499, "t": 488.43253, "r": 559.58203, "b": 496.80716, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "To quantify how this affects model performance, we trained and", "bbox": {"l": 317.686, "t": 499.39154, "r": 558.20032, "b": 507.76617, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "evaluated a Mask R-CNN R50 model on a modified dataset version.", "bbox": {"l": 317.95499, "t": 510.35052, "r": 559.5849, "b": 518.72516, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "Here, the train-, test- and validation-sets were obtained by a ran-", "bbox": {"l": 317.95499, "t": 521.30954, "r": 559.71381, "b": 529.68417, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "domised draw over the individual pages. As can be seen in Table 4,", "bbox": {"l": 317.95499, "t": 532.26855, "r": 559.18707, "b": 540.64317, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "the difference in model performance is surprisingly large: page-", "bbox": {"l": 317.95499, "t": 543.22655, "r": 559.71313, "b": 551.60117, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "wise splitting gains", "bbox": {"l": 317.62299, "t": 554.18555, "r": 388.35168, "b": 562.56017, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "\u02dc", "bbox": {"l": 391.36499, "t": 552.50055, "r": 393.98318, "b": 560.87517, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "10% in mAP over the document-wise splitting.", "bbox": {"l": 390.59, "t": 554.18555, "r": 559.58191, "b": 562.56017, "coord_origin": "TOPLEFT"}}, {"id": 201, "text": "Thus, random page-wise splitting of DocLayNet can easily lead", "bbox": {"l": 317.686, "t": 565.14455, "r": 558.20032, "b": 573.51917, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": "to accidental overestimation of model performance and should be", "bbox": {"l": 317.95499, "t": 576.10356, "r": 558.20508, "b": 584.4781800000001, "coord_origin": "TOPLEFT"}}, {"id": 203, "text": "avoided.", "bbox": {"l": 317.95499, "t": 587.06256, "r": 348.50354, "b": 595.43718, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Many documents in DocLayNet have a unique styling. In order to avoid overfitting on a particular style, we have split the train-, test- and validation-sets of DocLayNet on document boundaries, i.e. every document contributes pages to only one set. To the best of our knowledge, this was not considered in PubLayNet or DocBank. To quantify how this affects model performance, we trained and evaluated a Mask R-CNN R50 model on a modified dataset version. Here, the train-, test- and validation-sets were obtained by a randomised draw over the individual pages. As can be seen in Table 4, the difference in model performance is surprisingly large: pagewise splitting gains \u02dc 10% in mAP over the document-wise splitting. Thus, random page-wise splitting of DocLayNet can easily lead to accidental overestimation of model performance and should be avoided."}, {"label": "section_header", "id": 7, "page_no": 6, "cluster": {"id": 7, "label": "section_header", "bbox": {"l": 317.95499, "t": 608.34192, "r": 418.54776, "b": 618.65102, "coord_origin": "TOPLEFT"}, "confidence": 0.9589217305183411, "cells": [{"id": 204, "text": "Dataset Comparison", "bbox": {"l": 317.95499, "t": 608.34192, "r": 418.54776, "b": 618.65102, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Dataset Comparison"}, {"label": "text", "id": 2, "page_no": 6, "cluster": {"id": 2, "label": "text", "bbox": {"l": 317.686, "t": 623.54355, "r": 559.18817, "b": 708.640137, "coord_origin": "TOPLEFT"}, "confidence": 0.9872549772262573, "cells": [{"id": 205, "text": "Throughout this paper, we claim that DocLayNet\u2019s wider variety of", "bbox": {"l": 317.686, "t": 623.54355, "r": 558.20575, "b": 631.91817, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": "document layouts leads to more robust layout detection models. In", "bbox": {"l": 317.95499, "t": 634.50255, "r": 558.20624, "b": 642.87717, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": "Table 5, we provide evidence for that. We trained models on each", "bbox": {"l": 317.686, "t": 645.46155, "r": 558.20319, "b": 653.83617, "coord_origin": "TOPLEFT"}}, {"id": 208, "text": "of the available datasets (PubLayNet, DocBank and DocLayNet)", "bbox": {"l": 317.95499, "t": 656.42055, "r": 558.74377, "b": 664.79517, "coord_origin": "TOPLEFT"}}, {"id": 209, "text": "and evaluated them on the test sets of the other datasets. Due to", "bbox": {"l": 317.95499, "t": 667.37955, "r": 558.20398, "b": 675.7541699999999, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": "the different label sets and annotation styles, a direct comparison", "bbox": {"l": 317.95499, "t": 678.3385499999999, "r": 558.20062, "b": 686.71317, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "is not possible. Hence, we focussed on the common labels among", "bbox": {"l": 317.95499, "t": 689.29755, "r": 558.20343, "b": 697.672173, "coord_origin": "TOPLEFT"}}, {"id": 212, "text": "the datasets. Between PubLayNet and DocLayNet, these are", "bbox": {"l": 317.95499, "t": 700.256554, "r": 531.07666, "b": 708.631172, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "Picture", "bbox": {"l": 533.16199, "t": 700.301384, "r": 557.2561, "b": 708.640137, "coord_origin": "TOPLEFT"}}, {"id": 214, "text": ",", "bbox": {"l": 557.255, "t": 700.256554, "r": 559.18817, "b": 708.631172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Throughout this paper, we claim that DocLayNet's wider variety of document layouts leads to more robust layout detection models. In Table 5, we provide evidence for that. We trained models on each of the available datasets (PubLayNet, DocBank and DocLayNet) and evaluated them on the test sets of the other datasets. Due to the different label sets and annotation styles, a direct comparison is not possible. Hence, we focussed on the common labels among the datasets. Between PubLayNet and DocLayNet, these are Picture ,"}], "headers": [{"label": "page_header", "id": 12, "page_no": 6, "cluster": {"id": 12, "label": "page_header", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.9316118955612183, "cells": [{"id": 0, "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis"}, {"label": "page_header", "id": 11, "page_no": 6, "cluster": {"id": 11, "label": "page_header", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.9318180084228516, "cells": [{"id": 1, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA"}]}}, {"page_no": 7, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 246.24382, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar", "bbox": {"l": 253.13897999999998, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Table 5: Prediction Performance (mAP@0.5-0.95) of a Mask", "bbox": {"l": 53.501999, "t": 86.87292000000002, "r": 294.32153, "b": 95.34618999999998, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "R-CNN R50 network across the PubLayNet, DocBank & Do-", "bbox": {"l": 53.79800000000001, "t": 97.83191, "r": 295.64868, "b": 106.30517999999995, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "cLayNet data-sets. By evaluating on common label classes of", "bbox": {"l": 53.79800000000001, "t": 108.79088999999999, "r": 294.0437, "b": 117.26415999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "each dataset, we observe that the DocLayNet-trained model", "bbox": {"l": 53.79800000000001, "t": 119.74987999999996, "r": 294.04373, "b": 128.22313999999994, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "has much less pronounced variations in performance across", "bbox": {"l": 53.79800000000001, "t": 130.70885999999996, "r": 294.0437, "b": 139.18213000000003, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "all datasets.", "bbox": {"l": 53.79800000000001, "t": 141.66785000000004, "r": 101.15852, "b": 150.14111000000003, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Testing on", "bbox": {"l": 217.74099999999999, "t": 175.01855, "r": 256.26065, "b": 183.39319, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Training on", "bbox": {"l": 89.954002, "t": 185.97655999999995, "r": 133.24379, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "labels", "bbox": {"l": 154.629, "t": 185.97655999999995, "r": 175.47588, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "PLN", "bbox": {"l": 204.69, "t": 185.97655999999995, "r": 220.54260000000002, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "DB", "bbox": {"l": 230.50427000000002, "t": 185.97655999999995, "r": 242.06197, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "DLN", "bbox": {"l": 252.02364, "t": 185.97655999999995, "r": 269.31085, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "PubLayNet (PLN)", "bbox": {"l": 78.530998, "t": 219.25256000000002, "r": 142.56006, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Figure", "bbox": {"l": 154.629, "t": 197.33452999999997, "r": 177.92371, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "96", "bbox": {"l": 208.44701, "t": 197.33452999999997, "r": 216.78575000000004, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "43", "bbox": {"l": 232.1183, "t": 197.33452999999997, "r": 240.45705, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "23", "bbox": {"l": 256.49792, "t": 197.33452999999997, "r": 264.83667, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Sec-header", "bbox": {"l": 154.629, "t": 208.29351999999994, "r": 194.72675, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "87", "bbox": {"l": 208.44701, "t": 208.29351999999994, "r": 216.78575000000004, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "-", "bbox": {"l": 234.77235, "t": 208.29351999999994, "r": 237.80299000000002, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "32", "bbox": {"l": 256.49792, "t": 208.29351999999994, "r": 264.83667, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Table", "bbox": {"l": 154.629, "t": 219.25256000000002, "r": 174.43578, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "95", "bbox": {"l": 208.44701, "t": 219.25256000000002, "r": 216.78575000000004, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "24", "bbox": {"l": 232.1183, "t": 219.25256000000002, "r": 240.45705, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "49", "bbox": {"l": 256.49792, "t": 219.25256000000002, "r": 264.83667, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Text", "bbox": {"l": 154.629, "t": 230.21155, "r": 170.58919, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "96", "bbox": {"l": 208.44701, "t": 230.21155, "r": 216.78575000000004, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "-", "bbox": {"l": 234.77235, "t": 230.21155, "r": 237.80299000000002, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "42", "bbox": {"l": 256.49792, "t": 230.21155, "r": 264.83667, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "total", "bbox": {"l": 154.629, "t": 241.16956000000005, "r": 171.2796, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "93", "bbox": {"l": 208.44701, "t": 241.16956000000005, "r": 216.78575000000004, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "34", "bbox": {"l": 232.1183, "t": 241.16956000000005, "r": 240.45705, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "30", "bbox": {"l": 256.49792, "t": 241.16956000000005, "r": 264.83667, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "DocBank (DB)", "bbox": {"l": 78.530998, "t": 263.48650999999995, "r": 131.19963, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Figure", "bbox": {"l": 154.629, "t": 252.52752999999996, "r": 177.92371, "b": 260.90216, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "77", "bbox": {"l": 208.44701, "t": 252.52752999999996, "r": 216.78575000000004, "b": 260.90216, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "71", "bbox": {"l": 232.1183, "t": 252.52752999999996, "r": 240.45705, "b": 260.90216, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "31", "bbox": {"l": 256.49792, "t": 252.52752999999996, "r": 264.83667, "b": 260.90216, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "Table", "bbox": {"l": 154.629, "t": 263.48650999999995, "r": 174.43578, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "19", "bbox": {"l": 208.44701, "t": 263.48650999999995, "r": 216.78575000000004, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "65", "bbox": {"l": 232.1183, "t": 263.48650999999995, "r": 240.45705, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "22", "bbox": {"l": 256.49792, "t": 263.48650999999995, "r": 264.83667, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "total", "bbox": {"l": 154.629, "t": 274.44556, "r": 171.2796, "b": 282.82016, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "48", "bbox": {"l": 208.44701, "t": 274.44556, "r": 216.78575000000004, "b": 282.82016, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "68", "bbox": {"l": 232.1183, "t": 274.44556, "r": 240.45705, "b": 282.82016, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "27", "bbox": {"l": 256.49792, "t": 274.44556, "r": 264.83667, "b": 282.82016, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "DocLayNet (DLN)", "bbox": {"l": 78.530998, "t": 307.72055, "r": 144.66716, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "Figure", "bbox": {"l": 154.629, "t": 285.80255, "r": 177.92371, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "67", "bbox": {"l": 208.44701, "t": 285.80255, "r": 216.78575000000004, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "51", "bbox": {"l": 232.1183, "t": 285.80255, "r": 240.45705, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "72", "bbox": {"l": 256.49792, "t": 285.80255, "r": 264.83667, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Sec-header", "bbox": {"l": 154.629, "t": 296.76154, "r": 194.72675, "b": 305.13617, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "53", "bbox": {"l": 208.44701, "t": 296.76154, "r": 216.78575000000004, "b": 305.13617, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "-", "bbox": {"l": 234.77235, "t": 296.76154, "r": 237.80299000000002, "b": 305.13617, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "68", "bbox": {"l": 256.49792, "t": 296.76154, "r": 264.83667, "b": 305.13617, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Table", "bbox": {"l": 154.629, "t": 307.72055, "r": 174.43578, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "87", "bbox": {"l": 208.44701, "t": 307.72055, "r": 216.78575000000004, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "43", "bbox": {"l": 232.1183, "t": 307.72055, "r": 240.45705, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "82", "bbox": {"l": 256.49792, "t": 307.72055, "r": 264.83667, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "Text", "bbox": {"l": 154.629, "t": 318.67953, "r": 170.58919, "b": 327.05417, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "77", "bbox": {"l": 208.44701, "t": 318.67953, "r": 216.78575000000004, "b": 327.05417, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "-", "bbox": {"l": 234.77235, "t": 318.67953, "r": 237.80299000000002, "b": 327.05417, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "84", "bbox": {"l": 256.49792, "t": 318.67953, "r": 264.83667, "b": 327.05417, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "total", "bbox": {"l": 154.629, "t": 329.63855, "r": 171.2796, "b": 338.01318, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "59", "bbox": {"l": 208.44701, "t": 329.63855, "r": 216.78575000000004, "b": 338.01318, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "47", "bbox": {"l": 232.1183, "t": 329.63855, "r": 240.45705, "b": 338.01318, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "78", "bbox": {"l": 256.49792, "t": 329.63855, "r": 264.83667, "b": 338.01318, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "Section-header", "bbox": {"l": 53.79800000000001, "t": 390.96539, "r": 106.2392, "b": 399.30414, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": ",", "bbox": {"l": 106.239, "t": 390.92053, "r": 108.23331, "b": 399.2951699999999, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Table", "bbox": {"l": 110.482, "t": 390.96539, "r": 129.76332, "b": 399.30414, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "and", "bbox": {"l": 132.21899, "t": 390.92053, "r": 145.86186, "b": 399.2951699999999, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "Text", "bbox": {"l": 148.112, "t": 390.96539, "r": 163.14182, "b": 399.30414, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": ". Before training, we either mapped", "bbox": {"l": 163.13901, "t": 390.92053, "r": 294.04709, "b": 399.2951699999999, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "or excluded DocLayNet\u2019s other labels as specified in table 3, and", "bbox": {"l": 53.79800000000001, "t": 401.87954999999994, "r": 294.04712, "b": 410.25418, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "also PubLayNet\u2019s", "bbox": {"l": 53.79800000000001, "t": 412.83853, "r": 117.12856, "b": 421.21317, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "List", "bbox": {"l": 119.362, "t": 412.88339, "r": 132.4342, "b": 421.22214, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "to", "bbox": {"l": 135.177, "t": 412.83853, "r": 142.54416, "b": 421.21317, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "Text", "bbox": {"l": 144.77901, "t": 412.88339, "r": 159.66605, "b": 421.22214, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": ". Note that the different clustering of", "bbox": {"l": 159.66701, "t": 412.83853, "r": 294.04562, "b": 421.21317, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "lists (by list-element vs. whole list objects) naturally decreases the", "bbox": {"l": 53.79800000000001, "t": 423.79755, "r": 294.04614, "b": 432.17217999999997, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "mAP score for", "bbox": {"l": 53.79800000000001, "t": 434.75653, "r": 106.2066, "b": 443.13116, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "Text", "bbox": {"l": 108.448, "t": 434.80139, "r": 123.30533, "b": 443.14014, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": ".", "bbox": {"l": 123.305, "t": 434.75653, "r": 125.27761000000001, "b": 443.13116, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "For comparison of DocBank with DocLayNet, we trained only", "bbox": {"l": 63.76100199999999, "t": 445.71453999999994, "r": 294.27582, "b": 454.08917, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "on", "bbox": {"l": 53.79800000000001, "t": 456.67355, "r": 62.989277, "b": 465.04819, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Picture", "bbox": {"l": 64.852997, "t": 456.71841, "r": 88.947144, "b": 465.05716, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "and", "bbox": {"l": 91.019997, "t": 456.67355, "r": 104.24454, "b": 465.04819, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "Table", "bbox": {"l": 106.108, "t": 456.71841, "r": 124.78053, "b": 465.05716, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "clusters of each dataset. We had to exclude", "bbox": {"l": 126.85500000000002, "t": 456.67355, "r": 277.63235, "b": 465.04819, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "Text", "bbox": {"l": 279.49701, "t": 456.71841, "r": 294.0484, "b": 465.05716, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "because successive paragraphs are often grouped together into a", "bbox": {"l": 53.79800000000001, "t": 467.63254, "r": 294.04709, "b": 476.00717, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "single object in DocBank. This paragraph grouping is incompatible", "bbox": {"l": 53.79800000000001, "t": 478.59155, "r": 294.04532, "b": 486.96619, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "with the individual paragraphs of DocLayNet. As can be seen in", "bbox": {"l": 53.466999, "t": 489.55054, "r": 294.04538, "b": 497.92517, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "Table 5, DocLayNet trained models yield better performance com-", "bbox": {"l": 53.528999, "t": 500.50955, "r": 295.55908, "b": 508.88419, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "pared to the previous datasets. It is noteworthy that the models", "bbox": {"l": 53.79800000000001, "t": 511.46854, "r": 294.04712, "b": 519.84317, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "trained on PubLayNet and DocBank perform very well on their", "bbox": {"l": 53.79800000000001, "t": 522.42755, "r": 294.21179, "b": 530.80219, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "own test set, but have a much lower performance on the foreign", "bbox": {"l": 53.79800000000001, "t": 533.38654, "r": 294.04712, "b": 541.76117, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "datasets. While this also applies to DocLayNet, the difference is", "bbox": {"l": 53.79800000000001, "t": 544.34555, "r": 294.04715, "b": 552.72017, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "far less pronounced. Thus we conclude that DocLayNet trained", "bbox": {"l": 53.79800000000001, "t": 555.3045500000001, "r": 294.04712, "b": 563.67917, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "models are overall more robust and will produce better results for", "bbox": {"l": 53.79800000000001, "t": 566.26256, "r": 294.21411, "b": 574.63718, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "challenging, unseen layouts.", "bbox": {"l": 53.79800000000001, "t": 577.22156, "r": 157.52132, "b": 585.59618, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "Example Predictions", "bbox": {"l": 53.79800000000001, "t": 605.06091, "r": 156.00534, "b": 615.37001, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "To conclude this section, we illustrate the quality of layout predic-", "bbox": {"l": 53.528999, "t": 620.26355, "r": 295.5571, "b": 628.63817, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "tions one can expect from DocLayNet-trained models by providing", "bbox": {"l": 53.79800000000001, "t": 631.22255, "r": 294.04532, "b": 639.59717, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "a selection of examples without any further post-processing ap-", "bbox": {"l": 53.79800000000001, "t": 642.18155, "r": 295.55618, "b": 650.5561700000001, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "plied. Figure 6 shows selected layout predictions on pages from the", "bbox": {"l": 53.79800000000001, "t": 653.14055, "r": 294.04541, "b": 661.51517, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "test-set of DocLayNet. Results look decent in general across docu-", "bbox": {"l": 53.79800000000001, "t": 664.09956, "r": 295.55844, "b": 672.47417, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "ment categories, however one can also observe mistakes such as", "bbox": {"l": 53.79800000000001, "t": 675.05756, "r": 294.04712, "b": 683.43217, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "overlapping clusters of different classes, or entirely missing boxes", "bbox": {"l": 53.79800000000001, "t": 686.01656, "r": 294.04535, "b": 694.391174, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "due to low confidence.", "bbox": {"l": 53.79800000000001, "t": 696.975555, "r": 136.07368, "b": 705.350174, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "6", "bbox": {"l": 317.95502, "t": 85.85986000000003, "r": 323.56229, "b": 96.16900999999996, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "CONCLUSION", "bbox": {"l": 334.47137, "t": 85.85986000000003, "r": 405.72961, "b": 96.16900999999996, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "In this paper, we presented the DocLayNet dataset. It provides the", "bbox": {"l": 317.95499, "t": 101.06151999999997, "r": 558.2038, "b": 109.43615999999997, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "document conversion and layout analysis research community a", "bbox": {"l": 317.95499, "t": 112.02057000000002, "r": 558.2041, "b": 120.39520000000005, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "new and challenging dataset to improve and fine-tune novel ML", "bbox": {"l": 317.95499, "t": 122.97955000000002, "r": 558.43274, "b": 131.35419000000002, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "methods on. In contrast to many other datasets, DocLayNet was", "bbox": {"l": 317.95499, "t": 133.93854, "r": 558.20416, "b": 142.31317, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "created by human annotation in order to obtain reliable layout", "bbox": {"l": 317.95499, "t": 144.89752, "r": 558.20422, "b": 153.27215999999999, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "ground-truth on a wide variety of publication- and typesetting-", "bbox": {"l": 317.95499, "t": 155.85657000000003, "r": 559.71313, "b": 164.23119999999994, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "styles. Including a large proportion of documents outside the scien-", "bbox": {"l": 317.95499, "t": 166.81555000000003, "r": 559.71375, "b": 175.19019000000003, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "tific publishing domain adds significant value in this respect.", "bbox": {"l": 317.95499, "t": 177.77454, "r": 540.04382, "b": 186.14917000000003, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "From the dataset, we have derived on the one hand reference", "bbox": {"l": 327.918, "t": 188.73352, "r": 558.19836, "b": 197.10815000000002, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "metrics for human performance on document-layout annotation", "bbox": {"l": 317.95499, "t": 199.69257000000005, "r": 558.20404, "b": 208.06719999999996, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "(through double and triple annotations) and on the other hand eval-", "bbox": {"l": 317.686, "t": 210.65155000000004, "r": 559.71704, "b": 219.02617999999995, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "uated the baseline performance of commonly used object detection", "bbox": {"l": 317.95499, "t": 221.60956, "r": 558.20245, "b": 229.98419, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "methods. We also illustrated the impact of various dataset-related", "bbox": {"l": 317.95499, "t": 232.56853999999998, "r": 558.20502, "b": 240.94317999999998, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "aspects on model performance through data-ablation experiments,", "bbox": {"l": 317.95499, "t": 243.52752999999996, "r": 559.18408, "b": 251.90215999999998, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "both from a size and class-label perspective. Last but not least, we", "bbox": {"l": 317.95499, "t": 254.48650999999995, "r": 558.20227, "b": 262.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "compared the accuracy of models trained on other public datasets", "bbox": {"l": 317.95499, "t": 265.44556, "r": 558.20349, "b": 273.82019, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "and showed that DocLayNet trained models are more robust.", "bbox": {"l": 317.95499, "t": 276.40454, "r": 540.99426, "b": 284.77917, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "To date, there is still a significant gap between human and ML", "bbox": {"l": 327.918, "t": 287.36353, "r": 558.43469, "b": 295.73816, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "accuracy on the layout interpretation task, and we hope that this", "bbox": {"l": 317.95499, "t": 298.32254, "r": 558.20013, "b": 306.69717, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "work will inspire the research community to close that gap.", "bbox": {"l": 317.62299, "t": 309.28152, "r": 535.65015, "b": 317.65616000000006, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "REFERENCES", "bbox": {"l": 317.95499, "t": 335.09189, "r": 387.3696, "b": 345.40097, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "[1]", "bbox": {"l": 321.198, "t": 348.70233, "r": 329.72415, "b": 355.21588, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "Max G\u00f6bel, Tamir Hassan, Ermelinda Oro, and Giorgio Orsi. Icdar 2013 table", "bbox": {"l": 331.53516, "t": 348.70233, "r": 558.19904, "b": 355.21588, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "competition. In", "bbox": {"l": 333.39099, "t": 356.67236, "r": 379.36414, "b": 363.18591, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "2013 12th International Conference on Document Analysis and", "bbox": {"l": 381.37201, "t": 356.70724, "r": 558.20099, "b": 363.19287, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "Recognition", "bbox": {"l": 333.39099, "t": 364.67724999999996, "r": 365.59601, "b": 371.16286999999994, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": ", pages 1449-1453, 2013.", "bbox": {"l": 365.59601, "t": 364.64236, "r": 434.29489, "b": 371.15591, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "[2]", "bbox": {"l": 321.198, "t": 372.61237, "r": 329.85956, "b": 379.12592, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "Christian Clausner, Apostolos Antonacopoulos, and Stefan Pletschacher. Ic-", "bbox": {"l": 331.69931, "t": 372.61237, "r": 559.37976, "b": 379.12592, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "dar2017 competition on recognition of documents with complex layouts -", "bbox": {"l": 333.39099, "t": 380.58237, "r": 559.37982, "b": 387.09592, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "rdcl2017. In", "bbox": {"l": 333.39099, "t": 388.55236999999994, "r": 367.4339, "b": 395.06592, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "2017 14th IAPR International Conference on Document Analysis and", "bbox": {"l": 369.17401, "t": 388.58725000000004, "r": 558.20422, "b": 395.07288, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "Recognition (ICDAR)", "bbox": {"l": 333.39099, "t": 396.55725, "r": 390.87601, "b": 403.04287999999997, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": ", volume 01, pages 1404-1410, 2017.", "bbox": {"l": 390.87698, "t": 396.52237, "r": 492.17831, "b": 403.03592, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "[3]", "bbox": {"l": 321.198, "t": 404.49237, "r": 329.53583, "b": 411.00592, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "Herv\u00e9 D\u00e9jean, Jean-Luc Meunier, Liangcai Gao, Yilun Huang, Yu Fang, Florian", "bbox": {"l": 331.30682, "t": 404.49237, "r": 558.19958, "b": 411.00592, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "Kleber, and Eva-Maria Lang. ICDAR 2019 Competition on Table Detection and", "bbox": {"l": 333.39099, "t": 412.46335, "r": 558.20013, "b": 418.9769, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "Recognition (cTDaR), April 2019. http://sac.founderit.com/.", "bbox": {"l": 333.39099, "t": 420.43335, "r": 501.80127, "b": 426.94689999999997, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "[4]", "bbox": {"l": 321.198, "t": 428.40335, "r": 329.91299, "b": 434.9169, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "Antonio Jimeno Yepes, Peter Zhong, and Douglas Burdick. Competition on", "bbox": {"l": 331.7641, "t": 428.40335, "r": 558.19885, "b": 434.9169, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "scientific literature parsing. In", "bbox": {"l": 333.39099, "t": 436.3733500000001, "r": 423.77225, "b": 442.8869, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "Proceedings of the International Conference on", "bbox": {"l": 425.909, "t": 436.40823, "r": 558.20178, "b": 442.89386, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "Document Analysis and Recognition", "bbox": {"l": 333.39099, "t": 444.37823, "r": 429.42697, "b": 450.86386, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": ", ICDAR, pages 605-617. LNCS 12824, Springer-", "bbox": {"l": 429.42400999999995, "t": 444.34335, "r": 559.37872, "b": 450.85689999999994, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "Verlag, sep 2021.", "bbox": {"l": 332.819, "t": 452.31335, "r": 380.01764, "b": 458.8269, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "[5]", "bbox": {"l": 321.198, "t": 460.28336, "r": 329.22977, "b": 466.79691, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "Logan Markewich, Hao Zhang, Yubin Xing, Navid Lambert-Shirzad, Jiang Zhexin,", "bbox": {"l": 330.93576, "t": 460.28336, "r": 558.97156, "b": 466.79691, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "Roy Lee, Zhi Li, and Seok-Bum Ko. Segmentation for document layout analysis:", "bbox": {"l": 333.39099, "t": 468.25336, "r": 559.02625, "b": 474.76691, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "not dead yet.", "bbox": {"l": 333.39099, "t": 476.22437, "r": 368.85431, "b": 482.73792, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "International Journal on Document Analysis and Recognition (IJDAR)", "bbox": {"l": 370.811, "t": 476.25925, "r": 557.46326, "b": 482.74487, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": ",", "bbox": {"l": 557.46503, "t": 476.22437, "r": 558.96857, "b": 482.73792, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "pages 1-11, 01 2022.", "bbox": {"l": 333.39099, "t": 484.19437, "r": 390.82715, "b": 490.70792, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "[6]", "bbox": {"l": 321.198, "t": 492.16437, "r": 329.42145, "b": 498.67792, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "Xu Zhong, Jianbin Tang, and Antonio Jimeno-Yepes. Publaynet: Largest dataset", "bbox": {"l": 331.16812, "t": 492.16437, "r": 558.20361, "b": 498.67792, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "ever for document layout analysis. In", "bbox": {"l": 333.39099, "t": 500.13437, "r": 438.6101100000001, "b": 506.64792, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "Proceedings of the International Conference", "bbox": {"l": 440.349, "t": 500.16925, "r": 558.19958, "b": 506.65488, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "on Document Analysis and Recognition", "bbox": {"l": 333.39099, "t": 508.13925, "r": 441.40118, "b": 514.6248800000001, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": ", ICDAR, pages 1015-1022, sep 2019.", "bbox": {"l": 441.4019799999999, "t": 508.10437, "r": 544.78162, "b": 514.61792, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "[7]", "bbox": {"l": 321.19797, "t": 516.07437, "r": 329.74161, "b": 522.5879199999999, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "Minghao Li, Yiheng Xu, Lei Cui, Shaohan Huang, Furu Wei, Zhoujun Li, and", "bbox": {"l": 331.55634, "t": 516.07437, "r": 558.19897, "b": 522.5879199999999, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "Ming Zhou. Docbank: A benchmark dataset for document layout analysis. In", "bbox": {"l": 333.39099, "t": 524.0443700000001, "r": 558.19891, "b": 530.55792, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "Proceedings of the 28th International Conference on Computational Linguistics", "bbox": {"l": 333.39099, "t": 532.04922, "r": 557.40228, "b": 538.53487, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": ",", "bbox": {"l": 557.40399, "t": 532.01437, "r": 558.96893, "b": 538.5278900000001, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "COLING, pages 949-960. International Committee on Computational Linguistics,", "bbox": {"l": 333.39099, "t": 539.98438, "r": 558.9715, "b": 546.49789, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "dec 2020.", "bbox": {"l": 333.39099, "t": 547.95535, "r": 359.31955, "b": 554.46889, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "[8]", "bbox": {"l": 321.198, "t": 555.92535, "r": 329.7088, "b": 562.43889, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "Riaz Ahmad, Muhammad Tanvir Afzal, and M. Qadir. Information extraction", "bbox": {"l": 331.51654, "t": 555.92535, "r": 558.19891, "b": 562.43889, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "from pdf sources based on rule-based system using integrated formats. In", "bbox": {"l": 333.39099, "t": 563.89536, "r": 535.54352, "b": 570.40889, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "SemWe-", "bbox": {"l": 536.96399, "t": 563.93024, "r": 558.90222, "b": 570.4158600000001, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "bEval@ESWC", "bbox": {"l": 333.39099, "t": 571.9002399999999, "r": 371.94217, "b": 578.38586, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": ", 2016.", "bbox": {"l": 371.94299, "t": 571.86536, "r": 389.72617, "b": 578.3788900000001, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": "[9]", "bbox": {"l": 321.198, "t": 579.83536, "r": 329.45999, "b": 586.34889, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "Ross B. Girshick, Jeff Donahue, Trevor Darrell, and Jitendra Malik. Rich feature", "bbox": {"l": 331.21487, "t": 579.83536, "r": 558.19843, "b": 586.34889, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "hierarchies for accurate object detection and semantic segmentation. In", "bbox": {"l": 333.39099, "t": 587.8053600000001, "r": 543.05487, "b": 594.31889, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": "IEEE", "bbox": {"l": 544.98499, "t": 587.84024, "r": 558.20148, "b": 594.32587, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "Conference on Computer Vision and Pattern Recognition", "bbox": {"l": 333.39099, "t": 595.81024, "r": 491.61166, "b": 602.29587, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": ", CVPR, pages 580-587.", "bbox": {"l": 491.61301, "t": 595.77536, "r": 559.27448, "b": 602.28889, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "IEEE Computer Society, jun 2014.", "bbox": {"l": 333.39099, "t": 603.74536, "r": 428.59726000000006, "b": 610.2589, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": "[10]", "bbox": {"l": 317.95499, "t": 611.71536, "r": 329.54767, "b": 618.2289000000001, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "Ross B. Girshick. Fast R-CNN. In", "bbox": {"l": 331.31268, "t": 611.71536, "r": 425.1554, "b": 618.2289000000001, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "2015 IEEE International Conference on Computer", "bbox": {"l": 426.77802, "t": 611.75024, "r": 558.20203, "b": 618.23587, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "Vision", "bbox": {"l": 333.39099, "t": 619.72124, "r": 350.59537, "b": 626.20686, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": ", ICCV, pages 1440-1448. IEEE Computer Society, dec 2015.", "bbox": {"l": 350.59598, "t": 619.68637, "r": 518.58777, "b": 626.19989, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "[11]", "bbox": {"l": 317.95499, "t": 627.65637, "r": 329.5459, "b": 634.16989, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "Shaoqing Ren, Kaiming He, Ross Girshick, and Jian Sun. Faster r-cnn: Towards", "bbox": {"l": 331.31064, "t": 627.65637, "r": 558.20142, "b": 634.16989, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "real-time object detection with region proposal networks.", "bbox": {"l": 333.39099, "t": 635.62637, "r": 497.50909, "b": 642.13989, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "IEEE Transactions on", "bbox": {"l": 500.01401, "t": 635.66124, "r": 558.19885, "b": 642.14687, "coord_origin": "TOPLEFT"}}, {"id": 201, "text": "Pattern Analysis and Machine Intelligence", "bbox": {"l": 333.39099, "t": 643.6312399999999, "r": 449.38620000000003, "b": 650.1168700000001, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": ", 39(6):1137-1149, 2017.", "bbox": {"l": 449.38699, "t": 643.59637, "r": 515.74268, "b": 650.10989, "coord_origin": "TOPLEFT"}}, {"id": 203, "text": "[12]", "bbox": {"l": 317.95499, "t": 651.56638, "r": 329.41763, "b": 658.0799, "coord_origin": "TOPLEFT"}}, {"id": 204, "text": "Kaiming He, Georgia Gkioxari, Piotr Doll\u00e1r, and Ross B. Girshick. Mask R-CNN.", "bbox": {"l": 331.16287, "t": 651.56638, "r": 559.27808, "b": 658.0799, "coord_origin": "TOPLEFT"}}, {"id": 205, "text": "In", "bbox": {"l": 333.39099, "t": 659.53638, "r": 339.35904, "b": 666.0499, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": "IEEE International Conference on Computer Vision", "bbox": {"l": 341.56299, "t": 659.57124, "r": 485.8273, "b": 666.05687, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": ", ICCV, pages 2980-2988.", "bbox": {"l": 485.82901, "t": 659.53638, "r": 559.27356, "b": 666.0499, "coord_origin": "TOPLEFT"}}, {"id": 208, "text": "IEEE Computer Society, Oct 2017.", "bbox": {"l": 333.39099, "t": 667.50636, "r": 429.30161000000004, "b": 674.01989, "coord_origin": "TOPLEFT"}}, {"id": 209, "text": "[13]", "bbox": {"l": 317.95499, "t": 675.47636, "r": 330.11407, "b": 681.9898900000001, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": "Glenn Jocher, Alex Stoken, Ayush Chaurasia, Jirka Borovec, NanoCode012,", "bbox": {"l": 331.96533, "t": 675.47636, "r": 558.96716, "b": 681.9898900000001, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "TaoXie, Yonghye Kwon, Kalen Michael, Liu Changyu, Jiacong Fang, Abhiram V,", "bbox": {"l": 333.18201, "t": 683.44637, "r": 558.96661, "b": 689.95989, "coord_origin": "TOPLEFT"}}, {"id": 212, "text": "Laughing, tkianai, yxNONG, Piotr Skalski, Adam Hogan, Jebastin Nadar, imyhxy,", "bbox": {"l": 333.39099, "t": 691.41737, "r": 558.97156, "b": 697.930893, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "Lorenzo Mammana, Alex Wang, Cristi Fati, Diego Montes, Jan Hajek, Laurentiu", "bbox": {"l": 333.39099, "t": 699.387367, "r": 558.20001, "b": 705.900894, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 24, "label": "page_header", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.7984216809272766, "cells": [{"id": 0, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 246.24382, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar", "bbox": {"l": 253.13897999999998, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "text", "bbox": {"l": 53.501999, "t": 86.87292000000002, "r": 295.64868, "b": 150.14111000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9824112057685852, "cells": [{"id": 2, "text": "Table 5: Prediction Performance (mAP@0.5-0.95) of a Mask", "bbox": {"l": 53.501999, "t": 86.87292000000002, "r": 294.32153, "b": 95.34618999999998, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "R-CNN R50 network across the PubLayNet, DocBank & Do-", "bbox": {"l": 53.79800000000001, "t": 97.83191, "r": 295.64868, "b": 106.30517999999995, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "cLayNet data-sets. By evaluating on common label classes of", "bbox": {"l": 53.79800000000001, "t": 108.79088999999999, "r": 294.0437, "b": 117.26415999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "each dataset, we observe that the DocLayNet-trained model", "bbox": {"l": 53.79800000000001, "t": 119.74987999999996, "r": 294.04373, "b": 128.22313999999994, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "has much less pronounced variations in performance across", "bbox": {"l": 53.79800000000001, "t": 130.70885999999996, "r": 294.0437, "b": 139.18213000000003, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "all datasets.", "bbox": {"l": 53.79800000000001, "t": 141.66785000000004, "r": 101.15852, "b": 150.14111000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "table", "bbox": {"l": 72.6590347290039, "t": 172.48080444335938, "r": 274.83465576171875, "b": 339.8540344238281, "coord_origin": "TOPLEFT"}, "confidence": 0.9892616271972656, "cells": [{"id": 8, "text": "Testing on", "bbox": {"l": 217.74099999999999, "t": 175.01855, "r": 256.26065, "b": 183.39319, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Training on", "bbox": {"l": 89.954002, "t": 185.97655999999995, "r": 133.24379, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "labels", "bbox": {"l": 154.629, "t": 185.97655999999995, "r": 175.47588, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "PLN", "bbox": {"l": 204.69, "t": 185.97655999999995, "r": 220.54260000000002, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "DB", "bbox": {"l": 230.50427000000002, "t": 185.97655999999995, "r": 242.06197, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "DLN", "bbox": {"l": 252.02364, "t": 185.97655999999995, "r": 269.31085, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "PubLayNet (PLN)", "bbox": {"l": 78.530998, "t": 219.25256000000002, "r": 142.56006, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Figure", "bbox": {"l": 154.629, "t": 197.33452999999997, "r": 177.92371, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "96", "bbox": {"l": 208.44701, "t": 197.33452999999997, "r": 216.78575000000004, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "43", "bbox": {"l": 232.1183, "t": 197.33452999999997, "r": 240.45705, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "23", "bbox": {"l": 256.49792, "t": 197.33452999999997, "r": 264.83667, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Sec-header", "bbox": {"l": 154.629, "t": 208.29351999999994, "r": 194.72675, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "87", "bbox": {"l": 208.44701, "t": 208.29351999999994, "r": 216.78575000000004, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "-", "bbox": {"l": 234.77235, "t": 208.29351999999994, "r": 237.80299000000002, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "32", "bbox": {"l": 256.49792, "t": 208.29351999999994, "r": 264.83667, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Table", "bbox": {"l": 154.629, "t": 219.25256000000002, "r": 174.43578, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "95", "bbox": {"l": 208.44701, "t": 219.25256000000002, "r": 216.78575000000004, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "24", "bbox": {"l": 232.1183, "t": 219.25256000000002, "r": 240.45705, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "49", "bbox": {"l": 256.49792, "t": 219.25256000000002, "r": 264.83667, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Text", "bbox": {"l": 154.629, "t": 230.21155, "r": 170.58919, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "96", "bbox": {"l": 208.44701, "t": 230.21155, "r": 216.78575000000004, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "-", "bbox": {"l": 234.77235, "t": 230.21155, "r": 237.80299000000002, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "42", "bbox": {"l": 256.49792, "t": 230.21155, "r": 264.83667, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "total", "bbox": {"l": 154.629, "t": 241.16956000000005, "r": 171.2796, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "93", "bbox": {"l": 208.44701, "t": 241.16956000000005, "r": 216.78575000000004, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "34", "bbox": {"l": 232.1183, "t": 241.16956000000005, "r": 240.45705, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "30", "bbox": {"l": 256.49792, "t": 241.16956000000005, "r": 264.83667, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "DocBank (DB)", "bbox": {"l": 78.530998, "t": 263.48650999999995, "r": 131.19963, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Figure", "bbox": {"l": 154.629, "t": 252.52752999999996, "r": 177.92371, "b": 260.90216, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "77", "bbox": {"l": 208.44701, "t": 252.52752999999996, "r": 216.78575000000004, "b": 260.90216, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "71", "bbox": {"l": 232.1183, "t": 252.52752999999996, "r": 240.45705, "b": 260.90216, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "31", "bbox": {"l": 256.49792, "t": 252.52752999999996, "r": 264.83667, "b": 260.90216, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "Table", "bbox": {"l": 154.629, "t": 263.48650999999995, "r": 174.43578, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "19", "bbox": {"l": 208.44701, "t": 263.48650999999995, "r": 216.78575000000004, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "65", "bbox": {"l": 232.1183, "t": 263.48650999999995, "r": 240.45705, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "22", "bbox": {"l": 256.49792, "t": 263.48650999999995, "r": 264.83667, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "total", "bbox": {"l": 154.629, "t": 274.44556, "r": 171.2796, "b": 282.82016, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "48", "bbox": {"l": 208.44701, "t": 274.44556, "r": 216.78575000000004, "b": 282.82016, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "68", "bbox": {"l": 232.1183, "t": 274.44556, "r": 240.45705, "b": 282.82016, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "27", "bbox": {"l": 256.49792, "t": 274.44556, "r": 264.83667, "b": 282.82016, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "DocLayNet (DLN)", "bbox": {"l": 78.530998, "t": 307.72055, "r": 144.66716, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "Figure", "bbox": {"l": 154.629, "t": 285.80255, "r": 177.92371, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "67", "bbox": {"l": 208.44701, "t": 285.80255, "r": 216.78575000000004, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "51", "bbox": {"l": 232.1183, "t": 285.80255, "r": 240.45705, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "72", "bbox": {"l": 256.49792, "t": 285.80255, "r": 264.83667, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Sec-header", "bbox": {"l": 154.629, "t": 296.76154, "r": 194.72675, "b": 305.13617, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "53", "bbox": {"l": 208.44701, "t": 296.76154, "r": 216.78575000000004, "b": 305.13617, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "-", "bbox": {"l": 234.77235, "t": 296.76154, "r": 237.80299000000002, "b": 305.13617, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "68", "bbox": {"l": 256.49792, "t": 296.76154, "r": 264.83667, "b": 305.13617, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Table", "bbox": {"l": 154.629, "t": 307.72055, "r": 174.43578, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "87", "bbox": {"l": 208.44701, "t": 307.72055, "r": 216.78575000000004, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "43", "bbox": {"l": 232.1183, "t": 307.72055, "r": 240.45705, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "82", "bbox": {"l": 256.49792, "t": 307.72055, "r": 264.83667, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "Text", "bbox": {"l": 154.629, "t": 318.67953, "r": 170.58919, "b": 327.05417, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "77", "bbox": {"l": 208.44701, "t": 318.67953, "r": 216.78575000000004, "b": 327.05417, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "-", "bbox": {"l": 234.77235, "t": 318.67953, "r": 237.80299000000002, "b": 327.05417, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "84", "bbox": {"l": 256.49792, "t": 318.67953, "r": 264.83667, "b": 327.05417, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "total", "bbox": {"l": 154.629, "t": 329.63855, "r": 171.2796, "b": 338.01318, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "59", "bbox": {"l": 208.44701, "t": 329.63855, "r": 216.78575000000004, "b": 338.01318, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "47", "bbox": {"l": 232.1183, "t": 329.63855, "r": 240.45705, "b": 338.01318, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "78", "bbox": {"l": 256.49792, "t": 329.63855, "r": 264.83667, "b": 338.01318, "coord_origin": "TOPLEFT"}}], "children": [{"id": 25, "label": "text", "bbox": {"l": 217.74099999999999, "t": 175.01855, "r": 256.26065, "b": 183.39319, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "Testing on", "bbox": {"l": 217.74099999999999, "t": 175.01855, "r": 256.26065, "b": 183.39319, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 89.954002, "t": 185.97655999999995, "r": 133.24379, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "Training on", "bbox": {"l": 89.954002, "t": 185.97655999999995, "r": 133.24379, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 154.629, "t": 185.97655999999995, "r": 175.47588, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "labels", "bbox": {"l": 154.629, "t": 185.97655999999995, "r": 175.47588, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 204.69, "t": 185.97655999999995, "r": 220.54260000000002, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "PLN", "bbox": {"l": 204.69, "t": 185.97655999999995, "r": 220.54260000000002, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 230.50427000000002, "t": 185.97655999999995, "r": 242.06197, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "DB", "bbox": {"l": 230.50427000000002, "t": 185.97655999999995, "r": 242.06197, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 252.02364, "t": 185.97655999999995, "r": 269.31085, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "DLN", "bbox": {"l": 252.02364, "t": 185.97655999999995, "r": 269.31085, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 78.530998, "t": 219.25256000000002, "r": 142.56006, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "PubLayNet (PLN)", "bbox": {"l": 78.530998, "t": 219.25256000000002, "r": 142.56006, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 154.629, "t": 197.33452999999997, "r": 177.92371, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "Figure", "bbox": {"l": 154.629, "t": 197.33452999999997, "r": 177.92371, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 208.44701, "t": 197.33452999999997, "r": 216.78575000000004, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "96", "bbox": {"l": 208.44701, "t": 197.33452999999997, "r": 216.78575000000004, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 232.1183, "t": 197.33452999999997, "r": 240.45705, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "43", "bbox": {"l": 232.1183, "t": 197.33452999999997, "r": 240.45705, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 256.49792, "t": 197.33452999999997, "r": 264.83667, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "23", "bbox": {"l": 256.49792, "t": 197.33452999999997, "r": 264.83667, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 154.629, "t": 208.29351999999994, "r": 194.72675, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "Sec-header", "bbox": {"l": 154.629, "t": 208.29351999999994, "r": 194.72675, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 208.44701, "t": 208.29351999999994, "r": 216.78575000000004, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "87", "bbox": {"l": 208.44701, "t": 208.29351999999994, "r": 216.78575000000004, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 234.77235, "t": 208.29351999999994, "r": 237.80299000000002, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "-", "bbox": {"l": 234.77235, "t": 208.29351999999994, "r": 237.80299000000002, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 256.49792, "t": 208.29351999999994, "r": 264.83667, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "32", "bbox": {"l": 256.49792, "t": 208.29351999999994, "r": 264.83667, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 154.629, "t": 219.25256000000002, "r": 174.43578, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "Table", "bbox": {"l": 154.629, "t": 219.25256000000002, "r": 174.43578, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 208.44701, "t": 219.25256000000002, "r": 216.78575000000004, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "95", "bbox": {"l": 208.44701, "t": 219.25256000000002, "r": 216.78575000000004, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 232.1183, "t": 219.25256000000002, "r": 240.45705, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "24", "bbox": {"l": 232.1183, "t": 219.25256000000002, "r": 240.45705, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 256.49792, "t": 219.25256000000002, "r": 264.83667, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "49", "bbox": {"l": 256.49792, "t": 219.25256000000002, "r": 264.83667, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 154.629, "t": 230.21155, "r": 170.58919, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "Text", "bbox": {"l": 154.629, "t": 230.21155, "r": 170.58919, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 208.44701, "t": 230.21155, "r": 216.78575000000004, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "96", "bbox": {"l": 208.44701, "t": 230.21155, "r": 216.78575000000004, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 234.77235, "t": 230.21155, "r": 237.80299000000002, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "-", "bbox": {"l": 234.77235, "t": 230.21155, "r": 237.80299000000002, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 256.49792, "t": 230.21155, "r": 264.83667, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "42", "bbox": {"l": 256.49792, "t": 230.21155, "r": 264.83667, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 154.629, "t": 241.16956000000005, "r": 171.2796, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "total", "bbox": {"l": 154.629, "t": 241.16956000000005, "r": 171.2796, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 208.44701, "t": 241.16956000000005, "r": 216.78575000000004, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "93", "bbox": {"l": 208.44701, "t": 241.16956000000005, "r": 216.78575000000004, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 232.1183, "t": 241.16956000000005, "r": 240.45705, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "34", "bbox": {"l": 232.1183, "t": 241.16956000000005, "r": 240.45705, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 256.49792, "t": 241.16956000000005, "r": 264.83667, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "30", "bbox": {"l": 256.49792, "t": 241.16956000000005, "r": 264.83667, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 78.530998, "t": 263.48650999999995, "r": 131.19963, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "DocBank (DB)", "bbox": {"l": 78.530998, "t": 263.48650999999995, "r": 131.19963, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 154.629, "t": 252.52752999999996, "r": 177.92371, "b": 260.90216, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "Figure", "bbox": {"l": 154.629, "t": 252.52752999999996, "r": 177.92371, "b": 260.90216, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 208.44701, "t": 252.52752999999996, "r": 216.78575000000004, "b": 260.90216, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "77", "bbox": {"l": 208.44701, "t": 252.52752999999996, "r": 216.78575000000004, "b": 260.90216, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 232.1183, "t": 252.52752999999996, "r": 240.45705, "b": 260.90216, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "71", "bbox": {"l": 232.1183, "t": 252.52752999999996, "r": 240.45705, "b": 260.90216, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 256.49792, "t": 252.52752999999996, "r": 264.83667, "b": 260.90216, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "31", "bbox": {"l": 256.49792, "t": 252.52752999999996, "r": 264.83667, "b": 260.90216, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 154.629, "t": 263.48650999999995, "r": 174.43578, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "Table", "bbox": {"l": 154.629, "t": 263.48650999999995, "r": 174.43578, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 208.44701, "t": 263.48650999999995, "r": 216.78575000000004, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "19", "bbox": {"l": 208.44701, "t": 263.48650999999995, "r": 216.78575000000004, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 232.1183, "t": 263.48650999999995, "r": 240.45705, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "65", "bbox": {"l": 232.1183, "t": 263.48650999999995, "r": 240.45705, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 256.49792, "t": 263.48650999999995, "r": 264.83667, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "22", "bbox": {"l": 256.49792, "t": 263.48650999999995, "r": 264.83667, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 154.629, "t": 274.44556, "r": 171.2796, "b": 282.82016, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "total", "bbox": {"l": 154.629, "t": 274.44556, "r": 171.2796, "b": 282.82016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 208.44701, "t": 274.44556, "r": 216.78575000000004, "b": 282.82016, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "48", "bbox": {"l": 208.44701, "t": 274.44556, "r": 216.78575000000004, "b": 282.82016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 232.1183, "t": 274.44556, "r": 240.45705, "b": 282.82016, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "68", "bbox": {"l": 232.1183, "t": 274.44556, "r": 240.45705, "b": 282.82016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 256.49792, "t": 274.44556, "r": 264.83667, "b": 282.82016, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "27", "bbox": {"l": 256.49792, "t": 274.44556, "r": 264.83667, "b": 282.82016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 78.530998, "t": 307.72055, "r": 144.66716, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "DocLayNet (DLN)", "bbox": {"l": 78.530998, "t": 307.72055, "r": 144.66716, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 154.629, "t": 285.80255, "r": 177.92371, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "Figure", "bbox": {"l": 154.629, "t": 285.80255, "r": 177.92371, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 208.44701, "t": 285.80255, "r": 216.78575000000004, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "67", "bbox": {"l": 208.44701, "t": 285.80255, "r": 216.78575000000004, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 232.1183, "t": 285.80255, "r": 240.45705, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "51", "bbox": {"l": 232.1183, "t": 285.80255, "r": 240.45705, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 256.49792, "t": 285.80255, "r": 264.83667, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "72", "bbox": {"l": 256.49792, "t": 285.80255, "r": 264.83667, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 154.629, "t": 296.76154, "r": 194.72675, "b": 305.13617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "Sec-header", "bbox": {"l": 154.629, "t": 296.76154, "r": 194.72675, "b": 305.13617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 208.44701, "t": 296.76154, "r": 216.78575000000004, "b": 305.13617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "53", "bbox": {"l": 208.44701, "t": 296.76154, "r": 216.78575000000004, "b": 305.13617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 234.77235, "t": 296.76154, "r": 237.80299000000002, "b": 305.13617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "-", "bbox": {"l": 234.77235, "t": 296.76154, "r": 237.80299000000002, "b": 305.13617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 256.49792, "t": 296.76154, "r": 264.83667, "b": 305.13617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "68", "bbox": {"l": 256.49792, "t": 296.76154, "r": 264.83667, "b": 305.13617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 154.629, "t": 307.72055, "r": 174.43578, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "Table", "bbox": {"l": 154.629, "t": 307.72055, "r": 174.43578, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 208.44701, "t": 307.72055, "r": 216.78575000000004, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "87", "bbox": {"l": 208.44701, "t": 307.72055, "r": 216.78575000000004, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 232.1183, "t": 307.72055, "r": 240.45705, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "43", "bbox": {"l": 232.1183, "t": 307.72055, "r": 240.45705, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 256.49792, "t": 307.72055, "r": 264.83667, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "82", "bbox": {"l": 256.49792, "t": 307.72055, "r": 264.83667, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 154.629, "t": 318.67953, "r": 170.58919, "b": 327.05417, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "Text", "bbox": {"l": 154.629, "t": 318.67953, "r": 170.58919, "b": 327.05417, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 208.44701, "t": 318.67953, "r": 216.78575000000004, "b": 327.05417, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "77", "bbox": {"l": 208.44701, "t": 318.67953, "r": 216.78575000000004, "b": 327.05417, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 234.77235, "t": 318.67953, "r": 237.80299000000002, "b": 327.05417, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "-", "bbox": {"l": 234.77235, "t": 318.67953, "r": 237.80299000000002, "b": 327.05417, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 256.49792, "t": 318.67953, "r": 264.83667, "b": 327.05417, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "84", "bbox": {"l": 256.49792, "t": 318.67953, "r": 264.83667, "b": 327.05417, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 154.629, "t": 329.63855, "r": 171.2796, "b": 338.01318, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "total", "bbox": {"l": 154.629, "t": 329.63855, "r": 171.2796, "b": 338.01318, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 208.44701, "t": 329.63855, "r": 216.78575000000004, "b": 338.01318, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "59", "bbox": {"l": 208.44701, "t": 329.63855, "r": 216.78575000000004, "b": 338.01318, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 232.1183, "t": 329.63855, "r": 240.45705, "b": 338.01318, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "47", "bbox": {"l": 232.1183, "t": 329.63855, "r": 240.45705, "b": 338.01318, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 256.49792, "t": 329.63855, "r": 264.83667, "b": 338.01318, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "78", "bbox": {"l": 256.49792, "t": 329.63855, "r": 264.83667, "b": 338.01318, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 4, "label": "text", "bbox": {"l": 53.79800000000001, "t": 390.92053, "r": 294.04712, "b": 443.14014, "coord_origin": "TOPLEFT"}, "confidence": 0.9839397668838501, "cells": [{"id": 69, "text": "Section-header", "bbox": {"l": 53.79800000000001, "t": 390.96539, "r": 106.2392, "b": 399.30414, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": ",", "bbox": {"l": 106.239, "t": 390.92053, "r": 108.23331, "b": 399.2951699999999, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Table", "bbox": {"l": 110.482, "t": 390.96539, "r": 129.76332, "b": 399.30414, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "and", "bbox": {"l": 132.21899, "t": 390.92053, "r": 145.86186, "b": 399.2951699999999, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "Text", "bbox": {"l": 148.112, "t": 390.96539, "r": 163.14182, "b": 399.30414, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": ". Before training, we either mapped", "bbox": {"l": 163.13901, "t": 390.92053, "r": 294.04709, "b": 399.2951699999999, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "or excluded DocLayNet\u2019s other labels as specified in table 3, and", "bbox": {"l": 53.79800000000001, "t": 401.87954999999994, "r": 294.04712, "b": 410.25418, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "also PubLayNet\u2019s", "bbox": {"l": 53.79800000000001, "t": 412.83853, "r": 117.12856, "b": 421.21317, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "List", "bbox": {"l": 119.362, "t": 412.88339, "r": 132.4342, "b": 421.22214, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "to", "bbox": {"l": 135.177, "t": 412.83853, "r": 142.54416, "b": 421.21317, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "Text", "bbox": {"l": 144.77901, "t": 412.88339, "r": 159.66605, "b": 421.22214, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": ". Note that the different clustering of", "bbox": {"l": 159.66701, "t": 412.83853, "r": 294.04562, "b": 421.21317, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "lists (by list-element vs. whole list objects) naturally decreases the", "bbox": {"l": 53.79800000000001, "t": 423.79755, "r": 294.04614, "b": 432.17217999999997, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "mAP score for", "bbox": {"l": 53.79800000000001, "t": 434.75653, "r": 106.2066, "b": 443.13116, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "Text", "bbox": {"l": 108.448, "t": 434.80139, "r": 123.30533, "b": 443.14014, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": ".", "bbox": {"l": 123.305, "t": 434.75653, "r": 125.27761000000001, "b": 443.13116, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 53.466999, "t": 445.71453999999994, "r": 295.55908, "b": 585.59618, "coord_origin": "TOPLEFT"}, "confidence": 0.9868056774139404, "cells": [{"id": 85, "text": "For comparison of DocBank with DocLayNet, we trained only", "bbox": {"l": 63.76100199999999, "t": 445.71453999999994, "r": 294.27582, "b": 454.08917, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "on", "bbox": {"l": 53.79800000000001, "t": 456.67355, "r": 62.989277, "b": 465.04819, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Picture", "bbox": {"l": 64.852997, "t": 456.71841, "r": 88.947144, "b": 465.05716, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "and", "bbox": {"l": 91.019997, "t": 456.67355, "r": 104.24454, "b": 465.04819, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "Table", "bbox": {"l": 106.108, "t": 456.71841, "r": 124.78053, "b": 465.05716, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "clusters of each dataset. We had to exclude", "bbox": {"l": 126.85500000000002, "t": 456.67355, "r": 277.63235, "b": 465.04819, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "Text", "bbox": {"l": 279.49701, "t": 456.71841, "r": 294.0484, "b": 465.05716, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "because successive paragraphs are often grouped together into a", "bbox": {"l": 53.79800000000001, "t": 467.63254, "r": 294.04709, "b": 476.00717, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "single object in DocBank. This paragraph grouping is incompatible", "bbox": {"l": 53.79800000000001, "t": 478.59155, "r": 294.04532, "b": 486.96619, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "with the individual paragraphs of DocLayNet. As can be seen in", "bbox": {"l": 53.466999, "t": 489.55054, "r": 294.04538, "b": 497.92517, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "Table 5, DocLayNet trained models yield better performance com-", "bbox": {"l": 53.528999, "t": 500.50955, "r": 295.55908, "b": 508.88419, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "pared to the previous datasets. It is noteworthy that the models", "bbox": {"l": 53.79800000000001, "t": 511.46854, "r": 294.04712, "b": 519.84317, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "trained on PubLayNet and DocBank perform very well on their", "bbox": {"l": 53.79800000000001, "t": 522.42755, "r": 294.21179, "b": 530.80219, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "own test set, but have a much lower performance on the foreign", "bbox": {"l": 53.79800000000001, "t": 533.38654, "r": 294.04712, "b": 541.76117, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "datasets. While this also applies to DocLayNet, the difference is", "bbox": {"l": 53.79800000000001, "t": 544.34555, "r": 294.04715, "b": 552.72017, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "far less pronounced. Thus we conclude that DocLayNet trained", "bbox": {"l": 53.79800000000001, "t": 555.3045500000001, "r": 294.04712, "b": 563.67917, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "models are overall more robust and will produce better results for", "bbox": {"l": 53.79800000000001, "t": 566.26256, "r": 294.21411, "b": 574.63718, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "challenging, unseen layouts.", "bbox": {"l": 53.79800000000001, "t": 577.22156, "r": 157.52132, "b": 585.59618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "section_header", "bbox": {"l": 53.79800000000001, "t": 605.06091, "r": 156.00534, "b": 615.37001, "coord_origin": "TOPLEFT"}, "confidence": 0.9574698805809021, "cells": [{"id": 103, "text": "Example Predictions", "bbox": {"l": 53.79800000000001, "t": 605.06091, "r": 156.00534, "b": 615.37001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 53.528999, "t": 620.26355, "r": 295.55844, "b": 705.350174, "coord_origin": "TOPLEFT"}, "confidence": 0.9859886169433594, "cells": [{"id": 104, "text": "To conclude this section, we illustrate the quality of layout predic-", "bbox": {"l": 53.528999, "t": 620.26355, "r": 295.5571, "b": 628.63817, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "tions one can expect from DocLayNet-trained models by providing", "bbox": {"l": 53.79800000000001, "t": 631.22255, "r": 294.04532, "b": 639.59717, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "a selection of examples without any further post-processing ap-", "bbox": {"l": 53.79800000000001, "t": 642.18155, "r": 295.55618, "b": 650.5561700000001, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "plied. Figure 6 shows selected layout predictions on pages from the", "bbox": {"l": 53.79800000000001, "t": 653.14055, "r": 294.04541, "b": 661.51517, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "test-set of DocLayNet. Results look decent in general across docu-", "bbox": {"l": 53.79800000000001, "t": 664.09956, "r": 295.55844, "b": 672.47417, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "ment categories, however one can also observe mistakes such as", "bbox": {"l": 53.79800000000001, "t": 675.05756, "r": 294.04712, "b": 683.43217, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "overlapping clusters of different classes, or entirely missing boxes", "bbox": {"l": 53.79800000000001, "t": 686.01656, "r": 294.04535, "b": 694.391174, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "due to low confidence.", "bbox": {"l": 53.79800000000001, "t": 696.975555, "r": 136.07368, "b": 705.350174, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "section_header", "bbox": {"l": 317.95502, "t": 85.85986000000003, "r": 405.72961, "b": 96.16900999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.931998074054718, "cells": [{"id": 112, "text": "6", "bbox": {"l": 317.95502, "t": 85.85986000000003, "r": 323.56229, "b": 96.16900999999996, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "CONCLUSION", "bbox": {"l": 334.47137, "t": 85.85986000000003, "r": 405.72961, "b": 96.16900999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 317.95499, "t": 101.06151999999997, "r": 559.71375, "b": 186.14917000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.985493004322052, "cells": [{"id": 114, "text": "In this paper, we presented the DocLayNet dataset. It provides the", "bbox": {"l": 317.95499, "t": 101.06151999999997, "r": 558.2038, "b": 109.43615999999997, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "document conversion and layout analysis research community a", "bbox": {"l": 317.95499, "t": 112.02057000000002, "r": 558.2041, "b": 120.39520000000005, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "new and challenging dataset to improve and fine-tune novel ML", "bbox": {"l": 317.95499, "t": 122.97955000000002, "r": 558.43274, "b": 131.35419000000002, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "methods on. In contrast to many other datasets, DocLayNet was", "bbox": {"l": 317.95499, "t": 133.93854, "r": 558.20416, "b": 142.31317, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "created by human annotation in order to obtain reliable layout", "bbox": {"l": 317.95499, "t": 144.89752, "r": 558.20422, "b": 153.27215999999999, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "ground-truth on a wide variety of publication- and typesetting-", "bbox": {"l": 317.95499, "t": 155.85657000000003, "r": 559.71313, "b": 164.23119999999994, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "styles. Including a large proportion of documents outside the scien-", "bbox": {"l": 317.95499, "t": 166.81555000000003, "r": 559.71375, "b": 175.19019000000003, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "tific publishing domain adds significant value in this respect.", "bbox": {"l": 317.95499, "t": 177.77454, "r": 540.04382, "b": 186.14917000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "text", "bbox": {"l": 317.686, "t": 188.73352, "r": 559.71704, "b": 284.77917, "coord_origin": "TOPLEFT"}, "confidence": 0.9800531268119812, "cells": [{"id": 122, "text": "From the dataset, we have derived on the one hand reference", "bbox": {"l": 327.918, "t": 188.73352, "r": 558.19836, "b": 197.10815000000002, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "metrics for human performance on document-layout annotation", "bbox": {"l": 317.95499, "t": 199.69257000000005, "r": 558.20404, "b": 208.06719999999996, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "(through double and triple annotations) and on the other hand eval-", "bbox": {"l": 317.686, "t": 210.65155000000004, "r": 559.71704, "b": 219.02617999999995, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "uated the baseline performance of commonly used object detection", "bbox": {"l": 317.95499, "t": 221.60956, "r": 558.20245, "b": 229.98419, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "methods. We also illustrated the impact of various dataset-related", "bbox": {"l": 317.95499, "t": 232.56853999999998, "r": 558.20502, "b": 240.94317999999998, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "aspects on model performance through data-ablation experiments,", "bbox": {"l": 317.95499, "t": 243.52752999999996, "r": 559.18408, "b": 251.90215999999998, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "both from a size and class-label perspective. Last but not least, we", "bbox": {"l": 317.95499, "t": 254.48650999999995, "r": 558.20227, "b": 262.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "compared the accuracy of models trained on other public datasets", "bbox": {"l": 317.95499, "t": 265.44556, "r": 558.20349, "b": 273.82019, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "and showed that DocLayNet trained models are more robust.", "bbox": {"l": 317.95499, "t": 276.40454, "r": 540.99426, "b": 284.77917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "text", "bbox": {"l": 317.62299, "t": 287.36353, "r": 558.43469, "b": 317.65616000000006, "coord_origin": "TOPLEFT"}, "confidence": 0.9676101207733154, "cells": [{"id": 131, "text": "To date, there is still a significant gap between human and ML", "bbox": {"l": 327.918, "t": 287.36353, "r": 558.43469, "b": 295.73816, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "accuracy on the layout interpretation task, and we hope that this", "bbox": {"l": 317.95499, "t": 298.32254, "r": 558.20013, "b": 306.69717, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "work will inspire the research community to close that gap.", "bbox": {"l": 317.62299, "t": 309.28152, "r": 535.65015, "b": 317.65616000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "section_header", "bbox": {"l": 317.95499, "t": 335.09189, "r": 387.3696, "b": 345.40097, "coord_origin": "TOPLEFT"}, "confidence": 0.9378752708435059, "cells": [{"id": 134, "text": "REFERENCES", "bbox": {"l": 317.95499, "t": 335.09189, "r": 387.3696, "b": 345.40097, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "list_item", "bbox": {"l": 321.198, "t": 348.70233, "r": 558.20099, "b": 371.16286999999994, "coord_origin": "TOPLEFT"}, "confidence": 0.9372857213020325, "cells": [{"id": 135, "text": "[1]", "bbox": {"l": 321.198, "t": 348.70233, "r": 329.72415, "b": 355.21588, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "Max G\u00f6bel, Tamir Hassan, Ermelinda Oro, and Giorgio Orsi. Icdar 2013 table", "bbox": {"l": 331.53516, "t": 348.70233, "r": 558.19904, "b": 355.21588, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "competition. In", "bbox": {"l": 333.39099, "t": 356.67236, "r": 379.36414, "b": 363.18591, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "2013 12th International Conference on Document Analysis and", "bbox": {"l": 381.37201, "t": 356.70724, "r": 558.20099, "b": 363.19287, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "Recognition", "bbox": {"l": 333.39099, "t": 364.67724999999996, "r": 365.59601, "b": 371.16286999999994, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": ", pages 1449-1453, 2013.", "bbox": {"l": 365.59601, "t": 364.64236, "r": 434.29489, "b": 371.15591, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "list_item", "bbox": {"l": 321.198, "t": 372.61237, "r": 559.37982, "b": 403.04287999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9480945467948914, "cells": [{"id": 141, "text": "[2]", "bbox": {"l": 321.198, "t": 372.61237, "r": 329.85956, "b": 379.12592, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "Christian Clausner, Apostolos Antonacopoulos, and Stefan Pletschacher. Ic-", "bbox": {"l": 331.69931, "t": 372.61237, "r": 559.37976, "b": 379.12592, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "dar2017 competition on recognition of documents with complex layouts -", "bbox": {"l": 333.39099, "t": 380.58237, "r": 559.37982, "b": 387.09592, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "rdcl2017. In", "bbox": {"l": 333.39099, "t": 388.55236999999994, "r": 367.4339, "b": 395.06592, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "2017 14th IAPR International Conference on Document Analysis and", "bbox": {"l": 369.17401, "t": 388.58725000000004, "r": 558.20422, "b": 395.07288, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "Recognition (ICDAR)", "bbox": {"l": 333.39099, "t": 396.55725, "r": 390.87601, "b": 403.04287999999997, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": ", volume 01, pages 1404-1410, 2017.", "bbox": {"l": 390.87698, "t": 396.52237, "r": 492.17831, "b": 403.03592, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "list_item", "bbox": {"l": 321.198, "t": 404.49237, "r": 558.20013, "b": 426.94689999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9257517457008362, "cells": [{"id": 148, "text": "[3]", "bbox": {"l": 321.198, "t": 404.49237, "r": 329.53583, "b": 411.00592, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "Herv\u00e9 D\u00e9jean, Jean-Luc Meunier, Liangcai Gao, Yilun Huang, Yu Fang, Florian", "bbox": {"l": 331.30682, "t": 404.49237, "r": 558.19958, "b": 411.00592, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "Kleber, and Eva-Maria Lang. ICDAR 2019 Competition on Table Detection and", "bbox": {"l": 333.39099, "t": 412.46335, "r": 558.20013, "b": 418.9769, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "Recognition (cTDaR), April 2019. http://sac.founderit.com/.", "bbox": {"l": 333.39099, "t": 420.43335, "r": 501.80127, "b": 426.94689999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "list_item", "bbox": {"l": 321.198, "t": 428.40335, "r": 559.37872, "b": 458.8269, "coord_origin": "TOPLEFT"}, "confidence": 0.9270977973937988, "cells": [{"id": 152, "text": "[4]", "bbox": {"l": 321.198, "t": 428.40335, "r": 329.91299, "b": 434.9169, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "Antonio Jimeno Yepes, Peter Zhong, and Douglas Burdick. Competition on", "bbox": {"l": 331.7641, "t": 428.40335, "r": 558.19885, "b": 434.9169, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "scientific literature parsing. In", "bbox": {"l": 333.39099, "t": 436.3733500000001, "r": 423.77225, "b": 442.8869, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "Proceedings of the International Conference on", "bbox": {"l": 425.909, "t": 436.40823, "r": 558.20178, "b": 442.89386, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "Document Analysis and Recognition", "bbox": {"l": 333.39099, "t": 444.37823, "r": 429.42697, "b": 450.86386, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": ", ICDAR, pages 605-617. LNCS 12824, Springer-", "bbox": {"l": 429.42400999999995, "t": 444.34335, "r": 559.37872, "b": 450.85689999999994, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "Verlag, sep 2021.", "bbox": {"l": 332.819, "t": 452.31335, "r": 380.01764, "b": 458.8269, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "list_item", "bbox": {"l": 321.198, "t": 460.28336, "r": 559.02625, "b": 490.70792, "coord_origin": "TOPLEFT"}, "confidence": 0.9290012121200562, "cells": [{"id": 159, "text": "[5]", "bbox": {"l": 321.198, "t": 460.28336, "r": 329.22977, "b": 466.79691, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "Logan Markewich, Hao Zhang, Yubin Xing, Navid Lambert-Shirzad, Jiang Zhexin,", "bbox": {"l": 330.93576, "t": 460.28336, "r": 558.97156, "b": 466.79691, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "Roy Lee, Zhi Li, and Seok-Bum Ko. Segmentation for document layout analysis:", "bbox": {"l": 333.39099, "t": 468.25336, "r": 559.02625, "b": 474.76691, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "not dead yet.", "bbox": {"l": 333.39099, "t": 476.22437, "r": 368.85431, "b": 482.73792, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "International Journal on Document Analysis and Recognition (IJDAR)", "bbox": {"l": 370.811, "t": 476.25925, "r": 557.46326, "b": 482.74487, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": ",", "bbox": {"l": 557.46503, "t": 476.22437, "r": 558.96857, "b": 482.73792, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "pages 1-11, 01 2022.", "bbox": {"l": 333.39099, "t": 484.19437, "r": 390.82715, "b": 490.70792, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "list_item", "bbox": {"l": 321.198, "t": 492.16437, "r": 558.20361, "b": 514.6248800000001, "coord_origin": "TOPLEFT"}, "confidence": 0.927480161190033, "cells": [{"id": 166, "text": "[6]", "bbox": {"l": 321.198, "t": 492.16437, "r": 329.42145, "b": 498.67792, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "Xu Zhong, Jianbin Tang, and Antonio Jimeno-Yepes. Publaynet: Largest dataset", "bbox": {"l": 331.16812, "t": 492.16437, "r": 558.20361, "b": 498.67792, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "ever for document layout analysis. In", "bbox": {"l": 333.39099, "t": 500.13437, "r": 438.6101100000001, "b": 506.64792, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "Proceedings of the International Conference", "bbox": {"l": 440.349, "t": 500.16925, "r": 558.19958, "b": 506.65488, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "on Document Analysis and Recognition", "bbox": {"l": 333.39099, "t": 508.13925, "r": 441.40118, "b": 514.6248800000001, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": ", ICDAR, pages 1015-1022, sep 2019.", "bbox": {"l": 441.4019799999999, "t": 508.10437, "r": 544.78162, "b": 514.61792, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "list_item", "bbox": {"l": 321.19797, "t": 516.07437, "r": 558.9715, "b": 554.46889, "coord_origin": "TOPLEFT"}, "confidence": 0.9426893591880798, "cells": [{"id": 172, "text": "[7]", "bbox": {"l": 321.19797, "t": 516.07437, "r": 329.74161, "b": 522.5879199999999, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "Minghao Li, Yiheng Xu, Lei Cui, Shaohan Huang, Furu Wei, Zhoujun Li, and", "bbox": {"l": 331.55634, "t": 516.07437, "r": 558.19897, "b": 522.5879199999999, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "Ming Zhou. Docbank: A benchmark dataset for document layout analysis. In", "bbox": {"l": 333.39099, "t": 524.0443700000001, "r": 558.19891, "b": 530.55792, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "Proceedings of the 28th International Conference on Computational Linguistics", "bbox": {"l": 333.39099, "t": 532.04922, "r": 557.40228, "b": 538.53487, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": ",", "bbox": {"l": 557.40399, "t": 532.01437, "r": 558.96893, "b": 538.5278900000001, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "COLING, pages 949-960. International Committee on Computational Linguistics,", "bbox": {"l": 333.39099, "t": 539.98438, "r": 558.9715, "b": 546.49789, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "dec 2020.", "bbox": {"l": 333.39099, "t": 547.95535, "r": 359.31955, "b": 554.46889, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "list_item", "bbox": {"l": 321.198, "t": 555.92535, "r": 558.90222, "b": 578.38586, "coord_origin": "TOPLEFT"}, "confidence": 0.9139686226844788, "cells": [{"id": 179, "text": "[8]", "bbox": {"l": 321.198, "t": 555.92535, "r": 329.7088, "b": 562.43889, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "Riaz Ahmad, Muhammad Tanvir Afzal, and M. Qadir. Information extraction", "bbox": {"l": 331.51654, "t": 555.92535, "r": 558.19891, "b": 562.43889, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "from pdf sources based on rule-based system using integrated formats. In", "bbox": {"l": 333.39099, "t": 563.89536, "r": 535.54352, "b": 570.40889, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "SemWe-", "bbox": {"l": 536.96399, "t": 563.93024, "r": 558.90222, "b": 570.4158600000001, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "bEval@ESWC", "bbox": {"l": 333.39099, "t": 571.9002399999999, "r": 371.94217, "b": 578.38586, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": ", 2016.", "bbox": {"l": 371.94299, "t": 571.86536, "r": 389.72617, "b": 578.3788900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "list_item", "bbox": {"l": 321.198, "t": 579.83536, "r": 559.27448, "b": 610.2589, "coord_origin": "TOPLEFT"}, "confidence": 0.9113100171089172, "cells": [{"id": 185, "text": "[9]", "bbox": {"l": 321.198, "t": 579.83536, "r": 329.45999, "b": 586.34889, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "Ross B. Girshick, Jeff Donahue, Trevor Darrell, and Jitendra Malik. Rich feature", "bbox": {"l": 331.21487, "t": 579.83536, "r": 558.19843, "b": 586.34889, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "hierarchies for accurate object detection and semantic segmentation. In", "bbox": {"l": 333.39099, "t": 587.8053600000001, "r": 543.05487, "b": 594.31889, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": "IEEE", "bbox": {"l": 544.98499, "t": 587.84024, "r": 558.20148, "b": 594.32587, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "Conference on Computer Vision and Pattern Recognition", "bbox": {"l": 333.39099, "t": 595.81024, "r": 491.61166, "b": 602.29587, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": ", CVPR, pages 580-587.", "bbox": {"l": 491.61301, "t": 595.77536, "r": 559.27448, "b": 602.28889, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "IEEE Computer Society, jun 2014.", "bbox": {"l": 333.39099, "t": 603.74536, "r": 428.59726000000006, "b": 610.2589, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "list_item", "bbox": {"l": 317.95499, "t": 611.71536, "r": 558.20203, "b": 626.20686, "coord_origin": "TOPLEFT"}, "confidence": 0.9028767347335815, "cells": [{"id": 192, "text": "[10]", "bbox": {"l": 317.95499, "t": 611.71536, "r": 329.54767, "b": 618.2289000000001, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "Ross B. Girshick. Fast R-CNN. In", "bbox": {"l": 331.31268, "t": 611.71536, "r": 425.1554, "b": 618.2289000000001, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "2015 IEEE International Conference on Computer", "bbox": {"l": 426.77802, "t": 611.75024, "r": 558.20203, "b": 618.23587, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "Vision", "bbox": {"l": 333.39099, "t": 619.72124, "r": 350.59537, "b": 626.20686, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": ", ICCV, pages 1440-1448. IEEE Computer Society, dec 2015.", "bbox": {"l": 350.59598, "t": 619.68637, "r": 518.58777, "b": 626.19989, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "list_item", "bbox": {"l": 317.95499, "t": 627.65637, "r": 558.20142, "b": 650.1168700000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9127691984176636, "cells": [{"id": 197, "text": "[11]", "bbox": {"l": 317.95499, "t": 627.65637, "r": 329.5459, "b": 634.16989, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "Shaoqing Ren, Kaiming He, Ross Girshick, and Jian Sun. Faster r-cnn: Towards", "bbox": {"l": 331.31064, "t": 627.65637, "r": 558.20142, "b": 634.16989, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "real-time object detection with region proposal networks.", "bbox": {"l": 333.39099, "t": 635.62637, "r": 497.50909, "b": 642.13989, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "IEEE Transactions on", "bbox": {"l": 500.01401, "t": 635.66124, "r": 558.19885, "b": 642.14687, "coord_origin": "TOPLEFT"}}, {"id": 201, "text": "Pattern Analysis and Machine Intelligence", "bbox": {"l": 333.39099, "t": 643.6312399999999, "r": 449.38620000000003, "b": 650.1168700000001, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": ", 39(6):1137-1149, 2017.", "bbox": {"l": 449.38699, "t": 643.59637, "r": 515.74268, "b": 650.10989, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "list_item", "bbox": {"l": 317.95499, "t": 651.56638, "r": 559.27808, "b": 674.01989, "coord_origin": "TOPLEFT"}, "confidence": 0.9142459630966187, "cells": [{"id": 203, "text": "[12]", "bbox": {"l": 317.95499, "t": 651.56638, "r": 329.41763, "b": 658.0799, "coord_origin": "TOPLEFT"}}, {"id": 204, "text": "Kaiming He, Georgia Gkioxari, Piotr Doll\u00e1r, and Ross B. Girshick. Mask R-CNN.", "bbox": {"l": 331.16287, "t": 651.56638, "r": 559.27808, "b": 658.0799, "coord_origin": "TOPLEFT"}}, {"id": 205, "text": "In", "bbox": {"l": 333.39099, "t": 659.53638, "r": 339.35904, "b": 666.0499, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": "IEEE International Conference on Computer Vision", "bbox": {"l": 341.56299, "t": 659.57124, "r": 485.8273, "b": 666.05687, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": ", ICCV, pages 2980-2988.", "bbox": {"l": 485.82901, "t": 659.53638, "r": 559.27356, "b": 666.0499, "coord_origin": "TOPLEFT"}}, {"id": 208, "text": "IEEE Computer Society, Oct 2017.", "bbox": {"l": 333.39099, "t": 667.50636, "r": 429.30161000000004, "b": 674.01989, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "list_item", "bbox": {"l": 317.95499, "t": 675.47636, "r": 558.97156, "b": 705.900894, "coord_origin": "TOPLEFT"}, "confidence": 0.889543354511261, "cells": [{"id": 209, "text": "[13]", "bbox": {"l": 317.95499, "t": 675.47636, "r": 330.11407, "b": 681.9898900000001, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": "Glenn Jocher, Alex Stoken, Ayush Chaurasia, Jirka Borovec, NanoCode012,", "bbox": {"l": 331.96533, "t": 675.47636, "r": 558.96716, "b": 681.9898900000001, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "TaoXie, Yonghye Kwon, Kalen Michael, Liu Changyu, Jiacong Fang, Abhiram V,", "bbox": {"l": 333.18201, "t": 683.44637, "r": 558.96661, "b": 689.95989, "coord_origin": "TOPLEFT"}}, {"id": 212, "text": "Laughing, tkianai, yxNONG, Piotr Skalski, Adam Hogan, Jebastin Nadar, imyhxy,", "bbox": {"l": 333.39099, "t": 691.41737, "r": 558.97156, "b": 697.930893, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "Lorenzo Mammana, Alex Wang, Cristi Fati, Diego Montes, Jan Hajek, Laurentiu", "bbox": {"l": 333.39099, "t": 699.387367, "r": 558.20001, "b": 705.900894, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {"0": {"label": "table", "id": 0, "page_no": 7, "cluster": {"id": 0, "label": "table", "bbox": {"l": 72.6590347290039, "t": 172.48080444335938, "r": 274.83465576171875, "b": 339.8540344238281, "coord_origin": "TOPLEFT"}, "confidence": 0.9892616271972656, "cells": [{"id": 8, "text": "Testing on", "bbox": {"l": 217.74099999999999, "t": 175.01855, "r": 256.26065, "b": 183.39319, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Training on", "bbox": {"l": 89.954002, "t": 185.97655999999995, "r": 133.24379, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "labels", "bbox": {"l": 154.629, "t": 185.97655999999995, "r": 175.47588, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "PLN", "bbox": {"l": 204.69, "t": 185.97655999999995, "r": 220.54260000000002, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "DB", "bbox": {"l": 230.50427000000002, "t": 185.97655999999995, "r": 242.06197, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "DLN", "bbox": {"l": 252.02364, "t": 185.97655999999995, "r": 269.31085, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "PubLayNet (PLN)", "bbox": {"l": 78.530998, "t": 219.25256000000002, "r": 142.56006, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Figure", "bbox": {"l": 154.629, "t": 197.33452999999997, "r": 177.92371, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "96", "bbox": {"l": 208.44701, "t": 197.33452999999997, "r": 216.78575000000004, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "43", "bbox": {"l": 232.1183, "t": 197.33452999999997, "r": 240.45705, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "23", "bbox": {"l": 256.49792, "t": 197.33452999999997, "r": 264.83667, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Sec-header", "bbox": {"l": 154.629, "t": 208.29351999999994, "r": 194.72675, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "87", "bbox": {"l": 208.44701, "t": 208.29351999999994, "r": 216.78575000000004, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "-", "bbox": {"l": 234.77235, "t": 208.29351999999994, "r": 237.80299000000002, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "32", "bbox": {"l": 256.49792, "t": 208.29351999999994, "r": 264.83667, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Table", "bbox": {"l": 154.629, "t": 219.25256000000002, "r": 174.43578, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "95", "bbox": {"l": 208.44701, "t": 219.25256000000002, "r": 216.78575000000004, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "24", "bbox": {"l": 232.1183, "t": 219.25256000000002, "r": 240.45705, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "49", "bbox": {"l": 256.49792, "t": 219.25256000000002, "r": 264.83667, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Text", "bbox": {"l": 154.629, "t": 230.21155, "r": 170.58919, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "96", "bbox": {"l": 208.44701, "t": 230.21155, "r": 216.78575000000004, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "-", "bbox": {"l": 234.77235, "t": 230.21155, "r": 237.80299000000002, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "42", "bbox": {"l": 256.49792, "t": 230.21155, "r": 264.83667, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "total", "bbox": {"l": 154.629, "t": 241.16956000000005, "r": 171.2796, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "93", "bbox": {"l": 208.44701, "t": 241.16956000000005, "r": 216.78575000000004, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "34", "bbox": {"l": 232.1183, "t": 241.16956000000005, "r": 240.45705, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "30", "bbox": {"l": 256.49792, "t": 241.16956000000005, "r": 264.83667, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "DocBank (DB)", "bbox": {"l": 78.530998, "t": 263.48650999999995, "r": 131.19963, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Figure", "bbox": {"l": 154.629, "t": 252.52752999999996, "r": 177.92371, "b": 260.90216, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "77", "bbox": {"l": 208.44701, "t": 252.52752999999996, "r": 216.78575000000004, "b": 260.90216, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "71", "bbox": {"l": 232.1183, "t": 252.52752999999996, "r": 240.45705, "b": 260.90216, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "31", "bbox": {"l": 256.49792, "t": 252.52752999999996, "r": 264.83667, "b": 260.90216, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "Table", "bbox": {"l": 154.629, "t": 263.48650999999995, "r": 174.43578, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "19", "bbox": {"l": 208.44701, "t": 263.48650999999995, "r": 216.78575000000004, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "65", "bbox": {"l": 232.1183, "t": 263.48650999999995, "r": 240.45705, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "22", "bbox": {"l": 256.49792, "t": 263.48650999999995, "r": 264.83667, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "total", "bbox": {"l": 154.629, "t": 274.44556, "r": 171.2796, "b": 282.82016, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "48", "bbox": {"l": 208.44701, "t": 274.44556, "r": 216.78575000000004, "b": 282.82016, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "68", "bbox": {"l": 232.1183, "t": 274.44556, "r": 240.45705, "b": 282.82016, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "27", "bbox": {"l": 256.49792, "t": 274.44556, "r": 264.83667, "b": 282.82016, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "DocLayNet (DLN)", "bbox": {"l": 78.530998, "t": 307.72055, "r": 144.66716, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "Figure", "bbox": {"l": 154.629, "t": 285.80255, "r": 177.92371, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "67", "bbox": {"l": 208.44701, "t": 285.80255, "r": 216.78575000000004, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "51", "bbox": {"l": 232.1183, "t": 285.80255, "r": 240.45705, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "72", "bbox": {"l": 256.49792, "t": 285.80255, "r": 264.83667, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Sec-header", "bbox": {"l": 154.629, "t": 296.76154, "r": 194.72675, "b": 305.13617, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "53", "bbox": {"l": 208.44701, "t": 296.76154, "r": 216.78575000000004, "b": 305.13617, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "-", "bbox": {"l": 234.77235, "t": 296.76154, "r": 237.80299000000002, "b": 305.13617, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "68", "bbox": {"l": 256.49792, "t": 296.76154, "r": 264.83667, "b": 305.13617, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Table", "bbox": {"l": 154.629, "t": 307.72055, "r": 174.43578, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "87", "bbox": {"l": 208.44701, "t": 307.72055, "r": 216.78575000000004, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "43", "bbox": {"l": 232.1183, "t": 307.72055, "r": 240.45705, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "82", "bbox": {"l": 256.49792, "t": 307.72055, "r": 264.83667, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "Text", "bbox": {"l": 154.629, "t": 318.67953, "r": 170.58919, "b": 327.05417, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "77", "bbox": {"l": 208.44701, "t": 318.67953, "r": 216.78575000000004, "b": 327.05417, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "-", "bbox": {"l": 234.77235, "t": 318.67953, "r": 237.80299000000002, "b": 327.05417, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "84", "bbox": {"l": 256.49792, "t": 318.67953, "r": 264.83667, "b": 327.05417, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "total", "bbox": {"l": 154.629, "t": 329.63855, "r": 171.2796, "b": 338.01318, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "59", "bbox": {"l": 208.44701, "t": 329.63855, "r": 216.78575000000004, "b": 338.01318, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "47", "bbox": {"l": 232.1183, "t": 329.63855, "r": 240.45705, "b": 338.01318, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "78", "bbox": {"l": 256.49792, "t": 329.63855, "r": 264.83667, "b": 338.01318, "coord_origin": "TOPLEFT"}}], "children": [{"id": 25, "label": "text", "bbox": {"l": 217.74099999999999, "t": 175.01855, "r": 256.26065, "b": 183.39319, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "Testing on", "bbox": {"l": 217.74099999999999, "t": 175.01855, "r": 256.26065, "b": 183.39319, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 89.954002, "t": 185.97655999999995, "r": 133.24379, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "Training on", "bbox": {"l": 89.954002, "t": 185.97655999999995, "r": 133.24379, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 154.629, "t": 185.97655999999995, "r": 175.47588, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "labels", "bbox": {"l": 154.629, "t": 185.97655999999995, "r": 175.47588, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 204.69, "t": 185.97655999999995, "r": 220.54260000000002, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "PLN", "bbox": {"l": 204.69, "t": 185.97655999999995, "r": 220.54260000000002, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 230.50427000000002, "t": 185.97655999999995, "r": 242.06197, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "DB", "bbox": {"l": 230.50427000000002, "t": 185.97655999999995, "r": 242.06197, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 252.02364, "t": 185.97655999999995, "r": 269.31085, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "DLN", "bbox": {"l": 252.02364, "t": 185.97655999999995, "r": 269.31085, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 78.530998, "t": 219.25256000000002, "r": 142.56006, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "PubLayNet (PLN)", "bbox": {"l": 78.530998, "t": 219.25256000000002, "r": 142.56006, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 154.629, "t": 197.33452999999997, "r": 177.92371, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "Figure", "bbox": {"l": 154.629, "t": 197.33452999999997, "r": 177.92371, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 208.44701, "t": 197.33452999999997, "r": 216.78575000000004, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "96", "bbox": {"l": 208.44701, "t": 197.33452999999997, "r": 216.78575000000004, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 232.1183, "t": 197.33452999999997, "r": 240.45705, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "43", "bbox": {"l": 232.1183, "t": 197.33452999999997, "r": 240.45705, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 256.49792, "t": 197.33452999999997, "r": 264.83667, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "23", "bbox": {"l": 256.49792, "t": 197.33452999999997, "r": 264.83667, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 154.629, "t": 208.29351999999994, "r": 194.72675, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "Sec-header", "bbox": {"l": 154.629, "t": 208.29351999999994, "r": 194.72675, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 208.44701, "t": 208.29351999999994, "r": 216.78575000000004, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "87", "bbox": {"l": 208.44701, "t": 208.29351999999994, "r": 216.78575000000004, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 234.77235, "t": 208.29351999999994, "r": 237.80299000000002, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "-", "bbox": {"l": 234.77235, "t": 208.29351999999994, "r": 237.80299000000002, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 256.49792, "t": 208.29351999999994, "r": 264.83667, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "32", "bbox": {"l": 256.49792, "t": 208.29351999999994, "r": 264.83667, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 154.629, "t": 219.25256000000002, "r": 174.43578, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "Table", "bbox": {"l": 154.629, "t": 219.25256000000002, "r": 174.43578, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 208.44701, "t": 219.25256000000002, "r": 216.78575000000004, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "95", "bbox": {"l": 208.44701, "t": 219.25256000000002, "r": 216.78575000000004, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 232.1183, "t": 219.25256000000002, "r": 240.45705, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "24", "bbox": {"l": 232.1183, "t": 219.25256000000002, "r": 240.45705, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 256.49792, "t": 219.25256000000002, "r": 264.83667, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "49", "bbox": {"l": 256.49792, "t": 219.25256000000002, "r": 264.83667, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 154.629, "t": 230.21155, "r": 170.58919, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "Text", "bbox": {"l": 154.629, "t": 230.21155, "r": 170.58919, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 208.44701, "t": 230.21155, "r": 216.78575000000004, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "96", "bbox": {"l": 208.44701, "t": 230.21155, "r": 216.78575000000004, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 234.77235, "t": 230.21155, "r": 237.80299000000002, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "-", "bbox": {"l": 234.77235, "t": 230.21155, "r": 237.80299000000002, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 256.49792, "t": 230.21155, "r": 264.83667, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "42", "bbox": {"l": 256.49792, "t": 230.21155, "r": 264.83667, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 154.629, "t": 241.16956000000005, "r": 171.2796, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "total", "bbox": {"l": 154.629, "t": 241.16956000000005, "r": 171.2796, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 208.44701, "t": 241.16956000000005, "r": 216.78575000000004, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "93", "bbox": {"l": 208.44701, "t": 241.16956000000005, "r": 216.78575000000004, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 232.1183, "t": 241.16956000000005, "r": 240.45705, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "34", "bbox": {"l": 232.1183, "t": 241.16956000000005, "r": 240.45705, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 256.49792, "t": 241.16956000000005, "r": 264.83667, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "30", "bbox": {"l": 256.49792, "t": 241.16956000000005, "r": 264.83667, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 78.530998, "t": 263.48650999999995, "r": 131.19963, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "DocBank (DB)", "bbox": {"l": 78.530998, "t": 263.48650999999995, "r": 131.19963, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 154.629, "t": 252.52752999999996, "r": 177.92371, "b": 260.90216, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "Figure", "bbox": {"l": 154.629, "t": 252.52752999999996, "r": 177.92371, "b": 260.90216, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 208.44701, "t": 252.52752999999996, "r": 216.78575000000004, "b": 260.90216, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "77", "bbox": {"l": 208.44701, "t": 252.52752999999996, "r": 216.78575000000004, "b": 260.90216, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 232.1183, "t": 252.52752999999996, "r": 240.45705, "b": 260.90216, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "71", "bbox": {"l": 232.1183, "t": 252.52752999999996, "r": 240.45705, "b": 260.90216, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 256.49792, "t": 252.52752999999996, "r": 264.83667, "b": 260.90216, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "31", "bbox": {"l": 256.49792, "t": 252.52752999999996, "r": 264.83667, "b": 260.90216, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 154.629, "t": 263.48650999999995, "r": 174.43578, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "Table", "bbox": {"l": 154.629, "t": 263.48650999999995, "r": 174.43578, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 208.44701, "t": 263.48650999999995, "r": 216.78575000000004, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "19", "bbox": {"l": 208.44701, "t": 263.48650999999995, "r": 216.78575000000004, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 232.1183, "t": 263.48650999999995, "r": 240.45705, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "65", "bbox": {"l": 232.1183, "t": 263.48650999999995, "r": 240.45705, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 256.49792, "t": 263.48650999999995, "r": 264.83667, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "22", "bbox": {"l": 256.49792, "t": 263.48650999999995, "r": 264.83667, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 154.629, "t": 274.44556, "r": 171.2796, "b": 282.82016, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "total", "bbox": {"l": 154.629, "t": 274.44556, "r": 171.2796, "b": 282.82016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 208.44701, "t": 274.44556, "r": 216.78575000000004, "b": 282.82016, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "48", "bbox": {"l": 208.44701, "t": 274.44556, "r": 216.78575000000004, "b": 282.82016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 232.1183, "t": 274.44556, "r": 240.45705, "b": 282.82016, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "68", "bbox": {"l": 232.1183, "t": 274.44556, "r": 240.45705, "b": 282.82016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 256.49792, "t": 274.44556, "r": 264.83667, "b": 282.82016, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "27", "bbox": {"l": 256.49792, "t": 274.44556, "r": 264.83667, "b": 282.82016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 78.530998, "t": 307.72055, "r": 144.66716, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "DocLayNet (DLN)", "bbox": {"l": 78.530998, "t": 307.72055, "r": 144.66716, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 154.629, "t": 285.80255, "r": 177.92371, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "Figure", "bbox": {"l": 154.629, "t": 285.80255, "r": 177.92371, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 208.44701, "t": 285.80255, "r": 216.78575000000004, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "67", "bbox": {"l": 208.44701, "t": 285.80255, "r": 216.78575000000004, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 232.1183, "t": 285.80255, "r": 240.45705, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "51", "bbox": {"l": 232.1183, "t": 285.80255, "r": 240.45705, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 256.49792, "t": 285.80255, "r": 264.83667, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "72", "bbox": {"l": 256.49792, "t": 285.80255, "r": 264.83667, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 154.629, "t": 296.76154, "r": 194.72675, "b": 305.13617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "Sec-header", "bbox": {"l": 154.629, "t": 296.76154, "r": 194.72675, "b": 305.13617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 208.44701, "t": 296.76154, "r": 216.78575000000004, "b": 305.13617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "53", "bbox": {"l": 208.44701, "t": 296.76154, "r": 216.78575000000004, "b": 305.13617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 234.77235, "t": 296.76154, "r": 237.80299000000002, "b": 305.13617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "-", "bbox": {"l": 234.77235, "t": 296.76154, "r": 237.80299000000002, "b": 305.13617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 256.49792, "t": 296.76154, "r": 264.83667, "b": 305.13617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "68", "bbox": {"l": 256.49792, "t": 296.76154, "r": 264.83667, "b": 305.13617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 154.629, "t": 307.72055, "r": 174.43578, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "Table", "bbox": {"l": 154.629, "t": 307.72055, "r": 174.43578, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 208.44701, "t": 307.72055, "r": 216.78575000000004, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "87", "bbox": {"l": 208.44701, "t": 307.72055, "r": 216.78575000000004, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 232.1183, "t": 307.72055, "r": 240.45705, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "43", "bbox": {"l": 232.1183, "t": 307.72055, "r": 240.45705, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 256.49792, "t": 307.72055, "r": 264.83667, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "82", "bbox": {"l": 256.49792, "t": 307.72055, "r": 264.83667, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 154.629, "t": 318.67953, "r": 170.58919, "b": 327.05417, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "Text", "bbox": {"l": 154.629, "t": 318.67953, "r": 170.58919, "b": 327.05417, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 208.44701, "t": 318.67953, "r": 216.78575000000004, "b": 327.05417, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "77", "bbox": {"l": 208.44701, "t": 318.67953, "r": 216.78575000000004, "b": 327.05417, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 234.77235, "t": 318.67953, "r": 237.80299000000002, "b": 327.05417, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "-", "bbox": {"l": 234.77235, "t": 318.67953, "r": 237.80299000000002, "b": 327.05417, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 256.49792, "t": 318.67953, "r": 264.83667, "b": 327.05417, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "84", "bbox": {"l": 256.49792, "t": 318.67953, "r": 264.83667, "b": 327.05417, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 154.629, "t": 329.63855, "r": 171.2796, "b": 338.01318, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "total", "bbox": {"l": 154.629, "t": 329.63855, "r": 171.2796, "b": 338.01318, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 208.44701, "t": 329.63855, "r": 216.78575000000004, "b": 338.01318, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "59", "bbox": {"l": 208.44701, "t": 329.63855, "r": 216.78575000000004, "b": 338.01318, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 232.1183, "t": 329.63855, "r": 240.45705, "b": 338.01318, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "47", "bbox": {"l": 232.1183, "t": 329.63855, "r": 240.45705, "b": 338.01318, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 256.49792, "t": 329.63855, "r": 264.83667, "b": 338.01318, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "78", "bbox": {"l": 256.49792, "t": 329.63855, "r": 264.83667, "b": 338.01318, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "lcel", "lcel", "nl", "ched", "ched", "ched", "ched", "ched", "nl", "rhed", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl", "rhed", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl", "rhed", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl"], "num_rows": 15, "num_cols": 5, "table_cells": [{"bbox": {"l": 217.74099999999999, "t": 175.01855, "r": 256.26065, "b": 183.39319, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 3, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 5, "text": "Testing on", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 89.954002, "t": 185.97655999999995, "r": 133.24379, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Training on", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 185.97655999999995, "r": 175.47588, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "labels", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 204.69, "t": 185.97655999999995, "r": 220.54260000000002, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "PLN", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 230.50427000000002, "t": 185.97655999999995, "r": 242.06197, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "DB", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 252.02364, "t": 185.97655999999995, "r": 269.31085, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "DLN", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 78.530998, "t": 219.25256000000002, "r": 142.56006, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 5, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PubLayNet (PLN)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 154.629, "t": 197.33452999999997, "r": 177.92371, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Figure", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 197.33452999999997, "r": 216.78575000000004, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 197.33452999999997, "r": 240.45705, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "43", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 197.33452999999997, "r": 264.83667, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "23", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 208.29351999999994, "r": 194.72675, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Sec-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 208.29351999999994, "r": 216.78575000000004, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "87", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 234.77235, "t": 208.29351999999994, "r": 237.80299000000002, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 208.29351999999994, "r": 264.83667, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "32", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 219.25256000000002, "r": 174.43578, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 219.25256000000002, "r": 216.78575000000004, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "95", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 219.25256000000002, "r": 240.45705, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "24", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 219.25256000000002, "r": 264.83667, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "49", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 230.21155, "r": 170.58919, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Text", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 230.21155, "r": 216.78575000000004, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 234.77235, "t": 230.21155, "r": 237.80299000000002, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 230.21155, "r": 264.83667, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "42", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 241.16956000000005, "r": 171.2796, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "total", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 241.16956000000005, "r": 216.78575000000004, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "93", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 241.16956000000005, "r": 240.45705, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "34", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 241.16956000000005, "r": 264.83667, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "30", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 78.530998, "t": 263.48650999999995, "r": 131.19963, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "row_span": 3, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "DocBank (DB)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 154.629, "t": 252.52752999999996, "r": 177.92371, "b": 260.90216, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Figure", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 252.52752999999996, "r": 216.78575000000004, "b": 260.90216, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 252.52752999999996, "r": 240.45705, "b": 260.90216, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "71", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 252.52752999999996, "r": 264.83667, "b": 260.90216, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "31", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 263.48650999999995, "r": 174.43578, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 263.48650999999995, "r": 216.78575000000004, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "19", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 263.48650999999995, "r": 240.45705, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "65", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 263.48650999999995, "r": 264.83667, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "22", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 274.44556, "r": 171.2796, "b": 282.82016, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "total", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 274.44556, "r": 216.78575000000004, "b": 282.82016, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "48", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 274.44556, "r": 240.45705, "b": 282.82016, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 274.44556, "r": 264.83667, "b": 282.82016, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "27", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 78.530998, "t": 307.72055, "r": 144.66716, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "row_span": 5, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 15, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "DocLayNet (DLN)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 154.629, "t": 285.80255, "r": 177.92371, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Figure", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 285.80255, "r": 216.78575000000004, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "67", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 285.80255, "r": 240.45705, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "51", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 285.80255, "r": 264.83667, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 296.76154, "r": 194.72675, "b": 305.13617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Sec-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 296.76154, "r": 216.78575000000004, "b": 305.13617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "53", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 234.77235, "t": 296.76154, "r": 237.80299000000002, "b": 305.13617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 296.76154, "r": 264.83667, "b": 305.13617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 307.72055, "r": 174.43578, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 307.72055, "r": 216.78575000000004, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "87", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 307.72055, "r": 240.45705, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "43", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 307.72055, "r": 264.83667, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 318.67953, "r": 170.58919, "b": 327.05417, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Text", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 318.67953, "r": 216.78575000000004, "b": 327.05417, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 234.77235, "t": 318.67953, "r": 237.80299000000002, "b": 327.05417, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 318.67953, "r": 264.83667, "b": 327.05417, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 329.63855, "r": 171.2796, "b": 338.01318, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 14, "end_row_offset_idx": 15, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "total", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 329.63855, "r": 216.78575000000004, "b": 338.01318, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 14, "end_row_offset_idx": 15, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "59", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 329.63855, "r": 240.45705, "b": 338.01318, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 14, "end_row_offset_idx": 15, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "47", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 329.63855, "r": 264.83667, "b": 338.01318, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 14, "end_row_offset_idx": 15, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "78", "column_header": false, "row_header": false, "row_section": false}]}}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_header", "id": 24, "page_no": 7, "cluster": {"id": 24, "label": "page_header", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.7984216809272766, "cells": [{"id": 0, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 246.24382, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar", "bbox": {"l": 253.13897999999998, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "KDD '22, August 14-18, 2022, Washington, DC, USA Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar"}, {"label": "text", "id": 5, "page_no": 7, "cluster": {"id": 5, "label": "text", "bbox": {"l": 53.501999, "t": 86.87292000000002, "r": 295.64868, "b": 150.14111000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9824112057685852, "cells": [{"id": 2, "text": "Table 5: Prediction Performance (mAP@0.5-0.95) of a Mask", "bbox": {"l": 53.501999, "t": 86.87292000000002, "r": 294.32153, "b": 95.34618999999998, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "R-CNN R50 network across the PubLayNet, DocBank & Do-", "bbox": {"l": 53.79800000000001, "t": 97.83191, "r": 295.64868, "b": 106.30517999999995, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "cLayNet data-sets. By evaluating on common label classes of", "bbox": {"l": 53.79800000000001, "t": 108.79088999999999, "r": 294.0437, "b": 117.26415999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "each dataset, we observe that the DocLayNet-trained model", "bbox": {"l": 53.79800000000001, "t": 119.74987999999996, "r": 294.04373, "b": 128.22313999999994, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "has much less pronounced variations in performance across", "bbox": {"l": 53.79800000000001, "t": 130.70885999999996, "r": 294.0437, "b": 139.18213000000003, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "all datasets.", "bbox": {"l": 53.79800000000001, "t": 141.66785000000004, "r": 101.15852, "b": 150.14111000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 5: Prediction Performance (mAP@0.5-0.95) of a Mask R-CNN R50 network across the PubLayNet, DocBank & DocLayNet data-sets. By evaluating on common label classes of each dataset, we observe that the DocLayNet-trained model has much less pronounced variations in performance across all datasets."}, {"label": "table", "id": 0, "page_no": 7, "cluster": {"id": 0, "label": "table", "bbox": {"l": 72.6590347290039, "t": 172.48080444335938, "r": 274.83465576171875, "b": 339.8540344238281, "coord_origin": "TOPLEFT"}, "confidence": 0.9892616271972656, "cells": [{"id": 8, "text": "Testing on", "bbox": {"l": 217.74099999999999, "t": 175.01855, "r": 256.26065, "b": 183.39319, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Training on", "bbox": {"l": 89.954002, "t": 185.97655999999995, "r": 133.24379, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "labels", "bbox": {"l": 154.629, "t": 185.97655999999995, "r": 175.47588, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "PLN", "bbox": {"l": 204.69, "t": 185.97655999999995, "r": 220.54260000000002, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "DB", "bbox": {"l": 230.50427000000002, "t": 185.97655999999995, "r": 242.06197, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "DLN", "bbox": {"l": 252.02364, "t": 185.97655999999995, "r": 269.31085, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "PubLayNet (PLN)", "bbox": {"l": 78.530998, "t": 219.25256000000002, "r": 142.56006, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Figure", "bbox": {"l": 154.629, "t": 197.33452999999997, "r": 177.92371, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "96", "bbox": {"l": 208.44701, "t": 197.33452999999997, "r": 216.78575000000004, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "43", "bbox": {"l": 232.1183, "t": 197.33452999999997, "r": 240.45705, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "23", "bbox": {"l": 256.49792, "t": 197.33452999999997, "r": 264.83667, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Sec-header", "bbox": {"l": 154.629, "t": 208.29351999999994, "r": 194.72675, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "87", "bbox": {"l": 208.44701, "t": 208.29351999999994, "r": 216.78575000000004, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "-", "bbox": {"l": 234.77235, "t": 208.29351999999994, "r": 237.80299000000002, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "32", "bbox": {"l": 256.49792, "t": 208.29351999999994, "r": 264.83667, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Table", "bbox": {"l": 154.629, "t": 219.25256000000002, "r": 174.43578, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "95", "bbox": {"l": 208.44701, "t": 219.25256000000002, "r": 216.78575000000004, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "24", "bbox": {"l": 232.1183, "t": 219.25256000000002, "r": 240.45705, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "49", "bbox": {"l": 256.49792, "t": 219.25256000000002, "r": 264.83667, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Text", "bbox": {"l": 154.629, "t": 230.21155, "r": 170.58919, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "96", "bbox": {"l": 208.44701, "t": 230.21155, "r": 216.78575000000004, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "-", "bbox": {"l": 234.77235, "t": 230.21155, "r": 237.80299000000002, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "42", "bbox": {"l": 256.49792, "t": 230.21155, "r": 264.83667, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "total", "bbox": {"l": 154.629, "t": 241.16956000000005, "r": 171.2796, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "93", "bbox": {"l": 208.44701, "t": 241.16956000000005, "r": 216.78575000000004, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "34", "bbox": {"l": 232.1183, "t": 241.16956000000005, "r": 240.45705, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "30", "bbox": {"l": 256.49792, "t": 241.16956000000005, "r": 264.83667, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "DocBank (DB)", "bbox": {"l": 78.530998, "t": 263.48650999999995, "r": 131.19963, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Figure", "bbox": {"l": 154.629, "t": 252.52752999999996, "r": 177.92371, "b": 260.90216, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "77", "bbox": {"l": 208.44701, "t": 252.52752999999996, "r": 216.78575000000004, "b": 260.90216, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "71", "bbox": {"l": 232.1183, "t": 252.52752999999996, "r": 240.45705, "b": 260.90216, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "31", "bbox": {"l": 256.49792, "t": 252.52752999999996, "r": 264.83667, "b": 260.90216, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "Table", "bbox": {"l": 154.629, "t": 263.48650999999995, "r": 174.43578, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "19", "bbox": {"l": 208.44701, "t": 263.48650999999995, "r": 216.78575000000004, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "65", "bbox": {"l": 232.1183, "t": 263.48650999999995, "r": 240.45705, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "22", "bbox": {"l": 256.49792, "t": 263.48650999999995, "r": 264.83667, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "total", "bbox": {"l": 154.629, "t": 274.44556, "r": 171.2796, "b": 282.82016, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "48", "bbox": {"l": 208.44701, "t": 274.44556, "r": 216.78575000000004, "b": 282.82016, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "68", "bbox": {"l": 232.1183, "t": 274.44556, "r": 240.45705, "b": 282.82016, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "27", "bbox": {"l": 256.49792, "t": 274.44556, "r": 264.83667, "b": 282.82016, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "DocLayNet (DLN)", "bbox": {"l": 78.530998, "t": 307.72055, "r": 144.66716, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "Figure", "bbox": {"l": 154.629, "t": 285.80255, "r": 177.92371, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "67", "bbox": {"l": 208.44701, "t": 285.80255, "r": 216.78575000000004, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "51", "bbox": {"l": 232.1183, "t": 285.80255, "r": 240.45705, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "72", "bbox": {"l": 256.49792, "t": 285.80255, "r": 264.83667, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Sec-header", "bbox": {"l": 154.629, "t": 296.76154, "r": 194.72675, "b": 305.13617, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "53", "bbox": {"l": 208.44701, "t": 296.76154, "r": 216.78575000000004, "b": 305.13617, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "-", "bbox": {"l": 234.77235, "t": 296.76154, "r": 237.80299000000002, "b": 305.13617, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "68", "bbox": {"l": 256.49792, "t": 296.76154, "r": 264.83667, "b": 305.13617, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Table", "bbox": {"l": 154.629, "t": 307.72055, "r": 174.43578, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "87", "bbox": {"l": 208.44701, "t": 307.72055, "r": 216.78575000000004, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "43", "bbox": {"l": 232.1183, "t": 307.72055, "r": 240.45705, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "82", "bbox": {"l": 256.49792, "t": 307.72055, "r": 264.83667, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "Text", "bbox": {"l": 154.629, "t": 318.67953, "r": 170.58919, "b": 327.05417, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "77", "bbox": {"l": 208.44701, "t": 318.67953, "r": 216.78575000000004, "b": 327.05417, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "-", "bbox": {"l": 234.77235, "t": 318.67953, "r": 237.80299000000002, "b": 327.05417, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "84", "bbox": {"l": 256.49792, "t": 318.67953, "r": 264.83667, "b": 327.05417, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "total", "bbox": {"l": 154.629, "t": 329.63855, "r": 171.2796, "b": 338.01318, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "59", "bbox": {"l": 208.44701, "t": 329.63855, "r": 216.78575000000004, "b": 338.01318, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "47", "bbox": {"l": 232.1183, "t": 329.63855, "r": 240.45705, "b": 338.01318, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "78", "bbox": {"l": 256.49792, "t": 329.63855, "r": 264.83667, "b": 338.01318, "coord_origin": "TOPLEFT"}}], "children": [{"id": 25, "label": "text", "bbox": {"l": 217.74099999999999, "t": 175.01855, "r": 256.26065, "b": 183.39319, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "Testing on", "bbox": {"l": 217.74099999999999, "t": 175.01855, "r": 256.26065, "b": 183.39319, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 89.954002, "t": 185.97655999999995, "r": 133.24379, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "Training on", "bbox": {"l": 89.954002, "t": 185.97655999999995, "r": 133.24379, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 154.629, "t": 185.97655999999995, "r": 175.47588, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "labels", "bbox": {"l": 154.629, "t": 185.97655999999995, "r": 175.47588, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 204.69, "t": 185.97655999999995, "r": 220.54260000000002, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "PLN", "bbox": {"l": 204.69, "t": 185.97655999999995, "r": 220.54260000000002, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 230.50427000000002, "t": 185.97655999999995, "r": 242.06197, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "DB", "bbox": {"l": 230.50427000000002, "t": 185.97655999999995, "r": 242.06197, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 252.02364, "t": 185.97655999999995, "r": 269.31085, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "DLN", "bbox": {"l": 252.02364, "t": 185.97655999999995, "r": 269.31085, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 78.530998, "t": 219.25256000000002, "r": 142.56006, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "PubLayNet (PLN)", "bbox": {"l": 78.530998, "t": 219.25256000000002, "r": 142.56006, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 154.629, "t": 197.33452999999997, "r": 177.92371, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "Figure", "bbox": {"l": 154.629, "t": 197.33452999999997, "r": 177.92371, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 208.44701, "t": 197.33452999999997, "r": 216.78575000000004, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "96", "bbox": {"l": 208.44701, "t": 197.33452999999997, "r": 216.78575000000004, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 232.1183, "t": 197.33452999999997, "r": 240.45705, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "43", "bbox": {"l": 232.1183, "t": 197.33452999999997, "r": 240.45705, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 256.49792, "t": 197.33452999999997, "r": 264.83667, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "23", "bbox": {"l": 256.49792, "t": 197.33452999999997, "r": 264.83667, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 154.629, "t": 208.29351999999994, "r": 194.72675, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "Sec-header", "bbox": {"l": 154.629, "t": 208.29351999999994, "r": 194.72675, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 208.44701, "t": 208.29351999999994, "r": 216.78575000000004, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "87", "bbox": {"l": 208.44701, "t": 208.29351999999994, "r": 216.78575000000004, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 234.77235, "t": 208.29351999999994, "r": 237.80299000000002, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "-", "bbox": {"l": 234.77235, "t": 208.29351999999994, "r": 237.80299000000002, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 256.49792, "t": 208.29351999999994, "r": 264.83667, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "32", "bbox": {"l": 256.49792, "t": 208.29351999999994, "r": 264.83667, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 154.629, "t": 219.25256000000002, "r": 174.43578, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "Table", "bbox": {"l": 154.629, "t": 219.25256000000002, "r": 174.43578, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 208.44701, "t": 219.25256000000002, "r": 216.78575000000004, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "95", "bbox": {"l": 208.44701, "t": 219.25256000000002, "r": 216.78575000000004, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 232.1183, "t": 219.25256000000002, "r": 240.45705, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "24", "bbox": {"l": 232.1183, "t": 219.25256000000002, "r": 240.45705, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 256.49792, "t": 219.25256000000002, "r": 264.83667, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "49", "bbox": {"l": 256.49792, "t": 219.25256000000002, "r": 264.83667, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 154.629, "t": 230.21155, "r": 170.58919, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "Text", "bbox": {"l": 154.629, "t": 230.21155, "r": 170.58919, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 208.44701, "t": 230.21155, "r": 216.78575000000004, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "96", "bbox": {"l": 208.44701, "t": 230.21155, "r": 216.78575000000004, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 234.77235, "t": 230.21155, "r": 237.80299000000002, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "-", "bbox": {"l": 234.77235, "t": 230.21155, "r": 237.80299000000002, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 256.49792, "t": 230.21155, "r": 264.83667, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "42", "bbox": {"l": 256.49792, "t": 230.21155, "r": 264.83667, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 154.629, "t": 241.16956000000005, "r": 171.2796, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "total", "bbox": {"l": 154.629, "t": 241.16956000000005, "r": 171.2796, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 208.44701, "t": 241.16956000000005, "r": 216.78575000000004, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "93", "bbox": {"l": 208.44701, "t": 241.16956000000005, "r": 216.78575000000004, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 232.1183, "t": 241.16956000000005, "r": 240.45705, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "34", "bbox": {"l": 232.1183, "t": 241.16956000000005, "r": 240.45705, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 256.49792, "t": 241.16956000000005, "r": 264.83667, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "30", "bbox": {"l": 256.49792, "t": 241.16956000000005, "r": 264.83667, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 78.530998, "t": 263.48650999999995, "r": 131.19963, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "DocBank (DB)", "bbox": {"l": 78.530998, "t": 263.48650999999995, "r": 131.19963, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 154.629, "t": 252.52752999999996, "r": 177.92371, "b": 260.90216, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "Figure", "bbox": {"l": 154.629, "t": 252.52752999999996, "r": 177.92371, "b": 260.90216, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 208.44701, "t": 252.52752999999996, "r": 216.78575000000004, "b": 260.90216, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "77", "bbox": {"l": 208.44701, "t": 252.52752999999996, "r": 216.78575000000004, "b": 260.90216, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 232.1183, "t": 252.52752999999996, "r": 240.45705, "b": 260.90216, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "71", "bbox": {"l": 232.1183, "t": 252.52752999999996, "r": 240.45705, "b": 260.90216, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 256.49792, "t": 252.52752999999996, "r": 264.83667, "b": 260.90216, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "31", "bbox": {"l": 256.49792, "t": 252.52752999999996, "r": 264.83667, "b": 260.90216, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 154.629, "t": 263.48650999999995, "r": 174.43578, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "Table", "bbox": {"l": 154.629, "t": 263.48650999999995, "r": 174.43578, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 208.44701, "t": 263.48650999999995, "r": 216.78575000000004, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "19", "bbox": {"l": 208.44701, "t": 263.48650999999995, "r": 216.78575000000004, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 232.1183, "t": 263.48650999999995, "r": 240.45705, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "65", "bbox": {"l": 232.1183, "t": 263.48650999999995, "r": 240.45705, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 256.49792, "t": 263.48650999999995, "r": 264.83667, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "22", "bbox": {"l": 256.49792, "t": 263.48650999999995, "r": 264.83667, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 154.629, "t": 274.44556, "r": 171.2796, "b": 282.82016, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "total", "bbox": {"l": 154.629, "t": 274.44556, "r": 171.2796, "b": 282.82016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 208.44701, "t": 274.44556, "r": 216.78575000000004, "b": 282.82016, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "48", "bbox": {"l": 208.44701, "t": 274.44556, "r": 216.78575000000004, "b": 282.82016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 232.1183, "t": 274.44556, "r": 240.45705, "b": 282.82016, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "68", "bbox": {"l": 232.1183, "t": 274.44556, "r": 240.45705, "b": 282.82016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 256.49792, "t": 274.44556, "r": 264.83667, "b": 282.82016, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "27", "bbox": {"l": 256.49792, "t": 274.44556, "r": 264.83667, "b": 282.82016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 78.530998, "t": 307.72055, "r": 144.66716, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "DocLayNet (DLN)", "bbox": {"l": 78.530998, "t": 307.72055, "r": 144.66716, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 154.629, "t": 285.80255, "r": 177.92371, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "Figure", "bbox": {"l": 154.629, "t": 285.80255, "r": 177.92371, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 208.44701, "t": 285.80255, "r": 216.78575000000004, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "67", "bbox": {"l": 208.44701, "t": 285.80255, "r": 216.78575000000004, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 232.1183, "t": 285.80255, "r": 240.45705, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "51", "bbox": {"l": 232.1183, "t": 285.80255, "r": 240.45705, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 256.49792, "t": 285.80255, "r": 264.83667, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "72", "bbox": {"l": 256.49792, "t": 285.80255, "r": 264.83667, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 154.629, "t": 296.76154, "r": 194.72675, "b": 305.13617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "Sec-header", "bbox": {"l": 154.629, "t": 296.76154, "r": 194.72675, "b": 305.13617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 208.44701, "t": 296.76154, "r": 216.78575000000004, "b": 305.13617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "53", "bbox": {"l": 208.44701, "t": 296.76154, "r": 216.78575000000004, "b": 305.13617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 234.77235, "t": 296.76154, "r": 237.80299000000002, "b": 305.13617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "-", "bbox": {"l": 234.77235, "t": 296.76154, "r": 237.80299000000002, "b": 305.13617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 256.49792, "t": 296.76154, "r": 264.83667, "b": 305.13617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "68", "bbox": {"l": 256.49792, "t": 296.76154, "r": 264.83667, "b": 305.13617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 154.629, "t": 307.72055, "r": 174.43578, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "Table", "bbox": {"l": 154.629, "t": 307.72055, "r": 174.43578, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 208.44701, "t": 307.72055, "r": 216.78575000000004, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "87", "bbox": {"l": 208.44701, "t": 307.72055, "r": 216.78575000000004, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 232.1183, "t": 307.72055, "r": 240.45705, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "43", "bbox": {"l": 232.1183, "t": 307.72055, "r": 240.45705, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 256.49792, "t": 307.72055, "r": 264.83667, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "82", "bbox": {"l": 256.49792, "t": 307.72055, "r": 264.83667, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 154.629, "t": 318.67953, "r": 170.58919, "b": 327.05417, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "Text", "bbox": {"l": 154.629, "t": 318.67953, "r": 170.58919, "b": 327.05417, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 208.44701, "t": 318.67953, "r": 216.78575000000004, "b": 327.05417, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "77", "bbox": {"l": 208.44701, "t": 318.67953, "r": 216.78575000000004, "b": 327.05417, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 234.77235, "t": 318.67953, "r": 237.80299000000002, "b": 327.05417, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "-", "bbox": {"l": 234.77235, "t": 318.67953, "r": 237.80299000000002, "b": 327.05417, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 256.49792, "t": 318.67953, "r": 264.83667, "b": 327.05417, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "84", "bbox": {"l": 256.49792, "t": 318.67953, "r": 264.83667, "b": 327.05417, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 154.629, "t": 329.63855, "r": 171.2796, "b": 338.01318, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "total", "bbox": {"l": 154.629, "t": 329.63855, "r": 171.2796, "b": 338.01318, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 208.44701, "t": 329.63855, "r": 216.78575000000004, "b": 338.01318, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "59", "bbox": {"l": 208.44701, "t": 329.63855, "r": 216.78575000000004, "b": 338.01318, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 232.1183, "t": 329.63855, "r": 240.45705, "b": 338.01318, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "47", "bbox": {"l": 232.1183, "t": 329.63855, "r": 240.45705, "b": 338.01318, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 256.49792, "t": 329.63855, "r": 264.83667, "b": 338.01318, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "78", "bbox": {"l": 256.49792, "t": 329.63855, "r": 264.83667, "b": 338.01318, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "lcel", "lcel", "nl", "ched", "ched", "ched", "ched", "ched", "nl", "rhed", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl", "rhed", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl", "rhed", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl"], "num_rows": 15, "num_cols": 5, "table_cells": [{"bbox": {"l": 217.74099999999999, "t": 175.01855, "r": 256.26065, "b": 183.39319, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 3, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 5, "text": "Testing on", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 89.954002, "t": 185.97655999999995, "r": 133.24379, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Training on", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 185.97655999999995, "r": 175.47588, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "labels", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 204.69, "t": 185.97655999999995, "r": 220.54260000000002, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "PLN", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 230.50427000000002, "t": 185.97655999999995, "r": 242.06197, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "DB", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 252.02364, "t": 185.97655999999995, "r": 269.31085, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "DLN", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 78.530998, "t": 219.25256000000002, "r": 142.56006, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 5, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PubLayNet (PLN)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 154.629, "t": 197.33452999999997, "r": 177.92371, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Figure", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 197.33452999999997, "r": 216.78575000000004, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 197.33452999999997, "r": 240.45705, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "43", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 197.33452999999997, "r": 264.83667, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "23", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 208.29351999999994, "r": 194.72675, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Sec-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 208.29351999999994, "r": 216.78575000000004, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "87", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 234.77235, "t": 208.29351999999994, "r": 237.80299000000002, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 208.29351999999994, "r": 264.83667, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "32", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 219.25256000000002, "r": 174.43578, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 219.25256000000002, "r": 216.78575000000004, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "95", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 219.25256000000002, "r": 240.45705, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "24", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 219.25256000000002, "r": 264.83667, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "49", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 230.21155, "r": 170.58919, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Text", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 230.21155, "r": 216.78575000000004, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 234.77235, "t": 230.21155, "r": 237.80299000000002, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 230.21155, "r": 264.83667, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "42", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 241.16956000000005, "r": 171.2796, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "total", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 241.16956000000005, "r": 216.78575000000004, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "93", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 241.16956000000005, "r": 240.45705, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "34", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 241.16956000000005, "r": 264.83667, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "30", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 78.530998, "t": 263.48650999999995, "r": 131.19963, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "row_span": 3, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "DocBank (DB)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 154.629, "t": 252.52752999999996, "r": 177.92371, "b": 260.90216, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Figure", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 252.52752999999996, "r": 216.78575000000004, "b": 260.90216, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 252.52752999999996, "r": 240.45705, "b": 260.90216, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "71", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 252.52752999999996, "r": 264.83667, "b": 260.90216, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "31", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 263.48650999999995, "r": 174.43578, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 263.48650999999995, "r": 216.78575000000004, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "19", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 263.48650999999995, "r": 240.45705, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "65", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 263.48650999999995, "r": 264.83667, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "22", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 274.44556, "r": 171.2796, "b": 282.82016, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "total", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 274.44556, "r": 216.78575000000004, "b": 282.82016, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "48", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 274.44556, "r": 240.45705, "b": 282.82016, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 274.44556, "r": 264.83667, "b": 282.82016, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "27", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 78.530998, "t": 307.72055, "r": 144.66716, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "row_span": 5, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 15, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "DocLayNet (DLN)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 154.629, "t": 285.80255, "r": 177.92371, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Figure", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 285.80255, "r": 216.78575000000004, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "67", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 285.80255, "r": 240.45705, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "51", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 285.80255, "r": 264.83667, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 296.76154, "r": 194.72675, "b": 305.13617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Sec-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 296.76154, "r": 216.78575000000004, "b": 305.13617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "53", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 234.77235, "t": 296.76154, "r": 237.80299000000002, "b": 305.13617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 296.76154, "r": 264.83667, "b": 305.13617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 307.72055, "r": 174.43578, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 307.72055, "r": 216.78575000000004, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "87", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 307.72055, "r": 240.45705, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "43", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 307.72055, "r": 264.83667, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 318.67953, "r": 170.58919, "b": 327.05417, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Text", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 318.67953, "r": 216.78575000000004, "b": 327.05417, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 234.77235, "t": 318.67953, "r": 237.80299000000002, "b": 327.05417, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 318.67953, "r": 264.83667, "b": 327.05417, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 329.63855, "r": 171.2796, "b": 338.01318, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 14, "end_row_offset_idx": 15, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "total", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 329.63855, "r": 216.78575000000004, "b": 338.01318, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 14, "end_row_offset_idx": 15, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "59", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 329.63855, "r": 240.45705, "b": 338.01318, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 14, "end_row_offset_idx": 15, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "47", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 329.63855, "r": 264.83667, "b": 338.01318, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 14, "end_row_offset_idx": 15, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "78", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "text", "id": 4, "page_no": 7, "cluster": {"id": 4, "label": "text", "bbox": {"l": 53.79800000000001, "t": 390.92053, "r": 294.04712, "b": 443.14014, "coord_origin": "TOPLEFT"}, "confidence": 0.9839397668838501, "cells": [{"id": 69, "text": "Section-header", "bbox": {"l": 53.79800000000001, "t": 390.96539, "r": 106.2392, "b": 399.30414, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": ",", "bbox": {"l": 106.239, "t": 390.92053, "r": 108.23331, "b": 399.2951699999999, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Table", "bbox": {"l": 110.482, "t": 390.96539, "r": 129.76332, "b": 399.30414, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "and", "bbox": {"l": 132.21899, "t": 390.92053, "r": 145.86186, "b": 399.2951699999999, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "Text", "bbox": {"l": 148.112, "t": 390.96539, "r": 163.14182, "b": 399.30414, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": ". Before training, we either mapped", "bbox": {"l": 163.13901, "t": 390.92053, "r": 294.04709, "b": 399.2951699999999, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "or excluded DocLayNet\u2019s other labels as specified in table 3, and", "bbox": {"l": 53.79800000000001, "t": 401.87954999999994, "r": 294.04712, "b": 410.25418, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "also PubLayNet\u2019s", "bbox": {"l": 53.79800000000001, "t": 412.83853, "r": 117.12856, "b": 421.21317, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "List", "bbox": {"l": 119.362, "t": 412.88339, "r": 132.4342, "b": 421.22214, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "to", "bbox": {"l": 135.177, "t": 412.83853, "r": 142.54416, "b": 421.21317, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "Text", "bbox": {"l": 144.77901, "t": 412.88339, "r": 159.66605, "b": 421.22214, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": ". Note that the different clustering of", "bbox": {"l": 159.66701, "t": 412.83853, "r": 294.04562, "b": 421.21317, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "lists (by list-element vs. whole list objects) naturally decreases the", "bbox": {"l": 53.79800000000001, "t": 423.79755, "r": 294.04614, "b": 432.17217999999997, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "mAP score for", "bbox": {"l": 53.79800000000001, "t": 434.75653, "r": 106.2066, "b": 443.13116, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "Text", "bbox": {"l": 108.448, "t": 434.80139, "r": 123.30533, "b": 443.14014, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": ".", "bbox": {"l": 123.305, "t": 434.75653, "r": 125.27761000000001, "b": 443.13116, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Section-header , Table and Text . Before training, we either mapped or excluded DocLayNet's other labels as specified in table 3, and also PubLayNet's List to Text . Note that the different clustering of lists (by list-element vs. whole list objects) naturally decreases the mAP score for Text ."}, {"label": "text", "id": 1, "page_no": 7, "cluster": {"id": 1, "label": "text", "bbox": {"l": 53.466999, "t": 445.71453999999994, "r": 295.55908, "b": 585.59618, "coord_origin": "TOPLEFT"}, "confidence": 0.9868056774139404, "cells": [{"id": 85, "text": "For comparison of DocBank with DocLayNet, we trained only", "bbox": {"l": 63.76100199999999, "t": 445.71453999999994, "r": 294.27582, "b": 454.08917, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "on", "bbox": {"l": 53.79800000000001, "t": 456.67355, "r": 62.989277, "b": 465.04819, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Picture", "bbox": {"l": 64.852997, "t": 456.71841, "r": 88.947144, "b": 465.05716, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "and", "bbox": {"l": 91.019997, "t": 456.67355, "r": 104.24454, "b": 465.04819, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "Table", "bbox": {"l": 106.108, "t": 456.71841, "r": 124.78053, "b": 465.05716, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "clusters of each dataset. We had to exclude", "bbox": {"l": 126.85500000000002, "t": 456.67355, "r": 277.63235, "b": 465.04819, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "Text", "bbox": {"l": 279.49701, "t": 456.71841, "r": 294.0484, "b": 465.05716, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "because successive paragraphs are often grouped together into a", "bbox": {"l": 53.79800000000001, "t": 467.63254, "r": 294.04709, "b": 476.00717, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "single object in DocBank. This paragraph grouping is incompatible", "bbox": {"l": 53.79800000000001, "t": 478.59155, "r": 294.04532, "b": 486.96619, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "with the individual paragraphs of DocLayNet. As can be seen in", "bbox": {"l": 53.466999, "t": 489.55054, "r": 294.04538, "b": 497.92517, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "Table 5, DocLayNet trained models yield better performance com-", "bbox": {"l": 53.528999, "t": 500.50955, "r": 295.55908, "b": 508.88419, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "pared to the previous datasets. It is noteworthy that the models", "bbox": {"l": 53.79800000000001, "t": 511.46854, "r": 294.04712, "b": 519.84317, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "trained on PubLayNet and DocBank perform very well on their", "bbox": {"l": 53.79800000000001, "t": 522.42755, "r": 294.21179, "b": 530.80219, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "own test set, but have a much lower performance on the foreign", "bbox": {"l": 53.79800000000001, "t": 533.38654, "r": 294.04712, "b": 541.76117, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "datasets. While this also applies to DocLayNet, the difference is", "bbox": {"l": 53.79800000000001, "t": 544.34555, "r": 294.04715, "b": 552.72017, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "far less pronounced. Thus we conclude that DocLayNet trained", "bbox": {"l": 53.79800000000001, "t": 555.3045500000001, "r": 294.04712, "b": 563.67917, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "models are overall more robust and will produce better results for", "bbox": {"l": 53.79800000000001, "t": 566.26256, "r": 294.21411, "b": 574.63718, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "challenging, unseen layouts.", "bbox": {"l": 53.79800000000001, "t": 577.22156, "r": 157.52132, "b": 585.59618, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "For comparison of DocBank with DocLayNet, we trained only on Picture and Table clusters of each dataset. We had to exclude Text because successive paragraphs are often grouped together into a single object in DocBank. This paragraph grouping is incompatible with the individual paragraphs of DocLayNet. As can be seen in Table 5, DocLayNet trained models yield better performance compared to the previous datasets. It is noteworthy that the models trained on PubLayNet and DocBank perform very well on their own test set, but have a much lower performance on the foreign datasets. While this also applies to DocLayNet, the difference is far less pronounced. Thus we conclude that DocLayNet trained models are overall more robust and will produce better results for challenging, unseen layouts."}, {"label": "section_header", "id": 8, "page_no": 7, "cluster": {"id": 8, "label": "section_header", "bbox": {"l": 53.79800000000001, "t": 605.06091, "r": 156.00534, "b": 615.37001, "coord_origin": "TOPLEFT"}, "confidence": 0.9574698805809021, "cells": [{"id": 103, "text": "Example Predictions", "bbox": {"l": 53.79800000000001, "t": 605.06091, "r": 156.00534, "b": 615.37001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Example Predictions"}, {"label": "text", "id": 2, "page_no": 7, "cluster": {"id": 2, "label": "text", "bbox": {"l": 53.528999, "t": 620.26355, "r": 295.55844, "b": 705.350174, "coord_origin": "TOPLEFT"}, "confidence": 0.9859886169433594, "cells": [{"id": 104, "text": "To conclude this section, we illustrate the quality of layout predic-", "bbox": {"l": 53.528999, "t": 620.26355, "r": 295.5571, "b": 628.63817, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "tions one can expect from DocLayNet-trained models by providing", "bbox": {"l": 53.79800000000001, "t": 631.22255, "r": 294.04532, "b": 639.59717, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "a selection of examples without any further post-processing ap-", "bbox": {"l": 53.79800000000001, "t": 642.18155, "r": 295.55618, "b": 650.5561700000001, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "plied. Figure 6 shows selected layout predictions on pages from the", "bbox": {"l": 53.79800000000001, "t": 653.14055, "r": 294.04541, "b": 661.51517, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "test-set of DocLayNet. Results look decent in general across docu-", "bbox": {"l": 53.79800000000001, "t": 664.09956, "r": 295.55844, "b": 672.47417, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "ment categories, however one can also observe mistakes such as", "bbox": {"l": 53.79800000000001, "t": 675.05756, "r": 294.04712, "b": 683.43217, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "overlapping clusters of different classes, or entirely missing boxes", "bbox": {"l": 53.79800000000001, "t": 686.01656, "r": 294.04535, "b": 694.391174, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "due to low confidence.", "bbox": {"l": 53.79800000000001, "t": 696.975555, "r": 136.07368, "b": 705.350174, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "To conclude this section, we illustrate the quality of layout predictions one can expect from DocLayNet-trained models by providing a selection of examples without any further post-processing applied. Figure 6 shows selected layout predictions on pages from the test-set of DocLayNet. Results look decent in general across document categories, however one can also observe mistakes such as overlapping clusters of different classes, or entirely missing boxes due to low confidence."}, {"label": "section_header", "id": 13, "page_no": 7, "cluster": {"id": 13, "label": "section_header", "bbox": {"l": 317.95502, "t": 85.85986000000003, "r": 405.72961, "b": 96.16900999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.931998074054718, "cells": [{"id": 112, "text": "6", "bbox": {"l": 317.95502, "t": 85.85986000000003, "r": 323.56229, "b": 96.16900999999996, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "CONCLUSION", "bbox": {"l": 334.47137, "t": 85.85986000000003, "r": 405.72961, "b": 96.16900999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "6 CONCLUSION"}, {"label": "text", "id": 3, "page_no": 7, "cluster": {"id": 3, "label": "text", "bbox": {"l": 317.95499, "t": 101.06151999999997, "r": 559.71375, "b": 186.14917000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.985493004322052, "cells": [{"id": 114, "text": "In this paper, we presented the DocLayNet dataset. It provides the", "bbox": {"l": 317.95499, "t": 101.06151999999997, "r": 558.2038, "b": 109.43615999999997, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "document conversion and layout analysis research community a", "bbox": {"l": 317.95499, "t": 112.02057000000002, "r": 558.2041, "b": 120.39520000000005, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "new and challenging dataset to improve and fine-tune novel ML", "bbox": {"l": 317.95499, "t": 122.97955000000002, "r": 558.43274, "b": 131.35419000000002, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "methods on. In contrast to many other datasets, DocLayNet was", "bbox": {"l": 317.95499, "t": 133.93854, "r": 558.20416, "b": 142.31317, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "created by human annotation in order to obtain reliable layout", "bbox": {"l": 317.95499, "t": 144.89752, "r": 558.20422, "b": 153.27215999999999, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "ground-truth on a wide variety of publication- and typesetting-", "bbox": {"l": 317.95499, "t": 155.85657000000003, "r": 559.71313, "b": 164.23119999999994, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "styles. Including a large proportion of documents outside the scien-", "bbox": {"l": 317.95499, "t": 166.81555000000003, "r": 559.71375, "b": 175.19019000000003, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "tific publishing domain adds significant value in this respect.", "bbox": {"l": 317.95499, "t": 177.77454, "r": 540.04382, "b": 186.14917000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In this paper, we presented the DocLayNet dataset. It provides the document conversion and layout analysis research community a new and challenging dataset to improve and fine-tune novel ML methods on. In contrast to many other datasets, DocLayNet was created by human annotation in order to obtain reliable layout ground-truth on a wide variety of publication- and typesettingstyles. Including a large proportion of documents outside the scientific publishing domain adds significant value in this respect."}, {"label": "text", "id": 6, "page_no": 7, "cluster": {"id": 6, "label": "text", "bbox": {"l": 317.686, "t": 188.73352, "r": 559.71704, "b": 284.77917, "coord_origin": "TOPLEFT"}, "confidence": 0.9800531268119812, "cells": [{"id": 122, "text": "From the dataset, we have derived on the one hand reference", "bbox": {"l": 327.918, "t": 188.73352, "r": 558.19836, "b": 197.10815000000002, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "metrics for human performance on document-layout annotation", "bbox": {"l": 317.95499, "t": 199.69257000000005, "r": 558.20404, "b": 208.06719999999996, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "(through double and triple annotations) and on the other hand eval-", "bbox": {"l": 317.686, "t": 210.65155000000004, "r": 559.71704, "b": 219.02617999999995, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "uated the baseline performance of commonly used object detection", "bbox": {"l": 317.95499, "t": 221.60956, "r": 558.20245, "b": 229.98419, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "methods. We also illustrated the impact of various dataset-related", "bbox": {"l": 317.95499, "t": 232.56853999999998, "r": 558.20502, "b": 240.94317999999998, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "aspects on model performance through data-ablation experiments,", "bbox": {"l": 317.95499, "t": 243.52752999999996, "r": 559.18408, "b": 251.90215999999998, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "both from a size and class-label perspective. Last but not least, we", "bbox": {"l": 317.95499, "t": 254.48650999999995, "r": 558.20227, "b": 262.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "compared the accuracy of models trained on other public datasets", "bbox": {"l": 317.95499, "t": 265.44556, "r": 558.20349, "b": 273.82019, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "and showed that DocLayNet trained models are more robust.", "bbox": {"l": 317.95499, "t": 276.40454, "r": 540.99426, "b": 284.77917, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "From the dataset, we have derived on the one hand reference metrics for human performance on document-layout annotation (through double and triple annotations) and on the other hand evaluated the baseline performance of commonly used object detection methods. We also illustrated the impact of various dataset-related aspects on model performance through data-ablation experiments, both from a size and class-label perspective. Last but not least, we compared the accuracy of models trained on other public datasets and showed that DocLayNet trained models are more robust."}, {"label": "text", "id": 7, "page_no": 7, "cluster": {"id": 7, "label": "text", "bbox": {"l": 317.62299, "t": 287.36353, "r": 558.43469, "b": 317.65616000000006, "coord_origin": "TOPLEFT"}, "confidence": 0.9676101207733154, "cells": [{"id": 131, "text": "To date, there is still a significant gap between human and ML", "bbox": {"l": 327.918, "t": 287.36353, "r": 558.43469, "b": 295.73816, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "accuracy on the layout interpretation task, and we hope that this", "bbox": {"l": 317.95499, "t": 298.32254, "r": 558.20013, "b": 306.69717, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "work will inspire the research community to close that gap.", "bbox": {"l": 317.62299, "t": 309.28152, "r": 535.65015, "b": 317.65616000000006, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "To date, there is still a significant gap between human and ML accuracy on the layout interpretation task, and we hope that this work will inspire the research community to close that gap."}, {"label": "section_header", "id": 11, "page_no": 7, "cluster": {"id": 11, "label": "section_header", "bbox": {"l": 317.95499, "t": 335.09189, "r": 387.3696, "b": 345.40097, "coord_origin": "TOPLEFT"}, "confidence": 0.9378752708435059, "cells": [{"id": 134, "text": "REFERENCES", "bbox": {"l": 317.95499, "t": 335.09189, "r": 387.3696, "b": 345.40097, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "REFERENCES"}, {"label": "list_item", "id": 12, "page_no": 7, "cluster": {"id": 12, "label": "list_item", "bbox": {"l": 321.198, "t": 348.70233, "r": 558.20099, "b": 371.16286999999994, "coord_origin": "TOPLEFT"}, "confidence": 0.9372857213020325, "cells": [{"id": 135, "text": "[1]", "bbox": {"l": 321.198, "t": 348.70233, "r": 329.72415, "b": 355.21588, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "Max G\u00f6bel, Tamir Hassan, Ermelinda Oro, and Giorgio Orsi. Icdar 2013 table", "bbox": {"l": 331.53516, "t": 348.70233, "r": 558.19904, "b": 355.21588, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "competition. In", "bbox": {"l": 333.39099, "t": 356.67236, "r": 379.36414, "b": 363.18591, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "2013 12th International Conference on Document Analysis and", "bbox": {"l": 381.37201, "t": 356.70724, "r": 558.20099, "b": 363.19287, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "Recognition", "bbox": {"l": 333.39099, "t": 364.67724999999996, "r": 365.59601, "b": 371.16286999999994, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": ", pages 1449-1453, 2013.", "bbox": {"l": 365.59601, "t": 364.64236, "r": 434.29489, "b": 371.15591, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[1] Max G\u00f6bel, Tamir Hassan, Ermelinda Oro, and Giorgio Orsi. Icdar 2013 table competition. In 2013 12th International Conference on Document Analysis and Recognition , pages 1449-1453, 2013."}, {"label": "list_item", "id": 9, "page_no": 7, "cluster": {"id": 9, "label": "list_item", "bbox": {"l": 321.198, "t": 372.61237, "r": 559.37982, "b": 403.04287999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9480945467948914, "cells": [{"id": 141, "text": "[2]", "bbox": {"l": 321.198, "t": 372.61237, "r": 329.85956, "b": 379.12592, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "Christian Clausner, Apostolos Antonacopoulos, and Stefan Pletschacher. Ic-", "bbox": {"l": 331.69931, "t": 372.61237, "r": 559.37976, "b": 379.12592, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "dar2017 competition on recognition of documents with complex layouts -", "bbox": {"l": 333.39099, "t": 380.58237, "r": 559.37982, "b": 387.09592, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "rdcl2017. In", "bbox": {"l": 333.39099, "t": 388.55236999999994, "r": 367.4339, "b": 395.06592, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "2017 14th IAPR International Conference on Document Analysis and", "bbox": {"l": 369.17401, "t": 388.58725000000004, "r": 558.20422, "b": 395.07288, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "Recognition (ICDAR)", "bbox": {"l": 333.39099, "t": 396.55725, "r": 390.87601, "b": 403.04287999999997, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": ", volume 01, pages 1404-1410, 2017.", "bbox": {"l": 390.87698, "t": 396.52237, "r": 492.17831, "b": 403.03592, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[2] Christian Clausner, Apostolos Antonacopoulos, and Stefan Pletschacher. Icdar2017 competition on recognition of documents with complex layouts rdcl2017. In 2017 14th IAPR International Conference on Document Analysis and Recognition (ICDAR) , volume 01, pages 1404-1410, 2017."}, {"label": "list_item", "id": 17, "page_no": 7, "cluster": {"id": 17, "label": "list_item", "bbox": {"l": 321.198, "t": 404.49237, "r": 558.20013, "b": 426.94689999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9257517457008362, "cells": [{"id": 148, "text": "[3]", "bbox": {"l": 321.198, "t": 404.49237, "r": 329.53583, "b": 411.00592, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "Herv\u00e9 D\u00e9jean, Jean-Luc Meunier, Liangcai Gao, Yilun Huang, Yu Fang, Florian", "bbox": {"l": 331.30682, "t": 404.49237, "r": 558.19958, "b": 411.00592, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "Kleber, and Eva-Maria Lang. ICDAR 2019 Competition on Table Detection and", "bbox": {"l": 333.39099, "t": 412.46335, "r": 558.20013, "b": 418.9769, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "Recognition (cTDaR), April 2019. http://sac.founderit.com/.", "bbox": {"l": 333.39099, "t": 420.43335, "r": 501.80127, "b": 426.94689999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[3] Herv\u00e9 D\u00e9jean, Jean-Luc Meunier, Liangcai Gao, Yilun Huang, Yu Fang, Florian Kleber, and Eva-Maria Lang. ICDAR 2019 Competition on Table Detection and Recognition (cTDaR), April 2019. http://sac.founderit.com/."}, {"label": "list_item", "id": 16, "page_no": 7, "cluster": {"id": 16, "label": "list_item", "bbox": {"l": 321.198, "t": 428.40335, "r": 559.37872, "b": 458.8269, "coord_origin": "TOPLEFT"}, "confidence": 0.9270977973937988, "cells": [{"id": 152, "text": "[4]", "bbox": {"l": 321.198, "t": 428.40335, "r": 329.91299, "b": 434.9169, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "Antonio Jimeno Yepes, Peter Zhong, and Douglas Burdick. Competition on", "bbox": {"l": 331.7641, "t": 428.40335, "r": 558.19885, "b": 434.9169, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "scientific literature parsing. In", "bbox": {"l": 333.39099, "t": 436.3733500000001, "r": 423.77225, "b": 442.8869, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "Proceedings of the International Conference on", "bbox": {"l": 425.909, "t": 436.40823, "r": 558.20178, "b": 442.89386, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "Document Analysis and Recognition", "bbox": {"l": 333.39099, "t": 444.37823, "r": 429.42697, "b": 450.86386, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": ", ICDAR, pages 605-617. LNCS 12824, Springer-", "bbox": {"l": 429.42400999999995, "t": 444.34335, "r": 559.37872, "b": 450.85689999999994, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "Verlag, sep 2021.", "bbox": {"l": 332.819, "t": 452.31335, "r": 380.01764, "b": 458.8269, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[4] Antonio Jimeno Yepes, Peter Zhong, and Douglas Burdick. Competition on scientific literature parsing. In Proceedings of the International Conference on Document Analysis and Recognition , ICDAR, pages 605-617. LNCS 12824, SpringerVerlag, sep 2021."}, {"label": "list_item", "id": 14, "page_no": 7, "cluster": {"id": 14, "label": "list_item", "bbox": {"l": 321.198, "t": 460.28336, "r": 559.02625, "b": 490.70792, "coord_origin": "TOPLEFT"}, "confidence": 0.9290012121200562, "cells": [{"id": 159, "text": "[5]", "bbox": {"l": 321.198, "t": 460.28336, "r": 329.22977, "b": 466.79691, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "Logan Markewich, Hao Zhang, Yubin Xing, Navid Lambert-Shirzad, Jiang Zhexin,", "bbox": {"l": 330.93576, "t": 460.28336, "r": 558.97156, "b": 466.79691, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "Roy Lee, Zhi Li, and Seok-Bum Ko. Segmentation for document layout analysis:", "bbox": {"l": 333.39099, "t": 468.25336, "r": 559.02625, "b": 474.76691, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "not dead yet.", "bbox": {"l": 333.39099, "t": 476.22437, "r": 368.85431, "b": 482.73792, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "International Journal on Document Analysis and Recognition (IJDAR)", "bbox": {"l": 370.811, "t": 476.25925, "r": 557.46326, "b": 482.74487, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": ",", "bbox": {"l": 557.46503, "t": 476.22437, "r": 558.96857, "b": 482.73792, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "pages 1-11, 01 2022.", "bbox": {"l": 333.39099, "t": 484.19437, "r": 390.82715, "b": 490.70792, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[5] Logan Markewich, Hao Zhang, Yubin Xing, Navid Lambert-Shirzad, Jiang Zhexin, Roy Lee, Zhi Li, and Seok-Bum Ko. Segmentation for document layout analysis: not dead yet. International Journal on Document Analysis and Recognition (IJDAR) , pages 1-11, 01 2022."}, {"label": "list_item", "id": 15, "page_no": 7, "cluster": {"id": 15, "label": "list_item", "bbox": {"l": 321.198, "t": 492.16437, "r": 558.20361, "b": 514.6248800000001, "coord_origin": "TOPLEFT"}, "confidence": 0.927480161190033, "cells": [{"id": 166, "text": "[6]", "bbox": {"l": 321.198, "t": 492.16437, "r": 329.42145, "b": 498.67792, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "Xu Zhong, Jianbin Tang, and Antonio Jimeno-Yepes. Publaynet: Largest dataset", "bbox": {"l": 331.16812, "t": 492.16437, "r": 558.20361, "b": 498.67792, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "ever for document layout analysis. In", "bbox": {"l": 333.39099, "t": 500.13437, "r": 438.6101100000001, "b": 506.64792, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "Proceedings of the International Conference", "bbox": {"l": 440.349, "t": 500.16925, "r": 558.19958, "b": 506.65488, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "on Document Analysis and Recognition", "bbox": {"l": 333.39099, "t": 508.13925, "r": 441.40118, "b": 514.6248800000001, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": ", ICDAR, pages 1015-1022, sep 2019.", "bbox": {"l": 441.4019799999999, "t": 508.10437, "r": 544.78162, "b": 514.61792, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[6] Xu Zhong, Jianbin Tang, and Antonio Jimeno-Yepes. Publaynet: Largest dataset ever for document layout analysis. In Proceedings of the International Conference on Document Analysis and Recognition , ICDAR, pages 1015-1022, sep 2019."}, {"label": "list_item", "id": 10, "page_no": 7, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 321.19797, "t": 516.07437, "r": 558.9715, "b": 554.46889, "coord_origin": "TOPLEFT"}, "confidence": 0.9426893591880798, "cells": [{"id": 172, "text": "[7]", "bbox": {"l": 321.19797, "t": 516.07437, "r": 329.74161, "b": 522.5879199999999, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "Minghao Li, Yiheng Xu, Lei Cui, Shaohan Huang, Furu Wei, Zhoujun Li, and", "bbox": {"l": 331.55634, "t": 516.07437, "r": 558.19897, "b": 522.5879199999999, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "Ming Zhou. Docbank: A benchmark dataset for document layout analysis. In", "bbox": {"l": 333.39099, "t": 524.0443700000001, "r": 558.19891, "b": 530.55792, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "Proceedings of the 28th International Conference on Computational Linguistics", "bbox": {"l": 333.39099, "t": 532.04922, "r": 557.40228, "b": 538.53487, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": ",", "bbox": {"l": 557.40399, "t": 532.01437, "r": 558.96893, "b": 538.5278900000001, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "COLING, pages 949-960. International Committee on Computational Linguistics,", "bbox": {"l": 333.39099, "t": 539.98438, "r": 558.9715, "b": 546.49789, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "dec 2020.", "bbox": {"l": 333.39099, "t": 547.95535, "r": 359.31955, "b": 554.46889, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[7] Minghao Li, Yiheng Xu, Lei Cui, Shaohan Huang, Furu Wei, Zhoujun Li, and Ming Zhou. Docbank: A benchmark dataset for document layout analysis. In Proceedings of the 28th International Conference on Computational Linguistics , COLING, pages 949-960. International Committee on Computational Linguistics, dec 2020."}, {"label": "list_item", "id": 19, "page_no": 7, "cluster": {"id": 19, "label": "list_item", "bbox": {"l": 321.198, "t": 555.92535, "r": 558.90222, "b": 578.38586, "coord_origin": "TOPLEFT"}, "confidence": 0.9139686226844788, "cells": [{"id": 179, "text": "[8]", "bbox": {"l": 321.198, "t": 555.92535, "r": 329.7088, "b": 562.43889, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "Riaz Ahmad, Muhammad Tanvir Afzal, and M. Qadir. Information extraction", "bbox": {"l": 331.51654, "t": 555.92535, "r": 558.19891, "b": 562.43889, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "from pdf sources based on rule-based system using integrated formats. In", "bbox": {"l": 333.39099, "t": 563.89536, "r": 535.54352, "b": 570.40889, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "SemWe-", "bbox": {"l": 536.96399, "t": 563.93024, "r": 558.90222, "b": 570.4158600000001, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "bEval@ESWC", "bbox": {"l": 333.39099, "t": 571.9002399999999, "r": 371.94217, "b": 578.38586, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": ", 2016.", "bbox": {"l": 371.94299, "t": 571.86536, "r": 389.72617, "b": 578.3788900000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[8] Riaz Ahmad, Muhammad Tanvir Afzal, and M. Qadir. Information extraction from pdf sources based on rule-based system using integrated formats. In SemWebEval@ESWC , 2016."}, {"label": "list_item", "id": 21, "page_no": 7, "cluster": {"id": 21, "label": "list_item", "bbox": {"l": 321.198, "t": 579.83536, "r": 559.27448, "b": 610.2589, "coord_origin": "TOPLEFT"}, "confidence": 0.9113100171089172, "cells": [{"id": 185, "text": "[9]", "bbox": {"l": 321.198, "t": 579.83536, "r": 329.45999, "b": 586.34889, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "Ross B. Girshick, Jeff Donahue, Trevor Darrell, and Jitendra Malik. Rich feature", "bbox": {"l": 331.21487, "t": 579.83536, "r": 558.19843, "b": 586.34889, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "hierarchies for accurate object detection and semantic segmentation. In", "bbox": {"l": 333.39099, "t": 587.8053600000001, "r": 543.05487, "b": 594.31889, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": "IEEE", "bbox": {"l": 544.98499, "t": 587.84024, "r": 558.20148, "b": 594.32587, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "Conference on Computer Vision and Pattern Recognition", "bbox": {"l": 333.39099, "t": 595.81024, "r": 491.61166, "b": 602.29587, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": ", CVPR, pages 580-587.", "bbox": {"l": 491.61301, "t": 595.77536, "r": 559.27448, "b": 602.28889, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "IEEE Computer Society, jun 2014.", "bbox": {"l": 333.39099, "t": 603.74536, "r": 428.59726000000006, "b": 610.2589, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[9] Ross B. Girshick, Jeff Donahue, Trevor Darrell, and Jitendra Malik. Rich feature hierarchies for accurate object detection and semantic segmentation. In IEEE Conference on Computer Vision and Pattern Recognition , CVPR, pages 580-587. IEEE Computer Society, jun 2014."}, {"label": "list_item", "id": 22, "page_no": 7, "cluster": {"id": 22, "label": "list_item", "bbox": {"l": 317.95499, "t": 611.71536, "r": 558.20203, "b": 626.20686, "coord_origin": "TOPLEFT"}, "confidence": 0.9028767347335815, "cells": [{"id": 192, "text": "[10]", "bbox": {"l": 317.95499, "t": 611.71536, "r": 329.54767, "b": 618.2289000000001, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "Ross B. Girshick. Fast R-CNN. In", "bbox": {"l": 331.31268, "t": 611.71536, "r": 425.1554, "b": 618.2289000000001, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "2015 IEEE International Conference on Computer", "bbox": {"l": 426.77802, "t": 611.75024, "r": 558.20203, "b": 618.23587, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "Vision", "bbox": {"l": 333.39099, "t": 619.72124, "r": 350.59537, "b": 626.20686, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": ", ICCV, pages 1440-1448. IEEE Computer Society, dec 2015.", "bbox": {"l": 350.59598, "t": 619.68637, "r": 518.58777, "b": 626.19989, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[10] Ross B. Girshick. Fast R-CNN. In 2015 IEEE International Conference on Computer Vision , ICCV, pages 1440-1448. IEEE Computer Society, dec 2015."}, {"label": "list_item", "id": 20, "page_no": 7, "cluster": {"id": 20, "label": "list_item", "bbox": {"l": 317.95499, "t": 627.65637, "r": 558.20142, "b": 650.1168700000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9127691984176636, "cells": [{"id": 197, "text": "[11]", "bbox": {"l": 317.95499, "t": 627.65637, "r": 329.5459, "b": 634.16989, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "Shaoqing Ren, Kaiming He, Ross Girshick, and Jian Sun. Faster r-cnn: Towards", "bbox": {"l": 331.31064, "t": 627.65637, "r": 558.20142, "b": 634.16989, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "real-time object detection with region proposal networks.", "bbox": {"l": 333.39099, "t": 635.62637, "r": 497.50909, "b": 642.13989, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "IEEE Transactions on", "bbox": {"l": 500.01401, "t": 635.66124, "r": 558.19885, "b": 642.14687, "coord_origin": "TOPLEFT"}}, {"id": 201, "text": "Pattern Analysis and Machine Intelligence", "bbox": {"l": 333.39099, "t": 643.6312399999999, "r": 449.38620000000003, "b": 650.1168700000001, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": ", 39(6):1137-1149, 2017.", "bbox": {"l": 449.38699, "t": 643.59637, "r": 515.74268, "b": 650.10989, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[11] Shaoqing Ren, Kaiming He, Ross Girshick, and Jian Sun. Faster r-cnn: Towards real-time object detection with region proposal networks. IEEE Transactions on Pattern Analysis and Machine Intelligence , 39(6):1137-1149, 2017."}, {"label": "list_item", "id": 18, "page_no": 7, "cluster": {"id": 18, "label": "list_item", "bbox": {"l": 317.95499, "t": 651.56638, "r": 559.27808, "b": 674.01989, "coord_origin": "TOPLEFT"}, "confidence": 0.9142459630966187, "cells": [{"id": 203, "text": "[12]", "bbox": {"l": 317.95499, "t": 651.56638, "r": 329.41763, "b": 658.0799, "coord_origin": "TOPLEFT"}}, {"id": 204, "text": "Kaiming He, Georgia Gkioxari, Piotr Doll\u00e1r, and Ross B. Girshick. Mask R-CNN.", "bbox": {"l": 331.16287, "t": 651.56638, "r": 559.27808, "b": 658.0799, "coord_origin": "TOPLEFT"}}, {"id": 205, "text": "In", "bbox": {"l": 333.39099, "t": 659.53638, "r": 339.35904, "b": 666.0499, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": "IEEE International Conference on Computer Vision", "bbox": {"l": 341.56299, "t": 659.57124, "r": 485.8273, "b": 666.05687, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": ", ICCV, pages 2980-2988.", "bbox": {"l": 485.82901, "t": 659.53638, "r": 559.27356, "b": 666.0499, "coord_origin": "TOPLEFT"}}, {"id": 208, "text": "IEEE Computer Society, Oct 2017.", "bbox": {"l": 333.39099, "t": 667.50636, "r": 429.30161000000004, "b": 674.01989, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[12] Kaiming He, Georgia Gkioxari, Piotr Doll\u00e1r, and Ross B. Girshick. Mask R-CNN. In IEEE International Conference on Computer Vision , ICCV, pages 2980-2988. IEEE Computer Society, Oct 2017."}, {"label": "list_item", "id": 23, "page_no": 7, "cluster": {"id": 23, "label": "list_item", "bbox": {"l": 317.95499, "t": 675.47636, "r": 558.97156, "b": 705.900894, "coord_origin": "TOPLEFT"}, "confidence": 0.889543354511261, "cells": [{"id": 209, "text": "[13]", "bbox": {"l": 317.95499, "t": 675.47636, "r": 330.11407, "b": 681.9898900000001, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": "Glenn Jocher, Alex Stoken, Ayush Chaurasia, Jirka Borovec, NanoCode012,", "bbox": {"l": 331.96533, "t": 675.47636, "r": 558.96716, "b": 681.9898900000001, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "TaoXie, Yonghye Kwon, Kalen Michael, Liu Changyu, Jiacong Fang, Abhiram V,", "bbox": {"l": 333.18201, "t": 683.44637, "r": 558.96661, "b": 689.95989, "coord_origin": "TOPLEFT"}}, {"id": 212, "text": "Laughing, tkianai, yxNONG, Piotr Skalski, Adam Hogan, Jebastin Nadar, imyhxy,", "bbox": {"l": 333.39099, "t": 691.41737, "r": 558.97156, "b": 697.930893, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "Lorenzo Mammana, Alex Wang, Cristi Fati, Diego Montes, Jan Hajek, Laurentiu", "bbox": {"l": 333.39099, "t": 699.387367, "r": 558.20001, "b": 705.900894, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[13] Glenn Jocher, Alex Stoken, Ayush Chaurasia, Jirka Borovec, NanoCode012, TaoXie, Yonghye Kwon, Kalen Michael, Liu Changyu, Jiacong Fang, Abhiram V, Laughing, tkianai, yxNONG, Piotr Skalski, Adam Hogan, Jebastin Nadar, imyhxy, Lorenzo Mammana, Alex Wang, Cristi Fati, Diego Montes, Jan Hajek, Laurentiu"}], "body": [{"label": "text", "id": 5, "page_no": 7, "cluster": {"id": 5, "label": "text", "bbox": {"l": 53.501999, "t": 86.87292000000002, "r": 295.64868, "b": 150.14111000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9824112057685852, "cells": [{"id": 2, "text": "Table 5: Prediction Performance (mAP@0.5-0.95) of a Mask", "bbox": {"l": 53.501999, "t": 86.87292000000002, "r": 294.32153, "b": 95.34618999999998, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "R-CNN R50 network across the PubLayNet, DocBank & Do-", "bbox": {"l": 53.79800000000001, "t": 97.83191, "r": 295.64868, "b": 106.30517999999995, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "cLayNet data-sets. By evaluating on common label classes of", "bbox": {"l": 53.79800000000001, "t": 108.79088999999999, "r": 294.0437, "b": 117.26415999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "each dataset, we observe that the DocLayNet-trained model", "bbox": {"l": 53.79800000000001, "t": 119.74987999999996, "r": 294.04373, "b": 128.22313999999994, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "has much less pronounced variations in performance across", "bbox": {"l": 53.79800000000001, "t": 130.70885999999996, "r": 294.0437, "b": 139.18213000000003, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "all datasets.", "bbox": {"l": 53.79800000000001, "t": 141.66785000000004, "r": 101.15852, "b": 150.14111000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 5: Prediction Performance (mAP@0.5-0.95) of a Mask R-CNN R50 network across the PubLayNet, DocBank & DocLayNet data-sets. By evaluating on common label classes of each dataset, we observe that the DocLayNet-trained model has much less pronounced variations in performance across all datasets."}, {"label": "table", "id": 0, "page_no": 7, "cluster": {"id": 0, "label": "table", "bbox": {"l": 72.6590347290039, "t": 172.48080444335938, "r": 274.83465576171875, "b": 339.8540344238281, "coord_origin": "TOPLEFT"}, "confidence": 0.9892616271972656, "cells": [{"id": 8, "text": "Testing on", "bbox": {"l": 217.74099999999999, "t": 175.01855, "r": 256.26065, "b": 183.39319, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Training on", "bbox": {"l": 89.954002, "t": 185.97655999999995, "r": 133.24379, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "labels", "bbox": {"l": 154.629, "t": 185.97655999999995, "r": 175.47588, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "PLN", "bbox": {"l": 204.69, "t": 185.97655999999995, "r": 220.54260000000002, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "DB", "bbox": {"l": 230.50427000000002, "t": 185.97655999999995, "r": 242.06197, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "DLN", "bbox": {"l": 252.02364, "t": 185.97655999999995, "r": 269.31085, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "PubLayNet (PLN)", "bbox": {"l": 78.530998, "t": 219.25256000000002, "r": 142.56006, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Figure", "bbox": {"l": 154.629, "t": 197.33452999999997, "r": 177.92371, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "96", "bbox": {"l": 208.44701, "t": 197.33452999999997, "r": 216.78575000000004, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "43", "bbox": {"l": 232.1183, "t": 197.33452999999997, "r": 240.45705, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "23", "bbox": {"l": 256.49792, "t": 197.33452999999997, "r": 264.83667, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Sec-header", "bbox": {"l": 154.629, "t": 208.29351999999994, "r": 194.72675, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "87", "bbox": {"l": 208.44701, "t": 208.29351999999994, "r": 216.78575000000004, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "-", "bbox": {"l": 234.77235, "t": 208.29351999999994, "r": 237.80299000000002, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "32", "bbox": {"l": 256.49792, "t": 208.29351999999994, "r": 264.83667, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Table", "bbox": {"l": 154.629, "t": 219.25256000000002, "r": 174.43578, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "95", "bbox": {"l": 208.44701, "t": 219.25256000000002, "r": 216.78575000000004, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "24", "bbox": {"l": 232.1183, "t": 219.25256000000002, "r": 240.45705, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "49", "bbox": {"l": 256.49792, "t": 219.25256000000002, "r": 264.83667, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Text", "bbox": {"l": 154.629, "t": 230.21155, "r": 170.58919, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "96", "bbox": {"l": 208.44701, "t": 230.21155, "r": 216.78575000000004, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "-", "bbox": {"l": 234.77235, "t": 230.21155, "r": 237.80299000000002, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "42", "bbox": {"l": 256.49792, "t": 230.21155, "r": 264.83667, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "total", "bbox": {"l": 154.629, "t": 241.16956000000005, "r": 171.2796, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "93", "bbox": {"l": 208.44701, "t": 241.16956000000005, "r": 216.78575000000004, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "34", "bbox": {"l": 232.1183, "t": 241.16956000000005, "r": 240.45705, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "30", "bbox": {"l": 256.49792, "t": 241.16956000000005, "r": 264.83667, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "DocBank (DB)", "bbox": {"l": 78.530998, "t": 263.48650999999995, "r": 131.19963, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Figure", "bbox": {"l": 154.629, "t": 252.52752999999996, "r": 177.92371, "b": 260.90216, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "77", "bbox": {"l": 208.44701, "t": 252.52752999999996, "r": 216.78575000000004, "b": 260.90216, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "71", "bbox": {"l": 232.1183, "t": 252.52752999999996, "r": 240.45705, "b": 260.90216, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "31", "bbox": {"l": 256.49792, "t": 252.52752999999996, "r": 264.83667, "b": 260.90216, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "Table", "bbox": {"l": 154.629, "t": 263.48650999999995, "r": 174.43578, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "19", "bbox": {"l": 208.44701, "t": 263.48650999999995, "r": 216.78575000000004, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "65", "bbox": {"l": 232.1183, "t": 263.48650999999995, "r": 240.45705, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "22", "bbox": {"l": 256.49792, "t": 263.48650999999995, "r": 264.83667, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "total", "bbox": {"l": 154.629, "t": 274.44556, "r": 171.2796, "b": 282.82016, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "48", "bbox": {"l": 208.44701, "t": 274.44556, "r": 216.78575000000004, "b": 282.82016, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "68", "bbox": {"l": 232.1183, "t": 274.44556, "r": 240.45705, "b": 282.82016, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "27", "bbox": {"l": 256.49792, "t": 274.44556, "r": 264.83667, "b": 282.82016, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "DocLayNet (DLN)", "bbox": {"l": 78.530998, "t": 307.72055, "r": 144.66716, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "Figure", "bbox": {"l": 154.629, "t": 285.80255, "r": 177.92371, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "67", "bbox": {"l": 208.44701, "t": 285.80255, "r": 216.78575000000004, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "51", "bbox": {"l": 232.1183, "t": 285.80255, "r": 240.45705, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "72", "bbox": {"l": 256.49792, "t": 285.80255, "r": 264.83667, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Sec-header", "bbox": {"l": 154.629, "t": 296.76154, "r": 194.72675, "b": 305.13617, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "53", "bbox": {"l": 208.44701, "t": 296.76154, "r": 216.78575000000004, "b": 305.13617, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "-", "bbox": {"l": 234.77235, "t": 296.76154, "r": 237.80299000000002, "b": 305.13617, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "68", "bbox": {"l": 256.49792, "t": 296.76154, "r": 264.83667, "b": 305.13617, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Table", "bbox": {"l": 154.629, "t": 307.72055, "r": 174.43578, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "87", "bbox": {"l": 208.44701, "t": 307.72055, "r": 216.78575000000004, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "43", "bbox": {"l": 232.1183, "t": 307.72055, "r": 240.45705, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "82", "bbox": {"l": 256.49792, "t": 307.72055, "r": 264.83667, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "Text", "bbox": {"l": 154.629, "t": 318.67953, "r": 170.58919, "b": 327.05417, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "77", "bbox": {"l": 208.44701, "t": 318.67953, "r": 216.78575000000004, "b": 327.05417, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "-", "bbox": {"l": 234.77235, "t": 318.67953, "r": 237.80299000000002, "b": 327.05417, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "84", "bbox": {"l": 256.49792, "t": 318.67953, "r": 264.83667, "b": 327.05417, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "total", "bbox": {"l": 154.629, "t": 329.63855, "r": 171.2796, "b": 338.01318, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "59", "bbox": {"l": 208.44701, "t": 329.63855, "r": 216.78575000000004, "b": 338.01318, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "47", "bbox": {"l": 232.1183, "t": 329.63855, "r": 240.45705, "b": 338.01318, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "78", "bbox": {"l": 256.49792, "t": 329.63855, "r": 264.83667, "b": 338.01318, "coord_origin": "TOPLEFT"}}], "children": [{"id": 25, "label": "text", "bbox": {"l": 217.74099999999999, "t": 175.01855, "r": 256.26065, "b": 183.39319, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "Testing on", "bbox": {"l": 217.74099999999999, "t": 175.01855, "r": 256.26065, "b": 183.39319, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 89.954002, "t": 185.97655999999995, "r": 133.24379, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "Training on", "bbox": {"l": 89.954002, "t": 185.97655999999995, "r": 133.24379, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 154.629, "t": 185.97655999999995, "r": 175.47588, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "labels", "bbox": {"l": 154.629, "t": 185.97655999999995, "r": 175.47588, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 204.69, "t": 185.97655999999995, "r": 220.54260000000002, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "PLN", "bbox": {"l": 204.69, "t": 185.97655999999995, "r": 220.54260000000002, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 230.50427000000002, "t": 185.97655999999995, "r": 242.06197, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "DB", "bbox": {"l": 230.50427000000002, "t": 185.97655999999995, "r": 242.06197, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 252.02364, "t": 185.97655999999995, "r": 269.31085, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "DLN", "bbox": {"l": 252.02364, "t": 185.97655999999995, "r": 269.31085, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 78.530998, "t": 219.25256000000002, "r": 142.56006, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "PubLayNet (PLN)", "bbox": {"l": 78.530998, "t": 219.25256000000002, "r": 142.56006, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 154.629, "t": 197.33452999999997, "r": 177.92371, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "Figure", "bbox": {"l": 154.629, "t": 197.33452999999997, "r": 177.92371, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 208.44701, "t": 197.33452999999997, "r": 216.78575000000004, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "96", "bbox": {"l": 208.44701, "t": 197.33452999999997, "r": 216.78575000000004, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 232.1183, "t": 197.33452999999997, "r": 240.45705, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "43", "bbox": {"l": 232.1183, "t": 197.33452999999997, "r": 240.45705, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 256.49792, "t": 197.33452999999997, "r": 264.83667, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "23", "bbox": {"l": 256.49792, "t": 197.33452999999997, "r": 264.83667, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 154.629, "t": 208.29351999999994, "r": 194.72675, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "Sec-header", "bbox": {"l": 154.629, "t": 208.29351999999994, "r": 194.72675, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 208.44701, "t": 208.29351999999994, "r": 216.78575000000004, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "87", "bbox": {"l": 208.44701, "t": 208.29351999999994, "r": 216.78575000000004, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 234.77235, "t": 208.29351999999994, "r": 237.80299000000002, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "-", "bbox": {"l": 234.77235, "t": 208.29351999999994, "r": 237.80299000000002, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 256.49792, "t": 208.29351999999994, "r": 264.83667, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "32", "bbox": {"l": 256.49792, "t": 208.29351999999994, "r": 264.83667, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 154.629, "t": 219.25256000000002, "r": 174.43578, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "Table", "bbox": {"l": 154.629, "t": 219.25256000000002, "r": 174.43578, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 208.44701, "t": 219.25256000000002, "r": 216.78575000000004, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "95", "bbox": {"l": 208.44701, "t": 219.25256000000002, "r": 216.78575000000004, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 232.1183, "t": 219.25256000000002, "r": 240.45705, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "24", "bbox": {"l": 232.1183, "t": 219.25256000000002, "r": 240.45705, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 256.49792, "t": 219.25256000000002, "r": 264.83667, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "49", "bbox": {"l": 256.49792, "t": 219.25256000000002, "r": 264.83667, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 154.629, "t": 230.21155, "r": 170.58919, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "Text", "bbox": {"l": 154.629, "t": 230.21155, "r": 170.58919, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 208.44701, "t": 230.21155, "r": 216.78575000000004, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "96", "bbox": {"l": 208.44701, "t": 230.21155, "r": 216.78575000000004, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 234.77235, "t": 230.21155, "r": 237.80299000000002, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "-", "bbox": {"l": 234.77235, "t": 230.21155, "r": 237.80299000000002, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 256.49792, "t": 230.21155, "r": 264.83667, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "42", "bbox": {"l": 256.49792, "t": 230.21155, "r": 264.83667, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 154.629, "t": 241.16956000000005, "r": 171.2796, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "total", "bbox": {"l": 154.629, "t": 241.16956000000005, "r": 171.2796, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 208.44701, "t": 241.16956000000005, "r": 216.78575000000004, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "93", "bbox": {"l": 208.44701, "t": 241.16956000000005, "r": 216.78575000000004, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 232.1183, "t": 241.16956000000005, "r": 240.45705, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "34", "bbox": {"l": 232.1183, "t": 241.16956000000005, "r": 240.45705, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 256.49792, "t": 241.16956000000005, "r": 264.83667, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "30", "bbox": {"l": 256.49792, "t": 241.16956000000005, "r": 264.83667, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 78.530998, "t": 263.48650999999995, "r": 131.19963, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "DocBank (DB)", "bbox": {"l": 78.530998, "t": 263.48650999999995, "r": 131.19963, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 154.629, "t": 252.52752999999996, "r": 177.92371, "b": 260.90216, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "Figure", "bbox": {"l": 154.629, "t": 252.52752999999996, "r": 177.92371, "b": 260.90216, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 208.44701, "t": 252.52752999999996, "r": 216.78575000000004, "b": 260.90216, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "77", "bbox": {"l": 208.44701, "t": 252.52752999999996, "r": 216.78575000000004, "b": 260.90216, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 232.1183, "t": 252.52752999999996, "r": 240.45705, "b": 260.90216, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "71", "bbox": {"l": 232.1183, "t": 252.52752999999996, "r": 240.45705, "b": 260.90216, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 256.49792, "t": 252.52752999999996, "r": 264.83667, "b": 260.90216, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "31", "bbox": {"l": 256.49792, "t": 252.52752999999996, "r": 264.83667, "b": 260.90216, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 154.629, "t": 263.48650999999995, "r": 174.43578, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "Table", "bbox": {"l": 154.629, "t": 263.48650999999995, "r": 174.43578, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 208.44701, "t": 263.48650999999995, "r": 216.78575000000004, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "19", "bbox": {"l": 208.44701, "t": 263.48650999999995, "r": 216.78575000000004, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 232.1183, "t": 263.48650999999995, "r": 240.45705, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "65", "bbox": {"l": 232.1183, "t": 263.48650999999995, "r": 240.45705, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 256.49792, "t": 263.48650999999995, "r": 264.83667, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "22", "bbox": {"l": 256.49792, "t": 263.48650999999995, "r": 264.83667, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 154.629, "t": 274.44556, "r": 171.2796, "b": 282.82016, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "total", "bbox": {"l": 154.629, "t": 274.44556, "r": 171.2796, "b": 282.82016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 208.44701, "t": 274.44556, "r": 216.78575000000004, "b": 282.82016, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "48", "bbox": {"l": 208.44701, "t": 274.44556, "r": 216.78575000000004, "b": 282.82016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 232.1183, "t": 274.44556, "r": 240.45705, "b": 282.82016, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "68", "bbox": {"l": 232.1183, "t": 274.44556, "r": 240.45705, "b": 282.82016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 256.49792, "t": 274.44556, "r": 264.83667, "b": 282.82016, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "27", "bbox": {"l": 256.49792, "t": 274.44556, "r": 264.83667, "b": 282.82016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 78.530998, "t": 307.72055, "r": 144.66716, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "DocLayNet (DLN)", "bbox": {"l": 78.530998, "t": 307.72055, "r": 144.66716, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 154.629, "t": 285.80255, "r": 177.92371, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "Figure", "bbox": {"l": 154.629, "t": 285.80255, "r": 177.92371, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 208.44701, "t": 285.80255, "r": 216.78575000000004, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "67", "bbox": {"l": 208.44701, "t": 285.80255, "r": 216.78575000000004, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 232.1183, "t": 285.80255, "r": 240.45705, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "51", "bbox": {"l": 232.1183, "t": 285.80255, "r": 240.45705, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 256.49792, "t": 285.80255, "r": 264.83667, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "72", "bbox": {"l": 256.49792, "t": 285.80255, "r": 264.83667, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 154.629, "t": 296.76154, "r": 194.72675, "b": 305.13617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "Sec-header", "bbox": {"l": 154.629, "t": 296.76154, "r": 194.72675, "b": 305.13617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 208.44701, "t": 296.76154, "r": 216.78575000000004, "b": 305.13617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "53", "bbox": {"l": 208.44701, "t": 296.76154, "r": 216.78575000000004, "b": 305.13617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 234.77235, "t": 296.76154, "r": 237.80299000000002, "b": 305.13617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "-", "bbox": {"l": 234.77235, "t": 296.76154, "r": 237.80299000000002, "b": 305.13617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 256.49792, "t": 296.76154, "r": 264.83667, "b": 305.13617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "68", "bbox": {"l": 256.49792, "t": 296.76154, "r": 264.83667, "b": 305.13617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 154.629, "t": 307.72055, "r": 174.43578, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "Table", "bbox": {"l": 154.629, "t": 307.72055, "r": 174.43578, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 208.44701, "t": 307.72055, "r": 216.78575000000004, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "87", "bbox": {"l": 208.44701, "t": 307.72055, "r": 216.78575000000004, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 232.1183, "t": 307.72055, "r": 240.45705, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "43", "bbox": {"l": 232.1183, "t": 307.72055, "r": 240.45705, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 256.49792, "t": 307.72055, "r": 264.83667, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "82", "bbox": {"l": 256.49792, "t": 307.72055, "r": 264.83667, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 154.629, "t": 318.67953, "r": 170.58919, "b": 327.05417, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "Text", "bbox": {"l": 154.629, "t": 318.67953, "r": 170.58919, "b": 327.05417, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 208.44701, "t": 318.67953, "r": 216.78575000000004, "b": 327.05417, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "77", "bbox": {"l": 208.44701, "t": 318.67953, "r": 216.78575000000004, "b": 327.05417, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 234.77235, "t": 318.67953, "r": 237.80299000000002, "b": 327.05417, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "-", "bbox": {"l": 234.77235, "t": 318.67953, "r": 237.80299000000002, "b": 327.05417, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 256.49792, "t": 318.67953, "r": 264.83667, "b": 327.05417, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "84", "bbox": {"l": 256.49792, "t": 318.67953, "r": 264.83667, "b": 327.05417, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 154.629, "t": 329.63855, "r": 171.2796, "b": 338.01318, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "total", "bbox": {"l": 154.629, "t": 329.63855, "r": 171.2796, "b": 338.01318, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 208.44701, "t": 329.63855, "r": 216.78575000000004, "b": 338.01318, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "59", "bbox": {"l": 208.44701, "t": 329.63855, "r": 216.78575000000004, "b": 338.01318, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 232.1183, "t": 329.63855, "r": 240.45705, "b": 338.01318, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "47", "bbox": {"l": 232.1183, "t": 329.63855, "r": 240.45705, "b": 338.01318, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 256.49792, "t": 329.63855, "r": 264.83667, "b": 338.01318, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "78", "bbox": {"l": 256.49792, "t": 329.63855, "r": 264.83667, "b": 338.01318, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "lcel", "lcel", "nl", "ched", "ched", "ched", "ched", "ched", "nl", "rhed", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl", "rhed", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl", "rhed", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl"], "num_rows": 15, "num_cols": 5, "table_cells": [{"bbox": {"l": 217.74099999999999, "t": 175.01855, "r": 256.26065, "b": 183.39319, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 3, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 5, "text": "Testing on", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 89.954002, "t": 185.97655999999995, "r": 133.24379, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Training on", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 185.97655999999995, "r": 175.47588, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "labels", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 204.69, "t": 185.97655999999995, "r": 220.54260000000002, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "PLN", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 230.50427000000002, "t": 185.97655999999995, "r": 242.06197, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "DB", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 252.02364, "t": 185.97655999999995, "r": 269.31085, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "DLN", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 78.530998, "t": 219.25256000000002, "r": 142.56006, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 5, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PubLayNet (PLN)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 154.629, "t": 197.33452999999997, "r": 177.92371, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Figure", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 197.33452999999997, "r": 216.78575000000004, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 197.33452999999997, "r": 240.45705, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "43", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 197.33452999999997, "r": 264.83667, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "23", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 208.29351999999994, "r": 194.72675, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Sec-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 208.29351999999994, "r": 216.78575000000004, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "87", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 234.77235, "t": 208.29351999999994, "r": 237.80299000000002, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 208.29351999999994, "r": 264.83667, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "32", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 219.25256000000002, "r": 174.43578, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 219.25256000000002, "r": 216.78575000000004, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "95", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 219.25256000000002, "r": 240.45705, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "24", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 219.25256000000002, "r": 264.83667, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "49", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 230.21155, "r": 170.58919, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Text", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 230.21155, "r": 216.78575000000004, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 234.77235, "t": 230.21155, "r": 237.80299000000002, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 230.21155, "r": 264.83667, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "42", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 241.16956000000005, "r": 171.2796, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "total", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 241.16956000000005, "r": 216.78575000000004, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "93", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 241.16956000000005, "r": 240.45705, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "34", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 241.16956000000005, "r": 264.83667, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "30", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 78.530998, "t": 263.48650999999995, "r": 131.19963, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "row_span": 3, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "DocBank (DB)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 154.629, "t": 252.52752999999996, "r": 177.92371, "b": 260.90216, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Figure", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 252.52752999999996, "r": 216.78575000000004, "b": 260.90216, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 252.52752999999996, "r": 240.45705, "b": 260.90216, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "71", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 252.52752999999996, "r": 264.83667, "b": 260.90216, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "31", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 263.48650999999995, "r": 174.43578, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 263.48650999999995, "r": 216.78575000000004, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "19", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 263.48650999999995, "r": 240.45705, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "65", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 263.48650999999995, "r": 264.83667, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "22", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 274.44556, "r": 171.2796, "b": 282.82016, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "total", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 274.44556, "r": 216.78575000000004, "b": 282.82016, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "48", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 274.44556, "r": 240.45705, "b": 282.82016, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 274.44556, "r": 264.83667, "b": 282.82016, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "27", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 78.530998, "t": 307.72055, "r": 144.66716, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "row_span": 5, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 15, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "DocLayNet (DLN)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 154.629, "t": 285.80255, "r": 177.92371, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Figure", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 285.80255, "r": 216.78575000000004, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "67", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 285.80255, "r": 240.45705, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "51", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 285.80255, "r": 264.83667, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 296.76154, "r": 194.72675, "b": 305.13617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Sec-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 296.76154, "r": 216.78575000000004, "b": 305.13617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "53", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 234.77235, "t": 296.76154, "r": 237.80299000000002, "b": 305.13617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 296.76154, "r": 264.83667, "b": 305.13617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 307.72055, "r": 174.43578, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 307.72055, "r": 216.78575000000004, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "87", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 307.72055, "r": 240.45705, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "43", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 307.72055, "r": 264.83667, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 318.67953, "r": 170.58919, "b": 327.05417, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Text", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 318.67953, "r": 216.78575000000004, "b": 327.05417, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 234.77235, "t": 318.67953, "r": 237.80299000000002, "b": 327.05417, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 318.67953, "r": 264.83667, "b": 327.05417, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 329.63855, "r": 171.2796, "b": 338.01318, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 14, "end_row_offset_idx": 15, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "total", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 329.63855, "r": 216.78575000000004, "b": 338.01318, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 14, "end_row_offset_idx": 15, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "59", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 329.63855, "r": 240.45705, "b": 338.01318, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 14, "end_row_offset_idx": 15, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "47", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 329.63855, "r": 264.83667, "b": 338.01318, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 14, "end_row_offset_idx": 15, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "78", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "text", "id": 4, "page_no": 7, "cluster": {"id": 4, "label": "text", "bbox": {"l": 53.79800000000001, "t": 390.92053, "r": 294.04712, "b": 443.14014, "coord_origin": "TOPLEFT"}, "confidence": 0.9839397668838501, "cells": [{"id": 69, "text": "Section-header", "bbox": {"l": 53.79800000000001, "t": 390.96539, "r": 106.2392, "b": 399.30414, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": ",", "bbox": {"l": 106.239, "t": 390.92053, "r": 108.23331, "b": 399.2951699999999, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Table", "bbox": {"l": 110.482, "t": 390.96539, "r": 129.76332, "b": 399.30414, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "and", "bbox": {"l": 132.21899, "t": 390.92053, "r": 145.86186, "b": 399.2951699999999, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "Text", "bbox": {"l": 148.112, "t": 390.96539, "r": 163.14182, "b": 399.30414, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": ". Before training, we either mapped", "bbox": {"l": 163.13901, "t": 390.92053, "r": 294.04709, "b": 399.2951699999999, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "or excluded DocLayNet\u2019s other labels as specified in table 3, and", "bbox": {"l": 53.79800000000001, "t": 401.87954999999994, "r": 294.04712, "b": 410.25418, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "also PubLayNet\u2019s", "bbox": {"l": 53.79800000000001, "t": 412.83853, "r": 117.12856, "b": 421.21317, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "List", "bbox": {"l": 119.362, "t": 412.88339, "r": 132.4342, "b": 421.22214, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "to", "bbox": {"l": 135.177, "t": 412.83853, "r": 142.54416, "b": 421.21317, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "Text", "bbox": {"l": 144.77901, "t": 412.88339, "r": 159.66605, "b": 421.22214, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": ". Note that the different clustering of", "bbox": {"l": 159.66701, "t": 412.83853, "r": 294.04562, "b": 421.21317, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "lists (by list-element vs. whole list objects) naturally decreases the", "bbox": {"l": 53.79800000000001, "t": 423.79755, "r": 294.04614, "b": 432.17217999999997, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "mAP score for", "bbox": {"l": 53.79800000000001, "t": 434.75653, "r": 106.2066, "b": 443.13116, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "Text", "bbox": {"l": 108.448, "t": 434.80139, "r": 123.30533, "b": 443.14014, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": ".", "bbox": {"l": 123.305, "t": 434.75653, "r": 125.27761000000001, "b": 443.13116, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Section-header , Table and Text . Before training, we either mapped or excluded DocLayNet's other labels as specified in table 3, and also PubLayNet's List to Text . Note that the different clustering of lists (by list-element vs. whole list objects) naturally decreases the mAP score for Text ."}, {"label": "text", "id": 1, "page_no": 7, "cluster": {"id": 1, "label": "text", "bbox": {"l": 53.466999, "t": 445.71453999999994, "r": 295.55908, "b": 585.59618, "coord_origin": "TOPLEFT"}, "confidence": 0.9868056774139404, "cells": [{"id": 85, "text": "For comparison of DocBank with DocLayNet, we trained only", "bbox": {"l": 63.76100199999999, "t": 445.71453999999994, "r": 294.27582, "b": 454.08917, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "on", "bbox": {"l": 53.79800000000001, "t": 456.67355, "r": 62.989277, "b": 465.04819, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Picture", "bbox": {"l": 64.852997, "t": 456.71841, "r": 88.947144, "b": 465.05716, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "and", "bbox": {"l": 91.019997, "t": 456.67355, "r": 104.24454, "b": 465.04819, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "Table", "bbox": {"l": 106.108, "t": 456.71841, "r": 124.78053, "b": 465.05716, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "clusters of each dataset. We had to exclude", "bbox": {"l": 126.85500000000002, "t": 456.67355, "r": 277.63235, "b": 465.04819, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "Text", "bbox": {"l": 279.49701, "t": 456.71841, "r": 294.0484, "b": 465.05716, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "because successive paragraphs are often grouped together into a", "bbox": {"l": 53.79800000000001, "t": 467.63254, "r": 294.04709, "b": 476.00717, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "single object in DocBank. This paragraph grouping is incompatible", "bbox": {"l": 53.79800000000001, "t": 478.59155, "r": 294.04532, "b": 486.96619, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "with the individual paragraphs of DocLayNet. As can be seen in", "bbox": {"l": 53.466999, "t": 489.55054, "r": 294.04538, "b": 497.92517, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "Table 5, DocLayNet trained models yield better performance com-", "bbox": {"l": 53.528999, "t": 500.50955, "r": 295.55908, "b": 508.88419, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "pared to the previous datasets. It is noteworthy that the models", "bbox": {"l": 53.79800000000001, "t": 511.46854, "r": 294.04712, "b": 519.84317, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "trained on PubLayNet and DocBank perform very well on their", "bbox": {"l": 53.79800000000001, "t": 522.42755, "r": 294.21179, "b": 530.80219, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "own test set, but have a much lower performance on the foreign", "bbox": {"l": 53.79800000000001, "t": 533.38654, "r": 294.04712, "b": 541.76117, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "datasets. While this also applies to DocLayNet, the difference is", "bbox": {"l": 53.79800000000001, "t": 544.34555, "r": 294.04715, "b": 552.72017, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "far less pronounced. Thus we conclude that DocLayNet trained", "bbox": {"l": 53.79800000000001, "t": 555.3045500000001, "r": 294.04712, "b": 563.67917, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "models are overall more robust and will produce better results for", "bbox": {"l": 53.79800000000001, "t": 566.26256, "r": 294.21411, "b": 574.63718, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "challenging, unseen layouts.", "bbox": {"l": 53.79800000000001, "t": 577.22156, "r": 157.52132, "b": 585.59618, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "For comparison of DocBank with DocLayNet, we trained only on Picture and Table clusters of each dataset. We had to exclude Text because successive paragraphs are often grouped together into a single object in DocBank. This paragraph grouping is incompatible with the individual paragraphs of DocLayNet. As can be seen in Table 5, DocLayNet trained models yield better performance compared to the previous datasets. It is noteworthy that the models trained on PubLayNet and DocBank perform very well on their own test set, but have a much lower performance on the foreign datasets. While this also applies to DocLayNet, the difference is far less pronounced. Thus we conclude that DocLayNet trained models are overall more robust and will produce better results for challenging, unseen layouts."}, {"label": "section_header", "id": 8, "page_no": 7, "cluster": {"id": 8, "label": "section_header", "bbox": {"l": 53.79800000000001, "t": 605.06091, "r": 156.00534, "b": 615.37001, "coord_origin": "TOPLEFT"}, "confidence": 0.9574698805809021, "cells": [{"id": 103, "text": "Example Predictions", "bbox": {"l": 53.79800000000001, "t": 605.06091, "r": 156.00534, "b": 615.37001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Example Predictions"}, {"label": "text", "id": 2, "page_no": 7, "cluster": {"id": 2, "label": "text", "bbox": {"l": 53.528999, "t": 620.26355, "r": 295.55844, "b": 705.350174, "coord_origin": "TOPLEFT"}, "confidence": 0.9859886169433594, "cells": [{"id": 104, "text": "To conclude this section, we illustrate the quality of layout predic-", "bbox": {"l": 53.528999, "t": 620.26355, "r": 295.5571, "b": 628.63817, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "tions one can expect from DocLayNet-trained models by providing", "bbox": {"l": 53.79800000000001, "t": 631.22255, "r": 294.04532, "b": 639.59717, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "a selection of examples without any further post-processing ap-", "bbox": {"l": 53.79800000000001, "t": 642.18155, "r": 295.55618, "b": 650.5561700000001, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "plied. Figure 6 shows selected layout predictions on pages from the", "bbox": {"l": 53.79800000000001, "t": 653.14055, "r": 294.04541, "b": 661.51517, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "test-set of DocLayNet. Results look decent in general across docu-", "bbox": {"l": 53.79800000000001, "t": 664.09956, "r": 295.55844, "b": 672.47417, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "ment categories, however one can also observe mistakes such as", "bbox": {"l": 53.79800000000001, "t": 675.05756, "r": 294.04712, "b": 683.43217, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "overlapping clusters of different classes, or entirely missing boxes", "bbox": {"l": 53.79800000000001, "t": 686.01656, "r": 294.04535, "b": 694.391174, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "due to low confidence.", "bbox": {"l": 53.79800000000001, "t": 696.975555, "r": 136.07368, "b": 705.350174, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "To conclude this section, we illustrate the quality of layout predictions one can expect from DocLayNet-trained models by providing a selection of examples without any further post-processing applied. Figure 6 shows selected layout predictions on pages from the test-set of DocLayNet. Results look decent in general across document categories, however one can also observe mistakes such as overlapping clusters of different classes, or entirely missing boxes due to low confidence."}, {"label": "section_header", "id": 13, "page_no": 7, "cluster": {"id": 13, "label": "section_header", "bbox": {"l": 317.95502, "t": 85.85986000000003, "r": 405.72961, "b": 96.16900999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.931998074054718, "cells": [{"id": 112, "text": "6", "bbox": {"l": 317.95502, "t": 85.85986000000003, "r": 323.56229, "b": 96.16900999999996, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "CONCLUSION", "bbox": {"l": 334.47137, "t": 85.85986000000003, "r": 405.72961, "b": 96.16900999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "6 CONCLUSION"}, {"label": "text", "id": 3, "page_no": 7, "cluster": {"id": 3, "label": "text", "bbox": {"l": 317.95499, "t": 101.06151999999997, "r": 559.71375, "b": 186.14917000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.985493004322052, "cells": [{"id": 114, "text": "In this paper, we presented the DocLayNet dataset. It provides the", "bbox": {"l": 317.95499, "t": 101.06151999999997, "r": 558.2038, "b": 109.43615999999997, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "document conversion and layout analysis research community a", "bbox": {"l": 317.95499, "t": 112.02057000000002, "r": 558.2041, "b": 120.39520000000005, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "new and challenging dataset to improve and fine-tune novel ML", "bbox": {"l": 317.95499, "t": 122.97955000000002, "r": 558.43274, "b": 131.35419000000002, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "methods on. In contrast to many other datasets, DocLayNet was", "bbox": {"l": 317.95499, "t": 133.93854, "r": 558.20416, "b": 142.31317, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "created by human annotation in order to obtain reliable layout", "bbox": {"l": 317.95499, "t": 144.89752, "r": 558.20422, "b": 153.27215999999999, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "ground-truth on a wide variety of publication- and typesetting-", "bbox": {"l": 317.95499, "t": 155.85657000000003, "r": 559.71313, "b": 164.23119999999994, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "styles. Including a large proportion of documents outside the scien-", "bbox": {"l": 317.95499, "t": 166.81555000000003, "r": 559.71375, "b": 175.19019000000003, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "tific publishing domain adds significant value in this respect.", "bbox": {"l": 317.95499, "t": 177.77454, "r": 540.04382, "b": 186.14917000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In this paper, we presented the DocLayNet dataset. It provides the document conversion and layout analysis research community a new and challenging dataset to improve and fine-tune novel ML methods on. In contrast to many other datasets, DocLayNet was created by human annotation in order to obtain reliable layout ground-truth on a wide variety of publication- and typesettingstyles. Including a large proportion of documents outside the scientific publishing domain adds significant value in this respect."}, {"label": "text", "id": 6, "page_no": 7, "cluster": {"id": 6, "label": "text", "bbox": {"l": 317.686, "t": 188.73352, "r": 559.71704, "b": 284.77917, "coord_origin": "TOPLEFT"}, "confidence": 0.9800531268119812, "cells": [{"id": 122, "text": "From the dataset, we have derived on the one hand reference", "bbox": {"l": 327.918, "t": 188.73352, "r": 558.19836, "b": 197.10815000000002, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "metrics for human performance on document-layout annotation", "bbox": {"l": 317.95499, "t": 199.69257000000005, "r": 558.20404, "b": 208.06719999999996, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "(through double and triple annotations) and on the other hand eval-", "bbox": {"l": 317.686, "t": 210.65155000000004, "r": 559.71704, "b": 219.02617999999995, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "uated the baseline performance of commonly used object detection", "bbox": {"l": 317.95499, "t": 221.60956, "r": 558.20245, "b": 229.98419, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "methods. We also illustrated the impact of various dataset-related", "bbox": {"l": 317.95499, "t": 232.56853999999998, "r": 558.20502, "b": 240.94317999999998, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "aspects on model performance through data-ablation experiments,", "bbox": {"l": 317.95499, "t": 243.52752999999996, "r": 559.18408, "b": 251.90215999999998, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "both from a size and class-label perspective. Last but not least, we", "bbox": {"l": 317.95499, "t": 254.48650999999995, "r": 558.20227, "b": 262.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "compared the accuracy of models trained on other public datasets", "bbox": {"l": 317.95499, "t": 265.44556, "r": 558.20349, "b": 273.82019, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "and showed that DocLayNet trained models are more robust.", "bbox": {"l": 317.95499, "t": 276.40454, "r": 540.99426, "b": 284.77917, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "From the dataset, we have derived on the one hand reference metrics for human performance on document-layout annotation (through double and triple annotations) and on the other hand evaluated the baseline performance of commonly used object detection methods. We also illustrated the impact of various dataset-related aspects on model performance through data-ablation experiments, both from a size and class-label perspective. Last but not least, we compared the accuracy of models trained on other public datasets and showed that DocLayNet trained models are more robust."}, {"label": "text", "id": 7, "page_no": 7, "cluster": {"id": 7, "label": "text", "bbox": {"l": 317.62299, "t": 287.36353, "r": 558.43469, "b": 317.65616000000006, "coord_origin": "TOPLEFT"}, "confidence": 0.9676101207733154, "cells": [{"id": 131, "text": "To date, there is still a significant gap between human and ML", "bbox": {"l": 327.918, "t": 287.36353, "r": 558.43469, "b": 295.73816, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "accuracy on the layout interpretation task, and we hope that this", "bbox": {"l": 317.95499, "t": 298.32254, "r": 558.20013, "b": 306.69717, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "work will inspire the research community to close that gap.", "bbox": {"l": 317.62299, "t": 309.28152, "r": 535.65015, "b": 317.65616000000006, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "To date, there is still a significant gap between human and ML accuracy on the layout interpretation task, and we hope that this work will inspire the research community to close that gap."}, {"label": "section_header", "id": 11, "page_no": 7, "cluster": {"id": 11, "label": "section_header", "bbox": {"l": 317.95499, "t": 335.09189, "r": 387.3696, "b": 345.40097, "coord_origin": "TOPLEFT"}, "confidence": 0.9378752708435059, "cells": [{"id": 134, "text": "REFERENCES", "bbox": {"l": 317.95499, "t": 335.09189, "r": 387.3696, "b": 345.40097, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "REFERENCES"}, {"label": "list_item", "id": 12, "page_no": 7, "cluster": {"id": 12, "label": "list_item", "bbox": {"l": 321.198, "t": 348.70233, "r": 558.20099, "b": 371.16286999999994, "coord_origin": "TOPLEFT"}, "confidence": 0.9372857213020325, "cells": [{"id": 135, "text": "[1]", "bbox": {"l": 321.198, "t": 348.70233, "r": 329.72415, "b": 355.21588, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "Max G\u00f6bel, Tamir Hassan, Ermelinda Oro, and Giorgio Orsi. Icdar 2013 table", "bbox": {"l": 331.53516, "t": 348.70233, "r": 558.19904, "b": 355.21588, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "competition. In", "bbox": {"l": 333.39099, "t": 356.67236, "r": 379.36414, "b": 363.18591, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "2013 12th International Conference on Document Analysis and", "bbox": {"l": 381.37201, "t": 356.70724, "r": 558.20099, "b": 363.19287, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "Recognition", "bbox": {"l": 333.39099, "t": 364.67724999999996, "r": 365.59601, "b": 371.16286999999994, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": ", pages 1449-1453, 2013.", "bbox": {"l": 365.59601, "t": 364.64236, "r": 434.29489, "b": 371.15591, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[1] Max G\u00f6bel, Tamir Hassan, Ermelinda Oro, and Giorgio Orsi. Icdar 2013 table competition. In 2013 12th International Conference on Document Analysis and Recognition , pages 1449-1453, 2013."}, {"label": "list_item", "id": 9, "page_no": 7, "cluster": {"id": 9, "label": "list_item", "bbox": {"l": 321.198, "t": 372.61237, "r": 559.37982, "b": 403.04287999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9480945467948914, "cells": [{"id": 141, "text": "[2]", "bbox": {"l": 321.198, "t": 372.61237, "r": 329.85956, "b": 379.12592, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "Christian Clausner, Apostolos Antonacopoulos, and Stefan Pletschacher. Ic-", "bbox": {"l": 331.69931, "t": 372.61237, "r": 559.37976, "b": 379.12592, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "dar2017 competition on recognition of documents with complex layouts -", "bbox": {"l": 333.39099, "t": 380.58237, "r": 559.37982, "b": 387.09592, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "rdcl2017. In", "bbox": {"l": 333.39099, "t": 388.55236999999994, "r": 367.4339, "b": 395.06592, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "2017 14th IAPR International Conference on Document Analysis and", "bbox": {"l": 369.17401, "t": 388.58725000000004, "r": 558.20422, "b": 395.07288, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "Recognition (ICDAR)", "bbox": {"l": 333.39099, "t": 396.55725, "r": 390.87601, "b": 403.04287999999997, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": ", volume 01, pages 1404-1410, 2017.", "bbox": {"l": 390.87698, "t": 396.52237, "r": 492.17831, "b": 403.03592, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[2] Christian Clausner, Apostolos Antonacopoulos, and Stefan Pletschacher. Icdar2017 competition on recognition of documents with complex layouts rdcl2017. In 2017 14th IAPR International Conference on Document Analysis and Recognition (ICDAR) , volume 01, pages 1404-1410, 2017."}, {"label": "list_item", "id": 17, "page_no": 7, "cluster": {"id": 17, "label": "list_item", "bbox": {"l": 321.198, "t": 404.49237, "r": 558.20013, "b": 426.94689999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9257517457008362, "cells": [{"id": 148, "text": "[3]", "bbox": {"l": 321.198, "t": 404.49237, "r": 329.53583, "b": 411.00592, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "Herv\u00e9 D\u00e9jean, Jean-Luc Meunier, Liangcai Gao, Yilun Huang, Yu Fang, Florian", "bbox": {"l": 331.30682, "t": 404.49237, "r": 558.19958, "b": 411.00592, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "Kleber, and Eva-Maria Lang. ICDAR 2019 Competition on Table Detection and", "bbox": {"l": 333.39099, "t": 412.46335, "r": 558.20013, "b": 418.9769, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "Recognition (cTDaR), April 2019. http://sac.founderit.com/.", "bbox": {"l": 333.39099, "t": 420.43335, "r": 501.80127, "b": 426.94689999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[3] Herv\u00e9 D\u00e9jean, Jean-Luc Meunier, Liangcai Gao, Yilun Huang, Yu Fang, Florian Kleber, and Eva-Maria Lang. ICDAR 2019 Competition on Table Detection and Recognition (cTDaR), April 2019. http://sac.founderit.com/."}, {"label": "list_item", "id": 16, "page_no": 7, "cluster": {"id": 16, "label": "list_item", "bbox": {"l": 321.198, "t": 428.40335, "r": 559.37872, "b": 458.8269, "coord_origin": "TOPLEFT"}, "confidence": 0.9270977973937988, "cells": [{"id": 152, "text": "[4]", "bbox": {"l": 321.198, "t": 428.40335, "r": 329.91299, "b": 434.9169, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "Antonio Jimeno Yepes, Peter Zhong, and Douglas Burdick. Competition on", "bbox": {"l": 331.7641, "t": 428.40335, "r": 558.19885, "b": 434.9169, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "scientific literature parsing. In", "bbox": {"l": 333.39099, "t": 436.3733500000001, "r": 423.77225, "b": 442.8869, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "Proceedings of the International Conference on", "bbox": {"l": 425.909, "t": 436.40823, "r": 558.20178, "b": 442.89386, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "Document Analysis and Recognition", "bbox": {"l": 333.39099, "t": 444.37823, "r": 429.42697, "b": 450.86386, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": ", ICDAR, pages 605-617. LNCS 12824, Springer-", "bbox": {"l": 429.42400999999995, "t": 444.34335, "r": 559.37872, "b": 450.85689999999994, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "Verlag, sep 2021.", "bbox": {"l": 332.819, "t": 452.31335, "r": 380.01764, "b": 458.8269, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[4] Antonio Jimeno Yepes, Peter Zhong, and Douglas Burdick. Competition on scientific literature parsing. In Proceedings of the International Conference on Document Analysis and Recognition , ICDAR, pages 605-617. LNCS 12824, SpringerVerlag, sep 2021."}, {"label": "list_item", "id": 14, "page_no": 7, "cluster": {"id": 14, "label": "list_item", "bbox": {"l": 321.198, "t": 460.28336, "r": 559.02625, "b": 490.70792, "coord_origin": "TOPLEFT"}, "confidence": 0.9290012121200562, "cells": [{"id": 159, "text": "[5]", "bbox": {"l": 321.198, "t": 460.28336, "r": 329.22977, "b": 466.79691, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "Logan Markewich, Hao Zhang, Yubin Xing, Navid Lambert-Shirzad, Jiang Zhexin,", "bbox": {"l": 330.93576, "t": 460.28336, "r": 558.97156, "b": 466.79691, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "Roy Lee, Zhi Li, and Seok-Bum Ko. Segmentation for document layout analysis:", "bbox": {"l": 333.39099, "t": 468.25336, "r": 559.02625, "b": 474.76691, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "not dead yet.", "bbox": {"l": 333.39099, "t": 476.22437, "r": 368.85431, "b": 482.73792, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "International Journal on Document Analysis and Recognition (IJDAR)", "bbox": {"l": 370.811, "t": 476.25925, "r": 557.46326, "b": 482.74487, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": ",", "bbox": {"l": 557.46503, "t": 476.22437, "r": 558.96857, "b": 482.73792, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "pages 1-11, 01 2022.", "bbox": {"l": 333.39099, "t": 484.19437, "r": 390.82715, "b": 490.70792, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[5] Logan Markewich, Hao Zhang, Yubin Xing, Navid Lambert-Shirzad, Jiang Zhexin, Roy Lee, Zhi Li, and Seok-Bum Ko. Segmentation for document layout analysis: not dead yet. International Journal on Document Analysis and Recognition (IJDAR) , pages 1-11, 01 2022."}, {"label": "list_item", "id": 15, "page_no": 7, "cluster": {"id": 15, "label": "list_item", "bbox": {"l": 321.198, "t": 492.16437, "r": 558.20361, "b": 514.6248800000001, "coord_origin": "TOPLEFT"}, "confidence": 0.927480161190033, "cells": [{"id": 166, "text": "[6]", "bbox": {"l": 321.198, "t": 492.16437, "r": 329.42145, "b": 498.67792, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "Xu Zhong, Jianbin Tang, and Antonio Jimeno-Yepes. Publaynet: Largest dataset", "bbox": {"l": 331.16812, "t": 492.16437, "r": 558.20361, "b": 498.67792, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "ever for document layout analysis. In", "bbox": {"l": 333.39099, "t": 500.13437, "r": 438.6101100000001, "b": 506.64792, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "Proceedings of the International Conference", "bbox": {"l": 440.349, "t": 500.16925, "r": 558.19958, "b": 506.65488, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "on Document Analysis and Recognition", "bbox": {"l": 333.39099, "t": 508.13925, "r": 441.40118, "b": 514.6248800000001, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": ", ICDAR, pages 1015-1022, sep 2019.", "bbox": {"l": 441.4019799999999, "t": 508.10437, "r": 544.78162, "b": 514.61792, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[6] Xu Zhong, Jianbin Tang, and Antonio Jimeno-Yepes. Publaynet: Largest dataset ever for document layout analysis. In Proceedings of the International Conference on Document Analysis and Recognition , ICDAR, pages 1015-1022, sep 2019."}, {"label": "list_item", "id": 10, "page_no": 7, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 321.19797, "t": 516.07437, "r": 558.9715, "b": 554.46889, "coord_origin": "TOPLEFT"}, "confidence": 0.9426893591880798, "cells": [{"id": 172, "text": "[7]", "bbox": {"l": 321.19797, "t": 516.07437, "r": 329.74161, "b": 522.5879199999999, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "Minghao Li, Yiheng Xu, Lei Cui, Shaohan Huang, Furu Wei, Zhoujun Li, and", "bbox": {"l": 331.55634, "t": 516.07437, "r": 558.19897, "b": 522.5879199999999, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "Ming Zhou. Docbank: A benchmark dataset for document layout analysis. In", "bbox": {"l": 333.39099, "t": 524.0443700000001, "r": 558.19891, "b": 530.55792, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "Proceedings of the 28th International Conference on Computational Linguistics", "bbox": {"l": 333.39099, "t": 532.04922, "r": 557.40228, "b": 538.53487, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": ",", "bbox": {"l": 557.40399, "t": 532.01437, "r": 558.96893, "b": 538.5278900000001, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "COLING, pages 949-960. International Committee on Computational Linguistics,", "bbox": {"l": 333.39099, "t": 539.98438, "r": 558.9715, "b": 546.49789, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "dec 2020.", "bbox": {"l": 333.39099, "t": 547.95535, "r": 359.31955, "b": 554.46889, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[7] Minghao Li, Yiheng Xu, Lei Cui, Shaohan Huang, Furu Wei, Zhoujun Li, and Ming Zhou. Docbank: A benchmark dataset for document layout analysis. In Proceedings of the 28th International Conference on Computational Linguistics , COLING, pages 949-960. International Committee on Computational Linguistics, dec 2020."}, {"label": "list_item", "id": 19, "page_no": 7, "cluster": {"id": 19, "label": "list_item", "bbox": {"l": 321.198, "t": 555.92535, "r": 558.90222, "b": 578.38586, "coord_origin": "TOPLEFT"}, "confidence": 0.9139686226844788, "cells": [{"id": 179, "text": "[8]", "bbox": {"l": 321.198, "t": 555.92535, "r": 329.7088, "b": 562.43889, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "Riaz Ahmad, Muhammad Tanvir Afzal, and M. Qadir. Information extraction", "bbox": {"l": 331.51654, "t": 555.92535, "r": 558.19891, "b": 562.43889, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "from pdf sources based on rule-based system using integrated formats. In", "bbox": {"l": 333.39099, "t": 563.89536, "r": 535.54352, "b": 570.40889, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "SemWe-", "bbox": {"l": 536.96399, "t": 563.93024, "r": 558.90222, "b": 570.4158600000001, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "bEval@ESWC", "bbox": {"l": 333.39099, "t": 571.9002399999999, "r": 371.94217, "b": 578.38586, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": ", 2016.", "bbox": {"l": 371.94299, "t": 571.86536, "r": 389.72617, "b": 578.3788900000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[8] Riaz Ahmad, Muhammad Tanvir Afzal, and M. Qadir. Information extraction from pdf sources based on rule-based system using integrated formats. In SemWebEval@ESWC , 2016."}, {"label": "list_item", "id": 21, "page_no": 7, "cluster": {"id": 21, "label": "list_item", "bbox": {"l": 321.198, "t": 579.83536, "r": 559.27448, "b": 610.2589, "coord_origin": "TOPLEFT"}, "confidence": 0.9113100171089172, "cells": [{"id": 185, "text": "[9]", "bbox": {"l": 321.198, "t": 579.83536, "r": 329.45999, "b": 586.34889, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "Ross B. Girshick, Jeff Donahue, Trevor Darrell, and Jitendra Malik. Rich feature", "bbox": {"l": 331.21487, "t": 579.83536, "r": 558.19843, "b": 586.34889, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "hierarchies for accurate object detection and semantic segmentation. In", "bbox": {"l": 333.39099, "t": 587.8053600000001, "r": 543.05487, "b": 594.31889, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": "IEEE", "bbox": {"l": 544.98499, "t": 587.84024, "r": 558.20148, "b": 594.32587, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "Conference on Computer Vision and Pattern Recognition", "bbox": {"l": 333.39099, "t": 595.81024, "r": 491.61166, "b": 602.29587, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": ", CVPR, pages 580-587.", "bbox": {"l": 491.61301, "t": 595.77536, "r": 559.27448, "b": 602.28889, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "IEEE Computer Society, jun 2014.", "bbox": {"l": 333.39099, "t": 603.74536, "r": 428.59726000000006, "b": 610.2589, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[9] Ross B. Girshick, Jeff Donahue, Trevor Darrell, and Jitendra Malik. Rich feature hierarchies for accurate object detection and semantic segmentation. In IEEE Conference on Computer Vision and Pattern Recognition , CVPR, pages 580-587. IEEE Computer Society, jun 2014."}, {"label": "list_item", "id": 22, "page_no": 7, "cluster": {"id": 22, "label": "list_item", "bbox": {"l": 317.95499, "t": 611.71536, "r": 558.20203, "b": 626.20686, "coord_origin": "TOPLEFT"}, "confidence": 0.9028767347335815, "cells": [{"id": 192, "text": "[10]", "bbox": {"l": 317.95499, "t": 611.71536, "r": 329.54767, "b": 618.2289000000001, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "Ross B. Girshick. Fast R-CNN. In", "bbox": {"l": 331.31268, "t": 611.71536, "r": 425.1554, "b": 618.2289000000001, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "2015 IEEE International Conference on Computer", "bbox": {"l": 426.77802, "t": 611.75024, "r": 558.20203, "b": 618.23587, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "Vision", "bbox": {"l": 333.39099, "t": 619.72124, "r": 350.59537, "b": 626.20686, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": ", ICCV, pages 1440-1448. IEEE Computer Society, dec 2015.", "bbox": {"l": 350.59598, "t": 619.68637, "r": 518.58777, "b": 626.19989, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[10] Ross B. Girshick. Fast R-CNN. In 2015 IEEE International Conference on Computer Vision , ICCV, pages 1440-1448. IEEE Computer Society, dec 2015."}, {"label": "list_item", "id": 20, "page_no": 7, "cluster": {"id": 20, "label": "list_item", "bbox": {"l": 317.95499, "t": 627.65637, "r": 558.20142, "b": 650.1168700000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9127691984176636, "cells": [{"id": 197, "text": "[11]", "bbox": {"l": 317.95499, "t": 627.65637, "r": 329.5459, "b": 634.16989, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "Shaoqing Ren, Kaiming He, Ross Girshick, and Jian Sun. Faster r-cnn: Towards", "bbox": {"l": 331.31064, "t": 627.65637, "r": 558.20142, "b": 634.16989, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "real-time object detection with region proposal networks.", "bbox": {"l": 333.39099, "t": 635.62637, "r": 497.50909, "b": 642.13989, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "IEEE Transactions on", "bbox": {"l": 500.01401, "t": 635.66124, "r": 558.19885, "b": 642.14687, "coord_origin": "TOPLEFT"}}, {"id": 201, "text": "Pattern Analysis and Machine Intelligence", "bbox": {"l": 333.39099, "t": 643.6312399999999, "r": 449.38620000000003, "b": 650.1168700000001, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": ", 39(6):1137-1149, 2017.", "bbox": {"l": 449.38699, "t": 643.59637, "r": 515.74268, "b": 650.10989, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[11] Shaoqing Ren, Kaiming He, Ross Girshick, and Jian Sun. Faster r-cnn: Towards real-time object detection with region proposal networks. IEEE Transactions on Pattern Analysis and Machine Intelligence , 39(6):1137-1149, 2017."}, {"label": "list_item", "id": 18, "page_no": 7, "cluster": {"id": 18, "label": "list_item", "bbox": {"l": 317.95499, "t": 651.56638, "r": 559.27808, "b": 674.01989, "coord_origin": "TOPLEFT"}, "confidence": 0.9142459630966187, "cells": [{"id": 203, "text": "[12]", "bbox": {"l": 317.95499, "t": 651.56638, "r": 329.41763, "b": 658.0799, "coord_origin": "TOPLEFT"}}, {"id": 204, "text": "Kaiming He, Georgia Gkioxari, Piotr Doll\u00e1r, and Ross B. Girshick. Mask R-CNN.", "bbox": {"l": 331.16287, "t": 651.56638, "r": 559.27808, "b": 658.0799, "coord_origin": "TOPLEFT"}}, {"id": 205, "text": "In", "bbox": {"l": 333.39099, "t": 659.53638, "r": 339.35904, "b": 666.0499, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": "IEEE International Conference on Computer Vision", "bbox": {"l": 341.56299, "t": 659.57124, "r": 485.8273, "b": 666.05687, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": ", ICCV, pages 2980-2988.", "bbox": {"l": 485.82901, "t": 659.53638, "r": 559.27356, "b": 666.0499, "coord_origin": "TOPLEFT"}}, {"id": 208, "text": "IEEE Computer Society, Oct 2017.", "bbox": {"l": 333.39099, "t": 667.50636, "r": 429.30161000000004, "b": 674.01989, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[12] Kaiming He, Georgia Gkioxari, Piotr Doll\u00e1r, and Ross B. Girshick. Mask R-CNN. In IEEE International Conference on Computer Vision , ICCV, pages 2980-2988. IEEE Computer Society, Oct 2017."}, {"label": "list_item", "id": 23, "page_no": 7, "cluster": {"id": 23, "label": "list_item", "bbox": {"l": 317.95499, "t": 675.47636, "r": 558.97156, "b": 705.900894, "coord_origin": "TOPLEFT"}, "confidence": 0.889543354511261, "cells": [{"id": 209, "text": "[13]", "bbox": {"l": 317.95499, "t": 675.47636, "r": 330.11407, "b": 681.9898900000001, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": "Glenn Jocher, Alex Stoken, Ayush Chaurasia, Jirka Borovec, NanoCode012,", "bbox": {"l": 331.96533, "t": 675.47636, "r": 558.96716, "b": 681.9898900000001, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "TaoXie, Yonghye Kwon, Kalen Michael, Liu Changyu, Jiacong Fang, Abhiram V,", "bbox": {"l": 333.18201, "t": 683.44637, "r": 558.96661, "b": 689.95989, "coord_origin": "TOPLEFT"}}, {"id": 212, "text": "Laughing, tkianai, yxNONG, Piotr Skalski, Adam Hogan, Jebastin Nadar, imyhxy,", "bbox": {"l": 333.39099, "t": 691.41737, "r": 558.97156, "b": 697.930893, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "Lorenzo Mammana, Alex Wang, Cristi Fati, Diego Montes, Jan Hajek, Laurentiu", "bbox": {"l": 333.39099, "t": 699.387367, "r": 558.20001, "b": 705.900894, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[13] Glenn Jocher, Alex Stoken, Ayush Chaurasia, Jirka Borovec, NanoCode012, TaoXie, Yonghye Kwon, Kalen Michael, Liu Changyu, Jiacong Fang, Abhiram V, Laughing, tkianai, yxNONG, Piotr Skalski, Adam Hogan, Jebastin Nadar, imyhxy, Lorenzo Mammana, Alex Wang, Cristi Fati, Diego Montes, Jan Hajek, Laurentiu"}], "headers": [{"label": "page_header", "id": 24, "page_no": 7, "cluster": {"id": 24, "label": "page_header", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.7984216809272766, "cells": [{"id": 0, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 246.24382, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar", "bbox": {"l": 253.13897999999998, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "KDD '22, August 14-18, 2022, Washington, DC, USA Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar"}]}}, {"page_no": 8, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "4bed2a8aa51ac37058e79605821bbc426d032b0b6ca8bdf3409ed8508ccd8c67", "bbox": {"l": 231.8804, "t": 301.50543, "r": 235.14504999999997, "b": 414.69144, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "2f2a06d08f5ad565d0f5e815f4ddf666365b2cff435cdaeb8850217e8a8efabf", "bbox": {"l": 395.06876, "t": 117.37183000000005, "r": 398.33353, "b": 230.55786, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "7f2fd7293e04bf4f1756ae51f5779764933da1d1d2002e3915356050570fc75b", "bbox": {"l": 55.775887, "t": 301.50543, "r": 59.04052000000001, "b": 414.69144, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "1b81cf65f47456ad4faa725d1eb09879bd633af16cfe2bf8cea661b87907bfac", "bbox": {"l": 232.01364, "t": 117.37183000000005, "r": 235.27841000000004, "b": 230.55786, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "b60da9d26f488cb133e47d101d35fda1bdca2671ade60764d1cd569590270327", "bbox": {"l": 395.20047, "t": 301.50543, "r": 398.46512, "b": 414.69144, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "2b7b8355a42ebef0cf91583aad9f30f7c9fa63c5b05911730ba15275c024965b$^{A}$", "bbox": {"l": 55.775818, "t": 117.37183000000005, "r": 65.409912, "b": 230.55786, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "B", "bbox": {"l": 234.56980999999996, "t": 88.50183000000015, "r": 240.06987, "b": 97.01098999999988, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "C", "bbox": {"l": 397.81934, "t": 88.89355, "r": 403.3194, "b": 97.40270999999996, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "D", "bbox": {"l": 59.909843, "t": 266.75885000000005, "r": 65.409912, "b": 275.26793999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "E", "bbox": {"l": 234.77386, "t": 266.36707, "r": 239.85495000000003, "b": 274.87616, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "F", "bbox": {"l": 398.26144, "t": 266.75885000000005, "r": 402.91592, "b": 275.26793999999995, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Text", "bbox": {"l": 62.323874999999994, "t": 442.28543, "r": 70.895882, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Caption", "bbox": {"l": 80.16581, "t": 442.28543, "r": 95.565453, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "List-Item", "bbox": {"l": 104.94447, "t": 442.28543, "r": 122.38113000000001, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Formula", "bbox": {"l": 131.78354, "t": 442.28543, "r": 148.34625, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "Table", "bbox": {"l": 157.66106, "t": 442.28543, "r": 168.53032, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Section-Header", "bbox": {"l": 201.24315, "t": 442.28543, "r": 232.00499, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Picture", "bbox": {"l": 177.8381, "t": 442.28543, "r": 191.88956, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Page-Header", "bbox": {"l": 240.95844000000002, "t": 442.28543, "r": 266.61908, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Page-Footer", "bbox": {"l": 276.03928, "t": 442.28543, "r": 300.33261, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "Title", "bbox": {"l": 309.74615, "t": 442.28543, "r": 318.50473, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Figure 6: Example layout predictions on selected pages from the DocLayNet test-set. (A, D) exhibit favourable results on", "bbox": {"l": 53.79800000000001, "t": 464.48199, "r": 558.203, "b": 472.95523, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "coloured backgrounds. (B, C) show accurate list-item and paragraph differentiation despite densely-spaced lines. (E) demon-", "bbox": {"l": 53.79800000000001, "t": 475.44101, "r": 559.80786, "b": 483.91425, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "strates good table and figure distinction. (F) shows predictions on a Chinese patent with multiple overlaps, label confusion", "bbox": {"l": 53.79800000000001, "t": 486.39999, "r": 558.20294, "b": 494.87323, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "and missing boxes.", "bbox": {"l": 53.79800000000001, "t": 497.358, "r": 130.37105, "b": 505.83124, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Diaconu, Mai Thanh Minh, Marc, albinxavi, fatih, oleg, and wanghao yang. ul-", "bbox": {"l": 69.234001, "t": 527.06635, "r": 295.22406, "b": 533.5799, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "tralytics/yolov5: v6.0 - yolov5n nano models, roboflow integration, tensorflow", "bbox": {"l": 69.234001, "t": 535.03638, "r": 294.30612, "b": 541.5499, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "export, opencv dnn support, October 2021.", "bbox": {"l": 69.234001, "t": 543.00638, "r": 190.45259, "b": 549.5199, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "[14]", "bbox": {"l": 53.79800000000001, "t": 550.97638, "r": 65.286942, "b": 557.4899, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Nicolas Carion, Francisco Massa, Gabriel Synnaeve, Nicolas Usunier, Alexander", "bbox": {"l": 67.036171, "t": 550.97638, "r": 294.17709, "b": 557.4899, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Kirillov, and Sergey Zagoruyko. End-to-end object detection with transformers.", "bbox": {"l": 69.234001, "t": 558.94638, "r": 295.12177, "b": 565.4599000000001, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "CoRR", "bbox": {"l": 69.234001, "t": 566.95123, "r": 84.388069, "b": 573.43686, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": ", abs/2005.12872, 2020.", "bbox": {"l": 84.388, "t": 566.91635, "r": 147.7659, "b": 573.42989, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "[15]", "bbox": {"l": 53.79800000000001, "t": 574.88635, "r": 64.994034, "b": 581.39989, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Mingxing Tan, Ruoming Pang, and Quoc V. Le. Efficientdet: Scalable and efficient", "bbox": {"l": 66.698669, "t": 574.88635, "r": 294.04224, "b": 581.39989, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "object detection.", "bbox": {"l": 69.234001, "t": 582.85736, "r": 116.1049, "b": 589.3709, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "CoRR", "bbox": {"l": 118.616, "t": 582.89224, "r": 133.77007, "b": 589.37787, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": ", abs/1911.09070, 2019.", "bbox": {"l": 133.77, "t": 582.85736, "r": 197.14792, "b": 589.3709, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "[16]", "bbox": {"l": 53.79800399999999, "t": 590.82736, "r": 65.110367, "b": 597.3409, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Tsung-Yi Lin, Michael Maire, Serge J. Belongie, Lubomir D. Bourdev, Ross B. Gir-", "bbox": {"l": 66.832718, "t": 590.82736, "r": 295.22263, "b": 597.3409, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "shick, James Hays, Pietro Perona, Deva Ramanan, Piotr Doll\u00e1r, and C. Lawrence", "bbox": {"l": 69.234001, "t": 598.79736, "r": 294.04462, "b": 605.3109, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Zitnick. Microsoft COCO: common objects in context, 2014.", "bbox": {"l": 69.234001, "t": 606.76736, "r": 239.71553000000003, "b": 613.2809, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "[17]", "bbox": {"l": 53.79800000000001, "t": 614.7373699999999, "r": 65.177979, "b": 621.2509, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Yuxin Wu, Alexander Kirillov, Francisco Massa, Wan-Yen Lo, and Ross Girshick.", "bbox": {"l": 66.910622, "t": 614.7373699999999, "r": 295.12009, "b": 621.2509, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "Detectron2, 2019.", "bbox": {"l": 69.234001, "t": 622.70737, "r": 118.65732, "b": 629.22089, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "[18]", "bbox": {"l": 53.79800000000001, "t": 630.67737, "r": 65.022064, "b": 637.19089, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Nikolaos Livathinos, Cesar Berrospi, Maksym Lysak, Viktor Kuropiatnyk, Ahmed", "bbox": {"l": 66.730972, "t": 630.67737, "r": 294.04224, "b": 637.19089, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "Nassar, Andre Carvalho, Michele Dolfi, Christoph Auer, Kasper Dinkla, and Peter", "bbox": {"l": 69.234001, "t": 638.64737, "r": 294.17896, "b": 645.16089, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "W.", "bbox": {"l": 68.900002, "t": 646.6173699999999, "r": 76.877083, "b": 653.13089, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "J. Staar. Robust pdf document conversion using recurrent neural networks. In", "bbox": {"l": 78.580124, "t": 646.6173699999999, "r": 294.04312, "b": 653.13089, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Proceedings of the 35th Conference on Artificial Intelligence", "bbox": {"l": 69.234001, "t": 654.62325, "r": 233.43309000000002, "b": 661.10887, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": ", AAAI, pages 15137-", "bbox": {"l": 233.43401000000003, "t": 654.58838, "r": 294.8089, "b": 661.1019, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "15145, feb 2021.", "bbox": {"l": 69.073997, "t": 662.55836, "r": 113.53197, "b": 669.0718899999999, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "[19]", "bbox": {"l": 53.797997, "t": 670.52837, "r": 65.760811, "b": 677.04189, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Yiheng Xu, Minghao Li, Lei Cui, Shaohan Huang, Furu Wei, and Ming Zhou.", "bbox": {"l": 67.582199, "t": 670.52837, "r": 295.11609, "b": 677.04189, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Layoutlm: Pre-training of text and layout for document image understanding.", "bbox": {"l": 69.234001, "t": 678.49837, "r": 295.11606, "b": 685.01189, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "In", "bbox": {"l": 69.234001, "t": 686.46837, "r": 75.155228, "b": 692.981895, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Proceedings of the 26th ACM SIGKDD International Conference on Knowledge", "bbox": {"l": 76.891998, "t": 686.50323, "r": 294.04382, "b": 692.988869, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Discovery and Data Mining", "bbox": {"l": 69.234001, "t": 694.473236, "r": 144.91022, "b": 700.95887, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": ", KDD, pages 1192-1200, New York, USA, 2020. Asso-", "bbox": {"l": 144.908, "t": 694.4383700000001, "r": 295.22174, "b": 700.951897, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "ciation for Computing Machinery.", "bbox": {"l": 69.234001, "t": 702.408363, "r": 166.37207, "b": 708.92189, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "[20]", "bbox": {"l": 317.95499, "t": 527.06638, "r": 329.24017, "b": 533.57993, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "Shoubin Li, Xuyan Ma, Shuaiqun Pan, Jun Hu, Lin Shi, and Qing Wang. Vtlayout:", "bbox": {"l": 330.95837, "t": 527.06638, "r": 559.02637, "b": 533.57993, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "Fusion of visual and text features for document layout analysis, 2021.", "bbox": {"l": 333.39099, "t": 535.03638, "r": 530.03815, "b": 541.5499, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "[21]", "bbox": {"l": 317.95499, "t": 543.00638, "r": 329.54419, "b": 549.5199, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "Peng Zhang, Can Li, Liang Qiao, Zhanzhan Cheng, Shiliang Pu, Yi Niu, and Fei", "bbox": {"l": 331.30869, "t": 543.00638, "r": 558.20135, "b": 549.5199, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "Wu. Vsr: A unified framework for document layout analysis combining vision,", "bbox": {"l": 333.05701, "t": 550.97638, "r": 558.9715, "b": 557.4899, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "semantics and relations, 2021.", "bbox": {"l": 333.39099, "t": 558.94638, "r": 418.05988, "b": 565.4599000000001, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "[22]", "bbox": {"l": 317.95499, "t": 566.91638, "r": 330.14108, "b": 573.4299, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Peter W J Staar, Michele Dolfi, Christoph Auer, and Costas Bekas.", "bbox": {"l": 331.99646, "t": 566.91638, "r": 531.54553, "b": 573.4299, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "Corpus", "bbox": {"l": 537.12946, "t": 566.91635, "r": 558.19897, "b": 573.42989, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "conversion service: A machine learning platform to ingest documents at scale.", "bbox": {"l": 333.39099, "t": 574.88635, "r": 559.27539, "b": 581.39989, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "In", "bbox": {"l": 333.39099, "t": 582.85736, "r": 339.31223, "b": 589.3709, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "Proceedings of the 24th ACM SIGKDD International Conference on Knowledge", "bbox": {"l": 341.04901, "t": 582.89224, "r": 558.20081, "b": 589.37787, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "Discovery and Data Mining", "bbox": {"l": 333.39099, "t": 590.8622399999999, "r": 409.56577, "b": 597.3478700000001, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": ", KDD, pages 774-782. ACM, 2018.", "bbox": {"l": 409.56598, "t": 590.82736, "r": 507.31765999999993, "b": 597.3409, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "[23]", "bbox": {"l": 317.95499, "t": 598.79736, "r": 329.37976, "b": 605.3109, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "Connor Shorten and Taghi M. Khoshgoftaar. A survey on image data augmenta-", "bbox": {"l": 331.11923, "t": 598.79736, "r": 559.3783, "b": 605.3109, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "tion for deep learning.", "bbox": {"l": 333.39099, "t": 606.76736, "r": 396.9223, "b": 613.2809, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Journal of Big Data", "bbox": {"l": 399.43298, "t": 606.80225, "r": 453.66122, "b": 613.28787, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": ", 6(1):60, 2019.", "bbox": {"l": 453.66199, "t": 606.76736, "r": 493.49631, "b": 613.2809, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 13, "label": "page_header", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.8021690249443054, "cells": [{"id": 0, "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "page_header", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.8429245352745056, "cells": [{"id": 1, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "picture", "bbox": {"l": 52.963985443115234, "t": 84.73588562011719, "r": 556.931640625, "b": 442.1351318359375, "coord_origin": "TOPLEFT"}, "confidence": 0.8352116942405701, "cells": [{"id": 2, "text": "4bed2a8aa51ac37058e79605821bbc426d032b0b6ca8bdf3409ed8508ccd8c67", "bbox": {"l": 231.8804, "t": 301.50543, "r": 235.14504999999997, "b": 414.69144, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "2f2a06d08f5ad565d0f5e815f4ddf666365b2cff435cdaeb8850217e8a8efabf", "bbox": {"l": 395.06876, "t": 117.37183000000005, "r": 398.33353, "b": 230.55786, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "7f2fd7293e04bf4f1756ae51f5779764933da1d1d2002e3915356050570fc75b", "bbox": {"l": 55.775887, "t": 301.50543, "r": 59.04052000000001, "b": 414.69144, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "1b81cf65f47456ad4faa725d1eb09879bd633af16cfe2bf8cea661b87907bfac", "bbox": {"l": 232.01364, "t": 117.37183000000005, "r": 235.27841000000004, "b": 230.55786, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "b60da9d26f488cb133e47d101d35fda1bdca2671ade60764d1cd569590270327", "bbox": {"l": 395.20047, "t": 301.50543, "r": 398.46512, "b": 414.69144, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "2b7b8355a42ebef0cf91583aad9f30f7c9fa63c5b05911730ba15275c024965b$^{A}$", "bbox": {"l": 55.775818, "t": 117.37183000000005, "r": 65.409912, "b": 230.55786, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "B", "bbox": {"l": 234.56980999999996, "t": 88.50183000000015, "r": 240.06987, "b": 97.01098999999988, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "C", "bbox": {"l": 397.81934, "t": 88.89355, "r": 403.3194, "b": 97.40270999999996, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "D", "bbox": {"l": 59.909843, "t": 266.75885000000005, "r": 65.409912, "b": 275.26793999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "E", "bbox": {"l": 234.77386, "t": 266.36707, "r": 239.85495000000003, "b": 274.87616, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "F", "bbox": {"l": 398.26144, "t": 266.75885000000005, "r": 402.91592, "b": 275.26793999999995, "coord_origin": "TOPLEFT"}}], "children": [{"id": 17, "label": "text", "bbox": {"l": 231.8804, "t": 301.50543, "r": 235.14504999999997, "b": 414.69144, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 2, "text": "4bed2a8aa51ac37058e79605821bbc426d032b0b6ca8bdf3409ed8508ccd8c67", "bbox": {"l": 231.8804, "t": 301.50543, "r": 235.14504999999997, "b": 414.69144, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 395.06876, "t": 117.37183000000005, "r": 398.33353, "b": 230.55786, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 3, "text": "2f2a06d08f5ad565d0f5e815f4ddf666365b2cff435cdaeb8850217e8a8efabf", "bbox": {"l": 395.06876, "t": 117.37183000000005, "r": 398.33353, "b": 230.55786, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 55.775887, "t": 301.50543, "r": 59.04052000000001, "b": 414.69144, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 4, "text": "7f2fd7293e04bf4f1756ae51f5779764933da1d1d2002e3915356050570fc75b", "bbox": {"l": 55.775887, "t": 301.50543, "r": 59.04052000000001, "b": 414.69144, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 232.01364, "t": 117.37183000000005, "r": 235.27841000000004, "b": 230.55786, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 5, "text": "1b81cf65f47456ad4faa725d1eb09879bd633af16cfe2bf8cea661b87907bfac", "bbox": {"l": 232.01364, "t": 117.37183000000005, "r": 235.27841000000004, "b": 230.55786, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 395.20047, "t": 301.50543, "r": 398.46512, "b": 414.69144, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": "b60da9d26f488cb133e47d101d35fda1bdca2671ade60764d1cd569590270327", "bbox": {"l": 395.20047, "t": 301.50543, "r": 398.46512, "b": 414.69144, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 55.775818, "t": 117.37183000000005, "r": 65.409912, "b": 230.55786, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "2b7b8355a42ebef0cf91583aad9f30f7c9fa63c5b05911730ba15275c024965b$^{A}$", "bbox": {"l": 55.775818, "t": 117.37183000000005, "r": 65.409912, "b": 230.55786, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 234.56980999999996, "t": 88.50183000000015, "r": 240.06987, "b": 97.01098999999988, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "B", "bbox": {"l": 234.56980999999996, "t": 88.50183000000015, "r": 240.06987, "b": 97.01098999999988, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 397.81934, "t": 88.89355, "r": 403.3194, "b": 97.40270999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "C", "bbox": {"l": 397.81934, "t": 88.89355, "r": 403.3194, "b": 97.40270999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 59.909843, "t": 266.75885000000005, "r": 65.409912, "b": 275.26793999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "D", "bbox": {"l": 59.909843, "t": 266.75885000000005, "r": 65.409912, "b": 275.26793999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 234.77386, "t": 266.36707, "r": 239.85495000000003, "b": 274.87616, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "E", "bbox": {"l": 234.77386, "t": 266.36707, "r": 239.85495000000003, "b": 274.87616, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 398.26144, "t": 266.75885000000005, "r": 402.91592, "b": 275.26793999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "F", "bbox": {"l": 398.26144, "t": 266.75885000000005, "r": 402.91592, "b": 275.26793999999995, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 16, "label": "caption", "bbox": {"l": 62.323874999999994, "t": 442.28543, "r": 318.50473, "b": 448.26483, "coord_origin": "TOPLEFT"}, "confidence": 0.6248989701271057, "cells": [{"id": 13, "text": "Text", "bbox": {"l": 62.323874999999994, "t": 442.28543, "r": 70.895882, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Caption", "bbox": {"l": 80.16581, "t": 442.28543, "r": 95.565453, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "List-Item", "bbox": {"l": 104.94447, "t": 442.28543, "r": 122.38113000000001, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Formula", "bbox": {"l": 131.78354, "t": 442.28543, "r": 148.34625, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "Table", "bbox": {"l": 157.66106, "t": 442.28543, "r": 168.53032, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Section-Header", "bbox": {"l": 201.24315, "t": 442.28543, "r": 232.00499, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Picture", "bbox": {"l": 177.8381, "t": 442.28543, "r": 191.88956, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Page-Header", "bbox": {"l": 240.95844000000002, "t": 442.28543, "r": 266.61908, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Page-Footer", "bbox": {"l": 276.03928, "t": 442.28543, "r": 300.33261, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "Title", "bbox": {"l": 309.74615, "t": 442.28543, "r": 318.50473, "b": 448.26483, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "text", "bbox": {"l": 53.79800000000001, "t": 464.48199, "r": 559.80786, "b": 505.83124, "coord_origin": "TOPLEFT"}, "confidence": 0.8651240468025208, "cells": [{"id": 23, "text": "Figure 6: Example layout predictions on selected pages from the DocLayNet test-set. (A, D) exhibit favourable results on", "bbox": {"l": 53.79800000000001, "t": 464.48199, "r": 558.203, "b": 472.95523, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "coloured backgrounds. (B, C) show accurate list-item and paragraph differentiation despite densely-spaced lines. (E) demon-", "bbox": {"l": 53.79800000000001, "t": 475.44101, "r": 559.80786, "b": 483.91425, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "strates good table and figure distinction. (F) shows predictions on a Chinese patent with multiple overlaps, label confusion", "bbox": {"l": 53.79800000000001, "t": 486.39999, "r": 558.20294, "b": 494.87323, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "and missing boxes.", "bbox": {"l": 53.79800000000001, "t": 497.358, "r": 130.37105, "b": 505.83124, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "text", "bbox": {"l": 69.234001, "t": 527.06635, "r": 295.22406, "b": 549.5199, "coord_origin": "TOPLEFT"}, "confidence": 0.8445900082588196, "cells": [{"id": 27, "text": "Diaconu, Mai Thanh Minh, Marc, albinxavi, fatih, oleg, and wanghao yang. ul-", "bbox": {"l": 69.234001, "t": 527.06635, "r": 295.22406, "b": 533.5799, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "tralytics/yolov5: v6.0 - yolov5n nano models, roboflow integration, tensorflow", "bbox": {"l": 69.234001, "t": 535.03638, "r": 294.30612, "b": 541.5499, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "export, opencv dnn support, October 2021.", "bbox": {"l": 69.234001, "t": 543.00638, "r": 190.45259, "b": 549.5199, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "list_item", "bbox": {"l": 53.79800000000001, "t": 550.97638, "r": 295.12177, "b": 573.43686, "coord_origin": "TOPLEFT"}, "confidence": 0.8561117053031921, "cells": [{"id": 30, "text": "[14]", "bbox": {"l": 53.79800000000001, "t": 550.97638, "r": 65.286942, "b": 557.4899, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Nicolas Carion, Francisco Massa, Gabriel Synnaeve, Nicolas Usunier, Alexander", "bbox": {"l": 67.036171, "t": 550.97638, "r": 294.17709, "b": 557.4899, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Kirillov, and Sergey Zagoruyko. End-to-end object detection with transformers.", "bbox": {"l": 69.234001, "t": 558.94638, "r": 295.12177, "b": 565.4599000000001, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "CoRR", "bbox": {"l": 69.234001, "t": 566.95123, "r": 84.388069, "b": 573.43686, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": ", abs/2005.12872, 2020.", "bbox": {"l": 84.388, "t": 566.91635, "r": 147.7659, "b": 573.42989, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "list_item", "bbox": {"l": 53.79800000000001, "t": 574.88635, "r": 294.04224, "b": 589.37787, "coord_origin": "TOPLEFT"}, "confidence": 0.8615185618400574, "cells": [{"id": 35, "text": "[15]", "bbox": {"l": 53.79800000000001, "t": 574.88635, "r": 64.994034, "b": 581.39989, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Mingxing Tan, Ruoming Pang, and Quoc V. Le. Efficientdet: Scalable and efficient", "bbox": {"l": 66.698669, "t": 574.88635, "r": 294.04224, "b": 581.39989, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "object detection.", "bbox": {"l": 69.234001, "t": 582.85736, "r": 116.1049, "b": 589.3709, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "CoRR", "bbox": {"l": 118.616, "t": 582.89224, "r": 133.77007, "b": 589.37787, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": ", abs/1911.09070, 2019.", "bbox": {"l": 133.77, "t": 582.85736, "r": 197.14792, "b": 589.3709, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "list_item", "bbox": {"l": 53.79800399999999, "t": 590.82736, "r": 295.22263, "b": 613.2809, "coord_origin": "TOPLEFT"}, "confidence": 0.859420895576477, "cells": [{"id": 40, "text": "[16]", "bbox": {"l": 53.79800399999999, "t": 590.82736, "r": 65.110367, "b": 597.3409, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Tsung-Yi Lin, Michael Maire, Serge J. Belongie, Lubomir D. Bourdev, Ross B. Gir-", "bbox": {"l": 66.832718, "t": 590.82736, "r": 295.22263, "b": 597.3409, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "shick, James Hays, Pietro Perona, Deva Ramanan, Piotr Doll\u00e1r, and C. Lawrence", "bbox": {"l": 69.234001, "t": 598.79736, "r": 294.04462, "b": 605.3109, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Zitnick. Microsoft COCO: common objects in context, 2014.", "bbox": {"l": 69.234001, "t": 606.76736, "r": 239.71553000000003, "b": 613.2809, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "list_item", "bbox": {"l": 53.79800000000001, "t": 614.7373699999999, "r": 295.12009, "b": 629.22089, "coord_origin": "TOPLEFT"}, "confidence": 0.8385182023048401, "cells": [{"id": 44, "text": "[17]", "bbox": {"l": 53.79800000000001, "t": 614.7373699999999, "r": 65.177979, "b": 621.2509, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Yuxin Wu, Alexander Kirillov, Francisco Massa, Wan-Yen Lo, and Ross Girshick.", "bbox": {"l": 66.910622, "t": 614.7373699999999, "r": 295.12009, "b": 621.2509, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "Detectron2, 2019.", "bbox": {"l": 69.234001, "t": 622.70737, "r": 118.65732, "b": 629.22089, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "list_item", "bbox": {"l": 53.79800000000001, "t": 630.67737, "r": 294.8089, "b": 669.0718899999999, "coord_origin": "TOPLEFT"}, "confidence": 0.8362045288085938, "cells": [{"id": 47, "text": "[18]", "bbox": {"l": 53.79800000000001, "t": 630.67737, "r": 65.022064, "b": 637.19089, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Nikolaos Livathinos, Cesar Berrospi, Maksym Lysak, Viktor Kuropiatnyk, Ahmed", "bbox": {"l": 66.730972, "t": 630.67737, "r": 294.04224, "b": 637.19089, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "Nassar, Andre Carvalho, Michele Dolfi, Christoph Auer, Kasper Dinkla, and Peter", "bbox": {"l": 69.234001, "t": 638.64737, "r": 294.17896, "b": 645.16089, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "W.", "bbox": {"l": 68.900002, "t": 646.6173699999999, "r": 76.877083, "b": 653.13089, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "J. Staar. Robust pdf document conversion using recurrent neural networks. In", "bbox": {"l": 78.580124, "t": 646.6173699999999, "r": 294.04312, "b": 653.13089, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Proceedings of the 35th Conference on Artificial Intelligence", "bbox": {"l": 69.234001, "t": 654.62325, "r": 233.43309000000002, "b": 661.10887, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": ", AAAI, pages 15137-", "bbox": {"l": 233.43401000000003, "t": 654.58838, "r": 294.8089, "b": 661.1019, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "15145, feb 2021.", "bbox": {"l": 69.073997, "t": 662.55836, "r": 113.53197, "b": 669.0718899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "list_item", "bbox": {"l": 53.797997, "t": 670.52837, "r": 295.22174, "b": 708.92189, "coord_origin": "TOPLEFT"}, "confidence": 0.7421631217002869, "cells": [{"id": 55, "text": "[19]", "bbox": {"l": 53.797997, "t": 670.52837, "r": 65.760811, "b": 677.04189, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Yiheng Xu, Minghao Li, Lei Cui, Shaohan Huang, Furu Wei, and Ming Zhou.", "bbox": {"l": 67.582199, "t": 670.52837, "r": 295.11609, "b": 677.04189, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Layoutlm: Pre-training of text and layout for document image understanding.", "bbox": {"l": 69.234001, "t": 678.49837, "r": 295.11606, "b": 685.01189, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "In", "bbox": {"l": 69.234001, "t": 686.46837, "r": 75.155228, "b": 692.981895, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Proceedings of the 26th ACM SIGKDD International Conference on Knowledge", "bbox": {"l": 76.891998, "t": 686.50323, "r": 294.04382, "b": 692.988869, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Discovery and Data Mining", "bbox": {"l": 69.234001, "t": 694.473236, "r": 144.91022, "b": 700.95887, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": ", KDD, pages 1192-1200, New York, USA, 2020. Asso-", "bbox": {"l": 144.908, "t": 694.4383700000001, "r": 295.22174, "b": 700.951897, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "ciation for Computing Machinery.", "bbox": {"l": 69.234001, "t": 702.408363, "r": 166.37207, "b": 708.92189, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "list_item", "bbox": {"l": 317.95499, "t": 527.06638, "r": 559.02637, "b": 541.5499, "coord_origin": "TOPLEFT"}, "confidence": 0.9088895320892334, "cells": [{"id": 63, "text": "[20]", "bbox": {"l": 317.95499, "t": 527.06638, "r": 329.24017, "b": 533.57993, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "Shoubin Li, Xuyan Ma, Shuaiqun Pan, Jun Hu, Lin Shi, and Qing Wang. Vtlayout:", "bbox": {"l": 330.95837, "t": 527.06638, "r": 559.02637, "b": 533.57993, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "Fusion of visual and text features for document layout analysis, 2021.", "bbox": {"l": 333.39099, "t": 535.03638, "r": 530.03815, "b": 541.5499, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "list_item", "bbox": {"l": 317.95499, "t": 543.00638, "r": 558.9715, "b": 565.4599000000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9247174859046936, "cells": [{"id": 66, "text": "[21]", "bbox": {"l": 317.95499, "t": 543.00638, "r": 329.54419, "b": 549.5199, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "Peng Zhang, Can Li, Liang Qiao, Zhanzhan Cheng, Shiliang Pu, Yi Niu, and Fei", "bbox": {"l": 331.30869, "t": 543.00638, "r": 558.20135, "b": 549.5199, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "Wu. Vsr: A unified framework for document layout analysis combining vision,", "bbox": {"l": 333.05701, "t": 550.97638, "r": 558.9715, "b": 557.4899, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "semantics and relations, 2021.", "bbox": {"l": 333.39099, "t": 558.94638, "r": 418.05988, "b": 565.4599000000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "list_item", "bbox": {"l": 317.95499, "t": 566.91635, "r": 559.27539, "b": 597.3478700000001, "coord_origin": "TOPLEFT"}, "confidence": 0.8956930637359619, "cells": [{"id": 70, "text": "[22]", "bbox": {"l": 317.95499, "t": 566.91638, "r": 330.14108, "b": 573.4299, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Peter W J Staar, Michele Dolfi, Christoph Auer, and Costas Bekas.", "bbox": {"l": 331.99646, "t": 566.91638, "r": 531.54553, "b": 573.4299, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "Corpus", "bbox": {"l": 537.12946, "t": 566.91635, "r": 558.19897, "b": 573.42989, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "conversion service: A machine learning platform to ingest documents at scale.", "bbox": {"l": 333.39099, "t": 574.88635, "r": 559.27539, "b": 581.39989, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "In", "bbox": {"l": 333.39099, "t": 582.85736, "r": 339.31223, "b": 589.3709, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "Proceedings of the 24th ACM SIGKDD International Conference on Knowledge", "bbox": {"l": 341.04901, "t": 582.89224, "r": 558.20081, "b": 589.37787, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "Discovery and Data Mining", "bbox": {"l": 333.39099, "t": 590.8622399999999, "r": 409.56577, "b": 597.3478700000001, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": ", KDD, pages 774-782. ACM, 2018.", "bbox": {"l": 409.56598, "t": 590.82736, "r": 507.31765999999993, "b": 597.3409, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "list_item", "bbox": {"l": 317.95499, "t": 598.79736, "r": 559.3783, "b": 613.28787, "coord_origin": "TOPLEFT"}, "confidence": 0.8972970843315125, "cells": [{"id": 78, "text": "[23]", "bbox": {"l": 317.95499, "t": 598.79736, "r": 329.37976, "b": 605.3109, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "Connor Shorten and Taghi M. Khoshgoftaar. A survey on image data augmenta-", "bbox": {"l": 331.11923, "t": 598.79736, "r": 559.3783, "b": 605.3109, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "tion for deep learning.", "bbox": {"l": 333.39099, "t": 606.76736, "r": 396.9223, "b": 613.2809, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Journal of Big Data", "bbox": {"l": 399.43298, "t": 606.80225, "r": 453.66122, "b": 613.28787, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": ", 6(1):60, 2019.", "bbox": {"l": 453.66199, "t": 606.76736, "r": 493.49631, "b": 613.2809, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_header", "id": 13, "page_no": 8, "cluster": {"id": 13, "label": "page_header", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.8021690249443054, "cells": [{"id": 0, "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis"}, {"label": "page_header", "id": 9, "page_no": 8, "cluster": {"id": 9, "label": "page_header", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.8429245352745056, "cells": [{"id": 1, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA"}, {"label": "picture", "id": 12, "page_no": 8, "cluster": {"id": 12, "label": "picture", "bbox": {"l": 52.963985443115234, "t": 84.73588562011719, "r": 556.931640625, "b": 442.1351318359375, "coord_origin": "TOPLEFT"}, "confidence": 0.8352116942405701, "cells": [{"id": 2, "text": "4bed2a8aa51ac37058e79605821bbc426d032b0b6ca8bdf3409ed8508ccd8c67", "bbox": {"l": 231.8804, "t": 301.50543, "r": 235.14504999999997, "b": 414.69144, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "2f2a06d08f5ad565d0f5e815f4ddf666365b2cff435cdaeb8850217e8a8efabf", "bbox": {"l": 395.06876, "t": 117.37183000000005, "r": 398.33353, "b": 230.55786, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "7f2fd7293e04bf4f1756ae51f5779764933da1d1d2002e3915356050570fc75b", "bbox": {"l": 55.775887, "t": 301.50543, "r": 59.04052000000001, "b": 414.69144, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "1b81cf65f47456ad4faa725d1eb09879bd633af16cfe2bf8cea661b87907bfac", "bbox": {"l": 232.01364, "t": 117.37183000000005, "r": 235.27841000000004, "b": 230.55786, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "b60da9d26f488cb133e47d101d35fda1bdca2671ade60764d1cd569590270327", "bbox": {"l": 395.20047, "t": 301.50543, "r": 398.46512, "b": 414.69144, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "2b7b8355a42ebef0cf91583aad9f30f7c9fa63c5b05911730ba15275c024965b$^{A}$", "bbox": {"l": 55.775818, "t": 117.37183000000005, "r": 65.409912, "b": 230.55786, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "B", "bbox": {"l": 234.56980999999996, "t": 88.50183000000015, "r": 240.06987, "b": 97.01098999999988, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "C", "bbox": {"l": 397.81934, "t": 88.89355, "r": 403.3194, "b": 97.40270999999996, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "D", "bbox": {"l": 59.909843, "t": 266.75885000000005, "r": 65.409912, "b": 275.26793999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "E", "bbox": {"l": 234.77386, "t": 266.36707, "r": 239.85495000000003, "b": 274.87616, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "F", "bbox": {"l": 398.26144, "t": 266.75885000000005, "r": 402.91592, "b": 275.26793999999995, "coord_origin": "TOPLEFT"}}], "children": [{"id": 17, "label": "text", "bbox": {"l": 231.8804, "t": 301.50543, "r": 235.14504999999997, "b": 414.69144, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 2, "text": "4bed2a8aa51ac37058e79605821bbc426d032b0b6ca8bdf3409ed8508ccd8c67", "bbox": {"l": 231.8804, "t": 301.50543, "r": 235.14504999999997, "b": 414.69144, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 395.06876, "t": 117.37183000000005, "r": 398.33353, "b": 230.55786, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 3, "text": "2f2a06d08f5ad565d0f5e815f4ddf666365b2cff435cdaeb8850217e8a8efabf", "bbox": {"l": 395.06876, "t": 117.37183000000005, "r": 398.33353, "b": 230.55786, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 55.775887, "t": 301.50543, "r": 59.04052000000001, "b": 414.69144, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 4, "text": "7f2fd7293e04bf4f1756ae51f5779764933da1d1d2002e3915356050570fc75b", "bbox": {"l": 55.775887, "t": 301.50543, "r": 59.04052000000001, "b": 414.69144, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 232.01364, "t": 117.37183000000005, "r": 235.27841000000004, "b": 230.55786, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 5, "text": "1b81cf65f47456ad4faa725d1eb09879bd633af16cfe2bf8cea661b87907bfac", "bbox": {"l": 232.01364, "t": 117.37183000000005, "r": 235.27841000000004, "b": 230.55786, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 395.20047, "t": 301.50543, "r": 398.46512, "b": 414.69144, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": "b60da9d26f488cb133e47d101d35fda1bdca2671ade60764d1cd569590270327", "bbox": {"l": 395.20047, "t": 301.50543, "r": 398.46512, "b": 414.69144, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 55.775818, "t": 117.37183000000005, "r": 65.409912, "b": 230.55786, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "2b7b8355a42ebef0cf91583aad9f30f7c9fa63c5b05911730ba15275c024965b$^{A}$", "bbox": {"l": 55.775818, "t": 117.37183000000005, "r": 65.409912, "b": 230.55786, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 234.56980999999996, "t": 88.50183000000015, "r": 240.06987, "b": 97.01098999999988, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "B", "bbox": {"l": 234.56980999999996, "t": 88.50183000000015, "r": 240.06987, "b": 97.01098999999988, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 397.81934, "t": 88.89355, "r": 403.3194, "b": 97.40270999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "C", "bbox": {"l": 397.81934, "t": 88.89355, "r": 403.3194, "b": 97.40270999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 59.909843, "t": 266.75885000000005, "r": 65.409912, "b": 275.26793999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "D", "bbox": {"l": 59.909843, "t": 266.75885000000005, "r": 65.409912, "b": 275.26793999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 234.77386, "t": 266.36707, "r": 239.85495000000003, "b": 274.87616, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "E", "bbox": {"l": 234.77386, "t": 266.36707, "r": 239.85495000000003, "b": 274.87616, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 398.26144, "t": 266.75885000000005, "r": 402.91592, "b": 275.26793999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "F", "bbox": {"l": 398.26144, "t": 266.75885000000005, "r": 402.91592, "b": 275.26793999999995, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "caption", "id": 16, "page_no": 8, "cluster": {"id": 16, "label": "caption", "bbox": {"l": 62.323874999999994, "t": 442.28543, "r": 318.50473, "b": 448.26483, "coord_origin": "TOPLEFT"}, "confidence": 0.6248989701271057, "cells": [{"id": 13, "text": "Text", "bbox": {"l": 62.323874999999994, "t": 442.28543, "r": 70.895882, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Caption", "bbox": {"l": 80.16581, "t": 442.28543, "r": 95.565453, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "List-Item", "bbox": {"l": 104.94447, "t": 442.28543, "r": 122.38113000000001, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Formula", "bbox": {"l": 131.78354, "t": 442.28543, "r": 148.34625, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "Table", "bbox": {"l": 157.66106, "t": 442.28543, "r": 168.53032, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Section-Header", "bbox": {"l": 201.24315, "t": 442.28543, "r": 232.00499, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Picture", "bbox": {"l": 177.8381, "t": 442.28543, "r": 191.88956, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Page-Header", "bbox": {"l": 240.95844000000002, "t": 442.28543, "r": 266.61908, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Page-Footer", "bbox": {"l": 276.03928, "t": 442.28543, "r": 300.33261, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "Title", "bbox": {"l": 309.74615, "t": 442.28543, "r": 318.50473, "b": 448.26483, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Text Caption List-Item Formula Table Section-Header Picture Page-Header Page-Footer Title"}, {"label": "text", "id": 4, "page_no": 8, "cluster": {"id": 4, "label": "text", "bbox": {"l": 53.79800000000001, "t": 464.48199, "r": 559.80786, "b": 505.83124, "coord_origin": "TOPLEFT"}, "confidence": 0.8651240468025208, "cells": [{"id": 23, "text": "Figure 6: Example layout predictions on selected pages from the DocLayNet test-set. (A, D) exhibit favourable results on", "bbox": {"l": 53.79800000000001, "t": 464.48199, "r": 558.203, "b": 472.95523, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "coloured backgrounds. (B, C) show accurate list-item and paragraph differentiation despite densely-spaced lines. (E) demon-", "bbox": {"l": 53.79800000000001, "t": 475.44101, "r": 559.80786, "b": 483.91425, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "strates good table and figure distinction. (F) shows predictions on a Chinese patent with multiple overlaps, label confusion", "bbox": {"l": 53.79800000000001, "t": 486.39999, "r": 558.20294, "b": 494.87323, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "and missing boxes.", "bbox": {"l": 53.79800000000001, "t": 497.358, "r": 130.37105, "b": 505.83124, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 6: Example layout predictions on selected pages from the DocLayNet test-set. (A, D) exhibit favourable results on coloured backgrounds. (B, C) show accurate list-item and paragraph differentiation despite densely-spaced lines. (E) demonstrates good table and figure distinction. (F) shows predictions on a Chinese patent with multiple overlaps, label confusion and missing boxes."}, {"label": "text", "id": 8, "page_no": 8, "cluster": {"id": 8, "label": "text", "bbox": {"l": 69.234001, "t": 527.06635, "r": 295.22406, "b": 549.5199, "coord_origin": "TOPLEFT"}, "confidence": 0.8445900082588196, "cells": [{"id": 27, "text": "Diaconu, Mai Thanh Minh, Marc, albinxavi, fatih, oleg, and wanghao yang. ul-", "bbox": {"l": 69.234001, "t": 527.06635, "r": 295.22406, "b": 533.5799, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "tralytics/yolov5: v6.0 - yolov5n nano models, roboflow integration, tensorflow", "bbox": {"l": 69.234001, "t": 535.03638, "r": 294.30612, "b": 541.5499, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "export, opencv dnn support, October 2021.", "bbox": {"l": 69.234001, "t": 543.00638, "r": 190.45259, "b": 549.5199, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Diaconu, Mai Thanh Minh, Marc, albinxavi, fatih, oleg, and wanghao yang. ultralytics/yolov5: v6.0 - yolov5n nano models, roboflow integration, tensorflow export, opencv dnn support, October 2021."}, {"label": "list_item", "id": 7, "page_no": 8, "cluster": {"id": 7, "label": "list_item", "bbox": {"l": 53.79800000000001, "t": 550.97638, "r": 295.12177, "b": 573.43686, "coord_origin": "TOPLEFT"}, "confidence": 0.8561117053031921, "cells": [{"id": 30, "text": "[14]", "bbox": {"l": 53.79800000000001, "t": 550.97638, "r": 65.286942, "b": 557.4899, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Nicolas Carion, Francisco Massa, Gabriel Synnaeve, Nicolas Usunier, Alexander", "bbox": {"l": 67.036171, "t": 550.97638, "r": 294.17709, "b": 557.4899, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Kirillov, and Sergey Zagoruyko. End-to-end object detection with transformers.", "bbox": {"l": 69.234001, "t": 558.94638, "r": 295.12177, "b": 565.4599000000001, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "CoRR", "bbox": {"l": 69.234001, "t": 566.95123, "r": 84.388069, "b": 573.43686, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": ", abs/2005.12872, 2020.", "bbox": {"l": 84.388, "t": 566.91635, "r": 147.7659, "b": 573.42989, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[14] Nicolas Carion, Francisco Massa, Gabriel Synnaeve, Nicolas Usunier, Alexander Kirillov, and Sergey Zagoruyko. End-to-end object detection with transformers. CoRR , abs/2005.12872, 2020."}, {"label": "list_item", "id": 5, "page_no": 8, "cluster": {"id": 5, "label": "list_item", "bbox": {"l": 53.79800000000001, "t": 574.88635, "r": 294.04224, "b": 589.37787, "coord_origin": "TOPLEFT"}, "confidence": 0.8615185618400574, "cells": [{"id": 35, "text": "[15]", "bbox": {"l": 53.79800000000001, "t": 574.88635, "r": 64.994034, "b": 581.39989, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Mingxing Tan, Ruoming Pang, and Quoc V. Le. Efficientdet: Scalable and efficient", "bbox": {"l": 66.698669, "t": 574.88635, "r": 294.04224, "b": 581.39989, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "object detection.", "bbox": {"l": 69.234001, "t": 582.85736, "r": 116.1049, "b": 589.3709, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "CoRR", "bbox": {"l": 118.616, "t": 582.89224, "r": 133.77007, "b": 589.37787, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": ", abs/1911.09070, 2019.", "bbox": {"l": 133.77, "t": 582.85736, "r": 197.14792, "b": 589.3709, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[15] Mingxing Tan, Ruoming Pang, and Quoc V. Le. Efficientdet: Scalable and efficient object detection. CoRR , abs/1911.09070, 2019."}, {"label": "list_item", "id": 6, "page_no": 8, "cluster": {"id": 6, "label": "list_item", "bbox": {"l": 53.79800399999999, "t": 590.82736, "r": 295.22263, "b": 613.2809, "coord_origin": "TOPLEFT"}, "confidence": 0.859420895576477, "cells": [{"id": 40, "text": "[16]", "bbox": {"l": 53.79800399999999, "t": 590.82736, "r": 65.110367, "b": 597.3409, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Tsung-Yi Lin, Michael Maire, Serge J. Belongie, Lubomir D. Bourdev, Ross B. Gir-", "bbox": {"l": 66.832718, "t": 590.82736, "r": 295.22263, "b": 597.3409, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "shick, James Hays, Pietro Perona, Deva Ramanan, Piotr Doll\u00e1r, and C. Lawrence", "bbox": {"l": 69.234001, "t": 598.79736, "r": 294.04462, "b": 605.3109, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Zitnick. Microsoft COCO: common objects in context, 2014.", "bbox": {"l": 69.234001, "t": 606.76736, "r": 239.71553000000003, "b": 613.2809, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[16] Tsung-Yi Lin, Michael Maire, Serge J. Belongie, Lubomir D. Bourdev, Ross B. Girshick, James Hays, Pietro Perona, Deva Ramanan, Piotr Doll\u00e1r, and C. Lawrence Zitnick. Microsoft COCO: common objects in context, 2014."}, {"label": "list_item", "id": 10, "page_no": 8, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 53.79800000000001, "t": 614.7373699999999, "r": 295.12009, "b": 629.22089, "coord_origin": "TOPLEFT"}, "confidence": 0.8385182023048401, "cells": [{"id": 44, "text": "[17]", "bbox": {"l": 53.79800000000001, "t": 614.7373699999999, "r": 65.177979, "b": 621.2509, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Yuxin Wu, Alexander Kirillov, Francisco Massa, Wan-Yen Lo, and Ross Girshick.", "bbox": {"l": 66.910622, "t": 614.7373699999999, "r": 295.12009, "b": 621.2509, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "Detectron2, 2019.", "bbox": {"l": 69.234001, "t": 622.70737, "r": 118.65732, "b": 629.22089, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[17] Yuxin Wu, Alexander Kirillov, Francisco Massa, Wan-Yen Lo, and Ross Girshick. Detectron2, 2019."}, {"label": "list_item", "id": 11, "page_no": 8, "cluster": {"id": 11, "label": "list_item", "bbox": {"l": 53.79800000000001, "t": 630.67737, "r": 294.8089, "b": 669.0718899999999, "coord_origin": "TOPLEFT"}, "confidence": 0.8362045288085938, "cells": [{"id": 47, "text": "[18]", "bbox": {"l": 53.79800000000001, "t": 630.67737, "r": 65.022064, "b": 637.19089, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Nikolaos Livathinos, Cesar Berrospi, Maksym Lysak, Viktor Kuropiatnyk, Ahmed", "bbox": {"l": 66.730972, "t": 630.67737, "r": 294.04224, "b": 637.19089, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "Nassar, Andre Carvalho, Michele Dolfi, Christoph Auer, Kasper Dinkla, and Peter", "bbox": {"l": 69.234001, "t": 638.64737, "r": 294.17896, "b": 645.16089, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "W.", "bbox": {"l": 68.900002, "t": 646.6173699999999, "r": 76.877083, "b": 653.13089, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "J. Staar. Robust pdf document conversion using recurrent neural networks. In", "bbox": {"l": 78.580124, "t": 646.6173699999999, "r": 294.04312, "b": 653.13089, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Proceedings of the 35th Conference on Artificial Intelligence", "bbox": {"l": 69.234001, "t": 654.62325, "r": 233.43309000000002, "b": 661.10887, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": ", AAAI, pages 15137-", "bbox": {"l": 233.43401000000003, "t": 654.58838, "r": 294.8089, "b": 661.1019, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "15145, feb 2021.", "bbox": {"l": 69.073997, "t": 662.55836, "r": 113.53197, "b": 669.0718899999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[18] Nikolaos Livathinos, Cesar Berrospi, Maksym Lysak, Viktor Kuropiatnyk, Ahmed Nassar, Andre Carvalho, Michele Dolfi, Christoph Auer, Kasper Dinkla, and Peter W. J. Staar. Robust pdf document conversion using recurrent neural networks. In Proceedings of the 35th Conference on Artificial Intelligence , AAAI, pages 1513715145, feb 2021."}, {"label": "list_item", "id": 14, "page_no": 8, "cluster": {"id": 14, "label": "list_item", "bbox": {"l": 53.797997, "t": 670.52837, "r": 295.22174, "b": 708.92189, "coord_origin": "TOPLEFT"}, "confidence": 0.7421631217002869, "cells": [{"id": 55, "text": "[19]", "bbox": {"l": 53.797997, "t": 670.52837, "r": 65.760811, "b": 677.04189, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Yiheng Xu, Minghao Li, Lei Cui, Shaohan Huang, Furu Wei, and Ming Zhou.", "bbox": {"l": 67.582199, "t": 670.52837, "r": 295.11609, "b": 677.04189, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Layoutlm: Pre-training of text and layout for document image understanding.", "bbox": {"l": 69.234001, "t": 678.49837, "r": 295.11606, "b": 685.01189, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "In", "bbox": {"l": 69.234001, "t": 686.46837, "r": 75.155228, "b": 692.981895, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Proceedings of the 26th ACM SIGKDD International Conference on Knowledge", "bbox": {"l": 76.891998, "t": 686.50323, "r": 294.04382, "b": 692.988869, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Discovery and Data Mining", "bbox": {"l": 69.234001, "t": 694.473236, "r": 144.91022, "b": 700.95887, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": ", KDD, pages 1192-1200, New York, USA, 2020. Asso-", "bbox": {"l": 144.908, "t": 694.4383700000001, "r": 295.22174, "b": 700.951897, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "ciation for Computing Machinery.", "bbox": {"l": 69.234001, "t": 702.408363, "r": 166.37207, "b": 708.92189, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[19] Yiheng Xu, Minghao Li, Lei Cui, Shaohan Huang, Furu Wei, and Ming Zhou. Layoutlm: Pre-training of text and layout for document image understanding. In Proceedings of the 26th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining , KDD, pages 1192-1200, New York, USA, 2020. Association for Computing Machinery."}, {"label": "list_item", "id": 1, "page_no": 8, "cluster": {"id": 1, "label": "list_item", "bbox": {"l": 317.95499, "t": 527.06638, "r": 559.02637, "b": 541.5499, "coord_origin": "TOPLEFT"}, "confidence": 0.9088895320892334, "cells": [{"id": 63, "text": "[20]", "bbox": {"l": 317.95499, "t": 527.06638, "r": 329.24017, "b": 533.57993, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "Shoubin Li, Xuyan Ma, Shuaiqun Pan, Jun Hu, Lin Shi, and Qing Wang. Vtlayout:", "bbox": {"l": 330.95837, "t": 527.06638, "r": 559.02637, "b": 533.57993, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "Fusion of visual and text features for document layout analysis, 2021.", "bbox": {"l": 333.39099, "t": 535.03638, "r": 530.03815, "b": 541.5499, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[20] Shoubin Li, Xuyan Ma, Shuaiqun Pan, Jun Hu, Lin Shi, and Qing Wang. Vtlayout: Fusion of visual and text features for document layout analysis, 2021."}, {"label": "list_item", "id": 0, "page_no": 8, "cluster": {"id": 0, "label": "list_item", "bbox": {"l": 317.95499, "t": 543.00638, "r": 558.9715, "b": 565.4599000000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9247174859046936, "cells": [{"id": 66, "text": "[21]", "bbox": {"l": 317.95499, "t": 543.00638, "r": 329.54419, "b": 549.5199, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "Peng Zhang, Can Li, Liang Qiao, Zhanzhan Cheng, Shiliang Pu, Yi Niu, and Fei", "bbox": {"l": 331.30869, "t": 543.00638, "r": 558.20135, "b": 549.5199, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "Wu. Vsr: A unified framework for document layout analysis combining vision,", "bbox": {"l": 333.05701, "t": 550.97638, "r": 558.9715, "b": 557.4899, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "semantics and relations, 2021.", "bbox": {"l": 333.39099, "t": 558.94638, "r": 418.05988, "b": 565.4599000000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[21] Peng Zhang, Can Li, Liang Qiao, Zhanzhan Cheng, Shiliang Pu, Yi Niu, and Fei Wu. Vsr: A unified framework for document layout analysis combining vision, semantics and relations, 2021."}, {"label": "list_item", "id": 3, "page_no": 8, "cluster": {"id": 3, "label": "list_item", "bbox": {"l": 317.95499, "t": 566.91635, "r": 559.27539, "b": 597.3478700000001, "coord_origin": "TOPLEFT"}, "confidence": 0.8956930637359619, "cells": [{"id": 70, "text": "[22]", "bbox": {"l": 317.95499, "t": 566.91638, "r": 330.14108, "b": 573.4299, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Peter W J Staar, Michele Dolfi, Christoph Auer, and Costas Bekas.", "bbox": {"l": 331.99646, "t": 566.91638, "r": 531.54553, "b": 573.4299, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "Corpus", "bbox": {"l": 537.12946, "t": 566.91635, "r": 558.19897, "b": 573.42989, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "conversion service: A machine learning platform to ingest documents at scale.", "bbox": {"l": 333.39099, "t": 574.88635, "r": 559.27539, "b": 581.39989, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "In", "bbox": {"l": 333.39099, "t": 582.85736, "r": 339.31223, "b": 589.3709, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "Proceedings of the 24th ACM SIGKDD International Conference on Knowledge", "bbox": {"l": 341.04901, "t": 582.89224, "r": 558.20081, "b": 589.37787, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "Discovery and Data Mining", "bbox": {"l": 333.39099, "t": 590.8622399999999, "r": 409.56577, "b": 597.3478700000001, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": ", KDD, pages 774-782. ACM, 2018.", "bbox": {"l": 409.56598, "t": 590.82736, "r": 507.31765999999993, "b": 597.3409, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[22] Peter W J Staar, Michele Dolfi, Christoph Auer, and Costas Bekas. Corpus conversion service: A machine learning platform to ingest documents at scale. In Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining , KDD, pages 774-782. ACM, 2018."}, {"label": "list_item", "id": 2, "page_no": 8, "cluster": {"id": 2, "label": "list_item", "bbox": {"l": 317.95499, "t": 598.79736, "r": 559.3783, "b": 613.28787, "coord_origin": "TOPLEFT"}, "confidence": 0.8972970843315125, "cells": [{"id": 78, "text": "[23]", "bbox": {"l": 317.95499, "t": 598.79736, "r": 329.37976, "b": 605.3109, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "Connor Shorten and Taghi M. Khoshgoftaar. A survey on image data augmenta-", "bbox": {"l": 331.11923, "t": 598.79736, "r": 559.3783, "b": 605.3109, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "tion for deep learning.", "bbox": {"l": 333.39099, "t": 606.76736, "r": 396.9223, "b": 613.2809, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Journal of Big Data", "bbox": {"l": 399.43298, "t": 606.80225, "r": 453.66122, "b": 613.28787, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": ", 6(1):60, 2019.", "bbox": {"l": 453.66199, "t": 606.76736, "r": 493.49631, "b": 613.2809, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[23] Connor Shorten and Taghi M. Khoshgoftaar. A survey on image data augmentation for deep learning. Journal of Big Data , 6(1):60, 2019."}], "body": [{"label": "picture", "id": 12, "page_no": 8, "cluster": {"id": 12, "label": "picture", "bbox": {"l": 52.963985443115234, "t": 84.73588562011719, "r": 556.931640625, "b": 442.1351318359375, "coord_origin": "TOPLEFT"}, "confidence": 0.8352116942405701, "cells": [{"id": 2, "text": "4bed2a8aa51ac37058e79605821bbc426d032b0b6ca8bdf3409ed8508ccd8c67", "bbox": {"l": 231.8804, "t": 301.50543, "r": 235.14504999999997, "b": 414.69144, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "2f2a06d08f5ad565d0f5e815f4ddf666365b2cff435cdaeb8850217e8a8efabf", "bbox": {"l": 395.06876, "t": 117.37183000000005, "r": 398.33353, "b": 230.55786, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "7f2fd7293e04bf4f1756ae51f5779764933da1d1d2002e3915356050570fc75b", "bbox": {"l": 55.775887, "t": 301.50543, "r": 59.04052000000001, "b": 414.69144, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "1b81cf65f47456ad4faa725d1eb09879bd633af16cfe2bf8cea661b87907bfac", "bbox": {"l": 232.01364, "t": 117.37183000000005, "r": 235.27841000000004, "b": 230.55786, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "b60da9d26f488cb133e47d101d35fda1bdca2671ade60764d1cd569590270327", "bbox": {"l": 395.20047, "t": 301.50543, "r": 398.46512, "b": 414.69144, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "2b7b8355a42ebef0cf91583aad9f30f7c9fa63c5b05911730ba15275c024965b$^{A}$", "bbox": {"l": 55.775818, "t": 117.37183000000005, "r": 65.409912, "b": 230.55786, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "B", "bbox": {"l": 234.56980999999996, "t": 88.50183000000015, "r": 240.06987, "b": 97.01098999999988, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "C", "bbox": {"l": 397.81934, "t": 88.89355, "r": 403.3194, "b": 97.40270999999996, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "D", "bbox": {"l": 59.909843, "t": 266.75885000000005, "r": 65.409912, "b": 275.26793999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "E", "bbox": {"l": 234.77386, "t": 266.36707, "r": 239.85495000000003, "b": 274.87616, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "F", "bbox": {"l": 398.26144, "t": 266.75885000000005, "r": 402.91592, "b": 275.26793999999995, "coord_origin": "TOPLEFT"}}], "children": [{"id": 17, "label": "text", "bbox": {"l": 231.8804, "t": 301.50543, "r": 235.14504999999997, "b": 414.69144, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 2, "text": "4bed2a8aa51ac37058e79605821bbc426d032b0b6ca8bdf3409ed8508ccd8c67", "bbox": {"l": 231.8804, "t": 301.50543, "r": 235.14504999999997, "b": 414.69144, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 395.06876, "t": 117.37183000000005, "r": 398.33353, "b": 230.55786, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 3, "text": "2f2a06d08f5ad565d0f5e815f4ddf666365b2cff435cdaeb8850217e8a8efabf", "bbox": {"l": 395.06876, "t": 117.37183000000005, "r": 398.33353, "b": 230.55786, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 55.775887, "t": 301.50543, "r": 59.04052000000001, "b": 414.69144, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 4, "text": "7f2fd7293e04bf4f1756ae51f5779764933da1d1d2002e3915356050570fc75b", "bbox": {"l": 55.775887, "t": 301.50543, "r": 59.04052000000001, "b": 414.69144, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 232.01364, "t": 117.37183000000005, "r": 235.27841000000004, "b": 230.55786, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 5, "text": "1b81cf65f47456ad4faa725d1eb09879bd633af16cfe2bf8cea661b87907bfac", "bbox": {"l": 232.01364, "t": 117.37183000000005, "r": 235.27841000000004, "b": 230.55786, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 395.20047, "t": 301.50543, "r": 398.46512, "b": 414.69144, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": "b60da9d26f488cb133e47d101d35fda1bdca2671ade60764d1cd569590270327", "bbox": {"l": 395.20047, "t": 301.50543, "r": 398.46512, "b": 414.69144, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 55.775818, "t": 117.37183000000005, "r": 65.409912, "b": 230.55786, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "2b7b8355a42ebef0cf91583aad9f30f7c9fa63c5b05911730ba15275c024965b$^{A}$", "bbox": {"l": 55.775818, "t": 117.37183000000005, "r": 65.409912, "b": 230.55786, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 234.56980999999996, "t": 88.50183000000015, "r": 240.06987, "b": 97.01098999999988, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "B", "bbox": {"l": 234.56980999999996, "t": 88.50183000000015, "r": 240.06987, "b": 97.01098999999988, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 397.81934, "t": 88.89355, "r": 403.3194, "b": 97.40270999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "C", "bbox": {"l": 397.81934, "t": 88.89355, "r": 403.3194, "b": 97.40270999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 59.909843, "t": 266.75885000000005, "r": 65.409912, "b": 275.26793999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "D", "bbox": {"l": 59.909843, "t": 266.75885000000005, "r": 65.409912, "b": 275.26793999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 234.77386, "t": 266.36707, "r": 239.85495000000003, "b": 274.87616, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "E", "bbox": {"l": 234.77386, "t": 266.36707, "r": 239.85495000000003, "b": 274.87616, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 398.26144, "t": 266.75885000000005, "r": 402.91592, "b": 275.26793999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "F", "bbox": {"l": 398.26144, "t": 266.75885000000005, "r": 402.91592, "b": 275.26793999999995, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "caption", "id": 16, "page_no": 8, "cluster": {"id": 16, "label": "caption", "bbox": {"l": 62.323874999999994, "t": 442.28543, "r": 318.50473, "b": 448.26483, "coord_origin": "TOPLEFT"}, "confidence": 0.6248989701271057, "cells": [{"id": 13, "text": "Text", "bbox": {"l": 62.323874999999994, "t": 442.28543, "r": 70.895882, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Caption", "bbox": {"l": 80.16581, "t": 442.28543, "r": 95.565453, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "List-Item", "bbox": {"l": 104.94447, "t": 442.28543, "r": 122.38113000000001, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Formula", "bbox": {"l": 131.78354, "t": 442.28543, "r": 148.34625, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "Table", "bbox": {"l": 157.66106, "t": 442.28543, "r": 168.53032, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Section-Header", "bbox": {"l": 201.24315, "t": 442.28543, "r": 232.00499, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Picture", "bbox": {"l": 177.8381, "t": 442.28543, "r": 191.88956, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Page-Header", "bbox": {"l": 240.95844000000002, "t": 442.28543, "r": 266.61908, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Page-Footer", "bbox": {"l": 276.03928, "t": 442.28543, "r": 300.33261, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "Title", "bbox": {"l": 309.74615, "t": 442.28543, "r": 318.50473, "b": 448.26483, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Text Caption List-Item Formula Table Section-Header Picture Page-Header Page-Footer Title"}, {"label": "text", "id": 4, "page_no": 8, "cluster": {"id": 4, "label": "text", "bbox": {"l": 53.79800000000001, "t": 464.48199, "r": 559.80786, "b": 505.83124, "coord_origin": "TOPLEFT"}, "confidence": 0.8651240468025208, "cells": [{"id": 23, "text": "Figure 6: Example layout predictions on selected pages from the DocLayNet test-set. (A, D) exhibit favourable results on", "bbox": {"l": 53.79800000000001, "t": 464.48199, "r": 558.203, "b": 472.95523, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "coloured backgrounds. (B, C) show accurate list-item and paragraph differentiation despite densely-spaced lines. (E) demon-", "bbox": {"l": 53.79800000000001, "t": 475.44101, "r": 559.80786, "b": 483.91425, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "strates good table and figure distinction. (F) shows predictions on a Chinese patent with multiple overlaps, label confusion", "bbox": {"l": 53.79800000000001, "t": 486.39999, "r": 558.20294, "b": 494.87323, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "and missing boxes.", "bbox": {"l": 53.79800000000001, "t": 497.358, "r": 130.37105, "b": 505.83124, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 6: Example layout predictions on selected pages from the DocLayNet test-set. (A, D) exhibit favourable results on coloured backgrounds. (B, C) show accurate list-item and paragraph differentiation despite densely-spaced lines. (E) demonstrates good table and figure distinction. (F) shows predictions on a Chinese patent with multiple overlaps, label confusion and missing boxes."}, {"label": "text", "id": 8, "page_no": 8, "cluster": {"id": 8, "label": "text", "bbox": {"l": 69.234001, "t": 527.06635, "r": 295.22406, "b": 549.5199, "coord_origin": "TOPLEFT"}, "confidence": 0.8445900082588196, "cells": [{"id": 27, "text": "Diaconu, Mai Thanh Minh, Marc, albinxavi, fatih, oleg, and wanghao yang. ul-", "bbox": {"l": 69.234001, "t": 527.06635, "r": 295.22406, "b": 533.5799, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "tralytics/yolov5: v6.0 - yolov5n nano models, roboflow integration, tensorflow", "bbox": {"l": 69.234001, "t": 535.03638, "r": 294.30612, "b": 541.5499, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "export, opencv dnn support, October 2021.", "bbox": {"l": 69.234001, "t": 543.00638, "r": 190.45259, "b": 549.5199, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Diaconu, Mai Thanh Minh, Marc, albinxavi, fatih, oleg, and wanghao yang. ultralytics/yolov5: v6.0 - yolov5n nano models, roboflow integration, tensorflow export, opencv dnn support, October 2021."}, {"label": "list_item", "id": 7, "page_no": 8, "cluster": {"id": 7, "label": "list_item", "bbox": {"l": 53.79800000000001, "t": 550.97638, "r": 295.12177, "b": 573.43686, "coord_origin": "TOPLEFT"}, "confidence": 0.8561117053031921, "cells": [{"id": 30, "text": "[14]", "bbox": {"l": 53.79800000000001, "t": 550.97638, "r": 65.286942, "b": 557.4899, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Nicolas Carion, Francisco Massa, Gabriel Synnaeve, Nicolas Usunier, Alexander", "bbox": {"l": 67.036171, "t": 550.97638, "r": 294.17709, "b": 557.4899, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Kirillov, and Sergey Zagoruyko. End-to-end object detection with transformers.", "bbox": {"l": 69.234001, "t": 558.94638, "r": 295.12177, "b": 565.4599000000001, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "CoRR", "bbox": {"l": 69.234001, "t": 566.95123, "r": 84.388069, "b": 573.43686, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": ", abs/2005.12872, 2020.", "bbox": {"l": 84.388, "t": 566.91635, "r": 147.7659, "b": 573.42989, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[14] Nicolas Carion, Francisco Massa, Gabriel Synnaeve, Nicolas Usunier, Alexander Kirillov, and Sergey Zagoruyko. End-to-end object detection with transformers. CoRR , abs/2005.12872, 2020."}, {"label": "list_item", "id": 5, "page_no": 8, "cluster": {"id": 5, "label": "list_item", "bbox": {"l": 53.79800000000001, "t": 574.88635, "r": 294.04224, "b": 589.37787, "coord_origin": "TOPLEFT"}, "confidence": 0.8615185618400574, "cells": [{"id": 35, "text": "[15]", "bbox": {"l": 53.79800000000001, "t": 574.88635, "r": 64.994034, "b": 581.39989, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Mingxing Tan, Ruoming Pang, and Quoc V. Le. Efficientdet: Scalable and efficient", "bbox": {"l": 66.698669, "t": 574.88635, "r": 294.04224, "b": 581.39989, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "object detection.", "bbox": {"l": 69.234001, "t": 582.85736, "r": 116.1049, "b": 589.3709, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "CoRR", "bbox": {"l": 118.616, "t": 582.89224, "r": 133.77007, "b": 589.37787, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": ", abs/1911.09070, 2019.", "bbox": {"l": 133.77, "t": 582.85736, "r": 197.14792, "b": 589.3709, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[15] Mingxing Tan, Ruoming Pang, and Quoc V. Le. Efficientdet: Scalable and efficient object detection. CoRR , abs/1911.09070, 2019."}, {"label": "list_item", "id": 6, "page_no": 8, "cluster": {"id": 6, "label": "list_item", "bbox": {"l": 53.79800399999999, "t": 590.82736, "r": 295.22263, "b": 613.2809, "coord_origin": "TOPLEFT"}, "confidence": 0.859420895576477, "cells": [{"id": 40, "text": "[16]", "bbox": {"l": 53.79800399999999, "t": 590.82736, "r": 65.110367, "b": 597.3409, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Tsung-Yi Lin, Michael Maire, Serge J. Belongie, Lubomir D. Bourdev, Ross B. Gir-", "bbox": {"l": 66.832718, "t": 590.82736, "r": 295.22263, "b": 597.3409, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "shick, James Hays, Pietro Perona, Deva Ramanan, Piotr Doll\u00e1r, and C. Lawrence", "bbox": {"l": 69.234001, "t": 598.79736, "r": 294.04462, "b": 605.3109, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Zitnick. Microsoft COCO: common objects in context, 2014.", "bbox": {"l": 69.234001, "t": 606.76736, "r": 239.71553000000003, "b": 613.2809, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[16] Tsung-Yi Lin, Michael Maire, Serge J. Belongie, Lubomir D. Bourdev, Ross B. Girshick, James Hays, Pietro Perona, Deva Ramanan, Piotr Doll\u00e1r, and C. Lawrence Zitnick. Microsoft COCO: common objects in context, 2014."}, {"label": "list_item", "id": 10, "page_no": 8, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 53.79800000000001, "t": 614.7373699999999, "r": 295.12009, "b": 629.22089, "coord_origin": "TOPLEFT"}, "confidence": 0.8385182023048401, "cells": [{"id": 44, "text": "[17]", "bbox": {"l": 53.79800000000001, "t": 614.7373699999999, "r": 65.177979, "b": 621.2509, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Yuxin Wu, Alexander Kirillov, Francisco Massa, Wan-Yen Lo, and Ross Girshick.", "bbox": {"l": 66.910622, "t": 614.7373699999999, "r": 295.12009, "b": 621.2509, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "Detectron2, 2019.", "bbox": {"l": 69.234001, "t": 622.70737, "r": 118.65732, "b": 629.22089, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[17] Yuxin Wu, Alexander Kirillov, Francisco Massa, Wan-Yen Lo, and Ross Girshick. Detectron2, 2019."}, {"label": "list_item", "id": 11, "page_no": 8, "cluster": {"id": 11, "label": "list_item", "bbox": {"l": 53.79800000000001, "t": 630.67737, "r": 294.8089, "b": 669.0718899999999, "coord_origin": "TOPLEFT"}, "confidence": 0.8362045288085938, "cells": [{"id": 47, "text": "[18]", "bbox": {"l": 53.79800000000001, "t": 630.67737, "r": 65.022064, "b": 637.19089, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Nikolaos Livathinos, Cesar Berrospi, Maksym Lysak, Viktor Kuropiatnyk, Ahmed", "bbox": {"l": 66.730972, "t": 630.67737, "r": 294.04224, "b": 637.19089, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "Nassar, Andre Carvalho, Michele Dolfi, Christoph Auer, Kasper Dinkla, and Peter", "bbox": {"l": 69.234001, "t": 638.64737, "r": 294.17896, "b": 645.16089, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "W.", "bbox": {"l": 68.900002, "t": 646.6173699999999, "r": 76.877083, "b": 653.13089, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "J. Staar. Robust pdf document conversion using recurrent neural networks. In", "bbox": {"l": 78.580124, "t": 646.6173699999999, "r": 294.04312, "b": 653.13089, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Proceedings of the 35th Conference on Artificial Intelligence", "bbox": {"l": 69.234001, "t": 654.62325, "r": 233.43309000000002, "b": 661.10887, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": ", AAAI, pages 15137-", "bbox": {"l": 233.43401000000003, "t": 654.58838, "r": 294.8089, "b": 661.1019, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "15145, feb 2021.", "bbox": {"l": 69.073997, "t": 662.55836, "r": 113.53197, "b": 669.0718899999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[18] Nikolaos Livathinos, Cesar Berrospi, Maksym Lysak, Viktor Kuropiatnyk, Ahmed Nassar, Andre Carvalho, Michele Dolfi, Christoph Auer, Kasper Dinkla, and Peter W. J. Staar. Robust pdf document conversion using recurrent neural networks. In Proceedings of the 35th Conference on Artificial Intelligence , AAAI, pages 1513715145, feb 2021."}, {"label": "list_item", "id": 14, "page_no": 8, "cluster": {"id": 14, "label": "list_item", "bbox": {"l": 53.797997, "t": 670.52837, "r": 295.22174, "b": 708.92189, "coord_origin": "TOPLEFT"}, "confidence": 0.7421631217002869, "cells": [{"id": 55, "text": "[19]", "bbox": {"l": 53.797997, "t": 670.52837, "r": 65.760811, "b": 677.04189, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Yiheng Xu, Minghao Li, Lei Cui, Shaohan Huang, Furu Wei, and Ming Zhou.", "bbox": {"l": 67.582199, "t": 670.52837, "r": 295.11609, "b": 677.04189, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Layoutlm: Pre-training of text and layout for document image understanding.", "bbox": {"l": 69.234001, "t": 678.49837, "r": 295.11606, "b": 685.01189, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "In", "bbox": {"l": 69.234001, "t": 686.46837, "r": 75.155228, "b": 692.981895, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Proceedings of the 26th ACM SIGKDD International Conference on Knowledge", "bbox": {"l": 76.891998, "t": 686.50323, "r": 294.04382, "b": 692.988869, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Discovery and Data Mining", "bbox": {"l": 69.234001, "t": 694.473236, "r": 144.91022, "b": 700.95887, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": ", KDD, pages 1192-1200, New York, USA, 2020. Asso-", "bbox": {"l": 144.908, "t": 694.4383700000001, "r": 295.22174, "b": 700.951897, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "ciation for Computing Machinery.", "bbox": {"l": 69.234001, "t": 702.408363, "r": 166.37207, "b": 708.92189, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[19] Yiheng Xu, Minghao Li, Lei Cui, Shaohan Huang, Furu Wei, and Ming Zhou. Layoutlm: Pre-training of text and layout for document image understanding. In Proceedings of the 26th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining , KDD, pages 1192-1200, New York, USA, 2020. Association for Computing Machinery."}, {"label": "list_item", "id": 1, "page_no": 8, "cluster": {"id": 1, "label": "list_item", "bbox": {"l": 317.95499, "t": 527.06638, "r": 559.02637, "b": 541.5499, "coord_origin": "TOPLEFT"}, "confidence": 0.9088895320892334, "cells": [{"id": 63, "text": "[20]", "bbox": {"l": 317.95499, "t": 527.06638, "r": 329.24017, "b": 533.57993, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "Shoubin Li, Xuyan Ma, Shuaiqun Pan, Jun Hu, Lin Shi, and Qing Wang. Vtlayout:", "bbox": {"l": 330.95837, "t": 527.06638, "r": 559.02637, "b": 533.57993, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "Fusion of visual and text features for document layout analysis, 2021.", "bbox": {"l": 333.39099, "t": 535.03638, "r": 530.03815, "b": 541.5499, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[20] Shoubin Li, Xuyan Ma, Shuaiqun Pan, Jun Hu, Lin Shi, and Qing Wang. Vtlayout: Fusion of visual and text features for document layout analysis, 2021."}, {"label": "list_item", "id": 0, "page_no": 8, "cluster": {"id": 0, "label": "list_item", "bbox": {"l": 317.95499, "t": 543.00638, "r": 558.9715, "b": 565.4599000000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9247174859046936, "cells": [{"id": 66, "text": "[21]", "bbox": {"l": 317.95499, "t": 543.00638, "r": 329.54419, "b": 549.5199, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "Peng Zhang, Can Li, Liang Qiao, Zhanzhan Cheng, Shiliang Pu, Yi Niu, and Fei", "bbox": {"l": 331.30869, "t": 543.00638, "r": 558.20135, "b": 549.5199, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "Wu. Vsr: A unified framework for document layout analysis combining vision,", "bbox": {"l": 333.05701, "t": 550.97638, "r": 558.9715, "b": 557.4899, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "semantics and relations, 2021.", "bbox": {"l": 333.39099, "t": 558.94638, "r": 418.05988, "b": 565.4599000000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[21] Peng Zhang, Can Li, Liang Qiao, Zhanzhan Cheng, Shiliang Pu, Yi Niu, and Fei Wu. Vsr: A unified framework for document layout analysis combining vision, semantics and relations, 2021."}, {"label": "list_item", "id": 3, "page_no": 8, "cluster": {"id": 3, "label": "list_item", "bbox": {"l": 317.95499, "t": 566.91635, "r": 559.27539, "b": 597.3478700000001, "coord_origin": "TOPLEFT"}, "confidence": 0.8956930637359619, "cells": [{"id": 70, "text": "[22]", "bbox": {"l": 317.95499, "t": 566.91638, "r": 330.14108, "b": 573.4299, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Peter W J Staar, Michele Dolfi, Christoph Auer, and Costas Bekas.", "bbox": {"l": 331.99646, "t": 566.91638, "r": 531.54553, "b": 573.4299, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "Corpus", "bbox": {"l": 537.12946, "t": 566.91635, "r": 558.19897, "b": 573.42989, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "conversion service: A machine learning platform to ingest documents at scale.", "bbox": {"l": 333.39099, "t": 574.88635, "r": 559.27539, "b": 581.39989, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "In", "bbox": {"l": 333.39099, "t": 582.85736, "r": 339.31223, "b": 589.3709, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "Proceedings of the 24th ACM SIGKDD International Conference on Knowledge", "bbox": {"l": 341.04901, "t": 582.89224, "r": 558.20081, "b": 589.37787, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "Discovery and Data Mining", "bbox": {"l": 333.39099, "t": 590.8622399999999, "r": 409.56577, "b": 597.3478700000001, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": ", KDD, pages 774-782. ACM, 2018.", "bbox": {"l": 409.56598, "t": 590.82736, "r": 507.31765999999993, "b": 597.3409, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[22] Peter W J Staar, Michele Dolfi, Christoph Auer, and Costas Bekas. Corpus conversion service: A machine learning platform to ingest documents at scale. In Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining , KDD, pages 774-782. ACM, 2018."}, {"label": "list_item", "id": 2, "page_no": 8, "cluster": {"id": 2, "label": "list_item", "bbox": {"l": 317.95499, "t": 598.79736, "r": 559.3783, "b": 613.28787, "coord_origin": "TOPLEFT"}, "confidence": 0.8972970843315125, "cells": [{"id": 78, "text": "[23]", "bbox": {"l": 317.95499, "t": 598.79736, "r": 329.37976, "b": 605.3109, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "Connor Shorten and Taghi M. Khoshgoftaar. A survey on image data augmenta-", "bbox": {"l": 331.11923, "t": 598.79736, "r": 559.3783, "b": 605.3109, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "tion for deep learning.", "bbox": {"l": 333.39099, "t": 606.76736, "r": 396.9223, "b": 613.2809, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Journal of Big Data", "bbox": {"l": 399.43298, "t": 606.80225, "r": 453.66122, "b": 613.28787, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": ", 6(1):60, 2019.", "bbox": {"l": 453.66199, "t": 606.76736, "r": 493.49631, "b": 613.2809, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[23] Connor Shorten and Taghi M. Khoshgoftaar. A survey on image data augmentation for deep learning. Journal of Big Data , 6(1):60, 2019."}], "headers": [{"label": "page_header", "id": 13, "page_no": 8, "cluster": {"id": 13, "label": "page_header", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.8021690249443054, "cells": [{"id": 0, "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis"}, {"label": "page_header", "id": 9, "page_no": 8, "cluster": {"id": 9, "label": "page_header", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.8429245352745056, "cells": [{"id": 1, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA"}]}}]
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v1/2305.03393v1-pg9.doctags.txt b/tests/data/groundtruth/docling_v1/2305.03393v1-pg9.doctags.txt
index d2813af7..a909648b 100644
--- a/tests/data/groundtruth/docling_v1/2305.03393v1-pg9.doctags.txt
+++ b/tests/data/groundtruth/docling_v1/2305.03393v1-pg9.doctags.txt
@@ -2,7 +2,6 @@
 <paragraph><location><page_1><loc_22><loc_81><loc_79><loc_85></location>order to compute the TED score. Inference timing results for all experiments were obtained from the same machine on a single core with AMD EPYC 7763 CPU @2.45 GHz.</paragraph>
 <subtitle-level-1><location><page_1><loc_22><loc_77><loc_52><loc_79></location>5.1 Hyper Parameter Optimization</subtitle-level-1>
 <paragraph><location><page_1><loc_22><loc_68><loc_79><loc_77></location>We have chosen the PubTabNet data set to perform HPO, since it includes a highly diverse set of tables. Also we report TED scores separately for simple and complex tables (tables with cell spans). Results are presented in Table. 1. It is evident that with OTSL, our model achieves the same TED score and slightly better mAP scores in comparison to HTML. However OTSL yields a 2x speed up in the inference runtime over HTML.</paragraph>
-<caption><location><page_1><loc_22><loc_59><loc_79><loc_66></location>Table 1. HPO performed in OTSL and HTML representation on the same transformer-based TableFormer [9] architecture, trained only on PubTabNet [22]. Effects of reducing the # of layers in encoder and decoder stages of the model show that smaller models trained on OTSL perform better, especially in recognizing complex table structures, and maintain a much higher mAP score than the HTML counterpart.</caption>
 <table>
 <location><page_1><loc_23><loc_41><loc_78><loc_57></location>
 <caption>Table 1. HPO performed in OTSL and HTML representation on the same transformer-based TableFormer [9] architecture, trained only on PubTabNet [22]. Effects of reducing the # of layers in encoder and decoder stages of the model show that smaller models trained on OTSL perform better, especially in recognizing complex table structures, and maintain a much higher mAP score than the HTML counterpart.</caption>
@@ -14,6 +13,7 @@
 <row_5><col_0><body>2</col_0><col_1><body>4</col_1><col_2><body>HTML</col_2><col_3><body>0.945</col_3><col_4><body>0.897 0.901</col_4><col_5><body>0.915 0.931</col_5><col_6><body>0.859 0.834</col_6><col_7><body>1.91 3.81</col_7></row_5>
 <row_6><col_0><body>4</col_0><col_1><body>2</col_1><col_2><body>OTSL HTML</col_2><col_3><body>0.952 0.944</col_3><col_4><body>0.92 0.903</col_4><col_5><body>0.942 0.931</col_5><col_6><body>0.857 0.824</col_6><col_7><body>1.22 2</col_7></row_6>
 </table>
+<caption><location><page_1><loc_22><loc_59><loc_79><loc_66></location>Table 1. HPO performed in OTSL and HTML representation on the same transformer-based TableFormer [9] architecture, trained only on PubTabNet [22]. Effects of reducing the # of layers in encoder and decoder stages of the model show that smaller models trained on OTSL perform better, especially in recognizing complex table structures, and maintain a much higher mAP score than the HTML counterpart.</caption>
 <subtitle-level-1><location><page_1><loc_22><loc_35><loc_43><loc_36></location>5.2 Quantitative Results</subtitle-level-1>
 <paragraph><location><page_1><loc_22><loc_22><loc_79><loc_34></location>We picked the model parameter configuration that produced the best prediction quality (enc=6, dec=6, heads=8) with PubTabNet alone, then independently trained and evaluated it on three publicly available data sets: PubTabNet (395k samples), FinTabNet (113k samples) and PubTables-1M (about 1M samples). Performance results are presented in Table. 2. It is clearly evident that the model trained on OTSL outperforms HTML across the board, keeping high TEDs and mAP scores even on difficult financial tables (FinTabNet) that contain sparse and large tables.</paragraph>
 <paragraph><location><page_1><loc_22><loc_16><loc_79><loc_22></location>Additionally, the results show that OTSL has an advantage over HTML when applied on a bigger data set like PubTables-1M and achieves significantly improved scores. Finally, OTSL achieves faster inference due to fewer decoding steps which is a result of the reduced sequence representation.</paragraph>
diff --git a/tests/data/groundtruth/docling_v1/2305.03393v1-pg9.json b/tests/data/groundtruth/docling_v1/2305.03393v1-pg9.json
index d5036268..e830d3ac 100644
--- a/tests/data/groundtruth/docling_v1/2305.03393v1-pg9.json
+++ b/tests/data/groundtruth/docling_v1/2305.03393v1-pg9.json
@@ -1 +1 @@
-{"_name": "", "type": "pdf-document", "description": {"title": null, "abstract": null, "authors": null, "affiliations": null, "subjects": null, "keywords": null, "publication_date": null, "languages": null, "license": null, "publishers": null, "url_refs": null, "references": null, "publication": null, "reference_count": null, "citation_count": null, "citation_date": null, "advanced": null, "analytics": null, "logs": [], "collection": null, "acquisition": null}, "file-info": {"filename": "2305.03393v1-pg9.pdf", "filename-prov": null, "document-hash": "1a36870a3e6aa062b563b50c1eaed40685b651ee03e0538453de65e7013b742f", "#-pages": 1, "collection-name": null, "description": null, "page-hashes": [{"hash": "8a5a8d9a1ae6cbd1dcedcad02ed10195aa71d1ac3e4d56be4ab72c858d7f543e", "model": "default", "page": 1}]}, "main-text": [{"prov": [{"bbox": [194.47799682617188, 689.2177734375, 447.5447692871094, 700.5064697265625], "page": 1, "span": [0, 60], "__ref_s3_data": null}], "text": "Optimized Table Tokenization for Table Structure Recognition", "type": "page-header", "payload": null, "name": "Page-header", "font": null}, {"prov": [{"bbox": [475.9844055175781, 689.2177734375, 480.5931396484375, 700.5064697265625], "page": 1, "span": [0, 1], "__ref_s3_data": null}], "text": "9", "type": "page-header", "payload": null, "name": "Page-header", "font": null}, {"prov": [{"bbox": [134.76499938964844, 639.093017578125, 480.5966491699219, 675.5369873046875], "page": 1, "span": [0, 163], "__ref_s3_data": null}], "text": "order to compute the TED score. Inference timing results for all experiments were obtained from the same machine on a single core with AMD EPYC 7763 CPU @2.45 GHz.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [134.76499938964844, 612.7918090820312, 318.4514465332031, 625.2948608398438], "page": 1, "span": [0, 32], "__ref_s3_data": null}], "text": "5.1 Hyper Parameter Optimization", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [134.76499938964844, 536.5759887695312, 480.5956726074219, 608.8849487304688], "page": 1, "span": [0, 423], "__ref_s3_data": null}], "text": "We have chosen the PubTabNet data set to perform HPO, since it includes a highly diverse set of tables. Also we report TED scores separately for simple and complex tables (tables with cell spans). Results are presented in Table. 1. It is evident that with OTSL, our model achieves the same TED score and slightly better mAP scores in comparison to HTML. However OTSL yields a 2x speed up in the inference runtime over HTML.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [134.76499938964844, 464.017822265625, 480.5989074707031, 519.2052612304688], "page": 1, "span": [0, 398], "__ref_s3_data": null}], "text": "Table 1. HPO performed in OTSL and HTML representation on the same transformer-based TableFormer [9] architecture, trained only on PubTabNet [22]. Effects of reducing the # of layers in encoder and decoder stages of the model show that smaller models trained on OTSL perform better, especially in recognizing complex table structures, and maintain a much higher mAP score than the HTML counterpart.", "type": "caption", "payload": null, "name": "Caption", "font": null}, {"name": "Table", "type": "table", "$ref": "#/tables/0"}, {"prov": [{"bbox": [134.76499938964844, 273.8258056640625, 264.4082946777344, 286.3288879394531], "page": 1, "span": [0, 24], "__ref_s3_data": null}], "text": "5.2 Quantitative Results", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [134.76499938964844, 173.6999969482422, 480.72003173828125, 269.9199523925781], "page": 1, "span": [0, 555], "__ref_s3_data": null}], "text": "We picked the model parameter configuration that produced the best prediction quality (enc=6, dec=6, heads=8) with PubTabNet alone, then independently trained and evaluated it on three publicly available data sets: PubTabNet (395k samples), FinTabNet (113k samples) and PubTables-1M (about 1M samples). Performance results are presented in Table. 2. It is clearly evident that the model trained on OTSL outperforms HTML across the board, keeping high TEDs and mAP scores even on difficult financial tables (FinTabNet) that contain sparse and large tables.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [134.76499938964844, 125.87999725341797, 480.59857177734375, 174.2779541015625], "page": 1, "span": [0, 289], "__ref_s3_data": null}], "text": "Additionally, the results show that OTSL has an advantage over HTML when applied on a bigger data set like PubTables-1M and achieves significantly improved scores. Finally, OTSL achieves faster inference due to fewer decoding steps which is a result of the reduced sequence representation.", "type": "paragraph", "payload": null, "name": "Text", "font": null}], "figures": [], "tables": [{"prov": [{"bbox": [139.6674041748047, 322.5054626464844, 475.00927734375, 454.4546203613281], "page": 1, "span": [0, 0], "__ref_s3_data": null}], "text": "Table 1. HPO performed in OTSL and HTML representation on the same transformer-based TableFormer [9] architecture, trained only on PubTabNet [22]. Effects of reducing the # of layers in encoder and decoder stages of the model show that smaller models trained on OTSL perform better, especially in recognizing complex table structures, and maintain a much higher mAP score than the HTML counterpart.", "type": "table", "payload": null, "#-cols": 8, "#-rows": 7, "data": [[{"bbox": [160.3699951171875, 441.2538146972656, 168.04522705078125, 452.5425109863281], "spans": [[0, 0]], "text": "#", "type": "col_header", "col": 0, "col-header": true, "col-span": [0, 1], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [207.9739990234375, 441.2538146972656, 215.64923095703125, 452.5425109863281], "spans": [[0, 1]], "text": "#", "type": "col_header", "col": 1, "col-header": true, "col-span": [1, 2], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [239.79800415039062, 435.7748107910156, 278.33380126953125, 447.0635070800781], "spans": [[0, 2], [1, 2]], "text": "Language", "type": "col_header", "col": 2, "col-header": true, "col-span": [2, 3], "row": 0, "row-header": false, "row-span": [0, 2]}, {"bbox": [324.6700134277344, 441.2538146972656, 348.2641906738281, 452.5425109863281], "spans": [[0, 3], [0, 4], [0, 5]], "text": "TEDs", "type": "col_header", "col": 3, "col-header": true, "col-span": [3, 6], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [324.6700134277344, 441.2538146972656, 348.2641906738281, 452.5425109863281], "spans": [[0, 3], [0, 4], [0, 5]], "text": "TEDs", "type": "col_header", "col": 4, "col-header": true, "col-span": [3, 6], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [324.6700134277344, 441.2538146972656, 348.2641906738281, 452.5425109863281], "spans": [[0, 3], [0, 4], [0, 5]], "text": "TEDs", "type": "col_header", "col": 5, "col-header": true, "col-span": [3, 6], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [396.27099609375, 441.2538146972656, 417.1259460449219, 452.5425109863281], "spans": [[0, 6]], "text": "mAP", "type": "col_header", "col": 6, "col-header": true, "col-span": [6, 7], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [430.77099609375, 441.2538146972656, 467.14141845703125, 452.5425109863281], "spans": [[0, 7]], "text": "Inference", "type": "col_header", "col": 7, "col-header": true, "col-span": [7, 8], "row": 0, "row-header": false, "row-span": [0, 1]}], [{"bbox": [144.5919952392578, 428.3028259277344, 183.82894897460938, 439.5915222167969], "spans": [[1, 0]], "text": "enc-layers", "type": "col_header", "col": 0, "col-header": true, "col-span": [0, 1], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [192.19500732421875, 428.3028259277344, 231.42303466796875, 439.5915222167969], "spans": [[1, 1]], "text": "dec-layers", "type": "col_header", "col": 1, "col-header": true, "col-span": [1, 2], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [239.79800415039062, 435.7748107910156, 278.33380126953125, 447.0635070800781], "spans": [[0, 2], [1, 2]], "text": "Language", "type": "col_header", "col": 2, "col-header": true, "col-span": [2, 3], "row": 1, "row-header": false, "row-span": [0, 2]}, {"bbox": [286.6860046386719, 428.3028259277344, 312.328125, 439.5915222167969], "spans": [[1, 3]], "text": "simple", "type": "col_header", "col": 3, "col-header": true, "col-span": [3, 4], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [320.7019958496094, 428.3028259277344, 353.71539306640625, 439.5915222167969], "spans": [[1, 4]], "text": "complex", "type": "col_header", "col": 4, "col-header": true, "col-span": [4, 5], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [369.3059997558594, 428.3028259277344, 379.0291442871094, 439.5915222167969], "spans": [[1, 5]], "text": "all", "type": "col_header", "col": 5, "col-header": true, "col-span": [5, 6], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [394.927001953125, 430.2948303222656, 418.4692077636719, 441.5835266113281], "spans": [[1, 6]], "text": "(0.75)", "type": "col_header", "col": 6, "col-header": true, "col-span": [6, 7], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [427.14801025390625, 430.2948303222656, 470.7695617675781, 441.5835266113281], "spans": [[1, 7]], "text": "time (secs)", "type": "col_header", "col": 7, "col-header": true, "col-span": [7, 8], "row": 1, "row-header": false, "row-span": [1, 2]}], [{"bbox": [161.906005859375, 409.4728088378906, 166.51473999023438, 420.7615051269531], "spans": [[2, 0]], "text": "6", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [209.50900268554688, 409.4728088378906, 214.11773681640625, 420.7615051269531], "spans": [[2, 1]], "text": "6", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [245.17599487304688, 402.0008239746094, 272.9449462890625, 426.24151611328125], "spans": [[2, 2]], "text": "OTSL HTML", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [289.0169982910156, 402.0008239746094, 310.00732421875, 426.24151611328125], "spans": [[2, 3]], "text": "0.965 0.969", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [326.7170104980469, 402.0008239746094, 347.70733642578125, 426.24151611328125], "spans": [[2, 4]], "text": "0.934 0.927", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [363.6759948730469, 402.0008239746094, 384.66632080078125, 426.24151611328125], "spans": [[2, 5]], "text": "0.955 0.955", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [396.20599365234375, 402.0008239746094, 417.1963195800781, 426.3042907714844], "spans": [[2, 6]], "text": "0.88 0.857", "type": "body", "col": 6, "col-header": false, "col-span": [6, 7], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [439.5270080566406, 402.0008239746094, 458.38336181640625, 426.3042907714844], "spans": [[2, 7]], "text": "2.73 5.39", "type": "body", "col": 7, "col-header": false, "col-span": [7, 8], "row": 2, "row-header": false, "row-span": [2, 3]}], [{"bbox": [161.906005859375, 383.17181396484375, 166.51473999023438, 394.46051025390625], "spans": [[3, 0]], "text": "4", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [209.50900268554688, 383.17181396484375, 214.11773681640625, 394.46051025390625], "spans": [[3, 1]], "text": "4", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [245.17599487304688, 375.6998291015625, 272.9449462890625, 399.93951416015625], "spans": [[3, 2]], "text": "OTSL HTML", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [289.0169982910156, 388.65081787109375, 310.00732421875, 399.93951416015625], "spans": [[3, 3]], "text": "0.938", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [326.7170104980469, 388.65081787109375, 347.70733642578125, 399.93951416015625], "spans": [[3, 4]], "text": "0.904", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [363.6759948730469, 388.65081787109375, 384.66632080078125, 399.93951416015625], "spans": [[3, 5]], "text": "0.927", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [394.6180114746094, 388.5970153808594, 418.7779846191406, 400.0022888183594], "spans": [[3, 6]], "text": "0.853", "type": "body", "col": 6, "col-header": false, "col-span": [6, 7], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [439.5270080566406, 388.5970153808594, 458.38336181640625, 400.0022888183594], "spans": [[3, 7]], "text": "1.97", "type": "body", "col": 7, "col-header": false, "col-span": [7, 8], "row": 3, "row-header": false, "row-span": [3, 4]}], [{"bbox": null, "spans": [[4, 0]], "text": "", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": null, "spans": [[4, 1]], "text": "", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [246.7100067138672, 362.3498229980469, 271.41064453125, 373.6385192871094], "spans": [[4, 2]], "text": "OTSL", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [289.0169982910156, 362.3498229980469, 310.00732421875, 386.988525390625], "spans": [[4, 3]], "text": "0.952 0.923", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [326.7170104980469, 375.6998291015625, 347.70733642578125, 386.988525390625], "spans": [[4, 4]], "text": "0.909", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [362.0880126953125, 375.6460266113281, 386.24798583984375, 387.0513000488281], "spans": [[4, 5]], "text": "0.938", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [396.20599365234375, 375.6998291015625, 417.1963195800781, 386.988525390625], "spans": [[4, 6]], "text": "0.843", "type": "body", "col": 6, "col-header": false, "col-span": [6, 7], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [440.7669982910156, 375.6998291015625, 457.150390625, 386.988525390625], "spans": [[4, 7]], "text": "3.77", "type": "body", "col": 7, "col-header": false, "col-span": [7, 8], "row": 4, "row-header": false, "row-span": [4, 5]}], [{"bbox": [161.906005859375, 356.8708190917969, 166.51473999023438, 368.1595153808594], "spans": [[5, 0]], "text": "2", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [209.50900268554688, 356.8708190917969, 214.11773681640625, 368.1595153808594], "spans": [[5, 1]], "text": "4", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [245.17599487304688, 349.3988342285156, 272.9449462890625, 360.6875305175781], "spans": [[5, 2]], "text": "HTML", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [289.0169982910156, 349.3988342285156, 310.00732421875, 360.6875305175781], "spans": [[5, 3]], "text": "0.945", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [326.7170104980469, 349.3988342285156, 347.70733642578125, 373.6385192871094], "spans": [[5, 4]], "text": "0.897 0.901", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [362.0880126953125, 349.34503173828125, 386.24798583984375, 373.6385192871094], "spans": [[5, 5]], "text": "0.915 0.931", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [394.6180114746094, 349.3988342285156, 418.7779846191406, 373.7012939453125], "spans": [[5, 6]], "text": "0.859 0.834", "type": "body", "col": 6, "col-header": false, "col-span": [6, 7], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [439.5270080566406, 349.3988342285156, 458.38336181640625, 373.7012939453125], "spans": [[5, 7]], "text": "1.91 3.81", "type": "body", "col": 7, "col-header": false, "col-span": [7, 8], "row": 5, "row-header": false, "row-span": [5, 6]}], [{"bbox": [161.906005859375, 330.5688171386719, 166.51473999023438, 341.8575134277344], "spans": [[6, 0]], "text": "4", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [209.50900268554688, 330.5688171386719, 214.11773681640625, 341.8575134277344], "spans": [[6, 1]], "text": "2", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [245.17599487304688, 323.0968322753906, 272.9449462890625, 347.3375244140625], "spans": [[6, 2]], "text": "OTSL HTML", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [289.0169982910156, 323.0968322753906, 310.00732421875, 347.3375244140625], "spans": [[6, 3]], "text": "0.952 0.944", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [326.7170104980469, 323.0968322753906, 347.70733642578125, 347.3375244140625], "spans": [[6, 4]], "text": "0.92 0.903", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [362.0880126953125, 323.0968322753906, 386.24798583984375, 347.4002990722656], "spans": [[6, 5]], "text": "0.942 0.931", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [394.6180114746094, 323.0968322753906, 418.7779846191406, 347.4002990722656], "spans": [[6, 6]], "text": "0.857 0.824", "type": "body", "col": 6, "col-header": false, "col-span": [6, 7], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [439.5270080566406, 323.0968322753906, 458.38336181640625, 347.4002990722656], "spans": [[6, 7]], "text": "1.22 2", "type": "body", "col": 7, "col-header": false, "col-span": [7, 8], "row": 6, "row-header": false, "row-span": [6, 7]}]], "model": null, "bounding-box": null}], "bitmaps": null, "equations": [], "footnotes": [], "page-dimensions": [{"height": 792.0, "page": 1, "width": 612.0}], "page-footers": [], "page-headers": [], "_s3_data": null, "identifiers": null}
\ No newline at end of file
+{"_name": "", "type": "pdf-document", "description": {"title": null, "abstract": null, "authors": null, "affiliations": null, "subjects": null, "keywords": null, "publication_date": null, "languages": null, "license": null, "publishers": null, "url_refs": null, "references": null, "publication": null, "reference_count": null, "citation_count": null, "citation_date": null, "advanced": null, "analytics": null, "logs": [], "collection": null, "acquisition": null}, "file-info": {"filename": "2305.03393v1-pg9.pdf", "filename-prov": null, "document-hash": "1a36870a3e6aa062b563b50c1eaed40685b651ee03e0538453de65e7013b742f", "#-pages": 1, "collection-name": null, "description": null, "page-hashes": [{"hash": "8a5a8d9a1ae6cbd1dcedcad02ed10195aa71d1ac3e4d56be4ab72c858d7f543e", "model": "default", "page": 1}]}, "main-text": [{"prov": [{"bbox": [134.765, 639.09302, 480.59665, 675.53699], "page": 1, "span": [0, 163], "__ref_s3_data": null}], "text": "order to compute the TED score. Inference timing results for all experiments were obtained from the same machine on a single core with AMD EPYC 7763 CPU @2.45 GHz.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [134.765, 612.79181, 318.45145, 625.29486], "page": 1, "span": [0, 32], "__ref_s3_data": null}], "text": "5.1 Hyper Parameter Optimization", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [134.765, 536.57599, 480.59567, 608.88495], "page": 1, "span": [0, 423], "__ref_s3_data": null}], "text": "We have chosen the PubTabNet data set to perform HPO, since it includes a highly diverse set of tables. Also we report TED scores separately for simple and complex tables (tables with cell spans). Results are presented in Table. 1. It is evident that with OTSL, our model achieves the same TED score and slightly better mAP scores in comparison to HTML. However OTSL yields a 2x speed up in the inference runtime over HTML.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"name": "Table", "type": "table", "$ref": "#/tables/0"}, {"prov": [{"bbox": [134.765, 464.01782, 480.59890999999993, 519.20526], "page": 1, "span": [0, 398], "__ref_s3_data": null}], "text": "Table 1. HPO performed in OTSL and HTML representation on the same transformer-based TableFormer [9] architecture, trained only on PubTabNet [22]. Effects of reducing the # of layers in encoder and decoder stages of the model show that smaller models trained on OTSL perform better, especially in recognizing complex table structures, and maintain a much higher mAP score than the HTML counterpart.", "type": "caption", "payload": null, "name": "Caption", "font": null}, {"prov": [{"bbox": [134.765, 273.82581000000005, 264.40829, 286.32889], "page": 1, "span": [0, 24], "__ref_s3_data": null}], "text": "5.2 Quantitative Results", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [134.765, 173.70000000000005, 480.72003, 269.91995], "page": 1, "span": [0, 555], "__ref_s3_data": null}], "text": "We picked the model parameter configuration that produced the best prediction quality (enc=6, dec=6, heads=8) with PubTabNet alone, then independently trained and evaluated it on three publicly available data sets: PubTabNet (395k samples), FinTabNet (113k samples) and PubTables-1M (about 1M samples). Performance results are presented in Table. 2. It is clearly evident that the model trained on OTSL outperforms HTML across the board, keeping high TEDs and mAP scores even on difficult financial tables (FinTabNet) that contain sparse and large tables.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [134.765, 125.88, 480.59857000000005, 174.27795000000003], "page": 1, "span": [0, 289], "__ref_s3_data": null}], "text": "Additionally, the results show that OTSL has an advantage over HTML when applied on a bigger data set like PubTables-1M and achieves significantly improved scores. Finally, OTSL achieves faster inference due to fewer decoding steps which is a result of the reduced sequence representation.", "type": "paragraph", "payload": null, "name": "Text", "font": null}], "figures": [], "tables": [{"prov": [{"bbox": [139.66741943359375, 322.5054626464844, 475.00927734375, 454.45458984375], "page": 1, "span": [0, 0], "__ref_s3_data": null}], "text": "Table 1. HPO performed in OTSL and HTML representation on the same transformer-based TableFormer [9] architecture, trained only on PubTabNet [22]. Effects of reducing the # of layers in encoder and decoder stages of the model show that smaller models trained on OTSL perform better, especially in recognizing complex table structures, and maintain a much higher mAP score than the HTML counterpart.", "type": "table", "payload": null, "#-cols": 8, "#-rows": 7, "data": [[{"bbox": [160.37, 339.45749, 168.04523, 350.74619], "spans": [[0, 0]], "text": "#", "type": "col_header", "col": 0, "col-header": true, "col-span": [0, 1], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [207.974, 339.45749, 215.64923000000002, 350.74619], "spans": [[0, 1]], "text": "#", "type": "col_header", "col": 1, "col-header": true, "col-span": [1, 2], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [239.79799999999997, 344.93649, 278.3338, 356.22519000000005], "spans": [[0, 2], [1, 2]], "text": "Language", "type": "col_header", "col": 2, "col-header": true, "col-span": [2, 3], "row": 0, "row-header": false, "row-span": [0, 2]}, {"bbox": [324.67001, 339.45749, 348.26419, 350.74619], "spans": [[0, 3], [0, 4], [0, 5]], "text": "TEDs", "type": "col_header", "col": 3, "col-header": true, "col-span": [3, 6], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [324.67001, 339.45749, 348.26419, 350.74619], "spans": [[0, 3], [0, 4], [0, 5]], "text": "TEDs", "type": "col_header", "col": 4, "col-header": true, "col-span": [3, 6], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [324.67001, 339.45749, 348.26419, 350.74619], "spans": [[0, 3], [0, 4], [0, 5]], "text": "TEDs", "type": "col_header", "col": 5, "col-header": true, "col-span": [3, 6], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [396.271, 339.45749, 417.12595, 350.74619], "spans": [[0, 6]], "text": "mAP", "type": "col_header", "col": 6, "col-header": true, "col-span": [6, 7], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [430.771, 339.45749, 467.14142000000004, 350.74619], "spans": [[0, 7]], "text": "Inference", "type": "col_header", "col": 7, "col-header": true, "col-span": [7, 8], "row": 0, "row-header": false, "row-span": [0, 1]}], [{"bbox": [144.592, 352.40848, 183.82895, 363.69717], "spans": [[1, 0]], "text": "enc-layers", "type": "col_header", "col": 0, "col-header": true, "col-span": [0, 1], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [192.19501, 352.40848, 231.42303, 363.69717], "spans": [[1, 1]], "text": "dec-layers", "type": "col_header", "col": 1, "col-header": true, "col-span": [1, 2], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [239.79799999999997, 344.93649, 278.3338, 356.22519000000005], "spans": [[0, 2], [1, 2]], "text": "Language", "type": "col_header", "col": 2, "col-header": true, "col-span": [2, 3], "row": 1, "row-header": false, "row-span": [0, 2]}, {"bbox": [286.686, 352.40848, 312.32812, 363.69717], "spans": [[1, 3]], "text": "simple", "type": "col_header", "col": 3, "col-header": true, "col-span": [3, 4], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [320.702, 352.40848, 353.71539, 363.69717], "spans": [[1, 4]], "text": "complex", "type": "col_header", "col": 4, "col-header": true, "col-span": [4, 5], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [369.306, 352.40848, 379.02914, 363.69717], "spans": [[1, 5]], "text": "all", "type": "col_header", "col": 5, "col-header": true, "col-span": [5, 6], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [394.927, 350.41647, 418.46921, 361.70517], "spans": [[1, 6]], "text": "(0.75)", "type": "col_header", "col": 6, "col-header": true, "col-span": [6, 7], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [427.14801, 350.41647, 470.76955999999996, 361.70517], "spans": [[1, 7]], "text": "time (secs)", "type": "col_header", "col": 7, "col-header": true, "col-span": [7, 8], "row": 1, "row-header": false, "row-span": [1, 2]}], [{"bbox": [161.90601, 371.23849, 166.51474, 382.52719], "spans": [[2, 0]], "text": "6", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [209.509, 371.23849, 214.11774, 382.52719], "spans": [[2, 1]], "text": "6", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [245.17598999999998, 365.75848, 272.94495, 389.99917999999997], "spans": [[2, 2]], "text": "OTSL HTML", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [289.017, 365.75848, 310.00732, 389.99917999999997], "spans": [[2, 3]], "text": "0.965 0.969", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [326.71701, 365.75848, 347.70734, 389.99917999999997], "spans": [[2, 4]], "text": "0.934 0.927", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [363.67599, 365.75848, 384.66632, 389.99917999999997], "spans": [[2, 5]], "text": "0.955 0.955", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [396.20599, 365.69571, 417.19632, 389.99917999999997], "spans": [[2, 6]], "text": "0.88 0.857", "type": "body", "col": 6, "col-header": false, "col-span": [6, 7], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [439.52701, 365.69571, 458.38336, 389.99917999999997], "spans": [[2, 7]], "text": "2.73 5.39", "type": "body", "col": 7, "col-header": false, "col-span": [7, 8], "row": 2, "row-header": false, "row-span": [2, 3]}], [{"bbox": [161.90601, 397.53949, 166.51474, 408.82819], "spans": [[3, 0]], "text": "4", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [209.509, 397.53949, 214.11774, 408.82819], "spans": [[3, 1]], "text": "4", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [245.17598999999998, 392.06049, 272.94495, 416.30017], "spans": [[3, 2]], "text": "OTSL HTML", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [289.017, 392.06049, 310.00732, 403.34918], "spans": [[3, 3]], "text": "0.938", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [326.71701, 392.06049, 347.70734, 403.34918], "spans": [[3, 4]], "text": "0.904", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [363.67599, 392.06049, 384.66632, 403.34918], "spans": [[3, 5]], "text": "0.927", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [394.61801, 391.99771, 418.77798, 403.40298], "spans": [[3, 6]], "text": "0.853", "type": "body", "col": 6, "col-header": false, "col-span": [6, 7], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [439.52701, 391.99771, 458.38336, 403.40298], "spans": [[3, 7]], "text": "1.97", "type": "body", "col": 7, "col-header": false, "col-span": [7, 8], "row": 3, "row-header": false, "row-span": [3, 4]}], [{"bbox": null, "spans": [[4, 0]], "text": "", "type": "body"}, {"bbox": null, "spans": [[4, 1]], "text": "", "type": "body"}, {"bbox": [246.71000999999998, 418.3614799999999, 271.41064, 429.65018], "spans": [[4, 2]], "text": "OTSL", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [289.017, 405.01147, 310.00732, 429.65018], "spans": [[4, 3]], "text": "0.952 0.923", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [326.71701, 405.01147, 347.70734, 416.30017], "spans": [[4, 4]], "text": "0.909", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [362.08801, 404.9486999999999, 386.24799, 416.35397], "spans": [[4, 5]], "text": "0.938", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [396.20599, 405.01147, 417.19632, 416.30017], "spans": [[4, 6]], "text": "0.843", "type": "body", "col": 6, "col-header": false, "col-span": [6, 7], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [440.767, 405.01147, 457.15039, 416.30017], "spans": [[4, 7]], "text": "3.77", "type": "body", "col": 7, "col-header": false, "col-span": [7, 8], "row": 4, "row-header": false, "row-span": [4, 5]}], [{"bbox": [161.90601, 423.84048, 166.51474, 435.12918], "spans": [[5, 0]], "text": "2", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [209.509, 423.84048, 214.11774, 435.12918], "spans": [[5, 1]], "text": "4", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [245.17598999999998, 431.31246999999996, 272.94495, 442.60117], "spans": [[5, 2]], "text": "HTML", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [289.017, 431.31246999999996, 310.00732, 442.60117], "spans": [[5, 3]], "text": "0.945", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [326.71701, 418.3614799999999, 347.70734, 442.60117], "spans": [[5, 4]], "text": "0.897 0.901", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [362.08801, 418.3614799999999, 386.24799, 442.65497], "spans": [[5, 5]], "text": "0.915 0.931", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [394.61801, 418.29871, 418.77798, 442.60117], "spans": [[5, 6]], "text": "0.859 0.834", "type": "body", "col": 6, "col-header": false, "col-span": [6, 7], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [439.52701, 418.29871, 458.38336, 442.60117], "spans": [[5, 7]], "text": "1.91 3.81", "type": "body", "col": 7, "col-header": false, "col-span": [7, 8], "row": 5, "row-header": false, "row-span": [5, 6]}], [{"bbox": [161.90601, 450.14248999999995, 166.51474, 461.43118], "spans": [[6, 0]], "text": "4", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [209.509, 450.14248999999995, 214.11774, 461.43118], "spans": [[6, 1]], "text": "2", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [245.17598999999998, 444.66248, 272.94495, 468.90317], "spans": [[6, 2]], "text": "OTSL HTML", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [289.017, 444.66248, 310.00732, 468.90317], "spans": [[6, 3]], "text": "0.952 0.944", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [326.71701, 444.66248, 347.70734, 468.90317], "spans": [[6, 4]], "text": "0.92 0.903", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [362.08801, 444.5996999999999, 386.24799, 468.90317], "spans": [[6, 5]], "text": "0.942 0.931", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [394.61801, 444.5996999999999, 418.77798, 468.90317], "spans": [[6, 6]], "text": "0.857 0.824", "type": "body", "col": 6, "col-header": false, "col-span": [6, 7], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [439.52701, 444.5996999999999, 458.38336, 468.90317], "spans": [[6, 7]], "text": "1.22 2", "type": "body", "col": 7, "col-header": false, "col-span": [7, 8], "row": 6, "row-header": false, "row-span": [6, 7]}]], "model": null, "bounding-box": null}], "bitmaps": null, "equations": [], "footnotes": [], "page-dimensions": [{"height": 792.0, "page": 1, "width": 612.0}], "page-footers": [], "page-headers": [], "_s3_data": null, "identifiers": null}
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v1/2305.03393v1-pg9.pages.json b/tests/data/groundtruth/docling_v1/2305.03393v1-pg9.pages.json
index e243d300..b6fb5969 100644
--- a/tests/data/groundtruth/docling_v1/2305.03393v1-pg9.pages.json
+++ b/tests/data/groundtruth/docling_v1/2305.03393v1-pg9.pages.json
@@ -1 +1 @@
-[{"page_no": 0, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 91.49352999999996, "r": 447.54476999999997, "b": 102.78223000000003, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "9", "bbox": {"l": 475.98441, "t": 91.49352999999996, "r": 480.59314, "b": 102.78223000000003, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "order to compute the TED score. Inference timing results for all experiments", "bbox": {"l": 134.765, "t": 116.46301000000005, "r": 480.59067, "b": 128.99597000000006, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "were obtained from the same machine on a single core with AMD EPYC 7763", "bbox": {"l": 134.765, "t": 128.41803000000004, "r": 480.59665, "b": 140.95099000000005, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "CPU @2.45 GHz.", "bbox": {"l": 134.765, "t": 140.37401999999997, "r": 210.78761, "b": 152.90697999999998, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "5.1", "bbox": {"l": 134.765, "t": 166.70514000000003, "r": 149.40306, "b": 179.20818999999995, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Hyper Parameter Optimization", "bbox": {"l": 160.85905, "t": 166.70514000000003, "r": 318.45145, "b": 179.20818999999995, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "We have chosen the PubTabNet data set to perform HPO, since it includes a", "bbox": {"l": 134.765, "t": 183.11505, "r": 479.74982000000006, "b": 195.64801, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "highly diverse set of tables. Also we report TED scores separately for simple and", "bbox": {"l": 134.765, "t": 195.07007, "r": 480.58765, "b": 207.60303, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "complex tables (tables with cell spans). Results are presented in Table. 1. It is", "bbox": {"l": 134.765, "t": 207.02502000000004, "r": 480.58859000000007, "b": 219.55798000000004, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "evident that with OTSL, our model achieves the same TED score and slightly", "bbox": {"l": 134.765, "t": 218.98004000000003, "r": 480.59567, "b": 231.51300000000003, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "better mAP scores in comparison to HTML. However OTSL yields a", "bbox": {"l": 134.765, "t": 230.93506000000002, "r": 440.9425, "b": 243.46802000000002, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "2x speed", "bbox": {"l": 444.86800999999997, "t": 230.98486000000003, "r": 480.58792, "b": 243.46802000000002, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "up", "bbox": {"l": 134.765, "t": 242.94086000000004, "r": 145.19585, "b": 255.42400999999995, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "in the inference runtime over HTML.", "bbox": {"l": 149.149, "t": 242.89104999999995, "r": 311.22256, "b": 255.42400999999995, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Table", "bbox": {"l": 134.765, "t": 272.79474000000005, "r": 159.22983, "b": 284.1999799999999, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "1.", "bbox": {"l": 167.34442, "t": 272.79474000000005, "r": 174.71301, "b": 284.1999799999999, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "HPO performed in OTSL and HTML representation on the same", "bbox": {"l": 188.133, "t": 272.85748, "r": 480.58101999999997, "b": 284.14618, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "transformer-based TableFormer [9] architecture, trained only on PubTabNet [22]. Ef-", "bbox": {"l": 134.765, "t": 283.81647, "r": 480.59890999999993, "b": 295.10516000000007, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "fects of reducing the # of layers in encoder and decoder stages of the model show that", "bbox": {"l": 134.765, "t": 294.77547999999996, "r": 480.59887999999995, "b": 306.06418, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "smaller models trained on OTSL perform better, especially in recognizing complex", "bbox": {"l": 134.765, "t": 305.73447, "r": 480.59180000000003, "b": 317.02316, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "table structures, and maintain a much higher mAP score than the HTML counterpart.", "bbox": {"l": 134.765, "t": 316.69348, "r": 480.58471999999995, "b": 327.98218, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "#", "bbox": {"l": 160.37, "t": 339.45749, "r": 168.04523, "b": 350.74619, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "enc-layers", "bbox": {"l": 144.592, "t": 352.40848, "r": 183.82895, "b": 363.69717, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "#", "bbox": {"l": 207.974, "t": 339.45749, "r": 215.64923000000002, "b": 350.74619, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "dec-layers", "bbox": {"l": 192.19501, "t": 352.40848, "r": 231.42303, "b": 363.69717, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "Language", "bbox": {"l": 239.79799999999997, "t": 344.93649, "r": 278.3338, "b": 356.22519000000005, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "TEDs", "bbox": {"l": 324.67001, "t": 339.45749, "r": 348.26419, "b": 350.74619, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "mAP", "bbox": {"l": 396.271, "t": 339.45749, "r": 417.12595, "b": 350.74619, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "(0.75)", "bbox": {"l": 394.927, "t": 350.41647, "r": 418.46921, "b": 361.70517, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Inference", "bbox": {"l": 430.771, "t": 339.45749, "r": 467.14142000000004, "b": 350.74619, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "time (secs)", "bbox": {"l": 427.14801, "t": 350.41647, "r": 470.76955999999996, "b": 361.70517, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "simple", "bbox": {"l": 286.686, "t": 352.40848, "r": 312.32812, "b": 363.69717, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "complex", "bbox": {"l": 320.702, "t": 352.40848, "r": 353.71539, "b": 363.69717, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "all", "bbox": {"l": 369.306, "t": 352.40848, "r": 379.02914, "b": 363.69717, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "6", "bbox": {"l": 161.90601, "t": 371.23849, "r": 166.51474, "b": 382.52719, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "6", "bbox": {"l": 209.509, "t": 371.23849, "r": 214.11774, "b": 382.52719, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 365.75848, "r": 271.41064, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "0.965", "bbox": {"l": 289.017, "t": 365.75848, "r": 310.00732, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "0.934", "bbox": {"l": 326.71701, "t": 365.75848, "r": 347.70734, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "0.955", "bbox": {"l": 363.67599, "t": 365.75848, "r": 384.66632, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "0.88", "bbox": {"l": 397.26999, "t": 365.69571, "r": 416.12634, "b": 377.10098000000005, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "2.73", "bbox": {"l": 439.52701, "t": 365.69571, "r": 458.38336, "b": 377.10098000000005, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 378.71048, "r": 272.94495, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "0.969", "bbox": {"l": 289.017, "t": 378.71048, "r": 310.00732, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "0.927", "bbox": {"l": 326.71701, "t": 378.71048, "r": 347.70734, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "0.955", "bbox": {"l": 363.67599, "t": 378.71048, "r": 384.66632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "0.857", "bbox": {"l": 396.20599, "t": 378.71048, "r": 417.19632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "5.39", "bbox": {"l": 440.767, "t": 378.71048, "r": 457.15039, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "4", "bbox": {"l": 161.90601, "t": 397.53949, "r": 166.51474, "b": 408.82819, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "4", "bbox": {"l": 209.509, "t": 397.53949, "r": 214.11774, "b": 408.82819, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 392.06049, "r": 271.41064, "b": 403.34918, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "0.938", "bbox": {"l": 289.017, "t": 392.06049, "r": 310.00732, "b": 403.34918, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "0.904", "bbox": {"l": 326.71701, "t": 392.06049, "r": 347.70734, "b": 403.34918, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "0.927", "bbox": {"l": 363.67599, "t": 392.06049, "r": 384.66632, "b": 403.34918, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "0.853", "bbox": {"l": 394.61801, "t": 391.99771, "r": 418.77798, "b": 403.40298, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "1.97", "bbox": {"l": 439.52701, "t": 391.99771, "r": 458.38336, "b": 403.40298, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 405.01147, "r": 272.94495, "b": 416.30017, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "0.952", "bbox": {"l": 289.017, "t": 405.01147, "r": 310.00732, "b": 416.30017, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "0.909", "bbox": {"l": 326.71701, "t": 405.01147, "r": 347.70734, "b": 416.30017, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "0.938", "bbox": {"l": 362.08801, "t": 404.9486999999999, "r": 386.24799, "b": 416.35397, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "0.843", "bbox": {"l": 396.20599, "t": 405.01147, "r": 417.19632, "b": 416.30017, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "3.77", "bbox": {"l": 440.767, "t": 405.01147, "r": 457.15039, "b": 416.30017, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "2", "bbox": {"l": 161.90601, "t": 423.84048, "r": 166.51474, "b": 435.12918, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "4", "bbox": {"l": 209.509, "t": 423.84048, "r": 214.11774, "b": 435.12918, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 418.3614799999999, "r": 271.41064, "b": 429.65018, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "0.923", "bbox": {"l": 289.017, "t": 418.3614799999999, "r": 310.00732, "b": 429.65018, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "0.897", "bbox": {"l": 326.71701, "t": 418.3614799999999, "r": 347.70734, "b": 429.65018, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "0.915", "bbox": {"l": 363.67599, "t": 418.3614799999999, "r": 384.66632, "b": 429.65018, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "0.859", "bbox": {"l": 394.61801, "t": 418.29871, "r": 418.77798, "b": 429.70398, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "1.91", "bbox": {"l": 439.52701, "t": 418.29871, "r": 458.38336, "b": 429.70398, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 431.31246999999996, "r": 272.94495, "b": 442.60117, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "0.945", "bbox": {"l": 289.017, "t": 431.31246999999996, "r": 310.00732, "b": 442.60117, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "0.901", "bbox": {"l": 326.71701, "t": 431.31246999999996, "r": 347.70734, "b": 442.60117, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "0.931", "bbox": {"l": 362.08801, "t": 431.24969, "r": 386.24799, "b": 442.65497, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "0.834", "bbox": {"l": 396.20599, "t": 431.31246999999996, "r": 417.19632, "b": 442.60117, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "3.81", "bbox": {"l": 440.767, "t": 431.31246999999996, "r": 457.15039, "b": 442.60117, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "4", "bbox": {"l": 161.90601, "t": 450.14248999999995, "r": 166.51474, "b": 461.43118, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "2", "bbox": {"l": 209.509, "t": 450.14248999999995, "r": 214.11774, "b": 461.43118, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 444.66248, "r": 271.41064, "b": 455.95117, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "0.952", "bbox": {"l": 289.017, "t": 444.66248, "r": 310.00732, "b": 455.95117, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "0.92", "bbox": {"l": 329.021, "t": 444.66248, "r": 345.40439, "b": 455.95117, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "0.942", "bbox": {"l": 362.08801, "t": 444.5996999999999, "r": 386.24799, "b": 456.00497, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "0.857", "bbox": {"l": 394.61801, "t": 444.5996999999999, "r": 418.77798, "b": 456.00497, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "1.22", "bbox": {"l": 439.52701, "t": 444.5996999999999, "r": 458.38336, "b": 456.00497, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 457.61447, "r": 272.94495, "b": 468.90317, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "0.944", "bbox": {"l": 289.017, "t": 457.61447, "r": 310.00732, "b": 468.90317, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "0.903", "bbox": {"l": 326.71701, "t": 457.61447, "r": 347.70734, "b": 468.90317, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "0.931", "bbox": {"l": 363.67599, "t": 457.61447, "r": 384.66632, "b": 468.90317, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "0.824", "bbox": {"l": 396.20599, "t": 457.61447, "r": 417.19632, "b": 468.90317, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "2", "bbox": {"l": 446.65302, "t": 457.61447, "r": 451.26175, "b": 468.90317, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "5.2", "bbox": {"l": 134.765, "t": 505.67111, "r": 149.40306, "b": 518.17419, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Quantitative Results", "bbox": {"l": 160.85905, "t": 505.67111, "r": 264.40829, "b": 518.17419, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "We picked the model parameter configuration that produced the best prediction", "bbox": {"l": 134.765, "t": 522.08005, "r": 479.72983, "b": 534.61301, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "quality (enc=6, dec=6, heads=8) with PubTabNet alone, then independently", "bbox": {"l": 134.765, "t": 534.03604, "r": 480.5897499999999, "b": 546.569, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "trained and evaluated it on three publicly available data sets: PubTabNet (395k", "bbox": {"l": 134.765, "t": 545.99104, "r": 480.72003, "b": 558.524, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "samples), FinTabNet (113k samples) and PubTables-1M (about 1M samples).", "bbox": {"l": 134.765, "t": 557.94604, "r": 480.60577, "b": 570.479, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "Performance results are presented in Table. 2. It is clearly evident that the model", "bbox": {"l": 134.765, "t": 569.90103, "r": 480.5936899999999, "b": 582.43399, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "trained on OTSL outperforms HTML across the board, keeping high TEDs and", "bbox": {"l": 134.765, "t": 581.85603, "r": 480.59158, "b": 594.38899, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "mAP scores even on difficult financial tables (FinTabNet) that contain sparse", "bbox": {"l": 134.765, "t": 593.81204, "r": 480.58080999999993, "b": 606.345, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "and large tables.", "bbox": {"l": 134.765, "t": 605.76704, "r": 206.79959, "b": 618.3, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "Additionally, the results show that OTSL has an advantage over HTML", "bbox": {"l": 149.709, "t": 617.72205, "r": 480.59479, "b": 630.255, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "when applied on a bigger data set like PubTables-1M and achieves significantly", "bbox": {"l": 134.765, "t": 629.6770300000001, "r": 480.59857000000005, "b": 642.2099900000001, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "improved scores. Finally, OTSL achieves faster inference due to fewer decoding", "bbox": {"l": 134.765, "t": 641.63203, "r": 480.59384000000006, "b": 654.16499, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "steps which is a result of the reduced sequence representation.", "bbox": {"l": 134.765, "t": 653.58704, "r": 405.7995, "b": 666.12, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 8, "label": "page_header", "bbox": {"l": 194.478, "t": 91.49352999999996, "r": 447.54476999999997, "b": 102.78223000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9373531937599182, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 91.49352999999996, "r": 447.54476999999997, "b": 102.78223000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "page_header", "bbox": {"l": 475.98441, "t": 91.49352999999996, "r": 480.59314, "b": 102.78223000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.8858679533004761, "cells": [{"id": 1, "text": "9", "bbox": {"l": 475.98441, "t": 91.49352999999996, "r": 480.59314, "b": 102.78223000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "text", "bbox": {"l": 134.765, "t": 116.46301000000005, "r": 480.59665, "b": 152.90697999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.9806435108184814, "cells": [{"id": 2, "text": "order to compute the TED score. Inference timing results for all experiments", "bbox": {"l": 134.765, "t": 116.46301000000005, "r": 480.59067, "b": 128.99597000000006, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "were obtained from the same machine on a single core with AMD EPYC 7763", "bbox": {"l": 134.765, "t": 128.41803000000004, "r": 480.59665, "b": 140.95099000000005, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "CPU @2.45 GHz.", "bbox": {"l": 134.765, "t": 140.37401999999997, "r": 210.78761, "b": 152.90697999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "section_header", "bbox": {"l": 134.765, "t": 166.70514000000003, "r": 318.45145, "b": 179.20818999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.957740306854248, "cells": [{"id": 5, "text": "5.1", "bbox": {"l": 134.765, "t": 166.70514000000003, "r": 149.40306, "b": 179.20818999999995, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Hyper Parameter Optimization", "bbox": {"l": 160.85905, "t": 166.70514000000003, "r": 318.45145, "b": 179.20818999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 134.765, "t": 183.11505, "r": 480.59567, "b": 255.42400999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9850425124168396, "cells": [{"id": 7, "text": "We have chosen the PubTabNet data set to perform HPO, since it includes a", "bbox": {"l": 134.765, "t": 183.11505, "r": 479.74982000000006, "b": 195.64801, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "highly diverse set of tables. Also we report TED scores separately for simple and", "bbox": {"l": 134.765, "t": 195.07007, "r": 480.58765, "b": 207.60303, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "complex tables (tables with cell spans). Results are presented in Table. 1. It is", "bbox": {"l": 134.765, "t": 207.02502000000004, "r": 480.58859000000007, "b": 219.55798000000004, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "evident that with OTSL, our model achieves the same TED score and slightly", "bbox": {"l": 134.765, "t": 218.98004000000003, "r": 480.59567, "b": 231.51300000000003, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "better mAP scores in comparison to HTML. However OTSL yields a", "bbox": {"l": 134.765, "t": 230.93506000000002, "r": 440.9425, "b": 243.46802000000002, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "2x speed", "bbox": {"l": 444.86800999999997, "t": 230.98486000000003, "r": 480.58792, "b": 243.46802000000002, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "up", "bbox": {"l": 134.765, "t": 242.94086000000004, "r": 145.19585, "b": 255.42400999999995, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "in the inference runtime over HTML.", "bbox": {"l": 149.149, "t": 242.89104999999995, "r": 311.22256, "b": 255.42400999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "caption", "bbox": {"l": 134.765, "t": 272.79474000000005, "r": 480.59890999999993, "b": 327.98218, "coord_origin": "TOPLEFT"}, "confidence": 0.9591906070709229, "cells": [{"id": 15, "text": "Table", "bbox": {"l": 134.765, "t": 272.79474000000005, "r": 159.22983, "b": 284.1999799999999, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "1.", "bbox": {"l": 167.34442, "t": 272.79474000000005, "r": 174.71301, "b": 284.1999799999999, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "HPO performed in OTSL and HTML representation on the same", "bbox": {"l": 188.133, "t": 272.85748, "r": 480.58101999999997, "b": 284.14618, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "transformer-based TableFormer [9] architecture, trained only on PubTabNet [22]. Ef-", "bbox": {"l": 134.765, "t": 283.81647, "r": 480.59890999999993, "b": 295.10516000000007, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "fects of reducing the # of layers in encoder and decoder stages of the model show that", "bbox": {"l": 134.765, "t": 294.77547999999996, "r": 480.59887999999995, "b": 306.06418, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "smaller models trained on OTSL perform better, especially in recognizing complex", "bbox": {"l": 134.765, "t": 305.73447, "r": 480.59180000000003, "b": 317.02316, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "table structures, and maintain a much higher mAP score than the HTML counterpart.", "bbox": {"l": 134.765, "t": 316.69348, "r": 480.58471999999995, "b": 327.98218, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "table", "bbox": {"l": 139.6674041748047, "t": 337.5453796386719, "r": 475.00927734375, "b": 469.4945373535156, "coord_origin": "TOPLEFT"}, "confidence": 0.9901031255722046, "cells": [{"id": 22, "text": "#", "bbox": {"l": 160.37, "t": 339.45749, "r": 168.04523, "b": 350.74619, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "enc-layers", "bbox": {"l": 144.592, "t": 352.40848, "r": 183.82895, "b": 363.69717, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "#", "bbox": {"l": 207.974, "t": 339.45749, "r": 215.64923000000002, "b": 350.74619, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "dec-layers", "bbox": {"l": 192.19501, "t": 352.40848, "r": 231.42303, "b": 363.69717, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "Language", "bbox": {"l": 239.79799999999997, "t": 344.93649, "r": 278.3338, "b": 356.22519000000005, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "TEDs", "bbox": {"l": 324.67001, "t": 339.45749, "r": 348.26419, "b": 350.74619, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "mAP", "bbox": {"l": 396.271, "t": 339.45749, "r": 417.12595, "b": 350.74619, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "(0.75)", "bbox": {"l": 394.927, "t": 350.41647, "r": 418.46921, "b": 361.70517, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Inference", "bbox": {"l": 430.771, "t": 339.45749, "r": 467.14142000000004, "b": 350.74619, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "time (secs)", "bbox": {"l": 427.14801, "t": 350.41647, "r": 470.76955999999996, "b": 361.70517, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "simple", "bbox": {"l": 286.686, "t": 352.40848, "r": 312.32812, "b": 363.69717, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "complex", "bbox": {"l": 320.702, "t": 352.40848, "r": 353.71539, "b": 363.69717, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "all", "bbox": {"l": 369.306, "t": 352.40848, "r": 379.02914, "b": 363.69717, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "6", "bbox": {"l": 161.90601, "t": 371.23849, "r": 166.51474, "b": 382.52719, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "6", "bbox": {"l": 209.509, "t": 371.23849, "r": 214.11774, "b": 382.52719, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 365.75848, "r": 271.41064, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "0.965", "bbox": {"l": 289.017, "t": 365.75848, "r": 310.00732, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "0.934", "bbox": {"l": 326.71701, "t": 365.75848, "r": 347.70734, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "0.955", "bbox": {"l": 363.67599, "t": 365.75848, "r": 384.66632, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "0.88", "bbox": {"l": 397.26999, "t": 365.69571, "r": 416.12634, "b": 377.10098000000005, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "2.73", "bbox": {"l": 439.52701, "t": 365.69571, "r": 458.38336, "b": 377.10098000000005, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 378.71048, "r": 272.94495, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "0.969", "bbox": {"l": 289.017, "t": 378.71048, "r": 310.00732, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "0.927", "bbox": {"l": 326.71701, "t": 378.71048, "r": 347.70734, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "0.955", "bbox": {"l": 363.67599, "t": 378.71048, "r": 384.66632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "0.857", "bbox": {"l": 396.20599, "t": 378.71048, "r": 417.19632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "5.39", "bbox": {"l": 440.767, "t": 378.71048, "r": 457.15039, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "4", "bbox": {"l": 161.90601, "t": 397.53949, "r": 166.51474, "b": 408.82819, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "4", "bbox": {"l": 209.509, "t": 397.53949, "r": 214.11774, "b": 408.82819, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 392.06049, "r": 271.41064, "b": 403.34918, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "0.938", "bbox": {"l": 289.017, "t": 392.06049, "r": 310.00732, "b": 403.34918, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "0.904", "bbox": {"l": 326.71701, "t": 392.06049, "r": 347.70734, "b": 403.34918, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "0.927", "bbox": {"l": 363.67599, "t": 392.06049, "r": 384.66632, "b": 403.34918, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "0.853", "bbox": {"l": 394.61801, "t": 391.99771, "r": 418.77798, "b": 403.40298, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "1.97", "bbox": {"l": 439.52701, "t": 391.99771, "r": 458.38336, "b": 403.40298, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 405.01147, "r": 272.94495, "b": 416.30017, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "0.952", "bbox": {"l": 289.017, "t": 405.01147, "r": 310.00732, "b": 416.30017, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "0.909", "bbox": {"l": 326.71701, "t": 405.01147, "r": 347.70734, "b": 416.30017, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "0.938", "bbox": {"l": 362.08801, "t": 404.9486999999999, "r": 386.24799, "b": 416.35397, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "0.843", "bbox": {"l": 396.20599, "t": 405.01147, "r": 417.19632, "b": 416.30017, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "3.77", "bbox": {"l": 440.767, "t": 405.01147, "r": 457.15039, "b": 416.30017, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "2", "bbox": {"l": 161.90601, "t": 423.84048, "r": 166.51474, "b": 435.12918, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "4", "bbox": {"l": 209.509, "t": 423.84048, "r": 214.11774, "b": 435.12918, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 418.3614799999999, "r": 271.41064, "b": 429.65018, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "0.923", "bbox": {"l": 289.017, "t": 418.3614799999999, "r": 310.00732, "b": 429.65018, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "0.897", "bbox": {"l": 326.71701, "t": 418.3614799999999, "r": 347.70734, "b": 429.65018, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "0.915", "bbox": {"l": 363.67599, "t": 418.3614799999999, "r": 384.66632, "b": 429.65018, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "0.859", "bbox": {"l": 394.61801, "t": 418.29871, "r": 418.77798, "b": 429.70398, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "1.91", "bbox": {"l": 439.52701, "t": 418.29871, "r": 458.38336, "b": 429.70398, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 431.31246999999996, "r": 272.94495, "b": 442.60117, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "0.945", "bbox": {"l": 289.017, "t": 431.31246999999996, "r": 310.00732, "b": 442.60117, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "0.901", "bbox": {"l": 326.71701, "t": 431.31246999999996, "r": 347.70734, "b": 442.60117, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "0.931", "bbox": {"l": 362.08801, "t": 431.24969, "r": 386.24799, "b": 442.65497, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "0.834", "bbox": {"l": 396.20599, "t": 431.31246999999996, "r": 417.19632, "b": 442.60117, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "3.81", "bbox": {"l": 440.767, "t": 431.31246999999996, "r": 457.15039, "b": 442.60117, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "4", "bbox": {"l": 161.90601, "t": 450.14248999999995, "r": 166.51474, "b": 461.43118, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "2", "bbox": {"l": 209.509, "t": 450.14248999999995, "r": 214.11774, "b": 461.43118, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 444.66248, "r": 271.41064, "b": 455.95117, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "0.952", "bbox": {"l": 289.017, "t": 444.66248, "r": 310.00732, "b": 455.95117, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "0.92", "bbox": {"l": 329.021, "t": 444.66248, "r": 345.40439, "b": 455.95117, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "0.942", "bbox": {"l": 362.08801, "t": 444.5996999999999, "r": 386.24799, "b": 456.00497, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "0.857", "bbox": {"l": 394.61801, "t": 444.5996999999999, "r": 418.77798, "b": 456.00497, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "1.22", "bbox": {"l": 439.52701, "t": 444.5996999999999, "r": 458.38336, "b": 456.00497, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 457.61447, "r": 272.94495, "b": 468.90317, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "0.944", "bbox": {"l": 289.017, "t": 457.61447, "r": 310.00732, "b": 468.90317, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "0.903", "bbox": {"l": 326.71701, "t": 457.61447, "r": 347.70734, "b": 468.90317, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "0.931", "bbox": {"l": 363.67599, "t": 457.61447, "r": 384.66632, "b": 468.90317, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "0.824", "bbox": {"l": 396.20599, "t": 457.61447, "r": 417.19632, "b": 468.90317, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "2", "bbox": {"l": 446.65302, "t": 457.61447, "r": 451.26175, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": [{"id": 10, "label": "text", "bbox": {"l": 160.37, "t": 339.45749, "r": 168.04523, "b": 350.74619, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "#", "bbox": {"l": 160.37, "t": 339.45749, "r": 168.04523, "b": 350.74619, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 144.592, "t": 352.40848, "r": 183.82895, "b": 363.69717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "enc-layers", "bbox": {"l": 144.592, "t": 352.40848, "r": 183.82895, "b": 363.69717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 207.974, "t": 339.45749, "r": 215.64923000000002, "b": 350.74619, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "#", "bbox": {"l": 207.974, "t": 339.45749, "r": 215.64923000000002, "b": 350.74619, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 192.19501, "t": 352.40848, "r": 231.42303, "b": 363.69717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "dec-layers", "bbox": {"l": 192.19501, "t": 352.40848, "r": 231.42303, "b": 363.69717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 239.79799999999997, "t": 344.93649, "r": 278.3338, "b": 356.22519000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "Language", "bbox": {"l": 239.79799999999997, "t": 344.93649, "r": 278.3338, "b": 356.22519000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 324.67001, "t": 339.45749, "r": 348.26419, "b": 350.74619, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "TEDs", "bbox": {"l": 324.67001, "t": 339.45749, "r": 348.26419, "b": 350.74619, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 396.271, "t": 339.45749, "r": 417.12595, "b": 350.74619, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "mAP", "bbox": {"l": 396.271, "t": 339.45749, "r": 417.12595, "b": 350.74619, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 394.927, "t": 350.41647, "r": 418.46921, "b": 361.70517, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "(0.75)", "bbox": {"l": 394.927, "t": 350.41647, "r": 418.46921, "b": 361.70517, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 430.771, "t": 339.45749, "r": 467.14142000000004, "b": 350.74619, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "Inference", "bbox": {"l": 430.771, "t": 339.45749, "r": 467.14142000000004, "b": 350.74619, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 427.14801, "t": 350.41647, "r": 470.76955999999996, "b": 361.70517, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "time (secs)", "bbox": {"l": 427.14801, "t": 350.41647, "r": 470.76955999999996, "b": 361.70517, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 286.686, "t": 352.40848, "r": 312.32812, "b": 363.69717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "simple", "bbox": {"l": 286.686, "t": 352.40848, "r": 312.32812, "b": 363.69717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 320.702, "t": 352.40848, "r": 353.71539, "b": 363.69717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "complex", "bbox": {"l": 320.702, "t": 352.40848, "r": 353.71539, "b": 363.69717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 369.306, "t": 352.40848, "r": 379.02914, "b": 363.69717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "all", "bbox": {"l": 369.306, "t": 352.40848, "r": 379.02914, "b": 363.69717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 161.90601, "t": 371.23849, "r": 166.51474, "b": 382.52719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "6", "bbox": {"l": 161.90601, "t": 371.23849, "r": 166.51474, "b": 382.52719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 209.509, "t": 371.23849, "r": 214.11774, "b": 382.52719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "6", "bbox": {"l": 209.509, "t": 371.23849, "r": 214.11774, "b": 382.52719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 246.71000999999998, "t": 365.75848, "r": 271.41064, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 365.75848, "r": 271.41064, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 289.017, "t": 365.75848, "r": 310.00732, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "0.965", "bbox": {"l": 289.017, "t": 365.75848, "r": 310.00732, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 326.71701, "t": 365.75848, "r": 347.70734, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "0.934", "bbox": {"l": 326.71701, "t": 365.75848, "r": 347.70734, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 363.67599, "t": 365.75848, "r": 384.66632, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "0.955", "bbox": {"l": 363.67599, "t": 365.75848, "r": 384.66632, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 397.26999, "t": 365.69571, "r": 416.12634, "b": 377.10098000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "0.88", "bbox": {"l": 397.26999, "t": 365.69571, "r": 416.12634, "b": 377.10098000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 439.52701, "t": 365.69571, "r": 458.38336, "b": 377.10098000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "2.73", "bbox": {"l": 439.52701, "t": 365.69571, "r": 458.38336, "b": 377.10098000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 245.17598999999998, "t": 378.71048, "r": 272.94495, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 378.71048, "r": 272.94495, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 289.017, "t": 378.71048, "r": 310.00732, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "0.969", "bbox": {"l": 289.017, "t": 378.71048, "r": 310.00732, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 326.71701, "t": 378.71048, "r": 347.70734, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "0.927", "bbox": {"l": 326.71701, "t": 378.71048, "r": 347.70734, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 363.67599, "t": 378.71048, "r": 384.66632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "0.955", "bbox": {"l": 363.67599, "t": 378.71048, "r": 384.66632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 396.20599, "t": 378.71048, "r": 417.19632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "0.857", "bbox": {"l": 396.20599, "t": 378.71048, "r": 417.19632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 440.767, "t": 378.71048, "r": 457.15039, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "5.39", "bbox": {"l": 440.767, "t": 378.71048, "r": 457.15039, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 161.90601, "t": 397.53949, "r": 166.51474, "b": 408.82819, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "4", "bbox": {"l": 161.90601, "t": 397.53949, "r": 166.51474, "b": 408.82819, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 209.509, "t": 397.53949, "r": 214.11774, "b": 408.82819, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "4", "bbox": {"l": 209.509, "t": 397.53949, "r": 214.11774, "b": 408.82819, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 246.71000999999998, "t": 392.06049, "r": 271.41064, "b": 403.34918, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 392.06049, "r": 271.41064, "b": 403.34918, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 289.017, "t": 392.06049, "r": 310.00732, "b": 403.34918, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "0.938", "bbox": {"l": 289.017, "t": 392.06049, "r": 310.00732, "b": 403.34918, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 326.71701, "t": 392.06049, "r": 347.70734, "b": 403.34918, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "0.904", "bbox": {"l": 326.71701, "t": 392.06049, "r": 347.70734, "b": 403.34918, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 363.67599, "t": 392.06049, "r": 384.66632, "b": 403.34918, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "0.927", "bbox": {"l": 363.67599, "t": 392.06049, "r": 384.66632, "b": 403.34918, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 394.61801, "t": 391.99771, "r": 418.77798, "b": 403.40298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "0.853", "bbox": {"l": 394.61801, "t": 391.99771, "r": 418.77798, "b": 403.40298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 439.52701, "t": 391.99771, "r": 458.38336, "b": 403.40298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "1.97", "bbox": {"l": 439.52701, "t": 391.99771, "r": 458.38336, "b": 403.40298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 245.17598999999998, "t": 405.01147, "r": 272.94495, "b": 416.30017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 405.01147, "r": 272.94495, "b": 416.30017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 289.017, "t": 405.01147, "r": 310.00732, "b": 416.30017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "0.952", "bbox": {"l": 289.017, "t": 405.01147, "r": 310.00732, "b": 416.30017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 326.71701, "t": 405.01147, "r": 347.70734, "b": 416.30017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "0.909", "bbox": {"l": 326.71701, "t": 405.01147, "r": 347.70734, "b": 416.30017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 362.08801, "t": 404.9486999999999, "r": 386.24799, "b": 416.35397, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "0.938", "bbox": {"l": 362.08801, "t": 404.9486999999999, "r": 386.24799, "b": 416.35397, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 396.20599, "t": 405.01147, "r": 417.19632, "b": 416.30017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "0.843", "bbox": {"l": 396.20599, "t": 405.01147, "r": 417.19632, "b": 416.30017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 440.767, "t": 405.01147, "r": 457.15039, "b": 416.30017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "3.77", "bbox": {"l": 440.767, "t": 405.01147, "r": 457.15039, "b": 416.30017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 161.90601, "t": 423.84048, "r": 166.51474, "b": 435.12918, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "2", "bbox": {"l": 161.90601, "t": 423.84048, "r": 166.51474, "b": 435.12918, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 209.509, "t": 423.84048, "r": 214.11774, "b": 435.12918, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "4", "bbox": {"l": 209.509, "t": 423.84048, "r": 214.11774, "b": 435.12918, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 246.71000999999998, "t": 418.3614799999999, "r": 271.41064, "b": 429.65018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 418.3614799999999, "r": 271.41064, "b": 429.65018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 289.017, "t": 418.3614799999999, "r": 310.00732, "b": 429.65018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "0.923", "bbox": {"l": 289.017, "t": 418.3614799999999, "r": 310.00732, "b": 429.65018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 326.71701, "t": 418.3614799999999, "r": 347.70734, "b": 429.65018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "0.897", "bbox": {"l": 326.71701, "t": 418.3614799999999, "r": 347.70734, "b": 429.65018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 363.67599, "t": 418.3614799999999, "r": 384.66632, "b": 429.65018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "0.915", "bbox": {"l": 363.67599, "t": 418.3614799999999, "r": 384.66632, "b": 429.65018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 394.61801, "t": 418.29871, "r": 418.77798, "b": 429.70398, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "0.859", "bbox": {"l": 394.61801, "t": 418.29871, "r": 418.77798, "b": 429.70398, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 439.52701, "t": 418.29871, "r": 458.38336, "b": 429.70398, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "1.91", "bbox": {"l": 439.52701, "t": 418.29871, "r": 458.38336, "b": 429.70398, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 245.17598999999998, "t": 431.31246999999996, "r": 272.94495, "b": 442.60117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 431.31246999999996, "r": 272.94495, "b": 442.60117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 289.017, "t": 431.31246999999996, "r": 310.00732, "b": 442.60117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "0.945", "bbox": {"l": 289.017, "t": 431.31246999999996, "r": 310.00732, "b": 442.60117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 326.71701, "t": 431.31246999999996, "r": 347.70734, "b": 442.60117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "0.901", "bbox": {"l": 326.71701, "t": 431.31246999999996, "r": 347.70734, "b": 442.60117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 362.08801, "t": 431.24969, "r": 386.24799, "b": 442.65497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "0.931", "bbox": {"l": 362.08801, "t": 431.24969, "r": 386.24799, "b": 442.65497, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 396.20599, "t": 431.31246999999996, "r": 417.19632, "b": 442.60117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "0.834", "bbox": {"l": 396.20599, "t": 431.31246999999996, "r": 417.19632, "b": 442.60117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 440.767, "t": 431.31246999999996, "r": 457.15039, "b": 442.60117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "3.81", "bbox": {"l": 440.767, "t": 431.31246999999996, "r": 457.15039, "b": 442.60117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 161.90601, "t": 450.14248999999995, "r": 166.51474, "b": 461.43118, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "4", "bbox": {"l": 161.90601, "t": 450.14248999999995, "r": 166.51474, "b": 461.43118, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 209.509, "t": 450.14248999999995, "r": 214.11774, "b": 461.43118, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "2", "bbox": {"l": 209.509, "t": 450.14248999999995, "r": 214.11774, "b": 461.43118, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 246.71000999999998, "t": 444.66248, "r": 271.41064, "b": 455.95117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 444.66248, "r": 271.41064, "b": 455.95117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 289.017, "t": 444.66248, "r": 310.00732, "b": 455.95117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "0.952", "bbox": {"l": 289.017, "t": 444.66248, "r": 310.00732, "b": 455.95117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 329.021, "t": 444.66248, "r": 345.40439, "b": 455.95117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "0.92", "bbox": {"l": 329.021, "t": 444.66248, "r": 345.40439, "b": 455.95117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 362.08801, "t": 444.5996999999999, "r": 386.24799, "b": 456.00497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "0.942", "bbox": {"l": 362.08801, "t": 444.5996999999999, "r": 386.24799, "b": 456.00497, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 394.61801, "t": 444.5996999999999, "r": 418.77798, "b": 456.00497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "0.857", "bbox": {"l": 394.61801, "t": 444.5996999999999, "r": 418.77798, "b": 456.00497, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 439.52701, "t": 444.5996999999999, "r": 458.38336, "b": 456.00497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "1.22", "bbox": {"l": 439.52701, "t": 444.5996999999999, "r": 458.38336, "b": 456.00497, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 245.17598999999998, "t": 457.61447, "r": 272.94495, "b": 468.90317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 457.61447, "r": 272.94495, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 289.017, "t": 457.61447, "r": 310.00732, "b": 468.90317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "0.944", "bbox": {"l": 289.017, "t": 457.61447, "r": 310.00732, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 326.71701, "t": 457.61447, "r": 347.70734, "b": 468.90317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "0.903", "bbox": {"l": 326.71701, "t": 457.61447, "r": 347.70734, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 363.67599, "t": 457.61447, "r": 384.66632, "b": 468.90317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "0.931", "bbox": {"l": 363.67599, "t": 457.61447, "r": 384.66632, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 396.20599, "t": 457.61447, "r": 417.19632, "b": 468.90317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "0.824", "bbox": {"l": 396.20599, "t": 457.61447, "r": 417.19632, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 446.65302, "t": 457.61447, "r": 451.26175, "b": 468.90317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "2", "bbox": {"l": 446.65302, "t": 457.61447, "r": 451.26175, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 6, "label": "section_header", "bbox": {"l": 134.765, "t": 505.67111, "r": 264.40829, "b": 518.17419, "coord_origin": "TOPLEFT"}, "confidence": 0.9589295387268066, "cells": [{"id": 91, "text": "5.2", "bbox": {"l": 134.765, "t": 505.67111, "r": 149.40306, "b": 518.17419, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Quantitative Results", "bbox": {"l": 160.85905, "t": 505.67111, "r": 264.40829, "b": 518.17419, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 134.765, "t": 522.08005, "r": 480.72003, "b": 618.3, "coord_origin": "TOPLEFT"}, "confidence": 0.9849976301193237, "cells": [{"id": 93, "text": "We picked the model parameter configuration that produced the best prediction", "bbox": {"l": 134.765, "t": 522.08005, "r": 479.72983, "b": 534.61301, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "quality (enc=6, dec=6, heads=8) with PubTabNet alone, then independently", "bbox": {"l": 134.765, "t": 534.03604, "r": 480.5897499999999, "b": 546.569, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "trained and evaluated it on three publicly available data sets: PubTabNet (395k", "bbox": {"l": 134.765, "t": 545.99104, "r": 480.72003, "b": 558.524, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "samples), FinTabNet (113k samples) and PubTables-1M (about 1M samples).", "bbox": {"l": 134.765, "t": 557.94604, "r": 480.60577, "b": 570.479, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "Performance results are presented in Table. 2. It is clearly evident that the model", "bbox": {"l": 134.765, "t": 569.90103, "r": 480.5936899999999, "b": 582.43399, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "trained on OTSL outperforms HTML across the board, keeping high TEDs and", "bbox": {"l": 134.765, "t": 581.85603, "r": 480.59158, "b": 594.38899, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "mAP scores even on difficult financial tables (FinTabNet) that contain sparse", "bbox": {"l": 134.765, "t": 593.81204, "r": 480.58080999999993, "b": 606.345, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "and large tables.", "bbox": {"l": 134.765, "t": 605.76704, "r": 206.79959, "b": 618.3, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 134.765, "t": 617.72205, "r": 480.59857000000005, "b": 666.12, "coord_origin": "TOPLEFT"}, "confidence": 0.9850137829780579, "cells": [{"id": 101, "text": "Additionally, the results show that OTSL has an advantage over HTML", "bbox": {"l": 149.709, "t": 617.72205, "r": 480.59479, "b": 630.255, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "when applied on a bigger data set like PubTables-1M and achieves significantly", "bbox": {"l": 134.765, "t": 629.6770300000001, "r": 480.59857000000005, "b": 642.2099900000001, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "improved scores. Finally, OTSL achieves faster inference due to fewer decoding", "bbox": {"l": 134.765, "t": 641.63203, "r": 480.59384000000006, "b": 654.16499, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "steps which is a result of the reduced sequence representation.", "bbox": {"l": 134.765, "t": 653.58704, "r": 405.7995, "b": 666.12, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {"0": {"label": "table", "id": 0, "page_no": 0, "cluster": {"id": 0, "label": "table", "bbox": {"l": 139.6674041748047, "t": 337.5453796386719, "r": 475.00927734375, "b": 469.4945373535156, "coord_origin": "TOPLEFT"}, "confidence": 0.9901031255722046, "cells": [{"id": 22, "text": "#", "bbox": {"l": 160.37, "t": 339.45749, "r": 168.04523, "b": 350.74619, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "enc-layers", "bbox": {"l": 144.592, "t": 352.40848, "r": 183.82895, "b": 363.69717, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "#", "bbox": {"l": 207.974, "t": 339.45749, "r": 215.64923000000002, "b": 350.74619, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "dec-layers", "bbox": {"l": 192.19501, "t": 352.40848, "r": 231.42303, "b": 363.69717, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "Language", "bbox": {"l": 239.79799999999997, "t": 344.93649, "r": 278.3338, "b": 356.22519000000005, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "TEDs", "bbox": {"l": 324.67001, "t": 339.45749, "r": 348.26419, "b": 350.74619, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "mAP", "bbox": {"l": 396.271, "t": 339.45749, "r": 417.12595, "b": 350.74619, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "(0.75)", "bbox": {"l": 394.927, "t": 350.41647, "r": 418.46921, "b": 361.70517, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Inference", "bbox": {"l": 430.771, "t": 339.45749, "r": 467.14142000000004, "b": 350.74619, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "time (secs)", "bbox": {"l": 427.14801, "t": 350.41647, "r": 470.76955999999996, "b": 361.70517, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "simple", "bbox": {"l": 286.686, "t": 352.40848, "r": 312.32812, "b": 363.69717, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "complex", "bbox": {"l": 320.702, "t": 352.40848, "r": 353.71539, "b": 363.69717, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "all", "bbox": {"l": 369.306, "t": 352.40848, "r": 379.02914, "b": 363.69717, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "6", "bbox": {"l": 161.90601, "t": 371.23849, "r": 166.51474, "b": 382.52719, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "6", "bbox": {"l": 209.509, "t": 371.23849, "r": 214.11774, "b": 382.52719, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 365.75848, "r": 271.41064, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "0.965", "bbox": {"l": 289.017, "t": 365.75848, "r": 310.00732, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "0.934", "bbox": {"l": 326.71701, "t": 365.75848, "r": 347.70734, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "0.955", "bbox": {"l": 363.67599, "t": 365.75848, "r": 384.66632, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "0.88", "bbox": {"l": 397.26999, "t": 365.69571, "r": 416.12634, "b": 377.10098000000005, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "2.73", "bbox": {"l": 439.52701, "t": 365.69571, "r": 458.38336, "b": 377.10098000000005, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 378.71048, "r": 272.94495, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "0.969", "bbox": {"l": 289.017, "t": 378.71048, "r": 310.00732, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "0.927", "bbox": {"l": 326.71701, "t": 378.71048, "r": 347.70734, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "0.955", "bbox": {"l": 363.67599, "t": 378.71048, "r": 384.66632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "0.857", "bbox": {"l": 396.20599, "t": 378.71048, "r": 417.19632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "5.39", "bbox": {"l": 440.767, "t": 378.71048, "r": 457.15039, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "4", "bbox": {"l": 161.90601, "t": 397.53949, "r": 166.51474, "b": 408.82819, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "4", "bbox": {"l": 209.509, "t": 397.53949, "r": 214.11774, "b": 408.82819, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 392.06049, "r": 271.41064, "b": 403.34918, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "0.938", "bbox": {"l": 289.017, "t": 392.06049, "r": 310.00732, "b": 403.34918, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "0.904", "bbox": {"l": 326.71701, "t": 392.06049, "r": 347.70734, "b": 403.34918, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "0.927", "bbox": {"l": 363.67599, "t": 392.06049, "r": 384.66632, "b": 403.34918, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "0.853", "bbox": {"l": 394.61801, "t": 391.99771, "r": 418.77798, "b": 403.40298, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "1.97", "bbox": {"l": 439.52701, "t": 391.99771, "r": 458.38336, "b": 403.40298, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 405.01147, "r": 272.94495, "b": 416.30017, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "0.952", "bbox": {"l": 289.017, "t": 405.01147, "r": 310.00732, "b": 416.30017, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "0.909", "bbox": {"l": 326.71701, "t": 405.01147, "r": 347.70734, "b": 416.30017, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "0.938", "bbox": {"l": 362.08801, "t": 404.9486999999999, "r": 386.24799, "b": 416.35397, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "0.843", "bbox": {"l": 396.20599, "t": 405.01147, "r": 417.19632, "b": 416.30017, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "3.77", "bbox": {"l": 440.767, "t": 405.01147, "r": 457.15039, "b": 416.30017, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "2", "bbox": {"l": 161.90601, "t": 423.84048, "r": 166.51474, "b": 435.12918, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "4", "bbox": {"l": 209.509, "t": 423.84048, "r": 214.11774, "b": 435.12918, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 418.3614799999999, "r": 271.41064, "b": 429.65018, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "0.923", "bbox": {"l": 289.017, "t": 418.3614799999999, "r": 310.00732, "b": 429.65018, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "0.897", "bbox": {"l": 326.71701, "t": 418.3614799999999, "r": 347.70734, "b": 429.65018, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "0.915", "bbox": {"l": 363.67599, "t": 418.3614799999999, "r": 384.66632, "b": 429.65018, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "0.859", "bbox": {"l": 394.61801, "t": 418.29871, "r": 418.77798, "b": 429.70398, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "1.91", "bbox": {"l": 439.52701, "t": 418.29871, "r": 458.38336, "b": 429.70398, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 431.31246999999996, "r": 272.94495, "b": 442.60117, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "0.945", "bbox": {"l": 289.017, "t": 431.31246999999996, "r": 310.00732, "b": 442.60117, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "0.901", "bbox": {"l": 326.71701, "t": 431.31246999999996, "r": 347.70734, "b": 442.60117, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "0.931", "bbox": {"l": 362.08801, "t": 431.24969, "r": 386.24799, "b": 442.65497, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "0.834", "bbox": {"l": 396.20599, "t": 431.31246999999996, "r": 417.19632, "b": 442.60117, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "3.81", "bbox": {"l": 440.767, "t": 431.31246999999996, "r": 457.15039, "b": 442.60117, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "4", "bbox": {"l": 161.90601, "t": 450.14248999999995, "r": 166.51474, "b": 461.43118, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "2", "bbox": {"l": 209.509, "t": 450.14248999999995, "r": 214.11774, "b": 461.43118, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 444.66248, "r": 271.41064, "b": 455.95117, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "0.952", "bbox": {"l": 289.017, "t": 444.66248, "r": 310.00732, "b": 455.95117, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "0.92", "bbox": {"l": 329.021, "t": 444.66248, "r": 345.40439, "b": 455.95117, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "0.942", "bbox": {"l": 362.08801, "t": 444.5996999999999, "r": 386.24799, "b": 456.00497, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "0.857", "bbox": {"l": 394.61801, "t": 444.5996999999999, "r": 418.77798, "b": 456.00497, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "1.22", "bbox": {"l": 439.52701, "t": 444.5996999999999, "r": 458.38336, "b": 456.00497, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 457.61447, "r": 272.94495, "b": 468.90317, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "0.944", "bbox": {"l": 289.017, "t": 457.61447, "r": 310.00732, "b": 468.90317, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "0.903", "bbox": {"l": 326.71701, "t": 457.61447, "r": 347.70734, "b": 468.90317, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "0.931", "bbox": {"l": 363.67599, "t": 457.61447, "r": 384.66632, "b": 468.90317, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "0.824", "bbox": {"l": 396.20599, "t": 457.61447, "r": 417.19632, "b": 468.90317, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "2", "bbox": {"l": 446.65302, "t": 457.61447, "r": 451.26175, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": [{"id": 10, "label": "text", "bbox": {"l": 160.37, "t": 339.45749, "r": 168.04523, "b": 350.74619, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "#", "bbox": {"l": 160.37, "t": 339.45749, "r": 168.04523, "b": 350.74619, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 144.592, "t": 352.40848, "r": 183.82895, "b": 363.69717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "enc-layers", "bbox": {"l": 144.592, "t": 352.40848, "r": 183.82895, "b": 363.69717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 207.974, "t": 339.45749, "r": 215.64923000000002, "b": 350.74619, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "#", "bbox": {"l": 207.974, "t": 339.45749, "r": 215.64923000000002, "b": 350.74619, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 192.19501, "t": 352.40848, "r": 231.42303, "b": 363.69717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "dec-layers", "bbox": {"l": 192.19501, "t": 352.40848, "r": 231.42303, "b": 363.69717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 239.79799999999997, "t": 344.93649, "r": 278.3338, "b": 356.22519000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "Language", "bbox": {"l": 239.79799999999997, "t": 344.93649, "r": 278.3338, "b": 356.22519000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 324.67001, "t": 339.45749, "r": 348.26419, "b": 350.74619, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "TEDs", "bbox": {"l": 324.67001, "t": 339.45749, "r": 348.26419, "b": 350.74619, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 396.271, "t": 339.45749, "r": 417.12595, "b": 350.74619, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "mAP", "bbox": {"l": 396.271, "t": 339.45749, "r": 417.12595, "b": 350.74619, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 394.927, "t": 350.41647, "r": 418.46921, "b": 361.70517, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "(0.75)", "bbox": {"l": 394.927, "t": 350.41647, "r": 418.46921, "b": 361.70517, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 430.771, "t": 339.45749, "r": 467.14142000000004, "b": 350.74619, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "Inference", "bbox": {"l": 430.771, "t": 339.45749, "r": 467.14142000000004, "b": 350.74619, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 427.14801, "t": 350.41647, "r": 470.76955999999996, "b": 361.70517, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "time (secs)", "bbox": {"l": 427.14801, "t": 350.41647, "r": 470.76955999999996, "b": 361.70517, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 286.686, "t": 352.40848, "r": 312.32812, "b": 363.69717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "simple", "bbox": {"l": 286.686, "t": 352.40848, "r": 312.32812, "b": 363.69717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 320.702, "t": 352.40848, "r": 353.71539, "b": 363.69717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "complex", "bbox": {"l": 320.702, "t": 352.40848, "r": 353.71539, "b": 363.69717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 369.306, "t": 352.40848, "r": 379.02914, "b": 363.69717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "all", "bbox": {"l": 369.306, "t": 352.40848, "r": 379.02914, "b": 363.69717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 161.90601, "t": 371.23849, "r": 166.51474, "b": 382.52719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "6", "bbox": {"l": 161.90601, "t": 371.23849, "r": 166.51474, "b": 382.52719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 209.509, "t": 371.23849, "r": 214.11774, "b": 382.52719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "6", "bbox": {"l": 209.509, "t": 371.23849, "r": 214.11774, "b": 382.52719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 246.71000999999998, "t": 365.75848, "r": 271.41064, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 365.75848, "r": 271.41064, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 289.017, "t": 365.75848, "r": 310.00732, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "0.965", "bbox": {"l": 289.017, "t": 365.75848, "r": 310.00732, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 326.71701, "t": 365.75848, "r": 347.70734, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "0.934", "bbox": {"l": 326.71701, "t": 365.75848, "r": 347.70734, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 363.67599, "t": 365.75848, "r": 384.66632, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "0.955", "bbox": {"l": 363.67599, "t": 365.75848, "r": 384.66632, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 397.26999, "t": 365.69571, "r": 416.12634, "b": 377.10098000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "0.88", "bbox": {"l": 397.26999, "t": 365.69571, "r": 416.12634, "b": 377.10098000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 439.52701, "t": 365.69571, "r": 458.38336, "b": 377.10098000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "2.73", "bbox": {"l": 439.52701, "t": 365.69571, "r": 458.38336, "b": 377.10098000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 245.17598999999998, "t": 378.71048, "r": 272.94495, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 378.71048, "r": 272.94495, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 289.017, "t": 378.71048, "r": 310.00732, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "0.969", "bbox": {"l": 289.017, "t": 378.71048, "r": 310.00732, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 326.71701, "t": 378.71048, "r": 347.70734, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "0.927", "bbox": {"l": 326.71701, "t": 378.71048, "r": 347.70734, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 363.67599, "t": 378.71048, "r": 384.66632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "0.955", "bbox": {"l": 363.67599, "t": 378.71048, "r": 384.66632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 396.20599, "t": 378.71048, "r": 417.19632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "0.857", "bbox": {"l": 396.20599, "t": 378.71048, "r": 417.19632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 440.767, "t": 378.71048, "r": 457.15039, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "5.39", "bbox": {"l": 440.767, "t": 378.71048, "r": 457.15039, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 161.90601, "t": 397.53949, "r": 166.51474, "b": 408.82819, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "4", "bbox": {"l": 161.90601, "t": 397.53949, "r": 166.51474, "b": 408.82819, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 209.509, "t": 397.53949, "r": 214.11774, "b": 408.82819, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "4", "bbox": {"l": 209.509, "t": 397.53949, "r": 214.11774, "b": 408.82819, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 246.71000999999998, "t": 392.06049, "r": 271.41064, "b": 403.34918, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 392.06049, "r": 271.41064, "b": 403.34918, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 289.017, "t": 392.06049, "r": 310.00732, "b": 403.34918, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "0.938", "bbox": {"l": 289.017, "t": 392.06049, "r": 310.00732, "b": 403.34918, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 326.71701, "t": 392.06049, "r": 347.70734, "b": 403.34918, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "0.904", "bbox": {"l": 326.71701, "t": 392.06049, "r": 347.70734, "b": 403.34918, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 363.67599, "t": 392.06049, "r": 384.66632, "b": 403.34918, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "0.927", "bbox": {"l": 363.67599, "t": 392.06049, "r": 384.66632, "b": 403.34918, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 394.61801, "t": 391.99771, "r": 418.77798, "b": 403.40298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "0.853", "bbox": {"l": 394.61801, "t": 391.99771, "r": 418.77798, "b": 403.40298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 439.52701, "t": 391.99771, "r": 458.38336, "b": 403.40298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "1.97", "bbox": {"l": 439.52701, "t": 391.99771, "r": 458.38336, "b": 403.40298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 245.17598999999998, "t": 405.01147, "r": 272.94495, "b": 416.30017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 405.01147, "r": 272.94495, "b": 416.30017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 289.017, "t": 405.01147, "r": 310.00732, "b": 416.30017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "0.952", "bbox": {"l": 289.017, "t": 405.01147, "r": 310.00732, "b": 416.30017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 326.71701, "t": 405.01147, "r": 347.70734, "b": 416.30017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "0.909", "bbox": {"l": 326.71701, "t": 405.01147, "r": 347.70734, "b": 416.30017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 362.08801, "t": 404.9486999999999, "r": 386.24799, "b": 416.35397, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "0.938", "bbox": {"l": 362.08801, "t": 404.9486999999999, "r": 386.24799, "b": 416.35397, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 396.20599, "t": 405.01147, "r": 417.19632, "b": 416.30017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "0.843", "bbox": {"l": 396.20599, "t": 405.01147, "r": 417.19632, "b": 416.30017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 440.767, "t": 405.01147, "r": 457.15039, "b": 416.30017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "3.77", "bbox": {"l": 440.767, "t": 405.01147, "r": 457.15039, "b": 416.30017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 161.90601, "t": 423.84048, "r": 166.51474, "b": 435.12918, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "2", "bbox": {"l": 161.90601, "t": 423.84048, "r": 166.51474, "b": 435.12918, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 209.509, "t": 423.84048, "r": 214.11774, "b": 435.12918, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "4", "bbox": {"l": 209.509, "t": 423.84048, "r": 214.11774, "b": 435.12918, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 246.71000999999998, "t": 418.3614799999999, "r": 271.41064, "b": 429.65018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 418.3614799999999, "r": 271.41064, "b": 429.65018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 289.017, "t": 418.3614799999999, "r": 310.00732, "b": 429.65018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "0.923", "bbox": {"l": 289.017, "t": 418.3614799999999, "r": 310.00732, "b": 429.65018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 326.71701, "t": 418.3614799999999, "r": 347.70734, "b": 429.65018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "0.897", "bbox": {"l": 326.71701, "t": 418.3614799999999, "r": 347.70734, "b": 429.65018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 363.67599, "t": 418.3614799999999, "r": 384.66632, "b": 429.65018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "0.915", "bbox": {"l": 363.67599, "t": 418.3614799999999, "r": 384.66632, "b": 429.65018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 394.61801, "t": 418.29871, "r": 418.77798, "b": 429.70398, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "0.859", "bbox": {"l": 394.61801, "t": 418.29871, "r": 418.77798, "b": 429.70398, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 439.52701, "t": 418.29871, "r": 458.38336, "b": 429.70398, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "1.91", "bbox": {"l": 439.52701, "t": 418.29871, "r": 458.38336, "b": 429.70398, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 245.17598999999998, "t": 431.31246999999996, "r": 272.94495, "b": 442.60117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 431.31246999999996, "r": 272.94495, "b": 442.60117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 289.017, "t": 431.31246999999996, "r": 310.00732, "b": 442.60117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "0.945", "bbox": {"l": 289.017, "t": 431.31246999999996, "r": 310.00732, "b": 442.60117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 326.71701, "t": 431.31246999999996, "r": 347.70734, "b": 442.60117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "0.901", "bbox": {"l": 326.71701, "t": 431.31246999999996, "r": 347.70734, "b": 442.60117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 362.08801, "t": 431.24969, "r": 386.24799, "b": 442.65497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "0.931", "bbox": {"l": 362.08801, "t": 431.24969, "r": 386.24799, "b": 442.65497, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 396.20599, "t": 431.31246999999996, "r": 417.19632, "b": 442.60117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "0.834", "bbox": {"l": 396.20599, "t": 431.31246999999996, "r": 417.19632, "b": 442.60117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 440.767, "t": 431.31246999999996, "r": 457.15039, "b": 442.60117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "3.81", "bbox": {"l": 440.767, "t": 431.31246999999996, "r": 457.15039, "b": 442.60117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 161.90601, "t": 450.14248999999995, "r": 166.51474, "b": 461.43118, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "4", "bbox": {"l": 161.90601, "t": 450.14248999999995, "r": 166.51474, "b": 461.43118, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 209.509, "t": 450.14248999999995, "r": 214.11774, "b": 461.43118, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "2", "bbox": {"l": 209.509, "t": 450.14248999999995, "r": 214.11774, "b": 461.43118, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 246.71000999999998, "t": 444.66248, "r": 271.41064, "b": 455.95117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 444.66248, "r": 271.41064, "b": 455.95117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 289.017, "t": 444.66248, "r": 310.00732, "b": 455.95117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "0.952", "bbox": {"l": 289.017, "t": 444.66248, "r": 310.00732, "b": 455.95117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 329.021, "t": 444.66248, "r": 345.40439, "b": 455.95117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "0.92", "bbox": {"l": 329.021, "t": 444.66248, "r": 345.40439, "b": 455.95117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 362.08801, "t": 444.5996999999999, "r": 386.24799, "b": 456.00497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "0.942", "bbox": {"l": 362.08801, "t": 444.5996999999999, "r": 386.24799, "b": 456.00497, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 394.61801, "t": 444.5996999999999, "r": 418.77798, "b": 456.00497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "0.857", "bbox": {"l": 394.61801, "t": 444.5996999999999, "r": 418.77798, "b": 456.00497, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 439.52701, "t": 444.5996999999999, "r": 458.38336, "b": 456.00497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "1.22", "bbox": {"l": 439.52701, "t": 444.5996999999999, "r": 458.38336, "b": 456.00497, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 245.17598999999998, "t": 457.61447, "r": 272.94495, "b": 468.90317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 457.61447, "r": 272.94495, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 289.017, "t": 457.61447, "r": 310.00732, "b": 468.90317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "0.944", "bbox": {"l": 289.017, "t": 457.61447, "r": 310.00732, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 326.71701, "t": 457.61447, "r": 347.70734, "b": 468.90317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "0.903", "bbox": {"l": 326.71701, "t": 457.61447, "r": 347.70734, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 363.67599, "t": 457.61447, "r": 384.66632, "b": 468.90317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "0.931", "bbox": {"l": 363.67599, "t": 457.61447, "r": 384.66632, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 396.20599, "t": 457.61447, "r": 417.19632, "b": 468.90317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "0.824", "bbox": {"l": 396.20599, "t": 457.61447, "r": 417.19632, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 446.65302, "t": 457.61447, "r": 451.26175, "b": 468.90317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "2", "bbox": {"l": 446.65302, "t": 457.61447, "r": 451.26175, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "lcel", "lcel", "ched", "ched", "nl", "ched", "ched", "ucel", "ched", "ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 7, "num_cols": 8, "table_cells": [{"bbox": {"l": 160.37, "t": 339.45749, "r": 168.04523, "b": 350.74619, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "#", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 144.592, "t": 352.40848, "r": 183.82895, "b": 363.69717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "enc-layers", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 207.974, "t": 339.45749, "r": 215.64923000000002, "b": 350.74619, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "#", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 192.19501, "t": 352.40848, "r": 231.42303, "b": 363.69717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "dec-layers", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 239.79799999999997, "t": 344.93649, "r": 278.3338, "b": 356.22519000000005, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Language", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 324.67001, "t": 339.45749, "r": 348.26419, "b": 350.74619, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 3, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 6, "text": "TEDs", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 396.271, "t": 339.45749, "r": 417.12595, "b": 350.74619, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "mAP", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 394.927, "t": 350.41647, "r": 418.46921, "b": 361.70517, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "(0.75)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 430.771, "t": 339.45749, "r": 467.14142000000004, "b": 350.74619, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "Inference", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 427.14801, "t": 350.41647, "r": 470.76955999999996, "b": 361.70517, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "time (secs)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 286.686, "t": 352.40848, "r": 312.32812, "b": 363.69717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "simple", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 320.702, "t": 352.40848, "r": 353.71539, "b": 363.69717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "complex", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 369.306, "t": 352.40848, "r": 379.02914, "b": 363.69717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "all", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 161.90601, "t": 371.23849, "r": 166.51474, "b": 382.52719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 371.23849, "r": 214.11774, "b": 382.52719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 365.75848, "r": 272.94495, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 365.75848, "r": 310.00732, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.965 0.969", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 365.75848, "r": 347.70734, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.934 0.927", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 363.67599, "t": 365.75848, "r": 384.66632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.955 0.955", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 396.20599, "t": 365.69571, "r": 417.19632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.88 0.857", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 365.69571, "r": 458.38336, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "2.73 5.39", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 161.90601, "t": 397.53949, "r": 166.51474, "b": 408.82819, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 397.53949, "r": 214.11774, "b": 408.82819, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 392.06049, "r": 272.94495, "b": 416.30017, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 392.06049, "r": 310.00732, "b": 403.34918, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.938", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 392.06049, "r": 347.70734, "b": 403.34918, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.904", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 363.67599, "t": 392.06049, "r": 384.66632, "b": 403.34918, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.927", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.61801, "t": 391.99771, "r": 418.77798, "b": 403.40298, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.853", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 391.99771, "r": 458.38336, "b": 403.40298, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "1.97", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 405.01147, "r": 310.00732, "b": 429.65018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.952 0.923", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 405.01147, "r": 347.70734, "b": 416.30017, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.909", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 362.08801, "t": 404.9486999999999, "r": 386.24799, "b": 416.35397, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.938", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 396.20599, "t": 405.01147, "r": 417.19632, "b": 416.30017, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.843", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.767, "t": 405.01147, "r": 457.15039, "b": 416.30017, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "3.77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 161.90601, "t": 423.84048, "r": 166.51474, "b": 435.12918, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 423.84048, "r": 214.11774, "b": 435.12918, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 246.71000999999998, "t": 418.3614799999999, "r": 271.41064, "b": 429.65018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 418.3614799999999, "r": 347.70734, "b": 442.60117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.897 0.901", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 362.08801, "t": 418.3614799999999, "r": 386.24799, "b": 442.65497, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.915 0.931", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.61801, "t": 418.29871, "r": 418.77798, "b": 442.60117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.859 0.834", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 418.29871, "r": 458.38336, "b": 442.60117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "1.91 3.81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 431.31246999999996, "r": 272.94495, "b": 442.60117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 431.31246999999996, "r": 310.00732, "b": 442.60117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.945", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 161.90601, "t": 450.14248999999995, "r": 166.51474, "b": 461.43118, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 450.14248999999995, "r": 214.11774, "b": 461.43118, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 444.66248, "r": 272.94495, "b": 468.90317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 444.66248, "r": 310.00732, "b": 468.90317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.952 0.944", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 444.66248, "r": 347.70734, "b": 468.90317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.92 0.903", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 362.08801, "t": 444.5996999999999, "r": 386.24799, "b": 468.90317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.942 0.931", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.61801, "t": 444.5996999999999, "r": 418.77798, "b": 468.90317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.857 0.824", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 444.5996999999999, "r": 458.38336, "b": 468.90317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "1.22 2", "column_header": false, "row_header": false, "row_section": false}]}}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_header", "id": 8, "page_no": 0, "cluster": {"id": 8, "label": "page_header", "bbox": {"l": 194.478, "t": 91.49352999999996, "r": 447.54476999999997, "b": 102.78223000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9373531937599182, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 91.49352999999996, "r": 447.54476999999997, "b": 102.78223000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Optimized Table Tokenization for Table Structure Recognition"}, {"label": "page_header", "id": 9, "page_no": 0, "cluster": {"id": 9, "label": "page_header", "bbox": {"l": 475.98441, "t": 91.49352999999996, "r": 480.59314, "b": 102.78223000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.8858679533004761, "cells": [{"id": 1, "text": "9", "bbox": {"l": 475.98441, "t": 91.49352999999996, "r": 480.59314, "b": 102.78223000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "9"}, {"label": "text", "id": 4, "page_no": 0, "cluster": {"id": 4, "label": "text", "bbox": {"l": 134.765, "t": 116.46301000000005, "r": 480.59665, "b": 152.90697999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.9806435108184814, "cells": [{"id": 2, "text": "order to compute the TED score. Inference timing results for all experiments", "bbox": {"l": 134.765, "t": 116.46301000000005, "r": 480.59067, "b": 128.99597000000006, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "were obtained from the same machine on a single core with AMD EPYC 7763", "bbox": {"l": 134.765, "t": 128.41803000000004, "r": 480.59665, "b": 140.95099000000005, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "CPU @2.45 GHz.", "bbox": {"l": 134.765, "t": 140.37401999999997, "r": 210.78761, "b": 152.90697999999998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "order to compute the TED score. Inference timing results for all experiments were obtained from the same machine on a single core with AMD EPYC 7763 CPU @2.45 GHz."}, {"label": "section_header", "id": 7, "page_no": 0, "cluster": {"id": 7, "label": "section_header", "bbox": {"l": 134.765, "t": 166.70514000000003, "r": 318.45145, "b": 179.20818999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.957740306854248, "cells": [{"id": 5, "text": "5.1", "bbox": {"l": 134.765, "t": 166.70514000000003, "r": 149.40306, "b": 179.20818999999995, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Hyper Parameter Optimization", "bbox": {"l": 160.85905, "t": 166.70514000000003, "r": 318.45145, "b": 179.20818999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5.1 Hyper Parameter Optimization"}, {"label": "text", "id": 1, "page_no": 0, "cluster": {"id": 1, "label": "text", "bbox": {"l": 134.765, "t": 183.11505, "r": 480.59567, "b": 255.42400999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9850425124168396, "cells": [{"id": 7, "text": "We have chosen the PubTabNet data set to perform HPO, since it includes a", "bbox": {"l": 134.765, "t": 183.11505, "r": 479.74982000000006, "b": 195.64801, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "highly diverse set of tables. Also we report TED scores separately for simple and", "bbox": {"l": 134.765, "t": 195.07007, "r": 480.58765, "b": 207.60303, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "complex tables (tables with cell spans). Results are presented in Table. 1. It is", "bbox": {"l": 134.765, "t": 207.02502000000004, "r": 480.58859000000007, "b": 219.55798000000004, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "evident that with OTSL, our model achieves the same TED score and slightly", "bbox": {"l": 134.765, "t": 218.98004000000003, "r": 480.59567, "b": 231.51300000000003, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "better mAP scores in comparison to HTML. However OTSL yields a", "bbox": {"l": 134.765, "t": 230.93506000000002, "r": 440.9425, "b": 243.46802000000002, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "2x speed", "bbox": {"l": 444.86800999999997, "t": 230.98486000000003, "r": 480.58792, "b": 243.46802000000002, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "up", "bbox": {"l": 134.765, "t": 242.94086000000004, "r": 145.19585, "b": 255.42400999999995, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "in the inference runtime over HTML.", "bbox": {"l": 149.149, "t": 242.89104999999995, "r": 311.22256, "b": 255.42400999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "We have chosen the PubTabNet data set to perform HPO, since it includes a highly diverse set of tables. Also we report TED scores separately for simple and complex tables (tables with cell spans). Results are presented in Table. 1. It is evident that with OTSL, our model achieves the same TED score and slightly better mAP scores in comparison to HTML. However OTSL yields a 2x speed up in the inference runtime over HTML."}, {"label": "caption", "id": 5, "page_no": 0, "cluster": {"id": 5, "label": "caption", "bbox": {"l": 134.765, "t": 272.79474000000005, "r": 480.59890999999993, "b": 327.98218, "coord_origin": "TOPLEFT"}, "confidence": 0.9591906070709229, "cells": [{"id": 15, "text": "Table", "bbox": {"l": 134.765, "t": 272.79474000000005, "r": 159.22983, "b": 284.1999799999999, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "1.", "bbox": {"l": 167.34442, "t": 272.79474000000005, "r": 174.71301, "b": 284.1999799999999, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "HPO performed in OTSL and HTML representation on the same", "bbox": {"l": 188.133, "t": 272.85748, "r": 480.58101999999997, "b": 284.14618, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "transformer-based TableFormer [9] architecture, trained only on PubTabNet [22]. Ef-", "bbox": {"l": 134.765, "t": 283.81647, "r": 480.59890999999993, "b": 295.10516000000007, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "fects of reducing the # of layers in encoder and decoder stages of the model show that", "bbox": {"l": 134.765, "t": 294.77547999999996, "r": 480.59887999999995, "b": 306.06418, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "smaller models trained on OTSL perform better, especially in recognizing complex", "bbox": {"l": 134.765, "t": 305.73447, "r": 480.59180000000003, "b": 317.02316, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "table structures, and maintain a much higher mAP score than the HTML counterpart.", "bbox": {"l": 134.765, "t": 316.69348, "r": 480.58471999999995, "b": 327.98218, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 1. HPO performed in OTSL and HTML representation on the same transformer-based TableFormer [9] architecture, trained only on PubTabNet [22]. Effects of reducing the # of layers in encoder and decoder stages of the model show that smaller models trained on OTSL perform better, especially in recognizing complex table structures, and maintain a much higher mAP score than the HTML counterpart."}, {"label": "table", "id": 0, "page_no": 0, "cluster": {"id": 0, "label": "table", "bbox": {"l": 139.6674041748047, "t": 337.5453796386719, "r": 475.00927734375, "b": 469.4945373535156, "coord_origin": "TOPLEFT"}, "confidence": 0.9901031255722046, "cells": [{"id": 22, "text": "#", "bbox": {"l": 160.37, "t": 339.45749, "r": 168.04523, "b": 350.74619, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "enc-layers", "bbox": {"l": 144.592, "t": 352.40848, "r": 183.82895, "b": 363.69717, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "#", "bbox": {"l": 207.974, "t": 339.45749, "r": 215.64923000000002, "b": 350.74619, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "dec-layers", "bbox": {"l": 192.19501, "t": 352.40848, "r": 231.42303, "b": 363.69717, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "Language", "bbox": {"l": 239.79799999999997, "t": 344.93649, "r": 278.3338, "b": 356.22519000000005, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "TEDs", "bbox": {"l": 324.67001, "t": 339.45749, "r": 348.26419, "b": 350.74619, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "mAP", "bbox": {"l": 396.271, "t": 339.45749, "r": 417.12595, "b": 350.74619, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "(0.75)", "bbox": {"l": 394.927, "t": 350.41647, "r": 418.46921, "b": 361.70517, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Inference", "bbox": {"l": 430.771, "t": 339.45749, "r": 467.14142000000004, "b": 350.74619, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "time (secs)", "bbox": {"l": 427.14801, "t": 350.41647, "r": 470.76955999999996, "b": 361.70517, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "simple", "bbox": {"l": 286.686, "t": 352.40848, "r": 312.32812, "b": 363.69717, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "complex", "bbox": {"l": 320.702, "t": 352.40848, "r": 353.71539, "b": 363.69717, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "all", "bbox": {"l": 369.306, "t": 352.40848, "r": 379.02914, "b": 363.69717, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "6", "bbox": {"l": 161.90601, "t": 371.23849, "r": 166.51474, "b": 382.52719, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "6", "bbox": {"l": 209.509, "t": 371.23849, "r": 214.11774, "b": 382.52719, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 365.75848, "r": 271.41064, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "0.965", "bbox": {"l": 289.017, "t": 365.75848, "r": 310.00732, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "0.934", "bbox": {"l": 326.71701, "t": 365.75848, "r": 347.70734, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "0.955", "bbox": {"l": 363.67599, "t": 365.75848, "r": 384.66632, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "0.88", "bbox": {"l": 397.26999, "t": 365.69571, "r": 416.12634, "b": 377.10098000000005, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "2.73", "bbox": {"l": 439.52701, "t": 365.69571, "r": 458.38336, "b": 377.10098000000005, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 378.71048, "r": 272.94495, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "0.969", "bbox": {"l": 289.017, "t": 378.71048, "r": 310.00732, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "0.927", "bbox": {"l": 326.71701, "t": 378.71048, "r": 347.70734, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "0.955", "bbox": {"l": 363.67599, "t": 378.71048, "r": 384.66632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "0.857", "bbox": {"l": 396.20599, "t": 378.71048, "r": 417.19632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "5.39", "bbox": {"l": 440.767, "t": 378.71048, "r": 457.15039, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "4", "bbox": {"l": 161.90601, "t": 397.53949, "r": 166.51474, "b": 408.82819, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "4", "bbox": {"l": 209.509, "t": 397.53949, "r": 214.11774, "b": 408.82819, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 392.06049, "r": 271.41064, "b": 403.34918, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "0.938", "bbox": {"l": 289.017, "t": 392.06049, "r": 310.00732, "b": 403.34918, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "0.904", "bbox": {"l": 326.71701, "t": 392.06049, "r": 347.70734, "b": 403.34918, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "0.927", "bbox": {"l": 363.67599, "t": 392.06049, "r": 384.66632, "b": 403.34918, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "0.853", "bbox": {"l": 394.61801, "t": 391.99771, "r": 418.77798, "b": 403.40298, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "1.97", "bbox": {"l": 439.52701, "t": 391.99771, "r": 458.38336, "b": 403.40298, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 405.01147, "r": 272.94495, "b": 416.30017, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "0.952", "bbox": {"l": 289.017, "t": 405.01147, "r": 310.00732, "b": 416.30017, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "0.909", "bbox": {"l": 326.71701, "t": 405.01147, "r": 347.70734, "b": 416.30017, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "0.938", "bbox": {"l": 362.08801, "t": 404.9486999999999, "r": 386.24799, "b": 416.35397, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "0.843", "bbox": {"l": 396.20599, "t": 405.01147, "r": 417.19632, "b": 416.30017, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "3.77", "bbox": {"l": 440.767, "t": 405.01147, "r": 457.15039, "b": 416.30017, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "2", "bbox": {"l": 161.90601, "t": 423.84048, "r": 166.51474, "b": 435.12918, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "4", "bbox": {"l": 209.509, "t": 423.84048, "r": 214.11774, "b": 435.12918, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 418.3614799999999, "r": 271.41064, "b": 429.65018, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "0.923", "bbox": {"l": 289.017, "t": 418.3614799999999, "r": 310.00732, "b": 429.65018, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "0.897", "bbox": {"l": 326.71701, "t": 418.3614799999999, "r": 347.70734, "b": 429.65018, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "0.915", "bbox": {"l": 363.67599, "t": 418.3614799999999, "r": 384.66632, "b": 429.65018, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "0.859", "bbox": {"l": 394.61801, "t": 418.29871, "r": 418.77798, "b": 429.70398, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "1.91", "bbox": {"l": 439.52701, "t": 418.29871, "r": 458.38336, "b": 429.70398, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 431.31246999999996, "r": 272.94495, "b": 442.60117, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "0.945", "bbox": {"l": 289.017, "t": 431.31246999999996, "r": 310.00732, "b": 442.60117, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "0.901", "bbox": {"l": 326.71701, "t": 431.31246999999996, "r": 347.70734, "b": 442.60117, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "0.931", "bbox": {"l": 362.08801, "t": 431.24969, "r": 386.24799, "b": 442.65497, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "0.834", "bbox": {"l": 396.20599, "t": 431.31246999999996, "r": 417.19632, "b": 442.60117, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "3.81", "bbox": {"l": 440.767, "t": 431.31246999999996, "r": 457.15039, "b": 442.60117, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "4", "bbox": {"l": 161.90601, "t": 450.14248999999995, "r": 166.51474, "b": 461.43118, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "2", "bbox": {"l": 209.509, "t": 450.14248999999995, "r": 214.11774, "b": 461.43118, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 444.66248, "r": 271.41064, "b": 455.95117, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "0.952", "bbox": {"l": 289.017, "t": 444.66248, "r": 310.00732, "b": 455.95117, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "0.92", "bbox": {"l": 329.021, "t": 444.66248, "r": 345.40439, "b": 455.95117, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "0.942", "bbox": {"l": 362.08801, "t": 444.5996999999999, "r": 386.24799, "b": 456.00497, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "0.857", "bbox": {"l": 394.61801, "t": 444.5996999999999, "r": 418.77798, "b": 456.00497, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "1.22", "bbox": {"l": 439.52701, "t": 444.5996999999999, "r": 458.38336, "b": 456.00497, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 457.61447, "r": 272.94495, "b": 468.90317, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "0.944", "bbox": {"l": 289.017, "t": 457.61447, "r": 310.00732, "b": 468.90317, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "0.903", "bbox": {"l": 326.71701, "t": 457.61447, "r": 347.70734, "b": 468.90317, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "0.931", "bbox": {"l": 363.67599, "t": 457.61447, "r": 384.66632, "b": 468.90317, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "0.824", "bbox": {"l": 396.20599, "t": 457.61447, "r": 417.19632, "b": 468.90317, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "2", "bbox": {"l": 446.65302, "t": 457.61447, "r": 451.26175, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": [{"id": 10, "label": "text", "bbox": {"l": 160.37, "t": 339.45749, "r": 168.04523, "b": 350.74619, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "#", "bbox": {"l": 160.37, "t": 339.45749, "r": 168.04523, "b": 350.74619, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 144.592, "t": 352.40848, "r": 183.82895, "b": 363.69717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "enc-layers", "bbox": {"l": 144.592, "t": 352.40848, "r": 183.82895, "b": 363.69717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 207.974, "t": 339.45749, "r": 215.64923000000002, "b": 350.74619, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "#", "bbox": {"l": 207.974, "t": 339.45749, "r": 215.64923000000002, "b": 350.74619, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 192.19501, "t": 352.40848, "r": 231.42303, "b": 363.69717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "dec-layers", "bbox": {"l": 192.19501, "t": 352.40848, "r": 231.42303, "b": 363.69717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 239.79799999999997, "t": 344.93649, "r": 278.3338, "b": 356.22519000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "Language", "bbox": {"l": 239.79799999999997, "t": 344.93649, "r": 278.3338, "b": 356.22519000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 324.67001, "t": 339.45749, "r": 348.26419, "b": 350.74619, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "TEDs", "bbox": {"l": 324.67001, "t": 339.45749, "r": 348.26419, "b": 350.74619, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 396.271, "t": 339.45749, "r": 417.12595, "b": 350.74619, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "mAP", "bbox": {"l": 396.271, "t": 339.45749, "r": 417.12595, "b": 350.74619, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 394.927, "t": 350.41647, "r": 418.46921, "b": 361.70517, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "(0.75)", "bbox": {"l": 394.927, "t": 350.41647, "r": 418.46921, "b": 361.70517, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 430.771, "t": 339.45749, "r": 467.14142000000004, "b": 350.74619, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "Inference", "bbox": {"l": 430.771, "t": 339.45749, "r": 467.14142000000004, "b": 350.74619, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 427.14801, "t": 350.41647, "r": 470.76955999999996, "b": 361.70517, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "time (secs)", "bbox": {"l": 427.14801, "t": 350.41647, "r": 470.76955999999996, "b": 361.70517, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 286.686, "t": 352.40848, "r": 312.32812, "b": 363.69717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "simple", "bbox": {"l": 286.686, "t": 352.40848, "r": 312.32812, "b": 363.69717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 320.702, "t": 352.40848, "r": 353.71539, "b": 363.69717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "complex", "bbox": {"l": 320.702, "t": 352.40848, "r": 353.71539, "b": 363.69717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 369.306, "t": 352.40848, "r": 379.02914, "b": 363.69717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "all", "bbox": {"l": 369.306, "t": 352.40848, "r": 379.02914, "b": 363.69717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 161.90601, "t": 371.23849, "r": 166.51474, "b": 382.52719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "6", "bbox": {"l": 161.90601, "t": 371.23849, "r": 166.51474, "b": 382.52719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 209.509, "t": 371.23849, "r": 214.11774, "b": 382.52719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "6", "bbox": {"l": 209.509, "t": 371.23849, "r": 214.11774, "b": 382.52719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 246.71000999999998, "t": 365.75848, "r": 271.41064, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 365.75848, "r": 271.41064, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 289.017, "t": 365.75848, "r": 310.00732, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "0.965", "bbox": {"l": 289.017, "t": 365.75848, "r": 310.00732, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 326.71701, "t": 365.75848, "r": 347.70734, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "0.934", "bbox": {"l": 326.71701, "t": 365.75848, "r": 347.70734, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 363.67599, "t": 365.75848, "r": 384.66632, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "0.955", "bbox": {"l": 363.67599, "t": 365.75848, "r": 384.66632, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 397.26999, "t": 365.69571, "r": 416.12634, "b": 377.10098000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "0.88", "bbox": {"l": 397.26999, "t": 365.69571, "r": 416.12634, "b": 377.10098000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 439.52701, "t": 365.69571, "r": 458.38336, "b": 377.10098000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "2.73", "bbox": {"l": 439.52701, "t": 365.69571, "r": 458.38336, "b": 377.10098000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 245.17598999999998, "t": 378.71048, "r": 272.94495, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 378.71048, "r": 272.94495, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 289.017, "t": 378.71048, "r": 310.00732, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "0.969", "bbox": {"l": 289.017, "t": 378.71048, "r": 310.00732, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 326.71701, "t": 378.71048, "r": 347.70734, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "0.927", "bbox": {"l": 326.71701, "t": 378.71048, "r": 347.70734, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 363.67599, "t": 378.71048, "r": 384.66632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "0.955", "bbox": {"l": 363.67599, "t": 378.71048, "r": 384.66632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 396.20599, "t": 378.71048, "r": 417.19632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "0.857", "bbox": {"l": 396.20599, "t": 378.71048, "r": 417.19632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 440.767, "t": 378.71048, "r": 457.15039, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "5.39", "bbox": {"l": 440.767, "t": 378.71048, "r": 457.15039, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 161.90601, "t": 397.53949, "r": 166.51474, "b": 408.82819, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "4", "bbox": {"l": 161.90601, "t": 397.53949, "r": 166.51474, "b": 408.82819, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 209.509, "t": 397.53949, "r": 214.11774, "b": 408.82819, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "4", "bbox": {"l": 209.509, "t": 397.53949, "r": 214.11774, "b": 408.82819, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 246.71000999999998, "t": 392.06049, "r": 271.41064, "b": 403.34918, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 392.06049, "r": 271.41064, "b": 403.34918, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 289.017, "t": 392.06049, "r": 310.00732, "b": 403.34918, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "0.938", "bbox": {"l": 289.017, "t": 392.06049, "r": 310.00732, "b": 403.34918, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 326.71701, "t": 392.06049, "r": 347.70734, "b": 403.34918, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "0.904", "bbox": {"l": 326.71701, "t": 392.06049, "r": 347.70734, "b": 403.34918, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 363.67599, "t": 392.06049, "r": 384.66632, "b": 403.34918, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "0.927", "bbox": {"l": 363.67599, "t": 392.06049, "r": 384.66632, "b": 403.34918, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 394.61801, "t": 391.99771, "r": 418.77798, "b": 403.40298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "0.853", "bbox": {"l": 394.61801, "t": 391.99771, "r": 418.77798, "b": 403.40298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 439.52701, "t": 391.99771, "r": 458.38336, "b": 403.40298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "1.97", "bbox": {"l": 439.52701, "t": 391.99771, "r": 458.38336, "b": 403.40298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 245.17598999999998, "t": 405.01147, "r": 272.94495, "b": 416.30017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 405.01147, "r": 272.94495, "b": 416.30017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 289.017, "t": 405.01147, "r": 310.00732, "b": 416.30017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "0.952", "bbox": {"l": 289.017, "t": 405.01147, "r": 310.00732, "b": 416.30017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 326.71701, "t": 405.01147, "r": 347.70734, "b": 416.30017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "0.909", "bbox": {"l": 326.71701, "t": 405.01147, "r": 347.70734, "b": 416.30017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 362.08801, "t": 404.9486999999999, "r": 386.24799, "b": 416.35397, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "0.938", "bbox": {"l": 362.08801, "t": 404.9486999999999, "r": 386.24799, "b": 416.35397, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 396.20599, "t": 405.01147, "r": 417.19632, "b": 416.30017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "0.843", "bbox": {"l": 396.20599, "t": 405.01147, "r": 417.19632, "b": 416.30017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 440.767, "t": 405.01147, "r": 457.15039, "b": 416.30017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "3.77", "bbox": {"l": 440.767, "t": 405.01147, "r": 457.15039, "b": 416.30017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 161.90601, "t": 423.84048, "r": 166.51474, "b": 435.12918, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "2", "bbox": {"l": 161.90601, "t": 423.84048, "r": 166.51474, "b": 435.12918, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 209.509, "t": 423.84048, "r": 214.11774, "b": 435.12918, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "4", "bbox": {"l": 209.509, "t": 423.84048, "r": 214.11774, "b": 435.12918, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 246.71000999999998, "t": 418.3614799999999, "r": 271.41064, "b": 429.65018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 418.3614799999999, "r": 271.41064, "b": 429.65018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 289.017, "t": 418.3614799999999, "r": 310.00732, "b": 429.65018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "0.923", "bbox": {"l": 289.017, "t": 418.3614799999999, "r": 310.00732, "b": 429.65018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 326.71701, "t": 418.3614799999999, "r": 347.70734, "b": 429.65018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "0.897", "bbox": {"l": 326.71701, "t": 418.3614799999999, "r": 347.70734, "b": 429.65018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 363.67599, "t": 418.3614799999999, "r": 384.66632, "b": 429.65018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "0.915", "bbox": {"l": 363.67599, "t": 418.3614799999999, "r": 384.66632, "b": 429.65018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 394.61801, "t": 418.29871, "r": 418.77798, "b": 429.70398, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "0.859", "bbox": {"l": 394.61801, "t": 418.29871, "r": 418.77798, "b": 429.70398, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 439.52701, "t": 418.29871, "r": 458.38336, "b": 429.70398, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "1.91", "bbox": {"l": 439.52701, "t": 418.29871, "r": 458.38336, "b": 429.70398, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 245.17598999999998, "t": 431.31246999999996, "r": 272.94495, "b": 442.60117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 431.31246999999996, "r": 272.94495, "b": 442.60117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 289.017, "t": 431.31246999999996, "r": 310.00732, "b": 442.60117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "0.945", "bbox": {"l": 289.017, "t": 431.31246999999996, "r": 310.00732, "b": 442.60117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 326.71701, "t": 431.31246999999996, "r": 347.70734, "b": 442.60117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "0.901", "bbox": {"l": 326.71701, "t": 431.31246999999996, "r": 347.70734, "b": 442.60117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 362.08801, "t": 431.24969, "r": 386.24799, "b": 442.65497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "0.931", "bbox": {"l": 362.08801, "t": 431.24969, "r": 386.24799, "b": 442.65497, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 396.20599, "t": 431.31246999999996, "r": 417.19632, "b": 442.60117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "0.834", "bbox": {"l": 396.20599, "t": 431.31246999999996, "r": 417.19632, "b": 442.60117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 440.767, "t": 431.31246999999996, "r": 457.15039, "b": 442.60117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "3.81", "bbox": {"l": 440.767, "t": 431.31246999999996, "r": 457.15039, "b": 442.60117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 161.90601, "t": 450.14248999999995, "r": 166.51474, "b": 461.43118, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "4", "bbox": {"l": 161.90601, "t": 450.14248999999995, "r": 166.51474, "b": 461.43118, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 209.509, "t": 450.14248999999995, "r": 214.11774, "b": 461.43118, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "2", "bbox": {"l": 209.509, "t": 450.14248999999995, "r": 214.11774, "b": 461.43118, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 246.71000999999998, "t": 444.66248, "r": 271.41064, "b": 455.95117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 444.66248, "r": 271.41064, "b": 455.95117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 289.017, "t": 444.66248, "r": 310.00732, "b": 455.95117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "0.952", "bbox": {"l": 289.017, "t": 444.66248, "r": 310.00732, "b": 455.95117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 329.021, "t": 444.66248, "r": 345.40439, "b": 455.95117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "0.92", "bbox": {"l": 329.021, "t": 444.66248, "r": 345.40439, "b": 455.95117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 362.08801, "t": 444.5996999999999, "r": 386.24799, "b": 456.00497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "0.942", "bbox": {"l": 362.08801, "t": 444.5996999999999, "r": 386.24799, "b": 456.00497, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 394.61801, "t": 444.5996999999999, "r": 418.77798, "b": 456.00497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "0.857", "bbox": {"l": 394.61801, "t": 444.5996999999999, "r": 418.77798, "b": 456.00497, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 439.52701, "t": 444.5996999999999, "r": 458.38336, "b": 456.00497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "1.22", "bbox": {"l": 439.52701, "t": 444.5996999999999, "r": 458.38336, "b": 456.00497, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 245.17598999999998, "t": 457.61447, "r": 272.94495, "b": 468.90317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 457.61447, "r": 272.94495, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 289.017, "t": 457.61447, "r": 310.00732, "b": 468.90317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "0.944", "bbox": {"l": 289.017, "t": 457.61447, "r": 310.00732, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 326.71701, "t": 457.61447, "r": 347.70734, "b": 468.90317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "0.903", "bbox": {"l": 326.71701, "t": 457.61447, "r": 347.70734, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 363.67599, "t": 457.61447, "r": 384.66632, "b": 468.90317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "0.931", "bbox": {"l": 363.67599, "t": 457.61447, "r": 384.66632, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 396.20599, "t": 457.61447, "r": 417.19632, "b": 468.90317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "0.824", "bbox": {"l": 396.20599, "t": 457.61447, "r": 417.19632, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 446.65302, "t": 457.61447, "r": 451.26175, "b": 468.90317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "2", "bbox": {"l": 446.65302, "t": 457.61447, "r": 451.26175, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "lcel", "lcel", "ched", "ched", "nl", "ched", "ched", "ucel", "ched", "ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 7, "num_cols": 8, "table_cells": [{"bbox": {"l": 160.37, "t": 339.45749, "r": 168.04523, "b": 350.74619, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "#", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 144.592, "t": 352.40848, "r": 183.82895, "b": 363.69717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "enc-layers", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 207.974, "t": 339.45749, "r": 215.64923000000002, "b": 350.74619, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "#", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 192.19501, "t": 352.40848, "r": 231.42303, "b": 363.69717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "dec-layers", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 239.79799999999997, "t": 344.93649, "r": 278.3338, "b": 356.22519000000005, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Language", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 324.67001, "t": 339.45749, "r": 348.26419, "b": 350.74619, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 3, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 6, "text": "TEDs", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 396.271, "t": 339.45749, "r": 417.12595, "b": 350.74619, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "mAP", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 394.927, "t": 350.41647, "r": 418.46921, "b": 361.70517, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "(0.75)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 430.771, "t": 339.45749, "r": 467.14142000000004, "b": 350.74619, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "Inference", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 427.14801, "t": 350.41647, "r": 470.76955999999996, "b": 361.70517, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "time (secs)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 286.686, "t": 352.40848, "r": 312.32812, "b": 363.69717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "simple", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 320.702, "t": 352.40848, "r": 353.71539, "b": 363.69717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "complex", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 369.306, "t": 352.40848, "r": 379.02914, "b": 363.69717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "all", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 161.90601, "t": 371.23849, "r": 166.51474, "b": 382.52719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 371.23849, "r": 214.11774, "b": 382.52719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 365.75848, "r": 272.94495, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 365.75848, "r": 310.00732, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.965 0.969", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 365.75848, "r": 347.70734, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.934 0.927", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 363.67599, "t": 365.75848, "r": 384.66632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.955 0.955", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 396.20599, "t": 365.69571, "r": 417.19632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.88 0.857", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 365.69571, "r": 458.38336, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "2.73 5.39", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 161.90601, "t": 397.53949, "r": 166.51474, "b": 408.82819, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 397.53949, "r": 214.11774, "b": 408.82819, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 392.06049, "r": 272.94495, "b": 416.30017, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 392.06049, "r": 310.00732, "b": 403.34918, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.938", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 392.06049, "r": 347.70734, "b": 403.34918, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.904", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 363.67599, "t": 392.06049, "r": 384.66632, "b": 403.34918, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.927", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.61801, "t": 391.99771, "r": 418.77798, "b": 403.40298, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.853", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 391.99771, "r": 458.38336, "b": 403.40298, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "1.97", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 405.01147, "r": 310.00732, "b": 429.65018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.952 0.923", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 405.01147, "r": 347.70734, "b": 416.30017, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.909", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 362.08801, "t": 404.9486999999999, "r": 386.24799, "b": 416.35397, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.938", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 396.20599, "t": 405.01147, "r": 417.19632, "b": 416.30017, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.843", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.767, "t": 405.01147, "r": 457.15039, "b": 416.30017, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "3.77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 161.90601, "t": 423.84048, "r": 166.51474, "b": 435.12918, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 423.84048, "r": 214.11774, "b": 435.12918, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 246.71000999999998, "t": 418.3614799999999, "r": 271.41064, "b": 429.65018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 418.3614799999999, "r": 347.70734, "b": 442.60117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.897 0.901", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 362.08801, "t": 418.3614799999999, "r": 386.24799, "b": 442.65497, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.915 0.931", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.61801, "t": 418.29871, "r": 418.77798, "b": 442.60117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.859 0.834", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 418.29871, "r": 458.38336, "b": 442.60117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "1.91 3.81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 431.31246999999996, "r": 272.94495, "b": 442.60117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 431.31246999999996, "r": 310.00732, "b": 442.60117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.945", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 161.90601, "t": 450.14248999999995, "r": 166.51474, "b": 461.43118, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 450.14248999999995, "r": 214.11774, "b": 461.43118, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 444.66248, "r": 272.94495, "b": 468.90317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 444.66248, "r": 310.00732, "b": 468.90317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.952 0.944", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 444.66248, "r": 347.70734, "b": 468.90317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.92 0.903", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 362.08801, "t": 444.5996999999999, "r": 386.24799, "b": 468.90317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.942 0.931", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.61801, "t": 444.5996999999999, "r": 418.77798, "b": 468.90317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.857 0.824", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 444.5996999999999, "r": 458.38336, "b": 468.90317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "1.22 2", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "section_header", "id": 6, "page_no": 0, "cluster": {"id": 6, "label": "section_header", "bbox": {"l": 134.765, "t": 505.67111, "r": 264.40829, "b": 518.17419, "coord_origin": "TOPLEFT"}, "confidence": 0.9589295387268066, "cells": [{"id": 91, "text": "5.2", "bbox": {"l": 134.765, "t": 505.67111, "r": 149.40306, "b": 518.17419, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Quantitative Results", "bbox": {"l": 160.85905, "t": 505.67111, "r": 264.40829, "b": 518.17419, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5.2 Quantitative Results"}, {"label": "text", "id": 3, "page_no": 0, "cluster": {"id": 3, "label": "text", "bbox": {"l": 134.765, "t": 522.08005, "r": 480.72003, "b": 618.3, "coord_origin": "TOPLEFT"}, "confidence": 0.9849976301193237, "cells": [{"id": 93, "text": "We picked the model parameter configuration that produced the best prediction", "bbox": {"l": 134.765, "t": 522.08005, "r": 479.72983, "b": 534.61301, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "quality (enc=6, dec=6, heads=8) with PubTabNet alone, then independently", "bbox": {"l": 134.765, "t": 534.03604, "r": 480.5897499999999, "b": 546.569, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "trained and evaluated it on three publicly available data sets: PubTabNet (395k", "bbox": {"l": 134.765, "t": 545.99104, "r": 480.72003, "b": 558.524, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "samples), FinTabNet (113k samples) and PubTables-1M (about 1M samples).", "bbox": {"l": 134.765, "t": 557.94604, "r": 480.60577, "b": 570.479, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "Performance results are presented in Table. 2. It is clearly evident that the model", "bbox": {"l": 134.765, "t": 569.90103, "r": 480.5936899999999, "b": 582.43399, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "trained on OTSL outperforms HTML across the board, keeping high TEDs and", "bbox": {"l": 134.765, "t": 581.85603, "r": 480.59158, "b": 594.38899, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "mAP scores even on difficult financial tables (FinTabNet) that contain sparse", "bbox": {"l": 134.765, "t": 593.81204, "r": 480.58080999999993, "b": 606.345, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "and large tables.", "bbox": {"l": 134.765, "t": 605.76704, "r": 206.79959, "b": 618.3, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "We picked the model parameter configuration that produced the best prediction quality (enc=6, dec=6, heads=8) with PubTabNet alone, then independently trained and evaluated it on three publicly available data sets: PubTabNet (395k samples), FinTabNet (113k samples) and PubTables-1M (about 1M samples). Performance results are presented in Table. 2. It is clearly evident that the model trained on OTSL outperforms HTML across the board, keeping high TEDs and mAP scores even on difficult financial tables (FinTabNet) that contain sparse and large tables."}, {"label": "text", "id": 2, "page_no": 0, "cluster": {"id": 2, "label": "text", "bbox": {"l": 134.765, "t": 617.72205, "r": 480.59857000000005, "b": 666.12, "coord_origin": "TOPLEFT"}, "confidence": 0.9850137829780579, "cells": [{"id": 101, "text": "Additionally, the results show that OTSL has an advantage over HTML", "bbox": {"l": 149.709, "t": 617.72205, "r": 480.59479, "b": 630.255, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "when applied on a bigger data set like PubTables-1M and achieves significantly", "bbox": {"l": 134.765, "t": 629.6770300000001, "r": 480.59857000000005, "b": 642.2099900000001, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "improved scores. Finally, OTSL achieves faster inference due to fewer decoding", "bbox": {"l": 134.765, "t": 641.63203, "r": 480.59384000000006, "b": 654.16499, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "steps which is a result of the reduced sequence representation.", "bbox": {"l": 134.765, "t": 653.58704, "r": 405.7995, "b": 666.12, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Additionally, the results show that OTSL has an advantage over HTML when applied on a bigger data set like PubTables-1M and achieves significantly improved scores. Finally, OTSL achieves faster inference due to fewer decoding steps which is a result of the reduced sequence representation."}], "body": [{"label": "text", "id": 4, "page_no": 0, "cluster": {"id": 4, "label": "text", "bbox": {"l": 134.765, "t": 116.46301000000005, "r": 480.59665, "b": 152.90697999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.9806435108184814, "cells": [{"id": 2, "text": "order to compute the TED score. Inference timing results for all experiments", "bbox": {"l": 134.765, "t": 116.46301000000005, "r": 480.59067, "b": 128.99597000000006, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "were obtained from the same machine on a single core with AMD EPYC 7763", "bbox": {"l": 134.765, "t": 128.41803000000004, "r": 480.59665, "b": 140.95099000000005, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "CPU @2.45 GHz.", "bbox": {"l": 134.765, "t": 140.37401999999997, "r": 210.78761, "b": 152.90697999999998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "order to compute the TED score. Inference timing results for all experiments were obtained from the same machine on a single core with AMD EPYC 7763 CPU @2.45 GHz."}, {"label": "section_header", "id": 7, "page_no": 0, "cluster": {"id": 7, "label": "section_header", "bbox": {"l": 134.765, "t": 166.70514000000003, "r": 318.45145, "b": 179.20818999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.957740306854248, "cells": [{"id": 5, "text": "5.1", "bbox": {"l": 134.765, "t": 166.70514000000003, "r": 149.40306, "b": 179.20818999999995, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Hyper Parameter Optimization", "bbox": {"l": 160.85905, "t": 166.70514000000003, "r": 318.45145, "b": 179.20818999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5.1 Hyper Parameter Optimization"}, {"label": "text", "id": 1, "page_no": 0, "cluster": {"id": 1, "label": "text", "bbox": {"l": 134.765, "t": 183.11505, "r": 480.59567, "b": 255.42400999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9850425124168396, "cells": [{"id": 7, "text": "We have chosen the PubTabNet data set to perform HPO, since it includes a", "bbox": {"l": 134.765, "t": 183.11505, "r": 479.74982000000006, "b": 195.64801, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "highly diverse set of tables. Also we report TED scores separately for simple and", "bbox": {"l": 134.765, "t": 195.07007, "r": 480.58765, "b": 207.60303, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "complex tables (tables with cell spans). Results are presented in Table. 1. It is", "bbox": {"l": 134.765, "t": 207.02502000000004, "r": 480.58859000000007, "b": 219.55798000000004, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "evident that with OTSL, our model achieves the same TED score and slightly", "bbox": {"l": 134.765, "t": 218.98004000000003, "r": 480.59567, "b": 231.51300000000003, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "better mAP scores in comparison to HTML. However OTSL yields a", "bbox": {"l": 134.765, "t": 230.93506000000002, "r": 440.9425, "b": 243.46802000000002, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "2x speed", "bbox": {"l": 444.86800999999997, "t": 230.98486000000003, "r": 480.58792, "b": 243.46802000000002, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "up", "bbox": {"l": 134.765, "t": 242.94086000000004, "r": 145.19585, "b": 255.42400999999995, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "in the inference runtime over HTML.", "bbox": {"l": 149.149, "t": 242.89104999999995, "r": 311.22256, "b": 255.42400999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "We have chosen the PubTabNet data set to perform HPO, since it includes a highly diverse set of tables. Also we report TED scores separately for simple and complex tables (tables with cell spans). Results are presented in Table. 1. It is evident that with OTSL, our model achieves the same TED score and slightly better mAP scores in comparison to HTML. However OTSL yields a 2x speed up in the inference runtime over HTML."}, {"label": "caption", "id": 5, "page_no": 0, "cluster": {"id": 5, "label": "caption", "bbox": {"l": 134.765, "t": 272.79474000000005, "r": 480.59890999999993, "b": 327.98218, "coord_origin": "TOPLEFT"}, "confidence": 0.9591906070709229, "cells": [{"id": 15, "text": "Table", "bbox": {"l": 134.765, "t": 272.79474000000005, "r": 159.22983, "b": 284.1999799999999, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "1.", "bbox": {"l": 167.34442, "t": 272.79474000000005, "r": 174.71301, "b": 284.1999799999999, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "HPO performed in OTSL and HTML representation on the same", "bbox": {"l": 188.133, "t": 272.85748, "r": 480.58101999999997, "b": 284.14618, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "transformer-based TableFormer [9] architecture, trained only on PubTabNet [22]. Ef-", "bbox": {"l": 134.765, "t": 283.81647, "r": 480.59890999999993, "b": 295.10516000000007, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "fects of reducing the # of layers in encoder and decoder stages of the model show that", "bbox": {"l": 134.765, "t": 294.77547999999996, "r": 480.59887999999995, "b": 306.06418, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "smaller models trained on OTSL perform better, especially in recognizing complex", "bbox": {"l": 134.765, "t": 305.73447, "r": 480.59180000000003, "b": 317.02316, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "table structures, and maintain a much higher mAP score than the HTML counterpart.", "bbox": {"l": 134.765, "t": 316.69348, "r": 480.58471999999995, "b": 327.98218, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 1. HPO performed in OTSL and HTML representation on the same transformer-based TableFormer [9] architecture, trained only on PubTabNet [22]. Effects of reducing the # of layers in encoder and decoder stages of the model show that smaller models trained on OTSL perform better, especially in recognizing complex table structures, and maintain a much higher mAP score than the HTML counterpart."}, {"label": "table", "id": 0, "page_no": 0, "cluster": {"id": 0, "label": "table", "bbox": {"l": 139.6674041748047, "t": 337.5453796386719, "r": 475.00927734375, "b": 469.4945373535156, "coord_origin": "TOPLEFT"}, "confidence": 0.9901031255722046, "cells": [{"id": 22, "text": "#", "bbox": {"l": 160.37, "t": 339.45749, "r": 168.04523, "b": 350.74619, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "enc-layers", "bbox": {"l": 144.592, "t": 352.40848, "r": 183.82895, "b": 363.69717, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "#", "bbox": {"l": 207.974, "t": 339.45749, "r": 215.64923000000002, "b": 350.74619, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "dec-layers", "bbox": {"l": 192.19501, "t": 352.40848, "r": 231.42303, "b": 363.69717, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "Language", "bbox": {"l": 239.79799999999997, "t": 344.93649, "r": 278.3338, "b": 356.22519000000005, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "TEDs", "bbox": {"l": 324.67001, "t": 339.45749, "r": 348.26419, "b": 350.74619, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "mAP", "bbox": {"l": 396.271, "t": 339.45749, "r": 417.12595, "b": 350.74619, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "(0.75)", "bbox": {"l": 394.927, "t": 350.41647, "r": 418.46921, "b": 361.70517, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Inference", "bbox": {"l": 430.771, "t": 339.45749, "r": 467.14142000000004, "b": 350.74619, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "time (secs)", "bbox": {"l": 427.14801, "t": 350.41647, "r": 470.76955999999996, "b": 361.70517, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "simple", "bbox": {"l": 286.686, "t": 352.40848, "r": 312.32812, "b": 363.69717, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "complex", "bbox": {"l": 320.702, "t": 352.40848, "r": 353.71539, "b": 363.69717, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "all", "bbox": {"l": 369.306, "t": 352.40848, "r": 379.02914, "b": 363.69717, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "6", "bbox": {"l": 161.90601, "t": 371.23849, "r": 166.51474, "b": 382.52719, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "6", "bbox": {"l": 209.509, "t": 371.23849, "r": 214.11774, "b": 382.52719, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 365.75848, "r": 271.41064, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "0.965", "bbox": {"l": 289.017, "t": 365.75848, "r": 310.00732, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "0.934", "bbox": {"l": 326.71701, "t": 365.75848, "r": 347.70734, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "0.955", "bbox": {"l": 363.67599, "t": 365.75848, "r": 384.66632, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "0.88", "bbox": {"l": 397.26999, "t": 365.69571, "r": 416.12634, "b": 377.10098000000005, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "2.73", "bbox": {"l": 439.52701, "t": 365.69571, "r": 458.38336, "b": 377.10098000000005, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 378.71048, "r": 272.94495, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "0.969", "bbox": {"l": 289.017, "t": 378.71048, "r": 310.00732, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "0.927", "bbox": {"l": 326.71701, "t": 378.71048, "r": 347.70734, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "0.955", "bbox": {"l": 363.67599, "t": 378.71048, "r": 384.66632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "0.857", "bbox": {"l": 396.20599, "t": 378.71048, "r": 417.19632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "5.39", "bbox": {"l": 440.767, "t": 378.71048, "r": 457.15039, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "4", "bbox": {"l": 161.90601, "t": 397.53949, "r": 166.51474, "b": 408.82819, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "4", "bbox": {"l": 209.509, "t": 397.53949, "r": 214.11774, "b": 408.82819, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 392.06049, "r": 271.41064, "b": 403.34918, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "0.938", "bbox": {"l": 289.017, "t": 392.06049, "r": 310.00732, "b": 403.34918, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "0.904", "bbox": {"l": 326.71701, "t": 392.06049, "r": 347.70734, "b": 403.34918, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "0.927", "bbox": {"l": 363.67599, "t": 392.06049, "r": 384.66632, "b": 403.34918, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "0.853", "bbox": {"l": 394.61801, "t": 391.99771, "r": 418.77798, "b": 403.40298, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "1.97", "bbox": {"l": 439.52701, "t": 391.99771, "r": 458.38336, "b": 403.40298, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 405.01147, "r": 272.94495, "b": 416.30017, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "0.952", "bbox": {"l": 289.017, "t": 405.01147, "r": 310.00732, "b": 416.30017, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "0.909", "bbox": {"l": 326.71701, "t": 405.01147, "r": 347.70734, "b": 416.30017, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "0.938", "bbox": {"l": 362.08801, "t": 404.9486999999999, "r": 386.24799, "b": 416.35397, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "0.843", "bbox": {"l": 396.20599, "t": 405.01147, "r": 417.19632, "b": 416.30017, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "3.77", "bbox": {"l": 440.767, "t": 405.01147, "r": 457.15039, "b": 416.30017, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "2", "bbox": {"l": 161.90601, "t": 423.84048, "r": 166.51474, "b": 435.12918, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "4", "bbox": {"l": 209.509, "t": 423.84048, "r": 214.11774, "b": 435.12918, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 418.3614799999999, "r": 271.41064, "b": 429.65018, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "0.923", "bbox": {"l": 289.017, "t": 418.3614799999999, "r": 310.00732, "b": 429.65018, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "0.897", "bbox": {"l": 326.71701, "t": 418.3614799999999, "r": 347.70734, "b": 429.65018, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "0.915", "bbox": {"l": 363.67599, "t": 418.3614799999999, "r": 384.66632, "b": 429.65018, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "0.859", "bbox": {"l": 394.61801, "t": 418.29871, "r": 418.77798, "b": 429.70398, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "1.91", "bbox": {"l": 439.52701, "t": 418.29871, "r": 458.38336, "b": 429.70398, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 431.31246999999996, "r": 272.94495, "b": 442.60117, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "0.945", "bbox": {"l": 289.017, "t": 431.31246999999996, "r": 310.00732, "b": 442.60117, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "0.901", "bbox": {"l": 326.71701, "t": 431.31246999999996, "r": 347.70734, "b": 442.60117, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "0.931", "bbox": {"l": 362.08801, "t": 431.24969, "r": 386.24799, "b": 442.65497, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "0.834", "bbox": {"l": 396.20599, "t": 431.31246999999996, "r": 417.19632, "b": 442.60117, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "3.81", "bbox": {"l": 440.767, "t": 431.31246999999996, "r": 457.15039, "b": 442.60117, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "4", "bbox": {"l": 161.90601, "t": 450.14248999999995, "r": 166.51474, "b": 461.43118, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "2", "bbox": {"l": 209.509, "t": 450.14248999999995, "r": 214.11774, "b": 461.43118, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 444.66248, "r": 271.41064, "b": 455.95117, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "0.952", "bbox": {"l": 289.017, "t": 444.66248, "r": 310.00732, "b": 455.95117, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "0.92", "bbox": {"l": 329.021, "t": 444.66248, "r": 345.40439, "b": 455.95117, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "0.942", "bbox": {"l": 362.08801, "t": 444.5996999999999, "r": 386.24799, "b": 456.00497, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "0.857", "bbox": {"l": 394.61801, "t": 444.5996999999999, "r": 418.77798, "b": 456.00497, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "1.22", "bbox": {"l": 439.52701, "t": 444.5996999999999, "r": 458.38336, "b": 456.00497, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 457.61447, "r": 272.94495, "b": 468.90317, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "0.944", "bbox": {"l": 289.017, "t": 457.61447, "r": 310.00732, "b": 468.90317, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "0.903", "bbox": {"l": 326.71701, "t": 457.61447, "r": 347.70734, "b": 468.90317, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "0.931", "bbox": {"l": 363.67599, "t": 457.61447, "r": 384.66632, "b": 468.90317, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "0.824", "bbox": {"l": 396.20599, "t": 457.61447, "r": 417.19632, "b": 468.90317, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "2", "bbox": {"l": 446.65302, "t": 457.61447, "r": 451.26175, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": [{"id": 10, "label": "text", "bbox": {"l": 160.37, "t": 339.45749, "r": 168.04523, "b": 350.74619, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "#", "bbox": {"l": 160.37, "t": 339.45749, "r": 168.04523, "b": 350.74619, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 144.592, "t": 352.40848, "r": 183.82895, "b": 363.69717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "enc-layers", "bbox": {"l": 144.592, "t": 352.40848, "r": 183.82895, "b": 363.69717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 207.974, "t": 339.45749, "r": 215.64923000000002, "b": 350.74619, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "#", "bbox": {"l": 207.974, "t": 339.45749, "r": 215.64923000000002, "b": 350.74619, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 192.19501, "t": 352.40848, "r": 231.42303, "b": 363.69717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "dec-layers", "bbox": {"l": 192.19501, "t": 352.40848, "r": 231.42303, "b": 363.69717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 239.79799999999997, "t": 344.93649, "r": 278.3338, "b": 356.22519000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "Language", "bbox": {"l": 239.79799999999997, "t": 344.93649, "r": 278.3338, "b": 356.22519000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 324.67001, "t": 339.45749, "r": 348.26419, "b": 350.74619, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "TEDs", "bbox": {"l": 324.67001, "t": 339.45749, "r": 348.26419, "b": 350.74619, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 396.271, "t": 339.45749, "r": 417.12595, "b": 350.74619, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "mAP", "bbox": {"l": 396.271, "t": 339.45749, "r": 417.12595, "b": 350.74619, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 394.927, "t": 350.41647, "r": 418.46921, "b": 361.70517, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "(0.75)", "bbox": {"l": 394.927, "t": 350.41647, "r": 418.46921, "b": 361.70517, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 430.771, "t": 339.45749, "r": 467.14142000000004, "b": 350.74619, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "Inference", "bbox": {"l": 430.771, "t": 339.45749, "r": 467.14142000000004, "b": 350.74619, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 427.14801, "t": 350.41647, "r": 470.76955999999996, "b": 361.70517, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "time (secs)", "bbox": {"l": 427.14801, "t": 350.41647, "r": 470.76955999999996, "b": 361.70517, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 286.686, "t": 352.40848, "r": 312.32812, "b": 363.69717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "simple", "bbox": {"l": 286.686, "t": 352.40848, "r": 312.32812, "b": 363.69717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 320.702, "t": 352.40848, "r": 353.71539, "b": 363.69717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "complex", "bbox": {"l": 320.702, "t": 352.40848, "r": 353.71539, "b": 363.69717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 369.306, "t": 352.40848, "r": 379.02914, "b": 363.69717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "all", "bbox": {"l": 369.306, "t": 352.40848, "r": 379.02914, "b": 363.69717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 161.90601, "t": 371.23849, "r": 166.51474, "b": 382.52719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "6", "bbox": {"l": 161.90601, "t": 371.23849, "r": 166.51474, "b": 382.52719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 209.509, "t": 371.23849, "r": 214.11774, "b": 382.52719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "6", "bbox": {"l": 209.509, "t": 371.23849, "r": 214.11774, "b": 382.52719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 246.71000999999998, "t": 365.75848, "r": 271.41064, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 365.75848, "r": 271.41064, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 289.017, "t": 365.75848, "r": 310.00732, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "0.965", "bbox": {"l": 289.017, "t": 365.75848, "r": 310.00732, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 326.71701, "t": 365.75848, "r": 347.70734, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "0.934", "bbox": {"l": 326.71701, "t": 365.75848, "r": 347.70734, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 363.67599, "t": 365.75848, "r": 384.66632, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "0.955", "bbox": {"l": 363.67599, "t": 365.75848, "r": 384.66632, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 397.26999, "t": 365.69571, "r": 416.12634, "b": 377.10098000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "0.88", "bbox": {"l": 397.26999, "t": 365.69571, "r": 416.12634, "b": 377.10098000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 439.52701, "t": 365.69571, "r": 458.38336, "b": 377.10098000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "2.73", "bbox": {"l": 439.52701, "t": 365.69571, "r": 458.38336, "b": 377.10098000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 245.17598999999998, "t": 378.71048, "r": 272.94495, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 378.71048, "r": 272.94495, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 289.017, "t": 378.71048, "r": 310.00732, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "0.969", "bbox": {"l": 289.017, "t": 378.71048, "r": 310.00732, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 326.71701, "t": 378.71048, "r": 347.70734, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "0.927", "bbox": {"l": 326.71701, "t": 378.71048, "r": 347.70734, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 363.67599, "t": 378.71048, "r": 384.66632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "0.955", "bbox": {"l": 363.67599, "t": 378.71048, "r": 384.66632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 396.20599, "t": 378.71048, "r": 417.19632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "0.857", "bbox": {"l": 396.20599, "t": 378.71048, "r": 417.19632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 440.767, "t": 378.71048, "r": 457.15039, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "5.39", "bbox": {"l": 440.767, "t": 378.71048, "r": 457.15039, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 161.90601, "t": 397.53949, "r": 166.51474, "b": 408.82819, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "4", "bbox": {"l": 161.90601, "t": 397.53949, "r": 166.51474, "b": 408.82819, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 209.509, "t": 397.53949, "r": 214.11774, "b": 408.82819, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "4", "bbox": {"l": 209.509, "t": 397.53949, "r": 214.11774, "b": 408.82819, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 246.71000999999998, "t": 392.06049, "r": 271.41064, "b": 403.34918, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 392.06049, "r": 271.41064, "b": 403.34918, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 289.017, "t": 392.06049, "r": 310.00732, "b": 403.34918, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "0.938", "bbox": {"l": 289.017, "t": 392.06049, "r": 310.00732, "b": 403.34918, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 326.71701, "t": 392.06049, "r": 347.70734, "b": 403.34918, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "0.904", "bbox": {"l": 326.71701, "t": 392.06049, "r": 347.70734, "b": 403.34918, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 363.67599, "t": 392.06049, "r": 384.66632, "b": 403.34918, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "0.927", "bbox": {"l": 363.67599, "t": 392.06049, "r": 384.66632, "b": 403.34918, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 394.61801, "t": 391.99771, "r": 418.77798, "b": 403.40298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "0.853", "bbox": {"l": 394.61801, "t": 391.99771, "r": 418.77798, "b": 403.40298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 439.52701, "t": 391.99771, "r": 458.38336, "b": 403.40298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "1.97", "bbox": {"l": 439.52701, "t": 391.99771, "r": 458.38336, "b": 403.40298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 245.17598999999998, "t": 405.01147, "r": 272.94495, "b": 416.30017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 405.01147, "r": 272.94495, "b": 416.30017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 289.017, "t": 405.01147, "r": 310.00732, "b": 416.30017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "0.952", "bbox": {"l": 289.017, "t": 405.01147, "r": 310.00732, "b": 416.30017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 326.71701, "t": 405.01147, "r": 347.70734, "b": 416.30017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "0.909", "bbox": {"l": 326.71701, "t": 405.01147, "r": 347.70734, "b": 416.30017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 362.08801, "t": 404.9486999999999, "r": 386.24799, "b": 416.35397, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "0.938", "bbox": {"l": 362.08801, "t": 404.9486999999999, "r": 386.24799, "b": 416.35397, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 396.20599, "t": 405.01147, "r": 417.19632, "b": 416.30017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "0.843", "bbox": {"l": 396.20599, "t": 405.01147, "r": 417.19632, "b": 416.30017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 440.767, "t": 405.01147, "r": 457.15039, "b": 416.30017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "3.77", "bbox": {"l": 440.767, "t": 405.01147, "r": 457.15039, "b": 416.30017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 161.90601, "t": 423.84048, "r": 166.51474, "b": 435.12918, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "2", "bbox": {"l": 161.90601, "t": 423.84048, "r": 166.51474, "b": 435.12918, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 209.509, "t": 423.84048, "r": 214.11774, "b": 435.12918, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "4", "bbox": {"l": 209.509, "t": 423.84048, "r": 214.11774, "b": 435.12918, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 246.71000999999998, "t": 418.3614799999999, "r": 271.41064, "b": 429.65018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 418.3614799999999, "r": 271.41064, "b": 429.65018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 289.017, "t": 418.3614799999999, "r": 310.00732, "b": 429.65018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "0.923", "bbox": {"l": 289.017, "t": 418.3614799999999, "r": 310.00732, "b": 429.65018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 326.71701, "t": 418.3614799999999, "r": 347.70734, "b": 429.65018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "0.897", "bbox": {"l": 326.71701, "t": 418.3614799999999, "r": 347.70734, "b": 429.65018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 363.67599, "t": 418.3614799999999, "r": 384.66632, "b": 429.65018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "0.915", "bbox": {"l": 363.67599, "t": 418.3614799999999, "r": 384.66632, "b": 429.65018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 394.61801, "t": 418.29871, "r": 418.77798, "b": 429.70398, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "0.859", "bbox": {"l": 394.61801, "t": 418.29871, "r": 418.77798, "b": 429.70398, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 439.52701, "t": 418.29871, "r": 458.38336, "b": 429.70398, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "1.91", "bbox": {"l": 439.52701, "t": 418.29871, "r": 458.38336, "b": 429.70398, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 245.17598999999998, "t": 431.31246999999996, "r": 272.94495, "b": 442.60117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 431.31246999999996, "r": 272.94495, "b": 442.60117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 289.017, "t": 431.31246999999996, "r": 310.00732, "b": 442.60117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "0.945", "bbox": {"l": 289.017, "t": 431.31246999999996, "r": 310.00732, "b": 442.60117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 326.71701, "t": 431.31246999999996, "r": 347.70734, "b": 442.60117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "0.901", "bbox": {"l": 326.71701, "t": 431.31246999999996, "r": 347.70734, "b": 442.60117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 362.08801, "t": 431.24969, "r": 386.24799, "b": 442.65497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "0.931", "bbox": {"l": 362.08801, "t": 431.24969, "r": 386.24799, "b": 442.65497, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 396.20599, "t": 431.31246999999996, "r": 417.19632, "b": 442.60117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "0.834", "bbox": {"l": 396.20599, "t": 431.31246999999996, "r": 417.19632, "b": 442.60117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 440.767, "t": 431.31246999999996, "r": 457.15039, "b": 442.60117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "3.81", "bbox": {"l": 440.767, "t": 431.31246999999996, "r": 457.15039, "b": 442.60117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 161.90601, "t": 450.14248999999995, "r": 166.51474, "b": 461.43118, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "4", "bbox": {"l": 161.90601, "t": 450.14248999999995, "r": 166.51474, "b": 461.43118, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 209.509, "t": 450.14248999999995, "r": 214.11774, "b": 461.43118, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "2", "bbox": {"l": 209.509, "t": 450.14248999999995, "r": 214.11774, "b": 461.43118, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 246.71000999999998, "t": 444.66248, "r": 271.41064, "b": 455.95117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 444.66248, "r": 271.41064, "b": 455.95117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 289.017, "t": 444.66248, "r": 310.00732, "b": 455.95117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "0.952", "bbox": {"l": 289.017, "t": 444.66248, "r": 310.00732, "b": 455.95117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 329.021, "t": 444.66248, "r": 345.40439, "b": 455.95117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "0.92", "bbox": {"l": 329.021, "t": 444.66248, "r": 345.40439, "b": 455.95117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 362.08801, "t": 444.5996999999999, "r": 386.24799, "b": 456.00497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "0.942", "bbox": {"l": 362.08801, "t": 444.5996999999999, "r": 386.24799, "b": 456.00497, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 394.61801, "t": 444.5996999999999, "r": 418.77798, "b": 456.00497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "0.857", "bbox": {"l": 394.61801, "t": 444.5996999999999, "r": 418.77798, "b": 456.00497, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 439.52701, "t": 444.5996999999999, "r": 458.38336, "b": 456.00497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "1.22", "bbox": {"l": 439.52701, "t": 444.5996999999999, "r": 458.38336, "b": 456.00497, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 245.17598999999998, "t": 457.61447, "r": 272.94495, "b": 468.90317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 457.61447, "r": 272.94495, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 289.017, "t": 457.61447, "r": 310.00732, "b": 468.90317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "0.944", "bbox": {"l": 289.017, "t": 457.61447, "r": 310.00732, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 326.71701, "t": 457.61447, "r": 347.70734, "b": 468.90317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "0.903", "bbox": {"l": 326.71701, "t": 457.61447, "r": 347.70734, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 363.67599, "t": 457.61447, "r": 384.66632, "b": 468.90317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "0.931", "bbox": {"l": 363.67599, "t": 457.61447, "r": 384.66632, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 396.20599, "t": 457.61447, "r": 417.19632, "b": 468.90317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "0.824", "bbox": {"l": 396.20599, "t": 457.61447, "r": 417.19632, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 446.65302, "t": 457.61447, "r": 451.26175, "b": 468.90317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "2", "bbox": {"l": 446.65302, "t": 457.61447, "r": 451.26175, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "lcel", "lcel", "ched", "ched", "nl", "ched", "ched", "ucel", "ched", "ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 7, "num_cols": 8, "table_cells": [{"bbox": {"l": 160.37, "t": 339.45749, "r": 168.04523, "b": 350.74619, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "#", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 144.592, "t": 352.40848, "r": 183.82895, "b": 363.69717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "enc-layers", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 207.974, "t": 339.45749, "r": 215.64923000000002, "b": 350.74619, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "#", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 192.19501, "t": 352.40848, "r": 231.42303, "b": 363.69717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "dec-layers", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 239.79799999999997, "t": 344.93649, "r": 278.3338, "b": 356.22519000000005, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Language", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 324.67001, "t": 339.45749, "r": 348.26419, "b": 350.74619, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 3, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 6, "text": "TEDs", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 396.271, "t": 339.45749, "r": 417.12595, "b": 350.74619, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "mAP", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 394.927, "t": 350.41647, "r": 418.46921, "b": 361.70517, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "(0.75)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 430.771, "t": 339.45749, "r": 467.14142000000004, "b": 350.74619, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "Inference", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 427.14801, "t": 350.41647, "r": 470.76955999999996, "b": 361.70517, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "time (secs)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 286.686, "t": 352.40848, "r": 312.32812, "b": 363.69717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "simple", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 320.702, "t": 352.40848, "r": 353.71539, "b": 363.69717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "complex", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 369.306, "t": 352.40848, "r": 379.02914, "b": 363.69717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "all", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 161.90601, "t": 371.23849, "r": 166.51474, "b": 382.52719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 371.23849, "r": 214.11774, "b": 382.52719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 365.75848, "r": 272.94495, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 365.75848, "r": 310.00732, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.965 0.969", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 365.75848, "r": 347.70734, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.934 0.927", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 363.67599, "t": 365.75848, "r": 384.66632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.955 0.955", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 396.20599, "t": 365.69571, "r": 417.19632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.88 0.857", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 365.69571, "r": 458.38336, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "2.73 5.39", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 161.90601, "t": 397.53949, "r": 166.51474, "b": 408.82819, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 397.53949, "r": 214.11774, "b": 408.82819, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 392.06049, "r": 272.94495, "b": 416.30017, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 392.06049, "r": 310.00732, "b": 403.34918, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.938", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 392.06049, "r": 347.70734, "b": 403.34918, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.904", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 363.67599, "t": 392.06049, "r": 384.66632, "b": 403.34918, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.927", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.61801, "t": 391.99771, "r": 418.77798, "b": 403.40298, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.853", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 391.99771, "r": 458.38336, "b": 403.40298, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "1.97", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 405.01147, "r": 310.00732, "b": 429.65018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.952 0.923", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 405.01147, "r": 347.70734, "b": 416.30017, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.909", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 362.08801, "t": 404.9486999999999, "r": 386.24799, "b": 416.35397, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.938", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 396.20599, "t": 405.01147, "r": 417.19632, "b": 416.30017, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.843", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.767, "t": 405.01147, "r": 457.15039, "b": 416.30017, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "3.77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 161.90601, "t": 423.84048, "r": 166.51474, "b": 435.12918, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 423.84048, "r": 214.11774, "b": 435.12918, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 246.71000999999998, "t": 418.3614799999999, "r": 271.41064, "b": 429.65018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 418.3614799999999, "r": 347.70734, "b": 442.60117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.897 0.901", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 362.08801, "t": 418.3614799999999, "r": 386.24799, "b": 442.65497, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.915 0.931", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.61801, "t": 418.29871, "r": 418.77798, "b": 442.60117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.859 0.834", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 418.29871, "r": 458.38336, "b": 442.60117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "1.91 3.81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 431.31246999999996, "r": 272.94495, "b": 442.60117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 431.31246999999996, "r": 310.00732, "b": 442.60117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.945", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 161.90601, "t": 450.14248999999995, "r": 166.51474, "b": 461.43118, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 450.14248999999995, "r": 214.11774, "b": 461.43118, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 444.66248, "r": 272.94495, "b": 468.90317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 444.66248, "r": 310.00732, "b": 468.90317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.952 0.944", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 444.66248, "r": 347.70734, "b": 468.90317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.92 0.903", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 362.08801, "t": 444.5996999999999, "r": 386.24799, "b": 468.90317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.942 0.931", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.61801, "t": 444.5996999999999, "r": 418.77798, "b": 468.90317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.857 0.824", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 444.5996999999999, "r": 458.38336, "b": 468.90317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "1.22 2", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "section_header", "id": 6, "page_no": 0, "cluster": {"id": 6, "label": "section_header", "bbox": {"l": 134.765, "t": 505.67111, "r": 264.40829, "b": 518.17419, "coord_origin": "TOPLEFT"}, "confidence": 0.9589295387268066, "cells": [{"id": 91, "text": "5.2", "bbox": {"l": 134.765, "t": 505.67111, "r": 149.40306, "b": 518.17419, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Quantitative Results", "bbox": {"l": 160.85905, "t": 505.67111, "r": 264.40829, "b": 518.17419, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5.2 Quantitative Results"}, {"label": "text", "id": 3, "page_no": 0, "cluster": {"id": 3, "label": "text", "bbox": {"l": 134.765, "t": 522.08005, "r": 480.72003, "b": 618.3, "coord_origin": "TOPLEFT"}, "confidence": 0.9849976301193237, "cells": [{"id": 93, "text": "We picked the model parameter configuration that produced the best prediction", "bbox": {"l": 134.765, "t": 522.08005, "r": 479.72983, "b": 534.61301, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "quality (enc=6, dec=6, heads=8) with PubTabNet alone, then independently", "bbox": {"l": 134.765, "t": 534.03604, "r": 480.5897499999999, "b": 546.569, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "trained and evaluated it on three publicly available data sets: PubTabNet (395k", "bbox": {"l": 134.765, "t": 545.99104, "r": 480.72003, "b": 558.524, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "samples), FinTabNet (113k samples) and PubTables-1M (about 1M samples).", "bbox": {"l": 134.765, "t": 557.94604, "r": 480.60577, "b": 570.479, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "Performance results are presented in Table. 2. It is clearly evident that the model", "bbox": {"l": 134.765, "t": 569.90103, "r": 480.5936899999999, "b": 582.43399, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "trained on OTSL outperforms HTML across the board, keeping high TEDs and", "bbox": {"l": 134.765, "t": 581.85603, "r": 480.59158, "b": 594.38899, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "mAP scores even on difficult financial tables (FinTabNet) that contain sparse", "bbox": {"l": 134.765, "t": 593.81204, "r": 480.58080999999993, "b": 606.345, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "and large tables.", "bbox": {"l": 134.765, "t": 605.76704, "r": 206.79959, "b": 618.3, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "We picked the model parameter configuration that produced the best prediction quality (enc=6, dec=6, heads=8) with PubTabNet alone, then independently trained and evaluated it on three publicly available data sets: PubTabNet (395k samples), FinTabNet (113k samples) and PubTables-1M (about 1M samples). Performance results are presented in Table. 2. It is clearly evident that the model trained on OTSL outperforms HTML across the board, keeping high TEDs and mAP scores even on difficult financial tables (FinTabNet) that contain sparse and large tables."}, {"label": "text", "id": 2, "page_no": 0, "cluster": {"id": 2, "label": "text", "bbox": {"l": 134.765, "t": 617.72205, "r": 480.59857000000005, "b": 666.12, "coord_origin": "TOPLEFT"}, "confidence": 0.9850137829780579, "cells": [{"id": 101, "text": "Additionally, the results show that OTSL has an advantage over HTML", "bbox": {"l": 149.709, "t": 617.72205, "r": 480.59479, "b": 630.255, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "when applied on a bigger data set like PubTables-1M and achieves significantly", "bbox": {"l": 134.765, "t": 629.6770300000001, "r": 480.59857000000005, "b": 642.2099900000001, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "improved scores. Finally, OTSL achieves faster inference due to fewer decoding", "bbox": {"l": 134.765, "t": 641.63203, "r": 480.59384000000006, "b": 654.16499, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "steps which is a result of the reduced sequence representation.", "bbox": {"l": 134.765, "t": 653.58704, "r": 405.7995, "b": 666.12, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Additionally, the results show that OTSL has an advantage over HTML when applied on a bigger data set like PubTables-1M and achieves significantly improved scores. Finally, OTSL achieves faster inference due to fewer decoding steps which is a result of the reduced sequence representation."}], "headers": [{"label": "page_header", "id": 8, "page_no": 0, "cluster": {"id": 8, "label": "page_header", "bbox": {"l": 194.478, "t": 91.49352999999996, "r": 447.54476999999997, "b": 102.78223000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9373531937599182, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 91.49352999999996, "r": 447.54476999999997, "b": 102.78223000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Optimized Table Tokenization for Table Structure Recognition"}, {"label": "page_header", "id": 9, "page_no": 0, "cluster": {"id": 9, "label": "page_header", "bbox": {"l": 475.98441, "t": 91.49352999999996, "r": 480.59314, "b": 102.78223000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.8858679533004761, "cells": [{"id": 1, "text": "9", "bbox": {"l": 475.98441, "t": 91.49352999999996, "r": 480.59314, "b": 102.78223000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "9"}]}}]
\ No newline at end of file
+[{"page_no": 0, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 91.49352999999996, "r": 447.54476999999997, "b": 102.78223000000003, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "9", "bbox": {"l": 475.98441, "t": 91.49352999999996, "r": 480.59314, "b": 102.78223000000003, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "order to compute the TED score. Inference timing results for all experiments", "bbox": {"l": 134.765, "t": 116.46301000000005, "r": 480.59067, "b": 128.99597000000006, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "were obtained from the same machine on a single core with AMD EPYC 7763", "bbox": {"l": 134.765, "t": 128.41803000000004, "r": 480.59665, "b": 140.95099000000005, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "CPU @2.45 GHz.", "bbox": {"l": 134.765, "t": 140.37401999999997, "r": 210.78761, "b": 152.90697999999998, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "5.1", "bbox": {"l": 134.765, "t": 166.70514000000003, "r": 149.40306, "b": 179.20818999999995, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Hyper Parameter Optimization", "bbox": {"l": 160.85905, "t": 166.70514000000003, "r": 318.45145, "b": 179.20818999999995, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "We have chosen the PubTabNet data set to perform HPO, since it includes a", "bbox": {"l": 134.765, "t": 183.11505, "r": 479.74982000000006, "b": 195.64801, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "highly diverse set of tables. Also we report TED scores separately for simple and", "bbox": {"l": 134.765, "t": 195.07007, "r": 480.58765, "b": 207.60303, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "complex tables (tables with cell spans). Results are presented in Table. 1. It is", "bbox": {"l": 134.765, "t": 207.02502000000004, "r": 480.58859000000007, "b": 219.55798000000004, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "evident that with OTSL, our model achieves the same TED score and slightly", "bbox": {"l": 134.765, "t": 218.98004000000003, "r": 480.59567, "b": 231.51300000000003, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "better mAP scores in comparison to HTML. However OTSL yields a", "bbox": {"l": 134.765, "t": 230.93506000000002, "r": 440.9425, "b": 243.46802000000002, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "2x speed", "bbox": {"l": 444.86800999999997, "t": 230.98486000000003, "r": 480.58792, "b": 243.46802000000002, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "up", "bbox": {"l": 134.765, "t": 242.94086000000004, "r": 145.19585, "b": 255.42400999999995, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "in the inference runtime over HTML.", "bbox": {"l": 149.149, "t": 242.89104999999995, "r": 311.22256, "b": 255.42400999999995, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Table", "bbox": {"l": 134.765, "t": 272.79474000000005, "r": 159.22983, "b": 284.1999799999999, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "1.", "bbox": {"l": 167.34442, "t": 272.79474000000005, "r": 174.71301, "b": 284.1999799999999, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "HPO performed in OTSL and HTML representation on the same", "bbox": {"l": 188.133, "t": 272.85748, "r": 480.58101999999997, "b": 284.14618, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "transformer-based TableFormer [9] architecture, trained only on PubTabNet [22]. Ef-", "bbox": {"l": 134.765, "t": 283.81647, "r": 480.59890999999993, "b": 295.10516000000007, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "fects of reducing the # of layers in encoder and decoder stages of the model show that", "bbox": {"l": 134.765, "t": 294.77547999999996, "r": 480.59887999999995, "b": 306.06418, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "smaller models trained on OTSL perform better, especially in recognizing complex", "bbox": {"l": 134.765, "t": 305.73447, "r": 480.59180000000003, "b": 317.02316, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "table structures, and maintain a much higher mAP score than the HTML counterpart.", "bbox": {"l": 134.765, "t": 316.69348, "r": 480.58471999999995, "b": 327.98218, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "#", "bbox": {"l": 160.37, "t": 339.45749, "r": 168.04523, "b": 350.74619, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "enc-layers", "bbox": {"l": 144.592, "t": 352.40848, "r": 183.82895, "b": 363.69717, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "#", "bbox": {"l": 207.974, "t": 339.45749, "r": 215.64923000000002, "b": 350.74619, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "dec-layers", "bbox": {"l": 192.19501, "t": 352.40848, "r": 231.42303, "b": 363.69717, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "Language", "bbox": {"l": 239.79799999999997, "t": 344.93649, "r": 278.3338, "b": 356.22519000000005, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "TEDs", "bbox": {"l": 324.67001, "t": 339.45749, "r": 348.26419, "b": 350.74619, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "mAP", "bbox": {"l": 396.271, "t": 339.45749, "r": 417.12595, "b": 350.74619, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "(0.75)", "bbox": {"l": 394.927, "t": 350.41647, "r": 418.46921, "b": 361.70517, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Inference", "bbox": {"l": 430.771, "t": 339.45749, "r": 467.14142000000004, "b": 350.74619, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "time (secs)", "bbox": {"l": 427.14801, "t": 350.41647, "r": 470.76955999999996, "b": 361.70517, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "simple", "bbox": {"l": 286.686, "t": 352.40848, "r": 312.32812, "b": 363.69717, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "complex", "bbox": {"l": 320.702, "t": 352.40848, "r": 353.71539, "b": 363.69717, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "all", "bbox": {"l": 369.306, "t": 352.40848, "r": 379.02914, "b": 363.69717, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "6", "bbox": {"l": 161.90601, "t": 371.23849, "r": 166.51474, "b": 382.52719, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "6", "bbox": {"l": 209.509, "t": 371.23849, "r": 214.11774, "b": 382.52719, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 365.75848, "r": 271.41064, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "0.965", "bbox": {"l": 289.017, "t": 365.75848, "r": 310.00732, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "0.934", "bbox": {"l": 326.71701, "t": 365.75848, "r": 347.70734, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "0.955", "bbox": {"l": 363.67599, "t": 365.75848, "r": 384.66632, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "0.88", "bbox": {"l": 397.26999, "t": 365.69571, "r": 416.12634, "b": 377.10098000000005, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "2.73", "bbox": {"l": 439.52701, "t": 365.69571, "r": 458.38336, "b": 377.10098000000005, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 378.71048, "r": 272.94495, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "0.969", "bbox": {"l": 289.017, "t": 378.71048, "r": 310.00732, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "0.927", "bbox": {"l": 326.71701, "t": 378.71048, "r": 347.70734, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "0.955", "bbox": {"l": 363.67599, "t": 378.71048, "r": 384.66632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "0.857", "bbox": {"l": 396.20599, "t": 378.71048, "r": 417.19632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "5.39", "bbox": {"l": 440.767, "t": 378.71048, "r": 457.15039, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "4", "bbox": {"l": 161.90601, "t": 397.53949, "r": 166.51474, "b": 408.82819, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "4", "bbox": {"l": 209.509, "t": 397.53949, "r": 214.11774, "b": 408.82819, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 392.06049, "r": 271.41064, "b": 403.34918, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "0.938", "bbox": {"l": 289.017, "t": 392.06049, "r": 310.00732, "b": 403.34918, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "0.904", "bbox": {"l": 326.71701, "t": 392.06049, "r": 347.70734, "b": 403.34918, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "0.927", "bbox": {"l": 363.67599, "t": 392.06049, "r": 384.66632, "b": 403.34918, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "0.853", "bbox": {"l": 394.61801, "t": 391.99771, "r": 418.77798, "b": 403.40298, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "1.97", "bbox": {"l": 439.52701, "t": 391.99771, "r": 458.38336, "b": 403.40298, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 405.01147, "r": 272.94495, "b": 416.30017, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "0.952", "bbox": {"l": 289.017, "t": 405.01147, "r": 310.00732, "b": 416.30017, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "0.909", "bbox": {"l": 326.71701, "t": 405.01147, "r": 347.70734, "b": 416.30017, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "0.938", "bbox": {"l": 362.08801, "t": 404.9486999999999, "r": 386.24799, "b": 416.35397, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "0.843", "bbox": {"l": 396.20599, "t": 405.01147, "r": 417.19632, "b": 416.30017, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "3.77", "bbox": {"l": 440.767, "t": 405.01147, "r": 457.15039, "b": 416.30017, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "2", "bbox": {"l": 161.90601, "t": 423.84048, "r": 166.51474, "b": 435.12918, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "4", "bbox": {"l": 209.509, "t": 423.84048, "r": 214.11774, "b": 435.12918, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 418.3614799999999, "r": 271.41064, "b": 429.65018, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "0.923", "bbox": {"l": 289.017, "t": 418.3614799999999, "r": 310.00732, "b": 429.65018, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "0.897", "bbox": {"l": 326.71701, "t": 418.3614799999999, "r": 347.70734, "b": 429.65018, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "0.915", "bbox": {"l": 363.67599, "t": 418.3614799999999, "r": 384.66632, "b": 429.65018, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "0.859", "bbox": {"l": 394.61801, "t": 418.29871, "r": 418.77798, "b": 429.70398, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "1.91", "bbox": {"l": 439.52701, "t": 418.29871, "r": 458.38336, "b": 429.70398, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 431.31246999999996, "r": 272.94495, "b": 442.60117, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "0.945", "bbox": {"l": 289.017, "t": 431.31246999999996, "r": 310.00732, "b": 442.60117, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "0.901", "bbox": {"l": 326.71701, "t": 431.31246999999996, "r": 347.70734, "b": 442.60117, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "0.931", "bbox": {"l": 362.08801, "t": 431.24969, "r": 386.24799, "b": 442.65497, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "0.834", "bbox": {"l": 396.20599, "t": 431.31246999999996, "r": 417.19632, "b": 442.60117, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "3.81", "bbox": {"l": 440.767, "t": 431.31246999999996, "r": 457.15039, "b": 442.60117, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "4", "bbox": {"l": 161.90601, "t": 450.14248999999995, "r": 166.51474, "b": 461.43118, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "2", "bbox": {"l": 209.509, "t": 450.14248999999995, "r": 214.11774, "b": 461.43118, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 444.66248, "r": 271.41064, "b": 455.95117, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "0.952", "bbox": {"l": 289.017, "t": 444.66248, "r": 310.00732, "b": 455.95117, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "0.92", "bbox": {"l": 329.021, "t": 444.66248, "r": 345.40439, "b": 455.95117, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "0.942", "bbox": {"l": 362.08801, "t": 444.5996999999999, "r": 386.24799, "b": 456.00497, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "0.857", "bbox": {"l": 394.61801, "t": 444.5996999999999, "r": 418.77798, "b": 456.00497, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "1.22", "bbox": {"l": 439.52701, "t": 444.5996999999999, "r": 458.38336, "b": 456.00497, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 457.61447, "r": 272.94495, "b": 468.90317, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "0.944", "bbox": {"l": 289.017, "t": 457.61447, "r": 310.00732, "b": 468.90317, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "0.903", "bbox": {"l": 326.71701, "t": 457.61447, "r": 347.70734, "b": 468.90317, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "0.931", "bbox": {"l": 363.67599, "t": 457.61447, "r": 384.66632, "b": 468.90317, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "0.824", "bbox": {"l": 396.20599, "t": 457.61447, "r": 417.19632, "b": 468.90317, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "2", "bbox": {"l": 446.65302, "t": 457.61447, "r": 451.26175, "b": 468.90317, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "5.2", "bbox": {"l": 134.765, "t": 505.67111, "r": 149.40306, "b": 518.17419, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Quantitative Results", "bbox": {"l": 160.85905, "t": 505.67111, "r": 264.40829, "b": 518.17419, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "We picked the model parameter configuration that produced the best prediction", "bbox": {"l": 134.765, "t": 522.08005, "r": 479.72983, "b": 534.61301, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "quality (enc=6, dec=6, heads=8) with PubTabNet alone, then independently", "bbox": {"l": 134.765, "t": 534.03604, "r": 480.5897499999999, "b": 546.569, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "trained and evaluated it on three publicly available data sets: PubTabNet (395k", "bbox": {"l": 134.765, "t": 545.99104, "r": 480.72003, "b": 558.524, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "samples), FinTabNet (113k samples) and PubTables-1M (about 1M samples).", "bbox": {"l": 134.765, "t": 557.94604, "r": 480.60577, "b": 570.479, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "Performance results are presented in Table. 2. It is clearly evident that the model", "bbox": {"l": 134.765, "t": 569.90103, "r": 480.5936899999999, "b": 582.43399, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "trained on OTSL outperforms HTML across the board, keeping high TEDs and", "bbox": {"l": 134.765, "t": 581.85603, "r": 480.59158, "b": 594.38899, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "mAP scores even on difficult financial tables (FinTabNet) that contain sparse", "bbox": {"l": 134.765, "t": 593.81204, "r": 480.58080999999993, "b": 606.345, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "and large tables.", "bbox": {"l": 134.765, "t": 605.76704, "r": 206.79959, "b": 618.3, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "Additionally, the results show that OTSL has an advantage over HTML", "bbox": {"l": 149.709, "t": 617.72205, "r": 480.59479, "b": 630.255, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "when applied on a bigger data set like PubTables-1M and achieves significantly", "bbox": {"l": 134.765, "t": 629.6770300000001, "r": 480.59857000000005, "b": 642.2099900000001, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "improved scores. Finally, OTSL achieves faster inference due to fewer decoding", "bbox": {"l": 134.765, "t": 641.63203, "r": 480.59384000000006, "b": 654.16499, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "steps which is a result of the reduced sequence representation.", "bbox": {"l": 134.765, "t": 653.58704, "r": 405.7995, "b": 666.12, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 8, "label": "page_header", "bbox": {"l": 194.478, "t": 91.49352999999996, "r": 447.54476999999997, "b": 102.78223000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9373534917831421, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 91.49352999999996, "r": 447.54476999999997, "b": 102.78223000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "page_header", "bbox": {"l": 475.98441, "t": 91.49352999999996, "r": 480.59314, "b": 102.78223000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.8858680725097656, "cells": [{"id": 1, "text": "9", "bbox": {"l": 475.98441, "t": 91.49352999999996, "r": 480.59314, "b": 102.78223000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "text", "bbox": {"l": 134.765, "t": 116.46301000000005, "r": 480.59665, "b": 152.90697999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.9806433916091919, "cells": [{"id": 2, "text": "order to compute the TED score. Inference timing results for all experiments", "bbox": {"l": 134.765, "t": 116.46301000000005, "r": 480.59067, "b": 128.99597000000006, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "were obtained from the same machine on a single core with AMD EPYC 7763", "bbox": {"l": 134.765, "t": 128.41803000000004, "r": 480.59665, "b": 140.95099000000005, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "CPU @2.45 GHz.", "bbox": {"l": 134.765, "t": 140.37401999999997, "r": 210.78761, "b": 152.90697999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "section_header", "bbox": {"l": 134.765, "t": 166.70514000000003, "r": 318.45145, "b": 179.20818999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9577404260635376, "cells": [{"id": 5, "text": "5.1", "bbox": {"l": 134.765, "t": 166.70514000000003, "r": 149.40306, "b": 179.20818999999995, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Hyper Parameter Optimization", "bbox": {"l": 160.85905, "t": 166.70514000000003, "r": 318.45145, "b": 179.20818999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 134.765, "t": 183.11505, "r": 480.59567, "b": 255.42400999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.98504239320755, "cells": [{"id": 7, "text": "We have chosen the PubTabNet data set to perform HPO, since it includes a", "bbox": {"l": 134.765, "t": 183.11505, "r": 479.74982000000006, "b": 195.64801, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "highly diverse set of tables. Also we report TED scores separately for simple and", "bbox": {"l": 134.765, "t": 195.07007, "r": 480.58765, "b": 207.60303, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "complex tables (tables with cell spans). Results are presented in Table. 1. It is", "bbox": {"l": 134.765, "t": 207.02502000000004, "r": 480.58859000000007, "b": 219.55798000000004, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "evident that with OTSL, our model achieves the same TED score and slightly", "bbox": {"l": 134.765, "t": 218.98004000000003, "r": 480.59567, "b": 231.51300000000003, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "better mAP scores in comparison to HTML. However OTSL yields a", "bbox": {"l": 134.765, "t": 230.93506000000002, "r": 440.9425, "b": 243.46802000000002, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "2x speed", "bbox": {"l": 444.86800999999997, "t": 230.98486000000003, "r": 480.58792, "b": 243.46802000000002, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "up", "bbox": {"l": 134.765, "t": 242.94086000000004, "r": 145.19585, "b": 255.42400999999995, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "in the inference runtime over HTML.", "bbox": {"l": 149.149, "t": 242.89104999999995, "r": 311.22256, "b": 255.42400999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "caption", "bbox": {"l": 134.765, "t": 272.79474000000005, "r": 480.59890999999993, "b": 327.98218, "coord_origin": "TOPLEFT"}, "confidence": 0.9591909050941467, "cells": [{"id": 15, "text": "Table", "bbox": {"l": 134.765, "t": 272.79474000000005, "r": 159.22983, "b": 284.1999799999999, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "1.", "bbox": {"l": 167.34442, "t": 272.79474000000005, "r": 174.71301, "b": 284.1999799999999, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "HPO performed in OTSL and HTML representation on the same", "bbox": {"l": 188.133, "t": 272.85748, "r": 480.58101999999997, "b": 284.14618, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "transformer-based TableFormer [9] architecture, trained only on PubTabNet [22]. Ef-", "bbox": {"l": 134.765, "t": 283.81647, "r": 480.59890999999993, "b": 295.10516000000007, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "fects of reducing the # of layers in encoder and decoder stages of the model show that", "bbox": {"l": 134.765, "t": 294.77547999999996, "r": 480.59887999999995, "b": 306.06418, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "smaller models trained on OTSL perform better, especially in recognizing complex", "bbox": {"l": 134.765, "t": 305.73447, "r": 480.59180000000003, "b": 317.02316, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "table structures, and maintain a much higher mAP score than the HTML counterpart.", "bbox": {"l": 134.765, "t": 316.69348, "r": 480.58471999999995, "b": 327.98218, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "table", "bbox": {"l": 139.66741943359375, "t": 337.54541015625, "r": 475.00927734375, "b": 469.4945373535156, "coord_origin": "TOPLEFT"}, "confidence": 0.9901031255722046, "cells": [{"id": 22, "text": "#", "bbox": {"l": 160.37, "t": 339.45749, "r": 168.04523, "b": 350.74619, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "enc-layers", "bbox": {"l": 144.592, "t": 352.40848, "r": 183.82895, "b": 363.69717, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "#", "bbox": {"l": 207.974, "t": 339.45749, "r": 215.64923000000002, "b": 350.74619, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "dec-layers", "bbox": {"l": 192.19501, "t": 352.40848, "r": 231.42303, "b": 363.69717, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "Language", "bbox": {"l": 239.79799999999997, "t": 344.93649, "r": 278.3338, "b": 356.22519000000005, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "TEDs", "bbox": {"l": 324.67001, "t": 339.45749, "r": 348.26419, "b": 350.74619, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "mAP", "bbox": {"l": 396.271, "t": 339.45749, "r": 417.12595, "b": 350.74619, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "(0.75)", "bbox": {"l": 394.927, "t": 350.41647, "r": 418.46921, "b": 361.70517, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Inference", "bbox": {"l": 430.771, "t": 339.45749, "r": 467.14142000000004, "b": 350.74619, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "time (secs)", "bbox": {"l": 427.14801, "t": 350.41647, "r": 470.76955999999996, "b": 361.70517, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "simple", "bbox": {"l": 286.686, "t": 352.40848, "r": 312.32812, "b": 363.69717, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "complex", "bbox": {"l": 320.702, "t": 352.40848, "r": 353.71539, "b": 363.69717, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "all", "bbox": {"l": 369.306, "t": 352.40848, "r": 379.02914, "b": 363.69717, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "6", "bbox": {"l": 161.90601, "t": 371.23849, "r": 166.51474, "b": 382.52719, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "6", "bbox": {"l": 209.509, "t": 371.23849, "r": 214.11774, "b": 382.52719, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 365.75848, "r": 271.41064, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "0.965", "bbox": {"l": 289.017, "t": 365.75848, "r": 310.00732, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "0.934", "bbox": {"l": 326.71701, "t": 365.75848, "r": 347.70734, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "0.955", "bbox": {"l": 363.67599, "t": 365.75848, "r": 384.66632, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "0.88", "bbox": {"l": 397.26999, "t": 365.69571, "r": 416.12634, "b": 377.10098000000005, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "2.73", "bbox": {"l": 439.52701, "t": 365.69571, "r": 458.38336, "b": 377.10098000000005, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 378.71048, "r": 272.94495, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "0.969", "bbox": {"l": 289.017, "t": 378.71048, "r": 310.00732, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "0.927", "bbox": {"l": 326.71701, "t": 378.71048, "r": 347.70734, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "0.955", "bbox": {"l": 363.67599, "t": 378.71048, "r": 384.66632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "0.857", "bbox": {"l": 396.20599, "t": 378.71048, "r": 417.19632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "5.39", "bbox": {"l": 440.767, "t": 378.71048, "r": 457.15039, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "4", "bbox": {"l": 161.90601, "t": 397.53949, "r": 166.51474, "b": 408.82819, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "4", "bbox": {"l": 209.509, "t": 397.53949, "r": 214.11774, "b": 408.82819, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 392.06049, "r": 271.41064, "b": 403.34918, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "0.938", "bbox": {"l": 289.017, "t": 392.06049, "r": 310.00732, "b": 403.34918, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "0.904", "bbox": {"l": 326.71701, "t": 392.06049, "r": 347.70734, "b": 403.34918, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "0.927", "bbox": {"l": 363.67599, "t": 392.06049, "r": 384.66632, "b": 403.34918, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "0.853", "bbox": {"l": 394.61801, "t": 391.99771, "r": 418.77798, "b": 403.40298, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "1.97", "bbox": {"l": 439.52701, "t": 391.99771, "r": 458.38336, "b": 403.40298, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 405.01147, "r": 272.94495, "b": 416.30017, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "0.952", "bbox": {"l": 289.017, "t": 405.01147, "r": 310.00732, "b": 416.30017, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "0.909", "bbox": {"l": 326.71701, "t": 405.01147, "r": 347.70734, "b": 416.30017, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "0.938", "bbox": {"l": 362.08801, "t": 404.9486999999999, "r": 386.24799, "b": 416.35397, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "0.843", "bbox": {"l": 396.20599, "t": 405.01147, "r": 417.19632, "b": 416.30017, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "3.77", "bbox": {"l": 440.767, "t": 405.01147, "r": 457.15039, "b": 416.30017, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "2", "bbox": {"l": 161.90601, "t": 423.84048, "r": 166.51474, "b": 435.12918, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "4", "bbox": {"l": 209.509, "t": 423.84048, "r": 214.11774, "b": 435.12918, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 418.3614799999999, "r": 271.41064, "b": 429.65018, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "0.923", "bbox": {"l": 289.017, "t": 418.3614799999999, "r": 310.00732, "b": 429.65018, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "0.897", "bbox": {"l": 326.71701, "t": 418.3614799999999, "r": 347.70734, "b": 429.65018, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "0.915", "bbox": {"l": 363.67599, "t": 418.3614799999999, "r": 384.66632, "b": 429.65018, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "0.859", "bbox": {"l": 394.61801, "t": 418.29871, "r": 418.77798, "b": 429.70398, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "1.91", "bbox": {"l": 439.52701, "t": 418.29871, "r": 458.38336, "b": 429.70398, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 431.31246999999996, "r": 272.94495, "b": 442.60117, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "0.945", "bbox": {"l": 289.017, "t": 431.31246999999996, "r": 310.00732, "b": 442.60117, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "0.901", "bbox": {"l": 326.71701, "t": 431.31246999999996, "r": 347.70734, "b": 442.60117, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "0.931", "bbox": {"l": 362.08801, "t": 431.24969, "r": 386.24799, "b": 442.65497, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "0.834", "bbox": {"l": 396.20599, "t": 431.31246999999996, "r": 417.19632, "b": 442.60117, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "3.81", "bbox": {"l": 440.767, "t": 431.31246999999996, "r": 457.15039, "b": 442.60117, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "4", "bbox": {"l": 161.90601, "t": 450.14248999999995, "r": 166.51474, "b": 461.43118, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "2", "bbox": {"l": 209.509, "t": 450.14248999999995, "r": 214.11774, "b": 461.43118, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 444.66248, "r": 271.41064, "b": 455.95117, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "0.952", "bbox": {"l": 289.017, "t": 444.66248, "r": 310.00732, "b": 455.95117, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "0.92", "bbox": {"l": 329.021, "t": 444.66248, "r": 345.40439, "b": 455.95117, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "0.942", "bbox": {"l": 362.08801, "t": 444.5996999999999, "r": 386.24799, "b": 456.00497, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "0.857", "bbox": {"l": 394.61801, "t": 444.5996999999999, "r": 418.77798, "b": 456.00497, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "1.22", "bbox": {"l": 439.52701, "t": 444.5996999999999, "r": 458.38336, "b": 456.00497, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 457.61447, "r": 272.94495, "b": 468.90317, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "0.944", "bbox": {"l": 289.017, "t": 457.61447, "r": 310.00732, "b": 468.90317, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "0.903", "bbox": {"l": 326.71701, "t": 457.61447, "r": 347.70734, "b": 468.90317, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "0.931", "bbox": {"l": 363.67599, "t": 457.61447, "r": 384.66632, "b": 468.90317, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "0.824", "bbox": {"l": 396.20599, "t": 457.61447, "r": 417.19632, "b": 468.90317, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "2", "bbox": {"l": 446.65302, "t": 457.61447, "r": 451.26175, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": [{"id": 10, "label": "text", "bbox": {"l": 160.37, "t": 339.45749, "r": 168.04523, "b": 350.74619, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "#", "bbox": {"l": 160.37, "t": 339.45749, "r": 168.04523, "b": 350.74619, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 144.592, "t": 352.40848, "r": 183.82895, "b": 363.69717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "enc-layers", "bbox": {"l": 144.592, "t": 352.40848, "r": 183.82895, "b": 363.69717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 207.974, "t": 339.45749, "r": 215.64923000000002, "b": 350.74619, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "#", "bbox": {"l": 207.974, "t": 339.45749, "r": 215.64923000000002, "b": 350.74619, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 192.19501, "t": 352.40848, "r": 231.42303, "b": 363.69717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "dec-layers", "bbox": {"l": 192.19501, "t": 352.40848, "r": 231.42303, "b": 363.69717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 239.79799999999997, "t": 344.93649, "r": 278.3338, "b": 356.22519000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "Language", "bbox": {"l": 239.79799999999997, "t": 344.93649, "r": 278.3338, "b": 356.22519000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 324.67001, "t": 339.45749, "r": 348.26419, "b": 350.74619, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "TEDs", "bbox": {"l": 324.67001, "t": 339.45749, "r": 348.26419, "b": 350.74619, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 396.271, "t": 339.45749, "r": 417.12595, "b": 350.74619, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "mAP", "bbox": {"l": 396.271, "t": 339.45749, "r": 417.12595, "b": 350.74619, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 394.927, "t": 350.41647, "r": 418.46921, "b": 361.70517, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "(0.75)", "bbox": {"l": 394.927, "t": 350.41647, "r": 418.46921, "b": 361.70517, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 430.771, "t": 339.45749, "r": 467.14142000000004, "b": 350.74619, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "Inference", "bbox": {"l": 430.771, "t": 339.45749, "r": 467.14142000000004, "b": 350.74619, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 427.14801, "t": 350.41647, "r": 470.76955999999996, "b": 361.70517, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "time (secs)", "bbox": {"l": 427.14801, "t": 350.41647, "r": 470.76955999999996, "b": 361.70517, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 286.686, "t": 352.40848, "r": 312.32812, "b": 363.69717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "simple", "bbox": {"l": 286.686, "t": 352.40848, "r": 312.32812, "b": 363.69717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 320.702, "t": 352.40848, "r": 353.71539, "b": 363.69717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "complex", "bbox": {"l": 320.702, "t": 352.40848, "r": 353.71539, "b": 363.69717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 369.306, "t": 352.40848, "r": 379.02914, "b": 363.69717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "all", "bbox": {"l": 369.306, "t": 352.40848, "r": 379.02914, "b": 363.69717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 161.90601, "t": 371.23849, "r": 166.51474, "b": 382.52719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "6", "bbox": {"l": 161.90601, "t": 371.23849, "r": 166.51474, "b": 382.52719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 209.509, "t": 371.23849, "r": 214.11774, "b": 382.52719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "6", "bbox": {"l": 209.509, "t": 371.23849, "r": 214.11774, "b": 382.52719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 246.71000999999998, "t": 365.75848, "r": 271.41064, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 365.75848, "r": 271.41064, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 289.017, "t": 365.75848, "r": 310.00732, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "0.965", "bbox": {"l": 289.017, "t": 365.75848, "r": 310.00732, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 326.71701, "t": 365.75848, "r": 347.70734, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "0.934", "bbox": {"l": 326.71701, "t": 365.75848, "r": 347.70734, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 363.67599, "t": 365.75848, "r": 384.66632, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "0.955", "bbox": {"l": 363.67599, "t": 365.75848, "r": 384.66632, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 397.26999, "t": 365.69571, "r": 416.12634, "b": 377.10098000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "0.88", "bbox": {"l": 397.26999, "t": 365.69571, "r": 416.12634, "b": 377.10098000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 439.52701, "t": 365.69571, "r": 458.38336, "b": 377.10098000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "2.73", "bbox": {"l": 439.52701, "t": 365.69571, "r": 458.38336, "b": 377.10098000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 245.17598999999998, "t": 378.71048, "r": 272.94495, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 378.71048, "r": 272.94495, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 289.017, "t": 378.71048, "r": 310.00732, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "0.969", "bbox": {"l": 289.017, "t": 378.71048, "r": 310.00732, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 326.71701, "t": 378.71048, "r": 347.70734, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "0.927", "bbox": {"l": 326.71701, "t": 378.71048, "r": 347.70734, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 363.67599, "t": 378.71048, "r": 384.66632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "0.955", "bbox": {"l": 363.67599, "t": 378.71048, "r": 384.66632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 396.20599, "t": 378.71048, "r": 417.19632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "0.857", "bbox": {"l": 396.20599, "t": 378.71048, "r": 417.19632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 440.767, "t": 378.71048, "r": 457.15039, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "5.39", "bbox": {"l": 440.767, "t": 378.71048, "r": 457.15039, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 161.90601, "t": 397.53949, "r": 166.51474, "b": 408.82819, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "4", "bbox": {"l": 161.90601, "t": 397.53949, "r": 166.51474, "b": 408.82819, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 209.509, "t": 397.53949, "r": 214.11774, "b": 408.82819, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "4", "bbox": {"l": 209.509, "t": 397.53949, "r": 214.11774, "b": 408.82819, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 246.71000999999998, "t": 392.06049, "r": 271.41064, "b": 403.34918, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 392.06049, "r": 271.41064, "b": 403.34918, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 289.017, "t": 392.06049, "r": 310.00732, "b": 403.34918, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "0.938", "bbox": {"l": 289.017, "t": 392.06049, "r": 310.00732, "b": 403.34918, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 326.71701, "t": 392.06049, "r": 347.70734, "b": 403.34918, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "0.904", "bbox": {"l": 326.71701, "t": 392.06049, "r": 347.70734, "b": 403.34918, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 363.67599, "t": 392.06049, "r": 384.66632, "b": 403.34918, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "0.927", "bbox": {"l": 363.67599, "t": 392.06049, "r": 384.66632, "b": 403.34918, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 394.61801, "t": 391.99771, "r": 418.77798, "b": 403.40298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "0.853", "bbox": {"l": 394.61801, "t": 391.99771, "r": 418.77798, "b": 403.40298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 439.52701, "t": 391.99771, "r": 458.38336, "b": 403.40298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "1.97", "bbox": {"l": 439.52701, "t": 391.99771, "r": 458.38336, "b": 403.40298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 245.17598999999998, "t": 405.01147, "r": 272.94495, "b": 416.30017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 405.01147, "r": 272.94495, "b": 416.30017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 289.017, "t": 405.01147, "r": 310.00732, "b": 416.30017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "0.952", "bbox": {"l": 289.017, "t": 405.01147, "r": 310.00732, "b": 416.30017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 326.71701, "t": 405.01147, "r": 347.70734, "b": 416.30017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "0.909", "bbox": {"l": 326.71701, "t": 405.01147, "r": 347.70734, "b": 416.30017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 362.08801, "t": 404.9486999999999, "r": 386.24799, "b": 416.35397, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "0.938", "bbox": {"l": 362.08801, "t": 404.9486999999999, "r": 386.24799, "b": 416.35397, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 396.20599, "t": 405.01147, "r": 417.19632, "b": 416.30017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "0.843", "bbox": {"l": 396.20599, "t": 405.01147, "r": 417.19632, "b": 416.30017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 440.767, "t": 405.01147, "r": 457.15039, "b": 416.30017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "3.77", "bbox": {"l": 440.767, "t": 405.01147, "r": 457.15039, "b": 416.30017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 161.90601, "t": 423.84048, "r": 166.51474, "b": 435.12918, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "2", "bbox": {"l": 161.90601, "t": 423.84048, "r": 166.51474, "b": 435.12918, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 209.509, "t": 423.84048, "r": 214.11774, "b": 435.12918, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "4", "bbox": {"l": 209.509, "t": 423.84048, "r": 214.11774, "b": 435.12918, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 246.71000999999998, "t": 418.3614799999999, "r": 271.41064, "b": 429.65018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 418.3614799999999, "r": 271.41064, "b": 429.65018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 289.017, "t": 418.3614799999999, "r": 310.00732, "b": 429.65018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "0.923", "bbox": {"l": 289.017, "t": 418.3614799999999, "r": 310.00732, "b": 429.65018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 326.71701, "t": 418.3614799999999, "r": 347.70734, "b": 429.65018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "0.897", "bbox": {"l": 326.71701, "t": 418.3614799999999, "r": 347.70734, "b": 429.65018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 363.67599, "t": 418.3614799999999, "r": 384.66632, "b": 429.65018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "0.915", "bbox": {"l": 363.67599, "t": 418.3614799999999, "r": 384.66632, "b": 429.65018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 394.61801, "t": 418.29871, "r": 418.77798, "b": 429.70398, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "0.859", "bbox": {"l": 394.61801, "t": 418.29871, "r": 418.77798, "b": 429.70398, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 439.52701, "t": 418.29871, "r": 458.38336, "b": 429.70398, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "1.91", "bbox": {"l": 439.52701, "t": 418.29871, "r": 458.38336, "b": 429.70398, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 245.17598999999998, "t": 431.31246999999996, "r": 272.94495, "b": 442.60117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 431.31246999999996, "r": 272.94495, "b": 442.60117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 289.017, "t": 431.31246999999996, "r": 310.00732, "b": 442.60117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "0.945", "bbox": {"l": 289.017, "t": 431.31246999999996, "r": 310.00732, "b": 442.60117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 326.71701, "t": 431.31246999999996, "r": 347.70734, "b": 442.60117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "0.901", "bbox": {"l": 326.71701, "t": 431.31246999999996, "r": 347.70734, "b": 442.60117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 362.08801, "t": 431.24969, "r": 386.24799, "b": 442.65497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "0.931", "bbox": {"l": 362.08801, "t": 431.24969, "r": 386.24799, "b": 442.65497, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 396.20599, "t": 431.31246999999996, "r": 417.19632, "b": 442.60117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "0.834", "bbox": {"l": 396.20599, "t": 431.31246999999996, "r": 417.19632, "b": 442.60117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 440.767, "t": 431.31246999999996, "r": 457.15039, "b": 442.60117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "3.81", "bbox": {"l": 440.767, "t": 431.31246999999996, "r": 457.15039, "b": 442.60117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 161.90601, "t": 450.14248999999995, "r": 166.51474, "b": 461.43118, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "4", "bbox": {"l": 161.90601, "t": 450.14248999999995, "r": 166.51474, "b": 461.43118, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 209.509, "t": 450.14248999999995, "r": 214.11774, "b": 461.43118, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "2", "bbox": {"l": 209.509, "t": 450.14248999999995, "r": 214.11774, "b": 461.43118, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 246.71000999999998, "t": 444.66248, "r": 271.41064, "b": 455.95117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 444.66248, "r": 271.41064, "b": 455.95117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 289.017, "t": 444.66248, "r": 310.00732, "b": 455.95117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "0.952", "bbox": {"l": 289.017, "t": 444.66248, "r": 310.00732, "b": 455.95117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 329.021, "t": 444.66248, "r": 345.40439, "b": 455.95117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "0.92", "bbox": {"l": 329.021, "t": 444.66248, "r": 345.40439, "b": 455.95117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 362.08801, "t": 444.5996999999999, "r": 386.24799, "b": 456.00497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "0.942", "bbox": {"l": 362.08801, "t": 444.5996999999999, "r": 386.24799, "b": 456.00497, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 394.61801, "t": 444.5996999999999, "r": 418.77798, "b": 456.00497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "0.857", "bbox": {"l": 394.61801, "t": 444.5996999999999, "r": 418.77798, "b": 456.00497, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 439.52701, "t": 444.5996999999999, "r": 458.38336, "b": 456.00497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "1.22", "bbox": {"l": 439.52701, "t": 444.5996999999999, "r": 458.38336, "b": 456.00497, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 245.17598999999998, "t": 457.61447, "r": 272.94495, "b": 468.90317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 457.61447, "r": 272.94495, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 289.017, "t": 457.61447, "r": 310.00732, "b": 468.90317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "0.944", "bbox": {"l": 289.017, "t": 457.61447, "r": 310.00732, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 326.71701, "t": 457.61447, "r": 347.70734, "b": 468.90317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "0.903", "bbox": {"l": 326.71701, "t": 457.61447, "r": 347.70734, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 363.67599, "t": 457.61447, "r": 384.66632, "b": 468.90317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "0.931", "bbox": {"l": 363.67599, "t": 457.61447, "r": 384.66632, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 396.20599, "t": 457.61447, "r": 417.19632, "b": 468.90317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "0.824", "bbox": {"l": 396.20599, "t": 457.61447, "r": 417.19632, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 446.65302, "t": 457.61447, "r": 451.26175, "b": 468.90317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "2", "bbox": {"l": 446.65302, "t": 457.61447, "r": 451.26175, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 6, "label": "section_header", "bbox": {"l": 134.765, "t": 505.67111, "r": 264.40829, "b": 518.17419, "coord_origin": "TOPLEFT"}, "confidence": 0.9589294195175171, "cells": [{"id": 91, "text": "5.2", "bbox": {"l": 134.765, "t": 505.67111, "r": 149.40306, "b": 518.17419, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Quantitative Results", "bbox": {"l": 160.85905, "t": 505.67111, "r": 264.40829, "b": 518.17419, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 134.765, "t": 522.08005, "r": 480.72003, "b": 618.3, "coord_origin": "TOPLEFT"}, "confidence": 0.9849975109100342, "cells": [{"id": 93, "text": "We picked the model parameter configuration that produced the best prediction", "bbox": {"l": 134.765, "t": 522.08005, "r": 479.72983, "b": 534.61301, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "quality (enc=6, dec=6, heads=8) with PubTabNet alone, then independently", "bbox": {"l": 134.765, "t": 534.03604, "r": 480.5897499999999, "b": 546.569, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "trained and evaluated it on three publicly available data sets: PubTabNet (395k", "bbox": {"l": 134.765, "t": 545.99104, "r": 480.72003, "b": 558.524, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "samples), FinTabNet (113k samples) and PubTables-1M (about 1M samples).", "bbox": {"l": 134.765, "t": 557.94604, "r": 480.60577, "b": 570.479, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "Performance results are presented in Table. 2. It is clearly evident that the model", "bbox": {"l": 134.765, "t": 569.90103, "r": 480.5936899999999, "b": 582.43399, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "trained on OTSL outperforms HTML across the board, keeping high TEDs and", "bbox": {"l": 134.765, "t": 581.85603, "r": 480.59158, "b": 594.38899, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "mAP scores even on difficult financial tables (FinTabNet) that contain sparse", "bbox": {"l": 134.765, "t": 593.81204, "r": 480.58080999999993, "b": 606.345, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "and large tables.", "bbox": {"l": 134.765, "t": 605.76704, "r": 206.79959, "b": 618.3, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 134.765, "t": 617.72205, "r": 480.59857000000005, "b": 666.12, "coord_origin": "TOPLEFT"}, "confidence": 0.9850137829780579, "cells": [{"id": 101, "text": "Additionally, the results show that OTSL has an advantage over HTML", "bbox": {"l": 149.709, "t": 617.72205, "r": 480.59479, "b": 630.255, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "when applied on a bigger data set like PubTables-1M and achieves significantly", "bbox": {"l": 134.765, "t": 629.6770300000001, "r": 480.59857000000005, "b": 642.2099900000001, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "improved scores. Finally, OTSL achieves faster inference due to fewer decoding", "bbox": {"l": 134.765, "t": 641.63203, "r": 480.59384000000006, "b": 654.16499, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "steps which is a result of the reduced sequence representation.", "bbox": {"l": 134.765, "t": 653.58704, "r": 405.7995, "b": 666.12, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {"0": {"label": "table", "id": 0, "page_no": 0, "cluster": {"id": 0, "label": "table", "bbox": {"l": 139.66741943359375, "t": 337.54541015625, "r": 475.00927734375, "b": 469.4945373535156, "coord_origin": "TOPLEFT"}, "confidence": 0.9901031255722046, "cells": [{"id": 22, "text": "#", "bbox": {"l": 160.37, "t": 339.45749, "r": 168.04523, "b": 350.74619, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "enc-layers", "bbox": {"l": 144.592, "t": 352.40848, "r": 183.82895, "b": 363.69717, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "#", "bbox": {"l": 207.974, "t": 339.45749, "r": 215.64923000000002, "b": 350.74619, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "dec-layers", "bbox": {"l": 192.19501, "t": 352.40848, "r": 231.42303, "b": 363.69717, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "Language", "bbox": {"l": 239.79799999999997, "t": 344.93649, "r": 278.3338, "b": 356.22519000000005, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "TEDs", "bbox": {"l": 324.67001, "t": 339.45749, "r": 348.26419, "b": 350.74619, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "mAP", "bbox": {"l": 396.271, "t": 339.45749, "r": 417.12595, "b": 350.74619, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "(0.75)", "bbox": {"l": 394.927, "t": 350.41647, "r": 418.46921, "b": 361.70517, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Inference", "bbox": {"l": 430.771, "t": 339.45749, "r": 467.14142000000004, "b": 350.74619, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "time (secs)", "bbox": {"l": 427.14801, "t": 350.41647, "r": 470.76955999999996, "b": 361.70517, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "simple", "bbox": {"l": 286.686, "t": 352.40848, "r": 312.32812, "b": 363.69717, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "complex", "bbox": {"l": 320.702, "t": 352.40848, "r": 353.71539, "b": 363.69717, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "all", "bbox": {"l": 369.306, "t": 352.40848, "r": 379.02914, "b": 363.69717, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "6", "bbox": {"l": 161.90601, "t": 371.23849, "r": 166.51474, "b": 382.52719, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "6", "bbox": {"l": 209.509, "t": 371.23849, "r": 214.11774, "b": 382.52719, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 365.75848, "r": 271.41064, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "0.965", "bbox": {"l": 289.017, "t": 365.75848, "r": 310.00732, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "0.934", "bbox": {"l": 326.71701, "t": 365.75848, "r": 347.70734, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "0.955", "bbox": {"l": 363.67599, "t": 365.75848, "r": 384.66632, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "0.88", "bbox": {"l": 397.26999, "t": 365.69571, "r": 416.12634, "b": 377.10098000000005, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "2.73", "bbox": {"l": 439.52701, "t": 365.69571, "r": 458.38336, "b": 377.10098000000005, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 378.71048, "r": 272.94495, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "0.969", "bbox": {"l": 289.017, "t": 378.71048, "r": 310.00732, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "0.927", "bbox": {"l": 326.71701, "t": 378.71048, "r": 347.70734, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "0.955", "bbox": {"l": 363.67599, "t": 378.71048, "r": 384.66632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "0.857", "bbox": {"l": 396.20599, "t": 378.71048, "r": 417.19632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "5.39", "bbox": {"l": 440.767, "t": 378.71048, "r": 457.15039, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "4", "bbox": {"l": 161.90601, "t": 397.53949, "r": 166.51474, "b": 408.82819, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "4", "bbox": {"l": 209.509, "t": 397.53949, "r": 214.11774, "b": 408.82819, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 392.06049, "r": 271.41064, "b": 403.34918, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "0.938", "bbox": {"l": 289.017, "t": 392.06049, "r": 310.00732, "b": 403.34918, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "0.904", "bbox": {"l": 326.71701, "t": 392.06049, "r": 347.70734, "b": 403.34918, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "0.927", "bbox": {"l": 363.67599, "t": 392.06049, "r": 384.66632, "b": 403.34918, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "0.853", "bbox": {"l": 394.61801, "t": 391.99771, "r": 418.77798, "b": 403.40298, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "1.97", "bbox": {"l": 439.52701, "t": 391.99771, "r": 458.38336, "b": 403.40298, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 405.01147, "r": 272.94495, "b": 416.30017, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "0.952", "bbox": {"l": 289.017, "t": 405.01147, "r": 310.00732, "b": 416.30017, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "0.909", "bbox": {"l": 326.71701, "t": 405.01147, "r": 347.70734, "b": 416.30017, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "0.938", "bbox": {"l": 362.08801, "t": 404.9486999999999, "r": 386.24799, "b": 416.35397, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "0.843", "bbox": {"l": 396.20599, "t": 405.01147, "r": 417.19632, "b": 416.30017, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "3.77", "bbox": {"l": 440.767, "t": 405.01147, "r": 457.15039, "b": 416.30017, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "2", "bbox": {"l": 161.90601, "t": 423.84048, "r": 166.51474, "b": 435.12918, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "4", "bbox": {"l": 209.509, "t": 423.84048, "r": 214.11774, "b": 435.12918, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 418.3614799999999, "r": 271.41064, "b": 429.65018, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "0.923", "bbox": {"l": 289.017, "t": 418.3614799999999, "r": 310.00732, "b": 429.65018, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "0.897", "bbox": {"l": 326.71701, "t": 418.3614799999999, "r": 347.70734, "b": 429.65018, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "0.915", "bbox": {"l": 363.67599, "t": 418.3614799999999, "r": 384.66632, "b": 429.65018, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "0.859", "bbox": {"l": 394.61801, "t": 418.29871, "r": 418.77798, "b": 429.70398, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "1.91", "bbox": {"l": 439.52701, "t": 418.29871, "r": 458.38336, "b": 429.70398, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 431.31246999999996, "r": 272.94495, "b": 442.60117, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "0.945", "bbox": {"l": 289.017, "t": 431.31246999999996, "r": 310.00732, "b": 442.60117, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "0.901", "bbox": {"l": 326.71701, "t": 431.31246999999996, "r": 347.70734, "b": 442.60117, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "0.931", "bbox": {"l": 362.08801, "t": 431.24969, "r": 386.24799, "b": 442.65497, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "0.834", "bbox": {"l": 396.20599, "t": 431.31246999999996, "r": 417.19632, "b": 442.60117, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "3.81", "bbox": {"l": 440.767, "t": 431.31246999999996, "r": 457.15039, "b": 442.60117, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "4", "bbox": {"l": 161.90601, "t": 450.14248999999995, "r": 166.51474, "b": 461.43118, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "2", "bbox": {"l": 209.509, "t": 450.14248999999995, "r": 214.11774, "b": 461.43118, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 444.66248, "r": 271.41064, "b": 455.95117, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "0.952", "bbox": {"l": 289.017, "t": 444.66248, "r": 310.00732, "b": 455.95117, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "0.92", "bbox": {"l": 329.021, "t": 444.66248, "r": 345.40439, "b": 455.95117, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "0.942", "bbox": {"l": 362.08801, "t": 444.5996999999999, "r": 386.24799, "b": 456.00497, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "0.857", "bbox": {"l": 394.61801, "t": 444.5996999999999, "r": 418.77798, "b": 456.00497, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "1.22", "bbox": {"l": 439.52701, "t": 444.5996999999999, "r": 458.38336, "b": 456.00497, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 457.61447, "r": 272.94495, "b": 468.90317, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "0.944", "bbox": {"l": 289.017, "t": 457.61447, "r": 310.00732, "b": 468.90317, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "0.903", "bbox": {"l": 326.71701, "t": 457.61447, "r": 347.70734, "b": 468.90317, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "0.931", "bbox": {"l": 363.67599, "t": 457.61447, "r": 384.66632, "b": 468.90317, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "0.824", "bbox": {"l": 396.20599, "t": 457.61447, "r": 417.19632, "b": 468.90317, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "2", "bbox": {"l": 446.65302, "t": 457.61447, "r": 451.26175, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": [{"id": 10, "label": "text", "bbox": {"l": 160.37, "t": 339.45749, "r": 168.04523, "b": 350.74619, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "#", "bbox": {"l": 160.37, "t": 339.45749, "r": 168.04523, "b": 350.74619, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 144.592, "t": 352.40848, "r": 183.82895, "b": 363.69717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "enc-layers", "bbox": {"l": 144.592, "t": 352.40848, "r": 183.82895, "b": 363.69717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 207.974, "t": 339.45749, "r": 215.64923000000002, "b": 350.74619, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "#", "bbox": {"l": 207.974, "t": 339.45749, "r": 215.64923000000002, "b": 350.74619, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 192.19501, "t": 352.40848, "r": 231.42303, "b": 363.69717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "dec-layers", "bbox": {"l": 192.19501, "t": 352.40848, "r": 231.42303, "b": 363.69717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 239.79799999999997, "t": 344.93649, "r": 278.3338, "b": 356.22519000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "Language", "bbox": {"l": 239.79799999999997, "t": 344.93649, "r": 278.3338, "b": 356.22519000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 324.67001, "t": 339.45749, "r": 348.26419, "b": 350.74619, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "TEDs", "bbox": {"l": 324.67001, "t": 339.45749, "r": 348.26419, "b": 350.74619, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 396.271, "t": 339.45749, "r": 417.12595, "b": 350.74619, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "mAP", "bbox": {"l": 396.271, "t": 339.45749, "r": 417.12595, "b": 350.74619, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 394.927, "t": 350.41647, "r": 418.46921, "b": 361.70517, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "(0.75)", "bbox": {"l": 394.927, "t": 350.41647, "r": 418.46921, "b": 361.70517, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 430.771, "t": 339.45749, "r": 467.14142000000004, "b": 350.74619, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "Inference", "bbox": {"l": 430.771, "t": 339.45749, "r": 467.14142000000004, "b": 350.74619, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 427.14801, "t": 350.41647, "r": 470.76955999999996, "b": 361.70517, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "time (secs)", "bbox": {"l": 427.14801, "t": 350.41647, "r": 470.76955999999996, "b": 361.70517, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 286.686, "t": 352.40848, "r": 312.32812, "b": 363.69717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "simple", "bbox": {"l": 286.686, "t": 352.40848, "r": 312.32812, "b": 363.69717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 320.702, "t": 352.40848, "r": 353.71539, "b": 363.69717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "complex", "bbox": {"l": 320.702, "t": 352.40848, "r": 353.71539, "b": 363.69717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 369.306, "t": 352.40848, "r": 379.02914, "b": 363.69717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "all", "bbox": {"l": 369.306, "t": 352.40848, "r": 379.02914, "b": 363.69717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 161.90601, "t": 371.23849, "r": 166.51474, "b": 382.52719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "6", "bbox": {"l": 161.90601, "t": 371.23849, "r": 166.51474, "b": 382.52719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 209.509, "t": 371.23849, "r": 214.11774, "b": 382.52719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "6", "bbox": {"l": 209.509, "t": 371.23849, "r": 214.11774, "b": 382.52719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 246.71000999999998, "t": 365.75848, "r": 271.41064, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 365.75848, "r": 271.41064, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 289.017, "t": 365.75848, "r": 310.00732, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "0.965", "bbox": {"l": 289.017, "t": 365.75848, "r": 310.00732, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 326.71701, "t": 365.75848, "r": 347.70734, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "0.934", "bbox": {"l": 326.71701, "t": 365.75848, "r": 347.70734, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 363.67599, "t": 365.75848, "r": 384.66632, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "0.955", "bbox": {"l": 363.67599, "t": 365.75848, "r": 384.66632, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 397.26999, "t": 365.69571, "r": 416.12634, "b": 377.10098000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "0.88", "bbox": {"l": 397.26999, "t": 365.69571, "r": 416.12634, "b": 377.10098000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 439.52701, "t": 365.69571, "r": 458.38336, "b": 377.10098000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "2.73", "bbox": {"l": 439.52701, "t": 365.69571, "r": 458.38336, "b": 377.10098000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 245.17598999999998, "t": 378.71048, "r": 272.94495, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 378.71048, "r": 272.94495, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 289.017, "t": 378.71048, "r": 310.00732, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "0.969", "bbox": {"l": 289.017, "t": 378.71048, "r": 310.00732, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 326.71701, "t": 378.71048, "r": 347.70734, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "0.927", "bbox": {"l": 326.71701, "t": 378.71048, "r": 347.70734, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 363.67599, "t": 378.71048, "r": 384.66632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "0.955", "bbox": {"l": 363.67599, "t": 378.71048, "r": 384.66632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 396.20599, "t": 378.71048, "r": 417.19632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "0.857", "bbox": {"l": 396.20599, "t": 378.71048, "r": 417.19632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 440.767, "t": 378.71048, "r": 457.15039, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "5.39", "bbox": {"l": 440.767, "t": 378.71048, "r": 457.15039, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 161.90601, "t": 397.53949, "r": 166.51474, "b": 408.82819, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "4", "bbox": {"l": 161.90601, "t": 397.53949, "r": 166.51474, "b": 408.82819, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 209.509, "t": 397.53949, "r": 214.11774, "b": 408.82819, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "4", "bbox": {"l": 209.509, "t": 397.53949, "r": 214.11774, "b": 408.82819, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 246.71000999999998, "t": 392.06049, "r": 271.41064, "b": 403.34918, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 392.06049, "r": 271.41064, "b": 403.34918, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 289.017, "t": 392.06049, "r": 310.00732, "b": 403.34918, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "0.938", "bbox": {"l": 289.017, "t": 392.06049, "r": 310.00732, "b": 403.34918, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 326.71701, "t": 392.06049, "r": 347.70734, "b": 403.34918, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "0.904", "bbox": {"l": 326.71701, "t": 392.06049, "r": 347.70734, "b": 403.34918, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 363.67599, "t": 392.06049, "r": 384.66632, "b": 403.34918, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "0.927", "bbox": {"l": 363.67599, "t": 392.06049, "r": 384.66632, "b": 403.34918, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 394.61801, "t": 391.99771, "r": 418.77798, "b": 403.40298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "0.853", "bbox": {"l": 394.61801, "t": 391.99771, "r": 418.77798, "b": 403.40298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 439.52701, "t": 391.99771, "r": 458.38336, "b": 403.40298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "1.97", "bbox": {"l": 439.52701, "t": 391.99771, "r": 458.38336, "b": 403.40298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 245.17598999999998, "t": 405.01147, "r": 272.94495, "b": 416.30017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 405.01147, "r": 272.94495, "b": 416.30017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 289.017, "t": 405.01147, "r": 310.00732, "b": 416.30017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "0.952", "bbox": {"l": 289.017, "t": 405.01147, "r": 310.00732, "b": 416.30017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 326.71701, "t": 405.01147, "r": 347.70734, "b": 416.30017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "0.909", "bbox": {"l": 326.71701, "t": 405.01147, "r": 347.70734, "b": 416.30017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 362.08801, "t": 404.9486999999999, "r": 386.24799, "b": 416.35397, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "0.938", "bbox": {"l": 362.08801, "t": 404.9486999999999, "r": 386.24799, "b": 416.35397, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 396.20599, "t": 405.01147, "r": 417.19632, "b": 416.30017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "0.843", "bbox": {"l": 396.20599, "t": 405.01147, "r": 417.19632, "b": 416.30017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 440.767, "t": 405.01147, "r": 457.15039, "b": 416.30017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "3.77", "bbox": {"l": 440.767, "t": 405.01147, "r": 457.15039, "b": 416.30017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 161.90601, "t": 423.84048, "r": 166.51474, "b": 435.12918, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "2", "bbox": {"l": 161.90601, "t": 423.84048, "r": 166.51474, "b": 435.12918, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 209.509, "t": 423.84048, "r": 214.11774, "b": 435.12918, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "4", "bbox": {"l": 209.509, "t": 423.84048, "r": 214.11774, "b": 435.12918, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 246.71000999999998, "t": 418.3614799999999, "r": 271.41064, "b": 429.65018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 418.3614799999999, "r": 271.41064, "b": 429.65018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 289.017, "t": 418.3614799999999, "r": 310.00732, "b": 429.65018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "0.923", "bbox": {"l": 289.017, "t": 418.3614799999999, "r": 310.00732, "b": 429.65018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 326.71701, "t": 418.3614799999999, "r": 347.70734, "b": 429.65018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "0.897", "bbox": {"l": 326.71701, "t": 418.3614799999999, "r": 347.70734, "b": 429.65018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 363.67599, "t": 418.3614799999999, "r": 384.66632, "b": 429.65018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "0.915", "bbox": {"l": 363.67599, "t": 418.3614799999999, "r": 384.66632, "b": 429.65018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 394.61801, "t": 418.29871, "r": 418.77798, "b": 429.70398, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "0.859", "bbox": {"l": 394.61801, "t": 418.29871, "r": 418.77798, "b": 429.70398, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 439.52701, "t": 418.29871, "r": 458.38336, "b": 429.70398, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "1.91", "bbox": {"l": 439.52701, "t": 418.29871, "r": 458.38336, "b": 429.70398, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 245.17598999999998, "t": 431.31246999999996, "r": 272.94495, "b": 442.60117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 431.31246999999996, "r": 272.94495, "b": 442.60117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 289.017, "t": 431.31246999999996, "r": 310.00732, "b": 442.60117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "0.945", "bbox": {"l": 289.017, "t": 431.31246999999996, "r": 310.00732, "b": 442.60117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 326.71701, "t": 431.31246999999996, "r": 347.70734, "b": 442.60117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "0.901", "bbox": {"l": 326.71701, "t": 431.31246999999996, "r": 347.70734, "b": 442.60117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 362.08801, "t": 431.24969, "r": 386.24799, "b": 442.65497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "0.931", "bbox": {"l": 362.08801, "t": 431.24969, "r": 386.24799, "b": 442.65497, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 396.20599, "t": 431.31246999999996, "r": 417.19632, "b": 442.60117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "0.834", "bbox": {"l": 396.20599, "t": 431.31246999999996, "r": 417.19632, "b": 442.60117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 440.767, "t": 431.31246999999996, "r": 457.15039, "b": 442.60117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "3.81", "bbox": {"l": 440.767, "t": 431.31246999999996, "r": 457.15039, "b": 442.60117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 161.90601, "t": 450.14248999999995, "r": 166.51474, "b": 461.43118, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "4", "bbox": {"l": 161.90601, "t": 450.14248999999995, "r": 166.51474, "b": 461.43118, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 209.509, "t": 450.14248999999995, "r": 214.11774, "b": 461.43118, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "2", "bbox": {"l": 209.509, "t": 450.14248999999995, "r": 214.11774, "b": 461.43118, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 246.71000999999998, "t": 444.66248, "r": 271.41064, "b": 455.95117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 444.66248, "r": 271.41064, "b": 455.95117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 289.017, "t": 444.66248, "r": 310.00732, "b": 455.95117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "0.952", "bbox": {"l": 289.017, "t": 444.66248, "r": 310.00732, "b": 455.95117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 329.021, "t": 444.66248, "r": 345.40439, "b": 455.95117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "0.92", "bbox": {"l": 329.021, "t": 444.66248, "r": 345.40439, "b": 455.95117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 362.08801, "t": 444.5996999999999, "r": 386.24799, "b": 456.00497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "0.942", "bbox": {"l": 362.08801, "t": 444.5996999999999, "r": 386.24799, "b": 456.00497, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 394.61801, "t": 444.5996999999999, "r": 418.77798, "b": 456.00497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "0.857", "bbox": {"l": 394.61801, "t": 444.5996999999999, "r": 418.77798, "b": 456.00497, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 439.52701, "t": 444.5996999999999, "r": 458.38336, "b": 456.00497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "1.22", "bbox": {"l": 439.52701, "t": 444.5996999999999, "r": 458.38336, "b": 456.00497, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 245.17598999999998, "t": 457.61447, "r": 272.94495, "b": 468.90317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 457.61447, "r": 272.94495, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 289.017, "t": 457.61447, "r": 310.00732, "b": 468.90317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "0.944", "bbox": {"l": 289.017, "t": 457.61447, "r": 310.00732, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 326.71701, "t": 457.61447, "r": 347.70734, "b": 468.90317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "0.903", "bbox": {"l": 326.71701, "t": 457.61447, "r": 347.70734, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 363.67599, "t": 457.61447, "r": 384.66632, "b": 468.90317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "0.931", "bbox": {"l": 363.67599, "t": 457.61447, "r": 384.66632, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 396.20599, "t": 457.61447, "r": 417.19632, "b": 468.90317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "0.824", "bbox": {"l": 396.20599, "t": 457.61447, "r": 417.19632, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 446.65302, "t": 457.61447, "r": 451.26175, "b": 468.90317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "2", "bbox": {"l": 446.65302, "t": 457.61447, "r": 451.26175, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "lcel", "lcel", "ched", "ched", "nl", "ched", "ched", "ucel", "ched", "ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 7, "num_cols": 8, "table_cells": [{"bbox": {"l": 160.37, "t": 339.45749, "r": 168.04523, "b": 350.74619, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "#", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 144.592, "t": 352.40848, "r": 183.82895, "b": 363.69717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "enc-layers", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 207.974, "t": 339.45749, "r": 215.64923000000002, "b": 350.74619, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "#", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 192.19501, "t": 352.40848, "r": 231.42303, "b": 363.69717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "dec-layers", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 239.79799999999997, "t": 344.93649, "r": 278.3338, "b": 356.22519000000005, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Language", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 324.67001, "t": 339.45749, "r": 348.26419, "b": 350.74619, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 3, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 6, "text": "TEDs", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 396.271, "t": 339.45749, "r": 417.12595, "b": 350.74619, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "mAP", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 394.927, "t": 350.41647, "r": 418.46921, "b": 361.70517, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "(0.75)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 430.771, "t": 339.45749, "r": 467.14142000000004, "b": 350.74619, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "Inference", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 427.14801, "t": 350.41647, "r": 470.76955999999996, "b": 361.70517, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "time (secs)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 286.686, "t": 352.40848, "r": 312.32812, "b": 363.69717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "simple", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 320.702, "t": 352.40848, "r": 353.71539, "b": 363.69717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "complex", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 369.306, "t": 352.40848, "r": 379.02914, "b": 363.69717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "all", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 161.90601, "t": 371.23849, "r": 166.51474, "b": 382.52719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 371.23849, "r": 214.11774, "b": 382.52719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 365.75848, "r": 272.94495, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 365.75848, "r": 310.00732, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.965 0.969", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 365.75848, "r": 347.70734, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.934 0.927", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 363.67599, "t": 365.75848, "r": 384.66632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.955 0.955", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 396.20599, "t": 365.69571, "r": 417.19632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.88 0.857", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 365.69571, "r": 458.38336, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "2.73 5.39", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 161.90601, "t": 397.53949, "r": 166.51474, "b": 408.82819, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 397.53949, "r": 214.11774, "b": 408.82819, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 392.06049, "r": 272.94495, "b": 416.30017, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 392.06049, "r": 310.00732, "b": 403.34918, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.938", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 392.06049, "r": 347.70734, "b": 403.34918, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.904", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 363.67599, "t": 392.06049, "r": 384.66632, "b": 403.34918, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.927", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.61801, "t": 391.99771, "r": 418.77798, "b": 403.40298, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.853", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 391.99771, "r": 458.38336, "b": 403.40298, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "1.97", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 405.01147, "r": 310.00732, "b": 429.65018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.952 0.923", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 405.01147, "r": 347.70734, "b": 416.30017, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.909", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 362.08801, "t": 404.9486999999999, "r": 386.24799, "b": 416.35397, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.938", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 396.20599, "t": 405.01147, "r": 417.19632, "b": 416.30017, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.843", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.767, "t": 405.01147, "r": 457.15039, "b": 416.30017, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "3.77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 161.90601, "t": 423.84048, "r": 166.51474, "b": 435.12918, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 423.84048, "r": 214.11774, "b": 435.12918, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 246.71000999999998, "t": 418.3614799999999, "r": 271.41064, "b": 429.65018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 418.3614799999999, "r": 347.70734, "b": 442.60117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.897 0.901", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 362.08801, "t": 418.3614799999999, "r": 386.24799, "b": 442.65497, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.915 0.931", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.61801, "t": 418.29871, "r": 418.77798, "b": 442.60117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.859 0.834", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 418.29871, "r": 458.38336, "b": 442.60117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "1.91 3.81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 431.31246999999996, "r": 272.94495, "b": 442.60117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 431.31246999999996, "r": 310.00732, "b": 442.60117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.945", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 161.90601, "t": 450.14248999999995, "r": 166.51474, "b": 461.43118, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 450.14248999999995, "r": 214.11774, "b": 461.43118, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 444.66248, "r": 272.94495, "b": 468.90317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 444.66248, "r": 310.00732, "b": 468.90317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.952 0.944", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 444.66248, "r": 347.70734, "b": 468.90317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.92 0.903", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 362.08801, "t": 444.5996999999999, "r": 386.24799, "b": 468.90317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.942 0.931", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.61801, "t": 444.5996999999999, "r": 418.77798, "b": 468.90317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.857 0.824", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 444.5996999999999, "r": 458.38336, "b": 468.90317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "1.22 2", "column_header": false, "row_header": false, "row_section": false}]}}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_header", "id": 8, "page_no": 0, "cluster": {"id": 8, "label": "page_header", "bbox": {"l": 194.478, "t": 91.49352999999996, "r": 447.54476999999997, "b": 102.78223000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9373534917831421, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 91.49352999999996, "r": 447.54476999999997, "b": 102.78223000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Optimized Table Tokenization for Table Structure Recognition"}, {"label": "page_header", "id": 9, "page_no": 0, "cluster": {"id": 9, "label": "page_header", "bbox": {"l": 475.98441, "t": 91.49352999999996, "r": 480.59314, "b": 102.78223000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.8858680725097656, "cells": [{"id": 1, "text": "9", "bbox": {"l": 475.98441, "t": 91.49352999999996, "r": 480.59314, "b": 102.78223000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "9"}, {"label": "text", "id": 4, "page_no": 0, "cluster": {"id": 4, "label": "text", "bbox": {"l": 134.765, "t": 116.46301000000005, "r": 480.59665, "b": 152.90697999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.9806433916091919, "cells": [{"id": 2, "text": "order to compute the TED score. Inference timing results for all experiments", "bbox": {"l": 134.765, "t": 116.46301000000005, "r": 480.59067, "b": 128.99597000000006, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "were obtained from the same machine on a single core with AMD EPYC 7763", "bbox": {"l": 134.765, "t": 128.41803000000004, "r": 480.59665, "b": 140.95099000000005, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "CPU @2.45 GHz.", "bbox": {"l": 134.765, "t": 140.37401999999997, "r": 210.78761, "b": 152.90697999999998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "order to compute the TED score. Inference timing results for all experiments were obtained from the same machine on a single core with AMD EPYC 7763 CPU @2.45 GHz."}, {"label": "section_header", "id": 7, "page_no": 0, "cluster": {"id": 7, "label": "section_header", "bbox": {"l": 134.765, "t": 166.70514000000003, "r": 318.45145, "b": 179.20818999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9577404260635376, "cells": [{"id": 5, "text": "5.1", "bbox": {"l": 134.765, "t": 166.70514000000003, "r": 149.40306, "b": 179.20818999999995, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Hyper Parameter Optimization", "bbox": {"l": 160.85905, "t": 166.70514000000003, "r": 318.45145, "b": 179.20818999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5.1 Hyper Parameter Optimization"}, {"label": "text", "id": 1, "page_no": 0, "cluster": {"id": 1, "label": "text", "bbox": {"l": 134.765, "t": 183.11505, "r": 480.59567, "b": 255.42400999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.98504239320755, "cells": [{"id": 7, "text": "We have chosen the PubTabNet data set to perform HPO, since it includes a", "bbox": {"l": 134.765, "t": 183.11505, "r": 479.74982000000006, "b": 195.64801, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "highly diverse set of tables. Also we report TED scores separately for simple and", "bbox": {"l": 134.765, "t": 195.07007, "r": 480.58765, "b": 207.60303, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "complex tables (tables with cell spans). Results are presented in Table. 1. It is", "bbox": {"l": 134.765, "t": 207.02502000000004, "r": 480.58859000000007, "b": 219.55798000000004, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "evident that with OTSL, our model achieves the same TED score and slightly", "bbox": {"l": 134.765, "t": 218.98004000000003, "r": 480.59567, "b": 231.51300000000003, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "better mAP scores in comparison to HTML. However OTSL yields a", "bbox": {"l": 134.765, "t": 230.93506000000002, "r": 440.9425, "b": 243.46802000000002, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "2x speed", "bbox": {"l": 444.86800999999997, "t": 230.98486000000003, "r": 480.58792, "b": 243.46802000000002, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "up", "bbox": {"l": 134.765, "t": 242.94086000000004, "r": 145.19585, "b": 255.42400999999995, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "in the inference runtime over HTML.", "bbox": {"l": 149.149, "t": 242.89104999999995, "r": 311.22256, "b": 255.42400999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "We have chosen the PubTabNet data set to perform HPO, since it includes a highly diverse set of tables. Also we report TED scores separately for simple and complex tables (tables with cell spans). Results are presented in Table. 1. It is evident that with OTSL, our model achieves the same TED score and slightly better mAP scores in comparison to HTML. However OTSL yields a 2x speed up in the inference runtime over HTML."}, {"label": "caption", "id": 5, "page_no": 0, "cluster": {"id": 5, "label": "caption", "bbox": {"l": 134.765, "t": 272.79474000000005, "r": 480.59890999999993, "b": 327.98218, "coord_origin": "TOPLEFT"}, "confidence": 0.9591909050941467, "cells": [{"id": 15, "text": "Table", "bbox": {"l": 134.765, "t": 272.79474000000005, "r": 159.22983, "b": 284.1999799999999, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "1.", "bbox": {"l": 167.34442, "t": 272.79474000000005, "r": 174.71301, "b": 284.1999799999999, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "HPO performed in OTSL and HTML representation on the same", "bbox": {"l": 188.133, "t": 272.85748, "r": 480.58101999999997, "b": 284.14618, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "transformer-based TableFormer [9] architecture, trained only on PubTabNet [22]. Ef-", "bbox": {"l": 134.765, "t": 283.81647, "r": 480.59890999999993, "b": 295.10516000000007, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "fects of reducing the # of layers in encoder and decoder stages of the model show that", "bbox": {"l": 134.765, "t": 294.77547999999996, "r": 480.59887999999995, "b": 306.06418, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "smaller models trained on OTSL perform better, especially in recognizing complex", "bbox": {"l": 134.765, "t": 305.73447, "r": 480.59180000000003, "b": 317.02316, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "table structures, and maintain a much higher mAP score than the HTML counterpart.", "bbox": {"l": 134.765, "t": 316.69348, "r": 480.58471999999995, "b": 327.98218, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 1. HPO performed in OTSL and HTML representation on the same transformer-based TableFormer [9] architecture, trained only on PubTabNet [22]. Effects of reducing the # of layers in encoder and decoder stages of the model show that smaller models trained on OTSL perform better, especially in recognizing complex table structures, and maintain a much higher mAP score than the HTML counterpart."}, {"label": "table", "id": 0, "page_no": 0, "cluster": {"id": 0, "label": "table", "bbox": {"l": 139.66741943359375, "t": 337.54541015625, "r": 475.00927734375, "b": 469.4945373535156, "coord_origin": "TOPLEFT"}, "confidence": 0.9901031255722046, "cells": [{"id": 22, "text": "#", "bbox": {"l": 160.37, "t": 339.45749, "r": 168.04523, "b": 350.74619, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "enc-layers", "bbox": {"l": 144.592, "t": 352.40848, "r": 183.82895, "b": 363.69717, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "#", "bbox": {"l": 207.974, "t": 339.45749, "r": 215.64923000000002, "b": 350.74619, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "dec-layers", "bbox": {"l": 192.19501, "t": 352.40848, "r": 231.42303, "b": 363.69717, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "Language", "bbox": {"l": 239.79799999999997, "t": 344.93649, "r": 278.3338, "b": 356.22519000000005, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "TEDs", "bbox": {"l": 324.67001, "t": 339.45749, "r": 348.26419, "b": 350.74619, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "mAP", "bbox": {"l": 396.271, "t": 339.45749, "r": 417.12595, "b": 350.74619, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "(0.75)", "bbox": {"l": 394.927, "t": 350.41647, "r": 418.46921, "b": 361.70517, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Inference", "bbox": {"l": 430.771, "t": 339.45749, "r": 467.14142000000004, "b": 350.74619, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "time (secs)", "bbox": {"l": 427.14801, "t": 350.41647, "r": 470.76955999999996, "b": 361.70517, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "simple", "bbox": {"l": 286.686, "t": 352.40848, "r": 312.32812, "b": 363.69717, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "complex", "bbox": {"l": 320.702, "t": 352.40848, "r": 353.71539, "b": 363.69717, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "all", "bbox": {"l": 369.306, "t": 352.40848, "r": 379.02914, "b": 363.69717, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "6", "bbox": {"l": 161.90601, "t": 371.23849, "r": 166.51474, "b": 382.52719, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "6", "bbox": {"l": 209.509, "t": 371.23849, "r": 214.11774, "b": 382.52719, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 365.75848, "r": 271.41064, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "0.965", "bbox": {"l": 289.017, "t": 365.75848, "r": 310.00732, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "0.934", "bbox": {"l": 326.71701, "t": 365.75848, "r": 347.70734, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "0.955", "bbox": {"l": 363.67599, "t": 365.75848, "r": 384.66632, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "0.88", "bbox": {"l": 397.26999, "t": 365.69571, "r": 416.12634, "b": 377.10098000000005, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "2.73", "bbox": {"l": 439.52701, "t": 365.69571, "r": 458.38336, "b": 377.10098000000005, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 378.71048, "r": 272.94495, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "0.969", "bbox": {"l": 289.017, "t": 378.71048, "r": 310.00732, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "0.927", "bbox": {"l": 326.71701, "t": 378.71048, "r": 347.70734, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "0.955", "bbox": {"l": 363.67599, "t": 378.71048, "r": 384.66632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "0.857", "bbox": {"l": 396.20599, "t": 378.71048, "r": 417.19632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "5.39", "bbox": {"l": 440.767, "t": 378.71048, "r": 457.15039, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "4", "bbox": {"l": 161.90601, "t": 397.53949, "r": 166.51474, "b": 408.82819, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "4", "bbox": {"l": 209.509, "t": 397.53949, "r": 214.11774, "b": 408.82819, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 392.06049, "r": 271.41064, "b": 403.34918, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "0.938", "bbox": {"l": 289.017, "t": 392.06049, "r": 310.00732, "b": 403.34918, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "0.904", "bbox": {"l": 326.71701, "t": 392.06049, "r": 347.70734, "b": 403.34918, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "0.927", "bbox": {"l": 363.67599, "t": 392.06049, "r": 384.66632, "b": 403.34918, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "0.853", "bbox": {"l": 394.61801, "t": 391.99771, "r": 418.77798, "b": 403.40298, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "1.97", "bbox": {"l": 439.52701, "t": 391.99771, "r": 458.38336, "b": 403.40298, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 405.01147, "r": 272.94495, "b": 416.30017, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "0.952", "bbox": {"l": 289.017, "t": 405.01147, "r": 310.00732, "b": 416.30017, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "0.909", "bbox": {"l": 326.71701, "t": 405.01147, "r": 347.70734, "b": 416.30017, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "0.938", "bbox": {"l": 362.08801, "t": 404.9486999999999, "r": 386.24799, "b": 416.35397, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "0.843", "bbox": {"l": 396.20599, "t": 405.01147, "r": 417.19632, "b": 416.30017, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "3.77", "bbox": {"l": 440.767, "t": 405.01147, "r": 457.15039, "b": 416.30017, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "2", "bbox": {"l": 161.90601, "t": 423.84048, "r": 166.51474, "b": 435.12918, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "4", "bbox": {"l": 209.509, "t": 423.84048, "r": 214.11774, "b": 435.12918, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 418.3614799999999, "r": 271.41064, "b": 429.65018, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "0.923", "bbox": {"l": 289.017, "t": 418.3614799999999, "r": 310.00732, "b": 429.65018, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "0.897", "bbox": {"l": 326.71701, "t": 418.3614799999999, "r": 347.70734, "b": 429.65018, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "0.915", "bbox": {"l": 363.67599, "t": 418.3614799999999, "r": 384.66632, "b": 429.65018, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "0.859", "bbox": {"l": 394.61801, "t": 418.29871, "r": 418.77798, "b": 429.70398, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "1.91", "bbox": {"l": 439.52701, "t": 418.29871, "r": 458.38336, "b": 429.70398, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 431.31246999999996, "r": 272.94495, "b": 442.60117, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "0.945", "bbox": {"l": 289.017, "t": 431.31246999999996, "r": 310.00732, "b": 442.60117, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "0.901", "bbox": {"l": 326.71701, "t": 431.31246999999996, "r": 347.70734, "b": 442.60117, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "0.931", "bbox": {"l": 362.08801, "t": 431.24969, "r": 386.24799, "b": 442.65497, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "0.834", "bbox": {"l": 396.20599, "t": 431.31246999999996, "r": 417.19632, "b": 442.60117, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "3.81", "bbox": {"l": 440.767, "t": 431.31246999999996, "r": 457.15039, "b": 442.60117, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "4", "bbox": {"l": 161.90601, "t": 450.14248999999995, "r": 166.51474, "b": 461.43118, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "2", "bbox": {"l": 209.509, "t": 450.14248999999995, "r": 214.11774, "b": 461.43118, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 444.66248, "r": 271.41064, "b": 455.95117, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "0.952", "bbox": {"l": 289.017, "t": 444.66248, "r": 310.00732, "b": 455.95117, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "0.92", "bbox": {"l": 329.021, "t": 444.66248, "r": 345.40439, "b": 455.95117, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "0.942", "bbox": {"l": 362.08801, "t": 444.5996999999999, "r": 386.24799, "b": 456.00497, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "0.857", "bbox": {"l": 394.61801, "t": 444.5996999999999, "r": 418.77798, "b": 456.00497, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "1.22", "bbox": {"l": 439.52701, "t": 444.5996999999999, "r": 458.38336, "b": 456.00497, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 457.61447, "r": 272.94495, "b": 468.90317, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "0.944", "bbox": {"l": 289.017, "t": 457.61447, "r": 310.00732, "b": 468.90317, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "0.903", "bbox": {"l": 326.71701, "t": 457.61447, "r": 347.70734, "b": 468.90317, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "0.931", "bbox": {"l": 363.67599, "t": 457.61447, "r": 384.66632, "b": 468.90317, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "0.824", "bbox": {"l": 396.20599, "t": 457.61447, "r": 417.19632, "b": 468.90317, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "2", "bbox": {"l": 446.65302, "t": 457.61447, "r": 451.26175, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": [{"id": 10, "label": "text", "bbox": {"l": 160.37, "t": 339.45749, "r": 168.04523, "b": 350.74619, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "#", "bbox": {"l": 160.37, "t": 339.45749, "r": 168.04523, "b": 350.74619, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 144.592, "t": 352.40848, "r": 183.82895, "b": 363.69717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "enc-layers", "bbox": {"l": 144.592, "t": 352.40848, "r": 183.82895, "b": 363.69717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 207.974, "t": 339.45749, "r": 215.64923000000002, "b": 350.74619, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "#", "bbox": {"l": 207.974, "t": 339.45749, "r": 215.64923000000002, "b": 350.74619, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 192.19501, "t": 352.40848, "r": 231.42303, "b": 363.69717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "dec-layers", "bbox": {"l": 192.19501, "t": 352.40848, "r": 231.42303, "b": 363.69717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 239.79799999999997, "t": 344.93649, "r": 278.3338, "b": 356.22519000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "Language", "bbox": {"l": 239.79799999999997, "t": 344.93649, "r": 278.3338, "b": 356.22519000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 324.67001, "t": 339.45749, "r": 348.26419, "b": 350.74619, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "TEDs", "bbox": {"l": 324.67001, "t": 339.45749, "r": 348.26419, "b": 350.74619, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 396.271, "t": 339.45749, "r": 417.12595, "b": 350.74619, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "mAP", "bbox": {"l": 396.271, "t": 339.45749, "r": 417.12595, "b": 350.74619, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 394.927, "t": 350.41647, "r": 418.46921, "b": 361.70517, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "(0.75)", "bbox": {"l": 394.927, "t": 350.41647, "r": 418.46921, "b": 361.70517, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 430.771, "t": 339.45749, "r": 467.14142000000004, "b": 350.74619, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "Inference", "bbox": {"l": 430.771, "t": 339.45749, "r": 467.14142000000004, "b": 350.74619, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 427.14801, "t": 350.41647, "r": 470.76955999999996, "b": 361.70517, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "time (secs)", "bbox": {"l": 427.14801, "t": 350.41647, "r": 470.76955999999996, "b": 361.70517, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 286.686, "t": 352.40848, "r": 312.32812, "b": 363.69717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "simple", "bbox": {"l": 286.686, "t": 352.40848, "r": 312.32812, "b": 363.69717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 320.702, "t": 352.40848, "r": 353.71539, "b": 363.69717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "complex", "bbox": {"l": 320.702, "t": 352.40848, "r": 353.71539, "b": 363.69717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 369.306, "t": 352.40848, "r": 379.02914, "b": 363.69717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "all", "bbox": {"l": 369.306, "t": 352.40848, "r": 379.02914, "b": 363.69717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 161.90601, "t": 371.23849, "r": 166.51474, "b": 382.52719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "6", "bbox": {"l": 161.90601, "t": 371.23849, "r": 166.51474, "b": 382.52719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 209.509, "t": 371.23849, "r": 214.11774, "b": 382.52719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "6", "bbox": {"l": 209.509, "t": 371.23849, "r": 214.11774, "b": 382.52719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 246.71000999999998, "t": 365.75848, "r": 271.41064, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 365.75848, "r": 271.41064, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 289.017, "t": 365.75848, "r": 310.00732, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "0.965", "bbox": {"l": 289.017, "t": 365.75848, "r": 310.00732, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 326.71701, "t": 365.75848, "r": 347.70734, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "0.934", "bbox": {"l": 326.71701, "t": 365.75848, "r": 347.70734, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 363.67599, "t": 365.75848, "r": 384.66632, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "0.955", "bbox": {"l": 363.67599, "t": 365.75848, "r": 384.66632, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 397.26999, "t": 365.69571, "r": 416.12634, "b": 377.10098000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "0.88", "bbox": {"l": 397.26999, "t": 365.69571, "r": 416.12634, "b": 377.10098000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 439.52701, "t": 365.69571, "r": 458.38336, "b": 377.10098000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "2.73", "bbox": {"l": 439.52701, "t": 365.69571, "r": 458.38336, "b": 377.10098000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 245.17598999999998, "t": 378.71048, "r": 272.94495, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 378.71048, "r": 272.94495, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 289.017, "t": 378.71048, "r": 310.00732, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "0.969", "bbox": {"l": 289.017, "t": 378.71048, "r": 310.00732, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 326.71701, "t": 378.71048, "r": 347.70734, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "0.927", "bbox": {"l": 326.71701, "t": 378.71048, "r": 347.70734, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 363.67599, "t": 378.71048, "r": 384.66632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "0.955", "bbox": {"l": 363.67599, "t": 378.71048, "r": 384.66632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 396.20599, "t": 378.71048, "r": 417.19632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "0.857", "bbox": {"l": 396.20599, "t": 378.71048, "r": 417.19632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 440.767, "t": 378.71048, "r": 457.15039, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "5.39", "bbox": {"l": 440.767, "t": 378.71048, "r": 457.15039, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 161.90601, "t": 397.53949, "r": 166.51474, "b": 408.82819, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "4", "bbox": {"l": 161.90601, "t": 397.53949, "r": 166.51474, "b": 408.82819, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 209.509, "t": 397.53949, "r": 214.11774, "b": 408.82819, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "4", "bbox": {"l": 209.509, "t": 397.53949, "r": 214.11774, "b": 408.82819, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 246.71000999999998, "t": 392.06049, "r": 271.41064, "b": 403.34918, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 392.06049, "r": 271.41064, "b": 403.34918, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 289.017, "t": 392.06049, "r": 310.00732, "b": 403.34918, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "0.938", "bbox": {"l": 289.017, "t": 392.06049, "r": 310.00732, "b": 403.34918, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 326.71701, "t": 392.06049, "r": 347.70734, "b": 403.34918, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "0.904", "bbox": {"l": 326.71701, "t": 392.06049, "r": 347.70734, "b": 403.34918, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 363.67599, "t": 392.06049, "r": 384.66632, "b": 403.34918, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "0.927", "bbox": {"l": 363.67599, "t": 392.06049, "r": 384.66632, "b": 403.34918, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 394.61801, "t": 391.99771, "r": 418.77798, "b": 403.40298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "0.853", "bbox": {"l": 394.61801, "t": 391.99771, "r": 418.77798, "b": 403.40298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 439.52701, "t": 391.99771, "r": 458.38336, "b": 403.40298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "1.97", "bbox": {"l": 439.52701, "t": 391.99771, "r": 458.38336, "b": 403.40298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 245.17598999999998, "t": 405.01147, "r": 272.94495, "b": 416.30017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 405.01147, "r": 272.94495, "b": 416.30017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 289.017, "t": 405.01147, "r": 310.00732, "b": 416.30017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "0.952", "bbox": {"l": 289.017, "t": 405.01147, "r": 310.00732, "b": 416.30017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 326.71701, "t": 405.01147, "r": 347.70734, "b": 416.30017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "0.909", "bbox": {"l": 326.71701, "t": 405.01147, "r": 347.70734, "b": 416.30017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 362.08801, "t": 404.9486999999999, "r": 386.24799, "b": 416.35397, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "0.938", "bbox": {"l": 362.08801, "t": 404.9486999999999, "r": 386.24799, "b": 416.35397, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 396.20599, "t": 405.01147, "r": 417.19632, "b": 416.30017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "0.843", "bbox": {"l": 396.20599, "t": 405.01147, "r": 417.19632, "b": 416.30017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 440.767, "t": 405.01147, "r": 457.15039, "b": 416.30017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "3.77", "bbox": {"l": 440.767, "t": 405.01147, "r": 457.15039, "b": 416.30017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 161.90601, "t": 423.84048, "r": 166.51474, "b": 435.12918, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "2", "bbox": {"l": 161.90601, "t": 423.84048, "r": 166.51474, "b": 435.12918, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 209.509, "t": 423.84048, "r": 214.11774, "b": 435.12918, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "4", "bbox": {"l": 209.509, "t": 423.84048, "r": 214.11774, "b": 435.12918, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 246.71000999999998, "t": 418.3614799999999, "r": 271.41064, "b": 429.65018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 418.3614799999999, "r": 271.41064, "b": 429.65018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 289.017, "t": 418.3614799999999, "r": 310.00732, "b": 429.65018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "0.923", "bbox": {"l": 289.017, "t": 418.3614799999999, "r": 310.00732, "b": 429.65018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 326.71701, "t": 418.3614799999999, "r": 347.70734, "b": 429.65018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "0.897", "bbox": {"l": 326.71701, "t": 418.3614799999999, "r": 347.70734, "b": 429.65018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 363.67599, "t": 418.3614799999999, "r": 384.66632, "b": 429.65018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "0.915", "bbox": {"l": 363.67599, "t": 418.3614799999999, "r": 384.66632, "b": 429.65018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 394.61801, "t": 418.29871, "r": 418.77798, "b": 429.70398, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "0.859", "bbox": {"l": 394.61801, "t": 418.29871, "r": 418.77798, "b": 429.70398, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 439.52701, "t": 418.29871, "r": 458.38336, "b": 429.70398, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "1.91", "bbox": {"l": 439.52701, "t": 418.29871, "r": 458.38336, "b": 429.70398, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 245.17598999999998, "t": 431.31246999999996, "r": 272.94495, "b": 442.60117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 431.31246999999996, "r": 272.94495, "b": 442.60117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 289.017, "t": 431.31246999999996, "r": 310.00732, "b": 442.60117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "0.945", "bbox": {"l": 289.017, "t": 431.31246999999996, "r": 310.00732, "b": 442.60117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 326.71701, "t": 431.31246999999996, "r": 347.70734, "b": 442.60117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "0.901", "bbox": {"l": 326.71701, "t": 431.31246999999996, "r": 347.70734, "b": 442.60117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 362.08801, "t": 431.24969, "r": 386.24799, "b": 442.65497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "0.931", "bbox": {"l": 362.08801, "t": 431.24969, "r": 386.24799, "b": 442.65497, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 396.20599, "t": 431.31246999999996, "r": 417.19632, "b": 442.60117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "0.834", "bbox": {"l": 396.20599, "t": 431.31246999999996, "r": 417.19632, "b": 442.60117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 440.767, "t": 431.31246999999996, "r": 457.15039, "b": 442.60117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "3.81", "bbox": {"l": 440.767, "t": 431.31246999999996, "r": 457.15039, "b": 442.60117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 161.90601, "t": 450.14248999999995, "r": 166.51474, "b": 461.43118, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "4", "bbox": {"l": 161.90601, "t": 450.14248999999995, "r": 166.51474, "b": 461.43118, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 209.509, "t": 450.14248999999995, "r": 214.11774, "b": 461.43118, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "2", "bbox": {"l": 209.509, "t": 450.14248999999995, "r": 214.11774, "b": 461.43118, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 246.71000999999998, "t": 444.66248, "r": 271.41064, "b": 455.95117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 444.66248, "r": 271.41064, "b": 455.95117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 289.017, "t": 444.66248, "r": 310.00732, "b": 455.95117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "0.952", "bbox": {"l": 289.017, "t": 444.66248, "r": 310.00732, "b": 455.95117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 329.021, "t": 444.66248, "r": 345.40439, "b": 455.95117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "0.92", "bbox": {"l": 329.021, "t": 444.66248, "r": 345.40439, "b": 455.95117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 362.08801, "t": 444.5996999999999, "r": 386.24799, "b": 456.00497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "0.942", "bbox": {"l": 362.08801, "t": 444.5996999999999, "r": 386.24799, "b": 456.00497, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 394.61801, "t": 444.5996999999999, "r": 418.77798, "b": 456.00497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "0.857", "bbox": {"l": 394.61801, "t": 444.5996999999999, "r": 418.77798, "b": 456.00497, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 439.52701, "t": 444.5996999999999, "r": 458.38336, "b": 456.00497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "1.22", "bbox": {"l": 439.52701, "t": 444.5996999999999, "r": 458.38336, "b": 456.00497, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 245.17598999999998, "t": 457.61447, "r": 272.94495, "b": 468.90317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 457.61447, "r": 272.94495, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 289.017, "t": 457.61447, "r": 310.00732, "b": 468.90317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "0.944", "bbox": {"l": 289.017, "t": 457.61447, "r": 310.00732, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 326.71701, "t": 457.61447, "r": 347.70734, "b": 468.90317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "0.903", "bbox": {"l": 326.71701, "t": 457.61447, "r": 347.70734, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 363.67599, "t": 457.61447, "r": 384.66632, "b": 468.90317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "0.931", "bbox": {"l": 363.67599, "t": 457.61447, "r": 384.66632, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 396.20599, "t": 457.61447, "r": 417.19632, "b": 468.90317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "0.824", "bbox": {"l": 396.20599, "t": 457.61447, "r": 417.19632, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 446.65302, "t": 457.61447, "r": 451.26175, "b": 468.90317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "2", "bbox": {"l": 446.65302, "t": 457.61447, "r": 451.26175, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "lcel", "lcel", "ched", "ched", "nl", "ched", "ched", "ucel", "ched", "ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 7, "num_cols": 8, "table_cells": [{"bbox": {"l": 160.37, "t": 339.45749, "r": 168.04523, "b": 350.74619, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "#", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 144.592, "t": 352.40848, "r": 183.82895, "b": 363.69717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "enc-layers", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 207.974, "t": 339.45749, "r": 215.64923000000002, "b": 350.74619, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "#", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 192.19501, "t": 352.40848, "r": 231.42303, "b": 363.69717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "dec-layers", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 239.79799999999997, "t": 344.93649, "r": 278.3338, "b": 356.22519000000005, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Language", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 324.67001, "t": 339.45749, "r": 348.26419, "b": 350.74619, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 3, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 6, "text": "TEDs", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 396.271, "t": 339.45749, "r": 417.12595, "b": 350.74619, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "mAP", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 394.927, "t": 350.41647, "r": 418.46921, "b": 361.70517, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "(0.75)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 430.771, "t": 339.45749, "r": 467.14142000000004, "b": 350.74619, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "Inference", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 427.14801, "t": 350.41647, "r": 470.76955999999996, "b": 361.70517, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "time (secs)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 286.686, "t": 352.40848, "r": 312.32812, "b": 363.69717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "simple", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 320.702, "t": 352.40848, "r": 353.71539, "b": 363.69717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "complex", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 369.306, "t": 352.40848, "r": 379.02914, "b": 363.69717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "all", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 161.90601, "t": 371.23849, "r": 166.51474, "b": 382.52719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 371.23849, "r": 214.11774, "b": 382.52719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 365.75848, "r": 272.94495, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 365.75848, "r": 310.00732, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.965 0.969", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 365.75848, "r": 347.70734, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.934 0.927", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 363.67599, "t": 365.75848, "r": 384.66632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.955 0.955", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 396.20599, "t": 365.69571, "r": 417.19632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.88 0.857", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 365.69571, "r": 458.38336, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "2.73 5.39", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 161.90601, "t": 397.53949, "r": 166.51474, "b": 408.82819, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 397.53949, "r": 214.11774, "b": 408.82819, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 392.06049, "r": 272.94495, "b": 416.30017, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 392.06049, "r": 310.00732, "b": 403.34918, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.938", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 392.06049, "r": 347.70734, "b": 403.34918, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.904", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 363.67599, "t": 392.06049, "r": 384.66632, "b": 403.34918, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.927", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.61801, "t": 391.99771, "r": 418.77798, "b": 403.40298, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.853", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 391.99771, "r": 458.38336, "b": 403.40298, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "1.97", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 405.01147, "r": 310.00732, "b": 429.65018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.952 0.923", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 405.01147, "r": 347.70734, "b": 416.30017, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.909", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 362.08801, "t": 404.9486999999999, "r": 386.24799, "b": 416.35397, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.938", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 396.20599, "t": 405.01147, "r": 417.19632, "b": 416.30017, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.843", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.767, "t": 405.01147, "r": 457.15039, "b": 416.30017, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "3.77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 161.90601, "t": 423.84048, "r": 166.51474, "b": 435.12918, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 423.84048, "r": 214.11774, "b": 435.12918, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 246.71000999999998, "t": 418.3614799999999, "r": 271.41064, "b": 429.65018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 418.3614799999999, "r": 347.70734, "b": 442.60117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.897 0.901", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 362.08801, "t": 418.3614799999999, "r": 386.24799, "b": 442.65497, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.915 0.931", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.61801, "t": 418.29871, "r": 418.77798, "b": 442.60117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.859 0.834", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 418.29871, "r": 458.38336, "b": 442.60117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "1.91 3.81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 431.31246999999996, "r": 272.94495, "b": 442.60117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 431.31246999999996, "r": 310.00732, "b": 442.60117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.945", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 161.90601, "t": 450.14248999999995, "r": 166.51474, "b": 461.43118, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 450.14248999999995, "r": 214.11774, "b": 461.43118, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 444.66248, "r": 272.94495, "b": 468.90317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 444.66248, "r": 310.00732, "b": 468.90317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.952 0.944", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 444.66248, "r": 347.70734, "b": 468.90317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.92 0.903", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 362.08801, "t": 444.5996999999999, "r": 386.24799, "b": 468.90317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.942 0.931", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.61801, "t": 444.5996999999999, "r": 418.77798, "b": 468.90317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.857 0.824", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 444.5996999999999, "r": 458.38336, "b": 468.90317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "1.22 2", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "section_header", "id": 6, "page_no": 0, "cluster": {"id": 6, "label": "section_header", "bbox": {"l": 134.765, "t": 505.67111, "r": 264.40829, "b": 518.17419, "coord_origin": "TOPLEFT"}, "confidence": 0.9589294195175171, "cells": [{"id": 91, "text": "5.2", "bbox": {"l": 134.765, "t": 505.67111, "r": 149.40306, "b": 518.17419, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Quantitative Results", "bbox": {"l": 160.85905, "t": 505.67111, "r": 264.40829, "b": 518.17419, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5.2 Quantitative Results"}, {"label": "text", "id": 3, "page_no": 0, "cluster": {"id": 3, "label": "text", "bbox": {"l": 134.765, "t": 522.08005, "r": 480.72003, "b": 618.3, "coord_origin": "TOPLEFT"}, "confidence": 0.9849975109100342, "cells": [{"id": 93, "text": "We picked the model parameter configuration that produced the best prediction", "bbox": {"l": 134.765, "t": 522.08005, "r": 479.72983, "b": 534.61301, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "quality (enc=6, dec=6, heads=8) with PubTabNet alone, then independently", "bbox": {"l": 134.765, "t": 534.03604, "r": 480.5897499999999, "b": 546.569, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "trained and evaluated it on three publicly available data sets: PubTabNet (395k", "bbox": {"l": 134.765, "t": 545.99104, "r": 480.72003, "b": 558.524, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "samples), FinTabNet (113k samples) and PubTables-1M (about 1M samples).", "bbox": {"l": 134.765, "t": 557.94604, "r": 480.60577, "b": 570.479, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "Performance results are presented in Table. 2. It is clearly evident that the model", "bbox": {"l": 134.765, "t": 569.90103, "r": 480.5936899999999, "b": 582.43399, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "trained on OTSL outperforms HTML across the board, keeping high TEDs and", "bbox": {"l": 134.765, "t": 581.85603, "r": 480.59158, "b": 594.38899, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "mAP scores even on difficult financial tables (FinTabNet) that contain sparse", "bbox": {"l": 134.765, "t": 593.81204, "r": 480.58080999999993, "b": 606.345, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "and large tables.", "bbox": {"l": 134.765, "t": 605.76704, "r": 206.79959, "b": 618.3, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "We picked the model parameter configuration that produced the best prediction quality (enc=6, dec=6, heads=8) with PubTabNet alone, then independently trained and evaluated it on three publicly available data sets: PubTabNet (395k samples), FinTabNet (113k samples) and PubTables-1M (about 1M samples). Performance results are presented in Table. 2. It is clearly evident that the model trained on OTSL outperforms HTML across the board, keeping high TEDs and mAP scores even on difficult financial tables (FinTabNet) that contain sparse and large tables."}, {"label": "text", "id": 2, "page_no": 0, "cluster": {"id": 2, "label": "text", "bbox": {"l": 134.765, "t": 617.72205, "r": 480.59857000000005, "b": 666.12, "coord_origin": "TOPLEFT"}, "confidence": 0.9850137829780579, "cells": [{"id": 101, "text": "Additionally, the results show that OTSL has an advantage over HTML", "bbox": {"l": 149.709, "t": 617.72205, "r": 480.59479, "b": 630.255, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "when applied on a bigger data set like PubTables-1M and achieves significantly", "bbox": {"l": 134.765, "t": 629.6770300000001, "r": 480.59857000000005, "b": 642.2099900000001, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "improved scores. Finally, OTSL achieves faster inference due to fewer decoding", "bbox": {"l": 134.765, "t": 641.63203, "r": 480.59384000000006, "b": 654.16499, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "steps which is a result of the reduced sequence representation.", "bbox": {"l": 134.765, "t": 653.58704, "r": 405.7995, "b": 666.12, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Additionally, the results show that OTSL has an advantage over HTML when applied on a bigger data set like PubTables-1M and achieves significantly improved scores. Finally, OTSL achieves faster inference due to fewer decoding steps which is a result of the reduced sequence representation."}], "body": [{"label": "text", "id": 4, "page_no": 0, "cluster": {"id": 4, "label": "text", "bbox": {"l": 134.765, "t": 116.46301000000005, "r": 480.59665, "b": 152.90697999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.9806433916091919, "cells": [{"id": 2, "text": "order to compute the TED score. Inference timing results for all experiments", "bbox": {"l": 134.765, "t": 116.46301000000005, "r": 480.59067, "b": 128.99597000000006, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "were obtained from the same machine on a single core with AMD EPYC 7763", "bbox": {"l": 134.765, "t": 128.41803000000004, "r": 480.59665, "b": 140.95099000000005, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "CPU @2.45 GHz.", "bbox": {"l": 134.765, "t": 140.37401999999997, "r": 210.78761, "b": 152.90697999999998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "order to compute the TED score. Inference timing results for all experiments were obtained from the same machine on a single core with AMD EPYC 7763 CPU @2.45 GHz."}, {"label": "section_header", "id": 7, "page_no": 0, "cluster": {"id": 7, "label": "section_header", "bbox": {"l": 134.765, "t": 166.70514000000003, "r": 318.45145, "b": 179.20818999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9577404260635376, "cells": [{"id": 5, "text": "5.1", "bbox": {"l": 134.765, "t": 166.70514000000003, "r": 149.40306, "b": 179.20818999999995, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Hyper Parameter Optimization", "bbox": {"l": 160.85905, "t": 166.70514000000003, "r": 318.45145, "b": 179.20818999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5.1 Hyper Parameter Optimization"}, {"label": "text", "id": 1, "page_no": 0, "cluster": {"id": 1, "label": "text", "bbox": {"l": 134.765, "t": 183.11505, "r": 480.59567, "b": 255.42400999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.98504239320755, "cells": [{"id": 7, "text": "We have chosen the PubTabNet data set to perform HPO, since it includes a", "bbox": {"l": 134.765, "t": 183.11505, "r": 479.74982000000006, "b": 195.64801, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "highly diverse set of tables. Also we report TED scores separately for simple and", "bbox": {"l": 134.765, "t": 195.07007, "r": 480.58765, "b": 207.60303, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "complex tables (tables with cell spans). Results are presented in Table. 1. It is", "bbox": {"l": 134.765, "t": 207.02502000000004, "r": 480.58859000000007, "b": 219.55798000000004, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "evident that with OTSL, our model achieves the same TED score and slightly", "bbox": {"l": 134.765, "t": 218.98004000000003, "r": 480.59567, "b": 231.51300000000003, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "better mAP scores in comparison to HTML. However OTSL yields a", "bbox": {"l": 134.765, "t": 230.93506000000002, "r": 440.9425, "b": 243.46802000000002, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "2x speed", "bbox": {"l": 444.86800999999997, "t": 230.98486000000003, "r": 480.58792, "b": 243.46802000000002, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "up", "bbox": {"l": 134.765, "t": 242.94086000000004, "r": 145.19585, "b": 255.42400999999995, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "in the inference runtime over HTML.", "bbox": {"l": 149.149, "t": 242.89104999999995, "r": 311.22256, "b": 255.42400999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "We have chosen the PubTabNet data set to perform HPO, since it includes a highly diverse set of tables. Also we report TED scores separately for simple and complex tables (tables with cell spans). Results are presented in Table. 1. It is evident that with OTSL, our model achieves the same TED score and slightly better mAP scores in comparison to HTML. However OTSL yields a 2x speed up in the inference runtime over HTML."}, {"label": "caption", "id": 5, "page_no": 0, "cluster": {"id": 5, "label": "caption", "bbox": {"l": 134.765, "t": 272.79474000000005, "r": 480.59890999999993, "b": 327.98218, "coord_origin": "TOPLEFT"}, "confidence": 0.9591909050941467, "cells": [{"id": 15, "text": "Table", "bbox": {"l": 134.765, "t": 272.79474000000005, "r": 159.22983, "b": 284.1999799999999, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "1.", "bbox": {"l": 167.34442, "t": 272.79474000000005, "r": 174.71301, "b": 284.1999799999999, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "HPO performed in OTSL and HTML representation on the same", "bbox": {"l": 188.133, "t": 272.85748, "r": 480.58101999999997, "b": 284.14618, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "transformer-based TableFormer [9] architecture, trained only on PubTabNet [22]. Ef-", "bbox": {"l": 134.765, "t": 283.81647, "r": 480.59890999999993, "b": 295.10516000000007, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "fects of reducing the # of layers in encoder and decoder stages of the model show that", "bbox": {"l": 134.765, "t": 294.77547999999996, "r": 480.59887999999995, "b": 306.06418, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "smaller models trained on OTSL perform better, especially in recognizing complex", "bbox": {"l": 134.765, "t": 305.73447, "r": 480.59180000000003, "b": 317.02316, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "table structures, and maintain a much higher mAP score than the HTML counterpart.", "bbox": {"l": 134.765, "t": 316.69348, "r": 480.58471999999995, "b": 327.98218, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 1. HPO performed in OTSL and HTML representation on the same transformer-based TableFormer [9] architecture, trained only on PubTabNet [22]. Effects of reducing the # of layers in encoder and decoder stages of the model show that smaller models trained on OTSL perform better, especially in recognizing complex table structures, and maintain a much higher mAP score than the HTML counterpart."}, {"label": "table", "id": 0, "page_no": 0, "cluster": {"id": 0, "label": "table", "bbox": {"l": 139.66741943359375, "t": 337.54541015625, "r": 475.00927734375, "b": 469.4945373535156, "coord_origin": "TOPLEFT"}, "confidence": 0.9901031255722046, "cells": [{"id": 22, "text": "#", "bbox": {"l": 160.37, "t": 339.45749, "r": 168.04523, "b": 350.74619, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "enc-layers", "bbox": {"l": 144.592, "t": 352.40848, "r": 183.82895, "b": 363.69717, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "#", "bbox": {"l": 207.974, "t": 339.45749, "r": 215.64923000000002, "b": 350.74619, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "dec-layers", "bbox": {"l": 192.19501, "t": 352.40848, "r": 231.42303, "b": 363.69717, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "Language", "bbox": {"l": 239.79799999999997, "t": 344.93649, "r": 278.3338, "b": 356.22519000000005, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "TEDs", "bbox": {"l": 324.67001, "t": 339.45749, "r": 348.26419, "b": 350.74619, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "mAP", "bbox": {"l": 396.271, "t": 339.45749, "r": 417.12595, "b": 350.74619, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "(0.75)", "bbox": {"l": 394.927, "t": 350.41647, "r": 418.46921, "b": 361.70517, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Inference", "bbox": {"l": 430.771, "t": 339.45749, "r": 467.14142000000004, "b": 350.74619, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "time (secs)", "bbox": {"l": 427.14801, "t": 350.41647, "r": 470.76955999999996, "b": 361.70517, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "simple", "bbox": {"l": 286.686, "t": 352.40848, "r": 312.32812, "b": 363.69717, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "complex", "bbox": {"l": 320.702, "t": 352.40848, "r": 353.71539, "b": 363.69717, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "all", "bbox": {"l": 369.306, "t": 352.40848, "r": 379.02914, "b": 363.69717, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "6", "bbox": {"l": 161.90601, "t": 371.23849, "r": 166.51474, "b": 382.52719, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "6", "bbox": {"l": 209.509, "t": 371.23849, "r": 214.11774, "b": 382.52719, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 365.75848, "r": 271.41064, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "0.965", "bbox": {"l": 289.017, "t": 365.75848, "r": 310.00732, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "0.934", "bbox": {"l": 326.71701, "t": 365.75848, "r": 347.70734, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "0.955", "bbox": {"l": 363.67599, "t": 365.75848, "r": 384.66632, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "0.88", "bbox": {"l": 397.26999, "t": 365.69571, "r": 416.12634, "b": 377.10098000000005, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "2.73", "bbox": {"l": 439.52701, "t": 365.69571, "r": 458.38336, "b": 377.10098000000005, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 378.71048, "r": 272.94495, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "0.969", "bbox": {"l": 289.017, "t": 378.71048, "r": 310.00732, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "0.927", "bbox": {"l": 326.71701, "t": 378.71048, "r": 347.70734, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "0.955", "bbox": {"l": 363.67599, "t": 378.71048, "r": 384.66632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "0.857", "bbox": {"l": 396.20599, "t": 378.71048, "r": 417.19632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "5.39", "bbox": {"l": 440.767, "t": 378.71048, "r": 457.15039, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "4", "bbox": {"l": 161.90601, "t": 397.53949, "r": 166.51474, "b": 408.82819, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "4", "bbox": {"l": 209.509, "t": 397.53949, "r": 214.11774, "b": 408.82819, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 392.06049, "r": 271.41064, "b": 403.34918, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "0.938", "bbox": {"l": 289.017, "t": 392.06049, "r": 310.00732, "b": 403.34918, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "0.904", "bbox": {"l": 326.71701, "t": 392.06049, "r": 347.70734, "b": 403.34918, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "0.927", "bbox": {"l": 363.67599, "t": 392.06049, "r": 384.66632, "b": 403.34918, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "0.853", "bbox": {"l": 394.61801, "t": 391.99771, "r": 418.77798, "b": 403.40298, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "1.97", "bbox": {"l": 439.52701, "t": 391.99771, "r": 458.38336, "b": 403.40298, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 405.01147, "r": 272.94495, "b": 416.30017, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "0.952", "bbox": {"l": 289.017, "t": 405.01147, "r": 310.00732, "b": 416.30017, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "0.909", "bbox": {"l": 326.71701, "t": 405.01147, "r": 347.70734, "b": 416.30017, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "0.938", "bbox": {"l": 362.08801, "t": 404.9486999999999, "r": 386.24799, "b": 416.35397, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "0.843", "bbox": {"l": 396.20599, "t": 405.01147, "r": 417.19632, "b": 416.30017, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "3.77", "bbox": {"l": 440.767, "t": 405.01147, "r": 457.15039, "b": 416.30017, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "2", "bbox": {"l": 161.90601, "t": 423.84048, "r": 166.51474, "b": 435.12918, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "4", "bbox": {"l": 209.509, "t": 423.84048, "r": 214.11774, "b": 435.12918, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 418.3614799999999, "r": 271.41064, "b": 429.65018, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "0.923", "bbox": {"l": 289.017, "t": 418.3614799999999, "r": 310.00732, "b": 429.65018, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "0.897", "bbox": {"l": 326.71701, "t": 418.3614799999999, "r": 347.70734, "b": 429.65018, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "0.915", "bbox": {"l": 363.67599, "t": 418.3614799999999, "r": 384.66632, "b": 429.65018, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "0.859", "bbox": {"l": 394.61801, "t": 418.29871, "r": 418.77798, "b": 429.70398, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "1.91", "bbox": {"l": 439.52701, "t": 418.29871, "r": 458.38336, "b": 429.70398, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 431.31246999999996, "r": 272.94495, "b": 442.60117, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "0.945", "bbox": {"l": 289.017, "t": 431.31246999999996, "r": 310.00732, "b": 442.60117, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "0.901", "bbox": {"l": 326.71701, "t": 431.31246999999996, "r": 347.70734, "b": 442.60117, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "0.931", "bbox": {"l": 362.08801, "t": 431.24969, "r": 386.24799, "b": 442.65497, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "0.834", "bbox": {"l": 396.20599, "t": 431.31246999999996, "r": 417.19632, "b": 442.60117, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "3.81", "bbox": {"l": 440.767, "t": 431.31246999999996, "r": 457.15039, "b": 442.60117, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "4", "bbox": {"l": 161.90601, "t": 450.14248999999995, "r": 166.51474, "b": 461.43118, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "2", "bbox": {"l": 209.509, "t": 450.14248999999995, "r": 214.11774, "b": 461.43118, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 444.66248, "r": 271.41064, "b": 455.95117, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "0.952", "bbox": {"l": 289.017, "t": 444.66248, "r": 310.00732, "b": 455.95117, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "0.92", "bbox": {"l": 329.021, "t": 444.66248, "r": 345.40439, "b": 455.95117, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "0.942", "bbox": {"l": 362.08801, "t": 444.5996999999999, "r": 386.24799, "b": 456.00497, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "0.857", "bbox": {"l": 394.61801, "t": 444.5996999999999, "r": 418.77798, "b": 456.00497, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "1.22", "bbox": {"l": 439.52701, "t": 444.5996999999999, "r": 458.38336, "b": 456.00497, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 457.61447, "r": 272.94495, "b": 468.90317, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "0.944", "bbox": {"l": 289.017, "t": 457.61447, "r": 310.00732, "b": 468.90317, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "0.903", "bbox": {"l": 326.71701, "t": 457.61447, "r": 347.70734, "b": 468.90317, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "0.931", "bbox": {"l": 363.67599, "t": 457.61447, "r": 384.66632, "b": 468.90317, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "0.824", "bbox": {"l": 396.20599, "t": 457.61447, "r": 417.19632, "b": 468.90317, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "2", "bbox": {"l": 446.65302, "t": 457.61447, "r": 451.26175, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": [{"id": 10, "label": "text", "bbox": {"l": 160.37, "t": 339.45749, "r": 168.04523, "b": 350.74619, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "#", "bbox": {"l": 160.37, "t": 339.45749, "r": 168.04523, "b": 350.74619, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 144.592, "t": 352.40848, "r": 183.82895, "b": 363.69717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "enc-layers", "bbox": {"l": 144.592, "t": 352.40848, "r": 183.82895, "b": 363.69717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 207.974, "t": 339.45749, "r": 215.64923000000002, "b": 350.74619, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "#", "bbox": {"l": 207.974, "t": 339.45749, "r": 215.64923000000002, "b": 350.74619, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 192.19501, "t": 352.40848, "r": 231.42303, "b": 363.69717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "dec-layers", "bbox": {"l": 192.19501, "t": 352.40848, "r": 231.42303, "b": 363.69717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 239.79799999999997, "t": 344.93649, "r": 278.3338, "b": 356.22519000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "Language", "bbox": {"l": 239.79799999999997, "t": 344.93649, "r": 278.3338, "b": 356.22519000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 324.67001, "t": 339.45749, "r": 348.26419, "b": 350.74619, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "TEDs", "bbox": {"l": 324.67001, "t": 339.45749, "r": 348.26419, "b": 350.74619, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 396.271, "t": 339.45749, "r": 417.12595, "b": 350.74619, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "mAP", "bbox": {"l": 396.271, "t": 339.45749, "r": 417.12595, "b": 350.74619, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 394.927, "t": 350.41647, "r": 418.46921, "b": 361.70517, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "(0.75)", "bbox": {"l": 394.927, "t": 350.41647, "r": 418.46921, "b": 361.70517, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 430.771, "t": 339.45749, "r": 467.14142000000004, "b": 350.74619, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "Inference", "bbox": {"l": 430.771, "t": 339.45749, "r": 467.14142000000004, "b": 350.74619, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 427.14801, "t": 350.41647, "r": 470.76955999999996, "b": 361.70517, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "time (secs)", "bbox": {"l": 427.14801, "t": 350.41647, "r": 470.76955999999996, "b": 361.70517, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 286.686, "t": 352.40848, "r": 312.32812, "b": 363.69717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "simple", "bbox": {"l": 286.686, "t": 352.40848, "r": 312.32812, "b": 363.69717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 320.702, "t": 352.40848, "r": 353.71539, "b": 363.69717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "complex", "bbox": {"l": 320.702, "t": 352.40848, "r": 353.71539, "b": 363.69717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 369.306, "t": 352.40848, "r": 379.02914, "b": 363.69717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "all", "bbox": {"l": 369.306, "t": 352.40848, "r": 379.02914, "b": 363.69717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 161.90601, "t": 371.23849, "r": 166.51474, "b": 382.52719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "6", "bbox": {"l": 161.90601, "t": 371.23849, "r": 166.51474, "b": 382.52719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 209.509, "t": 371.23849, "r": 214.11774, "b": 382.52719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "6", "bbox": {"l": 209.509, "t": 371.23849, "r": 214.11774, "b": 382.52719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 246.71000999999998, "t": 365.75848, "r": 271.41064, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 365.75848, "r": 271.41064, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 289.017, "t": 365.75848, "r": 310.00732, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "0.965", "bbox": {"l": 289.017, "t": 365.75848, "r": 310.00732, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 326.71701, "t": 365.75848, "r": 347.70734, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "0.934", "bbox": {"l": 326.71701, "t": 365.75848, "r": 347.70734, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 363.67599, "t": 365.75848, "r": 384.66632, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "0.955", "bbox": {"l": 363.67599, "t": 365.75848, "r": 384.66632, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 397.26999, "t": 365.69571, "r": 416.12634, "b": 377.10098000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "0.88", "bbox": {"l": 397.26999, "t": 365.69571, "r": 416.12634, "b": 377.10098000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 439.52701, "t": 365.69571, "r": 458.38336, "b": 377.10098000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "2.73", "bbox": {"l": 439.52701, "t": 365.69571, "r": 458.38336, "b": 377.10098000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 245.17598999999998, "t": 378.71048, "r": 272.94495, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 378.71048, "r": 272.94495, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 289.017, "t": 378.71048, "r": 310.00732, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "0.969", "bbox": {"l": 289.017, "t": 378.71048, "r": 310.00732, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 326.71701, "t": 378.71048, "r": 347.70734, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "0.927", "bbox": {"l": 326.71701, "t": 378.71048, "r": 347.70734, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 363.67599, "t": 378.71048, "r": 384.66632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "0.955", "bbox": {"l": 363.67599, "t": 378.71048, "r": 384.66632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 396.20599, "t": 378.71048, "r": 417.19632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "0.857", "bbox": {"l": 396.20599, "t": 378.71048, "r": 417.19632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 440.767, "t": 378.71048, "r": 457.15039, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "5.39", "bbox": {"l": 440.767, "t": 378.71048, "r": 457.15039, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 161.90601, "t": 397.53949, "r": 166.51474, "b": 408.82819, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "4", "bbox": {"l": 161.90601, "t": 397.53949, "r": 166.51474, "b": 408.82819, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 209.509, "t": 397.53949, "r": 214.11774, "b": 408.82819, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "4", "bbox": {"l": 209.509, "t": 397.53949, "r": 214.11774, "b": 408.82819, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 246.71000999999998, "t": 392.06049, "r": 271.41064, "b": 403.34918, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 392.06049, "r": 271.41064, "b": 403.34918, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 289.017, "t": 392.06049, "r": 310.00732, "b": 403.34918, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "0.938", "bbox": {"l": 289.017, "t": 392.06049, "r": 310.00732, "b": 403.34918, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 326.71701, "t": 392.06049, "r": 347.70734, "b": 403.34918, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "0.904", "bbox": {"l": 326.71701, "t": 392.06049, "r": 347.70734, "b": 403.34918, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 363.67599, "t": 392.06049, "r": 384.66632, "b": 403.34918, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "0.927", "bbox": {"l": 363.67599, "t": 392.06049, "r": 384.66632, "b": 403.34918, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 394.61801, "t": 391.99771, "r": 418.77798, "b": 403.40298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "0.853", "bbox": {"l": 394.61801, "t": 391.99771, "r": 418.77798, "b": 403.40298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 439.52701, "t": 391.99771, "r": 458.38336, "b": 403.40298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "1.97", "bbox": {"l": 439.52701, "t": 391.99771, "r": 458.38336, "b": 403.40298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 245.17598999999998, "t": 405.01147, "r": 272.94495, "b": 416.30017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 405.01147, "r": 272.94495, "b": 416.30017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 289.017, "t": 405.01147, "r": 310.00732, "b": 416.30017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "0.952", "bbox": {"l": 289.017, "t": 405.01147, "r": 310.00732, "b": 416.30017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 326.71701, "t": 405.01147, "r": 347.70734, "b": 416.30017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "0.909", "bbox": {"l": 326.71701, "t": 405.01147, "r": 347.70734, "b": 416.30017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 362.08801, "t": 404.9486999999999, "r": 386.24799, "b": 416.35397, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "0.938", "bbox": {"l": 362.08801, "t": 404.9486999999999, "r": 386.24799, "b": 416.35397, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 396.20599, "t": 405.01147, "r": 417.19632, "b": 416.30017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "0.843", "bbox": {"l": 396.20599, "t": 405.01147, "r": 417.19632, "b": 416.30017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 440.767, "t": 405.01147, "r": 457.15039, "b": 416.30017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "3.77", "bbox": {"l": 440.767, "t": 405.01147, "r": 457.15039, "b": 416.30017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 161.90601, "t": 423.84048, "r": 166.51474, "b": 435.12918, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "2", "bbox": {"l": 161.90601, "t": 423.84048, "r": 166.51474, "b": 435.12918, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 209.509, "t": 423.84048, "r": 214.11774, "b": 435.12918, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "4", "bbox": {"l": 209.509, "t": 423.84048, "r": 214.11774, "b": 435.12918, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 246.71000999999998, "t": 418.3614799999999, "r": 271.41064, "b": 429.65018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 418.3614799999999, "r": 271.41064, "b": 429.65018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 289.017, "t": 418.3614799999999, "r": 310.00732, "b": 429.65018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "0.923", "bbox": {"l": 289.017, "t": 418.3614799999999, "r": 310.00732, "b": 429.65018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 326.71701, "t": 418.3614799999999, "r": 347.70734, "b": 429.65018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "0.897", "bbox": {"l": 326.71701, "t": 418.3614799999999, "r": 347.70734, "b": 429.65018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 363.67599, "t": 418.3614799999999, "r": 384.66632, "b": 429.65018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "0.915", "bbox": {"l": 363.67599, "t": 418.3614799999999, "r": 384.66632, "b": 429.65018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 394.61801, "t": 418.29871, "r": 418.77798, "b": 429.70398, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "0.859", "bbox": {"l": 394.61801, "t": 418.29871, "r": 418.77798, "b": 429.70398, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 439.52701, "t": 418.29871, "r": 458.38336, "b": 429.70398, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "1.91", "bbox": {"l": 439.52701, "t": 418.29871, "r": 458.38336, "b": 429.70398, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 245.17598999999998, "t": 431.31246999999996, "r": 272.94495, "b": 442.60117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 431.31246999999996, "r": 272.94495, "b": 442.60117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 289.017, "t": 431.31246999999996, "r": 310.00732, "b": 442.60117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "0.945", "bbox": {"l": 289.017, "t": 431.31246999999996, "r": 310.00732, "b": 442.60117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 326.71701, "t": 431.31246999999996, "r": 347.70734, "b": 442.60117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "0.901", "bbox": {"l": 326.71701, "t": 431.31246999999996, "r": 347.70734, "b": 442.60117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 362.08801, "t": 431.24969, "r": 386.24799, "b": 442.65497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "0.931", "bbox": {"l": 362.08801, "t": 431.24969, "r": 386.24799, "b": 442.65497, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 396.20599, "t": 431.31246999999996, "r": 417.19632, "b": 442.60117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "0.834", "bbox": {"l": 396.20599, "t": 431.31246999999996, "r": 417.19632, "b": 442.60117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 440.767, "t": 431.31246999999996, "r": 457.15039, "b": 442.60117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "3.81", "bbox": {"l": 440.767, "t": 431.31246999999996, "r": 457.15039, "b": 442.60117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 161.90601, "t": 450.14248999999995, "r": 166.51474, "b": 461.43118, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "4", "bbox": {"l": 161.90601, "t": 450.14248999999995, "r": 166.51474, "b": 461.43118, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 209.509, "t": 450.14248999999995, "r": 214.11774, "b": 461.43118, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "2", "bbox": {"l": 209.509, "t": 450.14248999999995, "r": 214.11774, "b": 461.43118, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 246.71000999999998, "t": 444.66248, "r": 271.41064, "b": 455.95117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 444.66248, "r": 271.41064, "b": 455.95117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 289.017, "t": 444.66248, "r": 310.00732, "b": 455.95117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "0.952", "bbox": {"l": 289.017, "t": 444.66248, "r": 310.00732, "b": 455.95117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 329.021, "t": 444.66248, "r": 345.40439, "b": 455.95117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "0.92", "bbox": {"l": 329.021, "t": 444.66248, "r": 345.40439, "b": 455.95117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 362.08801, "t": 444.5996999999999, "r": 386.24799, "b": 456.00497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "0.942", "bbox": {"l": 362.08801, "t": 444.5996999999999, "r": 386.24799, "b": 456.00497, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 394.61801, "t": 444.5996999999999, "r": 418.77798, "b": 456.00497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "0.857", "bbox": {"l": 394.61801, "t": 444.5996999999999, "r": 418.77798, "b": 456.00497, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 439.52701, "t": 444.5996999999999, "r": 458.38336, "b": 456.00497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "1.22", "bbox": {"l": 439.52701, "t": 444.5996999999999, "r": 458.38336, "b": 456.00497, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 245.17598999999998, "t": 457.61447, "r": 272.94495, "b": 468.90317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 457.61447, "r": 272.94495, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 289.017, "t": 457.61447, "r": 310.00732, "b": 468.90317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "0.944", "bbox": {"l": 289.017, "t": 457.61447, "r": 310.00732, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 326.71701, "t": 457.61447, "r": 347.70734, "b": 468.90317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "0.903", "bbox": {"l": 326.71701, "t": 457.61447, "r": 347.70734, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 363.67599, "t": 457.61447, "r": 384.66632, "b": 468.90317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "0.931", "bbox": {"l": 363.67599, "t": 457.61447, "r": 384.66632, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 396.20599, "t": 457.61447, "r": 417.19632, "b": 468.90317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "0.824", "bbox": {"l": 396.20599, "t": 457.61447, "r": 417.19632, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 446.65302, "t": 457.61447, "r": 451.26175, "b": 468.90317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "2", "bbox": {"l": 446.65302, "t": 457.61447, "r": 451.26175, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "lcel", "lcel", "ched", "ched", "nl", "ched", "ched", "ucel", "ched", "ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 7, "num_cols": 8, "table_cells": [{"bbox": {"l": 160.37, "t": 339.45749, "r": 168.04523, "b": 350.74619, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "#", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 144.592, "t": 352.40848, "r": 183.82895, "b": 363.69717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "enc-layers", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 207.974, "t": 339.45749, "r": 215.64923000000002, "b": 350.74619, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "#", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 192.19501, "t": 352.40848, "r": 231.42303, "b": 363.69717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "dec-layers", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 239.79799999999997, "t": 344.93649, "r": 278.3338, "b": 356.22519000000005, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Language", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 324.67001, "t": 339.45749, "r": 348.26419, "b": 350.74619, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 3, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 6, "text": "TEDs", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 396.271, "t": 339.45749, "r": 417.12595, "b": 350.74619, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "mAP", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 394.927, "t": 350.41647, "r": 418.46921, "b": 361.70517, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "(0.75)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 430.771, "t": 339.45749, "r": 467.14142000000004, "b": 350.74619, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "Inference", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 427.14801, "t": 350.41647, "r": 470.76955999999996, "b": 361.70517, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "time (secs)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 286.686, "t": 352.40848, "r": 312.32812, "b": 363.69717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "simple", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 320.702, "t": 352.40848, "r": 353.71539, "b": 363.69717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "complex", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 369.306, "t": 352.40848, "r": 379.02914, "b": 363.69717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "all", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 161.90601, "t": 371.23849, "r": 166.51474, "b": 382.52719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 371.23849, "r": 214.11774, "b": 382.52719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 365.75848, "r": 272.94495, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 365.75848, "r": 310.00732, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.965 0.969", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 365.75848, "r": 347.70734, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.934 0.927", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 363.67599, "t": 365.75848, "r": 384.66632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.955 0.955", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 396.20599, "t": 365.69571, "r": 417.19632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.88 0.857", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 365.69571, "r": 458.38336, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "2.73 5.39", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 161.90601, "t": 397.53949, "r": 166.51474, "b": 408.82819, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 397.53949, "r": 214.11774, "b": 408.82819, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 392.06049, "r": 272.94495, "b": 416.30017, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 392.06049, "r": 310.00732, "b": 403.34918, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.938", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 392.06049, "r": 347.70734, "b": 403.34918, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.904", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 363.67599, "t": 392.06049, "r": 384.66632, "b": 403.34918, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.927", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.61801, "t": 391.99771, "r": 418.77798, "b": 403.40298, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.853", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 391.99771, "r": 458.38336, "b": 403.40298, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "1.97", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 405.01147, "r": 310.00732, "b": 429.65018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.952 0.923", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 405.01147, "r": 347.70734, "b": 416.30017, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.909", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 362.08801, "t": 404.9486999999999, "r": 386.24799, "b": 416.35397, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.938", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 396.20599, "t": 405.01147, "r": 417.19632, "b": 416.30017, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.843", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.767, "t": 405.01147, "r": 457.15039, "b": 416.30017, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "3.77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 161.90601, "t": 423.84048, "r": 166.51474, "b": 435.12918, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 423.84048, "r": 214.11774, "b": 435.12918, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 246.71000999999998, "t": 418.3614799999999, "r": 271.41064, "b": 429.65018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 418.3614799999999, "r": 347.70734, "b": 442.60117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.897 0.901", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 362.08801, "t": 418.3614799999999, "r": 386.24799, "b": 442.65497, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.915 0.931", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.61801, "t": 418.29871, "r": 418.77798, "b": 442.60117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.859 0.834", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 418.29871, "r": 458.38336, "b": 442.60117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "1.91 3.81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 431.31246999999996, "r": 272.94495, "b": 442.60117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 431.31246999999996, "r": 310.00732, "b": 442.60117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.945", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 161.90601, "t": 450.14248999999995, "r": 166.51474, "b": 461.43118, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 450.14248999999995, "r": 214.11774, "b": 461.43118, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 444.66248, "r": 272.94495, "b": 468.90317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 444.66248, "r": 310.00732, "b": 468.90317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.952 0.944", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 444.66248, "r": 347.70734, "b": 468.90317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.92 0.903", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 362.08801, "t": 444.5996999999999, "r": 386.24799, "b": 468.90317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.942 0.931", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.61801, "t": 444.5996999999999, "r": 418.77798, "b": 468.90317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.857 0.824", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 444.5996999999999, "r": 458.38336, "b": 468.90317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "1.22 2", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "section_header", "id": 6, "page_no": 0, "cluster": {"id": 6, "label": "section_header", "bbox": {"l": 134.765, "t": 505.67111, "r": 264.40829, "b": 518.17419, "coord_origin": "TOPLEFT"}, "confidence": 0.9589294195175171, "cells": [{"id": 91, "text": "5.2", "bbox": {"l": 134.765, "t": 505.67111, "r": 149.40306, "b": 518.17419, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Quantitative Results", "bbox": {"l": 160.85905, "t": 505.67111, "r": 264.40829, "b": 518.17419, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5.2 Quantitative Results"}, {"label": "text", "id": 3, "page_no": 0, "cluster": {"id": 3, "label": "text", "bbox": {"l": 134.765, "t": 522.08005, "r": 480.72003, "b": 618.3, "coord_origin": "TOPLEFT"}, "confidence": 0.9849975109100342, "cells": [{"id": 93, "text": "We picked the model parameter configuration that produced the best prediction", "bbox": {"l": 134.765, "t": 522.08005, "r": 479.72983, "b": 534.61301, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "quality (enc=6, dec=6, heads=8) with PubTabNet alone, then independently", "bbox": {"l": 134.765, "t": 534.03604, "r": 480.5897499999999, "b": 546.569, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "trained and evaluated it on three publicly available data sets: PubTabNet (395k", "bbox": {"l": 134.765, "t": 545.99104, "r": 480.72003, "b": 558.524, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "samples), FinTabNet (113k samples) and PubTables-1M (about 1M samples).", "bbox": {"l": 134.765, "t": 557.94604, "r": 480.60577, "b": 570.479, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "Performance results are presented in Table. 2. It is clearly evident that the model", "bbox": {"l": 134.765, "t": 569.90103, "r": 480.5936899999999, "b": 582.43399, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "trained on OTSL outperforms HTML across the board, keeping high TEDs and", "bbox": {"l": 134.765, "t": 581.85603, "r": 480.59158, "b": 594.38899, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "mAP scores even on difficult financial tables (FinTabNet) that contain sparse", "bbox": {"l": 134.765, "t": 593.81204, "r": 480.58080999999993, "b": 606.345, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "and large tables.", "bbox": {"l": 134.765, "t": 605.76704, "r": 206.79959, "b": 618.3, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "We picked the model parameter configuration that produced the best prediction quality (enc=6, dec=6, heads=8) with PubTabNet alone, then independently trained and evaluated it on three publicly available data sets: PubTabNet (395k samples), FinTabNet (113k samples) and PubTables-1M (about 1M samples). Performance results are presented in Table. 2. It is clearly evident that the model trained on OTSL outperforms HTML across the board, keeping high TEDs and mAP scores even on difficult financial tables (FinTabNet) that contain sparse and large tables."}, {"label": "text", "id": 2, "page_no": 0, "cluster": {"id": 2, "label": "text", "bbox": {"l": 134.765, "t": 617.72205, "r": 480.59857000000005, "b": 666.12, "coord_origin": "TOPLEFT"}, "confidence": 0.9850137829780579, "cells": [{"id": 101, "text": "Additionally, the results show that OTSL has an advantage over HTML", "bbox": {"l": 149.709, "t": 617.72205, "r": 480.59479, "b": 630.255, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "when applied on a bigger data set like PubTables-1M and achieves significantly", "bbox": {"l": 134.765, "t": 629.6770300000001, "r": 480.59857000000005, "b": 642.2099900000001, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "improved scores. Finally, OTSL achieves faster inference due to fewer decoding", "bbox": {"l": 134.765, "t": 641.63203, "r": 480.59384000000006, "b": 654.16499, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "steps which is a result of the reduced sequence representation.", "bbox": {"l": 134.765, "t": 653.58704, "r": 405.7995, "b": 666.12, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Additionally, the results show that OTSL has an advantage over HTML when applied on a bigger data set like PubTables-1M and achieves significantly improved scores. Finally, OTSL achieves faster inference due to fewer decoding steps which is a result of the reduced sequence representation."}], "headers": [{"label": "page_header", "id": 8, "page_no": 0, "cluster": {"id": 8, "label": "page_header", "bbox": {"l": 194.478, "t": 91.49352999999996, "r": 447.54476999999997, "b": 102.78223000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9373534917831421, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 91.49352999999996, "r": 447.54476999999997, "b": 102.78223000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Optimized Table Tokenization for Table Structure Recognition"}, {"label": "page_header", "id": 9, "page_no": 0, "cluster": {"id": 9, "label": "page_header", "bbox": {"l": 475.98441, "t": 91.49352999999996, "r": 480.59314, "b": 102.78223000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.8858680725097656, "cells": [{"id": 1, "text": "9", "bbox": {"l": 475.98441, "t": 91.49352999999996, "r": 480.59314, "b": 102.78223000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "9"}]}}]
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v1/2305.03393v1.doctags.txt b/tests/data/groundtruth/docling_v1/2305.03393v1.doctags.txt
index b881826d..1ad30c47 100644
--- a/tests/data/groundtruth/docling_v1/2305.03393v1.doctags.txt
+++ b/tests/data/groundtruth/docling_v1/2305.03393v1.doctags.txt
@@ -9,7 +9,6 @@
 <subtitle-level-1><location><page_1><loc_22><loc_33><loc_37><loc_34></location>1 Introduction</subtitle-level-1>
 <paragraph><location><page_1><loc_22><loc_21><loc_79><loc_31></location>Tables are ubiquitous in documents such as scientific papers, patents, reports, manuals, specification sheets or marketing material. They often encode highly valuable information and therefore need to be extracted with high accuracy. Unfortunately, tables appear in documents in various sizes, styling and structure, making it difficult to recover their correct structure with simple analytical methods. Therefore, accurate table extraction is achieved these days with machine-learning based methods.</paragraph>
 <paragraph><location><page_1><loc_22><loc_16><loc_79><loc_20></location>In modern document understanding systems [1,15], table extraction is typically a two-step process. Firstly, every table on a page is located with a bounding box, and secondly, their logical row and column structure is recognized. As of</paragraph>
-<caption><location><page_2><loc_22><loc_75><loc_79><loc_84></location>Fig. 1. Comparison between HTML and OTSL table structure representation: (A) table-example with complex row and column headers, including a 2D empty span, (B) minimal graphical representation of table structure using rectangular layout, (C) HTML representation, (D) OTSL representation. This example demonstrates many of the key-features of OTSL, namely its reduced vocabulary size (12 versus 5 in this case), its reduced sequence length (55 versus 30) and a enhanced internal structure (variable token sequence length per row in HTML versus a fixed length of rows in OTSL).</caption>
 <figure>
 <location><page_2><loc_24><loc_46><loc_76><loc_74></location>
 <caption>Fig. 1. Comparison between HTML and OTSL table structure representation: (A) table-example with complex row and column headers, including a 2D empty span, (B) minimal graphical representation of table structure using rectangular layout, (C) HTML representation, (D) OTSL representation. This example demonstrates many of the key-features of OTSL, namely its reduced vocabulary size (12 versus 5 in this case), its reduced sequence length (55 versus 30) and a enhanced internal structure (variable token sequence length per row in HTML versus a fixed length of rows in OTSL).</caption>
@@ -27,7 +26,6 @@
 <subtitle-level-1><location><page_4><loc_22><loc_22><loc_44><loc_24></location>3 Problem Statement</subtitle-level-1>
 <paragraph><location><page_4><loc_22><loc_16><loc_79><loc_20></location>All known Im2Seq based models for TSR fundamentally work in similar ways. Given an image of a table, the Im2Seq model predicts the structure of the table by generating a sequence of tokens. These tokens originate from a finite vocab-</paragraph>
 <paragraph><location><page_5><loc_22><loc_76><loc_79><loc_85></location>ulary and can be interpreted as a table structure. For example, with the HTML tokens <table> , </table> , <tr> , </tr> , <td> and </td> , one can construct simple table structures without any spanning cells. In reality though, one needs at least 28 HTML tokens to describe the most common complex tables observed in real-world documents [21,22], due to a variety of spanning cells definitions in the HTML token vocabulary.</paragraph>
-<caption><location><page_5><loc_24><loc_71><loc_77><loc_72></location>Fig. 2. Frequency of tokens in HTML and OTSL as they appear in PubTabNet.</caption>
 <figure>
 <location><page_5><loc_22><loc_57><loc_78><loc_71></location>
 <caption>Fig. 2. Frequency of tokens in HTML and OTSL as they appear in PubTabNet.</caption>
@@ -48,7 +46,6 @@
 <paragraph><location><page_6><loc_23><loc_22><loc_74><loc_23></location>- -"X" cell cross cell , to merge with both left and upper neighbor cells</paragraph>
 <paragraph><location><page_6><loc_23><loc_20><loc_54><loc_21></location>- -"NL" new-line , switch to the next row.</paragraph>
 <paragraph><location><page_6><loc_22><loc_16><loc_79><loc_19></location>A notable attribute of OTSL is that it has the capability of achieving lossless conversion to HTML.</paragraph>
-<caption><location><page_7><loc_22><loc_80><loc_79><loc_84></location>Fig. 3. OTSL description of table structure: A - table example; B - graphical representation of table structure; C - mapping structure on a grid; D - OTSL structure encoding; E - explanation on cell encoding</caption>
 <figure>
 <location><page_7><loc_27><loc_65><loc_73><loc_79></location>
 <caption>Fig. 3. OTSL description of table structure: A - table example; B - graphical representation of table structure; C - mapping structure on a grid; D - OTSL structure encoding; E - explanation on cell encoding</caption>
@@ -69,7 +66,6 @@
 <paragraph><location><page_8><loc_22><loc_62><loc_79><loc_77></location>The design of OTSL allows to validate a table structure easily on an unfinished sequence. The detection of an invalid sequence token is a clear indication of a prediction mistake, however a valid sequence by itself does not guarantee prediction correctness. Different heuristics can be used to correct token errors in an invalid sequence and thus increase the chances for accurate predictions. Such heuristics can be applied either after the prediction of each token, or at the end on the entire predicted sequence. For example a simple heuristic which can correct the predicted OTSL sequence on-the-fly is to verify if the token with the highest prediction confidence invalidates the predicted sequence, and replace it by the token with the next highest confidence until OTSL rules are satisfied.</paragraph>
 <subtitle-level-1><location><page_8><loc_22><loc_58><loc_37><loc_59></location>5 Experiments</subtitle-level-1>
 <paragraph><location><page_8><loc_22><loc_43><loc_79><loc_56></location>To evaluate the impact of OTSL on prediction accuracy and inference times, we conducted a series of experiments based on the TableFormer model (Figure 4) with two objectives: Firstly we evaluate the prediction quality and performance of OTSL vs. HTML after performing Hyper Parameter Optimization (HPO) on the canonical PubTabNet data set. Secondly we pick the best hyper-parameters found in the first step and evaluate how OTSL impacts the performance of TableFormer after training on other publicly available data sets (FinTabNet, PubTables-1M [14]). The ground truth (GT) from all data sets has been converted into OTSL format for this purpose, and will be made publicly available.</paragraph>
-<caption><location><page_8><loc_22><loc_36><loc_79><loc_39></location>Fig. 4. Architecture sketch of the TableFormer model, which is a representative for the Im2Seq approach.</caption>
 <figure>
 <location><page_8><loc_23><loc_25><loc_77><loc_36></location>
 <caption>Fig. 4. Architecture sketch of the TableFormer model, which is a representative for the Im2Seq approach.</caption>
@@ -78,7 +74,6 @@
 <paragraph><location><page_9><loc_22><loc_81><loc_79><loc_85></location>order to compute the TED score. Inference timing results for all experiments were obtained from the same machine on a single core with AMD EPYC 7763 CPU @2.45 GHz.</paragraph>
 <subtitle-level-1><location><page_9><loc_22><loc_78><loc_52><loc_79></location>5.1 Hyper Parameter Optimization</subtitle-level-1>
 <paragraph><location><page_9><loc_22><loc_68><loc_79><loc_77></location>We have chosen the PubTabNet data set to perform HPO, since it includes a highly diverse set of tables. Also we report TED scores separately for simple and complex tables (tables with cell spans). Results are presented in Table. 1. It is evident that with OTSL, our model achieves the same TED score and slightly better mAP scores in comparison to HTML. However OTSL yields a 2x speed up in the inference runtime over HTML.</paragraph>
-<caption><location><page_9><loc_22><loc_59><loc_79><loc_65></location>Table 1. HPO performed in OTSL and HTML representation on the same transformer-based TableFormer [9] architecture, trained only on PubTabNet [22]. Effects of reducing the # of layers in encoder and decoder stages of the model show that smaller models trained on OTSL perform better, especially in recognizing complex table structures, and maintain a much higher mAP score than the HTML counterpart.</caption>
 <table>
 <location><page_9><loc_23><loc_41><loc_78><loc_57></location>
 <caption>Table 1. HPO performed in OTSL and HTML representation on the same transformer-based TableFormer [9] architecture, trained only on PubTabNet [22]. Effects of reducing the # of layers in encoder and decoder stages of the model show that smaller models trained on OTSL perform better, especially in recognizing complex table structures, and maintain a much higher mAP score than the HTML counterpart.</caption>
@@ -90,10 +85,10 @@
 <row_5><col_0><body></col_0><col_1><body></col_1><col_2><body>HTML</col_2><col_3><body></col_3><col_4><body>0.901</col_4><col_5><body>0.915 0.931</col_5><col_6><body>0.859 0.834</col_6><col_7><body>1.91 3.81</col_7></row_5>
 <row_6><col_0><body>4</col_0><col_1><body>2</col_1><col_2><body>OTSL HTML</col_2><col_3><body>0.952 0.944</col_3><col_4><body>0.92 0.903</col_4><col_5><body>0.942 0.931</col_5><col_6><body>0.857 0.824</col_6><col_7><body>1.22 2</col_7></row_6>
 </table>
+<caption><location><page_9><loc_22><loc_59><loc_79><loc_65></location>Table 1. HPO performed in OTSL and HTML representation on the same transformer-based TableFormer [9] architecture, trained only on PubTabNet [22]. Effects of reducing the # of layers in encoder and decoder stages of the model show that smaller models trained on OTSL perform better, especially in recognizing complex table structures, and maintain a much higher mAP score than the HTML counterpart.</caption>
 <subtitle-level-1><location><page_9><loc_22><loc_35><loc_43><loc_36></location>5.2 Quantitative Results</subtitle-level-1>
 <paragraph><location><page_9><loc_22><loc_22><loc_79><loc_34></location>We picked the model parameter configuration that produced the best prediction quality (enc=6, dec=6, heads=8) with PubTabNet alone, then independently trained and evaluated it on three publicly available data sets: PubTabNet (395k samples), FinTabNet (113k samples) and PubTables-1M (about 1M samples). Performance results are presented in Table. 2. It is clearly evident that the model trained on OTSL outperforms HTML across the board, keeping high TEDs and mAP scores even on difficult financial tables (FinTabNet) that contain sparse and large tables.</paragraph>
 <paragraph><location><page_9><loc_22><loc_16><loc_79><loc_22></location>Additionally, the results show that OTSL has an advantage over HTML when applied on a bigger data set like PubTables-1M and achieves significantly improved scores. Finally, OTSL achieves faster inference due to fewer decoding steps which is a result of the reduced sequence representation.</paragraph>
-<caption><location><page_10><loc_22><loc_82><loc_79><loc_85></location>Table 2. TSR and cell detection results compared between OTSL and HTML on the PubTabNet [22], FinTabNet [21] and PubTables-1M [14] data sets using TableFormer [9] (with enc=6, dec=6, heads=8).</caption>
 <table>
 <location><page_10><loc_23><loc_67><loc_77><loc_80></location>
 <caption>Table 2. TSR and cell detection results compared between OTSL and HTML on the PubTabNet [22], FinTabNet [21] and PubTables-1M [14] data sets using TableFormer [9] (with enc=6, dec=6, heads=8).</caption>
@@ -106,16 +101,15 @@
 <row_6><col_0><row_header>PubTables-1M</col_0><col_1><row_header>OTSL</col_1><col_2><body>0.987</col_2><col_3><body>0.964</col_3><col_4><body>0.977</col_4><col_5><body>0.896</col_5><col_6><body>1.79</col_6></row_6>
 <row_7><col_0><row_header>PubTables-1M</col_0><col_1><row_header>HTML</col_1><col_2><body>0.983</col_2><col_3><body>0.944</col_3><col_4><body>0.966</col_4><col_5><body>0.889</col_5><col_6><body>3.26</col_6></row_7>
 </table>
+<caption><location><page_10><loc_22><loc_82><loc_79><loc_85></location>Table 2. TSR and cell detection results compared between OTSL and HTML on the PubTabNet [22], FinTabNet [21] and PubTables-1M [14] data sets using TableFormer [9] (with enc=6, dec=6, heads=8).</caption>
 <subtitle-level-1><location><page_10><loc_22><loc_62><loc_42><loc_64></location>5.3 Qualitative Results</subtitle-level-1>
 <paragraph><location><page_10><loc_22><loc_54><loc_79><loc_61></location>To illustrate the qualitative differences between OTSL and HTML, Figure 5 demonstrates less overlap and more accurate bounding boxes with OTSL. In Figure 6, OTSL proves to be more effective in handling tables with longer token sequences, resulting in even more precise structure prediction and bounding boxes.</paragraph>
-<caption><location><page_10><loc_22><loc_44><loc_79><loc_50></location>Fig. 5. The OTSL model produces more accurate bounding boxes with less overlap (E) than the HTML model (D), when predicting the structure of a sparse table (A), at twice the inference speed because of shorter sequence length (B),(C). "PMC2807444_006_00.png" PubTabNet. μ</caption>
 <figure>
 <location><page_10><loc_27><loc_16><loc_74><loc_44></location>
 <caption>Fig. 5. The OTSL model produces more accurate bounding boxes with less overlap (E) than the HTML model (D), when predicting the structure of a sparse table (A), at twice the inference speed because of shorter sequence length (B),(C). "PMC2807444_006_00.png" PubTabNet. μ</caption>
 </figure>
 <paragraph><location><page_10><loc_37><loc_15><loc_38><loc_16></location>μ</paragraph>
 <paragraph><location><page_10><loc_49><loc_12><loc_49><loc_14></location>≥</paragraph>
-<caption><location><page_11><loc_22><loc_78><loc_79><loc_84></location>Fig. 6. Visualization of predicted structure and detected bounding boxes on a complex table with many rows. The OTSL model (B) captured repeating pattern of horizontally merged cells from the GT (A), unlike the HTML model (C). The HTML model also didn't complete the HTML sequence correctly and displayed a lot more of drift and overlap of bounding boxes. "PMC5406406_003_01.png" PubTabNet.</caption>
 <figure>
 <location><page_11><loc_28><loc_20><loc_73><loc_77></location>
 <caption>Fig. 6. Visualization of predicted structure and detected bounding boxes on a complex table with many rows. The OTSL model (B) captured repeating pattern of horizontally merged cells from the GT (A), unlike the HTML model (C). The HTML model also didn't complete the HTML sequence correctly and displayed a lot more of drift and overlap of bounding boxes. "PMC5406406_003_01.png" PubTabNet.</caption>
diff --git a/tests/data/groundtruth/docling_v1/2305.03393v1.json b/tests/data/groundtruth/docling_v1/2305.03393v1.json
index 7a0266da..d886d56c 100644
--- a/tests/data/groundtruth/docling_v1/2305.03393v1.json
+++ b/tests/data/groundtruth/docling_v1/2305.03393v1.json
@@ -1 +1 @@
-{"_name": "", "type": "pdf-document", "description": {"title": null, "abstract": null, "authors": null, "affiliations": null, "subjects": null, "keywords": null, "publication_date": null, "languages": null, "license": null, "publishers": null, "url_refs": null, "references": null, "publication": null, "reference_count": null, "citation_count": null, "citation_date": null, "advanced": null, "analytics": null, "logs": [], "collection": null, "acquisition": null}, "file-info": {"filename": "2305.03393v1.pdf", "filename-prov": null, "document-hash": "c98927fda1ef9b66a4c3a236a65dc0cdf5c129be4122cdb58eaa3a37e3241eae", "#-pages": 14, "collection-name": null, "description": null, "page-hashes": [{"hash": "f09df98501fbcd8a2b359e4686187b56b7d82f3eb312cbbb23f61661691ecbf9", "model": "default", "page": 1}, {"hash": "6d26558563949e376cdb8dcb12a7288ec12d4c513de04616238aadcd15255d28", "model": "default", "page": 2}, {"hash": "4ef8043e938e362a06bc7f88f0b02df95d95cbfc891f544b7f88a448e53fb689", "model": "default", "page": 3}, {"hash": "8b755c3cd938ebf88bf14db6103c999794b0ca0c6f591f47a0c902b111159fe6", "model": "default", "page": 4}, {"hash": "95582f3138775a800969e873ad2e4eafca4f1d1de7b9b14ad826bbe8a17fe302", "model": "default", "page": 5}, {"hash": "619ab9fe3258434818f86df106cb76ed1fc8ab9800cbd91444098e91f7e67d8b", "model": "default", "page": 6}, {"hash": "c02e90eed528fcb71d0657183903b3e2035b86e3e750fb579f8c1f1e09aa132d", "model": "default", "page": 7}, {"hash": "b56262de55611de4494b0ed5011ce9567fada7c99bf53c5ff6c689ad9f941730", "model": "default", "page": 8}, {"hash": "680962e4a1193f15a591c82e1be59c0ff4cc78a066aeaaccad41f9262c67197b", "model": "default", "page": 9}, {"hash": "37dca86674661a5845a3bbd2fabb4a497cf2b5fc4908fd28dd63296c4fbee075", "model": "default", "page": 10}, {"hash": "0e3c057d1d7e6b359d73d4a44597879b2d421097da9aeb18ea581b32666ce740", "model": "default", "page": 11}, {"hash": "ec343c5522af29f238bde237ca655cdc018c5db20fb099c15ce8bc5045ce8593", "model": "default", "page": 12}, {"hash": "4ffa1d69b1366de506ca77c25a021790c3c150791fc830d6f4c85c3846efe6a9", "model": "default", "page": 13}, {"hash": "9fd62e0449eaf680e49767b4c512d8172cd3586480344318dc7e1cb0964b4d18", "model": "default", "page": 14}]}, "main-text": [{"prov": [{"bbox": [18.34021759033203, 236.99996948242188, 36.339786529541016, 582.52001953125], "page": 1, "span": [0, 37], "__ref_s3_data": null}], "text": "arXiv:2305.03393v1 [cs.CV] 5 May 2023", "type": "page-header", "payload": null, "name": "Page-header", "font": null}, {"prov": [{"bbox": [134.76499938964844, 645.4859008789062, 480.59735107421875, 676.1008911132812], "page": 1, "span": [0, 60], "__ref_s3_data": null}], "text": "Optimized Table Tokenization for Table Structure Recognition", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [139.34305, 591.81409, 476.01270000000005, 622.30841], "page": 1, "span": [0, 222], "__ref_s3_data": null}], "text": "Maksym Lysak [0000 \u2212 0002 \u2212 3723 \u2212 $^{6960]}$, Ahmed Nassar[0000 \u2212 0002 \u2212 9468 \u2212 $^{0822]}$, Nikolaos Livathinos [0000 \u2212 0001 \u2212 8513 \u2212 $^{3491]}$, Christoph Auer[0000 \u2212 0001 \u2212 5761 \u2212 $^{0422]}$, [0000 \u2212 0002 \u2212 8088 \u2212 0823]", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [229.52109000000002, 587.61926, 298.6087, 596.41626], "page": 1, "span": [0, 15], "__ref_s3_data": null}], "text": "and Peter Staar", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [279.1051, 566.72632, 336.25153, 574.79602], "page": 1, "span": [0, 12], "__ref_s3_data": null}], "text": "IBM Research", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [222.96609, 555.72247, 392.38983, 563.19147], "page": 1, "span": [0, 36], "__ref_s3_data": null}], "text": "{mly,ahn,nli,cau,taa}@zurich.ibm.com", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [163.11109924316406, 327.2655334472656, 452.248779296875, 521.6988525390625], "page": 1, "span": [0, 1198], "__ref_s3_data": null}], "text": "Abstract. Extracting tables from documents is a crucial task in any document conversion pipeline. Recently, transformer-based models have demonstrated that table-structure can be recognized with impressive accuracy using Image-to-Markup-Sequence (Im2Seq) approaches. Taking only the image of a table, such models predict a sequence of tokens (e.g. in HTML, LaTeX) which represent the structure of the table. Since the token representation of the table structure has a significant impact on the accuracy and run-time performance of any Im2Seq model, we investigate in this paper how table-structure representation can be optimised. We propose a new, optimised table-structure language (OTSL) with a minimized vocabulary and specific rules. The benefits of OTSL are that it reduces the number of tokens to 5 (HTML needs 28+) and shortens the sequence length to half of HTML on average. Consequently, model accuracy improves significantly, inference time is halved compared to HTML-based models, and the predicted table structures are always syntactically correct. This in turn eliminates most post-processing needs. Popular table structure data-sets will be published in OTSL format to the community.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [163.11109924316406, 294.2145080566406, 452.2415771484375, 313.3060607910156], "page": 1, "span": [0, 90], "__ref_s3_data": null}], "text": "Keywords: Table Structure Recognition \u00b7 Data Representation \u00b7 Transformers \u00b7 Optimization.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [134.76512145996094, 259.3119201660156, 228.933837890625, 269.88031005859375], "page": 1, "span": [0, 14], "__ref_s3_data": null}], "text": "1 Introduction", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [134.76512145996094, 163.18548583984375, 480.595947265625, 243.7134552001953], "page": 1, "span": [0, 500], "__ref_s3_data": null}], "text": "Tables are ubiquitous in documents such as scientific papers, patents, reports, manuals, specification sheets or marketing material. They often encode highly valuable information and therefore need to be extracted with high accuracy. Unfortunately, tables appear in documents in various sizes, styling and structure, making it difficult to recover their correct structure with simple analytical methods. Therefore, accurate table extraction is achieved these days with machine-learning based methods.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [134.76512145996094, 127.14546966552734, 480.5958251953125, 159.85244750976562], "page": 1, "span": [0, 235], "__ref_s3_data": null}], "text": "In modern document understanding systems [1,15], table extraction is typically a two-step process. Firstly, every table on a page is located with a bounding box, and secondly, their logical row and column structure is recognized. As of", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [134.76499938964844, 690.1593017578125, 139.37193298339844, 698.22900390625], "page": 2, "span": [0, 1], "__ref_s3_data": null}], "text": "2", "type": "page-header", "payload": null, "name": "Page-header", "font": null}, {"prov": [{"bbox": [167.8133544921875, 690.1593017578125, 231.72227478027344, 698.22900390625], "page": 2, "span": [0, 16], "__ref_s3_data": null}], "text": "M. Lysak, et al.", "type": "page-header", "payload": null, "name": "Page-header", "font": null}, {"prov": [{"bbox": [134.76499938964844, 591.7794189453125, 480.5918884277344, 665.6658325195312], "page": 2, "span": [0, 574], "__ref_s3_data": null}], "text": "Fig. 1. Comparison between HTML and OTSL table structure representation: (A) table-example with complex row and column headers, including a 2D empty span, (B) minimal graphical representation of table structure using rectangular layout, (C) HTML representation, (D) OTSL representation. This example demonstrates many of the key-features of OTSL, namely its reduced vocabulary size (12 versus 5 in this case), its reduced sequence length (55 versus 30) and a enhanced internal structure (variable token sequence length per row in HTML versus a fixed length of rows in OTSL).", "type": "caption", "payload": null, "name": "Caption", "font": null}, {"name": "Picture", "type": "figure", "$ref": "#/figures/0"}, {"prov": [{"bbox": [134.76499938964844, 271.1133117675781, 480.5923156738281, 339.68621826171875], "page": 2, "span": [0, 435], "__ref_s3_data": null}], "text": "today, table detection in documents is a well understood problem, and the latest state-of-the-art (SOTA) object detection methods provide an accuracy comparable to human observers [7,8,10,14,23]. On the other hand, the problem of table structure recognition (TSR) is a lot more challenging and remains a very active area of research, in which many novel machine learning algorithms are being explored [3,4,5,9,11,12,13,14,17,18,21,22].", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [134.7650146484375, 127.14530181884766, 480.5948181152344, 267.44927978515625], "page": 2, "span": [0, 911], "__ref_s3_data": null}], "text": "Recently emerging SOTA methods for table structure recognition employ transformer-based models, in which an image of the table is provided to the network in order to predict the structure of the table as a sequence of tokens. These image-to-sequence (Im2Seq) models are extremely powerful, since they allow for a purely data-driven solution. The tokens of the sequence typically belong to a markup language such as HTML, Latex or Markdown, which allow to describe table structure as rows, columns and spanning cells in various configurations. In Figure 1, we illustrate how HTML is used to represent the table-structure of a particular example table. Public table-structure data sets such as PubTabNet [22], and FinTabNet [21], which were created in a semi-automated way from paired PDF and HTML sources (e.g. PubMed Central), popularized primarily the use of HTML as ground-truth representation format for TSR.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [194.47799682617188, 690.1593017578125, 447.54290771484375, 698.22900390625], "page": 3, "span": [0, 60], "__ref_s3_data": null}], "text": "Optimized Table Tokenization for Table Structure Recognition", "type": "page-header", "payload": null, "name": "Page-header", "font": null}, {"prov": [{"bbox": [475.98431396484375, 690.1593017578125, 480.59124755859375, 698.22900390625], "page": 3, "span": [0, 1], "__ref_s3_data": null}], "text": "3", "type": "page-header", "payload": null, "name": "Page-header", "font": null}, {"prov": [{"bbox": [134.76498413085938, 580.5831298828125, 480.5918273925781, 673.0662231445312], "page": 3, "span": [0, 584], "__ref_s3_data": null}], "text": "While the majority of research in TSR is currently focused on the development and application of novel neural model architectures, the table structure representation language (e.g. HTML in PubTabNet and FinTabNet) is usually adopted as is for the sequence tokenization in Im2Seq models. In this paper, we aim for the opposite and investigate the impact of the table structure representation language with an otherwise unmodified Im2Seq transformer-based architecture. Since the current state-of-the-art Im2Seq model is TableFormer [9], we select this model to perform our experiments.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [134.76498413085938, 460.7701416015625, 480.5957336425781, 577.1641235351562], "page": 3, "span": [0, 721], "__ref_s3_data": null}], "text": "The main contribution of this paper is the introduction of a new optimised table structure language (OTSL), specifically designed to describe table-structure in an compact and structured way for Im2Seq models. OTSL has a number of key features, which make it very attractive to use in Im2Seq models. Specifically, compared to other languages such as HTML, OTSL has a minimized vocabulary which yields short sequence length, strong inherent structure (e.g. strict rectangular layout) and a strict syntax with rules that only look backwards. The latter allows for syntax validation during inference and ensures a syntactically correct table-structure. These OTSL features are illustrated in Figure 1, in comparison to HTML.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [134.76498413085938, 352.9132385253906, 480.5956726074219, 457.35211181640625], "page": 3, "span": [0, 626], "__ref_s3_data": null}], "text": "The paper is structured as follows. In section 2, we give an overview of the latest developments in table-structure reconstruction. In section 3 we review the current HTML table encoding (popularised by PubTabNet and FinTabNet) and discuss its flaws. Subsequently, we introduce OTSL in section 4, which includes the language definition, syntax rules and error-correction procedures. In section 5, we apply OTSL on the TableFormer architecture, compare it to TableFormer models trained on HTML and ultimately demonstrate the advantages of using OTSL. Finally, in section 6 we conclude our work and outline next potential steps.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [134.76498413085938, 319.3436584472656, 236.76913452148438, 329.91204833984375], "page": 3, "span": [0, 14], "__ref_s3_data": null}], "text": "2 Related Work", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [134.76498413085938, 127.14423370361328, 484.1204833984375, 303.3141784667969], "page": 3, "span": [0, 1161], "__ref_s3_data": null}], "text": "Approaches to formalize the logical structure and layout of tables in electronic documents date back more than two decades [16]. In the recent past, a wide variety of computer vision methods have been explored to tackle the problem of table structure recognition, i.e. the correct identification of columns, rows and spanning cells in a given table. Broadly speaking, the current deeplearning based approaches fall into three categories: object detection (OD) methods, Graph-Neural-Network (GNN) methods and Image-to-Markup-Sequence (Im2Seq) methods. Object-detection based methods [11,12,13,14,21] rely on tablestructure annotation using (overlapping) bounding boxes for training, and produce bounding-box predictions to define table cells, rows, and columns on a table image. Graph Neural Network (GNN) based methods [3,6,17,18], as the name suggests, represent tables as graph structures. The graph nodes represent the content of each table cell, an embedding vector from the table image, or geometric coordinates of the table cell. The edges of the graph define the relationship between the nodes, e.g. if they belong to the same column, row, or table cell.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [134.76499938964844, 690.1593017578125, 139.37193298339844, 698.22900390625], "page": 4, "span": [0, 1], "__ref_s3_data": null}], "text": "4", "type": "page-header", "payload": null, "name": "Page-header", "font": null}, {"prov": [{"bbox": [167.8133544921875, 690.1593017578125, 231.72227478027344, 698.22900390625], "page": 4, "span": [0, 16], "__ref_s3_data": null}], "text": "M. Lysak, et al.", "type": "page-header", "payload": null, "name": "Page-header", "font": null}, {"prov": [{"bbox": [134.76499938964844, 532.7620849609375, 480.59576416015625, 673.0662231445312], "page": 4, "span": [0, 939], "__ref_s3_data": null}], "text": "Other work [20] aims at predicting a grid for each table and deciding which cells must be merged using an attention network. Im2Seq methods cast the problem as a sequence generation task [4,5,9,22], and therefore need an internal tablestructure representation language, which is often implemented with standard markup languages (e.g. HTML, LaTeX, Markdown). In theory, Im2Seq methods have a natural advantage over the OD and GNN methods by virtue of directly predicting the table-structure. As such, no post-processing or rules are needed in order to obtain the table-structure, which is necessary with OD and GNN approaches. In practice, this is not entirely true, because a predicted sequence of table-structure markup does not necessarily have to be syntactically correct. Hence, depending on the quality of the predicted sequence, some post-processing needs to be performed to ensure a syntactically valid (let alone correct) sequence.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [134.76498413085938, 305.3533020019531, 480.595703125, 529.3430786132812], "page": 4, "span": [0, 1404], "__ref_s3_data": null}], "text": "Within the Im2Seq method, we find several popular models, namely the encoder-dual-decoder model (EDD) [22], TableFormer [9], Tabsplitter[2] and Ye et. al. [19]. EDD uses two consecutive long short-term memory (LSTM) decoders to predict a table in HTML representation. The tag decoder predicts a sequence of HTML tags. For each decoded table cell ( <td> ), the attention is passed to the cell decoder to predict the content with an embedded OCR approach. The latter makes it susceptible to transcription errors in the cell content of the table. TableFormer address this reliance on OCR and uses two transformer decoders for HTML structure and cell bounding box prediction in an end-to-end architecture. The predicted cell bounding box is then used to extract text tokens from an originating (digital) PDF page, circumventing any need for OCR. TabSplitter [2] proposes a compact double-matrix representation of table rows and columns to do error detection and error correction of HTML structure sequences based on predictions from [19]. This compact double-matrix representation can not be used directly by the Img2seq model training, so the model uses HTML as an intermediate form. Chi et. al. [4] introduce a data set and a baseline method using bidirectional LSTMs to predict LaTeX code. Kayal [5] introduces Gated ResNet transformers to predict LaTeX code, and a separate OCR module to extract content.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [134.76498413085938, 209.4513397216797, 480.5937805175781, 301.93426513671875], "page": 4, "span": [0, 572], "__ref_s3_data": null}], "text": "Im2Seq approaches have shown to be well-suited for the TSR task and allow a full end-to-end network design that can output the final table structure without pre- or post-processing logic. Furthermore, Im2Seq models have demonstrated to deliver state-of-the-art prediction accuracy [9]. This motivated the authors to investigate if the performance (both in accuracy and inference time) can be further improved by optimising the table structure representation language. We believe this is a necessary step before further improving neural network architectures for this task.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [134.76498413085938, 175.88177490234375, 269.6244201660156, 186.45016479492188], "page": 4, "span": [0, 19], "__ref_s3_data": null}], "text": "3 Problem Statement", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [134.76498413085938, 127.14434051513672, 480.59368896484375, 159.85231018066406], "page": 4, "span": [0, 233], "__ref_s3_data": null}], "text": "All known Im2Seq based models for TSR fundamentally work in similar ways. Given an image of a table, the Im2Seq model predicts the structure of the table by generating a sequence of tokens. These tokens originate from a finite vocab-", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [194.47799682617188, 690.1593017578125, 447.54290771484375, 698.22900390625], "page": 5, "span": [0, 60], "__ref_s3_data": null}], "text": "Optimized Table Tokenization for Table Structure Recognition", "type": "page-header", "payload": null, "name": "Page-header", "font": null}, {"prov": [{"bbox": [475.98431396484375, 690.1593017578125, 480.59124755859375, 698.22900390625], "page": 5, "span": [0, 1], "__ref_s3_data": null}], "text": "5", "type": "page-header", "payload": null, "name": "Page-header", "font": null}, {"prov": [{"bbox": [134.76499938964844, 604.4931640625, 480.5937805175781, 673.0662231445312], "page": 5, "span": [0, 422], "__ref_s3_data": null}], "text": "ulary and can be interpreted as a table structure. For example, with the HTML tokens <table> , </table> , <tr> , </tr> , <td> and </td> , one can construct simple table structures without any spanning cells. In reality though, one needs at least 28 HTML tokens to describe the most common complex tables observed in real-world documents [21,22], due to a variety of spanning cells definitions in the HTML token vocabulary.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [145.6070098876953, 562.7882080078125, 469.7522277832031, 570.9207153320312], "page": 5, "span": [0, 73], "__ref_s3_data": null}], "text": "Fig. 2. Frequency of tokens in HTML and OTSL as they appear in PubTabNet.", "type": "caption", "payload": null, "name": "Caption", "font": null}, {"name": "Picture", "type": "figure", "$ref": "#/figures/1"}, {"prov": [{"bbox": [134.76499938964844, 259.57940673828125, 480.5947570800781, 423.793212890625], "page": 5, "span": [0, 1021], "__ref_s3_data": null}], "text": "Obviously, HTML and other general-purpose markup languages were not designed for Im2Seq models. As such, they have some serious drawbacks. First, the token vocabulary needs to be artificially large in order to describe all plausible tabular structures. Since most Im2Seq models use an autoregressive approach, they generate the sequence token by token. Therefore, to reduce inference time, a shorter sequence length is critical. Every table-cell is represented by at least two tokens ( <td> and </td> ). Furthermore, when tokenizing the HTML structure, one needs to explicitly enumerate possible column-spans and row-spans as words. In practice, this ends up requiring 28 different HTML tokens (when including column- and row-spans up to 10 cells) just to describe every table in the PubTabNet dataset. Clearly, not every token is equally represented, as is depicted in Figure 2. This skewed distribution of tokens in combination with variable token row-length makes it challenging for models to learn the HTML structure.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [134.7650146484375, 211.29440307617188, 480.5928955078125, 255.95736694335938], "page": 5, "span": [0, 313], "__ref_s3_data": null}], "text": "Additionally, it would be desirable if the representation would easily allow an early detection of invalid sequences on-the-go, before the prediction of the entire table structure is completed. HTML is not well-suited for this purpose as the verification of incomplete sequences is non-trivial or even impossible.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [134.7650146484375, 127.14539337158203, 480.5947265625, 207.67337036132812], "page": 5, "span": [0, 542], "__ref_s3_data": null}], "text": "In a valid HTML table, the token sequence must describe a 2D grid of table cells, serialised in row-major ordering, where each row and each column have the same length (while considering row- and column-spans). Furthermore, every opening tag in HTML needs to be matched by a closing tag in a correct hierarchical manner. Since the number of tokens for each table row and column can vary significantly, especially for large tables with many row- and column-spans, it is complex to verify the consistency of predicted structures during sequence", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [134.76499938964844, 690.1593017578125, 139.37193298339844, 698.22900390625], "page": 6, "span": [0, 1], "__ref_s3_data": null}], "text": "6", "type": "page-header", "payload": null, "name": "Page-header", "font": null}, {"prov": [{"bbox": [167.8133544921875, 690.1593017578125, 231.72227478027344, 698.22900390625], "page": 6, "span": [0, 16], "__ref_s3_data": null}], "text": "M. Lysak, et al.", "type": "page-header", "payload": null, "name": "Page-header", "font": null}, {"prov": [{"bbox": [134.76499938964844, 652.314208984375, 480.59478759765625, 673.0662231445312], "page": 6, "span": [0, 132], "__ref_s3_data": null}], "text": "generation. Implicitly, this also means that Im2Seq models need to learn these complex syntax rules, simply to deliver valid output.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [134.76498413085938, 496.2580871582031, 480.595703125, 648.5172119140625], "page": 6, "span": [0, 977], "__ref_s3_data": null}], "text": "In practice, we observe two major issues with prediction quality when training Im2Seq models on HTML table structure generation from images. On the one hand, we find that on large tables, the visual attention of the model often starts to drift and is not accurately moving forward cell by cell anymore. This manifests itself in either in an increasing location drift for proposed table-cells in later rows on the same column or even complete loss of vertical alignment, as illustrated in Figure 5. Addressing this with post-processing is partially possible, but clearly undesired. On the other hand, we find many instances of predictions with structural inconsistencies or plain invalid HTML output, as shown in Figure 6, which are nearly impossible to properly correct. Both problems seriously impact the TSR model performance, since they reflect not only in the task of pure structure recognition but also in the equally crucial recognition or matching of table cell content.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [134.76498413085938, 460.8005065917969, 372.50848388671875, 471.368896484375], "page": 6, "span": [0, 36], "__ref_s3_data": null}], "text": "4 Optimised Table Structure Language", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [134.76498413085938, 350.400146484375, 480.5947265625, 442.8830261230469], "page": 6, "span": [0, 563], "__ref_s3_data": null}], "text": "To mitigate the issues with HTML in Im2Seq-based TSR models laid out before, we propose here our Optimised Table Structure Language (OTSL). OTSL is designed to express table structure with a minimized vocabulary and a simple set of rules, which are both significantly reduced compared to HTML. At the same time, OTSL enables easy error detection and correction during sequence generation. We further demonstrate how the compact structure representation and minimized sequence length improves prediction accuracy and inference time in the TableFormer architecture.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [134.76498413085938, 317.3211364746094, 261.80108642578125, 326.1280822753906], "page": 6, "span": [0, 23], "__ref_s3_data": null}], "text": "4.1 Language Definition", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [134.76498413085938, 270.2941589355469, 480.5887145996094, 303.0021057128906], "page": 6, "span": [0, 165], "__ref_s3_data": null}], "text": "In Figure 3, we illustrate how the OTSL is defined. In essence, the OTSL defines only 5 tokens that directly describe a tabular structure based on an atomic 2D grid.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [149.708984375, 257.701171875, 409.3113708496094, 266.4981384277344], "page": 6, "span": [0, 57], "__ref_s3_data": null}], "text": "The OTSL vocabulary is comprised of the following tokens:", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [140.99298095703125, 235.22317504882812, 460.54443359375, 244.0301055908203], "page": 6, "span": [0, 72], "__ref_s3_data": null}], "text": "- -\"C\" cell a new table cell that either has or does not have cell content", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [140.99301147460938, 210.6751708984375, 480.59393310546875, 231.43710327148438], "page": 6, "span": [0, 82], "__ref_s3_data": null}], "text": "- -\"L\" cell left-looking cell , merging with the left neighbor cell to create a span", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [140.9930419921875, 186.1261749267578, 480.58856201171875, 206.8881072998047], "page": 6, "span": [0, 81], "__ref_s3_data": null}], "text": "- -\"U\" cell up-looking cell , merging with the upper neighbor cell to create a span", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [140.9930419921875, 173.53317260742188, 454.5549621582031, 182.34010314941406], "page": 6, "span": [0, 71], "__ref_s3_data": null}], "text": "- -\"X\" cell cross cell , to merge with both left and upper neighbor cells", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [140.9930419921875, 160.93917846679688, 328.61676025390625, 169.74610900878906], "page": 6, "span": [0, 40], "__ref_s3_data": null}], "text": "- -\"NL\" new-line , switch to the next row.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [134.76504516601562, 127.14515686035156, 480.5928039550781, 147.8971405029297], "page": 6, "span": [0, 99], "__ref_s3_data": null}], "text": "A notable attribute of OTSL is that it has the capability of achieving lossless conversion to HTML.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [194.47799682617188, 690.1593017578125, 447.54290771484375, 698.22900390625], "page": 7, "span": [0, 60], "__ref_s3_data": null}], "text": "Optimized Table Tokenization for Table Structure Recognition", "type": "page-header", "payload": null, "name": "Page-header", "font": null}, {"prov": [{"bbox": [475.98431396484375, 690.1593017578125, 480.59124755859375, 698.22900390625], "page": 7, "span": [0, 1], "__ref_s3_data": null}], "text": "7", "type": "page-header", "payload": null, "name": "Page-header", "font": null}, {"prov": [{"bbox": [134.76499938964844, 636.1503295898438, 480.58740234375, 666.2008056640625], "page": 7, "span": [0, 207], "__ref_s3_data": null}], "text": "Fig. 3. OTSL description of table structure: A - table example; B - graphical representation of table structure; C - mapping structure on a grid; D - OTSL structure encoding; E - explanation on cell encoding", "type": "caption", "payload": null, "name": "Caption", "font": null}, {"name": "Picture", "type": "figure", "$ref": "#/figures/2"}, {"prov": [{"bbox": [134.76499938964844, 477.8972473144531, 246.6519775390625, 486.7041931152344], "page": 7, "span": [0, 19], "__ref_s3_data": null}], "text": "4.2 Language Syntax", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [134.76499938964844, 457.95526123046875, 363.7961730957031, 466.7522277832031], "page": 7, "span": [0, 51], "__ref_s3_data": null}], "text": "The OTSL representation follows these syntax rules:", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [138.97299194335938, 424.0662536621094, 480.5890197753906, 444.8291931152344], "page": 7, "span": [0, 108], "__ref_s3_data": null}], "text": "- 1. Left-looking cell rule : The left neighbour of an \"L\" cell must be either another \"L\" cell or a \"C\" cell.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [138.97299194335938, 400.15325927734375, 480.59228515625, 420.9151916503906], "page": 7, "span": [0, 106], "__ref_s3_data": null}], "text": "- 2. Up-looking cell rule : The upper neighbour of a \"U\" cell must be either another \"U\" cell or a \"C\" cell.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [138.97299194335938, 388.19525146484375, 226.0736083984375, 397.002197265625], "page": 7, "span": [0, 20], "__ref_s3_data": null}], "text": "3. Cross cell rule :", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [151.70098876953125, 352.3262939453125, 480.5923767089844, 385.0332336425781], "page": 7, "span": [0, 167], "__ref_s3_data": null}], "text": "- The left neighbour of an \"X\" cell must be either another \"X\" cell or a \"U\" cell, and the upper neighbour of an \"X\" cell must be either another \"X\" cell or an \"L\" cell.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [138.97299194335938, 340.3673095703125, 474.5901794433594, 349.17425537109375], "page": 7, "span": [0, 78], "__ref_s3_data": null}], "text": "- 4. First row rule : Only \"L\" cells and \"C\" cells are allowed in the first row.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [138.97299194335938, 316.4543151855469, 480.58746337890625, 337.21624755859375], "page": 7, "span": [0, 84], "__ref_s3_data": null}], "text": "- 5. First column rule : Only \"U\" cells and \"C\" cells are allowed in the first column.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [138.97299194335938, 292.5403137207031, 480.5945739746094, 313.3032531738281], "page": 7, "span": [0, 144], "__ref_s3_data": null}], "text": "- 6. Rectangular rule : The table representation is always rectangular - all rows must have an equal number of tokens, terminated with \"NL\" token.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [134.76498413085938, 151.05833435058594, 480.5958251953125, 279.40728759765625], "page": 7, "span": [0, 848], "__ref_s3_data": null}], "text": "The application of these rules gives OTSL a set of unique properties. First of all, the OTSL enforces a strictly rectangular structure representation, where every new-line token starts a new row. As a consequence, all rows and all columns have exactly the same number of tokens, irrespective of cell spans. Secondly, the OTSL representation is unambiguous: Every table structure is represented in one way. In this representation every table cell corresponds to a \"C\"-cell token, which in case of spans is always located in the top-left corner of the table cell definition. Third, OTSL syntax rules are only backward-looking. As a consequence, every predicted token can be validated straight during sequence generation by looking at the previously predicted sequence. As such, OTSL can guarantee that every predicted sequence is syntactically valid.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [134.76498413085938, 127.14533233642578, 480.5926513671875, 147.89730834960938], "page": 7, "span": [0, 153], "__ref_s3_data": null}], "text": "These characteristics can be easily learned by sequence generator networks, as we demonstrate further below. We find strong indications that this pattern", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [134.76499938964844, 690.1593017578125, 139.37193298339844, 698.22900390625], "page": 8, "span": [0, 1], "__ref_s3_data": null}], "text": "8", "type": "page-header", "payload": null, "name": "Page-header", "font": null}, {"prov": [{"bbox": [167.8133544921875, 690.1593017578125, 231.72227478027344, 698.22900390625], "page": 8, "span": [0, 16], "__ref_s3_data": null}], "text": "M. Lysak, et al.", "type": "page-header", "payload": null, "name": "Page-header", "font": null}, {"prov": [{"bbox": [134.76499938964844, 652.314208984375, 480.5888366699219, 673.0662231445312], "page": 8, "span": [0, 84], "__ref_s3_data": null}], "text": "reduces significantly the column drift seen in the HTML based models (see Figure 5).", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [134.76499938964844, 621.63623046875, 319.3470764160156, 630.4431762695312], "page": 8, "span": [0, 35], "__ref_s3_data": null}], "text": "4.3 Error-detection and -mitigation", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [134.76499938964844, 493.32415771484375, 480.59576416015625, 609.7182006835938], "page": 8, "span": [0, 797], "__ref_s3_data": null}], "text": "The design of OTSL allows to validate a table structure easily on an unfinished sequence. The detection of an invalid sequence token is a clear indication of a prediction mistake, however a valid sequence by itself does not guarantee prediction correctness. Different heuristics can be used to correct token errors in an invalid sequence and thus increase the chances for accurate predictions. Such heuristics can be applied either after the prediction of each token, or at the end on the entire predicted sequence. For example a simple heuristic which can correct the predicted OTSL sequence on-the-fly is to verify if the token with the highest prediction confidence invalidates the predicted sequence, and replace it by the token with the next highest confidence until OTSL rules are satisfied.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [134.76499938964844, 460.2676086425781, 229.03533935546875, 470.83599853515625], "page": 8, "span": [0, 13], "__ref_s3_data": null}], "text": "5 Experiments", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [134.76499938964844, 340.3122863769531, 480.59527587890625, 444.7501525878906], "page": 8, "span": [0, 684], "__ref_s3_data": null}], "text": "To evaluate the impact of OTSL on prediction accuracy and inference times, we conducted a series of experiments based on the TableFormer model (Figure 4) with two objectives: Firstly we evaluate the prediction quality and performance of OTSL vs. HTML after performing Hyper Parameter Optimization (HPO) on the canonical PubTabNet data set. Secondly we pick the best hyper-parameters found in the first step and evaluate how OTSL impacts the performance of TableFormer after training on other publicly available data sets (FinTabNet, PubTables-1M [14]). The ground truth (GT) from all data sets has been converted into OTSL format for this purpose, and will be made publicly available.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [134.7650146484375, 288.2603454589844, 480.5908203125, 307.35186767578125], "page": 8, "span": [0, 104], "__ref_s3_data": null}], "text": "Fig. 4. Architecture sketch of the TableFormer model, which is a representative for the Im2Seq approach.", "type": "caption", "payload": null, "name": "Caption", "font": null}, {"name": "Picture", "type": "figure", "$ref": "#/figures/3"}, {"prov": [{"bbox": [134.76499938964844, 127.1452407836914, 480.59173583984375, 171.80722045898438], "page": 8, "span": [0, 299], "__ref_s3_data": null}], "text": "We rely on standard metrics such as Tree Edit Distance score (TEDs) for table structure prediction, and Mean Average Precision (mAP) with 0.75 Intersection Over Union (IOU) threshold for the bounding-box predictions of table cells. The predicted OTSL structures were converted back to HTML format in", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [194.47799682617188, 690.1593017578125, 447.54290771484375, 698.22900390625], "page": 9, "span": [0, 60], "__ref_s3_data": null}], "text": "Optimized Table Tokenization for Table Structure Recognition", "type": "page-header", "payload": null, "name": "Page-header", "font": null}, {"prov": [{"bbox": [475.98431396484375, 690.1593017578125, 480.59124755859375, 698.22900390625], "page": 9, "span": [0, 1], "__ref_s3_data": null}], "text": "9", "type": "page-header", "payload": null, "name": "Page-header", "font": null}, {"prov": [{"bbox": [134.76499938964844, 640.3582153320312, 480.5957946777344, 673.0662231445312], "page": 9, "span": [0, 163], "__ref_s3_data": null}], "text": "order to compute the TED score. Inference timing results for all experiments were obtained from the same machine on a single core with AMD EPYC 7763 CPU @2.45 GHz.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [134.76499938964844, 614.0072021484375, 318.44842529296875, 622.8141479492188], "page": 9, "span": [0, 32], "__ref_s3_data": null}], "text": "5.1 Hyper Parameter Optimization", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [134.76498413085938, 537.8411254882812, 480.5927734375, 606.4141845703125], "page": 9, "span": [0, 423], "__ref_s3_data": null}], "text": "We have chosen the PubTabNet data set to perform HPO, since it includes a highly diverse set of tables. Also we report TED scores separately for simple and complex tables (tables with cell spans). Results are presented in Table. 1. It is evident that with OTSL, our model achieves the same TED score and slightly better mAP scores in comparison to HTML. However OTSL yields a 2x speed up in the inference runtime over HTML.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [134.76498413085938, 464.9591979980469, 480.59539794921875, 516.9276733398438], "page": 9, "span": [0, 398], "__ref_s3_data": null}], "text": "Table 1. HPO performed in OTSL and HTML representation on the same transformer-based TableFormer [9] architecture, trained only on PubTabNet [22]. Effects of reducing the # of layers in encoder and decoder stages of the model show that smaller models trained on OTSL perform better, especially in recognizing complex table structures, and maintain a much higher mAP score than the HTML counterpart.", "type": "caption", "payload": null, "name": "Caption", "font": null}, {"name": "Table", "type": "table", "$ref": "#/tables/0"}, {"prov": [{"bbox": [134.76499938964844, 275.041259765625, 264.4033203125, 283.84820556640625], "page": 9, "span": [0, 24], "__ref_s3_data": null}], "text": "5.2 Quantitative Results", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [134.76499938964844, 174.9652557373047, 480.59576416015625, 267.44921875], "page": 9, "span": [0, 555], "__ref_s3_data": null}], "text": "We picked the model parameter configuration that produced the best prediction quality (enc=6, dec=6, heads=8) with PubTabNet alone, then independently trained and evaluated it on three publicly available data sets: PubTabNet (395k samples), FinTabNet (113k samples) and PubTables-1M (about 1M samples). Performance results are presented in Table. 2. It is clearly evident that the model trained on OTSL outperforms HTML across the board, keeping high TEDs and mAP scores even on difficult financial tables (FinTabNet) that contain sparse and large tables.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [134.76499938964844, 127.1452407836914, 480.59576416015625, 171.80722045898438], "page": 9, "span": [0, 289], "__ref_s3_data": null}], "text": "Additionally, the results show that OTSL has an advantage over HTML when applied on a bigger data set like PubTables-1M and achieves significantly improved scores. Finally, OTSL achieves faster inference due to fewer decoding steps which is a result of the reduced sequence representation.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [134.76499938964844, 690.1593017578125, 143.97886657714844, 698.22900390625], "page": 10, "span": [0, 2], "__ref_s3_data": null}], "text": "10", "type": "page-header", "payload": null, "name": "Page-header", "font": null}, {"prov": [{"bbox": [167.82052612304688, 690.1593017578125, 231.72048950195312, 698.22900390625], "page": 10, "span": [0, 16], "__ref_s3_data": null}], "text": "M. Lysak, et al.", "type": "page-header", "payload": null, "name": "Page-header", "font": null}, {"prov": [{"bbox": [134.76499938964844, 646.1133422851562, 480.59356689453125, 676.163818359375], "page": 10, "span": [0, 192], "__ref_s3_data": null}], "text": "Table 2. TSR and cell detection results compared between OTSL and HTML on the PubTabNet [22], FinTabNet [21] and PubTables-1M [14] data sets using TableFormer [9] (with enc=6, dec=6, heads=8).", "type": "caption", "payload": null, "name": "Caption", "font": null}, {"name": "Table", "type": "table", "$ref": "#/tables/1"}, {"prov": [{"bbox": [134.76499938964844, 494.27825927734375, 257.0867919921875, 503.085205078125], "page": 10, "span": [0, 23], "__ref_s3_data": null}], "text": "5.3 Qualitative Results", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [134.76499938964844, 425.5223083496094, 480.5898132324219, 482.13922119140625], "page": 10, "span": [0, 309], "__ref_s3_data": null}], "text": "To illustrate the qualitative differences between OTSL and HTML, Figure 5 demonstrates less overlap and more accurate bounding boxes with OTSL. In Figure 6, OTSL proves to be more effective in handling tables with longer token sequences, resulting in even more precise structure prediction and bounding boxes.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [134.76499938964844, 352.2828369140625, 480.591064453125, 394.4098815917969], "page": 10, "span": [0, 270], "__ref_s3_data": null}], "text": "Fig. 5. The OTSL model produces more accurate bounding boxes with less overlap (E) than the HTML model (D), when predicting the structure of a sparse table (A), at twice the inference speed because of shorter sequence length (B),(C). \"PMC2807444_006_00.png\" PubTabNet. \u03bc", "type": "caption", "payload": null, "name": "Caption", "font": null}, {"name": "Picture", "type": "figure", "$ref": "#/figures/4"}, {"prov": [{"bbox": [227.91465759277344, 116.65360260009766, 230.10028076171875, 126.1739730834961], "page": 10, "span": [0, 1], "__ref_s3_data": null}], "text": "\u03bc", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [300.58056640625, 98.57134246826172, 302.72637939453125, 108.3780517578125], "page": 10, "span": [0, 1], "__ref_s3_data": null}], "text": "\u2265", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [194.47799682617188, 690.1593017578125, 447.54290771484375, 698.22900390625], "page": 11, "span": [0, 60], "__ref_s3_data": null}], "text": "Optimized Table Tokenization for Table Structure Recognition", "type": "page-header", "payload": null, "name": "Page-header", "font": null}, {"prov": [{"bbox": [471.3756103515625, 690.1593017578125, 480.5894775390625, 698.22900390625], "page": 11, "span": [0, 2], "__ref_s3_data": null}], "text": "11", "type": "page-header", "payload": null, "name": "Page-header", "font": null}, {"prov": [{"bbox": [134.76499938964844, 614.2323608398438, 480.58837890625, 666.2008056640625], "page": 11, "span": [0, 390], "__ref_s3_data": null}], "text": "Fig. 6. Visualization of predicted structure and detected bounding boxes on a complex table with many rows. The OTSL model (B) captured repeating pattern of horizontally merged cells from the GT (A), unlike the HTML model (C). The HTML model also didn't complete the HTML sequence correctly and displayed a lot more of drift and overlap of bounding boxes. \"PMC5406406_003_01.png\" PubTabNet.", "type": "caption", "payload": null, "name": "Caption", "font": null}, {"name": "Picture", "type": "figure", "$ref": "#/figures/5"}, {"prov": [{"bbox": [134.76499938964844, 690.1593017578125, 143.97886657714844, 698.22900390625], "page": 12, "span": [0, 2], "__ref_s3_data": null}], "text": "12", "type": "page-header", "payload": null, "name": "Page-header", "font": null}, {"prov": [{"bbox": [167.82052612304688, 690.1593017578125, 231.72048950195312, 698.22900390625], "page": 12, "span": [0, 16], "__ref_s3_data": null}], "text": "M. Lysak, et al.", "type": "page-header", "payload": null, "name": "Page-header", "font": null}, {"prov": [{"bbox": [134.76499938964844, 663.8826293945312, 219.25479125976562, 674.4510498046875], "page": 12, "span": [0, 12], "__ref_s3_data": null}], "text": "6 Conclusion", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [134.76499938964844, 588.5181884765625, 480.595703125, 645.13623046875], "page": 12, "span": [0, 330], "__ref_s3_data": null}], "text": "We demonstrated that representing tables in HTML for the task of table structure recognition with Im2Seq models is ill-suited and has serious limitations. Furthermore, we presented in this paper an Optimized Table Structure Language (OTSL) which, when compared to commonly used general purpose languages, has several key benefits.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [134.76499938964844, 468.1632080078125, 480.59478759765625, 584.5562133789062], "page": 12, "span": [0, 724], "__ref_s3_data": null}], "text": "First and foremost, given the same network configuration, inference time for a table-structure prediction is about 2 times faster compared to the conventional HTML approach. This is primarily owed to the shorter sequence length of the OTSL representation. Additional performance benefits can be obtained with HPO (hyper parameter optimization). As we demonstrate in our experiments, models trained on OTSL can be significantly smaller, e.g. by reducing the number of encoder and decoder layers, while preserving comparatively good prediction quality. This can further improve inference performance, yielding 5-6 times faster inference speed in OTSL with prediction quality comparable to models trained on HTML (see Table 1).", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [134.76499938964844, 323.8973388671875, 480.5948181152344, 464.201171875], "page": 12, "span": [0, 926], "__ref_s3_data": null}], "text": "Secondly, OTSL has more inherent structure and a significantly restricted vocabulary size. This allows autoregressive models to perform better in the TED metric, but especially with regards to prediction accuracy of the table-cell bounding boxes (see Table 2). As shown in Figure 5, we observe that the OTSL drastically reduces the drift for table cell bounding boxes at high row count and in sparse tables. This leads to more accurate predictions and a significant reduction in post-processing complexity, which is an undesired necessity in HTML-based Im2Seq models. Significant novelty lies in OTSL syntactical rules, which are few, simple and always backwards looking. Each new token can be validated only by analyzing the sequence of previous tokens, without requiring the entire sequence to detect mistakes. This in return allows to perform structural error detection and correction on-the-fly during sequence generation.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [134.76499938964844, 287.61077880859375, 197.68641662597656, 298.1791687011719], "page": 12, "span": [0, 10], "__ref_s3_data": null}], "text": "References", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [139.37100219726562, 228.12855529785156, 480.5920104980469, 269.1201477050781], "page": 12, "span": [0, 270], "__ref_s3_data": null}], "text": "- 1. Auer, C., Dolfi, M., Carvalho, A., Ramis, C.B., Staar, P.W.J.: Delivering document conversion as a cloud service with high throughput and responsiveness. CoRR abs/2206.00785 (2022). https://doi.org/10.48550/arXiv.2206.00785 , https://doi.org/10.48550/arXiv.2206.00785", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [139.3709716796875, 183.53439331054688, 480.5920104980469, 224.4811553955078], "page": 12, "span": [0, 301], "__ref_s3_data": null}], "text": "- 2. Chen, B., Peng, D., Zhang, J., Ren, Y., Jin, L.: Complex table structure recognition in the wild using transformer and identity matrix-based augmentation. In: Porwal, U., Forn\u00e9s, A., Shafait, F. (eds.) Frontiers in Handwriting Recognition. pp. 545561. Springer International Publishing, Cham (2022)", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [139.3709716796875, 160.81239318847656, 480.5873107910156, 179.84115600585938], "page": 12, "span": [0, 140], "__ref_s3_data": null}], "text": "- 3. Chi, Z., Huang, H., Xu, H.D., Yu, H., Yin, W., Mao, X.L.: Complicated table structure recognition. arXiv preprint arXiv:1908.04729 (2019)", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [139.3709716796875, 127.13239288330078, 480.5882568359375, 157.11915588378906], "page": 12, "span": [0, 204], "__ref_s3_data": null}], "text": "- 4. Deng, Y., Rosenberg, D., Mann, G.: Challenges in end-to-end neural scientific table recognition. In: 2019 International Conference on Document Analysis and Recognition (ICDAR). pp. 894-901. IEEE (2019)", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [194.47799682617188, 690.1593017578125, 447.54290771484375, 698.22900390625], "page": 13, "span": [0, 60], "__ref_s3_data": null}], "text": "Optimized Table Tokenization for Table Structure Recognition", "type": "page-header", "payload": null, "name": "Page-header", "font": null}, {"prov": [{"bbox": [471.3756103515625, 690.1593017578125, 480.5894775390625, 698.22900390625], "page": 13, "span": [0, 2], "__ref_s3_data": null}], "text": "13", "type": "page-header", "payload": null, "name": "Page-header", "font": null}, {"prov": [{"bbox": [139.37100219726562, 642.3383178710938, 480.59478759765625, 672.3259887695312], "page": 13, "span": [0, 203], "__ref_s3_data": null}], "text": "- 5. Kayal, P., Anand, M., Desai, H., Singh, M.: Tables to latex: structure and content extraction from scientific tables. International Journal on Document Analysis and Recognition (IJDAR) pp. 1-10 (2022)", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [139.37100219726562, 598.4913940429688, 480.5928649902344, 639.4380493164062], "page": 13, "span": [0, 264], "__ref_s3_data": null}], "text": "- 6. Lee, E., Kwon, J., Yang, H., Park, J., Lee, S., Koo, H.I., Cho, N.I.: Table structure recognition based on grid shape graph. In: 2022 Asia-Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC). pp. 18681873. IEEE (2022)", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [139.37100219726562, 576.5624389648438, 480.5901184082031, 595.5911254882812], "page": 13, "span": [0, 131], "__ref_s3_data": null}], "text": "- 7. Li, M., Cui, L., Huang, S., Wei, F., Zhou, M., Li, Z.: Tablebank: A benchmark dataset for table detection and recognition (2019)", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [139.37100219726562, 521.7116088867188, 480.5947265625, 573.6611328125], "page": 13, "span": [0, 345], "__ref_s3_data": null}], "text": "- 8. Livathinos, N., Berrospi, C., Lysak, M., Kuropiatnyk, V., Nassar, A., Carvalho, A., Dolfi, M., Auer, C., Dinkla, K., Staar, P.: Robust pdf document conversion using recurrent neural networks. Proceedings of the AAAI Conference on Artificial Intelligence 35 (17), 15137-15145 (May 2021), https://ojs.aaai.org/index.php/ AAAI/article/view/17777", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [139.37100219726562, 488.8674621582031, 480.5938720703125, 518.8551635742188], "page": 13, "span": [0, 234], "__ref_s3_data": null}], "text": "- 9. Nassar, A., Livathinos, N., Lysak, M., Staar, P.: Tableformer: Table structure understanding with transformers. In: Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). pp. 4614-4623 (June 2022)", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [134.76400756835938, 423.05767822265625, 480.5937194824219, 485.96722412109375], "page": 13, "span": [0, 413], "__ref_s3_data": null}], "text": "- 10. Pfitzmann, B., Auer, C., Dolfi, M., Nassar, A.S., Staar, P.W.J.: Doclaynet: A large human-annotated dataset for document-layout segmentation. In: Zhang, A., Rangwala, H. (eds.) KDD '22: The 28th ACM SIGKDD Conference on Knowledge Discovery and Data Mining, Washington, DC, USA, August 14 - 18, 2022. pp. 3743-3751. ACM (2022). https://doi.org/10.1145/3534678.3539043 , https:// doi.org/10.1145/3534678.3539043", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [134.76400756835938, 379.2555236816406, 480.59295654296875, 420.2022705078125], "page": 13, "span": [0, 295], "__ref_s3_data": null}], "text": "- 11. Prasad, D., Gadpal, A., Kapadni, K., Visave, M., Sultanpure, K.: Cascadetabnet: An approach for end to end table detection and structure recognition from imagebased documents. In: Proceedings of the IEEE/CVF conference on computer vision and pattern recognition workshops. pp. 572-573 (2020)", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [134.76400756835938, 335.4085388183594, 480.5946960449219, 376.35528564453125], "page": 13, "span": [0, 281], "__ref_s3_data": null}], "text": "- 12. Schreiber, S., Agne, S., Wolf, I., Dengel, A., Ahmed, S.: Deepdesrt: Deep learning for detection and structure recognition of tables in document images. In: 2017 14th IAPR international conference on document analysis and recognition (ICDAR). vol. 1, pp. 1162-1167. IEEE (2017)", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [134.76400756835938, 291.5167236328125, 480.5937194824219, 332.50830078125], "page": 13, "span": [0, 275], "__ref_s3_data": null}], "text": "- 13. Siddiqui, S.A., Fateh, I.A., Rizvi, S.T.R., Dengel, A., Ahmed, S.: Deeptabstr: Deep learning based table structure recognition. In: 2019 International Conference on Document Analysis and Recognition (ICDAR). pp. 1403-1409 (2019). https:// doi.org/10.1109/ICDAR.2019.00226", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [134.76400756835938, 247.7145538330078, 480.5928649902344, 288.66131591796875], "page": 13, "span": [0, 241], "__ref_s3_data": null}], "text": "- 14. Smock, B., Pesala, R., Abraham, R.: PubTables-1M: Towards comprehensive table extraction from unstructured documents. In: Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). pp. 4634-4642 (June 2022)", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [134.76400756835938, 181.90472412109375, 480.5958251953125, 244.81431579589844], "page": 13, "span": [0, 405], "__ref_s3_data": null}], "text": "- 15. Staar, P.W.J., Dolfi, M., Auer, C., Bekas, C.: Corpus conversion service: A machine learning platform to ingest documents at scale. In: Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining. pp. 774-782. KDD '18, Association for Computing Machinery, New York, NY, USA (2018). https://doi.org/10.1145/3219819.3219834 , https://doi.org/10. 1145/3219819.3219834", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [134.76400756835938, 160.0205535888672, 480.5954284667969, 179.04931640625], "page": 13, "span": [0, 96], "__ref_s3_data": null}], "text": "- 16. Wang, X.: Tabular Abstraction, Editing, and Formatting. Ph.D. thesis, CAN (1996), aAINN09397", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [134.76400756835938, 127.13255310058594, 480.5911865234375, 157.1203155517578], "page": 13, "span": [0, 195], "__ref_s3_data": null}], "text": "- 17. Xue, W., Li, Q., Tao, D.: Res2tim: Reconstruct syntactic structures from table images. In: 2019 International Conference on Document Analysis and Recognition (ICDAR). pp. 749-755. IEEE (2019)", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [134.76499938964844, 690.1593017578125, 143.97886657714844, 698.22900390625], "page": 14, "span": [0, 2], "__ref_s3_data": null}], "text": "14", "type": "page-header", "payload": null, "name": "Page-header", "font": null}, {"prov": [{"bbox": [167.82052612304688, 690.1593017578125, 231.72048950195312, 698.22900390625], "page": 14, "span": [0, 16], "__ref_s3_data": null}], "text": "M. Lysak, et al.", "type": "page-header", "payload": null, "name": "Page-header", "font": null}, {"prov": [{"bbox": [134.76499938964844, 642.3383178710938, 480.59112548828125, 672.3259887695312], "page": 14, "span": [0, 223], "__ref_s3_data": null}], "text": "- 18. Xue, W., Yu, B., Wang, W., Tao, D., Li, Q.: Tgrnet: A table graph reconstruction network for table structure recognition. In: Proceedings of the IEEE/CVF International Conference on Computer Vision. pp. 1295-1304 (2021)", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [134.76499938964844, 598.45751953125, 480.5946960449219, 639.4490356445312], "page": 14, "span": [0, 269], "__ref_s3_data": null}], "text": "- 19. Ye, J., Qi, X., He, Y., Chen, Y., Gu, D., Gao, P., Xiao, R.: Pingan-vcgroup's solution for icdar 2021 competition on scientific literature parsing task b: Table recognition to html (2021). https://doi.org/10.48550/ARXIV.2105.01848 , https://arxiv.org/abs/2105.01848", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [134.7649688720703, 576.5853881835938, 480.5935363769531, 595.6130981445312], "page": 14, "span": [0, 147], "__ref_s3_data": null}], "text": "- 20. Zhang, Z., Zhang, J., Du, J., Wang, F.: Split, embed and merge: An accurate table structure recognizer. Pattern Recognition 126 , 108565 (2022)", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [134.76495361328125, 521.74560546875, 480.5930480957031, 573.6961059570312], "page": 14, "span": [0, 329], "__ref_s3_data": null}], "text": "- 21. Zheng, X., Burdick, D., Popa, L., Zhong, X., Wang, N.X.R.: Global table extractor (gte): A framework for joint table identification and cell structure recognition using visual context. In: 2021 IEEE Winter Conference on Applications of Computer Vision (WACV). pp. 697-706 (2021). https://doi.org/10.1109/WACV48630.2021. 00074", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [134.76495361328125, 477.9544982910156, 480.5955810546875, 518.9011840820312], "page": 14, "span": [0, 259], "__ref_s3_data": null}], "text": "- 22. Zhong, X., ShafieiBavani, E., Jimeno Yepes, A.: Image-based table recognition: Data, model, and evaluation. In: Vedaldi, A., Bischof, H., Brox, T., Frahm, J.M. (eds.) Computer Vision - ECCV 2020. pp. 564-580. Springer International Publishing, Cham (2020)", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [134.76495361328125, 445.0785217285156, 480.59454345703125, 475.0652770996094], "page": 14, "span": [0, 206], "__ref_s3_data": null}], "text": "- 23. Zhong, X., Tang, J., Yepes, A.J.: Publaynet: largest dataset ever for document layout analysis. In: 2019 International Conference on Document Analysis and Recognition (ICDAR). pp. 1015-1022. IEEE (2019)", "type": "paragraph", "payload": null, "name": "List-item", "font": null}], "figures": [{"prov": [{"bbox": [148.45361328125, 366.1537780761719, 464.3608093261719, 583.625732421875], "page": 2, "span": [0, 574], "__ref_s3_data": null}], "text": "Fig. 1. Comparison between HTML and OTSL table structure representation: (A) table-example with complex row and column headers, including a 2D empty span, (B) minimal graphical representation of table structure using rectangular layout, (C) HTML representation, (D) OTSL representation. This example demonstrates many of the key-features of OTSL, namely its reduced vocabulary size (12 versus 5 in this case), its reduced sequence length (55 versus 30) and a enhanced internal structure (variable token sequence length per row in HTML versus a fixed length of rows in OTSL).", "type": "figure", "payload": null, "bounding-box": null}, {"prov": [{"bbox": [137.41452026367188, 451.7695007324219, 476.5608215332031, 558.4876708984375], "page": 5, "span": [0, 73], "__ref_s3_data": null}], "text": "Fig. 2. Frequency of tokens in HTML and OTSL as they appear in PubTabNet.", "type": "figure", "payload": null, "bounding-box": null}, {"prov": [{"bbox": [164.65028381347656, 511.6590576171875, 449.5505676269531, 628.202880859375], "page": 7, "span": [0, 207], "__ref_s3_data": null}], "text": "Fig. 3. OTSL description of table structure: A - table example; B - graphical representation of table structure; C - mapping structure on a grid; D - OTSL structure encoding; E - explanation on cell encoding", "type": "figure", "payload": null, "bounding-box": null}, {"prov": [{"bbox": [140.7096710205078, 198.32275390625, 472.73382568359375, 283.93609619140625], "page": 8, "span": [0, 104], "__ref_s3_data": null}], "text": "Fig. 4. Architecture sketch of the TableFormer model, which is a representative for the Im2Seq approach.", "type": "figure", "payload": null, "bounding-box": null}, {"prov": [{"bbox": [162.67430114746094, 128.78643798828125, 451.70062255859375, 347.37744140625], "page": 10, "span": [0, 270], "__ref_s3_data": null}], "text": "Fig. 5. The OTSL model produces more accurate bounding boxes with less overlap (E) than the HTML model (D), when predicting the structure of a sparse table (A), at twice the inference speed because of shorter sequence length (B),(C). \"PMC2807444_006_00.png\" PubTabNet. \u03bc", "type": "figure", "payload": null, "bounding-box": null}, {"prov": [{"bbox": [168.3928985595703, 157.99432373046875, 447.3513488769531, 610.0335693359375], "page": 11, "span": [0, 390], "__ref_s3_data": null}], "text": "Fig. 6. Visualization of predicted structure and detected bounding boxes on a complex table with many rows. The OTSL model (B) captured repeating pattern of horizontally merged cells from the GT (A), unlike the HTML model (C). The HTML model also didn't complete the HTML sequence correctly and displayed a lot more of drift and overlap of bounding boxes. \"PMC5406406_003_01.png\" PubTabNet.", "type": "figure", "payload": null, "bounding-box": null}], "tables": [{"prov": [{"bbox": [139.66845703125, 322.5279235839844, 475.00372314453125, 454.4252624511719], "page": 9, "span": [0, 0], "__ref_s3_data": null}], "text": "Table 1. HPO performed in OTSL and HTML representation on the same transformer-based TableFormer [9] architecture, trained only on PubTabNet [22]. Effects of reducing the # of layers in encoder and decoder stages of the model show that smaller models trained on OTSL perform better, especially in recognizing complex table structures, and maintain a much higher mAP score than the HTML counterpart.", "type": "table", "payload": null, "#-cols": 8, "#-rows": 7, "data": [[{"bbox": [160.3699951171875, 442.1952819824219, 168.0479278564453, 450.2650451660156], "spans": [[0, 0]], "text": "#", "type": "col_header", "col": 0, "col-header": true, "col-span": [0, 1], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [207.9739990234375, 442.1952819824219, 215.6519317626953, 450.2650451660156], "spans": [[0, 1]], "text": "#", "type": "col_header", "col": 1, "col-header": true, "col-span": [1, 2], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [239.79800415039062, 436.7162780761719, 278.3176574707031, 444.7860412597656], "spans": [[0, 2], [1, 2]], "text": "Language", "type": "col_header", "col": 2, "col-header": true, "col-span": [2, 3], "row": 0, "row-header": false, "row-span": [0, 2]}, {"bbox": [324.6700134277344, 442.1952819824219, 348.2641906738281, 450.2650451660156], "spans": [[0, 3], [0, 4], [0, 5]], "text": "TEDs", "type": "col_header", "col": 3, "col-header": true, "col-span": [3, 6], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [324.6700134277344, 442.1952819824219, 348.2641906738281, 450.2650451660156], "spans": [[0, 3], [0, 4], [0, 5]], "text": "TEDs", "type": "col_header", "col": 4, "col-header": true, "col-span": [3, 6], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [324.6700134277344, 442.1952819824219, 348.2641906738281, 450.2650451660156], "spans": [[0, 3], [0, 4], [0, 5]], "text": "TEDs", "type": "col_header", "col": 5, "col-header": true, "col-span": [3, 6], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [396.27099609375, 442.1952819824219, 417.1268310546875, 450.2650451660156], "spans": [[0, 6]], "text": "mAP", "type": "col_header", "col": 6, "col-header": true, "col-span": [6, 7], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [430.77099609375, 442.1952819824219, 467.1423034667969, 450.2650451660156], "spans": [[0, 7]], "text": "Inference", "type": "col_header", "col": 7, "col-header": true, "col-span": [7, 8], "row": 0, "row-header": false, "row-span": [0, 1]}], [{"bbox": [144.5919952392578, 429.2442932128906, 183.82806396484375, 437.3140563964844], "spans": [[1, 0]], "text": "enc-layers", "type": "col_header", "col": 0, "col-header": true, "col-span": [0, 1], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [192.1949920654297, 429.2442932128906, 231.43106079101562, 437.3140563964844], "spans": [[1, 1]], "text": "dec-layers", "type": "col_header", "col": 1, "col-header": true, "col-span": [1, 2], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [239.79800415039062, 436.7162780761719, 278.3176574707031, 444.7860412597656], "spans": [[0, 2], [1, 2]], "text": "Language", "type": "col_header", "col": 2, "col-header": true, "col-span": [2, 3], "row": 1, "row-header": false, "row-span": [0, 2]}, {"bbox": [286.6860046386719, 429.2442932128906, 312.3326110839844, 437.3140563964844], "spans": [[1, 3]], "text": "simple", "type": "col_header", "col": 3, "col-header": true, "col-span": [3, 4], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [320.7019958496094, 429.2442932128906, 353.7198791503906, 437.3140563964844], "spans": [[1, 4]], "text": "complex", "type": "col_header", "col": 4, "col-header": true, "col-span": [4, 5], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [369.3059997558594, 429.2442932128906, 379.03094482421875, 437.3140563964844], "spans": [[1, 5]], "text": "all", "type": "col_header", "col": 5, "col-header": true, "col-span": [5, 6], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [394.927001953125, 431.2362976074219, 418.4727783203125, 439.3060607910156], "spans": [[1, 6]], "text": "(0.75)", "type": "col_header", "col": 6, "col-header": true, "col-span": [6, 7], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [427.14801025390625, 431.2362976074219, 470.76055908203125, 439.3060607910156], "spans": [[1, 7]], "text": "time (secs)", "type": "col_header", "col": 7, "col-header": true, "col-span": [7, 8], "row": 1, "row-header": false, "row-span": [1, 2]}], [{"bbox": [161.906005859375, 410.4142761230469, 166.512939453125, 418.4840393066406], "spans": [[2, 0]], "text": "6", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [209.50900268554688, 410.4142761230469, 214.11593627929688, 418.4840393066406], "spans": [[2, 1]], "text": "6", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [245.17599487304688, 402.9422912597656, 272.9395446777344, 423.96405029296875], "spans": [[2, 2]], "text": "OTSL HTML", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [289.0169982910156, 402.9422912597656, 310.0037536621094, 423.96405029296875], "spans": [[2, 3]], "text": "0.965 0.969", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [326.7170104980469, 402.9422912597656, 347.7037658691406, 423.96405029296875], "spans": [[2, 4]], "text": "0.934 0.927", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [363.6759948730469, 402.9422912597656, 384.6627502441406, 423.96405029296875], "spans": [[2, 5]], "text": "0.955 0.955", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [396.20599365234375, 402.9422912597656, 417.1927490234375, 424.0268249511719], "spans": [[2, 6]], "text": "0.88 0.857", "type": "body", "col": 6, "col-header": false, "col-span": [6, 7], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [439.5270080566406, 402.9422912597656, 458.3842468261719, 424.0268249511719], "spans": [[2, 7]], "text": "2.73 5.39", "type": "body", "col": 7, "col-header": false, "col-span": [7, 8], "row": 2, "row-header": false, "row-span": [2, 3]}], [{"bbox": [161.906005859375, 384.11328125, 166.512939453125, 392.18304443359375], "spans": [[3, 0]], "text": "4", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [209.50900268554688, 384.11328125, 214.11593627929688, 392.18304443359375], "spans": [[3, 1]], "text": "4", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [245.17599487304688, 376.64129638671875, 272.9395446777344, 397.66204833984375], "spans": [[3, 2]], "text": "OTSL HTML", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [289.0169982910156, 376.64129638671875, 310.0037536621094, 397.66204833984375], "spans": [[3, 3]], "text": "0.938 0.952", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [326.7170104980469, 389.59228515625, 347.7037658691406, 397.66204833984375], "spans": [[3, 4]], "text": "0.904", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [363.6759948730469, 389.59228515625, 384.6627502441406, 397.66204833984375], "spans": [[3, 5]], "text": "0.927", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [394.6180114746094, 389.79852294921875, 418.77886962890625, 397.7248229980469], "spans": [[3, 6]], "text": "0.853", "type": "body", "col": 6, "col-header": false, "col-span": [6, 7], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [439.5270080566406, 389.79852294921875, 458.3842468261719, 397.7248229980469], "spans": [[3, 7]], "text": "1.97", "type": "body", "col": 7, "col-header": false, "col-span": [7, 8], "row": 3, "row-header": false, "row-span": [3, 4]}], [{"bbox": [161.906005859375, 357.8122863769531, 166.512939453125, 365.8820495605469], "spans": [[4, 0]], "text": "2", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [209.50900268554688, 357.8122863769531, 214.11593627929688, 365.8820495605469], "spans": [[4, 1]], "text": "4", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [246.7100067138672, 363.2912902832031, 271.4052734375, 371.3610534667969], "spans": [[4, 2]], "text": "OTSL", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [289.0169982910156, 350.3403015136719, 310.0037536621094, 371.3610534667969], "spans": [[4, 3]], "text": "0.923 0.945", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [326.7170104980469, 363.2912902832031, 347.7037658691406, 384.7110595703125], "spans": [[4, 4]], "text": "0.909 0.897", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [362.0880126953125, 376.8475341796875, 386.2488708496094, 384.7738342285156], "spans": [[4, 5]], "text": "0.938", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [396.20599365234375, 376.64129638671875, 417.1927490234375, 384.7110595703125], "spans": [[4, 6]], "text": "0.843", "type": "body", "col": 6, "col-header": false, "col-span": [6, 7], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [440.7669982910156, 376.64129638671875, 457.1468200683594, 384.7110595703125], "spans": [[4, 7]], "text": "3.77", "type": "body", "col": 7, "col-header": false, "col-span": [7, 8], "row": 4, "row-header": false, "row-span": [4, 5]}], [{"bbox": null, "spans": [[5, 0]], "text": "", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": null, "spans": [[5, 1]], "text": "", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [245.17599487304688, 350.3403015136719, 272.9395446777344, 358.4100646972656], "spans": [[5, 2]], "text": "HTML", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": null, "spans": [[5, 3]], "text": "", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [326.7170104980469, 350.3403015136719, 347.7037658691406, 358.4100646972656], "spans": [[5, 4]], "text": "0.901", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [362.0880126953125, 350.5465393066406, 386.2488708496094, 371.3610534667969], "spans": [[5, 5]], "text": "0.915 0.931", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [394.6180114746094, 350.3403015136719, 418.77886962890625, 371.423828125], "spans": [[5, 6]], "text": "0.859 0.834", "type": "body", "col": 6, "col-header": false, "col-span": [6, 7], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [439.5270080566406, 350.3403015136719, 458.3842468261719, 371.423828125], "spans": [[5, 7]], "text": "1.91 3.81", "type": "body", "col": 7, "col-header": false, "col-span": [7, 8], "row": 5, "row-header": false, "row-span": [5, 6]}], [{"bbox": [161.906005859375, 331.5102844238281, 166.512939453125, 339.5800476074219], "spans": [[6, 0]], "text": "4", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [209.50900268554688, 331.5102844238281, 214.11593627929688, 339.5800476074219], "spans": [[6, 1]], "text": "2", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [245.17599487304688, 324.0382995605469, 272.9395446777344, 345.06005859375], "spans": [[6, 2]], "text": "OTSL HTML", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [289.0169982910156, 324.0382995605469, 310.0037536621094, 345.06005859375], "spans": [[6, 3]], "text": "0.952 0.944", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [326.7170104980469, 324.0382995605469, 347.7037658691406, 345.06005859375], "spans": [[6, 4]], "text": "0.92 0.903", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [362.0880126953125, 324.0382995605469, 386.2488708496094, 345.1228332519531], "spans": [[6, 5]], "text": "0.942 0.931", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [394.6180114746094, 324.0382995605469, 418.77886962890625, 345.1228332519531], "spans": [[6, 6]], "text": "0.857 0.824", "type": "body", "col": 6, "col-header": false, "col-span": [6, 7], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [439.5270080566406, 324.0382995605469, 458.3842468261719, 345.1228332519531], "spans": [[6, 7]], "text": "1.22 2", "type": "body", "col": 7, "col-header": false, "col-span": [7, 8], "row": 6, "row-header": false, "row-span": [6, 7]}]], "model": null, "bounding-box": null}, {"prov": [{"bbox": [143.63763427734375, 528.737548828125, 470.8485107421875, 635.6522827148438], "page": 10, "span": [0, 0], "__ref_s3_data": null}], "text": "Table 2. TSR and cell detection results compared between OTSL and HTML on the PubTabNet [22], FinTabNet [21] and PubTables-1M [14] data sets using TableFormer [9] (with enc=6, dec=6, heads=8).", "type": "table", "payload": null, "#-cols": 7, "#-rows": 8, "data": [[{"bbox": null, "spans": [[0, 0]], "text": "", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [215.52499389648438, 617.3963012695312, 254.04464721679688, 625.4660034179688], "spans": [[0, 1], [1, 1]], "text": "Language", "type": "col_header", "col": 1, "col-header": true, "col-span": [1, 2], "row": 0, "row-header": false, "row-span": [0, 2]}, {"bbox": [300.3970031738281, 622.851318359375, 323.9911804199219, 630.9210205078125], "spans": [[0, 2], [0, 3], [0, 4]], "text": "TEDs", "type": "col_header", "col": 2, "col-header": true, "col-span": [2, 5], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [300.3970031738281, 622.851318359375, 323.9911804199219, 630.9210205078125], "spans": [[0, 2], [0, 3], [0, 4]], "text": "TEDs", "type": "col_header", "col": 3, "col-header": true, "col-span": [2, 5], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [300.3970031738281, 622.851318359375, 323.9911804199219, 630.9210205078125], "spans": [[0, 2], [0, 3], [0, 4]], "text": "TEDs", "type": "col_header", "col": 4, "col-header": true, "col-span": [2, 5], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [370.3450012207031, 617.371337890625, 414.7466125488281, 625.4410400390625], "spans": [[0, 5], [1, 5]], "text": "mAP(0.75)", "type": "col_header", "col": 5, "col-header": true, "col-span": [5, 6], "row": 0, "row-header": false, "row-span": [0, 2]}, {"bbox": [423.114013671875, 611.892333984375, 466.7265625, 630.9210205078125], "spans": [[0, 6], [1, 6]], "text": "Inference time (secs)", "type": "col_header", "col": 6, "col-header": true, "col-span": [6, 7], "row": 0, "row-header": false, "row-span": [0, 2]}], [{"bbox": null, "spans": [[1, 0]], "text": "", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [215.52499389648438, 617.3963012695312, 254.04464721679688, 625.4660034179688], "spans": [[0, 1], [1, 1]], "text": "Language", "type": "col_header", "col": 1, "col-header": true, "col-span": [1, 2], "row": 1, "row-header": false, "row-span": [0, 2]}, {"bbox": [262.4129943847656, 609.8992919921875, 288.0596008300781, 617.968994140625], "spans": [[1, 2]], "text": "simple", "type": "col_header", "col": 2, "col-header": true, "col-span": [2, 3], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [296.4289855957031, 609.8992919921875, 329.4468688964844, 617.968994140625], "spans": [[1, 3]], "text": "complex", "type": "col_header", "col": 3, "col-header": true, "col-span": [3, 4], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [345.0329895019531, 609.8992919921875, 354.7579345703125, 617.968994140625], "spans": [[1, 4]], "text": "all", "type": "col_header", "col": 4, "col-header": true, "col-span": [4, 5], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [370.3450012207031, 617.371337890625, 414.7466125488281, 625.4410400390625], "spans": [[0, 5], [1, 5]], "text": "mAP(0.75)", "type": "col_header", "col": 5, "col-header": true, "col-span": [5, 6], "row": 1, "row-header": false, "row-span": [0, 2]}, {"bbox": [423.114013671875, 611.892333984375, 466.7265625, 630.9210205078125], "spans": [[0, 6], [1, 6]], "text": "Inference time (secs)", "type": "col_header", "col": 6, "col-header": true, "col-span": [6, 7], "row": 1, "row-header": false, "row-span": [0, 2]}], [{"bbox": [154.53799438476562, 591.0703125, 201.2412872314453, 599.1400146484375], "spans": [[2, 0], [3, 0]], "text": "PubTabNet", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 2, "row-header": true, "row-span": [2, 4]}, {"bbox": [222.43699645996094, 596.54931640625, 247.13226318359375, 604.6190185546875], "spans": [[2, 1]], "text": "OTSL", "type": "row_header", "col": 1, "col-header": false, "col-span": [1, 2], "row": 2, "row-header": true, "row-span": [2, 3]}, {"bbox": [264.7439880371094, 596.54931640625, 285.7307434082031, 604.6190185546875], "spans": [[2, 2]], "text": "0.965", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [302.4440002441406, 596.54931640625, 323.4307556152344, 604.6190185546875], "spans": [[2, 3]], "text": "0.934", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [339.40301513671875, 596.54931640625, 360.3897705078125, 604.6190185546875], "spans": [[2, 4]], "text": "0.955", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [383.1159973144531, 596.7554931640625, 401.9732360839844, 604.6818237304688], "spans": [[2, 5]], "text": "0.88", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [435.4930114746094, 596.7554931640625, 454.3502502441406, 604.6818237304688], "spans": [[2, 6]], "text": "2.73", "type": "body", "col": 6, "col-header": false, "col-span": [6, 7], "row": 2, "row-header": false, "row-span": [2, 3]}], [{"bbox": [154.53799438476562, 591.0703125, 201.2412872314453, 599.1400146484375], "spans": [[2, 0], [3, 0]], "text": "PubTabNet", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 3, "row-header": true, "row-span": [2, 4]}, {"bbox": [220.9029998779297, 583.5983276367188, 248.66656494140625, 591.6680297851562], "spans": [[3, 1]], "text": "HTML", "type": "row_header", "col": 1, "col-header": false, "col-span": [1, 2], "row": 3, "row-header": true, "row-span": [3, 4]}, {"bbox": [264.7439880371094, 583.5983276367188, 285.7307434082031, 591.6680297851562], "spans": [[3, 2]], "text": "0.969", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [302.4440002441406, 583.5983276367188, 323.4307556152344, 591.6680297851562], "spans": [[3, 3]], "text": "0.927", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [339.40301513671875, 583.5983276367188, 360.3897705078125, 591.6680297851562], "spans": [[3, 4]], "text": "0.955", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [382.052001953125, 583.5983276367188, 403.03875732421875, 591.6680297851562], "spans": [[3, 5]], "text": "0.857", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [436.73199462890625, 583.5983276367188, 453.11181640625, 591.6680297851562], "spans": [[3, 6]], "text": "5.39", "type": "body", "col": 6, "col-header": false, "col-span": [6, 7], "row": 3, "row-header": false, "row-span": [3, 4]}], [{"bbox": [155.94500732421875, 564.768310546875, 199.833740234375, 572.8380126953125], "spans": [[4, 0], [5, 0]], "text": "FinTabNet", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 4, "row-header": true, "row-span": [4, 6]}, {"bbox": [222.43699645996094, 570.248291015625, 247.13226318359375, 578.3179931640625], "spans": [[4, 1]], "text": "OTSL", "type": "row_header", "col": 1, "col-header": false, "col-span": [1, 2], "row": 4, "row-header": true, "row-span": [4, 5]}, {"bbox": [264.7439880371094, 570.248291015625, 285.7307434082031, 578.3179931640625], "spans": [[4, 2]], "text": "0.955", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [302.4440002441406, 570.248291015625, 323.4307556152344, 578.3179931640625], "spans": [[4, 3]], "text": "0.961", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [337.81500244140625, 570.4544677734375, 361.9758605957031, 578.3807983398438], "spans": [[4, 4]], "text": "0.959", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [380.4639892578125, 570.4544677734375, 404.6248474121094, 578.3807983398438], "spans": [[4, 5]], "text": "0.862", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [435.4930114746094, 570.4544677734375, 454.3502502441406, 578.3807983398438], "spans": [[4, 6]], "text": "1.85", "type": "body", "col": 6, "col-header": false, "col-span": [6, 7], "row": 4, "row-header": false, "row-span": [4, 5]}], [{"bbox": [155.94500732421875, 564.768310546875, 199.833740234375, 572.8380126953125], "spans": [[4, 0], [5, 0]], "text": "FinTabNet", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 5, "row-header": true, "row-span": [4, 6]}, {"bbox": [220.9029998779297, 557.2963256835938, 248.66656494140625, 565.3660278320312], "spans": [[5, 1]], "text": "HTML", "type": "row_header", "col": 1, "col-header": false, "col-span": [1, 2], "row": 5, "row-header": true, "row-span": [5, 6]}, {"bbox": [264.7439880371094, 557.2963256835938, 285.7307434082031, 565.3660278320312], "spans": [[5, 2]], "text": "0.917", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [302.4440002441406, 557.2963256835938, 323.4307556152344, 565.3660278320312], "spans": [[5, 3]], "text": "0.922", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [341.70599365234375, 557.2963256835938, 358.0858154296875, 565.3660278320312], "spans": [[5, 4]], "text": "0.92", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [382.052001953125, 557.2963256835938, 403.03875732421875, 565.3660278320312], "spans": [[5, 5]], "text": "0.722", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [436.73199462890625, 557.2963256835938, 453.11181640625, 565.3660278320312], "spans": [[5, 6]], "text": "3.26", "type": "body", "col": 6, "col-header": false, "col-span": [6, 7], "row": 5, "row-header": false, "row-span": [5, 6]}], [{"bbox": [148.62600708007812, 538.4673461914062, 207.15240478515625, 546.5370483398438], "spans": [[6, 0], [7, 0]], "text": "PubTables-1M", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 6, "row-header": true, "row-span": [6, 8]}, {"bbox": [222.43699645996094, 543.9473266601562, 247.13226318359375, 552.0170288085938], "spans": [[6, 1]], "text": "OTSL", "type": "row_header", "col": 1, "col-header": false, "col-span": [1, 2], "row": 6, "row-header": true, "row-span": [6, 7]}, {"bbox": [264.7439880371094, 543.9473266601562, 285.7307434082031, 552.0170288085938], "spans": [[6, 2]], "text": "0.987", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [302.4440002441406, 543.9473266601562, 323.4307556152344, 552.0170288085938], "spans": [[6, 3]], "text": "0.964", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [337.81500244140625, 544.1535034179688, 361.9758605957031, 552.079833984375], "spans": [[6, 4]], "text": "0.977", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [380.4639892578125, 544.1535034179688, 404.6248474121094, 552.079833984375], "spans": [[6, 5]], "text": "0.896", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [435.4930114746094, 544.1535034179688, 454.3502502441406, 552.079833984375], "spans": [[6, 6]], "text": "1.79", "type": "body", "col": 6, "col-header": false, "col-span": [6, 7], "row": 6, "row-header": false, "row-span": [6, 7]}], [{"bbox": [148.62600708007812, 538.4673461914062, 207.15240478515625, 546.5370483398438], "spans": [[6, 0], [7, 0]], "text": "PubTables-1M", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 7, "row-header": true, "row-span": [6, 8]}, {"bbox": [220.9029998779297, 530.9953002929688, 248.66656494140625, 539.0650024414062], "spans": [[7, 1]], "text": "HTML", "type": "row_header", "col": 1, "col-header": false, "col-span": [1, 2], "row": 7, "row-header": true, "row-span": [7, 8]}, {"bbox": [264.7439880371094, 530.9953002929688, 285.7307434082031, 539.0650024414062], "spans": [[7, 2]], "text": "0.983", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 7, "row-header": false, "row-span": [7, 8]}, {"bbox": [302.4440002441406, 530.9953002929688, 323.4307556152344, 539.0650024414062], "spans": [[7, 3]], "text": "0.944", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 7, "row-header": false, "row-span": [7, 8]}, {"bbox": [339.40301513671875, 530.9953002929688, 360.3897705078125, 539.0650024414062], "spans": [[7, 4]], "text": "0.966", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 7, "row-header": false, "row-span": [7, 8]}, {"bbox": [382.052001953125, 530.9953002929688, 403.03875732421875, 539.0650024414062], "spans": [[7, 5]], "text": "0.889", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 7, "row-header": false, "row-span": [7, 8]}, {"bbox": [436.73199462890625, 530.9953002929688, 453.11181640625, 539.0650024414062], "spans": [[7, 6]], "text": "3.26", "type": "body", "col": 6, "col-header": false, "col-span": [6, 7], "row": 7, "row-header": false, "row-span": [7, 8]}]], "model": null, "bounding-box": null}], "bitmaps": null, "equations": [], "footnotes": [], "page-dimensions": [{"height": 792.0, "page": 1, "width": 612.0}, {"height": 792.0, "page": 2, "width": 612.0}, {"height": 792.0, "page": 3, "width": 612.0}, {"height": 792.0, "page": 4, "width": 612.0}, {"height": 792.0, "page": 5, "width": 612.0}, {"height": 792.0, "page": 6, "width": 612.0}, {"height": 792.0, "page": 7, "width": 612.0}, {"height": 792.0, "page": 8, "width": 612.0}, {"height": 792.0, "page": 9, "width": 612.0}, {"height": 792.0, "page": 10, "width": 612.0}, {"height": 792.0, "page": 11, "width": 612.0}, {"height": 792.0, "page": 12, "width": 612.0}, {"height": 792.0, "page": 13, "width": 612.0}, {"height": 792.0, "page": 14, "width": 612.0}], "page-footers": [], "page-headers": [], "_s3_data": null, "identifiers": null}
\ No newline at end of file
+{"_name": "", "type": "pdf-document", "description": {"title": null, "abstract": null, "authors": null, "affiliations": null, "subjects": null, "keywords": null, "publication_date": null, "languages": null, "license": null, "publishers": null, "url_refs": null, "references": null, "publication": null, "reference_count": null, "citation_count": null, "citation_date": null, "advanced": null, "analytics": null, "logs": [], "collection": null, "acquisition": null}, "file-info": {"filename": "2305.03393v1.pdf", "filename-prov": null, "document-hash": "c98927fda1ef9b66a4c3a236a65dc0cdf5c129be4122cdb58eaa3a37e3241eae", "#-pages": 14, "collection-name": null, "description": null, "page-hashes": [{"hash": "f09df98501fbcd8a2b359e4686187b56b7d82f3eb312cbbb23f61661691ecbf9", "model": "default", "page": 1}, {"hash": "6d26558563949e376cdb8dcb12a7288ec12d4c513de04616238aadcd15255d28", "model": "default", "page": 2}, {"hash": "4ef8043e938e362a06bc7f88f0b02df95d95cbfc891f544b7f88a448e53fb689", "model": "default", "page": 3}, {"hash": "8b755c3cd938ebf88bf14db6103c999794b0ca0c6f591f47a0c902b111159fe6", "model": "default", "page": 4}, {"hash": "95582f3138775a800969e873ad2e4eafca4f1d1de7b9b14ad826bbe8a17fe302", "model": "default", "page": 5}, {"hash": "619ab9fe3258434818f86df106cb76ed1fc8ab9800cbd91444098e91f7e67d8b", "model": "default", "page": 6}, {"hash": "c02e90eed528fcb71d0657183903b3e2035b86e3e750fb579f8c1f1e09aa132d", "model": "default", "page": 7}, {"hash": "b56262de55611de4494b0ed5011ce9567fada7c99bf53c5ff6c689ad9f941730", "model": "default", "page": 8}, {"hash": "680962e4a1193f15a591c82e1be59c0ff4cc78a066aeaaccad41f9262c67197b", "model": "default", "page": 9}, {"hash": "37dca86674661a5845a3bbd2fabb4a497cf2b5fc4908fd28dd63296c4fbee075", "model": "default", "page": 10}, {"hash": "0e3c057d1d7e6b359d73d4a44597879b2d421097da9aeb18ea581b32666ce740", "model": "default", "page": 11}, {"hash": "ec343c5522af29f238bde237ca655cdc018c5db20fb099c15ce8bc5045ce8593", "model": "default", "page": 12}, {"hash": "4ffa1d69b1366de506ca77c25a021790c3c150791fc830d6f4c85c3846efe6a9", "model": "default", "page": 13}, {"hash": "9fd62e0449eaf680e49767b4c512d8172cd3586480344318dc7e1cb0964b4d18", "model": "default", "page": 14}]}, "main-text": [{"prov": [{"bbox": [134.765, 645.4859, 480.59735, 676.10089], "page": 1, "span": [0, 60], "__ref_s3_data": null}], "text": "Optimized Table Tokenization for Table Structure Recognition", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [139.34305, 591.81409, 476.01270000000005, 622.30841], "page": 1, "span": [0, 222], "__ref_s3_data": null}], "text": "Maksym Lysak [0000 \u2212 0002 \u2212 3723 \u2212 $^{6960]}$, Ahmed Nassar[0000 \u2212 0002 \u2212 9468 \u2212 $^{0822]}$, Nikolaos Livathinos [0000 \u2212 0001 \u2212 8513 \u2212 $^{3491]}$, Christoph Auer[0000 \u2212 0001 \u2212 5761 \u2212 $^{0422]}$, [0000 \u2212 0002 \u2212 8088 \u2212 0823]", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [229.52109000000002, 587.61926, 298.6087, 596.41626], "page": 1, "span": [0, 15], "__ref_s3_data": null}], "text": "and Peter Staar", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [279.1051, 566.72632, 336.25153, 574.79602], "page": 1, "span": [0, 12], "__ref_s3_data": null}], "text": "IBM Research", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [222.96609, 555.72247, 392.38983, 563.19147], "page": 1, "span": [0, 36], "__ref_s3_data": null}], "text": "{mly,ahn,nli,cau,taa}@zurich.ibm.com", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [163.1111, 327.26553, 452.24878000000007, 521.69885], "page": 1, "span": [0, 1198], "__ref_s3_data": null}], "text": "Abstract. Extracting tables from documents is a crucial task in any document conversion pipeline. Recently, transformer-based models have demonstrated that table-structure can be recognized with impressive accuracy using Image-to-Markup-Sequence (Im2Seq) approaches. Taking only the image of a table, such models predict a sequence of tokens (e.g. in HTML, LaTeX) which represent the structure of the table. Since the token representation of the table structure has a significant impact on the accuracy and run-time performance of any Im2Seq model, we investigate in this paper how table-structure representation can be optimised. We propose a new, optimised table-structure language (OTSL) with a minimized vocabulary and specific rules. The benefits of OTSL are that it reduces the number of tokens to 5 (HTML needs 28+) and shortens the sequence length to half of HTML on average. Consequently, model accuracy improves significantly, inference time is halved compared to HTML-based models, and the predicted table structures are always syntactically correct. This in turn eliminates most post-processing needs. Popular table structure data-sets will be published in OTSL format to the community.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [163.1111, 294.21451, 452.24158, 313.30606], "page": 1, "span": [0, 90], "__ref_s3_data": null}], "text": "Keywords: Table Structure Recognition \u00b7 Data Representation \u00b7 Transformers \u00b7 Optimization.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [134.76512, 259.31192, 228.93384, 269.88031], "page": 1, "span": [0, 14], "__ref_s3_data": null}], "text": "1 Introduction", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [134.76512, 163.18548999999996, 480.5959500000001, 243.71345999999994], "page": 1, "span": [0, 500], "__ref_s3_data": null}], "text": "Tables are ubiquitous in documents such as scientific papers, patents, reports, manuals, specification sheets or marketing material. They often encode highly valuable information and therefore need to be extracted with high accuracy. Unfortunately, tables appear in documents in various sizes, styling and structure, making it difficult to recover their correct structure with simple analytical methods. Therefore, accurate table extraction is achieved these days with machine-learning based methods.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [134.76512, 127.14547000000005, 480.59583, 159.85244999999998], "page": 1, "span": [0, 235], "__ref_s3_data": null}], "text": "In modern document understanding systems [1,15], table extraction is typically a two-step process. Firstly, every table on a page is located with a bounding box, and secondly, their logical row and column structure is recognized. As of", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"name": "Picture", "type": "figure", "$ref": "#/figures/0"}, {"prov": [{"bbox": [134.765, 271.11330999999996, 480.59232000000003, 339.68622], "page": 2, "span": [0, 435], "__ref_s3_data": null}], "text": "today, table detection in documents is a well understood problem, and the latest state-of-the-art (SOTA) object detection methods provide an accuracy comparable to human observers [7,8,10,14,23]. On the other hand, the problem of table structure recognition (TSR) is a lot more challenging and remains a very active area of research, in which many novel machine learning algorithms are being explored [3,4,5,9,11,12,13,14,17,18,21,22].", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [134.76501, 127.14530000000002, 480.59482, 267.44928000000004], "page": 2, "span": [0, 911], "__ref_s3_data": null}], "text": "Recently emerging SOTA methods for table structure recognition employ transformer-based models, in which an image of the table is provided to the network in order to predict the structure of the table as a sequence of tokens. These image-to-sequence (Im2Seq) models are extremely powerful, since they allow for a purely data-driven solution. The tokens of the sequence typically belong to a markup language such as HTML, Latex or Markdown, which allow to describe table structure as rows, columns and spanning cells in various configurations. In Figure 1, we illustrate how HTML is used to represent the table-structure of a particular example table. Public table-structure data sets such as PubTabNet [22], and FinTabNet [21], which were created in a semi-automated way from paired PDF and HTML sources (e.g. PubMed Central), popularized primarily the use of HTML as ground-truth representation format for TSR.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [134.76498, 580.58313, 480.59183, 673.06622], "page": 3, "span": [0, 584], "__ref_s3_data": null}], "text": "While the majority of research in TSR is currently focused on the development and application of novel neural model architectures, the table structure representation language (e.g. HTML in PubTabNet and FinTabNet) is usually adopted as is for the sequence tokenization in Im2Seq models. In this paper, we aim for the opposite and investigate the impact of the table structure representation language with an otherwise unmodified Im2Seq transformer-based architecture. Since the current state-of-the-art Im2Seq model is TableFormer [9], we select this model to perform our experiments.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [134.76498, 460.77014, 480.59572999999995, 577.16412], "page": 3, "span": [0, 721], "__ref_s3_data": null}], "text": "The main contribution of this paper is the introduction of a new optimised table structure language (OTSL), specifically designed to describe table-structure in an compact and structured way for Im2Seq models. OTSL has a number of key features, which make it very attractive to use in Im2Seq models. Specifically, compared to other languages such as HTML, OTSL has a minimized vocabulary which yields short sequence length, strong inherent structure (e.g. strict rectangular layout) and a strict syntax with rules that only look backwards. The latter allows for syntax validation during inference and ensures a syntactically correct table-structure. These OTSL features are illustrated in Figure 1, in comparison to HTML.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [134.76498, 352.91324, 480.59567, 457.35211], "page": 3, "span": [0, 626], "__ref_s3_data": null}], "text": "The paper is structured as follows. In section 2, we give an overview of the latest developments in table-structure reconstruction. In section 3 we review the current HTML table encoding (popularised by PubTabNet and FinTabNet) and discuss its flaws. Subsequently, we introduce OTSL in section 4, which includes the language definition, syntax rules and error-correction procedures. In section 5, we apply OTSL on the TableFormer architecture, compare it to TableFormer models trained on HTML and ultimately demonstrate the advantages of using OTSL. Finally, in section 6 we conclude our work and outline next potential steps.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [134.76498, 319.34366, 236.76912999999996, 329.91205], "page": 3, "span": [0, 14], "__ref_s3_data": null}], "text": "2 Related Work", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [134.76498, 127.14423, 484.12047999999993, 303.31418], "page": 3, "span": [0, 1161], "__ref_s3_data": null}], "text": "Approaches to formalize the logical structure and layout of tables in electronic documents date back more than two decades [16]. In the recent past, a wide variety of computer vision methods have been explored to tackle the problem of table structure recognition, i.e. the correct identification of columns, rows and spanning cells in a given table. Broadly speaking, the current deeplearning based approaches fall into three categories: object detection (OD) methods, Graph-Neural-Network (GNN) methods and Image-to-Markup-Sequence (Im2Seq) methods. Object-detection based methods [11,12,13,14,21] rely on tablestructure annotation using (overlapping) bounding boxes for training, and produce bounding-box predictions to define table cells, rows, and columns on a table image. Graph Neural Network (GNN) based methods [3,6,17,18], as the name suggests, represent tables as graph structures. The graph nodes represent the content of each table cell, an embedding vector from the table image, or geometric coordinates of the table cell. The edges of the graph define the relationship between the nodes, e.g. if they belong to the same column, row, or table cell.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [134.765, 532.76208, 480.5957599999999, 673.06622], "page": 4, "span": [0, 939], "__ref_s3_data": null}], "text": "Other work [20] aims at predicting a grid for each table and deciding which cells must be merged using an attention network. Im2Seq methods cast the problem as a sequence generation task [4,5,9,22], and therefore need an internal tablestructure representation language, which is often implemented with standard markup languages (e.g. HTML, LaTeX, Markdown). In theory, Im2Seq methods have a natural advantage over the OD and GNN methods by virtue of directly predicting the table-structure. As such, no post-processing or rules are needed in order to obtain the table-structure, which is necessary with OD and GNN approaches. In practice, this is not entirely true, because a predicted sequence of table-structure markup does not necessarily have to be syntactically correct. Hence, depending on the quality of the predicted sequence, some post-processing needs to be performed to ensure a syntactically valid (let alone correct) sequence.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [134.76498, 305.3533, 480.59569999999997, 529.34308], "page": 4, "span": [0, 1404], "__ref_s3_data": null}], "text": "Within the Im2Seq method, we find several popular models, namely the encoder-dual-decoder model (EDD) [22], TableFormer [9], Tabsplitter[2] and Ye et. al. [19]. EDD uses two consecutive long short-term memory (LSTM) decoders to predict a table in HTML representation. The tag decoder predicts a sequence of HTML tags. For each decoded table cell ( <td> ), the attention is passed to the cell decoder to predict the content with an embedded OCR approach. The latter makes it susceptible to transcription errors in the cell content of the table. TableFormer address this reliance on OCR and uses two transformer decoders for HTML structure and cell bounding box prediction in an end-to-end architecture. The predicted cell bounding box is then used to extract text tokens from an originating (digital) PDF page, circumventing any need for OCR. TabSplitter [2] proposes a compact double-matrix representation of table rows and columns to do error detection and error correction of HTML structure sequences based on predictions from [19]. This compact double-matrix representation can not be used directly by the Img2seq model training, so the model uses HTML as an intermediate form. Chi et. al. [4] introduce a data set and a baseline method using bidirectional LSTMs to predict LaTeX code. Kayal [5] introduces Gated ResNet transformers to predict LaTeX code, and a separate OCR module to extract content.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [134.76498, 209.45133999999996, 480.59378, 301.93427], "page": 4, "span": [0, 572], "__ref_s3_data": null}], "text": "Im2Seq approaches have shown to be well-suited for the TSR task and allow a full end-to-end network design that can output the final table structure without pre- or post-processing logic. Furthermore, Im2Seq models have demonstrated to deliver state-of-the-art prediction accuracy [9]. This motivated the authors to investigate if the performance (both in accuracy and inference time) can be further improved by optimising the table structure representation language. We believe this is a necessary step before further improving neural network architectures for this task.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [134.76498, 175.88176999999996, 269.62442, 186.45015999999998], "page": 4, "span": [0, 19], "__ref_s3_data": null}], "text": "3 Problem Statement", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [134.76498, 127.14434000000006, 480.5936899999999, 159.85231], "page": 4, "span": [0, 233], "__ref_s3_data": null}], "text": "All known Im2Seq based models for TSR fundamentally work in similar ways. Given an image of a table, the Im2Seq model predicts the structure of the table by generating a sequence of tokens. These tokens originate from a finite vocab-", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [134.765, 604.49316, 480.59378, 673.06622], "page": 5, "span": [0, 422], "__ref_s3_data": null}], "text": "ulary and can be interpreted as a table structure. For example, with the HTML tokens <table> , </table> , <tr> , </tr> , <td> and </td> , one can construct simple table structures without any spanning cells. In reality though, one needs at least 28 HTML tokens to describe the most common complex tables observed in real-world documents [21,22], due to a variety of spanning cells definitions in the HTML token vocabulary.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"name": "Picture", "type": "figure", "$ref": "#/figures/1"}, {"prov": [{"bbox": [134.765, 259.57941000000005, 480.59476, 423.79321], "page": 5, "span": [0, 1021], "__ref_s3_data": null}], "text": "Obviously, HTML and other general-purpose markup languages were not designed for Im2Seq models. As such, they have some serious drawbacks. First, the token vocabulary needs to be artificially large in order to describe all plausible tabular structures. Since most Im2Seq models use an autoregressive approach, they generate the sequence token by token. Therefore, to reduce inference time, a shorter sequence length is critical. Every table-cell is represented by at least two tokens ( <td> and </td> ). Furthermore, when tokenizing the HTML structure, one needs to explicitly enumerate possible column-spans and row-spans as words. In practice, this ends up requiring 28 different HTML tokens (when including column- and row-spans up to 10 cells) just to describe every table in the PubTabNet dataset. Clearly, not every token is equally represented, as is depicted in Figure 2. This skewed distribution of tokens in combination with variable token row-length makes it challenging for models to learn the HTML structure.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [134.76501, 211.2944, 480.59289999999993, 255.95736999999997], "page": 5, "span": [0, 313], "__ref_s3_data": null}], "text": "Additionally, it would be desirable if the representation would easily allow an early detection of invalid sequences on-the-go, before the prediction of the entire table structure is completed. HTML is not well-suited for this purpose as the verification of incomplete sequences is non-trivial or even impossible.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [134.76501, 127.14539000000002, 480.59473, 207.67336999999998], "page": 5, "span": [0, 542], "__ref_s3_data": null}], "text": "In a valid HTML table, the token sequence must describe a 2D grid of table cells, serialised in row-major ordering, where each row and each column have the same length (while considering row- and column-spans). Furthermore, every opening tag in HTML needs to be matched by a closing tag in a correct hierarchical manner. Since the number of tokens for each table row and column can vary significantly, especially for large tables with many row- and column-spans, it is complex to verify the consistency of predicted structures during sequence", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [134.765, 652.31421, 480.59479, 673.06622], "page": 6, "span": [0, 132], "__ref_s3_data": null}], "text": "generation. Implicitly, this also means that Im2Seq models need to learn these complex syntax rules, simply to deliver valid output.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [134.76498, 496.25809, 480.59569999999997, 648.51721], "page": 6, "span": [0, 977], "__ref_s3_data": null}], "text": "In practice, we observe two major issues with prediction quality when training Im2Seq models on HTML table structure generation from images. On the one hand, we find that on large tables, the visual attention of the model often starts to drift and is not accurately moving forward cell by cell anymore. This manifests itself in either in an increasing location drift for proposed table-cells in later rows on the same column or even complete loss of vertical alignment, as illustrated in Figure 5. Addressing this with post-processing is partially possible, but clearly undesired. On the other hand, we find many instances of predictions with structural inconsistencies or plain invalid HTML output, as shown in Figure 6, which are nearly impossible to properly correct. Both problems seriously impact the TSR model performance, since they reflect not only in the task of pure structure recognition but also in the equally crucial recognition or matching of table cell content.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [134.76498, 460.80051, 372.50848, 471.3689], "page": 6, "span": [0, 36], "__ref_s3_data": null}], "text": "4 Optimised Table Structure Language", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [134.76498, 350.40015, 480.59473, 442.88303], "page": 6, "span": [0, 563], "__ref_s3_data": null}], "text": "To mitigate the issues with HTML in Im2Seq-based TSR models laid out before, we propose here our Optimised Table Structure Language (OTSL). OTSL is designed to express table structure with a minimized vocabulary and a simple set of rules, which are both significantly reduced compared to HTML. At the same time, OTSL enables easy error detection and correction during sequence generation. We further demonstrate how the compact structure representation and minimized sequence length improves prediction accuracy and inference time in the TableFormer architecture.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [134.76498, 317.32114, 261.80109, 326.12808], "page": 6, "span": [0, 23], "__ref_s3_data": null}], "text": "4.1 Language Definition", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [134.76498, 270.2941599999999, 480.58871, 303.00211], "page": 6, "span": [0, 165], "__ref_s3_data": null}], "text": "In Figure 3, we illustrate how the OTSL is defined. In essence, the OTSL defines only 5 tokens that directly describe a tabular structure based on an atomic 2D grid.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [149.70898, 257.70117000000005, 409.31137, 266.4981399999999], "page": 6, "span": [0, 57], "__ref_s3_data": null}], "text": "The OTSL vocabulary is comprised of the following tokens:", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [140.99298, 235.22317999999996, 460.54443, 244.03011000000004], "page": 6, "span": [0, 72], "__ref_s3_data": null}], "text": "- -\"C\" cell a new table cell that either has or does not have cell content", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [140.99301, 210.67516999999998, 480.59392999999994, 231.4371], "page": 6, "span": [0, 82], "__ref_s3_data": null}], "text": "- -\"L\" cell left-looking cell , merging with the left neighbor cell to create a span", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [140.99304, 186.12617, 480.58856, 206.88810999999998], "page": 6, "span": [0, 81], "__ref_s3_data": null}], "text": "- -\"U\" cell up-looking cell , merging with the upper neighbor cell to create a span", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [140.99304, 173.53317000000004, 454.55496, 182.3401], "page": 6, "span": [0, 71], "__ref_s3_data": null}], "text": "- -\"X\" cell cross cell , to merge with both left and upper neighbor cells", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [140.99304, 160.93917999999996, 328.61676, 169.74610999999993], "page": 6, "span": [0, 40], "__ref_s3_data": null}], "text": "- -\"NL\" new-line , switch to the next row.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [134.76505, 127.14516000000003, 480.59280000000007, 147.89714000000004], "page": 6, "span": [0, 99], "__ref_s3_data": null}], "text": "A notable attribute of OTSL is that it has the capability of achieving lossless conversion to HTML.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"name": "Picture", "type": "figure", "$ref": "#/figures/2"}, {"prov": [{"bbox": [134.765, 477.89725, 246.65197999999998, 486.70419], "page": 7, "span": [0, 19], "__ref_s3_data": null}], "text": "4.2 Language Syntax", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [134.765, 457.95526, 363.79617, 466.75223], "page": 7, "span": [0, 51], "__ref_s3_data": null}], "text": "The OTSL representation follows these syntax rules:", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [138.97299, 424.06625, 480.58902, 444.82919], "page": 7, "span": [0, 108], "__ref_s3_data": null}], "text": "- 1. Left-looking cell rule : The left neighbour of an \"L\" cell must be either another \"L\" cell or a \"C\" cell.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [138.97299, 400.15326000000005, 480.59229000000005, 420.91519], "page": 7, "span": [0, 106], "__ref_s3_data": null}], "text": "- 2. Up-looking cell rule : The upper neighbour of a \"U\" cell must be either another \"U\" cell or a \"C\" cell.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [138.97299, 388.19525, 226.07360999999997, 397.00219999999996], "page": 7, "span": [0, 20], "__ref_s3_data": null}], "text": "3. Cross cell rule :", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [151.70099, 352.32629, 480.59238, 385.03323], "page": 7, "span": [0, 167], "__ref_s3_data": null}], "text": "- The left neighbour of an \"X\" cell must be either another \"X\" cell or a \"U\" cell, and the upper neighbour of an \"X\" cell must be either another \"X\" cell or an \"L\" cell.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [138.97299, 340.36731, 474.59018, 349.17426], "page": 7, "span": [0, 78], "__ref_s3_data": null}], "text": "- 4. First row rule : Only \"L\" cells and \"C\" cells are allowed in the first row.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [138.97299, 316.45432, 480.58746, 337.21625], "page": 7, "span": [0, 84], "__ref_s3_data": null}], "text": "- 5. First column rule : Only \"U\" cells and \"C\" cells are allowed in the first column.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [138.97299, 292.54031, 480.59457, 313.30325], "page": 7, "span": [0, 144], "__ref_s3_data": null}], "text": "- 6. Rectangular rule : The table representation is always rectangular - all rows must have an equal number of tokens, terminated with \"NL\" token.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [134.76498, 151.05833000000007, 480.59583, 279.40729], "page": 7, "span": [0, 848], "__ref_s3_data": null}], "text": "The application of these rules gives OTSL a set of unique properties. First of all, the OTSL enforces a strictly rectangular structure representation, where every new-line token starts a new row. As a consequence, all rows and all columns have exactly the same number of tokens, irrespective of cell spans. Secondly, the OTSL representation is unambiguous: Every table structure is represented in one way. In this representation every table cell corresponds to a \"C\"-cell token, which in case of spans is always located in the top-left corner of the table cell definition. Third, OTSL syntax rules are only backward-looking. As a consequence, every predicted token can be validated straight during sequence generation by looking at the previously predicted sequence. As such, OTSL can guarantee that every predicted sequence is syntactically valid.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [134.76498, 127.14533000000006, 480.59265, 147.89731000000006], "page": 7, "span": [0, 153], "__ref_s3_data": null}], "text": "These characteristics can be easily learned by sequence generator networks, as we demonstrate further below. We find strong indications that this pattern", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [134.765, 652.31421, 480.58884000000006, 673.06622], "page": 8, "span": [0, 84], "__ref_s3_data": null}], "text": "reduces significantly the column drift seen in the HTML based models (see Figure 5).", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [134.765, 621.63623, 319.34708, 630.44318], "page": 8, "span": [0, 35], "__ref_s3_data": null}], "text": "4.3 Error-detection and -mitigation", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [134.765, 493.32416, 480.5957599999999, 609.7182], "page": 8, "span": [0, 797], "__ref_s3_data": null}], "text": "The design of OTSL allows to validate a table structure easily on an unfinished sequence. The detection of an invalid sequence token is a clear indication of a prediction mistake, however a valid sequence by itself does not guarantee prediction correctness. Different heuristics can be used to correct token errors in an invalid sequence and thus increase the chances for accurate predictions. Such heuristics can be applied either after the prediction of each token, or at the end on the entire predicted sequence. For example a simple heuristic which can correct the predicted OTSL sequence on-the-fly is to verify if the token with the highest prediction confidence invalidates the predicted sequence, and replace it by the token with the next highest confidence until OTSL rules are satisfied.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [134.765, 460.26760999999993, 229.03534, 470.836], "page": 8, "span": [0, 13], "__ref_s3_data": null}], "text": "5 Experiments", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [134.765, 340.3122900000001, 480.59528, 444.75015], "page": 8, "span": [0, 684], "__ref_s3_data": null}], "text": "To evaluate the impact of OTSL on prediction accuracy and inference times, we conducted a series of experiments based on the TableFormer model (Figure 4) with two objectives: Firstly we evaluate the prediction quality and performance of OTSL vs. HTML after performing Hyper Parameter Optimization (HPO) on the canonical PubTabNet data set. Secondly we pick the best hyper-parameters found in the first step and evaluate how OTSL impacts the performance of TableFormer after training on other publicly available data sets (FinTabNet, PubTables-1M [14]). The ground truth (GT) from all data sets has been converted into OTSL format for this purpose, and will be made publicly available.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"name": "Picture", "type": "figure", "$ref": "#/figures/3"}, {"prov": [{"bbox": [134.765, 127.14524000000006, 480.5917400000001, 171.80722000000003], "page": 8, "span": [0, 299], "__ref_s3_data": null}], "text": "We rely on standard metrics such as Tree Edit Distance score (TEDs) for table structure prediction, and Mean Average Precision (mAP) with 0.75 Intersection Over Union (IOU) threshold for the bounding-box predictions of table cells. The predicted OTSL structures were converted back to HTML format in", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [134.765, 640.35822, 480.59579, 673.06622], "page": 9, "span": [0, 163], "__ref_s3_data": null}], "text": "order to compute the TED score. Inference timing results for all experiments were obtained from the same machine on a single core with AMD EPYC 7763 CPU @2.45 GHz.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [134.765, 614.0072, 318.44843, 622.81415], "page": 9, "span": [0, 32], "__ref_s3_data": null}], "text": "5.1 Hyper Parameter Optimization", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [134.76498, 537.84113, 480.59277, 606.41418], "page": 9, "span": [0, 423], "__ref_s3_data": null}], "text": "We have chosen the PubTabNet data set to perform HPO, since it includes a highly diverse set of tables. Also we report TED scores separately for simple and complex tables (tables with cell spans). Results are presented in Table. 1. It is evident that with OTSL, our model achieves the same TED score and slightly better mAP scores in comparison to HTML. However OTSL yields a 2x speed up in the inference runtime over HTML.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"name": "Table", "type": "table", "$ref": "#/tables/0"}, {"prov": [{"bbox": [134.76498, 464.9592, 480.5954, 516.92767], "page": 9, "span": [0, 398], "__ref_s3_data": null}], "text": "Table 1. HPO performed in OTSL and HTML representation on the same transformer-based TableFormer [9] architecture, trained only on PubTabNet [22]. Effects of reducing the # of layers in encoder and decoder stages of the model show that smaller models trained on OTSL perform better, especially in recognizing complex table structures, and maintain a much higher mAP score than the HTML counterpart.", "type": "caption", "payload": null, "name": "Caption", "font": null}, {"prov": [{"bbox": [134.765, 275.04125999999997, 264.40332, 283.84821], "page": 9, "span": [0, 24], "__ref_s3_data": null}], "text": "5.2 Quantitative Results", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [134.765, 174.96525999999994, 480.5957599999999, 267.44921999999997], "page": 9, "span": [0, 555], "__ref_s3_data": null}], "text": "We picked the model parameter configuration that produced the best prediction quality (enc=6, dec=6, heads=8) with PubTabNet alone, then independently trained and evaluated it on three publicly available data sets: PubTabNet (395k samples), FinTabNet (113k samples) and PubTables-1M (about 1M samples). Performance results are presented in Table. 2. It is clearly evident that the model trained on OTSL outperforms HTML across the board, keeping high TEDs and mAP scores even on difficult financial tables (FinTabNet) that contain sparse and large tables.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [134.765, 127.14524000000006, 480.5957599999999, 171.80722000000003], "page": 9, "span": [0, 289], "__ref_s3_data": null}], "text": "Additionally, the results show that OTSL has an advantage over HTML when applied on a bigger data set like PubTables-1M and achieves significantly improved scores. Finally, OTSL achieves faster inference due to fewer decoding steps which is a result of the reduced sequence representation.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"name": "Table", "type": "table", "$ref": "#/tables/1"}, {"prov": [{"bbox": [134.765, 646.11334, 480.59357000000006, 676.16382], "page": 10, "span": [0, 192], "__ref_s3_data": null}], "text": "Table 2. TSR and cell detection results compared between OTSL and HTML on the PubTabNet [22], FinTabNet [21] and PubTables-1M [14] data sets using TableFormer [9] (with enc=6, dec=6, heads=8).", "type": "caption", "payload": null, "name": "Caption", "font": null}, {"prov": [{"bbox": [134.765, 494.27826000000005, 257.08679, 503.08521], "page": 10, "span": [0, 23], "__ref_s3_data": null}], "text": "5.3 Qualitative Results", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [134.765, 425.52231, 480.58981, 482.13922], "page": 10, "span": [0, 309], "__ref_s3_data": null}], "text": "To illustrate the qualitative differences between OTSL and HTML, Figure 5 demonstrates less overlap and more accurate bounding boxes with OTSL. In Figure 6, OTSL proves to be more effective in handling tables with longer token sequences, resulting in even more precise structure prediction and bounding boxes.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"name": "Picture", "type": "figure", "$ref": "#/figures/4"}, {"prov": [{"bbox": [227.91466, 116.65359999999998, 230.10028, 126.17397000000005], "page": 10, "span": [0, 1], "__ref_s3_data": null}], "text": "\u03bc", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [300.58057, 98.57134199999996, 302.72638, 108.37805000000003], "page": 10, "span": [0, 1], "__ref_s3_data": null}], "text": "\u2265", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"name": "Picture", "type": "figure", "$ref": "#/figures/5"}, {"prov": [{"bbox": [134.765, 663.88263, 219.25478999999999, 674.4510500000001], "page": 12, "span": [0, 12], "__ref_s3_data": null}], "text": "6 Conclusion", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [134.765, 588.51819, 480.59569999999997, 645.13623], "page": 12, "span": [0, 330], "__ref_s3_data": null}], "text": "We demonstrated that representing tables in HTML for the task of table structure recognition with Im2Seq models is ill-suited and has serious limitations. Furthermore, we presented in this paper an Optimized Table Structure Language (OTSL) which, when compared to commonly used general purpose languages, has several key benefits.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [134.765, 468.16321, 480.59479, 584.55621], "page": 12, "span": [0, 724], "__ref_s3_data": null}], "text": "First and foremost, given the same network configuration, inference time for a table-structure prediction is about 2 times faster compared to the conventional HTML approach. This is primarily owed to the shorter sequence length of the OTSL representation. Additional performance benefits can be obtained with HPO (hyper parameter optimization). As we demonstrate in our experiments, models trained on OTSL can be significantly smaller, e.g. by reducing the number of encoder and decoder layers, while preserving comparatively good prediction quality. This can further improve inference performance, yielding 5-6 times faster inference speed in OTSL with prediction quality comparable to models trained on HTML (see Table 1).", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [134.765, 323.89734, 480.59482, 464.20117], "page": 12, "span": [0, 926], "__ref_s3_data": null}], "text": "Secondly, OTSL has more inherent structure and a significantly restricted vocabulary size. This allows autoregressive models to perform better in the TED metric, but especially with regards to prediction accuracy of the table-cell bounding boxes (see Table 2). As shown in Figure 5, we observe that the OTSL drastically reduces the drift for table cell bounding boxes at high row count and in sparse tables. This leads to more accurate predictions and a significant reduction in post-processing complexity, which is an undesired necessity in HTML-based Im2Seq models. Significant novelty lies in OTSL syntactical rules, which are few, simple and always backwards looking. Each new token can be validated only by analyzing the sequence of previous tokens, without requiring the entire sequence to detect mistakes. This in return allows to perform structural error detection and correction on-the-fly during sequence generation.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [134.765, 287.61078, 197.68642, 298.17917], "page": 12, "span": [0, 10], "__ref_s3_data": null}], "text": "References", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [139.371, 228.12856, 480.5920100000001, 269.12014999999997], "page": 12, "span": [0, 270], "__ref_s3_data": null}], "text": "- 1. Auer, C., Dolfi, M., Carvalho, A., Ramis, C.B., Staar, P.W.J.: Delivering document conversion as a cloud service with high throughput and responsiveness. CoRR abs/2206.00785 (2022). https://doi.org/10.48550/arXiv.2206.00785 , https://doi.org/10.48550/arXiv.2206.00785", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [139.37097, 183.53439000000003, 480.5920100000001, 224.48116000000005], "page": 12, "span": [0, 301], "__ref_s3_data": null}], "text": "- 2. Chen, B., Peng, D., Zhang, J., Ren, Y., Jin, L.: Complex table structure recognition in the wild using transformer and identity matrix-based augmentation. In: Porwal, U., Forn\u00e9s, A., Shafait, F. (eds.) Frontiers in Handwriting Recognition. pp. 545561. Springer International Publishing, Cham (2022)", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [139.37097, 160.81239000000005, 480.58731000000006, 179.84116000000006], "page": 12, "span": [0, 140], "__ref_s3_data": null}], "text": "- 3. Chi, Z., Huang, H., Xu, H.D., Yu, H., Yin, W., Mao, X.L.: Complicated table structure recognition. arXiv preprint arXiv:1908.04729 (2019)", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [139.37097, 127.13238999999999, 480.58826, 157.11915999999997], "page": 12, "span": [0, 204], "__ref_s3_data": null}], "text": "- 4. Deng, Y., Rosenberg, D., Mann, G.: Challenges in end-to-end neural scientific table recognition. In: 2019 International Conference on Document Analysis and Recognition (ICDAR). pp. 894-901. IEEE (2019)", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [139.371, 642.33832, 480.59479, 672.32599], "page": 13, "span": [0, 203], "__ref_s3_data": null}], "text": "- 5. Kayal, P., Anand, M., Desai, H., Singh, M.: Tables to latex: structure and content extraction from scientific tables. International Journal on Document Analysis and Recognition (IJDAR) pp. 1-10 (2022)", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [139.371, 598.49139, 480.59286000000003, 639.43805], "page": 13, "span": [0, 264], "__ref_s3_data": null}], "text": "- 6. Lee, E., Kwon, J., Yang, H., Park, J., Lee, S., Koo, H.I., Cho, N.I.: Table structure recognition based on grid shape graph. In: 2022 Asia-Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC). pp. 18681873. IEEE (2022)", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [139.371, 576.56244, 480.59012, 595.59113], "page": 13, "span": [0, 131], "__ref_s3_data": null}], "text": "- 7. Li, M., Cui, L., Huang, S., Wei, F., Zhou, M., Li, Z.: Tablebank: A benchmark dataset for table detection and recognition (2019)", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [139.371, 521.71161, 480.59473, 573.66113], "page": 13, "span": [0, 345], "__ref_s3_data": null}], "text": "- 8. Livathinos, N., Berrospi, C., Lysak, M., Kuropiatnyk, V., Nassar, A., Carvalho, A., Dolfi, M., Auer, C., Dinkla, K., Staar, P.: Robust pdf document conversion using recurrent neural networks. Proceedings of the AAAI Conference on Artificial Intelligence 35 (17), 15137-15145 (May 2021), https://ojs.aaai.org/index.php/ AAAI/article/view/17777", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [139.371, 488.86746, 480.59387000000004, 518.85516], "page": 13, "span": [0, 234], "__ref_s3_data": null}], "text": "- 9. Nassar, A., Livathinos, N., Lysak, M., Staar, P.: Tableformer: Table structure understanding with transformers. In: Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). pp. 4614-4623 (June 2022)", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [134.76401, 423.05768, 480.59372, 485.96722000000005], "page": 13, "span": [0, 413], "__ref_s3_data": null}], "text": "- 10. Pfitzmann, B., Auer, C., Dolfi, M., Nassar, A.S., Staar, P.W.J.: Doclaynet: A large human-annotated dataset for document-layout segmentation. In: Zhang, A., Rangwala, H. (eds.) KDD '22: The 28th ACM SIGKDD Conference on Knowledge Discovery and Data Mining, Washington, DC, USA, August 14 - 18, 2022. pp. 3743-3751. ACM (2022). https://doi.org/10.1145/3534678.3539043 , https:// doi.org/10.1145/3534678.3539043", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [134.76401, 379.25552, 480.59296, 420.20227], "page": 13, "span": [0, 295], "__ref_s3_data": null}], "text": "- 11. Prasad, D., Gadpal, A., Kapadni, K., Visave, M., Sultanpure, K.: Cascadetabnet: An approach for end to end table detection and structure recognition from imagebased documents. In: Proceedings of the IEEE/CVF conference on computer vision and pattern recognition workshops. pp. 572-573 (2020)", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [134.76401, 335.40854, 480.59469999999993, 376.35529], "page": 13, "span": [0, 281], "__ref_s3_data": null}], "text": "- 12. Schreiber, S., Agne, S., Wolf, I., Dengel, A., Ahmed, S.: Deepdesrt: Deep learning for detection and structure recognition of tables in document images. In: 2017 14th IAPR international conference on document analysis and recognition (ICDAR). vol. 1, pp. 1162-1167. IEEE (2017)", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [134.76401, 291.51672, 480.59372, 332.5083], "page": 13, "span": [0, 275], "__ref_s3_data": null}], "text": "- 13. Siddiqui, S.A., Fateh, I.A., Rizvi, S.T.R., Dengel, A., Ahmed, S.: Deeptabstr: Deep learning based table structure recognition. In: 2019 International Conference on Document Analysis and Recognition (ICDAR). pp. 1403-1409 (2019). https:// doi.org/10.1109/ICDAR.2019.00226", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [134.76401, 247.71455000000003, 480.59286000000003, 288.66132], "page": 13, "span": [0, 241], "__ref_s3_data": null}], "text": "- 14. Smock, B., Pesala, R., Abraham, R.: PubTables-1M: Towards comprehensive table extraction from unstructured documents. In: Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). pp. 4634-4642 (June 2022)", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [134.76401, 181.90472, 480.59583, 244.81431999999995], "page": 13, "span": [0, 405], "__ref_s3_data": null}], "text": "- 15. Staar, P.W.J., Dolfi, M., Auer, C., Bekas, C.: Corpus conversion service: A machine learning platform to ingest documents at scale. In: Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining. pp. 774-782. KDD '18, Association for Computing Machinery, New York, NY, USA (2018). https://doi.org/10.1145/3219819.3219834 , https://doi.org/10. 1145/3219819.3219834", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [134.76401, 160.02054999999996, 480.59542999999996, 179.04931999999997], "page": 13, "span": [0, 96], "__ref_s3_data": null}], "text": "- 16. Wang, X.: Tabular Abstraction, Editing, and Formatting. Ph.D. thesis, CAN (1996), aAINN09397", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [134.76401, 127.13255000000004, 480.59119, 157.12032], "page": 13, "span": [0, 195], "__ref_s3_data": null}], "text": "- 17. Xue, W., Li, Q., Tao, D.: Res2tim: Reconstruct syntactic structures from table images. In: 2019 International Conference on Document Analysis and Recognition (ICDAR). pp. 749-755. IEEE (2019)", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [134.765, 642.33832, 480.59113, 672.32599], "page": 14, "span": [0, 223], "__ref_s3_data": null}], "text": "- 18. Xue, W., Yu, B., Wang, W., Tao, D., Li, Q.: Tgrnet: A table graph reconstruction network for table structure recognition. In: Proceedings of the IEEE/CVF International Conference on Computer Vision. pp. 1295-1304 (2021)", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [134.765, 598.45752, 480.59469999999993, 639.44904], "page": 14, "span": [0, 269], "__ref_s3_data": null}], "text": "- 19. Ye, J., Qi, X., He, Y., Chen, Y., Gu, D., Gao, P., Xiao, R.: Pingan-vcgroup's solution for icdar 2021 competition on scientific literature parsing task b: Table recognition to html (2021). https://doi.org/10.48550/ARXIV.2105.01848 , https://arxiv.org/abs/2105.01848", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [134.76497, 576.58539, 480.5935400000001, 595.6131], "page": 14, "span": [0, 147], "__ref_s3_data": null}], "text": "- 20. Zhang, Z., Zhang, J., Du, J., Wang, F.: Split, embed and merge: An accurate table structure recognizer. Pattern Recognition 126 , 108565 (2022)", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [134.76495, 521.74561, 480.59305000000006, 573.69611], "page": 14, "span": [0, 329], "__ref_s3_data": null}], "text": "- 21. Zheng, X., Burdick, D., Popa, L., Zhong, X., Wang, N.X.R.: Global table extractor (gte): A framework for joint table identification and cell structure recognition using visual context. In: 2021 IEEE Winter Conference on Applications of Computer Vision (WACV). pp. 697-706 (2021). https://doi.org/10.1109/WACV48630.2021. 00074", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [134.76495, 477.9545, 480.59558, 518.90118], "page": 14, "span": [0, 259], "__ref_s3_data": null}], "text": "- 22. Zhong, X., ShafieiBavani, E., Jimeno Yepes, A.: Image-based table recognition: Data, model, and evaluation. In: Vedaldi, A., Bischof, H., Brox, T., Frahm, J.M. (eds.) Computer Vision - ECCV 2020. pp. 564-580. Springer International Publishing, Cham (2020)", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [134.76495, 445.07852, 480.59454, 475.06528], "page": 14, "span": [0, 206], "__ref_s3_data": null}], "text": "- 23. Zhong, X., Tang, J., Yepes, A.J.: Publaynet: largest dataset ever for document layout analysis. In: 2019 International Conference on Document Analysis and Recognition (ICDAR). pp. 1015-1022. IEEE (2019)", "type": "paragraph", "payload": null, "name": "List-item", "font": null}], "figures": [{"prov": [{"bbox": [148.45364379882812, 366.1537780761719, 464.3608093261719, 583.6257629394531], "page": 2, "span": [0, 574], "__ref_s3_data": null}], "text": "Fig. 1. Comparison between HTML and OTSL table structure representation: (A) table-example with complex row and column headers, including a 2D empty span, (B) minimal graphical representation of table structure using rectangular layout, (C) HTML representation, (D) OTSL representation. This example demonstrates many of the key-features of OTSL, namely its reduced vocabulary size (12 versus 5 in this case), its reduced sequence length (55 versus 30) and a enhanced internal structure (variable token sequence length per row in HTML versus a fixed length of rows in OTSL).", "type": "figure", "payload": null, "bounding-box": null}, {"prov": [{"bbox": [137.41448974609375, 451.7695007324219, 476.5608215332031, 558.4876861572266], "page": 5, "span": [0, 73], "__ref_s3_data": null}], "text": "Fig. 2. Frequency of tokens in HTML and OTSL as they appear in PubTabNet.", "type": "figure", "payload": null, "bounding-box": null}, {"prov": [{"bbox": [164.65028381347656, 511.6590576171875, 449.5505676269531, 628.2029113769531], "page": 7, "span": [0, 207], "__ref_s3_data": null}], "text": "Fig. 3. OTSL description of table structure: A - table example; B - graphical representation of table structure; C - mapping structure on a grid; D - OTSL structure encoding; E - explanation on cell encoding", "type": "figure", "payload": null, "bounding-box": null}, {"prov": [{"bbox": [140.70968627929688, 198.32281494140625, 472.73382568359375, 283.9361572265625], "page": 8, "span": [0, 104], "__ref_s3_data": null}], "text": "Fig. 4. Architecture sketch of the TableFormer model, which is a representative for the Im2Seq approach.", "type": "figure", "payload": null, "bounding-box": null}, {"prov": [{"bbox": [162.67430114746094, 128.78643798828125, 451.70062255859375, 347.37744140625], "page": 10, "span": [0, 270], "__ref_s3_data": null}], "text": "Fig. 5. The OTSL model produces more accurate bounding boxes with less overlap (E) than the HTML model (D), when predicting the structure of a sparse table (A), at twice the inference speed because of shorter sequence length (B),(C). \"PMC2807444_006_00.png\" PubTabNet. \u03bc", "type": "figure", "payload": null, "bounding-box": null}, {"prov": [{"bbox": [168.39285278320312, 157.99432373046875, 447.35137939453125, 610.0334930419922], "page": 11, "span": [0, 390], "__ref_s3_data": null}], "text": "Fig. 6. Visualization of predicted structure and detected bounding boxes on a complex table with many rows. The OTSL model (B) captured repeating pattern of horizontally merged cells from the GT (A), unlike the HTML model (C). The HTML model also didn't complete the HTML sequence correctly and displayed a lot more of drift and overlap of bounding boxes. \"PMC5406406_003_01.png\" PubTabNet.", "type": "figure", "payload": null, "bounding-box": null}], "tables": [{"prov": [{"bbox": [139.66845703125, 322.5278625488281, 475.00372314453125, 454.4252014160156], "page": 9, "span": [0, 0], "__ref_s3_data": null}], "text": "Table 1. HPO performed in OTSL and HTML representation on the same transformer-based TableFormer [9] architecture, trained only on PubTabNet [22]. Effects of reducing the # of layers in encoder and decoder stages of the model show that smaller models trained on OTSL perform better, especially in recognizing complex table structures, and maintain a much higher mAP score than the HTML counterpart.", "type": "table", "payload": null, "#-cols": 8, "#-rows": 7, "data": [[{"bbox": [160.37, 341.73495, 168.04793, 349.8047199999999], "spans": [[0, 0]], "text": "#", "type": "col_header", "col": 0, "col-header": true, "col-span": [0, 1], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [207.974, 341.73495, 215.65193, 349.8047199999999], "spans": [[0, 1]], "text": "#", "type": "col_header", "col": 1, "col-header": true, "col-span": [1, 2], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [239.79799999999997, 347.21396, 278.31766, 355.28372], "spans": [[0, 2], [1, 2]], "text": "Language", "type": "col_header", "col": 2, "col-header": true, "col-span": [2, 3], "row": 0, "row-header": false, "row-span": [0, 2]}, {"bbox": [324.67001, 341.73495, 348.26419, 349.8047199999999], "spans": [[0, 3], [0, 4], [0, 5]], "text": "TEDs", "type": "col_header", "col": 3, "col-header": true, "col-span": [3, 6], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [324.67001, 341.73495, 348.26419, 349.8047199999999], "spans": [[0, 3], [0, 4], [0, 5]], "text": "TEDs", "type": "col_header", "col": 4, "col-header": true, "col-span": [3, 6], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [324.67001, 341.73495, 348.26419, 349.8047199999999], "spans": [[0, 3], [0, 4], [0, 5]], "text": "TEDs", "type": "col_header", "col": 5, "col-header": true, "col-span": [3, 6], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [396.271, 341.73495, 417.12683, 349.8047199999999], "spans": [[0, 6]], "text": "mAP", "type": "col_header", "col": 6, "col-header": true, "col-span": [6, 7], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [430.771, 341.73495, 467.1423, 349.8047199999999], "spans": [[0, 7]], "text": "Inference", "type": "col_header", "col": 7, "col-header": true, "col-span": [7, 8], "row": 0, "row-header": false, "row-span": [0, 1]}], [{"bbox": [144.592, 354.68594, 183.82806, 362.75570999999997], "spans": [[1, 0]], "text": "enc-layers", "type": "col_header", "col": 0, "col-header": true, "col-span": [0, 1], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [192.19499, 354.68594, 231.43106, 362.75570999999997], "spans": [[1, 1]], "text": "dec-layers", "type": "col_header", "col": 1, "col-header": true, "col-span": [1, 2], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [239.79799999999997, 347.21396, 278.31766, 355.28372], "spans": [[0, 2], [1, 2]], "text": "Language", "type": "col_header", "col": 2, "col-header": true, "col-span": [2, 3], "row": 1, "row-header": false, "row-span": [0, 2]}, {"bbox": [286.686, 354.68594, 312.33261, 362.75570999999997], "spans": [[1, 3]], "text": "simple", "type": "col_header", "col": 3, "col-header": true, "col-span": [3, 4], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [320.702, 354.68594, 353.71988, 362.75570999999997], "spans": [[1, 4]], "text": "complex", "type": "col_header", "col": 4, "col-header": true, "col-span": [4, 5], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [369.306, 354.68594, 379.03094, 362.75570999999997], "spans": [[1, 5]], "text": "all", "type": "col_header", "col": 5, "col-header": true, "col-span": [5, 6], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [394.927, 352.69394000000005, 418.47278, 360.7637], "spans": [[1, 6]], "text": "(0.75)", "type": "col_header", "col": 6, "col-header": true, "col-span": [6, 7], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [427.14801, 352.69394000000005, 470.76056, 360.7637], "spans": [[1, 7]], "text": "time (secs)", "type": "col_header", "col": 7, "col-header": true, "col-span": [7, 8], "row": 1, "row-header": false, "row-span": [1, 2]}], [{"bbox": [161.90601, 373.51596, 166.51294, 381.58572], "spans": [[2, 0]], "text": "6", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [209.509, 373.51596, 214.11594, 381.58572], "spans": [[2, 1]], "text": "6", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [245.17598999999998, 368.03595, 272.93954, 389.05771], "spans": [[2, 2]], "text": "OTSL HTML", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [289.017, 368.03595, 310.00375, 389.05771], "spans": [[2, 3]], "text": "0.965 0.969", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [326.71701, 368.03595, 347.70377, 389.05771], "spans": [[2, 4]], "text": "0.934 0.927", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [363.67599, 368.03595, 384.66275, 389.05771], "spans": [[2, 5]], "text": "0.955 0.955", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [396.20599, 367.97317999999996, 417.19275, 389.05771], "spans": [[2, 6]], "text": "0.88 0.857", "type": "body", "col": 6, "col-header": false, "col-span": [6, 7], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [439.52701, 367.97317999999996, 458.38425, 389.05771], "spans": [[2, 7]], "text": "2.73 5.39", "type": "body", "col": 7, "col-header": false, "col-span": [7, 8], "row": 2, "row-header": false, "row-span": [2, 3]}], [{"bbox": [161.90601, 399.81696, 166.51294, 407.88672], "spans": [[3, 0]], "text": "4", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [209.509, 399.81696, 214.11594, 407.88672], "spans": [[3, 1]], "text": "4", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [245.17598999999998, 394.33795, 272.93954, 415.3587], "spans": [[3, 2]], "text": "OTSL HTML", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [289.017, 394.33795, 310.00375, 415.3587], "spans": [[3, 3]], "text": "0.938 0.952", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [326.71701, 394.33795, 347.70377, 402.40771], "spans": [[3, 4]], "text": "0.904", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [363.67599, 394.33795, 384.66275, 402.40771], "spans": [[3, 5]], "text": "0.927", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [394.61801, 394.27518, 418.77887, 402.20148], "spans": [[3, 6]], "text": "0.853", "type": "body", "col": 6, "col-header": false, "col-span": [6, 7], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [439.52701, 394.27518, 458.38425, 402.20148], "spans": [[3, 7]], "text": "1.97", "type": "body", "col": 7, "col-header": false, "col-span": [7, 8], "row": 3, "row-header": false, "row-span": [3, 4]}], [{"bbox": [161.90601, 426.11795, 166.51294, 434.1877099999999], "spans": [[4, 0]], "text": "2", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [209.509, 426.11795, 214.11594, 434.1877099999999], "spans": [[4, 1]], "text": "4", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [246.71000999999998, 420.63895, 271.40527, 428.70871], "spans": [[4, 2]], "text": "OTSL", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [289.017, 420.63895, 310.00375, 441.6597], "spans": [[4, 3]], "text": "0.923 0.945", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [326.71701, 407.28894, 347.70377, 428.70871], "spans": [[4, 4]], "text": "0.909 0.897", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [362.08801, 407.22617, 386.24887, 415.15247], "spans": [[4, 5]], "text": "0.938", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [396.20599, 407.28894, 417.19275, 415.3587], "spans": [[4, 6]], "text": "0.843", "type": "body", "col": 6, "col-header": false, "col-span": [6, 7], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [440.767, 407.28894, 457.14682, 415.3587], "spans": [[4, 7]], "text": "3.77", "type": "body", "col": 7, "col-header": false, "col-span": [7, 8], "row": 4, "row-header": false, "row-span": [4, 5]}], [{"bbox": null, "spans": [[5, 0]], "text": "", "type": "body"}, {"bbox": null, "spans": [[5, 1]], "text": "", "type": "body"}, {"bbox": [245.17598999999998, 433.58994, 272.93954, 441.6597], "spans": [[5, 2]], "text": "HTML", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": null, "spans": [[5, 3]], "text": "", "type": "body"}, {"bbox": [326.71701, 433.58994, 347.70377, 441.6597], "spans": [[5, 4]], "text": "0.901", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [362.08801, 420.63895, 386.24887, 441.45346], "spans": [[5, 5]], "text": "0.915 0.931", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [394.61801, 420.57617, 418.77887, 441.6597], "spans": [[5, 6]], "text": "0.859 0.834", "type": "body", "col": 6, "col-header": false, "col-span": [6, 7], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [439.52701, 420.57617, 458.38425, 441.6597], "spans": [[5, 7]], "text": "1.91 3.81", "type": "body", "col": 7, "col-header": false, "col-span": [7, 8], "row": 5, "row-header": false, "row-span": [5, 6]}], [{"bbox": [161.90601, 452.41995, 166.51294, 460.48972], "spans": [[6, 0]], "text": "4", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [209.509, 452.41995, 214.11594, 460.48972], "spans": [[6, 1]], "text": "2", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [245.17598999999998, 446.9399399999999, 272.93954, 467.9617], "spans": [[6, 2]], "text": "OTSL HTML", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [289.017, 446.9399399999999, 310.00375, 467.9617], "spans": [[6, 3]], "text": "0.952 0.944", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [326.71701, 446.9399399999999, 347.70377, 467.9617], "spans": [[6, 4]], "text": "0.92 0.903", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [362.08801, 446.87717, 386.24887, 467.9617], "spans": [[6, 5]], "text": "0.942 0.931", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [394.61801, 446.87717, 418.77887, 467.9617], "spans": [[6, 6]], "text": "0.857 0.824", "type": "body", "col": 6, "col-header": false, "col-span": [6, 7], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [439.52701, 446.87717, 458.38425, 467.9617], "spans": [[6, 7]], "text": "1.22 2", "type": "body", "col": 7, "col-header": false, "col-span": [7, 8], "row": 6, "row-header": false, "row-span": [6, 7]}]], "model": null, "bounding-box": null}, {"prov": [{"bbox": [143.6376495361328, 528.7375183105469, 470.8485412597656, 635.6522979736328], "page": 10, "span": [0, 0], "__ref_s3_data": null}], "text": "Table 2. TSR and cell detection results compared between OTSL and HTML on the PubTabNet [22], FinTabNet [21] and PubTables-1M [14] data sets using TableFormer [9] (with enc=6, dec=6, heads=8).", "type": "table", "payload": null, "#-cols": 7, "#-rows": 8, "data": [[{"bbox": null, "spans": [[0, 0]], "text": "", "type": "body"}, {"bbox": [215.52499000000003, 166.534, 254.04465, 174.6037], "spans": [[0, 1], [1, 1]], "text": "Language", "type": "col_header", "col": 1, "col-header": true, "col-span": [1, 2], "row": 0, "row-header": false, "row-span": [0, 2]}, {"bbox": [300.397, 161.07898, 323.99118, 169.14868], "spans": [[0, 2], [0, 3], [0, 4]], "text": "TEDs", "type": "col_header", "col": 2, "col-header": true, "col-span": [2, 5], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [300.397, 161.07898, 323.99118, 169.14868], "spans": [[0, 2], [0, 3], [0, 4]], "text": "TEDs", "type": "col_header", "col": 3, "col-header": true, "col-span": [2, 5], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [300.397, 161.07898, 323.99118, 169.14868], "spans": [[0, 2], [0, 3], [0, 4]], "text": "TEDs", "type": "col_header", "col": 4, "col-header": true, "col-span": [2, 5], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [370.345, 166.55895999999996, 414.74661, 174.62865999999997], "spans": [[0, 5], [1, 5]], "text": "mAP(0.75)", "type": "col_header", "col": 5, "col-header": true, "col-span": [5, 6], "row": 0, "row-header": false, "row-span": [0, 2]}, {"bbox": [423.11401, 161.07898, 466.72656, 180.10766999999998], "spans": [[0, 6], [1, 6]], "text": "Inference time (secs)", "type": "col_header", "col": 6, "col-header": true, "col-span": [6, 7], "row": 0, "row-header": false, "row-span": [0, 2]}], [{"bbox": null, "spans": [[1, 0]], "text": "", "type": "body"}, {"bbox": [215.52499000000003, 166.534, 254.04465, 174.6037], "spans": [[0, 1], [1, 1]], "text": "Language", "type": "col_header", "col": 1, "col-header": true, "col-span": [1, 2], "row": 1, "row-header": false, "row-span": [0, 2]}, {"bbox": [262.41299, 174.03101000000004, 288.0596, 182.10071000000005], "spans": [[1, 2]], "text": "simple", "type": "col_header", "col": 2, "col-header": true, "col-span": [2, 3], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [296.42899, 174.03101000000004, 329.44687, 182.10071000000005], "spans": [[1, 3]], "text": "complex", "type": "col_header", "col": 3, "col-header": true, "col-span": [3, 4], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [345.03299, 174.03101000000004, 354.75793, 182.10071000000005], "spans": [[1, 4]], "text": "all", "type": "col_header", "col": 4, "col-header": true, "col-span": [4, 5], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [370.345, 166.55895999999996, 414.74661, 174.62865999999997], "spans": [[0, 5], [1, 5]], "text": "mAP(0.75)", "type": "col_header", "col": 5, "col-header": true, "col-span": [5, 6], "row": 1, "row-header": false, "row-span": [0, 2]}, {"bbox": [423.11401, 161.07898, 466.72656, 180.10766999999998], "spans": [[0, 6], [1, 6]], "text": "Inference time (secs)", "type": "col_header", "col": 6, "col-header": true, "col-span": [6, 7], "row": 1, "row-header": false, "row-span": [0, 2]}], [{"bbox": [154.53799, 192.85999000000004, 201.24129, 200.92969000000005], "spans": [[2, 0], [3, 0]], "text": "PubTabNet", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 2, "row-header": true, "row-span": [2, 4]}, {"bbox": [222.43700000000004, 187.38098000000002, 247.13226000000003, 195.45068000000003], "spans": [[2, 1]], "text": "OTSL", "type": "row_header", "col": 1, "col-header": false, "col-span": [1, 2], "row": 2, "row-header": true, "row-span": [2, 3]}, {"bbox": [264.74399, 187.38098000000002, 285.73074, 195.45068000000003], "spans": [[2, 2]], "text": "0.965", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [302.444, 187.38098000000002, 323.43076, 195.45068000000003], "spans": [[2, 3]], "text": "0.934", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [339.40302, 187.38098000000002, 360.38977, 195.45068000000003], "spans": [[2, 4]], "text": "0.955", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [383.116, 187.31817999999998, 401.97324, 195.24451], "spans": [[2, 5]], "text": "0.88", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [435.49300999999997, 187.31817999999998, 454.35025, 195.24451], "spans": [[2, 6]], "text": "2.73", "type": "body", "col": 6, "col-header": false, "col-span": [6, 7], "row": 2, "row-header": false, "row-span": [2, 3]}], [{"bbox": [154.53799, 192.85999000000004, 201.24129, 200.92969000000005], "spans": [[2, 0], [3, 0]], "text": "PubTabNet", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 3, "row-header": true, "row-span": [2, 4]}, {"bbox": [220.903, 200.33196999999996, 248.66655999999998, 208.40166999999997], "spans": [[3, 1]], "text": "HTML", "type": "row_header", "col": 1, "col-header": false, "col-span": [1, 2], "row": 3, "row-header": true, "row-span": [3, 4]}, {"bbox": [264.74399, 200.33196999999996, 285.73074, 208.40166999999997], "spans": [[3, 2]], "text": "0.969", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [302.444, 200.33196999999996, 323.43076, 208.40166999999997], "spans": [[3, 3]], "text": "0.927", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [339.40302, 200.33196999999996, 360.38977, 208.40166999999997], "spans": [[3, 4]], "text": "0.955", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [382.052, 200.33196999999996, 403.03876, 208.40166999999997], "spans": [[3, 5]], "text": "0.857", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [436.73199000000005, 200.33196999999996, 453.11182, 208.40166999999997], "spans": [[3, 6]], "text": "5.39", "type": "body", "col": 6, "col-header": false, "col-span": [6, 7], "row": 3, "row-header": false, "row-span": [3, 4]}], [{"bbox": [155.94501, 219.16198999999995, 199.83374, 227.23168999999996], "spans": [[4, 0], [5, 0]], "text": "FinTabNet", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 4, "row-header": true, "row-span": [4, 6]}, {"bbox": [222.43700000000004, 213.68201, 247.13226000000003, 221.75171], "spans": [[4, 1]], "text": "OTSL", "type": "row_header", "col": 1, "col-header": false, "col-span": [1, 2], "row": 4, "row-header": true, "row-span": [4, 5]}, {"bbox": [264.74399, 213.68201, 285.73074, 221.75171], "spans": [[4, 2]], "text": "0.955", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [302.444, 213.68201, 323.43076, 221.75171], "spans": [[4, 3]], "text": "0.961", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [337.815, 213.61919999999998, 361.97586, 221.54552999999999], "spans": [[4, 4]], "text": "0.959", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [380.46399, 213.61919999999998, 404.62485, 221.54552999999999], "spans": [[4, 5]], "text": "0.862", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [435.49300999999997, 213.61919999999998, 454.35025, 221.54552999999999], "spans": [[4, 6]], "text": "1.85", "type": "body", "col": 6, "col-header": false, "col-span": [6, 7], "row": 4, "row-header": false, "row-span": [4, 5]}], [{"bbox": [155.94501, 219.16198999999995, 199.83374, 227.23168999999996], "spans": [[4, 0], [5, 0]], "text": "FinTabNet", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 5, "row-header": true, "row-span": [4, 6]}, {"bbox": [220.903, 226.63396999999998, 248.66655999999998, 234.70367], "spans": [[5, 1]], "text": "HTML", "type": "row_header", "col": 1, "col-header": false, "col-span": [1, 2], "row": 5, "row-header": true, "row-span": [5, 6]}, {"bbox": [264.74399, 226.63396999999998, 285.73074, 234.70367], "spans": [[5, 2]], "text": "0.917", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [302.444, 226.63396999999998, 323.43076, 234.70367], "spans": [[5, 3]], "text": "0.922", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [341.70599, 226.63396999999998, 358.08582, 234.70367], "spans": [[5, 4]], "text": "0.92", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [382.052, 226.63396999999998, 403.03876, 234.70367], "spans": [[5, 5]], "text": "0.722", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [436.73199000000005, 226.63396999999998, 453.11182, 234.70367], "spans": [[5, 6]], "text": "3.26", "type": "body", "col": 6, "col-header": false, "col-span": [6, 7], "row": 5, "row-header": false, "row-span": [5, 6]}], [{"bbox": [148.62601, 245.46294999999998, 207.1524, 253.53265], "spans": [[6, 0], [7, 0]], "text": "PubTables-1M", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 6, "row-header": true, "row-span": [6, 8]}, {"bbox": [222.43700000000004, 239.98297000000002, 247.13226000000003, 248.05267000000003], "spans": [[6, 1]], "text": "OTSL", "type": "row_header", "col": 1, "col-header": false, "col-span": [1, 2], "row": 6, "row-header": true, "row-span": [6, 7]}, {"bbox": [264.74399, 239.98297000000002, 285.73074, 248.05267000000003], "spans": [[6, 2]], "text": "0.987", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [302.444, 239.98297000000002, 323.43076, 248.05267000000003], "spans": [[6, 3]], "text": "0.964", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [337.815, 239.92016999999998, 361.97586, 247.8465], "spans": [[6, 4]], "text": "0.977", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [380.46399, 239.92016999999998, 404.62485, 247.8465], "spans": [[6, 5]], "text": "0.896", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [435.49300999999997, 239.92016999999998, 454.35025, 247.8465], "spans": [[6, 6]], "text": "1.79", "type": "body", "col": 6, "col-header": false, "col-span": [6, 7], "row": 6, "row-header": false, "row-span": [6, 7]}], [{"bbox": [148.62601, 245.46294999999998, 207.1524, 253.53265], "spans": [[6, 0], [7, 0]], "text": "PubTables-1M", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 7, "row-header": true, "row-span": [6, 8]}, {"bbox": [220.903, 252.93499999999995, 248.66655999999998, 261.00469999999996], "spans": [[7, 1]], "text": "HTML", "type": "row_header", "col": 1, "col-header": false, "col-span": [1, 2], "row": 7, "row-header": true, "row-span": [7, 8]}, {"bbox": [264.74399, 252.93499999999995, 285.73074, 261.00469999999996], "spans": [[7, 2]], "text": "0.983", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 7, "row-header": false, "row-span": [7, 8]}, {"bbox": [302.444, 252.93499999999995, 323.43076, 261.00469999999996], "spans": [[7, 3]], "text": "0.944", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 7, "row-header": false, "row-span": [7, 8]}, {"bbox": [339.40302, 252.93499999999995, 360.38977, 261.00469999999996], "spans": [[7, 4]], "text": "0.966", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 7, "row-header": false, "row-span": [7, 8]}, {"bbox": [382.052, 252.93499999999995, 403.03876, 261.00469999999996], "spans": [[7, 5]], "text": "0.889", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 7, "row-header": false, "row-span": [7, 8]}, {"bbox": [436.73199000000005, 252.93499999999995, 453.11182, 261.00469999999996], "spans": [[7, 6]], "text": "3.26", "type": "body", "col": 6, "col-header": false, "col-span": [6, 7], "row": 7, "row-header": false, "row-span": [7, 8]}]], "model": null, "bounding-box": null}], "bitmaps": null, "equations": [], "footnotes": [], "page-dimensions": [{"height": 792.0, "page": 1, "width": 612.0}, {"height": 792.0, "page": 2, "width": 612.0}, {"height": 792.0, "page": 3, "width": 612.0}, {"height": 792.0, "page": 4, "width": 612.0}, {"height": 792.0, "page": 5, "width": 612.0}, {"height": 792.0, "page": 6, "width": 612.0}, {"height": 792.0, "page": 7, "width": 612.0}, {"height": 792.0, "page": 8, "width": 612.0}, {"height": 792.0, "page": 9, "width": 612.0}, {"height": 792.0, "page": 10, "width": 612.0}, {"height": 792.0, "page": 11, "width": 612.0}, {"height": 792.0, "page": 12, "width": 612.0}, {"height": 792.0, "page": 13, "width": 612.0}, {"height": 792.0, "page": 14, "width": 612.0}], "page-footers": [], "page-headers": [], "_s3_data": null, "identifiers": null}
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v1/2305.03393v1.pages.json b/tests/data/groundtruth/docling_v1/2305.03393v1.pages.json
index 12de98a6..df8dadbc 100644
--- a/tests/data/groundtruth/docling_v1/2305.03393v1.pages.json
+++ b/tests/data/groundtruth/docling_v1/2305.03393v1.pages.json
@@ -1 +1 @@
-[{"page_no": 0, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure", "bbox": {"l": 134.765, "t": 115.89910999999995, "r": 480.59735, "b": 128.58112000000006, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Recognition", "bbox": {"l": 266.67499, "t": 133.83209, "r": 348.68506, "b": 146.51409999999998, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Maksym Lysak", "bbox": {"l": 151.22598, "t": 171.67371000000003, "r": 217.04390999999998, "b": 180.47069999999997, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "[0000", "bbox": {"l": 217.04599, "t": 170.08209, "r": 235.18764, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "\u2212", "bbox": {"l": 235.18598999999998, "t": 169.69159000000002, "r": 241.4129, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "0002", "bbox": {"l": 241.41299000000004, "t": 170.08209, "r": 257.29932, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "\u2212", "bbox": {"l": 257.298, "t": 169.69159000000002, "r": 263.5249, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "3723", "bbox": {"l": 263.52499, "t": 170.08209, "r": 279.41132, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "\u2212", "bbox": {"l": 279.41, "t": 169.69159000000002, "r": 285.6369, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "$^{6960]}$, Ahmed Nassar[0000", "bbox": {"l": 285.63602, "t": 171.67371000000003, "r": 392.27664, "b": 180.47069999999997, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "\u2212", "bbox": {"l": 392.27502, "t": 169.69159000000002, "r": 398.50192, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "0002", "bbox": {"l": 398.50201, "t": 170.08209, "r": 414.38834, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "\u2212", "bbox": {"l": 414.38702, "t": 169.69159000000002, "r": 420.61392, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "9468", "bbox": {"l": 420.61304, "t": 170.08209, "r": 436.49936, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "\u2212", "bbox": {"l": 436.49805000000003, "t": 169.69159000000002, "r": 442.72495000000004, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "$^{0822]}$,", "bbox": {"l": 442.72504, "t": 171.67371000000003, "r": 464.12963999999994, "b": 180.47069999999997, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Nikolaos Livathinos", "bbox": {"l": 139.34305, "t": 183.62872000000004, "r": 224.80720999999997, "b": 192.42571999999996, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "[0000", "bbox": {"l": 224.80704000000003, "t": 182.03814999999997, "r": 242.94868, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "\u2212", "bbox": {"l": 242.94704000000002, "t": 181.64764000000002, "r": 249.17394999999996, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "0001", "bbox": {"l": 249.17404000000002, "t": 182.03814999999997, "r": 265.06036, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "\u2212", "bbox": {"l": 265.05905, "t": 181.64764000000002, "r": 271.28595, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "8513", "bbox": {"l": 271.28506, "t": 182.03814999999997, "r": 287.17139, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "\u2212", "bbox": {"l": 287.17007, "t": 181.64764000000002, "r": 293.39697, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "$^{3491]}$, Christoph Auer[0000", "bbox": {"l": 293.39706, "t": 183.62872000000004, "r": 404.1597, "b": 192.42571999999996, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "\u2212", "bbox": {"l": 404.15808, "t": 181.64764000000002, "r": 410.38498, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "0001", "bbox": {"l": 410.38507, "t": 182.03814999999997, "r": 426.27139, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "\u2212", "bbox": {"l": 426.27008, "t": 181.64764000000002, "r": 432.49697999999995, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "5761", "bbox": {"l": 432.49609, "t": 182.03814999999997, "r": 448.3824200000001, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "\u2212", "bbox": {"l": 448.3811, "t": 181.64764000000002, "r": 454.608, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "$^{0422]}$,", "bbox": {"l": 454.60808999999995, "t": 183.62872000000004, "r": 476.01270000000005, "b": 192.42571999999996, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "and Peter Staar", "bbox": {"l": 229.52109000000002, "t": 195.58374000000003, "r": 298.6087, "b": 204.38073999999995, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "[0000", "bbox": {"l": 298.60608, "t": 193.99316, "r": 316.74771, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "\u2212", "bbox": {"l": 316.74609, "t": 193.60266000000001, "r": 322.97299, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "0002", "bbox": {"l": 322.97308, "t": 193.99316, "r": 338.85941, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "\u2212", "bbox": {"l": 338.85809, "t": 193.60266000000001, "r": 345.08499, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "8088", "bbox": {"l": 345.08508, "t": 193.99316, "r": 360.97141, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "\u2212", "bbox": {"l": 360.97009, "t": 193.60266000000001, "r": 367.19699, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "0823]", "bbox": {"l": 367.19611, "t": 193.99316, "r": 385.33774, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "IBM Research", "bbox": {"l": 279.1051, "t": 217.20398, "r": 336.25153, "b": 225.27368, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "{mly,ahn,nli,cau,taa}@zurich.ibm.com", "bbox": {"l": 222.96609, "t": 228.80853000000002, "r": 392.38983, "b": 236.27752999999996, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "Abstract.", "bbox": {"l": 163.1111, "t": 270.30115, "r": 206.6358, "b": 278.22748, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Extracting tables from documents is a crucial task in any", "bbox": {"l": 211.6171, "t": 270.36395000000005, "r": 452.2447199999999, "b": 278.43364999999994, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "document conversion pipeline. Recently, transformer-based models have", "bbox": {"l": 163.1111, "t": 281.3229099999999, "r": 452.24246, "b": 289.39267, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "demonstrated that table-structure can be recognized with impressive ac-", "bbox": {"l": 163.1111, "t": 292.28189, "r": 452.24792, "b": 300.35165000000006, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "curacy using Image-to-Markup-Sequence (Im2Seq) approaches. Taking", "bbox": {"l": 163.1111, "t": 303.24088, "r": 452.2407799999999, "b": 311.31064, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "only the image of a table, such models predict a sequence of tokens (e.g.", "bbox": {"l": 163.1111, "t": 314.19888, "r": 452.24609, "b": 322.26865, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "in HTML, LaTeX) which represent the structure of the table. Since the", "bbox": {"l": 163.1111, "t": 325.15787, "r": 452.24615000000006, "b": 333.22763, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "token representation of the table structure has a significant impact on", "bbox": {"l": 163.1111, "t": 336.11685, "r": 452.24707, "b": 344.18661, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "the accuracy and run-time performance of any Im2Seq model, we inves-", "bbox": {"l": 163.1111, "t": 347.07584, "r": 452.2459999999999, "b": 355.1456, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "tigate in this paper how table-structure representation can be optimised.", "bbox": {"l": 163.1111, "t": 358.03482, "r": 452.2479900000001, "b": 366.10458, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "We propose a new, optimised table-structure language (OTSL) with a", "bbox": {"l": 163.1111, "t": 368.9938, "r": 452.24609, "b": 377.06357, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "minimized vocabulary and specific rules. The benefits of OTSL are that", "bbox": {"l": 163.1111, "t": 379.95279, "r": 452.2417, "b": 388.02255, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "it reduces the number of tokens to 5 (HTML needs 28+) and shortens", "bbox": {"l": 163.1111, "t": 390.91177, "r": 452.2443200000001, "b": 398.98154, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "the sequence length to half of HTML on average. Consequently, model", "bbox": {"l": 163.1111, "t": 401.87076, "r": 452.24878000000007, "b": 409.94052, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "accuracy improves significantly, inference time is halved compared to", "bbox": {"l": 163.1111, "t": 412.82974, "r": 452.24063000000007, "b": 420.8995100000001, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "HTML-based models, and the predicted table structures are always syn-", "bbox": {"l": 163.1111, "t": 423.78774999999996, "r": 452.24161, "b": 431.85751000000005, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "tactically correct. This in turn eliminates most post-processing needs.", "bbox": {"l": 163.1111, "t": 434.74673, "r": 452.24429, "b": 442.8165, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Popular table structure data-sets will be published in OTSL format to", "bbox": {"l": 163.1111, "t": 445.70572000000004, "r": 452.24603, "b": 453.77547999999996, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "the community.", "bbox": {"l": 163.1111, "t": 456.6647, "r": 225.56116, "b": 464.73447, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Keywords:", "bbox": {"l": 163.1111, "t": 478.69394, "r": 211.94211, "b": 486.62024, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Table Structure Recognition \u00b7 Data Representation \u00b7 Trans-", "bbox": {"l": 216.55208999999996, "t": 478.75671, "r": 452.24158, "b": 486.82648, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "formers \u00b7 Optimization.", "bbox": {"l": 163.11111, "t": 489.71573, "r": 257.64185, "b": 497.78549, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "1", "bbox": {"l": 134.76512, "t": 522.11969, "r": 141.48872, "b": 532.68808, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "Introduction", "bbox": {"l": 154.93832, "t": 522.11969, "r": 228.93384, "b": 532.68808, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "Tables are ubiquitous in documents such as scientific papers, patents, reports,", "bbox": {"l": 134.76512, "t": 548.2865400000001, "r": 480.5939, "b": 557.0835099999999, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "manuals, specification sheets or marketing material. They often encode highly", "bbox": {"l": 134.76512, "t": 560.24254, "r": 480.59180000000003, "b": 569.0395100000001, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "valuable information and therefore need to be extracted with high accuracy.", "bbox": {"l": 134.76512, "t": 572.19754, "r": 480.59283000000005, "b": 580.99451, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "Unfortunately, tables appear in documents in various sizes, styling and struc-", "bbox": {"l": 134.76512, "t": 584.15254, "r": 480.5959500000001, "b": 592.9495099999999, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "ture, making it difficult to recover their correct structure with simple analyt-", "bbox": {"l": 134.76512, "t": 596.10754, "r": 480.58688, "b": 604.90451, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "ical methods. Therefore, accurate table extraction is achieved these days with", "bbox": {"l": 134.76512, "t": 608.06255, "r": 480.59088, "b": 616.85951, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "machine-learning based methods.", "bbox": {"l": 134.76512, "t": 620.01755, "r": 279.32745, "b": 628.81451, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "In modern document understanding systems [1,15], table extraction is typi-", "bbox": {"l": 149.70811, "t": 632.14755, "r": 480.58899, "b": 640.94452, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "cally a two-step process. Firstly, every table on a page is located with a bounding", "bbox": {"l": 134.76512, "t": 644.1025500000001, "r": 480.59583, "b": 652.8995199999999, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "box, and secondly, their logical row and column structure is recognized. As of", "bbox": {"l": 134.76512, "t": 656.05756, "r": 480.59496999999993, "b": 664.85453, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "arXiv:2305.03393v1 [cs.CV] 5 May 2023", "bbox": {"l": 18.340218, "t": 209.47997999999995, "r": 36.339787, "b": 555.00003, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 5, "label": "section_header", "bbox": {"l": 134.765, "t": 115.89910999999995, "r": 480.59735, "b": 146.51409999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.89183509349823, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure", "bbox": {"l": 134.765, "t": 115.89910999999995, "r": 480.59735, "b": 128.58112000000006, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Recognition", "bbox": {"l": 266.67499, "t": 133.83209, "r": 348.68506, "b": 146.51409999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "key_value_region", "bbox": {"l": 139.34305, "t": 169.69159000000002, "r": 476.01270000000005, "b": 236.27752999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.4844580888748169, "cells": [{"id": 2, "text": "Maksym Lysak", "bbox": {"l": 151.22598, "t": 171.67371000000003, "r": 217.04390999999998, "b": 180.47069999999997, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "[0000", "bbox": {"l": 217.04599, "t": 170.08209, "r": 235.18764, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "\u2212", "bbox": {"l": 235.18598999999998, "t": 169.69159000000002, "r": 241.4129, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "0002", "bbox": {"l": 241.41299000000004, "t": 170.08209, "r": 257.29932, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "\u2212", "bbox": {"l": 257.298, "t": 169.69159000000002, "r": 263.5249, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "3723", "bbox": {"l": 263.52499, "t": 170.08209, "r": 279.41132, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "\u2212", "bbox": {"l": 279.41, "t": 169.69159000000002, "r": 285.6369, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "$^{6960]}$, Ahmed Nassar[0000", "bbox": {"l": 285.63602, "t": 171.67371000000003, "r": 392.27664, "b": 180.47069999999997, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "\u2212", "bbox": {"l": 392.27502, "t": 169.69159000000002, "r": 398.50192, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "0002", "bbox": {"l": 398.50201, "t": 170.08209, "r": 414.38834, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "\u2212", "bbox": {"l": 414.38702, "t": 169.69159000000002, "r": 420.61392, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "9468", "bbox": {"l": 420.61304, "t": 170.08209, "r": 436.49936, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "\u2212", "bbox": {"l": 436.49805000000003, "t": 169.69159000000002, "r": 442.72495000000004, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "$^{0822]}$,", "bbox": {"l": 442.72504, "t": 171.67371000000003, "r": 464.12963999999994, "b": 180.47069999999997, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Nikolaos Livathinos", "bbox": {"l": 139.34305, "t": 183.62872000000004, "r": 224.80720999999997, "b": 192.42571999999996, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "[0000", "bbox": {"l": 224.80704000000003, "t": 182.03814999999997, "r": 242.94868, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "\u2212", "bbox": {"l": 242.94704000000002, "t": 181.64764000000002, "r": 249.17394999999996, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "0001", "bbox": {"l": 249.17404000000002, "t": 182.03814999999997, "r": 265.06036, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "\u2212", "bbox": {"l": 265.05905, "t": 181.64764000000002, "r": 271.28595, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "8513", "bbox": {"l": 271.28506, "t": 182.03814999999997, "r": 287.17139, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "\u2212", "bbox": {"l": 287.17007, "t": 181.64764000000002, "r": 293.39697, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "$^{3491]}$, Christoph Auer[0000", "bbox": {"l": 293.39706, "t": 183.62872000000004, "r": 404.1597, "b": 192.42571999999996, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "\u2212", "bbox": {"l": 404.15808, "t": 181.64764000000002, "r": 410.38498, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "0001", "bbox": {"l": 410.38507, "t": 182.03814999999997, "r": 426.27139, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "\u2212", "bbox": {"l": 426.27008, "t": 181.64764000000002, "r": 432.49697999999995, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "5761", "bbox": {"l": 432.49609, "t": 182.03814999999997, "r": 448.3824200000001, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "\u2212", "bbox": {"l": 448.3811, "t": 181.64764000000002, "r": 454.608, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "$^{0422]}$,", "bbox": {"l": 454.60808999999995, "t": 183.62872000000004, "r": 476.01270000000005, "b": 192.42571999999996, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "and Peter Staar", "bbox": {"l": 229.52109000000002, "t": 195.58374000000003, "r": 298.6087, "b": 204.38073999999995, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "[0000", "bbox": {"l": 298.60608, "t": 193.99316, "r": 316.74771, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "\u2212", "bbox": {"l": 316.74609, "t": 193.60266000000001, "r": 322.97299, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "0002", "bbox": {"l": 322.97308, "t": 193.99316, "r": 338.85941, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "\u2212", "bbox": {"l": 338.85809, "t": 193.60266000000001, "r": 345.08499, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "8088", "bbox": {"l": 345.08508, "t": 193.99316, "r": 360.97141, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "\u2212", "bbox": {"l": 360.97009, "t": 193.60266000000001, "r": 367.19699, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "0823]", "bbox": {"l": 367.19611, "t": 193.99316, "r": 385.33774, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "IBM Research", "bbox": {"l": 279.1051, "t": 217.20398, "r": 336.25153, "b": 225.27368, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "{mly,ahn,nli,cau,taa}@zurich.ibm.com", "bbox": {"l": 222.96609, "t": 228.80853000000002, "r": 392.38983, "b": 236.27752999999996, "coord_origin": "TOPLEFT"}}], "children": [{"id": 7, "label": "text", "bbox": {"l": 139.34305, "t": 169.69159000000002, "r": 476.01270000000005, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.7918067574501038, "cells": [{"id": 2, "text": "Maksym Lysak", "bbox": {"l": 151.22598, "t": 171.67371000000003, "r": 217.04390999999998, "b": 180.47069999999997, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "[0000", "bbox": {"l": 217.04599, "t": 170.08209, "r": 235.18764, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "\u2212", "bbox": {"l": 235.18598999999998, "t": 169.69159000000002, "r": 241.4129, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "0002", "bbox": {"l": 241.41299000000004, "t": 170.08209, "r": 257.29932, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "\u2212", "bbox": {"l": 257.298, "t": 169.69159000000002, "r": 263.5249, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "3723", "bbox": {"l": 263.52499, "t": 170.08209, "r": 279.41132, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "\u2212", "bbox": {"l": 279.41, "t": 169.69159000000002, "r": 285.6369, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "$^{6960]}$, Ahmed Nassar[0000", "bbox": {"l": 285.63602, "t": 171.67371000000003, "r": 392.27664, "b": 180.47069999999997, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "\u2212", "bbox": {"l": 392.27502, "t": 169.69159000000002, "r": 398.50192, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "0002", "bbox": {"l": 398.50201, "t": 170.08209, "r": 414.38834, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "\u2212", "bbox": {"l": 414.38702, "t": 169.69159000000002, "r": 420.61392, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "9468", "bbox": {"l": 420.61304, "t": 170.08209, "r": 436.49936, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "\u2212", "bbox": {"l": 436.49805000000003, "t": 169.69159000000002, "r": 442.72495000000004, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "$^{0822]}$,", "bbox": {"l": 442.72504, "t": 171.67371000000003, "r": 464.12963999999994, "b": 180.47069999999997, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Nikolaos Livathinos", "bbox": {"l": 139.34305, "t": 183.62872000000004, "r": 224.80720999999997, "b": 192.42571999999996, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "[0000", "bbox": {"l": 224.80704000000003, "t": 182.03814999999997, "r": 242.94868, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "\u2212", "bbox": {"l": 242.94704000000002, "t": 181.64764000000002, "r": 249.17394999999996, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "0001", "bbox": {"l": 249.17404000000002, "t": 182.03814999999997, "r": 265.06036, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "\u2212", "bbox": {"l": 265.05905, "t": 181.64764000000002, "r": 271.28595, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "8513", "bbox": {"l": 271.28506, "t": 182.03814999999997, "r": 287.17139, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "\u2212", "bbox": {"l": 287.17007, "t": 181.64764000000002, "r": 293.39697, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "$^{3491]}$, Christoph Auer[0000", "bbox": {"l": 293.39706, "t": 183.62872000000004, "r": 404.1597, "b": 192.42571999999996, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "\u2212", "bbox": {"l": 404.15808, "t": 181.64764000000002, "r": 410.38498, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "0001", "bbox": {"l": 410.38507, "t": 182.03814999999997, "r": 426.27139, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "\u2212", "bbox": {"l": 426.27008, "t": 181.64764000000002, "r": 432.49697999999995, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "5761", "bbox": {"l": 432.49609, "t": 182.03814999999997, "r": 448.3824200000001, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "\u2212", "bbox": {"l": 448.3811, "t": 181.64764000000002, "r": 454.608, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "$^{0422]}$,", "bbox": {"l": 454.60808999999995, "t": 183.62872000000004, "r": 476.01270000000005, "b": 192.42571999999996, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "[0000", "bbox": {"l": 298.60608, "t": 193.99316, "r": 316.74771, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "\u2212", "bbox": {"l": 316.74609, "t": 193.60266000000001, "r": 322.97299, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "0002", "bbox": {"l": 322.97308, "t": 193.99316, "r": 338.85941, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "\u2212", "bbox": {"l": 338.85809, "t": 193.60266000000001, "r": 345.08499, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "8088", "bbox": {"l": 345.08508, "t": 193.99316, "r": 360.97141, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "\u2212", "bbox": {"l": 360.97009, "t": 193.60266000000001, "r": 367.19699, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "0823]", "bbox": {"l": 367.19611, "t": 193.99316, "r": 385.33774, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 229.52109000000002, "t": 195.58374000000003, "r": 298.6087, "b": 204.38073999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.5015264749526978, "cells": [{"id": 30, "text": "and Peter Staar", "bbox": {"l": 229.52109000000002, "t": 195.58374000000003, "r": 298.6087, "b": 204.38073999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 279.1051, "t": 217.20398, "r": 336.25153, "b": 225.27368, "coord_origin": "TOPLEFT"}, "confidence": 0.6310854554176331, "cells": [{"id": 38, "text": "IBM Research", "bbox": {"l": 279.1051, "t": 217.20398, "r": 336.25153, "b": 225.27368, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "text", "bbox": {"l": 222.96609, "t": 228.80853000000002, "r": 392.38983, "b": 236.27752999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.6924147009849548, "cells": [{"id": 39, "text": "{mly,ahn,nli,cau,taa}@zurich.ibm.com", "bbox": {"l": 222.96609, "t": 228.80853000000002, "r": 392.38983, "b": 236.27752999999996, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 1, "label": "text", "bbox": {"l": 163.1111, "t": 270.30115, "r": 452.24878000000007, "b": 464.73447, "coord_origin": "TOPLEFT"}, "confidence": 0.9807655215263367, "cells": [{"id": 40, "text": "Abstract.", "bbox": {"l": 163.1111, "t": 270.30115, "r": 206.6358, "b": 278.22748, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Extracting tables from documents is a crucial task in any", "bbox": {"l": 211.6171, "t": 270.36395000000005, "r": 452.2447199999999, "b": 278.43364999999994, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "document conversion pipeline. Recently, transformer-based models have", "bbox": {"l": 163.1111, "t": 281.3229099999999, "r": 452.24246, "b": 289.39267, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "demonstrated that table-structure can be recognized with impressive ac-", "bbox": {"l": 163.1111, "t": 292.28189, "r": 452.24792, "b": 300.35165000000006, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "curacy using Image-to-Markup-Sequence (Im2Seq) approaches. Taking", "bbox": {"l": 163.1111, "t": 303.24088, "r": 452.2407799999999, "b": 311.31064, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "only the image of a table, such models predict a sequence of tokens (e.g.", "bbox": {"l": 163.1111, "t": 314.19888, "r": 452.24609, "b": 322.26865, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "in HTML, LaTeX) which represent the structure of the table. Since the", "bbox": {"l": 163.1111, "t": 325.15787, "r": 452.24615000000006, "b": 333.22763, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "token representation of the table structure has a significant impact on", "bbox": {"l": 163.1111, "t": 336.11685, "r": 452.24707, "b": 344.18661, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "the accuracy and run-time performance of any Im2Seq model, we inves-", "bbox": {"l": 163.1111, "t": 347.07584, "r": 452.2459999999999, "b": 355.1456, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "tigate in this paper how table-structure representation can be optimised.", "bbox": {"l": 163.1111, "t": 358.03482, "r": 452.2479900000001, "b": 366.10458, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "We propose a new, optimised table-structure language (OTSL) with a", "bbox": {"l": 163.1111, "t": 368.9938, "r": 452.24609, "b": 377.06357, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "minimized vocabulary and specific rules. The benefits of OTSL are that", "bbox": {"l": 163.1111, "t": 379.95279, "r": 452.2417, "b": 388.02255, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "it reduces the number of tokens to 5 (HTML needs 28+) and shortens", "bbox": {"l": 163.1111, "t": 390.91177, "r": 452.2443200000001, "b": 398.98154, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "the sequence length to half of HTML on average. Consequently, model", "bbox": {"l": 163.1111, "t": 401.87076, "r": 452.24878000000007, "b": 409.94052, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "accuracy improves significantly, inference time is halved compared to", "bbox": {"l": 163.1111, "t": 412.82974, "r": 452.24063000000007, "b": 420.8995100000001, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "HTML-based models, and the predicted table structures are always syn-", "bbox": {"l": 163.1111, "t": 423.78774999999996, "r": 452.24161, "b": 431.85751000000005, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "tactically correct. This in turn eliminates most post-processing needs.", "bbox": {"l": 163.1111, "t": 434.74673, "r": 452.24429, "b": 442.8165, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Popular table structure data-sets will be published in OTSL format to", "bbox": {"l": 163.1111, "t": 445.70572000000004, "r": 452.24603, "b": 453.77547999999996, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "the community.", "bbox": {"l": 163.1111, "t": 456.6647, "r": 225.56116, "b": 464.73447, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "text", "bbox": {"l": 163.1111, "t": 478.69394, "r": 452.24158, "b": 497.78549, "coord_origin": "TOPLEFT"}, "confidence": 0.93040531873703, "cells": [{"id": 59, "text": "Keywords:", "bbox": {"l": 163.1111, "t": 478.69394, "r": 211.94211, "b": 486.62024, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Table Structure Recognition \u00b7 Data Representation \u00b7 Trans-", "bbox": {"l": 216.55208999999996, "t": 478.75671, "r": 452.24158, "b": 486.82648, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "formers \u00b7 Optimization.", "bbox": {"l": 163.11111, "t": 489.71573, "r": 257.64185, "b": 497.78549, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "section_header", "bbox": {"l": 134.76512, "t": 522.11969, "r": 228.93384, "b": 532.68808, "coord_origin": "TOPLEFT"}, "confidence": 0.9392016530036926, "cells": [{"id": 62, "text": "1", "bbox": {"l": 134.76512, "t": 522.11969, "r": 141.48872, "b": 532.68808, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "Introduction", "bbox": {"l": 154.93832, "t": 522.11969, "r": 228.93384, "b": 532.68808, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 134.76512, "t": 548.2865400000001, "r": 480.5959500000001, "b": 628.81451, "coord_origin": "TOPLEFT"}, "confidence": 0.9835679531097412, "cells": [{"id": 64, "text": "Tables are ubiquitous in documents such as scientific papers, patents, reports,", "bbox": {"l": 134.76512, "t": 548.2865400000001, "r": 480.5939, "b": 557.0835099999999, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "manuals, specification sheets or marketing material. They often encode highly", "bbox": {"l": 134.76512, "t": 560.24254, "r": 480.59180000000003, "b": 569.0395100000001, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "valuable information and therefore need to be extracted with high accuracy.", "bbox": {"l": 134.76512, "t": 572.19754, "r": 480.59283000000005, "b": 580.99451, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "Unfortunately, tables appear in documents in various sizes, styling and struc-", "bbox": {"l": 134.76512, "t": 584.15254, "r": 480.5959500000001, "b": 592.9495099999999, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "ture, making it difficult to recover their correct structure with simple analyt-", "bbox": {"l": 134.76512, "t": 596.10754, "r": 480.58688, "b": 604.90451, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "ical methods. Therefore, accurate table extraction is achieved these days with", "bbox": {"l": 134.76512, "t": 608.06255, "r": 480.59088, "b": 616.85951, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "machine-learning based methods.", "bbox": {"l": 134.76512, "t": 620.01755, "r": 279.32745, "b": 628.81451, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 134.76512, "t": 632.14755, "r": 480.59583, "b": 664.85453, "coord_origin": "TOPLEFT"}, "confidence": 0.9696458578109741, "cells": [{"id": 71, "text": "In modern document understanding systems [1,15], table extraction is typi-", "bbox": {"l": 149.70811, "t": 632.14755, "r": 480.58899, "b": 640.94452, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "cally a two-step process. Firstly, every table on a page is located with a bounding", "bbox": {"l": 134.76512, "t": 644.1025500000001, "r": 480.59583, "b": 652.8995199999999, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "box, and secondly, their logical row and column structure is recognized. As of", "bbox": {"l": 134.76512, "t": 656.05756, "r": 480.59496999999993, "b": 664.85453, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "page_header", "bbox": {"l": 18.340218, "t": 209.47997999999995, "r": 36.339787, "b": 555.00003, "coord_origin": "TOPLEFT"}, "confidence": 0.8899644017219543, "cells": [{"id": 74, "text": "arXiv:2305.03393v1 [cs.CV] 5 May 2023", "bbox": {"l": 18.340218, "t": 209.47997999999995, "r": 36.339787, "b": 555.00003, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "section_header", "id": 5, "page_no": 0, "cluster": {"id": 5, "label": "section_header", "bbox": {"l": 134.765, "t": 115.89910999999995, "r": 480.59735, "b": 146.51409999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.89183509349823, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure", "bbox": {"l": 134.765, "t": 115.89910999999995, "r": 480.59735, "b": 128.58112000000006, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Recognition", "bbox": {"l": 266.67499, "t": 133.83209, "r": 348.68506, "b": 146.51409999999998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Optimized Table Tokenization for Table Structure Recognition"}, {"label": "key_value_region", "id": 16, "page_no": 0, "cluster": {"id": 16, "label": "key_value_region", "bbox": {"l": 139.34305, "t": 169.69159000000002, "r": 476.01270000000005, "b": 236.27752999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.4844580888748169, "cells": [{"id": 2, "text": "Maksym Lysak", "bbox": {"l": 151.22598, "t": 171.67371000000003, "r": 217.04390999999998, "b": 180.47069999999997, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "[0000", "bbox": {"l": 217.04599, "t": 170.08209, "r": 235.18764, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "\u2212", "bbox": {"l": 235.18598999999998, "t": 169.69159000000002, "r": 241.4129, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "0002", "bbox": {"l": 241.41299000000004, "t": 170.08209, "r": 257.29932, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "\u2212", "bbox": {"l": 257.298, "t": 169.69159000000002, "r": 263.5249, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "3723", "bbox": {"l": 263.52499, "t": 170.08209, "r": 279.41132, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "\u2212", "bbox": {"l": 279.41, "t": 169.69159000000002, "r": 285.6369, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "$^{6960]}$, Ahmed Nassar[0000", "bbox": {"l": 285.63602, "t": 171.67371000000003, "r": 392.27664, "b": 180.47069999999997, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "\u2212", "bbox": {"l": 392.27502, "t": 169.69159000000002, "r": 398.50192, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "0002", "bbox": {"l": 398.50201, "t": 170.08209, "r": 414.38834, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "\u2212", "bbox": {"l": 414.38702, "t": 169.69159000000002, "r": 420.61392, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "9468", "bbox": {"l": 420.61304, "t": 170.08209, "r": 436.49936, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "\u2212", "bbox": {"l": 436.49805000000003, "t": 169.69159000000002, "r": 442.72495000000004, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "$^{0822]}$,", "bbox": {"l": 442.72504, "t": 171.67371000000003, "r": 464.12963999999994, "b": 180.47069999999997, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Nikolaos Livathinos", "bbox": {"l": 139.34305, "t": 183.62872000000004, "r": 224.80720999999997, "b": 192.42571999999996, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "[0000", "bbox": {"l": 224.80704000000003, "t": 182.03814999999997, "r": 242.94868, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "\u2212", "bbox": {"l": 242.94704000000002, "t": 181.64764000000002, "r": 249.17394999999996, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "0001", "bbox": {"l": 249.17404000000002, "t": 182.03814999999997, "r": 265.06036, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "\u2212", "bbox": {"l": 265.05905, "t": 181.64764000000002, "r": 271.28595, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "8513", "bbox": {"l": 271.28506, "t": 182.03814999999997, "r": 287.17139, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "\u2212", "bbox": {"l": 287.17007, "t": 181.64764000000002, "r": 293.39697, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "$^{3491]}$, Christoph Auer[0000", "bbox": {"l": 293.39706, "t": 183.62872000000004, "r": 404.1597, "b": 192.42571999999996, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "\u2212", "bbox": {"l": 404.15808, "t": 181.64764000000002, "r": 410.38498, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "0001", "bbox": {"l": 410.38507, "t": 182.03814999999997, "r": 426.27139, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "\u2212", "bbox": {"l": 426.27008, "t": 181.64764000000002, "r": 432.49697999999995, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "5761", "bbox": {"l": 432.49609, "t": 182.03814999999997, "r": 448.3824200000001, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "\u2212", "bbox": {"l": 448.3811, "t": 181.64764000000002, "r": 454.608, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "$^{0422]}$,", "bbox": {"l": 454.60808999999995, "t": 183.62872000000004, "r": 476.01270000000005, "b": 192.42571999999996, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "and Peter Staar", "bbox": {"l": 229.52109000000002, "t": 195.58374000000003, "r": 298.6087, "b": 204.38073999999995, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "[0000", "bbox": {"l": 298.60608, "t": 193.99316, "r": 316.74771, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "\u2212", "bbox": {"l": 316.74609, "t": 193.60266000000001, "r": 322.97299, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "0002", "bbox": {"l": 322.97308, "t": 193.99316, "r": 338.85941, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "\u2212", "bbox": {"l": 338.85809, "t": 193.60266000000001, "r": 345.08499, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "8088", "bbox": {"l": 345.08508, "t": 193.99316, "r": 360.97141, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "\u2212", "bbox": {"l": 360.97009, "t": 193.60266000000001, "r": 367.19699, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "0823]", "bbox": {"l": 367.19611, "t": 193.99316, "r": 385.33774, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "IBM Research", "bbox": {"l": 279.1051, "t": 217.20398, "r": 336.25153, "b": 225.27368, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "{mly,ahn,nli,cau,taa}@zurich.ibm.com", "bbox": {"l": 222.96609, "t": 228.80853000000002, "r": 392.38983, "b": 236.27752999999996, "coord_origin": "TOPLEFT"}}], "children": [{"id": 7, "label": "text", "bbox": {"l": 139.34305, "t": 169.69159000000002, "r": 476.01270000000005, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.7918067574501038, "cells": [{"id": 2, "text": "Maksym Lysak", "bbox": {"l": 151.22598, "t": 171.67371000000003, "r": 217.04390999999998, "b": 180.47069999999997, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "[0000", "bbox": {"l": 217.04599, "t": 170.08209, "r": 235.18764, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "\u2212", "bbox": {"l": 235.18598999999998, "t": 169.69159000000002, "r": 241.4129, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "0002", "bbox": {"l": 241.41299000000004, "t": 170.08209, "r": 257.29932, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "\u2212", "bbox": {"l": 257.298, "t": 169.69159000000002, "r": 263.5249, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "3723", "bbox": {"l": 263.52499, "t": 170.08209, "r": 279.41132, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "\u2212", "bbox": {"l": 279.41, "t": 169.69159000000002, "r": 285.6369, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "$^{6960]}$, Ahmed Nassar[0000", "bbox": {"l": 285.63602, "t": 171.67371000000003, "r": 392.27664, "b": 180.47069999999997, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "\u2212", "bbox": {"l": 392.27502, "t": 169.69159000000002, "r": 398.50192, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "0002", "bbox": {"l": 398.50201, "t": 170.08209, "r": 414.38834, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "\u2212", "bbox": {"l": 414.38702, "t": 169.69159000000002, "r": 420.61392, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "9468", "bbox": {"l": 420.61304, "t": 170.08209, "r": 436.49936, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "\u2212", "bbox": {"l": 436.49805000000003, "t": 169.69159000000002, "r": 442.72495000000004, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "$^{0822]}$,", "bbox": {"l": 442.72504, "t": 171.67371000000003, "r": 464.12963999999994, "b": 180.47069999999997, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Nikolaos Livathinos", "bbox": {"l": 139.34305, "t": 183.62872000000004, "r": 224.80720999999997, "b": 192.42571999999996, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "[0000", "bbox": {"l": 224.80704000000003, "t": 182.03814999999997, "r": 242.94868, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "\u2212", "bbox": {"l": 242.94704000000002, "t": 181.64764000000002, "r": 249.17394999999996, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "0001", "bbox": {"l": 249.17404000000002, "t": 182.03814999999997, "r": 265.06036, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "\u2212", "bbox": {"l": 265.05905, "t": 181.64764000000002, "r": 271.28595, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "8513", "bbox": {"l": 271.28506, "t": 182.03814999999997, "r": 287.17139, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "\u2212", "bbox": {"l": 287.17007, "t": 181.64764000000002, "r": 293.39697, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "$^{3491]}$, Christoph Auer[0000", "bbox": {"l": 293.39706, "t": 183.62872000000004, "r": 404.1597, "b": 192.42571999999996, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "\u2212", "bbox": {"l": 404.15808, "t": 181.64764000000002, "r": 410.38498, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "0001", "bbox": {"l": 410.38507, "t": 182.03814999999997, "r": 426.27139, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "\u2212", "bbox": {"l": 426.27008, "t": 181.64764000000002, "r": 432.49697999999995, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "5761", "bbox": {"l": 432.49609, "t": 182.03814999999997, "r": 448.3824200000001, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "\u2212", "bbox": {"l": 448.3811, "t": 181.64764000000002, "r": 454.608, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "$^{0422]}$,", "bbox": {"l": 454.60808999999995, "t": 183.62872000000004, "r": 476.01270000000005, "b": 192.42571999999996, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "[0000", "bbox": {"l": 298.60608, "t": 193.99316, "r": 316.74771, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "\u2212", "bbox": {"l": 316.74609, "t": 193.60266000000001, "r": 322.97299, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "0002", "bbox": {"l": 322.97308, "t": 193.99316, "r": 338.85941, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "\u2212", "bbox": {"l": 338.85809, "t": 193.60266000000001, "r": 345.08499, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "8088", "bbox": {"l": 345.08508, "t": 193.99316, "r": 360.97141, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "\u2212", "bbox": {"l": 360.97009, "t": 193.60266000000001, "r": 367.19699, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "0823]", "bbox": {"l": 367.19611, "t": 193.99316, "r": 385.33774, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 229.52109000000002, "t": 195.58374000000003, "r": 298.6087, "b": 204.38073999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.5015264749526978, "cells": [{"id": 30, "text": "and Peter Staar", "bbox": {"l": 229.52109000000002, "t": 195.58374000000003, "r": 298.6087, "b": 204.38073999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 279.1051, "t": 217.20398, "r": 336.25153, "b": 225.27368, "coord_origin": "TOPLEFT"}, "confidence": 0.6310854554176331, "cells": [{"id": 38, "text": "IBM Research", "bbox": {"l": 279.1051, "t": 217.20398, "r": 336.25153, "b": 225.27368, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "text", "bbox": {"l": 222.96609, "t": 228.80853000000002, "r": 392.38983, "b": 236.27752999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.6924147009849548, "cells": [{"id": 39, "text": "{mly,ahn,nli,cau,taa}@zurich.ibm.com", "bbox": {"l": 222.96609, "t": 228.80853000000002, "r": 392.38983, "b": 236.27752999999996, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null}, {"label": "text", "id": 1, "page_no": 0, "cluster": {"id": 1, "label": "text", "bbox": {"l": 163.1111, "t": 270.30115, "r": 452.24878000000007, "b": 464.73447, "coord_origin": "TOPLEFT"}, "confidence": 0.9807655215263367, "cells": [{"id": 40, "text": "Abstract.", "bbox": {"l": 163.1111, "t": 270.30115, "r": 206.6358, "b": 278.22748, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Extracting tables from documents is a crucial task in any", "bbox": {"l": 211.6171, "t": 270.36395000000005, "r": 452.2447199999999, "b": 278.43364999999994, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "document conversion pipeline. Recently, transformer-based models have", "bbox": {"l": 163.1111, "t": 281.3229099999999, "r": 452.24246, "b": 289.39267, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "demonstrated that table-structure can be recognized with impressive ac-", "bbox": {"l": 163.1111, "t": 292.28189, "r": 452.24792, "b": 300.35165000000006, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "curacy using Image-to-Markup-Sequence (Im2Seq) approaches. Taking", "bbox": {"l": 163.1111, "t": 303.24088, "r": 452.2407799999999, "b": 311.31064, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "only the image of a table, such models predict a sequence of tokens (e.g.", "bbox": {"l": 163.1111, "t": 314.19888, "r": 452.24609, "b": 322.26865, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "in HTML, LaTeX) which represent the structure of the table. Since the", "bbox": {"l": 163.1111, "t": 325.15787, "r": 452.24615000000006, "b": 333.22763, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "token representation of the table structure has a significant impact on", "bbox": {"l": 163.1111, "t": 336.11685, "r": 452.24707, "b": 344.18661, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "the accuracy and run-time performance of any Im2Seq model, we inves-", "bbox": {"l": 163.1111, "t": 347.07584, "r": 452.2459999999999, "b": 355.1456, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "tigate in this paper how table-structure representation can be optimised.", "bbox": {"l": 163.1111, "t": 358.03482, "r": 452.2479900000001, "b": 366.10458, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "We propose a new, optimised table-structure language (OTSL) with a", "bbox": {"l": 163.1111, "t": 368.9938, "r": 452.24609, "b": 377.06357, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "minimized vocabulary and specific rules. The benefits of OTSL are that", "bbox": {"l": 163.1111, "t": 379.95279, "r": 452.2417, "b": 388.02255, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "it reduces the number of tokens to 5 (HTML needs 28+) and shortens", "bbox": {"l": 163.1111, "t": 390.91177, "r": 452.2443200000001, "b": 398.98154, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "the sequence length to half of HTML on average. Consequently, model", "bbox": {"l": 163.1111, "t": 401.87076, "r": 452.24878000000007, "b": 409.94052, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "accuracy improves significantly, inference time is halved compared to", "bbox": {"l": 163.1111, "t": 412.82974, "r": 452.24063000000007, "b": 420.8995100000001, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "HTML-based models, and the predicted table structures are always syn-", "bbox": {"l": 163.1111, "t": 423.78774999999996, "r": 452.24161, "b": 431.85751000000005, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "tactically correct. This in turn eliminates most post-processing needs.", "bbox": {"l": 163.1111, "t": 434.74673, "r": 452.24429, "b": 442.8165, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Popular table structure data-sets will be published in OTSL format to", "bbox": {"l": 163.1111, "t": 445.70572000000004, "r": 452.24603, "b": 453.77547999999996, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "the community.", "bbox": {"l": 163.1111, "t": 456.6647, "r": 225.56116, "b": 464.73447, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Abstract. Extracting tables from documents is a crucial task in any document conversion pipeline. Recently, transformer-based models have demonstrated that table-structure can be recognized with impressive accuracy using Image-to-Markup-Sequence (Im2Seq) approaches. Taking only the image of a table, such models predict a sequence of tokens (e.g. in HTML, LaTeX) which represent the structure of the table. Since the token representation of the table structure has a significant impact on the accuracy and run-time performance of any Im2Seq model, we investigate in this paper how table-structure representation can be optimised. We propose a new, optimised table-structure language (OTSL) with a minimized vocabulary and specific rules. The benefits of OTSL are that it reduces the number of tokens to 5 (HTML needs 28+) and shortens the sequence length to half of HTML on average. Consequently, model accuracy improves significantly, inference time is halved compared to HTML-based models, and the predicted table structures are always syntactically correct. This in turn eliminates most post-processing needs. Popular table structure data-sets will be published in OTSL format to the community."}, {"label": "text", "id": 4, "page_no": 0, "cluster": {"id": 4, "label": "text", "bbox": {"l": 163.1111, "t": 478.69394, "r": 452.24158, "b": 497.78549, "coord_origin": "TOPLEFT"}, "confidence": 0.93040531873703, "cells": [{"id": 59, "text": "Keywords:", "bbox": {"l": 163.1111, "t": 478.69394, "r": 211.94211, "b": 486.62024, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Table Structure Recognition \u00b7 Data Representation \u00b7 Trans-", "bbox": {"l": 216.55208999999996, "t": 478.75671, "r": 452.24158, "b": 486.82648, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "formers \u00b7 Optimization.", "bbox": {"l": 163.11111, "t": 489.71573, "r": 257.64185, "b": 497.78549, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Keywords: Table Structure Recognition \u00b7 Data Representation \u00b7 Transformers \u00b7 Optimization."}, {"label": "section_header", "id": 3, "page_no": 0, "cluster": {"id": 3, "label": "section_header", "bbox": {"l": 134.76512, "t": 522.11969, "r": 228.93384, "b": 532.68808, "coord_origin": "TOPLEFT"}, "confidence": 0.9392016530036926, "cells": [{"id": 62, "text": "1", "bbox": {"l": 134.76512, "t": 522.11969, "r": 141.48872, "b": 532.68808, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "Introduction", "bbox": {"l": 154.93832, "t": 522.11969, "r": 228.93384, "b": 532.68808, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1 Introduction"}, {"label": "text", "id": 0, "page_no": 0, "cluster": {"id": 0, "label": "text", "bbox": {"l": 134.76512, "t": 548.2865400000001, "r": 480.5959500000001, "b": 628.81451, "coord_origin": "TOPLEFT"}, "confidence": 0.9835679531097412, "cells": [{"id": 64, "text": "Tables are ubiquitous in documents such as scientific papers, patents, reports,", "bbox": {"l": 134.76512, "t": 548.2865400000001, "r": 480.5939, "b": 557.0835099999999, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "manuals, specification sheets or marketing material. They often encode highly", "bbox": {"l": 134.76512, "t": 560.24254, "r": 480.59180000000003, "b": 569.0395100000001, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "valuable information and therefore need to be extracted with high accuracy.", "bbox": {"l": 134.76512, "t": 572.19754, "r": 480.59283000000005, "b": 580.99451, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "Unfortunately, tables appear in documents in various sizes, styling and struc-", "bbox": {"l": 134.76512, "t": 584.15254, "r": 480.5959500000001, "b": 592.9495099999999, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "ture, making it difficult to recover their correct structure with simple analyt-", "bbox": {"l": 134.76512, "t": 596.10754, "r": 480.58688, "b": 604.90451, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "ical methods. Therefore, accurate table extraction is achieved these days with", "bbox": {"l": 134.76512, "t": 608.06255, "r": 480.59088, "b": 616.85951, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "machine-learning based methods.", "bbox": {"l": 134.76512, "t": 620.01755, "r": 279.32745, "b": 628.81451, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Tables are ubiquitous in documents such as scientific papers, patents, reports, manuals, specification sheets or marketing material. They often encode highly valuable information and therefore need to be extracted with high accuracy. Unfortunately, tables appear in documents in various sizes, styling and structure, making it difficult to recover their correct structure with simple analytical methods. Therefore, accurate table extraction is achieved these days with machine-learning based methods."}, {"label": "text", "id": 2, "page_no": 0, "cluster": {"id": 2, "label": "text", "bbox": {"l": 134.76512, "t": 632.14755, "r": 480.59583, "b": 664.85453, "coord_origin": "TOPLEFT"}, "confidence": 0.9696458578109741, "cells": [{"id": 71, "text": "In modern document understanding systems [1,15], table extraction is typi-", "bbox": {"l": 149.70811, "t": 632.14755, "r": 480.58899, "b": 640.94452, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "cally a two-step process. Firstly, every table on a page is located with a bounding", "bbox": {"l": 134.76512, "t": 644.1025500000001, "r": 480.59583, "b": 652.8995199999999, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "box, and secondly, their logical row and column structure is recognized. As of", "bbox": {"l": 134.76512, "t": 656.05756, "r": 480.59496999999993, "b": 664.85453, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In modern document understanding systems [1,15], table extraction is typically a two-step process. Firstly, every table on a page is located with a bounding box, and secondly, their logical row and column structure is recognized. As of"}, {"label": "page_header", "id": 6, "page_no": 0, "cluster": {"id": 6, "label": "page_header", "bbox": {"l": 18.340218, "t": 209.47997999999995, "r": 36.339787, "b": 555.00003, "coord_origin": "TOPLEFT"}, "confidence": 0.8899644017219543, "cells": [{"id": 74, "text": "arXiv:2305.03393v1 [cs.CV] 5 May 2023", "bbox": {"l": 18.340218, "t": 209.47997999999995, "r": 36.339787, "b": 555.00003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "arXiv:2305.03393v1 [cs.CV] 5 May 2023"}], "body": [{"label": "section_header", "id": 5, "page_no": 0, "cluster": {"id": 5, "label": "section_header", "bbox": {"l": 134.765, "t": 115.89910999999995, "r": 480.59735, "b": 146.51409999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.89183509349823, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure", "bbox": {"l": 134.765, "t": 115.89910999999995, "r": 480.59735, "b": 128.58112000000006, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Recognition", "bbox": {"l": 266.67499, "t": 133.83209, "r": 348.68506, "b": 146.51409999999998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Optimized Table Tokenization for Table Structure Recognition"}, {"label": "key_value_region", "id": 16, "page_no": 0, "cluster": {"id": 16, "label": "key_value_region", "bbox": {"l": 139.34305, "t": 169.69159000000002, "r": 476.01270000000005, "b": 236.27752999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.4844580888748169, "cells": [{"id": 2, "text": "Maksym Lysak", "bbox": {"l": 151.22598, "t": 171.67371000000003, "r": 217.04390999999998, "b": 180.47069999999997, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "[0000", "bbox": {"l": 217.04599, "t": 170.08209, "r": 235.18764, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "\u2212", "bbox": {"l": 235.18598999999998, "t": 169.69159000000002, "r": 241.4129, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "0002", "bbox": {"l": 241.41299000000004, "t": 170.08209, "r": 257.29932, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "\u2212", "bbox": {"l": 257.298, "t": 169.69159000000002, "r": 263.5249, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "3723", "bbox": {"l": 263.52499, "t": 170.08209, "r": 279.41132, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "\u2212", "bbox": {"l": 279.41, "t": 169.69159000000002, "r": 285.6369, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "$^{6960]}$, Ahmed Nassar[0000", "bbox": {"l": 285.63602, "t": 171.67371000000003, "r": 392.27664, "b": 180.47069999999997, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "\u2212", "bbox": {"l": 392.27502, "t": 169.69159000000002, "r": 398.50192, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "0002", "bbox": {"l": 398.50201, "t": 170.08209, "r": 414.38834, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "\u2212", "bbox": {"l": 414.38702, "t": 169.69159000000002, "r": 420.61392, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "9468", "bbox": {"l": 420.61304, "t": 170.08209, "r": 436.49936, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "\u2212", "bbox": {"l": 436.49805000000003, "t": 169.69159000000002, "r": 442.72495000000004, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "$^{0822]}$,", "bbox": {"l": 442.72504, "t": 171.67371000000003, "r": 464.12963999999994, "b": 180.47069999999997, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Nikolaos Livathinos", "bbox": {"l": 139.34305, "t": 183.62872000000004, "r": 224.80720999999997, "b": 192.42571999999996, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "[0000", "bbox": {"l": 224.80704000000003, "t": 182.03814999999997, "r": 242.94868, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "\u2212", "bbox": {"l": 242.94704000000002, "t": 181.64764000000002, "r": 249.17394999999996, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "0001", "bbox": {"l": 249.17404000000002, "t": 182.03814999999997, "r": 265.06036, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "\u2212", "bbox": {"l": 265.05905, "t": 181.64764000000002, "r": 271.28595, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "8513", "bbox": {"l": 271.28506, "t": 182.03814999999997, "r": 287.17139, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "\u2212", "bbox": {"l": 287.17007, "t": 181.64764000000002, "r": 293.39697, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "$^{3491]}$, Christoph Auer[0000", "bbox": {"l": 293.39706, "t": 183.62872000000004, "r": 404.1597, "b": 192.42571999999996, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "\u2212", "bbox": {"l": 404.15808, "t": 181.64764000000002, "r": 410.38498, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "0001", "bbox": {"l": 410.38507, "t": 182.03814999999997, "r": 426.27139, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "\u2212", "bbox": {"l": 426.27008, "t": 181.64764000000002, "r": 432.49697999999995, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "5761", "bbox": {"l": 432.49609, "t": 182.03814999999997, "r": 448.3824200000001, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "\u2212", "bbox": {"l": 448.3811, "t": 181.64764000000002, "r": 454.608, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "$^{0422]}$,", "bbox": {"l": 454.60808999999995, "t": 183.62872000000004, "r": 476.01270000000005, "b": 192.42571999999996, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "and Peter Staar", "bbox": {"l": 229.52109000000002, "t": 195.58374000000003, "r": 298.6087, "b": 204.38073999999995, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "[0000", "bbox": {"l": 298.60608, "t": 193.99316, "r": 316.74771, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "\u2212", "bbox": {"l": 316.74609, "t": 193.60266000000001, "r": 322.97299, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "0002", "bbox": {"l": 322.97308, "t": 193.99316, "r": 338.85941, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "\u2212", "bbox": {"l": 338.85809, "t": 193.60266000000001, "r": 345.08499, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "8088", "bbox": {"l": 345.08508, "t": 193.99316, "r": 360.97141, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "\u2212", "bbox": {"l": 360.97009, "t": 193.60266000000001, "r": 367.19699, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "0823]", "bbox": {"l": 367.19611, "t": 193.99316, "r": 385.33774, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "IBM Research", "bbox": {"l": 279.1051, "t": 217.20398, "r": 336.25153, "b": 225.27368, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "{mly,ahn,nli,cau,taa}@zurich.ibm.com", "bbox": {"l": 222.96609, "t": 228.80853000000002, "r": 392.38983, "b": 236.27752999999996, "coord_origin": "TOPLEFT"}}], "children": [{"id": 7, "label": "text", "bbox": {"l": 139.34305, "t": 169.69159000000002, "r": 476.01270000000005, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.7918067574501038, "cells": [{"id": 2, "text": "Maksym Lysak", "bbox": {"l": 151.22598, "t": 171.67371000000003, "r": 217.04390999999998, "b": 180.47069999999997, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "[0000", "bbox": {"l": 217.04599, "t": 170.08209, "r": 235.18764, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "\u2212", "bbox": {"l": 235.18598999999998, "t": 169.69159000000002, "r": 241.4129, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "0002", "bbox": {"l": 241.41299000000004, "t": 170.08209, "r": 257.29932, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "\u2212", "bbox": {"l": 257.298, "t": 169.69159000000002, "r": 263.5249, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "3723", "bbox": {"l": 263.52499, "t": 170.08209, "r": 279.41132, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "\u2212", "bbox": {"l": 279.41, "t": 169.69159000000002, "r": 285.6369, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "$^{6960]}$, Ahmed Nassar[0000", "bbox": {"l": 285.63602, "t": 171.67371000000003, "r": 392.27664, "b": 180.47069999999997, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "\u2212", "bbox": {"l": 392.27502, "t": 169.69159000000002, "r": 398.50192, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "0002", "bbox": {"l": 398.50201, "t": 170.08209, "r": 414.38834, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "\u2212", "bbox": {"l": 414.38702, "t": 169.69159000000002, "r": 420.61392, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "9468", "bbox": {"l": 420.61304, "t": 170.08209, "r": 436.49936, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "\u2212", "bbox": {"l": 436.49805000000003, "t": 169.69159000000002, "r": 442.72495000000004, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "$^{0822]}$,", "bbox": {"l": 442.72504, "t": 171.67371000000003, "r": 464.12963999999994, "b": 180.47069999999997, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Nikolaos Livathinos", "bbox": {"l": 139.34305, "t": 183.62872000000004, "r": 224.80720999999997, "b": 192.42571999999996, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "[0000", "bbox": {"l": 224.80704000000003, "t": 182.03814999999997, "r": 242.94868, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "\u2212", "bbox": {"l": 242.94704000000002, "t": 181.64764000000002, "r": 249.17394999999996, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "0001", "bbox": {"l": 249.17404000000002, "t": 182.03814999999997, "r": 265.06036, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "\u2212", "bbox": {"l": 265.05905, "t": 181.64764000000002, "r": 271.28595, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "8513", "bbox": {"l": 271.28506, "t": 182.03814999999997, "r": 287.17139, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "\u2212", "bbox": {"l": 287.17007, "t": 181.64764000000002, "r": 293.39697, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "$^{3491]}$, Christoph Auer[0000", "bbox": {"l": 293.39706, "t": 183.62872000000004, "r": 404.1597, "b": 192.42571999999996, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "\u2212", "bbox": {"l": 404.15808, "t": 181.64764000000002, "r": 410.38498, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "0001", "bbox": {"l": 410.38507, "t": 182.03814999999997, "r": 426.27139, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "\u2212", "bbox": {"l": 426.27008, "t": 181.64764000000002, "r": 432.49697999999995, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "5761", "bbox": {"l": 432.49609, "t": 182.03814999999997, "r": 448.3824200000001, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "\u2212", "bbox": {"l": 448.3811, "t": 181.64764000000002, "r": 454.608, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "$^{0422]}$,", "bbox": {"l": 454.60808999999995, "t": 183.62872000000004, "r": 476.01270000000005, "b": 192.42571999999996, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "[0000", "bbox": {"l": 298.60608, "t": 193.99316, "r": 316.74771, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "\u2212", "bbox": {"l": 316.74609, "t": 193.60266000000001, "r": 322.97299, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "0002", "bbox": {"l": 322.97308, "t": 193.99316, "r": 338.85941, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "\u2212", "bbox": {"l": 338.85809, "t": 193.60266000000001, "r": 345.08499, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "8088", "bbox": {"l": 345.08508, "t": 193.99316, "r": 360.97141, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "\u2212", "bbox": {"l": 360.97009, "t": 193.60266000000001, "r": 367.19699, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "0823]", "bbox": {"l": 367.19611, "t": 193.99316, "r": 385.33774, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 229.52109000000002, "t": 195.58374000000003, "r": 298.6087, "b": 204.38073999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.5015264749526978, "cells": [{"id": 30, "text": "and Peter Staar", "bbox": {"l": 229.52109000000002, "t": 195.58374000000003, "r": 298.6087, "b": 204.38073999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 279.1051, "t": 217.20398, "r": 336.25153, "b": 225.27368, "coord_origin": "TOPLEFT"}, "confidence": 0.6310854554176331, "cells": [{"id": 38, "text": "IBM Research", "bbox": {"l": 279.1051, "t": 217.20398, "r": 336.25153, "b": 225.27368, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "text", "bbox": {"l": 222.96609, "t": 228.80853000000002, "r": 392.38983, "b": 236.27752999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.6924147009849548, "cells": [{"id": 39, "text": "{mly,ahn,nli,cau,taa}@zurich.ibm.com", "bbox": {"l": 222.96609, "t": 228.80853000000002, "r": 392.38983, "b": 236.27752999999996, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null}, {"label": "text", "id": 1, "page_no": 0, "cluster": {"id": 1, "label": "text", "bbox": {"l": 163.1111, "t": 270.30115, "r": 452.24878000000007, "b": 464.73447, "coord_origin": "TOPLEFT"}, "confidence": 0.9807655215263367, "cells": [{"id": 40, "text": "Abstract.", "bbox": {"l": 163.1111, "t": 270.30115, "r": 206.6358, "b": 278.22748, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Extracting tables from documents is a crucial task in any", "bbox": {"l": 211.6171, "t": 270.36395000000005, "r": 452.2447199999999, "b": 278.43364999999994, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "document conversion pipeline. Recently, transformer-based models have", "bbox": {"l": 163.1111, "t": 281.3229099999999, "r": 452.24246, "b": 289.39267, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "demonstrated that table-structure can be recognized with impressive ac-", "bbox": {"l": 163.1111, "t": 292.28189, "r": 452.24792, "b": 300.35165000000006, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "curacy using Image-to-Markup-Sequence (Im2Seq) approaches. Taking", "bbox": {"l": 163.1111, "t": 303.24088, "r": 452.2407799999999, "b": 311.31064, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "only the image of a table, such models predict a sequence of tokens (e.g.", "bbox": {"l": 163.1111, "t": 314.19888, "r": 452.24609, "b": 322.26865, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "in HTML, LaTeX) which represent the structure of the table. Since the", "bbox": {"l": 163.1111, "t": 325.15787, "r": 452.24615000000006, "b": 333.22763, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "token representation of the table structure has a significant impact on", "bbox": {"l": 163.1111, "t": 336.11685, "r": 452.24707, "b": 344.18661, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "the accuracy and run-time performance of any Im2Seq model, we inves-", "bbox": {"l": 163.1111, "t": 347.07584, "r": 452.2459999999999, "b": 355.1456, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "tigate in this paper how table-structure representation can be optimised.", "bbox": {"l": 163.1111, "t": 358.03482, "r": 452.2479900000001, "b": 366.10458, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "We propose a new, optimised table-structure language (OTSL) with a", "bbox": {"l": 163.1111, "t": 368.9938, "r": 452.24609, "b": 377.06357, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "minimized vocabulary and specific rules. The benefits of OTSL are that", "bbox": {"l": 163.1111, "t": 379.95279, "r": 452.2417, "b": 388.02255, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "it reduces the number of tokens to 5 (HTML needs 28+) and shortens", "bbox": {"l": 163.1111, "t": 390.91177, "r": 452.2443200000001, "b": 398.98154, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "the sequence length to half of HTML on average. Consequently, model", "bbox": {"l": 163.1111, "t": 401.87076, "r": 452.24878000000007, "b": 409.94052, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "accuracy improves significantly, inference time is halved compared to", "bbox": {"l": 163.1111, "t": 412.82974, "r": 452.24063000000007, "b": 420.8995100000001, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "HTML-based models, and the predicted table structures are always syn-", "bbox": {"l": 163.1111, "t": 423.78774999999996, "r": 452.24161, "b": 431.85751000000005, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "tactically correct. This in turn eliminates most post-processing needs.", "bbox": {"l": 163.1111, "t": 434.74673, "r": 452.24429, "b": 442.8165, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Popular table structure data-sets will be published in OTSL format to", "bbox": {"l": 163.1111, "t": 445.70572000000004, "r": 452.24603, "b": 453.77547999999996, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "the community.", "bbox": {"l": 163.1111, "t": 456.6647, "r": 225.56116, "b": 464.73447, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Abstract. Extracting tables from documents is a crucial task in any document conversion pipeline. Recently, transformer-based models have demonstrated that table-structure can be recognized with impressive accuracy using Image-to-Markup-Sequence (Im2Seq) approaches. Taking only the image of a table, such models predict a sequence of tokens (e.g. in HTML, LaTeX) which represent the structure of the table. Since the token representation of the table structure has a significant impact on the accuracy and run-time performance of any Im2Seq model, we investigate in this paper how table-structure representation can be optimised. We propose a new, optimised table-structure language (OTSL) with a minimized vocabulary and specific rules. The benefits of OTSL are that it reduces the number of tokens to 5 (HTML needs 28+) and shortens the sequence length to half of HTML on average. Consequently, model accuracy improves significantly, inference time is halved compared to HTML-based models, and the predicted table structures are always syntactically correct. This in turn eliminates most post-processing needs. Popular table structure data-sets will be published in OTSL format to the community."}, {"label": "text", "id": 4, "page_no": 0, "cluster": {"id": 4, "label": "text", "bbox": {"l": 163.1111, "t": 478.69394, "r": 452.24158, "b": 497.78549, "coord_origin": "TOPLEFT"}, "confidence": 0.93040531873703, "cells": [{"id": 59, "text": "Keywords:", "bbox": {"l": 163.1111, "t": 478.69394, "r": 211.94211, "b": 486.62024, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Table Structure Recognition \u00b7 Data Representation \u00b7 Trans-", "bbox": {"l": 216.55208999999996, "t": 478.75671, "r": 452.24158, "b": 486.82648, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "formers \u00b7 Optimization.", "bbox": {"l": 163.11111, "t": 489.71573, "r": 257.64185, "b": 497.78549, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Keywords: Table Structure Recognition \u00b7 Data Representation \u00b7 Transformers \u00b7 Optimization."}, {"label": "section_header", "id": 3, "page_no": 0, "cluster": {"id": 3, "label": "section_header", "bbox": {"l": 134.76512, "t": 522.11969, "r": 228.93384, "b": 532.68808, "coord_origin": "TOPLEFT"}, "confidence": 0.9392016530036926, "cells": [{"id": 62, "text": "1", "bbox": {"l": 134.76512, "t": 522.11969, "r": 141.48872, "b": 532.68808, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "Introduction", "bbox": {"l": 154.93832, "t": 522.11969, "r": 228.93384, "b": 532.68808, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1 Introduction"}, {"label": "text", "id": 0, "page_no": 0, "cluster": {"id": 0, "label": "text", "bbox": {"l": 134.76512, "t": 548.2865400000001, "r": 480.5959500000001, "b": 628.81451, "coord_origin": "TOPLEFT"}, "confidence": 0.9835679531097412, "cells": [{"id": 64, "text": "Tables are ubiquitous in documents such as scientific papers, patents, reports,", "bbox": {"l": 134.76512, "t": 548.2865400000001, "r": 480.5939, "b": 557.0835099999999, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "manuals, specification sheets or marketing material. They often encode highly", "bbox": {"l": 134.76512, "t": 560.24254, "r": 480.59180000000003, "b": 569.0395100000001, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "valuable information and therefore need to be extracted with high accuracy.", "bbox": {"l": 134.76512, "t": 572.19754, "r": 480.59283000000005, "b": 580.99451, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "Unfortunately, tables appear in documents in various sizes, styling and struc-", "bbox": {"l": 134.76512, "t": 584.15254, "r": 480.5959500000001, "b": 592.9495099999999, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "ture, making it difficult to recover their correct structure with simple analyt-", "bbox": {"l": 134.76512, "t": 596.10754, "r": 480.58688, "b": 604.90451, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "ical methods. Therefore, accurate table extraction is achieved these days with", "bbox": {"l": 134.76512, "t": 608.06255, "r": 480.59088, "b": 616.85951, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "machine-learning based methods.", "bbox": {"l": 134.76512, "t": 620.01755, "r": 279.32745, "b": 628.81451, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Tables are ubiquitous in documents such as scientific papers, patents, reports, manuals, specification sheets or marketing material. They often encode highly valuable information and therefore need to be extracted with high accuracy. Unfortunately, tables appear in documents in various sizes, styling and structure, making it difficult to recover their correct structure with simple analytical methods. Therefore, accurate table extraction is achieved these days with machine-learning based methods."}, {"label": "text", "id": 2, "page_no": 0, "cluster": {"id": 2, "label": "text", "bbox": {"l": 134.76512, "t": 632.14755, "r": 480.59583, "b": 664.85453, "coord_origin": "TOPLEFT"}, "confidence": 0.9696458578109741, "cells": [{"id": 71, "text": "In modern document understanding systems [1,15], table extraction is typi-", "bbox": {"l": 149.70811, "t": 632.14755, "r": 480.58899, "b": 640.94452, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "cally a two-step process. Firstly, every table on a page is located with a bounding", "bbox": {"l": 134.76512, "t": 644.1025500000001, "r": 480.59583, "b": 652.8995199999999, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "box, and secondly, their logical row and column structure is recognized. As of", "bbox": {"l": 134.76512, "t": 656.05756, "r": 480.59496999999993, "b": 664.85453, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In modern document understanding systems [1,15], table extraction is typically a two-step process. Firstly, every table on a page is located with a bounding box, and secondly, their logical row and column structure is recognized. As of"}], "headers": [{"label": "page_header", "id": 6, "page_no": 0, "cluster": {"id": 6, "label": "page_header", "bbox": {"l": 18.340218, "t": 209.47997999999995, "r": 36.339787, "b": 555.00003, "coord_origin": "TOPLEFT"}, "confidence": 0.8899644017219543, "cells": [{"id": 74, "text": "arXiv:2305.03393v1 [cs.CV] 5 May 2023", "bbox": {"l": 18.340218, "t": 209.47997999999995, "r": 36.339787, "b": 555.00003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "arXiv:2305.03393v1 [cs.CV] 5 May 2023"}]}}, {"page_no": 1, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "2", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "M.", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 178.07675, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37415, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Fig. 1.", "bbox": {"l": 134.765, "t": 126.33416999999997, "r": 162.64424, "b": 134.26049999999998, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Comparison between HTML and OTSL table structure representation: (A)", "bbox": {"l": 167.062, "t": 126.39697000000001, "r": 480.59106, "b": 134.46667000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "table-example with complex row and column headers, including a 2D empty span,", "bbox": {"l": 134.765, "t": 137.35595999999998, "r": 480.59018, "b": 145.42566, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "(B)", "bbox": {"l": 134.765, "t": 148.31493999999998, "r": 147.95433, "b": 156.38464, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "minimal graphical representation of table structure using rectangular layout, (C)", "bbox": {"l": 152.39224, "t": 148.31493999999998, "r": 480.59096999999997, "b": 156.38464, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "HTML representation, (D) OTSL representation. This example demonstrates many of", "bbox": {"l": 134.765, "t": 159.27392999999995, "r": 480.59189, "b": 167.34362999999996, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "the key-features of OTSL, namely its reduced vocabulary size (12 versus 5 in this case),", "bbox": {"l": 134.765, "t": 170.23290999999995, "r": 480.58914000000004, "b": 178.30260999999996, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "its reduced sequence length (55 versus 30) and a enhanced internal structure (variable", "bbox": {"l": 134.765, "t": 181.19188999999994, "r": 480.59020999999996, "b": 189.26160000000004, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "token sequence length per row in HTML versus a fixed length of rows in OTSL).", "bbox": {"l": 134.765, "t": 192.15088000000003, "r": 460.87109, "b": 200.22058000000004, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "C", "bbox": {"l": 396.41107, "t": 280.98352, "r": 402.97336, "b": 289.50903, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "C", "bbox": {"l": 418.58682, "t": 280.89792, "r": 425.14911, "b": 289.42343, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "C", "bbox": {"l": 395.74835, "t": 303.23727, "r": 402.31064, "b": 311.76279, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "C", "bbox": {"l": 407.54214, "t": 303.36981, "r": 414.10443, "b": 311.89532, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "C", "bbox": {"l": 407.56335, "t": 314.40619, "r": 414.12564, "b": 322.9317, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "C", "bbox": {"l": 418.51108, "t": 292.08502000000004, "r": 425.07336, "b": 300.61053000000004, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "C", "bbox": {"l": 429.59744, "t": 292.09106, "r": 436.1597300000001, "b": 300.61658, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "C", "bbox": {"l": 440.68759000000006, "t": 292.01230000000004, "r": 447.24987999999996, "b": 300.53781000000004, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "C", "bbox": {"l": 418.6232, "t": 303.29483, "r": 425.18549, "b": 311.82034, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "C", "bbox": {"l": 429.7095299999999, "t": 303.30011, "r": 436.27182, "b": 311.82562, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "C", "bbox": {"l": 440.7996800000001, "t": 303.22211, "r": 447.36197, "b": 311.74762, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "C", "bbox": {"l": 418.62546, "t": 314.56903, "r": 425.18774, "b": 323.09454, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "C", "bbox": {"l": 429.71181999999993, "t": 314.57434, "r": 436.27411, "b": 323.09985, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "C", "bbox": {"l": 440.80194, "t": 314.49631, "r": 447.36423, "b": 323.02182, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "C", "bbox": {"l": 407.39746, "t": 325.29031, "r": 413.95975, "b": 333.81583, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "C", "bbox": {"l": 418.45959, "t": 325.45316, "r": 425.02188, "b": 333.97867, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "C", "bbox": {"l": 429.54593, "t": 325.4592, "r": 436.10822, "b": 333.98471, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "C", "bbox": {"l": 440.63608, "t": 325.38043, "r": 447.19836, "b": 333.90594, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "NL", "bbox": {"l": 451.89511000000005, "t": 280.15717, "r": 463.51273000000003, "b": 288.68268, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "NL", "bbox": {"l": 452.1557, "t": 291.59875000000005, "r": 463.77332, "b": 300.12427, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "NL", "bbox": {"l": 452.17688000000004, "t": 302.84265, "r": 463.79449000000005, "b": 311.36816, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "NL", "bbox": {"l": 452.09887999999995, "t": 314.12441999999993, "r": 463.71648999999996, "b": 322.6499299999999, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "NL", "bbox": {"l": 452.29733, "t": 325.46906, "r": 463.91495, "b": 333.99457, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "U", "bbox": {"l": 396.09677, "t": 314.49478, "r": 402.65906, "b": 323.02029000000005, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "U", "bbox": {"l": 395.99829, "t": 325.38876000000005, "r": 402.56058, "b": 333.91428, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "U", "bbox": {"l": 396.27475, "t": 292.27057, "r": 402.83704, "b": 300.79608, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "L", "bbox": {"l": 408.54724, "t": 280.96912, "r": 413.60074, "b": 289.49463, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "L", "bbox": {"l": 430.58966, "t": 280.49725, "r": 435.6431600000001, "b": 289.02277, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "L", "bbox": {"l": 441.08069, "t": 280.38062, "r": 446.13419, "b": 288.90613, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "X", "bbox": {"l": 407.97388, "t": 292.13425, "r": 414.03625, "b": 300.65976, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "NL", "bbox": {"l": 441.25640999999996, "t": 411.1807600000001, "r": 452.87402, "b": 419.7062700000001, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "vocabulary:", "bbox": {"l": 393.75256, "t": 399.7947700000001, "r": 432.48929, "b": 406.89935, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "5", "bbox": {"l": 434.5896000000001, "t": 399.7947700000001, "r": 438.80083999999994, "b": 406.89935, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "tokens", "bbox": {"l": 440.90573, "t": 399.7947700000001, "r": 463.22235, "b": 406.89935, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "D OTSL", "bbox": {"l": 384.11816, "t": 258.54718, "r": 413.99307, "b": 265.65179, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "sequence length:", "bbox": {"l": 393.75256, "t": 266.67505000000006, "r": 451.45129000000003, "b": 273.77966000000004, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "30", "bbox": {"l": 453.55083999999994, "t": 266.67505000000006, "r": 461.97485, "b": 273.77966000000004, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "vocabulary for this table:", "bbox": {"l": 151.79318, "t": 399.76016, "r": 233.89371000000003, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "12", "bbox": {"l": 235.99332, "t": 399.76016, "r": 244.41734000000002, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "tokens", "bbox": {"l": 246.52222, "t": 399.76016, "r": 268.83884, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "A", "bbox": {"l": 154.3298, "t": 213.57457999999997, "r": 159.79837, "b": 220.67920000000004, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "B", "bbox": {"l": 321.07053, "t": 213.57457999999997, "r": 326.53909, "b": 220.67920000000004, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "<table>", "bbox": {"l": 153.0947, "t": 280.30411, "r": 175.83888, "b": 286.69824, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "<tr>", "bbox": {"l": 160.67039, "t": 287.12088, "r": 172.79608, "b": 293.51501, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "<td", "bbox": {"l": 168.24603, "t": 293.93765, "r": 177.91019, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "colspan=\u201c2\u201d", "bbox": {"l": 179.80525, "t": 293.93765, "r": 215.61517, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "rowspan=\u201c2\u201d", "bbox": {"l": 217.50886999999997, "t": 293.93765, "r": 255.58945, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": ">", "bbox": {"l": 257.48315, "t": 293.93765, "r": 261.46414, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "</td>", "bbox": {"l": 263.35785, "t": 293.93765, "r": 278.89804, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "<td", "bbox": {"l": 280.79175, "t": 293.93765, "r": 290.4559, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "colspan=\u201c3\u201d", "bbox": {"l": 292.35095, "t": 293.93765, "r": 328.16083, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": ">", "bbox": {"l": 330.05457, "t": 293.93765, "r": 334.03555, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "</td>", "bbox": {"l": 335.92926, "t": 293.93765, "r": 351.46945, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "</tr>", "bbox": {"l": 160.67039, "t": 300.75442999999996, "r": 174.68979, "b": 307.14856, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "<tr>", "bbox": {"l": 160.67039, "t": 307.57122999999996, "r": 172.79608, "b": 313.96536, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "<td>", "bbox": {"l": 168.24603, "t": 314.388, "r": 181.89255, "b": 320.78214, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "</td>", "bbox": {"l": 183.78624, "t": 314.388, "r": 199.32646, "b": 320.78214, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "<td>", "bbox": {"l": 201.22015, "t": 314.388, "r": 214.86666999999997, "b": 320.78214, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "</td>", "bbox": {"l": 216.76038, "t": 314.388, "r": 232.30058, "b": 320.78214, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "<td>", "bbox": {"l": 234.19427000000002, "t": 314.388, "r": 247.84079000000003, "b": 320.78214, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "</td>", "bbox": {"l": 249.73447999999996, "t": 314.388, "r": 265.27469, "b": 320.78214, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "</tr>", "bbox": {"l": 160.67039, "t": 321.20477, "r": 174.68979, "b": 327.59890999999993, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "<tr>", "bbox": {"l": 160.67039, "t": 328.02158, "r": 172.79608, "b": 334.41571000000005, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "<td rowspan=\u201c3\u201d > </td> <td> </td> <td> </td> <td> </td> <td> </td>", "bbox": {"l": 168.24603, "t": 334.83835, "r": 373.09091, "b": 341.23248, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "</tr>", "bbox": {"l": 160.67039, "t": 341.65512, "r": 174.68979, "b": 348.04926, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "<tr>", "bbox": {"l": 160.67039, "t": 348.47159, "r": 172.79608, "b": 354.86572, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "<td>", "bbox": {"l": 168.24603, "t": 355.28836000000007, "r": 181.89255, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "</td>", "bbox": {"l": 183.78624, "t": 355.28836000000007, "r": 199.32646, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "<td>", "bbox": {"l": 201.22015, "t": 355.28836000000007, "r": 214.86666999999997, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "</td>", "bbox": {"l": 216.76038, "t": 355.28836000000007, "r": 232.30058, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "<td>", "bbox": {"l": 234.19427000000002, "t": 355.28836000000007, "r": 247.84079000000003, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "</td>", "bbox": {"l": 249.73447999999996, "t": 355.28836000000007, "r": 265.27469, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "<td>", "bbox": {"l": 267.1684, "t": 355.28836000000007, "r": 280.81488, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "</td>", "bbox": {"l": 282.70862, "t": 355.28836000000007, "r": 298.24881, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "</tr>", "bbox": {"l": 160.67039, "t": 362.10516000000007, "r": 174.68979, "b": 368.49929999999995, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "<tr>", "bbox": {"l": 160.67039, "t": 368.92194, "r": 172.79608, "b": 375.31607, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "<td>", "bbox": {"l": 168.24603, "t": 375.73871, "r": 181.89255, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "</td>", "bbox": {"l": 183.78624, "t": 375.73871, "r": 199.32646, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "<td>", "bbox": {"l": 201.22015, "t": 375.73871, "r": 214.86666999999997, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "</td>", "bbox": {"l": 216.76038, "t": 375.73871, "r": 232.30058, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "<td>", "bbox": {"l": 234.19427000000002, "t": 375.73871, "r": 247.84079000000003, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "</td>", "bbox": {"l": 249.73447999999996, "t": 375.73871, "r": 265.27469, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "<td>", "bbox": {"l": 267.1684, "t": 375.73871, "r": 280.81488, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "</td>", "bbox": {"l": 282.70862, "t": 375.73871, "r": 298.24881, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "</tr>", "bbox": {"l": 160.67039, "t": 382.55551, "r": 174.68979, "b": 388.94965, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "</table>", "bbox": {"l": 153.0947, "t": 389.37228, "r": 177.73259, "b": 395.76642, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "C", "bbox": {"l": 395.06137, "t": 411.33353, "r": 401.62366, "b": 419.85904, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "L", "bbox": {"l": 407.42249, "t": 411.33353, "r": 412.47598, "b": 419.85904, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "U", "bbox": {"l": 418.69287, "t": 411.33353, "r": 425.25516, "b": 419.85904, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "X", "bbox": {"l": 430.5086099999999, "t": 411.33353, "r": 436.5709800000001, "b": 419.85904, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "<table>", "bbox": {"l": 152.36208, "t": 409.77362, "r": 175.10626, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "<tr>", "bbox": {"l": 178.89366, "t": 409.77362, "r": 191.01935, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "</tr>", "bbox": {"l": 194.80676, "t": 409.77362, "r": 208.82614, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "<td>", "bbox": {"l": 212.61354, "t": 409.77362, "r": 226.26003999999998, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "</td>", "bbox": {"l": 230.04745000000003, "t": 409.77362, "r": 245.58765000000002, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "<td", "bbox": {"l": 249.37506000000002, "t": 409.77362, "r": 259.03918, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "colspan=\"2\"", "bbox": {"l": 262.82797, "t": 409.77362, "r": 298.93646, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "colspan=\"3\"", "bbox": {"l": 302.72385, "t": 409.77362, "r": 338.83234, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "rowspan=\"2\"", "bbox": {"l": 152.36208, "t": 418.10522, "r": 190.74123, "b": 424.49936, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "rowspan=\"3\"", "bbox": {"l": 194.52863, "t": 418.10522, "r": 232.90777999999997, "b": 424.49936, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": ">", "bbox": {"l": 236.69518999999997, "t": 418.10522, "r": 240.67617999999996, "b": 424.49936, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "</table>", "bbox": {"l": 244.46358, "t": 418.10522, "r": 269.10144, "b": 424.49936, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "C", "bbox": {"l": 154.50595, "t": 258.60095, "r": 159.62473, "b": 265.70556999999997, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "HTML", "bbox": {"l": 164.74348, "t": 258.60095, "r": 185.21857, "b": 265.70556999999997, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "sequence length:", "bbox": {"l": 164.3548, "t": 266.49707, "r": 222.05352999999997, "b": 273.60168, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "55", "bbox": {"l": 224.15326, "t": 266.49707, "r": 232.57729, "b": 273.60168, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "today,", "bbox": {"l": 134.765, "t": 452.31378, "r": 161.32928, "b": 461.11075, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "table detection", "bbox": {"l": 164.269, "t": 452.31378, "r": 226.28617999999997, "b": 461.11075, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "in documents is a well understood problem, and the latest", "bbox": {"l": 229.992, "t": 452.31378, "r": 480.59232000000003, "b": 461.11075, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "state-of-the-art (SOTA) object detection methods provide an accuracy compa-", "bbox": {"l": 134.76501, "t": 464.26877, "r": 480.59180000000003, "b": 473.06573, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "rable to human observers [7,8,10,14,23]. On the other hand, the problem of table", "bbox": {"l": 134.76501, "t": 476.22375, "r": 480.58673, "b": 485.02072, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "structure recognition (TSR) is a lot more challenging and remains a very active", "bbox": {"l": 134.76501, "t": 488.17975, "r": 480.58658, "b": 496.97672, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "area of research, in which many novel machine learning algorithms are being", "bbox": {"l": 134.76501, "t": 500.13474, "r": 480.58978, "b": 508.9317, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "explored [3,4,5,9,11,12,13,14,17,18,21,22].", "bbox": {"l": 134.76501, "t": 512.0897199999999, "r": 313.24597, "b": 520.88669, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "Recently emerging SOTA methods for table structure recognition employ", "bbox": {"l": 149.70901, "t": 524.55072, "r": 480.58884000000006, "b": 533.3476900000001, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "transformer-based models, in which an image of the table is provided to the net-", "bbox": {"l": 134.76501, "t": 536.50671, "r": 480.5917400000001, "b": 545.30368, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "work in order to predict the structure of the table as a sequence of tokens. These", "bbox": {"l": 134.76501, "t": 548.46172, "r": 480.58868, "b": 557.25868, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "image-to-sequence (Im2Seq) models are extremely powerful, since they allow for", "bbox": {"l": 134.76501, "t": 560.41672, "r": 480.58795, "b": 569.2136800000001, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "a purely data-driven solution. The tokens of the sequence typically belong to a", "bbox": {"l": 134.76501, "t": 572.37172, "r": 480.58978, "b": 581.16869, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "markup language such as HTML, Latex or Markdown, which allow to describe", "bbox": {"l": 134.76501, "t": 584.32672, "r": 480.59479, "b": 593.12369, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "table structure as rows, columns and spanning cells in various configurations.", "bbox": {"l": 134.76501, "t": 596.28271, "r": 480.58678999999995, "b": 605.0796799999999, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "In Figure 1, we illustrate how HTML is used to represent the table-structure", "bbox": {"l": 134.76501, "t": 608.23772, "r": 480.59476, "b": 617.03468, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "of a particular example table. Public table-structure data sets such as PubTab-", "bbox": {"l": 134.76501, "t": 620.19272, "r": 480.5938100000001, "b": 628.98969, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "Net [22], and FinTabNet [21], which were created in a semi-automated way from", "bbox": {"l": 134.76501, "t": 632.1477199999999, "r": 480.59482, "b": 640.94469, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "paired PDF and HTML sources (e.g. PubMed Central), popularized primarily", "bbox": {"l": 134.76501, "t": 644.10272, "r": 480.58771, "b": 652.89969, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "the use of HTML as ground-truth representation format for TSR.", "bbox": {"l": 134.76501, "t": 656.05772, "r": 421.45377, "b": 664.8547, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 5, "label": "page_header", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8580349683761597, "cells": [{"id": 0, "text": "2", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "page_header", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9076642990112305, "cells": [{"id": 1, "text": "M.", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 178.07675, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37415, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "caption", "bbox": {"l": 134.765, "t": 126.33416999999997, "r": 480.59189, "b": 200.22058000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.8939083218574524, "cells": [{"id": 3, "text": "Fig. 1.", "bbox": {"l": 134.765, "t": 126.33416999999997, "r": 162.64424, "b": 134.26049999999998, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Comparison between HTML and OTSL table structure representation: (A)", "bbox": {"l": 167.062, "t": 126.39697000000001, "r": 480.59106, "b": 134.46667000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "table-example with complex row and column headers, including a 2D empty span,", "bbox": {"l": 134.765, "t": 137.35595999999998, "r": 480.59018, "b": 145.42566, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "(B)", "bbox": {"l": 134.765, "t": 148.31493999999998, "r": 147.95433, "b": 156.38464, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "minimal graphical representation of table structure using rectangular layout, (C)", "bbox": {"l": 152.39224, "t": 148.31493999999998, "r": 480.59096999999997, "b": 156.38464, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "HTML representation, (D) OTSL representation. This example demonstrates many of", "bbox": {"l": 134.765, "t": 159.27392999999995, "r": 480.59189, "b": 167.34362999999996, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "the key-features of OTSL, namely its reduced vocabulary size (12 versus 5 in this case),", "bbox": {"l": 134.765, "t": 170.23290999999995, "r": 480.58914000000004, "b": 178.30260999999996, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "its reduced sequence length (55 versus 30) and a enhanced internal structure (variable", "bbox": {"l": 134.765, "t": 181.19188999999994, "r": 480.59020999999996, "b": 189.26160000000004, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "token sequence length per row in HTML versus a fixed length of rows in OTSL).", "bbox": {"l": 134.765, "t": 192.15088000000003, "r": 460.87109, "b": 200.22058000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "picture", "bbox": {"l": 148.45361328125, "t": 208.37423706054688, "r": 464.3608093261719, "b": 425.8462219238281, "coord_origin": "TOPLEFT"}, "confidence": 0.9688959121704102, "cells": [{"id": 12, "text": "C", "bbox": {"l": 396.41107, "t": 280.98352, "r": 402.97336, "b": 289.50903, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "C", "bbox": {"l": 418.58682, "t": 280.89792, "r": 425.14911, "b": 289.42343, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "C", "bbox": {"l": 395.74835, "t": 303.23727, "r": 402.31064, "b": 311.76279, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "C", "bbox": {"l": 407.54214, "t": 303.36981, "r": 414.10443, "b": 311.89532, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "C", "bbox": {"l": 407.56335, "t": 314.40619, "r": 414.12564, "b": 322.9317, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "C", "bbox": {"l": 418.51108, "t": 292.08502000000004, "r": 425.07336, "b": 300.61053000000004, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "C", "bbox": {"l": 429.59744, "t": 292.09106, "r": 436.1597300000001, "b": 300.61658, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "C", "bbox": {"l": 440.68759000000006, "t": 292.01230000000004, "r": 447.24987999999996, "b": 300.53781000000004, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "C", "bbox": {"l": 418.6232, "t": 303.29483, "r": 425.18549, "b": 311.82034, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "C", "bbox": {"l": 429.7095299999999, "t": 303.30011, "r": 436.27182, "b": 311.82562, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "C", "bbox": {"l": 440.7996800000001, "t": 303.22211, "r": 447.36197, "b": 311.74762, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "C", "bbox": {"l": 418.62546, "t": 314.56903, "r": 425.18774, "b": 323.09454, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "C", "bbox": {"l": 429.71181999999993, "t": 314.57434, "r": 436.27411, "b": 323.09985, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "C", "bbox": {"l": 440.80194, "t": 314.49631, "r": 447.36423, "b": 323.02182, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "C", "bbox": {"l": 407.39746, "t": 325.29031, "r": 413.95975, "b": 333.81583, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "C", "bbox": {"l": 418.45959, "t": 325.45316, "r": 425.02188, "b": 333.97867, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "C", "bbox": {"l": 429.54593, "t": 325.4592, "r": 436.10822, "b": 333.98471, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "C", "bbox": {"l": 440.63608, "t": 325.38043, "r": 447.19836, "b": 333.90594, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "NL", "bbox": {"l": 451.89511000000005, "t": 280.15717, "r": 463.51273000000003, "b": 288.68268, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "NL", "bbox": {"l": 452.1557, "t": 291.59875000000005, "r": 463.77332, "b": 300.12427, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "NL", "bbox": {"l": 452.17688000000004, "t": 302.84265, "r": 463.79449000000005, "b": 311.36816, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "NL", "bbox": {"l": 452.09887999999995, "t": 314.12441999999993, "r": 463.71648999999996, "b": 322.6499299999999, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "NL", "bbox": {"l": 452.29733, "t": 325.46906, "r": 463.91495, "b": 333.99457, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "U", "bbox": {"l": 396.09677, "t": 314.49478, "r": 402.65906, "b": 323.02029000000005, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "U", "bbox": {"l": 395.99829, "t": 325.38876000000005, "r": 402.56058, "b": 333.91428, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "U", "bbox": {"l": 396.27475, "t": 292.27057, "r": 402.83704, "b": 300.79608, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "L", "bbox": {"l": 408.54724, "t": 280.96912, "r": 413.60074, "b": 289.49463, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "L", "bbox": {"l": 430.58966, "t": 280.49725, "r": 435.6431600000001, "b": 289.02277, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "L", "bbox": {"l": 441.08069, "t": 280.38062, "r": 446.13419, "b": 288.90613, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "X", "bbox": {"l": 407.97388, "t": 292.13425, "r": 414.03625, "b": 300.65976, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "NL", "bbox": {"l": 441.25640999999996, "t": 411.1807600000001, "r": 452.87402, "b": 419.7062700000001, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "vocabulary:", "bbox": {"l": 393.75256, "t": 399.7947700000001, "r": 432.48929, "b": 406.89935, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "5", "bbox": {"l": 434.5896000000001, "t": 399.7947700000001, "r": 438.80083999999994, "b": 406.89935, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "tokens", "bbox": {"l": 440.90573, "t": 399.7947700000001, "r": 463.22235, "b": 406.89935, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "D OTSL", "bbox": {"l": 384.11816, "t": 258.54718, "r": 413.99307, "b": 265.65179, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "sequence length:", "bbox": {"l": 393.75256, "t": 266.67505000000006, "r": 451.45129000000003, "b": 273.77966000000004, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "30", "bbox": {"l": 453.55083999999994, "t": 266.67505000000006, "r": 461.97485, "b": 273.77966000000004, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "vocabulary for this table:", "bbox": {"l": 151.79318, "t": 399.76016, "r": 233.89371000000003, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "12", "bbox": {"l": 235.99332, "t": 399.76016, "r": 244.41734000000002, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "tokens", "bbox": {"l": 246.52222, "t": 399.76016, "r": 268.83884, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "A", "bbox": {"l": 154.3298, "t": 213.57457999999997, "r": 159.79837, "b": 220.67920000000004, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "B", "bbox": {"l": 321.07053, "t": 213.57457999999997, "r": 326.53909, "b": 220.67920000000004, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "<table>", "bbox": {"l": 153.0947, "t": 280.30411, "r": 175.83888, "b": 286.69824, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "<tr>", "bbox": {"l": 160.67039, "t": 287.12088, "r": 172.79608, "b": 293.51501, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "<td", "bbox": {"l": 168.24603, "t": 293.93765, "r": 177.91019, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "colspan=\u201c2\u201d", "bbox": {"l": 179.80525, "t": 293.93765, "r": 215.61517, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "rowspan=\u201c2\u201d", "bbox": {"l": 217.50886999999997, "t": 293.93765, "r": 255.58945, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": ">", "bbox": {"l": 257.48315, "t": 293.93765, "r": 261.46414, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "</td>", "bbox": {"l": 263.35785, "t": 293.93765, "r": 278.89804, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "<td", "bbox": {"l": 280.79175, "t": 293.93765, "r": 290.4559, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "colspan=\u201c3\u201d", "bbox": {"l": 292.35095, "t": 293.93765, "r": 328.16083, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": ">", "bbox": {"l": 330.05457, "t": 293.93765, "r": 334.03555, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "</td>", "bbox": {"l": 335.92926, "t": 293.93765, "r": 351.46945, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "</tr>", "bbox": {"l": 160.67039, "t": 300.75442999999996, "r": 174.68979, "b": 307.14856, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "<tr>", "bbox": {"l": 160.67039, "t": 307.57122999999996, "r": 172.79608, "b": 313.96536, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "<td>", "bbox": {"l": 168.24603, "t": 314.388, "r": 181.89255, "b": 320.78214, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "</td>", "bbox": {"l": 183.78624, "t": 314.388, "r": 199.32646, "b": 320.78214, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "<td>", "bbox": {"l": 201.22015, "t": 314.388, "r": 214.86666999999997, "b": 320.78214, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "</td>", "bbox": {"l": 216.76038, "t": 314.388, "r": 232.30058, "b": 320.78214, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "<td>", "bbox": {"l": 234.19427000000002, "t": 314.388, "r": 247.84079000000003, "b": 320.78214, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "</td>", "bbox": {"l": 249.73447999999996, "t": 314.388, "r": 265.27469, "b": 320.78214, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "</tr>", "bbox": {"l": 160.67039, "t": 321.20477, "r": 174.68979, "b": 327.59890999999993, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "<tr>", "bbox": {"l": 160.67039, "t": 328.02158, "r": 172.79608, "b": 334.41571000000005, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "<td rowspan=\u201c3\u201d > </td> <td> </td> <td> </td> <td> </td> <td> </td>", "bbox": {"l": 168.24603, "t": 334.83835, "r": 373.09091, "b": 341.23248, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "</tr>", "bbox": {"l": 160.67039, "t": 341.65512, "r": 174.68979, "b": 348.04926, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "<tr>", "bbox": {"l": 160.67039, "t": 348.47159, "r": 172.79608, "b": 354.86572, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "<td>", "bbox": {"l": 168.24603, "t": 355.28836000000007, "r": 181.89255, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "</td>", "bbox": {"l": 183.78624, "t": 355.28836000000007, "r": 199.32646, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "<td>", "bbox": {"l": 201.22015, "t": 355.28836000000007, "r": 214.86666999999997, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "</td>", "bbox": {"l": 216.76038, "t": 355.28836000000007, "r": 232.30058, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "<td>", "bbox": {"l": 234.19427000000002, "t": 355.28836000000007, "r": 247.84079000000003, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "</td>", "bbox": {"l": 249.73447999999996, "t": 355.28836000000007, "r": 265.27469, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "<td>", "bbox": {"l": 267.1684, "t": 355.28836000000007, "r": 280.81488, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "</td>", "bbox": {"l": 282.70862, "t": 355.28836000000007, "r": 298.24881, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "</tr>", "bbox": {"l": 160.67039, "t": 362.10516000000007, "r": 174.68979, "b": 368.49929999999995, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "<tr>", "bbox": {"l": 160.67039, "t": 368.92194, "r": 172.79608, "b": 375.31607, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "<td>", "bbox": {"l": 168.24603, "t": 375.73871, "r": 181.89255, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "</td>", "bbox": {"l": 183.78624, "t": 375.73871, "r": 199.32646, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "<td>", "bbox": {"l": 201.22015, "t": 375.73871, "r": 214.86666999999997, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "</td>", "bbox": {"l": 216.76038, "t": 375.73871, "r": 232.30058, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "<td>", "bbox": {"l": 234.19427000000002, "t": 375.73871, "r": 247.84079000000003, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "</td>", "bbox": {"l": 249.73447999999996, "t": 375.73871, "r": 265.27469, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "<td>", "bbox": {"l": 267.1684, "t": 375.73871, "r": 280.81488, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "</td>", "bbox": {"l": 282.70862, "t": 375.73871, "r": 298.24881, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "</tr>", "bbox": {"l": 160.67039, "t": 382.55551, "r": 174.68979, "b": 388.94965, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "</table>", "bbox": {"l": 153.0947, "t": 389.37228, "r": 177.73259, "b": 395.76642, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "C", "bbox": {"l": 395.06137, "t": 411.33353, "r": 401.62366, "b": 419.85904, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "L", "bbox": {"l": 407.42249, "t": 411.33353, "r": 412.47598, "b": 419.85904, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "U", "bbox": {"l": 418.69287, "t": 411.33353, "r": 425.25516, "b": 419.85904, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "X", "bbox": {"l": 430.5086099999999, "t": 411.33353, "r": 436.5709800000001, "b": 419.85904, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "<table>", "bbox": {"l": 152.36208, "t": 409.77362, "r": 175.10626, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "<tr>", "bbox": {"l": 178.89366, "t": 409.77362, "r": 191.01935, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "</tr>", "bbox": {"l": 194.80676, "t": 409.77362, "r": 208.82614, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "<td>", "bbox": {"l": 212.61354, "t": 409.77362, "r": 226.26003999999998, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "</td>", "bbox": {"l": 230.04745000000003, "t": 409.77362, "r": 245.58765000000002, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "<td", "bbox": {"l": 249.37506000000002, "t": 409.77362, "r": 259.03918, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "colspan=\"2\"", "bbox": {"l": 262.82797, "t": 409.77362, "r": 298.93646, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "colspan=\"3\"", "bbox": {"l": 302.72385, "t": 409.77362, "r": 338.83234, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "rowspan=\"2\"", "bbox": {"l": 152.36208, "t": 418.10522, "r": 190.74123, "b": 424.49936, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "rowspan=\"3\"", "bbox": {"l": 194.52863, "t": 418.10522, "r": 232.90777999999997, "b": 424.49936, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": ">", "bbox": {"l": 236.69518999999997, "t": 418.10522, "r": 240.67617999999996, "b": 424.49936, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "</table>", "bbox": {"l": 244.46358, "t": 418.10522, "r": 269.10144, "b": 424.49936, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "C", "bbox": {"l": 154.50595, "t": 258.60095, "r": 159.62473, "b": 265.70556999999997, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "HTML", "bbox": {"l": 164.74348, "t": 258.60095, "r": 185.21857, "b": 265.70556999999997, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "sequence length:", "bbox": {"l": 164.3548, "t": 266.49707, "r": 222.05352999999997, "b": 273.60168, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "55", "bbox": {"l": 224.15326, "t": 266.49707, "r": 232.57729, "b": 273.60168, "coord_origin": "TOPLEFT"}}], "children": [{"id": 6, "label": "text", "bbox": {"l": 396.41107, "t": 280.98352, "r": 402.97336, "b": 289.50903, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "C", "bbox": {"l": 396.41107, "t": 280.98352, "r": 402.97336, "b": 289.50903, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "text", "bbox": {"l": 418.58682, "t": 280.89792, "r": 425.14911, "b": 289.42343, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "C", "bbox": {"l": 418.58682, "t": 280.89792, "r": 425.14911, "b": 289.42343, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "text", "bbox": {"l": 395.74835, "t": 303.23727, "r": 402.31064, "b": 311.76279, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "C", "bbox": {"l": 395.74835, "t": 303.23727, "r": 402.31064, "b": 311.76279, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 407.54214, "t": 303.36981, "r": 414.10443, "b": 311.89532, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "C", "bbox": {"l": 407.54214, "t": 303.36981, "r": 414.10443, "b": 311.89532, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "text", "bbox": {"l": 407.56335, "t": 314.40619, "r": 414.12564, "b": 322.9317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "C", "bbox": {"l": 407.56335, "t": 314.40619, "r": 414.12564, "b": 322.9317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 418.51108, "t": 292.08502000000004, "r": 425.07336, "b": 300.61053000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "C", "bbox": {"l": 418.51108, "t": 292.08502000000004, "r": 425.07336, "b": 300.61053000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 429.59744, "t": 292.09106, "r": 436.1597300000001, "b": 300.61658, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "C", "bbox": {"l": 429.59744, "t": 292.09106, "r": 436.1597300000001, "b": 300.61658, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 440.68759000000006, "t": 292.01230000000004, "r": 447.24987999999996, "b": 300.53781000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "C", "bbox": {"l": 440.68759000000006, "t": 292.01230000000004, "r": 447.24987999999996, "b": 300.53781000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 418.6232, "t": 303.29483, "r": 425.18549, "b": 311.82034, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "C", "bbox": {"l": 418.6232, "t": 303.29483, "r": 425.18549, "b": 311.82034, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 429.7095299999999, "t": 303.30011, "r": 436.27182, "b": 311.82562, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "C", "bbox": {"l": 429.7095299999999, "t": 303.30011, "r": 436.27182, "b": 311.82562, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 440.7996800000001, "t": 303.22211, "r": 447.36197, "b": 311.74762, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "C", "bbox": {"l": 440.7996800000001, "t": 303.22211, "r": 447.36197, "b": 311.74762, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 418.62546, "t": 314.56903, "r": 425.18774, "b": 323.09454, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "C", "bbox": {"l": 418.62546, "t": 314.56903, "r": 425.18774, "b": 323.09454, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 429.71181999999993, "t": 314.57434, "r": 436.27411, "b": 323.09985, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "C", "bbox": {"l": 429.71181999999993, "t": 314.57434, "r": 436.27411, "b": 323.09985, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 440.80194, "t": 314.49631, "r": 447.36423, "b": 323.02182, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "C", "bbox": {"l": 440.80194, "t": 314.49631, "r": 447.36423, "b": 323.02182, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 407.39746, "t": 325.29031, "r": 413.95975, "b": 333.81583, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "C", "bbox": {"l": 407.39746, "t": 325.29031, "r": 413.95975, "b": 333.81583, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 418.45959, "t": 325.45316, "r": 425.02188, "b": 333.97867, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "C", "bbox": {"l": 418.45959, "t": 325.45316, "r": 425.02188, "b": 333.97867, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 429.54593, "t": 325.4592, "r": 436.10822, "b": 333.98471, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "C", "bbox": {"l": 429.54593, "t": 325.4592, "r": 436.10822, "b": 333.98471, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 440.63608, "t": 325.38043, "r": 447.19836, "b": 333.90594, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "C", "bbox": {"l": 440.63608, "t": 325.38043, "r": 447.19836, "b": 333.90594, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 451.89511000000005, "t": 280.15717, "r": 463.51273000000003, "b": 288.68268, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "NL", "bbox": {"l": 451.89511000000005, "t": 280.15717, "r": 463.51273000000003, "b": 288.68268, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 452.1557, "t": 291.59875000000005, "r": 463.77332, "b": 300.12427, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "NL", "bbox": {"l": 452.1557, "t": 291.59875000000005, "r": 463.77332, "b": 300.12427, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 452.17688000000004, "t": 302.84265, "r": 463.79449000000005, "b": 311.36816, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "NL", "bbox": {"l": 452.17688000000004, "t": 302.84265, "r": 463.79449000000005, "b": 311.36816, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 452.09887999999995, "t": 314.12441999999993, "r": 463.71648999999996, "b": 322.6499299999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "NL", "bbox": {"l": 452.09887999999995, "t": 314.12441999999993, "r": 463.71648999999996, "b": 322.6499299999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 452.29733, "t": 325.46906, "r": 463.91495, "b": 333.99457, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "NL", "bbox": {"l": 452.29733, "t": 325.46906, "r": 463.91495, "b": 333.99457, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 396.09677, "t": 314.49478, "r": 402.65906, "b": 323.02029000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "U", "bbox": {"l": 396.09677, "t": 314.49478, "r": 402.65906, "b": 323.02029000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 395.99829, "t": 325.38876000000005, "r": 402.56058, "b": 333.91428, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "U", "bbox": {"l": 395.99829, "t": 325.38876000000005, "r": 402.56058, "b": 333.91428, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 396.27475, "t": 292.27057, "r": 402.83704, "b": 300.79608, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "U", "bbox": {"l": 396.27475, "t": 292.27057, "r": 402.83704, "b": 300.79608, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 408.54724, "t": 280.96912, "r": 413.60074, "b": 289.49463, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "L", "bbox": {"l": 408.54724, "t": 280.96912, "r": 413.60074, "b": 289.49463, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 430.58966, "t": 280.49725, "r": 435.6431600000001, "b": 289.02277, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "L", "bbox": {"l": 430.58966, "t": 280.49725, "r": 435.6431600000001, "b": 289.02277, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 441.08069, "t": 280.38062, "r": 446.13419, "b": 288.90613, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "L", "bbox": {"l": 441.08069, "t": 280.38062, "r": 446.13419, "b": 288.90613, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 407.97388, "t": 292.13425, "r": 414.03625, "b": 300.65976, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "X", "bbox": {"l": 407.97388, "t": 292.13425, "r": 414.03625, "b": 300.65976, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 441.25640999999996, "t": 411.1807600000001, "r": 452.87402, "b": 419.7062700000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "NL", "bbox": {"l": 441.25640999999996, "t": 411.1807600000001, "r": 452.87402, "b": 419.7062700000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 393.75256, "t": 399.7947700000001, "r": 432.48929, "b": 406.89935, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "vocabulary:", "bbox": {"l": 393.75256, "t": 399.7947700000001, "r": 432.48929, "b": 406.89935, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 434.5896000000001, "t": 399.7947700000001, "r": 438.80083999999994, "b": 406.89935, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "5", "bbox": {"l": 434.5896000000001, "t": 399.7947700000001, "r": 438.80083999999994, "b": 406.89935, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 440.90573, "t": 399.7947700000001, "r": 463.22235, "b": 406.89935, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "tokens", "bbox": {"l": 440.90573, "t": 399.7947700000001, "r": 463.22235, "b": 406.89935, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 384.11816, "t": 258.54718, "r": 413.99307, "b": 265.65179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "D OTSL", "bbox": {"l": 384.11816, "t": 258.54718, "r": 413.99307, "b": 265.65179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 393.75256, "t": 266.67505000000006, "r": 451.45129000000003, "b": 273.77966000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "sequence length:", "bbox": {"l": 393.75256, "t": 266.67505000000006, "r": 451.45129000000003, "b": 273.77966000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 453.55083999999994, "t": 266.67505000000006, "r": 461.97485, "b": 273.77966000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "30", "bbox": {"l": 453.55083999999994, "t": 266.67505000000006, "r": 461.97485, "b": 273.77966000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 151.79318, "t": 399.76016, "r": 233.89371000000003, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "vocabulary for this table:", "bbox": {"l": 151.79318, "t": 399.76016, "r": 233.89371000000003, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 235.99332, "t": 399.76016, "r": 244.41734000000002, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "12", "bbox": {"l": 235.99332, "t": 399.76016, "r": 244.41734000000002, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 246.52222, "t": 399.76016, "r": 268.83884, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "tokens", "bbox": {"l": 246.52222, "t": 399.76016, "r": 268.83884, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 154.3298, "t": 213.57457999999997, "r": 159.79837, "b": 220.67920000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "A", "bbox": {"l": 154.3298, "t": 213.57457999999997, "r": 159.79837, "b": 220.67920000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 321.07053, "t": 213.57457999999997, "r": 326.53909, "b": 220.67920000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "B", "bbox": {"l": 321.07053, "t": 213.57457999999997, "r": 326.53909, "b": 220.67920000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 153.0947, "t": 280.30411, "r": 175.83888, "b": 286.69824, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "<table>", "bbox": {"l": 153.0947, "t": 280.30411, "r": 175.83888, "b": 286.69824, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 160.67039, "t": 287.12088, "r": 172.79608, "b": 293.51501, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "<tr>", "bbox": {"l": 160.67039, "t": 287.12088, "r": 172.79608, "b": 293.51501, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 168.24603, "t": 293.93765, "r": 177.91019, "b": 300.33179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "<td", "bbox": {"l": 168.24603, "t": 293.93765, "r": 177.91019, "b": 300.33179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 179.80525, "t": 293.93765, "r": 215.61517, "b": 300.33179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "colspan=\u201c2\u201d", "bbox": {"l": 179.80525, "t": 293.93765, "r": 215.61517, "b": 300.33179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 217.50886999999997, "t": 293.93765, "r": 255.58945, "b": 300.33179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "rowspan=\u201c2\u201d", "bbox": {"l": 217.50886999999997, "t": 293.93765, "r": 255.58945, "b": 300.33179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 257.48315, "t": 293.93765, "r": 261.46414, "b": 300.33179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": ">", "bbox": {"l": 257.48315, "t": 293.93765, "r": 261.46414, "b": 300.33179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 263.35785, "t": 293.93765, "r": 278.89804, "b": 300.33179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "</td>", "bbox": {"l": 263.35785, "t": 293.93765, "r": 278.89804, "b": 300.33179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 280.79175, "t": 293.93765, "r": 290.4559, "b": 300.33179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "<td", "bbox": {"l": 280.79175, "t": 293.93765, "r": 290.4559, "b": 300.33179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 292.35095, "t": 293.93765, "r": 328.16083, "b": 300.33179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "colspan=\u201c3\u201d", "bbox": {"l": 292.35095, "t": 293.93765, "r": 328.16083, "b": 300.33179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 330.05457, "t": 293.93765, "r": 334.03555, "b": 300.33179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": ">", "bbox": {"l": 330.05457, "t": 293.93765, "r": 334.03555, "b": 300.33179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 335.92926, "t": 293.93765, "r": 351.46945, "b": 300.33179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "</td>", "bbox": {"l": 335.92926, "t": 293.93765, "r": 351.46945, "b": 300.33179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 160.67039, "t": 300.75442999999996, "r": 174.68979, "b": 307.14856, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "</tr>", "bbox": {"l": 160.67039, "t": 300.75442999999996, "r": 174.68979, "b": 307.14856, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 160.67039, "t": 307.57122999999996, "r": 172.79608, "b": 313.96536, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "<tr>", "bbox": {"l": 160.67039, "t": 307.57122999999996, "r": 172.79608, "b": 313.96536, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 168.24603, "t": 314.388, "r": 181.89255, "b": 320.78214, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "<td>", "bbox": {"l": 168.24603, "t": 314.388, "r": 181.89255, "b": 320.78214, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 183.78624, "t": 314.388, "r": 199.32646, "b": 320.78214, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "</td>", "bbox": {"l": 183.78624, "t": 314.388, "r": 199.32646, "b": 320.78214, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 201.22015, "t": 314.388, "r": 214.86666999999997, "b": 320.78214, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "<td>", "bbox": {"l": 201.22015, "t": 314.388, "r": 214.86666999999997, "b": 320.78214, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 216.76038, "t": 314.388, "r": 232.30058, "b": 320.78214, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "</td>", "bbox": {"l": 216.76038, "t": 314.388, "r": 232.30058, "b": 320.78214, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 234.19427000000002, "t": 314.388, "r": 247.84079000000003, "b": 320.78214, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "<td>", "bbox": {"l": 234.19427000000002, "t": 314.388, "r": 247.84079000000003, "b": 320.78214, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 249.73447999999996, "t": 314.388, "r": 265.27469, "b": 320.78214, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "</td>", "bbox": {"l": 249.73447999999996, "t": 314.388, "r": 265.27469, "b": 320.78214, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 160.67039, "t": 321.20477, "r": 174.68979, "b": 327.59890999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "</tr>", "bbox": {"l": 160.67039, "t": 321.20477, "r": 174.68979, "b": 327.59890999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 160.67039, "t": 328.02158, "r": 172.79608, "b": 334.41571000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "<tr>", "bbox": {"l": 160.67039, "t": 328.02158, "r": 172.79608, "b": 334.41571000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 168.24603, "t": 334.83835, "r": 373.09091, "b": 341.23248, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "<td rowspan=\u201c3\u201d > </td> <td> </td> <td> </td> <td> </td> <td> </td>", "bbox": {"l": 168.24603, "t": 334.83835, "r": 373.09091, "b": 341.23248, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 160.67039, "t": 341.65512, "r": 174.68979, "b": 348.04926, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "</tr>", "bbox": {"l": 160.67039, "t": 341.65512, "r": 174.68979, "b": 348.04926, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 160.67039, "t": 348.47159, "r": 172.79608, "b": 354.86572, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "<tr>", "bbox": {"l": 160.67039, "t": 348.47159, "r": 172.79608, "b": 354.86572, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 168.24603, "t": 355.28836000000007, "r": 181.89255, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "<td>", "bbox": {"l": 168.24603, "t": 355.28836000000007, "r": 181.89255, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 183.78624, "t": 355.28836000000007, "r": 199.32646, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "</td>", "bbox": {"l": 183.78624, "t": 355.28836000000007, "r": 199.32646, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 201.22015, "t": 355.28836000000007, "r": 214.86666999999997, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "<td>", "bbox": {"l": 201.22015, "t": 355.28836000000007, "r": 214.86666999999997, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 216.76038, "t": 355.28836000000007, "r": 232.30058, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "</td>", "bbox": {"l": 216.76038, "t": 355.28836000000007, "r": 232.30058, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 234.19427000000002, "t": 355.28836000000007, "r": 247.84079000000003, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "<td>", "bbox": {"l": 234.19427000000002, "t": 355.28836000000007, "r": 247.84079000000003, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 249.73447999999996, "t": 355.28836000000007, "r": 265.27469, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "</td>", "bbox": {"l": 249.73447999999996, "t": 355.28836000000007, "r": 265.27469, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 267.1684, "t": 355.28836000000007, "r": 280.81488, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "<td>", "bbox": {"l": 267.1684, "t": 355.28836000000007, "r": 280.81488, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 282.70862, "t": 355.28836000000007, "r": 298.24881, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "</td>", "bbox": {"l": 282.70862, "t": 355.28836000000007, "r": 298.24881, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 160.67039, "t": 362.10516000000007, "r": 174.68979, "b": 368.49929999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "</tr>", "bbox": {"l": 160.67039, "t": 362.10516000000007, "r": 174.68979, "b": 368.49929999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 160.67039, "t": 368.92194, "r": 172.79608, "b": 375.31607, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "<tr>", "bbox": {"l": 160.67039, "t": 368.92194, "r": 172.79608, "b": 375.31607, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 168.24603, "t": 375.73871, "r": 181.89255, "b": 382.13284, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "<td>", "bbox": {"l": 168.24603, "t": 375.73871, "r": 181.89255, "b": 382.13284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 183.78624, "t": 375.73871, "r": 199.32646, "b": 382.13284, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "</td>", "bbox": {"l": 183.78624, "t": 375.73871, "r": 199.32646, "b": 382.13284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 201.22015, "t": 375.73871, "r": 214.86666999999997, "b": 382.13284, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "<td>", "bbox": {"l": 201.22015, "t": 375.73871, "r": 214.86666999999997, "b": 382.13284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 216.76038, "t": 375.73871, "r": 232.30058, "b": 382.13284, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "</td>", "bbox": {"l": 216.76038, "t": 375.73871, "r": 232.30058, "b": 382.13284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 234.19427000000002, "t": 375.73871, "r": 247.84079000000003, "b": 382.13284, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "<td>", "bbox": {"l": 234.19427000000002, "t": 375.73871, "r": 247.84079000000003, "b": 382.13284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 249.73447999999996, "t": 375.73871, "r": 265.27469, "b": 382.13284, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "</td>", "bbox": {"l": 249.73447999999996, "t": 375.73871, "r": 265.27469, "b": 382.13284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 267.1684, "t": 375.73871, "r": 280.81488, "b": 382.13284, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "<td>", "bbox": {"l": 267.1684, "t": 375.73871, "r": 280.81488, "b": 382.13284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 282.70862, "t": 375.73871, "r": 298.24881, "b": 382.13284, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "</td>", "bbox": {"l": 282.70862, "t": 375.73871, "r": 298.24881, "b": 382.13284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 160.67039, "t": 382.55551, "r": 174.68979, "b": 388.94965, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "</tr>", "bbox": {"l": 160.67039, "t": 382.55551, "r": 174.68979, "b": 388.94965, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 153.0947, "t": 389.37228, "r": 177.73259, "b": 395.76642, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "</table>", "bbox": {"l": 153.0947, "t": 389.37228, "r": 177.73259, "b": 395.76642, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 395.06137, "t": 411.33353, "r": 401.62366, "b": 419.85904, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "C", "bbox": {"l": 395.06137, "t": 411.33353, "r": 401.62366, "b": 419.85904, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 407.42249, "t": 411.33353, "r": 412.47598, "b": 419.85904, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "L", "bbox": {"l": 407.42249, "t": 411.33353, "r": 412.47598, "b": 419.85904, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 418.69287, "t": 411.33353, "r": 425.25516, "b": 419.85904, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "U", "bbox": {"l": 418.69287, "t": 411.33353, "r": 425.25516, "b": 419.85904, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 430.5086099999999, "t": 411.33353, "r": 436.5709800000001, "b": 419.85904, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "X", "bbox": {"l": 430.5086099999999, "t": 411.33353, "r": 436.5709800000001, "b": 419.85904, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 152.36208, "t": 409.77362, "r": 175.10626, "b": 416.16776, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "<table>", "bbox": {"l": 152.36208, "t": 409.77362, "r": 175.10626, "b": 416.16776, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 178.89366, "t": 409.77362, "r": 191.01935, "b": 416.16776, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": "<tr>", "bbox": {"l": 178.89366, "t": 409.77362, "r": 191.01935, "b": 416.16776, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 194.80676, "t": 409.77362, "r": 208.82614, "b": 416.16776, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "</tr>", "bbox": {"l": 194.80676, "t": 409.77362, "r": 208.82614, "b": 416.16776, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 212.61354, "t": 409.77362, "r": 226.26003999999998, "b": 416.16776, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "<td>", "bbox": {"l": 212.61354, "t": 409.77362, "r": 226.26003999999998, "b": 416.16776, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 230.04745000000003, "t": 409.77362, "r": 245.58765000000002, "b": 416.16776, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": "</td>", "bbox": {"l": 230.04745000000003, "t": 409.77362, "r": 245.58765000000002, "b": 416.16776, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 249.37506000000002, "t": 409.77362, "r": 259.03918, "b": 416.16776, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 107, "text": "<td", "bbox": {"l": 249.37506000000002, "t": 409.77362, "r": 259.03918, "b": 416.16776, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 262.82797, "t": 409.77362, "r": 298.93646, "b": 416.16776, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 108, "text": "colspan=\"2\"", "bbox": {"l": 262.82797, "t": 409.77362, "r": 298.93646, "b": 416.16776, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 302.72385, "t": 409.77362, "r": 338.83234, "b": 416.16776, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 109, "text": "colspan=\"3\"", "bbox": {"l": 302.72385, "t": 409.77362, "r": 338.83234, "b": 416.16776, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 152.36208, "t": 418.10522, "r": 190.74123, "b": 424.49936, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 110, "text": "rowspan=\"2\"", "bbox": {"l": 152.36208, "t": 418.10522, "r": 190.74123, "b": 424.49936, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 194.52863, "t": 418.10522, "r": 232.90777999999997, "b": 424.49936, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 111, "text": "rowspan=\"3\"", "bbox": {"l": 194.52863, "t": 418.10522, "r": 232.90777999999997, "b": 424.49936, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 236.69518999999997, "t": 418.10522, "r": 240.67617999999996, "b": 424.49936, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 112, "text": ">", "bbox": {"l": 236.69518999999997, "t": 418.10522, "r": 240.67617999999996, "b": 424.49936, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 244.46358, "t": 418.10522, "r": 269.10144, "b": 424.49936, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 113, "text": "</table>", "bbox": {"l": 244.46358, "t": 418.10522, "r": 269.10144, "b": 424.49936, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 154.50595, "t": 258.60095, "r": 159.62473, "b": 265.70556999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 114, "text": "C", "bbox": {"l": 154.50595, "t": 258.60095, "r": 159.62473, "b": 265.70556999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 164.74348, "t": 258.60095, "r": 185.21857, "b": 265.70556999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 115, "text": "HTML", "bbox": {"l": 164.74348, "t": 258.60095, "r": 185.21857, "b": 265.70556999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 164.3548, "t": 266.49707, "r": 222.05352999999997, "b": 273.60168, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 116, "text": "sequence length:", "bbox": {"l": 164.3548, "t": 266.49707, "r": 222.05352999999997, "b": 273.60168, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 224.15326, "t": 266.49707, "r": 232.57729, "b": 273.60168, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 117, "text": "55", "bbox": {"l": 224.15326, "t": 266.49707, "r": 232.57729, "b": 273.60168, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 2, "label": "text", "bbox": {"l": 134.765, "t": 452.31378, "r": 480.59232000000003, "b": 520.88669, "coord_origin": "TOPLEFT"}, "confidence": 0.9505000710487366, "cells": [{"id": 118, "text": "today,", "bbox": {"l": 134.765, "t": 452.31378, "r": 161.32928, "b": 461.11075, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "table detection", "bbox": {"l": 164.269, "t": 452.31378, "r": 226.28617999999997, "b": 461.11075, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "in documents is a well understood problem, and the latest", "bbox": {"l": 229.992, "t": 452.31378, "r": 480.59232000000003, "b": 461.11075, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "state-of-the-art (SOTA) object detection methods provide an accuracy compa-", "bbox": {"l": 134.76501, "t": 464.26877, "r": 480.59180000000003, "b": 473.06573, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "rable to human observers [7,8,10,14,23]. On the other hand, the problem of table", "bbox": {"l": 134.76501, "t": 476.22375, "r": 480.58673, "b": 485.02072, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "structure recognition (TSR) is a lot more challenging and remains a very active", "bbox": {"l": 134.76501, "t": 488.17975, "r": 480.58658, "b": 496.97672, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "area of research, in which many novel machine learning algorithms are being", "bbox": {"l": 134.76501, "t": 500.13474, "r": 480.58978, "b": 508.9317, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "explored [3,4,5,9,11,12,13,14,17,18,21,22].", "bbox": {"l": 134.76501, "t": 512.0897199999999, "r": 313.24597, "b": 520.88669, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 134.76501, "t": 524.55072, "r": 480.59482, "b": 664.8547, "coord_origin": "TOPLEFT"}, "confidence": 0.9845513701438904, "cells": [{"id": 126, "text": "Recently emerging SOTA methods for table structure recognition employ", "bbox": {"l": 149.70901, "t": 524.55072, "r": 480.58884000000006, "b": 533.3476900000001, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "transformer-based models, in which an image of the table is provided to the net-", "bbox": {"l": 134.76501, "t": 536.50671, "r": 480.5917400000001, "b": 545.30368, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "work in order to predict the structure of the table as a sequence of tokens. These", "bbox": {"l": 134.76501, "t": 548.46172, "r": 480.58868, "b": 557.25868, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "image-to-sequence (Im2Seq) models are extremely powerful, since they allow for", "bbox": {"l": 134.76501, "t": 560.41672, "r": 480.58795, "b": 569.2136800000001, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "a purely data-driven solution. The tokens of the sequence typically belong to a", "bbox": {"l": 134.76501, "t": 572.37172, "r": 480.58978, "b": 581.16869, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "markup language such as HTML, Latex or Markdown, which allow to describe", "bbox": {"l": 134.76501, "t": 584.32672, "r": 480.59479, "b": 593.12369, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "table structure as rows, columns and spanning cells in various configurations.", "bbox": {"l": 134.76501, "t": 596.28271, "r": 480.58678999999995, "b": 605.0796799999999, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "In Figure 1, we illustrate how HTML is used to represent the table-structure", "bbox": {"l": 134.76501, "t": 608.23772, "r": 480.59476, "b": 617.03468, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "of a particular example table. Public table-structure data sets such as PubTab-", "bbox": {"l": 134.76501, "t": 620.19272, "r": 480.5938100000001, "b": 628.98969, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "Net [22], and FinTabNet [21], which were created in a semi-automated way from", "bbox": {"l": 134.76501, "t": 632.1477199999999, "r": 480.59482, "b": 640.94469, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "paired PDF and HTML sources (e.g. PubMed Central), popularized primarily", "bbox": {"l": 134.76501, "t": 644.10272, "r": 480.58771, "b": 652.89969, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "the use of HTML as ground-truth representation format for TSR.", "bbox": {"l": 134.76501, "t": 656.05772, "r": 421.45377, "b": 664.8547, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_header", "id": 5, "page_no": 1, "cluster": {"id": 5, "label": "page_header", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8580349683761597, "cells": [{"id": 0, "text": "2", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2"}, {"label": "page_header", "id": 3, "page_no": 1, "cluster": {"id": 3, "label": "page_header", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9076642990112305, "cells": [{"id": 1, "text": "M.", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 178.07675, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37415, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "M. Lysak, et al."}, {"label": "caption", "id": 4, "page_no": 1, "cluster": {"id": 4, "label": "caption", "bbox": {"l": 134.765, "t": 126.33416999999997, "r": 480.59189, "b": 200.22058000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.8939083218574524, "cells": [{"id": 3, "text": "Fig. 1.", "bbox": {"l": 134.765, "t": 126.33416999999997, "r": 162.64424, "b": 134.26049999999998, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Comparison between HTML and OTSL table structure representation: (A)", "bbox": {"l": 167.062, "t": 126.39697000000001, "r": 480.59106, "b": 134.46667000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "table-example with complex row and column headers, including a 2D empty span,", "bbox": {"l": 134.765, "t": 137.35595999999998, "r": 480.59018, "b": 145.42566, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "(B)", "bbox": {"l": 134.765, "t": 148.31493999999998, "r": 147.95433, "b": 156.38464, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "minimal graphical representation of table structure using rectangular layout, (C)", "bbox": {"l": 152.39224, "t": 148.31493999999998, "r": 480.59096999999997, "b": 156.38464, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "HTML representation, (D) OTSL representation. This example demonstrates many of", "bbox": {"l": 134.765, "t": 159.27392999999995, "r": 480.59189, "b": 167.34362999999996, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "the key-features of OTSL, namely its reduced vocabulary size (12 versus 5 in this case),", "bbox": {"l": 134.765, "t": 170.23290999999995, "r": 480.58914000000004, "b": 178.30260999999996, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "its reduced sequence length (55 versus 30) and a enhanced internal structure (variable", "bbox": {"l": 134.765, "t": 181.19188999999994, "r": 480.59020999999996, "b": 189.26160000000004, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "token sequence length per row in HTML versus a fixed length of rows in OTSL).", "bbox": {"l": 134.765, "t": 192.15088000000003, "r": 460.87109, "b": 200.22058000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Fig. 1. Comparison between HTML and OTSL table structure representation: (A) table-example with complex row and column headers, including a 2D empty span, (B) minimal graphical representation of table structure using rectangular layout, (C) HTML representation, (D) OTSL representation. This example demonstrates many of the key-features of OTSL, namely its reduced vocabulary size (12 versus 5 in this case), its reduced sequence length (55 versus 30) and a enhanced internal structure (variable token sequence length per row in HTML versus a fixed length of rows in OTSL)."}, {"label": "picture", "id": 1, "page_no": 1, "cluster": {"id": 1, "label": "picture", "bbox": {"l": 148.45361328125, "t": 208.37423706054688, "r": 464.3608093261719, "b": 425.8462219238281, "coord_origin": "TOPLEFT"}, "confidence": 0.9688959121704102, "cells": [{"id": 12, "text": "C", "bbox": {"l": 396.41107, "t": 280.98352, "r": 402.97336, "b": 289.50903, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "C", "bbox": {"l": 418.58682, "t": 280.89792, "r": 425.14911, "b": 289.42343, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "C", "bbox": {"l": 395.74835, "t": 303.23727, "r": 402.31064, "b": 311.76279, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "C", "bbox": {"l": 407.54214, "t": 303.36981, "r": 414.10443, "b": 311.89532, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "C", "bbox": {"l": 407.56335, "t": 314.40619, "r": 414.12564, "b": 322.9317, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "C", "bbox": {"l": 418.51108, "t": 292.08502000000004, "r": 425.07336, "b": 300.61053000000004, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "C", "bbox": {"l": 429.59744, "t": 292.09106, "r": 436.1597300000001, "b": 300.61658, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "C", "bbox": {"l": 440.68759000000006, "t": 292.01230000000004, "r": 447.24987999999996, "b": 300.53781000000004, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "C", "bbox": {"l": 418.6232, "t": 303.29483, "r": 425.18549, "b": 311.82034, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "C", "bbox": {"l": 429.7095299999999, "t": 303.30011, "r": 436.27182, "b": 311.82562, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "C", "bbox": {"l": 440.7996800000001, "t": 303.22211, "r": 447.36197, "b": 311.74762, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "C", "bbox": {"l": 418.62546, "t": 314.56903, "r": 425.18774, "b": 323.09454, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "C", "bbox": {"l": 429.71181999999993, "t": 314.57434, "r": 436.27411, "b": 323.09985, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "C", "bbox": {"l": 440.80194, "t": 314.49631, "r": 447.36423, "b": 323.02182, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "C", "bbox": {"l": 407.39746, "t": 325.29031, "r": 413.95975, "b": 333.81583, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "C", "bbox": {"l": 418.45959, "t": 325.45316, "r": 425.02188, "b": 333.97867, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "C", "bbox": {"l": 429.54593, "t": 325.4592, "r": 436.10822, "b": 333.98471, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "C", "bbox": {"l": 440.63608, "t": 325.38043, "r": 447.19836, "b": 333.90594, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "NL", "bbox": {"l": 451.89511000000005, "t": 280.15717, "r": 463.51273000000003, "b": 288.68268, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "NL", "bbox": {"l": 452.1557, "t": 291.59875000000005, "r": 463.77332, "b": 300.12427, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "NL", "bbox": {"l": 452.17688000000004, "t": 302.84265, "r": 463.79449000000005, "b": 311.36816, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "NL", "bbox": {"l": 452.09887999999995, "t": 314.12441999999993, "r": 463.71648999999996, "b": 322.6499299999999, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "NL", "bbox": {"l": 452.29733, "t": 325.46906, "r": 463.91495, "b": 333.99457, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "U", "bbox": {"l": 396.09677, "t": 314.49478, "r": 402.65906, "b": 323.02029000000005, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "U", "bbox": {"l": 395.99829, "t": 325.38876000000005, "r": 402.56058, "b": 333.91428, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "U", "bbox": {"l": 396.27475, "t": 292.27057, "r": 402.83704, "b": 300.79608, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "L", "bbox": {"l": 408.54724, "t": 280.96912, "r": 413.60074, "b": 289.49463, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "L", "bbox": {"l": 430.58966, "t": 280.49725, "r": 435.6431600000001, "b": 289.02277, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "L", "bbox": {"l": 441.08069, "t": 280.38062, "r": 446.13419, "b": 288.90613, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "X", "bbox": {"l": 407.97388, "t": 292.13425, "r": 414.03625, "b": 300.65976, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "NL", "bbox": {"l": 441.25640999999996, "t": 411.1807600000001, "r": 452.87402, "b": 419.7062700000001, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "vocabulary:", "bbox": {"l": 393.75256, "t": 399.7947700000001, "r": 432.48929, "b": 406.89935, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "5", "bbox": {"l": 434.5896000000001, "t": 399.7947700000001, "r": 438.80083999999994, "b": 406.89935, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "tokens", "bbox": {"l": 440.90573, "t": 399.7947700000001, "r": 463.22235, "b": 406.89935, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "D OTSL", "bbox": {"l": 384.11816, "t": 258.54718, "r": 413.99307, "b": 265.65179, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "sequence length:", "bbox": {"l": 393.75256, "t": 266.67505000000006, "r": 451.45129000000003, "b": 273.77966000000004, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "30", "bbox": {"l": 453.55083999999994, "t": 266.67505000000006, "r": 461.97485, "b": 273.77966000000004, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "vocabulary for this table:", "bbox": {"l": 151.79318, "t": 399.76016, "r": 233.89371000000003, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "12", "bbox": {"l": 235.99332, "t": 399.76016, "r": 244.41734000000002, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "tokens", "bbox": {"l": 246.52222, "t": 399.76016, "r": 268.83884, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "A", "bbox": {"l": 154.3298, "t": 213.57457999999997, "r": 159.79837, "b": 220.67920000000004, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "B", "bbox": {"l": 321.07053, "t": 213.57457999999997, "r": 326.53909, "b": 220.67920000000004, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "<table>", "bbox": {"l": 153.0947, "t": 280.30411, "r": 175.83888, "b": 286.69824, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "<tr>", "bbox": {"l": 160.67039, "t": 287.12088, "r": 172.79608, "b": 293.51501, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "<td", "bbox": {"l": 168.24603, "t": 293.93765, "r": 177.91019, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "colspan=\u201c2\u201d", "bbox": {"l": 179.80525, "t": 293.93765, "r": 215.61517, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "rowspan=\u201c2\u201d", "bbox": {"l": 217.50886999999997, "t": 293.93765, "r": 255.58945, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": ">", "bbox": {"l": 257.48315, "t": 293.93765, "r": 261.46414, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "</td>", "bbox": {"l": 263.35785, "t": 293.93765, "r": 278.89804, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "<td", "bbox": {"l": 280.79175, "t": 293.93765, "r": 290.4559, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "colspan=\u201c3\u201d", "bbox": {"l": 292.35095, "t": 293.93765, "r": 328.16083, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": ">", "bbox": {"l": 330.05457, "t": 293.93765, "r": 334.03555, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "</td>", "bbox": {"l": 335.92926, "t": 293.93765, "r": 351.46945, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "</tr>", "bbox": {"l": 160.67039, "t": 300.75442999999996, "r": 174.68979, "b": 307.14856, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "<tr>", "bbox": {"l": 160.67039, "t": 307.57122999999996, "r": 172.79608, "b": 313.96536, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "<td>", "bbox": {"l": 168.24603, "t": 314.388, "r": 181.89255, "b": 320.78214, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "</td>", "bbox": {"l": 183.78624, "t": 314.388, "r": 199.32646, "b": 320.78214, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "<td>", "bbox": {"l": 201.22015, "t": 314.388, "r": 214.86666999999997, "b": 320.78214, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "</td>", "bbox": {"l": 216.76038, "t": 314.388, "r": 232.30058, "b": 320.78214, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "<td>", "bbox": {"l": 234.19427000000002, "t": 314.388, "r": 247.84079000000003, "b": 320.78214, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "</td>", "bbox": {"l": 249.73447999999996, "t": 314.388, "r": 265.27469, "b": 320.78214, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "</tr>", "bbox": {"l": 160.67039, "t": 321.20477, "r": 174.68979, "b": 327.59890999999993, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "<tr>", "bbox": {"l": 160.67039, "t": 328.02158, "r": 172.79608, "b": 334.41571000000005, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "<td rowspan=\u201c3\u201d > </td> <td> </td> <td> </td> <td> </td> <td> </td>", "bbox": {"l": 168.24603, "t": 334.83835, "r": 373.09091, "b": 341.23248, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "</tr>", "bbox": {"l": 160.67039, "t": 341.65512, "r": 174.68979, "b": 348.04926, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "<tr>", "bbox": {"l": 160.67039, "t": 348.47159, "r": 172.79608, "b": 354.86572, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "<td>", "bbox": {"l": 168.24603, "t": 355.28836000000007, "r": 181.89255, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "</td>", "bbox": {"l": 183.78624, "t": 355.28836000000007, "r": 199.32646, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "<td>", "bbox": {"l": 201.22015, "t": 355.28836000000007, "r": 214.86666999999997, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "</td>", "bbox": {"l": 216.76038, "t": 355.28836000000007, "r": 232.30058, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "<td>", "bbox": {"l": 234.19427000000002, "t": 355.28836000000007, "r": 247.84079000000003, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "</td>", "bbox": {"l": 249.73447999999996, "t": 355.28836000000007, "r": 265.27469, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "<td>", "bbox": {"l": 267.1684, "t": 355.28836000000007, "r": 280.81488, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "</td>", "bbox": {"l": 282.70862, "t": 355.28836000000007, "r": 298.24881, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "</tr>", "bbox": {"l": 160.67039, "t": 362.10516000000007, "r": 174.68979, "b": 368.49929999999995, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "<tr>", "bbox": {"l": 160.67039, "t": 368.92194, "r": 172.79608, "b": 375.31607, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "<td>", "bbox": {"l": 168.24603, "t": 375.73871, "r": 181.89255, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "</td>", "bbox": {"l": 183.78624, "t": 375.73871, "r": 199.32646, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "<td>", "bbox": {"l": 201.22015, "t": 375.73871, "r": 214.86666999999997, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "</td>", "bbox": {"l": 216.76038, "t": 375.73871, "r": 232.30058, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "<td>", "bbox": {"l": 234.19427000000002, "t": 375.73871, "r": 247.84079000000003, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "</td>", "bbox": {"l": 249.73447999999996, "t": 375.73871, "r": 265.27469, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "<td>", "bbox": {"l": 267.1684, "t": 375.73871, "r": 280.81488, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "</td>", "bbox": {"l": 282.70862, "t": 375.73871, "r": 298.24881, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "</tr>", "bbox": {"l": 160.67039, "t": 382.55551, "r": 174.68979, "b": 388.94965, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "</table>", "bbox": {"l": 153.0947, "t": 389.37228, "r": 177.73259, "b": 395.76642, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "C", "bbox": {"l": 395.06137, "t": 411.33353, "r": 401.62366, "b": 419.85904, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "L", "bbox": {"l": 407.42249, "t": 411.33353, "r": 412.47598, "b": 419.85904, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "U", "bbox": {"l": 418.69287, "t": 411.33353, "r": 425.25516, "b": 419.85904, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "X", "bbox": {"l": 430.5086099999999, "t": 411.33353, "r": 436.5709800000001, "b": 419.85904, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "<table>", "bbox": {"l": 152.36208, "t": 409.77362, "r": 175.10626, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "<tr>", "bbox": {"l": 178.89366, "t": 409.77362, "r": 191.01935, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "</tr>", "bbox": {"l": 194.80676, "t": 409.77362, "r": 208.82614, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "<td>", "bbox": {"l": 212.61354, "t": 409.77362, "r": 226.26003999999998, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "</td>", "bbox": {"l": 230.04745000000003, "t": 409.77362, "r": 245.58765000000002, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "<td", "bbox": {"l": 249.37506000000002, "t": 409.77362, "r": 259.03918, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "colspan=\"2\"", "bbox": {"l": 262.82797, "t": 409.77362, "r": 298.93646, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "colspan=\"3\"", "bbox": {"l": 302.72385, "t": 409.77362, "r": 338.83234, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "rowspan=\"2\"", "bbox": {"l": 152.36208, "t": 418.10522, "r": 190.74123, "b": 424.49936, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "rowspan=\"3\"", "bbox": {"l": 194.52863, "t": 418.10522, "r": 232.90777999999997, "b": 424.49936, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": ">", "bbox": {"l": 236.69518999999997, "t": 418.10522, "r": 240.67617999999996, "b": 424.49936, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "</table>", "bbox": {"l": 244.46358, "t": 418.10522, "r": 269.10144, "b": 424.49936, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "C", "bbox": {"l": 154.50595, "t": 258.60095, "r": 159.62473, "b": 265.70556999999997, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "HTML", "bbox": {"l": 164.74348, "t": 258.60095, "r": 185.21857, "b": 265.70556999999997, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "sequence length:", "bbox": {"l": 164.3548, "t": 266.49707, "r": 222.05352999999997, "b": 273.60168, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "55", "bbox": {"l": 224.15326, "t": 266.49707, "r": 232.57729, "b": 273.60168, "coord_origin": "TOPLEFT"}}], "children": [{"id": 6, "label": "text", "bbox": {"l": 396.41107, "t": 280.98352, "r": 402.97336, "b": 289.50903, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "C", "bbox": {"l": 396.41107, "t": 280.98352, "r": 402.97336, "b": 289.50903, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "text", "bbox": {"l": 418.58682, "t": 280.89792, "r": 425.14911, "b": 289.42343, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "C", "bbox": {"l": 418.58682, "t": 280.89792, "r": 425.14911, "b": 289.42343, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "text", "bbox": {"l": 395.74835, "t": 303.23727, "r": 402.31064, "b": 311.76279, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "C", "bbox": {"l": 395.74835, "t": 303.23727, "r": 402.31064, "b": 311.76279, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 407.54214, "t": 303.36981, "r": 414.10443, "b": 311.89532, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "C", "bbox": {"l": 407.54214, "t": 303.36981, "r": 414.10443, "b": 311.89532, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "text", "bbox": {"l": 407.56335, "t": 314.40619, "r": 414.12564, "b": 322.9317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "C", "bbox": {"l": 407.56335, "t": 314.40619, "r": 414.12564, "b": 322.9317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 418.51108, "t": 292.08502000000004, "r": 425.07336, "b": 300.61053000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "C", "bbox": {"l": 418.51108, "t": 292.08502000000004, "r": 425.07336, "b": 300.61053000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 429.59744, "t": 292.09106, "r": 436.1597300000001, "b": 300.61658, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "C", "bbox": {"l": 429.59744, "t": 292.09106, "r": 436.1597300000001, "b": 300.61658, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 440.68759000000006, "t": 292.01230000000004, "r": 447.24987999999996, "b": 300.53781000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "C", "bbox": {"l": 440.68759000000006, "t": 292.01230000000004, "r": 447.24987999999996, "b": 300.53781000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 418.6232, "t": 303.29483, "r": 425.18549, "b": 311.82034, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "C", "bbox": {"l": 418.6232, "t": 303.29483, "r": 425.18549, "b": 311.82034, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 429.7095299999999, "t": 303.30011, "r": 436.27182, "b": 311.82562, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "C", "bbox": {"l": 429.7095299999999, "t": 303.30011, "r": 436.27182, "b": 311.82562, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 440.7996800000001, "t": 303.22211, "r": 447.36197, "b": 311.74762, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "C", "bbox": {"l": 440.7996800000001, "t": 303.22211, "r": 447.36197, "b": 311.74762, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 418.62546, "t": 314.56903, "r": 425.18774, "b": 323.09454, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "C", "bbox": {"l": 418.62546, "t": 314.56903, "r": 425.18774, "b": 323.09454, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 429.71181999999993, "t": 314.57434, "r": 436.27411, "b": 323.09985, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "C", "bbox": {"l": 429.71181999999993, "t": 314.57434, "r": 436.27411, "b": 323.09985, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 440.80194, "t": 314.49631, "r": 447.36423, "b": 323.02182, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "C", "bbox": {"l": 440.80194, "t": 314.49631, "r": 447.36423, "b": 323.02182, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 407.39746, "t": 325.29031, "r": 413.95975, "b": 333.81583, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "C", "bbox": {"l": 407.39746, "t": 325.29031, "r": 413.95975, "b": 333.81583, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 418.45959, "t": 325.45316, "r": 425.02188, "b": 333.97867, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "C", "bbox": {"l": 418.45959, "t": 325.45316, "r": 425.02188, "b": 333.97867, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 429.54593, "t": 325.4592, "r": 436.10822, "b": 333.98471, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "C", "bbox": {"l": 429.54593, "t": 325.4592, "r": 436.10822, "b": 333.98471, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 440.63608, "t": 325.38043, "r": 447.19836, "b": 333.90594, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "C", "bbox": {"l": 440.63608, "t": 325.38043, "r": 447.19836, "b": 333.90594, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 451.89511000000005, "t": 280.15717, "r": 463.51273000000003, "b": 288.68268, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "NL", "bbox": {"l": 451.89511000000005, "t": 280.15717, "r": 463.51273000000003, "b": 288.68268, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 452.1557, "t": 291.59875000000005, "r": 463.77332, "b": 300.12427, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "NL", "bbox": {"l": 452.1557, "t": 291.59875000000005, "r": 463.77332, "b": 300.12427, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 452.17688000000004, "t": 302.84265, "r": 463.79449000000005, "b": 311.36816, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "NL", "bbox": {"l": 452.17688000000004, "t": 302.84265, "r": 463.79449000000005, "b": 311.36816, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 452.09887999999995, "t": 314.12441999999993, "r": 463.71648999999996, "b": 322.6499299999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "NL", "bbox": {"l": 452.09887999999995, "t": 314.12441999999993, "r": 463.71648999999996, "b": 322.6499299999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 452.29733, "t": 325.46906, "r": 463.91495, "b": 333.99457, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "NL", "bbox": {"l": 452.29733, "t": 325.46906, "r": 463.91495, "b": 333.99457, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 396.09677, "t": 314.49478, "r": 402.65906, "b": 323.02029000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "U", "bbox": {"l": 396.09677, "t": 314.49478, "r": 402.65906, "b": 323.02029000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 395.99829, "t": 325.38876000000005, "r": 402.56058, "b": 333.91428, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "U", "bbox": {"l": 395.99829, "t": 325.38876000000005, "r": 402.56058, "b": 333.91428, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 396.27475, "t": 292.27057, "r": 402.83704, "b": 300.79608, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "U", "bbox": {"l": 396.27475, "t": 292.27057, "r": 402.83704, "b": 300.79608, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 408.54724, "t": 280.96912, "r": 413.60074, "b": 289.49463, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "L", "bbox": {"l": 408.54724, "t": 280.96912, "r": 413.60074, "b": 289.49463, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 430.58966, "t": 280.49725, "r": 435.6431600000001, "b": 289.02277, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "L", "bbox": {"l": 430.58966, "t": 280.49725, "r": 435.6431600000001, "b": 289.02277, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 441.08069, "t": 280.38062, "r": 446.13419, "b": 288.90613, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "L", "bbox": {"l": 441.08069, "t": 280.38062, "r": 446.13419, "b": 288.90613, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 407.97388, "t": 292.13425, "r": 414.03625, "b": 300.65976, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "X", "bbox": {"l": 407.97388, "t": 292.13425, "r": 414.03625, "b": 300.65976, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 441.25640999999996, "t": 411.1807600000001, "r": 452.87402, "b": 419.7062700000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "NL", "bbox": {"l": 441.25640999999996, "t": 411.1807600000001, "r": 452.87402, "b": 419.7062700000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 393.75256, "t": 399.7947700000001, "r": 432.48929, "b": 406.89935, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "vocabulary:", "bbox": {"l": 393.75256, "t": 399.7947700000001, "r": 432.48929, "b": 406.89935, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 434.5896000000001, "t": 399.7947700000001, "r": 438.80083999999994, "b": 406.89935, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "5", "bbox": {"l": 434.5896000000001, "t": 399.7947700000001, "r": 438.80083999999994, "b": 406.89935, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 440.90573, "t": 399.7947700000001, "r": 463.22235, "b": 406.89935, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "tokens", "bbox": {"l": 440.90573, "t": 399.7947700000001, "r": 463.22235, "b": 406.89935, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 384.11816, "t": 258.54718, "r": 413.99307, "b": 265.65179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "D OTSL", "bbox": {"l": 384.11816, "t": 258.54718, "r": 413.99307, "b": 265.65179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 393.75256, "t": 266.67505000000006, "r": 451.45129000000003, "b": 273.77966000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "sequence length:", "bbox": {"l": 393.75256, "t": 266.67505000000006, "r": 451.45129000000003, "b": 273.77966000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 453.55083999999994, "t": 266.67505000000006, "r": 461.97485, "b": 273.77966000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "30", "bbox": {"l": 453.55083999999994, "t": 266.67505000000006, "r": 461.97485, "b": 273.77966000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 151.79318, "t": 399.76016, "r": 233.89371000000003, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "vocabulary for this table:", "bbox": {"l": 151.79318, "t": 399.76016, "r": 233.89371000000003, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 235.99332, "t": 399.76016, "r": 244.41734000000002, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "12", "bbox": {"l": 235.99332, "t": 399.76016, "r": 244.41734000000002, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 246.52222, "t": 399.76016, "r": 268.83884, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "tokens", "bbox": {"l": 246.52222, "t": 399.76016, "r": 268.83884, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 154.3298, "t": 213.57457999999997, "r": 159.79837, "b": 220.67920000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "A", "bbox": {"l": 154.3298, "t": 213.57457999999997, "r": 159.79837, "b": 220.67920000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 321.07053, "t": 213.57457999999997, "r": 326.53909, "b": 220.67920000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "B", "bbox": {"l": 321.07053, "t": 213.57457999999997, "r": 326.53909, "b": 220.67920000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 153.0947, "t": 280.30411, "r": 175.83888, "b": 286.69824, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "<table>", "bbox": {"l": 153.0947, "t": 280.30411, "r": 175.83888, "b": 286.69824, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 160.67039, "t": 287.12088, "r": 172.79608, "b": 293.51501, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "<tr>", "bbox": {"l": 160.67039, "t": 287.12088, "r": 172.79608, "b": 293.51501, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 168.24603, "t": 293.93765, "r": 177.91019, "b": 300.33179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "<td", "bbox": {"l": 168.24603, "t": 293.93765, "r": 177.91019, "b": 300.33179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 179.80525, "t": 293.93765, "r": 215.61517, "b": 300.33179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "colspan=\u201c2\u201d", "bbox": {"l": 179.80525, "t": 293.93765, "r": 215.61517, "b": 300.33179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 217.50886999999997, "t": 293.93765, "r": 255.58945, "b": 300.33179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "rowspan=\u201c2\u201d", "bbox": {"l": 217.50886999999997, "t": 293.93765, "r": 255.58945, "b": 300.33179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 257.48315, "t": 293.93765, "r": 261.46414, "b": 300.33179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": ">", "bbox": {"l": 257.48315, "t": 293.93765, "r": 261.46414, "b": 300.33179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 263.35785, "t": 293.93765, "r": 278.89804, "b": 300.33179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "</td>", "bbox": {"l": 263.35785, "t": 293.93765, "r": 278.89804, "b": 300.33179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 280.79175, "t": 293.93765, "r": 290.4559, "b": 300.33179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "<td", "bbox": {"l": 280.79175, "t": 293.93765, "r": 290.4559, "b": 300.33179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 292.35095, "t": 293.93765, "r": 328.16083, "b": 300.33179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "colspan=\u201c3\u201d", "bbox": {"l": 292.35095, "t": 293.93765, "r": 328.16083, "b": 300.33179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 330.05457, "t": 293.93765, "r": 334.03555, "b": 300.33179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": ">", "bbox": {"l": 330.05457, "t": 293.93765, "r": 334.03555, "b": 300.33179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 335.92926, "t": 293.93765, "r": 351.46945, "b": 300.33179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "</td>", "bbox": {"l": 335.92926, "t": 293.93765, "r": 351.46945, "b": 300.33179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 160.67039, "t": 300.75442999999996, "r": 174.68979, "b": 307.14856, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "</tr>", "bbox": {"l": 160.67039, "t": 300.75442999999996, "r": 174.68979, "b": 307.14856, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 160.67039, "t": 307.57122999999996, "r": 172.79608, "b": 313.96536, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "<tr>", "bbox": {"l": 160.67039, "t": 307.57122999999996, "r": 172.79608, "b": 313.96536, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 168.24603, "t": 314.388, "r": 181.89255, "b": 320.78214, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "<td>", "bbox": {"l": 168.24603, "t": 314.388, "r": 181.89255, "b": 320.78214, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 183.78624, "t": 314.388, "r": 199.32646, "b": 320.78214, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "</td>", "bbox": {"l": 183.78624, "t": 314.388, "r": 199.32646, "b": 320.78214, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 201.22015, "t": 314.388, "r": 214.86666999999997, "b": 320.78214, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "<td>", "bbox": {"l": 201.22015, "t": 314.388, "r": 214.86666999999997, "b": 320.78214, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 216.76038, "t": 314.388, "r": 232.30058, "b": 320.78214, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "</td>", "bbox": {"l": 216.76038, "t": 314.388, "r": 232.30058, "b": 320.78214, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 234.19427000000002, "t": 314.388, "r": 247.84079000000003, "b": 320.78214, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "<td>", "bbox": {"l": 234.19427000000002, "t": 314.388, "r": 247.84079000000003, "b": 320.78214, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 249.73447999999996, "t": 314.388, "r": 265.27469, "b": 320.78214, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "</td>", "bbox": {"l": 249.73447999999996, "t": 314.388, "r": 265.27469, "b": 320.78214, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 160.67039, "t": 321.20477, "r": 174.68979, "b": 327.59890999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "</tr>", "bbox": {"l": 160.67039, "t": 321.20477, "r": 174.68979, "b": 327.59890999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 160.67039, "t": 328.02158, "r": 172.79608, "b": 334.41571000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "<tr>", "bbox": {"l": 160.67039, "t": 328.02158, "r": 172.79608, "b": 334.41571000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 168.24603, "t": 334.83835, "r": 373.09091, "b": 341.23248, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "<td rowspan=\u201c3\u201d > </td> <td> </td> <td> </td> <td> </td> <td> </td>", "bbox": {"l": 168.24603, "t": 334.83835, "r": 373.09091, "b": 341.23248, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 160.67039, "t": 341.65512, "r": 174.68979, "b": 348.04926, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "</tr>", "bbox": {"l": 160.67039, "t": 341.65512, "r": 174.68979, "b": 348.04926, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 160.67039, "t": 348.47159, "r": 172.79608, "b": 354.86572, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "<tr>", "bbox": {"l": 160.67039, "t": 348.47159, "r": 172.79608, "b": 354.86572, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 168.24603, "t": 355.28836000000007, "r": 181.89255, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "<td>", "bbox": {"l": 168.24603, "t": 355.28836000000007, "r": 181.89255, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 183.78624, "t": 355.28836000000007, "r": 199.32646, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "</td>", "bbox": {"l": 183.78624, "t": 355.28836000000007, "r": 199.32646, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 201.22015, "t": 355.28836000000007, "r": 214.86666999999997, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "<td>", "bbox": {"l": 201.22015, "t": 355.28836000000007, "r": 214.86666999999997, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 216.76038, "t": 355.28836000000007, "r": 232.30058, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "</td>", "bbox": {"l": 216.76038, "t": 355.28836000000007, "r": 232.30058, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 234.19427000000002, "t": 355.28836000000007, "r": 247.84079000000003, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "<td>", "bbox": {"l": 234.19427000000002, "t": 355.28836000000007, "r": 247.84079000000003, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 249.73447999999996, "t": 355.28836000000007, "r": 265.27469, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "</td>", "bbox": {"l": 249.73447999999996, "t": 355.28836000000007, "r": 265.27469, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 267.1684, "t": 355.28836000000007, "r": 280.81488, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "<td>", "bbox": {"l": 267.1684, "t": 355.28836000000007, "r": 280.81488, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 282.70862, "t": 355.28836000000007, "r": 298.24881, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "</td>", "bbox": {"l": 282.70862, "t": 355.28836000000007, "r": 298.24881, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 160.67039, "t": 362.10516000000007, "r": 174.68979, "b": 368.49929999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "</tr>", "bbox": {"l": 160.67039, "t": 362.10516000000007, "r": 174.68979, "b": 368.49929999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 160.67039, "t": 368.92194, "r": 172.79608, "b": 375.31607, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "<tr>", "bbox": {"l": 160.67039, "t": 368.92194, "r": 172.79608, "b": 375.31607, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 168.24603, "t": 375.73871, "r": 181.89255, "b": 382.13284, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "<td>", "bbox": {"l": 168.24603, "t": 375.73871, "r": 181.89255, "b": 382.13284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 183.78624, "t": 375.73871, "r": 199.32646, "b": 382.13284, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "</td>", "bbox": {"l": 183.78624, "t": 375.73871, "r": 199.32646, "b": 382.13284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 201.22015, "t": 375.73871, "r": 214.86666999999997, "b": 382.13284, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "<td>", "bbox": {"l": 201.22015, "t": 375.73871, "r": 214.86666999999997, "b": 382.13284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 216.76038, "t": 375.73871, "r": 232.30058, "b": 382.13284, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "</td>", "bbox": {"l": 216.76038, "t": 375.73871, "r": 232.30058, "b": 382.13284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 234.19427000000002, "t": 375.73871, "r": 247.84079000000003, "b": 382.13284, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "<td>", "bbox": {"l": 234.19427000000002, "t": 375.73871, "r": 247.84079000000003, "b": 382.13284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 249.73447999999996, "t": 375.73871, "r": 265.27469, "b": 382.13284, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "</td>", "bbox": {"l": 249.73447999999996, "t": 375.73871, "r": 265.27469, "b": 382.13284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 267.1684, "t": 375.73871, "r": 280.81488, "b": 382.13284, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "<td>", "bbox": {"l": 267.1684, "t": 375.73871, "r": 280.81488, "b": 382.13284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 282.70862, "t": 375.73871, "r": 298.24881, "b": 382.13284, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "</td>", "bbox": {"l": 282.70862, "t": 375.73871, "r": 298.24881, "b": 382.13284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 160.67039, "t": 382.55551, "r": 174.68979, "b": 388.94965, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "</tr>", "bbox": {"l": 160.67039, "t": 382.55551, "r": 174.68979, "b": 388.94965, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 153.0947, "t": 389.37228, "r": 177.73259, "b": 395.76642, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "</table>", "bbox": {"l": 153.0947, "t": 389.37228, "r": 177.73259, "b": 395.76642, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 395.06137, "t": 411.33353, "r": 401.62366, "b": 419.85904, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "C", "bbox": {"l": 395.06137, "t": 411.33353, "r": 401.62366, "b": 419.85904, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 407.42249, "t": 411.33353, "r": 412.47598, "b": 419.85904, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "L", "bbox": {"l": 407.42249, "t": 411.33353, "r": 412.47598, "b": 419.85904, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 418.69287, "t": 411.33353, "r": 425.25516, "b": 419.85904, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "U", "bbox": {"l": 418.69287, "t": 411.33353, "r": 425.25516, "b": 419.85904, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 430.5086099999999, "t": 411.33353, "r": 436.5709800000001, "b": 419.85904, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "X", "bbox": {"l": 430.5086099999999, "t": 411.33353, "r": 436.5709800000001, "b": 419.85904, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 152.36208, "t": 409.77362, "r": 175.10626, "b": 416.16776, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "<table>", "bbox": {"l": 152.36208, "t": 409.77362, "r": 175.10626, "b": 416.16776, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 178.89366, "t": 409.77362, "r": 191.01935, "b": 416.16776, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": "<tr>", "bbox": {"l": 178.89366, "t": 409.77362, "r": 191.01935, "b": 416.16776, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 194.80676, "t": 409.77362, "r": 208.82614, "b": 416.16776, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "</tr>", "bbox": {"l": 194.80676, "t": 409.77362, "r": 208.82614, "b": 416.16776, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 212.61354, "t": 409.77362, "r": 226.26003999999998, "b": 416.16776, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "<td>", "bbox": {"l": 212.61354, "t": 409.77362, "r": 226.26003999999998, "b": 416.16776, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 230.04745000000003, "t": 409.77362, "r": 245.58765000000002, "b": 416.16776, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": "</td>", "bbox": {"l": 230.04745000000003, "t": 409.77362, "r": 245.58765000000002, "b": 416.16776, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 249.37506000000002, "t": 409.77362, "r": 259.03918, "b": 416.16776, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 107, "text": "<td", "bbox": {"l": 249.37506000000002, "t": 409.77362, "r": 259.03918, "b": 416.16776, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 262.82797, "t": 409.77362, "r": 298.93646, "b": 416.16776, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 108, "text": "colspan=\"2\"", "bbox": {"l": 262.82797, "t": 409.77362, "r": 298.93646, "b": 416.16776, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 302.72385, "t": 409.77362, "r": 338.83234, "b": 416.16776, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 109, "text": "colspan=\"3\"", "bbox": {"l": 302.72385, "t": 409.77362, "r": 338.83234, "b": 416.16776, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 152.36208, "t": 418.10522, "r": 190.74123, "b": 424.49936, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 110, "text": "rowspan=\"2\"", "bbox": {"l": 152.36208, "t": 418.10522, "r": 190.74123, "b": 424.49936, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 194.52863, "t": 418.10522, "r": 232.90777999999997, "b": 424.49936, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 111, "text": "rowspan=\"3\"", "bbox": {"l": 194.52863, "t": 418.10522, "r": 232.90777999999997, "b": 424.49936, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 236.69518999999997, "t": 418.10522, "r": 240.67617999999996, "b": 424.49936, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 112, "text": ">", "bbox": {"l": 236.69518999999997, "t": 418.10522, "r": 240.67617999999996, "b": 424.49936, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 244.46358, "t": 418.10522, "r": 269.10144, "b": 424.49936, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 113, "text": "</table>", "bbox": {"l": 244.46358, "t": 418.10522, "r": 269.10144, "b": 424.49936, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 154.50595, "t": 258.60095, "r": 159.62473, "b": 265.70556999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 114, "text": "C", "bbox": {"l": 154.50595, "t": 258.60095, "r": 159.62473, "b": 265.70556999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 164.74348, "t": 258.60095, "r": 185.21857, "b": 265.70556999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 115, "text": "HTML", "bbox": {"l": 164.74348, "t": 258.60095, "r": 185.21857, "b": 265.70556999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 164.3548, "t": 266.49707, "r": 222.05352999999997, "b": 273.60168, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 116, "text": "sequence length:", "bbox": {"l": 164.3548, "t": 266.49707, "r": 222.05352999999997, "b": 273.60168, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 224.15326, "t": 266.49707, "r": 232.57729, "b": 273.60168, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 117, "text": "55", "bbox": {"l": 224.15326, "t": 266.49707, "r": 232.57729, "b": 273.60168, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "text", "id": 2, "page_no": 1, "cluster": {"id": 2, "label": "text", "bbox": {"l": 134.765, "t": 452.31378, "r": 480.59232000000003, "b": 520.88669, "coord_origin": "TOPLEFT"}, "confidence": 0.9505000710487366, "cells": [{"id": 118, "text": "today,", "bbox": {"l": 134.765, "t": 452.31378, "r": 161.32928, "b": 461.11075, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "table detection", "bbox": {"l": 164.269, "t": 452.31378, "r": 226.28617999999997, "b": 461.11075, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "in documents is a well understood problem, and the latest", "bbox": {"l": 229.992, "t": 452.31378, "r": 480.59232000000003, "b": 461.11075, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "state-of-the-art (SOTA) object detection methods provide an accuracy compa-", "bbox": {"l": 134.76501, "t": 464.26877, "r": 480.59180000000003, "b": 473.06573, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "rable to human observers [7,8,10,14,23]. On the other hand, the problem of table", "bbox": {"l": 134.76501, "t": 476.22375, "r": 480.58673, "b": 485.02072, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "structure recognition (TSR) is a lot more challenging and remains a very active", "bbox": {"l": 134.76501, "t": 488.17975, "r": 480.58658, "b": 496.97672, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "area of research, in which many novel machine learning algorithms are being", "bbox": {"l": 134.76501, "t": 500.13474, "r": 480.58978, "b": 508.9317, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "explored [3,4,5,9,11,12,13,14,17,18,21,22].", "bbox": {"l": 134.76501, "t": 512.0897199999999, "r": 313.24597, "b": 520.88669, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "today, table detection in documents is a well understood problem, and the latest state-of-the-art (SOTA) object detection methods provide an accuracy comparable to human observers [7,8,10,14,23]. On the other hand, the problem of table structure recognition (TSR) is a lot more challenging and remains a very active area of research, in which many novel machine learning algorithms are being explored [3,4,5,9,11,12,13,14,17,18,21,22]."}, {"label": "text", "id": 0, "page_no": 1, "cluster": {"id": 0, "label": "text", "bbox": {"l": 134.76501, "t": 524.55072, "r": 480.59482, "b": 664.8547, "coord_origin": "TOPLEFT"}, "confidence": 0.9845513701438904, "cells": [{"id": 126, "text": "Recently emerging SOTA methods for table structure recognition employ", "bbox": {"l": 149.70901, "t": 524.55072, "r": 480.58884000000006, "b": 533.3476900000001, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "transformer-based models, in which an image of the table is provided to the net-", "bbox": {"l": 134.76501, "t": 536.50671, "r": 480.5917400000001, "b": 545.30368, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "work in order to predict the structure of the table as a sequence of tokens. These", "bbox": {"l": 134.76501, "t": 548.46172, "r": 480.58868, "b": 557.25868, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "image-to-sequence (Im2Seq) models are extremely powerful, since they allow for", "bbox": {"l": 134.76501, "t": 560.41672, "r": 480.58795, "b": 569.2136800000001, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "a purely data-driven solution. The tokens of the sequence typically belong to a", "bbox": {"l": 134.76501, "t": 572.37172, "r": 480.58978, "b": 581.16869, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "markup language such as HTML, Latex or Markdown, which allow to describe", "bbox": {"l": 134.76501, "t": 584.32672, "r": 480.59479, "b": 593.12369, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "table structure as rows, columns and spanning cells in various configurations.", "bbox": {"l": 134.76501, "t": 596.28271, "r": 480.58678999999995, "b": 605.0796799999999, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "In Figure 1, we illustrate how HTML is used to represent the table-structure", "bbox": {"l": 134.76501, "t": 608.23772, "r": 480.59476, "b": 617.03468, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "of a particular example table. Public table-structure data sets such as PubTab-", "bbox": {"l": 134.76501, "t": 620.19272, "r": 480.5938100000001, "b": 628.98969, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "Net [22], and FinTabNet [21], which were created in a semi-automated way from", "bbox": {"l": 134.76501, "t": 632.1477199999999, "r": 480.59482, "b": 640.94469, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "paired PDF and HTML sources (e.g. PubMed Central), popularized primarily", "bbox": {"l": 134.76501, "t": 644.10272, "r": 480.58771, "b": 652.89969, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "the use of HTML as ground-truth representation format for TSR.", "bbox": {"l": 134.76501, "t": 656.05772, "r": 421.45377, "b": 664.8547, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Recently emerging SOTA methods for table structure recognition employ transformer-based models, in which an image of the table is provided to the network in order to predict the structure of the table as a sequence of tokens. These image-to-sequence (Im2Seq) models are extremely powerful, since they allow for a purely data-driven solution. The tokens of the sequence typically belong to a markup language such as HTML, Latex or Markdown, which allow to describe table structure as rows, columns and spanning cells in various configurations. In Figure 1, we illustrate how HTML is used to represent the table-structure of a particular example table. Public table-structure data sets such as PubTabNet [22], and FinTabNet [21], which were created in a semi-automated way from paired PDF and HTML sources (e.g. PubMed Central), popularized primarily the use of HTML as ground-truth representation format for TSR."}], "body": [{"label": "caption", "id": 4, "page_no": 1, "cluster": {"id": 4, "label": "caption", "bbox": {"l": 134.765, "t": 126.33416999999997, "r": 480.59189, "b": 200.22058000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.8939083218574524, "cells": [{"id": 3, "text": "Fig. 1.", "bbox": {"l": 134.765, "t": 126.33416999999997, "r": 162.64424, "b": 134.26049999999998, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Comparison between HTML and OTSL table structure representation: (A)", "bbox": {"l": 167.062, "t": 126.39697000000001, "r": 480.59106, "b": 134.46667000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "table-example with complex row and column headers, including a 2D empty span,", "bbox": {"l": 134.765, "t": 137.35595999999998, "r": 480.59018, "b": 145.42566, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "(B)", "bbox": {"l": 134.765, "t": 148.31493999999998, "r": 147.95433, "b": 156.38464, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "minimal graphical representation of table structure using rectangular layout, (C)", "bbox": {"l": 152.39224, "t": 148.31493999999998, "r": 480.59096999999997, "b": 156.38464, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "HTML representation, (D) OTSL representation. This example demonstrates many of", "bbox": {"l": 134.765, "t": 159.27392999999995, "r": 480.59189, "b": 167.34362999999996, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "the key-features of OTSL, namely its reduced vocabulary size (12 versus 5 in this case),", "bbox": {"l": 134.765, "t": 170.23290999999995, "r": 480.58914000000004, "b": 178.30260999999996, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "its reduced sequence length (55 versus 30) and a enhanced internal structure (variable", "bbox": {"l": 134.765, "t": 181.19188999999994, "r": 480.59020999999996, "b": 189.26160000000004, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "token sequence length per row in HTML versus a fixed length of rows in OTSL).", "bbox": {"l": 134.765, "t": 192.15088000000003, "r": 460.87109, "b": 200.22058000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Fig. 1. Comparison between HTML and OTSL table structure representation: (A) table-example with complex row and column headers, including a 2D empty span, (B) minimal graphical representation of table structure using rectangular layout, (C) HTML representation, (D) OTSL representation. This example demonstrates many of the key-features of OTSL, namely its reduced vocabulary size (12 versus 5 in this case), its reduced sequence length (55 versus 30) and a enhanced internal structure (variable token sequence length per row in HTML versus a fixed length of rows in OTSL)."}, {"label": "picture", "id": 1, "page_no": 1, "cluster": {"id": 1, "label": "picture", "bbox": {"l": 148.45361328125, "t": 208.37423706054688, "r": 464.3608093261719, "b": 425.8462219238281, "coord_origin": "TOPLEFT"}, "confidence": 0.9688959121704102, "cells": [{"id": 12, "text": "C", "bbox": {"l": 396.41107, "t": 280.98352, "r": 402.97336, "b": 289.50903, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "C", "bbox": {"l": 418.58682, "t": 280.89792, "r": 425.14911, "b": 289.42343, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "C", "bbox": {"l": 395.74835, "t": 303.23727, "r": 402.31064, "b": 311.76279, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "C", "bbox": {"l": 407.54214, "t": 303.36981, "r": 414.10443, "b": 311.89532, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "C", "bbox": {"l": 407.56335, "t": 314.40619, "r": 414.12564, "b": 322.9317, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "C", "bbox": {"l": 418.51108, "t": 292.08502000000004, "r": 425.07336, "b": 300.61053000000004, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "C", "bbox": {"l": 429.59744, "t": 292.09106, "r": 436.1597300000001, "b": 300.61658, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "C", "bbox": {"l": 440.68759000000006, "t": 292.01230000000004, "r": 447.24987999999996, "b": 300.53781000000004, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "C", "bbox": {"l": 418.6232, "t": 303.29483, "r": 425.18549, "b": 311.82034, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "C", "bbox": {"l": 429.7095299999999, "t": 303.30011, "r": 436.27182, "b": 311.82562, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "C", "bbox": {"l": 440.7996800000001, "t": 303.22211, "r": 447.36197, "b": 311.74762, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "C", "bbox": {"l": 418.62546, "t": 314.56903, "r": 425.18774, "b": 323.09454, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "C", "bbox": {"l": 429.71181999999993, "t": 314.57434, "r": 436.27411, "b": 323.09985, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "C", "bbox": {"l": 440.80194, "t": 314.49631, "r": 447.36423, "b": 323.02182, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "C", "bbox": {"l": 407.39746, "t": 325.29031, "r": 413.95975, "b": 333.81583, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "C", "bbox": {"l": 418.45959, "t": 325.45316, "r": 425.02188, "b": 333.97867, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "C", "bbox": {"l": 429.54593, "t": 325.4592, "r": 436.10822, "b": 333.98471, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "C", "bbox": {"l": 440.63608, "t": 325.38043, "r": 447.19836, "b": 333.90594, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "NL", "bbox": {"l": 451.89511000000005, "t": 280.15717, "r": 463.51273000000003, "b": 288.68268, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "NL", "bbox": {"l": 452.1557, "t": 291.59875000000005, "r": 463.77332, "b": 300.12427, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "NL", "bbox": {"l": 452.17688000000004, "t": 302.84265, "r": 463.79449000000005, "b": 311.36816, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "NL", "bbox": {"l": 452.09887999999995, "t": 314.12441999999993, "r": 463.71648999999996, "b": 322.6499299999999, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "NL", "bbox": {"l": 452.29733, "t": 325.46906, "r": 463.91495, "b": 333.99457, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "U", "bbox": {"l": 396.09677, "t": 314.49478, "r": 402.65906, "b": 323.02029000000005, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "U", "bbox": {"l": 395.99829, "t": 325.38876000000005, "r": 402.56058, "b": 333.91428, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "U", "bbox": {"l": 396.27475, "t": 292.27057, "r": 402.83704, "b": 300.79608, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "L", "bbox": {"l": 408.54724, "t": 280.96912, "r": 413.60074, "b": 289.49463, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "L", "bbox": {"l": 430.58966, "t": 280.49725, "r": 435.6431600000001, "b": 289.02277, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "L", "bbox": {"l": 441.08069, "t": 280.38062, "r": 446.13419, "b": 288.90613, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "X", "bbox": {"l": 407.97388, "t": 292.13425, "r": 414.03625, "b": 300.65976, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "NL", "bbox": {"l": 441.25640999999996, "t": 411.1807600000001, "r": 452.87402, "b": 419.7062700000001, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "vocabulary:", "bbox": {"l": 393.75256, "t": 399.7947700000001, "r": 432.48929, "b": 406.89935, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "5", "bbox": {"l": 434.5896000000001, "t": 399.7947700000001, "r": 438.80083999999994, "b": 406.89935, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "tokens", "bbox": {"l": 440.90573, "t": 399.7947700000001, "r": 463.22235, "b": 406.89935, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "D OTSL", "bbox": {"l": 384.11816, "t": 258.54718, "r": 413.99307, "b": 265.65179, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "sequence length:", "bbox": {"l": 393.75256, "t": 266.67505000000006, "r": 451.45129000000003, "b": 273.77966000000004, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "30", "bbox": {"l": 453.55083999999994, "t": 266.67505000000006, "r": 461.97485, "b": 273.77966000000004, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "vocabulary for this table:", "bbox": {"l": 151.79318, "t": 399.76016, "r": 233.89371000000003, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "12", "bbox": {"l": 235.99332, "t": 399.76016, "r": 244.41734000000002, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "tokens", "bbox": {"l": 246.52222, "t": 399.76016, "r": 268.83884, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "A", "bbox": {"l": 154.3298, "t": 213.57457999999997, "r": 159.79837, "b": 220.67920000000004, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "B", "bbox": {"l": 321.07053, "t": 213.57457999999997, "r": 326.53909, "b": 220.67920000000004, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "<table>", "bbox": {"l": 153.0947, "t": 280.30411, "r": 175.83888, "b": 286.69824, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "<tr>", "bbox": {"l": 160.67039, "t": 287.12088, "r": 172.79608, "b": 293.51501, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "<td", "bbox": {"l": 168.24603, "t": 293.93765, "r": 177.91019, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "colspan=\u201c2\u201d", "bbox": {"l": 179.80525, "t": 293.93765, "r": 215.61517, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "rowspan=\u201c2\u201d", "bbox": {"l": 217.50886999999997, "t": 293.93765, "r": 255.58945, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": ">", "bbox": {"l": 257.48315, "t": 293.93765, "r": 261.46414, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "</td>", "bbox": {"l": 263.35785, "t": 293.93765, "r": 278.89804, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "<td", "bbox": {"l": 280.79175, "t": 293.93765, "r": 290.4559, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "colspan=\u201c3\u201d", "bbox": {"l": 292.35095, "t": 293.93765, "r": 328.16083, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": ">", "bbox": {"l": 330.05457, "t": 293.93765, "r": 334.03555, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "</td>", "bbox": {"l": 335.92926, "t": 293.93765, "r": 351.46945, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "</tr>", "bbox": {"l": 160.67039, "t": 300.75442999999996, "r": 174.68979, "b": 307.14856, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "<tr>", "bbox": {"l": 160.67039, "t": 307.57122999999996, "r": 172.79608, "b": 313.96536, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "<td>", "bbox": {"l": 168.24603, "t": 314.388, "r": 181.89255, "b": 320.78214, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "</td>", "bbox": {"l": 183.78624, "t": 314.388, "r": 199.32646, "b": 320.78214, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "<td>", "bbox": {"l": 201.22015, "t": 314.388, "r": 214.86666999999997, "b": 320.78214, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "</td>", "bbox": {"l": 216.76038, "t": 314.388, "r": 232.30058, "b": 320.78214, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "<td>", "bbox": {"l": 234.19427000000002, "t": 314.388, "r": 247.84079000000003, "b": 320.78214, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "</td>", "bbox": {"l": 249.73447999999996, "t": 314.388, "r": 265.27469, "b": 320.78214, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "</tr>", "bbox": {"l": 160.67039, "t": 321.20477, "r": 174.68979, "b": 327.59890999999993, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "<tr>", "bbox": {"l": 160.67039, "t": 328.02158, "r": 172.79608, "b": 334.41571000000005, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "<td rowspan=\u201c3\u201d > </td> <td> </td> <td> </td> <td> </td> <td> </td>", "bbox": {"l": 168.24603, "t": 334.83835, "r": 373.09091, "b": 341.23248, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "</tr>", "bbox": {"l": 160.67039, "t": 341.65512, "r": 174.68979, "b": 348.04926, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "<tr>", "bbox": {"l": 160.67039, "t": 348.47159, "r": 172.79608, "b": 354.86572, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "<td>", "bbox": {"l": 168.24603, "t": 355.28836000000007, "r": 181.89255, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "</td>", "bbox": {"l": 183.78624, "t": 355.28836000000007, "r": 199.32646, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "<td>", "bbox": {"l": 201.22015, "t": 355.28836000000007, "r": 214.86666999999997, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "</td>", "bbox": {"l": 216.76038, "t": 355.28836000000007, "r": 232.30058, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "<td>", "bbox": {"l": 234.19427000000002, "t": 355.28836000000007, "r": 247.84079000000003, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "</td>", "bbox": {"l": 249.73447999999996, "t": 355.28836000000007, "r": 265.27469, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "<td>", "bbox": {"l": 267.1684, "t": 355.28836000000007, "r": 280.81488, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "</td>", "bbox": {"l": 282.70862, "t": 355.28836000000007, "r": 298.24881, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "</tr>", "bbox": {"l": 160.67039, "t": 362.10516000000007, "r": 174.68979, "b": 368.49929999999995, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "<tr>", "bbox": {"l": 160.67039, "t": 368.92194, "r": 172.79608, "b": 375.31607, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "<td>", "bbox": {"l": 168.24603, "t": 375.73871, "r": 181.89255, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "</td>", "bbox": {"l": 183.78624, "t": 375.73871, "r": 199.32646, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "<td>", "bbox": {"l": 201.22015, "t": 375.73871, "r": 214.86666999999997, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "</td>", "bbox": {"l": 216.76038, "t": 375.73871, "r": 232.30058, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "<td>", "bbox": {"l": 234.19427000000002, "t": 375.73871, "r": 247.84079000000003, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "</td>", "bbox": {"l": 249.73447999999996, "t": 375.73871, "r": 265.27469, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "<td>", "bbox": {"l": 267.1684, "t": 375.73871, "r": 280.81488, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "</td>", "bbox": {"l": 282.70862, "t": 375.73871, "r": 298.24881, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "</tr>", "bbox": {"l": 160.67039, "t": 382.55551, "r": 174.68979, "b": 388.94965, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "</table>", "bbox": {"l": 153.0947, "t": 389.37228, "r": 177.73259, "b": 395.76642, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "C", "bbox": {"l": 395.06137, "t": 411.33353, "r": 401.62366, "b": 419.85904, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "L", "bbox": {"l": 407.42249, "t": 411.33353, "r": 412.47598, "b": 419.85904, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "U", "bbox": {"l": 418.69287, "t": 411.33353, "r": 425.25516, "b": 419.85904, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "X", "bbox": {"l": 430.5086099999999, "t": 411.33353, "r": 436.5709800000001, "b": 419.85904, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "<table>", "bbox": {"l": 152.36208, "t": 409.77362, "r": 175.10626, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "<tr>", "bbox": {"l": 178.89366, "t": 409.77362, "r": 191.01935, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "</tr>", "bbox": {"l": 194.80676, "t": 409.77362, "r": 208.82614, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "<td>", "bbox": {"l": 212.61354, "t": 409.77362, "r": 226.26003999999998, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "</td>", "bbox": {"l": 230.04745000000003, "t": 409.77362, "r": 245.58765000000002, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "<td", "bbox": {"l": 249.37506000000002, "t": 409.77362, "r": 259.03918, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "colspan=\"2\"", "bbox": {"l": 262.82797, "t": 409.77362, "r": 298.93646, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "colspan=\"3\"", "bbox": {"l": 302.72385, "t": 409.77362, "r": 338.83234, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "rowspan=\"2\"", "bbox": {"l": 152.36208, "t": 418.10522, "r": 190.74123, "b": 424.49936, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "rowspan=\"3\"", "bbox": {"l": 194.52863, "t": 418.10522, "r": 232.90777999999997, "b": 424.49936, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": ">", "bbox": {"l": 236.69518999999997, "t": 418.10522, "r": 240.67617999999996, "b": 424.49936, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "</table>", "bbox": {"l": 244.46358, "t": 418.10522, "r": 269.10144, "b": 424.49936, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "C", "bbox": {"l": 154.50595, "t": 258.60095, "r": 159.62473, "b": 265.70556999999997, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "HTML", "bbox": {"l": 164.74348, "t": 258.60095, "r": 185.21857, "b": 265.70556999999997, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "sequence length:", "bbox": {"l": 164.3548, "t": 266.49707, "r": 222.05352999999997, "b": 273.60168, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "55", "bbox": {"l": 224.15326, "t": 266.49707, "r": 232.57729, "b": 273.60168, "coord_origin": "TOPLEFT"}}], "children": [{"id": 6, "label": "text", "bbox": {"l": 396.41107, "t": 280.98352, "r": 402.97336, "b": 289.50903, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "C", "bbox": {"l": 396.41107, "t": 280.98352, "r": 402.97336, "b": 289.50903, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "text", "bbox": {"l": 418.58682, "t": 280.89792, "r": 425.14911, "b": 289.42343, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "C", "bbox": {"l": 418.58682, "t": 280.89792, "r": 425.14911, "b": 289.42343, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "text", "bbox": {"l": 395.74835, "t": 303.23727, "r": 402.31064, "b": 311.76279, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "C", "bbox": {"l": 395.74835, "t": 303.23727, "r": 402.31064, "b": 311.76279, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 407.54214, "t": 303.36981, "r": 414.10443, "b": 311.89532, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "C", "bbox": {"l": 407.54214, "t": 303.36981, "r": 414.10443, "b": 311.89532, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "text", "bbox": {"l": 407.56335, "t": 314.40619, "r": 414.12564, "b": 322.9317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "C", "bbox": {"l": 407.56335, "t": 314.40619, "r": 414.12564, "b": 322.9317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 418.51108, "t": 292.08502000000004, "r": 425.07336, "b": 300.61053000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "C", "bbox": {"l": 418.51108, "t": 292.08502000000004, "r": 425.07336, "b": 300.61053000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 429.59744, "t": 292.09106, "r": 436.1597300000001, "b": 300.61658, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "C", "bbox": {"l": 429.59744, "t": 292.09106, "r": 436.1597300000001, "b": 300.61658, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 440.68759000000006, "t": 292.01230000000004, "r": 447.24987999999996, "b": 300.53781000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "C", "bbox": {"l": 440.68759000000006, "t": 292.01230000000004, "r": 447.24987999999996, "b": 300.53781000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 418.6232, "t": 303.29483, "r": 425.18549, "b": 311.82034, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "C", "bbox": {"l": 418.6232, "t": 303.29483, "r": 425.18549, "b": 311.82034, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 429.7095299999999, "t": 303.30011, "r": 436.27182, "b": 311.82562, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "C", "bbox": {"l": 429.7095299999999, "t": 303.30011, "r": 436.27182, "b": 311.82562, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 440.7996800000001, "t": 303.22211, "r": 447.36197, "b": 311.74762, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "C", "bbox": {"l": 440.7996800000001, "t": 303.22211, "r": 447.36197, "b": 311.74762, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 418.62546, "t": 314.56903, "r": 425.18774, "b": 323.09454, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "C", "bbox": {"l": 418.62546, "t": 314.56903, "r": 425.18774, "b": 323.09454, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 429.71181999999993, "t": 314.57434, "r": 436.27411, "b": 323.09985, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "C", "bbox": {"l": 429.71181999999993, "t": 314.57434, "r": 436.27411, "b": 323.09985, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 440.80194, "t": 314.49631, "r": 447.36423, "b": 323.02182, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "C", "bbox": {"l": 440.80194, "t": 314.49631, "r": 447.36423, "b": 323.02182, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 407.39746, "t": 325.29031, "r": 413.95975, "b": 333.81583, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "C", "bbox": {"l": 407.39746, "t": 325.29031, "r": 413.95975, "b": 333.81583, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 418.45959, "t": 325.45316, "r": 425.02188, "b": 333.97867, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "C", "bbox": {"l": 418.45959, "t": 325.45316, "r": 425.02188, "b": 333.97867, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 429.54593, "t": 325.4592, "r": 436.10822, "b": 333.98471, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "C", "bbox": {"l": 429.54593, "t": 325.4592, "r": 436.10822, "b": 333.98471, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 440.63608, "t": 325.38043, "r": 447.19836, "b": 333.90594, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "C", "bbox": {"l": 440.63608, "t": 325.38043, "r": 447.19836, "b": 333.90594, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 451.89511000000005, "t": 280.15717, "r": 463.51273000000003, "b": 288.68268, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "NL", "bbox": {"l": 451.89511000000005, "t": 280.15717, "r": 463.51273000000003, "b": 288.68268, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 452.1557, "t": 291.59875000000005, "r": 463.77332, "b": 300.12427, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "NL", "bbox": {"l": 452.1557, "t": 291.59875000000005, "r": 463.77332, "b": 300.12427, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 452.17688000000004, "t": 302.84265, "r": 463.79449000000005, "b": 311.36816, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "NL", "bbox": {"l": 452.17688000000004, "t": 302.84265, "r": 463.79449000000005, "b": 311.36816, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 452.09887999999995, "t": 314.12441999999993, "r": 463.71648999999996, "b": 322.6499299999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "NL", "bbox": {"l": 452.09887999999995, "t": 314.12441999999993, "r": 463.71648999999996, "b": 322.6499299999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 452.29733, "t": 325.46906, "r": 463.91495, "b": 333.99457, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "NL", "bbox": {"l": 452.29733, "t": 325.46906, "r": 463.91495, "b": 333.99457, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 396.09677, "t": 314.49478, "r": 402.65906, "b": 323.02029000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "U", "bbox": {"l": 396.09677, "t": 314.49478, "r": 402.65906, "b": 323.02029000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 395.99829, "t": 325.38876000000005, "r": 402.56058, "b": 333.91428, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "U", "bbox": {"l": 395.99829, "t": 325.38876000000005, "r": 402.56058, "b": 333.91428, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 396.27475, "t": 292.27057, "r": 402.83704, "b": 300.79608, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "U", "bbox": {"l": 396.27475, "t": 292.27057, "r": 402.83704, "b": 300.79608, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 408.54724, "t": 280.96912, "r": 413.60074, "b": 289.49463, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "L", "bbox": {"l": 408.54724, "t": 280.96912, "r": 413.60074, "b": 289.49463, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 430.58966, "t": 280.49725, "r": 435.6431600000001, "b": 289.02277, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "L", "bbox": {"l": 430.58966, "t": 280.49725, "r": 435.6431600000001, "b": 289.02277, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 441.08069, "t": 280.38062, "r": 446.13419, "b": 288.90613, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "L", "bbox": {"l": 441.08069, "t": 280.38062, "r": 446.13419, "b": 288.90613, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 407.97388, "t": 292.13425, "r": 414.03625, "b": 300.65976, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "X", "bbox": {"l": 407.97388, "t": 292.13425, "r": 414.03625, "b": 300.65976, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 441.25640999999996, "t": 411.1807600000001, "r": 452.87402, "b": 419.7062700000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "NL", "bbox": {"l": 441.25640999999996, "t": 411.1807600000001, "r": 452.87402, "b": 419.7062700000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 393.75256, "t": 399.7947700000001, "r": 432.48929, "b": 406.89935, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "vocabulary:", "bbox": {"l": 393.75256, "t": 399.7947700000001, "r": 432.48929, "b": 406.89935, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 434.5896000000001, "t": 399.7947700000001, "r": 438.80083999999994, "b": 406.89935, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "5", "bbox": {"l": 434.5896000000001, "t": 399.7947700000001, "r": 438.80083999999994, "b": 406.89935, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 440.90573, "t": 399.7947700000001, "r": 463.22235, "b": 406.89935, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "tokens", "bbox": {"l": 440.90573, "t": 399.7947700000001, "r": 463.22235, "b": 406.89935, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 384.11816, "t": 258.54718, "r": 413.99307, "b": 265.65179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "D OTSL", "bbox": {"l": 384.11816, "t": 258.54718, "r": 413.99307, "b": 265.65179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 393.75256, "t": 266.67505000000006, "r": 451.45129000000003, "b": 273.77966000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "sequence length:", "bbox": {"l": 393.75256, "t": 266.67505000000006, "r": 451.45129000000003, "b": 273.77966000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 453.55083999999994, "t": 266.67505000000006, "r": 461.97485, "b": 273.77966000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "30", "bbox": {"l": 453.55083999999994, "t": 266.67505000000006, "r": 461.97485, "b": 273.77966000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 151.79318, "t": 399.76016, "r": 233.89371000000003, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "vocabulary for this table:", "bbox": {"l": 151.79318, "t": 399.76016, "r": 233.89371000000003, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 235.99332, "t": 399.76016, "r": 244.41734000000002, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "12", "bbox": {"l": 235.99332, "t": 399.76016, "r": 244.41734000000002, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 246.52222, "t": 399.76016, "r": 268.83884, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "tokens", "bbox": {"l": 246.52222, "t": 399.76016, "r": 268.83884, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 154.3298, "t": 213.57457999999997, "r": 159.79837, "b": 220.67920000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "A", "bbox": {"l": 154.3298, "t": 213.57457999999997, "r": 159.79837, "b": 220.67920000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 321.07053, "t": 213.57457999999997, "r": 326.53909, "b": 220.67920000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "B", "bbox": {"l": 321.07053, "t": 213.57457999999997, "r": 326.53909, "b": 220.67920000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 153.0947, "t": 280.30411, "r": 175.83888, "b": 286.69824, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "<table>", "bbox": {"l": 153.0947, "t": 280.30411, "r": 175.83888, "b": 286.69824, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 160.67039, "t": 287.12088, "r": 172.79608, "b": 293.51501, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "<tr>", "bbox": {"l": 160.67039, "t": 287.12088, "r": 172.79608, "b": 293.51501, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 168.24603, "t": 293.93765, "r": 177.91019, "b": 300.33179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "<td", "bbox": {"l": 168.24603, "t": 293.93765, "r": 177.91019, "b": 300.33179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 179.80525, "t": 293.93765, "r": 215.61517, "b": 300.33179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "colspan=\u201c2\u201d", "bbox": {"l": 179.80525, "t": 293.93765, "r": 215.61517, "b": 300.33179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 217.50886999999997, "t": 293.93765, "r": 255.58945, "b": 300.33179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "rowspan=\u201c2\u201d", "bbox": {"l": 217.50886999999997, "t": 293.93765, "r": 255.58945, "b": 300.33179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 257.48315, "t": 293.93765, "r": 261.46414, "b": 300.33179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": ">", "bbox": {"l": 257.48315, "t": 293.93765, "r": 261.46414, "b": 300.33179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 263.35785, "t": 293.93765, "r": 278.89804, "b": 300.33179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "</td>", "bbox": {"l": 263.35785, "t": 293.93765, "r": 278.89804, "b": 300.33179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 280.79175, "t": 293.93765, "r": 290.4559, "b": 300.33179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "<td", "bbox": {"l": 280.79175, "t": 293.93765, "r": 290.4559, "b": 300.33179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 292.35095, "t": 293.93765, "r": 328.16083, "b": 300.33179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "colspan=\u201c3\u201d", "bbox": {"l": 292.35095, "t": 293.93765, "r": 328.16083, "b": 300.33179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 330.05457, "t": 293.93765, "r": 334.03555, "b": 300.33179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": ">", "bbox": {"l": 330.05457, "t": 293.93765, "r": 334.03555, "b": 300.33179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 335.92926, "t": 293.93765, "r": 351.46945, "b": 300.33179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "</td>", "bbox": {"l": 335.92926, "t": 293.93765, "r": 351.46945, "b": 300.33179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 160.67039, "t": 300.75442999999996, "r": 174.68979, "b": 307.14856, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "</tr>", "bbox": {"l": 160.67039, "t": 300.75442999999996, "r": 174.68979, "b": 307.14856, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 160.67039, "t": 307.57122999999996, "r": 172.79608, "b": 313.96536, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "<tr>", "bbox": {"l": 160.67039, "t": 307.57122999999996, "r": 172.79608, "b": 313.96536, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 168.24603, "t": 314.388, "r": 181.89255, "b": 320.78214, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "<td>", "bbox": {"l": 168.24603, "t": 314.388, "r": 181.89255, "b": 320.78214, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 183.78624, "t": 314.388, "r": 199.32646, "b": 320.78214, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "</td>", "bbox": {"l": 183.78624, "t": 314.388, "r": 199.32646, "b": 320.78214, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 201.22015, "t": 314.388, "r": 214.86666999999997, "b": 320.78214, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "<td>", "bbox": {"l": 201.22015, "t": 314.388, "r": 214.86666999999997, "b": 320.78214, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 216.76038, "t": 314.388, "r": 232.30058, "b": 320.78214, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "</td>", "bbox": {"l": 216.76038, "t": 314.388, "r": 232.30058, "b": 320.78214, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 234.19427000000002, "t": 314.388, "r": 247.84079000000003, "b": 320.78214, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "<td>", "bbox": {"l": 234.19427000000002, "t": 314.388, "r": 247.84079000000003, "b": 320.78214, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 249.73447999999996, "t": 314.388, "r": 265.27469, "b": 320.78214, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "</td>", "bbox": {"l": 249.73447999999996, "t": 314.388, "r": 265.27469, "b": 320.78214, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 160.67039, "t": 321.20477, "r": 174.68979, "b": 327.59890999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "</tr>", "bbox": {"l": 160.67039, "t": 321.20477, "r": 174.68979, "b": 327.59890999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 160.67039, "t": 328.02158, "r": 172.79608, "b": 334.41571000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "<tr>", "bbox": {"l": 160.67039, "t": 328.02158, "r": 172.79608, "b": 334.41571000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 168.24603, "t": 334.83835, "r": 373.09091, "b": 341.23248, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "<td rowspan=\u201c3\u201d > </td> <td> </td> <td> </td> <td> </td> <td> </td>", "bbox": {"l": 168.24603, "t": 334.83835, "r": 373.09091, "b": 341.23248, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 160.67039, "t": 341.65512, "r": 174.68979, "b": 348.04926, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "</tr>", "bbox": {"l": 160.67039, "t": 341.65512, "r": 174.68979, "b": 348.04926, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 160.67039, "t": 348.47159, "r": 172.79608, "b": 354.86572, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "<tr>", "bbox": {"l": 160.67039, "t": 348.47159, "r": 172.79608, "b": 354.86572, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 168.24603, "t": 355.28836000000007, "r": 181.89255, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "<td>", "bbox": {"l": 168.24603, "t": 355.28836000000007, "r": 181.89255, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 183.78624, "t": 355.28836000000007, "r": 199.32646, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "</td>", "bbox": {"l": 183.78624, "t": 355.28836000000007, "r": 199.32646, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 201.22015, "t": 355.28836000000007, "r": 214.86666999999997, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "<td>", "bbox": {"l": 201.22015, "t": 355.28836000000007, "r": 214.86666999999997, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 216.76038, "t": 355.28836000000007, "r": 232.30058, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "</td>", "bbox": {"l": 216.76038, "t": 355.28836000000007, "r": 232.30058, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 234.19427000000002, "t": 355.28836000000007, "r": 247.84079000000003, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "<td>", "bbox": {"l": 234.19427000000002, "t": 355.28836000000007, "r": 247.84079000000003, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 249.73447999999996, "t": 355.28836000000007, "r": 265.27469, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "</td>", "bbox": {"l": 249.73447999999996, "t": 355.28836000000007, "r": 265.27469, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 267.1684, "t": 355.28836000000007, "r": 280.81488, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "<td>", "bbox": {"l": 267.1684, "t": 355.28836000000007, "r": 280.81488, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 282.70862, "t": 355.28836000000007, "r": 298.24881, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "</td>", "bbox": {"l": 282.70862, "t": 355.28836000000007, "r": 298.24881, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 160.67039, "t": 362.10516000000007, "r": 174.68979, "b": 368.49929999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "</tr>", "bbox": {"l": 160.67039, "t": 362.10516000000007, "r": 174.68979, "b": 368.49929999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 160.67039, "t": 368.92194, "r": 172.79608, "b": 375.31607, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "<tr>", "bbox": {"l": 160.67039, "t": 368.92194, "r": 172.79608, "b": 375.31607, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 168.24603, "t": 375.73871, "r": 181.89255, "b": 382.13284, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "<td>", "bbox": {"l": 168.24603, "t": 375.73871, "r": 181.89255, "b": 382.13284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 183.78624, "t": 375.73871, "r": 199.32646, "b": 382.13284, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "</td>", "bbox": {"l": 183.78624, "t": 375.73871, "r": 199.32646, "b": 382.13284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 201.22015, "t": 375.73871, "r": 214.86666999999997, "b": 382.13284, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "<td>", "bbox": {"l": 201.22015, "t": 375.73871, "r": 214.86666999999997, "b": 382.13284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 216.76038, "t": 375.73871, "r": 232.30058, "b": 382.13284, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "</td>", "bbox": {"l": 216.76038, "t": 375.73871, "r": 232.30058, "b": 382.13284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 234.19427000000002, "t": 375.73871, "r": 247.84079000000003, "b": 382.13284, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "<td>", "bbox": {"l": 234.19427000000002, "t": 375.73871, "r": 247.84079000000003, "b": 382.13284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 249.73447999999996, "t": 375.73871, "r": 265.27469, "b": 382.13284, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "</td>", "bbox": {"l": 249.73447999999996, "t": 375.73871, "r": 265.27469, "b": 382.13284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 267.1684, "t": 375.73871, "r": 280.81488, "b": 382.13284, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "<td>", "bbox": {"l": 267.1684, "t": 375.73871, "r": 280.81488, "b": 382.13284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 282.70862, "t": 375.73871, "r": 298.24881, "b": 382.13284, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "</td>", "bbox": {"l": 282.70862, "t": 375.73871, "r": 298.24881, "b": 382.13284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 160.67039, "t": 382.55551, "r": 174.68979, "b": 388.94965, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "</tr>", "bbox": {"l": 160.67039, "t": 382.55551, "r": 174.68979, "b": 388.94965, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 153.0947, "t": 389.37228, "r": 177.73259, "b": 395.76642, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "</table>", "bbox": {"l": 153.0947, "t": 389.37228, "r": 177.73259, "b": 395.76642, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 395.06137, "t": 411.33353, "r": 401.62366, "b": 419.85904, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "C", "bbox": {"l": 395.06137, "t": 411.33353, "r": 401.62366, "b": 419.85904, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 407.42249, "t": 411.33353, "r": 412.47598, "b": 419.85904, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "L", "bbox": {"l": 407.42249, "t": 411.33353, "r": 412.47598, "b": 419.85904, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 418.69287, "t": 411.33353, "r": 425.25516, "b": 419.85904, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "U", "bbox": {"l": 418.69287, "t": 411.33353, "r": 425.25516, "b": 419.85904, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 430.5086099999999, "t": 411.33353, "r": 436.5709800000001, "b": 419.85904, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "X", "bbox": {"l": 430.5086099999999, "t": 411.33353, "r": 436.5709800000001, "b": 419.85904, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 152.36208, "t": 409.77362, "r": 175.10626, "b": 416.16776, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "<table>", "bbox": {"l": 152.36208, "t": 409.77362, "r": 175.10626, "b": 416.16776, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 178.89366, "t": 409.77362, "r": 191.01935, "b": 416.16776, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": "<tr>", "bbox": {"l": 178.89366, "t": 409.77362, "r": 191.01935, "b": 416.16776, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 194.80676, "t": 409.77362, "r": 208.82614, "b": 416.16776, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "</tr>", "bbox": {"l": 194.80676, "t": 409.77362, "r": 208.82614, "b": 416.16776, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 212.61354, "t": 409.77362, "r": 226.26003999999998, "b": 416.16776, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "<td>", "bbox": {"l": 212.61354, "t": 409.77362, "r": 226.26003999999998, "b": 416.16776, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 230.04745000000003, "t": 409.77362, "r": 245.58765000000002, "b": 416.16776, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": "</td>", "bbox": {"l": 230.04745000000003, "t": 409.77362, "r": 245.58765000000002, "b": 416.16776, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 249.37506000000002, "t": 409.77362, "r": 259.03918, "b": 416.16776, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 107, "text": "<td", "bbox": {"l": 249.37506000000002, "t": 409.77362, "r": 259.03918, "b": 416.16776, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 262.82797, "t": 409.77362, "r": 298.93646, "b": 416.16776, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 108, "text": "colspan=\"2\"", "bbox": {"l": 262.82797, "t": 409.77362, "r": 298.93646, "b": 416.16776, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 302.72385, "t": 409.77362, "r": 338.83234, "b": 416.16776, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 109, "text": "colspan=\"3\"", "bbox": {"l": 302.72385, "t": 409.77362, "r": 338.83234, "b": 416.16776, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 152.36208, "t": 418.10522, "r": 190.74123, "b": 424.49936, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 110, "text": "rowspan=\"2\"", "bbox": {"l": 152.36208, "t": 418.10522, "r": 190.74123, "b": 424.49936, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 194.52863, "t": 418.10522, "r": 232.90777999999997, "b": 424.49936, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 111, "text": "rowspan=\"3\"", "bbox": {"l": 194.52863, "t": 418.10522, "r": 232.90777999999997, "b": 424.49936, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 236.69518999999997, "t": 418.10522, "r": 240.67617999999996, "b": 424.49936, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 112, "text": ">", "bbox": {"l": 236.69518999999997, "t": 418.10522, "r": 240.67617999999996, "b": 424.49936, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 244.46358, "t": 418.10522, "r": 269.10144, "b": 424.49936, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 113, "text": "</table>", "bbox": {"l": 244.46358, "t": 418.10522, "r": 269.10144, "b": 424.49936, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 154.50595, "t": 258.60095, "r": 159.62473, "b": 265.70556999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 114, "text": "C", "bbox": {"l": 154.50595, "t": 258.60095, "r": 159.62473, "b": 265.70556999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 164.74348, "t": 258.60095, "r": 185.21857, "b": 265.70556999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 115, "text": "HTML", "bbox": {"l": 164.74348, "t": 258.60095, "r": 185.21857, "b": 265.70556999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 164.3548, "t": 266.49707, "r": 222.05352999999997, "b": 273.60168, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 116, "text": "sequence length:", "bbox": {"l": 164.3548, "t": 266.49707, "r": 222.05352999999997, "b": 273.60168, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 224.15326, "t": 266.49707, "r": 232.57729, "b": 273.60168, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 117, "text": "55", "bbox": {"l": 224.15326, "t": 266.49707, "r": 232.57729, "b": 273.60168, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "text", "id": 2, "page_no": 1, "cluster": {"id": 2, "label": "text", "bbox": {"l": 134.765, "t": 452.31378, "r": 480.59232000000003, "b": 520.88669, "coord_origin": "TOPLEFT"}, "confidence": 0.9505000710487366, "cells": [{"id": 118, "text": "today,", "bbox": {"l": 134.765, "t": 452.31378, "r": 161.32928, "b": 461.11075, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "table detection", "bbox": {"l": 164.269, "t": 452.31378, "r": 226.28617999999997, "b": 461.11075, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "in documents is a well understood problem, and the latest", "bbox": {"l": 229.992, "t": 452.31378, "r": 480.59232000000003, "b": 461.11075, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "state-of-the-art (SOTA) object detection methods provide an accuracy compa-", "bbox": {"l": 134.76501, "t": 464.26877, "r": 480.59180000000003, "b": 473.06573, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "rable to human observers [7,8,10,14,23]. On the other hand, the problem of table", "bbox": {"l": 134.76501, "t": 476.22375, "r": 480.58673, "b": 485.02072, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "structure recognition (TSR) is a lot more challenging and remains a very active", "bbox": {"l": 134.76501, "t": 488.17975, "r": 480.58658, "b": 496.97672, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "area of research, in which many novel machine learning algorithms are being", "bbox": {"l": 134.76501, "t": 500.13474, "r": 480.58978, "b": 508.9317, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "explored [3,4,5,9,11,12,13,14,17,18,21,22].", "bbox": {"l": 134.76501, "t": 512.0897199999999, "r": 313.24597, "b": 520.88669, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "today, table detection in documents is a well understood problem, and the latest state-of-the-art (SOTA) object detection methods provide an accuracy comparable to human observers [7,8,10,14,23]. On the other hand, the problem of table structure recognition (TSR) is a lot more challenging and remains a very active area of research, in which many novel machine learning algorithms are being explored [3,4,5,9,11,12,13,14,17,18,21,22]."}, {"label": "text", "id": 0, "page_no": 1, "cluster": {"id": 0, "label": "text", "bbox": {"l": 134.76501, "t": 524.55072, "r": 480.59482, "b": 664.8547, "coord_origin": "TOPLEFT"}, "confidence": 0.9845513701438904, "cells": [{"id": 126, "text": "Recently emerging SOTA methods for table structure recognition employ", "bbox": {"l": 149.70901, "t": 524.55072, "r": 480.58884000000006, "b": 533.3476900000001, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "transformer-based models, in which an image of the table is provided to the net-", "bbox": {"l": 134.76501, "t": 536.50671, "r": 480.5917400000001, "b": 545.30368, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "work in order to predict the structure of the table as a sequence of tokens. These", "bbox": {"l": 134.76501, "t": 548.46172, "r": 480.58868, "b": 557.25868, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "image-to-sequence (Im2Seq) models are extremely powerful, since they allow for", "bbox": {"l": 134.76501, "t": 560.41672, "r": 480.58795, "b": 569.2136800000001, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "a purely data-driven solution. The tokens of the sequence typically belong to a", "bbox": {"l": 134.76501, "t": 572.37172, "r": 480.58978, "b": 581.16869, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "markup language such as HTML, Latex or Markdown, which allow to describe", "bbox": {"l": 134.76501, "t": 584.32672, "r": 480.59479, "b": 593.12369, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "table structure as rows, columns and spanning cells in various configurations.", "bbox": {"l": 134.76501, "t": 596.28271, "r": 480.58678999999995, "b": 605.0796799999999, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "In Figure 1, we illustrate how HTML is used to represent the table-structure", "bbox": {"l": 134.76501, "t": 608.23772, "r": 480.59476, "b": 617.03468, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "of a particular example table. Public table-structure data sets such as PubTab-", "bbox": {"l": 134.76501, "t": 620.19272, "r": 480.5938100000001, "b": 628.98969, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "Net [22], and FinTabNet [21], which were created in a semi-automated way from", "bbox": {"l": 134.76501, "t": 632.1477199999999, "r": 480.59482, "b": 640.94469, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "paired PDF and HTML sources (e.g. PubMed Central), popularized primarily", "bbox": {"l": 134.76501, "t": 644.10272, "r": 480.58771, "b": 652.89969, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "the use of HTML as ground-truth representation format for TSR.", "bbox": {"l": 134.76501, "t": 656.05772, "r": 421.45377, "b": 664.8547, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Recently emerging SOTA methods for table structure recognition employ transformer-based models, in which an image of the table is provided to the network in order to predict the structure of the table as a sequence of tokens. These image-to-sequence (Im2Seq) models are extremely powerful, since they allow for a purely data-driven solution. The tokens of the sequence typically belong to a markup language such as HTML, Latex or Markdown, which allow to describe table structure as rows, columns and spanning cells in various configurations. In Figure 1, we illustrate how HTML is used to represent the table-structure of a particular example table. Public table-structure data sets such as PubTabNet [22], and FinTabNet [21], which were created in a semi-automated way from paired PDF and HTML sources (e.g. PubMed Central), popularized primarily the use of HTML as ground-truth representation format for TSR."}], "headers": [{"label": "page_header", "id": 5, "page_no": 1, "cluster": {"id": 5, "label": "page_header", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8580349683761597, "cells": [{"id": 0, "text": "2", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2"}, {"label": "page_header", "id": 3, "page_no": 1, "cluster": {"id": 3, "label": "page_header", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9076642990112305, "cells": [{"id": 1, "text": "M.", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 178.07675, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37415, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "M. Lysak, et al."}]}}, {"page_no": 2, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "3", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "While the majority of research in TSR is currently focused on the develop-", "bbox": {"l": 149.709, "t": 118.93377999999996, "r": 480.59183, "b": 127.73077, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "ment and application of novel neural model architectures, the table structure", "bbox": {"l": 134.765, "t": 130.88878999999997, "r": 480.58675999999997, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "representation language (e.g. HTML in PubTabNet and FinTabNet) is usually", "bbox": {"l": 134.765, "t": 142.84479, "r": 480.5917400000001, "b": 151.64178000000004, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "adopted", "bbox": {"l": 134.765, "t": 154.7998, "r": 169.62514, "b": 163.59680000000003, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "as is", "bbox": {"l": 173.86099, "t": 154.7998, "r": 194.55531, "b": 163.59680000000003, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "for the sequence tokenization in Im2Seq models. In this paper,", "bbox": {"l": 199.60999, "t": 154.7998, "r": 480.58618, "b": 163.59680000000003, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "we aim for the opposite and investigate the impact of the table structure rep-", "bbox": {"l": 134.76498, "t": 166.75482, "r": 480.59167, "b": 175.55182000000002, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "resentation language with an otherwise unmodified Im2Seq transformer-based", "bbox": {"l": 134.76498, "t": 178.70983999999999, "r": 480.58968999999996, "b": 187.50684, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "architecture. Since the current state-of-the-art Im2Seq model is TableFormer [9],", "bbox": {"l": 134.76498, "t": 190.66485999999998, "r": 480.5917400000001, "b": 199.46185000000003, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "we select this model to perform our experiments.", "bbox": {"l": 134.76498, "t": 202.61987, "r": 348.35519, "b": 211.41687000000002, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "The main contribution of this paper is the introduction of a new optimised ta-", "bbox": {"l": 149.70898, "t": 214.83587999999997, "r": 480.5939, "b": 223.63287000000003, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "ble structure language (OTSL), specifically designed to describe table-structure", "bbox": {"l": 134.76498, "t": 226.79089, "r": 480.5938100000001, "b": 235.58789000000002, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "in an compact and structured way for Im2Seq models. OTSL has a number of", "bbox": {"l": 134.76498, "t": 238.74689, "r": 480.58667, "b": 247.54387999999994, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "key features, which make it very attractive to use in Im2Seq models. Specifically,", "bbox": {"l": 134.76498, "t": 250.70190000000002, "r": 480.5867, "b": 259.49890000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "compared to other languages such as HTML, OTSL has a minimized vocabulary", "bbox": {"l": 134.76498, "t": 262.65692, "r": 480.58771, "b": 271.45392000000004, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "which yields short sequence length, strong inherent structure (e.g. strict rectan-", "bbox": {"l": 134.76498, "t": 274.61194, "r": 480.59572999999995, "b": 283.40891, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "gular layout) and a strict syntax with rules that only look backwards. The latter", "bbox": {"l": 134.76498, "t": 286.56692999999996, "r": 480.59274, "b": 295.36389, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "allows for syntax validation during inference and ensures a syntactically correct", "bbox": {"l": 134.76498, "t": 298.52190999999993, "r": 480.59473, "b": 307.31888, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "table-structure. These OTSL features are illustrated in Figure 1, in comparison", "bbox": {"l": 134.76498, "t": 310.47791, "r": 480.58667, "b": 319.27487, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "to HTML.", "bbox": {"l": 134.76498, "t": 322.43289, "r": 179.72021, "b": 331.22986, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "The paper is structured as follows. In section 2, we give an overview of the", "bbox": {"l": 149.70898, "t": 334.64789, "r": 480.5878000000001, "b": 343.44485000000003, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "latest developments in table-structure reconstruction. In section 3 we review", "bbox": {"l": 134.76498, "t": 346.60388000000006, "r": 480.59375, "b": 355.40085, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "the current HTML table encoding (popularised by PubTabNet and FinTabNet)", "bbox": {"l": 134.76498, "t": 358.55887, "r": 480.58673, "b": 367.3558300000001, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "and discuss its flaws. Subsequently, we introduce OTSL in section 4, which in-", "bbox": {"l": 134.76498, "t": 370.51385, "r": 480.59161, "b": 379.31082, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "cludes the language definition, syntax rules and error-correction procedures. In", "bbox": {"l": 134.76498, "t": 382.46883999999994, "r": 480.59177000000005, "b": 391.26581, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "section 5, we apply OTSL on the TableFormer architecture, compare it to Table-", "bbox": {"l": 134.76498, "t": 394.42383, "r": 480.58774, "b": 403.2207900000001, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Former models trained on HTML and ultimately demonstrate the advantages", "bbox": {"l": 134.76498, "t": 406.37982, "r": 480.59469999999993, "b": 415.17679, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "of using OTSL. Finally, in section 6 we conclude our work and outline next", "bbox": {"l": 134.76498, "t": 418.33481, "r": 480.59567, "b": 427.13177, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "potential steps.", "bbox": {"l": 134.76498, "t": 430.28979, "r": 201.27232, "b": 439.08676, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "2", "bbox": {"l": 134.76498, "t": 462.08795, "r": 141.48859, "b": 472.65634, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Related Work", "bbox": {"l": 154.93819, "t": 462.08795, "r": 236.76912999999996, "b": 472.65634, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "Approaches to formalize the logical structure and layout of tables in electronic", "bbox": {"l": 134.76498, "t": 488.68582, "r": 480.59067, "b": 497.48279, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "documents date back more than two decades [16]. In the recent past, a wide", "bbox": {"l": 134.76498, "t": 500.64081, "r": 480.5917400000001, "b": 509.43777, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "variety of computer vision methods have been explored to tackle the prob-", "bbox": {"l": 134.76498, "t": 512.5957900000001, "r": 480.58971999999994, "b": 521.39276, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "lem of table structure recognition, i.e. the correct identification of columns,", "bbox": {"l": 134.76498, "t": 524.55179, "r": 480.58966, "b": 533.34875, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "rows and spanning cells in a given table. Broadly speaking, the current deep-", "bbox": {"l": 134.76498, "t": 536.50679, "r": 480.5897499999999, "b": 545.30376, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "learning based approaches fall into three categories: object detection (OD) meth-", "bbox": {"l": 134.76498, "t": 548.4617900000001, "r": 480.58862000000005, "b": 557.2587599999999, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "ods, Graph-Neural-Network (GNN) methods and Image-to-Markup-Sequence", "bbox": {"l": 134.76498, "t": 560.41679, "r": 480.59072999999995, "b": 569.21376, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "(Im2Seq) methods. Object-detection based methods [11,12,13,14,21] rely on table-", "bbox": {"l": 134.76498, "t": 572.3718, "r": 484.12047999999993, "b": 581.16876, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "structure annotation using (overlapping) bounding boxes for training, and pro-", "bbox": {"l": 134.76498, "t": 584.3267999999999, "r": 480.59567, "b": 593.12376, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "duce bounding-box predictions to define table cells, rows, and columns on a table", "bbox": {"l": 134.76498, "t": 596.28279, "r": 480.58871, "b": 605.07976, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "image. Graph Neural Network (GNN) based methods [3,6,17,18], as the name", "bbox": {"l": 134.76498, "t": 608.23779, "r": 480.59075999999993, "b": 617.03476, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "suggests, represent tables as graph structures. The graph nodes represent the", "bbox": {"l": 134.76498, "t": 620.1927900000001, "r": 480.58574999999996, "b": 628.9897599999999, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "content of each table cell, an embedding vector from the table image, or geomet-", "bbox": {"l": 134.76498, "t": 632.1478, "r": 480.58875, "b": 640.94476, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "ric coordinates of the table cell. The edges of the graph define the relationship", "bbox": {"l": 134.76498, "t": 644.1028, "r": 480.58875, "b": 652.89977, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "between the nodes, e.g. if they belong to the same column, row, or table cell.", "bbox": {"l": 134.76498, "t": 656.05879, "r": 480.59069999999997, "b": 664.85577, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 5, "label": "page_header", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9325800538063049, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "page_header", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8773486614227295, "cells": [{"id": 1, "text": "3", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 134.76498, "t": 118.93377999999996, "r": 480.59183, "b": 211.41687000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9871802926063538, "cells": [{"id": 2, "text": "While the majority of research in TSR is currently focused on the develop-", "bbox": {"l": 149.709, "t": 118.93377999999996, "r": 480.59183, "b": 127.73077, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "ment and application of novel neural model architectures, the table structure", "bbox": {"l": 134.765, "t": 130.88878999999997, "r": 480.58675999999997, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "representation language (e.g. HTML in PubTabNet and FinTabNet) is usually", "bbox": {"l": 134.765, "t": 142.84479, "r": 480.5917400000001, "b": 151.64178000000004, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "adopted", "bbox": {"l": 134.765, "t": 154.7998, "r": 169.62514, "b": 163.59680000000003, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "as is", "bbox": {"l": 173.86099, "t": 154.7998, "r": 194.55531, "b": 163.59680000000003, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "for the sequence tokenization in Im2Seq models. In this paper,", "bbox": {"l": 199.60999, "t": 154.7998, "r": 480.58618, "b": 163.59680000000003, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "we aim for the opposite and investigate the impact of the table structure rep-", "bbox": {"l": 134.76498, "t": 166.75482, "r": 480.59167, "b": 175.55182000000002, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "resentation language with an otherwise unmodified Im2Seq transformer-based", "bbox": {"l": 134.76498, "t": 178.70983999999999, "r": 480.58968999999996, "b": 187.50684, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "architecture. Since the current state-of-the-art Im2Seq model is TableFormer [9],", "bbox": {"l": 134.76498, "t": 190.66485999999998, "r": 480.5917400000001, "b": 199.46185000000003, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "we select this model to perform our experiments.", "bbox": {"l": 134.76498, "t": 202.61987, "r": 348.35519, "b": 211.41687000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 134.76498, "t": 214.83587999999997, "r": 480.59572999999995, "b": 331.22986, "coord_origin": "TOPLEFT"}, "confidence": 0.9871861338615417, "cells": [{"id": 12, "text": "The main contribution of this paper is the introduction of a new optimised ta-", "bbox": {"l": 149.70898, "t": 214.83587999999997, "r": 480.5939, "b": 223.63287000000003, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "ble structure language (OTSL), specifically designed to describe table-structure", "bbox": {"l": 134.76498, "t": 226.79089, "r": 480.5938100000001, "b": 235.58789000000002, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "in an compact and structured way for Im2Seq models. OTSL has a number of", "bbox": {"l": 134.76498, "t": 238.74689, "r": 480.58667, "b": 247.54387999999994, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "key features, which make it very attractive to use in Im2Seq models. Specifically,", "bbox": {"l": 134.76498, "t": 250.70190000000002, "r": 480.5867, "b": 259.49890000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "compared to other languages such as HTML, OTSL has a minimized vocabulary", "bbox": {"l": 134.76498, "t": 262.65692, "r": 480.58771, "b": 271.45392000000004, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "which yields short sequence length, strong inherent structure (e.g. strict rectan-", "bbox": {"l": 134.76498, "t": 274.61194, "r": 480.59572999999995, "b": 283.40891, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "gular layout) and a strict syntax with rules that only look backwards. The latter", "bbox": {"l": 134.76498, "t": 286.56692999999996, "r": 480.59274, "b": 295.36389, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "allows for syntax validation during inference and ensures a syntactically correct", "bbox": {"l": 134.76498, "t": 298.52190999999993, "r": 480.59473, "b": 307.31888, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "table-structure. These OTSL features are illustrated in Figure 1, in comparison", "bbox": {"l": 134.76498, "t": 310.47791, "r": 480.58667, "b": 319.27487, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "to HTML.", "bbox": {"l": 134.76498, "t": 322.43289, "r": 179.72021, "b": 331.22986, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 134.76498, "t": 334.64789, "r": 480.59567, "b": 439.08676, "coord_origin": "TOPLEFT"}, "confidence": 0.988121747970581, "cells": [{"id": 22, "text": "The paper is structured as follows. In section 2, we give an overview of the", "bbox": {"l": 149.70898, "t": 334.64789, "r": 480.5878000000001, "b": 343.44485000000003, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "latest developments in table-structure reconstruction. In section 3 we review", "bbox": {"l": 134.76498, "t": 346.60388000000006, "r": 480.59375, "b": 355.40085, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "the current HTML table encoding (popularised by PubTabNet and FinTabNet)", "bbox": {"l": 134.76498, "t": 358.55887, "r": 480.58673, "b": 367.3558300000001, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "and discuss its flaws. Subsequently, we introduce OTSL in section 4, which in-", "bbox": {"l": 134.76498, "t": 370.51385, "r": 480.59161, "b": 379.31082, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "cludes the language definition, syntax rules and error-correction procedures. In", "bbox": {"l": 134.76498, "t": 382.46883999999994, "r": 480.59177000000005, "b": 391.26581, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "section 5, we apply OTSL on the TableFormer architecture, compare it to Table-", "bbox": {"l": 134.76498, "t": 394.42383, "r": 480.58774, "b": 403.2207900000001, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Former models trained on HTML and ultimately demonstrate the advantages", "bbox": {"l": 134.76498, "t": 406.37982, "r": 480.59469999999993, "b": 415.17679, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "of using OTSL. Finally, in section 6 we conclude our work and outline next", "bbox": {"l": 134.76498, "t": 418.33481, "r": 480.59567, "b": 427.13177, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "potential steps.", "bbox": {"l": 134.76498, "t": 430.28979, "r": 201.27232, "b": 439.08676, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "section_header", "bbox": {"l": 134.76498, "t": 462.08795, "r": 236.76912999999996, "b": 472.65634, "coord_origin": "TOPLEFT"}, "confidence": 0.9439422488212585, "cells": [{"id": 31, "text": "2", "bbox": {"l": 134.76498, "t": 462.08795, "r": 141.48859, "b": 472.65634, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Related Work", "bbox": {"l": 154.93819, "t": 462.08795, "r": 236.76912999999996, "b": 472.65634, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 134.76498, "t": 488.68582, "r": 484.12047999999993, "b": 664.85577, "coord_origin": "TOPLEFT"}, "confidence": 0.9870182871818542, "cells": [{"id": 33, "text": "Approaches to formalize the logical structure and layout of tables in electronic", "bbox": {"l": 134.76498, "t": 488.68582, "r": 480.59067, "b": 497.48279, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "documents date back more than two decades [16]. In the recent past, a wide", "bbox": {"l": 134.76498, "t": 500.64081, "r": 480.5917400000001, "b": 509.43777, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "variety of computer vision methods have been explored to tackle the prob-", "bbox": {"l": 134.76498, "t": 512.5957900000001, "r": 480.58971999999994, "b": 521.39276, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "lem of table structure recognition, i.e. the correct identification of columns,", "bbox": {"l": 134.76498, "t": 524.55179, "r": 480.58966, "b": 533.34875, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "rows and spanning cells in a given table. Broadly speaking, the current deep-", "bbox": {"l": 134.76498, "t": 536.50679, "r": 480.5897499999999, "b": 545.30376, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "learning based approaches fall into three categories: object detection (OD) meth-", "bbox": {"l": 134.76498, "t": 548.4617900000001, "r": 480.58862000000005, "b": 557.2587599999999, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "ods, Graph-Neural-Network (GNN) methods and Image-to-Markup-Sequence", "bbox": {"l": 134.76498, "t": 560.41679, "r": 480.59072999999995, "b": 569.21376, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "(Im2Seq) methods. Object-detection based methods [11,12,13,14,21] rely on table-", "bbox": {"l": 134.76498, "t": 572.3718, "r": 484.12047999999993, "b": 581.16876, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "structure annotation using (overlapping) bounding boxes for training, and pro-", "bbox": {"l": 134.76498, "t": 584.3267999999999, "r": 480.59567, "b": 593.12376, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "duce bounding-box predictions to define table cells, rows, and columns on a table", "bbox": {"l": 134.76498, "t": 596.28279, "r": 480.58871, "b": 605.07976, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "image. Graph Neural Network (GNN) based methods [3,6,17,18], as the name", "bbox": {"l": 134.76498, "t": 608.23779, "r": 480.59075999999993, "b": 617.03476, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "suggests, represent tables as graph structures. The graph nodes represent the", "bbox": {"l": 134.76498, "t": 620.1927900000001, "r": 480.58574999999996, "b": 628.9897599999999, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "content of each table cell, an embedding vector from the table image, or geomet-", "bbox": {"l": 134.76498, "t": 632.1478, "r": 480.58875, "b": 640.94476, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "ric coordinates of the table cell. The edges of the graph define the relationship", "bbox": {"l": 134.76498, "t": 644.1028, "r": 480.58875, "b": 652.89977, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "between the nodes, e.g. if they belong to the same column, row, or table cell.", "bbox": {"l": 134.76498, "t": 656.05879, "r": 480.59069999999997, "b": 664.85577, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_header", "id": 5, "page_no": 2, "cluster": {"id": 5, "label": "page_header", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9325800538063049, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Optimized Table Tokenization for Table Structure Recognition"}, {"label": "page_header", "id": 6, "page_no": 2, "cluster": {"id": 6, "label": "page_header", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8773486614227295, "cells": [{"id": 1, "text": "3", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3"}, {"label": "text", "id": 2, "page_no": 2, "cluster": {"id": 2, "label": "text", "bbox": {"l": 134.76498, "t": 118.93377999999996, "r": 480.59183, "b": 211.41687000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9871802926063538, "cells": [{"id": 2, "text": "While the majority of research in TSR is currently focused on the develop-", "bbox": {"l": 149.709, "t": 118.93377999999996, "r": 480.59183, "b": 127.73077, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "ment and application of novel neural model architectures, the table structure", "bbox": {"l": 134.765, "t": 130.88878999999997, "r": 480.58675999999997, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "representation language (e.g. HTML in PubTabNet and FinTabNet) is usually", "bbox": {"l": 134.765, "t": 142.84479, "r": 480.5917400000001, "b": 151.64178000000004, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "adopted", "bbox": {"l": 134.765, "t": 154.7998, "r": 169.62514, "b": 163.59680000000003, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "as is", "bbox": {"l": 173.86099, "t": 154.7998, "r": 194.55531, "b": 163.59680000000003, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "for the sequence tokenization in Im2Seq models. In this paper,", "bbox": {"l": 199.60999, "t": 154.7998, "r": 480.58618, "b": 163.59680000000003, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "we aim for the opposite and investigate the impact of the table structure rep-", "bbox": {"l": 134.76498, "t": 166.75482, "r": 480.59167, "b": 175.55182000000002, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "resentation language with an otherwise unmodified Im2Seq transformer-based", "bbox": {"l": 134.76498, "t": 178.70983999999999, "r": 480.58968999999996, "b": 187.50684, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "architecture. Since the current state-of-the-art Im2Seq model is TableFormer [9],", "bbox": {"l": 134.76498, "t": 190.66485999999998, "r": 480.5917400000001, "b": 199.46185000000003, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "we select this model to perform our experiments.", "bbox": {"l": 134.76498, "t": 202.61987, "r": 348.35519, "b": 211.41687000000002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "While the majority of research in TSR is currently focused on the development and application of novel neural model architectures, the table structure representation language (e.g. HTML in PubTabNet and FinTabNet) is usually adopted as is for the sequence tokenization in Im2Seq models. In this paper, we aim for the opposite and investigate the impact of the table structure representation language with an otherwise unmodified Im2Seq transformer-based architecture. Since the current state-of-the-art Im2Seq model is TableFormer [9], we select this model to perform our experiments."}, {"label": "text", "id": 1, "page_no": 2, "cluster": {"id": 1, "label": "text", "bbox": {"l": 134.76498, "t": 214.83587999999997, "r": 480.59572999999995, "b": 331.22986, "coord_origin": "TOPLEFT"}, "confidence": 0.9871861338615417, "cells": [{"id": 12, "text": "The main contribution of this paper is the introduction of a new optimised ta-", "bbox": {"l": 149.70898, "t": 214.83587999999997, "r": 480.5939, "b": 223.63287000000003, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "ble structure language (OTSL), specifically designed to describe table-structure", "bbox": {"l": 134.76498, "t": 226.79089, "r": 480.5938100000001, "b": 235.58789000000002, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "in an compact and structured way for Im2Seq models. OTSL has a number of", "bbox": {"l": 134.76498, "t": 238.74689, "r": 480.58667, "b": 247.54387999999994, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "key features, which make it very attractive to use in Im2Seq models. Specifically,", "bbox": {"l": 134.76498, "t": 250.70190000000002, "r": 480.5867, "b": 259.49890000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "compared to other languages such as HTML, OTSL has a minimized vocabulary", "bbox": {"l": 134.76498, "t": 262.65692, "r": 480.58771, "b": 271.45392000000004, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "which yields short sequence length, strong inherent structure (e.g. strict rectan-", "bbox": {"l": 134.76498, "t": 274.61194, "r": 480.59572999999995, "b": 283.40891, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "gular layout) and a strict syntax with rules that only look backwards. The latter", "bbox": {"l": 134.76498, "t": 286.56692999999996, "r": 480.59274, "b": 295.36389, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "allows for syntax validation during inference and ensures a syntactically correct", "bbox": {"l": 134.76498, "t": 298.52190999999993, "r": 480.59473, "b": 307.31888, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "table-structure. These OTSL features are illustrated in Figure 1, in comparison", "bbox": {"l": 134.76498, "t": 310.47791, "r": 480.58667, "b": 319.27487, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "to HTML.", "bbox": {"l": 134.76498, "t": 322.43289, "r": 179.72021, "b": 331.22986, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The main contribution of this paper is the introduction of a new optimised table structure language (OTSL), specifically designed to describe table-structure in an compact and structured way for Im2Seq models. OTSL has a number of key features, which make it very attractive to use in Im2Seq models. Specifically, compared to other languages such as HTML, OTSL has a minimized vocabulary which yields short sequence length, strong inherent structure (e.g. strict rectangular layout) and a strict syntax with rules that only look backwards. The latter allows for syntax validation during inference and ensures a syntactically correct table-structure. These OTSL features are illustrated in Figure 1, in comparison to HTML."}, {"label": "text", "id": 0, "page_no": 2, "cluster": {"id": 0, "label": "text", "bbox": {"l": 134.76498, "t": 334.64789, "r": 480.59567, "b": 439.08676, "coord_origin": "TOPLEFT"}, "confidence": 0.988121747970581, "cells": [{"id": 22, "text": "The paper is structured as follows. In section 2, we give an overview of the", "bbox": {"l": 149.70898, "t": 334.64789, "r": 480.5878000000001, "b": 343.44485000000003, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "latest developments in table-structure reconstruction. In section 3 we review", "bbox": {"l": 134.76498, "t": 346.60388000000006, "r": 480.59375, "b": 355.40085, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "the current HTML table encoding (popularised by PubTabNet and FinTabNet)", "bbox": {"l": 134.76498, "t": 358.55887, "r": 480.58673, "b": 367.3558300000001, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "and discuss its flaws. Subsequently, we introduce OTSL in section 4, which in-", "bbox": {"l": 134.76498, "t": 370.51385, "r": 480.59161, "b": 379.31082, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "cludes the language definition, syntax rules and error-correction procedures. In", "bbox": {"l": 134.76498, "t": 382.46883999999994, "r": 480.59177000000005, "b": 391.26581, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "section 5, we apply OTSL on the TableFormer architecture, compare it to Table-", "bbox": {"l": 134.76498, "t": 394.42383, "r": 480.58774, "b": 403.2207900000001, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Former models trained on HTML and ultimately demonstrate the advantages", "bbox": {"l": 134.76498, "t": 406.37982, "r": 480.59469999999993, "b": 415.17679, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "of using OTSL. Finally, in section 6 we conclude our work and outline next", "bbox": {"l": 134.76498, "t": 418.33481, "r": 480.59567, "b": 427.13177, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "potential steps.", "bbox": {"l": 134.76498, "t": 430.28979, "r": 201.27232, "b": 439.08676, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The paper is structured as follows. In section 2, we give an overview of the latest developments in table-structure reconstruction. In section 3 we review the current HTML table encoding (popularised by PubTabNet and FinTabNet) and discuss its flaws. Subsequently, we introduce OTSL in section 4, which includes the language definition, syntax rules and error-correction procedures. In section 5, we apply OTSL on the TableFormer architecture, compare it to TableFormer models trained on HTML and ultimately demonstrate the advantages of using OTSL. Finally, in section 6 we conclude our work and outline next potential steps."}, {"label": "section_header", "id": 4, "page_no": 2, "cluster": {"id": 4, "label": "section_header", "bbox": {"l": 134.76498, "t": 462.08795, "r": 236.76912999999996, "b": 472.65634, "coord_origin": "TOPLEFT"}, "confidence": 0.9439422488212585, "cells": [{"id": 31, "text": "2", "bbox": {"l": 134.76498, "t": 462.08795, "r": 141.48859, "b": 472.65634, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Related Work", "bbox": {"l": 154.93819, "t": 462.08795, "r": 236.76912999999996, "b": 472.65634, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2 Related Work"}, {"label": "text", "id": 3, "page_no": 2, "cluster": {"id": 3, "label": "text", "bbox": {"l": 134.76498, "t": 488.68582, "r": 484.12047999999993, "b": 664.85577, "coord_origin": "TOPLEFT"}, "confidence": 0.9870182871818542, "cells": [{"id": 33, "text": "Approaches to formalize the logical structure and layout of tables in electronic", "bbox": {"l": 134.76498, "t": 488.68582, "r": 480.59067, "b": 497.48279, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "documents date back more than two decades [16]. In the recent past, a wide", "bbox": {"l": 134.76498, "t": 500.64081, "r": 480.5917400000001, "b": 509.43777, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "variety of computer vision methods have been explored to tackle the prob-", "bbox": {"l": 134.76498, "t": 512.5957900000001, "r": 480.58971999999994, "b": 521.39276, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "lem of table structure recognition, i.e. the correct identification of columns,", "bbox": {"l": 134.76498, "t": 524.55179, "r": 480.58966, "b": 533.34875, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "rows and spanning cells in a given table. Broadly speaking, the current deep-", "bbox": {"l": 134.76498, "t": 536.50679, "r": 480.5897499999999, "b": 545.30376, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "learning based approaches fall into three categories: object detection (OD) meth-", "bbox": {"l": 134.76498, "t": 548.4617900000001, "r": 480.58862000000005, "b": 557.2587599999999, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "ods, Graph-Neural-Network (GNN) methods and Image-to-Markup-Sequence", "bbox": {"l": 134.76498, "t": 560.41679, "r": 480.59072999999995, "b": 569.21376, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "(Im2Seq) methods. Object-detection based methods [11,12,13,14,21] rely on table-", "bbox": {"l": 134.76498, "t": 572.3718, "r": 484.12047999999993, "b": 581.16876, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "structure annotation using (overlapping) bounding boxes for training, and pro-", "bbox": {"l": 134.76498, "t": 584.3267999999999, "r": 480.59567, "b": 593.12376, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "duce bounding-box predictions to define table cells, rows, and columns on a table", "bbox": {"l": 134.76498, "t": 596.28279, "r": 480.58871, "b": 605.07976, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "image. Graph Neural Network (GNN) based methods [3,6,17,18], as the name", "bbox": {"l": 134.76498, "t": 608.23779, "r": 480.59075999999993, "b": 617.03476, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "suggests, represent tables as graph structures. The graph nodes represent the", "bbox": {"l": 134.76498, "t": 620.1927900000001, "r": 480.58574999999996, "b": 628.9897599999999, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "content of each table cell, an embedding vector from the table image, or geomet-", "bbox": {"l": 134.76498, "t": 632.1478, "r": 480.58875, "b": 640.94476, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "ric coordinates of the table cell. The edges of the graph define the relationship", "bbox": {"l": 134.76498, "t": 644.1028, "r": 480.58875, "b": 652.89977, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "between the nodes, e.g. if they belong to the same column, row, or table cell.", "bbox": {"l": 134.76498, "t": 656.05879, "r": 480.59069999999997, "b": 664.85577, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Approaches to formalize the logical structure and layout of tables in electronic documents date back more than two decades [16]. In the recent past, a wide variety of computer vision methods have been explored to tackle the problem of table structure recognition, i.e. the correct identification of columns, rows and spanning cells in a given table. Broadly speaking, the current deeplearning based approaches fall into three categories: object detection (OD) methods, Graph-Neural-Network (GNN) methods and Image-to-Markup-Sequence (Im2Seq) methods. Object-detection based methods [11,12,13,14,21] rely on tablestructure annotation using (overlapping) bounding boxes for training, and produce bounding-box predictions to define table cells, rows, and columns on a table image. Graph Neural Network (GNN) based methods [3,6,17,18], as the name suggests, represent tables as graph structures. The graph nodes represent the content of each table cell, an embedding vector from the table image, or geometric coordinates of the table cell. The edges of the graph define the relationship between the nodes, e.g. if they belong to the same column, row, or table cell."}], "body": [{"label": "text", "id": 2, "page_no": 2, "cluster": {"id": 2, "label": "text", "bbox": {"l": 134.76498, "t": 118.93377999999996, "r": 480.59183, "b": 211.41687000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9871802926063538, "cells": [{"id": 2, "text": "While the majority of research in TSR is currently focused on the develop-", "bbox": {"l": 149.709, "t": 118.93377999999996, "r": 480.59183, "b": 127.73077, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "ment and application of novel neural model architectures, the table structure", "bbox": {"l": 134.765, "t": 130.88878999999997, "r": 480.58675999999997, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "representation language (e.g. HTML in PubTabNet and FinTabNet) is usually", "bbox": {"l": 134.765, "t": 142.84479, "r": 480.5917400000001, "b": 151.64178000000004, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "adopted", "bbox": {"l": 134.765, "t": 154.7998, "r": 169.62514, "b": 163.59680000000003, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "as is", "bbox": {"l": 173.86099, "t": 154.7998, "r": 194.55531, "b": 163.59680000000003, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "for the sequence tokenization in Im2Seq models. In this paper,", "bbox": {"l": 199.60999, "t": 154.7998, "r": 480.58618, "b": 163.59680000000003, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "we aim for the opposite and investigate the impact of the table structure rep-", "bbox": {"l": 134.76498, "t": 166.75482, "r": 480.59167, "b": 175.55182000000002, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "resentation language with an otherwise unmodified Im2Seq transformer-based", "bbox": {"l": 134.76498, "t": 178.70983999999999, "r": 480.58968999999996, "b": 187.50684, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "architecture. Since the current state-of-the-art Im2Seq model is TableFormer [9],", "bbox": {"l": 134.76498, "t": 190.66485999999998, "r": 480.5917400000001, "b": 199.46185000000003, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "we select this model to perform our experiments.", "bbox": {"l": 134.76498, "t": 202.61987, "r": 348.35519, "b": 211.41687000000002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "While the majority of research in TSR is currently focused on the development and application of novel neural model architectures, the table structure representation language (e.g. HTML in PubTabNet and FinTabNet) is usually adopted as is for the sequence tokenization in Im2Seq models. In this paper, we aim for the opposite and investigate the impact of the table structure representation language with an otherwise unmodified Im2Seq transformer-based architecture. Since the current state-of-the-art Im2Seq model is TableFormer [9], we select this model to perform our experiments."}, {"label": "text", "id": 1, "page_no": 2, "cluster": {"id": 1, "label": "text", "bbox": {"l": 134.76498, "t": 214.83587999999997, "r": 480.59572999999995, "b": 331.22986, "coord_origin": "TOPLEFT"}, "confidence": 0.9871861338615417, "cells": [{"id": 12, "text": "The main contribution of this paper is the introduction of a new optimised ta-", "bbox": {"l": 149.70898, "t": 214.83587999999997, "r": 480.5939, "b": 223.63287000000003, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "ble structure language (OTSL), specifically designed to describe table-structure", "bbox": {"l": 134.76498, "t": 226.79089, "r": 480.5938100000001, "b": 235.58789000000002, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "in an compact and structured way for Im2Seq models. OTSL has a number of", "bbox": {"l": 134.76498, "t": 238.74689, "r": 480.58667, "b": 247.54387999999994, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "key features, which make it very attractive to use in Im2Seq models. Specifically,", "bbox": {"l": 134.76498, "t": 250.70190000000002, "r": 480.5867, "b": 259.49890000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "compared to other languages such as HTML, OTSL has a minimized vocabulary", "bbox": {"l": 134.76498, "t": 262.65692, "r": 480.58771, "b": 271.45392000000004, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "which yields short sequence length, strong inherent structure (e.g. strict rectan-", "bbox": {"l": 134.76498, "t": 274.61194, "r": 480.59572999999995, "b": 283.40891, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "gular layout) and a strict syntax with rules that only look backwards. The latter", "bbox": {"l": 134.76498, "t": 286.56692999999996, "r": 480.59274, "b": 295.36389, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "allows for syntax validation during inference and ensures a syntactically correct", "bbox": {"l": 134.76498, "t": 298.52190999999993, "r": 480.59473, "b": 307.31888, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "table-structure. These OTSL features are illustrated in Figure 1, in comparison", "bbox": {"l": 134.76498, "t": 310.47791, "r": 480.58667, "b": 319.27487, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "to HTML.", "bbox": {"l": 134.76498, "t": 322.43289, "r": 179.72021, "b": 331.22986, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The main contribution of this paper is the introduction of a new optimised table structure language (OTSL), specifically designed to describe table-structure in an compact and structured way for Im2Seq models. OTSL has a number of key features, which make it very attractive to use in Im2Seq models. Specifically, compared to other languages such as HTML, OTSL has a minimized vocabulary which yields short sequence length, strong inherent structure (e.g. strict rectangular layout) and a strict syntax with rules that only look backwards. The latter allows for syntax validation during inference and ensures a syntactically correct table-structure. These OTSL features are illustrated in Figure 1, in comparison to HTML."}, {"label": "text", "id": 0, "page_no": 2, "cluster": {"id": 0, "label": "text", "bbox": {"l": 134.76498, "t": 334.64789, "r": 480.59567, "b": 439.08676, "coord_origin": "TOPLEFT"}, "confidence": 0.988121747970581, "cells": [{"id": 22, "text": "The paper is structured as follows. In section 2, we give an overview of the", "bbox": {"l": 149.70898, "t": 334.64789, "r": 480.5878000000001, "b": 343.44485000000003, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "latest developments in table-structure reconstruction. In section 3 we review", "bbox": {"l": 134.76498, "t": 346.60388000000006, "r": 480.59375, "b": 355.40085, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "the current HTML table encoding (popularised by PubTabNet and FinTabNet)", "bbox": {"l": 134.76498, "t": 358.55887, "r": 480.58673, "b": 367.3558300000001, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "and discuss its flaws. Subsequently, we introduce OTSL in section 4, which in-", "bbox": {"l": 134.76498, "t": 370.51385, "r": 480.59161, "b": 379.31082, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "cludes the language definition, syntax rules and error-correction procedures. In", "bbox": {"l": 134.76498, "t": 382.46883999999994, "r": 480.59177000000005, "b": 391.26581, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "section 5, we apply OTSL on the TableFormer architecture, compare it to Table-", "bbox": {"l": 134.76498, "t": 394.42383, "r": 480.58774, "b": 403.2207900000001, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Former models trained on HTML and ultimately demonstrate the advantages", "bbox": {"l": 134.76498, "t": 406.37982, "r": 480.59469999999993, "b": 415.17679, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "of using OTSL. Finally, in section 6 we conclude our work and outline next", "bbox": {"l": 134.76498, "t": 418.33481, "r": 480.59567, "b": 427.13177, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "potential steps.", "bbox": {"l": 134.76498, "t": 430.28979, "r": 201.27232, "b": 439.08676, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The paper is structured as follows. In section 2, we give an overview of the latest developments in table-structure reconstruction. In section 3 we review the current HTML table encoding (popularised by PubTabNet and FinTabNet) and discuss its flaws. Subsequently, we introduce OTSL in section 4, which includes the language definition, syntax rules and error-correction procedures. In section 5, we apply OTSL on the TableFormer architecture, compare it to TableFormer models trained on HTML and ultimately demonstrate the advantages of using OTSL. Finally, in section 6 we conclude our work and outline next potential steps."}, {"label": "section_header", "id": 4, "page_no": 2, "cluster": {"id": 4, "label": "section_header", "bbox": {"l": 134.76498, "t": 462.08795, "r": 236.76912999999996, "b": 472.65634, "coord_origin": "TOPLEFT"}, "confidence": 0.9439422488212585, "cells": [{"id": 31, "text": "2", "bbox": {"l": 134.76498, "t": 462.08795, "r": 141.48859, "b": 472.65634, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Related Work", "bbox": {"l": 154.93819, "t": 462.08795, "r": 236.76912999999996, "b": 472.65634, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2 Related Work"}, {"label": "text", "id": 3, "page_no": 2, "cluster": {"id": 3, "label": "text", "bbox": {"l": 134.76498, "t": 488.68582, "r": 484.12047999999993, "b": 664.85577, "coord_origin": "TOPLEFT"}, "confidence": 0.9870182871818542, "cells": [{"id": 33, "text": "Approaches to formalize the logical structure and layout of tables in electronic", "bbox": {"l": 134.76498, "t": 488.68582, "r": 480.59067, "b": 497.48279, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "documents date back more than two decades [16]. In the recent past, a wide", "bbox": {"l": 134.76498, "t": 500.64081, "r": 480.5917400000001, "b": 509.43777, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "variety of computer vision methods have been explored to tackle the prob-", "bbox": {"l": 134.76498, "t": 512.5957900000001, "r": 480.58971999999994, "b": 521.39276, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "lem of table structure recognition, i.e. the correct identification of columns,", "bbox": {"l": 134.76498, "t": 524.55179, "r": 480.58966, "b": 533.34875, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "rows and spanning cells in a given table. Broadly speaking, the current deep-", "bbox": {"l": 134.76498, "t": 536.50679, "r": 480.5897499999999, "b": 545.30376, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "learning based approaches fall into three categories: object detection (OD) meth-", "bbox": {"l": 134.76498, "t": 548.4617900000001, "r": 480.58862000000005, "b": 557.2587599999999, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "ods, Graph-Neural-Network (GNN) methods and Image-to-Markup-Sequence", "bbox": {"l": 134.76498, "t": 560.41679, "r": 480.59072999999995, "b": 569.21376, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "(Im2Seq) methods. Object-detection based methods [11,12,13,14,21] rely on table-", "bbox": {"l": 134.76498, "t": 572.3718, "r": 484.12047999999993, "b": 581.16876, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "structure annotation using (overlapping) bounding boxes for training, and pro-", "bbox": {"l": 134.76498, "t": 584.3267999999999, "r": 480.59567, "b": 593.12376, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "duce bounding-box predictions to define table cells, rows, and columns on a table", "bbox": {"l": 134.76498, "t": 596.28279, "r": 480.58871, "b": 605.07976, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "image. Graph Neural Network (GNN) based methods [3,6,17,18], as the name", "bbox": {"l": 134.76498, "t": 608.23779, "r": 480.59075999999993, "b": 617.03476, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "suggests, represent tables as graph structures. The graph nodes represent the", "bbox": {"l": 134.76498, "t": 620.1927900000001, "r": 480.58574999999996, "b": 628.9897599999999, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "content of each table cell, an embedding vector from the table image, or geomet-", "bbox": {"l": 134.76498, "t": 632.1478, "r": 480.58875, "b": 640.94476, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "ric coordinates of the table cell. The edges of the graph define the relationship", "bbox": {"l": 134.76498, "t": 644.1028, "r": 480.58875, "b": 652.89977, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "between the nodes, e.g. if they belong to the same column, row, or table cell.", "bbox": {"l": 134.76498, "t": 656.05879, "r": 480.59069999999997, "b": 664.85577, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Approaches to formalize the logical structure and layout of tables in electronic documents date back more than two decades [16]. In the recent past, a wide variety of computer vision methods have been explored to tackle the problem of table structure recognition, i.e. the correct identification of columns, rows and spanning cells in a given table. Broadly speaking, the current deeplearning based approaches fall into three categories: object detection (OD) methods, Graph-Neural-Network (GNN) methods and Image-to-Markup-Sequence (Im2Seq) methods. Object-detection based methods [11,12,13,14,21] rely on tablestructure annotation using (overlapping) bounding boxes for training, and produce bounding-box predictions to define table cells, rows, and columns on a table image. Graph Neural Network (GNN) based methods [3,6,17,18], as the name suggests, represent tables as graph structures. The graph nodes represent the content of each table cell, an embedding vector from the table image, or geometric coordinates of the table cell. The edges of the graph define the relationship between the nodes, e.g. if they belong to the same column, row, or table cell."}], "headers": [{"label": "page_header", "id": 5, "page_no": 2, "cluster": {"id": 5, "label": "page_header", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9325800538063049, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Optimized Table Tokenization for Table Structure Recognition"}, {"label": "page_header", "id": 6, "page_no": 2, "cluster": {"id": 6, "label": "page_header", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8773486614227295, "cells": [{"id": 1, "text": "3", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3"}]}}, {"page_no": 3, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "4", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "M.", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 178.07675, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37415, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Other work [20] aims at predicting a grid for each table and deciding which cells", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.59375, "b": 127.73077, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "must be merged using an attention network. Im2Seq methods cast the problem", "bbox": {"l": 134.765, "t": 130.88878999999997, "r": 480.58774, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "as a sequence generation task [4,5,9,22], and therefore need an internal table-", "bbox": {"l": 134.765, "t": 142.84479, "r": 480.58675999999997, "b": 151.64178000000004, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "structure representation language, which is often implemented with standard", "bbox": {"l": 134.765, "t": 154.7998, "r": 480.5878000000001, "b": 163.59680000000003, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "markup languages (e.g. HTML, LaTeX, Markdown). In theory, Im2Seq methods", "bbox": {"l": 134.765, "t": 166.75482, "r": 480.59271, "b": 175.55182000000002, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "have a natural advantage over the OD and GNN methods by virtue of directly", "bbox": {"l": 134.765, "t": 178.70983999999999, "r": 480.5957599999999, "b": 187.50684, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "predicting the table-structure. As such, no post-processing or rules are needed", "bbox": {"l": 134.765, "t": 190.66485999999998, "r": 480.59271, "b": 199.46185000000003, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "in order to obtain the table-structure, which is necessary with OD and GNN", "bbox": {"l": 134.765, "t": 202.61987, "r": 480.59378, "b": 211.41687000000002, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "approaches. In practice, this is not entirely true, because a predicted sequence", "bbox": {"l": 134.765, "t": 214.57587, "r": 480.58783000000005, "b": 223.37285999999995, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "of table-structure markup does not necessarily have to be syntactically correct.", "bbox": {"l": 134.765, "t": 226.53088000000002, "r": 480.58978, "b": 235.32788000000005, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Hence, depending on the quality of the predicted sequence, some post-processing", "bbox": {"l": 134.765, "t": 238.48590000000002, "r": 480.59572999999995, "b": 247.28290000000004, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "needs to be performed to ensure a syntactically valid (let alone correct) sequence.", "bbox": {"l": 134.765, "t": 250.44092, "r": 480.59473, "b": 259.23792000000003, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Within the Im2Seq method, we find several popular models, namely the", "bbox": {"l": 149.709, "t": 262.65692, "r": 480.59280000000007, "b": 271.45392000000004, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "encoder-dual-decoder model (EDD) [22], TableFormer [9], Tabsplitter[2] and Ye", "bbox": {"l": 134.765, "t": 274.61194, "r": 480.59167, "b": 283.40891, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "et. al. [19]. EDD uses two consecutive long short-term memory (LSTM) decoders", "bbox": {"l": 134.765, "t": 286.56692999999996, "r": 480.59271, "b": 295.36389, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "to predict a table in HTML representation. The", "bbox": {"l": 134.765, "t": 298.52190999999993, "r": 342.02097, "b": 307.31888, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "tag decoder", "bbox": {"l": 345.064, "t": 298.52190999999993, "r": 393.04684, "b": 307.31888, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "predicts a sequence", "bbox": {"l": 397.16699, "t": 298.52190999999993, "r": 480.59082, "b": 307.31888, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "of HTML tags. For each decoded table cell (", "bbox": {"l": 134.76498, "t": 310.47791, "r": 333.29871, "b": 319.27487, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "<td>", "bbox": {"l": 333.29898, "t": 310.47791, "r": 356.9711, "b": 319.27487, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "), the attention is passed to", "bbox": {"l": 357.08499, "t": 310.47791, "r": 480.59433000000007, "b": 319.27487, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "the", "bbox": {"l": 134.76498, "t": 322.43289, "r": 148.59805, "b": 331.22986, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "cell decoder", "bbox": {"l": 152.27698, "t": 322.43289, "r": 202.1109, "b": 331.22986, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "to predict the content with an embedded OCR approach. The", "bbox": {"l": 206.86398, "t": 322.43289, "r": 480.58743, "b": 331.22986, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "latter makes it susceptible to transcription errors in the cell content of the table.", "bbox": {"l": 134.76498, "t": 334.38788, "r": 480.59476, "b": 343.18484, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "TableFormer address this reliance on OCR and uses two transformer decoders for", "bbox": {"l": 134.76498, "t": 346.34286, "r": 480.58675999999997, "b": 355.13983, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "HTML structure and cell bounding box prediction in an end-to-end architecture.", "bbox": {"l": 134.76498, "t": 358.29785, "r": 480.58868, "b": 367.09482, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "The predicted cell bounding box is then used to extract text tokens from an", "bbox": {"l": 134.76498, "t": 370.25284, "r": 480.58868, "b": 379.0498, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "originating (digital) PDF page, circumventing any need for OCR. TabSplitter", "bbox": {"l": 134.76498, "t": 382.20883, "r": 480.59357000000006, "b": 391.0058, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "[2]", "bbox": {"l": 134.76498, "t": 394.16382, "r": 144.76979, "b": 402.96078, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "proposes a compact double-matrix representation of table rows and columns", "bbox": {"l": 149.50908, "t": 394.16382, "r": 480.58667, "b": 402.96078, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "to do error detection and error correction of HTML structure sequences based", "bbox": {"l": 134.76498, "t": 406.1188, "r": 480.59569999999997, "b": 414.91576999999995, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "on predictions from [19]. This compact double-matrix representation can not be", "bbox": {"l": 134.76498, "t": 418.07379, "r": 480.59180000000003, "b": 426.87076, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "used directly by the Img2seq model training, so the model uses HTML as an", "bbox": {"l": 134.76498, "t": 430.02878, "r": 480.5878000000001, "b": 438.82574, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "intermediate form. Chi et. al. [4] introduce a data set and a baseline method", "bbox": {"l": 134.76498, "t": 441.98376, "r": 480.58868, "b": 450.78073, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "using bidirectional LSTMs to predict LaTeX code. Kayal", "bbox": {"l": 134.76498, "t": 453.93976000000004, "r": 384.5752, "b": 462.73672, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "[5]", "bbox": {"l": 391.55899, "t": 453.93976000000004, "r": 401.73236, "b": 462.73672, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "introduces Gated", "bbox": {"l": 406.55154, "t": 453.93976000000004, "r": 480.58777, "b": 462.73672, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "ResNet transformers to predict LaTeX code, and a separate OCR module to", "bbox": {"l": 134.76498, "t": 465.89474, "r": 480.59079, "b": 474.69171, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "extract content.", "bbox": {"l": 134.76498, "t": 477.84973, "r": 203.68625, "b": 486.6467, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Im2Seq approaches have shown to be well-suited for the TSR task and allow a", "bbox": {"l": 149.70898, "t": 490.06573, "r": 480.59378, "b": 498.8627, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "full end-to-end network design that can output the final table structure without", "bbox": {"l": 134.76498, "t": 502.02072, "r": 480.58871, "b": 510.81769, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "pre- or post-processing logic. Furthermore, Im2Seq models have demonstrated", "bbox": {"l": 134.76498, "t": 513.9757099999999, "r": 480.58675999999997, "b": 522.7726700000001, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "to deliver state-of-the-art prediction accuracy [9]. This motivated the authors", "bbox": {"l": 134.76498, "t": 525.93069, "r": 480.58978, "b": 534.72766, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "to investigate if the performance (both in accuracy and inference time) can", "bbox": {"l": 134.76498, "t": 537.8857, "r": 480.58765, "b": 546.6826599999999, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "be further improved by optimising the table structure representation language.", "bbox": {"l": 134.76498, "t": 549.84169, "r": 480.58971999999994, "b": 558.63866, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "We believe this is a necessary step before further improving neural network", "bbox": {"l": 134.76498, "t": 561.79669, "r": 480.58871, "b": 570.59366, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "architectures for this task.", "bbox": {"l": 134.76498, "t": 573.75169, "r": 249.27811, "b": 582.54866, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "3", "bbox": {"l": 134.76498, "t": 605.54984, "r": 141.48859, "b": 616.11823, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Problem Statement", "bbox": {"l": 154.93819, "t": 605.54984, "r": 269.62442, "b": 616.11823, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "All known Im2Seq based models for TSR fundamentally work in similar ways.", "bbox": {"l": 134.76498, "t": 632.14769, "r": 480.59064, "b": 640.94466, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "Given an image of a table, the Im2Seq model predicts the structure of the table", "bbox": {"l": 134.76498, "t": 644.1026899999999, "r": 480.5867, "b": 652.89966, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "by generating a sequence of tokens. These tokens originate from a finite vocab-", "bbox": {"l": 134.76498, "t": 656.0586900000001, "r": 480.5936899999999, "b": 664.85566, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 6, "label": "page_header", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.78900545835495, "cells": [{"id": 0, "text": "4", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "page_header", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9045588374137878, "cells": [{"id": 1, "text": "M.", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 178.07675, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37415, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.5957599999999, "b": 259.23792000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9467443227767944, "cells": [{"id": 3, "text": "Other work [20] aims at predicting a grid for each table and deciding which cells", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.59375, "b": 127.73077, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "must be merged using an attention network. Im2Seq methods cast the problem", "bbox": {"l": 134.765, "t": 130.88878999999997, "r": 480.58774, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "as a sequence generation task [4,5,9,22], and therefore need an internal table-", "bbox": {"l": 134.765, "t": 142.84479, "r": 480.58675999999997, "b": 151.64178000000004, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "structure representation language, which is often implemented with standard", "bbox": {"l": 134.765, "t": 154.7998, "r": 480.5878000000001, "b": 163.59680000000003, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "markup languages (e.g. HTML, LaTeX, Markdown). In theory, Im2Seq methods", "bbox": {"l": 134.765, "t": 166.75482, "r": 480.59271, "b": 175.55182000000002, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "have a natural advantage over the OD and GNN methods by virtue of directly", "bbox": {"l": 134.765, "t": 178.70983999999999, "r": 480.5957599999999, "b": 187.50684, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "predicting the table-structure. As such, no post-processing or rules are needed", "bbox": {"l": 134.765, "t": 190.66485999999998, "r": 480.59271, "b": 199.46185000000003, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "in order to obtain the table-structure, which is necessary with OD and GNN", "bbox": {"l": 134.765, "t": 202.61987, "r": 480.59378, "b": 211.41687000000002, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "approaches. In practice, this is not entirely true, because a predicted sequence", "bbox": {"l": 134.765, "t": 214.57587, "r": 480.58783000000005, "b": 223.37285999999995, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "of table-structure markup does not necessarily have to be syntactically correct.", "bbox": {"l": 134.765, "t": 226.53088000000002, "r": 480.58978, "b": 235.32788000000005, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Hence, depending on the quality of the predicted sequence, some post-processing", "bbox": {"l": 134.765, "t": 238.48590000000002, "r": 480.59572999999995, "b": 247.28290000000004, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "needs to be performed to ensure a syntactically valid (let alone correct) sequence.", "bbox": {"l": 134.765, "t": 250.44092, "r": 480.59473, "b": 259.23792000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "text", "bbox": {"l": 134.76498, "t": 262.65692, "r": 480.59569999999997, "b": 486.6467, "coord_origin": "TOPLEFT"}, "confidence": 0.9290871620178223, "cells": [{"id": 15, "text": "Within the Im2Seq method, we find several popular models, namely the", "bbox": {"l": 149.709, "t": 262.65692, "r": 480.59280000000007, "b": 271.45392000000004, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "encoder-dual-decoder model (EDD) [22], TableFormer [9], Tabsplitter[2] and Ye", "bbox": {"l": 134.765, "t": 274.61194, "r": 480.59167, "b": 283.40891, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "et. al. [19]. EDD uses two consecutive long short-term memory (LSTM) decoders", "bbox": {"l": 134.765, "t": 286.56692999999996, "r": 480.59271, "b": 295.36389, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "to predict a table in HTML representation. The", "bbox": {"l": 134.765, "t": 298.52190999999993, "r": 342.02097, "b": 307.31888, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "tag decoder", "bbox": {"l": 345.064, "t": 298.52190999999993, "r": 393.04684, "b": 307.31888, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "predicts a sequence", "bbox": {"l": 397.16699, "t": 298.52190999999993, "r": 480.59082, "b": 307.31888, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "of HTML tags. For each decoded table cell (", "bbox": {"l": 134.76498, "t": 310.47791, "r": 333.29871, "b": 319.27487, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "<td>", "bbox": {"l": 333.29898, "t": 310.47791, "r": 356.9711, "b": 319.27487, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "), the attention is passed to", "bbox": {"l": 357.08499, "t": 310.47791, "r": 480.59433000000007, "b": 319.27487, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "the", "bbox": {"l": 134.76498, "t": 322.43289, "r": 148.59805, "b": 331.22986, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "cell decoder", "bbox": {"l": 152.27698, "t": 322.43289, "r": 202.1109, "b": 331.22986, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "to predict the content with an embedded OCR approach. The", "bbox": {"l": 206.86398, "t": 322.43289, "r": 480.58743, "b": 331.22986, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "latter makes it susceptible to transcription errors in the cell content of the table.", "bbox": {"l": 134.76498, "t": 334.38788, "r": 480.59476, "b": 343.18484, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "TableFormer address this reliance on OCR and uses two transformer decoders for", "bbox": {"l": 134.76498, "t": 346.34286, "r": 480.58675999999997, "b": 355.13983, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "HTML structure and cell bounding box prediction in an end-to-end architecture.", "bbox": {"l": 134.76498, "t": 358.29785, "r": 480.58868, "b": 367.09482, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "The predicted cell bounding box is then used to extract text tokens from an", "bbox": {"l": 134.76498, "t": 370.25284, "r": 480.58868, "b": 379.0498, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "originating (digital) PDF page, circumventing any need for OCR. TabSplitter", "bbox": {"l": 134.76498, "t": 382.20883, "r": 480.59357000000006, "b": 391.0058, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "[2]", "bbox": {"l": 134.76498, "t": 394.16382, "r": 144.76979, "b": 402.96078, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "proposes a compact double-matrix representation of table rows and columns", "bbox": {"l": 149.50908, "t": 394.16382, "r": 480.58667, "b": 402.96078, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "to do error detection and error correction of HTML structure sequences based", "bbox": {"l": 134.76498, "t": 406.1188, "r": 480.59569999999997, "b": 414.91576999999995, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "on predictions from [19]. This compact double-matrix representation can not be", "bbox": {"l": 134.76498, "t": 418.07379, "r": 480.59180000000003, "b": 426.87076, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "used directly by the Img2seq model training, so the model uses HTML as an", "bbox": {"l": 134.76498, "t": 430.02878, "r": 480.5878000000001, "b": 438.82574, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "intermediate form. Chi et. al. [4] introduce a data set and a baseline method", "bbox": {"l": 134.76498, "t": 441.98376, "r": 480.58868, "b": 450.78073, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "using bidirectional LSTMs to predict LaTeX code. Kayal", "bbox": {"l": 134.76498, "t": 453.93976000000004, "r": 384.5752, "b": 462.73672, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "[5]", "bbox": {"l": 391.55899, "t": 453.93976000000004, "r": 401.73236, "b": 462.73672, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "introduces Gated", "bbox": {"l": 406.55154, "t": 453.93976000000004, "r": 480.58777, "b": 462.73672, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "ResNet transformers to predict LaTeX code, and a separate OCR module to", "bbox": {"l": 134.76498, "t": 465.89474, "r": 480.59079, "b": 474.69171, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "extract content.", "bbox": {"l": 134.76498, "t": 477.84973, "r": 203.68625, "b": 486.6467, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 134.76498, "t": 490.06573, "r": 480.59378, "b": 582.54866, "coord_origin": "TOPLEFT"}, "confidence": 0.9853583574295044, "cells": [{"id": 43, "text": "Im2Seq approaches have shown to be well-suited for the TSR task and allow a", "bbox": {"l": 149.70898, "t": 490.06573, "r": 480.59378, "b": 498.8627, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "full end-to-end network design that can output the final table structure without", "bbox": {"l": 134.76498, "t": 502.02072, "r": 480.58871, "b": 510.81769, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "pre- or post-processing logic. Furthermore, Im2Seq models have demonstrated", "bbox": {"l": 134.76498, "t": 513.9757099999999, "r": 480.58675999999997, "b": 522.7726700000001, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "to deliver state-of-the-art prediction accuracy [9]. This motivated the authors", "bbox": {"l": 134.76498, "t": 525.93069, "r": 480.58978, "b": 534.72766, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "to investigate if the performance (both in accuracy and inference time) can", "bbox": {"l": 134.76498, "t": 537.8857, "r": 480.58765, "b": 546.6826599999999, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "be further improved by optimising the table structure representation language.", "bbox": {"l": 134.76498, "t": 549.84169, "r": 480.58971999999994, "b": 558.63866, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "We believe this is a necessary step before further improving neural network", "bbox": {"l": 134.76498, "t": 561.79669, "r": 480.58871, "b": 570.59366, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "architectures for this task.", "bbox": {"l": 134.76498, "t": 573.75169, "r": 249.27811, "b": 582.54866, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "section_header", "bbox": {"l": 134.76498, "t": 605.54984, "r": 269.62442, "b": 616.11823, "coord_origin": "TOPLEFT"}, "confidence": 0.9393904209136963, "cells": [{"id": 51, "text": "3", "bbox": {"l": 134.76498, "t": 605.54984, "r": 141.48859, "b": 616.11823, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Problem Statement", "bbox": {"l": 154.93819, "t": 605.54984, "r": 269.62442, "b": 616.11823, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 134.76498, "t": 632.14769, "r": 480.5936899999999, "b": 664.85566, "coord_origin": "TOPLEFT"}, "confidence": 0.9692807197570801, "cells": [{"id": 53, "text": "All known Im2Seq based models for TSR fundamentally work in similar ways.", "bbox": {"l": 134.76498, "t": 632.14769, "r": 480.59064, "b": 640.94466, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "Given an image of a table, the Im2Seq model predicts the structure of the table", "bbox": {"l": 134.76498, "t": 644.1026899999999, "r": 480.5867, "b": 652.89966, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "by generating a sequence of tokens. These tokens originate from a finite vocab-", "bbox": {"l": 134.76498, "t": 656.0586900000001, "r": 480.5936899999999, "b": 664.85566, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_header", "id": 6, "page_no": 3, "cluster": {"id": 6, "label": "page_header", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.78900545835495, "cells": [{"id": 0, "text": "4", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4"}, {"label": "page_header", "id": 5, "page_no": 3, "cluster": {"id": 5, "label": "page_header", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9045588374137878, "cells": [{"id": 1, "text": "M.", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 178.07675, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37415, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "M. Lysak, et al."}, {"label": "text", "id": 2, "page_no": 3, "cluster": {"id": 2, "label": "text", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.5957599999999, "b": 259.23792000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9467443227767944, "cells": [{"id": 3, "text": "Other work [20] aims at predicting a grid for each table and deciding which cells", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.59375, "b": 127.73077, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "must be merged using an attention network. Im2Seq methods cast the problem", "bbox": {"l": 134.765, "t": 130.88878999999997, "r": 480.58774, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "as a sequence generation task [4,5,9,22], and therefore need an internal table-", "bbox": {"l": 134.765, "t": 142.84479, "r": 480.58675999999997, "b": 151.64178000000004, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "structure representation language, which is often implemented with standard", "bbox": {"l": 134.765, "t": 154.7998, "r": 480.5878000000001, "b": 163.59680000000003, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "markup languages (e.g. HTML, LaTeX, Markdown). In theory, Im2Seq methods", "bbox": {"l": 134.765, "t": 166.75482, "r": 480.59271, "b": 175.55182000000002, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "have a natural advantage over the OD and GNN methods by virtue of directly", "bbox": {"l": 134.765, "t": 178.70983999999999, "r": 480.5957599999999, "b": 187.50684, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "predicting the table-structure. As such, no post-processing or rules are needed", "bbox": {"l": 134.765, "t": 190.66485999999998, "r": 480.59271, "b": 199.46185000000003, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "in order to obtain the table-structure, which is necessary with OD and GNN", "bbox": {"l": 134.765, "t": 202.61987, "r": 480.59378, "b": 211.41687000000002, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "approaches. In practice, this is not entirely true, because a predicted sequence", "bbox": {"l": 134.765, "t": 214.57587, "r": 480.58783000000005, "b": 223.37285999999995, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "of table-structure markup does not necessarily have to be syntactically correct.", "bbox": {"l": 134.765, "t": 226.53088000000002, "r": 480.58978, "b": 235.32788000000005, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Hence, depending on the quality of the predicted sequence, some post-processing", "bbox": {"l": 134.765, "t": 238.48590000000002, "r": 480.59572999999995, "b": 247.28290000000004, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "needs to be performed to ensure a syntactically valid (let alone correct) sequence.", "bbox": {"l": 134.765, "t": 250.44092, "r": 480.59473, "b": 259.23792000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Other work [20] aims at predicting a grid for each table and deciding which cells must be merged using an attention network. Im2Seq methods cast the problem as a sequence generation task [4,5,9,22], and therefore need an internal tablestructure representation language, which is often implemented with standard markup languages (e.g. HTML, LaTeX, Markdown). In theory, Im2Seq methods have a natural advantage over the OD and GNN methods by virtue of directly predicting the table-structure. As such, no post-processing or rules are needed in order to obtain the table-structure, which is necessary with OD and GNN approaches. In practice, this is not entirely true, because a predicted sequence of table-structure markup does not necessarily have to be syntactically correct. Hence, depending on the quality of the predicted sequence, some post-processing needs to be performed to ensure a syntactically valid (let alone correct) sequence."}, {"label": "text", "id": 4, "page_no": 3, "cluster": {"id": 4, "label": "text", "bbox": {"l": 134.76498, "t": 262.65692, "r": 480.59569999999997, "b": 486.6467, "coord_origin": "TOPLEFT"}, "confidence": 0.9290871620178223, "cells": [{"id": 15, "text": "Within the Im2Seq method, we find several popular models, namely the", "bbox": {"l": 149.709, "t": 262.65692, "r": 480.59280000000007, "b": 271.45392000000004, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "encoder-dual-decoder model (EDD) [22], TableFormer [9], Tabsplitter[2] and Ye", "bbox": {"l": 134.765, "t": 274.61194, "r": 480.59167, "b": 283.40891, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "et. al. [19]. EDD uses two consecutive long short-term memory (LSTM) decoders", "bbox": {"l": 134.765, "t": 286.56692999999996, "r": 480.59271, "b": 295.36389, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "to predict a table in HTML representation. The", "bbox": {"l": 134.765, "t": 298.52190999999993, "r": 342.02097, "b": 307.31888, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "tag decoder", "bbox": {"l": 345.064, "t": 298.52190999999993, "r": 393.04684, "b": 307.31888, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "predicts a sequence", "bbox": {"l": 397.16699, "t": 298.52190999999993, "r": 480.59082, "b": 307.31888, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "of HTML tags. For each decoded table cell (", "bbox": {"l": 134.76498, "t": 310.47791, "r": 333.29871, "b": 319.27487, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "<td>", "bbox": {"l": 333.29898, "t": 310.47791, "r": 356.9711, "b": 319.27487, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "), the attention is passed to", "bbox": {"l": 357.08499, "t": 310.47791, "r": 480.59433000000007, "b": 319.27487, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "the", "bbox": {"l": 134.76498, "t": 322.43289, "r": 148.59805, "b": 331.22986, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "cell decoder", "bbox": {"l": 152.27698, "t": 322.43289, "r": 202.1109, "b": 331.22986, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "to predict the content with an embedded OCR approach. The", "bbox": {"l": 206.86398, "t": 322.43289, "r": 480.58743, "b": 331.22986, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "latter makes it susceptible to transcription errors in the cell content of the table.", "bbox": {"l": 134.76498, "t": 334.38788, "r": 480.59476, "b": 343.18484, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "TableFormer address this reliance on OCR and uses two transformer decoders for", "bbox": {"l": 134.76498, "t": 346.34286, "r": 480.58675999999997, "b": 355.13983, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "HTML structure and cell bounding box prediction in an end-to-end architecture.", "bbox": {"l": 134.76498, "t": 358.29785, "r": 480.58868, "b": 367.09482, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "The predicted cell bounding box is then used to extract text tokens from an", "bbox": {"l": 134.76498, "t": 370.25284, "r": 480.58868, "b": 379.0498, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "originating (digital) PDF page, circumventing any need for OCR. TabSplitter", "bbox": {"l": 134.76498, "t": 382.20883, "r": 480.59357000000006, "b": 391.0058, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "[2]", "bbox": {"l": 134.76498, "t": 394.16382, "r": 144.76979, "b": 402.96078, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "proposes a compact double-matrix representation of table rows and columns", "bbox": {"l": 149.50908, "t": 394.16382, "r": 480.58667, "b": 402.96078, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "to do error detection and error correction of HTML structure sequences based", "bbox": {"l": 134.76498, "t": 406.1188, "r": 480.59569999999997, "b": 414.91576999999995, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "on predictions from [19]. This compact double-matrix representation can not be", "bbox": {"l": 134.76498, "t": 418.07379, "r": 480.59180000000003, "b": 426.87076, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "used directly by the Img2seq model training, so the model uses HTML as an", "bbox": {"l": 134.76498, "t": 430.02878, "r": 480.5878000000001, "b": 438.82574, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "intermediate form. Chi et. al. [4] introduce a data set and a baseline method", "bbox": {"l": 134.76498, "t": 441.98376, "r": 480.58868, "b": 450.78073, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "using bidirectional LSTMs to predict LaTeX code. Kayal", "bbox": {"l": 134.76498, "t": 453.93976000000004, "r": 384.5752, "b": 462.73672, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "[5]", "bbox": {"l": 391.55899, "t": 453.93976000000004, "r": 401.73236, "b": 462.73672, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "introduces Gated", "bbox": {"l": 406.55154, "t": 453.93976000000004, "r": 480.58777, "b": 462.73672, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "ResNet transformers to predict LaTeX code, and a separate OCR module to", "bbox": {"l": 134.76498, "t": 465.89474, "r": 480.59079, "b": 474.69171, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "extract content.", "bbox": {"l": 134.76498, "t": 477.84973, "r": 203.68625, "b": 486.6467, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Within the Im2Seq method, we find several popular models, namely the encoder-dual-decoder model (EDD) [22], TableFormer [9], Tabsplitter[2] and Ye et. al. [19]. EDD uses two consecutive long short-term memory (LSTM) decoders to predict a table in HTML representation. The tag decoder predicts a sequence of HTML tags. For each decoded table cell ( <td> ), the attention is passed to the cell decoder to predict the content with an embedded OCR approach. The latter makes it susceptible to transcription errors in the cell content of the table. TableFormer address this reliance on OCR and uses two transformer decoders for HTML structure and cell bounding box prediction in an end-to-end architecture. The predicted cell bounding box is then used to extract text tokens from an originating (digital) PDF page, circumventing any need for OCR. TabSplitter [2] proposes a compact double-matrix representation of table rows and columns to do error detection and error correction of HTML structure sequences based on predictions from [19]. This compact double-matrix representation can not be used directly by the Img2seq model training, so the model uses HTML as an intermediate form. Chi et. al. [4] introduce a data set and a baseline method using bidirectional LSTMs to predict LaTeX code. Kayal [5] introduces Gated ResNet transformers to predict LaTeX code, and a separate OCR module to extract content."}, {"label": "text", "id": 0, "page_no": 3, "cluster": {"id": 0, "label": "text", "bbox": {"l": 134.76498, "t": 490.06573, "r": 480.59378, "b": 582.54866, "coord_origin": "TOPLEFT"}, "confidence": 0.9853583574295044, "cells": [{"id": 43, "text": "Im2Seq approaches have shown to be well-suited for the TSR task and allow a", "bbox": {"l": 149.70898, "t": 490.06573, "r": 480.59378, "b": 498.8627, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "full end-to-end network design that can output the final table structure without", "bbox": {"l": 134.76498, "t": 502.02072, "r": 480.58871, "b": 510.81769, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "pre- or post-processing logic. Furthermore, Im2Seq models have demonstrated", "bbox": {"l": 134.76498, "t": 513.9757099999999, "r": 480.58675999999997, "b": 522.7726700000001, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "to deliver state-of-the-art prediction accuracy [9]. This motivated the authors", "bbox": {"l": 134.76498, "t": 525.93069, "r": 480.58978, "b": 534.72766, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "to investigate if the performance (both in accuracy and inference time) can", "bbox": {"l": 134.76498, "t": 537.8857, "r": 480.58765, "b": 546.6826599999999, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "be further improved by optimising the table structure representation language.", "bbox": {"l": 134.76498, "t": 549.84169, "r": 480.58971999999994, "b": 558.63866, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "We believe this is a necessary step before further improving neural network", "bbox": {"l": 134.76498, "t": 561.79669, "r": 480.58871, "b": 570.59366, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "architectures for this task.", "bbox": {"l": 134.76498, "t": 573.75169, "r": 249.27811, "b": 582.54866, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Im2Seq approaches have shown to be well-suited for the TSR task and allow a full end-to-end network design that can output the final table structure without pre- or post-processing logic. Furthermore, Im2Seq models have demonstrated to deliver state-of-the-art prediction accuracy [9]. This motivated the authors to investigate if the performance (both in accuracy and inference time) can be further improved by optimising the table structure representation language. We believe this is a necessary step before further improving neural network architectures for this task."}, {"label": "section_header", "id": 3, "page_no": 3, "cluster": {"id": 3, "label": "section_header", "bbox": {"l": 134.76498, "t": 605.54984, "r": 269.62442, "b": 616.11823, "coord_origin": "TOPLEFT"}, "confidence": 0.9393904209136963, "cells": [{"id": 51, "text": "3", "bbox": {"l": 134.76498, "t": 605.54984, "r": 141.48859, "b": 616.11823, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Problem Statement", "bbox": {"l": 154.93819, "t": 605.54984, "r": 269.62442, "b": 616.11823, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3 Problem Statement"}, {"label": "text", "id": 1, "page_no": 3, "cluster": {"id": 1, "label": "text", "bbox": {"l": 134.76498, "t": 632.14769, "r": 480.5936899999999, "b": 664.85566, "coord_origin": "TOPLEFT"}, "confidence": 0.9692807197570801, "cells": [{"id": 53, "text": "All known Im2Seq based models for TSR fundamentally work in similar ways.", "bbox": {"l": 134.76498, "t": 632.14769, "r": 480.59064, "b": 640.94466, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "Given an image of a table, the Im2Seq model predicts the structure of the table", "bbox": {"l": 134.76498, "t": 644.1026899999999, "r": 480.5867, "b": 652.89966, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "by generating a sequence of tokens. These tokens originate from a finite vocab-", "bbox": {"l": 134.76498, "t": 656.0586900000001, "r": 480.5936899999999, "b": 664.85566, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "All known Im2Seq based models for TSR fundamentally work in similar ways. Given an image of a table, the Im2Seq model predicts the structure of the table by generating a sequence of tokens. These tokens originate from a finite vocab-"}], "body": [{"label": "text", "id": 2, "page_no": 3, "cluster": {"id": 2, "label": "text", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.5957599999999, "b": 259.23792000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9467443227767944, "cells": [{"id": 3, "text": "Other work [20] aims at predicting a grid for each table and deciding which cells", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.59375, "b": 127.73077, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "must be merged using an attention network. Im2Seq methods cast the problem", "bbox": {"l": 134.765, "t": 130.88878999999997, "r": 480.58774, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "as a sequence generation task [4,5,9,22], and therefore need an internal table-", "bbox": {"l": 134.765, "t": 142.84479, "r": 480.58675999999997, "b": 151.64178000000004, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "structure representation language, which is often implemented with standard", "bbox": {"l": 134.765, "t": 154.7998, "r": 480.5878000000001, "b": 163.59680000000003, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "markup languages (e.g. HTML, LaTeX, Markdown). In theory, Im2Seq methods", "bbox": {"l": 134.765, "t": 166.75482, "r": 480.59271, "b": 175.55182000000002, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "have a natural advantage over the OD and GNN methods by virtue of directly", "bbox": {"l": 134.765, "t": 178.70983999999999, "r": 480.5957599999999, "b": 187.50684, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "predicting the table-structure. As such, no post-processing or rules are needed", "bbox": {"l": 134.765, "t": 190.66485999999998, "r": 480.59271, "b": 199.46185000000003, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "in order to obtain the table-structure, which is necessary with OD and GNN", "bbox": {"l": 134.765, "t": 202.61987, "r": 480.59378, "b": 211.41687000000002, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "approaches. In practice, this is not entirely true, because a predicted sequence", "bbox": {"l": 134.765, "t": 214.57587, "r": 480.58783000000005, "b": 223.37285999999995, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "of table-structure markup does not necessarily have to be syntactically correct.", "bbox": {"l": 134.765, "t": 226.53088000000002, "r": 480.58978, "b": 235.32788000000005, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Hence, depending on the quality of the predicted sequence, some post-processing", "bbox": {"l": 134.765, "t": 238.48590000000002, "r": 480.59572999999995, "b": 247.28290000000004, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "needs to be performed to ensure a syntactically valid (let alone correct) sequence.", "bbox": {"l": 134.765, "t": 250.44092, "r": 480.59473, "b": 259.23792000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Other work [20] aims at predicting a grid for each table and deciding which cells must be merged using an attention network. Im2Seq methods cast the problem as a sequence generation task [4,5,9,22], and therefore need an internal tablestructure representation language, which is often implemented with standard markup languages (e.g. HTML, LaTeX, Markdown). In theory, Im2Seq methods have a natural advantage over the OD and GNN methods by virtue of directly predicting the table-structure. As such, no post-processing or rules are needed in order to obtain the table-structure, which is necessary with OD and GNN approaches. In practice, this is not entirely true, because a predicted sequence of table-structure markup does not necessarily have to be syntactically correct. Hence, depending on the quality of the predicted sequence, some post-processing needs to be performed to ensure a syntactically valid (let alone correct) sequence."}, {"label": "text", "id": 4, "page_no": 3, "cluster": {"id": 4, "label": "text", "bbox": {"l": 134.76498, "t": 262.65692, "r": 480.59569999999997, "b": 486.6467, "coord_origin": "TOPLEFT"}, "confidence": 0.9290871620178223, "cells": [{"id": 15, "text": "Within the Im2Seq method, we find several popular models, namely the", "bbox": {"l": 149.709, "t": 262.65692, "r": 480.59280000000007, "b": 271.45392000000004, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "encoder-dual-decoder model (EDD) [22], TableFormer [9], Tabsplitter[2] and Ye", "bbox": {"l": 134.765, "t": 274.61194, "r": 480.59167, "b": 283.40891, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "et. al. [19]. EDD uses two consecutive long short-term memory (LSTM) decoders", "bbox": {"l": 134.765, "t": 286.56692999999996, "r": 480.59271, "b": 295.36389, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "to predict a table in HTML representation. The", "bbox": {"l": 134.765, "t": 298.52190999999993, "r": 342.02097, "b": 307.31888, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "tag decoder", "bbox": {"l": 345.064, "t": 298.52190999999993, "r": 393.04684, "b": 307.31888, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "predicts a sequence", "bbox": {"l": 397.16699, "t": 298.52190999999993, "r": 480.59082, "b": 307.31888, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "of HTML tags. For each decoded table cell (", "bbox": {"l": 134.76498, "t": 310.47791, "r": 333.29871, "b": 319.27487, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "<td>", "bbox": {"l": 333.29898, "t": 310.47791, "r": 356.9711, "b": 319.27487, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "), the attention is passed to", "bbox": {"l": 357.08499, "t": 310.47791, "r": 480.59433000000007, "b": 319.27487, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "the", "bbox": {"l": 134.76498, "t": 322.43289, "r": 148.59805, "b": 331.22986, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "cell decoder", "bbox": {"l": 152.27698, "t": 322.43289, "r": 202.1109, "b": 331.22986, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "to predict the content with an embedded OCR approach. The", "bbox": {"l": 206.86398, "t": 322.43289, "r": 480.58743, "b": 331.22986, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "latter makes it susceptible to transcription errors in the cell content of the table.", "bbox": {"l": 134.76498, "t": 334.38788, "r": 480.59476, "b": 343.18484, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "TableFormer address this reliance on OCR and uses two transformer decoders for", "bbox": {"l": 134.76498, "t": 346.34286, "r": 480.58675999999997, "b": 355.13983, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "HTML structure and cell bounding box prediction in an end-to-end architecture.", "bbox": {"l": 134.76498, "t": 358.29785, "r": 480.58868, "b": 367.09482, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "The predicted cell bounding box is then used to extract text tokens from an", "bbox": {"l": 134.76498, "t": 370.25284, "r": 480.58868, "b": 379.0498, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "originating (digital) PDF page, circumventing any need for OCR. TabSplitter", "bbox": {"l": 134.76498, "t": 382.20883, "r": 480.59357000000006, "b": 391.0058, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "[2]", "bbox": {"l": 134.76498, "t": 394.16382, "r": 144.76979, "b": 402.96078, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "proposes a compact double-matrix representation of table rows and columns", "bbox": {"l": 149.50908, "t": 394.16382, "r": 480.58667, "b": 402.96078, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "to do error detection and error correction of HTML structure sequences based", "bbox": {"l": 134.76498, "t": 406.1188, "r": 480.59569999999997, "b": 414.91576999999995, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "on predictions from [19]. This compact double-matrix representation can not be", "bbox": {"l": 134.76498, "t": 418.07379, "r": 480.59180000000003, "b": 426.87076, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "used directly by the Img2seq model training, so the model uses HTML as an", "bbox": {"l": 134.76498, "t": 430.02878, "r": 480.5878000000001, "b": 438.82574, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "intermediate form. Chi et. al. [4] introduce a data set and a baseline method", "bbox": {"l": 134.76498, "t": 441.98376, "r": 480.58868, "b": 450.78073, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "using bidirectional LSTMs to predict LaTeX code. Kayal", "bbox": {"l": 134.76498, "t": 453.93976000000004, "r": 384.5752, "b": 462.73672, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "[5]", "bbox": {"l": 391.55899, "t": 453.93976000000004, "r": 401.73236, "b": 462.73672, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "introduces Gated", "bbox": {"l": 406.55154, "t": 453.93976000000004, "r": 480.58777, "b": 462.73672, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "ResNet transformers to predict LaTeX code, and a separate OCR module to", "bbox": {"l": 134.76498, "t": 465.89474, "r": 480.59079, "b": 474.69171, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "extract content.", "bbox": {"l": 134.76498, "t": 477.84973, "r": 203.68625, "b": 486.6467, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Within the Im2Seq method, we find several popular models, namely the encoder-dual-decoder model (EDD) [22], TableFormer [9], Tabsplitter[2] and Ye et. al. [19]. EDD uses two consecutive long short-term memory (LSTM) decoders to predict a table in HTML representation. The tag decoder predicts a sequence of HTML tags. For each decoded table cell ( <td> ), the attention is passed to the cell decoder to predict the content with an embedded OCR approach. The latter makes it susceptible to transcription errors in the cell content of the table. TableFormer address this reliance on OCR and uses two transformer decoders for HTML structure and cell bounding box prediction in an end-to-end architecture. The predicted cell bounding box is then used to extract text tokens from an originating (digital) PDF page, circumventing any need for OCR. TabSplitter [2] proposes a compact double-matrix representation of table rows and columns to do error detection and error correction of HTML structure sequences based on predictions from [19]. This compact double-matrix representation can not be used directly by the Img2seq model training, so the model uses HTML as an intermediate form. Chi et. al. [4] introduce a data set and a baseline method using bidirectional LSTMs to predict LaTeX code. Kayal [5] introduces Gated ResNet transformers to predict LaTeX code, and a separate OCR module to extract content."}, {"label": "text", "id": 0, "page_no": 3, "cluster": {"id": 0, "label": "text", "bbox": {"l": 134.76498, "t": 490.06573, "r": 480.59378, "b": 582.54866, "coord_origin": "TOPLEFT"}, "confidence": 0.9853583574295044, "cells": [{"id": 43, "text": "Im2Seq approaches have shown to be well-suited for the TSR task and allow a", "bbox": {"l": 149.70898, "t": 490.06573, "r": 480.59378, "b": 498.8627, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "full end-to-end network design that can output the final table structure without", "bbox": {"l": 134.76498, "t": 502.02072, "r": 480.58871, "b": 510.81769, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "pre- or post-processing logic. Furthermore, Im2Seq models have demonstrated", "bbox": {"l": 134.76498, "t": 513.9757099999999, "r": 480.58675999999997, "b": 522.7726700000001, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "to deliver state-of-the-art prediction accuracy [9]. This motivated the authors", "bbox": {"l": 134.76498, "t": 525.93069, "r": 480.58978, "b": 534.72766, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "to investigate if the performance (both in accuracy and inference time) can", "bbox": {"l": 134.76498, "t": 537.8857, "r": 480.58765, "b": 546.6826599999999, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "be further improved by optimising the table structure representation language.", "bbox": {"l": 134.76498, "t": 549.84169, "r": 480.58971999999994, "b": 558.63866, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "We believe this is a necessary step before further improving neural network", "bbox": {"l": 134.76498, "t": 561.79669, "r": 480.58871, "b": 570.59366, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "architectures for this task.", "bbox": {"l": 134.76498, "t": 573.75169, "r": 249.27811, "b": 582.54866, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Im2Seq approaches have shown to be well-suited for the TSR task and allow a full end-to-end network design that can output the final table structure without pre- or post-processing logic. Furthermore, Im2Seq models have demonstrated to deliver state-of-the-art prediction accuracy [9]. This motivated the authors to investigate if the performance (both in accuracy and inference time) can be further improved by optimising the table structure representation language. We believe this is a necessary step before further improving neural network architectures for this task."}, {"label": "section_header", "id": 3, "page_no": 3, "cluster": {"id": 3, "label": "section_header", "bbox": {"l": 134.76498, "t": 605.54984, "r": 269.62442, "b": 616.11823, "coord_origin": "TOPLEFT"}, "confidence": 0.9393904209136963, "cells": [{"id": 51, "text": "3", "bbox": {"l": 134.76498, "t": 605.54984, "r": 141.48859, "b": 616.11823, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Problem Statement", "bbox": {"l": 154.93819, "t": 605.54984, "r": 269.62442, "b": 616.11823, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3 Problem Statement"}, {"label": "text", "id": 1, "page_no": 3, "cluster": {"id": 1, "label": "text", "bbox": {"l": 134.76498, "t": 632.14769, "r": 480.5936899999999, "b": 664.85566, "coord_origin": "TOPLEFT"}, "confidence": 0.9692807197570801, "cells": [{"id": 53, "text": "All known Im2Seq based models for TSR fundamentally work in similar ways.", "bbox": {"l": 134.76498, "t": 632.14769, "r": 480.59064, "b": 640.94466, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "Given an image of a table, the Im2Seq model predicts the structure of the table", "bbox": {"l": 134.76498, "t": 644.1026899999999, "r": 480.5867, "b": 652.89966, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "by generating a sequence of tokens. These tokens originate from a finite vocab-", "bbox": {"l": 134.76498, "t": 656.0586900000001, "r": 480.5936899999999, "b": 664.85566, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "All known Im2Seq based models for TSR fundamentally work in similar ways. Given an image of a table, the Im2Seq model predicts the structure of the table by generating a sequence of tokens. These tokens originate from a finite vocab-"}], "headers": [{"label": "page_header", "id": 6, "page_no": 3, "cluster": {"id": 6, "label": "page_header", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.78900545835495, "cells": [{"id": 0, "text": "4", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4"}, {"label": "page_header", "id": 5, "page_no": 3, "cluster": {"id": 5, "label": "page_header", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9045588374137878, "cells": [{"id": 1, "text": "M.", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 178.07675, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37415, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "M. Lysak, et al."}]}}, {"page_no": 4, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "5", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "ulary and can be interpreted as a table structure. For example, with the HTML", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.58577999999994, "b": 127.73077, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "tokens", "bbox": {"l": 134.765, "t": 130.88878999999997, "r": 162.48494, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "<table>", "bbox": {"l": 166.368, "t": 130.88878999999997, "r": 201.74918, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": ",", "bbox": {"l": 201.74899, "t": 130.88878999999997, "r": 204.51561, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "</table>", "bbox": {"l": 208.39699, "t": 130.88878999999997, "r": 248.86904999999996, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": ",", "bbox": {"l": 248.86899, "t": 130.88878999999997, "r": 251.6356, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "<tr>", "bbox": {"l": 255.51698, "t": 130.88878999999997, "r": 278.29846, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": ",", "bbox": {"l": 278.29797, "t": 130.88878999999997, "r": 281.06458, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "</tr>", "bbox": {"l": 284.94598, "t": 130.88878999999997, "r": 312.81836, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": ",", "bbox": {"l": 312.81799, "t": 130.88878999999997, "r": 315.58459, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "<td>", "bbox": {"l": 319.466, "t": 130.88878999999997, "r": 343.13812, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "and", "bbox": {"l": 347.13202, "t": 130.88878999999997, "r": 363.17877, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "</td>", "bbox": {"l": 367.06003, "t": 130.88878999999997, "r": 395.82306, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": ", one can construct", "bbox": {"l": 395.82303, "t": 130.88878999999997, "r": 480.59177000000005, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "simple table structures without any spanning cells. In reality though, one needs", "bbox": {"l": 134.76501, "t": 142.84479, "r": 480.59365999999994, "b": 151.64178000000004, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "at least 28 HTML tokens to describe the most common complex tables observed", "bbox": {"l": 134.76501, "t": 154.7998, "r": 480.58577999999994, "b": 163.59680000000003, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "in real-world documents [21,22], due to a variety of spanning cells definitions in", "bbox": {"l": 134.76501, "t": 166.75482, "r": 480.59378, "b": 175.55182000000002, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "the HTML token vocabulary.", "bbox": {"l": 134.76501, "t": 178.70983999999999, "r": 261.92566, "b": 187.50684, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Fig. 2.", "bbox": {"l": 145.60701, "t": 221.07928000000004, "r": 173.48625, "b": 229.00562000000002, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Frequency of tokens in HTML and OTSL as they appear in PubTabNet.", "bbox": {"l": 176.56001, "t": 221.14209000000005, "r": 469.75223000000005, "b": 229.21178999999995, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "Obviously, HTML and other general-purpose markup languages were not de-", "bbox": {"l": 149.709, "t": 368.20679, "r": 480.59283000000005, "b": 377.00375, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "signed for Im2Seq models. As such, they have some serious drawbacks. First, the", "bbox": {"l": 134.765, "t": 380.16177, "r": 480.58664, "b": 388.9587399999999, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "token vocabulary needs to be artificially large in order to describe all plausible", "bbox": {"l": 134.765, "t": 392.11676, "r": 480.59180000000003, "b": 400.91373, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "tabular structures. Since most Im2Seq models use an autoregressive approach,", "bbox": {"l": 134.765, "t": 404.07175, "r": 480.5897499999999, "b": 412.86871, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "they generate the sequence token by token. Therefore, to reduce inference time,", "bbox": {"l": 134.765, "t": 416.02774, "r": 480.58871, "b": 424.82471, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "a shorter sequence length is critical. Every table-cell is represented by at least", "bbox": {"l": 134.765, "t": 427.98273, "r": 480.59265, "b": 436.77969, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "two tokens (", "bbox": {"l": 134.765, "t": 439.9377099999999, "r": 187.93439, "b": 448.73467999999997, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "<td>", "bbox": {"l": 187.931, "t": 439.9377099999999, "r": 211.60313, "b": 448.73467999999997, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "and", "bbox": {"l": 214.75400000000002, "t": 439.9377099999999, "r": 230.80075000000002, "b": 448.73467999999997, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "</td>", "bbox": {"l": 233.83898999999997, "t": 439.9377099999999, "r": 262.60202, "b": 448.73467999999997, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "). Furthermore, when tokenizing the HTML struc-", "bbox": {"l": 262.716, "t": 439.9377099999999, "r": 480.59009, "b": 448.73467999999997, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "ture, one needs to explicitly enumerate possible column-spans and row-spans", "bbox": {"l": 134.76501, "t": 451.8927, "r": 480.58777, "b": 460.68967, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "as words. In practice, this ends up requiring 28 different HTML tokens (when", "bbox": {"l": 134.76501, "t": 463.84769, "r": 480.58681999999993, "b": 472.64465, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "including column- and row-spans up to 10 cells) just to describe every table in", "bbox": {"l": 134.76501, "t": 475.80368, "r": 480.58681999999993, "b": 484.60065, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "the PubTabNet dataset. Clearly, not every token is equally represented, as is", "bbox": {"l": 134.76501, "t": 487.75867, "r": 480.59067, "b": 496.55563, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "depicted in Figure 2. This skewed distribution of tokens in combination with", "bbox": {"l": 134.76501, "t": 499.71365, "r": 480.59277, "b": 508.51062, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "variable token row-length makes it challenging for models to learn the HTML", "bbox": {"l": 134.76501, "t": 511.66864, "r": 480.59476, "b": 520.46561, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "structure.", "bbox": {"l": 134.76501, "t": 523.62363, "r": 176.92873, "b": 532.42059, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "Additionally, it would be desirable if the representation would easily allow", "bbox": {"l": 149.70901, "t": 536.04263, "r": 480.59289999999993, "b": 544.8396, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "an early detection of invalid sequences on-the-go, before the prediction of the", "bbox": {"l": 134.76501, "t": 547.99763, "r": 480.59085, "b": 556.7946000000001, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "entire table structure is completed. HTML is not well-suited for this purpose as", "bbox": {"l": 134.76501, "t": 559.95264, "r": 480.58984, "b": 568.7496, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "the verification of incomplete sequences is non-trivial or even impossible.", "bbox": {"l": 134.76501, "t": 571.90863, "r": 452.18933, "b": 580.7056, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "In a valid HTML table, the token sequence must describe a 2D grid of table", "bbox": {"l": 149.70901, "t": 584.32663, "r": 480.59283000000005, "b": 593.1236, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "cells, serialised in row-major ordering, where each row and each column have", "bbox": {"l": 134.76501, "t": 596.28262, "r": 480.58978, "b": 605.07959, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "the same length (while considering row- and column-spans). Furthermore, every", "bbox": {"l": 134.76501, "t": 608.23763, "r": 480.5936899999999, "b": 617.03459, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "opening tag in HTML needs to be matched by a closing tag in a correct hierar-", "bbox": {"l": 134.76501, "t": 620.19263, "r": 480.59091, "b": 628.98959, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "chical manner. Since the number of tokens for each table row and column can", "bbox": {"l": 134.76501, "t": 632.1476299999999, "r": 480.58582, "b": 640.9446, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "vary significantly, especially for large tables with many row- and column-spans,", "bbox": {"l": 134.76501, "t": 644.10263, "r": 480.59180000000003, "b": 652.8996, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "it is complex to verify the consistency of predicted structures during sequence", "bbox": {"l": 134.76501, "t": 656.05763, "r": 480.59473, "b": 664.85461, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 5, "label": "page_header", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.926919162273407, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "page_header", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8696111440658569, "cells": [{"id": 1, "text": "5", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.59378, "b": 187.50684, "coord_origin": "TOPLEFT"}, "confidence": 0.9857171773910522, "cells": [{"id": 2, "text": "ulary and can be interpreted as a table structure. For example, with the HTML", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.58577999999994, "b": 127.73077, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "tokens", "bbox": {"l": 134.765, "t": 130.88878999999997, "r": 162.48494, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "<table>", "bbox": {"l": 166.368, "t": 130.88878999999997, "r": 201.74918, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": ",", "bbox": {"l": 201.74899, "t": 130.88878999999997, "r": 204.51561, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "</table>", "bbox": {"l": 208.39699, "t": 130.88878999999997, "r": 248.86904999999996, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": ",", "bbox": {"l": 248.86899, "t": 130.88878999999997, "r": 251.6356, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "<tr>", "bbox": {"l": 255.51698, "t": 130.88878999999997, "r": 278.29846, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": ",", "bbox": {"l": 278.29797, "t": 130.88878999999997, "r": 281.06458, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "</tr>", "bbox": {"l": 284.94598, "t": 130.88878999999997, "r": 312.81836, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": ",", "bbox": {"l": 312.81799, "t": 130.88878999999997, "r": 315.58459, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "<td>", "bbox": {"l": 319.466, "t": 130.88878999999997, "r": 343.13812, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "and", "bbox": {"l": 347.13202, "t": 130.88878999999997, "r": 363.17877, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "</td>", "bbox": {"l": 367.06003, "t": 130.88878999999997, "r": 395.82306, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": ", one can construct", "bbox": {"l": 395.82303, "t": 130.88878999999997, "r": 480.59177000000005, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "simple table structures without any spanning cells. In reality though, one needs", "bbox": {"l": 134.76501, "t": 142.84479, "r": 480.59365999999994, "b": 151.64178000000004, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "at least 28 HTML tokens to describe the most common complex tables observed", "bbox": {"l": 134.76501, "t": 154.7998, "r": 480.58577999999994, "b": 163.59680000000003, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "in real-world documents [21,22], due to a variety of spanning cells definitions in", "bbox": {"l": 134.76501, "t": 166.75482, "r": 480.59378, "b": 175.55182000000002, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "the HTML token vocabulary.", "bbox": {"l": 134.76501, "t": 178.70983999999999, "r": 261.92566, "b": 187.50684, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "caption", "bbox": {"l": 145.60701, "t": 221.07928000000004, "r": 469.75223000000005, "b": 229.21178999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.8472552299499512, "cells": [{"id": 20, "text": "Fig. 2.", "bbox": {"l": 145.60701, "t": 221.07928000000004, "r": 173.48625, "b": 229.00562000000002, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Frequency of tokens in HTML and OTSL as they appear in PubTabNet.", "bbox": {"l": 176.56001, "t": 221.14209000000005, "r": 469.75223000000005, "b": 229.21178999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 134.765, "t": 368.20679, "r": 480.59476, "b": 532.42059, "coord_origin": "TOPLEFT"}, "confidence": 0.9844798445701599, "cells": [{"id": 22, "text": "Obviously, HTML and other general-purpose markup languages were not de-", "bbox": {"l": 149.709, "t": 368.20679, "r": 480.59283000000005, "b": 377.00375, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "signed for Im2Seq models. As such, they have some serious drawbacks. First, the", "bbox": {"l": 134.765, "t": 380.16177, "r": 480.58664, "b": 388.9587399999999, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "token vocabulary needs to be artificially large in order to describe all plausible", "bbox": {"l": 134.765, "t": 392.11676, "r": 480.59180000000003, "b": 400.91373, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "tabular structures. Since most Im2Seq models use an autoregressive approach,", "bbox": {"l": 134.765, "t": 404.07175, "r": 480.5897499999999, "b": 412.86871, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "they generate the sequence token by token. Therefore, to reduce inference time,", "bbox": {"l": 134.765, "t": 416.02774, "r": 480.58871, "b": 424.82471, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "a shorter sequence length is critical. Every table-cell is represented by at least", "bbox": {"l": 134.765, "t": 427.98273, "r": 480.59265, "b": 436.77969, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "two tokens (", "bbox": {"l": 134.765, "t": 439.9377099999999, "r": 187.93439, "b": 448.73467999999997, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "<td>", "bbox": {"l": 187.931, "t": 439.9377099999999, "r": 211.60313, "b": 448.73467999999997, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "and", "bbox": {"l": 214.75400000000002, "t": 439.9377099999999, "r": 230.80075000000002, "b": 448.73467999999997, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "</td>", "bbox": {"l": 233.83898999999997, "t": 439.9377099999999, "r": 262.60202, "b": 448.73467999999997, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "). Furthermore, when tokenizing the HTML struc-", "bbox": {"l": 262.716, "t": 439.9377099999999, "r": 480.59009, "b": 448.73467999999997, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "ture, one needs to explicitly enumerate possible column-spans and row-spans", "bbox": {"l": 134.76501, "t": 451.8927, "r": 480.58777, "b": 460.68967, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "as words. In practice, this ends up requiring 28 different HTML tokens (when", "bbox": {"l": 134.76501, "t": 463.84769, "r": 480.58681999999993, "b": 472.64465, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "including column- and row-spans up to 10 cells) just to describe every table in", "bbox": {"l": 134.76501, "t": 475.80368, "r": 480.58681999999993, "b": 484.60065, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "the PubTabNet dataset. Clearly, not every token is equally represented, as is", "bbox": {"l": 134.76501, "t": 487.75867, "r": 480.59067, "b": 496.55563, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "depicted in Figure 2. This skewed distribution of tokens in combination with", "bbox": {"l": 134.76501, "t": 499.71365, "r": 480.59277, "b": 508.51062, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "variable token row-length makes it challenging for models to learn the HTML", "bbox": {"l": 134.76501, "t": 511.66864, "r": 480.59476, "b": 520.46561, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "structure.", "bbox": {"l": 134.76501, "t": 523.62363, "r": 176.92873, "b": 532.42059, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 134.76501, "t": 536.04263, "r": 480.59289999999993, "b": 580.7056, "coord_origin": "TOPLEFT"}, "confidence": 0.978394627571106, "cells": [{"id": 40, "text": "Additionally, it would be desirable if the representation would easily allow", "bbox": {"l": 149.70901, "t": 536.04263, "r": 480.59289999999993, "b": 544.8396, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "an early detection of invalid sequences on-the-go, before the prediction of the", "bbox": {"l": 134.76501, "t": 547.99763, "r": 480.59085, "b": 556.7946000000001, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "entire table structure is completed. HTML is not well-suited for this purpose as", "bbox": {"l": 134.76501, "t": 559.95264, "r": 480.58984, "b": 568.7496, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "the verification of incomplete sequences is non-trivial or even impossible.", "bbox": {"l": 134.76501, "t": 571.90863, "r": 452.18933, "b": 580.7056, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 134.76501, "t": 584.32663, "r": 480.59473, "b": 664.85461, "coord_origin": "TOPLEFT"}, "confidence": 0.9838283061981201, "cells": [{"id": 44, "text": "In a valid HTML table, the token sequence must describe a 2D grid of table", "bbox": {"l": 149.70901, "t": 584.32663, "r": 480.59283000000005, "b": 593.1236, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "cells, serialised in row-major ordering, where each row and each column have", "bbox": {"l": 134.76501, "t": 596.28262, "r": 480.58978, "b": 605.07959, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "the same length (while considering row- and column-spans). Furthermore, every", "bbox": {"l": 134.76501, "t": 608.23763, "r": 480.5936899999999, "b": 617.03459, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "opening tag in HTML needs to be matched by a closing tag in a correct hierar-", "bbox": {"l": 134.76501, "t": 620.19263, "r": 480.59091, "b": 628.98959, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "chical manner. Since the number of tokens for each table row and column can", "bbox": {"l": 134.76501, "t": 632.1476299999999, "r": 480.58582, "b": 640.9446, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "vary significantly, especially for large tables with many row- and column-spans,", "bbox": {"l": 134.76501, "t": 644.10263, "r": 480.59180000000003, "b": 652.8996, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "it is complex to verify the consistency of predicted structures during sequence", "bbox": {"l": 134.76501, "t": 656.05763, "r": 480.59473, "b": 664.85461, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "picture", "bbox": {"l": 137.41452026367188, "t": 233.51231384277344, "r": 476.5608215332031, "b": 340.2304992675781, "coord_origin": "TOPLEFT"}, "confidence": 0.9387974739074707, "cells": [], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_header", "id": 5, "page_no": 4, "cluster": {"id": 5, "label": "page_header", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.926919162273407, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Optimized Table Tokenization for Table Structure Recognition"}, {"label": "page_header", "id": 6, "page_no": 4, "cluster": {"id": 6, "label": "page_header", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8696111440658569, "cells": [{"id": 1, "text": "5", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5"}, {"label": "text", "id": 0, "page_no": 4, "cluster": {"id": 0, "label": "text", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.59378, "b": 187.50684, "coord_origin": "TOPLEFT"}, "confidence": 0.9857171773910522, "cells": [{"id": 2, "text": "ulary and can be interpreted as a table structure. For example, with the HTML", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.58577999999994, "b": 127.73077, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "tokens", "bbox": {"l": 134.765, "t": 130.88878999999997, "r": 162.48494, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "<table>", "bbox": {"l": 166.368, "t": 130.88878999999997, "r": 201.74918, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": ",", "bbox": {"l": 201.74899, "t": 130.88878999999997, "r": 204.51561, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "</table>", "bbox": {"l": 208.39699, "t": 130.88878999999997, "r": 248.86904999999996, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": ",", "bbox": {"l": 248.86899, "t": 130.88878999999997, "r": 251.6356, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "<tr>", "bbox": {"l": 255.51698, "t": 130.88878999999997, "r": 278.29846, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": ",", "bbox": {"l": 278.29797, "t": 130.88878999999997, "r": 281.06458, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "</tr>", "bbox": {"l": 284.94598, "t": 130.88878999999997, "r": 312.81836, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": ",", "bbox": {"l": 312.81799, "t": 130.88878999999997, "r": 315.58459, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "<td>", "bbox": {"l": 319.466, "t": 130.88878999999997, "r": 343.13812, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "and", "bbox": {"l": 347.13202, "t": 130.88878999999997, "r": 363.17877, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "</td>", "bbox": {"l": 367.06003, "t": 130.88878999999997, "r": 395.82306, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": ", one can construct", "bbox": {"l": 395.82303, "t": 130.88878999999997, "r": 480.59177000000005, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "simple table structures without any spanning cells. In reality though, one needs", "bbox": {"l": 134.76501, "t": 142.84479, "r": 480.59365999999994, "b": 151.64178000000004, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "at least 28 HTML tokens to describe the most common complex tables observed", "bbox": {"l": 134.76501, "t": 154.7998, "r": 480.58577999999994, "b": 163.59680000000003, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "in real-world documents [21,22], due to a variety of spanning cells definitions in", "bbox": {"l": 134.76501, "t": 166.75482, "r": 480.59378, "b": 175.55182000000002, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "the HTML token vocabulary.", "bbox": {"l": 134.76501, "t": 178.70983999999999, "r": 261.92566, "b": 187.50684, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "ulary and can be interpreted as a table structure. For example, with the HTML tokens <table> , </table> , <tr> , </tr> , <td> and </td> , one can construct simple table structures without any spanning cells. In reality though, one needs at least 28 HTML tokens to describe the most common complex tables observed in real-world documents [21,22], due to a variety of spanning cells definitions in the HTML token vocabulary."}, {"label": "caption", "id": 7, "page_no": 4, "cluster": {"id": 7, "label": "caption", "bbox": {"l": 145.60701, "t": 221.07928000000004, "r": 469.75223000000005, "b": 229.21178999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.8472552299499512, "cells": [{"id": 20, "text": "Fig. 2.", "bbox": {"l": 145.60701, "t": 221.07928000000004, "r": 173.48625, "b": 229.00562000000002, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Frequency of tokens in HTML and OTSL as they appear in PubTabNet.", "bbox": {"l": 176.56001, "t": 221.14209000000005, "r": 469.75223000000005, "b": 229.21178999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Fig. 2. Frequency of tokens in HTML and OTSL as they appear in PubTabNet."}, {"label": "text", "id": 1, "page_no": 4, "cluster": {"id": 1, "label": "text", "bbox": {"l": 134.765, "t": 368.20679, "r": 480.59476, "b": 532.42059, "coord_origin": "TOPLEFT"}, "confidence": 0.9844798445701599, "cells": [{"id": 22, "text": "Obviously, HTML and other general-purpose markup languages were not de-", "bbox": {"l": 149.709, "t": 368.20679, "r": 480.59283000000005, "b": 377.00375, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "signed for Im2Seq models. As such, they have some serious drawbacks. First, the", "bbox": {"l": 134.765, "t": 380.16177, "r": 480.58664, "b": 388.9587399999999, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "token vocabulary needs to be artificially large in order to describe all plausible", "bbox": {"l": 134.765, "t": 392.11676, "r": 480.59180000000003, "b": 400.91373, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "tabular structures. Since most Im2Seq models use an autoregressive approach,", "bbox": {"l": 134.765, "t": 404.07175, "r": 480.5897499999999, "b": 412.86871, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "they generate the sequence token by token. Therefore, to reduce inference time,", "bbox": {"l": 134.765, "t": 416.02774, "r": 480.58871, "b": 424.82471, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "a shorter sequence length is critical. Every table-cell is represented by at least", "bbox": {"l": 134.765, "t": 427.98273, "r": 480.59265, "b": 436.77969, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "two tokens (", "bbox": {"l": 134.765, "t": 439.9377099999999, "r": 187.93439, "b": 448.73467999999997, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "<td>", "bbox": {"l": 187.931, "t": 439.9377099999999, "r": 211.60313, "b": 448.73467999999997, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "and", "bbox": {"l": 214.75400000000002, "t": 439.9377099999999, "r": 230.80075000000002, "b": 448.73467999999997, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "</td>", "bbox": {"l": 233.83898999999997, "t": 439.9377099999999, "r": 262.60202, "b": 448.73467999999997, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "). Furthermore, when tokenizing the HTML struc-", "bbox": {"l": 262.716, "t": 439.9377099999999, "r": 480.59009, "b": 448.73467999999997, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "ture, one needs to explicitly enumerate possible column-spans and row-spans", "bbox": {"l": 134.76501, "t": 451.8927, "r": 480.58777, "b": 460.68967, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "as words. In practice, this ends up requiring 28 different HTML tokens (when", "bbox": {"l": 134.76501, "t": 463.84769, "r": 480.58681999999993, "b": 472.64465, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "including column- and row-spans up to 10 cells) just to describe every table in", "bbox": {"l": 134.76501, "t": 475.80368, "r": 480.58681999999993, "b": 484.60065, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "the PubTabNet dataset. Clearly, not every token is equally represented, as is", "bbox": {"l": 134.76501, "t": 487.75867, "r": 480.59067, "b": 496.55563, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "depicted in Figure 2. This skewed distribution of tokens in combination with", "bbox": {"l": 134.76501, "t": 499.71365, "r": 480.59277, "b": 508.51062, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "variable token row-length makes it challenging for models to learn the HTML", "bbox": {"l": 134.76501, "t": 511.66864, "r": 480.59476, "b": 520.46561, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "structure.", "bbox": {"l": 134.76501, "t": 523.62363, "r": 176.92873, "b": 532.42059, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Obviously, HTML and other general-purpose markup languages were not designed for Im2Seq models. As such, they have some serious drawbacks. First, the token vocabulary needs to be artificially large in order to describe all plausible tabular structures. Since most Im2Seq models use an autoregressive approach, they generate the sequence token by token. Therefore, to reduce inference time, a shorter sequence length is critical. Every table-cell is represented by at least two tokens ( <td> and </td> ). Furthermore, when tokenizing the HTML structure, one needs to explicitly enumerate possible column-spans and row-spans as words. In practice, this ends up requiring 28 different HTML tokens (when including column- and row-spans up to 10 cells) just to describe every table in the PubTabNet dataset. Clearly, not every token is equally represented, as is depicted in Figure 2. This skewed distribution of tokens in combination with variable token row-length makes it challenging for models to learn the HTML structure."}, {"label": "text", "id": 3, "page_no": 4, "cluster": {"id": 3, "label": "text", "bbox": {"l": 134.76501, "t": 536.04263, "r": 480.59289999999993, "b": 580.7056, "coord_origin": "TOPLEFT"}, "confidence": 0.978394627571106, "cells": [{"id": 40, "text": "Additionally, it would be desirable if the representation would easily allow", "bbox": {"l": 149.70901, "t": 536.04263, "r": 480.59289999999993, "b": 544.8396, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "an early detection of invalid sequences on-the-go, before the prediction of the", "bbox": {"l": 134.76501, "t": 547.99763, "r": 480.59085, "b": 556.7946000000001, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "entire table structure is completed. HTML is not well-suited for this purpose as", "bbox": {"l": 134.76501, "t": 559.95264, "r": 480.58984, "b": 568.7496, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "the verification of incomplete sequences is non-trivial or even impossible.", "bbox": {"l": 134.76501, "t": 571.90863, "r": 452.18933, "b": 580.7056, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Additionally, it would be desirable if the representation would easily allow an early detection of invalid sequences on-the-go, before the prediction of the entire table structure is completed. HTML is not well-suited for this purpose as the verification of incomplete sequences is non-trivial or even impossible."}, {"label": "text", "id": 2, "page_no": 4, "cluster": {"id": 2, "label": "text", "bbox": {"l": 134.76501, "t": 584.32663, "r": 480.59473, "b": 664.85461, "coord_origin": "TOPLEFT"}, "confidence": 0.9838283061981201, "cells": [{"id": 44, "text": "In a valid HTML table, the token sequence must describe a 2D grid of table", "bbox": {"l": 149.70901, "t": 584.32663, "r": 480.59283000000005, "b": 593.1236, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "cells, serialised in row-major ordering, where each row and each column have", "bbox": {"l": 134.76501, "t": 596.28262, "r": 480.58978, "b": 605.07959, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "the same length (while considering row- and column-spans). Furthermore, every", "bbox": {"l": 134.76501, "t": 608.23763, "r": 480.5936899999999, "b": 617.03459, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "opening tag in HTML needs to be matched by a closing tag in a correct hierar-", "bbox": {"l": 134.76501, "t": 620.19263, "r": 480.59091, "b": 628.98959, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "chical manner. Since the number of tokens for each table row and column can", "bbox": {"l": 134.76501, "t": 632.1476299999999, "r": 480.58582, "b": 640.9446, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "vary significantly, especially for large tables with many row- and column-spans,", "bbox": {"l": 134.76501, "t": 644.10263, "r": 480.59180000000003, "b": 652.8996, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "it is complex to verify the consistency of predicted structures during sequence", "bbox": {"l": 134.76501, "t": 656.05763, "r": 480.59473, "b": 664.85461, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In a valid HTML table, the token sequence must describe a 2D grid of table cells, serialised in row-major ordering, where each row and each column have the same length (while considering row- and column-spans). Furthermore, every opening tag in HTML needs to be matched by a closing tag in a correct hierarchical manner. Since the number of tokens for each table row and column can vary significantly, especially for large tables with many row- and column-spans, it is complex to verify the consistency of predicted structures during sequence"}, {"label": "picture", "id": 4, "page_no": 4, "cluster": {"id": 4, "label": "picture", "bbox": {"l": 137.41452026367188, "t": 233.51231384277344, "r": 476.5608215332031, "b": 340.2304992675781, "coord_origin": "TOPLEFT"}, "confidence": 0.9387974739074707, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "body": [{"label": "text", "id": 0, "page_no": 4, "cluster": {"id": 0, "label": "text", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.59378, "b": 187.50684, "coord_origin": "TOPLEFT"}, "confidence": 0.9857171773910522, "cells": [{"id": 2, "text": "ulary and can be interpreted as a table structure. For example, with the HTML", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.58577999999994, "b": 127.73077, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "tokens", "bbox": {"l": 134.765, "t": 130.88878999999997, "r": 162.48494, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "<table>", "bbox": {"l": 166.368, "t": 130.88878999999997, "r": 201.74918, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": ",", "bbox": {"l": 201.74899, "t": 130.88878999999997, "r": 204.51561, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "</table>", "bbox": {"l": 208.39699, "t": 130.88878999999997, "r": 248.86904999999996, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": ",", "bbox": {"l": 248.86899, "t": 130.88878999999997, "r": 251.6356, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "<tr>", "bbox": {"l": 255.51698, "t": 130.88878999999997, "r": 278.29846, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": ",", "bbox": {"l": 278.29797, "t": 130.88878999999997, "r": 281.06458, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "</tr>", "bbox": {"l": 284.94598, "t": 130.88878999999997, "r": 312.81836, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": ",", "bbox": {"l": 312.81799, "t": 130.88878999999997, "r": 315.58459, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "<td>", "bbox": {"l": 319.466, "t": 130.88878999999997, "r": 343.13812, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "and", "bbox": {"l": 347.13202, "t": 130.88878999999997, "r": 363.17877, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "</td>", "bbox": {"l": 367.06003, "t": 130.88878999999997, "r": 395.82306, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": ", one can construct", "bbox": {"l": 395.82303, "t": 130.88878999999997, "r": 480.59177000000005, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "simple table structures without any spanning cells. In reality though, one needs", "bbox": {"l": 134.76501, "t": 142.84479, "r": 480.59365999999994, "b": 151.64178000000004, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "at least 28 HTML tokens to describe the most common complex tables observed", "bbox": {"l": 134.76501, "t": 154.7998, "r": 480.58577999999994, "b": 163.59680000000003, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "in real-world documents [21,22], due to a variety of spanning cells definitions in", "bbox": {"l": 134.76501, "t": 166.75482, "r": 480.59378, "b": 175.55182000000002, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "the HTML token vocabulary.", "bbox": {"l": 134.76501, "t": 178.70983999999999, "r": 261.92566, "b": 187.50684, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "ulary and can be interpreted as a table structure. For example, with the HTML tokens <table> , </table> , <tr> , </tr> , <td> and </td> , one can construct simple table structures without any spanning cells. In reality though, one needs at least 28 HTML tokens to describe the most common complex tables observed in real-world documents [21,22], due to a variety of spanning cells definitions in the HTML token vocabulary."}, {"label": "caption", "id": 7, "page_no": 4, "cluster": {"id": 7, "label": "caption", "bbox": {"l": 145.60701, "t": 221.07928000000004, "r": 469.75223000000005, "b": 229.21178999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.8472552299499512, "cells": [{"id": 20, "text": "Fig. 2.", "bbox": {"l": 145.60701, "t": 221.07928000000004, "r": 173.48625, "b": 229.00562000000002, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Frequency of tokens in HTML and OTSL as they appear in PubTabNet.", "bbox": {"l": 176.56001, "t": 221.14209000000005, "r": 469.75223000000005, "b": 229.21178999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Fig. 2. Frequency of tokens in HTML and OTSL as they appear in PubTabNet."}, {"label": "text", "id": 1, "page_no": 4, "cluster": {"id": 1, "label": "text", "bbox": {"l": 134.765, "t": 368.20679, "r": 480.59476, "b": 532.42059, "coord_origin": "TOPLEFT"}, "confidence": 0.9844798445701599, "cells": [{"id": 22, "text": "Obviously, HTML and other general-purpose markup languages were not de-", "bbox": {"l": 149.709, "t": 368.20679, "r": 480.59283000000005, "b": 377.00375, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "signed for Im2Seq models. As such, they have some serious drawbacks. First, the", "bbox": {"l": 134.765, "t": 380.16177, "r": 480.58664, "b": 388.9587399999999, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "token vocabulary needs to be artificially large in order to describe all plausible", "bbox": {"l": 134.765, "t": 392.11676, "r": 480.59180000000003, "b": 400.91373, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "tabular structures. Since most Im2Seq models use an autoregressive approach,", "bbox": {"l": 134.765, "t": 404.07175, "r": 480.5897499999999, "b": 412.86871, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "they generate the sequence token by token. Therefore, to reduce inference time,", "bbox": {"l": 134.765, "t": 416.02774, "r": 480.58871, "b": 424.82471, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "a shorter sequence length is critical. Every table-cell is represented by at least", "bbox": {"l": 134.765, "t": 427.98273, "r": 480.59265, "b": 436.77969, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "two tokens (", "bbox": {"l": 134.765, "t": 439.9377099999999, "r": 187.93439, "b": 448.73467999999997, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "<td>", "bbox": {"l": 187.931, "t": 439.9377099999999, "r": 211.60313, "b": 448.73467999999997, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "and", "bbox": {"l": 214.75400000000002, "t": 439.9377099999999, "r": 230.80075000000002, "b": 448.73467999999997, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "</td>", "bbox": {"l": 233.83898999999997, "t": 439.9377099999999, "r": 262.60202, "b": 448.73467999999997, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "). Furthermore, when tokenizing the HTML struc-", "bbox": {"l": 262.716, "t": 439.9377099999999, "r": 480.59009, "b": 448.73467999999997, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "ture, one needs to explicitly enumerate possible column-spans and row-spans", "bbox": {"l": 134.76501, "t": 451.8927, "r": 480.58777, "b": 460.68967, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "as words. In practice, this ends up requiring 28 different HTML tokens (when", "bbox": {"l": 134.76501, "t": 463.84769, "r": 480.58681999999993, "b": 472.64465, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "including column- and row-spans up to 10 cells) just to describe every table in", "bbox": {"l": 134.76501, "t": 475.80368, "r": 480.58681999999993, "b": 484.60065, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "the PubTabNet dataset. Clearly, not every token is equally represented, as is", "bbox": {"l": 134.76501, "t": 487.75867, "r": 480.59067, "b": 496.55563, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "depicted in Figure 2. This skewed distribution of tokens in combination with", "bbox": {"l": 134.76501, "t": 499.71365, "r": 480.59277, "b": 508.51062, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "variable token row-length makes it challenging for models to learn the HTML", "bbox": {"l": 134.76501, "t": 511.66864, "r": 480.59476, "b": 520.46561, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "structure.", "bbox": {"l": 134.76501, "t": 523.62363, "r": 176.92873, "b": 532.42059, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Obviously, HTML and other general-purpose markup languages were not designed for Im2Seq models. As such, they have some serious drawbacks. First, the token vocabulary needs to be artificially large in order to describe all plausible tabular structures. Since most Im2Seq models use an autoregressive approach, they generate the sequence token by token. Therefore, to reduce inference time, a shorter sequence length is critical. Every table-cell is represented by at least two tokens ( <td> and </td> ). Furthermore, when tokenizing the HTML structure, one needs to explicitly enumerate possible column-spans and row-spans as words. In practice, this ends up requiring 28 different HTML tokens (when including column- and row-spans up to 10 cells) just to describe every table in the PubTabNet dataset. Clearly, not every token is equally represented, as is depicted in Figure 2. This skewed distribution of tokens in combination with variable token row-length makes it challenging for models to learn the HTML structure."}, {"label": "text", "id": 3, "page_no": 4, "cluster": {"id": 3, "label": "text", "bbox": {"l": 134.76501, "t": 536.04263, "r": 480.59289999999993, "b": 580.7056, "coord_origin": "TOPLEFT"}, "confidence": 0.978394627571106, "cells": [{"id": 40, "text": "Additionally, it would be desirable if the representation would easily allow", "bbox": {"l": 149.70901, "t": 536.04263, "r": 480.59289999999993, "b": 544.8396, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "an early detection of invalid sequences on-the-go, before the prediction of the", "bbox": {"l": 134.76501, "t": 547.99763, "r": 480.59085, "b": 556.7946000000001, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "entire table structure is completed. HTML is not well-suited for this purpose as", "bbox": {"l": 134.76501, "t": 559.95264, "r": 480.58984, "b": 568.7496, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "the verification of incomplete sequences is non-trivial or even impossible.", "bbox": {"l": 134.76501, "t": 571.90863, "r": 452.18933, "b": 580.7056, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Additionally, it would be desirable if the representation would easily allow an early detection of invalid sequences on-the-go, before the prediction of the entire table structure is completed. HTML is not well-suited for this purpose as the verification of incomplete sequences is non-trivial or even impossible."}, {"label": "text", "id": 2, "page_no": 4, "cluster": {"id": 2, "label": "text", "bbox": {"l": 134.76501, "t": 584.32663, "r": 480.59473, "b": 664.85461, "coord_origin": "TOPLEFT"}, "confidence": 0.9838283061981201, "cells": [{"id": 44, "text": "In a valid HTML table, the token sequence must describe a 2D grid of table", "bbox": {"l": 149.70901, "t": 584.32663, "r": 480.59283000000005, "b": 593.1236, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "cells, serialised in row-major ordering, where each row and each column have", "bbox": {"l": 134.76501, "t": 596.28262, "r": 480.58978, "b": 605.07959, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "the same length (while considering row- and column-spans). Furthermore, every", "bbox": {"l": 134.76501, "t": 608.23763, "r": 480.5936899999999, "b": 617.03459, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "opening tag in HTML needs to be matched by a closing tag in a correct hierar-", "bbox": {"l": 134.76501, "t": 620.19263, "r": 480.59091, "b": 628.98959, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "chical manner. Since the number of tokens for each table row and column can", "bbox": {"l": 134.76501, "t": 632.1476299999999, "r": 480.58582, "b": 640.9446, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "vary significantly, especially for large tables with many row- and column-spans,", "bbox": {"l": 134.76501, "t": 644.10263, "r": 480.59180000000003, "b": 652.8996, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "it is complex to verify the consistency of predicted structures during sequence", "bbox": {"l": 134.76501, "t": 656.05763, "r": 480.59473, "b": 664.85461, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In a valid HTML table, the token sequence must describe a 2D grid of table cells, serialised in row-major ordering, where each row and each column have the same length (while considering row- and column-spans). Furthermore, every opening tag in HTML needs to be matched by a closing tag in a correct hierarchical manner. Since the number of tokens for each table row and column can vary significantly, especially for large tables with many row- and column-spans, it is complex to verify the consistency of predicted structures during sequence"}, {"label": "picture", "id": 4, "page_no": 4, "cluster": {"id": 4, "label": "picture", "bbox": {"l": 137.41452026367188, "t": 233.51231384277344, "r": 476.5608215332031, "b": 340.2304992675781, "coord_origin": "TOPLEFT"}, "confidence": 0.9387974739074707, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "headers": [{"label": "page_header", "id": 5, "page_no": 4, "cluster": {"id": 5, "label": "page_header", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.926919162273407, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Optimized Table Tokenization for Table Structure Recognition"}, {"label": "page_header", "id": 6, "page_no": 4, "cluster": {"id": 6, "label": "page_header", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8696111440658569, "cells": [{"id": 1, "text": "5", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5"}]}}, {"page_no": 5, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "6", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "M.", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 178.07675, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37415, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "generation. Implicitly, this also means that Im2Seq models need to learn these", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.59479, "b": 127.73077, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "complex syntax rules, simply to deliver valid output.", "bbox": {"l": 134.765, "t": 130.88878999999997, "r": 364.62503, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "In practice, we observe two major issues with prediction quality when train-", "bbox": {"l": 149.709, "t": 143.48279000000002, "r": 480.58981, "b": 152.27979000000005, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "ing Im2Seq models on HTML table structure generation from images. On the", "bbox": {"l": 134.765, "t": 155.43781, "r": 480.59378, "b": 164.23479999999995, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "one hand, we find that on large tables, the visual attention of the model often", "bbox": {"l": 134.765, "t": 167.39282000000003, "r": 480.5867, "b": 176.18982000000005, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "starts to drift and is not accurately moving forward cell by cell anymore. This", "bbox": {"l": 134.765, "t": 179.34784000000002, "r": 480.59476, "b": 188.14484000000004, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "manifests itself in either in an increasing", "bbox": {"l": 134.765, "t": 191.30286, "r": 314.27805, "b": 200.09984999999995, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "location drift", "bbox": {"l": 318.056, "t": 191.30286, "r": 374.08664, "b": 200.09984999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "for proposed table-cells", "bbox": {"l": 378.80899, "t": 191.30286, "r": 480.58594, "b": 200.09984999999995, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "in later rows on the same column or even complete loss of vertical alignment, as", "bbox": {"l": 134.76498, "t": 203.25885000000005, "r": 480.58771, "b": 212.05584999999996, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "illustrated in Figure 5. Addressing this with post-processing is partially possible,", "bbox": {"l": 134.76498, "t": 215.21387000000004, "r": 480.59569999999997, "b": 224.01085999999998, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "but clearly undesired. On the other hand, we find many instances of predictions", "bbox": {"l": 134.76498, "t": 227.16887999999994, "r": 480.59454, "b": 235.96587999999997, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "with structural inconsistencies or plain invalid HTML output, as shown in Fig-", "bbox": {"l": 134.76498, "t": 239.12390000000005, "r": 480.58759000000003, "b": 247.92089999999996, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "ure 6, which are nearly impossible to properly correct. Both problems seriously", "bbox": {"l": 134.76498, "t": 251.07892000000004, "r": 480.59277, "b": 259.87591999999995, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "impact the TSR model performance, since they reflect not only in the task of", "bbox": {"l": 134.76498, "t": 263.03394000000003, "r": 480.59463999999997, "b": 271.83092999999997, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "pure structure recognition but also in the equally crucial recognition or matching", "bbox": {"l": 134.76498, "t": 274.98992999999996, "r": 480.58978, "b": 283.78693, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "of table cell content.", "bbox": {"l": 134.76498, "t": 286.94495, "r": 223.57262, "b": 295.74191, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "4", "bbox": {"l": 134.76498, "t": 320.6311, "r": 141.48859, "b": 331.19949, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Optimised Table Structure Language", "bbox": {"l": 154.93819, "t": 320.6311, "r": 372.50848, "b": 331.19949, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "To mitigate the issues with HTML in Im2Seq-based TSR models laid out before,", "bbox": {"l": 134.76498, "t": 349.11697, "r": 480.59075999999993, "b": 357.91394, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "we propose here our Optimised Table Structure Language (OTSL). OTSL is", "bbox": {"l": 134.76498, "t": 361.07196000000005, "r": 480.58875, "b": 369.86893, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "designed to express table structure with a minimized vocabulary and a simple", "bbox": {"l": 134.76498, "t": 373.02795, "r": 480.58681999999993, "b": 381.82492, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "set of rules, which are both significantly reduced compared to HTML. At the", "bbox": {"l": 134.76498, "t": 384.98294, "r": 480.58875, "b": 393.77991, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "same time, OTSL enables easy error detection and correction during sequence", "bbox": {"l": 134.76498, "t": 396.93793, "r": 480.58978, "b": 405.73489, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "generation. We further demonstrate how the compact structure representation", "bbox": {"l": 134.76498, "t": 408.89291, "r": 480.59473, "b": 417.68988, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "and minimized sequence length improves prediction accuracy and inference time", "bbox": {"l": 134.76498, "t": 420.8479, "r": 480.58868, "b": 429.64487, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "in the TableFormer architecture.", "bbox": {"l": 134.76498, "t": 432.80289, "r": 276.67325, "b": 441.59985, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "4.1", "bbox": {"l": 134.76498, "t": 465.87192, "r": 149.40204, "b": 474.67886, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Language Definition", "bbox": {"l": 160.85902, "t": 465.87192, "r": 261.80109, "b": 474.67886, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "In Figure 3, we illustrate how the OTSL is defined. In essence, the OTSL defines", "bbox": {"l": 134.76498, "t": 488.99789, "r": 480.58871, "b": 497.79486, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "only 5 tokens that directly describe a tabular structure based on an atomic 2D", "bbox": {"l": 134.76498, "t": 500.95288, "r": 480.5867, "b": 509.74985, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "grid.", "bbox": {"l": 134.76498, "t": 512.90887, "r": 154.7131, "b": 521.7058400000001, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "The OTSL vocabulary is comprised of the following tokens:", "bbox": {"l": 149.70898, "t": 525.5018600000001, "r": 409.31137, "b": 534.29883, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "-", "bbox": {"l": 140.99298, "t": 547.96989, "r": 146.72047, "b": 556.77682, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "\"C\" cell -", "bbox": {"l": 151.70099, "t": 547.97986, "r": 193.20619, "b": 556.77682, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "a new table cell", "bbox": {"l": 196.52199, "t": 547.97986, "r": 263.46564, "b": 556.77682, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "that either has or does not have cell content", "bbox": {"l": 267.815, "t": 547.97986, "r": 460.54443, "b": 556.77682, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "-", "bbox": {"l": 140.99301, "t": 560.5629, "r": 146.7205, "b": 569.36983, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "\"L\" cell -", "bbox": {"l": 151.70102, "t": 560.57286, "r": 194.30011, "b": 569.36983, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "left-looking cell", "bbox": {"l": 198.65903, "t": 560.57286, "r": 264.51779, "b": 569.36983, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": ", merging with the left neighbor cell to create a", "bbox": {"l": 264.51804, "t": 560.57286, "r": 480.59392999999994, "b": 569.36983, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "span", "bbox": {"l": 151.70103, "t": 572.52786, "r": 171.67604, "b": 581.32483, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "-", "bbox": {"l": 140.99304, "t": 585.11189, "r": 146.72054, "b": 593.91882, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "\"U\" cell -", "bbox": {"l": 151.70105, "t": 585.12186, "r": 194.11086, "b": 593.91882, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "up-looking cell", "bbox": {"l": 197.74805, "t": 585.12186, "r": 259.89474, "b": 593.91882, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": ", merging with the upper neighbor cell to create a", "bbox": {"l": 259.89206, "t": 585.12186, "r": 480.58856, "b": 593.91882, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "span", "bbox": {"l": 151.70105, "t": 597.07686, "r": 171.67606, "b": 605.87383, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "-", "bbox": {"l": 140.99304, "t": 609.6599, "r": 146.72054, "b": 618.46683, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "\"X\" cell -", "bbox": {"l": 151.70105, "t": 609.66986, "r": 193.48323, "b": 618.46683, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "cross cell", "bbox": {"l": 196.79904, "t": 609.66986, "r": 236.12042, "b": 618.46683, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": ", to merge with both left and upper neighbor cells", "bbox": {"l": 236.12505, "t": 609.66986, "r": 454.55496, "b": 618.46683, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "-", "bbox": {"l": 140.99304, "t": 622.2538900000001, "r": 146.72054, "b": 631.06082, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "\"NL\" -", "bbox": {"l": 151.70105, "t": 622.26385, "r": 181.99434, "b": 631.06082, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "new-line", "bbox": {"l": 185.31705, "t": 622.26385, "r": 221.46236, "b": 631.06082, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": ", switch to the next row.", "bbox": {"l": 221.46104, "t": 622.26385, "r": 328.61676, "b": 631.06082, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "A notable attribute of OTSL is that it has the capability of achieving lossless", "bbox": {"l": 149.70905, "t": 644.10286, "r": 480.59280000000007, "b": 652.8998300000001, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "conversion to HTML.", "bbox": {"l": 134.76505, "t": 656.05786, "r": 228.22321, "b": 664.85484, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 14, "label": "page_header", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8378866910934448, "cells": [{"id": 0, "text": "6", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "page_header", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8919180631637573, "cells": [{"id": 1, "text": "M.", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 178.07675, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37415, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.59479, "b": 139.68579, "coord_origin": "TOPLEFT"}, "confidence": 0.9633480906486511, "cells": [{"id": 3, "text": "generation. Implicitly, this also means that Im2Seq models need to learn these", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.59479, "b": 127.73077, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "complex syntax rules, simply to deliver valid output.", "bbox": {"l": 134.765, "t": 130.88878999999997, "r": 364.62503, "b": 139.68579, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 134.76498, "t": 143.48279000000002, "r": 480.59569999999997, "b": 295.74191, "coord_origin": "TOPLEFT"}, "confidence": 0.9856826663017273, "cells": [{"id": 5, "text": "In practice, we observe two major issues with prediction quality when train-", "bbox": {"l": 149.709, "t": 143.48279000000002, "r": 480.58981, "b": 152.27979000000005, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "ing Im2Seq models on HTML table structure generation from images. On the", "bbox": {"l": 134.765, "t": 155.43781, "r": 480.59378, "b": 164.23479999999995, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "one hand, we find that on large tables, the visual attention of the model often", "bbox": {"l": 134.765, "t": 167.39282000000003, "r": 480.5867, "b": 176.18982000000005, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "starts to drift and is not accurately moving forward cell by cell anymore. This", "bbox": {"l": 134.765, "t": 179.34784000000002, "r": 480.59476, "b": 188.14484000000004, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "manifests itself in either in an increasing", "bbox": {"l": 134.765, "t": 191.30286, "r": 314.27805, "b": 200.09984999999995, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "location drift", "bbox": {"l": 318.056, "t": 191.30286, "r": 374.08664, "b": 200.09984999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "for proposed table-cells", "bbox": {"l": 378.80899, "t": 191.30286, "r": 480.58594, "b": 200.09984999999995, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "in later rows on the same column or even complete loss of vertical alignment, as", "bbox": {"l": 134.76498, "t": 203.25885000000005, "r": 480.58771, "b": 212.05584999999996, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "illustrated in Figure 5. Addressing this with post-processing is partially possible,", "bbox": {"l": 134.76498, "t": 215.21387000000004, "r": 480.59569999999997, "b": 224.01085999999998, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "but clearly undesired. On the other hand, we find many instances of predictions", "bbox": {"l": 134.76498, "t": 227.16887999999994, "r": 480.59454, "b": 235.96587999999997, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "with structural inconsistencies or plain invalid HTML output, as shown in Fig-", "bbox": {"l": 134.76498, "t": 239.12390000000005, "r": 480.58759000000003, "b": 247.92089999999996, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "ure 6, which are nearly impossible to properly correct. Both problems seriously", "bbox": {"l": 134.76498, "t": 251.07892000000004, "r": 480.59277, "b": 259.87591999999995, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "impact the TSR model performance, since they reflect not only in the task of", "bbox": {"l": 134.76498, "t": 263.03394000000003, "r": 480.59463999999997, "b": 271.83092999999997, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "pure structure recognition but also in the equally crucial recognition or matching", "bbox": {"l": 134.76498, "t": 274.98992999999996, "r": 480.58978, "b": 283.78693, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "of table cell content.", "bbox": {"l": 134.76498, "t": 286.94495, "r": 223.57262, "b": 295.74191, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "section_header", "bbox": {"l": 134.76498, "t": 320.6311, "r": 372.50848, "b": 331.19949, "coord_origin": "TOPLEFT"}, "confidence": 0.9570288062095642, "cells": [{"id": 20, "text": "4", "bbox": {"l": 134.76498, "t": 320.6311, "r": 141.48859, "b": 331.19949, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Optimised Table Structure Language", "bbox": {"l": 154.93819, "t": 320.6311, "r": 372.50848, "b": 331.19949, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 134.76498, "t": 349.11697, "r": 480.59473, "b": 441.59985, "coord_origin": "TOPLEFT"}, "confidence": 0.9879323840141296, "cells": [{"id": 22, "text": "To mitigate the issues with HTML in Im2Seq-based TSR models laid out before,", "bbox": {"l": 134.76498, "t": 349.11697, "r": 480.59075999999993, "b": 357.91394, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "we propose here our Optimised Table Structure Language (OTSL). OTSL is", "bbox": {"l": 134.76498, "t": 361.07196000000005, "r": 480.58875, "b": 369.86893, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "designed to express table structure with a minimized vocabulary and a simple", "bbox": {"l": 134.76498, "t": 373.02795, "r": 480.58681999999993, "b": 381.82492, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "set of rules, which are both significantly reduced compared to HTML. At the", "bbox": {"l": 134.76498, "t": 384.98294, "r": 480.58875, "b": 393.77991, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "same time, OTSL enables easy error detection and correction during sequence", "bbox": {"l": 134.76498, "t": 396.93793, "r": 480.58978, "b": 405.73489, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "generation. We further demonstrate how the compact structure representation", "bbox": {"l": 134.76498, "t": 408.89291, "r": 480.59473, "b": 417.68988, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "and minimized sequence length improves prediction accuracy and inference time", "bbox": {"l": 134.76498, "t": 420.8479, "r": 480.58868, "b": 429.64487, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "in the TableFormer architecture.", "bbox": {"l": 134.76498, "t": 432.80289, "r": 276.67325, "b": 441.59985, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "section_header", "bbox": {"l": 134.76498, "t": 465.87192, "r": 261.80109, "b": 474.67886, "coord_origin": "TOPLEFT"}, "confidence": 0.9559652209281921, "cells": [{"id": 30, "text": "4.1", "bbox": {"l": 134.76498, "t": 465.87192, "r": 149.40204, "b": 474.67886, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Language Definition", "bbox": {"l": 160.85902, "t": 465.87192, "r": 261.80109, "b": 474.67886, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 134.76498, "t": 488.99789, "r": 480.58871, "b": 521.7058400000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9671263098716736, "cells": [{"id": 32, "text": "In Figure 3, we illustrate how the OTSL is defined. In essence, the OTSL defines", "bbox": {"l": 134.76498, "t": 488.99789, "r": 480.58871, "b": 497.79486, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "only 5 tokens that directly describe a tabular structure based on an atomic 2D", "bbox": {"l": 134.76498, "t": 500.95288, "r": 480.5867, "b": 509.74985, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "grid.", "bbox": {"l": 134.76498, "t": 512.90887, "r": 154.7131, "b": 521.7058400000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 149.70898, "t": 525.5018600000001, "r": 409.31137, "b": 534.29883, "coord_origin": "TOPLEFT"}, "confidence": 0.8555868268013, "cells": [{"id": 35, "text": "The OTSL vocabulary is comprised of the following tokens:", "bbox": {"l": 149.70898, "t": 525.5018600000001, "r": 409.31137, "b": 534.29883, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "list_item", "bbox": {"l": 140.99298, "t": 547.96989, "r": 460.54443, "b": 556.77682, "coord_origin": "TOPLEFT"}, "confidence": 0.9184334874153137, "cells": [{"id": 36, "text": "-", "bbox": {"l": 140.99298, "t": 547.96989, "r": 146.72047, "b": 556.77682, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "\"C\" cell -", "bbox": {"l": 151.70099, "t": 547.97986, "r": 193.20619, "b": 556.77682, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "a new table cell", "bbox": {"l": 196.52199, "t": 547.97986, "r": 263.46564, "b": 556.77682, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "that either has or does not have cell content", "bbox": {"l": 267.815, "t": 547.97986, "r": 460.54443, "b": 556.77682, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "list_item", "bbox": {"l": 140.99301, "t": 560.5629, "r": 480.59392999999994, "b": 581.32483, "coord_origin": "TOPLEFT"}, "confidence": 0.9319928884506226, "cells": [{"id": 40, "text": "-", "bbox": {"l": 140.99301, "t": 560.5629, "r": 146.7205, "b": 569.36983, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "\"L\" cell -", "bbox": {"l": 151.70102, "t": 560.57286, "r": 194.30011, "b": 569.36983, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "left-looking cell", "bbox": {"l": 198.65903, "t": 560.57286, "r": 264.51779, "b": 569.36983, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": ", merging with the left neighbor cell to create a", "bbox": {"l": 264.51804, "t": 560.57286, "r": 480.59392999999994, "b": 569.36983, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "span", "bbox": {"l": 151.70103, "t": 572.52786, "r": 171.67604, "b": 581.32483, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "list_item", "bbox": {"l": 140.99304, "t": 585.11189, "r": 480.58856, "b": 605.87383, "coord_origin": "TOPLEFT"}, "confidence": 0.9438968896865845, "cells": [{"id": 45, "text": "-", "bbox": {"l": 140.99304, "t": 585.11189, "r": 146.72054, "b": 593.91882, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "\"U\" cell -", "bbox": {"l": 151.70105, "t": 585.12186, "r": 194.11086, "b": 593.91882, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "up-looking cell", "bbox": {"l": 197.74805, "t": 585.12186, "r": 259.89474, "b": 593.91882, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": ", merging with the upper neighbor cell to create a", "bbox": {"l": 259.89206, "t": 585.12186, "r": 480.58856, "b": 593.91882, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "span", "bbox": {"l": 151.70105, "t": 597.07686, "r": 171.67606, "b": 605.87383, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "list_item", "bbox": {"l": 140.99304, "t": 609.6599, "r": 454.55496, "b": 618.46683, "coord_origin": "TOPLEFT"}, "confidence": 0.9036383628845215, "cells": [{"id": 50, "text": "-", "bbox": {"l": 140.99304, "t": 609.6599, "r": 146.72054, "b": 618.46683, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "\"X\" cell -", "bbox": {"l": 151.70105, "t": 609.66986, "r": 193.48323, "b": 618.46683, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "cross cell", "bbox": {"l": 196.79904, "t": 609.66986, "r": 236.12042, "b": 618.46683, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": ", to merge with both left and upper neighbor cells", "bbox": {"l": 236.12505, "t": 609.66986, "r": 454.55496, "b": 618.46683, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "list_item", "bbox": {"l": 140.99304, "t": 622.2538900000001, "r": 328.61676, "b": 631.06082, "coord_origin": "TOPLEFT"}, "confidence": 0.8636868000030518, "cells": [{"id": 54, "text": "-", "bbox": {"l": 140.99304, "t": 622.2538900000001, "r": 146.72054, "b": 631.06082, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "\"NL\" -", "bbox": {"l": 151.70105, "t": 622.26385, "r": 181.99434, "b": 631.06082, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "new-line", "bbox": {"l": 185.31705, "t": 622.26385, "r": 221.46236, "b": 631.06082, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": ", switch to the next row.", "bbox": {"l": 221.46104, "t": 622.26385, "r": 328.61676, "b": 631.06082, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "text", "bbox": {"l": 134.76505, "t": 644.10286, "r": 480.59280000000007, "b": 664.85484, "coord_origin": "TOPLEFT"}, "confidence": 0.9443336129188538, "cells": [{"id": 58, "text": "A notable attribute of OTSL is that it has the capability of achieving lossless", "bbox": {"l": 149.70905, "t": 644.10286, "r": 480.59280000000007, "b": 652.8998300000001, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "conversion to HTML.", "bbox": {"l": 134.76505, "t": 656.05786, "r": 228.22321, "b": 664.85484, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_header", "id": 14, "page_no": 5, "cluster": {"id": 14, "label": "page_header", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8378866910934448, "cells": [{"id": 0, "text": "6", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "6"}, {"label": "page_header", "id": 11, "page_no": 5, "cluster": {"id": 11, "label": "page_header", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8919180631637573, "cells": [{"id": 1, "text": "M.", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 178.07675, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37415, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "M. Lysak, et al."}, {"label": "text", "id": 3, "page_no": 5, "cluster": {"id": 3, "label": "text", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.59479, "b": 139.68579, "coord_origin": "TOPLEFT"}, "confidence": 0.9633480906486511, "cells": [{"id": 3, "text": "generation. Implicitly, this also means that Im2Seq models need to learn these", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.59479, "b": 127.73077, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "complex syntax rules, simply to deliver valid output.", "bbox": {"l": 134.765, "t": 130.88878999999997, "r": 364.62503, "b": 139.68579, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "generation. Implicitly, this also means that Im2Seq models need to learn these complex syntax rules, simply to deliver valid output."}, {"label": "text", "id": 1, "page_no": 5, "cluster": {"id": 1, "label": "text", "bbox": {"l": 134.76498, "t": 143.48279000000002, "r": 480.59569999999997, "b": 295.74191, "coord_origin": "TOPLEFT"}, "confidence": 0.9856826663017273, "cells": [{"id": 5, "text": "In practice, we observe two major issues with prediction quality when train-", "bbox": {"l": 149.709, "t": 143.48279000000002, "r": 480.58981, "b": 152.27979000000005, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "ing Im2Seq models on HTML table structure generation from images. On the", "bbox": {"l": 134.765, "t": 155.43781, "r": 480.59378, "b": 164.23479999999995, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "one hand, we find that on large tables, the visual attention of the model often", "bbox": {"l": 134.765, "t": 167.39282000000003, "r": 480.5867, "b": 176.18982000000005, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "starts to drift and is not accurately moving forward cell by cell anymore. This", "bbox": {"l": 134.765, "t": 179.34784000000002, "r": 480.59476, "b": 188.14484000000004, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "manifests itself in either in an increasing", "bbox": {"l": 134.765, "t": 191.30286, "r": 314.27805, "b": 200.09984999999995, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "location drift", "bbox": {"l": 318.056, "t": 191.30286, "r": 374.08664, "b": 200.09984999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "for proposed table-cells", "bbox": {"l": 378.80899, "t": 191.30286, "r": 480.58594, "b": 200.09984999999995, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "in later rows on the same column or even complete loss of vertical alignment, as", "bbox": {"l": 134.76498, "t": 203.25885000000005, "r": 480.58771, "b": 212.05584999999996, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "illustrated in Figure 5. Addressing this with post-processing is partially possible,", "bbox": {"l": 134.76498, "t": 215.21387000000004, "r": 480.59569999999997, "b": 224.01085999999998, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "but clearly undesired. On the other hand, we find many instances of predictions", "bbox": {"l": 134.76498, "t": 227.16887999999994, "r": 480.59454, "b": 235.96587999999997, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "with structural inconsistencies or plain invalid HTML output, as shown in Fig-", "bbox": {"l": 134.76498, "t": 239.12390000000005, "r": 480.58759000000003, "b": 247.92089999999996, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "ure 6, which are nearly impossible to properly correct. Both problems seriously", "bbox": {"l": 134.76498, "t": 251.07892000000004, "r": 480.59277, "b": 259.87591999999995, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "impact the TSR model performance, since they reflect not only in the task of", "bbox": {"l": 134.76498, "t": 263.03394000000003, "r": 480.59463999999997, "b": 271.83092999999997, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "pure structure recognition but also in the equally crucial recognition or matching", "bbox": {"l": 134.76498, "t": 274.98992999999996, "r": 480.58978, "b": 283.78693, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "of table cell content.", "bbox": {"l": 134.76498, "t": 286.94495, "r": 223.57262, "b": 295.74191, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In practice, we observe two major issues with prediction quality when training Im2Seq models on HTML table structure generation from images. On the one hand, we find that on large tables, the visual attention of the model often starts to drift and is not accurately moving forward cell by cell anymore. This manifests itself in either in an increasing location drift for proposed table-cells in later rows on the same column or even complete loss of vertical alignment, as illustrated in Figure 5. Addressing this with post-processing is partially possible, but clearly undesired. On the other hand, we find many instances of predictions with structural inconsistencies or plain invalid HTML output, as shown in Figure 6, which are nearly impossible to properly correct. Both problems seriously impact the TSR model performance, since they reflect not only in the task of pure structure recognition but also in the equally crucial recognition or matching of table cell content."}, {"label": "section_header", "id": 4, "page_no": 5, "cluster": {"id": 4, "label": "section_header", "bbox": {"l": 134.76498, "t": 320.6311, "r": 372.50848, "b": 331.19949, "coord_origin": "TOPLEFT"}, "confidence": 0.9570288062095642, "cells": [{"id": 20, "text": "4", "bbox": {"l": 134.76498, "t": 320.6311, "r": 141.48859, "b": 331.19949, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Optimised Table Structure Language", "bbox": {"l": 154.93819, "t": 320.6311, "r": 372.50848, "b": 331.19949, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4 Optimised Table Structure Language"}, {"label": "text", "id": 0, "page_no": 5, "cluster": {"id": 0, "label": "text", "bbox": {"l": 134.76498, "t": 349.11697, "r": 480.59473, "b": 441.59985, "coord_origin": "TOPLEFT"}, "confidence": 0.9879323840141296, "cells": [{"id": 22, "text": "To mitigate the issues with HTML in Im2Seq-based TSR models laid out before,", "bbox": {"l": 134.76498, "t": 349.11697, "r": 480.59075999999993, "b": 357.91394, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "we propose here our Optimised Table Structure Language (OTSL). OTSL is", "bbox": {"l": 134.76498, "t": 361.07196000000005, "r": 480.58875, "b": 369.86893, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "designed to express table structure with a minimized vocabulary and a simple", "bbox": {"l": 134.76498, "t": 373.02795, "r": 480.58681999999993, "b": 381.82492, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "set of rules, which are both significantly reduced compared to HTML. At the", "bbox": {"l": 134.76498, "t": 384.98294, "r": 480.58875, "b": 393.77991, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "same time, OTSL enables easy error detection and correction during sequence", "bbox": {"l": 134.76498, "t": 396.93793, "r": 480.58978, "b": 405.73489, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "generation. We further demonstrate how the compact structure representation", "bbox": {"l": 134.76498, "t": 408.89291, "r": 480.59473, "b": 417.68988, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "and minimized sequence length improves prediction accuracy and inference time", "bbox": {"l": 134.76498, "t": 420.8479, "r": 480.58868, "b": 429.64487, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "in the TableFormer architecture.", "bbox": {"l": 134.76498, "t": 432.80289, "r": 276.67325, "b": 441.59985, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "To mitigate the issues with HTML in Im2Seq-based TSR models laid out before, we propose here our Optimised Table Structure Language (OTSL). OTSL is designed to express table structure with a minimized vocabulary and a simple set of rules, which are both significantly reduced compared to HTML. At the same time, OTSL enables easy error detection and correction during sequence generation. We further demonstrate how the compact structure representation and minimized sequence length improves prediction accuracy and inference time in the TableFormer architecture."}, {"label": "section_header", "id": 5, "page_no": 5, "cluster": {"id": 5, "label": "section_header", "bbox": {"l": 134.76498, "t": 465.87192, "r": 261.80109, "b": 474.67886, "coord_origin": "TOPLEFT"}, "confidence": 0.9559652209281921, "cells": [{"id": 30, "text": "4.1", "bbox": {"l": 134.76498, "t": 465.87192, "r": 149.40204, "b": 474.67886, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Language Definition", "bbox": {"l": 160.85902, "t": 465.87192, "r": 261.80109, "b": 474.67886, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4.1 Language Definition"}, {"label": "text", "id": 2, "page_no": 5, "cluster": {"id": 2, "label": "text", "bbox": {"l": 134.76498, "t": 488.99789, "r": 480.58871, "b": 521.7058400000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9671263098716736, "cells": [{"id": 32, "text": "In Figure 3, we illustrate how the OTSL is defined. In essence, the OTSL defines", "bbox": {"l": 134.76498, "t": 488.99789, "r": 480.58871, "b": 497.79486, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "only 5 tokens that directly describe a tabular structure based on an atomic 2D", "bbox": {"l": 134.76498, "t": 500.95288, "r": 480.5867, "b": 509.74985, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "grid.", "bbox": {"l": 134.76498, "t": 512.90887, "r": 154.7131, "b": 521.7058400000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In Figure 3, we illustrate how the OTSL is defined. In essence, the OTSL defines only 5 tokens that directly describe a tabular structure based on an atomic 2D grid."}, {"label": "text", "id": 13, "page_no": 5, "cluster": {"id": 13, "label": "text", "bbox": {"l": 149.70898, "t": 525.5018600000001, "r": 409.31137, "b": 534.29883, "coord_origin": "TOPLEFT"}, "confidence": 0.8555868268013, "cells": [{"id": 35, "text": "The OTSL vocabulary is comprised of the following tokens:", "bbox": {"l": 149.70898, "t": 525.5018600000001, "r": 409.31137, "b": 534.29883, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The OTSL vocabulary is comprised of the following tokens:"}, {"label": "list_item", "id": 9, "page_no": 5, "cluster": {"id": 9, "label": "list_item", "bbox": {"l": 140.99298, "t": 547.96989, "r": 460.54443, "b": 556.77682, "coord_origin": "TOPLEFT"}, "confidence": 0.9184334874153137, "cells": [{"id": 36, "text": "-", "bbox": {"l": 140.99298, "t": 547.96989, "r": 146.72047, "b": 556.77682, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "\"C\" cell -", "bbox": {"l": 151.70099, "t": 547.97986, "r": 193.20619, "b": 556.77682, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "a new table cell", "bbox": {"l": 196.52199, "t": 547.97986, "r": 263.46564, "b": 556.77682, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "that either has or does not have cell content", "bbox": {"l": 267.815, "t": 547.97986, "r": 460.54443, "b": 556.77682, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "-\"C\" cell a new table cell that either has or does not have cell content"}, {"label": "list_item", "id": 8, "page_no": 5, "cluster": {"id": 8, "label": "list_item", "bbox": {"l": 140.99301, "t": 560.5629, "r": 480.59392999999994, "b": 581.32483, "coord_origin": "TOPLEFT"}, "confidence": 0.9319928884506226, "cells": [{"id": 40, "text": "-", "bbox": {"l": 140.99301, "t": 560.5629, "r": 146.7205, "b": 569.36983, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "\"L\" cell -", "bbox": {"l": 151.70102, "t": 560.57286, "r": 194.30011, "b": 569.36983, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "left-looking cell", "bbox": {"l": 198.65903, "t": 560.57286, "r": 264.51779, "b": 569.36983, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": ", merging with the left neighbor cell to create a", "bbox": {"l": 264.51804, "t": 560.57286, "r": 480.59392999999994, "b": 569.36983, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "span", "bbox": {"l": 151.70103, "t": 572.52786, "r": 171.67604, "b": 581.32483, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "-\"L\" cell left-looking cell , merging with the left neighbor cell to create a span"}, {"label": "list_item", "id": 7, "page_no": 5, "cluster": {"id": 7, "label": "list_item", "bbox": {"l": 140.99304, "t": 585.11189, "r": 480.58856, "b": 605.87383, "coord_origin": "TOPLEFT"}, "confidence": 0.9438968896865845, "cells": [{"id": 45, "text": "-", "bbox": {"l": 140.99304, "t": 585.11189, "r": 146.72054, "b": 593.91882, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "\"U\" cell -", "bbox": {"l": 151.70105, "t": 585.12186, "r": 194.11086, "b": 593.91882, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "up-looking cell", "bbox": {"l": 197.74805, "t": 585.12186, "r": 259.89474, "b": 593.91882, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": ", merging with the upper neighbor cell to create a", "bbox": {"l": 259.89206, "t": 585.12186, "r": 480.58856, "b": 593.91882, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "span", "bbox": {"l": 151.70105, "t": 597.07686, "r": 171.67606, "b": 605.87383, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "-\"U\" cell up-looking cell , merging with the upper neighbor cell to create a span"}, {"label": "list_item", "id": 10, "page_no": 5, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 140.99304, "t": 609.6599, "r": 454.55496, "b": 618.46683, "coord_origin": "TOPLEFT"}, "confidence": 0.9036383628845215, "cells": [{"id": 50, "text": "-", "bbox": {"l": 140.99304, "t": 609.6599, "r": 146.72054, "b": 618.46683, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "\"X\" cell -", "bbox": {"l": 151.70105, "t": 609.66986, "r": 193.48323, "b": 618.46683, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "cross cell", "bbox": {"l": 196.79904, "t": 609.66986, "r": 236.12042, "b": 618.46683, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": ", to merge with both left and upper neighbor cells", "bbox": {"l": 236.12505, "t": 609.66986, "r": 454.55496, "b": 618.46683, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "-\"X\" cell cross cell , to merge with both left and upper neighbor cells"}, {"label": "list_item", "id": 12, "page_no": 5, "cluster": {"id": 12, "label": "list_item", "bbox": {"l": 140.99304, "t": 622.2538900000001, "r": 328.61676, "b": 631.06082, "coord_origin": "TOPLEFT"}, "confidence": 0.8636868000030518, "cells": [{"id": 54, "text": "-", "bbox": {"l": 140.99304, "t": 622.2538900000001, "r": 146.72054, "b": 631.06082, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "\"NL\" -", "bbox": {"l": 151.70105, "t": 622.26385, "r": 181.99434, "b": 631.06082, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "new-line", "bbox": {"l": 185.31705, "t": 622.26385, "r": 221.46236, "b": 631.06082, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": ", switch to the next row.", "bbox": {"l": 221.46104, "t": 622.26385, "r": 328.61676, "b": 631.06082, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "-\"NL\" new-line , switch to the next row."}, {"label": "text", "id": 6, "page_no": 5, "cluster": {"id": 6, "label": "text", "bbox": {"l": 134.76505, "t": 644.10286, "r": 480.59280000000007, "b": 664.85484, "coord_origin": "TOPLEFT"}, "confidence": 0.9443336129188538, "cells": [{"id": 58, "text": "A notable attribute of OTSL is that it has the capability of achieving lossless", "bbox": {"l": 149.70905, "t": 644.10286, "r": 480.59280000000007, "b": 652.8998300000001, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "conversion to HTML.", "bbox": {"l": 134.76505, "t": 656.05786, "r": 228.22321, "b": 664.85484, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "A notable attribute of OTSL is that it has the capability of achieving lossless conversion to HTML."}], "body": [{"label": "text", "id": 3, "page_no": 5, "cluster": {"id": 3, "label": "text", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.59479, "b": 139.68579, "coord_origin": "TOPLEFT"}, "confidence": 0.9633480906486511, "cells": [{"id": 3, "text": "generation. Implicitly, this also means that Im2Seq models need to learn these", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.59479, "b": 127.73077, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "complex syntax rules, simply to deliver valid output.", "bbox": {"l": 134.765, "t": 130.88878999999997, "r": 364.62503, "b": 139.68579, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "generation. Implicitly, this also means that Im2Seq models need to learn these complex syntax rules, simply to deliver valid output."}, {"label": "text", "id": 1, "page_no": 5, "cluster": {"id": 1, "label": "text", "bbox": {"l": 134.76498, "t": 143.48279000000002, "r": 480.59569999999997, "b": 295.74191, "coord_origin": "TOPLEFT"}, "confidence": 0.9856826663017273, "cells": [{"id": 5, "text": "In practice, we observe two major issues with prediction quality when train-", "bbox": {"l": 149.709, "t": 143.48279000000002, "r": 480.58981, "b": 152.27979000000005, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "ing Im2Seq models on HTML table structure generation from images. On the", "bbox": {"l": 134.765, "t": 155.43781, "r": 480.59378, "b": 164.23479999999995, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "one hand, we find that on large tables, the visual attention of the model often", "bbox": {"l": 134.765, "t": 167.39282000000003, "r": 480.5867, "b": 176.18982000000005, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "starts to drift and is not accurately moving forward cell by cell anymore. This", "bbox": {"l": 134.765, "t": 179.34784000000002, "r": 480.59476, "b": 188.14484000000004, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "manifests itself in either in an increasing", "bbox": {"l": 134.765, "t": 191.30286, "r": 314.27805, "b": 200.09984999999995, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "location drift", "bbox": {"l": 318.056, "t": 191.30286, "r": 374.08664, "b": 200.09984999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "for proposed table-cells", "bbox": {"l": 378.80899, "t": 191.30286, "r": 480.58594, "b": 200.09984999999995, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "in later rows on the same column or even complete loss of vertical alignment, as", "bbox": {"l": 134.76498, "t": 203.25885000000005, "r": 480.58771, "b": 212.05584999999996, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "illustrated in Figure 5. Addressing this with post-processing is partially possible,", "bbox": {"l": 134.76498, "t": 215.21387000000004, "r": 480.59569999999997, "b": 224.01085999999998, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "but clearly undesired. On the other hand, we find many instances of predictions", "bbox": {"l": 134.76498, "t": 227.16887999999994, "r": 480.59454, "b": 235.96587999999997, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "with structural inconsistencies or plain invalid HTML output, as shown in Fig-", "bbox": {"l": 134.76498, "t": 239.12390000000005, "r": 480.58759000000003, "b": 247.92089999999996, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "ure 6, which are nearly impossible to properly correct. Both problems seriously", "bbox": {"l": 134.76498, "t": 251.07892000000004, "r": 480.59277, "b": 259.87591999999995, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "impact the TSR model performance, since they reflect not only in the task of", "bbox": {"l": 134.76498, "t": 263.03394000000003, "r": 480.59463999999997, "b": 271.83092999999997, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "pure structure recognition but also in the equally crucial recognition or matching", "bbox": {"l": 134.76498, "t": 274.98992999999996, "r": 480.58978, "b": 283.78693, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "of table cell content.", "bbox": {"l": 134.76498, "t": 286.94495, "r": 223.57262, "b": 295.74191, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In practice, we observe two major issues with prediction quality when training Im2Seq models on HTML table structure generation from images. On the one hand, we find that on large tables, the visual attention of the model often starts to drift and is not accurately moving forward cell by cell anymore. This manifests itself in either in an increasing location drift for proposed table-cells in later rows on the same column or even complete loss of vertical alignment, as illustrated in Figure 5. Addressing this with post-processing is partially possible, but clearly undesired. On the other hand, we find many instances of predictions with structural inconsistencies or plain invalid HTML output, as shown in Figure 6, which are nearly impossible to properly correct. Both problems seriously impact the TSR model performance, since they reflect not only in the task of pure structure recognition but also in the equally crucial recognition or matching of table cell content."}, {"label": "section_header", "id": 4, "page_no": 5, "cluster": {"id": 4, "label": "section_header", "bbox": {"l": 134.76498, "t": 320.6311, "r": 372.50848, "b": 331.19949, "coord_origin": "TOPLEFT"}, "confidence": 0.9570288062095642, "cells": [{"id": 20, "text": "4", "bbox": {"l": 134.76498, "t": 320.6311, "r": 141.48859, "b": 331.19949, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Optimised Table Structure Language", "bbox": {"l": 154.93819, "t": 320.6311, "r": 372.50848, "b": 331.19949, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4 Optimised Table Structure Language"}, {"label": "text", "id": 0, "page_no": 5, "cluster": {"id": 0, "label": "text", "bbox": {"l": 134.76498, "t": 349.11697, "r": 480.59473, "b": 441.59985, "coord_origin": "TOPLEFT"}, "confidence": 0.9879323840141296, "cells": [{"id": 22, "text": "To mitigate the issues with HTML in Im2Seq-based TSR models laid out before,", "bbox": {"l": 134.76498, "t": 349.11697, "r": 480.59075999999993, "b": 357.91394, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "we propose here our Optimised Table Structure Language (OTSL). OTSL is", "bbox": {"l": 134.76498, "t": 361.07196000000005, "r": 480.58875, "b": 369.86893, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "designed to express table structure with a minimized vocabulary and a simple", "bbox": {"l": 134.76498, "t": 373.02795, "r": 480.58681999999993, "b": 381.82492, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "set of rules, which are both significantly reduced compared to HTML. At the", "bbox": {"l": 134.76498, "t": 384.98294, "r": 480.58875, "b": 393.77991, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "same time, OTSL enables easy error detection and correction during sequence", "bbox": {"l": 134.76498, "t": 396.93793, "r": 480.58978, "b": 405.73489, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "generation. We further demonstrate how the compact structure representation", "bbox": {"l": 134.76498, "t": 408.89291, "r": 480.59473, "b": 417.68988, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "and minimized sequence length improves prediction accuracy and inference time", "bbox": {"l": 134.76498, "t": 420.8479, "r": 480.58868, "b": 429.64487, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "in the TableFormer architecture.", "bbox": {"l": 134.76498, "t": 432.80289, "r": 276.67325, "b": 441.59985, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "To mitigate the issues with HTML in Im2Seq-based TSR models laid out before, we propose here our Optimised Table Structure Language (OTSL). OTSL is designed to express table structure with a minimized vocabulary and a simple set of rules, which are both significantly reduced compared to HTML. At the same time, OTSL enables easy error detection and correction during sequence generation. We further demonstrate how the compact structure representation and minimized sequence length improves prediction accuracy and inference time in the TableFormer architecture."}, {"label": "section_header", "id": 5, "page_no": 5, "cluster": {"id": 5, "label": "section_header", "bbox": {"l": 134.76498, "t": 465.87192, "r": 261.80109, "b": 474.67886, "coord_origin": "TOPLEFT"}, "confidence": 0.9559652209281921, "cells": [{"id": 30, "text": "4.1", "bbox": {"l": 134.76498, "t": 465.87192, "r": 149.40204, "b": 474.67886, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Language Definition", "bbox": {"l": 160.85902, "t": 465.87192, "r": 261.80109, "b": 474.67886, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4.1 Language Definition"}, {"label": "text", "id": 2, "page_no": 5, "cluster": {"id": 2, "label": "text", "bbox": {"l": 134.76498, "t": 488.99789, "r": 480.58871, "b": 521.7058400000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9671263098716736, "cells": [{"id": 32, "text": "In Figure 3, we illustrate how the OTSL is defined. In essence, the OTSL defines", "bbox": {"l": 134.76498, "t": 488.99789, "r": 480.58871, "b": 497.79486, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "only 5 tokens that directly describe a tabular structure based on an atomic 2D", "bbox": {"l": 134.76498, "t": 500.95288, "r": 480.5867, "b": 509.74985, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "grid.", "bbox": {"l": 134.76498, "t": 512.90887, "r": 154.7131, "b": 521.7058400000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In Figure 3, we illustrate how the OTSL is defined. In essence, the OTSL defines only 5 tokens that directly describe a tabular structure based on an atomic 2D grid."}, {"label": "text", "id": 13, "page_no": 5, "cluster": {"id": 13, "label": "text", "bbox": {"l": 149.70898, "t": 525.5018600000001, "r": 409.31137, "b": 534.29883, "coord_origin": "TOPLEFT"}, "confidence": 0.8555868268013, "cells": [{"id": 35, "text": "The OTSL vocabulary is comprised of the following tokens:", "bbox": {"l": 149.70898, "t": 525.5018600000001, "r": 409.31137, "b": 534.29883, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The OTSL vocabulary is comprised of the following tokens:"}, {"label": "list_item", "id": 9, "page_no": 5, "cluster": {"id": 9, "label": "list_item", "bbox": {"l": 140.99298, "t": 547.96989, "r": 460.54443, "b": 556.77682, "coord_origin": "TOPLEFT"}, "confidence": 0.9184334874153137, "cells": [{"id": 36, "text": "-", "bbox": {"l": 140.99298, "t": 547.96989, "r": 146.72047, "b": 556.77682, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "\"C\" cell -", "bbox": {"l": 151.70099, "t": 547.97986, "r": 193.20619, "b": 556.77682, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "a new table cell", "bbox": {"l": 196.52199, "t": 547.97986, "r": 263.46564, "b": 556.77682, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "that either has or does not have cell content", "bbox": {"l": 267.815, "t": 547.97986, "r": 460.54443, "b": 556.77682, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "-\"C\" cell a new table cell that either has or does not have cell content"}, {"label": "list_item", "id": 8, "page_no": 5, "cluster": {"id": 8, "label": "list_item", "bbox": {"l": 140.99301, "t": 560.5629, "r": 480.59392999999994, "b": 581.32483, "coord_origin": "TOPLEFT"}, "confidence": 0.9319928884506226, "cells": [{"id": 40, "text": "-", "bbox": {"l": 140.99301, "t": 560.5629, "r": 146.7205, "b": 569.36983, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "\"L\" cell -", "bbox": {"l": 151.70102, "t": 560.57286, "r": 194.30011, "b": 569.36983, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "left-looking cell", "bbox": {"l": 198.65903, "t": 560.57286, "r": 264.51779, "b": 569.36983, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": ", merging with the left neighbor cell to create a", "bbox": {"l": 264.51804, "t": 560.57286, "r": 480.59392999999994, "b": 569.36983, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "span", "bbox": {"l": 151.70103, "t": 572.52786, "r": 171.67604, "b": 581.32483, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "-\"L\" cell left-looking cell , merging with the left neighbor cell to create a span"}, {"label": "list_item", "id": 7, "page_no": 5, "cluster": {"id": 7, "label": "list_item", "bbox": {"l": 140.99304, "t": 585.11189, "r": 480.58856, "b": 605.87383, "coord_origin": "TOPLEFT"}, "confidence": 0.9438968896865845, "cells": [{"id": 45, "text": "-", "bbox": {"l": 140.99304, "t": 585.11189, "r": 146.72054, "b": 593.91882, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "\"U\" cell -", "bbox": {"l": 151.70105, "t": 585.12186, "r": 194.11086, "b": 593.91882, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "up-looking cell", "bbox": {"l": 197.74805, "t": 585.12186, "r": 259.89474, "b": 593.91882, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": ", merging with the upper neighbor cell to create a", "bbox": {"l": 259.89206, "t": 585.12186, "r": 480.58856, "b": 593.91882, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "span", "bbox": {"l": 151.70105, "t": 597.07686, "r": 171.67606, "b": 605.87383, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "-\"U\" cell up-looking cell , merging with the upper neighbor cell to create a span"}, {"label": "list_item", "id": 10, "page_no": 5, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 140.99304, "t": 609.6599, "r": 454.55496, "b": 618.46683, "coord_origin": "TOPLEFT"}, "confidence": 0.9036383628845215, "cells": [{"id": 50, "text": "-", "bbox": {"l": 140.99304, "t": 609.6599, "r": 146.72054, "b": 618.46683, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "\"X\" cell -", "bbox": {"l": 151.70105, "t": 609.66986, "r": 193.48323, "b": 618.46683, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "cross cell", "bbox": {"l": 196.79904, "t": 609.66986, "r": 236.12042, "b": 618.46683, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": ", to merge with both left and upper neighbor cells", "bbox": {"l": 236.12505, "t": 609.66986, "r": 454.55496, "b": 618.46683, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "-\"X\" cell cross cell , to merge with both left and upper neighbor cells"}, {"label": "list_item", "id": 12, "page_no": 5, "cluster": {"id": 12, "label": "list_item", "bbox": {"l": 140.99304, "t": 622.2538900000001, "r": 328.61676, "b": 631.06082, "coord_origin": "TOPLEFT"}, "confidence": 0.8636868000030518, "cells": [{"id": 54, "text": "-", "bbox": {"l": 140.99304, "t": 622.2538900000001, "r": 146.72054, "b": 631.06082, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "\"NL\" -", "bbox": {"l": 151.70105, "t": 622.26385, "r": 181.99434, "b": 631.06082, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "new-line", "bbox": {"l": 185.31705, "t": 622.26385, "r": 221.46236, "b": 631.06082, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": ", switch to the next row.", "bbox": {"l": 221.46104, "t": 622.26385, "r": 328.61676, "b": 631.06082, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "-\"NL\" new-line , switch to the next row."}, {"label": "text", "id": 6, "page_no": 5, "cluster": {"id": 6, "label": "text", "bbox": {"l": 134.76505, "t": 644.10286, "r": 480.59280000000007, "b": 664.85484, "coord_origin": "TOPLEFT"}, "confidence": 0.9443336129188538, "cells": [{"id": 58, "text": "A notable attribute of OTSL is that it has the capability of achieving lossless", "bbox": {"l": 149.70905, "t": 644.10286, "r": 480.59280000000007, "b": 652.8998300000001, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "conversion to HTML.", "bbox": {"l": 134.76505, "t": 656.05786, "r": 228.22321, "b": 664.85484, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "A notable attribute of OTSL is that it has the capability of achieving lossless conversion to HTML."}], "headers": [{"label": "page_header", "id": 14, "page_no": 5, "cluster": {"id": 14, "label": "page_header", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8378866910934448, "cells": [{"id": 0, "text": "6", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "6"}, {"label": "page_header", "id": 11, "page_no": 5, "cluster": {"id": 11, "label": "page_header", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8919180631637573, "cells": [{"id": 1, "text": "M.", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 178.07675, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37415, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "M. Lysak, et al."}]}}, {"page_no": 6, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "7", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Fig. 3.", "bbox": {"l": 134.765, "t": 125.79918999999984, "r": 162.64424, "b": 133.72551999999996, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "OTSL description of table structure: A - table example; B - graphical repre-", "bbox": {"l": 166.276, "t": 125.86200000000008, "r": 480.58675999999997, "b": 133.93169999999998, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "sentation of table structure; C - mapping structure on a grid; D - OTSL structure", "bbox": {"l": 134.765, "t": 136.82097999999996, "r": 480.5874, "b": 144.89068999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "encoding; E - explanation on cell encoding", "bbox": {"l": 134.765, "t": 147.77997000000005, "r": 306.1156, "b": 155.84966999999995, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "C", "bbox": {"l": 374.49326, "t": 168.59362999999996, "r": 381.66843, "b": 177.91540999999995, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "C", "bbox": {"l": 398.74011, "t": 168.50005999999996, "r": 405.91528, "b": 177.82183999999995, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "C", "bbox": {"l": 373.76862, "t": 192.92553999999996, "r": 380.94379, "b": 202.24730999999997, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "C", "bbox": {"l": 386.66388, "t": 193.07061999999996, "r": 393.83905, "b": 202.39239999999995, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "C", "bbox": {"l": 386.68707, "t": 205.13756999999998, "r": 393.86224, "b": 214.45934999999997, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "C", "bbox": {"l": 398.65729, "t": 180.73279000000002, "r": 405.83246, "b": 190.05457, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "C", "bbox": {"l": 410.77908, "t": 180.73859000000004, "r": 417.95425, "b": 190.06035999999995, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "C", "bbox": {"l": 422.90503, "t": 180.65247, "r": 430.08020000000005, "b": 189.97424, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "C", "bbox": {"l": 398.7807, "t": 192.98865, "r": 405.95587, "b": 202.31042000000002, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "C", "bbox": {"l": 410.90164, "t": 192.99487, "r": 418.07681, "b": 202.31664999999998, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "C", "bbox": {"l": 423.02753, "t": 192.909, "r": 430.2027, "b": 202.23077, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "C", "bbox": {"l": 398.78235, "t": 205.31573000000003, "r": 405.95752, "b": 214.63751000000002, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "C", "bbox": {"l": 410.90414, "t": 205.32196, "r": 418.07932, "b": 214.64373999999998, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "C", "bbox": {"l": 423.03003, "t": 205.23614999999995, "r": 430.20520000000005, "b": 214.55791999999997, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "C", "bbox": {"l": 386.50574, "t": 217.03882, "r": 393.68091, "b": 226.36059999999998, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "C", "bbox": {"l": 398.60181, "t": 217.21704, "r": 405.77698, "b": 226.53882, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "C", "bbox": {"l": 410.72275, "t": 217.22321, "r": 417.89792, "b": 226.54498, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "C", "bbox": {"l": 422.84869, "t": 217.13738999999998, "r": 430.02386, "b": 226.45916999999997, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "NL", "bbox": {"l": 435.16009999999994, "t": 167.69011999999998, "r": 447.86273, "b": 177.01189999999997, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "NL", "bbox": {"l": 435.44415, "t": 180.20025999999996, "r": 448.14679, "b": 189.52202999999997, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "NL", "bbox": {"l": 435.46735, "t": 192.49474999999995, "r": 448.16998000000007, "b": 201.81652999999994, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "NL", "bbox": {"l": 435.38202, "t": 204.83025999999995, "r": 448.08466, "b": 214.15204000000006, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "NL", "bbox": {"l": 435.59906, "t": 217.2337, "r": 448.3017, "b": 226.55548, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "U", "bbox": {"l": 374.14957, "t": 205.23492, "r": 381.32474, "b": 214.55669999999998, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "U", "bbox": {"l": 374.0419, "t": 217.14648, "r": 381.21707, "b": 226.46826, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "U", "bbox": {"l": 374.34418, "t": 180.93488000000002, "r": 381.51935, "b": 190.25665000000004, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "L", "bbox": {"l": 387.76285, "t": 168.57788000000005, "r": 393.28833, "b": 177.89966000000004, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "L", "bbox": {"l": 411.86395, "t": 168.06195000000002, "r": 417.38943, "b": 177.38373, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "L", "bbox": {"l": 423.33563, "t": 167.93439, "r": 428.86111, "b": 177.25616000000002, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "X", "bbox": {"l": 387.13593, "t": 180.78576999999996, "r": 393.76453, "b": 190.10753999999997, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "C", "bbox": {"l": 282.2594, "t": 244.50878999999998, "r": 289.43457, "b": 253.83056999999997, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "U", "bbox": {"l": 282.11035, "t": 256.85022000000004, "r": 289.28552, "b": 266.172, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "U", "bbox": {"l": 282.40848, "t": 269.13300000000004, "r": 289.58365, "b": 278.45477000000005, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "L", "bbox": {"l": 295.52902, "t": 244.49347, "r": 301.0545, "b": 253.81525, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "L", "bbox": {"l": 307.46613, "t": 244.57372999999995, "r": 312.99161, "b": 253.89550999999994, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "L", "bbox": {"l": 318.76886, "t": 244.44037000000003, "r": 324.29434, "b": 253.76215000000002, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "X", "bbox": {"l": 294.9021, "t": 256.70154, "r": 301.03976, "b": 266.02332, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "X X", "bbox": {"l": 307.17743, "t": 256.70154, "r": 325.59039, "b": 266.02332, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "X", "bbox": {"l": 294.78949, "t": 269.25420999999994, "r": 300.92715, "b": 278.57599000000005, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "X X", "bbox": {"l": 307.06482, "t": 269.25420999999994, "r": 325.47778, "b": 278.57599000000005, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "C", "bbox": {"l": 195.93939, "t": 268.74798999999996, "r": 203.11456, "b": 278.06976, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "L", "bbox": {"l": 209.20891, "t": 268.73267, "r": 214.73439, "b": 278.05444, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "L", "bbox": {"l": 221.14551, "t": 268.81293000000005, "r": 226.67099, "b": 278.13469999999995, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "L", "bbox": {"l": 232.44858, "t": 268.67957, "r": 237.97405999999998, "b": 278.00134, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "C", "bbox": {"l": 196.21715, "t": 244.53961000000004, "r": 203.39232, "b": 253.86139000000003, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "C", "bbox": {"l": 250.32143, "t": 244.09813999999994, "r": 257.49661, "b": 253.41992000000005, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "U", "bbox": {"l": 250.17235999999997, "t": 256.43951000000004, "r": 257.34753, "b": 265.76129000000003, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "U", "bbox": {"l": 250.47049000000004, "t": 268.72222999999997, "r": 257.64566, "b": 278.04400999999996, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "1", "bbox": {"l": 334.51135, "t": 242.99463000000003, "r": 337.22485, "b": 249.20911, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "- simple cells: \"C\"", "bbox": {"l": 339.93835, "t": 242.99463000000003, "r": 391.49472, "b": 249.20911, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "2", "bbox": {"l": 334.51135, "t": 252.93255999999997, "r": 337.33313, "b": 259.14703, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "- horizontal merges: \"C\", \"L\"", "bbox": {"l": 340.15491, "t": 252.93255999999997, "r": 421.98624, "b": 259.14703, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "3", "bbox": {"l": 334.51135, "t": 262.87048000000004, "r": 337.29868, "b": 269.08496, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "- vertical merges: \"C\", \"U\"", "bbox": {"l": 340.086, "t": 262.87048000000004, "r": 415.34375, "b": 269.08496, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "4", "bbox": {"l": 334.51135, "t": 272.80841, "r": 337.30188, "b": 279.02288999999996, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "- 2d merges: \"C\", \"L\", \"U\", \"X\"", "bbox": {"l": 340.09241, "t": 272.80841, "r": 426.59875, "b": 279.02288999999996, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "1", "bbox": {"l": 185.67178, "t": 244.04224, "r": 189.35544, "b": 250.25671, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "2", "bbox": {"l": 185.96759, "t": 268.34766, "r": 189.65125, "b": 274.56213, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "3", "bbox": {"l": 239.34152, "t": 243.62523999999996, "r": 243.02518, "b": 249.83972000000006, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "4", "bbox": {"l": 271.32852, "t": 243.49390000000005, "r": 275.01218, "b": 249.70836999999995, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "2", "bbox": {"l": 229.81627, "t": 166.51495, "r": 233.49992000000003, "b": 172.72942999999998, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "1", "bbox": {"l": 257.24402, "t": 189.961, "r": 260.92767, "b": 196.17548, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "3", "bbox": {"l": 186.87526, "t": 177.97668, "r": 190.55891, "b": 184.19115999999997, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "4", "bbox": {"l": 196.48746, "t": 169.01520000000005, "r": 200.17111, "b": 175.22968000000003, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "A", "bbox": {"l": 169.74728, "t": 167.88225999999997, "r": 175.72659, "b": 175.65039000000002, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "B", "bbox": {"l": 169.74728, "t": 206.83867999999995, "r": 175.72659, "b": 214.60681, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "C", "bbox": {"l": 274.29419, "t": 168.27972, "r": 280.2735, "b": 176.04785000000004, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "D", "bbox": {"l": 359.56152, "t": 168.27972, "r": 365.54083, "b": 176.04785000000004, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "E", "bbox": {"l": 169.74728, "t": 243.21149000000003, "r": 175.27112, "b": 250.97960999999998, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "4.2", "bbox": {"l": 134.765, "t": 305.29581, "r": 149.40205, "b": 314.10275, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "Language Syntax", "bbox": {"l": 160.85904, "t": 305.29581, "r": 246.65197999999998, "b": 314.10275, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "The OTSL representation follows these syntax rules:", "bbox": {"l": 134.765, "t": 325.24777, "r": 363.79617, "b": 334.04474, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "1.", "bbox": {"l": 138.97299, "t": 347.18079, "r": 146.71991, "b": 355.97775, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "Left-looking cell rule", "bbox": {"l": 151.70099, "t": 347.17081, "r": 257.37927, "b": 355.97775, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": ": The left neighbour of an \"L\" cell must be either", "bbox": {"l": 257.383, "t": 347.18079, "r": 480.58902, "b": 355.97775, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "another \"L\" cell or a \"C\" cell.", "bbox": {"l": 151.70099, "t": 359.13678, "r": 283.59387, "b": 367.93375, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "2.", "bbox": {"l": 138.97299, "t": 371.09479, "r": 146.71991, "b": 379.89175, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "Up-looking cell rule", "bbox": {"l": 151.70099, "t": 371.08481, "r": 252.11203, "b": 379.89175, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": ": The upper neighbour of a \"U\" cell must be either", "bbox": {"l": 252.112, "t": 371.09479, "r": 480.59229000000005, "b": 379.89175, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "another \"U\" cell or a \"C\" cell.", "bbox": {"l": 151.70099, "t": 383.04977, "r": 284.8392, "b": 391.84673999999995, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "3.", "bbox": {"l": 138.97299, "t": 395.0077800000001, "r": 146.71991, "b": 403.80475, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Cross cell rule", "bbox": {"l": 151.70099, "t": 394.99780000000004, "r": 223.3042, "b": 403.80475, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": ":", "bbox": {"l": 223.30699, "t": 395.0077800000001, "r": 226.07360999999997, "b": 403.80475, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "The left neighbour of an \"X\" cell must be either another \"X\" cell or a \"U\"", "bbox": {"l": 151.70099, "t": 406.96677, "r": 480.59238, "b": 415.76373, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "cell, and the upper neighbour of an \"X\" cell must be either another \"X\" cell", "bbox": {"l": 151.70099, "t": 418.9217499999999, "r": 480.59219, "b": 427.71871999999996, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "or an \"L\" cell.", "bbox": {"l": 151.70099, "t": 430.87674, "r": 214.39663999999996, "b": 439.67371, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "4.", "bbox": {"l": 138.97299, "t": 442.83572, "r": 146.71991, "b": 451.63269, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "First row rule", "bbox": {"l": 151.70099, "t": 442.82574, "r": 221.32263, "b": 451.63269, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": ": Only \"L\" cells and \"C\" cells are allowed in the first row.", "bbox": {"l": 221.32700000000003, "t": 442.83572, "r": 474.59018, "b": 451.63269, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "5.", "bbox": {"l": 138.97299, "t": 454.7937299999999, "r": 146.71991, "b": 463.5907, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "First column rule", "bbox": {"l": 151.70099, "t": 454.78375, "r": 240.71982, "b": 463.5907, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": ": Only \"U\" cells and \"C\" cells are allowed in the first", "bbox": {"l": 240.71599, "t": 454.7937299999999, "r": 480.58746, "b": 463.5907, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "column.", "bbox": {"l": 151.70099, "t": 466.74872, "r": 186.0072, "b": 475.54568, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "6.", "bbox": {"l": 138.97299, "t": 478.70673, "r": 146.71991, "b": 487.50369, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "Rectangular rule", "bbox": {"l": 151.70099, "t": 478.69675, "r": 235.15768, "b": 487.50369, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": ": The table representation is always rectangular - all rows", "bbox": {"l": 235.15697999999998, "t": 478.70673, "r": 480.59457, "b": 487.50369, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "must have an equal number of tokens, terminated with \"NL\" token.", "bbox": {"l": 151.70099, "t": 490.66272, "r": 448.04147, "b": 499.45969, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "The application of these rules gives OTSL a set of unique properties. First", "bbox": {"l": 149.70898, "t": 512.59271, "r": 480.59583, "b": 521.38968, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "of all, the OTSL enforces a strictly rectangular structure representation, where", "bbox": {"l": 134.76498, "t": 524.5477000000001, "r": 480.59079, "b": 533.34467, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "every new-line token starts a new row. As a consequence, all rows and all columns", "bbox": {"l": 134.76498, "t": 536.5027, "r": 480.59482, "b": 545.29967, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "have exactly the same number of tokens, irrespective of cell spans. Secondly, the", "bbox": {"l": 134.76498, "t": 548.4586899999999, "r": 480.58865000000003, "b": 557.25566, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "OTSL representation is unambiguous: Every table structure is represented in one", "bbox": {"l": 134.76498, "t": 560.4137000000001, "r": 480.59365999999994, "b": 569.21066, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "way. In this representation every table cell corresponds to a \"C\"-cell token, which", "bbox": {"l": 134.76498, "t": 572.3687, "r": 480.58673, "b": 581.16566, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "in case of spans is always located in the top-left corner of the table cell definition.", "bbox": {"l": 134.76498, "t": 584.3237, "r": 480.59171, "b": 593.12067, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "Third, OTSL syntax rules are only backward-looking. As a consequence, every", "bbox": {"l": 134.76498, "t": 596.2787, "r": 480.59180000000003, "b": 605.07567, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "predicted token can be validated straight during sequence generation by looking", "bbox": {"l": 134.76498, "t": 608.2347, "r": 480.5936899999999, "b": 617.03166, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "at the previously predicted sequence. As such, OTSL can guarantee that every", "bbox": {"l": 134.76498, "t": 620.1897, "r": 480.59072999999995, "b": 628.98666, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "predicted sequence is syntactically valid.", "bbox": {"l": 134.76498, "t": 632.1447000000001, "r": 311.19769, "b": 640.9416699999999, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "These characteristics can be easily learned by sequence generator networks,", "bbox": {"l": 149.70898, "t": 644.1026899999999, "r": 480.59186, "b": 652.89966, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "as we demonstrate further below. We find strong indications that this pattern", "bbox": {"l": 134.76498, "t": 656.05769, "r": 480.59265, "b": 664.8546699999999, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 7, "label": "page_header", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9326512813568115, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "page_header", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8749732971191406, "cells": [{"id": 1, "text": "7", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "caption", "bbox": {"l": 134.765, "t": 125.79918999999984, "r": 480.5874, "b": 155.84966999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9333082437515259, "cells": [{"id": 2, "text": "Fig. 3.", "bbox": {"l": 134.765, "t": 125.79918999999984, "r": 162.64424, "b": 133.72551999999996, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "OTSL description of table structure: A - table example; B - graphical repre-", "bbox": {"l": 166.276, "t": 125.86200000000008, "r": 480.58675999999997, "b": 133.93169999999998, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "sentation of table structure; C - mapping structure on a grid; D - OTSL structure", "bbox": {"l": 134.765, "t": 136.82097999999996, "r": 480.5874, "b": 144.89068999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "encoding; E - explanation on cell encoding", "bbox": {"l": 134.765, "t": 147.77997000000005, "r": 306.1156, "b": 155.84966999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "picture", "bbox": {"l": 164.65028381347656, "t": 163.79708862304688, "r": 449.5505676269531, "b": 280.3409423828125, "coord_origin": "TOPLEFT"}, "confidence": 0.7868534922599792, "cells": [{"id": 6, "text": "C", "bbox": {"l": 374.49326, "t": 168.59362999999996, "r": 381.66843, "b": 177.91540999999995, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "C", "bbox": {"l": 398.74011, "t": 168.50005999999996, "r": 405.91528, "b": 177.82183999999995, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "C", "bbox": {"l": 373.76862, "t": 192.92553999999996, "r": 380.94379, "b": 202.24730999999997, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "C", "bbox": {"l": 386.66388, "t": 193.07061999999996, "r": 393.83905, "b": 202.39239999999995, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "C", "bbox": {"l": 386.68707, "t": 205.13756999999998, "r": 393.86224, "b": 214.45934999999997, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "C", "bbox": {"l": 398.65729, "t": 180.73279000000002, "r": 405.83246, "b": 190.05457, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "C", "bbox": {"l": 410.77908, "t": 180.73859000000004, "r": 417.95425, "b": 190.06035999999995, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "C", "bbox": {"l": 422.90503, "t": 180.65247, "r": 430.08020000000005, "b": 189.97424, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "C", "bbox": {"l": 398.7807, "t": 192.98865, "r": 405.95587, "b": 202.31042000000002, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "C", "bbox": {"l": 410.90164, "t": 192.99487, "r": 418.07681, "b": 202.31664999999998, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "C", "bbox": {"l": 423.02753, "t": 192.909, "r": 430.2027, "b": 202.23077, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "C", "bbox": {"l": 398.78235, "t": 205.31573000000003, "r": 405.95752, "b": 214.63751000000002, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "C", "bbox": {"l": 410.90414, "t": 205.32196, "r": 418.07932, "b": 214.64373999999998, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "C", "bbox": {"l": 423.03003, "t": 205.23614999999995, "r": 430.20520000000005, "b": 214.55791999999997, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "C", "bbox": {"l": 386.50574, "t": 217.03882, "r": 393.68091, "b": 226.36059999999998, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "C", "bbox": {"l": 398.60181, "t": 217.21704, "r": 405.77698, "b": 226.53882, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "C", "bbox": {"l": 410.72275, "t": 217.22321, "r": 417.89792, "b": 226.54498, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "C", "bbox": {"l": 422.84869, "t": 217.13738999999998, "r": 430.02386, "b": 226.45916999999997, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "NL", "bbox": {"l": 435.16009999999994, "t": 167.69011999999998, "r": 447.86273, "b": 177.01189999999997, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "NL", "bbox": {"l": 435.44415, "t": 180.20025999999996, "r": 448.14679, "b": 189.52202999999997, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "NL", "bbox": {"l": 435.46735, "t": 192.49474999999995, "r": 448.16998000000007, "b": 201.81652999999994, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "NL", "bbox": {"l": 435.38202, "t": 204.83025999999995, "r": 448.08466, "b": 214.15204000000006, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "NL", "bbox": {"l": 435.59906, "t": 217.2337, "r": 448.3017, "b": 226.55548, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "U", "bbox": {"l": 374.14957, "t": 205.23492, "r": 381.32474, "b": 214.55669999999998, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "U", "bbox": {"l": 374.0419, "t": 217.14648, "r": 381.21707, "b": 226.46826, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "U", "bbox": {"l": 374.34418, "t": 180.93488000000002, "r": 381.51935, "b": 190.25665000000004, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "L", "bbox": {"l": 387.76285, "t": 168.57788000000005, "r": 393.28833, "b": 177.89966000000004, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "L", "bbox": {"l": 411.86395, "t": 168.06195000000002, "r": 417.38943, "b": 177.38373, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "L", "bbox": {"l": 423.33563, "t": 167.93439, "r": 428.86111, "b": 177.25616000000002, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "X", "bbox": {"l": 387.13593, "t": 180.78576999999996, "r": 393.76453, "b": 190.10753999999997, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "C", "bbox": {"l": 282.2594, "t": 244.50878999999998, "r": 289.43457, "b": 253.83056999999997, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "U", "bbox": {"l": 282.11035, "t": 256.85022000000004, "r": 289.28552, "b": 266.172, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "U", "bbox": {"l": 282.40848, "t": 269.13300000000004, "r": 289.58365, "b": 278.45477000000005, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "L", "bbox": {"l": 295.52902, "t": 244.49347, "r": 301.0545, "b": 253.81525, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "L", "bbox": {"l": 307.46613, "t": 244.57372999999995, "r": 312.99161, "b": 253.89550999999994, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "L", "bbox": {"l": 318.76886, "t": 244.44037000000003, "r": 324.29434, "b": 253.76215000000002, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "X", "bbox": {"l": 294.9021, "t": 256.70154, "r": 301.03976, "b": 266.02332, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "X X", "bbox": {"l": 307.17743, "t": 256.70154, "r": 325.59039, "b": 266.02332, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "X", "bbox": {"l": 294.78949, "t": 269.25420999999994, "r": 300.92715, "b": 278.57599000000005, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "X X", "bbox": {"l": 307.06482, "t": 269.25420999999994, "r": 325.47778, "b": 278.57599000000005, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "C", "bbox": {"l": 195.93939, "t": 268.74798999999996, "r": 203.11456, "b": 278.06976, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "L", "bbox": {"l": 209.20891, "t": 268.73267, "r": 214.73439, "b": 278.05444, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "L", "bbox": {"l": 221.14551, "t": 268.81293000000005, "r": 226.67099, "b": 278.13469999999995, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "L", "bbox": {"l": 232.44858, "t": 268.67957, "r": 237.97405999999998, "b": 278.00134, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "C", "bbox": {"l": 196.21715, "t": 244.53961000000004, "r": 203.39232, "b": 253.86139000000003, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "C", "bbox": {"l": 250.32143, "t": 244.09813999999994, "r": 257.49661, "b": 253.41992000000005, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "U", "bbox": {"l": 250.17235999999997, "t": 256.43951000000004, "r": 257.34753, "b": 265.76129000000003, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "U", "bbox": {"l": 250.47049000000004, "t": 268.72222999999997, "r": 257.64566, "b": 278.04400999999996, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "1", "bbox": {"l": 334.51135, "t": 242.99463000000003, "r": 337.22485, "b": 249.20911, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "- simple cells: \"C\"", "bbox": {"l": 339.93835, "t": 242.99463000000003, "r": 391.49472, "b": 249.20911, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "2", "bbox": {"l": 334.51135, "t": 252.93255999999997, "r": 337.33313, "b": 259.14703, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "- horizontal merges: \"C\", \"L\"", "bbox": {"l": 340.15491, "t": 252.93255999999997, "r": 421.98624, "b": 259.14703, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "3", "bbox": {"l": 334.51135, "t": 262.87048000000004, "r": 337.29868, "b": 269.08496, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "- vertical merges: \"C\", \"U\"", "bbox": {"l": 340.086, "t": 262.87048000000004, "r": 415.34375, "b": 269.08496, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "4", "bbox": {"l": 334.51135, "t": 272.80841, "r": 337.30188, "b": 279.02288999999996, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "- 2d merges: \"C\", \"L\", \"U\", \"X\"", "bbox": {"l": 340.09241, "t": 272.80841, "r": 426.59875, "b": 279.02288999999996, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "1", "bbox": {"l": 185.67178, "t": 244.04224, "r": 189.35544, "b": 250.25671, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "2", "bbox": {"l": 185.96759, "t": 268.34766, "r": 189.65125, "b": 274.56213, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "3", "bbox": {"l": 239.34152, "t": 243.62523999999996, "r": 243.02518, "b": 249.83972000000006, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "4", "bbox": {"l": 271.32852, "t": 243.49390000000005, "r": 275.01218, "b": 249.70836999999995, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "2", "bbox": {"l": 229.81627, "t": 166.51495, "r": 233.49992000000003, "b": 172.72942999999998, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "1", "bbox": {"l": 257.24402, "t": 189.961, "r": 260.92767, "b": 196.17548, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "3", "bbox": {"l": 186.87526, "t": 177.97668, "r": 190.55891, "b": 184.19115999999997, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "4", "bbox": {"l": 196.48746, "t": 169.01520000000005, "r": 200.17111, "b": 175.22968000000003, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "A", "bbox": {"l": 169.74728, "t": 167.88225999999997, "r": 175.72659, "b": 175.65039000000002, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "B", "bbox": {"l": 169.74728, "t": 206.83867999999995, "r": 175.72659, "b": 214.60681, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "C", "bbox": {"l": 274.29419, "t": 168.27972, "r": 280.2735, "b": 176.04785000000004, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "D", "bbox": {"l": 359.56152, "t": 168.27972, "r": 365.54083, "b": 176.04785000000004, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "E", "bbox": {"l": 169.74728, "t": 243.21149000000003, "r": 175.27112, "b": 250.97960999999998, "coord_origin": "TOPLEFT"}}], "children": [{"id": 19, "label": "text", "bbox": {"l": 374.49326, "t": 168.59362999999996, "r": 381.66843, "b": 177.91540999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": "C", "bbox": {"l": 374.49326, "t": 168.59362999999996, "r": 381.66843, "b": 177.91540999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 398.74011, "t": 168.50005999999996, "r": 405.91528, "b": 177.82183999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "C", "bbox": {"l": 398.74011, "t": 168.50005999999996, "r": 405.91528, "b": 177.82183999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 373.76862, "t": 192.92553999999996, "r": 380.94379, "b": 202.24730999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "C", "bbox": {"l": 373.76862, "t": 192.92553999999996, "r": 380.94379, "b": 202.24730999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 386.66388, "t": 193.07061999999996, "r": 393.83905, "b": 202.39239999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "C", "bbox": {"l": 386.66388, "t": 193.07061999999996, "r": 393.83905, "b": 202.39239999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 386.68707, "t": 205.13756999999998, "r": 393.86224, "b": 214.45934999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "C", "bbox": {"l": 386.68707, "t": 205.13756999999998, "r": 393.86224, "b": 214.45934999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 398.65729, "t": 180.73279000000002, "r": 405.83246, "b": 190.05457, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "C", "bbox": {"l": 398.65729, "t": 180.73279000000002, "r": 405.83246, "b": 190.05457, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 410.77908, "t": 180.73859000000004, "r": 417.95425, "b": 190.06035999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "C", "bbox": {"l": 410.77908, "t": 180.73859000000004, "r": 417.95425, "b": 190.06035999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 422.90503, "t": 180.65247, "r": 430.08020000000005, "b": 189.97424, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "C", "bbox": {"l": 422.90503, "t": 180.65247, "r": 430.08020000000005, "b": 189.97424, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 398.7807, "t": 192.98865, "r": 405.95587, "b": 202.31042000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "C", "bbox": {"l": 398.7807, "t": 192.98865, "r": 405.95587, "b": 202.31042000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 410.90164, "t": 192.99487, "r": 418.07681, "b": 202.31664999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "C", "bbox": {"l": 410.90164, "t": 192.99487, "r": 418.07681, "b": 202.31664999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 423.02753, "t": 192.909, "r": 430.2027, "b": 202.23077, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "C", "bbox": {"l": 423.02753, "t": 192.909, "r": 430.2027, "b": 202.23077, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 398.78235, "t": 205.31573000000003, "r": 405.95752, "b": 214.63751000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "C", "bbox": {"l": 398.78235, "t": 205.31573000000003, "r": 405.95752, "b": 214.63751000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 410.90414, "t": 205.32196, "r": 418.07932, "b": 214.64373999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "C", "bbox": {"l": 410.90414, "t": 205.32196, "r": 418.07932, "b": 214.64373999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 423.03003, "t": 205.23614999999995, "r": 430.20520000000005, "b": 214.55791999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "C", "bbox": {"l": 423.03003, "t": 205.23614999999995, "r": 430.20520000000005, "b": 214.55791999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 386.50574, "t": 217.03882, "r": 393.68091, "b": 226.36059999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "C", "bbox": {"l": 386.50574, "t": 217.03882, "r": 393.68091, "b": 226.36059999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 398.60181, "t": 217.21704, "r": 405.77698, "b": 226.53882, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "C", "bbox": {"l": 398.60181, "t": 217.21704, "r": 405.77698, "b": 226.53882, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 410.72275, "t": 217.22321, "r": 417.89792, "b": 226.54498, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "C", "bbox": {"l": 410.72275, "t": 217.22321, "r": 417.89792, "b": 226.54498, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 422.84869, "t": 217.13738999999998, "r": 430.02386, "b": 226.45916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "C", "bbox": {"l": 422.84869, "t": 217.13738999999998, "r": 430.02386, "b": 226.45916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 435.16009999999994, "t": 167.69011999999998, "r": 447.86273, "b": 177.01189999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "NL", "bbox": {"l": 435.16009999999994, "t": 167.69011999999998, "r": 447.86273, "b": 177.01189999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 435.44415, "t": 180.20025999999996, "r": 448.14679, "b": 189.52202999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "NL", "bbox": {"l": 435.44415, "t": 180.20025999999996, "r": 448.14679, "b": 189.52202999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 435.46735, "t": 192.49474999999995, "r": 448.16998000000007, "b": 201.81652999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "NL", "bbox": {"l": 435.46735, "t": 192.49474999999995, "r": 448.16998000000007, "b": 201.81652999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 435.38202, "t": 204.83025999999995, "r": 448.08466, "b": 214.15204000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "NL", "bbox": {"l": 435.38202, "t": 204.83025999999995, "r": 448.08466, "b": 214.15204000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 435.59906, "t": 217.2337, "r": 448.3017, "b": 226.55548, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "NL", "bbox": {"l": 435.59906, "t": 217.2337, "r": 448.3017, "b": 226.55548, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 374.14957, "t": 205.23492, "r": 381.32474, "b": 214.55669999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "U", "bbox": {"l": 374.14957, "t": 205.23492, "r": 381.32474, "b": 214.55669999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 374.0419, "t": 217.14648, "r": 381.21707, "b": 226.46826, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "U", "bbox": {"l": 374.0419, "t": 217.14648, "r": 381.21707, "b": 226.46826, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 374.34418, "t": 180.93488000000002, "r": 381.51935, "b": 190.25665000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "U", "bbox": {"l": 374.34418, "t": 180.93488000000002, "r": 381.51935, "b": 190.25665000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 387.76285, "t": 168.57788000000005, "r": 393.28833, "b": 177.89966000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "L", "bbox": {"l": 387.76285, "t": 168.57788000000005, "r": 393.28833, "b": 177.89966000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 411.86395, "t": 168.06195000000002, "r": 417.38943, "b": 177.38373, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "L", "bbox": {"l": 411.86395, "t": 168.06195000000002, "r": 417.38943, "b": 177.38373, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 423.33563, "t": 167.93439, "r": 428.86111, "b": 177.25616000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "L", "bbox": {"l": 423.33563, "t": 167.93439, "r": 428.86111, "b": 177.25616000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 387.13593, "t": 180.78576999999996, "r": 393.76453, "b": 190.10753999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "X", "bbox": {"l": 387.13593, "t": 180.78576999999996, "r": 393.76453, "b": 190.10753999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 282.2594, "t": 244.50878999999998, "r": 289.43457, "b": 253.83056999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "C", "bbox": {"l": 282.2594, "t": 244.50878999999998, "r": 289.43457, "b": 253.83056999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 282.11035, "t": 256.85022000000004, "r": 289.28552, "b": 266.172, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "U", "bbox": {"l": 282.11035, "t": 256.85022000000004, "r": 289.28552, "b": 266.172, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 282.40848, "t": 269.13300000000004, "r": 289.58365, "b": 278.45477000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "U", "bbox": {"l": 282.40848, "t": 269.13300000000004, "r": 289.58365, "b": 278.45477000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 295.52902, "t": 244.49347, "r": 301.0545, "b": 253.81525, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "L", "bbox": {"l": 295.52902, "t": 244.49347, "r": 301.0545, "b": 253.81525, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 307.46613, "t": 244.57372999999995, "r": 312.99161, "b": 253.89550999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "L", "bbox": {"l": 307.46613, "t": 244.57372999999995, "r": 312.99161, "b": 253.89550999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 318.76886, "t": 244.44037000000003, "r": 324.29434, "b": 253.76215000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "L", "bbox": {"l": 318.76886, "t": 244.44037000000003, "r": 324.29434, "b": 253.76215000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 294.9021, "t": 256.70154, "r": 301.03976, "b": 266.02332, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "X", "bbox": {"l": 294.9021, "t": 256.70154, "r": 301.03976, "b": 266.02332, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 307.17743, "t": 256.70154, "r": 325.59039, "b": 266.02332, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "X X", "bbox": {"l": 307.17743, "t": 256.70154, "r": 325.59039, "b": 266.02332, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 294.78949, "t": 269.25420999999994, "r": 300.92715, "b": 278.57599000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "X", "bbox": {"l": 294.78949, "t": 269.25420999999994, "r": 300.92715, "b": 278.57599000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 307.06482, "t": 269.25420999999994, "r": 325.47778, "b": 278.57599000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "X X", "bbox": {"l": 307.06482, "t": 269.25420999999994, "r": 325.47778, "b": 278.57599000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 195.93939, "t": 268.74798999999996, "r": 203.11456, "b": 278.06976, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "C", "bbox": {"l": 195.93939, "t": 268.74798999999996, "r": 203.11456, "b": 278.06976, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 209.20891, "t": 268.73267, "r": 214.73439, "b": 278.05444, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "L", "bbox": {"l": 209.20891, "t": 268.73267, "r": 214.73439, "b": 278.05444, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 221.14551, "t": 268.81293000000005, "r": 226.67099, "b": 278.13469999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "L", "bbox": {"l": 221.14551, "t": 268.81293000000005, "r": 226.67099, "b": 278.13469999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 232.44858, "t": 268.67957, "r": 237.97405999999998, "b": 278.00134, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "L", "bbox": {"l": 232.44858, "t": 268.67957, "r": 237.97405999999998, "b": 278.00134, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 196.21715, "t": 244.53961000000004, "r": 203.39232, "b": 253.86139000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "C", "bbox": {"l": 196.21715, "t": 244.53961000000004, "r": 203.39232, "b": 253.86139000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 250.32143, "t": 244.09813999999994, "r": 257.49661, "b": 253.41992000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "C", "bbox": {"l": 250.32143, "t": 244.09813999999994, "r": 257.49661, "b": 253.41992000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 250.17235999999997, "t": 256.43951000000004, "r": 257.34753, "b": 265.76129000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "U", "bbox": {"l": 250.17235999999997, "t": 256.43951000000004, "r": 257.34753, "b": 265.76129000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 250.47049000000004, "t": 268.72222999999997, "r": 257.64566, "b": 278.04400999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "U", "bbox": {"l": 250.47049000000004, "t": 268.72222999999997, "r": 257.64566, "b": 278.04400999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 334.51135, "t": 242.99463000000003, "r": 337.22485, "b": 249.20911, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "1", "bbox": {"l": 334.51135, "t": 242.99463000000003, "r": 337.22485, "b": 249.20911, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 339.93835, "t": 242.99463000000003, "r": 391.49472, "b": 249.20911, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "- simple cells: \"C\"", "bbox": {"l": 339.93835, "t": 242.99463000000003, "r": 391.49472, "b": 249.20911, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 334.51135, "t": 252.93255999999997, "r": 337.33313, "b": 259.14703, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "2", "bbox": {"l": 334.51135, "t": 252.93255999999997, "r": 337.33313, "b": 259.14703, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 340.15491, "t": 252.93255999999997, "r": 421.98624, "b": 259.14703, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "- horizontal merges: \"C\", \"L\"", "bbox": {"l": 340.15491, "t": 252.93255999999997, "r": 421.98624, "b": 259.14703, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 334.51135, "t": 262.87048000000004, "r": 337.29868, "b": 269.08496, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "3", "bbox": {"l": 334.51135, "t": 262.87048000000004, "r": 337.29868, "b": 269.08496, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 340.086, "t": 262.87048000000004, "r": 415.34375, "b": 269.08496, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "- vertical merges: \"C\", \"U\"", "bbox": {"l": 340.086, "t": 262.87048000000004, "r": 415.34375, "b": 269.08496, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "list_item", "bbox": {"l": 334.51135, "t": 272.80841, "r": 426.59875, "b": 279.02288999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.5250620245933533, "cells": [{"id": 60, "text": "4", "bbox": {"l": 334.51135, "t": 272.80841, "r": 337.30188, "b": 279.02288999999996, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "- 2d merges: \"C\", \"L\", \"U\", \"X\"", "bbox": {"l": 340.09241, "t": 272.80841, "r": 426.59875, "b": 279.02288999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 185.67178, "t": 244.04224, "r": 189.35544, "b": 250.25671, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "1", "bbox": {"l": 185.67178, "t": 244.04224, "r": 189.35544, "b": 250.25671, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 185.96759, "t": 268.34766, "r": 189.65125, "b": 274.56213, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "2", "bbox": {"l": 185.96759, "t": 268.34766, "r": 189.65125, "b": 274.56213, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 239.34152, "t": 243.62523999999996, "r": 243.02518, "b": 249.83972000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "3", "bbox": {"l": 239.34152, "t": 243.62523999999996, "r": 243.02518, "b": 249.83972000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 271.32852, "t": 243.49390000000005, "r": 275.01218, "b": 249.70836999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "4", "bbox": {"l": 271.32852, "t": 243.49390000000005, "r": 275.01218, "b": 249.70836999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 229.81627, "t": 166.51495, "r": 233.49992000000003, "b": 172.72942999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "2", "bbox": {"l": 229.81627, "t": 166.51495, "r": 233.49992000000003, "b": 172.72942999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 257.24402, "t": 189.961, "r": 260.92767, "b": 196.17548, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "1", "bbox": {"l": 257.24402, "t": 189.961, "r": 260.92767, "b": 196.17548, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 186.87526, "t": 177.97668, "r": 190.55891, "b": 184.19115999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "3", "bbox": {"l": 186.87526, "t": 177.97668, "r": 190.55891, "b": 184.19115999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 196.48746, "t": 169.01520000000005, "r": 200.17111, "b": 175.22968000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "4", "bbox": {"l": 196.48746, "t": 169.01520000000005, "r": 200.17111, "b": 175.22968000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 169.74728, "t": 167.88225999999997, "r": 175.72659, "b": 175.65039000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "A", "bbox": {"l": 169.74728, "t": 167.88225999999997, "r": 175.72659, "b": 175.65039000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 169.74728, "t": 206.83867999999995, "r": 175.72659, "b": 214.60681, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "B", "bbox": {"l": 169.74728, "t": 206.83867999999995, "r": 175.72659, "b": 214.60681, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 274.29419, "t": 168.27972, "r": 280.2735, "b": 176.04785000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "C", "bbox": {"l": 274.29419, "t": 168.27972, "r": 280.2735, "b": 176.04785000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 359.56152, "t": 168.27972, "r": 365.54083, "b": 176.04785000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "D", "bbox": {"l": 359.56152, "t": 168.27972, "r": 365.54083, "b": 176.04785000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 169.74728, "t": 243.21149000000003, "r": 175.27112, "b": 250.97960999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "E", "bbox": {"l": 169.74728, "t": 243.21149000000003, "r": 175.27112, "b": 250.97960999999998, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 9, "label": "section_header", "bbox": {"l": 134.765, "t": 305.29581, "r": 246.65197999999998, "b": 314.10275, "coord_origin": "TOPLEFT"}, "confidence": 0.923302412033081, "cells": [{"id": 75, "text": "4.2", "bbox": {"l": 134.765, "t": 305.29581, "r": 149.40205, "b": 314.10275, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "Language Syntax", "bbox": {"l": 160.85904, "t": 305.29581, "r": 246.65197999999998, "b": 314.10275, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "text", "bbox": {"l": 134.765, "t": 325.24777, "r": 363.79617, "b": 334.04474, "coord_origin": "TOPLEFT"}, "confidence": 0.9169169068336487, "cells": [{"id": 77, "text": "The OTSL representation follows these syntax rules:", "bbox": {"l": 134.765, "t": 325.24777, "r": 363.79617, "b": 334.04474, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "list_item", "bbox": {"l": 138.97299, "t": 347.17081, "r": 480.58902, "b": 367.93375, "coord_origin": "TOPLEFT"}, "confidence": 0.958811342716217, "cells": [{"id": 78, "text": "1.", "bbox": {"l": 138.97299, "t": 347.18079, "r": 146.71991, "b": 355.97775, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "Left-looking cell rule", "bbox": {"l": 151.70099, "t": 347.17081, "r": 257.37927, "b": 355.97775, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": ": The left neighbour of an \"L\" cell must be either", "bbox": {"l": 257.383, "t": 347.18079, "r": 480.58902, "b": 355.97775, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "another \"L\" cell or a \"C\" cell.", "bbox": {"l": 151.70099, "t": 359.13678, "r": 283.59387, "b": 367.93375, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "list_item", "bbox": {"l": 138.97299, "t": 371.08481, "r": 480.59229000000005, "b": 391.84673999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9585386514663696, "cells": [{"id": 82, "text": "2.", "bbox": {"l": 138.97299, "t": 371.09479, "r": 146.71991, "b": 379.89175, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "Up-looking cell rule", "bbox": {"l": 151.70099, "t": 371.08481, "r": 252.11203, "b": 379.89175, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": ": The upper neighbour of a \"U\" cell must be either", "bbox": {"l": 252.112, "t": 371.09479, "r": 480.59229000000005, "b": 379.89175, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "another \"U\" cell or a \"C\" cell.", "bbox": {"l": 151.70099, "t": 383.04977, "r": 284.8392, "b": 391.84673999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "section_header", "bbox": {"l": 138.97299, "t": 394.99780000000004, "r": 226.07360999999997, "b": 403.80475, "coord_origin": "TOPLEFT"}, "confidence": 0.6506174802780151, "cells": [{"id": 86, "text": "3.", "bbox": {"l": 138.97299, "t": 395.0077800000001, "r": 146.71991, "b": 403.80475, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Cross cell rule", "bbox": {"l": 151.70099, "t": 394.99780000000004, "r": 223.3042, "b": 403.80475, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": ":", "bbox": {"l": 223.30699, "t": 395.0077800000001, "r": 226.07360999999997, "b": 403.80475, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "list_item", "bbox": {"l": 151.70099, "t": 406.96677, "r": 480.59238, "b": 439.67371, "coord_origin": "TOPLEFT"}, "confidence": 0.7247233390808105, "cells": [{"id": 89, "text": "The left neighbour of an \"X\" cell must be either another \"X\" cell or a \"U\"", "bbox": {"l": 151.70099, "t": 406.96677, "r": 480.59238, "b": 415.76373, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "cell, and the upper neighbour of an \"X\" cell must be either another \"X\" cell", "bbox": {"l": 151.70099, "t": 418.9217499999999, "r": 480.59219, "b": 427.71871999999996, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "or an \"L\" cell.", "bbox": {"l": 151.70099, "t": 430.87674, "r": 214.39663999999996, "b": 439.67371, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "list_item", "bbox": {"l": 138.97299, "t": 442.82574, "r": 474.59018, "b": 451.63269, "coord_origin": "TOPLEFT"}, "confidence": 0.9259927272796631, "cells": [{"id": 92, "text": "4.", "bbox": {"l": 138.97299, "t": 442.83572, "r": 146.71991, "b": 451.63269, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "First row rule", "bbox": {"l": 151.70099, "t": 442.82574, "r": 221.32263, "b": 451.63269, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": ": Only \"L\" cells and \"C\" cells are allowed in the first row.", "bbox": {"l": 221.32700000000003, "t": 442.83572, "r": 474.59018, "b": 451.63269, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "list_item", "bbox": {"l": 138.97299, "t": 454.78375, "r": 480.58746, "b": 475.54568, "coord_origin": "TOPLEFT"}, "confidence": 0.9420597553253174, "cells": [{"id": 95, "text": "5.", "bbox": {"l": 138.97299, "t": 454.7937299999999, "r": 146.71991, "b": 463.5907, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "First column rule", "bbox": {"l": 151.70099, "t": 454.78375, "r": 240.71982, "b": 463.5907, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": ": Only \"U\" cells and \"C\" cells are allowed in the first", "bbox": {"l": 240.71599, "t": 454.7937299999999, "r": 480.58746, "b": 463.5907, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "column.", "bbox": {"l": 151.70099, "t": 466.74872, "r": 186.0072, "b": 475.54568, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "list_item", "bbox": {"l": 138.97299, "t": 478.69675, "r": 480.59457, "b": 499.45969, "coord_origin": "TOPLEFT"}, "confidence": 0.961783230304718, "cells": [{"id": 99, "text": "6.", "bbox": {"l": 138.97299, "t": 478.70673, "r": 146.71991, "b": 487.50369, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "Rectangular rule", "bbox": {"l": 151.70099, "t": 478.69675, "r": 235.15768, "b": 487.50369, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": ": The table representation is always rectangular - all rows", "bbox": {"l": 235.15697999999998, "t": 478.70673, "r": 480.59457, "b": 487.50369, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "must have an equal number of tokens, terminated with \"NL\" token.", "bbox": {"l": 151.70099, "t": 490.66272, "r": 448.04147, "b": 499.45969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 134.76498, "t": 512.59271, "r": 480.59583, "b": 640.9416699999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9785562753677368, "cells": [{"id": 103, "text": "The application of these rules gives OTSL a set of unique properties. First", "bbox": {"l": 149.70898, "t": 512.59271, "r": 480.59583, "b": 521.38968, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "of all, the OTSL enforces a strictly rectangular structure representation, where", "bbox": {"l": 134.76498, "t": 524.5477000000001, "r": 480.59079, "b": 533.34467, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "every new-line token starts a new row. As a consequence, all rows and all columns", "bbox": {"l": 134.76498, "t": 536.5027, "r": 480.59482, "b": 545.29967, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "have exactly the same number of tokens, irrespective of cell spans. Secondly, the", "bbox": {"l": 134.76498, "t": 548.4586899999999, "r": 480.58865000000003, "b": 557.25566, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "OTSL representation is unambiguous: Every table structure is represented in one", "bbox": {"l": 134.76498, "t": 560.4137000000001, "r": 480.59365999999994, "b": 569.21066, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "way. In this representation every table cell corresponds to a \"C\"-cell token, which", "bbox": {"l": 134.76498, "t": 572.3687, "r": 480.58673, "b": 581.16566, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "in case of spans is always located in the top-left corner of the table cell definition.", "bbox": {"l": 134.76498, "t": 584.3237, "r": 480.59171, "b": 593.12067, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "Third, OTSL syntax rules are only backward-looking. As a consequence, every", "bbox": {"l": 134.76498, "t": 596.2787, "r": 480.59180000000003, "b": 605.07567, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "predicted token can be validated straight during sequence generation by looking", "bbox": {"l": 134.76498, "t": 608.2347, "r": 480.5936899999999, "b": 617.03166, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "at the previously predicted sequence. As such, OTSL can guarantee that every", "bbox": {"l": 134.76498, "t": 620.1897, "r": 480.59072999999995, "b": 628.98666, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "predicted sequence is syntactically valid.", "bbox": {"l": 134.76498, "t": 632.1447000000001, "r": 311.19769, "b": 640.9416699999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 134.76498, "t": 644.1026899999999, "r": 480.59265, "b": 664.8546699999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9590610861778259, "cells": [{"id": 114, "text": "These characteristics can be easily learned by sequence generator networks,", "bbox": {"l": 149.70898, "t": 644.1026899999999, "r": 480.59186, "b": 652.89966, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "as we demonstrate further below. We find strong indications that this pattern", "bbox": {"l": 134.76498, "t": 656.05769, "r": 480.59265, "b": 664.8546699999999, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_header", "id": 7, "page_no": 6, "cluster": {"id": 7, "label": "page_header", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9326512813568115, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Optimized Table Tokenization for Table Structure Recognition"}, {"label": "page_header", "id": 11, "page_no": 6, "cluster": {"id": 11, "label": "page_header", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8749732971191406, "cells": [{"id": 1, "text": "7", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "7"}, {"label": "caption", "id": 6, "page_no": 6, "cluster": {"id": 6, "label": "caption", "bbox": {"l": 134.765, "t": 125.79918999999984, "r": 480.5874, "b": 155.84966999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9333082437515259, "cells": [{"id": 2, "text": "Fig. 3.", "bbox": {"l": 134.765, "t": 125.79918999999984, "r": 162.64424, "b": 133.72551999999996, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "OTSL description of table structure: A - table example; B - graphical repre-", "bbox": {"l": 166.276, "t": 125.86200000000008, "r": 480.58675999999997, "b": 133.93169999999998, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "sentation of table structure; C - mapping structure on a grid; D - OTSL structure", "bbox": {"l": 134.765, "t": 136.82097999999996, "r": 480.5874, "b": 144.89068999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "encoding; E - explanation on cell encoding", "bbox": {"l": 134.765, "t": 147.77997000000005, "r": 306.1156, "b": 155.84966999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Fig. 3. OTSL description of table structure: A - table example; B - graphical representation of table structure; C - mapping structure on a grid; D - OTSL structure encoding; E - explanation on cell encoding"}, {"label": "picture", "id": 12, "page_no": 6, "cluster": {"id": 12, "label": "picture", "bbox": {"l": 164.65028381347656, "t": 163.79708862304688, "r": 449.5505676269531, "b": 280.3409423828125, "coord_origin": "TOPLEFT"}, "confidence": 0.7868534922599792, "cells": [{"id": 6, "text": "C", "bbox": {"l": 374.49326, "t": 168.59362999999996, "r": 381.66843, "b": 177.91540999999995, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "C", "bbox": {"l": 398.74011, "t": 168.50005999999996, "r": 405.91528, "b": 177.82183999999995, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "C", "bbox": {"l": 373.76862, "t": 192.92553999999996, "r": 380.94379, "b": 202.24730999999997, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "C", "bbox": {"l": 386.66388, "t": 193.07061999999996, "r": 393.83905, "b": 202.39239999999995, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "C", "bbox": {"l": 386.68707, "t": 205.13756999999998, "r": 393.86224, "b": 214.45934999999997, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "C", "bbox": {"l": 398.65729, "t": 180.73279000000002, "r": 405.83246, "b": 190.05457, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "C", "bbox": {"l": 410.77908, "t": 180.73859000000004, "r": 417.95425, "b": 190.06035999999995, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "C", "bbox": {"l": 422.90503, "t": 180.65247, "r": 430.08020000000005, "b": 189.97424, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "C", "bbox": {"l": 398.7807, "t": 192.98865, "r": 405.95587, "b": 202.31042000000002, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "C", "bbox": {"l": 410.90164, "t": 192.99487, "r": 418.07681, "b": 202.31664999999998, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "C", "bbox": {"l": 423.02753, "t": 192.909, "r": 430.2027, "b": 202.23077, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "C", "bbox": {"l": 398.78235, "t": 205.31573000000003, "r": 405.95752, "b": 214.63751000000002, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "C", "bbox": {"l": 410.90414, "t": 205.32196, "r": 418.07932, "b": 214.64373999999998, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "C", "bbox": {"l": 423.03003, "t": 205.23614999999995, "r": 430.20520000000005, "b": 214.55791999999997, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "C", "bbox": {"l": 386.50574, "t": 217.03882, "r": 393.68091, "b": 226.36059999999998, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "C", "bbox": {"l": 398.60181, "t": 217.21704, "r": 405.77698, "b": 226.53882, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "C", "bbox": {"l": 410.72275, "t": 217.22321, "r": 417.89792, "b": 226.54498, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "C", "bbox": {"l": 422.84869, "t": 217.13738999999998, "r": 430.02386, "b": 226.45916999999997, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "NL", "bbox": {"l": 435.16009999999994, "t": 167.69011999999998, "r": 447.86273, "b": 177.01189999999997, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "NL", "bbox": {"l": 435.44415, "t": 180.20025999999996, "r": 448.14679, "b": 189.52202999999997, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "NL", "bbox": {"l": 435.46735, "t": 192.49474999999995, "r": 448.16998000000007, "b": 201.81652999999994, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "NL", "bbox": {"l": 435.38202, "t": 204.83025999999995, "r": 448.08466, "b": 214.15204000000006, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "NL", "bbox": {"l": 435.59906, "t": 217.2337, "r": 448.3017, "b": 226.55548, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "U", "bbox": {"l": 374.14957, "t": 205.23492, "r": 381.32474, "b": 214.55669999999998, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "U", "bbox": {"l": 374.0419, "t": 217.14648, "r": 381.21707, "b": 226.46826, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "U", "bbox": {"l": 374.34418, "t": 180.93488000000002, "r": 381.51935, "b": 190.25665000000004, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "L", "bbox": {"l": 387.76285, "t": 168.57788000000005, "r": 393.28833, "b": 177.89966000000004, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "L", "bbox": {"l": 411.86395, "t": 168.06195000000002, "r": 417.38943, "b": 177.38373, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "L", "bbox": {"l": 423.33563, "t": 167.93439, "r": 428.86111, "b": 177.25616000000002, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "X", "bbox": {"l": 387.13593, "t": 180.78576999999996, "r": 393.76453, "b": 190.10753999999997, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "C", "bbox": {"l": 282.2594, "t": 244.50878999999998, "r": 289.43457, "b": 253.83056999999997, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "U", "bbox": {"l": 282.11035, "t": 256.85022000000004, "r": 289.28552, "b": 266.172, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "U", "bbox": {"l": 282.40848, "t": 269.13300000000004, "r": 289.58365, "b": 278.45477000000005, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "L", "bbox": {"l": 295.52902, "t": 244.49347, "r": 301.0545, "b": 253.81525, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "L", "bbox": {"l": 307.46613, "t": 244.57372999999995, "r": 312.99161, "b": 253.89550999999994, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "L", "bbox": {"l": 318.76886, "t": 244.44037000000003, "r": 324.29434, "b": 253.76215000000002, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "X", "bbox": {"l": 294.9021, "t": 256.70154, "r": 301.03976, "b": 266.02332, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "X X", "bbox": {"l": 307.17743, "t": 256.70154, "r": 325.59039, "b": 266.02332, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "X", "bbox": {"l": 294.78949, "t": 269.25420999999994, "r": 300.92715, "b": 278.57599000000005, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "X X", "bbox": {"l": 307.06482, "t": 269.25420999999994, "r": 325.47778, "b": 278.57599000000005, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "C", "bbox": {"l": 195.93939, "t": 268.74798999999996, "r": 203.11456, "b": 278.06976, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "L", "bbox": {"l": 209.20891, "t": 268.73267, "r": 214.73439, "b": 278.05444, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "L", "bbox": {"l": 221.14551, "t": 268.81293000000005, "r": 226.67099, "b": 278.13469999999995, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "L", "bbox": {"l": 232.44858, "t": 268.67957, "r": 237.97405999999998, "b": 278.00134, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "C", "bbox": {"l": 196.21715, "t": 244.53961000000004, "r": 203.39232, "b": 253.86139000000003, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "C", "bbox": {"l": 250.32143, "t": 244.09813999999994, "r": 257.49661, "b": 253.41992000000005, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "U", "bbox": {"l": 250.17235999999997, "t": 256.43951000000004, "r": 257.34753, "b": 265.76129000000003, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "U", "bbox": {"l": 250.47049000000004, "t": 268.72222999999997, "r": 257.64566, "b": 278.04400999999996, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "1", "bbox": {"l": 334.51135, "t": 242.99463000000003, "r": 337.22485, "b": 249.20911, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "- simple cells: \"C\"", "bbox": {"l": 339.93835, "t": 242.99463000000003, "r": 391.49472, "b": 249.20911, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "2", "bbox": {"l": 334.51135, "t": 252.93255999999997, "r": 337.33313, "b": 259.14703, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "- horizontal merges: \"C\", \"L\"", "bbox": {"l": 340.15491, "t": 252.93255999999997, "r": 421.98624, "b": 259.14703, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "3", "bbox": {"l": 334.51135, "t": 262.87048000000004, "r": 337.29868, "b": 269.08496, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "- vertical merges: \"C\", \"U\"", "bbox": {"l": 340.086, "t": 262.87048000000004, "r": 415.34375, "b": 269.08496, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "4", "bbox": {"l": 334.51135, "t": 272.80841, "r": 337.30188, "b": 279.02288999999996, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "- 2d merges: \"C\", \"L\", \"U\", \"X\"", "bbox": {"l": 340.09241, "t": 272.80841, "r": 426.59875, "b": 279.02288999999996, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "1", "bbox": {"l": 185.67178, "t": 244.04224, "r": 189.35544, "b": 250.25671, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "2", "bbox": {"l": 185.96759, "t": 268.34766, "r": 189.65125, "b": 274.56213, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "3", "bbox": {"l": 239.34152, "t": 243.62523999999996, "r": 243.02518, "b": 249.83972000000006, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "4", "bbox": {"l": 271.32852, "t": 243.49390000000005, "r": 275.01218, "b": 249.70836999999995, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "2", "bbox": {"l": 229.81627, "t": 166.51495, "r": 233.49992000000003, "b": 172.72942999999998, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "1", "bbox": {"l": 257.24402, "t": 189.961, "r": 260.92767, "b": 196.17548, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "3", "bbox": {"l": 186.87526, "t": 177.97668, "r": 190.55891, "b": 184.19115999999997, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "4", "bbox": {"l": 196.48746, "t": 169.01520000000005, "r": 200.17111, "b": 175.22968000000003, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "A", "bbox": {"l": 169.74728, "t": 167.88225999999997, "r": 175.72659, "b": 175.65039000000002, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "B", "bbox": {"l": 169.74728, "t": 206.83867999999995, "r": 175.72659, "b": 214.60681, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "C", "bbox": {"l": 274.29419, "t": 168.27972, "r": 280.2735, "b": 176.04785000000004, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "D", "bbox": {"l": 359.56152, "t": 168.27972, "r": 365.54083, "b": 176.04785000000004, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "E", "bbox": {"l": 169.74728, "t": 243.21149000000003, "r": 175.27112, "b": 250.97960999999998, "coord_origin": "TOPLEFT"}}], "children": [{"id": 19, "label": "text", "bbox": {"l": 374.49326, "t": 168.59362999999996, "r": 381.66843, "b": 177.91540999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": "C", "bbox": {"l": 374.49326, "t": 168.59362999999996, "r": 381.66843, "b": 177.91540999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 398.74011, "t": 168.50005999999996, "r": 405.91528, "b": 177.82183999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "C", "bbox": {"l": 398.74011, "t": 168.50005999999996, "r": 405.91528, "b": 177.82183999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 373.76862, "t": 192.92553999999996, "r": 380.94379, "b": 202.24730999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "C", "bbox": {"l": 373.76862, "t": 192.92553999999996, "r": 380.94379, "b": 202.24730999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 386.66388, "t": 193.07061999999996, "r": 393.83905, "b": 202.39239999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "C", "bbox": {"l": 386.66388, "t": 193.07061999999996, "r": 393.83905, "b": 202.39239999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 386.68707, "t": 205.13756999999998, "r": 393.86224, "b": 214.45934999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "C", "bbox": {"l": 386.68707, "t": 205.13756999999998, "r": 393.86224, "b": 214.45934999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 398.65729, "t": 180.73279000000002, "r": 405.83246, "b": 190.05457, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "C", "bbox": {"l": 398.65729, "t": 180.73279000000002, "r": 405.83246, "b": 190.05457, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 410.77908, "t": 180.73859000000004, "r": 417.95425, "b": 190.06035999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "C", "bbox": {"l": 410.77908, "t": 180.73859000000004, "r": 417.95425, "b": 190.06035999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 422.90503, "t": 180.65247, "r": 430.08020000000005, "b": 189.97424, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "C", "bbox": {"l": 422.90503, "t": 180.65247, "r": 430.08020000000005, "b": 189.97424, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 398.7807, "t": 192.98865, "r": 405.95587, "b": 202.31042000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "C", "bbox": {"l": 398.7807, "t": 192.98865, "r": 405.95587, "b": 202.31042000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 410.90164, "t": 192.99487, "r": 418.07681, "b": 202.31664999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "C", "bbox": {"l": 410.90164, "t": 192.99487, "r": 418.07681, "b": 202.31664999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 423.02753, "t": 192.909, "r": 430.2027, "b": 202.23077, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "C", "bbox": {"l": 423.02753, "t": 192.909, "r": 430.2027, "b": 202.23077, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 398.78235, "t": 205.31573000000003, "r": 405.95752, "b": 214.63751000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "C", "bbox": {"l": 398.78235, "t": 205.31573000000003, "r": 405.95752, "b": 214.63751000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 410.90414, "t": 205.32196, "r": 418.07932, "b": 214.64373999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "C", "bbox": {"l": 410.90414, "t": 205.32196, "r": 418.07932, "b": 214.64373999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 423.03003, "t": 205.23614999999995, "r": 430.20520000000005, "b": 214.55791999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "C", "bbox": {"l": 423.03003, "t": 205.23614999999995, "r": 430.20520000000005, "b": 214.55791999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 386.50574, "t": 217.03882, "r": 393.68091, "b": 226.36059999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "C", "bbox": {"l": 386.50574, "t": 217.03882, "r": 393.68091, "b": 226.36059999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 398.60181, "t": 217.21704, "r": 405.77698, "b": 226.53882, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "C", "bbox": {"l": 398.60181, "t": 217.21704, "r": 405.77698, "b": 226.53882, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 410.72275, "t": 217.22321, "r": 417.89792, "b": 226.54498, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "C", "bbox": {"l": 410.72275, "t": 217.22321, "r": 417.89792, "b": 226.54498, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 422.84869, "t": 217.13738999999998, "r": 430.02386, "b": 226.45916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "C", "bbox": {"l": 422.84869, "t": 217.13738999999998, "r": 430.02386, "b": 226.45916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 435.16009999999994, "t": 167.69011999999998, "r": 447.86273, "b": 177.01189999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "NL", "bbox": {"l": 435.16009999999994, "t": 167.69011999999998, "r": 447.86273, "b": 177.01189999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 435.44415, "t": 180.20025999999996, "r": 448.14679, "b": 189.52202999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "NL", "bbox": {"l": 435.44415, "t": 180.20025999999996, "r": 448.14679, "b": 189.52202999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 435.46735, "t": 192.49474999999995, "r": 448.16998000000007, "b": 201.81652999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "NL", "bbox": {"l": 435.46735, "t": 192.49474999999995, "r": 448.16998000000007, "b": 201.81652999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 435.38202, "t": 204.83025999999995, "r": 448.08466, "b": 214.15204000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "NL", "bbox": {"l": 435.38202, "t": 204.83025999999995, "r": 448.08466, "b": 214.15204000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 435.59906, "t": 217.2337, "r": 448.3017, "b": 226.55548, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "NL", "bbox": {"l": 435.59906, "t": 217.2337, "r": 448.3017, "b": 226.55548, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 374.14957, "t": 205.23492, "r": 381.32474, "b": 214.55669999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "U", "bbox": {"l": 374.14957, "t": 205.23492, "r": 381.32474, "b": 214.55669999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 374.0419, "t": 217.14648, "r": 381.21707, "b": 226.46826, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "U", "bbox": {"l": 374.0419, "t": 217.14648, "r": 381.21707, "b": 226.46826, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 374.34418, "t": 180.93488000000002, "r": 381.51935, "b": 190.25665000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "U", "bbox": {"l": 374.34418, "t": 180.93488000000002, "r": 381.51935, "b": 190.25665000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 387.76285, "t": 168.57788000000005, "r": 393.28833, "b": 177.89966000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "L", "bbox": {"l": 387.76285, "t": 168.57788000000005, "r": 393.28833, "b": 177.89966000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 411.86395, "t": 168.06195000000002, "r": 417.38943, "b": 177.38373, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "L", "bbox": {"l": 411.86395, "t": 168.06195000000002, "r": 417.38943, "b": 177.38373, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 423.33563, "t": 167.93439, "r": 428.86111, "b": 177.25616000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "L", "bbox": {"l": 423.33563, "t": 167.93439, "r": 428.86111, "b": 177.25616000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 387.13593, "t": 180.78576999999996, "r": 393.76453, "b": 190.10753999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "X", "bbox": {"l": 387.13593, "t": 180.78576999999996, "r": 393.76453, "b": 190.10753999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 282.2594, "t": 244.50878999999998, "r": 289.43457, "b": 253.83056999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "C", "bbox": {"l": 282.2594, "t": 244.50878999999998, "r": 289.43457, "b": 253.83056999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 282.11035, "t": 256.85022000000004, "r": 289.28552, "b": 266.172, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "U", "bbox": {"l": 282.11035, "t": 256.85022000000004, "r": 289.28552, "b": 266.172, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 282.40848, "t": 269.13300000000004, "r": 289.58365, "b": 278.45477000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "U", "bbox": {"l": 282.40848, "t": 269.13300000000004, "r": 289.58365, "b": 278.45477000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 295.52902, "t": 244.49347, "r": 301.0545, "b": 253.81525, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "L", "bbox": {"l": 295.52902, "t": 244.49347, "r": 301.0545, "b": 253.81525, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 307.46613, "t": 244.57372999999995, "r": 312.99161, "b": 253.89550999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "L", "bbox": {"l": 307.46613, "t": 244.57372999999995, "r": 312.99161, "b": 253.89550999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 318.76886, "t": 244.44037000000003, "r": 324.29434, "b": 253.76215000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "L", "bbox": {"l": 318.76886, "t": 244.44037000000003, "r": 324.29434, "b": 253.76215000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 294.9021, "t": 256.70154, "r": 301.03976, "b": 266.02332, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "X", "bbox": {"l": 294.9021, "t": 256.70154, "r": 301.03976, "b": 266.02332, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 307.17743, "t": 256.70154, "r": 325.59039, "b": 266.02332, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "X X", "bbox": {"l": 307.17743, "t": 256.70154, "r": 325.59039, "b": 266.02332, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 294.78949, "t": 269.25420999999994, "r": 300.92715, "b": 278.57599000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "X", "bbox": {"l": 294.78949, "t": 269.25420999999994, "r": 300.92715, "b": 278.57599000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 307.06482, "t": 269.25420999999994, "r": 325.47778, "b": 278.57599000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "X X", "bbox": {"l": 307.06482, "t": 269.25420999999994, "r": 325.47778, "b": 278.57599000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 195.93939, "t": 268.74798999999996, "r": 203.11456, "b": 278.06976, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "C", "bbox": {"l": 195.93939, "t": 268.74798999999996, "r": 203.11456, "b": 278.06976, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 209.20891, "t": 268.73267, "r": 214.73439, "b": 278.05444, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "L", "bbox": {"l": 209.20891, "t": 268.73267, "r": 214.73439, "b": 278.05444, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 221.14551, "t": 268.81293000000005, "r": 226.67099, "b": 278.13469999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "L", "bbox": {"l": 221.14551, "t": 268.81293000000005, "r": 226.67099, "b": 278.13469999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 232.44858, "t": 268.67957, "r": 237.97405999999998, "b": 278.00134, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "L", "bbox": {"l": 232.44858, "t": 268.67957, "r": 237.97405999999998, "b": 278.00134, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 196.21715, "t": 244.53961000000004, "r": 203.39232, "b": 253.86139000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "C", "bbox": {"l": 196.21715, "t": 244.53961000000004, "r": 203.39232, "b": 253.86139000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 250.32143, "t": 244.09813999999994, "r": 257.49661, "b": 253.41992000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "C", "bbox": {"l": 250.32143, "t": 244.09813999999994, "r": 257.49661, "b": 253.41992000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 250.17235999999997, "t": 256.43951000000004, "r": 257.34753, "b": 265.76129000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "U", "bbox": {"l": 250.17235999999997, "t": 256.43951000000004, "r": 257.34753, "b": 265.76129000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 250.47049000000004, "t": 268.72222999999997, "r": 257.64566, "b": 278.04400999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "U", "bbox": {"l": 250.47049000000004, "t": 268.72222999999997, "r": 257.64566, "b": 278.04400999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 334.51135, "t": 242.99463000000003, "r": 337.22485, "b": 249.20911, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "1", "bbox": {"l": 334.51135, "t": 242.99463000000003, "r": 337.22485, "b": 249.20911, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 339.93835, "t": 242.99463000000003, "r": 391.49472, "b": 249.20911, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "- simple cells: \"C\"", "bbox": {"l": 339.93835, "t": 242.99463000000003, "r": 391.49472, "b": 249.20911, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 334.51135, "t": 252.93255999999997, "r": 337.33313, "b": 259.14703, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "2", "bbox": {"l": 334.51135, "t": 252.93255999999997, "r": 337.33313, "b": 259.14703, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 340.15491, "t": 252.93255999999997, "r": 421.98624, "b": 259.14703, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "- horizontal merges: \"C\", \"L\"", "bbox": {"l": 340.15491, "t": 252.93255999999997, "r": 421.98624, "b": 259.14703, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 334.51135, "t": 262.87048000000004, "r": 337.29868, "b": 269.08496, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "3", "bbox": {"l": 334.51135, "t": 262.87048000000004, "r": 337.29868, "b": 269.08496, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 340.086, "t": 262.87048000000004, "r": 415.34375, "b": 269.08496, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "- vertical merges: \"C\", \"U\"", "bbox": {"l": 340.086, "t": 262.87048000000004, "r": 415.34375, "b": 269.08496, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "list_item", "bbox": {"l": 334.51135, "t": 272.80841, "r": 426.59875, "b": 279.02288999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.5250620245933533, "cells": [{"id": 60, "text": "4", "bbox": {"l": 334.51135, "t": 272.80841, "r": 337.30188, "b": 279.02288999999996, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "- 2d merges: \"C\", \"L\", \"U\", \"X\"", "bbox": {"l": 340.09241, "t": 272.80841, "r": 426.59875, "b": 279.02288999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 185.67178, "t": 244.04224, "r": 189.35544, "b": 250.25671, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "1", "bbox": {"l": 185.67178, "t": 244.04224, "r": 189.35544, "b": 250.25671, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 185.96759, "t": 268.34766, "r": 189.65125, "b": 274.56213, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "2", "bbox": {"l": 185.96759, "t": 268.34766, "r": 189.65125, "b": 274.56213, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 239.34152, "t": 243.62523999999996, "r": 243.02518, "b": 249.83972000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "3", "bbox": {"l": 239.34152, "t": 243.62523999999996, "r": 243.02518, "b": 249.83972000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 271.32852, "t": 243.49390000000005, "r": 275.01218, "b": 249.70836999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "4", "bbox": {"l": 271.32852, "t": 243.49390000000005, "r": 275.01218, "b": 249.70836999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 229.81627, "t": 166.51495, "r": 233.49992000000003, "b": 172.72942999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "2", "bbox": {"l": 229.81627, "t": 166.51495, "r": 233.49992000000003, "b": 172.72942999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 257.24402, "t": 189.961, "r": 260.92767, "b": 196.17548, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "1", "bbox": {"l": 257.24402, "t": 189.961, "r": 260.92767, "b": 196.17548, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 186.87526, "t": 177.97668, "r": 190.55891, "b": 184.19115999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "3", "bbox": {"l": 186.87526, "t": 177.97668, "r": 190.55891, "b": 184.19115999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 196.48746, "t": 169.01520000000005, "r": 200.17111, "b": 175.22968000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "4", "bbox": {"l": 196.48746, "t": 169.01520000000005, "r": 200.17111, "b": 175.22968000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 169.74728, "t": 167.88225999999997, "r": 175.72659, "b": 175.65039000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "A", "bbox": {"l": 169.74728, "t": 167.88225999999997, "r": 175.72659, "b": 175.65039000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 169.74728, "t": 206.83867999999995, "r": 175.72659, "b": 214.60681, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "B", "bbox": {"l": 169.74728, "t": 206.83867999999995, "r": 175.72659, "b": 214.60681, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 274.29419, "t": 168.27972, "r": 280.2735, "b": 176.04785000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "C", "bbox": {"l": 274.29419, "t": 168.27972, "r": 280.2735, "b": 176.04785000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 359.56152, "t": 168.27972, "r": 365.54083, "b": 176.04785000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "D", "bbox": {"l": 359.56152, "t": 168.27972, "r": 365.54083, "b": 176.04785000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 169.74728, "t": 243.21149000000003, "r": 175.27112, "b": 250.97960999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "E", "bbox": {"l": 169.74728, "t": 243.21149000000003, "r": 175.27112, "b": 250.97960999999998, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "section_header", "id": 9, "page_no": 6, "cluster": {"id": 9, "label": "section_header", "bbox": {"l": 134.765, "t": 305.29581, "r": 246.65197999999998, "b": 314.10275, "coord_origin": "TOPLEFT"}, "confidence": 0.923302412033081, "cells": [{"id": 75, "text": "4.2", "bbox": {"l": 134.765, "t": 305.29581, "r": 149.40205, "b": 314.10275, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "Language Syntax", "bbox": {"l": 160.85904, "t": 305.29581, "r": 246.65197999999998, "b": 314.10275, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4.2 Language Syntax"}, {"label": "text", "id": 10, "page_no": 6, "cluster": {"id": 10, "label": "text", "bbox": {"l": 134.765, "t": 325.24777, "r": 363.79617, "b": 334.04474, "coord_origin": "TOPLEFT"}, "confidence": 0.9169169068336487, "cells": [{"id": 77, "text": "The OTSL representation follows these syntax rules:", "bbox": {"l": 134.765, "t": 325.24777, "r": 363.79617, "b": 334.04474, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The OTSL representation follows these syntax rules:"}, {"label": "list_item", "id": 3, "page_no": 6, "cluster": {"id": 3, "label": "list_item", "bbox": {"l": 138.97299, "t": 347.17081, "r": 480.58902, "b": 367.93375, "coord_origin": "TOPLEFT"}, "confidence": 0.958811342716217, "cells": [{"id": 78, "text": "1.", "bbox": {"l": 138.97299, "t": 347.18079, "r": 146.71991, "b": 355.97775, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "Left-looking cell rule", "bbox": {"l": 151.70099, "t": 347.17081, "r": 257.37927, "b": 355.97775, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": ": The left neighbour of an \"L\" cell must be either", "bbox": {"l": 257.383, "t": 347.18079, "r": 480.58902, "b": 355.97775, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "another \"L\" cell or a \"C\" cell.", "bbox": {"l": 151.70099, "t": 359.13678, "r": 283.59387, "b": 367.93375, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1. Left-looking cell rule : The left neighbour of an \"L\" cell must be either another \"L\" cell or a \"C\" cell."}, {"label": "list_item", "id": 4, "page_no": 6, "cluster": {"id": 4, "label": "list_item", "bbox": {"l": 138.97299, "t": 371.08481, "r": 480.59229000000005, "b": 391.84673999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9585386514663696, "cells": [{"id": 82, "text": "2.", "bbox": {"l": 138.97299, "t": 371.09479, "r": 146.71991, "b": 379.89175, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "Up-looking cell rule", "bbox": {"l": 151.70099, "t": 371.08481, "r": 252.11203, "b": 379.89175, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": ": The upper neighbour of a \"U\" cell must be either", "bbox": {"l": 252.112, "t": 371.09479, "r": 480.59229000000005, "b": 379.89175, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "another \"U\" cell or a \"C\" cell.", "bbox": {"l": 151.70099, "t": 383.04977, "r": 284.8392, "b": 391.84673999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2. Up-looking cell rule : The upper neighbour of a \"U\" cell must be either another \"U\" cell or a \"C\" cell."}, {"label": "section_header", "id": 14, "page_no": 6, "cluster": {"id": 14, "label": "section_header", "bbox": {"l": 138.97299, "t": 394.99780000000004, "r": 226.07360999999997, "b": 403.80475, "coord_origin": "TOPLEFT"}, "confidence": 0.6506174802780151, "cells": [{"id": 86, "text": "3.", "bbox": {"l": 138.97299, "t": 395.0077800000001, "r": 146.71991, "b": 403.80475, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Cross cell rule", "bbox": {"l": 151.70099, "t": 394.99780000000004, "r": 223.3042, "b": 403.80475, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": ":", "bbox": {"l": 223.30699, "t": 395.0077800000001, "r": 226.07360999999997, "b": 403.80475, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3. Cross cell rule :"}, {"label": "list_item", "id": 13, "page_no": 6, "cluster": {"id": 13, "label": "list_item", "bbox": {"l": 151.70099, "t": 406.96677, "r": 480.59238, "b": 439.67371, "coord_origin": "TOPLEFT"}, "confidence": 0.7247233390808105, "cells": [{"id": 89, "text": "The left neighbour of an \"X\" cell must be either another \"X\" cell or a \"U\"", "bbox": {"l": 151.70099, "t": 406.96677, "r": 480.59238, "b": 415.76373, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "cell, and the upper neighbour of an \"X\" cell must be either another \"X\" cell", "bbox": {"l": 151.70099, "t": 418.9217499999999, "r": 480.59219, "b": 427.71871999999996, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "or an \"L\" cell.", "bbox": {"l": 151.70099, "t": 430.87674, "r": 214.39663999999996, "b": 439.67371, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The left neighbour of an \"X\" cell must be either another \"X\" cell or a \"U\" cell, and the upper neighbour of an \"X\" cell must be either another \"X\" cell or an \"L\" cell."}, {"label": "list_item", "id": 8, "page_no": 6, "cluster": {"id": 8, "label": "list_item", "bbox": {"l": 138.97299, "t": 442.82574, "r": 474.59018, "b": 451.63269, "coord_origin": "TOPLEFT"}, "confidence": 0.9259927272796631, "cells": [{"id": 92, "text": "4.", "bbox": {"l": 138.97299, "t": 442.83572, "r": 146.71991, "b": 451.63269, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "First row rule", "bbox": {"l": 151.70099, "t": 442.82574, "r": 221.32263, "b": 451.63269, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": ": Only \"L\" cells and \"C\" cells are allowed in the first row.", "bbox": {"l": 221.32700000000003, "t": 442.83572, "r": 474.59018, "b": 451.63269, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4. First row rule : Only \"L\" cells and \"C\" cells are allowed in the first row."}, {"label": "list_item", "id": 5, "page_no": 6, "cluster": {"id": 5, "label": "list_item", "bbox": {"l": 138.97299, "t": 454.78375, "r": 480.58746, "b": 475.54568, "coord_origin": "TOPLEFT"}, "confidence": 0.9420597553253174, "cells": [{"id": 95, "text": "5.", "bbox": {"l": 138.97299, "t": 454.7937299999999, "r": 146.71991, "b": 463.5907, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "First column rule", "bbox": {"l": 151.70099, "t": 454.78375, "r": 240.71982, "b": 463.5907, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": ": Only \"U\" cells and \"C\" cells are allowed in the first", "bbox": {"l": 240.71599, "t": 454.7937299999999, "r": 480.58746, "b": 463.5907, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "column.", "bbox": {"l": 151.70099, "t": 466.74872, "r": 186.0072, "b": 475.54568, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5. First column rule : Only \"U\" cells and \"C\" cells are allowed in the first column."}, {"label": "list_item", "id": 1, "page_no": 6, "cluster": {"id": 1, "label": "list_item", "bbox": {"l": 138.97299, "t": 478.69675, "r": 480.59457, "b": 499.45969, "coord_origin": "TOPLEFT"}, "confidence": 0.961783230304718, "cells": [{"id": 99, "text": "6.", "bbox": {"l": 138.97299, "t": 478.70673, "r": 146.71991, "b": 487.50369, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "Rectangular rule", "bbox": {"l": 151.70099, "t": 478.69675, "r": 235.15768, "b": 487.50369, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": ": The table representation is always rectangular - all rows", "bbox": {"l": 235.15697999999998, "t": 478.70673, "r": 480.59457, "b": 487.50369, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "must have an equal number of tokens, terminated with \"NL\" token.", "bbox": {"l": 151.70099, "t": 490.66272, "r": 448.04147, "b": 499.45969, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "6. Rectangular rule : The table representation is always rectangular - all rows must have an equal number of tokens, terminated with \"NL\" token."}, {"label": "text", "id": 0, "page_no": 6, "cluster": {"id": 0, "label": "text", "bbox": {"l": 134.76498, "t": 512.59271, "r": 480.59583, "b": 640.9416699999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9785562753677368, "cells": [{"id": 103, "text": "The application of these rules gives OTSL a set of unique properties. First", "bbox": {"l": 149.70898, "t": 512.59271, "r": 480.59583, "b": 521.38968, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "of all, the OTSL enforces a strictly rectangular structure representation, where", "bbox": {"l": 134.76498, "t": 524.5477000000001, "r": 480.59079, "b": 533.34467, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "every new-line token starts a new row. As a consequence, all rows and all columns", "bbox": {"l": 134.76498, "t": 536.5027, "r": 480.59482, "b": 545.29967, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "have exactly the same number of tokens, irrespective of cell spans. Secondly, the", "bbox": {"l": 134.76498, "t": 548.4586899999999, "r": 480.58865000000003, "b": 557.25566, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "OTSL representation is unambiguous: Every table structure is represented in one", "bbox": {"l": 134.76498, "t": 560.4137000000001, "r": 480.59365999999994, "b": 569.21066, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "way. In this representation every table cell corresponds to a \"C\"-cell token, which", "bbox": {"l": 134.76498, "t": 572.3687, "r": 480.58673, "b": 581.16566, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "in case of spans is always located in the top-left corner of the table cell definition.", "bbox": {"l": 134.76498, "t": 584.3237, "r": 480.59171, "b": 593.12067, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "Third, OTSL syntax rules are only backward-looking. As a consequence, every", "bbox": {"l": 134.76498, "t": 596.2787, "r": 480.59180000000003, "b": 605.07567, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "predicted token can be validated straight during sequence generation by looking", "bbox": {"l": 134.76498, "t": 608.2347, "r": 480.5936899999999, "b": 617.03166, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "at the previously predicted sequence. As such, OTSL can guarantee that every", "bbox": {"l": 134.76498, "t": 620.1897, "r": 480.59072999999995, "b": 628.98666, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "predicted sequence is syntactically valid.", "bbox": {"l": 134.76498, "t": 632.1447000000001, "r": 311.19769, "b": 640.9416699999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The application of these rules gives OTSL a set of unique properties. First of all, the OTSL enforces a strictly rectangular structure representation, where every new-line token starts a new row. As a consequence, all rows and all columns have exactly the same number of tokens, irrespective of cell spans. Secondly, the OTSL representation is unambiguous: Every table structure is represented in one way. In this representation every table cell corresponds to a \"C\"-cell token, which in case of spans is always located in the top-left corner of the table cell definition. Third, OTSL syntax rules are only backward-looking. As a consequence, every predicted token can be validated straight during sequence generation by looking at the previously predicted sequence. As such, OTSL can guarantee that every predicted sequence is syntactically valid."}, {"label": "text", "id": 2, "page_no": 6, "cluster": {"id": 2, "label": "text", "bbox": {"l": 134.76498, "t": 644.1026899999999, "r": 480.59265, "b": 664.8546699999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9590610861778259, "cells": [{"id": 114, "text": "These characteristics can be easily learned by sequence generator networks,", "bbox": {"l": 149.70898, "t": 644.1026899999999, "r": 480.59186, "b": 652.89966, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "as we demonstrate further below. We find strong indications that this pattern", "bbox": {"l": 134.76498, "t": 656.05769, "r": 480.59265, "b": 664.8546699999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "These characteristics can be easily learned by sequence generator networks, as we demonstrate further below. We find strong indications that this pattern"}], "body": [{"label": "caption", "id": 6, "page_no": 6, "cluster": {"id": 6, "label": "caption", "bbox": {"l": 134.765, "t": 125.79918999999984, "r": 480.5874, "b": 155.84966999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9333082437515259, "cells": [{"id": 2, "text": "Fig. 3.", "bbox": {"l": 134.765, "t": 125.79918999999984, "r": 162.64424, "b": 133.72551999999996, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "OTSL description of table structure: A - table example; B - graphical repre-", "bbox": {"l": 166.276, "t": 125.86200000000008, "r": 480.58675999999997, "b": 133.93169999999998, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "sentation of table structure; C - mapping structure on a grid; D - OTSL structure", "bbox": {"l": 134.765, "t": 136.82097999999996, "r": 480.5874, "b": 144.89068999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "encoding; E - explanation on cell encoding", "bbox": {"l": 134.765, "t": 147.77997000000005, "r": 306.1156, "b": 155.84966999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Fig. 3. OTSL description of table structure: A - table example; B - graphical representation of table structure; C - mapping structure on a grid; D - OTSL structure encoding; E - explanation on cell encoding"}, {"label": "picture", "id": 12, "page_no": 6, "cluster": {"id": 12, "label": "picture", "bbox": {"l": 164.65028381347656, "t": 163.79708862304688, "r": 449.5505676269531, "b": 280.3409423828125, "coord_origin": "TOPLEFT"}, "confidence": 0.7868534922599792, "cells": [{"id": 6, "text": "C", "bbox": {"l": 374.49326, "t": 168.59362999999996, "r": 381.66843, "b": 177.91540999999995, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "C", "bbox": {"l": 398.74011, "t": 168.50005999999996, "r": 405.91528, "b": 177.82183999999995, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "C", "bbox": {"l": 373.76862, "t": 192.92553999999996, "r": 380.94379, "b": 202.24730999999997, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "C", "bbox": {"l": 386.66388, "t": 193.07061999999996, "r": 393.83905, "b": 202.39239999999995, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "C", "bbox": {"l": 386.68707, "t": 205.13756999999998, "r": 393.86224, "b": 214.45934999999997, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "C", "bbox": {"l": 398.65729, "t": 180.73279000000002, "r": 405.83246, "b": 190.05457, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "C", "bbox": {"l": 410.77908, "t": 180.73859000000004, "r": 417.95425, "b": 190.06035999999995, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "C", "bbox": {"l": 422.90503, "t": 180.65247, "r": 430.08020000000005, "b": 189.97424, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "C", "bbox": {"l": 398.7807, "t": 192.98865, "r": 405.95587, "b": 202.31042000000002, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "C", "bbox": {"l": 410.90164, "t": 192.99487, "r": 418.07681, "b": 202.31664999999998, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "C", "bbox": {"l": 423.02753, "t": 192.909, "r": 430.2027, "b": 202.23077, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "C", "bbox": {"l": 398.78235, "t": 205.31573000000003, "r": 405.95752, "b": 214.63751000000002, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "C", "bbox": {"l": 410.90414, "t": 205.32196, "r": 418.07932, "b": 214.64373999999998, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "C", "bbox": {"l": 423.03003, "t": 205.23614999999995, "r": 430.20520000000005, "b": 214.55791999999997, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "C", "bbox": {"l": 386.50574, "t": 217.03882, "r": 393.68091, "b": 226.36059999999998, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "C", "bbox": {"l": 398.60181, "t": 217.21704, "r": 405.77698, "b": 226.53882, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "C", "bbox": {"l": 410.72275, "t": 217.22321, "r": 417.89792, "b": 226.54498, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "C", "bbox": {"l": 422.84869, "t": 217.13738999999998, "r": 430.02386, "b": 226.45916999999997, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "NL", "bbox": {"l": 435.16009999999994, "t": 167.69011999999998, "r": 447.86273, "b": 177.01189999999997, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "NL", "bbox": {"l": 435.44415, "t": 180.20025999999996, "r": 448.14679, "b": 189.52202999999997, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "NL", "bbox": {"l": 435.46735, "t": 192.49474999999995, "r": 448.16998000000007, "b": 201.81652999999994, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "NL", "bbox": {"l": 435.38202, "t": 204.83025999999995, "r": 448.08466, "b": 214.15204000000006, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "NL", "bbox": {"l": 435.59906, "t": 217.2337, "r": 448.3017, "b": 226.55548, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "U", "bbox": {"l": 374.14957, "t": 205.23492, "r": 381.32474, "b": 214.55669999999998, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "U", "bbox": {"l": 374.0419, "t": 217.14648, "r": 381.21707, "b": 226.46826, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "U", "bbox": {"l": 374.34418, "t": 180.93488000000002, "r": 381.51935, "b": 190.25665000000004, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "L", "bbox": {"l": 387.76285, "t": 168.57788000000005, "r": 393.28833, "b": 177.89966000000004, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "L", "bbox": {"l": 411.86395, "t": 168.06195000000002, "r": 417.38943, "b": 177.38373, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "L", "bbox": {"l": 423.33563, "t": 167.93439, "r": 428.86111, "b": 177.25616000000002, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "X", "bbox": {"l": 387.13593, "t": 180.78576999999996, "r": 393.76453, "b": 190.10753999999997, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "C", "bbox": {"l": 282.2594, "t": 244.50878999999998, "r": 289.43457, "b": 253.83056999999997, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "U", "bbox": {"l": 282.11035, "t": 256.85022000000004, "r": 289.28552, "b": 266.172, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "U", "bbox": {"l": 282.40848, "t": 269.13300000000004, "r": 289.58365, "b": 278.45477000000005, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "L", "bbox": {"l": 295.52902, "t": 244.49347, "r": 301.0545, "b": 253.81525, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "L", "bbox": {"l": 307.46613, "t": 244.57372999999995, "r": 312.99161, "b": 253.89550999999994, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "L", "bbox": {"l": 318.76886, "t": 244.44037000000003, "r": 324.29434, "b": 253.76215000000002, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "X", "bbox": {"l": 294.9021, "t": 256.70154, "r": 301.03976, "b": 266.02332, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "X X", "bbox": {"l": 307.17743, "t": 256.70154, "r": 325.59039, "b": 266.02332, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "X", "bbox": {"l": 294.78949, "t": 269.25420999999994, "r": 300.92715, "b": 278.57599000000005, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "X X", "bbox": {"l": 307.06482, "t": 269.25420999999994, "r": 325.47778, "b": 278.57599000000005, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "C", "bbox": {"l": 195.93939, "t": 268.74798999999996, "r": 203.11456, "b": 278.06976, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "L", "bbox": {"l": 209.20891, "t": 268.73267, "r": 214.73439, "b": 278.05444, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "L", "bbox": {"l": 221.14551, "t": 268.81293000000005, "r": 226.67099, "b": 278.13469999999995, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "L", "bbox": {"l": 232.44858, "t": 268.67957, "r": 237.97405999999998, "b": 278.00134, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "C", "bbox": {"l": 196.21715, "t": 244.53961000000004, "r": 203.39232, "b": 253.86139000000003, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "C", "bbox": {"l": 250.32143, "t": 244.09813999999994, "r": 257.49661, "b": 253.41992000000005, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "U", "bbox": {"l": 250.17235999999997, "t": 256.43951000000004, "r": 257.34753, "b": 265.76129000000003, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "U", "bbox": {"l": 250.47049000000004, "t": 268.72222999999997, "r": 257.64566, "b": 278.04400999999996, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "1", "bbox": {"l": 334.51135, "t": 242.99463000000003, "r": 337.22485, "b": 249.20911, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "- simple cells: \"C\"", "bbox": {"l": 339.93835, "t": 242.99463000000003, "r": 391.49472, "b": 249.20911, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "2", "bbox": {"l": 334.51135, "t": 252.93255999999997, "r": 337.33313, "b": 259.14703, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "- horizontal merges: \"C\", \"L\"", "bbox": {"l": 340.15491, "t": 252.93255999999997, "r": 421.98624, "b": 259.14703, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "3", "bbox": {"l": 334.51135, "t": 262.87048000000004, "r": 337.29868, "b": 269.08496, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "- vertical merges: \"C\", \"U\"", "bbox": {"l": 340.086, "t": 262.87048000000004, "r": 415.34375, "b": 269.08496, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "4", "bbox": {"l": 334.51135, "t": 272.80841, "r": 337.30188, "b": 279.02288999999996, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "- 2d merges: \"C\", \"L\", \"U\", \"X\"", "bbox": {"l": 340.09241, "t": 272.80841, "r": 426.59875, "b": 279.02288999999996, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "1", "bbox": {"l": 185.67178, "t": 244.04224, "r": 189.35544, "b": 250.25671, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "2", "bbox": {"l": 185.96759, "t": 268.34766, "r": 189.65125, "b": 274.56213, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "3", "bbox": {"l": 239.34152, "t": 243.62523999999996, "r": 243.02518, "b": 249.83972000000006, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "4", "bbox": {"l": 271.32852, "t": 243.49390000000005, "r": 275.01218, "b": 249.70836999999995, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "2", "bbox": {"l": 229.81627, "t": 166.51495, "r": 233.49992000000003, "b": 172.72942999999998, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "1", "bbox": {"l": 257.24402, "t": 189.961, "r": 260.92767, "b": 196.17548, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "3", "bbox": {"l": 186.87526, "t": 177.97668, "r": 190.55891, "b": 184.19115999999997, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "4", "bbox": {"l": 196.48746, "t": 169.01520000000005, "r": 200.17111, "b": 175.22968000000003, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "A", "bbox": {"l": 169.74728, "t": 167.88225999999997, "r": 175.72659, "b": 175.65039000000002, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "B", "bbox": {"l": 169.74728, "t": 206.83867999999995, "r": 175.72659, "b": 214.60681, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "C", "bbox": {"l": 274.29419, "t": 168.27972, "r": 280.2735, "b": 176.04785000000004, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "D", "bbox": {"l": 359.56152, "t": 168.27972, "r": 365.54083, "b": 176.04785000000004, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "E", "bbox": {"l": 169.74728, "t": 243.21149000000003, "r": 175.27112, "b": 250.97960999999998, "coord_origin": "TOPLEFT"}}], "children": [{"id": 19, "label": "text", "bbox": {"l": 374.49326, "t": 168.59362999999996, "r": 381.66843, "b": 177.91540999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": "C", "bbox": {"l": 374.49326, "t": 168.59362999999996, "r": 381.66843, "b": 177.91540999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 398.74011, "t": 168.50005999999996, "r": 405.91528, "b": 177.82183999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "C", "bbox": {"l": 398.74011, "t": 168.50005999999996, "r": 405.91528, "b": 177.82183999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 373.76862, "t": 192.92553999999996, "r": 380.94379, "b": 202.24730999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "C", "bbox": {"l": 373.76862, "t": 192.92553999999996, "r": 380.94379, "b": 202.24730999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 386.66388, "t": 193.07061999999996, "r": 393.83905, "b": 202.39239999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "C", "bbox": {"l": 386.66388, "t": 193.07061999999996, "r": 393.83905, "b": 202.39239999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 386.68707, "t": 205.13756999999998, "r": 393.86224, "b": 214.45934999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "C", "bbox": {"l": 386.68707, "t": 205.13756999999998, "r": 393.86224, "b": 214.45934999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 398.65729, "t": 180.73279000000002, "r": 405.83246, "b": 190.05457, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "C", "bbox": {"l": 398.65729, "t": 180.73279000000002, "r": 405.83246, "b": 190.05457, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 410.77908, "t": 180.73859000000004, "r": 417.95425, "b": 190.06035999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "C", "bbox": {"l": 410.77908, "t": 180.73859000000004, "r": 417.95425, "b": 190.06035999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 422.90503, "t": 180.65247, "r": 430.08020000000005, "b": 189.97424, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "C", "bbox": {"l": 422.90503, "t": 180.65247, "r": 430.08020000000005, "b": 189.97424, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 398.7807, "t": 192.98865, "r": 405.95587, "b": 202.31042000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "C", "bbox": {"l": 398.7807, "t": 192.98865, "r": 405.95587, "b": 202.31042000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 410.90164, "t": 192.99487, "r": 418.07681, "b": 202.31664999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "C", "bbox": {"l": 410.90164, "t": 192.99487, "r": 418.07681, "b": 202.31664999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 423.02753, "t": 192.909, "r": 430.2027, "b": 202.23077, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "C", "bbox": {"l": 423.02753, "t": 192.909, "r": 430.2027, "b": 202.23077, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 398.78235, "t": 205.31573000000003, "r": 405.95752, "b": 214.63751000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "C", "bbox": {"l": 398.78235, "t": 205.31573000000003, "r": 405.95752, "b": 214.63751000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 410.90414, "t": 205.32196, "r": 418.07932, "b": 214.64373999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "C", "bbox": {"l": 410.90414, "t": 205.32196, "r": 418.07932, "b": 214.64373999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 423.03003, "t": 205.23614999999995, "r": 430.20520000000005, "b": 214.55791999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "C", "bbox": {"l": 423.03003, "t": 205.23614999999995, "r": 430.20520000000005, "b": 214.55791999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 386.50574, "t": 217.03882, "r": 393.68091, "b": 226.36059999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "C", "bbox": {"l": 386.50574, "t": 217.03882, "r": 393.68091, "b": 226.36059999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 398.60181, "t": 217.21704, "r": 405.77698, "b": 226.53882, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "C", "bbox": {"l": 398.60181, "t": 217.21704, "r": 405.77698, "b": 226.53882, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 410.72275, "t": 217.22321, "r": 417.89792, "b": 226.54498, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "C", "bbox": {"l": 410.72275, "t": 217.22321, "r": 417.89792, "b": 226.54498, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 422.84869, "t": 217.13738999999998, "r": 430.02386, "b": 226.45916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "C", "bbox": {"l": 422.84869, "t": 217.13738999999998, "r": 430.02386, "b": 226.45916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 435.16009999999994, "t": 167.69011999999998, "r": 447.86273, "b": 177.01189999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "NL", "bbox": {"l": 435.16009999999994, "t": 167.69011999999998, "r": 447.86273, "b": 177.01189999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 435.44415, "t": 180.20025999999996, "r": 448.14679, "b": 189.52202999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "NL", "bbox": {"l": 435.44415, "t": 180.20025999999996, "r": 448.14679, "b": 189.52202999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 435.46735, "t": 192.49474999999995, "r": 448.16998000000007, "b": 201.81652999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "NL", "bbox": {"l": 435.46735, "t": 192.49474999999995, "r": 448.16998000000007, "b": 201.81652999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 435.38202, "t": 204.83025999999995, "r": 448.08466, "b": 214.15204000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "NL", "bbox": {"l": 435.38202, "t": 204.83025999999995, "r": 448.08466, "b": 214.15204000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 435.59906, "t": 217.2337, "r": 448.3017, "b": 226.55548, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "NL", "bbox": {"l": 435.59906, "t": 217.2337, "r": 448.3017, "b": 226.55548, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 374.14957, "t": 205.23492, "r": 381.32474, "b": 214.55669999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "U", "bbox": {"l": 374.14957, "t": 205.23492, "r": 381.32474, "b": 214.55669999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 374.0419, "t": 217.14648, "r": 381.21707, "b": 226.46826, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "U", "bbox": {"l": 374.0419, "t": 217.14648, "r": 381.21707, "b": 226.46826, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 374.34418, "t": 180.93488000000002, "r": 381.51935, "b": 190.25665000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "U", "bbox": {"l": 374.34418, "t": 180.93488000000002, "r": 381.51935, "b": 190.25665000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 387.76285, "t": 168.57788000000005, "r": 393.28833, "b": 177.89966000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "L", "bbox": {"l": 387.76285, "t": 168.57788000000005, "r": 393.28833, "b": 177.89966000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 411.86395, "t": 168.06195000000002, "r": 417.38943, "b": 177.38373, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "L", "bbox": {"l": 411.86395, "t": 168.06195000000002, "r": 417.38943, "b": 177.38373, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 423.33563, "t": 167.93439, "r": 428.86111, "b": 177.25616000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "L", "bbox": {"l": 423.33563, "t": 167.93439, "r": 428.86111, "b": 177.25616000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 387.13593, "t": 180.78576999999996, "r": 393.76453, "b": 190.10753999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "X", "bbox": {"l": 387.13593, "t": 180.78576999999996, "r": 393.76453, "b": 190.10753999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 282.2594, "t": 244.50878999999998, "r": 289.43457, "b": 253.83056999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "C", "bbox": {"l": 282.2594, "t": 244.50878999999998, "r": 289.43457, "b": 253.83056999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 282.11035, "t": 256.85022000000004, "r": 289.28552, "b": 266.172, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "U", "bbox": {"l": 282.11035, "t": 256.85022000000004, "r": 289.28552, "b": 266.172, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 282.40848, "t": 269.13300000000004, "r": 289.58365, "b": 278.45477000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "U", "bbox": {"l": 282.40848, "t": 269.13300000000004, "r": 289.58365, "b": 278.45477000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 295.52902, "t": 244.49347, "r": 301.0545, "b": 253.81525, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "L", "bbox": {"l": 295.52902, "t": 244.49347, "r": 301.0545, "b": 253.81525, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 307.46613, "t": 244.57372999999995, "r": 312.99161, "b": 253.89550999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "L", "bbox": {"l": 307.46613, "t": 244.57372999999995, "r": 312.99161, "b": 253.89550999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 318.76886, "t": 244.44037000000003, "r": 324.29434, "b": 253.76215000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "L", "bbox": {"l": 318.76886, "t": 244.44037000000003, "r": 324.29434, "b": 253.76215000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 294.9021, "t": 256.70154, "r": 301.03976, "b": 266.02332, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "X", "bbox": {"l": 294.9021, "t": 256.70154, "r": 301.03976, "b": 266.02332, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 307.17743, "t": 256.70154, "r": 325.59039, "b": 266.02332, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "X X", "bbox": {"l": 307.17743, "t": 256.70154, "r": 325.59039, "b": 266.02332, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 294.78949, "t": 269.25420999999994, "r": 300.92715, "b": 278.57599000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "X", "bbox": {"l": 294.78949, "t": 269.25420999999994, "r": 300.92715, "b": 278.57599000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 307.06482, "t": 269.25420999999994, "r": 325.47778, "b": 278.57599000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "X X", "bbox": {"l": 307.06482, "t": 269.25420999999994, "r": 325.47778, "b": 278.57599000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 195.93939, "t": 268.74798999999996, "r": 203.11456, "b": 278.06976, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "C", "bbox": {"l": 195.93939, "t": 268.74798999999996, "r": 203.11456, "b": 278.06976, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 209.20891, "t": 268.73267, "r": 214.73439, "b": 278.05444, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "L", "bbox": {"l": 209.20891, "t": 268.73267, "r": 214.73439, "b": 278.05444, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 221.14551, "t": 268.81293000000005, "r": 226.67099, "b": 278.13469999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "L", "bbox": {"l": 221.14551, "t": 268.81293000000005, "r": 226.67099, "b": 278.13469999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 232.44858, "t": 268.67957, "r": 237.97405999999998, "b": 278.00134, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "L", "bbox": {"l": 232.44858, "t": 268.67957, "r": 237.97405999999998, "b": 278.00134, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 196.21715, "t": 244.53961000000004, "r": 203.39232, "b": 253.86139000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "C", "bbox": {"l": 196.21715, "t": 244.53961000000004, "r": 203.39232, "b": 253.86139000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 250.32143, "t": 244.09813999999994, "r": 257.49661, "b": 253.41992000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "C", "bbox": {"l": 250.32143, "t": 244.09813999999994, "r": 257.49661, "b": 253.41992000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 250.17235999999997, "t": 256.43951000000004, "r": 257.34753, "b": 265.76129000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "U", "bbox": {"l": 250.17235999999997, "t": 256.43951000000004, "r": 257.34753, "b": 265.76129000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 250.47049000000004, "t": 268.72222999999997, "r": 257.64566, "b": 278.04400999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "U", "bbox": {"l": 250.47049000000004, "t": 268.72222999999997, "r": 257.64566, "b": 278.04400999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 334.51135, "t": 242.99463000000003, "r": 337.22485, "b": 249.20911, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "1", "bbox": {"l": 334.51135, "t": 242.99463000000003, "r": 337.22485, "b": 249.20911, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 339.93835, "t": 242.99463000000003, "r": 391.49472, "b": 249.20911, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "- simple cells: \"C\"", "bbox": {"l": 339.93835, "t": 242.99463000000003, "r": 391.49472, "b": 249.20911, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 334.51135, "t": 252.93255999999997, "r": 337.33313, "b": 259.14703, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "2", "bbox": {"l": 334.51135, "t": 252.93255999999997, "r": 337.33313, "b": 259.14703, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 340.15491, "t": 252.93255999999997, "r": 421.98624, "b": 259.14703, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "- horizontal merges: \"C\", \"L\"", "bbox": {"l": 340.15491, "t": 252.93255999999997, "r": 421.98624, "b": 259.14703, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 334.51135, "t": 262.87048000000004, "r": 337.29868, "b": 269.08496, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "3", "bbox": {"l": 334.51135, "t": 262.87048000000004, "r": 337.29868, "b": 269.08496, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 340.086, "t": 262.87048000000004, "r": 415.34375, "b": 269.08496, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "- vertical merges: \"C\", \"U\"", "bbox": {"l": 340.086, "t": 262.87048000000004, "r": 415.34375, "b": 269.08496, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "list_item", "bbox": {"l": 334.51135, "t": 272.80841, "r": 426.59875, "b": 279.02288999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.5250620245933533, "cells": [{"id": 60, "text": "4", "bbox": {"l": 334.51135, "t": 272.80841, "r": 337.30188, "b": 279.02288999999996, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "- 2d merges: \"C\", \"L\", \"U\", \"X\"", "bbox": {"l": 340.09241, "t": 272.80841, "r": 426.59875, "b": 279.02288999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 185.67178, "t": 244.04224, "r": 189.35544, "b": 250.25671, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "1", "bbox": {"l": 185.67178, "t": 244.04224, "r": 189.35544, "b": 250.25671, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 185.96759, "t": 268.34766, "r": 189.65125, "b": 274.56213, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "2", "bbox": {"l": 185.96759, "t": 268.34766, "r": 189.65125, "b": 274.56213, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 239.34152, "t": 243.62523999999996, "r": 243.02518, "b": 249.83972000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "3", "bbox": {"l": 239.34152, "t": 243.62523999999996, "r": 243.02518, "b": 249.83972000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 271.32852, "t": 243.49390000000005, "r": 275.01218, "b": 249.70836999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "4", "bbox": {"l": 271.32852, "t": 243.49390000000005, "r": 275.01218, "b": 249.70836999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 229.81627, "t": 166.51495, "r": 233.49992000000003, "b": 172.72942999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "2", "bbox": {"l": 229.81627, "t": 166.51495, "r": 233.49992000000003, "b": 172.72942999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 257.24402, "t": 189.961, "r": 260.92767, "b": 196.17548, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "1", "bbox": {"l": 257.24402, "t": 189.961, "r": 260.92767, "b": 196.17548, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 186.87526, "t": 177.97668, "r": 190.55891, "b": 184.19115999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "3", "bbox": {"l": 186.87526, "t": 177.97668, "r": 190.55891, "b": 184.19115999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 196.48746, "t": 169.01520000000005, "r": 200.17111, "b": 175.22968000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "4", "bbox": {"l": 196.48746, "t": 169.01520000000005, "r": 200.17111, "b": 175.22968000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 169.74728, "t": 167.88225999999997, "r": 175.72659, "b": 175.65039000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "A", "bbox": {"l": 169.74728, "t": 167.88225999999997, "r": 175.72659, "b": 175.65039000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 169.74728, "t": 206.83867999999995, "r": 175.72659, "b": 214.60681, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "B", "bbox": {"l": 169.74728, "t": 206.83867999999995, "r": 175.72659, "b": 214.60681, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 274.29419, "t": 168.27972, "r": 280.2735, "b": 176.04785000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "C", "bbox": {"l": 274.29419, "t": 168.27972, "r": 280.2735, "b": 176.04785000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 359.56152, "t": 168.27972, "r": 365.54083, "b": 176.04785000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "D", "bbox": {"l": 359.56152, "t": 168.27972, "r": 365.54083, "b": 176.04785000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 169.74728, "t": 243.21149000000003, "r": 175.27112, "b": 250.97960999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "E", "bbox": {"l": 169.74728, "t": 243.21149000000003, "r": 175.27112, "b": 250.97960999999998, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "section_header", "id": 9, "page_no": 6, "cluster": {"id": 9, "label": "section_header", "bbox": {"l": 134.765, "t": 305.29581, "r": 246.65197999999998, "b": 314.10275, "coord_origin": "TOPLEFT"}, "confidence": 0.923302412033081, "cells": [{"id": 75, "text": "4.2", "bbox": {"l": 134.765, "t": 305.29581, "r": 149.40205, "b": 314.10275, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "Language Syntax", "bbox": {"l": 160.85904, "t": 305.29581, "r": 246.65197999999998, "b": 314.10275, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4.2 Language Syntax"}, {"label": "text", "id": 10, "page_no": 6, "cluster": {"id": 10, "label": "text", "bbox": {"l": 134.765, "t": 325.24777, "r": 363.79617, "b": 334.04474, "coord_origin": "TOPLEFT"}, "confidence": 0.9169169068336487, "cells": [{"id": 77, "text": "The OTSL representation follows these syntax rules:", "bbox": {"l": 134.765, "t": 325.24777, "r": 363.79617, "b": 334.04474, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The OTSL representation follows these syntax rules:"}, {"label": "list_item", "id": 3, "page_no": 6, "cluster": {"id": 3, "label": "list_item", "bbox": {"l": 138.97299, "t": 347.17081, "r": 480.58902, "b": 367.93375, "coord_origin": "TOPLEFT"}, "confidence": 0.958811342716217, "cells": [{"id": 78, "text": "1.", "bbox": {"l": 138.97299, "t": 347.18079, "r": 146.71991, "b": 355.97775, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "Left-looking cell rule", "bbox": {"l": 151.70099, "t": 347.17081, "r": 257.37927, "b": 355.97775, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": ": The left neighbour of an \"L\" cell must be either", "bbox": {"l": 257.383, "t": 347.18079, "r": 480.58902, "b": 355.97775, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "another \"L\" cell or a \"C\" cell.", "bbox": {"l": 151.70099, "t": 359.13678, "r": 283.59387, "b": 367.93375, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1. Left-looking cell rule : The left neighbour of an \"L\" cell must be either another \"L\" cell or a \"C\" cell."}, {"label": "list_item", "id": 4, "page_no": 6, "cluster": {"id": 4, "label": "list_item", "bbox": {"l": 138.97299, "t": 371.08481, "r": 480.59229000000005, "b": 391.84673999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9585386514663696, "cells": [{"id": 82, "text": "2.", "bbox": {"l": 138.97299, "t": 371.09479, "r": 146.71991, "b": 379.89175, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "Up-looking cell rule", "bbox": {"l": 151.70099, "t": 371.08481, "r": 252.11203, "b": 379.89175, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": ": The upper neighbour of a \"U\" cell must be either", "bbox": {"l": 252.112, "t": 371.09479, "r": 480.59229000000005, "b": 379.89175, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "another \"U\" cell or a \"C\" cell.", "bbox": {"l": 151.70099, "t": 383.04977, "r": 284.8392, "b": 391.84673999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2. Up-looking cell rule : The upper neighbour of a \"U\" cell must be either another \"U\" cell or a \"C\" cell."}, {"label": "section_header", "id": 14, "page_no": 6, "cluster": {"id": 14, "label": "section_header", "bbox": {"l": 138.97299, "t": 394.99780000000004, "r": 226.07360999999997, "b": 403.80475, "coord_origin": "TOPLEFT"}, "confidence": 0.6506174802780151, "cells": [{"id": 86, "text": "3.", "bbox": {"l": 138.97299, "t": 395.0077800000001, "r": 146.71991, "b": 403.80475, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Cross cell rule", "bbox": {"l": 151.70099, "t": 394.99780000000004, "r": 223.3042, "b": 403.80475, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": ":", "bbox": {"l": 223.30699, "t": 395.0077800000001, "r": 226.07360999999997, "b": 403.80475, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3. Cross cell rule :"}, {"label": "list_item", "id": 13, "page_no": 6, "cluster": {"id": 13, "label": "list_item", "bbox": {"l": 151.70099, "t": 406.96677, "r": 480.59238, "b": 439.67371, "coord_origin": "TOPLEFT"}, "confidence": 0.7247233390808105, "cells": [{"id": 89, "text": "The left neighbour of an \"X\" cell must be either another \"X\" cell or a \"U\"", "bbox": {"l": 151.70099, "t": 406.96677, "r": 480.59238, "b": 415.76373, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "cell, and the upper neighbour of an \"X\" cell must be either another \"X\" cell", "bbox": {"l": 151.70099, "t": 418.9217499999999, "r": 480.59219, "b": 427.71871999999996, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "or an \"L\" cell.", "bbox": {"l": 151.70099, "t": 430.87674, "r": 214.39663999999996, "b": 439.67371, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The left neighbour of an \"X\" cell must be either another \"X\" cell or a \"U\" cell, and the upper neighbour of an \"X\" cell must be either another \"X\" cell or an \"L\" cell."}, {"label": "list_item", "id": 8, "page_no": 6, "cluster": {"id": 8, "label": "list_item", "bbox": {"l": 138.97299, "t": 442.82574, "r": 474.59018, "b": 451.63269, "coord_origin": "TOPLEFT"}, "confidence": 0.9259927272796631, "cells": [{"id": 92, "text": "4.", "bbox": {"l": 138.97299, "t": 442.83572, "r": 146.71991, "b": 451.63269, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "First row rule", "bbox": {"l": 151.70099, "t": 442.82574, "r": 221.32263, "b": 451.63269, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": ": Only \"L\" cells and \"C\" cells are allowed in the first row.", "bbox": {"l": 221.32700000000003, "t": 442.83572, "r": 474.59018, "b": 451.63269, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4. First row rule : Only \"L\" cells and \"C\" cells are allowed in the first row."}, {"label": "list_item", "id": 5, "page_no": 6, "cluster": {"id": 5, "label": "list_item", "bbox": {"l": 138.97299, "t": 454.78375, "r": 480.58746, "b": 475.54568, "coord_origin": "TOPLEFT"}, "confidence": 0.9420597553253174, "cells": [{"id": 95, "text": "5.", "bbox": {"l": 138.97299, "t": 454.7937299999999, "r": 146.71991, "b": 463.5907, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "First column rule", "bbox": {"l": 151.70099, "t": 454.78375, "r": 240.71982, "b": 463.5907, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": ": Only \"U\" cells and \"C\" cells are allowed in the first", "bbox": {"l": 240.71599, "t": 454.7937299999999, "r": 480.58746, "b": 463.5907, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "column.", "bbox": {"l": 151.70099, "t": 466.74872, "r": 186.0072, "b": 475.54568, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5. First column rule : Only \"U\" cells and \"C\" cells are allowed in the first column."}, {"label": "list_item", "id": 1, "page_no": 6, "cluster": {"id": 1, "label": "list_item", "bbox": {"l": 138.97299, "t": 478.69675, "r": 480.59457, "b": 499.45969, "coord_origin": "TOPLEFT"}, "confidence": 0.961783230304718, "cells": [{"id": 99, "text": "6.", "bbox": {"l": 138.97299, "t": 478.70673, "r": 146.71991, "b": 487.50369, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "Rectangular rule", "bbox": {"l": 151.70099, "t": 478.69675, "r": 235.15768, "b": 487.50369, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": ": The table representation is always rectangular - all rows", "bbox": {"l": 235.15697999999998, "t": 478.70673, "r": 480.59457, "b": 487.50369, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "must have an equal number of tokens, terminated with \"NL\" token.", "bbox": {"l": 151.70099, "t": 490.66272, "r": 448.04147, "b": 499.45969, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "6. Rectangular rule : The table representation is always rectangular - all rows must have an equal number of tokens, terminated with \"NL\" token."}, {"label": "text", "id": 0, "page_no": 6, "cluster": {"id": 0, "label": "text", "bbox": {"l": 134.76498, "t": 512.59271, "r": 480.59583, "b": 640.9416699999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9785562753677368, "cells": [{"id": 103, "text": "The application of these rules gives OTSL a set of unique properties. First", "bbox": {"l": 149.70898, "t": 512.59271, "r": 480.59583, "b": 521.38968, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "of all, the OTSL enforces a strictly rectangular structure representation, where", "bbox": {"l": 134.76498, "t": 524.5477000000001, "r": 480.59079, "b": 533.34467, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "every new-line token starts a new row. As a consequence, all rows and all columns", "bbox": {"l": 134.76498, "t": 536.5027, "r": 480.59482, "b": 545.29967, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "have exactly the same number of tokens, irrespective of cell spans. Secondly, the", "bbox": {"l": 134.76498, "t": 548.4586899999999, "r": 480.58865000000003, "b": 557.25566, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "OTSL representation is unambiguous: Every table structure is represented in one", "bbox": {"l": 134.76498, "t": 560.4137000000001, "r": 480.59365999999994, "b": 569.21066, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "way. In this representation every table cell corresponds to a \"C\"-cell token, which", "bbox": {"l": 134.76498, "t": 572.3687, "r": 480.58673, "b": 581.16566, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "in case of spans is always located in the top-left corner of the table cell definition.", "bbox": {"l": 134.76498, "t": 584.3237, "r": 480.59171, "b": 593.12067, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "Third, OTSL syntax rules are only backward-looking. As a consequence, every", "bbox": {"l": 134.76498, "t": 596.2787, "r": 480.59180000000003, "b": 605.07567, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "predicted token can be validated straight during sequence generation by looking", "bbox": {"l": 134.76498, "t": 608.2347, "r": 480.5936899999999, "b": 617.03166, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "at the previously predicted sequence. As such, OTSL can guarantee that every", "bbox": {"l": 134.76498, "t": 620.1897, "r": 480.59072999999995, "b": 628.98666, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "predicted sequence is syntactically valid.", "bbox": {"l": 134.76498, "t": 632.1447000000001, "r": 311.19769, "b": 640.9416699999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The application of these rules gives OTSL a set of unique properties. First of all, the OTSL enforces a strictly rectangular structure representation, where every new-line token starts a new row. As a consequence, all rows and all columns have exactly the same number of tokens, irrespective of cell spans. Secondly, the OTSL representation is unambiguous: Every table structure is represented in one way. In this representation every table cell corresponds to a \"C\"-cell token, which in case of spans is always located in the top-left corner of the table cell definition. Third, OTSL syntax rules are only backward-looking. As a consequence, every predicted token can be validated straight during sequence generation by looking at the previously predicted sequence. As such, OTSL can guarantee that every predicted sequence is syntactically valid."}, {"label": "text", "id": 2, "page_no": 6, "cluster": {"id": 2, "label": "text", "bbox": {"l": 134.76498, "t": 644.1026899999999, "r": 480.59265, "b": 664.8546699999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9590610861778259, "cells": [{"id": 114, "text": "These characteristics can be easily learned by sequence generator networks,", "bbox": {"l": 149.70898, "t": 644.1026899999999, "r": 480.59186, "b": 652.89966, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "as we demonstrate further below. We find strong indications that this pattern", "bbox": {"l": 134.76498, "t": 656.05769, "r": 480.59265, "b": 664.8546699999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "These characteristics can be easily learned by sequence generator networks, as we demonstrate further below. We find strong indications that this pattern"}], "headers": [{"label": "page_header", "id": 7, "page_no": 6, "cluster": {"id": 7, "label": "page_header", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9326512813568115, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Optimized Table Tokenization for Table Structure Recognition"}, {"label": "page_header", "id": 11, "page_no": 6, "cluster": {"id": 11, "label": "page_header", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8749732971191406, "cells": [{"id": 1, "text": "7", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "7"}]}}, {"page_no": 7, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "8", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "M.", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 178.07675, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37415, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "reduces significantly the column drift seen in the HTML based models (see Fig-", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.58884000000006, "b": 127.73077, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "ure 5).", "bbox": {"l": 134.765, "t": 130.88878999999997, "r": 163.56389, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "4.3", "bbox": {"l": 134.765, "t": 161.55682000000002, "r": 149.40205, "b": 170.36377000000005, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Error-detection and -mitigation", "bbox": {"l": 160.85904, "t": 161.55682000000002, "r": 319.34708, "b": 170.36377000000005, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "The design of OTSL allows to validate a table structure easily on an unfinished", "bbox": {"l": 134.765, "t": 182.28179999999998, "r": 480.59572999999995, "b": 191.0788, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "sequence. The detection of an invalid sequence token is a clear indication of a", "bbox": {"l": 134.765, "t": 194.23779000000002, "r": 480.59473, "b": 203.03479000000004, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "prediction mistake, however a valid sequence by itself does not guarantee pre-", "bbox": {"l": 134.765, "t": 206.19281, "r": 480.58678999999995, "b": 214.98981000000003, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "diction correctness. Different heuristics can be used to correct token errors in", "bbox": {"l": 134.765, "t": 218.14783, "r": 480.59177000000005, "b": 226.94482000000005, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "an invalid sequence and thus increase the chances for accurate predictions. Such", "bbox": {"l": 134.765, "t": 230.10284000000001, "r": 480.58768, "b": 238.89984000000004, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "heuristics can be applied either after the prediction of each token, or at the end", "bbox": {"l": 134.765, "t": 242.05786, "r": 480.5867, "b": 250.85486000000003, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "on the entire predicted sequence. For example a simple heuristic which can cor-", "bbox": {"l": 134.765, "t": 254.01288, "r": 480.5938100000001, "b": 262.80988, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "rect the predicted OTSL sequence on-the-fly is to verify if the token with the", "bbox": {"l": 134.765, "t": 265.96887000000004, "r": 480.59069999999997, "b": 274.76586999999995, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "highest prediction confidence invalidates the predicted sequence, and replace it", "bbox": {"l": 134.765, "t": 277.92389000000003, "r": 480.5957599999999, "b": 286.72086, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "by the token with the next highest confidence until OTSL rules are satisfied.", "bbox": {"l": 134.765, "t": 289.8788799999999, "r": 469.40369, "b": 298.67584, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "5", "bbox": {"l": 134.765, "t": 321.164, "r": 141.4886, "b": 331.73239000000007, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Experiments", "bbox": {"l": 154.9382, "t": 321.164, "r": 229.03534, "b": 331.73239000000007, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "To evaluate the impact of OTSL on prediction accuracy and inference times, we", "bbox": {"l": 134.765, "t": 347.24985, "r": 480.59375, "b": 356.04681, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "conducted a series of experiments based on the TableFormer model (Figure 4)", "bbox": {"l": 134.765, "t": 359.2048300000001, "r": 480.59476, "b": 368.0018, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "with two objectives: Firstly we evaluate the prediction quality and performance", "bbox": {"l": 134.765, "t": 371.15982, "r": 480.58786000000003, "b": 379.95679, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "of OTSL vs. HTML after performing Hyper Parameter Optimization (HPO) on", "bbox": {"l": 134.765, "t": 383.11481000000003, "r": 480.58777, "b": 391.91177, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "the", "bbox": {"l": 134.765, "t": 395.06978999999995, "r": 148.59807, "b": 403.86676, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "canonical", "bbox": {"l": 151.627, "t": 395.06978999999995, "r": 191.84703, "b": 403.86676, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "PubTabNet data set. Secondly we pick the best hyper-parameters", "bbox": {"l": 195.90201, "t": 395.06978999999995, "r": 480.59528, "b": 403.86676, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "found in the first step and evaluate how OTSL impacts the performance of", "bbox": {"l": 134.76501, "t": 407.02478, "r": 480.59283000000005, "b": 415.82175, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "TableFormer after training on other publicly available data sets (FinTabNet,", "bbox": {"l": 134.76501, "t": 418.98077, "r": 480.59476, "b": 427.77774, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "PubTables-1M [14]). The ground truth (GT) from all data sets has been con-", "bbox": {"l": 134.76501, "t": 430.93576, "r": 480.59171, "b": 439.73273, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "verted into OTSL format for this purpose, and will be made publicly available.", "bbox": {"l": 134.76501, "t": 442.8907500000001, "r": 479.30258, "b": 451.6877099999999, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Fig. 4.", "bbox": {"l": 134.76501, "t": 484.64813, "r": 162.64424, "b": 492.57443, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Architecture sketch of the TableFormer model, which is a representative for the", "bbox": {"l": 165.19601, "t": 484.71091, "r": 480.59082, "b": 492.78067, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Im2Seq approach.", "bbox": {"l": 134.76501, "t": 495.66989, "r": 206.70245, "b": 503.73965, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "1.", "bbox": {"l": 147.30025, "t": 540.73164, "r": 149.70605, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Item", "bbox": {"l": 150.90895, "t": 540.73164, "r": 155.72055, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "Amount", "bbox": {"l": 162.75987, "t": 535.3938, "r": 172.2963, "b": 537.76224, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Names", "bbox": {"l": 147.63603, "t": 535.3661500000001, "r": 155.91753, "b": 537.73459, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "1000", "bbox": {"l": 158.48466, "t": 540.73164, "r": 164.10178, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "500", "bbox": {"l": 158.48466, "t": 544.67065, "r": 162.69737, "b": 547.03909, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "3500", "bbox": {"l": 158.48466, "t": 548.91264, "r": 164.10178, "b": 551.28108, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "150", "bbox": {"l": 158.48466, "t": 553.15465, "r": 162.69737, "b": 555.52309, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "unit", "bbox": {"l": 168.81696, "t": 540.73164, "r": 172.88876, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "unit", "bbox": {"l": 168.81696, "t": 544.67065, "r": 172.88876, "b": 547.03909, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "unit", "bbox": {"l": 168.81696, "t": 548.91264, "r": 172.88876, "b": 551.28108, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "unit", "bbox": {"l": 168.81696, "t": 553.15465, "r": 172.88876, "b": 555.52309, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "2.", "bbox": {"l": 147.30025, "t": 544.67065, "r": 149.70605, "b": 547.03909, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "Item", "bbox": {"l": 150.90895, "t": 544.67065, "r": 155.72055, "b": 547.03909, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "3.", "bbox": {"l": 147.30025, "t": 548.91264, "r": 149.70605, "b": 551.28108, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Item", "bbox": {"l": 150.90895, "t": 548.91264, "r": 155.72055, "b": 551.28108, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "4.", "bbox": {"l": 147.30025, "t": 553.15465, "r": 149.70605, "b": 555.52309, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Item", "bbox": {"l": 150.90895, "t": 553.15465, "r": 155.72055, "b": 555.52309, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Extracted", "bbox": {"l": 152.05046, "t": 517.0098, "r": 171.24945, "b": 521.27298, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Table Images", "bbox": {"l": 148.13347, "t": 522.3122900000001, "r": 175.16759, "b": 526.57547, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Standardized", "bbox": {"l": 193.53331, "t": 524.51422, "r": 220.31973, "b": 528.7774, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "Images", "bbox": {"l": 199.47311, "t": 529.8167100000001, "r": 214.37889, "b": 534.0799, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "BBox", "bbox": {"l": 273.61066, "t": 509.9053, "r": 284.47275, "b": 514.16849, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Decoder", "bbox": {"l": 270.45187, "t": 513.6928399999999, "r": 287.63242, "b": 517.9560200000001, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "BBoxes", "bbox": {"l": 332.47852, "t": 508.14438, "r": 348.14014, "b": 512.40756, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "BBoxes can be", "bbox": {"l": 376.68622, "t": 521.12024, "r": 407.25497, "b": 525.38342, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "traced back to the", "bbox": {"l": 373.90869, "t": 525.66525, "r": 410.03506, "b": 529.92844, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "original image to", "bbox": {"l": 375.29871, "t": 530.21024, "r": 408.64902, "b": 534.47342, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "extract content", "bbox": {"l": 377.06747, "t": 534.75522, "r": 406.88312, "b": 539.01843, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "Structure Tags sequence", "bbox": {"l": 383.56683, "t": 563.24176, "r": 433.76544, "b": 567.50497, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "provide full description of", "bbox": {"l": 383.52768, "t": 567.78676, "r": 433.80764999999997, "b": 572.04997, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "the table structure", "bbox": {"l": 390.47522, "t": 572.33177, "r": 426.85703, "b": 576.59499, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "Structure Tags", "bbox": {"l": 293.94702, "t": 577.89143, "r": 323.1691, "b": 582.15465, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "in OTSL format", "bbox": {"l": 293.94702, "t": 582.43648, "r": 324.59396, "b": 586.69969, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "BBoxes in sync", "bbox": {"l": 333.07819, "t": 541.82269, "r": 364.14691, "b": 546.08591, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "with tag sequence", "bbox": {"l": 333.07819, "t": 545.6102, "r": 369.71542, "b": 549.87341, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "Encoder", "bbox": {"l": 232.65881000000002, "t": 515.24139, "r": 249.58894000000004, "b": 519.50458, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "Structure", "bbox": {"l": 269.8219, "t": 545.97102, "r": 288.26279, "b": 550.23424, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Decoder", "bbox": {"l": 270.45187, "t": 549.75851, "r": 287.63242, "b": 554.0217299999999, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "[x1, y2, x2, y2]", "bbox": {"l": 332.17676, "t": 515.91205, "r": 358.11206, "b": 520.17523, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "[x1', y2', x2', y2']", "bbox": {"l": 332.17676, "t": 521.9720500000001, "r": 361.58298, "b": 526.23523, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "[x1'', y2'', x2'', y2'']", "bbox": {"l": 332.17676, "t": 528.03204, "r": 364.76474, "b": 532.29523, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "...", "bbox": {"l": 332.17676, "t": 534.09204, "r": 335.96548, "b": 538.35524, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "1", "bbox": {"l": 326.8894, "t": 516.39508, "r": 329.41641, "b": 520.6582599999999, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "2", "bbox": {"l": 327.04089, "t": 522.4247700000001, "r": 329.5679, "b": 526.68796, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "3", "bbox": {"l": 327.04089, "t": 528.51508, "r": 329.5679, "b": 532.77826, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "3", "bbox": {"l": 424.14102, "t": 527.4428399999999, "r": 426.66803, "b": 531.7060200000001, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "2", "bbox": {"l": 453.0018, "t": 517.4539500000001, "r": 455.52881, "b": 521.71713, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "1", "bbox": {"l": 423.85825, "t": 517.06281, "r": 426.38525, "b": 521.32599, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "C", "bbox": {"l": 333.4342, "t": 557.36679, "r": 337.27542, "b": 562.35719, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "C", "bbox": {"l": 340.35397, "t": 557.31679, "r": 344.19519, "b": 562.30719, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "C", "bbox": {"l": 340.30978, "t": 563.8653899999999, "r": 344.151, "b": 568.8557900000001, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "C", "bbox": {"l": 346.79904, "t": 563.8686700000001, "r": 350.64026, "b": 568.85907, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "C", "bbox": {"l": 333.59583, "t": 563.82271, "r": 337.43704, "b": 568.81311, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "C", "bbox": {"l": 340.37543, "t": 570.42673, "r": 344.21664, "b": 575.41713, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "C", "bbox": {"l": 346.86469, "t": 570.43001, "r": 350.7059, "b": 575.42041, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "C", "bbox": {"l": 333.66144, "t": 570.38405, "r": 337.50266, "b": 575.37445, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "C", "bbox": {"l": 340.37671, "t": 577.02606, "r": 344.21793, "b": 582.0164599999999, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "C", "bbox": {"l": 346.86597, "t": 577.02934, "r": 350.70718, "b": 582.01974, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "C", "bbox": {"l": 333.66272, "t": 576.98338, "r": 337.50394, "b": 581.97379, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "C", "bbox": {"l": 340.27948, "t": 583.39737, "r": 344.1207, "b": 588.38777, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "C", "bbox": {"l": 346.76874, "t": 583.40068, "r": 350.60995, "b": 588.39108, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "C", "bbox": {"l": 333.56549, "t": 583.35474, "r": 337.40671, "b": 588.34514, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "NL", "bbox": {"l": 353.03326, "t": 556.8831299999999, "r": 359.83362, "b": 561.87354, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "NL", "bbox": {"l": 353.18604, "t": 563.58044, "r": 359.98639, "b": 568.57085, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "NL", "bbox": {"l": 353.19864, "t": 570.1623500000001, "r": 359.99899, "b": 575.15276, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "NL", "bbox": {"l": 353.1532, "t": 576.76611, "r": 359.95355, "b": 581.75652, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "NL", "bbox": {"l": 353.26935, "t": 583.40628, "r": 360.0697, "b": 588.3966800000001, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "L", "bbox": {"l": 347.37979, "t": 557.08235, "r": 350.33786, "b": 562.07275, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "3", "bbox": {"l": 331.14026, "t": 564.2907700000001, "r": 333.66727, "b": 568.55399, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "2", "bbox": {"l": 340.80972, "t": 554.59312, "r": 343.33673, "b": 558.85634, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "1", "bbox": {"l": 330.97992, "t": 554.83035, "r": 333.50693, "b": 559.09357, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "We rely on standard metrics such as Tree Edit Distance score (TEDs) for", "bbox": {"l": 149.709, "t": 620.19278, "r": 480.58792, "b": 628.98975, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "table structure prediction, and Mean Average Precision (mAP) with 0.75 Inter-", "bbox": {"l": 134.765, "t": 632.14778, "r": 480.58871, "b": 640.94475, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "section Over Union (IOU) threshold for the bounding-box predictions of table", "bbox": {"l": 134.765, "t": 644.1027799999999, "r": 480.5917400000001, "b": 652.89975, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "cells. The predicted OTSL structures were converted back to HTML format in", "bbox": {"l": 134.765, "t": 656.0577900000001, "r": 480.58968999999996, "b": 664.8547599999999, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 9, "label": "page_header", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8301324844360352, "cells": [{"id": 0, "text": "8", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "page_header", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8631827235221863, "cells": [{"id": 1, "text": "M.", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 178.07675, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37415, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "text", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.58884000000006, "b": 139.68579, "coord_origin": "TOPLEFT"}, "confidence": 0.9464746713638306, "cells": [{"id": 3, "text": "reduces significantly the column drift seen in the HTML based models (see Fig-", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.58884000000006, "b": 127.73077, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "ure 5).", "bbox": {"l": 134.765, "t": 130.88878999999997, "r": 163.56389, "b": 139.68579, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "section_header", "bbox": {"l": 134.765, "t": 161.55682000000002, "r": 319.34708, "b": 170.36377000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9549515843391418, "cells": [{"id": 5, "text": "4.3", "bbox": {"l": 134.765, "t": 161.55682000000002, "r": 149.40205, "b": 170.36377000000005, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Error-detection and -mitigation", "bbox": {"l": 160.85904, "t": 161.55682000000002, "r": 319.34708, "b": 170.36377000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 134.765, "t": 182.28179999999998, "r": 480.5957599999999, "b": 298.67584, "coord_origin": "TOPLEFT"}, "confidence": 0.9879790544509888, "cells": [{"id": 7, "text": "The design of OTSL allows to validate a table structure easily on an unfinished", "bbox": {"l": 134.765, "t": 182.28179999999998, "r": 480.59572999999995, "b": 191.0788, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "sequence. The detection of an invalid sequence token is a clear indication of a", "bbox": {"l": 134.765, "t": 194.23779000000002, "r": 480.59473, "b": 203.03479000000004, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "prediction mistake, however a valid sequence by itself does not guarantee pre-", "bbox": {"l": 134.765, "t": 206.19281, "r": 480.58678999999995, "b": 214.98981000000003, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "diction correctness. Different heuristics can be used to correct token errors in", "bbox": {"l": 134.765, "t": 218.14783, "r": 480.59177000000005, "b": 226.94482000000005, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "an invalid sequence and thus increase the chances for accurate predictions. Such", "bbox": {"l": 134.765, "t": 230.10284000000001, "r": 480.58768, "b": 238.89984000000004, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "heuristics can be applied either after the prediction of each token, or at the end", "bbox": {"l": 134.765, "t": 242.05786, "r": 480.5867, "b": 250.85486000000003, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "on the entire predicted sequence. For example a simple heuristic which can cor-", "bbox": {"l": 134.765, "t": 254.01288, "r": 480.5938100000001, "b": 262.80988, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "rect the predicted OTSL sequence on-the-fly is to verify if the token with the", "bbox": {"l": 134.765, "t": 265.96887000000004, "r": 480.59069999999997, "b": 274.76586999999995, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "highest prediction confidence invalidates the predicted sequence, and replace it", "bbox": {"l": 134.765, "t": 277.92389000000003, "r": 480.5957599999999, "b": 286.72086, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "by the token with the next highest confidence until OTSL rules are satisfied.", "bbox": {"l": 134.765, "t": 289.8788799999999, "r": 469.40369, "b": 298.67584, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "section_header", "bbox": {"l": 134.765, "t": 321.164, "r": 229.03534, "b": 331.73239000000007, "coord_origin": "TOPLEFT"}, "confidence": 0.9515273571014404, "cells": [{"id": 17, "text": "5", "bbox": {"l": 134.765, "t": 321.164, "r": 141.4886, "b": 331.73239000000007, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Experiments", "bbox": {"l": 154.9382, "t": 321.164, "r": 229.03534, "b": 331.73239000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 134.765, "t": 347.24985, "r": 480.59528, "b": 451.6877099999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9877985119819641, "cells": [{"id": 19, "text": "To evaluate the impact of OTSL on prediction accuracy and inference times, we", "bbox": {"l": 134.765, "t": 347.24985, "r": 480.59375, "b": 356.04681, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "conducted a series of experiments based on the TableFormer model (Figure 4)", "bbox": {"l": 134.765, "t": 359.2048300000001, "r": 480.59476, "b": 368.0018, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "with two objectives: Firstly we evaluate the prediction quality and performance", "bbox": {"l": 134.765, "t": 371.15982, "r": 480.58786000000003, "b": 379.95679, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "of OTSL vs. HTML after performing Hyper Parameter Optimization (HPO) on", "bbox": {"l": 134.765, "t": 383.11481000000003, "r": 480.58777, "b": 391.91177, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "the", "bbox": {"l": 134.765, "t": 395.06978999999995, "r": 148.59807, "b": 403.86676, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "canonical", "bbox": {"l": 151.627, "t": 395.06978999999995, "r": 191.84703, "b": 403.86676, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "PubTabNet data set. Secondly we pick the best hyper-parameters", "bbox": {"l": 195.90201, "t": 395.06978999999995, "r": 480.59528, "b": 403.86676, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "found in the first step and evaluate how OTSL impacts the performance of", "bbox": {"l": 134.76501, "t": 407.02478, "r": 480.59283000000005, "b": 415.82175, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "TableFormer after training on other publicly available data sets (FinTabNet,", "bbox": {"l": 134.76501, "t": 418.98077, "r": 480.59476, "b": 427.77774, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "PubTables-1M [14]). The ground truth (GT) from all data sets has been con-", "bbox": {"l": 134.76501, "t": 430.93576, "r": 480.59171, "b": 439.73273, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "verted into OTSL format for this purpose, and will be made publicly available.", "bbox": {"l": 134.76501, "t": 442.8907500000001, "r": 479.30258, "b": 451.6877099999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "caption", "bbox": {"l": 134.76501, "t": 484.64813, "r": 480.59082, "b": 503.73965, "coord_origin": "TOPLEFT"}, "confidence": 0.9297955632209778, "cells": [{"id": 30, "text": "Fig. 4.", "bbox": {"l": 134.76501, "t": 484.64813, "r": 162.64424, "b": 492.57443, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Architecture sketch of the TableFormer model, which is a representative for the", "bbox": {"l": 165.19601, "t": 484.71091, "r": 480.59082, "b": 492.78067, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Im2Seq approach.", "bbox": {"l": 134.76501, "t": 495.66989, "r": 206.70245, "b": 503.73965, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "picture", "bbox": {"l": 140.7096710205078, "t": 508.06390380859375, "r": 472.73382568359375, "b": 593.67724609375, "coord_origin": "TOPLEFT"}, "confidence": 0.9303393959999084, "cells": [{"id": 33, "text": "1.", "bbox": {"l": 147.30025, "t": 540.73164, "r": 149.70605, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Item", "bbox": {"l": 150.90895, "t": 540.73164, "r": 155.72055, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "Amount", "bbox": {"l": 162.75987, "t": 535.3938, "r": 172.2963, "b": 537.76224, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Names", "bbox": {"l": 147.63603, "t": 535.3661500000001, "r": 155.91753, "b": 537.73459, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "1000", "bbox": {"l": 158.48466, "t": 540.73164, "r": 164.10178, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "500", "bbox": {"l": 158.48466, "t": 544.67065, "r": 162.69737, "b": 547.03909, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "3500", "bbox": {"l": 158.48466, "t": 548.91264, "r": 164.10178, "b": 551.28108, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "150", "bbox": {"l": 158.48466, "t": 553.15465, "r": 162.69737, "b": 555.52309, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "unit", "bbox": {"l": 168.81696, "t": 540.73164, "r": 172.88876, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "unit", "bbox": {"l": 168.81696, "t": 544.67065, "r": 172.88876, "b": 547.03909, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "unit", "bbox": {"l": 168.81696, "t": 548.91264, "r": 172.88876, "b": 551.28108, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "unit", "bbox": {"l": 168.81696, "t": 553.15465, "r": 172.88876, "b": 555.52309, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "2.", "bbox": {"l": 147.30025, "t": 544.67065, "r": 149.70605, "b": 547.03909, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "Item", "bbox": {"l": 150.90895, "t": 544.67065, "r": 155.72055, "b": 547.03909, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "3.", "bbox": {"l": 147.30025, "t": 548.91264, "r": 149.70605, "b": 551.28108, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Item", "bbox": {"l": 150.90895, "t": 548.91264, "r": 155.72055, "b": 551.28108, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "4.", "bbox": {"l": 147.30025, "t": 553.15465, "r": 149.70605, "b": 555.52309, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Item", "bbox": {"l": 150.90895, "t": 553.15465, "r": 155.72055, "b": 555.52309, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Extracted", "bbox": {"l": 152.05046, "t": 517.0098, "r": 171.24945, "b": 521.27298, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Table Images", "bbox": {"l": 148.13347, "t": 522.3122900000001, "r": 175.16759, "b": 526.57547, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Standardized", "bbox": {"l": 193.53331, "t": 524.51422, "r": 220.31973, "b": 528.7774, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "Images", "bbox": {"l": 199.47311, "t": 529.8167100000001, "r": 214.37889, "b": 534.0799, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "BBox", "bbox": {"l": 273.61066, "t": 509.9053, "r": 284.47275, "b": 514.16849, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Decoder", "bbox": {"l": 270.45187, "t": 513.6928399999999, "r": 287.63242, "b": 517.9560200000001, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "BBoxes", "bbox": {"l": 332.47852, "t": 508.14438, "r": 348.14014, "b": 512.40756, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "BBoxes can be", "bbox": {"l": 376.68622, "t": 521.12024, "r": 407.25497, "b": 525.38342, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "traced back to the", "bbox": {"l": 373.90869, "t": 525.66525, "r": 410.03506, "b": 529.92844, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "original image to", "bbox": {"l": 375.29871, "t": 530.21024, "r": 408.64902, "b": 534.47342, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "extract content", "bbox": {"l": 377.06747, "t": 534.75522, "r": 406.88312, "b": 539.01843, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "Structure Tags sequence", "bbox": {"l": 383.56683, "t": 563.24176, "r": 433.76544, "b": 567.50497, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "provide full description of", "bbox": {"l": 383.52768, "t": 567.78676, "r": 433.80764999999997, "b": 572.04997, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "the table structure", "bbox": {"l": 390.47522, "t": 572.33177, "r": 426.85703, "b": 576.59499, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "Structure Tags", "bbox": {"l": 293.94702, "t": 577.89143, "r": 323.1691, "b": 582.15465, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "in OTSL format", "bbox": {"l": 293.94702, "t": 582.43648, "r": 324.59396, "b": 586.69969, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "BBoxes in sync", "bbox": {"l": 333.07819, "t": 541.82269, "r": 364.14691, "b": 546.08591, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "with tag sequence", "bbox": {"l": 333.07819, "t": 545.6102, "r": 369.71542, "b": 549.87341, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "Encoder", "bbox": {"l": 232.65881000000002, "t": 515.24139, "r": 249.58894000000004, "b": 519.50458, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "Structure", "bbox": {"l": 269.8219, "t": 545.97102, "r": 288.26279, "b": 550.23424, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Decoder", "bbox": {"l": 270.45187, "t": 549.75851, "r": 287.63242, "b": 554.0217299999999, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "[x1, y2, x2, y2]", "bbox": {"l": 332.17676, "t": 515.91205, "r": 358.11206, "b": 520.17523, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "[x1', y2', x2', y2']", "bbox": {"l": 332.17676, "t": 521.9720500000001, "r": 361.58298, "b": 526.23523, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "[x1'', y2'', x2'', y2'']", "bbox": {"l": 332.17676, "t": 528.03204, "r": 364.76474, "b": 532.29523, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "...", "bbox": {"l": 332.17676, "t": 534.09204, "r": 335.96548, "b": 538.35524, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "1", "bbox": {"l": 326.8894, "t": 516.39508, "r": 329.41641, "b": 520.6582599999999, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "2", "bbox": {"l": 327.04089, "t": 522.4247700000001, "r": 329.5679, "b": 526.68796, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "3", "bbox": {"l": 327.04089, "t": 528.51508, "r": 329.5679, "b": 532.77826, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "3", "bbox": {"l": 424.14102, "t": 527.4428399999999, "r": 426.66803, "b": 531.7060200000001, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "2", "bbox": {"l": 453.0018, "t": 517.4539500000001, "r": 455.52881, "b": 521.71713, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "1", "bbox": {"l": 423.85825, "t": 517.06281, "r": 426.38525, "b": 521.32599, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "C", "bbox": {"l": 333.4342, "t": 557.36679, "r": 337.27542, "b": 562.35719, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "C", "bbox": {"l": 340.35397, "t": 557.31679, "r": 344.19519, "b": 562.30719, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "C", "bbox": {"l": 340.30978, "t": 563.8653899999999, "r": 344.151, "b": 568.8557900000001, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "C", "bbox": {"l": 346.79904, "t": 563.8686700000001, "r": 350.64026, "b": 568.85907, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "C", "bbox": {"l": 333.59583, "t": 563.82271, "r": 337.43704, "b": 568.81311, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "C", "bbox": {"l": 340.37543, "t": 570.42673, "r": 344.21664, "b": 575.41713, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "C", "bbox": {"l": 346.86469, "t": 570.43001, "r": 350.7059, "b": 575.42041, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "C", "bbox": {"l": 333.66144, "t": 570.38405, "r": 337.50266, "b": 575.37445, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "C", "bbox": {"l": 340.37671, "t": 577.02606, "r": 344.21793, "b": 582.0164599999999, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "C", "bbox": {"l": 346.86597, "t": 577.02934, "r": 350.70718, "b": 582.01974, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "C", "bbox": {"l": 333.66272, "t": 576.98338, "r": 337.50394, "b": 581.97379, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "C", "bbox": {"l": 340.27948, "t": 583.39737, "r": 344.1207, "b": 588.38777, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "C", "bbox": {"l": 346.76874, "t": 583.40068, "r": 350.60995, "b": 588.39108, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "C", "bbox": {"l": 333.56549, "t": 583.35474, "r": 337.40671, "b": 588.34514, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "NL", "bbox": {"l": 353.03326, "t": 556.8831299999999, "r": 359.83362, "b": 561.87354, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "NL", "bbox": {"l": 353.18604, "t": 563.58044, "r": 359.98639, "b": 568.57085, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "NL", "bbox": {"l": 353.19864, "t": 570.1623500000001, "r": 359.99899, "b": 575.15276, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "NL", "bbox": {"l": 353.1532, "t": 576.76611, "r": 359.95355, "b": 581.75652, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "NL", "bbox": {"l": 353.26935, "t": 583.40628, "r": 360.0697, "b": 588.3966800000001, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "L", "bbox": {"l": 347.37979, "t": 557.08235, "r": 350.33786, "b": 562.07275, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "3", "bbox": {"l": 331.14026, "t": 564.2907700000001, "r": 333.66727, "b": 568.55399, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "2", "bbox": {"l": 340.80972, "t": 554.59312, "r": 343.33673, "b": 558.85634, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "1", "bbox": {"l": 330.97992, "t": 554.83035, "r": 333.50693, "b": 559.09357, "coord_origin": "TOPLEFT"}}], "children": [{"id": 10, "label": "text", "bbox": {"l": 147.30025, "t": 540.73164, "r": 149.70605, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "1.", "bbox": {"l": 147.30025, "t": 540.73164, "r": 149.70605, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 150.90895, "t": 540.73164, "r": 155.72055, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "Item", "bbox": {"l": 150.90895, "t": 540.73164, "r": 155.72055, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 162.75987, "t": 535.3938, "r": 172.2963, "b": 537.76224, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "Amount", "bbox": {"l": 162.75987, "t": 535.3938, "r": 172.2963, "b": 537.76224, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 147.63603, "t": 535.3661500000001, "r": 155.91753, "b": 537.73459, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "Names", "bbox": {"l": 147.63603, "t": 535.3661500000001, "r": 155.91753, "b": 537.73459, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 158.48466, "t": 540.73164, "r": 164.10178, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "1000", "bbox": {"l": 158.48466, "t": 540.73164, "r": 164.10178, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 158.48466, "t": 544.67065, "r": 162.69737, "b": 547.03909, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "500", "bbox": {"l": 158.48466, "t": 544.67065, "r": 162.69737, "b": 547.03909, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 158.48466, "t": 548.91264, "r": 164.10178, "b": 551.28108, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "3500", "bbox": {"l": 158.48466, "t": 548.91264, "r": 164.10178, "b": 551.28108, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 158.48466, "t": 553.15465, "r": 162.69737, "b": 555.52309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "150", "bbox": {"l": 158.48466, "t": 553.15465, "r": 162.69737, "b": 555.52309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 168.81696, "t": 540.73164, "r": 172.88876, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "unit", "bbox": {"l": 168.81696, "t": 540.73164, "r": 172.88876, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 168.81696, "t": 544.67065, "r": 172.88876, "b": 547.03909, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "unit", "bbox": {"l": 168.81696, "t": 544.67065, "r": 172.88876, "b": 547.03909, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 168.81696, "t": 548.91264, "r": 172.88876, "b": 551.28108, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "unit", "bbox": {"l": 168.81696, "t": 548.91264, "r": 172.88876, "b": 551.28108, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 168.81696, "t": 553.15465, "r": 172.88876, "b": 555.52309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "unit", "bbox": {"l": 168.81696, "t": 553.15465, "r": 172.88876, "b": 555.52309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 147.30025, "t": 544.67065, "r": 149.70605, "b": 547.03909, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "2.", "bbox": {"l": 147.30025, "t": 544.67065, "r": 149.70605, "b": 547.03909, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 150.90895, "t": 544.67065, "r": 155.72055, "b": 547.03909, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "Item", "bbox": {"l": 150.90895, "t": 544.67065, "r": 155.72055, "b": 547.03909, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 147.30025, "t": 548.91264, "r": 149.70605, "b": 551.28108, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "3.", "bbox": {"l": 147.30025, "t": 548.91264, "r": 149.70605, "b": 551.28108, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 150.90895, "t": 548.91264, "r": 155.72055, "b": 551.28108, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "Item", "bbox": {"l": 150.90895, "t": 548.91264, "r": 155.72055, "b": 551.28108, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 147.30025, "t": 553.15465, "r": 149.70605, "b": 555.52309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "4.", "bbox": {"l": 147.30025, "t": 553.15465, "r": 149.70605, "b": 555.52309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 150.90895, "t": 553.15465, "r": 155.72055, "b": 555.52309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "Item", "bbox": {"l": 150.90895, "t": 553.15465, "r": 155.72055, "b": 555.52309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 152.05046, "t": 517.0098, "r": 171.24945, "b": 521.27298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "Extracted", "bbox": {"l": 152.05046, "t": 517.0098, "r": 171.24945, "b": 521.27298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 148.13347, "t": 522.3122900000001, "r": 175.16759, "b": 526.57547, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "Table Images", "bbox": {"l": 148.13347, "t": 522.3122900000001, "r": 175.16759, "b": 526.57547, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 193.53331, "t": 524.51422, "r": 220.31973, "b": 528.7774, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "Standardized", "bbox": {"l": 193.53331, "t": 524.51422, "r": 220.31973, "b": 528.7774, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 199.47311, "t": 529.8167100000001, "r": 214.37889, "b": 534.0799, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "Images", "bbox": {"l": 199.47311, "t": 529.8167100000001, "r": 214.37889, "b": 534.0799, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 273.61066, "t": 509.9053, "r": 284.47275, "b": 514.16849, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "BBox", "bbox": {"l": 273.61066, "t": 509.9053, "r": 284.47275, "b": 514.16849, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 270.45187, "t": 513.6928399999999, "r": 287.63242, "b": 517.9560200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "Decoder", "bbox": {"l": 270.45187, "t": 513.6928399999999, "r": 287.63242, "b": 517.9560200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 332.47852, "t": 508.14438, "r": 348.14014, "b": 512.40756, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "BBoxes", "bbox": {"l": 332.47852, "t": 508.14438, "r": 348.14014, "b": 512.40756, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 376.68622, "t": 521.12024, "r": 407.25497, "b": 525.38342, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "BBoxes can be", "bbox": {"l": 376.68622, "t": 521.12024, "r": 407.25497, "b": 525.38342, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 373.90869, "t": 525.66525, "r": 410.03506, "b": 529.92844, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "traced back to the", "bbox": {"l": 373.90869, "t": 525.66525, "r": 410.03506, "b": 529.92844, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 375.29871, "t": 530.21024, "r": 408.64902, "b": 534.47342, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "original image to", "bbox": {"l": 375.29871, "t": 530.21024, "r": 408.64902, "b": 534.47342, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 377.06747, "t": 534.75522, "r": 406.88312, "b": 539.01843, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "extract content", "bbox": {"l": 377.06747, "t": 534.75522, "r": 406.88312, "b": 539.01843, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 383.56683, "t": 563.24176, "r": 433.76544, "b": 567.50497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "Structure Tags sequence", "bbox": {"l": 383.56683, "t": 563.24176, "r": 433.76544, "b": 567.50497, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 383.52768, "t": 567.78676, "r": 433.80764999999997, "b": 572.04997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "provide full description of", "bbox": {"l": 383.52768, "t": 567.78676, "r": 433.80764999999997, "b": 572.04997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 390.47522, "t": 572.33177, "r": 426.85703, "b": 576.59499, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "the table structure", "bbox": {"l": 390.47522, "t": 572.33177, "r": 426.85703, "b": 576.59499, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 293.94702, "t": 577.89143, "r": 323.1691, "b": 582.15465, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "Structure Tags", "bbox": {"l": 293.94702, "t": 577.89143, "r": 323.1691, "b": 582.15465, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 293.94702, "t": 582.43648, "r": 324.59396, "b": 586.69969, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "in OTSL format", "bbox": {"l": 293.94702, "t": 582.43648, "r": 324.59396, "b": 586.69969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 333.07819, "t": 541.82269, "r": 364.14691, "b": 546.08591, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "BBoxes in sync", "bbox": {"l": 333.07819, "t": 541.82269, "r": 364.14691, "b": 546.08591, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 333.07819, "t": 545.6102, "r": 369.71542, "b": 549.87341, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "with tag sequence", "bbox": {"l": 333.07819, "t": 545.6102, "r": 369.71542, "b": 549.87341, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 232.65881000000002, "t": 515.24139, "r": 249.58894000000004, "b": 519.50458, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "Encoder", "bbox": {"l": 232.65881000000002, "t": 515.24139, "r": 249.58894000000004, "b": 519.50458, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 269.8219, "t": 545.97102, "r": 288.26279, "b": 550.23424, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "Structure", "bbox": {"l": 269.8219, "t": 545.97102, "r": 288.26279, "b": 550.23424, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 270.45187, "t": 549.75851, "r": 287.63242, "b": 554.0217299999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "Decoder", "bbox": {"l": 270.45187, "t": 549.75851, "r": 287.63242, "b": 554.0217299999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 332.17676, "t": 515.91205, "r": 358.11206, "b": 520.17523, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "[x1, y2, x2, y2]", "bbox": {"l": 332.17676, "t": 515.91205, "r": 358.11206, "b": 520.17523, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 332.17676, "t": 521.9720500000001, "r": 361.58298, "b": 526.23523, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "[x1', y2', x2', y2']", "bbox": {"l": 332.17676, "t": 521.9720500000001, "r": 361.58298, "b": 526.23523, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 332.17676, "t": 528.03204, "r": 364.76474, "b": 532.29523, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "[x1'', y2'', x2'', y2'']", "bbox": {"l": 332.17676, "t": 528.03204, "r": 364.76474, "b": 532.29523, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 332.17676, "t": 534.09204, "r": 335.96548, "b": 538.35524, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "...", "bbox": {"l": 332.17676, "t": 534.09204, "r": 335.96548, "b": 538.35524, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 326.8894, "t": 516.39508, "r": 329.41641, "b": 520.6582599999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "1", "bbox": {"l": 326.8894, "t": 516.39508, "r": 329.41641, "b": 520.6582599999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 327.04089, "t": 522.4247700000001, "r": 329.5679, "b": 526.68796, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "2", "bbox": {"l": 327.04089, "t": 522.4247700000001, "r": 329.5679, "b": 526.68796, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 327.04089, "t": 528.51508, "r": 329.5679, "b": 532.77826, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "3", "bbox": {"l": 327.04089, "t": 528.51508, "r": 329.5679, "b": 532.77826, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 424.14102, "t": 527.4428399999999, "r": 426.66803, "b": 531.7060200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "3", "bbox": {"l": 424.14102, "t": 527.4428399999999, "r": 426.66803, "b": 531.7060200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 453.0018, "t": 517.4539500000001, "r": 455.52881, "b": 521.71713, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "2", "bbox": {"l": 453.0018, "t": 517.4539500000001, "r": 455.52881, "b": 521.71713, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 423.85825, "t": 517.06281, "r": 426.38525, "b": 521.32599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "1", "bbox": {"l": 423.85825, "t": 517.06281, "r": 426.38525, "b": 521.32599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 333.4342, "t": 557.36679, "r": 337.27542, "b": 562.35719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "C", "bbox": {"l": 333.4342, "t": 557.36679, "r": 337.27542, "b": 562.35719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 340.35397, "t": 557.31679, "r": 344.19519, "b": 562.30719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "C", "bbox": {"l": 340.35397, "t": 557.31679, "r": 344.19519, "b": 562.30719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 340.30978, "t": 563.8653899999999, "r": 344.151, "b": 568.8557900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "C", "bbox": {"l": 340.30978, "t": 563.8653899999999, "r": 344.151, "b": 568.8557900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 346.79904, "t": 563.8686700000001, "r": 350.64026, "b": 568.85907, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "C", "bbox": {"l": 346.79904, "t": 563.8686700000001, "r": 350.64026, "b": 568.85907, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 333.59583, "t": 563.82271, "r": 337.43704, "b": 568.81311, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "C", "bbox": {"l": 333.59583, "t": 563.82271, "r": 337.43704, "b": 568.81311, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 340.37543, "t": 570.42673, "r": 344.21664, "b": 575.41713, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "C", "bbox": {"l": 340.37543, "t": 570.42673, "r": 344.21664, "b": 575.41713, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 346.86469, "t": 570.43001, "r": 350.7059, "b": 575.42041, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "C", "bbox": {"l": 346.86469, "t": 570.43001, "r": 350.7059, "b": 575.42041, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 333.66144, "t": 570.38405, "r": 337.50266, "b": 575.37445, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "C", "bbox": {"l": 333.66144, "t": 570.38405, "r": 337.50266, "b": 575.37445, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 340.37671, "t": 577.02606, "r": 344.21793, "b": 582.0164599999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "C", "bbox": {"l": 340.37671, "t": 577.02606, "r": 344.21793, "b": 582.0164599999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 346.86597, "t": 577.02934, "r": 350.70718, "b": 582.01974, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "C", "bbox": {"l": 346.86597, "t": 577.02934, "r": 350.70718, "b": 582.01974, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 333.66272, "t": 576.98338, "r": 337.50394, "b": 581.97379, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "C", "bbox": {"l": 333.66272, "t": 576.98338, "r": 337.50394, "b": 581.97379, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 340.27948, "t": 583.39737, "r": 344.1207, "b": 588.38777, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "C", "bbox": {"l": 340.27948, "t": 583.39737, "r": 344.1207, "b": 588.38777, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 346.76874, "t": 583.40068, "r": 350.60995, "b": 588.39108, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "C", "bbox": {"l": 346.76874, "t": 583.40068, "r": 350.60995, "b": 588.39108, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 333.56549, "t": 583.35474, "r": 337.40671, "b": 588.34514, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "C", "bbox": {"l": 333.56549, "t": 583.35474, "r": 337.40671, "b": 588.34514, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 353.03326, "t": 556.8831299999999, "r": 359.83362, "b": 561.87354, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "NL", "bbox": {"l": 353.03326, "t": 556.8831299999999, "r": 359.83362, "b": 561.87354, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 353.18604, "t": 563.58044, "r": 359.98639, "b": 568.57085, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "NL", "bbox": {"l": 353.18604, "t": 563.58044, "r": 359.98639, "b": 568.57085, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 353.19864, "t": 570.1623500000001, "r": 359.99899, "b": 575.15276, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "NL", "bbox": {"l": 353.19864, "t": 570.1623500000001, "r": 359.99899, "b": 575.15276, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 353.1532, "t": 576.76611, "r": 359.95355, "b": 581.75652, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "NL", "bbox": {"l": 353.1532, "t": 576.76611, "r": 359.95355, "b": 581.75652, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 353.26935, "t": 583.40628, "r": 360.0697, "b": 588.3966800000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "NL", "bbox": {"l": 353.26935, "t": 583.40628, "r": 360.0697, "b": 588.3966800000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 347.37979, "t": 557.08235, "r": 350.33786, "b": 562.07275, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "L", "bbox": {"l": 347.37979, "t": 557.08235, "r": 350.33786, "b": 562.07275, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 331.14026, "t": 564.2907700000001, "r": 333.66727, "b": 568.55399, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "3", "bbox": {"l": 331.14026, "t": 564.2907700000001, "r": 333.66727, "b": 568.55399, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 340.80972, "t": 554.59312, "r": 343.33673, "b": 558.85634, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": "2", "bbox": {"l": 340.80972, "t": 554.59312, "r": 343.33673, "b": 558.85634, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 330.97992, "t": 554.83035, "r": 333.50693, "b": 559.09357, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "1", "bbox": {"l": 330.97992, "t": 554.83035, "r": 333.50693, "b": 559.09357, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 4, "label": "text", "bbox": {"l": 134.765, "t": 620.19278, "r": 480.5917400000001, "b": 664.8547599999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9512704014778137, "cells": [{"id": 105, "text": "We rely on standard metrics such as Tree Edit Distance score (TEDs) for", "bbox": {"l": 149.709, "t": 620.19278, "r": 480.58792, "b": 628.98975, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "table structure prediction, and Mean Average Precision (mAP) with 0.75 Inter-", "bbox": {"l": 134.765, "t": 632.14778, "r": 480.58871, "b": 640.94475, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "section Over Union (IOU) threshold for the bounding-box predictions of table", "bbox": {"l": 134.765, "t": 644.1027799999999, "r": 480.5917400000001, "b": 652.89975, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "cells. The predicted OTSL structures were converted back to HTML format in", "bbox": {"l": 134.765, "t": 656.0577900000001, "r": 480.58968999999996, "b": 664.8547599999999, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_header", "id": 9, "page_no": 7, "cluster": {"id": 9, "label": "page_header", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8301324844360352, "cells": [{"id": 0, "text": "8", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "8"}, {"label": "page_header", "id": 8, "page_no": 7, "cluster": {"id": 8, "label": "page_header", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8631827235221863, "cells": [{"id": 1, "text": "M.", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 178.07675, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37415, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "M. Lysak, et al."}, {"label": "text", "id": 5, "page_no": 7, "cluster": {"id": 5, "label": "text", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.58884000000006, "b": 139.68579, "coord_origin": "TOPLEFT"}, "confidence": 0.9464746713638306, "cells": [{"id": 3, "text": "reduces significantly the column drift seen in the HTML based models (see Fig-", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.58884000000006, "b": 127.73077, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "ure 5).", "bbox": {"l": 134.765, "t": 130.88878999999997, "r": 163.56389, "b": 139.68579, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "reduces significantly the column drift seen in the HTML based models (see Figure 5)."}, {"label": "section_header", "id": 2, "page_no": 7, "cluster": {"id": 2, "label": "section_header", "bbox": {"l": 134.765, "t": 161.55682000000002, "r": 319.34708, "b": 170.36377000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9549515843391418, "cells": [{"id": 5, "text": "4.3", "bbox": {"l": 134.765, "t": 161.55682000000002, "r": 149.40205, "b": 170.36377000000005, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Error-detection and -mitigation", "bbox": {"l": 160.85904, "t": 161.55682000000002, "r": 319.34708, "b": 170.36377000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4.3 Error-detection and -mitigation"}, {"label": "text", "id": 0, "page_no": 7, "cluster": {"id": 0, "label": "text", "bbox": {"l": 134.765, "t": 182.28179999999998, "r": 480.5957599999999, "b": 298.67584, "coord_origin": "TOPLEFT"}, "confidence": 0.9879790544509888, "cells": [{"id": 7, "text": "The design of OTSL allows to validate a table structure easily on an unfinished", "bbox": {"l": 134.765, "t": 182.28179999999998, "r": 480.59572999999995, "b": 191.0788, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "sequence. The detection of an invalid sequence token is a clear indication of a", "bbox": {"l": 134.765, "t": 194.23779000000002, "r": 480.59473, "b": 203.03479000000004, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "prediction mistake, however a valid sequence by itself does not guarantee pre-", "bbox": {"l": 134.765, "t": 206.19281, "r": 480.58678999999995, "b": 214.98981000000003, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "diction correctness. Different heuristics can be used to correct token errors in", "bbox": {"l": 134.765, "t": 218.14783, "r": 480.59177000000005, "b": 226.94482000000005, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "an invalid sequence and thus increase the chances for accurate predictions. Such", "bbox": {"l": 134.765, "t": 230.10284000000001, "r": 480.58768, "b": 238.89984000000004, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "heuristics can be applied either after the prediction of each token, or at the end", "bbox": {"l": 134.765, "t": 242.05786, "r": 480.5867, "b": 250.85486000000003, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "on the entire predicted sequence. For example a simple heuristic which can cor-", "bbox": {"l": 134.765, "t": 254.01288, "r": 480.5938100000001, "b": 262.80988, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "rect the predicted OTSL sequence on-the-fly is to verify if the token with the", "bbox": {"l": 134.765, "t": 265.96887000000004, "r": 480.59069999999997, "b": 274.76586999999995, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "highest prediction confidence invalidates the predicted sequence, and replace it", "bbox": {"l": 134.765, "t": 277.92389000000003, "r": 480.5957599999999, "b": 286.72086, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "by the token with the next highest confidence until OTSL rules are satisfied.", "bbox": {"l": 134.765, "t": 289.8788799999999, "r": 469.40369, "b": 298.67584, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The design of OTSL allows to validate a table structure easily on an unfinished sequence. The detection of an invalid sequence token is a clear indication of a prediction mistake, however a valid sequence by itself does not guarantee prediction correctness. Different heuristics can be used to correct token errors in an invalid sequence and thus increase the chances for accurate predictions. Such heuristics can be applied either after the prediction of each token, or at the end on the entire predicted sequence. For example a simple heuristic which can correct the predicted OTSL sequence on-the-fly is to verify if the token with the highest prediction confidence invalidates the predicted sequence, and replace it by the token with the next highest confidence until OTSL rules are satisfied."}, {"label": "section_header", "id": 3, "page_no": 7, "cluster": {"id": 3, "label": "section_header", "bbox": {"l": 134.765, "t": 321.164, "r": 229.03534, "b": 331.73239000000007, "coord_origin": "TOPLEFT"}, "confidence": 0.9515273571014404, "cells": [{"id": 17, "text": "5", "bbox": {"l": 134.765, "t": 321.164, "r": 141.4886, "b": 331.73239000000007, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Experiments", "bbox": {"l": 154.9382, "t": 321.164, "r": 229.03534, "b": 331.73239000000007, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5 Experiments"}, {"label": "text", "id": 1, "page_no": 7, "cluster": {"id": 1, "label": "text", "bbox": {"l": 134.765, "t": 347.24985, "r": 480.59528, "b": 451.6877099999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9877985119819641, "cells": [{"id": 19, "text": "To evaluate the impact of OTSL on prediction accuracy and inference times, we", "bbox": {"l": 134.765, "t": 347.24985, "r": 480.59375, "b": 356.04681, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "conducted a series of experiments based on the TableFormer model (Figure 4)", "bbox": {"l": 134.765, "t": 359.2048300000001, "r": 480.59476, "b": 368.0018, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "with two objectives: Firstly we evaluate the prediction quality and performance", "bbox": {"l": 134.765, "t": 371.15982, "r": 480.58786000000003, "b": 379.95679, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "of OTSL vs. HTML after performing Hyper Parameter Optimization (HPO) on", "bbox": {"l": 134.765, "t": 383.11481000000003, "r": 480.58777, "b": 391.91177, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "the", "bbox": {"l": 134.765, "t": 395.06978999999995, "r": 148.59807, "b": 403.86676, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "canonical", "bbox": {"l": 151.627, "t": 395.06978999999995, "r": 191.84703, "b": 403.86676, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "PubTabNet data set. Secondly we pick the best hyper-parameters", "bbox": {"l": 195.90201, "t": 395.06978999999995, "r": 480.59528, "b": 403.86676, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "found in the first step and evaluate how OTSL impacts the performance of", "bbox": {"l": 134.76501, "t": 407.02478, "r": 480.59283000000005, "b": 415.82175, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "TableFormer after training on other publicly available data sets (FinTabNet,", "bbox": {"l": 134.76501, "t": 418.98077, "r": 480.59476, "b": 427.77774, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "PubTables-1M [14]). The ground truth (GT) from all data sets has been con-", "bbox": {"l": 134.76501, "t": 430.93576, "r": 480.59171, "b": 439.73273, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "verted into OTSL format for this purpose, and will be made publicly available.", "bbox": {"l": 134.76501, "t": 442.8907500000001, "r": 479.30258, "b": 451.6877099999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "To evaluate the impact of OTSL on prediction accuracy and inference times, we conducted a series of experiments based on the TableFormer model (Figure 4) with two objectives: Firstly we evaluate the prediction quality and performance of OTSL vs. HTML after performing Hyper Parameter Optimization (HPO) on the canonical PubTabNet data set. Secondly we pick the best hyper-parameters found in the first step and evaluate how OTSL impacts the performance of TableFormer after training on other publicly available data sets (FinTabNet, PubTables-1M [14]). The ground truth (GT) from all data sets has been converted into OTSL format for this purpose, and will be made publicly available."}, {"label": "caption", "id": 7, "page_no": 7, "cluster": {"id": 7, "label": "caption", "bbox": {"l": 134.76501, "t": 484.64813, "r": 480.59082, "b": 503.73965, "coord_origin": "TOPLEFT"}, "confidence": 0.9297955632209778, "cells": [{"id": 30, "text": "Fig. 4.", "bbox": {"l": 134.76501, "t": 484.64813, "r": 162.64424, "b": 492.57443, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Architecture sketch of the TableFormer model, which is a representative for the", "bbox": {"l": 165.19601, "t": 484.71091, "r": 480.59082, "b": 492.78067, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Im2Seq approach.", "bbox": {"l": 134.76501, "t": 495.66989, "r": 206.70245, "b": 503.73965, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Fig. 4. Architecture sketch of the TableFormer model, which is a representative for the Im2Seq approach."}, {"label": "picture", "id": 6, "page_no": 7, "cluster": {"id": 6, "label": "picture", "bbox": {"l": 140.7096710205078, "t": 508.06390380859375, "r": 472.73382568359375, "b": 593.67724609375, "coord_origin": "TOPLEFT"}, "confidence": 0.9303393959999084, "cells": [{"id": 33, "text": "1.", "bbox": {"l": 147.30025, "t": 540.73164, "r": 149.70605, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Item", "bbox": {"l": 150.90895, "t": 540.73164, "r": 155.72055, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "Amount", "bbox": {"l": 162.75987, "t": 535.3938, "r": 172.2963, "b": 537.76224, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Names", "bbox": {"l": 147.63603, "t": 535.3661500000001, "r": 155.91753, "b": 537.73459, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "1000", "bbox": {"l": 158.48466, "t": 540.73164, "r": 164.10178, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "500", "bbox": {"l": 158.48466, "t": 544.67065, "r": 162.69737, "b": 547.03909, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "3500", "bbox": {"l": 158.48466, "t": 548.91264, "r": 164.10178, "b": 551.28108, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "150", "bbox": {"l": 158.48466, "t": 553.15465, "r": 162.69737, "b": 555.52309, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "unit", "bbox": {"l": 168.81696, "t": 540.73164, "r": 172.88876, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "unit", "bbox": {"l": 168.81696, "t": 544.67065, "r": 172.88876, "b": 547.03909, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "unit", "bbox": {"l": 168.81696, "t": 548.91264, "r": 172.88876, "b": 551.28108, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "unit", "bbox": {"l": 168.81696, "t": 553.15465, "r": 172.88876, "b": 555.52309, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "2.", "bbox": {"l": 147.30025, "t": 544.67065, "r": 149.70605, "b": 547.03909, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "Item", "bbox": {"l": 150.90895, "t": 544.67065, "r": 155.72055, "b": 547.03909, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "3.", "bbox": {"l": 147.30025, "t": 548.91264, "r": 149.70605, "b": 551.28108, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Item", "bbox": {"l": 150.90895, "t": 548.91264, "r": 155.72055, "b": 551.28108, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "4.", "bbox": {"l": 147.30025, "t": 553.15465, "r": 149.70605, "b": 555.52309, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Item", "bbox": {"l": 150.90895, "t": 553.15465, "r": 155.72055, "b": 555.52309, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Extracted", "bbox": {"l": 152.05046, "t": 517.0098, "r": 171.24945, "b": 521.27298, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Table Images", "bbox": {"l": 148.13347, "t": 522.3122900000001, "r": 175.16759, "b": 526.57547, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Standardized", "bbox": {"l": 193.53331, "t": 524.51422, "r": 220.31973, "b": 528.7774, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "Images", "bbox": {"l": 199.47311, "t": 529.8167100000001, "r": 214.37889, "b": 534.0799, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "BBox", "bbox": {"l": 273.61066, "t": 509.9053, "r": 284.47275, "b": 514.16849, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Decoder", "bbox": {"l": 270.45187, "t": 513.6928399999999, "r": 287.63242, "b": 517.9560200000001, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "BBoxes", "bbox": {"l": 332.47852, "t": 508.14438, "r": 348.14014, "b": 512.40756, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "BBoxes can be", "bbox": {"l": 376.68622, "t": 521.12024, "r": 407.25497, "b": 525.38342, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "traced back to the", "bbox": {"l": 373.90869, "t": 525.66525, "r": 410.03506, "b": 529.92844, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "original image to", "bbox": {"l": 375.29871, "t": 530.21024, "r": 408.64902, "b": 534.47342, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "extract content", "bbox": {"l": 377.06747, "t": 534.75522, "r": 406.88312, "b": 539.01843, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "Structure Tags sequence", "bbox": {"l": 383.56683, "t": 563.24176, "r": 433.76544, "b": 567.50497, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "provide full description of", "bbox": {"l": 383.52768, "t": 567.78676, "r": 433.80764999999997, "b": 572.04997, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "the table structure", "bbox": {"l": 390.47522, "t": 572.33177, "r": 426.85703, "b": 576.59499, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "Structure Tags", "bbox": {"l": 293.94702, "t": 577.89143, "r": 323.1691, "b": 582.15465, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "in OTSL format", "bbox": {"l": 293.94702, "t": 582.43648, "r": 324.59396, "b": 586.69969, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "BBoxes in sync", "bbox": {"l": 333.07819, "t": 541.82269, "r": 364.14691, "b": 546.08591, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "with tag sequence", "bbox": {"l": 333.07819, "t": 545.6102, "r": 369.71542, "b": 549.87341, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "Encoder", "bbox": {"l": 232.65881000000002, "t": 515.24139, "r": 249.58894000000004, "b": 519.50458, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "Structure", "bbox": {"l": 269.8219, "t": 545.97102, "r": 288.26279, "b": 550.23424, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Decoder", "bbox": {"l": 270.45187, "t": 549.75851, "r": 287.63242, "b": 554.0217299999999, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "[x1, y2, x2, y2]", "bbox": {"l": 332.17676, "t": 515.91205, "r": 358.11206, "b": 520.17523, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "[x1', y2', x2', y2']", "bbox": {"l": 332.17676, "t": 521.9720500000001, "r": 361.58298, "b": 526.23523, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "[x1'', y2'', x2'', y2'']", "bbox": {"l": 332.17676, "t": 528.03204, "r": 364.76474, "b": 532.29523, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "...", "bbox": {"l": 332.17676, "t": 534.09204, "r": 335.96548, "b": 538.35524, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "1", "bbox": {"l": 326.8894, "t": 516.39508, "r": 329.41641, "b": 520.6582599999999, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "2", "bbox": {"l": 327.04089, "t": 522.4247700000001, "r": 329.5679, "b": 526.68796, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "3", "bbox": {"l": 327.04089, "t": 528.51508, "r": 329.5679, "b": 532.77826, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "3", "bbox": {"l": 424.14102, "t": 527.4428399999999, "r": 426.66803, "b": 531.7060200000001, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "2", "bbox": {"l": 453.0018, "t": 517.4539500000001, "r": 455.52881, "b": 521.71713, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "1", "bbox": {"l": 423.85825, "t": 517.06281, "r": 426.38525, "b": 521.32599, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "C", "bbox": {"l": 333.4342, "t": 557.36679, "r": 337.27542, "b": 562.35719, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "C", "bbox": {"l": 340.35397, "t": 557.31679, "r": 344.19519, "b": 562.30719, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "C", "bbox": {"l": 340.30978, "t": 563.8653899999999, "r": 344.151, "b": 568.8557900000001, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "C", "bbox": {"l": 346.79904, "t": 563.8686700000001, "r": 350.64026, "b": 568.85907, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "C", "bbox": {"l": 333.59583, "t": 563.82271, "r": 337.43704, "b": 568.81311, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "C", "bbox": {"l": 340.37543, "t": 570.42673, "r": 344.21664, "b": 575.41713, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "C", "bbox": {"l": 346.86469, "t": 570.43001, "r": 350.7059, "b": 575.42041, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "C", "bbox": {"l": 333.66144, "t": 570.38405, "r": 337.50266, "b": 575.37445, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "C", "bbox": {"l": 340.37671, "t": 577.02606, "r": 344.21793, "b": 582.0164599999999, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "C", "bbox": {"l": 346.86597, "t": 577.02934, "r": 350.70718, "b": 582.01974, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "C", "bbox": {"l": 333.66272, "t": 576.98338, "r": 337.50394, "b": 581.97379, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "C", "bbox": {"l": 340.27948, "t": 583.39737, "r": 344.1207, "b": 588.38777, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "C", "bbox": {"l": 346.76874, "t": 583.40068, "r": 350.60995, "b": 588.39108, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "C", "bbox": {"l": 333.56549, "t": 583.35474, "r": 337.40671, "b": 588.34514, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "NL", "bbox": {"l": 353.03326, "t": 556.8831299999999, "r": 359.83362, "b": 561.87354, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "NL", "bbox": {"l": 353.18604, "t": 563.58044, "r": 359.98639, "b": 568.57085, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "NL", "bbox": {"l": 353.19864, "t": 570.1623500000001, "r": 359.99899, "b": 575.15276, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "NL", "bbox": {"l": 353.1532, "t": 576.76611, "r": 359.95355, "b": 581.75652, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "NL", "bbox": {"l": 353.26935, "t": 583.40628, "r": 360.0697, "b": 588.3966800000001, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "L", "bbox": {"l": 347.37979, "t": 557.08235, "r": 350.33786, "b": 562.07275, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "3", "bbox": {"l": 331.14026, "t": 564.2907700000001, "r": 333.66727, "b": 568.55399, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "2", "bbox": {"l": 340.80972, "t": 554.59312, "r": 343.33673, "b": 558.85634, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "1", "bbox": {"l": 330.97992, "t": 554.83035, "r": 333.50693, "b": 559.09357, "coord_origin": "TOPLEFT"}}], "children": [{"id": 10, "label": "text", "bbox": {"l": 147.30025, "t": 540.73164, "r": 149.70605, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "1.", "bbox": {"l": 147.30025, "t": 540.73164, "r": 149.70605, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 150.90895, "t": 540.73164, "r": 155.72055, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "Item", "bbox": {"l": 150.90895, "t": 540.73164, "r": 155.72055, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 162.75987, "t": 535.3938, "r": 172.2963, "b": 537.76224, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "Amount", "bbox": {"l": 162.75987, "t": 535.3938, "r": 172.2963, "b": 537.76224, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 147.63603, "t": 535.3661500000001, "r": 155.91753, "b": 537.73459, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "Names", "bbox": {"l": 147.63603, "t": 535.3661500000001, "r": 155.91753, "b": 537.73459, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 158.48466, "t": 540.73164, "r": 164.10178, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "1000", "bbox": {"l": 158.48466, "t": 540.73164, "r": 164.10178, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 158.48466, "t": 544.67065, "r": 162.69737, "b": 547.03909, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "500", "bbox": {"l": 158.48466, "t": 544.67065, "r": 162.69737, "b": 547.03909, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 158.48466, "t": 548.91264, "r": 164.10178, "b": 551.28108, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "3500", "bbox": {"l": 158.48466, "t": 548.91264, "r": 164.10178, "b": 551.28108, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 158.48466, "t": 553.15465, "r": 162.69737, "b": 555.52309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "150", "bbox": {"l": 158.48466, "t": 553.15465, "r": 162.69737, "b": 555.52309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 168.81696, "t": 540.73164, "r": 172.88876, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "unit", "bbox": {"l": 168.81696, "t": 540.73164, "r": 172.88876, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 168.81696, "t": 544.67065, "r": 172.88876, "b": 547.03909, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "unit", "bbox": {"l": 168.81696, "t": 544.67065, "r": 172.88876, "b": 547.03909, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 168.81696, "t": 548.91264, "r": 172.88876, "b": 551.28108, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "unit", "bbox": {"l": 168.81696, "t": 548.91264, "r": 172.88876, "b": 551.28108, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 168.81696, "t": 553.15465, "r": 172.88876, "b": 555.52309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "unit", "bbox": {"l": 168.81696, "t": 553.15465, "r": 172.88876, "b": 555.52309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 147.30025, "t": 544.67065, "r": 149.70605, "b": 547.03909, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "2.", "bbox": {"l": 147.30025, "t": 544.67065, "r": 149.70605, "b": 547.03909, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 150.90895, "t": 544.67065, "r": 155.72055, "b": 547.03909, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "Item", "bbox": {"l": 150.90895, "t": 544.67065, "r": 155.72055, "b": 547.03909, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 147.30025, "t": 548.91264, "r": 149.70605, "b": 551.28108, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "3.", "bbox": {"l": 147.30025, "t": 548.91264, "r": 149.70605, "b": 551.28108, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 150.90895, "t": 548.91264, "r": 155.72055, "b": 551.28108, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "Item", "bbox": {"l": 150.90895, "t": 548.91264, "r": 155.72055, "b": 551.28108, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 147.30025, "t": 553.15465, "r": 149.70605, "b": 555.52309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "4.", "bbox": {"l": 147.30025, "t": 553.15465, "r": 149.70605, "b": 555.52309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 150.90895, "t": 553.15465, "r": 155.72055, "b": 555.52309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "Item", "bbox": {"l": 150.90895, "t": 553.15465, "r": 155.72055, "b": 555.52309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 152.05046, "t": 517.0098, "r": 171.24945, "b": 521.27298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "Extracted", "bbox": {"l": 152.05046, "t": 517.0098, "r": 171.24945, "b": 521.27298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 148.13347, "t": 522.3122900000001, "r": 175.16759, "b": 526.57547, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "Table Images", "bbox": {"l": 148.13347, "t": 522.3122900000001, "r": 175.16759, "b": 526.57547, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 193.53331, "t": 524.51422, "r": 220.31973, "b": 528.7774, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "Standardized", "bbox": {"l": 193.53331, "t": 524.51422, "r": 220.31973, "b": 528.7774, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 199.47311, "t": 529.8167100000001, "r": 214.37889, "b": 534.0799, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "Images", "bbox": {"l": 199.47311, "t": 529.8167100000001, "r": 214.37889, "b": 534.0799, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 273.61066, "t": 509.9053, "r": 284.47275, "b": 514.16849, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "BBox", "bbox": {"l": 273.61066, "t": 509.9053, "r": 284.47275, "b": 514.16849, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 270.45187, "t": 513.6928399999999, "r": 287.63242, "b": 517.9560200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "Decoder", "bbox": {"l": 270.45187, "t": 513.6928399999999, "r": 287.63242, "b": 517.9560200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 332.47852, "t": 508.14438, "r": 348.14014, "b": 512.40756, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "BBoxes", "bbox": {"l": 332.47852, "t": 508.14438, "r": 348.14014, "b": 512.40756, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 376.68622, "t": 521.12024, "r": 407.25497, "b": 525.38342, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "BBoxes can be", "bbox": {"l": 376.68622, "t": 521.12024, "r": 407.25497, "b": 525.38342, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 373.90869, "t": 525.66525, "r": 410.03506, "b": 529.92844, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "traced back to the", "bbox": {"l": 373.90869, "t": 525.66525, "r": 410.03506, "b": 529.92844, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 375.29871, "t": 530.21024, "r": 408.64902, "b": 534.47342, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "original image to", "bbox": {"l": 375.29871, "t": 530.21024, "r": 408.64902, "b": 534.47342, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 377.06747, "t": 534.75522, "r": 406.88312, "b": 539.01843, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "extract content", "bbox": {"l": 377.06747, "t": 534.75522, "r": 406.88312, "b": 539.01843, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 383.56683, "t": 563.24176, "r": 433.76544, "b": 567.50497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "Structure Tags sequence", "bbox": {"l": 383.56683, "t": 563.24176, "r": 433.76544, "b": 567.50497, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 383.52768, "t": 567.78676, "r": 433.80764999999997, "b": 572.04997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "provide full description of", "bbox": {"l": 383.52768, "t": 567.78676, "r": 433.80764999999997, "b": 572.04997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 390.47522, "t": 572.33177, "r": 426.85703, "b": 576.59499, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "the table structure", "bbox": {"l": 390.47522, "t": 572.33177, "r": 426.85703, "b": 576.59499, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 293.94702, "t": 577.89143, "r": 323.1691, "b": 582.15465, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "Structure Tags", "bbox": {"l": 293.94702, "t": 577.89143, "r": 323.1691, "b": 582.15465, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 293.94702, "t": 582.43648, "r": 324.59396, "b": 586.69969, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "in OTSL format", "bbox": {"l": 293.94702, "t": 582.43648, "r": 324.59396, "b": 586.69969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 333.07819, "t": 541.82269, "r": 364.14691, "b": 546.08591, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "BBoxes in sync", "bbox": {"l": 333.07819, "t": 541.82269, "r": 364.14691, "b": 546.08591, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 333.07819, "t": 545.6102, "r": 369.71542, "b": 549.87341, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "with tag sequence", "bbox": {"l": 333.07819, "t": 545.6102, "r": 369.71542, "b": 549.87341, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 232.65881000000002, "t": 515.24139, "r": 249.58894000000004, "b": 519.50458, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "Encoder", "bbox": {"l": 232.65881000000002, "t": 515.24139, "r": 249.58894000000004, "b": 519.50458, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 269.8219, "t": 545.97102, "r": 288.26279, "b": 550.23424, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "Structure", "bbox": {"l": 269.8219, "t": 545.97102, "r": 288.26279, "b": 550.23424, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 270.45187, "t": 549.75851, "r": 287.63242, "b": 554.0217299999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "Decoder", "bbox": {"l": 270.45187, "t": 549.75851, "r": 287.63242, "b": 554.0217299999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 332.17676, "t": 515.91205, "r": 358.11206, "b": 520.17523, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "[x1, y2, x2, y2]", "bbox": {"l": 332.17676, "t": 515.91205, "r": 358.11206, "b": 520.17523, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 332.17676, "t": 521.9720500000001, "r": 361.58298, "b": 526.23523, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "[x1', y2', x2', y2']", "bbox": {"l": 332.17676, "t": 521.9720500000001, "r": 361.58298, "b": 526.23523, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 332.17676, "t": 528.03204, "r": 364.76474, "b": 532.29523, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "[x1'', y2'', x2'', y2'']", "bbox": {"l": 332.17676, "t": 528.03204, "r": 364.76474, "b": 532.29523, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 332.17676, "t": 534.09204, "r": 335.96548, "b": 538.35524, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "...", "bbox": {"l": 332.17676, "t": 534.09204, "r": 335.96548, "b": 538.35524, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 326.8894, "t": 516.39508, "r": 329.41641, "b": 520.6582599999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "1", "bbox": {"l": 326.8894, "t": 516.39508, "r": 329.41641, "b": 520.6582599999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 327.04089, "t": 522.4247700000001, "r": 329.5679, "b": 526.68796, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "2", "bbox": {"l": 327.04089, "t": 522.4247700000001, "r": 329.5679, "b": 526.68796, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 327.04089, "t": 528.51508, "r": 329.5679, "b": 532.77826, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "3", "bbox": {"l": 327.04089, "t": 528.51508, "r": 329.5679, "b": 532.77826, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 424.14102, "t": 527.4428399999999, "r": 426.66803, "b": 531.7060200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "3", "bbox": {"l": 424.14102, "t": 527.4428399999999, "r": 426.66803, "b": 531.7060200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 453.0018, "t": 517.4539500000001, "r": 455.52881, "b": 521.71713, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "2", "bbox": {"l": 453.0018, "t": 517.4539500000001, "r": 455.52881, "b": 521.71713, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 423.85825, "t": 517.06281, "r": 426.38525, "b": 521.32599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "1", "bbox": {"l": 423.85825, "t": 517.06281, "r": 426.38525, "b": 521.32599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 333.4342, "t": 557.36679, "r": 337.27542, "b": 562.35719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "C", "bbox": {"l": 333.4342, "t": 557.36679, "r": 337.27542, "b": 562.35719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 340.35397, "t": 557.31679, "r": 344.19519, "b": 562.30719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "C", "bbox": {"l": 340.35397, "t": 557.31679, "r": 344.19519, "b": 562.30719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 340.30978, "t": 563.8653899999999, "r": 344.151, "b": 568.8557900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "C", "bbox": {"l": 340.30978, "t": 563.8653899999999, "r": 344.151, "b": 568.8557900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 346.79904, "t": 563.8686700000001, "r": 350.64026, "b": 568.85907, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "C", "bbox": {"l": 346.79904, "t": 563.8686700000001, "r": 350.64026, "b": 568.85907, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 333.59583, "t": 563.82271, "r": 337.43704, "b": 568.81311, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "C", "bbox": {"l": 333.59583, "t": 563.82271, "r": 337.43704, "b": 568.81311, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 340.37543, "t": 570.42673, "r": 344.21664, "b": 575.41713, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "C", "bbox": {"l": 340.37543, "t": 570.42673, "r": 344.21664, "b": 575.41713, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 346.86469, "t": 570.43001, "r": 350.7059, "b": 575.42041, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "C", "bbox": {"l": 346.86469, "t": 570.43001, "r": 350.7059, "b": 575.42041, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 333.66144, "t": 570.38405, "r": 337.50266, "b": 575.37445, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "C", "bbox": {"l": 333.66144, "t": 570.38405, "r": 337.50266, "b": 575.37445, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 340.37671, "t": 577.02606, "r": 344.21793, "b": 582.0164599999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "C", "bbox": {"l": 340.37671, "t": 577.02606, "r": 344.21793, "b": 582.0164599999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 346.86597, "t": 577.02934, "r": 350.70718, "b": 582.01974, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "C", "bbox": {"l": 346.86597, "t": 577.02934, "r": 350.70718, "b": 582.01974, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 333.66272, "t": 576.98338, "r": 337.50394, "b": 581.97379, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "C", "bbox": {"l": 333.66272, "t": 576.98338, "r": 337.50394, "b": 581.97379, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 340.27948, "t": 583.39737, "r": 344.1207, "b": 588.38777, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "C", "bbox": {"l": 340.27948, "t": 583.39737, "r": 344.1207, "b": 588.38777, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 346.76874, "t": 583.40068, "r": 350.60995, "b": 588.39108, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "C", "bbox": {"l": 346.76874, "t": 583.40068, "r": 350.60995, "b": 588.39108, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 333.56549, "t": 583.35474, "r": 337.40671, "b": 588.34514, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "C", "bbox": {"l": 333.56549, "t": 583.35474, "r": 337.40671, "b": 588.34514, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 353.03326, "t": 556.8831299999999, "r": 359.83362, "b": 561.87354, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "NL", "bbox": {"l": 353.03326, "t": 556.8831299999999, "r": 359.83362, "b": 561.87354, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 353.18604, "t": 563.58044, "r": 359.98639, "b": 568.57085, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "NL", "bbox": {"l": 353.18604, "t": 563.58044, "r": 359.98639, "b": 568.57085, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 353.19864, "t": 570.1623500000001, "r": 359.99899, "b": 575.15276, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "NL", "bbox": {"l": 353.19864, "t": 570.1623500000001, "r": 359.99899, "b": 575.15276, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 353.1532, "t": 576.76611, "r": 359.95355, "b": 581.75652, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "NL", "bbox": {"l": 353.1532, "t": 576.76611, "r": 359.95355, "b": 581.75652, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 353.26935, "t": 583.40628, "r": 360.0697, "b": 588.3966800000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "NL", "bbox": {"l": 353.26935, "t": 583.40628, "r": 360.0697, "b": 588.3966800000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 347.37979, "t": 557.08235, "r": 350.33786, "b": 562.07275, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "L", "bbox": {"l": 347.37979, "t": 557.08235, "r": 350.33786, "b": 562.07275, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 331.14026, "t": 564.2907700000001, "r": 333.66727, "b": 568.55399, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "3", "bbox": {"l": 331.14026, "t": 564.2907700000001, "r": 333.66727, "b": 568.55399, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 340.80972, "t": 554.59312, "r": 343.33673, "b": 558.85634, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": "2", "bbox": {"l": 340.80972, "t": 554.59312, "r": 343.33673, "b": 558.85634, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 330.97992, "t": 554.83035, "r": 333.50693, "b": 559.09357, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "1", "bbox": {"l": 330.97992, "t": 554.83035, "r": 333.50693, "b": 559.09357, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "text", "id": 4, "page_no": 7, "cluster": {"id": 4, "label": "text", "bbox": {"l": 134.765, "t": 620.19278, "r": 480.5917400000001, "b": 664.8547599999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9512704014778137, "cells": [{"id": 105, "text": "We rely on standard metrics such as Tree Edit Distance score (TEDs) for", "bbox": {"l": 149.709, "t": 620.19278, "r": 480.58792, "b": 628.98975, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "table structure prediction, and Mean Average Precision (mAP) with 0.75 Inter-", "bbox": {"l": 134.765, "t": 632.14778, "r": 480.58871, "b": 640.94475, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "section Over Union (IOU) threshold for the bounding-box predictions of table", "bbox": {"l": 134.765, "t": 644.1027799999999, "r": 480.5917400000001, "b": 652.89975, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "cells. The predicted OTSL structures were converted back to HTML format in", "bbox": {"l": 134.765, "t": 656.0577900000001, "r": 480.58968999999996, "b": 664.8547599999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "We rely on standard metrics such as Tree Edit Distance score (TEDs) for table structure prediction, and Mean Average Precision (mAP) with 0.75 Intersection Over Union (IOU) threshold for the bounding-box predictions of table cells. The predicted OTSL structures were converted back to HTML format in"}], "body": [{"label": "text", "id": 5, "page_no": 7, "cluster": {"id": 5, "label": "text", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.58884000000006, "b": 139.68579, "coord_origin": "TOPLEFT"}, "confidence": 0.9464746713638306, "cells": [{"id": 3, "text": "reduces significantly the column drift seen in the HTML based models (see Fig-", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.58884000000006, "b": 127.73077, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "ure 5).", "bbox": {"l": 134.765, "t": 130.88878999999997, "r": 163.56389, "b": 139.68579, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "reduces significantly the column drift seen in the HTML based models (see Figure 5)."}, {"label": "section_header", "id": 2, "page_no": 7, "cluster": {"id": 2, "label": "section_header", "bbox": {"l": 134.765, "t": 161.55682000000002, "r": 319.34708, "b": 170.36377000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9549515843391418, "cells": [{"id": 5, "text": "4.3", "bbox": {"l": 134.765, "t": 161.55682000000002, "r": 149.40205, "b": 170.36377000000005, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Error-detection and -mitigation", "bbox": {"l": 160.85904, "t": 161.55682000000002, "r": 319.34708, "b": 170.36377000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4.3 Error-detection and -mitigation"}, {"label": "text", "id": 0, "page_no": 7, "cluster": {"id": 0, "label": "text", "bbox": {"l": 134.765, "t": 182.28179999999998, "r": 480.5957599999999, "b": 298.67584, "coord_origin": "TOPLEFT"}, "confidence": 0.9879790544509888, "cells": [{"id": 7, "text": "The design of OTSL allows to validate a table structure easily on an unfinished", "bbox": {"l": 134.765, "t": 182.28179999999998, "r": 480.59572999999995, "b": 191.0788, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "sequence. The detection of an invalid sequence token is a clear indication of a", "bbox": {"l": 134.765, "t": 194.23779000000002, "r": 480.59473, "b": 203.03479000000004, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "prediction mistake, however a valid sequence by itself does not guarantee pre-", "bbox": {"l": 134.765, "t": 206.19281, "r": 480.58678999999995, "b": 214.98981000000003, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "diction correctness. Different heuristics can be used to correct token errors in", "bbox": {"l": 134.765, "t": 218.14783, "r": 480.59177000000005, "b": 226.94482000000005, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "an invalid sequence and thus increase the chances for accurate predictions. Such", "bbox": {"l": 134.765, "t": 230.10284000000001, "r": 480.58768, "b": 238.89984000000004, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "heuristics can be applied either after the prediction of each token, or at the end", "bbox": {"l": 134.765, "t": 242.05786, "r": 480.5867, "b": 250.85486000000003, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "on the entire predicted sequence. For example a simple heuristic which can cor-", "bbox": {"l": 134.765, "t": 254.01288, "r": 480.5938100000001, "b": 262.80988, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "rect the predicted OTSL sequence on-the-fly is to verify if the token with the", "bbox": {"l": 134.765, "t": 265.96887000000004, "r": 480.59069999999997, "b": 274.76586999999995, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "highest prediction confidence invalidates the predicted sequence, and replace it", "bbox": {"l": 134.765, "t": 277.92389000000003, "r": 480.5957599999999, "b": 286.72086, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "by the token with the next highest confidence until OTSL rules are satisfied.", "bbox": {"l": 134.765, "t": 289.8788799999999, "r": 469.40369, "b": 298.67584, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The design of OTSL allows to validate a table structure easily on an unfinished sequence. The detection of an invalid sequence token is a clear indication of a prediction mistake, however a valid sequence by itself does not guarantee prediction correctness. Different heuristics can be used to correct token errors in an invalid sequence and thus increase the chances for accurate predictions. Such heuristics can be applied either after the prediction of each token, or at the end on the entire predicted sequence. For example a simple heuristic which can correct the predicted OTSL sequence on-the-fly is to verify if the token with the highest prediction confidence invalidates the predicted sequence, and replace it by the token with the next highest confidence until OTSL rules are satisfied."}, {"label": "section_header", "id": 3, "page_no": 7, "cluster": {"id": 3, "label": "section_header", "bbox": {"l": 134.765, "t": 321.164, "r": 229.03534, "b": 331.73239000000007, "coord_origin": "TOPLEFT"}, "confidence": 0.9515273571014404, "cells": [{"id": 17, "text": "5", "bbox": {"l": 134.765, "t": 321.164, "r": 141.4886, "b": 331.73239000000007, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Experiments", "bbox": {"l": 154.9382, "t": 321.164, "r": 229.03534, "b": 331.73239000000007, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5 Experiments"}, {"label": "text", "id": 1, "page_no": 7, "cluster": {"id": 1, "label": "text", "bbox": {"l": 134.765, "t": 347.24985, "r": 480.59528, "b": 451.6877099999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9877985119819641, "cells": [{"id": 19, "text": "To evaluate the impact of OTSL on prediction accuracy and inference times, we", "bbox": {"l": 134.765, "t": 347.24985, "r": 480.59375, "b": 356.04681, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "conducted a series of experiments based on the TableFormer model (Figure 4)", "bbox": {"l": 134.765, "t": 359.2048300000001, "r": 480.59476, "b": 368.0018, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "with two objectives: Firstly we evaluate the prediction quality and performance", "bbox": {"l": 134.765, "t": 371.15982, "r": 480.58786000000003, "b": 379.95679, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "of OTSL vs. HTML after performing Hyper Parameter Optimization (HPO) on", "bbox": {"l": 134.765, "t": 383.11481000000003, "r": 480.58777, "b": 391.91177, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "the", "bbox": {"l": 134.765, "t": 395.06978999999995, "r": 148.59807, "b": 403.86676, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "canonical", "bbox": {"l": 151.627, "t": 395.06978999999995, "r": 191.84703, "b": 403.86676, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "PubTabNet data set. Secondly we pick the best hyper-parameters", "bbox": {"l": 195.90201, "t": 395.06978999999995, "r": 480.59528, "b": 403.86676, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "found in the first step and evaluate how OTSL impacts the performance of", "bbox": {"l": 134.76501, "t": 407.02478, "r": 480.59283000000005, "b": 415.82175, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "TableFormer after training on other publicly available data sets (FinTabNet,", "bbox": {"l": 134.76501, "t": 418.98077, "r": 480.59476, "b": 427.77774, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "PubTables-1M [14]). The ground truth (GT) from all data sets has been con-", "bbox": {"l": 134.76501, "t": 430.93576, "r": 480.59171, "b": 439.73273, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "verted into OTSL format for this purpose, and will be made publicly available.", "bbox": {"l": 134.76501, "t": 442.8907500000001, "r": 479.30258, "b": 451.6877099999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "To evaluate the impact of OTSL on prediction accuracy and inference times, we conducted a series of experiments based on the TableFormer model (Figure 4) with two objectives: Firstly we evaluate the prediction quality and performance of OTSL vs. HTML after performing Hyper Parameter Optimization (HPO) on the canonical PubTabNet data set. Secondly we pick the best hyper-parameters found in the first step and evaluate how OTSL impacts the performance of TableFormer after training on other publicly available data sets (FinTabNet, PubTables-1M [14]). The ground truth (GT) from all data sets has been converted into OTSL format for this purpose, and will be made publicly available."}, {"label": "caption", "id": 7, "page_no": 7, "cluster": {"id": 7, "label": "caption", "bbox": {"l": 134.76501, "t": 484.64813, "r": 480.59082, "b": 503.73965, "coord_origin": "TOPLEFT"}, "confidence": 0.9297955632209778, "cells": [{"id": 30, "text": "Fig. 4.", "bbox": {"l": 134.76501, "t": 484.64813, "r": 162.64424, "b": 492.57443, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Architecture sketch of the TableFormer model, which is a representative for the", "bbox": {"l": 165.19601, "t": 484.71091, "r": 480.59082, "b": 492.78067, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Im2Seq approach.", "bbox": {"l": 134.76501, "t": 495.66989, "r": 206.70245, "b": 503.73965, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Fig. 4. Architecture sketch of the TableFormer model, which is a representative for the Im2Seq approach."}, {"label": "picture", "id": 6, "page_no": 7, "cluster": {"id": 6, "label": "picture", "bbox": {"l": 140.7096710205078, "t": 508.06390380859375, "r": 472.73382568359375, "b": 593.67724609375, "coord_origin": "TOPLEFT"}, "confidence": 0.9303393959999084, "cells": [{"id": 33, "text": "1.", "bbox": {"l": 147.30025, "t": 540.73164, "r": 149.70605, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Item", "bbox": {"l": 150.90895, "t": 540.73164, "r": 155.72055, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "Amount", "bbox": {"l": 162.75987, "t": 535.3938, "r": 172.2963, "b": 537.76224, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Names", "bbox": {"l": 147.63603, "t": 535.3661500000001, "r": 155.91753, "b": 537.73459, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "1000", "bbox": {"l": 158.48466, "t": 540.73164, "r": 164.10178, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "500", "bbox": {"l": 158.48466, "t": 544.67065, "r": 162.69737, "b": 547.03909, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "3500", "bbox": {"l": 158.48466, "t": 548.91264, "r": 164.10178, "b": 551.28108, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "150", "bbox": {"l": 158.48466, "t": 553.15465, "r": 162.69737, "b": 555.52309, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "unit", "bbox": {"l": 168.81696, "t": 540.73164, "r": 172.88876, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "unit", "bbox": {"l": 168.81696, "t": 544.67065, "r": 172.88876, "b": 547.03909, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "unit", "bbox": {"l": 168.81696, "t": 548.91264, "r": 172.88876, "b": 551.28108, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "unit", "bbox": {"l": 168.81696, "t": 553.15465, "r": 172.88876, "b": 555.52309, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "2.", "bbox": {"l": 147.30025, "t": 544.67065, "r": 149.70605, "b": 547.03909, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "Item", "bbox": {"l": 150.90895, "t": 544.67065, "r": 155.72055, "b": 547.03909, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "3.", "bbox": {"l": 147.30025, "t": 548.91264, "r": 149.70605, "b": 551.28108, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Item", "bbox": {"l": 150.90895, "t": 548.91264, "r": 155.72055, "b": 551.28108, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "4.", "bbox": {"l": 147.30025, "t": 553.15465, "r": 149.70605, "b": 555.52309, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Item", "bbox": {"l": 150.90895, "t": 553.15465, "r": 155.72055, "b": 555.52309, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Extracted", "bbox": {"l": 152.05046, "t": 517.0098, "r": 171.24945, "b": 521.27298, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Table Images", "bbox": {"l": 148.13347, "t": 522.3122900000001, "r": 175.16759, "b": 526.57547, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Standardized", "bbox": {"l": 193.53331, "t": 524.51422, "r": 220.31973, "b": 528.7774, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "Images", "bbox": {"l": 199.47311, "t": 529.8167100000001, "r": 214.37889, "b": 534.0799, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "BBox", "bbox": {"l": 273.61066, "t": 509.9053, "r": 284.47275, "b": 514.16849, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Decoder", "bbox": {"l": 270.45187, "t": 513.6928399999999, "r": 287.63242, "b": 517.9560200000001, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "BBoxes", "bbox": {"l": 332.47852, "t": 508.14438, "r": 348.14014, "b": 512.40756, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "BBoxes can be", "bbox": {"l": 376.68622, "t": 521.12024, "r": 407.25497, "b": 525.38342, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "traced back to the", "bbox": {"l": 373.90869, "t": 525.66525, "r": 410.03506, "b": 529.92844, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "original image to", "bbox": {"l": 375.29871, "t": 530.21024, "r": 408.64902, "b": 534.47342, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "extract content", "bbox": {"l": 377.06747, "t": 534.75522, "r": 406.88312, "b": 539.01843, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "Structure Tags sequence", "bbox": {"l": 383.56683, "t": 563.24176, "r": 433.76544, "b": 567.50497, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "provide full description of", "bbox": {"l": 383.52768, "t": 567.78676, "r": 433.80764999999997, "b": 572.04997, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "the table structure", "bbox": {"l": 390.47522, "t": 572.33177, "r": 426.85703, "b": 576.59499, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "Structure Tags", "bbox": {"l": 293.94702, "t": 577.89143, "r": 323.1691, "b": 582.15465, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "in OTSL format", "bbox": {"l": 293.94702, "t": 582.43648, "r": 324.59396, "b": 586.69969, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "BBoxes in sync", "bbox": {"l": 333.07819, "t": 541.82269, "r": 364.14691, "b": 546.08591, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "with tag sequence", "bbox": {"l": 333.07819, "t": 545.6102, "r": 369.71542, "b": 549.87341, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "Encoder", "bbox": {"l": 232.65881000000002, "t": 515.24139, "r": 249.58894000000004, "b": 519.50458, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "Structure", "bbox": {"l": 269.8219, "t": 545.97102, "r": 288.26279, "b": 550.23424, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Decoder", "bbox": {"l": 270.45187, "t": 549.75851, "r": 287.63242, "b": 554.0217299999999, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "[x1, y2, x2, y2]", "bbox": {"l": 332.17676, "t": 515.91205, "r": 358.11206, "b": 520.17523, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "[x1', y2', x2', y2']", "bbox": {"l": 332.17676, "t": 521.9720500000001, "r": 361.58298, "b": 526.23523, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "[x1'', y2'', x2'', y2'']", "bbox": {"l": 332.17676, "t": 528.03204, "r": 364.76474, "b": 532.29523, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "...", "bbox": {"l": 332.17676, "t": 534.09204, "r": 335.96548, "b": 538.35524, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "1", "bbox": {"l": 326.8894, "t": 516.39508, "r": 329.41641, "b": 520.6582599999999, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "2", "bbox": {"l": 327.04089, "t": 522.4247700000001, "r": 329.5679, "b": 526.68796, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "3", "bbox": {"l": 327.04089, "t": 528.51508, "r": 329.5679, "b": 532.77826, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "3", "bbox": {"l": 424.14102, "t": 527.4428399999999, "r": 426.66803, "b": 531.7060200000001, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "2", "bbox": {"l": 453.0018, "t": 517.4539500000001, "r": 455.52881, "b": 521.71713, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "1", "bbox": {"l": 423.85825, "t": 517.06281, "r": 426.38525, "b": 521.32599, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "C", "bbox": {"l": 333.4342, "t": 557.36679, "r": 337.27542, "b": 562.35719, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "C", "bbox": {"l": 340.35397, "t": 557.31679, "r": 344.19519, "b": 562.30719, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "C", "bbox": {"l": 340.30978, "t": 563.8653899999999, "r": 344.151, "b": 568.8557900000001, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "C", "bbox": {"l": 346.79904, "t": 563.8686700000001, "r": 350.64026, "b": 568.85907, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "C", "bbox": {"l": 333.59583, "t": 563.82271, "r": 337.43704, "b": 568.81311, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "C", "bbox": {"l": 340.37543, "t": 570.42673, "r": 344.21664, "b": 575.41713, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "C", "bbox": {"l": 346.86469, "t": 570.43001, "r": 350.7059, "b": 575.42041, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "C", "bbox": {"l": 333.66144, "t": 570.38405, "r": 337.50266, "b": 575.37445, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "C", "bbox": {"l": 340.37671, "t": 577.02606, "r": 344.21793, "b": 582.0164599999999, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "C", "bbox": {"l": 346.86597, "t": 577.02934, "r": 350.70718, "b": 582.01974, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "C", "bbox": {"l": 333.66272, "t": 576.98338, "r": 337.50394, "b": 581.97379, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "C", "bbox": {"l": 340.27948, "t": 583.39737, "r": 344.1207, "b": 588.38777, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "C", "bbox": {"l": 346.76874, "t": 583.40068, "r": 350.60995, "b": 588.39108, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "C", "bbox": {"l": 333.56549, "t": 583.35474, "r": 337.40671, "b": 588.34514, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "NL", "bbox": {"l": 353.03326, "t": 556.8831299999999, "r": 359.83362, "b": 561.87354, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "NL", "bbox": {"l": 353.18604, "t": 563.58044, "r": 359.98639, "b": 568.57085, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "NL", "bbox": {"l": 353.19864, "t": 570.1623500000001, "r": 359.99899, "b": 575.15276, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "NL", "bbox": {"l": 353.1532, "t": 576.76611, "r": 359.95355, "b": 581.75652, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "NL", "bbox": {"l": 353.26935, "t": 583.40628, "r": 360.0697, "b": 588.3966800000001, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "L", "bbox": {"l": 347.37979, "t": 557.08235, "r": 350.33786, "b": 562.07275, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "3", "bbox": {"l": 331.14026, "t": 564.2907700000001, "r": 333.66727, "b": 568.55399, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "2", "bbox": {"l": 340.80972, "t": 554.59312, "r": 343.33673, "b": 558.85634, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "1", "bbox": {"l": 330.97992, "t": 554.83035, "r": 333.50693, "b": 559.09357, "coord_origin": "TOPLEFT"}}], "children": [{"id": 10, "label": "text", "bbox": {"l": 147.30025, "t": 540.73164, "r": 149.70605, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "1.", "bbox": {"l": 147.30025, "t": 540.73164, "r": 149.70605, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 150.90895, "t": 540.73164, "r": 155.72055, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "Item", "bbox": {"l": 150.90895, "t": 540.73164, "r": 155.72055, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 162.75987, "t": 535.3938, "r": 172.2963, "b": 537.76224, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "Amount", "bbox": {"l": 162.75987, "t": 535.3938, "r": 172.2963, "b": 537.76224, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 147.63603, "t": 535.3661500000001, "r": 155.91753, "b": 537.73459, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "Names", "bbox": {"l": 147.63603, "t": 535.3661500000001, "r": 155.91753, "b": 537.73459, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 158.48466, "t": 540.73164, "r": 164.10178, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "1000", "bbox": {"l": 158.48466, "t": 540.73164, "r": 164.10178, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 158.48466, "t": 544.67065, "r": 162.69737, "b": 547.03909, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "500", "bbox": {"l": 158.48466, "t": 544.67065, "r": 162.69737, "b": 547.03909, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 158.48466, "t": 548.91264, "r": 164.10178, "b": 551.28108, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "3500", "bbox": {"l": 158.48466, "t": 548.91264, "r": 164.10178, "b": 551.28108, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 158.48466, "t": 553.15465, "r": 162.69737, "b": 555.52309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "150", "bbox": {"l": 158.48466, "t": 553.15465, "r": 162.69737, "b": 555.52309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 168.81696, "t": 540.73164, "r": 172.88876, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "unit", "bbox": {"l": 168.81696, "t": 540.73164, "r": 172.88876, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 168.81696, "t": 544.67065, "r": 172.88876, "b": 547.03909, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "unit", "bbox": {"l": 168.81696, "t": 544.67065, "r": 172.88876, "b": 547.03909, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 168.81696, "t": 548.91264, "r": 172.88876, "b": 551.28108, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "unit", "bbox": {"l": 168.81696, "t": 548.91264, "r": 172.88876, "b": 551.28108, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 168.81696, "t": 553.15465, "r": 172.88876, "b": 555.52309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "unit", "bbox": {"l": 168.81696, "t": 553.15465, "r": 172.88876, "b": 555.52309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 147.30025, "t": 544.67065, "r": 149.70605, "b": 547.03909, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "2.", "bbox": {"l": 147.30025, "t": 544.67065, "r": 149.70605, "b": 547.03909, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 150.90895, "t": 544.67065, "r": 155.72055, "b": 547.03909, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "Item", "bbox": {"l": 150.90895, "t": 544.67065, "r": 155.72055, "b": 547.03909, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 147.30025, "t": 548.91264, "r": 149.70605, "b": 551.28108, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "3.", "bbox": {"l": 147.30025, "t": 548.91264, "r": 149.70605, "b": 551.28108, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 150.90895, "t": 548.91264, "r": 155.72055, "b": 551.28108, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "Item", "bbox": {"l": 150.90895, "t": 548.91264, "r": 155.72055, "b": 551.28108, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 147.30025, "t": 553.15465, "r": 149.70605, "b": 555.52309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "4.", "bbox": {"l": 147.30025, "t": 553.15465, "r": 149.70605, "b": 555.52309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 150.90895, "t": 553.15465, "r": 155.72055, "b": 555.52309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "Item", "bbox": {"l": 150.90895, "t": 553.15465, "r": 155.72055, "b": 555.52309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 152.05046, "t": 517.0098, "r": 171.24945, "b": 521.27298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "Extracted", "bbox": {"l": 152.05046, "t": 517.0098, "r": 171.24945, "b": 521.27298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 148.13347, "t": 522.3122900000001, "r": 175.16759, "b": 526.57547, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "Table Images", "bbox": {"l": 148.13347, "t": 522.3122900000001, "r": 175.16759, "b": 526.57547, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 193.53331, "t": 524.51422, "r": 220.31973, "b": 528.7774, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "Standardized", "bbox": {"l": 193.53331, "t": 524.51422, "r": 220.31973, "b": 528.7774, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 199.47311, "t": 529.8167100000001, "r": 214.37889, "b": 534.0799, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "Images", "bbox": {"l": 199.47311, "t": 529.8167100000001, "r": 214.37889, "b": 534.0799, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 273.61066, "t": 509.9053, "r": 284.47275, "b": 514.16849, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "BBox", "bbox": {"l": 273.61066, "t": 509.9053, "r": 284.47275, "b": 514.16849, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 270.45187, "t": 513.6928399999999, "r": 287.63242, "b": 517.9560200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "Decoder", "bbox": {"l": 270.45187, "t": 513.6928399999999, "r": 287.63242, "b": 517.9560200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 332.47852, "t": 508.14438, "r": 348.14014, "b": 512.40756, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "BBoxes", "bbox": {"l": 332.47852, "t": 508.14438, "r": 348.14014, "b": 512.40756, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 376.68622, "t": 521.12024, "r": 407.25497, "b": 525.38342, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "BBoxes can be", "bbox": {"l": 376.68622, "t": 521.12024, "r": 407.25497, "b": 525.38342, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 373.90869, "t": 525.66525, "r": 410.03506, "b": 529.92844, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "traced back to the", "bbox": {"l": 373.90869, "t": 525.66525, "r": 410.03506, "b": 529.92844, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 375.29871, "t": 530.21024, "r": 408.64902, "b": 534.47342, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "original image to", "bbox": {"l": 375.29871, "t": 530.21024, "r": 408.64902, "b": 534.47342, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 377.06747, "t": 534.75522, "r": 406.88312, "b": 539.01843, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "extract content", "bbox": {"l": 377.06747, "t": 534.75522, "r": 406.88312, "b": 539.01843, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 383.56683, "t": 563.24176, "r": 433.76544, "b": 567.50497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "Structure Tags sequence", "bbox": {"l": 383.56683, "t": 563.24176, "r": 433.76544, "b": 567.50497, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 383.52768, "t": 567.78676, "r": 433.80764999999997, "b": 572.04997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "provide full description of", "bbox": {"l": 383.52768, "t": 567.78676, "r": 433.80764999999997, "b": 572.04997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 390.47522, "t": 572.33177, "r": 426.85703, "b": 576.59499, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "the table structure", "bbox": {"l": 390.47522, "t": 572.33177, "r": 426.85703, "b": 576.59499, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 293.94702, "t": 577.89143, "r": 323.1691, "b": 582.15465, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "Structure Tags", "bbox": {"l": 293.94702, "t": 577.89143, "r": 323.1691, "b": 582.15465, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 293.94702, "t": 582.43648, "r": 324.59396, "b": 586.69969, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "in OTSL format", "bbox": {"l": 293.94702, "t": 582.43648, "r": 324.59396, "b": 586.69969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 333.07819, "t": 541.82269, "r": 364.14691, "b": 546.08591, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "BBoxes in sync", "bbox": {"l": 333.07819, "t": 541.82269, "r": 364.14691, "b": 546.08591, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 333.07819, "t": 545.6102, "r": 369.71542, "b": 549.87341, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "with tag sequence", "bbox": {"l": 333.07819, "t": 545.6102, "r": 369.71542, "b": 549.87341, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 232.65881000000002, "t": 515.24139, "r": 249.58894000000004, "b": 519.50458, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "Encoder", "bbox": {"l": 232.65881000000002, "t": 515.24139, "r": 249.58894000000004, "b": 519.50458, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 269.8219, "t": 545.97102, "r": 288.26279, "b": 550.23424, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "Structure", "bbox": {"l": 269.8219, "t": 545.97102, "r": 288.26279, "b": 550.23424, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 270.45187, "t": 549.75851, "r": 287.63242, "b": 554.0217299999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "Decoder", "bbox": {"l": 270.45187, "t": 549.75851, "r": 287.63242, "b": 554.0217299999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 332.17676, "t": 515.91205, "r": 358.11206, "b": 520.17523, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "[x1, y2, x2, y2]", "bbox": {"l": 332.17676, "t": 515.91205, "r": 358.11206, "b": 520.17523, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 332.17676, "t": 521.9720500000001, "r": 361.58298, "b": 526.23523, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "[x1', y2', x2', y2']", "bbox": {"l": 332.17676, "t": 521.9720500000001, "r": 361.58298, "b": 526.23523, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 332.17676, "t": 528.03204, "r": 364.76474, "b": 532.29523, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "[x1'', y2'', x2'', y2'']", "bbox": {"l": 332.17676, "t": 528.03204, "r": 364.76474, "b": 532.29523, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 332.17676, "t": 534.09204, "r": 335.96548, "b": 538.35524, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "...", "bbox": {"l": 332.17676, "t": 534.09204, "r": 335.96548, "b": 538.35524, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 326.8894, "t": 516.39508, "r": 329.41641, "b": 520.6582599999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "1", "bbox": {"l": 326.8894, "t": 516.39508, "r": 329.41641, "b": 520.6582599999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 327.04089, "t": 522.4247700000001, "r": 329.5679, "b": 526.68796, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "2", "bbox": {"l": 327.04089, "t": 522.4247700000001, "r": 329.5679, "b": 526.68796, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 327.04089, "t": 528.51508, "r": 329.5679, "b": 532.77826, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "3", "bbox": {"l": 327.04089, "t": 528.51508, "r": 329.5679, "b": 532.77826, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 424.14102, "t": 527.4428399999999, "r": 426.66803, "b": 531.7060200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "3", "bbox": {"l": 424.14102, "t": 527.4428399999999, "r": 426.66803, "b": 531.7060200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 453.0018, "t": 517.4539500000001, "r": 455.52881, "b": 521.71713, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "2", "bbox": {"l": 453.0018, "t": 517.4539500000001, "r": 455.52881, "b": 521.71713, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 423.85825, "t": 517.06281, "r": 426.38525, "b": 521.32599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "1", "bbox": {"l": 423.85825, "t": 517.06281, "r": 426.38525, "b": 521.32599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 333.4342, "t": 557.36679, "r": 337.27542, "b": 562.35719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "C", "bbox": {"l": 333.4342, "t": 557.36679, "r": 337.27542, "b": 562.35719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 340.35397, "t": 557.31679, "r": 344.19519, "b": 562.30719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "C", "bbox": {"l": 340.35397, "t": 557.31679, "r": 344.19519, "b": 562.30719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 340.30978, "t": 563.8653899999999, "r": 344.151, "b": 568.8557900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "C", "bbox": {"l": 340.30978, "t": 563.8653899999999, "r": 344.151, "b": 568.8557900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 346.79904, "t": 563.8686700000001, "r": 350.64026, "b": 568.85907, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "C", "bbox": {"l": 346.79904, "t": 563.8686700000001, "r": 350.64026, "b": 568.85907, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 333.59583, "t": 563.82271, "r": 337.43704, "b": 568.81311, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "C", "bbox": {"l": 333.59583, "t": 563.82271, "r": 337.43704, "b": 568.81311, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 340.37543, "t": 570.42673, "r": 344.21664, "b": 575.41713, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "C", "bbox": {"l": 340.37543, "t": 570.42673, "r": 344.21664, "b": 575.41713, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 346.86469, "t": 570.43001, "r": 350.7059, "b": 575.42041, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "C", "bbox": {"l": 346.86469, "t": 570.43001, "r": 350.7059, "b": 575.42041, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 333.66144, "t": 570.38405, "r": 337.50266, "b": 575.37445, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "C", "bbox": {"l": 333.66144, "t": 570.38405, "r": 337.50266, "b": 575.37445, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 340.37671, "t": 577.02606, "r": 344.21793, "b": 582.0164599999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "C", "bbox": {"l": 340.37671, "t": 577.02606, "r": 344.21793, "b": 582.0164599999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 346.86597, "t": 577.02934, "r": 350.70718, "b": 582.01974, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "C", "bbox": {"l": 346.86597, "t": 577.02934, "r": 350.70718, "b": 582.01974, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 333.66272, "t": 576.98338, "r": 337.50394, "b": 581.97379, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "C", "bbox": {"l": 333.66272, "t": 576.98338, "r": 337.50394, "b": 581.97379, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 340.27948, "t": 583.39737, "r": 344.1207, "b": 588.38777, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "C", "bbox": {"l": 340.27948, "t": 583.39737, "r": 344.1207, "b": 588.38777, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 346.76874, "t": 583.40068, "r": 350.60995, "b": 588.39108, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "C", "bbox": {"l": 346.76874, "t": 583.40068, "r": 350.60995, "b": 588.39108, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 333.56549, "t": 583.35474, "r": 337.40671, "b": 588.34514, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "C", "bbox": {"l": 333.56549, "t": 583.35474, "r": 337.40671, "b": 588.34514, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 353.03326, "t": 556.8831299999999, "r": 359.83362, "b": 561.87354, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "NL", "bbox": {"l": 353.03326, "t": 556.8831299999999, "r": 359.83362, "b": 561.87354, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 353.18604, "t": 563.58044, "r": 359.98639, "b": 568.57085, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "NL", "bbox": {"l": 353.18604, "t": 563.58044, "r": 359.98639, "b": 568.57085, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 353.19864, "t": 570.1623500000001, "r": 359.99899, "b": 575.15276, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "NL", "bbox": {"l": 353.19864, "t": 570.1623500000001, "r": 359.99899, "b": 575.15276, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 353.1532, "t": 576.76611, "r": 359.95355, "b": 581.75652, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "NL", "bbox": {"l": 353.1532, "t": 576.76611, "r": 359.95355, "b": 581.75652, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 353.26935, "t": 583.40628, "r": 360.0697, "b": 588.3966800000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "NL", "bbox": {"l": 353.26935, "t": 583.40628, "r": 360.0697, "b": 588.3966800000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 347.37979, "t": 557.08235, "r": 350.33786, "b": 562.07275, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "L", "bbox": {"l": 347.37979, "t": 557.08235, "r": 350.33786, "b": 562.07275, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 331.14026, "t": 564.2907700000001, "r": 333.66727, "b": 568.55399, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "3", "bbox": {"l": 331.14026, "t": 564.2907700000001, "r": 333.66727, "b": 568.55399, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 340.80972, "t": 554.59312, "r": 343.33673, "b": 558.85634, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": "2", "bbox": {"l": 340.80972, "t": 554.59312, "r": 343.33673, "b": 558.85634, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 330.97992, "t": 554.83035, "r": 333.50693, "b": 559.09357, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "1", "bbox": {"l": 330.97992, "t": 554.83035, "r": 333.50693, "b": 559.09357, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "text", "id": 4, "page_no": 7, "cluster": {"id": 4, "label": "text", "bbox": {"l": 134.765, "t": 620.19278, "r": 480.5917400000001, "b": 664.8547599999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9512704014778137, "cells": [{"id": 105, "text": "We rely on standard metrics such as Tree Edit Distance score (TEDs) for", "bbox": {"l": 149.709, "t": 620.19278, "r": 480.58792, "b": 628.98975, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "table structure prediction, and Mean Average Precision (mAP) with 0.75 Inter-", "bbox": {"l": 134.765, "t": 632.14778, "r": 480.58871, "b": 640.94475, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "section Over Union (IOU) threshold for the bounding-box predictions of table", "bbox": {"l": 134.765, "t": 644.1027799999999, "r": 480.5917400000001, "b": 652.89975, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "cells. The predicted OTSL structures were converted back to HTML format in", "bbox": {"l": 134.765, "t": 656.0577900000001, "r": 480.58968999999996, "b": 664.8547599999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "We rely on standard metrics such as Tree Edit Distance score (TEDs) for table structure prediction, and Mean Average Precision (mAP) with 0.75 Intersection Over Union (IOU) threshold for the bounding-box predictions of table cells. The predicted OTSL structures were converted back to HTML format in"}], "headers": [{"label": "page_header", "id": 9, "page_no": 7, "cluster": {"id": 9, "label": "page_header", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8301324844360352, "cells": [{"id": 0, "text": "8", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "8"}, {"label": "page_header", "id": 8, "page_no": 7, "cluster": {"id": 8, "label": "page_header", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8631827235221863, "cells": [{"id": 1, "text": "M.", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 178.07675, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37415, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "M. Lysak, et al."}]}}, {"page_no": 8, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "9", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "order to compute the TED score. Inference timing results for all experiments", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.5936899999999, "b": 127.73077, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "were obtained from the same machine on a single core with AMD EPYC 7763", "bbox": {"l": 134.765, "t": 130.88878999999997, "r": 480.59579, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "CPU @2.45 GHz.", "bbox": {"l": 134.765, "t": 142.84479, "r": 210.78462, "b": 151.64178000000004, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "5.1", "bbox": {"l": 134.765, "t": 169.18584999999996, "r": 149.40205, "b": 177.9928, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Hyper Parameter Optimization", "bbox": {"l": 160.85904, "t": 169.18584999999996, "r": 318.44843, "b": 177.9928, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "We have chosen the PubTabNet data set to perform HPO, since it includes a", "bbox": {"l": 134.765, "t": 185.58582, "r": 480.59183, "b": 194.38280999999995, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "highly diverse set of tables. Also we report TED scores separately for simple and", "bbox": {"l": 134.765, "t": 197.54083000000003, "r": 480.59183, "b": 206.33783000000005, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "complex tables (tables with cell spans). Results are presented in Table. 1. It is", "bbox": {"l": 134.765, "t": 209.49585000000002, "r": 480.59177000000005, "b": 218.29285000000004, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "evident that with OTSL, our model achieves the same TED score and slightly", "bbox": {"l": 134.765, "t": 221.45087, "r": 480.59277, "b": 230.24785999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "better mAP scores in comparison to HTML. However OTSL yields a", "bbox": {"l": 134.765, "t": 233.40588000000002, "r": 440.94159, "b": 242.20288000000005, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "2x speed", "bbox": {"l": 444.86798, "t": 233.40588000000002, "r": 480.58786000000003, "b": 242.20288000000005, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "up", "bbox": {"l": 134.76498, "t": 245.36188000000004, "r": 145.20081, "b": 254.15886999999998, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "in the inference runtime over HTML.", "bbox": {"l": 149.14899, "t": 245.36188000000004, "r": 311.21957, "b": 254.15886999999998, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Table", "bbox": {"l": 134.76498, "t": 275.07232999999997, "r": 160.11836, "b": 282.9986, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "1.", "bbox": {"l": 167.34528, "t": 275.07232999999997, "r": 175.59526, "b": 282.9986, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "HPO performed in OTSL and HTML representation on the same", "bbox": {"l": 188.13298, "t": 275.13507000000004, "r": 480.59365999999994, "b": 283.2048300000001, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "transformer-based TableFormer [9] architecture, trained only on PubTabNet [22]. Ef-", "bbox": {"l": 134.76498, "t": 286.09409, "r": 480.59444999999994, "b": 294.16385, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "fects of reducing the # of layers in encoder and decoder stages of the model show that", "bbox": {"l": 134.76498, "t": 297.05307, "r": 480.5954, "b": 305.12283, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "smaller models trained on OTSL perform better, especially in recognizing complex", "bbox": {"l": 134.76498, "t": 308.01205, "r": 480.59451, "b": 316.08182, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "table structures, and maintain a much higher mAP score than the HTML counterpart.", "bbox": {"l": 134.76498, "t": 318.97104, "r": 480.59441999999996, "b": 327.0408, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "#", "bbox": {"l": 160.37, "t": 341.73495, "r": 168.04793, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "enc-layers", "bbox": {"l": 144.592, "t": 354.68594, "r": 183.82806, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "#", "bbox": {"l": 207.974, "t": 341.73495, "r": 215.65193, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "dec-layers", "bbox": {"l": 192.19499, "t": 354.68594, "r": 231.43106, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "Language", "bbox": {"l": 239.79799999999997, "t": 347.21396, "r": 278.31766, "b": 355.28372, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "TEDs", "bbox": {"l": 324.67001, "t": 341.73495, "r": 348.26419, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "mAP", "bbox": {"l": 396.271, "t": 341.73495, "r": 417.12683, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "(0.75)", "bbox": {"l": 394.927, "t": 352.69394000000005, "r": 418.47278, "b": 360.7637, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Inference", "bbox": {"l": 430.771, "t": 341.73495, "r": 467.1423, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "time (secs)", "bbox": {"l": 427.14801, "t": 352.69394000000005, "r": 470.76056, "b": 360.7637, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "simple", "bbox": {"l": 286.686, "t": 354.68594, "r": 312.33261, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "complex", "bbox": {"l": 320.702, "t": 354.68594, "r": 353.71988, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "all", "bbox": {"l": 369.306, "t": 354.68594, "r": 379.03094, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "6", "bbox": {"l": 161.90601, "t": 373.51596, "r": 166.51294, "b": 381.58572, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "6", "bbox": {"l": 209.509, "t": 373.51596, "r": 214.11594, "b": 381.58572, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 368.03595, "r": 271.40527, "b": 376.10571, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "0.965", "bbox": {"l": 289.017, "t": 368.03595, "r": 310.00375, "b": 376.10571, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "0.934", "bbox": {"l": 326.71701, "t": 368.03595, "r": 347.70377, "b": 376.10571, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "0.955", "bbox": {"l": 363.67599, "t": 368.03595, "r": 384.66275, "b": 376.10571, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "0.88", "bbox": {"l": 397.26999, "t": 367.97317999999996, "r": 416.12723, "b": 375.89948, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "2.73", "bbox": {"l": 439.52701, "t": 367.97317999999996, "r": 458.38425, "b": 375.89948, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 380.98795, "r": 272.93954, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "0.969", "bbox": {"l": 289.017, "t": 380.98795, "r": 310.00375, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "0.927", "bbox": {"l": 326.71701, "t": 380.98795, "r": 347.70377, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "0.955", "bbox": {"l": 363.67599, "t": 380.98795, "r": 384.66275, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "0.857", "bbox": {"l": 396.20599, "t": 380.98795, "r": 417.19275, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "5.39", "bbox": {"l": 440.767, "t": 380.98795, "r": 457.14682, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "4", "bbox": {"l": 161.90601, "t": 399.81696, "r": 166.51294, "b": 407.88672, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "4", "bbox": {"l": 209.509, "t": 399.81696, "r": 214.11594, "b": 407.88672, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 394.33795, "r": 271.40527, "b": 402.40771, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "0.938", "bbox": {"l": 289.017, "t": 394.33795, "r": 310.00375, "b": 402.40771, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "0.904", "bbox": {"l": 326.71701, "t": 394.33795, "r": 347.70377, "b": 402.40771, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "0.927", "bbox": {"l": 363.67599, "t": 394.33795, "r": 384.66275, "b": 402.40771, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "0.853", "bbox": {"l": 394.61801, "t": 394.27518, "r": 418.77887, "b": 402.20148, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "1.97", "bbox": {"l": 439.52701, "t": 394.27518, "r": 458.38425, "b": 402.20148, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 407.28894, "r": 272.93954, "b": 415.3587, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "0.952", "bbox": {"l": 289.017, "t": 407.28894, "r": 310.00375, "b": 415.3587, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "0.909", "bbox": {"l": 326.71701, "t": 407.28894, "r": 347.70377, "b": 415.3587, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "0.938", "bbox": {"l": 362.08801, "t": 407.22617, "r": 386.24887, "b": 415.15247, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "0.843", "bbox": {"l": 396.20599, "t": 407.28894, "r": 417.19275, "b": 415.3587, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "3.77", "bbox": {"l": 440.767, "t": 407.28894, "r": 457.14682, "b": 415.3587, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "2", "bbox": {"l": 161.90601, "t": 426.11795, "r": 166.51294, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "4", "bbox": {"l": 209.509, "t": 426.11795, "r": 214.11594, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 420.63895, "r": 271.40527, "b": 428.70871, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "0.923", "bbox": {"l": 289.017, "t": 420.63895, "r": 310.00375, "b": 428.70871, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "0.897", "bbox": {"l": 326.71701, "t": 420.63895, "r": 347.70377, "b": 428.70871, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "0.915", "bbox": {"l": 363.67599, "t": 420.63895, "r": 384.66275, "b": 428.70871, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "0.859", "bbox": {"l": 394.61801, "t": 420.57617, "r": 418.77887, "b": 428.50247, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "1.91", "bbox": {"l": 439.52701, "t": 420.57617, "r": 458.38425, "b": 428.50247, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 433.58994, "r": 272.93954, "b": 441.6597, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "0.945", "bbox": {"l": 289.017, "t": 433.58994, "r": 310.00375, "b": 441.6597, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "0.901", "bbox": {"l": 326.71701, "t": 433.58994, "r": 347.70377, "b": 441.6597, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "0.931", "bbox": {"l": 362.08801, "t": 433.5271599999999, "r": 386.24887, "b": 441.45346, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "0.834", "bbox": {"l": 396.20599, "t": 433.58994, "r": 417.19275, "b": 441.6597, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "3.81", "bbox": {"l": 440.767, "t": 433.58994, "r": 457.14682, "b": 441.6597, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "4", "bbox": {"l": 161.90601, "t": 452.41995, "r": 166.51294, "b": 460.48972, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "2", "bbox": {"l": 209.509, "t": 452.41995, "r": 214.11594, "b": 460.48972, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 446.9399399999999, "r": 271.40527, "b": 455.0097, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "0.952", "bbox": {"l": 289.017, "t": 446.9399399999999, "r": 310.00375, "b": 455.0097, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "0.92", "bbox": {"l": 329.021, "t": 446.9399399999999, "r": 345.40082, "b": 455.0097, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "0.942", "bbox": {"l": 362.08801, "t": 446.87717, "r": 386.24887, "b": 454.80347, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "0.857", "bbox": {"l": 394.61801, "t": 446.87717, "r": 418.77887, "b": 454.80347, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "1.22", "bbox": {"l": 439.52701, "t": 446.87717, "r": 458.38425, "b": 454.80347, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 459.8919399999999, "r": 272.93954, "b": 467.9617, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "0.944", "bbox": {"l": 289.017, "t": 459.8919399999999, "r": 310.00375, "b": 467.9617, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "0.903", "bbox": {"l": 326.71701, "t": 459.8919399999999, "r": 347.70377, "b": 467.9617, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "0.931", "bbox": {"l": 363.67599, "t": 459.8919399999999, "r": 384.66275, "b": 467.9617, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "0.824", "bbox": {"l": 396.20599, "t": 459.8919399999999, "r": 417.19275, "b": 467.9617, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "2", "bbox": {"l": 446.65302, "t": 459.8919399999999, "r": 451.25995, "b": 467.9617, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "5.2", "bbox": {"l": 134.765, "t": 508.15179, "r": 149.40205, "b": 516.95874, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Quantitative Results", "bbox": {"l": 160.85904, "t": 508.15179, "r": 264.40332, "b": 516.95874, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "We picked the model parameter configuration that produced the best prediction", "bbox": {"l": 134.765, "t": 524.55078, "r": 480.59075999999993, "b": 533.34775, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "quality (enc=6, dec=6, heads=8) with PubTabNet alone, then independently", "bbox": {"l": 134.765, "t": 536.50677, "r": 480.58675999999997, "b": 545.3037400000001, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "trained and evaluated it on three publicly available data sets: PubTabNet (395k", "bbox": {"l": 134.765, "t": 548.4617800000001, "r": 480.59572999999995, "b": 557.25874, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "samples), FinTabNet (113k samples) and PubTables-1M (about 1M samples).", "bbox": {"l": 134.765, "t": 560.41678, "r": 480.59177000000005, "b": 569.21375, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "Performance results are presented in Table. 2. It is clearly evident that the model", "bbox": {"l": 134.765, "t": 572.37178, "r": 480.59069999999997, "b": 581.16875, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "trained on OTSL outperforms HTML across the board, keeping high TEDs and", "bbox": {"l": 134.765, "t": 584.32678, "r": 480.5957599999999, "b": 593.12375, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "mAP scores even on difficult financial tables (FinTabNet) that contain sparse", "bbox": {"l": 134.765, "t": 596.28278, "r": 480.58774, "b": 605.07974, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "and large tables.", "bbox": {"l": 134.765, "t": 608.2377799999999, "r": 206.78664, "b": 617.03474, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "Additionally, the results show that OTSL has an advantage over HTML", "bbox": {"l": 149.709, "t": 620.19278, "r": 480.59271, "b": 628.98975, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "when applied on a bigger data set like PubTables-1M and achieves significantly", "bbox": {"l": 134.765, "t": 632.14778, "r": 480.5957599999999, "b": 640.94475, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "improved scores. Finally, OTSL achieves faster inference due to fewer decoding", "bbox": {"l": 134.765, "t": 644.1027799999999, "r": 480.59283000000005, "b": 652.89975, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "steps which is a result of the reduced sequence representation.", "bbox": {"l": 134.765, "t": 656.0577900000001, "r": 405.79651, "b": 664.8547599999999, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 8, "label": "page_header", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9373378157615662, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "page_header", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8857628107070923, "cells": [{"id": 1, "text": "9", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "text", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.59579, "b": 151.64178000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9805440306663513, "cells": [{"id": 2, "text": "order to compute the TED score. Inference timing results for all experiments", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.5936899999999, "b": 127.73077, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "were obtained from the same machine on a single core with AMD EPYC 7763", "bbox": {"l": 134.765, "t": 130.88878999999997, "r": 480.59579, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "CPU @2.45 GHz.", "bbox": {"l": 134.765, "t": 142.84479, "r": 210.78462, "b": 151.64178000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "section_header", "bbox": {"l": 134.765, "t": 169.18584999999996, "r": 318.44843, "b": 177.9928, "coord_origin": "TOPLEFT"}, "confidence": 0.9579682350158691, "cells": [{"id": 5, "text": "5.1", "bbox": {"l": 134.765, "t": 169.18584999999996, "r": 149.40205, "b": 177.9928, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Hyper Parameter Optimization", "bbox": {"l": 160.85904, "t": 169.18584999999996, "r": 318.44843, "b": 177.9928, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 134.76498, "t": 185.58582, "r": 480.59277, "b": 254.15886999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.9842326641082764, "cells": [{"id": 7, "text": "We have chosen the PubTabNet data set to perform HPO, since it includes a", "bbox": {"l": 134.765, "t": 185.58582, "r": 480.59183, "b": 194.38280999999995, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "highly diverse set of tables. Also we report TED scores separately for simple and", "bbox": {"l": 134.765, "t": 197.54083000000003, "r": 480.59183, "b": 206.33783000000005, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "complex tables (tables with cell spans). Results are presented in Table. 1. It is", "bbox": {"l": 134.765, "t": 209.49585000000002, "r": 480.59177000000005, "b": 218.29285000000004, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "evident that with OTSL, our model achieves the same TED score and slightly", "bbox": {"l": 134.765, "t": 221.45087, "r": 480.59277, "b": 230.24785999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "better mAP scores in comparison to HTML. However OTSL yields a", "bbox": {"l": 134.765, "t": 233.40588000000002, "r": 440.94159, "b": 242.20288000000005, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "2x speed", "bbox": {"l": 444.86798, "t": 233.40588000000002, "r": 480.58786000000003, "b": 242.20288000000005, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "up", "bbox": {"l": 134.76498, "t": 245.36188000000004, "r": 145.20081, "b": 254.15886999999998, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "in the inference runtime over HTML.", "bbox": {"l": 149.14899, "t": 245.36188000000004, "r": 311.21957, "b": 254.15886999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "caption", "bbox": {"l": 134.76498, "t": 275.07232999999997, "r": 480.5954, "b": 327.0408, "coord_origin": "TOPLEFT"}, "confidence": 0.957078218460083, "cells": [{"id": 15, "text": "Table", "bbox": {"l": 134.76498, "t": 275.07232999999997, "r": 160.11836, "b": 282.9986, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "1.", "bbox": {"l": 167.34528, "t": 275.07232999999997, "r": 175.59526, "b": 282.9986, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "HPO performed in OTSL and HTML representation on the same", "bbox": {"l": 188.13298, "t": 275.13507000000004, "r": 480.59365999999994, "b": 283.2048300000001, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "transformer-based TableFormer [9] architecture, trained only on PubTabNet [22]. Ef-", "bbox": {"l": 134.76498, "t": 286.09409, "r": 480.59444999999994, "b": 294.16385, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "fects of reducing the # of layers in encoder and decoder stages of the model show that", "bbox": {"l": 134.76498, "t": 297.05307, "r": 480.5954, "b": 305.12283, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "smaller models trained on OTSL perform better, especially in recognizing complex", "bbox": {"l": 134.76498, "t": 308.01205, "r": 480.59451, "b": 316.08182, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "table structures, and maintain a much higher mAP score than the HTML counterpart.", "bbox": {"l": 134.76498, "t": 318.97104, "r": 480.59441999999996, "b": 327.0408, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "table", "bbox": {"l": 139.66845703125, "t": 337.5747375488281, "r": 475.00372314453125, "b": 469.4720764160156, "coord_origin": "TOPLEFT"}, "confidence": 0.9901032447814941, "cells": [{"id": 22, "text": "#", "bbox": {"l": 160.37, "t": 341.73495, "r": 168.04793, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "enc-layers", "bbox": {"l": 144.592, "t": 354.68594, "r": 183.82806, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "#", "bbox": {"l": 207.974, "t": 341.73495, "r": 215.65193, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "dec-layers", "bbox": {"l": 192.19499, "t": 354.68594, "r": 231.43106, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "Language", "bbox": {"l": 239.79799999999997, "t": 347.21396, "r": 278.31766, "b": 355.28372, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "TEDs", "bbox": {"l": 324.67001, "t": 341.73495, "r": 348.26419, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "mAP", "bbox": {"l": 396.271, "t": 341.73495, "r": 417.12683, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "(0.75)", "bbox": {"l": 394.927, "t": 352.69394000000005, "r": 418.47278, "b": 360.7637, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Inference", "bbox": {"l": 430.771, "t": 341.73495, "r": 467.1423, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "time (secs)", "bbox": {"l": 427.14801, "t": 352.69394000000005, "r": 470.76056, "b": 360.7637, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "simple", "bbox": {"l": 286.686, "t": 354.68594, "r": 312.33261, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "complex", "bbox": {"l": 320.702, "t": 354.68594, "r": 353.71988, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "all", "bbox": {"l": 369.306, "t": 354.68594, "r": 379.03094, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "6", "bbox": {"l": 161.90601, "t": 373.51596, "r": 166.51294, "b": 381.58572, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "6", "bbox": {"l": 209.509, "t": 373.51596, "r": 214.11594, "b": 381.58572, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 368.03595, "r": 271.40527, "b": 376.10571, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "0.965", "bbox": {"l": 289.017, "t": 368.03595, "r": 310.00375, "b": 376.10571, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "0.934", "bbox": {"l": 326.71701, "t": 368.03595, "r": 347.70377, "b": 376.10571, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "0.955", "bbox": {"l": 363.67599, "t": 368.03595, "r": 384.66275, "b": 376.10571, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "0.88", "bbox": {"l": 397.26999, "t": 367.97317999999996, "r": 416.12723, "b": 375.89948, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "2.73", "bbox": {"l": 439.52701, "t": 367.97317999999996, "r": 458.38425, "b": 375.89948, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 380.98795, "r": 272.93954, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "0.969", "bbox": {"l": 289.017, "t": 380.98795, "r": 310.00375, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "0.927", "bbox": {"l": 326.71701, "t": 380.98795, "r": 347.70377, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "0.955", "bbox": {"l": 363.67599, "t": 380.98795, "r": 384.66275, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "0.857", "bbox": {"l": 396.20599, "t": 380.98795, "r": 417.19275, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "5.39", "bbox": {"l": 440.767, "t": 380.98795, "r": 457.14682, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "4", "bbox": {"l": 161.90601, "t": 399.81696, "r": 166.51294, "b": 407.88672, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "4", "bbox": {"l": 209.509, "t": 399.81696, "r": 214.11594, "b": 407.88672, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 394.33795, "r": 271.40527, "b": 402.40771, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "0.938", "bbox": {"l": 289.017, "t": 394.33795, "r": 310.00375, "b": 402.40771, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "0.904", "bbox": {"l": 326.71701, "t": 394.33795, "r": 347.70377, "b": 402.40771, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "0.927", "bbox": {"l": 363.67599, "t": 394.33795, "r": 384.66275, "b": 402.40771, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "0.853", "bbox": {"l": 394.61801, "t": 394.27518, "r": 418.77887, "b": 402.20148, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "1.97", "bbox": {"l": 439.52701, "t": 394.27518, "r": 458.38425, "b": 402.20148, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 407.28894, "r": 272.93954, "b": 415.3587, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "0.952", "bbox": {"l": 289.017, "t": 407.28894, "r": 310.00375, "b": 415.3587, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "0.909", "bbox": {"l": 326.71701, "t": 407.28894, "r": 347.70377, "b": 415.3587, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "0.938", "bbox": {"l": 362.08801, "t": 407.22617, "r": 386.24887, "b": 415.15247, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "0.843", "bbox": {"l": 396.20599, "t": 407.28894, "r": 417.19275, "b": 415.3587, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "3.77", "bbox": {"l": 440.767, "t": 407.28894, "r": 457.14682, "b": 415.3587, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "2", "bbox": {"l": 161.90601, "t": 426.11795, "r": 166.51294, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "4", "bbox": {"l": 209.509, "t": 426.11795, "r": 214.11594, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 420.63895, "r": 271.40527, "b": 428.70871, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "0.923", "bbox": {"l": 289.017, "t": 420.63895, "r": 310.00375, "b": 428.70871, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "0.897", "bbox": {"l": 326.71701, "t": 420.63895, "r": 347.70377, "b": 428.70871, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "0.915", "bbox": {"l": 363.67599, "t": 420.63895, "r": 384.66275, "b": 428.70871, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "0.859", "bbox": {"l": 394.61801, "t": 420.57617, "r": 418.77887, "b": 428.50247, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "1.91", "bbox": {"l": 439.52701, "t": 420.57617, "r": 458.38425, "b": 428.50247, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 433.58994, "r": 272.93954, "b": 441.6597, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "0.945", "bbox": {"l": 289.017, "t": 433.58994, "r": 310.00375, "b": 441.6597, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "0.901", "bbox": {"l": 326.71701, "t": 433.58994, "r": 347.70377, "b": 441.6597, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "0.931", "bbox": {"l": 362.08801, "t": 433.5271599999999, "r": 386.24887, "b": 441.45346, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "0.834", "bbox": {"l": 396.20599, "t": 433.58994, "r": 417.19275, "b": 441.6597, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "3.81", "bbox": {"l": 440.767, "t": 433.58994, "r": 457.14682, "b": 441.6597, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "4", "bbox": {"l": 161.90601, "t": 452.41995, "r": 166.51294, "b": 460.48972, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "2", "bbox": {"l": 209.509, "t": 452.41995, "r": 214.11594, "b": 460.48972, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 446.9399399999999, "r": 271.40527, "b": 455.0097, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "0.952", "bbox": {"l": 289.017, "t": 446.9399399999999, "r": 310.00375, "b": 455.0097, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "0.92", "bbox": {"l": 329.021, "t": 446.9399399999999, "r": 345.40082, "b": 455.0097, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "0.942", "bbox": {"l": 362.08801, "t": 446.87717, "r": 386.24887, "b": 454.80347, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "0.857", "bbox": {"l": 394.61801, "t": 446.87717, "r": 418.77887, "b": 454.80347, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "1.22", "bbox": {"l": 439.52701, "t": 446.87717, "r": 458.38425, "b": 454.80347, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 459.8919399999999, "r": 272.93954, "b": 467.9617, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "0.944", "bbox": {"l": 289.017, "t": 459.8919399999999, "r": 310.00375, "b": 467.9617, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "0.903", "bbox": {"l": 326.71701, "t": 459.8919399999999, "r": 347.70377, "b": 467.9617, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "0.931", "bbox": {"l": 363.67599, "t": 459.8919399999999, "r": 384.66275, "b": 467.9617, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "0.824", "bbox": {"l": 396.20599, "t": 459.8919399999999, "r": 417.19275, "b": 467.9617, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "2", "bbox": {"l": 446.65302, "t": 459.8919399999999, "r": 451.25995, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": [{"id": 10, "label": "text", "bbox": {"l": 160.37, "t": 341.73495, "r": 168.04793, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "#", "bbox": {"l": 160.37, "t": 341.73495, "r": 168.04793, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 144.592, "t": 354.68594, "r": 183.82806, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "enc-layers", "bbox": {"l": 144.592, "t": 354.68594, "r": 183.82806, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 207.974, "t": 341.73495, "r": 215.65193, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "#", "bbox": {"l": 207.974, "t": 341.73495, "r": 215.65193, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 192.19499, "t": 354.68594, "r": 231.43106, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "dec-layers", "bbox": {"l": 192.19499, "t": 354.68594, "r": 231.43106, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 239.79799999999997, "t": 347.21396, "r": 278.31766, "b": 355.28372, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "Language", "bbox": {"l": 239.79799999999997, "t": 347.21396, "r": 278.31766, "b": 355.28372, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 324.67001, "t": 341.73495, "r": 348.26419, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "TEDs", "bbox": {"l": 324.67001, "t": 341.73495, "r": 348.26419, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 396.271, "t": 341.73495, "r": 417.12683, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "mAP", "bbox": {"l": 396.271, "t": 341.73495, "r": 417.12683, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 394.927, "t": 352.69394000000005, "r": 418.47278, "b": 360.7637, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "(0.75)", "bbox": {"l": 394.927, "t": 352.69394000000005, "r": 418.47278, "b": 360.7637, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 430.771, "t": 341.73495, "r": 467.1423, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "Inference", "bbox": {"l": 430.771, "t": 341.73495, "r": 467.1423, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 427.14801, "t": 352.69394000000005, "r": 470.76056, "b": 360.7637, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "time (secs)", "bbox": {"l": 427.14801, "t": 352.69394000000005, "r": 470.76056, "b": 360.7637, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 286.686, "t": 354.68594, "r": 312.33261, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "simple", "bbox": {"l": 286.686, "t": 354.68594, "r": 312.33261, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 320.702, "t": 354.68594, "r": 353.71988, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "complex", "bbox": {"l": 320.702, "t": 354.68594, "r": 353.71988, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 369.306, "t": 354.68594, "r": 379.03094, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "all", "bbox": {"l": 369.306, "t": 354.68594, "r": 379.03094, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 161.90601, "t": 373.51596, "r": 166.51294, "b": 381.58572, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "6", "bbox": {"l": 161.90601, "t": 373.51596, "r": 166.51294, "b": 381.58572, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 209.509, "t": 373.51596, "r": 214.11594, "b": 381.58572, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "6", "bbox": {"l": 209.509, "t": 373.51596, "r": 214.11594, "b": 381.58572, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 246.71000999999998, "t": 368.03595, "r": 271.40527, "b": 376.10571, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 368.03595, "r": 271.40527, "b": 376.10571, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 289.017, "t": 368.03595, "r": 310.00375, "b": 376.10571, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "0.965", "bbox": {"l": 289.017, "t": 368.03595, "r": 310.00375, "b": 376.10571, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 326.71701, "t": 368.03595, "r": 347.70377, "b": 376.10571, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "0.934", "bbox": {"l": 326.71701, "t": 368.03595, "r": 347.70377, "b": 376.10571, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 363.67599, "t": 368.03595, "r": 384.66275, "b": 376.10571, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "0.955", "bbox": {"l": 363.67599, "t": 368.03595, "r": 384.66275, "b": 376.10571, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 397.26999, "t": 367.97317999999996, "r": 416.12723, "b": 375.89948, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "0.88", "bbox": {"l": 397.26999, "t": 367.97317999999996, "r": 416.12723, "b": 375.89948, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 439.52701, "t": 367.97317999999996, "r": 458.38425, "b": 375.89948, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "2.73", "bbox": {"l": 439.52701, "t": 367.97317999999996, "r": 458.38425, "b": 375.89948, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 245.17598999999998, "t": 380.98795, "r": 272.93954, "b": 389.05771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 380.98795, "r": 272.93954, "b": 389.05771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 289.017, "t": 380.98795, "r": 310.00375, "b": 389.05771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "0.969", "bbox": {"l": 289.017, "t": 380.98795, "r": 310.00375, "b": 389.05771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 326.71701, "t": 380.98795, "r": 347.70377, "b": 389.05771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "0.927", "bbox": {"l": 326.71701, "t": 380.98795, "r": 347.70377, "b": 389.05771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 363.67599, "t": 380.98795, "r": 384.66275, "b": 389.05771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "0.955", "bbox": {"l": 363.67599, "t": 380.98795, "r": 384.66275, "b": 389.05771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 396.20599, "t": 380.98795, "r": 417.19275, "b": 389.05771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "0.857", "bbox": {"l": 396.20599, "t": 380.98795, "r": 417.19275, "b": 389.05771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 440.767, "t": 380.98795, "r": 457.14682, "b": 389.05771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "5.39", "bbox": {"l": 440.767, "t": 380.98795, "r": 457.14682, "b": 389.05771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 161.90601, "t": 399.81696, "r": 166.51294, "b": 407.88672, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "4", "bbox": {"l": 161.90601, "t": 399.81696, "r": 166.51294, "b": 407.88672, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 209.509, "t": 399.81696, "r": 214.11594, "b": 407.88672, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "4", "bbox": {"l": 209.509, "t": 399.81696, "r": 214.11594, "b": 407.88672, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 246.71000999999998, "t": 394.33795, "r": 271.40527, "b": 402.40771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 394.33795, "r": 271.40527, "b": 402.40771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 289.017, "t": 394.33795, "r": 310.00375, "b": 402.40771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "0.938", "bbox": {"l": 289.017, "t": 394.33795, "r": 310.00375, "b": 402.40771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 326.71701, "t": 394.33795, "r": 347.70377, "b": 402.40771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "0.904", "bbox": {"l": 326.71701, "t": 394.33795, "r": 347.70377, "b": 402.40771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 363.67599, "t": 394.33795, "r": 384.66275, "b": 402.40771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "0.927", "bbox": {"l": 363.67599, "t": 394.33795, "r": 384.66275, "b": 402.40771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 394.61801, "t": 394.27518, "r": 418.77887, "b": 402.20148, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "0.853", "bbox": {"l": 394.61801, "t": 394.27518, "r": 418.77887, "b": 402.20148, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 439.52701, "t": 394.27518, "r": 458.38425, "b": 402.20148, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "1.97", "bbox": {"l": 439.52701, "t": 394.27518, "r": 458.38425, "b": 402.20148, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 245.17598999999998, "t": 407.28894, "r": 272.93954, "b": 415.3587, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 407.28894, "r": 272.93954, "b": 415.3587, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 289.017, "t": 407.28894, "r": 310.00375, "b": 415.3587, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "0.952", "bbox": {"l": 289.017, "t": 407.28894, "r": 310.00375, "b": 415.3587, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 326.71701, "t": 407.28894, "r": 347.70377, "b": 415.3587, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "0.909", "bbox": {"l": 326.71701, "t": 407.28894, "r": 347.70377, "b": 415.3587, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 362.08801, "t": 407.22617, "r": 386.24887, "b": 415.15247, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "0.938", "bbox": {"l": 362.08801, "t": 407.22617, "r": 386.24887, "b": 415.15247, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 396.20599, "t": 407.28894, "r": 417.19275, "b": 415.3587, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "0.843", "bbox": {"l": 396.20599, "t": 407.28894, "r": 417.19275, "b": 415.3587, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 440.767, "t": 407.28894, "r": 457.14682, "b": 415.3587, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "3.77", "bbox": {"l": 440.767, "t": 407.28894, "r": 457.14682, "b": 415.3587, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 161.90601, "t": 426.11795, "r": 166.51294, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "2", "bbox": {"l": 161.90601, "t": 426.11795, "r": 166.51294, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 209.509, "t": 426.11795, "r": 214.11594, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "4", "bbox": {"l": 209.509, "t": 426.11795, "r": 214.11594, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 246.71000999999998, "t": 420.63895, "r": 271.40527, "b": 428.70871, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 420.63895, "r": 271.40527, "b": 428.70871, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 289.017, "t": 420.63895, "r": 310.00375, "b": 428.70871, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "0.923", "bbox": {"l": 289.017, "t": 420.63895, "r": 310.00375, "b": 428.70871, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 326.71701, "t": 420.63895, "r": 347.70377, "b": 428.70871, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "0.897", "bbox": {"l": 326.71701, "t": 420.63895, "r": 347.70377, "b": 428.70871, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 363.67599, "t": 420.63895, "r": 384.66275, "b": 428.70871, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "0.915", "bbox": {"l": 363.67599, "t": 420.63895, "r": 384.66275, "b": 428.70871, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 394.61801, "t": 420.57617, "r": 418.77887, "b": 428.50247, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "0.859", "bbox": {"l": 394.61801, "t": 420.57617, "r": 418.77887, "b": 428.50247, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 439.52701, "t": 420.57617, "r": 458.38425, "b": 428.50247, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "1.91", "bbox": {"l": 439.52701, "t": 420.57617, "r": 458.38425, "b": 428.50247, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 245.17598999999998, "t": 433.58994, "r": 272.93954, "b": 441.6597, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 433.58994, "r": 272.93954, "b": 441.6597, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 289.017, "t": 433.58994, "r": 310.00375, "b": 441.6597, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "0.945", "bbox": {"l": 289.017, "t": 433.58994, "r": 310.00375, "b": 441.6597, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 326.71701, "t": 433.58994, "r": 347.70377, "b": 441.6597, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "0.901", "bbox": {"l": 326.71701, "t": 433.58994, "r": 347.70377, "b": 441.6597, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 362.08801, "t": 433.5271599999999, "r": 386.24887, "b": 441.45346, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "0.931", "bbox": {"l": 362.08801, "t": 433.5271599999999, "r": 386.24887, "b": 441.45346, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 396.20599, "t": 433.58994, "r": 417.19275, "b": 441.6597, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "0.834", "bbox": {"l": 396.20599, "t": 433.58994, "r": 417.19275, "b": 441.6597, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 440.767, "t": 433.58994, "r": 457.14682, "b": 441.6597, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "3.81", "bbox": {"l": 440.767, "t": 433.58994, "r": 457.14682, "b": 441.6597, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 161.90601, "t": 452.41995, "r": 166.51294, "b": 460.48972, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "4", "bbox": {"l": 161.90601, "t": 452.41995, "r": 166.51294, "b": 460.48972, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 209.509, "t": 452.41995, "r": 214.11594, "b": 460.48972, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "2", "bbox": {"l": 209.509, "t": 452.41995, "r": 214.11594, "b": 460.48972, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 246.71000999999998, "t": 446.9399399999999, "r": 271.40527, "b": 455.0097, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 446.9399399999999, "r": 271.40527, "b": 455.0097, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 289.017, "t": 446.9399399999999, "r": 310.00375, "b": 455.0097, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "0.952", "bbox": {"l": 289.017, "t": 446.9399399999999, "r": 310.00375, "b": 455.0097, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 329.021, "t": 446.9399399999999, "r": 345.40082, "b": 455.0097, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "0.92", "bbox": {"l": 329.021, "t": 446.9399399999999, "r": 345.40082, "b": 455.0097, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 362.08801, "t": 446.87717, "r": 386.24887, "b": 454.80347, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "0.942", "bbox": {"l": 362.08801, "t": 446.87717, "r": 386.24887, "b": 454.80347, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 394.61801, "t": 446.87717, "r": 418.77887, "b": 454.80347, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "0.857", "bbox": {"l": 394.61801, "t": 446.87717, "r": 418.77887, "b": 454.80347, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 439.52701, "t": 446.87717, "r": 458.38425, "b": 454.80347, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "1.22", "bbox": {"l": 439.52701, "t": 446.87717, "r": 458.38425, "b": 454.80347, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 245.17598999999998, "t": 459.8919399999999, "r": 272.93954, "b": 467.9617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 459.8919399999999, "r": 272.93954, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 289.017, "t": 459.8919399999999, "r": 310.00375, "b": 467.9617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "0.944", "bbox": {"l": 289.017, "t": 459.8919399999999, "r": 310.00375, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 326.71701, "t": 459.8919399999999, "r": 347.70377, "b": 467.9617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "0.903", "bbox": {"l": 326.71701, "t": 459.8919399999999, "r": 347.70377, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 363.67599, "t": 459.8919399999999, "r": 384.66275, "b": 467.9617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "0.931", "bbox": {"l": 363.67599, "t": 459.8919399999999, "r": 384.66275, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 396.20599, "t": 459.8919399999999, "r": 417.19275, "b": 467.9617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "0.824", "bbox": {"l": 396.20599, "t": 459.8919399999999, "r": 417.19275, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 446.65302, "t": 459.8919399999999, "r": 451.25995, "b": 467.9617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "2", "bbox": {"l": 446.65302, "t": 459.8919399999999, "r": 451.25995, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 5, "label": "section_header", "bbox": {"l": 134.765, "t": 508.15179, "r": 264.40332, "b": 516.95874, "coord_origin": "TOPLEFT"}, "confidence": 0.9592539668083191, "cells": [{"id": 91, "text": "5.2", "bbox": {"l": 134.765, "t": 508.15179, "r": 149.40205, "b": 516.95874, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Quantitative Results", "bbox": {"l": 160.85904, "t": 508.15179, "r": 264.40332, "b": 516.95874, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 134.765, "t": 524.55078, "r": 480.5957599999999, "b": 617.03474, "coord_origin": "TOPLEFT"}, "confidence": 0.9854757189750671, "cells": [{"id": 93, "text": "We picked the model parameter configuration that produced the best prediction", "bbox": {"l": 134.765, "t": 524.55078, "r": 480.59075999999993, "b": 533.34775, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "quality (enc=6, dec=6, heads=8) with PubTabNet alone, then independently", "bbox": {"l": 134.765, "t": 536.50677, "r": 480.58675999999997, "b": 545.3037400000001, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "trained and evaluated it on three publicly available data sets: PubTabNet (395k", "bbox": {"l": 134.765, "t": 548.4617800000001, "r": 480.59572999999995, "b": 557.25874, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "samples), FinTabNet (113k samples) and PubTables-1M (about 1M samples).", "bbox": {"l": 134.765, "t": 560.41678, "r": 480.59177000000005, "b": 569.21375, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "Performance results are presented in Table. 2. It is clearly evident that the model", "bbox": {"l": 134.765, "t": 572.37178, "r": 480.59069999999997, "b": 581.16875, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "trained on OTSL outperforms HTML across the board, keeping high TEDs and", "bbox": {"l": 134.765, "t": 584.32678, "r": 480.5957599999999, "b": 593.12375, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "mAP scores even on difficult financial tables (FinTabNet) that contain sparse", "bbox": {"l": 134.765, "t": 596.28278, "r": 480.58774, "b": 605.07974, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "and large tables.", "bbox": {"l": 134.765, "t": 608.2377799999999, "r": 206.78664, "b": 617.03474, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 134.765, "t": 620.19278, "r": 480.5957599999999, "b": 664.8547599999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9851234555244446, "cells": [{"id": 101, "text": "Additionally, the results show that OTSL has an advantage over HTML", "bbox": {"l": 149.709, "t": 620.19278, "r": 480.59271, "b": 628.98975, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "when applied on a bigger data set like PubTables-1M and achieves significantly", "bbox": {"l": 134.765, "t": 632.14778, "r": 480.5957599999999, "b": 640.94475, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "improved scores. Finally, OTSL achieves faster inference due to fewer decoding", "bbox": {"l": 134.765, "t": 644.1027799999999, "r": 480.59283000000005, "b": 652.89975, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "steps which is a result of the reduced sequence representation.", "bbox": {"l": 134.765, "t": 656.0577900000001, "r": 405.79651, "b": 664.8547599999999, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {"0": {"label": "table", "id": 0, "page_no": 8, "cluster": {"id": 0, "label": "table", "bbox": {"l": 139.66845703125, "t": 337.5747375488281, "r": 475.00372314453125, "b": 469.4720764160156, "coord_origin": "TOPLEFT"}, "confidence": 0.9901032447814941, "cells": [{"id": 22, "text": "#", "bbox": {"l": 160.37, "t": 341.73495, "r": 168.04793, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "enc-layers", "bbox": {"l": 144.592, "t": 354.68594, "r": 183.82806, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "#", "bbox": {"l": 207.974, "t": 341.73495, "r": 215.65193, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "dec-layers", "bbox": {"l": 192.19499, "t": 354.68594, "r": 231.43106, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "Language", "bbox": {"l": 239.79799999999997, "t": 347.21396, "r": 278.31766, "b": 355.28372, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "TEDs", "bbox": {"l": 324.67001, "t": 341.73495, "r": 348.26419, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "mAP", "bbox": {"l": 396.271, "t": 341.73495, "r": 417.12683, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "(0.75)", "bbox": {"l": 394.927, "t": 352.69394000000005, "r": 418.47278, "b": 360.7637, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Inference", "bbox": {"l": 430.771, "t": 341.73495, "r": 467.1423, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "time (secs)", "bbox": {"l": 427.14801, "t": 352.69394000000005, "r": 470.76056, "b": 360.7637, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "simple", "bbox": {"l": 286.686, "t": 354.68594, "r": 312.33261, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "complex", "bbox": {"l": 320.702, "t": 354.68594, "r": 353.71988, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "all", "bbox": {"l": 369.306, "t": 354.68594, "r": 379.03094, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "6", "bbox": {"l": 161.90601, "t": 373.51596, "r": 166.51294, "b": 381.58572, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "6", "bbox": {"l": 209.509, "t": 373.51596, "r": 214.11594, "b": 381.58572, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 368.03595, "r": 271.40527, "b": 376.10571, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "0.965", "bbox": {"l": 289.017, "t": 368.03595, "r": 310.00375, "b": 376.10571, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "0.934", "bbox": {"l": 326.71701, "t": 368.03595, "r": 347.70377, "b": 376.10571, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "0.955", "bbox": {"l": 363.67599, "t": 368.03595, "r": 384.66275, "b": 376.10571, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "0.88", "bbox": {"l": 397.26999, "t": 367.97317999999996, "r": 416.12723, "b": 375.89948, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "2.73", "bbox": {"l": 439.52701, "t": 367.97317999999996, "r": 458.38425, "b": 375.89948, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 380.98795, "r": 272.93954, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "0.969", "bbox": {"l": 289.017, "t": 380.98795, "r": 310.00375, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "0.927", "bbox": {"l": 326.71701, "t": 380.98795, "r": 347.70377, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "0.955", "bbox": {"l": 363.67599, "t": 380.98795, "r": 384.66275, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "0.857", "bbox": {"l": 396.20599, "t": 380.98795, "r": 417.19275, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "5.39", "bbox": {"l": 440.767, "t": 380.98795, "r": 457.14682, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "4", "bbox": {"l": 161.90601, "t": 399.81696, "r": 166.51294, "b": 407.88672, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "4", "bbox": {"l": 209.509, "t": 399.81696, "r": 214.11594, "b": 407.88672, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 394.33795, "r": 271.40527, "b": 402.40771, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "0.938", "bbox": {"l": 289.017, "t": 394.33795, "r": 310.00375, "b": 402.40771, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "0.904", "bbox": {"l": 326.71701, "t": 394.33795, "r": 347.70377, "b": 402.40771, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "0.927", "bbox": {"l": 363.67599, "t": 394.33795, "r": 384.66275, "b": 402.40771, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "0.853", "bbox": {"l": 394.61801, "t": 394.27518, "r": 418.77887, "b": 402.20148, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "1.97", "bbox": {"l": 439.52701, "t": 394.27518, "r": 458.38425, "b": 402.20148, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 407.28894, "r": 272.93954, "b": 415.3587, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "0.952", "bbox": {"l": 289.017, "t": 407.28894, "r": 310.00375, "b": 415.3587, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "0.909", "bbox": {"l": 326.71701, "t": 407.28894, "r": 347.70377, "b": 415.3587, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "0.938", "bbox": {"l": 362.08801, "t": 407.22617, "r": 386.24887, "b": 415.15247, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "0.843", "bbox": {"l": 396.20599, "t": 407.28894, "r": 417.19275, "b": 415.3587, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "3.77", "bbox": {"l": 440.767, "t": 407.28894, "r": 457.14682, "b": 415.3587, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "2", "bbox": {"l": 161.90601, "t": 426.11795, "r": 166.51294, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "4", "bbox": {"l": 209.509, "t": 426.11795, "r": 214.11594, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 420.63895, "r": 271.40527, "b": 428.70871, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "0.923", "bbox": {"l": 289.017, "t": 420.63895, "r": 310.00375, "b": 428.70871, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "0.897", "bbox": {"l": 326.71701, "t": 420.63895, "r": 347.70377, "b": 428.70871, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "0.915", "bbox": {"l": 363.67599, "t": 420.63895, "r": 384.66275, "b": 428.70871, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "0.859", "bbox": {"l": 394.61801, "t": 420.57617, "r": 418.77887, "b": 428.50247, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "1.91", "bbox": {"l": 439.52701, "t": 420.57617, "r": 458.38425, "b": 428.50247, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 433.58994, "r": 272.93954, "b": 441.6597, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "0.945", "bbox": {"l": 289.017, "t": 433.58994, "r": 310.00375, "b": 441.6597, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "0.901", "bbox": {"l": 326.71701, "t": 433.58994, "r": 347.70377, "b": 441.6597, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "0.931", "bbox": {"l": 362.08801, "t": 433.5271599999999, "r": 386.24887, "b": 441.45346, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "0.834", "bbox": {"l": 396.20599, "t": 433.58994, "r": 417.19275, "b": 441.6597, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "3.81", "bbox": {"l": 440.767, "t": 433.58994, "r": 457.14682, "b": 441.6597, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "4", "bbox": {"l": 161.90601, "t": 452.41995, "r": 166.51294, "b": 460.48972, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "2", "bbox": {"l": 209.509, "t": 452.41995, "r": 214.11594, "b": 460.48972, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 446.9399399999999, "r": 271.40527, "b": 455.0097, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "0.952", "bbox": {"l": 289.017, "t": 446.9399399999999, "r": 310.00375, "b": 455.0097, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "0.92", "bbox": {"l": 329.021, "t": 446.9399399999999, "r": 345.40082, "b": 455.0097, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "0.942", "bbox": {"l": 362.08801, "t": 446.87717, "r": 386.24887, "b": 454.80347, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "0.857", "bbox": {"l": 394.61801, "t": 446.87717, "r": 418.77887, "b": 454.80347, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "1.22", "bbox": {"l": 439.52701, "t": 446.87717, "r": 458.38425, "b": 454.80347, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 459.8919399999999, "r": 272.93954, "b": 467.9617, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "0.944", "bbox": {"l": 289.017, "t": 459.8919399999999, "r": 310.00375, "b": 467.9617, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "0.903", "bbox": {"l": 326.71701, "t": 459.8919399999999, "r": 347.70377, "b": 467.9617, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "0.931", "bbox": {"l": 363.67599, "t": 459.8919399999999, "r": 384.66275, "b": 467.9617, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "0.824", "bbox": {"l": 396.20599, "t": 459.8919399999999, "r": 417.19275, "b": 467.9617, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "2", "bbox": {"l": 446.65302, "t": 459.8919399999999, "r": 451.25995, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": [{"id": 10, "label": "text", "bbox": {"l": 160.37, "t": 341.73495, "r": 168.04793, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "#", "bbox": {"l": 160.37, "t": 341.73495, "r": 168.04793, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 144.592, "t": 354.68594, "r": 183.82806, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "enc-layers", "bbox": {"l": 144.592, "t": 354.68594, "r": 183.82806, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 207.974, "t": 341.73495, "r": 215.65193, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "#", "bbox": {"l": 207.974, "t": 341.73495, "r": 215.65193, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 192.19499, "t": 354.68594, "r": 231.43106, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "dec-layers", "bbox": {"l": 192.19499, "t": 354.68594, "r": 231.43106, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 239.79799999999997, "t": 347.21396, "r": 278.31766, "b": 355.28372, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "Language", "bbox": {"l": 239.79799999999997, "t": 347.21396, "r": 278.31766, "b": 355.28372, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 324.67001, "t": 341.73495, "r": 348.26419, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "TEDs", "bbox": {"l": 324.67001, "t": 341.73495, "r": 348.26419, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 396.271, "t": 341.73495, "r": 417.12683, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "mAP", "bbox": {"l": 396.271, "t": 341.73495, "r": 417.12683, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 394.927, "t": 352.69394000000005, "r": 418.47278, "b": 360.7637, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "(0.75)", "bbox": {"l": 394.927, "t": 352.69394000000005, "r": 418.47278, "b": 360.7637, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 430.771, "t": 341.73495, "r": 467.1423, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "Inference", "bbox": {"l": 430.771, "t": 341.73495, "r": 467.1423, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 427.14801, "t": 352.69394000000005, "r": 470.76056, "b": 360.7637, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "time (secs)", "bbox": {"l": 427.14801, "t": 352.69394000000005, "r": 470.76056, "b": 360.7637, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 286.686, "t": 354.68594, "r": 312.33261, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "simple", "bbox": {"l": 286.686, "t": 354.68594, "r": 312.33261, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 320.702, "t": 354.68594, "r": 353.71988, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "complex", "bbox": {"l": 320.702, "t": 354.68594, "r": 353.71988, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 369.306, "t": 354.68594, "r": 379.03094, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "all", "bbox": {"l": 369.306, "t": 354.68594, "r": 379.03094, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 161.90601, "t": 373.51596, "r": 166.51294, "b": 381.58572, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "6", "bbox": {"l": 161.90601, "t": 373.51596, "r": 166.51294, "b": 381.58572, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 209.509, "t": 373.51596, "r": 214.11594, "b": 381.58572, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "6", "bbox": {"l": 209.509, "t": 373.51596, "r": 214.11594, "b": 381.58572, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 246.71000999999998, "t": 368.03595, "r": 271.40527, "b": 376.10571, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 368.03595, "r": 271.40527, "b": 376.10571, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 289.017, "t": 368.03595, "r": 310.00375, "b": 376.10571, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "0.965", "bbox": {"l": 289.017, "t": 368.03595, "r": 310.00375, "b": 376.10571, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 326.71701, "t": 368.03595, "r": 347.70377, "b": 376.10571, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "0.934", "bbox": {"l": 326.71701, "t": 368.03595, "r": 347.70377, "b": 376.10571, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 363.67599, "t": 368.03595, "r": 384.66275, "b": 376.10571, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "0.955", "bbox": {"l": 363.67599, "t": 368.03595, "r": 384.66275, "b": 376.10571, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 397.26999, "t": 367.97317999999996, "r": 416.12723, "b": 375.89948, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "0.88", "bbox": {"l": 397.26999, "t": 367.97317999999996, "r": 416.12723, "b": 375.89948, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 439.52701, "t": 367.97317999999996, "r": 458.38425, "b": 375.89948, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "2.73", "bbox": {"l": 439.52701, "t": 367.97317999999996, "r": 458.38425, "b": 375.89948, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 245.17598999999998, "t": 380.98795, "r": 272.93954, "b": 389.05771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 380.98795, "r": 272.93954, "b": 389.05771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 289.017, "t": 380.98795, "r": 310.00375, "b": 389.05771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "0.969", "bbox": {"l": 289.017, "t": 380.98795, "r": 310.00375, "b": 389.05771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 326.71701, "t": 380.98795, "r": 347.70377, "b": 389.05771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "0.927", "bbox": {"l": 326.71701, "t": 380.98795, "r": 347.70377, "b": 389.05771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 363.67599, "t": 380.98795, "r": 384.66275, "b": 389.05771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "0.955", "bbox": {"l": 363.67599, "t": 380.98795, "r": 384.66275, "b": 389.05771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 396.20599, "t": 380.98795, "r": 417.19275, "b": 389.05771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "0.857", "bbox": {"l": 396.20599, "t": 380.98795, "r": 417.19275, "b": 389.05771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 440.767, "t": 380.98795, "r": 457.14682, "b": 389.05771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "5.39", "bbox": {"l": 440.767, "t": 380.98795, "r": 457.14682, "b": 389.05771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 161.90601, "t": 399.81696, "r": 166.51294, "b": 407.88672, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "4", "bbox": {"l": 161.90601, "t": 399.81696, "r": 166.51294, "b": 407.88672, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 209.509, "t": 399.81696, "r": 214.11594, "b": 407.88672, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "4", "bbox": {"l": 209.509, "t": 399.81696, "r": 214.11594, "b": 407.88672, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 246.71000999999998, "t": 394.33795, "r": 271.40527, "b": 402.40771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 394.33795, "r": 271.40527, "b": 402.40771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 289.017, "t": 394.33795, "r": 310.00375, "b": 402.40771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "0.938", "bbox": {"l": 289.017, "t": 394.33795, "r": 310.00375, "b": 402.40771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 326.71701, "t": 394.33795, "r": 347.70377, "b": 402.40771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "0.904", "bbox": {"l": 326.71701, "t": 394.33795, "r": 347.70377, "b": 402.40771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 363.67599, "t": 394.33795, "r": 384.66275, "b": 402.40771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "0.927", "bbox": {"l": 363.67599, "t": 394.33795, "r": 384.66275, "b": 402.40771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 394.61801, "t": 394.27518, "r": 418.77887, "b": 402.20148, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "0.853", "bbox": {"l": 394.61801, "t": 394.27518, "r": 418.77887, "b": 402.20148, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 439.52701, "t": 394.27518, "r": 458.38425, "b": 402.20148, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "1.97", "bbox": {"l": 439.52701, "t": 394.27518, "r": 458.38425, "b": 402.20148, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 245.17598999999998, "t": 407.28894, "r": 272.93954, "b": 415.3587, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 407.28894, "r": 272.93954, "b": 415.3587, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 289.017, "t": 407.28894, "r": 310.00375, "b": 415.3587, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "0.952", "bbox": {"l": 289.017, "t": 407.28894, "r": 310.00375, "b": 415.3587, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 326.71701, "t": 407.28894, "r": 347.70377, "b": 415.3587, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "0.909", "bbox": {"l": 326.71701, "t": 407.28894, "r": 347.70377, "b": 415.3587, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 362.08801, "t": 407.22617, "r": 386.24887, "b": 415.15247, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "0.938", "bbox": {"l": 362.08801, "t": 407.22617, "r": 386.24887, "b": 415.15247, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 396.20599, "t": 407.28894, "r": 417.19275, "b": 415.3587, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "0.843", "bbox": {"l": 396.20599, "t": 407.28894, "r": 417.19275, "b": 415.3587, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 440.767, "t": 407.28894, "r": 457.14682, "b": 415.3587, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "3.77", "bbox": {"l": 440.767, "t": 407.28894, "r": 457.14682, "b": 415.3587, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 161.90601, "t": 426.11795, "r": 166.51294, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "2", "bbox": {"l": 161.90601, "t": 426.11795, "r": 166.51294, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 209.509, "t": 426.11795, "r": 214.11594, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "4", "bbox": {"l": 209.509, "t": 426.11795, "r": 214.11594, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 246.71000999999998, "t": 420.63895, "r": 271.40527, "b": 428.70871, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 420.63895, "r": 271.40527, "b": 428.70871, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 289.017, "t": 420.63895, "r": 310.00375, "b": 428.70871, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "0.923", "bbox": {"l": 289.017, "t": 420.63895, "r": 310.00375, "b": 428.70871, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 326.71701, "t": 420.63895, "r": 347.70377, "b": 428.70871, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "0.897", "bbox": {"l": 326.71701, "t": 420.63895, "r": 347.70377, "b": 428.70871, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 363.67599, "t": 420.63895, "r": 384.66275, "b": 428.70871, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "0.915", "bbox": {"l": 363.67599, "t": 420.63895, "r": 384.66275, "b": 428.70871, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 394.61801, "t": 420.57617, "r": 418.77887, "b": 428.50247, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "0.859", "bbox": {"l": 394.61801, "t": 420.57617, "r": 418.77887, "b": 428.50247, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 439.52701, "t": 420.57617, "r": 458.38425, "b": 428.50247, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "1.91", "bbox": {"l": 439.52701, "t": 420.57617, "r": 458.38425, "b": 428.50247, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 245.17598999999998, "t": 433.58994, "r": 272.93954, "b": 441.6597, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 433.58994, "r": 272.93954, "b": 441.6597, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 289.017, "t": 433.58994, "r": 310.00375, "b": 441.6597, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "0.945", "bbox": {"l": 289.017, "t": 433.58994, "r": 310.00375, "b": 441.6597, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 326.71701, "t": 433.58994, "r": 347.70377, "b": 441.6597, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "0.901", "bbox": {"l": 326.71701, "t": 433.58994, "r": 347.70377, "b": 441.6597, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 362.08801, "t": 433.5271599999999, "r": 386.24887, "b": 441.45346, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "0.931", "bbox": {"l": 362.08801, "t": 433.5271599999999, "r": 386.24887, "b": 441.45346, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 396.20599, "t": 433.58994, "r": 417.19275, "b": 441.6597, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "0.834", "bbox": {"l": 396.20599, "t": 433.58994, "r": 417.19275, "b": 441.6597, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 440.767, "t": 433.58994, "r": 457.14682, "b": 441.6597, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "3.81", "bbox": {"l": 440.767, "t": 433.58994, "r": 457.14682, "b": 441.6597, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 161.90601, "t": 452.41995, "r": 166.51294, "b": 460.48972, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "4", "bbox": {"l": 161.90601, "t": 452.41995, "r": 166.51294, "b": 460.48972, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 209.509, "t": 452.41995, "r": 214.11594, "b": 460.48972, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "2", "bbox": {"l": 209.509, "t": 452.41995, "r": 214.11594, "b": 460.48972, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 246.71000999999998, "t": 446.9399399999999, "r": 271.40527, "b": 455.0097, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 446.9399399999999, "r": 271.40527, "b": 455.0097, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 289.017, "t": 446.9399399999999, "r": 310.00375, "b": 455.0097, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "0.952", "bbox": {"l": 289.017, "t": 446.9399399999999, "r": 310.00375, "b": 455.0097, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 329.021, "t": 446.9399399999999, "r": 345.40082, "b": 455.0097, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "0.92", "bbox": {"l": 329.021, "t": 446.9399399999999, "r": 345.40082, "b": 455.0097, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 362.08801, "t": 446.87717, "r": 386.24887, "b": 454.80347, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "0.942", "bbox": {"l": 362.08801, "t": 446.87717, "r": 386.24887, "b": 454.80347, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 394.61801, "t": 446.87717, "r": 418.77887, "b": 454.80347, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "0.857", "bbox": {"l": 394.61801, "t": 446.87717, "r": 418.77887, "b": 454.80347, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 439.52701, "t": 446.87717, "r": 458.38425, "b": 454.80347, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "1.22", "bbox": {"l": 439.52701, "t": 446.87717, "r": 458.38425, "b": 454.80347, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 245.17598999999998, "t": 459.8919399999999, "r": 272.93954, "b": 467.9617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 459.8919399999999, "r": 272.93954, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 289.017, "t": 459.8919399999999, "r": 310.00375, "b": 467.9617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "0.944", "bbox": {"l": 289.017, "t": 459.8919399999999, "r": 310.00375, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 326.71701, "t": 459.8919399999999, "r": 347.70377, "b": 467.9617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "0.903", "bbox": {"l": 326.71701, "t": 459.8919399999999, "r": 347.70377, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 363.67599, "t": 459.8919399999999, "r": 384.66275, "b": 467.9617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "0.931", "bbox": {"l": 363.67599, "t": 459.8919399999999, "r": 384.66275, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 396.20599, "t": 459.8919399999999, "r": 417.19275, "b": 467.9617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "0.824", "bbox": {"l": 396.20599, "t": 459.8919399999999, "r": 417.19275, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 446.65302, "t": 459.8919399999999, "r": 451.25995, "b": 467.9617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "2", "bbox": {"l": 446.65302, "t": 459.8919399999999, "r": 451.25995, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "lcel", "lcel", "ched", "ched", "nl", "ched", "ched", "ucel", "ched", "ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 7, "num_cols": 8, "table_cells": [{"bbox": {"l": 160.37, "t": 341.73495, "r": 168.04793, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "#", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 144.592, "t": 354.68594, "r": 183.82806, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "enc-layers", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 207.974, "t": 341.73495, "r": 215.65193, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "#", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 192.19499, "t": 354.68594, "r": 231.43106, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "dec-layers", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 239.79799999999997, "t": 347.21396, "r": 278.31766, "b": 355.28372, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Language", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 324.67001, "t": 341.73495, "r": 348.26419, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 3, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 6, "text": "TEDs", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 396.271, "t": 341.73495, "r": 417.12683, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "mAP", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 394.927, "t": 352.69394000000005, "r": 418.47278, "b": 360.7637, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "(0.75)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 430.771, "t": 341.73495, "r": 467.1423, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "Inference", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 427.14801, "t": 352.69394000000005, "r": 470.76056, "b": 360.7637, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "time (secs)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 286.686, "t": 354.68594, "r": 312.33261, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "simple", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 320.702, "t": 354.68594, "r": 353.71988, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "complex", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 369.306, "t": 354.68594, "r": 379.03094, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "all", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 161.90601, "t": 373.51596, "r": 166.51294, "b": 381.58572, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 373.51596, "r": 214.11594, "b": 381.58572, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 368.03595, "r": 272.93954, "b": 389.05771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 368.03595, "r": 310.00375, "b": 389.05771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.965 0.969", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 368.03595, "r": 347.70377, "b": 389.05771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.934 0.927", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 363.67599, "t": 368.03595, "r": 384.66275, "b": 389.05771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.955 0.955", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 396.20599, "t": 367.97317999999996, "r": 417.19275, "b": 389.05771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.88 0.857", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 367.97317999999996, "r": 458.38425, "b": 389.05771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "2.73 5.39", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 161.90601, "t": 399.81696, "r": 166.51294, "b": 407.88672, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 399.81696, "r": 214.11594, "b": 407.88672, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 394.33795, "r": 272.93954, "b": 415.3587, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 394.33795, "r": 310.00375, "b": 415.3587, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.938 0.952", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 394.33795, "r": 347.70377, "b": 402.40771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.904", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 363.67599, "t": 394.33795, "r": 384.66275, "b": 402.40771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.927", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.61801, "t": 394.27518, "r": 418.77887, "b": 402.20148, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.853", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 394.27518, "r": 458.38425, "b": 402.20148, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "1.97", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 407.28894, "r": 347.70377, "b": 428.70871, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.909 0.897", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 362.08801, "t": 407.22617, "r": 386.24887, "b": 415.15247, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.938", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 396.20599, "t": 407.28894, "r": 417.19275, "b": 415.3587, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.843", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.767, "t": 407.28894, "r": 457.14682, "b": 415.3587, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "3.77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 161.90601, "t": 426.11795, "r": 166.51294, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 426.11795, "r": 214.11594, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 246.71000999999998, "t": 420.63895, "r": 271.40527, "b": 428.70871, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 420.63895, "r": 310.00375, "b": 441.6597, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.923 0.945", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 362.08801, "t": 420.63895, "r": 386.24887, "b": 441.45346, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.915 0.931", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.61801, "t": 420.57617, "r": 418.77887, "b": 441.6597, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.859 0.834", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 420.57617, "r": 458.38425, "b": 441.6597, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "1.91 3.81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 433.58994, "r": 272.93954, "b": 441.6597, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 433.58994, "r": 347.70377, "b": 441.6597, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.901", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 161.90601, "t": 452.41995, "r": 166.51294, "b": 460.48972, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 452.41995, "r": 214.11594, "b": 460.48972, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 446.9399399999999, "r": 272.93954, "b": 467.9617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 446.9399399999999, "r": 310.00375, "b": 467.9617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.952 0.944", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 446.9399399999999, "r": 347.70377, "b": 467.9617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.92 0.903", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 362.08801, "t": 446.87717, "r": 386.24887, "b": 467.9617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.942 0.931", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.61801, "t": 446.87717, "r": 418.77887, "b": 467.9617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.857 0.824", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 446.87717, "r": 458.38425, "b": 467.9617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "1.22 2", "column_header": false, "row_header": false, "row_section": false}]}}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_header", "id": 8, "page_no": 8, "cluster": {"id": 8, "label": "page_header", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9373378157615662, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Optimized Table Tokenization for Table Structure Recognition"}, {"label": "page_header", "id": 9, "page_no": 8, "cluster": {"id": 9, "label": "page_header", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8857628107070923, "cells": [{"id": 1, "text": "9", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "9"}, {"label": "text", "id": 4, "page_no": 8, "cluster": {"id": 4, "label": "text", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.59579, "b": 151.64178000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9805440306663513, "cells": [{"id": 2, "text": "order to compute the TED score. Inference timing results for all experiments", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.5936899999999, "b": 127.73077, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "were obtained from the same machine on a single core with AMD EPYC 7763", "bbox": {"l": 134.765, "t": 130.88878999999997, "r": 480.59579, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "CPU @2.45 GHz.", "bbox": {"l": 134.765, "t": 142.84479, "r": 210.78462, "b": 151.64178000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "order to compute the TED score. Inference timing results for all experiments were obtained from the same machine on a single core with AMD EPYC 7763 CPU @2.45 GHz."}, {"label": "section_header", "id": 6, "page_no": 8, "cluster": {"id": 6, "label": "section_header", "bbox": {"l": 134.765, "t": 169.18584999999996, "r": 318.44843, "b": 177.9928, "coord_origin": "TOPLEFT"}, "confidence": 0.9579682350158691, "cells": [{"id": 5, "text": "5.1", "bbox": {"l": 134.765, "t": 169.18584999999996, "r": 149.40205, "b": 177.9928, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Hyper Parameter Optimization", "bbox": {"l": 160.85904, "t": 169.18584999999996, "r": 318.44843, "b": 177.9928, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5.1 Hyper Parameter Optimization"}, {"label": "text", "id": 3, "page_no": 8, "cluster": {"id": 3, "label": "text", "bbox": {"l": 134.76498, "t": 185.58582, "r": 480.59277, "b": 254.15886999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.9842326641082764, "cells": [{"id": 7, "text": "We have chosen the PubTabNet data set to perform HPO, since it includes a", "bbox": {"l": 134.765, "t": 185.58582, "r": 480.59183, "b": 194.38280999999995, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "highly diverse set of tables. Also we report TED scores separately for simple and", "bbox": {"l": 134.765, "t": 197.54083000000003, "r": 480.59183, "b": 206.33783000000005, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "complex tables (tables with cell spans). Results are presented in Table. 1. It is", "bbox": {"l": 134.765, "t": 209.49585000000002, "r": 480.59177000000005, "b": 218.29285000000004, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "evident that with OTSL, our model achieves the same TED score and slightly", "bbox": {"l": 134.765, "t": 221.45087, "r": 480.59277, "b": 230.24785999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "better mAP scores in comparison to HTML. However OTSL yields a", "bbox": {"l": 134.765, "t": 233.40588000000002, "r": 440.94159, "b": 242.20288000000005, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "2x speed", "bbox": {"l": 444.86798, "t": 233.40588000000002, "r": 480.58786000000003, "b": 242.20288000000005, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "up", "bbox": {"l": 134.76498, "t": 245.36188000000004, "r": 145.20081, "b": 254.15886999999998, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "in the inference runtime over HTML.", "bbox": {"l": 149.14899, "t": 245.36188000000004, "r": 311.21957, "b": 254.15886999999998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "We have chosen the PubTabNet data set to perform HPO, since it includes a highly diverse set of tables. Also we report TED scores separately for simple and complex tables (tables with cell spans). Results are presented in Table. 1. It is evident that with OTSL, our model achieves the same TED score and slightly better mAP scores in comparison to HTML. However OTSL yields a 2x speed up in the inference runtime over HTML."}, {"label": "caption", "id": 7, "page_no": 8, "cluster": {"id": 7, "label": "caption", "bbox": {"l": 134.76498, "t": 275.07232999999997, "r": 480.5954, "b": 327.0408, "coord_origin": "TOPLEFT"}, "confidence": 0.957078218460083, "cells": [{"id": 15, "text": "Table", "bbox": {"l": 134.76498, "t": 275.07232999999997, "r": 160.11836, "b": 282.9986, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "1.", "bbox": {"l": 167.34528, "t": 275.07232999999997, "r": 175.59526, "b": 282.9986, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "HPO performed in OTSL and HTML representation on the same", "bbox": {"l": 188.13298, "t": 275.13507000000004, "r": 480.59365999999994, "b": 283.2048300000001, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "transformer-based TableFormer [9] architecture, trained only on PubTabNet [22]. Ef-", "bbox": {"l": 134.76498, "t": 286.09409, "r": 480.59444999999994, "b": 294.16385, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "fects of reducing the # of layers in encoder and decoder stages of the model show that", "bbox": {"l": 134.76498, "t": 297.05307, "r": 480.5954, "b": 305.12283, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "smaller models trained on OTSL perform better, especially in recognizing complex", "bbox": {"l": 134.76498, "t": 308.01205, "r": 480.59451, "b": 316.08182, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "table structures, and maintain a much higher mAP score than the HTML counterpart.", "bbox": {"l": 134.76498, "t": 318.97104, "r": 480.59441999999996, "b": 327.0408, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 1. HPO performed in OTSL and HTML representation on the same transformer-based TableFormer [9] architecture, trained only on PubTabNet [22]. Effects of reducing the # of layers in encoder and decoder stages of the model show that smaller models trained on OTSL perform better, especially in recognizing complex table structures, and maintain a much higher mAP score than the HTML counterpart."}, {"label": "table", "id": 0, "page_no": 8, "cluster": {"id": 0, "label": "table", "bbox": {"l": 139.66845703125, "t": 337.5747375488281, "r": 475.00372314453125, "b": 469.4720764160156, "coord_origin": "TOPLEFT"}, "confidence": 0.9901032447814941, "cells": [{"id": 22, "text": "#", "bbox": {"l": 160.37, "t": 341.73495, "r": 168.04793, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "enc-layers", "bbox": {"l": 144.592, "t": 354.68594, "r": 183.82806, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "#", "bbox": {"l": 207.974, "t": 341.73495, "r": 215.65193, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "dec-layers", "bbox": {"l": 192.19499, "t": 354.68594, "r": 231.43106, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "Language", "bbox": {"l": 239.79799999999997, "t": 347.21396, "r": 278.31766, "b": 355.28372, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "TEDs", "bbox": {"l": 324.67001, "t": 341.73495, "r": 348.26419, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "mAP", "bbox": {"l": 396.271, "t": 341.73495, "r": 417.12683, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "(0.75)", "bbox": {"l": 394.927, "t": 352.69394000000005, "r": 418.47278, "b": 360.7637, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Inference", "bbox": {"l": 430.771, "t": 341.73495, "r": 467.1423, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "time (secs)", "bbox": {"l": 427.14801, "t": 352.69394000000005, "r": 470.76056, "b": 360.7637, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "simple", "bbox": {"l": 286.686, "t": 354.68594, "r": 312.33261, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "complex", "bbox": {"l": 320.702, "t": 354.68594, "r": 353.71988, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "all", "bbox": {"l": 369.306, "t": 354.68594, "r": 379.03094, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "6", "bbox": {"l": 161.90601, "t": 373.51596, "r": 166.51294, "b": 381.58572, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "6", "bbox": {"l": 209.509, "t": 373.51596, "r": 214.11594, "b": 381.58572, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 368.03595, "r": 271.40527, "b": 376.10571, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "0.965", "bbox": {"l": 289.017, "t": 368.03595, "r": 310.00375, "b": 376.10571, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "0.934", "bbox": {"l": 326.71701, "t": 368.03595, "r": 347.70377, "b": 376.10571, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "0.955", "bbox": {"l": 363.67599, "t": 368.03595, "r": 384.66275, "b": 376.10571, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "0.88", "bbox": {"l": 397.26999, "t": 367.97317999999996, "r": 416.12723, "b": 375.89948, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "2.73", "bbox": {"l": 439.52701, "t": 367.97317999999996, "r": 458.38425, "b": 375.89948, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 380.98795, "r": 272.93954, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "0.969", "bbox": {"l": 289.017, "t": 380.98795, "r": 310.00375, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "0.927", "bbox": {"l": 326.71701, "t": 380.98795, "r": 347.70377, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "0.955", "bbox": {"l": 363.67599, "t": 380.98795, "r": 384.66275, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "0.857", "bbox": {"l": 396.20599, "t": 380.98795, "r": 417.19275, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "5.39", "bbox": {"l": 440.767, "t": 380.98795, "r": 457.14682, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "4", "bbox": {"l": 161.90601, "t": 399.81696, "r": 166.51294, "b": 407.88672, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "4", "bbox": {"l": 209.509, "t": 399.81696, "r": 214.11594, "b": 407.88672, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 394.33795, "r": 271.40527, "b": 402.40771, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "0.938", "bbox": {"l": 289.017, "t": 394.33795, "r": 310.00375, "b": 402.40771, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "0.904", "bbox": {"l": 326.71701, "t": 394.33795, "r": 347.70377, "b": 402.40771, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "0.927", "bbox": {"l": 363.67599, "t": 394.33795, "r": 384.66275, "b": 402.40771, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "0.853", "bbox": {"l": 394.61801, "t": 394.27518, "r": 418.77887, "b": 402.20148, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "1.97", "bbox": {"l": 439.52701, "t": 394.27518, "r": 458.38425, "b": 402.20148, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 407.28894, "r": 272.93954, "b": 415.3587, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "0.952", "bbox": {"l": 289.017, "t": 407.28894, "r": 310.00375, "b": 415.3587, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "0.909", "bbox": {"l": 326.71701, "t": 407.28894, "r": 347.70377, "b": 415.3587, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "0.938", "bbox": {"l": 362.08801, "t": 407.22617, "r": 386.24887, "b": 415.15247, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "0.843", "bbox": {"l": 396.20599, "t": 407.28894, "r": 417.19275, "b": 415.3587, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "3.77", "bbox": {"l": 440.767, "t": 407.28894, "r": 457.14682, "b": 415.3587, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "2", "bbox": {"l": 161.90601, "t": 426.11795, "r": 166.51294, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "4", "bbox": {"l": 209.509, "t": 426.11795, "r": 214.11594, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 420.63895, "r": 271.40527, "b": 428.70871, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "0.923", "bbox": {"l": 289.017, "t": 420.63895, "r": 310.00375, "b": 428.70871, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "0.897", "bbox": {"l": 326.71701, "t": 420.63895, "r": 347.70377, "b": 428.70871, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "0.915", "bbox": {"l": 363.67599, "t": 420.63895, "r": 384.66275, "b": 428.70871, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "0.859", "bbox": {"l": 394.61801, "t": 420.57617, "r": 418.77887, "b": 428.50247, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "1.91", "bbox": {"l": 439.52701, "t": 420.57617, "r": 458.38425, "b": 428.50247, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 433.58994, "r": 272.93954, "b": 441.6597, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "0.945", "bbox": {"l": 289.017, "t": 433.58994, "r": 310.00375, "b": 441.6597, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "0.901", "bbox": {"l": 326.71701, "t": 433.58994, "r": 347.70377, "b": 441.6597, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "0.931", "bbox": {"l": 362.08801, "t": 433.5271599999999, "r": 386.24887, "b": 441.45346, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "0.834", "bbox": {"l": 396.20599, "t": 433.58994, "r": 417.19275, "b": 441.6597, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "3.81", "bbox": {"l": 440.767, "t": 433.58994, "r": 457.14682, "b": 441.6597, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "4", "bbox": {"l": 161.90601, "t": 452.41995, "r": 166.51294, "b": 460.48972, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "2", "bbox": {"l": 209.509, "t": 452.41995, "r": 214.11594, "b": 460.48972, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 446.9399399999999, "r": 271.40527, "b": 455.0097, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "0.952", "bbox": {"l": 289.017, "t": 446.9399399999999, "r": 310.00375, "b": 455.0097, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "0.92", "bbox": {"l": 329.021, "t": 446.9399399999999, "r": 345.40082, "b": 455.0097, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "0.942", "bbox": {"l": 362.08801, "t": 446.87717, "r": 386.24887, "b": 454.80347, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "0.857", "bbox": {"l": 394.61801, "t": 446.87717, "r": 418.77887, "b": 454.80347, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "1.22", "bbox": {"l": 439.52701, "t": 446.87717, "r": 458.38425, "b": 454.80347, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 459.8919399999999, "r": 272.93954, "b": 467.9617, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "0.944", "bbox": {"l": 289.017, "t": 459.8919399999999, "r": 310.00375, "b": 467.9617, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "0.903", "bbox": {"l": 326.71701, "t": 459.8919399999999, "r": 347.70377, "b": 467.9617, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "0.931", "bbox": {"l": 363.67599, "t": 459.8919399999999, "r": 384.66275, "b": 467.9617, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "0.824", "bbox": {"l": 396.20599, "t": 459.8919399999999, "r": 417.19275, "b": 467.9617, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "2", "bbox": {"l": 446.65302, "t": 459.8919399999999, "r": 451.25995, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": [{"id": 10, "label": "text", "bbox": {"l": 160.37, "t": 341.73495, "r": 168.04793, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "#", "bbox": {"l": 160.37, "t": 341.73495, "r": 168.04793, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 144.592, "t": 354.68594, "r": 183.82806, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "enc-layers", "bbox": {"l": 144.592, "t": 354.68594, "r": 183.82806, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 207.974, "t": 341.73495, "r": 215.65193, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "#", "bbox": {"l": 207.974, "t": 341.73495, "r": 215.65193, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 192.19499, "t": 354.68594, "r": 231.43106, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "dec-layers", "bbox": {"l": 192.19499, "t": 354.68594, "r": 231.43106, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 239.79799999999997, "t": 347.21396, "r": 278.31766, "b": 355.28372, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "Language", "bbox": {"l": 239.79799999999997, "t": 347.21396, "r": 278.31766, "b": 355.28372, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 324.67001, "t": 341.73495, "r": 348.26419, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "TEDs", "bbox": {"l": 324.67001, "t": 341.73495, "r": 348.26419, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 396.271, "t": 341.73495, "r": 417.12683, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "mAP", "bbox": {"l": 396.271, "t": 341.73495, "r": 417.12683, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 394.927, "t": 352.69394000000005, "r": 418.47278, "b": 360.7637, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "(0.75)", "bbox": {"l": 394.927, "t": 352.69394000000005, "r": 418.47278, "b": 360.7637, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 430.771, "t": 341.73495, "r": 467.1423, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "Inference", "bbox": {"l": 430.771, "t": 341.73495, "r": 467.1423, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 427.14801, "t": 352.69394000000005, "r": 470.76056, "b": 360.7637, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "time (secs)", "bbox": {"l": 427.14801, "t": 352.69394000000005, "r": 470.76056, "b": 360.7637, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 286.686, "t": 354.68594, "r": 312.33261, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "simple", "bbox": {"l": 286.686, "t": 354.68594, "r": 312.33261, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 320.702, "t": 354.68594, "r": 353.71988, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "complex", "bbox": {"l": 320.702, "t": 354.68594, "r": 353.71988, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 369.306, "t": 354.68594, "r": 379.03094, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "all", "bbox": {"l": 369.306, "t": 354.68594, "r": 379.03094, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 161.90601, "t": 373.51596, "r": 166.51294, "b": 381.58572, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "6", "bbox": {"l": 161.90601, "t": 373.51596, "r": 166.51294, "b": 381.58572, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 209.509, "t": 373.51596, "r": 214.11594, "b": 381.58572, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "6", "bbox": {"l": 209.509, "t": 373.51596, "r": 214.11594, "b": 381.58572, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 246.71000999999998, "t": 368.03595, "r": 271.40527, "b": 376.10571, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 368.03595, "r": 271.40527, "b": 376.10571, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 289.017, "t": 368.03595, "r": 310.00375, "b": 376.10571, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "0.965", "bbox": {"l": 289.017, "t": 368.03595, "r": 310.00375, "b": 376.10571, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 326.71701, "t": 368.03595, "r": 347.70377, "b": 376.10571, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "0.934", "bbox": {"l": 326.71701, "t": 368.03595, "r": 347.70377, "b": 376.10571, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 363.67599, "t": 368.03595, "r": 384.66275, "b": 376.10571, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "0.955", "bbox": {"l": 363.67599, "t": 368.03595, "r": 384.66275, "b": 376.10571, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 397.26999, "t": 367.97317999999996, "r": 416.12723, "b": 375.89948, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "0.88", "bbox": {"l": 397.26999, "t": 367.97317999999996, "r": 416.12723, "b": 375.89948, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 439.52701, "t": 367.97317999999996, "r": 458.38425, "b": 375.89948, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "2.73", "bbox": {"l": 439.52701, "t": 367.97317999999996, "r": 458.38425, "b": 375.89948, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 245.17598999999998, "t": 380.98795, "r": 272.93954, "b": 389.05771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 380.98795, "r": 272.93954, "b": 389.05771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 289.017, "t": 380.98795, "r": 310.00375, "b": 389.05771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "0.969", "bbox": {"l": 289.017, "t": 380.98795, "r": 310.00375, "b": 389.05771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 326.71701, "t": 380.98795, "r": 347.70377, "b": 389.05771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "0.927", "bbox": {"l": 326.71701, "t": 380.98795, "r": 347.70377, "b": 389.05771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 363.67599, "t": 380.98795, "r": 384.66275, "b": 389.05771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "0.955", "bbox": {"l": 363.67599, "t": 380.98795, "r": 384.66275, "b": 389.05771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 396.20599, "t": 380.98795, "r": 417.19275, "b": 389.05771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "0.857", "bbox": {"l": 396.20599, "t": 380.98795, "r": 417.19275, "b": 389.05771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 440.767, "t": 380.98795, "r": 457.14682, "b": 389.05771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "5.39", "bbox": {"l": 440.767, "t": 380.98795, "r": 457.14682, "b": 389.05771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 161.90601, "t": 399.81696, "r": 166.51294, "b": 407.88672, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "4", "bbox": {"l": 161.90601, "t": 399.81696, "r": 166.51294, "b": 407.88672, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 209.509, "t": 399.81696, "r": 214.11594, "b": 407.88672, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "4", "bbox": {"l": 209.509, "t": 399.81696, "r": 214.11594, "b": 407.88672, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 246.71000999999998, "t": 394.33795, "r": 271.40527, "b": 402.40771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 394.33795, "r": 271.40527, "b": 402.40771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 289.017, "t": 394.33795, "r": 310.00375, "b": 402.40771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "0.938", "bbox": {"l": 289.017, "t": 394.33795, "r": 310.00375, "b": 402.40771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 326.71701, "t": 394.33795, "r": 347.70377, "b": 402.40771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "0.904", "bbox": {"l": 326.71701, "t": 394.33795, "r": 347.70377, "b": 402.40771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 363.67599, "t": 394.33795, "r": 384.66275, "b": 402.40771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "0.927", "bbox": {"l": 363.67599, "t": 394.33795, "r": 384.66275, "b": 402.40771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 394.61801, "t": 394.27518, "r": 418.77887, "b": 402.20148, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "0.853", "bbox": {"l": 394.61801, "t": 394.27518, "r": 418.77887, "b": 402.20148, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 439.52701, "t": 394.27518, "r": 458.38425, "b": 402.20148, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "1.97", "bbox": {"l": 439.52701, "t": 394.27518, "r": 458.38425, "b": 402.20148, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 245.17598999999998, "t": 407.28894, "r": 272.93954, "b": 415.3587, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 407.28894, "r": 272.93954, "b": 415.3587, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 289.017, "t": 407.28894, "r": 310.00375, "b": 415.3587, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "0.952", "bbox": {"l": 289.017, "t": 407.28894, "r": 310.00375, "b": 415.3587, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 326.71701, "t": 407.28894, "r": 347.70377, "b": 415.3587, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "0.909", "bbox": {"l": 326.71701, "t": 407.28894, "r": 347.70377, "b": 415.3587, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 362.08801, "t": 407.22617, "r": 386.24887, "b": 415.15247, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "0.938", "bbox": {"l": 362.08801, "t": 407.22617, "r": 386.24887, "b": 415.15247, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 396.20599, "t": 407.28894, "r": 417.19275, "b": 415.3587, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "0.843", "bbox": {"l": 396.20599, "t": 407.28894, "r": 417.19275, "b": 415.3587, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 440.767, "t": 407.28894, "r": 457.14682, "b": 415.3587, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "3.77", "bbox": {"l": 440.767, "t": 407.28894, "r": 457.14682, "b": 415.3587, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 161.90601, "t": 426.11795, "r": 166.51294, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "2", "bbox": {"l": 161.90601, "t": 426.11795, "r": 166.51294, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 209.509, "t": 426.11795, "r": 214.11594, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "4", "bbox": {"l": 209.509, "t": 426.11795, "r": 214.11594, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 246.71000999999998, "t": 420.63895, "r": 271.40527, "b": 428.70871, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 420.63895, "r": 271.40527, "b": 428.70871, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 289.017, "t": 420.63895, "r": 310.00375, "b": 428.70871, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "0.923", "bbox": {"l": 289.017, "t": 420.63895, "r": 310.00375, "b": 428.70871, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 326.71701, "t": 420.63895, "r": 347.70377, "b": 428.70871, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "0.897", "bbox": {"l": 326.71701, "t": 420.63895, "r": 347.70377, "b": 428.70871, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 363.67599, "t": 420.63895, "r": 384.66275, "b": 428.70871, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "0.915", "bbox": {"l": 363.67599, "t": 420.63895, "r": 384.66275, "b": 428.70871, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 394.61801, "t": 420.57617, "r": 418.77887, "b": 428.50247, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "0.859", "bbox": {"l": 394.61801, "t": 420.57617, "r": 418.77887, "b": 428.50247, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 439.52701, "t": 420.57617, "r": 458.38425, "b": 428.50247, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "1.91", "bbox": {"l": 439.52701, "t": 420.57617, "r": 458.38425, "b": 428.50247, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 245.17598999999998, "t": 433.58994, "r": 272.93954, "b": 441.6597, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 433.58994, "r": 272.93954, "b": 441.6597, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 289.017, "t": 433.58994, "r": 310.00375, "b": 441.6597, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "0.945", "bbox": {"l": 289.017, "t": 433.58994, "r": 310.00375, "b": 441.6597, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 326.71701, "t": 433.58994, "r": 347.70377, "b": 441.6597, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "0.901", "bbox": {"l": 326.71701, "t": 433.58994, "r": 347.70377, "b": 441.6597, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 362.08801, "t": 433.5271599999999, "r": 386.24887, "b": 441.45346, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "0.931", "bbox": {"l": 362.08801, "t": 433.5271599999999, "r": 386.24887, "b": 441.45346, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 396.20599, "t": 433.58994, "r": 417.19275, "b": 441.6597, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "0.834", "bbox": {"l": 396.20599, "t": 433.58994, "r": 417.19275, "b": 441.6597, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 440.767, "t": 433.58994, "r": 457.14682, "b": 441.6597, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "3.81", "bbox": {"l": 440.767, "t": 433.58994, "r": 457.14682, "b": 441.6597, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 161.90601, "t": 452.41995, "r": 166.51294, "b": 460.48972, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "4", "bbox": {"l": 161.90601, "t": 452.41995, "r": 166.51294, "b": 460.48972, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 209.509, "t": 452.41995, "r": 214.11594, "b": 460.48972, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "2", "bbox": {"l": 209.509, "t": 452.41995, "r": 214.11594, "b": 460.48972, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 246.71000999999998, "t": 446.9399399999999, "r": 271.40527, "b": 455.0097, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 446.9399399999999, "r": 271.40527, "b": 455.0097, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 289.017, "t": 446.9399399999999, "r": 310.00375, "b": 455.0097, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "0.952", "bbox": {"l": 289.017, "t": 446.9399399999999, "r": 310.00375, "b": 455.0097, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 329.021, "t": 446.9399399999999, "r": 345.40082, "b": 455.0097, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "0.92", "bbox": {"l": 329.021, "t": 446.9399399999999, "r": 345.40082, "b": 455.0097, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 362.08801, "t": 446.87717, "r": 386.24887, "b": 454.80347, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "0.942", "bbox": {"l": 362.08801, "t": 446.87717, "r": 386.24887, "b": 454.80347, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 394.61801, "t": 446.87717, "r": 418.77887, "b": 454.80347, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "0.857", "bbox": {"l": 394.61801, "t": 446.87717, "r": 418.77887, "b": 454.80347, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 439.52701, "t": 446.87717, "r": 458.38425, "b": 454.80347, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "1.22", "bbox": {"l": 439.52701, "t": 446.87717, "r": 458.38425, "b": 454.80347, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 245.17598999999998, "t": 459.8919399999999, "r": 272.93954, "b": 467.9617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 459.8919399999999, "r": 272.93954, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 289.017, "t": 459.8919399999999, "r": 310.00375, "b": 467.9617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "0.944", "bbox": {"l": 289.017, "t": 459.8919399999999, "r": 310.00375, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 326.71701, "t": 459.8919399999999, "r": 347.70377, "b": 467.9617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "0.903", "bbox": {"l": 326.71701, "t": 459.8919399999999, "r": 347.70377, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 363.67599, "t": 459.8919399999999, "r": 384.66275, "b": 467.9617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "0.931", "bbox": {"l": 363.67599, "t": 459.8919399999999, "r": 384.66275, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 396.20599, "t": 459.8919399999999, "r": 417.19275, "b": 467.9617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "0.824", "bbox": {"l": 396.20599, "t": 459.8919399999999, "r": 417.19275, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 446.65302, "t": 459.8919399999999, "r": 451.25995, "b": 467.9617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "2", "bbox": {"l": 446.65302, "t": 459.8919399999999, "r": 451.25995, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "lcel", "lcel", "ched", "ched", "nl", "ched", "ched", "ucel", "ched", "ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 7, "num_cols": 8, "table_cells": [{"bbox": {"l": 160.37, "t": 341.73495, "r": 168.04793, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "#", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 144.592, "t": 354.68594, "r": 183.82806, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "enc-layers", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 207.974, "t": 341.73495, "r": 215.65193, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "#", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 192.19499, "t": 354.68594, "r": 231.43106, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "dec-layers", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 239.79799999999997, "t": 347.21396, "r": 278.31766, "b": 355.28372, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Language", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 324.67001, "t": 341.73495, "r": 348.26419, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 3, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 6, "text": "TEDs", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 396.271, "t": 341.73495, "r": 417.12683, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "mAP", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 394.927, "t": 352.69394000000005, "r": 418.47278, "b": 360.7637, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "(0.75)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 430.771, "t": 341.73495, "r": 467.1423, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "Inference", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 427.14801, "t": 352.69394000000005, "r": 470.76056, "b": 360.7637, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "time (secs)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 286.686, "t": 354.68594, "r": 312.33261, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "simple", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 320.702, "t": 354.68594, "r": 353.71988, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "complex", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 369.306, "t": 354.68594, "r": 379.03094, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "all", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 161.90601, "t": 373.51596, "r": 166.51294, "b": 381.58572, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 373.51596, "r": 214.11594, "b": 381.58572, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 368.03595, "r": 272.93954, "b": 389.05771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 368.03595, "r": 310.00375, "b": 389.05771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.965 0.969", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 368.03595, "r": 347.70377, "b": 389.05771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.934 0.927", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 363.67599, "t": 368.03595, "r": 384.66275, "b": 389.05771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.955 0.955", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 396.20599, "t": 367.97317999999996, "r": 417.19275, "b": 389.05771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.88 0.857", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 367.97317999999996, "r": 458.38425, "b": 389.05771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "2.73 5.39", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 161.90601, "t": 399.81696, "r": 166.51294, "b": 407.88672, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 399.81696, "r": 214.11594, "b": 407.88672, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 394.33795, "r": 272.93954, "b": 415.3587, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 394.33795, "r": 310.00375, "b": 415.3587, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.938 0.952", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 394.33795, "r": 347.70377, "b": 402.40771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.904", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 363.67599, "t": 394.33795, "r": 384.66275, "b": 402.40771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.927", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.61801, "t": 394.27518, "r": 418.77887, "b": 402.20148, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.853", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 394.27518, "r": 458.38425, "b": 402.20148, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "1.97", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 407.28894, "r": 347.70377, "b": 428.70871, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.909 0.897", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 362.08801, "t": 407.22617, "r": 386.24887, "b": 415.15247, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.938", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 396.20599, "t": 407.28894, "r": 417.19275, "b": 415.3587, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.843", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.767, "t": 407.28894, "r": 457.14682, "b": 415.3587, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "3.77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 161.90601, "t": 426.11795, "r": 166.51294, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 426.11795, "r": 214.11594, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 246.71000999999998, "t": 420.63895, "r": 271.40527, "b": 428.70871, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 420.63895, "r": 310.00375, "b": 441.6597, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.923 0.945", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 362.08801, "t": 420.63895, "r": 386.24887, "b": 441.45346, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.915 0.931", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.61801, "t": 420.57617, "r": 418.77887, "b": 441.6597, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.859 0.834", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 420.57617, "r": 458.38425, "b": 441.6597, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "1.91 3.81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 433.58994, "r": 272.93954, "b": 441.6597, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 433.58994, "r": 347.70377, "b": 441.6597, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.901", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 161.90601, "t": 452.41995, "r": 166.51294, "b": 460.48972, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 452.41995, "r": 214.11594, "b": 460.48972, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 446.9399399999999, "r": 272.93954, "b": 467.9617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 446.9399399999999, "r": 310.00375, "b": 467.9617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.952 0.944", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 446.9399399999999, "r": 347.70377, "b": 467.9617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.92 0.903", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 362.08801, "t": 446.87717, "r": 386.24887, "b": 467.9617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.942 0.931", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.61801, "t": 446.87717, "r": 418.77887, "b": 467.9617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.857 0.824", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 446.87717, "r": 458.38425, "b": 467.9617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "1.22 2", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "section_header", "id": 5, "page_no": 8, "cluster": {"id": 5, "label": "section_header", "bbox": {"l": 134.765, "t": 508.15179, "r": 264.40332, "b": 516.95874, "coord_origin": "TOPLEFT"}, "confidence": 0.9592539668083191, "cells": [{"id": 91, "text": "5.2", "bbox": {"l": 134.765, "t": 508.15179, "r": 149.40205, "b": 516.95874, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Quantitative Results", "bbox": {"l": 160.85904, "t": 508.15179, "r": 264.40332, "b": 516.95874, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5.2 Quantitative Results"}, {"label": "text", "id": 1, "page_no": 8, "cluster": {"id": 1, "label": "text", "bbox": {"l": 134.765, "t": 524.55078, "r": 480.5957599999999, "b": 617.03474, "coord_origin": "TOPLEFT"}, "confidence": 0.9854757189750671, "cells": [{"id": 93, "text": "We picked the model parameter configuration that produced the best prediction", "bbox": {"l": 134.765, "t": 524.55078, "r": 480.59075999999993, "b": 533.34775, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "quality (enc=6, dec=6, heads=8) with PubTabNet alone, then independently", "bbox": {"l": 134.765, "t": 536.50677, "r": 480.58675999999997, "b": 545.3037400000001, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "trained and evaluated it on three publicly available data sets: PubTabNet (395k", "bbox": {"l": 134.765, "t": 548.4617800000001, "r": 480.59572999999995, "b": 557.25874, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "samples), FinTabNet (113k samples) and PubTables-1M (about 1M samples).", "bbox": {"l": 134.765, "t": 560.41678, "r": 480.59177000000005, "b": 569.21375, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "Performance results are presented in Table. 2. It is clearly evident that the model", "bbox": {"l": 134.765, "t": 572.37178, "r": 480.59069999999997, "b": 581.16875, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "trained on OTSL outperforms HTML across the board, keeping high TEDs and", "bbox": {"l": 134.765, "t": 584.32678, "r": 480.5957599999999, "b": 593.12375, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "mAP scores even on difficult financial tables (FinTabNet) that contain sparse", "bbox": {"l": 134.765, "t": 596.28278, "r": 480.58774, "b": 605.07974, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "and large tables.", "bbox": {"l": 134.765, "t": 608.2377799999999, "r": 206.78664, "b": 617.03474, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "We picked the model parameter configuration that produced the best prediction quality (enc=6, dec=6, heads=8) with PubTabNet alone, then independently trained and evaluated it on three publicly available data sets: PubTabNet (395k samples), FinTabNet (113k samples) and PubTables-1M (about 1M samples). Performance results are presented in Table. 2. It is clearly evident that the model trained on OTSL outperforms HTML across the board, keeping high TEDs and mAP scores even on difficult financial tables (FinTabNet) that contain sparse and large tables."}, {"label": "text", "id": 2, "page_no": 8, "cluster": {"id": 2, "label": "text", "bbox": {"l": 134.765, "t": 620.19278, "r": 480.5957599999999, "b": 664.8547599999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9851234555244446, "cells": [{"id": 101, "text": "Additionally, the results show that OTSL has an advantage over HTML", "bbox": {"l": 149.709, "t": 620.19278, "r": 480.59271, "b": 628.98975, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "when applied on a bigger data set like PubTables-1M and achieves significantly", "bbox": {"l": 134.765, "t": 632.14778, "r": 480.5957599999999, "b": 640.94475, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "improved scores. Finally, OTSL achieves faster inference due to fewer decoding", "bbox": {"l": 134.765, "t": 644.1027799999999, "r": 480.59283000000005, "b": 652.89975, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "steps which is a result of the reduced sequence representation.", "bbox": {"l": 134.765, "t": 656.0577900000001, "r": 405.79651, "b": 664.8547599999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Additionally, the results show that OTSL has an advantage over HTML when applied on a bigger data set like PubTables-1M and achieves significantly improved scores. Finally, OTSL achieves faster inference due to fewer decoding steps which is a result of the reduced sequence representation."}], "body": [{"label": "text", "id": 4, "page_no": 8, "cluster": {"id": 4, "label": "text", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.59579, "b": 151.64178000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9805440306663513, "cells": [{"id": 2, "text": "order to compute the TED score. Inference timing results for all experiments", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.5936899999999, "b": 127.73077, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "were obtained from the same machine on a single core with AMD EPYC 7763", "bbox": {"l": 134.765, "t": 130.88878999999997, "r": 480.59579, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "CPU @2.45 GHz.", "bbox": {"l": 134.765, "t": 142.84479, "r": 210.78462, "b": 151.64178000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "order to compute the TED score. Inference timing results for all experiments were obtained from the same machine on a single core with AMD EPYC 7763 CPU @2.45 GHz."}, {"label": "section_header", "id": 6, "page_no": 8, "cluster": {"id": 6, "label": "section_header", "bbox": {"l": 134.765, "t": 169.18584999999996, "r": 318.44843, "b": 177.9928, "coord_origin": "TOPLEFT"}, "confidence": 0.9579682350158691, "cells": [{"id": 5, "text": "5.1", "bbox": {"l": 134.765, "t": 169.18584999999996, "r": 149.40205, "b": 177.9928, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Hyper Parameter Optimization", "bbox": {"l": 160.85904, "t": 169.18584999999996, "r": 318.44843, "b": 177.9928, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5.1 Hyper Parameter Optimization"}, {"label": "text", "id": 3, "page_no": 8, "cluster": {"id": 3, "label": "text", "bbox": {"l": 134.76498, "t": 185.58582, "r": 480.59277, "b": 254.15886999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.9842326641082764, "cells": [{"id": 7, "text": "We have chosen the PubTabNet data set to perform HPO, since it includes a", "bbox": {"l": 134.765, "t": 185.58582, "r": 480.59183, "b": 194.38280999999995, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "highly diverse set of tables. Also we report TED scores separately for simple and", "bbox": {"l": 134.765, "t": 197.54083000000003, "r": 480.59183, "b": 206.33783000000005, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "complex tables (tables with cell spans). Results are presented in Table. 1. It is", "bbox": {"l": 134.765, "t": 209.49585000000002, "r": 480.59177000000005, "b": 218.29285000000004, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "evident that with OTSL, our model achieves the same TED score and slightly", "bbox": {"l": 134.765, "t": 221.45087, "r": 480.59277, "b": 230.24785999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "better mAP scores in comparison to HTML. However OTSL yields a", "bbox": {"l": 134.765, "t": 233.40588000000002, "r": 440.94159, "b": 242.20288000000005, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "2x speed", "bbox": {"l": 444.86798, "t": 233.40588000000002, "r": 480.58786000000003, "b": 242.20288000000005, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "up", "bbox": {"l": 134.76498, "t": 245.36188000000004, "r": 145.20081, "b": 254.15886999999998, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "in the inference runtime over HTML.", "bbox": {"l": 149.14899, "t": 245.36188000000004, "r": 311.21957, "b": 254.15886999999998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "We have chosen the PubTabNet data set to perform HPO, since it includes a highly diverse set of tables. Also we report TED scores separately for simple and complex tables (tables with cell spans). Results are presented in Table. 1. It is evident that with OTSL, our model achieves the same TED score and slightly better mAP scores in comparison to HTML. However OTSL yields a 2x speed up in the inference runtime over HTML."}, {"label": "caption", "id": 7, "page_no": 8, "cluster": {"id": 7, "label": "caption", "bbox": {"l": 134.76498, "t": 275.07232999999997, "r": 480.5954, "b": 327.0408, "coord_origin": "TOPLEFT"}, "confidence": 0.957078218460083, "cells": [{"id": 15, "text": "Table", "bbox": {"l": 134.76498, "t": 275.07232999999997, "r": 160.11836, "b": 282.9986, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "1.", "bbox": {"l": 167.34528, "t": 275.07232999999997, "r": 175.59526, "b": 282.9986, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "HPO performed in OTSL and HTML representation on the same", "bbox": {"l": 188.13298, "t": 275.13507000000004, "r": 480.59365999999994, "b": 283.2048300000001, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "transformer-based TableFormer [9] architecture, trained only on PubTabNet [22]. Ef-", "bbox": {"l": 134.76498, "t": 286.09409, "r": 480.59444999999994, "b": 294.16385, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "fects of reducing the # of layers in encoder and decoder stages of the model show that", "bbox": {"l": 134.76498, "t": 297.05307, "r": 480.5954, "b": 305.12283, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "smaller models trained on OTSL perform better, especially in recognizing complex", "bbox": {"l": 134.76498, "t": 308.01205, "r": 480.59451, "b": 316.08182, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "table structures, and maintain a much higher mAP score than the HTML counterpart.", "bbox": {"l": 134.76498, "t": 318.97104, "r": 480.59441999999996, "b": 327.0408, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 1. HPO performed in OTSL and HTML representation on the same transformer-based TableFormer [9] architecture, trained only on PubTabNet [22]. Effects of reducing the # of layers in encoder and decoder stages of the model show that smaller models trained on OTSL perform better, especially in recognizing complex table structures, and maintain a much higher mAP score than the HTML counterpart."}, {"label": "table", "id": 0, "page_no": 8, "cluster": {"id": 0, "label": "table", "bbox": {"l": 139.66845703125, "t": 337.5747375488281, "r": 475.00372314453125, "b": 469.4720764160156, "coord_origin": "TOPLEFT"}, "confidence": 0.9901032447814941, "cells": [{"id": 22, "text": "#", "bbox": {"l": 160.37, "t": 341.73495, "r": 168.04793, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "enc-layers", "bbox": {"l": 144.592, "t": 354.68594, "r": 183.82806, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "#", "bbox": {"l": 207.974, "t": 341.73495, "r": 215.65193, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "dec-layers", "bbox": {"l": 192.19499, "t": 354.68594, "r": 231.43106, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "Language", "bbox": {"l": 239.79799999999997, "t": 347.21396, "r": 278.31766, "b": 355.28372, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "TEDs", "bbox": {"l": 324.67001, "t": 341.73495, "r": 348.26419, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "mAP", "bbox": {"l": 396.271, "t": 341.73495, "r": 417.12683, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "(0.75)", "bbox": {"l": 394.927, "t": 352.69394000000005, "r": 418.47278, "b": 360.7637, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Inference", "bbox": {"l": 430.771, "t": 341.73495, "r": 467.1423, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "time (secs)", "bbox": {"l": 427.14801, "t": 352.69394000000005, "r": 470.76056, "b": 360.7637, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "simple", "bbox": {"l": 286.686, "t": 354.68594, "r": 312.33261, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "complex", "bbox": {"l": 320.702, "t": 354.68594, "r": 353.71988, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "all", "bbox": {"l": 369.306, "t": 354.68594, "r": 379.03094, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "6", "bbox": {"l": 161.90601, "t": 373.51596, "r": 166.51294, "b": 381.58572, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "6", "bbox": {"l": 209.509, "t": 373.51596, "r": 214.11594, "b": 381.58572, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 368.03595, "r": 271.40527, "b": 376.10571, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "0.965", "bbox": {"l": 289.017, "t": 368.03595, "r": 310.00375, "b": 376.10571, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "0.934", "bbox": {"l": 326.71701, "t": 368.03595, "r": 347.70377, "b": 376.10571, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "0.955", "bbox": {"l": 363.67599, "t": 368.03595, "r": 384.66275, "b": 376.10571, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "0.88", "bbox": {"l": 397.26999, "t": 367.97317999999996, "r": 416.12723, "b": 375.89948, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "2.73", "bbox": {"l": 439.52701, "t": 367.97317999999996, "r": 458.38425, "b": 375.89948, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 380.98795, "r": 272.93954, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "0.969", "bbox": {"l": 289.017, "t": 380.98795, "r": 310.00375, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "0.927", "bbox": {"l": 326.71701, "t": 380.98795, "r": 347.70377, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "0.955", "bbox": {"l": 363.67599, "t": 380.98795, "r": 384.66275, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "0.857", "bbox": {"l": 396.20599, "t": 380.98795, "r": 417.19275, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "5.39", "bbox": {"l": 440.767, "t": 380.98795, "r": 457.14682, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "4", "bbox": {"l": 161.90601, "t": 399.81696, "r": 166.51294, "b": 407.88672, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "4", "bbox": {"l": 209.509, "t": 399.81696, "r": 214.11594, "b": 407.88672, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 394.33795, "r": 271.40527, "b": 402.40771, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "0.938", "bbox": {"l": 289.017, "t": 394.33795, "r": 310.00375, "b": 402.40771, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "0.904", "bbox": {"l": 326.71701, "t": 394.33795, "r": 347.70377, "b": 402.40771, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "0.927", "bbox": {"l": 363.67599, "t": 394.33795, "r": 384.66275, "b": 402.40771, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "0.853", "bbox": {"l": 394.61801, "t": 394.27518, "r": 418.77887, "b": 402.20148, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "1.97", "bbox": {"l": 439.52701, "t": 394.27518, "r": 458.38425, "b": 402.20148, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 407.28894, "r": 272.93954, "b": 415.3587, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "0.952", "bbox": {"l": 289.017, "t": 407.28894, "r": 310.00375, "b": 415.3587, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "0.909", "bbox": {"l": 326.71701, "t": 407.28894, "r": 347.70377, "b": 415.3587, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "0.938", "bbox": {"l": 362.08801, "t": 407.22617, "r": 386.24887, "b": 415.15247, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "0.843", "bbox": {"l": 396.20599, "t": 407.28894, "r": 417.19275, "b": 415.3587, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "3.77", "bbox": {"l": 440.767, "t": 407.28894, "r": 457.14682, "b": 415.3587, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "2", "bbox": {"l": 161.90601, "t": 426.11795, "r": 166.51294, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "4", "bbox": {"l": 209.509, "t": 426.11795, "r": 214.11594, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 420.63895, "r": 271.40527, "b": 428.70871, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "0.923", "bbox": {"l": 289.017, "t": 420.63895, "r": 310.00375, "b": 428.70871, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "0.897", "bbox": {"l": 326.71701, "t": 420.63895, "r": 347.70377, "b": 428.70871, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "0.915", "bbox": {"l": 363.67599, "t": 420.63895, "r": 384.66275, "b": 428.70871, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "0.859", "bbox": {"l": 394.61801, "t": 420.57617, "r": 418.77887, "b": 428.50247, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "1.91", "bbox": {"l": 439.52701, "t": 420.57617, "r": 458.38425, "b": 428.50247, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 433.58994, "r": 272.93954, "b": 441.6597, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "0.945", "bbox": {"l": 289.017, "t": 433.58994, "r": 310.00375, "b": 441.6597, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "0.901", "bbox": {"l": 326.71701, "t": 433.58994, "r": 347.70377, "b": 441.6597, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "0.931", "bbox": {"l": 362.08801, "t": 433.5271599999999, "r": 386.24887, "b": 441.45346, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "0.834", "bbox": {"l": 396.20599, "t": 433.58994, "r": 417.19275, "b": 441.6597, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "3.81", "bbox": {"l": 440.767, "t": 433.58994, "r": 457.14682, "b": 441.6597, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "4", "bbox": {"l": 161.90601, "t": 452.41995, "r": 166.51294, "b": 460.48972, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "2", "bbox": {"l": 209.509, "t": 452.41995, "r": 214.11594, "b": 460.48972, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 446.9399399999999, "r": 271.40527, "b": 455.0097, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "0.952", "bbox": {"l": 289.017, "t": 446.9399399999999, "r": 310.00375, "b": 455.0097, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "0.92", "bbox": {"l": 329.021, "t": 446.9399399999999, "r": 345.40082, "b": 455.0097, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "0.942", "bbox": {"l": 362.08801, "t": 446.87717, "r": 386.24887, "b": 454.80347, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "0.857", "bbox": {"l": 394.61801, "t": 446.87717, "r": 418.77887, "b": 454.80347, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "1.22", "bbox": {"l": 439.52701, "t": 446.87717, "r": 458.38425, "b": 454.80347, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 459.8919399999999, "r": 272.93954, "b": 467.9617, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "0.944", "bbox": {"l": 289.017, "t": 459.8919399999999, "r": 310.00375, "b": 467.9617, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "0.903", "bbox": {"l": 326.71701, "t": 459.8919399999999, "r": 347.70377, "b": 467.9617, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "0.931", "bbox": {"l": 363.67599, "t": 459.8919399999999, "r": 384.66275, "b": 467.9617, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "0.824", "bbox": {"l": 396.20599, "t": 459.8919399999999, "r": 417.19275, "b": 467.9617, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "2", "bbox": {"l": 446.65302, "t": 459.8919399999999, "r": 451.25995, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": [{"id": 10, "label": "text", "bbox": {"l": 160.37, "t": 341.73495, "r": 168.04793, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "#", "bbox": {"l": 160.37, "t": 341.73495, "r": 168.04793, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 144.592, "t": 354.68594, "r": 183.82806, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "enc-layers", "bbox": {"l": 144.592, "t": 354.68594, "r": 183.82806, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 207.974, "t": 341.73495, "r": 215.65193, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "#", "bbox": {"l": 207.974, "t": 341.73495, "r": 215.65193, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 192.19499, "t": 354.68594, "r": 231.43106, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "dec-layers", "bbox": {"l": 192.19499, "t": 354.68594, "r": 231.43106, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 239.79799999999997, "t": 347.21396, "r": 278.31766, "b": 355.28372, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "Language", "bbox": {"l": 239.79799999999997, "t": 347.21396, "r": 278.31766, "b": 355.28372, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 324.67001, "t": 341.73495, "r": 348.26419, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "TEDs", "bbox": {"l": 324.67001, "t": 341.73495, "r": 348.26419, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 396.271, "t": 341.73495, "r": 417.12683, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "mAP", "bbox": {"l": 396.271, "t": 341.73495, "r": 417.12683, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 394.927, "t": 352.69394000000005, "r": 418.47278, "b": 360.7637, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "(0.75)", "bbox": {"l": 394.927, "t": 352.69394000000005, "r": 418.47278, "b": 360.7637, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 430.771, "t": 341.73495, "r": 467.1423, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "Inference", "bbox": {"l": 430.771, "t": 341.73495, "r": 467.1423, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 427.14801, "t": 352.69394000000005, "r": 470.76056, "b": 360.7637, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "time (secs)", "bbox": {"l": 427.14801, "t": 352.69394000000005, "r": 470.76056, "b": 360.7637, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 286.686, "t": 354.68594, "r": 312.33261, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "simple", "bbox": {"l": 286.686, "t": 354.68594, "r": 312.33261, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 320.702, "t": 354.68594, "r": 353.71988, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "complex", "bbox": {"l": 320.702, "t": 354.68594, "r": 353.71988, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 369.306, "t": 354.68594, "r": 379.03094, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "all", "bbox": {"l": 369.306, "t": 354.68594, "r": 379.03094, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 161.90601, "t": 373.51596, "r": 166.51294, "b": 381.58572, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "6", "bbox": {"l": 161.90601, "t": 373.51596, "r": 166.51294, "b": 381.58572, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 209.509, "t": 373.51596, "r": 214.11594, "b": 381.58572, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "6", "bbox": {"l": 209.509, "t": 373.51596, "r": 214.11594, "b": 381.58572, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 246.71000999999998, "t": 368.03595, "r": 271.40527, "b": 376.10571, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 368.03595, "r": 271.40527, "b": 376.10571, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 289.017, "t": 368.03595, "r": 310.00375, "b": 376.10571, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "0.965", "bbox": {"l": 289.017, "t": 368.03595, "r": 310.00375, "b": 376.10571, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 326.71701, "t": 368.03595, "r": 347.70377, "b": 376.10571, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "0.934", "bbox": {"l": 326.71701, "t": 368.03595, "r": 347.70377, "b": 376.10571, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 363.67599, "t": 368.03595, "r": 384.66275, "b": 376.10571, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "0.955", "bbox": {"l": 363.67599, "t": 368.03595, "r": 384.66275, "b": 376.10571, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 397.26999, "t": 367.97317999999996, "r": 416.12723, "b": 375.89948, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "0.88", "bbox": {"l": 397.26999, "t": 367.97317999999996, "r": 416.12723, "b": 375.89948, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 439.52701, "t": 367.97317999999996, "r": 458.38425, "b": 375.89948, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "2.73", "bbox": {"l": 439.52701, "t": 367.97317999999996, "r": 458.38425, "b": 375.89948, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 245.17598999999998, "t": 380.98795, "r": 272.93954, "b": 389.05771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 380.98795, "r": 272.93954, "b": 389.05771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 289.017, "t": 380.98795, "r": 310.00375, "b": 389.05771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "0.969", "bbox": {"l": 289.017, "t": 380.98795, "r": 310.00375, "b": 389.05771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 326.71701, "t": 380.98795, "r": 347.70377, "b": 389.05771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "0.927", "bbox": {"l": 326.71701, "t": 380.98795, "r": 347.70377, "b": 389.05771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 363.67599, "t": 380.98795, "r": 384.66275, "b": 389.05771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "0.955", "bbox": {"l": 363.67599, "t": 380.98795, "r": 384.66275, "b": 389.05771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 396.20599, "t": 380.98795, "r": 417.19275, "b": 389.05771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "0.857", "bbox": {"l": 396.20599, "t": 380.98795, "r": 417.19275, "b": 389.05771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 440.767, "t": 380.98795, "r": 457.14682, "b": 389.05771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "5.39", "bbox": {"l": 440.767, "t": 380.98795, "r": 457.14682, "b": 389.05771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 161.90601, "t": 399.81696, "r": 166.51294, "b": 407.88672, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "4", "bbox": {"l": 161.90601, "t": 399.81696, "r": 166.51294, "b": 407.88672, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 209.509, "t": 399.81696, "r": 214.11594, "b": 407.88672, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "4", "bbox": {"l": 209.509, "t": 399.81696, "r": 214.11594, "b": 407.88672, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 246.71000999999998, "t": 394.33795, "r": 271.40527, "b": 402.40771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 394.33795, "r": 271.40527, "b": 402.40771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 289.017, "t": 394.33795, "r": 310.00375, "b": 402.40771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "0.938", "bbox": {"l": 289.017, "t": 394.33795, "r": 310.00375, "b": 402.40771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 326.71701, "t": 394.33795, "r": 347.70377, "b": 402.40771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "0.904", "bbox": {"l": 326.71701, "t": 394.33795, "r": 347.70377, "b": 402.40771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 363.67599, "t": 394.33795, "r": 384.66275, "b": 402.40771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "0.927", "bbox": {"l": 363.67599, "t": 394.33795, "r": 384.66275, "b": 402.40771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 394.61801, "t": 394.27518, "r": 418.77887, "b": 402.20148, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "0.853", "bbox": {"l": 394.61801, "t": 394.27518, "r": 418.77887, "b": 402.20148, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 439.52701, "t": 394.27518, "r": 458.38425, "b": 402.20148, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "1.97", "bbox": {"l": 439.52701, "t": 394.27518, "r": 458.38425, "b": 402.20148, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 245.17598999999998, "t": 407.28894, "r": 272.93954, "b": 415.3587, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 407.28894, "r": 272.93954, "b": 415.3587, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 289.017, "t": 407.28894, "r": 310.00375, "b": 415.3587, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "0.952", "bbox": {"l": 289.017, "t": 407.28894, "r": 310.00375, "b": 415.3587, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 326.71701, "t": 407.28894, "r": 347.70377, "b": 415.3587, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "0.909", "bbox": {"l": 326.71701, "t": 407.28894, "r": 347.70377, "b": 415.3587, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 362.08801, "t": 407.22617, "r": 386.24887, "b": 415.15247, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "0.938", "bbox": {"l": 362.08801, "t": 407.22617, "r": 386.24887, "b": 415.15247, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 396.20599, "t": 407.28894, "r": 417.19275, "b": 415.3587, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "0.843", "bbox": {"l": 396.20599, "t": 407.28894, "r": 417.19275, "b": 415.3587, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 440.767, "t": 407.28894, "r": 457.14682, "b": 415.3587, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "3.77", "bbox": {"l": 440.767, "t": 407.28894, "r": 457.14682, "b": 415.3587, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 161.90601, "t": 426.11795, "r": 166.51294, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "2", "bbox": {"l": 161.90601, "t": 426.11795, "r": 166.51294, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 209.509, "t": 426.11795, "r": 214.11594, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "4", "bbox": {"l": 209.509, "t": 426.11795, "r": 214.11594, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 246.71000999999998, "t": 420.63895, "r": 271.40527, "b": 428.70871, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 420.63895, "r": 271.40527, "b": 428.70871, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 289.017, "t": 420.63895, "r": 310.00375, "b": 428.70871, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "0.923", "bbox": {"l": 289.017, "t": 420.63895, "r": 310.00375, "b": 428.70871, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 326.71701, "t": 420.63895, "r": 347.70377, "b": 428.70871, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "0.897", "bbox": {"l": 326.71701, "t": 420.63895, "r": 347.70377, "b": 428.70871, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 363.67599, "t": 420.63895, "r": 384.66275, "b": 428.70871, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "0.915", "bbox": {"l": 363.67599, "t": 420.63895, "r": 384.66275, "b": 428.70871, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 394.61801, "t": 420.57617, "r": 418.77887, "b": 428.50247, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "0.859", "bbox": {"l": 394.61801, "t": 420.57617, "r": 418.77887, "b": 428.50247, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 439.52701, "t": 420.57617, "r": 458.38425, "b": 428.50247, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "1.91", "bbox": {"l": 439.52701, "t": 420.57617, "r": 458.38425, "b": 428.50247, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 245.17598999999998, "t": 433.58994, "r": 272.93954, "b": 441.6597, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 433.58994, "r": 272.93954, "b": 441.6597, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 289.017, "t": 433.58994, "r": 310.00375, "b": 441.6597, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "0.945", "bbox": {"l": 289.017, "t": 433.58994, "r": 310.00375, "b": 441.6597, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 326.71701, "t": 433.58994, "r": 347.70377, "b": 441.6597, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "0.901", "bbox": {"l": 326.71701, "t": 433.58994, "r": 347.70377, "b": 441.6597, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 362.08801, "t": 433.5271599999999, "r": 386.24887, "b": 441.45346, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "0.931", "bbox": {"l": 362.08801, "t": 433.5271599999999, "r": 386.24887, "b": 441.45346, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 396.20599, "t": 433.58994, "r": 417.19275, "b": 441.6597, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "0.834", "bbox": {"l": 396.20599, "t": 433.58994, "r": 417.19275, "b": 441.6597, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 440.767, "t": 433.58994, "r": 457.14682, "b": 441.6597, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "3.81", "bbox": {"l": 440.767, "t": 433.58994, "r": 457.14682, "b": 441.6597, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 161.90601, "t": 452.41995, "r": 166.51294, "b": 460.48972, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "4", "bbox": {"l": 161.90601, "t": 452.41995, "r": 166.51294, "b": 460.48972, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 209.509, "t": 452.41995, "r": 214.11594, "b": 460.48972, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "2", "bbox": {"l": 209.509, "t": 452.41995, "r": 214.11594, "b": 460.48972, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 246.71000999999998, "t": 446.9399399999999, "r": 271.40527, "b": 455.0097, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 446.9399399999999, "r": 271.40527, "b": 455.0097, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 289.017, "t": 446.9399399999999, "r": 310.00375, "b": 455.0097, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "0.952", "bbox": {"l": 289.017, "t": 446.9399399999999, "r": 310.00375, "b": 455.0097, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 329.021, "t": 446.9399399999999, "r": 345.40082, "b": 455.0097, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "0.92", "bbox": {"l": 329.021, "t": 446.9399399999999, "r": 345.40082, "b": 455.0097, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 362.08801, "t": 446.87717, "r": 386.24887, "b": 454.80347, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "0.942", "bbox": {"l": 362.08801, "t": 446.87717, "r": 386.24887, "b": 454.80347, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 394.61801, "t": 446.87717, "r": 418.77887, "b": 454.80347, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "0.857", "bbox": {"l": 394.61801, "t": 446.87717, "r": 418.77887, "b": 454.80347, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 439.52701, "t": 446.87717, "r": 458.38425, "b": 454.80347, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "1.22", "bbox": {"l": 439.52701, "t": 446.87717, "r": 458.38425, "b": 454.80347, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 245.17598999999998, "t": 459.8919399999999, "r": 272.93954, "b": 467.9617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 459.8919399999999, "r": 272.93954, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 289.017, "t": 459.8919399999999, "r": 310.00375, "b": 467.9617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "0.944", "bbox": {"l": 289.017, "t": 459.8919399999999, "r": 310.00375, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 326.71701, "t": 459.8919399999999, "r": 347.70377, "b": 467.9617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "0.903", "bbox": {"l": 326.71701, "t": 459.8919399999999, "r": 347.70377, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 363.67599, "t": 459.8919399999999, "r": 384.66275, "b": 467.9617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "0.931", "bbox": {"l": 363.67599, "t": 459.8919399999999, "r": 384.66275, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 396.20599, "t": 459.8919399999999, "r": 417.19275, "b": 467.9617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "0.824", "bbox": {"l": 396.20599, "t": 459.8919399999999, "r": 417.19275, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 446.65302, "t": 459.8919399999999, "r": 451.25995, "b": 467.9617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "2", "bbox": {"l": 446.65302, "t": 459.8919399999999, "r": 451.25995, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "lcel", "lcel", "ched", "ched", "nl", "ched", "ched", "ucel", "ched", "ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 7, "num_cols": 8, "table_cells": [{"bbox": {"l": 160.37, "t": 341.73495, "r": 168.04793, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "#", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 144.592, "t": 354.68594, "r": 183.82806, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "enc-layers", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 207.974, "t": 341.73495, "r": 215.65193, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "#", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 192.19499, "t": 354.68594, "r": 231.43106, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "dec-layers", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 239.79799999999997, "t": 347.21396, "r": 278.31766, "b": 355.28372, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Language", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 324.67001, "t": 341.73495, "r": 348.26419, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 3, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 6, "text": "TEDs", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 396.271, "t": 341.73495, "r": 417.12683, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "mAP", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 394.927, "t": 352.69394000000005, "r": 418.47278, "b": 360.7637, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "(0.75)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 430.771, "t": 341.73495, "r": 467.1423, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "Inference", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 427.14801, "t": 352.69394000000005, "r": 470.76056, "b": 360.7637, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "time (secs)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 286.686, "t": 354.68594, "r": 312.33261, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "simple", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 320.702, "t": 354.68594, "r": 353.71988, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "complex", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 369.306, "t": 354.68594, "r": 379.03094, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "all", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 161.90601, "t": 373.51596, "r": 166.51294, "b": 381.58572, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 373.51596, "r": 214.11594, "b": 381.58572, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 368.03595, "r": 272.93954, "b": 389.05771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 368.03595, "r": 310.00375, "b": 389.05771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.965 0.969", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 368.03595, "r": 347.70377, "b": 389.05771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.934 0.927", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 363.67599, "t": 368.03595, "r": 384.66275, "b": 389.05771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.955 0.955", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 396.20599, "t": 367.97317999999996, "r": 417.19275, "b": 389.05771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.88 0.857", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 367.97317999999996, "r": 458.38425, "b": 389.05771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "2.73 5.39", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 161.90601, "t": 399.81696, "r": 166.51294, "b": 407.88672, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 399.81696, "r": 214.11594, "b": 407.88672, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 394.33795, "r": 272.93954, "b": 415.3587, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 394.33795, "r": 310.00375, "b": 415.3587, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.938 0.952", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 394.33795, "r": 347.70377, "b": 402.40771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.904", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 363.67599, "t": 394.33795, "r": 384.66275, "b": 402.40771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.927", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.61801, "t": 394.27518, "r": 418.77887, "b": 402.20148, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.853", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 394.27518, "r": 458.38425, "b": 402.20148, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "1.97", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 407.28894, "r": 347.70377, "b": 428.70871, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.909 0.897", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 362.08801, "t": 407.22617, "r": 386.24887, "b": 415.15247, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.938", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 396.20599, "t": 407.28894, "r": 417.19275, "b": 415.3587, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.843", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.767, "t": 407.28894, "r": 457.14682, "b": 415.3587, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "3.77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 161.90601, "t": 426.11795, "r": 166.51294, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 426.11795, "r": 214.11594, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 246.71000999999998, "t": 420.63895, "r": 271.40527, "b": 428.70871, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 420.63895, "r": 310.00375, "b": 441.6597, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.923 0.945", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 362.08801, "t": 420.63895, "r": 386.24887, "b": 441.45346, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.915 0.931", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.61801, "t": 420.57617, "r": 418.77887, "b": 441.6597, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.859 0.834", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 420.57617, "r": 458.38425, "b": 441.6597, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "1.91 3.81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 433.58994, "r": 272.93954, "b": 441.6597, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 433.58994, "r": 347.70377, "b": 441.6597, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.901", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 161.90601, "t": 452.41995, "r": 166.51294, "b": 460.48972, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 452.41995, "r": 214.11594, "b": 460.48972, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 446.9399399999999, "r": 272.93954, "b": 467.9617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 446.9399399999999, "r": 310.00375, "b": 467.9617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.952 0.944", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 446.9399399999999, "r": 347.70377, "b": 467.9617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.92 0.903", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 362.08801, "t": 446.87717, "r": 386.24887, "b": 467.9617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.942 0.931", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.61801, "t": 446.87717, "r": 418.77887, "b": 467.9617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.857 0.824", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 446.87717, "r": 458.38425, "b": 467.9617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "1.22 2", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "section_header", "id": 5, "page_no": 8, "cluster": {"id": 5, "label": "section_header", "bbox": {"l": 134.765, "t": 508.15179, "r": 264.40332, "b": 516.95874, "coord_origin": "TOPLEFT"}, "confidence": 0.9592539668083191, "cells": [{"id": 91, "text": "5.2", "bbox": {"l": 134.765, "t": 508.15179, "r": 149.40205, "b": 516.95874, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Quantitative Results", "bbox": {"l": 160.85904, "t": 508.15179, "r": 264.40332, "b": 516.95874, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5.2 Quantitative Results"}, {"label": "text", "id": 1, "page_no": 8, "cluster": {"id": 1, "label": "text", "bbox": {"l": 134.765, "t": 524.55078, "r": 480.5957599999999, "b": 617.03474, "coord_origin": "TOPLEFT"}, "confidence": 0.9854757189750671, "cells": [{"id": 93, "text": "We picked the model parameter configuration that produced the best prediction", "bbox": {"l": 134.765, "t": 524.55078, "r": 480.59075999999993, "b": 533.34775, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "quality (enc=6, dec=6, heads=8) with PubTabNet alone, then independently", "bbox": {"l": 134.765, "t": 536.50677, "r": 480.58675999999997, "b": 545.3037400000001, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "trained and evaluated it on three publicly available data sets: PubTabNet (395k", "bbox": {"l": 134.765, "t": 548.4617800000001, "r": 480.59572999999995, "b": 557.25874, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "samples), FinTabNet (113k samples) and PubTables-1M (about 1M samples).", "bbox": {"l": 134.765, "t": 560.41678, "r": 480.59177000000005, "b": 569.21375, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "Performance results are presented in Table. 2. It is clearly evident that the model", "bbox": {"l": 134.765, "t": 572.37178, "r": 480.59069999999997, "b": 581.16875, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "trained on OTSL outperforms HTML across the board, keeping high TEDs and", "bbox": {"l": 134.765, "t": 584.32678, "r": 480.5957599999999, "b": 593.12375, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "mAP scores even on difficult financial tables (FinTabNet) that contain sparse", "bbox": {"l": 134.765, "t": 596.28278, "r": 480.58774, "b": 605.07974, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "and large tables.", "bbox": {"l": 134.765, "t": 608.2377799999999, "r": 206.78664, "b": 617.03474, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "We picked the model parameter configuration that produced the best prediction quality (enc=6, dec=6, heads=8) with PubTabNet alone, then independently trained and evaluated it on three publicly available data sets: PubTabNet (395k samples), FinTabNet (113k samples) and PubTables-1M (about 1M samples). Performance results are presented in Table. 2. It is clearly evident that the model trained on OTSL outperforms HTML across the board, keeping high TEDs and mAP scores even on difficult financial tables (FinTabNet) that contain sparse and large tables."}, {"label": "text", "id": 2, "page_no": 8, "cluster": {"id": 2, "label": "text", "bbox": {"l": 134.765, "t": 620.19278, "r": 480.5957599999999, "b": 664.8547599999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9851234555244446, "cells": [{"id": 101, "text": "Additionally, the results show that OTSL has an advantage over HTML", "bbox": {"l": 149.709, "t": 620.19278, "r": 480.59271, "b": 628.98975, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "when applied on a bigger data set like PubTables-1M and achieves significantly", "bbox": {"l": 134.765, "t": 632.14778, "r": 480.5957599999999, "b": 640.94475, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "improved scores. Finally, OTSL achieves faster inference due to fewer decoding", "bbox": {"l": 134.765, "t": 644.1027799999999, "r": 480.59283000000005, "b": 652.89975, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "steps which is a result of the reduced sequence representation.", "bbox": {"l": 134.765, "t": 656.0577900000001, "r": 405.79651, "b": 664.8547599999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Additionally, the results show that OTSL has an advantage over HTML when applied on a bigger data set like PubTables-1M and achieves significantly improved scores. Finally, OTSL achieves faster inference due to fewer decoding steps which is a result of the reduced sequence representation."}], "headers": [{"label": "page_header", "id": 8, "page_no": 8, "cluster": {"id": 8, "label": "page_header", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9373378157615662, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Optimized Table Tokenization for Table Structure Recognition"}, {"label": "page_header", "id": 9, "page_no": 8, "cluster": {"id": 9, "label": "page_header", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8857628107070923, "cells": [{"id": 1, "text": "9", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "9"}]}}, {"page_no": 9, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "10", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 143.97887, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "M.", "bbox": {"l": 167.82053, "t": 93.77099999999996, "r": 178.08249, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37929, "t": 93.77099999999996, "r": 231.72049000000004, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Table 2.", "bbox": {"l": 134.765, "t": 115.83618000000001, "r": 173.09366, "b": 123.76251000000002, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "TSR and cell detection results compared between OTSL and HTML on", "bbox": {"l": 181.30299, "t": 115.89899000000003, "r": 480.59151999999995, "b": 123.96868999999992, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "the PubTabNet [22], FinTabNet [21] and PubTables-1M [14] data sets using Table-", "bbox": {"l": 134.765, "t": 126.85797000000014, "r": 480.59357000000006, "b": 134.92767000000003, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Former [9] (with enc=6, dec=6, heads=8).", "bbox": {"l": 134.765, "t": 137.81696, "r": 305.95691, "b": 145.88666, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Data set", "bbox": {"l": 160.782, "t": 166.55895999999996, "r": 194.99779, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Language", "bbox": {"l": 215.52499000000003, "t": 166.534, "r": 254.04465, "b": 174.6037, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "TEDs", "bbox": {"l": 300.397, "t": 161.07898, "r": 323.99118, "b": 169.14868, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "mAP(0.75)", "bbox": {"l": 370.345, "t": 166.55895999999996, "r": 414.74661, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Inference", "bbox": {"l": 426.737, "t": 161.07898, "r": 463.10830999999996, "b": 169.14868, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "time (secs)", "bbox": {"l": 423.11401, "t": 172.03796, "r": 466.72656, "b": 180.10766999999998, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "simple", "bbox": {"l": 262.41299, "t": 174.03101000000004, "r": 288.0596, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "complex", "bbox": {"l": 296.42899, "t": 174.03101000000004, "r": 329.44687, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "all", "bbox": {"l": 345.03299, "t": 174.03101000000004, "r": 354.75793, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "PubTabNet", "bbox": {"l": 154.53799, "t": 192.85999000000004, "r": 201.24129, "b": 200.92969000000005, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "OTSL", "bbox": {"l": 222.43700000000004, "t": 187.38098000000002, "r": 247.13226000000003, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "0.965", "bbox": {"l": 264.74399, "t": 187.38098000000002, "r": 285.73074, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "0.934", "bbox": {"l": 302.444, "t": 187.38098000000002, "r": 323.43076, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "0.955", "bbox": {"l": 339.40302, "t": 187.38098000000002, "r": 360.38977, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "0.88", "bbox": {"l": 383.116, "t": 187.31817999999998, "r": 401.97324, "b": 195.24451, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "2.73", "bbox": {"l": 435.49300999999997, "t": 187.31817999999998, "r": 454.35025, "b": 195.24451, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "HTML", "bbox": {"l": 220.903, "t": 200.33196999999996, "r": 248.66655999999998, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "0.969", "bbox": {"l": 264.74399, "t": 200.33196999999996, "r": 285.73074, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "0.927", "bbox": {"l": 302.444, "t": 200.33196999999996, "r": 323.43076, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "0.955", "bbox": {"l": 339.40302, "t": 200.33196999999996, "r": 360.38977, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "0.857", "bbox": {"l": 382.052, "t": 200.33196999999996, "r": 403.03876, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "5.39", "bbox": {"l": 436.73199000000005, "t": 200.33196999999996, "r": 453.11182, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "FinTabNet", "bbox": {"l": 155.94501, "t": 219.16198999999995, "r": 199.83374, "b": 227.23168999999996, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "OTSL", "bbox": {"l": 222.43700000000004, "t": 213.68201, "r": 247.13226000000003, "b": 221.75171, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "0.955", "bbox": {"l": 264.74399, "t": 213.68201, "r": 285.73074, "b": 221.75171, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "0.961", "bbox": {"l": 302.444, "t": 213.68201, "r": 323.43076, "b": 221.75171, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "0.959", "bbox": {"l": 337.815, "t": 213.61919999999998, "r": 361.97586, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "0.862", "bbox": {"l": 380.46399, "t": 213.61919999999998, "r": 404.62485, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "1.85", "bbox": {"l": 435.49300999999997, "t": 213.61919999999998, "r": 454.35025, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "HTML", "bbox": {"l": 220.903, "t": 226.63396999999998, "r": 248.66655999999998, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "0.917", "bbox": {"l": 264.74399, "t": 226.63396999999998, "r": 285.73074, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "0.922", "bbox": {"l": 302.444, "t": 226.63396999999998, "r": 323.43076, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "0.92", "bbox": {"l": 341.70599, "t": 226.63396999999998, "r": 358.08582, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "0.722", "bbox": {"l": 382.052, "t": 226.63396999999998, "r": 403.03876, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "3.26", "bbox": {"l": 436.73199000000005, "t": 226.63396999999998, "r": 453.11182, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "PubTables-1M", "bbox": {"l": 148.62601, "t": 245.46294999999998, "r": 207.1524, "b": 253.53265, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "OTSL", "bbox": {"l": 222.43700000000004, "t": 239.98297000000002, "r": 247.13226000000003, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "0.987", "bbox": {"l": 264.74399, "t": 239.98297000000002, "r": 285.73074, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "0.964", "bbox": {"l": 302.444, "t": 239.98297000000002, "r": 323.43076, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "0.977", "bbox": {"l": 337.815, "t": 239.92016999999998, "r": 361.97586, "b": 247.8465, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "0.896", "bbox": {"l": 380.46399, "t": 239.92016999999998, "r": 404.62485, "b": 247.8465, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "1.79", "bbox": {"l": 435.49300999999997, "t": 239.92016999999998, "r": 454.35025, "b": 247.8465, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "HTML", "bbox": {"l": 220.903, "t": 252.93499999999995, "r": 248.66655999999998, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "0.983", "bbox": {"l": 264.74399, "t": 252.93499999999995, "r": 285.73074, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "0.944", "bbox": {"l": 302.444, "t": 252.93499999999995, "r": 323.43076, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "0.966", "bbox": {"l": 339.40302, "t": 252.93499999999995, "r": 360.38977, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "0.889", "bbox": {"l": 382.052, "t": 252.93499999999995, "r": 403.03876, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "3.26", "bbox": {"l": 436.73199000000005, "t": 252.93499999999995, "r": 453.11182, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "5.3", "bbox": {"l": 134.765, "t": 288.91479, "r": 149.40205, "b": 297.72173999999995, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Qualitative Results", "bbox": {"l": 160.85904, "t": 288.91479, "r": 257.08679, "b": 297.72173999999995, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "To illustrate the qualitative differences between OTSL and HTML, Figure 5", "bbox": {"l": 134.765, "t": 309.86078, "r": 480.58777, "b": 318.65775, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "demonstrates less overlap and more accurate bounding boxes with OTSL. In", "bbox": {"l": 134.765, "t": 321.81577, "r": 480.58889999999997, "b": 330.61273, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Figure 6, OTSL proves to be more effective in handling tables with longer to-", "bbox": {"l": 134.765, "t": 333.77075, "r": 480.58681999999993, "b": 342.56772, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "ken sequences, resulting in even more precise structure prediction and bounding", "bbox": {"l": 134.765, "t": 345.72574, "r": 480.58981, "b": 354.52271, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "boxes.", "bbox": {"l": 134.765, "t": 357.68073, "r": 161.65704, "b": 366.47769, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "Fig. 5.", "bbox": {"l": 134.765, "t": 397.59012, "r": 162.64424, "b": 405.51642, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "The OTSL model produces more accurate bounding boxes with less over-", "bbox": {"l": 167.384, "t": 397.65289, "r": 480.59106, "b": 405.72266, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "lap (E) than the HTML model (D), when predicting the structure of a sparse ta-", "bbox": {"l": 134.765, "t": 408.61190999999997, "r": 480.59106, "b": 416.68167000000005, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "ble (A), at twice the inference speed because of shorter sequence length (B),(C).", "bbox": {"l": 134.765, "t": 419.57089, "r": 480.58838000000003, "b": 427.64066, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "\"PMC2807444_006_00.png\" PubTabNet.", "bbox": {"l": 134.765, "t": 430.52987999999993, "r": 304.69171, "b": 438.59964, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "<table>", "bbox": {"l": 180.12473, "t": 516.2332200000001, "r": 190.62042, "b": 518.94992, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "<tr><td></td><td colspan=\"4\"></td><td colspan=\"6\"></td><td colspan=\"3\"></td></tr>", "bbox": {"l": 183.2438, "t": 520.13208, "r": 304.54797, "b": 522.84879, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 524.03094, "r": 388.42313, "b": 526.74765, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 527.9297799999999, "r": 388.42313, "b": 530.64648, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 531.82861, "r": 388.42313, "b": 534.54532, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 535.72748, "r": 388.42313, "b": 538.44418, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 539.62631, "r": 388.42313, "b": 542.34303, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 543.52516, "r": 388.42313, "b": 546.24188, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 547.42401, "r": 388.42313, "b": 550.14073, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 551.32286, "r": 388.42313, "b": 554.03958, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "</table>", "bbox": {"l": 180.12473, "t": 555.22173, "r": 191.86806, "b": 557.93845, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "C", "bbox": {"l": 407.38348, "t": 518.30042, "r": 408.82025, "b": 521.01712, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "C L L L C L L L L L C L L NL", "bbox": {"l": 410.25699, "t": 518.30042, "r": 450.48605, "b": 521.01712, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "C", "bbox": {"l": 407.38348, "t": 522.19925, "r": 408.82025, "b": 524.9159500000001, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 522.19925, "r": 450.48605, "b": 524.9159500000001, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "C", "bbox": {"l": 407.38348, "t": 526.09808, "r": 408.82025, "b": 528.81479, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 526.09808, "r": 450.48605, "b": 528.81479, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "C", "bbox": {"l": 407.38348, "t": 529.99695, "r": 408.82025, "b": 532.7136499999999, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 529.99695, "r": 450.48605, "b": 532.7136499999999, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "C", "bbox": {"l": 407.38348, "t": 533.8957800000001, "r": 408.82025, "b": 536.6125, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 533.8957800000001, "r": 450.48605, "b": 536.6125, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "C", "bbox": {"l": 407.38348, "t": 537.79463, "r": 408.82025, "b": 540.51135, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 537.79463, "r": 450.48605, "b": 540.51135, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "C", "bbox": {"l": 407.38348, "t": 541.69348, "r": 408.82025, "b": 544.4102, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 541.69348, "r": 450.48605, "b": 544.4102, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "C", "bbox": {"l": 407.38348, "t": 545.59233, "r": 408.82025, "b": 548.3090500000001, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 545.59233, "r": 450.48605, "b": 548.3090500000001, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "C", "bbox": {"l": 407.38348, "t": 549.4911999999999, "r": 408.82025, "b": 552.2079200000001, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 549.4911999999999, "r": 450.48605, "b": 552.2079200000001, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "HTML", "bbox": {"l": 164.52881, "t": 509.45859, "r": 181.8528, "b": 515.31, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "#", "bbox": {"l": 183.58441, "t": 509.45859, "r": 186.3974, "b": 515.31, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "tokens:", "bbox": {"l": 189.2104, "t": 509.45859, "r": 208.90137, "b": 515.31, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "258", "bbox": {"l": 210.63269, "t": 509.45859, "r": 221.04044, "b": 515.31, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "OTSL", "bbox": {"l": 390.20203, "t": 509.60361, "r": 406.83609, "b": 515.45502, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "#", "bbox": {"l": 408.56952, "t": 509.60361, "r": 411.38251, "b": 515.45502, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "tokens:", "bbox": {"l": 414.1955, "t": 509.60361, "r": 433.88647000000003, "b": 515.45502, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "135", "bbox": {"l": 435.61737, "t": 509.60361, "r": 446.02512, "b": 515.45502, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "B", "bbox": {"l": 167.19316, "t": 519.07236, "r": 172.8231, "b": 526.3866, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "A", "bbox": {"l": 187.33745, "t": 448.62485, "r": 192.96739, "b": 455.93909, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "D", "bbox": {"l": 167.38654, "t": 566.0051599999999, "r": 173.01648, "b": 573.3194, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "E", "bbox": {"l": 248.45621000000003, "t": 621.78008, "r": 253.65727, "b": 629.09431, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "C", "bbox": {"l": 395.90057, "t": 519.19946, "r": 401.53052, "b": 526.5137, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "HTML", "bbox": {"l": 171.62886, "t": 580.28853, "r": 177.48148, "b": 597.26784, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "OTSL", "bbox": {"l": 251.05969000000002, "t": 633.63408, "r": 256.91235, "b": 649.92345, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "HTML model shows", "bbox": {"l": 372.14645, "t": 601.45724, "r": 427.0379, "b": 607.30864, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "bounding box drifting", "bbox": {"l": 372.14645, "t": 607.89948, "r": 430.06838999999997, "b": 613.75087, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "OTSL model shows", "bbox": {"l": 176.88042, "t": 642.87209, "r": 231.08191, "b": 648.72348, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "clean bounding box", "bbox": {"l": 176.88042, "t": 649.3143, "r": 230.99271000000002, "b": 655.1657, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "alignment", "bbox": {"l": 176.88042, "t": 655.7565500000001, "r": 203.93219, "b": 661.60794, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "\u2264", "bbox": {"l": 215.93231000000003, "t": 557.56342, "r": 218.4697, "b": 569.15967, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "\u03bc", "bbox": {"l": 229.05689999999998, "t": 557.56342, "r": 231.71908999999997, "b": 569.15967, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "\u03bc", "bbox": {"l": 342.63354, "t": 430.19678, "r": 344.81915, "b": 439.71716, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "S", "bbox": {"l": 261.20892, "t": 448.46124, "r": 263.56973, "b": 451.19727, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "I", "bbox": {"l": 312.33463, "t": 448.46124, "r": 313.6362, "b": 451.19727, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "R", "bbox": {"l": 377.41125, "t": 448.46124, "r": 380.05737, "b": 451.19727, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "ST", "bbox": {"l": 200.63976, "t": 453.33997, "r": 205.82492, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "0.03", "bbox": {"l": 222.20833000000002, "t": 453.33997, "r": 229.76836, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "0.06", "bbox": {"l": 243.26666, "t": 453.33997, "r": 250.82669, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "0.12", "bbox": {"l": 264.29657, "t": 453.33997, "r": 271.84949, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "0.25", "bbox": {"l": 285.31943, "t": 453.33997, "r": 292.87946, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "0.5", "bbox": {"l": 306.37775, "t": 453.33997, "r": 311.77319, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "1", "bbox": {"l": 323.41699, "t": 453.33997, "r": 325.58157, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "2", "bbox": {"l": 334.45807, "t": 453.33997, "r": 336.62265, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "4", "bbox": {"l": 345.52756, "t": 453.33997, "r": 347.69214, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "8", "bbox": {"l": 356.56863, "t": 453.33997, "r": 358.73322, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "16", "bbox": {"l": 367.63812, "t": 453.33997, "r": 371.97089, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "32", "bbox": {"l": 382.6734, "t": 453.33997, "r": 387.00616, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "64", "bbox": {"l": 397.73727, "t": 453.33997, "r": 402.07001, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "\u2265", "bbox": {"l": 412.78879, "t": 447.99298, "r": 414.93463, "b": 457.79964999999993, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": " 128", "bbox": {"l": 414.95697, "t": 453.33997, "r": 422.51746, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "63", "bbox": {"l": 200.63998, "t": 463.92444, "r": 204.57674, "b": 466.66043, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "1", "bbox": {"l": 367.62604, "t": 463.92444, "r": 369.58032, "b": 466.66043, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "1", "bbox": {"l": 382.66132, "t": 463.92444, "r": 384.6156, "b": 466.66043, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "3", "bbox": {"l": 397.72504, "t": 463.92444, "r": 399.67932, "b": 466.66043, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "199", "bbox": {"l": 200.64, "t": 468.80313, "r": 206.51694, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "5", "bbox": {"l": 264.29047, "t": 468.80313, "r": 266.25885, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "1", "bbox": {"l": 306.37213, "t": 468.80313, "r": 308.34052, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "2", "bbox": {"l": 345.51526, "t": 468.80313, "r": 347.48364, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "4", "bbox": {"l": 356.55634, "t": 468.80313, "r": 358.52472, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "1", "bbox": {"l": 367.62582, "t": 468.80313, "r": 369.59418, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "1", "bbox": {"l": 382.66107, "t": 468.80313, "r": 384.62946, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "416", "bbox": {"l": 200.64, "t": 473.68185, "r": 206.51694, "b": 476.41788, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "4", "bbox": {"l": 264.29047, "t": 473.68185, "r": 266.25885, "b": 476.41788, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "230", "bbox": {"l": 200.64, "t": 478.53214, "r": 206.51694, "b": 481.26816, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "1", "bbox": {"l": 243.26373, "t": 478.53214, "r": 245.2321, "b": 481.26816, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "9", "bbox": {"l": 264.29047, "t": 478.53214, "r": 266.25885, "b": 481.26816, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "1", "bbox": {"l": 323.40466, "t": 478.53214, "r": 325.37305, "b": 481.26816, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "1", "bbox": {"l": 397.72519, "t": 478.53214, "r": 399.69354, "b": 481.26816, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "276", "bbox": {"l": 200.64, "t": 483.41086, "r": 206.51694, "b": 486.14688, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "2", "bbox": {"l": 382.66132, "t": 483.41086, "r": 384.61563, "b": 486.14688, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "12", "bbox": {"l": 397.72513, "t": 483.41086, "r": 401.64819, "b": 486.14688, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "1", "bbox": {"l": 412.78928, "t": 483.41086, "r": 414.74359, "b": 486.14688, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "320", "bbox": {"l": 200.64014, "t": 488.28958, "r": 207.14445, "b": 491.0256, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "1", "bbox": {"l": 367.62616, "t": 488.28958, "r": 369.78375, "b": 491.0256, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "4", "bbox": {"l": 382.66141, "t": 488.28958, "r": 384.81897, "b": 491.0256, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "20", "bbox": {"l": 397.7251, "t": 488.28958, "r": 402.05087, "b": 491.0256, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "2013", "bbox": {"l": 200.64032, "t": 493.1683, "r": 208.48566, "b": 495.90433, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "3", "bbox": {"l": 264.29044, "t": 493.1683, "r": 266.25879, "b": 495.90433, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "\u03bc", "bbox": {"l": 227.91466, "t": 665.82603, "r": 230.10028, "b": 675.3464, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "\u2265", "bbox": {"l": 300.58057, "t": 683.62195, "r": 302.72638, "b": 693.428658, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 7, "label": "page_header", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 143.97887, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8309906721115112, "cells": [{"id": 0, "text": "10", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 143.97887, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "page_header", "bbox": {"l": 167.82053, "t": 93.77099999999996, "r": 231.72049000000004, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8367074728012085, "cells": [{"id": 1, "text": "M.", "bbox": {"l": 167.82053, "t": 93.77099999999996, "r": 178.08249, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37929, "t": 93.77099999999996, "r": 231.72049000000004, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "caption", "bbox": {"l": 134.765, "t": 115.83618000000001, "r": 480.59357000000006, "b": 145.88666, "coord_origin": "TOPLEFT"}, "confidence": 0.9512290954589844, "cells": [{"id": 3, "text": "Table 2.", "bbox": {"l": 134.765, "t": 115.83618000000001, "r": 173.09366, "b": 123.76251000000002, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "TSR and cell detection results compared between OTSL and HTML on", "bbox": {"l": 181.30299, "t": 115.89899000000003, "r": 480.59151999999995, "b": 123.96868999999992, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "the PubTabNet [22], FinTabNet [21] and PubTables-1M [14] data sets using Table-", "bbox": {"l": 134.765, "t": 126.85797000000014, "r": 480.59357000000006, "b": 134.92767000000003, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Former [9] (with enc=6, dec=6, heads=8).", "bbox": {"l": 134.765, "t": 137.81696, "r": 305.95691, "b": 145.88666, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "table", "bbox": {"l": 143.63763427734375, "t": 156.34771728515625, "r": 470.8485107421875, "b": 263.2624816894531, "coord_origin": "TOPLEFT"}, "confidence": 0.9884640574455261, "cells": [{"id": 7, "text": "Data set", "bbox": {"l": 160.782, "t": 166.55895999999996, "r": 194.99779, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Language", "bbox": {"l": 215.52499000000003, "t": 166.534, "r": 254.04465, "b": 174.6037, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "TEDs", "bbox": {"l": 300.397, "t": 161.07898, "r": 323.99118, "b": 169.14868, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "mAP(0.75)", "bbox": {"l": 370.345, "t": 166.55895999999996, "r": 414.74661, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Inference", "bbox": {"l": 426.737, "t": 161.07898, "r": 463.10830999999996, "b": 169.14868, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "time (secs)", "bbox": {"l": 423.11401, "t": 172.03796, "r": 466.72656, "b": 180.10766999999998, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "simple", "bbox": {"l": 262.41299, "t": 174.03101000000004, "r": 288.0596, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "complex", "bbox": {"l": 296.42899, "t": 174.03101000000004, "r": 329.44687, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "all", "bbox": {"l": 345.03299, "t": 174.03101000000004, "r": 354.75793, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "PubTabNet", "bbox": {"l": 154.53799, "t": 192.85999000000004, "r": 201.24129, "b": 200.92969000000005, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "OTSL", "bbox": {"l": 222.43700000000004, "t": 187.38098000000002, "r": 247.13226000000003, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "0.965", "bbox": {"l": 264.74399, "t": 187.38098000000002, "r": 285.73074, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "0.934", "bbox": {"l": 302.444, "t": 187.38098000000002, "r": 323.43076, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "0.955", "bbox": {"l": 339.40302, "t": 187.38098000000002, "r": 360.38977, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "0.88", "bbox": {"l": 383.116, "t": 187.31817999999998, "r": 401.97324, "b": 195.24451, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "2.73", "bbox": {"l": 435.49300999999997, "t": 187.31817999999998, "r": 454.35025, "b": 195.24451, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "HTML", "bbox": {"l": 220.903, "t": 200.33196999999996, "r": 248.66655999999998, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "0.969", "bbox": {"l": 264.74399, "t": 200.33196999999996, "r": 285.73074, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "0.927", "bbox": {"l": 302.444, "t": 200.33196999999996, "r": 323.43076, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "0.955", "bbox": {"l": 339.40302, "t": 200.33196999999996, "r": 360.38977, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "0.857", "bbox": {"l": 382.052, "t": 200.33196999999996, "r": 403.03876, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "5.39", "bbox": {"l": 436.73199000000005, "t": 200.33196999999996, "r": 453.11182, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "FinTabNet", "bbox": {"l": 155.94501, "t": 219.16198999999995, "r": 199.83374, "b": 227.23168999999996, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "OTSL", "bbox": {"l": 222.43700000000004, "t": 213.68201, "r": 247.13226000000003, "b": 221.75171, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "0.955", "bbox": {"l": 264.74399, "t": 213.68201, "r": 285.73074, "b": 221.75171, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "0.961", "bbox": {"l": 302.444, "t": 213.68201, "r": 323.43076, "b": 221.75171, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "0.959", "bbox": {"l": 337.815, "t": 213.61919999999998, "r": 361.97586, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "0.862", "bbox": {"l": 380.46399, "t": 213.61919999999998, "r": 404.62485, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "1.85", "bbox": {"l": 435.49300999999997, "t": 213.61919999999998, "r": 454.35025, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "HTML", "bbox": {"l": 220.903, "t": 226.63396999999998, "r": 248.66655999999998, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "0.917", "bbox": {"l": 264.74399, "t": 226.63396999999998, "r": 285.73074, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "0.922", "bbox": {"l": 302.444, "t": 226.63396999999998, "r": 323.43076, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "0.92", "bbox": {"l": 341.70599, "t": 226.63396999999998, "r": 358.08582, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "0.722", "bbox": {"l": 382.052, "t": 226.63396999999998, "r": 403.03876, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "3.26", "bbox": {"l": 436.73199000000005, "t": 226.63396999999998, "r": 453.11182, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "PubTables-1M", "bbox": {"l": 148.62601, "t": 245.46294999999998, "r": 207.1524, "b": 253.53265, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "OTSL", "bbox": {"l": 222.43700000000004, "t": 239.98297000000002, "r": 247.13226000000003, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "0.987", "bbox": {"l": 264.74399, "t": 239.98297000000002, "r": 285.73074, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "0.964", "bbox": {"l": 302.444, "t": 239.98297000000002, "r": 323.43076, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "0.977", "bbox": {"l": 337.815, "t": 239.92016999999998, "r": 361.97586, "b": 247.8465, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "0.896", "bbox": {"l": 380.46399, "t": 239.92016999999998, "r": 404.62485, "b": 247.8465, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "1.79", "bbox": {"l": 435.49300999999997, "t": 239.92016999999998, "r": 454.35025, "b": 247.8465, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "HTML", "bbox": {"l": 220.903, "t": 252.93499999999995, "r": 248.66655999999998, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "0.983", "bbox": {"l": 264.74399, "t": 252.93499999999995, "r": 285.73074, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "0.944", "bbox": {"l": 302.444, "t": 252.93499999999995, "r": 323.43076, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "0.966", "bbox": {"l": 339.40302, "t": 252.93499999999995, "r": 360.38977, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "0.889", "bbox": {"l": 382.052, "t": 252.93499999999995, "r": 403.03876, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "3.26", "bbox": {"l": 436.73199000000005, "t": 252.93499999999995, "r": 453.11182, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": [{"id": 8, "label": "text", "bbox": {"l": 160.782, "t": 166.55895999999996, "r": 194.99779, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "Data set", "bbox": {"l": 160.782, "t": 166.55895999999996, "r": 194.99779, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 215.52499000000003, "t": 166.534, "r": 254.04465, "b": 174.6037, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "Language", "bbox": {"l": 215.52499000000003, "t": 166.534, "r": 254.04465, "b": 174.6037, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "text", "bbox": {"l": 300.397, "t": 161.07898, "r": 323.99118, "b": 169.14868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "TEDs", "bbox": {"l": 300.397, "t": 161.07898, "r": 323.99118, "b": 169.14868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 370.345, "t": 166.55895999999996, "r": 414.74661, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "mAP(0.75)", "bbox": {"l": 370.345, "t": 166.55895999999996, "r": 414.74661, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 426.737, "t": 161.07898, "r": 463.10830999999996, "b": 169.14868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "Inference", "bbox": {"l": 426.737, "t": 161.07898, "r": 463.10830999999996, "b": 169.14868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 423.11401, "t": 172.03796, "r": 466.72656, "b": 180.10766999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "time (secs)", "bbox": {"l": 423.11401, "t": 172.03796, "r": 466.72656, "b": 180.10766999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 262.41299, "t": 174.03101000000004, "r": 288.0596, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "simple", "bbox": {"l": 262.41299, "t": 174.03101000000004, "r": 288.0596, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 296.42899, "t": 174.03101000000004, "r": 329.44687, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "complex", "bbox": {"l": 296.42899, "t": 174.03101000000004, "r": 329.44687, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 345.03299, "t": 174.03101000000004, "r": 354.75793, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "all", "bbox": {"l": 345.03299, "t": 174.03101000000004, "r": 354.75793, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 154.53799, "t": 192.85999000000004, "r": 201.24129, "b": 200.92969000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "PubTabNet", "bbox": {"l": 154.53799, "t": 192.85999000000004, "r": 201.24129, "b": 200.92969000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 222.43700000000004, "t": 187.38098000000002, "r": 247.13226000000003, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "OTSL", "bbox": {"l": 222.43700000000004, "t": 187.38098000000002, "r": 247.13226000000003, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 264.74399, "t": 187.38098000000002, "r": 285.73074, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "0.965", "bbox": {"l": 264.74399, "t": 187.38098000000002, "r": 285.73074, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 302.444, "t": 187.38098000000002, "r": 323.43076, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "0.934", "bbox": {"l": 302.444, "t": 187.38098000000002, "r": 323.43076, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 339.40302, "t": 187.38098000000002, "r": 360.38977, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "0.955", "bbox": {"l": 339.40302, "t": 187.38098000000002, "r": 360.38977, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 383.116, "t": 187.31817999999998, "r": 401.97324, "b": 195.24451, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "0.88", "bbox": {"l": 383.116, "t": 187.31817999999998, "r": 401.97324, "b": 195.24451, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 435.49300999999997, "t": 187.31817999999998, "r": 454.35025, "b": 195.24451, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "2.73", "bbox": {"l": 435.49300999999997, "t": 187.31817999999998, "r": 454.35025, "b": 195.24451, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 220.903, "t": 200.33196999999996, "r": 248.66655999999998, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "HTML", "bbox": {"l": 220.903, "t": 200.33196999999996, "r": 248.66655999999998, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 264.74399, "t": 200.33196999999996, "r": 285.73074, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "0.969", "bbox": {"l": 264.74399, "t": 200.33196999999996, "r": 285.73074, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 302.444, "t": 200.33196999999996, "r": 323.43076, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "0.927", "bbox": {"l": 302.444, "t": 200.33196999999996, "r": 323.43076, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 339.40302, "t": 200.33196999999996, "r": 360.38977, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "0.955", "bbox": {"l": 339.40302, "t": 200.33196999999996, "r": 360.38977, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 382.052, "t": 200.33196999999996, "r": 403.03876, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "0.857", "bbox": {"l": 382.052, "t": 200.33196999999996, "r": 403.03876, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 436.73199000000005, "t": 200.33196999999996, "r": 453.11182, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "5.39", "bbox": {"l": 436.73199000000005, "t": 200.33196999999996, "r": 453.11182, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 155.94501, "t": 219.16198999999995, "r": 199.83374, "b": 227.23168999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "FinTabNet", "bbox": {"l": 155.94501, "t": 219.16198999999995, "r": 199.83374, "b": 227.23168999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 222.43700000000004, "t": 213.68201, "r": 247.13226000000003, "b": 221.75171, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "OTSL", "bbox": {"l": 222.43700000000004, "t": 213.68201, "r": 247.13226000000003, "b": 221.75171, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 264.74399, "t": 213.68201, "r": 285.73074, "b": 221.75171, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "0.955", "bbox": {"l": 264.74399, "t": 213.68201, "r": 285.73074, "b": 221.75171, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 302.444, "t": 213.68201, "r": 323.43076, "b": 221.75171, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "0.961", "bbox": {"l": 302.444, "t": 213.68201, "r": 323.43076, "b": 221.75171, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 337.815, "t": 213.61919999999998, "r": 361.97586, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "0.959", "bbox": {"l": 337.815, "t": 213.61919999999998, "r": 361.97586, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 380.46399, "t": 213.61919999999998, "r": 404.62485, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "0.862", "bbox": {"l": 380.46399, "t": 213.61919999999998, "r": 404.62485, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 435.49300999999997, "t": 213.61919999999998, "r": 454.35025, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "1.85", "bbox": {"l": 435.49300999999997, "t": 213.61919999999998, "r": 454.35025, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 220.903, "t": 226.63396999999998, "r": 248.66655999999998, "b": 234.70367, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "HTML", "bbox": {"l": 220.903, "t": 226.63396999999998, "r": 248.66655999999998, "b": 234.70367, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 264.74399, "t": 226.63396999999998, "r": 285.73074, "b": 234.70367, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "0.917", "bbox": {"l": 264.74399, "t": 226.63396999999998, "r": 285.73074, "b": 234.70367, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 302.444, "t": 226.63396999999998, "r": 323.43076, "b": 234.70367, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "0.922", "bbox": {"l": 302.444, "t": 226.63396999999998, "r": 323.43076, "b": 234.70367, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 341.70599, "t": 226.63396999999998, "r": 358.08582, "b": 234.70367, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "0.92", "bbox": {"l": 341.70599, "t": 226.63396999999998, "r": 358.08582, "b": 234.70367, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 382.052, "t": 226.63396999999998, "r": 403.03876, "b": 234.70367, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "0.722", "bbox": {"l": 382.052, "t": 226.63396999999998, "r": 403.03876, "b": 234.70367, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 436.73199000000005, "t": 226.63396999999998, "r": 453.11182, "b": 234.70367, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "3.26", "bbox": {"l": 436.73199000000005, "t": 226.63396999999998, "r": 453.11182, "b": 234.70367, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 148.62601, "t": 245.46294999999998, "r": 207.1524, "b": 253.53265, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "PubTables-1M", "bbox": {"l": 148.62601, "t": 245.46294999999998, "r": 207.1524, "b": 253.53265, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 222.43700000000004, "t": 239.98297000000002, "r": 247.13226000000003, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "OTSL", "bbox": {"l": 222.43700000000004, "t": 239.98297000000002, "r": 247.13226000000003, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 264.74399, "t": 239.98297000000002, "r": 285.73074, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "0.987", "bbox": {"l": 264.74399, "t": 239.98297000000002, "r": 285.73074, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 302.444, "t": 239.98297000000002, "r": 323.43076, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "0.964", "bbox": {"l": 302.444, "t": 239.98297000000002, "r": 323.43076, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 337.815, "t": 239.92016999999998, "r": 361.97586, "b": 247.8465, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "0.977", "bbox": {"l": 337.815, "t": 239.92016999999998, "r": 361.97586, "b": 247.8465, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 380.46399, "t": 239.92016999999998, "r": 404.62485, "b": 247.8465, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "0.896", "bbox": {"l": 380.46399, "t": 239.92016999999998, "r": 404.62485, "b": 247.8465, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 435.49300999999997, "t": 239.92016999999998, "r": 454.35025, "b": 247.8465, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "1.79", "bbox": {"l": 435.49300999999997, "t": 239.92016999999998, "r": 454.35025, "b": 247.8465, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 220.903, "t": 252.93499999999995, "r": 248.66655999999998, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "HTML", "bbox": {"l": 220.903, "t": 252.93499999999995, "r": 248.66655999999998, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 264.74399, "t": 252.93499999999995, "r": 285.73074, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "0.983", "bbox": {"l": 264.74399, "t": 252.93499999999995, "r": 285.73074, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 302.444, "t": 252.93499999999995, "r": 323.43076, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "0.944", "bbox": {"l": 302.444, "t": 252.93499999999995, "r": 323.43076, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 339.40302, "t": 252.93499999999995, "r": 360.38977, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "0.966", "bbox": {"l": 339.40302, "t": 252.93499999999995, "r": 360.38977, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 382.052, "t": 252.93499999999995, "r": 403.03876, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "0.889", "bbox": {"l": 382.052, "t": 252.93499999999995, "r": 403.03876, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 436.73199000000005, "t": 252.93499999999995, "r": 453.11182, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "3.26", "bbox": {"l": 436.73199000000005, "t": 252.93499999999995, "r": 453.11182, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 3, "label": "section_header", "bbox": {"l": 134.765, "t": 288.91479, "r": 257.08679, "b": 297.72173999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9546447992324829, "cells": [{"id": 55, "text": "5.3", "bbox": {"l": 134.765, "t": 288.91479, "r": 149.40205, "b": 297.72173999999995, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Qualitative Results", "bbox": {"l": 160.85904, "t": 288.91479, "r": 257.08679, "b": 297.72173999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 134.765, "t": 309.86078, "r": 480.58981, "b": 366.47769, "coord_origin": "TOPLEFT"}, "confidence": 0.9834085702896118, "cells": [{"id": 57, "text": "To illustrate the qualitative differences between OTSL and HTML, Figure 5", "bbox": {"l": 134.765, "t": 309.86078, "r": 480.58777, "b": 318.65775, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "demonstrates less overlap and more accurate bounding boxes with OTSL. In", "bbox": {"l": 134.765, "t": 321.81577, "r": 480.58889999999997, "b": 330.61273, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Figure 6, OTSL proves to be more effective in handling tables with longer to-", "bbox": {"l": 134.765, "t": 333.77075, "r": 480.58681999999993, "b": 342.56772, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "ken sequences, resulting in even more precise structure prediction and bounding", "bbox": {"l": 134.765, "t": 345.72574, "r": 480.58981, "b": 354.52271, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "boxes.", "bbox": {"l": 134.765, "t": 357.68073, "r": 161.65704, "b": 366.47769, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "caption", "bbox": {"l": 134.765, "t": 397.59012, "r": 480.59106, "b": 439.71716, "coord_origin": "TOPLEFT"}, "confidence": 0.948272705078125, "cells": [{"id": 62, "text": "Fig. 5.", "bbox": {"l": 134.765, "t": 397.59012, "r": 162.64424, "b": 405.51642, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "The OTSL model produces more accurate bounding boxes with less over-", "bbox": {"l": 167.384, "t": 397.65289, "r": 480.59106, "b": 405.72266, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "lap (E) than the HTML model (D), when predicting the structure of a sparse ta-", "bbox": {"l": 134.765, "t": 408.61190999999997, "r": 480.59106, "b": 416.68167000000005, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "ble (A), at twice the inference speed because of shorter sequence length (B),(C).", "bbox": {"l": 134.765, "t": 419.57089, "r": 480.58838000000003, "b": 427.64066, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "\"PMC2807444_006_00.png\" PubTabNet.", "bbox": {"l": 134.765, "t": 430.52987999999993, "r": 304.69171, "b": 438.59964, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "\u03bc", "bbox": {"l": 342.63354, "t": 430.19678, "r": 344.81915, "b": 439.71716, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "picture", "bbox": {"l": 162.67430114746094, "t": 444.62255859375, "r": 451.70062255859375, "b": 663.2135620117188, "coord_origin": "TOPLEFT"}, "confidence": 0.9742383360862732, "cells": [{"id": 67, "text": "<table>", "bbox": {"l": 180.12473, "t": 516.2332200000001, "r": 190.62042, "b": 518.94992, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "<tr><td></td><td colspan=\"4\"></td><td colspan=\"6\"></td><td colspan=\"3\"></td></tr>", "bbox": {"l": 183.2438, "t": 520.13208, "r": 304.54797, "b": 522.84879, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 524.03094, "r": 388.42313, "b": 526.74765, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 527.9297799999999, "r": 388.42313, "b": 530.64648, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 531.82861, "r": 388.42313, "b": 534.54532, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 535.72748, "r": 388.42313, "b": 538.44418, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 539.62631, "r": 388.42313, "b": 542.34303, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 543.52516, "r": 388.42313, "b": 546.24188, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 547.42401, "r": 388.42313, "b": 550.14073, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 551.32286, "r": 388.42313, "b": 554.03958, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "</table>", "bbox": {"l": 180.12473, "t": 555.22173, "r": 191.86806, "b": 557.93845, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "C", "bbox": {"l": 407.38348, "t": 518.30042, "r": 408.82025, "b": 521.01712, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "C L L L C L L L L L C L L NL", "bbox": {"l": 410.25699, "t": 518.30042, "r": 450.48605, "b": 521.01712, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "C", "bbox": {"l": 407.38348, "t": 522.19925, "r": 408.82025, "b": 524.9159500000001, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 522.19925, "r": 450.48605, "b": 524.9159500000001, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "C", "bbox": {"l": 407.38348, "t": 526.09808, "r": 408.82025, "b": 528.81479, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 526.09808, "r": 450.48605, "b": 528.81479, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "C", "bbox": {"l": 407.38348, "t": 529.99695, "r": 408.82025, "b": 532.7136499999999, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 529.99695, "r": 450.48605, "b": 532.7136499999999, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "C", "bbox": {"l": 407.38348, "t": 533.8957800000001, "r": 408.82025, "b": 536.6125, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 533.8957800000001, "r": 450.48605, "b": 536.6125, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "C", "bbox": {"l": 407.38348, "t": 537.79463, "r": 408.82025, "b": 540.51135, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 537.79463, "r": 450.48605, "b": 540.51135, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "C", "bbox": {"l": 407.38348, "t": 541.69348, "r": 408.82025, "b": 544.4102, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 541.69348, "r": 450.48605, "b": 544.4102, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "C", "bbox": {"l": 407.38348, "t": 545.59233, "r": 408.82025, "b": 548.3090500000001, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 545.59233, "r": 450.48605, "b": 548.3090500000001, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "C", "bbox": {"l": 407.38348, "t": 549.4911999999999, "r": 408.82025, "b": 552.2079200000001, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 549.4911999999999, "r": 450.48605, "b": 552.2079200000001, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "HTML", "bbox": {"l": 164.52881, "t": 509.45859, "r": 181.8528, "b": 515.31, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "#", "bbox": {"l": 183.58441, "t": 509.45859, "r": 186.3974, "b": 515.31, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "tokens:", "bbox": {"l": 189.2104, "t": 509.45859, "r": 208.90137, "b": 515.31, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "258", "bbox": {"l": 210.63269, "t": 509.45859, "r": 221.04044, "b": 515.31, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "OTSL", "bbox": {"l": 390.20203, "t": 509.60361, "r": 406.83609, "b": 515.45502, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "#", "bbox": {"l": 408.56952, "t": 509.60361, "r": 411.38251, "b": 515.45502, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "tokens:", "bbox": {"l": 414.1955, "t": 509.60361, "r": 433.88647000000003, "b": 515.45502, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "135", "bbox": {"l": 435.61737, "t": 509.60361, "r": 446.02512, "b": 515.45502, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "B", "bbox": {"l": 167.19316, "t": 519.07236, "r": 172.8231, "b": 526.3866, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "A", "bbox": {"l": 187.33745, "t": 448.62485, "r": 192.96739, "b": 455.93909, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "D", "bbox": {"l": 167.38654, "t": 566.0051599999999, "r": 173.01648, "b": 573.3194, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "E", "bbox": {"l": 248.45621000000003, "t": 621.78008, "r": 253.65727, "b": 629.09431, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "C", "bbox": {"l": 395.90057, "t": 519.19946, "r": 401.53052, "b": 526.5137, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "HTML", "bbox": {"l": 171.62886, "t": 580.28853, "r": 177.48148, "b": 597.26784, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "OTSL", "bbox": {"l": 251.05969000000002, "t": 633.63408, "r": 256.91235, "b": 649.92345, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "HTML model shows", "bbox": {"l": 372.14645, "t": 601.45724, "r": 427.0379, "b": 607.30864, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "bounding box drifting", "bbox": {"l": 372.14645, "t": 607.89948, "r": 430.06838999999997, "b": 613.75087, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "OTSL model shows", "bbox": {"l": 176.88042, "t": 642.87209, "r": 231.08191, "b": 648.72348, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "clean bounding box", "bbox": {"l": 176.88042, "t": 649.3143, "r": 230.99271000000002, "b": 655.1657, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "alignment", "bbox": {"l": 176.88042, "t": 655.7565500000001, "r": 203.93219, "b": 661.60794, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "\u2264", "bbox": {"l": 215.93231000000003, "t": 557.56342, "r": 218.4697, "b": 569.15967, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "\u03bc", "bbox": {"l": 229.05689999999998, "t": 557.56342, "r": 231.71908999999997, "b": 569.15967, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "S", "bbox": {"l": 261.20892, "t": 448.46124, "r": 263.56973, "b": 451.19727, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "I", "bbox": {"l": 312.33463, "t": 448.46124, "r": 313.6362, "b": 451.19727, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "R", "bbox": {"l": 377.41125, "t": 448.46124, "r": 380.05737, "b": 451.19727, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "ST", "bbox": {"l": 200.63976, "t": 453.33997, "r": 205.82492, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "0.03", "bbox": {"l": 222.20833000000002, "t": 453.33997, "r": 229.76836, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "0.06", "bbox": {"l": 243.26666, "t": 453.33997, "r": 250.82669, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "0.12", "bbox": {"l": 264.29657, "t": 453.33997, "r": 271.84949, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "0.25", "bbox": {"l": 285.31943, "t": 453.33997, "r": 292.87946, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "0.5", "bbox": {"l": 306.37775, "t": 453.33997, "r": 311.77319, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "1", "bbox": {"l": 323.41699, "t": 453.33997, "r": 325.58157, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "2", "bbox": {"l": 334.45807, "t": 453.33997, "r": 336.62265, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "4", "bbox": {"l": 345.52756, "t": 453.33997, "r": 347.69214, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "8", "bbox": {"l": 356.56863, "t": 453.33997, "r": 358.73322, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "16", "bbox": {"l": 367.63812, "t": 453.33997, "r": 371.97089, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "32", "bbox": {"l": 382.6734, "t": 453.33997, "r": 387.00616, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "64", "bbox": {"l": 397.73727, "t": 453.33997, "r": 402.07001, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "\u2265", "bbox": {"l": 412.78879, "t": 447.99298, "r": 414.93463, "b": 457.79964999999993, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": " 128", "bbox": {"l": 414.95697, "t": 453.33997, "r": 422.51746, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "63", "bbox": {"l": 200.63998, "t": 463.92444, "r": 204.57674, "b": 466.66043, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "1", "bbox": {"l": 367.62604, "t": 463.92444, "r": 369.58032, "b": 466.66043, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "1", "bbox": {"l": 382.66132, "t": 463.92444, "r": 384.6156, "b": 466.66043, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "3", "bbox": {"l": 397.72504, "t": 463.92444, "r": 399.67932, "b": 466.66043, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "199", "bbox": {"l": 200.64, "t": 468.80313, "r": 206.51694, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "5", "bbox": {"l": 264.29047, "t": 468.80313, "r": 266.25885, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "1", "bbox": {"l": 306.37213, "t": 468.80313, "r": 308.34052, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "2", "bbox": {"l": 345.51526, "t": 468.80313, "r": 347.48364, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "4", "bbox": {"l": 356.55634, "t": 468.80313, "r": 358.52472, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "1", "bbox": {"l": 367.62582, "t": 468.80313, "r": 369.59418, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "1", "bbox": {"l": 382.66107, "t": 468.80313, "r": 384.62946, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "416", "bbox": {"l": 200.64, "t": 473.68185, "r": 206.51694, "b": 476.41788, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "4", "bbox": {"l": 264.29047, "t": 473.68185, "r": 266.25885, "b": 476.41788, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "230", "bbox": {"l": 200.64, "t": 478.53214, "r": 206.51694, "b": 481.26816, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "1", "bbox": {"l": 243.26373, "t": 478.53214, "r": 245.2321, "b": 481.26816, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "9", "bbox": {"l": 264.29047, "t": 478.53214, "r": 266.25885, "b": 481.26816, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "1", "bbox": {"l": 323.40466, "t": 478.53214, "r": 325.37305, "b": 481.26816, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "1", "bbox": {"l": 397.72519, "t": 478.53214, "r": 399.69354, "b": 481.26816, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "276", "bbox": {"l": 200.64, "t": 483.41086, "r": 206.51694, "b": 486.14688, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "2", "bbox": {"l": 382.66132, "t": 483.41086, "r": 384.61563, "b": 486.14688, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "12", "bbox": {"l": 397.72513, "t": 483.41086, "r": 401.64819, "b": 486.14688, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "1", "bbox": {"l": 412.78928, "t": 483.41086, "r": 414.74359, "b": 486.14688, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "320", "bbox": {"l": 200.64014, "t": 488.28958, "r": 207.14445, "b": 491.0256, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "1", "bbox": {"l": 367.62616, "t": 488.28958, "r": 369.78375, "b": 491.0256, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "4", "bbox": {"l": 382.66141, "t": 488.28958, "r": 384.81897, "b": 491.0256, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "20", "bbox": {"l": 397.7251, "t": 488.28958, "r": 402.05087, "b": 491.0256, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "2013", "bbox": {"l": 200.64032, "t": 493.1683, "r": 208.48566, "b": 495.90433, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "3", "bbox": {"l": 264.29044, "t": 493.1683, "r": 266.25879, "b": 495.90433, "coord_origin": "TOPLEFT"}}], "children": [{"id": 56, "label": "text", "bbox": {"l": 180.12473, "t": 516.2332200000001, "r": 190.62042, "b": 518.94992, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "<table>", "bbox": {"l": 180.12473, "t": 516.2332200000001, "r": 190.62042, "b": 518.94992, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 183.2438, "t": 520.13208, "r": 304.54797, "b": 522.84879, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "<tr><td></td><td colspan=\"4\"></td><td colspan=\"6\"></td><td colspan=\"3\"></td></tr>", "bbox": {"l": 183.2438, "t": 520.13208, "r": 304.54797, "b": 522.84879, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 183.2438, "t": 524.03094, "r": 388.42313, "b": 526.74765, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 524.03094, "r": 388.42313, "b": 526.74765, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 183.2438, "t": 527.9297799999999, "r": 388.42313, "b": 530.64648, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 527.9297799999999, "r": 388.42313, "b": 530.64648, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 183.2438, "t": 531.82861, "r": 388.42313, "b": 534.54532, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 531.82861, "r": 388.42313, "b": 534.54532, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 183.2438, "t": 535.72748, "r": 388.42313, "b": 538.44418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 535.72748, "r": 388.42313, "b": 538.44418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 183.2438, "t": 539.62631, "r": 388.42313, "b": 542.34303, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 539.62631, "r": 388.42313, "b": 542.34303, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 183.2438, "t": 543.52516, "r": 388.42313, "b": 546.24188, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 543.52516, "r": 388.42313, "b": 546.24188, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 183.2438, "t": 547.42401, "r": 388.42313, "b": 550.14073, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 547.42401, "r": 388.42313, "b": 550.14073, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 183.2438, "t": 551.32286, "r": 388.42313, "b": 554.03958, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 551.32286, "r": 388.42313, "b": 554.03958, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 180.12473, "t": 555.22173, "r": 191.86806, "b": 557.93845, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "</table>", "bbox": {"l": 180.12473, "t": 555.22173, "r": 191.86806, "b": 557.93845, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 407.38348, "t": 518.30042, "r": 408.82025, "b": 521.01712, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "C", "bbox": {"l": 407.38348, "t": 518.30042, "r": 408.82025, "b": 521.01712, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 410.25699, "t": 518.30042, "r": 450.48605, "b": 521.01712, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "C L L L C L L L L L C L L NL", "bbox": {"l": 410.25699, "t": 518.30042, "r": 450.48605, "b": 521.01712, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 407.38348, "t": 522.19925, "r": 408.82025, "b": 524.9159500000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "C", "bbox": {"l": 407.38348, "t": 522.19925, "r": 408.82025, "b": 524.9159500000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 410.25699, "t": 522.19925, "r": 450.48605, "b": 524.9159500000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 522.19925, "r": 450.48605, "b": 524.9159500000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 407.38348, "t": 526.09808, "r": 408.82025, "b": 528.81479, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "C", "bbox": {"l": 407.38348, "t": 526.09808, "r": 408.82025, "b": 528.81479, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 410.25699, "t": 526.09808, "r": 450.48605, "b": 528.81479, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 526.09808, "r": 450.48605, "b": 528.81479, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 407.38348, "t": 529.99695, "r": 408.82025, "b": 532.7136499999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "C", "bbox": {"l": 407.38348, "t": 529.99695, "r": 408.82025, "b": 532.7136499999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 410.25699, "t": 529.99695, "r": 450.48605, "b": 532.7136499999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 529.99695, "r": 450.48605, "b": 532.7136499999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 407.38348, "t": 533.8957800000001, "r": 408.82025, "b": 536.6125, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "C", "bbox": {"l": 407.38348, "t": 533.8957800000001, "r": 408.82025, "b": 536.6125, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 410.25699, "t": 533.8957800000001, "r": 450.48605, "b": 536.6125, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 533.8957800000001, "r": 450.48605, "b": 536.6125, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 407.38348, "t": 537.79463, "r": 408.82025, "b": 540.51135, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "C", "bbox": {"l": 407.38348, "t": 537.79463, "r": 408.82025, "b": 540.51135, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 410.25699, "t": 537.79463, "r": 450.48605, "b": 540.51135, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 537.79463, "r": 450.48605, "b": 540.51135, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 407.38348, "t": 541.69348, "r": 408.82025, "b": 544.4102, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "C", "bbox": {"l": 407.38348, "t": 541.69348, "r": 408.82025, "b": 544.4102, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 410.25699, "t": 541.69348, "r": 450.48605, "b": 544.4102, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 541.69348, "r": 450.48605, "b": 544.4102, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 407.38348, "t": 545.59233, "r": 408.82025, "b": 548.3090500000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "C", "bbox": {"l": 407.38348, "t": 545.59233, "r": 408.82025, "b": 548.3090500000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 410.25699, "t": 545.59233, "r": 450.48605, "b": 548.3090500000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 545.59233, "r": 450.48605, "b": 548.3090500000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 407.38348, "t": 549.4911999999999, "r": 408.82025, "b": 552.2079200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "C", "bbox": {"l": 407.38348, "t": 549.4911999999999, "r": 408.82025, "b": 552.2079200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 410.25699, "t": 549.4911999999999, "r": 450.48605, "b": 552.2079200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 549.4911999999999, "r": 450.48605, "b": 552.2079200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 164.52881, "t": 509.45859, "r": 181.8528, "b": 515.31, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "HTML", "bbox": {"l": 164.52881, "t": 509.45859, "r": 181.8528, "b": 515.31, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 183.58441, "t": 509.45859, "r": 186.3974, "b": 515.31, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "#", "bbox": {"l": 183.58441, "t": 509.45859, "r": 186.3974, "b": 515.31, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 189.2104, "t": 509.45859, "r": 208.90137, "b": 515.31, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "tokens:", "bbox": {"l": 189.2104, "t": 509.45859, "r": 208.90137, "b": 515.31, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 210.63269, "t": 509.45859, "r": 221.04044, "b": 515.31, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "258", "bbox": {"l": 210.63269, "t": 509.45859, "r": 221.04044, "b": 515.31, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 390.20203, "t": 509.60361, "r": 406.83609, "b": 515.45502, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "OTSL", "bbox": {"l": 390.20203, "t": 509.60361, "r": 406.83609, "b": 515.45502, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 408.56952, "t": 509.60361, "r": 411.38251, "b": 515.45502, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "#", "bbox": {"l": 408.56952, "t": 509.60361, "r": 411.38251, "b": 515.45502, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 414.1955, "t": 509.60361, "r": 433.88647000000003, "b": 515.45502, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "tokens:", "bbox": {"l": 414.1955, "t": 509.60361, "r": 433.88647000000003, "b": 515.45502, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 435.61737, "t": 509.60361, "r": 446.02512, "b": 515.45502, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": "135", "bbox": {"l": 435.61737, "t": 509.60361, "r": 446.02512, "b": 515.45502, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 167.19316, "t": 519.07236, "r": 172.8231, "b": 526.3866, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "B", "bbox": {"l": 167.19316, "t": 519.07236, "r": 172.8231, "b": 526.3866, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 187.33745, "t": 448.62485, "r": 192.96739, "b": 455.93909, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "A", "bbox": {"l": 187.33745, "t": 448.62485, "r": 192.96739, "b": 455.93909, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 167.38654, "t": 566.0051599999999, "r": 173.01648, "b": 573.3194, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": "D", "bbox": {"l": 167.38654, "t": 566.0051599999999, "r": 173.01648, "b": 573.3194, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 248.45621000000003, "t": 621.78008, "r": 253.65727, "b": 629.09431, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 107, "text": "E", "bbox": {"l": 248.45621000000003, "t": 621.78008, "r": 253.65727, "b": 629.09431, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 395.90057, "t": 519.19946, "r": 401.53052, "b": 526.5137, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 108, "text": "C", "bbox": {"l": 395.90057, "t": 519.19946, "r": 401.53052, "b": 526.5137, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 171.62886, "t": 580.28853, "r": 177.48148, "b": 597.26784, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 109, "text": "HTML", "bbox": {"l": 171.62886, "t": 580.28853, "r": 177.48148, "b": 597.26784, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 251.05969000000002, "t": 633.63408, "r": 256.91235, "b": 649.92345, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 110, "text": "OTSL", "bbox": {"l": 251.05969000000002, "t": 633.63408, "r": 256.91235, "b": 649.92345, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 372.14645, "t": 601.45724, "r": 427.0379, "b": 607.30864, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 111, "text": "HTML model shows", "bbox": {"l": 372.14645, "t": 601.45724, "r": 427.0379, "b": 607.30864, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 372.14645, "t": 607.89948, "r": 430.06838999999997, "b": 613.75087, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 112, "text": "bounding box drifting", "bbox": {"l": 372.14645, "t": 607.89948, "r": 430.06838999999997, "b": 613.75087, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 176.88042, "t": 642.87209, "r": 231.08191, "b": 648.72348, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 113, "text": "OTSL model shows", "bbox": {"l": 176.88042, "t": 642.87209, "r": 231.08191, "b": 648.72348, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 176.88042, "t": 649.3143, "r": 230.99271000000002, "b": 655.1657, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 114, "text": "clean bounding box", "bbox": {"l": 176.88042, "t": 649.3143, "r": 230.99271000000002, "b": 655.1657, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 176.88042, "t": 655.7565500000001, "r": 203.93219, "b": 661.60794, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 115, "text": "alignment", "bbox": {"l": 176.88042, "t": 655.7565500000001, "r": 203.93219, "b": 661.60794, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 215.93231000000003, "t": 557.56342, "r": 218.4697, "b": 569.15967, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 116, "text": "\u2264", "bbox": {"l": 215.93231000000003, "t": 557.56342, "r": 218.4697, "b": 569.15967, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 229.05689999999998, "t": 557.56342, "r": 231.71908999999997, "b": 569.15967, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 117, "text": "\u03bc", "bbox": {"l": 229.05689999999998, "t": 557.56342, "r": 231.71908999999997, "b": 569.15967, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 261.20892, "t": 448.46124, "r": 263.56973, "b": 451.19727, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 119, "text": "S", "bbox": {"l": 261.20892, "t": 448.46124, "r": 263.56973, "b": 451.19727, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 312.33463, "t": 448.46124, "r": 313.6362, "b": 451.19727, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 120, "text": "I", "bbox": {"l": 312.33463, "t": 448.46124, "r": 313.6362, "b": 451.19727, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 377.41125, "t": 448.46124, "r": 380.05737, "b": 451.19727, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 121, "text": "R", "bbox": {"l": 377.41125, "t": 448.46124, "r": 380.05737, "b": 451.19727, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 200.63976, "t": 453.33997, "r": 205.82492, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 122, "text": "ST", "bbox": {"l": 200.63976, "t": 453.33997, "r": 205.82492, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 222.20833000000002, "t": 453.33997, "r": 229.76836, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 123, "text": "0.03", "bbox": {"l": 222.20833000000002, "t": 453.33997, "r": 229.76836, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 243.26666, "t": 453.33997, "r": 250.82669, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 124, "text": "0.06", "bbox": {"l": 243.26666, "t": 453.33997, "r": 250.82669, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 264.29657, "t": 453.33997, "r": 271.84949, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 125, "text": "0.12", "bbox": {"l": 264.29657, "t": 453.33997, "r": 271.84949, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 114, "label": "text", "bbox": {"l": 285.31943, "t": 453.33997, "r": 292.87946, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 126, "text": "0.25", "bbox": {"l": 285.31943, "t": 453.33997, "r": 292.87946, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 115, "label": "text", "bbox": {"l": 306.37775, "t": 453.33997, "r": 311.77319, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 127, "text": "0.5", "bbox": {"l": 306.37775, "t": 453.33997, "r": 311.77319, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 116, "label": "text", "bbox": {"l": 323.41699, "t": 453.33997, "r": 325.58157, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 128, "text": "1", "bbox": {"l": 323.41699, "t": 453.33997, "r": 325.58157, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 117, "label": "text", "bbox": {"l": 334.45807, "t": 453.33997, "r": 336.62265, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 129, "text": "2", "bbox": {"l": 334.45807, "t": 453.33997, "r": 336.62265, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 118, "label": "text", "bbox": {"l": 345.52756, "t": 453.33997, "r": 347.69214, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 130, "text": "4", "bbox": {"l": 345.52756, "t": 453.33997, "r": 347.69214, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 119, "label": "text", "bbox": {"l": 356.56863, "t": 453.33997, "r": 358.73322, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 131, "text": "8", "bbox": {"l": 356.56863, "t": 453.33997, "r": 358.73322, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 120, "label": "text", "bbox": {"l": 367.63812, "t": 453.33997, "r": 371.97089, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 132, "text": "16", "bbox": {"l": 367.63812, "t": 453.33997, "r": 371.97089, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 121, "label": "text", "bbox": {"l": 382.6734, "t": 453.33997, "r": 387.00616, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 133, "text": "32", "bbox": {"l": 382.6734, "t": 453.33997, "r": 387.00616, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 122, "label": "text", "bbox": {"l": 397.73727, "t": 453.33997, "r": 402.07001, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 134, "text": "64", "bbox": {"l": 397.73727, "t": 453.33997, "r": 402.07001, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 123, "label": "text", "bbox": {"l": 412.78879, "t": 447.99298, "r": 414.93463, "b": 457.79964999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 135, "text": "\u2265", "bbox": {"l": 412.78879, "t": 447.99298, "r": 414.93463, "b": 457.79964999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 124, "label": "text", "bbox": {"l": 414.95697, "t": 453.33997, "r": 422.51746, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 136, "text": " 128", "bbox": {"l": 414.95697, "t": 453.33997, "r": 422.51746, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 125, "label": "text", "bbox": {"l": 200.63998, "t": 463.92444, "r": 204.57674, "b": 466.66043, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 137, "text": "63", "bbox": {"l": 200.63998, "t": 463.92444, "r": 204.57674, "b": 466.66043, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 126, "label": "text", "bbox": {"l": 367.62604, "t": 463.92444, "r": 369.58032, "b": 466.66043, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 138, "text": "1", "bbox": {"l": 367.62604, "t": 463.92444, "r": 369.58032, "b": 466.66043, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 127, "label": "text", "bbox": {"l": 382.66132, "t": 463.92444, "r": 384.6156, "b": 466.66043, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 139, "text": "1", "bbox": {"l": 382.66132, "t": 463.92444, "r": 384.6156, "b": 466.66043, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 128, "label": "text", "bbox": {"l": 397.72504, "t": 463.92444, "r": 399.67932, "b": 466.66043, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 140, "text": "3", "bbox": {"l": 397.72504, "t": 463.92444, "r": 399.67932, "b": 466.66043, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 129, "label": "text", "bbox": {"l": 200.64, "t": 468.80313, "r": 206.51694, "b": 471.53915, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 141, "text": "199", "bbox": {"l": 200.64, "t": 468.80313, "r": 206.51694, "b": 471.53915, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 130, "label": "text", "bbox": {"l": 264.29047, "t": 468.80313, "r": 266.25885, "b": 471.53915, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 142, "text": "5", "bbox": {"l": 264.29047, "t": 468.80313, "r": 266.25885, "b": 471.53915, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 131, "label": "text", "bbox": {"l": 306.37213, "t": 468.80313, "r": 308.34052, "b": 471.53915, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 143, "text": "1", "bbox": {"l": 306.37213, "t": 468.80313, "r": 308.34052, "b": 471.53915, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 132, "label": "text", "bbox": {"l": 345.51526, "t": 468.80313, "r": 347.48364, "b": 471.53915, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 144, "text": "2", "bbox": {"l": 345.51526, "t": 468.80313, "r": 347.48364, "b": 471.53915, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 133, "label": "text", "bbox": {"l": 356.55634, "t": 468.80313, "r": 358.52472, "b": 471.53915, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 145, "text": "4", "bbox": {"l": 356.55634, "t": 468.80313, "r": 358.52472, "b": 471.53915, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 134, "label": "text", "bbox": {"l": 367.62582, "t": 468.80313, "r": 369.59418, "b": 471.53915, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 146, "text": "1", "bbox": {"l": 367.62582, "t": 468.80313, "r": 369.59418, "b": 471.53915, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 135, "label": "text", "bbox": {"l": 382.66107, "t": 468.80313, "r": 384.62946, "b": 471.53915, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 147, "text": "1", "bbox": {"l": 382.66107, "t": 468.80313, "r": 384.62946, "b": 471.53915, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 136, "label": "text", "bbox": {"l": 200.64, "t": 473.68185, "r": 206.51694, "b": 476.41788, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 148, "text": "416", "bbox": {"l": 200.64, "t": 473.68185, "r": 206.51694, "b": 476.41788, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 137, "label": "text", "bbox": {"l": 264.29047, "t": 473.68185, "r": 266.25885, "b": 476.41788, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 149, "text": "4", "bbox": {"l": 264.29047, "t": 473.68185, "r": 266.25885, "b": 476.41788, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 138, "label": "text", "bbox": {"l": 200.64, "t": 478.53214, "r": 206.51694, "b": 481.26816, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 150, "text": "230", "bbox": {"l": 200.64, "t": 478.53214, "r": 206.51694, "b": 481.26816, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 139, "label": "text", "bbox": {"l": 243.26373, "t": 478.53214, "r": 245.2321, "b": 481.26816, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 151, "text": "1", "bbox": {"l": 243.26373, "t": 478.53214, "r": 245.2321, "b": 481.26816, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 140, "label": "text", "bbox": {"l": 264.29047, "t": 478.53214, "r": 266.25885, "b": 481.26816, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 152, "text": "9", "bbox": {"l": 264.29047, "t": 478.53214, "r": 266.25885, "b": 481.26816, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 141, "label": "text", "bbox": {"l": 323.40466, "t": 478.53214, "r": 325.37305, "b": 481.26816, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 153, "text": "1", "bbox": {"l": 323.40466, "t": 478.53214, "r": 325.37305, "b": 481.26816, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 142, "label": "text", "bbox": {"l": 397.72519, "t": 478.53214, "r": 399.69354, "b": 481.26816, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 154, "text": "1", "bbox": {"l": 397.72519, "t": 478.53214, "r": 399.69354, "b": 481.26816, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 143, "label": "text", "bbox": {"l": 200.64, "t": 483.41086, "r": 206.51694, "b": 486.14688, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 155, "text": "276", "bbox": {"l": 200.64, "t": 483.41086, "r": 206.51694, "b": 486.14688, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 144, "label": "text", "bbox": {"l": 382.66132, "t": 483.41086, "r": 384.61563, "b": 486.14688, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 156, "text": "2", "bbox": {"l": 382.66132, "t": 483.41086, "r": 384.61563, "b": 486.14688, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 145, "label": "text", "bbox": {"l": 397.72513, "t": 483.41086, "r": 401.64819, "b": 486.14688, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 157, "text": "12", "bbox": {"l": 397.72513, "t": 483.41086, "r": 401.64819, "b": 486.14688, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 146, "label": "text", "bbox": {"l": 412.78928, "t": 483.41086, "r": 414.74359, "b": 486.14688, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 158, "text": "1", "bbox": {"l": 412.78928, "t": 483.41086, "r": 414.74359, "b": 486.14688, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 147, "label": "text", "bbox": {"l": 200.64014, "t": 488.28958, "r": 207.14445, "b": 491.0256, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 159, "text": "320", "bbox": {"l": 200.64014, "t": 488.28958, "r": 207.14445, "b": 491.0256, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 148, "label": "text", "bbox": {"l": 367.62616, "t": 488.28958, "r": 369.78375, "b": 491.0256, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 160, "text": "1", "bbox": {"l": 367.62616, "t": 488.28958, "r": 369.78375, "b": 491.0256, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 149, "label": "text", "bbox": {"l": 382.66141, "t": 488.28958, "r": 384.81897, "b": 491.0256, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 161, "text": "4", "bbox": {"l": 382.66141, "t": 488.28958, "r": 384.81897, "b": 491.0256, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 150, "label": "text", "bbox": {"l": 397.7251, "t": 488.28958, "r": 402.05087, "b": 491.0256, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 162, "text": "20", "bbox": {"l": 397.7251, "t": 488.28958, "r": 402.05087, "b": 491.0256, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 151, "label": "text", "bbox": {"l": 200.64032, "t": 493.1683, "r": 208.48566, "b": 495.90433, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 163, "text": "2013", "bbox": {"l": 200.64032, "t": 493.1683, "r": 208.48566, "b": 495.90433, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 152, "label": "text", "bbox": {"l": 264.29044, "t": 493.1683, "r": 266.25879, "b": 495.90433, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 164, "text": "3", "bbox": {"l": 264.29044, "t": 493.1683, "r": 266.25879, "b": 495.90433, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 153, "label": "text", "bbox": {"l": 227.91466, "t": 665.82603, "r": 230.10028, "b": 675.3464, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 165, "text": "\u03bc", "bbox": {"l": 227.91466, "t": 665.82603, "r": 230.10028, "b": 675.3464, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 154, "label": "text", "bbox": {"l": 300.58057, "t": 683.62195, "r": 302.72638, "b": 693.428658, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 166, "text": "\u2265", "bbox": {"l": 300.58057, "t": 683.62195, "r": 302.72638, "b": 693.428658, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {"0": {"label": "table", "id": 0, "page_no": 9, "cluster": {"id": 0, "label": "table", "bbox": {"l": 143.63763427734375, "t": 156.34771728515625, "r": 470.8485107421875, "b": 263.2624816894531, "coord_origin": "TOPLEFT"}, "confidence": 0.9884640574455261, "cells": [{"id": 7, "text": "Data set", "bbox": {"l": 160.782, "t": 166.55895999999996, "r": 194.99779, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Language", "bbox": {"l": 215.52499000000003, "t": 166.534, "r": 254.04465, "b": 174.6037, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "TEDs", "bbox": {"l": 300.397, "t": 161.07898, "r": 323.99118, "b": 169.14868, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "mAP(0.75)", "bbox": {"l": 370.345, "t": 166.55895999999996, "r": 414.74661, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Inference", "bbox": {"l": 426.737, "t": 161.07898, "r": 463.10830999999996, "b": 169.14868, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "time (secs)", "bbox": {"l": 423.11401, "t": 172.03796, "r": 466.72656, "b": 180.10766999999998, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "simple", "bbox": {"l": 262.41299, "t": 174.03101000000004, "r": 288.0596, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "complex", "bbox": {"l": 296.42899, "t": 174.03101000000004, "r": 329.44687, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "all", "bbox": {"l": 345.03299, "t": 174.03101000000004, "r": 354.75793, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "PubTabNet", "bbox": {"l": 154.53799, "t": 192.85999000000004, "r": 201.24129, "b": 200.92969000000005, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "OTSL", "bbox": {"l": 222.43700000000004, "t": 187.38098000000002, "r": 247.13226000000003, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "0.965", "bbox": {"l": 264.74399, "t": 187.38098000000002, "r": 285.73074, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "0.934", "bbox": {"l": 302.444, "t": 187.38098000000002, "r": 323.43076, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "0.955", "bbox": {"l": 339.40302, "t": 187.38098000000002, "r": 360.38977, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "0.88", "bbox": {"l": 383.116, "t": 187.31817999999998, "r": 401.97324, "b": 195.24451, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "2.73", "bbox": {"l": 435.49300999999997, "t": 187.31817999999998, "r": 454.35025, "b": 195.24451, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "HTML", "bbox": {"l": 220.903, "t": 200.33196999999996, "r": 248.66655999999998, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "0.969", "bbox": {"l": 264.74399, "t": 200.33196999999996, "r": 285.73074, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "0.927", "bbox": {"l": 302.444, "t": 200.33196999999996, "r": 323.43076, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "0.955", "bbox": {"l": 339.40302, "t": 200.33196999999996, "r": 360.38977, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "0.857", "bbox": {"l": 382.052, "t": 200.33196999999996, "r": 403.03876, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "5.39", "bbox": {"l": 436.73199000000005, "t": 200.33196999999996, "r": 453.11182, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "FinTabNet", "bbox": {"l": 155.94501, "t": 219.16198999999995, "r": 199.83374, "b": 227.23168999999996, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "OTSL", "bbox": {"l": 222.43700000000004, "t": 213.68201, "r": 247.13226000000003, "b": 221.75171, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "0.955", "bbox": {"l": 264.74399, "t": 213.68201, "r": 285.73074, "b": 221.75171, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "0.961", "bbox": {"l": 302.444, "t": 213.68201, "r": 323.43076, "b": 221.75171, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "0.959", "bbox": {"l": 337.815, "t": 213.61919999999998, "r": 361.97586, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "0.862", "bbox": {"l": 380.46399, "t": 213.61919999999998, "r": 404.62485, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "1.85", "bbox": {"l": 435.49300999999997, "t": 213.61919999999998, "r": 454.35025, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "HTML", "bbox": {"l": 220.903, "t": 226.63396999999998, "r": 248.66655999999998, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "0.917", "bbox": {"l": 264.74399, "t": 226.63396999999998, "r": 285.73074, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "0.922", "bbox": {"l": 302.444, "t": 226.63396999999998, "r": 323.43076, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "0.92", "bbox": {"l": 341.70599, "t": 226.63396999999998, "r": 358.08582, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "0.722", "bbox": {"l": 382.052, "t": 226.63396999999998, "r": 403.03876, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "3.26", "bbox": {"l": 436.73199000000005, "t": 226.63396999999998, "r": 453.11182, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "PubTables-1M", "bbox": {"l": 148.62601, "t": 245.46294999999998, "r": 207.1524, "b": 253.53265, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "OTSL", "bbox": {"l": 222.43700000000004, "t": 239.98297000000002, "r": 247.13226000000003, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "0.987", "bbox": {"l": 264.74399, "t": 239.98297000000002, "r": 285.73074, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "0.964", "bbox": {"l": 302.444, "t": 239.98297000000002, "r": 323.43076, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "0.977", "bbox": {"l": 337.815, "t": 239.92016999999998, "r": 361.97586, "b": 247.8465, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "0.896", "bbox": {"l": 380.46399, "t": 239.92016999999998, "r": 404.62485, "b": 247.8465, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "1.79", "bbox": {"l": 435.49300999999997, "t": 239.92016999999998, "r": 454.35025, "b": 247.8465, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "HTML", "bbox": {"l": 220.903, "t": 252.93499999999995, "r": 248.66655999999998, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "0.983", "bbox": {"l": 264.74399, "t": 252.93499999999995, "r": 285.73074, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "0.944", "bbox": {"l": 302.444, "t": 252.93499999999995, "r": 323.43076, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "0.966", "bbox": {"l": 339.40302, "t": 252.93499999999995, "r": 360.38977, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "0.889", "bbox": {"l": 382.052, "t": 252.93499999999995, "r": 403.03876, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "3.26", "bbox": {"l": 436.73199000000005, "t": 252.93499999999995, "r": 453.11182, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": [{"id": 8, "label": "text", "bbox": {"l": 160.782, "t": 166.55895999999996, "r": 194.99779, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "Data set", "bbox": {"l": 160.782, "t": 166.55895999999996, "r": 194.99779, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 215.52499000000003, "t": 166.534, "r": 254.04465, "b": 174.6037, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "Language", "bbox": {"l": 215.52499000000003, "t": 166.534, "r": 254.04465, "b": 174.6037, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "text", "bbox": {"l": 300.397, "t": 161.07898, "r": 323.99118, "b": 169.14868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "TEDs", "bbox": {"l": 300.397, "t": 161.07898, "r": 323.99118, "b": 169.14868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 370.345, "t": 166.55895999999996, "r": 414.74661, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "mAP(0.75)", "bbox": {"l": 370.345, "t": 166.55895999999996, "r": 414.74661, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 426.737, "t": 161.07898, "r": 463.10830999999996, "b": 169.14868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "Inference", "bbox": {"l": 426.737, "t": 161.07898, "r": 463.10830999999996, "b": 169.14868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 423.11401, "t": 172.03796, "r": 466.72656, "b": 180.10766999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "time (secs)", "bbox": {"l": 423.11401, "t": 172.03796, "r": 466.72656, "b": 180.10766999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 262.41299, "t": 174.03101000000004, "r": 288.0596, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "simple", "bbox": {"l": 262.41299, "t": 174.03101000000004, "r": 288.0596, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 296.42899, "t": 174.03101000000004, "r": 329.44687, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "complex", "bbox": {"l": 296.42899, "t": 174.03101000000004, "r": 329.44687, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 345.03299, "t": 174.03101000000004, "r": 354.75793, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "all", "bbox": {"l": 345.03299, "t": 174.03101000000004, "r": 354.75793, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 154.53799, "t": 192.85999000000004, "r": 201.24129, "b": 200.92969000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "PubTabNet", "bbox": {"l": 154.53799, "t": 192.85999000000004, "r": 201.24129, "b": 200.92969000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 222.43700000000004, "t": 187.38098000000002, "r": 247.13226000000003, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "OTSL", "bbox": {"l": 222.43700000000004, "t": 187.38098000000002, "r": 247.13226000000003, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 264.74399, "t": 187.38098000000002, "r": 285.73074, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "0.965", "bbox": {"l": 264.74399, "t": 187.38098000000002, "r": 285.73074, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 302.444, "t": 187.38098000000002, "r": 323.43076, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "0.934", "bbox": {"l": 302.444, "t": 187.38098000000002, "r": 323.43076, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 339.40302, "t": 187.38098000000002, "r": 360.38977, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "0.955", "bbox": {"l": 339.40302, "t": 187.38098000000002, "r": 360.38977, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 383.116, "t": 187.31817999999998, "r": 401.97324, "b": 195.24451, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "0.88", "bbox": {"l": 383.116, "t": 187.31817999999998, "r": 401.97324, "b": 195.24451, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 435.49300999999997, "t": 187.31817999999998, "r": 454.35025, "b": 195.24451, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "2.73", "bbox": {"l": 435.49300999999997, "t": 187.31817999999998, "r": 454.35025, "b": 195.24451, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 220.903, "t": 200.33196999999996, "r": 248.66655999999998, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "HTML", "bbox": {"l": 220.903, "t": 200.33196999999996, "r": 248.66655999999998, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 264.74399, "t": 200.33196999999996, "r": 285.73074, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "0.969", "bbox": {"l": 264.74399, "t": 200.33196999999996, "r": 285.73074, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 302.444, "t": 200.33196999999996, "r": 323.43076, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "0.927", "bbox": {"l": 302.444, "t": 200.33196999999996, "r": 323.43076, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 339.40302, "t": 200.33196999999996, "r": 360.38977, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "0.955", "bbox": {"l": 339.40302, "t": 200.33196999999996, "r": 360.38977, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 382.052, "t": 200.33196999999996, "r": 403.03876, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "0.857", "bbox": {"l": 382.052, "t": 200.33196999999996, "r": 403.03876, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 436.73199000000005, "t": 200.33196999999996, "r": 453.11182, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "5.39", "bbox": {"l": 436.73199000000005, "t": 200.33196999999996, "r": 453.11182, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 155.94501, "t": 219.16198999999995, "r": 199.83374, "b": 227.23168999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "FinTabNet", "bbox": {"l": 155.94501, "t": 219.16198999999995, "r": 199.83374, "b": 227.23168999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 222.43700000000004, "t": 213.68201, "r": 247.13226000000003, "b": 221.75171, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "OTSL", "bbox": {"l": 222.43700000000004, "t": 213.68201, "r": 247.13226000000003, "b": 221.75171, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 264.74399, "t": 213.68201, "r": 285.73074, "b": 221.75171, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "0.955", "bbox": {"l": 264.74399, "t": 213.68201, "r": 285.73074, "b": 221.75171, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 302.444, "t": 213.68201, "r": 323.43076, "b": 221.75171, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "0.961", "bbox": {"l": 302.444, "t": 213.68201, "r": 323.43076, "b": 221.75171, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 337.815, "t": 213.61919999999998, "r": 361.97586, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "0.959", "bbox": {"l": 337.815, "t": 213.61919999999998, "r": 361.97586, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 380.46399, "t": 213.61919999999998, "r": 404.62485, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "0.862", "bbox": {"l": 380.46399, "t": 213.61919999999998, "r": 404.62485, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 435.49300999999997, "t": 213.61919999999998, "r": 454.35025, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "1.85", "bbox": {"l": 435.49300999999997, "t": 213.61919999999998, "r": 454.35025, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 220.903, "t": 226.63396999999998, "r": 248.66655999999998, "b": 234.70367, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "HTML", "bbox": {"l": 220.903, "t": 226.63396999999998, "r": 248.66655999999998, "b": 234.70367, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 264.74399, "t": 226.63396999999998, "r": 285.73074, "b": 234.70367, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "0.917", "bbox": {"l": 264.74399, "t": 226.63396999999998, "r": 285.73074, "b": 234.70367, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 302.444, "t": 226.63396999999998, "r": 323.43076, "b": 234.70367, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "0.922", "bbox": {"l": 302.444, "t": 226.63396999999998, "r": 323.43076, "b": 234.70367, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 341.70599, "t": 226.63396999999998, "r": 358.08582, "b": 234.70367, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "0.92", "bbox": {"l": 341.70599, "t": 226.63396999999998, "r": 358.08582, "b": 234.70367, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 382.052, "t": 226.63396999999998, "r": 403.03876, "b": 234.70367, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "0.722", "bbox": {"l": 382.052, "t": 226.63396999999998, "r": 403.03876, "b": 234.70367, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 436.73199000000005, "t": 226.63396999999998, "r": 453.11182, "b": 234.70367, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "3.26", "bbox": {"l": 436.73199000000005, "t": 226.63396999999998, "r": 453.11182, "b": 234.70367, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 148.62601, "t": 245.46294999999998, "r": 207.1524, "b": 253.53265, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "PubTables-1M", "bbox": {"l": 148.62601, "t": 245.46294999999998, "r": 207.1524, "b": 253.53265, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 222.43700000000004, "t": 239.98297000000002, "r": 247.13226000000003, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "OTSL", "bbox": {"l": 222.43700000000004, "t": 239.98297000000002, "r": 247.13226000000003, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 264.74399, "t": 239.98297000000002, "r": 285.73074, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "0.987", "bbox": {"l": 264.74399, "t": 239.98297000000002, "r": 285.73074, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 302.444, "t": 239.98297000000002, "r": 323.43076, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "0.964", "bbox": {"l": 302.444, "t": 239.98297000000002, "r": 323.43076, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 337.815, "t": 239.92016999999998, "r": 361.97586, "b": 247.8465, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "0.977", "bbox": {"l": 337.815, "t": 239.92016999999998, "r": 361.97586, "b": 247.8465, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 380.46399, "t": 239.92016999999998, "r": 404.62485, "b": 247.8465, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "0.896", "bbox": {"l": 380.46399, "t": 239.92016999999998, "r": 404.62485, "b": 247.8465, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 435.49300999999997, "t": 239.92016999999998, "r": 454.35025, "b": 247.8465, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "1.79", "bbox": {"l": 435.49300999999997, "t": 239.92016999999998, "r": 454.35025, "b": 247.8465, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 220.903, "t": 252.93499999999995, "r": 248.66655999999998, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "HTML", "bbox": {"l": 220.903, "t": 252.93499999999995, "r": 248.66655999999998, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 264.74399, "t": 252.93499999999995, "r": 285.73074, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "0.983", "bbox": {"l": 264.74399, "t": 252.93499999999995, "r": 285.73074, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 302.444, "t": 252.93499999999995, "r": 323.43076, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "0.944", "bbox": {"l": 302.444, "t": 252.93499999999995, "r": 323.43076, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 339.40302, "t": 252.93499999999995, "r": 360.38977, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "0.966", "bbox": {"l": 339.40302, "t": 252.93499999999995, "r": 360.38977, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 382.052, "t": 252.93499999999995, "r": 403.03876, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "0.889", "bbox": {"l": 382.052, "t": 252.93499999999995, "r": 403.03876, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 436.73199000000005, "t": 252.93499999999995, "r": 453.11182, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "3.26", "bbox": {"l": 436.73199000000005, "t": 252.93499999999995, "r": 453.11182, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "lcel", "lcel", "ched", "ched", "nl", "ched", "ucel", "ched", "ched", "ched", "ucel", "ucel", "nl", "rhed", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 8, "num_cols": 7, "table_cells": [{"bbox": {"l": 215.52499000000003, "t": 166.534, "r": 254.04465, "b": 174.6037, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Language", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 300.397, "t": 161.07898, "r": 323.99118, "b": 169.14868, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 3, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 5, "text": "TEDs", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 370.345, "t": 166.55895999999996, "r": 414.74661, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 2, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "mAP(0.75)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 423.11401, "t": 161.07898, "r": 466.72656, "b": 180.10766999999998, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 2, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "Inference time (secs)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 262.41299, "t": 174.03101000000004, "r": 288.0596, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "simple", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 296.42899, "t": 174.03101000000004, "r": 329.44687, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "complex", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 345.03299, "t": 174.03101000000004, "r": 354.75793, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "all", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 154.53799, "t": 192.85999000000004, "r": 201.24129, "b": 200.92969000000005, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PubTabNet", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 222.43700000000004, "t": 187.38098000000002, "r": 247.13226000000003, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "OTSL", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 264.74399, "t": 187.38098000000002, "r": 285.73074, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.965", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 302.444, "t": 187.38098000000002, "r": 323.43076, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.934", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 339.40302, "t": 187.38098000000002, "r": 360.38977, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.955", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 383.116, "t": 187.31817999999998, "r": 401.97324, "b": 195.24451, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 435.49300999999997, "t": 187.31817999999998, "r": 454.35025, "b": 195.24451, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "2.73", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 220.903, "t": 200.33196999999996, "r": 248.66655999999998, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "HTML", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 264.74399, "t": 200.33196999999996, "r": 285.73074, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.969", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 302.444, "t": 200.33196999999996, "r": 323.43076, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.927", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 339.40302, "t": 200.33196999999996, "r": 360.38977, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.955", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 382.052, "t": 200.33196999999996, "r": 403.03876, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.857", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 436.73199000000005, "t": 200.33196999999996, "r": 453.11182, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "5.39", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 155.94501, "t": 219.16198999999995, "r": 199.83374, "b": 227.23168999999996, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "FinTabNet", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 222.43700000000004, "t": 213.68201, "r": 247.13226000000003, "b": 221.75171, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "OTSL", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 264.74399, "t": 213.68201, "r": 285.73074, "b": 221.75171, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.955", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 302.444, "t": 213.68201, "r": 323.43076, "b": 221.75171, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.961", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 337.815, "t": 213.61919999999998, "r": 361.97586, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.959", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 380.46399, "t": 213.61919999999998, "r": 404.62485, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.862", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 435.49300999999997, "t": 213.61919999999998, "r": 454.35025, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "1.85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 220.903, "t": 226.63396999999998, "r": 248.66655999999998, "b": 234.70367, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "HTML", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 264.74399, "t": 226.63396999999998, "r": 285.73074, "b": 234.70367, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.917", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 302.444, "t": 226.63396999999998, "r": 323.43076, "b": 234.70367, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.922", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 341.70599, "t": 226.63396999999998, "r": 358.08582, "b": 234.70367, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.92", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 382.052, "t": 226.63396999999998, "r": 403.03876, "b": 234.70367, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.722", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 436.73199000000005, "t": 226.63396999999998, "r": 453.11182, "b": 234.70367, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "3.26", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 148.62601, "t": 245.46294999999998, "r": 207.1524, "b": 253.53265, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PubTables-1M", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 222.43700000000004, "t": 239.98297000000002, "r": 247.13226000000003, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "OTSL", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 264.74399, "t": 239.98297000000002, "r": 285.73074, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.987", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 302.444, "t": 239.98297000000002, "r": 323.43076, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.964", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 337.815, "t": 239.92016999999998, "r": 361.97586, "b": 247.8465, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.977", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 380.46399, "t": 239.92016999999998, "r": 404.62485, "b": 247.8465, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.896", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 435.49300999999997, "t": 239.92016999999998, "r": 454.35025, "b": 247.8465, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "1.79", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 220.903, "t": 252.93499999999995, "r": 248.66655999999998, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "HTML", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 264.74399, "t": 252.93499999999995, "r": 285.73074, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.983", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 302.444, "t": 252.93499999999995, "r": 323.43076, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.944", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 339.40302, "t": 252.93499999999995, "r": 360.38977, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.966", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 382.052, "t": 252.93499999999995, "r": 403.03876, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.889", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 436.73199000000005, "t": 252.93499999999995, "r": 453.11182, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "3.26", "column_header": false, "row_header": false, "row_section": false}]}}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_header", "id": 7, "page_no": 9, "cluster": {"id": 7, "label": "page_header", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 143.97887, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8309906721115112, "cells": [{"id": 0, "text": "10", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 143.97887, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "10"}, {"label": "page_header", "id": 6, "page_no": 9, "cluster": {"id": 6, "label": "page_header", "bbox": {"l": 167.82053, "t": 93.77099999999996, "r": 231.72049000000004, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8367074728012085, "cells": [{"id": 1, "text": "M.", "bbox": {"l": 167.82053, "t": 93.77099999999996, "r": 178.08249, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37929, "t": 93.77099999999996, "r": 231.72049000000004, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "M. Lysak, et al."}, {"label": "caption", "id": 4, "page_no": 9, "cluster": {"id": 4, "label": "caption", "bbox": {"l": 134.765, "t": 115.83618000000001, "r": 480.59357000000006, "b": 145.88666, "coord_origin": "TOPLEFT"}, "confidence": 0.9512290954589844, "cells": [{"id": 3, "text": "Table 2.", "bbox": {"l": 134.765, "t": 115.83618000000001, "r": 173.09366, "b": 123.76251000000002, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "TSR and cell detection results compared between OTSL and HTML on", "bbox": {"l": 181.30299, "t": 115.89899000000003, "r": 480.59151999999995, "b": 123.96868999999992, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "the PubTabNet [22], FinTabNet [21] and PubTables-1M [14] data sets using Table-", "bbox": {"l": 134.765, "t": 126.85797000000014, "r": 480.59357000000006, "b": 134.92767000000003, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Former [9] (with enc=6, dec=6, heads=8).", "bbox": {"l": 134.765, "t": 137.81696, "r": 305.95691, "b": 145.88666, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 2. TSR and cell detection results compared between OTSL and HTML on the PubTabNet [22], FinTabNet [21] and PubTables-1M [14] data sets using TableFormer [9] (with enc=6, dec=6, heads=8)."}, {"label": "table", "id": 0, "page_no": 9, "cluster": {"id": 0, "label": "table", "bbox": {"l": 143.63763427734375, "t": 156.34771728515625, "r": 470.8485107421875, "b": 263.2624816894531, "coord_origin": "TOPLEFT"}, "confidence": 0.9884640574455261, "cells": [{"id": 7, "text": "Data set", "bbox": {"l": 160.782, "t": 166.55895999999996, "r": 194.99779, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Language", "bbox": {"l": 215.52499000000003, "t": 166.534, "r": 254.04465, "b": 174.6037, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "TEDs", "bbox": {"l": 300.397, "t": 161.07898, "r": 323.99118, "b": 169.14868, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "mAP(0.75)", "bbox": {"l": 370.345, "t": 166.55895999999996, "r": 414.74661, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Inference", "bbox": {"l": 426.737, "t": 161.07898, "r": 463.10830999999996, "b": 169.14868, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "time (secs)", "bbox": {"l": 423.11401, "t": 172.03796, "r": 466.72656, "b": 180.10766999999998, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "simple", "bbox": {"l": 262.41299, "t": 174.03101000000004, "r": 288.0596, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "complex", "bbox": {"l": 296.42899, "t": 174.03101000000004, "r": 329.44687, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "all", "bbox": {"l": 345.03299, "t": 174.03101000000004, "r": 354.75793, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "PubTabNet", "bbox": {"l": 154.53799, "t": 192.85999000000004, "r": 201.24129, "b": 200.92969000000005, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "OTSL", "bbox": {"l": 222.43700000000004, "t": 187.38098000000002, "r": 247.13226000000003, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "0.965", "bbox": {"l": 264.74399, "t": 187.38098000000002, "r": 285.73074, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "0.934", "bbox": {"l": 302.444, "t": 187.38098000000002, "r": 323.43076, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "0.955", "bbox": {"l": 339.40302, "t": 187.38098000000002, "r": 360.38977, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "0.88", "bbox": {"l": 383.116, "t": 187.31817999999998, "r": 401.97324, "b": 195.24451, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "2.73", "bbox": {"l": 435.49300999999997, "t": 187.31817999999998, "r": 454.35025, "b": 195.24451, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "HTML", "bbox": {"l": 220.903, "t": 200.33196999999996, "r": 248.66655999999998, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "0.969", "bbox": {"l": 264.74399, "t": 200.33196999999996, "r": 285.73074, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "0.927", "bbox": {"l": 302.444, "t": 200.33196999999996, "r": 323.43076, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "0.955", "bbox": {"l": 339.40302, "t": 200.33196999999996, "r": 360.38977, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "0.857", "bbox": {"l": 382.052, "t": 200.33196999999996, "r": 403.03876, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "5.39", "bbox": {"l": 436.73199000000005, "t": 200.33196999999996, "r": 453.11182, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "FinTabNet", "bbox": {"l": 155.94501, "t": 219.16198999999995, "r": 199.83374, "b": 227.23168999999996, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "OTSL", "bbox": {"l": 222.43700000000004, "t": 213.68201, "r": 247.13226000000003, "b": 221.75171, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "0.955", "bbox": {"l": 264.74399, "t": 213.68201, "r": 285.73074, "b": 221.75171, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "0.961", "bbox": {"l": 302.444, "t": 213.68201, "r": 323.43076, "b": 221.75171, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "0.959", "bbox": {"l": 337.815, "t": 213.61919999999998, "r": 361.97586, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "0.862", "bbox": {"l": 380.46399, "t": 213.61919999999998, "r": 404.62485, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "1.85", "bbox": {"l": 435.49300999999997, "t": 213.61919999999998, "r": 454.35025, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "HTML", "bbox": {"l": 220.903, "t": 226.63396999999998, "r": 248.66655999999998, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "0.917", "bbox": {"l": 264.74399, "t": 226.63396999999998, "r": 285.73074, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "0.922", "bbox": {"l": 302.444, "t": 226.63396999999998, "r": 323.43076, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "0.92", "bbox": {"l": 341.70599, "t": 226.63396999999998, "r": 358.08582, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "0.722", "bbox": {"l": 382.052, "t": 226.63396999999998, "r": 403.03876, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "3.26", "bbox": {"l": 436.73199000000005, "t": 226.63396999999998, "r": 453.11182, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "PubTables-1M", "bbox": {"l": 148.62601, "t": 245.46294999999998, "r": 207.1524, "b": 253.53265, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "OTSL", "bbox": {"l": 222.43700000000004, "t": 239.98297000000002, "r": 247.13226000000003, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "0.987", "bbox": {"l": 264.74399, "t": 239.98297000000002, "r": 285.73074, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "0.964", "bbox": {"l": 302.444, "t": 239.98297000000002, "r": 323.43076, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "0.977", "bbox": {"l": 337.815, "t": 239.92016999999998, "r": 361.97586, "b": 247.8465, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "0.896", "bbox": {"l": 380.46399, "t": 239.92016999999998, "r": 404.62485, "b": 247.8465, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "1.79", "bbox": {"l": 435.49300999999997, "t": 239.92016999999998, "r": 454.35025, "b": 247.8465, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "HTML", "bbox": {"l": 220.903, "t": 252.93499999999995, "r": 248.66655999999998, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "0.983", "bbox": {"l": 264.74399, "t": 252.93499999999995, "r": 285.73074, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "0.944", "bbox": {"l": 302.444, "t": 252.93499999999995, "r": 323.43076, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "0.966", "bbox": {"l": 339.40302, "t": 252.93499999999995, "r": 360.38977, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "0.889", "bbox": {"l": 382.052, "t": 252.93499999999995, "r": 403.03876, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "3.26", "bbox": {"l": 436.73199000000005, "t": 252.93499999999995, "r": 453.11182, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": [{"id": 8, "label": "text", "bbox": {"l": 160.782, "t": 166.55895999999996, "r": 194.99779, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "Data set", "bbox": {"l": 160.782, "t": 166.55895999999996, "r": 194.99779, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 215.52499000000003, "t": 166.534, "r": 254.04465, "b": 174.6037, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "Language", "bbox": {"l": 215.52499000000003, "t": 166.534, "r": 254.04465, "b": 174.6037, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "text", "bbox": {"l": 300.397, "t": 161.07898, "r": 323.99118, "b": 169.14868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "TEDs", "bbox": {"l": 300.397, "t": 161.07898, "r": 323.99118, "b": 169.14868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 370.345, "t": 166.55895999999996, "r": 414.74661, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "mAP(0.75)", "bbox": {"l": 370.345, "t": 166.55895999999996, "r": 414.74661, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 426.737, "t": 161.07898, "r": 463.10830999999996, "b": 169.14868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "Inference", "bbox": {"l": 426.737, "t": 161.07898, "r": 463.10830999999996, "b": 169.14868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 423.11401, "t": 172.03796, "r": 466.72656, "b": 180.10766999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "time (secs)", "bbox": {"l": 423.11401, "t": 172.03796, "r": 466.72656, "b": 180.10766999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 262.41299, "t": 174.03101000000004, "r": 288.0596, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "simple", "bbox": {"l": 262.41299, "t": 174.03101000000004, "r": 288.0596, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 296.42899, "t": 174.03101000000004, "r": 329.44687, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "complex", "bbox": {"l": 296.42899, "t": 174.03101000000004, "r": 329.44687, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 345.03299, "t": 174.03101000000004, "r": 354.75793, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "all", "bbox": {"l": 345.03299, "t": 174.03101000000004, "r": 354.75793, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 154.53799, "t": 192.85999000000004, "r": 201.24129, "b": 200.92969000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "PubTabNet", "bbox": {"l": 154.53799, "t": 192.85999000000004, "r": 201.24129, "b": 200.92969000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 222.43700000000004, "t": 187.38098000000002, "r": 247.13226000000003, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "OTSL", "bbox": {"l": 222.43700000000004, "t": 187.38098000000002, "r": 247.13226000000003, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 264.74399, "t": 187.38098000000002, "r": 285.73074, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "0.965", "bbox": {"l": 264.74399, "t": 187.38098000000002, "r": 285.73074, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 302.444, "t": 187.38098000000002, "r": 323.43076, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "0.934", "bbox": {"l": 302.444, "t": 187.38098000000002, "r": 323.43076, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 339.40302, "t": 187.38098000000002, "r": 360.38977, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "0.955", "bbox": {"l": 339.40302, "t": 187.38098000000002, "r": 360.38977, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 383.116, "t": 187.31817999999998, "r": 401.97324, "b": 195.24451, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "0.88", "bbox": {"l": 383.116, "t": 187.31817999999998, "r": 401.97324, "b": 195.24451, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 435.49300999999997, "t": 187.31817999999998, "r": 454.35025, "b": 195.24451, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "2.73", "bbox": {"l": 435.49300999999997, "t": 187.31817999999998, "r": 454.35025, "b": 195.24451, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 220.903, "t": 200.33196999999996, "r": 248.66655999999998, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "HTML", "bbox": {"l": 220.903, "t": 200.33196999999996, "r": 248.66655999999998, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 264.74399, "t": 200.33196999999996, "r": 285.73074, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "0.969", "bbox": {"l": 264.74399, "t": 200.33196999999996, "r": 285.73074, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 302.444, "t": 200.33196999999996, "r": 323.43076, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "0.927", "bbox": {"l": 302.444, "t": 200.33196999999996, "r": 323.43076, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 339.40302, "t": 200.33196999999996, "r": 360.38977, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "0.955", "bbox": {"l": 339.40302, "t": 200.33196999999996, "r": 360.38977, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 382.052, "t": 200.33196999999996, "r": 403.03876, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "0.857", "bbox": {"l": 382.052, "t": 200.33196999999996, "r": 403.03876, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 436.73199000000005, "t": 200.33196999999996, "r": 453.11182, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "5.39", "bbox": {"l": 436.73199000000005, "t": 200.33196999999996, "r": 453.11182, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 155.94501, "t": 219.16198999999995, "r": 199.83374, "b": 227.23168999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "FinTabNet", "bbox": {"l": 155.94501, "t": 219.16198999999995, "r": 199.83374, "b": 227.23168999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 222.43700000000004, "t": 213.68201, "r": 247.13226000000003, "b": 221.75171, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "OTSL", "bbox": {"l": 222.43700000000004, "t": 213.68201, "r": 247.13226000000003, "b": 221.75171, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 264.74399, "t": 213.68201, "r": 285.73074, "b": 221.75171, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "0.955", "bbox": {"l": 264.74399, "t": 213.68201, "r": 285.73074, "b": 221.75171, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 302.444, "t": 213.68201, "r": 323.43076, "b": 221.75171, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "0.961", "bbox": {"l": 302.444, "t": 213.68201, "r": 323.43076, "b": 221.75171, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 337.815, "t": 213.61919999999998, "r": 361.97586, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "0.959", "bbox": {"l": 337.815, "t": 213.61919999999998, "r": 361.97586, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 380.46399, "t": 213.61919999999998, "r": 404.62485, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "0.862", "bbox": {"l": 380.46399, "t": 213.61919999999998, "r": 404.62485, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 435.49300999999997, "t": 213.61919999999998, "r": 454.35025, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "1.85", "bbox": {"l": 435.49300999999997, "t": 213.61919999999998, "r": 454.35025, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 220.903, "t": 226.63396999999998, "r": 248.66655999999998, "b": 234.70367, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "HTML", "bbox": {"l": 220.903, "t": 226.63396999999998, "r": 248.66655999999998, "b": 234.70367, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 264.74399, "t": 226.63396999999998, "r": 285.73074, "b": 234.70367, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "0.917", "bbox": {"l": 264.74399, "t": 226.63396999999998, "r": 285.73074, "b": 234.70367, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 302.444, "t": 226.63396999999998, "r": 323.43076, "b": 234.70367, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "0.922", "bbox": {"l": 302.444, "t": 226.63396999999998, "r": 323.43076, "b": 234.70367, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 341.70599, "t": 226.63396999999998, "r": 358.08582, "b": 234.70367, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "0.92", "bbox": {"l": 341.70599, "t": 226.63396999999998, "r": 358.08582, "b": 234.70367, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 382.052, "t": 226.63396999999998, "r": 403.03876, "b": 234.70367, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "0.722", "bbox": {"l": 382.052, "t": 226.63396999999998, "r": 403.03876, "b": 234.70367, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 436.73199000000005, "t": 226.63396999999998, "r": 453.11182, "b": 234.70367, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "3.26", "bbox": {"l": 436.73199000000005, "t": 226.63396999999998, "r": 453.11182, "b": 234.70367, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 148.62601, "t": 245.46294999999998, "r": 207.1524, "b": 253.53265, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "PubTables-1M", "bbox": {"l": 148.62601, "t": 245.46294999999998, "r": 207.1524, "b": 253.53265, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 222.43700000000004, "t": 239.98297000000002, "r": 247.13226000000003, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "OTSL", "bbox": {"l": 222.43700000000004, "t": 239.98297000000002, "r": 247.13226000000003, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 264.74399, "t": 239.98297000000002, "r": 285.73074, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "0.987", "bbox": {"l": 264.74399, "t": 239.98297000000002, "r": 285.73074, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 302.444, "t": 239.98297000000002, "r": 323.43076, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "0.964", "bbox": {"l": 302.444, "t": 239.98297000000002, "r": 323.43076, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 337.815, "t": 239.92016999999998, "r": 361.97586, "b": 247.8465, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "0.977", "bbox": {"l": 337.815, "t": 239.92016999999998, "r": 361.97586, "b": 247.8465, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 380.46399, "t": 239.92016999999998, "r": 404.62485, "b": 247.8465, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "0.896", "bbox": {"l": 380.46399, "t": 239.92016999999998, "r": 404.62485, "b": 247.8465, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 435.49300999999997, "t": 239.92016999999998, "r": 454.35025, "b": 247.8465, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "1.79", "bbox": {"l": 435.49300999999997, "t": 239.92016999999998, "r": 454.35025, "b": 247.8465, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 220.903, "t": 252.93499999999995, "r": 248.66655999999998, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "HTML", "bbox": {"l": 220.903, "t": 252.93499999999995, "r": 248.66655999999998, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 264.74399, "t": 252.93499999999995, "r": 285.73074, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "0.983", "bbox": {"l": 264.74399, "t": 252.93499999999995, "r": 285.73074, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 302.444, "t": 252.93499999999995, "r": 323.43076, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "0.944", "bbox": {"l": 302.444, "t": 252.93499999999995, "r": 323.43076, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 339.40302, "t": 252.93499999999995, "r": 360.38977, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "0.966", "bbox": {"l": 339.40302, "t": 252.93499999999995, "r": 360.38977, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 382.052, "t": 252.93499999999995, "r": 403.03876, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "0.889", "bbox": {"l": 382.052, "t": 252.93499999999995, "r": 403.03876, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 436.73199000000005, "t": 252.93499999999995, "r": 453.11182, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "3.26", "bbox": {"l": 436.73199000000005, "t": 252.93499999999995, "r": 453.11182, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "lcel", "lcel", "ched", "ched", "nl", "ched", "ucel", "ched", "ched", "ched", "ucel", "ucel", "nl", "rhed", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 8, "num_cols": 7, "table_cells": [{"bbox": {"l": 215.52499000000003, "t": 166.534, "r": 254.04465, "b": 174.6037, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Language", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 300.397, "t": 161.07898, "r": 323.99118, "b": 169.14868, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 3, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 5, "text": "TEDs", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 370.345, "t": 166.55895999999996, "r": 414.74661, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 2, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "mAP(0.75)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 423.11401, "t": 161.07898, "r": 466.72656, "b": 180.10766999999998, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 2, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "Inference time (secs)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 262.41299, "t": 174.03101000000004, "r": 288.0596, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "simple", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 296.42899, "t": 174.03101000000004, "r": 329.44687, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "complex", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 345.03299, "t": 174.03101000000004, "r": 354.75793, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "all", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 154.53799, "t": 192.85999000000004, "r": 201.24129, "b": 200.92969000000005, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PubTabNet", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 222.43700000000004, "t": 187.38098000000002, "r": 247.13226000000003, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "OTSL", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 264.74399, "t": 187.38098000000002, "r": 285.73074, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.965", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 302.444, "t": 187.38098000000002, "r": 323.43076, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.934", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 339.40302, "t": 187.38098000000002, "r": 360.38977, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.955", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 383.116, "t": 187.31817999999998, "r": 401.97324, "b": 195.24451, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 435.49300999999997, "t": 187.31817999999998, "r": 454.35025, "b": 195.24451, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "2.73", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 220.903, "t": 200.33196999999996, "r": 248.66655999999998, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "HTML", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 264.74399, "t": 200.33196999999996, "r": 285.73074, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.969", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 302.444, "t": 200.33196999999996, "r": 323.43076, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.927", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 339.40302, "t": 200.33196999999996, "r": 360.38977, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.955", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 382.052, "t": 200.33196999999996, "r": 403.03876, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.857", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 436.73199000000005, "t": 200.33196999999996, "r": 453.11182, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "5.39", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 155.94501, "t": 219.16198999999995, "r": 199.83374, "b": 227.23168999999996, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "FinTabNet", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 222.43700000000004, "t": 213.68201, "r": 247.13226000000003, "b": 221.75171, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "OTSL", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 264.74399, "t": 213.68201, "r": 285.73074, "b": 221.75171, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.955", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 302.444, "t": 213.68201, "r": 323.43076, "b": 221.75171, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.961", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 337.815, "t": 213.61919999999998, "r": 361.97586, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.959", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 380.46399, "t": 213.61919999999998, "r": 404.62485, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.862", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 435.49300999999997, "t": 213.61919999999998, "r": 454.35025, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "1.85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 220.903, "t": 226.63396999999998, "r": 248.66655999999998, "b": 234.70367, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "HTML", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 264.74399, "t": 226.63396999999998, "r": 285.73074, "b": 234.70367, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.917", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 302.444, "t": 226.63396999999998, "r": 323.43076, "b": 234.70367, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.922", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 341.70599, "t": 226.63396999999998, "r": 358.08582, "b": 234.70367, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.92", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 382.052, "t": 226.63396999999998, "r": 403.03876, "b": 234.70367, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.722", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 436.73199000000005, "t": 226.63396999999998, "r": 453.11182, "b": 234.70367, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "3.26", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 148.62601, "t": 245.46294999999998, "r": 207.1524, "b": 253.53265, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PubTables-1M", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 222.43700000000004, "t": 239.98297000000002, "r": 247.13226000000003, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "OTSL", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 264.74399, "t": 239.98297000000002, "r": 285.73074, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.987", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 302.444, "t": 239.98297000000002, "r": 323.43076, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.964", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 337.815, "t": 239.92016999999998, "r": 361.97586, "b": 247.8465, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.977", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 380.46399, "t": 239.92016999999998, "r": 404.62485, "b": 247.8465, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.896", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 435.49300999999997, "t": 239.92016999999998, "r": 454.35025, "b": 247.8465, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "1.79", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 220.903, "t": 252.93499999999995, "r": 248.66655999999998, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "HTML", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 264.74399, "t": 252.93499999999995, "r": 285.73074, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.983", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 302.444, "t": 252.93499999999995, "r": 323.43076, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.944", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 339.40302, "t": 252.93499999999995, "r": 360.38977, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.966", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 382.052, "t": 252.93499999999995, "r": 403.03876, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.889", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 436.73199000000005, "t": 252.93499999999995, "r": 453.11182, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "3.26", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "section_header", "id": 3, "page_no": 9, "cluster": {"id": 3, "label": "section_header", "bbox": {"l": 134.765, "t": 288.91479, "r": 257.08679, "b": 297.72173999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9546447992324829, "cells": [{"id": 55, "text": "5.3", "bbox": {"l": 134.765, "t": 288.91479, "r": 149.40205, "b": 297.72173999999995, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Qualitative Results", "bbox": {"l": 160.85904, "t": 288.91479, "r": 257.08679, "b": 297.72173999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5.3 Qualitative Results"}, {"label": "text", "id": 1, "page_no": 9, "cluster": {"id": 1, "label": "text", "bbox": {"l": 134.765, "t": 309.86078, "r": 480.58981, "b": 366.47769, "coord_origin": "TOPLEFT"}, "confidence": 0.9834085702896118, "cells": [{"id": 57, "text": "To illustrate the qualitative differences between OTSL and HTML, Figure 5", "bbox": {"l": 134.765, "t": 309.86078, "r": 480.58777, "b": 318.65775, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "demonstrates less overlap and more accurate bounding boxes with OTSL. In", "bbox": {"l": 134.765, "t": 321.81577, "r": 480.58889999999997, "b": 330.61273, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Figure 6, OTSL proves to be more effective in handling tables with longer to-", "bbox": {"l": 134.765, "t": 333.77075, "r": 480.58681999999993, "b": 342.56772, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "ken sequences, resulting in even more precise structure prediction and bounding", "bbox": {"l": 134.765, "t": 345.72574, "r": 480.58981, "b": 354.52271, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "boxes.", "bbox": {"l": 134.765, "t": 357.68073, "r": 161.65704, "b": 366.47769, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "To illustrate the qualitative differences between OTSL and HTML, Figure 5 demonstrates less overlap and more accurate bounding boxes with OTSL. In Figure 6, OTSL proves to be more effective in handling tables with longer token sequences, resulting in even more precise structure prediction and bounding boxes."}, {"label": "caption", "id": 5, "page_no": 9, "cluster": {"id": 5, "label": "caption", "bbox": {"l": 134.765, "t": 397.59012, "r": 480.59106, "b": 439.71716, "coord_origin": "TOPLEFT"}, "confidence": 0.948272705078125, "cells": [{"id": 62, "text": "Fig. 5.", "bbox": {"l": 134.765, "t": 397.59012, "r": 162.64424, "b": 405.51642, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "The OTSL model produces more accurate bounding boxes with less over-", "bbox": {"l": 167.384, "t": 397.65289, "r": 480.59106, "b": 405.72266, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "lap (E) than the HTML model (D), when predicting the structure of a sparse ta-", "bbox": {"l": 134.765, "t": 408.61190999999997, "r": 480.59106, "b": 416.68167000000005, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "ble (A), at twice the inference speed because of shorter sequence length (B),(C).", "bbox": {"l": 134.765, "t": 419.57089, "r": 480.58838000000003, "b": 427.64066, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "\"PMC2807444_006_00.png\" PubTabNet.", "bbox": {"l": 134.765, "t": 430.52987999999993, "r": 304.69171, "b": 438.59964, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "\u03bc", "bbox": {"l": 342.63354, "t": 430.19678, "r": 344.81915, "b": 439.71716, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Fig. 5. The OTSL model produces more accurate bounding boxes with less overlap (E) than the HTML model (D), when predicting the structure of a sparse table (A), at twice the inference speed because of shorter sequence length (B),(C). \"PMC2807444_006_00.png\" PubTabNet. \u03bc"}, {"label": "picture", "id": 2, "page_no": 9, "cluster": {"id": 2, "label": "picture", "bbox": {"l": 162.67430114746094, "t": 444.62255859375, "r": 451.70062255859375, "b": 663.2135620117188, "coord_origin": "TOPLEFT"}, "confidence": 0.9742383360862732, "cells": [{"id": 67, "text": "<table>", "bbox": {"l": 180.12473, "t": 516.2332200000001, "r": 190.62042, "b": 518.94992, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "<tr><td></td><td colspan=\"4\"></td><td colspan=\"6\"></td><td colspan=\"3\"></td></tr>", "bbox": {"l": 183.2438, "t": 520.13208, "r": 304.54797, "b": 522.84879, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 524.03094, "r": 388.42313, "b": 526.74765, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 527.9297799999999, "r": 388.42313, "b": 530.64648, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 531.82861, "r": 388.42313, "b": 534.54532, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 535.72748, "r": 388.42313, "b": 538.44418, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 539.62631, "r": 388.42313, "b": 542.34303, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 543.52516, "r": 388.42313, "b": 546.24188, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 547.42401, "r": 388.42313, "b": 550.14073, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 551.32286, "r": 388.42313, "b": 554.03958, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "</table>", "bbox": {"l": 180.12473, "t": 555.22173, "r": 191.86806, "b": 557.93845, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "C", "bbox": {"l": 407.38348, "t": 518.30042, "r": 408.82025, "b": 521.01712, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "C L L L C L L L L L C L L NL", "bbox": {"l": 410.25699, "t": 518.30042, "r": 450.48605, "b": 521.01712, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "C", "bbox": {"l": 407.38348, "t": 522.19925, "r": 408.82025, "b": 524.9159500000001, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 522.19925, "r": 450.48605, "b": 524.9159500000001, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "C", "bbox": {"l": 407.38348, "t": 526.09808, "r": 408.82025, "b": 528.81479, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 526.09808, "r": 450.48605, "b": 528.81479, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "C", "bbox": {"l": 407.38348, "t": 529.99695, "r": 408.82025, "b": 532.7136499999999, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 529.99695, "r": 450.48605, "b": 532.7136499999999, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "C", "bbox": {"l": 407.38348, "t": 533.8957800000001, "r": 408.82025, "b": 536.6125, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 533.8957800000001, "r": 450.48605, "b": 536.6125, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "C", "bbox": {"l": 407.38348, "t": 537.79463, "r": 408.82025, "b": 540.51135, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 537.79463, "r": 450.48605, "b": 540.51135, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "C", "bbox": {"l": 407.38348, "t": 541.69348, "r": 408.82025, "b": 544.4102, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 541.69348, "r": 450.48605, "b": 544.4102, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "C", "bbox": {"l": 407.38348, "t": 545.59233, "r": 408.82025, "b": 548.3090500000001, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 545.59233, "r": 450.48605, "b": 548.3090500000001, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "C", "bbox": {"l": 407.38348, "t": 549.4911999999999, "r": 408.82025, "b": 552.2079200000001, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 549.4911999999999, "r": 450.48605, "b": 552.2079200000001, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "HTML", "bbox": {"l": 164.52881, "t": 509.45859, "r": 181.8528, "b": 515.31, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "#", "bbox": {"l": 183.58441, "t": 509.45859, "r": 186.3974, "b": 515.31, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "tokens:", "bbox": {"l": 189.2104, "t": 509.45859, "r": 208.90137, "b": 515.31, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "258", "bbox": {"l": 210.63269, "t": 509.45859, "r": 221.04044, "b": 515.31, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "OTSL", "bbox": {"l": 390.20203, "t": 509.60361, "r": 406.83609, "b": 515.45502, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "#", "bbox": {"l": 408.56952, "t": 509.60361, "r": 411.38251, "b": 515.45502, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "tokens:", "bbox": {"l": 414.1955, "t": 509.60361, "r": 433.88647000000003, "b": 515.45502, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "135", "bbox": {"l": 435.61737, "t": 509.60361, "r": 446.02512, "b": 515.45502, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "B", "bbox": {"l": 167.19316, "t": 519.07236, "r": 172.8231, "b": 526.3866, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "A", "bbox": {"l": 187.33745, "t": 448.62485, "r": 192.96739, "b": 455.93909, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "D", "bbox": {"l": 167.38654, "t": 566.0051599999999, "r": 173.01648, "b": 573.3194, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "E", "bbox": {"l": 248.45621000000003, "t": 621.78008, "r": 253.65727, "b": 629.09431, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "C", "bbox": {"l": 395.90057, "t": 519.19946, "r": 401.53052, "b": 526.5137, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "HTML", "bbox": {"l": 171.62886, "t": 580.28853, "r": 177.48148, "b": 597.26784, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "OTSL", "bbox": {"l": 251.05969000000002, "t": 633.63408, "r": 256.91235, "b": 649.92345, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "HTML model shows", "bbox": {"l": 372.14645, "t": 601.45724, "r": 427.0379, "b": 607.30864, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "bounding box drifting", "bbox": {"l": 372.14645, "t": 607.89948, "r": 430.06838999999997, "b": 613.75087, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "OTSL model shows", "bbox": {"l": 176.88042, "t": 642.87209, "r": 231.08191, "b": 648.72348, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "clean bounding box", "bbox": {"l": 176.88042, "t": 649.3143, "r": 230.99271000000002, "b": 655.1657, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "alignment", "bbox": {"l": 176.88042, "t": 655.7565500000001, "r": 203.93219, "b": 661.60794, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "\u2264", "bbox": {"l": 215.93231000000003, "t": 557.56342, "r": 218.4697, "b": 569.15967, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "\u03bc", "bbox": {"l": 229.05689999999998, "t": 557.56342, "r": 231.71908999999997, "b": 569.15967, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "S", "bbox": {"l": 261.20892, "t": 448.46124, "r": 263.56973, "b": 451.19727, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "I", "bbox": {"l": 312.33463, "t": 448.46124, "r": 313.6362, "b": 451.19727, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "R", "bbox": {"l": 377.41125, "t": 448.46124, "r": 380.05737, "b": 451.19727, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "ST", "bbox": {"l": 200.63976, "t": 453.33997, "r": 205.82492, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "0.03", "bbox": {"l": 222.20833000000002, "t": 453.33997, "r": 229.76836, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "0.06", "bbox": {"l": 243.26666, "t": 453.33997, "r": 250.82669, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "0.12", "bbox": {"l": 264.29657, "t": 453.33997, "r": 271.84949, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "0.25", "bbox": {"l": 285.31943, "t": 453.33997, "r": 292.87946, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "0.5", "bbox": {"l": 306.37775, "t": 453.33997, "r": 311.77319, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "1", "bbox": {"l": 323.41699, "t": 453.33997, "r": 325.58157, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "2", "bbox": {"l": 334.45807, "t": 453.33997, "r": 336.62265, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "4", "bbox": {"l": 345.52756, "t": 453.33997, "r": 347.69214, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "8", "bbox": {"l": 356.56863, "t": 453.33997, "r": 358.73322, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "16", "bbox": {"l": 367.63812, "t": 453.33997, "r": 371.97089, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "32", "bbox": {"l": 382.6734, "t": 453.33997, "r": 387.00616, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "64", "bbox": {"l": 397.73727, "t": 453.33997, "r": 402.07001, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "\u2265", "bbox": {"l": 412.78879, "t": 447.99298, "r": 414.93463, "b": 457.79964999999993, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": " 128", "bbox": {"l": 414.95697, "t": 453.33997, "r": 422.51746, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "63", "bbox": {"l": 200.63998, "t": 463.92444, "r": 204.57674, "b": 466.66043, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "1", "bbox": {"l": 367.62604, "t": 463.92444, "r": 369.58032, "b": 466.66043, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "1", "bbox": {"l": 382.66132, "t": 463.92444, "r": 384.6156, "b": 466.66043, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "3", "bbox": {"l": 397.72504, "t": 463.92444, "r": 399.67932, "b": 466.66043, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "199", "bbox": {"l": 200.64, "t": 468.80313, "r": 206.51694, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "5", "bbox": {"l": 264.29047, "t": 468.80313, "r": 266.25885, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "1", "bbox": {"l": 306.37213, "t": 468.80313, "r": 308.34052, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "2", "bbox": {"l": 345.51526, "t": 468.80313, "r": 347.48364, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "4", "bbox": {"l": 356.55634, "t": 468.80313, "r": 358.52472, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "1", "bbox": {"l": 367.62582, "t": 468.80313, "r": 369.59418, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "1", "bbox": {"l": 382.66107, "t": 468.80313, "r": 384.62946, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "416", "bbox": {"l": 200.64, "t": 473.68185, "r": 206.51694, "b": 476.41788, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "4", "bbox": {"l": 264.29047, "t": 473.68185, "r": 266.25885, "b": 476.41788, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "230", "bbox": {"l": 200.64, "t": 478.53214, "r": 206.51694, "b": 481.26816, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "1", "bbox": {"l": 243.26373, "t": 478.53214, "r": 245.2321, "b": 481.26816, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "9", "bbox": {"l": 264.29047, "t": 478.53214, "r": 266.25885, "b": 481.26816, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "1", "bbox": {"l": 323.40466, "t": 478.53214, "r": 325.37305, "b": 481.26816, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "1", "bbox": {"l": 397.72519, "t": 478.53214, "r": 399.69354, "b": 481.26816, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "276", "bbox": {"l": 200.64, "t": 483.41086, "r": 206.51694, "b": 486.14688, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "2", "bbox": {"l": 382.66132, "t": 483.41086, "r": 384.61563, "b": 486.14688, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "12", "bbox": {"l": 397.72513, "t": 483.41086, "r": 401.64819, "b": 486.14688, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "1", "bbox": {"l": 412.78928, "t": 483.41086, "r": 414.74359, "b": 486.14688, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "320", "bbox": {"l": 200.64014, "t": 488.28958, "r": 207.14445, "b": 491.0256, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "1", "bbox": {"l": 367.62616, "t": 488.28958, "r": 369.78375, "b": 491.0256, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "4", "bbox": {"l": 382.66141, "t": 488.28958, "r": 384.81897, "b": 491.0256, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "20", "bbox": {"l": 397.7251, "t": 488.28958, "r": 402.05087, "b": 491.0256, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "2013", "bbox": {"l": 200.64032, "t": 493.1683, "r": 208.48566, "b": 495.90433, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "3", "bbox": {"l": 264.29044, "t": 493.1683, "r": 266.25879, "b": 495.90433, "coord_origin": "TOPLEFT"}}], "children": [{"id": 56, "label": "text", "bbox": {"l": 180.12473, "t": 516.2332200000001, "r": 190.62042, "b": 518.94992, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "<table>", "bbox": {"l": 180.12473, "t": 516.2332200000001, "r": 190.62042, "b": 518.94992, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 183.2438, "t": 520.13208, "r": 304.54797, "b": 522.84879, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "<tr><td></td><td colspan=\"4\"></td><td colspan=\"6\"></td><td colspan=\"3\"></td></tr>", "bbox": {"l": 183.2438, "t": 520.13208, "r": 304.54797, "b": 522.84879, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 183.2438, "t": 524.03094, "r": 388.42313, "b": 526.74765, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 524.03094, "r": 388.42313, "b": 526.74765, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 183.2438, "t": 527.9297799999999, "r": 388.42313, "b": 530.64648, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 527.9297799999999, "r": 388.42313, "b": 530.64648, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 183.2438, "t": 531.82861, "r": 388.42313, "b": 534.54532, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 531.82861, "r": 388.42313, "b": 534.54532, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 183.2438, "t": 535.72748, "r": 388.42313, "b": 538.44418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 535.72748, "r": 388.42313, "b": 538.44418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 183.2438, "t": 539.62631, "r": 388.42313, "b": 542.34303, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 539.62631, "r": 388.42313, "b": 542.34303, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 183.2438, "t": 543.52516, "r": 388.42313, "b": 546.24188, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 543.52516, "r": 388.42313, "b": 546.24188, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 183.2438, "t": 547.42401, "r": 388.42313, "b": 550.14073, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 547.42401, "r": 388.42313, "b": 550.14073, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 183.2438, "t": 551.32286, "r": 388.42313, "b": 554.03958, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 551.32286, "r": 388.42313, "b": 554.03958, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 180.12473, "t": 555.22173, "r": 191.86806, "b": 557.93845, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "</table>", "bbox": {"l": 180.12473, "t": 555.22173, "r": 191.86806, "b": 557.93845, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 407.38348, "t": 518.30042, "r": 408.82025, "b": 521.01712, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "C", "bbox": {"l": 407.38348, "t": 518.30042, "r": 408.82025, "b": 521.01712, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 410.25699, "t": 518.30042, "r": 450.48605, "b": 521.01712, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "C L L L C L L L L L C L L NL", "bbox": {"l": 410.25699, "t": 518.30042, "r": 450.48605, "b": 521.01712, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 407.38348, "t": 522.19925, "r": 408.82025, "b": 524.9159500000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "C", "bbox": {"l": 407.38348, "t": 522.19925, "r": 408.82025, "b": 524.9159500000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 410.25699, "t": 522.19925, "r": 450.48605, "b": 524.9159500000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 522.19925, "r": 450.48605, "b": 524.9159500000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 407.38348, "t": 526.09808, "r": 408.82025, "b": 528.81479, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "C", "bbox": {"l": 407.38348, "t": 526.09808, "r": 408.82025, "b": 528.81479, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 410.25699, "t": 526.09808, "r": 450.48605, "b": 528.81479, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 526.09808, "r": 450.48605, "b": 528.81479, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 407.38348, "t": 529.99695, "r": 408.82025, "b": 532.7136499999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "C", "bbox": {"l": 407.38348, "t": 529.99695, "r": 408.82025, "b": 532.7136499999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 410.25699, "t": 529.99695, "r": 450.48605, "b": 532.7136499999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 529.99695, "r": 450.48605, "b": 532.7136499999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 407.38348, "t": 533.8957800000001, "r": 408.82025, "b": 536.6125, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "C", "bbox": {"l": 407.38348, "t": 533.8957800000001, "r": 408.82025, "b": 536.6125, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 410.25699, "t": 533.8957800000001, "r": 450.48605, "b": 536.6125, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 533.8957800000001, "r": 450.48605, "b": 536.6125, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 407.38348, "t": 537.79463, "r": 408.82025, "b": 540.51135, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "C", "bbox": {"l": 407.38348, "t": 537.79463, "r": 408.82025, "b": 540.51135, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 410.25699, "t": 537.79463, "r": 450.48605, "b": 540.51135, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 537.79463, "r": 450.48605, "b": 540.51135, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 407.38348, "t": 541.69348, "r": 408.82025, "b": 544.4102, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "C", "bbox": {"l": 407.38348, "t": 541.69348, "r": 408.82025, "b": 544.4102, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 410.25699, "t": 541.69348, "r": 450.48605, "b": 544.4102, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 541.69348, "r": 450.48605, "b": 544.4102, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 407.38348, "t": 545.59233, "r": 408.82025, "b": 548.3090500000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "C", "bbox": {"l": 407.38348, "t": 545.59233, "r": 408.82025, "b": 548.3090500000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 410.25699, "t": 545.59233, "r": 450.48605, "b": 548.3090500000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 545.59233, "r": 450.48605, "b": 548.3090500000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 407.38348, "t": 549.4911999999999, "r": 408.82025, "b": 552.2079200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "C", "bbox": {"l": 407.38348, "t": 549.4911999999999, "r": 408.82025, "b": 552.2079200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 410.25699, "t": 549.4911999999999, "r": 450.48605, "b": 552.2079200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 549.4911999999999, "r": 450.48605, "b": 552.2079200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 164.52881, "t": 509.45859, "r": 181.8528, "b": 515.31, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "HTML", "bbox": {"l": 164.52881, "t": 509.45859, "r": 181.8528, "b": 515.31, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 183.58441, "t": 509.45859, "r": 186.3974, "b": 515.31, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "#", "bbox": {"l": 183.58441, "t": 509.45859, "r": 186.3974, "b": 515.31, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 189.2104, "t": 509.45859, "r": 208.90137, "b": 515.31, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "tokens:", "bbox": {"l": 189.2104, "t": 509.45859, "r": 208.90137, "b": 515.31, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 210.63269, "t": 509.45859, "r": 221.04044, "b": 515.31, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "258", "bbox": {"l": 210.63269, "t": 509.45859, "r": 221.04044, "b": 515.31, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 390.20203, "t": 509.60361, "r": 406.83609, "b": 515.45502, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "OTSL", "bbox": {"l": 390.20203, "t": 509.60361, "r": 406.83609, "b": 515.45502, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 408.56952, "t": 509.60361, "r": 411.38251, "b": 515.45502, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "#", "bbox": {"l": 408.56952, "t": 509.60361, "r": 411.38251, "b": 515.45502, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 414.1955, "t": 509.60361, "r": 433.88647000000003, "b": 515.45502, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "tokens:", "bbox": {"l": 414.1955, "t": 509.60361, "r": 433.88647000000003, "b": 515.45502, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 435.61737, "t": 509.60361, "r": 446.02512, "b": 515.45502, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": "135", "bbox": {"l": 435.61737, "t": 509.60361, "r": 446.02512, "b": 515.45502, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 167.19316, "t": 519.07236, "r": 172.8231, "b": 526.3866, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "B", "bbox": {"l": 167.19316, "t": 519.07236, "r": 172.8231, "b": 526.3866, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 187.33745, "t": 448.62485, "r": 192.96739, "b": 455.93909, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "A", "bbox": {"l": 187.33745, "t": 448.62485, "r": 192.96739, "b": 455.93909, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 167.38654, "t": 566.0051599999999, "r": 173.01648, "b": 573.3194, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": "D", "bbox": {"l": 167.38654, "t": 566.0051599999999, "r": 173.01648, "b": 573.3194, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 248.45621000000003, "t": 621.78008, "r": 253.65727, "b": 629.09431, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 107, "text": "E", "bbox": {"l": 248.45621000000003, "t": 621.78008, "r": 253.65727, "b": 629.09431, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 395.90057, "t": 519.19946, "r": 401.53052, "b": 526.5137, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 108, "text": "C", "bbox": {"l": 395.90057, "t": 519.19946, "r": 401.53052, "b": 526.5137, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 171.62886, "t": 580.28853, "r": 177.48148, "b": 597.26784, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 109, "text": "HTML", "bbox": {"l": 171.62886, "t": 580.28853, "r": 177.48148, "b": 597.26784, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 251.05969000000002, "t": 633.63408, "r": 256.91235, "b": 649.92345, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 110, "text": "OTSL", "bbox": {"l": 251.05969000000002, "t": 633.63408, "r": 256.91235, "b": 649.92345, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 372.14645, "t": 601.45724, "r": 427.0379, "b": 607.30864, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 111, "text": "HTML model shows", "bbox": {"l": 372.14645, "t": 601.45724, "r": 427.0379, "b": 607.30864, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 372.14645, "t": 607.89948, "r": 430.06838999999997, "b": 613.75087, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 112, "text": "bounding box drifting", "bbox": {"l": 372.14645, "t": 607.89948, "r": 430.06838999999997, "b": 613.75087, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 176.88042, "t": 642.87209, "r": 231.08191, "b": 648.72348, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 113, "text": "OTSL model shows", "bbox": {"l": 176.88042, "t": 642.87209, "r": 231.08191, "b": 648.72348, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 176.88042, "t": 649.3143, "r": 230.99271000000002, "b": 655.1657, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 114, "text": "clean bounding box", "bbox": {"l": 176.88042, "t": 649.3143, "r": 230.99271000000002, "b": 655.1657, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 176.88042, "t": 655.7565500000001, "r": 203.93219, "b": 661.60794, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 115, "text": "alignment", "bbox": {"l": 176.88042, "t": 655.7565500000001, "r": 203.93219, "b": 661.60794, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 215.93231000000003, "t": 557.56342, "r": 218.4697, "b": 569.15967, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 116, "text": "\u2264", "bbox": {"l": 215.93231000000003, "t": 557.56342, "r": 218.4697, "b": 569.15967, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 229.05689999999998, "t": 557.56342, "r": 231.71908999999997, "b": 569.15967, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 117, "text": "\u03bc", "bbox": {"l": 229.05689999999998, "t": 557.56342, "r": 231.71908999999997, "b": 569.15967, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 261.20892, "t": 448.46124, "r": 263.56973, "b": 451.19727, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 119, "text": "S", "bbox": {"l": 261.20892, "t": 448.46124, "r": 263.56973, "b": 451.19727, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 312.33463, "t": 448.46124, "r": 313.6362, "b": 451.19727, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 120, "text": "I", "bbox": {"l": 312.33463, "t": 448.46124, "r": 313.6362, "b": 451.19727, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 377.41125, "t": 448.46124, "r": 380.05737, "b": 451.19727, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 121, "text": "R", "bbox": {"l": 377.41125, "t": 448.46124, "r": 380.05737, "b": 451.19727, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 200.63976, "t": 453.33997, "r": 205.82492, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 122, "text": "ST", "bbox": {"l": 200.63976, "t": 453.33997, "r": 205.82492, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 222.20833000000002, "t": 453.33997, "r": 229.76836, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 123, "text": "0.03", "bbox": {"l": 222.20833000000002, "t": 453.33997, "r": 229.76836, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 243.26666, "t": 453.33997, "r": 250.82669, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 124, "text": "0.06", "bbox": {"l": 243.26666, "t": 453.33997, "r": 250.82669, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 264.29657, "t": 453.33997, "r": 271.84949, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 125, "text": "0.12", "bbox": {"l": 264.29657, "t": 453.33997, "r": 271.84949, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 114, "label": "text", "bbox": {"l": 285.31943, "t": 453.33997, "r": 292.87946, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 126, "text": "0.25", "bbox": {"l": 285.31943, "t": 453.33997, "r": 292.87946, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 115, "label": "text", "bbox": {"l": 306.37775, "t": 453.33997, "r": 311.77319, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 127, "text": "0.5", "bbox": {"l": 306.37775, "t": 453.33997, "r": 311.77319, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 116, "label": "text", "bbox": {"l": 323.41699, "t": 453.33997, "r": 325.58157, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 128, "text": "1", "bbox": {"l": 323.41699, "t": 453.33997, "r": 325.58157, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 117, "label": "text", "bbox": {"l": 334.45807, "t": 453.33997, "r": 336.62265, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 129, "text": "2", "bbox": {"l": 334.45807, "t": 453.33997, "r": 336.62265, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 118, "label": "text", "bbox": {"l": 345.52756, "t": 453.33997, "r": 347.69214, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 130, "text": "4", "bbox": {"l": 345.52756, "t": 453.33997, "r": 347.69214, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 119, "label": "text", "bbox": {"l": 356.56863, "t": 453.33997, "r": 358.73322, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 131, "text": "8", "bbox": {"l": 356.56863, "t": 453.33997, "r": 358.73322, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 120, "label": "text", "bbox": {"l": 367.63812, "t": 453.33997, "r": 371.97089, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 132, "text": "16", "bbox": {"l": 367.63812, "t": 453.33997, "r": 371.97089, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 121, "label": "text", "bbox": {"l": 382.6734, "t": 453.33997, "r": 387.00616, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 133, "text": "32", "bbox": {"l": 382.6734, "t": 453.33997, "r": 387.00616, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 122, "label": "text", "bbox": {"l": 397.73727, "t": 453.33997, "r": 402.07001, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 134, "text": "64", "bbox": {"l": 397.73727, "t": 453.33997, "r": 402.07001, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 123, "label": "text", "bbox": {"l": 412.78879, "t": 447.99298, "r": 414.93463, "b": 457.79964999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 135, "text": "\u2265", "bbox": {"l": 412.78879, "t": 447.99298, "r": 414.93463, "b": 457.79964999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 124, "label": "text", "bbox": {"l": 414.95697, "t": 453.33997, "r": 422.51746, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 136, "text": " 128", "bbox": {"l": 414.95697, "t": 453.33997, "r": 422.51746, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 125, "label": "text", "bbox": {"l": 200.63998, "t": 463.92444, "r": 204.57674, "b": 466.66043, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 137, "text": "63", "bbox": {"l": 200.63998, "t": 463.92444, "r": 204.57674, "b": 466.66043, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 126, "label": "text", "bbox": {"l": 367.62604, "t": 463.92444, "r": 369.58032, "b": 466.66043, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 138, "text": "1", "bbox": {"l": 367.62604, "t": 463.92444, "r": 369.58032, "b": 466.66043, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 127, "label": "text", "bbox": {"l": 382.66132, "t": 463.92444, "r": 384.6156, "b": 466.66043, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 139, "text": "1", "bbox": {"l": 382.66132, "t": 463.92444, "r": 384.6156, "b": 466.66043, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 128, "label": "text", "bbox": {"l": 397.72504, "t": 463.92444, "r": 399.67932, "b": 466.66043, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 140, "text": "3", "bbox": {"l": 397.72504, "t": 463.92444, "r": 399.67932, "b": 466.66043, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 129, "label": "text", "bbox": {"l": 200.64, "t": 468.80313, "r": 206.51694, "b": 471.53915, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 141, "text": "199", "bbox": {"l": 200.64, "t": 468.80313, "r": 206.51694, "b": 471.53915, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 130, "label": "text", "bbox": {"l": 264.29047, "t": 468.80313, "r": 266.25885, "b": 471.53915, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 142, "text": "5", "bbox": {"l": 264.29047, "t": 468.80313, "r": 266.25885, "b": 471.53915, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 131, "label": "text", "bbox": {"l": 306.37213, "t": 468.80313, "r": 308.34052, "b": 471.53915, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 143, "text": "1", "bbox": {"l": 306.37213, "t": 468.80313, "r": 308.34052, "b": 471.53915, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 132, "label": "text", "bbox": {"l": 345.51526, "t": 468.80313, "r": 347.48364, "b": 471.53915, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 144, "text": "2", "bbox": {"l": 345.51526, "t": 468.80313, "r": 347.48364, "b": 471.53915, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 133, "label": "text", "bbox": {"l": 356.55634, "t": 468.80313, "r": 358.52472, "b": 471.53915, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 145, "text": "4", "bbox": {"l": 356.55634, "t": 468.80313, "r": 358.52472, "b": 471.53915, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 134, "label": "text", "bbox": {"l": 367.62582, "t": 468.80313, "r": 369.59418, "b": 471.53915, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 146, "text": "1", "bbox": {"l": 367.62582, "t": 468.80313, "r": 369.59418, "b": 471.53915, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 135, "label": "text", "bbox": {"l": 382.66107, "t": 468.80313, "r": 384.62946, "b": 471.53915, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 147, "text": "1", "bbox": {"l": 382.66107, "t": 468.80313, "r": 384.62946, "b": 471.53915, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 136, "label": "text", "bbox": {"l": 200.64, "t": 473.68185, "r": 206.51694, "b": 476.41788, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 148, "text": "416", "bbox": {"l": 200.64, "t": 473.68185, "r": 206.51694, "b": 476.41788, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 137, "label": "text", "bbox": {"l": 264.29047, "t": 473.68185, "r": 266.25885, "b": 476.41788, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 149, "text": "4", "bbox": {"l": 264.29047, "t": 473.68185, "r": 266.25885, "b": 476.41788, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 138, "label": "text", "bbox": {"l": 200.64, "t": 478.53214, "r": 206.51694, "b": 481.26816, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 150, "text": "230", "bbox": {"l": 200.64, "t": 478.53214, "r": 206.51694, "b": 481.26816, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 139, "label": "text", "bbox": {"l": 243.26373, "t": 478.53214, "r": 245.2321, "b": 481.26816, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 151, "text": "1", "bbox": {"l": 243.26373, "t": 478.53214, "r": 245.2321, "b": 481.26816, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 140, "label": "text", "bbox": {"l": 264.29047, "t": 478.53214, "r": 266.25885, "b": 481.26816, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 152, "text": "9", "bbox": {"l": 264.29047, "t": 478.53214, "r": 266.25885, "b": 481.26816, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 141, "label": "text", "bbox": {"l": 323.40466, "t": 478.53214, "r": 325.37305, "b": 481.26816, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 153, "text": "1", "bbox": {"l": 323.40466, "t": 478.53214, "r": 325.37305, "b": 481.26816, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 142, "label": "text", "bbox": {"l": 397.72519, "t": 478.53214, "r": 399.69354, "b": 481.26816, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 154, "text": "1", "bbox": {"l": 397.72519, "t": 478.53214, "r": 399.69354, "b": 481.26816, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 143, "label": "text", "bbox": {"l": 200.64, "t": 483.41086, "r": 206.51694, "b": 486.14688, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 155, "text": "276", "bbox": {"l": 200.64, "t": 483.41086, "r": 206.51694, "b": 486.14688, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 144, "label": "text", "bbox": {"l": 382.66132, "t": 483.41086, "r": 384.61563, "b": 486.14688, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 156, "text": "2", "bbox": {"l": 382.66132, "t": 483.41086, "r": 384.61563, "b": 486.14688, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 145, "label": "text", "bbox": {"l": 397.72513, "t": 483.41086, "r": 401.64819, "b": 486.14688, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 157, "text": "12", "bbox": {"l": 397.72513, "t": 483.41086, "r": 401.64819, "b": 486.14688, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 146, "label": "text", "bbox": {"l": 412.78928, "t": 483.41086, "r": 414.74359, "b": 486.14688, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 158, "text": "1", "bbox": {"l": 412.78928, "t": 483.41086, "r": 414.74359, "b": 486.14688, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 147, "label": "text", "bbox": {"l": 200.64014, "t": 488.28958, "r": 207.14445, "b": 491.0256, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 159, "text": "320", "bbox": {"l": 200.64014, "t": 488.28958, "r": 207.14445, "b": 491.0256, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 148, "label": "text", "bbox": {"l": 367.62616, "t": 488.28958, "r": 369.78375, "b": 491.0256, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 160, "text": "1", "bbox": {"l": 367.62616, "t": 488.28958, "r": 369.78375, "b": 491.0256, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 149, "label": "text", "bbox": {"l": 382.66141, "t": 488.28958, "r": 384.81897, "b": 491.0256, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 161, "text": "4", "bbox": {"l": 382.66141, "t": 488.28958, "r": 384.81897, "b": 491.0256, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 150, "label": "text", "bbox": {"l": 397.7251, "t": 488.28958, "r": 402.05087, "b": 491.0256, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 162, "text": "20", "bbox": {"l": 397.7251, "t": 488.28958, "r": 402.05087, "b": 491.0256, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 151, "label": "text", "bbox": {"l": 200.64032, "t": 493.1683, "r": 208.48566, "b": 495.90433, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 163, "text": "2013", "bbox": {"l": 200.64032, "t": 493.1683, "r": 208.48566, "b": 495.90433, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 152, "label": "text", "bbox": {"l": 264.29044, "t": 493.1683, "r": 266.25879, "b": 495.90433, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 164, "text": "3", "bbox": {"l": 264.29044, "t": 493.1683, "r": 266.25879, "b": 495.90433, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "text", "id": 153, "page_no": 9, "cluster": {"id": 153, "label": "text", "bbox": {"l": 227.91466, "t": 665.82603, "r": 230.10028, "b": 675.3464, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 165, "text": "\u03bc", "bbox": {"l": 227.91466, "t": 665.82603, "r": 230.10028, "b": 675.3464, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u03bc"}, {"label": "text", "id": 154, "page_no": 9, "cluster": {"id": 154, "label": "text", "bbox": {"l": 300.58057, "t": 683.62195, "r": 302.72638, "b": 693.428658, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 166, "text": "\u2265", "bbox": {"l": 300.58057, "t": 683.62195, "r": 302.72638, "b": 693.428658, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u2265"}], "body": [{"label": "caption", "id": 4, "page_no": 9, "cluster": {"id": 4, "label": "caption", "bbox": {"l": 134.765, "t": 115.83618000000001, "r": 480.59357000000006, "b": 145.88666, "coord_origin": "TOPLEFT"}, "confidence": 0.9512290954589844, "cells": [{"id": 3, "text": "Table 2.", "bbox": {"l": 134.765, "t": 115.83618000000001, "r": 173.09366, "b": 123.76251000000002, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "TSR and cell detection results compared between OTSL and HTML on", "bbox": {"l": 181.30299, "t": 115.89899000000003, "r": 480.59151999999995, "b": 123.96868999999992, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "the PubTabNet [22], FinTabNet [21] and PubTables-1M [14] data sets using Table-", "bbox": {"l": 134.765, "t": 126.85797000000014, "r": 480.59357000000006, "b": 134.92767000000003, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Former [9] (with enc=6, dec=6, heads=8).", "bbox": {"l": 134.765, "t": 137.81696, "r": 305.95691, "b": 145.88666, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 2. TSR and cell detection results compared between OTSL and HTML on the PubTabNet [22], FinTabNet [21] and PubTables-1M [14] data sets using TableFormer [9] (with enc=6, dec=6, heads=8)."}, {"label": "table", "id": 0, "page_no": 9, "cluster": {"id": 0, "label": "table", "bbox": {"l": 143.63763427734375, "t": 156.34771728515625, "r": 470.8485107421875, "b": 263.2624816894531, "coord_origin": "TOPLEFT"}, "confidence": 0.9884640574455261, "cells": [{"id": 7, "text": "Data set", "bbox": {"l": 160.782, "t": 166.55895999999996, "r": 194.99779, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Language", "bbox": {"l": 215.52499000000003, "t": 166.534, "r": 254.04465, "b": 174.6037, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "TEDs", "bbox": {"l": 300.397, "t": 161.07898, "r": 323.99118, "b": 169.14868, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "mAP(0.75)", "bbox": {"l": 370.345, "t": 166.55895999999996, "r": 414.74661, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Inference", "bbox": {"l": 426.737, "t": 161.07898, "r": 463.10830999999996, "b": 169.14868, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "time (secs)", "bbox": {"l": 423.11401, "t": 172.03796, "r": 466.72656, "b": 180.10766999999998, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "simple", "bbox": {"l": 262.41299, "t": 174.03101000000004, "r": 288.0596, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "complex", "bbox": {"l": 296.42899, "t": 174.03101000000004, "r": 329.44687, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "all", "bbox": {"l": 345.03299, "t": 174.03101000000004, "r": 354.75793, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "PubTabNet", "bbox": {"l": 154.53799, "t": 192.85999000000004, "r": 201.24129, "b": 200.92969000000005, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "OTSL", "bbox": {"l": 222.43700000000004, "t": 187.38098000000002, "r": 247.13226000000003, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "0.965", "bbox": {"l": 264.74399, "t": 187.38098000000002, "r": 285.73074, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "0.934", "bbox": {"l": 302.444, "t": 187.38098000000002, "r": 323.43076, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "0.955", "bbox": {"l": 339.40302, "t": 187.38098000000002, "r": 360.38977, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "0.88", "bbox": {"l": 383.116, "t": 187.31817999999998, "r": 401.97324, "b": 195.24451, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "2.73", "bbox": {"l": 435.49300999999997, "t": 187.31817999999998, "r": 454.35025, "b": 195.24451, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "HTML", "bbox": {"l": 220.903, "t": 200.33196999999996, "r": 248.66655999999998, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "0.969", "bbox": {"l": 264.74399, "t": 200.33196999999996, "r": 285.73074, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "0.927", "bbox": {"l": 302.444, "t": 200.33196999999996, "r": 323.43076, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "0.955", "bbox": {"l": 339.40302, "t": 200.33196999999996, "r": 360.38977, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "0.857", "bbox": {"l": 382.052, "t": 200.33196999999996, "r": 403.03876, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "5.39", "bbox": {"l": 436.73199000000005, "t": 200.33196999999996, "r": 453.11182, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "FinTabNet", "bbox": {"l": 155.94501, "t": 219.16198999999995, "r": 199.83374, "b": 227.23168999999996, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "OTSL", "bbox": {"l": 222.43700000000004, "t": 213.68201, "r": 247.13226000000003, "b": 221.75171, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "0.955", "bbox": {"l": 264.74399, "t": 213.68201, "r": 285.73074, "b": 221.75171, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "0.961", "bbox": {"l": 302.444, "t": 213.68201, "r": 323.43076, "b": 221.75171, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "0.959", "bbox": {"l": 337.815, "t": 213.61919999999998, "r": 361.97586, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "0.862", "bbox": {"l": 380.46399, "t": 213.61919999999998, "r": 404.62485, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "1.85", "bbox": {"l": 435.49300999999997, "t": 213.61919999999998, "r": 454.35025, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "HTML", "bbox": {"l": 220.903, "t": 226.63396999999998, "r": 248.66655999999998, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "0.917", "bbox": {"l": 264.74399, "t": 226.63396999999998, "r": 285.73074, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "0.922", "bbox": {"l": 302.444, "t": 226.63396999999998, "r": 323.43076, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "0.92", "bbox": {"l": 341.70599, "t": 226.63396999999998, "r": 358.08582, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "0.722", "bbox": {"l": 382.052, "t": 226.63396999999998, "r": 403.03876, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "3.26", "bbox": {"l": 436.73199000000005, "t": 226.63396999999998, "r": 453.11182, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "PubTables-1M", "bbox": {"l": 148.62601, "t": 245.46294999999998, "r": 207.1524, "b": 253.53265, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "OTSL", "bbox": {"l": 222.43700000000004, "t": 239.98297000000002, "r": 247.13226000000003, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "0.987", "bbox": {"l": 264.74399, "t": 239.98297000000002, "r": 285.73074, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "0.964", "bbox": {"l": 302.444, "t": 239.98297000000002, "r": 323.43076, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "0.977", "bbox": {"l": 337.815, "t": 239.92016999999998, "r": 361.97586, "b": 247.8465, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "0.896", "bbox": {"l": 380.46399, "t": 239.92016999999998, "r": 404.62485, "b": 247.8465, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "1.79", "bbox": {"l": 435.49300999999997, "t": 239.92016999999998, "r": 454.35025, "b": 247.8465, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "HTML", "bbox": {"l": 220.903, "t": 252.93499999999995, "r": 248.66655999999998, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "0.983", "bbox": {"l": 264.74399, "t": 252.93499999999995, "r": 285.73074, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "0.944", "bbox": {"l": 302.444, "t": 252.93499999999995, "r": 323.43076, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "0.966", "bbox": {"l": 339.40302, "t": 252.93499999999995, "r": 360.38977, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "0.889", "bbox": {"l": 382.052, "t": 252.93499999999995, "r": 403.03876, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "3.26", "bbox": {"l": 436.73199000000005, "t": 252.93499999999995, "r": 453.11182, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": [{"id": 8, "label": "text", "bbox": {"l": 160.782, "t": 166.55895999999996, "r": 194.99779, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "Data set", "bbox": {"l": 160.782, "t": 166.55895999999996, "r": 194.99779, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 215.52499000000003, "t": 166.534, "r": 254.04465, "b": 174.6037, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "Language", "bbox": {"l": 215.52499000000003, "t": 166.534, "r": 254.04465, "b": 174.6037, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "text", "bbox": {"l": 300.397, "t": 161.07898, "r": 323.99118, "b": 169.14868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "TEDs", "bbox": {"l": 300.397, "t": 161.07898, "r": 323.99118, "b": 169.14868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 370.345, "t": 166.55895999999996, "r": 414.74661, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "mAP(0.75)", "bbox": {"l": 370.345, "t": 166.55895999999996, "r": 414.74661, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 426.737, "t": 161.07898, "r": 463.10830999999996, "b": 169.14868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "Inference", "bbox": {"l": 426.737, "t": 161.07898, "r": 463.10830999999996, "b": 169.14868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 423.11401, "t": 172.03796, "r": 466.72656, "b": 180.10766999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "time (secs)", "bbox": {"l": 423.11401, "t": 172.03796, "r": 466.72656, "b": 180.10766999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 262.41299, "t": 174.03101000000004, "r": 288.0596, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "simple", "bbox": {"l": 262.41299, "t": 174.03101000000004, "r": 288.0596, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 296.42899, "t": 174.03101000000004, "r": 329.44687, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "complex", "bbox": {"l": 296.42899, "t": 174.03101000000004, "r": 329.44687, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 345.03299, "t": 174.03101000000004, "r": 354.75793, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "all", "bbox": {"l": 345.03299, "t": 174.03101000000004, "r": 354.75793, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 154.53799, "t": 192.85999000000004, "r": 201.24129, "b": 200.92969000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "PubTabNet", "bbox": {"l": 154.53799, "t": 192.85999000000004, "r": 201.24129, "b": 200.92969000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 222.43700000000004, "t": 187.38098000000002, "r": 247.13226000000003, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "OTSL", "bbox": {"l": 222.43700000000004, "t": 187.38098000000002, "r": 247.13226000000003, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 264.74399, "t": 187.38098000000002, "r": 285.73074, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "0.965", "bbox": {"l": 264.74399, "t": 187.38098000000002, "r": 285.73074, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 302.444, "t": 187.38098000000002, "r": 323.43076, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "0.934", "bbox": {"l": 302.444, "t": 187.38098000000002, "r": 323.43076, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 339.40302, "t": 187.38098000000002, "r": 360.38977, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "0.955", "bbox": {"l": 339.40302, "t": 187.38098000000002, "r": 360.38977, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 383.116, "t": 187.31817999999998, "r": 401.97324, "b": 195.24451, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "0.88", "bbox": {"l": 383.116, "t": 187.31817999999998, "r": 401.97324, "b": 195.24451, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 435.49300999999997, "t": 187.31817999999998, "r": 454.35025, "b": 195.24451, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "2.73", "bbox": {"l": 435.49300999999997, "t": 187.31817999999998, "r": 454.35025, "b": 195.24451, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 220.903, "t": 200.33196999999996, "r": 248.66655999999998, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "HTML", "bbox": {"l": 220.903, "t": 200.33196999999996, "r": 248.66655999999998, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 264.74399, "t": 200.33196999999996, "r": 285.73074, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "0.969", "bbox": {"l": 264.74399, "t": 200.33196999999996, "r": 285.73074, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 302.444, "t": 200.33196999999996, "r": 323.43076, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "0.927", "bbox": {"l": 302.444, "t": 200.33196999999996, "r": 323.43076, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 339.40302, "t": 200.33196999999996, "r": 360.38977, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "0.955", "bbox": {"l": 339.40302, "t": 200.33196999999996, "r": 360.38977, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 382.052, "t": 200.33196999999996, "r": 403.03876, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "0.857", "bbox": {"l": 382.052, "t": 200.33196999999996, "r": 403.03876, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 436.73199000000005, "t": 200.33196999999996, "r": 453.11182, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "5.39", "bbox": {"l": 436.73199000000005, "t": 200.33196999999996, "r": 453.11182, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 155.94501, "t": 219.16198999999995, "r": 199.83374, "b": 227.23168999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "FinTabNet", "bbox": {"l": 155.94501, "t": 219.16198999999995, "r": 199.83374, "b": 227.23168999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 222.43700000000004, "t": 213.68201, "r": 247.13226000000003, "b": 221.75171, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "OTSL", "bbox": {"l": 222.43700000000004, "t": 213.68201, "r": 247.13226000000003, "b": 221.75171, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 264.74399, "t": 213.68201, "r": 285.73074, "b": 221.75171, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "0.955", "bbox": {"l": 264.74399, "t": 213.68201, "r": 285.73074, "b": 221.75171, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 302.444, "t": 213.68201, "r": 323.43076, "b": 221.75171, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "0.961", "bbox": {"l": 302.444, "t": 213.68201, "r": 323.43076, "b": 221.75171, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 337.815, "t": 213.61919999999998, "r": 361.97586, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "0.959", "bbox": {"l": 337.815, "t": 213.61919999999998, "r": 361.97586, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 380.46399, "t": 213.61919999999998, "r": 404.62485, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "0.862", "bbox": {"l": 380.46399, "t": 213.61919999999998, "r": 404.62485, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 435.49300999999997, "t": 213.61919999999998, "r": 454.35025, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "1.85", "bbox": {"l": 435.49300999999997, "t": 213.61919999999998, "r": 454.35025, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 220.903, "t": 226.63396999999998, "r": 248.66655999999998, "b": 234.70367, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "HTML", "bbox": {"l": 220.903, "t": 226.63396999999998, "r": 248.66655999999998, "b": 234.70367, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 264.74399, "t": 226.63396999999998, "r": 285.73074, "b": 234.70367, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "0.917", "bbox": {"l": 264.74399, "t": 226.63396999999998, "r": 285.73074, "b": 234.70367, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 302.444, "t": 226.63396999999998, "r": 323.43076, "b": 234.70367, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "0.922", "bbox": {"l": 302.444, "t": 226.63396999999998, "r": 323.43076, "b": 234.70367, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 341.70599, "t": 226.63396999999998, "r": 358.08582, "b": 234.70367, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "0.92", "bbox": {"l": 341.70599, "t": 226.63396999999998, "r": 358.08582, "b": 234.70367, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 382.052, "t": 226.63396999999998, "r": 403.03876, "b": 234.70367, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "0.722", "bbox": {"l": 382.052, "t": 226.63396999999998, "r": 403.03876, "b": 234.70367, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 436.73199000000005, "t": 226.63396999999998, "r": 453.11182, "b": 234.70367, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "3.26", "bbox": {"l": 436.73199000000005, "t": 226.63396999999998, "r": 453.11182, "b": 234.70367, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 148.62601, "t": 245.46294999999998, "r": 207.1524, "b": 253.53265, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "PubTables-1M", "bbox": {"l": 148.62601, "t": 245.46294999999998, "r": 207.1524, "b": 253.53265, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 222.43700000000004, "t": 239.98297000000002, "r": 247.13226000000003, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "OTSL", "bbox": {"l": 222.43700000000004, "t": 239.98297000000002, "r": 247.13226000000003, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 264.74399, "t": 239.98297000000002, "r": 285.73074, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "0.987", "bbox": {"l": 264.74399, "t": 239.98297000000002, "r": 285.73074, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 302.444, "t": 239.98297000000002, "r": 323.43076, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "0.964", "bbox": {"l": 302.444, "t": 239.98297000000002, "r": 323.43076, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 337.815, "t": 239.92016999999998, "r": 361.97586, "b": 247.8465, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "0.977", "bbox": {"l": 337.815, "t": 239.92016999999998, "r": 361.97586, "b": 247.8465, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 380.46399, "t": 239.92016999999998, "r": 404.62485, "b": 247.8465, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "0.896", "bbox": {"l": 380.46399, "t": 239.92016999999998, "r": 404.62485, "b": 247.8465, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 435.49300999999997, "t": 239.92016999999998, "r": 454.35025, "b": 247.8465, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "1.79", "bbox": {"l": 435.49300999999997, "t": 239.92016999999998, "r": 454.35025, "b": 247.8465, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 220.903, "t": 252.93499999999995, "r": 248.66655999999998, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "HTML", "bbox": {"l": 220.903, "t": 252.93499999999995, "r": 248.66655999999998, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 264.74399, "t": 252.93499999999995, "r": 285.73074, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "0.983", "bbox": {"l": 264.74399, "t": 252.93499999999995, "r": 285.73074, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 302.444, "t": 252.93499999999995, "r": 323.43076, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "0.944", "bbox": {"l": 302.444, "t": 252.93499999999995, "r": 323.43076, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 339.40302, "t": 252.93499999999995, "r": 360.38977, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "0.966", "bbox": {"l": 339.40302, "t": 252.93499999999995, "r": 360.38977, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 382.052, "t": 252.93499999999995, "r": 403.03876, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "0.889", "bbox": {"l": 382.052, "t": 252.93499999999995, "r": 403.03876, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 436.73199000000005, "t": 252.93499999999995, "r": 453.11182, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "3.26", "bbox": {"l": 436.73199000000005, "t": 252.93499999999995, "r": 453.11182, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "lcel", "lcel", "ched", "ched", "nl", "ched", "ucel", "ched", "ched", "ched", "ucel", "ucel", "nl", "rhed", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 8, "num_cols": 7, "table_cells": [{"bbox": {"l": 215.52499000000003, "t": 166.534, "r": 254.04465, "b": 174.6037, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Language", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 300.397, "t": 161.07898, "r": 323.99118, "b": 169.14868, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 3, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 5, "text": "TEDs", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 370.345, "t": 166.55895999999996, "r": 414.74661, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 2, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "mAP(0.75)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 423.11401, "t": 161.07898, "r": 466.72656, "b": 180.10766999999998, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 2, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "Inference time (secs)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 262.41299, "t": 174.03101000000004, "r": 288.0596, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "simple", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 296.42899, "t": 174.03101000000004, "r": 329.44687, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "complex", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 345.03299, "t": 174.03101000000004, "r": 354.75793, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "all", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 154.53799, "t": 192.85999000000004, "r": 201.24129, "b": 200.92969000000005, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PubTabNet", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 222.43700000000004, "t": 187.38098000000002, "r": 247.13226000000003, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "OTSL", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 264.74399, "t": 187.38098000000002, "r": 285.73074, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.965", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 302.444, "t": 187.38098000000002, "r": 323.43076, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.934", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 339.40302, "t": 187.38098000000002, "r": 360.38977, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.955", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 383.116, "t": 187.31817999999998, "r": 401.97324, "b": 195.24451, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 435.49300999999997, "t": 187.31817999999998, "r": 454.35025, "b": 195.24451, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "2.73", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 220.903, "t": 200.33196999999996, "r": 248.66655999999998, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "HTML", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 264.74399, "t": 200.33196999999996, "r": 285.73074, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.969", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 302.444, "t": 200.33196999999996, "r": 323.43076, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.927", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 339.40302, "t": 200.33196999999996, "r": 360.38977, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.955", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 382.052, "t": 200.33196999999996, "r": 403.03876, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.857", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 436.73199000000005, "t": 200.33196999999996, "r": 453.11182, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "5.39", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 155.94501, "t": 219.16198999999995, "r": 199.83374, "b": 227.23168999999996, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "FinTabNet", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 222.43700000000004, "t": 213.68201, "r": 247.13226000000003, "b": 221.75171, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "OTSL", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 264.74399, "t": 213.68201, "r": 285.73074, "b": 221.75171, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.955", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 302.444, "t": 213.68201, "r": 323.43076, "b": 221.75171, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.961", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 337.815, "t": 213.61919999999998, "r": 361.97586, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.959", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 380.46399, "t": 213.61919999999998, "r": 404.62485, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.862", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 435.49300999999997, "t": 213.61919999999998, "r": 454.35025, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "1.85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 220.903, "t": 226.63396999999998, "r": 248.66655999999998, "b": 234.70367, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "HTML", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 264.74399, "t": 226.63396999999998, "r": 285.73074, "b": 234.70367, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.917", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 302.444, "t": 226.63396999999998, "r": 323.43076, "b": 234.70367, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.922", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 341.70599, "t": 226.63396999999998, "r": 358.08582, "b": 234.70367, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.92", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 382.052, "t": 226.63396999999998, "r": 403.03876, "b": 234.70367, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.722", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 436.73199000000005, "t": 226.63396999999998, "r": 453.11182, "b": 234.70367, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "3.26", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 148.62601, "t": 245.46294999999998, "r": 207.1524, "b": 253.53265, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PubTables-1M", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 222.43700000000004, "t": 239.98297000000002, "r": 247.13226000000003, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "OTSL", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 264.74399, "t": 239.98297000000002, "r": 285.73074, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.987", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 302.444, "t": 239.98297000000002, "r": 323.43076, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.964", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 337.815, "t": 239.92016999999998, "r": 361.97586, "b": 247.8465, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.977", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 380.46399, "t": 239.92016999999998, "r": 404.62485, "b": 247.8465, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.896", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 435.49300999999997, "t": 239.92016999999998, "r": 454.35025, "b": 247.8465, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "1.79", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 220.903, "t": 252.93499999999995, "r": 248.66655999999998, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "HTML", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 264.74399, "t": 252.93499999999995, "r": 285.73074, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.983", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 302.444, "t": 252.93499999999995, "r": 323.43076, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.944", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 339.40302, "t": 252.93499999999995, "r": 360.38977, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.966", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 382.052, "t": 252.93499999999995, "r": 403.03876, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.889", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 436.73199000000005, "t": 252.93499999999995, "r": 453.11182, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "3.26", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "section_header", "id": 3, "page_no": 9, "cluster": {"id": 3, "label": "section_header", "bbox": {"l": 134.765, "t": 288.91479, "r": 257.08679, "b": 297.72173999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9546447992324829, "cells": [{"id": 55, "text": "5.3", "bbox": {"l": 134.765, "t": 288.91479, "r": 149.40205, "b": 297.72173999999995, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Qualitative Results", "bbox": {"l": 160.85904, "t": 288.91479, "r": 257.08679, "b": 297.72173999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5.3 Qualitative Results"}, {"label": "text", "id": 1, "page_no": 9, "cluster": {"id": 1, "label": "text", "bbox": {"l": 134.765, "t": 309.86078, "r": 480.58981, "b": 366.47769, "coord_origin": "TOPLEFT"}, "confidence": 0.9834085702896118, "cells": [{"id": 57, "text": "To illustrate the qualitative differences between OTSL and HTML, Figure 5", "bbox": {"l": 134.765, "t": 309.86078, "r": 480.58777, "b": 318.65775, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "demonstrates less overlap and more accurate bounding boxes with OTSL. In", "bbox": {"l": 134.765, "t": 321.81577, "r": 480.58889999999997, "b": 330.61273, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Figure 6, OTSL proves to be more effective in handling tables with longer to-", "bbox": {"l": 134.765, "t": 333.77075, "r": 480.58681999999993, "b": 342.56772, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "ken sequences, resulting in even more precise structure prediction and bounding", "bbox": {"l": 134.765, "t": 345.72574, "r": 480.58981, "b": 354.52271, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "boxes.", "bbox": {"l": 134.765, "t": 357.68073, "r": 161.65704, "b": 366.47769, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "To illustrate the qualitative differences between OTSL and HTML, Figure 5 demonstrates less overlap and more accurate bounding boxes with OTSL. In Figure 6, OTSL proves to be more effective in handling tables with longer token sequences, resulting in even more precise structure prediction and bounding boxes."}, {"label": "caption", "id": 5, "page_no": 9, "cluster": {"id": 5, "label": "caption", "bbox": {"l": 134.765, "t": 397.59012, "r": 480.59106, "b": 439.71716, "coord_origin": "TOPLEFT"}, "confidence": 0.948272705078125, "cells": [{"id": 62, "text": "Fig. 5.", "bbox": {"l": 134.765, "t": 397.59012, "r": 162.64424, "b": 405.51642, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "The OTSL model produces more accurate bounding boxes with less over-", "bbox": {"l": 167.384, "t": 397.65289, "r": 480.59106, "b": 405.72266, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "lap (E) than the HTML model (D), when predicting the structure of a sparse ta-", "bbox": {"l": 134.765, "t": 408.61190999999997, "r": 480.59106, "b": 416.68167000000005, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "ble (A), at twice the inference speed because of shorter sequence length (B),(C).", "bbox": {"l": 134.765, "t": 419.57089, "r": 480.58838000000003, "b": 427.64066, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "\"PMC2807444_006_00.png\" PubTabNet.", "bbox": {"l": 134.765, "t": 430.52987999999993, "r": 304.69171, "b": 438.59964, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "\u03bc", "bbox": {"l": 342.63354, "t": 430.19678, "r": 344.81915, "b": 439.71716, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Fig. 5. The OTSL model produces more accurate bounding boxes with less overlap (E) than the HTML model (D), when predicting the structure of a sparse table (A), at twice the inference speed because of shorter sequence length (B),(C). \"PMC2807444_006_00.png\" PubTabNet. \u03bc"}, {"label": "picture", "id": 2, "page_no": 9, "cluster": {"id": 2, "label": "picture", "bbox": {"l": 162.67430114746094, "t": 444.62255859375, "r": 451.70062255859375, "b": 663.2135620117188, "coord_origin": "TOPLEFT"}, "confidence": 0.9742383360862732, "cells": [{"id": 67, "text": "<table>", "bbox": {"l": 180.12473, "t": 516.2332200000001, "r": 190.62042, "b": 518.94992, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "<tr><td></td><td colspan=\"4\"></td><td colspan=\"6\"></td><td colspan=\"3\"></td></tr>", "bbox": {"l": 183.2438, "t": 520.13208, "r": 304.54797, "b": 522.84879, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 524.03094, "r": 388.42313, "b": 526.74765, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 527.9297799999999, "r": 388.42313, "b": 530.64648, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 531.82861, "r": 388.42313, "b": 534.54532, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 535.72748, "r": 388.42313, "b": 538.44418, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 539.62631, "r": 388.42313, "b": 542.34303, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 543.52516, "r": 388.42313, "b": 546.24188, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 547.42401, "r": 388.42313, "b": 550.14073, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 551.32286, "r": 388.42313, "b": 554.03958, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "</table>", "bbox": {"l": 180.12473, "t": 555.22173, "r": 191.86806, "b": 557.93845, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "C", "bbox": {"l": 407.38348, "t": 518.30042, "r": 408.82025, "b": 521.01712, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "C L L L C L L L L L C L L NL", "bbox": {"l": 410.25699, "t": 518.30042, "r": 450.48605, "b": 521.01712, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "C", "bbox": {"l": 407.38348, "t": 522.19925, "r": 408.82025, "b": 524.9159500000001, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 522.19925, "r": 450.48605, "b": 524.9159500000001, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "C", "bbox": {"l": 407.38348, "t": 526.09808, "r": 408.82025, "b": 528.81479, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 526.09808, "r": 450.48605, "b": 528.81479, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "C", "bbox": {"l": 407.38348, "t": 529.99695, "r": 408.82025, "b": 532.7136499999999, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 529.99695, "r": 450.48605, "b": 532.7136499999999, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "C", "bbox": {"l": 407.38348, "t": 533.8957800000001, "r": 408.82025, "b": 536.6125, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 533.8957800000001, "r": 450.48605, "b": 536.6125, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "C", "bbox": {"l": 407.38348, "t": 537.79463, "r": 408.82025, "b": 540.51135, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 537.79463, "r": 450.48605, "b": 540.51135, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "C", "bbox": {"l": 407.38348, "t": 541.69348, "r": 408.82025, "b": 544.4102, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 541.69348, "r": 450.48605, "b": 544.4102, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "C", "bbox": {"l": 407.38348, "t": 545.59233, "r": 408.82025, "b": 548.3090500000001, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 545.59233, "r": 450.48605, "b": 548.3090500000001, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "C", "bbox": {"l": 407.38348, "t": 549.4911999999999, "r": 408.82025, "b": 552.2079200000001, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 549.4911999999999, "r": 450.48605, "b": 552.2079200000001, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "HTML", "bbox": {"l": 164.52881, "t": 509.45859, "r": 181.8528, "b": 515.31, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "#", "bbox": {"l": 183.58441, "t": 509.45859, "r": 186.3974, "b": 515.31, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "tokens:", "bbox": {"l": 189.2104, "t": 509.45859, "r": 208.90137, "b": 515.31, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "258", "bbox": {"l": 210.63269, "t": 509.45859, "r": 221.04044, "b": 515.31, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "OTSL", "bbox": {"l": 390.20203, "t": 509.60361, "r": 406.83609, "b": 515.45502, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "#", "bbox": {"l": 408.56952, "t": 509.60361, "r": 411.38251, "b": 515.45502, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "tokens:", "bbox": {"l": 414.1955, "t": 509.60361, "r": 433.88647000000003, "b": 515.45502, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "135", "bbox": {"l": 435.61737, "t": 509.60361, "r": 446.02512, "b": 515.45502, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "B", "bbox": {"l": 167.19316, "t": 519.07236, "r": 172.8231, "b": 526.3866, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "A", "bbox": {"l": 187.33745, "t": 448.62485, "r": 192.96739, "b": 455.93909, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "D", "bbox": {"l": 167.38654, "t": 566.0051599999999, "r": 173.01648, "b": 573.3194, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "E", "bbox": {"l": 248.45621000000003, "t": 621.78008, "r": 253.65727, "b": 629.09431, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "C", "bbox": {"l": 395.90057, "t": 519.19946, "r": 401.53052, "b": 526.5137, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "HTML", "bbox": {"l": 171.62886, "t": 580.28853, "r": 177.48148, "b": 597.26784, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "OTSL", "bbox": {"l": 251.05969000000002, "t": 633.63408, "r": 256.91235, "b": 649.92345, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "HTML model shows", "bbox": {"l": 372.14645, "t": 601.45724, "r": 427.0379, "b": 607.30864, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "bounding box drifting", "bbox": {"l": 372.14645, "t": 607.89948, "r": 430.06838999999997, "b": 613.75087, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "OTSL model shows", "bbox": {"l": 176.88042, "t": 642.87209, "r": 231.08191, "b": 648.72348, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "clean bounding box", "bbox": {"l": 176.88042, "t": 649.3143, "r": 230.99271000000002, "b": 655.1657, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "alignment", "bbox": {"l": 176.88042, "t": 655.7565500000001, "r": 203.93219, "b": 661.60794, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "\u2264", "bbox": {"l": 215.93231000000003, "t": 557.56342, "r": 218.4697, "b": 569.15967, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "\u03bc", "bbox": {"l": 229.05689999999998, "t": 557.56342, "r": 231.71908999999997, "b": 569.15967, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "S", "bbox": {"l": 261.20892, "t": 448.46124, "r": 263.56973, "b": 451.19727, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "I", "bbox": {"l": 312.33463, "t": 448.46124, "r": 313.6362, "b": 451.19727, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "R", "bbox": {"l": 377.41125, "t": 448.46124, "r": 380.05737, "b": 451.19727, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "ST", "bbox": {"l": 200.63976, "t": 453.33997, "r": 205.82492, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "0.03", "bbox": {"l": 222.20833000000002, "t": 453.33997, "r": 229.76836, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "0.06", "bbox": {"l": 243.26666, "t": 453.33997, "r": 250.82669, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "0.12", "bbox": {"l": 264.29657, "t": 453.33997, "r": 271.84949, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "0.25", "bbox": {"l": 285.31943, "t": 453.33997, "r": 292.87946, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "0.5", "bbox": {"l": 306.37775, "t": 453.33997, "r": 311.77319, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "1", "bbox": {"l": 323.41699, "t": 453.33997, "r": 325.58157, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "2", "bbox": {"l": 334.45807, "t": 453.33997, "r": 336.62265, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "4", "bbox": {"l": 345.52756, "t": 453.33997, "r": 347.69214, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "8", "bbox": {"l": 356.56863, "t": 453.33997, "r": 358.73322, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "16", "bbox": {"l": 367.63812, "t": 453.33997, "r": 371.97089, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "32", "bbox": {"l": 382.6734, "t": 453.33997, "r": 387.00616, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "64", "bbox": {"l": 397.73727, "t": 453.33997, "r": 402.07001, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "\u2265", "bbox": {"l": 412.78879, "t": 447.99298, "r": 414.93463, "b": 457.79964999999993, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": " 128", "bbox": {"l": 414.95697, "t": 453.33997, "r": 422.51746, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "63", "bbox": {"l": 200.63998, "t": 463.92444, "r": 204.57674, "b": 466.66043, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "1", "bbox": {"l": 367.62604, "t": 463.92444, "r": 369.58032, "b": 466.66043, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "1", "bbox": {"l": 382.66132, "t": 463.92444, "r": 384.6156, "b": 466.66043, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "3", "bbox": {"l": 397.72504, "t": 463.92444, "r": 399.67932, "b": 466.66043, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "199", "bbox": {"l": 200.64, "t": 468.80313, "r": 206.51694, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "5", "bbox": {"l": 264.29047, "t": 468.80313, "r": 266.25885, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "1", "bbox": {"l": 306.37213, "t": 468.80313, "r": 308.34052, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "2", "bbox": {"l": 345.51526, "t": 468.80313, "r": 347.48364, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "4", "bbox": {"l": 356.55634, "t": 468.80313, "r": 358.52472, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "1", "bbox": {"l": 367.62582, "t": 468.80313, "r": 369.59418, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "1", "bbox": {"l": 382.66107, "t": 468.80313, "r": 384.62946, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "416", "bbox": {"l": 200.64, "t": 473.68185, "r": 206.51694, "b": 476.41788, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "4", "bbox": {"l": 264.29047, "t": 473.68185, "r": 266.25885, "b": 476.41788, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "230", "bbox": {"l": 200.64, "t": 478.53214, "r": 206.51694, "b": 481.26816, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "1", "bbox": {"l": 243.26373, "t": 478.53214, "r": 245.2321, "b": 481.26816, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "9", "bbox": {"l": 264.29047, "t": 478.53214, "r": 266.25885, "b": 481.26816, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "1", "bbox": {"l": 323.40466, "t": 478.53214, "r": 325.37305, "b": 481.26816, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "1", "bbox": {"l": 397.72519, "t": 478.53214, "r": 399.69354, "b": 481.26816, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "276", "bbox": {"l": 200.64, "t": 483.41086, "r": 206.51694, "b": 486.14688, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "2", "bbox": {"l": 382.66132, "t": 483.41086, "r": 384.61563, "b": 486.14688, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "12", "bbox": {"l": 397.72513, "t": 483.41086, "r": 401.64819, "b": 486.14688, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "1", "bbox": {"l": 412.78928, "t": 483.41086, "r": 414.74359, "b": 486.14688, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "320", "bbox": {"l": 200.64014, "t": 488.28958, "r": 207.14445, "b": 491.0256, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "1", "bbox": {"l": 367.62616, "t": 488.28958, "r": 369.78375, "b": 491.0256, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "4", "bbox": {"l": 382.66141, "t": 488.28958, "r": 384.81897, "b": 491.0256, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "20", "bbox": {"l": 397.7251, "t": 488.28958, "r": 402.05087, "b": 491.0256, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "2013", "bbox": {"l": 200.64032, "t": 493.1683, "r": 208.48566, "b": 495.90433, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "3", "bbox": {"l": 264.29044, "t": 493.1683, "r": 266.25879, "b": 495.90433, "coord_origin": "TOPLEFT"}}], "children": [{"id": 56, "label": "text", "bbox": {"l": 180.12473, "t": 516.2332200000001, "r": 190.62042, "b": 518.94992, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "<table>", "bbox": {"l": 180.12473, "t": 516.2332200000001, "r": 190.62042, "b": 518.94992, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 183.2438, "t": 520.13208, "r": 304.54797, "b": 522.84879, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "<tr><td></td><td colspan=\"4\"></td><td colspan=\"6\"></td><td colspan=\"3\"></td></tr>", "bbox": {"l": 183.2438, "t": 520.13208, "r": 304.54797, "b": 522.84879, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 183.2438, "t": 524.03094, "r": 388.42313, "b": 526.74765, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 524.03094, "r": 388.42313, "b": 526.74765, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 183.2438, "t": 527.9297799999999, "r": 388.42313, "b": 530.64648, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 527.9297799999999, "r": 388.42313, "b": 530.64648, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 183.2438, "t": 531.82861, "r": 388.42313, "b": 534.54532, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 531.82861, "r": 388.42313, "b": 534.54532, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 183.2438, "t": 535.72748, "r": 388.42313, "b": 538.44418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 535.72748, "r": 388.42313, "b": 538.44418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 183.2438, "t": 539.62631, "r": 388.42313, "b": 542.34303, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 539.62631, "r": 388.42313, "b": 542.34303, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 183.2438, "t": 543.52516, "r": 388.42313, "b": 546.24188, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 543.52516, "r": 388.42313, "b": 546.24188, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 183.2438, "t": 547.42401, "r": 388.42313, "b": 550.14073, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 547.42401, "r": 388.42313, "b": 550.14073, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 183.2438, "t": 551.32286, "r": 388.42313, "b": 554.03958, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 551.32286, "r": 388.42313, "b": 554.03958, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 180.12473, "t": 555.22173, "r": 191.86806, "b": 557.93845, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "</table>", "bbox": {"l": 180.12473, "t": 555.22173, "r": 191.86806, "b": 557.93845, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 407.38348, "t": 518.30042, "r": 408.82025, "b": 521.01712, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "C", "bbox": {"l": 407.38348, "t": 518.30042, "r": 408.82025, "b": 521.01712, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 410.25699, "t": 518.30042, "r": 450.48605, "b": 521.01712, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "C L L L C L L L L L C L L NL", "bbox": {"l": 410.25699, "t": 518.30042, "r": 450.48605, "b": 521.01712, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 407.38348, "t": 522.19925, "r": 408.82025, "b": 524.9159500000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "C", "bbox": {"l": 407.38348, "t": 522.19925, "r": 408.82025, "b": 524.9159500000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 410.25699, "t": 522.19925, "r": 450.48605, "b": 524.9159500000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 522.19925, "r": 450.48605, "b": 524.9159500000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 407.38348, "t": 526.09808, "r": 408.82025, "b": 528.81479, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "C", "bbox": {"l": 407.38348, "t": 526.09808, "r": 408.82025, "b": 528.81479, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 410.25699, "t": 526.09808, "r": 450.48605, "b": 528.81479, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 526.09808, "r": 450.48605, "b": 528.81479, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 407.38348, "t": 529.99695, "r": 408.82025, "b": 532.7136499999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "C", "bbox": {"l": 407.38348, "t": 529.99695, "r": 408.82025, "b": 532.7136499999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 410.25699, "t": 529.99695, "r": 450.48605, "b": 532.7136499999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 529.99695, "r": 450.48605, "b": 532.7136499999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 407.38348, "t": 533.8957800000001, "r": 408.82025, "b": 536.6125, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "C", "bbox": {"l": 407.38348, "t": 533.8957800000001, "r": 408.82025, "b": 536.6125, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 410.25699, "t": 533.8957800000001, "r": 450.48605, "b": 536.6125, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 533.8957800000001, "r": 450.48605, "b": 536.6125, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 407.38348, "t": 537.79463, "r": 408.82025, "b": 540.51135, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "C", "bbox": {"l": 407.38348, "t": 537.79463, "r": 408.82025, "b": 540.51135, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 410.25699, "t": 537.79463, "r": 450.48605, "b": 540.51135, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 537.79463, "r": 450.48605, "b": 540.51135, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 407.38348, "t": 541.69348, "r": 408.82025, "b": 544.4102, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "C", "bbox": {"l": 407.38348, "t": 541.69348, "r": 408.82025, "b": 544.4102, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 410.25699, "t": 541.69348, "r": 450.48605, "b": 544.4102, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 541.69348, "r": 450.48605, "b": 544.4102, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 407.38348, "t": 545.59233, "r": 408.82025, "b": 548.3090500000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "C", "bbox": {"l": 407.38348, "t": 545.59233, "r": 408.82025, "b": 548.3090500000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 410.25699, "t": 545.59233, "r": 450.48605, "b": 548.3090500000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 545.59233, "r": 450.48605, "b": 548.3090500000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 407.38348, "t": 549.4911999999999, "r": 408.82025, "b": 552.2079200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "C", "bbox": {"l": 407.38348, "t": 549.4911999999999, "r": 408.82025, "b": 552.2079200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 410.25699, "t": 549.4911999999999, "r": 450.48605, "b": 552.2079200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 549.4911999999999, "r": 450.48605, "b": 552.2079200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 164.52881, "t": 509.45859, "r": 181.8528, "b": 515.31, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "HTML", "bbox": {"l": 164.52881, "t": 509.45859, "r": 181.8528, "b": 515.31, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 183.58441, "t": 509.45859, "r": 186.3974, "b": 515.31, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "#", "bbox": {"l": 183.58441, "t": 509.45859, "r": 186.3974, "b": 515.31, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 189.2104, "t": 509.45859, "r": 208.90137, "b": 515.31, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "tokens:", "bbox": {"l": 189.2104, "t": 509.45859, "r": 208.90137, "b": 515.31, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 210.63269, "t": 509.45859, "r": 221.04044, "b": 515.31, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "258", "bbox": {"l": 210.63269, "t": 509.45859, "r": 221.04044, "b": 515.31, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 390.20203, "t": 509.60361, "r": 406.83609, "b": 515.45502, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "OTSL", "bbox": {"l": 390.20203, "t": 509.60361, "r": 406.83609, "b": 515.45502, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 408.56952, "t": 509.60361, "r": 411.38251, "b": 515.45502, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "#", "bbox": {"l": 408.56952, "t": 509.60361, "r": 411.38251, "b": 515.45502, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 414.1955, "t": 509.60361, "r": 433.88647000000003, "b": 515.45502, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "tokens:", "bbox": {"l": 414.1955, "t": 509.60361, "r": 433.88647000000003, "b": 515.45502, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 435.61737, "t": 509.60361, "r": 446.02512, "b": 515.45502, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": "135", "bbox": {"l": 435.61737, "t": 509.60361, "r": 446.02512, "b": 515.45502, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 167.19316, "t": 519.07236, "r": 172.8231, "b": 526.3866, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "B", "bbox": {"l": 167.19316, "t": 519.07236, "r": 172.8231, "b": 526.3866, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 187.33745, "t": 448.62485, "r": 192.96739, "b": 455.93909, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "A", "bbox": {"l": 187.33745, "t": 448.62485, "r": 192.96739, "b": 455.93909, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 167.38654, "t": 566.0051599999999, "r": 173.01648, "b": 573.3194, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": "D", "bbox": {"l": 167.38654, "t": 566.0051599999999, "r": 173.01648, "b": 573.3194, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 248.45621000000003, "t": 621.78008, "r": 253.65727, "b": 629.09431, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 107, "text": "E", "bbox": {"l": 248.45621000000003, "t": 621.78008, "r": 253.65727, "b": 629.09431, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 395.90057, "t": 519.19946, "r": 401.53052, "b": 526.5137, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 108, "text": "C", "bbox": {"l": 395.90057, "t": 519.19946, "r": 401.53052, "b": 526.5137, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 171.62886, "t": 580.28853, "r": 177.48148, "b": 597.26784, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 109, "text": "HTML", "bbox": {"l": 171.62886, "t": 580.28853, "r": 177.48148, "b": 597.26784, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 251.05969000000002, "t": 633.63408, "r": 256.91235, "b": 649.92345, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 110, "text": "OTSL", "bbox": {"l": 251.05969000000002, "t": 633.63408, "r": 256.91235, "b": 649.92345, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 372.14645, "t": 601.45724, "r": 427.0379, "b": 607.30864, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 111, "text": "HTML model shows", "bbox": {"l": 372.14645, "t": 601.45724, "r": 427.0379, "b": 607.30864, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 372.14645, "t": 607.89948, "r": 430.06838999999997, "b": 613.75087, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 112, "text": "bounding box drifting", "bbox": {"l": 372.14645, "t": 607.89948, "r": 430.06838999999997, "b": 613.75087, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 176.88042, "t": 642.87209, "r": 231.08191, "b": 648.72348, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 113, "text": "OTSL model shows", "bbox": {"l": 176.88042, "t": 642.87209, "r": 231.08191, "b": 648.72348, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 176.88042, "t": 649.3143, "r": 230.99271000000002, "b": 655.1657, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 114, "text": "clean bounding box", "bbox": {"l": 176.88042, "t": 649.3143, "r": 230.99271000000002, "b": 655.1657, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 176.88042, "t": 655.7565500000001, "r": 203.93219, "b": 661.60794, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 115, "text": "alignment", "bbox": {"l": 176.88042, "t": 655.7565500000001, "r": 203.93219, "b": 661.60794, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 215.93231000000003, "t": 557.56342, "r": 218.4697, "b": 569.15967, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 116, "text": "\u2264", "bbox": {"l": 215.93231000000003, "t": 557.56342, "r": 218.4697, "b": 569.15967, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 229.05689999999998, "t": 557.56342, "r": 231.71908999999997, "b": 569.15967, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 117, "text": "\u03bc", "bbox": {"l": 229.05689999999998, "t": 557.56342, "r": 231.71908999999997, "b": 569.15967, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 261.20892, "t": 448.46124, "r": 263.56973, "b": 451.19727, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 119, "text": "S", "bbox": {"l": 261.20892, "t": 448.46124, "r": 263.56973, "b": 451.19727, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 312.33463, "t": 448.46124, "r": 313.6362, "b": 451.19727, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 120, "text": "I", "bbox": {"l": 312.33463, "t": 448.46124, "r": 313.6362, "b": 451.19727, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 377.41125, "t": 448.46124, "r": 380.05737, "b": 451.19727, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 121, "text": "R", "bbox": {"l": 377.41125, "t": 448.46124, "r": 380.05737, "b": 451.19727, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 200.63976, "t": 453.33997, "r": 205.82492, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 122, "text": "ST", "bbox": {"l": 200.63976, "t": 453.33997, "r": 205.82492, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 222.20833000000002, "t": 453.33997, "r": 229.76836, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 123, "text": "0.03", "bbox": {"l": 222.20833000000002, "t": 453.33997, "r": 229.76836, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 243.26666, "t": 453.33997, "r": 250.82669, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 124, "text": "0.06", "bbox": {"l": 243.26666, "t": 453.33997, "r": 250.82669, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 264.29657, "t": 453.33997, "r": 271.84949, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 125, "text": "0.12", "bbox": {"l": 264.29657, "t": 453.33997, "r": 271.84949, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 114, "label": "text", "bbox": {"l": 285.31943, "t": 453.33997, "r": 292.87946, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 126, "text": "0.25", "bbox": {"l": 285.31943, "t": 453.33997, "r": 292.87946, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 115, "label": "text", "bbox": {"l": 306.37775, "t": 453.33997, "r": 311.77319, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 127, "text": "0.5", "bbox": {"l": 306.37775, "t": 453.33997, "r": 311.77319, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 116, "label": "text", "bbox": {"l": 323.41699, "t": 453.33997, "r": 325.58157, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 128, "text": "1", "bbox": {"l": 323.41699, "t": 453.33997, "r": 325.58157, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 117, "label": "text", "bbox": {"l": 334.45807, "t": 453.33997, "r": 336.62265, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 129, "text": "2", "bbox": {"l": 334.45807, "t": 453.33997, "r": 336.62265, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 118, "label": "text", "bbox": {"l": 345.52756, "t": 453.33997, "r": 347.69214, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 130, "text": "4", "bbox": {"l": 345.52756, "t": 453.33997, "r": 347.69214, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 119, "label": "text", "bbox": {"l": 356.56863, "t": 453.33997, "r": 358.73322, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 131, "text": "8", "bbox": {"l": 356.56863, "t": 453.33997, "r": 358.73322, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 120, "label": "text", "bbox": {"l": 367.63812, "t": 453.33997, "r": 371.97089, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 132, "text": "16", "bbox": {"l": 367.63812, "t": 453.33997, "r": 371.97089, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 121, "label": "text", "bbox": {"l": 382.6734, "t": 453.33997, "r": 387.00616, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 133, "text": "32", "bbox": {"l": 382.6734, "t": 453.33997, "r": 387.00616, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 122, "label": "text", "bbox": {"l": 397.73727, "t": 453.33997, "r": 402.07001, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 134, "text": "64", "bbox": {"l": 397.73727, "t": 453.33997, "r": 402.07001, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 123, "label": "text", "bbox": {"l": 412.78879, "t": 447.99298, "r": 414.93463, "b": 457.79964999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 135, "text": "\u2265", "bbox": {"l": 412.78879, "t": 447.99298, "r": 414.93463, "b": 457.79964999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 124, "label": "text", "bbox": {"l": 414.95697, "t": 453.33997, "r": 422.51746, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 136, "text": " 128", "bbox": {"l": 414.95697, "t": 453.33997, "r": 422.51746, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 125, "label": "text", "bbox": {"l": 200.63998, "t": 463.92444, "r": 204.57674, "b": 466.66043, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 137, "text": "63", "bbox": {"l": 200.63998, "t": 463.92444, "r": 204.57674, "b": 466.66043, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 126, "label": "text", "bbox": {"l": 367.62604, "t": 463.92444, "r": 369.58032, "b": 466.66043, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 138, "text": "1", "bbox": {"l": 367.62604, "t": 463.92444, "r": 369.58032, "b": 466.66043, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 127, "label": "text", "bbox": {"l": 382.66132, "t": 463.92444, "r": 384.6156, "b": 466.66043, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 139, "text": "1", "bbox": {"l": 382.66132, "t": 463.92444, "r": 384.6156, "b": 466.66043, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 128, "label": "text", "bbox": {"l": 397.72504, "t": 463.92444, "r": 399.67932, "b": 466.66043, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 140, "text": "3", "bbox": {"l": 397.72504, "t": 463.92444, "r": 399.67932, "b": 466.66043, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 129, "label": "text", "bbox": {"l": 200.64, "t": 468.80313, "r": 206.51694, "b": 471.53915, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 141, "text": "199", "bbox": {"l": 200.64, "t": 468.80313, "r": 206.51694, "b": 471.53915, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 130, "label": "text", "bbox": {"l": 264.29047, "t": 468.80313, "r": 266.25885, "b": 471.53915, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 142, "text": "5", "bbox": {"l": 264.29047, "t": 468.80313, "r": 266.25885, "b": 471.53915, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 131, "label": "text", "bbox": {"l": 306.37213, "t": 468.80313, "r": 308.34052, "b": 471.53915, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 143, "text": "1", "bbox": {"l": 306.37213, "t": 468.80313, "r": 308.34052, "b": 471.53915, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 132, "label": "text", "bbox": {"l": 345.51526, "t": 468.80313, "r": 347.48364, "b": 471.53915, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 144, "text": "2", "bbox": {"l": 345.51526, "t": 468.80313, "r": 347.48364, "b": 471.53915, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 133, "label": "text", "bbox": {"l": 356.55634, "t": 468.80313, "r": 358.52472, "b": 471.53915, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 145, "text": "4", "bbox": {"l": 356.55634, "t": 468.80313, "r": 358.52472, "b": 471.53915, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 134, "label": "text", "bbox": {"l": 367.62582, "t": 468.80313, "r": 369.59418, "b": 471.53915, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 146, "text": "1", "bbox": {"l": 367.62582, "t": 468.80313, "r": 369.59418, "b": 471.53915, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 135, "label": "text", "bbox": {"l": 382.66107, "t": 468.80313, "r": 384.62946, "b": 471.53915, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 147, "text": "1", "bbox": {"l": 382.66107, "t": 468.80313, "r": 384.62946, "b": 471.53915, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 136, "label": "text", "bbox": {"l": 200.64, "t": 473.68185, "r": 206.51694, "b": 476.41788, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 148, "text": "416", "bbox": {"l": 200.64, "t": 473.68185, "r": 206.51694, "b": 476.41788, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 137, "label": "text", "bbox": {"l": 264.29047, "t": 473.68185, "r": 266.25885, "b": 476.41788, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 149, "text": "4", "bbox": {"l": 264.29047, "t": 473.68185, "r": 266.25885, "b": 476.41788, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 138, "label": "text", "bbox": {"l": 200.64, "t": 478.53214, "r": 206.51694, "b": 481.26816, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 150, "text": "230", "bbox": {"l": 200.64, "t": 478.53214, "r": 206.51694, "b": 481.26816, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 139, "label": "text", "bbox": {"l": 243.26373, "t": 478.53214, "r": 245.2321, "b": 481.26816, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 151, "text": "1", "bbox": {"l": 243.26373, "t": 478.53214, "r": 245.2321, "b": 481.26816, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 140, "label": "text", "bbox": {"l": 264.29047, "t": 478.53214, "r": 266.25885, "b": 481.26816, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 152, "text": "9", "bbox": {"l": 264.29047, "t": 478.53214, "r": 266.25885, "b": 481.26816, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 141, "label": "text", "bbox": {"l": 323.40466, "t": 478.53214, "r": 325.37305, "b": 481.26816, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 153, "text": "1", "bbox": {"l": 323.40466, "t": 478.53214, "r": 325.37305, "b": 481.26816, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 142, "label": "text", "bbox": {"l": 397.72519, "t": 478.53214, "r": 399.69354, "b": 481.26816, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 154, "text": "1", "bbox": {"l": 397.72519, "t": 478.53214, "r": 399.69354, "b": 481.26816, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 143, "label": "text", "bbox": {"l": 200.64, "t": 483.41086, "r": 206.51694, "b": 486.14688, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 155, "text": "276", "bbox": {"l": 200.64, "t": 483.41086, "r": 206.51694, "b": 486.14688, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 144, "label": "text", "bbox": {"l": 382.66132, "t": 483.41086, "r": 384.61563, "b": 486.14688, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 156, "text": "2", "bbox": {"l": 382.66132, "t": 483.41086, "r": 384.61563, "b": 486.14688, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 145, "label": "text", "bbox": {"l": 397.72513, "t": 483.41086, "r": 401.64819, "b": 486.14688, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 157, "text": "12", "bbox": {"l": 397.72513, "t": 483.41086, "r": 401.64819, "b": 486.14688, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 146, "label": "text", "bbox": {"l": 412.78928, "t": 483.41086, "r": 414.74359, "b": 486.14688, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 158, "text": "1", "bbox": {"l": 412.78928, "t": 483.41086, "r": 414.74359, "b": 486.14688, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 147, "label": "text", "bbox": {"l": 200.64014, "t": 488.28958, "r": 207.14445, "b": 491.0256, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 159, "text": "320", "bbox": {"l": 200.64014, "t": 488.28958, "r": 207.14445, "b": 491.0256, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 148, "label": "text", "bbox": {"l": 367.62616, "t": 488.28958, "r": 369.78375, "b": 491.0256, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 160, "text": "1", "bbox": {"l": 367.62616, "t": 488.28958, "r": 369.78375, "b": 491.0256, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 149, "label": "text", "bbox": {"l": 382.66141, "t": 488.28958, "r": 384.81897, "b": 491.0256, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 161, "text": "4", "bbox": {"l": 382.66141, "t": 488.28958, "r": 384.81897, "b": 491.0256, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 150, "label": "text", "bbox": {"l": 397.7251, "t": 488.28958, "r": 402.05087, "b": 491.0256, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 162, "text": "20", "bbox": {"l": 397.7251, "t": 488.28958, "r": 402.05087, "b": 491.0256, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 151, "label": "text", "bbox": {"l": 200.64032, "t": 493.1683, "r": 208.48566, "b": 495.90433, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 163, "text": "2013", "bbox": {"l": 200.64032, "t": 493.1683, "r": 208.48566, "b": 495.90433, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 152, "label": "text", "bbox": {"l": 264.29044, "t": 493.1683, "r": 266.25879, "b": 495.90433, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 164, "text": "3", "bbox": {"l": 264.29044, "t": 493.1683, "r": 266.25879, "b": 495.90433, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "text", "id": 153, "page_no": 9, "cluster": {"id": 153, "label": "text", "bbox": {"l": 227.91466, "t": 665.82603, "r": 230.10028, "b": 675.3464, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 165, "text": "\u03bc", "bbox": {"l": 227.91466, "t": 665.82603, "r": 230.10028, "b": 675.3464, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u03bc"}, {"label": "text", "id": 154, "page_no": 9, "cluster": {"id": 154, "label": "text", "bbox": {"l": 300.58057, "t": 683.62195, "r": 302.72638, "b": 693.428658, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 166, "text": "\u2265", "bbox": {"l": 300.58057, "t": 683.62195, "r": 302.72638, "b": 693.428658, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u2265"}], "headers": [{"label": "page_header", "id": 7, "page_no": 9, "cluster": {"id": 7, "label": "page_header", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 143.97887, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8309906721115112, "cells": [{"id": 0, "text": "10", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 143.97887, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "10"}, {"label": "page_header", "id": 6, "page_no": 9, "cluster": {"id": 6, "label": "page_header", "bbox": {"l": 167.82053, "t": 93.77099999999996, "r": 231.72049000000004, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8367074728012085, "cells": [{"id": 1, "text": "M.", "bbox": {"l": 167.82053, "t": 93.77099999999996, "r": 178.08249, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37929, "t": 93.77099999999996, "r": 231.72049000000004, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "M. Lysak, et al."}]}}, {"page_no": 10, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "11", "bbox": {"l": 471.37561, "t": 93.77099999999996, "r": 480.5894799999999, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Fig. 6.", "bbox": {"l": 134.765, "t": 125.79918999999984, "r": 162.64424, "b": 133.72551999999996, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Visualization of predicted structure and detected bounding boxes on a complex", "bbox": {"l": 165.215, "t": 125.86200000000008, "r": 480.58752, "b": 133.93169999999998, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "table with many rows. The OTSL model (B) captured repeating pattern of horizontally", "bbox": {"l": 134.765, "t": 136.82097999999996, "r": 480.58823, "b": 144.89068999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "merged cells from the GT (A), unlike the HTML model (C). The HTML model also", "bbox": {"l": 134.765, "t": 147.77997000000005, "r": 480.5881999999999, "b": 155.84966999999995, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "didn\u2019t complete the HTML sequence correctly and displayed a lot more of drift and", "bbox": {"l": 134.765, "t": 158.73895000000005, "r": 480.58838000000003, "b": 166.80864999999994, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "overlap of bounding boxes. \"PMC5406406_003_01.png\" PubTabNet.", "bbox": {"l": 134.765, "t": 169.69794000000002, "r": 415.84454, "b": 177.76764000000003, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "B", "bbox": {"l": 171.5049, "t": 312.45032, "r": 177.59613, "b": 320.36386, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "C", "bbox": {"l": 171.05823, "t": 492.65274, "r": 177.14946, "b": 500.56628, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Incorrect end of HTML sequence", "bbox": {"l": 283.047, "t": 627.48166, "r": 374.96332, "b": 633.4168099999999, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Horizontally merged cells are not present", "bbox": {"l": 283.047, "t": 617.35776, "r": 398.05978, "b": 623.29291, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Repeating pattern is well represented in predictions", "bbox": {"l": 293.64209, "t": 465.59784, "r": 437.50800000000004, "b": 471.53299, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Repeating pattern of", "bbox": {"l": 181.89114, "t": 288.35962000000006, "r": 239.23492, "b": 294.2947700000001, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "horizontally merged cells", "bbox": {"l": 181.89114, "t": 294.89423, "r": 251.52917, "b": 300.82938, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "A", "bbox": {"l": 247.83432, "t": 184.75989000000004, "r": 253.61339, "b": 194.81635000000006, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Bounding box drifting at the end", "bbox": {"l": 292.18976, "t": 607.80609, "r": 381.54663, "b": 613.7412400000001, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "OTSL", "bbox": {"l": 172.27777, "t": 381.36288, "r": 180.18666, "b": 403.40067, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "HTML", "bbox": {"l": 172.27747, "t": 555.7769499999999, "r": 180.18663, "b": 578.7478, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 0, "label": "page_header", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9301657676696777, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "page_header", "bbox": {"l": 471.37561, "t": 93.77099999999996, "r": 480.5894799999999, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9007200002670288, "cells": [{"id": 1, "text": "11", "bbox": {"l": 471.37561, "t": 93.77099999999996, "r": 480.5894799999999, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "caption", "bbox": {"l": 134.765, "t": 125.79918999999984, "r": 480.58838000000003, "b": 177.76764000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.8657059073448181, "cells": [{"id": 2, "text": "Fig. 6.", "bbox": {"l": 134.765, "t": 125.79918999999984, "r": 162.64424, "b": 133.72551999999996, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Visualization of predicted structure and detected bounding boxes on a complex", "bbox": {"l": 165.215, "t": 125.86200000000008, "r": 480.58752, "b": 133.93169999999998, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "table with many rows. The OTSL model (B) captured repeating pattern of horizontally", "bbox": {"l": 134.765, "t": 136.82097999999996, "r": 480.58823, "b": 144.89068999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "merged cells from the GT (A), unlike the HTML model (C). The HTML model also", "bbox": {"l": 134.765, "t": 147.77997000000005, "r": 480.5881999999999, "b": 155.84966999999995, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "didn\u2019t complete the HTML sequence correctly and displayed a lot more of drift and", "bbox": {"l": 134.765, "t": 158.73895000000005, "r": 480.58838000000003, "b": 166.80864999999994, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "overlap of bounding boxes. \"PMC5406406_003_01.png\" PubTabNet.", "bbox": {"l": 134.765, "t": 169.69794000000002, "r": 415.84454, "b": 177.76764000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "picture", "bbox": {"l": 168.3928985595703, "t": 181.96646118164062, "r": 447.3513488769531, "b": 634.0056762695312, "coord_origin": "TOPLEFT"}, "confidence": 0.7612658739089966, "cells": [{"id": 8, "text": "B", "bbox": {"l": 171.5049, "t": 312.45032, "r": 177.59613, "b": 320.36386, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "C", "bbox": {"l": 171.05823, "t": 492.65274, "r": 177.14946, "b": 500.56628, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Incorrect end of HTML sequence", "bbox": {"l": 283.047, "t": 627.48166, "r": 374.96332, "b": 633.4168099999999, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Horizontally merged cells are not present", "bbox": {"l": 283.047, "t": 617.35776, "r": 398.05978, "b": 623.29291, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Repeating pattern is well represented in predictions", "bbox": {"l": 293.64209, "t": 465.59784, "r": 437.50800000000004, "b": 471.53299, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Repeating pattern of", "bbox": {"l": 181.89114, "t": 288.35962000000006, "r": 239.23492, "b": 294.2947700000001, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "horizontally merged cells", "bbox": {"l": 181.89114, "t": 294.89423, "r": 251.52917, "b": 300.82938, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "A", "bbox": {"l": 247.83432, "t": 184.75989000000004, "r": 253.61339, "b": 194.81635000000006, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Bounding box drifting at the end", "bbox": {"l": 292.18976, "t": 607.80609, "r": 381.54663, "b": 613.7412400000001, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "OTSL", "bbox": {"l": 172.27777, "t": 381.36288, "r": 180.18666, "b": 403.40067, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "HTML", "bbox": {"l": 172.27747, "t": 555.7769499999999, "r": 180.18663, "b": 578.7478, "coord_origin": "TOPLEFT"}}], "children": [{"id": 3, "label": "text", "bbox": {"l": 171.5049, "t": 312.45032, "r": 177.59613, "b": 320.36386, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "B", "bbox": {"l": 171.5049, "t": 312.45032, "r": 177.59613, "b": 320.36386, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "text", "bbox": {"l": 171.05823, "t": 492.65274, "r": 177.14946, "b": 500.56628, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "C", "bbox": {"l": 171.05823, "t": 492.65274, "r": 177.14946, "b": 500.56628, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "text", "bbox": {"l": 283.047, "t": 627.48166, "r": 374.96332, "b": 633.4168099999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "Incorrect end of HTML sequence", "bbox": {"l": 283.047, "t": 627.48166, "r": 374.96332, "b": 633.4168099999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "text", "bbox": {"l": 283.047, "t": 617.35776, "r": 398.05978, "b": 623.29291, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "Horizontally merged cells are not present", "bbox": {"l": 283.047, "t": 617.35776, "r": 398.05978, "b": 623.29291, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "text", "bbox": {"l": 293.64209, "t": 465.59784, "r": 437.50800000000004, "b": 471.53299, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "Repeating pattern is well represented in predictions", "bbox": {"l": 293.64209, "t": 465.59784, "r": 437.50800000000004, "b": 471.53299, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "text", "bbox": {"l": 181.89114, "t": 288.35962000000006, "r": 239.23492, "b": 294.2947700000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "Repeating pattern of", "bbox": {"l": 181.89114, "t": 288.35962000000006, "r": 239.23492, "b": 294.2947700000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 181.89114, "t": 294.89423, "r": 251.52917, "b": 300.82938, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "horizontally merged cells", "bbox": {"l": 181.89114, "t": 294.89423, "r": 251.52917, "b": 300.82938, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "text", "bbox": {"l": 247.83432, "t": 184.75989000000004, "r": 253.61339, "b": 194.81635000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "A", "bbox": {"l": 247.83432, "t": 184.75989000000004, "r": 253.61339, "b": 194.81635000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 292.18976, "t": 607.80609, "r": 381.54663, "b": 613.7412400000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "Bounding box drifting at the end", "bbox": {"l": 292.18976, "t": 607.80609, "r": 381.54663, "b": 613.7412400000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 172.27777, "t": 381.36288, "r": 180.18666, "b": 403.40067, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "OTSL", "bbox": {"l": 172.27777, "t": 381.36288, "r": 180.18666, "b": 403.40067, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 172.27747, "t": 555.7769499999999, "r": 180.18663, "b": 578.7478, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "HTML", "bbox": {"l": 172.27747, "t": 555.7769499999999, "r": 180.18663, "b": 578.7478, "coord_origin": "TOPLEFT"}}], "children": []}]}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_header", "id": 0, "page_no": 10, "cluster": {"id": 0, "label": "page_header", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9301657676696777, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Optimized Table Tokenization for Table Structure Recognition"}, {"label": "page_header", "id": 1, "page_no": 10, "cluster": {"id": 1, "label": "page_header", "bbox": {"l": 471.37561, "t": 93.77099999999996, "r": 480.5894799999999, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9007200002670288, "cells": [{"id": 1, "text": "11", "bbox": {"l": 471.37561, "t": 93.77099999999996, "r": 480.5894799999999, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "11"}, {"label": "caption", "id": 2, "page_no": 10, "cluster": {"id": 2, "label": "caption", "bbox": {"l": 134.765, "t": 125.79918999999984, "r": 480.58838000000003, "b": 177.76764000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.8657059073448181, "cells": [{"id": 2, "text": "Fig. 6.", "bbox": {"l": 134.765, "t": 125.79918999999984, "r": 162.64424, "b": 133.72551999999996, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Visualization of predicted structure and detected bounding boxes on a complex", "bbox": {"l": 165.215, "t": 125.86200000000008, "r": 480.58752, "b": 133.93169999999998, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "table with many rows. The OTSL model (B) captured repeating pattern of horizontally", "bbox": {"l": 134.765, "t": 136.82097999999996, "r": 480.58823, "b": 144.89068999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "merged cells from the GT (A), unlike the HTML model (C). The HTML model also", "bbox": {"l": 134.765, "t": 147.77997000000005, "r": 480.5881999999999, "b": 155.84966999999995, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "didn\u2019t complete the HTML sequence correctly and displayed a lot more of drift and", "bbox": {"l": 134.765, "t": 158.73895000000005, "r": 480.58838000000003, "b": 166.80864999999994, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "overlap of bounding boxes. \"PMC5406406_003_01.png\" PubTabNet.", "bbox": {"l": 134.765, "t": 169.69794000000002, "r": 415.84454, "b": 177.76764000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Fig. 6. Visualization of predicted structure and detected bounding boxes on a complex table with many rows. The OTSL model (B) captured repeating pattern of horizontally merged cells from the GT (A), unlike the HTML model (C). The HTML model also didn\u2019t complete the HTML sequence correctly and displayed a lot more of drift and overlap of bounding boxes. \"PMC5406406_003_01.png\" PubTabNet."}, {"label": "picture", "id": 3, "page_no": 10, "cluster": {"id": 3, "label": "picture", "bbox": {"l": 168.3928985595703, "t": 181.96646118164062, "r": 447.3513488769531, "b": 634.0056762695312, "coord_origin": "TOPLEFT"}, "confidence": 0.7612658739089966, "cells": [{"id": 8, "text": "B", "bbox": {"l": 171.5049, "t": 312.45032, "r": 177.59613, "b": 320.36386, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "C", "bbox": {"l": 171.05823, "t": 492.65274, "r": 177.14946, "b": 500.56628, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Incorrect end of HTML sequence", "bbox": {"l": 283.047, "t": 627.48166, "r": 374.96332, "b": 633.4168099999999, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Horizontally merged cells are not present", "bbox": {"l": 283.047, "t": 617.35776, "r": 398.05978, "b": 623.29291, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Repeating pattern is well represented in predictions", "bbox": {"l": 293.64209, "t": 465.59784, "r": 437.50800000000004, "b": 471.53299, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Repeating pattern of", "bbox": {"l": 181.89114, "t": 288.35962000000006, "r": 239.23492, "b": 294.2947700000001, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "horizontally merged cells", "bbox": {"l": 181.89114, "t": 294.89423, "r": 251.52917, "b": 300.82938, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "A", "bbox": {"l": 247.83432, "t": 184.75989000000004, "r": 253.61339, "b": 194.81635000000006, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Bounding box drifting at the end", "bbox": {"l": 292.18976, "t": 607.80609, "r": 381.54663, "b": 613.7412400000001, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "OTSL", "bbox": {"l": 172.27777, "t": 381.36288, "r": 180.18666, "b": 403.40067, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "HTML", "bbox": {"l": 172.27747, "t": 555.7769499999999, "r": 180.18663, "b": 578.7478, "coord_origin": "TOPLEFT"}}], "children": [{"id": 3, "label": "text", "bbox": {"l": 171.5049, "t": 312.45032, "r": 177.59613, "b": 320.36386, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "B", "bbox": {"l": 171.5049, "t": 312.45032, "r": 177.59613, "b": 320.36386, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "text", "bbox": {"l": 171.05823, "t": 492.65274, "r": 177.14946, "b": 500.56628, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "C", "bbox": {"l": 171.05823, "t": 492.65274, "r": 177.14946, "b": 500.56628, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "text", "bbox": {"l": 283.047, "t": 627.48166, "r": 374.96332, "b": 633.4168099999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "Incorrect end of HTML sequence", "bbox": {"l": 283.047, "t": 627.48166, "r": 374.96332, "b": 633.4168099999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "text", "bbox": {"l": 283.047, "t": 617.35776, "r": 398.05978, "b": 623.29291, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "Horizontally merged cells are not present", "bbox": {"l": 283.047, "t": 617.35776, "r": 398.05978, "b": 623.29291, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "text", "bbox": {"l": 293.64209, "t": 465.59784, "r": 437.50800000000004, "b": 471.53299, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "Repeating pattern is well represented in predictions", "bbox": {"l": 293.64209, "t": 465.59784, "r": 437.50800000000004, "b": 471.53299, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "text", "bbox": {"l": 181.89114, "t": 288.35962000000006, "r": 239.23492, "b": 294.2947700000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "Repeating pattern of", "bbox": {"l": 181.89114, "t": 288.35962000000006, "r": 239.23492, "b": 294.2947700000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 181.89114, "t": 294.89423, "r": 251.52917, "b": 300.82938, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "horizontally merged cells", "bbox": {"l": 181.89114, "t": 294.89423, "r": 251.52917, "b": 300.82938, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "text", "bbox": {"l": 247.83432, "t": 184.75989000000004, "r": 253.61339, "b": 194.81635000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "A", "bbox": {"l": 247.83432, "t": 184.75989000000004, "r": 253.61339, "b": 194.81635000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 292.18976, "t": 607.80609, "r": 381.54663, "b": 613.7412400000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "Bounding box drifting at the end", "bbox": {"l": 292.18976, "t": 607.80609, "r": 381.54663, "b": 613.7412400000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 172.27777, "t": 381.36288, "r": 180.18666, "b": 403.40067, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "OTSL", "bbox": {"l": 172.27777, "t": 381.36288, "r": 180.18666, "b": 403.40067, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 172.27747, "t": 555.7769499999999, "r": 180.18663, "b": 578.7478, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "HTML", "bbox": {"l": 172.27747, "t": 555.7769499999999, "r": 180.18663, "b": 578.7478, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "body": [{"label": "caption", "id": 2, "page_no": 10, "cluster": {"id": 2, "label": "caption", "bbox": {"l": 134.765, "t": 125.79918999999984, "r": 480.58838000000003, "b": 177.76764000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.8657059073448181, "cells": [{"id": 2, "text": "Fig. 6.", "bbox": {"l": 134.765, "t": 125.79918999999984, "r": 162.64424, "b": 133.72551999999996, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Visualization of predicted structure and detected bounding boxes on a complex", "bbox": {"l": 165.215, "t": 125.86200000000008, "r": 480.58752, "b": 133.93169999999998, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "table with many rows. The OTSL model (B) captured repeating pattern of horizontally", "bbox": {"l": 134.765, "t": 136.82097999999996, "r": 480.58823, "b": 144.89068999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "merged cells from the GT (A), unlike the HTML model (C). The HTML model also", "bbox": {"l": 134.765, "t": 147.77997000000005, "r": 480.5881999999999, "b": 155.84966999999995, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "didn\u2019t complete the HTML sequence correctly and displayed a lot more of drift and", "bbox": {"l": 134.765, "t": 158.73895000000005, "r": 480.58838000000003, "b": 166.80864999999994, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "overlap of bounding boxes. \"PMC5406406_003_01.png\" PubTabNet.", "bbox": {"l": 134.765, "t": 169.69794000000002, "r": 415.84454, "b": 177.76764000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Fig. 6. Visualization of predicted structure and detected bounding boxes on a complex table with many rows. The OTSL model (B) captured repeating pattern of horizontally merged cells from the GT (A), unlike the HTML model (C). The HTML model also didn\u2019t complete the HTML sequence correctly and displayed a lot more of drift and overlap of bounding boxes. \"PMC5406406_003_01.png\" PubTabNet."}, {"label": "picture", "id": 3, "page_no": 10, "cluster": {"id": 3, "label": "picture", "bbox": {"l": 168.3928985595703, "t": 181.96646118164062, "r": 447.3513488769531, "b": 634.0056762695312, "coord_origin": "TOPLEFT"}, "confidence": 0.7612658739089966, "cells": [{"id": 8, "text": "B", "bbox": {"l": 171.5049, "t": 312.45032, "r": 177.59613, "b": 320.36386, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "C", "bbox": {"l": 171.05823, "t": 492.65274, "r": 177.14946, "b": 500.56628, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Incorrect end of HTML sequence", "bbox": {"l": 283.047, "t": 627.48166, "r": 374.96332, "b": 633.4168099999999, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Horizontally merged cells are not present", "bbox": {"l": 283.047, "t": 617.35776, "r": 398.05978, "b": 623.29291, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Repeating pattern is well represented in predictions", "bbox": {"l": 293.64209, "t": 465.59784, "r": 437.50800000000004, "b": 471.53299, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Repeating pattern of", "bbox": {"l": 181.89114, "t": 288.35962000000006, "r": 239.23492, "b": 294.2947700000001, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "horizontally merged cells", "bbox": {"l": 181.89114, "t": 294.89423, "r": 251.52917, "b": 300.82938, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "A", "bbox": {"l": 247.83432, "t": 184.75989000000004, "r": 253.61339, "b": 194.81635000000006, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Bounding box drifting at the end", "bbox": {"l": 292.18976, "t": 607.80609, "r": 381.54663, "b": 613.7412400000001, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "OTSL", "bbox": {"l": 172.27777, "t": 381.36288, "r": 180.18666, "b": 403.40067, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "HTML", "bbox": {"l": 172.27747, "t": 555.7769499999999, "r": 180.18663, "b": 578.7478, "coord_origin": "TOPLEFT"}}], "children": [{"id": 3, "label": "text", "bbox": {"l": 171.5049, "t": 312.45032, "r": 177.59613, "b": 320.36386, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "B", "bbox": {"l": 171.5049, "t": 312.45032, "r": 177.59613, "b": 320.36386, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "text", "bbox": {"l": 171.05823, "t": 492.65274, "r": 177.14946, "b": 500.56628, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "C", "bbox": {"l": 171.05823, "t": 492.65274, "r": 177.14946, "b": 500.56628, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "text", "bbox": {"l": 283.047, "t": 627.48166, "r": 374.96332, "b": 633.4168099999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "Incorrect end of HTML sequence", "bbox": {"l": 283.047, "t": 627.48166, "r": 374.96332, "b": 633.4168099999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "text", "bbox": {"l": 283.047, "t": 617.35776, "r": 398.05978, "b": 623.29291, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "Horizontally merged cells are not present", "bbox": {"l": 283.047, "t": 617.35776, "r": 398.05978, "b": 623.29291, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "text", "bbox": {"l": 293.64209, "t": 465.59784, "r": 437.50800000000004, "b": 471.53299, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "Repeating pattern is well represented in predictions", "bbox": {"l": 293.64209, "t": 465.59784, "r": 437.50800000000004, "b": 471.53299, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "text", "bbox": {"l": 181.89114, "t": 288.35962000000006, "r": 239.23492, "b": 294.2947700000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "Repeating pattern of", "bbox": {"l": 181.89114, "t": 288.35962000000006, "r": 239.23492, "b": 294.2947700000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 181.89114, "t": 294.89423, "r": 251.52917, "b": 300.82938, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "horizontally merged cells", "bbox": {"l": 181.89114, "t": 294.89423, "r": 251.52917, "b": 300.82938, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "text", "bbox": {"l": 247.83432, "t": 184.75989000000004, "r": 253.61339, "b": 194.81635000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "A", "bbox": {"l": 247.83432, "t": 184.75989000000004, "r": 253.61339, "b": 194.81635000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 292.18976, "t": 607.80609, "r": 381.54663, "b": 613.7412400000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "Bounding box drifting at the end", "bbox": {"l": 292.18976, "t": 607.80609, "r": 381.54663, "b": 613.7412400000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 172.27777, "t": 381.36288, "r": 180.18666, "b": 403.40067, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "OTSL", "bbox": {"l": 172.27777, "t": 381.36288, "r": 180.18666, "b": 403.40067, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 172.27747, "t": 555.7769499999999, "r": 180.18663, "b": 578.7478, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "HTML", "bbox": {"l": 172.27747, "t": 555.7769499999999, "r": 180.18663, "b": 578.7478, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "headers": [{"label": "page_header", "id": 0, "page_no": 10, "cluster": {"id": 0, "label": "page_header", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9301657676696777, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Optimized Table Tokenization for Table Structure Recognition"}, {"label": "page_header", "id": 1, "page_no": 10, "cluster": {"id": 1, "label": "page_header", "bbox": {"l": 471.37561, "t": 93.77099999999996, "r": 480.5894799999999, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9007200002670288, "cells": [{"id": 1, "text": "11", "bbox": {"l": 471.37561, "t": 93.77099999999996, "r": 480.5894799999999, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "11"}]}}, {"page_no": 11, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "12", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 143.97887, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "M.", "bbox": {"l": 167.82053, "t": 93.77099999999996, "r": 178.08249, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37929, "t": 93.77099999999996, "r": 231.72049000000004, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "6", "bbox": {"l": 134.765, "t": 117.54894999999988, "r": 141.4886, "b": 128.11737000000005, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Conclusion", "bbox": {"l": 154.9382, "t": 117.54894999999988, "r": 219.25478999999999, "b": 128.11737000000005, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "We demonstrated that representing tables in HTML for the task of table struc-", "bbox": {"l": 134.765, "t": 146.86377000000005, "r": 480.59476, "b": 155.66076999999996, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "ture recognition with Im2Seq models is ill-suited and has serious limitations.", "bbox": {"l": 134.765, "t": 158.81879000000004, "r": 480.59476, "b": 167.61577999999997, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Furthermore, we presented in this paper an Optimized Table Structure Language", "bbox": {"l": 134.765, "t": 170.77380000000005, "r": 480.58978, "b": 179.57079999999996, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "(OTSL) which, when compared to commonly used general purpose languages,", "bbox": {"l": 134.765, "t": 182.72979999999995, "r": 480.59569999999997, "b": 191.52679, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "has several key benefits.", "bbox": {"l": 134.765, "t": 194.68480999999997, "r": 239.5387, "b": 203.48181, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "First and foremost, given the same network configuration, inference time for", "bbox": {"l": 149.709, "t": 207.44379000000004, "r": 480.59283000000005, "b": 216.24077999999997, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "a table-structure prediction is about 2 times faster compared to the conventional", "bbox": {"l": 134.765, "t": 219.39880000000005, "r": 480.59365999999994, "b": 228.19579999999996, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "HTML approach. This is primarily owed to the shorter sequence length of the", "bbox": {"l": 134.765, "t": 231.35382000000004, "r": 480.59079, "b": 240.15081999999995, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "OTSL representation. Additional performance benefits can be obtained with", "bbox": {"l": 134.765, "t": 243.30884000000003, "r": 480.58786000000003, "b": 252.10582999999997, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "HPO (hyper parameter optimization). As we demonstrate in our experiments,", "bbox": {"l": 134.765, "t": 255.26482999999996, "r": 480.59479, "b": 264.06183, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "models trained on OTSL can be significantly smaller, e.g. by reducing the number", "bbox": {"l": 134.765, "t": 267.21984999999995, "r": 480.5878000000001, "b": 276.01685, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "of encoder and decoder layers, while preserving comparatively good prediction", "bbox": {"l": 134.765, "t": 279.17487000000006, "r": 480.59268, "b": 287.97183, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "quality. This can further improve inference performance, yielding 5-6 times faster", "bbox": {"l": 134.765, "t": 291.12985, "r": 480.58871, "b": 299.92682, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "inference speed in OTSL with prediction quality comparable to models trained", "bbox": {"l": 134.765, "t": 303.08484, "r": 480.59375, "b": 311.88181, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "on HTML (see Table 1).", "bbox": {"l": 134.765, "t": 315.03983, "r": 240.92351000000002, "b": 323.83679, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Secondly, OTSL has more inherent structure and a significantly restricted vo-", "bbox": {"l": 149.709, "t": 327.79883, "r": 480.58984, "b": 336.5957900000001, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "cabulary size. This allows autoregressive models to perform better in the TED", "bbox": {"l": 134.765, "t": 339.75482, "r": 480.59473, "b": 348.55179, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "metric, but especially with regards to prediction accuracy of the table-cell bound-", "bbox": {"l": 134.765, "t": 351.70981, "r": 480.58664, "b": 360.50677, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "ing boxes (see Table 2). As shown in Figure 5, we observe that the OTSL dras-", "bbox": {"l": 134.765, "t": 363.66479, "r": 480.59479, "b": 372.46176, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "tically reduces the drift for table cell bounding boxes at high row count and in", "bbox": {"l": 134.765, "t": 375.61978, "r": 480.58971999999994, "b": 384.41675, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "sparse tables. This leads to more accurate predictions and a significant reduction", "bbox": {"l": 134.765, "t": 387.57477, "r": 480.58673, "b": 396.37173, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "in post-processing complexity, which is an undesired necessity in HTML-based", "bbox": {"l": 134.765, "t": 399.53076, "r": 480.58574999999996, "b": 408.32773, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Im2Seq models. Significant novelty lies in OTSL syntactical rules, which are few,", "bbox": {"l": 134.765, "t": 411.48575, "r": 480.58675999999997, "b": 420.28271, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "simple and always backwards looking. Each new token can be validated only by", "bbox": {"l": 134.765, "t": 423.44073, "r": 480.59482, "b": 432.23769999999996, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "analyzing the sequence of previous tokens, without requiring the entire sequence", "bbox": {"l": 134.765, "t": 435.39572, "r": 480.58777, "b": 444.19269, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "to detect mistakes. This in return allows to perform structural error detection", "bbox": {"l": 134.765, "t": 447.35071, "r": 480.58968999999996, "b": 456.14767, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "and correction on-the-fly during sequence generation.", "bbox": {"l": 134.765, "t": 459.30569, "r": 366.77698, "b": 468.10266, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "References", "bbox": {"l": 134.765, "t": 493.82083, "r": 197.68642, "b": 504.38922, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "1.", "bbox": {"l": 139.371, "t": 522.87985, "r": 146.46127, "b": 530.94962, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Auer, C., Dolfi, M., Carvalho, A., Ramis, C.B., Staar, P.W.J.: Delivering doc-", "bbox": {"l": 151.01955, "t": 522.87985, "r": 480.5920100000001, "b": 530.94962, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "ument conversion as a cloud service with high throughput and responsiveness.", "bbox": {"l": 151.51801, "t": 533.83887, "r": 480.58667, "b": 541.90862, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "CoRR", "bbox": {"l": 151.51801, "t": 544.79785, "r": 176.34149, "b": 552.86761, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "abs/2206.00785", "bbox": {"l": 179.464, "t": 544.73509, "r": 250.67963, "b": 552.66139, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "(2022).", "bbox": {"l": 253.804, "t": 544.79785, "r": 281.9567, "b": 552.86761, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "https://doi.org/10.48550/arXiv.2206.00785", "bbox": {"l": 285.078, "t": 545.44344, "r": 478.03403000000003, "b": 552.91245, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": ",", "bbox": {"l": 478.0319799999999, "t": 544.79785, "r": 480.59099999999995, "b": 552.86761, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "https://doi.org/10.48550/arXiv.2206.00785", "bbox": {"l": 151.51797, "t": 556.4024400000001, "r": 344.474, "b": 563.87144, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "2.", "bbox": {"l": 139.37097, "t": 567.51884, "r": 145.94186, "b": 575.58861, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Chen, B., Peng, D., Zhang, J., Ren, Y., Jin, L.: Complex table structure recognition", "bbox": {"l": 150.16624, "t": 567.51884, "r": 480.58636, "b": 575.58861, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "in the wild using transformer and identity matrix-based augmentation. In: Porwal,", "bbox": {"l": 151.51797, "t": 578.47784, "r": 480.59012, "b": 586.5476100000001, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "U., Forn\u00e9s, A., Shafait, F. (eds.) Frontiers in Handwriting Recognition. pp. 545-", "bbox": {"l": 151.51797, "t": 589.43684, "r": 480.5920100000001, "b": 597.50661, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "561. Springer International Publishing, Cham (2022)", "bbox": {"l": 151.51797, "t": 600.39584, "r": 364.17856, "b": 608.46561, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "3.", "bbox": {"l": 139.37097, "t": 612.1588399999999, "r": 146.4379, "b": 620.22861, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Chi, Z., Huang, H., Xu, H.D., Yu, H., Yin, W., Mao, X.L.: Complicated table", "bbox": {"l": 150.98117, "t": 612.1588399999999, "r": 480.58731000000006, "b": 620.22861, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "structure recognition. arXiv preprint arXiv:1908.04729 (2019)", "bbox": {"l": 151.51797, "t": 623.11784, "r": 400.22525, "b": 631.18761, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "4.", "bbox": {"l": 139.37097, "t": 634.88084, "r": 146.52443, "b": 642.95061, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Deng, Y., Rosenberg, D., Mann, G.: Challenges in end-to-end neural scientific", "bbox": {"l": 151.12335, "t": 634.88084, "r": 480.58826, "b": 642.95061, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "table recognition. In: 2019 International Conference on Document Analysis and", "bbox": {"l": 151.51797, "t": 645.83984, "r": 480.58752, "b": 653.9096099999999, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Recognition (ICDAR). pp. 894-901. IEEE (2019)", "bbox": {"l": 151.51797, "t": 656.79785, "r": 350.11115, "b": 664.86761, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 10, "label": "page_header", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 143.97887, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8610828518867493, "cells": [{"id": 0, "text": "12", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 143.97887, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "page_header", "bbox": {"l": 167.82053, "t": 93.77099999999996, "r": 231.72049000000004, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8927666544914246, "cells": [{"id": 1, "text": "M.", "bbox": {"l": 167.82053, "t": 93.77099999999996, "r": 178.08249, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37929, "t": 93.77099999999996, "r": 231.72049000000004, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "section_header", "bbox": {"l": 134.765, "t": 117.54894999999988, "r": 219.25478999999999, "b": 128.11737000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.915635347366333, "cells": [{"id": 3, "text": "6", "bbox": {"l": 134.765, "t": 117.54894999999988, "r": 141.4886, "b": 128.11737000000005, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Conclusion", "bbox": {"l": 154.9382, "t": 117.54894999999988, "r": 219.25478999999999, "b": 128.11737000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 134.765, "t": 146.86377000000005, "r": 480.59569999999997, "b": 203.48181, "coord_origin": "TOPLEFT"}, "confidence": 0.9806171655654907, "cells": [{"id": 5, "text": "We demonstrated that representing tables in HTML for the task of table struc-", "bbox": {"l": 134.765, "t": 146.86377000000005, "r": 480.59476, "b": 155.66076999999996, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "ture recognition with Im2Seq models is ill-suited and has serious limitations.", "bbox": {"l": 134.765, "t": 158.81879000000004, "r": 480.59476, "b": 167.61577999999997, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Furthermore, we presented in this paper an Optimized Table Structure Language", "bbox": {"l": 134.765, "t": 170.77380000000005, "r": 480.58978, "b": 179.57079999999996, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "(OTSL) which, when compared to commonly used general purpose languages,", "bbox": {"l": 134.765, "t": 182.72979999999995, "r": 480.59569999999997, "b": 191.52679, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "has several key benefits.", "bbox": {"l": 134.765, "t": 194.68480999999997, "r": 239.5387, "b": 203.48181, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 134.765, "t": 207.44379000000004, "r": 480.59479, "b": 323.83679, "coord_origin": "TOPLEFT"}, "confidence": 0.9873477220535278, "cells": [{"id": 10, "text": "First and foremost, given the same network configuration, inference time for", "bbox": {"l": 149.709, "t": 207.44379000000004, "r": 480.59283000000005, "b": 216.24077999999997, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "a table-structure prediction is about 2 times faster compared to the conventional", "bbox": {"l": 134.765, "t": 219.39880000000005, "r": 480.59365999999994, "b": 228.19579999999996, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "HTML approach. This is primarily owed to the shorter sequence length of the", "bbox": {"l": 134.765, "t": 231.35382000000004, "r": 480.59079, "b": 240.15081999999995, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "OTSL representation. Additional performance benefits can be obtained with", "bbox": {"l": 134.765, "t": 243.30884000000003, "r": 480.58786000000003, "b": 252.10582999999997, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "HPO (hyper parameter optimization). As we demonstrate in our experiments,", "bbox": {"l": 134.765, "t": 255.26482999999996, "r": 480.59479, "b": 264.06183, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "models trained on OTSL can be significantly smaller, e.g. by reducing the number", "bbox": {"l": 134.765, "t": 267.21984999999995, "r": 480.5878000000001, "b": 276.01685, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "of encoder and decoder layers, while preserving comparatively good prediction", "bbox": {"l": 134.765, "t": 279.17487000000006, "r": 480.59268, "b": 287.97183, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "quality. This can further improve inference performance, yielding 5-6 times faster", "bbox": {"l": 134.765, "t": 291.12985, "r": 480.58871, "b": 299.92682, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "inference speed in OTSL with prediction quality comparable to models trained", "bbox": {"l": 134.765, "t": 303.08484, "r": 480.59375, "b": 311.88181, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "on HTML (see Table 1).", "bbox": {"l": 134.765, "t": 315.03983, "r": 240.92351000000002, "b": 323.83679, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 134.765, "t": 327.79883, "r": 480.59482, "b": 468.10266, "coord_origin": "TOPLEFT"}, "confidence": 0.9868747591972351, "cells": [{"id": 20, "text": "Secondly, OTSL has more inherent structure and a significantly restricted vo-", "bbox": {"l": 149.709, "t": 327.79883, "r": 480.58984, "b": 336.5957900000001, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "cabulary size. This allows autoregressive models to perform better in the TED", "bbox": {"l": 134.765, "t": 339.75482, "r": 480.59473, "b": 348.55179, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "metric, but especially with regards to prediction accuracy of the table-cell bound-", "bbox": {"l": 134.765, "t": 351.70981, "r": 480.58664, "b": 360.50677, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "ing boxes (see Table 2). As shown in Figure 5, we observe that the OTSL dras-", "bbox": {"l": 134.765, "t": 363.66479, "r": 480.59479, "b": 372.46176, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "tically reduces the drift for table cell bounding boxes at high row count and in", "bbox": {"l": 134.765, "t": 375.61978, "r": 480.58971999999994, "b": 384.41675, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "sparse tables. This leads to more accurate predictions and a significant reduction", "bbox": {"l": 134.765, "t": 387.57477, "r": 480.58673, "b": 396.37173, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "in post-processing complexity, which is an undesired necessity in HTML-based", "bbox": {"l": 134.765, "t": 399.53076, "r": 480.58574999999996, "b": 408.32773, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Im2Seq models. Significant novelty lies in OTSL syntactical rules, which are few,", "bbox": {"l": 134.765, "t": 411.48575, "r": 480.58675999999997, "b": 420.28271, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "simple and always backwards looking. Each new token can be validated only by", "bbox": {"l": 134.765, "t": 423.44073, "r": 480.59482, "b": 432.23769999999996, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "analyzing the sequence of previous tokens, without requiring the entire sequence", "bbox": {"l": 134.765, "t": 435.39572, "r": 480.58777, "b": 444.19269, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "to detect mistakes. This in return allows to perform structural error detection", "bbox": {"l": 134.765, "t": 447.35071, "r": 480.58968999999996, "b": 456.14767, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "and correction on-the-fly during sequence generation.", "bbox": {"l": 134.765, "t": 459.30569, "r": 366.77698, "b": 468.10266, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "section_header", "bbox": {"l": 134.765, "t": 493.82083, "r": 197.68642, "b": 504.38922, "coord_origin": "TOPLEFT"}, "confidence": 0.9403266310691833, "cells": [{"id": 32, "text": "References", "bbox": {"l": 134.765, "t": 493.82083, "r": 197.68642, "b": 504.38922, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "list_item", "bbox": {"l": 139.371, "t": 522.87985, "r": 480.5920100000001, "b": 563.87144, "coord_origin": "TOPLEFT"}, "confidence": 0.9698606729507446, "cells": [{"id": 33, "text": "1.", "bbox": {"l": 139.371, "t": 522.87985, "r": 146.46127, "b": 530.94962, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Auer, C., Dolfi, M., Carvalho, A., Ramis, C.B., Staar, P.W.J.: Delivering doc-", "bbox": {"l": 151.01955, "t": 522.87985, "r": 480.5920100000001, "b": 530.94962, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "ument conversion as a cloud service with high throughput and responsiveness.", "bbox": {"l": 151.51801, "t": 533.83887, "r": 480.58667, "b": 541.90862, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "CoRR", "bbox": {"l": 151.51801, "t": 544.79785, "r": 176.34149, "b": 552.86761, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "abs/2206.00785", "bbox": {"l": 179.464, "t": 544.73509, "r": 250.67963, "b": 552.66139, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "(2022).", "bbox": {"l": 253.804, "t": 544.79785, "r": 281.9567, "b": 552.86761, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "https://doi.org/10.48550/arXiv.2206.00785", "bbox": {"l": 285.078, "t": 545.44344, "r": 478.03403000000003, "b": 552.91245, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": ",", "bbox": {"l": 478.0319799999999, "t": 544.79785, "r": 480.59099999999995, "b": 552.86761, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "https://doi.org/10.48550/arXiv.2206.00785", "bbox": {"l": 151.51797, "t": 556.4024400000001, "r": 344.474, "b": 563.87144, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "list_item", "bbox": {"l": 139.37097, "t": 567.51884, "r": 480.5920100000001, "b": 608.46561, "coord_origin": "TOPLEFT"}, "confidence": 0.9730570316314697, "cells": [{"id": 42, "text": "2.", "bbox": {"l": 139.37097, "t": 567.51884, "r": 145.94186, "b": 575.58861, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Chen, B., Peng, D., Zhang, J., Ren, Y., Jin, L.: Complex table structure recognition", "bbox": {"l": 150.16624, "t": 567.51884, "r": 480.58636, "b": 575.58861, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "in the wild using transformer and identity matrix-based augmentation. In: Porwal,", "bbox": {"l": 151.51797, "t": 578.47784, "r": 480.59012, "b": 586.5476100000001, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "U., Forn\u00e9s, A., Shafait, F. (eds.) Frontiers in Handwriting Recognition. pp. 545-", "bbox": {"l": 151.51797, "t": 589.43684, "r": 480.5920100000001, "b": 597.50661, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "561. Springer International Publishing, Cham (2022)", "bbox": {"l": 151.51797, "t": 600.39584, "r": 364.17856, "b": 608.46561, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "list_item", "bbox": {"l": 139.37097, "t": 612.1588399999999, "r": 480.58731000000006, "b": 631.18761, "coord_origin": "TOPLEFT"}, "confidence": 0.9617196321487427, "cells": [{"id": 47, "text": "3.", "bbox": {"l": 139.37097, "t": 612.1588399999999, "r": 146.4379, "b": 620.22861, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Chi, Z., Huang, H., Xu, H.D., Yu, H., Yin, W., Mao, X.L.: Complicated table", "bbox": {"l": 150.98117, "t": 612.1588399999999, "r": 480.58731000000006, "b": 620.22861, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "structure recognition. arXiv preprint arXiv:1908.04729 (2019)", "bbox": {"l": 151.51797, "t": 623.11784, "r": 400.22525, "b": 631.18761, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "list_item", "bbox": {"l": 139.37097, "t": 634.88084, "r": 480.58826, "b": 664.86761, "coord_origin": "TOPLEFT"}, "confidence": 0.9754673838615417, "cells": [{"id": 50, "text": "4.", "bbox": {"l": 139.37097, "t": 634.88084, "r": 146.52443, "b": 642.95061, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Deng, Y., Rosenberg, D., Mann, G.: Challenges in end-to-end neural scientific", "bbox": {"l": 151.12335, "t": 634.88084, "r": 480.58826, "b": 642.95061, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "table recognition. In: 2019 International Conference on Document Analysis and", "bbox": {"l": 151.51797, "t": 645.83984, "r": 480.58752, "b": 653.9096099999999, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Recognition (ICDAR). pp. 894-901. IEEE (2019)", "bbox": {"l": 151.51797, "t": 656.79785, "r": 350.11115, "b": 664.86761, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_header", "id": 10, "page_no": 11, "cluster": {"id": 10, "label": "page_header", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 143.97887, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8610828518867493, "cells": [{"id": 0, "text": "12", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 143.97887, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "12"}, {"label": "page_header", "id": 9, "page_no": 11, "cluster": {"id": 9, "label": "page_header", "bbox": {"l": 167.82053, "t": 93.77099999999996, "r": 231.72049000000004, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8927666544914246, "cells": [{"id": 1, "text": "M.", "bbox": {"l": 167.82053, "t": 93.77099999999996, "r": 178.08249, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37929, "t": 93.77099999999996, "r": 231.72049000000004, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "M. Lysak, et al."}, {"label": "section_header", "id": 8, "page_no": 11, "cluster": {"id": 8, "label": "section_header", "bbox": {"l": 134.765, "t": 117.54894999999988, "r": 219.25478999999999, "b": 128.11737000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.915635347366333, "cells": [{"id": 3, "text": "6", "bbox": {"l": 134.765, "t": 117.54894999999988, "r": 141.4886, "b": 128.11737000000005, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Conclusion", "bbox": {"l": 154.9382, "t": 117.54894999999988, "r": 219.25478999999999, "b": 128.11737000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "6 Conclusion"}, {"label": "text", "id": 2, "page_no": 11, "cluster": {"id": 2, "label": "text", "bbox": {"l": 134.765, "t": 146.86377000000005, "r": 480.59569999999997, "b": 203.48181, "coord_origin": "TOPLEFT"}, "confidence": 0.9806171655654907, "cells": [{"id": 5, "text": "We demonstrated that representing tables in HTML for the task of table struc-", "bbox": {"l": 134.765, "t": 146.86377000000005, "r": 480.59476, "b": 155.66076999999996, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "ture recognition with Im2Seq models is ill-suited and has serious limitations.", "bbox": {"l": 134.765, "t": 158.81879000000004, "r": 480.59476, "b": 167.61577999999997, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Furthermore, we presented in this paper an Optimized Table Structure Language", "bbox": {"l": 134.765, "t": 170.77380000000005, "r": 480.58978, "b": 179.57079999999996, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "(OTSL) which, when compared to commonly used general purpose languages,", "bbox": {"l": 134.765, "t": 182.72979999999995, "r": 480.59569999999997, "b": 191.52679, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "has several key benefits.", "bbox": {"l": 134.765, "t": 194.68480999999997, "r": 239.5387, "b": 203.48181, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "We demonstrated that representing tables in HTML for the task of table structure recognition with Im2Seq models is ill-suited and has serious limitations. Furthermore, we presented in this paper an Optimized Table Structure Language (OTSL) which, when compared to commonly used general purpose languages, has several key benefits."}, {"label": "text", "id": 0, "page_no": 11, "cluster": {"id": 0, "label": "text", "bbox": {"l": 134.765, "t": 207.44379000000004, "r": 480.59479, "b": 323.83679, "coord_origin": "TOPLEFT"}, "confidence": 0.9873477220535278, "cells": [{"id": 10, "text": "First and foremost, given the same network configuration, inference time for", "bbox": {"l": 149.709, "t": 207.44379000000004, "r": 480.59283000000005, "b": 216.24077999999997, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "a table-structure prediction is about 2 times faster compared to the conventional", "bbox": {"l": 134.765, "t": 219.39880000000005, "r": 480.59365999999994, "b": 228.19579999999996, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "HTML approach. This is primarily owed to the shorter sequence length of the", "bbox": {"l": 134.765, "t": 231.35382000000004, "r": 480.59079, "b": 240.15081999999995, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "OTSL representation. Additional performance benefits can be obtained with", "bbox": {"l": 134.765, "t": 243.30884000000003, "r": 480.58786000000003, "b": 252.10582999999997, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "HPO (hyper parameter optimization). As we demonstrate in our experiments,", "bbox": {"l": 134.765, "t": 255.26482999999996, "r": 480.59479, "b": 264.06183, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "models trained on OTSL can be significantly smaller, e.g. by reducing the number", "bbox": {"l": 134.765, "t": 267.21984999999995, "r": 480.5878000000001, "b": 276.01685, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "of encoder and decoder layers, while preserving comparatively good prediction", "bbox": {"l": 134.765, "t": 279.17487000000006, "r": 480.59268, "b": 287.97183, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "quality. This can further improve inference performance, yielding 5-6 times faster", "bbox": {"l": 134.765, "t": 291.12985, "r": 480.58871, "b": 299.92682, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "inference speed in OTSL with prediction quality comparable to models trained", "bbox": {"l": 134.765, "t": 303.08484, "r": 480.59375, "b": 311.88181, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "on HTML (see Table 1).", "bbox": {"l": 134.765, "t": 315.03983, "r": 240.92351000000002, "b": 323.83679, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "First and foremost, given the same network configuration, inference time for a table-structure prediction is about 2 times faster compared to the conventional HTML approach. This is primarily owed to the shorter sequence length of the OTSL representation. Additional performance benefits can be obtained with HPO (hyper parameter optimization). As we demonstrate in our experiments, models trained on OTSL can be significantly smaller, e.g. by reducing the number of encoder and decoder layers, while preserving comparatively good prediction quality. This can further improve inference performance, yielding 5-6 times faster inference speed in OTSL with prediction quality comparable to models trained on HTML (see Table 1)."}, {"label": "text", "id": 1, "page_no": 11, "cluster": {"id": 1, "label": "text", "bbox": {"l": 134.765, "t": 327.79883, "r": 480.59482, "b": 468.10266, "coord_origin": "TOPLEFT"}, "confidence": 0.9868747591972351, "cells": [{"id": 20, "text": "Secondly, OTSL has more inherent structure and a significantly restricted vo-", "bbox": {"l": 149.709, "t": 327.79883, "r": 480.58984, "b": 336.5957900000001, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "cabulary size. This allows autoregressive models to perform better in the TED", "bbox": {"l": 134.765, "t": 339.75482, "r": 480.59473, "b": 348.55179, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "metric, but especially with regards to prediction accuracy of the table-cell bound-", "bbox": {"l": 134.765, "t": 351.70981, "r": 480.58664, "b": 360.50677, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "ing boxes (see Table 2). As shown in Figure 5, we observe that the OTSL dras-", "bbox": {"l": 134.765, "t": 363.66479, "r": 480.59479, "b": 372.46176, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "tically reduces the drift for table cell bounding boxes at high row count and in", "bbox": {"l": 134.765, "t": 375.61978, "r": 480.58971999999994, "b": 384.41675, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "sparse tables. This leads to more accurate predictions and a significant reduction", "bbox": {"l": 134.765, "t": 387.57477, "r": 480.58673, "b": 396.37173, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "in post-processing complexity, which is an undesired necessity in HTML-based", "bbox": {"l": 134.765, "t": 399.53076, "r": 480.58574999999996, "b": 408.32773, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Im2Seq models. Significant novelty lies in OTSL syntactical rules, which are few,", "bbox": {"l": 134.765, "t": 411.48575, "r": 480.58675999999997, "b": 420.28271, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "simple and always backwards looking. Each new token can be validated only by", "bbox": {"l": 134.765, "t": 423.44073, "r": 480.59482, "b": 432.23769999999996, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "analyzing the sequence of previous tokens, without requiring the entire sequence", "bbox": {"l": 134.765, "t": 435.39572, "r": 480.58777, "b": 444.19269, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "to detect mistakes. This in return allows to perform structural error detection", "bbox": {"l": 134.765, "t": 447.35071, "r": 480.58968999999996, "b": 456.14767, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "and correction on-the-fly during sequence generation.", "bbox": {"l": 134.765, "t": 459.30569, "r": 366.77698, "b": 468.10266, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Secondly, OTSL has more inherent structure and a significantly restricted vocabulary size. This allows autoregressive models to perform better in the TED metric, but especially with regards to prediction accuracy of the table-cell bounding boxes (see Table 2). As shown in Figure 5, we observe that the OTSL drastically reduces the drift for table cell bounding boxes at high row count and in sparse tables. This leads to more accurate predictions and a significant reduction in post-processing complexity, which is an undesired necessity in HTML-based Im2Seq models. Significant novelty lies in OTSL syntactical rules, which are few, simple and always backwards looking. Each new token can be validated only by analyzing the sequence of previous tokens, without requiring the entire sequence to detect mistakes. This in return allows to perform structural error detection and correction on-the-fly during sequence generation."}, {"label": "section_header", "id": 7, "page_no": 11, "cluster": {"id": 7, "label": "section_header", "bbox": {"l": 134.765, "t": 493.82083, "r": 197.68642, "b": 504.38922, "coord_origin": "TOPLEFT"}, "confidence": 0.9403266310691833, "cells": [{"id": 32, "text": "References", "bbox": {"l": 134.765, "t": 493.82083, "r": 197.68642, "b": 504.38922, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "References"}, {"label": "list_item", "id": 5, "page_no": 11, "cluster": {"id": 5, "label": "list_item", "bbox": {"l": 139.371, "t": 522.87985, "r": 480.5920100000001, "b": 563.87144, "coord_origin": "TOPLEFT"}, "confidence": 0.9698606729507446, "cells": [{"id": 33, "text": "1.", "bbox": {"l": 139.371, "t": 522.87985, "r": 146.46127, "b": 530.94962, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Auer, C., Dolfi, M., Carvalho, A., Ramis, C.B., Staar, P.W.J.: Delivering doc-", "bbox": {"l": 151.01955, "t": 522.87985, "r": 480.5920100000001, "b": 530.94962, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "ument conversion as a cloud service with high throughput and responsiveness.", "bbox": {"l": 151.51801, "t": 533.83887, "r": 480.58667, "b": 541.90862, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "CoRR", "bbox": {"l": 151.51801, "t": 544.79785, "r": 176.34149, "b": 552.86761, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "abs/2206.00785", "bbox": {"l": 179.464, "t": 544.73509, "r": 250.67963, "b": 552.66139, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "(2022).", "bbox": {"l": 253.804, "t": 544.79785, "r": 281.9567, "b": 552.86761, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "https://doi.org/10.48550/arXiv.2206.00785", "bbox": {"l": 285.078, "t": 545.44344, "r": 478.03403000000003, "b": 552.91245, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": ",", "bbox": {"l": 478.0319799999999, "t": 544.79785, "r": 480.59099999999995, "b": 552.86761, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "https://doi.org/10.48550/arXiv.2206.00785", "bbox": {"l": 151.51797, "t": 556.4024400000001, "r": 344.474, "b": 563.87144, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1. Auer, C., Dolfi, M., Carvalho, A., Ramis, C.B., Staar, P.W.J.: Delivering document conversion as a cloud service with high throughput and responsiveness. CoRR abs/2206.00785 (2022). https://doi.org/10.48550/arXiv.2206.00785 , https://doi.org/10.48550/arXiv.2206.00785"}, {"label": "list_item", "id": 4, "page_no": 11, "cluster": {"id": 4, "label": "list_item", "bbox": {"l": 139.37097, "t": 567.51884, "r": 480.5920100000001, "b": 608.46561, "coord_origin": "TOPLEFT"}, "confidence": 0.9730570316314697, "cells": [{"id": 42, "text": "2.", "bbox": {"l": 139.37097, "t": 567.51884, "r": 145.94186, "b": 575.58861, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Chen, B., Peng, D., Zhang, J., Ren, Y., Jin, L.: Complex table structure recognition", "bbox": {"l": 150.16624, "t": 567.51884, "r": 480.58636, "b": 575.58861, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "in the wild using transformer and identity matrix-based augmentation. In: Porwal,", "bbox": {"l": 151.51797, "t": 578.47784, "r": 480.59012, "b": 586.5476100000001, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "U., Forn\u00e9s, A., Shafait, F. (eds.) Frontiers in Handwriting Recognition. pp. 545-", "bbox": {"l": 151.51797, "t": 589.43684, "r": 480.5920100000001, "b": 597.50661, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "561. Springer International Publishing, Cham (2022)", "bbox": {"l": 151.51797, "t": 600.39584, "r": 364.17856, "b": 608.46561, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2. Chen, B., Peng, D., Zhang, J., Ren, Y., Jin, L.: Complex table structure recognition in the wild using transformer and identity matrix-based augmentation. In: Porwal, U., Forn\u00e9s, A., Shafait, F. (eds.) Frontiers in Handwriting Recognition. pp. 545561. Springer International Publishing, Cham (2022)"}, {"label": "list_item", "id": 6, "page_no": 11, "cluster": {"id": 6, "label": "list_item", "bbox": {"l": 139.37097, "t": 612.1588399999999, "r": 480.58731000000006, "b": 631.18761, "coord_origin": "TOPLEFT"}, "confidence": 0.9617196321487427, "cells": [{"id": 47, "text": "3.", "bbox": {"l": 139.37097, "t": 612.1588399999999, "r": 146.4379, "b": 620.22861, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Chi, Z., Huang, H., Xu, H.D., Yu, H., Yin, W., Mao, X.L.: Complicated table", "bbox": {"l": 150.98117, "t": 612.1588399999999, "r": 480.58731000000006, "b": 620.22861, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "structure recognition. arXiv preprint arXiv:1908.04729 (2019)", "bbox": {"l": 151.51797, "t": 623.11784, "r": 400.22525, "b": 631.18761, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3. Chi, Z., Huang, H., Xu, H.D., Yu, H., Yin, W., Mao, X.L.: Complicated table structure recognition. arXiv preprint arXiv:1908.04729 (2019)"}, {"label": "list_item", "id": 3, "page_no": 11, "cluster": {"id": 3, "label": "list_item", "bbox": {"l": 139.37097, "t": 634.88084, "r": 480.58826, "b": 664.86761, "coord_origin": "TOPLEFT"}, "confidence": 0.9754673838615417, "cells": [{"id": 50, "text": "4.", "bbox": {"l": 139.37097, "t": 634.88084, "r": 146.52443, "b": 642.95061, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Deng, Y., Rosenberg, D., Mann, G.: Challenges in end-to-end neural scientific", "bbox": {"l": 151.12335, "t": 634.88084, "r": 480.58826, "b": 642.95061, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "table recognition. In: 2019 International Conference on Document Analysis and", "bbox": {"l": 151.51797, "t": 645.83984, "r": 480.58752, "b": 653.9096099999999, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Recognition (ICDAR). pp. 894-901. IEEE (2019)", "bbox": {"l": 151.51797, "t": 656.79785, "r": 350.11115, "b": 664.86761, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4. Deng, Y., Rosenberg, D., Mann, G.: Challenges in end-to-end neural scientific table recognition. In: 2019 International Conference on Document Analysis and Recognition (ICDAR). pp. 894-901. IEEE (2019)"}], "body": [{"label": "section_header", "id": 8, "page_no": 11, "cluster": {"id": 8, "label": "section_header", "bbox": {"l": 134.765, "t": 117.54894999999988, "r": 219.25478999999999, "b": 128.11737000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.915635347366333, "cells": [{"id": 3, "text": "6", "bbox": {"l": 134.765, "t": 117.54894999999988, "r": 141.4886, "b": 128.11737000000005, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Conclusion", "bbox": {"l": 154.9382, "t": 117.54894999999988, "r": 219.25478999999999, "b": 128.11737000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "6 Conclusion"}, {"label": "text", "id": 2, "page_no": 11, "cluster": {"id": 2, "label": "text", "bbox": {"l": 134.765, "t": 146.86377000000005, "r": 480.59569999999997, "b": 203.48181, "coord_origin": "TOPLEFT"}, "confidence": 0.9806171655654907, "cells": [{"id": 5, "text": "We demonstrated that representing tables in HTML for the task of table struc-", "bbox": {"l": 134.765, "t": 146.86377000000005, "r": 480.59476, "b": 155.66076999999996, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "ture recognition with Im2Seq models is ill-suited and has serious limitations.", "bbox": {"l": 134.765, "t": 158.81879000000004, "r": 480.59476, "b": 167.61577999999997, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Furthermore, we presented in this paper an Optimized Table Structure Language", "bbox": {"l": 134.765, "t": 170.77380000000005, "r": 480.58978, "b": 179.57079999999996, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "(OTSL) which, when compared to commonly used general purpose languages,", "bbox": {"l": 134.765, "t": 182.72979999999995, "r": 480.59569999999997, "b": 191.52679, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "has several key benefits.", "bbox": {"l": 134.765, "t": 194.68480999999997, "r": 239.5387, "b": 203.48181, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "We demonstrated that representing tables in HTML for the task of table structure recognition with Im2Seq models is ill-suited and has serious limitations. Furthermore, we presented in this paper an Optimized Table Structure Language (OTSL) which, when compared to commonly used general purpose languages, has several key benefits."}, {"label": "text", "id": 0, "page_no": 11, "cluster": {"id": 0, "label": "text", "bbox": {"l": 134.765, "t": 207.44379000000004, "r": 480.59479, "b": 323.83679, "coord_origin": "TOPLEFT"}, "confidence": 0.9873477220535278, "cells": [{"id": 10, "text": "First and foremost, given the same network configuration, inference time for", "bbox": {"l": 149.709, "t": 207.44379000000004, "r": 480.59283000000005, "b": 216.24077999999997, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "a table-structure prediction is about 2 times faster compared to the conventional", "bbox": {"l": 134.765, "t": 219.39880000000005, "r": 480.59365999999994, "b": 228.19579999999996, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "HTML approach. This is primarily owed to the shorter sequence length of the", "bbox": {"l": 134.765, "t": 231.35382000000004, "r": 480.59079, "b": 240.15081999999995, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "OTSL representation. Additional performance benefits can be obtained with", "bbox": {"l": 134.765, "t": 243.30884000000003, "r": 480.58786000000003, "b": 252.10582999999997, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "HPO (hyper parameter optimization). As we demonstrate in our experiments,", "bbox": {"l": 134.765, "t": 255.26482999999996, "r": 480.59479, "b": 264.06183, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "models trained on OTSL can be significantly smaller, e.g. by reducing the number", "bbox": {"l": 134.765, "t": 267.21984999999995, "r": 480.5878000000001, "b": 276.01685, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "of encoder and decoder layers, while preserving comparatively good prediction", "bbox": {"l": 134.765, "t": 279.17487000000006, "r": 480.59268, "b": 287.97183, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "quality. This can further improve inference performance, yielding 5-6 times faster", "bbox": {"l": 134.765, "t": 291.12985, "r": 480.58871, "b": 299.92682, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "inference speed in OTSL with prediction quality comparable to models trained", "bbox": {"l": 134.765, "t": 303.08484, "r": 480.59375, "b": 311.88181, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "on HTML (see Table 1).", "bbox": {"l": 134.765, "t": 315.03983, "r": 240.92351000000002, "b": 323.83679, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "First and foremost, given the same network configuration, inference time for a table-structure prediction is about 2 times faster compared to the conventional HTML approach. This is primarily owed to the shorter sequence length of the OTSL representation. Additional performance benefits can be obtained with HPO (hyper parameter optimization). As we demonstrate in our experiments, models trained on OTSL can be significantly smaller, e.g. by reducing the number of encoder and decoder layers, while preserving comparatively good prediction quality. This can further improve inference performance, yielding 5-6 times faster inference speed in OTSL with prediction quality comparable to models trained on HTML (see Table 1)."}, {"label": "text", "id": 1, "page_no": 11, "cluster": {"id": 1, "label": "text", "bbox": {"l": 134.765, "t": 327.79883, "r": 480.59482, "b": 468.10266, "coord_origin": "TOPLEFT"}, "confidence": 0.9868747591972351, "cells": [{"id": 20, "text": "Secondly, OTSL has more inherent structure and a significantly restricted vo-", "bbox": {"l": 149.709, "t": 327.79883, "r": 480.58984, "b": 336.5957900000001, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "cabulary size. This allows autoregressive models to perform better in the TED", "bbox": {"l": 134.765, "t": 339.75482, "r": 480.59473, "b": 348.55179, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "metric, but especially with regards to prediction accuracy of the table-cell bound-", "bbox": {"l": 134.765, "t": 351.70981, "r": 480.58664, "b": 360.50677, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "ing boxes (see Table 2). As shown in Figure 5, we observe that the OTSL dras-", "bbox": {"l": 134.765, "t": 363.66479, "r": 480.59479, "b": 372.46176, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "tically reduces the drift for table cell bounding boxes at high row count and in", "bbox": {"l": 134.765, "t": 375.61978, "r": 480.58971999999994, "b": 384.41675, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "sparse tables. This leads to more accurate predictions and a significant reduction", "bbox": {"l": 134.765, "t": 387.57477, "r": 480.58673, "b": 396.37173, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "in post-processing complexity, which is an undesired necessity in HTML-based", "bbox": {"l": 134.765, "t": 399.53076, "r": 480.58574999999996, "b": 408.32773, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Im2Seq models. Significant novelty lies in OTSL syntactical rules, which are few,", "bbox": {"l": 134.765, "t": 411.48575, "r": 480.58675999999997, "b": 420.28271, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "simple and always backwards looking. Each new token can be validated only by", "bbox": {"l": 134.765, "t": 423.44073, "r": 480.59482, "b": 432.23769999999996, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "analyzing the sequence of previous tokens, without requiring the entire sequence", "bbox": {"l": 134.765, "t": 435.39572, "r": 480.58777, "b": 444.19269, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "to detect mistakes. This in return allows to perform structural error detection", "bbox": {"l": 134.765, "t": 447.35071, "r": 480.58968999999996, "b": 456.14767, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "and correction on-the-fly during sequence generation.", "bbox": {"l": 134.765, "t": 459.30569, "r": 366.77698, "b": 468.10266, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Secondly, OTSL has more inherent structure and a significantly restricted vocabulary size. This allows autoregressive models to perform better in the TED metric, but especially with regards to prediction accuracy of the table-cell bounding boxes (see Table 2). As shown in Figure 5, we observe that the OTSL drastically reduces the drift for table cell bounding boxes at high row count and in sparse tables. This leads to more accurate predictions and a significant reduction in post-processing complexity, which is an undesired necessity in HTML-based Im2Seq models. Significant novelty lies in OTSL syntactical rules, which are few, simple and always backwards looking. Each new token can be validated only by analyzing the sequence of previous tokens, without requiring the entire sequence to detect mistakes. This in return allows to perform structural error detection and correction on-the-fly during sequence generation."}, {"label": "section_header", "id": 7, "page_no": 11, "cluster": {"id": 7, "label": "section_header", "bbox": {"l": 134.765, "t": 493.82083, "r": 197.68642, "b": 504.38922, "coord_origin": "TOPLEFT"}, "confidence": 0.9403266310691833, "cells": [{"id": 32, "text": "References", "bbox": {"l": 134.765, "t": 493.82083, "r": 197.68642, "b": 504.38922, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "References"}, {"label": "list_item", "id": 5, "page_no": 11, "cluster": {"id": 5, "label": "list_item", "bbox": {"l": 139.371, "t": 522.87985, "r": 480.5920100000001, "b": 563.87144, "coord_origin": "TOPLEFT"}, "confidence": 0.9698606729507446, "cells": [{"id": 33, "text": "1.", "bbox": {"l": 139.371, "t": 522.87985, "r": 146.46127, "b": 530.94962, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Auer, C., Dolfi, M., Carvalho, A., Ramis, C.B., Staar, P.W.J.: Delivering doc-", "bbox": {"l": 151.01955, "t": 522.87985, "r": 480.5920100000001, "b": 530.94962, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "ument conversion as a cloud service with high throughput and responsiveness.", "bbox": {"l": 151.51801, "t": 533.83887, "r": 480.58667, "b": 541.90862, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "CoRR", "bbox": {"l": 151.51801, "t": 544.79785, "r": 176.34149, "b": 552.86761, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "abs/2206.00785", "bbox": {"l": 179.464, "t": 544.73509, "r": 250.67963, "b": 552.66139, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "(2022).", "bbox": {"l": 253.804, "t": 544.79785, "r": 281.9567, "b": 552.86761, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "https://doi.org/10.48550/arXiv.2206.00785", "bbox": {"l": 285.078, "t": 545.44344, "r": 478.03403000000003, "b": 552.91245, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": ",", "bbox": {"l": 478.0319799999999, "t": 544.79785, "r": 480.59099999999995, "b": 552.86761, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "https://doi.org/10.48550/arXiv.2206.00785", "bbox": {"l": 151.51797, "t": 556.4024400000001, "r": 344.474, "b": 563.87144, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1. Auer, C., Dolfi, M., Carvalho, A., Ramis, C.B., Staar, P.W.J.: Delivering document conversion as a cloud service with high throughput and responsiveness. CoRR abs/2206.00785 (2022). https://doi.org/10.48550/arXiv.2206.00785 , https://doi.org/10.48550/arXiv.2206.00785"}, {"label": "list_item", "id": 4, "page_no": 11, "cluster": {"id": 4, "label": "list_item", "bbox": {"l": 139.37097, "t": 567.51884, "r": 480.5920100000001, "b": 608.46561, "coord_origin": "TOPLEFT"}, "confidence": 0.9730570316314697, "cells": [{"id": 42, "text": "2.", "bbox": {"l": 139.37097, "t": 567.51884, "r": 145.94186, "b": 575.58861, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Chen, B., Peng, D., Zhang, J., Ren, Y., Jin, L.: Complex table structure recognition", "bbox": {"l": 150.16624, "t": 567.51884, "r": 480.58636, "b": 575.58861, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "in the wild using transformer and identity matrix-based augmentation. In: Porwal,", "bbox": {"l": 151.51797, "t": 578.47784, "r": 480.59012, "b": 586.5476100000001, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "U., Forn\u00e9s, A., Shafait, F. (eds.) Frontiers in Handwriting Recognition. pp. 545-", "bbox": {"l": 151.51797, "t": 589.43684, "r": 480.5920100000001, "b": 597.50661, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "561. Springer International Publishing, Cham (2022)", "bbox": {"l": 151.51797, "t": 600.39584, "r": 364.17856, "b": 608.46561, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2. Chen, B., Peng, D., Zhang, J., Ren, Y., Jin, L.: Complex table structure recognition in the wild using transformer and identity matrix-based augmentation. In: Porwal, U., Forn\u00e9s, A., Shafait, F. (eds.) Frontiers in Handwriting Recognition. pp. 545561. Springer International Publishing, Cham (2022)"}, {"label": "list_item", "id": 6, "page_no": 11, "cluster": {"id": 6, "label": "list_item", "bbox": {"l": 139.37097, "t": 612.1588399999999, "r": 480.58731000000006, "b": 631.18761, "coord_origin": "TOPLEFT"}, "confidence": 0.9617196321487427, "cells": [{"id": 47, "text": "3.", "bbox": {"l": 139.37097, "t": 612.1588399999999, "r": 146.4379, "b": 620.22861, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Chi, Z., Huang, H., Xu, H.D., Yu, H., Yin, W., Mao, X.L.: Complicated table", "bbox": {"l": 150.98117, "t": 612.1588399999999, "r": 480.58731000000006, "b": 620.22861, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "structure recognition. arXiv preprint arXiv:1908.04729 (2019)", "bbox": {"l": 151.51797, "t": 623.11784, "r": 400.22525, "b": 631.18761, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3. Chi, Z., Huang, H., Xu, H.D., Yu, H., Yin, W., Mao, X.L.: Complicated table structure recognition. arXiv preprint arXiv:1908.04729 (2019)"}, {"label": "list_item", "id": 3, "page_no": 11, "cluster": {"id": 3, "label": "list_item", "bbox": {"l": 139.37097, "t": 634.88084, "r": 480.58826, "b": 664.86761, "coord_origin": "TOPLEFT"}, "confidence": 0.9754673838615417, "cells": [{"id": 50, "text": "4.", "bbox": {"l": 139.37097, "t": 634.88084, "r": 146.52443, "b": 642.95061, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Deng, Y., Rosenberg, D., Mann, G.: Challenges in end-to-end neural scientific", "bbox": {"l": 151.12335, "t": 634.88084, "r": 480.58826, "b": 642.95061, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "table recognition. In: 2019 International Conference on Document Analysis and", "bbox": {"l": 151.51797, "t": 645.83984, "r": 480.58752, "b": 653.9096099999999, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Recognition (ICDAR). pp. 894-901. IEEE (2019)", "bbox": {"l": 151.51797, "t": 656.79785, "r": 350.11115, "b": 664.86761, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4. Deng, Y., Rosenberg, D., Mann, G.: Challenges in end-to-end neural scientific table recognition. In: 2019 International Conference on Document Analysis and Recognition (ICDAR). pp. 894-901. IEEE (2019)"}], "headers": [{"label": "page_header", "id": 10, "page_no": 11, "cluster": {"id": 10, "label": "page_header", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 143.97887, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8610828518867493, "cells": [{"id": 0, "text": "12", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 143.97887, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "12"}, {"label": "page_header", "id": 9, "page_no": 11, "cluster": {"id": 9, "label": "page_header", "bbox": {"l": 167.82053, "t": 93.77099999999996, "r": 231.72049000000004, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8927666544914246, "cells": [{"id": 1, "text": "M.", "bbox": {"l": 167.82053, "t": 93.77099999999996, "r": 178.08249, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37929, "t": 93.77099999999996, "r": 231.72049000000004, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "M. Lysak, et al."}]}}, {"page_no": 12, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "13", "bbox": {"l": 471.37561, "t": 93.77099999999996, "r": 480.5894799999999, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "5.", "bbox": {"l": 139.371, "t": 119.67400999999995, "r": 146.04857, "b": 127.74370999999985, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Kayal, P., Anand, M., Desai, H., Singh, M.: Tables to latex: structure and content", "bbox": {"l": 150.34157, "t": 119.67400999999995, "r": 480.58826, "b": 127.74370999999985, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "extraction from scientific tables. International Journal on Document Analysis and", "bbox": {"l": 151.51801, "t": 130.63300000000004, "r": 480.59479, "b": 138.70270000000005, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Recognition (IJDAR) pp. 1-10 (2022)", "bbox": {"l": 151.51801, "t": 141.59198000000004, "r": 304.04364, "b": 149.66168000000005, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "6.", "bbox": {"l": 139.371, "t": 152.56195000000002, "r": 145.93991, "b": 160.63165000000004, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Lee, E., Kwon, J., Yang, H., Park, J., Lee, S., Koo, H.I., Cho, N.I.: Table structure", "bbox": {"l": 150.16298, "t": 152.56195000000002, "r": 480.59015, "b": 160.63165000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "recognition based on grid shape graph. In: 2022 Asia-Pacific Signal and Information", "bbox": {"l": 151.51801, "t": 163.52094, "r": 480.5903, "b": 171.59064, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Processing Association Annual Summit and Conference (APSIPA ASC). pp. 1868-", "bbox": {"l": 151.51801, "t": 174.47992, "r": 480.59286000000003, "b": 182.54962, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "1873. IEEE (2022)", "bbox": {"l": 151.51801, "t": 185.4389, "r": 226.37399, "b": 193.50860999999998, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "7.", "bbox": {"l": 139.371, "t": 196.40886999999998, "r": 146.31418, "b": 204.47857999999997, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Li, M., Cui, L., Huang, S., Wei, F., Zhou, M., Li, Z.: Tablebank: A benchmark", "bbox": {"l": 150.77789, "t": 196.40886999999998, "r": 480.59012, "b": 204.47857999999997, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "dataset for table detection and recognition (2019)", "bbox": {"l": 151.51801, "t": 207.36785999999995, "r": 352.01746, "b": 215.43755999999996, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "8.", "bbox": {"l": 139.371, "t": 218.33887000000004, "r": 146.37106, "b": 226.40857000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Livathinos, N., Berrospi, C., Lysak, M., Kuropiatnyk, V., Nassar, A., Carvalho,", "bbox": {"l": 150.87132, "t": 218.33887000000004, "r": 480.58731000000006, "b": 226.40857000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "A., Dolfi, M., Auer, C., Dinkla, K., Staar, P.: Robust pdf document conversion", "bbox": {"l": 151.51801, "t": 229.29785000000004, "r": 480.59020999999996, "b": 237.36755000000005, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "using recurrent neural networks. Proceedings of the AAAI Conference on Artificial", "bbox": {"l": 151.51801, "t": 240.25684, "r": 480.59473, "b": 248.32654000000002, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Intelligence", "bbox": {"l": 151.51801, "t": 251.21582, "r": 197.08617, "b": 259.28552, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "35", "bbox": {"l": 199.40001, "t": 251.15301999999997, "r": 210.00726, "b": 259.07935, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "(17), 15137-15145 (May 2021),", "bbox": {"l": 210.007, "t": 251.21582, "r": 332.37683, "b": 259.28552, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "https://ojs.aaai.org/index.php/", "bbox": {"l": 334.69901, "t": 251.86139000000003, "r": 480.59039000000007, "b": 259.33038, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "AAAI/article/view/17777", "bbox": {"l": 151.51801, "t": 262.8194, "r": 259.75769, "b": 270.28839000000005, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "9.", "bbox": {"l": 139.371, "t": 273.14484000000004, "r": 146.14218, "b": 281.21457, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "Nassar, A., Livathinos, N., Lysak, M., Staar, P.: Tableformer: Table structure un-", "bbox": {"l": 150.49533, "t": 273.14484000000004, "r": 480.5881999999999, "b": 281.21457, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "derstanding with transformers. In: Proceedings of the IEEE/CVF Conference on", "bbox": {"l": 151.51801, "t": 284.10379, "r": 480.59387000000004, "b": 292.17355, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "Computer Vision and Pattern Recognition (CVPR). pp. 4614-4623 (June 2022)", "bbox": {"l": 151.51801, "t": 295.06277, "r": 473.44308000000007, "b": 303.13254, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "10.", "bbox": {"l": 134.76401, "t": 306.03277999999995, "r": 146.49922, "b": 314.10254000000003, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Pfitzmann, B., Auer, C., Dolfi, M., Nassar, A.S., Staar, P.W.J.: Doclaynet: A", "bbox": {"l": 151.09138, "t": 306.03277999999995, "r": 480.58905, "b": 314.10254000000003, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "large human-annotated dataset for document-layout segmentation. In: Zhang, A.,", "bbox": {"l": 151.51801, "t": 316.99179, "r": 480.59015, "b": 325.06155, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Rangwala, H. (eds.) KDD \u201922: The 28th ACM SIGKDD Conference on Knowledge", "bbox": {"l": 151.51801, "t": 327.95078, "r": 480.59113, "b": 336.02054, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Discovery and Data Mining, Washington, DC, USA, August 14 - 18, 2022. pp.", "bbox": {"l": 151.51801, "t": 338.90976, "r": 480.59113, "b": 346.97952, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "3743-3751. ACM (2022).", "bbox": {"l": 151.51801, "t": 349.86874, "r": 251.14098999999996, "b": 357.93851, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "https://doi.org/10.1145/3534678.3539043", "bbox": {"l": 253.99001, "t": 350.5143100000001, "r": 437.53311, "b": 357.98333999999994, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": ",", "bbox": {"l": 437.53201, "t": 349.86874, "r": 440.09102999999993, "b": 357.93851, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "https://", "bbox": {"l": 442.94202000000007, "t": 350.5143100000001, "r": 480.59372, "b": 357.98333999999994, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "doi.org/10.1145/3534678.3539043", "bbox": {"l": 151.51801, "t": 361.47329999999994, "r": 297.40939, "b": 368.94232, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "11.", "bbox": {"l": 134.76401, "t": 371.79773, "r": 146.03854, "b": 379.86749, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "Prasad, D., Gadpal, A., Kapadni, K., Visave, M., Sultanpure, K.: Cascadetabnet:", "bbox": {"l": 150.4505, "t": 371.79773, "r": 480.58914000000004, "b": 379.86749, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "An approach for end to end table detection and structure recognition from image-", "bbox": {"l": 151.51801, "t": 382.7567399999999, "r": 480.59296, "b": 390.82651, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "based documents. In: Proceedings of the IEEE/CVF conference on computer vision", "bbox": {"l": 151.51801, "t": 393.71573, "r": 480.59293, "b": 401.78549, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "and pattern recognition workshops. pp. 572-573 (2020)", "bbox": {"l": 151.51801, "t": 404.67471, "r": 373.82727, "b": 412.74448, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "12.", "bbox": {"l": 134.76401, "t": 415.64471, "r": 145.91106, "b": 423.71448000000004, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Schreiber, S., Agne, S., Wolf, I., Dengel, A., Ahmed, S.: Deepdesrt: Deep learning", "bbox": {"l": 150.27309, "t": 415.64471, "r": 480.5874, "b": 423.71448000000004, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "for detection and structure recognition of tables in document images. In: 2017 14th", "bbox": {"l": 151.51801, "t": 426.60373, "r": 480.59469999999993, "b": 434.67349, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "IAPR international conference on document analysis and recognition (ICDAR).", "bbox": {"l": 151.51801, "t": 437.5627099999999, "r": 480.58844, "b": 445.63248, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "vol. 1, pp. 1162-1167. IEEE (2017)", "bbox": {"l": 151.51801, "t": 448.5217, "r": 292.91455, "b": 456.59146, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "13.", "bbox": {"l": 134.76401, "t": 459.4917, "r": 145.7785, "b": 467.56146, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Siddiqui, S.A., Fateh, I.A., Rizvi, S.T.R., Dengel, A., Ahmed, S.: Deeptabstr: Deep", "bbox": {"l": 150.08871, "t": 459.4917, "r": 480.59006, "b": 467.56146, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "learning based table structure recognition. In: 2019 International Conference on", "bbox": {"l": 151.51801, "t": 470.45071, "r": 480.59116, "b": 478.52048, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Document Analysis and Recognition (ICDAR). pp. 1403-1409 (2019).", "bbox": {"l": 151.51801, "t": 481.4097, "r": 439.05963, "b": 489.47946, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "https://", "bbox": {"l": 442.94202000000007, "t": 482.05527, "r": 480.59372, "b": 489.52429, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "doi.org/10.1109/ICDAR.2019.00226", "bbox": {"l": 151.51801, "t": 493.01425, "r": 302.11584, "b": 500.48328, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "14.", "bbox": {"l": 134.76401, "t": 503.33868, "r": 146.15501, "b": 511.40845, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "Smock, B., Pesala, R., Abraham, R.: PubTables-1M: Towards comprehensive ta-", "bbox": {"l": 150.61252, "t": 503.33868, "r": 480.59088, "b": 511.40845, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "ble extraction from unstructured documents. In: Proceedings of the IEEE/CVF", "bbox": {"l": 151.51801, "t": 514.2977000000001, "r": 480.59286000000003, "b": 522.3674599999999, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Conference on Computer Vision and Pattern Recognition (CVPR). pp. 4634-4642", "bbox": {"l": 151.51801, "t": 525.25668, "r": 480.58838000000003, "b": 533.32645, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "(June 2022)", "bbox": {"l": 151.51801, "t": 536.21568, "r": 199.24704, "b": 544.28545, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "15.", "bbox": {"l": 134.76401, "t": 547.18568, "r": 146.16588, "b": 555.25545, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Staar, P.W.J., Dolfi, M., Auer, C., Bekas, C.: Corpus conversion service: A ma-", "bbox": {"l": 150.62764, "t": 547.18568, "r": 480.58734000000004, "b": 555.25545, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "chine learning platform to ingest documents at scale. In: Proceedings of the 24th", "bbox": {"l": 151.51801, "t": 558.14468, "r": 480.58838000000003, "b": 566.2144499999999, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "ACM SIGKDD International Conference on Knowledge Discovery & Data Min-", "bbox": {"l": 151.51801, "t": 569.1036799999999, "r": 480.59109, "b": 577.17345, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "ing. pp. 774-782. KDD \u201918, Association for Computing Machinery, New York, NY,", "bbox": {"l": 151.51801, "t": 580.06268, "r": 480.59195, "b": 588.1324500000001, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "USA (2018).", "bbox": {"l": 151.51801, "t": 591.0216800000001, "r": 200.75787, "b": 599.09145, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "https://doi.org/10.1145/3219819.3219834", "bbox": {"l": 202.916, "t": 591.66727, "r": 386.45911, "b": 599.1362799999999, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": ",", "bbox": {"l": 386.45801, "t": 591.0216800000001, "r": 389.01703, "b": 599.09145, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "https://doi.org/10.", "bbox": {"l": 391.173, "t": 591.66727, "r": 480.59583, "b": 599.1362799999999, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "1145/3219819.3219834", "bbox": {"l": 151.51801, "t": 602.62627, "r": 245.63831, "b": 610.09528, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "16.", "bbox": {"l": 134.76401, "t": 612.95068, "r": 146.62019, "b": 621.02045, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "Wang, X.: Tabular Abstraction, Editing, and Formatting. Ph.D. thesis, CAN", "bbox": {"l": 151.25977, "t": 612.95068, "r": 480.59542999999996, "b": 621.02045, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "(1996), aAINN09397", "bbox": {"l": 151.51801, "t": 623.90968, "r": 234.43031, "b": 631.97945, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "17.", "bbox": {"l": 134.76401, "t": 634.87968, "r": 146.30539, "b": 642.9494500000001, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "Xue, W., Li, Q., Tao, D.: Res2tim: Reconstruct syntactic structures from table", "bbox": {"l": 150.82175, "t": 634.87968, "r": 480.58731000000006, "b": 642.9494500000001, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "images. In: 2019 International Conference on Document Analysis and Recognition", "bbox": {"l": 151.51801, "t": 645.8386800000001, "r": 480.59119, "b": 653.90845, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "(ICDAR). pp. 749-755. IEEE (2019)", "bbox": {"l": 151.51801, "t": 656.79768, "r": 299.30307, "b": 664.86745, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 13, "label": "page_header", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9163166880607605, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "page_header", "bbox": {"l": 471.37561, "t": 93.77099999999996, "r": 480.5894799999999, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9061065912246704, "cells": [{"id": 1, "text": "13", "bbox": {"l": 471.37561, "t": 93.77099999999996, "r": 480.5894799999999, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "list_item", "bbox": {"l": 139.371, "t": 119.67400999999995, "r": 480.59479, "b": 149.66168000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9677113890647888, "cells": [{"id": 2, "text": "5.", "bbox": {"l": 139.371, "t": 119.67400999999995, "r": 146.04857, "b": 127.74370999999985, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Kayal, P., Anand, M., Desai, H., Singh, M.: Tables to latex: structure and content", "bbox": {"l": 150.34157, "t": 119.67400999999995, "r": 480.58826, "b": 127.74370999999985, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "extraction from scientific tables. International Journal on Document Analysis and", "bbox": {"l": 151.51801, "t": 130.63300000000004, "r": 480.59479, "b": 138.70270000000005, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Recognition (IJDAR) pp. 1-10 (2022)", "bbox": {"l": 151.51801, "t": 141.59198000000004, "r": 304.04364, "b": 149.66168000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "list_item", "bbox": {"l": 139.371, "t": 152.56195000000002, "r": 480.59286000000003, "b": 193.50860999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.973045289516449, "cells": [{"id": 6, "text": "6.", "bbox": {"l": 139.371, "t": 152.56195000000002, "r": 145.93991, "b": 160.63165000000004, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Lee, E., Kwon, J., Yang, H., Park, J., Lee, S., Koo, H.I., Cho, N.I.: Table structure", "bbox": {"l": 150.16298, "t": 152.56195000000002, "r": 480.59015, "b": 160.63165000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "recognition based on grid shape graph. In: 2022 Asia-Pacific Signal and Information", "bbox": {"l": 151.51801, "t": 163.52094, "r": 480.5903, "b": 171.59064, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Processing Association Annual Summit and Conference (APSIPA ASC). pp. 1868-", "bbox": {"l": 151.51801, "t": 174.47992, "r": 480.59286000000003, "b": 182.54962, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "1873. IEEE (2022)", "bbox": {"l": 151.51801, "t": 185.4389, "r": 226.37399, "b": 193.50860999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "list_item", "bbox": {"l": 139.371, "t": 196.40886999999998, "r": 480.59012, "b": 215.43755999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9582491517066956, "cells": [{"id": 11, "text": "7.", "bbox": {"l": 139.371, "t": 196.40886999999998, "r": 146.31418, "b": 204.47857999999997, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Li, M., Cui, L., Huang, S., Wei, F., Zhou, M., Li, Z.: Tablebank: A benchmark", "bbox": {"l": 150.77789, "t": 196.40886999999998, "r": 480.59012, "b": 204.47857999999997, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "dataset for table detection and recognition (2019)", "bbox": {"l": 151.51801, "t": 207.36785999999995, "r": 352.01746, "b": 215.43755999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "list_item", "bbox": {"l": 139.371, "t": 218.33887000000004, "r": 480.59473, "b": 270.28839000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9678146243095398, "cells": [{"id": 14, "text": "8.", "bbox": {"l": 139.371, "t": 218.33887000000004, "r": 146.37106, "b": 226.40857000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Livathinos, N., Berrospi, C., Lysak, M., Kuropiatnyk, V., Nassar, A., Carvalho,", "bbox": {"l": 150.87132, "t": 218.33887000000004, "r": 480.58731000000006, "b": 226.40857000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "A., Dolfi, M., Auer, C., Dinkla, K., Staar, P.: Robust pdf document conversion", "bbox": {"l": 151.51801, "t": 229.29785000000004, "r": 480.59020999999996, "b": 237.36755000000005, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "using recurrent neural networks. Proceedings of the AAAI Conference on Artificial", "bbox": {"l": 151.51801, "t": 240.25684, "r": 480.59473, "b": 248.32654000000002, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Intelligence", "bbox": {"l": 151.51801, "t": 251.21582, "r": 197.08617, "b": 259.28552, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "35", "bbox": {"l": 199.40001, "t": 251.15301999999997, "r": 210.00726, "b": 259.07935, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "(17), 15137-15145 (May 2021),", "bbox": {"l": 210.007, "t": 251.21582, "r": 332.37683, "b": 259.28552, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "https://ojs.aaai.org/index.php/", "bbox": {"l": 334.69901, "t": 251.86139000000003, "r": 480.59039000000007, "b": 259.33038, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "AAAI/article/view/17777", "bbox": {"l": 151.51801, "t": 262.8194, "r": 259.75769, "b": 270.28839000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "list_item", "bbox": {"l": 139.371, "t": 273.14484000000004, "r": 480.59387000000004, "b": 303.13254, "coord_origin": "TOPLEFT"}, "confidence": 0.9557179808616638, "cells": [{"id": 23, "text": "9.", "bbox": {"l": 139.371, "t": 273.14484000000004, "r": 146.14218, "b": 281.21457, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "Nassar, A., Livathinos, N., Lysak, M., Staar, P.: Tableformer: Table structure un-", "bbox": {"l": 150.49533, "t": 273.14484000000004, "r": 480.5881999999999, "b": 281.21457, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "derstanding with transformers. In: Proceedings of the IEEE/CVF Conference on", "bbox": {"l": 151.51801, "t": 284.10379, "r": 480.59387000000004, "b": 292.17355, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "Computer Vision and Pattern Recognition (CVPR). pp. 4614-4623 (June 2022)", "bbox": {"l": 151.51801, "t": 295.06277, "r": 473.44308000000007, "b": 303.13254, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "list_item", "bbox": {"l": 134.76401, "t": 306.03277999999995, "r": 480.59372, "b": 368.94232, "coord_origin": "TOPLEFT"}, "confidence": 0.9639304876327515, "cells": [{"id": 27, "text": "10.", "bbox": {"l": 134.76401, "t": 306.03277999999995, "r": 146.49922, "b": 314.10254000000003, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Pfitzmann, B., Auer, C., Dolfi, M., Nassar, A.S., Staar, P.W.J.: Doclaynet: A", "bbox": {"l": 151.09138, "t": 306.03277999999995, "r": 480.58905, "b": 314.10254000000003, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "large human-annotated dataset for document-layout segmentation. In: Zhang, A.,", "bbox": {"l": 151.51801, "t": 316.99179, "r": 480.59015, "b": 325.06155, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Rangwala, H. (eds.) KDD \u201922: The 28th ACM SIGKDD Conference on Knowledge", "bbox": {"l": 151.51801, "t": 327.95078, "r": 480.59113, "b": 336.02054, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Discovery and Data Mining, Washington, DC, USA, August 14 - 18, 2022. pp.", "bbox": {"l": 151.51801, "t": 338.90976, "r": 480.59113, "b": 346.97952, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "3743-3751. ACM (2022).", "bbox": {"l": 151.51801, "t": 349.86874, "r": 251.14098999999996, "b": 357.93851, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "https://doi.org/10.1145/3534678.3539043", "bbox": {"l": 253.99001, "t": 350.5143100000001, "r": 437.53311, "b": 357.98333999999994, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": ",", "bbox": {"l": 437.53201, "t": 349.86874, "r": 440.09102999999993, "b": 357.93851, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "https://", "bbox": {"l": 442.94202000000007, "t": 350.5143100000001, "r": 480.59372, "b": 357.98333999999994, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "doi.org/10.1145/3534678.3539043", "bbox": {"l": 151.51801, "t": 361.47329999999994, "r": 297.40939, "b": 368.94232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "list_item", "bbox": {"l": 134.76401, "t": 371.79773, "r": 480.59296, "b": 412.74448, "coord_origin": "TOPLEFT"}, "confidence": 0.9752162098884583, "cells": [{"id": 37, "text": "11.", "bbox": {"l": 134.76401, "t": 371.79773, "r": 146.03854, "b": 379.86749, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "Prasad, D., Gadpal, A., Kapadni, K., Visave, M., Sultanpure, K.: Cascadetabnet:", "bbox": {"l": 150.4505, "t": 371.79773, "r": 480.58914000000004, "b": 379.86749, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "An approach for end to end table detection and structure recognition from image-", "bbox": {"l": 151.51801, "t": 382.7567399999999, "r": 480.59296, "b": 390.82651, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "based documents. In: Proceedings of the IEEE/CVF conference on computer vision", "bbox": {"l": 151.51801, "t": 393.71573, "r": 480.59293, "b": 401.78549, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "and pattern recognition workshops. pp. 572-573 (2020)", "bbox": {"l": 151.51801, "t": 404.67471, "r": 373.82727, "b": 412.74448, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "list_item", "bbox": {"l": 134.76401, "t": 415.64471, "r": 480.59469999999993, "b": 456.59146, "coord_origin": "TOPLEFT"}, "confidence": 0.9707236886024475, "cells": [{"id": 42, "text": "12.", "bbox": {"l": 134.76401, "t": 415.64471, "r": 145.91106, "b": 423.71448000000004, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Schreiber, S., Agne, S., Wolf, I., Dengel, A., Ahmed, S.: Deepdesrt: Deep learning", "bbox": {"l": 150.27309, "t": 415.64471, "r": 480.5874, "b": 423.71448000000004, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "for detection and structure recognition of tables in document images. In: 2017 14th", "bbox": {"l": 151.51801, "t": 426.60373, "r": 480.59469999999993, "b": 434.67349, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "IAPR international conference on document analysis and recognition (ICDAR).", "bbox": {"l": 151.51801, "t": 437.5627099999999, "r": 480.58844, "b": 445.63248, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "vol. 1, pp. 1162-1167. IEEE (2017)", "bbox": {"l": 151.51801, "t": 448.5217, "r": 292.91455, "b": 456.59146, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "list_item", "bbox": {"l": 134.76401, "t": 459.4917, "r": 480.59372, "b": 500.48328, "coord_origin": "TOPLEFT"}, "confidence": 0.9658119678497314, "cells": [{"id": 47, "text": "13.", "bbox": {"l": 134.76401, "t": 459.4917, "r": 145.7785, "b": 467.56146, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Siddiqui, S.A., Fateh, I.A., Rizvi, S.T.R., Dengel, A., Ahmed, S.: Deeptabstr: Deep", "bbox": {"l": 150.08871, "t": 459.4917, "r": 480.59006, "b": 467.56146, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "learning based table structure recognition. In: 2019 International Conference on", "bbox": {"l": 151.51801, "t": 470.45071, "r": 480.59116, "b": 478.52048, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Document Analysis and Recognition (ICDAR). pp. 1403-1409 (2019).", "bbox": {"l": 151.51801, "t": 481.4097, "r": 439.05963, "b": 489.47946, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "https://", "bbox": {"l": 442.94202000000007, "t": 482.05527, "r": 480.59372, "b": 489.52429, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "doi.org/10.1109/ICDAR.2019.00226", "bbox": {"l": 151.51801, "t": 493.01425, "r": 302.11584, "b": 500.48328, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "list_item", "bbox": {"l": 134.76401, "t": 503.33868, "r": 480.59286000000003, "b": 544.28545, "coord_origin": "TOPLEFT"}, "confidence": 0.972225546836853, "cells": [{"id": 53, "text": "14.", "bbox": {"l": 134.76401, "t": 503.33868, "r": 146.15501, "b": 511.40845, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "Smock, B., Pesala, R., Abraham, R.: PubTables-1M: Towards comprehensive ta-", "bbox": {"l": 150.61252, "t": 503.33868, "r": 480.59088, "b": 511.40845, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "ble extraction from unstructured documents. In: Proceedings of the IEEE/CVF", "bbox": {"l": 151.51801, "t": 514.2977000000001, "r": 480.59286000000003, "b": 522.3674599999999, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Conference on Computer Vision and Pattern Recognition (CVPR). pp. 4634-4642", "bbox": {"l": 151.51801, "t": 525.25668, "r": 480.58838000000003, "b": 533.32645, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "(June 2022)", "bbox": {"l": 151.51801, "t": 536.21568, "r": 199.24704, "b": 544.28545, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "list_item", "bbox": {"l": 134.76401, "t": 547.18568, "r": 480.59583, "b": 610.09528, "coord_origin": "TOPLEFT"}, "confidence": 0.9674035906791687, "cells": [{"id": 58, "text": "15.", "bbox": {"l": 134.76401, "t": 547.18568, "r": 146.16588, "b": 555.25545, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Staar, P.W.J., Dolfi, M., Auer, C., Bekas, C.: Corpus conversion service: A ma-", "bbox": {"l": 150.62764, "t": 547.18568, "r": 480.58734000000004, "b": 555.25545, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "chine learning platform to ingest documents at scale. In: Proceedings of the 24th", "bbox": {"l": 151.51801, "t": 558.14468, "r": 480.58838000000003, "b": 566.2144499999999, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "ACM SIGKDD International Conference on Knowledge Discovery & Data Min-", "bbox": {"l": 151.51801, "t": 569.1036799999999, "r": 480.59109, "b": 577.17345, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "ing. pp. 774-782. KDD \u201918, Association for Computing Machinery, New York, NY,", "bbox": {"l": 151.51801, "t": 580.06268, "r": 480.59195, "b": 588.1324500000001, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "USA (2018).", "bbox": {"l": 151.51801, "t": 591.0216800000001, "r": 200.75787, "b": 599.09145, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "https://doi.org/10.1145/3219819.3219834", "bbox": {"l": 202.916, "t": 591.66727, "r": 386.45911, "b": 599.1362799999999, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": ",", "bbox": {"l": 386.45801, "t": 591.0216800000001, "r": 389.01703, "b": 599.09145, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "https://doi.org/10.", "bbox": {"l": 391.173, "t": 591.66727, "r": 480.59583, "b": 599.1362799999999, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "1145/3219819.3219834", "bbox": {"l": 151.51801, "t": 602.62627, "r": 245.63831, "b": 610.09528, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "list_item", "bbox": {"l": 134.76401, "t": 612.95068, "r": 480.59542999999996, "b": 631.97945, "coord_origin": "TOPLEFT"}, "confidence": 0.9416431188583374, "cells": [{"id": 68, "text": "16.", "bbox": {"l": 134.76401, "t": 612.95068, "r": 146.62019, "b": 621.02045, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "Wang, X.: Tabular Abstraction, Editing, and Formatting. Ph.D. thesis, CAN", "bbox": {"l": 151.25977, "t": 612.95068, "r": 480.59542999999996, "b": 621.02045, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "(1996), aAINN09397", "bbox": {"l": 151.51801, "t": 623.90968, "r": 234.43031, "b": 631.97945, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "list_item", "bbox": {"l": 134.76401, "t": 634.87968, "r": 480.59119, "b": 664.86745, "coord_origin": "TOPLEFT"}, "confidence": 0.964638352394104, "cells": [{"id": 71, "text": "17.", "bbox": {"l": 134.76401, "t": 634.87968, "r": 146.30539, "b": 642.9494500000001, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "Xue, W., Li, Q., Tao, D.: Res2tim: Reconstruct syntactic structures from table", "bbox": {"l": 150.82175, "t": 634.87968, "r": 480.58731000000006, "b": 642.9494500000001, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "images. In: 2019 International Conference on Document Analysis and Recognition", "bbox": {"l": 151.51801, "t": 645.8386800000001, "r": 480.59119, "b": 653.90845, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "(ICDAR). pp. 749-755. IEEE (2019)", "bbox": {"l": 151.51801, "t": 656.79768, "r": 299.30307, "b": 664.86745, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_header", "id": 13, "page_no": 12, "cluster": {"id": 13, "label": "page_header", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9163166880607605, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Optimized Table Tokenization for Table Structure Recognition"}, {"label": "page_header", "id": 14, "page_no": 12, "cluster": {"id": 14, "label": "page_header", "bbox": {"l": 471.37561, "t": 93.77099999999996, "r": 480.5894799999999, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9061065912246704, "cells": [{"id": 1, "text": "13", "bbox": {"l": 471.37561, "t": 93.77099999999996, "r": 480.5894799999999, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "13"}, {"label": "list_item", "id": 5, "page_no": 12, "cluster": {"id": 5, "label": "list_item", "bbox": {"l": 139.371, "t": 119.67400999999995, "r": 480.59479, "b": 149.66168000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9677113890647888, "cells": [{"id": 2, "text": "5.", "bbox": {"l": 139.371, "t": 119.67400999999995, "r": 146.04857, "b": 127.74370999999985, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Kayal, P., Anand, M., Desai, H., Singh, M.: Tables to latex: structure and content", "bbox": {"l": 150.34157, "t": 119.67400999999995, "r": 480.58826, "b": 127.74370999999985, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "extraction from scientific tables. International Journal on Document Analysis and", "bbox": {"l": 151.51801, "t": 130.63300000000004, "r": 480.59479, "b": 138.70270000000005, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Recognition (IJDAR) pp. 1-10 (2022)", "bbox": {"l": 151.51801, "t": 141.59198000000004, "r": 304.04364, "b": 149.66168000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5. Kayal, P., Anand, M., Desai, H., Singh, M.: Tables to latex: structure and content extraction from scientific tables. International Journal on Document Analysis and Recognition (IJDAR) pp. 1-10 (2022)"}, {"label": "list_item", "id": 1, "page_no": 12, "cluster": {"id": 1, "label": "list_item", "bbox": {"l": 139.371, "t": 152.56195000000002, "r": 480.59286000000003, "b": 193.50860999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.973045289516449, "cells": [{"id": 6, "text": "6.", "bbox": {"l": 139.371, "t": 152.56195000000002, "r": 145.93991, "b": 160.63165000000004, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Lee, E., Kwon, J., Yang, H., Park, J., Lee, S., Koo, H.I., Cho, N.I.: Table structure", "bbox": {"l": 150.16298, "t": 152.56195000000002, "r": 480.59015, "b": 160.63165000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "recognition based on grid shape graph. In: 2022 Asia-Pacific Signal and Information", "bbox": {"l": 151.51801, "t": 163.52094, "r": 480.5903, "b": 171.59064, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Processing Association Annual Summit and Conference (APSIPA ASC). pp. 1868-", "bbox": {"l": 151.51801, "t": 174.47992, "r": 480.59286000000003, "b": 182.54962, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "1873. IEEE (2022)", "bbox": {"l": 151.51801, "t": 185.4389, "r": 226.37399, "b": 193.50860999999998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "6. Lee, E., Kwon, J., Yang, H., Park, J., Lee, S., Koo, H.I., Cho, N.I.: Table structure recognition based on grid shape graph. In: 2022 Asia-Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC). pp. 18681873. IEEE (2022)"}, {"label": "list_item", "id": 10, "page_no": 12, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 139.371, "t": 196.40886999999998, "r": 480.59012, "b": 215.43755999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9582491517066956, "cells": [{"id": 11, "text": "7.", "bbox": {"l": 139.371, "t": 196.40886999999998, "r": 146.31418, "b": 204.47857999999997, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Li, M., Cui, L., Huang, S., Wei, F., Zhou, M., Li, Z.: Tablebank: A benchmark", "bbox": {"l": 150.77789, "t": 196.40886999999998, "r": 480.59012, "b": 204.47857999999997, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "dataset for table detection and recognition (2019)", "bbox": {"l": 151.51801, "t": 207.36785999999995, "r": 352.01746, "b": 215.43755999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "7. Li, M., Cui, L., Huang, S., Wei, F., Zhou, M., Li, Z.: Tablebank: A benchmark dataset for table detection and recognition (2019)"}, {"label": "list_item", "id": 4, "page_no": 12, "cluster": {"id": 4, "label": "list_item", "bbox": {"l": 139.371, "t": 218.33887000000004, "r": 480.59473, "b": 270.28839000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9678146243095398, "cells": [{"id": 14, "text": "8.", "bbox": {"l": 139.371, "t": 218.33887000000004, "r": 146.37106, "b": 226.40857000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Livathinos, N., Berrospi, C., Lysak, M., Kuropiatnyk, V., Nassar, A., Carvalho,", "bbox": {"l": 150.87132, "t": 218.33887000000004, "r": 480.58731000000006, "b": 226.40857000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "A., Dolfi, M., Auer, C., Dinkla, K., Staar, P.: Robust pdf document conversion", "bbox": {"l": 151.51801, "t": 229.29785000000004, "r": 480.59020999999996, "b": 237.36755000000005, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "using recurrent neural networks. Proceedings of the AAAI Conference on Artificial", "bbox": {"l": 151.51801, "t": 240.25684, "r": 480.59473, "b": 248.32654000000002, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Intelligence", "bbox": {"l": 151.51801, "t": 251.21582, "r": 197.08617, "b": 259.28552, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "35", "bbox": {"l": 199.40001, "t": 251.15301999999997, "r": 210.00726, "b": 259.07935, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "(17), 15137-15145 (May 2021),", "bbox": {"l": 210.007, "t": 251.21582, "r": 332.37683, "b": 259.28552, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "https://ojs.aaai.org/index.php/", "bbox": {"l": 334.69901, "t": 251.86139000000003, "r": 480.59039000000007, "b": 259.33038, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "AAAI/article/view/17777", "bbox": {"l": 151.51801, "t": 262.8194, "r": 259.75769, "b": 270.28839000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "8. Livathinos, N., Berrospi, C., Lysak, M., Kuropiatnyk, V., Nassar, A., Carvalho, A., Dolfi, M., Auer, C., Dinkla, K., Staar, P.: Robust pdf document conversion using recurrent neural networks. Proceedings of the AAAI Conference on Artificial Intelligence 35 (17), 15137-15145 (May 2021), https://ojs.aaai.org/index.php/ AAAI/article/view/17777"}, {"label": "list_item", "id": 11, "page_no": 12, "cluster": {"id": 11, "label": "list_item", "bbox": {"l": 139.371, "t": 273.14484000000004, "r": 480.59387000000004, "b": 303.13254, "coord_origin": "TOPLEFT"}, "confidence": 0.9557179808616638, "cells": [{"id": 23, "text": "9.", "bbox": {"l": 139.371, "t": 273.14484000000004, "r": 146.14218, "b": 281.21457, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "Nassar, A., Livathinos, N., Lysak, M., Staar, P.: Tableformer: Table structure un-", "bbox": {"l": 150.49533, "t": 273.14484000000004, "r": 480.5881999999999, "b": 281.21457, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "derstanding with transformers. In: Proceedings of the IEEE/CVF Conference on", "bbox": {"l": 151.51801, "t": 284.10379, "r": 480.59387000000004, "b": 292.17355, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "Computer Vision and Pattern Recognition (CVPR). pp. 4614-4623 (June 2022)", "bbox": {"l": 151.51801, "t": 295.06277, "r": 473.44308000000007, "b": 303.13254, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "9. Nassar, A., Livathinos, N., Lysak, M., Staar, P.: Tableformer: Table structure understanding with transformers. In: Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). pp. 4614-4623 (June 2022)"}, {"label": "list_item", "id": 9, "page_no": 12, "cluster": {"id": 9, "label": "list_item", "bbox": {"l": 134.76401, "t": 306.03277999999995, "r": 480.59372, "b": 368.94232, "coord_origin": "TOPLEFT"}, "confidence": 0.9639304876327515, "cells": [{"id": 27, "text": "10.", "bbox": {"l": 134.76401, "t": 306.03277999999995, "r": 146.49922, "b": 314.10254000000003, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Pfitzmann, B., Auer, C., Dolfi, M., Nassar, A.S., Staar, P.W.J.: Doclaynet: A", "bbox": {"l": 151.09138, "t": 306.03277999999995, "r": 480.58905, "b": 314.10254000000003, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "large human-annotated dataset for document-layout segmentation. In: Zhang, A.,", "bbox": {"l": 151.51801, "t": 316.99179, "r": 480.59015, "b": 325.06155, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Rangwala, H. (eds.) KDD \u201922: The 28th ACM SIGKDD Conference on Knowledge", "bbox": {"l": 151.51801, "t": 327.95078, "r": 480.59113, "b": 336.02054, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Discovery and Data Mining, Washington, DC, USA, August 14 - 18, 2022. pp.", "bbox": {"l": 151.51801, "t": 338.90976, "r": 480.59113, "b": 346.97952, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "3743-3751. ACM (2022).", "bbox": {"l": 151.51801, "t": 349.86874, "r": 251.14098999999996, "b": 357.93851, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "https://doi.org/10.1145/3534678.3539043", "bbox": {"l": 253.99001, "t": 350.5143100000001, "r": 437.53311, "b": 357.98333999999994, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": ",", "bbox": {"l": 437.53201, "t": 349.86874, "r": 440.09102999999993, "b": 357.93851, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "https://", "bbox": {"l": 442.94202000000007, "t": 350.5143100000001, "r": 480.59372, "b": 357.98333999999994, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "doi.org/10.1145/3534678.3539043", "bbox": {"l": 151.51801, "t": 361.47329999999994, "r": 297.40939, "b": 368.94232, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "10. Pfitzmann, B., Auer, C., Dolfi, M., Nassar, A.S., Staar, P.W.J.: Doclaynet: A large human-annotated dataset for document-layout segmentation. In: Zhang, A., Rangwala, H. (eds.) KDD \u201922: The 28th ACM SIGKDD Conference on Knowledge Discovery and Data Mining, Washington, DC, USA, August 14 - 18, 2022. pp. 3743-3751. ACM (2022). https://doi.org/10.1145/3534678.3539043 , https:// doi.org/10.1145/3534678.3539043"}, {"label": "list_item", "id": 0, "page_no": 12, "cluster": {"id": 0, "label": "list_item", "bbox": {"l": 134.76401, "t": 371.79773, "r": 480.59296, "b": 412.74448, "coord_origin": "TOPLEFT"}, "confidence": 0.9752162098884583, "cells": [{"id": 37, "text": "11.", "bbox": {"l": 134.76401, "t": 371.79773, "r": 146.03854, "b": 379.86749, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "Prasad, D., Gadpal, A., Kapadni, K., Visave, M., Sultanpure, K.: Cascadetabnet:", "bbox": {"l": 150.4505, "t": 371.79773, "r": 480.58914000000004, "b": 379.86749, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "An approach for end to end table detection and structure recognition from image-", "bbox": {"l": 151.51801, "t": 382.7567399999999, "r": 480.59296, "b": 390.82651, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "based documents. In: Proceedings of the IEEE/CVF conference on computer vision", "bbox": {"l": 151.51801, "t": 393.71573, "r": 480.59293, "b": 401.78549, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "and pattern recognition workshops. pp. 572-573 (2020)", "bbox": {"l": 151.51801, "t": 404.67471, "r": 373.82727, "b": 412.74448, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "11. Prasad, D., Gadpal, A., Kapadni, K., Visave, M., Sultanpure, K.: Cascadetabnet: An approach for end to end table detection and structure recognition from imagebased documents. In: Proceedings of the IEEE/CVF conference on computer vision and pattern recognition workshops. pp. 572-573 (2020)"}, {"label": "list_item", "id": 3, "page_no": 12, "cluster": {"id": 3, "label": "list_item", "bbox": {"l": 134.76401, "t": 415.64471, "r": 480.59469999999993, "b": 456.59146, "coord_origin": "TOPLEFT"}, "confidence": 0.9707236886024475, "cells": [{"id": 42, "text": "12.", "bbox": {"l": 134.76401, "t": 415.64471, "r": 145.91106, "b": 423.71448000000004, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Schreiber, S., Agne, S., Wolf, I., Dengel, A., Ahmed, S.: Deepdesrt: Deep learning", "bbox": {"l": 150.27309, "t": 415.64471, "r": 480.5874, "b": 423.71448000000004, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "for detection and structure recognition of tables in document images. In: 2017 14th", "bbox": {"l": 151.51801, "t": 426.60373, "r": 480.59469999999993, "b": 434.67349, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "IAPR international conference on document analysis and recognition (ICDAR).", "bbox": {"l": 151.51801, "t": 437.5627099999999, "r": 480.58844, "b": 445.63248, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "vol. 1, pp. 1162-1167. IEEE (2017)", "bbox": {"l": 151.51801, "t": 448.5217, "r": 292.91455, "b": 456.59146, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "12. Schreiber, S., Agne, S., Wolf, I., Dengel, A., Ahmed, S.: Deepdesrt: Deep learning for detection and structure recognition of tables in document images. In: 2017 14th IAPR international conference on document analysis and recognition (ICDAR). vol. 1, pp. 1162-1167. IEEE (2017)"}, {"label": "list_item", "id": 7, "page_no": 12, "cluster": {"id": 7, "label": "list_item", "bbox": {"l": 134.76401, "t": 459.4917, "r": 480.59372, "b": 500.48328, "coord_origin": "TOPLEFT"}, "confidence": 0.9658119678497314, "cells": [{"id": 47, "text": "13.", "bbox": {"l": 134.76401, "t": 459.4917, "r": 145.7785, "b": 467.56146, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Siddiqui, S.A., Fateh, I.A., Rizvi, S.T.R., Dengel, A., Ahmed, S.: Deeptabstr: Deep", "bbox": {"l": 150.08871, "t": 459.4917, "r": 480.59006, "b": 467.56146, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "learning based table structure recognition. In: 2019 International Conference on", "bbox": {"l": 151.51801, "t": 470.45071, "r": 480.59116, "b": 478.52048, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Document Analysis and Recognition (ICDAR). pp. 1403-1409 (2019).", "bbox": {"l": 151.51801, "t": 481.4097, "r": 439.05963, "b": 489.47946, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "https://", "bbox": {"l": 442.94202000000007, "t": 482.05527, "r": 480.59372, "b": 489.52429, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "doi.org/10.1109/ICDAR.2019.00226", "bbox": {"l": 151.51801, "t": 493.01425, "r": 302.11584, "b": 500.48328, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "13. Siddiqui, S.A., Fateh, I.A., Rizvi, S.T.R., Dengel, A., Ahmed, S.: Deeptabstr: Deep learning based table structure recognition. In: 2019 International Conference on Document Analysis and Recognition (ICDAR). pp. 1403-1409 (2019). https:// doi.org/10.1109/ICDAR.2019.00226"}, {"label": "list_item", "id": 2, "page_no": 12, "cluster": {"id": 2, "label": "list_item", "bbox": {"l": 134.76401, "t": 503.33868, "r": 480.59286000000003, "b": 544.28545, "coord_origin": "TOPLEFT"}, "confidence": 0.972225546836853, "cells": [{"id": 53, "text": "14.", "bbox": {"l": 134.76401, "t": 503.33868, "r": 146.15501, "b": 511.40845, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "Smock, B., Pesala, R., Abraham, R.: PubTables-1M: Towards comprehensive ta-", "bbox": {"l": 150.61252, "t": 503.33868, "r": 480.59088, "b": 511.40845, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "ble extraction from unstructured documents. In: Proceedings of the IEEE/CVF", "bbox": {"l": 151.51801, "t": 514.2977000000001, "r": 480.59286000000003, "b": 522.3674599999999, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Conference on Computer Vision and Pattern Recognition (CVPR). pp. 4634-4642", "bbox": {"l": 151.51801, "t": 525.25668, "r": 480.58838000000003, "b": 533.32645, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "(June 2022)", "bbox": {"l": 151.51801, "t": 536.21568, "r": 199.24704, "b": 544.28545, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "14. Smock, B., Pesala, R., Abraham, R.: PubTables-1M: Towards comprehensive table extraction from unstructured documents. In: Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). pp. 4634-4642 (June 2022)"}, {"label": "list_item", "id": 6, "page_no": 12, "cluster": {"id": 6, "label": "list_item", "bbox": {"l": 134.76401, "t": 547.18568, "r": 480.59583, "b": 610.09528, "coord_origin": "TOPLEFT"}, "confidence": 0.9674035906791687, "cells": [{"id": 58, "text": "15.", "bbox": {"l": 134.76401, "t": 547.18568, "r": 146.16588, "b": 555.25545, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Staar, P.W.J., Dolfi, M., Auer, C., Bekas, C.: Corpus conversion service: A ma-", "bbox": {"l": 150.62764, "t": 547.18568, "r": 480.58734000000004, "b": 555.25545, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "chine learning platform to ingest documents at scale. In: Proceedings of the 24th", "bbox": {"l": 151.51801, "t": 558.14468, "r": 480.58838000000003, "b": 566.2144499999999, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "ACM SIGKDD International Conference on Knowledge Discovery & Data Min-", "bbox": {"l": 151.51801, "t": 569.1036799999999, "r": 480.59109, "b": 577.17345, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "ing. pp. 774-782. KDD \u201918, Association for Computing Machinery, New York, NY,", "bbox": {"l": 151.51801, "t": 580.06268, "r": 480.59195, "b": 588.1324500000001, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "USA (2018).", "bbox": {"l": 151.51801, "t": 591.0216800000001, "r": 200.75787, "b": 599.09145, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "https://doi.org/10.1145/3219819.3219834", "bbox": {"l": 202.916, "t": 591.66727, "r": 386.45911, "b": 599.1362799999999, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": ",", "bbox": {"l": 386.45801, "t": 591.0216800000001, "r": 389.01703, "b": 599.09145, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "https://doi.org/10.", "bbox": {"l": 391.173, "t": 591.66727, "r": 480.59583, "b": 599.1362799999999, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "1145/3219819.3219834", "bbox": {"l": 151.51801, "t": 602.62627, "r": 245.63831, "b": 610.09528, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "15. Staar, P.W.J., Dolfi, M., Auer, C., Bekas, C.: Corpus conversion service: A machine learning platform to ingest documents at scale. In: Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining. pp. 774-782. KDD \u201918, Association for Computing Machinery, New York, NY, USA (2018). https://doi.org/10.1145/3219819.3219834 , https://doi.org/10. 1145/3219819.3219834"}, {"label": "list_item", "id": 12, "page_no": 12, "cluster": {"id": 12, "label": "list_item", "bbox": {"l": 134.76401, "t": 612.95068, "r": 480.59542999999996, "b": 631.97945, "coord_origin": "TOPLEFT"}, "confidence": 0.9416431188583374, "cells": [{"id": 68, "text": "16.", "bbox": {"l": 134.76401, "t": 612.95068, "r": 146.62019, "b": 621.02045, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "Wang, X.: Tabular Abstraction, Editing, and Formatting. Ph.D. thesis, CAN", "bbox": {"l": 151.25977, "t": 612.95068, "r": 480.59542999999996, "b": 621.02045, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "(1996), aAINN09397", "bbox": {"l": 151.51801, "t": 623.90968, "r": 234.43031, "b": 631.97945, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "16. Wang, X.: Tabular Abstraction, Editing, and Formatting. Ph.D. thesis, CAN (1996), aAINN09397"}, {"label": "list_item", "id": 8, "page_no": 12, "cluster": {"id": 8, "label": "list_item", "bbox": {"l": 134.76401, "t": 634.87968, "r": 480.59119, "b": 664.86745, "coord_origin": "TOPLEFT"}, "confidence": 0.964638352394104, "cells": [{"id": 71, "text": "17.", "bbox": {"l": 134.76401, "t": 634.87968, "r": 146.30539, "b": 642.9494500000001, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "Xue, W., Li, Q., Tao, D.: Res2tim: Reconstruct syntactic structures from table", "bbox": {"l": 150.82175, "t": 634.87968, "r": 480.58731000000006, "b": 642.9494500000001, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "images. In: 2019 International Conference on Document Analysis and Recognition", "bbox": {"l": 151.51801, "t": 645.8386800000001, "r": 480.59119, "b": 653.90845, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "(ICDAR). pp. 749-755. IEEE (2019)", "bbox": {"l": 151.51801, "t": 656.79768, "r": 299.30307, "b": 664.86745, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "17. Xue, W., Li, Q., Tao, D.: Res2tim: Reconstruct syntactic structures from table images. In: 2019 International Conference on Document Analysis and Recognition (ICDAR). pp. 749-755. IEEE (2019)"}], "body": [{"label": "list_item", "id": 5, "page_no": 12, "cluster": {"id": 5, "label": "list_item", "bbox": {"l": 139.371, "t": 119.67400999999995, "r": 480.59479, "b": 149.66168000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9677113890647888, "cells": [{"id": 2, "text": "5.", "bbox": {"l": 139.371, "t": 119.67400999999995, "r": 146.04857, "b": 127.74370999999985, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Kayal, P., Anand, M., Desai, H., Singh, M.: Tables to latex: structure and content", "bbox": {"l": 150.34157, "t": 119.67400999999995, "r": 480.58826, "b": 127.74370999999985, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "extraction from scientific tables. International Journal on Document Analysis and", "bbox": {"l": 151.51801, "t": 130.63300000000004, "r": 480.59479, "b": 138.70270000000005, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Recognition (IJDAR) pp. 1-10 (2022)", "bbox": {"l": 151.51801, "t": 141.59198000000004, "r": 304.04364, "b": 149.66168000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5. Kayal, P., Anand, M., Desai, H., Singh, M.: Tables to latex: structure and content extraction from scientific tables. International Journal on Document Analysis and Recognition (IJDAR) pp. 1-10 (2022)"}, {"label": "list_item", "id": 1, "page_no": 12, "cluster": {"id": 1, "label": "list_item", "bbox": {"l": 139.371, "t": 152.56195000000002, "r": 480.59286000000003, "b": 193.50860999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.973045289516449, "cells": [{"id": 6, "text": "6.", "bbox": {"l": 139.371, "t": 152.56195000000002, "r": 145.93991, "b": 160.63165000000004, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Lee, E., Kwon, J., Yang, H., Park, J., Lee, S., Koo, H.I., Cho, N.I.: Table structure", "bbox": {"l": 150.16298, "t": 152.56195000000002, "r": 480.59015, "b": 160.63165000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "recognition based on grid shape graph. In: 2022 Asia-Pacific Signal and Information", "bbox": {"l": 151.51801, "t": 163.52094, "r": 480.5903, "b": 171.59064, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Processing Association Annual Summit and Conference (APSIPA ASC). pp. 1868-", "bbox": {"l": 151.51801, "t": 174.47992, "r": 480.59286000000003, "b": 182.54962, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "1873. IEEE (2022)", "bbox": {"l": 151.51801, "t": 185.4389, "r": 226.37399, "b": 193.50860999999998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "6. Lee, E., Kwon, J., Yang, H., Park, J., Lee, S., Koo, H.I., Cho, N.I.: Table structure recognition based on grid shape graph. In: 2022 Asia-Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC). pp. 18681873. IEEE (2022)"}, {"label": "list_item", "id": 10, "page_no": 12, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 139.371, "t": 196.40886999999998, "r": 480.59012, "b": 215.43755999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9582491517066956, "cells": [{"id": 11, "text": "7.", "bbox": {"l": 139.371, "t": 196.40886999999998, "r": 146.31418, "b": 204.47857999999997, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Li, M., Cui, L., Huang, S., Wei, F., Zhou, M., Li, Z.: Tablebank: A benchmark", "bbox": {"l": 150.77789, "t": 196.40886999999998, "r": 480.59012, "b": 204.47857999999997, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "dataset for table detection and recognition (2019)", "bbox": {"l": 151.51801, "t": 207.36785999999995, "r": 352.01746, "b": 215.43755999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "7. Li, M., Cui, L., Huang, S., Wei, F., Zhou, M., Li, Z.: Tablebank: A benchmark dataset for table detection and recognition (2019)"}, {"label": "list_item", "id": 4, "page_no": 12, "cluster": {"id": 4, "label": "list_item", "bbox": {"l": 139.371, "t": 218.33887000000004, "r": 480.59473, "b": 270.28839000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9678146243095398, "cells": [{"id": 14, "text": "8.", "bbox": {"l": 139.371, "t": 218.33887000000004, "r": 146.37106, "b": 226.40857000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Livathinos, N., Berrospi, C., Lysak, M., Kuropiatnyk, V., Nassar, A., Carvalho,", "bbox": {"l": 150.87132, "t": 218.33887000000004, "r": 480.58731000000006, "b": 226.40857000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "A., Dolfi, M., Auer, C., Dinkla, K., Staar, P.: Robust pdf document conversion", "bbox": {"l": 151.51801, "t": 229.29785000000004, "r": 480.59020999999996, "b": 237.36755000000005, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "using recurrent neural networks. Proceedings of the AAAI Conference on Artificial", "bbox": {"l": 151.51801, "t": 240.25684, "r": 480.59473, "b": 248.32654000000002, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Intelligence", "bbox": {"l": 151.51801, "t": 251.21582, "r": 197.08617, "b": 259.28552, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "35", "bbox": {"l": 199.40001, "t": 251.15301999999997, "r": 210.00726, "b": 259.07935, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "(17), 15137-15145 (May 2021),", "bbox": {"l": 210.007, "t": 251.21582, "r": 332.37683, "b": 259.28552, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "https://ojs.aaai.org/index.php/", "bbox": {"l": 334.69901, "t": 251.86139000000003, "r": 480.59039000000007, "b": 259.33038, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "AAAI/article/view/17777", "bbox": {"l": 151.51801, "t": 262.8194, "r": 259.75769, "b": 270.28839000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "8. Livathinos, N., Berrospi, C., Lysak, M., Kuropiatnyk, V., Nassar, A., Carvalho, A., Dolfi, M., Auer, C., Dinkla, K., Staar, P.: Robust pdf document conversion using recurrent neural networks. Proceedings of the AAAI Conference on Artificial Intelligence 35 (17), 15137-15145 (May 2021), https://ojs.aaai.org/index.php/ AAAI/article/view/17777"}, {"label": "list_item", "id": 11, "page_no": 12, "cluster": {"id": 11, "label": "list_item", "bbox": {"l": 139.371, "t": 273.14484000000004, "r": 480.59387000000004, "b": 303.13254, "coord_origin": "TOPLEFT"}, "confidence": 0.9557179808616638, "cells": [{"id": 23, "text": "9.", "bbox": {"l": 139.371, "t": 273.14484000000004, "r": 146.14218, "b": 281.21457, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "Nassar, A., Livathinos, N., Lysak, M., Staar, P.: Tableformer: Table structure un-", "bbox": {"l": 150.49533, "t": 273.14484000000004, "r": 480.5881999999999, "b": 281.21457, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "derstanding with transformers. In: Proceedings of the IEEE/CVF Conference on", "bbox": {"l": 151.51801, "t": 284.10379, "r": 480.59387000000004, "b": 292.17355, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "Computer Vision and Pattern Recognition (CVPR). pp. 4614-4623 (June 2022)", "bbox": {"l": 151.51801, "t": 295.06277, "r": 473.44308000000007, "b": 303.13254, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "9. Nassar, A., Livathinos, N., Lysak, M., Staar, P.: Tableformer: Table structure understanding with transformers. In: Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). pp. 4614-4623 (June 2022)"}, {"label": "list_item", "id": 9, "page_no": 12, "cluster": {"id": 9, "label": "list_item", "bbox": {"l": 134.76401, "t": 306.03277999999995, "r": 480.59372, "b": 368.94232, "coord_origin": "TOPLEFT"}, "confidence": 0.9639304876327515, "cells": [{"id": 27, "text": "10.", "bbox": {"l": 134.76401, "t": 306.03277999999995, "r": 146.49922, "b": 314.10254000000003, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Pfitzmann, B., Auer, C., Dolfi, M., Nassar, A.S., Staar, P.W.J.: Doclaynet: A", "bbox": {"l": 151.09138, "t": 306.03277999999995, "r": 480.58905, "b": 314.10254000000003, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "large human-annotated dataset for document-layout segmentation. In: Zhang, A.,", "bbox": {"l": 151.51801, "t": 316.99179, "r": 480.59015, "b": 325.06155, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Rangwala, H. (eds.) KDD \u201922: The 28th ACM SIGKDD Conference on Knowledge", "bbox": {"l": 151.51801, "t": 327.95078, "r": 480.59113, "b": 336.02054, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Discovery and Data Mining, Washington, DC, USA, August 14 - 18, 2022. pp.", "bbox": {"l": 151.51801, "t": 338.90976, "r": 480.59113, "b": 346.97952, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "3743-3751. ACM (2022).", "bbox": {"l": 151.51801, "t": 349.86874, "r": 251.14098999999996, "b": 357.93851, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "https://doi.org/10.1145/3534678.3539043", "bbox": {"l": 253.99001, "t": 350.5143100000001, "r": 437.53311, "b": 357.98333999999994, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": ",", "bbox": {"l": 437.53201, "t": 349.86874, "r": 440.09102999999993, "b": 357.93851, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "https://", "bbox": {"l": 442.94202000000007, "t": 350.5143100000001, "r": 480.59372, "b": 357.98333999999994, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "doi.org/10.1145/3534678.3539043", "bbox": {"l": 151.51801, "t": 361.47329999999994, "r": 297.40939, "b": 368.94232, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "10. Pfitzmann, B., Auer, C., Dolfi, M., Nassar, A.S., Staar, P.W.J.: Doclaynet: A large human-annotated dataset for document-layout segmentation. In: Zhang, A., Rangwala, H. (eds.) KDD \u201922: The 28th ACM SIGKDD Conference on Knowledge Discovery and Data Mining, Washington, DC, USA, August 14 - 18, 2022. pp. 3743-3751. ACM (2022). https://doi.org/10.1145/3534678.3539043 , https:// doi.org/10.1145/3534678.3539043"}, {"label": "list_item", "id": 0, "page_no": 12, "cluster": {"id": 0, "label": "list_item", "bbox": {"l": 134.76401, "t": 371.79773, "r": 480.59296, "b": 412.74448, "coord_origin": "TOPLEFT"}, "confidence": 0.9752162098884583, "cells": [{"id": 37, "text": "11.", "bbox": {"l": 134.76401, "t": 371.79773, "r": 146.03854, "b": 379.86749, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "Prasad, D., Gadpal, A., Kapadni, K., Visave, M., Sultanpure, K.: Cascadetabnet:", "bbox": {"l": 150.4505, "t": 371.79773, "r": 480.58914000000004, "b": 379.86749, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "An approach for end to end table detection and structure recognition from image-", "bbox": {"l": 151.51801, "t": 382.7567399999999, "r": 480.59296, "b": 390.82651, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "based documents. In: Proceedings of the IEEE/CVF conference on computer vision", "bbox": {"l": 151.51801, "t": 393.71573, "r": 480.59293, "b": 401.78549, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "and pattern recognition workshops. pp. 572-573 (2020)", "bbox": {"l": 151.51801, "t": 404.67471, "r": 373.82727, "b": 412.74448, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "11. Prasad, D., Gadpal, A., Kapadni, K., Visave, M., Sultanpure, K.: Cascadetabnet: An approach for end to end table detection and structure recognition from imagebased documents. In: Proceedings of the IEEE/CVF conference on computer vision and pattern recognition workshops. pp. 572-573 (2020)"}, {"label": "list_item", "id": 3, "page_no": 12, "cluster": {"id": 3, "label": "list_item", "bbox": {"l": 134.76401, "t": 415.64471, "r": 480.59469999999993, "b": 456.59146, "coord_origin": "TOPLEFT"}, "confidence": 0.9707236886024475, "cells": [{"id": 42, "text": "12.", "bbox": {"l": 134.76401, "t": 415.64471, "r": 145.91106, "b": 423.71448000000004, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Schreiber, S., Agne, S., Wolf, I., Dengel, A., Ahmed, S.: Deepdesrt: Deep learning", "bbox": {"l": 150.27309, "t": 415.64471, "r": 480.5874, "b": 423.71448000000004, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "for detection and structure recognition of tables in document images. In: 2017 14th", "bbox": {"l": 151.51801, "t": 426.60373, "r": 480.59469999999993, "b": 434.67349, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "IAPR international conference on document analysis and recognition (ICDAR).", "bbox": {"l": 151.51801, "t": 437.5627099999999, "r": 480.58844, "b": 445.63248, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "vol. 1, pp. 1162-1167. IEEE (2017)", "bbox": {"l": 151.51801, "t": 448.5217, "r": 292.91455, "b": 456.59146, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "12. Schreiber, S., Agne, S., Wolf, I., Dengel, A., Ahmed, S.: Deepdesrt: Deep learning for detection and structure recognition of tables in document images. In: 2017 14th IAPR international conference on document analysis and recognition (ICDAR). vol. 1, pp. 1162-1167. IEEE (2017)"}, {"label": "list_item", "id": 7, "page_no": 12, "cluster": {"id": 7, "label": "list_item", "bbox": {"l": 134.76401, "t": 459.4917, "r": 480.59372, "b": 500.48328, "coord_origin": "TOPLEFT"}, "confidence": 0.9658119678497314, "cells": [{"id": 47, "text": "13.", "bbox": {"l": 134.76401, "t": 459.4917, "r": 145.7785, "b": 467.56146, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Siddiqui, S.A., Fateh, I.A., Rizvi, S.T.R., Dengel, A., Ahmed, S.: Deeptabstr: Deep", "bbox": {"l": 150.08871, "t": 459.4917, "r": 480.59006, "b": 467.56146, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "learning based table structure recognition. In: 2019 International Conference on", "bbox": {"l": 151.51801, "t": 470.45071, "r": 480.59116, "b": 478.52048, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Document Analysis and Recognition (ICDAR). pp. 1403-1409 (2019).", "bbox": {"l": 151.51801, "t": 481.4097, "r": 439.05963, "b": 489.47946, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "https://", "bbox": {"l": 442.94202000000007, "t": 482.05527, "r": 480.59372, "b": 489.52429, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "doi.org/10.1109/ICDAR.2019.00226", "bbox": {"l": 151.51801, "t": 493.01425, "r": 302.11584, "b": 500.48328, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "13. Siddiqui, S.A., Fateh, I.A., Rizvi, S.T.R., Dengel, A., Ahmed, S.: Deeptabstr: Deep learning based table structure recognition. In: 2019 International Conference on Document Analysis and Recognition (ICDAR). pp. 1403-1409 (2019). https:// doi.org/10.1109/ICDAR.2019.00226"}, {"label": "list_item", "id": 2, "page_no": 12, "cluster": {"id": 2, "label": "list_item", "bbox": {"l": 134.76401, "t": 503.33868, "r": 480.59286000000003, "b": 544.28545, "coord_origin": "TOPLEFT"}, "confidence": 0.972225546836853, "cells": [{"id": 53, "text": "14.", "bbox": {"l": 134.76401, "t": 503.33868, "r": 146.15501, "b": 511.40845, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "Smock, B., Pesala, R., Abraham, R.: PubTables-1M: Towards comprehensive ta-", "bbox": {"l": 150.61252, "t": 503.33868, "r": 480.59088, "b": 511.40845, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "ble extraction from unstructured documents. In: Proceedings of the IEEE/CVF", "bbox": {"l": 151.51801, "t": 514.2977000000001, "r": 480.59286000000003, "b": 522.3674599999999, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Conference on Computer Vision and Pattern Recognition (CVPR). pp. 4634-4642", "bbox": {"l": 151.51801, "t": 525.25668, "r": 480.58838000000003, "b": 533.32645, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "(June 2022)", "bbox": {"l": 151.51801, "t": 536.21568, "r": 199.24704, "b": 544.28545, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "14. Smock, B., Pesala, R., Abraham, R.: PubTables-1M: Towards comprehensive table extraction from unstructured documents. In: Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). pp. 4634-4642 (June 2022)"}, {"label": "list_item", "id": 6, "page_no": 12, "cluster": {"id": 6, "label": "list_item", "bbox": {"l": 134.76401, "t": 547.18568, "r": 480.59583, "b": 610.09528, "coord_origin": "TOPLEFT"}, "confidence": 0.9674035906791687, "cells": [{"id": 58, "text": "15.", "bbox": {"l": 134.76401, "t": 547.18568, "r": 146.16588, "b": 555.25545, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Staar, P.W.J., Dolfi, M., Auer, C., Bekas, C.: Corpus conversion service: A ma-", "bbox": {"l": 150.62764, "t": 547.18568, "r": 480.58734000000004, "b": 555.25545, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "chine learning platform to ingest documents at scale. In: Proceedings of the 24th", "bbox": {"l": 151.51801, "t": 558.14468, "r": 480.58838000000003, "b": 566.2144499999999, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "ACM SIGKDD International Conference on Knowledge Discovery & Data Min-", "bbox": {"l": 151.51801, "t": 569.1036799999999, "r": 480.59109, "b": 577.17345, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "ing. pp. 774-782. KDD \u201918, Association for Computing Machinery, New York, NY,", "bbox": {"l": 151.51801, "t": 580.06268, "r": 480.59195, "b": 588.1324500000001, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "USA (2018).", "bbox": {"l": 151.51801, "t": 591.0216800000001, "r": 200.75787, "b": 599.09145, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "https://doi.org/10.1145/3219819.3219834", "bbox": {"l": 202.916, "t": 591.66727, "r": 386.45911, "b": 599.1362799999999, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": ",", "bbox": {"l": 386.45801, "t": 591.0216800000001, "r": 389.01703, "b": 599.09145, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "https://doi.org/10.", "bbox": {"l": 391.173, "t": 591.66727, "r": 480.59583, "b": 599.1362799999999, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "1145/3219819.3219834", "bbox": {"l": 151.51801, "t": 602.62627, "r": 245.63831, "b": 610.09528, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "15. Staar, P.W.J., Dolfi, M., Auer, C., Bekas, C.: Corpus conversion service: A machine learning platform to ingest documents at scale. In: Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining. pp. 774-782. KDD \u201918, Association for Computing Machinery, New York, NY, USA (2018). https://doi.org/10.1145/3219819.3219834 , https://doi.org/10. 1145/3219819.3219834"}, {"label": "list_item", "id": 12, "page_no": 12, "cluster": {"id": 12, "label": "list_item", "bbox": {"l": 134.76401, "t": 612.95068, "r": 480.59542999999996, "b": 631.97945, "coord_origin": "TOPLEFT"}, "confidence": 0.9416431188583374, "cells": [{"id": 68, "text": "16.", "bbox": {"l": 134.76401, "t": 612.95068, "r": 146.62019, "b": 621.02045, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "Wang, X.: Tabular Abstraction, Editing, and Formatting. Ph.D. thesis, CAN", "bbox": {"l": 151.25977, "t": 612.95068, "r": 480.59542999999996, "b": 621.02045, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "(1996), aAINN09397", "bbox": {"l": 151.51801, "t": 623.90968, "r": 234.43031, "b": 631.97945, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "16. Wang, X.: Tabular Abstraction, Editing, and Formatting. Ph.D. thesis, CAN (1996), aAINN09397"}, {"label": "list_item", "id": 8, "page_no": 12, "cluster": {"id": 8, "label": "list_item", "bbox": {"l": 134.76401, "t": 634.87968, "r": 480.59119, "b": 664.86745, "coord_origin": "TOPLEFT"}, "confidence": 0.964638352394104, "cells": [{"id": 71, "text": "17.", "bbox": {"l": 134.76401, "t": 634.87968, "r": 146.30539, "b": 642.9494500000001, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "Xue, W., Li, Q., Tao, D.: Res2tim: Reconstruct syntactic structures from table", "bbox": {"l": 150.82175, "t": 634.87968, "r": 480.58731000000006, "b": 642.9494500000001, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "images. In: 2019 International Conference on Document Analysis and Recognition", "bbox": {"l": 151.51801, "t": 645.8386800000001, "r": 480.59119, "b": 653.90845, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "(ICDAR). pp. 749-755. IEEE (2019)", "bbox": {"l": 151.51801, "t": 656.79768, "r": 299.30307, "b": 664.86745, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "17. Xue, W., Li, Q., Tao, D.: Res2tim: Reconstruct syntactic structures from table images. In: 2019 International Conference on Document Analysis and Recognition (ICDAR). pp. 749-755. IEEE (2019)"}], "headers": [{"label": "page_header", "id": 13, "page_no": 12, "cluster": {"id": 13, "label": "page_header", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9163166880607605, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Optimized Table Tokenization for Table Structure Recognition"}, {"label": "page_header", "id": 14, "page_no": 12, "cluster": {"id": 14, "label": "page_header", "bbox": {"l": 471.37561, "t": 93.77099999999996, "r": 480.5894799999999, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9061065912246704, "cells": [{"id": 1, "text": "13", "bbox": {"l": 471.37561, "t": 93.77099999999996, "r": 480.5894799999999, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "13"}]}}, {"page_no": 13, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "14", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 143.97887, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "M.", "bbox": {"l": 167.82053, "t": 93.77099999999996, "r": 178.08249, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37929, "t": 93.77099999999996, "r": 231.72049000000004, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "18.", "bbox": {"l": 134.765, "t": 119.67400999999995, "r": 146.07936, "b": 127.74370999999985, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Xue, W., Yu, B., Wang, W., Tao, D., Li, Q.: Tgrnet: A table graph reconstruc-", "bbox": {"l": 150.5069, "t": 119.67400999999995, "r": 480.5892, "b": 127.74370999999985, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "tion network for table structure recognition. In: Proceedings of the IEEE/CVF", "bbox": {"l": 151.51801, "t": 130.63300000000004, "r": 480.59113, "b": 138.70270000000005, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "International Conference on Computer Vision. pp. 1295-1304 (2021)", "bbox": {"l": 151.51801, "t": 141.59198000000004, "r": 427.53329, "b": 149.66168000000005, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "19.", "bbox": {"l": 134.765, "t": 152.55096000000003, "r": 146.19109, "b": 160.62067000000002, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Ye, J., Qi, X., He, Y., Chen, Y., Gu, D., Gao, P., Xiao, R.: Pingan-vcgroup\u2019s", "bbox": {"l": 150.66234, "t": 152.55096000000003, "r": 480.5936899999999, "b": 160.62067000000002, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "solution for icdar 2021 competition on scientific literature parsing task b: Ta-", "bbox": {"l": 151.51801, "t": 163.50995, "r": 480.59469999999993, "b": 171.57965000000002, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "ble recognition to html (2021).", "bbox": {"l": 151.51801, "t": 174.46893, "r": 280.64047, "b": 182.53864, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "https://doi.org/10.48550/ARXIV.2105.01848", "bbox": {"l": 285.078, "t": 175.11450000000002, "r": 478.03403000000003, "b": 182.58349999999996, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": ",", "bbox": {"l": 478.0319799999999, "t": 174.46893, "r": 480.59099999999995, "b": 182.53864, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "https://arxiv.org/abs/2105.01848", "bbox": {"l": 151.51797, "t": 186.07349, "r": 302.11584, "b": 193.54247999999995, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "20.", "bbox": {"l": 134.76497, "t": 196.38689999999997, "r": 145.65964, "b": 204.45659999999998, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Zhang, Z., Zhang, J., Du, J., Wang, F.: Split, embed and merge: An accurate table", "bbox": {"l": 149.92294, "t": 196.38689999999997, "r": 480.5935400000001, "b": 204.45659999999998, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "structure recognizer. Pattern Recognition", "bbox": {"l": 151.51797, "t": 207.34491000000003, "r": 318.55124, "b": 215.41461000000004, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "126", "bbox": {"l": 321.62097, "t": 207.2821, "r": 337.53186, "b": 215.20844, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": ", 108565 (2022)", "bbox": {"l": 337.53296, "t": 207.34491000000003, "r": 399.46927, "b": 215.41461000000004, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "21.", "bbox": {"l": 134.76495, "t": 218.30389000000002, "r": 145.7213, "b": 226.3736, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Zheng, X., Burdick, D., Popa, L., Zhong, X., Wang, N.X.R.: Global table extractor", "bbox": {"l": 150.00871, "t": 218.30389000000002, "r": 480.59012, "b": 226.3736, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "(gte): A framework for joint table identification and cell structure recognition using", "bbox": {"l": 151.51796, "t": 229.26288, "r": 480.59102999999993, "b": 237.33258, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "visual context. In: 2021 IEEE Winter Conference on Applications of Computer Vi-", "bbox": {"l": 151.51796, "t": 240.22186, "r": 480.59119, "b": 248.29156, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "sion (WACV). pp. 697-706 (2021).", "bbox": {"l": 151.51796, "t": 251.18084999999996, "r": 293.44086, "b": 259.25055, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "https://doi.org/10.1109/WACV48630.2021.", "bbox": {"l": 297.04996, "t": 251.82641999999998, "r": 480.59305000000006, "b": 259.29540999999995, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "00074", "bbox": {"l": 151.51796, "t": 262.7854, "r": 175.05028, "b": 270.25438999999994, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "22.", "bbox": {"l": 134.76495, "t": 273.09882000000005, "r": 146.36798, "b": 281.16855000000004, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Zhong, X., ShafieiBavani, E., Jimeno Yepes, A.: Image-based table recognition:", "bbox": {"l": 150.90846, "t": 273.09882000000005, "r": 480.59094, "b": 281.16855000000004, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Data, model, and evaluation. In: Vedaldi, A., Bischof, H., Brox, T., Frahm, J.M.", "bbox": {"l": 151.51796, "t": 284.05777, "r": 480.58832000000007, "b": 292.12753, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "(eds.) Computer Vision - ECCV 2020. pp. 564-580. Springer International Pub-", "bbox": {"l": 151.51796, "t": 295.01675, "r": 480.59558, "b": 303.08651999999995, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "lishing, Cham (2020)", "bbox": {"l": 151.51796, "t": 305.97574, "r": 236.02359, "b": 314.0455, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "23.", "bbox": {"l": 134.76495, "t": 316.93472, "r": 145.69547, "b": 325.00449000000003, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Zhong, X., Tang, J., Yepes, A.J.: Publaynet: largest dataset ever for document lay-", "bbox": {"l": 149.97276, "t": 316.93472, "r": 480.59454, "b": 325.00449000000003, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "out analysis. In: 2019 International Conference on Document Analysis and Recog-", "bbox": {"l": 151.51796, "t": 327.8927299999999, "r": 480.59387000000004, "b": 335.96249, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "nition (ICDAR). pp. 1015-1022. IEEE (2019)", "bbox": {"l": 151.51796, "t": 338.85172, "r": 335.13635, "b": 346.92148, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 7, "label": "page_header", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 143.97887, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.7012730240821838, "cells": [{"id": 0, "text": "14", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 143.97887, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "page_header", "bbox": {"l": 167.82053, "t": 93.77099999999996, "r": 231.72049000000004, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.7889755368232727, "cells": [{"id": 1, "text": "M.", "bbox": {"l": 167.82053, "t": 93.77099999999996, "r": 178.08249, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37929, "t": 93.77099999999996, "r": 231.72049000000004, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "list_item", "bbox": {"l": 134.765, "t": 119.67400999999995, "r": 480.59113, "b": 149.66168000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9444758892059326, "cells": [{"id": 3, "text": "18.", "bbox": {"l": 134.765, "t": 119.67400999999995, "r": 146.07936, "b": 127.74370999999985, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Xue, W., Yu, B., Wang, W., Tao, D., Li, Q.: Tgrnet: A table graph reconstruc-", "bbox": {"l": 150.5069, "t": 119.67400999999995, "r": 480.5892, "b": 127.74370999999985, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "tion network for table structure recognition. In: Proceedings of the IEEE/CVF", "bbox": {"l": 151.51801, "t": 130.63300000000004, "r": 480.59113, "b": 138.70270000000005, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "International Conference on Computer Vision. pp. 1295-1304 (2021)", "bbox": {"l": 151.51801, "t": 141.59198000000004, "r": 427.53329, "b": 149.66168000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "list_item", "bbox": {"l": 134.765, "t": 152.55096000000003, "r": 480.59469999999993, "b": 193.54247999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9540891051292419, "cells": [{"id": 7, "text": "19.", "bbox": {"l": 134.765, "t": 152.55096000000003, "r": 146.19109, "b": 160.62067000000002, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Ye, J., Qi, X., He, Y., Chen, Y., Gu, D., Gao, P., Xiao, R.: Pingan-vcgroup\u2019s", "bbox": {"l": 150.66234, "t": 152.55096000000003, "r": 480.5936899999999, "b": 160.62067000000002, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "solution for icdar 2021 competition on scientific literature parsing task b: Ta-", "bbox": {"l": 151.51801, "t": 163.50995, "r": 480.59469999999993, "b": 171.57965000000002, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "ble recognition to html (2021).", "bbox": {"l": 151.51801, "t": 174.46893, "r": 280.64047, "b": 182.53864, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "https://doi.org/10.48550/ARXIV.2105.01848", "bbox": {"l": 285.078, "t": 175.11450000000002, "r": 478.03403000000003, "b": 182.58349999999996, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": ",", "bbox": {"l": 478.0319799999999, "t": 174.46893, "r": 480.59099999999995, "b": 182.53864, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "https://arxiv.org/abs/2105.01848", "bbox": {"l": 151.51797, "t": 186.07349, "r": 302.11584, "b": 193.54247999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "list_item", "bbox": {"l": 134.76497, "t": 196.38689999999997, "r": 480.5935400000001, "b": 215.41461000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9531471729278564, "cells": [{"id": 14, "text": "20.", "bbox": {"l": 134.76497, "t": 196.38689999999997, "r": 145.65964, "b": 204.45659999999998, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Zhang, Z., Zhang, J., Du, J., Wang, F.: Split, embed and merge: An accurate table", "bbox": {"l": 149.92294, "t": 196.38689999999997, "r": 480.5935400000001, "b": 204.45659999999998, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "structure recognizer. Pattern Recognition", "bbox": {"l": 151.51797, "t": 207.34491000000003, "r": 318.55124, "b": 215.41461000000004, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "126", "bbox": {"l": 321.62097, "t": 207.2821, "r": 337.53186, "b": 215.20844, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": ", 108565 (2022)", "bbox": {"l": 337.53296, "t": 207.34491000000003, "r": 399.46927, "b": 215.41461000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "list_item", "bbox": {"l": 134.76495, "t": 218.30389000000002, "r": 480.59305000000006, "b": 270.25438999999994, "coord_origin": "TOPLEFT"}, "confidence": 0.9720271825790405, "cells": [{"id": 19, "text": "21.", "bbox": {"l": 134.76495, "t": 218.30389000000002, "r": 145.7213, "b": 226.3736, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Zheng, X., Burdick, D., Popa, L., Zhong, X., Wang, N.X.R.: Global table extractor", "bbox": {"l": 150.00871, "t": 218.30389000000002, "r": 480.59012, "b": 226.3736, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "(gte): A framework for joint table identification and cell structure recognition using", "bbox": {"l": 151.51796, "t": 229.26288, "r": 480.59102999999993, "b": 237.33258, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "visual context. In: 2021 IEEE Winter Conference on Applications of Computer Vi-", "bbox": {"l": 151.51796, "t": 240.22186, "r": 480.59119, "b": 248.29156, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "sion (WACV). pp. 697-706 (2021).", "bbox": {"l": 151.51796, "t": 251.18084999999996, "r": 293.44086, "b": 259.25055, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "https://doi.org/10.1109/WACV48630.2021.", "bbox": {"l": 297.04996, "t": 251.82641999999998, "r": 480.59305000000006, "b": 259.29540999999995, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "00074", "bbox": {"l": 151.51796, "t": 262.7854, "r": 175.05028, "b": 270.25438999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "list_item", "bbox": {"l": 134.76495, "t": 273.09882000000005, "r": 480.59558, "b": 314.0455, "coord_origin": "TOPLEFT"}, "confidence": 0.9685125946998596, "cells": [{"id": 26, "text": "22.", "bbox": {"l": 134.76495, "t": 273.09882000000005, "r": 146.36798, "b": 281.16855000000004, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Zhong, X., ShafieiBavani, E., Jimeno Yepes, A.: Image-based table recognition:", "bbox": {"l": 150.90846, "t": 273.09882000000005, "r": 480.59094, "b": 281.16855000000004, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Data, model, and evaluation. In: Vedaldi, A., Bischof, H., Brox, T., Frahm, J.M.", "bbox": {"l": 151.51796, "t": 284.05777, "r": 480.58832000000007, "b": 292.12753, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "(eds.) Computer Vision - ECCV 2020. pp. 564-580. Springer International Pub-", "bbox": {"l": 151.51796, "t": 295.01675, "r": 480.59558, "b": 303.08651999999995, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "lishing, Cham (2020)", "bbox": {"l": 151.51796, "t": 305.97574, "r": 236.02359, "b": 314.0455, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "list_item", "bbox": {"l": 134.76495, "t": 316.93472, "r": 480.59454, "b": 346.92148, "coord_origin": "TOPLEFT"}, "confidence": 0.9668972492218018, "cells": [{"id": 31, "text": "23.", "bbox": {"l": 134.76495, "t": 316.93472, "r": 145.69547, "b": 325.00449000000003, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Zhong, X., Tang, J., Yepes, A.J.: Publaynet: largest dataset ever for document lay-", "bbox": {"l": 149.97276, "t": 316.93472, "r": 480.59454, "b": 325.00449000000003, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "out analysis. In: 2019 International Conference on Document Analysis and Recog-", "bbox": {"l": 151.51796, "t": 327.8927299999999, "r": 480.59387000000004, "b": 335.96249, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "nition (ICDAR). pp. 1015-1022. IEEE (2019)", "bbox": {"l": 151.51796, "t": 338.85172, "r": 335.13635, "b": 346.92148, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_header", "id": 7, "page_no": 13, "cluster": {"id": 7, "label": "page_header", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 143.97887, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.7012730240821838, "cells": [{"id": 0, "text": "14", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 143.97887, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "14"}, {"label": "page_header", "id": 6, "page_no": 13, "cluster": {"id": 6, "label": "page_header", "bbox": {"l": 167.82053, "t": 93.77099999999996, "r": 231.72049000000004, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.7889755368232727, "cells": [{"id": 1, "text": "M.", "bbox": {"l": 167.82053, "t": 93.77099999999996, "r": 178.08249, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37929, "t": 93.77099999999996, "r": 231.72049000000004, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "M. Lysak, et al."}, {"label": "list_item", "id": 5, "page_no": 13, "cluster": {"id": 5, "label": "list_item", "bbox": {"l": 134.765, "t": 119.67400999999995, "r": 480.59113, "b": 149.66168000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9444758892059326, "cells": [{"id": 3, "text": "18.", "bbox": {"l": 134.765, "t": 119.67400999999995, "r": 146.07936, "b": 127.74370999999985, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Xue, W., Yu, B., Wang, W., Tao, D., Li, Q.: Tgrnet: A table graph reconstruc-", "bbox": {"l": 150.5069, "t": 119.67400999999995, "r": 480.5892, "b": 127.74370999999985, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "tion network for table structure recognition. In: Proceedings of the IEEE/CVF", "bbox": {"l": 151.51801, "t": 130.63300000000004, "r": 480.59113, "b": 138.70270000000005, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "International Conference on Computer Vision. pp. 1295-1304 (2021)", "bbox": {"l": 151.51801, "t": 141.59198000000004, "r": 427.53329, "b": 149.66168000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "18. Xue, W., Yu, B., Wang, W., Tao, D., Li, Q.: Tgrnet: A table graph reconstruction network for table structure recognition. In: Proceedings of the IEEE/CVF International Conference on Computer Vision. pp. 1295-1304 (2021)"}, {"label": "list_item", "id": 3, "page_no": 13, "cluster": {"id": 3, "label": "list_item", "bbox": {"l": 134.765, "t": 152.55096000000003, "r": 480.59469999999993, "b": 193.54247999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9540891051292419, "cells": [{"id": 7, "text": "19.", "bbox": {"l": 134.765, "t": 152.55096000000003, "r": 146.19109, "b": 160.62067000000002, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Ye, J., Qi, X., He, Y., Chen, Y., Gu, D., Gao, P., Xiao, R.: Pingan-vcgroup\u2019s", "bbox": {"l": 150.66234, "t": 152.55096000000003, "r": 480.5936899999999, "b": 160.62067000000002, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "solution for icdar 2021 competition on scientific literature parsing task b: Ta-", "bbox": {"l": 151.51801, "t": 163.50995, "r": 480.59469999999993, "b": 171.57965000000002, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "ble recognition to html (2021).", "bbox": {"l": 151.51801, "t": 174.46893, "r": 280.64047, "b": 182.53864, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "https://doi.org/10.48550/ARXIV.2105.01848", "bbox": {"l": 285.078, "t": 175.11450000000002, "r": 478.03403000000003, "b": 182.58349999999996, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": ",", "bbox": {"l": 478.0319799999999, "t": 174.46893, "r": 480.59099999999995, "b": 182.53864, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "https://arxiv.org/abs/2105.01848", "bbox": {"l": 151.51797, "t": 186.07349, "r": 302.11584, "b": 193.54247999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "19. Ye, J., Qi, X., He, Y., Chen, Y., Gu, D., Gao, P., Xiao, R.: Pingan-vcgroup\u2019s solution for icdar 2021 competition on scientific literature parsing task b: Table recognition to html (2021). https://doi.org/10.48550/ARXIV.2105.01848 , https://arxiv.org/abs/2105.01848"}, {"label": "list_item", "id": 4, "page_no": 13, "cluster": {"id": 4, "label": "list_item", "bbox": {"l": 134.76497, "t": 196.38689999999997, "r": 480.5935400000001, "b": 215.41461000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9531471729278564, "cells": [{"id": 14, "text": "20.", "bbox": {"l": 134.76497, "t": 196.38689999999997, "r": 145.65964, "b": 204.45659999999998, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Zhang, Z., Zhang, J., Du, J., Wang, F.: Split, embed and merge: An accurate table", "bbox": {"l": 149.92294, "t": 196.38689999999997, "r": 480.5935400000001, "b": 204.45659999999998, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "structure recognizer. Pattern Recognition", "bbox": {"l": 151.51797, "t": 207.34491000000003, "r": 318.55124, "b": 215.41461000000004, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "126", "bbox": {"l": 321.62097, "t": 207.2821, "r": 337.53186, "b": 215.20844, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": ", 108565 (2022)", "bbox": {"l": 337.53296, "t": 207.34491000000003, "r": 399.46927, "b": 215.41461000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "20. Zhang, Z., Zhang, J., Du, J., Wang, F.: Split, embed and merge: An accurate table structure recognizer. Pattern Recognition 126 , 108565 (2022)"}, {"label": "list_item", "id": 0, "page_no": 13, "cluster": {"id": 0, "label": "list_item", "bbox": {"l": 134.76495, "t": 218.30389000000002, "r": 480.59305000000006, "b": 270.25438999999994, "coord_origin": "TOPLEFT"}, "confidence": 0.9720271825790405, "cells": [{"id": 19, "text": "21.", "bbox": {"l": 134.76495, "t": 218.30389000000002, "r": 145.7213, "b": 226.3736, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Zheng, X., Burdick, D., Popa, L., Zhong, X., Wang, N.X.R.: Global table extractor", "bbox": {"l": 150.00871, "t": 218.30389000000002, "r": 480.59012, "b": 226.3736, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "(gte): A framework for joint table identification and cell structure recognition using", "bbox": {"l": 151.51796, "t": 229.26288, "r": 480.59102999999993, "b": 237.33258, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "visual context. In: 2021 IEEE Winter Conference on Applications of Computer Vi-", "bbox": {"l": 151.51796, "t": 240.22186, "r": 480.59119, "b": 248.29156, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "sion (WACV). pp. 697-706 (2021).", "bbox": {"l": 151.51796, "t": 251.18084999999996, "r": 293.44086, "b": 259.25055, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "https://doi.org/10.1109/WACV48630.2021.", "bbox": {"l": 297.04996, "t": 251.82641999999998, "r": 480.59305000000006, "b": 259.29540999999995, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "00074", "bbox": {"l": 151.51796, "t": 262.7854, "r": 175.05028, "b": 270.25438999999994, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "21. Zheng, X., Burdick, D., Popa, L., Zhong, X., Wang, N.X.R.: Global table extractor (gte): A framework for joint table identification and cell structure recognition using visual context. In: 2021 IEEE Winter Conference on Applications of Computer Vision (WACV). pp. 697-706 (2021). https://doi.org/10.1109/WACV48630.2021. 00074"}, {"label": "list_item", "id": 1, "page_no": 13, "cluster": {"id": 1, "label": "list_item", "bbox": {"l": 134.76495, "t": 273.09882000000005, "r": 480.59558, "b": 314.0455, "coord_origin": "TOPLEFT"}, "confidence": 0.9685125946998596, "cells": [{"id": 26, "text": "22.", "bbox": {"l": 134.76495, "t": 273.09882000000005, "r": 146.36798, "b": 281.16855000000004, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Zhong, X., ShafieiBavani, E., Jimeno Yepes, A.: Image-based table recognition:", "bbox": {"l": 150.90846, "t": 273.09882000000005, "r": 480.59094, "b": 281.16855000000004, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Data, model, and evaluation. In: Vedaldi, A., Bischof, H., Brox, T., Frahm, J.M.", "bbox": {"l": 151.51796, "t": 284.05777, "r": 480.58832000000007, "b": 292.12753, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "(eds.) Computer Vision - ECCV 2020. pp. 564-580. Springer International Pub-", "bbox": {"l": 151.51796, "t": 295.01675, "r": 480.59558, "b": 303.08651999999995, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "lishing, Cham (2020)", "bbox": {"l": 151.51796, "t": 305.97574, "r": 236.02359, "b": 314.0455, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "22. Zhong, X., ShafieiBavani, E., Jimeno Yepes, A.: Image-based table recognition: Data, model, and evaluation. In: Vedaldi, A., Bischof, H., Brox, T., Frahm, J.M. (eds.) Computer Vision - ECCV 2020. pp. 564-580. Springer International Publishing, Cham (2020)"}, {"label": "list_item", "id": 2, "page_no": 13, "cluster": {"id": 2, "label": "list_item", "bbox": {"l": 134.76495, "t": 316.93472, "r": 480.59454, "b": 346.92148, "coord_origin": "TOPLEFT"}, "confidence": 0.9668972492218018, "cells": [{"id": 31, "text": "23.", "bbox": {"l": 134.76495, "t": 316.93472, "r": 145.69547, "b": 325.00449000000003, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Zhong, X., Tang, J., Yepes, A.J.: Publaynet: largest dataset ever for document lay-", "bbox": {"l": 149.97276, "t": 316.93472, "r": 480.59454, "b": 325.00449000000003, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "out analysis. In: 2019 International Conference on Document Analysis and Recog-", "bbox": {"l": 151.51796, "t": 327.8927299999999, "r": 480.59387000000004, "b": 335.96249, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "nition (ICDAR). pp. 1015-1022. IEEE (2019)", "bbox": {"l": 151.51796, "t": 338.85172, "r": 335.13635, "b": 346.92148, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "23. Zhong, X., Tang, J., Yepes, A.J.: Publaynet: largest dataset ever for document layout analysis. In: 2019 International Conference on Document Analysis and Recognition (ICDAR). pp. 1015-1022. IEEE (2019)"}], "body": [{"label": "list_item", "id": 5, "page_no": 13, "cluster": {"id": 5, "label": "list_item", "bbox": {"l": 134.765, "t": 119.67400999999995, "r": 480.59113, "b": 149.66168000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9444758892059326, "cells": [{"id": 3, "text": "18.", "bbox": {"l": 134.765, "t": 119.67400999999995, "r": 146.07936, "b": 127.74370999999985, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Xue, W., Yu, B., Wang, W., Tao, D., Li, Q.: Tgrnet: A table graph reconstruc-", "bbox": {"l": 150.5069, "t": 119.67400999999995, "r": 480.5892, "b": 127.74370999999985, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "tion network for table structure recognition. In: Proceedings of the IEEE/CVF", "bbox": {"l": 151.51801, "t": 130.63300000000004, "r": 480.59113, "b": 138.70270000000005, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "International Conference on Computer Vision. pp. 1295-1304 (2021)", "bbox": {"l": 151.51801, "t": 141.59198000000004, "r": 427.53329, "b": 149.66168000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "18. Xue, W., Yu, B., Wang, W., Tao, D., Li, Q.: Tgrnet: A table graph reconstruction network for table structure recognition. In: Proceedings of the IEEE/CVF International Conference on Computer Vision. pp. 1295-1304 (2021)"}, {"label": "list_item", "id": 3, "page_no": 13, "cluster": {"id": 3, "label": "list_item", "bbox": {"l": 134.765, "t": 152.55096000000003, "r": 480.59469999999993, "b": 193.54247999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9540891051292419, "cells": [{"id": 7, "text": "19.", "bbox": {"l": 134.765, "t": 152.55096000000003, "r": 146.19109, "b": 160.62067000000002, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Ye, J., Qi, X., He, Y., Chen, Y., Gu, D., Gao, P., Xiao, R.: Pingan-vcgroup\u2019s", "bbox": {"l": 150.66234, "t": 152.55096000000003, "r": 480.5936899999999, "b": 160.62067000000002, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "solution for icdar 2021 competition on scientific literature parsing task b: Ta-", "bbox": {"l": 151.51801, "t": 163.50995, "r": 480.59469999999993, "b": 171.57965000000002, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "ble recognition to html (2021).", "bbox": {"l": 151.51801, "t": 174.46893, "r": 280.64047, "b": 182.53864, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "https://doi.org/10.48550/ARXIV.2105.01848", "bbox": {"l": 285.078, "t": 175.11450000000002, "r": 478.03403000000003, "b": 182.58349999999996, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": ",", "bbox": {"l": 478.0319799999999, "t": 174.46893, "r": 480.59099999999995, "b": 182.53864, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "https://arxiv.org/abs/2105.01848", "bbox": {"l": 151.51797, "t": 186.07349, "r": 302.11584, "b": 193.54247999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "19. Ye, J., Qi, X., He, Y., Chen, Y., Gu, D., Gao, P., Xiao, R.: Pingan-vcgroup\u2019s solution for icdar 2021 competition on scientific literature parsing task b: Table recognition to html (2021). https://doi.org/10.48550/ARXIV.2105.01848 , https://arxiv.org/abs/2105.01848"}, {"label": "list_item", "id": 4, "page_no": 13, "cluster": {"id": 4, "label": "list_item", "bbox": {"l": 134.76497, "t": 196.38689999999997, "r": 480.5935400000001, "b": 215.41461000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9531471729278564, "cells": [{"id": 14, "text": "20.", "bbox": {"l": 134.76497, "t": 196.38689999999997, "r": 145.65964, "b": 204.45659999999998, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Zhang, Z., Zhang, J., Du, J., Wang, F.: Split, embed and merge: An accurate table", "bbox": {"l": 149.92294, "t": 196.38689999999997, "r": 480.5935400000001, "b": 204.45659999999998, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "structure recognizer. Pattern Recognition", "bbox": {"l": 151.51797, "t": 207.34491000000003, "r": 318.55124, "b": 215.41461000000004, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "126", "bbox": {"l": 321.62097, "t": 207.2821, "r": 337.53186, "b": 215.20844, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": ", 108565 (2022)", "bbox": {"l": 337.53296, "t": 207.34491000000003, "r": 399.46927, "b": 215.41461000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "20. Zhang, Z., Zhang, J., Du, J., Wang, F.: Split, embed and merge: An accurate table structure recognizer. Pattern Recognition 126 , 108565 (2022)"}, {"label": "list_item", "id": 0, "page_no": 13, "cluster": {"id": 0, "label": "list_item", "bbox": {"l": 134.76495, "t": 218.30389000000002, "r": 480.59305000000006, "b": 270.25438999999994, "coord_origin": "TOPLEFT"}, "confidence": 0.9720271825790405, "cells": [{"id": 19, "text": "21.", "bbox": {"l": 134.76495, "t": 218.30389000000002, "r": 145.7213, "b": 226.3736, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Zheng, X., Burdick, D., Popa, L., Zhong, X., Wang, N.X.R.: Global table extractor", "bbox": {"l": 150.00871, "t": 218.30389000000002, "r": 480.59012, "b": 226.3736, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "(gte): A framework for joint table identification and cell structure recognition using", "bbox": {"l": 151.51796, "t": 229.26288, "r": 480.59102999999993, "b": 237.33258, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "visual context. In: 2021 IEEE Winter Conference on Applications of Computer Vi-", "bbox": {"l": 151.51796, "t": 240.22186, "r": 480.59119, "b": 248.29156, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "sion (WACV). pp. 697-706 (2021).", "bbox": {"l": 151.51796, "t": 251.18084999999996, "r": 293.44086, "b": 259.25055, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "https://doi.org/10.1109/WACV48630.2021.", "bbox": {"l": 297.04996, "t": 251.82641999999998, "r": 480.59305000000006, "b": 259.29540999999995, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "00074", "bbox": {"l": 151.51796, "t": 262.7854, "r": 175.05028, "b": 270.25438999999994, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "21. Zheng, X., Burdick, D., Popa, L., Zhong, X., Wang, N.X.R.: Global table extractor (gte): A framework for joint table identification and cell structure recognition using visual context. In: 2021 IEEE Winter Conference on Applications of Computer Vision (WACV). pp. 697-706 (2021). https://doi.org/10.1109/WACV48630.2021. 00074"}, {"label": "list_item", "id": 1, "page_no": 13, "cluster": {"id": 1, "label": "list_item", "bbox": {"l": 134.76495, "t": 273.09882000000005, "r": 480.59558, "b": 314.0455, "coord_origin": "TOPLEFT"}, "confidence": 0.9685125946998596, "cells": [{"id": 26, "text": "22.", "bbox": {"l": 134.76495, "t": 273.09882000000005, "r": 146.36798, "b": 281.16855000000004, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Zhong, X., ShafieiBavani, E., Jimeno Yepes, A.: Image-based table recognition:", "bbox": {"l": 150.90846, "t": 273.09882000000005, "r": 480.59094, "b": 281.16855000000004, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Data, model, and evaluation. In: Vedaldi, A., Bischof, H., Brox, T., Frahm, J.M.", "bbox": {"l": 151.51796, "t": 284.05777, "r": 480.58832000000007, "b": 292.12753, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "(eds.) Computer Vision - ECCV 2020. pp. 564-580. Springer International Pub-", "bbox": {"l": 151.51796, "t": 295.01675, "r": 480.59558, "b": 303.08651999999995, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "lishing, Cham (2020)", "bbox": {"l": 151.51796, "t": 305.97574, "r": 236.02359, "b": 314.0455, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "22. Zhong, X., ShafieiBavani, E., Jimeno Yepes, A.: Image-based table recognition: Data, model, and evaluation. In: Vedaldi, A., Bischof, H., Brox, T., Frahm, J.M. (eds.) Computer Vision - ECCV 2020. pp. 564-580. Springer International Publishing, Cham (2020)"}, {"label": "list_item", "id": 2, "page_no": 13, "cluster": {"id": 2, "label": "list_item", "bbox": {"l": 134.76495, "t": 316.93472, "r": 480.59454, "b": 346.92148, "coord_origin": "TOPLEFT"}, "confidence": 0.9668972492218018, "cells": [{"id": 31, "text": "23.", "bbox": {"l": 134.76495, "t": 316.93472, "r": 145.69547, "b": 325.00449000000003, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Zhong, X., Tang, J., Yepes, A.J.: Publaynet: largest dataset ever for document lay-", "bbox": {"l": 149.97276, "t": 316.93472, "r": 480.59454, "b": 325.00449000000003, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "out analysis. In: 2019 International Conference on Document Analysis and Recog-", "bbox": {"l": 151.51796, "t": 327.8927299999999, "r": 480.59387000000004, "b": 335.96249, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "nition (ICDAR). pp. 1015-1022. IEEE (2019)", "bbox": {"l": 151.51796, "t": 338.85172, "r": 335.13635, "b": 346.92148, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "23. Zhong, X., Tang, J., Yepes, A.J.: Publaynet: largest dataset ever for document layout analysis. In: 2019 International Conference on Document Analysis and Recognition (ICDAR). pp. 1015-1022. IEEE (2019)"}], "headers": [{"label": "page_header", "id": 7, "page_no": 13, "cluster": {"id": 7, "label": "page_header", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 143.97887, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.7012730240821838, "cells": [{"id": 0, "text": "14", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 143.97887, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "14"}, {"label": "page_header", "id": 6, "page_no": 13, "cluster": {"id": 6, "label": "page_header", "bbox": {"l": 167.82053, "t": 93.77099999999996, "r": 231.72049000000004, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.7889755368232727, "cells": [{"id": 1, "text": "M.", "bbox": {"l": 167.82053, "t": 93.77099999999996, "r": 178.08249, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37929, "t": 93.77099999999996, "r": 231.72049000000004, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "M. Lysak, et al."}]}}]
\ No newline at end of file
+[{"page_no": 0, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure", "bbox": {"l": 134.765, "t": 115.89910999999995, "r": 480.59735, "b": 128.58112000000006, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Recognition", "bbox": {"l": 266.67499, "t": 133.83209, "r": 348.68506, "b": 146.51409999999998, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Maksym Lysak", "bbox": {"l": 151.22598, "t": 171.67371000000003, "r": 217.04390999999998, "b": 180.47069999999997, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "[0000", "bbox": {"l": 217.04599, "t": 170.08209, "r": 235.18764, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "\u2212", "bbox": {"l": 235.18598999999998, "t": 169.69159000000002, "r": 241.4129, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "0002", "bbox": {"l": 241.41299000000004, "t": 170.08209, "r": 257.29932, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "\u2212", "bbox": {"l": 257.298, "t": 169.69159000000002, "r": 263.5249, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "3723", "bbox": {"l": 263.52499, "t": 170.08209, "r": 279.41132, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "\u2212", "bbox": {"l": 279.41, "t": 169.69159000000002, "r": 285.6369, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "$^{6960]}$, Ahmed Nassar[0000", "bbox": {"l": 285.63602, "t": 171.67371000000003, "r": 392.27664, "b": 180.47069999999997, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "\u2212", "bbox": {"l": 392.27502, "t": 169.69159000000002, "r": 398.50192, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "0002", "bbox": {"l": 398.50201, "t": 170.08209, "r": 414.38834, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "\u2212", "bbox": {"l": 414.38702, "t": 169.69159000000002, "r": 420.61392, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "9468", "bbox": {"l": 420.61304, "t": 170.08209, "r": 436.49936, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "\u2212", "bbox": {"l": 436.49805000000003, "t": 169.69159000000002, "r": 442.72495000000004, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "$^{0822]}$,", "bbox": {"l": 442.72504, "t": 171.67371000000003, "r": 464.12963999999994, "b": 180.47069999999997, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Nikolaos Livathinos", "bbox": {"l": 139.34305, "t": 183.62872000000004, "r": 224.80720999999997, "b": 192.42571999999996, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "[0000", "bbox": {"l": 224.80704000000003, "t": 182.03814999999997, "r": 242.94868, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "\u2212", "bbox": {"l": 242.94704000000002, "t": 181.64764000000002, "r": 249.17394999999996, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "0001", "bbox": {"l": 249.17404000000002, "t": 182.03814999999997, "r": 265.06036, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "\u2212", "bbox": {"l": 265.05905, "t": 181.64764000000002, "r": 271.28595, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "8513", "bbox": {"l": 271.28506, "t": 182.03814999999997, "r": 287.17139, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "\u2212", "bbox": {"l": 287.17007, "t": 181.64764000000002, "r": 293.39697, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "$^{3491]}$, Christoph Auer[0000", "bbox": {"l": 293.39706, "t": 183.62872000000004, "r": 404.1597, "b": 192.42571999999996, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "\u2212", "bbox": {"l": 404.15808, "t": 181.64764000000002, "r": 410.38498, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "0001", "bbox": {"l": 410.38507, "t": 182.03814999999997, "r": 426.27139, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "\u2212", "bbox": {"l": 426.27008, "t": 181.64764000000002, "r": 432.49697999999995, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "5761", "bbox": {"l": 432.49609, "t": 182.03814999999997, "r": 448.3824200000001, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "\u2212", "bbox": {"l": 448.3811, "t": 181.64764000000002, "r": 454.608, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "$^{0422]}$,", "bbox": {"l": 454.60808999999995, "t": 183.62872000000004, "r": 476.01270000000005, "b": 192.42571999999996, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "and Peter Staar", "bbox": {"l": 229.52109000000002, "t": 195.58374000000003, "r": 298.6087, "b": 204.38073999999995, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "[0000", "bbox": {"l": 298.60608, "t": 193.99316, "r": 316.74771, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "\u2212", "bbox": {"l": 316.74609, "t": 193.60266000000001, "r": 322.97299, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "0002", "bbox": {"l": 322.97308, "t": 193.99316, "r": 338.85941, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "\u2212", "bbox": {"l": 338.85809, "t": 193.60266000000001, "r": 345.08499, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "8088", "bbox": {"l": 345.08508, "t": 193.99316, "r": 360.97141, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "\u2212", "bbox": {"l": 360.97009, "t": 193.60266000000001, "r": 367.19699, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "0823]", "bbox": {"l": 367.19611, "t": 193.99316, "r": 385.33774, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "IBM Research", "bbox": {"l": 279.1051, "t": 217.20398, "r": 336.25153, "b": 225.27368, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "{mly,ahn,nli,cau,taa}@zurich.ibm.com", "bbox": {"l": 222.96609, "t": 228.80853000000002, "r": 392.38983, "b": 236.27752999999996, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "Abstract.", "bbox": {"l": 163.1111, "t": 270.30115, "r": 206.6358, "b": 278.22748, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Extracting tables from documents is a crucial task in any", "bbox": {"l": 211.6171, "t": 270.36395000000005, "r": 452.2447199999999, "b": 278.43364999999994, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "document conversion pipeline. Recently, transformer-based models have", "bbox": {"l": 163.1111, "t": 281.3229099999999, "r": 452.24246, "b": 289.39267, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "demonstrated that table-structure can be recognized with impressive ac-", "bbox": {"l": 163.1111, "t": 292.28189, "r": 452.24792, "b": 300.35165000000006, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "curacy using Image-to-Markup-Sequence (Im2Seq) approaches. Taking", "bbox": {"l": 163.1111, "t": 303.24088, "r": 452.2407799999999, "b": 311.31064, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "only the image of a table, such models predict a sequence of tokens (e.g.", "bbox": {"l": 163.1111, "t": 314.19888, "r": 452.24609, "b": 322.26865, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "in HTML, LaTeX) which represent the structure of the table. Since the", "bbox": {"l": 163.1111, "t": 325.15787, "r": 452.24615000000006, "b": 333.22763, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "token representation of the table structure has a significant impact on", "bbox": {"l": 163.1111, "t": 336.11685, "r": 452.24707, "b": 344.18661, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "the accuracy and run-time performance of any Im2Seq model, we inves-", "bbox": {"l": 163.1111, "t": 347.07584, "r": 452.2459999999999, "b": 355.1456, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "tigate in this paper how table-structure representation can be optimised.", "bbox": {"l": 163.1111, "t": 358.03482, "r": 452.2479900000001, "b": 366.10458, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "We propose a new, optimised table-structure language (OTSL) with a", "bbox": {"l": 163.1111, "t": 368.9938, "r": 452.24609, "b": 377.06357, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "minimized vocabulary and specific rules. The benefits of OTSL are that", "bbox": {"l": 163.1111, "t": 379.95279, "r": 452.2417, "b": 388.02255, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "it reduces the number of tokens to 5 (HTML needs 28+) and shortens", "bbox": {"l": 163.1111, "t": 390.91177, "r": 452.2443200000001, "b": 398.98154, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "the sequence length to half of HTML on average. Consequently, model", "bbox": {"l": 163.1111, "t": 401.87076, "r": 452.24878000000007, "b": 409.94052, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "accuracy improves significantly, inference time is halved compared to", "bbox": {"l": 163.1111, "t": 412.82974, "r": 452.24063000000007, "b": 420.8995100000001, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "HTML-based models, and the predicted table structures are always syn-", "bbox": {"l": 163.1111, "t": 423.78774999999996, "r": 452.24161, "b": 431.85751000000005, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "tactically correct. This in turn eliminates most post-processing needs.", "bbox": {"l": 163.1111, "t": 434.74673, "r": 452.24429, "b": 442.8165, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Popular table structure data-sets will be published in OTSL format to", "bbox": {"l": 163.1111, "t": 445.70572000000004, "r": 452.24603, "b": 453.77547999999996, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "the community.", "bbox": {"l": 163.1111, "t": 456.6647, "r": 225.56116, "b": 464.73447, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Keywords:", "bbox": {"l": 163.1111, "t": 478.69394, "r": 211.94211, "b": 486.62024, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Table Structure Recognition \u00b7 Data Representation \u00b7 Trans-", "bbox": {"l": 216.55208999999996, "t": 478.75671, "r": 452.24158, "b": 486.82648, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "formers \u00b7 Optimization.", "bbox": {"l": 163.11111, "t": 489.71573, "r": 257.64185, "b": 497.78549, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "1", "bbox": {"l": 134.76512, "t": 522.11969, "r": 141.48872, "b": 532.68808, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "Introduction", "bbox": {"l": 154.93832, "t": 522.11969, "r": 228.93384, "b": 532.68808, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "Tables are ubiquitous in documents such as scientific papers, patents, reports,", "bbox": {"l": 134.76512, "t": 548.2865400000001, "r": 480.5939, "b": 557.0835099999999, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "manuals, specification sheets or marketing material. They often encode highly", "bbox": {"l": 134.76512, "t": 560.24254, "r": 480.59180000000003, "b": 569.0395100000001, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "valuable information and therefore need to be extracted with high accuracy.", "bbox": {"l": 134.76512, "t": 572.19754, "r": 480.59283000000005, "b": 580.99451, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "Unfortunately, tables appear in documents in various sizes, styling and struc-", "bbox": {"l": 134.76512, "t": 584.15254, "r": 480.5959500000001, "b": 592.9495099999999, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "ture, making it difficult to recover their correct structure with simple analyt-", "bbox": {"l": 134.76512, "t": 596.10754, "r": 480.58688, "b": 604.90451, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "ical methods. Therefore, accurate table extraction is achieved these days with", "bbox": {"l": 134.76512, "t": 608.06255, "r": 480.59088, "b": 616.85951, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "machine-learning based methods.", "bbox": {"l": 134.76512, "t": 620.01755, "r": 279.32745, "b": 628.81451, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "In modern document understanding systems [1,15], table extraction is typi-", "bbox": {"l": 149.70811, "t": 632.14755, "r": 480.58899, "b": 640.94452, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "cally a two-step process. Firstly, every table on a page is located with a bounding", "bbox": {"l": 134.76512, "t": 644.1025500000001, "r": 480.59583, "b": 652.8995199999999, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "box, and secondly, their logical row and column structure is recognized. As of", "bbox": {"l": 134.76512, "t": 656.05756, "r": 480.59496999999993, "b": 664.85453, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "arXiv:2305.03393v1 [cs.CV] 5 May 2023", "bbox": {"l": 18.340218, "t": 209.47997999999995, "r": 36.339787, "b": 555.00003, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 5, "label": "section_header", "bbox": {"l": 134.765, "t": 115.89910999999995, "r": 480.59735, "b": 146.51409999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.8918349742889404, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure", "bbox": {"l": 134.765, "t": 115.89910999999995, "r": 480.59735, "b": 128.58112000000006, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Recognition", "bbox": {"l": 266.67499, "t": 133.83209, "r": 348.68506, "b": 146.51409999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "key_value_region", "bbox": {"l": 139.34305, "t": 169.69159000000002, "r": 476.01270000000005, "b": 236.27752999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.48445820808410645, "cells": [{"id": 2, "text": "Maksym Lysak", "bbox": {"l": 151.22598, "t": 171.67371000000003, "r": 217.04390999999998, "b": 180.47069999999997, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "[0000", "bbox": {"l": 217.04599, "t": 170.08209, "r": 235.18764, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "\u2212", "bbox": {"l": 235.18598999999998, "t": 169.69159000000002, "r": 241.4129, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "0002", "bbox": {"l": 241.41299000000004, "t": 170.08209, "r": 257.29932, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "\u2212", "bbox": {"l": 257.298, "t": 169.69159000000002, "r": 263.5249, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "3723", "bbox": {"l": 263.52499, "t": 170.08209, "r": 279.41132, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "\u2212", "bbox": {"l": 279.41, "t": 169.69159000000002, "r": 285.6369, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "$^{6960]}$, Ahmed Nassar[0000", "bbox": {"l": 285.63602, "t": 171.67371000000003, "r": 392.27664, "b": 180.47069999999997, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "\u2212", "bbox": {"l": 392.27502, "t": 169.69159000000002, "r": 398.50192, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "0002", "bbox": {"l": 398.50201, "t": 170.08209, "r": 414.38834, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "\u2212", "bbox": {"l": 414.38702, "t": 169.69159000000002, "r": 420.61392, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "9468", "bbox": {"l": 420.61304, "t": 170.08209, "r": 436.49936, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "\u2212", "bbox": {"l": 436.49805000000003, "t": 169.69159000000002, "r": 442.72495000000004, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "$^{0822]}$,", "bbox": {"l": 442.72504, "t": 171.67371000000003, "r": 464.12963999999994, "b": 180.47069999999997, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Nikolaos Livathinos", "bbox": {"l": 139.34305, "t": 183.62872000000004, "r": 224.80720999999997, "b": 192.42571999999996, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "[0000", "bbox": {"l": 224.80704000000003, "t": 182.03814999999997, "r": 242.94868, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "\u2212", "bbox": {"l": 242.94704000000002, "t": 181.64764000000002, "r": 249.17394999999996, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "0001", "bbox": {"l": 249.17404000000002, "t": 182.03814999999997, "r": 265.06036, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "\u2212", "bbox": {"l": 265.05905, "t": 181.64764000000002, "r": 271.28595, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "8513", "bbox": {"l": 271.28506, "t": 182.03814999999997, "r": 287.17139, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "\u2212", "bbox": {"l": 287.17007, "t": 181.64764000000002, "r": 293.39697, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "$^{3491]}$, Christoph Auer[0000", "bbox": {"l": 293.39706, "t": 183.62872000000004, "r": 404.1597, "b": 192.42571999999996, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "\u2212", "bbox": {"l": 404.15808, "t": 181.64764000000002, "r": 410.38498, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "0001", "bbox": {"l": 410.38507, "t": 182.03814999999997, "r": 426.27139, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "\u2212", "bbox": {"l": 426.27008, "t": 181.64764000000002, "r": 432.49697999999995, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "5761", "bbox": {"l": 432.49609, "t": 182.03814999999997, "r": 448.3824200000001, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "\u2212", "bbox": {"l": 448.3811, "t": 181.64764000000002, "r": 454.608, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "$^{0422]}$,", "bbox": {"l": 454.60808999999995, "t": 183.62872000000004, "r": 476.01270000000005, "b": 192.42571999999996, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "and Peter Staar", "bbox": {"l": 229.52109000000002, "t": 195.58374000000003, "r": 298.6087, "b": 204.38073999999995, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "[0000", "bbox": {"l": 298.60608, "t": 193.99316, "r": 316.74771, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "\u2212", "bbox": {"l": 316.74609, "t": 193.60266000000001, "r": 322.97299, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "0002", "bbox": {"l": 322.97308, "t": 193.99316, "r": 338.85941, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "\u2212", "bbox": {"l": 338.85809, "t": 193.60266000000001, "r": 345.08499, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "8088", "bbox": {"l": 345.08508, "t": 193.99316, "r": 360.97141, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "\u2212", "bbox": {"l": 360.97009, "t": 193.60266000000001, "r": 367.19699, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "0823]", "bbox": {"l": 367.19611, "t": 193.99316, "r": 385.33774, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "IBM Research", "bbox": {"l": 279.1051, "t": 217.20398, "r": 336.25153, "b": 225.27368, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "{mly,ahn,nli,cau,taa}@zurich.ibm.com", "bbox": {"l": 222.96609, "t": 228.80853000000002, "r": 392.38983, "b": 236.27752999999996, "coord_origin": "TOPLEFT"}}], "children": [{"id": 7, "label": "text", "bbox": {"l": 139.34305, "t": 169.69159000000002, "r": 476.01270000000005, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.7918068766593933, "cells": [{"id": 2, "text": "Maksym Lysak", "bbox": {"l": 151.22598, "t": 171.67371000000003, "r": 217.04390999999998, "b": 180.47069999999997, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "[0000", "bbox": {"l": 217.04599, "t": 170.08209, "r": 235.18764, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "\u2212", "bbox": {"l": 235.18598999999998, "t": 169.69159000000002, "r": 241.4129, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "0002", "bbox": {"l": 241.41299000000004, "t": 170.08209, "r": 257.29932, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "\u2212", "bbox": {"l": 257.298, "t": 169.69159000000002, "r": 263.5249, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "3723", "bbox": {"l": 263.52499, "t": 170.08209, "r": 279.41132, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "\u2212", "bbox": {"l": 279.41, "t": 169.69159000000002, "r": 285.6369, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "$^{6960]}$, Ahmed Nassar[0000", "bbox": {"l": 285.63602, "t": 171.67371000000003, "r": 392.27664, "b": 180.47069999999997, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "\u2212", "bbox": {"l": 392.27502, "t": 169.69159000000002, "r": 398.50192, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "0002", "bbox": {"l": 398.50201, "t": 170.08209, "r": 414.38834, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "\u2212", "bbox": {"l": 414.38702, "t": 169.69159000000002, "r": 420.61392, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "9468", "bbox": {"l": 420.61304, "t": 170.08209, "r": 436.49936, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "\u2212", "bbox": {"l": 436.49805000000003, "t": 169.69159000000002, "r": 442.72495000000004, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "$^{0822]}$,", "bbox": {"l": 442.72504, "t": 171.67371000000003, "r": 464.12963999999994, "b": 180.47069999999997, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Nikolaos Livathinos", "bbox": {"l": 139.34305, "t": 183.62872000000004, "r": 224.80720999999997, "b": 192.42571999999996, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "[0000", "bbox": {"l": 224.80704000000003, "t": 182.03814999999997, "r": 242.94868, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "\u2212", "bbox": {"l": 242.94704000000002, "t": 181.64764000000002, "r": 249.17394999999996, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "0001", "bbox": {"l": 249.17404000000002, "t": 182.03814999999997, "r": 265.06036, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "\u2212", "bbox": {"l": 265.05905, "t": 181.64764000000002, "r": 271.28595, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "8513", "bbox": {"l": 271.28506, "t": 182.03814999999997, "r": 287.17139, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "\u2212", "bbox": {"l": 287.17007, "t": 181.64764000000002, "r": 293.39697, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "$^{3491]}$, Christoph Auer[0000", "bbox": {"l": 293.39706, "t": 183.62872000000004, "r": 404.1597, "b": 192.42571999999996, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "\u2212", "bbox": {"l": 404.15808, "t": 181.64764000000002, "r": 410.38498, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "0001", "bbox": {"l": 410.38507, "t": 182.03814999999997, "r": 426.27139, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "\u2212", "bbox": {"l": 426.27008, "t": 181.64764000000002, "r": 432.49697999999995, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "5761", "bbox": {"l": 432.49609, "t": 182.03814999999997, "r": 448.3824200000001, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "\u2212", "bbox": {"l": 448.3811, "t": 181.64764000000002, "r": 454.608, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "$^{0422]}$,", "bbox": {"l": 454.60808999999995, "t": 183.62872000000004, "r": 476.01270000000005, "b": 192.42571999999996, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "[0000", "bbox": {"l": 298.60608, "t": 193.99316, "r": 316.74771, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "\u2212", "bbox": {"l": 316.74609, "t": 193.60266000000001, "r": 322.97299, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "0002", "bbox": {"l": 322.97308, "t": 193.99316, "r": 338.85941, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "\u2212", "bbox": {"l": 338.85809, "t": 193.60266000000001, "r": 345.08499, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "8088", "bbox": {"l": 345.08508, "t": 193.99316, "r": 360.97141, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "\u2212", "bbox": {"l": 360.97009, "t": 193.60266000000001, "r": 367.19699, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "0823]", "bbox": {"l": 367.19611, "t": 193.99316, "r": 385.33774, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 229.52109000000002, "t": 195.58374000000003, "r": 298.6087, "b": 204.38073999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.5015263557434082, "cells": [{"id": 30, "text": "and Peter Staar", "bbox": {"l": 229.52109000000002, "t": 195.58374000000003, "r": 298.6087, "b": 204.38073999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 279.1051, "t": 217.20398, "r": 336.25153, "b": 225.27368, "coord_origin": "TOPLEFT"}, "confidence": 0.6310867667198181, "cells": [{"id": 38, "text": "IBM Research", "bbox": {"l": 279.1051, "t": 217.20398, "r": 336.25153, "b": 225.27368, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "text", "bbox": {"l": 222.96609, "t": 228.80853000000002, "r": 392.38983, "b": 236.27752999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.6924149990081787, "cells": [{"id": 39, "text": "{mly,ahn,nli,cau,taa}@zurich.ibm.com", "bbox": {"l": 222.96609, "t": 228.80853000000002, "r": 392.38983, "b": 236.27752999999996, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 1, "label": "text", "bbox": {"l": 163.1111, "t": 270.30115, "r": 452.24878000000007, "b": 464.73447, "coord_origin": "TOPLEFT"}, "confidence": 0.9807654023170471, "cells": [{"id": 40, "text": "Abstract.", "bbox": {"l": 163.1111, "t": 270.30115, "r": 206.6358, "b": 278.22748, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Extracting tables from documents is a crucial task in any", "bbox": {"l": 211.6171, "t": 270.36395000000005, "r": 452.2447199999999, "b": 278.43364999999994, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "document conversion pipeline. Recently, transformer-based models have", "bbox": {"l": 163.1111, "t": 281.3229099999999, "r": 452.24246, "b": 289.39267, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "demonstrated that table-structure can be recognized with impressive ac-", "bbox": {"l": 163.1111, "t": 292.28189, "r": 452.24792, "b": 300.35165000000006, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "curacy using Image-to-Markup-Sequence (Im2Seq) approaches. Taking", "bbox": {"l": 163.1111, "t": 303.24088, "r": 452.2407799999999, "b": 311.31064, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "only the image of a table, such models predict a sequence of tokens (e.g.", "bbox": {"l": 163.1111, "t": 314.19888, "r": 452.24609, "b": 322.26865, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "in HTML, LaTeX) which represent the structure of the table. Since the", "bbox": {"l": 163.1111, "t": 325.15787, "r": 452.24615000000006, "b": 333.22763, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "token representation of the table structure has a significant impact on", "bbox": {"l": 163.1111, "t": 336.11685, "r": 452.24707, "b": 344.18661, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "the accuracy and run-time performance of any Im2Seq model, we inves-", "bbox": {"l": 163.1111, "t": 347.07584, "r": 452.2459999999999, "b": 355.1456, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "tigate in this paper how table-structure representation can be optimised.", "bbox": {"l": 163.1111, "t": 358.03482, "r": 452.2479900000001, "b": 366.10458, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "We propose a new, optimised table-structure language (OTSL) with a", "bbox": {"l": 163.1111, "t": 368.9938, "r": 452.24609, "b": 377.06357, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "minimized vocabulary and specific rules. The benefits of OTSL are that", "bbox": {"l": 163.1111, "t": 379.95279, "r": 452.2417, "b": 388.02255, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "it reduces the number of tokens to 5 (HTML needs 28+) and shortens", "bbox": {"l": 163.1111, "t": 390.91177, "r": 452.2443200000001, "b": 398.98154, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "the sequence length to half of HTML on average. Consequently, model", "bbox": {"l": 163.1111, "t": 401.87076, "r": 452.24878000000007, "b": 409.94052, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "accuracy improves significantly, inference time is halved compared to", "bbox": {"l": 163.1111, "t": 412.82974, "r": 452.24063000000007, "b": 420.8995100000001, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "HTML-based models, and the predicted table structures are always syn-", "bbox": {"l": 163.1111, "t": 423.78774999999996, "r": 452.24161, "b": 431.85751000000005, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "tactically correct. This in turn eliminates most post-processing needs.", "bbox": {"l": 163.1111, "t": 434.74673, "r": 452.24429, "b": 442.8165, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Popular table structure data-sets will be published in OTSL format to", "bbox": {"l": 163.1111, "t": 445.70572000000004, "r": 452.24603, "b": 453.77547999999996, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "the community.", "bbox": {"l": 163.1111, "t": 456.6647, "r": 225.56116, "b": 464.73447, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "text", "bbox": {"l": 163.1111, "t": 478.69394, "r": 452.24158, "b": 497.78549, "coord_origin": "TOPLEFT"}, "confidence": 0.9304055571556091, "cells": [{"id": 59, "text": "Keywords:", "bbox": {"l": 163.1111, "t": 478.69394, "r": 211.94211, "b": 486.62024, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Table Structure Recognition \u00b7 Data Representation \u00b7 Trans-", "bbox": {"l": 216.55208999999996, "t": 478.75671, "r": 452.24158, "b": 486.82648, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "formers \u00b7 Optimization.", "bbox": {"l": 163.11111, "t": 489.71573, "r": 257.64185, "b": 497.78549, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "section_header", "bbox": {"l": 134.76512, "t": 522.11969, "r": 228.93384, "b": 532.68808, "coord_origin": "TOPLEFT"}, "confidence": 0.9392016530036926, "cells": [{"id": 62, "text": "1", "bbox": {"l": 134.76512, "t": 522.11969, "r": 141.48872, "b": 532.68808, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "Introduction", "bbox": {"l": 154.93832, "t": 522.11969, "r": 228.93384, "b": 532.68808, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 134.76512, "t": 548.2865400000001, "r": 480.5959500000001, "b": 628.81451, "coord_origin": "TOPLEFT"}, "confidence": 0.9835679531097412, "cells": [{"id": 64, "text": "Tables are ubiquitous in documents such as scientific papers, patents, reports,", "bbox": {"l": 134.76512, "t": 548.2865400000001, "r": 480.5939, "b": 557.0835099999999, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "manuals, specification sheets or marketing material. They often encode highly", "bbox": {"l": 134.76512, "t": 560.24254, "r": 480.59180000000003, "b": 569.0395100000001, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "valuable information and therefore need to be extracted with high accuracy.", "bbox": {"l": 134.76512, "t": 572.19754, "r": 480.59283000000005, "b": 580.99451, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "Unfortunately, tables appear in documents in various sizes, styling and struc-", "bbox": {"l": 134.76512, "t": 584.15254, "r": 480.5959500000001, "b": 592.9495099999999, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "ture, making it difficult to recover their correct structure with simple analyt-", "bbox": {"l": 134.76512, "t": 596.10754, "r": 480.58688, "b": 604.90451, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "ical methods. Therefore, accurate table extraction is achieved these days with", "bbox": {"l": 134.76512, "t": 608.06255, "r": 480.59088, "b": 616.85951, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "machine-learning based methods.", "bbox": {"l": 134.76512, "t": 620.01755, "r": 279.32745, "b": 628.81451, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 134.76512, "t": 632.14755, "r": 480.59583, "b": 664.85453, "coord_origin": "TOPLEFT"}, "confidence": 0.9696458578109741, "cells": [{"id": 71, "text": "In modern document understanding systems [1,15], table extraction is typi-", "bbox": {"l": 149.70811, "t": 632.14755, "r": 480.58899, "b": 640.94452, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "cally a two-step process. Firstly, every table on a page is located with a bounding", "bbox": {"l": 134.76512, "t": 644.1025500000001, "r": 480.59583, "b": 652.8995199999999, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "box, and secondly, their logical row and column structure is recognized. As of", "bbox": {"l": 134.76512, "t": 656.05756, "r": 480.59496999999993, "b": 664.85453, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "page_header", "bbox": {"l": 18.340218, "t": 209.47997999999995, "r": 36.339787, "b": 555.00003, "coord_origin": "TOPLEFT"}, "confidence": 0.8899643421173096, "cells": [{"id": 74, "text": "arXiv:2305.03393v1 [cs.CV] 5 May 2023", "bbox": {"l": 18.340218, "t": 209.47997999999995, "r": 36.339787, "b": 555.00003, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "section_header", "id": 5, "page_no": 0, "cluster": {"id": 5, "label": "section_header", "bbox": {"l": 134.765, "t": 115.89910999999995, "r": 480.59735, "b": 146.51409999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.8918349742889404, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure", "bbox": {"l": 134.765, "t": 115.89910999999995, "r": 480.59735, "b": 128.58112000000006, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Recognition", "bbox": {"l": 266.67499, "t": 133.83209, "r": 348.68506, "b": 146.51409999999998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Optimized Table Tokenization for Table Structure Recognition"}, {"label": "key_value_region", "id": 16, "page_no": 0, "cluster": {"id": 16, "label": "key_value_region", "bbox": {"l": 139.34305, "t": 169.69159000000002, "r": 476.01270000000005, "b": 236.27752999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.48445820808410645, "cells": [{"id": 2, "text": "Maksym Lysak", "bbox": {"l": 151.22598, "t": 171.67371000000003, "r": 217.04390999999998, "b": 180.47069999999997, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "[0000", "bbox": {"l": 217.04599, "t": 170.08209, "r": 235.18764, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "\u2212", "bbox": {"l": 235.18598999999998, "t": 169.69159000000002, "r": 241.4129, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "0002", "bbox": {"l": 241.41299000000004, "t": 170.08209, "r": 257.29932, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "\u2212", "bbox": {"l": 257.298, "t": 169.69159000000002, "r": 263.5249, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "3723", "bbox": {"l": 263.52499, "t": 170.08209, "r": 279.41132, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "\u2212", "bbox": {"l": 279.41, "t": 169.69159000000002, "r": 285.6369, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "$^{6960]}$, Ahmed Nassar[0000", "bbox": {"l": 285.63602, "t": 171.67371000000003, "r": 392.27664, "b": 180.47069999999997, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "\u2212", "bbox": {"l": 392.27502, "t": 169.69159000000002, "r": 398.50192, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "0002", "bbox": {"l": 398.50201, "t": 170.08209, "r": 414.38834, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "\u2212", "bbox": {"l": 414.38702, "t": 169.69159000000002, "r": 420.61392, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "9468", "bbox": {"l": 420.61304, "t": 170.08209, "r": 436.49936, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "\u2212", "bbox": {"l": 436.49805000000003, "t": 169.69159000000002, "r": 442.72495000000004, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "$^{0822]}$,", "bbox": {"l": 442.72504, "t": 171.67371000000003, "r": 464.12963999999994, "b": 180.47069999999997, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Nikolaos Livathinos", "bbox": {"l": 139.34305, "t": 183.62872000000004, "r": 224.80720999999997, "b": 192.42571999999996, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "[0000", "bbox": {"l": 224.80704000000003, "t": 182.03814999999997, "r": 242.94868, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "\u2212", "bbox": {"l": 242.94704000000002, "t": 181.64764000000002, "r": 249.17394999999996, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "0001", "bbox": {"l": 249.17404000000002, "t": 182.03814999999997, "r": 265.06036, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "\u2212", "bbox": {"l": 265.05905, "t": 181.64764000000002, "r": 271.28595, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "8513", "bbox": {"l": 271.28506, "t": 182.03814999999997, "r": 287.17139, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "\u2212", "bbox": {"l": 287.17007, "t": 181.64764000000002, "r": 293.39697, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "$^{3491]}$, Christoph Auer[0000", "bbox": {"l": 293.39706, "t": 183.62872000000004, "r": 404.1597, "b": 192.42571999999996, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "\u2212", "bbox": {"l": 404.15808, "t": 181.64764000000002, "r": 410.38498, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "0001", "bbox": {"l": 410.38507, "t": 182.03814999999997, "r": 426.27139, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "\u2212", "bbox": {"l": 426.27008, "t": 181.64764000000002, "r": 432.49697999999995, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "5761", "bbox": {"l": 432.49609, "t": 182.03814999999997, "r": 448.3824200000001, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "\u2212", "bbox": {"l": 448.3811, "t": 181.64764000000002, "r": 454.608, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "$^{0422]}$,", "bbox": {"l": 454.60808999999995, "t": 183.62872000000004, "r": 476.01270000000005, "b": 192.42571999999996, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "and Peter Staar", "bbox": {"l": 229.52109000000002, "t": 195.58374000000003, "r": 298.6087, "b": 204.38073999999995, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "[0000", "bbox": {"l": 298.60608, "t": 193.99316, "r": 316.74771, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "\u2212", "bbox": {"l": 316.74609, "t": 193.60266000000001, "r": 322.97299, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "0002", "bbox": {"l": 322.97308, "t": 193.99316, "r": 338.85941, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "\u2212", "bbox": {"l": 338.85809, "t": 193.60266000000001, "r": 345.08499, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "8088", "bbox": {"l": 345.08508, "t": 193.99316, "r": 360.97141, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "\u2212", "bbox": {"l": 360.97009, "t": 193.60266000000001, "r": 367.19699, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "0823]", "bbox": {"l": 367.19611, "t": 193.99316, "r": 385.33774, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "IBM Research", "bbox": {"l": 279.1051, "t": 217.20398, "r": 336.25153, "b": 225.27368, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "{mly,ahn,nli,cau,taa}@zurich.ibm.com", "bbox": {"l": 222.96609, "t": 228.80853000000002, "r": 392.38983, "b": 236.27752999999996, "coord_origin": "TOPLEFT"}}], "children": [{"id": 7, "label": "text", "bbox": {"l": 139.34305, "t": 169.69159000000002, "r": 476.01270000000005, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.7918068766593933, "cells": [{"id": 2, "text": "Maksym Lysak", "bbox": {"l": 151.22598, "t": 171.67371000000003, "r": 217.04390999999998, "b": 180.47069999999997, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "[0000", "bbox": {"l": 217.04599, "t": 170.08209, "r": 235.18764, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "\u2212", "bbox": {"l": 235.18598999999998, "t": 169.69159000000002, "r": 241.4129, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "0002", "bbox": {"l": 241.41299000000004, "t": 170.08209, "r": 257.29932, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "\u2212", "bbox": {"l": 257.298, "t": 169.69159000000002, "r": 263.5249, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "3723", "bbox": {"l": 263.52499, "t": 170.08209, "r": 279.41132, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "\u2212", "bbox": {"l": 279.41, "t": 169.69159000000002, "r": 285.6369, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "$^{6960]}$, Ahmed Nassar[0000", "bbox": {"l": 285.63602, "t": 171.67371000000003, "r": 392.27664, "b": 180.47069999999997, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "\u2212", "bbox": {"l": 392.27502, "t": 169.69159000000002, "r": 398.50192, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "0002", "bbox": {"l": 398.50201, "t": 170.08209, "r": 414.38834, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "\u2212", "bbox": {"l": 414.38702, "t": 169.69159000000002, "r": 420.61392, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "9468", "bbox": {"l": 420.61304, "t": 170.08209, "r": 436.49936, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "\u2212", "bbox": {"l": 436.49805000000003, "t": 169.69159000000002, "r": 442.72495000000004, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "$^{0822]}$,", "bbox": {"l": 442.72504, "t": 171.67371000000003, "r": 464.12963999999994, "b": 180.47069999999997, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Nikolaos Livathinos", "bbox": {"l": 139.34305, "t": 183.62872000000004, "r": 224.80720999999997, "b": 192.42571999999996, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "[0000", "bbox": {"l": 224.80704000000003, "t": 182.03814999999997, "r": 242.94868, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "\u2212", "bbox": {"l": 242.94704000000002, "t": 181.64764000000002, "r": 249.17394999999996, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "0001", "bbox": {"l": 249.17404000000002, "t": 182.03814999999997, "r": 265.06036, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "\u2212", "bbox": {"l": 265.05905, "t": 181.64764000000002, "r": 271.28595, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "8513", "bbox": {"l": 271.28506, "t": 182.03814999999997, "r": 287.17139, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "\u2212", "bbox": {"l": 287.17007, "t": 181.64764000000002, "r": 293.39697, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "$^{3491]}$, Christoph Auer[0000", "bbox": {"l": 293.39706, "t": 183.62872000000004, "r": 404.1597, "b": 192.42571999999996, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "\u2212", "bbox": {"l": 404.15808, "t": 181.64764000000002, "r": 410.38498, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "0001", "bbox": {"l": 410.38507, "t": 182.03814999999997, "r": 426.27139, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "\u2212", "bbox": {"l": 426.27008, "t": 181.64764000000002, "r": 432.49697999999995, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "5761", "bbox": {"l": 432.49609, "t": 182.03814999999997, "r": 448.3824200000001, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "\u2212", "bbox": {"l": 448.3811, "t": 181.64764000000002, "r": 454.608, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "$^{0422]}$,", "bbox": {"l": 454.60808999999995, "t": 183.62872000000004, "r": 476.01270000000005, "b": 192.42571999999996, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "[0000", "bbox": {"l": 298.60608, "t": 193.99316, "r": 316.74771, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "\u2212", "bbox": {"l": 316.74609, "t": 193.60266000000001, "r": 322.97299, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "0002", "bbox": {"l": 322.97308, "t": 193.99316, "r": 338.85941, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "\u2212", "bbox": {"l": 338.85809, "t": 193.60266000000001, "r": 345.08499, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "8088", "bbox": {"l": 345.08508, "t": 193.99316, "r": 360.97141, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "\u2212", "bbox": {"l": 360.97009, "t": 193.60266000000001, "r": 367.19699, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "0823]", "bbox": {"l": 367.19611, "t": 193.99316, "r": 385.33774, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 229.52109000000002, "t": 195.58374000000003, "r": 298.6087, "b": 204.38073999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.5015263557434082, "cells": [{"id": 30, "text": "and Peter Staar", "bbox": {"l": 229.52109000000002, "t": 195.58374000000003, "r": 298.6087, "b": 204.38073999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 279.1051, "t": 217.20398, "r": 336.25153, "b": 225.27368, "coord_origin": "TOPLEFT"}, "confidence": 0.6310867667198181, "cells": [{"id": 38, "text": "IBM Research", "bbox": {"l": 279.1051, "t": 217.20398, "r": 336.25153, "b": 225.27368, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "text", "bbox": {"l": 222.96609, "t": 228.80853000000002, "r": 392.38983, "b": 236.27752999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.6924149990081787, "cells": [{"id": 39, "text": "{mly,ahn,nli,cau,taa}@zurich.ibm.com", "bbox": {"l": 222.96609, "t": 228.80853000000002, "r": 392.38983, "b": 236.27752999999996, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null}, {"label": "text", "id": 1, "page_no": 0, "cluster": {"id": 1, "label": "text", "bbox": {"l": 163.1111, "t": 270.30115, "r": 452.24878000000007, "b": 464.73447, "coord_origin": "TOPLEFT"}, "confidence": 0.9807654023170471, "cells": [{"id": 40, "text": "Abstract.", "bbox": {"l": 163.1111, "t": 270.30115, "r": 206.6358, "b": 278.22748, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Extracting tables from documents is a crucial task in any", "bbox": {"l": 211.6171, "t": 270.36395000000005, "r": 452.2447199999999, "b": 278.43364999999994, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "document conversion pipeline. Recently, transformer-based models have", "bbox": {"l": 163.1111, "t": 281.3229099999999, "r": 452.24246, "b": 289.39267, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "demonstrated that table-structure can be recognized with impressive ac-", "bbox": {"l": 163.1111, "t": 292.28189, "r": 452.24792, "b": 300.35165000000006, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "curacy using Image-to-Markup-Sequence (Im2Seq) approaches. Taking", "bbox": {"l": 163.1111, "t": 303.24088, "r": 452.2407799999999, "b": 311.31064, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "only the image of a table, such models predict a sequence of tokens (e.g.", "bbox": {"l": 163.1111, "t": 314.19888, "r": 452.24609, "b": 322.26865, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "in HTML, LaTeX) which represent the structure of the table. Since the", "bbox": {"l": 163.1111, "t": 325.15787, "r": 452.24615000000006, "b": 333.22763, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "token representation of the table structure has a significant impact on", "bbox": {"l": 163.1111, "t": 336.11685, "r": 452.24707, "b": 344.18661, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "the accuracy and run-time performance of any Im2Seq model, we inves-", "bbox": {"l": 163.1111, "t": 347.07584, "r": 452.2459999999999, "b": 355.1456, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "tigate in this paper how table-structure representation can be optimised.", "bbox": {"l": 163.1111, "t": 358.03482, "r": 452.2479900000001, "b": 366.10458, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "We propose a new, optimised table-structure language (OTSL) with a", "bbox": {"l": 163.1111, "t": 368.9938, "r": 452.24609, "b": 377.06357, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "minimized vocabulary and specific rules. The benefits of OTSL are that", "bbox": {"l": 163.1111, "t": 379.95279, "r": 452.2417, "b": 388.02255, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "it reduces the number of tokens to 5 (HTML needs 28+) and shortens", "bbox": {"l": 163.1111, "t": 390.91177, "r": 452.2443200000001, "b": 398.98154, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "the sequence length to half of HTML on average. Consequently, model", "bbox": {"l": 163.1111, "t": 401.87076, "r": 452.24878000000007, "b": 409.94052, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "accuracy improves significantly, inference time is halved compared to", "bbox": {"l": 163.1111, "t": 412.82974, "r": 452.24063000000007, "b": 420.8995100000001, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "HTML-based models, and the predicted table structures are always syn-", "bbox": {"l": 163.1111, "t": 423.78774999999996, "r": 452.24161, "b": 431.85751000000005, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "tactically correct. This in turn eliminates most post-processing needs.", "bbox": {"l": 163.1111, "t": 434.74673, "r": 452.24429, "b": 442.8165, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Popular table structure data-sets will be published in OTSL format to", "bbox": {"l": 163.1111, "t": 445.70572000000004, "r": 452.24603, "b": 453.77547999999996, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "the community.", "bbox": {"l": 163.1111, "t": 456.6647, "r": 225.56116, "b": 464.73447, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Abstract. Extracting tables from documents is a crucial task in any document conversion pipeline. Recently, transformer-based models have demonstrated that table-structure can be recognized with impressive accuracy using Image-to-Markup-Sequence (Im2Seq) approaches. Taking only the image of a table, such models predict a sequence of tokens (e.g. in HTML, LaTeX) which represent the structure of the table. Since the token representation of the table structure has a significant impact on the accuracy and run-time performance of any Im2Seq model, we investigate in this paper how table-structure representation can be optimised. We propose a new, optimised table-structure language (OTSL) with a minimized vocabulary and specific rules. The benefits of OTSL are that it reduces the number of tokens to 5 (HTML needs 28+) and shortens the sequence length to half of HTML on average. Consequently, model accuracy improves significantly, inference time is halved compared to HTML-based models, and the predicted table structures are always syntactically correct. This in turn eliminates most post-processing needs. Popular table structure data-sets will be published in OTSL format to the community."}, {"label": "text", "id": 4, "page_no": 0, "cluster": {"id": 4, "label": "text", "bbox": {"l": 163.1111, "t": 478.69394, "r": 452.24158, "b": 497.78549, "coord_origin": "TOPLEFT"}, "confidence": 0.9304055571556091, "cells": [{"id": 59, "text": "Keywords:", "bbox": {"l": 163.1111, "t": 478.69394, "r": 211.94211, "b": 486.62024, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Table Structure Recognition \u00b7 Data Representation \u00b7 Trans-", "bbox": {"l": 216.55208999999996, "t": 478.75671, "r": 452.24158, "b": 486.82648, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "formers \u00b7 Optimization.", "bbox": {"l": 163.11111, "t": 489.71573, "r": 257.64185, "b": 497.78549, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Keywords: Table Structure Recognition \u00b7 Data Representation \u00b7 Transformers \u00b7 Optimization."}, {"label": "section_header", "id": 3, "page_no": 0, "cluster": {"id": 3, "label": "section_header", "bbox": {"l": 134.76512, "t": 522.11969, "r": 228.93384, "b": 532.68808, "coord_origin": "TOPLEFT"}, "confidence": 0.9392016530036926, "cells": [{"id": 62, "text": "1", "bbox": {"l": 134.76512, "t": 522.11969, "r": 141.48872, "b": 532.68808, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "Introduction", "bbox": {"l": 154.93832, "t": 522.11969, "r": 228.93384, "b": 532.68808, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1 Introduction"}, {"label": "text", "id": 0, "page_no": 0, "cluster": {"id": 0, "label": "text", "bbox": {"l": 134.76512, "t": 548.2865400000001, "r": 480.5959500000001, "b": 628.81451, "coord_origin": "TOPLEFT"}, "confidence": 0.9835679531097412, "cells": [{"id": 64, "text": "Tables are ubiquitous in documents such as scientific papers, patents, reports,", "bbox": {"l": 134.76512, "t": 548.2865400000001, "r": 480.5939, "b": 557.0835099999999, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "manuals, specification sheets or marketing material. They often encode highly", "bbox": {"l": 134.76512, "t": 560.24254, "r": 480.59180000000003, "b": 569.0395100000001, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "valuable information and therefore need to be extracted with high accuracy.", "bbox": {"l": 134.76512, "t": 572.19754, "r": 480.59283000000005, "b": 580.99451, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "Unfortunately, tables appear in documents in various sizes, styling and struc-", "bbox": {"l": 134.76512, "t": 584.15254, "r": 480.5959500000001, "b": 592.9495099999999, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "ture, making it difficult to recover their correct structure with simple analyt-", "bbox": {"l": 134.76512, "t": 596.10754, "r": 480.58688, "b": 604.90451, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "ical methods. Therefore, accurate table extraction is achieved these days with", "bbox": {"l": 134.76512, "t": 608.06255, "r": 480.59088, "b": 616.85951, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "machine-learning based methods.", "bbox": {"l": 134.76512, "t": 620.01755, "r": 279.32745, "b": 628.81451, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Tables are ubiquitous in documents such as scientific papers, patents, reports, manuals, specification sheets or marketing material. They often encode highly valuable information and therefore need to be extracted with high accuracy. Unfortunately, tables appear in documents in various sizes, styling and structure, making it difficult to recover their correct structure with simple analytical methods. Therefore, accurate table extraction is achieved these days with machine-learning based methods."}, {"label": "text", "id": 2, "page_no": 0, "cluster": {"id": 2, "label": "text", "bbox": {"l": 134.76512, "t": 632.14755, "r": 480.59583, "b": 664.85453, "coord_origin": "TOPLEFT"}, "confidence": 0.9696458578109741, "cells": [{"id": 71, "text": "In modern document understanding systems [1,15], table extraction is typi-", "bbox": {"l": 149.70811, "t": 632.14755, "r": 480.58899, "b": 640.94452, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "cally a two-step process. Firstly, every table on a page is located with a bounding", "bbox": {"l": 134.76512, "t": 644.1025500000001, "r": 480.59583, "b": 652.8995199999999, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "box, and secondly, their logical row and column structure is recognized. As of", "bbox": {"l": 134.76512, "t": 656.05756, "r": 480.59496999999993, "b": 664.85453, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In modern document understanding systems [1,15], table extraction is typically a two-step process. Firstly, every table on a page is located with a bounding box, and secondly, their logical row and column structure is recognized. As of"}, {"label": "page_header", "id": 6, "page_no": 0, "cluster": {"id": 6, "label": "page_header", "bbox": {"l": 18.340218, "t": 209.47997999999995, "r": 36.339787, "b": 555.00003, "coord_origin": "TOPLEFT"}, "confidence": 0.8899643421173096, "cells": [{"id": 74, "text": "arXiv:2305.03393v1 [cs.CV] 5 May 2023", "bbox": {"l": 18.340218, "t": 209.47997999999995, "r": 36.339787, "b": 555.00003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "arXiv:2305.03393v1 [cs.CV] 5 May 2023"}], "body": [{"label": "section_header", "id": 5, "page_no": 0, "cluster": {"id": 5, "label": "section_header", "bbox": {"l": 134.765, "t": 115.89910999999995, "r": 480.59735, "b": 146.51409999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.8918349742889404, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure", "bbox": {"l": 134.765, "t": 115.89910999999995, "r": 480.59735, "b": 128.58112000000006, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Recognition", "bbox": {"l": 266.67499, "t": 133.83209, "r": 348.68506, "b": 146.51409999999998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Optimized Table Tokenization for Table Structure Recognition"}, {"label": "key_value_region", "id": 16, "page_no": 0, "cluster": {"id": 16, "label": "key_value_region", "bbox": {"l": 139.34305, "t": 169.69159000000002, "r": 476.01270000000005, "b": 236.27752999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.48445820808410645, "cells": [{"id": 2, "text": "Maksym Lysak", "bbox": {"l": 151.22598, "t": 171.67371000000003, "r": 217.04390999999998, "b": 180.47069999999997, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "[0000", "bbox": {"l": 217.04599, "t": 170.08209, "r": 235.18764, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "\u2212", "bbox": {"l": 235.18598999999998, "t": 169.69159000000002, "r": 241.4129, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "0002", "bbox": {"l": 241.41299000000004, "t": 170.08209, "r": 257.29932, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "\u2212", "bbox": {"l": 257.298, "t": 169.69159000000002, "r": 263.5249, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "3723", "bbox": {"l": 263.52499, "t": 170.08209, "r": 279.41132, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "\u2212", "bbox": {"l": 279.41, "t": 169.69159000000002, "r": 285.6369, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "$^{6960]}$, Ahmed Nassar[0000", "bbox": {"l": 285.63602, "t": 171.67371000000003, "r": 392.27664, "b": 180.47069999999997, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "\u2212", "bbox": {"l": 392.27502, "t": 169.69159000000002, "r": 398.50192, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "0002", "bbox": {"l": 398.50201, "t": 170.08209, "r": 414.38834, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "\u2212", "bbox": {"l": 414.38702, "t": 169.69159000000002, "r": 420.61392, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "9468", "bbox": {"l": 420.61304, "t": 170.08209, "r": 436.49936, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "\u2212", "bbox": {"l": 436.49805000000003, "t": 169.69159000000002, "r": 442.72495000000004, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "$^{0822]}$,", "bbox": {"l": 442.72504, "t": 171.67371000000003, "r": 464.12963999999994, "b": 180.47069999999997, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Nikolaos Livathinos", "bbox": {"l": 139.34305, "t": 183.62872000000004, "r": 224.80720999999997, "b": 192.42571999999996, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "[0000", "bbox": {"l": 224.80704000000003, "t": 182.03814999999997, "r": 242.94868, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "\u2212", "bbox": {"l": 242.94704000000002, "t": 181.64764000000002, "r": 249.17394999999996, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "0001", "bbox": {"l": 249.17404000000002, "t": 182.03814999999997, "r": 265.06036, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "\u2212", "bbox": {"l": 265.05905, "t": 181.64764000000002, "r": 271.28595, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "8513", "bbox": {"l": 271.28506, "t": 182.03814999999997, "r": 287.17139, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "\u2212", "bbox": {"l": 287.17007, "t": 181.64764000000002, "r": 293.39697, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "$^{3491]}$, Christoph Auer[0000", "bbox": {"l": 293.39706, "t": 183.62872000000004, "r": 404.1597, "b": 192.42571999999996, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "\u2212", "bbox": {"l": 404.15808, "t": 181.64764000000002, "r": 410.38498, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "0001", "bbox": {"l": 410.38507, "t": 182.03814999999997, "r": 426.27139, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "\u2212", "bbox": {"l": 426.27008, "t": 181.64764000000002, "r": 432.49697999999995, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "5761", "bbox": {"l": 432.49609, "t": 182.03814999999997, "r": 448.3824200000001, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "\u2212", "bbox": {"l": 448.3811, "t": 181.64764000000002, "r": 454.608, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "$^{0422]}$,", "bbox": {"l": 454.60808999999995, "t": 183.62872000000004, "r": 476.01270000000005, "b": 192.42571999999996, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "and Peter Staar", "bbox": {"l": 229.52109000000002, "t": 195.58374000000003, "r": 298.6087, "b": 204.38073999999995, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "[0000", "bbox": {"l": 298.60608, "t": 193.99316, "r": 316.74771, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "\u2212", "bbox": {"l": 316.74609, "t": 193.60266000000001, "r": 322.97299, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "0002", "bbox": {"l": 322.97308, "t": 193.99316, "r": 338.85941, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "\u2212", "bbox": {"l": 338.85809, "t": 193.60266000000001, "r": 345.08499, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "8088", "bbox": {"l": 345.08508, "t": 193.99316, "r": 360.97141, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "\u2212", "bbox": {"l": 360.97009, "t": 193.60266000000001, "r": 367.19699, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "0823]", "bbox": {"l": 367.19611, "t": 193.99316, "r": 385.33774, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "IBM Research", "bbox": {"l": 279.1051, "t": 217.20398, "r": 336.25153, "b": 225.27368, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "{mly,ahn,nli,cau,taa}@zurich.ibm.com", "bbox": {"l": 222.96609, "t": 228.80853000000002, "r": 392.38983, "b": 236.27752999999996, "coord_origin": "TOPLEFT"}}], "children": [{"id": 7, "label": "text", "bbox": {"l": 139.34305, "t": 169.69159000000002, "r": 476.01270000000005, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.7918068766593933, "cells": [{"id": 2, "text": "Maksym Lysak", "bbox": {"l": 151.22598, "t": 171.67371000000003, "r": 217.04390999999998, "b": 180.47069999999997, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "[0000", "bbox": {"l": 217.04599, "t": 170.08209, "r": 235.18764, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "\u2212", "bbox": {"l": 235.18598999999998, "t": 169.69159000000002, "r": 241.4129, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "0002", "bbox": {"l": 241.41299000000004, "t": 170.08209, "r": 257.29932, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "\u2212", "bbox": {"l": 257.298, "t": 169.69159000000002, "r": 263.5249, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "3723", "bbox": {"l": 263.52499, "t": 170.08209, "r": 279.41132, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "\u2212", "bbox": {"l": 279.41, "t": 169.69159000000002, "r": 285.6369, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "$^{6960]}$, Ahmed Nassar[0000", "bbox": {"l": 285.63602, "t": 171.67371000000003, "r": 392.27664, "b": 180.47069999999997, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "\u2212", "bbox": {"l": 392.27502, "t": 169.69159000000002, "r": 398.50192, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "0002", "bbox": {"l": 398.50201, "t": 170.08209, "r": 414.38834, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "\u2212", "bbox": {"l": 414.38702, "t": 169.69159000000002, "r": 420.61392, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "9468", "bbox": {"l": 420.61304, "t": 170.08209, "r": 436.49936, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "\u2212", "bbox": {"l": 436.49805000000003, "t": 169.69159000000002, "r": 442.72495000000004, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "$^{0822]}$,", "bbox": {"l": 442.72504, "t": 171.67371000000003, "r": 464.12963999999994, "b": 180.47069999999997, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Nikolaos Livathinos", "bbox": {"l": 139.34305, "t": 183.62872000000004, "r": 224.80720999999997, "b": 192.42571999999996, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "[0000", "bbox": {"l": 224.80704000000003, "t": 182.03814999999997, "r": 242.94868, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "\u2212", "bbox": {"l": 242.94704000000002, "t": 181.64764000000002, "r": 249.17394999999996, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "0001", "bbox": {"l": 249.17404000000002, "t": 182.03814999999997, "r": 265.06036, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "\u2212", "bbox": {"l": 265.05905, "t": 181.64764000000002, "r": 271.28595, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "8513", "bbox": {"l": 271.28506, "t": 182.03814999999997, "r": 287.17139, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "\u2212", "bbox": {"l": 287.17007, "t": 181.64764000000002, "r": 293.39697, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "$^{3491]}$, Christoph Auer[0000", "bbox": {"l": 293.39706, "t": 183.62872000000004, "r": 404.1597, "b": 192.42571999999996, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "\u2212", "bbox": {"l": 404.15808, "t": 181.64764000000002, "r": 410.38498, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "0001", "bbox": {"l": 410.38507, "t": 182.03814999999997, "r": 426.27139, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "\u2212", "bbox": {"l": 426.27008, "t": 181.64764000000002, "r": 432.49697999999995, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "5761", "bbox": {"l": 432.49609, "t": 182.03814999999997, "r": 448.3824200000001, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "\u2212", "bbox": {"l": 448.3811, "t": 181.64764000000002, "r": 454.608, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "$^{0422]}$,", "bbox": {"l": 454.60808999999995, "t": 183.62872000000004, "r": 476.01270000000005, "b": 192.42571999999996, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "[0000", "bbox": {"l": 298.60608, "t": 193.99316, "r": 316.74771, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "\u2212", "bbox": {"l": 316.74609, "t": 193.60266000000001, "r": 322.97299, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "0002", "bbox": {"l": 322.97308, "t": 193.99316, "r": 338.85941, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "\u2212", "bbox": {"l": 338.85809, "t": 193.60266000000001, "r": 345.08499, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "8088", "bbox": {"l": 345.08508, "t": 193.99316, "r": 360.97141, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "\u2212", "bbox": {"l": 360.97009, "t": 193.60266000000001, "r": 367.19699, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "0823]", "bbox": {"l": 367.19611, "t": 193.99316, "r": 385.33774, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 229.52109000000002, "t": 195.58374000000003, "r": 298.6087, "b": 204.38073999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.5015263557434082, "cells": [{"id": 30, "text": "and Peter Staar", "bbox": {"l": 229.52109000000002, "t": 195.58374000000003, "r": 298.6087, "b": 204.38073999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 279.1051, "t": 217.20398, "r": 336.25153, "b": 225.27368, "coord_origin": "TOPLEFT"}, "confidence": 0.6310867667198181, "cells": [{"id": 38, "text": "IBM Research", "bbox": {"l": 279.1051, "t": 217.20398, "r": 336.25153, "b": 225.27368, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "text", "bbox": {"l": 222.96609, "t": 228.80853000000002, "r": 392.38983, "b": 236.27752999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.6924149990081787, "cells": [{"id": 39, "text": "{mly,ahn,nli,cau,taa}@zurich.ibm.com", "bbox": {"l": 222.96609, "t": 228.80853000000002, "r": 392.38983, "b": 236.27752999999996, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null}, {"label": "text", "id": 1, "page_no": 0, "cluster": {"id": 1, "label": "text", "bbox": {"l": 163.1111, "t": 270.30115, "r": 452.24878000000007, "b": 464.73447, "coord_origin": "TOPLEFT"}, "confidence": 0.9807654023170471, "cells": [{"id": 40, "text": "Abstract.", "bbox": {"l": 163.1111, "t": 270.30115, "r": 206.6358, "b": 278.22748, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Extracting tables from documents is a crucial task in any", "bbox": {"l": 211.6171, "t": 270.36395000000005, "r": 452.2447199999999, "b": 278.43364999999994, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "document conversion pipeline. Recently, transformer-based models have", "bbox": {"l": 163.1111, "t": 281.3229099999999, "r": 452.24246, "b": 289.39267, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "demonstrated that table-structure can be recognized with impressive ac-", "bbox": {"l": 163.1111, "t": 292.28189, "r": 452.24792, "b": 300.35165000000006, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "curacy using Image-to-Markup-Sequence (Im2Seq) approaches. Taking", "bbox": {"l": 163.1111, "t": 303.24088, "r": 452.2407799999999, "b": 311.31064, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "only the image of a table, such models predict a sequence of tokens (e.g.", "bbox": {"l": 163.1111, "t": 314.19888, "r": 452.24609, "b": 322.26865, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "in HTML, LaTeX) which represent the structure of the table. Since the", "bbox": {"l": 163.1111, "t": 325.15787, "r": 452.24615000000006, "b": 333.22763, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "token representation of the table structure has a significant impact on", "bbox": {"l": 163.1111, "t": 336.11685, "r": 452.24707, "b": 344.18661, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "the accuracy and run-time performance of any Im2Seq model, we inves-", "bbox": {"l": 163.1111, "t": 347.07584, "r": 452.2459999999999, "b": 355.1456, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "tigate in this paper how table-structure representation can be optimised.", "bbox": {"l": 163.1111, "t": 358.03482, "r": 452.2479900000001, "b": 366.10458, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "We propose a new, optimised table-structure language (OTSL) with a", "bbox": {"l": 163.1111, "t": 368.9938, "r": 452.24609, "b": 377.06357, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "minimized vocabulary and specific rules. The benefits of OTSL are that", "bbox": {"l": 163.1111, "t": 379.95279, "r": 452.2417, "b": 388.02255, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "it reduces the number of tokens to 5 (HTML needs 28+) and shortens", "bbox": {"l": 163.1111, "t": 390.91177, "r": 452.2443200000001, "b": 398.98154, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "the sequence length to half of HTML on average. Consequently, model", "bbox": {"l": 163.1111, "t": 401.87076, "r": 452.24878000000007, "b": 409.94052, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "accuracy improves significantly, inference time is halved compared to", "bbox": {"l": 163.1111, "t": 412.82974, "r": 452.24063000000007, "b": 420.8995100000001, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "HTML-based models, and the predicted table structures are always syn-", "bbox": {"l": 163.1111, "t": 423.78774999999996, "r": 452.24161, "b": 431.85751000000005, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "tactically correct. This in turn eliminates most post-processing needs.", "bbox": {"l": 163.1111, "t": 434.74673, "r": 452.24429, "b": 442.8165, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Popular table structure data-sets will be published in OTSL format to", "bbox": {"l": 163.1111, "t": 445.70572000000004, "r": 452.24603, "b": 453.77547999999996, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "the community.", "bbox": {"l": 163.1111, "t": 456.6647, "r": 225.56116, "b": 464.73447, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Abstract. Extracting tables from documents is a crucial task in any document conversion pipeline. Recently, transformer-based models have demonstrated that table-structure can be recognized with impressive accuracy using Image-to-Markup-Sequence (Im2Seq) approaches. Taking only the image of a table, such models predict a sequence of tokens (e.g. in HTML, LaTeX) which represent the structure of the table. Since the token representation of the table structure has a significant impact on the accuracy and run-time performance of any Im2Seq model, we investigate in this paper how table-structure representation can be optimised. We propose a new, optimised table-structure language (OTSL) with a minimized vocabulary and specific rules. The benefits of OTSL are that it reduces the number of tokens to 5 (HTML needs 28+) and shortens the sequence length to half of HTML on average. Consequently, model accuracy improves significantly, inference time is halved compared to HTML-based models, and the predicted table structures are always syntactically correct. This in turn eliminates most post-processing needs. Popular table structure data-sets will be published in OTSL format to the community."}, {"label": "text", "id": 4, "page_no": 0, "cluster": {"id": 4, "label": "text", "bbox": {"l": 163.1111, "t": 478.69394, "r": 452.24158, "b": 497.78549, "coord_origin": "TOPLEFT"}, "confidence": 0.9304055571556091, "cells": [{"id": 59, "text": "Keywords:", "bbox": {"l": 163.1111, "t": 478.69394, "r": 211.94211, "b": 486.62024, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Table Structure Recognition \u00b7 Data Representation \u00b7 Trans-", "bbox": {"l": 216.55208999999996, "t": 478.75671, "r": 452.24158, "b": 486.82648, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "formers \u00b7 Optimization.", "bbox": {"l": 163.11111, "t": 489.71573, "r": 257.64185, "b": 497.78549, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Keywords: Table Structure Recognition \u00b7 Data Representation \u00b7 Transformers \u00b7 Optimization."}, {"label": "section_header", "id": 3, "page_no": 0, "cluster": {"id": 3, "label": "section_header", "bbox": {"l": 134.76512, "t": 522.11969, "r": 228.93384, "b": 532.68808, "coord_origin": "TOPLEFT"}, "confidence": 0.9392016530036926, "cells": [{"id": 62, "text": "1", "bbox": {"l": 134.76512, "t": 522.11969, "r": 141.48872, "b": 532.68808, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "Introduction", "bbox": {"l": 154.93832, "t": 522.11969, "r": 228.93384, "b": 532.68808, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1 Introduction"}, {"label": "text", "id": 0, "page_no": 0, "cluster": {"id": 0, "label": "text", "bbox": {"l": 134.76512, "t": 548.2865400000001, "r": 480.5959500000001, "b": 628.81451, "coord_origin": "TOPLEFT"}, "confidence": 0.9835679531097412, "cells": [{"id": 64, "text": "Tables are ubiquitous in documents such as scientific papers, patents, reports,", "bbox": {"l": 134.76512, "t": 548.2865400000001, "r": 480.5939, "b": 557.0835099999999, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "manuals, specification sheets or marketing material. They often encode highly", "bbox": {"l": 134.76512, "t": 560.24254, "r": 480.59180000000003, "b": 569.0395100000001, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "valuable information and therefore need to be extracted with high accuracy.", "bbox": {"l": 134.76512, "t": 572.19754, "r": 480.59283000000005, "b": 580.99451, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "Unfortunately, tables appear in documents in various sizes, styling and struc-", "bbox": {"l": 134.76512, "t": 584.15254, "r": 480.5959500000001, "b": 592.9495099999999, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "ture, making it difficult to recover their correct structure with simple analyt-", "bbox": {"l": 134.76512, "t": 596.10754, "r": 480.58688, "b": 604.90451, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "ical methods. Therefore, accurate table extraction is achieved these days with", "bbox": {"l": 134.76512, "t": 608.06255, "r": 480.59088, "b": 616.85951, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "machine-learning based methods.", "bbox": {"l": 134.76512, "t": 620.01755, "r": 279.32745, "b": 628.81451, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Tables are ubiquitous in documents such as scientific papers, patents, reports, manuals, specification sheets or marketing material. They often encode highly valuable information and therefore need to be extracted with high accuracy. Unfortunately, tables appear in documents in various sizes, styling and structure, making it difficult to recover their correct structure with simple analytical methods. Therefore, accurate table extraction is achieved these days with machine-learning based methods."}, {"label": "text", "id": 2, "page_no": 0, "cluster": {"id": 2, "label": "text", "bbox": {"l": 134.76512, "t": 632.14755, "r": 480.59583, "b": 664.85453, "coord_origin": "TOPLEFT"}, "confidence": 0.9696458578109741, "cells": [{"id": 71, "text": "In modern document understanding systems [1,15], table extraction is typi-", "bbox": {"l": 149.70811, "t": 632.14755, "r": 480.58899, "b": 640.94452, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "cally a two-step process. Firstly, every table on a page is located with a bounding", "bbox": {"l": 134.76512, "t": 644.1025500000001, "r": 480.59583, "b": 652.8995199999999, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "box, and secondly, their logical row and column structure is recognized. As of", "bbox": {"l": 134.76512, "t": 656.05756, "r": 480.59496999999993, "b": 664.85453, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In modern document understanding systems [1,15], table extraction is typically a two-step process. Firstly, every table on a page is located with a bounding box, and secondly, their logical row and column structure is recognized. As of"}], "headers": [{"label": "page_header", "id": 6, "page_no": 0, "cluster": {"id": 6, "label": "page_header", "bbox": {"l": 18.340218, "t": 209.47997999999995, "r": 36.339787, "b": 555.00003, "coord_origin": "TOPLEFT"}, "confidence": 0.8899643421173096, "cells": [{"id": 74, "text": "arXiv:2305.03393v1 [cs.CV] 5 May 2023", "bbox": {"l": 18.340218, "t": 209.47997999999995, "r": 36.339787, "b": 555.00003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "arXiv:2305.03393v1 [cs.CV] 5 May 2023"}]}}, {"page_no": 1, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "2", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "M.", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 178.07675, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37415, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Fig. 1.", "bbox": {"l": 134.765, "t": 126.33416999999997, "r": 162.64424, "b": 134.26049999999998, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Comparison between HTML and OTSL table structure representation: (A)", "bbox": {"l": 167.062, "t": 126.39697000000001, "r": 480.59106, "b": 134.46667000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "table-example with complex row and column headers, including a 2D empty span,", "bbox": {"l": 134.765, "t": 137.35595999999998, "r": 480.59018, "b": 145.42566, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "(B)", "bbox": {"l": 134.765, "t": 148.31493999999998, "r": 147.95433, "b": 156.38464, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "minimal graphical representation of table structure using rectangular layout, (C)", "bbox": {"l": 152.39224, "t": 148.31493999999998, "r": 480.59096999999997, "b": 156.38464, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "HTML representation, (D) OTSL representation. This example demonstrates many of", "bbox": {"l": 134.765, "t": 159.27392999999995, "r": 480.59189, "b": 167.34362999999996, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "the key-features of OTSL, namely its reduced vocabulary size (12 versus 5 in this case),", "bbox": {"l": 134.765, "t": 170.23290999999995, "r": 480.58914000000004, "b": 178.30260999999996, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "its reduced sequence length (55 versus 30) and a enhanced internal structure (variable", "bbox": {"l": 134.765, "t": 181.19188999999994, "r": 480.59020999999996, "b": 189.26160000000004, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "token sequence length per row in HTML versus a fixed length of rows in OTSL).", "bbox": {"l": 134.765, "t": 192.15088000000003, "r": 460.87109, "b": 200.22058000000004, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "C", "bbox": {"l": 396.41107, "t": 280.98352, "r": 402.97336, "b": 289.50903, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "C", "bbox": {"l": 418.58682, "t": 280.89792, "r": 425.14911, "b": 289.42343, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "C", "bbox": {"l": 395.74835, "t": 303.23727, "r": 402.31064, "b": 311.76279, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "C", "bbox": {"l": 407.54214, "t": 303.36981, "r": 414.10443, "b": 311.89532, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "C", "bbox": {"l": 407.56335, "t": 314.40619, "r": 414.12564, "b": 322.9317, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "C", "bbox": {"l": 418.51108, "t": 292.08502000000004, "r": 425.07336, "b": 300.61053000000004, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "C", "bbox": {"l": 429.59744, "t": 292.09106, "r": 436.1597300000001, "b": 300.61658, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "C", "bbox": {"l": 440.68759000000006, "t": 292.01230000000004, "r": 447.24987999999996, "b": 300.53781000000004, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "C", "bbox": {"l": 418.6232, "t": 303.29483, "r": 425.18549, "b": 311.82034, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "C", "bbox": {"l": 429.7095299999999, "t": 303.30011, "r": 436.27182, "b": 311.82562, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "C", "bbox": {"l": 440.7996800000001, "t": 303.22211, "r": 447.36197, "b": 311.74762, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "C", "bbox": {"l": 418.62546, "t": 314.56903, "r": 425.18774, "b": 323.09454, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "C", "bbox": {"l": 429.71181999999993, "t": 314.57434, "r": 436.27411, "b": 323.09985, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "C", "bbox": {"l": 440.80194, "t": 314.49631, "r": 447.36423, "b": 323.02182, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "C", "bbox": {"l": 407.39746, "t": 325.29031, "r": 413.95975, "b": 333.81583, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "C", "bbox": {"l": 418.45959, "t": 325.45316, "r": 425.02188, "b": 333.97867, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "C", "bbox": {"l": 429.54593, "t": 325.4592, "r": 436.10822, "b": 333.98471, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "C", "bbox": {"l": 440.63608, "t": 325.38043, "r": 447.19836, "b": 333.90594, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "NL", "bbox": {"l": 451.89511000000005, "t": 280.15717, "r": 463.51273000000003, "b": 288.68268, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "NL", "bbox": {"l": 452.1557, "t": 291.59875000000005, "r": 463.77332, "b": 300.12427, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "NL", "bbox": {"l": 452.17688000000004, "t": 302.84265, "r": 463.79449000000005, "b": 311.36816, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "NL", "bbox": {"l": 452.09887999999995, "t": 314.12441999999993, "r": 463.71648999999996, "b": 322.6499299999999, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "NL", "bbox": {"l": 452.29733, "t": 325.46906, "r": 463.91495, "b": 333.99457, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "U", "bbox": {"l": 396.09677, "t": 314.49478, "r": 402.65906, "b": 323.02029000000005, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "U", "bbox": {"l": 395.99829, "t": 325.38876000000005, "r": 402.56058, "b": 333.91428, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "U", "bbox": {"l": 396.27475, "t": 292.27057, "r": 402.83704, "b": 300.79608, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "L", "bbox": {"l": 408.54724, "t": 280.96912, "r": 413.60074, "b": 289.49463, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "L", "bbox": {"l": 430.58966, "t": 280.49725, "r": 435.6431600000001, "b": 289.02277, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "L", "bbox": {"l": 441.08069, "t": 280.38062, "r": 446.13419, "b": 288.90613, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "X", "bbox": {"l": 407.97388, "t": 292.13425, "r": 414.03625, "b": 300.65976, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "NL", "bbox": {"l": 441.25640999999996, "t": 411.1807600000001, "r": 452.87402, "b": 419.7062700000001, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "vocabulary:", "bbox": {"l": 393.75256, "t": 399.7947700000001, "r": 432.48929, "b": 406.89935, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "5", "bbox": {"l": 434.5896000000001, "t": 399.7947700000001, "r": 438.80083999999994, "b": 406.89935, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "tokens", "bbox": {"l": 440.90573, "t": 399.7947700000001, "r": 463.22235, "b": 406.89935, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "D OTSL", "bbox": {"l": 384.11816, "t": 258.54718, "r": 413.99307, "b": 265.65179, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "sequence length:", "bbox": {"l": 393.75256, "t": 266.67505000000006, "r": 451.45129000000003, "b": 273.77966000000004, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "30", "bbox": {"l": 453.55083999999994, "t": 266.67505000000006, "r": 461.97485, "b": 273.77966000000004, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "vocabulary for this table:", "bbox": {"l": 151.79318, "t": 399.76016, "r": 233.89371000000003, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "12", "bbox": {"l": 235.99332, "t": 399.76016, "r": 244.41734000000002, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "tokens", "bbox": {"l": 246.52222, "t": 399.76016, "r": 268.83884, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "A", "bbox": {"l": 154.3298, "t": 213.57457999999997, "r": 159.79837, "b": 220.67920000000004, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "B", "bbox": {"l": 321.07053, "t": 213.57457999999997, "r": 326.53909, "b": 220.67920000000004, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "<table>", "bbox": {"l": 153.0947, "t": 280.30411, "r": 175.83888, "b": 286.69824, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "<tr>", "bbox": {"l": 160.67039, "t": 287.12088, "r": 172.79608, "b": 293.51501, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "<td", "bbox": {"l": 168.24603, "t": 293.93765, "r": 177.91019, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "colspan=\u201c2\u201d", "bbox": {"l": 179.80525, "t": 293.93765, "r": 215.61517, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "rowspan=\u201c2\u201d", "bbox": {"l": 217.50886999999997, "t": 293.93765, "r": 255.58945, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": ">", "bbox": {"l": 257.48315, "t": 293.93765, "r": 261.46414, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "</td>", "bbox": {"l": 263.35785, "t": 293.93765, "r": 278.89804, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "<td", "bbox": {"l": 280.79175, "t": 293.93765, "r": 290.4559, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "colspan=\u201c3\u201d", "bbox": {"l": 292.35095, "t": 293.93765, "r": 328.16083, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": ">", "bbox": {"l": 330.05457, "t": 293.93765, "r": 334.03555, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "</td>", "bbox": {"l": 335.92926, "t": 293.93765, "r": 351.46945, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "</tr>", "bbox": {"l": 160.67039, "t": 300.75442999999996, "r": 174.68979, "b": 307.14856, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "<tr>", "bbox": {"l": 160.67039, "t": 307.57122999999996, "r": 172.79608, "b": 313.96536, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "<td>", "bbox": {"l": 168.24603, "t": 314.388, "r": 181.89255, "b": 320.78214, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "</td>", "bbox": {"l": 183.78624, "t": 314.388, "r": 199.32646, "b": 320.78214, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "<td>", "bbox": {"l": 201.22015, "t": 314.388, "r": 214.86666999999997, "b": 320.78214, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "</td>", "bbox": {"l": 216.76038, "t": 314.388, "r": 232.30058, "b": 320.78214, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "<td>", "bbox": {"l": 234.19427000000002, "t": 314.388, "r": 247.84079000000003, "b": 320.78214, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "</td>", "bbox": {"l": 249.73447999999996, "t": 314.388, "r": 265.27469, "b": 320.78214, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "</tr>", "bbox": {"l": 160.67039, "t": 321.20477, "r": 174.68979, "b": 327.59890999999993, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "<tr>", "bbox": {"l": 160.67039, "t": 328.02158, "r": 172.79608, "b": 334.41571000000005, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "<td rowspan=\u201c3\u201d > </td> <td> </td> <td> </td> <td> </td> <td> </td>", "bbox": {"l": 168.24603, "t": 334.83835, "r": 373.09091, "b": 341.23248, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "</tr>", "bbox": {"l": 160.67039, "t": 341.65512, "r": 174.68979, "b": 348.04926, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "<tr>", "bbox": {"l": 160.67039, "t": 348.47159, "r": 172.79608, "b": 354.86572, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "<td>", "bbox": {"l": 168.24603, "t": 355.28836000000007, "r": 181.89255, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "</td>", "bbox": {"l": 183.78624, "t": 355.28836000000007, "r": 199.32646, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "<td>", "bbox": {"l": 201.22015, "t": 355.28836000000007, "r": 214.86666999999997, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "</td>", "bbox": {"l": 216.76038, "t": 355.28836000000007, "r": 232.30058, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "<td>", "bbox": {"l": 234.19427000000002, "t": 355.28836000000007, "r": 247.84079000000003, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "</td>", "bbox": {"l": 249.73447999999996, "t": 355.28836000000007, "r": 265.27469, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "<td>", "bbox": {"l": 267.1684, "t": 355.28836000000007, "r": 280.81488, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "</td>", "bbox": {"l": 282.70862, "t": 355.28836000000007, "r": 298.24881, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "</tr>", "bbox": {"l": 160.67039, "t": 362.10516000000007, "r": 174.68979, "b": 368.49929999999995, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "<tr>", "bbox": {"l": 160.67039, "t": 368.92194, "r": 172.79608, "b": 375.31607, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "<td>", "bbox": {"l": 168.24603, "t": 375.73871, "r": 181.89255, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "</td>", "bbox": {"l": 183.78624, "t": 375.73871, "r": 199.32646, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "<td>", "bbox": {"l": 201.22015, "t": 375.73871, "r": 214.86666999999997, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "</td>", "bbox": {"l": 216.76038, "t": 375.73871, "r": 232.30058, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "<td>", "bbox": {"l": 234.19427000000002, "t": 375.73871, "r": 247.84079000000003, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "</td>", "bbox": {"l": 249.73447999999996, "t": 375.73871, "r": 265.27469, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "<td>", "bbox": {"l": 267.1684, "t": 375.73871, "r": 280.81488, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "</td>", "bbox": {"l": 282.70862, "t": 375.73871, "r": 298.24881, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "</tr>", "bbox": {"l": 160.67039, "t": 382.55551, "r": 174.68979, "b": 388.94965, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "</table>", "bbox": {"l": 153.0947, "t": 389.37228, "r": 177.73259, "b": 395.76642, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "C", "bbox": {"l": 395.06137, "t": 411.33353, "r": 401.62366, "b": 419.85904, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "L", "bbox": {"l": 407.42249, "t": 411.33353, "r": 412.47598, "b": 419.85904, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "U", "bbox": {"l": 418.69287, "t": 411.33353, "r": 425.25516, "b": 419.85904, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "X", "bbox": {"l": 430.5086099999999, "t": 411.33353, "r": 436.5709800000001, "b": 419.85904, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "<table>", "bbox": {"l": 152.36208, "t": 409.77362, "r": 175.10626, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "<tr>", "bbox": {"l": 178.89366, "t": 409.77362, "r": 191.01935, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "</tr>", "bbox": {"l": 194.80676, "t": 409.77362, "r": 208.82614, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "<td>", "bbox": {"l": 212.61354, "t": 409.77362, "r": 226.26003999999998, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "</td>", "bbox": {"l": 230.04745000000003, "t": 409.77362, "r": 245.58765000000002, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "<td", "bbox": {"l": 249.37506000000002, "t": 409.77362, "r": 259.03918, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "colspan=\"2\"", "bbox": {"l": 262.82797, "t": 409.77362, "r": 298.93646, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "colspan=\"3\"", "bbox": {"l": 302.72385, "t": 409.77362, "r": 338.83234, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "rowspan=\"2\"", "bbox": {"l": 152.36208, "t": 418.10522, "r": 190.74123, "b": 424.49936, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "rowspan=\"3\"", "bbox": {"l": 194.52863, "t": 418.10522, "r": 232.90777999999997, "b": 424.49936, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": ">", "bbox": {"l": 236.69518999999997, "t": 418.10522, "r": 240.67617999999996, "b": 424.49936, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "</table>", "bbox": {"l": 244.46358, "t": 418.10522, "r": 269.10144, "b": 424.49936, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "C", "bbox": {"l": 154.50595, "t": 258.60095, "r": 159.62473, "b": 265.70556999999997, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "HTML", "bbox": {"l": 164.74348, "t": 258.60095, "r": 185.21857, "b": 265.70556999999997, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "sequence length:", "bbox": {"l": 164.3548, "t": 266.49707, "r": 222.05352999999997, "b": 273.60168, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "55", "bbox": {"l": 224.15326, "t": 266.49707, "r": 232.57729, "b": 273.60168, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "today,", "bbox": {"l": 134.765, "t": 452.31378, "r": 161.32928, "b": 461.11075, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "table detection", "bbox": {"l": 164.269, "t": 452.31378, "r": 226.28617999999997, "b": 461.11075, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "in documents is a well understood problem, and the latest", "bbox": {"l": 229.992, "t": 452.31378, "r": 480.59232000000003, "b": 461.11075, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "state-of-the-art (SOTA) object detection methods provide an accuracy compa-", "bbox": {"l": 134.76501, "t": 464.26877, "r": 480.59180000000003, "b": 473.06573, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "rable to human observers [7,8,10,14,23]. On the other hand, the problem of table", "bbox": {"l": 134.76501, "t": 476.22375, "r": 480.58673, "b": 485.02072, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "structure recognition (TSR) is a lot more challenging and remains a very active", "bbox": {"l": 134.76501, "t": 488.17975, "r": 480.58658, "b": 496.97672, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "area of research, in which many novel machine learning algorithms are being", "bbox": {"l": 134.76501, "t": 500.13474, "r": 480.58978, "b": 508.9317, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "explored [3,4,5,9,11,12,13,14,17,18,21,22].", "bbox": {"l": 134.76501, "t": 512.0897199999999, "r": 313.24597, "b": 520.88669, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "Recently emerging SOTA methods for table structure recognition employ", "bbox": {"l": 149.70901, "t": 524.55072, "r": 480.58884000000006, "b": 533.3476900000001, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "transformer-based models, in which an image of the table is provided to the net-", "bbox": {"l": 134.76501, "t": 536.50671, "r": 480.5917400000001, "b": 545.30368, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "work in order to predict the structure of the table as a sequence of tokens. These", "bbox": {"l": 134.76501, "t": 548.46172, "r": 480.58868, "b": 557.25868, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "image-to-sequence (Im2Seq) models are extremely powerful, since they allow for", "bbox": {"l": 134.76501, "t": 560.41672, "r": 480.58795, "b": 569.2136800000001, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "a purely data-driven solution. The tokens of the sequence typically belong to a", "bbox": {"l": 134.76501, "t": 572.37172, "r": 480.58978, "b": 581.16869, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "markup language such as HTML, Latex or Markdown, which allow to describe", "bbox": {"l": 134.76501, "t": 584.32672, "r": 480.59479, "b": 593.12369, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "table structure as rows, columns and spanning cells in various configurations.", "bbox": {"l": 134.76501, "t": 596.28271, "r": 480.58678999999995, "b": 605.0796799999999, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "In Figure 1, we illustrate how HTML is used to represent the table-structure", "bbox": {"l": 134.76501, "t": 608.23772, "r": 480.59476, "b": 617.03468, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "of a particular example table. Public table-structure data sets such as PubTab-", "bbox": {"l": 134.76501, "t": 620.19272, "r": 480.5938100000001, "b": 628.98969, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "Net [22], and FinTabNet [21], which were created in a semi-automated way from", "bbox": {"l": 134.76501, "t": 632.1477199999999, "r": 480.59482, "b": 640.94469, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "paired PDF and HTML sources (e.g. PubMed Central), popularized primarily", "bbox": {"l": 134.76501, "t": 644.10272, "r": 480.58771, "b": 652.89969, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "the use of HTML as ground-truth representation format for TSR.", "bbox": {"l": 134.76501, "t": 656.05772, "r": 421.45377, "b": 664.8547, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 5, "label": "page_header", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8580349683761597, "cells": [{"id": 0, "text": "2", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "page_header", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9076642990112305, "cells": [{"id": 1, "text": "M.", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 178.07675, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37415, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "caption", "bbox": {"l": 134.765, "t": 126.33416999999997, "r": 480.59189, "b": 200.22058000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.8939083218574524, "cells": [{"id": 3, "text": "Fig. 1.", "bbox": {"l": 134.765, "t": 126.33416999999997, "r": 162.64424, "b": 134.26049999999998, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Comparison between HTML and OTSL table structure representation: (A)", "bbox": {"l": 167.062, "t": 126.39697000000001, "r": 480.59106, "b": 134.46667000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "table-example with complex row and column headers, including a 2D empty span,", "bbox": {"l": 134.765, "t": 137.35595999999998, "r": 480.59018, "b": 145.42566, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "(B)", "bbox": {"l": 134.765, "t": 148.31493999999998, "r": 147.95433, "b": 156.38464, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "minimal graphical representation of table structure using rectangular layout, (C)", "bbox": {"l": 152.39224, "t": 148.31493999999998, "r": 480.59096999999997, "b": 156.38464, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "HTML representation, (D) OTSL representation. This example demonstrates many of", "bbox": {"l": 134.765, "t": 159.27392999999995, "r": 480.59189, "b": 167.34362999999996, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "the key-features of OTSL, namely its reduced vocabulary size (12 versus 5 in this case),", "bbox": {"l": 134.765, "t": 170.23290999999995, "r": 480.58914000000004, "b": 178.30260999999996, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "its reduced sequence length (55 versus 30) and a enhanced internal structure (variable", "bbox": {"l": 134.765, "t": 181.19188999999994, "r": 480.59020999999996, "b": 189.26160000000004, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "token sequence length per row in HTML versus a fixed length of rows in OTSL).", "bbox": {"l": 134.765, "t": 192.15088000000003, "r": 460.87109, "b": 200.22058000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "picture", "bbox": {"l": 148.45364379882812, "t": 208.37423706054688, "r": 464.3608093261719, "b": 425.8462219238281, "coord_origin": "TOPLEFT"}, "confidence": 0.9688959121704102, "cells": [{"id": 12, "text": "C", "bbox": {"l": 396.41107, "t": 280.98352, "r": 402.97336, "b": 289.50903, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "C", "bbox": {"l": 418.58682, "t": 280.89792, "r": 425.14911, "b": 289.42343, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "C", "bbox": {"l": 395.74835, "t": 303.23727, "r": 402.31064, "b": 311.76279, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "C", "bbox": {"l": 407.54214, "t": 303.36981, "r": 414.10443, "b": 311.89532, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "C", "bbox": {"l": 407.56335, "t": 314.40619, "r": 414.12564, "b": 322.9317, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "C", "bbox": {"l": 418.51108, "t": 292.08502000000004, "r": 425.07336, "b": 300.61053000000004, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "C", "bbox": {"l": 429.59744, "t": 292.09106, "r": 436.1597300000001, "b": 300.61658, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "C", "bbox": {"l": 440.68759000000006, "t": 292.01230000000004, "r": 447.24987999999996, "b": 300.53781000000004, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "C", "bbox": {"l": 418.6232, "t": 303.29483, "r": 425.18549, "b": 311.82034, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "C", "bbox": {"l": 429.7095299999999, "t": 303.30011, "r": 436.27182, "b": 311.82562, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "C", "bbox": {"l": 440.7996800000001, "t": 303.22211, "r": 447.36197, "b": 311.74762, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "C", "bbox": {"l": 418.62546, "t": 314.56903, "r": 425.18774, "b": 323.09454, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "C", "bbox": {"l": 429.71181999999993, "t": 314.57434, "r": 436.27411, "b": 323.09985, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "C", "bbox": {"l": 440.80194, "t": 314.49631, "r": 447.36423, "b": 323.02182, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "C", "bbox": {"l": 407.39746, "t": 325.29031, "r": 413.95975, "b": 333.81583, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "C", "bbox": {"l": 418.45959, "t": 325.45316, "r": 425.02188, "b": 333.97867, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "C", "bbox": {"l": 429.54593, "t": 325.4592, "r": 436.10822, "b": 333.98471, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "C", "bbox": {"l": 440.63608, "t": 325.38043, "r": 447.19836, "b": 333.90594, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "NL", "bbox": {"l": 451.89511000000005, "t": 280.15717, "r": 463.51273000000003, "b": 288.68268, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "NL", "bbox": {"l": 452.1557, "t": 291.59875000000005, "r": 463.77332, "b": 300.12427, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "NL", "bbox": {"l": 452.17688000000004, "t": 302.84265, "r": 463.79449000000005, "b": 311.36816, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "NL", "bbox": {"l": 452.09887999999995, "t": 314.12441999999993, "r": 463.71648999999996, "b": 322.6499299999999, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "NL", "bbox": {"l": 452.29733, "t": 325.46906, "r": 463.91495, "b": 333.99457, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "U", "bbox": {"l": 396.09677, "t": 314.49478, "r": 402.65906, "b": 323.02029000000005, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "U", "bbox": {"l": 395.99829, "t": 325.38876000000005, "r": 402.56058, "b": 333.91428, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "U", "bbox": {"l": 396.27475, "t": 292.27057, "r": 402.83704, "b": 300.79608, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "L", "bbox": {"l": 408.54724, "t": 280.96912, "r": 413.60074, "b": 289.49463, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "L", "bbox": {"l": 430.58966, "t": 280.49725, "r": 435.6431600000001, "b": 289.02277, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "L", "bbox": {"l": 441.08069, "t": 280.38062, "r": 446.13419, "b": 288.90613, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "X", "bbox": {"l": 407.97388, "t": 292.13425, "r": 414.03625, "b": 300.65976, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "NL", "bbox": {"l": 441.25640999999996, "t": 411.1807600000001, "r": 452.87402, "b": 419.7062700000001, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "vocabulary:", "bbox": {"l": 393.75256, "t": 399.7947700000001, "r": 432.48929, "b": 406.89935, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "5", "bbox": {"l": 434.5896000000001, "t": 399.7947700000001, "r": 438.80083999999994, "b": 406.89935, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "tokens", "bbox": {"l": 440.90573, "t": 399.7947700000001, "r": 463.22235, "b": 406.89935, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "D OTSL", "bbox": {"l": 384.11816, "t": 258.54718, "r": 413.99307, "b": 265.65179, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "sequence length:", "bbox": {"l": 393.75256, "t": 266.67505000000006, "r": 451.45129000000003, "b": 273.77966000000004, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "30", "bbox": {"l": 453.55083999999994, "t": 266.67505000000006, "r": 461.97485, "b": 273.77966000000004, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "vocabulary for this table:", "bbox": {"l": 151.79318, "t": 399.76016, "r": 233.89371000000003, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "12", "bbox": {"l": 235.99332, "t": 399.76016, "r": 244.41734000000002, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "tokens", "bbox": {"l": 246.52222, "t": 399.76016, "r": 268.83884, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "A", "bbox": {"l": 154.3298, "t": 213.57457999999997, "r": 159.79837, "b": 220.67920000000004, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "B", "bbox": {"l": 321.07053, "t": 213.57457999999997, "r": 326.53909, "b": 220.67920000000004, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "<table>", "bbox": {"l": 153.0947, "t": 280.30411, "r": 175.83888, "b": 286.69824, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "<tr>", "bbox": {"l": 160.67039, "t": 287.12088, "r": 172.79608, "b": 293.51501, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "<td", "bbox": {"l": 168.24603, "t": 293.93765, "r": 177.91019, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "colspan=\u201c2\u201d", "bbox": {"l": 179.80525, "t": 293.93765, "r": 215.61517, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "rowspan=\u201c2\u201d", "bbox": {"l": 217.50886999999997, "t": 293.93765, "r": 255.58945, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": ">", "bbox": {"l": 257.48315, "t": 293.93765, "r": 261.46414, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "</td>", "bbox": {"l": 263.35785, "t": 293.93765, "r": 278.89804, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "<td", "bbox": {"l": 280.79175, "t": 293.93765, "r": 290.4559, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "colspan=\u201c3\u201d", "bbox": {"l": 292.35095, "t": 293.93765, "r": 328.16083, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": ">", "bbox": {"l": 330.05457, "t": 293.93765, "r": 334.03555, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "</td>", "bbox": {"l": 335.92926, "t": 293.93765, "r": 351.46945, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "</tr>", "bbox": {"l": 160.67039, "t": 300.75442999999996, "r": 174.68979, "b": 307.14856, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "<tr>", "bbox": {"l": 160.67039, "t": 307.57122999999996, "r": 172.79608, "b": 313.96536, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "<td>", "bbox": {"l": 168.24603, "t": 314.388, "r": 181.89255, "b": 320.78214, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "</td>", "bbox": {"l": 183.78624, "t": 314.388, "r": 199.32646, "b": 320.78214, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "<td>", "bbox": {"l": 201.22015, "t": 314.388, "r": 214.86666999999997, "b": 320.78214, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "</td>", "bbox": {"l": 216.76038, "t": 314.388, "r": 232.30058, "b": 320.78214, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "<td>", "bbox": {"l": 234.19427000000002, "t": 314.388, "r": 247.84079000000003, "b": 320.78214, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "</td>", "bbox": {"l": 249.73447999999996, "t": 314.388, "r": 265.27469, "b": 320.78214, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "</tr>", "bbox": {"l": 160.67039, "t": 321.20477, "r": 174.68979, "b": 327.59890999999993, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "<tr>", "bbox": {"l": 160.67039, "t": 328.02158, "r": 172.79608, "b": 334.41571000000005, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "<td rowspan=\u201c3\u201d > </td> <td> </td> <td> </td> <td> </td> <td> </td>", "bbox": {"l": 168.24603, "t": 334.83835, "r": 373.09091, "b": 341.23248, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "</tr>", "bbox": {"l": 160.67039, "t": 341.65512, "r": 174.68979, "b": 348.04926, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "<tr>", "bbox": {"l": 160.67039, "t": 348.47159, "r": 172.79608, "b": 354.86572, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "<td>", "bbox": {"l": 168.24603, "t": 355.28836000000007, "r": 181.89255, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "</td>", "bbox": {"l": 183.78624, "t": 355.28836000000007, "r": 199.32646, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "<td>", "bbox": {"l": 201.22015, "t": 355.28836000000007, "r": 214.86666999999997, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "</td>", "bbox": {"l": 216.76038, "t": 355.28836000000007, "r": 232.30058, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "<td>", "bbox": {"l": 234.19427000000002, "t": 355.28836000000007, "r": 247.84079000000003, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "</td>", "bbox": {"l": 249.73447999999996, "t": 355.28836000000007, "r": 265.27469, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "<td>", "bbox": {"l": 267.1684, "t": 355.28836000000007, "r": 280.81488, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "</td>", "bbox": {"l": 282.70862, "t": 355.28836000000007, "r": 298.24881, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "</tr>", "bbox": {"l": 160.67039, "t": 362.10516000000007, "r": 174.68979, "b": 368.49929999999995, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "<tr>", "bbox": {"l": 160.67039, "t": 368.92194, "r": 172.79608, "b": 375.31607, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "<td>", "bbox": {"l": 168.24603, "t": 375.73871, "r": 181.89255, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "</td>", "bbox": {"l": 183.78624, "t": 375.73871, "r": 199.32646, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "<td>", "bbox": {"l": 201.22015, "t": 375.73871, "r": 214.86666999999997, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "</td>", "bbox": {"l": 216.76038, "t": 375.73871, "r": 232.30058, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "<td>", "bbox": {"l": 234.19427000000002, "t": 375.73871, "r": 247.84079000000003, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "</td>", "bbox": {"l": 249.73447999999996, "t": 375.73871, "r": 265.27469, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "<td>", "bbox": {"l": 267.1684, "t": 375.73871, "r": 280.81488, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "</td>", "bbox": {"l": 282.70862, "t": 375.73871, "r": 298.24881, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "</tr>", "bbox": {"l": 160.67039, "t": 382.55551, "r": 174.68979, "b": 388.94965, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "</table>", "bbox": {"l": 153.0947, "t": 389.37228, "r": 177.73259, "b": 395.76642, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "C", "bbox": {"l": 395.06137, "t": 411.33353, "r": 401.62366, "b": 419.85904, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "L", "bbox": {"l": 407.42249, "t": 411.33353, "r": 412.47598, "b": 419.85904, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "U", "bbox": {"l": 418.69287, "t": 411.33353, "r": 425.25516, "b": 419.85904, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "X", "bbox": {"l": 430.5086099999999, "t": 411.33353, "r": 436.5709800000001, "b": 419.85904, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "<table>", "bbox": {"l": 152.36208, "t": 409.77362, "r": 175.10626, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "<tr>", "bbox": {"l": 178.89366, "t": 409.77362, "r": 191.01935, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "</tr>", "bbox": {"l": 194.80676, "t": 409.77362, "r": 208.82614, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "<td>", "bbox": {"l": 212.61354, "t": 409.77362, "r": 226.26003999999998, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "</td>", "bbox": {"l": 230.04745000000003, "t": 409.77362, "r": 245.58765000000002, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "<td", "bbox": {"l": 249.37506000000002, "t": 409.77362, "r": 259.03918, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "colspan=\"2\"", "bbox": {"l": 262.82797, "t": 409.77362, "r": 298.93646, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "colspan=\"3\"", "bbox": {"l": 302.72385, "t": 409.77362, "r": 338.83234, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "rowspan=\"2\"", "bbox": {"l": 152.36208, "t": 418.10522, "r": 190.74123, "b": 424.49936, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "rowspan=\"3\"", "bbox": {"l": 194.52863, "t": 418.10522, "r": 232.90777999999997, "b": 424.49936, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": ">", "bbox": {"l": 236.69518999999997, "t": 418.10522, "r": 240.67617999999996, "b": 424.49936, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "</table>", "bbox": {"l": 244.46358, "t": 418.10522, "r": 269.10144, "b": 424.49936, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "C", "bbox": {"l": 154.50595, "t": 258.60095, "r": 159.62473, "b": 265.70556999999997, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "HTML", "bbox": {"l": 164.74348, "t": 258.60095, "r": 185.21857, "b": 265.70556999999997, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "sequence length:", "bbox": {"l": 164.3548, "t": 266.49707, "r": 222.05352999999997, "b": 273.60168, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "55", "bbox": {"l": 224.15326, "t": 266.49707, "r": 232.57729, "b": 273.60168, "coord_origin": "TOPLEFT"}}], "children": [{"id": 6, "label": "text", "bbox": {"l": 396.41107, "t": 280.98352, "r": 402.97336, "b": 289.50903, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "C", "bbox": {"l": 396.41107, "t": 280.98352, "r": 402.97336, "b": 289.50903, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "text", "bbox": {"l": 418.58682, "t": 280.89792, "r": 425.14911, "b": 289.42343, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "C", "bbox": {"l": 418.58682, "t": 280.89792, "r": 425.14911, "b": 289.42343, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "text", "bbox": {"l": 395.74835, "t": 303.23727, "r": 402.31064, "b": 311.76279, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "C", "bbox": {"l": 395.74835, "t": 303.23727, "r": 402.31064, "b": 311.76279, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 407.54214, "t": 303.36981, "r": 414.10443, "b": 311.89532, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "C", "bbox": {"l": 407.54214, "t": 303.36981, "r": 414.10443, "b": 311.89532, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "text", "bbox": {"l": 407.56335, "t": 314.40619, "r": 414.12564, "b": 322.9317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "C", "bbox": {"l": 407.56335, "t": 314.40619, "r": 414.12564, "b": 322.9317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 418.51108, "t": 292.08502000000004, "r": 425.07336, "b": 300.61053000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "C", "bbox": {"l": 418.51108, "t": 292.08502000000004, "r": 425.07336, "b": 300.61053000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 429.59744, "t": 292.09106, "r": 436.1597300000001, "b": 300.61658, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "C", "bbox": {"l": 429.59744, "t": 292.09106, "r": 436.1597300000001, "b": 300.61658, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 440.68759000000006, "t": 292.01230000000004, "r": 447.24987999999996, "b": 300.53781000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "C", "bbox": {"l": 440.68759000000006, "t": 292.01230000000004, "r": 447.24987999999996, "b": 300.53781000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 418.6232, "t": 303.29483, "r": 425.18549, "b": 311.82034, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "C", "bbox": {"l": 418.6232, "t": 303.29483, "r": 425.18549, "b": 311.82034, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 429.7095299999999, "t": 303.30011, "r": 436.27182, "b": 311.82562, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "C", "bbox": {"l": 429.7095299999999, "t": 303.30011, "r": 436.27182, "b": 311.82562, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 440.7996800000001, "t": 303.22211, "r": 447.36197, "b": 311.74762, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "C", "bbox": {"l": 440.7996800000001, "t": 303.22211, "r": 447.36197, "b": 311.74762, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 418.62546, "t": 314.56903, "r": 425.18774, "b": 323.09454, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "C", "bbox": {"l": 418.62546, "t": 314.56903, "r": 425.18774, "b": 323.09454, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 429.71181999999993, "t": 314.57434, "r": 436.27411, "b": 323.09985, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "C", "bbox": {"l": 429.71181999999993, "t": 314.57434, "r": 436.27411, "b": 323.09985, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 440.80194, "t": 314.49631, "r": 447.36423, "b": 323.02182, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "C", "bbox": {"l": 440.80194, "t": 314.49631, "r": 447.36423, "b": 323.02182, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 407.39746, "t": 325.29031, "r": 413.95975, "b": 333.81583, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "C", "bbox": {"l": 407.39746, "t": 325.29031, "r": 413.95975, "b": 333.81583, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 418.45959, "t": 325.45316, "r": 425.02188, "b": 333.97867, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "C", "bbox": {"l": 418.45959, "t": 325.45316, "r": 425.02188, "b": 333.97867, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 429.54593, "t": 325.4592, "r": 436.10822, "b": 333.98471, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "C", "bbox": {"l": 429.54593, "t": 325.4592, "r": 436.10822, "b": 333.98471, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 440.63608, "t": 325.38043, "r": 447.19836, "b": 333.90594, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "C", "bbox": {"l": 440.63608, "t": 325.38043, "r": 447.19836, "b": 333.90594, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 451.89511000000005, "t": 280.15717, "r": 463.51273000000003, "b": 288.68268, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "NL", "bbox": {"l": 451.89511000000005, "t": 280.15717, "r": 463.51273000000003, "b": 288.68268, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 452.1557, "t": 291.59875000000005, "r": 463.77332, "b": 300.12427, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "NL", "bbox": {"l": 452.1557, "t": 291.59875000000005, "r": 463.77332, "b": 300.12427, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 452.17688000000004, "t": 302.84265, "r": 463.79449000000005, "b": 311.36816, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "NL", "bbox": {"l": 452.17688000000004, "t": 302.84265, "r": 463.79449000000005, "b": 311.36816, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 452.09887999999995, "t": 314.12441999999993, "r": 463.71648999999996, "b": 322.6499299999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "NL", "bbox": {"l": 452.09887999999995, "t": 314.12441999999993, "r": 463.71648999999996, "b": 322.6499299999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 452.29733, "t": 325.46906, "r": 463.91495, "b": 333.99457, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "NL", "bbox": {"l": 452.29733, "t": 325.46906, "r": 463.91495, "b": 333.99457, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 396.09677, "t": 314.49478, "r": 402.65906, "b": 323.02029000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "U", "bbox": {"l": 396.09677, "t": 314.49478, "r": 402.65906, "b": 323.02029000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 395.99829, "t": 325.38876000000005, "r": 402.56058, "b": 333.91428, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "U", "bbox": {"l": 395.99829, "t": 325.38876000000005, "r": 402.56058, "b": 333.91428, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 396.27475, "t": 292.27057, "r": 402.83704, "b": 300.79608, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "U", "bbox": {"l": 396.27475, "t": 292.27057, "r": 402.83704, "b": 300.79608, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 408.54724, "t": 280.96912, "r": 413.60074, "b": 289.49463, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "L", "bbox": {"l": 408.54724, "t": 280.96912, "r": 413.60074, "b": 289.49463, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 430.58966, "t": 280.49725, "r": 435.6431600000001, "b": 289.02277, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "L", "bbox": {"l": 430.58966, "t": 280.49725, "r": 435.6431600000001, "b": 289.02277, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 441.08069, "t": 280.38062, "r": 446.13419, "b": 288.90613, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "L", "bbox": {"l": 441.08069, "t": 280.38062, "r": 446.13419, "b": 288.90613, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 407.97388, "t": 292.13425, "r": 414.03625, "b": 300.65976, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "X", "bbox": {"l": 407.97388, "t": 292.13425, "r": 414.03625, "b": 300.65976, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 441.25640999999996, "t": 411.1807600000001, "r": 452.87402, "b": 419.7062700000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "NL", "bbox": {"l": 441.25640999999996, "t": 411.1807600000001, "r": 452.87402, "b": 419.7062700000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 393.75256, "t": 399.7947700000001, "r": 432.48929, "b": 406.89935, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "vocabulary:", "bbox": {"l": 393.75256, "t": 399.7947700000001, "r": 432.48929, "b": 406.89935, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 434.5896000000001, "t": 399.7947700000001, "r": 438.80083999999994, "b": 406.89935, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "5", "bbox": {"l": 434.5896000000001, "t": 399.7947700000001, "r": 438.80083999999994, "b": 406.89935, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 440.90573, "t": 399.7947700000001, "r": 463.22235, "b": 406.89935, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "tokens", "bbox": {"l": 440.90573, "t": 399.7947700000001, "r": 463.22235, "b": 406.89935, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 384.11816, "t": 258.54718, "r": 413.99307, "b": 265.65179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "D OTSL", "bbox": {"l": 384.11816, "t": 258.54718, "r": 413.99307, "b": 265.65179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 393.75256, "t": 266.67505000000006, "r": 451.45129000000003, "b": 273.77966000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "sequence length:", "bbox": {"l": 393.75256, "t": 266.67505000000006, "r": 451.45129000000003, "b": 273.77966000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 453.55083999999994, "t": 266.67505000000006, "r": 461.97485, "b": 273.77966000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "30", "bbox": {"l": 453.55083999999994, "t": 266.67505000000006, "r": 461.97485, "b": 273.77966000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 151.79318, "t": 399.76016, "r": 233.89371000000003, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "vocabulary for this table:", "bbox": {"l": 151.79318, "t": 399.76016, "r": 233.89371000000003, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 235.99332, "t": 399.76016, "r": 244.41734000000002, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "12", "bbox": {"l": 235.99332, "t": 399.76016, "r": 244.41734000000002, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 246.52222, "t": 399.76016, "r": 268.83884, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "tokens", "bbox": {"l": 246.52222, "t": 399.76016, "r": 268.83884, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 154.3298, "t": 213.57457999999997, "r": 159.79837, "b": 220.67920000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "A", "bbox": {"l": 154.3298, "t": 213.57457999999997, "r": 159.79837, "b": 220.67920000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 321.07053, "t": 213.57457999999997, "r": 326.53909, "b": 220.67920000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "B", "bbox": {"l": 321.07053, "t": 213.57457999999997, "r": 326.53909, "b": 220.67920000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 153.0947, "t": 280.30411, "r": 175.83888, "b": 286.69824, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "<table>", "bbox": {"l": 153.0947, "t": 280.30411, "r": 175.83888, "b": 286.69824, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 160.67039, "t": 287.12088, "r": 172.79608, "b": 293.51501, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "<tr>", "bbox": {"l": 160.67039, "t": 287.12088, "r": 172.79608, "b": 293.51501, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 168.24603, "t": 293.93765, "r": 177.91019, "b": 300.33179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "<td", "bbox": {"l": 168.24603, "t": 293.93765, "r": 177.91019, "b": 300.33179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 179.80525, "t": 293.93765, "r": 215.61517, "b": 300.33179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "colspan=\u201c2\u201d", "bbox": {"l": 179.80525, "t": 293.93765, "r": 215.61517, "b": 300.33179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 217.50886999999997, "t": 293.93765, "r": 255.58945, "b": 300.33179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "rowspan=\u201c2\u201d", "bbox": {"l": 217.50886999999997, "t": 293.93765, "r": 255.58945, "b": 300.33179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 257.48315, "t": 293.93765, "r": 261.46414, "b": 300.33179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": ">", "bbox": {"l": 257.48315, "t": 293.93765, "r": 261.46414, "b": 300.33179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 263.35785, "t": 293.93765, "r": 278.89804, "b": 300.33179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "</td>", "bbox": {"l": 263.35785, "t": 293.93765, "r": 278.89804, "b": 300.33179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 280.79175, "t": 293.93765, "r": 290.4559, "b": 300.33179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "<td", "bbox": {"l": 280.79175, "t": 293.93765, "r": 290.4559, "b": 300.33179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 292.35095, "t": 293.93765, "r": 328.16083, "b": 300.33179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "colspan=\u201c3\u201d", "bbox": {"l": 292.35095, "t": 293.93765, "r": 328.16083, "b": 300.33179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 330.05457, "t": 293.93765, "r": 334.03555, "b": 300.33179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": ">", "bbox": {"l": 330.05457, "t": 293.93765, "r": 334.03555, "b": 300.33179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 335.92926, "t": 293.93765, "r": 351.46945, "b": 300.33179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "</td>", "bbox": {"l": 335.92926, "t": 293.93765, "r": 351.46945, "b": 300.33179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 160.67039, "t": 300.75442999999996, "r": 174.68979, "b": 307.14856, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "</tr>", "bbox": {"l": 160.67039, "t": 300.75442999999996, "r": 174.68979, "b": 307.14856, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 160.67039, "t": 307.57122999999996, "r": 172.79608, "b": 313.96536, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "<tr>", "bbox": {"l": 160.67039, "t": 307.57122999999996, "r": 172.79608, "b": 313.96536, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 168.24603, "t": 314.388, "r": 181.89255, "b": 320.78214, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "<td>", "bbox": {"l": 168.24603, "t": 314.388, "r": 181.89255, "b": 320.78214, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 183.78624, "t": 314.388, "r": 199.32646, "b": 320.78214, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "</td>", "bbox": {"l": 183.78624, "t": 314.388, "r": 199.32646, "b": 320.78214, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 201.22015, "t": 314.388, "r": 214.86666999999997, "b": 320.78214, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "<td>", "bbox": {"l": 201.22015, "t": 314.388, "r": 214.86666999999997, "b": 320.78214, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 216.76038, "t": 314.388, "r": 232.30058, "b": 320.78214, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "</td>", "bbox": {"l": 216.76038, "t": 314.388, "r": 232.30058, "b": 320.78214, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 234.19427000000002, "t": 314.388, "r": 247.84079000000003, "b": 320.78214, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "<td>", "bbox": {"l": 234.19427000000002, "t": 314.388, "r": 247.84079000000003, "b": 320.78214, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 249.73447999999996, "t": 314.388, "r": 265.27469, "b": 320.78214, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "</td>", "bbox": {"l": 249.73447999999996, "t": 314.388, "r": 265.27469, "b": 320.78214, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 160.67039, "t": 321.20477, "r": 174.68979, "b": 327.59890999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "</tr>", "bbox": {"l": 160.67039, "t": 321.20477, "r": 174.68979, "b": 327.59890999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 160.67039, "t": 328.02158, "r": 172.79608, "b": 334.41571000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "<tr>", "bbox": {"l": 160.67039, "t": 328.02158, "r": 172.79608, "b": 334.41571000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 168.24603, "t": 334.83835, "r": 373.09091, "b": 341.23248, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "<td rowspan=\u201c3\u201d > </td> <td> </td> <td> </td> <td> </td> <td> </td>", "bbox": {"l": 168.24603, "t": 334.83835, "r": 373.09091, "b": 341.23248, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 160.67039, "t": 341.65512, "r": 174.68979, "b": 348.04926, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "</tr>", "bbox": {"l": 160.67039, "t": 341.65512, "r": 174.68979, "b": 348.04926, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 160.67039, "t": 348.47159, "r": 172.79608, "b": 354.86572, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "<tr>", "bbox": {"l": 160.67039, "t": 348.47159, "r": 172.79608, "b": 354.86572, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 168.24603, "t": 355.28836000000007, "r": 181.89255, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "<td>", "bbox": {"l": 168.24603, "t": 355.28836000000007, "r": 181.89255, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 183.78624, "t": 355.28836000000007, "r": 199.32646, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "</td>", "bbox": {"l": 183.78624, "t": 355.28836000000007, "r": 199.32646, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 201.22015, "t": 355.28836000000007, "r": 214.86666999999997, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "<td>", "bbox": {"l": 201.22015, "t": 355.28836000000007, "r": 214.86666999999997, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 216.76038, "t": 355.28836000000007, "r": 232.30058, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "</td>", "bbox": {"l": 216.76038, "t": 355.28836000000007, "r": 232.30058, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 234.19427000000002, "t": 355.28836000000007, "r": 247.84079000000003, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "<td>", "bbox": {"l": 234.19427000000002, "t": 355.28836000000007, "r": 247.84079000000003, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 249.73447999999996, "t": 355.28836000000007, "r": 265.27469, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "</td>", "bbox": {"l": 249.73447999999996, "t": 355.28836000000007, "r": 265.27469, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 267.1684, "t": 355.28836000000007, "r": 280.81488, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "<td>", "bbox": {"l": 267.1684, "t": 355.28836000000007, "r": 280.81488, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 282.70862, "t": 355.28836000000007, "r": 298.24881, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "</td>", "bbox": {"l": 282.70862, "t": 355.28836000000007, "r": 298.24881, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 160.67039, "t": 362.10516000000007, "r": 174.68979, "b": 368.49929999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "</tr>", "bbox": {"l": 160.67039, "t": 362.10516000000007, "r": 174.68979, "b": 368.49929999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 160.67039, "t": 368.92194, "r": 172.79608, "b": 375.31607, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "<tr>", "bbox": {"l": 160.67039, "t": 368.92194, "r": 172.79608, "b": 375.31607, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 168.24603, "t": 375.73871, "r": 181.89255, "b": 382.13284, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "<td>", "bbox": {"l": 168.24603, "t": 375.73871, "r": 181.89255, "b": 382.13284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 183.78624, "t": 375.73871, "r": 199.32646, "b": 382.13284, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "</td>", "bbox": {"l": 183.78624, "t": 375.73871, "r": 199.32646, "b": 382.13284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 201.22015, "t": 375.73871, "r": 214.86666999999997, "b": 382.13284, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "<td>", "bbox": {"l": 201.22015, "t": 375.73871, "r": 214.86666999999997, "b": 382.13284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 216.76038, "t": 375.73871, "r": 232.30058, "b": 382.13284, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "</td>", "bbox": {"l": 216.76038, "t": 375.73871, "r": 232.30058, "b": 382.13284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 234.19427000000002, "t": 375.73871, "r": 247.84079000000003, "b": 382.13284, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "<td>", "bbox": {"l": 234.19427000000002, "t": 375.73871, "r": 247.84079000000003, "b": 382.13284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 249.73447999999996, "t": 375.73871, "r": 265.27469, "b": 382.13284, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "</td>", "bbox": {"l": 249.73447999999996, "t": 375.73871, "r": 265.27469, "b": 382.13284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 267.1684, "t": 375.73871, "r": 280.81488, "b": 382.13284, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "<td>", "bbox": {"l": 267.1684, "t": 375.73871, "r": 280.81488, "b": 382.13284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 282.70862, "t": 375.73871, "r": 298.24881, "b": 382.13284, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "</td>", "bbox": {"l": 282.70862, "t": 375.73871, "r": 298.24881, "b": 382.13284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 160.67039, "t": 382.55551, "r": 174.68979, "b": 388.94965, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "</tr>", "bbox": {"l": 160.67039, "t": 382.55551, "r": 174.68979, "b": 388.94965, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 153.0947, "t": 389.37228, "r": 177.73259, "b": 395.76642, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "</table>", "bbox": {"l": 153.0947, "t": 389.37228, "r": 177.73259, "b": 395.76642, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 395.06137, "t": 411.33353, "r": 401.62366, "b": 419.85904, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "C", "bbox": {"l": 395.06137, "t": 411.33353, "r": 401.62366, "b": 419.85904, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 407.42249, "t": 411.33353, "r": 412.47598, "b": 419.85904, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "L", "bbox": {"l": 407.42249, "t": 411.33353, "r": 412.47598, "b": 419.85904, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 418.69287, "t": 411.33353, "r": 425.25516, "b": 419.85904, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "U", "bbox": {"l": 418.69287, "t": 411.33353, "r": 425.25516, "b": 419.85904, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 430.5086099999999, "t": 411.33353, "r": 436.5709800000001, "b": 419.85904, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "X", "bbox": {"l": 430.5086099999999, "t": 411.33353, "r": 436.5709800000001, "b": 419.85904, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 152.36208, "t": 409.77362, "r": 175.10626, "b": 416.16776, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "<table>", "bbox": {"l": 152.36208, "t": 409.77362, "r": 175.10626, "b": 416.16776, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 178.89366, "t": 409.77362, "r": 191.01935, "b": 416.16776, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": "<tr>", "bbox": {"l": 178.89366, "t": 409.77362, "r": 191.01935, "b": 416.16776, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 194.80676, "t": 409.77362, "r": 208.82614, "b": 416.16776, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "</tr>", "bbox": {"l": 194.80676, "t": 409.77362, "r": 208.82614, "b": 416.16776, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 212.61354, "t": 409.77362, "r": 226.26003999999998, "b": 416.16776, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "<td>", "bbox": {"l": 212.61354, "t": 409.77362, "r": 226.26003999999998, "b": 416.16776, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 230.04745000000003, "t": 409.77362, "r": 245.58765000000002, "b": 416.16776, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": "</td>", "bbox": {"l": 230.04745000000003, "t": 409.77362, "r": 245.58765000000002, "b": 416.16776, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 249.37506000000002, "t": 409.77362, "r": 259.03918, "b": 416.16776, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 107, "text": "<td", "bbox": {"l": 249.37506000000002, "t": 409.77362, "r": 259.03918, "b": 416.16776, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 262.82797, "t": 409.77362, "r": 298.93646, "b": 416.16776, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 108, "text": "colspan=\"2\"", "bbox": {"l": 262.82797, "t": 409.77362, "r": 298.93646, "b": 416.16776, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 302.72385, "t": 409.77362, "r": 338.83234, "b": 416.16776, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 109, "text": "colspan=\"3\"", "bbox": {"l": 302.72385, "t": 409.77362, "r": 338.83234, "b": 416.16776, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 152.36208, "t": 418.10522, "r": 190.74123, "b": 424.49936, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 110, "text": "rowspan=\"2\"", "bbox": {"l": 152.36208, "t": 418.10522, "r": 190.74123, "b": 424.49936, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 194.52863, "t": 418.10522, "r": 232.90777999999997, "b": 424.49936, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 111, "text": "rowspan=\"3\"", "bbox": {"l": 194.52863, "t": 418.10522, "r": 232.90777999999997, "b": 424.49936, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 236.69518999999997, "t": 418.10522, "r": 240.67617999999996, "b": 424.49936, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 112, "text": ">", "bbox": {"l": 236.69518999999997, "t": 418.10522, "r": 240.67617999999996, "b": 424.49936, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 244.46358, "t": 418.10522, "r": 269.10144, "b": 424.49936, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 113, "text": "</table>", "bbox": {"l": 244.46358, "t": 418.10522, "r": 269.10144, "b": 424.49936, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 154.50595, "t": 258.60095, "r": 159.62473, "b": 265.70556999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 114, "text": "C", "bbox": {"l": 154.50595, "t": 258.60095, "r": 159.62473, "b": 265.70556999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 164.74348, "t": 258.60095, "r": 185.21857, "b": 265.70556999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 115, "text": "HTML", "bbox": {"l": 164.74348, "t": 258.60095, "r": 185.21857, "b": 265.70556999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 164.3548, "t": 266.49707, "r": 222.05352999999997, "b": 273.60168, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 116, "text": "sequence length:", "bbox": {"l": 164.3548, "t": 266.49707, "r": 222.05352999999997, "b": 273.60168, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 224.15326, "t": 266.49707, "r": 232.57729, "b": 273.60168, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 117, "text": "55", "bbox": {"l": 224.15326, "t": 266.49707, "r": 232.57729, "b": 273.60168, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 2, "label": "text", "bbox": {"l": 134.765, "t": 452.31378, "r": 480.59232000000003, "b": 520.88669, "coord_origin": "TOPLEFT"}, "confidence": 0.950499951839447, "cells": [{"id": 118, "text": "today,", "bbox": {"l": 134.765, "t": 452.31378, "r": 161.32928, "b": 461.11075, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "table detection", "bbox": {"l": 164.269, "t": 452.31378, "r": 226.28617999999997, "b": 461.11075, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "in documents is a well understood problem, and the latest", "bbox": {"l": 229.992, "t": 452.31378, "r": 480.59232000000003, "b": 461.11075, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "state-of-the-art (SOTA) object detection methods provide an accuracy compa-", "bbox": {"l": 134.76501, "t": 464.26877, "r": 480.59180000000003, "b": 473.06573, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "rable to human observers [7,8,10,14,23]. On the other hand, the problem of table", "bbox": {"l": 134.76501, "t": 476.22375, "r": 480.58673, "b": 485.02072, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "structure recognition (TSR) is a lot more challenging and remains a very active", "bbox": {"l": 134.76501, "t": 488.17975, "r": 480.58658, "b": 496.97672, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "area of research, in which many novel machine learning algorithms are being", "bbox": {"l": 134.76501, "t": 500.13474, "r": 480.58978, "b": 508.9317, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "explored [3,4,5,9,11,12,13,14,17,18,21,22].", "bbox": {"l": 134.76501, "t": 512.0897199999999, "r": 313.24597, "b": 520.88669, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 134.76501, "t": 524.55072, "r": 480.59482, "b": 664.8547, "coord_origin": "TOPLEFT"}, "confidence": 0.9845512509346008, "cells": [{"id": 126, "text": "Recently emerging SOTA methods for table structure recognition employ", "bbox": {"l": 149.70901, "t": 524.55072, "r": 480.58884000000006, "b": 533.3476900000001, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "transformer-based models, in which an image of the table is provided to the net-", "bbox": {"l": 134.76501, "t": 536.50671, "r": 480.5917400000001, "b": 545.30368, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "work in order to predict the structure of the table as a sequence of tokens. These", "bbox": {"l": 134.76501, "t": 548.46172, "r": 480.58868, "b": 557.25868, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "image-to-sequence (Im2Seq) models are extremely powerful, since they allow for", "bbox": {"l": 134.76501, "t": 560.41672, "r": 480.58795, "b": 569.2136800000001, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "a purely data-driven solution. The tokens of the sequence typically belong to a", "bbox": {"l": 134.76501, "t": 572.37172, "r": 480.58978, "b": 581.16869, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "markup language such as HTML, Latex or Markdown, which allow to describe", "bbox": {"l": 134.76501, "t": 584.32672, "r": 480.59479, "b": 593.12369, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "table structure as rows, columns and spanning cells in various configurations.", "bbox": {"l": 134.76501, "t": 596.28271, "r": 480.58678999999995, "b": 605.0796799999999, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "In Figure 1, we illustrate how HTML is used to represent the table-structure", "bbox": {"l": 134.76501, "t": 608.23772, "r": 480.59476, "b": 617.03468, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "of a particular example table. Public table-structure data sets such as PubTab-", "bbox": {"l": 134.76501, "t": 620.19272, "r": 480.5938100000001, "b": 628.98969, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "Net [22], and FinTabNet [21], which were created in a semi-automated way from", "bbox": {"l": 134.76501, "t": 632.1477199999999, "r": 480.59482, "b": 640.94469, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "paired PDF and HTML sources (e.g. PubMed Central), popularized primarily", "bbox": {"l": 134.76501, "t": 644.10272, "r": 480.58771, "b": 652.89969, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "the use of HTML as ground-truth representation format for TSR.", "bbox": {"l": 134.76501, "t": 656.05772, "r": 421.45377, "b": 664.8547, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_header", "id": 5, "page_no": 1, "cluster": {"id": 5, "label": "page_header", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8580349683761597, "cells": [{"id": 0, "text": "2", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2"}, {"label": "page_header", "id": 3, "page_no": 1, "cluster": {"id": 3, "label": "page_header", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9076642990112305, "cells": [{"id": 1, "text": "M.", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 178.07675, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37415, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "M. Lysak, et al."}, {"label": "caption", "id": 4, "page_no": 1, "cluster": {"id": 4, "label": "caption", "bbox": {"l": 134.765, "t": 126.33416999999997, "r": 480.59189, "b": 200.22058000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.8939083218574524, "cells": [{"id": 3, "text": "Fig. 1.", "bbox": {"l": 134.765, "t": 126.33416999999997, "r": 162.64424, "b": 134.26049999999998, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Comparison between HTML and OTSL table structure representation: (A)", "bbox": {"l": 167.062, "t": 126.39697000000001, "r": 480.59106, "b": 134.46667000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "table-example with complex row and column headers, including a 2D empty span,", "bbox": {"l": 134.765, "t": 137.35595999999998, "r": 480.59018, "b": 145.42566, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "(B)", "bbox": {"l": 134.765, "t": 148.31493999999998, "r": 147.95433, "b": 156.38464, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "minimal graphical representation of table structure using rectangular layout, (C)", "bbox": {"l": 152.39224, "t": 148.31493999999998, "r": 480.59096999999997, "b": 156.38464, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "HTML representation, (D) OTSL representation. This example demonstrates many of", "bbox": {"l": 134.765, "t": 159.27392999999995, "r": 480.59189, "b": 167.34362999999996, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "the key-features of OTSL, namely its reduced vocabulary size (12 versus 5 in this case),", "bbox": {"l": 134.765, "t": 170.23290999999995, "r": 480.58914000000004, "b": 178.30260999999996, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "its reduced sequence length (55 versus 30) and a enhanced internal structure (variable", "bbox": {"l": 134.765, "t": 181.19188999999994, "r": 480.59020999999996, "b": 189.26160000000004, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "token sequence length per row in HTML versus a fixed length of rows in OTSL).", "bbox": {"l": 134.765, "t": 192.15088000000003, "r": 460.87109, "b": 200.22058000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Fig. 1. Comparison between HTML and OTSL table structure representation: (A) table-example with complex row and column headers, including a 2D empty span, (B) minimal graphical representation of table structure using rectangular layout, (C) HTML representation, (D) OTSL representation. This example demonstrates many of the key-features of OTSL, namely its reduced vocabulary size (12 versus 5 in this case), its reduced sequence length (55 versus 30) and a enhanced internal structure (variable token sequence length per row in HTML versus a fixed length of rows in OTSL)."}, {"label": "picture", "id": 1, "page_no": 1, "cluster": {"id": 1, "label": "picture", "bbox": {"l": 148.45364379882812, "t": 208.37423706054688, "r": 464.3608093261719, "b": 425.8462219238281, "coord_origin": "TOPLEFT"}, "confidence": 0.9688959121704102, "cells": [{"id": 12, "text": "C", "bbox": {"l": 396.41107, "t": 280.98352, "r": 402.97336, "b": 289.50903, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "C", "bbox": {"l": 418.58682, "t": 280.89792, "r": 425.14911, "b": 289.42343, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "C", "bbox": {"l": 395.74835, "t": 303.23727, "r": 402.31064, "b": 311.76279, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "C", "bbox": {"l": 407.54214, "t": 303.36981, "r": 414.10443, "b": 311.89532, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "C", "bbox": {"l": 407.56335, "t": 314.40619, "r": 414.12564, "b": 322.9317, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "C", "bbox": {"l": 418.51108, "t": 292.08502000000004, "r": 425.07336, "b": 300.61053000000004, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "C", "bbox": {"l": 429.59744, "t": 292.09106, "r": 436.1597300000001, "b": 300.61658, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "C", "bbox": {"l": 440.68759000000006, "t": 292.01230000000004, "r": 447.24987999999996, "b": 300.53781000000004, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "C", "bbox": {"l": 418.6232, "t": 303.29483, "r": 425.18549, "b": 311.82034, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "C", "bbox": {"l": 429.7095299999999, "t": 303.30011, "r": 436.27182, "b": 311.82562, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "C", "bbox": {"l": 440.7996800000001, "t": 303.22211, "r": 447.36197, "b": 311.74762, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "C", "bbox": {"l": 418.62546, "t": 314.56903, "r": 425.18774, "b": 323.09454, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "C", "bbox": {"l": 429.71181999999993, "t": 314.57434, "r": 436.27411, "b": 323.09985, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "C", "bbox": {"l": 440.80194, "t": 314.49631, "r": 447.36423, "b": 323.02182, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "C", "bbox": {"l": 407.39746, "t": 325.29031, "r": 413.95975, "b": 333.81583, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "C", "bbox": {"l": 418.45959, "t": 325.45316, "r": 425.02188, "b": 333.97867, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "C", "bbox": {"l": 429.54593, "t": 325.4592, "r": 436.10822, "b": 333.98471, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "C", "bbox": {"l": 440.63608, "t": 325.38043, "r": 447.19836, "b": 333.90594, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "NL", "bbox": {"l": 451.89511000000005, "t": 280.15717, "r": 463.51273000000003, "b": 288.68268, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "NL", "bbox": {"l": 452.1557, "t": 291.59875000000005, "r": 463.77332, "b": 300.12427, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "NL", "bbox": {"l": 452.17688000000004, "t": 302.84265, "r": 463.79449000000005, "b": 311.36816, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "NL", "bbox": {"l": 452.09887999999995, "t": 314.12441999999993, "r": 463.71648999999996, "b": 322.6499299999999, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "NL", "bbox": {"l": 452.29733, "t": 325.46906, "r": 463.91495, "b": 333.99457, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "U", "bbox": {"l": 396.09677, "t": 314.49478, "r": 402.65906, "b": 323.02029000000005, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "U", "bbox": {"l": 395.99829, "t": 325.38876000000005, "r": 402.56058, "b": 333.91428, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "U", "bbox": {"l": 396.27475, "t": 292.27057, "r": 402.83704, "b": 300.79608, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "L", "bbox": {"l": 408.54724, "t": 280.96912, "r": 413.60074, "b": 289.49463, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "L", "bbox": {"l": 430.58966, "t": 280.49725, "r": 435.6431600000001, "b": 289.02277, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "L", "bbox": {"l": 441.08069, "t": 280.38062, "r": 446.13419, "b": 288.90613, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "X", "bbox": {"l": 407.97388, "t": 292.13425, "r": 414.03625, "b": 300.65976, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "NL", "bbox": {"l": 441.25640999999996, "t": 411.1807600000001, "r": 452.87402, "b": 419.7062700000001, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "vocabulary:", "bbox": {"l": 393.75256, "t": 399.7947700000001, "r": 432.48929, "b": 406.89935, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "5", "bbox": {"l": 434.5896000000001, "t": 399.7947700000001, "r": 438.80083999999994, "b": 406.89935, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "tokens", "bbox": {"l": 440.90573, "t": 399.7947700000001, "r": 463.22235, "b": 406.89935, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "D OTSL", "bbox": {"l": 384.11816, "t": 258.54718, "r": 413.99307, "b": 265.65179, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "sequence length:", "bbox": {"l": 393.75256, "t": 266.67505000000006, "r": 451.45129000000003, "b": 273.77966000000004, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "30", "bbox": {"l": 453.55083999999994, "t": 266.67505000000006, "r": 461.97485, "b": 273.77966000000004, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "vocabulary for this table:", "bbox": {"l": 151.79318, "t": 399.76016, "r": 233.89371000000003, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "12", "bbox": {"l": 235.99332, "t": 399.76016, "r": 244.41734000000002, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "tokens", "bbox": {"l": 246.52222, "t": 399.76016, "r": 268.83884, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "A", "bbox": {"l": 154.3298, "t": 213.57457999999997, "r": 159.79837, "b": 220.67920000000004, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "B", "bbox": {"l": 321.07053, "t": 213.57457999999997, "r": 326.53909, "b": 220.67920000000004, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "<table>", "bbox": {"l": 153.0947, "t": 280.30411, "r": 175.83888, "b": 286.69824, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "<tr>", "bbox": {"l": 160.67039, "t": 287.12088, "r": 172.79608, "b": 293.51501, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "<td", "bbox": {"l": 168.24603, "t": 293.93765, "r": 177.91019, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "colspan=\u201c2\u201d", "bbox": {"l": 179.80525, "t": 293.93765, "r": 215.61517, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "rowspan=\u201c2\u201d", "bbox": {"l": 217.50886999999997, "t": 293.93765, "r": 255.58945, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": ">", "bbox": {"l": 257.48315, "t": 293.93765, "r": 261.46414, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "</td>", "bbox": {"l": 263.35785, "t": 293.93765, "r": 278.89804, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "<td", "bbox": {"l": 280.79175, "t": 293.93765, "r": 290.4559, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "colspan=\u201c3\u201d", "bbox": {"l": 292.35095, "t": 293.93765, "r": 328.16083, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": ">", "bbox": {"l": 330.05457, "t": 293.93765, "r": 334.03555, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "</td>", "bbox": {"l": 335.92926, "t": 293.93765, "r": 351.46945, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "</tr>", "bbox": {"l": 160.67039, "t": 300.75442999999996, "r": 174.68979, "b": 307.14856, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "<tr>", "bbox": {"l": 160.67039, "t": 307.57122999999996, "r": 172.79608, "b": 313.96536, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "<td>", "bbox": {"l": 168.24603, "t": 314.388, "r": 181.89255, "b": 320.78214, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "</td>", "bbox": {"l": 183.78624, "t": 314.388, "r": 199.32646, "b": 320.78214, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "<td>", "bbox": {"l": 201.22015, "t": 314.388, "r": 214.86666999999997, "b": 320.78214, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "</td>", "bbox": {"l": 216.76038, "t": 314.388, "r": 232.30058, "b": 320.78214, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "<td>", "bbox": {"l": 234.19427000000002, "t": 314.388, "r": 247.84079000000003, "b": 320.78214, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "</td>", "bbox": {"l": 249.73447999999996, "t": 314.388, "r": 265.27469, "b": 320.78214, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "</tr>", "bbox": {"l": 160.67039, "t": 321.20477, "r": 174.68979, "b": 327.59890999999993, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "<tr>", "bbox": {"l": 160.67039, "t": 328.02158, "r": 172.79608, "b": 334.41571000000005, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "<td rowspan=\u201c3\u201d > </td> <td> </td> <td> </td> <td> </td> <td> </td>", "bbox": {"l": 168.24603, "t": 334.83835, "r": 373.09091, "b": 341.23248, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "</tr>", "bbox": {"l": 160.67039, "t": 341.65512, "r": 174.68979, "b": 348.04926, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "<tr>", "bbox": {"l": 160.67039, "t": 348.47159, "r": 172.79608, "b": 354.86572, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "<td>", "bbox": {"l": 168.24603, "t": 355.28836000000007, "r": 181.89255, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "</td>", "bbox": {"l": 183.78624, "t": 355.28836000000007, "r": 199.32646, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "<td>", "bbox": {"l": 201.22015, "t": 355.28836000000007, "r": 214.86666999999997, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "</td>", "bbox": {"l": 216.76038, "t": 355.28836000000007, "r": 232.30058, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "<td>", "bbox": {"l": 234.19427000000002, "t": 355.28836000000007, "r": 247.84079000000003, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "</td>", "bbox": {"l": 249.73447999999996, "t": 355.28836000000007, "r": 265.27469, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "<td>", "bbox": {"l": 267.1684, "t": 355.28836000000007, "r": 280.81488, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "</td>", "bbox": {"l": 282.70862, "t": 355.28836000000007, "r": 298.24881, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "</tr>", "bbox": {"l": 160.67039, "t": 362.10516000000007, "r": 174.68979, "b": 368.49929999999995, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "<tr>", "bbox": {"l": 160.67039, "t": 368.92194, "r": 172.79608, "b": 375.31607, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "<td>", "bbox": {"l": 168.24603, "t": 375.73871, "r": 181.89255, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "</td>", "bbox": {"l": 183.78624, "t": 375.73871, "r": 199.32646, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "<td>", "bbox": {"l": 201.22015, "t": 375.73871, "r": 214.86666999999997, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "</td>", "bbox": {"l": 216.76038, "t": 375.73871, "r": 232.30058, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "<td>", "bbox": {"l": 234.19427000000002, "t": 375.73871, "r": 247.84079000000003, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "</td>", "bbox": {"l": 249.73447999999996, "t": 375.73871, "r": 265.27469, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "<td>", "bbox": {"l": 267.1684, "t": 375.73871, "r": 280.81488, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "</td>", "bbox": {"l": 282.70862, "t": 375.73871, "r": 298.24881, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "</tr>", "bbox": {"l": 160.67039, "t": 382.55551, "r": 174.68979, "b": 388.94965, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "</table>", "bbox": {"l": 153.0947, "t": 389.37228, "r": 177.73259, "b": 395.76642, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "C", "bbox": {"l": 395.06137, "t": 411.33353, "r": 401.62366, "b": 419.85904, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "L", "bbox": {"l": 407.42249, "t": 411.33353, "r": 412.47598, "b": 419.85904, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "U", "bbox": {"l": 418.69287, "t": 411.33353, "r": 425.25516, "b": 419.85904, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "X", "bbox": {"l": 430.5086099999999, "t": 411.33353, "r": 436.5709800000001, "b": 419.85904, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "<table>", "bbox": {"l": 152.36208, "t": 409.77362, "r": 175.10626, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "<tr>", "bbox": {"l": 178.89366, "t": 409.77362, "r": 191.01935, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "</tr>", "bbox": {"l": 194.80676, "t": 409.77362, "r": 208.82614, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "<td>", "bbox": {"l": 212.61354, "t": 409.77362, "r": 226.26003999999998, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "</td>", "bbox": {"l": 230.04745000000003, "t": 409.77362, "r": 245.58765000000002, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "<td", "bbox": {"l": 249.37506000000002, "t": 409.77362, "r": 259.03918, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "colspan=\"2\"", "bbox": {"l": 262.82797, "t": 409.77362, "r": 298.93646, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "colspan=\"3\"", "bbox": {"l": 302.72385, "t": 409.77362, "r": 338.83234, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "rowspan=\"2\"", "bbox": {"l": 152.36208, "t": 418.10522, "r": 190.74123, "b": 424.49936, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "rowspan=\"3\"", "bbox": {"l": 194.52863, "t": 418.10522, "r": 232.90777999999997, "b": 424.49936, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": ">", "bbox": {"l": 236.69518999999997, "t": 418.10522, "r": 240.67617999999996, "b": 424.49936, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "</table>", "bbox": {"l": 244.46358, "t": 418.10522, "r": 269.10144, "b": 424.49936, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "C", "bbox": {"l": 154.50595, "t": 258.60095, "r": 159.62473, "b": 265.70556999999997, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "HTML", "bbox": {"l": 164.74348, "t": 258.60095, "r": 185.21857, "b": 265.70556999999997, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "sequence length:", "bbox": {"l": 164.3548, "t": 266.49707, "r": 222.05352999999997, "b": 273.60168, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "55", "bbox": {"l": 224.15326, "t": 266.49707, "r": 232.57729, "b": 273.60168, "coord_origin": "TOPLEFT"}}], "children": [{"id": 6, "label": "text", "bbox": {"l": 396.41107, "t": 280.98352, "r": 402.97336, "b": 289.50903, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "C", "bbox": {"l": 396.41107, "t": 280.98352, "r": 402.97336, "b": 289.50903, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "text", "bbox": {"l": 418.58682, "t": 280.89792, "r": 425.14911, "b": 289.42343, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "C", "bbox": {"l": 418.58682, "t": 280.89792, "r": 425.14911, "b": 289.42343, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "text", "bbox": {"l": 395.74835, "t": 303.23727, "r": 402.31064, "b": 311.76279, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "C", "bbox": {"l": 395.74835, "t": 303.23727, "r": 402.31064, "b": 311.76279, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 407.54214, "t": 303.36981, "r": 414.10443, "b": 311.89532, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "C", "bbox": {"l": 407.54214, "t": 303.36981, "r": 414.10443, "b": 311.89532, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "text", "bbox": {"l": 407.56335, "t": 314.40619, "r": 414.12564, "b": 322.9317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "C", "bbox": {"l": 407.56335, "t": 314.40619, "r": 414.12564, "b": 322.9317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 418.51108, "t": 292.08502000000004, "r": 425.07336, "b": 300.61053000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "C", "bbox": {"l": 418.51108, "t": 292.08502000000004, "r": 425.07336, "b": 300.61053000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 429.59744, "t": 292.09106, "r": 436.1597300000001, "b": 300.61658, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "C", "bbox": {"l": 429.59744, "t": 292.09106, "r": 436.1597300000001, "b": 300.61658, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 440.68759000000006, "t": 292.01230000000004, "r": 447.24987999999996, "b": 300.53781000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "C", "bbox": {"l": 440.68759000000006, "t": 292.01230000000004, "r": 447.24987999999996, "b": 300.53781000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 418.6232, "t": 303.29483, "r": 425.18549, "b": 311.82034, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "C", "bbox": {"l": 418.6232, "t": 303.29483, "r": 425.18549, "b": 311.82034, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 429.7095299999999, "t": 303.30011, "r": 436.27182, "b": 311.82562, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "C", "bbox": {"l": 429.7095299999999, "t": 303.30011, "r": 436.27182, "b": 311.82562, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 440.7996800000001, "t": 303.22211, "r": 447.36197, "b": 311.74762, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "C", "bbox": {"l": 440.7996800000001, "t": 303.22211, "r": 447.36197, "b": 311.74762, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 418.62546, "t": 314.56903, "r": 425.18774, "b": 323.09454, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "C", "bbox": {"l": 418.62546, "t": 314.56903, "r": 425.18774, "b": 323.09454, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 429.71181999999993, "t": 314.57434, "r": 436.27411, "b": 323.09985, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "C", "bbox": {"l": 429.71181999999993, "t": 314.57434, "r": 436.27411, "b": 323.09985, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 440.80194, "t": 314.49631, "r": 447.36423, "b": 323.02182, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "C", "bbox": {"l": 440.80194, "t": 314.49631, "r": 447.36423, "b": 323.02182, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 407.39746, "t": 325.29031, "r": 413.95975, "b": 333.81583, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "C", "bbox": {"l": 407.39746, "t": 325.29031, "r": 413.95975, "b": 333.81583, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 418.45959, "t": 325.45316, "r": 425.02188, "b": 333.97867, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "C", "bbox": {"l": 418.45959, "t": 325.45316, "r": 425.02188, "b": 333.97867, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 429.54593, "t": 325.4592, "r": 436.10822, "b": 333.98471, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "C", "bbox": {"l": 429.54593, "t": 325.4592, "r": 436.10822, "b": 333.98471, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 440.63608, "t": 325.38043, "r": 447.19836, "b": 333.90594, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "C", "bbox": {"l": 440.63608, "t": 325.38043, "r": 447.19836, "b": 333.90594, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 451.89511000000005, "t": 280.15717, "r": 463.51273000000003, "b": 288.68268, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "NL", "bbox": {"l": 451.89511000000005, "t": 280.15717, "r": 463.51273000000003, "b": 288.68268, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 452.1557, "t": 291.59875000000005, "r": 463.77332, "b": 300.12427, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "NL", "bbox": {"l": 452.1557, "t": 291.59875000000005, "r": 463.77332, "b": 300.12427, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 452.17688000000004, "t": 302.84265, "r": 463.79449000000005, "b": 311.36816, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "NL", "bbox": {"l": 452.17688000000004, "t": 302.84265, "r": 463.79449000000005, "b": 311.36816, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 452.09887999999995, "t": 314.12441999999993, "r": 463.71648999999996, "b": 322.6499299999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "NL", "bbox": {"l": 452.09887999999995, "t": 314.12441999999993, "r": 463.71648999999996, "b": 322.6499299999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 452.29733, "t": 325.46906, "r": 463.91495, "b": 333.99457, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "NL", "bbox": {"l": 452.29733, "t": 325.46906, "r": 463.91495, "b": 333.99457, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 396.09677, "t": 314.49478, "r": 402.65906, "b": 323.02029000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "U", "bbox": {"l": 396.09677, "t": 314.49478, "r": 402.65906, "b": 323.02029000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 395.99829, "t": 325.38876000000005, "r": 402.56058, "b": 333.91428, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "U", "bbox": {"l": 395.99829, "t": 325.38876000000005, "r": 402.56058, "b": 333.91428, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 396.27475, "t": 292.27057, "r": 402.83704, "b": 300.79608, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "U", "bbox": {"l": 396.27475, "t": 292.27057, "r": 402.83704, "b": 300.79608, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 408.54724, "t": 280.96912, "r": 413.60074, "b": 289.49463, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "L", "bbox": {"l": 408.54724, "t": 280.96912, "r": 413.60074, "b": 289.49463, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 430.58966, "t": 280.49725, "r": 435.6431600000001, "b": 289.02277, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "L", "bbox": {"l": 430.58966, "t": 280.49725, "r": 435.6431600000001, "b": 289.02277, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 441.08069, "t": 280.38062, "r": 446.13419, "b": 288.90613, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "L", "bbox": {"l": 441.08069, "t": 280.38062, "r": 446.13419, "b": 288.90613, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 407.97388, "t": 292.13425, "r": 414.03625, "b": 300.65976, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "X", "bbox": {"l": 407.97388, "t": 292.13425, "r": 414.03625, "b": 300.65976, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 441.25640999999996, "t": 411.1807600000001, "r": 452.87402, "b": 419.7062700000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "NL", "bbox": {"l": 441.25640999999996, "t": 411.1807600000001, "r": 452.87402, "b": 419.7062700000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 393.75256, "t": 399.7947700000001, "r": 432.48929, "b": 406.89935, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "vocabulary:", "bbox": {"l": 393.75256, "t": 399.7947700000001, "r": 432.48929, "b": 406.89935, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 434.5896000000001, "t": 399.7947700000001, "r": 438.80083999999994, "b": 406.89935, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "5", "bbox": {"l": 434.5896000000001, "t": 399.7947700000001, "r": 438.80083999999994, "b": 406.89935, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 440.90573, "t": 399.7947700000001, "r": 463.22235, "b": 406.89935, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "tokens", "bbox": {"l": 440.90573, "t": 399.7947700000001, "r": 463.22235, "b": 406.89935, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 384.11816, "t": 258.54718, "r": 413.99307, "b": 265.65179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "D OTSL", "bbox": {"l": 384.11816, "t": 258.54718, "r": 413.99307, "b": 265.65179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 393.75256, "t": 266.67505000000006, "r": 451.45129000000003, "b": 273.77966000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "sequence length:", "bbox": {"l": 393.75256, "t": 266.67505000000006, "r": 451.45129000000003, "b": 273.77966000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 453.55083999999994, "t": 266.67505000000006, "r": 461.97485, "b": 273.77966000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "30", "bbox": {"l": 453.55083999999994, "t": 266.67505000000006, "r": 461.97485, "b": 273.77966000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 151.79318, "t": 399.76016, "r": 233.89371000000003, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "vocabulary for this table:", "bbox": {"l": 151.79318, "t": 399.76016, "r": 233.89371000000003, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 235.99332, "t": 399.76016, "r": 244.41734000000002, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "12", "bbox": {"l": 235.99332, "t": 399.76016, "r": 244.41734000000002, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 246.52222, "t": 399.76016, "r": 268.83884, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "tokens", "bbox": {"l": 246.52222, "t": 399.76016, "r": 268.83884, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 154.3298, "t": 213.57457999999997, "r": 159.79837, "b": 220.67920000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "A", "bbox": {"l": 154.3298, "t": 213.57457999999997, "r": 159.79837, "b": 220.67920000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 321.07053, "t": 213.57457999999997, "r": 326.53909, "b": 220.67920000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "B", "bbox": {"l": 321.07053, "t": 213.57457999999997, "r": 326.53909, "b": 220.67920000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 153.0947, "t": 280.30411, "r": 175.83888, "b": 286.69824, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "<table>", "bbox": {"l": 153.0947, "t": 280.30411, "r": 175.83888, "b": 286.69824, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 160.67039, "t": 287.12088, "r": 172.79608, "b": 293.51501, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "<tr>", "bbox": {"l": 160.67039, "t": 287.12088, "r": 172.79608, "b": 293.51501, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 168.24603, "t": 293.93765, "r": 177.91019, "b": 300.33179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "<td", "bbox": {"l": 168.24603, "t": 293.93765, "r": 177.91019, "b": 300.33179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 179.80525, "t": 293.93765, "r": 215.61517, "b": 300.33179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "colspan=\u201c2\u201d", "bbox": {"l": 179.80525, "t": 293.93765, "r": 215.61517, "b": 300.33179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 217.50886999999997, "t": 293.93765, "r": 255.58945, "b": 300.33179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "rowspan=\u201c2\u201d", "bbox": {"l": 217.50886999999997, "t": 293.93765, "r": 255.58945, "b": 300.33179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 257.48315, "t": 293.93765, "r": 261.46414, "b": 300.33179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": ">", "bbox": {"l": 257.48315, "t": 293.93765, "r": 261.46414, "b": 300.33179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 263.35785, "t": 293.93765, "r": 278.89804, "b": 300.33179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "</td>", "bbox": {"l": 263.35785, "t": 293.93765, "r": 278.89804, "b": 300.33179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 280.79175, "t": 293.93765, "r": 290.4559, "b": 300.33179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "<td", "bbox": {"l": 280.79175, "t": 293.93765, "r": 290.4559, "b": 300.33179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 292.35095, "t": 293.93765, "r": 328.16083, "b": 300.33179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "colspan=\u201c3\u201d", "bbox": {"l": 292.35095, "t": 293.93765, "r": 328.16083, "b": 300.33179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 330.05457, "t": 293.93765, "r": 334.03555, "b": 300.33179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": ">", "bbox": {"l": 330.05457, "t": 293.93765, "r": 334.03555, "b": 300.33179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 335.92926, "t": 293.93765, "r": 351.46945, "b": 300.33179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "</td>", "bbox": {"l": 335.92926, "t": 293.93765, "r": 351.46945, "b": 300.33179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 160.67039, "t": 300.75442999999996, "r": 174.68979, "b": 307.14856, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "</tr>", "bbox": {"l": 160.67039, "t": 300.75442999999996, "r": 174.68979, "b": 307.14856, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 160.67039, "t": 307.57122999999996, "r": 172.79608, "b": 313.96536, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "<tr>", "bbox": {"l": 160.67039, "t": 307.57122999999996, "r": 172.79608, "b": 313.96536, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 168.24603, "t": 314.388, "r": 181.89255, "b": 320.78214, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "<td>", "bbox": {"l": 168.24603, "t": 314.388, "r": 181.89255, "b": 320.78214, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 183.78624, "t": 314.388, "r": 199.32646, "b": 320.78214, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "</td>", "bbox": {"l": 183.78624, "t": 314.388, "r": 199.32646, "b": 320.78214, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 201.22015, "t": 314.388, "r": 214.86666999999997, "b": 320.78214, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "<td>", "bbox": {"l": 201.22015, "t": 314.388, "r": 214.86666999999997, "b": 320.78214, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 216.76038, "t": 314.388, "r": 232.30058, "b": 320.78214, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "</td>", "bbox": {"l": 216.76038, "t": 314.388, "r": 232.30058, "b": 320.78214, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 234.19427000000002, "t": 314.388, "r": 247.84079000000003, "b": 320.78214, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "<td>", "bbox": {"l": 234.19427000000002, "t": 314.388, "r": 247.84079000000003, "b": 320.78214, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 249.73447999999996, "t": 314.388, "r": 265.27469, "b": 320.78214, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "</td>", "bbox": {"l": 249.73447999999996, "t": 314.388, "r": 265.27469, "b": 320.78214, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 160.67039, "t": 321.20477, "r": 174.68979, "b": 327.59890999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "</tr>", "bbox": {"l": 160.67039, "t": 321.20477, "r": 174.68979, "b": 327.59890999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 160.67039, "t": 328.02158, "r": 172.79608, "b": 334.41571000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "<tr>", "bbox": {"l": 160.67039, "t": 328.02158, "r": 172.79608, "b": 334.41571000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 168.24603, "t": 334.83835, "r": 373.09091, "b": 341.23248, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "<td rowspan=\u201c3\u201d > </td> <td> </td> <td> </td> <td> </td> <td> </td>", "bbox": {"l": 168.24603, "t": 334.83835, "r": 373.09091, "b": 341.23248, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 160.67039, "t": 341.65512, "r": 174.68979, "b": 348.04926, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "</tr>", "bbox": {"l": 160.67039, "t": 341.65512, "r": 174.68979, "b": 348.04926, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 160.67039, "t": 348.47159, "r": 172.79608, "b": 354.86572, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "<tr>", "bbox": {"l": 160.67039, "t": 348.47159, "r": 172.79608, "b": 354.86572, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 168.24603, "t": 355.28836000000007, "r": 181.89255, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "<td>", "bbox": {"l": 168.24603, "t": 355.28836000000007, "r": 181.89255, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 183.78624, "t": 355.28836000000007, "r": 199.32646, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "</td>", "bbox": {"l": 183.78624, "t": 355.28836000000007, "r": 199.32646, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 201.22015, "t": 355.28836000000007, "r": 214.86666999999997, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "<td>", "bbox": {"l": 201.22015, "t": 355.28836000000007, "r": 214.86666999999997, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 216.76038, "t": 355.28836000000007, "r": 232.30058, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "</td>", "bbox": {"l": 216.76038, "t": 355.28836000000007, "r": 232.30058, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 234.19427000000002, "t": 355.28836000000007, "r": 247.84079000000003, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "<td>", "bbox": {"l": 234.19427000000002, "t": 355.28836000000007, "r": 247.84079000000003, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 249.73447999999996, "t": 355.28836000000007, "r": 265.27469, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "</td>", "bbox": {"l": 249.73447999999996, "t": 355.28836000000007, "r": 265.27469, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 267.1684, "t": 355.28836000000007, "r": 280.81488, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "<td>", "bbox": {"l": 267.1684, "t": 355.28836000000007, "r": 280.81488, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 282.70862, "t": 355.28836000000007, "r": 298.24881, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "</td>", "bbox": {"l": 282.70862, "t": 355.28836000000007, "r": 298.24881, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 160.67039, "t": 362.10516000000007, "r": 174.68979, "b": 368.49929999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "</tr>", "bbox": {"l": 160.67039, "t": 362.10516000000007, "r": 174.68979, "b": 368.49929999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 160.67039, "t": 368.92194, "r": 172.79608, "b": 375.31607, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "<tr>", "bbox": {"l": 160.67039, "t": 368.92194, "r": 172.79608, "b": 375.31607, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 168.24603, "t": 375.73871, "r": 181.89255, "b": 382.13284, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "<td>", "bbox": {"l": 168.24603, "t": 375.73871, "r": 181.89255, "b": 382.13284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 183.78624, "t": 375.73871, "r": 199.32646, "b": 382.13284, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "</td>", "bbox": {"l": 183.78624, "t": 375.73871, "r": 199.32646, "b": 382.13284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 201.22015, "t": 375.73871, "r": 214.86666999999997, "b": 382.13284, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "<td>", "bbox": {"l": 201.22015, "t": 375.73871, "r": 214.86666999999997, "b": 382.13284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 216.76038, "t": 375.73871, "r": 232.30058, "b": 382.13284, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "</td>", "bbox": {"l": 216.76038, "t": 375.73871, "r": 232.30058, "b": 382.13284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 234.19427000000002, "t": 375.73871, "r": 247.84079000000003, "b": 382.13284, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "<td>", "bbox": {"l": 234.19427000000002, "t": 375.73871, "r": 247.84079000000003, "b": 382.13284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 249.73447999999996, "t": 375.73871, "r": 265.27469, "b": 382.13284, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "</td>", "bbox": {"l": 249.73447999999996, "t": 375.73871, "r": 265.27469, "b": 382.13284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 267.1684, "t": 375.73871, "r": 280.81488, "b": 382.13284, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "<td>", "bbox": {"l": 267.1684, "t": 375.73871, "r": 280.81488, "b": 382.13284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 282.70862, "t": 375.73871, "r": 298.24881, "b": 382.13284, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "</td>", "bbox": {"l": 282.70862, "t": 375.73871, "r": 298.24881, "b": 382.13284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 160.67039, "t": 382.55551, "r": 174.68979, "b": 388.94965, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "</tr>", "bbox": {"l": 160.67039, "t": 382.55551, "r": 174.68979, "b": 388.94965, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 153.0947, "t": 389.37228, "r": 177.73259, "b": 395.76642, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "</table>", "bbox": {"l": 153.0947, "t": 389.37228, "r": 177.73259, "b": 395.76642, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 395.06137, "t": 411.33353, "r": 401.62366, "b": 419.85904, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "C", "bbox": {"l": 395.06137, "t": 411.33353, "r": 401.62366, "b": 419.85904, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 407.42249, "t": 411.33353, "r": 412.47598, "b": 419.85904, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "L", "bbox": {"l": 407.42249, "t": 411.33353, "r": 412.47598, "b": 419.85904, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 418.69287, "t": 411.33353, "r": 425.25516, "b": 419.85904, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "U", "bbox": {"l": 418.69287, "t": 411.33353, "r": 425.25516, "b": 419.85904, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 430.5086099999999, "t": 411.33353, "r": 436.5709800000001, "b": 419.85904, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "X", "bbox": {"l": 430.5086099999999, "t": 411.33353, "r": 436.5709800000001, "b": 419.85904, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 152.36208, "t": 409.77362, "r": 175.10626, "b": 416.16776, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "<table>", "bbox": {"l": 152.36208, "t": 409.77362, "r": 175.10626, "b": 416.16776, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 178.89366, "t": 409.77362, "r": 191.01935, "b": 416.16776, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": "<tr>", "bbox": {"l": 178.89366, "t": 409.77362, "r": 191.01935, "b": 416.16776, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 194.80676, "t": 409.77362, "r": 208.82614, "b": 416.16776, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "</tr>", "bbox": {"l": 194.80676, "t": 409.77362, "r": 208.82614, "b": 416.16776, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 212.61354, "t": 409.77362, "r": 226.26003999999998, "b": 416.16776, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "<td>", "bbox": {"l": 212.61354, "t": 409.77362, "r": 226.26003999999998, "b": 416.16776, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 230.04745000000003, "t": 409.77362, "r": 245.58765000000002, "b": 416.16776, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": "</td>", "bbox": {"l": 230.04745000000003, "t": 409.77362, "r": 245.58765000000002, "b": 416.16776, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 249.37506000000002, "t": 409.77362, "r": 259.03918, "b": 416.16776, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 107, "text": "<td", "bbox": {"l": 249.37506000000002, "t": 409.77362, "r": 259.03918, "b": 416.16776, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 262.82797, "t": 409.77362, "r": 298.93646, "b": 416.16776, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 108, "text": "colspan=\"2\"", "bbox": {"l": 262.82797, "t": 409.77362, "r": 298.93646, "b": 416.16776, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 302.72385, "t": 409.77362, "r": 338.83234, "b": 416.16776, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 109, "text": "colspan=\"3\"", "bbox": {"l": 302.72385, "t": 409.77362, "r": 338.83234, "b": 416.16776, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 152.36208, "t": 418.10522, "r": 190.74123, "b": 424.49936, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 110, "text": "rowspan=\"2\"", "bbox": {"l": 152.36208, "t": 418.10522, "r": 190.74123, "b": 424.49936, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 194.52863, "t": 418.10522, "r": 232.90777999999997, "b": 424.49936, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 111, "text": "rowspan=\"3\"", "bbox": {"l": 194.52863, "t": 418.10522, "r": 232.90777999999997, "b": 424.49936, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 236.69518999999997, "t": 418.10522, "r": 240.67617999999996, "b": 424.49936, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 112, "text": ">", "bbox": {"l": 236.69518999999997, "t": 418.10522, "r": 240.67617999999996, "b": 424.49936, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 244.46358, "t": 418.10522, "r": 269.10144, "b": 424.49936, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 113, "text": "</table>", "bbox": {"l": 244.46358, "t": 418.10522, "r": 269.10144, "b": 424.49936, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 154.50595, "t": 258.60095, "r": 159.62473, "b": 265.70556999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 114, "text": "C", "bbox": {"l": 154.50595, "t": 258.60095, "r": 159.62473, "b": 265.70556999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 164.74348, "t": 258.60095, "r": 185.21857, "b": 265.70556999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 115, "text": "HTML", "bbox": {"l": 164.74348, "t": 258.60095, "r": 185.21857, "b": 265.70556999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 164.3548, "t": 266.49707, "r": 222.05352999999997, "b": 273.60168, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 116, "text": "sequence length:", "bbox": {"l": 164.3548, "t": 266.49707, "r": 222.05352999999997, "b": 273.60168, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 224.15326, "t": 266.49707, "r": 232.57729, "b": 273.60168, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 117, "text": "55", "bbox": {"l": 224.15326, "t": 266.49707, "r": 232.57729, "b": 273.60168, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "text", "id": 2, "page_no": 1, "cluster": {"id": 2, "label": "text", "bbox": {"l": 134.765, "t": 452.31378, "r": 480.59232000000003, "b": 520.88669, "coord_origin": "TOPLEFT"}, "confidence": 0.950499951839447, "cells": [{"id": 118, "text": "today,", "bbox": {"l": 134.765, "t": 452.31378, "r": 161.32928, "b": 461.11075, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "table detection", "bbox": {"l": 164.269, "t": 452.31378, "r": 226.28617999999997, "b": 461.11075, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "in documents is a well understood problem, and the latest", "bbox": {"l": 229.992, "t": 452.31378, "r": 480.59232000000003, "b": 461.11075, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "state-of-the-art (SOTA) object detection methods provide an accuracy compa-", "bbox": {"l": 134.76501, "t": 464.26877, "r": 480.59180000000003, "b": 473.06573, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "rable to human observers [7,8,10,14,23]. On the other hand, the problem of table", "bbox": {"l": 134.76501, "t": 476.22375, "r": 480.58673, "b": 485.02072, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "structure recognition (TSR) is a lot more challenging and remains a very active", "bbox": {"l": 134.76501, "t": 488.17975, "r": 480.58658, "b": 496.97672, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "area of research, in which many novel machine learning algorithms are being", "bbox": {"l": 134.76501, "t": 500.13474, "r": 480.58978, "b": 508.9317, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "explored [3,4,5,9,11,12,13,14,17,18,21,22].", "bbox": {"l": 134.76501, "t": 512.0897199999999, "r": 313.24597, "b": 520.88669, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "today, table detection in documents is a well understood problem, and the latest state-of-the-art (SOTA) object detection methods provide an accuracy comparable to human observers [7,8,10,14,23]. On the other hand, the problem of table structure recognition (TSR) is a lot more challenging and remains a very active area of research, in which many novel machine learning algorithms are being explored [3,4,5,9,11,12,13,14,17,18,21,22]."}, {"label": "text", "id": 0, "page_no": 1, "cluster": {"id": 0, "label": "text", "bbox": {"l": 134.76501, "t": 524.55072, "r": 480.59482, "b": 664.8547, "coord_origin": "TOPLEFT"}, "confidence": 0.9845512509346008, "cells": [{"id": 126, "text": "Recently emerging SOTA methods for table structure recognition employ", "bbox": {"l": 149.70901, "t": 524.55072, "r": 480.58884000000006, "b": 533.3476900000001, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "transformer-based models, in which an image of the table is provided to the net-", "bbox": {"l": 134.76501, "t": 536.50671, "r": 480.5917400000001, "b": 545.30368, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "work in order to predict the structure of the table as a sequence of tokens. These", "bbox": {"l": 134.76501, "t": 548.46172, "r": 480.58868, "b": 557.25868, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "image-to-sequence (Im2Seq) models are extremely powerful, since they allow for", "bbox": {"l": 134.76501, "t": 560.41672, "r": 480.58795, "b": 569.2136800000001, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "a purely data-driven solution. The tokens of the sequence typically belong to a", "bbox": {"l": 134.76501, "t": 572.37172, "r": 480.58978, "b": 581.16869, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "markup language such as HTML, Latex or Markdown, which allow to describe", "bbox": {"l": 134.76501, "t": 584.32672, "r": 480.59479, "b": 593.12369, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "table structure as rows, columns and spanning cells in various configurations.", "bbox": {"l": 134.76501, "t": 596.28271, "r": 480.58678999999995, "b": 605.0796799999999, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "In Figure 1, we illustrate how HTML is used to represent the table-structure", "bbox": {"l": 134.76501, "t": 608.23772, "r": 480.59476, "b": 617.03468, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "of a particular example table. Public table-structure data sets such as PubTab-", "bbox": {"l": 134.76501, "t": 620.19272, "r": 480.5938100000001, "b": 628.98969, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "Net [22], and FinTabNet [21], which were created in a semi-automated way from", "bbox": {"l": 134.76501, "t": 632.1477199999999, "r": 480.59482, "b": 640.94469, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "paired PDF and HTML sources (e.g. PubMed Central), popularized primarily", "bbox": {"l": 134.76501, "t": 644.10272, "r": 480.58771, "b": 652.89969, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "the use of HTML as ground-truth representation format for TSR.", "bbox": {"l": 134.76501, "t": 656.05772, "r": 421.45377, "b": 664.8547, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Recently emerging SOTA methods for table structure recognition employ transformer-based models, in which an image of the table is provided to the network in order to predict the structure of the table as a sequence of tokens. These image-to-sequence (Im2Seq) models are extremely powerful, since they allow for a purely data-driven solution. The tokens of the sequence typically belong to a markup language such as HTML, Latex or Markdown, which allow to describe table structure as rows, columns and spanning cells in various configurations. In Figure 1, we illustrate how HTML is used to represent the table-structure of a particular example table. Public table-structure data sets such as PubTabNet [22], and FinTabNet [21], which were created in a semi-automated way from paired PDF and HTML sources (e.g. PubMed Central), popularized primarily the use of HTML as ground-truth representation format for TSR."}], "body": [{"label": "caption", "id": 4, "page_no": 1, "cluster": {"id": 4, "label": "caption", "bbox": {"l": 134.765, "t": 126.33416999999997, "r": 480.59189, "b": 200.22058000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.8939083218574524, "cells": [{"id": 3, "text": "Fig. 1.", "bbox": {"l": 134.765, "t": 126.33416999999997, "r": 162.64424, "b": 134.26049999999998, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Comparison between HTML and OTSL table structure representation: (A)", "bbox": {"l": 167.062, "t": 126.39697000000001, "r": 480.59106, "b": 134.46667000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "table-example with complex row and column headers, including a 2D empty span,", "bbox": {"l": 134.765, "t": 137.35595999999998, "r": 480.59018, "b": 145.42566, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "(B)", "bbox": {"l": 134.765, "t": 148.31493999999998, "r": 147.95433, "b": 156.38464, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "minimal graphical representation of table structure using rectangular layout, (C)", "bbox": {"l": 152.39224, "t": 148.31493999999998, "r": 480.59096999999997, "b": 156.38464, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "HTML representation, (D) OTSL representation. This example demonstrates many of", "bbox": {"l": 134.765, "t": 159.27392999999995, "r": 480.59189, "b": 167.34362999999996, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "the key-features of OTSL, namely its reduced vocabulary size (12 versus 5 in this case),", "bbox": {"l": 134.765, "t": 170.23290999999995, "r": 480.58914000000004, "b": 178.30260999999996, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "its reduced sequence length (55 versus 30) and a enhanced internal structure (variable", "bbox": {"l": 134.765, "t": 181.19188999999994, "r": 480.59020999999996, "b": 189.26160000000004, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "token sequence length per row in HTML versus a fixed length of rows in OTSL).", "bbox": {"l": 134.765, "t": 192.15088000000003, "r": 460.87109, "b": 200.22058000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Fig. 1. Comparison between HTML and OTSL table structure representation: (A) table-example with complex row and column headers, including a 2D empty span, (B) minimal graphical representation of table structure using rectangular layout, (C) HTML representation, (D) OTSL representation. This example demonstrates many of the key-features of OTSL, namely its reduced vocabulary size (12 versus 5 in this case), its reduced sequence length (55 versus 30) and a enhanced internal structure (variable token sequence length per row in HTML versus a fixed length of rows in OTSL)."}, {"label": "picture", "id": 1, "page_no": 1, "cluster": {"id": 1, "label": "picture", "bbox": {"l": 148.45364379882812, "t": 208.37423706054688, "r": 464.3608093261719, "b": 425.8462219238281, "coord_origin": "TOPLEFT"}, "confidence": 0.9688959121704102, "cells": [{"id": 12, "text": "C", "bbox": {"l": 396.41107, "t": 280.98352, "r": 402.97336, "b": 289.50903, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "C", "bbox": {"l": 418.58682, "t": 280.89792, "r": 425.14911, "b": 289.42343, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "C", "bbox": {"l": 395.74835, "t": 303.23727, "r": 402.31064, "b": 311.76279, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "C", "bbox": {"l": 407.54214, "t": 303.36981, "r": 414.10443, "b": 311.89532, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "C", "bbox": {"l": 407.56335, "t": 314.40619, "r": 414.12564, "b": 322.9317, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "C", "bbox": {"l": 418.51108, "t": 292.08502000000004, "r": 425.07336, "b": 300.61053000000004, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "C", "bbox": {"l": 429.59744, "t": 292.09106, "r": 436.1597300000001, "b": 300.61658, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "C", "bbox": {"l": 440.68759000000006, "t": 292.01230000000004, "r": 447.24987999999996, "b": 300.53781000000004, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "C", "bbox": {"l": 418.6232, "t": 303.29483, "r": 425.18549, "b": 311.82034, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "C", "bbox": {"l": 429.7095299999999, "t": 303.30011, "r": 436.27182, "b": 311.82562, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "C", "bbox": {"l": 440.7996800000001, "t": 303.22211, "r": 447.36197, "b": 311.74762, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "C", "bbox": {"l": 418.62546, "t": 314.56903, "r": 425.18774, "b": 323.09454, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "C", "bbox": {"l": 429.71181999999993, "t": 314.57434, "r": 436.27411, "b": 323.09985, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "C", "bbox": {"l": 440.80194, "t": 314.49631, "r": 447.36423, "b": 323.02182, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "C", "bbox": {"l": 407.39746, "t": 325.29031, "r": 413.95975, "b": 333.81583, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "C", "bbox": {"l": 418.45959, "t": 325.45316, "r": 425.02188, "b": 333.97867, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "C", "bbox": {"l": 429.54593, "t": 325.4592, "r": 436.10822, "b": 333.98471, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "C", "bbox": {"l": 440.63608, "t": 325.38043, "r": 447.19836, "b": 333.90594, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "NL", "bbox": {"l": 451.89511000000005, "t": 280.15717, "r": 463.51273000000003, "b": 288.68268, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "NL", "bbox": {"l": 452.1557, "t": 291.59875000000005, "r": 463.77332, "b": 300.12427, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "NL", "bbox": {"l": 452.17688000000004, "t": 302.84265, "r": 463.79449000000005, "b": 311.36816, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "NL", "bbox": {"l": 452.09887999999995, "t": 314.12441999999993, "r": 463.71648999999996, "b": 322.6499299999999, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "NL", "bbox": {"l": 452.29733, "t": 325.46906, "r": 463.91495, "b": 333.99457, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "U", "bbox": {"l": 396.09677, "t": 314.49478, "r": 402.65906, "b": 323.02029000000005, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "U", "bbox": {"l": 395.99829, "t": 325.38876000000005, "r": 402.56058, "b": 333.91428, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "U", "bbox": {"l": 396.27475, "t": 292.27057, "r": 402.83704, "b": 300.79608, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "L", "bbox": {"l": 408.54724, "t": 280.96912, "r": 413.60074, "b": 289.49463, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "L", "bbox": {"l": 430.58966, "t": 280.49725, "r": 435.6431600000001, "b": 289.02277, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "L", "bbox": {"l": 441.08069, "t": 280.38062, "r": 446.13419, "b": 288.90613, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "X", "bbox": {"l": 407.97388, "t": 292.13425, "r": 414.03625, "b": 300.65976, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "NL", "bbox": {"l": 441.25640999999996, "t": 411.1807600000001, "r": 452.87402, "b": 419.7062700000001, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "vocabulary:", "bbox": {"l": 393.75256, "t": 399.7947700000001, "r": 432.48929, "b": 406.89935, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "5", "bbox": {"l": 434.5896000000001, "t": 399.7947700000001, "r": 438.80083999999994, "b": 406.89935, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "tokens", "bbox": {"l": 440.90573, "t": 399.7947700000001, "r": 463.22235, "b": 406.89935, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "D OTSL", "bbox": {"l": 384.11816, "t": 258.54718, "r": 413.99307, "b": 265.65179, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "sequence length:", "bbox": {"l": 393.75256, "t": 266.67505000000006, "r": 451.45129000000003, "b": 273.77966000000004, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "30", "bbox": {"l": 453.55083999999994, "t": 266.67505000000006, "r": 461.97485, "b": 273.77966000000004, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "vocabulary for this table:", "bbox": {"l": 151.79318, "t": 399.76016, "r": 233.89371000000003, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "12", "bbox": {"l": 235.99332, "t": 399.76016, "r": 244.41734000000002, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "tokens", "bbox": {"l": 246.52222, "t": 399.76016, "r": 268.83884, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "A", "bbox": {"l": 154.3298, "t": 213.57457999999997, "r": 159.79837, "b": 220.67920000000004, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "B", "bbox": {"l": 321.07053, "t": 213.57457999999997, "r": 326.53909, "b": 220.67920000000004, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "<table>", "bbox": {"l": 153.0947, "t": 280.30411, "r": 175.83888, "b": 286.69824, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "<tr>", "bbox": {"l": 160.67039, "t": 287.12088, "r": 172.79608, "b": 293.51501, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "<td", "bbox": {"l": 168.24603, "t": 293.93765, "r": 177.91019, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "colspan=\u201c2\u201d", "bbox": {"l": 179.80525, "t": 293.93765, "r": 215.61517, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "rowspan=\u201c2\u201d", "bbox": {"l": 217.50886999999997, "t": 293.93765, "r": 255.58945, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": ">", "bbox": {"l": 257.48315, "t": 293.93765, "r": 261.46414, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "</td>", "bbox": {"l": 263.35785, "t": 293.93765, "r": 278.89804, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "<td", "bbox": {"l": 280.79175, "t": 293.93765, "r": 290.4559, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "colspan=\u201c3\u201d", "bbox": {"l": 292.35095, "t": 293.93765, "r": 328.16083, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": ">", "bbox": {"l": 330.05457, "t": 293.93765, "r": 334.03555, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "</td>", "bbox": {"l": 335.92926, "t": 293.93765, "r": 351.46945, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "</tr>", "bbox": {"l": 160.67039, "t": 300.75442999999996, "r": 174.68979, "b": 307.14856, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "<tr>", "bbox": {"l": 160.67039, "t": 307.57122999999996, "r": 172.79608, "b": 313.96536, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "<td>", "bbox": {"l": 168.24603, "t": 314.388, "r": 181.89255, "b": 320.78214, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "</td>", "bbox": {"l": 183.78624, "t": 314.388, "r": 199.32646, "b": 320.78214, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "<td>", "bbox": {"l": 201.22015, "t": 314.388, "r": 214.86666999999997, "b": 320.78214, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "</td>", "bbox": {"l": 216.76038, "t": 314.388, "r": 232.30058, "b": 320.78214, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "<td>", "bbox": {"l": 234.19427000000002, "t": 314.388, "r": 247.84079000000003, "b": 320.78214, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "</td>", "bbox": {"l": 249.73447999999996, "t": 314.388, "r": 265.27469, "b": 320.78214, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "</tr>", "bbox": {"l": 160.67039, "t": 321.20477, "r": 174.68979, "b": 327.59890999999993, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "<tr>", "bbox": {"l": 160.67039, "t": 328.02158, "r": 172.79608, "b": 334.41571000000005, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "<td rowspan=\u201c3\u201d > </td> <td> </td> <td> </td> <td> </td> <td> </td>", "bbox": {"l": 168.24603, "t": 334.83835, "r": 373.09091, "b": 341.23248, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "</tr>", "bbox": {"l": 160.67039, "t": 341.65512, "r": 174.68979, "b": 348.04926, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "<tr>", "bbox": {"l": 160.67039, "t": 348.47159, "r": 172.79608, "b": 354.86572, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "<td>", "bbox": {"l": 168.24603, "t": 355.28836000000007, "r": 181.89255, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "</td>", "bbox": {"l": 183.78624, "t": 355.28836000000007, "r": 199.32646, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "<td>", "bbox": {"l": 201.22015, "t": 355.28836000000007, "r": 214.86666999999997, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "</td>", "bbox": {"l": 216.76038, "t": 355.28836000000007, "r": 232.30058, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "<td>", "bbox": {"l": 234.19427000000002, "t": 355.28836000000007, "r": 247.84079000000003, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "</td>", "bbox": {"l": 249.73447999999996, "t": 355.28836000000007, "r": 265.27469, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "<td>", "bbox": {"l": 267.1684, "t": 355.28836000000007, "r": 280.81488, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "</td>", "bbox": {"l": 282.70862, "t": 355.28836000000007, "r": 298.24881, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "</tr>", "bbox": {"l": 160.67039, "t": 362.10516000000007, "r": 174.68979, "b": 368.49929999999995, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "<tr>", "bbox": {"l": 160.67039, "t": 368.92194, "r": 172.79608, "b": 375.31607, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "<td>", "bbox": {"l": 168.24603, "t": 375.73871, "r": 181.89255, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "</td>", "bbox": {"l": 183.78624, "t": 375.73871, "r": 199.32646, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "<td>", "bbox": {"l": 201.22015, "t": 375.73871, "r": 214.86666999999997, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "</td>", "bbox": {"l": 216.76038, "t": 375.73871, "r": 232.30058, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "<td>", "bbox": {"l": 234.19427000000002, "t": 375.73871, "r": 247.84079000000003, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "</td>", "bbox": {"l": 249.73447999999996, "t": 375.73871, "r": 265.27469, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "<td>", "bbox": {"l": 267.1684, "t": 375.73871, "r": 280.81488, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "</td>", "bbox": {"l": 282.70862, "t": 375.73871, "r": 298.24881, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "</tr>", "bbox": {"l": 160.67039, "t": 382.55551, "r": 174.68979, "b": 388.94965, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "</table>", "bbox": {"l": 153.0947, "t": 389.37228, "r": 177.73259, "b": 395.76642, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "C", "bbox": {"l": 395.06137, "t": 411.33353, "r": 401.62366, "b": 419.85904, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "L", "bbox": {"l": 407.42249, "t": 411.33353, "r": 412.47598, "b": 419.85904, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "U", "bbox": {"l": 418.69287, "t": 411.33353, "r": 425.25516, "b": 419.85904, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "X", "bbox": {"l": 430.5086099999999, "t": 411.33353, "r": 436.5709800000001, "b": 419.85904, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "<table>", "bbox": {"l": 152.36208, "t": 409.77362, "r": 175.10626, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "<tr>", "bbox": {"l": 178.89366, "t": 409.77362, "r": 191.01935, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "</tr>", "bbox": {"l": 194.80676, "t": 409.77362, "r": 208.82614, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "<td>", "bbox": {"l": 212.61354, "t": 409.77362, "r": 226.26003999999998, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "</td>", "bbox": {"l": 230.04745000000003, "t": 409.77362, "r": 245.58765000000002, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "<td", "bbox": {"l": 249.37506000000002, "t": 409.77362, "r": 259.03918, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "colspan=\"2\"", "bbox": {"l": 262.82797, "t": 409.77362, "r": 298.93646, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "colspan=\"3\"", "bbox": {"l": 302.72385, "t": 409.77362, "r": 338.83234, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "rowspan=\"2\"", "bbox": {"l": 152.36208, "t": 418.10522, "r": 190.74123, "b": 424.49936, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "rowspan=\"3\"", "bbox": {"l": 194.52863, "t": 418.10522, "r": 232.90777999999997, "b": 424.49936, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": ">", "bbox": {"l": 236.69518999999997, "t": 418.10522, "r": 240.67617999999996, "b": 424.49936, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "</table>", "bbox": {"l": 244.46358, "t": 418.10522, "r": 269.10144, "b": 424.49936, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "C", "bbox": {"l": 154.50595, "t": 258.60095, "r": 159.62473, "b": 265.70556999999997, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "HTML", "bbox": {"l": 164.74348, "t": 258.60095, "r": 185.21857, "b": 265.70556999999997, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "sequence length:", "bbox": {"l": 164.3548, "t": 266.49707, "r": 222.05352999999997, "b": 273.60168, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "55", "bbox": {"l": 224.15326, "t": 266.49707, "r": 232.57729, "b": 273.60168, "coord_origin": "TOPLEFT"}}], "children": [{"id": 6, "label": "text", "bbox": {"l": 396.41107, "t": 280.98352, "r": 402.97336, "b": 289.50903, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "C", "bbox": {"l": 396.41107, "t": 280.98352, "r": 402.97336, "b": 289.50903, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "text", "bbox": {"l": 418.58682, "t": 280.89792, "r": 425.14911, "b": 289.42343, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "C", "bbox": {"l": 418.58682, "t": 280.89792, "r": 425.14911, "b": 289.42343, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "text", "bbox": {"l": 395.74835, "t": 303.23727, "r": 402.31064, "b": 311.76279, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "C", "bbox": {"l": 395.74835, "t": 303.23727, "r": 402.31064, "b": 311.76279, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 407.54214, "t": 303.36981, "r": 414.10443, "b": 311.89532, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "C", "bbox": {"l": 407.54214, "t": 303.36981, "r": 414.10443, "b": 311.89532, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "text", "bbox": {"l": 407.56335, "t": 314.40619, "r": 414.12564, "b": 322.9317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "C", "bbox": {"l": 407.56335, "t": 314.40619, "r": 414.12564, "b": 322.9317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 418.51108, "t": 292.08502000000004, "r": 425.07336, "b": 300.61053000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "C", "bbox": {"l": 418.51108, "t": 292.08502000000004, "r": 425.07336, "b": 300.61053000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 429.59744, "t": 292.09106, "r": 436.1597300000001, "b": 300.61658, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "C", "bbox": {"l": 429.59744, "t": 292.09106, "r": 436.1597300000001, "b": 300.61658, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 440.68759000000006, "t": 292.01230000000004, "r": 447.24987999999996, "b": 300.53781000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "C", "bbox": {"l": 440.68759000000006, "t": 292.01230000000004, "r": 447.24987999999996, "b": 300.53781000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 418.6232, "t": 303.29483, "r": 425.18549, "b": 311.82034, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "C", "bbox": {"l": 418.6232, "t": 303.29483, "r": 425.18549, "b": 311.82034, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 429.7095299999999, "t": 303.30011, "r": 436.27182, "b": 311.82562, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "C", "bbox": {"l": 429.7095299999999, "t": 303.30011, "r": 436.27182, "b": 311.82562, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 440.7996800000001, "t": 303.22211, "r": 447.36197, "b": 311.74762, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "C", "bbox": {"l": 440.7996800000001, "t": 303.22211, "r": 447.36197, "b": 311.74762, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 418.62546, "t": 314.56903, "r": 425.18774, "b": 323.09454, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "C", "bbox": {"l": 418.62546, "t": 314.56903, "r": 425.18774, "b": 323.09454, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 429.71181999999993, "t": 314.57434, "r": 436.27411, "b": 323.09985, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "C", "bbox": {"l": 429.71181999999993, "t": 314.57434, "r": 436.27411, "b": 323.09985, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 440.80194, "t": 314.49631, "r": 447.36423, "b": 323.02182, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "C", "bbox": {"l": 440.80194, "t": 314.49631, "r": 447.36423, "b": 323.02182, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 407.39746, "t": 325.29031, "r": 413.95975, "b": 333.81583, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "C", "bbox": {"l": 407.39746, "t": 325.29031, "r": 413.95975, "b": 333.81583, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 418.45959, "t": 325.45316, "r": 425.02188, "b": 333.97867, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "C", "bbox": {"l": 418.45959, "t": 325.45316, "r": 425.02188, "b": 333.97867, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 429.54593, "t": 325.4592, "r": 436.10822, "b": 333.98471, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "C", "bbox": {"l": 429.54593, "t": 325.4592, "r": 436.10822, "b": 333.98471, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 440.63608, "t": 325.38043, "r": 447.19836, "b": 333.90594, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "C", "bbox": {"l": 440.63608, "t": 325.38043, "r": 447.19836, "b": 333.90594, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 451.89511000000005, "t": 280.15717, "r": 463.51273000000003, "b": 288.68268, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "NL", "bbox": {"l": 451.89511000000005, "t": 280.15717, "r": 463.51273000000003, "b": 288.68268, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 452.1557, "t": 291.59875000000005, "r": 463.77332, "b": 300.12427, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "NL", "bbox": {"l": 452.1557, "t": 291.59875000000005, "r": 463.77332, "b": 300.12427, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 452.17688000000004, "t": 302.84265, "r": 463.79449000000005, "b": 311.36816, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "NL", "bbox": {"l": 452.17688000000004, "t": 302.84265, "r": 463.79449000000005, "b": 311.36816, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 452.09887999999995, "t": 314.12441999999993, "r": 463.71648999999996, "b": 322.6499299999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "NL", "bbox": {"l": 452.09887999999995, "t": 314.12441999999993, "r": 463.71648999999996, "b": 322.6499299999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 452.29733, "t": 325.46906, "r": 463.91495, "b": 333.99457, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "NL", "bbox": {"l": 452.29733, "t": 325.46906, "r": 463.91495, "b": 333.99457, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 396.09677, "t": 314.49478, "r": 402.65906, "b": 323.02029000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "U", "bbox": {"l": 396.09677, "t": 314.49478, "r": 402.65906, "b": 323.02029000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 395.99829, "t": 325.38876000000005, "r": 402.56058, "b": 333.91428, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "U", "bbox": {"l": 395.99829, "t": 325.38876000000005, "r": 402.56058, "b": 333.91428, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 396.27475, "t": 292.27057, "r": 402.83704, "b": 300.79608, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "U", "bbox": {"l": 396.27475, "t": 292.27057, "r": 402.83704, "b": 300.79608, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 408.54724, "t": 280.96912, "r": 413.60074, "b": 289.49463, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "L", "bbox": {"l": 408.54724, "t": 280.96912, "r": 413.60074, "b": 289.49463, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 430.58966, "t": 280.49725, "r": 435.6431600000001, "b": 289.02277, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "L", "bbox": {"l": 430.58966, "t": 280.49725, "r": 435.6431600000001, "b": 289.02277, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 441.08069, "t": 280.38062, "r": 446.13419, "b": 288.90613, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "L", "bbox": {"l": 441.08069, "t": 280.38062, "r": 446.13419, "b": 288.90613, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 407.97388, "t": 292.13425, "r": 414.03625, "b": 300.65976, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "X", "bbox": {"l": 407.97388, "t": 292.13425, "r": 414.03625, "b": 300.65976, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 441.25640999999996, "t": 411.1807600000001, "r": 452.87402, "b": 419.7062700000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "NL", "bbox": {"l": 441.25640999999996, "t": 411.1807600000001, "r": 452.87402, "b": 419.7062700000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 393.75256, "t": 399.7947700000001, "r": 432.48929, "b": 406.89935, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "vocabulary:", "bbox": {"l": 393.75256, "t": 399.7947700000001, "r": 432.48929, "b": 406.89935, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 434.5896000000001, "t": 399.7947700000001, "r": 438.80083999999994, "b": 406.89935, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "5", "bbox": {"l": 434.5896000000001, "t": 399.7947700000001, "r": 438.80083999999994, "b": 406.89935, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 440.90573, "t": 399.7947700000001, "r": 463.22235, "b": 406.89935, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "tokens", "bbox": {"l": 440.90573, "t": 399.7947700000001, "r": 463.22235, "b": 406.89935, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 384.11816, "t": 258.54718, "r": 413.99307, "b": 265.65179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "D OTSL", "bbox": {"l": 384.11816, "t": 258.54718, "r": 413.99307, "b": 265.65179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 393.75256, "t": 266.67505000000006, "r": 451.45129000000003, "b": 273.77966000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "sequence length:", "bbox": {"l": 393.75256, "t": 266.67505000000006, "r": 451.45129000000003, "b": 273.77966000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 453.55083999999994, "t": 266.67505000000006, "r": 461.97485, "b": 273.77966000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "30", "bbox": {"l": 453.55083999999994, "t": 266.67505000000006, "r": 461.97485, "b": 273.77966000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 151.79318, "t": 399.76016, "r": 233.89371000000003, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "vocabulary for this table:", "bbox": {"l": 151.79318, "t": 399.76016, "r": 233.89371000000003, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 235.99332, "t": 399.76016, "r": 244.41734000000002, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "12", "bbox": {"l": 235.99332, "t": 399.76016, "r": 244.41734000000002, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 246.52222, "t": 399.76016, "r": 268.83884, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "tokens", "bbox": {"l": 246.52222, "t": 399.76016, "r": 268.83884, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 154.3298, "t": 213.57457999999997, "r": 159.79837, "b": 220.67920000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "A", "bbox": {"l": 154.3298, "t": 213.57457999999997, "r": 159.79837, "b": 220.67920000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 321.07053, "t": 213.57457999999997, "r": 326.53909, "b": 220.67920000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "B", "bbox": {"l": 321.07053, "t": 213.57457999999997, "r": 326.53909, "b": 220.67920000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 153.0947, "t": 280.30411, "r": 175.83888, "b": 286.69824, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "<table>", "bbox": {"l": 153.0947, "t": 280.30411, "r": 175.83888, "b": 286.69824, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 160.67039, "t": 287.12088, "r": 172.79608, "b": 293.51501, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "<tr>", "bbox": {"l": 160.67039, "t": 287.12088, "r": 172.79608, "b": 293.51501, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 168.24603, "t": 293.93765, "r": 177.91019, "b": 300.33179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "<td", "bbox": {"l": 168.24603, "t": 293.93765, "r": 177.91019, "b": 300.33179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 179.80525, "t": 293.93765, "r": 215.61517, "b": 300.33179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "colspan=\u201c2\u201d", "bbox": {"l": 179.80525, "t": 293.93765, "r": 215.61517, "b": 300.33179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 217.50886999999997, "t": 293.93765, "r": 255.58945, "b": 300.33179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "rowspan=\u201c2\u201d", "bbox": {"l": 217.50886999999997, "t": 293.93765, "r": 255.58945, "b": 300.33179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 257.48315, "t": 293.93765, "r": 261.46414, "b": 300.33179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": ">", "bbox": {"l": 257.48315, "t": 293.93765, "r": 261.46414, "b": 300.33179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 263.35785, "t": 293.93765, "r": 278.89804, "b": 300.33179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "</td>", "bbox": {"l": 263.35785, "t": 293.93765, "r": 278.89804, "b": 300.33179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 280.79175, "t": 293.93765, "r": 290.4559, "b": 300.33179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "<td", "bbox": {"l": 280.79175, "t": 293.93765, "r": 290.4559, "b": 300.33179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 292.35095, "t": 293.93765, "r": 328.16083, "b": 300.33179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "colspan=\u201c3\u201d", "bbox": {"l": 292.35095, "t": 293.93765, "r": 328.16083, "b": 300.33179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 330.05457, "t": 293.93765, "r": 334.03555, "b": 300.33179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": ">", "bbox": {"l": 330.05457, "t": 293.93765, "r": 334.03555, "b": 300.33179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 335.92926, "t": 293.93765, "r": 351.46945, "b": 300.33179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "</td>", "bbox": {"l": 335.92926, "t": 293.93765, "r": 351.46945, "b": 300.33179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 160.67039, "t": 300.75442999999996, "r": 174.68979, "b": 307.14856, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "</tr>", "bbox": {"l": 160.67039, "t": 300.75442999999996, "r": 174.68979, "b": 307.14856, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 160.67039, "t": 307.57122999999996, "r": 172.79608, "b": 313.96536, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "<tr>", "bbox": {"l": 160.67039, "t": 307.57122999999996, "r": 172.79608, "b": 313.96536, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 168.24603, "t": 314.388, "r": 181.89255, "b": 320.78214, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "<td>", "bbox": {"l": 168.24603, "t": 314.388, "r": 181.89255, "b": 320.78214, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 183.78624, "t": 314.388, "r": 199.32646, "b": 320.78214, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "</td>", "bbox": {"l": 183.78624, "t": 314.388, "r": 199.32646, "b": 320.78214, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 201.22015, "t": 314.388, "r": 214.86666999999997, "b": 320.78214, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "<td>", "bbox": {"l": 201.22015, "t": 314.388, "r": 214.86666999999997, "b": 320.78214, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 216.76038, "t": 314.388, "r": 232.30058, "b": 320.78214, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "</td>", "bbox": {"l": 216.76038, "t": 314.388, "r": 232.30058, "b": 320.78214, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 234.19427000000002, "t": 314.388, "r": 247.84079000000003, "b": 320.78214, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "<td>", "bbox": {"l": 234.19427000000002, "t": 314.388, "r": 247.84079000000003, "b": 320.78214, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 249.73447999999996, "t": 314.388, "r": 265.27469, "b": 320.78214, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "</td>", "bbox": {"l": 249.73447999999996, "t": 314.388, "r": 265.27469, "b": 320.78214, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 160.67039, "t": 321.20477, "r": 174.68979, "b": 327.59890999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "</tr>", "bbox": {"l": 160.67039, "t": 321.20477, "r": 174.68979, "b": 327.59890999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 160.67039, "t": 328.02158, "r": 172.79608, "b": 334.41571000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "<tr>", "bbox": {"l": 160.67039, "t": 328.02158, "r": 172.79608, "b": 334.41571000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 168.24603, "t": 334.83835, "r": 373.09091, "b": 341.23248, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "<td rowspan=\u201c3\u201d > </td> <td> </td> <td> </td> <td> </td> <td> </td>", "bbox": {"l": 168.24603, "t": 334.83835, "r": 373.09091, "b": 341.23248, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 160.67039, "t": 341.65512, "r": 174.68979, "b": 348.04926, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "</tr>", "bbox": {"l": 160.67039, "t": 341.65512, "r": 174.68979, "b": 348.04926, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 160.67039, "t": 348.47159, "r": 172.79608, "b": 354.86572, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "<tr>", "bbox": {"l": 160.67039, "t": 348.47159, "r": 172.79608, "b": 354.86572, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 168.24603, "t": 355.28836000000007, "r": 181.89255, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "<td>", "bbox": {"l": 168.24603, "t": 355.28836000000007, "r": 181.89255, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 183.78624, "t": 355.28836000000007, "r": 199.32646, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "</td>", "bbox": {"l": 183.78624, "t": 355.28836000000007, "r": 199.32646, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 201.22015, "t": 355.28836000000007, "r": 214.86666999999997, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "<td>", "bbox": {"l": 201.22015, "t": 355.28836000000007, "r": 214.86666999999997, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 216.76038, "t": 355.28836000000007, "r": 232.30058, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "</td>", "bbox": {"l": 216.76038, "t": 355.28836000000007, "r": 232.30058, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 234.19427000000002, "t": 355.28836000000007, "r": 247.84079000000003, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "<td>", "bbox": {"l": 234.19427000000002, "t": 355.28836000000007, "r": 247.84079000000003, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 249.73447999999996, "t": 355.28836000000007, "r": 265.27469, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "</td>", "bbox": {"l": 249.73447999999996, "t": 355.28836000000007, "r": 265.27469, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 267.1684, "t": 355.28836000000007, "r": 280.81488, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "<td>", "bbox": {"l": 267.1684, "t": 355.28836000000007, "r": 280.81488, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 282.70862, "t": 355.28836000000007, "r": 298.24881, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "</td>", "bbox": {"l": 282.70862, "t": 355.28836000000007, "r": 298.24881, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 160.67039, "t": 362.10516000000007, "r": 174.68979, "b": 368.49929999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "</tr>", "bbox": {"l": 160.67039, "t": 362.10516000000007, "r": 174.68979, "b": 368.49929999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 160.67039, "t": 368.92194, "r": 172.79608, "b": 375.31607, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "<tr>", "bbox": {"l": 160.67039, "t": 368.92194, "r": 172.79608, "b": 375.31607, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 168.24603, "t": 375.73871, "r": 181.89255, "b": 382.13284, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "<td>", "bbox": {"l": 168.24603, "t": 375.73871, "r": 181.89255, "b": 382.13284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 183.78624, "t": 375.73871, "r": 199.32646, "b": 382.13284, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "</td>", "bbox": {"l": 183.78624, "t": 375.73871, "r": 199.32646, "b": 382.13284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 201.22015, "t": 375.73871, "r": 214.86666999999997, "b": 382.13284, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "<td>", "bbox": {"l": 201.22015, "t": 375.73871, "r": 214.86666999999997, "b": 382.13284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 216.76038, "t": 375.73871, "r": 232.30058, "b": 382.13284, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "</td>", "bbox": {"l": 216.76038, "t": 375.73871, "r": 232.30058, "b": 382.13284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 234.19427000000002, "t": 375.73871, "r": 247.84079000000003, "b": 382.13284, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "<td>", "bbox": {"l": 234.19427000000002, "t": 375.73871, "r": 247.84079000000003, "b": 382.13284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 249.73447999999996, "t": 375.73871, "r": 265.27469, "b": 382.13284, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "</td>", "bbox": {"l": 249.73447999999996, "t": 375.73871, "r": 265.27469, "b": 382.13284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 267.1684, "t": 375.73871, "r": 280.81488, "b": 382.13284, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "<td>", "bbox": {"l": 267.1684, "t": 375.73871, "r": 280.81488, "b": 382.13284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 282.70862, "t": 375.73871, "r": 298.24881, "b": 382.13284, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "</td>", "bbox": {"l": 282.70862, "t": 375.73871, "r": 298.24881, "b": 382.13284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 160.67039, "t": 382.55551, "r": 174.68979, "b": 388.94965, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "</tr>", "bbox": {"l": 160.67039, "t": 382.55551, "r": 174.68979, "b": 388.94965, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 153.0947, "t": 389.37228, "r": 177.73259, "b": 395.76642, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "</table>", "bbox": {"l": 153.0947, "t": 389.37228, "r": 177.73259, "b": 395.76642, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 395.06137, "t": 411.33353, "r": 401.62366, "b": 419.85904, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "C", "bbox": {"l": 395.06137, "t": 411.33353, "r": 401.62366, "b": 419.85904, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 407.42249, "t": 411.33353, "r": 412.47598, "b": 419.85904, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "L", "bbox": {"l": 407.42249, "t": 411.33353, "r": 412.47598, "b": 419.85904, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 418.69287, "t": 411.33353, "r": 425.25516, "b": 419.85904, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "U", "bbox": {"l": 418.69287, "t": 411.33353, "r": 425.25516, "b": 419.85904, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 430.5086099999999, "t": 411.33353, "r": 436.5709800000001, "b": 419.85904, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "X", "bbox": {"l": 430.5086099999999, "t": 411.33353, "r": 436.5709800000001, "b": 419.85904, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 152.36208, "t": 409.77362, "r": 175.10626, "b": 416.16776, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "<table>", "bbox": {"l": 152.36208, "t": 409.77362, "r": 175.10626, "b": 416.16776, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 178.89366, "t": 409.77362, "r": 191.01935, "b": 416.16776, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": "<tr>", "bbox": {"l": 178.89366, "t": 409.77362, "r": 191.01935, "b": 416.16776, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 194.80676, "t": 409.77362, "r": 208.82614, "b": 416.16776, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "</tr>", "bbox": {"l": 194.80676, "t": 409.77362, "r": 208.82614, "b": 416.16776, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 212.61354, "t": 409.77362, "r": 226.26003999999998, "b": 416.16776, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "<td>", "bbox": {"l": 212.61354, "t": 409.77362, "r": 226.26003999999998, "b": 416.16776, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 230.04745000000003, "t": 409.77362, "r": 245.58765000000002, "b": 416.16776, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": "</td>", "bbox": {"l": 230.04745000000003, "t": 409.77362, "r": 245.58765000000002, "b": 416.16776, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 249.37506000000002, "t": 409.77362, "r": 259.03918, "b": 416.16776, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 107, "text": "<td", "bbox": {"l": 249.37506000000002, "t": 409.77362, "r": 259.03918, "b": 416.16776, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 262.82797, "t": 409.77362, "r": 298.93646, "b": 416.16776, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 108, "text": "colspan=\"2\"", "bbox": {"l": 262.82797, "t": 409.77362, "r": 298.93646, "b": 416.16776, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 302.72385, "t": 409.77362, "r": 338.83234, "b": 416.16776, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 109, "text": "colspan=\"3\"", "bbox": {"l": 302.72385, "t": 409.77362, "r": 338.83234, "b": 416.16776, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 152.36208, "t": 418.10522, "r": 190.74123, "b": 424.49936, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 110, "text": "rowspan=\"2\"", "bbox": {"l": 152.36208, "t": 418.10522, "r": 190.74123, "b": 424.49936, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 194.52863, "t": 418.10522, "r": 232.90777999999997, "b": 424.49936, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 111, "text": "rowspan=\"3\"", "bbox": {"l": 194.52863, "t": 418.10522, "r": 232.90777999999997, "b": 424.49936, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 236.69518999999997, "t": 418.10522, "r": 240.67617999999996, "b": 424.49936, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 112, "text": ">", "bbox": {"l": 236.69518999999997, "t": 418.10522, "r": 240.67617999999996, "b": 424.49936, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 244.46358, "t": 418.10522, "r": 269.10144, "b": 424.49936, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 113, "text": "</table>", "bbox": {"l": 244.46358, "t": 418.10522, "r": 269.10144, "b": 424.49936, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 154.50595, "t": 258.60095, "r": 159.62473, "b": 265.70556999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 114, "text": "C", "bbox": {"l": 154.50595, "t": 258.60095, "r": 159.62473, "b": 265.70556999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 164.74348, "t": 258.60095, "r": 185.21857, "b": 265.70556999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 115, "text": "HTML", "bbox": {"l": 164.74348, "t": 258.60095, "r": 185.21857, "b": 265.70556999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 164.3548, "t": 266.49707, "r": 222.05352999999997, "b": 273.60168, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 116, "text": "sequence length:", "bbox": {"l": 164.3548, "t": 266.49707, "r": 222.05352999999997, "b": 273.60168, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 224.15326, "t": 266.49707, "r": 232.57729, "b": 273.60168, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 117, "text": "55", "bbox": {"l": 224.15326, "t": 266.49707, "r": 232.57729, "b": 273.60168, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "text", "id": 2, "page_no": 1, "cluster": {"id": 2, "label": "text", "bbox": {"l": 134.765, "t": 452.31378, "r": 480.59232000000003, "b": 520.88669, "coord_origin": "TOPLEFT"}, "confidence": 0.950499951839447, "cells": [{"id": 118, "text": "today,", "bbox": {"l": 134.765, "t": 452.31378, "r": 161.32928, "b": 461.11075, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "table detection", "bbox": {"l": 164.269, "t": 452.31378, "r": 226.28617999999997, "b": 461.11075, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "in documents is a well understood problem, and the latest", "bbox": {"l": 229.992, "t": 452.31378, "r": 480.59232000000003, "b": 461.11075, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "state-of-the-art (SOTA) object detection methods provide an accuracy compa-", "bbox": {"l": 134.76501, "t": 464.26877, "r": 480.59180000000003, "b": 473.06573, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "rable to human observers [7,8,10,14,23]. On the other hand, the problem of table", "bbox": {"l": 134.76501, "t": 476.22375, "r": 480.58673, "b": 485.02072, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "structure recognition (TSR) is a lot more challenging and remains a very active", "bbox": {"l": 134.76501, "t": 488.17975, "r": 480.58658, "b": 496.97672, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "area of research, in which many novel machine learning algorithms are being", "bbox": {"l": 134.76501, "t": 500.13474, "r": 480.58978, "b": 508.9317, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "explored [3,4,5,9,11,12,13,14,17,18,21,22].", "bbox": {"l": 134.76501, "t": 512.0897199999999, "r": 313.24597, "b": 520.88669, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "today, table detection in documents is a well understood problem, and the latest state-of-the-art (SOTA) object detection methods provide an accuracy comparable to human observers [7,8,10,14,23]. On the other hand, the problem of table structure recognition (TSR) is a lot more challenging and remains a very active area of research, in which many novel machine learning algorithms are being explored [3,4,5,9,11,12,13,14,17,18,21,22]."}, {"label": "text", "id": 0, "page_no": 1, "cluster": {"id": 0, "label": "text", "bbox": {"l": 134.76501, "t": 524.55072, "r": 480.59482, "b": 664.8547, "coord_origin": "TOPLEFT"}, "confidence": 0.9845512509346008, "cells": [{"id": 126, "text": "Recently emerging SOTA methods for table structure recognition employ", "bbox": {"l": 149.70901, "t": 524.55072, "r": 480.58884000000006, "b": 533.3476900000001, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "transformer-based models, in which an image of the table is provided to the net-", "bbox": {"l": 134.76501, "t": 536.50671, "r": 480.5917400000001, "b": 545.30368, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "work in order to predict the structure of the table as a sequence of tokens. These", "bbox": {"l": 134.76501, "t": 548.46172, "r": 480.58868, "b": 557.25868, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "image-to-sequence (Im2Seq) models are extremely powerful, since they allow for", "bbox": {"l": 134.76501, "t": 560.41672, "r": 480.58795, "b": 569.2136800000001, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "a purely data-driven solution. The tokens of the sequence typically belong to a", "bbox": {"l": 134.76501, "t": 572.37172, "r": 480.58978, "b": 581.16869, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "markup language such as HTML, Latex or Markdown, which allow to describe", "bbox": {"l": 134.76501, "t": 584.32672, "r": 480.59479, "b": 593.12369, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "table structure as rows, columns and spanning cells in various configurations.", "bbox": {"l": 134.76501, "t": 596.28271, "r": 480.58678999999995, "b": 605.0796799999999, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "In Figure 1, we illustrate how HTML is used to represent the table-structure", "bbox": {"l": 134.76501, "t": 608.23772, "r": 480.59476, "b": 617.03468, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "of a particular example table. Public table-structure data sets such as PubTab-", "bbox": {"l": 134.76501, "t": 620.19272, "r": 480.5938100000001, "b": 628.98969, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "Net [22], and FinTabNet [21], which were created in a semi-automated way from", "bbox": {"l": 134.76501, "t": 632.1477199999999, "r": 480.59482, "b": 640.94469, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "paired PDF and HTML sources (e.g. PubMed Central), popularized primarily", "bbox": {"l": 134.76501, "t": 644.10272, "r": 480.58771, "b": 652.89969, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "the use of HTML as ground-truth representation format for TSR.", "bbox": {"l": 134.76501, "t": 656.05772, "r": 421.45377, "b": 664.8547, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Recently emerging SOTA methods for table structure recognition employ transformer-based models, in which an image of the table is provided to the network in order to predict the structure of the table as a sequence of tokens. These image-to-sequence (Im2Seq) models are extremely powerful, since they allow for a purely data-driven solution. The tokens of the sequence typically belong to a markup language such as HTML, Latex or Markdown, which allow to describe table structure as rows, columns and spanning cells in various configurations. In Figure 1, we illustrate how HTML is used to represent the table-structure of a particular example table. Public table-structure data sets such as PubTabNet [22], and FinTabNet [21], which were created in a semi-automated way from paired PDF and HTML sources (e.g. PubMed Central), popularized primarily the use of HTML as ground-truth representation format for TSR."}], "headers": [{"label": "page_header", "id": 5, "page_no": 1, "cluster": {"id": 5, "label": "page_header", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8580349683761597, "cells": [{"id": 0, "text": "2", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2"}, {"label": "page_header", "id": 3, "page_no": 1, "cluster": {"id": 3, "label": "page_header", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9076642990112305, "cells": [{"id": 1, "text": "M.", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 178.07675, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37415, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "M. Lysak, et al."}]}}, {"page_no": 2, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "3", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "While the majority of research in TSR is currently focused on the develop-", "bbox": {"l": 149.709, "t": 118.93377999999996, "r": 480.59183, "b": 127.73077, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "ment and application of novel neural model architectures, the table structure", "bbox": {"l": 134.765, "t": 130.88878999999997, "r": 480.58675999999997, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "representation language (e.g. HTML in PubTabNet and FinTabNet) is usually", "bbox": {"l": 134.765, "t": 142.84479, "r": 480.5917400000001, "b": 151.64178000000004, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "adopted", "bbox": {"l": 134.765, "t": 154.7998, "r": 169.62514, "b": 163.59680000000003, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "as is", "bbox": {"l": 173.86099, "t": 154.7998, "r": 194.55531, "b": 163.59680000000003, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "for the sequence tokenization in Im2Seq models. In this paper,", "bbox": {"l": 199.60999, "t": 154.7998, "r": 480.58618, "b": 163.59680000000003, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "we aim for the opposite and investigate the impact of the table structure rep-", "bbox": {"l": 134.76498, "t": 166.75482, "r": 480.59167, "b": 175.55182000000002, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "resentation language with an otherwise unmodified Im2Seq transformer-based", "bbox": {"l": 134.76498, "t": 178.70983999999999, "r": 480.58968999999996, "b": 187.50684, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "architecture. Since the current state-of-the-art Im2Seq model is TableFormer [9],", "bbox": {"l": 134.76498, "t": 190.66485999999998, "r": 480.5917400000001, "b": 199.46185000000003, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "we select this model to perform our experiments.", "bbox": {"l": 134.76498, "t": 202.61987, "r": 348.35519, "b": 211.41687000000002, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "The main contribution of this paper is the introduction of a new optimised ta-", "bbox": {"l": 149.70898, "t": 214.83587999999997, "r": 480.5939, "b": 223.63287000000003, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "ble structure language (OTSL), specifically designed to describe table-structure", "bbox": {"l": 134.76498, "t": 226.79089, "r": 480.5938100000001, "b": 235.58789000000002, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "in an compact and structured way for Im2Seq models. OTSL has a number of", "bbox": {"l": 134.76498, "t": 238.74689, "r": 480.58667, "b": 247.54387999999994, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "key features, which make it very attractive to use in Im2Seq models. Specifically,", "bbox": {"l": 134.76498, "t": 250.70190000000002, "r": 480.5867, "b": 259.49890000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "compared to other languages such as HTML, OTSL has a minimized vocabulary", "bbox": {"l": 134.76498, "t": 262.65692, "r": 480.58771, "b": 271.45392000000004, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "which yields short sequence length, strong inherent structure (e.g. strict rectan-", "bbox": {"l": 134.76498, "t": 274.61194, "r": 480.59572999999995, "b": 283.40891, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "gular layout) and a strict syntax with rules that only look backwards. The latter", "bbox": {"l": 134.76498, "t": 286.56692999999996, "r": 480.59274, "b": 295.36389, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "allows for syntax validation during inference and ensures a syntactically correct", "bbox": {"l": 134.76498, "t": 298.52190999999993, "r": 480.59473, "b": 307.31888, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "table-structure. These OTSL features are illustrated in Figure 1, in comparison", "bbox": {"l": 134.76498, "t": 310.47791, "r": 480.58667, "b": 319.27487, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "to HTML.", "bbox": {"l": 134.76498, "t": 322.43289, "r": 179.72021, "b": 331.22986, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "The paper is structured as follows. In section 2, we give an overview of the", "bbox": {"l": 149.70898, "t": 334.64789, "r": 480.5878000000001, "b": 343.44485000000003, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "latest developments in table-structure reconstruction. In section 3 we review", "bbox": {"l": 134.76498, "t": 346.60388000000006, "r": 480.59375, "b": 355.40085, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "the current HTML table encoding (popularised by PubTabNet and FinTabNet)", "bbox": {"l": 134.76498, "t": 358.55887, "r": 480.58673, "b": 367.3558300000001, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "and discuss its flaws. Subsequently, we introduce OTSL in section 4, which in-", "bbox": {"l": 134.76498, "t": 370.51385, "r": 480.59161, "b": 379.31082, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "cludes the language definition, syntax rules and error-correction procedures. In", "bbox": {"l": 134.76498, "t": 382.46883999999994, "r": 480.59177000000005, "b": 391.26581, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "section 5, we apply OTSL on the TableFormer architecture, compare it to Table-", "bbox": {"l": 134.76498, "t": 394.42383, "r": 480.58774, "b": 403.2207900000001, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Former models trained on HTML and ultimately demonstrate the advantages", "bbox": {"l": 134.76498, "t": 406.37982, "r": 480.59469999999993, "b": 415.17679, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "of using OTSL. Finally, in section 6 we conclude our work and outline next", "bbox": {"l": 134.76498, "t": 418.33481, "r": 480.59567, "b": 427.13177, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "potential steps.", "bbox": {"l": 134.76498, "t": 430.28979, "r": 201.27232, "b": 439.08676, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "2", "bbox": {"l": 134.76498, "t": 462.08795, "r": 141.48859, "b": 472.65634, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Related Work", "bbox": {"l": 154.93819, "t": 462.08795, "r": 236.76912999999996, "b": 472.65634, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "Approaches to formalize the logical structure and layout of tables in electronic", "bbox": {"l": 134.76498, "t": 488.68582, "r": 480.59067, "b": 497.48279, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "documents date back more than two decades [16]. In the recent past, a wide", "bbox": {"l": 134.76498, "t": 500.64081, "r": 480.5917400000001, "b": 509.43777, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "variety of computer vision methods have been explored to tackle the prob-", "bbox": {"l": 134.76498, "t": 512.5957900000001, "r": 480.58971999999994, "b": 521.39276, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "lem of table structure recognition, i.e. the correct identification of columns,", "bbox": {"l": 134.76498, "t": 524.55179, "r": 480.58966, "b": 533.34875, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "rows and spanning cells in a given table. Broadly speaking, the current deep-", "bbox": {"l": 134.76498, "t": 536.50679, "r": 480.5897499999999, "b": 545.30376, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "learning based approaches fall into three categories: object detection (OD) meth-", "bbox": {"l": 134.76498, "t": 548.4617900000001, "r": 480.58862000000005, "b": 557.2587599999999, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "ods, Graph-Neural-Network (GNN) methods and Image-to-Markup-Sequence", "bbox": {"l": 134.76498, "t": 560.41679, "r": 480.59072999999995, "b": 569.21376, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "(Im2Seq) methods. Object-detection based methods [11,12,13,14,21] rely on table-", "bbox": {"l": 134.76498, "t": 572.3718, "r": 484.12047999999993, "b": 581.16876, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "structure annotation using (overlapping) bounding boxes for training, and pro-", "bbox": {"l": 134.76498, "t": 584.3267999999999, "r": 480.59567, "b": 593.12376, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "duce bounding-box predictions to define table cells, rows, and columns on a table", "bbox": {"l": 134.76498, "t": 596.28279, "r": 480.58871, "b": 605.07976, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "image. Graph Neural Network (GNN) based methods [3,6,17,18], as the name", "bbox": {"l": 134.76498, "t": 608.23779, "r": 480.59075999999993, "b": 617.03476, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "suggests, represent tables as graph structures. The graph nodes represent the", "bbox": {"l": 134.76498, "t": 620.1927900000001, "r": 480.58574999999996, "b": 628.9897599999999, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "content of each table cell, an embedding vector from the table image, or geomet-", "bbox": {"l": 134.76498, "t": 632.1478, "r": 480.58875, "b": 640.94476, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "ric coordinates of the table cell. The edges of the graph define the relationship", "bbox": {"l": 134.76498, "t": 644.1028, "r": 480.58875, "b": 652.89977, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "between the nodes, e.g. if they belong to the same column, row, or table cell.", "bbox": {"l": 134.76498, "t": 656.05879, "r": 480.59069999999997, "b": 664.85577, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 5, "label": "page_header", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9325801730155945, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "page_header", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8773486614227295, "cells": [{"id": 1, "text": "3", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 134.76498, "t": 118.93377999999996, "r": 480.59183, "b": 211.41687000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9871802926063538, "cells": [{"id": 2, "text": "While the majority of research in TSR is currently focused on the develop-", "bbox": {"l": 149.709, "t": 118.93377999999996, "r": 480.59183, "b": 127.73077, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "ment and application of novel neural model architectures, the table structure", "bbox": {"l": 134.765, "t": 130.88878999999997, "r": 480.58675999999997, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "representation language (e.g. HTML in PubTabNet and FinTabNet) is usually", "bbox": {"l": 134.765, "t": 142.84479, "r": 480.5917400000001, "b": 151.64178000000004, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "adopted", "bbox": {"l": 134.765, "t": 154.7998, "r": 169.62514, "b": 163.59680000000003, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "as is", "bbox": {"l": 173.86099, "t": 154.7998, "r": 194.55531, "b": 163.59680000000003, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "for the sequence tokenization in Im2Seq models. In this paper,", "bbox": {"l": 199.60999, "t": 154.7998, "r": 480.58618, "b": 163.59680000000003, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "we aim for the opposite and investigate the impact of the table structure rep-", "bbox": {"l": 134.76498, "t": 166.75482, "r": 480.59167, "b": 175.55182000000002, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "resentation language with an otherwise unmodified Im2Seq transformer-based", "bbox": {"l": 134.76498, "t": 178.70983999999999, "r": 480.58968999999996, "b": 187.50684, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "architecture. Since the current state-of-the-art Im2Seq model is TableFormer [9],", "bbox": {"l": 134.76498, "t": 190.66485999999998, "r": 480.5917400000001, "b": 199.46185000000003, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "we select this model to perform our experiments.", "bbox": {"l": 134.76498, "t": 202.61987, "r": 348.35519, "b": 211.41687000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 134.76498, "t": 214.83587999999997, "r": 480.59572999999995, "b": 331.22986, "coord_origin": "TOPLEFT"}, "confidence": 0.9871861338615417, "cells": [{"id": 12, "text": "The main contribution of this paper is the introduction of a new optimised ta-", "bbox": {"l": 149.70898, "t": 214.83587999999997, "r": 480.5939, "b": 223.63287000000003, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "ble structure language (OTSL), specifically designed to describe table-structure", "bbox": {"l": 134.76498, "t": 226.79089, "r": 480.5938100000001, "b": 235.58789000000002, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "in an compact and structured way for Im2Seq models. OTSL has a number of", "bbox": {"l": 134.76498, "t": 238.74689, "r": 480.58667, "b": 247.54387999999994, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "key features, which make it very attractive to use in Im2Seq models. Specifically,", "bbox": {"l": 134.76498, "t": 250.70190000000002, "r": 480.5867, "b": 259.49890000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "compared to other languages such as HTML, OTSL has a minimized vocabulary", "bbox": {"l": 134.76498, "t": 262.65692, "r": 480.58771, "b": 271.45392000000004, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "which yields short sequence length, strong inherent structure (e.g. strict rectan-", "bbox": {"l": 134.76498, "t": 274.61194, "r": 480.59572999999995, "b": 283.40891, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "gular layout) and a strict syntax with rules that only look backwards. The latter", "bbox": {"l": 134.76498, "t": 286.56692999999996, "r": 480.59274, "b": 295.36389, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "allows for syntax validation during inference and ensures a syntactically correct", "bbox": {"l": 134.76498, "t": 298.52190999999993, "r": 480.59473, "b": 307.31888, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "table-structure. These OTSL features are illustrated in Figure 1, in comparison", "bbox": {"l": 134.76498, "t": 310.47791, "r": 480.58667, "b": 319.27487, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "to HTML.", "bbox": {"l": 134.76498, "t": 322.43289, "r": 179.72021, "b": 331.22986, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 134.76498, "t": 334.64789, "r": 480.59567, "b": 439.08676, "coord_origin": "TOPLEFT"}, "confidence": 0.988121747970581, "cells": [{"id": 22, "text": "The paper is structured as follows. In section 2, we give an overview of the", "bbox": {"l": 149.70898, "t": 334.64789, "r": 480.5878000000001, "b": 343.44485000000003, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "latest developments in table-structure reconstruction. In section 3 we review", "bbox": {"l": 134.76498, "t": 346.60388000000006, "r": 480.59375, "b": 355.40085, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "the current HTML table encoding (popularised by PubTabNet and FinTabNet)", "bbox": {"l": 134.76498, "t": 358.55887, "r": 480.58673, "b": 367.3558300000001, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "and discuss its flaws. Subsequently, we introduce OTSL in section 4, which in-", "bbox": {"l": 134.76498, "t": 370.51385, "r": 480.59161, "b": 379.31082, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "cludes the language definition, syntax rules and error-correction procedures. In", "bbox": {"l": 134.76498, "t": 382.46883999999994, "r": 480.59177000000005, "b": 391.26581, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "section 5, we apply OTSL on the TableFormer architecture, compare it to Table-", "bbox": {"l": 134.76498, "t": 394.42383, "r": 480.58774, "b": 403.2207900000001, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Former models trained on HTML and ultimately demonstrate the advantages", "bbox": {"l": 134.76498, "t": 406.37982, "r": 480.59469999999993, "b": 415.17679, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "of using OTSL. Finally, in section 6 we conclude our work and outline next", "bbox": {"l": 134.76498, "t": 418.33481, "r": 480.59567, "b": 427.13177, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "potential steps.", "bbox": {"l": 134.76498, "t": 430.28979, "r": 201.27232, "b": 439.08676, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "section_header", "bbox": {"l": 134.76498, "t": 462.08795, "r": 236.76912999999996, "b": 472.65634, "coord_origin": "TOPLEFT"}, "confidence": 0.9439423680305481, "cells": [{"id": 31, "text": "2", "bbox": {"l": 134.76498, "t": 462.08795, "r": 141.48859, "b": 472.65634, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Related Work", "bbox": {"l": 154.93819, "t": 462.08795, "r": 236.76912999999996, "b": 472.65634, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 134.76498, "t": 488.68582, "r": 484.12047999999993, "b": 664.85577, "coord_origin": "TOPLEFT"}, "confidence": 0.9870182871818542, "cells": [{"id": 33, "text": "Approaches to formalize the logical structure and layout of tables in electronic", "bbox": {"l": 134.76498, "t": 488.68582, "r": 480.59067, "b": 497.48279, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "documents date back more than two decades [16]. In the recent past, a wide", "bbox": {"l": 134.76498, "t": 500.64081, "r": 480.5917400000001, "b": 509.43777, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "variety of computer vision methods have been explored to tackle the prob-", "bbox": {"l": 134.76498, "t": 512.5957900000001, "r": 480.58971999999994, "b": 521.39276, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "lem of table structure recognition, i.e. the correct identification of columns,", "bbox": {"l": 134.76498, "t": 524.55179, "r": 480.58966, "b": 533.34875, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "rows and spanning cells in a given table. Broadly speaking, the current deep-", "bbox": {"l": 134.76498, "t": 536.50679, "r": 480.5897499999999, "b": 545.30376, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "learning based approaches fall into three categories: object detection (OD) meth-", "bbox": {"l": 134.76498, "t": 548.4617900000001, "r": 480.58862000000005, "b": 557.2587599999999, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "ods, Graph-Neural-Network (GNN) methods and Image-to-Markup-Sequence", "bbox": {"l": 134.76498, "t": 560.41679, "r": 480.59072999999995, "b": 569.21376, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "(Im2Seq) methods. Object-detection based methods [11,12,13,14,21] rely on table-", "bbox": {"l": 134.76498, "t": 572.3718, "r": 484.12047999999993, "b": 581.16876, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "structure annotation using (overlapping) bounding boxes for training, and pro-", "bbox": {"l": 134.76498, "t": 584.3267999999999, "r": 480.59567, "b": 593.12376, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "duce bounding-box predictions to define table cells, rows, and columns on a table", "bbox": {"l": 134.76498, "t": 596.28279, "r": 480.58871, "b": 605.07976, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "image. Graph Neural Network (GNN) based methods [3,6,17,18], as the name", "bbox": {"l": 134.76498, "t": 608.23779, "r": 480.59075999999993, "b": 617.03476, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "suggests, represent tables as graph structures. The graph nodes represent the", "bbox": {"l": 134.76498, "t": 620.1927900000001, "r": 480.58574999999996, "b": 628.9897599999999, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "content of each table cell, an embedding vector from the table image, or geomet-", "bbox": {"l": 134.76498, "t": 632.1478, "r": 480.58875, "b": 640.94476, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "ric coordinates of the table cell. The edges of the graph define the relationship", "bbox": {"l": 134.76498, "t": 644.1028, "r": 480.58875, "b": 652.89977, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "between the nodes, e.g. if they belong to the same column, row, or table cell.", "bbox": {"l": 134.76498, "t": 656.05879, "r": 480.59069999999997, "b": 664.85577, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_header", "id": 5, "page_no": 2, "cluster": {"id": 5, "label": "page_header", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9325801730155945, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Optimized Table Tokenization for Table Structure Recognition"}, {"label": "page_header", "id": 6, "page_no": 2, "cluster": {"id": 6, "label": "page_header", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8773486614227295, "cells": [{"id": 1, "text": "3", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3"}, {"label": "text", "id": 2, "page_no": 2, "cluster": {"id": 2, "label": "text", "bbox": {"l": 134.76498, "t": 118.93377999999996, "r": 480.59183, "b": 211.41687000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9871802926063538, "cells": [{"id": 2, "text": "While the majority of research in TSR is currently focused on the develop-", "bbox": {"l": 149.709, "t": 118.93377999999996, "r": 480.59183, "b": 127.73077, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "ment and application of novel neural model architectures, the table structure", "bbox": {"l": 134.765, "t": 130.88878999999997, "r": 480.58675999999997, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "representation language (e.g. HTML in PubTabNet and FinTabNet) is usually", "bbox": {"l": 134.765, "t": 142.84479, "r": 480.5917400000001, "b": 151.64178000000004, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "adopted", "bbox": {"l": 134.765, "t": 154.7998, "r": 169.62514, "b": 163.59680000000003, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "as is", "bbox": {"l": 173.86099, "t": 154.7998, "r": 194.55531, "b": 163.59680000000003, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "for the sequence tokenization in Im2Seq models. In this paper,", "bbox": {"l": 199.60999, "t": 154.7998, "r": 480.58618, "b": 163.59680000000003, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "we aim for the opposite and investigate the impact of the table structure rep-", "bbox": {"l": 134.76498, "t": 166.75482, "r": 480.59167, "b": 175.55182000000002, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "resentation language with an otherwise unmodified Im2Seq transformer-based", "bbox": {"l": 134.76498, "t": 178.70983999999999, "r": 480.58968999999996, "b": 187.50684, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "architecture. Since the current state-of-the-art Im2Seq model is TableFormer [9],", "bbox": {"l": 134.76498, "t": 190.66485999999998, "r": 480.5917400000001, "b": 199.46185000000003, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "we select this model to perform our experiments.", "bbox": {"l": 134.76498, "t": 202.61987, "r": 348.35519, "b": 211.41687000000002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "While the majority of research in TSR is currently focused on the development and application of novel neural model architectures, the table structure representation language (e.g. HTML in PubTabNet and FinTabNet) is usually adopted as is for the sequence tokenization in Im2Seq models. In this paper, we aim for the opposite and investigate the impact of the table structure representation language with an otherwise unmodified Im2Seq transformer-based architecture. Since the current state-of-the-art Im2Seq model is TableFormer [9], we select this model to perform our experiments."}, {"label": "text", "id": 1, "page_no": 2, "cluster": {"id": 1, "label": "text", "bbox": {"l": 134.76498, "t": 214.83587999999997, "r": 480.59572999999995, "b": 331.22986, "coord_origin": "TOPLEFT"}, "confidence": 0.9871861338615417, "cells": [{"id": 12, "text": "The main contribution of this paper is the introduction of a new optimised ta-", "bbox": {"l": 149.70898, "t": 214.83587999999997, "r": 480.5939, "b": 223.63287000000003, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "ble structure language (OTSL), specifically designed to describe table-structure", "bbox": {"l": 134.76498, "t": 226.79089, "r": 480.5938100000001, "b": 235.58789000000002, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "in an compact and structured way for Im2Seq models. OTSL has a number of", "bbox": {"l": 134.76498, "t": 238.74689, "r": 480.58667, "b": 247.54387999999994, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "key features, which make it very attractive to use in Im2Seq models. Specifically,", "bbox": {"l": 134.76498, "t": 250.70190000000002, "r": 480.5867, "b": 259.49890000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "compared to other languages such as HTML, OTSL has a minimized vocabulary", "bbox": {"l": 134.76498, "t": 262.65692, "r": 480.58771, "b": 271.45392000000004, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "which yields short sequence length, strong inherent structure (e.g. strict rectan-", "bbox": {"l": 134.76498, "t": 274.61194, "r": 480.59572999999995, "b": 283.40891, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "gular layout) and a strict syntax with rules that only look backwards. The latter", "bbox": {"l": 134.76498, "t": 286.56692999999996, "r": 480.59274, "b": 295.36389, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "allows for syntax validation during inference and ensures a syntactically correct", "bbox": {"l": 134.76498, "t": 298.52190999999993, "r": 480.59473, "b": 307.31888, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "table-structure. These OTSL features are illustrated in Figure 1, in comparison", "bbox": {"l": 134.76498, "t": 310.47791, "r": 480.58667, "b": 319.27487, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "to HTML.", "bbox": {"l": 134.76498, "t": 322.43289, "r": 179.72021, "b": 331.22986, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The main contribution of this paper is the introduction of a new optimised table structure language (OTSL), specifically designed to describe table-structure in an compact and structured way for Im2Seq models. OTSL has a number of key features, which make it very attractive to use in Im2Seq models. Specifically, compared to other languages such as HTML, OTSL has a minimized vocabulary which yields short sequence length, strong inherent structure (e.g. strict rectangular layout) and a strict syntax with rules that only look backwards. The latter allows for syntax validation during inference and ensures a syntactically correct table-structure. These OTSL features are illustrated in Figure 1, in comparison to HTML."}, {"label": "text", "id": 0, "page_no": 2, "cluster": {"id": 0, "label": "text", "bbox": {"l": 134.76498, "t": 334.64789, "r": 480.59567, "b": 439.08676, "coord_origin": "TOPLEFT"}, "confidence": 0.988121747970581, "cells": [{"id": 22, "text": "The paper is structured as follows. In section 2, we give an overview of the", "bbox": {"l": 149.70898, "t": 334.64789, "r": 480.5878000000001, "b": 343.44485000000003, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "latest developments in table-structure reconstruction. In section 3 we review", "bbox": {"l": 134.76498, "t": 346.60388000000006, "r": 480.59375, "b": 355.40085, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "the current HTML table encoding (popularised by PubTabNet and FinTabNet)", "bbox": {"l": 134.76498, "t": 358.55887, "r": 480.58673, "b": 367.3558300000001, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "and discuss its flaws. Subsequently, we introduce OTSL in section 4, which in-", "bbox": {"l": 134.76498, "t": 370.51385, "r": 480.59161, "b": 379.31082, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "cludes the language definition, syntax rules and error-correction procedures. In", "bbox": {"l": 134.76498, "t": 382.46883999999994, "r": 480.59177000000005, "b": 391.26581, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "section 5, we apply OTSL on the TableFormer architecture, compare it to Table-", "bbox": {"l": 134.76498, "t": 394.42383, "r": 480.58774, "b": 403.2207900000001, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Former models trained on HTML and ultimately demonstrate the advantages", "bbox": {"l": 134.76498, "t": 406.37982, "r": 480.59469999999993, "b": 415.17679, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "of using OTSL. Finally, in section 6 we conclude our work and outline next", "bbox": {"l": 134.76498, "t": 418.33481, "r": 480.59567, "b": 427.13177, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "potential steps.", "bbox": {"l": 134.76498, "t": 430.28979, "r": 201.27232, "b": 439.08676, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The paper is structured as follows. In section 2, we give an overview of the latest developments in table-structure reconstruction. In section 3 we review the current HTML table encoding (popularised by PubTabNet and FinTabNet) and discuss its flaws. Subsequently, we introduce OTSL in section 4, which includes the language definition, syntax rules and error-correction procedures. In section 5, we apply OTSL on the TableFormer architecture, compare it to TableFormer models trained on HTML and ultimately demonstrate the advantages of using OTSL. Finally, in section 6 we conclude our work and outline next potential steps."}, {"label": "section_header", "id": 4, "page_no": 2, "cluster": {"id": 4, "label": "section_header", "bbox": {"l": 134.76498, "t": 462.08795, "r": 236.76912999999996, "b": 472.65634, "coord_origin": "TOPLEFT"}, "confidence": 0.9439423680305481, "cells": [{"id": 31, "text": "2", "bbox": {"l": 134.76498, "t": 462.08795, "r": 141.48859, "b": 472.65634, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Related Work", "bbox": {"l": 154.93819, "t": 462.08795, "r": 236.76912999999996, "b": 472.65634, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2 Related Work"}, {"label": "text", "id": 3, "page_no": 2, "cluster": {"id": 3, "label": "text", "bbox": {"l": 134.76498, "t": 488.68582, "r": 484.12047999999993, "b": 664.85577, "coord_origin": "TOPLEFT"}, "confidence": 0.9870182871818542, "cells": [{"id": 33, "text": "Approaches to formalize the logical structure and layout of tables in electronic", "bbox": {"l": 134.76498, "t": 488.68582, "r": 480.59067, "b": 497.48279, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "documents date back more than two decades [16]. In the recent past, a wide", "bbox": {"l": 134.76498, "t": 500.64081, "r": 480.5917400000001, "b": 509.43777, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "variety of computer vision methods have been explored to tackle the prob-", "bbox": {"l": 134.76498, "t": 512.5957900000001, "r": 480.58971999999994, "b": 521.39276, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "lem of table structure recognition, i.e. the correct identification of columns,", "bbox": {"l": 134.76498, "t": 524.55179, "r": 480.58966, "b": 533.34875, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "rows and spanning cells in a given table. Broadly speaking, the current deep-", "bbox": {"l": 134.76498, "t": 536.50679, "r": 480.5897499999999, "b": 545.30376, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "learning based approaches fall into three categories: object detection (OD) meth-", "bbox": {"l": 134.76498, "t": 548.4617900000001, "r": 480.58862000000005, "b": 557.2587599999999, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "ods, Graph-Neural-Network (GNN) methods and Image-to-Markup-Sequence", "bbox": {"l": 134.76498, "t": 560.41679, "r": 480.59072999999995, "b": 569.21376, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "(Im2Seq) methods. Object-detection based methods [11,12,13,14,21] rely on table-", "bbox": {"l": 134.76498, "t": 572.3718, "r": 484.12047999999993, "b": 581.16876, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "structure annotation using (overlapping) bounding boxes for training, and pro-", "bbox": {"l": 134.76498, "t": 584.3267999999999, "r": 480.59567, "b": 593.12376, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "duce bounding-box predictions to define table cells, rows, and columns on a table", "bbox": {"l": 134.76498, "t": 596.28279, "r": 480.58871, "b": 605.07976, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "image. Graph Neural Network (GNN) based methods [3,6,17,18], as the name", "bbox": {"l": 134.76498, "t": 608.23779, "r": 480.59075999999993, "b": 617.03476, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "suggests, represent tables as graph structures. The graph nodes represent the", "bbox": {"l": 134.76498, "t": 620.1927900000001, "r": 480.58574999999996, "b": 628.9897599999999, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "content of each table cell, an embedding vector from the table image, or geomet-", "bbox": {"l": 134.76498, "t": 632.1478, "r": 480.58875, "b": 640.94476, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "ric coordinates of the table cell. The edges of the graph define the relationship", "bbox": {"l": 134.76498, "t": 644.1028, "r": 480.58875, "b": 652.89977, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "between the nodes, e.g. if they belong to the same column, row, or table cell.", "bbox": {"l": 134.76498, "t": 656.05879, "r": 480.59069999999997, "b": 664.85577, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Approaches to formalize the logical structure and layout of tables in electronic documents date back more than two decades [16]. In the recent past, a wide variety of computer vision methods have been explored to tackle the problem of table structure recognition, i.e. the correct identification of columns, rows and spanning cells in a given table. Broadly speaking, the current deeplearning based approaches fall into three categories: object detection (OD) methods, Graph-Neural-Network (GNN) methods and Image-to-Markup-Sequence (Im2Seq) methods. Object-detection based methods [11,12,13,14,21] rely on tablestructure annotation using (overlapping) bounding boxes for training, and produce bounding-box predictions to define table cells, rows, and columns on a table image. Graph Neural Network (GNN) based methods [3,6,17,18], as the name suggests, represent tables as graph structures. The graph nodes represent the content of each table cell, an embedding vector from the table image, or geometric coordinates of the table cell. The edges of the graph define the relationship between the nodes, e.g. if they belong to the same column, row, or table cell."}], "body": [{"label": "text", "id": 2, "page_no": 2, "cluster": {"id": 2, "label": "text", "bbox": {"l": 134.76498, "t": 118.93377999999996, "r": 480.59183, "b": 211.41687000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9871802926063538, "cells": [{"id": 2, "text": "While the majority of research in TSR is currently focused on the develop-", "bbox": {"l": 149.709, "t": 118.93377999999996, "r": 480.59183, "b": 127.73077, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "ment and application of novel neural model architectures, the table structure", "bbox": {"l": 134.765, "t": 130.88878999999997, "r": 480.58675999999997, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "representation language (e.g. HTML in PubTabNet and FinTabNet) is usually", "bbox": {"l": 134.765, "t": 142.84479, "r": 480.5917400000001, "b": 151.64178000000004, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "adopted", "bbox": {"l": 134.765, "t": 154.7998, "r": 169.62514, "b": 163.59680000000003, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "as is", "bbox": {"l": 173.86099, "t": 154.7998, "r": 194.55531, "b": 163.59680000000003, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "for the sequence tokenization in Im2Seq models. In this paper,", "bbox": {"l": 199.60999, "t": 154.7998, "r": 480.58618, "b": 163.59680000000003, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "we aim for the opposite and investigate the impact of the table structure rep-", "bbox": {"l": 134.76498, "t": 166.75482, "r": 480.59167, "b": 175.55182000000002, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "resentation language with an otherwise unmodified Im2Seq transformer-based", "bbox": {"l": 134.76498, "t": 178.70983999999999, "r": 480.58968999999996, "b": 187.50684, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "architecture. Since the current state-of-the-art Im2Seq model is TableFormer [9],", "bbox": {"l": 134.76498, "t": 190.66485999999998, "r": 480.5917400000001, "b": 199.46185000000003, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "we select this model to perform our experiments.", "bbox": {"l": 134.76498, "t": 202.61987, "r": 348.35519, "b": 211.41687000000002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "While the majority of research in TSR is currently focused on the development and application of novel neural model architectures, the table structure representation language (e.g. HTML in PubTabNet and FinTabNet) is usually adopted as is for the sequence tokenization in Im2Seq models. In this paper, we aim for the opposite and investigate the impact of the table structure representation language with an otherwise unmodified Im2Seq transformer-based architecture. Since the current state-of-the-art Im2Seq model is TableFormer [9], we select this model to perform our experiments."}, {"label": "text", "id": 1, "page_no": 2, "cluster": {"id": 1, "label": "text", "bbox": {"l": 134.76498, "t": 214.83587999999997, "r": 480.59572999999995, "b": 331.22986, "coord_origin": "TOPLEFT"}, "confidence": 0.9871861338615417, "cells": [{"id": 12, "text": "The main contribution of this paper is the introduction of a new optimised ta-", "bbox": {"l": 149.70898, "t": 214.83587999999997, "r": 480.5939, "b": 223.63287000000003, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "ble structure language (OTSL), specifically designed to describe table-structure", "bbox": {"l": 134.76498, "t": 226.79089, "r": 480.5938100000001, "b": 235.58789000000002, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "in an compact and structured way for Im2Seq models. OTSL has a number of", "bbox": {"l": 134.76498, "t": 238.74689, "r": 480.58667, "b": 247.54387999999994, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "key features, which make it very attractive to use in Im2Seq models. Specifically,", "bbox": {"l": 134.76498, "t": 250.70190000000002, "r": 480.5867, "b": 259.49890000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "compared to other languages such as HTML, OTSL has a minimized vocabulary", "bbox": {"l": 134.76498, "t": 262.65692, "r": 480.58771, "b": 271.45392000000004, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "which yields short sequence length, strong inherent structure (e.g. strict rectan-", "bbox": {"l": 134.76498, "t": 274.61194, "r": 480.59572999999995, "b": 283.40891, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "gular layout) and a strict syntax with rules that only look backwards. The latter", "bbox": {"l": 134.76498, "t": 286.56692999999996, "r": 480.59274, "b": 295.36389, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "allows for syntax validation during inference and ensures a syntactically correct", "bbox": {"l": 134.76498, "t": 298.52190999999993, "r": 480.59473, "b": 307.31888, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "table-structure. These OTSL features are illustrated in Figure 1, in comparison", "bbox": {"l": 134.76498, "t": 310.47791, "r": 480.58667, "b": 319.27487, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "to HTML.", "bbox": {"l": 134.76498, "t": 322.43289, "r": 179.72021, "b": 331.22986, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The main contribution of this paper is the introduction of a new optimised table structure language (OTSL), specifically designed to describe table-structure in an compact and structured way for Im2Seq models. OTSL has a number of key features, which make it very attractive to use in Im2Seq models. Specifically, compared to other languages such as HTML, OTSL has a minimized vocabulary which yields short sequence length, strong inherent structure (e.g. strict rectangular layout) and a strict syntax with rules that only look backwards. The latter allows for syntax validation during inference and ensures a syntactically correct table-structure. These OTSL features are illustrated in Figure 1, in comparison to HTML."}, {"label": "text", "id": 0, "page_no": 2, "cluster": {"id": 0, "label": "text", "bbox": {"l": 134.76498, "t": 334.64789, "r": 480.59567, "b": 439.08676, "coord_origin": "TOPLEFT"}, "confidence": 0.988121747970581, "cells": [{"id": 22, "text": "The paper is structured as follows. In section 2, we give an overview of the", "bbox": {"l": 149.70898, "t": 334.64789, "r": 480.5878000000001, "b": 343.44485000000003, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "latest developments in table-structure reconstruction. In section 3 we review", "bbox": {"l": 134.76498, "t": 346.60388000000006, "r": 480.59375, "b": 355.40085, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "the current HTML table encoding (popularised by PubTabNet and FinTabNet)", "bbox": {"l": 134.76498, "t": 358.55887, "r": 480.58673, "b": 367.3558300000001, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "and discuss its flaws. Subsequently, we introduce OTSL in section 4, which in-", "bbox": {"l": 134.76498, "t": 370.51385, "r": 480.59161, "b": 379.31082, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "cludes the language definition, syntax rules and error-correction procedures. In", "bbox": {"l": 134.76498, "t": 382.46883999999994, "r": 480.59177000000005, "b": 391.26581, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "section 5, we apply OTSL on the TableFormer architecture, compare it to Table-", "bbox": {"l": 134.76498, "t": 394.42383, "r": 480.58774, "b": 403.2207900000001, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Former models trained on HTML and ultimately demonstrate the advantages", "bbox": {"l": 134.76498, "t": 406.37982, "r": 480.59469999999993, "b": 415.17679, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "of using OTSL. Finally, in section 6 we conclude our work and outline next", "bbox": {"l": 134.76498, "t": 418.33481, "r": 480.59567, "b": 427.13177, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "potential steps.", "bbox": {"l": 134.76498, "t": 430.28979, "r": 201.27232, "b": 439.08676, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The paper is structured as follows. In section 2, we give an overview of the latest developments in table-structure reconstruction. In section 3 we review the current HTML table encoding (popularised by PubTabNet and FinTabNet) and discuss its flaws. Subsequently, we introduce OTSL in section 4, which includes the language definition, syntax rules and error-correction procedures. In section 5, we apply OTSL on the TableFormer architecture, compare it to TableFormer models trained on HTML and ultimately demonstrate the advantages of using OTSL. Finally, in section 6 we conclude our work and outline next potential steps."}, {"label": "section_header", "id": 4, "page_no": 2, "cluster": {"id": 4, "label": "section_header", "bbox": {"l": 134.76498, "t": 462.08795, "r": 236.76912999999996, "b": 472.65634, "coord_origin": "TOPLEFT"}, "confidence": 0.9439423680305481, "cells": [{"id": 31, "text": "2", "bbox": {"l": 134.76498, "t": 462.08795, "r": 141.48859, "b": 472.65634, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Related Work", "bbox": {"l": 154.93819, "t": 462.08795, "r": 236.76912999999996, "b": 472.65634, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2 Related Work"}, {"label": "text", "id": 3, "page_no": 2, "cluster": {"id": 3, "label": "text", "bbox": {"l": 134.76498, "t": 488.68582, "r": 484.12047999999993, "b": 664.85577, "coord_origin": "TOPLEFT"}, "confidence": 0.9870182871818542, "cells": [{"id": 33, "text": "Approaches to formalize the logical structure and layout of tables in electronic", "bbox": {"l": 134.76498, "t": 488.68582, "r": 480.59067, "b": 497.48279, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "documents date back more than two decades [16]. In the recent past, a wide", "bbox": {"l": 134.76498, "t": 500.64081, "r": 480.5917400000001, "b": 509.43777, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "variety of computer vision methods have been explored to tackle the prob-", "bbox": {"l": 134.76498, "t": 512.5957900000001, "r": 480.58971999999994, "b": 521.39276, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "lem of table structure recognition, i.e. the correct identification of columns,", "bbox": {"l": 134.76498, "t": 524.55179, "r": 480.58966, "b": 533.34875, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "rows and spanning cells in a given table. Broadly speaking, the current deep-", "bbox": {"l": 134.76498, "t": 536.50679, "r": 480.5897499999999, "b": 545.30376, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "learning based approaches fall into three categories: object detection (OD) meth-", "bbox": {"l": 134.76498, "t": 548.4617900000001, "r": 480.58862000000005, "b": 557.2587599999999, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "ods, Graph-Neural-Network (GNN) methods and Image-to-Markup-Sequence", "bbox": {"l": 134.76498, "t": 560.41679, "r": 480.59072999999995, "b": 569.21376, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "(Im2Seq) methods. Object-detection based methods [11,12,13,14,21] rely on table-", "bbox": {"l": 134.76498, "t": 572.3718, "r": 484.12047999999993, "b": 581.16876, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "structure annotation using (overlapping) bounding boxes for training, and pro-", "bbox": {"l": 134.76498, "t": 584.3267999999999, "r": 480.59567, "b": 593.12376, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "duce bounding-box predictions to define table cells, rows, and columns on a table", "bbox": {"l": 134.76498, "t": 596.28279, "r": 480.58871, "b": 605.07976, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "image. Graph Neural Network (GNN) based methods [3,6,17,18], as the name", "bbox": {"l": 134.76498, "t": 608.23779, "r": 480.59075999999993, "b": 617.03476, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "suggests, represent tables as graph structures. The graph nodes represent the", "bbox": {"l": 134.76498, "t": 620.1927900000001, "r": 480.58574999999996, "b": 628.9897599999999, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "content of each table cell, an embedding vector from the table image, or geomet-", "bbox": {"l": 134.76498, "t": 632.1478, "r": 480.58875, "b": 640.94476, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "ric coordinates of the table cell. The edges of the graph define the relationship", "bbox": {"l": 134.76498, "t": 644.1028, "r": 480.58875, "b": 652.89977, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "between the nodes, e.g. if they belong to the same column, row, or table cell.", "bbox": {"l": 134.76498, "t": 656.05879, "r": 480.59069999999997, "b": 664.85577, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Approaches to formalize the logical structure and layout of tables in electronic documents date back more than two decades [16]. In the recent past, a wide variety of computer vision methods have been explored to tackle the problem of table structure recognition, i.e. the correct identification of columns, rows and spanning cells in a given table. Broadly speaking, the current deeplearning based approaches fall into three categories: object detection (OD) methods, Graph-Neural-Network (GNN) methods and Image-to-Markup-Sequence (Im2Seq) methods. Object-detection based methods [11,12,13,14,21] rely on tablestructure annotation using (overlapping) bounding boxes for training, and produce bounding-box predictions to define table cells, rows, and columns on a table image. Graph Neural Network (GNN) based methods [3,6,17,18], as the name suggests, represent tables as graph structures. The graph nodes represent the content of each table cell, an embedding vector from the table image, or geometric coordinates of the table cell. The edges of the graph define the relationship between the nodes, e.g. if they belong to the same column, row, or table cell."}], "headers": [{"label": "page_header", "id": 5, "page_no": 2, "cluster": {"id": 5, "label": "page_header", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9325801730155945, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Optimized Table Tokenization for Table Structure Recognition"}, {"label": "page_header", "id": 6, "page_no": 2, "cluster": {"id": 6, "label": "page_header", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8773486614227295, "cells": [{"id": 1, "text": "3", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3"}]}}, {"page_no": 3, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "4", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "M.", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 178.07675, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37415, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Other work [20] aims at predicting a grid for each table and deciding which cells", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.59375, "b": 127.73077, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "must be merged using an attention network. Im2Seq methods cast the problem", "bbox": {"l": 134.765, "t": 130.88878999999997, "r": 480.58774, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "as a sequence generation task [4,5,9,22], and therefore need an internal table-", "bbox": {"l": 134.765, "t": 142.84479, "r": 480.58675999999997, "b": 151.64178000000004, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "structure representation language, which is often implemented with standard", "bbox": {"l": 134.765, "t": 154.7998, "r": 480.5878000000001, "b": 163.59680000000003, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "markup languages (e.g. HTML, LaTeX, Markdown). In theory, Im2Seq methods", "bbox": {"l": 134.765, "t": 166.75482, "r": 480.59271, "b": 175.55182000000002, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "have a natural advantage over the OD and GNN methods by virtue of directly", "bbox": {"l": 134.765, "t": 178.70983999999999, "r": 480.5957599999999, "b": 187.50684, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "predicting the table-structure. As such, no post-processing or rules are needed", "bbox": {"l": 134.765, "t": 190.66485999999998, "r": 480.59271, "b": 199.46185000000003, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "in order to obtain the table-structure, which is necessary with OD and GNN", "bbox": {"l": 134.765, "t": 202.61987, "r": 480.59378, "b": 211.41687000000002, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "approaches. In practice, this is not entirely true, because a predicted sequence", "bbox": {"l": 134.765, "t": 214.57587, "r": 480.58783000000005, "b": 223.37285999999995, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "of table-structure markup does not necessarily have to be syntactically correct.", "bbox": {"l": 134.765, "t": 226.53088000000002, "r": 480.58978, "b": 235.32788000000005, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Hence, depending on the quality of the predicted sequence, some post-processing", "bbox": {"l": 134.765, "t": 238.48590000000002, "r": 480.59572999999995, "b": 247.28290000000004, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "needs to be performed to ensure a syntactically valid (let alone correct) sequence.", "bbox": {"l": 134.765, "t": 250.44092, "r": 480.59473, "b": 259.23792000000003, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Within the Im2Seq method, we find several popular models, namely the", "bbox": {"l": 149.709, "t": 262.65692, "r": 480.59280000000007, "b": 271.45392000000004, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "encoder-dual-decoder model (EDD) [22], TableFormer [9], Tabsplitter[2] and Ye", "bbox": {"l": 134.765, "t": 274.61194, "r": 480.59167, "b": 283.40891, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "et. al. [19]. EDD uses two consecutive long short-term memory (LSTM) decoders", "bbox": {"l": 134.765, "t": 286.56692999999996, "r": 480.59271, "b": 295.36389, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "to predict a table in HTML representation. The", "bbox": {"l": 134.765, "t": 298.52190999999993, "r": 342.02097, "b": 307.31888, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "tag decoder", "bbox": {"l": 345.064, "t": 298.52190999999993, "r": 393.04684, "b": 307.31888, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "predicts a sequence", "bbox": {"l": 397.16699, "t": 298.52190999999993, "r": 480.59082, "b": 307.31888, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "of HTML tags. For each decoded table cell (", "bbox": {"l": 134.76498, "t": 310.47791, "r": 333.29871, "b": 319.27487, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "<td>", "bbox": {"l": 333.29898, "t": 310.47791, "r": 356.9711, "b": 319.27487, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "), the attention is passed to", "bbox": {"l": 357.08499, "t": 310.47791, "r": 480.59433000000007, "b": 319.27487, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "the", "bbox": {"l": 134.76498, "t": 322.43289, "r": 148.59805, "b": 331.22986, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "cell decoder", "bbox": {"l": 152.27698, "t": 322.43289, "r": 202.1109, "b": 331.22986, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "to predict the content with an embedded OCR approach. The", "bbox": {"l": 206.86398, "t": 322.43289, "r": 480.58743, "b": 331.22986, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "latter makes it susceptible to transcription errors in the cell content of the table.", "bbox": {"l": 134.76498, "t": 334.38788, "r": 480.59476, "b": 343.18484, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "TableFormer address this reliance on OCR and uses two transformer decoders for", "bbox": {"l": 134.76498, "t": 346.34286, "r": 480.58675999999997, "b": 355.13983, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "HTML structure and cell bounding box prediction in an end-to-end architecture.", "bbox": {"l": 134.76498, "t": 358.29785, "r": 480.58868, "b": 367.09482, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "The predicted cell bounding box is then used to extract text tokens from an", "bbox": {"l": 134.76498, "t": 370.25284, "r": 480.58868, "b": 379.0498, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "originating (digital) PDF page, circumventing any need for OCR. TabSplitter", "bbox": {"l": 134.76498, "t": 382.20883, "r": 480.59357000000006, "b": 391.0058, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "[2]", "bbox": {"l": 134.76498, "t": 394.16382, "r": 144.76979, "b": 402.96078, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "proposes a compact double-matrix representation of table rows and columns", "bbox": {"l": 149.50908, "t": 394.16382, "r": 480.58667, "b": 402.96078, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "to do error detection and error correction of HTML structure sequences based", "bbox": {"l": 134.76498, "t": 406.1188, "r": 480.59569999999997, "b": 414.91576999999995, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "on predictions from [19]. This compact double-matrix representation can not be", "bbox": {"l": 134.76498, "t": 418.07379, "r": 480.59180000000003, "b": 426.87076, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "used directly by the Img2seq model training, so the model uses HTML as an", "bbox": {"l": 134.76498, "t": 430.02878, "r": 480.5878000000001, "b": 438.82574, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "intermediate form. Chi et. al. [4] introduce a data set and a baseline method", "bbox": {"l": 134.76498, "t": 441.98376, "r": 480.58868, "b": 450.78073, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "using bidirectional LSTMs to predict LaTeX code. Kayal", "bbox": {"l": 134.76498, "t": 453.93976000000004, "r": 384.5752, "b": 462.73672, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "[5]", "bbox": {"l": 391.55899, "t": 453.93976000000004, "r": 401.73236, "b": 462.73672, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "introduces Gated", "bbox": {"l": 406.55154, "t": 453.93976000000004, "r": 480.58777, "b": 462.73672, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "ResNet transformers to predict LaTeX code, and a separate OCR module to", "bbox": {"l": 134.76498, "t": 465.89474, "r": 480.59079, "b": 474.69171, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "extract content.", "bbox": {"l": 134.76498, "t": 477.84973, "r": 203.68625, "b": 486.6467, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Im2Seq approaches have shown to be well-suited for the TSR task and allow a", "bbox": {"l": 149.70898, "t": 490.06573, "r": 480.59378, "b": 498.8627, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "full end-to-end network design that can output the final table structure without", "bbox": {"l": 134.76498, "t": 502.02072, "r": 480.58871, "b": 510.81769, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "pre- or post-processing logic. Furthermore, Im2Seq models have demonstrated", "bbox": {"l": 134.76498, "t": 513.9757099999999, "r": 480.58675999999997, "b": 522.7726700000001, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "to deliver state-of-the-art prediction accuracy [9]. This motivated the authors", "bbox": {"l": 134.76498, "t": 525.93069, "r": 480.58978, "b": 534.72766, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "to investigate if the performance (both in accuracy and inference time) can", "bbox": {"l": 134.76498, "t": 537.8857, "r": 480.58765, "b": 546.6826599999999, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "be further improved by optimising the table structure representation language.", "bbox": {"l": 134.76498, "t": 549.84169, "r": 480.58971999999994, "b": 558.63866, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "We believe this is a necessary step before further improving neural network", "bbox": {"l": 134.76498, "t": 561.79669, "r": 480.58871, "b": 570.59366, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "architectures for this task.", "bbox": {"l": 134.76498, "t": 573.75169, "r": 249.27811, "b": 582.54866, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "3", "bbox": {"l": 134.76498, "t": 605.54984, "r": 141.48859, "b": 616.11823, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Problem Statement", "bbox": {"l": 154.93819, "t": 605.54984, "r": 269.62442, "b": 616.11823, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "All known Im2Seq based models for TSR fundamentally work in similar ways.", "bbox": {"l": 134.76498, "t": 632.14769, "r": 480.59064, "b": 640.94466, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "Given an image of a table, the Im2Seq model predicts the structure of the table", "bbox": {"l": 134.76498, "t": 644.1026899999999, "r": 480.5867, "b": 652.89966, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "by generating a sequence of tokens. These tokens originate from a finite vocab-", "bbox": {"l": 134.76498, "t": 656.0586900000001, "r": 480.5936899999999, "b": 664.85566, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 6, "label": "page_header", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.7890051603317261, "cells": [{"id": 0, "text": "4", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "page_header", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9045588374137878, "cells": [{"id": 1, "text": "M.", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 178.07675, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37415, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.5957599999999, "b": 259.23792000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9467443823814392, "cells": [{"id": 3, "text": "Other work [20] aims at predicting a grid for each table and deciding which cells", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.59375, "b": 127.73077, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "must be merged using an attention network. Im2Seq methods cast the problem", "bbox": {"l": 134.765, "t": 130.88878999999997, "r": 480.58774, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "as a sequence generation task [4,5,9,22], and therefore need an internal table-", "bbox": {"l": 134.765, "t": 142.84479, "r": 480.58675999999997, "b": 151.64178000000004, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "structure representation language, which is often implemented with standard", "bbox": {"l": 134.765, "t": 154.7998, "r": 480.5878000000001, "b": 163.59680000000003, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "markup languages (e.g. HTML, LaTeX, Markdown). In theory, Im2Seq methods", "bbox": {"l": 134.765, "t": 166.75482, "r": 480.59271, "b": 175.55182000000002, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "have a natural advantage over the OD and GNN methods by virtue of directly", "bbox": {"l": 134.765, "t": 178.70983999999999, "r": 480.5957599999999, "b": 187.50684, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "predicting the table-structure. As such, no post-processing or rules are needed", "bbox": {"l": 134.765, "t": 190.66485999999998, "r": 480.59271, "b": 199.46185000000003, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "in order to obtain the table-structure, which is necessary with OD and GNN", "bbox": {"l": 134.765, "t": 202.61987, "r": 480.59378, "b": 211.41687000000002, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "approaches. In practice, this is not entirely true, because a predicted sequence", "bbox": {"l": 134.765, "t": 214.57587, "r": 480.58783000000005, "b": 223.37285999999995, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "of table-structure markup does not necessarily have to be syntactically correct.", "bbox": {"l": 134.765, "t": 226.53088000000002, "r": 480.58978, "b": 235.32788000000005, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Hence, depending on the quality of the predicted sequence, some post-processing", "bbox": {"l": 134.765, "t": 238.48590000000002, "r": 480.59572999999995, "b": 247.28290000000004, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "needs to be performed to ensure a syntactically valid (let alone correct) sequence.", "bbox": {"l": 134.765, "t": 250.44092, "r": 480.59473, "b": 259.23792000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "text", "bbox": {"l": 134.76498, "t": 262.65692, "r": 480.59569999999997, "b": 486.6467, "coord_origin": "TOPLEFT"}, "confidence": 0.929087221622467, "cells": [{"id": 15, "text": "Within the Im2Seq method, we find several popular models, namely the", "bbox": {"l": 149.709, "t": 262.65692, "r": 480.59280000000007, "b": 271.45392000000004, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "encoder-dual-decoder model (EDD) [22], TableFormer [9], Tabsplitter[2] and Ye", "bbox": {"l": 134.765, "t": 274.61194, "r": 480.59167, "b": 283.40891, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "et. al. [19]. EDD uses two consecutive long short-term memory (LSTM) decoders", "bbox": {"l": 134.765, "t": 286.56692999999996, "r": 480.59271, "b": 295.36389, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "to predict a table in HTML representation. The", "bbox": {"l": 134.765, "t": 298.52190999999993, "r": 342.02097, "b": 307.31888, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "tag decoder", "bbox": {"l": 345.064, "t": 298.52190999999993, "r": 393.04684, "b": 307.31888, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "predicts a sequence", "bbox": {"l": 397.16699, "t": 298.52190999999993, "r": 480.59082, "b": 307.31888, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "of HTML tags. For each decoded table cell (", "bbox": {"l": 134.76498, "t": 310.47791, "r": 333.29871, "b": 319.27487, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "<td>", "bbox": {"l": 333.29898, "t": 310.47791, "r": 356.9711, "b": 319.27487, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "), the attention is passed to", "bbox": {"l": 357.08499, "t": 310.47791, "r": 480.59433000000007, "b": 319.27487, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "the", "bbox": {"l": 134.76498, "t": 322.43289, "r": 148.59805, "b": 331.22986, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "cell decoder", "bbox": {"l": 152.27698, "t": 322.43289, "r": 202.1109, "b": 331.22986, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "to predict the content with an embedded OCR approach. The", "bbox": {"l": 206.86398, "t": 322.43289, "r": 480.58743, "b": 331.22986, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "latter makes it susceptible to transcription errors in the cell content of the table.", "bbox": {"l": 134.76498, "t": 334.38788, "r": 480.59476, "b": 343.18484, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "TableFormer address this reliance on OCR and uses two transformer decoders for", "bbox": {"l": 134.76498, "t": 346.34286, "r": 480.58675999999997, "b": 355.13983, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "HTML structure and cell bounding box prediction in an end-to-end architecture.", "bbox": {"l": 134.76498, "t": 358.29785, "r": 480.58868, "b": 367.09482, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "The predicted cell bounding box is then used to extract text tokens from an", "bbox": {"l": 134.76498, "t": 370.25284, "r": 480.58868, "b": 379.0498, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "originating (digital) PDF page, circumventing any need for OCR. TabSplitter", "bbox": {"l": 134.76498, "t": 382.20883, "r": 480.59357000000006, "b": 391.0058, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "[2]", "bbox": {"l": 134.76498, "t": 394.16382, "r": 144.76979, "b": 402.96078, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "proposes a compact double-matrix representation of table rows and columns", "bbox": {"l": 149.50908, "t": 394.16382, "r": 480.58667, "b": 402.96078, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "to do error detection and error correction of HTML structure sequences based", "bbox": {"l": 134.76498, "t": 406.1188, "r": 480.59569999999997, "b": 414.91576999999995, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "on predictions from [19]. This compact double-matrix representation can not be", "bbox": {"l": 134.76498, "t": 418.07379, "r": 480.59180000000003, "b": 426.87076, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "used directly by the Img2seq model training, so the model uses HTML as an", "bbox": {"l": 134.76498, "t": 430.02878, "r": 480.5878000000001, "b": 438.82574, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "intermediate form. Chi et. al. [4] introduce a data set and a baseline method", "bbox": {"l": 134.76498, "t": 441.98376, "r": 480.58868, "b": 450.78073, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "using bidirectional LSTMs to predict LaTeX code. Kayal", "bbox": {"l": 134.76498, "t": 453.93976000000004, "r": 384.5752, "b": 462.73672, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "[5]", "bbox": {"l": 391.55899, "t": 453.93976000000004, "r": 401.73236, "b": 462.73672, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "introduces Gated", "bbox": {"l": 406.55154, "t": 453.93976000000004, "r": 480.58777, "b": 462.73672, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "ResNet transformers to predict LaTeX code, and a separate OCR module to", "bbox": {"l": 134.76498, "t": 465.89474, "r": 480.59079, "b": 474.69171, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "extract content.", "bbox": {"l": 134.76498, "t": 477.84973, "r": 203.68625, "b": 486.6467, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 134.76498, "t": 490.06573, "r": 480.59378, "b": 582.54866, "coord_origin": "TOPLEFT"}, "confidence": 0.9853583574295044, "cells": [{"id": 43, "text": "Im2Seq approaches have shown to be well-suited for the TSR task and allow a", "bbox": {"l": 149.70898, "t": 490.06573, "r": 480.59378, "b": 498.8627, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "full end-to-end network design that can output the final table structure without", "bbox": {"l": 134.76498, "t": 502.02072, "r": 480.58871, "b": 510.81769, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "pre- or post-processing logic. Furthermore, Im2Seq models have demonstrated", "bbox": {"l": 134.76498, "t": 513.9757099999999, "r": 480.58675999999997, "b": 522.7726700000001, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "to deliver state-of-the-art prediction accuracy [9]. This motivated the authors", "bbox": {"l": 134.76498, "t": 525.93069, "r": 480.58978, "b": 534.72766, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "to investigate if the performance (both in accuracy and inference time) can", "bbox": {"l": 134.76498, "t": 537.8857, "r": 480.58765, "b": 546.6826599999999, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "be further improved by optimising the table structure representation language.", "bbox": {"l": 134.76498, "t": 549.84169, "r": 480.58971999999994, "b": 558.63866, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "We believe this is a necessary step before further improving neural network", "bbox": {"l": 134.76498, "t": 561.79669, "r": 480.58871, "b": 570.59366, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "architectures for this task.", "bbox": {"l": 134.76498, "t": 573.75169, "r": 249.27811, "b": 582.54866, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "section_header", "bbox": {"l": 134.76498, "t": 605.54984, "r": 269.62442, "b": 616.11823, "coord_origin": "TOPLEFT"}, "confidence": 0.9393903017044067, "cells": [{"id": 51, "text": "3", "bbox": {"l": 134.76498, "t": 605.54984, "r": 141.48859, "b": 616.11823, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Problem Statement", "bbox": {"l": 154.93819, "t": 605.54984, "r": 269.62442, "b": 616.11823, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 134.76498, "t": 632.14769, "r": 480.5936899999999, "b": 664.85566, "coord_origin": "TOPLEFT"}, "confidence": 0.9692807197570801, "cells": [{"id": 53, "text": "All known Im2Seq based models for TSR fundamentally work in similar ways.", "bbox": {"l": 134.76498, "t": 632.14769, "r": 480.59064, "b": 640.94466, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "Given an image of a table, the Im2Seq model predicts the structure of the table", "bbox": {"l": 134.76498, "t": 644.1026899999999, "r": 480.5867, "b": 652.89966, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "by generating a sequence of tokens. These tokens originate from a finite vocab-", "bbox": {"l": 134.76498, "t": 656.0586900000001, "r": 480.5936899999999, "b": 664.85566, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_header", "id": 6, "page_no": 3, "cluster": {"id": 6, "label": "page_header", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.7890051603317261, "cells": [{"id": 0, "text": "4", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4"}, {"label": "page_header", "id": 5, "page_no": 3, "cluster": {"id": 5, "label": "page_header", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9045588374137878, "cells": [{"id": 1, "text": "M.", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 178.07675, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37415, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "M. Lysak, et al."}, {"label": "text", "id": 2, "page_no": 3, "cluster": {"id": 2, "label": "text", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.5957599999999, "b": 259.23792000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9467443823814392, "cells": [{"id": 3, "text": "Other work [20] aims at predicting a grid for each table and deciding which cells", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.59375, "b": 127.73077, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "must be merged using an attention network. Im2Seq methods cast the problem", "bbox": {"l": 134.765, "t": 130.88878999999997, "r": 480.58774, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "as a sequence generation task [4,5,9,22], and therefore need an internal table-", "bbox": {"l": 134.765, "t": 142.84479, "r": 480.58675999999997, "b": 151.64178000000004, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "structure representation language, which is often implemented with standard", "bbox": {"l": 134.765, "t": 154.7998, "r": 480.5878000000001, "b": 163.59680000000003, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "markup languages (e.g. HTML, LaTeX, Markdown). In theory, Im2Seq methods", "bbox": {"l": 134.765, "t": 166.75482, "r": 480.59271, "b": 175.55182000000002, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "have a natural advantage over the OD and GNN methods by virtue of directly", "bbox": {"l": 134.765, "t": 178.70983999999999, "r": 480.5957599999999, "b": 187.50684, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "predicting the table-structure. As such, no post-processing or rules are needed", "bbox": {"l": 134.765, "t": 190.66485999999998, "r": 480.59271, "b": 199.46185000000003, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "in order to obtain the table-structure, which is necessary with OD and GNN", "bbox": {"l": 134.765, "t": 202.61987, "r": 480.59378, "b": 211.41687000000002, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "approaches. In practice, this is not entirely true, because a predicted sequence", "bbox": {"l": 134.765, "t": 214.57587, "r": 480.58783000000005, "b": 223.37285999999995, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "of table-structure markup does not necessarily have to be syntactically correct.", "bbox": {"l": 134.765, "t": 226.53088000000002, "r": 480.58978, "b": 235.32788000000005, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Hence, depending on the quality of the predicted sequence, some post-processing", "bbox": {"l": 134.765, "t": 238.48590000000002, "r": 480.59572999999995, "b": 247.28290000000004, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "needs to be performed to ensure a syntactically valid (let alone correct) sequence.", "bbox": {"l": 134.765, "t": 250.44092, "r": 480.59473, "b": 259.23792000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Other work [20] aims at predicting a grid for each table and deciding which cells must be merged using an attention network. Im2Seq methods cast the problem as a sequence generation task [4,5,9,22], and therefore need an internal tablestructure representation language, which is often implemented with standard markup languages (e.g. HTML, LaTeX, Markdown). In theory, Im2Seq methods have a natural advantage over the OD and GNN methods by virtue of directly predicting the table-structure. As such, no post-processing or rules are needed in order to obtain the table-structure, which is necessary with OD and GNN approaches. In practice, this is not entirely true, because a predicted sequence of table-structure markup does not necessarily have to be syntactically correct. Hence, depending on the quality of the predicted sequence, some post-processing needs to be performed to ensure a syntactically valid (let alone correct) sequence."}, {"label": "text", "id": 4, "page_no": 3, "cluster": {"id": 4, "label": "text", "bbox": {"l": 134.76498, "t": 262.65692, "r": 480.59569999999997, "b": 486.6467, "coord_origin": "TOPLEFT"}, "confidence": 0.929087221622467, "cells": [{"id": 15, "text": "Within the Im2Seq method, we find several popular models, namely the", "bbox": {"l": 149.709, "t": 262.65692, "r": 480.59280000000007, "b": 271.45392000000004, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "encoder-dual-decoder model (EDD) [22], TableFormer [9], Tabsplitter[2] and Ye", "bbox": {"l": 134.765, "t": 274.61194, "r": 480.59167, "b": 283.40891, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "et. al. [19]. EDD uses two consecutive long short-term memory (LSTM) decoders", "bbox": {"l": 134.765, "t": 286.56692999999996, "r": 480.59271, "b": 295.36389, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "to predict a table in HTML representation. The", "bbox": {"l": 134.765, "t": 298.52190999999993, "r": 342.02097, "b": 307.31888, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "tag decoder", "bbox": {"l": 345.064, "t": 298.52190999999993, "r": 393.04684, "b": 307.31888, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "predicts a sequence", "bbox": {"l": 397.16699, "t": 298.52190999999993, "r": 480.59082, "b": 307.31888, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "of HTML tags. For each decoded table cell (", "bbox": {"l": 134.76498, "t": 310.47791, "r": 333.29871, "b": 319.27487, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "<td>", "bbox": {"l": 333.29898, "t": 310.47791, "r": 356.9711, "b": 319.27487, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "), the attention is passed to", "bbox": {"l": 357.08499, "t": 310.47791, "r": 480.59433000000007, "b": 319.27487, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "the", "bbox": {"l": 134.76498, "t": 322.43289, "r": 148.59805, "b": 331.22986, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "cell decoder", "bbox": {"l": 152.27698, "t": 322.43289, "r": 202.1109, "b": 331.22986, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "to predict the content with an embedded OCR approach. The", "bbox": {"l": 206.86398, "t": 322.43289, "r": 480.58743, "b": 331.22986, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "latter makes it susceptible to transcription errors in the cell content of the table.", "bbox": {"l": 134.76498, "t": 334.38788, "r": 480.59476, "b": 343.18484, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "TableFormer address this reliance on OCR and uses two transformer decoders for", "bbox": {"l": 134.76498, "t": 346.34286, "r": 480.58675999999997, "b": 355.13983, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "HTML structure and cell bounding box prediction in an end-to-end architecture.", "bbox": {"l": 134.76498, "t": 358.29785, "r": 480.58868, "b": 367.09482, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "The predicted cell bounding box is then used to extract text tokens from an", "bbox": {"l": 134.76498, "t": 370.25284, "r": 480.58868, "b": 379.0498, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "originating (digital) PDF page, circumventing any need for OCR. TabSplitter", "bbox": {"l": 134.76498, "t": 382.20883, "r": 480.59357000000006, "b": 391.0058, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "[2]", "bbox": {"l": 134.76498, "t": 394.16382, "r": 144.76979, "b": 402.96078, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "proposes a compact double-matrix representation of table rows and columns", "bbox": {"l": 149.50908, "t": 394.16382, "r": 480.58667, "b": 402.96078, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "to do error detection and error correction of HTML structure sequences based", "bbox": {"l": 134.76498, "t": 406.1188, "r": 480.59569999999997, "b": 414.91576999999995, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "on predictions from [19]. This compact double-matrix representation can not be", "bbox": {"l": 134.76498, "t": 418.07379, "r": 480.59180000000003, "b": 426.87076, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "used directly by the Img2seq model training, so the model uses HTML as an", "bbox": {"l": 134.76498, "t": 430.02878, "r": 480.5878000000001, "b": 438.82574, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "intermediate form. Chi et. al. [4] introduce a data set and a baseline method", "bbox": {"l": 134.76498, "t": 441.98376, "r": 480.58868, "b": 450.78073, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "using bidirectional LSTMs to predict LaTeX code. Kayal", "bbox": {"l": 134.76498, "t": 453.93976000000004, "r": 384.5752, "b": 462.73672, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "[5]", "bbox": {"l": 391.55899, "t": 453.93976000000004, "r": 401.73236, "b": 462.73672, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "introduces Gated", "bbox": {"l": 406.55154, "t": 453.93976000000004, "r": 480.58777, "b": 462.73672, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "ResNet transformers to predict LaTeX code, and a separate OCR module to", "bbox": {"l": 134.76498, "t": 465.89474, "r": 480.59079, "b": 474.69171, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "extract content.", "bbox": {"l": 134.76498, "t": 477.84973, "r": 203.68625, "b": 486.6467, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Within the Im2Seq method, we find several popular models, namely the encoder-dual-decoder model (EDD) [22], TableFormer [9], Tabsplitter[2] and Ye et. al. [19]. EDD uses two consecutive long short-term memory (LSTM) decoders to predict a table in HTML representation. The tag decoder predicts a sequence of HTML tags. For each decoded table cell ( <td> ), the attention is passed to the cell decoder to predict the content with an embedded OCR approach. The latter makes it susceptible to transcription errors in the cell content of the table. TableFormer address this reliance on OCR and uses two transformer decoders for HTML structure and cell bounding box prediction in an end-to-end architecture. The predicted cell bounding box is then used to extract text tokens from an originating (digital) PDF page, circumventing any need for OCR. TabSplitter [2] proposes a compact double-matrix representation of table rows and columns to do error detection and error correction of HTML structure sequences based on predictions from [19]. This compact double-matrix representation can not be used directly by the Img2seq model training, so the model uses HTML as an intermediate form. Chi et. al. [4] introduce a data set and a baseline method using bidirectional LSTMs to predict LaTeX code. Kayal [5] introduces Gated ResNet transformers to predict LaTeX code, and a separate OCR module to extract content."}, {"label": "text", "id": 0, "page_no": 3, "cluster": {"id": 0, "label": "text", "bbox": {"l": 134.76498, "t": 490.06573, "r": 480.59378, "b": 582.54866, "coord_origin": "TOPLEFT"}, "confidence": 0.9853583574295044, "cells": [{"id": 43, "text": "Im2Seq approaches have shown to be well-suited for the TSR task and allow a", "bbox": {"l": 149.70898, "t": 490.06573, "r": 480.59378, "b": 498.8627, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "full end-to-end network design that can output the final table structure without", "bbox": {"l": 134.76498, "t": 502.02072, "r": 480.58871, "b": 510.81769, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "pre- or post-processing logic. Furthermore, Im2Seq models have demonstrated", "bbox": {"l": 134.76498, "t": 513.9757099999999, "r": 480.58675999999997, "b": 522.7726700000001, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "to deliver state-of-the-art prediction accuracy [9]. This motivated the authors", "bbox": {"l": 134.76498, "t": 525.93069, "r": 480.58978, "b": 534.72766, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "to investigate if the performance (both in accuracy and inference time) can", "bbox": {"l": 134.76498, "t": 537.8857, "r": 480.58765, "b": 546.6826599999999, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "be further improved by optimising the table structure representation language.", "bbox": {"l": 134.76498, "t": 549.84169, "r": 480.58971999999994, "b": 558.63866, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "We believe this is a necessary step before further improving neural network", "bbox": {"l": 134.76498, "t": 561.79669, "r": 480.58871, "b": 570.59366, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "architectures for this task.", "bbox": {"l": 134.76498, "t": 573.75169, "r": 249.27811, "b": 582.54866, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Im2Seq approaches have shown to be well-suited for the TSR task and allow a full end-to-end network design that can output the final table structure without pre- or post-processing logic. Furthermore, Im2Seq models have demonstrated to deliver state-of-the-art prediction accuracy [9]. This motivated the authors to investigate if the performance (both in accuracy and inference time) can be further improved by optimising the table structure representation language. We believe this is a necessary step before further improving neural network architectures for this task."}, {"label": "section_header", "id": 3, "page_no": 3, "cluster": {"id": 3, "label": "section_header", "bbox": {"l": 134.76498, "t": 605.54984, "r": 269.62442, "b": 616.11823, "coord_origin": "TOPLEFT"}, "confidence": 0.9393903017044067, "cells": [{"id": 51, "text": "3", "bbox": {"l": 134.76498, "t": 605.54984, "r": 141.48859, "b": 616.11823, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Problem Statement", "bbox": {"l": 154.93819, "t": 605.54984, "r": 269.62442, "b": 616.11823, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3 Problem Statement"}, {"label": "text", "id": 1, "page_no": 3, "cluster": {"id": 1, "label": "text", "bbox": {"l": 134.76498, "t": 632.14769, "r": 480.5936899999999, "b": 664.85566, "coord_origin": "TOPLEFT"}, "confidence": 0.9692807197570801, "cells": [{"id": 53, "text": "All known Im2Seq based models for TSR fundamentally work in similar ways.", "bbox": {"l": 134.76498, "t": 632.14769, "r": 480.59064, "b": 640.94466, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "Given an image of a table, the Im2Seq model predicts the structure of the table", "bbox": {"l": 134.76498, "t": 644.1026899999999, "r": 480.5867, "b": 652.89966, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "by generating a sequence of tokens. These tokens originate from a finite vocab-", "bbox": {"l": 134.76498, "t": 656.0586900000001, "r": 480.5936899999999, "b": 664.85566, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "All known Im2Seq based models for TSR fundamentally work in similar ways. Given an image of a table, the Im2Seq model predicts the structure of the table by generating a sequence of tokens. These tokens originate from a finite vocab-"}], "body": [{"label": "text", "id": 2, "page_no": 3, "cluster": {"id": 2, "label": "text", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.5957599999999, "b": 259.23792000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9467443823814392, "cells": [{"id": 3, "text": "Other work [20] aims at predicting a grid for each table and deciding which cells", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.59375, "b": 127.73077, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "must be merged using an attention network. Im2Seq methods cast the problem", "bbox": {"l": 134.765, "t": 130.88878999999997, "r": 480.58774, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "as a sequence generation task [4,5,9,22], and therefore need an internal table-", "bbox": {"l": 134.765, "t": 142.84479, "r": 480.58675999999997, "b": 151.64178000000004, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "structure representation language, which is often implemented with standard", "bbox": {"l": 134.765, "t": 154.7998, "r": 480.5878000000001, "b": 163.59680000000003, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "markup languages (e.g. HTML, LaTeX, Markdown). In theory, Im2Seq methods", "bbox": {"l": 134.765, "t": 166.75482, "r": 480.59271, "b": 175.55182000000002, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "have a natural advantage over the OD and GNN methods by virtue of directly", "bbox": {"l": 134.765, "t": 178.70983999999999, "r": 480.5957599999999, "b": 187.50684, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "predicting the table-structure. As such, no post-processing or rules are needed", "bbox": {"l": 134.765, "t": 190.66485999999998, "r": 480.59271, "b": 199.46185000000003, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "in order to obtain the table-structure, which is necessary with OD and GNN", "bbox": {"l": 134.765, "t": 202.61987, "r": 480.59378, "b": 211.41687000000002, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "approaches. In practice, this is not entirely true, because a predicted sequence", "bbox": {"l": 134.765, "t": 214.57587, "r": 480.58783000000005, "b": 223.37285999999995, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "of table-structure markup does not necessarily have to be syntactically correct.", "bbox": {"l": 134.765, "t": 226.53088000000002, "r": 480.58978, "b": 235.32788000000005, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Hence, depending on the quality of the predicted sequence, some post-processing", "bbox": {"l": 134.765, "t": 238.48590000000002, "r": 480.59572999999995, "b": 247.28290000000004, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "needs to be performed to ensure a syntactically valid (let alone correct) sequence.", "bbox": {"l": 134.765, "t": 250.44092, "r": 480.59473, "b": 259.23792000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Other work [20] aims at predicting a grid for each table and deciding which cells must be merged using an attention network. Im2Seq methods cast the problem as a sequence generation task [4,5,9,22], and therefore need an internal tablestructure representation language, which is often implemented with standard markup languages (e.g. HTML, LaTeX, Markdown). In theory, Im2Seq methods have a natural advantage over the OD and GNN methods by virtue of directly predicting the table-structure. As such, no post-processing or rules are needed in order to obtain the table-structure, which is necessary with OD and GNN approaches. In practice, this is not entirely true, because a predicted sequence of table-structure markup does not necessarily have to be syntactically correct. Hence, depending on the quality of the predicted sequence, some post-processing needs to be performed to ensure a syntactically valid (let alone correct) sequence."}, {"label": "text", "id": 4, "page_no": 3, "cluster": {"id": 4, "label": "text", "bbox": {"l": 134.76498, "t": 262.65692, "r": 480.59569999999997, "b": 486.6467, "coord_origin": "TOPLEFT"}, "confidence": 0.929087221622467, "cells": [{"id": 15, "text": "Within the Im2Seq method, we find several popular models, namely the", "bbox": {"l": 149.709, "t": 262.65692, "r": 480.59280000000007, "b": 271.45392000000004, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "encoder-dual-decoder model (EDD) [22], TableFormer [9], Tabsplitter[2] and Ye", "bbox": {"l": 134.765, "t": 274.61194, "r": 480.59167, "b": 283.40891, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "et. al. [19]. EDD uses two consecutive long short-term memory (LSTM) decoders", "bbox": {"l": 134.765, "t": 286.56692999999996, "r": 480.59271, "b": 295.36389, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "to predict a table in HTML representation. The", "bbox": {"l": 134.765, "t": 298.52190999999993, "r": 342.02097, "b": 307.31888, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "tag decoder", "bbox": {"l": 345.064, "t": 298.52190999999993, "r": 393.04684, "b": 307.31888, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "predicts a sequence", "bbox": {"l": 397.16699, "t": 298.52190999999993, "r": 480.59082, "b": 307.31888, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "of HTML tags. For each decoded table cell (", "bbox": {"l": 134.76498, "t": 310.47791, "r": 333.29871, "b": 319.27487, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "<td>", "bbox": {"l": 333.29898, "t": 310.47791, "r": 356.9711, "b": 319.27487, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "), the attention is passed to", "bbox": {"l": 357.08499, "t": 310.47791, "r": 480.59433000000007, "b": 319.27487, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "the", "bbox": {"l": 134.76498, "t": 322.43289, "r": 148.59805, "b": 331.22986, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "cell decoder", "bbox": {"l": 152.27698, "t": 322.43289, "r": 202.1109, "b": 331.22986, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "to predict the content with an embedded OCR approach. The", "bbox": {"l": 206.86398, "t": 322.43289, "r": 480.58743, "b": 331.22986, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "latter makes it susceptible to transcription errors in the cell content of the table.", "bbox": {"l": 134.76498, "t": 334.38788, "r": 480.59476, "b": 343.18484, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "TableFormer address this reliance on OCR and uses two transformer decoders for", "bbox": {"l": 134.76498, "t": 346.34286, "r": 480.58675999999997, "b": 355.13983, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "HTML structure and cell bounding box prediction in an end-to-end architecture.", "bbox": {"l": 134.76498, "t": 358.29785, "r": 480.58868, "b": 367.09482, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "The predicted cell bounding box is then used to extract text tokens from an", "bbox": {"l": 134.76498, "t": 370.25284, "r": 480.58868, "b": 379.0498, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "originating (digital) PDF page, circumventing any need for OCR. TabSplitter", "bbox": {"l": 134.76498, "t": 382.20883, "r": 480.59357000000006, "b": 391.0058, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "[2]", "bbox": {"l": 134.76498, "t": 394.16382, "r": 144.76979, "b": 402.96078, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "proposes a compact double-matrix representation of table rows and columns", "bbox": {"l": 149.50908, "t": 394.16382, "r": 480.58667, "b": 402.96078, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "to do error detection and error correction of HTML structure sequences based", "bbox": {"l": 134.76498, "t": 406.1188, "r": 480.59569999999997, "b": 414.91576999999995, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "on predictions from [19]. This compact double-matrix representation can not be", "bbox": {"l": 134.76498, "t": 418.07379, "r": 480.59180000000003, "b": 426.87076, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "used directly by the Img2seq model training, so the model uses HTML as an", "bbox": {"l": 134.76498, "t": 430.02878, "r": 480.5878000000001, "b": 438.82574, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "intermediate form. Chi et. al. [4] introduce a data set and a baseline method", "bbox": {"l": 134.76498, "t": 441.98376, "r": 480.58868, "b": 450.78073, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "using bidirectional LSTMs to predict LaTeX code. Kayal", "bbox": {"l": 134.76498, "t": 453.93976000000004, "r": 384.5752, "b": 462.73672, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "[5]", "bbox": {"l": 391.55899, "t": 453.93976000000004, "r": 401.73236, "b": 462.73672, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "introduces Gated", "bbox": {"l": 406.55154, "t": 453.93976000000004, "r": 480.58777, "b": 462.73672, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "ResNet transformers to predict LaTeX code, and a separate OCR module to", "bbox": {"l": 134.76498, "t": 465.89474, "r": 480.59079, "b": 474.69171, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "extract content.", "bbox": {"l": 134.76498, "t": 477.84973, "r": 203.68625, "b": 486.6467, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Within the Im2Seq method, we find several popular models, namely the encoder-dual-decoder model (EDD) [22], TableFormer [9], Tabsplitter[2] and Ye et. al. [19]. EDD uses two consecutive long short-term memory (LSTM) decoders to predict a table in HTML representation. The tag decoder predicts a sequence of HTML tags. For each decoded table cell ( <td> ), the attention is passed to the cell decoder to predict the content with an embedded OCR approach. The latter makes it susceptible to transcription errors in the cell content of the table. TableFormer address this reliance on OCR and uses two transformer decoders for HTML structure and cell bounding box prediction in an end-to-end architecture. The predicted cell bounding box is then used to extract text tokens from an originating (digital) PDF page, circumventing any need for OCR. TabSplitter [2] proposes a compact double-matrix representation of table rows and columns to do error detection and error correction of HTML structure sequences based on predictions from [19]. This compact double-matrix representation can not be used directly by the Img2seq model training, so the model uses HTML as an intermediate form. Chi et. al. [4] introduce a data set and a baseline method using bidirectional LSTMs to predict LaTeX code. Kayal [5] introduces Gated ResNet transformers to predict LaTeX code, and a separate OCR module to extract content."}, {"label": "text", "id": 0, "page_no": 3, "cluster": {"id": 0, "label": "text", "bbox": {"l": 134.76498, "t": 490.06573, "r": 480.59378, "b": 582.54866, "coord_origin": "TOPLEFT"}, "confidence": 0.9853583574295044, "cells": [{"id": 43, "text": "Im2Seq approaches have shown to be well-suited for the TSR task and allow a", "bbox": {"l": 149.70898, "t": 490.06573, "r": 480.59378, "b": 498.8627, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "full end-to-end network design that can output the final table structure without", "bbox": {"l": 134.76498, "t": 502.02072, "r": 480.58871, "b": 510.81769, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "pre- or post-processing logic. Furthermore, Im2Seq models have demonstrated", "bbox": {"l": 134.76498, "t": 513.9757099999999, "r": 480.58675999999997, "b": 522.7726700000001, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "to deliver state-of-the-art prediction accuracy [9]. This motivated the authors", "bbox": {"l": 134.76498, "t": 525.93069, "r": 480.58978, "b": 534.72766, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "to investigate if the performance (both in accuracy and inference time) can", "bbox": {"l": 134.76498, "t": 537.8857, "r": 480.58765, "b": 546.6826599999999, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "be further improved by optimising the table structure representation language.", "bbox": {"l": 134.76498, "t": 549.84169, "r": 480.58971999999994, "b": 558.63866, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "We believe this is a necessary step before further improving neural network", "bbox": {"l": 134.76498, "t": 561.79669, "r": 480.58871, "b": 570.59366, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "architectures for this task.", "bbox": {"l": 134.76498, "t": 573.75169, "r": 249.27811, "b": 582.54866, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Im2Seq approaches have shown to be well-suited for the TSR task and allow a full end-to-end network design that can output the final table structure without pre- or post-processing logic. Furthermore, Im2Seq models have demonstrated to deliver state-of-the-art prediction accuracy [9]. This motivated the authors to investigate if the performance (both in accuracy and inference time) can be further improved by optimising the table structure representation language. We believe this is a necessary step before further improving neural network architectures for this task."}, {"label": "section_header", "id": 3, "page_no": 3, "cluster": {"id": 3, "label": "section_header", "bbox": {"l": 134.76498, "t": 605.54984, "r": 269.62442, "b": 616.11823, "coord_origin": "TOPLEFT"}, "confidence": 0.9393903017044067, "cells": [{"id": 51, "text": "3", "bbox": {"l": 134.76498, "t": 605.54984, "r": 141.48859, "b": 616.11823, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Problem Statement", "bbox": {"l": 154.93819, "t": 605.54984, "r": 269.62442, "b": 616.11823, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3 Problem Statement"}, {"label": "text", "id": 1, "page_no": 3, "cluster": {"id": 1, "label": "text", "bbox": {"l": 134.76498, "t": 632.14769, "r": 480.5936899999999, "b": 664.85566, "coord_origin": "TOPLEFT"}, "confidence": 0.9692807197570801, "cells": [{"id": 53, "text": "All known Im2Seq based models for TSR fundamentally work in similar ways.", "bbox": {"l": 134.76498, "t": 632.14769, "r": 480.59064, "b": 640.94466, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "Given an image of a table, the Im2Seq model predicts the structure of the table", "bbox": {"l": 134.76498, "t": 644.1026899999999, "r": 480.5867, "b": 652.89966, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "by generating a sequence of tokens. These tokens originate from a finite vocab-", "bbox": {"l": 134.76498, "t": 656.0586900000001, "r": 480.5936899999999, "b": 664.85566, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "All known Im2Seq based models for TSR fundamentally work in similar ways. Given an image of a table, the Im2Seq model predicts the structure of the table by generating a sequence of tokens. These tokens originate from a finite vocab-"}], "headers": [{"label": "page_header", "id": 6, "page_no": 3, "cluster": {"id": 6, "label": "page_header", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.7890051603317261, "cells": [{"id": 0, "text": "4", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4"}, {"label": "page_header", "id": 5, "page_no": 3, "cluster": {"id": 5, "label": "page_header", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9045588374137878, "cells": [{"id": 1, "text": "M.", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 178.07675, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37415, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "M. Lysak, et al."}]}}, {"page_no": 4, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "5", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "ulary and can be interpreted as a table structure. For example, with the HTML", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.58577999999994, "b": 127.73077, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "tokens", "bbox": {"l": 134.765, "t": 130.88878999999997, "r": 162.48494, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "<table>", "bbox": {"l": 166.368, "t": 130.88878999999997, "r": 201.74918, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": ",", "bbox": {"l": 201.74899, "t": 130.88878999999997, "r": 204.51561, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "</table>", "bbox": {"l": 208.39699, "t": 130.88878999999997, "r": 248.86904999999996, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": ",", "bbox": {"l": 248.86899, "t": 130.88878999999997, "r": 251.6356, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "<tr>", "bbox": {"l": 255.51698, "t": 130.88878999999997, "r": 278.29846, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": ",", "bbox": {"l": 278.29797, "t": 130.88878999999997, "r": 281.06458, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "</tr>", "bbox": {"l": 284.94598, "t": 130.88878999999997, "r": 312.81836, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": ",", "bbox": {"l": 312.81799, "t": 130.88878999999997, "r": 315.58459, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "<td>", "bbox": {"l": 319.466, "t": 130.88878999999997, "r": 343.13812, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "and", "bbox": {"l": 347.13202, "t": 130.88878999999997, "r": 363.17877, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "</td>", "bbox": {"l": 367.06003, "t": 130.88878999999997, "r": 395.82306, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": ", one can construct", "bbox": {"l": 395.82303, "t": 130.88878999999997, "r": 480.59177000000005, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "simple table structures without any spanning cells. In reality though, one needs", "bbox": {"l": 134.76501, "t": 142.84479, "r": 480.59365999999994, "b": 151.64178000000004, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "at least 28 HTML tokens to describe the most common complex tables observed", "bbox": {"l": 134.76501, "t": 154.7998, "r": 480.58577999999994, "b": 163.59680000000003, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "in real-world documents [21,22], due to a variety of spanning cells definitions in", "bbox": {"l": 134.76501, "t": 166.75482, "r": 480.59378, "b": 175.55182000000002, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "the HTML token vocabulary.", "bbox": {"l": 134.76501, "t": 178.70983999999999, "r": 261.92566, "b": 187.50684, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Fig. 2.", "bbox": {"l": 145.60701, "t": 221.07928000000004, "r": 173.48625, "b": 229.00562000000002, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Frequency of tokens in HTML and OTSL as they appear in PubTabNet.", "bbox": {"l": 176.56001, "t": 221.14209000000005, "r": 469.75223000000005, "b": 229.21178999999995, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "Obviously, HTML and other general-purpose markup languages were not de-", "bbox": {"l": 149.709, "t": 368.20679, "r": 480.59283000000005, "b": 377.00375, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "signed for Im2Seq models. As such, they have some serious drawbacks. First, the", "bbox": {"l": 134.765, "t": 380.16177, "r": 480.58664, "b": 388.9587399999999, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "token vocabulary needs to be artificially large in order to describe all plausible", "bbox": {"l": 134.765, "t": 392.11676, "r": 480.59180000000003, "b": 400.91373, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "tabular structures. Since most Im2Seq models use an autoregressive approach,", "bbox": {"l": 134.765, "t": 404.07175, "r": 480.5897499999999, "b": 412.86871, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "they generate the sequence token by token. Therefore, to reduce inference time,", "bbox": {"l": 134.765, "t": 416.02774, "r": 480.58871, "b": 424.82471, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "a shorter sequence length is critical. Every table-cell is represented by at least", "bbox": {"l": 134.765, "t": 427.98273, "r": 480.59265, "b": 436.77969, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "two tokens (", "bbox": {"l": 134.765, "t": 439.9377099999999, "r": 187.93439, "b": 448.73467999999997, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "<td>", "bbox": {"l": 187.931, "t": 439.9377099999999, "r": 211.60313, "b": 448.73467999999997, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "and", "bbox": {"l": 214.75400000000002, "t": 439.9377099999999, "r": 230.80075000000002, "b": 448.73467999999997, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "</td>", "bbox": {"l": 233.83898999999997, "t": 439.9377099999999, "r": 262.60202, "b": 448.73467999999997, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "). Furthermore, when tokenizing the HTML struc-", "bbox": {"l": 262.716, "t": 439.9377099999999, "r": 480.59009, "b": 448.73467999999997, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "ture, one needs to explicitly enumerate possible column-spans and row-spans", "bbox": {"l": 134.76501, "t": 451.8927, "r": 480.58777, "b": 460.68967, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "as words. In practice, this ends up requiring 28 different HTML tokens (when", "bbox": {"l": 134.76501, "t": 463.84769, "r": 480.58681999999993, "b": 472.64465, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "including column- and row-spans up to 10 cells) just to describe every table in", "bbox": {"l": 134.76501, "t": 475.80368, "r": 480.58681999999993, "b": 484.60065, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "the PubTabNet dataset. Clearly, not every token is equally represented, as is", "bbox": {"l": 134.76501, "t": 487.75867, "r": 480.59067, "b": 496.55563, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "depicted in Figure 2. This skewed distribution of tokens in combination with", "bbox": {"l": 134.76501, "t": 499.71365, "r": 480.59277, "b": 508.51062, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "variable token row-length makes it challenging for models to learn the HTML", "bbox": {"l": 134.76501, "t": 511.66864, "r": 480.59476, "b": 520.46561, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "structure.", "bbox": {"l": 134.76501, "t": 523.62363, "r": 176.92873, "b": 532.42059, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "Additionally, it would be desirable if the representation would easily allow", "bbox": {"l": 149.70901, "t": 536.04263, "r": 480.59289999999993, "b": 544.8396, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "an early detection of invalid sequences on-the-go, before the prediction of the", "bbox": {"l": 134.76501, "t": 547.99763, "r": 480.59085, "b": 556.7946000000001, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "entire table structure is completed. HTML is not well-suited for this purpose as", "bbox": {"l": 134.76501, "t": 559.95264, "r": 480.58984, "b": 568.7496, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "the verification of incomplete sequences is non-trivial or even impossible.", "bbox": {"l": 134.76501, "t": 571.90863, "r": 452.18933, "b": 580.7056, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "In a valid HTML table, the token sequence must describe a 2D grid of table", "bbox": {"l": 149.70901, "t": 584.32663, "r": 480.59283000000005, "b": 593.1236, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "cells, serialised in row-major ordering, where each row and each column have", "bbox": {"l": 134.76501, "t": 596.28262, "r": 480.58978, "b": 605.07959, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "the same length (while considering row- and column-spans). Furthermore, every", "bbox": {"l": 134.76501, "t": 608.23763, "r": 480.5936899999999, "b": 617.03459, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "opening tag in HTML needs to be matched by a closing tag in a correct hierar-", "bbox": {"l": 134.76501, "t": 620.19263, "r": 480.59091, "b": 628.98959, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "chical manner. Since the number of tokens for each table row and column can", "bbox": {"l": 134.76501, "t": 632.1476299999999, "r": 480.58582, "b": 640.9446, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "vary significantly, especially for large tables with many row- and column-spans,", "bbox": {"l": 134.76501, "t": 644.10263, "r": 480.59180000000003, "b": 652.8996, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "it is complex to verify the consistency of predicted structures during sequence", "bbox": {"l": 134.76501, "t": 656.05763, "r": 480.59473, "b": 664.85461, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 5, "label": "page_header", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9269194602966309, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "page_header", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8696112036705017, "cells": [{"id": 1, "text": "5", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.59378, "b": 187.50684, "coord_origin": "TOPLEFT"}, "confidence": 0.9857171773910522, "cells": [{"id": 2, "text": "ulary and can be interpreted as a table structure. For example, with the HTML", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.58577999999994, "b": 127.73077, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "tokens", "bbox": {"l": 134.765, "t": 130.88878999999997, "r": 162.48494, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "<table>", "bbox": {"l": 166.368, "t": 130.88878999999997, "r": 201.74918, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": ",", "bbox": {"l": 201.74899, "t": 130.88878999999997, "r": 204.51561, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "</table>", "bbox": {"l": 208.39699, "t": 130.88878999999997, "r": 248.86904999999996, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": ",", "bbox": {"l": 248.86899, "t": 130.88878999999997, "r": 251.6356, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "<tr>", "bbox": {"l": 255.51698, "t": 130.88878999999997, "r": 278.29846, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": ",", "bbox": {"l": 278.29797, "t": 130.88878999999997, "r": 281.06458, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "</tr>", "bbox": {"l": 284.94598, "t": 130.88878999999997, "r": 312.81836, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": ",", "bbox": {"l": 312.81799, "t": 130.88878999999997, "r": 315.58459, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "<td>", "bbox": {"l": 319.466, "t": 130.88878999999997, "r": 343.13812, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "and", "bbox": {"l": 347.13202, "t": 130.88878999999997, "r": 363.17877, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "</td>", "bbox": {"l": 367.06003, "t": 130.88878999999997, "r": 395.82306, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": ", one can construct", "bbox": {"l": 395.82303, "t": 130.88878999999997, "r": 480.59177000000005, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "simple table structures without any spanning cells. In reality though, one needs", "bbox": {"l": 134.76501, "t": 142.84479, "r": 480.59365999999994, "b": 151.64178000000004, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "at least 28 HTML tokens to describe the most common complex tables observed", "bbox": {"l": 134.76501, "t": 154.7998, "r": 480.58577999999994, "b": 163.59680000000003, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "in real-world documents [21,22], due to a variety of spanning cells definitions in", "bbox": {"l": 134.76501, "t": 166.75482, "r": 480.59378, "b": 175.55182000000002, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "the HTML token vocabulary.", "bbox": {"l": 134.76501, "t": 178.70983999999999, "r": 261.92566, "b": 187.50684, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "caption", "bbox": {"l": 145.60701, "t": 221.07928000000004, "r": 469.75223000000005, "b": 229.21178999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.8472551703453064, "cells": [{"id": 20, "text": "Fig. 2.", "bbox": {"l": 145.60701, "t": 221.07928000000004, "r": 173.48625, "b": 229.00562000000002, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Frequency of tokens in HTML and OTSL as they appear in PubTabNet.", "bbox": {"l": 176.56001, "t": 221.14209000000005, "r": 469.75223000000005, "b": 229.21178999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 134.765, "t": 368.20679, "r": 480.59476, "b": 532.42059, "coord_origin": "TOPLEFT"}, "confidence": 0.9844799637794495, "cells": [{"id": 22, "text": "Obviously, HTML and other general-purpose markup languages were not de-", "bbox": {"l": 149.709, "t": 368.20679, "r": 480.59283000000005, "b": 377.00375, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "signed for Im2Seq models. As such, they have some serious drawbacks. First, the", "bbox": {"l": 134.765, "t": 380.16177, "r": 480.58664, "b": 388.9587399999999, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "token vocabulary needs to be artificially large in order to describe all plausible", "bbox": {"l": 134.765, "t": 392.11676, "r": 480.59180000000003, "b": 400.91373, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "tabular structures. Since most Im2Seq models use an autoregressive approach,", "bbox": {"l": 134.765, "t": 404.07175, "r": 480.5897499999999, "b": 412.86871, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "they generate the sequence token by token. Therefore, to reduce inference time,", "bbox": {"l": 134.765, "t": 416.02774, "r": 480.58871, "b": 424.82471, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "a shorter sequence length is critical. Every table-cell is represented by at least", "bbox": {"l": 134.765, "t": 427.98273, "r": 480.59265, "b": 436.77969, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "two tokens (", "bbox": {"l": 134.765, "t": 439.9377099999999, "r": 187.93439, "b": 448.73467999999997, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "<td>", "bbox": {"l": 187.931, "t": 439.9377099999999, "r": 211.60313, "b": 448.73467999999997, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "and", "bbox": {"l": 214.75400000000002, "t": 439.9377099999999, "r": 230.80075000000002, "b": 448.73467999999997, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "</td>", "bbox": {"l": 233.83898999999997, "t": 439.9377099999999, "r": 262.60202, "b": 448.73467999999997, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "). Furthermore, when tokenizing the HTML struc-", "bbox": {"l": 262.716, "t": 439.9377099999999, "r": 480.59009, "b": 448.73467999999997, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "ture, one needs to explicitly enumerate possible column-spans and row-spans", "bbox": {"l": 134.76501, "t": 451.8927, "r": 480.58777, "b": 460.68967, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "as words. In practice, this ends up requiring 28 different HTML tokens (when", "bbox": {"l": 134.76501, "t": 463.84769, "r": 480.58681999999993, "b": 472.64465, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "including column- and row-spans up to 10 cells) just to describe every table in", "bbox": {"l": 134.76501, "t": 475.80368, "r": 480.58681999999993, "b": 484.60065, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "the PubTabNet dataset. Clearly, not every token is equally represented, as is", "bbox": {"l": 134.76501, "t": 487.75867, "r": 480.59067, "b": 496.55563, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "depicted in Figure 2. This skewed distribution of tokens in combination with", "bbox": {"l": 134.76501, "t": 499.71365, "r": 480.59277, "b": 508.51062, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "variable token row-length makes it challenging for models to learn the HTML", "bbox": {"l": 134.76501, "t": 511.66864, "r": 480.59476, "b": 520.46561, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "structure.", "bbox": {"l": 134.76501, "t": 523.62363, "r": 176.92873, "b": 532.42059, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 134.76501, "t": 536.04263, "r": 480.59289999999993, "b": 580.7056, "coord_origin": "TOPLEFT"}, "confidence": 0.978394627571106, "cells": [{"id": 40, "text": "Additionally, it would be desirable if the representation would easily allow", "bbox": {"l": 149.70901, "t": 536.04263, "r": 480.59289999999993, "b": 544.8396, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "an early detection of invalid sequences on-the-go, before the prediction of the", "bbox": {"l": 134.76501, "t": 547.99763, "r": 480.59085, "b": 556.7946000000001, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "entire table structure is completed. HTML is not well-suited for this purpose as", "bbox": {"l": 134.76501, "t": 559.95264, "r": 480.58984, "b": 568.7496, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "the verification of incomplete sequences is non-trivial or even impossible.", "bbox": {"l": 134.76501, "t": 571.90863, "r": 452.18933, "b": 580.7056, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 134.76501, "t": 584.32663, "r": 480.59473, "b": 664.85461, "coord_origin": "TOPLEFT"}, "confidence": 0.9838283061981201, "cells": [{"id": 44, "text": "In a valid HTML table, the token sequence must describe a 2D grid of table", "bbox": {"l": 149.70901, "t": 584.32663, "r": 480.59283000000005, "b": 593.1236, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "cells, serialised in row-major ordering, where each row and each column have", "bbox": {"l": 134.76501, "t": 596.28262, "r": 480.58978, "b": 605.07959, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "the same length (while considering row- and column-spans). Furthermore, every", "bbox": {"l": 134.76501, "t": 608.23763, "r": 480.5936899999999, "b": 617.03459, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "opening tag in HTML needs to be matched by a closing tag in a correct hierar-", "bbox": {"l": 134.76501, "t": 620.19263, "r": 480.59091, "b": 628.98959, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "chical manner. Since the number of tokens for each table row and column can", "bbox": {"l": 134.76501, "t": 632.1476299999999, "r": 480.58582, "b": 640.9446, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "vary significantly, especially for large tables with many row- and column-spans,", "bbox": {"l": 134.76501, "t": 644.10263, "r": 480.59180000000003, "b": 652.8996, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "it is complex to verify the consistency of predicted structures during sequence", "bbox": {"l": 134.76501, "t": 656.05763, "r": 480.59473, "b": 664.85461, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "picture", "bbox": {"l": 137.41448974609375, "t": 233.51231384277344, "r": 476.5608215332031, "b": 340.2304992675781, "coord_origin": "TOPLEFT"}, "confidence": 0.9387977123260498, "cells": [], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_header", "id": 5, "page_no": 4, "cluster": {"id": 5, "label": "page_header", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9269194602966309, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Optimized Table Tokenization for Table Structure Recognition"}, {"label": "page_header", "id": 6, "page_no": 4, "cluster": {"id": 6, "label": "page_header", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8696112036705017, "cells": [{"id": 1, "text": "5", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5"}, {"label": "text", "id": 0, "page_no": 4, "cluster": {"id": 0, "label": "text", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.59378, "b": 187.50684, "coord_origin": "TOPLEFT"}, "confidence": 0.9857171773910522, "cells": [{"id": 2, "text": "ulary and can be interpreted as a table structure. For example, with the HTML", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.58577999999994, "b": 127.73077, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "tokens", "bbox": {"l": 134.765, "t": 130.88878999999997, "r": 162.48494, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "<table>", "bbox": {"l": 166.368, "t": 130.88878999999997, "r": 201.74918, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": ",", "bbox": {"l": 201.74899, "t": 130.88878999999997, "r": 204.51561, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "</table>", "bbox": {"l": 208.39699, "t": 130.88878999999997, "r": 248.86904999999996, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": ",", "bbox": {"l": 248.86899, "t": 130.88878999999997, "r": 251.6356, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "<tr>", "bbox": {"l": 255.51698, "t": 130.88878999999997, "r": 278.29846, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": ",", "bbox": {"l": 278.29797, "t": 130.88878999999997, "r": 281.06458, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "</tr>", "bbox": {"l": 284.94598, "t": 130.88878999999997, "r": 312.81836, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": ",", "bbox": {"l": 312.81799, "t": 130.88878999999997, "r": 315.58459, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "<td>", "bbox": {"l": 319.466, "t": 130.88878999999997, "r": 343.13812, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "and", "bbox": {"l": 347.13202, "t": 130.88878999999997, "r": 363.17877, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "</td>", "bbox": {"l": 367.06003, "t": 130.88878999999997, "r": 395.82306, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": ", one can construct", "bbox": {"l": 395.82303, "t": 130.88878999999997, "r": 480.59177000000005, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "simple table structures without any spanning cells. In reality though, one needs", "bbox": {"l": 134.76501, "t": 142.84479, "r": 480.59365999999994, "b": 151.64178000000004, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "at least 28 HTML tokens to describe the most common complex tables observed", "bbox": {"l": 134.76501, "t": 154.7998, "r": 480.58577999999994, "b": 163.59680000000003, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "in real-world documents [21,22], due to a variety of spanning cells definitions in", "bbox": {"l": 134.76501, "t": 166.75482, "r": 480.59378, "b": 175.55182000000002, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "the HTML token vocabulary.", "bbox": {"l": 134.76501, "t": 178.70983999999999, "r": 261.92566, "b": 187.50684, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "ulary and can be interpreted as a table structure. For example, with the HTML tokens <table> , </table> , <tr> , </tr> , <td> and </td> , one can construct simple table structures without any spanning cells. In reality though, one needs at least 28 HTML tokens to describe the most common complex tables observed in real-world documents [21,22], due to a variety of spanning cells definitions in the HTML token vocabulary."}, {"label": "caption", "id": 7, "page_no": 4, "cluster": {"id": 7, "label": "caption", "bbox": {"l": 145.60701, "t": 221.07928000000004, "r": 469.75223000000005, "b": 229.21178999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.8472551703453064, "cells": [{"id": 20, "text": "Fig. 2.", "bbox": {"l": 145.60701, "t": 221.07928000000004, "r": 173.48625, "b": 229.00562000000002, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Frequency of tokens in HTML and OTSL as they appear in PubTabNet.", "bbox": {"l": 176.56001, "t": 221.14209000000005, "r": 469.75223000000005, "b": 229.21178999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Fig. 2. Frequency of tokens in HTML and OTSL as they appear in PubTabNet."}, {"label": "text", "id": 1, "page_no": 4, "cluster": {"id": 1, "label": "text", "bbox": {"l": 134.765, "t": 368.20679, "r": 480.59476, "b": 532.42059, "coord_origin": "TOPLEFT"}, "confidence": 0.9844799637794495, "cells": [{"id": 22, "text": "Obviously, HTML and other general-purpose markup languages were not de-", "bbox": {"l": 149.709, "t": 368.20679, "r": 480.59283000000005, "b": 377.00375, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "signed for Im2Seq models. As such, they have some serious drawbacks. First, the", "bbox": {"l": 134.765, "t": 380.16177, "r": 480.58664, "b": 388.9587399999999, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "token vocabulary needs to be artificially large in order to describe all plausible", "bbox": {"l": 134.765, "t": 392.11676, "r": 480.59180000000003, "b": 400.91373, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "tabular structures. Since most Im2Seq models use an autoregressive approach,", "bbox": {"l": 134.765, "t": 404.07175, "r": 480.5897499999999, "b": 412.86871, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "they generate the sequence token by token. Therefore, to reduce inference time,", "bbox": {"l": 134.765, "t": 416.02774, "r": 480.58871, "b": 424.82471, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "a shorter sequence length is critical. Every table-cell is represented by at least", "bbox": {"l": 134.765, "t": 427.98273, "r": 480.59265, "b": 436.77969, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "two tokens (", "bbox": {"l": 134.765, "t": 439.9377099999999, "r": 187.93439, "b": 448.73467999999997, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "<td>", "bbox": {"l": 187.931, "t": 439.9377099999999, "r": 211.60313, "b": 448.73467999999997, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "and", "bbox": {"l": 214.75400000000002, "t": 439.9377099999999, "r": 230.80075000000002, "b": 448.73467999999997, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "</td>", "bbox": {"l": 233.83898999999997, "t": 439.9377099999999, "r": 262.60202, "b": 448.73467999999997, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "). Furthermore, when tokenizing the HTML struc-", "bbox": {"l": 262.716, "t": 439.9377099999999, "r": 480.59009, "b": 448.73467999999997, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "ture, one needs to explicitly enumerate possible column-spans and row-spans", "bbox": {"l": 134.76501, "t": 451.8927, "r": 480.58777, "b": 460.68967, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "as words. In practice, this ends up requiring 28 different HTML tokens (when", "bbox": {"l": 134.76501, "t": 463.84769, "r": 480.58681999999993, "b": 472.64465, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "including column- and row-spans up to 10 cells) just to describe every table in", "bbox": {"l": 134.76501, "t": 475.80368, "r": 480.58681999999993, "b": 484.60065, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "the PubTabNet dataset. Clearly, not every token is equally represented, as is", "bbox": {"l": 134.76501, "t": 487.75867, "r": 480.59067, "b": 496.55563, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "depicted in Figure 2. This skewed distribution of tokens in combination with", "bbox": {"l": 134.76501, "t": 499.71365, "r": 480.59277, "b": 508.51062, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "variable token row-length makes it challenging for models to learn the HTML", "bbox": {"l": 134.76501, "t": 511.66864, "r": 480.59476, "b": 520.46561, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "structure.", "bbox": {"l": 134.76501, "t": 523.62363, "r": 176.92873, "b": 532.42059, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Obviously, HTML and other general-purpose markup languages were not designed for Im2Seq models. As such, they have some serious drawbacks. First, the token vocabulary needs to be artificially large in order to describe all plausible tabular structures. Since most Im2Seq models use an autoregressive approach, they generate the sequence token by token. Therefore, to reduce inference time, a shorter sequence length is critical. Every table-cell is represented by at least two tokens ( <td> and </td> ). Furthermore, when tokenizing the HTML structure, one needs to explicitly enumerate possible column-spans and row-spans as words. In practice, this ends up requiring 28 different HTML tokens (when including column- and row-spans up to 10 cells) just to describe every table in the PubTabNet dataset. Clearly, not every token is equally represented, as is depicted in Figure 2. This skewed distribution of tokens in combination with variable token row-length makes it challenging for models to learn the HTML structure."}, {"label": "text", "id": 3, "page_no": 4, "cluster": {"id": 3, "label": "text", "bbox": {"l": 134.76501, "t": 536.04263, "r": 480.59289999999993, "b": 580.7056, "coord_origin": "TOPLEFT"}, "confidence": 0.978394627571106, "cells": [{"id": 40, "text": "Additionally, it would be desirable if the representation would easily allow", "bbox": {"l": 149.70901, "t": 536.04263, "r": 480.59289999999993, "b": 544.8396, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "an early detection of invalid sequences on-the-go, before the prediction of the", "bbox": {"l": 134.76501, "t": 547.99763, "r": 480.59085, "b": 556.7946000000001, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "entire table structure is completed. HTML is not well-suited for this purpose as", "bbox": {"l": 134.76501, "t": 559.95264, "r": 480.58984, "b": 568.7496, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "the verification of incomplete sequences is non-trivial or even impossible.", "bbox": {"l": 134.76501, "t": 571.90863, "r": 452.18933, "b": 580.7056, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Additionally, it would be desirable if the representation would easily allow an early detection of invalid sequences on-the-go, before the prediction of the entire table structure is completed. HTML is not well-suited for this purpose as the verification of incomplete sequences is non-trivial or even impossible."}, {"label": "text", "id": 2, "page_no": 4, "cluster": {"id": 2, "label": "text", "bbox": {"l": 134.76501, "t": 584.32663, "r": 480.59473, "b": 664.85461, "coord_origin": "TOPLEFT"}, "confidence": 0.9838283061981201, "cells": [{"id": 44, "text": "In a valid HTML table, the token sequence must describe a 2D grid of table", "bbox": {"l": 149.70901, "t": 584.32663, "r": 480.59283000000005, "b": 593.1236, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "cells, serialised in row-major ordering, where each row and each column have", "bbox": {"l": 134.76501, "t": 596.28262, "r": 480.58978, "b": 605.07959, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "the same length (while considering row- and column-spans). Furthermore, every", "bbox": {"l": 134.76501, "t": 608.23763, "r": 480.5936899999999, "b": 617.03459, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "opening tag in HTML needs to be matched by a closing tag in a correct hierar-", "bbox": {"l": 134.76501, "t": 620.19263, "r": 480.59091, "b": 628.98959, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "chical manner. Since the number of tokens for each table row and column can", "bbox": {"l": 134.76501, "t": 632.1476299999999, "r": 480.58582, "b": 640.9446, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "vary significantly, especially for large tables with many row- and column-spans,", "bbox": {"l": 134.76501, "t": 644.10263, "r": 480.59180000000003, "b": 652.8996, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "it is complex to verify the consistency of predicted structures during sequence", "bbox": {"l": 134.76501, "t": 656.05763, "r": 480.59473, "b": 664.85461, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In a valid HTML table, the token sequence must describe a 2D grid of table cells, serialised in row-major ordering, where each row and each column have the same length (while considering row- and column-spans). Furthermore, every opening tag in HTML needs to be matched by a closing tag in a correct hierarchical manner. Since the number of tokens for each table row and column can vary significantly, especially for large tables with many row- and column-spans, it is complex to verify the consistency of predicted structures during sequence"}, {"label": "picture", "id": 4, "page_no": 4, "cluster": {"id": 4, "label": "picture", "bbox": {"l": 137.41448974609375, "t": 233.51231384277344, "r": 476.5608215332031, "b": 340.2304992675781, "coord_origin": "TOPLEFT"}, "confidence": 0.9387977123260498, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "body": [{"label": "text", "id": 0, "page_no": 4, "cluster": {"id": 0, "label": "text", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.59378, "b": 187.50684, "coord_origin": "TOPLEFT"}, "confidence": 0.9857171773910522, "cells": [{"id": 2, "text": "ulary and can be interpreted as a table structure. For example, with the HTML", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.58577999999994, "b": 127.73077, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "tokens", "bbox": {"l": 134.765, "t": 130.88878999999997, "r": 162.48494, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "<table>", "bbox": {"l": 166.368, "t": 130.88878999999997, "r": 201.74918, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": ",", "bbox": {"l": 201.74899, "t": 130.88878999999997, "r": 204.51561, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "</table>", "bbox": {"l": 208.39699, "t": 130.88878999999997, "r": 248.86904999999996, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": ",", "bbox": {"l": 248.86899, "t": 130.88878999999997, "r": 251.6356, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "<tr>", "bbox": {"l": 255.51698, "t": 130.88878999999997, "r": 278.29846, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": ",", "bbox": {"l": 278.29797, "t": 130.88878999999997, "r": 281.06458, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "</tr>", "bbox": {"l": 284.94598, "t": 130.88878999999997, "r": 312.81836, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": ",", "bbox": {"l": 312.81799, "t": 130.88878999999997, "r": 315.58459, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "<td>", "bbox": {"l": 319.466, "t": 130.88878999999997, "r": 343.13812, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "and", "bbox": {"l": 347.13202, "t": 130.88878999999997, "r": 363.17877, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "</td>", "bbox": {"l": 367.06003, "t": 130.88878999999997, "r": 395.82306, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": ", one can construct", "bbox": {"l": 395.82303, "t": 130.88878999999997, "r": 480.59177000000005, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "simple table structures without any spanning cells. In reality though, one needs", "bbox": {"l": 134.76501, "t": 142.84479, "r": 480.59365999999994, "b": 151.64178000000004, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "at least 28 HTML tokens to describe the most common complex tables observed", "bbox": {"l": 134.76501, "t": 154.7998, "r": 480.58577999999994, "b": 163.59680000000003, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "in real-world documents [21,22], due to a variety of spanning cells definitions in", "bbox": {"l": 134.76501, "t": 166.75482, "r": 480.59378, "b": 175.55182000000002, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "the HTML token vocabulary.", "bbox": {"l": 134.76501, "t": 178.70983999999999, "r": 261.92566, "b": 187.50684, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "ulary and can be interpreted as a table structure. For example, with the HTML tokens <table> , </table> , <tr> , </tr> , <td> and </td> , one can construct simple table structures without any spanning cells. In reality though, one needs at least 28 HTML tokens to describe the most common complex tables observed in real-world documents [21,22], due to a variety of spanning cells definitions in the HTML token vocabulary."}, {"label": "caption", "id": 7, "page_no": 4, "cluster": {"id": 7, "label": "caption", "bbox": {"l": 145.60701, "t": 221.07928000000004, "r": 469.75223000000005, "b": 229.21178999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.8472551703453064, "cells": [{"id": 20, "text": "Fig. 2.", "bbox": {"l": 145.60701, "t": 221.07928000000004, "r": 173.48625, "b": 229.00562000000002, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Frequency of tokens in HTML and OTSL as they appear in PubTabNet.", "bbox": {"l": 176.56001, "t": 221.14209000000005, "r": 469.75223000000005, "b": 229.21178999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Fig. 2. Frequency of tokens in HTML and OTSL as they appear in PubTabNet."}, {"label": "text", "id": 1, "page_no": 4, "cluster": {"id": 1, "label": "text", "bbox": {"l": 134.765, "t": 368.20679, "r": 480.59476, "b": 532.42059, "coord_origin": "TOPLEFT"}, "confidence": 0.9844799637794495, "cells": [{"id": 22, "text": "Obviously, HTML and other general-purpose markup languages were not de-", "bbox": {"l": 149.709, "t": 368.20679, "r": 480.59283000000005, "b": 377.00375, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "signed for Im2Seq models. As such, they have some serious drawbacks. First, the", "bbox": {"l": 134.765, "t": 380.16177, "r": 480.58664, "b": 388.9587399999999, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "token vocabulary needs to be artificially large in order to describe all plausible", "bbox": {"l": 134.765, "t": 392.11676, "r": 480.59180000000003, "b": 400.91373, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "tabular structures. Since most Im2Seq models use an autoregressive approach,", "bbox": {"l": 134.765, "t": 404.07175, "r": 480.5897499999999, "b": 412.86871, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "they generate the sequence token by token. Therefore, to reduce inference time,", "bbox": {"l": 134.765, "t": 416.02774, "r": 480.58871, "b": 424.82471, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "a shorter sequence length is critical. Every table-cell is represented by at least", "bbox": {"l": 134.765, "t": 427.98273, "r": 480.59265, "b": 436.77969, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "two tokens (", "bbox": {"l": 134.765, "t": 439.9377099999999, "r": 187.93439, "b": 448.73467999999997, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "<td>", "bbox": {"l": 187.931, "t": 439.9377099999999, "r": 211.60313, "b": 448.73467999999997, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "and", "bbox": {"l": 214.75400000000002, "t": 439.9377099999999, "r": 230.80075000000002, "b": 448.73467999999997, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "</td>", "bbox": {"l": 233.83898999999997, "t": 439.9377099999999, "r": 262.60202, "b": 448.73467999999997, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "). Furthermore, when tokenizing the HTML struc-", "bbox": {"l": 262.716, "t": 439.9377099999999, "r": 480.59009, "b": 448.73467999999997, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "ture, one needs to explicitly enumerate possible column-spans and row-spans", "bbox": {"l": 134.76501, "t": 451.8927, "r": 480.58777, "b": 460.68967, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "as words. In practice, this ends up requiring 28 different HTML tokens (when", "bbox": {"l": 134.76501, "t": 463.84769, "r": 480.58681999999993, "b": 472.64465, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "including column- and row-spans up to 10 cells) just to describe every table in", "bbox": {"l": 134.76501, "t": 475.80368, "r": 480.58681999999993, "b": 484.60065, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "the PubTabNet dataset. Clearly, not every token is equally represented, as is", "bbox": {"l": 134.76501, "t": 487.75867, "r": 480.59067, "b": 496.55563, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "depicted in Figure 2. This skewed distribution of tokens in combination with", "bbox": {"l": 134.76501, "t": 499.71365, "r": 480.59277, "b": 508.51062, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "variable token row-length makes it challenging for models to learn the HTML", "bbox": {"l": 134.76501, "t": 511.66864, "r": 480.59476, "b": 520.46561, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "structure.", "bbox": {"l": 134.76501, "t": 523.62363, "r": 176.92873, "b": 532.42059, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Obviously, HTML and other general-purpose markup languages were not designed for Im2Seq models. As such, they have some serious drawbacks. First, the token vocabulary needs to be artificially large in order to describe all plausible tabular structures. Since most Im2Seq models use an autoregressive approach, they generate the sequence token by token. Therefore, to reduce inference time, a shorter sequence length is critical. Every table-cell is represented by at least two tokens ( <td> and </td> ). Furthermore, when tokenizing the HTML structure, one needs to explicitly enumerate possible column-spans and row-spans as words. In practice, this ends up requiring 28 different HTML tokens (when including column- and row-spans up to 10 cells) just to describe every table in the PubTabNet dataset. Clearly, not every token is equally represented, as is depicted in Figure 2. This skewed distribution of tokens in combination with variable token row-length makes it challenging for models to learn the HTML structure."}, {"label": "text", "id": 3, "page_no": 4, "cluster": {"id": 3, "label": "text", "bbox": {"l": 134.76501, "t": 536.04263, "r": 480.59289999999993, "b": 580.7056, "coord_origin": "TOPLEFT"}, "confidence": 0.978394627571106, "cells": [{"id": 40, "text": "Additionally, it would be desirable if the representation would easily allow", "bbox": {"l": 149.70901, "t": 536.04263, "r": 480.59289999999993, "b": 544.8396, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "an early detection of invalid sequences on-the-go, before the prediction of the", "bbox": {"l": 134.76501, "t": 547.99763, "r": 480.59085, "b": 556.7946000000001, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "entire table structure is completed. HTML is not well-suited for this purpose as", "bbox": {"l": 134.76501, "t": 559.95264, "r": 480.58984, "b": 568.7496, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "the verification of incomplete sequences is non-trivial or even impossible.", "bbox": {"l": 134.76501, "t": 571.90863, "r": 452.18933, "b": 580.7056, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Additionally, it would be desirable if the representation would easily allow an early detection of invalid sequences on-the-go, before the prediction of the entire table structure is completed. HTML is not well-suited for this purpose as the verification of incomplete sequences is non-trivial or even impossible."}, {"label": "text", "id": 2, "page_no": 4, "cluster": {"id": 2, "label": "text", "bbox": {"l": 134.76501, "t": 584.32663, "r": 480.59473, "b": 664.85461, "coord_origin": "TOPLEFT"}, "confidence": 0.9838283061981201, "cells": [{"id": 44, "text": "In a valid HTML table, the token sequence must describe a 2D grid of table", "bbox": {"l": 149.70901, "t": 584.32663, "r": 480.59283000000005, "b": 593.1236, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "cells, serialised in row-major ordering, where each row and each column have", "bbox": {"l": 134.76501, "t": 596.28262, "r": 480.58978, "b": 605.07959, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "the same length (while considering row- and column-spans). Furthermore, every", "bbox": {"l": 134.76501, "t": 608.23763, "r": 480.5936899999999, "b": 617.03459, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "opening tag in HTML needs to be matched by a closing tag in a correct hierar-", "bbox": {"l": 134.76501, "t": 620.19263, "r": 480.59091, "b": 628.98959, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "chical manner. Since the number of tokens for each table row and column can", "bbox": {"l": 134.76501, "t": 632.1476299999999, "r": 480.58582, "b": 640.9446, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "vary significantly, especially for large tables with many row- and column-spans,", "bbox": {"l": 134.76501, "t": 644.10263, "r": 480.59180000000003, "b": 652.8996, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "it is complex to verify the consistency of predicted structures during sequence", "bbox": {"l": 134.76501, "t": 656.05763, "r": 480.59473, "b": 664.85461, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In a valid HTML table, the token sequence must describe a 2D grid of table cells, serialised in row-major ordering, where each row and each column have the same length (while considering row- and column-spans). Furthermore, every opening tag in HTML needs to be matched by a closing tag in a correct hierarchical manner. Since the number of tokens for each table row and column can vary significantly, especially for large tables with many row- and column-spans, it is complex to verify the consistency of predicted structures during sequence"}, {"label": "picture", "id": 4, "page_no": 4, "cluster": {"id": 4, "label": "picture", "bbox": {"l": 137.41448974609375, "t": 233.51231384277344, "r": 476.5608215332031, "b": 340.2304992675781, "coord_origin": "TOPLEFT"}, "confidence": 0.9387977123260498, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "headers": [{"label": "page_header", "id": 5, "page_no": 4, "cluster": {"id": 5, "label": "page_header", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9269194602966309, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Optimized Table Tokenization for Table Structure Recognition"}, {"label": "page_header", "id": 6, "page_no": 4, "cluster": {"id": 6, "label": "page_header", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8696112036705017, "cells": [{"id": 1, "text": "5", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5"}]}}, {"page_no": 5, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "6", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "M.", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 178.07675, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37415, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "generation. Implicitly, this also means that Im2Seq models need to learn these", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.59479, "b": 127.73077, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "complex syntax rules, simply to deliver valid output.", "bbox": {"l": 134.765, "t": 130.88878999999997, "r": 364.62503, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "In practice, we observe two major issues with prediction quality when train-", "bbox": {"l": 149.709, "t": 143.48279000000002, "r": 480.58981, "b": 152.27979000000005, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "ing Im2Seq models on HTML table structure generation from images. On the", "bbox": {"l": 134.765, "t": 155.43781, "r": 480.59378, "b": 164.23479999999995, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "one hand, we find that on large tables, the visual attention of the model often", "bbox": {"l": 134.765, "t": 167.39282000000003, "r": 480.5867, "b": 176.18982000000005, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "starts to drift and is not accurately moving forward cell by cell anymore. This", "bbox": {"l": 134.765, "t": 179.34784000000002, "r": 480.59476, "b": 188.14484000000004, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "manifests itself in either in an increasing", "bbox": {"l": 134.765, "t": 191.30286, "r": 314.27805, "b": 200.09984999999995, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "location drift", "bbox": {"l": 318.056, "t": 191.30286, "r": 374.08664, "b": 200.09984999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "for proposed table-cells", "bbox": {"l": 378.80899, "t": 191.30286, "r": 480.58594, "b": 200.09984999999995, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "in later rows on the same column or even complete loss of vertical alignment, as", "bbox": {"l": 134.76498, "t": 203.25885000000005, "r": 480.58771, "b": 212.05584999999996, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "illustrated in Figure 5. Addressing this with post-processing is partially possible,", "bbox": {"l": 134.76498, "t": 215.21387000000004, "r": 480.59569999999997, "b": 224.01085999999998, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "but clearly undesired. On the other hand, we find many instances of predictions", "bbox": {"l": 134.76498, "t": 227.16887999999994, "r": 480.59454, "b": 235.96587999999997, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "with structural inconsistencies or plain invalid HTML output, as shown in Fig-", "bbox": {"l": 134.76498, "t": 239.12390000000005, "r": 480.58759000000003, "b": 247.92089999999996, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "ure 6, which are nearly impossible to properly correct. Both problems seriously", "bbox": {"l": 134.76498, "t": 251.07892000000004, "r": 480.59277, "b": 259.87591999999995, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "impact the TSR model performance, since they reflect not only in the task of", "bbox": {"l": 134.76498, "t": 263.03394000000003, "r": 480.59463999999997, "b": 271.83092999999997, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "pure structure recognition but also in the equally crucial recognition or matching", "bbox": {"l": 134.76498, "t": 274.98992999999996, "r": 480.58978, "b": 283.78693, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "of table cell content.", "bbox": {"l": 134.76498, "t": 286.94495, "r": 223.57262, "b": 295.74191, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "4", "bbox": {"l": 134.76498, "t": 320.6311, "r": 141.48859, "b": 331.19949, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Optimised Table Structure Language", "bbox": {"l": 154.93819, "t": 320.6311, "r": 372.50848, "b": 331.19949, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "To mitigate the issues with HTML in Im2Seq-based TSR models laid out before,", "bbox": {"l": 134.76498, "t": 349.11697, "r": 480.59075999999993, "b": 357.91394, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "we propose here our Optimised Table Structure Language (OTSL). OTSL is", "bbox": {"l": 134.76498, "t": 361.07196000000005, "r": 480.58875, "b": 369.86893, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "designed to express table structure with a minimized vocabulary and a simple", "bbox": {"l": 134.76498, "t": 373.02795, "r": 480.58681999999993, "b": 381.82492, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "set of rules, which are both significantly reduced compared to HTML. At the", "bbox": {"l": 134.76498, "t": 384.98294, "r": 480.58875, "b": 393.77991, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "same time, OTSL enables easy error detection and correction during sequence", "bbox": {"l": 134.76498, "t": 396.93793, "r": 480.58978, "b": 405.73489, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "generation. We further demonstrate how the compact structure representation", "bbox": {"l": 134.76498, "t": 408.89291, "r": 480.59473, "b": 417.68988, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "and minimized sequence length improves prediction accuracy and inference time", "bbox": {"l": 134.76498, "t": 420.8479, "r": 480.58868, "b": 429.64487, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "in the TableFormer architecture.", "bbox": {"l": 134.76498, "t": 432.80289, "r": 276.67325, "b": 441.59985, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "4.1", "bbox": {"l": 134.76498, "t": 465.87192, "r": 149.40204, "b": 474.67886, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Language Definition", "bbox": {"l": 160.85902, "t": 465.87192, "r": 261.80109, "b": 474.67886, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "In Figure 3, we illustrate how the OTSL is defined. In essence, the OTSL defines", "bbox": {"l": 134.76498, "t": 488.99789, "r": 480.58871, "b": 497.79486, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "only 5 tokens that directly describe a tabular structure based on an atomic 2D", "bbox": {"l": 134.76498, "t": 500.95288, "r": 480.5867, "b": 509.74985, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "grid.", "bbox": {"l": 134.76498, "t": 512.90887, "r": 154.7131, "b": 521.7058400000001, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "The OTSL vocabulary is comprised of the following tokens:", "bbox": {"l": 149.70898, "t": 525.5018600000001, "r": 409.31137, "b": 534.29883, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "-", "bbox": {"l": 140.99298, "t": 547.96989, "r": 146.72047, "b": 556.77682, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "\"C\" cell -", "bbox": {"l": 151.70099, "t": 547.97986, "r": 193.20619, "b": 556.77682, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "a new table cell", "bbox": {"l": 196.52199, "t": 547.97986, "r": 263.46564, "b": 556.77682, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "that either has or does not have cell content", "bbox": {"l": 267.815, "t": 547.97986, "r": 460.54443, "b": 556.77682, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "-", "bbox": {"l": 140.99301, "t": 560.5629, "r": 146.7205, "b": 569.36983, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "\"L\" cell -", "bbox": {"l": 151.70102, "t": 560.57286, "r": 194.30011, "b": 569.36983, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "left-looking cell", "bbox": {"l": 198.65903, "t": 560.57286, "r": 264.51779, "b": 569.36983, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": ", merging with the left neighbor cell to create a", "bbox": {"l": 264.51804, "t": 560.57286, "r": 480.59392999999994, "b": 569.36983, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "span", "bbox": {"l": 151.70103, "t": 572.52786, "r": 171.67604, "b": 581.32483, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "-", "bbox": {"l": 140.99304, "t": 585.11189, "r": 146.72054, "b": 593.91882, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "\"U\" cell -", "bbox": {"l": 151.70105, "t": 585.12186, "r": 194.11086, "b": 593.91882, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "up-looking cell", "bbox": {"l": 197.74805, "t": 585.12186, "r": 259.89474, "b": 593.91882, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": ", merging with the upper neighbor cell to create a", "bbox": {"l": 259.89206, "t": 585.12186, "r": 480.58856, "b": 593.91882, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "span", "bbox": {"l": 151.70105, "t": 597.07686, "r": 171.67606, "b": 605.87383, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "-", "bbox": {"l": 140.99304, "t": 609.6599, "r": 146.72054, "b": 618.46683, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "\"X\" cell -", "bbox": {"l": 151.70105, "t": 609.66986, "r": 193.48323, "b": 618.46683, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "cross cell", "bbox": {"l": 196.79904, "t": 609.66986, "r": 236.12042, "b": 618.46683, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": ", to merge with both left and upper neighbor cells", "bbox": {"l": 236.12505, "t": 609.66986, "r": 454.55496, "b": 618.46683, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "-", "bbox": {"l": 140.99304, "t": 622.2538900000001, "r": 146.72054, "b": 631.06082, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "\"NL\" -", "bbox": {"l": 151.70105, "t": 622.26385, "r": 181.99434, "b": 631.06082, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "new-line", "bbox": {"l": 185.31705, "t": 622.26385, "r": 221.46236, "b": 631.06082, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": ", switch to the next row.", "bbox": {"l": 221.46104, "t": 622.26385, "r": 328.61676, "b": 631.06082, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "A notable attribute of OTSL is that it has the capability of achieving lossless", "bbox": {"l": 149.70905, "t": 644.10286, "r": 480.59280000000007, "b": 652.8998300000001, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "conversion to HTML.", "bbox": {"l": 134.76505, "t": 656.05786, "r": 228.22321, "b": 664.85484, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 14, "label": "page_header", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8378868699073792, "cells": [{"id": 0, "text": "6", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "page_header", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8919177651405334, "cells": [{"id": 1, "text": "M.", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 178.07675, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37415, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.59479, "b": 139.68579, "coord_origin": "TOPLEFT"}, "confidence": 0.9633480906486511, "cells": [{"id": 3, "text": "generation. Implicitly, this also means that Im2Seq models need to learn these", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.59479, "b": 127.73077, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "complex syntax rules, simply to deliver valid output.", "bbox": {"l": 134.765, "t": 130.88878999999997, "r": 364.62503, "b": 139.68579, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 134.76498, "t": 143.48279000000002, "r": 480.59569999999997, "b": 295.74191, "coord_origin": "TOPLEFT"}, "confidence": 0.9856827855110168, "cells": [{"id": 5, "text": "In practice, we observe two major issues with prediction quality when train-", "bbox": {"l": 149.709, "t": 143.48279000000002, "r": 480.58981, "b": 152.27979000000005, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "ing Im2Seq models on HTML table structure generation from images. On the", "bbox": {"l": 134.765, "t": 155.43781, "r": 480.59378, "b": 164.23479999999995, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "one hand, we find that on large tables, the visual attention of the model often", "bbox": {"l": 134.765, "t": 167.39282000000003, "r": 480.5867, "b": 176.18982000000005, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "starts to drift and is not accurately moving forward cell by cell anymore. This", "bbox": {"l": 134.765, "t": 179.34784000000002, "r": 480.59476, "b": 188.14484000000004, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "manifests itself in either in an increasing", "bbox": {"l": 134.765, "t": 191.30286, "r": 314.27805, "b": 200.09984999999995, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "location drift", "bbox": {"l": 318.056, "t": 191.30286, "r": 374.08664, "b": 200.09984999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "for proposed table-cells", "bbox": {"l": 378.80899, "t": 191.30286, "r": 480.58594, "b": 200.09984999999995, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "in later rows on the same column or even complete loss of vertical alignment, as", "bbox": {"l": 134.76498, "t": 203.25885000000005, "r": 480.58771, "b": 212.05584999999996, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "illustrated in Figure 5. Addressing this with post-processing is partially possible,", "bbox": {"l": 134.76498, "t": 215.21387000000004, "r": 480.59569999999997, "b": 224.01085999999998, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "but clearly undesired. On the other hand, we find many instances of predictions", "bbox": {"l": 134.76498, "t": 227.16887999999994, "r": 480.59454, "b": 235.96587999999997, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "with structural inconsistencies or plain invalid HTML output, as shown in Fig-", "bbox": {"l": 134.76498, "t": 239.12390000000005, "r": 480.58759000000003, "b": 247.92089999999996, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "ure 6, which are nearly impossible to properly correct. Both problems seriously", "bbox": {"l": 134.76498, "t": 251.07892000000004, "r": 480.59277, "b": 259.87591999999995, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "impact the TSR model performance, since they reflect not only in the task of", "bbox": {"l": 134.76498, "t": 263.03394000000003, "r": 480.59463999999997, "b": 271.83092999999997, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "pure structure recognition but also in the equally crucial recognition or matching", "bbox": {"l": 134.76498, "t": 274.98992999999996, "r": 480.58978, "b": 283.78693, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "of table cell content.", "bbox": {"l": 134.76498, "t": 286.94495, "r": 223.57262, "b": 295.74191, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "section_header", "bbox": {"l": 134.76498, "t": 320.6311, "r": 372.50848, "b": 331.19949, "coord_origin": "TOPLEFT"}, "confidence": 0.957028865814209, "cells": [{"id": 20, "text": "4", "bbox": {"l": 134.76498, "t": 320.6311, "r": 141.48859, "b": 331.19949, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Optimised Table Structure Language", "bbox": {"l": 154.93819, "t": 320.6311, "r": 372.50848, "b": 331.19949, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 134.76498, "t": 349.11697, "r": 480.59473, "b": 441.59985, "coord_origin": "TOPLEFT"}, "confidence": 0.9879323840141296, "cells": [{"id": 22, "text": "To mitigate the issues with HTML in Im2Seq-based TSR models laid out before,", "bbox": {"l": 134.76498, "t": 349.11697, "r": 480.59075999999993, "b": 357.91394, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "we propose here our Optimised Table Structure Language (OTSL). OTSL is", "bbox": {"l": 134.76498, "t": 361.07196000000005, "r": 480.58875, "b": 369.86893, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "designed to express table structure with a minimized vocabulary and a simple", "bbox": {"l": 134.76498, "t": 373.02795, "r": 480.58681999999993, "b": 381.82492, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "set of rules, which are both significantly reduced compared to HTML. At the", "bbox": {"l": 134.76498, "t": 384.98294, "r": 480.58875, "b": 393.77991, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "same time, OTSL enables easy error detection and correction during sequence", "bbox": {"l": 134.76498, "t": 396.93793, "r": 480.58978, "b": 405.73489, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "generation. We further demonstrate how the compact structure representation", "bbox": {"l": 134.76498, "t": 408.89291, "r": 480.59473, "b": 417.68988, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "and minimized sequence length improves prediction accuracy and inference time", "bbox": {"l": 134.76498, "t": 420.8479, "r": 480.58868, "b": 429.64487, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "in the TableFormer architecture.", "bbox": {"l": 134.76498, "t": 432.80289, "r": 276.67325, "b": 441.59985, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "section_header", "bbox": {"l": 134.76498, "t": 465.87192, "r": 261.80109, "b": 474.67886, "coord_origin": "TOPLEFT"}, "confidence": 0.9559652209281921, "cells": [{"id": 30, "text": "4.1", "bbox": {"l": 134.76498, "t": 465.87192, "r": 149.40204, "b": 474.67886, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Language Definition", "bbox": {"l": 160.85902, "t": 465.87192, "r": 261.80109, "b": 474.67886, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 134.76498, "t": 488.99789, "r": 480.58871, "b": 521.7058400000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9671263098716736, "cells": [{"id": 32, "text": "In Figure 3, we illustrate how the OTSL is defined. In essence, the OTSL defines", "bbox": {"l": 134.76498, "t": 488.99789, "r": 480.58871, "b": 497.79486, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "only 5 tokens that directly describe a tabular structure based on an atomic 2D", "bbox": {"l": 134.76498, "t": 500.95288, "r": 480.5867, "b": 509.74985, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "grid.", "bbox": {"l": 134.76498, "t": 512.90887, "r": 154.7131, "b": 521.7058400000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 149.70898, "t": 525.5018600000001, "r": 409.31137, "b": 534.29883, "coord_origin": "TOPLEFT"}, "confidence": 0.8555866479873657, "cells": [{"id": 35, "text": "The OTSL vocabulary is comprised of the following tokens:", "bbox": {"l": 149.70898, "t": 525.5018600000001, "r": 409.31137, "b": 534.29883, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "list_item", "bbox": {"l": 140.99298, "t": 547.96989, "r": 460.54443, "b": 556.77682, "coord_origin": "TOPLEFT"}, "confidence": 0.9184334874153137, "cells": [{"id": 36, "text": "-", "bbox": {"l": 140.99298, "t": 547.96989, "r": 146.72047, "b": 556.77682, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "\"C\" cell -", "bbox": {"l": 151.70099, "t": 547.97986, "r": 193.20619, "b": 556.77682, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "a new table cell", "bbox": {"l": 196.52199, "t": 547.97986, "r": 263.46564, "b": 556.77682, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "that either has or does not have cell content", "bbox": {"l": 267.815, "t": 547.97986, "r": 460.54443, "b": 556.77682, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "list_item", "bbox": {"l": 140.99301, "t": 560.5629, "r": 480.59392999999994, "b": 581.32483, "coord_origin": "TOPLEFT"}, "confidence": 0.9319931268692017, "cells": [{"id": 40, "text": "-", "bbox": {"l": 140.99301, "t": 560.5629, "r": 146.7205, "b": 569.36983, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "\"L\" cell -", "bbox": {"l": 151.70102, "t": 560.57286, "r": 194.30011, "b": 569.36983, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "left-looking cell", "bbox": {"l": 198.65903, "t": 560.57286, "r": 264.51779, "b": 569.36983, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": ", merging with the left neighbor cell to create a", "bbox": {"l": 264.51804, "t": 560.57286, "r": 480.59392999999994, "b": 569.36983, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "span", "bbox": {"l": 151.70103, "t": 572.52786, "r": 171.67604, "b": 581.32483, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "list_item", "bbox": {"l": 140.99304, "t": 585.11189, "r": 480.58856, "b": 605.87383, "coord_origin": "TOPLEFT"}, "confidence": 0.9438967704772949, "cells": [{"id": 45, "text": "-", "bbox": {"l": 140.99304, "t": 585.11189, "r": 146.72054, "b": 593.91882, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "\"U\" cell -", "bbox": {"l": 151.70105, "t": 585.12186, "r": 194.11086, "b": 593.91882, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "up-looking cell", "bbox": {"l": 197.74805, "t": 585.12186, "r": 259.89474, "b": 593.91882, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": ", merging with the upper neighbor cell to create a", "bbox": {"l": 259.89206, "t": 585.12186, "r": 480.58856, "b": 593.91882, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "span", "bbox": {"l": 151.70105, "t": 597.07686, "r": 171.67606, "b": 605.87383, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "list_item", "bbox": {"l": 140.99304, "t": 609.6599, "r": 454.55496, "b": 618.46683, "coord_origin": "TOPLEFT"}, "confidence": 0.9036387801170349, "cells": [{"id": 50, "text": "-", "bbox": {"l": 140.99304, "t": 609.6599, "r": 146.72054, "b": 618.46683, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "\"X\" cell -", "bbox": {"l": 151.70105, "t": 609.66986, "r": 193.48323, "b": 618.46683, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "cross cell", "bbox": {"l": 196.79904, "t": 609.66986, "r": 236.12042, "b": 618.46683, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": ", to merge with both left and upper neighbor cells", "bbox": {"l": 236.12505, "t": 609.66986, "r": 454.55496, "b": 618.46683, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "list_item", "bbox": {"l": 140.99304, "t": 622.2538900000001, "r": 328.61676, "b": 631.06082, "coord_origin": "TOPLEFT"}, "confidence": 0.8636871576309204, "cells": [{"id": 54, "text": "-", "bbox": {"l": 140.99304, "t": 622.2538900000001, "r": 146.72054, "b": 631.06082, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "\"NL\" -", "bbox": {"l": 151.70105, "t": 622.26385, "r": 181.99434, "b": 631.06082, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "new-line", "bbox": {"l": 185.31705, "t": 622.26385, "r": 221.46236, "b": 631.06082, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": ", switch to the next row.", "bbox": {"l": 221.46104, "t": 622.26385, "r": 328.61676, "b": 631.06082, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "text", "bbox": {"l": 134.76505, "t": 644.10286, "r": 480.59280000000007, "b": 664.85484, "coord_origin": "TOPLEFT"}, "confidence": 0.9443338513374329, "cells": [{"id": 58, "text": "A notable attribute of OTSL is that it has the capability of achieving lossless", "bbox": {"l": 149.70905, "t": 644.10286, "r": 480.59280000000007, "b": 652.8998300000001, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "conversion to HTML.", "bbox": {"l": 134.76505, "t": 656.05786, "r": 228.22321, "b": 664.85484, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_header", "id": 14, "page_no": 5, "cluster": {"id": 14, "label": "page_header", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8378868699073792, "cells": [{"id": 0, "text": "6", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "6"}, {"label": "page_header", "id": 11, "page_no": 5, "cluster": {"id": 11, "label": "page_header", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8919177651405334, "cells": [{"id": 1, "text": "M.", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 178.07675, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37415, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "M. Lysak, et al."}, {"label": "text", "id": 3, "page_no": 5, "cluster": {"id": 3, "label": "text", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.59479, "b": 139.68579, "coord_origin": "TOPLEFT"}, "confidence": 0.9633480906486511, "cells": [{"id": 3, "text": "generation. Implicitly, this also means that Im2Seq models need to learn these", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.59479, "b": 127.73077, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "complex syntax rules, simply to deliver valid output.", "bbox": {"l": 134.765, "t": 130.88878999999997, "r": 364.62503, "b": 139.68579, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "generation. Implicitly, this also means that Im2Seq models need to learn these complex syntax rules, simply to deliver valid output."}, {"label": "text", "id": 1, "page_no": 5, "cluster": {"id": 1, "label": "text", "bbox": {"l": 134.76498, "t": 143.48279000000002, "r": 480.59569999999997, "b": 295.74191, "coord_origin": "TOPLEFT"}, "confidence": 0.9856827855110168, "cells": [{"id": 5, "text": "In practice, we observe two major issues with prediction quality when train-", "bbox": {"l": 149.709, "t": 143.48279000000002, "r": 480.58981, "b": 152.27979000000005, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "ing Im2Seq models on HTML table structure generation from images. On the", "bbox": {"l": 134.765, "t": 155.43781, "r": 480.59378, "b": 164.23479999999995, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "one hand, we find that on large tables, the visual attention of the model often", "bbox": {"l": 134.765, "t": 167.39282000000003, "r": 480.5867, "b": 176.18982000000005, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "starts to drift and is not accurately moving forward cell by cell anymore. This", "bbox": {"l": 134.765, "t": 179.34784000000002, "r": 480.59476, "b": 188.14484000000004, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "manifests itself in either in an increasing", "bbox": {"l": 134.765, "t": 191.30286, "r": 314.27805, "b": 200.09984999999995, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "location drift", "bbox": {"l": 318.056, "t": 191.30286, "r": 374.08664, "b": 200.09984999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "for proposed table-cells", "bbox": {"l": 378.80899, "t": 191.30286, "r": 480.58594, "b": 200.09984999999995, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "in later rows on the same column or even complete loss of vertical alignment, as", "bbox": {"l": 134.76498, "t": 203.25885000000005, "r": 480.58771, "b": 212.05584999999996, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "illustrated in Figure 5. Addressing this with post-processing is partially possible,", "bbox": {"l": 134.76498, "t": 215.21387000000004, "r": 480.59569999999997, "b": 224.01085999999998, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "but clearly undesired. On the other hand, we find many instances of predictions", "bbox": {"l": 134.76498, "t": 227.16887999999994, "r": 480.59454, "b": 235.96587999999997, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "with structural inconsistencies or plain invalid HTML output, as shown in Fig-", "bbox": {"l": 134.76498, "t": 239.12390000000005, "r": 480.58759000000003, "b": 247.92089999999996, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "ure 6, which are nearly impossible to properly correct. Both problems seriously", "bbox": {"l": 134.76498, "t": 251.07892000000004, "r": 480.59277, "b": 259.87591999999995, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "impact the TSR model performance, since they reflect not only in the task of", "bbox": {"l": 134.76498, "t": 263.03394000000003, "r": 480.59463999999997, "b": 271.83092999999997, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "pure structure recognition but also in the equally crucial recognition or matching", "bbox": {"l": 134.76498, "t": 274.98992999999996, "r": 480.58978, "b": 283.78693, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "of table cell content.", "bbox": {"l": 134.76498, "t": 286.94495, "r": 223.57262, "b": 295.74191, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In practice, we observe two major issues with prediction quality when training Im2Seq models on HTML table structure generation from images. On the one hand, we find that on large tables, the visual attention of the model often starts to drift and is not accurately moving forward cell by cell anymore. This manifests itself in either in an increasing location drift for proposed table-cells in later rows on the same column or even complete loss of vertical alignment, as illustrated in Figure 5. Addressing this with post-processing is partially possible, but clearly undesired. On the other hand, we find many instances of predictions with structural inconsistencies or plain invalid HTML output, as shown in Figure 6, which are nearly impossible to properly correct. Both problems seriously impact the TSR model performance, since they reflect not only in the task of pure structure recognition but also in the equally crucial recognition or matching of table cell content."}, {"label": "section_header", "id": 4, "page_no": 5, "cluster": {"id": 4, "label": "section_header", "bbox": {"l": 134.76498, "t": 320.6311, "r": 372.50848, "b": 331.19949, "coord_origin": "TOPLEFT"}, "confidence": 0.957028865814209, "cells": [{"id": 20, "text": "4", "bbox": {"l": 134.76498, "t": 320.6311, "r": 141.48859, "b": 331.19949, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Optimised Table Structure Language", "bbox": {"l": 154.93819, "t": 320.6311, "r": 372.50848, "b": 331.19949, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4 Optimised Table Structure Language"}, {"label": "text", "id": 0, "page_no": 5, "cluster": {"id": 0, "label": "text", "bbox": {"l": 134.76498, "t": 349.11697, "r": 480.59473, "b": 441.59985, "coord_origin": "TOPLEFT"}, "confidence": 0.9879323840141296, "cells": [{"id": 22, "text": "To mitigate the issues with HTML in Im2Seq-based TSR models laid out before,", "bbox": {"l": 134.76498, "t": 349.11697, "r": 480.59075999999993, "b": 357.91394, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "we propose here our Optimised Table Structure Language (OTSL). OTSL is", "bbox": {"l": 134.76498, "t": 361.07196000000005, "r": 480.58875, "b": 369.86893, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "designed to express table structure with a minimized vocabulary and a simple", "bbox": {"l": 134.76498, "t": 373.02795, "r": 480.58681999999993, "b": 381.82492, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "set of rules, which are both significantly reduced compared to HTML. At the", "bbox": {"l": 134.76498, "t": 384.98294, "r": 480.58875, "b": 393.77991, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "same time, OTSL enables easy error detection and correction during sequence", "bbox": {"l": 134.76498, "t": 396.93793, "r": 480.58978, "b": 405.73489, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "generation. We further demonstrate how the compact structure representation", "bbox": {"l": 134.76498, "t": 408.89291, "r": 480.59473, "b": 417.68988, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "and minimized sequence length improves prediction accuracy and inference time", "bbox": {"l": 134.76498, "t": 420.8479, "r": 480.58868, "b": 429.64487, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "in the TableFormer architecture.", "bbox": {"l": 134.76498, "t": 432.80289, "r": 276.67325, "b": 441.59985, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "To mitigate the issues with HTML in Im2Seq-based TSR models laid out before, we propose here our Optimised Table Structure Language (OTSL). OTSL is designed to express table structure with a minimized vocabulary and a simple set of rules, which are both significantly reduced compared to HTML. At the same time, OTSL enables easy error detection and correction during sequence generation. We further demonstrate how the compact structure representation and minimized sequence length improves prediction accuracy and inference time in the TableFormer architecture."}, {"label": "section_header", "id": 5, "page_no": 5, "cluster": {"id": 5, "label": "section_header", "bbox": {"l": 134.76498, "t": 465.87192, "r": 261.80109, "b": 474.67886, "coord_origin": "TOPLEFT"}, "confidence": 0.9559652209281921, "cells": [{"id": 30, "text": "4.1", "bbox": {"l": 134.76498, "t": 465.87192, "r": 149.40204, "b": 474.67886, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Language Definition", "bbox": {"l": 160.85902, "t": 465.87192, "r": 261.80109, "b": 474.67886, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4.1 Language Definition"}, {"label": "text", "id": 2, "page_no": 5, "cluster": {"id": 2, "label": "text", "bbox": {"l": 134.76498, "t": 488.99789, "r": 480.58871, "b": 521.7058400000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9671263098716736, "cells": [{"id": 32, "text": "In Figure 3, we illustrate how the OTSL is defined. In essence, the OTSL defines", "bbox": {"l": 134.76498, "t": 488.99789, "r": 480.58871, "b": 497.79486, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "only 5 tokens that directly describe a tabular structure based on an atomic 2D", "bbox": {"l": 134.76498, "t": 500.95288, "r": 480.5867, "b": 509.74985, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "grid.", "bbox": {"l": 134.76498, "t": 512.90887, "r": 154.7131, "b": 521.7058400000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In Figure 3, we illustrate how the OTSL is defined. In essence, the OTSL defines only 5 tokens that directly describe a tabular structure based on an atomic 2D grid."}, {"label": "text", "id": 13, "page_no": 5, "cluster": {"id": 13, "label": "text", "bbox": {"l": 149.70898, "t": 525.5018600000001, "r": 409.31137, "b": 534.29883, "coord_origin": "TOPLEFT"}, "confidence": 0.8555866479873657, "cells": [{"id": 35, "text": "The OTSL vocabulary is comprised of the following tokens:", "bbox": {"l": 149.70898, "t": 525.5018600000001, "r": 409.31137, "b": 534.29883, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The OTSL vocabulary is comprised of the following tokens:"}, {"label": "list_item", "id": 9, "page_no": 5, "cluster": {"id": 9, "label": "list_item", "bbox": {"l": 140.99298, "t": 547.96989, "r": 460.54443, "b": 556.77682, "coord_origin": "TOPLEFT"}, "confidence": 0.9184334874153137, "cells": [{"id": 36, "text": "-", "bbox": {"l": 140.99298, "t": 547.96989, "r": 146.72047, "b": 556.77682, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "\"C\" cell -", "bbox": {"l": 151.70099, "t": 547.97986, "r": 193.20619, "b": 556.77682, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "a new table cell", "bbox": {"l": 196.52199, "t": 547.97986, "r": 263.46564, "b": 556.77682, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "that either has or does not have cell content", "bbox": {"l": 267.815, "t": 547.97986, "r": 460.54443, "b": 556.77682, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "-\"C\" cell a new table cell that either has or does not have cell content"}, {"label": "list_item", "id": 8, "page_no": 5, "cluster": {"id": 8, "label": "list_item", "bbox": {"l": 140.99301, "t": 560.5629, "r": 480.59392999999994, "b": 581.32483, "coord_origin": "TOPLEFT"}, "confidence": 0.9319931268692017, "cells": [{"id": 40, "text": "-", "bbox": {"l": 140.99301, "t": 560.5629, "r": 146.7205, "b": 569.36983, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "\"L\" cell -", "bbox": {"l": 151.70102, "t": 560.57286, "r": 194.30011, "b": 569.36983, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "left-looking cell", "bbox": {"l": 198.65903, "t": 560.57286, "r": 264.51779, "b": 569.36983, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": ", merging with the left neighbor cell to create a", "bbox": {"l": 264.51804, "t": 560.57286, "r": 480.59392999999994, "b": 569.36983, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "span", "bbox": {"l": 151.70103, "t": 572.52786, "r": 171.67604, "b": 581.32483, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "-\"L\" cell left-looking cell , merging with the left neighbor cell to create a span"}, {"label": "list_item", "id": 7, "page_no": 5, "cluster": {"id": 7, "label": "list_item", "bbox": {"l": 140.99304, "t": 585.11189, "r": 480.58856, "b": 605.87383, "coord_origin": "TOPLEFT"}, "confidence": 0.9438967704772949, "cells": [{"id": 45, "text": "-", "bbox": {"l": 140.99304, "t": 585.11189, "r": 146.72054, "b": 593.91882, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "\"U\" cell -", "bbox": {"l": 151.70105, "t": 585.12186, "r": 194.11086, "b": 593.91882, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "up-looking cell", "bbox": {"l": 197.74805, "t": 585.12186, "r": 259.89474, "b": 593.91882, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": ", merging with the upper neighbor cell to create a", "bbox": {"l": 259.89206, "t": 585.12186, "r": 480.58856, "b": 593.91882, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "span", "bbox": {"l": 151.70105, "t": 597.07686, "r": 171.67606, "b": 605.87383, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "-\"U\" cell up-looking cell , merging with the upper neighbor cell to create a span"}, {"label": "list_item", "id": 10, "page_no": 5, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 140.99304, "t": 609.6599, "r": 454.55496, "b": 618.46683, "coord_origin": "TOPLEFT"}, "confidence": 0.9036387801170349, "cells": [{"id": 50, "text": "-", "bbox": {"l": 140.99304, "t": 609.6599, "r": 146.72054, "b": 618.46683, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "\"X\" cell -", "bbox": {"l": 151.70105, "t": 609.66986, "r": 193.48323, "b": 618.46683, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "cross cell", "bbox": {"l": 196.79904, "t": 609.66986, "r": 236.12042, "b": 618.46683, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": ", to merge with both left and upper neighbor cells", "bbox": {"l": 236.12505, "t": 609.66986, "r": 454.55496, "b": 618.46683, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "-\"X\" cell cross cell , to merge with both left and upper neighbor cells"}, {"label": "list_item", "id": 12, "page_no": 5, "cluster": {"id": 12, "label": "list_item", "bbox": {"l": 140.99304, "t": 622.2538900000001, "r": 328.61676, "b": 631.06082, "coord_origin": "TOPLEFT"}, "confidence": 0.8636871576309204, "cells": [{"id": 54, "text": "-", "bbox": {"l": 140.99304, "t": 622.2538900000001, "r": 146.72054, "b": 631.06082, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "\"NL\" -", "bbox": {"l": 151.70105, "t": 622.26385, "r": 181.99434, "b": 631.06082, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "new-line", "bbox": {"l": 185.31705, "t": 622.26385, "r": 221.46236, "b": 631.06082, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": ", switch to the next row.", "bbox": {"l": 221.46104, "t": 622.26385, "r": 328.61676, "b": 631.06082, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "-\"NL\" new-line , switch to the next row."}, {"label": "text", "id": 6, "page_no": 5, "cluster": {"id": 6, "label": "text", "bbox": {"l": 134.76505, "t": 644.10286, "r": 480.59280000000007, "b": 664.85484, "coord_origin": "TOPLEFT"}, "confidence": 0.9443338513374329, "cells": [{"id": 58, "text": "A notable attribute of OTSL is that it has the capability of achieving lossless", "bbox": {"l": 149.70905, "t": 644.10286, "r": 480.59280000000007, "b": 652.8998300000001, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "conversion to HTML.", "bbox": {"l": 134.76505, "t": 656.05786, "r": 228.22321, "b": 664.85484, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "A notable attribute of OTSL is that it has the capability of achieving lossless conversion to HTML."}], "body": [{"label": "text", "id": 3, "page_no": 5, "cluster": {"id": 3, "label": "text", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.59479, "b": 139.68579, "coord_origin": "TOPLEFT"}, "confidence": 0.9633480906486511, "cells": [{"id": 3, "text": "generation. Implicitly, this also means that Im2Seq models need to learn these", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.59479, "b": 127.73077, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "complex syntax rules, simply to deliver valid output.", "bbox": {"l": 134.765, "t": 130.88878999999997, "r": 364.62503, "b": 139.68579, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "generation. Implicitly, this also means that Im2Seq models need to learn these complex syntax rules, simply to deliver valid output."}, {"label": "text", "id": 1, "page_no": 5, "cluster": {"id": 1, "label": "text", "bbox": {"l": 134.76498, "t": 143.48279000000002, "r": 480.59569999999997, "b": 295.74191, "coord_origin": "TOPLEFT"}, "confidence": 0.9856827855110168, "cells": [{"id": 5, "text": "In practice, we observe two major issues with prediction quality when train-", "bbox": {"l": 149.709, "t": 143.48279000000002, "r": 480.58981, "b": 152.27979000000005, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "ing Im2Seq models on HTML table structure generation from images. On the", "bbox": {"l": 134.765, "t": 155.43781, "r": 480.59378, "b": 164.23479999999995, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "one hand, we find that on large tables, the visual attention of the model often", "bbox": {"l": 134.765, "t": 167.39282000000003, "r": 480.5867, "b": 176.18982000000005, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "starts to drift and is not accurately moving forward cell by cell anymore. This", "bbox": {"l": 134.765, "t": 179.34784000000002, "r": 480.59476, "b": 188.14484000000004, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "manifests itself in either in an increasing", "bbox": {"l": 134.765, "t": 191.30286, "r": 314.27805, "b": 200.09984999999995, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "location drift", "bbox": {"l": 318.056, "t": 191.30286, "r": 374.08664, "b": 200.09984999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "for proposed table-cells", "bbox": {"l": 378.80899, "t": 191.30286, "r": 480.58594, "b": 200.09984999999995, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "in later rows on the same column or even complete loss of vertical alignment, as", "bbox": {"l": 134.76498, "t": 203.25885000000005, "r": 480.58771, "b": 212.05584999999996, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "illustrated in Figure 5. Addressing this with post-processing is partially possible,", "bbox": {"l": 134.76498, "t": 215.21387000000004, "r": 480.59569999999997, "b": 224.01085999999998, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "but clearly undesired. On the other hand, we find many instances of predictions", "bbox": {"l": 134.76498, "t": 227.16887999999994, "r": 480.59454, "b": 235.96587999999997, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "with structural inconsistencies or plain invalid HTML output, as shown in Fig-", "bbox": {"l": 134.76498, "t": 239.12390000000005, "r": 480.58759000000003, "b": 247.92089999999996, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "ure 6, which are nearly impossible to properly correct. Both problems seriously", "bbox": {"l": 134.76498, "t": 251.07892000000004, "r": 480.59277, "b": 259.87591999999995, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "impact the TSR model performance, since they reflect not only in the task of", "bbox": {"l": 134.76498, "t": 263.03394000000003, "r": 480.59463999999997, "b": 271.83092999999997, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "pure structure recognition but also in the equally crucial recognition or matching", "bbox": {"l": 134.76498, "t": 274.98992999999996, "r": 480.58978, "b": 283.78693, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "of table cell content.", "bbox": {"l": 134.76498, "t": 286.94495, "r": 223.57262, "b": 295.74191, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In practice, we observe two major issues with prediction quality when training Im2Seq models on HTML table structure generation from images. On the one hand, we find that on large tables, the visual attention of the model often starts to drift and is not accurately moving forward cell by cell anymore. This manifests itself in either in an increasing location drift for proposed table-cells in later rows on the same column or even complete loss of vertical alignment, as illustrated in Figure 5. Addressing this with post-processing is partially possible, but clearly undesired. On the other hand, we find many instances of predictions with structural inconsistencies or plain invalid HTML output, as shown in Figure 6, which are nearly impossible to properly correct. Both problems seriously impact the TSR model performance, since they reflect not only in the task of pure structure recognition but also in the equally crucial recognition or matching of table cell content."}, {"label": "section_header", "id": 4, "page_no": 5, "cluster": {"id": 4, "label": "section_header", "bbox": {"l": 134.76498, "t": 320.6311, "r": 372.50848, "b": 331.19949, "coord_origin": "TOPLEFT"}, "confidence": 0.957028865814209, "cells": [{"id": 20, "text": "4", "bbox": {"l": 134.76498, "t": 320.6311, "r": 141.48859, "b": 331.19949, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Optimised Table Structure Language", "bbox": {"l": 154.93819, "t": 320.6311, "r": 372.50848, "b": 331.19949, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4 Optimised Table Structure Language"}, {"label": "text", "id": 0, "page_no": 5, "cluster": {"id": 0, "label": "text", "bbox": {"l": 134.76498, "t": 349.11697, "r": 480.59473, "b": 441.59985, "coord_origin": "TOPLEFT"}, "confidence": 0.9879323840141296, "cells": [{"id": 22, "text": "To mitigate the issues with HTML in Im2Seq-based TSR models laid out before,", "bbox": {"l": 134.76498, "t": 349.11697, "r": 480.59075999999993, "b": 357.91394, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "we propose here our Optimised Table Structure Language (OTSL). OTSL is", "bbox": {"l": 134.76498, "t": 361.07196000000005, "r": 480.58875, "b": 369.86893, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "designed to express table structure with a minimized vocabulary and a simple", "bbox": {"l": 134.76498, "t": 373.02795, "r": 480.58681999999993, "b": 381.82492, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "set of rules, which are both significantly reduced compared to HTML. At the", "bbox": {"l": 134.76498, "t": 384.98294, "r": 480.58875, "b": 393.77991, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "same time, OTSL enables easy error detection and correction during sequence", "bbox": {"l": 134.76498, "t": 396.93793, "r": 480.58978, "b": 405.73489, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "generation. We further demonstrate how the compact structure representation", "bbox": {"l": 134.76498, "t": 408.89291, "r": 480.59473, "b": 417.68988, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "and minimized sequence length improves prediction accuracy and inference time", "bbox": {"l": 134.76498, "t": 420.8479, "r": 480.58868, "b": 429.64487, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "in the TableFormer architecture.", "bbox": {"l": 134.76498, "t": 432.80289, "r": 276.67325, "b": 441.59985, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "To mitigate the issues with HTML in Im2Seq-based TSR models laid out before, we propose here our Optimised Table Structure Language (OTSL). OTSL is designed to express table structure with a minimized vocabulary and a simple set of rules, which are both significantly reduced compared to HTML. At the same time, OTSL enables easy error detection and correction during sequence generation. We further demonstrate how the compact structure representation and minimized sequence length improves prediction accuracy and inference time in the TableFormer architecture."}, {"label": "section_header", "id": 5, "page_no": 5, "cluster": {"id": 5, "label": "section_header", "bbox": {"l": 134.76498, "t": 465.87192, "r": 261.80109, "b": 474.67886, "coord_origin": "TOPLEFT"}, "confidence": 0.9559652209281921, "cells": [{"id": 30, "text": "4.1", "bbox": {"l": 134.76498, "t": 465.87192, "r": 149.40204, "b": 474.67886, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Language Definition", "bbox": {"l": 160.85902, "t": 465.87192, "r": 261.80109, "b": 474.67886, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4.1 Language Definition"}, {"label": "text", "id": 2, "page_no": 5, "cluster": {"id": 2, "label": "text", "bbox": {"l": 134.76498, "t": 488.99789, "r": 480.58871, "b": 521.7058400000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9671263098716736, "cells": [{"id": 32, "text": "In Figure 3, we illustrate how the OTSL is defined. In essence, the OTSL defines", "bbox": {"l": 134.76498, "t": 488.99789, "r": 480.58871, "b": 497.79486, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "only 5 tokens that directly describe a tabular structure based on an atomic 2D", "bbox": {"l": 134.76498, "t": 500.95288, "r": 480.5867, "b": 509.74985, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "grid.", "bbox": {"l": 134.76498, "t": 512.90887, "r": 154.7131, "b": 521.7058400000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In Figure 3, we illustrate how the OTSL is defined. In essence, the OTSL defines only 5 tokens that directly describe a tabular structure based on an atomic 2D grid."}, {"label": "text", "id": 13, "page_no": 5, "cluster": {"id": 13, "label": "text", "bbox": {"l": 149.70898, "t": 525.5018600000001, "r": 409.31137, "b": 534.29883, "coord_origin": "TOPLEFT"}, "confidence": 0.8555866479873657, "cells": [{"id": 35, "text": "The OTSL vocabulary is comprised of the following tokens:", "bbox": {"l": 149.70898, "t": 525.5018600000001, "r": 409.31137, "b": 534.29883, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The OTSL vocabulary is comprised of the following tokens:"}, {"label": "list_item", "id": 9, "page_no": 5, "cluster": {"id": 9, "label": "list_item", "bbox": {"l": 140.99298, "t": 547.96989, "r": 460.54443, "b": 556.77682, "coord_origin": "TOPLEFT"}, "confidence": 0.9184334874153137, "cells": [{"id": 36, "text": "-", "bbox": {"l": 140.99298, "t": 547.96989, "r": 146.72047, "b": 556.77682, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "\"C\" cell -", "bbox": {"l": 151.70099, "t": 547.97986, "r": 193.20619, "b": 556.77682, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "a new table cell", "bbox": {"l": 196.52199, "t": 547.97986, "r": 263.46564, "b": 556.77682, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "that either has or does not have cell content", "bbox": {"l": 267.815, "t": 547.97986, "r": 460.54443, "b": 556.77682, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "-\"C\" cell a new table cell that either has or does not have cell content"}, {"label": "list_item", "id": 8, "page_no": 5, "cluster": {"id": 8, "label": "list_item", "bbox": {"l": 140.99301, "t": 560.5629, "r": 480.59392999999994, "b": 581.32483, "coord_origin": "TOPLEFT"}, "confidence": 0.9319931268692017, "cells": [{"id": 40, "text": "-", "bbox": {"l": 140.99301, "t": 560.5629, "r": 146.7205, "b": 569.36983, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "\"L\" cell -", "bbox": {"l": 151.70102, "t": 560.57286, "r": 194.30011, "b": 569.36983, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "left-looking cell", "bbox": {"l": 198.65903, "t": 560.57286, "r": 264.51779, "b": 569.36983, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": ", merging with the left neighbor cell to create a", "bbox": {"l": 264.51804, "t": 560.57286, "r": 480.59392999999994, "b": 569.36983, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "span", "bbox": {"l": 151.70103, "t": 572.52786, "r": 171.67604, "b": 581.32483, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "-\"L\" cell left-looking cell , merging with the left neighbor cell to create a span"}, {"label": "list_item", "id": 7, "page_no": 5, "cluster": {"id": 7, "label": "list_item", "bbox": {"l": 140.99304, "t": 585.11189, "r": 480.58856, "b": 605.87383, "coord_origin": "TOPLEFT"}, "confidence": 0.9438967704772949, "cells": [{"id": 45, "text": "-", "bbox": {"l": 140.99304, "t": 585.11189, "r": 146.72054, "b": 593.91882, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "\"U\" cell -", "bbox": {"l": 151.70105, "t": 585.12186, "r": 194.11086, "b": 593.91882, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "up-looking cell", "bbox": {"l": 197.74805, "t": 585.12186, "r": 259.89474, "b": 593.91882, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": ", merging with the upper neighbor cell to create a", "bbox": {"l": 259.89206, "t": 585.12186, "r": 480.58856, "b": 593.91882, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "span", "bbox": {"l": 151.70105, "t": 597.07686, "r": 171.67606, "b": 605.87383, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "-\"U\" cell up-looking cell , merging with the upper neighbor cell to create a span"}, {"label": "list_item", "id": 10, "page_no": 5, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 140.99304, "t": 609.6599, "r": 454.55496, "b": 618.46683, "coord_origin": "TOPLEFT"}, "confidence": 0.9036387801170349, "cells": [{"id": 50, "text": "-", "bbox": {"l": 140.99304, "t": 609.6599, "r": 146.72054, "b": 618.46683, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "\"X\" cell -", "bbox": {"l": 151.70105, "t": 609.66986, "r": 193.48323, "b": 618.46683, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "cross cell", "bbox": {"l": 196.79904, "t": 609.66986, "r": 236.12042, "b": 618.46683, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": ", to merge with both left and upper neighbor cells", "bbox": {"l": 236.12505, "t": 609.66986, "r": 454.55496, "b": 618.46683, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "-\"X\" cell cross cell , to merge with both left and upper neighbor cells"}, {"label": "list_item", "id": 12, "page_no": 5, "cluster": {"id": 12, "label": "list_item", "bbox": {"l": 140.99304, "t": 622.2538900000001, "r": 328.61676, "b": 631.06082, "coord_origin": "TOPLEFT"}, "confidence": 0.8636871576309204, "cells": [{"id": 54, "text": "-", "bbox": {"l": 140.99304, "t": 622.2538900000001, "r": 146.72054, "b": 631.06082, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "\"NL\" -", "bbox": {"l": 151.70105, "t": 622.26385, "r": 181.99434, "b": 631.06082, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "new-line", "bbox": {"l": 185.31705, "t": 622.26385, "r": 221.46236, "b": 631.06082, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": ", switch to the next row.", "bbox": {"l": 221.46104, "t": 622.26385, "r": 328.61676, "b": 631.06082, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "-\"NL\" new-line , switch to the next row."}, {"label": "text", "id": 6, "page_no": 5, "cluster": {"id": 6, "label": "text", "bbox": {"l": 134.76505, "t": 644.10286, "r": 480.59280000000007, "b": 664.85484, "coord_origin": "TOPLEFT"}, "confidence": 0.9443338513374329, "cells": [{"id": 58, "text": "A notable attribute of OTSL is that it has the capability of achieving lossless", "bbox": {"l": 149.70905, "t": 644.10286, "r": 480.59280000000007, "b": 652.8998300000001, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "conversion to HTML.", "bbox": {"l": 134.76505, "t": 656.05786, "r": 228.22321, "b": 664.85484, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "A notable attribute of OTSL is that it has the capability of achieving lossless conversion to HTML."}], "headers": [{"label": "page_header", "id": 14, "page_no": 5, "cluster": {"id": 14, "label": "page_header", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8378868699073792, "cells": [{"id": 0, "text": "6", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "6"}, {"label": "page_header", "id": 11, "page_no": 5, "cluster": {"id": 11, "label": "page_header", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8919177651405334, "cells": [{"id": 1, "text": "M.", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 178.07675, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37415, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "M. Lysak, et al."}]}}, {"page_no": 6, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "7", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Fig. 3.", "bbox": {"l": 134.765, "t": 125.79918999999984, "r": 162.64424, "b": 133.72551999999996, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "OTSL description of table structure: A - table example; B - graphical repre-", "bbox": {"l": 166.276, "t": 125.86200000000008, "r": 480.58675999999997, "b": 133.93169999999998, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "sentation of table structure; C - mapping structure on a grid; D - OTSL structure", "bbox": {"l": 134.765, "t": 136.82097999999996, "r": 480.5874, "b": 144.89068999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "encoding; E - explanation on cell encoding", "bbox": {"l": 134.765, "t": 147.77997000000005, "r": 306.1156, "b": 155.84966999999995, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "C", "bbox": {"l": 374.49326, "t": 168.59362999999996, "r": 381.66843, "b": 177.91540999999995, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "C", "bbox": {"l": 398.74011, "t": 168.50005999999996, "r": 405.91528, "b": 177.82183999999995, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "C", "bbox": {"l": 373.76862, "t": 192.92553999999996, "r": 380.94379, "b": 202.24730999999997, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "C", "bbox": {"l": 386.66388, "t": 193.07061999999996, "r": 393.83905, "b": 202.39239999999995, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "C", "bbox": {"l": 386.68707, "t": 205.13756999999998, "r": 393.86224, "b": 214.45934999999997, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "C", "bbox": {"l": 398.65729, "t": 180.73279000000002, "r": 405.83246, "b": 190.05457, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "C", "bbox": {"l": 410.77908, "t": 180.73859000000004, "r": 417.95425, "b": 190.06035999999995, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "C", "bbox": {"l": 422.90503, "t": 180.65247, "r": 430.08020000000005, "b": 189.97424, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "C", "bbox": {"l": 398.7807, "t": 192.98865, "r": 405.95587, "b": 202.31042000000002, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "C", "bbox": {"l": 410.90164, "t": 192.99487, "r": 418.07681, "b": 202.31664999999998, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "C", "bbox": {"l": 423.02753, "t": 192.909, "r": 430.2027, "b": 202.23077, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "C", "bbox": {"l": 398.78235, "t": 205.31573000000003, "r": 405.95752, "b": 214.63751000000002, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "C", "bbox": {"l": 410.90414, "t": 205.32196, "r": 418.07932, "b": 214.64373999999998, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "C", "bbox": {"l": 423.03003, "t": 205.23614999999995, "r": 430.20520000000005, "b": 214.55791999999997, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "C", "bbox": {"l": 386.50574, "t": 217.03882, "r": 393.68091, "b": 226.36059999999998, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "C", "bbox": {"l": 398.60181, "t": 217.21704, "r": 405.77698, "b": 226.53882, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "C", "bbox": {"l": 410.72275, "t": 217.22321, "r": 417.89792, "b": 226.54498, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "C", "bbox": {"l": 422.84869, "t": 217.13738999999998, "r": 430.02386, "b": 226.45916999999997, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "NL", "bbox": {"l": 435.16009999999994, "t": 167.69011999999998, "r": 447.86273, "b": 177.01189999999997, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "NL", "bbox": {"l": 435.44415, "t": 180.20025999999996, "r": 448.14679, "b": 189.52202999999997, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "NL", "bbox": {"l": 435.46735, "t": 192.49474999999995, "r": 448.16998000000007, "b": 201.81652999999994, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "NL", "bbox": {"l": 435.38202, "t": 204.83025999999995, "r": 448.08466, "b": 214.15204000000006, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "NL", "bbox": {"l": 435.59906, "t": 217.2337, "r": 448.3017, "b": 226.55548, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "U", "bbox": {"l": 374.14957, "t": 205.23492, "r": 381.32474, "b": 214.55669999999998, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "U", "bbox": {"l": 374.0419, "t": 217.14648, "r": 381.21707, "b": 226.46826, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "U", "bbox": {"l": 374.34418, "t": 180.93488000000002, "r": 381.51935, "b": 190.25665000000004, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "L", "bbox": {"l": 387.76285, "t": 168.57788000000005, "r": 393.28833, "b": 177.89966000000004, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "L", "bbox": {"l": 411.86395, "t": 168.06195000000002, "r": 417.38943, "b": 177.38373, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "L", "bbox": {"l": 423.33563, "t": 167.93439, "r": 428.86111, "b": 177.25616000000002, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "X", "bbox": {"l": 387.13593, "t": 180.78576999999996, "r": 393.76453, "b": 190.10753999999997, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "C", "bbox": {"l": 282.2594, "t": 244.50878999999998, "r": 289.43457, "b": 253.83056999999997, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "U", "bbox": {"l": 282.11035, "t": 256.85022000000004, "r": 289.28552, "b": 266.172, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "U", "bbox": {"l": 282.40848, "t": 269.13300000000004, "r": 289.58365, "b": 278.45477000000005, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "L", "bbox": {"l": 295.52902, "t": 244.49347, "r": 301.0545, "b": 253.81525, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "L", "bbox": {"l": 307.46613, "t": 244.57372999999995, "r": 312.99161, "b": 253.89550999999994, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "L", "bbox": {"l": 318.76886, "t": 244.44037000000003, "r": 324.29434, "b": 253.76215000000002, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "X", "bbox": {"l": 294.9021, "t": 256.70154, "r": 301.03976, "b": 266.02332, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "X X", "bbox": {"l": 307.17743, "t": 256.70154, "r": 325.59039, "b": 266.02332, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "X", "bbox": {"l": 294.78949, "t": 269.25420999999994, "r": 300.92715, "b": 278.57599000000005, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "X X", "bbox": {"l": 307.06482, "t": 269.25420999999994, "r": 325.47778, "b": 278.57599000000005, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "C", "bbox": {"l": 195.93939, "t": 268.74798999999996, "r": 203.11456, "b": 278.06976, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "L", "bbox": {"l": 209.20891, "t": 268.73267, "r": 214.73439, "b": 278.05444, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "L", "bbox": {"l": 221.14551, "t": 268.81293000000005, "r": 226.67099, "b": 278.13469999999995, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "L", "bbox": {"l": 232.44858, "t": 268.67957, "r": 237.97405999999998, "b": 278.00134, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "C", "bbox": {"l": 196.21715, "t": 244.53961000000004, "r": 203.39232, "b": 253.86139000000003, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "C", "bbox": {"l": 250.32143, "t": 244.09813999999994, "r": 257.49661, "b": 253.41992000000005, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "U", "bbox": {"l": 250.17235999999997, "t": 256.43951000000004, "r": 257.34753, "b": 265.76129000000003, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "U", "bbox": {"l": 250.47049000000004, "t": 268.72222999999997, "r": 257.64566, "b": 278.04400999999996, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "1", "bbox": {"l": 334.51135, "t": 242.99463000000003, "r": 337.22485, "b": 249.20911, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "- simple cells: \"C\"", "bbox": {"l": 339.93835, "t": 242.99463000000003, "r": 391.49472, "b": 249.20911, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "2", "bbox": {"l": 334.51135, "t": 252.93255999999997, "r": 337.33313, "b": 259.14703, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "- horizontal merges: \"C\", \"L\"", "bbox": {"l": 340.15491, "t": 252.93255999999997, "r": 421.98624, "b": 259.14703, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "3", "bbox": {"l": 334.51135, "t": 262.87048000000004, "r": 337.29868, "b": 269.08496, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "- vertical merges: \"C\", \"U\"", "bbox": {"l": 340.086, "t": 262.87048000000004, "r": 415.34375, "b": 269.08496, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "4", "bbox": {"l": 334.51135, "t": 272.80841, "r": 337.30188, "b": 279.02288999999996, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "- 2d merges: \"C\", \"L\", \"U\", \"X\"", "bbox": {"l": 340.09241, "t": 272.80841, "r": 426.59875, "b": 279.02288999999996, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "1", "bbox": {"l": 185.67178, "t": 244.04224, "r": 189.35544, "b": 250.25671, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "2", "bbox": {"l": 185.96759, "t": 268.34766, "r": 189.65125, "b": 274.56213, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "3", "bbox": {"l": 239.34152, "t": 243.62523999999996, "r": 243.02518, "b": 249.83972000000006, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "4", "bbox": {"l": 271.32852, "t": 243.49390000000005, "r": 275.01218, "b": 249.70836999999995, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "2", "bbox": {"l": 229.81627, "t": 166.51495, "r": 233.49992000000003, "b": 172.72942999999998, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "1", "bbox": {"l": 257.24402, "t": 189.961, "r": 260.92767, "b": 196.17548, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "3", "bbox": {"l": 186.87526, "t": 177.97668, "r": 190.55891, "b": 184.19115999999997, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "4", "bbox": {"l": 196.48746, "t": 169.01520000000005, "r": 200.17111, "b": 175.22968000000003, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "A", "bbox": {"l": 169.74728, "t": 167.88225999999997, "r": 175.72659, "b": 175.65039000000002, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "B", "bbox": {"l": 169.74728, "t": 206.83867999999995, "r": 175.72659, "b": 214.60681, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "C", "bbox": {"l": 274.29419, "t": 168.27972, "r": 280.2735, "b": 176.04785000000004, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "D", "bbox": {"l": 359.56152, "t": 168.27972, "r": 365.54083, "b": 176.04785000000004, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "E", "bbox": {"l": 169.74728, "t": 243.21149000000003, "r": 175.27112, "b": 250.97960999999998, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "4.2", "bbox": {"l": 134.765, "t": 305.29581, "r": 149.40205, "b": 314.10275, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "Language Syntax", "bbox": {"l": 160.85904, "t": 305.29581, "r": 246.65197999999998, "b": 314.10275, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "The OTSL representation follows these syntax rules:", "bbox": {"l": 134.765, "t": 325.24777, "r": 363.79617, "b": 334.04474, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "1.", "bbox": {"l": 138.97299, "t": 347.18079, "r": 146.71991, "b": 355.97775, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "Left-looking cell rule", "bbox": {"l": 151.70099, "t": 347.17081, "r": 257.37927, "b": 355.97775, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": ": The left neighbour of an \"L\" cell must be either", "bbox": {"l": 257.383, "t": 347.18079, "r": 480.58902, "b": 355.97775, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "another \"L\" cell or a \"C\" cell.", "bbox": {"l": 151.70099, "t": 359.13678, "r": 283.59387, "b": 367.93375, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "2.", "bbox": {"l": 138.97299, "t": 371.09479, "r": 146.71991, "b": 379.89175, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "Up-looking cell rule", "bbox": {"l": 151.70099, "t": 371.08481, "r": 252.11203, "b": 379.89175, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": ": The upper neighbour of a \"U\" cell must be either", "bbox": {"l": 252.112, "t": 371.09479, "r": 480.59229000000005, "b": 379.89175, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "another \"U\" cell or a \"C\" cell.", "bbox": {"l": 151.70099, "t": 383.04977, "r": 284.8392, "b": 391.84673999999995, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "3.", "bbox": {"l": 138.97299, "t": 395.0077800000001, "r": 146.71991, "b": 403.80475, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Cross cell rule", "bbox": {"l": 151.70099, "t": 394.99780000000004, "r": 223.3042, "b": 403.80475, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": ":", "bbox": {"l": 223.30699, "t": 395.0077800000001, "r": 226.07360999999997, "b": 403.80475, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "The left neighbour of an \"X\" cell must be either another \"X\" cell or a \"U\"", "bbox": {"l": 151.70099, "t": 406.96677, "r": 480.59238, "b": 415.76373, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "cell, and the upper neighbour of an \"X\" cell must be either another \"X\" cell", "bbox": {"l": 151.70099, "t": 418.9217499999999, "r": 480.59219, "b": 427.71871999999996, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "or an \"L\" cell.", "bbox": {"l": 151.70099, "t": 430.87674, "r": 214.39663999999996, "b": 439.67371, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "4.", "bbox": {"l": 138.97299, "t": 442.83572, "r": 146.71991, "b": 451.63269, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "First row rule", "bbox": {"l": 151.70099, "t": 442.82574, "r": 221.32263, "b": 451.63269, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": ": Only \"L\" cells and \"C\" cells are allowed in the first row.", "bbox": {"l": 221.32700000000003, "t": 442.83572, "r": 474.59018, "b": 451.63269, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "5.", "bbox": {"l": 138.97299, "t": 454.7937299999999, "r": 146.71991, "b": 463.5907, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "First column rule", "bbox": {"l": 151.70099, "t": 454.78375, "r": 240.71982, "b": 463.5907, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": ": Only \"U\" cells and \"C\" cells are allowed in the first", "bbox": {"l": 240.71599, "t": 454.7937299999999, "r": 480.58746, "b": 463.5907, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "column.", "bbox": {"l": 151.70099, "t": 466.74872, "r": 186.0072, "b": 475.54568, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "6.", "bbox": {"l": 138.97299, "t": 478.70673, "r": 146.71991, "b": 487.50369, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "Rectangular rule", "bbox": {"l": 151.70099, "t": 478.69675, "r": 235.15768, "b": 487.50369, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": ": The table representation is always rectangular - all rows", "bbox": {"l": 235.15697999999998, "t": 478.70673, "r": 480.59457, "b": 487.50369, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "must have an equal number of tokens, terminated with \"NL\" token.", "bbox": {"l": 151.70099, "t": 490.66272, "r": 448.04147, "b": 499.45969, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "The application of these rules gives OTSL a set of unique properties. First", "bbox": {"l": 149.70898, "t": 512.59271, "r": 480.59583, "b": 521.38968, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "of all, the OTSL enforces a strictly rectangular structure representation, where", "bbox": {"l": 134.76498, "t": 524.5477000000001, "r": 480.59079, "b": 533.34467, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "every new-line token starts a new row. As a consequence, all rows and all columns", "bbox": {"l": 134.76498, "t": 536.5027, "r": 480.59482, "b": 545.29967, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "have exactly the same number of tokens, irrespective of cell spans. Secondly, the", "bbox": {"l": 134.76498, "t": 548.4586899999999, "r": 480.58865000000003, "b": 557.25566, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "OTSL representation is unambiguous: Every table structure is represented in one", "bbox": {"l": 134.76498, "t": 560.4137000000001, "r": 480.59365999999994, "b": 569.21066, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "way. In this representation every table cell corresponds to a \"C\"-cell token, which", "bbox": {"l": 134.76498, "t": 572.3687, "r": 480.58673, "b": 581.16566, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "in case of spans is always located in the top-left corner of the table cell definition.", "bbox": {"l": 134.76498, "t": 584.3237, "r": 480.59171, "b": 593.12067, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "Third, OTSL syntax rules are only backward-looking. As a consequence, every", "bbox": {"l": 134.76498, "t": 596.2787, "r": 480.59180000000003, "b": 605.07567, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "predicted token can be validated straight during sequence generation by looking", "bbox": {"l": 134.76498, "t": 608.2347, "r": 480.5936899999999, "b": 617.03166, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "at the previously predicted sequence. As such, OTSL can guarantee that every", "bbox": {"l": 134.76498, "t": 620.1897, "r": 480.59072999999995, "b": 628.98666, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "predicted sequence is syntactically valid.", "bbox": {"l": 134.76498, "t": 632.1447000000001, "r": 311.19769, "b": 640.9416699999999, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "These characteristics can be easily learned by sequence generator networks,", "bbox": {"l": 149.70898, "t": 644.1026899999999, "r": 480.59186, "b": 652.89966, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "as we demonstrate further below. We find strong indications that this pattern", "bbox": {"l": 134.76498, "t": 656.05769, "r": 480.59265, "b": 664.8546699999999, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 7, "label": "page_header", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.932651162147522, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "page_header", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8749732375144958, "cells": [{"id": 1, "text": "7", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "caption", "bbox": {"l": 134.765, "t": 125.79918999999984, "r": 480.5874, "b": 155.84966999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9333080053329468, "cells": [{"id": 2, "text": "Fig. 3.", "bbox": {"l": 134.765, "t": 125.79918999999984, "r": 162.64424, "b": 133.72551999999996, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "OTSL description of table structure: A - table example; B - graphical repre-", "bbox": {"l": 166.276, "t": 125.86200000000008, "r": 480.58675999999997, "b": 133.93169999999998, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "sentation of table structure; C - mapping structure on a grid; D - OTSL structure", "bbox": {"l": 134.765, "t": 136.82097999999996, "r": 480.5874, "b": 144.89068999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "encoding; E - explanation on cell encoding", "bbox": {"l": 134.765, "t": 147.77997000000005, "r": 306.1156, "b": 155.84966999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "picture", "bbox": {"l": 164.65028381347656, "t": 163.79708862304688, "r": 449.5505676269531, "b": 280.3409423828125, "coord_origin": "TOPLEFT"}, "confidence": 0.7868534922599792, "cells": [{"id": 6, "text": "C", "bbox": {"l": 374.49326, "t": 168.59362999999996, "r": 381.66843, "b": 177.91540999999995, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "C", "bbox": {"l": 398.74011, "t": 168.50005999999996, "r": 405.91528, "b": 177.82183999999995, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "C", "bbox": {"l": 373.76862, "t": 192.92553999999996, "r": 380.94379, "b": 202.24730999999997, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "C", "bbox": {"l": 386.66388, "t": 193.07061999999996, "r": 393.83905, "b": 202.39239999999995, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "C", "bbox": {"l": 386.68707, "t": 205.13756999999998, "r": 393.86224, "b": 214.45934999999997, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "C", "bbox": {"l": 398.65729, "t": 180.73279000000002, "r": 405.83246, "b": 190.05457, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "C", "bbox": {"l": 410.77908, "t": 180.73859000000004, "r": 417.95425, "b": 190.06035999999995, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "C", "bbox": {"l": 422.90503, "t": 180.65247, "r": 430.08020000000005, "b": 189.97424, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "C", "bbox": {"l": 398.7807, "t": 192.98865, "r": 405.95587, "b": 202.31042000000002, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "C", "bbox": {"l": 410.90164, "t": 192.99487, "r": 418.07681, "b": 202.31664999999998, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "C", "bbox": {"l": 423.02753, "t": 192.909, "r": 430.2027, "b": 202.23077, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "C", "bbox": {"l": 398.78235, "t": 205.31573000000003, "r": 405.95752, "b": 214.63751000000002, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "C", "bbox": {"l": 410.90414, "t": 205.32196, "r": 418.07932, "b": 214.64373999999998, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "C", "bbox": {"l": 423.03003, "t": 205.23614999999995, "r": 430.20520000000005, "b": 214.55791999999997, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "C", "bbox": {"l": 386.50574, "t": 217.03882, "r": 393.68091, "b": 226.36059999999998, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "C", "bbox": {"l": 398.60181, "t": 217.21704, "r": 405.77698, "b": 226.53882, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "C", "bbox": {"l": 410.72275, "t": 217.22321, "r": 417.89792, "b": 226.54498, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "C", "bbox": {"l": 422.84869, "t": 217.13738999999998, "r": 430.02386, "b": 226.45916999999997, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "NL", "bbox": {"l": 435.16009999999994, "t": 167.69011999999998, "r": 447.86273, "b": 177.01189999999997, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "NL", "bbox": {"l": 435.44415, "t": 180.20025999999996, "r": 448.14679, "b": 189.52202999999997, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "NL", "bbox": {"l": 435.46735, "t": 192.49474999999995, "r": 448.16998000000007, "b": 201.81652999999994, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "NL", "bbox": {"l": 435.38202, "t": 204.83025999999995, "r": 448.08466, "b": 214.15204000000006, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "NL", "bbox": {"l": 435.59906, "t": 217.2337, "r": 448.3017, "b": 226.55548, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "U", "bbox": {"l": 374.14957, "t": 205.23492, "r": 381.32474, "b": 214.55669999999998, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "U", "bbox": {"l": 374.0419, "t": 217.14648, "r": 381.21707, "b": 226.46826, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "U", "bbox": {"l": 374.34418, "t": 180.93488000000002, "r": 381.51935, "b": 190.25665000000004, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "L", "bbox": {"l": 387.76285, "t": 168.57788000000005, "r": 393.28833, "b": 177.89966000000004, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "L", "bbox": {"l": 411.86395, "t": 168.06195000000002, "r": 417.38943, "b": 177.38373, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "L", "bbox": {"l": 423.33563, "t": 167.93439, "r": 428.86111, "b": 177.25616000000002, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "X", "bbox": {"l": 387.13593, "t": 180.78576999999996, "r": 393.76453, "b": 190.10753999999997, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "C", "bbox": {"l": 282.2594, "t": 244.50878999999998, "r": 289.43457, "b": 253.83056999999997, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "U", "bbox": {"l": 282.11035, "t": 256.85022000000004, "r": 289.28552, "b": 266.172, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "U", "bbox": {"l": 282.40848, "t": 269.13300000000004, "r": 289.58365, "b": 278.45477000000005, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "L", "bbox": {"l": 295.52902, "t": 244.49347, "r": 301.0545, "b": 253.81525, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "L", "bbox": {"l": 307.46613, "t": 244.57372999999995, "r": 312.99161, "b": 253.89550999999994, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "L", "bbox": {"l": 318.76886, "t": 244.44037000000003, "r": 324.29434, "b": 253.76215000000002, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "X", "bbox": {"l": 294.9021, "t": 256.70154, "r": 301.03976, "b": 266.02332, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "X X", "bbox": {"l": 307.17743, "t": 256.70154, "r": 325.59039, "b": 266.02332, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "X", "bbox": {"l": 294.78949, "t": 269.25420999999994, "r": 300.92715, "b": 278.57599000000005, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "X X", "bbox": {"l": 307.06482, "t": 269.25420999999994, "r": 325.47778, "b": 278.57599000000005, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "C", "bbox": {"l": 195.93939, "t": 268.74798999999996, "r": 203.11456, "b": 278.06976, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "L", "bbox": {"l": 209.20891, "t": 268.73267, "r": 214.73439, "b": 278.05444, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "L", "bbox": {"l": 221.14551, "t": 268.81293000000005, "r": 226.67099, "b": 278.13469999999995, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "L", "bbox": {"l": 232.44858, "t": 268.67957, "r": 237.97405999999998, "b": 278.00134, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "C", "bbox": {"l": 196.21715, "t": 244.53961000000004, "r": 203.39232, "b": 253.86139000000003, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "C", "bbox": {"l": 250.32143, "t": 244.09813999999994, "r": 257.49661, "b": 253.41992000000005, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "U", "bbox": {"l": 250.17235999999997, "t": 256.43951000000004, "r": 257.34753, "b": 265.76129000000003, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "U", "bbox": {"l": 250.47049000000004, "t": 268.72222999999997, "r": 257.64566, "b": 278.04400999999996, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "1", "bbox": {"l": 334.51135, "t": 242.99463000000003, "r": 337.22485, "b": 249.20911, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "- simple cells: \"C\"", "bbox": {"l": 339.93835, "t": 242.99463000000003, "r": 391.49472, "b": 249.20911, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "2", "bbox": {"l": 334.51135, "t": 252.93255999999997, "r": 337.33313, "b": 259.14703, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "- horizontal merges: \"C\", \"L\"", "bbox": {"l": 340.15491, "t": 252.93255999999997, "r": 421.98624, "b": 259.14703, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "3", "bbox": {"l": 334.51135, "t": 262.87048000000004, "r": 337.29868, "b": 269.08496, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "- vertical merges: \"C\", \"U\"", "bbox": {"l": 340.086, "t": 262.87048000000004, "r": 415.34375, "b": 269.08496, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "4", "bbox": {"l": 334.51135, "t": 272.80841, "r": 337.30188, "b": 279.02288999999996, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "- 2d merges: \"C\", \"L\", \"U\", \"X\"", "bbox": {"l": 340.09241, "t": 272.80841, "r": 426.59875, "b": 279.02288999999996, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "1", "bbox": {"l": 185.67178, "t": 244.04224, "r": 189.35544, "b": 250.25671, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "2", "bbox": {"l": 185.96759, "t": 268.34766, "r": 189.65125, "b": 274.56213, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "3", "bbox": {"l": 239.34152, "t": 243.62523999999996, "r": 243.02518, "b": 249.83972000000006, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "4", "bbox": {"l": 271.32852, "t": 243.49390000000005, "r": 275.01218, "b": 249.70836999999995, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "2", "bbox": {"l": 229.81627, "t": 166.51495, "r": 233.49992000000003, "b": 172.72942999999998, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "1", "bbox": {"l": 257.24402, "t": 189.961, "r": 260.92767, "b": 196.17548, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "3", "bbox": {"l": 186.87526, "t": 177.97668, "r": 190.55891, "b": 184.19115999999997, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "4", "bbox": {"l": 196.48746, "t": 169.01520000000005, "r": 200.17111, "b": 175.22968000000003, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "A", "bbox": {"l": 169.74728, "t": 167.88225999999997, "r": 175.72659, "b": 175.65039000000002, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "B", "bbox": {"l": 169.74728, "t": 206.83867999999995, "r": 175.72659, "b": 214.60681, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "C", "bbox": {"l": 274.29419, "t": 168.27972, "r": 280.2735, "b": 176.04785000000004, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "D", "bbox": {"l": 359.56152, "t": 168.27972, "r": 365.54083, "b": 176.04785000000004, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "E", "bbox": {"l": 169.74728, "t": 243.21149000000003, "r": 175.27112, "b": 250.97960999999998, "coord_origin": "TOPLEFT"}}], "children": [{"id": 19, "label": "text", "bbox": {"l": 374.49326, "t": 168.59362999999996, "r": 381.66843, "b": 177.91540999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": "C", "bbox": {"l": 374.49326, "t": 168.59362999999996, "r": 381.66843, "b": 177.91540999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 398.74011, "t": 168.50005999999996, "r": 405.91528, "b": 177.82183999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "C", "bbox": {"l": 398.74011, "t": 168.50005999999996, "r": 405.91528, "b": 177.82183999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 373.76862, "t": 192.92553999999996, "r": 380.94379, "b": 202.24730999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "C", "bbox": {"l": 373.76862, "t": 192.92553999999996, "r": 380.94379, "b": 202.24730999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 386.66388, "t": 193.07061999999996, "r": 393.83905, "b": 202.39239999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "C", "bbox": {"l": 386.66388, "t": 193.07061999999996, "r": 393.83905, "b": 202.39239999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 386.68707, "t": 205.13756999999998, "r": 393.86224, "b": 214.45934999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "C", "bbox": {"l": 386.68707, "t": 205.13756999999998, "r": 393.86224, "b": 214.45934999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 398.65729, "t": 180.73279000000002, "r": 405.83246, "b": 190.05457, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "C", "bbox": {"l": 398.65729, "t": 180.73279000000002, "r": 405.83246, "b": 190.05457, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 410.77908, "t": 180.73859000000004, "r": 417.95425, "b": 190.06035999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "C", "bbox": {"l": 410.77908, "t": 180.73859000000004, "r": 417.95425, "b": 190.06035999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 422.90503, "t": 180.65247, "r": 430.08020000000005, "b": 189.97424, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "C", "bbox": {"l": 422.90503, "t": 180.65247, "r": 430.08020000000005, "b": 189.97424, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 398.7807, "t": 192.98865, "r": 405.95587, "b": 202.31042000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "C", "bbox": {"l": 398.7807, "t": 192.98865, "r": 405.95587, "b": 202.31042000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 410.90164, "t": 192.99487, "r": 418.07681, "b": 202.31664999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "C", "bbox": {"l": 410.90164, "t": 192.99487, "r": 418.07681, "b": 202.31664999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 423.02753, "t": 192.909, "r": 430.2027, "b": 202.23077, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "C", "bbox": {"l": 423.02753, "t": 192.909, "r": 430.2027, "b": 202.23077, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 398.78235, "t": 205.31573000000003, "r": 405.95752, "b": 214.63751000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "C", "bbox": {"l": 398.78235, "t": 205.31573000000003, "r": 405.95752, "b": 214.63751000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 410.90414, "t": 205.32196, "r": 418.07932, "b": 214.64373999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "C", "bbox": {"l": 410.90414, "t": 205.32196, "r": 418.07932, "b": 214.64373999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 423.03003, "t": 205.23614999999995, "r": 430.20520000000005, "b": 214.55791999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "C", "bbox": {"l": 423.03003, "t": 205.23614999999995, "r": 430.20520000000005, "b": 214.55791999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 386.50574, "t": 217.03882, "r": 393.68091, "b": 226.36059999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "C", "bbox": {"l": 386.50574, "t": 217.03882, "r": 393.68091, "b": 226.36059999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 398.60181, "t": 217.21704, "r": 405.77698, "b": 226.53882, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "C", "bbox": {"l": 398.60181, "t": 217.21704, "r": 405.77698, "b": 226.53882, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 410.72275, "t": 217.22321, "r": 417.89792, "b": 226.54498, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "C", "bbox": {"l": 410.72275, "t": 217.22321, "r": 417.89792, "b": 226.54498, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 422.84869, "t": 217.13738999999998, "r": 430.02386, "b": 226.45916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "C", "bbox": {"l": 422.84869, "t": 217.13738999999998, "r": 430.02386, "b": 226.45916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 435.16009999999994, "t": 167.69011999999998, "r": 447.86273, "b": 177.01189999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "NL", "bbox": {"l": 435.16009999999994, "t": 167.69011999999998, "r": 447.86273, "b": 177.01189999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 435.44415, "t": 180.20025999999996, "r": 448.14679, "b": 189.52202999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "NL", "bbox": {"l": 435.44415, "t": 180.20025999999996, "r": 448.14679, "b": 189.52202999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 435.46735, "t": 192.49474999999995, "r": 448.16998000000007, "b": 201.81652999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "NL", "bbox": {"l": 435.46735, "t": 192.49474999999995, "r": 448.16998000000007, "b": 201.81652999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 435.38202, "t": 204.83025999999995, "r": 448.08466, "b": 214.15204000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "NL", "bbox": {"l": 435.38202, "t": 204.83025999999995, "r": 448.08466, "b": 214.15204000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 435.59906, "t": 217.2337, "r": 448.3017, "b": 226.55548, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "NL", "bbox": {"l": 435.59906, "t": 217.2337, "r": 448.3017, "b": 226.55548, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 374.14957, "t": 205.23492, "r": 381.32474, "b": 214.55669999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "U", "bbox": {"l": 374.14957, "t": 205.23492, "r": 381.32474, "b": 214.55669999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 374.0419, "t": 217.14648, "r": 381.21707, "b": 226.46826, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "U", "bbox": {"l": 374.0419, "t": 217.14648, "r": 381.21707, "b": 226.46826, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 374.34418, "t": 180.93488000000002, "r": 381.51935, "b": 190.25665000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "U", "bbox": {"l": 374.34418, "t": 180.93488000000002, "r": 381.51935, "b": 190.25665000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 387.76285, "t": 168.57788000000005, "r": 393.28833, "b": 177.89966000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "L", "bbox": {"l": 387.76285, "t": 168.57788000000005, "r": 393.28833, "b": 177.89966000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 411.86395, "t": 168.06195000000002, "r": 417.38943, "b": 177.38373, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "L", "bbox": {"l": 411.86395, "t": 168.06195000000002, "r": 417.38943, "b": 177.38373, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 423.33563, "t": 167.93439, "r": 428.86111, "b": 177.25616000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "L", "bbox": {"l": 423.33563, "t": 167.93439, "r": 428.86111, "b": 177.25616000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 387.13593, "t": 180.78576999999996, "r": 393.76453, "b": 190.10753999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "X", "bbox": {"l": 387.13593, "t": 180.78576999999996, "r": 393.76453, "b": 190.10753999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 282.2594, "t": 244.50878999999998, "r": 289.43457, "b": 253.83056999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "C", "bbox": {"l": 282.2594, "t": 244.50878999999998, "r": 289.43457, "b": 253.83056999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 282.11035, "t": 256.85022000000004, "r": 289.28552, "b": 266.172, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "U", "bbox": {"l": 282.11035, "t": 256.85022000000004, "r": 289.28552, "b": 266.172, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 282.40848, "t": 269.13300000000004, "r": 289.58365, "b": 278.45477000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "U", "bbox": {"l": 282.40848, "t": 269.13300000000004, "r": 289.58365, "b": 278.45477000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 295.52902, "t": 244.49347, "r": 301.0545, "b": 253.81525, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "L", "bbox": {"l": 295.52902, "t": 244.49347, "r": 301.0545, "b": 253.81525, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 307.46613, "t": 244.57372999999995, "r": 312.99161, "b": 253.89550999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "L", "bbox": {"l": 307.46613, "t": 244.57372999999995, "r": 312.99161, "b": 253.89550999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 318.76886, "t": 244.44037000000003, "r": 324.29434, "b": 253.76215000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "L", "bbox": {"l": 318.76886, "t": 244.44037000000003, "r": 324.29434, "b": 253.76215000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 294.9021, "t": 256.70154, "r": 301.03976, "b": 266.02332, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "X", "bbox": {"l": 294.9021, "t": 256.70154, "r": 301.03976, "b": 266.02332, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 307.17743, "t": 256.70154, "r": 325.59039, "b": 266.02332, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "X X", "bbox": {"l": 307.17743, "t": 256.70154, "r": 325.59039, "b": 266.02332, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 294.78949, "t": 269.25420999999994, "r": 300.92715, "b": 278.57599000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "X", "bbox": {"l": 294.78949, "t": 269.25420999999994, "r": 300.92715, "b": 278.57599000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 307.06482, "t": 269.25420999999994, "r": 325.47778, "b": 278.57599000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "X X", "bbox": {"l": 307.06482, "t": 269.25420999999994, "r": 325.47778, "b": 278.57599000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 195.93939, "t": 268.74798999999996, "r": 203.11456, "b": 278.06976, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "C", "bbox": {"l": 195.93939, "t": 268.74798999999996, "r": 203.11456, "b": 278.06976, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 209.20891, "t": 268.73267, "r": 214.73439, "b": 278.05444, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "L", "bbox": {"l": 209.20891, "t": 268.73267, "r": 214.73439, "b": 278.05444, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 221.14551, "t": 268.81293000000005, "r": 226.67099, "b": 278.13469999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "L", "bbox": {"l": 221.14551, "t": 268.81293000000005, "r": 226.67099, "b": 278.13469999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 232.44858, "t": 268.67957, "r": 237.97405999999998, "b": 278.00134, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "L", "bbox": {"l": 232.44858, "t": 268.67957, "r": 237.97405999999998, "b": 278.00134, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 196.21715, "t": 244.53961000000004, "r": 203.39232, "b": 253.86139000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "C", "bbox": {"l": 196.21715, "t": 244.53961000000004, "r": 203.39232, "b": 253.86139000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 250.32143, "t": 244.09813999999994, "r": 257.49661, "b": 253.41992000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "C", "bbox": {"l": 250.32143, "t": 244.09813999999994, "r": 257.49661, "b": 253.41992000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 250.17235999999997, "t": 256.43951000000004, "r": 257.34753, "b": 265.76129000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "U", "bbox": {"l": 250.17235999999997, "t": 256.43951000000004, "r": 257.34753, "b": 265.76129000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 250.47049000000004, "t": 268.72222999999997, "r": 257.64566, "b": 278.04400999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "U", "bbox": {"l": 250.47049000000004, "t": 268.72222999999997, "r": 257.64566, "b": 278.04400999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 334.51135, "t": 242.99463000000003, "r": 337.22485, "b": 249.20911, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "1", "bbox": {"l": 334.51135, "t": 242.99463000000003, "r": 337.22485, "b": 249.20911, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 339.93835, "t": 242.99463000000003, "r": 391.49472, "b": 249.20911, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "- simple cells: \"C\"", "bbox": {"l": 339.93835, "t": 242.99463000000003, "r": 391.49472, "b": 249.20911, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 334.51135, "t": 252.93255999999997, "r": 337.33313, "b": 259.14703, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "2", "bbox": {"l": 334.51135, "t": 252.93255999999997, "r": 337.33313, "b": 259.14703, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 340.15491, "t": 252.93255999999997, "r": 421.98624, "b": 259.14703, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "- horizontal merges: \"C\", \"L\"", "bbox": {"l": 340.15491, "t": 252.93255999999997, "r": 421.98624, "b": 259.14703, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 334.51135, "t": 262.87048000000004, "r": 337.29868, "b": 269.08496, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "3", "bbox": {"l": 334.51135, "t": 262.87048000000004, "r": 337.29868, "b": 269.08496, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 340.086, "t": 262.87048000000004, "r": 415.34375, "b": 269.08496, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "- vertical merges: \"C\", \"U\"", "bbox": {"l": 340.086, "t": 262.87048000000004, "r": 415.34375, "b": 269.08496, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "list_item", "bbox": {"l": 334.51135, "t": 272.80841, "r": 426.59875, "b": 279.02288999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.5250625610351562, "cells": [{"id": 60, "text": "4", "bbox": {"l": 334.51135, "t": 272.80841, "r": 337.30188, "b": 279.02288999999996, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "- 2d merges: \"C\", \"L\", \"U\", \"X\"", "bbox": {"l": 340.09241, "t": 272.80841, "r": 426.59875, "b": 279.02288999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 185.67178, "t": 244.04224, "r": 189.35544, "b": 250.25671, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "1", "bbox": {"l": 185.67178, "t": 244.04224, "r": 189.35544, "b": 250.25671, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 185.96759, "t": 268.34766, "r": 189.65125, "b": 274.56213, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "2", "bbox": {"l": 185.96759, "t": 268.34766, "r": 189.65125, "b": 274.56213, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 239.34152, "t": 243.62523999999996, "r": 243.02518, "b": 249.83972000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "3", "bbox": {"l": 239.34152, "t": 243.62523999999996, "r": 243.02518, "b": 249.83972000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 271.32852, "t": 243.49390000000005, "r": 275.01218, "b": 249.70836999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "4", "bbox": {"l": 271.32852, "t": 243.49390000000005, "r": 275.01218, "b": 249.70836999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 229.81627, "t": 166.51495, "r": 233.49992000000003, "b": 172.72942999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "2", "bbox": {"l": 229.81627, "t": 166.51495, "r": 233.49992000000003, "b": 172.72942999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 257.24402, "t": 189.961, "r": 260.92767, "b": 196.17548, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "1", "bbox": {"l": 257.24402, "t": 189.961, "r": 260.92767, "b": 196.17548, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 186.87526, "t": 177.97668, "r": 190.55891, "b": 184.19115999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "3", "bbox": {"l": 186.87526, "t": 177.97668, "r": 190.55891, "b": 184.19115999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 196.48746, "t": 169.01520000000005, "r": 200.17111, "b": 175.22968000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "4", "bbox": {"l": 196.48746, "t": 169.01520000000005, "r": 200.17111, "b": 175.22968000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 169.74728, "t": 167.88225999999997, "r": 175.72659, "b": 175.65039000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "A", "bbox": {"l": 169.74728, "t": 167.88225999999997, "r": 175.72659, "b": 175.65039000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 169.74728, "t": 206.83867999999995, "r": 175.72659, "b": 214.60681, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "B", "bbox": {"l": 169.74728, "t": 206.83867999999995, "r": 175.72659, "b": 214.60681, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 274.29419, "t": 168.27972, "r": 280.2735, "b": 176.04785000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "C", "bbox": {"l": 274.29419, "t": 168.27972, "r": 280.2735, "b": 176.04785000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 359.56152, "t": 168.27972, "r": 365.54083, "b": 176.04785000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "D", "bbox": {"l": 359.56152, "t": 168.27972, "r": 365.54083, "b": 176.04785000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 169.74728, "t": 243.21149000000003, "r": 175.27112, "b": 250.97960999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "E", "bbox": {"l": 169.74728, "t": 243.21149000000003, "r": 175.27112, "b": 250.97960999999998, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 9, "label": "section_header", "bbox": {"l": 134.765, "t": 305.29581, "r": 246.65197999999998, "b": 314.10275, "coord_origin": "TOPLEFT"}, "confidence": 0.9233023524284363, "cells": [{"id": 75, "text": "4.2", "bbox": {"l": 134.765, "t": 305.29581, "r": 149.40205, "b": 314.10275, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "Language Syntax", "bbox": {"l": 160.85904, "t": 305.29581, "r": 246.65197999999998, "b": 314.10275, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "text", "bbox": {"l": 134.765, "t": 325.24777, "r": 363.79617, "b": 334.04474, "coord_origin": "TOPLEFT"}, "confidence": 0.9169168472290039, "cells": [{"id": 77, "text": "The OTSL representation follows these syntax rules:", "bbox": {"l": 134.765, "t": 325.24777, "r": 363.79617, "b": 334.04474, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "list_item", "bbox": {"l": 138.97299, "t": 347.17081, "r": 480.58902, "b": 367.93375, "coord_origin": "TOPLEFT"}, "confidence": 0.9588112235069275, "cells": [{"id": 78, "text": "1.", "bbox": {"l": 138.97299, "t": 347.18079, "r": 146.71991, "b": 355.97775, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "Left-looking cell rule", "bbox": {"l": 151.70099, "t": 347.17081, "r": 257.37927, "b": 355.97775, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": ": The left neighbour of an \"L\" cell must be either", "bbox": {"l": 257.383, "t": 347.18079, "r": 480.58902, "b": 355.97775, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "another \"L\" cell or a \"C\" cell.", "bbox": {"l": 151.70099, "t": 359.13678, "r": 283.59387, "b": 367.93375, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "list_item", "bbox": {"l": 138.97299, "t": 371.08481, "r": 480.59229000000005, "b": 391.84673999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9585386514663696, "cells": [{"id": 82, "text": "2.", "bbox": {"l": 138.97299, "t": 371.09479, "r": 146.71991, "b": 379.89175, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "Up-looking cell rule", "bbox": {"l": 151.70099, "t": 371.08481, "r": 252.11203, "b": 379.89175, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": ": The upper neighbour of a \"U\" cell must be either", "bbox": {"l": 252.112, "t": 371.09479, "r": 480.59229000000005, "b": 379.89175, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "another \"U\" cell or a \"C\" cell.", "bbox": {"l": 151.70099, "t": 383.04977, "r": 284.8392, "b": 391.84673999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "section_header", "bbox": {"l": 138.97299, "t": 394.99780000000004, "r": 226.07360999999997, "b": 403.80475, "coord_origin": "TOPLEFT"}, "confidence": 0.6506174206733704, "cells": [{"id": 86, "text": "3.", "bbox": {"l": 138.97299, "t": 395.0077800000001, "r": 146.71991, "b": 403.80475, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Cross cell rule", "bbox": {"l": 151.70099, "t": 394.99780000000004, "r": 223.3042, "b": 403.80475, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": ":", "bbox": {"l": 223.30699, "t": 395.0077800000001, "r": 226.07360999999997, "b": 403.80475, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "list_item", "bbox": {"l": 151.70099, "t": 406.96677, "r": 480.59238, "b": 439.67371, "coord_origin": "TOPLEFT"}, "confidence": 0.7247239947319031, "cells": [{"id": 89, "text": "The left neighbour of an \"X\" cell must be either another \"X\" cell or a \"U\"", "bbox": {"l": 151.70099, "t": 406.96677, "r": 480.59238, "b": 415.76373, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "cell, and the upper neighbour of an \"X\" cell must be either another \"X\" cell", "bbox": {"l": 151.70099, "t": 418.9217499999999, "r": 480.59219, "b": 427.71871999999996, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "or an \"L\" cell.", "bbox": {"l": 151.70099, "t": 430.87674, "r": 214.39663999999996, "b": 439.67371, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "list_item", "bbox": {"l": 138.97299, "t": 442.82574, "r": 474.59018, "b": 451.63269, "coord_origin": "TOPLEFT"}, "confidence": 0.9259927272796631, "cells": [{"id": 92, "text": "4.", "bbox": {"l": 138.97299, "t": 442.83572, "r": 146.71991, "b": 451.63269, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "First row rule", "bbox": {"l": 151.70099, "t": 442.82574, "r": 221.32263, "b": 451.63269, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": ": Only \"L\" cells and \"C\" cells are allowed in the first row.", "bbox": {"l": 221.32700000000003, "t": 442.83572, "r": 474.59018, "b": 451.63269, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "list_item", "bbox": {"l": 138.97299, "t": 454.78375, "r": 480.58746, "b": 475.54568, "coord_origin": "TOPLEFT"}, "confidence": 0.9420599937438965, "cells": [{"id": 95, "text": "5.", "bbox": {"l": 138.97299, "t": 454.7937299999999, "r": 146.71991, "b": 463.5907, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "First column rule", "bbox": {"l": 151.70099, "t": 454.78375, "r": 240.71982, "b": 463.5907, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": ": Only \"U\" cells and \"C\" cells are allowed in the first", "bbox": {"l": 240.71599, "t": 454.7937299999999, "r": 480.58746, "b": 463.5907, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "column.", "bbox": {"l": 151.70099, "t": 466.74872, "r": 186.0072, "b": 475.54568, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "list_item", "bbox": {"l": 138.97299, "t": 478.69675, "r": 480.59457, "b": 499.45969, "coord_origin": "TOPLEFT"}, "confidence": 0.9617829918861389, "cells": [{"id": 99, "text": "6.", "bbox": {"l": 138.97299, "t": 478.70673, "r": 146.71991, "b": 487.50369, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "Rectangular rule", "bbox": {"l": 151.70099, "t": 478.69675, "r": 235.15768, "b": 487.50369, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": ": The table representation is always rectangular - all rows", "bbox": {"l": 235.15697999999998, "t": 478.70673, "r": 480.59457, "b": 487.50369, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "must have an equal number of tokens, terminated with \"NL\" token.", "bbox": {"l": 151.70099, "t": 490.66272, "r": 448.04147, "b": 499.45969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 134.76498, "t": 512.59271, "r": 480.59583, "b": 640.9416699999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9785562753677368, "cells": [{"id": 103, "text": "The application of these rules gives OTSL a set of unique properties. First", "bbox": {"l": 149.70898, "t": 512.59271, "r": 480.59583, "b": 521.38968, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "of all, the OTSL enforces a strictly rectangular structure representation, where", "bbox": {"l": 134.76498, "t": 524.5477000000001, "r": 480.59079, "b": 533.34467, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "every new-line token starts a new row. As a consequence, all rows and all columns", "bbox": {"l": 134.76498, "t": 536.5027, "r": 480.59482, "b": 545.29967, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "have exactly the same number of tokens, irrespective of cell spans. Secondly, the", "bbox": {"l": 134.76498, "t": 548.4586899999999, "r": 480.58865000000003, "b": 557.25566, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "OTSL representation is unambiguous: Every table structure is represented in one", "bbox": {"l": 134.76498, "t": 560.4137000000001, "r": 480.59365999999994, "b": 569.21066, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "way. In this representation every table cell corresponds to a \"C\"-cell token, which", "bbox": {"l": 134.76498, "t": 572.3687, "r": 480.58673, "b": 581.16566, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "in case of spans is always located in the top-left corner of the table cell definition.", "bbox": {"l": 134.76498, "t": 584.3237, "r": 480.59171, "b": 593.12067, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "Third, OTSL syntax rules are only backward-looking. As a consequence, every", "bbox": {"l": 134.76498, "t": 596.2787, "r": 480.59180000000003, "b": 605.07567, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "predicted token can be validated straight during sequence generation by looking", "bbox": {"l": 134.76498, "t": 608.2347, "r": 480.5936899999999, "b": 617.03166, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "at the previously predicted sequence. As such, OTSL can guarantee that every", "bbox": {"l": 134.76498, "t": 620.1897, "r": 480.59072999999995, "b": 628.98666, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "predicted sequence is syntactically valid.", "bbox": {"l": 134.76498, "t": 632.1447000000001, "r": 311.19769, "b": 640.9416699999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 134.76498, "t": 644.1026899999999, "r": 480.59265, "b": 664.8546699999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9590610861778259, "cells": [{"id": 114, "text": "These characteristics can be easily learned by sequence generator networks,", "bbox": {"l": 149.70898, "t": 644.1026899999999, "r": 480.59186, "b": 652.89966, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "as we demonstrate further below. We find strong indications that this pattern", "bbox": {"l": 134.76498, "t": 656.05769, "r": 480.59265, "b": 664.8546699999999, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_header", "id": 7, "page_no": 6, "cluster": {"id": 7, "label": "page_header", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.932651162147522, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Optimized Table Tokenization for Table Structure Recognition"}, {"label": "page_header", "id": 11, "page_no": 6, "cluster": {"id": 11, "label": "page_header", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8749732375144958, "cells": [{"id": 1, "text": "7", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "7"}, {"label": "caption", "id": 6, "page_no": 6, "cluster": {"id": 6, "label": "caption", "bbox": {"l": 134.765, "t": 125.79918999999984, "r": 480.5874, "b": 155.84966999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9333080053329468, "cells": [{"id": 2, "text": "Fig. 3.", "bbox": {"l": 134.765, "t": 125.79918999999984, "r": 162.64424, "b": 133.72551999999996, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "OTSL description of table structure: A - table example; B - graphical repre-", "bbox": {"l": 166.276, "t": 125.86200000000008, "r": 480.58675999999997, "b": 133.93169999999998, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "sentation of table structure; C - mapping structure on a grid; D - OTSL structure", "bbox": {"l": 134.765, "t": 136.82097999999996, "r": 480.5874, "b": 144.89068999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "encoding; E - explanation on cell encoding", "bbox": {"l": 134.765, "t": 147.77997000000005, "r": 306.1156, "b": 155.84966999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Fig. 3. OTSL description of table structure: A - table example; B - graphical representation of table structure; C - mapping structure on a grid; D - OTSL structure encoding; E - explanation on cell encoding"}, {"label": "picture", "id": 12, "page_no": 6, "cluster": {"id": 12, "label": "picture", "bbox": {"l": 164.65028381347656, "t": 163.79708862304688, "r": 449.5505676269531, "b": 280.3409423828125, "coord_origin": "TOPLEFT"}, "confidence": 0.7868534922599792, "cells": [{"id": 6, "text": "C", "bbox": {"l": 374.49326, "t": 168.59362999999996, "r": 381.66843, "b": 177.91540999999995, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "C", "bbox": {"l": 398.74011, "t": 168.50005999999996, "r": 405.91528, "b": 177.82183999999995, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "C", "bbox": {"l": 373.76862, "t": 192.92553999999996, "r": 380.94379, "b": 202.24730999999997, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "C", "bbox": {"l": 386.66388, "t": 193.07061999999996, "r": 393.83905, "b": 202.39239999999995, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "C", "bbox": {"l": 386.68707, "t": 205.13756999999998, "r": 393.86224, "b": 214.45934999999997, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "C", "bbox": {"l": 398.65729, "t": 180.73279000000002, "r": 405.83246, "b": 190.05457, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "C", "bbox": {"l": 410.77908, "t": 180.73859000000004, "r": 417.95425, "b": 190.06035999999995, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "C", "bbox": {"l": 422.90503, "t": 180.65247, "r": 430.08020000000005, "b": 189.97424, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "C", "bbox": {"l": 398.7807, "t": 192.98865, "r": 405.95587, "b": 202.31042000000002, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "C", "bbox": {"l": 410.90164, "t": 192.99487, "r": 418.07681, "b": 202.31664999999998, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "C", "bbox": {"l": 423.02753, "t": 192.909, "r": 430.2027, "b": 202.23077, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "C", "bbox": {"l": 398.78235, "t": 205.31573000000003, "r": 405.95752, "b": 214.63751000000002, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "C", "bbox": {"l": 410.90414, "t": 205.32196, "r": 418.07932, "b": 214.64373999999998, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "C", "bbox": {"l": 423.03003, "t": 205.23614999999995, "r": 430.20520000000005, "b": 214.55791999999997, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "C", "bbox": {"l": 386.50574, "t": 217.03882, "r": 393.68091, "b": 226.36059999999998, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "C", "bbox": {"l": 398.60181, "t": 217.21704, "r": 405.77698, "b": 226.53882, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "C", "bbox": {"l": 410.72275, "t": 217.22321, "r": 417.89792, "b": 226.54498, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "C", "bbox": {"l": 422.84869, "t": 217.13738999999998, "r": 430.02386, "b": 226.45916999999997, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "NL", "bbox": {"l": 435.16009999999994, "t": 167.69011999999998, "r": 447.86273, "b": 177.01189999999997, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "NL", "bbox": {"l": 435.44415, "t": 180.20025999999996, "r": 448.14679, "b": 189.52202999999997, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "NL", "bbox": {"l": 435.46735, "t": 192.49474999999995, "r": 448.16998000000007, "b": 201.81652999999994, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "NL", "bbox": {"l": 435.38202, "t": 204.83025999999995, "r": 448.08466, "b": 214.15204000000006, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "NL", "bbox": {"l": 435.59906, "t": 217.2337, "r": 448.3017, "b": 226.55548, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "U", "bbox": {"l": 374.14957, "t": 205.23492, "r": 381.32474, "b": 214.55669999999998, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "U", "bbox": {"l": 374.0419, "t": 217.14648, "r": 381.21707, "b": 226.46826, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "U", "bbox": {"l": 374.34418, "t": 180.93488000000002, "r": 381.51935, "b": 190.25665000000004, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "L", "bbox": {"l": 387.76285, "t": 168.57788000000005, "r": 393.28833, "b": 177.89966000000004, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "L", "bbox": {"l": 411.86395, "t": 168.06195000000002, "r": 417.38943, "b": 177.38373, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "L", "bbox": {"l": 423.33563, "t": 167.93439, "r": 428.86111, "b": 177.25616000000002, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "X", "bbox": {"l": 387.13593, "t": 180.78576999999996, "r": 393.76453, "b": 190.10753999999997, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "C", "bbox": {"l": 282.2594, "t": 244.50878999999998, "r": 289.43457, "b": 253.83056999999997, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "U", "bbox": {"l": 282.11035, "t": 256.85022000000004, "r": 289.28552, "b": 266.172, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "U", "bbox": {"l": 282.40848, "t": 269.13300000000004, "r": 289.58365, "b": 278.45477000000005, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "L", "bbox": {"l": 295.52902, "t": 244.49347, "r": 301.0545, "b": 253.81525, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "L", "bbox": {"l": 307.46613, "t": 244.57372999999995, "r": 312.99161, "b": 253.89550999999994, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "L", "bbox": {"l": 318.76886, "t": 244.44037000000003, "r": 324.29434, "b": 253.76215000000002, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "X", "bbox": {"l": 294.9021, "t": 256.70154, "r": 301.03976, "b": 266.02332, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "X X", "bbox": {"l": 307.17743, "t": 256.70154, "r": 325.59039, "b": 266.02332, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "X", "bbox": {"l": 294.78949, "t": 269.25420999999994, "r": 300.92715, "b": 278.57599000000005, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "X X", "bbox": {"l": 307.06482, "t": 269.25420999999994, "r": 325.47778, "b": 278.57599000000005, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "C", "bbox": {"l": 195.93939, "t": 268.74798999999996, "r": 203.11456, "b": 278.06976, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "L", "bbox": {"l": 209.20891, "t": 268.73267, "r": 214.73439, "b": 278.05444, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "L", "bbox": {"l": 221.14551, "t": 268.81293000000005, "r": 226.67099, "b": 278.13469999999995, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "L", "bbox": {"l": 232.44858, "t": 268.67957, "r": 237.97405999999998, "b": 278.00134, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "C", "bbox": {"l": 196.21715, "t": 244.53961000000004, "r": 203.39232, "b": 253.86139000000003, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "C", "bbox": {"l": 250.32143, "t": 244.09813999999994, "r": 257.49661, "b": 253.41992000000005, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "U", "bbox": {"l": 250.17235999999997, "t": 256.43951000000004, "r": 257.34753, "b": 265.76129000000003, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "U", "bbox": {"l": 250.47049000000004, "t": 268.72222999999997, "r": 257.64566, "b": 278.04400999999996, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "1", "bbox": {"l": 334.51135, "t": 242.99463000000003, "r": 337.22485, "b": 249.20911, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "- simple cells: \"C\"", "bbox": {"l": 339.93835, "t": 242.99463000000003, "r": 391.49472, "b": 249.20911, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "2", "bbox": {"l": 334.51135, "t": 252.93255999999997, "r": 337.33313, "b": 259.14703, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "- horizontal merges: \"C\", \"L\"", "bbox": {"l": 340.15491, "t": 252.93255999999997, "r": 421.98624, "b": 259.14703, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "3", "bbox": {"l": 334.51135, "t": 262.87048000000004, "r": 337.29868, "b": 269.08496, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "- vertical merges: \"C\", \"U\"", "bbox": {"l": 340.086, "t": 262.87048000000004, "r": 415.34375, "b": 269.08496, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "4", "bbox": {"l": 334.51135, "t": 272.80841, "r": 337.30188, "b": 279.02288999999996, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "- 2d merges: \"C\", \"L\", \"U\", \"X\"", "bbox": {"l": 340.09241, "t": 272.80841, "r": 426.59875, "b": 279.02288999999996, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "1", "bbox": {"l": 185.67178, "t": 244.04224, "r": 189.35544, "b": 250.25671, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "2", "bbox": {"l": 185.96759, "t": 268.34766, "r": 189.65125, "b": 274.56213, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "3", "bbox": {"l": 239.34152, "t": 243.62523999999996, "r": 243.02518, "b": 249.83972000000006, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "4", "bbox": {"l": 271.32852, "t": 243.49390000000005, "r": 275.01218, "b": 249.70836999999995, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "2", "bbox": {"l": 229.81627, "t": 166.51495, "r": 233.49992000000003, "b": 172.72942999999998, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "1", "bbox": {"l": 257.24402, "t": 189.961, "r": 260.92767, "b": 196.17548, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "3", "bbox": {"l": 186.87526, "t": 177.97668, "r": 190.55891, "b": 184.19115999999997, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "4", "bbox": {"l": 196.48746, "t": 169.01520000000005, "r": 200.17111, "b": 175.22968000000003, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "A", "bbox": {"l": 169.74728, "t": 167.88225999999997, "r": 175.72659, "b": 175.65039000000002, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "B", "bbox": {"l": 169.74728, "t": 206.83867999999995, "r": 175.72659, "b": 214.60681, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "C", "bbox": {"l": 274.29419, "t": 168.27972, "r": 280.2735, "b": 176.04785000000004, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "D", "bbox": {"l": 359.56152, "t": 168.27972, "r": 365.54083, "b": 176.04785000000004, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "E", "bbox": {"l": 169.74728, "t": 243.21149000000003, "r": 175.27112, "b": 250.97960999999998, "coord_origin": "TOPLEFT"}}], "children": [{"id": 19, "label": "text", "bbox": {"l": 374.49326, "t": 168.59362999999996, "r": 381.66843, "b": 177.91540999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": "C", "bbox": {"l": 374.49326, "t": 168.59362999999996, "r": 381.66843, "b": 177.91540999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 398.74011, "t": 168.50005999999996, "r": 405.91528, "b": 177.82183999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "C", "bbox": {"l": 398.74011, "t": 168.50005999999996, "r": 405.91528, "b": 177.82183999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 373.76862, "t": 192.92553999999996, "r": 380.94379, "b": 202.24730999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "C", "bbox": {"l": 373.76862, "t": 192.92553999999996, "r": 380.94379, "b": 202.24730999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 386.66388, "t": 193.07061999999996, "r": 393.83905, "b": 202.39239999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "C", "bbox": {"l": 386.66388, "t": 193.07061999999996, "r": 393.83905, "b": 202.39239999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 386.68707, "t": 205.13756999999998, "r": 393.86224, "b": 214.45934999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "C", "bbox": {"l": 386.68707, "t": 205.13756999999998, "r": 393.86224, "b": 214.45934999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 398.65729, "t": 180.73279000000002, "r": 405.83246, "b": 190.05457, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "C", "bbox": {"l": 398.65729, "t": 180.73279000000002, "r": 405.83246, "b": 190.05457, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 410.77908, "t": 180.73859000000004, "r": 417.95425, "b": 190.06035999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "C", "bbox": {"l": 410.77908, "t": 180.73859000000004, "r": 417.95425, "b": 190.06035999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 422.90503, "t": 180.65247, "r": 430.08020000000005, "b": 189.97424, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "C", "bbox": {"l": 422.90503, "t": 180.65247, "r": 430.08020000000005, "b": 189.97424, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 398.7807, "t": 192.98865, "r": 405.95587, "b": 202.31042000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "C", "bbox": {"l": 398.7807, "t": 192.98865, "r": 405.95587, "b": 202.31042000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 410.90164, "t": 192.99487, "r": 418.07681, "b": 202.31664999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "C", "bbox": {"l": 410.90164, "t": 192.99487, "r": 418.07681, "b": 202.31664999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 423.02753, "t": 192.909, "r": 430.2027, "b": 202.23077, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "C", "bbox": {"l": 423.02753, "t": 192.909, "r": 430.2027, "b": 202.23077, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 398.78235, "t": 205.31573000000003, "r": 405.95752, "b": 214.63751000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "C", "bbox": {"l": 398.78235, "t": 205.31573000000003, "r": 405.95752, "b": 214.63751000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 410.90414, "t": 205.32196, "r": 418.07932, "b": 214.64373999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "C", "bbox": {"l": 410.90414, "t": 205.32196, "r": 418.07932, "b": 214.64373999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 423.03003, "t": 205.23614999999995, "r": 430.20520000000005, "b": 214.55791999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "C", "bbox": {"l": 423.03003, "t": 205.23614999999995, "r": 430.20520000000005, "b": 214.55791999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 386.50574, "t": 217.03882, "r": 393.68091, "b": 226.36059999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "C", "bbox": {"l": 386.50574, "t": 217.03882, "r": 393.68091, "b": 226.36059999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 398.60181, "t": 217.21704, "r": 405.77698, "b": 226.53882, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "C", "bbox": {"l": 398.60181, "t": 217.21704, "r": 405.77698, "b": 226.53882, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 410.72275, "t": 217.22321, "r": 417.89792, "b": 226.54498, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "C", "bbox": {"l": 410.72275, "t": 217.22321, "r": 417.89792, "b": 226.54498, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 422.84869, "t": 217.13738999999998, "r": 430.02386, "b": 226.45916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "C", "bbox": {"l": 422.84869, "t": 217.13738999999998, "r": 430.02386, "b": 226.45916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 435.16009999999994, "t": 167.69011999999998, "r": 447.86273, "b": 177.01189999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "NL", "bbox": {"l": 435.16009999999994, "t": 167.69011999999998, "r": 447.86273, "b": 177.01189999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 435.44415, "t": 180.20025999999996, "r": 448.14679, "b": 189.52202999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "NL", "bbox": {"l": 435.44415, "t": 180.20025999999996, "r": 448.14679, "b": 189.52202999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 435.46735, "t": 192.49474999999995, "r": 448.16998000000007, "b": 201.81652999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "NL", "bbox": {"l": 435.46735, "t": 192.49474999999995, "r": 448.16998000000007, "b": 201.81652999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 435.38202, "t": 204.83025999999995, "r": 448.08466, "b": 214.15204000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "NL", "bbox": {"l": 435.38202, "t": 204.83025999999995, "r": 448.08466, "b": 214.15204000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 435.59906, "t": 217.2337, "r": 448.3017, "b": 226.55548, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "NL", "bbox": {"l": 435.59906, "t": 217.2337, "r": 448.3017, "b": 226.55548, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 374.14957, "t": 205.23492, "r": 381.32474, "b": 214.55669999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "U", "bbox": {"l": 374.14957, "t": 205.23492, "r": 381.32474, "b": 214.55669999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 374.0419, "t": 217.14648, "r": 381.21707, "b": 226.46826, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "U", "bbox": {"l": 374.0419, "t": 217.14648, "r": 381.21707, "b": 226.46826, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 374.34418, "t": 180.93488000000002, "r": 381.51935, "b": 190.25665000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "U", "bbox": {"l": 374.34418, "t": 180.93488000000002, "r": 381.51935, "b": 190.25665000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 387.76285, "t": 168.57788000000005, "r": 393.28833, "b": 177.89966000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "L", "bbox": {"l": 387.76285, "t": 168.57788000000005, "r": 393.28833, "b": 177.89966000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 411.86395, "t": 168.06195000000002, "r": 417.38943, "b": 177.38373, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "L", "bbox": {"l": 411.86395, "t": 168.06195000000002, "r": 417.38943, "b": 177.38373, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 423.33563, "t": 167.93439, "r": 428.86111, "b": 177.25616000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "L", "bbox": {"l": 423.33563, "t": 167.93439, "r": 428.86111, "b": 177.25616000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 387.13593, "t": 180.78576999999996, "r": 393.76453, "b": 190.10753999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "X", "bbox": {"l": 387.13593, "t": 180.78576999999996, "r": 393.76453, "b": 190.10753999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 282.2594, "t": 244.50878999999998, "r": 289.43457, "b": 253.83056999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "C", "bbox": {"l": 282.2594, "t": 244.50878999999998, "r": 289.43457, "b": 253.83056999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 282.11035, "t": 256.85022000000004, "r": 289.28552, "b": 266.172, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "U", "bbox": {"l": 282.11035, "t": 256.85022000000004, "r": 289.28552, "b": 266.172, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 282.40848, "t": 269.13300000000004, "r": 289.58365, "b": 278.45477000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "U", "bbox": {"l": 282.40848, "t": 269.13300000000004, "r": 289.58365, "b": 278.45477000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 295.52902, "t": 244.49347, "r": 301.0545, "b": 253.81525, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "L", "bbox": {"l": 295.52902, "t": 244.49347, "r": 301.0545, "b": 253.81525, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 307.46613, "t": 244.57372999999995, "r": 312.99161, "b": 253.89550999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "L", "bbox": {"l": 307.46613, "t": 244.57372999999995, "r": 312.99161, "b": 253.89550999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 318.76886, "t": 244.44037000000003, "r": 324.29434, "b": 253.76215000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "L", "bbox": {"l": 318.76886, "t": 244.44037000000003, "r": 324.29434, "b": 253.76215000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 294.9021, "t": 256.70154, "r": 301.03976, "b": 266.02332, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "X", "bbox": {"l": 294.9021, "t": 256.70154, "r": 301.03976, "b": 266.02332, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 307.17743, "t": 256.70154, "r": 325.59039, "b": 266.02332, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "X X", "bbox": {"l": 307.17743, "t": 256.70154, "r": 325.59039, "b": 266.02332, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 294.78949, "t": 269.25420999999994, "r": 300.92715, "b": 278.57599000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "X", "bbox": {"l": 294.78949, "t": 269.25420999999994, "r": 300.92715, "b": 278.57599000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 307.06482, "t": 269.25420999999994, "r": 325.47778, "b": 278.57599000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "X X", "bbox": {"l": 307.06482, "t": 269.25420999999994, "r": 325.47778, "b": 278.57599000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 195.93939, "t": 268.74798999999996, "r": 203.11456, "b": 278.06976, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "C", "bbox": {"l": 195.93939, "t": 268.74798999999996, "r": 203.11456, "b": 278.06976, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 209.20891, "t": 268.73267, "r": 214.73439, "b": 278.05444, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "L", "bbox": {"l": 209.20891, "t": 268.73267, "r": 214.73439, "b": 278.05444, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 221.14551, "t": 268.81293000000005, "r": 226.67099, "b": 278.13469999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "L", "bbox": {"l": 221.14551, "t": 268.81293000000005, "r": 226.67099, "b": 278.13469999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 232.44858, "t": 268.67957, "r": 237.97405999999998, "b": 278.00134, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "L", "bbox": {"l": 232.44858, "t": 268.67957, "r": 237.97405999999998, "b": 278.00134, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 196.21715, "t": 244.53961000000004, "r": 203.39232, "b": 253.86139000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "C", "bbox": {"l": 196.21715, "t": 244.53961000000004, "r": 203.39232, "b": 253.86139000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 250.32143, "t": 244.09813999999994, "r": 257.49661, "b": 253.41992000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "C", "bbox": {"l": 250.32143, "t": 244.09813999999994, "r": 257.49661, "b": 253.41992000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 250.17235999999997, "t": 256.43951000000004, "r": 257.34753, "b": 265.76129000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "U", "bbox": {"l": 250.17235999999997, "t": 256.43951000000004, "r": 257.34753, "b": 265.76129000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 250.47049000000004, "t": 268.72222999999997, "r": 257.64566, "b": 278.04400999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "U", "bbox": {"l": 250.47049000000004, "t": 268.72222999999997, "r": 257.64566, "b": 278.04400999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 334.51135, "t": 242.99463000000003, "r": 337.22485, "b": 249.20911, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "1", "bbox": {"l": 334.51135, "t": 242.99463000000003, "r": 337.22485, "b": 249.20911, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 339.93835, "t": 242.99463000000003, "r": 391.49472, "b": 249.20911, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "- simple cells: \"C\"", "bbox": {"l": 339.93835, "t": 242.99463000000003, "r": 391.49472, "b": 249.20911, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 334.51135, "t": 252.93255999999997, "r": 337.33313, "b": 259.14703, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "2", "bbox": {"l": 334.51135, "t": 252.93255999999997, "r": 337.33313, "b": 259.14703, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 340.15491, "t": 252.93255999999997, "r": 421.98624, "b": 259.14703, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "- horizontal merges: \"C\", \"L\"", "bbox": {"l": 340.15491, "t": 252.93255999999997, "r": 421.98624, "b": 259.14703, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 334.51135, "t": 262.87048000000004, "r": 337.29868, "b": 269.08496, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "3", "bbox": {"l": 334.51135, "t": 262.87048000000004, "r": 337.29868, "b": 269.08496, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 340.086, "t": 262.87048000000004, "r": 415.34375, "b": 269.08496, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "- vertical merges: \"C\", \"U\"", "bbox": {"l": 340.086, "t": 262.87048000000004, "r": 415.34375, "b": 269.08496, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "list_item", "bbox": {"l": 334.51135, "t": 272.80841, "r": 426.59875, "b": 279.02288999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.5250625610351562, "cells": [{"id": 60, "text": "4", "bbox": {"l": 334.51135, "t": 272.80841, "r": 337.30188, "b": 279.02288999999996, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "- 2d merges: \"C\", \"L\", \"U\", \"X\"", "bbox": {"l": 340.09241, "t": 272.80841, "r": 426.59875, "b": 279.02288999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 185.67178, "t": 244.04224, "r": 189.35544, "b": 250.25671, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "1", "bbox": {"l": 185.67178, "t": 244.04224, "r": 189.35544, "b": 250.25671, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 185.96759, "t": 268.34766, "r": 189.65125, "b": 274.56213, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "2", "bbox": {"l": 185.96759, "t": 268.34766, "r": 189.65125, "b": 274.56213, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 239.34152, "t": 243.62523999999996, "r": 243.02518, "b": 249.83972000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "3", "bbox": {"l": 239.34152, "t": 243.62523999999996, "r": 243.02518, "b": 249.83972000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 271.32852, "t": 243.49390000000005, "r": 275.01218, "b": 249.70836999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "4", "bbox": {"l": 271.32852, "t": 243.49390000000005, "r": 275.01218, "b": 249.70836999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 229.81627, "t": 166.51495, "r": 233.49992000000003, "b": 172.72942999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "2", "bbox": {"l": 229.81627, "t": 166.51495, "r": 233.49992000000003, "b": 172.72942999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 257.24402, "t": 189.961, "r": 260.92767, "b": 196.17548, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "1", "bbox": {"l": 257.24402, "t": 189.961, "r": 260.92767, "b": 196.17548, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 186.87526, "t": 177.97668, "r": 190.55891, "b": 184.19115999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "3", "bbox": {"l": 186.87526, "t": 177.97668, "r": 190.55891, "b": 184.19115999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 196.48746, "t": 169.01520000000005, "r": 200.17111, "b": 175.22968000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "4", "bbox": {"l": 196.48746, "t": 169.01520000000005, "r": 200.17111, "b": 175.22968000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 169.74728, "t": 167.88225999999997, "r": 175.72659, "b": 175.65039000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "A", "bbox": {"l": 169.74728, "t": 167.88225999999997, "r": 175.72659, "b": 175.65039000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 169.74728, "t": 206.83867999999995, "r": 175.72659, "b": 214.60681, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "B", "bbox": {"l": 169.74728, "t": 206.83867999999995, "r": 175.72659, "b": 214.60681, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 274.29419, "t": 168.27972, "r": 280.2735, "b": 176.04785000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "C", "bbox": {"l": 274.29419, "t": 168.27972, "r": 280.2735, "b": 176.04785000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 359.56152, "t": 168.27972, "r": 365.54083, "b": 176.04785000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "D", "bbox": {"l": 359.56152, "t": 168.27972, "r": 365.54083, "b": 176.04785000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 169.74728, "t": 243.21149000000003, "r": 175.27112, "b": 250.97960999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "E", "bbox": {"l": 169.74728, "t": 243.21149000000003, "r": 175.27112, "b": 250.97960999999998, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "section_header", "id": 9, "page_no": 6, "cluster": {"id": 9, "label": "section_header", "bbox": {"l": 134.765, "t": 305.29581, "r": 246.65197999999998, "b": 314.10275, "coord_origin": "TOPLEFT"}, "confidence": 0.9233023524284363, "cells": [{"id": 75, "text": "4.2", "bbox": {"l": 134.765, "t": 305.29581, "r": 149.40205, "b": 314.10275, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "Language Syntax", "bbox": {"l": 160.85904, "t": 305.29581, "r": 246.65197999999998, "b": 314.10275, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4.2 Language Syntax"}, {"label": "text", "id": 10, "page_no": 6, "cluster": {"id": 10, "label": "text", "bbox": {"l": 134.765, "t": 325.24777, "r": 363.79617, "b": 334.04474, "coord_origin": "TOPLEFT"}, "confidence": 0.9169168472290039, "cells": [{"id": 77, "text": "The OTSL representation follows these syntax rules:", "bbox": {"l": 134.765, "t": 325.24777, "r": 363.79617, "b": 334.04474, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The OTSL representation follows these syntax rules:"}, {"label": "list_item", "id": 3, "page_no": 6, "cluster": {"id": 3, "label": "list_item", "bbox": {"l": 138.97299, "t": 347.17081, "r": 480.58902, "b": 367.93375, "coord_origin": "TOPLEFT"}, "confidence": 0.9588112235069275, "cells": [{"id": 78, "text": "1.", "bbox": {"l": 138.97299, "t": 347.18079, "r": 146.71991, "b": 355.97775, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "Left-looking cell rule", "bbox": {"l": 151.70099, "t": 347.17081, "r": 257.37927, "b": 355.97775, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": ": The left neighbour of an \"L\" cell must be either", "bbox": {"l": 257.383, "t": 347.18079, "r": 480.58902, "b": 355.97775, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "another \"L\" cell or a \"C\" cell.", "bbox": {"l": 151.70099, "t": 359.13678, "r": 283.59387, "b": 367.93375, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1. Left-looking cell rule : The left neighbour of an \"L\" cell must be either another \"L\" cell or a \"C\" cell."}, {"label": "list_item", "id": 4, "page_no": 6, "cluster": {"id": 4, "label": "list_item", "bbox": {"l": 138.97299, "t": 371.08481, "r": 480.59229000000005, "b": 391.84673999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9585386514663696, "cells": [{"id": 82, "text": "2.", "bbox": {"l": 138.97299, "t": 371.09479, "r": 146.71991, "b": 379.89175, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "Up-looking cell rule", "bbox": {"l": 151.70099, "t": 371.08481, "r": 252.11203, "b": 379.89175, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": ": The upper neighbour of a \"U\" cell must be either", "bbox": {"l": 252.112, "t": 371.09479, "r": 480.59229000000005, "b": 379.89175, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "another \"U\" cell or a \"C\" cell.", "bbox": {"l": 151.70099, "t": 383.04977, "r": 284.8392, "b": 391.84673999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2. Up-looking cell rule : The upper neighbour of a \"U\" cell must be either another \"U\" cell or a \"C\" cell."}, {"label": "section_header", "id": 14, "page_no": 6, "cluster": {"id": 14, "label": "section_header", "bbox": {"l": 138.97299, "t": 394.99780000000004, "r": 226.07360999999997, "b": 403.80475, "coord_origin": "TOPLEFT"}, "confidence": 0.6506174206733704, "cells": [{"id": 86, "text": "3.", "bbox": {"l": 138.97299, "t": 395.0077800000001, "r": 146.71991, "b": 403.80475, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Cross cell rule", "bbox": {"l": 151.70099, "t": 394.99780000000004, "r": 223.3042, "b": 403.80475, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": ":", "bbox": {"l": 223.30699, "t": 395.0077800000001, "r": 226.07360999999997, "b": 403.80475, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3. Cross cell rule :"}, {"label": "list_item", "id": 13, "page_no": 6, "cluster": {"id": 13, "label": "list_item", "bbox": {"l": 151.70099, "t": 406.96677, "r": 480.59238, "b": 439.67371, "coord_origin": "TOPLEFT"}, "confidence": 0.7247239947319031, "cells": [{"id": 89, "text": "The left neighbour of an \"X\" cell must be either another \"X\" cell or a \"U\"", "bbox": {"l": 151.70099, "t": 406.96677, "r": 480.59238, "b": 415.76373, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "cell, and the upper neighbour of an \"X\" cell must be either another \"X\" cell", "bbox": {"l": 151.70099, "t": 418.9217499999999, "r": 480.59219, "b": 427.71871999999996, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "or an \"L\" cell.", "bbox": {"l": 151.70099, "t": 430.87674, "r": 214.39663999999996, "b": 439.67371, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The left neighbour of an \"X\" cell must be either another \"X\" cell or a \"U\" cell, and the upper neighbour of an \"X\" cell must be either another \"X\" cell or an \"L\" cell."}, {"label": "list_item", "id": 8, "page_no": 6, "cluster": {"id": 8, "label": "list_item", "bbox": {"l": 138.97299, "t": 442.82574, "r": 474.59018, "b": 451.63269, "coord_origin": "TOPLEFT"}, "confidence": 0.9259927272796631, "cells": [{"id": 92, "text": "4.", "bbox": {"l": 138.97299, "t": 442.83572, "r": 146.71991, "b": 451.63269, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "First row rule", "bbox": {"l": 151.70099, "t": 442.82574, "r": 221.32263, "b": 451.63269, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": ": Only \"L\" cells and \"C\" cells are allowed in the first row.", "bbox": {"l": 221.32700000000003, "t": 442.83572, "r": 474.59018, "b": 451.63269, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4. First row rule : Only \"L\" cells and \"C\" cells are allowed in the first row."}, {"label": "list_item", "id": 5, "page_no": 6, "cluster": {"id": 5, "label": "list_item", "bbox": {"l": 138.97299, "t": 454.78375, "r": 480.58746, "b": 475.54568, "coord_origin": "TOPLEFT"}, "confidence": 0.9420599937438965, "cells": [{"id": 95, "text": "5.", "bbox": {"l": 138.97299, "t": 454.7937299999999, "r": 146.71991, "b": 463.5907, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "First column rule", "bbox": {"l": 151.70099, "t": 454.78375, "r": 240.71982, "b": 463.5907, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": ": Only \"U\" cells and \"C\" cells are allowed in the first", "bbox": {"l": 240.71599, "t": 454.7937299999999, "r": 480.58746, "b": 463.5907, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "column.", "bbox": {"l": 151.70099, "t": 466.74872, "r": 186.0072, "b": 475.54568, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5. First column rule : Only \"U\" cells and \"C\" cells are allowed in the first column."}, {"label": "list_item", "id": 1, "page_no": 6, "cluster": {"id": 1, "label": "list_item", "bbox": {"l": 138.97299, "t": 478.69675, "r": 480.59457, "b": 499.45969, "coord_origin": "TOPLEFT"}, "confidence": 0.9617829918861389, "cells": [{"id": 99, "text": "6.", "bbox": {"l": 138.97299, "t": 478.70673, "r": 146.71991, "b": 487.50369, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "Rectangular rule", "bbox": {"l": 151.70099, "t": 478.69675, "r": 235.15768, "b": 487.50369, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": ": The table representation is always rectangular - all rows", "bbox": {"l": 235.15697999999998, "t": 478.70673, "r": 480.59457, "b": 487.50369, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "must have an equal number of tokens, terminated with \"NL\" token.", "bbox": {"l": 151.70099, "t": 490.66272, "r": 448.04147, "b": 499.45969, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "6. Rectangular rule : The table representation is always rectangular - all rows must have an equal number of tokens, terminated with \"NL\" token."}, {"label": "text", "id": 0, "page_no": 6, "cluster": {"id": 0, "label": "text", "bbox": {"l": 134.76498, "t": 512.59271, "r": 480.59583, "b": 640.9416699999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9785562753677368, "cells": [{"id": 103, "text": "The application of these rules gives OTSL a set of unique properties. First", "bbox": {"l": 149.70898, "t": 512.59271, "r": 480.59583, "b": 521.38968, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "of all, the OTSL enforces a strictly rectangular structure representation, where", "bbox": {"l": 134.76498, "t": 524.5477000000001, "r": 480.59079, "b": 533.34467, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "every new-line token starts a new row. As a consequence, all rows and all columns", "bbox": {"l": 134.76498, "t": 536.5027, "r": 480.59482, "b": 545.29967, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "have exactly the same number of tokens, irrespective of cell spans. Secondly, the", "bbox": {"l": 134.76498, "t": 548.4586899999999, "r": 480.58865000000003, "b": 557.25566, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "OTSL representation is unambiguous: Every table structure is represented in one", "bbox": {"l": 134.76498, "t": 560.4137000000001, "r": 480.59365999999994, "b": 569.21066, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "way. In this representation every table cell corresponds to a \"C\"-cell token, which", "bbox": {"l": 134.76498, "t": 572.3687, "r": 480.58673, "b": 581.16566, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "in case of spans is always located in the top-left corner of the table cell definition.", "bbox": {"l": 134.76498, "t": 584.3237, "r": 480.59171, "b": 593.12067, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "Third, OTSL syntax rules are only backward-looking. As a consequence, every", "bbox": {"l": 134.76498, "t": 596.2787, "r": 480.59180000000003, "b": 605.07567, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "predicted token can be validated straight during sequence generation by looking", "bbox": {"l": 134.76498, "t": 608.2347, "r": 480.5936899999999, "b": 617.03166, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "at the previously predicted sequence. As such, OTSL can guarantee that every", "bbox": {"l": 134.76498, "t": 620.1897, "r": 480.59072999999995, "b": 628.98666, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "predicted sequence is syntactically valid.", "bbox": {"l": 134.76498, "t": 632.1447000000001, "r": 311.19769, "b": 640.9416699999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The application of these rules gives OTSL a set of unique properties. First of all, the OTSL enforces a strictly rectangular structure representation, where every new-line token starts a new row. As a consequence, all rows and all columns have exactly the same number of tokens, irrespective of cell spans. Secondly, the OTSL representation is unambiguous: Every table structure is represented in one way. In this representation every table cell corresponds to a \"C\"-cell token, which in case of spans is always located in the top-left corner of the table cell definition. Third, OTSL syntax rules are only backward-looking. As a consequence, every predicted token can be validated straight during sequence generation by looking at the previously predicted sequence. As such, OTSL can guarantee that every predicted sequence is syntactically valid."}, {"label": "text", "id": 2, "page_no": 6, "cluster": {"id": 2, "label": "text", "bbox": {"l": 134.76498, "t": 644.1026899999999, "r": 480.59265, "b": 664.8546699999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9590610861778259, "cells": [{"id": 114, "text": "These characteristics can be easily learned by sequence generator networks,", "bbox": {"l": 149.70898, "t": 644.1026899999999, "r": 480.59186, "b": 652.89966, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "as we demonstrate further below. We find strong indications that this pattern", "bbox": {"l": 134.76498, "t": 656.05769, "r": 480.59265, "b": 664.8546699999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "These characteristics can be easily learned by sequence generator networks, as we demonstrate further below. We find strong indications that this pattern"}], "body": [{"label": "caption", "id": 6, "page_no": 6, "cluster": {"id": 6, "label": "caption", "bbox": {"l": 134.765, "t": 125.79918999999984, "r": 480.5874, "b": 155.84966999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9333080053329468, "cells": [{"id": 2, "text": "Fig. 3.", "bbox": {"l": 134.765, "t": 125.79918999999984, "r": 162.64424, "b": 133.72551999999996, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "OTSL description of table structure: A - table example; B - graphical repre-", "bbox": {"l": 166.276, "t": 125.86200000000008, "r": 480.58675999999997, "b": 133.93169999999998, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "sentation of table structure; C - mapping structure on a grid; D - OTSL structure", "bbox": {"l": 134.765, "t": 136.82097999999996, "r": 480.5874, "b": 144.89068999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "encoding; E - explanation on cell encoding", "bbox": {"l": 134.765, "t": 147.77997000000005, "r": 306.1156, "b": 155.84966999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Fig. 3. OTSL description of table structure: A - table example; B - graphical representation of table structure; C - mapping structure on a grid; D - OTSL structure encoding; E - explanation on cell encoding"}, {"label": "picture", "id": 12, "page_no": 6, "cluster": {"id": 12, "label": "picture", "bbox": {"l": 164.65028381347656, "t": 163.79708862304688, "r": 449.5505676269531, "b": 280.3409423828125, "coord_origin": "TOPLEFT"}, "confidence": 0.7868534922599792, "cells": [{"id": 6, "text": "C", "bbox": {"l": 374.49326, "t": 168.59362999999996, "r": 381.66843, "b": 177.91540999999995, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "C", "bbox": {"l": 398.74011, "t": 168.50005999999996, "r": 405.91528, "b": 177.82183999999995, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "C", "bbox": {"l": 373.76862, "t": 192.92553999999996, "r": 380.94379, "b": 202.24730999999997, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "C", "bbox": {"l": 386.66388, "t": 193.07061999999996, "r": 393.83905, "b": 202.39239999999995, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "C", "bbox": {"l": 386.68707, "t": 205.13756999999998, "r": 393.86224, "b": 214.45934999999997, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "C", "bbox": {"l": 398.65729, "t": 180.73279000000002, "r": 405.83246, "b": 190.05457, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "C", "bbox": {"l": 410.77908, "t": 180.73859000000004, "r": 417.95425, "b": 190.06035999999995, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "C", "bbox": {"l": 422.90503, "t": 180.65247, "r": 430.08020000000005, "b": 189.97424, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "C", "bbox": {"l": 398.7807, "t": 192.98865, "r": 405.95587, "b": 202.31042000000002, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "C", "bbox": {"l": 410.90164, "t": 192.99487, "r": 418.07681, "b": 202.31664999999998, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "C", "bbox": {"l": 423.02753, "t": 192.909, "r": 430.2027, "b": 202.23077, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "C", "bbox": {"l": 398.78235, "t": 205.31573000000003, "r": 405.95752, "b": 214.63751000000002, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "C", "bbox": {"l": 410.90414, "t": 205.32196, "r": 418.07932, "b": 214.64373999999998, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "C", "bbox": {"l": 423.03003, "t": 205.23614999999995, "r": 430.20520000000005, "b": 214.55791999999997, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "C", "bbox": {"l": 386.50574, "t": 217.03882, "r": 393.68091, "b": 226.36059999999998, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "C", "bbox": {"l": 398.60181, "t": 217.21704, "r": 405.77698, "b": 226.53882, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "C", "bbox": {"l": 410.72275, "t": 217.22321, "r": 417.89792, "b": 226.54498, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "C", "bbox": {"l": 422.84869, "t": 217.13738999999998, "r": 430.02386, "b": 226.45916999999997, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "NL", "bbox": {"l": 435.16009999999994, "t": 167.69011999999998, "r": 447.86273, "b": 177.01189999999997, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "NL", "bbox": {"l": 435.44415, "t": 180.20025999999996, "r": 448.14679, "b": 189.52202999999997, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "NL", "bbox": {"l": 435.46735, "t": 192.49474999999995, "r": 448.16998000000007, "b": 201.81652999999994, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "NL", "bbox": {"l": 435.38202, "t": 204.83025999999995, "r": 448.08466, "b": 214.15204000000006, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "NL", "bbox": {"l": 435.59906, "t": 217.2337, "r": 448.3017, "b": 226.55548, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "U", "bbox": {"l": 374.14957, "t": 205.23492, "r": 381.32474, "b": 214.55669999999998, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "U", "bbox": {"l": 374.0419, "t": 217.14648, "r": 381.21707, "b": 226.46826, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "U", "bbox": {"l": 374.34418, "t": 180.93488000000002, "r": 381.51935, "b": 190.25665000000004, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "L", "bbox": {"l": 387.76285, "t": 168.57788000000005, "r": 393.28833, "b": 177.89966000000004, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "L", "bbox": {"l": 411.86395, "t": 168.06195000000002, "r": 417.38943, "b": 177.38373, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "L", "bbox": {"l": 423.33563, "t": 167.93439, "r": 428.86111, "b": 177.25616000000002, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "X", "bbox": {"l": 387.13593, "t": 180.78576999999996, "r": 393.76453, "b": 190.10753999999997, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "C", "bbox": {"l": 282.2594, "t": 244.50878999999998, "r": 289.43457, "b": 253.83056999999997, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "U", "bbox": {"l": 282.11035, "t": 256.85022000000004, "r": 289.28552, "b": 266.172, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "U", "bbox": {"l": 282.40848, "t": 269.13300000000004, "r": 289.58365, "b": 278.45477000000005, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "L", "bbox": {"l": 295.52902, "t": 244.49347, "r": 301.0545, "b": 253.81525, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "L", "bbox": {"l": 307.46613, "t": 244.57372999999995, "r": 312.99161, "b": 253.89550999999994, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "L", "bbox": {"l": 318.76886, "t": 244.44037000000003, "r": 324.29434, "b": 253.76215000000002, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "X", "bbox": {"l": 294.9021, "t": 256.70154, "r": 301.03976, "b": 266.02332, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "X X", "bbox": {"l": 307.17743, "t": 256.70154, "r": 325.59039, "b": 266.02332, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "X", "bbox": {"l": 294.78949, "t": 269.25420999999994, "r": 300.92715, "b": 278.57599000000005, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "X X", "bbox": {"l": 307.06482, "t": 269.25420999999994, "r": 325.47778, "b": 278.57599000000005, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "C", "bbox": {"l": 195.93939, "t": 268.74798999999996, "r": 203.11456, "b": 278.06976, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "L", "bbox": {"l": 209.20891, "t": 268.73267, "r": 214.73439, "b": 278.05444, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "L", "bbox": {"l": 221.14551, "t": 268.81293000000005, "r": 226.67099, "b": 278.13469999999995, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "L", "bbox": {"l": 232.44858, "t": 268.67957, "r": 237.97405999999998, "b": 278.00134, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "C", "bbox": {"l": 196.21715, "t": 244.53961000000004, "r": 203.39232, "b": 253.86139000000003, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "C", "bbox": {"l": 250.32143, "t": 244.09813999999994, "r": 257.49661, "b": 253.41992000000005, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "U", "bbox": {"l": 250.17235999999997, "t": 256.43951000000004, "r": 257.34753, "b": 265.76129000000003, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "U", "bbox": {"l": 250.47049000000004, "t": 268.72222999999997, "r": 257.64566, "b": 278.04400999999996, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "1", "bbox": {"l": 334.51135, "t": 242.99463000000003, "r": 337.22485, "b": 249.20911, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "- simple cells: \"C\"", "bbox": {"l": 339.93835, "t": 242.99463000000003, "r": 391.49472, "b": 249.20911, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "2", "bbox": {"l": 334.51135, "t": 252.93255999999997, "r": 337.33313, "b": 259.14703, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "- horizontal merges: \"C\", \"L\"", "bbox": {"l": 340.15491, "t": 252.93255999999997, "r": 421.98624, "b": 259.14703, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "3", "bbox": {"l": 334.51135, "t": 262.87048000000004, "r": 337.29868, "b": 269.08496, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "- vertical merges: \"C\", \"U\"", "bbox": {"l": 340.086, "t": 262.87048000000004, "r": 415.34375, "b": 269.08496, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "4", "bbox": {"l": 334.51135, "t": 272.80841, "r": 337.30188, "b": 279.02288999999996, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "- 2d merges: \"C\", \"L\", \"U\", \"X\"", "bbox": {"l": 340.09241, "t": 272.80841, "r": 426.59875, "b": 279.02288999999996, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "1", "bbox": {"l": 185.67178, "t": 244.04224, "r": 189.35544, "b": 250.25671, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "2", "bbox": {"l": 185.96759, "t": 268.34766, "r": 189.65125, "b": 274.56213, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "3", "bbox": {"l": 239.34152, "t": 243.62523999999996, "r": 243.02518, "b": 249.83972000000006, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "4", "bbox": {"l": 271.32852, "t": 243.49390000000005, "r": 275.01218, "b": 249.70836999999995, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "2", "bbox": {"l": 229.81627, "t": 166.51495, "r": 233.49992000000003, "b": 172.72942999999998, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "1", "bbox": {"l": 257.24402, "t": 189.961, "r": 260.92767, "b": 196.17548, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "3", "bbox": {"l": 186.87526, "t": 177.97668, "r": 190.55891, "b": 184.19115999999997, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "4", "bbox": {"l": 196.48746, "t": 169.01520000000005, "r": 200.17111, "b": 175.22968000000003, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "A", "bbox": {"l": 169.74728, "t": 167.88225999999997, "r": 175.72659, "b": 175.65039000000002, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "B", "bbox": {"l": 169.74728, "t": 206.83867999999995, "r": 175.72659, "b": 214.60681, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "C", "bbox": {"l": 274.29419, "t": 168.27972, "r": 280.2735, "b": 176.04785000000004, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "D", "bbox": {"l": 359.56152, "t": 168.27972, "r": 365.54083, "b": 176.04785000000004, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "E", "bbox": {"l": 169.74728, "t": 243.21149000000003, "r": 175.27112, "b": 250.97960999999998, "coord_origin": "TOPLEFT"}}], "children": [{"id": 19, "label": "text", "bbox": {"l": 374.49326, "t": 168.59362999999996, "r": 381.66843, "b": 177.91540999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": "C", "bbox": {"l": 374.49326, "t": 168.59362999999996, "r": 381.66843, "b": 177.91540999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 398.74011, "t": 168.50005999999996, "r": 405.91528, "b": 177.82183999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "C", "bbox": {"l": 398.74011, "t": 168.50005999999996, "r": 405.91528, "b": 177.82183999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 373.76862, "t": 192.92553999999996, "r": 380.94379, "b": 202.24730999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "C", "bbox": {"l": 373.76862, "t": 192.92553999999996, "r": 380.94379, "b": 202.24730999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 386.66388, "t": 193.07061999999996, "r": 393.83905, "b": 202.39239999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "C", "bbox": {"l": 386.66388, "t": 193.07061999999996, "r": 393.83905, "b": 202.39239999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 386.68707, "t": 205.13756999999998, "r": 393.86224, "b": 214.45934999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "C", "bbox": {"l": 386.68707, "t": 205.13756999999998, "r": 393.86224, "b": 214.45934999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 398.65729, "t": 180.73279000000002, "r": 405.83246, "b": 190.05457, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "C", "bbox": {"l": 398.65729, "t": 180.73279000000002, "r": 405.83246, "b": 190.05457, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 410.77908, "t": 180.73859000000004, "r": 417.95425, "b": 190.06035999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "C", "bbox": {"l": 410.77908, "t": 180.73859000000004, "r": 417.95425, "b": 190.06035999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 422.90503, "t": 180.65247, "r": 430.08020000000005, "b": 189.97424, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "C", "bbox": {"l": 422.90503, "t": 180.65247, "r": 430.08020000000005, "b": 189.97424, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 398.7807, "t": 192.98865, "r": 405.95587, "b": 202.31042000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "C", "bbox": {"l": 398.7807, "t": 192.98865, "r": 405.95587, "b": 202.31042000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 410.90164, "t": 192.99487, "r": 418.07681, "b": 202.31664999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "C", "bbox": {"l": 410.90164, "t": 192.99487, "r": 418.07681, "b": 202.31664999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 423.02753, "t": 192.909, "r": 430.2027, "b": 202.23077, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "C", "bbox": {"l": 423.02753, "t": 192.909, "r": 430.2027, "b": 202.23077, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 398.78235, "t": 205.31573000000003, "r": 405.95752, "b": 214.63751000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "C", "bbox": {"l": 398.78235, "t": 205.31573000000003, "r": 405.95752, "b": 214.63751000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 410.90414, "t": 205.32196, "r": 418.07932, "b": 214.64373999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "C", "bbox": {"l": 410.90414, "t": 205.32196, "r": 418.07932, "b": 214.64373999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 423.03003, "t": 205.23614999999995, "r": 430.20520000000005, "b": 214.55791999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "C", "bbox": {"l": 423.03003, "t": 205.23614999999995, "r": 430.20520000000005, "b": 214.55791999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 386.50574, "t": 217.03882, "r": 393.68091, "b": 226.36059999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "C", "bbox": {"l": 386.50574, "t": 217.03882, "r": 393.68091, "b": 226.36059999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 398.60181, "t": 217.21704, "r": 405.77698, "b": 226.53882, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "C", "bbox": {"l": 398.60181, "t": 217.21704, "r": 405.77698, "b": 226.53882, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 410.72275, "t": 217.22321, "r": 417.89792, "b": 226.54498, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "C", "bbox": {"l": 410.72275, "t": 217.22321, "r": 417.89792, "b": 226.54498, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 422.84869, "t": 217.13738999999998, "r": 430.02386, "b": 226.45916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "C", "bbox": {"l": 422.84869, "t": 217.13738999999998, "r": 430.02386, "b": 226.45916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 435.16009999999994, "t": 167.69011999999998, "r": 447.86273, "b": 177.01189999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "NL", "bbox": {"l": 435.16009999999994, "t": 167.69011999999998, "r": 447.86273, "b": 177.01189999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 435.44415, "t": 180.20025999999996, "r": 448.14679, "b": 189.52202999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "NL", "bbox": {"l": 435.44415, "t": 180.20025999999996, "r": 448.14679, "b": 189.52202999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 435.46735, "t": 192.49474999999995, "r": 448.16998000000007, "b": 201.81652999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "NL", "bbox": {"l": 435.46735, "t": 192.49474999999995, "r": 448.16998000000007, "b": 201.81652999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 435.38202, "t": 204.83025999999995, "r": 448.08466, "b": 214.15204000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "NL", "bbox": {"l": 435.38202, "t": 204.83025999999995, "r": 448.08466, "b": 214.15204000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 435.59906, "t": 217.2337, "r": 448.3017, "b": 226.55548, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "NL", "bbox": {"l": 435.59906, "t": 217.2337, "r": 448.3017, "b": 226.55548, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 374.14957, "t": 205.23492, "r": 381.32474, "b": 214.55669999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "U", "bbox": {"l": 374.14957, "t": 205.23492, "r": 381.32474, "b": 214.55669999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 374.0419, "t": 217.14648, "r": 381.21707, "b": 226.46826, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "U", "bbox": {"l": 374.0419, "t": 217.14648, "r": 381.21707, "b": 226.46826, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 374.34418, "t": 180.93488000000002, "r": 381.51935, "b": 190.25665000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "U", "bbox": {"l": 374.34418, "t": 180.93488000000002, "r": 381.51935, "b": 190.25665000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 387.76285, "t": 168.57788000000005, "r": 393.28833, "b": 177.89966000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "L", "bbox": {"l": 387.76285, "t": 168.57788000000005, "r": 393.28833, "b": 177.89966000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 411.86395, "t": 168.06195000000002, "r": 417.38943, "b": 177.38373, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "L", "bbox": {"l": 411.86395, "t": 168.06195000000002, "r": 417.38943, "b": 177.38373, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 423.33563, "t": 167.93439, "r": 428.86111, "b": 177.25616000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "L", "bbox": {"l": 423.33563, "t": 167.93439, "r": 428.86111, "b": 177.25616000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 387.13593, "t": 180.78576999999996, "r": 393.76453, "b": 190.10753999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "X", "bbox": {"l": 387.13593, "t": 180.78576999999996, "r": 393.76453, "b": 190.10753999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 282.2594, "t": 244.50878999999998, "r": 289.43457, "b": 253.83056999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "C", "bbox": {"l": 282.2594, "t": 244.50878999999998, "r": 289.43457, "b": 253.83056999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 282.11035, "t": 256.85022000000004, "r": 289.28552, "b": 266.172, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "U", "bbox": {"l": 282.11035, "t": 256.85022000000004, "r": 289.28552, "b": 266.172, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 282.40848, "t": 269.13300000000004, "r": 289.58365, "b": 278.45477000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "U", "bbox": {"l": 282.40848, "t": 269.13300000000004, "r": 289.58365, "b": 278.45477000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 295.52902, "t": 244.49347, "r": 301.0545, "b": 253.81525, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "L", "bbox": {"l": 295.52902, "t": 244.49347, "r": 301.0545, "b": 253.81525, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 307.46613, "t": 244.57372999999995, "r": 312.99161, "b": 253.89550999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "L", "bbox": {"l": 307.46613, "t": 244.57372999999995, "r": 312.99161, "b": 253.89550999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 318.76886, "t": 244.44037000000003, "r": 324.29434, "b": 253.76215000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "L", "bbox": {"l": 318.76886, "t": 244.44037000000003, "r": 324.29434, "b": 253.76215000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 294.9021, "t": 256.70154, "r": 301.03976, "b": 266.02332, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "X", "bbox": {"l": 294.9021, "t": 256.70154, "r": 301.03976, "b": 266.02332, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 307.17743, "t": 256.70154, "r": 325.59039, "b": 266.02332, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "X X", "bbox": {"l": 307.17743, "t": 256.70154, "r": 325.59039, "b": 266.02332, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 294.78949, "t": 269.25420999999994, "r": 300.92715, "b": 278.57599000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "X", "bbox": {"l": 294.78949, "t": 269.25420999999994, "r": 300.92715, "b": 278.57599000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 307.06482, "t": 269.25420999999994, "r": 325.47778, "b": 278.57599000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "X X", "bbox": {"l": 307.06482, "t": 269.25420999999994, "r": 325.47778, "b": 278.57599000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 195.93939, "t": 268.74798999999996, "r": 203.11456, "b": 278.06976, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "C", "bbox": {"l": 195.93939, "t": 268.74798999999996, "r": 203.11456, "b": 278.06976, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 209.20891, "t": 268.73267, "r": 214.73439, "b": 278.05444, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "L", "bbox": {"l": 209.20891, "t": 268.73267, "r": 214.73439, "b": 278.05444, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 221.14551, "t": 268.81293000000005, "r": 226.67099, "b": 278.13469999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "L", "bbox": {"l": 221.14551, "t": 268.81293000000005, "r": 226.67099, "b": 278.13469999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 232.44858, "t": 268.67957, "r": 237.97405999999998, "b": 278.00134, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "L", "bbox": {"l": 232.44858, "t": 268.67957, "r": 237.97405999999998, "b": 278.00134, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 196.21715, "t": 244.53961000000004, "r": 203.39232, "b": 253.86139000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "C", "bbox": {"l": 196.21715, "t": 244.53961000000004, "r": 203.39232, "b": 253.86139000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 250.32143, "t": 244.09813999999994, "r": 257.49661, "b": 253.41992000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "C", "bbox": {"l": 250.32143, "t": 244.09813999999994, "r": 257.49661, "b": 253.41992000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 250.17235999999997, "t": 256.43951000000004, "r": 257.34753, "b": 265.76129000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "U", "bbox": {"l": 250.17235999999997, "t": 256.43951000000004, "r": 257.34753, "b": 265.76129000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 250.47049000000004, "t": 268.72222999999997, "r": 257.64566, "b": 278.04400999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "U", "bbox": {"l": 250.47049000000004, "t": 268.72222999999997, "r": 257.64566, "b": 278.04400999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 334.51135, "t": 242.99463000000003, "r": 337.22485, "b": 249.20911, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "1", "bbox": {"l": 334.51135, "t": 242.99463000000003, "r": 337.22485, "b": 249.20911, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 339.93835, "t": 242.99463000000003, "r": 391.49472, "b": 249.20911, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "- simple cells: \"C\"", "bbox": {"l": 339.93835, "t": 242.99463000000003, "r": 391.49472, "b": 249.20911, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 334.51135, "t": 252.93255999999997, "r": 337.33313, "b": 259.14703, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "2", "bbox": {"l": 334.51135, "t": 252.93255999999997, "r": 337.33313, "b": 259.14703, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 340.15491, "t": 252.93255999999997, "r": 421.98624, "b": 259.14703, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "- horizontal merges: \"C\", \"L\"", "bbox": {"l": 340.15491, "t": 252.93255999999997, "r": 421.98624, "b": 259.14703, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 334.51135, "t": 262.87048000000004, "r": 337.29868, "b": 269.08496, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "3", "bbox": {"l": 334.51135, "t": 262.87048000000004, "r": 337.29868, "b": 269.08496, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 340.086, "t": 262.87048000000004, "r": 415.34375, "b": 269.08496, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "- vertical merges: \"C\", \"U\"", "bbox": {"l": 340.086, "t": 262.87048000000004, "r": 415.34375, "b": 269.08496, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "list_item", "bbox": {"l": 334.51135, "t": 272.80841, "r": 426.59875, "b": 279.02288999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.5250625610351562, "cells": [{"id": 60, "text": "4", "bbox": {"l": 334.51135, "t": 272.80841, "r": 337.30188, "b": 279.02288999999996, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "- 2d merges: \"C\", \"L\", \"U\", \"X\"", "bbox": {"l": 340.09241, "t": 272.80841, "r": 426.59875, "b": 279.02288999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 185.67178, "t": 244.04224, "r": 189.35544, "b": 250.25671, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "1", "bbox": {"l": 185.67178, "t": 244.04224, "r": 189.35544, "b": 250.25671, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 185.96759, "t": 268.34766, "r": 189.65125, "b": 274.56213, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "2", "bbox": {"l": 185.96759, "t": 268.34766, "r": 189.65125, "b": 274.56213, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 239.34152, "t": 243.62523999999996, "r": 243.02518, "b": 249.83972000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "3", "bbox": {"l": 239.34152, "t": 243.62523999999996, "r": 243.02518, "b": 249.83972000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 271.32852, "t": 243.49390000000005, "r": 275.01218, "b": 249.70836999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "4", "bbox": {"l": 271.32852, "t": 243.49390000000005, "r": 275.01218, "b": 249.70836999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 229.81627, "t": 166.51495, "r": 233.49992000000003, "b": 172.72942999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "2", "bbox": {"l": 229.81627, "t": 166.51495, "r": 233.49992000000003, "b": 172.72942999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 257.24402, "t": 189.961, "r": 260.92767, "b": 196.17548, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "1", "bbox": {"l": 257.24402, "t": 189.961, "r": 260.92767, "b": 196.17548, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 186.87526, "t": 177.97668, "r": 190.55891, "b": 184.19115999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "3", "bbox": {"l": 186.87526, "t": 177.97668, "r": 190.55891, "b": 184.19115999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 196.48746, "t": 169.01520000000005, "r": 200.17111, "b": 175.22968000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "4", "bbox": {"l": 196.48746, "t": 169.01520000000005, "r": 200.17111, "b": 175.22968000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 169.74728, "t": 167.88225999999997, "r": 175.72659, "b": 175.65039000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "A", "bbox": {"l": 169.74728, "t": 167.88225999999997, "r": 175.72659, "b": 175.65039000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 169.74728, "t": 206.83867999999995, "r": 175.72659, "b": 214.60681, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "B", "bbox": {"l": 169.74728, "t": 206.83867999999995, "r": 175.72659, "b": 214.60681, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 274.29419, "t": 168.27972, "r": 280.2735, "b": 176.04785000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "C", "bbox": {"l": 274.29419, "t": 168.27972, "r": 280.2735, "b": 176.04785000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 359.56152, "t": 168.27972, "r": 365.54083, "b": 176.04785000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "D", "bbox": {"l": 359.56152, "t": 168.27972, "r": 365.54083, "b": 176.04785000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 169.74728, "t": 243.21149000000003, "r": 175.27112, "b": 250.97960999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "E", "bbox": {"l": 169.74728, "t": 243.21149000000003, "r": 175.27112, "b": 250.97960999999998, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "section_header", "id": 9, "page_no": 6, "cluster": {"id": 9, "label": "section_header", "bbox": {"l": 134.765, "t": 305.29581, "r": 246.65197999999998, "b": 314.10275, "coord_origin": "TOPLEFT"}, "confidence": 0.9233023524284363, "cells": [{"id": 75, "text": "4.2", "bbox": {"l": 134.765, "t": 305.29581, "r": 149.40205, "b": 314.10275, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "Language Syntax", "bbox": {"l": 160.85904, "t": 305.29581, "r": 246.65197999999998, "b": 314.10275, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4.2 Language Syntax"}, {"label": "text", "id": 10, "page_no": 6, "cluster": {"id": 10, "label": "text", "bbox": {"l": 134.765, "t": 325.24777, "r": 363.79617, "b": 334.04474, "coord_origin": "TOPLEFT"}, "confidence": 0.9169168472290039, "cells": [{"id": 77, "text": "The OTSL representation follows these syntax rules:", "bbox": {"l": 134.765, "t": 325.24777, "r": 363.79617, "b": 334.04474, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The OTSL representation follows these syntax rules:"}, {"label": "list_item", "id": 3, "page_no": 6, "cluster": {"id": 3, "label": "list_item", "bbox": {"l": 138.97299, "t": 347.17081, "r": 480.58902, "b": 367.93375, "coord_origin": "TOPLEFT"}, "confidence": 0.9588112235069275, "cells": [{"id": 78, "text": "1.", "bbox": {"l": 138.97299, "t": 347.18079, "r": 146.71991, "b": 355.97775, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "Left-looking cell rule", "bbox": {"l": 151.70099, "t": 347.17081, "r": 257.37927, "b": 355.97775, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": ": The left neighbour of an \"L\" cell must be either", "bbox": {"l": 257.383, "t": 347.18079, "r": 480.58902, "b": 355.97775, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "another \"L\" cell or a \"C\" cell.", "bbox": {"l": 151.70099, "t": 359.13678, "r": 283.59387, "b": 367.93375, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1. Left-looking cell rule : The left neighbour of an \"L\" cell must be either another \"L\" cell or a \"C\" cell."}, {"label": "list_item", "id": 4, "page_no": 6, "cluster": {"id": 4, "label": "list_item", "bbox": {"l": 138.97299, "t": 371.08481, "r": 480.59229000000005, "b": 391.84673999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9585386514663696, "cells": [{"id": 82, "text": "2.", "bbox": {"l": 138.97299, "t": 371.09479, "r": 146.71991, "b": 379.89175, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "Up-looking cell rule", "bbox": {"l": 151.70099, "t": 371.08481, "r": 252.11203, "b": 379.89175, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": ": The upper neighbour of a \"U\" cell must be either", "bbox": {"l": 252.112, "t": 371.09479, "r": 480.59229000000005, "b": 379.89175, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "another \"U\" cell or a \"C\" cell.", "bbox": {"l": 151.70099, "t": 383.04977, "r": 284.8392, "b": 391.84673999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2. Up-looking cell rule : The upper neighbour of a \"U\" cell must be either another \"U\" cell or a \"C\" cell."}, {"label": "section_header", "id": 14, "page_no": 6, "cluster": {"id": 14, "label": "section_header", "bbox": {"l": 138.97299, "t": 394.99780000000004, "r": 226.07360999999997, "b": 403.80475, "coord_origin": "TOPLEFT"}, "confidence": 0.6506174206733704, "cells": [{"id": 86, "text": "3.", "bbox": {"l": 138.97299, "t": 395.0077800000001, "r": 146.71991, "b": 403.80475, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Cross cell rule", "bbox": {"l": 151.70099, "t": 394.99780000000004, "r": 223.3042, "b": 403.80475, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": ":", "bbox": {"l": 223.30699, "t": 395.0077800000001, "r": 226.07360999999997, "b": 403.80475, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3. Cross cell rule :"}, {"label": "list_item", "id": 13, "page_no": 6, "cluster": {"id": 13, "label": "list_item", "bbox": {"l": 151.70099, "t": 406.96677, "r": 480.59238, "b": 439.67371, "coord_origin": "TOPLEFT"}, "confidence": 0.7247239947319031, "cells": [{"id": 89, "text": "The left neighbour of an \"X\" cell must be either another \"X\" cell or a \"U\"", "bbox": {"l": 151.70099, "t": 406.96677, "r": 480.59238, "b": 415.76373, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "cell, and the upper neighbour of an \"X\" cell must be either another \"X\" cell", "bbox": {"l": 151.70099, "t": 418.9217499999999, "r": 480.59219, "b": 427.71871999999996, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "or an \"L\" cell.", "bbox": {"l": 151.70099, "t": 430.87674, "r": 214.39663999999996, "b": 439.67371, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The left neighbour of an \"X\" cell must be either another \"X\" cell or a \"U\" cell, and the upper neighbour of an \"X\" cell must be either another \"X\" cell or an \"L\" cell."}, {"label": "list_item", "id": 8, "page_no": 6, "cluster": {"id": 8, "label": "list_item", "bbox": {"l": 138.97299, "t": 442.82574, "r": 474.59018, "b": 451.63269, "coord_origin": "TOPLEFT"}, "confidence": 0.9259927272796631, "cells": [{"id": 92, "text": "4.", "bbox": {"l": 138.97299, "t": 442.83572, "r": 146.71991, "b": 451.63269, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "First row rule", "bbox": {"l": 151.70099, "t": 442.82574, "r": 221.32263, "b": 451.63269, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": ": Only \"L\" cells and \"C\" cells are allowed in the first row.", "bbox": {"l": 221.32700000000003, "t": 442.83572, "r": 474.59018, "b": 451.63269, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4. First row rule : Only \"L\" cells and \"C\" cells are allowed in the first row."}, {"label": "list_item", "id": 5, "page_no": 6, "cluster": {"id": 5, "label": "list_item", "bbox": {"l": 138.97299, "t": 454.78375, "r": 480.58746, "b": 475.54568, "coord_origin": "TOPLEFT"}, "confidence": 0.9420599937438965, "cells": [{"id": 95, "text": "5.", "bbox": {"l": 138.97299, "t": 454.7937299999999, "r": 146.71991, "b": 463.5907, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "First column rule", "bbox": {"l": 151.70099, "t": 454.78375, "r": 240.71982, "b": 463.5907, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": ": Only \"U\" cells and \"C\" cells are allowed in the first", "bbox": {"l": 240.71599, "t": 454.7937299999999, "r": 480.58746, "b": 463.5907, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "column.", "bbox": {"l": 151.70099, "t": 466.74872, "r": 186.0072, "b": 475.54568, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5. First column rule : Only \"U\" cells and \"C\" cells are allowed in the first column."}, {"label": "list_item", "id": 1, "page_no": 6, "cluster": {"id": 1, "label": "list_item", "bbox": {"l": 138.97299, "t": 478.69675, "r": 480.59457, "b": 499.45969, "coord_origin": "TOPLEFT"}, "confidence": 0.9617829918861389, "cells": [{"id": 99, "text": "6.", "bbox": {"l": 138.97299, "t": 478.70673, "r": 146.71991, "b": 487.50369, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "Rectangular rule", "bbox": {"l": 151.70099, "t": 478.69675, "r": 235.15768, "b": 487.50369, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": ": The table representation is always rectangular - all rows", "bbox": {"l": 235.15697999999998, "t": 478.70673, "r": 480.59457, "b": 487.50369, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "must have an equal number of tokens, terminated with \"NL\" token.", "bbox": {"l": 151.70099, "t": 490.66272, "r": 448.04147, "b": 499.45969, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "6. Rectangular rule : The table representation is always rectangular - all rows must have an equal number of tokens, terminated with \"NL\" token."}, {"label": "text", "id": 0, "page_no": 6, "cluster": {"id": 0, "label": "text", "bbox": {"l": 134.76498, "t": 512.59271, "r": 480.59583, "b": 640.9416699999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9785562753677368, "cells": [{"id": 103, "text": "The application of these rules gives OTSL a set of unique properties. First", "bbox": {"l": 149.70898, "t": 512.59271, "r": 480.59583, "b": 521.38968, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "of all, the OTSL enforces a strictly rectangular structure representation, where", "bbox": {"l": 134.76498, "t": 524.5477000000001, "r": 480.59079, "b": 533.34467, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "every new-line token starts a new row. As a consequence, all rows and all columns", "bbox": {"l": 134.76498, "t": 536.5027, "r": 480.59482, "b": 545.29967, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "have exactly the same number of tokens, irrespective of cell spans. Secondly, the", "bbox": {"l": 134.76498, "t": 548.4586899999999, "r": 480.58865000000003, "b": 557.25566, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "OTSL representation is unambiguous: Every table structure is represented in one", "bbox": {"l": 134.76498, "t": 560.4137000000001, "r": 480.59365999999994, "b": 569.21066, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "way. In this representation every table cell corresponds to a \"C\"-cell token, which", "bbox": {"l": 134.76498, "t": 572.3687, "r": 480.58673, "b": 581.16566, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "in case of spans is always located in the top-left corner of the table cell definition.", "bbox": {"l": 134.76498, "t": 584.3237, "r": 480.59171, "b": 593.12067, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "Third, OTSL syntax rules are only backward-looking. As a consequence, every", "bbox": {"l": 134.76498, "t": 596.2787, "r": 480.59180000000003, "b": 605.07567, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "predicted token can be validated straight during sequence generation by looking", "bbox": {"l": 134.76498, "t": 608.2347, "r": 480.5936899999999, "b": 617.03166, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "at the previously predicted sequence. As such, OTSL can guarantee that every", "bbox": {"l": 134.76498, "t": 620.1897, "r": 480.59072999999995, "b": 628.98666, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "predicted sequence is syntactically valid.", "bbox": {"l": 134.76498, "t": 632.1447000000001, "r": 311.19769, "b": 640.9416699999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The application of these rules gives OTSL a set of unique properties. First of all, the OTSL enforces a strictly rectangular structure representation, where every new-line token starts a new row. As a consequence, all rows and all columns have exactly the same number of tokens, irrespective of cell spans. Secondly, the OTSL representation is unambiguous: Every table structure is represented in one way. In this representation every table cell corresponds to a \"C\"-cell token, which in case of spans is always located in the top-left corner of the table cell definition. Third, OTSL syntax rules are only backward-looking. As a consequence, every predicted token can be validated straight during sequence generation by looking at the previously predicted sequence. As such, OTSL can guarantee that every predicted sequence is syntactically valid."}, {"label": "text", "id": 2, "page_no": 6, "cluster": {"id": 2, "label": "text", "bbox": {"l": 134.76498, "t": 644.1026899999999, "r": 480.59265, "b": 664.8546699999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9590610861778259, "cells": [{"id": 114, "text": "These characteristics can be easily learned by sequence generator networks,", "bbox": {"l": 149.70898, "t": 644.1026899999999, "r": 480.59186, "b": 652.89966, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "as we demonstrate further below. We find strong indications that this pattern", "bbox": {"l": 134.76498, "t": 656.05769, "r": 480.59265, "b": 664.8546699999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "These characteristics can be easily learned by sequence generator networks, as we demonstrate further below. We find strong indications that this pattern"}], "headers": [{"label": "page_header", "id": 7, "page_no": 6, "cluster": {"id": 7, "label": "page_header", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.932651162147522, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Optimized Table Tokenization for Table Structure Recognition"}, {"label": "page_header", "id": 11, "page_no": 6, "cluster": {"id": 11, "label": "page_header", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8749732375144958, "cells": [{"id": 1, "text": "7", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "7"}]}}, {"page_no": 7, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "8", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "M.", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 178.07675, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37415, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "reduces significantly the column drift seen in the HTML based models (see Fig-", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.58884000000006, "b": 127.73077, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "ure 5).", "bbox": {"l": 134.765, "t": 130.88878999999997, "r": 163.56389, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "4.3", "bbox": {"l": 134.765, "t": 161.55682000000002, "r": 149.40205, "b": 170.36377000000005, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Error-detection and -mitigation", "bbox": {"l": 160.85904, "t": 161.55682000000002, "r": 319.34708, "b": 170.36377000000005, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "The design of OTSL allows to validate a table structure easily on an unfinished", "bbox": {"l": 134.765, "t": 182.28179999999998, "r": 480.59572999999995, "b": 191.0788, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "sequence. The detection of an invalid sequence token is a clear indication of a", "bbox": {"l": 134.765, "t": 194.23779000000002, "r": 480.59473, "b": 203.03479000000004, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "prediction mistake, however a valid sequence by itself does not guarantee pre-", "bbox": {"l": 134.765, "t": 206.19281, "r": 480.58678999999995, "b": 214.98981000000003, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "diction correctness. Different heuristics can be used to correct token errors in", "bbox": {"l": 134.765, "t": 218.14783, "r": 480.59177000000005, "b": 226.94482000000005, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "an invalid sequence and thus increase the chances for accurate predictions. Such", "bbox": {"l": 134.765, "t": 230.10284000000001, "r": 480.58768, "b": 238.89984000000004, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "heuristics can be applied either after the prediction of each token, or at the end", "bbox": {"l": 134.765, "t": 242.05786, "r": 480.5867, "b": 250.85486000000003, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "on the entire predicted sequence. For example a simple heuristic which can cor-", "bbox": {"l": 134.765, "t": 254.01288, "r": 480.5938100000001, "b": 262.80988, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "rect the predicted OTSL sequence on-the-fly is to verify if the token with the", "bbox": {"l": 134.765, "t": 265.96887000000004, "r": 480.59069999999997, "b": 274.76586999999995, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "highest prediction confidence invalidates the predicted sequence, and replace it", "bbox": {"l": 134.765, "t": 277.92389000000003, "r": 480.5957599999999, "b": 286.72086, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "by the token with the next highest confidence until OTSL rules are satisfied.", "bbox": {"l": 134.765, "t": 289.8788799999999, "r": 469.40369, "b": 298.67584, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "5", "bbox": {"l": 134.765, "t": 321.164, "r": 141.4886, "b": 331.73239000000007, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Experiments", "bbox": {"l": 154.9382, "t": 321.164, "r": 229.03534, "b": 331.73239000000007, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "To evaluate the impact of OTSL on prediction accuracy and inference times, we", "bbox": {"l": 134.765, "t": 347.24985, "r": 480.59375, "b": 356.04681, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "conducted a series of experiments based on the TableFormer model (Figure 4)", "bbox": {"l": 134.765, "t": 359.2048300000001, "r": 480.59476, "b": 368.0018, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "with two objectives: Firstly we evaluate the prediction quality and performance", "bbox": {"l": 134.765, "t": 371.15982, "r": 480.58786000000003, "b": 379.95679, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "of OTSL vs. HTML after performing Hyper Parameter Optimization (HPO) on", "bbox": {"l": 134.765, "t": 383.11481000000003, "r": 480.58777, "b": 391.91177, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "the", "bbox": {"l": 134.765, "t": 395.06978999999995, "r": 148.59807, "b": 403.86676, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "canonical", "bbox": {"l": 151.627, "t": 395.06978999999995, "r": 191.84703, "b": 403.86676, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "PubTabNet data set. Secondly we pick the best hyper-parameters", "bbox": {"l": 195.90201, "t": 395.06978999999995, "r": 480.59528, "b": 403.86676, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "found in the first step and evaluate how OTSL impacts the performance of", "bbox": {"l": 134.76501, "t": 407.02478, "r": 480.59283000000005, "b": 415.82175, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "TableFormer after training on other publicly available data sets (FinTabNet,", "bbox": {"l": 134.76501, "t": 418.98077, "r": 480.59476, "b": 427.77774, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "PubTables-1M [14]). The ground truth (GT) from all data sets has been con-", "bbox": {"l": 134.76501, "t": 430.93576, "r": 480.59171, "b": 439.73273, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "verted into OTSL format for this purpose, and will be made publicly available.", "bbox": {"l": 134.76501, "t": 442.8907500000001, "r": 479.30258, "b": 451.6877099999999, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Fig. 4.", "bbox": {"l": 134.76501, "t": 484.64813, "r": 162.64424, "b": 492.57443, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Architecture sketch of the TableFormer model, which is a representative for the", "bbox": {"l": 165.19601, "t": 484.71091, "r": 480.59082, "b": 492.78067, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Im2Seq approach.", "bbox": {"l": 134.76501, "t": 495.66989, "r": 206.70245, "b": 503.73965, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "1.", "bbox": {"l": 147.30025, "t": 540.73164, "r": 149.70605, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Item", "bbox": {"l": 150.90895, "t": 540.73164, "r": 155.72055, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "Amount", "bbox": {"l": 162.75987, "t": 535.3938, "r": 172.2963, "b": 537.76224, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Names", "bbox": {"l": 147.63603, "t": 535.3661500000001, "r": 155.91753, "b": 537.73459, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "1000", "bbox": {"l": 158.48466, "t": 540.73164, "r": 164.10178, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "500", "bbox": {"l": 158.48466, "t": 544.67065, "r": 162.69737, "b": 547.03909, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "3500", "bbox": {"l": 158.48466, "t": 548.91264, "r": 164.10178, "b": 551.28108, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "150", "bbox": {"l": 158.48466, "t": 553.15465, "r": 162.69737, "b": 555.52309, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "unit", "bbox": {"l": 168.81696, "t": 540.73164, "r": 172.88876, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "unit", "bbox": {"l": 168.81696, "t": 544.67065, "r": 172.88876, "b": 547.03909, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "unit", "bbox": {"l": 168.81696, "t": 548.91264, "r": 172.88876, "b": 551.28108, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "unit", "bbox": {"l": 168.81696, "t": 553.15465, "r": 172.88876, "b": 555.52309, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "2.", "bbox": {"l": 147.30025, "t": 544.67065, "r": 149.70605, "b": 547.03909, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "Item", "bbox": {"l": 150.90895, "t": 544.67065, "r": 155.72055, "b": 547.03909, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "3.", "bbox": {"l": 147.30025, "t": 548.91264, "r": 149.70605, "b": 551.28108, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Item", "bbox": {"l": 150.90895, "t": 548.91264, "r": 155.72055, "b": 551.28108, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "4.", "bbox": {"l": 147.30025, "t": 553.15465, "r": 149.70605, "b": 555.52309, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Item", "bbox": {"l": 150.90895, "t": 553.15465, "r": 155.72055, "b": 555.52309, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Extracted", "bbox": {"l": 152.05046, "t": 517.0098, "r": 171.24945, "b": 521.27298, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Table Images", "bbox": {"l": 148.13347, "t": 522.3122900000001, "r": 175.16759, "b": 526.57547, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Standardized", "bbox": {"l": 193.53331, "t": 524.51422, "r": 220.31973, "b": 528.7774, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "Images", "bbox": {"l": 199.47311, "t": 529.8167100000001, "r": 214.37889, "b": 534.0799, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "BBox", "bbox": {"l": 273.61066, "t": 509.9053, "r": 284.47275, "b": 514.16849, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Decoder", "bbox": {"l": 270.45187, "t": 513.6928399999999, "r": 287.63242, "b": 517.9560200000001, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "BBoxes", "bbox": {"l": 332.47852, "t": 508.14438, "r": 348.14014, "b": 512.40756, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "BBoxes can be", "bbox": {"l": 376.68622, "t": 521.12024, "r": 407.25497, "b": 525.38342, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "traced back to the", "bbox": {"l": 373.90869, "t": 525.66525, "r": 410.03506, "b": 529.92844, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "original image to", "bbox": {"l": 375.29871, "t": 530.21024, "r": 408.64902, "b": 534.47342, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "extract content", "bbox": {"l": 377.06747, "t": 534.75522, "r": 406.88312, "b": 539.01843, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "Structure Tags sequence", "bbox": {"l": 383.56683, "t": 563.24176, "r": 433.76544, "b": 567.50497, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "provide full description of", "bbox": {"l": 383.52768, "t": 567.78676, "r": 433.80764999999997, "b": 572.04997, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "the table structure", "bbox": {"l": 390.47522, "t": 572.33177, "r": 426.85703, "b": 576.59499, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "Structure Tags", "bbox": {"l": 293.94702, "t": 577.89143, "r": 323.1691, "b": 582.15465, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "in OTSL format", "bbox": {"l": 293.94702, "t": 582.43648, "r": 324.59396, "b": 586.69969, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "BBoxes in sync", "bbox": {"l": 333.07819, "t": 541.82269, "r": 364.14691, "b": 546.08591, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "with tag sequence", "bbox": {"l": 333.07819, "t": 545.6102, "r": 369.71542, "b": 549.87341, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "Encoder", "bbox": {"l": 232.65881000000002, "t": 515.24139, "r": 249.58894000000004, "b": 519.50458, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "Structure", "bbox": {"l": 269.8219, "t": 545.97102, "r": 288.26279, "b": 550.23424, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Decoder", "bbox": {"l": 270.45187, "t": 549.75851, "r": 287.63242, "b": 554.0217299999999, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "[x1, y2, x2, y2]", "bbox": {"l": 332.17676, "t": 515.91205, "r": 358.11206, "b": 520.17523, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "[x1', y2', x2', y2']", "bbox": {"l": 332.17676, "t": 521.9720500000001, "r": 361.58298, "b": 526.23523, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "[x1'', y2'', x2'', y2'']", "bbox": {"l": 332.17676, "t": 528.03204, "r": 364.76474, "b": 532.29523, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "...", "bbox": {"l": 332.17676, "t": 534.09204, "r": 335.96548, "b": 538.35524, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "1", "bbox": {"l": 326.8894, "t": 516.39508, "r": 329.41641, "b": 520.6582599999999, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "2", "bbox": {"l": 327.04089, "t": 522.4247700000001, "r": 329.5679, "b": 526.68796, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "3", "bbox": {"l": 327.04089, "t": 528.51508, "r": 329.5679, "b": 532.77826, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "3", "bbox": {"l": 424.14102, "t": 527.4428399999999, "r": 426.66803, "b": 531.7060200000001, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "2", "bbox": {"l": 453.0018, "t": 517.4539500000001, "r": 455.52881, "b": 521.71713, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "1", "bbox": {"l": 423.85825, "t": 517.06281, "r": 426.38525, "b": 521.32599, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "C", "bbox": {"l": 333.4342, "t": 557.36679, "r": 337.27542, "b": 562.35719, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "C", "bbox": {"l": 340.35397, "t": 557.31679, "r": 344.19519, "b": 562.30719, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "C", "bbox": {"l": 340.30978, "t": 563.8653899999999, "r": 344.151, "b": 568.8557900000001, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "C", "bbox": {"l": 346.79904, "t": 563.8686700000001, "r": 350.64026, "b": 568.85907, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "C", "bbox": {"l": 333.59583, "t": 563.82271, "r": 337.43704, "b": 568.81311, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "C", "bbox": {"l": 340.37543, "t": 570.42673, "r": 344.21664, "b": 575.41713, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "C", "bbox": {"l": 346.86469, "t": 570.43001, "r": 350.7059, "b": 575.42041, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "C", "bbox": {"l": 333.66144, "t": 570.38405, "r": 337.50266, "b": 575.37445, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "C", "bbox": {"l": 340.37671, "t": 577.02606, "r": 344.21793, "b": 582.0164599999999, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "C", "bbox": {"l": 346.86597, "t": 577.02934, "r": 350.70718, "b": 582.01974, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "C", "bbox": {"l": 333.66272, "t": 576.98338, "r": 337.50394, "b": 581.97379, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "C", "bbox": {"l": 340.27948, "t": 583.39737, "r": 344.1207, "b": 588.38777, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "C", "bbox": {"l": 346.76874, "t": 583.40068, "r": 350.60995, "b": 588.39108, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "C", "bbox": {"l": 333.56549, "t": 583.35474, "r": 337.40671, "b": 588.34514, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "NL", "bbox": {"l": 353.03326, "t": 556.8831299999999, "r": 359.83362, "b": 561.87354, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "NL", "bbox": {"l": 353.18604, "t": 563.58044, "r": 359.98639, "b": 568.57085, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "NL", "bbox": {"l": 353.19864, "t": 570.1623500000001, "r": 359.99899, "b": 575.15276, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "NL", "bbox": {"l": 353.1532, "t": 576.76611, "r": 359.95355, "b": 581.75652, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "NL", "bbox": {"l": 353.26935, "t": 583.40628, "r": 360.0697, "b": 588.3966800000001, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "L", "bbox": {"l": 347.37979, "t": 557.08235, "r": 350.33786, "b": 562.07275, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "3", "bbox": {"l": 331.14026, "t": 564.2907700000001, "r": 333.66727, "b": 568.55399, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "2", "bbox": {"l": 340.80972, "t": 554.59312, "r": 343.33673, "b": 558.85634, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "1", "bbox": {"l": 330.97992, "t": 554.83035, "r": 333.50693, "b": 559.09357, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "We rely on standard metrics such as Tree Edit Distance score (TEDs) for", "bbox": {"l": 149.709, "t": 620.19278, "r": 480.58792, "b": 628.98975, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "table structure prediction, and Mean Average Precision (mAP) with 0.75 Inter-", "bbox": {"l": 134.765, "t": 632.14778, "r": 480.58871, "b": 640.94475, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "section Over Union (IOU) threshold for the bounding-box predictions of table", "bbox": {"l": 134.765, "t": 644.1027799999999, "r": 480.5917400000001, "b": 652.89975, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "cells. The predicted OTSL structures were converted back to HTML format in", "bbox": {"l": 134.765, "t": 656.0577900000001, "r": 480.58968999999996, "b": 664.8547599999999, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 9, "label": "page_header", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8301323056221008, "cells": [{"id": 0, "text": "8", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "page_header", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8631826043128967, "cells": [{"id": 1, "text": "M.", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 178.07675, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37415, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "text", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.58884000000006, "b": 139.68579, "coord_origin": "TOPLEFT"}, "confidence": 0.9464744925498962, "cells": [{"id": 3, "text": "reduces significantly the column drift seen in the HTML based models (see Fig-", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.58884000000006, "b": 127.73077, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "ure 5).", "bbox": {"l": 134.765, "t": 130.88878999999997, "r": 163.56389, "b": 139.68579, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "section_header", "bbox": {"l": 134.765, "t": 161.55682000000002, "r": 319.34708, "b": 170.36377000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9549514651298523, "cells": [{"id": 5, "text": "4.3", "bbox": {"l": 134.765, "t": 161.55682000000002, "r": 149.40205, "b": 170.36377000000005, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Error-detection and -mitigation", "bbox": {"l": 160.85904, "t": 161.55682000000002, "r": 319.34708, "b": 170.36377000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 134.765, "t": 182.28179999999998, "r": 480.5957599999999, "b": 298.67584, "coord_origin": "TOPLEFT"}, "confidence": 0.9879790544509888, "cells": [{"id": 7, "text": "The design of OTSL allows to validate a table structure easily on an unfinished", "bbox": {"l": 134.765, "t": 182.28179999999998, "r": 480.59572999999995, "b": 191.0788, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "sequence. The detection of an invalid sequence token is a clear indication of a", "bbox": {"l": 134.765, "t": 194.23779000000002, "r": 480.59473, "b": 203.03479000000004, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "prediction mistake, however a valid sequence by itself does not guarantee pre-", "bbox": {"l": 134.765, "t": 206.19281, "r": 480.58678999999995, "b": 214.98981000000003, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "diction correctness. Different heuristics can be used to correct token errors in", "bbox": {"l": 134.765, "t": 218.14783, "r": 480.59177000000005, "b": 226.94482000000005, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "an invalid sequence and thus increase the chances for accurate predictions. Such", "bbox": {"l": 134.765, "t": 230.10284000000001, "r": 480.58768, "b": 238.89984000000004, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "heuristics can be applied either after the prediction of each token, or at the end", "bbox": {"l": 134.765, "t": 242.05786, "r": 480.5867, "b": 250.85486000000003, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "on the entire predicted sequence. For example a simple heuristic which can cor-", "bbox": {"l": 134.765, "t": 254.01288, "r": 480.5938100000001, "b": 262.80988, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "rect the predicted OTSL sequence on-the-fly is to verify if the token with the", "bbox": {"l": 134.765, "t": 265.96887000000004, "r": 480.59069999999997, "b": 274.76586999999995, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "highest prediction confidence invalidates the predicted sequence, and replace it", "bbox": {"l": 134.765, "t": 277.92389000000003, "r": 480.5957599999999, "b": 286.72086, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "by the token with the next highest confidence until OTSL rules are satisfied.", "bbox": {"l": 134.765, "t": 289.8788799999999, "r": 469.40369, "b": 298.67584, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "section_header", "bbox": {"l": 134.765, "t": 321.164, "r": 229.03534, "b": 331.73239000000007, "coord_origin": "TOPLEFT"}, "confidence": 0.95152747631073, "cells": [{"id": 17, "text": "5", "bbox": {"l": 134.765, "t": 321.164, "r": 141.4886, "b": 331.73239000000007, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Experiments", "bbox": {"l": 154.9382, "t": 321.164, "r": 229.03534, "b": 331.73239000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 134.765, "t": 347.24985, "r": 480.59528, "b": 451.6877099999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9877985119819641, "cells": [{"id": 19, "text": "To evaluate the impact of OTSL on prediction accuracy and inference times, we", "bbox": {"l": 134.765, "t": 347.24985, "r": 480.59375, "b": 356.04681, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "conducted a series of experiments based on the TableFormer model (Figure 4)", "bbox": {"l": 134.765, "t": 359.2048300000001, "r": 480.59476, "b": 368.0018, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "with two objectives: Firstly we evaluate the prediction quality and performance", "bbox": {"l": 134.765, "t": 371.15982, "r": 480.58786000000003, "b": 379.95679, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "of OTSL vs. HTML after performing Hyper Parameter Optimization (HPO) on", "bbox": {"l": 134.765, "t": 383.11481000000003, "r": 480.58777, "b": 391.91177, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "the", "bbox": {"l": 134.765, "t": 395.06978999999995, "r": 148.59807, "b": 403.86676, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "canonical", "bbox": {"l": 151.627, "t": 395.06978999999995, "r": 191.84703, "b": 403.86676, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "PubTabNet data set. Secondly we pick the best hyper-parameters", "bbox": {"l": 195.90201, "t": 395.06978999999995, "r": 480.59528, "b": 403.86676, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "found in the first step and evaluate how OTSL impacts the performance of", "bbox": {"l": 134.76501, "t": 407.02478, "r": 480.59283000000005, "b": 415.82175, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "TableFormer after training on other publicly available data sets (FinTabNet,", "bbox": {"l": 134.76501, "t": 418.98077, "r": 480.59476, "b": 427.77774, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "PubTables-1M [14]). The ground truth (GT) from all data sets has been con-", "bbox": {"l": 134.76501, "t": 430.93576, "r": 480.59171, "b": 439.73273, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "verted into OTSL format for this purpose, and will be made publicly available.", "bbox": {"l": 134.76501, "t": 442.8907500000001, "r": 479.30258, "b": 451.6877099999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "caption", "bbox": {"l": 134.76501, "t": 484.64813, "r": 480.59082, "b": 503.73965, "coord_origin": "TOPLEFT"}, "confidence": 0.9297956228256226, "cells": [{"id": 30, "text": "Fig. 4.", "bbox": {"l": 134.76501, "t": 484.64813, "r": 162.64424, "b": 492.57443, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Architecture sketch of the TableFormer model, which is a representative for the", "bbox": {"l": 165.19601, "t": 484.71091, "r": 480.59082, "b": 492.78067, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Im2Seq approach.", "bbox": {"l": 134.76501, "t": 495.66989, "r": 206.70245, "b": 503.73965, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "picture", "bbox": {"l": 140.70968627929688, "t": 508.0638427734375, "r": 472.73382568359375, "b": 593.6771850585938, "coord_origin": "TOPLEFT"}, "confidence": 0.9303396344184875, "cells": [{"id": 33, "text": "1.", "bbox": {"l": 147.30025, "t": 540.73164, "r": 149.70605, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Item", "bbox": {"l": 150.90895, "t": 540.73164, "r": 155.72055, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "Amount", "bbox": {"l": 162.75987, "t": 535.3938, "r": 172.2963, "b": 537.76224, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Names", "bbox": {"l": 147.63603, "t": 535.3661500000001, "r": 155.91753, "b": 537.73459, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "1000", "bbox": {"l": 158.48466, "t": 540.73164, "r": 164.10178, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "500", "bbox": {"l": 158.48466, "t": 544.67065, "r": 162.69737, "b": 547.03909, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "3500", "bbox": {"l": 158.48466, "t": 548.91264, "r": 164.10178, "b": 551.28108, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "150", "bbox": {"l": 158.48466, "t": 553.15465, "r": 162.69737, "b": 555.52309, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "unit", "bbox": {"l": 168.81696, "t": 540.73164, "r": 172.88876, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "unit", "bbox": {"l": 168.81696, "t": 544.67065, "r": 172.88876, "b": 547.03909, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "unit", "bbox": {"l": 168.81696, "t": 548.91264, "r": 172.88876, "b": 551.28108, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "unit", "bbox": {"l": 168.81696, "t": 553.15465, "r": 172.88876, "b": 555.52309, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "2.", "bbox": {"l": 147.30025, "t": 544.67065, "r": 149.70605, "b": 547.03909, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "Item", "bbox": {"l": 150.90895, "t": 544.67065, "r": 155.72055, "b": 547.03909, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "3.", "bbox": {"l": 147.30025, "t": 548.91264, "r": 149.70605, "b": 551.28108, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Item", "bbox": {"l": 150.90895, "t": 548.91264, "r": 155.72055, "b": 551.28108, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "4.", "bbox": {"l": 147.30025, "t": 553.15465, "r": 149.70605, "b": 555.52309, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Item", "bbox": {"l": 150.90895, "t": 553.15465, "r": 155.72055, "b": 555.52309, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Extracted", "bbox": {"l": 152.05046, "t": 517.0098, "r": 171.24945, "b": 521.27298, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Table Images", "bbox": {"l": 148.13347, "t": 522.3122900000001, "r": 175.16759, "b": 526.57547, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Standardized", "bbox": {"l": 193.53331, "t": 524.51422, "r": 220.31973, "b": 528.7774, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "Images", "bbox": {"l": 199.47311, "t": 529.8167100000001, "r": 214.37889, "b": 534.0799, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "BBox", "bbox": {"l": 273.61066, "t": 509.9053, "r": 284.47275, "b": 514.16849, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Decoder", "bbox": {"l": 270.45187, "t": 513.6928399999999, "r": 287.63242, "b": 517.9560200000001, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "BBoxes", "bbox": {"l": 332.47852, "t": 508.14438, "r": 348.14014, "b": 512.40756, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "BBoxes can be", "bbox": {"l": 376.68622, "t": 521.12024, "r": 407.25497, "b": 525.38342, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "traced back to the", "bbox": {"l": 373.90869, "t": 525.66525, "r": 410.03506, "b": 529.92844, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "original image to", "bbox": {"l": 375.29871, "t": 530.21024, "r": 408.64902, "b": 534.47342, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "extract content", "bbox": {"l": 377.06747, "t": 534.75522, "r": 406.88312, "b": 539.01843, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "Structure Tags sequence", "bbox": {"l": 383.56683, "t": 563.24176, "r": 433.76544, "b": 567.50497, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "provide full description of", "bbox": {"l": 383.52768, "t": 567.78676, "r": 433.80764999999997, "b": 572.04997, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "the table structure", "bbox": {"l": 390.47522, "t": 572.33177, "r": 426.85703, "b": 576.59499, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "Structure Tags", "bbox": {"l": 293.94702, "t": 577.89143, "r": 323.1691, "b": 582.15465, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "in OTSL format", "bbox": {"l": 293.94702, "t": 582.43648, "r": 324.59396, "b": 586.69969, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "BBoxes in sync", "bbox": {"l": 333.07819, "t": 541.82269, "r": 364.14691, "b": 546.08591, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "with tag sequence", "bbox": {"l": 333.07819, "t": 545.6102, "r": 369.71542, "b": 549.87341, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "Encoder", "bbox": {"l": 232.65881000000002, "t": 515.24139, "r": 249.58894000000004, "b": 519.50458, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "Structure", "bbox": {"l": 269.8219, "t": 545.97102, "r": 288.26279, "b": 550.23424, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Decoder", "bbox": {"l": 270.45187, "t": 549.75851, "r": 287.63242, "b": 554.0217299999999, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "[x1, y2, x2, y2]", "bbox": {"l": 332.17676, "t": 515.91205, "r": 358.11206, "b": 520.17523, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "[x1', y2', x2', y2']", "bbox": {"l": 332.17676, "t": 521.9720500000001, "r": 361.58298, "b": 526.23523, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "[x1'', y2'', x2'', y2'']", "bbox": {"l": 332.17676, "t": 528.03204, "r": 364.76474, "b": 532.29523, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "...", "bbox": {"l": 332.17676, "t": 534.09204, "r": 335.96548, "b": 538.35524, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "1", "bbox": {"l": 326.8894, "t": 516.39508, "r": 329.41641, "b": 520.6582599999999, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "2", "bbox": {"l": 327.04089, "t": 522.4247700000001, "r": 329.5679, "b": 526.68796, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "3", "bbox": {"l": 327.04089, "t": 528.51508, "r": 329.5679, "b": 532.77826, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "3", "bbox": {"l": 424.14102, "t": 527.4428399999999, "r": 426.66803, "b": 531.7060200000001, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "2", "bbox": {"l": 453.0018, "t": 517.4539500000001, "r": 455.52881, "b": 521.71713, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "1", "bbox": {"l": 423.85825, "t": 517.06281, "r": 426.38525, "b": 521.32599, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "C", "bbox": {"l": 333.4342, "t": 557.36679, "r": 337.27542, "b": 562.35719, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "C", "bbox": {"l": 340.35397, "t": 557.31679, "r": 344.19519, "b": 562.30719, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "C", "bbox": {"l": 340.30978, "t": 563.8653899999999, "r": 344.151, "b": 568.8557900000001, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "C", "bbox": {"l": 346.79904, "t": 563.8686700000001, "r": 350.64026, "b": 568.85907, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "C", "bbox": {"l": 333.59583, "t": 563.82271, "r": 337.43704, "b": 568.81311, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "C", "bbox": {"l": 340.37543, "t": 570.42673, "r": 344.21664, "b": 575.41713, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "C", "bbox": {"l": 346.86469, "t": 570.43001, "r": 350.7059, "b": 575.42041, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "C", "bbox": {"l": 333.66144, "t": 570.38405, "r": 337.50266, "b": 575.37445, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "C", "bbox": {"l": 340.37671, "t": 577.02606, "r": 344.21793, "b": 582.0164599999999, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "C", "bbox": {"l": 346.86597, "t": 577.02934, "r": 350.70718, "b": 582.01974, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "C", "bbox": {"l": 333.66272, "t": 576.98338, "r": 337.50394, "b": 581.97379, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "C", "bbox": {"l": 340.27948, "t": 583.39737, "r": 344.1207, "b": 588.38777, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "C", "bbox": {"l": 346.76874, "t": 583.40068, "r": 350.60995, "b": 588.39108, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "C", "bbox": {"l": 333.56549, "t": 583.35474, "r": 337.40671, "b": 588.34514, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "NL", "bbox": {"l": 353.03326, "t": 556.8831299999999, "r": 359.83362, "b": 561.87354, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "NL", "bbox": {"l": 353.18604, "t": 563.58044, "r": 359.98639, "b": 568.57085, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "NL", "bbox": {"l": 353.19864, "t": 570.1623500000001, "r": 359.99899, "b": 575.15276, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "NL", "bbox": {"l": 353.1532, "t": 576.76611, "r": 359.95355, "b": 581.75652, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "NL", "bbox": {"l": 353.26935, "t": 583.40628, "r": 360.0697, "b": 588.3966800000001, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "L", "bbox": {"l": 347.37979, "t": 557.08235, "r": 350.33786, "b": 562.07275, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "3", "bbox": {"l": 331.14026, "t": 564.2907700000001, "r": 333.66727, "b": 568.55399, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "2", "bbox": {"l": 340.80972, "t": 554.59312, "r": 343.33673, "b": 558.85634, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "1", "bbox": {"l": 330.97992, "t": 554.83035, "r": 333.50693, "b": 559.09357, "coord_origin": "TOPLEFT"}}], "children": [{"id": 10, "label": "text", "bbox": {"l": 147.30025, "t": 540.73164, "r": 149.70605, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "1.", "bbox": {"l": 147.30025, "t": 540.73164, "r": 149.70605, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 150.90895, "t": 540.73164, "r": 155.72055, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "Item", "bbox": {"l": 150.90895, "t": 540.73164, "r": 155.72055, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 162.75987, "t": 535.3938, "r": 172.2963, "b": 537.76224, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "Amount", "bbox": {"l": 162.75987, "t": 535.3938, "r": 172.2963, "b": 537.76224, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 147.63603, "t": 535.3661500000001, "r": 155.91753, "b": 537.73459, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "Names", "bbox": {"l": 147.63603, "t": 535.3661500000001, "r": 155.91753, "b": 537.73459, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 158.48466, "t": 540.73164, "r": 164.10178, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "1000", "bbox": {"l": 158.48466, "t": 540.73164, "r": 164.10178, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 158.48466, "t": 544.67065, "r": 162.69737, "b": 547.03909, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "500", "bbox": {"l": 158.48466, "t": 544.67065, "r": 162.69737, "b": 547.03909, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 158.48466, "t": 548.91264, "r": 164.10178, "b": 551.28108, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "3500", "bbox": {"l": 158.48466, "t": 548.91264, "r": 164.10178, "b": 551.28108, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 158.48466, "t": 553.15465, "r": 162.69737, "b": 555.52309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "150", "bbox": {"l": 158.48466, "t": 553.15465, "r": 162.69737, "b": 555.52309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 168.81696, "t": 540.73164, "r": 172.88876, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "unit", "bbox": {"l": 168.81696, "t": 540.73164, "r": 172.88876, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 168.81696, "t": 544.67065, "r": 172.88876, "b": 547.03909, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "unit", "bbox": {"l": 168.81696, "t": 544.67065, "r": 172.88876, "b": 547.03909, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 168.81696, "t": 548.91264, "r": 172.88876, "b": 551.28108, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "unit", "bbox": {"l": 168.81696, "t": 548.91264, "r": 172.88876, "b": 551.28108, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 168.81696, "t": 553.15465, "r": 172.88876, "b": 555.52309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "unit", "bbox": {"l": 168.81696, "t": 553.15465, "r": 172.88876, "b": 555.52309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 147.30025, "t": 544.67065, "r": 149.70605, "b": 547.03909, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "2.", "bbox": {"l": 147.30025, "t": 544.67065, "r": 149.70605, "b": 547.03909, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 150.90895, "t": 544.67065, "r": 155.72055, "b": 547.03909, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "Item", "bbox": {"l": 150.90895, "t": 544.67065, "r": 155.72055, "b": 547.03909, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 147.30025, "t": 548.91264, "r": 149.70605, "b": 551.28108, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "3.", "bbox": {"l": 147.30025, "t": 548.91264, "r": 149.70605, "b": 551.28108, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 150.90895, "t": 548.91264, "r": 155.72055, "b": 551.28108, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "Item", "bbox": {"l": 150.90895, "t": 548.91264, "r": 155.72055, "b": 551.28108, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 147.30025, "t": 553.15465, "r": 149.70605, "b": 555.52309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "4.", "bbox": {"l": 147.30025, "t": 553.15465, "r": 149.70605, "b": 555.52309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 150.90895, "t": 553.15465, "r": 155.72055, "b": 555.52309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "Item", "bbox": {"l": 150.90895, "t": 553.15465, "r": 155.72055, "b": 555.52309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 152.05046, "t": 517.0098, "r": 171.24945, "b": 521.27298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "Extracted", "bbox": {"l": 152.05046, "t": 517.0098, "r": 171.24945, "b": 521.27298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 148.13347, "t": 522.3122900000001, "r": 175.16759, "b": 526.57547, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "Table Images", "bbox": {"l": 148.13347, "t": 522.3122900000001, "r": 175.16759, "b": 526.57547, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 193.53331, "t": 524.51422, "r": 220.31973, "b": 528.7774, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "Standardized", "bbox": {"l": 193.53331, "t": 524.51422, "r": 220.31973, "b": 528.7774, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 199.47311, "t": 529.8167100000001, "r": 214.37889, "b": 534.0799, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "Images", "bbox": {"l": 199.47311, "t": 529.8167100000001, "r": 214.37889, "b": 534.0799, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 273.61066, "t": 509.9053, "r": 284.47275, "b": 514.16849, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "BBox", "bbox": {"l": 273.61066, "t": 509.9053, "r": 284.47275, "b": 514.16849, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 270.45187, "t": 513.6928399999999, "r": 287.63242, "b": 517.9560200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "Decoder", "bbox": {"l": 270.45187, "t": 513.6928399999999, "r": 287.63242, "b": 517.9560200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 332.47852, "t": 508.14438, "r": 348.14014, "b": 512.40756, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "BBoxes", "bbox": {"l": 332.47852, "t": 508.14438, "r": 348.14014, "b": 512.40756, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 376.68622, "t": 521.12024, "r": 407.25497, "b": 525.38342, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "BBoxes can be", "bbox": {"l": 376.68622, "t": 521.12024, "r": 407.25497, "b": 525.38342, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 373.90869, "t": 525.66525, "r": 410.03506, "b": 529.92844, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "traced back to the", "bbox": {"l": 373.90869, "t": 525.66525, "r": 410.03506, "b": 529.92844, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 375.29871, "t": 530.21024, "r": 408.64902, "b": 534.47342, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "original image to", "bbox": {"l": 375.29871, "t": 530.21024, "r": 408.64902, "b": 534.47342, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 377.06747, "t": 534.75522, "r": 406.88312, "b": 539.01843, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "extract content", "bbox": {"l": 377.06747, "t": 534.75522, "r": 406.88312, "b": 539.01843, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 383.56683, "t": 563.24176, "r": 433.76544, "b": 567.50497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "Structure Tags sequence", "bbox": {"l": 383.56683, "t": 563.24176, "r": 433.76544, "b": 567.50497, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 383.52768, "t": 567.78676, "r": 433.80764999999997, "b": 572.04997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "provide full description of", "bbox": {"l": 383.52768, "t": 567.78676, "r": 433.80764999999997, "b": 572.04997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 390.47522, "t": 572.33177, "r": 426.85703, "b": 576.59499, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "the table structure", "bbox": {"l": 390.47522, "t": 572.33177, "r": 426.85703, "b": 576.59499, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 293.94702, "t": 577.89143, "r": 323.1691, "b": 582.15465, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "Structure Tags", "bbox": {"l": 293.94702, "t": 577.89143, "r": 323.1691, "b": 582.15465, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 293.94702, "t": 582.43648, "r": 324.59396, "b": 586.69969, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "in OTSL format", "bbox": {"l": 293.94702, "t": 582.43648, "r": 324.59396, "b": 586.69969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 333.07819, "t": 541.82269, "r": 364.14691, "b": 546.08591, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "BBoxes in sync", "bbox": {"l": 333.07819, "t": 541.82269, "r": 364.14691, "b": 546.08591, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 333.07819, "t": 545.6102, "r": 369.71542, "b": 549.87341, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "with tag sequence", "bbox": {"l": 333.07819, "t": 545.6102, "r": 369.71542, "b": 549.87341, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 232.65881000000002, "t": 515.24139, "r": 249.58894000000004, "b": 519.50458, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "Encoder", "bbox": {"l": 232.65881000000002, "t": 515.24139, "r": 249.58894000000004, "b": 519.50458, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 269.8219, "t": 545.97102, "r": 288.26279, "b": 550.23424, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "Structure", "bbox": {"l": 269.8219, "t": 545.97102, "r": 288.26279, "b": 550.23424, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 270.45187, "t": 549.75851, "r": 287.63242, "b": 554.0217299999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "Decoder", "bbox": {"l": 270.45187, "t": 549.75851, "r": 287.63242, "b": 554.0217299999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 332.17676, "t": 515.91205, "r": 358.11206, "b": 520.17523, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "[x1, y2, x2, y2]", "bbox": {"l": 332.17676, "t": 515.91205, "r": 358.11206, "b": 520.17523, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 332.17676, "t": 521.9720500000001, "r": 361.58298, "b": 526.23523, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "[x1', y2', x2', y2']", "bbox": {"l": 332.17676, "t": 521.9720500000001, "r": 361.58298, "b": 526.23523, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 332.17676, "t": 528.03204, "r": 364.76474, "b": 532.29523, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "[x1'', y2'', x2'', y2'']", "bbox": {"l": 332.17676, "t": 528.03204, "r": 364.76474, "b": 532.29523, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 332.17676, "t": 534.09204, "r": 335.96548, "b": 538.35524, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "...", "bbox": {"l": 332.17676, "t": 534.09204, "r": 335.96548, "b": 538.35524, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 326.8894, "t": 516.39508, "r": 329.41641, "b": 520.6582599999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "1", "bbox": {"l": 326.8894, "t": 516.39508, "r": 329.41641, "b": 520.6582599999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 327.04089, "t": 522.4247700000001, "r": 329.5679, "b": 526.68796, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "2", "bbox": {"l": 327.04089, "t": 522.4247700000001, "r": 329.5679, "b": 526.68796, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 327.04089, "t": 528.51508, "r": 329.5679, "b": 532.77826, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "3", "bbox": {"l": 327.04089, "t": 528.51508, "r": 329.5679, "b": 532.77826, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 424.14102, "t": 527.4428399999999, "r": 426.66803, "b": 531.7060200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "3", "bbox": {"l": 424.14102, "t": 527.4428399999999, "r": 426.66803, "b": 531.7060200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 453.0018, "t": 517.4539500000001, "r": 455.52881, "b": 521.71713, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "2", "bbox": {"l": 453.0018, "t": 517.4539500000001, "r": 455.52881, "b": 521.71713, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 423.85825, "t": 517.06281, "r": 426.38525, "b": 521.32599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "1", "bbox": {"l": 423.85825, "t": 517.06281, "r": 426.38525, "b": 521.32599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 333.4342, "t": 557.36679, "r": 337.27542, "b": 562.35719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "C", "bbox": {"l": 333.4342, "t": 557.36679, "r": 337.27542, "b": 562.35719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 340.35397, "t": 557.31679, "r": 344.19519, "b": 562.30719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "C", "bbox": {"l": 340.35397, "t": 557.31679, "r": 344.19519, "b": 562.30719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 340.30978, "t": 563.8653899999999, "r": 344.151, "b": 568.8557900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "C", "bbox": {"l": 340.30978, "t": 563.8653899999999, "r": 344.151, "b": 568.8557900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 346.79904, "t": 563.8686700000001, "r": 350.64026, "b": 568.85907, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "C", "bbox": {"l": 346.79904, "t": 563.8686700000001, "r": 350.64026, "b": 568.85907, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 333.59583, "t": 563.82271, "r": 337.43704, "b": 568.81311, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "C", "bbox": {"l": 333.59583, "t": 563.82271, "r": 337.43704, "b": 568.81311, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 340.37543, "t": 570.42673, "r": 344.21664, "b": 575.41713, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "C", "bbox": {"l": 340.37543, "t": 570.42673, "r": 344.21664, "b": 575.41713, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 346.86469, "t": 570.43001, "r": 350.7059, "b": 575.42041, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "C", "bbox": {"l": 346.86469, "t": 570.43001, "r": 350.7059, "b": 575.42041, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 333.66144, "t": 570.38405, "r": 337.50266, "b": 575.37445, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "C", "bbox": {"l": 333.66144, "t": 570.38405, "r": 337.50266, "b": 575.37445, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 340.37671, "t": 577.02606, "r": 344.21793, "b": 582.0164599999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "C", "bbox": {"l": 340.37671, "t": 577.02606, "r": 344.21793, "b": 582.0164599999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 346.86597, "t": 577.02934, "r": 350.70718, "b": 582.01974, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "C", "bbox": {"l": 346.86597, "t": 577.02934, "r": 350.70718, "b": 582.01974, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 333.66272, "t": 576.98338, "r": 337.50394, "b": 581.97379, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "C", "bbox": {"l": 333.66272, "t": 576.98338, "r": 337.50394, "b": 581.97379, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 340.27948, "t": 583.39737, "r": 344.1207, "b": 588.38777, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "C", "bbox": {"l": 340.27948, "t": 583.39737, "r": 344.1207, "b": 588.38777, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 346.76874, "t": 583.40068, "r": 350.60995, "b": 588.39108, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "C", "bbox": {"l": 346.76874, "t": 583.40068, "r": 350.60995, "b": 588.39108, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 333.56549, "t": 583.35474, "r": 337.40671, "b": 588.34514, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "C", "bbox": {"l": 333.56549, "t": 583.35474, "r": 337.40671, "b": 588.34514, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 353.03326, "t": 556.8831299999999, "r": 359.83362, "b": 561.87354, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "NL", "bbox": {"l": 353.03326, "t": 556.8831299999999, "r": 359.83362, "b": 561.87354, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 353.18604, "t": 563.58044, "r": 359.98639, "b": 568.57085, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "NL", "bbox": {"l": 353.18604, "t": 563.58044, "r": 359.98639, "b": 568.57085, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 353.19864, "t": 570.1623500000001, "r": 359.99899, "b": 575.15276, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "NL", "bbox": {"l": 353.19864, "t": 570.1623500000001, "r": 359.99899, "b": 575.15276, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 353.1532, "t": 576.76611, "r": 359.95355, "b": 581.75652, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "NL", "bbox": {"l": 353.1532, "t": 576.76611, "r": 359.95355, "b": 581.75652, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 353.26935, "t": 583.40628, "r": 360.0697, "b": 588.3966800000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "NL", "bbox": {"l": 353.26935, "t": 583.40628, "r": 360.0697, "b": 588.3966800000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 347.37979, "t": 557.08235, "r": 350.33786, "b": 562.07275, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "L", "bbox": {"l": 347.37979, "t": 557.08235, "r": 350.33786, "b": 562.07275, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 331.14026, "t": 564.2907700000001, "r": 333.66727, "b": 568.55399, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "3", "bbox": {"l": 331.14026, "t": 564.2907700000001, "r": 333.66727, "b": 568.55399, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 340.80972, "t": 554.59312, "r": 343.33673, "b": 558.85634, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": "2", "bbox": {"l": 340.80972, "t": 554.59312, "r": 343.33673, "b": 558.85634, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 330.97992, "t": 554.83035, "r": 333.50693, "b": 559.09357, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "1", "bbox": {"l": 330.97992, "t": 554.83035, "r": 333.50693, "b": 559.09357, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 4, "label": "text", "bbox": {"l": 134.765, "t": 620.19278, "r": 480.5917400000001, "b": 664.8547599999999, "coord_origin": "TOPLEFT"}, "confidence": 0.951270341873169, "cells": [{"id": 105, "text": "We rely on standard metrics such as Tree Edit Distance score (TEDs) for", "bbox": {"l": 149.709, "t": 620.19278, "r": 480.58792, "b": 628.98975, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "table structure prediction, and Mean Average Precision (mAP) with 0.75 Inter-", "bbox": {"l": 134.765, "t": 632.14778, "r": 480.58871, "b": 640.94475, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "section Over Union (IOU) threshold for the bounding-box predictions of table", "bbox": {"l": 134.765, "t": 644.1027799999999, "r": 480.5917400000001, "b": 652.89975, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "cells. The predicted OTSL structures were converted back to HTML format in", "bbox": {"l": 134.765, "t": 656.0577900000001, "r": 480.58968999999996, "b": 664.8547599999999, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_header", "id": 9, "page_no": 7, "cluster": {"id": 9, "label": "page_header", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8301323056221008, "cells": [{"id": 0, "text": "8", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "8"}, {"label": "page_header", "id": 8, "page_no": 7, "cluster": {"id": 8, "label": "page_header", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8631826043128967, "cells": [{"id": 1, "text": "M.", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 178.07675, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37415, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "M. Lysak, et al."}, {"label": "text", "id": 5, "page_no": 7, "cluster": {"id": 5, "label": "text", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.58884000000006, "b": 139.68579, "coord_origin": "TOPLEFT"}, "confidence": 0.9464744925498962, "cells": [{"id": 3, "text": "reduces significantly the column drift seen in the HTML based models (see Fig-", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.58884000000006, "b": 127.73077, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "ure 5).", "bbox": {"l": 134.765, "t": 130.88878999999997, "r": 163.56389, "b": 139.68579, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "reduces significantly the column drift seen in the HTML based models (see Figure 5)."}, {"label": "section_header", "id": 2, "page_no": 7, "cluster": {"id": 2, "label": "section_header", "bbox": {"l": 134.765, "t": 161.55682000000002, "r": 319.34708, "b": 170.36377000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9549514651298523, "cells": [{"id": 5, "text": "4.3", "bbox": {"l": 134.765, "t": 161.55682000000002, "r": 149.40205, "b": 170.36377000000005, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Error-detection and -mitigation", "bbox": {"l": 160.85904, "t": 161.55682000000002, "r": 319.34708, "b": 170.36377000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4.3 Error-detection and -mitigation"}, {"label": "text", "id": 0, "page_no": 7, "cluster": {"id": 0, "label": "text", "bbox": {"l": 134.765, "t": 182.28179999999998, "r": 480.5957599999999, "b": 298.67584, "coord_origin": "TOPLEFT"}, "confidence": 0.9879790544509888, "cells": [{"id": 7, "text": "The design of OTSL allows to validate a table structure easily on an unfinished", "bbox": {"l": 134.765, "t": 182.28179999999998, "r": 480.59572999999995, "b": 191.0788, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "sequence. The detection of an invalid sequence token is a clear indication of a", "bbox": {"l": 134.765, "t": 194.23779000000002, "r": 480.59473, "b": 203.03479000000004, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "prediction mistake, however a valid sequence by itself does not guarantee pre-", "bbox": {"l": 134.765, "t": 206.19281, "r": 480.58678999999995, "b": 214.98981000000003, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "diction correctness. Different heuristics can be used to correct token errors in", "bbox": {"l": 134.765, "t": 218.14783, "r": 480.59177000000005, "b": 226.94482000000005, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "an invalid sequence and thus increase the chances for accurate predictions. Such", "bbox": {"l": 134.765, "t": 230.10284000000001, "r": 480.58768, "b": 238.89984000000004, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "heuristics can be applied either after the prediction of each token, or at the end", "bbox": {"l": 134.765, "t": 242.05786, "r": 480.5867, "b": 250.85486000000003, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "on the entire predicted sequence. For example a simple heuristic which can cor-", "bbox": {"l": 134.765, "t": 254.01288, "r": 480.5938100000001, "b": 262.80988, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "rect the predicted OTSL sequence on-the-fly is to verify if the token with the", "bbox": {"l": 134.765, "t": 265.96887000000004, "r": 480.59069999999997, "b": 274.76586999999995, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "highest prediction confidence invalidates the predicted sequence, and replace it", "bbox": {"l": 134.765, "t": 277.92389000000003, "r": 480.5957599999999, "b": 286.72086, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "by the token with the next highest confidence until OTSL rules are satisfied.", "bbox": {"l": 134.765, "t": 289.8788799999999, "r": 469.40369, "b": 298.67584, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The design of OTSL allows to validate a table structure easily on an unfinished sequence. The detection of an invalid sequence token is a clear indication of a prediction mistake, however a valid sequence by itself does not guarantee prediction correctness. Different heuristics can be used to correct token errors in an invalid sequence and thus increase the chances for accurate predictions. Such heuristics can be applied either after the prediction of each token, or at the end on the entire predicted sequence. For example a simple heuristic which can correct the predicted OTSL sequence on-the-fly is to verify if the token with the highest prediction confidence invalidates the predicted sequence, and replace it by the token with the next highest confidence until OTSL rules are satisfied."}, {"label": "section_header", "id": 3, "page_no": 7, "cluster": {"id": 3, "label": "section_header", "bbox": {"l": 134.765, "t": 321.164, "r": 229.03534, "b": 331.73239000000007, "coord_origin": "TOPLEFT"}, "confidence": 0.95152747631073, "cells": [{"id": 17, "text": "5", "bbox": {"l": 134.765, "t": 321.164, "r": 141.4886, "b": 331.73239000000007, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Experiments", "bbox": {"l": 154.9382, "t": 321.164, "r": 229.03534, "b": 331.73239000000007, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5 Experiments"}, {"label": "text", "id": 1, "page_no": 7, "cluster": {"id": 1, "label": "text", "bbox": {"l": 134.765, "t": 347.24985, "r": 480.59528, "b": 451.6877099999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9877985119819641, "cells": [{"id": 19, "text": "To evaluate the impact of OTSL on prediction accuracy and inference times, we", "bbox": {"l": 134.765, "t": 347.24985, "r": 480.59375, "b": 356.04681, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "conducted a series of experiments based on the TableFormer model (Figure 4)", "bbox": {"l": 134.765, "t": 359.2048300000001, "r": 480.59476, "b": 368.0018, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "with two objectives: Firstly we evaluate the prediction quality and performance", "bbox": {"l": 134.765, "t": 371.15982, "r": 480.58786000000003, "b": 379.95679, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "of OTSL vs. HTML after performing Hyper Parameter Optimization (HPO) on", "bbox": {"l": 134.765, "t": 383.11481000000003, "r": 480.58777, "b": 391.91177, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "the", "bbox": {"l": 134.765, "t": 395.06978999999995, "r": 148.59807, "b": 403.86676, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "canonical", "bbox": {"l": 151.627, "t": 395.06978999999995, "r": 191.84703, "b": 403.86676, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "PubTabNet data set. Secondly we pick the best hyper-parameters", "bbox": {"l": 195.90201, "t": 395.06978999999995, "r": 480.59528, "b": 403.86676, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "found in the first step and evaluate how OTSL impacts the performance of", "bbox": {"l": 134.76501, "t": 407.02478, "r": 480.59283000000005, "b": 415.82175, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "TableFormer after training on other publicly available data sets (FinTabNet,", "bbox": {"l": 134.76501, "t": 418.98077, "r": 480.59476, "b": 427.77774, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "PubTables-1M [14]). The ground truth (GT) from all data sets has been con-", "bbox": {"l": 134.76501, "t": 430.93576, "r": 480.59171, "b": 439.73273, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "verted into OTSL format for this purpose, and will be made publicly available.", "bbox": {"l": 134.76501, "t": 442.8907500000001, "r": 479.30258, "b": 451.6877099999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "To evaluate the impact of OTSL on prediction accuracy and inference times, we conducted a series of experiments based on the TableFormer model (Figure 4) with two objectives: Firstly we evaluate the prediction quality and performance of OTSL vs. HTML after performing Hyper Parameter Optimization (HPO) on the canonical PubTabNet data set. Secondly we pick the best hyper-parameters found in the first step and evaluate how OTSL impacts the performance of TableFormer after training on other publicly available data sets (FinTabNet, PubTables-1M [14]). The ground truth (GT) from all data sets has been converted into OTSL format for this purpose, and will be made publicly available."}, {"label": "caption", "id": 7, "page_no": 7, "cluster": {"id": 7, "label": "caption", "bbox": {"l": 134.76501, "t": 484.64813, "r": 480.59082, "b": 503.73965, "coord_origin": "TOPLEFT"}, "confidence": 0.9297956228256226, "cells": [{"id": 30, "text": "Fig. 4.", "bbox": {"l": 134.76501, "t": 484.64813, "r": 162.64424, "b": 492.57443, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Architecture sketch of the TableFormer model, which is a representative for the", "bbox": {"l": 165.19601, "t": 484.71091, "r": 480.59082, "b": 492.78067, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Im2Seq approach.", "bbox": {"l": 134.76501, "t": 495.66989, "r": 206.70245, "b": 503.73965, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Fig. 4. Architecture sketch of the TableFormer model, which is a representative for the Im2Seq approach."}, {"label": "picture", "id": 6, "page_no": 7, "cluster": {"id": 6, "label": "picture", "bbox": {"l": 140.70968627929688, "t": 508.0638427734375, "r": 472.73382568359375, "b": 593.6771850585938, "coord_origin": "TOPLEFT"}, "confidence": 0.9303396344184875, "cells": [{"id": 33, "text": "1.", "bbox": {"l": 147.30025, "t": 540.73164, "r": 149.70605, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Item", "bbox": {"l": 150.90895, "t": 540.73164, "r": 155.72055, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "Amount", "bbox": {"l": 162.75987, "t": 535.3938, "r": 172.2963, "b": 537.76224, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Names", "bbox": {"l": 147.63603, "t": 535.3661500000001, "r": 155.91753, "b": 537.73459, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "1000", "bbox": {"l": 158.48466, "t": 540.73164, "r": 164.10178, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "500", "bbox": {"l": 158.48466, "t": 544.67065, "r": 162.69737, "b": 547.03909, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "3500", "bbox": {"l": 158.48466, "t": 548.91264, "r": 164.10178, "b": 551.28108, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "150", "bbox": {"l": 158.48466, "t": 553.15465, "r": 162.69737, "b": 555.52309, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "unit", "bbox": {"l": 168.81696, "t": 540.73164, "r": 172.88876, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "unit", "bbox": {"l": 168.81696, "t": 544.67065, "r": 172.88876, "b": 547.03909, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "unit", "bbox": {"l": 168.81696, "t": 548.91264, "r": 172.88876, "b": 551.28108, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "unit", "bbox": {"l": 168.81696, "t": 553.15465, "r": 172.88876, "b": 555.52309, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "2.", "bbox": {"l": 147.30025, "t": 544.67065, "r": 149.70605, "b": 547.03909, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "Item", "bbox": {"l": 150.90895, "t": 544.67065, "r": 155.72055, "b": 547.03909, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "3.", "bbox": {"l": 147.30025, "t": 548.91264, "r": 149.70605, "b": 551.28108, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Item", "bbox": {"l": 150.90895, "t": 548.91264, "r": 155.72055, "b": 551.28108, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "4.", "bbox": {"l": 147.30025, "t": 553.15465, "r": 149.70605, "b": 555.52309, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Item", "bbox": {"l": 150.90895, "t": 553.15465, "r": 155.72055, "b": 555.52309, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Extracted", "bbox": {"l": 152.05046, "t": 517.0098, "r": 171.24945, "b": 521.27298, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Table Images", "bbox": {"l": 148.13347, "t": 522.3122900000001, "r": 175.16759, "b": 526.57547, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Standardized", "bbox": {"l": 193.53331, "t": 524.51422, "r": 220.31973, "b": 528.7774, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "Images", "bbox": {"l": 199.47311, "t": 529.8167100000001, "r": 214.37889, "b": 534.0799, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "BBox", "bbox": {"l": 273.61066, "t": 509.9053, "r": 284.47275, "b": 514.16849, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Decoder", "bbox": {"l": 270.45187, "t": 513.6928399999999, "r": 287.63242, "b": 517.9560200000001, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "BBoxes", "bbox": {"l": 332.47852, "t": 508.14438, "r": 348.14014, "b": 512.40756, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "BBoxes can be", "bbox": {"l": 376.68622, "t": 521.12024, "r": 407.25497, "b": 525.38342, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "traced back to the", "bbox": {"l": 373.90869, "t": 525.66525, "r": 410.03506, "b": 529.92844, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "original image to", "bbox": {"l": 375.29871, "t": 530.21024, "r": 408.64902, "b": 534.47342, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "extract content", "bbox": {"l": 377.06747, "t": 534.75522, "r": 406.88312, "b": 539.01843, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "Structure Tags sequence", "bbox": {"l": 383.56683, "t": 563.24176, "r": 433.76544, "b": 567.50497, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "provide full description of", "bbox": {"l": 383.52768, "t": 567.78676, "r": 433.80764999999997, "b": 572.04997, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "the table structure", "bbox": {"l": 390.47522, "t": 572.33177, "r": 426.85703, "b": 576.59499, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "Structure Tags", "bbox": {"l": 293.94702, "t": 577.89143, "r": 323.1691, "b": 582.15465, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "in OTSL format", "bbox": {"l": 293.94702, "t": 582.43648, "r": 324.59396, "b": 586.69969, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "BBoxes in sync", "bbox": {"l": 333.07819, "t": 541.82269, "r": 364.14691, "b": 546.08591, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "with tag sequence", "bbox": {"l": 333.07819, "t": 545.6102, "r": 369.71542, "b": 549.87341, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "Encoder", "bbox": {"l": 232.65881000000002, "t": 515.24139, "r": 249.58894000000004, "b": 519.50458, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "Structure", "bbox": {"l": 269.8219, "t": 545.97102, "r": 288.26279, "b": 550.23424, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Decoder", "bbox": {"l": 270.45187, "t": 549.75851, "r": 287.63242, "b": 554.0217299999999, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "[x1, y2, x2, y2]", "bbox": {"l": 332.17676, "t": 515.91205, "r": 358.11206, "b": 520.17523, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "[x1', y2', x2', y2']", "bbox": {"l": 332.17676, "t": 521.9720500000001, "r": 361.58298, "b": 526.23523, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "[x1'', y2'', x2'', y2'']", "bbox": {"l": 332.17676, "t": 528.03204, "r": 364.76474, "b": 532.29523, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "...", "bbox": {"l": 332.17676, "t": 534.09204, "r": 335.96548, "b": 538.35524, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "1", "bbox": {"l": 326.8894, "t": 516.39508, "r": 329.41641, "b": 520.6582599999999, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "2", "bbox": {"l": 327.04089, "t": 522.4247700000001, "r": 329.5679, "b": 526.68796, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "3", "bbox": {"l": 327.04089, "t": 528.51508, "r": 329.5679, "b": 532.77826, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "3", "bbox": {"l": 424.14102, "t": 527.4428399999999, "r": 426.66803, "b": 531.7060200000001, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "2", "bbox": {"l": 453.0018, "t": 517.4539500000001, "r": 455.52881, "b": 521.71713, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "1", "bbox": {"l": 423.85825, "t": 517.06281, "r": 426.38525, "b": 521.32599, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "C", "bbox": {"l": 333.4342, "t": 557.36679, "r": 337.27542, "b": 562.35719, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "C", "bbox": {"l": 340.35397, "t": 557.31679, "r": 344.19519, "b": 562.30719, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "C", "bbox": {"l": 340.30978, "t": 563.8653899999999, "r": 344.151, "b": 568.8557900000001, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "C", "bbox": {"l": 346.79904, "t": 563.8686700000001, "r": 350.64026, "b": 568.85907, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "C", "bbox": {"l": 333.59583, "t": 563.82271, "r": 337.43704, "b": 568.81311, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "C", "bbox": {"l": 340.37543, "t": 570.42673, "r": 344.21664, "b": 575.41713, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "C", "bbox": {"l": 346.86469, "t": 570.43001, "r": 350.7059, "b": 575.42041, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "C", "bbox": {"l": 333.66144, "t": 570.38405, "r": 337.50266, "b": 575.37445, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "C", "bbox": {"l": 340.37671, "t": 577.02606, "r": 344.21793, "b": 582.0164599999999, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "C", "bbox": {"l": 346.86597, "t": 577.02934, "r": 350.70718, "b": 582.01974, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "C", "bbox": {"l": 333.66272, "t": 576.98338, "r": 337.50394, "b": 581.97379, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "C", "bbox": {"l": 340.27948, "t": 583.39737, "r": 344.1207, "b": 588.38777, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "C", "bbox": {"l": 346.76874, "t": 583.40068, "r": 350.60995, "b": 588.39108, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "C", "bbox": {"l": 333.56549, "t": 583.35474, "r": 337.40671, "b": 588.34514, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "NL", "bbox": {"l": 353.03326, "t": 556.8831299999999, "r": 359.83362, "b": 561.87354, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "NL", "bbox": {"l": 353.18604, "t": 563.58044, "r": 359.98639, "b": 568.57085, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "NL", "bbox": {"l": 353.19864, "t": 570.1623500000001, "r": 359.99899, "b": 575.15276, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "NL", "bbox": {"l": 353.1532, "t": 576.76611, "r": 359.95355, "b": 581.75652, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "NL", "bbox": {"l": 353.26935, "t": 583.40628, "r": 360.0697, "b": 588.3966800000001, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "L", "bbox": {"l": 347.37979, "t": 557.08235, "r": 350.33786, "b": 562.07275, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "3", "bbox": {"l": 331.14026, "t": 564.2907700000001, "r": 333.66727, "b": 568.55399, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "2", "bbox": {"l": 340.80972, "t": 554.59312, "r": 343.33673, "b": 558.85634, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "1", "bbox": {"l": 330.97992, "t": 554.83035, "r": 333.50693, "b": 559.09357, "coord_origin": "TOPLEFT"}}], "children": [{"id": 10, "label": "text", "bbox": {"l": 147.30025, "t": 540.73164, "r": 149.70605, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "1.", "bbox": {"l": 147.30025, "t": 540.73164, "r": 149.70605, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 150.90895, "t": 540.73164, "r": 155.72055, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "Item", "bbox": {"l": 150.90895, "t": 540.73164, "r": 155.72055, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 162.75987, "t": 535.3938, "r": 172.2963, "b": 537.76224, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "Amount", "bbox": {"l": 162.75987, "t": 535.3938, "r": 172.2963, "b": 537.76224, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 147.63603, "t": 535.3661500000001, "r": 155.91753, "b": 537.73459, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "Names", "bbox": {"l": 147.63603, "t": 535.3661500000001, "r": 155.91753, "b": 537.73459, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 158.48466, "t": 540.73164, "r": 164.10178, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "1000", "bbox": {"l": 158.48466, "t": 540.73164, "r": 164.10178, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 158.48466, "t": 544.67065, "r": 162.69737, "b": 547.03909, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "500", "bbox": {"l": 158.48466, "t": 544.67065, "r": 162.69737, "b": 547.03909, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 158.48466, "t": 548.91264, "r": 164.10178, "b": 551.28108, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "3500", "bbox": {"l": 158.48466, "t": 548.91264, "r": 164.10178, "b": 551.28108, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 158.48466, "t": 553.15465, "r": 162.69737, "b": 555.52309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "150", "bbox": {"l": 158.48466, "t": 553.15465, "r": 162.69737, "b": 555.52309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 168.81696, "t": 540.73164, "r": 172.88876, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "unit", "bbox": {"l": 168.81696, "t": 540.73164, "r": 172.88876, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 168.81696, "t": 544.67065, "r": 172.88876, "b": 547.03909, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "unit", "bbox": {"l": 168.81696, "t": 544.67065, "r": 172.88876, "b": 547.03909, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 168.81696, "t": 548.91264, "r": 172.88876, "b": 551.28108, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "unit", "bbox": {"l": 168.81696, "t": 548.91264, "r": 172.88876, "b": 551.28108, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 168.81696, "t": 553.15465, "r": 172.88876, "b": 555.52309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "unit", "bbox": {"l": 168.81696, "t": 553.15465, "r": 172.88876, "b": 555.52309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 147.30025, "t": 544.67065, "r": 149.70605, "b": 547.03909, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "2.", "bbox": {"l": 147.30025, "t": 544.67065, "r": 149.70605, "b": 547.03909, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 150.90895, "t": 544.67065, "r": 155.72055, "b": 547.03909, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "Item", "bbox": {"l": 150.90895, "t": 544.67065, "r": 155.72055, "b": 547.03909, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 147.30025, "t": 548.91264, "r": 149.70605, "b": 551.28108, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "3.", "bbox": {"l": 147.30025, "t": 548.91264, "r": 149.70605, "b": 551.28108, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 150.90895, "t": 548.91264, "r": 155.72055, "b": 551.28108, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "Item", "bbox": {"l": 150.90895, "t": 548.91264, "r": 155.72055, "b": 551.28108, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 147.30025, "t": 553.15465, "r": 149.70605, "b": 555.52309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "4.", "bbox": {"l": 147.30025, "t": 553.15465, "r": 149.70605, "b": 555.52309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 150.90895, "t": 553.15465, "r": 155.72055, "b": 555.52309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "Item", "bbox": {"l": 150.90895, "t": 553.15465, "r": 155.72055, "b": 555.52309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 152.05046, "t": 517.0098, "r": 171.24945, "b": 521.27298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "Extracted", "bbox": {"l": 152.05046, "t": 517.0098, "r": 171.24945, "b": 521.27298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 148.13347, "t": 522.3122900000001, "r": 175.16759, "b": 526.57547, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "Table Images", "bbox": {"l": 148.13347, "t": 522.3122900000001, "r": 175.16759, "b": 526.57547, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 193.53331, "t": 524.51422, "r": 220.31973, "b": 528.7774, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "Standardized", "bbox": {"l": 193.53331, "t": 524.51422, "r": 220.31973, "b": 528.7774, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 199.47311, "t": 529.8167100000001, "r": 214.37889, "b": 534.0799, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "Images", "bbox": {"l": 199.47311, "t": 529.8167100000001, "r": 214.37889, "b": 534.0799, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 273.61066, "t": 509.9053, "r": 284.47275, "b": 514.16849, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "BBox", "bbox": {"l": 273.61066, "t": 509.9053, "r": 284.47275, "b": 514.16849, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 270.45187, "t": 513.6928399999999, "r": 287.63242, "b": 517.9560200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "Decoder", "bbox": {"l": 270.45187, "t": 513.6928399999999, "r": 287.63242, "b": 517.9560200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 332.47852, "t": 508.14438, "r": 348.14014, "b": 512.40756, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "BBoxes", "bbox": {"l": 332.47852, "t": 508.14438, "r": 348.14014, "b": 512.40756, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 376.68622, "t": 521.12024, "r": 407.25497, "b": 525.38342, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "BBoxes can be", "bbox": {"l": 376.68622, "t": 521.12024, "r": 407.25497, "b": 525.38342, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 373.90869, "t": 525.66525, "r": 410.03506, "b": 529.92844, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "traced back to the", "bbox": {"l": 373.90869, "t": 525.66525, "r": 410.03506, "b": 529.92844, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 375.29871, "t": 530.21024, "r": 408.64902, "b": 534.47342, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "original image to", "bbox": {"l": 375.29871, "t": 530.21024, "r": 408.64902, "b": 534.47342, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 377.06747, "t": 534.75522, "r": 406.88312, "b": 539.01843, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "extract content", "bbox": {"l": 377.06747, "t": 534.75522, "r": 406.88312, "b": 539.01843, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 383.56683, "t": 563.24176, "r": 433.76544, "b": 567.50497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "Structure Tags sequence", "bbox": {"l": 383.56683, "t": 563.24176, "r": 433.76544, "b": 567.50497, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 383.52768, "t": 567.78676, "r": 433.80764999999997, "b": 572.04997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "provide full description of", "bbox": {"l": 383.52768, "t": 567.78676, "r": 433.80764999999997, "b": 572.04997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 390.47522, "t": 572.33177, "r": 426.85703, "b": 576.59499, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "the table structure", "bbox": {"l": 390.47522, "t": 572.33177, "r": 426.85703, "b": 576.59499, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 293.94702, "t": 577.89143, "r": 323.1691, "b": 582.15465, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "Structure Tags", "bbox": {"l": 293.94702, "t": 577.89143, "r": 323.1691, "b": 582.15465, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 293.94702, "t": 582.43648, "r": 324.59396, "b": 586.69969, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "in OTSL format", "bbox": {"l": 293.94702, "t": 582.43648, "r": 324.59396, "b": 586.69969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 333.07819, "t": 541.82269, "r": 364.14691, "b": 546.08591, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "BBoxes in sync", "bbox": {"l": 333.07819, "t": 541.82269, "r": 364.14691, "b": 546.08591, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 333.07819, "t": 545.6102, "r": 369.71542, "b": 549.87341, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "with tag sequence", "bbox": {"l": 333.07819, "t": 545.6102, "r": 369.71542, "b": 549.87341, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 232.65881000000002, "t": 515.24139, "r": 249.58894000000004, "b": 519.50458, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "Encoder", "bbox": {"l": 232.65881000000002, "t": 515.24139, "r": 249.58894000000004, "b": 519.50458, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 269.8219, "t": 545.97102, "r": 288.26279, "b": 550.23424, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "Structure", "bbox": {"l": 269.8219, "t": 545.97102, "r": 288.26279, "b": 550.23424, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 270.45187, "t": 549.75851, "r": 287.63242, "b": 554.0217299999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "Decoder", "bbox": {"l": 270.45187, "t": 549.75851, "r": 287.63242, "b": 554.0217299999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 332.17676, "t": 515.91205, "r": 358.11206, "b": 520.17523, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "[x1, y2, x2, y2]", "bbox": {"l": 332.17676, "t": 515.91205, "r": 358.11206, "b": 520.17523, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 332.17676, "t": 521.9720500000001, "r": 361.58298, "b": 526.23523, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "[x1', y2', x2', y2']", "bbox": {"l": 332.17676, "t": 521.9720500000001, "r": 361.58298, "b": 526.23523, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 332.17676, "t": 528.03204, "r": 364.76474, "b": 532.29523, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "[x1'', y2'', x2'', y2'']", "bbox": {"l": 332.17676, "t": 528.03204, "r": 364.76474, "b": 532.29523, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 332.17676, "t": 534.09204, "r": 335.96548, "b": 538.35524, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "...", "bbox": {"l": 332.17676, "t": 534.09204, "r": 335.96548, "b": 538.35524, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 326.8894, "t": 516.39508, "r": 329.41641, "b": 520.6582599999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "1", "bbox": {"l": 326.8894, "t": 516.39508, "r": 329.41641, "b": 520.6582599999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 327.04089, "t": 522.4247700000001, "r": 329.5679, "b": 526.68796, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "2", "bbox": {"l": 327.04089, "t": 522.4247700000001, "r": 329.5679, "b": 526.68796, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 327.04089, "t": 528.51508, "r": 329.5679, "b": 532.77826, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "3", "bbox": {"l": 327.04089, "t": 528.51508, "r": 329.5679, "b": 532.77826, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 424.14102, "t": 527.4428399999999, "r": 426.66803, "b": 531.7060200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "3", "bbox": {"l": 424.14102, "t": 527.4428399999999, "r": 426.66803, "b": 531.7060200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 453.0018, "t": 517.4539500000001, "r": 455.52881, "b": 521.71713, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "2", "bbox": {"l": 453.0018, "t": 517.4539500000001, "r": 455.52881, "b": 521.71713, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 423.85825, "t": 517.06281, "r": 426.38525, "b": 521.32599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "1", "bbox": {"l": 423.85825, "t": 517.06281, "r": 426.38525, "b": 521.32599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 333.4342, "t": 557.36679, "r": 337.27542, "b": 562.35719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "C", "bbox": {"l": 333.4342, "t": 557.36679, "r": 337.27542, "b": 562.35719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 340.35397, "t": 557.31679, "r": 344.19519, "b": 562.30719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "C", "bbox": {"l": 340.35397, "t": 557.31679, "r": 344.19519, "b": 562.30719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 340.30978, "t": 563.8653899999999, "r": 344.151, "b": 568.8557900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "C", "bbox": {"l": 340.30978, "t": 563.8653899999999, "r": 344.151, "b": 568.8557900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 346.79904, "t": 563.8686700000001, "r": 350.64026, "b": 568.85907, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "C", "bbox": {"l": 346.79904, "t": 563.8686700000001, "r": 350.64026, "b": 568.85907, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 333.59583, "t": 563.82271, "r": 337.43704, "b": 568.81311, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "C", "bbox": {"l": 333.59583, "t": 563.82271, "r": 337.43704, "b": 568.81311, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 340.37543, "t": 570.42673, "r": 344.21664, "b": 575.41713, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "C", "bbox": {"l": 340.37543, "t": 570.42673, "r": 344.21664, "b": 575.41713, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 346.86469, "t": 570.43001, "r": 350.7059, "b": 575.42041, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "C", "bbox": {"l": 346.86469, "t": 570.43001, "r": 350.7059, "b": 575.42041, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 333.66144, "t": 570.38405, "r": 337.50266, "b": 575.37445, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "C", "bbox": {"l": 333.66144, "t": 570.38405, "r": 337.50266, "b": 575.37445, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 340.37671, "t": 577.02606, "r": 344.21793, "b": 582.0164599999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "C", "bbox": {"l": 340.37671, "t": 577.02606, "r": 344.21793, "b": 582.0164599999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 346.86597, "t": 577.02934, "r": 350.70718, "b": 582.01974, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "C", "bbox": {"l": 346.86597, "t": 577.02934, "r": 350.70718, "b": 582.01974, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 333.66272, "t": 576.98338, "r": 337.50394, "b": 581.97379, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "C", "bbox": {"l": 333.66272, "t": 576.98338, "r": 337.50394, "b": 581.97379, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 340.27948, "t": 583.39737, "r": 344.1207, "b": 588.38777, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "C", "bbox": {"l": 340.27948, "t": 583.39737, "r": 344.1207, "b": 588.38777, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 346.76874, "t": 583.40068, "r": 350.60995, "b": 588.39108, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "C", "bbox": {"l": 346.76874, "t": 583.40068, "r": 350.60995, "b": 588.39108, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 333.56549, "t": 583.35474, "r": 337.40671, "b": 588.34514, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "C", "bbox": {"l": 333.56549, "t": 583.35474, "r": 337.40671, "b": 588.34514, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 353.03326, "t": 556.8831299999999, "r": 359.83362, "b": 561.87354, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "NL", "bbox": {"l": 353.03326, "t": 556.8831299999999, "r": 359.83362, "b": 561.87354, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 353.18604, "t": 563.58044, "r": 359.98639, "b": 568.57085, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "NL", "bbox": {"l": 353.18604, "t": 563.58044, "r": 359.98639, "b": 568.57085, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 353.19864, "t": 570.1623500000001, "r": 359.99899, "b": 575.15276, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "NL", "bbox": {"l": 353.19864, "t": 570.1623500000001, "r": 359.99899, "b": 575.15276, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 353.1532, "t": 576.76611, "r": 359.95355, "b": 581.75652, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "NL", "bbox": {"l": 353.1532, "t": 576.76611, "r": 359.95355, "b": 581.75652, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 353.26935, "t": 583.40628, "r": 360.0697, "b": 588.3966800000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "NL", "bbox": {"l": 353.26935, "t": 583.40628, "r": 360.0697, "b": 588.3966800000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 347.37979, "t": 557.08235, "r": 350.33786, "b": 562.07275, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "L", "bbox": {"l": 347.37979, "t": 557.08235, "r": 350.33786, "b": 562.07275, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 331.14026, "t": 564.2907700000001, "r": 333.66727, "b": 568.55399, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "3", "bbox": {"l": 331.14026, "t": 564.2907700000001, "r": 333.66727, "b": 568.55399, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 340.80972, "t": 554.59312, "r": 343.33673, "b": 558.85634, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": "2", "bbox": {"l": 340.80972, "t": 554.59312, "r": 343.33673, "b": 558.85634, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 330.97992, "t": 554.83035, "r": 333.50693, "b": 559.09357, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "1", "bbox": {"l": 330.97992, "t": 554.83035, "r": 333.50693, "b": 559.09357, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "text", "id": 4, "page_no": 7, "cluster": {"id": 4, "label": "text", "bbox": {"l": 134.765, "t": 620.19278, "r": 480.5917400000001, "b": 664.8547599999999, "coord_origin": "TOPLEFT"}, "confidence": 0.951270341873169, "cells": [{"id": 105, "text": "We rely on standard metrics such as Tree Edit Distance score (TEDs) for", "bbox": {"l": 149.709, "t": 620.19278, "r": 480.58792, "b": 628.98975, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "table structure prediction, and Mean Average Precision (mAP) with 0.75 Inter-", "bbox": {"l": 134.765, "t": 632.14778, "r": 480.58871, "b": 640.94475, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "section Over Union (IOU) threshold for the bounding-box predictions of table", "bbox": {"l": 134.765, "t": 644.1027799999999, "r": 480.5917400000001, "b": 652.89975, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "cells. The predicted OTSL structures were converted back to HTML format in", "bbox": {"l": 134.765, "t": 656.0577900000001, "r": 480.58968999999996, "b": 664.8547599999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "We rely on standard metrics such as Tree Edit Distance score (TEDs) for table structure prediction, and Mean Average Precision (mAP) with 0.75 Intersection Over Union (IOU) threshold for the bounding-box predictions of table cells. The predicted OTSL structures were converted back to HTML format in"}], "body": [{"label": "text", "id": 5, "page_no": 7, "cluster": {"id": 5, "label": "text", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.58884000000006, "b": 139.68579, "coord_origin": "TOPLEFT"}, "confidence": 0.9464744925498962, "cells": [{"id": 3, "text": "reduces significantly the column drift seen in the HTML based models (see Fig-", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.58884000000006, "b": 127.73077, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "ure 5).", "bbox": {"l": 134.765, "t": 130.88878999999997, "r": 163.56389, "b": 139.68579, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "reduces significantly the column drift seen in the HTML based models (see Figure 5)."}, {"label": "section_header", "id": 2, "page_no": 7, "cluster": {"id": 2, "label": "section_header", "bbox": {"l": 134.765, "t": 161.55682000000002, "r": 319.34708, "b": 170.36377000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9549514651298523, "cells": [{"id": 5, "text": "4.3", "bbox": {"l": 134.765, "t": 161.55682000000002, "r": 149.40205, "b": 170.36377000000005, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Error-detection and -mitigation", "bbox": {"l": 160.85904, "t": 161.55682000000002, "r": 319.34708, "b": 170.36377000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4.3 Error-detection and -mitigation"}, {"label": "text", "id": 0, "page_no": 7, "cluster": {"id": 0, "label": "text", "bbox": {"l": 134.765, "t": 182.28179999999998, "r": 480.5957599999999, "b": 298.67584, "coord_origin": "TOPLEFT"}, "confidence": 0.9879790544509888, "cells": [{"id": 7, "text": "The design of OTSL allows to validate a table structure easily on an unfinished", "bbox": {"l": 134.765, "t": 182.28179999999998, "r": 480.59572999999995, "b": 191.0788, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "sequence. The detection of an invalid sequence token is a clear indication of a", "bbox": {"l": 134.765, "t": 194.23779000000002, "r": 480.59473, "b": 203.03479000000004, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "prediction mistake, however a valid sequence by itself does not guarantee pre-", "bbox": {"l": 134.765, "t": 206.19281, "r": 480.58678999999995, "b": 214.98981000000003, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "diction correctness. Different heuristics can be used to correct token errors in", "bbox": {"l": 134.765, "t": 218.14783, "r": 480.59177000000005, "b": 226.94482000000005, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "an invalid sequence and thus increase the chances for accurate predictions. Such", "bbox": {"l": 134.765, "t": 230.10284000000001, "r": 480.58768, "b": 238.89984000000004, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "heuristics can be applied either after the prediction of each token, or at the end", "bbox": {"l": 134.765, "t": 242.05786, "r": 480.5867, "b": 250.85486000000003, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "on the entire predicted sequence. For example a simple heuristic which can cor-", "bbox": {"l": 134.765, "t": 254.01288, "r": 480.5938100000001, "b": 262.80988, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "rect the predicted OTSL sequence on-the-fly is to verify if the token with the", "bbox": {"l": 134.765, "t": 265.96887000000004, "r": 480.59069999999997, "b": 274.76586999999995, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "highest prediction confidence invalidates the predicted sequence, and replace it", "bbox": {"l": 134.765, "t": 277.92389000000003, "r": 480.5957599999999, "b": 286.72086, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "by the token with the next highest confidence until OTSL rules are satisfied.", "bbox": {"l": 134.765, "t": 289.8788799999999, "r": 469.40369, "b": 298.67584, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The design of OTSL allows to validate a table structure easily on an unfinished sequence. The detection of an invalid sequence token is a clear indication of a prediction mistake, however a valid sequence by itself does not guarantee prediction correctness. Different heuristics can be used to correct token errors in an invalid sequence and thus increase the chances for accurate predictions. Such heuristics can be applied either after the prediction of each token, or at the end on the entire predicted sequence. For example a simple heuristic which can correct the predicted OTSL sequence on-the-fly is to verify if the token with the highest prediction confidence invalidates the predicted sequence, and replace it by the token with the next highest confidence until OTSL rules are satisfied."}, {"label": "section_header", "id": 3, "page_no": 7, "cluster": {"id": 3, "label": "section_header", "bbox": {"l": 134.765, "t": 321.164, "r": 229.03534, "b": 331.73239000000007, "coord_origin": "TOPLEFT"}, "confidence": 0.95152747631073, "cells": [{"id": 17, "text": "5", "bbox": {"l": 134.765, "t": 321.164, "r": 141.4886, "b": 331.73239000000007, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Experiments", "bbox": {"l": 154.9382, "t": 321.164, "r": 229.03534, "b": 331.73239000000007, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5 Experiments"}, {"label": "text", "id": 1, "page_no": 7, "cluster": {"id": 1, "label": "text", "bbox": {"l": 134.765, "t": 347.24985, "r": 480.59528, "b": 451.6877099999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9877985119819641, "cells": [{"id": 19, "text": "To evaluate the impact of OTSL on prediction accuracy and inference times, we", "bbox": {"l": 134.765, "t": 347.24985, "r": 480.59375, "b": 356.04681, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "conducted a series of experiments based on the TableFormer model (Figure 4)", "bbox": {"l": 134.765, "t": 359.2048300000001, "r": 480.59476, "b": 368.0018, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "with two objectives: Firstly we evaluate the prediction quality and performance", "bbox": {"l": 134.765, "t": 371.15982, "r": 480.58786000000003, "b": 379.95679, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "of OTSL vs. HTML after performing Hyper Parameter Optimization (HPO) on", "bbox": {"l": 134.765, "t": 383.11481000000003, "r": 480.58777, "b": 391.91177, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "the", "bbox": {"l": 134.765, "t": 395.06978999999995, "r": 148.59807, "b": 403.86676, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "canonical", "bbox": {"l": 151.627, "t": 395.06978999999995, "r": 191.84703, "b": 403.86676, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "PubTabNet data set. Secondly we pick the best hyper-parameters", "bbox": {"l": 195.90201, "t": 395.06978999999995, "r": 480.59528, "b": 403.86676, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "found in the first step and evaluate how OTSL impacts the performance of", "bbox": {"l": 134.76501, "t": 407.02478, "r": 480.59283000000005, "b": 415.82175, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "TableFormer after training on other publicly available data sets (FinTabNet,", "bbox": {"l": 134.76501, "t": 418.98077, "r": 480.59476, "b": 427.77774, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "PubTables-1M [14]). The ground truth (GT) from all data sets has been con-", "bbox": {"l": 134.76501, "t": 430.93576, "r": 480.59171, "b": 439.73273, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "verted into OTSL format for this purpose, and will be made publicly available.", "bbox": {"l": 134.76501, "t": 442.8907500000001, "r": 479.30258, "b": 451.6877099999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "To evaluate the impact of OTSL on prediction accuracy and inference times, we conducted a series of experiments based on the TableFormer model (Figure 4) with two objectives: Firstly we evaluate the prediction quality and performance of OTSL vs. HTML after performing Hyper Parameter Optimization (HPO) on the canonical PubTabNet data set. Secondly we pick the best hyper-parameters found in the first step and evaluate how OTSL impacts the performance of TableFormer after training on other publicly available data sets (FinTabNet, PubTables-1M [14]). The ground truth (GT) from all data sets has been converted into OTSL format for this purpose, and will be made publicly available."}, {"label": "caption", "id": 7, "page_no": 7, "cluster": {"id": 7, "label": "caption", "bbox": {"l": 134.76501, "t": 484.64813, "r": 480.59082, "b": 503.73965, "coord_origin": "TOPLEFT"}, "confidence": 0.9297956228256226, "cells": [{"id": 30, "text": "Fig. 4.", "bbox": {"l": 134.76501, "t": 484.64813, "r": 162.64424, "b": 492.57443, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Architecture sketch of the TableFormer model, which is a representative for the", "bbox": {"l": 165.19601, "t": 484.71091, "r": 480.59082, "b": 492.78067, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Im2Seq approach.", "bbox": {"l": 134.76501, "t": 495.66989, "r": 206.70245, "b": 503.73965, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Fig. 4. Architecture sketch of the TableFormer model, which is a representative for the Im2Seq approach."}, {"label": "picture", "id": 6, "page_no": 7, "cluster": {"id": 6, "label": "picture", "bbox": {"l": 140.70968627929688, "t": 508.0638427734375, "r": 472.73382568359375, "b": 593.6771850585938, "coord_origin": "TOPLEFT"}, "confidence": 0.9303396344184875, "cells": [{"id": 33, "text": "1.", "bbox": {"l": 147.30025, "t": 540.73164, "r": 149.70605, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Item", "bbox": {"l": 150.90895, "t": 540.73164, "r": 155.72055, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "Amount", "bbox": {"l": 162.75987, "t": 535.3938, "r": 172.2963, "b": 537.76224, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Names", "bbox": {"l": 147.63603, "t": 535.3661500000001, "r": 155.91753, "b": 537.73459, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "1000", "bbox": {"l": 158.48466, "t": 540.73164, "r": 164.10178, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "500", "bbox": {"l": 158.48466, "t": 544.67065, "r": 162.69737, "b": 547.03909, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "3500", "bbox": {"l": 158.48466, "t": 548.91264, "r": 164.10178, "b": 551.28108, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "150", "bbox": {"l": 158.48466, "t": 553.15465, "r": 162.69737, "b": 555.52309, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "unit", "bbox": {"l": 168.81696, "t": 540.73164, "r": 172.88876, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "unit", "bbox": {"l": 168.81696, "t": 544.67065, "r": 172.88876, "b": 547.03909, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "unit", "bbox": {"l": 168.81696, "t": 548.91264, "r": 172.88876, "b": 551.28108, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "unit", "bbox": {"l": 168.81696, "t": 553.15465, "r": 172.88876, "b": 555.52309, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "2.", "bbox": {"l": 147.30025, "t": 544.67065, "r": 149.70605, "b": 547.03909, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "Item", "bbox": {"l": 150.90895, "t": 544.67065, "r": 155.72055, "b": 547.03909, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "3.", "bbox": {"l": 147.30025, "t": 548.91264, "r": 149.70605, "b": 551.28108, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Item", "bbox": {"l": 150.90895, "t": 548.91264, "r": 155.72055, "b": 551.28108, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "4.", "bbox": {"l": 147.30025, "t": 553.15465, "r": 149.70605, "b": 555.52309, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Item", "bbox": {"l": 150.90895, "t": 553.15465, "r": 155.72055, "b": 555.52309, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Extracted", "bbox": {"l": 152.05046, "t": 517.0098, "r": 171.24945, "b": 521.27298, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Table Images", "bbox": {"l": 148.13347, "t": 522.3122900000001, "r": 175.16759, "b": 526.57547, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Standardized", "bbox": {"l": 193.53331, "t": 524.51422, "r": 220.31973, "b": 528.7774, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "Images", "bbox": {"l": 199.47311, "t": 529.8167100000001, "r": 214.37889, "b": 534.0799, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "BBox", "bbox": {"l": 273.61066, "t": 509.9053, "r": 284.47275, "b": 514.16849, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Decoder", "bbox": {"l": 270.45187, "t": 513.6928399999999, "r": 287.63242, "b": 517.9560200000001, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "BBoxes", "bbox": {"l": 332.47852, "t": 508.14438, "r": 348.14014, "b": 512.40756, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "BBoxes can be", "bbox": {"l": 376.68622, "t": 521.12024, "r": 407.25497, "b": 525.38342, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "traced back to the", "bbox": {"l": 373.90869, "t": 525.66525, "r": 410.03506, "b": 529.92844, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "original image to", "bbox": {"l": 375.29871, "t": 530.21024, "r": 408.64902, "b": 534.47342, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "extract content", "bbox": {"l": 377.06747, "t": 534.75522, "r": 406.88312, "b": 539.01843, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "Structure Tags sequence", "bbox": {"l": 383.56683, "t": 563.24176, "r": 433.76544, "b": 567.50497, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "provide full description of", "bbox": {"l": 383.52768, "t": 567.78676, "r": 433.80764999999997, "b": 572.04997, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "the table structure", "bbox": {"l": 390.47522, "t": 572.33177, "r": 426.85703, "b": 576.59499, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "Structure Tags", "bbox": {"l": 293.94702, "t": 577.89143, "r": 323.1691, "b": 582.15465, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "in OTSL format", "bbox": {"l": 293.94702, "t": 582.43648, "r": 324.59396, "b": 586.69969, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "BBoxes in sync", "bbox": {"l": 333.07819, "t": 541.82269, "r": 364.14691, "b": 546.08591, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "with tag sequence", "bbox": {"l": 333.07819, "t": 545.6102, "r": 369.71542, "b": 549.87341, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "Encoder", "bbox": {"l": 232.65881000000002, "t": 515.24139, "r": 249.58894000000004, "b": 519.50458, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "Structure", "bbox": {"l": 269.8219, "t": 545.97102, "r": 288.26279, "b": 550.23424, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Decoder", "bbox": {"l": 270.45187, "t": 549.75851, "r": 287.63242, "b": 554.0217299999999, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "[x1, y2, x2, y2]", "bbox": {"l": 332.17676, "t": 515.91205, "r": 358.11206, "b": 520.17523, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "[x1', y2', x2', y2']", "bbox": {"l": 332.17676, "t": 521.9720500000001, "r": 361.58298, "b": 526.23523, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "[x1'', y2'', x2'', y2'']", "bbox": {"l": 332.17676, "t": 528.03204, "r": 364.76474, "b": 532.29523, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "...", "bbox": {"l": 332.17676, "t": 534.09204, "r": 335.96548, "b": 538.35524, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "1", "bbox": {"l": 326.8894, "t": 516.39508, "r": 329.41641, "b": 520.6582599999999, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "2", "bbox": {"l": 327.04089, "t": 522.4247700000001, "r": 329.5679, "b": 526.68796, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "3", "bbox": {"l": 327.04089, "t": 528.51508, "r": 329.5679, "b": 532.77826, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "3", "bbox": {"l": 424.14102, "t": 527.4428399999999, "r": 426.66803, "b": 531.7060200000001, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "2", "bbox": {"l": 453.0018, "t": 517.4539500000001, "r": 455.52881, "b": 521.71713, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "1", "bbox": {"l": 423.85825, "t": 517.06281, "r": 426.38525, "b": 521.32599, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "C", "bbox": {"l": 333.4342, "t": 557.36679, "r": 337.27542, "b": 562.35719, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "C", "bbox": {"l": 340.35397, "t": 557.31679, "r": 344.19519, "b": 562.30719, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "C", "bbox": {"l": 340.30978, "t": 563.8653899999999, "r": 344.151, "b": 568.8557900000001, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "C", "bbox": {"l": 346.79904, "t": 563.8686700000001, "r": 350.64026, "b": 568.85907, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "C", "bbox": {"l": 333.59583, "t": 563.82271, "r": 337.43704, "b": 568.81311, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "C", "bbox": {"l": 340.37543, "t": 570.42673, "r": 344.21664, "b": 575.41713, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "C", "bbox": {"l": 346.86469, "t": 570.43001, "r": 350.7059, "b": 575.42041, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "C", "bbox": {"l": 333.66144, "t": 570.38405, "r": 337.50266, "b": 575.37445, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "C", "bbox": {"l": 340.37671, "t": 577.02606, "r": 344.21793, "b": 582.0164599999999, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "C", "bbox": {"l": 346.86597, "t": 577.02934, "r": 350.70718, "b": 582.01974, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "C", "bbox": {"l": 333.66272, "t": 576.98338, "r": 337.50394, "b": 581.97379, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "C", "bbox": {"l": 340.27948, "t": 583.39737, "r": 344.1207, "b": 588.38777, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "C", "bbox": {"l": 346.76874, "t": 583.40068, "r": 350.60995, "b": 588.39108, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "C", "bbox": {"l": 333.56549, "t": 583.35474, "r": 337.40671, "b": 588.34514, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "NL", "bbox": {"l": 353.03326, "t": 556.8831299999999, "r": 359.83362, "b": 561.87354, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "NL", "bbox": {"l": 353.18604, "t": 563.58044, "r": 359.98639, "b": 568.57085, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "NL", "bbox": {"l": 353.19864, "t": 570.1623500000001, "r": 359.99899, "b": 575.15276, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "NL", "bbox": {"l": 353.1532, "t": 576.76611, "r": 359.95355, "b": 581.75652, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "NL", "bbox": {"l": 353.26935, "t": 583.40628, "r": 360.0697, "b": 588.3966800000001, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "L", "bbox": {"l": 347.37979, "t": 557.08235, "r": 350.33786, "b": 562.07275, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "3", "bbox": {"l": 331.14026, "t": 564.2907700000001, "r": 333.66727, "b": 568.55399, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "2", "bbox": {"l": 340.80972, "t": 554.59312, "r": 343.33673, "b": 558.85634, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "1", "bbox": {"l": 330.97992, "t": 554.83035, "r": 333.50693, "b": 559.09357, "coord_origin": "TOPLEFT"}}], "children": [{"id": 10, "label": "text", "bbox": {"l": 147.30025, "t": 540.73164, "r": 149.70605, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "1.", "bbox": {"l": 147.30025, "t": 540.73164, "r": 149.70605, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 150.90895, "t": 540.73164, "r": 155.72055, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "Item", "bbox": {"l": 150.90895, "t": 540.73164, "r": 155.72055, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 162.75987, "t": 535.3938, "r": 172.2963, "b": 537.76224, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "Amount", "bbox": {"l": 162.75987, "t": 535.3938, "r": 172.2963, "b": 537.76224, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 147.63603, "t": 535.3661500000001, "r": 155.91753, "b": 537.73459, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "Names", "bbox": {"l": 147.63603, "t": 535.3661500000001, "r": 155.91753, "b": 537.73459, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 158.48466, "t": 540.73164, "r": 164.10178, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "1000", "bbox": {"l": 158.48466, "t": 540.73164, "r": 164.10178, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 158.48466, "t": 544.67065, "r": 162.69737, "b": 547.03909, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "500", "bbox": {"l": 158.48466, "t": 544.67065, "r": 162.69737, "b": 547.03909, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 158.48466, "t": 548.91264, "r": 164.10178, "b": 551.28108, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "3500", "bbox": {"l": 158.48466, "t": 548.91264, "r": 164.10178, "b": 551.28108, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 158.48466, "t": 553.15465, "r": 162.69737, "b": 555.52309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "150", "bbox": {"l": 158.48466, "t": 553.15465, "r": 162.69737, "b": 555.52309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 168.81696, "t": 540.73164, "r": 172.88876, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "unit", "bbox": {"l": 168.81696, "t": 540.73164, "r": 172.88876, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 168.81696, "t": 544.67065, "r": 172.88876, "b": 547.03909, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "unit", "bbox": {"l": 168.81696, "t": 544.67065, "r": 172.88876, "b": 547.03909, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 168.81696, "t": 548.91264, "r": 172.88876, "b": 551.28108, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "unit", "bbox": {"l": 168.81696, "t": 548.91264, "r": 172.88876, "b": 551.28108, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 168.81696, "t": 553.15465, "r": 172.88876, "b": 555.52309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "unit", "bbox": {"l": 168.81696, "t": 553.15465, "r": 172.88876, "b": 555.52309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 147.30025, "t": 544.67065, "r": 149.70605, "b": 547.03909, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "2.", "bbox": {"l": 147.30025, "t": 544.67065, "r": 149.70605, "b": 547.03909, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 150.90895, "t": 544.67065, "r": 155.72055, "b": 547.03909, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "Item", "bbox": {"l": 150.90895, "t": 544.67065, "r": 155.72055, "b": 547.03909, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 147.30025, "t": 548.91264, "r": 149.70605, "b": 551.28108, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "3.", "bbox": {"l": 147.30025, "t": 548.91264, "r": 149.70605, "b": 551.28108, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 150.90895, "t": 548.91264, "r": 155.72055, "b": 551.28108, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "Item", "bbox": {"l": 150.90895, "t": 548.91264, "r": 155.72055, "b": 551.28108, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 147.30025, "t": 553.15465, "r": 149.70605, "b": 555.52309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "4.", "bbox": {"l": 147.30025, "t": 553.15465, "r": 149.70605, "b": 555.52309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 150.90895, "t": 553.15465, "r": 155.72055, "b": 555.52309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "Item", "bbox": {"l": 150.90895, "t": 553.15465, "r": 155.72055, "b": 555.52309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 152.05046, "t": 517.0098, "r": 171.24945, "b": 521.27298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "Extracted", "bbox": {"l": 152.05046, "t": 517.0098, "r": 171.24945, "b": 521.27298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 148.13347, "t": 522.3122900000001, "r": 175.16759, "b": 526.57547, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "Table Images", "bbox": {"l": 148.13347, "t": 522.3122900000001, "r": 175.16759, "b": 526.57547, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 193.53331, "t": 524.51422, "r": 220.31973, "b": 528.7774, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "Standardized", "bbox": {"l": 193.53331, "t": 524.51422, "r": 220.31973, "b": 528.7774, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 199.47311, "t": 529.8167100000001, "r": 214.37889, "b": 534.0799, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "Images", "bbox": {"l": 199.47311, "t": 529.8167100000001, "r": 214.37889, "b": 534.0799, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 273.61066, "t": 509.9053, "r": 284.47275, "b": 514.16849, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "BBox", "bbox": {"l": 273.61066, "t": 509.9053, "r": 284.47275, "b": 514.16849, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 270.45187, "t": 513.6928399999999, "r": 287.63242, "b": 517.9560200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "Decoder", "bbox": {"l": 270.45187, "t": 513.6928399999999, "r": 287.63242, "b": 517.9560200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 332.47852, "t": 508.14438, "r": 348.14014, "b": 512.40756, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "BBoxes", "bbox": {"l": 332.47852, "t": 508.14438, "r": 348.14014, "b": 512.40756, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 376.68622, "t": 521.12024, "r": 407.25497, "b": 525.38342, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "BBoxes can be", "bbox": {"l": 376.68622, "t": 521.12024, "r": 407.25497, "b": 525.38342, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 373.90869, "t": 525.66525, "r": 410.03506, "b": 529.92844, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "traced back to the", "bbox": {"l": 373.90869, "t": 525.66525, "r": 410.03506, "b": 529.92844, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 375.29871, "t": 530.21024, "r": 408.64902, "b": 534.47342, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "original image to", "bbox": {"l": 375.29871, "t": 530.21024, "r": 408.64902, "b": 534.47342, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 377.06747, "t": 534.75522, "r": 406.88312, "b": 539.01843, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "extract content", "bbox": {"l": 377.06747, "t": 534.75522, "r": 406.88312, "b": 539.01843, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 383.56683, "t": 563.24176, "r": 433.76544, "b": 567.50497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "Structure Tags sequence", "bbox": {"l": 383.56683, "t": 563.24176, "r": 433.76544, "b": 567.50497, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 383.52768, "t": 567.78676, "r": 433.80764999999997, "b": 572.04997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "provide full description of", "bbox": {"l": 383.52768, "t": 567.78676, "r": 433.80764999999997, "b": 572.04997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 390.47522, "t": 572.33177, "r": 426.85703, "b": 576.59499, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "the table structure", "bbox": {"l": 390.47522, "t": 572.33177, "r": 426.85703, "b": 576.59499, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 293.94702, "t": 577.89143, "r": 323.1691, "b": 582.15465, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "Structure Tags", "bbox": {"l": 293.94702, "t": 577.89143, "r": 323.1691, "b": 582.15465, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 293.94702, "t": 582.43648, "r": 324.59396, "b": 586.69969, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "in OTSL format", "bbox": {"l": 293.94702, "t": 582.43648, "r": 324.59396, "b": 586.69969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 333.07819, "t": 541.82269, "r": 364.14691, "b": 546.08591, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "BBoxes in sync", "bbox": {"l": 333.07819, "t": 541.82269, "r": 364.14691, "b": 546.08591, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 333.07819, "t": 545.6102, "r": 369.71542, "b": 549.87341, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "with tag sequence", "bbox": {"l": 333.07819, "t": 545.6102, "r": 369.71542, "b": 549.87341, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 232.65881000000002, "t": 515.24139, "r": 249.58894000000004, "b": 519.50458, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "Encoder", "bbox": {"l": 232.65881000000002, "t": 515.24139, "r": 249.58894000000004, "b": 519.50458, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 269.8219, "t": 545.97102, "r": 288.26279, "b": 550.23424, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "Structure", "bbox": {"l": 269.8219, "t": 545.97102, "r": 288.26279, "b": 550.23424, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 270.45187, "t": 549.75851, "r": 287.63242, "b": 554.0217299999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "Decoder", "bbox": {"l": 270.45187, "t": 549.75851, "r": 287.63242, "b": 554.0217299999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 332.17676, "t": 515.91205, "r": 358.11206, "b": 520.17523, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "[x1, y2, x2, y2]", "bbox": {"l": 332.17676, "t": 515.91205, "r": 358.11206, "b": 520.17523, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 332.17676, "t": 521.9720500000001, "r": 361.58298, "b": 526.23523, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "[x1', y2', x2', y2']", "bbox": {"l": 332.17676, "t": 521.9720500000001, "r": 361.58298, "b": 526.23523, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 332.17676, "t": 528.03204, "r": 364.76474, "b": 532.29523, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "[x1'', y2'', x2'', y2'']", "bbox": {"l": 332.17676, "t": 528.03204, "r": 364.76474, "b": 532.29523, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 332.17676, "t": 534.09204, "r": 335.96548, "b": 538.35524, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "...", "bbox": {"l": 332.17676, "t": 534.09204, "r": 335.96548, "b": 538.35524, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 326.8894, "t": 516.39508, "r": 329.41641, "b": 520.6582599999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "1", "bbox": {"l": 326.8894, "t": 516.39508, "r": 329.41641, "b": 520.6582599999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 327.04089, "t": 522.4247700000001, "r": 329.5679, "b": 526.68796, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "2", "bbox": {"l": 327.04089, "t": 522.4247700000001, "r": 329.5679, "b": 526.68796, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 327.04089, "t": 528.51508, "r": 329.5679, "b": 532.77826, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "3", "bbox": {"l": 327.04089, "t": 528.51508, "r": 329.5679, "b": 532.77826, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 424.14102, "t": 527.4428399999999, "r": 426.66803, "b": 531.7060200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "3", "bbox": {"l": 424.14102, "t": 527.4428399999999, "r": 426.66803, "b": 531.7060200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 453.0018, "t": 517.4539500000001, "r": 455.52881, "b": 521.71713, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "2", "bbox": {"l": 453.0018, "t": 517.4539500000001, "r": 455.52881, "b": 521.71713, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 423.85825, "t": 517.06281, "r": 426.38525, "b": 521.32599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "1", "bbox": {"l": 423.85825, "t": 517.06281, "r": 426.38525, "b": 521.32599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 333.4342, "t": 557.36679, "r": 337.27542, "b": 562.35719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "C", "bbox": {"l": 333.4342, "t": 557.36679, "r": 337.27542, "b": 562.35719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 340.35397, "t": 557.31679, "r": 344.19519, "b": 562.30719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "C", "bbox": {"l": 340.35397, "t": 557.31679, "r": 344.19519, "b": 562.30719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 340.30978, "t": 563.8653899999999, "r": 344.151, "b": 568.8557900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "C", "bbox": {"l": 340.30978, "t": 563.8653899999999, "r": 344.151, "b": 568.8557900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 346.79904, "t": 563.8686700000001, "r": 350.64026, "b": 568.85907, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "C", "bbox": {"l": 346.79904, "t": 563.8686700000001, "r": 350.64026, "b": 568.85907, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 333.59583, "t": 563.82271, "r": 337.43704, "b": 568.81311, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "C", "bbox": {"l": 333.59583, "t": 563.82271, "r": 337.43704, "b": 568.81311, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 340.37543, "t": 570.42673, "r": 344.21664, "b": 575.41713, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "C", "bbox": {"l": 340.37543, "t": 570.42673, "r": 344.21664, "b": 575.41713, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 346.86469, "t": 570.43001, "r": 350.7059, "b": 575.42041, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "C", "bbox": {"l": 346.86469, "t": 570.43001, "r": 350.7059, "b": 575.42041, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 333.66144, "t": 570.38405, "r": 337.50266, "b": 575.37445, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "C", "bbox": {"l": 333.66144, "t": 570.38405, "r": 337.50266, "b": 575.37445, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 340.37671, "t": 577.02606, "r": 344.21793, "b": 582.0164599999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "C", "bbox": {"l": 340.37671, "t": 577.02606, "r": 344.21793, "b": 582.0164599999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 346.86597, "t": 577.02934, "r": 350.70718, "b": 582.01974, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "C", "bbox": {"l": 346.86597, "t": 577.02934, "r": 350.70718, "b": 582.01974, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 333.66272, "t": 576.98338, "r": 337.50394, "b": 581.97379, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "C", "bbox": {"l": 333.66272, "t": 576.98338, "r": 337.50394, "b": 581.97379, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 340.27948, "t": 583.39737, "r": 344.1207, "b": 588.38777, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "C", "bbox": {"l": 340.27948, "t": 583.39737, "r": 344.1207, "b": 588.38777, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 346.76874, "t": 583.40068, "r": 350.60995, "b": 588.39108, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "C", "bbox": {"l": 346.76874, "t": 583.40068, "r": 350.60995, "b": 588.39108, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 333.56549, "t": 583.35474, "r": 337.40671, "b": 588.34514, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "C", "bbox": {"l": 333.56549, "t": 583.35474, "r": 337.40671, "b": 588.34514, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 353.03326, "t": 556.8831299999999, "r": 359.83362, "b": 561.87354, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "NL", "bbox": {"l": 353.03326, "t": 556.8831299999999, "r": 359.83362, "b": 561.87354, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 353.18604, "t": 563.58044, "r": 359.98639, "b": 568.57085, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "NL", "bbox": {"l": 353.18604, "t": 563.58044, "r": 359.98639, "b": 568.57085, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 353.19864, "t": 570.1623500000001, "r": 359.99899, "b": 575.15276, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "NL", "bbox": {"l": 353.19864, "t": 570.1623500000001, "r": 359.99899, "b": 575.15276, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 353.1532, "t": 576.76611, "r": 359.95355, "b": 581.75652, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "NL", "bbox": {"l": 353.1532, "t": 576.76611, "r": 359.95355, "b": 581.75652, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 353.26935, "t": 583.40628, "r": 360.0697, "b": 588.3966800000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "NL", "bbox": {"l": 353.26935, "t": 583.40628, "r": 360.0697, "b": 588.3966800000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 347.37979, "t": 557.08235, "r": 350.33786, "b": 562.07275, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "L", "bbox": {"l": 347.37979, "t": 557.08235, "r": 350.33786, "b": 562.07275, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 331.14026, "t": 564.2907700000001, "r": 333.66727, "b": 568.55399, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "3", "bbox": {"l": 331.14026, "t": 564.2907700000001, "r": 333.66727, "b": 568.55399, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 340.80972, "t": 554.59312, "r": 343.33673, "b": 558.85634, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": "2", "bbox": {"l": 340.80972, "t": 554.59312, "r": 343.33673, "b": 558.85634, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 330.97992, "t": 554.83035, "r": 333.50693, "b": 559.09357, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "1", "bbox": {"l": 330.97992, "t": 554.83035, "r": 333.50693, "b": 559.09357, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "text", "id": 4, "page_no": 7, "cluster": {"id": 4, "label": "text", "bbox": {"l": 134.765, "t": 620.19278, "r": 480.5917400000001, "b": 664.8547599999999, "coord_origin": "TOPLEFT"}, "confidence": 0.951270341873169, "cells": [{"id": 105, "text": "We rely on standard metrics such as Tree Edit Distance score (TEDs) for", "bbox": {"l": 149.709, "t": 620.19278, "r": 480.58792, "b": 628.98975, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "table structure prediction, and Mean Average Precision (mAP) with 0.75 Inter-", "bbox": {"l": 134.765, "t": 632.14778, "r": 480.58871, "b": 640.94475, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "section Over Union (IOU) threshold for the bounding-box predictions of table", "bbox": {"l": 134.765, "t": 644.1027799999999, "r": 480.5917400000001, "b": 652.89975, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "cells. The predicted OTSL structures were converted back to HTML format in", "bbox": {"l": 134.765, "t": 656.0577900000001, "r": 480.58968999999996, "b": 664.8547599999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "We rely on standard metrics such as Tree Edit Distance score (TEDs) for table structure prediction, and Mean Average Precision (mAP) with 0.75 Intersection Over Union (IOU) threshold for the bounding-box predictions of table cells. The predicted OTSL structures were converted back to HTML format in"}], "headers": [{"label": "page_header", "id": 9, "page_no": 7, "cluster": {"id": 9, "label": "page_header", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8301323056221008, "cells": [{"id": 0, "text": "8", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "8"}, {"label": "page_header", "id": 8, "page_no": 7, "cluster": {"id": 8, "label": "page_header", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8631826043128967, "cells": [{"id": 1, "text": "M.", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 178.07675, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37415, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "M. Lysak, et al."}]}}, {"page_no": 8, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "9", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "order to compute the TED score. Inference timing results for all experiments", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.5936899999999, "b": 127.73077, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "were obtained from the same machine on a single core with AMD EPYC 7763", "bbox": {"l": 134.765, "t": 130.88878999999997, "r": 480.59579, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "CPU @2.45 GHz.", "bbox": {"l": 134.765, "t": 142.84479, "r": 210.78462, "b": 151.64178000000004, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "5.1", "bbox": {"l": 134.765, "t": 169.18584999999996, "r": 149.40205, "b": 177.9928, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Hyper Parameter Optimization", "bbox": {"l": 160.85904, "t": 169.18584999999996, "r": 318.44843, "b": 177.9928, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "We have chosen the PubTabNet data set to perform HPO, since it includes a", "bbox": {"l": 134.765, "t": 185.58582, "r": 480.59183, "b": 194.38280999999995, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "highly diverse set of tables. Also we report TED scores separately for simple and", "bbox": {"l": 134.765, "t": 197.54083000000003, "r": 480.59183, "b": 206.33783000000005, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "complex tables (tables with cell spans). Results are presented in Table. 1. It is", "bbox": {"l": 134.765, "t": 209.49585000000002, "r": 480.59177000000005, "b": 218.29285000000004, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "evident that with OTSL, our model achieves the same TED score and slightly", "bbox": {"l": 134.765, "t": 221.45087, "r": 480.59277, "b": 230.24785999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "better mAP scores in comparison to HTML. However OTSL yields a", "bbox": {"l": 134.765, "t": 233.40588000000002, "r": 440.94159, "b": 242.20288000000005, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "2x speed", "bbox": {"l": 444.86798, "t": 233.40588000000002, "r": 480.58786000000003, "b": 242.20288000000005, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "up", "bbox": {"l": 134.76498, "t": 245.36188000000004, "r": 145.20081, "b": 254.15886999999998, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "in the inference runtime over HTML.", "bbox": {"l": 149.14899, "t": 245.36188000000004, "r": 311.21957, "b": 254.15886999999998, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Table", "bbox": {"l": 134.76498, "t": 275.07232999999997, "r": 160.11836, "b": 282.9986, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "1.", "bbox": {"l": 167.34528, "t": 275.07232999999997, "r": 175.59526, "b": 282.9986, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "HPO performed in OTSL and HTML representation on the same", "bbox": {"l": 188.13298, "t": 275.13507000000004, "r": 480.59365999999994, "b": 283.2048300000001, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "transformer-based TableFormer [9] architecture, trained only on PubTabNet [22]. Ef-", "bbox": {"l": 134.76498, "t": 286.09409, "r": 480.59444999999994, "b": 294.16385, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "fects of reducing the # of layers in encoder and decoder stages of the model show that", "bbox": {"l": 134.76498, "t": 297.05307, "r": 480.5954, "b": 305.12283, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "smaller models trained on OTSL perform better, especially in recognizing complex", "bbox": {"l": 134.76498, "t": 308.01205, "r": 480.59451, "b": 316.08182, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "table structures, and maintain a much higher mAP score than the HTML counterpart.", "bbox": {"l": 134.76498, "t": 318.97104, "r": 480.59441999999996, "b": 327.0408, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "#", "bbox": {"l": 160.37, "t": 341.73495, "r": 168.04793, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "enc-layers", "bbox": {"l": 144.592, "t": 354.68594, "r": 183.82806, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "#", "bbox": {"l": 207.974, "t": 341.73495, "r": 215.65193, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "dec-layers", "bbox": {"l": 192.19499, "t": 354.68594, "r": 231.43106, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "Language", "bbox": {"l": 239.79799999999997, "t": 347.21396, "r": 278.31766, "b": 355.28372, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "TEDs", "bbox": {"l": 324.67001, "t": 341.73495, "r": 348.26419, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "mAP", "bbox": {"l": 396.271, "t": 341.73495, "r": 417.12683, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "(0.75)", "bbox": {"l": 394.927, "t": 352.69394000000005, "r": 418.47278, "b": 360.7637, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Inference", "bbox": {"l": 430.771, "t": 341.73495, "r": 467.1423, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "time (secs)", "bbox": {"l": 427.14801, "t": 352.69394000000005, "r": 470.76056, "b": 360.7637, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "simple", "bbox": {"l": 286.686, "t": 354.68594, "r": 312.33261, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "complex", "bbox": {"l": 320.702, "t": 354.68594, "r": 353.71988, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "all", "bbox": {"l": 369.306, "t": 354.68594, "r": 379.03094, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "6", "bbox": {"l": 161.90601, "t": 373.51596, "r": 166.51294, "b": 381.58572, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "6", "bbox": {"l": 209.509, "t": 373.51596, "r": 214.11594, "b": 381.58572, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 368.03595, "r": 271.40527, "b": 376.10571, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "0.965", "bbox": {"l": 289.017, "t": 368.03595, "r": 310.00375, "b": 376.10571, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "0.934", "bbox": {"l": 326.71701, "t": 368.03595, "r": 347.70377, "b": 376.10571, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "0.955", "bbox": {"l": 363.67599, "t": 368.03595, "r": 384.66275, "b": 376.10571, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "0.88", "bbox": {"l": 397.26999, "t": 367.97317999999996, "r": 416.12723, "b": 375.89948, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "2.73", "bbox": {"l": 439.52701, "t": 367.97317999999996, "r": 458.38425, "b": 375.89948, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 380.98795, "r": 272.93954, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "0.969", "bbox": {"l": 289.017, "t": 380.98795, "r": 310.00375, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "0.927", "bbox": {"l": 326.71701, "t": 380.98795, "r": 347.70377, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "0.955", "bbox": {"l": 363.67599, "t": 380.98795, "r": 384.66275, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "0.857", "bbox": {"l": 396.20599, "t": 380.98795, "r": 417.19275, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "5.39", "bbox": {"l": 440.767, "t": 380.98795, "r": 457.14682, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "4", "bbox": {"l": 161.90601, "t": 399.81696, "r": 166.51294, "b": 407.88672, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "4", "bbox": {"l": 209.509, "t": 399.81696, "r": 214.11594, "b": 407.88672, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 394.33795, "r": 271.40527, "b": 402.40771, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "0.938", "bbox": {"l": 289.017, "t": 394.33795, "r": 310.00375, "b": 402.40771, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "0.904", "bbox": {"l": 326.71701, "t": 394.33795, "r": 347.70377, "b": 402.40771, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "0.927", "bbox": {"l": 363.67599, "t": 394.33795, "r": 384.66275, "b": 402.40771, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "0.853", "bbox": {"l": 394.61801, "t": 394.27518, "r": 418.77887, "b": 402.20148, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "1.97", "bbox": {"l": 439.52701, "t": 394.27518, "r": 458.38425, "b": 402.20148, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 407.28894, "r": 272.93954, "b": 415.3587, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "0.952", "bbox": {"l": 289.017, "t": 407.28894, "r": 310.00375, "b": 415.3587, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "0.909", "bbox": {"l": 326.71701, "t": 407.28894, "r": 347.70377, "b": 415.3587, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "0.938", "bbox": {"l": 362.08801, "t": 407.22617, "r": 386.24887, "b": 415.15247, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "0.843", "bbox": {"l": 396.20599, "t": 407.28894, "r": 417.19275, "b": 415.3587, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "3.77", "bbox": {"l": 440.767, "t": 407.28894, "r": 457.14682, "b": 415.3587, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "2", "bbox": {"l": 161.90601, "t": 426.11795, "r": 166.51294, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "4", "bbox": {"l": 209.509, "t": 426.11795, "r": 214.11594, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 420.63895, "r": 271.40527, "b": 428.70871, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "0.923", "bbox": {"l": 289.017, "t": 420.63895, "r": 310.00375, "b": 428.70871, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "0.897", "bbox": {"l": 326.71701, "t": 420.63895, "r": 347.70377, "b": 428.70871, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "0.915", "bbox": {"l": 363.67599, "t": 420.63895, "r": 384.66275, "b": 428.70871, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "0.859", "bbox": {"l": 394.61801, "t": 420.57617, "r": 418.77887, "b": 428.50247, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "1.91", "bbox": {"l": 439.52701, "t": 420.57617, "r": 458.38425, "b": 428.50247, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 433.58994, "r": 272.93954, "b": 441.6597, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "0.945", "bbox": {"l": 289.017, "t": 433.58994, "r": 310.00375, "b": 441.6597, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "0.901", "bbox": {"l": 326.71701, "t": 433.58994, "r": 347.70377, "b": 441.6597, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "0.931", "bbox": {"l": 362.08801, "t": 433.5271599999999, "r": 386.24887, "b": 441.45346, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "0.834", "bbox": {"l": 396.20599, "t": 433.58994, "r": 417.19275, "b": 441.6597, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "3.81", "bbox": {"l": 440.767, "t": 433.58994, "r": 457.14682, "b": 441.6597, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "4", "bbox": {"l": 161.90601, "t": 452.41995, "r": 166.51294, "b": 460.48972, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "2", "bbox": {"l": 209.509, "t": 452.41995, "r": 214.11594, "b": 460.48972, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 446.9399399999999, "r": 271.40527, "b": 455.0097, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "0.952", "bbox": {"l": 289.017, "t": 446.9399399999999, "r": 310.00375, "b": 455.0097, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "0.92", "bbox": {"l": 329.021, "t": 446.9399399999999, "r": 345.40082, "b": 455.0097, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "0.942", "bbox": {"l": 362.08801, "t": 446.87717, "r": 386.24887, "b": 454.80347, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "0.857", "bbox": {"l": 394.61801, "t": 446.87717, "r": 418.77887, "b": 454.80347, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "1.22", "bbox": {"l": 439.52701, "t": 446.87717, "r": 458.38425, "b": 454.80347, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 459.8919399999999, "r": 272.93954, "b": 467.9617, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "0.944", "bbox": {"l": 289.017, "t": 459.8919399999999, "r": 310.00375, "b": 467.9617, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "0.903", "bbox": {"l": 326.71701, "t": 459.8919399999999, "r": 347.70377, "b": 467.9617, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "0.931", "bbox": {"l": 363.67599, "t": 459.8919399999999, "r": 384.66275, "b": 467.9617, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "0.824", "bbox": {"l": 396.20599, "t": 459.8919399999999, "r": 417.19275, "b": 467.9617, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "2", "bbox": {"l": 446.65302, "t": 459.8919399999999, "r": 451.25995, "b": 467.9617, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "5.2", "bbox": {"l": 134.765, "t": 508.15179, "r": 149.40205, "b": 516.95874, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Quantitative Results", "bbox": {"l": 160.85904, "t": 508.15179, "r": 264.40332, "b": 516.95874, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "We picked the model parameter configuration that produced the best prediction", "bbox": {"l": 134.765, "t": 524.55078, "r": 480.59075999999993, "b": 533.34775, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "quality (enc=6, dec=6, heads=8) with PubTabNet alone, then independently", "bbox": {"l": 134.765, "t": 536.50677, "r": 480.58675999999997, "b": 545.3037400000001, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "trained and evaluated it on three publicly available data sets: PubTabNet (395k", "bbox": {"l": 134.765, "t": 548.4617800000001, "r": 480.59572999999995, "b": 557.25874, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "samples), FinTabNet (113k samples) and PubTables-1M (about 1M samples).", "bbox": {"l": 134.765, "t": 560.41678, "r": 480.59177000000005, "b": 569.21375, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "Performance results are presented in Table. 2. It is clearly evident that the model", "bbox": {"l": 134.765, "t": 572.37178, "r": 480.59069999999997, "b": 581.16875, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "trained on OTSL outperforms HTML across the board, keeping high TEDs and", "bbox": {"l": 134.765, "t": 584.32678, "r": 480.5957599999999, "b": 593.12375, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "mAP scores even on difficult financial tables (FinTabNet) that contain sparse", "bbox": {"l": 134.765, "t": 596.28278, "r": 480.58774, "b": 605.07974, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "and large tables.", "bbox": {"l": 134.765, "t": 608.2377799999999, "r": 206.78664, "b": 617.03474, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "Additionally, the results show that OTSL has an advantage over HTML", "bbox": {"l": 149.709, "t": 620.19278, "r": 480.59271, "b": 628.98975, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "when applied on a bigger data set like PubTables-1M and achieves significantly", "bbox": {"l": 134.765, "t": 632.14778, "r": 480.5957599999999, "b": 640.94475, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "improved scores. Finally, OTSL achieves faster inference due to fewer decoding", "bbox": {"l": 134.765, "t": 644.1027799999999, "r": 480.59283000000005, "b": 652.89975, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "steps which is a result of the reduced sequence representation.", "bbox": {"l": 134.765, "t": 656.0577900000001, "r": 405.79651, "b": 664.8547599999999, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 8, "label": "page_header", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9373378753662109, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "page_header", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8857625722885132, "cells": [{"id": 1, "text": "9", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "text", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.59579, "b": 151.64178000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9805440306663513, "cells": [{"id": 2, "text": "order to compute the TED score. Inference timing results for all experiments", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.5936899999999, "b": 127.73077, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "were obtained from the same machine on a single core with AMD EPYC 7763", "bbox": {"l": 134.765, "t": 130.88878999999997, "r": 480.59579, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "CPU @2.45 GHz.", "bbox": {"l": 134.765, "t": 142.84479, "r": 210.78462, "b": 151.64178000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "section_header", "bbox": {"l": 134.765, "t": 169.18584999999996, "r": 318.44843, "b": 177.9928, "coord_origin": "TOPLEFT"}, "confidence": 0.9579681158065796, "cells": [{"id": 5, "text": "5.1", "bbox": {"l": 134.765, "t": 169.18584999999996, "r": 149.40205, "b": 177.9928, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Hyper Parameter Optimization", "bbox": {"l": 160.85904, "t": 169.18584999999996, "r": 318.44843, "b": 177.9928, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 134.76498, "t": 185.58582, "r": 480.59277, "b": 254.15886999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.9842326641082764, "cells": [{"id": 7, "text": "We have chosen the PubTabNet data set to perform HPO, since it includes a", "bbox": {"l": 134.765, "t": 185.58582, "r": 480.59183, "b": 194.38280999999995, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "highly diverse set of tables. Also we report TED scores separately for simple and", "bbox": {"l": 134.765, "t": 197.54083000000003, "r": 480.59183, "b": 206.33783000000005, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "complex tables (tables with cell spans). Results are presented in Table. 1. It is", "bbox": {"l": 134.765, "t": 209.49585000000002, "r": 480.59177000000005, "b": 218.29285000000004, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "evident that with OTSL, our model achieves the same TED score and slightly", "bbox": {"l": 134.765, "t": 221.45087, "r": 480.59277, "b": 230.24785999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "better mAP scores in comparison to HTML. However OTSL yields a", "bbox": {"l": 134.765, "t": 233.40588000000002, "r": 440.94159, "b": 242.20288000000005, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "2x speed", "bbox": {"l": 444.86798, "t": 233.40588000000002, "r": 480.58786000000003, "b": 242.20288000000005, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "up", "bbox": {"l": 134.76498, "t": 245.36188000000004, "r": 145.20081, "b": 254.15886999999998, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "in the inference runtime over HTML.", "bbox": {"l": 149.14899, "t": 245.36188000000004, "r": 311.21957, "b": 254.15886999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "caption", "bbox": {"l": 134.76498, "t": 275.07232999999997, "r": 480.5954, "b": 327.0408, "coord_origin": "TOPLEFT"}, "confidence": 0.9570781588554382, "cells": [{"id": 15, "text": "Table", "bbox": {"l": 134.76498, "t": 275.07232999999997, "r": 160.11836, "b": 282.9986, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "1.", "bbox": {"l": 167.34528, "t": 275.07232999999997, "r": 175.59526, "b": 282.9986, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "HPO performed in OTSL and HTML representation on the same", "bbox": {"l": 188.13298, "t": 275.13507000000004, "r": 480.59365999999994, "b": 283.2048300000001, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "transformer-based TableFormer [9] architecture, trained only on PubTabNet [22]. Ef-", "bbox": {"l": 134.76498, "t": 286.09409, "r": 480.59444999999994, "b": 294.16385, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "fects of reducing the # of layers in encoder and decoder stages of the model show that", "bbox": {"l": 134.76498, "t": 297.05307, "r": 480.5954, "b": 305.12283, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "smaller models trained on OTSL perform better, especially in recognizing complex", "bbox": {"l": 134.76498, "t": 308.01205, "r": 480.59451, "b": 316.08182, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "table structures, and maintain a much higher mAP score than the HTML counterpart.", "bbox": {"l": 134.76498, "t": 318.97104, "r": 480.59441999999996, "b": 327.0408, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "table", "bbox": {"l": 139.66845703125, "t": 337.5747985839844, "r": 475.00372314453125, "b": 469.4721374511719, "coord_origin": "TOPLEFT"}, "confidence": 0.9901032447814941, "cells": [{"id": 22, "text": "#", "bbox": {"l": 160.37, "t": 341.73495, "r": 168.04793, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "enc-layers", "bbox": {"l": 144.592, "t": 354.68594, "r": 183.82806, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "#", "bbox": {"l": 207.974, "t": 341.73495, "r": 215.65193, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "dec-layers", "bbox": {"l": 192.19499, "t": 354.68594, "r": 231.43106, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "Language", "bbox": {"l": 239.79799999999997, "t": 347.21396, "r": 278.31766, "b": 355.28372, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "TEDs", "bbox": {"l": 324.67001, "t": 341.73495, "r": 348.26419, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "mAP", "bbox": {"l": 396.271, "t": 341.73495, "r": 417.12683, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "(0.75)", "bbox": {"l": 394.927, "t": 352.69394000000005, "r": 418.47278, "b": 360.7637, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Inference", "bbox": {"l": 430.771, "t": 341.73495, "r": 467.1423, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "time (secs)", "bbox": {"l": 427.14801, "t": 352.69394000000005, "r": 470.76056, "b": 360.7637, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "simple", "bbox": {"l": 286.686, "t": 354.68594, "r": 312.33261, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "complex", "bbox": {"l": 320.702, "t": 354.68594, "r": 353.71988, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "all", "bbox": {"l": 369.306, "t": 354.68594, "r": 379.03094, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "6", "bbox": {"l": 161.90601, "t": 373.51596, "r": 166.51294, "b": 381.58572, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "6", "bbox": {"l": 209.509, "t": 373.51596, "r": 214.11594, "b": 381.58572, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 368.03595, "r": 271.40527, "b": 376.10571, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "0.965", "bbox": {"l": 289.017, "t": 368.03595, "r": 310.00375, "b": 376.10571, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "0.934", "bbox": {"l": 326.71701, "t": 368.03595, "r": 347.70377, "b": 376.10571, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "0.955", "bbox": {"l": 363.67599, "t": 368.03595, "r": 384.66275, "b": 376.10571, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "0.88", "bbox": {"l": 397.26999, "t": 367.97317999999996, "r": 416.12723, "b": 375.89948, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "2.73", "bbox": {"l": 439.52701, "t": 367.97317999999996, "r": 458.38425, "b": 375.89948, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 380.98795, "r": 272.93954, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "0.969", "bbox": {"l": 289.017, "t": 380.98795, "r": 310.00375, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "0.927", "bbox": {"l": 326.71701, "t": 380.98795, "r": 347.70377, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "0.955", "bbox": {"l": 363.67599, "t": 380.98795, "r": 384.66275, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "0.857", "bbox": {"l": 396.20599, "t": 380.98795, "r": 417.19275, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "5.39", "bbox": {"l": 440.767, "t": 380.98795, "r": 457.14682, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "4", "bbox": {"l": 161.90601, "t": 399.81696, "r": 166.51294, "b": 407.88672, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "4", "bbox": {"l": 209.509, "t": 399.81696, "r": 214.11594, "b": 407.88672, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 394.33795, "r": 271.40527, "b": 402.40771, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "0.938", "bbox": {"l": 289.017, "t": 394.33795, "r": 310.00375, "b": 402.40771, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "0.904", "bbox": {"l": 326.71701, "t": 394.33795, "r": 347.70377, "b": 402.40771, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "0.927", "bbox": {"l": 363.67599, "t": 394.33795, "r": 384.66275, "b": 402.40771, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "0.853", "bbox": {"l": 394.61801, "t": 394.27518, "r": 418.77887, "b": 402.20148, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "1.97", "bbox": {"l": 439.52701, "t": 394.27518, "r": 458.38425, "b": 402.20148, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 407.28894, "r": 272.93954, "b": 415.3587, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "0.952", "bbox": {"l": 289.017, "t": 407.28894, "r": 310.00375, "b": 415.3587, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "0.909", "bbox": {"l": 326.71701, "t": 407.28894, "r": 347.70377, "b": 415.3587, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "0.938", "bbox": {"l": 362.08801, "t": 407.22617, "r": 386.24887, "b": 415.15247, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "0.843", "bbox": {"l": 396.20599, "t": 407.28894, "r": 417.19275, "b": 415.3587, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "3.77", "bbox": {"l": 440.767, "t": 407.28894, "r": 457.14682, "b": 415.3587, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "2", "bbox": {"l": 161.90601, "t": 426.11795, "r": 166.51294, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "4", "bbox": {"l": 209.509, "t": 426.11795, "r": 214.11594, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 420.63895, "r": 271.40527, "b": 428.70871, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "0.923", "bbox": {"l": 289.017, "t": 420.63895, "r": 310.00375, "b": 428.70871, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "0.897", "bbox": {"l": 326.71701, "t": 420.63895, "r": 347.70377, "b": 428.70871, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "0.915", "bbox": {"l": 363.67599, "t": 420.63895, "r": 384.66275, "b": 428.70871, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "0.859", "bbox": {"l": 394.61801, "t": 420.57617, "r": 418.77887, "b": 428.50247, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "1.91", "bbox": {"l": 439.52701, "t": 420.57617, "r": 458.38425, "b": 428.50247, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 433.58994, "r": 272.93954, "b": 441.6597, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "0.945", "bbox": {"l": 289.017, "t": 433.58994, "r": 310.00375, "b": 441.6597, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "0.901", "bbox": {"l": 326.71701, "t": 433.58994, "r": 347.70377, "b": 441.6597, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "0.931", "bbox": {"l": 362.08801, "t": 433.5271599999999, "r": 386.24887, "b": 441.45346, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "0.834", "bbox": {"l": 396.20599, "t": 433.58994, "r": 417.19275, "b": 441.6597, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "3.81", "bbox": {"l": 440.767, "t": 433.58994, "r": 457.14682, "b": 441.6597, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "4", "bbox": {"l": 161.90601, "t": 452.41995, "r": 166.51294, "b": 460.48972, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "2", "bbox": {"l": 209.509, "t": 452.41995, "r": 214.11594, "b": 460.48972, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 446.9399399999999, "r": 271.40527, "b": 455.0097, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "0.952", "bbox": {"l": 289.017, "t": 446.9399399999999, "r": 310.00375, "b": 455.0097, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "0.92", "bbox": {"l": 329.021, "t": 446.9399399999999, "r": 345.40082, "b": 455.0097, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "0.942", "bbox": {"l": 362.08801, "t": 446.87717, "r": 386.24887, "b": 454.80347, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "0.857", "bbox": {"l": 394.61801, "t": 446.87717, "r": 418.77887, "b": 454.80347, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "1.22", "bbox": {"l": 439.52701, "t": 446.87717, "r": 458.38425, "b": 454.80347, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 459.8919399999999, "r": 272.93954, "b": 467.9617, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "0.944", "bbox": {"l": 289.017, "t": 459.8919399999999, "r": 310.00375, "b": 467.9617, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "0.903", "bbox": {"l": 326.71701, "t": 459.8919399999999, "r": 347.70377, "b": 467.9617, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "0.931", "bbox": {"l": 363.67599, "t": 459.8919399999999, "r": 384.66275, "b": 467.9617, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "0.824", "bbox": {"l": 396.20599, "t": 459.8919399999999, "r": 417.19275, "b": 467.9617, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "2", "bbox": {"l": 446.65302, "t": 459.8919399999999, "r": 451.25995, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": [{"id": 10, "label": "text", "bbox": {"l": 160.37, "t": 341.73495, "r": 168.04793, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "#", "bbox": {"l": 160.37, "t": 341.73495, "r": 168.04793, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 144.592, "t": 354.68594, "r": 183.82806, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "enc-layers", "bbox": {"l": 144.592, "t": 354.68594, "r": 183.82806, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 207.974, "t": 341.73495, "r": 215.65193, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "#", "bbox": {"l": 207.974, "t": 341.73495, "r": 215.65193, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 192.19499, "t": 354.68594, "r": 231.43106, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "dec-layers", "bbox": {"l": 192.19499, "t": 354.68594, "r": 231.43106, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 239.79799999999997, "t": 347.21396, "r": 278.31766, "b": 355.28372, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "Language", "bbox": {"l": 239.79799999999997, "t": 347.21396, "r": 278.31766, "b": 355.28372, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 324.67001, "t": 341.73495, "r": 348.26419, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "TEDs", "bbox": {"l": 324.67001, "t": 341.73495, "r": 348.26419, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 396.271, "t": 341.73495, "r": 417.12683, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "mAP", "bbox": {"l": 396.271, "t": 341.73495, "r": 417.12683, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 394.927, "t": 352.69394000000005, "r": 418.47278, "b": 360.7637, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "(0.75)", "bbox": {"l": 394.927, "t": 352.69394000000005, "r": 418.47278, "b": 360.7637, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 430.771, "t": 341.73495, "r": 467.1423, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "Inference", "bbox": {"l": 430.771, "t": 341.73495, "r": 467.1423, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 427.14801, "t": 352.69394000000005, "r": 470.76056, "b": 360.7637, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "time (secs)", "bbox": {"l": 427.14801, "t": 352.69394000000005, "r": 470.76056, "b": 360.7637, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 286.686, "t": 354.68594, "r": 312.33261, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "simple", "bbox": {"l": 286.686, "t": 354.68594, "r": 312.33261, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 320.702, "t": 354.68594, "r": 353.71988, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "complex", "bbox": {"l": 320.702, "t": 354.68594, "r": 353.71988, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 369.306, "t": 354.68594, "r": 379.03094, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "all", "bbox": {"l": 369.306, "t": 354.68594, "r": 379.03094, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 161.90601, "t": 373.51596, "r": 166.51294, "b": 381.58572, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "6", "bbox": {"l": 161.90601, "t": 373.51596, "r": 166.51294, "b": 381.58572, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 209.509, "t": 373.51596, "r": 214.11594, "b": 381.58572, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "6", "bbox": {"l": 209.509, "t": 373.51596, "r": 214.11594, "b": 381.58572, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 246.71000999999998, "t": 368.03595, "r": 271.40527, "b": 376.10571, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 368.03595, "r": 271.40527, "b": 376.10571, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 289.017, "t": 368.03595, "r": 310.00375, "b": 376.10571, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "0.965", "bbox": {"l": 289.017, "t": 368.03595, "r": 310.00375, "b": 376.10571, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 326.71701, "t": 368.03595, "r": 347.70377, "b": 376.10571, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "0.934", "bbox": {"l": 326.71701, "t": 368.03595, "r": 347.70377, "b": 376.10571, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 363.67599, "t": 368.03595, "r": 384.66275, "b": 376.10571, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "0.955", "bbox": {"l": 363.67599, "t": 368.03595, "r": 384.66275, "b": 376.10571, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 397.26999, "t": 367.97317999999996, "r": 416.12723, "b": 375.89948, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "0.88", "bbox": {"l": 397.26999, "t": 367.97317999999996, "r": 416.12723, "b": 375.89948, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 439.52701, "t": 367.97317999999996, "r": 458.38425, "b": 375.89948, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "2.73", "bbox": {"l": 439.52701, "t": 367.97317999999996, "r": 458.38425, "b": 375.89948, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 245.17598999999998, "t": 380.98795, "r": 272.93954, "b": 389.05771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 380.98795, "r": 272.93954, "b": 389.05771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 289.017, "t": 380.98795, "r": 310.00375, "b": 389.05771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "0.969", "bbox": {"l": 289.017, "t": 380.98795, "r": 310.00375, "b": 389.05771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 326.71701, "t": 380.98795, "r": 347.70377, "b": 389.05771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "0.927", "bbox": {"l": 326.71701, "t": 380.98795, "r": 347.70377, "b": 389.05771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 363.67599, "t": 380.98795, "r": 384.66275, "b": 389.05771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "0.955", "bbox": {"l": 363.67599, "t": 380.98795, "r": 384.66275, "b": 389.05771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 396.20599, "t": 380.98795, "r": 417.19275, "b": 389.05771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "0.857", "bbox": {"l": 396.20599, "t": 380.98795, "r": 417.19275, "b": 389.05771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 440.767, "t": 380.98795, "r": 457.14682, "b": 389.05771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "5.39", "bbox": {"l": 440.767, "t": 380.98795, "r": 457.14682, "b": 389.05771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 161.90601, "t": 399.81696, "r": 166.51294, "b": 407.88672, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "4", "bbox": {"l": 161.90601, "t": 399.81696, "r": 166.51294, "b": 407.88672, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 209.509, "t": 399.81696, "r": 214.11594, "b": 407.88672, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "4", "bbox": {"l": 209.509, "t": 399.81696, "r": 214.11594, "b": 407.88672, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 246.71000999999998, "t": 394.33795, "r": 271.40527, "b": 402.40771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 394.33795, "r": 271.40527, "b": 402.40771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 289.017, "t": 394.33795, "r": 310.00375, "b": 402.40771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "0.938", "bbox": {"l": 289.017, "t": 394.33795, "r": 310.00375, "b": 402.40771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 326.71701, "t": 394.33795, "r": 347.70377, "b": 402.40771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "0.904", "bbox": {"l": 326.71701, "t": 394.33795, "r": 347.70377, "b": 402.40771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 363.67599, "t": 394.33795, "r": 384.66275, "b": 402.40771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "0.927", "bbox": {"l": 363.67599, "t": 394.33795, "r": 384.66275, "b": 402.40771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 394.61801, "t": 394.27518, "r": 418.77887, "b": 402.20148, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "0.853", "bbox": {"l": 394.61801, "t": 394.27518, "r": 418.77887, "b": 402.20148, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 439.52701, "t": 394.27518, "r": 458.38425, "b": 402.20148, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "1.97", "bbox": {"l": 439.52701, "t": 394.27518, "r": 458.38425, "b": 402.20148, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 245.17598999999998, "t": 407.28894, "r": 272.93954, "b": 415.3587, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 407.28894, "r": 272.93954, "b": 415.3587, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 289.017, "t": 407.28894, "r": 310.00375, "b": 415.3587, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "0.952", "bbox": {"l": 289.017, "t": 407.28894, "r": 310.00375, "b": 415.3587, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 326.71701, "t": 407.28894, "r": 347.70377, "b": 415.3587, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "0.909", "bbox": {"l": 326.71701, "t": 407.28894, "r": 347.70377, "b": 415.3587, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 362.08801, "t": 407.22617, "r": 386.24887, "b": 415.15247, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "0.938", "bbox": {"l": 362.08801, "t": 407.22617, "r": 386.24887, "b": 415.15247, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 396.20599, "t": 407.28894, "r": 417.19275, "b": 415.3587, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "0.843", "bbox": {"l": 396.20599, "t": 407.28894, "r": 417.19275, "b": 415.3587, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 440.767, "t": 407.28894, "r": 457.14682, "b": 415.3587, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "3.77", "bbox": {"l": 440.767, "t": 407.28894, "r": 457.14682, "b": 415.3587, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 161.90601, "t": 426.11795, "r": 166.51294, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "2", "bbox": {"l": 161.90601, "t": 426.11795, "r": 166.51294, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 209.509, "t": 426.11795, "r": 214.11594, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "4", "bbox": {"l": 209.509, "t": 426.11795, "r": 214.11594, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 246.71000999999998, "t": 420.63895, "r": 271.40527, "b": 428.70871, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 420.63895, "r": 271.40527, "b": 428.70871, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 289.017, "t": 420.63895, "r": 310.00375, "b": 428.70871, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "0.923", "bbox": {"l": 289.017, "t": 420.63895, "r": 310.00375, "b": 428.70871, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 326.71701, "t": 420.63895, "r": 347.70377, "b": 428.70871, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "0.897", "bbox": {"l": 326.71701, "t": 420.63895, "r": 347.70377, "b": 428.70871, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 363.67599, "t": 420.63895, "r": 384.66275, "b": 428.70871, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "0.915", "bbox": {"l": 363.67599, "t": 420.63895, "r": 384.66275, "b": 428.70871, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 394.61801, "t": 420.57617, "r": 418.77887, "b": 428.50247, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "0.859", "bbox": {"l": 394.61801, "t": 420.57617, "r": 418.77887, "b": 428.50247, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 439.52701, "t": 420.57617, "r": 458.38425, "b": 428.50247, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "1.91", "bbox": {"l": 439.52701, "t": 420.57617, "r": 458.38425, "b": 428.50247, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 245.17598999999998, "t": 433.58994, "r": 272.93954, "b": 441.6597, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 433.58994, "r": 272.93954, "b": 441.6597, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 289.017, "t": 433.58994, "r": 310.00375, "b": 441.6597, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "0.945", "bbox": {"l": 289.017, "t": 433.58994, "r": 310.00375, "b": 441.6597, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 326.71701, "t": 433.58994, "r": 347.70377, "b": 441.6597, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "0.901", "bbox": {"l": 326.71701, "t": 433.58994, "r": 347.70377, "b": 441.6597, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 362.08801, "t": 433.5271599999999, "r": 386.24887, "b": 441.45346, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "0.931", "bbox": {"l": 362.08801, "t": 433.5271599999999, "r": 386.24887, "b": 441.45346, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 396.20599, "t": 433.58994, "r": 417.19275, "b": 441.6597, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "0.834", "bbox": {"l": 396.20599, "t": 433.58994, "r": 417.19275, "b": 441.6597, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 440.767, "t": 433.58994, "r": 457.14682, "b": 441.6597, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "3.81", "bbox": {"l": 440.767, "t": 433.58994, "r": 457.14682, "b": 441.6597, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 161.90601, "t": 452.41995, "r": 166.51294, "b": 460.48972, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "4", "bbox": {"l": 161.90601, "t": 452.41995, "r": 166.51294, "b": 460.48972, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 209.509, "t": 452.41995, "r": 214.11594, "b": 460.48972, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "2", "bbox": {"l": 209.509, "t": 452.41995, "r": 214.11594, "b": 460.48972, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 246.71000999999998, "t": 446.9399399999999, "r": 271.40527, "b": 455.0097, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 446.9399399999999, "r": 271.40527, "b": 455.0097, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 289.017, "t": 446.9399399999999, "r": 310.00375, "b": 455.0097, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "0.952", "bbox": {"l": 289.017, "t": 446.9399399999999, "r": 310.00375, "b": 455.0097, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 329.021, "t": 446.9399399999999, "r": 345.40082, "b": 455.0097, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "0.92", "bbox": {"l": 329.021, "t": 446.9399399999999, "r": 345.40082, "b": 455.0097, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 362.08801, "t": 446.87717, "r": 386.24887, "b": 454.80347, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "0.942", "bbox": {"l": 362.08801, "t": 446.87717, "r": 386.24887, "b": 454.80347, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 394.61801, "t": 446.87717, "r": 418.77887, "b": 454.80347, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "0.857", "bbox": {"l": 394.61801, "t": 446.87717, "r": 418.77887, "b": 454.80347, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 439.52701, "t": 446.87717, "r": 458.38425, "b": 454.80347, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "1.22", "bbox": {"l": 439.52701, "t": 446.87717, "r": 458.38425, "b": 454.80347, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 245.17598999999998, "t": 459.8919399999999, "r": 272.93954, "b": 467.9617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 459.8919399999999, "r": 272.93954, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 289.017, "t": 459.8919399999999, "r": 310.00375, "b": 467.9617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "0.944", "bbox": {"l": 289.017, "t": 459.8919399999999, "r": 310.00375, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 326.71701, "t": 459.8919399999999, "r": 347.70377, "b": 467.9617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "0.903", "bbox": {"l": 326.71701, "t": 459.8919399999999, "r": 347.70377, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 363.67599, "t": 459.8919399999999, "r": 384.66275, "b": 467.9617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "0.931", "bbox": {"l": 363.67599, "t": 459.8919399999999, "r": 384.66275, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 396.20599, "t": 459.8919399999999, "r": 417.19275, "b": 467.9617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "0.824", "bbox": {"l": 396.20599, "t": 459.8919399999999, "r": 417.19275, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 446.65302, "t": 459.8919399999999, "r": 451.25995, "b": 467.9617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "2", "bbox": {"l": 446.65302, "t": 459.8919399999999, "r": 451.25995, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 5, "label": "section_header", "bbox": {"l": 134.765, "t": 508.15179, "r": 264.40332, "b": 516.95874, "coord_origin": "TOPLEFT"}, "confidence": 0.9592539668083191, "cells": [{"id": 91, "text": "5.2", "bbox": {"l": 134.765, "t": 508.15179, "r": 149.40205, "b": 516.95874, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Quantitative Results", "bbox": {"l": 160.85904, "t": 508.15179, "r": 264.40332, "b": 516.95874, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 134.765, "t": 524.55078, "r": 480.5957599999999, "b": 617.03474, "coord_origin": "TOPLEFT"}, "confidence": 0.9854757189750671, "cells": [{"id": 93, "text": "We picked the model parameter configuration that produced the best prediction", "bbox": {"l": 134.765, "t": 524.55078, "r": 480.59075999999993, "b": 533.34775, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "quality (enc=6, dec=6, heads=8) with PubTabNet alone, then independently", "bbox": {"l": 134.765, "t": 536.50677, "r": 480.58675999999997, "b": 545.3037400000001, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "trained and evaluated it on three publicly available data sets: PubTabNet (395k", "bbox": {"l": 134.765, "t": 548.4617800000001, "r": 480.59572999999995, "b": 557.25874, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "samples), FinTabNet (113k samples) and PubTables-1M (about 1M samples).", "bbox": {"l": 134.765, "t": 560.41678, "r": 480.59177000000005, "b": 569.21375, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "Performance results are presented in Table. 2. It is clearly evident that the model", "bbox": {"l": 134.765, "t": 572.37178, "r": 480.59069999999997, "b": 581.16875, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "trained on OTSL outperforms HTML across the board, keeping high TEDs and", "bbox": {"l": 134.765, "t": 584.32678, "r": 480.5957599999999, "b": 593.12375, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "mAP scores even on difficult financial tables (FinTabNet) that contain sparse", "bbox": {"l": 134.765, "t": 596.28278, "r": 480.58774, "b": 605.07974, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "and large tables.", "bbox": {"l": 134.765, "t": 608.2377799999999, "r": 206.78664, "b": 617.03474, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 134.765, "t": 620.19278, "r": 480.5957599999999, "b": 664.8547599999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9851234555244446, "cells": [{"id": 101, "text": "Additionally, the results show that OTSL has an advantage over HTML", "bbox": {"l": 149.709, "t": 620.19278, "r": 480.59271, "b": 628.98975, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "when applied on a bigger data set like PubTables-1M and achieves significantly", "bbox": {"l": 134.765, "t": 632.14778, "r": 480.5957599999999, "b": 640.94475, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "improved scores. Finally, OTSL achieves faster inference due to fewer decoding", "bbox": {"l": 134.765, "t": 644.1027799999999, "r": 480.59283000000005, "b": 652.89975, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "steps which is a result of the reduced sequence representation.", "bbox": {"l": 134.765, "t": 656.0577900000001, "r": 405.79651, "b": 664.8547599999999, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {"0": {"label": "table", "id": 0, "page_no": 8, "cluster": {"id": 0, "label": "table", "bbox": {"l": 139.66845703125, "t": 337.5747985839844, "r": 475.00372314453125, "b": 469.4721374511719, "coord_origin": "TOPLEFT"}, "confidence": 0.9901032447814941, "cells": [{"id": 22, "text": "#", "bbox": {"l": 160.37, "t": 341.73495, "r": 168.04793, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "enc-layers", "bbox": {"l": 144.592, "t": 354.68594, "r": 183.82806, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "#", "bbox": {"l": 207.974, "t": 341.73495, "r": 215.65193, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "dec-layers", "bbox": {"l": 192.19499, "t": 354.68594, "r": 231.43106, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "Language", "bbox": {"l": 239.79799999999997, "t": 347.21396, "r": 278.31766, "b": 355.28372, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "TEDs", "bbox": {"l": 324.67001, "t": 341.73495, "r": 348.26419, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "mAP", "bbox": {"l": 396.271, "t": 341.73495, "r": 417.12683, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "(0.75)", "bbox": {"l": 394.927, "t": 352.69394000000005, "r": 418.47278, "b": 360.7637, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Inference", "bbox": {"l": 430.771, "t": 341.73495, "r": 467.1423, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "time (secs)", "bbox": {"l": 427.14801, "t": 352.69394000000005, "r": 470.76056, "b": 360.7637, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "simple", "bbox": {"l": 286.686, "t": 354.68594, "r": 312.33261, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "complex", "bbox": {"l": 320.702, "t": 354.68594, "r": 353.71988, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "all", "bbox": {"l": 369.306, "t": 354.68594, "r": 379.03094, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "6", "bbox": {"l": 161.90601, "t": 373.51596, "r": 166.51294, "b": 381.58572, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "6", "bbox": {"l": 209.509, "t": 373.51596, "r": 214.11594, "b": 381.58572, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 368.03595, "r": 271.40527, "b": 376.10571, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "0.965", "bbox": {"l": 289.017, "t": 368.03595, "r": 310.00375, "b": 376.10571, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "0.934", "bbox": {"l": 326.71701, "t": 368.03595, "r": 347.70377, "b": 376.10571, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "0.955", "bbox": {"l": 363.67599, "t": 368.03595, "r": 384.66275, "b": 376.10571, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "0.88", "bbox": {"l": 397.26999, "t": 367.97317999999996, "r": 416.12723, "b": 375.89948, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "2.73", "bbox": {"l": 439.52701, "t": 367.97317999999996, "r": 458.38425, "b": 375.89948, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 380.98795, "r": 272.93954, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "0.969", "bbox": {"l": 289.017, "t": 380.98795, "r": 310.00375, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "0.927", "bbox": {"l": 326.71701, "t": 380.98795, "r": 347.70377, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "0.955", "bbox": {"l": 363.67599, "t": 380.98795, "r": 384.66275, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "0.857", "bbox": {"l": 396.20599, "t": 380.98795, "r": 417.19275, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "5.39", "bbox": {"l": 440.767, "t": 380.98795, "r": 457.14682, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "4", "bbox": {"l": 161.90601, "t": 399.81696, "r": 166.51294, "b": 407.88672, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "4", "bbox": {"l": 209.509, "t": 399.81696, "r": 214.11594, "b": 407.88672, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 394.33795, "r": 271.40527, "b": 402.40771, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "0.938", "bbox": {"l": 289.017, "t": 394.33795, "r": 310.00375, "b": 402.40771, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "0.904", "bbox": {"l": 326.71701, "t": 394.33795, "r": 347.70377, "b": 402.40771, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "0.927", "bbox": {"l": 363.67599, "t": 394.33795, "r": 384.66275, "b": 402.40771, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "0.853", "bbox": {"l": 394.61801, "t": 394.27518, "r": 418.77887, "b": 402.20148, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "1.97", "bbox": {"l": 439.52701, "t": 394.27518, "r": 458.38425, "b": 402.20148, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 407.28894, "r": 272.93954, "b": 415.3587, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "0.952", "bbox": {"l": 289.017, "t": 407.28894, "r": 310.00375, "b": 415.3587, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "0.909", "bbox": {"l": 326.71701, "t": 407.28894, "r": 347.70377, "b": 415.3587, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "0.938", "bbox": {"l": 362.08801, "t": 407.22617, "r": 386.24887, "b": 415.15247, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "0.843", "bbox": {"l": 396.20599, "t": 407.28894, "r": 417.19275, "b": 415.3587, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "3.77", "bbox": {"l": 440.767, "t": 407.28894, "r": 457.14682, "b": 415.3587, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "2", "bbox": {"l": 161.90601, "t": 426.11795, "r": 166.51294, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "4", "bbox": {"l": 209.509, "t": 426.11795, "r": 214.11594, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 420.63895, "r": 271.40527, "b": 428.70871, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "0.923", "bbox": {"l": 289.017, "t": 420.63895, "r": 310.00375, "b": 428.70871, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "0.897", "bbox": {"l": 326.71701, "t": 420.63895, "r": 347.70377, "b": 428.70871, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "0.915", "bbox": {"l": 363.67599, "t": 420.63895, "r": 384.66275, "b": 428.70871, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "0.859", "bbox": {"l": 394.61801, "t": 420.57617, "r": 418.77887, "b": 428.50247, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "1.91", "bbox": {"l": 439.52701, "t": 420.57617, "r": 458.38425, "b": 428.50247, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 433.58994, "r": 272.93954, "b": 441.6597, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "0.945", "bbox": {"l": 289.017, "t": 433.58994, "r": 310.00375, "b": 441.6597, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "0.901", "bbox": {"l": 326.71701, "t": 433.58994, "r": 347.70377, "b": 441.6597, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "0.931", "bbox": {"l": 362.08801, "t": 433.5271599999999, "r": 386.24887, "b": 441.45346, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "0.834", "bbox": {"l": 396.20599, "t": 433.58994, "r": 417.19275, "b": 441.6597, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "3.81", "bbox": {"l": 440.767, "t": 433.58994, "r": 457.14682, "b": 441.6597, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "4", "bbox": {"l": 161.90601, "t": 452.41995, "r": 166.51294, "b": 460.48972, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "2", "bbox": {"l": 209.509, "t": 452.41995, "r": 214.11594, "b": 460.48972, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 446.9399399999999, "r": 271.40527, "b": 455.0097, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "0.952", "bbox": {"l": 289.017, "t": 446.9399399999999, "r": 310.00375, "b": 455.0097, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "0.92", "bbox": {"l": 329.021, "t": 446.9399399999999, "r": 345.40082, "b": 455.0097, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "0.942", "bbox": {"l": 362.08801, "t": 446.87717, "r": 386.24887, "b": 454.80347, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "0.857", "bbox": {"l": 394.61801, "t": 446.87717, "r": 418.77887, "b": 454.80347, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "1.22", "bbox": {"l": 439.52701, "t": 446.87717, "r": 458.38425, "b": 454.80347, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 459.8919399999999, "r": 272.93954, "b": 467.9617, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "0.944", "bbox": {"l": 289.017, "t": 459.8919399999999, "r": 310.00375, "b": 467.9617, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "0.903", "bbox": {"l": 326.71701, "t": 459.8919399999999, "r": 347.70377, "b": 467.9617, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "0.931", "bbox": {"l": 363.67599, "t": 459.8919399999999, "r": 384.66275, "b": 467.9617, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "0.824", "bbox": {"l": 396.20599, "t": 459.8919399999999, "r": 417.19275, "b": 467.9617, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "2", "bbox": {"l": 446.65302, "t": 459.8919399999999, "r": 451.25995, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": [{"id": 10, "label": "text", "bbox": {"l": 160.37, "t": 341.73495, "r": 168.04793, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "#", "bbox": {"l": 160.37, "t": 341.73495, "r": 168.04793, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 144.592, "t": 354.68594, "r": 183.82806, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "enc-layers", "bbox": {"l": 144.592, "t": 354.68594, "r": 183.82806, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 207.974, "t": 341.73495, "r": 215.65193, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "#", "bbox": {"l": 207.974, "t": 341.73495, "r": 215.65193, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 192.19499, "t": 354.68594, "r": 231.43106, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "dec-layers", "bbox": {"l": 192.19499, "t": 354.68594, "r": 231.43106, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 239.79799999999997, "t": 347.21396, "r": 278.31766, "b": 355.28372, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "Language", "bbox": {"l": 239.79799999999997, "t": 347.21396, "r": 278.31766, "b": 355.28372, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 324.67001, "t": 341.73495, "r": 348.26419, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "TEDs", "bbox": {"l": 324.67001, "t": 341.73495, "r": 348.26419, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 396.271, "t": 341.73495, "r": 417.12683, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "mAP", "bbox": {"l": 396.271, "t": 341.73495, "r": 417.12683, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 394.927, "t": 352.69394000000005, "r": 418.47278, "b": 360.7637, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "(0.75)", "bbox": {"l": 394.927, "t": 352.69394000000005, "r": 418.47278, "b": 360.7637, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 430.771, "t": 341.73495, "r": 467.1423, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "Inference", "bbox": {"l": 430.771, "t": 341.73495, "r": 467.1423, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 427.14801, "t": 352.69394000000005, "r": 470.76056, "b": 360.7637, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "time (secs)", "bbox": {"l": 427.14801, "t": 352.69394000000005, "r": 470.76056, "b": 360.7637, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 286.686, "t": 354.68594, "r": 312.33261, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "simple", "bbox": {"l": 286.686, "t": 354.68594, "r": 312.33261, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 320.702, "t": 354.68594, "r": 353.71988, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "complex", "bbox": {"l": 320.702, "t": 354.68594, "r": 353.71988, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 369.306, "t": 354.68594, "r": 379.03094, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "all", "bbox": {"l": 369.306, "t": 354.68594, "r": 379.03094, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 161.90601, "t": 373.51596, "r": 166.51294, "b": 381.58572, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "6", "bbox": {"l": 161.90601, "t": 373.51596, "r": 166.51294, "b": 381.58572, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 209.509, "t": 373.51596, "r": 214.11594, "b": 381.58572, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "6", "bbox": {"l": 209.509, "t": 373.51596, "r": 214.11594, "b": 381.58572, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 246.71000999999998, "t": 368.03595, "r": 271.40527, "b": 376.10571, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 368.03595, "r": 271.40527, "b": 376.10571, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 289.017, "t": 368.03595, "r": 310.00375, "b": 376.10571, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "0.965", "bbox": {"l": 289.017, "t": 368.03595, "r": 310.00375, "b": 376.10571, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 326.71701, "t": 368.03595, "r": 347.70377, "b": 376.10571, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "0.934", "bbox": {"l": 326.71701, "t": 368.03595, "r": 347.70377, "b": 376.10571, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 363.67599, "t": 368.03595, "r": 384.66275, "b": 376.10571, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "0.955", "bbox": {"l": 363.67599, "t": 368.03595, "r": 384.66275, "b": 376.10571, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 397.26999, "t": 367.97317999999996, "r": 416.12723, "b": 375.89948, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "0.88", "bbox": {"l": 397.26999, "t": 367.97317999999996, "r": 416.12723, "b": 375.89948, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 439.52701, "t": 367.97317999999996, "r": 458.38425, "b": 375.89948, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "2.73", "bbox": {"l": 439.52701, "t": 367.97317999999996, "r": 458.38425, "b": 375.89948, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 245.17598999999998, "t": 380.98795, "r": 272.93954, "b": 389.05771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 380.98795, "r": 272.93954, "b": 389.05771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 289.017, "t": 380.98795, "r": 310.00375, "b": 389.05771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "0.969", "bbox": {"l": 289.017, "t": 380.98795, "r": 310.00375, "b": 389.05771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 326.71701, "t": 380.98795, "r": 347.70377, "b": 389.05771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "0.927", "bbox": {"l": 326.71701, "t": 380.98795, "r": 347.70377, "b": 389.05771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 363.67599, "t": 380.98795, "r": 384.66275, "b": 389.05771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "0.955", "bbox": {"l": 363.67599, "t": 380.98795, "r": 384.66275, "b": 389.05771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 396.20599, "t": 380.98795, "r": 417.19275, "b": 389.05771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "0.857", "bbox": {"l": 396.20599, "t": 380.98795, "r": 417.19275, "b": 389.05771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 440.767, "t": 380.98795, "r": 457.14682, "b": 389.05771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "5.39", "bbox": {"l": 440.767, "t": 380.98795, "r": 457.14682, "b": 389.05771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 161.90601, "t": 399.81696, "r": 166.51294, "b": 407.88672, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "4", "bbox": {"l": 161.90601, "t": 399.81696, "r": 166.51294, "b": 407.88672, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 209.509, "t": 399.81696, "r": 214.11594, "b": 407.88672, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "4", "bbox": {"l": 209.509, "t": 399.81696, "r": 214.11594, "b": 407.88672, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 246.71000999999998, "t": 394.33795, "r": 271.40527, "b": 402.40771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 394.33795, "r": 271.40527, "b": 402.40771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 289.017, "t": 394.33795, "r": 310.00375, "b": 402.40771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "0.938", "bbox": {"l": 289.017, "t": 394.33795, "r": 310.00375, "b": 402.40771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 326.71701, "t": 394.33795, "r": 347.70377, "b": 402.40771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "0.904", "bbox": {"l": 326.71701, "t": 394.33795, "r": 347.70377, "b": 402.40771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 363.67599, "t": 394.33795, "r": 384.66275, "b": 402.40771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "0.927", "bbox": {"l": 363.67599, "t": 394.33795, "r": 384.66275, "b": 402.40771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 394.61801, "t": 394.27518, "r": 418.77887, "b": 402.20148, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "0.853", "bbox": {"l": 394.61801, "t": 394.27518, "r": 418.77887, "b": 402.20148, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 439.52701, "t": 394.27518, "r": 458.38425, "b": 402.20148, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "1.97", "bbox": {"l": 439.52701, "t": 394.27518, "r": 458.38425, "b": 402.20148, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 245.17598999999998, "t": 407.28894, "r": 272.93954, "b": 415.3587, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 407.28894, "r": 272.93954, "b": 415.3587, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 289.017, "t": 407.28894, "r": 310.00375, "b": 415.3587, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "0.952", "bbox": {"l": 289.017, "t": 407.28894, "r": 310.00375, "b": 415.3587, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 326.71701, "t": 407.28894, "r": 347.70377, "b": 415.3587, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "0.909", "bbox": {"l": 326.71701, "t": 407.28894, "r": 347.70377, "b": 415.3587, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 362.08801, "t": 407.22617, "r": 386.24887, "b": 415.15247, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "0.938", "bbox": {"l": 362.08801, "t": 407.22617, "r": 386.24887, "b": 415.15247, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 396.20599, "t": 407.28894, "r": 417.19275, "b": 415.3587, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "0.843", "bbox": {"l": 396.20599, "t": 407.28894, "r": 417.19275, "b": 415.3587, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 440.767, "t": 407.28894, "r": 457.14682, "b": 415.3587, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "3.77", "bbox": {"l": 440.767, "t": 407.28894, "r": 457.14682, "b": 415.3587, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 161.90601, "t": 426.11795, "r": 166.51294, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "2", "bbox": {"l": 161.90601, "t": 426.11795, "r": 166.51294, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 209.509, "t": 426.11795, "r": 214.11594, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "4", "bbox": {"l": 209.509, "t": 426.11795, "r": 214.11594, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 246.71000999999998, "t": 420.63895, "r": 271.40527, "b": 428.70871, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 420.63895, "r": 271.40527, "b": 428.70871, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 289.017, "t": 420.63895, "r": 310.00375, "b": 428.70871, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "0.923", "bbox": {"l": 289.017, "t": 420.63895, "r": 310.00375, "b": 428.70871, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 326.71701, "t": 420.63895, "r": 347.70377, "b": 428.70871, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "0.897", "bbox": {"l": 326.71701, "t": 420.63895, "r": 347.70377, "b": 428.70871, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 363.67599, "t": 420.63895, "r": 384.66275, "b": 428.70871, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "0.915", "bbox": {"l": 363.67599, "t": 420.63895, "r": 384.66275, "b": 428.70871, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 394.61801, "t": 420.57617, "r": 418.77887, "b": 428.50247, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "0.859", "bbox": {"l": 394.61801, "t": 420.57617, "r": 418.77887, "b": 428.50247, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 439.52701, "t": 420.57617, "r": 458.38425, "b": 428.50247, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "1.91", "bbox": {"l": 439.52701, "t": 420.57617, "r": 458.38425, "b": 428.50247, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 245.17598999999998, "t": 433.58994, "r": 272.93954, "b": 441.6597, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 433.58994, "r": 272.93954, "b": 441.6597, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 289.017, "t": 433.58994, "r": 310.00375, "b": 441.6597, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "0.945", "bbox": {"l": 289.017, "t": 433.58994, "r": 310.00375, "b": 441.6597, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 326.71701, "t": 433.58994, "r": 347.70377, "b": 441.6597, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "0.901", "bbox": {"l": 326.71701, "t": 433.58994, "r": 347.70377, "b": 441.6597, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 362.08801, "t": 433.5271599999999, "r": 386.24887, "b": 441.45346, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "0.931", "bbox": {"l": 362.08801, "t": 433.5271599999999, "r": 386.24887, "b": 441.45346, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 396.20599, "t": 433.58994, "r": 417.19275, "b": 441.6597, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "0.834", "bbox": {"l": 396.20599, "t": 433.58994, "r": 417.19275, "b": 441.6597, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 440.767, "t": 433.58994, "r": 457.14682, "b": 441.6597, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "3.81", "bbox": {"l": 440.767, "t": 433.58994, "r": 457.14682, "b": 441.6597, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 161.90601, "t": 452.41995, "r": 166.51294, "b": 460.48972, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "4", "bbox": {"l": 161.90601, "t": 452.41995, "r": 166.51294, "b": 460.48972, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 209.509, "t": 452.41995, "r": 214.11594, "b": 460.48972, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "2", "bbox": {"l": 209.509, "t": 452.41995, "r": 214.11594, "b": 460.48972, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 246.71000999999998, "t": 446.9399399999999, "r": 271.40527, "b": 455.0097, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 446.9399399999999, "r": 271.40527, "b": 455.0097, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 289.017, "t": 446.9399399999999, "r": 310.00375, "b": 455.0097, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "0.952", "bbox": {"l": 289.017, "t": 446.9399399999999, "r": 310.00375, "b": 455.0097, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 329.021, "t": 446.9399399999999, "r": 345.40082, "b": 455.0097, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "0.92", "bbox": {"l": 329.021, "t": 446.9399399999999, "r": 345.40082, "b": 455.0097, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 362.08801, "t": 446.87717, "r": 386.24887, "b": 454.80347, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "0.942", "bbox": {"l": 362.08801, "t": 446.87717, "r": 386.24887, "b": 454.80347, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 394.61801, "t": 446.87717, "r": 418.77887, "b": 454.80347, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "0.857", "bbox": {"l": 394.61801, "t": 446.87717, "r": 418.77887, "b": 454.80347, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 439.52701, "t": 446.87717, "r": 458.38425, "b": 454.80347, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "1.22", "bbox": {"l": 439.52701, "t": 446.87717, "r": 458.38425, "b": 454.80347, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 245.17598999999998, "t": 459.8919399999999, "r": 272.93954, "b": 467.9617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 459.8919399999999, "r": 272.93954, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 289.017, "t": 459.8919399999999, "r": 310.00375, "b": 467.9617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "0.944", "bbox": {"l": 289.017, "t": 459.8919399999999, "r": 310.00375, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 326.71701, "t": 459.8919399999999, "r": 347.70377, "b": 467.9617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "0.903", "bbox": {"l": 326.71701, "t": 459.8919399999999, "r": 347.70377, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 363.67599, "t": 459.8919399999999, "r": 384.66275, "b": 467.9617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "0.931", "bbox": {"l": 363.67599, "t": 459.8919399999999, "r": 384.66275, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 396.20599, "t": 459.8919399999999, "r": 417.19275, "b": 467.9617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "0.824", "bbox": {"l": 396.20599, "t": 459.8919399999999, "r": 417.19275, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 446.65302, "t": 459.8919399999999, "r": 451.25995, "b": 467.9617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "2", "bbox": {"l": 446.65302, "t": 459.8919399999999, "r": 451.25995, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "lcel", "lcel", "ched", "ched", "nl", "ched", "ched", "ucel", "ched", "ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 7, "num_cols": 8, "table_cells": [{"bbox": {"l": 160.37, "t": 341.73495, "r": 168.04793, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "#", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 144.592, "t": 354.68594, "r": 183.82806, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "enc-layers", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 207.974, "t": 341.73495, "r": 215.65193, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "#", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 192.19499, "t": 354.68594, "r": 231.43106, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "dec-layers", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 239.79799999999997, "t": 347.21396, "r": 278.31766, "b": 355.28372, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Language", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 324.67001, "t": 341.73495, "r": 348.26419, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 3, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 6, "text": "TEDs", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 396.271, "t": 341.73495, "r": 417.12683, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "mAP", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 394.927, "t": 352.69394000000005, "r": 418.47278, "b": 360.7637, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "(0.75)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 430.771, "t": 341.73495, "r": 467.1423, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "Inference", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 427.14801, "t": 352.69394000000005, "r": 470.76056, "b": 360.7637, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "time (secs)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 286.686, "t": 354.68594, "r": 312.33261, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "simple", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 320.702, "t": 354.68594, "r": 353.71988, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "complex", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 369.306, "t": 354.68594, "r": 379.03094, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "all", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 161.90601, "t": 373.51596, "r": 166.51294, "b": 381.58572, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 373.51596, "r": 214.11594, "b": 381.58572, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 368.03595, "r": 272.93954, "b": 389.05771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 368.03595, "r": 310.00375, "b": 389.05771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.965 0.969", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 368.03595, "r": 347.70377, "b": 389.05771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.934 0.927", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 363.67599, "t": 368.03595, "r": 384.66275, "b": 389.05771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.955 0.955", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 396.20599, "t": 367.97317999999996, "r": 417.19275, "b": 389.05771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.88 0.857", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 367.97317999999996, "r": 458.38425, "b": 389.05771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "2.73 5.39", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 161.90601, "t": 399.81696, "r": 166.51294, "b": 407.88672, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 399.81696, "r": 214.11594, "b": 407.88672, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 394.33795, "r": 272.93954, "b": 415.3587, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 394.33795, "r": 310.00375, "b": 415.3587, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.938 0.952", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 394.33795, "r": 347.70377, "b": 402.40771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.904", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 363.67599, "t": 394.33795, "r": 384.66275, "b": 402.40771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.927", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.61801, "t": 394.27518, "r": 418.77887, "b": 402.20148, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.853", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 394.27518, "r": 458.38425, "b": 402.20148, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "1.97", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 407.28894, "r": 347.70377, "b": 428.70871, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.909 0.897", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 362.08801, "t": 407.22617, "r": 386.24887, "b": 415.15247, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.938", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 396.20599, "t": 407.28894, "r": 417.19275, "b": 415.3587, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.843", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.767, "t": 407.28894, "r": 457.14682, "b": 415.3587, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "3.77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 161.90601, "t": 426.11795, "r": 166.51294, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 426.11795, "r": 214.11594, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 246.71000999999998, "t": 420.63895, "r": 271.40527, "b": 428.70871, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 420.63895, "r": 310.00375, "b": 441.6597, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.923 0.945", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 362.08801, "t": 420.63895, "r": 386.24887, "b": 441.45346, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.915 0.931", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.61801, "t": 420.57617, "r": 418.77887, "b": 441.6597, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.859 0.834", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 420.57617, "r": 458.38425, "b": 441.6597, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "1.91 3.81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 433.58994, "r": 272.93954, "b": 441.6597, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 433.58994, "r": 347.70377, "b": 441.6597, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.901", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 161.90601, "t": 452.41995, "r": 166.51294, "b": 460.48972, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 452.41995, "r": 214.11594, "b": 460.48972, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 446.9399399999999, "r": 272.93954, "b": 467.9617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 446.9399399999999, "r": 310.00375, "b": 467.9617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.952 0.944", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 446.9399399999999, "r": 347.70377, "b": 467.9617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.92 0.903", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 362.08801, "t": 446.87717, "r": 386.24887, "b": 467.9617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.942 0.931", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.61801, "t": 446.87717, "r": 418.77887, "b": 467.9617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.857 0.824", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 446.87717, "r": 458.38425, "b": 467.9617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "1.22 2", "column_header": false, "row_header": false, "row_section": false}]}}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_header", "id": 8, "page_no": 8, "cluster": {"id": 8, "label": "page_header", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9373378753662109, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Optimized Table Tokenization for Table Structure Recognition"}, {"label": "page_header", "id": 9, "page_no": 8, "cluster": {"id": 9, "label": "page_header", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8857625722885132, "cells": [{"id": 1, "text": "9", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "9"}, {"label": "text", "id": 4, "page_no": 8, "cluster": {"id": 4, "label": "text", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.59579, "b": 151.64178000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9805440306663513, "cells": [{"id": 2, "text": "order to compute the TED score. Inference timing results for all experiments", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.5936899999999, "b": 127.73077, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "were obtained from the same machine on a single core with AMD EPYC 7763", "bbox": {"l": 134.765, "t": 130.88878999999997, "r": 480.59579, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "CPU @2.45 GHz.", "bbox": {"l": 134.765, "t": 142.84479, "r": 210.78462, "b": 151.64178000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "order to compute the TED score. Inference timing results for all experiments were obtained from the same machine on a single core with AMD EPYC 7763 CPU @2.45 GHz."}, {"label": "section_header", "id": 6, "page_no": 8, "cluster": {"id": 6, "label": "section_header", "bbox": {"l": 134.765, "t": 169.18584999999996, "r": 318.44843, "b": 177.9928, "coord_origin": "TOPLEFT"}, "confidence": 0.9579681158065796, "cells": [{"id": 5, "text": "5.1", "bbox": {"l": 134.765, "t": 169.18584999999996, "r": 149.40205, "b": 177.9928, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Hyper Parameter Optimization", "bbox": {"l": 160.85904, "t": 169.18584999999996, "r": 318.44843, "b": 177.9928, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5.1 Hyper Parameter Optimization"}, {"label": "text", "id": 3, "page_no": 8, "cluster": {"id": 3, "label": "text", "bbox": {"l": 134.76498, "t": 185.58582, "r": 480.59277, "b": 254.15886999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.9842326641082764, "cells": [{"id": 7, "text": "We have chosen the PubTabNet data set to perform HPO, since it includes a", "bbox": {"l": 134.765, "t": 185.58582, "r": 480.59183, "b": 194.38280999999995, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "highly diverse set of tables. Also we report TED scores separately for simple and", "bbox": {"l": 134.765, "t": 197.54083000000003, "r": 480.59183, "b": 206.33783000000005, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "complex tables (tables with cell spans). Results are presented in Table. 1. It is", "bbox": {"l": 134.765, "t": 209.49585000000002, "r": 480.59177000000005, "b": 218.29285000000004, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "evident that with OTSL, our model achieves the same TED score and slightly", "bbox": {"l": 134.765, "t": 221.45087, "r": 480.59277, "b": 230.24785999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "better mAP scores in comparison to HTML. However OTSL yields a", "bbox": {"l": 134.765, "t": 233.40588000000002, "r": 440.94159, "b": 242.20288000000005, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "2x speed", "bbox": {"l": 444.86798, "t": 233.40588000000002, "r": 480.58786000000003, "b": 242.20288000000005, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "up", "bbox": {"l": 134.76498, "t": 245.36188000000004, "r": 145.20081, "b": 254.15886999999998, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "in the inference runtime over HTML.", "bbox": {"l": 149.14899, "t": 245.36188000000004, "r": 311.21957, "b": 254.15886999999998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "We have chosen the PubTabNet data set to perform HPO, since it includes a highly diverse set of tables. Also we report TED scores separately for simple and complex tables (tables with cell spans). Results are presented in Table. 1. It is evident that with OTSL, our model achieves the same TED score and slightly better mAP scores in comparison to HTML. However OTSL yields a 2x speed up in the inference runtime over HTML."}, {"label": "caption", "id": 7, "page_no": 8, "cluster": {"id": 7, "label": "caption", "bbox": {"l": 134.76498, "t": 275.07232999999997, "r": 480.5954, "b": 327.0408, "coord_origin": "TOPLEFT"}, "confidence": 0.9570781588554382, "cells": [{"id": 15, "text": "Table", "bbox": {"l": 134.76498, "t": 275.07232999999997, "r": 160.11836, "b": 282.9986, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "1.", "bbox": {"l": 167.34528, "t": 275.07232999999997, "r": 175.59526, "b": 282.9986, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "HPO performed in OTSL and HTML representation on the same", "bbox": {"l": 188.13298, "t": 275.13507000000004, "r": 480.59365999999994, "b": 283.2048300000001, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "transformer-based TableFormer [9] architecture, trained only on PubTabNet [22]. Ef-", "bbox": {"l": 134.76498, "t": 286.09409, "r": 480.59444999999994, "b": 294.16385, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "fects of reducing the # of layers in encoder and decoder stages of the model show that", "bbox": {"l": 134.76498, "t": 297.05307, "r": 480.5954, "b": 305.12283, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "smaller models trained on OTSL perform better, especially in recognizing complex", "bbox": {"l": 134.76498, "t": 308.01205, "r": 480.59451, "b": 316.08182, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "table structures, and maintain a much higher mAP score than the HTML counterpart.", "bbox": {"l": 134.76498, "t": 318.97104, "r": 480.59441999999996, "b": 327.0408, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 1. HPO performed in OTSL and HTML representation on the same transformer-based TableFormer [9] architecture, trained only on PubTabNet [22]. Effects of reducing the # of layers in encoder and decoder stages of the model show that smaller models trained on OTSL perform better, especially in recognizing complex table structures, and maintain a much higher mAP score than the HTML counterpart."}, {"label": "table", "id": 0, "page_no": 8, "cluster": {"id": 0, "label": "table", "bbox": {"l": 139.66845703125, "t": 337.5747985839844, "r": 475.00372314453125, "b": 469.4721374511719, "coord_origin": "TOPLEFT"}, "confidence": 0.9901032447814941, "cells": [{"id": 22, "text": "#", "bbox": {"l": 160.37, "t": 341.73495, "r": 168.04793, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "enc-layers", "bbox": {"l": 144.592, "t": 354.68594, "r": 183.82806, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "#", "bbox": {"l": 207.974, "t": 341.73495, "r": 215.65193, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "dec-layers", "bbox": {"l": 192.19499, "t": 354.68594, "r": 231.43106, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "Language", "bbox": {"l": 239.79799999999997, "t": 347.21396, "r": 278.31766, "b": 355.28372, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "TEDs", "bbox": {"l": 324.67001, "t": 341.73495, "r": 348.26419, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "mAP", "bbox": {"l": 396.271, "t": 341.73495, "r": 417.12683, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "(0.75)", "bbox": {"l": 394.927, "t": 352.69394000000005, "r": 418.47278, "b": 360.7637, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Inference", "bbox": {"l": 430.771, "t": 341.73495, "r": 467.1423, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "time (secs)", "bbox": {"l": 427.14801, "t": 352.69394000000005, "r": 470.76056, "b": 360.7637, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "simple", "bbox": {"l": 286.686, "t": 354.68594, "r": 312.33261, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "complex", "bbox": {"l": 320.702, "t": 354.68594, "r": 353.71988, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "all", "bbox": {"l": 369.306, "t": 354.68594, "r": 379.03094, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "6", "bbox": {"l": 161.90601, "t": 373.51596, "r": 166.51294, "b": 381.58572, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "6", "bbox": {"l": 209.509, "t": 373.51596, "r": 214.11594, "b": 381.58572, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 368.03595, "r": 271.40527, "b": 376.10571, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "0.965", "bbox": {"l": 289.017, "t": 368.03595, "r": 310.00375, "b": 376.10571, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "0.934", "bbox": {"l": 326.71701, "t": 368.03595, "r": 347.70377, "b": 376.10571, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "0.955", "bbox": {"l": 363.67599, "t": 368.03595, "r": 384.66275, "b": 376.10571, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "0.88", "bbox": {"l": 397.26999, "t": 367.97317999999996, "r": 416.12723, "b": 375.89948, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "2.73", "bbox": {"l": 439.52701, "t": 367.97317999999996, "r": 458.38425, "b": 375.89948, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 380.98795, "r": 272.93954, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "0.969", "bbox": {"l": 289.017, "t": 380.98795, "r": 310.00375, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "0.927", "bbox": {"l": 326.71701, "t": 380.98795, "r": 347.70377, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "0.955", "bbox": {"l": 363.67599, "t": 380.98795, "r": 384.66275, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "0.857", "bbox": {"l": 396.20599, "t": 380.98795, "r": 417.19275, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "5.39", "bbox": {"l": 440.767, "t": 380.98795, "r": 457.14682, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "4", "bbox": {"l": 161.90601, "t": 399.81696, "r": 166.51294, "b": 407.88672, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "4", "bbox": {"l": 209.509, "t": 399.81696, "r": 214.11594, "b": 407.88672, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 394.33795, "r": 271.40527, "b": 402.40771, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "0.938", "bbox": {"l": 289.017, "t": 394.33795, "r": 310.00375, "b": 402.40771, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "0.904", "bbox": {"l": 326.71701, "t": 394.33795, "r": 347.70377, "b": 402.40771, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "0.927", "bbox": {"l": 363.67599, "t": 394.33795, "r": 384.66275, "b": 402.40771, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "0.853", "bbox": {"l": 394.61801, "t": 394.27518, "r": 418.77887, "b": 402.20148, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "1.97", "bbox": {"l": 439.52701, "t": 394.27518, "r": 458.38425, "b": 402.20148, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 407.28894, "r": 272.93954, "b": 415.3587, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "0.952", "bbox": {"l": 289.017, "t": 407.28894, "r": 310.00375, "b": 415.3587, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "0.909", "bbox": {"l": 326.71701, "t": 407.28894, "r": 347.70377, "b": 415.3587, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "0.938", "bbox": {"l": 362.08801, "t": 407.22617, "r": 386.24887, "b": 415.15247, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "0.843", "bbox": {"l": 396.20599, "t": 407.28894, "r": 417.19275, "b": 415.3587, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "3.77", "bbox": {"l": 440.767, "t": 407.28894, "r": 457.14682, "b": 415.3587, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "2", "bbox": {"l": 161.90601, "t": 426.11795, "r": 166.51294, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "4", "bbox": {"l": 209.509, "t": 426.11795, "r": 214.11594, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 420.63895, "r": 271.40527, "b": 428.70871, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "0.923", "bbox": {"l": 289.017, "t": 420.63895, "r": 310.00375, "b": 428.70871, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "0.897", "bbox": {"l": 326.71701, "t": 420.63895, "r": 347.70377, "b": 428.70871, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "0.915", "bbox": {"l": 363.67599, "t": 420.63895, "r": 384.66275, "b": 428.70871, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "0.859", "bbox": {"l": 394.61801, "t": 420.57617, "r": 418.77887, "b": 428.50247, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "1.91", "bbox": {"l": 439.52701, "t": 420.57617, "r": 458.38425, "b": 428.50247, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 433.58994, "r": 272.93954, "b": 441.6597, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "0.945", "bbox": {"l": 289.017, "t": 433.58994, "r": 310.00375, "b": 441.6597, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "0.901", "bbox": {"l": 326.71701, "t": 433.58994, "r": 347.70377, "b": 441.6597, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "0.931", "bbox": {"l": 362.08801, "t": 433.5271599999999, "r": 386.24887, "b": 441.45346, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "0.834", "bbox": {"l": 396.20599, "t": 433.58994, "r": 417.19275, "b": 441.6597, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "3.81", "bbox": {"l": 440.767, "t": 433.58994, "r": 457.14682, "b": 441.6597, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "4", "bbox": {"l": 161.90601, "t": 452.41995, "r": 166.51294, "b": 460.48972, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "2", "bbox": {"l": 209.509, "t": 452.41995, "r": 214.11594, "b": 460.48972, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 446.9399399999999, "r": 271.40527, "b": 455.0097, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "0.952", "bbox": {"l": 289.017, "t": 446.9399399999999, "r": 310.00375, "b": 455.0097, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "0.92", "bbox": {"l": 329.021, "t": 446.9399399999999, "r": 345.40082, "b": 455.0097, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "0.942", "bbox": {"l": 362.08801, "t": 446.87717, "r": 386.24887, "b": 454.80347, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "0.857", "bbox": {"l": 394.61801, "t": 446.87717, "r": 418.77887, "b": 454.80347, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "1.22", "bbox": {"l": 439.52701, "t": 446.87717, "r": 458.38425, "b": 454.80347, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 459.8919399999999, "r": 272.93954, "b": 467.9617, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "0.944", "bbox": {"l": 289.017, "t": 459.8919399999999, "r": 310.00375, "b": 467.9617, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "0.903", "bbox": {"l": 326.71701, "t": 459.8919399999999, "r": 347.70377, "b": 467.9617, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "0.931", "bbox": {"l": 363.67599, "t": 459.8919399999999, "r": 384.66275, "b": 467.9617, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "0.824", "bbox": {"l": 396.20599, "t": 459.8919399999999, "r": 417.19275, "b": 467.9617, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "2", "bbox": {"l": 446.65302, "t": 459.8919399999999, "r": 451.25995, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": [{"id": 10, "label": "text", "bbox": {"l": 160.37, "t": 341.73495, "r": 168.04793, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "#", "bbox": {"l": 160.37, "t": 341.73495, "r": 168.04793, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 144.592, "t": 354.68594, "r": 183.82806, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "enc-layers", "bbox": {"l": 144.592, "t": 354.68594, "r": 183.82806, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 207.974, "t": 341.73495, "r": 215.65193, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "#", "bbox": {"l": 207.974, "t": 341.73495, "r": 215.65193, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 192.19499, "t": 354.68594, "r": 231.43106, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "dec-layers", "bbox": {"l": 192.19499, "t": 354.68594, "r": 231.43106, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 239.79799999999997, "t": 347.21396, "r": 278.31766, "b": 355.28372, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "Language", "bbox": {"l": 239.79799999999997, "t": 347.21396, "r": 278.31766, "b": 355.28372, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 324.67001, "t": 341.73495, "r": 348.26419, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "TEDs", "bbox": {"l": 324.67001, "t": 341.73495, "r": 348.26419, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 396.271, "t": 341.73495, "r": 417.12683, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "mAP", "bbox": {"l": 396.271, "t": 341.73495, "r": 417.12683, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 394.927, "t": 352.69394000000005, "r": 418.47278, "b": 360.7637, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "(0.75)", "bbox": {"l": 394.927, "t": 352.69394000000005, "r": 418.47278, "b": 360.7637, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 430.771, "t": 341.73495, "r": 467.1423, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "Inference", "bbox": {"l": 430.771, "t": 341.73495, "r": 467.1423, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 427.14801, "t": 352.69394000000005, "r": 470.76056, "b": 360.7637, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "time (secs)", "bbox": {"l": 427.14801, "t": 352.69394000000005, "r": 470.76056, "b": 360.7637, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 286.686, "t": 354.68594, "r": 312.33261, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "simple", "bbox": {"l": 286.686, "t": 354.68594, "r": 312.33261, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 320.702, "t": 354.68594, "r": 353.71988, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "complex", "bbox": {"l": 320.702, "t": 354.68594, "r": 353.71988, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 369.306, "t": 354.68594, "r": 379.03094, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "all", "bbox": {"l": 369.306, "t": 354.68594, "r": 379.03094, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 161.90601, "t": 373.51596, "r": 166.51294, "b": 381.58572, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "6", "bbox": {"l": 161.90601, "t": 373.51596, "r": 166.51294, "b": 381.58572, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 209.509, "t": 373.51596, "r": 214.11594, "b": 381.58572, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "6", "bbox": {"l": 209.509, "t": 373.51596, "r": 214.11594, "b": 381.58572, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 246.71000999999998, "t": 368.03595, "r": 271.40527, "b": 376.10571, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 368.03595, "r": 271.40527, "b": 376.10571, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 289.017, "t": 368.03595, "r": 310.00375, "b": 376.10571, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "0.965", "bbox": {"l": 289.017, "t": 368.03595, "r": 310.00375, "b": 376.10571, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 326.71701, "t": 368.03595, "r": 347.70377, "b": 376.10571, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "0.934", "bbox": {"l": 326.71701, "t": 368.03595, "r": 347.70377, "b": 376.10571, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 363.67599, "t": 368.03595, "r": 384.66275, "b": 376.10571, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "0.955", "bbox": {"l": 363.67599, "t": 368.03595, "r": 384.66275, "b": 376.10571, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 397.26999, "t": 367.97317999999996, "r": 416.12723, "b": 375.89948, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "0.88", "bbox": {"l": 397.26999, "t": 367.97317999999996, "r": 416.12723, "b": 375.89948, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 439.52701, "t": 367.97317999999996, "r": 458.38425, "b": 375.89948, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "2.73", "bbox": {"l": 439.52701, "t": 367.97317999999996, "r": 458.38425, "b": 375.89948, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 245.17598999999998, "t": 380.98795, "r": 272.93954, "b": 389.05771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 380.98795, "r": 272.93954, "b": 389.05771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 289.017, "t": 380.98795, "r": 310.00375, "b": 389.05771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "0.969", "bbox": {"l": 289.017, "t": 380.98795, "r": 310.00375, "b": 389.05771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 326.71701, "t": 380.98795, "r": 347.70377, "b": 389.05771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "0.927", "bbox": {"l": 326.71701, "t": 380.98795, "r": 347.70377, "b": 389.05771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 363.67599, "t": 380.98795, "r": 384.66275, "b": 389.05771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "0.955", "bbox": {"l": 363.67599, "t": 380.98795, "r": 384.66275, "b": 389.05771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 396.20599, "t": 380.98795, "r": 417.19275, "b": 389.05771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "0.857", "bbox": {"l": 396.20599, "t": 380.98795, "r": 417.19275, "b": 389.05771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 440.767, "t": 380.98795, "r": 457.14682, "b": 389.05771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "5.39", "bbox": {"l": 440.767, "t": 380.98795, "r": 457.14682, "b": 389.05771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 161.90601, "t": 399.81696, "r": 166.51294, "b": 407.88672, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "4", "bbox": {"l": 161.90601, "t": 399.81696, "r": 166.51294, "b": 407.88672, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 209.509, "t": 399.81696, "r": 214.11594, "b": 407.88672, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "4", "bbox": {"l": 209.509, "t": 399.81696, "r": 214.11594, "b": 407.88672, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 246.71000999999998, "t": 394.33795, "r": 271.40527, "b": 402.40771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 394.33795, "r": 271.40527, "b": 402.40771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 289.017, "t": 394.33795, "r": 310.00375, "b": 402.40771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "0.938", "bbox": {"l": 289.017, "t": 394.33795, "r": 310.00375, "b": 402.40771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 326.71701, "t": 394.33795, "r": 347.70377, "b": 402.40771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "0.904", "bbox": {"l": 326.71701, "t": 394.33795, "r": 347.70377, "b": 402.40771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 363.67599, "t": 394.33795, "r": 384.66275, "b": 402.40771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "0.927", "bbox": {"l": 363.67599, "t": 394.33795, "r": 384.66275, "b": 402.40771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 394.61801, "t": 394.27518, "r": 418.77887, "b": 402.20148, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "0.853", "bbox": {"l": 394.61801, "t": 394.27518, "r": 418.77887, "b": 402.20148, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 439.52701, "t": 394.27518, "r": 458.38425, "b": 402.20148, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "1.97", "bbox": {"l": 439.52701, "t": 394.27518, "r": 458.38425, "b": 402.20148, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 245.17598999999998, "t": 407.28894, "r": 272.93954, "b": 415.3587, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 407.28894, "r": 272.93954, "b": 415.3587, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 289.017, "t": 407.28894, "r": 310.00375, "b": 415.3587, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "0.952", "bbox": {"l": 289.017, "t": 407.28894, "r": 310.00375, "b": 415.3587, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 326.71701, "t": 407.28894, "r": 347.70377, "b": 415.3587, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "0.909", "bbox": {"l": 326.71701, "t": 407.28894, "r": 347.70377, "b": 415.3587, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 362.08801, "t": 407.22617, "r": 386.24887, "b": 415.15247, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "0.938", "bbox": {"l": 362.08801, "t": 407.22617, "r": 386.24887, "b": 415.15247, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 396.20599, "t": 407.28894, "r": 417.19275, "b": 415.3587, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "0.843", "bbox": {"l": 396.20599, "t": 407.28894, "r": 417.19275, "b": 415.3587, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 440.767, "t": 407.28894, "r": 457.14682, "b": 415.3587, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "3.77", "bbox": {"l": 440.767, "t": 407.28894, "r": 457.14682, "b": 415.3587, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 161.90601, "t": 426.11795, "r": 166.51294, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "2", "bbox": {"l": 161.90601, "t": 426.11795, "r": 166.51294, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 209.509, "t": 426.11795, "r": 214.11594, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "4", "bbox": {"l": 209.509, "t": 426.11795, "r": 214.11594, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 246.71000999999998, "t": 420.63895, "r": 271.40527, "b": 428.70871, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 420.63895, "r": 271.40527, "b": 428.70871, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 289.017, "t": 420.63895, "r": 310.00375, "b": 428.70871, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "0.923", "bbox": {"l": 289.017, "t": 420.63895, "r": 310.00375, "b": 428.70871, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 326.71701, "t": 420.63895, "r": 347.70377, "b": 428.70871, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "0.897", "bbox": {"l": 326.71701, "t": 420.63895, "r": 347.70377, "b": 428.70871, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 363.67599, "t": 420.63895, "r": 384.66275, "b": 428.70871, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "0.915", "bbox": {"l": 363.67599, "t": 420.63895, "r": 384.66275, "b": 428.70871, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 394.61801, "t": 420.57617, "r": 418.77887, "b": 428.50247, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "0.859", "bbox": {"l": 394.61801, "t": 420.57617, "r": 418.77887, "b": 428.50247, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 439.52701, "t": 420.57617, "r": 458.38425, "b": 428.50247, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "1.91", "bbox": {"l": 439.52701, "t": 420.57617, "r": 458.38425, "b": 428.50247, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 245.17598999999998, "t": 433.58994, "r": 272.93954, "b": 441.6597, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 433.58994, "r": 272.93954, "b": 441.6597, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 289.017, "t": 433.58994, "r": 310.00375, "b": 441.6597, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "0.945", "bbox": {"l": 289.017, "t": 433.58994, "r": 310.00375, "b": 441.6597, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 326.71701, "t": 433.58994, "r": 347.70377, "b": 441.6597, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "0.901", "bbox": {"l": 326.71701, "t": 433.58994, "r": 347.70377, "b": 441.6597, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 362.08801, "t": 433.5271599999999, "r": 386.24887, "b": 441.45346, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "0.931", "bbox": {"l": 362.08801, "t": 433.5271599999999, "r": 386.24887, "b": 441.45346, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 396.20599, "t": 433.58994, "r": 417.19275, "b": 441.6597, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "0.834", "bbox": {"l": 396.20599, "t": 433.58994, "r": 417.19275, "b": 441.6597, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 440.767, "t": 433.58994, "r": 457.14682, "b": 441.6597, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "3.81", "bbox": {"l": 440.767, "t": 433.58994, "r": 457.14682, "b": 441.6597, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 161.90601, "t": 452.41995, "r": 166.51294, "b": 460.48972, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "4", "bbox": {"l": 161.90601, "t": 452.41995, "r": 166.51294, "b": 460.48972, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 209.509, "t": 452.41995, "r": 214.11594, "b": 460.48972, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "2", "bbox": {"l": 209.509, "t": 452.41995, "r": 214.11594, "b": 460.48972, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 246.71000999999998, "t": 446.9399399999999, "r": 271.40527, "b": 455.0097, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 446.9399399999999, "r": 271.40527, "b": 455.0097, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 289.017, "t": 446.9399399999999, "r": 310.00375, "b": 455.0097, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "0.952", "bbox": {"l": 289.017, "t": 446.9399399999999, "r": 310.00375, "b": 455.0097, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 329.021, "t": 446.9399399999999, "r": 345.40082, "b": 455.0097, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "0.92", "bbox": {"l": 329.021, "t": 446.9399399999999, "r": 345.40082, "b": 455.0097, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 362.08801, "t": 446.87717, "r": 386.24887, "b": 454.80347, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "0.942", "bbox": {"l": 362.08801, "t": 446.87717, "r": 386.24887, "b": 454.80347, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 394.61801, "t": 446.87717, "r": 418.77887, "b": 454.80347, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "0.857", "bbox": {"l": 394.61801, "t": 446.87717, "r": 418.77887, "b": 454.80347, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 439.52701, "t": 446.87717, "r": 458.38425, "b": 454.80347, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "1.22", "bbox": {"l": 439.52701, "t": 446.87717, "r": 458.38425, "b": 454.80347, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 245.17598999999998, "t": 459.8919399999999, "r": 272.93954, "b": 467.9617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 459.8919399999999, "r": 272.93954, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 289.017, "t": 459.8919399999999, "r": 310.00375, "b": 467.9617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "0.944", "bbox": {"l": 289.017, "t": 459.8919399999999, "r": 310.00375, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 326.71701, "t": 459.8919399999999, "r": 347.70377, "b": 467.9617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "0.903", "bbox": {"l": 326.71701, "t": 459.8919399999999, "r": 347.70377, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 363.67599, "t": 459.8919399999999, "r": 384.66275, "b": 467.9617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "0.931", "bbox": {"l": 363.67599, "t": 459.8919399999999, "r": 384.66275, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 396.20599, "t": 459.8919399999999, "r": 417.19275, "b": 467.9617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "0.824", "bbox": {"l": 396.20599, "t": 459.8919399999999, "r": 417.19275, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 446.65302, "t": 459.8919399999999, "r": 451.25995, "b": 467.9617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "2", "bbox": {"l": 446.65302, "t": 459.8919399999999, "r": 451.25995, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "lcel", "lcel", "ched", "ched", "nl", "ched", "ched", "ucel", "ched", "ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 7, "num_cols": 8, "table_cells": [{"bbox": {"l": 160.37, "t": 341.73495, "r": 168.04793, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "#", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 144.592, "t": 354.68594, "r": 183.82806, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "enc-layers", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 207.974, "t": 341.73495, "r": 215.65193, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "#", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 192.19499, "t": 354.68594, "r": 231.43106, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "dec-layers", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 239.79799999999997, "t": 347.21396, "r": 278.31766, "b": 355.28372, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Language", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 324.67001, "t": 341.73495, "r": 348.26419, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 3, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 6, "text": "TEDs", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 396.271, "t": 341.73495, "r": 417.12683, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "mAP", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 394.927, "t": 352.69394000000005, "r": 418.47278, "b": 360.7637, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "(0.75)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 430.771, "t": 341.73495, "r": 467.1423, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "Inference", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 427.14801, "t": 352.69394000000005, "r": 470.76056, "b": 360.7637, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "time (secs)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 286.686, "t": 354.68594, "r": 312.33261, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "simple", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 320.702, "t": 354.68594, "r": 353.71988, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "complex", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 369.306, "t": 354.68594, "r": 379.03094, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "all", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 161.90601, "t": 373.51596, "r": 166.51294, "b": 381.58572, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 373.51596, "r": 214.11594, "b": 381.58572, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 368.03595, "r": 272.93954, "b": 389.05771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 368.03595, "r": 310.00375, "b": 389.05771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.965 0.969", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 368.03595, "r": 347.70377, "b": 389.05771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.934 0.927", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 363.67599, "t": 368.03595, "r": 384.66275, "b": 389.05771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.955 0.955", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 396.20599, "t": 367.97317999999996, "r": 417.19275, "b": 389.05771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.88 0.857", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 367.97317999999996, "r": 458.38425, "b": 389.05771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "2.73 5.39", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 161.90601, "t": 399.81696, "r": 166.51294, "b": 407.88672, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 399.81696, "r": 214.11594, "b": 407.88672, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 394.33795, "r": 272.93954, "b": 415.3587, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 394.33795, "r": 310.00375, "b": 415.3587, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.938 0.952", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 394.33795, "r": 347.70377, "b": 402.40771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.904", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 363.67599, "t": 394.33795, "r": 384.66275, "b": 402.40771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.927", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.61801, "t": 394.27518, "r": 418.77887, "b": 402.20148, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.853", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 394.27518, "r": 458.38425, "b": 402.20148, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "1.97", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 407.28894, "r": 347.70377, "b": 428.70871, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.909 0.897", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 362.08801, "t": 407.22617, "r": 386.24887, "b": 415.15247, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.938", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 396.20599, "t": 407.28894, "r": 417.19275, "b": 415.3587, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.843", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.767, "t": 407.28894, "r": 457.14682, "b": 415.3587, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "3.77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 161.90601, "t": 426.11795, "r": 166.51294, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 426.11795, "r": 214.11594, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 246.71000999999998, "t": 420.63895, "r": 271.40527, "b": 428.70871, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 420.63895, "r": 310.00375, "b": 441.6597, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.923 0.945", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 362.08801, "t": 420.63895, "r": 386.24887, "b": 441.45346, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.915 0.931", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.61801, "t": 420.57617, "r": 418.77887, "b": 441.6597, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.859 0.834", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 420.57617, "r": 458.38425, "b": 441.6597, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "1.91 3.81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 433.58994, "r": 272.93954, "b": 441.6597, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 433.58994, "r": 347.70377, "b": 441.6597, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.901", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 161.90601, "t": 452.41995, "r": 166.51294, "b": 460.48972, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 452.41995, "r": 214.11594, "b": 460.48972, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 446.9399399999999, "r": 272.93954, "b": 467.9617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 446.9399399999999, "r": 310.00375, "b": 467.9617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.952 0.944", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 446.9399399999999, "r": 347.70377, "b": 467.9617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.92 0.903", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 362.08801, "t": 446.87717, "r": 386.24887, "b": 467.9617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.942 0.931", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.61801, "t": 446.87717, "r": 418.77887, "b": 467.9617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.857 0.824", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 446.87717, "r": 458.38425, "b": 467.9617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "1.22 2", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "section_header", "id": 5, "page_no": 8, "cluster": {"id": 5, "label": "section_header", "bbox": {"l": 134.765, "t": 508.15179, "r": 264.40332, "b": 516.95874, "coord_origin": "TOPLEFT"}, "confidence": 0.9592539668083191, "cells": [{"id": 91, "text": "5.2", "bbox": {"l": 134.765, "t": 508.15179, "r": 149.40205, "b": 516.95874, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Quantitative Results", "bbox": {"l": 160.85904, "t": 508.15179, "r": 264.40332, "b": 516.95874, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5.2 Quantitative Results"}, {"label": "text", "id": 1, "page_no": 8, "cluster": {"id": 1, "label": "text", "bbox": {"l": 134.765, "t": 524.55078, "r": 480.5957599999999, "b": 617.03474, "coord_origin": "TOPLEFT"}, "confidence": 0.9854757189750671, "cells": [{"id": 93, "text": "We picked the model parameter configuration that produced the best prediction", "bbox": {"l": 134.765, "t": 524.55078, "r": 480.59075999999993, "b": 533.34775, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "quality (enc=6, dec=6, heads=8) with PubTabNet alone, then independently", "bbox": {"l": 134.765, "t": 536.50677, "r": 480.58675999999997, "b": 545.3037400000001, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "trained and evaluated it on three publicly available data sets: PubTabNet (395k", "bbox": {"l": 134.765, "t": 548.4617800000001, "r": 480.59572999999995, "b": 557.25874, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "samples), FinTabNet (113k samples) and PubTables-1M (about 1M samples).", "bbox": {"l": 134.765, "t": 560.41678, "r": 480.59177000000005, "b": 569.21375, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "Performance results are presented in Table. 2. It is clearly evident that the model", "bbox": {"l": 134.765, "t": 572.37178, "r": 480.59069999999997, "b": 581.16875, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "trained on OTSL outperforms HTML across the board, keeping high TEDs and", "bbox": {"l": 134.765, "t": 584.32678, "r": 480.5957599999999, "b": 593.12375, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "mAP scores even on difficult financial tables (FinTabNet) that contain sparse", "bbox": {"l": 134.765, "t": 596.28278, "r": 480.58774, "b": 605.07974, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "and large tables.", "bbox": {"l": 134.765, "t": 608.2377799999999, "r": 206.78664, "b": 617.03474, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "We picked the model parameter configuration that produced the best prediction quality (enc=6, dec=6, heads=8) with PubTabNet alone, then independently trained and evaluated it on three publicly available data sets: PubTabNet (395k samples), FinTabNet (113k samples) and PubTables-1M (about 1M samples). Performance results are presented in Table. 2. It is clearly evident that the model trained on OTSL outperforms HTML across the board, keeping high TEDs and mAP scores even on difficult financial tables (FinTabNet) that contain sparse and large tables."}, {"label": "text", "id": 2, "page_no": 8, "cluster": {"id": 2, "label": "text", "bbox": {"l": 134.765, "t": 620.19278, "r": 480.5957599999999, "b": 664.8547599999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9851234555244446, "cells": [{"id": 101, "text": "Additionally, the results show that OTSL has an advantage over HTML", "bbox": {"l": 149.709, "t": 620.19278, "r": 480.59271, "b": 628.98975, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "when applied on a bigger data set like PubTables-1M and achieves significantly", "bbox": {"l": 134.765, "t": 632.14778, "r": 480.5957599999999, "b": 640.94475, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "improved scores. Finally, OTSL achieves faster inference due to fewer decoding", "bbox": {"l": 134.765, "t": 644.1027799999999, "r": 480.59283000000005, "b": 652.89975, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "steps which is a result of the reduced sequence representation.", "bbox": {"l": 134.765, "t": 656.0577900000001, "r": 405.79651, "b": 664.8547599999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Additionally, the results show that OTSL has an advantage over HTML when applied on a bigger data set like PubTables-1M and achieves significantly improved scores. Finally, OTSL achieves faster inference due to fewer decoding steps which is a result of the reduced sequence representation."}], "body": [{"label": "text", "id": 4, "page_no": 8, "cluster": {"id": 4, "label": "text", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.59579, "b": 151.64178000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9805440306663513, "cells": [{"id": 2, "text": "order to compute the TED score. Inference timing results for all experiments", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.5936899999999, "b": 127.73077, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "were obtained from the same machine on a single core with AMD EPYC 7763", "bbox": {"l": 134.765, "t": 130.88878999999997, "r": 480.59579, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "CPU @2.45 GHz.", "bbox": {"l": 134.765, "t": 142.84479, "r": 210.78462, "b": 151.64178000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "order to compute the TED score. Inference timing results for all experiments were obtained from the same machine on a single core with AMD EPYC 7763 CPU @2.45 GHz."}, {"label": "section_header", "id": 6, "page_no": 8, "cluster": {"id": 6, "label": "section_header", "bbox": {"l": 134.765, "t": 169.18584999999996, "r": 318.44843, "b": 177.9928, "coord_origin": "TOPLEFT"}, "confidence": 0.9579681158065796, "cells": [{"id": 5, "text": "5.1", "bbox": {"l": 134.765, "t": 169.18584999999996, "r": 149.40205, "b": 177.9928, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Hyper Parameter Optimization", "bbox": {"l": 160.85904, "t": 169.18584999999996, "r": 318.44843, "b": 177.9928, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5.1 Hyper Parameter Optimization"}, {"label": "text", "id": 3, "page_no": 8, "cluster": {"id": 3, "label": "text", "bbox": {"l": 134.76498, "t": 185.58582, "r": 480.59277, "b": 254.15886999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.9842326641082764, "cells": [{"id": 7, "text": "We have chosen the PubTabNet data set to perform HPO, since it includes a", "bbox": {"l": 134.765, "t": 185.58582, "r": 480.59183, "b": 194.38280999999995, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "highly diverse set of tables. Also we report TED scores separately for simple and", "bbox": {"l": 134.765, "t": 197.54083000000003, "r": 480.59183, "b": 206.33783000000005, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "complex tables (tables with cell spans). Results are presented in Table. 1. It is", "bbox": {"l": 134.765, "t": 209.49585000000002, "r": 480.59177000000005, "b": 218.29285000000004, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "evident that with OTSL, our model achieves the same TED score and slightly", "bbox": {"l": 134.765, "t": 221.45087, "r": 480.59277, "b": 230.24785999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "better mAP scores in comparison to HTML. However OTSL yields a", "bbox": {"l": 134.765, "t": 233.40588000000002, "r": 440.94159, "b": 242.20288000000005, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "2x speed", "bbox": {"l": 444.86798, "t": 233.40588000000002, "r": 480.58786000000003, "b": 242.20288000000005, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "up", "bbox": {"l": 134.76498, "t": 245.36188000000004, "r": 145.20081, "b": 254.15886999999998, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "in the inference runtime over HTML.", "bbox": {"l": 149.14899, "t": 245.36188000000004, "r": 311.21957, "b": 254.15886999999998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "We have chosen the PubTabNet data set to perform HPO, since it includes a highly diverse set of tables. Also we report TED scores separately for simple and complex tables (tables with cell spans). Results are presented in Table. 1. It is evident that with OTSL, our model achieves the same TED score and slightly better mAP scores in comparison to HTML. However OTSL yields a 2x speed up in the inference runtime over HTML."}, {"label": "caption", "id": 7, "page_no": 8, "cluster": {"id": 7, "label": "caption", "bbox": {"l": 134.76498, "t": 275.07232999999997, "r": 480.5954, "b": 327.0408, "coord_origin": "TOPLEFT"}, "confidence": 0.9570781588554382, "cells": [{"id": 15, "text": "Table", "bbox": {"l": 134.76498, "t": 275.07232999999997, "r": 160.11836, "b": 282.9986, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "1.", "bbox": {"l": 167.34528, "t": 275.07232999999997, "r": 175.59526, "b": 282.9986, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "HPO performed in OTSL and HTML representation on the same", "bbox": {"l": 188.13298, "t": 275.13507000000004, "r": 480.59365999999994, "b": 283.2048300000001, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "transformer-based TableFormer [9] architecture, trained only on PubTabNet [22]. Ef-", "bbox": {"l": 134.76498, "t": 286.09409, "r": 480.59444999999994, "b": 294.16385, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "fects of reducing the # of layers in encoder and decoder stages of the model show that", "bbox": {"l": 134.76498, "t": 297.05307, "r": 480.5954, "b": 305.12283, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "smaller models trained on OTSL perform better, especially in recognizing complex", "bbox": {"l": 134.76498, "t": 308.01205, "r": 480.59451, "b": 316.08182, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "table structures, and maintain a much higher mAP score than the HTML counterpart.", "bbox": {"l": 134.76498, "t": 318.97104, "r": 480.59441999999996, "b": 327.0408, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 1. HPO performed in OTSL and HTML representation on the same transformer-based TableFormer [9] architecture, trained only on PubTabNet [22]. Effects of reducing the # of layers in encoder and decoder stages of the model show that smaller models trained on OTSL perform better, especially in recognizing complex table structures, and maintain a much higher mAP score than the HTML counterpart."}, {"label": "table", "id": 0, "page_no": 8, "cluster": {"id": 0, "label": "table", "bbox": {"l": 139.66845703125, "t": 337.5747985839844, "r": 475.00372314453125, "b": 469.4721374511719, "coord_origin": "TOPLEFT"}, "confidence": 0.9901032447814941, "cells": [{"id": 22, "text": "#", "bbox": {"l": 160.37, "t": 341.73495, "r": 168.04793, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "enc-layers", "bbox": {"l": 144.592, "t": 354.68594, "r": 183.82806, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "#", "bbox": {"l": 207.974, "t": 341.73495, "r": 215.65193, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "dec-layers", "bbox": {"l": 192.19499, "t": 354.68594, "r": 231.43106, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "Language", "bbox": {"l": 239.79799999999997, "t": 347.21396, "r": 278.31766, "b": 355.28372, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "TEDs", "bbox": {"l": 324.67001, "t": 341.73495, "r": 348.26419, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "mAP", "bbox": {"l": 396.271, "t": 341.73495, "r": 417.12683, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "(0.75)", "bbox": {"l": 394.927, "t": 352.69394000000005, "r": 418.47278, "b": 360.7637, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Inference", "bbox": {"l": 430.771, "t": 341.73495, "r": 467.1423, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "time (secs)", "bbox": {"l": 427.14801, "t": 352.69394000000005, "r": 470.76056, "b": 360.7637, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "simple", "bbox": {"l": 286.686, "t": 354.68594, "r": 312.33261, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "complex", "bbox": {"l": 320.702, "t": 354.68594, "r": 353.71988, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "all", "bbox": {"l": 369.306, "t": 354.68594, "r": 379.03094, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "6", "bbox": {"l": 161.90601, "t": 373.51596, "r": 166.51294, "b": 381.58572, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "6", "bbox": {"l": 209.509, "t": 373.51596, "r": 214.11594, "b": 381.58572, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 368.03595, "r": 271.40527, "b": 376.10571, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "0.965", "bbox": {"l": 289.017, "t": 368.03595, "r": 310.00375, "b": 376.10571, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "0.934", "bbox": {"l": 326.71701, "t": 368.03595, "r": 347.70377, "b": 376.10571, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "0.955", "bbox": {"l": 363.67599, "t": 368.03595, "r": 384.66275, "b": 376.10571, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "0.88", "bbox": {"l": 397.26999, "t": 367.97317999999996, "r": 416.12723, "b": 375.89948, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "2.73", "bbox": {"l": 439.52701, "t": 367.97317999999996, "r": 458.38425, "b": 375.89948, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 380.98795, "r": 272.93954, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "0.969", "bbox": {"l": 289.017, "t": 380.98795, "r": 310.00375, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "0.927", "bbox": {"l": 326.71701, "t": 380.98795, "r": 347.70377, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "0.955", "bbox": {"l": 363.67599, "t": 380.98795, "r": 384.66275, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "0.857", "bbox": {"l": 396.20599, "t": 380.98795, "r": 417.19275, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "5.39", "bbox": {"l": 440.767, "t": 380.98795, "r": 457.14682, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "4", "bbox": {"l": 161.90601, "t": 399.81696, "r": 166.51294, "b": 407.88672, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "4", "bbox": {"l": 209.509, "t": 399.81696, "r": 214.11594, "b": 407.88672, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 394.33795, "r": 271.40527, "b": 402.40771, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "0.938", "bbox": {"l": 289.017, "t": 394.33795, "r": 310.00375, "b": 402.40771, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "0.904", "bbox": {"l": 326.71701, "t": 394.33795, "r": 347.70377, "b": 402.40771, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "0.927", "bbox": {"l": 363.67599, "t": 394.33795, "r": 384.66275, "b": 402.40771, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "0.853", "bbox": {"l": 394.61801, "t": 394.27518, "r": 418.77887, "b": 402.20148, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "1.97", "bbox": {"l": 439.52701, "t": 394.27518, "r": 458.38425, "b": 402.20148, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 407.28894, "r": 272.93954, "b": 415.3587, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "0.952", "bbox": {"l": 289.017, "t": 407.28894, "r": 310.00375, "b": 415.3587, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "0.909", "bbox": {"l": 326.71701, "t": 407.28894, "r": 347.70377, "b": 415.3587, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "0.938", "bbox": {"l": 362.08801, "t": 407.22617, "r": 386.24887, "b": 415.15247, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "0.843", "bbox": {"l": 396.20599, "t": 407.28894, "r": 417.19275, "b": 415.3587, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "3.77", "bbox": {"l": 440.767, "t": 407.28894, "r": 457.14682, "b": 415.3587, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "2", "bbox": {"l": 161.90601, "t": 426.11795, "r": 166.51294, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "4", "bbox": {"l": 209.509, "t": 426.11795, "r": 214.11594, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 420.63895, "r": 271.40527, "b": 428.70871, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "0.923", "bbox": {"l": 289.017, "t": 420.63895, "r": 310.00375, "b": 428.70871, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "0.897", "bbox": {"l": 326.71701, "t": 420.63895, "r": 347.70377, "b": 428.70871, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "0.915", "bbox": {"l": 363.67599, "t": 420.63895, "r": 384.66275, "b": 428.70871, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "0.859", "bbox": {"l": 394.61801, "t": 420.57617, "r": 418.77887, "b": 428.50247, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "1.91", "bbox": {"l": 439.52701, "t": 420.57617, "r": 458.38425, "b": 428.50247, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 433.58994, "r": 272.93954, "b": 441.6597, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "0.945", "bbox": {"l": 289.017, "t": 433.58994, "r": 310.00375, "b": 441.6597, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "0.901", "bbox": {"l": 326.71701, "t": 433.58994, "r": 347.70377, "b": 441.6597, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "0.931", "bbox": {"l": 362.08801, "t": 433.5271599999999, "r": 386.24887, "b": 441.45346, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "0.834", "bbox": {"l": 396.20599, "t": 433.58994, "r": 417.19275, "b": 441.6597, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "3.81", "bbox": {"l": 440.767, "t": 433.58994, "r": 457.14682, "b": 441.6597, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "4", "bbox": {"l": 161.90601, "t": 452.41995, "r": 166.51294, "b": 460.48972, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "2", "bbox": {"l": 209.509, "t": 452.41995, "r": 214.11594, "b": 460.48972, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 446.9399399999999, "r": 271.40527, "b": 455.0097, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "0.952", "bbox": {"l": 289.017, "t": 446.9399399999999, "r": 310.00375, "b": 455.0097, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "0.92", "bbox": {"l": 329.021, "t": 446.9399399999999, "r": 345.40082, "b": 455.0097, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "0.942", "bbox": {"l": 362.08801, "t": 446.87717, "r": 386.24887, "b": 454.80347, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "0.857", "bbox": {"l": 394.61801, "t": 446.87717, "r": 418.77887, "b": 454.80347, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "1.22", "bbox": {"l": 439.52701, "t": 446.87717, "r": 458.38425, "b": 454.80347, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 459.8919399999999, "r": 272.93954, "b": 467.9617, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "0.944", "bbox": {"l": 289.017, "t": 459.8919399999999, "r": 310.00375, "b": 467.9617, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "0.903", "bbox": {"l": 326.71701, "t": 459.8919399999999, "r": 347.70377, "b": 467.9617, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "0.931", "bbox": {"l": 363.67599, "t": 459.8919399999999, "r": 384.66275, "b": 467.9617, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "0.824", "bbox": {"l": 396.20599, "t": 459.8919399999999, "r": 417.19275, "b": 467.9617, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "2", "bbox": {"l": 446.65302, "t": 459.8919399999999, "r": 451.25995, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": [{"id": 10, "label": "text", "bbox": {"l": 160.37, "t": 341.73495, "r": 168.04793, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "#", "bbox": {"l": 160.37, "t": 341.73495, "r": 168.04793, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 144.592, "t": 354.68594, "r": 183.82806, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "enc-layers", "bbox": {"l": 144.592, "t": 354.68594, "r": 183.82806, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 207.974, "t": 341.73495, "r": 215.65193, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "#", "bbox": {"l": 207.974, "t": 341.73495, "r": 215.65193, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 192.19499, "t": 354.68594, "r": 231.43106, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "dec-layers", "bbox": {"l": 192.19499, "t": 354.68594, "r": 231.43106, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 239.79799999999997, "t": 347.21396, "r": 278.31766, "b": 355.28372, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "Language", "bbox": {"l": 239.79799999999997, "t": 347.21396, "r": 278.31766, "b": 355.28372, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 324.67001, "t": 341.73495, "r": 348.26419, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "TEDs", "bbox": {"l": 324.67001, "t": 341.73495, "r": 348.26419, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 396.271, "t": 341.73495, "r": 417.12683, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "mAP", "bbox": {"l": 396.271, "t": 341.73495, "r": 417.12683, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 394.927, "t": 352.69394000000005, "r": 418.47278, "b": 360.7637, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "(0.75)", "bbox": {"l": 394.927, "t": 352.69394000000005, "r": 418.47278, "b": 360.7637, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 430.771, "t": 341.73495, "r": 467.1423, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "Inference", "bbox": {"l": 430.771, "t": 341.73495, "r": 467.1423, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 427.14801, "t": 352.69394000000005, "r": 470.76056, "b": 360.7637, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "time (secs)", "bbox": {"l": 427.14801, "t": 352.69394000000005, "r": 470.76056, "b": 360.7637, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 286.686, "t": 354.68594, "r": 312.33261, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "simple", "bbox": {"l": 286.686, "t": 354.68594, "r": 312.33261, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 320.702, "t": 354.68594, "r": 353.71988, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "complex", "bbox": {"l": 320.702, "t": 354.68594, "r": 353.71988, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 369.306, "t": 354.68594, "r": 379.03094, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "all", "bbox": {"l": 369.306, "t": 354.68594, "r": 379.03094, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 161.90601, "t": 373.51596, "r": 166.51294, "b": 381.58572, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "6", "bbox": {"l": 161.90601, "t": 373.51596, "r": 166.51294, "b": 381.58572, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 209.509, "t": 373.51596, "r": 214.11594, "b": 381.58572, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "6", "bbox": {"l": 209.509, "t": 373.51596, "r": 214.11594, "b": 381.58572, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 246.71000999999998, "t": 368.03595, "r": 271.40527, "b": 376.10571, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 368.03595, "r": 271.40527, "b": 376.10571, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 289.017, "t": 368.03595, "r": 310.00375, "b": 376.10571, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "0.965", "bbox": {"l": 289.017, "t": 368.03595, "r": 310.00375, "b": 376.10571, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 326.71701, "t": 368.03595, "r": 347.70377, "b": 376.10571, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "0.934", "bbox": {"l": 326.71701, "t": 368.03595, "r": 347.70377, "b": 376.10571, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 363.67599, "t": 368.03595, "r": 384.66275, "b": 376.10571, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "0.955", "bbox": {"l": 363.67599, "t": 368.03595, "r": 384.66275, "b": 376.10571, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 397.26999, "t": 367.97317999999996, "r": 416.12723, "b": 375.89948, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "0.88", "bbox": {"l": 397.26999, "t": 367.97317999999996, "r": 416.12723, "b": 375.89948, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 439.52701, "t": 367.97317999999996, "r": 458.38425, "b": 375.89948, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "2.73", "bbox": {"l": 439.52701, "t": 367.97317999999996, "r": 458.38425, "b": 375.89948, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 245.17598999999998, "t": 380.98795, "r": 272.93954, "b": 389.05771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 380.98795, "r": 272.93954, "b": 389.05771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 289.017, "t": 380.98795, "r": 310.00375, "b": 389.05771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "0.969", "bbox": {"l": 289.017, "t": 380.98795, "r": 310.00375, "b": 389.05771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 326.71701, "t": 380.98795, "r": 347.70377, "b": 389.05771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "0.927", "bbox": {"l": 326.71701, "t": 380.98795, "r": 347.70377, "b": 389.05771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 363.67599, "t": 380.98795, "r": 384.66275, "b": 389.05771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "0.955", "bbox": {"l": 363.67599, "t": 380.98795, "r": 384.66275, "b": 389.05771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 396.20599, "t": 380.98795, "r": 417.19275, "b": 389.05771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "0.857", "bbox": {"l": 396.20599, "t": 380.98795, "r": 417.19275, "b": 389.05771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 440.767, "t": 380.98795, "r": 457.14682, "b": 389.05771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "5.39", "bbox": {"l": 440.767, "t": 380.98795, "r": 457.14682, "b": 389.05771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 161.90601, "t": 399.81696, "r": 166.51294, "b": 407.88672, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "4", "bbox": {"l": 161.90601, "t": 399.81696, "r": 166.51294, "b": 407.88672, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 209.509, "t": 399.81696, "r": 214.11594, "b": 407.88672, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "4", "bbox": {"l": 209.509, "t": 399.81696, "r": 214.11594, "b": 407.88672, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 246.71000999999998, "t": 394.33795, "r": 271.40527, "b": 402.40771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 394.33795, "r": 271.40527, "b": 402.40771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 289.017, "t": 394.33795, "r": 310.00375, "b": 402.40771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "0.938", "bbox": {"l": 289.017, "t": 394.33795, "r": 310.00375, "b": 402.40771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 326.71701, "t": 394.33795, "r": 347.70377, "b": 402.40771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "0.904", "bbox": {"l": 326.71701, "t": 394.33795, "r": 347.70377, "b": 402.40771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 363.67599, "t": 394.33795, "r": 384.66275, "b": 402.40771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "0.927", "bbox": {"l": 363.67599, "t": 394.33795, "r": 384.66275, "b": 402.40771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 394.61801, "t": 394.27518, "r": 418.77887, "b": 402.20148, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "0.853", "bbox": {"l": 394.61801, "t": 394.27518, "r": 418.77887, "b": 402.20148, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 439.52701, "t": 394.27518, "r": 458.38425, "b": 402.20148, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "1.97", "bbox": {"l": 439.52701, "t": 394.27518, "r": 458.38425, "b": 402.20148, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 245.17598999999998, "t": 407.28894, "r": 272.93954, "b": 415.3587, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 407.28894, "r": 272.93954, "b": 415.3587, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 289.017, "t": 407.28894, "r": 310.00375, "b": 415.3587, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "0.952", "bbox": {"l": 289.017, "t": 407.28894, "r": 310.00375, "b": 415.3587, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 326.71701, "t": 407.28894, "r": 347.70377, "b": 415.3587, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "0.909", "bbox": {"l": 326.71701, "t": 407.28894, "r": 347.70377, "b": 415.3587, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 362.08801, "t": 407.22617, "r": 386.24887, "b": 415.15247, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "0.938", "bbox": {"l": 362.08801, "t": 407.22617, "r": 386.24887, "b": 415.15247, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 396.20599, "t": 407.28894, "r": 417.19275, "b": 415.3587, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "0.843", "bbox": {"l": 396.20599, "t": 407.28894, "r": 417.19275, "b": 415.3587, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 440.767, "t": 407.28894, "r": 457.14682, "b": 415.3587, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "3.77", "bbox": {"l": 440.767, "t": 407.28894, "r": 457.14682, "b": 415.3587, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 161.90601, "t": 426.11795, "r": 166.51294, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "2", "bbox": {"l": 161.90601, "t": 426.11795, "r": 166.51294, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 209.509, "t": 426.11795, "r": 214.11594, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "4", "bbox": {"l": 209.509, "t": 426.11795, "r": 214.11594, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 246.71000999999998, "t": 420.63895, "r": 271.40527, "b": 428.70871, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 420.63895, "r": 271.40527, "b": 428.70871, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 289.017, "t": 420.63895, "r": 310.00375, "b": 428.70871, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "0.923", "bbox": {"l": 289.017, "t": 420.63895, "r": 310.00375, "b": 428.70871, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 326.71701, "t": 420.63895, "r": 347.70377, "b": 428.70871, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "0.897", "bbox": {"l": 326.71701, "t": 420.63895, "r": 347.70377, "b": 428.70871, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 363.67599, "t": 420.63895, "r": 384.66275, "b": 428.70871, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "0.915", "bbox": {"l": 363.67599, "t": 420.63895, "r": 384.66275, "b": 428.70871, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 394.61801, "t": 420.57617, "r": 418.77887, "b": 428.50247, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "0.859", "bbox": {"l": 394.61801, "t": 420.57617, "r": 418.77887, "b": 428.50247, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 439.52701, "t": 420.57617, "r": 458.38425, "b": 428.50247, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "1.91", "bbox": {"l": 439.52701, "t": 420.57617, "r": 458.38425, "b": 428.50247, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 245.17598999999998, "t": 433.58994, "r": 272.93954, "b": 441.6597, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 433.58994, "r": 272.93954, "b": 441.6597, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 289.017, "t": 433.58994, "r": 310.00375, "b": 441.6597, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "0.945", "bbox": {"l": 289.017, "t": 433.58994, "r": 310.00375, "b": 441.6597, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 326.71701, "t": 433.58994, "r": 347.70377, "b": 441.6597, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "0.901", "bbox": {"l": 326.71701, "t": 433.58994, "r": 347.70377, "b": 441.6597, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 362.08801, "t": 433.5271599999999, "r": 386.24887, "b": 441.45346, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "0.931", "bbox": {"l": 362.08801, "t": 433.5271599999999, "r": 386.24887, "b": 441.45346, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 396.20599, "t": 433.58994, "r": 417.19275, "b": 441.6597, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "0.834", "bbox": {"l": 396.20599, "t": 433.58994, "r": 417.19275, "b": 441.6597, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 440.767, "t": 433.58994, "r": 457.14682, "b": 441.6597, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "3.81", "bbox": {"l": 440.767, "t": 433.58994, "r": 457.14682, "b": 441.6597, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 161.90601, "t": 452.41995, "r": 166.51294, "b": 460.48972, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "4", "bbox": {"l": 161.90601, "t": 452.41995, "r": 166.51294, "b": 460.48972, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 209.509, "t": 452.41995, "r": 214.11594, "b": 460.48972, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "2", "bbox": {"l": 209.509, "t": 452.41995, "r": 214.11594, "b": 460.48972, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 246.71000999999998, "t": 446.9399399999999, "r": 271.40527, "b": 455.0097, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 446.9399399999999, "r": 271.40527, "b": 455.0097, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 289.017, "t": 446.9399399999999, "r": 310.00375, "b": 455.0097, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "0.952", "bbox": {"l": 289.017, "t": 446.9399399999999, "r": 310.00375, "b": 455.0097, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 329.021, "t": 446.9399399999999, "r": 345.40082, "b": 455.0097, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "0.92", "bbox": {"l": 329.021, "t": 446.9399399999999, "r": 345.40082, "b": 455.0097, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 362.08801, "t": 446.87717, "r": 386.24887, "b": 454.80347, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "0.942", "bbox": {"l": 362.08801, "t": 446.87717, "r": 386.24887, "b": 454.80347, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 394.61801, "t": 446.87717, "r": 418.77887, "b": 454.80347, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "0.857", "bbox": {"l": 394.61801, "t": 446.87717, "r": 418.77887, "b": 454.80347, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 439.52701, "t": 446.87717, "r": 458.38425, "b": 454.80347, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "1.22", "bbox": {"l": 439.52701, "t": 446.87717, "r": 458.38425, "b": 454.80347, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 245.17598999999998, "t": 459.8919399999999, "r": 272.93954, "b": 467.9617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 459.8919399999999, "r": 272.93954, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 289.017, "t": 459.8919399999999, "r": 310.00375, "b": 467.9617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "0.944", "bbox": {"l": 289.017, "t": 459.8919399999999, "r": 310.00375, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 326.71701, "t": 459.8919399999999, "r": 347.70377, "b": 467.9617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "0.903", "bbox": {"l": 326.71701, "t": 459.8919399999999, "r": 347.70377, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 363.67599, "t": 459.8919399999999, "r": 384.66275, "b": 467.9617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "0.931", "bbox": {"l": 363.67599, "t": 459.8919399999999, "r": 384.66275, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 396.20599, "t": 459.8919399999999, "r": 417.19275, "b": 467.9617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "0.824", "bbox": {"l": 396.20599, "t": 459.8919399999999, "r": 417.19275, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 446.65302, "t": 459.8919399999999, "r": 451.25995, "b": 467.9617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "2", "bbox": {"l": 446.65302, "t": 459.8919399999999, "r": 451.25995, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "lcel", "lcel", "ched", "ched", "nl", "ched", "ched", "ucel", "ched", "ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 7, "num_cols": 8, "table_cells": [{"bbox": {"l": 160.37, "t": 341.73495, "r": 168.04793, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "#", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 144.592, "t": 354.68594, "r": 183.82806, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "enc-layers", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 207.974, "t": 341.73495, "r": 215.65193, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "#", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 192.19499, "t": 354.68594, "r": 231.43106, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "dec-layers", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 239.79799999999997, "t": 347.21396, "r": 278.31766, "b": 355.28372, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Language", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 324.67001, "t": 341.73495, "r": 348.26419, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 3, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 6, "text": "TEDs", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 396.271, "t": 341.73495, "r": 417.12683, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "mAP", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 394.927, "t": 352.69394000000005, "r": 418.47278, "b": 360.7637, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "(0.75)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 430.771, "t": 341.73495, "r": 467.1423, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "Inference", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 427.14801, "t": 352.69394000000005, "r": 470.76056, "b": 360.7637, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "time (secs)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 286.686, "t": 354.68594, "r": 312.33261, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "simple", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 320.702, "t": 354.68594, "r": 353.71988, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "complex", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 369.306, "t": 354.68594, "r": 379.03094, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "all", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 161.90601, "t": 373.51596, "r": 166.51294, "b": 381.58572, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 373.51596, "r": 214.11594, "b": 381.58572, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 368.03595, "r": 272.93954, "b": 389.05771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 368.03595, "r": 310.00375, "b": 389.05771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.965 0.969", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 368.03595, "r": 347.70377, "b": 389.05771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.934 0.927", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 363.67599, "t": 368.03595, "r": 384.66275, "b": 389.05771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.955 0.955", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 396.20599, "t": 367.97317999999996, "r": 417.19275, "b": 389.05771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.88 0.857", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 367.97317999999996, "r": 458.38425, "b": 389.05771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "2.73 5.39", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 161.90601, "t": 399.81696, "r": 166.51294, "b": 407.88672, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 399.81696, "r": 214.11594, "b": 407.88672, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 394.33795, "r": 272.93954, "b": 415.3587, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 394.33795, "r": 310.00375, "b": 415.3587, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.938 0.952", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 394.33795, "r": 347.70377, "b": 402.40771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.904", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 363.67599, "t": 394.33795, "r": 384.66275, "b": 402.40771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.927", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.61801, "t": 394.27518, "r": 418.77887, "b": 402.20148, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.853", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 394.27518, "r": 458.38425, "b": 402.20148, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "1.97", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 407.28894, "r": 347.70377, "b": 428.70871, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.909 0.897", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 362.08801, "t": 407.22617, "r": 386.24887, "b": 415.15247, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.938", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 396.20599, "t": 407.28894, "r": 417.19275, "b": 415.3587, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.843", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.767, "t": 407.28894, "r": 457.14682, "b": 415.3587, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "3.77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 161.90601, "t": 426.11795, "r": 166.51294, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 426.11795, "r": 214.11594, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 246.71000999999998, "t": 420.63895, "r": 271.40527, "b": 428.70871, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 420.63895, "r": 310.00375, "b": 441.6597, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.923 0.945", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 362.08801, "t": 420.63895, "r": 386.24887, "b": 441.45346, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.915 0.931", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.61801, "t": 420.57617, "r": 418.77887, "b": 441.6597, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.859 0.834", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 420.57617, "r": 458.38425, "b": 441.6597, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "1.91 3.81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 433.58994, "r": 272.93954, "b": 441.6597, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 433.58994, "r": 347.70377, "b": 441.6597, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.901", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 161.90601, "t": 452.41995, "r": 166.51294, "b": 460.48972, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 452.41995, "r": 214.11594, "b": 460.48972, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 446.9399399999999, "r": 272.93954, "b": 467.9617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 446.9399399999999, "r": 310.00375, "b": 467.9617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.952 0.944", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 446.9399399999999, "r": 347.70377, "b": 467.9617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.92 0.903", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 362.08801, "t": 446.87717, "r": 386.24887, "b": 467.9617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.942 0.931", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.61801, "t": 446.87717, "r": 418.77887, "b": 467.9617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.857 0.824", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 446.87717, "r": 458.38425, "b": 467.9617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "1.22 2", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "section_header", "id": 5, "page_no": 8, "cluster": {"id": 5, "label": "section_header", "bbox": {"l": 134.765, "t": 508.15179, "r": 264.40332, "b": 516.95874, "coord_origin": "TOPLEFT"}, "confidence": 0.9592539668083191, "cells": [{"id": 91, "text": "5.2", "bbox": {"l": 134.765, "t": 508.15179, "r": 149.40205, "b": 516.95874, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Quantitative Results", "bbox": {"l": 160.85904, "t": 508.15179, "r": 264.40332, "b": 516.95874, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5.2 Quantitative Results"}, {"label": "text", "id": 1, "page_no": 8, "cluster": {"id": 1, "label": "text", "bbox": {"l": 134.765, "t": 524.55078, "r": 480.5957599999999, "b": 617.03474, "coord_origin": "TOPLEFT"}, "confidence": 0.9854757189750671, "cells": [{"id": 93, "text": "We picked the model parameter configuration that produced the best prediction", "bbox": {"l": 134.765, "t": 524.55078, "r": 480.59075999999993, "b": 533.34775, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "quality (enc=6, dec=6, heads=8) with PubTabNet alone, then independently", "bbox": {"l": 134.765, "t": 536.50677, "r": 480.58675999999997, "b": 545.3037400000001, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "trained and evaluated it on three publicly available data sets: PubTabNet (395k", "bbox": {"l": 134.765, "t": 548.4617800000001, "r": 480.59572999999995, "b": 557.25874, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "samples), FinTabNet (113k samples) and PubTables-1M (about 1M samples).", "bbox": {"l": 134.765, "t": 560.41678, "r": 480.59177000000005, "b": 569.21375, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "Performance results are presented in Table. 2. It is clearly evident that the model", "bbox": {"l": 134.765, "t": 572.37178, "r": 480.59069999999997, "b": 581.16875, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "trained on OTSL outperforms HTML across the board, keeping high TEDs and", "bbox": {"l": 134.765, "t": 584.32678, "r": 480.5957599999999, "b": 593.12375, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "mAP scores even on difficult financial tables (FinTabNet) that contain sparse", "bbox": {"l": 134.765, "t": 596.28278, "r": 480.58774, "b": 605.07974, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "and large tables.", "bbox": {"l": 134.765, "t": 608.2377799999999, "r": 206.78664, "b": 617.03474, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "We picked the model parameter configuration that produced the best prediction quality (enc=6, dec=6, heads=8) with PubTabNet alone, then independently trained and evaluated it on three publicly available data sets: PubTabNet (395k samples), FinTabNet (113k samples) and PubTables-1M (about 1M samples). Performance results are presented in Table. 2. It is clearly evident that the model trained on OTSL outperforms HTML across the board, keeping high TEDs and mAP scores even on difficult financial tables (FinTabNet) that contain sparse and large tables."}, {"label": "text", "id": 2, "page_no": 8, "cluster": {"id": 2, "label": "text", "bbox": {"l": 134.765, "t": 620.19278, "r": 480.5957599999999, "b": 664.8547599999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9851234555244446, "cells": [{"id": 101, "text": "Additionally, the results show that OTSL has an advantage over HTML", "bbox": {"l": 149.709, "t": 620.19278, "r": 480.59271, "b": 628.98975, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "when applied on a bigger data set like PubTables-1M and achieves significantly", "bbox": {"l": 134.765, "t": 632.14778, "r": 480.5957599999999, "b": 640.94475, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "improved scores. Finally, OTSL achieves faster inference due to fewer decoding", "bbox": {"l": 134.765, "t": 644.1027799999999, "r": 480.59283000000005, "b": 652.89975, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "steps which is a result of the reduced sequence representation.", "bbox": {"l": 134.765, "t": 656.0577900000001, "r": 405.79651, "b": 664.8547599999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Additionally, the results show that OTSL has an advantage over HTML when applied on a bigger data set like PubTables-1M and achieves significantly improved scores. Finally, OTSL achieves faster inference due to fewer decoding steps which is a result of the reduced sequence representation."}], "headers": [{"label": "page_header", "id": 8, "page_no": 8, "cluster": {"id": 8, "label": "page_header", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9373378753662109, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Optimized Table Tokenization for Table Structure Recognition"}, {"label": "page_header", "id": 9, "page_no": 8, "cluster": {"id": 9, "label": "page_header", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8857625722885132, "cells": [{"id": 1, "text": "9", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "9"}]}}, {"page_no": 9, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "10", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 143.97887, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "M.", "bbox": {"l": 167.82053, "t": 93.77099999999996, "r": 178.08249, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37929, "t": 93.77099999999996, "r": 231.72049000000004, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Table 2.", "bbox": {"l": 134.765, "t": 115.83618000000001, "r": 173.09366, "b": 123.76251000000002, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "TSR and cell detection results compared between OTSL and HTML on", "bbox": {"l": 181.30299, "t": 115.89899000000003, "r": 480.59151999999995, "b": 123.96868999999992, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "the PubTabNet [22], FinTabNet [21] and PubTables-1M [14] data sets using Table-", "bbox": {"l": 134.765, "t": 126.85797000000014, "r": 480.59357000000006, "b": 134.92767000000003, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Former [9] (with enc=6, dec=6, heads=8).", "bbox": {"l": 134.765, "t": 137.81696, "r": 305.95691, "b": 145.88666, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Data set", "bbox": {"l": 160.782, "t": 166.55895999999996, "r": 194.99779, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Language", "bbox": {"l": 215.52499000000003, "t": 166.534, "r": 254.04465, "b": 174.6037, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "TEDs", "bbox": {"l": 300.397, "t": 161.07898, "r": 323.99118, "b": 169.14868, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "mAP(0.75)", "bbox": {"l": 370.345, "t": 166.55895999999996, "r": 414.74661, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Inference", "bbox": {"l": 426.737, "t": 161.07898, "r": 463.10830999999996, "b": 169.14868, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "time (secs)", "bbox": {"l": 423.11401, "t": 172.03796, "r": 466.72656, "b": 180.10766999999998, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "simple", "bbox": {"l": 262.41299, "t": 174.03101000000004, "r": 288.0596, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "complex", "bbox": {"l": 296.42899, "t": 174.03101000000004, "r": 329.44687, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "all", "bbox": {"l": 345.03299, "t": 174.03101000000004, "r": 354.75793, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "PubTabNet", "bbox": {"l": 154.53799, "t": 192.85999000000004, "r": 201.24129, "b": 200.92969000000005, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "OTSL", "bbox": {"l": 222.43700000000004, "t": 187.38098000000002, "r": 247.13226000000003, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "0.965", "bbox": {"l": 264.74399, "t": 187.38098000000002, "r": 285.73074, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "0.934", "bbox": {"l": 302.444, "t": 187.38098000000002, "r": 323.43076, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "0.955", "bbox": {"l": 339.40302, "t": 187.38098000000002, "r": 360.38977, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "0.88", "bbox": {"l": 383.116, "t": 187.31817999999998, "r": 401.97324, "b": 195.24451, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "2.73", "bbox": {"l": 435.49300999999997, "t": 187.31817999999998, "r": 454.35025, "b": 195.24451, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "HTML", "bbox": {"l": 220.903, "t": 200.33196999999996, "r": 248.66655999999998, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "0.969", "bbox": {"l": 264.74399, "t": 200.33196999999996, "r": 285.73074, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "0.927", "bbox": {"l": 302.444, "t": 200.33196999999996, "r": 323.43076, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "0.955", "bbox": {"l": 339.40302, "t": 200.33196999999996, "r": 360.38977, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "0.857", "bbox": {"l": 382.052, "t": 200.33196999999996, "r": 403.03876, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "5.39", "bbox": {"l": 436.73199000000005, "t": 200.33196999999996, "r": 453.11182, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "FinTabNet", "bbox": {"l": 155.94501, "t": 219.16198999999995, "r": 199.83374, "b": 227.23168999999996, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "OTSL", "bbox": {"l": 222.43700000000004, "t": 213.68201, "r": 247.13226000000003, "b": 221.75171, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "0.955", "bbox": {"l": 264.74399, "t": 213.68201, "r": 285.73074, "b": 221.75171, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "0.961", "bbox": {"l": 302.444, "t": 213.68201, "r": 323.43076, "b": 221.75171, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "0.959", "bbox": {"l": 337.815, "t": 213.61919999999998, "r": 361.97586, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "0.862", "bbox": {"l": 380.46399, "t": 213.61919999999998, "r": 404.62485, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "1.85", "bbox": {"l": 435.49300999999997, "t": 213.61919999999998, "r": 454.35025, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "HTML", "bbox": {"l": 220.903, "t": 226.63396999999998, "r": 248.66655999999998, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "0.917", "bbox": {"l": 264.74399, "t": 226.63396999999998, "r": 285.73074, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "0.922", "bbox": {"l": 302.444, "t": 226.63396999999998, "r": 323.43076, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "0.92", "bbox": {"l": 341.70599, "t": 226.63396999999998, "r": 358.08582, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "0.722", "bbox": {"l": 382.052, "t": 226.63396999999998, "r": 403.03876, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "3.26", "bbox": {"l": 436.73199000000005, "t": 226.63396999999998, "r": 453.11182, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "PubTables-1M", "bbox": {"l": 148.62601, "t": 245.46294999999998, "r": 207.1524, "b": 253.53265, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "OTSL", "bbox": {"l": 222.43700000000004, "t": 239.98297000000002, "r": 247.13226000000003, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "0.987", "bbox": {"l": 264.74399, "t": 239.98297000000002, "r": 285.73074, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "0.964", "bbox": {"l": 302.444, "t": 239.98297000000002, "r": 323.43076, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "0.977", "bbox": {"l": 337.815, "t": 239.92016999999998, "r": 361.97586, "b": 247.8465, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "0.896", "bbox": {"l": 380.46399, "t": 239.92016999999998, "r": 404.62485, "b": 247.8465, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "1.79", "bbox": {"l": 435.49300999999997, "t": 239.92016999999998, "r": 454.35025, "b": 247.8465, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "HTML", "bbox": {"l": 220.903, "t": 252.93499999999995, "r": 248.66655999999998, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "0.983", "bbox": {"l": 264.74399, "t": 252.93499999999995, "r": 285.73074, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "0.944", "bbox": {"l": 302.444, "t": 252.93499999999995, "r": 323.43076, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "0.966", "bbox": {"l": 339.40302, "t": 252.93499999999995, "r": 360.38977, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "0.889", "bbox": {"l": 382.052, "t": 252.93499999999995, "r": 403.03876, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "3.26", "bbox": {"l": 436.73199000000005, "t": 252.93499999999995, "r": 453.11182, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "5.3", "bbox": {"l": 134.765, "t": 288.91479, "r": 149.40205, "b": 297.72173999999995, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Qualitative Results", "bbox": {"l": 160.85904, "t": 288.91479, "r": 257.08679, "b": 297.72173999999995, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "To illustrate the qualitative differences between OTSL and HTML, Figure 5", "bbox": {"l": 134.765, "t": 309.86078, "r": 480.58777, "b": 318.65775, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "demonstrates less overlap and more accurate bounding boxes with OTSL. In", "bbox": {"l": 134.765, "t": 321.81577, "r": 480.58889999999997, "b": 330.61273, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Figure 6, OTSL proves to be more effective in handling tables with longer to-", "bbox": {"l": 134.765, "t": 333.77075, "r": 480.58681999999993, "b": 342.56772, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "ken sequences, resulting in even more precise structure prediction and bounding", "bbox": {"l": 134.765, "t": 345.72574, "r": 480.58981, "b": 354.52271, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "boxes.", "bbox": {"l": 134.765, "t": 357.68073, "r": 161.65704, "b": 366.47769, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "Fig. 5.", "bbox": {"l": 134.765, "t": 397.59012, "r": 162.64424, "b": 405.51642, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "The OTSL model produces more accurate bounding boxes with less over-", "bbox": {"l": 167.384, "t": 397.65289, "r": 480.59106, "b": 405.72266, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "lap (E) than the HTML model (D), when predicting the structure of a sparse ta-", "bbox": {"l": 134.765, "t": 408.61190999999997, "r": 480.59106, "b": 416.68167000000005, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "ble (A), at twice the inference speed because of shorter sequence length (B),(C).", "bbox": {"l": 134.765, "t": 419.57089, "r": 480.58838000000003, "b": 427.64066, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "\"PMC2807444_006_00.png\" PubTabNet.", "bbox": {"l": 134.765, "t": 430.52987999999993, "r": 304.69171, "b": 438.59964, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "<table>", "bbox": {"l": 180.12473, "t": 516.2332200000001, "r": 190.62042, "b": 518.94992, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "<tr><td></td><td colspan=\"4\"></td><td colspan=\"6\"></td><td colspan=\"3\"></td></tr>", "bbox": {"l": 183.2438, "t": 520.13208, "r": 304.54797, "b": 522.84879, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 524.03094, "r": 388.42313, "b": 526.74765, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 527.9297799999999, "r": 388.42313, "b": 530.64648, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 531.82861, "r": 388.42313, "b": 534.54532, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 535.72748, "r": 388.42313, "b": 538.44418, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 539.62631, "r": 388.42313, "b": 542.34303, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 543.52516, "r": 388.42313, "b": 546.24188, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 547.42401, "r": 388.42313, "b": 550.14073, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 551.32286, "r": 388.42313, "b": 554.03958, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "</table>", "bbox": {"l": 180.12473, "t": 555.22173, "r": 191.86806, "b": 557.93845, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "C", "bbox": {"l": 407.38348, "t": 518.30042, "r": 408.82025, "b": 521.01712, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "C L L L C L L L L L C L L NL", "bbox": {"l": 410.25699, "t": 518.30042, "r": 450.48605, "b": 521.01712, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "C", "bbox": {"l": 407.38348, "t": 522.19925, "r": 408.82025, "b": 524.9159500000001, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 522.19925, "r": 450.48605, "b": 524.9159500000001, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "C", "bbox": {"l": 407.38348, "t": 526.09808, "r": 408.82025, "b": 528.81479, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 526.09808, "r": 450.48605, "b": 528.81479, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "C", "bbox": {"l": 407.38348, "t": 529.99695, "r": 408.82025, "b": 532.7136499999999, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 529.99695, "r": 450.48605, "b": 532.7136499999999, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "C", "bbox": {"l": 407.38348, "t": 533.8957800000001, "r": 408.82025, "b": 536.6125, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 533.8957800000001, "r": 450.48605, "b": 536.6125, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "C", "bbox": {"l": 407.38348, "t": 537.79463, "r": 408.82025, "b": 540.51135, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 537.79463, "r": 450.48605, "b": 540.51135, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "C", "bbox": {"l": 407.38348, "t": 541.69348, "r": 408.82025, "b": 544.4102, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 541.69348, "r": 450.48605, "b": 544.4102, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "C", "bbox": {"l": 407.38348, "t": 545.59233, "r": 408.82025, "b": 548.3090500000001, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 545.59233, "r": 450.48605, "b": 548.3090500000001, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "C", "bbox": {"l": 407.38348, "t": 549.4911999999999, "r": 408.82025, "b": 552.2079200000001, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 549.4911999999999, "r": 450.48605, "b": 552.2079200000001, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "HTML", "bbox": {"l": 164.52881, "t": 509.45859, "r": 181.8528, "b": 515.31, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "#", "bbox": {"l": 183.58441, "t": 509.45859, "r": 186.3974, "b": 515.31, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "tokens:", "bbox": {"l": 189.2104, "t": 509.45859, "r": 208.90137, "b": 515.31, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "258", "bbox": {"l": 210.63269, "t": 509.45859, "r": 221.04044, "b": 515.31, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "OTSL", "bbox": {"l": 390.20203, "t": 509.60361, "r": 406.83609, "b": 515.45502, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "#", "bbox": {"l": 408.56952, "t": 509.60361, "r": 411.38251, "b": 515.45502, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "tokens:", "bbox": {"l": 414.1955, "t": 509.60361, "r": 433.88647000000003, "b": 515.45502, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "135", "bbox": {"l": 435.61737, "t": 509.60361, "r": 446.02512, "b": 515.45502, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "B", "bbox": {"l": 167.19316, "t": 519.07236, "r": 172.8231, "b": 526.3866, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "A", "bbox": {"l": 187.33745, "t": 448.62485, "r": 192.96739, "b": 455.93909, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "D", "bbox": {"l": 167.38654, "t": 566.0051599999999, "r": 173.01648, "b": 573.3194, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "E", "bbox": {"l": 248.45621000000003, "t": 621.78008, "r": 253.65727, "b": 629.09431, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "C", "bbox": {"l": 395.90057, "t": 519.19946, "r": 401.53052, "b": 526.5137, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "HTML", "bbox": {"l": 171.62886, "t": 580.28853, "r": 177.48148, "b": 597.26784, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "OTSL", "bbox": {"l": 251.05969000000002, "t": 633.63408, "r": 256.91235, "b": 649.92345, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "HTML model shows", "bbox": {"l": 372.14645, "t": 601.45724, "r": 427.0379, "b": 607.30864, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "bounding box drifting", "bbox": {"l": 372.14645, "t": 607.89948, "r": 430.06838999999997, "b": 613.75087, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "OTSL model shows", "bbox": {"l": 176.88042, "t": 642.87209, "r": 231.08191, "b": 648.72348, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "clean bounding box", "bbox": {"l": 176.88042, "t": 649.3143, "r": 230.99271000000002, "b": 655.1657, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "alignment", "bbox": {"l": 176.88042, "t": 655.7565500000001, "r": 203.93219, "b": 661.60794, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "\u2264", "bbox": {"l": 215.93231000000003, "t": 557.56342, "r": 218.4697, "b": 569.15967, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "\u03bc", "bbox": {"l": 229.05689999999998, "t": 557.56342, "r": 231.71908999999997, "b": 569.15967, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "\u03bc", "bbox": {"l": 342.63354, "t": 430.19678, "r": 344.81915, "b": 439.71716, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "S", "bbox": {"l": 261.20892, "t": 448.46124, "r": 263.56973, "b": 451.19727, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "I", "bbox": {"l": 312.33463, "t": 448.46124, "r": 313.6362, "b": 451.19727, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "R", "bbox": {"l": 377.41125, "t": 448.46124, "r": 380.05737, "b": 451.19727, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "ST", "bbox": {"l": 200.63976, "t": 453.33997, "r": 205.82492, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "0.03", "bbox": {"l": 222.20833000000002, "t": 453.33997, "r": 229.76836, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "0.06", "bbox": {"l": 243.26666, "t": 453.33997, "r": 250.82669, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "0.12", "bbox": {"l": 264.29657, "t": 453.33997, "r": 271.84949, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "0.25", "bbox": {"l": 285.31943, "t": 453.33997, "r": 292.87946, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "0.5", "bbox": {"l": 306.37775, "t": 453.33997, "r": 311.77319, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "1", "bbox": {"l": 323.41699, "t": 453.33997, "r": 325.58157, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "2", "bbox": {"l": 334.45807, "t": 453.33997, "r": 336.62265, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "4", "bbox": {"l": 345.52756, "t": 453.33997, "r": 347.69214, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "8", "bbox": {"l": 356.56863, "t": 453.33997, "r": 358.73322, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "16", "bbox": {"l": 367.63812, "t": 453.33997, "r": 371.97089, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "32", "bbox": {"l": 382.6734, "t": 453.33997, "r": 387.00616, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "64", "bbox": {"l": 397.73727, "t": 453.33997, "r": 402.07001, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "\u2265", "bbox": {"l": 412.78879, "t": 447.99298, "r": 414.93463, "b": 457.79964999999993, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": " 128", "bbox": {"l": 414.95697, "t": 453.33997, "r": 422.51746, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "63", "bbox": {"l": 200.63998, "t": 463.92444, "r": 204.57674, "b": 466.66043, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "1", "bbox": {"l": 367.62604, "t": 463.92444, "r": 369.58032, "b": 466.66043, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "1", "bbox": {"l": 382.66132, "t": 463.92444, "r": 384.6156, "b": 466.66043, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "3", "bbox": {"l": 397.72504, "t": 463.92444, "r": 399.67932, "b": 466.66043, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "199", "bbox": {"l": 200.64, "t": 468.80313, "r": 206.51694, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "5", "bbox": {"l": 264.29047, "t": 468.80313, "r": 266.25885, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "1", "bbox": {"l": 306.37213, "t": 468.80313, "r": 308.34052, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "2", "bbox": {"l": 345.51526, "t": 468.80313, "r": 347.48364, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "4", "bbox": {"l": 356.55634, "t": 468.80313, "r": 358.52472, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "1", "bbox": {"l": 367.62582, "t": 468.80313, "r": 369.59418, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "1", "bbox": {"l": 382.66107, "t": 468.80313, "r": 384.62946, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "416", "bbox": {"l": 200.64, "t": 473.68185, "r": 206.51694, "b": 476.41788, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "4", "bbox": {"l": 264.29047, "t": 473.68185, "r": 266.25885, "b": 476.41788, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "230", "bbox": {"l": 200.64, "t": 478.53214, "r": 206.51694, "b": 481.26816, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "1", "bbox": {"l": 243.26373, "t": 478.53214, "r": 245.2321, "b": 481.26816, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "9", "bbox": {"l": 264.29047, "t": 478.53214, "r": 266.25885, "b": 481.26816, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "1", "bbox": {"l": 323.40466, "t": 478.53214, "r": 325.37305, "b": 481.26816, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "1", "bbox": {"l": 397.72519, "t": 478.53214, "r": 399.69354, "b": 481.26816, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "276", "bbox": {"l": 200.64, "t": 483.41086, "r": 206.51694, "b": 486.14688, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "2", "bbox": {"l": 382.66132, "t": 483.41086, "r": 384.61563, "b": 486.14688, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "12", "bbox": {"l": 397.72513, "t": 483.41086, "r": 401.64819, "b": 486.14688, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "1", "bbox": {"l": 412.78928, "t": 483.41086, "r": 414.74359, "b": 486.14688, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "320", "bbox": {"l": 200.64014, "t": 488.28958, "r": 207.14445, "b": 491.0256, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "1", "bbox": {"l": 367.62616, "t": 488.28958, "r": 369.78375, "b": 491.0256, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "4", "bbox": {"l": 382.66141, "t": 488.28958, "r": 384.81897, "b": 491.0256, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "20", "bbox": {"l": 397.7251, "t": 488.28958, "r": 402.05087, "b": 491.0256, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "2013", "bbox": {"l": 200.64032, "t": 493.1683, "r": 208.48566, "b": 495.90433, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "3", "bbox": {"l": 264.29044, "t": 493.1683, "r": 266.25879, "b": 495.90433, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "\u03bc", "bbox": {"l": 227.91466, "t": 665.82603, "r": 230.10028, "b": 675.3464, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "\u2265", "bbox": {"l": 300.58057, "t": 683.62195, "r": 302.72638, "b": 693.428658, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 7, "label": "page_header", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 143.97887, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8309906721115112, "cells": [{"id": 0, "text": "10", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 143.97887, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "page_header", "bbox": {"l": 167.82053, "t": 93.77099999999996, "r": 231.72049000000004, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8367075324058533, "cells": [{"id": 1, "text": "M.", "bbox": {"l": 167.82053, "t": 93.77099999999996, "r": 178.08249, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37929, "t": 93.77099999999996, "r": 231.72049000000004, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "caption", "bbox": {"l": 134.765, "t": 115.83618000000001, "r": 480.59357000000006, "b": 145.88666, "coord_origin": "TOPLEFT"}, "confidence": 0.9512290954589844, "cells": [{"id": 3, "text": "Table 2.", "bbox": {"l": 134.765, "t": 115.83618000000001, "r": 173.09366, "b": 123.76251000000002, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "TSR and cell detection results compared between OTSL and HTML on", "bbox": {"l": 181.30299, "t": 115.89899000000003, "r": 480.59151999999995, "b": 123.96868999999992, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "the PubTabNet [22], FinTabNet [21] and PubTables-1M [14] data sets using Table-", "bbox": {"l": 134.765, "t": 126.85797000000014, "r": 480.59357000000006, "b": 134.92767000000003, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Former [9] (with enc=6, dec=6, heads=8).", "bbox": {"l": 134.765, "t": 137.81696, "r": 305.95691, "b": 145.88666, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "table", "bbox": {"l": 143.6376495361328, "t": 156.3477020263672, "r": 470.8485412597656, "b": 263.2624816894531, "coord_origin": "TOPLEFT"}, "confidence": 0.9884640574455261, "cells": [{"id": 7, "text": "Data set", "bbox": {"l": 160.782, "t": 166.55895999999996, "r": 194.99779, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Language", "bbox": {"l": 215.52499000000003, "t": 166.534, "r": 254.04465, "b": 174.6037, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "TEDs", "bbox": {"l": 300.397, "t": 161.07898, "r": 323.99118, "b": 169.14868, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "mAP(0.75)", "bbox": {"l": 370.345, "t": 166.55895999999996, "r": 414.74661, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Inference", "bbox": {"l": 426.737, "t": 161.07898, "r": 463.10830999999996, "b": 169.14868, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "time (secs)", "bbox": {"l": 423.11401, "t": 172.03796, "r": 466.72656, "b": 180.10766999999998, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "simple", "bbox": {"l": 262.41299, "t": 174.03101000000004, "r": 288.0596, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "complex", "bbox": {"l": 296.42899, "t": 174.03101000000004, "r": 329.44687, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "all", "bbox": {"l": 345.03299, "t": 174.03101000000004, "r": 354.75793, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "PubTabNet", "bbox": {"l": 154.53799, "t": 192.85999000000004, "r": 201.24129, "b": 200.92969000000005, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "OTSL", "bbox": {"l": 222.43700000000004, "t": 187.38098000000002, "r": 247.13226000000003, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "0.965", "bbox": {"l": 264.74399, "t": 187.38098000000002, "r": 285.73074, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "0.934", "bbox": {"l": 302.444, "t": 187.38098000000002, "r": 323.43076, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "0.955", "bbox": {"l": 339.40302, "t": 187.38098000000002, "r": 360.38977, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "0.88", "bbox": {"l": 383.116, "t": 187.31817999999998, "r": 401.97324, "b": 195.24451, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "2.73", "bbox": {"l": 435.49300999999997, "t": 187.31817999999998, "r": 454.35025, "b": 195.24451, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "HTML", "bbox": {"l": 220.903, "t": 200.33196999999996, "r": 248.66655999999998, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "0.969", "bbox": {"l": 264.74399, "t": 200.33196999999996, "r": 285.73074, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "0.927", "bbox": {"l": 302.444, "t": 200.33196999999996, "r": 323.43076, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "0.955", "bbox": {"l": 339.40302, "t": 200.33196999999996, "r": 360.38977, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "0.857", "bbox": {"l": 382.052, "t": 200.33196999999996, "r": 403.03876, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "5.39", "bbox": {"l": 436.73199000000005, "t": 200.33196999999996, "r": 453.11182, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "FinTabNet", "bbox": {"l": 155.94501, "t": 219.16198999999995, "r": 199.83374, "b": 227.23168999999996, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "OTSL", "bbox": {"l": 222.43700000000004, "t": 213.68201, "r": 247.13226000000003, "b": 221.75171, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "0.955", "bbox": {"l": 264.74399, "t": 213.68201, "r": 285.73074, "b": 221.75171, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "0.961", "bbox": {"l": 302.444, "t": 213.68201, "r": 323.43076, "b": 221.75171, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "0.959", "bbox": {"l": 337.815, "t": 213.61919999999998, "r": 361.97586, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "0.862", "bbox": {"l": 380.46399, "t": 213.61919999999998, "r": 404.62485, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "1.85", "bbox": {"l": 435.49300999999997, "t": 213.61919999999998, "r": 454.35025, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "HTML", "bbox": {"l": 220.903, "t": 226.63396999999998, "r": 248.66655999999998, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "0.917", "bbox": {"l": 264.74399, "t": 226.63396999999998, "r": 285.73074, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "0.922", "bbox": {"l": 302.444, "t": 226.63396999999998, "r": 323.43076, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "0.92", "bbox": {"l": 341.70599, "t": 226.63396999999998, "r": 358.08582, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "0.722", "bbox": {"l": 382.052, "t": 226.63396999999998, "r": 403.03876, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "3.26", "bbox": {"l": 436.73199000000005, "t": 226.63396999999998, "r": 453.11182, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "PubTables-1M", "bbox": {"l": 148.62601, "t": 245.46294999999998, "r": 207.1524, "b": 253.53265, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "OTSL", "bbox": {"l": 222.43700000000004, "t": 239.98297000000002, "r": 247.13226000000003, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "0.987", "bbox": {"l": 264.74399, "t": 239.98297000000002, "r": 285.73074, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "0.964", "bbox": {"l": 302.444, "t": 239.98297000000002, "r": 323.43076, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "0.977", "bbox": {"l": 337.815, "t": 239.92016999999998, "r": 361.97586, "b": 247.8465, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "0.896", "bbox": {"l": 380.46399, "t": 239.92016999999998, "r": 404.62485, "b": 247.8465, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "1.79", "bbox": {"l": 435.49300999999997, "t": 239.92016999999998, "r": 454.35025, "b": 247.8465, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "HTML", "bbox": {"l": 220.903, "t": 252.93499999999995, "r": 248.66655999999998, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "0.983", "bbox": {"l": 264.74399, "t": 252.93499999999995, "r": 285.73074, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "0.944", "bbox": {"l": 302.444, "t": 252.93499999999995, "r": 323.43076, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "0.966", "bbox": {"l": 339.40302, "t": 252.93499999999995, "r": 360.38977, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "0.889", "bbox": {"l": 382.052, "t": 252.93499999999995, "r": 403.03876, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "3.26", "bbox": {"l": 436.73199000000005, "t": 252.93499999999995, "r": 453.11182, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": [{"id": 8, "label": "text", "bbox": {"l": 160.782, "t": 166.55895999999996, "r": 194.99779, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "Data set", "bbox": {"l": 160.782, "t": 166.55895999999996, "r": 194.99779, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 215.52499000000003, "t": 166.534, "r": 254.04465, "b": 174.6037, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "Language", "bbox": {"l": 215.52499000000003, "t": 166.534, "r": 254.04465, "b": 174.6037, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "text", "bbox": {"l": 300.397, "t": 161.07898, "r": 323.99118, "b": 169.14868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "TEDs", "bbox": {"l": 300.397, "t": 161.07898, "r": 323.99118, "b": 169.14868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 370.345, "t": 166.55895999999996, "r": 414.74661, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "mAP(0.75)", "bbox": {"l": 370.345, "t": 166.55895999999996, "r": 414.74661, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 426.737, "t": 161.07898, "r": 463.10830999999996, "b": 169.14868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "Inference", "bbox": {"l": 426.737, "t": 161.07898, "r": 463.10830999999996, "b": 169.14868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 423.11401, "t": 172.03796, "r": 466.72656, "b": 180.10766999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "time (secs)", "bbox": {"l": 423.11401, "t": 172.03796, "r": 466.72656, "b": 180.10766999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 262.41299, "t": 174.03101000000004, "r": 288.0596, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "simple", "bbox": {"l": 262.41299, "t": 174.03101000000004, "r": 288.0596, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 296.42899, "t": 174.03101000000004, "r": 329.44687, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "complex", "bbox": {"l": 296.42899, "t": 174.03101000000004, "r": 329.44687, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 345.03299, "t": 174.03101000000004, "r": 354.75793, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "all", "bbox": {"l": 345.03299, "t": 174.03101000000004, "r": 354.75793, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 154.53799, "t": 192.85999000000004, "r": 201.24129, "b": 200.92969000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "PubTabNet", "bbox": {"l": 154.53799, "t": 192.85999000000004, "r": 201.24129, "b": 200.92969000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 222.43700000000004, "t": 187.38098000000002, "r": 247.13226000000003, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "OTSL", "bbox": {"l": 222.43700000000004, "t": 187.38098000000002, "r": 247.13226000000003, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 264.74399, "t": 187.38098000000002, "r": 285.73074, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "0.965", "bbox": {"l": 264.74399, "t": 187.38098000000002, "r": 285.73074, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 302.444, "t": 187.38098000000002, "r": 323.43076, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "0.934", "bbox": {"l": 302.444, "t": 187.38098000000002, "r": 323.43076, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 339.40302, "t": 187.38098000000002, "r": 360.38977, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "0.955", "bbox": {"l": 339.40302, "t": 187.38098000000002, "r": 360.38977, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 383.116, "t": 187.31817999999998, "r": 401.97324, "b": 195.24451, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "0.88", "bbox": {"l": 383.116, "t": 187.31817999999998, "r": 401.97324, "b": 195.24451, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 435.49300999999997, "t": 187.31817999999998, "r": 454.35025, "b": 195.24451, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "2.73", "bbox": {"l": 435.49300999999997, "t": 187.31817999999998, "r": 454.35025, "b": 195.24451, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 220.903, "t": 200.33196999999996, "r": 248.66655999999998, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "HTML", "bbox": {"l": 220.903, "t": 200.33196999999996, "r": 248.66655999999998, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 264.74399, "t": 200.33196999999996, "r": 285.73074, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "0.969", "bbox": {"l": 264.74399, "t": 200.33196999999996, "r": 285.73074, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 302.444, "t": 200.33196999999996, "r": 323.43076, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "0.927", "bbox": {"l": 302.444, "t": 200.33196999999996, "r": 323.43076, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 339.40302, "t": 200.33196999999996, "r": 360.38977, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "0.955", "bbox": {"l": 339.40302, "t": 200.33196999999996, "r": 360.38977, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 382.052, "t": 200.33196999999996, "r": 403.03876, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "0.857", "bbox": {"l": 382.052, "t": 200.33196999999996, "r": 403.03876, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 436.73199000000005, "t": 200.33196999999996, "r": 453.11182, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "5.39", "bbox": {"l": 436.73199000000005, "t": 200.33196999999996, "r": 453.11182, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 155.94501, "t": 219.16198999999995, "r": 199.83374, "b": 227.23168999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "FinTabNet", "bbox": {"l": 155.94501, "t": 219.16198999999995, "r": 199.83374, "b": 227.23168999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 222.43700000000004, "t": 213.68201, "r": 247.13226000000003, "b": 221.75171, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "OTSL", "bbox": {"l": 222.43700000000004, "t": 213.68201, "r": 247.13226000000003, "b": 221.75171, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 264.74399, "t": 213.68201, "r": 285.73074, "b": 221.75171, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "0.955", "bbox": {"l": 264.74399, "t": 213.68201, "r": 285.73074, "b": 221.75171, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 302.444, "t": 213.68201, "r": 323.43076, "b": 221.75171, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "0.961", "bbox": {"l": 302.444, "t": 213.68201, "r": 323.43076, "b": 221.75171, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 337.815, "t": 213.61919999999998, "r": 361.97586, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "0.959", "bbox": {"l": 337.815, "t": 213.61919999999998, "r": 361.97586, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 380.46399, "t": 213.61919999999998, "r": 404.62485, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "0.862", "bbox": {"l": 380.46399, "t": 213.61919999999998, "r": 404.62485, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 435.49300999999997, "t": 213.61919999999998, "r": 454.35025, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "1.85", "bbox": {"l": 435.49300999999997, "t": 213.61919999999998, "r": 454.35025, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 220.903, "t": 226.63396999999998, "r": 248.66655999999998, "b": 234.70367, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "HTML", "bbox": {"l": 220.903, "t": 226.63396999999998, "r": 248.66655999999998, "b": 234.70367, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 264.74399, "t": 226.63396999999998, "r": 285.73074, "b": 234.70367, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "0.917", "bbox": {"l": 264.74399, "t": 226.63396999999998, "r": 285.73074, "b": 234.70367, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 302.444, "t": 226.63396999999998, "r": 323.43076, "b": 234.70367, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "0.922", "bbox": {"l": 302.444, "t": 226.63396999999998, "r": 323.43076, "b": 234.70367, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 341.70599, "t": 226.63396999999998, "r": 358.08582, "b": 234.70367, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "0.92", "bbox": {"l": 341.70599, "t": 226.63396999999998, "r": 358.08582, "b": 234.70367, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 382.052, "t": 226.63396999999998, "r": 403.03876, "b": 234.70367, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "0.722", "bbox": {"l": 382.052, "t": 226.63396999999998, "r": 403.03876, "b": 234.70367, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 436.73199000000005, "t": 226.63396999999998, "r": 453.11182, "b": 234.70367, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "3.26", "bbox": {"l": 436.73199000000005, "t": 226.63396999999998, "r": 453.11182, "b": 234.70367, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 148.62601, "t": 245.46294999999998, "r": 207.1524, "b": 253.53265, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "PubTables-1M", "bbox": {"l": 148.62601, "t": 245.46294999999998, "r": 207.1524, "b": 253.53265, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 222.43700000000004, "t": 239.98297000000002, "r": 247.13226000000003, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "OTSL", "bbox": {"l": 222.43700000000004, "t": 239.98297000000002, "r": 247.13226000000003, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 264.74399, "t": 239.98297000000002, "r": 285.73074, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "0.987", "bbox": {"l": 264.74399, "t": 239.98297000000002, "r": 285.73074, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 302.444, "t": 239.98297000000002, "r": 323.43076, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "0.964", "bbox": {"l": 302.444, "t": 239.98297000000002, "r": 323.43076, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 337.815, "t": 239.92016999999998, "r": 361.97586, "b": 247.8465, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "0.977", "bbox": {"l": 337.815, "t": 239.92016999999998, "r": 361.97586, "b": 247.8465, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 380.46399, "t": 239.92016999999998, "r": 404.62485, "b": 247.8465, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "0.896", "bbox": {"l": 380.46399, "t": 239.92016999999998, "r": 404.62485, "b": 247.8465, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 435.49300999999997, "t": 239.92016999999998, "r": 454.35025, "b": 247.8465, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "1.79", "bbox": {"l": 435.49300999999997, "t": 239.92016999999998, "r": 454.35025, "b": 247.8465, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 220.903, "t": 252.93499999999995, "r": 248.66655999999998, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "HTML", "bbox": {"l": 220.903, "t": 252.93499999999995, "r": 248.66655999999998, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 264.74399, "t": 252.93499999999995, "r": 285.73074, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "0.983", "bbox": {"l": 264.74399, "t": 252.93499999999995, "r": 285.73074, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 302.444, "t": 252.93499999999995, "r": 323.43076, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "0.944", "bbox": {"l": 302.444, "t": 252.93499999999995, "r": 323.43076, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 339.40302, "t": 252.93499999999995, "r": 360.38977, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "0.966", "bbox": {"l": 339.40302, "t": 252.93499999999995, "r": 360.38977, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 382.052, "t": 252.93499999999995, "r": 403.03876, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "0.889", "bbox": {"l": 382.052, "t": 252.93499999999995, "r": 403.03876, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 436.73199000000005, "t": 252.93499999999995, "r": 453.11182, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "3.26", "bbox": {"l": 436.73199000000005, "t": 252.93499999999995, "r": 453.11182, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 3, "label": "section_header", "bbox": {"l": 134.765, "t": 288.91479, "r": 257.08679, "b": 297.72173999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9546447992324829, "cells": [{"id": 55, "text": "5.3", "bbox": {"l": 134.765, "t": 288.91479, "r": 149.40205, "b": 297.72173999999995, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Qualitative Results", "bbox": {"l": 160.85904, "t": 288.91479, "r": 257.08679, "b": 297.72173999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 134.765, "t": 309.86078, "r": 480.58981, "b": 366.47769, "coord_origin": "TOPLEFT"}, "confidence": 0.9834085702896118, "cells": [{"id": 57, "text": "To illustrate the qualitative differences between OTSL and HTML, Figure 5", "bbox": {"l": 134.765, "t": 309.86078, "r": 480.58777, "b": 318.65775, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "demonstrates less overlap and more accurate bounding boxes with OTSL. In", "bbox": {"l": 134.765, "t": 321.81577, "r": 480.58889999999997, "b": 330.61273, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Figure 6, OTSL proves to be more effective in handling tables with longer to-", "bbox": {"l": 134.765, "t": 333.77075, "r": 480.58681999999993, "b": 342.56772, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "ken sequences, resulting in even more precise structure prediction and bounding", "bbox": {"l": 134.765, "t": 345.72574, "r": 480.58981, "b": 354.52271, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "boxes.", "bbox": {"l": 134.765, "t": 357.68073, "r": 161.65704, "b": 366.47769, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "caption", "bbox": {"l": 134.765, "t": 397.59012, "r": 480.59106, "b": 439.71716, "coord_origin": "TOPLEFT"}, "confidence": 0.9482728838920593, "cells": [{"id": 62, "text": "Fig. 5.", "bbox": {"l": 134.765, "t": 397.59012, "r": 162.64424, "b": 405.51642, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "The OTSL model produces more accurate bounding boxes with less over-", "bbox": {"l": 167.384, "t": 397.65289, "r": 480.59106, "b": 405.72266, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "lap (E) than the HTML model (D), when predicting the structure of a sparse ta-", "bbox": {"l": 134.765, "t": 408.61190999999997, "r": 480.59106, "b": 416.68167000000005, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "ble (A), at twice the inference speed because of shorter sequence length (B),(C).", "bbox": {"l": 134.765, "t": 419.57089, "r": 480.58838000000003, "b": 427.64066, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "\"PMC2807444_006_00.png\" PubTabNet.", "bbox": {"l": 134.765, "t": 430.52987999999993, "r": 304.69171, "b": 438.59964, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "\u03bc", "bbox": {"l": 342.63354, "t": 430.19678, "r": 344.81915, "b": 439.71716, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "picture", "bbox": {"l": 162.67430114746094, "t": 444.62255859375, "r": 451.70062255859375, "b": 663.2135620117188, "coord_origin": "TOPLEFT"}, "confidence": 0.9742383360862732, "cells": [{"id": 67, "text": "<table>", "bbox": {"l": 180.12473, "t": 516.2332200000001, "r": 190.62042, "b": 518.94992, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "<tr><td></td><td colspan=\"4\"></td><td colspan=\"6\"></td><td colspan=\"3\"></td></tr>", "bbox": {"l": 183.2438, "t": 520.13208, "r": 304.54797, "b": 522.84879, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 524.03094, "r": 388.42313, "b": 526.74765, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 527.9297799999999, "r": 388.42313, "b": 530.64648, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 531.82861, "r": 388.42313, "b": 534.54532, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 535.72748, "r": 388.42313, "b": 538.44418, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 539.62631, "r": 388.42313, "b": 542.34303, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 543.52516, "r": 388.42313, "b": 546.24188, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 547.42401, "r": 388.42313, "b": 550.14073, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 551.32286, "r": 388.42313, "b": 554.03958, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "</table>", "bbox": {"l": 180.12473, "t": 555.22173, "r": 191.86806, "b": 557.93845, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "C", "bbox": {"l": 407.38348, "t": 518.30042, "r": 408.82025, "b": 521.01712, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "C L L L C L L L L L C L L NL", "bbox": {"l": 410.25699, "t": 518.30042, "r": 450.48605, "b": 521.01712, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "C", "bbox": {"l": 407.38348, "t": 522.19925, "r": 408.82025, "b": 524.9159500000001, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 522.19925, "r": 450.48605, "b": 524.9159500000001, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "C", "bbox": {"l": 407.38348, "t": 526.09808, "r": 408.82025, "b": 528.81479, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 526.09808, "r": 450.48605, "b": 528.81479, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "C", "bbox": {"l": 407.38348, "t": 529.99695, "r": 408.82025, "b": 532.7136499999999, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 529.99695, "r": 450.48605, "b": 532.7136499999999, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "C", "bbox": {"l": 407.38348, "t": 533.8957800000001, "r": 408.82025, "b": 536.6125, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 533.8957800000001, "r": 450.48605, "b": 536.6125, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "C", "bbox": {"l": 407.38348, "t": 537.79463, "r": 408.82025, "b": 540.51135, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 537.79463, "r": 450.48605, "b": 540.51135, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "C", "bbox": {"l": 407.38348, "t": 541.69348, "r": 408.82025, "b": 544.4102, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 541.69348, "r": 450.48605, "b": 544.4102, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "C", "bbox": {"l": 407.38348, "t": 545.59233, "r": 408.82025, "b": 548.3090500000001, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 545.59233, "r": 450.48605, "b": 548.3090500000001, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "C", "bbox": {"l": 407.38348, "t": 549.4911999999999, "r": 408.82025, "b": 552.2079200000001, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 549.4911999999999, "r": 450.48605, "b": 552.2079200000001, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "HTML", "bbox": {"l": 164.52881, "t": 509.45859, "r": 181.8528, "b": 515.31, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "#", "bbox": {"l": 183.58441, "t": 509.45859, "r": 186.3974, "b": 515.31, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "tokens:", "bbox": {"l": 189.2104, "t": 509.45859, "r": 208.90137, "b": 515.31, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "258", "bbox": {"l": 210.63269, "t": 509.45859, "r": 221.04044, "b": 515.31, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "OTSL", "bbox": {"l": 390.20203, "t": 509.60361, "r": 406.83609, "b": 515.45502, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "#", "bbox": {"l": 408.56952, "t": 509.60361, "r": 411.38251, "b": 515.45502, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "tokens:", "bbox": {"l": 414.1955, "t": 509.60361, "r": 433.88647000000003, "b": 515.45502, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "135", "bbox": {"l": 435.61737, "t": 509.60361, "r": 446.02512, "b": 515.45502, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "B", "bbox": {"l": 167.19316, "t": 519.07236, "r": 172.8231, "b": 526.3866, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "A", "bbox": {"l": 187.33745, "t": 448.62485, "r": 192.96739, "b": 455.93909, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "D", "bbox": {"l": 167.38654, "t": 566.0051599999999, "r": 173.01648, "b": 573.3194, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "E", "bbox": {"l": 248.45621000000003, "t": 621.78008, "r": 253.65727, "b": 629.09431, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "C", "bbox": {"l": 395.90057, "t": 519.19946, "r": 401.53052, "b": 526.5137, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "HTML", "bbox": {"l": 171.62886, "t": 580.28853, "r": 177.48148, "b": 597.26784, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "OTSL", "bbox": {"l": 251.05969000000002, "t": 633.63408, "r": 256.91235, "b": 649.92345, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "HTML model shows", "bbox": {"l": 372.14645, "t": 601.45724, "r": 427.0379, "b": 607.30864, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "bounding box drifting", "bbox": {"l": 372.14645, "t": 607.89948, "r": 430.06838999999997, "b": 613.75087, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "OTSL model shows", "bbox": {"l": 176.88042, "t": 642.87209, "r": 231.08191, "b": 648.72348, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "clean bounding box", "bbox": {"l": 176.88042, "t": 649.3143, "r": 230.99271000000002, "b": 655.1657, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "alignment", "bbox": {"l": 176.88042, "t": 655.7565500000001, "r": 203.93219, "b": 661.60794, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "\u2264", "bbox": {"l": 215.93231000000003, "t": 557.56342, "r": 218.4697, "b": 569.15967, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "\u03bc", "bbox": {"l": 229.05689999999998, "t": 557.56342, "r": 231.71908999999997, "b": 569.15967, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "S", "bbox": {"l": 261.20892, "t": 448.46124, "r": 263.56973, "b": 451.19727, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "I", "bbox": {"l": 312.33463, "t": 448.46124, "r": 313.6362, "b": 451.19727, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "R", "bbox": {"l": 377.41125, "t": 448.46124, "r": 380.05737, "b": 451.19727, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "ST", "bbox": {"l": 200.63976, "t": 453.33997, "r": 205.82492, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "0.03", "bbox": {"l": 222.20833000000002, "t": 453.33997, "r": 229.76836, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "0.06", "bbox": {"l": 243.26666, "t": 453.33997, "r": 250.82669, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "0.12", "bbox": {"l": 264.29657, "t": 453.33997, "r": 271.84949, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "0.25", "bbox": {"l": 285.31943, "t": 453.33997, "r": 292.87946, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "0.5", "bbox": {"l": 306.37775, "t": 453.33997, "r": 311.77319, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "1", "bbox": {"l": 323.41699, "t": 453.33997, "r": 325.58157, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "2", "bbox": {"l": 334.45807, "t": 453.33997, "r": 336.62265, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "4", "bbox": {"l": 345.52756, "t": 453.33997, "r": 347.69214, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "8", "bbox": {"l": 356.56863, "t": 453.33997, "r": 358.73322, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "16", "bbox": {"l": 367.63812, "t": 453.33997, "r": 371.97089, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "32", "bbox": {"l": 382.6734, "t": 453.33997, "r": 387.00616, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "64", "bbox": {"l": 397.73727, "t": 453.33997, "r": 402.07001, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "\u2265", "bbox": {"l": 412.78879, "t": 447.99298, "r": 414.93463, "b": 457.79964999999993, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": " 128", "bbox": {"l": 414.95697, "t": 453.33997, "r": 422.51746, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "63", "bbox": {"l": 200.63998, "t": 463.92444, "r": 204.57674, "b": 466.66043, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "1", "bbox": {"l": 367.62604, "t": 463.92444, "r": 369.58032, "b": 466.66043, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "1", "bbox": {"l": 382.66132, "t": 463.92444, "r": 384.6156, "b": 466.66043, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "3", "bbox": {"l": 397.72504, "t": 463.92444, "r": 399.67932, "b": 466.66043, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "199", "bbox": {"l": 200.64, "t": 468.80313, "r": 206.51694, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "5", "bbox": {"l": 264.29047, "t": 468.80313, "r": 266.25885, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "1", "bbox": {"l": 306.37213, "t": 468.80313, "r": 308.34052, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "2", "bbox": {"l": 345.51526, "t": 468.80313, "r": 347.48364, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "4", "bbox": {"l": 356.55634, "t": 468.80313, "r": 358.52472, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "1", "bbox": {"l": 367.62582, "t": 468.80313, "r": 369.59418, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "1", "bbox": {"l": 382.66107, "t": 468.80313, "r": 384.62946, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "416", "bbox": {"l": 200.64, "t": 473.68185, "r": 206.51694, "b": 476.41788, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "4", "bbox": {"l": 264.29047, "t": 473.68185, "r": 266.25885, "b": 476.41788, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "230", "bbox": {"l": 200.64, "t": 478.53214, "r": 206.51694, "b": 481.26816, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "1", "bbox": {"l": 243.26373, "t": 478.53214, "r": 245.2321, "b": 481.26816, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "9", "bbox": {"l": 264.29047, "t": 478.53214, "r": 266.25885, "b": 481.26816, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "1", "bbox": {"l": 323.40466, "t": 478.53214, "r": 325.37305, "b": 481.26816, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "1", "bbox": {"l": 397.72519, "t": 478.53214, "r": 399.69354, "b": 481.26816, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "276", "bbox": {"l": 200.64, "t": 483.41086, "r": 206.51694, "b": 486.14688, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "2", "bbox": {"l": 382.66132, "t": 483.41086, "r": 384.61563, "b": 486.14688, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "12", "bbox": {"l": 397.72513, "t": 483.41086, "r": 401.64819, "b": 486.14688, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "1", "bbox": {"l": 412.78928, "t": 483.41086, "r": 414.74359, "b": 486.14688, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "320", "bbox": {"l": 200.64014, "t": 488.28958, "r": 207.14445, "b": 491.0256, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "1", "bbox": {"l": 367.62616, "t": 488.28958, "r": 369.78375, "b": 491.0256, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "4", "bbox": {"l": 382.66141, "t": 488.28958, "r": 384.81897, "b": 491.0256, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "20", "bbox": {"l": 397.7251, "t": 488.28958, "r": 402.05087, "b": 491.0256, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "2013", "bbox": {"l": 200.64032, "t": 493.1683, "r": 208.48566, "b": 495.90433, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "3", "bbox": {"l": 264.29044, "t": 493.1683, "r": 266.25879, "b": 495.90433, "coord_origin": "TOPLEFT"}}], "children": [{"id": 56, "label": "text", "bbox": {"l": 180.12473, "t": 516.2332200000001, "r": 190.62042, "b": 518.94992, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "<table>", "bbox": {"l": 180.12473, "t": 516.2332200000001, "r": 190.62042, "b": 518.94992, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 183.2438, "t": 520.13208, "r": 304.54797, "b": 522.84879, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "<tr><td></td><td colspan=\"4\"></td><td colspan=\"6\"></td><td colspan=\"3\"></td></tr>", "bbox": {"l": 183.2438, "t": 520.13208, "r": 304.54797, "b": 522.84879, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 183.2438, "t": 524.03094, "r": 388.42313, "b": 526.74765, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 524.03094, "r": 388.42313, "b": 526.74765, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 183.2438, "t": 527.9297799999999, "r": 388.42313, "b": 530.64648, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 527.9297799999999, "r": 388.42313, "b": 530.64648, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 183.2438, "t": 531.82861, "r": 388.42313, "b": 534.54532, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 531.82861, "r": 388.42313, "b": 534.54532, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 183.2438, "t": 535.72748, "r": 388.42313, "b": 538.44418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 535.72748, "r": 388.42313, "b": 538.44418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 183.2438, "t": 539.62631, "r": 388.42313, "b": 542.34303, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 539.62631, "r": 388.42313, "b": 542.34303, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 183.2438, "t": 543.52516, "r": 388.42313, "b": 546.24188, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 543.52516, "r": 388.42313, "b": 546.24188, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 183.2438, "t": 547.42401, "r": 388.42313, "b": 550.14073, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 547.42401, "r": 388.42313, "b": 550.14073, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 183.2438, "t": 551.32286, "r": 388.42313, "b": 554.03958, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 551.32286, "r": 388.42313, "b": 554.03958, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 180.12473, "t": 555.22173, "r": 191.86806, "b": 557.93845, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "</table>", "bbox": {"l": 180.12473, "t": 555.22173, "r": 191.86806, "b": 557.93845, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 407.38348, "t": 518.30042, "r": 408.82025, "b": 521.01712, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "C", "bbox": {"l": 407.38348, "t": 518.30042, "r": 408.82025, "b": 521.01712, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 410.25699, "t": 518.30042, "r": 450.48605, "b": 521.01712, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "C L L L C L L L L L C L L NL", "bbox": {"l": 410.25699, "t": 518.30042, "r": 450.48605, "b": 521.01712, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 407.38348, "t": 522.19925, "r": 408.82025, "b": 524.9159500000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "C", "bbox": {"l": 407.38348, "t": 522.19925, "r": 408.82025, "b": 524.9159500000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 410.25699, "t": 522.19925, "r": 450.48605, "b": 524.9159500000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 522.19925, "r": 450.48605, "b": 524.9159500000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 407.38348, "t": 526.09808, "r": 408.82025, "b": 528.81479, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "C", "bbox": {"l": 407.38348, "t": 526.09808, "r": 408.82025, "b": 528.81479, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 410.25699, "t": 526.09808, "r": 450.48605, "b": 528.81479, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 526.09808, "r": 450.48605, "b": 528.81479, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 407.38348, "t": 529.99695, "r": 408.82025, "b": 532.7136499999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "C", "bbox": {"l": 407.38348, "t": 529.99695, "r": 408.82025, "b": 532.7136499999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 410.25699, "t": 529.99695, "r": 450.48605, "b": 532.7136499999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 529.99695, "r": 450.48605, "b": 532.7136499999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 407.38348, "t": 533.8957800000001, "r": 408.82025, "b": 536.6125, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "C", "bbox": {"l": 407.38348, "t": 533.8957800000001, "r": 408.82025, "b": 536.6125, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 410.25699, "t": 533.8957800000001, "r": 450.48605, "b": 536.6125, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 533.8957800000001, "r": 450.48605, "b": 536.6125, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 407.38348, "t": 537.79463, "r": 408.82025, "b": 540.51135, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "C", "bbox": {"l": 407.38348, "t": 537.79463, "r": 408.82025, "b": 540.51135, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 410.25699, "t": 537.79463, "r": 450.48605, "b": 540.51135, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 537.79463, "r": 450.48605, "b": 540.51135, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 407.38348, "t": 541.69348, "r": 408.82025, "b": 544.4102, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "C", "bbox": {"l": 407.38348, "t": 541.69348, "r": 408.82025, "b": 544.4102, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 410.25699, "t": 541.69348, "r": 450.48605, "b": 544.4102, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 541.69348, "r": 450.48605, "b": 544.4102, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 407.38348, "t": 545.59233, "r": 408.82025, "b": 548.3090500000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "C", "bbox": {"l": 407.38348, "t": 545.59233, "r": 408.82025, "b": 548.3090500000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 410.25699, "t": 545.59233, "r": 450.48605, "b": 548.3090500000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 545.59233, "r": 450.48605, "b": 548.3090500000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 407.38348, "t": 549.4911999999999, "r": 408.82025, "b": 552.2079200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "C", "bbox": {"l": 407.38348, "t": 549.4911999999999, "r": 408.82025, "b": 552.2079200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 410.25699, "t": 549.4911999999999, "r": 450.48605, "b": 552.2079200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 549.4911999999999, "r": 450.48605, "b": 552.2079200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 164.52881, "t": 509.45859, "r": 181.8528, "b": 515.31, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "HTML", "bbox": {"l": 164.52881, "t": 509.45859, "r": 181.8528, "b": 515.31, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 183.58441, "t": 509.45859, "r": 186.3974, "b": 515.31, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "#", "bbox": {"l": 183.58441, "t": 509.45859, "r": 186.3974, "b": 515.31, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 189.2104, "t": 509.45859, "r": 208.90137, "b": 515.31, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "tokens:", "bbox": {"l": 189.2104, "t": 509.45859, "r": 208.90137, "b": 515.31, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 210.63269, "t": 509.45859, "r": 221.04044, "b": 515.31, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "258", "bbox": {"l": 210.63269, "t": 509.45859, "r": 221.04044, "b": 515.31, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 390.20203, "t": 509.60361, "r": 406.83609, "b": 515.45502, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "OTSL", "bbox": {"l": 390.20203, "t": 509.60361, "r": 406.83609, "b": 515.45502, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 408.56952, "t": 509.60361, "r": 411.38251, "b": 515.45502, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "#", "bbox": {"l": 408.56952, "t": 509.60361, "r": 411.38251, "b": 515.45502, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 414.1955, "t": 509.60361, "r": 433.88647000000003, "b": 515.45502, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "tokens:", "bbox": {"l": 414.1955, "t": 509.60361, "r": 433.88647000000003, "b": 515.45502, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 435.61737, "t": 509.60361, "r": 446.02512, "b": 515.45502, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": "135", "bbox": {"l": 435.61737, "t": 509.60361, "r": 446.02512, "b": 515.45502, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 167.19316, "t": 519.07236, "r": 172.8231, "b": 526.3866, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "B", "bbox": {"l": 167.19316, "t": 519.07236, "r": 172.8231, "b": 526.3866, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 187.33745, "t": 448.62485, "r": 192.96739, "b": 455.93909, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "A", "bbox": {"l": 187.33745, "t": 448.62485, "r": 192.96739, "b": 455.93909, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 167.38654, "t": 566.0051599999999, "r": 173.01648, "b": 573.3194, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": "D", "bbox": {"l": 167.38654, "t": 566.0051599999999, "r": 173.01648, "b": 573.3194, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 248.45621000000003, "t": 621.78008, "r": 253.65727, "b": 629.09431, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 107, "text": "E", "bbox": {"l": 248.45621000000003, "t": 621.78008, "r": 253.65727, "b": 629.09431, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 395.90057, "t": 519.19946, "r": 401.53052, "b": 526.5137, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 108, "text": "C", "bbox": {"l": 395.90057, "t": 519.19946, "r": 401.53052, "b": 526.5137, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 171.62886, "t": 580.28853, "r": 177.48148, "b": 597.26784, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 109, "text": "HTML", "bbox": {"l": 171.62886, "t": 580.28853, "r": 177.48148, "b": 597.26784, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 251.05969000000002, "t": 633.63408, "r": 256.91235, "b": 649.92345, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 110, "text": "OTSL", "bbox": {"l": 251.05969000000002, "t": 633.63408, "r": 256.91235, "b": 649.92345, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 372.14645, "t": 601.45724, "r": 427.0379, "b": 607.30864, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 111, "text": "HTML model shows", "bbox": {"l": 372.14645, "t": 601.45724, "r": 427.0379, "b": 607.30864, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 372.14645, "t": 607.89948, "r": 430.06838999999997, "b": 613.75087, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 112, "text": "bounding box drifting", "bbox": {"l": 372.14645, "t": 607.89948, "r": 430.06838999999997, "b": 613.75087, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 176.88042, "t": 642.87209, "r": 231.08191, "b": 648.72348, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 113, "text": "OTSL model shows", "bbox": {"l": 176.88042, "t": 642.87209, "r": 231.08191, "b": 648.72348, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 176.88042, "t": 649.3143, "r": 230.99271000000002, "b": 655.1657, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 114, "text": "clean bounding box", "bbox": {"l": 176.88042, "t": 649.3143, "r": 230.99271000000002, "b": 655.1657, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 176.88042, "t": 655.7565500000001, "r": 203.93219, "b": 661.60794, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 115, "text": "alignment", "bbox": {"l": 176.88042, "t": 655.7565500000001, "r": 203.93219, "b": 661.60794, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 215.93231000000003, "t": 557.56342, "r": 218.4697, "b": 569.15967, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 116, "text": "\u2264", "bbox": {"l": 215.93231000000003, "t": 557.56342, "r": 218.4697, "b": 569.15967, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 229.05689999999998, "t": 557.56342, "r": 231.71908999999997, "b": 569.15967, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 117, "text": "\u03bc", "bbox": {"l": 229.05689999999998, "t": 557.56342, "r": 231.71908999999997, "b": 569.15967, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 261.20892, "t": 448.46124, "r": 263.56973, "b": 451.19727, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 119, "text": "S", "bbox": {"l": 261.20892, "t": 448.46124, "r": 263.56973, "b": 451.19727, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 312.33463, "t": 448.46124, "r": 313.6362, "b": 451.19727, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 120, "text": "I", "bbox": {"l": 312.33463, "t": 448.46124, "r": 313.6362, "b": 451.19727, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 377.41125, "t": 448.46124, "r": 380.05737, "b": 451.19727, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 121, "text": "R", "bbox": {"l": 377.41125, "t": 448.46124, "r": 380.05737, "b": 451.19727, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 200.63976, "t": 453.33997, "r": 205.82492, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 122, "text": "ST", "bbox": {"l": 200.63976, "t": 453.33997, "r": 205.82492, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 222.20833000000002, "t": 453.33997, "r": 229.76836, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 123, "text": "0.03", "bbox": {"l": 222.20833000000002, "t": 453.33997, "r": 229.76836, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 243.26666, "t": 453.33997, "r": 250.82669, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 124, "text": "0.06", "bbox": {"l": 243.26666, "t": 453.33997, "r": 250.82669, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 264.29657, "t": 453.33997, "r": 271.84949, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 125, "text": "0.12", "bbox": {"l": 264.29657, "t": 453.33997, "r": 271.84949, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 114, "label": "text", "bbox": {"l": 285.31943, "t": 453.33997, "r": 292.87946, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 126, "text": "0.25", "bbox": {"l": 285.31943, "t": 453.33997, "r": 292.87946, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 115, "label": "text", "bbox": {"l": 306.37775, "t": 453.33997, "r": 311.77319, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 127, "text": "0.5", "bbox": {"l": 306.37775, "t": 453.33997, "r": 311.77319, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 116, "label": "text", "bbox": {"l": 323.41699, "t": 453.33997, "r": 325.58157, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 128, "text": "1", "bbox": {"l": 323.41699, "t": 453.33997, "r": 325.58157, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 117, "label": "text", "bbox": {"l": 334.45807, "t": 453.33997, "r": 336.62265, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 129, "text": "2", "bbox": {"l": 334.45807, "t": 453.33997, "r": 336.62265, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 118, "label": "text", "bbox": {"l": 345.52756, "t": 453.33997, "r": 347.69214, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 130, "text": "4", "bbox": {"l": 345.52756, "t": 453.33997, "r": 347.69214, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 119, "label": "text", "bbox": {"l": 356.56863, "t": 453.33997, "r": 358.73322, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 131, "text": "8", "bbox": {"l": 356.56863, "t": 453.33997, "r": 358.73322, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 120, "label": "text", "bbox": {"l": 367.63812, "t": 453.33997, "r": 371.97089, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 132, "text": "16", "bbox": {"l": 367.63812, "t": 453.33997, "r": 371.97089, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 121, "label": "text", "bbox": {"l": 382.6734, "t": 453.33997, "r": 387.00616, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 133, "text": "32", "bbox": {"l": 382.6734, "t": 453.33997, "r": 387.00616, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 122, "label": "text", "bbox": {"l": 397.73727, "t": 453.33997, "r": 402.07001, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 134, "text": "64", "bbox": {"l": 397.73727, "t": 453.33997, "r": 402.07001, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 123, "label": "text", "bbox": {"l": 412.78879, "t": 447.99298, "r": 414.93463, "b": 457.79964999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 135, "text": "\u2265", "bbox": {"l": 412.78879, "t": 447.99298, "r": 414.93463, "b": 457.79964999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 124, "label": "text", "bbox": {"l": 414.95697, "t": 453.33997, "r": 422.51746, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 136, "text": " 128", "bbox": {"l": 414.95697, "t": 453.33997, "r": 422.51746, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 125, "label": "text", "bbox": {"l": 200.63998, "t": 463.92444, "r": 204.57674, "b": 466.66043, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 137, "text": "63", "bbox": {"l": 200.63998, "t": 463.92444, "r": 204.57674, "b": 466.66043, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 126, "label": "text", "bbox": {"l": 367.62604, "t": 463.92444, "r": 369.58032, "b": 466.66043, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 138, "text": "1", "bbox": {"l": 367.62604, "t": 463.92444, "r": 369.58032, "b": 466.66043, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 127, "label": "text", "bbox": {"l": 382.66132, "t": 463.92444, "r": 384.6156, "b": 466.66043, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 139, "text": "1", "bbox": {"l": 382.66132, "t": 463.92444, "r": 384.6156, "b": 466.66043, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 128, "label": "text", "bbox": {"l": 397.72504, "t": 463.92444, "r": 399.67932, "b": 466.66043, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 140, "text": "3", "bbox": {"l": 397.72504, "t": 463.92444, "r": 399.67932, "b": 466.66043, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 129, "label": "text", "bbox": {"l": 200.64, "t": 468.80313, "r": 206.51694, "b": 471.53915, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 141, "text": "199", "bbox": {"l": 200.64, "t": 468.80313, "r": 206.51694, "b": 471.53915, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 130, "label": "text", "bbox": {"l": 264.29047, "t": 468.80313, "r": 266.25885, "b": 471.53915, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 142, "text": "5", "bbox": {"l": 264.29047, "t": 468.80313, "r": 266.25885, "b": 471.53915, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 131, "label": "text", "bbox": {"l": 306.37213, "t": 468.80313, "r": 308.34052, "b": 471.53915, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 143, "text": "1", "bbox": {"l": 306.37213, "t": 468.80313, "r": 308.34052, "b": 471.53915, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 132, "label": "text", "bbox": {"l": 345.51526, "t": 468.80313, "r": 347.48364, "b": 471.53915, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 144, "text": "2", "bbox": {"l": 345.51526, "t": 468.80313, "r": 347.48364, "b": 471.53915, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 133, "label": "text", "bbox": {"l": 356.55634, "t": 468.80313, "r": 358.52472, "b": 471.53915, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 145, "text": "4", "bbox": {"l": 356.55634, "t": 468.80313, "r": 358.52472, "b": 471.53915, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 134, "label": "text", "bbox": {"l": 367.62582, "t": 468.80313, "r": 369.59418, "b": 471.53915, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 146, "text": "1", "bbox": {"l": 367.62582, "t": 468.80313, "r": 369.59418, "b": 471.53915, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 135, "label": "text", "bbox": {"l": 382.66107, "t": 468.80313, "r": 384.62946, "b": 471.53915, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 147, "text": "1", "bbox": {"l": 382.66107, "t": 468.80313, "r": 384.62946, "b": 471.53915, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 136, "label": "text", "bbox": {"l": 200.64, "t": 473.68185, "r": 206.51694, "b": 476.41788, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 148, "text": "416", "bbox": {"l": 200.64, "t": 473.68185, "r": 206.51694, "b": 476.41788, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 137, "label": "text", "bbox": {"l": 264.29047, "t": 473.68185, "r": 266.25885, "b": 476.41788, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 149, "text": "4", "bbox": {"l": 264.29047, "t": 473.68185, "r": 266.25885, "b": 476.41788, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 138, "label": "text", "bbox": {"l": 200.64, "t": 478.53214, "r": 206.51694, "b": 481.26816, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 150, "text": "230", "bbox": {"l": 200.64, "t": 478.53214, "r": 206.51694, "b": 481.26816, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 139, "label": "text", "bbox": {"l": 243.26373, "t": 478.53214, "r": 245.2321, "b": 481.26816, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 151, "text": "1", "bbox": {"l": 243.26373, "t": 478.53214, "r": 245.2321, "b": 481.26816, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 140, "label": "text", "bbox": {"l": 264.29047, "t": 478.53214, "r": 266.25885, "b": 481.26816, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 152, "text": "9", "bbox": {"l": 264.29047, "t": 478.53214, "r": 266.25885, "b": 481.26816, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 141, "label": "text", "bbox": {"l": 323.40466, "t": 478.53214, "r": 325.37305, "b": 481.26816, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 153, "text": "1", "bbox": {"l": 323.40466, "t": 478.53214, "r": 325.37305, "b": 481.26816, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 142, "label": "text", "bbox": {"l": 397.72519, "t": 478.53214, "r": 399.69354, "b": 481.26816, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 154, "text": "1", "bbox": {"l": 397.72519, "t": 478.53214, "r": 399.69354, "b": 481.26816, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 143, "label": "text", "bbox": {"l": 200.64, "t": 483.41086, "r": 206.51694, "b": 486.14688, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 155, "text": "276", "bbox": {"l": 200.64, "t": 483.41086, "r": 206.51694, "b": 486.14688, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 144, "label": "text", "bbox": {"l": 382.66132, "t": 483.41086, "r": 384.61563, "b": 486.14688, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 156, "text": "2", "bbox": {"l": 382.66132, "t": 483.41086, "r": 384.61563, "b": 486.14688, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 145, "label": "text", "bbox": {"l": 397.72513, "t": 483.41086, "r": 401.64819, "b": 486.14688, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 157, "text": "12", "bbox": {"l": 397.72513, "t": 483.41086, "r": 401.64819, "b": 486.14688, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 146, "label": "text", "bbox": {"l": 412.78928, "t": 483.41086, "r": 414.74359, "b": 486.14688, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 158, "text": "1", "bbox": {"l": 412.78928, "t": 483.41086, "r": 414.74359, "b": 486.14688, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 147, "label": "text", "bbox": {"l": 200.64014, "t": 488.28958, "r": 207.14445, "b": 491.0256, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 159, "text": "320", "bbox": {"l": 200.64014, "t": 488.28958, "r": 207.14445, "b": 491.0256, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 148, "label": "text", "bbox": {"l": 367.62616, "t": 488.28958, "r": 369.78375, "b": 491.0256, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 160, "text": "1", "bbox": {"l": 367.62616, "t": 488.28958, "r": 369.78375, "b": 491.0256, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 149, "label": "text", "bbox": {"l": 382.66141, "t": 488.28958, "r": 384.81897, "b": 491.0256, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 161, "text": "4", "bbox": {"l": 382.66141, "t": 488.28958, "r": 384.81897, "b": 491.0256, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 150, "label": "text", "bbox": {"l": 397.7251, "t": 488.28958, "r": 402.05087, "b": 491.0256, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 162, "text": "20", "bbox": {"l": 397.7251, "t": 488.28958, "r": 402.05087, "b": 491.0256, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 151, "label": "text", "bbox": {"l": 200.64032, "t": 493.1683, "r": 208.48566, "b": 495.90433, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 163, "text": "2013", "bbox": {"l": 200.64032, "t": 493.1683, "r": 208.48566, "b": 495.90433, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 152, "label": "text", "bbox": {"l": 264.29044, "t": 493.1683, "r": 266.25879, "b": 495.90433, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 164, "text": "3", "bbox": {"l": 264.29044, "t": 493.1683, "r": 266.25879, "b": 495.90433, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 153, "label": "text", "bbox": {"l": 227.91466, "t": 665.82603, "r": 230.10028, "b": 675.3464, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 165, "text": "\u03bc", "bbox": {"l": 227.91466, "t": 665.82603, "r": 230.10028, "b": 675.3464, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 154, "label": "text", "bbox": {"l": 300.58057, "t": 683.62195, "r": 302.72638, "b": 693.428658, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 166, "text": "\u2265", "bbox": {"l": 300.58057, "t": 683.62195, "r": 302.72638, "b": 693.428658, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {"0": {"label": "table", "id": 0, "page_no": 9, "cluster": {"id": 0, "label": "table", "bbox": {"l": 143.6376495361328, "t": 156.3477020263672, "r": 470.8485412597656, "b": 263.2624816894531, "coord_origin": "TOPLEFT"}, "confidence": 0.9884640574455261, "cells": [{"id": 7, "text": "Data set", "bbox": {"l": 160.782, "t": 166.55895999999996, "r": 194.99779, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Language", "bbox": {"l": 215.52499000000003, "t": 166.534, "r": 254.04465, "b": 174.6037, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "TEDs", "bbox": {"l": 300.397, "t": 161.07898, "r": 323.99118, "b": 169.14868, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "mAP(0.75)", "bbox": {"l": 370.345, "t": 166.55895999999996, "r": 414.74661, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Inference", "bbox": {"l": 426.737, "t": 161.07898, "r": 463.10830999999996, "b": 169.14868, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "time (secs)", "bbox": {"l": 423.11401, "t": 172.03796, "r": 466.72656, "b": 180.10766999999998, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "simple", "bbox": {"l": 262.41299, "t": 174.03101000000004, "r": 288.0596, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "complex", "bbox": {"l": 296.42899, "t": 174.03101000000004, "r": 329.44687, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "all", "bbox": {"l": 345.03299, "t": 174.03101000000004, "r": 354.75793, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "PubTabNet", "bbox": {"l": 154.53799, "t": 192.85999000000004, "r": 201.24129, "b": 200.92969000000005, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "OTSL", "bbox": {"l": 222.43700000000004, "t": 187.38098000000002, "r": 247.13226000000003, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "0.965", "bbox": {"l": 264.74399, "t": 187.38098000000002, "r": 285.73074, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "0.934", "bbox": {"l": 302.444, "t": 187.38098000000002, "r": 323.43076, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "0.955", "bbox": {"l": 339.40302, "t": 187.38098000000002, "r": 360.38977, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "0.88", "bbox": {"l": 383.116, "t": 187.31817999999998, "r": 401.97324, "b": 195.24451, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "2.73", "bbox": {"l": 435.49300999999997, "t": 187.31817999999998, "r": 454.35025, "b": 195.24451, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "HTML", "bbox": {"l": 220.903, "t": 200.33196999999996, "r": 248.66655999999998, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "0.969", "bbox": {"l": 264.74399, "t": 200.33196999999996, "r": 285.73074, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "0.927", "bbox": {"l": 302.444, "t": 200.33196999999996, "r": 323.43076, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "0.955", "bbox": {"l": 339.40302, "t": 200.33196999999996, "r": 360.38977, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "0.857", "bbox": {"l": 382.052, "t": 200.33196999999996, "r": 403.03876, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "5.39", "bbox": {"l": 436.73199000000005, "t": 200.33196999999996, "r": 453.11182, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "FinTabNet", "bbox": {"l": 155.94501, "t": 219.16198999999995, "r": 199.83374, "b": 227.23168999999996, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "OTSL", "bbox": {"l": 222.43700000000004, "t": 213.68201, "r": 247.13226000000003, "b": 221.75171, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "0.955", "bbox": {"l": 264.74399, "t": 213.68201, "r": 285.73074, "b": 221.75171, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "0.961", "bbox": {"l": 302.444, "t": 213.68201, "r": 323.43076, "b": 221.75171, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "0.959", "bbox": {"l": 337.815, "t": 213.61919999999998, "r": 361.97586, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "0.862", "bbox": {"l": 380.46399, "t": 213.61919999999998, "r": 404.62485, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "1.85", "bbox": {"l": 435.49300999999997, "t": 213.61919999999998, "r": 454.35025, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "HTML", "bbox": {"l": 220.903, "t": 226.63396999999998, "r": 248.66655999999998, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "0.917", "bbox": {"l": 264.74399, "t": 226.63396999999998, "r": 285.73074, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "0.922", "bbox": {"l": 302.444, "t": 226.63396999999998, "r": 323.43076, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "0.92", "bbox": {"l": 341.70599, "t": 226.63396999999998, "r": 358.08582, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "0.722", "bbox": {"l": 382.052, "t": 226.63396999999998, "r": 403.03876, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "3.26", "bbox": {"l": 436.73199000000005, "t": 226.63396999999998, "r": 453.11182, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "PubTables-1M", "bbox": {"l": 148.62601, "t": 245.46294999999998, "r": 207.1524, "b": 253.53265, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "OTSL", "bbox": {"l": 222.43700000000004, "t": 239.98297000000002, "r": 247.13226000000003, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "0.987", "bbox": {"l": 264.74399, "t": 239.98297000000002, "r": 285.73074, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "0.964", "bbox": {"l": 302.444, "t": 239.98297000000002, "r": 323.43076, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "0.977", "bbox": {"l": 337.815, "t": 239.92016999999998, "r": 361.97586, "b": 247.8465, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "0.896", "bbox": {"l": 380.46399, "t": 239.92016999999998, "r": 404.62485, "b": 247.8465, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "1.79", "bbox": {"l": 435.49300999999997, "t": 239.92016999999998, "r": 454.35025, "b": 247.8465, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "HTML", "bbox": {"l": 220.903, "t": 252.93499999999995, "r": 248.66655999999998, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "0.983", "bbox": {"l": 264.74399, "t": 252.93499999999995, "r": 285.73074, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "0.944", "bbox": {"l": 302.444, "t": 252.93499999999995, "r": 323.43076, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "0.966", "bbox": {"l": 339.40302, "t": 252.93499999999995, "r": 360.38977, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "0.889", "bbox": {"l": 382.052, "t": 252.93499999999995, "r": 403.03876, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "3.26", "bbox": {"l": 436.73199000000005, "t": 252.93499999999995, "r": 453.11182, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": [{"id": 8, "label": "text", "bbox": {"l": 160.782, "t": 166.55895999999996, "r": 194.99779, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "Data set", "bbox": {"l": 160.782, "t": 166.55895999999996, "r": 194.99779, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 215.52499000000003, "t": 166.534, "r": 254.04465, "b": 174.6037, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "Language", "bbox": {"l": 215.52499000000003, "t": 166.534, "r": 254.04465, "b": 174.6037, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "text", "bbox": {"l": 300.397, "t": 161.07898, "r": 323.99118, "b": 169.14868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "TEDs", "bbox": {"l": 300.397, "t": 161.07898, "r": 323.99118, "b": 169.14868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 370.345, "t": 166.55895999999996, "r": 414.74661, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "mAP(0.75)", "bbox": {"l": 370.345, "t": 166.55895999999996, "r": 414.74661, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 426.737, "t": 161.07898, "r": 463.10830999999996, "b": 169.14868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "Inference", "bbox": {"l": 426.737, "t": 161.07898, "r": 463.10830999999996, "b": 169.14868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 423.11401, "t": 172.03796, "r": 466.72656, "b": 180.10766999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "time (secs)", "bbox": {"l": 423.11401, "t": 172.03796, "r": 466.72656, "b": 180.10766999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 262.41299, "t": 174.03101000000004, "r": 288.0596, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "simple", "bbox": {"l": 262.41299, "t": 174.03101000000004, "r": 288.0596, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 296.42899, "t": 174.03101000000004, "r": 329.44687, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "complex", "bbox": {"l": 296.42899, "t": 174.03101000000004, "r": 329.44687, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 345.03299, "t": 174.03101000000004, "r": 354.75793, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "all", "bbox": {"l": 345.03299, "t": 174.03101000000004, "r": 354.75793, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 154.53799, "t": 192.85999000000004, "r": 201.24129, "b": 200.92969000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "PubTabNet", "bbox": {"l": 154.53799, "t": 192.85999000000004, "r": 201.24129, "b": 200.92969000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 222.43700000000004, "t": 187.38098000000002, "r": 247.13226000000003, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "OTSL", "bbox": {"l": 222.43700000000004, "t": 187.38098000000002, "r": 247.13226000000003, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 264.74399, "t": 187.38098000000002, "r": 285.73074, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "0.965", "bbox": {"l": 264.74399, "t": 187.38098000000002, "r": 285.73074, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 302.444, "t": 187.38098000000002, "r": 323.43076, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "0.934", "bbox": {"l": 302.444, "t": 187.38098000000002, "r": 323.43076, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 339.40302, "t": 187.38098000000002, "r": 360.38977, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "0.955", "bbox": {"l": 339.40302, "t": 187.38098000000002, "r": 360.38977, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 383.116, "t": 187.31817999999998, "r": 401.97324, "b": 195.24451, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "0.88", "bbox": {"l": 383.116, "t": 187.31817999999998, "r": 401.97324, "b": 195.24451, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 435.49300999999997, "t": 187.31817999999998, "r": 454.35025, "b": 195.24451, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "2.73", "bbox": {"l": 435.49300999999997, "t": 187.31817999999998, "r": 454.35025, "b": 195.24451, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 220.903, "t": 200.33196999999996, "r": 248.66655999999998, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "HTML", "bbox": {"l": 220.903, "t": 200.33196999999996, "r": 248.66655999999998, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 264.74399, "t": 200.33196999999996, "r": 285.73074, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "0.969", "bbox": {"l": 264.74399, "t": 200.33196999999996, "r": 285.73074, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 302.444, "t": 200.33196999999996, "r": 323.43076, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "0.927", "bbox": {"l": 302.444, "t": 200.33196999999996, "r": 323.43076, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 339.40302, "t": 200.33196999999996, "r": 360.38977, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "0.955", "bbox": {"l": 339.40302, "t": 200.33196999999996, "r": 360.38977, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 382.052, "t": 200.33196999999996, "r": 403.03876, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "0.857", "bbox": {"l": 382.052, "t": 200.33196999999996, "r": 403.03876, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 436.73199000000005, "t": 200.33196999999996, "r": 453.11182, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "5.39", "bbox": {"l": 436.73199000000005, "t": 200.33196999999996, "r": 453.11182, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 155.94501, "t": 219.16198999999995, "r": 199.83374, "b": 227.23168999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "FinTabNet", "bbox": {"l": 155.94501, "t": 219.16198999999995, "r": 199.83374, "b": 227.23168999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 222.43700000000004, "t": 213.68201, "r": 247.13226000000003, "b": 221.75171, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "OTSL", "bbox": {"l": 222.43700000000004, "t": 213.68201, "r": 247.13226000000003, "b": 221.75171, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 264.74399, "t": 213.68201, "r": 285.73074, "b": 221.75171, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "0.955", "bbox": {"l": 264.74399, "t": 213.68201, "r": 285.73074, "b": 221.75171, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 302.444, "t": 213.68201, "r": 323.43076, "b": 221.75171, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "0.961", "bbox": {"l": 302.444, "t": 213.68201, "r": 323.43076, "b": 221.75171, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 337.815, "t": 213.61919999999998, "r": 361.97586, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "0.959", "bbox": {"l": 337.815, "t": 213.61919999999998, "r": 361.97586, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 380.46399, "t": 213.61919999999998, "r": 404.62485, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "0.862", "bbox": {"l": 380.46399, "t": 213.61919999999998, "r": 404.62485, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 435.49300999999997, "t": 213.61919999999998, "r": 454.35025, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "1.85", "bbox": {"l": 435.49300999999997, "t": 213.61919999999998, "r": 454.35025, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 220.903, "t": 226.63396999999998, "r": 248.66655999999998, "b": 234.70367, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "HTML", "bbox": {"l": 220.903, "t": 226.63396999999998, "r": 248.66655999999998, "b": 234.70367, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 264.74399, "t": 226.63396999999998, "r": 285.73074, "b": 234.70367, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "0.917", "bbox": {"l": 264.74399, "t": 226.63396999999998, "r": 285.73074, "b": 234.70367, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 302.444, "t": 226.63396999999998, "r": 323.43076, "b": 234.70367, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "0.922", "bbox": {"l": 302.444, "t": 226.63396999999998, "r": 323.43076, "b": 234.70367, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 341.70599, "t": 226.63396999999998, "r": 358.08582, "b": 234.70367, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "0.92", "bbox": {"l": 341.70599, "t": 226.63396999999998, "r": 358.08582, "b": 234.70367, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 382.052, "t": 226.63396999999998, "r": 403.03876, "b": 234.70367, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "0.722", "bbox": {"l": 382.052, "t": 226.63396999999998, "r": 403.03876, "b": 234.70367, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 436.73199000000005, "t": 226.63396999999998, "r": 453.11182, "b": 234.70367, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "3.26", "bbox": {"l": 436.73199000000005, "t": 226.63396999999998, "r": 453.11182, "b": 234.70367, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 148.62601, "t": 245.46294999999998, "r": 207.1524, "b": 253.53265, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "PubTables-1M", "bbox": {"l": 148.62601, "t": 245.46294999999998, "r": 207.1524, "b": 253.53265, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 222.43700000000004, "t": 239.98297000000002, "r": 247.13226000000003, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "OTSL", "bbox": {"l": 222.43700000000004, "t": 239.98297000000002, "r": 247.13226000000003, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 264.74399, "t": 239.98297000000002, "r": 285.73074, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "0.987", "bbox": {"l": 264.74399, "t": 239.98297000000002, "r": 285.73074, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 302.444, "t": 239.98297000000002, "r": 323.43076, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "0.964", "bbox": {"l": 302.444, "t": 239.98297000000002, "r": 323.43076, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 337.815, "t": 239.92016999999998, "r": 361.97586, "b": 247.8465, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "0.977", "bbox": {"l": 337.815, "t": 239.92016999999998, "r": 361.97586, "b": 247.8465, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 380.46399, "t": 239.92016999999998, "r": 404.62485, "b": 247.8465, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "0.896", "bbox": {"l": 380.46399, "t": 239.92016999999998, "r": 404.62485, "b": 247.8465, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 435.49300999999997, "t": 239.92016999999998, "r": 454.35025, "b": 247.8465, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "1.79", "bbox": {"l": 435.49300999999997, "t": 239.92016999999998, "r": 454.35025, "b": 247.8465, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 220.903, "t": 252.93499999999995, "r": 248.66655999999998, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "HTML", "bbox": {"l": 220.903, "t": 252.93499999999995, "r": 248.66655999999998, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 264.74399, "t": 252.93499999999995, "r": 285.73074, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "0.983", "bbox": {"l": 264.74399, "t": 252.93499999999995, "r": 285.73074, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 302.444, "t": 252.93499999999995, "r": 323.43076, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "0.944", "bbox": {"l": 302.444, "t": 252.93499999999995, "r": 323.43076, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 339.40302, "t": 252.93499999999995, "r": 360.38977, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "0.966", "bbox": {"l": 339.40302, "t": 252.93499999999995, "r": 360.38977, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 382.052, "t": 252.93499999999995, "r": 403.03876, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "0.889", "bbox": {"l": 382.052, "t": 252.93499999999995, "r": 403.03876, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 436.73199000000005, "t": 252.93499999999995, "r": 453.11182, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "3.26", "bbox": {"l": 436.73199000000005, "t": 252.93499999999995, "r": 453.11182, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "lcel", "lcel", "ched", "ched", "nl", "ched", "ucel", "ched", "ched", "ched", "ucel", "ucel", "nl", "rhed", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 8, "num_cols": 7, "table_cells": [{"bbox": {"l": 215.52499000000003, "t": 166.534, "r": 254.04465, "b": 174.6037, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Language", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 300.397, "t": 161.07898, "r": 323.99118, "b": 169.14868, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 3, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 5, "text": "TEDs", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 370.345, "t": 166.55895999999996, "r": 414.74661, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 2, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "mAP(0.75)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 423.11401, "t": 161.07898, "r": 466.72656, "b": 180.10766999999998, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 2, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "Inference time (secs)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 262.41299, "t": 174.03101000000004, "r": 288.0596, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "simple", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 296.42899, "t": 174.03101000000004, "r": 329.44687, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "complex", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 345.03299, "t": 174.03101000000004, "r": 354.75793, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "all", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 154.53799, "t": 192.85999000000004, "r": 201.24129, "b": 200.92969000000005, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PubTabNet", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 222.43700000000004, "t": 187.38098000000002, "r": 247.13226000000003, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "OTSL", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 264.74399, "t": 187.38098000000002, "r": 285.73074, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.965", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 302.444, "t": 187.38098000000002, "r": 323.43076, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.934", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 339.40302, "t": 187.38098000000002, "r": 360.38977, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.955", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 383.116, "t": 187.31817999999998, "r": 401.97324, "b": 195.24451, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 435.49300999999997, "t": 187.31817999999998, "r": 454.35025, "b": 195.24451, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "2.73", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 220.903, "t": 200.33196999999996, "r": 248.66655999999998, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "HTML", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 264.74399, "t": 200.33196999999996, "r": 285.73074, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.969", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 302.444, "t": 200.33196999999996, "r": 323.43076, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.927", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 339.40302, "t": 200.33196999999996, "r": 360.38977, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.955", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 382.052, "t": 200.33196999999996, "r": 403.03876, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.857", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 436.73199000000005, "t": 200.33196999999996, "r": 453.11182, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "5.39", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 155.94501, "t": 219.16198999999995, "r": 199.83374, "b": 227.23168999999996, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "FinTabNet", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 222.43700000000004, "t": 213.68201, "r": 247.13226000000003, "b": 221.75171, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "OTSL", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 264.74399, "t": 213.68201, "r": 285.73074, "b": 221.75171, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.955", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 302.444, "t": 213.68201, "r": 323.43076, "b": 221.75171, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.961", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 337.815, "t": 213.61919999999998, "r": 361.97586, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.959", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 380.46399, "t": 213.61919999999998, "r": 404.62485, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.862", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 435.49300999999997, "t": 213.61919999999998, "r": 454.35025, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "1.85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 220.903, "t": 226.63396999999998, "r": 248.66655999999998, "b": 234.70367, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "HTML", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 264.74399, "t": 226.63396999999998, "r": 285.73074, "b": 234.70367, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.917", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 302.444, "t": 226.63396999999998, "r": 323.43076, "b": 234.70367, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.922", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 341.70599, "t": 226.63396999999998, "r": 358.08582, "b": 234.70367, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.92", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 382.052, "t": 226.63396999999998, "r": 403.03876, "b": 234.70367, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.722", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 436.73199000000005, "t": 226.63396999999998, "r": 453.11182, "b": 234.70367, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "3.26", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 148.62601, "t": 245.46294999999998, "r": 207.1524, "b": 253.53265, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PubTables-1M", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 222.43700000000004, "t": 239.98297000000002, "r": 247.13226000000003, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "OTSL", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 264.74399, "t": 239.98297000000002, "r": 285.73074, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.987", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 302.444, "t": 239.98297000000002, "r": 323.43076, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.964", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 337.815, "t": 239.92016999999998, "r": 361.97586, "b": 247.8465, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.977", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 380.46399, "t": 239.92016999999998, "r": 404.62485, "b": 247.8465, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.896", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 435.49300999999997, "t": 239.92016999999998, "r": 454.35025, "b": 247.8465, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "1.79", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 220.903, "t": 252.93499999999995, "r": 248.66655999999998, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "HTML", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 264.74399, "t": 252.93499999999995, "r": 285.73074, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.983", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 302.444, "t": 252.93499999999995, "r": 323.43076, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.944", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 339.40302, "t": 252.93499999999995, "r": 360.38977, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.966", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 382.052, "t": 252.93499999999995, "r": 403.03876, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.889", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 436.73199000000005, "t": 252.93499999999995, "r": 453.11182, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "3.26", "column_header": false, "row_header": false, "row_section": false}]}}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_header", "id": 7, "page_no": 9, "cluster": {"id": 7, "label": "page_header", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 143.97887, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8309906721115112, "cells": [{"id": 0, "text": "10", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 143.97887, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "10"}, {"label": "page_header", "id": 6, "page_no": 9, "cluster": {"id": 6, "label": "page_header", "bbox": {"l": 167.82053, "t": 93.77099999999996, "r": 231.72049000000004, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8367075324058533, "cells": [{"id": 1, "text": "M.", "bbox": {"l": 167.82053, "t": 93.77099999999996, "r": 178.08249, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37929, "t": 93.77099999999996, "r": 231.72049000000004, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "M. Lysak, et al."}, {"label": "caption", "id": 4, "page_no": 9, "cluster": {"id": 4, "label": "caption", "bbox": {"l": 134.765, "t": 115.83618000000001, "r": 480.59357000000006, "b": 145.88666, "coord_origin": "TOPLEFT"}, "confidence": 0.9512290954589844, "cells": [{"id": 3, "text": "Table 2.", "bbox": {"l": 134.765, "t": 115.83618000000001, "r": 173.09366, "b": 123.76251000000002, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "TSR and cell detection results compared between OTSL and HTML on", "bbox": {"l": 181.30299, "t": 115.89899000000003, "r": 480.59151999999995, "b": 123.96868999999992, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "the PubTabNet [22], FinTabNet [21] and PubTables-1M [14] data sets using Table-", "bbox": {"l": 134.765, "t": 126.85797000000014, "r": 480.59357000000006, "b": 134.92767000000003, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Former [9] (with enc=6, dec=6, heads=8).", "bbox": {"l": 134.765, "t": 137.81696, "r": 305.95691, "b": 145.88666, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 2. TSR and cell detection results compared between OTSL and HTML on the PubTabNet [22], FinTabNet [21] and PubTables-1M [14] data sets using TableFormer [9] (with enc=6, dec=6, heads=8)."}, {"label": "table", "id": 0, "page_no": 9, "cluster": {"id": 0, "label": "table", "bbox": {"l": 143.6376495361328, "t": 156.3477020263672, "r": 470.8485412597656, "b": 263.2624816894531, "coord_origin": "TOPLEFT"}, "confidence": 0.9884640574455261, "cells": [{"id": 7, "text": "Data set", "bbox": {"l": 160.782, "t": 166.55895999999996, "r": 194.99779, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Language", "bbox": {"l": 215.52499000000003, "t": 166.534, "r": 254.04465, "b": 174.6037, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "TEDs", "bbox": {"l": 300.397, "t": 161.07898, "r": 323.99118, "b": 169.14868, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "mAP(0.75)", "bbox": {"l": 370.345, "t": 166.55895999999996, "r": 414.74661, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Inference", "bbox": {"l": 426.737, "t": 161.07898, "r": 463.10830999999996, "b": 169.14868, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "time (secs)", "bbox": {"l": 423.11401, "t": 172.03796, "r": 466.72656, "b": 180.10766999999998, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "simple", "bbox": {"l": 262.41299, "t": 174.03101000000004, "r": 288.0596, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "complex", "bbox": {"l": 296.42899, "t": 174.03101000000004, "r": 329.44687, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "all", "bbox": {"l": 345.03299, "t": 174.03101000000004, "r": 354.75793, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "PubTabNet", "bbox": {"l": 154.53799, "t": 192.85999000000004, "r": 201.24129, "b": 200.92969000000005, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "OTSL", "bbox": {"l": 222.43700000000004, "t": 187.38098000000002, "r": 247.13226000000003, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "0.965", "bbox": {"l": 264.74399, "t": 187.38098000000002, "r": 285.73074, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "0.934", "bbox": {"l": 302.444, "t": 187.38098000000002, "r": 323.43076, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "0.955", "bbox": {"l": 339.40302, "t": 187.38098000000002, "r": 360.38977, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "0.88", "bbox": {"l": 383.116, "t": 187.31817999999998, "r": 401.97324, "b": 195.24451, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "2.73", "bbox": {"l": 435.49300999999997, "t": 187.31817999999998, "r": 454.35025, "b": 195.24451, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "HTML", "bbox": {"l": 220.903, "t": 200.33196999999996, "r": 248.66655999999998, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "0.969", "bbox": {"l": 264.74399, "t": 200.33196999999996, "r": 285.73074, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "0.927", "bbox": {"l": 302.444, "t": 200.33196999999996, "r": 323.43076, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "0.955", "bbox": {"l": 339.40302, "t": 200.33196999999996, "r": 360.38977, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "0.857", "bbox": {"l": 382.052, "t": 200.33196999999996, "r": 403.03876, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "5.39", "bbox": {"l": 436.73199000000005, "t": 200.33196999999996, "r": 453.11182, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "FinTabNet", "bbox": {"l": 155.94501, "t": 219.16198999999995, "r": 199.83374, "b": 227.23168999999996, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "OTSL", "bbox": {"l": 222.43700000000004, "t": 213.68201, "r": 247.13226000000003, "b": 221.75171, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "0.955", "bbox": {"l": 264.74399, "t": 213.68201, "r": 285.73074, "b": 221.75171, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "0.961", "bbox": {"l": 302.444, "t": 213.68201, "r": 323.43076, "b": 221.75171, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "0.959", "bbox": {"l": 337.815, "t": 213.61919999999998, "r": 361.97586, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "0.862", "bbox": {"l": 380.46399, "t": 213.61919999999998, "r": 404.62485, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "1.85", "bbox": {"l": 435.49300999999997, "t": 213.61919999999998, "r": 454.35025, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "HTML", "bbox": {"l": 220.903, "t": 226.63396999999998, "r": 248.66655999999998, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "0.917", "bbox": {"l": 264.74399, "t": 226.63396999999998, "r": 285.73074, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "0.922", "bbox": {"l": 302.444, "t": 226.63396999999998, "r": 323.43076, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "0.92", "bbox": {"l": 341.70599, "t": 226.63396999999998, "r": 358.08582, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "0.722", "bbox": {"l": 382.052, "t": 226.63396999999998, "r": 403.03876, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "3.26", "bbox": {"l": 436.73199000000005, "t": 226.63396999999998, "r": 453.11182, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "PubTables-1M", "bbox": {"l": 148.62601, "t": 245.46294999999998, "r": 207.1524, "b": 253.53265, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "OTSL", "bbox": {"l": 222.43700000000004, "t": 239.98297000000002, "r": 247.13226000000003, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "0.987", "bbox": {"l": 264.74399, "t": 239.98297000000002, "r": 285.73074, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "0.964", "bbox": {"l": 302.444, "t": 239.98297000000002, "r": 323.43076, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "0.977", "bbox": {"l": 337.815, "t": 239.92016999999998, "r": 361.97586, "b": 247.8465, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "0.896", "bbox": {"l": 380.46399, "t": 239.92016999999998, "r": 404.62485, "b": 247.8465, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "1.79", "bbox": {"l": 435.49300999999997, "t": 239.92016999999998, "r": 454.35025, "b": 247.8465, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "HTML", "bbox": {"l": 220.903, "t": 252.93499999999995, "r": 248.66655999999998, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "0.983", "bbox": {"l": 264.74399, "t": 252.93499999999995, "r": 285.73074, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "0.944", "bbox": {"l": 302.444, "t": 252.93499999999995, "r": 323.43076, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "0.966", "bbox": {"l": 339.40302, "t": 252.93499999999995, "r": 360.38977, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "0.889", "bbox": {"l": 382.052, "t": 252.93499999999995, "r": 403.03876, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "3.26", "bbox": {"l": 436.73199000000005, "t": 252.93499999999995, "r": 453.11182, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": [{"id": 8, "label": "text", "bbox": {"l": 160.782, "t": 166.55895999999996, "r": 194.99779, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "Data set", "bbox": {"l": 160.782, "t": 166.55895999999996, "r": 194.99779, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 215.52499000000003, "t": 166.534, "r": 254.04465, "b": 174.6037, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "Language", "bbox": {"l": 215.52499000000003, "t": 166.534, "r": 254.04465, "b": 174.6037, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "text", "bbox": {"l": 300.397, "t": 161.07898, "r": 323.99118, "b": 169.14868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "TEDs", "bbox": {"l": 300.397, "t": 161.07898, "r": 323.99118, "b": 169.14868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 370.345, "t": 166.55895999999996, "r": 414.74661, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "mAP(0.75)", "bbox": {"l": 370.345, "t": 166.55895999999996, "r": 414.74661, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 426.737, "t": 161.07898, "r": 463.10830999999996, "b": 169.14868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "Inference", "bbox": {"l": 426.737, "t": 161.07898, "r": 463.10830999999996, "b": 169.14868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 423.11401, "t": 172.03796, "r": 466.72656, "b": 180.10766999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "time (secs)", "bbox": {"l": 423.11401, "t": 172.03796, "r": 466.72656, "b": 180.10766999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 262.41299, "t": 174.03101000000004, "r": 288.0596, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "simple", "bbox": {"l": 262.41299, "t": 174.03101000000004, "r": 288.0596, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 296.42899, "t": 174.03101000000004, "r": 329.44687, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "complex", "bbox": {"l": 296.42899, "t": 174.03101000000004, "r": 329.44687, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 345.03299, "t": 174.03101000000004, "r": 354.75793, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "all", "bbox": {"l": 345.03299, "t": 174.03101000000004, "r": 354.75793, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 154.53799, "t": 192.85999000000004, "r": 201.24129, "b": 200.92969000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "PubTabNet", "bbox": {"l": 154.53799, "t": 192.85999000000004, "r": 201.24129, "b": 200.92969000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 222.43700000000004, "t": 187.38098000000002, "r": 247.13226000000003, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "OTSL", "bbox": {"l": 222.43700000000004, "t": 187.38098000000002, "r": 247.13226000000003, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 264.74399, "t": 187.38098000000002, "r": 285.73074, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "0.965", "bbox": {"l": 264.74399, "t": 187.38098000000002, "r": 285.73074, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 302.444, "t": 187.38098000000002, "r": 323.43076, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "0.934", "bbox": {"l": 302.444, "t": 187.38098000000002, "r": 323.43076, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 339.40302, "t": 187.38098000000002, "r": 360.38977, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "0.955", "bbox": {"l": 339.40302, "t": 187.38098000000002, "r": 360.38977, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 383.116, "t": 187.31817999999998, "r": 401.97324, "b": 195.24451, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "0.88", "bbox": {"l": 383.116, "t": 187.31817999999998, "r": 401.97324, "b": 195.24451, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 435.49300999999997, "t": 187.31817999999998, "r": 454.35025, "b": 195.24451, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "2.73", "bbox": {"l": 435.49300999999997, "t": 187.31817999999998, "r": 454.35025, "b": 195.24451, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 220.903, "t": 200.33196999999996, "r": 248.66655999999998, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "HTML", "bbox": {"l": 220.903, "t": 200.33196999999996, "r": 248.66655999999998, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 264.74399, "t": 200.33196999999996, "r": 285.73074, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "0.969", "bbox": {"l": 264.74399, "t": 200.33196999999996, "r": 285.73074, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 302.444, "t": 200.33196999999996, "r": 323.43076, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "0.927", "bbox": {"l": 302.444, "t": 200.33196999999996, "r": 323.43076, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 339.40302, "t": 200.33196999999996, "r": 360.38977, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "0.955", "bbox": {"l": 339.40302, "t": 200.33196999999996, "r": 360.38977, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 382.052, "t": 200.33196999999996, "r": 403.03876, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "0.857", "bbox": {"l": 382.052, "t": 200.33196999999996, "r": 403.03876, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 436.73199000000005, "t": 200.33196999999996, "r": 453.11182, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "5.39", "bbox": {"l": 436.73199000000005, "t": 200.33196999999996, "r": 453.11182, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 155.94501, "t": 219.16198999999995, "r": 199.83374, "b": 227.23168999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "FinTabNet", "bbox": {"l": 155.94501, "t": 219.16198999999995, "r": 199.83374, "b": 227.23168999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 222.43700000000004, "t": 213.68201, "r": 247.13226000000003, "b": 221.75171, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "OTSL", "bbox": {"l": 222.43700000000004, "t": 213.68201, "r": 247.13226000000003, "b": 221.75171, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 264.74399, "t": 213.68201, "r": 285.73074, "b": 221.75171, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "0.955", "bbox": {"l": 264.74399, "t": 213.68201, "r": 285.73074, "b": 221.75171, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 302.444, "t": 213.68201, "r": 323.43076, "b": 221.75171, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "0.961", "bbox": {"l": 302.444, "t": 213.68201, "r": 323.43076, "b": 221.75171, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 337.815, "t": 213.61919999999998, "r": 361.97586, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "0.959", "bbox": {"l": 337.815, "t": 213.61919999999998, "r": 361.97586, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 380.46399, "t": 213.61919999999998, "r": 404.62485, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "0.862", "bbox": {"l": 380.46399, "t": 213.61919999999998, "r": 404.62485, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 435.49300999999997, "t": 213.61919999999998, "r": 454.35025, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "1.85", "bbox": {"l": 435.49300999999997, "t": 213.61919999999998, "r": 454.35025, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 220.903, "t": 226.63396999999998, "r": 248.66655999999998, "b": 234.70367, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "HTML", "bbox": {"l": 220.903, "t": 226.63396999999998, "r": 248.66655999999998, "b": 234.70367, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 264.74399, "t": 226.63396999999998, "r": 285.73074, "b": 234.70367, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "0.917", "bbox": {"l": 264.74399, "t": 226.63396999999998, "r": 285.73074, "b": 234.70367, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 302.444, "t": 226.63396999999998, "r": 323.43076, "b": 234.70367, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "0.922", "bbox": {"l": 302.444, "t": 226.63396999999998, "r": 323.43076, "b": 234.70367, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 341.70599, "t": 226.63396999999998, "r": 358.08582, "b": 234.70367, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "0.92", "bbox": {"l": 341.70599, "t": 226.63396999999998, "r": 358.08582, "b": 234.70367, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 382.052, "t": 226.63396999999998, "r": 403.03876, "b": 234.70367, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "0.722", "bbox": {"l": 382.052, "t": 226.63396999999998, "r": 403.03876, "b": 234.70367, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 436.73199000000005, "t": 226.63396999999998, "r": 453.11182, "b": 234.70367, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "3.26", "bbox": {"l": 436.73199000000005, "t": 226.63396999999998, "r": 453.11182, "b": 234.70367, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 148.62601, "t": 245.46294999999998, "r": 207.1524, "b": 253.53265, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "PubTables-1M", "bbox": {"l": 148.62601, "t": 245.46294999999998, "r": 207.1524, "b": 253.53265, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 222.43700000000004, "t": 239.98297000000002, "r": 247.13226000000003, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "OTSL", "bbox": {"l": 222.43700000000004, "t": 239.98297000000002, "r": 247.13226000000003, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 264.74399, "t": 239.98297000000002, "r": 285.73074, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "0.987", "bbox": {"l": 264.74399, "t": 239.98297000000002, "r": 285.73074, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 302.444, "t": 239.98297000000002, "r": 323.43076, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "0.964", "bbox": {"l": 302.444, "t": 239.98297000000002, "r": 323.43076, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 337.815, "t": 239.92016999999998, "r": 361.97586, "b": 247.8465, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "0.977", "bbox": {"l": 337.815, "t": 239.92016999999998, "r": 361.97586, "b": 247.8465, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 380.46399, "t": 239.92016999999998, "r": 404.62485, "b": 247.8465, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "0.896", "bbox": {"l": 380.46399, "t": 239.92016999999998, "r": 404.62485, "b": 247.8465, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 435.49300999999997, "t": 239.92016999999998, "r": 454.35025, "b": 247.8465, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "1.79", "bbox": {"l": 435.49300999999997, "t": 239.92016999999998, "r": 454.35025, "b": 247.8465, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 220.903, "t": 252.93499999999995, "r": 248.66655999999998, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "HTML", "bbox": {"l": 220.903, "t": 252.93499999999995, "r": 248.66655999999998, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 264.74399, "t": 252.93499999999995, "r": 285.73074, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "0.983", "bbox": {"l": 264.74399, "t": 252.93499999999995, "r": 285.73074, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 302.444, "t": 252.93499999999995, "r": 323.43076, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "0.944", "bbox": {"l": 302.444, "t": 252.93499999999995, "r": 323.43076, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 339.40302, "t": 252.93499999999995, "r": 360.38977, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "0.966", "bbox": {"l": 339.40302, "t": 252.93499999999995, "r": 360.38977, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 382.052, "t": 252.93499999999995, "r": 403.03876, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "0.889", "bbox": {"l": 382.052, "t": 252.93499999999995, "r": 403.03876, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 436.73199000000005, "t": 252.93499999999995, "r": 453.11182, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "3.26", "bbox": {"l": 436.73199000000005, "t": 252.93499999999995, "r": 453.11182, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "lcel", "lcel", "ched", "ched", "nl", "ched", "ucel", "ched", "ched", "ched", "ucel", "ucel", "nl", "rhed", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 8, "num_cols": 7, "table_cells": [{"bbox": {"l": 215.52499000000003, "t": 166.534, "r": 254.04465, "b": 174.6037, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Language", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 300.397, "t": 161.07898, "r": 323.99118, "b": 169.14868, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 3, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 5, "text": "TEDs", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 370.345, "t": 166.55895999999996, "r": 414.74661, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 2, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "mAP(0.75)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 423.11401, "t": 161.07898, "r": 466.72656, "b": 180.10766999999998, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 2, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "Inference time (secs)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 262.41299, "t": 174.03101000000004, "r": 288.0596, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "simple", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 296.42899, "t": 174.03101000000004, "r": 329.44687, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "complex", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 345.03299, "t": 174.03101000000004, "r": 354.75793, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "all", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 154.53799, "t": 192.85999000000004, "r": 201.24129, "b": 200.92969000000005, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PubTabNet", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 222.43700000000004, "t": 187.38098000000002, "r": 247.13226000000003, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "OTSL", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 264.74399, "t": 187.38098000000002, "r": 285.73074, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.965", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 302.444, "t": 187.38098000000002, "r": 323.43076, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.934", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 339.40302, "t": 187.38098000000002, "r": 360.38977, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.955", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 383.116, "t": 187.31817999999998, "r": 401.97324, "b": 195.24451, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 435.49300999999997, "t": 187.31817999999998, "r": 454.35025, "b": 195.24451, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "2.73", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 220.903, "t": 200.33196999999996, "r": 248.66655999999998, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "HTML", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 264.74399, "t": 200.33196999999996, "r": 285.73074, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.969", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 302.444, "t": 200.33196999999996, "r": 323.43076, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.927", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 339.40302, "t": 200.33196999999996, "r": 360.38977, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.955", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 382.052, "t": 200.33196999999996, "r": 403.03876, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.857", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 436.73199000000005, "t": 200.33196999999996, "r": 453.11182, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "5.39", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 155.94501, "t": 219.16198999999995, "r": 199.83374, "b": 227.23168999999996, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "FinTabNet", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 222.43700000000004, "t": 213.68201, "r": 247.13226000000003, "b": 221.75171, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "OTSL", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 264.74399, "t": 213.68201, "r": 285.73074, "b": 221.75171, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.955", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 302.444, "t": 213.68201, "r": 323.43076, "b": 221.75171, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.961", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 337.815, "t": 213.61919999999998, "r": 361.97586, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.959", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 380.46399, "t": 213.61919999999998, "r": 404.62485, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.862", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 435.49300999999997, "t": 213.61919999999998, "r": 454.35025, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "1.85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 220.903, "t": 226.63396999999998, "r": 248.66655999999998, "b": 234.70367, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "HTML", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 264.74399, "t": 226.63396999999998, "r": 285.73074, "b": 234.70367, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.917", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 302.444, "t": 226.63396999999998, "r": 323.43076, "b": 234.70367, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.922", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 341.70599, "t": 226.63396999999998, "r": 358.08582, "b": 234.70367, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.92", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 382.052, "t": 226.63396999999998, "r": 403.03876, "b": 234.70367, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.722", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 436.73199000000005, "t": 226.63396999999998, "r": 453.11182, "b": 234.70367, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "3.26", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 148.62601, "t": 245.46294999999998, "r": 207.1524, "b": 253.53265, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PubTables-1M", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 222.43700000000004, "t": 239.98297000000002, "r": 247.13226000000003, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "OTSL", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 264.74399, "t": 239.98297000000002, "r": 285.73074, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.987", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 302.444, "t": 239.98297000000002, "r": 323.43076, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.964", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 337.815, "t": 239.92016999999998, "r": 361.97586, "b": 247.8465, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.977", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 380.46399, "t": 239.92016999999998, "r": 404.62485, "b": 247.8465, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.896", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 435.49300999999997, "t": 239.92016999999998, "r": 454.35025, "b": 247.8465, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "1.79", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 220.903, "t": 252.93499999999995, "r": 248.66655999999998, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "HTML", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 264.74399, "t": 252.93499999999995, "r": 285.73074, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.983", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 302.444, "t": 252.93499999999995, "r": 323.43076, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.944", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 339.40302, "t": 252.93499999999995, "r": 360.38977, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.966", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 382.052, "t": 252.93499999999995, "r": 403.03876, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.889", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 436.73199000000005, "t": 252.93499999999995, "r": 453.11182, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "3.26", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "section_header", "id": 3, "page_no": 9, "cluster": {"id": 3, "label": "section_header", "bbox": {"l": 134.765, "t": 288.91479, "r": 257.08679, "b": 297.72173999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9546447992324829, "cells": [{"id": 55, "text": "5.3", "bbox": {"l": 134.765, "t": 288.91479, "r": 149.40205, "b": 297.72173999999995, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Qualitative Results", "bbox": {"l": 160.85904, "t": 288.91479, "r": 257.08679, "b": 297.72173999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5.3 Qualitative Results"}, {"label": "text", "id": 1, "page_no": 9, "cluster": {"id": 1, "label": "text", "bbox": {"l": 134.765, "t": 309.86078, "r": 480.58981, "b": 366.47769, "coord_origin": "TOPLEFT"}, "confidence": 0.9834085702896118, "cells": [{"id": 57, "text": "To illustrate the qualitative differences between OTSL and HTML, Figure 5", "bbox": {"l": 134.765, "t": 309.86078, "r": 480.58777, "b": 318.65775, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "demonstrates less overlap and more accurate bounding boxes with OTSL. In", "bbox": {"l": 134.765, "t": 321.81577, "r": 480.58889999999997, "b": 330.61273, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Figure 6, OTSL proves to be more effective in handling tables with longer to-", "bbox": {"l": 134.765, "t": 333.77075, "r": 480.58681999999993, "b": 342.56772, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "ken sequences, resulting in even more precise structure prediction and bounding", "bbox": {"l": 134.765, "t": 345.72574, "r": 480.58981, "b": 354.52271, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "boxes.", "bbox": {"l": 134.765, "t": 357.68073, "r": 161.65704, "b": 366.47769, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "To illustrate the qualitative differences between OTSL and HTML, Figure 5 demonstrates less overlap and more accurate bounding boxes with OTSL. In Figure 6, OTSL proves to be more effective in handling tables with longer token sequences, resulting in even more precise structure prediction and bounding boxes."}, {"label": "caption", "id": 5, "page_no": 9, "cluster": {"id": 5, "label": "caption", "bbox": {"l": 134.765, "t": 397.59012, "r": 480.59106, "b": 439.71716, "coord_origin": "TOPLEFT"}, "confidence": 0.9482728838920593, "cells": [{"id": 62, "text": "Fig. 5.", "bbox": {"l": 134.765, "t": 397.59012, "r": 162.64424, "b": 405.51642, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "The OTSL model produces more accurate bounding boxes with less over-", "bbox": {"l": 167.384, "t": 397.65289, "r": 480.59106, "b": 405.72266, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "lap (E) than the HTML model (D), when predicting the structure of a sparse ta-", "bbox": {"l": 134.765, "t": 408.61190999999997, "r": 480.59106, "b": 416.68167000000005, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "ble (A), at twice the inference speed because of shorter sequence length (B),(C).", "bbox": {"l": 134.765, "t": 419.57089, "r": 480.58838000000003, "b": 427.64066, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "\"PMC2807444_006_00.png\" PubTabNet.", "bbox": {"l": 134.765, "t": 430.52987999999993, "r": 304.69171, "b": 438.59964, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "\u03bc", "bbox": {"l": 342.63354, "t": 430.19678, "r": 344.81915, "b": 439.71716, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Fig. 5. The OTSL model produces more accurate bounding boxes with less overlap (E) than the HTML model (D), when predicting the structure of a sparse table (A), at twice the inference speed because of shorter sequence length (B),(C). \"PMC2807444_006_00.png\" PubTabNet. \u03bc"}, {"label": "picture", "id": 2, "page_no": 9, "cluster": {"id": 2, "label": "picture", "bbox": {"l": 162.67430114746094, "t": 444.62255859375, "r": 451.70062255859375, "b": 663.2135620117188, "coord_origin": "TOPLEFT"}, "confidence": 0.9742383360862732, "cells": [{"id": 67, "text": "<table>", "bbox": {"l": 180.12473, "t": 516.2332200000001, "r": 190.62042, "b": 518.94992, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "<tr><td></td><td colspan=\"4\"></td><td colspan=\"6\"></td><td colspan=\"3\"></td></tr>", "bbox": {"l": 183.2438, "t": 520.13208, "r": 304.54797, "b": 522.84879, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 524.03094, "r": 388.42313, "b": 526.74765, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 527.9297799999999, "r": 388.42313, "b": 530.64648, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 531.82861, "r": 388.42313, "b": 534.54532, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 535.72748, "r": 388.42313, "b": 538.44418, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 539.62631, "r": 388.42313, "b": 542.34303, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 543.52516, "r": 388.42313, "b": 546.24188, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 547.42401, "r": 388.42313, "b": 550.14073, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 551.32286, "r": 388.42313, "b": 554.03958, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "</table>", "bbox": {"l": 180.12473, "t": 555.22173, "r": 191.86806, "b": 557.93845, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "C", "bbox": {"l": 407.38348, "t": 518.30042, "r": 408.82025, "b": 521.01712, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "C L L L C L L L L L C L L NL", "bbox": {"l": 410.25699, "t": 518.30042, "r": 450.48605, "b": 521.01712, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "C", "bbox": {"l": 407.38348, "t": 522.19925, "r": 408.82025, "b": 524.9159500000001, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 522.19925, "r": 450.48605, "b": 524.9159500000001, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "C", "bbox": {"l": 407.38348, "t": 526.09808, "r": 408.82025, "b": 528.81479, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 526.09808, "r": 450.48605, "b": 528.81479, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "C", "bbox": {"l": 407.38348, "t": 529.99695, "r": 408.82025, "b": 532.7136499999999, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 529.99695, "r": 450.48605, "b": 532.7136499999999, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "C", "bbox": {"l": 407.38348, "t": 533.8957800000001, "r": 408.82025, "b": 536.6125, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 533.8957800000001, "r": 450.48605, "b": 536.6125, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "C", "bbox": {"l": 407.38348, "t": 537.79463, "r": 408.82025, "b": 540.51135, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 537.79463, "r": 450.48605, "b": 540.51135, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "C", "bbox": {"l": 407.38348, "t": 541.69348, "r": 408.82025, "b": 544.4102, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 541.69348, "r": 450.48605, "b": 544.4102, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "C", "bbox": {"l": 407.38348, "t": 545.59233, "r": 408.82025, "b": 548.3090500000001, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 545.59233, "r": 450.48605, "b": 548.3090500000001, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "C", "bbox": {"l": 407.38348, "t": 549.4911999999999, "r": 408.82025, "b": 552.2079200000001, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 549.4911999999999, "r": 450.48605, "b": 552.2079200000001, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "HTML", "bbox": {"l": 164.52881, "t": 509.45859, "r": 181.8528, "b": 515.31, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "#", "bbox": {"l": 183.58441, "t": 509.45859, "r": 186.3974, "b": 515.31, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "tokens:", "bbox": {"l": 189.2104, "t": 509.45859, "r": 208.90137, "b": 515.31, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "258", "bbox": {"l": 210.63269, "t": 509.45859, "r": 221.04044, "b": 515.31, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "OTSL", "bbox": {"l": 390.20203, "t": 509.60361, "r": 406.83609, "b": 515.45502, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "#", "bbox": {"l": 408.56952, "t": 509.60361, "r": 411.38251, "b": 515.45502, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "tokens:", "bbox": {"l": 414.1955, "t": 509.60361, "r": 433.88647000000003, "b": 515.45502, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "135", "bbox": {"l": 435.61737, "t": 509.60361, "r": 446.02512, "b": 515.45502, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "B", "bbox": {"l": 167.19316, "t": 519.07236, "r": 172.8231, "b": 526.3866, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "A", "bbox": {"l": 187.33745, "t": 448.62485, "r": 192.96739, "b": 455.93909, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "D", "bbox": {"l": 167.38654, "t": 566.0051599999999, "r": 173.01648, "b": 573.3194, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "E", "bbox": {"l": 248.45621000000003, "t": 621.78008, "r": 253.65727, "b": 629.09431, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "C", "bbox": {"l": 395.90057, "t": 519.19946, "r": 401.53052, "b": 526.5137, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "HTML", "bbox": {"l": 171.62886, "t": 580.28853, "r": 177.48148, "b": 597.26784, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "OTSL", "bbox": {"l": 251.05969000000002, "t": 633.63408, "r": 256.91235, "b": 649.92345, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "HTML model shows", "bbox": {"l": 372.14645, "t": 601.45724, "r": 427.0379, "b": 607.30864, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "bounding box drifting", "bbox": {"l": 372.14645, "t": 607.89948, "r": 430.06838999999997, "b": 613.75087, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "OTSL model shows", "bbox": {"l": 176.88042, "t": 642.87209, "r": 231.08191, "b": 648.72348, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "clean bounding box", "bbox": {"l": 176.88042, "t": 649.3143, "r": 230.99271000000002, "b": 655.1657, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "alignment", "bbox": {"l": 176.88042, "t": 655.7565500000001, "r": 203.93219, "b": 661.60794, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "\u2264", "bbox": {"l": 215.93231000000003, "t": 557.56342, "r": 218.4697, "b": 569.15967, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "\u03bc", "bbox": {"l": 229.05689999999998, "t": 557.56342, "r": 231.71908999999997, "b": 569.15967, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "S", "bbox": {"l": 261.20892, "t": 448.46124, "r": 263.56973, "b": 451.19727, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "I", "bbox": {"l": 312.33463, "t": 448.46124, "r": 313.6362, "b": 451.19727, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "R", "bbox": {"l": 377.41125, "t": 448.46124, "r": 380.05737, "b": 451.19727, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "ST", "bbox": {"l": 200.63976, "t": 453.33997, "r": 205.82492, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "0.03", "bbox": {"l": 222.20833000000002, "t": 453.33997, "r": 229.76836, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "0.06", "bbox": {"l": 243.26666, "t": 453.33997, "r": 250.82669, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "0.12", "bbox": {"l": 264.29657, "t": 453.33997, "r": 271.84949, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "0.25", "bbox": {"l": 285.31943, "t": 453.33997, "r": 292.87946, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "0.5", "bbox": {"l": 306.37775, "t": 453.33997, "r": 311.77319, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "1", "bbox": {"l": 323.41699, "t": 453.33997, "r": 325.58157, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "2", "bbox": {"l": 334.45807, "t": 453.33997, "r": 336.62265, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "4", "bbox": {"l": 345.52756, "t": 453.33997, "r": 347.69214, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "8", "bbox": {"l": 356.56863, "t": 453.33997, "r": 358.73322, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "16", "bbox": {"l": 367.63812, "t": 453.33997, "r": 371.97089, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "32", "bbox": {"l": 382.6734, "t": 453.33997, "r": 387.00616, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "64", "bbox": {"l": 397.73727, "t": 453.33997, "r": 402.07001, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "\u2265", "bbox": {"l": 412.78879, "t": 447.99298, "r": 414.93463, "b": 457.79964999999993, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": " 128", "bbox": {"l": 414.95697, "t": 453.33997, "r": 422.51746, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "63", "bbox": {"l": 200.63998, "t": 463.92444, "r": 204.57674, "b": 466.66043, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "1", "bbox": {"l": 367.62604, "t": 463.92444, "r": 369.58032, "b": 466.66043, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "1", "bbox": {"l": 382.66132, "t": 463.92444, "r": 384.6156, "b": 466.66043, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "3", "bbox": {"l": 397.72504, "t": 463.92444, "r": 399.67932, "b": 466.66043, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "199", "bbox": {"l": 200.64, "t": 468.80313, "r": 206.51694, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "5", "bbox": {"l": 264.29047, "t": 468.80313, "r": 266.25885, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "1", "bbox": {"l": 306.37213, "t": 468.80313, "r": 308.34052, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "2", "bbox": {"l": 345.51526, "t": 468.80313, "r": 347.48364, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "4", "bbox": {"l": 356.55634, "t": 468.80313, "r": 358.52472, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "1", "bbox": {"l": 367.62582, "t": 468.80313, "r": 369.59418, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "1", "bbox": {"l": 382.66107, "t": 468.80313, "r": 384.62946, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "416", "bbox": {"l": 200.64, "t": 473.68185, "r": 206.51694, "b": 476.41788, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "4", "bbox": {"l": 264.29047, "t": 473.68185, "r": 266.25885, "b": 476.41788, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "230", "bbox": {"l": 200.64, "t": 478.53214, "r": 206.51694, "b": 481.26816, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "1", "bbox": {"l": 243.26373, "t": 478.53214, "r": 245.2321, "b": 481.26816, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "9", "bbox": {"l": 264.29047, "t": 478.53214, "r": 266.25885, "b": 481.26816, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "1", "bbox": {"l": 323.40466, "t": 478.53214, "r": 325.37305, "b": 481.26816, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "1", "bbox": {"l": 397.72519, "t": 478.53214, "r": 399.69354, "b": 481.26816, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "276", "bbox": {"l": 200.64, "t": 483.41086, "r": 206.51694, "b": 486.14688, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "2", "bbox": {"l": 382.66132, "t": 483.41086, "r": 384.61563, "b": 486.14688, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "12", "bbox": {"l": 397.72513, "t": 483.41086, "r": 401.64819, "b": 486.14688, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "1", "bbox": {"l": 412.78928, "t": 483.41086, "r": 414.74359, "b": 486.14688, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "320", "bbox": {"l": 200.64014, "t": 488.28958, "r": 207.14445, "b": 491.0256, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "1", "bbox": {"l": 367.62616, "t": 488.28958, "r": 369.78375, "b": 491.0256, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "4", "bbox": {"l": 382.66141, "t": 488.28958, "r": 384.81897, "b": 491.0256, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "20", "bbox": {"l": 397.7251, "t": 488.28958, "r": 402.05087, "b": 491.0256, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "2013", "bbox": {"l": 200.64032, "t": 493.1683, "r": 208.48566, "b": 495.90433, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "3", "bbox": {"l": 264.29044, "t": 493.1683, "r": 266.25879, "b": 495.90433, "coord_origin": "TOPLEFT"}}], "children": [{"id": 56, "label": "text", "bbox": {"l": 180.12473, "t": 516.2332200000001, "r": 190.62042, "b": 518.94992, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "<table>", "bbox": {"l": 180.12473, "t": 516.2332200000001, "r": 190.62042, "b": 518.94992, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 183.2438, "t": 520.13208, "r": 304.54797, "b": 522.84879, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "<tr><td></td><td colspan=\"4\"></td><td colspan=\"6\"></td><td colspan=\"3\"></td></tr>", "bbox": {"l": 183.2438, "t": 520.13208, "r": 304.54797, "b": 522.84879, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 183.2438, "t": 524.03094, "r": 388.42313, "b": 526.74765, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 524.03094, "r": 388.42313, "b": 526.74765, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 183.2438, "t": 527.9297799999999, "r": 388.42313, "b": 530.64648, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 527.9297799999999, "r": 388.42313, "b": 530.64648, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 183.2438, "t": 531.82861, "r": 388.42313, "b": 534.54532, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 531.82861, "r": 388.42313, "b": 534.54532, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 183.2438, "t": 535.72748, "r": 388.42313, "b": 538.44418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 535.72748, "r": 388.42313, "b": 538.44418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 183.2438, "t": 539.62631, "r": 388.42313, "b": 542.34303, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 539.62631, "r": 388.42313, "b": 542.34303, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 183.2438, "t": 543.52516, "r": 388.42313, "b": 546.24188, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 543.52516, "r": 388.42313, "b": 546.24188, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 183.2438, "t": 547.42401, "r": 388.42313, "b": 550.14073, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 547.42401, "r": 388.42313, "b": 550.14073, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 183.2438, "t": 551.32286, "r": 388.42313, "b": 554.03958, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 551.32286, "r": 388.42313, "b": 554.03958, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 180.12473, "t": 555.22173, "r": 191.86806, "b": 557.93845, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "</table>", "bbox": {"l": 180.12473, "t": 555.22173, "r": 191.86806, "b": 557.93845, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 407.38348, "t": 518.30042, "r": 408.82025, "b": 521.01712, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "C", "bbox": {"l": 407.38348, "t": 518.30042, "r": 408.82025, "b": 521.01712, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 410.25699, "t": 518.30042, "r": 450.48605, "b": 521.01712, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "C L L L C L L L L L C L L NL", "bbox": {"l": 410.25699, "t": 518.30042, "r": 450.48605, "b": 521.01712, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 407.38348, "t": 522.19925, "r": 408.82025, "b": 524.9159500000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "C", "bbox": {"l": 407.38348, "t": 522.19925, "r": 408.82025, "b": 524.9159500000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 410.25699, "t": 522.19925, "r": 450.48605, "b": 524.9159500000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 522.19925, "r": 450.48605, "b": 524.9159500000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 407.38348, "t": 526.09808, "r": 408.82025, "b": 528.81479, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "C", "bbox": {"l": 407.38348, "t": 526.09808, "r": 408.82025, "b": 528.81479, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 410.25699, "t": 526.09808, "r": 450.48605, "b": 528.81479, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 526.09808, "r": 450.48605, "b": 528.81479, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 407.38348, "t": 529.99695, "r": 408.82025, "b": 532.7136499999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "C", "bbox": {"l": 407.38348, "t": 529.99695, "r": 408.82025, "b": 532.7136499999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 410.25699, "t": 529.99695, "r": 450.48605, "b": 532.7136499999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 529.99695, "r": 450.48605, "b": 532.7136499999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 407.38348, "t": 533.8957800000001, "r": 408.82025, "b": 536.6125, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "C", "bbox": {"l": 407.38348, "t": 533.8957800000001, "r": 408.82025, "b": 536.6125, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 410.25699, "t": 533.8957800000001, "r": 450.48605, "b": 536.6125, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 533.8957800000001, "r": 450.48605, "b": 536.6125, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 407.38348, "t": 537.79463, "r": 408.82025, "b": 540.51135, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "C", "bbox": {"l": 407.38348, "t": 537.79463, "r": 408.82025, "b": 540.51135, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 410.25699, "t": 537.79463, "r": 450.48605, "b": 540.51135, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 537.79463, "r": 450.48605, "b": 540.51135, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 407.38348, "t": 541.69348, "r": 408.82025, "b": 544.4102, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "C", "bbox": {"l": 407.38348, "t": 541.69348, "r": 408.82025, "b": 544.4102, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 410.25699, "t": 541.69348, "r": 450.48605, "b": 544.4102, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 541.69348, "r": 450.48605, "b": 544.4102, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 407.38348, "t": 545.59233, "r": 408.82025, "b": 548.3090500000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "C", "bbox": {"l": 407.38348, "t": 545.59233, "r": 408.82025, "b": 548.3090500000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 410.25699, "t": 545.59233, "r": 450.48605, "b": 548.3090500000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 545.59233, "r": 450.48605, "b": 548.3090500000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 407.38348, "t": 549.4911999999999, "r": 408.82025, "b": 552.2079200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "C", "bbox": {"l": 407.38348, "t": 549.4911999999999, "r": 408.82025, "b": 552.2079200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 410.25699, "t": 549.4911999999999, "r": 450.48605, "b": 552.2079200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 549.4911999999999, "r": 450.48605, "b": 552.2079200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 164.52881, "t": 509.45859, "r": 181.8528, "b": 515.31, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "HTML", "bbox": {"l": 164.52881, "t": 509.45859, "r": 181.8528, "b": 515.31, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 183.58441, "t": 509.45859, "r": 186.3974, "b": 515.31, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "#", "bbox": {"l": 183.58441, "t": 509.45859, "r": 186.3974, "b": 515.31, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 189.2104, "t": 509.45859, "r": 208.90137, "b": 515.31, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "tokens:", "bbox": {"l": 189.2104, "t": 509.45859, "r": 208.90137, "b": 515.31, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 210.63269, "t": 509.45859, "r": 221.04044, "b": 515.31, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "258", "bbox": {"l": 210.63269, "t": 509.45859, "r": 221.04044, "b": 515.31, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 390.20203, "t": 509.60361, "r": 406.83609, "b": 515.45502, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "OTSL", "bbox": {"l": 390.20203, "t": 509.60361, "r": 406.83609, "b": 515.45502, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 408.56952, "t": 509.60361, "r": 411.38251, "b": 515.45502, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "#", "bbox": {"l": 408.56952, "t": 509.60361, "r": 411.38251, "b": 515.45502, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 414.1955, "t": 509.60361, "r": 433.88647000000003, "b": 515.45502, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "tokens:", "bbox": {"l": 414.1955, "t": 509.60361, "r": 433.88647000000003, "b": 515.45502, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 435.61737, "t": 509.60361, "r": 446.02512, "b": 515.45502, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": "135", "bbox": {"l": 435.61737, "t": 509.60361, "r": 446.02512, "b": 515.45502, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 167.19316, "t": 519.07236, "r": 172.8231, "b": 526.3866, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "B", "bbox": {"l": 167.19316, "t": 519.07236, "r": 172.8231, "b": 526.3866, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 187.33745, "t": 448.62485, "r": 192.96739, "b": 455.93909, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "A", "bbox": {"l": 187.33745, "t": 448.62485, "r": 192.96739, "b": 455.93909, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 167.38654, "t": 566.0051599999999, "r": 173.01648, "b": 573.3194, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": "D", "bbox": {"l": 167.38654, "t": 566.0051599999999, "r": 173.01648, "b": 573.3194, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 248.45621000000003, "t": 621.78008, "r": 253.65727, "b": 629.09431, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 107, "text": "E", "bbox": {"l": 248.45621000000003, "t": 621.78008, "r": 253.65727, "b": 629.09431, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 395.90057, "t": 519.19946, "r": 401.53052, "b": 526.5137, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 108, "text": "C", "bbox": {"l": 395.90057, "t": 519.19946, "r": 401.53052, "b": 526.5137, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 171.62886, "t": 580.28853, "r": 177.48148, "b": 597.26784, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 109, "text": "HTML", "bbox": {"l": 171.62886, "t": 580.28853, "r": 177.48148, "b": 597.26784, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 251.05969000000002, "t": 633.63408, "r": 256.91235, "b": 649.92345, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 110, "text": "OTSL", "bbox": {"l": 251.05969000000002, "t": 633.63408, "r": 256.91235, "b": 649.92345, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 372.14645, "t": 601.45724, "r": 427.0379, "b": 607.30864, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 111, "text": "HTML model shows", "bbox": {"l": 372.14645, "t": 601.45724, "r": 427.0379, "b": 607.30864, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 372.14645, "t": 607.89948, "r": 430.06838999999997, "b": 613.75087, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 112, "text": "bounding box drifting", "bbox": {"l": 372.14645, "t": 607.89948, "r": 430.06838999999997, "b": 613.75087, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 176.88042, "t": 642.87209, "r": 231.08191, "b": 648.72348, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 113, "text": "OTSL model shows", "bbox": {"l": 176.88042, "t": 642.87209, "r": 231.08191, "b": 648.72348, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 176.88042, "t": 649.3143, "r": 230.99271000000002, "b": 655.1657, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 114, "text": "clean bounding box", "bbox": {"l": 176.88042, "t": 649.3143, "r": 230.99271000000002, "b": 655.1657, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 176.88042, "t": 655.7565500000001, "r": 203.93219, "b": 661.60794, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 115, "text": "alignment", "bbox": {"l": 176.88042, "t": 655.7565500000001, "r": 203.93219, "b": 661.60794, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 215.93231000000003, "t": 557.56342, "r": 218.4697, "b": 569.15967, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 116, "text": "\u2264", "bbox": {"l": 215.93231000000003, "t": 557.56342, "r": 218.4697, "b": 569.15967, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 229.05689999999998, "t": 557.56342, "r": 231.71908999999997, "b": 569.15967, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 117, "text": "\u03bc", "bbox": {"l": 229.05689999999998, "t": 557.56342, "r": 231.71908999999997, "b": 569.15967, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 261.20892, "t": 448.46124, "r": 263.56973, "b": 451.19727, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 119, "text": "S", "bbox": {"l": 261.20892, "t": 448.46124, "r": 263.56973, "b": 451.19727, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 312.33463, "t": 448.46124, "r": 313.6362, "b": 451.19727, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 120, "text": "I", "bbox": {"l": 312.33463, "t": 448.46124, "r": 313.6362, "b": 451.19727, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 377.41125, "t": 448.46124, "r": 380.05737, "b": 451.19727, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 121, "text": "R", "bbox": {"l": 377.41125, "t": 448.46124, "r": 380.05737, "b": 451.19727, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 200.63976, "t": 453.33997, "r": 205.82492, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 122, "text": "ST", "bbox": {"l": 200.63976, "t": 453.33997, "r": 205.82492, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 222.20833000000002, "t": 453.33997, "r": 229.76836, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 123, "text": "0.03", "bbox": {"l": 222.20833000000002, "t": 453.33997, "r": 229.76836, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 243.26666, "t": 453.33997, "r": 250.82669, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 124, "text": "0.06", "bbox": {"l": 243.26666, "t": 453.33997, "r": 250.82669, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 264.29657, "t": 453.33997, "r": 271.84949, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 125, "text": "0.12", "bbox": {"l": 264.29657, "t": 453.33997, "r": 271.84949, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 114, "label": "text", "bbox": {"l": 285.31943, "t": 453.33997, "r": 292.87946, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 126, "text": "0.25", "bbox": {"l": 285.31943, "t": 453.33997, "r": 292.87946, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 115, "label": "text", "bbox": {"l": 306.37775, "t": 453.33997, "r": 311.77319, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 127, "text": "0.5", "bbox": {"l": 306.37775, "t": 453.33997, "r": 311.77319, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 116, "label": "text", "bbox": {"l": 323.41699, "t": 453.33997, "r": 325.58157, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 128, "text": "1", "bbox": {"l": 323.41699, "t": 453.33997, "r": 325.58157, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 117, "label": "text", "bbox": {"l": 334.45807, "t": 453.33997, "r": 336.62265, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 129, "text": "2", "bbox": {"l": 334.45807, "t": 453.33997, "r": 336.62265, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 118, "label": "text", "bbox": {"l": 345.52756, "t": 453.33997, "r": 347.69214, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 130, "text": "4", "bbox": {"l": 345.52756, "t": 453.33997, "r": 347.69214, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 119, "label": "text", "bbox": {"l": 356.56863, "t": 453.33997, "r": 358.73322, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 131, "text": "8", "bbox": {"l": 356.56863, "t": 453.33997, "r": 358.73322, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 120, "label": "text", "bbox": {"l": 367.63812, "t": 453.33997, "r": 371.97089, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 132, "text": "16", "bbox": {"l": 367.63812, "t": 453.33997, "r": 371.97089, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 121, "label": "text", "bbox": {"l": 382.6734, "t": 453.33997, "r": 387.00616, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 133, "text": "32", "bbox": {"l": 382.6734, "t": 453.33997, "r": 387.00616, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 122, "label": "text", "bbox": {"l": 397.73727, "t": 453.33997, "r": 402.07001, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 134, "text": "64", "bbox": {"l": 397.73727, "t": 453.33997, "r": 402.07001, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 123, "label": "text", "bbox": {"l": 412.78879, "t": 447.99298, "r": 414.93463, "b": 457.79964999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 135, "text": "\u2265", "bbox": {"l": 412.78879, "t": 447.99298, "r": 414.93463, "b": 457.79964999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 124, "label": "text", "bbox": {"l": 414.95697, "t": 453.33997, "r": 422.51746, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 136, "text": " 128", "bbox": {"l": 414.95697, "t": 453.33997, "r": 422.51746, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 125, "label": "text", "bbox": {"l": 200.63998, "t": 463.92444, "r": 204.57674, "b": 466.66043, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 137, "text": "63", "bbox": {"l": 200.63998, "t": 463.92444, "r": 204.57674, "b": 466.66043, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 126, "label": "text", "bbox": {"l": 367.62604, "t": 463.92444, "r": 369.58032, "b": 466.66043, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 138, "text": "1", "bbox": {"l": 367.62604, "t": 463.92444, "r": 369.58032, "b": 466.66043, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 127, "label": "text", "bbox": {"l": 382.66132, "t": 463.92444, "r": 384.6156, "b": 466.66043, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 139, "text": "1", "bbox": {"l": 382.66132, "t": 463.92444, "r": 384.6156, "b": 466.66043, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 128, "label": "text", "bbox": {"l": 397.72504, "t": 463.92444, "r": 399.67932, "b": 466.66043, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 140, "text": "3", "bbox": {"l": 397.72504, "t": 463.92444, "r": 399.67932, "b": 466.66043, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 129, "label": "text", "bbox": {"l": 200.64, "t": 468.80313, "r": 206.51694, "b": 471.53915, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 141, "text": "199", "bbox": {"l": 200.64, "t": 468.80313, "r": 206.51694, "b": 471.53915, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 130, "label": "text", "bbox": {"l": 264.29047, "t": 468.80313, "r": 266.25885, "b": 471.53915, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 142, "text": "5", "bbox": {"l": 264.29047, "t": 468.80313, "r": 266.25885, "b": 471.53915, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 131, "label": "text", "bbox": {"l": 306.37213, "t": 468.80313, "r": 308.34052, "b": 471.53915, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 143, "text": "1", "bbox": {"l": 306.37213, "t": 468.80313, "r": 308.34052, "b": 471.53915, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 132, "label": "text", "bbox": {"l": 345.51526, "t": 468.80313, "r": 347.48364, "b": 471.53915, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 144, "text": "2", "bbox": {"l": 345.51526, "t": 468.80313, "r": 347.48364, "b": 471.53915, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 133, "label": "text", "bbox": {"l": 356.55634, "t": 468.80313, "r": 358.52472, "b": 471.53915, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 145, "text": "4", "bbox": {"l": 356.55634, "t": 468.80313, "r": 358.52472, "b": 471.53915, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 134, "label": "text", "bbox": {"l": 367.62582, "t": 468.80313, "r": 369.59418, "b": 471.53915, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 146, "text": "1", "bbox": {"l": 367.62582, "t": 468.80313, "r": 369.59418, "b": 471.53915, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 135, "label": "text", "bbox": {"l": 382.66107, "t": 468.80313, "r": 384.62946, "b": 471.53915, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 147, "text": "1", "bbox": {"l": 382.66107, "t": 468.80313, "r": 384.62946, "b": 471.53915, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 136, "label": "text", "bbox": {"l": 200.64, "t": 473.68185, "r": 206.51694, "b": 476.41788, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 148, "text": "416", "bbox": {"l": 200.64, "t": 473.68185, "r": 206.51694, "b": 476.41788, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 137, "label": "text", "bbox": {"l": 264.29047, "t": 473.68185, "r": 266.25885, "b": 476.41788, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 149, "text": "4", "bbox": {"l": 264.29047, "t": 473.68185, "r": 266.25885, "b": 476.41788, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 138, "label": "text", "bbox": {"l": 200.64, "t": 478.53214, "r": 206.51694, "b": 481.26816, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 150, "text": "230", "bbox": {"l": 200.64, "t": 478.53214, "r": 206.51694, "b": 481.26816, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 139, "label": "text", "bbox": {"l": 243.26373, "t": 478.53214, "r": 245.2321, "b": 481.26816, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 151, "text": "1", "bbox": {"l": 243.26373, "t": 478.53214, "r": 245.2321, "b": 481.26816, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 140, "label": "text", "bbox": {"l": 264.29047, "t": 478.53214, "r": 266.25885, "b": 481.26816, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 152, "text": "9", "bbox": {"l": 264.29047, "t": 478.53214, "r": 266.25885, "b": 481.26816, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 141, "label": "text", "bbox": {"l": 323.40466, "t": 478.53214, "r": 325.37305, "b": 481.26816, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 153, "text": "1", "bbox": {"l": 323.40466, "t": 478.53214, "r": 325.37305, "b": 481.26816, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 142, "label": "text", "bbox": {"l": 397.72519, "t": 478.53214, "r": 399.69354, "b": 481.26816, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 154, "text": "1", "bbox": {"l": 397.72519, "t": 478.53214, "r": 399.69354, "b": 481.26816, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 143, "label": "text", "bbox": {"l": 200.64, "t": 483.41086, "r": 206.51694, "b": 486.14688, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 155, "text": "276", "bbox": {"l": 200.64, "t": 483.41086, "r": 206.51694, "b": 486.14688, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 144, "label": "text", "bbox": {"l": 382.66132, "t": 483.41086, "r": 384.61563, "b": 486.14688, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 156, "text": "2", "bbox": {"l": 382.66132, "t": 483.41086, "r": 384.61563, "b": 486.14688, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 145, "label": "text", "bbox": {"l": 397.72513, "t": 483.41086, "r": 401.64819, "b": 486.14688, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 157, "text": "12", "bbox": {"l": 397.72513, "t": 483.41086, "r": 401.64819, "b": 486.14688, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 146, "label": "text", "bbox": {"l": 412.78928, "t": 483.41086, "r": 414.74359, "b": 486.14688, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 158, "text": "1", "bbox": {"l": 412.78928, "t": 483.41086, "r": 414.74359, "b": 486.14688, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 147, "label": "text", "bbox": {"l": 200.64014, "t": 488.28958, "r": 207.14445, "b": 491.0256, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 159, "text": "320", "bbox": {"l": 200.64014, "t": 488.28958, "r": 207.14445, "b": 491.0256, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 148, "label": "text", "bbox": {"l": 367.62616, "t": 488.28958, "r": 369.78375, "b": 491.0256, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 160, "text": "1", "bbox": {"l": 367.62616, "t": 488.28958, "r": 369.78375, "b": 491.0256, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 149, "label": "text", "bbox": {"l": 382.66141, "t": 488.28958, "r": 384.81897, "b": 491.0256, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 161, "text": "4", "bbox": {"l": 382.66141, "t": 488.28958, "r": 384.81897, "b": 491.0256, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 150, "label": "text", "bbox": {"l": 397.7251, "t": 488.28958, "r": 402.05087, "b": 491.0256, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 162, "text": "20", "bbox": {"l": 397.7251, "t": 488.28958, "r": 402.05087, "b": 491.0256, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 151, "label": "text", "bbox": {"l": 200.64032, "t": 493.1683, "r": 208.48566, "b": 495.90433, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 163, "text": "2013", "bbox": {"l": 200.64032, "t": 493.1683, "r": 208.48566, "b": 495.90433, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 152, "label": "text", "bbox": {"l": 264.29044, "t": 493.1683, "r": 266.25879, "b": 495.90433, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 164, "text": "3", "bbox": {"l": 264.29044, "t": 493.1683, "r": 266.25879, "b": 495.90433, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "text", "id": 153, "page_no": 9, "cluster": {"id": 153, "label": "text", "bbox": {"l": 227.91466, "t": 665.82603, "r": 230.10028, "b": 675.3464, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 165, "text": "\u03bc", "bbox": {"l": 227.91466, "t": 665.82603, "r": 230.10028, "b": 675.3464, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u03bc"}, {"label": "text", "id": 154, "page_no": 9, "cluster": {"id": 154, "label": "text", "bbox": {"l": 300.58057, "t": 683.62195, "r": 302.72638, "b": 693.428658, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 166, "text": "\u2265", "bbox": {"l": 300.58057, "t": 683.62195, "r": 302.72638, "b": 693.428658, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u2265"}], "body": [{"label": "caption", "id": 4, "page_no": 9, "cluster": {"id": 4, "label": "caption", "bbox": {"l": 134.765, "t": 115.83618000000001, "r": 480.59357000000006, "b": 145.88666, "coord_origin": "TOPLEFT"}, "confidence": 0.9512290954589844, "cells": [{"id": 3, "text": "Table 2.", "bbox": {"l": 134.765, "t": 115.83618000000001, "r": 173.09366, "b": 123.76251000000002, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "TSR and cell detection results compared between OTSL and HTML on", "bbox": {"l": 181.30299, "t": 115.89899000000003, "r": 480.59151999999995, "b": 123.96868999999992, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "the PubTabNet [22], FinTabNet [21] and PubTables-1M [14] data sets using Table-", "bbox": {"l": 134.765, "t": 126.85797000000014, "r": 480.59357000000006, "b": 134.92767000000003, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Former [9] (with enc=6, dec=6, heads=8).", "bbox": {"l": 134.765, "t": 137.81696, "r": 305.95691, "b": 145.88666, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 2. TSR and cell detection results compared between OTSL and HTML on the PubTabNet [22], FinTabNet [21] and PubTables-1M [14] data sets using TableFormer [9] (with enc=6, dec=6, heads=8)."}, {"label": "table", "id": 0, "page_no": 9, "cluster": {"id": 0, "label": "table", "bbox": {"l": 143.6376495361328, "t": 156.3477020263672, "r": 470.8485412597656, "b": 263.2624816894531, "coord_origin": "TOPLEFT"}, "confidence": 0.9884640574455261, "cells": [{"id": 7, "text": "Data set", "bbox": {"l": 160.782, "t": 166.55895999999996, "r": 194.99779, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Language", "bbox": {"l": 215.52499000000003, "t": 166.534, "r": 254.04465, "b": 174.6037, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "TEDs", "bbox": {"l": 300.397, "t": 161.07898, "r": 323.99118, "b": 169.14868, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "mAP(0.75)", "bbox": {"l": 370.345, "t": 166.55895999999996, "r": 414.74661, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Inference", "bbox": {"l": 426.737, "t": 161.07898, "r": 463.10830999999996, "b": 169.14868, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "time (secs)", "bbox": {"l": 423.11401, "t": 172.03796, "r": 466.72656, "b": 180.10766999999998, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "simple", "bbox": {"l": 262.41299, "t": 174.03101000000004, "r": 288.0596, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "complex", "bbox": {"l": 296.42899, "t": 174.03101000000004, "r": 329.44687, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "all", "bbox": {"l": 345.03299, "t": 174.03101000000004, "r": 354.75793, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "PubTabNet", "bbox": {"l": 154.53799, "t": 192.85999000000004, "r": 201.24129, "b": 200.92969000000005, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "OTSL", "bbox": {"l": 222.43700000000004, "t": 187.38098000000002, "r": 247.13226000000003, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "0.965", "bbox": {"l": 264.74399, "t": 187.38098000000002, "r": 285.73074, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "0.934", "bbox": {"l": 302.444, "t": 187.38098000000002, "r": 323.43076, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "0.955", "bbox": {"l": 339.40302, "t": 187.38098000000002, "r": 360.38977, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "0.88", "bbox": {"l": 383.116, "t": 187.31817999999998, "r": 401.97324, "b": 195.24451, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "2.73", "bbox": {"l": 435.49300999999997, "t": 187.31817999999998, "r": 454.35025, "b": 195.24451, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "HTML", "bbox": {"l": 220.903, "t": 200.33196999999996, "r": 248.66655999999998, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "0.969", "bbox": {"l": 264.74399, "t": 200.33196999999996, "r": 285.73074, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "0.927", "bbox": {"l": 302.444, "t": 200.33196999999996, "r": 323.43076, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "0.955", "bbox": {"l": 339.40302, "t": 200.33196999999996, "r": 360.38977, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "0.857", "bbox": {"l": 382.052, "t": 200.33196999999996, "r": 403.03876, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "5.39", "bbox": {"l": 436.73199000000005, "t": 200.33196999999996, "r": 453.11182, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "FinTabNet", "bbox": {"l": 155.94501, "t": 219.16198999999995, "r": 199.83374, "b": 227.23168999999996, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "OTSL", "bbox": {"l": 222.43700000000004, "t": 213.68201, "r": 247.13226000000003, "b": 221.75171, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "0.955", "bbox": {"l": 264.74399, "t": 213.68201, "r": 285.73074, "b": 221.75171, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "0.961", "bbox": {"l": 302.444, "t": 213.68201, "r": 323.43076, "b": 221.75171, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "0.959", "bbox": {"l": 337.815, "t": 213.61919999999998, "r": 361.97586, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "0.862", "bbox": {"l": 380.46399, "t": 213.61919999999998, "r": 404.62485, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "1.85", "bbox": {"l": 435.49300999999997, "t": 213.61919999999998, "r": 454.35025, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "HTML", "bbox": {"l": 220.903, "t": 226.63396999999998, "r": 248.66655999999998, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "0.917", "bbox": {"l": 264.74399, "t": 226.63396999999998, "r": 285.73074, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "0.922", "bbox": {"l": 302.444, "t": 226.63396999999998, "r": 323.43076, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "0.92", "bbox": {"l": 341.70599, "t": 226.63396999999998, "r": 358.08582, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "0.722", "bbox": {"l": 382.052, "t": 226.63396999999998, "r": 403.03876, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "3.26", "bbox": {"l": 436.73199000000005, "t": 226.63396999999998, "r": 453.11182, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "PubTables-1M", "bbox": {"l": 148.62601, "t": 245.46294999999998, "r": 207.1524, "b": 253.53265, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "OTSL", "bbox": {"l": 222.43700000000004, "t": 239.98297000000002, "r": 247.13226000000003, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "0.987", "bbox": {"l": 264.74399, "t": 239.98297000000002, "r": 285.73074, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "0.964", "bbox": {"l": 302.444, "t": 239.98297000000002, "r": 323.43076, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "0.977", "bbox": {"l": 337.815, "t": 239.92016999999998, "r": 361.97586, "b": 247.8465, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "0.896", "bbox": {"l": 380.46399, "t": 239.92016999999998, "r": 404.62485, "b": 247.8465, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "1.79", "bbox": {"l": 435.49300999999997, "t": 239.92016999999998, "r": 454.35025, "b": 247.8465, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "HTML", "bbox": {"l": 220.903, "t": 252.93499999999995, "r": 248.66655999999998, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "0.983", "bbox": {"l": 264.74399, "t": 252.93499999999995, "r": 285.73074, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "0.944", "bbox": {"l": 302.444, "t": 252.93499999999995, "r": 323.43076, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "0.966", "bbox": {"l": 339.40302, "t": 252.93499999999995, "r": 360.38977, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "0.889", "bbox": {"l": 382.052, "t": 252.93499999999995, "r": 403.03876, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "3.26", "bbox": {"l": 436.73199000000005, "t": 252.93499999999995, "r": 453.11182, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": [{"id": 8, "label": "text", "bbox": {"l": 160.782, "t": 166.55895999999996, "r": 194.99779, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "Data set", "bbox": {"l": 160.782, "t": 166.55895999999996, "r": 194.99779, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 215.52499000000003, "t": 166.534, "r": 254.04465, "b": 174.6037, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "Language", "bbox": {"l": 215.52499000000003, "t": 166.534, "r": 254.04465, "b": 174.6037, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "text", "bbox": {"l": 300.397, "t": 161.07898, "r": 323.99118, "b": 169.14868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "TEDs", "bbox": {"l": 300.397, "t": 161.07898, "r": 323.99118, "b": 169.14868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 370.345, "t": 166.55895999999996, "r": 414.74661, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "mAP(0.75)", "bbox": {"l": 370.345, "t": 166.55895999999996, "r": 414.74661, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 426.737, "t": 161.07898, "r": 463.10830999999996, "b": 169.14868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "Inference", "bbox": {"l": 426.737, "t": 161.07898, "r": 463.10830999999996, "b": 169.14868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 423.11401, "t": 172.03796, "r": 466.72656, "b": 180.10766999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "time (secs)", "bbox": {"l": 423.11401, "t": 172.03796, "r": 466.72656, "b": 180.10766999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 262.41299, "t": 174.03101000000004, "r": 288.0596, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "simple", "bbox": {"l": 262.41299, "t": 174.03101000000004, "r": 288.0596, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 296.42899, "t": 174.03101000000004, "r": 329.44687, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "complex", "bbox": {"l": 296.42899, "t": 174.03101000000004, "r": 329.44687, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 345.03299, "t": 174.03101000000004, "r": 354.75793, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "all", "bbox": {"l": 345.03299, "t": 174.03101000000004, "r": 354.75793, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 154.53799, "t": 192.85999000000004, "r": 201.24129, "b": 200.92969000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "PubTabNet", "bbox": {"l": 154.53799, "t": 192.85999000000004, "r": 201.24129, "b": 200.92969000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 222.43700000000004, "t": 187.38098000000002, "r": 247.13226000000003, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "OTSL", "bbox": {"l": 222.43700000000004, "t": 187.38098000000002, "r": 247.13226000000003, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 264.74399, "t": 187.38098000000002, "r": 285.73074, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "0.965", "bbox": {"l": 264.74399, "t": 187.38098000000002, "r": 285.73074, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 302.444, "t": 187.38098000000002, "r": 323.43076, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "0.934", "bbox": {"l": 302.444, "t": 187.38098000000002, "r": 323.43076, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 339.40302, "t": 187.38098000000002, "r": 360.38977, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "0.955", "bbox": {"l": 339.40302, "t": 187.38098000000002, "r": 360.38977, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 383.116, "t": 187.31817999999998, "r": 401.97324, "b": 195.24451, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "0.88", "bbox": {"l": 383.116, "t": 187.31817999999998, "r": 401.97324, "b": 195.24451, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 435.49300999999997, "t": 187.31817999999998, "r": 454.35025, "b": 195.24451, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "2.73", "bbox": {"l": 435.49300999999997, "t": 187.31817999999998, "r": 454.35025, "b": 195.24451, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 220.903, "t": 200.33196999999996, "r": 248.66655999999998, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "HTML", "bbox": {"l": 220.903, "t": 200.33196999999996, "r": 248.66655999999998, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 264.74399, "t": 200.33196999999996, "r": 285.73074, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "0.969", "bbox": {"l": 264.74399, "t": 200.33196999999996, "r": 285.73074, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 302.444, "t": 200.33196999999996, "r": 323.43076, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "0.927", "bbox": {"l": 302.444, "t": 200.33196999999996, "r": 323.43076, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 339.40302, "t": 200.33196999999996, "r": 360.38977, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "0.955", "bbox": {"l": 339.40302, "t": 200.33196999999996, "r": 360.38977, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 382.052, "t": 200.33196999999996, "r": 403.03876, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "0.857", "bbox": {"l": 382.052, "t": 200.33196999999996, "r": 403.03876, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 436.73199000000005, "t": 200.33196999999996, "r": 453.11182, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "5.39", "bbox": {"l": 436.73199000000005, "t": 200.33196999999996, "r": 453.11182, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 155.94501, "t": 219.16198999999995, "r": 199.83374, "b": 227.23168999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "FinTabNet", "bbox": {"l": 155.94501, "t": 219.16198999999995, "r": 199.83374, "b": 227.23168999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 222.43700000000004, "t": 213.68201, "r": 247.13226000000003, "b": 221.75171, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "OTSL", "bbox": {"l": 222.43700000000004, "t": 213.68201, "r": 247.13226000000003, "b": 221.75171, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 264.74399, "t": 213.68201, "r": 285.73074, "b": 221.75171, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "0.955", "bbox": {"l": 264.74399, "t": 213.68201, "r": 285.73074, "b": 221.75171, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 302.444, "t": 213.68201, "r": 323.43076, "b": 221.75171, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "0.961", "bbox": {"l": 302.444, "t": 213.68201, "r": 323.43076, "b": 221.75171, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 337.815, "t": 213.61919999999998, "r": 361.97586, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "0.959", "bbox": {"l": 337.815, "t": 213.61919999999998, "r": 361.97586, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 380.46399, "t": 213.61919999999998, "r": 404.62485, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "0.862", "bbox": {"l": 380.46399, "t": 213.61919999999998, "r": 404.62485, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 435.49300999999997, "t": 213.61919999999998, "r": 454.35025, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "1.85", "bbox": {"l": 435.49300999999997, "t": 213.61919999999998, "r": 454.35025, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 220.903, "t": 226.63396999999998, "r": 248.66655999999998, "b": 234.70367, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "HTML", "bbox": {"l": 220.903, "t": 226.63396999999998, "r": 248.66655999999998, "b": 234.70367, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 264.74399, "t": 226.63396999999998, "r": 285.73074, "b": 234.70367, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "0.917", "bbox": {"l": 264.74399, "t": 226.63396999999998, "r": 285.73074, "b": 234.70367, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 302.444, "t": 226.63396999999998, "r": 323.43076, "b": 234.70367, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "0.922", "bbox": {"l": 302.444, "t": 226.63396999999998, "r": 323.43076, "b": 234.70367, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 341.70599, "t": 226.63396999999998, "r": 358.08582, "b": 234.70367, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "0.92", "bbox": {"l": 341.70599, "t": 226.63396999999998, "r": 358.08582, "b": 234.70367, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 382.052, "t": 226.63396999999998, "r": 403.03876, "b": 234.70367, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "0.722", "bbox": {"l": 382.052, "t": 226.63396999999998, "r": 403.03876, "b": 234.70367, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 436.73199000000005, "t": 226.63396999999998, "r": 453.11182, "b": 234.70367, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "3.26", "bbox": {"l": 436.73199000000005, "t": 226.63396999999998, "r": 453.11182, "b": 234.70367, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 148.62601, "t": 245.46294999999998, "r": 207.1524, "b": 253.53265, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "PubTables-1M", "bbox": {"l": 148.62601, "t": 245.46294999999998, "r": 207.1524, "b": 253.53265, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 222.43700000000004, "t": 239.98297000000002, "r": 247.13226000000003, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "OTSL", "bbox": {"l": 222.43700000000004, "t": 239.98297000000002, "r": 247.13226000000003, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 264.74399, "t": 239.98297000000002, "r": 285.73074, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "0.987", "bbox": {"l": 264.74399, "t": 239.98297000000002, "r": 285.73074, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 302.444, "t": 239.98297000000002, "r": 323.43076, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "0.964", "bbox": {"l": 302.444, "t": 239.98297000000002, "r": 323.43076, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 337.815, "t": 239.92016999999998, "r": 361.97586, "b": 247.8465, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "0.977", "bbox": {"l": 337.815, "t": 239.92016999999998, "r": 361.97586, "b": 247.8465, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 380.46399, "t": 239.92016999999998, "r": 404.62485, "b": 247.8465, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "0.896", "bbox": {"l": 380.46399, "t": 239.92016999999998, "r": 404.62485, "b": 247.8465, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 435.49300999999997, "t": 239.92016999999998, "r": 454.35025, "b": 247.8465, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "1.79", "bbox": {"l": 435.49300999999997, "t": 239.92016999999998, "r": 454.35025, "b": 247.8465, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 220.903, "t": 252.93499999999995, "r": 248.66655999999998, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "HTML", "bbox": {"l": 220.903, "t": 252.93499999999995, "r": 248.66655999999998, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 264.74399, "t": 252.93499999999995, "r": 285.73074, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "0.983", "bbox": {"l": 264.74399, "t": 252.93499999999995, "r": 285.73074, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 302.444, "t": 252.93499999999995, "r": 323.43076, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "0.944", "bbox": {"l": 302.444, "t": 252.93499999999995, "r": 323.43076, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 339.40302, "t": 252.93499999999995, "r": 360.38977, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "0.966", "bbox": {"l": 339.40302, "t": 252.93499999999995, "r": 360.38977, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 382.052, "t": 252.93499999999995, "r": 403.03876, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "0.889", "bbox": {"l": 382.052, "t": 252.93499999999995, "r": 403.03876, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 436.73199000000005, "t": 252.93499999999995, "r": 453.11182, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "3.26", "bbox": {"l": 436.73199000000005, "t": 252.93499999999995, "r": 453.11182, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "lcel", "lcel", "ched", "ched", "nl", "ched", "ucel", "ched", "ched", "ched", "ucel", "ucel", "nl", "rhed", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 8, "num_cols": 7, "table_cells": [{"bbox": {"l": 215.52499000000003, "t": 166.534, "r": 254.04465, "b": 174.6037, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Language", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 300.397, "t": 161.07898, "r": 323.99118, "b": 169.14868, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 3, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 5, "text": "TEDs", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 370.345, "t": 166.55895999999996, "r": 414.74661, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 2, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "mAP(0.75)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 423.11401, "t": 161.07898, "r": 466.72656, "b": 180.10766999999998, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 2, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "Inference time (secs)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 262.41299, "t": 174.03101000000004, "r": 288.0596, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "simple", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 296.42899, "t": 174.03101000000004, "r": 329.44687, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "complex", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 345.03299, "t": 174.03101000000004, "r": 354.75793, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "all", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 154.53799, "t": 192.85999000000004, "r": 201.24129, "b": 200.92969000000005, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PubTabNet", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 222.43700000000004, "t": 187.38098000000002, "r": 247.13226000000003, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "OTSL", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 264.74399, "t": 187.38098000000002, "r": 285.73074, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.965", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 302.444, "t": 187.38098000000002, "r": 323.43076, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.934", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 339.40302, "t": 187.38098000000002, "r": 360.38977, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.955", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 383.116, "t": 187.31817999999998, "r": 401.97324, "b": 195.24451, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 435.49300999999997, "t": 187.31817999999998, "r": 454.35025, "b": 195.24451, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "2.73", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 220.903, "t": 200.33196999999996, "r": 248.66655999999998, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "HTML", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 264.74399, "t": 200.33196999999996, "r": 285.73074, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.969", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 302.444, "t": 200.33196999999996, "r": 323.43076, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.927", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 339.40302, "t": 200.33196999999996, "r": 360.38977, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.955", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 382.052, "t": 200.33196999999996, "r": 403.03876, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.857", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 436.73199000000005, "t": 200.33196999999996, "r": 453.11182, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "5.39", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 155.94501, "t": 219.16198999999995, "r": 199.83374, "b": 227.23168999999996, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "FinTabNet", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 222.43700000000004, "t": 213.68201, "r": 247.13226000000003, "b": 221.75171, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "OTSL", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 264.74399, "t": 213.68201, "r": 285.73074, "b": 221.75171, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.955", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 302.444, "t": 213.68201, "r": 323.43076, "b": 221.75171, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.961", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 337.815, "t": 213.61919999999998, "r": 361.97586, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.959", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 380.46399, "t": 213.61919999999998, "r": 404.62485, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.862", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 435.49300999999997, "t": 213.61919999999998, "r": 454.35025, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "1.85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 220.903, "t": 226.63396999999998, "r": 248.66655999999998, "b": 234.70367, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "HTML", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 264.74399, "t": 226.63396999999998, "r": 285.73074, "b": 234.70367, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.917", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 302.444, "t": 226.63396999999998, "r": 323.43076, "b": 234.70367, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.922", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 341.70599, "t": 226.63396999999998, "r": 358.08582, "b": 234.70367, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.92", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 382.052, "t": 226.63396999999998, "r": 403.03876, "b": 234.70367, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.722", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 436.73199000000005, "t": 226.63396999999998, "r": 453.11182, "b": 234.70367, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "3.26", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 148.62601, "t": 245.46294999999998, "r": 207.1524, "b": 253.53265, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PubTables-1M", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 222.43700000000004, "t": 239.98297000000002, "r": 247.13226000000003, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "OTSL", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 264.74399, "t": 239.98297000000002, "r": 285.73074, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.987", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 302.444, "t": 239.98297000000002, "r": 323.43076, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.964", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 337.815, "t": 239.92016999999998, "r": 361.97586, "b": 247.8465, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.977", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 380.46399, "t": 239.92016999999998, "r": 404.62485, "b": 247.8465, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.896", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 435.49300999999997, "t": 239.92016999999998, "r": 454.35025, "b": 247.8465, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "1.79", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 220.903, "t": 252.93499999999995, "r": 248.66655999999998, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "HTML", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 264.74399, "t": 252.93499999999995, "r": 285.73074, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.983", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 302.444, "t": 252.93499999999995, "r": 323.43076, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.944", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 339.40302, "t": 252.93499999999995, "r": 360.38977, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.966", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 382.052, "t": 252.93499999999995, "r": 403.03876, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.889", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 436.73199000000005, "t": 252.93499999999995, "r": 453.11182, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "3.26", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "section_header", "id": 3, "page_no": 9, "cluster": {"id": 3, "label": "section_header", "bbox": {"l": 134.765, "t": 288.91479, "r": 257.08679, "b": 297.72173999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9546447992324829, "cells": [{"id": 55, "text": "5.3", "bbox": {"l": 134.765, "t": 288.91479, "r": 149.40205, "b": 297.72173999999995, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Qualitative Results", "bbox": {"l": 160.85904, "t": 288.91479, "r": 257.08679, "b": 297.72173999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5.3 Qualitative Results"}, {"label": "text", "id": 1, "page_no": 9, "cluster": {"id": 1, "label": "text", "bbox": {"l": 134.765, "t": 309.86078, "r": 480.58981, "b": 366.47769, "coord_origin": "TOPLEFT"}, "confidence": 0.9834085702896118, "cells": [{"id": 57, "text": "To illustrate the qualitative differences between OTSL and HTML, Figure 5", "bbox": {"l": 134.765, "t": 309.86078, "r": 480.58777, "b": 318.65775, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "demonstrates less overlap and more accurate bounding boxes with OTSL. In", "bbox": {"l": 134.765, "t": 321.81577, "r": 480.58889999999997, "b": 330.61273, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Figure 6, OTSL proves to be more effective in handling tables with longer to-", "bbox": {"l": 134.765, "t": 333.77075, "r": 480.58681999999993, "b": 342.56772, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "ken sequences, resulting in even more precise structure prediction and bounding", "bbox": {"l": 134.765, "t": 345.72574, "r": 480.58981, "b": 354.52271, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "boxes.", "bbox": {"l": 134.765, "t": 357.68073, "r": 161.65704, "b": 366.47769, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "To illustrate the qualitative differences between OTSL and HTML, Figure 5 demonstrates less overlap and more accurate bounding boxes with OTSL. In Figure 6, OTSL proves to be more effective in handling tables with longer token sequences, resulting in even more precise structure prediction and bounding boxes."}, {"label": "caption", "id": 5, "page_no": 9, "cluster": {"id": 5, "label": "caption", "bbox": {"l": 134.765, "t": 397.59012, "r": 480.59106, "b": 439.71716, "coord_origin": "TOPLEFT"}, "confidence": 0.9482728838920593, "cells": [{"id": 62, "text": "Fig. 5.", "bbox": {"l": 134.765, "t": 397.59012, "r": 162.64424, "b": 405.51642, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "The OTSL model produces more accurate bounding boxes with less over-", "bbox": {"l": 167.384, "t": 397.65289, "r": 480.59106, "b": 405.72266, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "lap (E) than the HTML model (D), when predicting the structure of a sparse ta-", "bbox": {"l": 134.765, "t": 408.61190999999997, "r": 480.59106, "b": 416.68167000000005, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "ble (A), at twice the inference speed because of shorter sequence length (B),(C).", "bbox": {"l": 134.765, "t": 419.57089, "r": 480.58838000000003, "b": 427.64066, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "\"PMC2807444_006_00.png\" PubTabNet.", "bbox": {"l": 134.765, "t": 430.52987999999993, "r": 304.69171, "b": 438.59964, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "\u03bc", "bbox": {"l": 342.63354, "t": 430.19678, "r": 344.81915, "b": 439.71716, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Fig. 5. The OTSL model produces more accurate bounding boxes with less overlap (E) than the HTML model (D), when predicting the structure of a sparse table (A), at twice the inference speed because of shorter sequence length (B),(C). \"PMC2807444_006_00.png\" PubTabNet. \u03bc"}, {"label": "picture", "id": 2, "page_no": 9, "cluster": {"id": 2, "label": "picture", "bbox": {"l": 162.67430114746094, "t": 444.62255859375, "r": 451.70062255859375, "b": 663.2135620117188, "coord_origin": "TOPLEFT"}, "confidence": 0.9742383360862732, "cells": [{"id": 67, "text": "<table>", "bbox": {"l": 180.12473, "t": 516.2332200000001, "r": 190.62042, "b": 518.94992, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "<tr><td></td><td colspan=\"4\"></td><td colspan=\"6\"></td><td colspan=\"3\"></td></tr>", "bbox": {"l": 183.2438, "t": 520.13208, "r": 304.54797, "b": 522.84879, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 524.03094, "r": 388.42313, "b": 526.74765, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 527.9297799999999, "r": 388.42313, "b": 530.64648, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 531.82861, "r": 388.42313, "b": 534.54532, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 535.72748, "r": 388.42313, "b": 538.44418, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 539.62631, "r": 388.42313, "b": 542.34303, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 543.52516, "r": 388.42313, "b": 546.24188, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 547.42401, "r": 388.42313, "b": 550.14073, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 551.32286, "r": 388.42313, "b": 554.03958, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "</table>", "bbox": {"l": 180.12473, "t": 555.22173, "r": 191.86806, "b": 557.93845, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "C", "bbox": {"l": 407.38348, "t": 518.30042, "r": 408.82025, "b": 521.01712, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "C L L L C L L L L L C L L NL", "bbox": {"l": 410.25699, "t": 518.30042, "r": 450.48605, "b": 521.01712, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "C", "bbox": {"l": 407.38348, "t": 522.19925, "r": 408.82025, "b": 524.9159500000001, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 522.19925, "r": 450.48605, "b": 524.9159500000001, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "C", "bbox": {"l": 407.38348, "t": 526.09808, "r": 408.82025, "b": 528.81479, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 526.09808, "r": 450.48605, "b": 528.81479, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "C", "bbox": {"l": 407.38348, "t": 529.99695, "r": 408.82025, "b": 532.7136499999999, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 529.99695, "r": 450.48605, "b": 532.7136499999999, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "C", "bbox": {"l": 407.38348, "t": 533.8957800000001, "r": 408.82025, "b": 536.6125, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 533.8957800000001, "r": 450.48605, "b": 536.6125, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "C", "bbox": {"l": 407.38348, "t": 537.79463, "r": 408.82025, "b": 540.51135, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 537.79463, "r": 450.48605, "b": 540.51135, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "C", "bbox": {"l": 407.38348, "t": 541.69348, "r": 408.82025, "b": 544.4102, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 541.69348, "r": 450.48605, "b": 544.4102, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "C", "bbox": {"l": 407.38348, "t": 545.59233, "r": 408.82025, "b": 548.3090500000001, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 545.59233, "r": 450.48605, "b": 548.3090500000001, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "C", "bbox": {"l": 407.38348, "t": 549.4911999999999, "r": 408.82025, "b": 552.2079200000001, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 549.4911999999999, "r": 450.48605, "b": 552.2079200000001, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "HTML", "bbox": {"l": 164.52881, "t": 509.45859, "r": 181.8528, "b": 515.31, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "#", "bbox": {"l": 183.58441, "t": 509.45859, "r": 186.3974, "b": 515.31, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "tokens:", "bbox": {"l": 189.2104, "t": 509.45859, "r": 208.90137, "b": 515.31, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "258", "bbox": {"l": 210.63269, "t": 509.45859, "r": 221.04044, "b": 515.31, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "OTSL", "bbox": {"l": 390.20203, "t": 509.60361, "r": 406.83609, "b": 515.45502, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "#", "bbox": {"l": 408.56952, "t": 509.60361, "r": 411.38251, "b": 515.45502, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "tokens:", "bbox": {"l": 414.1955, "t": 509.60361, "r": 433.88647000000003, "b": 515.45502, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "135", "bbox": {"l": 435.61737, "t": 509.60361, "r": 446.02512, "b": 515.45502, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "B", "bbox": {"l": 167.19316, "t": 519.07236, "r": 172.8231, "b": 526.3866, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "A", "bbox": {"l": 187.33745, "t": 448.62485, "r": 192.96739, "b": 455.93909, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "D", "bbox": {"l": 167.38654, "t": 566.0051599999999, "r": 173.01648, "b": 573.3194, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "E", "bbox": {"l": 248.45621000000003, "t": 621.78008, "r": 253.65727, "b": 629.09431, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "C", "bbox": {"l": 395.90057, "t": 519.19946, "r": 401.53052, "b": 526.5137, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "HTML", "bbox": {"l": 171.62886, "t": 580.28853, "r": 177.48148, "b": 597.26784, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "OTSL", "bbox": {"l": 251.05969000000002, "t": 633.63408, "r": 256.91235, "b": 649.92345, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "HTML model shows", "bbox": {"l": 372.14645, "t": 601.45724, "r": 427.0379, "b": 607.30864, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "bounding box drifting", "bbox": {"l": 372.14645, "t": 607.89948, "r": 430.06838999999997, "b": 613.75087, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "OTSL model shows", "bbox": {"l": 176.88042, "t": 642.87209, "r": 231.08191, "b": 648.72348, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "clean bounding box", "bbox": {"l": 176.88042, "t": 649.3143, "r": 230.99271000000002, "b": 655.1657, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "alignment", "bbox": {"l": 176.88042, "t": 655.7565500000001, "r": 203.93219, "b": 661.60794, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "\u2264", "bbox": {"l": 215.93231000000003, "t": 557.56342, "r": 218.4697, "b": 569.15967, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "\u03bc", "bbox": {"l": 229.05689999999998, "t": 557.56342, "r": 231.71908999999997, "b": 569.15967, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "S", "bbox": {"l": 261.20892, "t": 448.46124, "r": 263.56973, "b": 451.19727, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "I", "bbox": {"l": 312.33463, "t": 448.46124, "r": 313.6362, "b": 451.19727, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "R", "bbox": {"l": 377.41125, "t": 448.46124, "r": 380.05737, "b": 451.19727, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "ST", "bbox": {"l": 200.63976, "t": 453.33997, "r": 205.82492, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "0.03", "bbox": {"l": 222.20833000000002, "t": 453.33997, "r": 229.76836, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "0.06", "bbox": {"l": 243.26666, "t": 453.33997, "r": 250.82669, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "0.12", "bbox": {"l": 264.29657, "t": 453.33997, "r": 271.84949, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "0.25", "bbox": {"l": 285.31943, "t": 453.33997, "r": 292.87946, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "0.5", "bbox": {"l": 306.37775, "t": 453.33997, "r": 311.77319, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "1", "bbox": {"l": 323.41699, "t": 453.33997, "r": 325.58157, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "2", "bbox": {"l": 334.45807, "t": 453.33997, "r": 336.62265, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "4", "bbox": {"l": 345.52756, "t": 453.33997, "r": 347.69214, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "8", "bbox": {"l": 356.56863, "t": 453.33997, "r": 358.73322, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "16", "bbox": {"l": 367.63812, "t": 453.33997, "r": 371.97089, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "32", "bbox": {"l": 382.6734, "t": 453.33997, "r": 387.00616, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "64", "bbox": {"l": 397.73727, "t": 453.33997, "r": 402.07001, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "\u2265", "bbox": {"l": 412.78879, "t": 447.99298, "r": 414.93463, "b": 457.79964999999993, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": " 128", "bbox": {"l": 414.95697, "t": 453.33997, "r": 422.51746, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "63", "bbox": {"l": 200.63998, "t": 463.92444, "r": 204.57674, "b": 466.66043, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "1", "bbox": {"l": 367.62604, "t": 463.92444, "r": 369.58032, "b": 466.66043, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "1", "bbox": {"l": 382.66132, "t": 463.92444, "r": 384.6156, "b": 466.66043, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "3", "bbox": {"l": 397.72504, "t": 463.92444, "r": 399.67932, "b": 466.66043, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "199", "bbox": {"l": 200.64, "t": 468.80313, "r": 206.51694, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "5", "bbox": {"l": 264.29047, "t": 468.80313, "r": 266.25885, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "1", "bbox": {"l": 306.37213, "t": 468.80313, "r": 308.34052, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "2", "bbox": {"l": 345.51526, "t": 468.80313, "r": 347.48364, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "4", "bbox": {"l": 356.55634, "t": 468.80313, "r": 358.52472, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "1", "bbox": {"l": 367.62582, "t": 468.80313, "r": 369.59418, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "1", "bbox": {"l": 382.66107, "t": 468.80313, "r": 384.62946, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "416", "bbox": {"l": 200.64, "t": 473.68185, "r": 206.51694, "b": 476.41788, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "4", "bbox": {"l": 264.29047, "t": 473.68185, "r": 266.25885, "b": 476.41788, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "230", "bbox": {"l": 200.64, "t": 478.53214, "r": 206.51694, "b": 481.26816, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "1", "bbox": {"l": 243.26373, "t": 478.53214, "r": 245.2321, "b": 481.26816, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "9", "bbox": {"l": 264.29047, "t": 478.53214, "r": 266.25885, "b": 481.26816, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "1", "bbox": {"l": 323.40466, "t": 478.53214, "r": 325.37305, "b": 481.26816, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "1", "bbox": {"l": 397.72519, "t": 478.53214, "r": 399.69354, "b": 481.26816, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "276", "bbox": {"l": 200.64, "t": 483.41086, "r": 206.51694, "b": 486.14688, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "2", "bbox": {"l": 382.66132, "t": 483.41086, "r": 384.61563, "b": 486.14688, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "12", "bbox": {"l": 397.72513, "t": 483.41086, "r": 401.64819, "b": 486.14688, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "1", "bbox": {"l": 412.78928, "t": 483.41086, "r": 414.74359, "b": 486.14688, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "320", "bbox": {"l": 200.64014, "t": 488.28958, "r": 207.14445, "b": 491.0256, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "1", "bbox": {"l": 367.62616, "t": 488.28958, "r": 369.78375, "b": 491.0256, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "4", "bbox": {"l": 382.66141, "t": 488.28958, "r": 384.81897, "b": 491.0256, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "20", "bbox": {"l": 397.7251, "t": 488.28958, "r": 402.05087, "b": 491.0256, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "2013", "bbox": {"l": 200.64032, "t": 493.1683, "r": 208.48566, "b": 495.90433, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "3", "bbox": {"l": 264.29044, "t": 493.1683, "r": 266.25879, "b": 495.90433, "coord_origin": "TOPLEFT"}}], "children": [{"id": 56, "label": "text", "bbox": {"l": 180.12473, "t": 516.2332200000001, "r": 190.62042, "b": 518.94992, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "<table>", "bbox": {"l": 180.12473, "t": 516.2332200000001, "r": 190.62042, "b": 518.94992, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 183.2438, "t": 520.13208, "r": 304.54797, "b": 522.84879, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "<tr><td></td><td colspan=\"4\"></td><td colspan=\"6\"></td><td colspan=\"3\"></td></tr>", "bbox": {"l": 183.2438, "t": 520.13208, "r": 304.54797, "b": 522.84879, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 183.2438, "t": 524.03094, "r": 388.42313, "b": 526.74765, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 524.03094, "r": 388.42313, "b": 526.74765, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 183.2438, "t": 527.9297799999999, "r": 388.42313, "b": 530.64648, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 527.9297799999999, "r": 388.42313, "b": 530.64648, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 183.2438, "t": 531.82861, "r": 388.42313, "b": 534.54532, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 531.82861, "r": 388.42313, "b": 534.54532, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 183.2438, "t": 535.72748, "r": 388.42313, "b": 538.44418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 535.72748, "r": 388.42313, "b": 538.44418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 183.2438, "t": 539.62631, "r": 388.42313, "b": 542.34303, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 539.62631, "r": 388.42313, "b": 542.34303, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 183.2438, "t": 543.52516, "r": 388.42313, "b": 546.24188, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 543.52516, "r": 388.42313, "b": 546.24188, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 183.2438, "t": 547.42401, "r": 388.42313, "b": 550.14073, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 547.42401, "r": 388.42313, "b": 550.14073, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 183.2438, "t": 551.32286, "r": 388.42313, "b": 554.03958, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 551.32286, "r": 388.42313, "b": 554.03958, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 180.12473, "t": 555.22173, "r": 191.86806, "b": 557.93845, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "</table>", "bbox": {"l": 180.12473, "t": 555.22173, "r": 191.86806, "b": 557.93845, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 407.38348, "t": 518.30042, "r": 408.82025, "b": 521.01712, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "C", "bbox": {"l": 407.38348, "t": 518.30042, "r": 408.82025, "b": 521.01712, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 410.25699, "t": 518.30042, "r": 450.48605, "b": 521.01712, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "C L L L C L L L L L C L L NL", "bbox": {"l": 410.25699, "t": 518.30042, "r": 450.48605, "b": 521.01712, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 407.38348, "t": 522.19925, "r": 408.82025, "b": 524.9159500000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "C", "bbox": {"l": 407.38348, "t": 522.19925, "r": 408.82025, "b": 524.9159500000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 410.25699, "t": 522.19925, "r": 450.48605, "b": 524.9159500000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 522.19925, "r": 450.48605, "b": 524.9159500000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 407.38348, "t": 526.09808, "r": 408.82025, "b": 528.81479, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "C", "bbox": {"l": 407.38348, "t": 526.09808, "r": 408.82025, "b": 528.81479, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 410.25699, "t": 526.09808, "r": 450.48605, "b": 528.81479, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 526.09808, "r": 450.48605, "b": 528.81479, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 407.38348, "t": 529.99695, "r": 408.82025, "b": 532.7136499999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "C", "bbox": {"l": 407.38348, "t": 529.99695, "r": 408.82025, "b": 532.7136499999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 410.25699, "t": 529.99695, "r": 450.48605, "b": 532.7136499999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 529.99695, "r": 450.48605, "b": 532.7136499999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 407.38348, "t": 533.8957800000001, "r": 408.82025, "b": 536.6125, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "C", "bbox": {"l": 407.38348, "t": 533.8957800000001, "r": 408.82025, "b": 536.6125, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 410.25699, "t": 533.8957800000001, "r": 450.48605, "b": 536.6125, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 533.8957800000001, "r": 450.48605, "b": 536.6125, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 407.38348, "t": 537.79463, "r": 408.82025, "b": 540.51135, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "C", "bbox": {"l": 407.38348, "t": 537.79463, "r": 408.82025, "b": 540.51135, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 410.25699, "t": 537.79463, "r": 450.48605, "b": 540.51135, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 537.79463, "r": 450.48605, "b": 540.51135, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 407.38348, "t": 541.69348, "r": 408.82025, "b": 544.4102, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "C", "bbox": {"l": 407.38348, "t": 541.69348, "r": 408.82025, "b": 544.4102, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 410.25699, "t": 541.69348, "r": 450.48605, "b": 544.4102, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 541.69348, "r": 450.48605, "b": 544.4102, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 407.38348, "t": 545.59233, "r": 408.82025, "b": 548.3090500000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "C", "bbox": {"l": 407.38348, "t": 545.59233, "r": 408.82025, "b": 548.3090500000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 410.25699, "t": 545.59233, "r": 450.48605, "b": 548.3090500000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 545.59233, "r": 450.48605, "b": 548.3090500000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 407.38348, "t": 549.4911999999999, "r": 408.82025, "b": 552.2079200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "C", "bbox": {"l": 407.38348, "t": 549.4911999999999, "r": 408.82025, "b": 552.2079200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 410.25699, "t": 549.4911999999999, "r": 450.48605, "b": 552.2079200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 549.4911999999999, "r": 450.48605, "b": 552.2079200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 164.52881, "t": 509.45859, "r": 181.8528, "b": 515.31, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "HTML", "bbox": {"l": 164.52881, "t": 509.45859, "r": 181.8528, "b": 515.31, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 183.58441, "t": 509.45859, "r": 186.3974, "b": 515.31, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "#", "bbox": {"l": 183.58441, "t": 509.45859, "r": 186.3974, "b": 515.31, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 189.2104, "t": 509.45859, "r": 208.90137, "b": 515.31, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "tokens:", "bbox": {"l": 189.2104, "t": 509.45859, "r": 208.90137, "b": 515.31, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 210.63269, "t": 509.45859, "r": 221.04044, "b": 515.31, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "258", "bbox": {"l": 210.63269, "t": 509.45859, "r": 221.04044, "b": 515.31, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 390.20203, "t": 509.60361, "r": 406.83609, "b": 515.45502, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "OTSL", "bbox": {"l": 390.20203, "t": 509.60361, "r": 406.83609, "b": 515.45502, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 408.56952, "t": 509.60361, "r": 411.38251, "b": 515.45502, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "#", "bbox": {"l": 408.56952, "t": 509.60361, "r": 411.38251, "b": 515.45502, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 414.1955, "t": 509.60361, "r": 433.88647000000003, "b": 515.45502, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "tokens:", "bbox": {"l": 414.1955, "t": 509.60361, "r": 433.88647000000003, "b": 515.45502, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 435.61737, "t": 509.60361, "r": 446.02512, "b": 515.45502, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": "135", "bbox": {"l": 435.61737, "t": 509.60361, "r": 446.02512, "b": 515.45502, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 167.19316, "t": 519.07236, "r": 172.8231, "b": 526.3866, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "B", "bbox": {"l": 167.19316, "t": 519.07236, "r": 172.8231, "b": 526.3866, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 187.33745, "t": 448.62485, "r": 192.96739, "b": 455.93909, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "A", "bbox": {"l": 187.33745, "t": 448.62485, "r": 192.96739, "b": 455.93909, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 167.38654, "t": 566.0051599999999, "r": 173.01648, "b": 573.3194, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": "D", "bbox": {"l": 167.38654, "t": 566.0051599999999, "r": 173.01648, "b": 573.3194, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 248.45621000000003, "t": 621.78008, "r": 253.65727, "b": 629.09431, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 107, "text": "E", "bbox": {"l": 248.45621000000003, "t": 621.78008, "r": 253.65727, "b": 629.09431, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 395.90057, "t": 519.19946, "r": 401.53052, "b": 526.5137, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 108, "text": "C", "bbox": {"l": 395.90057, "t": 519.19946, "r": 401.53052, "b": 526.5137, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 171.62886, "t": 580.28853, "r": 177.48148, "b": 597.26784, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 109, "text": "HTML", "bbox": {"l": 171.62886, "t": 580.28853, "r": 177.48148, "b": 597.26784, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 251.05969000000002, "t": 633.63408, "r": 256.91235, "b": 649.92345, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 110, "text": "OTSL", "bbox": {"l": 251.05969000000002, "t": 633.63408, "r": 256.91235, "b": 649.92345, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 372.14645, "t": 601.45724, "r": 427.0379, "b": 607.30864, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 111, "text": "HTML model shows", "bbox": {"l": 372.14645, "t": 601.45724, "r": 427.0379, "b": 607.30864, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 372.14645, "t": 607.89948, "r": 430.06838999999997, "b": 613.75087, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 112, "text": "bounding box drifting", "bbox": {"l": 372.14645, "t": 607.89948, "r": 430.06838999999997, "b": 613.75087, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 176.88042, "t": 642.87209, "r": 231.08191, "b": 648.72348, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 113, "text": "OTSL model shows", "bbox": {"l": 176.88042, "t": 642.87209, "r": 231.08191, "b": 648.72348, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 176.88042, "t": 649.3143, "r": 230.99271000000002, "b": 655.1657, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 114, "text": "clean bounding box", "bbox": {"l": 176.88042, "t": 649.3143, "r": 230.99271000000002, "b": 655.1657, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 176.88042, "t": 655.7565500000001, "r": 203.93219, "b": 661.60794, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 115, "text": "alignment", "bbox": {"l": 176.88042, "t": 655.7565500000001, "r": 203.93219, "b": 661.60794, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 215.93231000000003, "t": 557.56342, "r": 218.4697, "b": 569.15967, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 116, "text": "\u2264", "bbox": {"l": 215.93231000000003, "t": 557.56342, "r": 218.4697, "b": 569.15967, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 229.05689999999998, "t": 557.56342, "r": 231.71908999999997, "b": 569.15967, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 117, "text": "\u03bc", "bbox": {"l": 229.05689999999998, "t": 557.56342, "r": 231.71908999999997, "b": 569.15967, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 261.20892, "t": 448.46124, "r": 263.56973, "b": 451.19727, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 119, "text": "S", "bbox": {"l": 261.20892, "t": 448.46124, "r": 263.56973, "b": 451.19727, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 312.33463, "t": 448.46124, "r": 313.6362, "b": 451.19727, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 120, "text": "I", "bbox": {"l": 312.33463, "t": 448.46124, "r": 313.6362, "b": 451.19727, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 377.41125, "t": 448.46124, "r": 380.05737, "b": 451.19727, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 121, "text": "R", "bbox": {"l": 377.41125, "t": 448.46124, "r": 380.05737, "b": 451.19727, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 200.63976, "t": 453.33997, "r": 205.82492, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 122, "text": "ST", "bbox": {"l": 200.63976, "t": 453.33997, "r": 205.82492, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 222.20833000000002, "t": 453.33997, "r": 229.76836, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 123, "text": "0.03", "bbox": {"l": 222.20833000000002, "t": 453.33997, "r": 229.76836, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 243.26666, "t": 453.33997, "r": 250.82669, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 124, "text": "0.06", "bbox": {"l": 243.26666, "t": 453.33997, "r": 250.82669, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 264.29657, "t": 453.33997, "r": 271.84949, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 125, "text": "0.12", "bbox": {"l": 264.29657, "t": 453.33997, "r": 271.84949, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 114, "label": "text", "bbox": {"l": 285.31943, "t": 453.33997, "r": 292.87946, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 126, "text": "0.25", "bbox": {"l": 285.31943, "t": 453.33997, "r": 292.87946, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 115, "label": "text", "bbox": {"l": 306.37775, "t": 453.33997, "r": 311.77319, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 127, "text": "0.5", "bbox": {"l": 306.37775, "t": 453.33997, "r": 311.77319, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 116, "label": "text", "bbox": {"l": 323.41699, "t": 453.33997, "r": 325.58157, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 128, "text": "1", "bbox": {"l": 323.41699, "t": 453.33997, "r": 325.58157, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 117, "label": "text", "bbox": {"l": 334.45807, "t": 453.33997, "r": 336.62265, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 129, "text": "2", "bbox": {"l": 334.45807, "t": 453.33997, "r": 336.62265, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 118, "label": "text", "bbox": {"l": 345.52756, "t": 453.33997, "r": 347.69214, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 130, "text": "4", "bbox": {"l": 345.52756, "t": 453.33997, "r": 347.69214, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 119, "label": "text", "bbox": {"l": 356.56863, "t": 453.33997, "r": 358.73322, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 131, "text": "8", "bbox": {"l": 356.56863, "t": 453.33997, "r": 358.73322, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 120, "label": "text", "bbox": {"l": 367.63812, "t": 453.33997, "r": 371.97089, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 132, "text": "16", "bbox": {"l": 367.63812, "t": 453.33997, "r": 371.97089, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 121, "label": "text", "bbox": {"l": 382.6734, "t": 453.33997, "r": 387.00616, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 133, "text": "32", "bbox": {"l": 382.6734, "t": 453.33997, "r": 387.00616, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 122, "label": "text", "bbox": {"l": 397.73727, "t": 453.33997, "r": 402.07001, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 134, "text": "64", "bbox": {"l": 397.73727, "t": 453.33997, "r": 402.07001, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 123, "label": "text", "bbox": {"l": 412.78879, "t": 447.99298, "r": 414.93463, "b": 457.79964999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 135, "text": "\u2265", "bbox": {"l": 412.78879, "t": 447.99298, "r": 414.93463, "b": 457.79964999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 124, "label": "text", "bbox": {"l": 414.95697, "t": 453.33997, "r": 422.51746, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 136, "text": " 128", "bbox": {"l": 414.95697, "t": 453.33997, "r": 422.51746, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 125, "label": "text", "bbox": {"l": 200.63998, "t": 463.92444, "r": 204.57674, "b": 466.66043, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 137, "text": "63", "bbox": {"l": 200.63998, "t": 463.92444, "r": 204.57674, "b": 466.66043, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 126, "label": "text", "bbox": {"l": 367.62604, "t": 463.92444, "r": 369.58032, "b": 466.66043, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 138, "text": "1", "bbox": {"l": 367.62604, "t": 463.92444, "r": 369.58032, "b": 466.66043, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 127, "label": "text", "bbox": {"l": 382.66132, "t": 463.92444, "r": 384.6156, "b": 466.66043, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 139, "text": "1", "bbox": {"l": 382.66132, "t": 463.92444, "r": 384.6156, "b": 466.66043, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 128, "label": "text", "bbox": {"l": 397.72504, "t": 463.92444, "r": 399.67932, "b": 466.66043, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 140, "text": "3", "bbox": {"l": 397.72504, "t": 463.92444, "r": 399.67932, "b": 466.66043, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 129, "label": "text", "bbox": {"l": 200.64, "t": 468.80313, "r": 206.51694, "b": 471.53915, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 141, "text": "199", "bbox": {"l": 200.64, "t": 468.80313, "r": 206.51694, "b": 471.53915, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 130, "label": "text", "bbox": {"l": 264.29047, "t": 468.80313, "r": 266.25885, "b": 471.53915, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 142, "text": "5", "bbox": {"l": 264.29047, "t": 468.80313, "r": 266.25885, "b": 471.53915, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 131, "label": "text", "bbox": {"l": 306.37213, "t": 468.80313, "r": 308.34052, "b": 471.53915, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 143, "text": "1", "bbox": {"l": 306.37213, "t": 468.80313, "r": 308.34052, "b": 471.53915, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 132, "label": "text", "bbox": {"l": 345.51526, "t": 468.80313, "r": 347.48364, "b": 471.53915, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 144, "text": "2", "bbox": {"l": 345.51526, "t": 468.80313, "r": 347.48364, "b": 471.53915, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 133, "label": "text", "bbox": {"l": 356.55634, "t": 468.80313, "r": 358.52472, "b": 471.53915, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 145, "text": "4", "bbox": {"l": 356.55634, "t": 468.80313, "r": 358.52472, "b": 471.53915, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 134, "label": "text", "bbox": {"l": 367.62582, "t": 468.80313, "r": 369.59418, "b": 471.53915, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 146, "text": "1", "bbox": {"l": 367.62582, "t": 468.80313, "r": 369.59418, "b": 471.53915, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 135, "label": "text", "bbox": {"l": 382.66107, "t": 468.80313, "r": 384.62946, "b": 471.53915, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 147, "text": "1", "bbox": {"l": 382.66107, "t": 468.80313, "r": 384.62946, "b": 471.53915, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 136, "label": "text", "bbox": {"l": 200.64, "t": 473.68185, "r": 206.51694, "b": 476.41788, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 148, "text": "416", "bbox": {"l": 200.64, "t": 473.68185, "r": 206.51694, "b": 476.41788, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 137, "label": "text", "bbox": {"l": 264.29047, "t": 473.68185, "r": 266.25885, "b": 476.41788, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 149, "text": "4", "bbox": {"l": 264.29047, "t": 473.68185, "r": 266.25885, "b": 476.41788, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 138, "label": "text", "bbox": {"l": 200.64, "t": 478.53214, "r": 206.51694, "b": 481.26816, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 150, "text": "230", "bbox": {"l": 200.64, "t": 478.53214, "r": 206.51694, "b": 481.26816, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 139, "label": "text", "bbox": {"l": 243.26373, "t": 478.53214, "r": 245.2321, "b": 481.26816, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 151, "text": "1", "bbox": {"l": 243.26373, "t": 478.53214, "r": 245.2321, "b": 481.26816, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 140, "label": "text", "bbox": {"l": 264.29047, "t": 478.53214, "r": 266.25885, "b": 481.26816, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 152, "text": "9", "bbox": {"l": 264.29047, "t": 478.53214, "r": 266.25885, "b": 481.26816, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 141, "label": "text", "bbox": {"l": 323.40466, "t": 478.53214, "r": 325.37305, "b": 481.26816, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 153, "text": "1", "bbox": {"l": 323.40466, "t": 478.53214, "r": 325.37305, "b": 481.26816, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 142, "label": "text", "bbox": {"l": 397.72519, "t": 478.53214, "r": 399.69354, "b": 481.26816, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 154, "text": "1", "bbox": {"l": 397.72519, "t": 478.53214, "r": 399.69354, "b": 481.26816, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 143, "label": "text", "bbox": {"l": 200.64, "t": 483.41086, "r": 206.51694, "b": 486.14688, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 155, "text": "276", "bbox": {"l": 200.64, "t": 483.41086, "r": 206.51694, "b": 486.14688, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 144, "label": "text", "bbox": {"l": 382.66132, "t": 483.41086, "r": 384.61563, "b": 486.14688, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 156, "text": "2", "bbox": {"l": 382.66132, "t": 483.41086, "r": 384.61563, "b": 486.14688, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 145, "label": "text", "bbox": {"l": 397.72513, "t": 483.41086, "r": 401.64819, "b": 486.14688, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 157, "text": "12", "bbox": {"l": 397.72513, "t": 483.41086, "r": 401.64819, "b": 486.14688, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 146, "label": "text", "bbox": {"l": 412.78928, "t": 483.41086, "r": 414.74359, "b": 486.14688, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 158, "text": "1", "bbox": {"l": 412.78928, "t": 483.41086, "r": 414.74359, "b": 486.14688, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 147, "label": "text", "bbox": {"l": 200.64014, "t": 488.28958, "r": 207.14445, "b": 491.0256, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 159, "text": "320", "bbox": {"l": 200.64014, "t": 488.28958, "r": 207.14445, "b": 491.0256, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 148, "label": "text", "bbox": {"l": 367.62616, "t": 488.28958, "r": 369.78375, "b": 491.0256, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 160, "text": "1", "bbox": {"l": 367.62616, "t": 488.28958, "r": 369.78375, "b": 491.0256, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 149, "label": "text", "bbox": {"l": 382.66141, "t": 488.28958, "r": 384.81897, "b": 491.0256, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 161, "text": "4", "bbox": {"l": 382.66141, "t": 488.28958, "r": 384.81897, "b": 491.0256, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 150, "label": "text", "bbox": {"l": 397.7251, "t": 488.28958, "r": 402.05087, "b": 491.0256, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 162, "text": "20", "bbox": {"l": 397.7251, "t": 488.28958, "r": 402.05087, "b": 491.0256, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 151, "label": "text", "bbox": {"l": 200.64032, "t": 493.1683, "r": 208.48566, "b": 495.90433, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 163, "text": "2013", "bbox": {"l": 200.64032, "t": 493.1683, "r": 208.48566, "b": 495.90433, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 152, "label": "text", "bbox": {"l": 264.29044, "t": 493.1683, "r": 266.25879, "b": 495.90433, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 164, "text": "3", "bbox": {"l": 264.29044, "t": 493.1683, "r": 266.25879, "b": 495.90433, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "text", "id": 153, "page_no": 9, "cluster": {"id": 153, "label": "text", "bbox": {"l": 227.91466, "t": 665.82603, "r": 230.10028, "b": 675.3464, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 165, "text": "\u03bc", "bbox": {"l": 227.91466, "t": 665.82603, "r": 230.10028, "b": 675.3464, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u03bc"}, {"label": "text", "id": 154, "page_no": 9, "cluster": {"id": 154, "label": "text", "bbox": {"l": 300.58057, "t": 683.62195, "r": 302.72638, "b": 693.428658, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 166, "text": "\u2265", "bbox": {"l": 300.58057, "t": 683.62195, "r": 302.72638, "b": 693.428658, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u2265"}], "headers": [{"label": "page_header", "id": 7, "page_no": 9, "cluster": {"id": 7, "label": "page_header", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 143.97887, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8309906721115112, "cells": [{"id": 0, "text": "10", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 143.97887, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "10"}, {"label": "page_header", "id": 6, "page_no": 9, "cluster": {"id": 6, "label": "page_header", "bbox": {"l": 167.82053, "t": 93.77099999999996, "r": 231.72049000000004, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8367075324058533, "cells": [{"id": 1, "text": "M.", "bbox": {"l": 167.82053, "t": 93.77099999999996, "r": 178.08249, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37929, "t": 93.77099999999996, "r": 231.72049000000004, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "M. Lysak, et al."}]}}, {"page_no": 10, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "11", "bbox": {"l": 471.37561, "t": 93.77099999999996, "r": 480.5894799999999, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Fig. 6.", "bbox": {"l": 134.765, "t": 125.79918999999984, "r": 162.64424, "b": 133.72551999999996, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Visualization of predicted structure and detected bounding boxes on a complex", "bbox": {"l": 165.215, "t": 125.86200000000008, "r": 480.58752, "b": 133.93169999999998, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "table with many rows. The OTSL model (B) captured repeating pattern of horizontally", "bbox": {"l": 134.765, "t": 136.82097999999996, "r": 480.58823, "b": 144.89068999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "merged cells from the GT (A), unlike the HTML model (C). The HTML model also", "bbox": {"l": 134.765, "t": 147.77997000000005, "r": 480.5881999999999, "b": 155.84966999999995, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "didn\u2019t complete the HTML sequence correctly and displayed a lot more of drift and", "bbox": {"l": 134.765, "t": 158.73895000000005, "r": 480.58838000000003, "b": 166.80864999999994, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "overlap of bounding boxes. \"PMC5406406_003_01.png\" PubTabNet.", "bbox": {"l": 134.765, "t": 169.69794000000002, "r": 415.84454, "b": 177.76764000000003, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "B", "bbox": {"l": 171.5049, "t": 312.45032, "r": 177.59613, "b": 320.36386, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "C", "bbox": {"l": 171.05823, "t": 492.65274, "r": 177.14946, "b": 500.56628, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Incorrect end of HTML sequence", "bbox": {"l": 283.047, "t": 627.48166, "r": 374.96332, "b": 633.4168099999999, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Horizontally merged cells are not present", "bbox": {"l": 283.047, "t": 617.35776, "r": 398.05978, "b": 623.29291, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Repeating pattern is well represented in predictions", "bbox": {"l": 293.64209, "t": 465.59784, "r": 437.50800000000004, "b": 471.53299, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Repeating pattern of", "bbox": {"l": 181.89114, "t": 288.35962000000006, "r": 239.23492, "b": 294.2947700000001, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "horizontally merged cells", "bbox": {"l": 181.89114, "t": 294.89423, "r": 251.52917, "b": 300.82938, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "A", "bbox": {"l": 247.83432, "t": 184.75989000000004, "r": 253.61339, "b": 194.81635000000006, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Bounding box drifting at the end", "bbox": {"l": 292.18976, "t": 607.80609, "r": 381.54663, "b": 613.7412400000001, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "OTSL", "bbox": {"l": 172.27777, "t": 381.36288, "r": 180.18666, "b": 403.40067, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "HTML", "bbox": {"l": 172.27747, "t": 555.7769499999999, "r": 180.18663, "b": 578.7478, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 0, "label": "page_header", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9301655888557434, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "page_header", "bbox": {"l": 471.37561, "t": 93.77099999999996, "r": 480.5894799999999, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9007201790809631, "cells": [{"id": 1, "text": "11", "bbox": {"l": 471.37561, "t": 93.77099999999996, "r": 480.5894799999999, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "caption", "bbox": {"l": 134.765, "t": 125.79918999999984, "r": 480.58838000000003, "b": 177.76764000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.8657060861587524, "cells": [{"id": 2, "text": "Fig. 6.", "bbox": {"l": 134.765, "t": 125.79918999999984, "r": 162.64424, "b": 133.72551999999996, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Visualization of predicted structure and detected bounding boxes on a complex", "bbox": {"l": 165.215, "t": 125.86200000000008, "r": 480.58752, "b": 133.93169999999998, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "table with many rows. The OTSL model (B) captured repeating pattern of horizontally", "bbox": {"l": 134.765, "t": 136.82097999999996, "r": 480.58823, "b": 144.89068999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "merged cells from the GT (A), unlike the HTML model (C). The HTML model also", "bbox": {"l": 134.765, "t": 147.77997000000005, "r": 480.5881999999999, "b": 155.84966999999995, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "didn\u2019t complete the HTML sequence correctly and displayed a lot more of drift and", "bbox": {"l": 134.765, "t": 158.73895000000005, "r": 480.58838000000003, "b": 166.80864999999994, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "overlap of bounding boxes. \"PMC5406406_003_01.png\" PubTabNet.", "bbox": {"l": 134.765, "t": 169.69794000000002, "r": 415.84454, "b": 177.76764000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "picture", "bbox": {"l": 168.39285278320312, "t": 181.9665069580078, "r": 447.35137939453125, "b": 634.0056762695312, "coord_origin": "TOPLEFT"}, "confidence": 0.7612658739089966, "cells": [{"id": 8, "text": "B", "bbox": {"l": 171.5049, "t": 312.45032, "r": 177.59613, "b": 320.36386, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "C", "bbox": {"l": 171.05823, "t": 492.65274, "r": 177.14946, "b": 500.56628, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Incorrect end of HTML sequence", "bbox": {"l": 283.047, "t": 627.48166, "r": 374.96332, "b": 633.4168099999999, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Horizontally merged cells are not present", "bbox": {"l": 283.047, "t": 617.35776, "r": 398.05978, "b": 623.29291, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Repeating pattern is well represented in predictions", "bbox": {"l": 293.64209, "t": 465.59784, "r": 437.50800000000004, "b": 471.53299, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Repeating pattern of", "bbox": {"l": 181.89114, "t": 288.35962000000006, "r": 239.23492, "b": 294.2947700000001, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "horizontally merged cells", "bbox": {"l": 181.89114, "t": 294.89423, "r": 251.52917, "b": 300.82938, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "A", "bbox": {"l": 247.83432, "t": 184.75989000000004, "r": 253.61339, "b": 194.81635000000006, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Bounding box drifting at the end", "bbox": {"l": 292.18976, "t": 607.80609, "r": 381.54663, "b": 613.7412400000001, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "OTSL", "bbox": {"l": 172.27777, "t": 381.36288, "r": 180.18666, "b": 403.40067, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "HTML", "bbox": {"l": 172.27747, "t": 555.7769499999999, "r": 180.18663, "b": 578.7478, "coord_origin": "TOPLEFT"}}], "children": [{"id": 3, "label": "text", "bbox": {"l": 171.5049, "t": 312.45032, "r": 177.59613, "b": 320.36386, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "B", "bbox": {"l": 171.5049, "t": 312.45032, "r": 177.59613, "b": 320.36386, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "text", "bbox": {"l": 171.05823, "t": 492.65274, "r": 177.14946, "b": 500.56628, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "C", "bbox": {"l": 171.05823, "t": 492.65274, "r": 177.14946, "b": 500.56628, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "text", "bbox": {"l": 283.047, "t": 627.48166, "r": 374.96332, "b": 633.4168099999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "Incorrect end of HTML sequence", "bbox": {"l": 283.047, "t": 627.48166, "r": 374.96332, "b": 633.4168099999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "text", "bbox": {"l": 283.047, "t": 617.35776, "r": 398.05978, "b": 623.29291, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "Horizontally merged cells are not present", "bbox": {"l": 283.047, "t": 617.35776, "r": 398.05978, "b": 623.29291, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "text", "bbox": {"l": 293.64209, "t": 465.59784, "r": 437.50800000000004, "b": 471.53299, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "Repeating pattern is well represented in predictions", "bbox": {"l": 293.64209, "t": 465.59784, "r": 437.50800000000004, "b": 471.53299, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "text", "bbox": {"l": 181.89114, "t": 288.35962000000006, "r": 239.23492, "b": 294.2947700000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "Repeating pattern of", "bbox": {"l": 181.89114, "t": 288.35962000000006, "r": 239.23492, "b": 294.2947700000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 181.89114, "t": 294.89423, "r": 251.52917, "b": 300.82938, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "horizontally merged cells", "bbox": {"l": 181.89114, "t": 294.89423, "r": 251.52917, "b": 300.82938, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "text", "bbox": {"l": 247.83432, "t": 184.75989000000004, "r": 253.61339, "b": 194.81635000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "A", "bbox": {"l": 247.83432, "t": 184.75989000000004, "r": 253.61339, "b": 194.81635000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 292.18976, "t": 607.80609, "r": 381.54663, "b": 613.7412400000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "Bounding box drifting at the end", "bbox": {"l": 292.18976, "t": 607.80609, "r": 381.54663, "b": 613.7412400000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 172.27777, "t": 381.36288, "r": 180.18666, "b": 403.40067, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "OTSL", "bbox": {"l": 172.27777, "t": 381.36288, "r": 180.18666, "b": 403.40067, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 172.27747, "t": 555.7769499999999, "r": 180.18663, "b": 578.7478, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "HTML", "bbox": {"l": 172.27747, "t": 555.7769499999999, "r": 180.18663, "b": 578.7478, "coord_origin": "TOPLEFT"}}], "children": []}]}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_header", "id": 0, "page_no": 10, "cluster": {"id": 0, "label": "page_header", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9301655888557434, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Optimized Table Tokenization for Table Structure Recognition"}, {"label": "page_header", "id": 1, "page_no": 10, "cluster": {"id": 1, "label": "page_header", "bbox": {"l": 471.37561, "t": 93.77099999999996, "r": 480.5894799999999, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9007201790809631, "cells": [{"id": 1, "text": "11", "bbox": {"l": 471.37561, "t": 93.77099999999996, "r": 480.5894799999999, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "11"}, {"label": "caption", "id": 2, "page_no": 10, "cluster": {"id": 2, "label": "caption", "bbox": {"l": 134.765, "t": 125.79918999999984, "r": 480.58838000000003, "b": 177.76764000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.8657060861587524, "cells": [{"id": 2, "text": "Fig. 6.", "bbox": {"l": 134.765, "t": 125.79918999999984, "r": 162.64424, "b": 133.72551999999996, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Visualization of predicted structure and detected bounding boxes on a complex", "bbox": {"l": 165.215, "t": 125.86200000000008, "r": 480.58752, "b": 133.93169999999998, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "table with many rows. The OTSL model (B) captured repeating pattern of horizontally", "bbox": {"l": 134.765, "t": 136.82097999999996, "r": 480.58823, "b": 144.89068999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "merged cells from the GT (A), unlike the HTML model (C). The HTML model also", "bbox": {"l": 134.765, "t": 147.77997000000005, "r": 480.5881999999999, "b": 155.84966999999995, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "didn\u2019t complete the HTML sequence correctly and displayed a lot more of drift and", "bbox": {"l": 134.765, "t": 158.73895000000005, "r": 480.58838000000003, "b": 166.80864999999994, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "overlap of bounding boxes. \"PMC5406406_003_01.png\" PubTabNet.", "bbox": {"l": 134.765, "t": 169.69794000000002, "r": 415.84454, "b": 177.76764000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Fig. 6. Visualization of predicted structure and detected bounding boxes on a complex table with many rows. The OTSL model (B) captured repeating pattern of horizontally merged cells from the GT (A), unlike the HTML model (C). The HTML model also didn't complete the HTML sequence correctly and displayed a lot more of drift and overlap of bounding boxes. \"PMC5406406_003_01.png\" PubTabNet."}, {"label": "picture", "id": 3, "page_no": 10, "cluster": {"id": 3, "label": "picture", "bbox": {"l": 168.39285278320312, "t": 181.9665069580078, "r": 447.35137939453125, "b": 634.0056762695312, "coord_origin": "TOPLEFT"}, "confidence": 0.7612658739089966, "cells": [{"id": 8, "text": "B", "bbox": {"l": 171.5049, "t": 312.45032, "r": 177.59613, "b": 320.36386, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "C", "bbox": {"l": 171.05823, "t": 492.65274, "r": 177.14946, "b": 500.56628, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Incorrect end of HTML sequence", "bbox": {"l": 283.047, "t": 627.48166, "r": 374.96332, "b": 633.4168099999999, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Horizontally merged cells are not present", "bbox": {"l": 283.047, "t": 617.35776, "r": 398.05978, "b": 623.29291, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Repeating pattern is well represented in predictions", "bbox": {"l": 293.64209, "t": 465.59784, "r": 437.50800000000004, "b": 471.53299, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Repeating pattern of", "bbox": {"l": 181.89114, "t": 288.35962000000006, "r": 239.23492, "b": 294.2947700000001, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "horizontally merged cells", "bbox": {"l": 181.89114, "t": 294.89423, "r": 251.52917, "b": 300.82938, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "A", "bbox": {"l": 247.83432, "t": 184.75989000000004, "r": 253.61339, "b": 194.81635000000006, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Bounding box drifting at the end", "bbox": {"l": 292.18976, "t": 607.80609, "r": 381.54663, "b": 613.7412400000001, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "OTSL", "bbox": {"l": 172.27777, "t": 381.36288, "r": 180.18666, "b": 403.40067, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "HTML", "bbox": {"l": 172.27747, "t": 555.7769499999999, "r": 180.18663, "b": 578.7478, "coord_origin": "TOPLEFT"}}], "children": [{"id": 3, "label": "text", "bbox": {"l": 171.5049, "t": 312.45032, "r": 177.59613, "b": 320.36386, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "B", "bbox": {"l": 171.5049, "t": 312.45032, "r": 177.59613, "b": 320.36386, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "text", "bbox": {"l": 171.05823, "t": 492.65274, "r": 177.14946, "b": 500.56628, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "C", "bbox": {"l": 171.05823, "t": 492.65274, "r": 177.14946, "b": 500.56628, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "text", "bbox": {"l": 283.047, "t": 627.48166, "r": 374.96332, "b": 633.4168099999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "Incorrect end of HTML sequence", "bbox": {"l": 283.047, "t": 627.48166, "r": 374.96332, "b": 633.4168099999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "text", "bbox": {"l": 283.047, "t": 617.35776, "r": 398.05978, "b": 623.29291, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "Horizontally merged cells are not present", "bbox": {"l": 283.047, "t": 617.35776, "r": 398.05978, "b": 623.29291, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "text", "bbox": {"l": 293.64209, "t": 465.59784, "r": 437.50800000000004, "b": 471.53299, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "Repeating pattern is well represented in predictions", "bbox": {"l": 293.64209, "t": 465.59784, "r": 437.50800000000004, "b": 471.53299, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "text", "bbox": {"l": 181.89114, "t": 288.35962000000006, "r": 239.23492, "b": 294.2947700000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "Repeating pattern of", "bbox": {"l": 181.89114, "t": 288.35962000000006, "r": 239.23492, "b": 294.2947700000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 181.89114, "t": 294.89423, "r": 251.52917, "b": 300.82938, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "horizontally merged cells", "bbox": {"l": 181.89114, "t": 294.89423, "r": 251.52917, "b": 300.82938, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "text", "bbox": {"l": 247.83432, "t": 184.75989000000004, "r": 253.61339, "b": 194.81635000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "A", "bbox": {"l": 247.83432, "t": 184.75989000000004, "r": 253.61339, "b": 194.81635000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 292.18976, "t": 607.80609, "r": 381.54663, "b": 613.7412400000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "Bounding box drifting at the end", "bbox": {"l": 292.18976, "t": 607.80609, "r": 381.54663, "b": 613.7412400000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 172.27777, "t": 381.36288, "r": 180.18666, "b": 403.40067, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "OTSL", "bbox": {"l": 172.27777, "t": 381.36288, "r": 180.18666, "b": 403.40067, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 172.27747, "t": 555.7769499999999, "r": 180.18663, "b": 578.7478, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "HTML", "bbox": {"l": 172.27747, "t": 555.7769499999999, "r": 180.18663, "b": 578.7478, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "body": [{"label": "caption", "id": 2, "page_no": 10, "cluster": {"id": 2, "label": "caption", "bbox": {"l": 134.765, "t": 125.79918999999984, "r": 480.58838000000003, "b": 177.76764000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.8657060861587524, "cells": [{"id": 2, "text": "Fig. 6.", "bbox": {"l": 134.765, "t": 125.79918999999984, "r": 162.64424, "b": 133.72551999999996, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Visualization of predicted structure and detected bounding boxes on a complex", "bbox": {"l": 165.215, "t": 125.86200000000008, "r": 480.58752, "b": 133.93169999999998, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "table with many rows. The OTSL model (B) captured repeating pattern of horizontally", "bbox": {"l": 134.765, "t": 136.82097999999996, "r": 480.58823, "b": 144.89068999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "merged cells from the GT (A), unlike the HTML model (C). The HTML model also", "bbox": {"l": 134.765, "t": 147.77997000000005, "r": 480.5881999999999, "b": 155.84966999999995, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "didn\u2019t complete the HTML sequence correctly and displayed a lot more of drift and", "bbox": {"l": 134.765, "t": 158.73895000000005, "r": 480.58838000000003, "b": 166.80864999999994, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "overlap of bounding boxes. \"PMC5406406_003_01.png\" PubTabNet.", "bbox": {"l": 134.765, "t": 169.69794000000002, "r": 415.84454, "b": 177.76764000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Fig. 6. Visualization of predicted structure and detected bounding boxes on a complex table with many rows. The OTSL model (B) captured repeating pattern of horizontally merged cells from the GT (A), unlike the HTML model (C). The HTML model also didn't complete the HTML sequence correctly and displayed a lot more of drift and overlap of bounding boxes. \"PMC5406406_003_01.png\" PubTabNet."}, {"label": "picture", "id": 3, "page_no": 10, "cluster": {"id": 3, "label": "picture", "bbox": {"l": 168.39285278320312, "t": 181.9665069580078, "r": 447.35137939453125, "b": 634.0056762695312, "coord_origin": "TOPLEFT"}, "confidence": 0.7612658739089966, "cells": [{"id": 8, "text": "B", "bbox": {"l": 171.5049, "t": 312.45032, "r": 177.59613, "b": 320.36386, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "C", "bbox": {"l": 171.05823, "t": 492.65274, "r": 177.14946, "b": 500.56628, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Incorrect end of HTML sequence", "bbox": {"l": 283.047, "t": 627.48166, "r": 374.96332, "b": 633.4168099999999, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Horizontally merged cells are not present", "bbox": {"l": 283.047, "t": 617.35776, "r": 398.05978, "b": 623.29291, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Repeating pattern is well represented in predictions", "bbox": {"l": 293.64209, "t": 465.59784, "r": 437.50800000000004, "b": 471.53299, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Repeating pattern of", "bbox": {"l": 181.89114, "t": 288.35962000000006, "r": 239.23492, "b": 294.2947700000001, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "horizontally merged cells", "bbox": {"l": 181.89114, "t": 294.89423, "r": 251.52917, "b": 300.82938, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "A", "bbox": {"l": 247.83432, "t": 184.75989000000004, "r": 253.61339, "b": 194.81635000000006, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Bounding box drifting at the end", "bbox": {"l": 292.18976, "t": 607.80609, "r": 381.54663, "b": 613.7412400000001, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "OTSL", "bbox": {"l": 172.27777, "t": 381.36288, "r": 180.18666, "b": 403.40067, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "HTML", "bbox": {"l": 172.27747, "t": 555.7769499999999, "r": 180.18663, "b": 578.7478, "coord_origin": "TOPLEFT"}}], "children": [{"id": 3, "label": "text", "bbox": {"l": 171.5049, "t": 312.45032, "r": 177.59613, "b": 320.36386, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "B", "bbox": {"l": 171.5049, "t": 312.45032, "r": 177.59613, "b": 320.36386, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "text", "bbox": {"l": 171.05823, "t": 492.65274, "r": 177.14946, "b": 500.56628, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "C", "bbox": {"l": 171.05823, "t": 492.65274, "r": 177.14946, "b": 500.56628, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "text", "bbox": {"l": 283.047, "t": 627.48166, "r": 374.96332, "b": 633.4168099999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "Incorrect end of HTML sequence", "bbox": {"l": 283.047, "t": 627.48166, "r": 374.96332, "b": 633.4168099999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "text", "bbox": {"l": 283.047, "t": 617.35776, "r": 398.05978, "b": 623.29291, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "Horizontally merged cells are not present", "bbox": {"l": 283.047, "t": 617.35776, "r": 398.05978, "b": 623.29291, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "text", "bbox": {"l": 293.64209, "t": 465.59784, "r": 437.50800000000004, "b": 471.53299, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "Repeating pattern is well represented in predictions", "bbox": {"l": 293.64209, "t": 465.59784, "r": 437.50800000000004, "b": 471.53299, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "text", "bbox": {"l": 181.89114, "t": 288.35962000000006, "r": 239.23492, "b": 294.2947700000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "Repeating pattern of", "bbox": {"l": 181.89114, "t": 288.35962000000006, "r": 239.23492, "b": 294.2947700000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 181.89114, "t": 294.89423, "r": 251.52917, "b": 300.82938, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "horizontally merged cells", "bbox": {"l": 181.89114, "t": 294.89423, "r": 251.52917, "b": 300.82938, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "text", "bbox": {"l": 247.83432, "t": 184.75989000000004, "r": 253.61339, "b": 194.81635000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "A", "bbox": {"l": 247.83432, "t": 184.75989000000004, "r": 253.61339, "b": 194.81635000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 292.18976, "t": 607.80609, "r": 381.54663, "b": 613.7412400000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "Bounding box drifting at the end", "bbox": {"l": 292.18976, "t": 607.80609, "r": 381.54663, "b": 613.7412400000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 172.27777, "t": 381.36288, "r": 180.18666, "b": 403.40067, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "OTSL", "bbox": {"l": 172.27777, "t": 381.36288, "r": 180.18666, "b": 403.40067, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 172.27747, "t": 555.7769499999999, "r": 180.18663, "b": 578.7478, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "HTML", "bbox": {"l": 172.27747, "t": 555.7769499999999, "r": 180.18663, "b": 578.7478, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "headers": [{"label": "page_header", "id": 0, "page_no": 10, "cluster": {"id": 0, "label": "page_header", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9301655888557434, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Optimized Table Tokenization for Table Structure Recognition"}, {"label": "page_header", "id": 1, "page_no": 10, "cluster": {"id": 1, "label": "page_header", "bbox": {"l": 471.37561, "t": 93.77099999999996, "r": 480.5894799999999, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9007201790809631, "cells": [{"id": 1, "text": "11", "bbox": {"l": 471.37561, "t": 93.77099999999996, "r": 480.5894799999999, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "11"}]}}, {"page_no": 11, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "12", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 143.97887, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "M.", "bbox": {"l": 167.82053, "t": 93.77099999999996, "r": 178.08249, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37929, "t": 93.77099999999996, "r": 231.72049000000004, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "6", "bbox": {"l": 134.765, "t": 117.54894999999988, "r": 141.4886, "b": 128.11737000000005, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Conclusion", "bbox": {"l": 154.9382, "t": 117.54894999999988, "r": 219.25478999999999, "b": 128.11737000000005, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "We demonstrated that representing tables in HTML for the task of table struc-", "bbox": {"l": 134.765, "t": 146.86377000000005, "r": 480.59476, "b": 155.66076999999996, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "ture recognition with Im2Seq models is ill-suited and has serious limitations.", "bbox": {"l": 134.765, "t": 158.81879000000004, "r": 480.59476, "b": 167.61577999999997, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Furthermore, we presented in this paper an Optimized Table Structure Language", "bbox": {"l": 134.765, "t": 170.77380000000005, "r": 480.58978, "b": 179.57079999999996, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "(OTSL) which, when compared to commonly used general purpose languages,", "bbox": {"l": 134.765, "t": 182.72979999999995, "r": 480.59569999999997, "b": 191.52679, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "has several key benefits.", "bbox": {"l": 134.765, "t": 194.68480999999997, "r": 239.5387, "b": 203.48181, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "First and foremost, given the same network configuration, inference time for", "bbox": {"l": 149.709, "t": 207.44379000000004, "r": 480.59283000000005, "b": 216.24077999999997, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "a table-structure prediction is about 2 times faster compared to the conventional", "bbox": {"l": 134.765, "t": 219.39880000000005, "r": 480.59365999999994, "b": 228.19579999999996, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "HTML approach. This is primarily owed to the shorter sequence length of the", "bbox": {"l": 134.765, "t": 231.35382000000004, "r": 480.59079, "b": 240.15081999999995, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "OTSL representation. Additional performance benefits can be obtained with", "bbox": {"l": 134.765, "t": 243.30884000000003, "r": 480.58786000000003, "b": 252.10582999999997, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "HPO (hyper parameter optimization). As we demonstrate in our experiments,", "bbox": {"l": 134.765, "t": 255.26482999999996, "r": 480.59479, "b": 264.06183, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "models trained on OTSL can be significantly smaller, e.g. by reducing the number", "bbox": {"l": 134.765, "t": 267.21984999999995, "r": 480.5878000000001, "b": 276.01685, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "of encoder and decoder layers, while preserving comparatively good prediction", "bbox": {"l": 134.765, "t": 279.17487000000006, "r": 480.59268, "b": 287.97183, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "quality. This can further improve inference performance, yielding 5-6 times faster", "bbox": {"l": 134.765, "t": 291.12985, "r": 480.58871, "b": 299.92682, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "inference speed in OTSL with prediction quality comparable to models trained", "bbox": {"l": 134.765, "t": 303.08484, "r": 480.59375, "b": 311.88181, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "on HTML (see Table 1).", "bbox": {"l": 134.765, "t": 315.03983, "r": 240.92351000000002, "b": 323.83679, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Secondly, OTSL has more inherent structure and a significantly restricted vo-", "bbox": {"l": 149.709, "t": 327.79883, "r": 480.58984, "b": 336.5957900000001, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "cabulary size. This allows autoregressive models to perform better in the TED", "bbox": {"l": 134.765, "t": 339.75482, "r": 480.59473, "b": 348.55179, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "metric, but especially with regards to prediction accuracy of the table-cell bound-", "bbox": {"l": 134.765, "t": 351.70981, "r": 480.58664, "b": 360.50677, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "ing boxes (see Table 2). As shown in Figure 5, we observe that the OTSL dras-", "bbox": {"l": 134.765, "t": 363.66479, "r": 480.59479, "b": 372.46176, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "tically reduces the drift for table cell bounding boxes at high row count and in", "bbox": {"l": 134.765, "t": 375.61978, "r": 480.58971999999994, "b": 384.41675, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "sparse tables. This leads to more accurate predictions and a significant reduction", "bbox": {"l": 134.765, "t": 387.57477, "r": 480.58673, "b": 396.37173, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "in post-processing complexity, which is an undesired necessity in HTML-based", "bbox": {"l": 134.765, "t": 399.53076, "r": 480.58574999999996, "b": 408.32773, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Im2Seq models. Significant novelty lies in OTSL syntactical rules, which are few,", "bbox": {"l": 134.765, "t": 411.48575, "r": 480.58675999999997, "b": 420.28271, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "simple and always backwards looking. Each new token can be validated only by", "bbox": {"l": 134.765, "t": 423.44073, "r": 480.59482, "b": 432.23769999999996, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "analyzing the sequence of previous tokens, without requiring the entire sequence", "bbox": {"l": 134.765, "t": 435.39572, "r": 480.58777, "b": 444.19269, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "to detect mistakes. This in return allows to perform structural error detection", "bbox": {"l": 134.765, "t": 447.35071, "r": 480.58968999999996, "b": 456.14767, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "and correction on-the-fly during sequence generation.", "bbox": {"l": 134.765, "t": 459.30569, "r": 366.77698, "b": 468.10266, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "References", "bbox": {"l": 134.765, "t": 493.82083, "r": 197.68642, "b": 504.38922, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "1.", "bbox": {"l": 139.371, "t": 522.87985, "r": 146.46127, "b": 530.94962, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Auer, C., Dolfi, M., Carvalho, A., Ramis, C.B., Staar, P.W.J.: Delivering doc-", "bbox": {"l": 151.01955, "t": 522.87985, "r": 480.5920100000001, "b": 530.94962, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "ument conversion as a cloud service with high throughput and responsiveness.", "bbox": {"l": 151.51801, "t": 533.83887, "r": 480.58667, "b": 541.90862, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "CoRR", "bbox": {"l": 151.51801, "t": 544.79785, "r": 176.34149, "b": 552.86761, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "abs/2206.00785", "bbox": {"l": 179.464, "t": 544.73509, "r": 250.67963, "b": 552.66139, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "(2022).", "bbox": {"l": 253.804, "t": 544.79785, "r": 281.9567, "b": 552.86761, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "https://doi.org/10.48550/arXiv.2206.00785", "bbox": {"l": 285.078, "t": 545.44344, "r": 478.03403000000003, "b": 552.91245, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": ",", "bbox": {"l": 478.0319799999999, "t": 544.79785, "r": 480.59099999999995, "b": 552.86761, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "https://doi.org/10.48550/arXiv.2206.00785", "bbox": {"l": 151.51797, "t": 556.4024400000001, "r": 344.474, "b": 563.87144, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "2.", "bbox": {"l": 139.37097, "t": 567.51884, "r": 145.94186, "b": 575.58861, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Chen, B., Peng, D., Zhang, J., Ren, Y., Jin, L.: Complex table structure recognition", "bbox": {"l": 150.16624, "t": 567.51884, "r": 480.58636, "b": 575.58861, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "in the wild using transformer and identity matrix-based augmentation. In: Porwal,", "bbox": {"l": 151.51797, "t": 578.47784, "r": 480.59012, "b": 586.5476100000001, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "U., Forn\u00e9s, A., Shafait, F. (eds.) Frontiers in Handwriting Recognition. pp. 545-", "bbox": {"l": 151.51797, "t": 589.43684, "r": 480.5920100000001, "b": 597.50661, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "561. Springer International Publishing, Cham (2022)", "bbox": {"l": 151.51797, "t": 600.39584, "r": 364.17856, "b": 608.46561, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "3.", "bbox": {"l": 139.37097, "t": 612.1588399999999, "r": 146.4379, "b": 620.22861, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Chi, Z., Huang, H., Xu, H.D., Yu, H., Yin, W., Mao, X.L.: Complicated table", "bbox": {"l": 150.98117, "t": 612.1588399999999, "r": 480.58731000000006, "b": 620.22861, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "structure recognition. arXiv preprint arXiv:1908.04729 (2019)", "bbox": {"l": 151.51797, "t": 623.11784, "r": 400.22525, "b": 631.18761, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "4.", "bbox": {"l": 139.37097, "t": 634.88084, "r": 146.52443, "b": 642.95061, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Deng, Y., Rosenberg, D., Mann, G.: Challenges in end-to-end neural scientific", "bbox": {"l": 151.12335, "t": 634.88084, "r": 480.58826, "b": 642.95061, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "table recognition. In: 2019 International Conference on Document Analysis and", "bbox": {"l": 151.51797, "t": 645.83984, "r": 480.58752, "b": 653.9096099999999, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Recognition (ICDAR). pp. 894-901. IEEE (2019)", "bbox": {"l": 151.51797, "t": 656.79785, "r": 350.11115, "b": 664.86761, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 10, "label": "page_header", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 143.97887, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8610832691192627, "cells": [{"id": 0, "text": "12", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 143.97887, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "page_header", "bbox": {"l": 167.82053, "t": 93.77099999999996, "r": 231.72049000000004, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8927664756774902, "cells": [{"id": 1, "text": "M.", "bbox": {"l": 167.82053, "t": 93.77099999999996, "r": 178.08249, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37929, "t": 93.77099999999996, "r": 231.72049000000004, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "section_header", "bbox": {"l": 134.765, "t": 117.54894999999988, "r": 219.25478999999999, "b": 128.11737000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.915635347366333, "cells": [{"id": 3, "text": "6", "bbox": {"l": 134.765, "t": 117.54894999999988, "r": 141.4886, "b": 128.11737000000005, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Conclusion", "bbox": {"l": 154.9382, "t": 117.54894999999988, "r": 219.25478999999999, "b": 128.11737000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 134.765, "t": 146.86377000000005, "r": 480.59569999999997, "b": 203.48181, "coord_origin": "TOPLEFT"}, "confidence": 0.9806171655654907, "cells": [{"id": 5, "text": "We demonstrated that representing tables in HTML for the task of table struc-", "bbox": {"l": 134.765, "t": 146.86377000000005, "r": 480.59476, "b": 155.66076999999996, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "ture recognition with Im2Seq models is ill-suited and has serious limitations.", "bbox": {"l": 134.765, "t": 158.81879000000004, "r": 480.59476, "b": 167.61577999999997, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Furthermore, we presented in this paper an Optimized Table Structure Language", "bbox": {"l": 134.765, "t": 170.77380000000005, "r": 480.58978, "b": 179.57079999999996, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "(OTSL) which, when compared to commonly used general purpose languages,", "bbox": {"l": 134.765, "t": 182.72979999999995, "r": 480.59569999999997, "b": 191.52679, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "has several key benefits.", "bbox": {"l": 134.765, "t": 194.68480999999997, "r": 239.5387, "b": 203.48181, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 134.765, "t": 207.44379000000004, "r": 480.59479, "b": 323.83679, "coord_origin": "TOPLEFT"}, "confidence": 0.9873476028442383, "cells": [{"id": 10, "text": "First and foremost, given the same network configuration, inference time for", "bbox": {"l": 149.709, "t": 207.44379000000004, "r": 480.59283000000005, "b": 216.24077999999997, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "a table-structure prediction is about 2 times faster compared to the conventional", "bbox": {"l": 134.765, "t": 219.39880000000005, "r": 480.59365999999994, "b": 228.19579999999996, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "HTML approach. This is primarily owed to the shorter sequence length of the", "bbox": {"l": 134.765, "t": 231.35382000000004, "r": 480.59079, "b": 240.15081999999995, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "OTSL representation. Additional performance benefits can be obtained with", "bbox": {"l": 134.765, "t": 243.30884000000003, "r": 480.58786000000003, "b": 252.10582999999997, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "HPO (hyper parameter optimization). As we demonstrate in our experiments,", "bbox": {"l": 134.765, "t": 255.26482999999996, "r": 480.59479, "b": 264.06183, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "models trained on OTSL can be significantly smaller, e.g. by reducing the number", "bbox": {"l": 134.765, "t": 267.21984999999995, "r": 480.5878000000001, "b": 276.01685, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "of encoder and decoder layers, while preserving comparatively good prediction", "bbox": {"l": 134.765, "t": 279.17487000000006, "r": 480.59268, "b": 287.97183, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "quality. This can further improve inference performance, yielding 5-6 times faster", "bbox": {"l": 134.765, "t": 291.12985, "r": 480.58871, "b": 299.92682, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "inference speed in OTSL with prediction quality comparable to models trained", "bbox": {"l": 134.765, "t": 303.08484, "r": 480.59375, "b": 311.88181, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "on HTML (see Table 1).", "bbox": {"l": 134.765, "t": 315.03983, "r": 240.92351000000002, "b": 323.83679, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 134.765, "t": 327.79883, "r": 480.59482, "b": 468.10266, "coord_origin": "TOPLEFT"}, "confidence": 0.9868747591972351, "cells": [{"id": 20, "text": "Secondly, OTSL has more inherent structure and a significantly restricted vo-", "bbox": {"l": 149.709, "t": 327.79883, "r": 480.58984, "b": 336.5957900000001, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "cabulary size. This allows autoregressive models to perform better in the TED", "bbox": {"l": 134.765, "t": 339.75482, "r": 480.59473, "b": 348.55179, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "metric, but especially with regards to prediction accuracy of the table-cell bound-", "bbox": {"l": 134.765, "t": 351.70981, "r": 480.58664, "b": 360.50677, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "ing boxes (see Table 2). As shown in Figure 5, we observe that the OTSL dras-", "bbox": {"l": 134.765, "t": 363.66479, "r": 480.59479, "b": 372.46176, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "tically reduces the drift for table cell bounding boxes at high row count and in", "bbox": {"l": 134.765, "t": 375.61978, "r": 480.58971999999994, "b": 384.41675, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "sparse tables. This leads to more accurate predictions and a significant reduction", "bbox": {"l": 134.765, "t": 387.57477, "r": 480.58673, "b": 396.37173, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "in post-processing complexity, which is an undesired necessity in HTML-based", "bbox": {"l": 134.765, "t": 399.53076, "r": 480.58574999999996, "b": 408.32773, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Im2Seq models. Significant novelty lies in OTSL syntactical rules, which are few,", "bbox": {"l": 134.765, "t": 411.48575, "r": 480.58675999999997, "b": 420.28271, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "simple and always backwards looking. Each new token can be validated only by", "bbox": {"l": 134.765, "t": 423.44073, "r": 480.59482, "b": 432.23769999999996, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "analyzing the sequence of previous tokens, without requiring the entire sequence", "bbox": {"l": 134.765, "t": 435.39572, "r": 480.58777, "b": 444.19269, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "to detect mistakes. This in return allows to perform structural error detection", "bbox": {"l": 134.765, "t": 447.35071, "r": 480.58968999999996, "b": 456.14767, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "and correction on-the-fly during sequence generation.", "bbox": {"l": 134.765, "t": 459.30569, "r": 366.77698, "b": 468.10266, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "section_header", "bbox": {"l": 134.765, "t": 493.82083, "r": 197.68642, "b": 504.38922, "coord_origin": "TOPLEFT"}, "confidence": 0.9403266310691833, "cells": [{"id": 32, "text": "References", "bbox": {"l": 134.765, "t": 493.82083, "r": 197.68642, "b": 504.38922, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "list_item", "bbox": {"l": 139.371, "t": 522.87985, "r": 480.5920100000001, "b": 563.87144, "coord_origin": "TOPLEFT"}, "confidence": 0.9698606729507446, "cells": [{"id": 33, "text": "1.", "bbox": {"l": 139.371, "t": 522.87985, "r": 146.46127, "b": 530.94962, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Auer, C., Dolfi, M., Carvalho, A., Ramis, C.B., Staar, P.W.J.: Delivering doc-", "bbox": {"l": 151.01955, "t": 522.87985, "r": 480.5920100000001, "b": 530.94962, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "ument conversion as a cloud service with high throughput and responsiveness.", "bbox": {"l": 151.51801, "t": 533.83887, "r": 480.58667, "b": 541.90862, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "CoRR", "bbox": {"l": 151.51801, "t": 544.79785, "r": 176.34149, "b": 552.86761, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "abs/2206.00785", "bbox": {"l": 179.464, "t": 544.73509, "r": 250.67963, "b": 552.66139, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "(2022).", "bbox": {"l": 253.804, "t": 544.79785, "r": 281.9567, "b": 552.86761, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "https://doi.org/10.48550/arXiv.2206.00785", "bbox": {"l": 285.078, "t": 545.44344, "r": 478.03403000000003, "b": 552.91245, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": ",", "bbox": {"l": 478.0319799999999, "t": 544.79785, "r": 480.59099999999995, "b": 552.86761, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "https://doi.org/10.48550/arXiv.2206.00785", "bbox": {"l": 151.51797, "t": 556.4024400000001, "r": 344.474, "b": 563.87144, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "list_item", "bbox": {"l": 139.37097, "t": 567.51884, "r": 480.5920100000001, "b": 608.46561, "coord_origin": "TOPLEFT"}, "confidence": 0.9730570316314697, "cells": [{"id": 42, "text": "2.", "bbox": {"l": 139.37097, "t": 567.51884, "r": 145.94186, "b": 575.58861, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Chen, B., Peng, D., Zhang, J., Ren, Y., Jin, L.: Complex table structure recognition", "bbox": {"l": 150.16624, "t": 567.51884, "r": 480.58636, "b": 575.58861, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "in the wild using transformer and identity matrix-based augmentation. In: Porwal,", "bbox": {"l": 151.51797, "t": 578.47784, "r": 480.59012, "b": 586.5476100000001, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "U., Forn\u00e9s, A., Shafait, F. (eds.) Frontiers in Handwriting Recognition. pp. 545-", "bbox": {"l": 151.51797, "t": 589.43684, "r": 480.5920100000001, "b": 597.50661, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "561. Springer International Publishing, Cham (2022)", "bbox": {"l": 151.51797, "t": 600.39584, "r": 364.17856, "b": 608.46561, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "list_item", "bbox": {"l": 139.37097, "t": 612.1588399999999, "r": 480.58731000000006, "b": 631.18761, "coord_origin": "TOPLEFT"}, "confidence": 0.9617196321487427, "cells": [{"id": 47, "text": "3.", "bbox": {"l": 139.37097, "t": 612.1588399999999, "r": 146.4379, "b": 620.22861, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Chi, Z., Huang, H., Xu, H.D., Yu, H., Yin, W., Mao, X.L.: Complicated table", "bbox": {"l": 150.98117, "t": 612.1588399999999, "r": 480.58731000000006, "b": 620.22861, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "structure recognition. arXiv preprint arXiv:1908.04729 (2019)", "bbox": {"l": 151.51797, "t": 623.11784, "r": 400.22525, "b": 631.18761, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "list_item", "bbox": {"l": 139.37097, "t": 634.88084, "r": 480.58826, "b": 664.86761, "coord_origin": "TOPLEFT"}, "confidence": 0.9754673838615417, "cells": [{"id": 50, "text": "4.", "bbox": {"l": 139.37097, "t": 634.88084, "r": 146.52443, "b": 642.95061, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Deng, Y., Rosenberg, D., Mann, G.: Challenges in end-to-end neural scientific", "bbox": {"l": 151.12335, "t": 634.88084, "r": 480.58826, "b": 642.95061, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "table recognition. In: 2019 International Conference on Document Analysis and", "bbox": {"l": 151.51797, "t": 645.83984, "r": 480.58752, "b": 653.9096099999999, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Recognition (ICDAR). pp. 894-901. IEEE (2019)", "bbox": {"l": 151.51797, "t": 656.79785, "r": 350.11115, "b": 664.86761, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_header", "id": 10, "page_no": 11, "cluster": {"id": 10, "label": "page_header", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 143.97887, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8610832691192627, "cells": [{"id": 0, "text": "12", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 143.97887, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "12"}, {"label": "page_header", "id": 9, "page_no": 11, "cluster": {"id": 9, "label": "page_header", "bbox": {"l": 167.82053, "t": 93.77099999999996, "r": 231.72049000000004, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8927664756774902, "cells": [{"id": 1, "text": "M.", "bbox": {"l": 167.82053, "t": 93.77099999999996, "r": 178.08249, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37929, "t": 93.77099999999996, "r": 231.72049000000004, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "M. Lysak, et al."}, {"label": "section_header", "id": 8, "page_no": 11, "cluster": {"id": 8, "label": "section_header", "bbox": {"l": 134.765, "t": 117.54894999999988, "r": 219.25478999999999, "b": 128.11737000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.915635347366333, "cells": [{"id": 3, "text": "6", "bbox": {"l": 134.765, "t": 117.54894999999988, "r": 141.4886, "b": 128.11737000000005, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Conclusion", "bbox": {"l": 154.9382, "t": 117.54894999999988, "r": 219.25478999999999, "b": 128.11737000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "6 Conclusion"}, {"label": "text", "id": 2, "page_no": 11, "cluster": {"id": 2, "label": "text", "bbox": {"l": 134.765, "t": 146.86377000000005, "r": 480.59569999999997, "b": 203.48181, "coord_origin": "TOPLEFT"}, "confidence": 0.9806171655654907, "cells": [{"id": 5, "text": "We demonstrated that representing tables in HTML for the task of table struc-", "bbox": {"l": 134.765, "t": 146.86377000000005, "r": 480.59476, "b": 155.66076999999996, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "ture recognition with Im2Seq models is ill-suited and has serious limitations.", "bbox": {"l": 134.765, "t": 158.81879000000004, "r": 480.59476, "b": 167.61577999999997, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Furthermore, we presented in this paper an Optimized Table Structure Language", "bbox": {"l": 134.765, "t": 170.77380000000005, "r": 480.58978, "b": 179.57079999999996, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "(OTSL) which, when compared to commonly used general purpose languages,", "bbox": {"l": 134.765, "t": 182.72979999999995, "r": 480.59569999999997, "b": 191.52679, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "has several key benefits.", "bbox": {"l": 134.765, "t": 194.68480999999997, "r": 239.5387, "b": 203.48181, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "We demonstrated that representing tables in HTML for the task of table structure recognition with Im2Seq models is ill-suited and has serious limitations. Furthermore, we presented in this paper an Optimized Table Structure Language (OTSL) which, when compared to commonly used general purpose languages, has several key benefits."}, {"label": "text", "id": 0, "page_no": 11, "cluster": {"id": 0, "label": "text", "bbox": {"l": 134.765, "t": 207.44379000000004, "r": 480.59479, "b": 323.83679, "coord_origin": "TOPLEFT"}, "confidence": 0.9873476028442383, "cells": [{"id": 10, "text": "First and foremost, given the same network configuration, inference time for", "bbox": {"l": 149.709, "t": 207.44379000000004, "r": 480.59283000000005, "b": 216.24077999999997, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "a table-structure prediction is about 2 times faster compared to the conventional", "bbox": {"l": 134.765, "t": 219.39880000000005, "r": 480.59365999999994, "b": 228.19579999999996, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "HTML approach. This is primarily owed to the shorter sequence length of the", "bbox": {"l": 134.765, "t": 231.35382000000004, "r": 480.59079, "b": 240.15081999999995, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "OTSL representation. Additional performance benefits can be obtained with", "bbox": {"l": 134.765, "t": 243.30884000000003, "r": 480.58786000000003, "b": 252.10582999999997, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "HPO (hyper parameter optimization). As we demonstrate in our experiments,", "bbox": {"l": 134.765, "t": 255.26482999999996, "r": 480.59479, "b": 264.06183, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "models trained on OTSL can be significantly smaller, e.g. by reducing the number", "bbox": {"l": 134.765, "t": 267.21984999999995, "r": 480.5878000000001, "b": 276.01685, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "of encoder and decoder layers, while preserving comparatively good prediction", "bbox": {"l": 134.765, "t": 279.17487000000006, "r": 480.59268, "b": 287.97183, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "quality. This can further improve inference performance, yielding 5-6 times faster", "bbox": {"l": 134.765, "t": 291.12985, "r": 480.58871, "b": 299.92682, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "inference speed in OTSL with prediction quality comparable to models trained", "bbox": {"l": 134.765, "t": 303.08484, "r": 480.59375, "b": 311.88181, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "on HTML (see Table 1).", "bbox": {"l": 134.765, "t": 315.03983, "r": 240.92351000000002, "b": 323.83679, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "First and foremost, given the same network configuration, inference time for a table-structure prediction is about 2 times faster compared to the conventional HTML approach. This is primarily owed to the shorter sequence length of the OTSL representation. Additional performance benefits can be obtained with HPO (hyper parameter optimization). As we demonstrate in our experiments, models trained on OTSL can be significantly smaller, e.g. by reducing the number of encoder and decoder layers, while preserving comparatively good prediction quality. This can further improve inference performance, yielding 5-6 times faster inference speed in OTSL with prediction quality comparable to models trained on HTML (see Table 1)."}, {"label": "text", "id": 1, "page_no": 11, "cluster": {"id": 1, "label": "text", "bbox": {"l": 134.765, "t": 327.79883, "r": 480.59482, "b": 468.10266, "coord_origin": "TOPLEFT"}, "confidence": 0.9868747591972351, "cells": [{"id": 20, "text": "Secondly, OTSL has more inherent structure and a significantly restricted vo-", "bbox": {"l": 149.709, "t": 327.79883, "r": 480.58984, "b": 336.5957900000001, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "cabulary size. This allows autoregressive models to perform better in the TED", "bbox": {"l": 134.765, "t": 339.75482, "r": 480.59473, "b": 348.55179, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "metric, but especially with regards to prediction accuracy of the table-cell bound-", "bbox": {"l": 134.765, "t": 351.70981, "r": 480.58664, "b": 360.50677, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "ing boxes (see Table 2). As shown in Figure 5, we observe that the OTSL dras-", "bbox": {"l": 134.765, "t": 363.66479, "r": 480.59479, "b": 372.46176, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "tically reduces the drift for table cell bounding boxes at high row count and in", "bbox": {"l": 134.765, "t": 375.61978, "r": 480.58971999999994, "b": 384.41675, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "sparse tables. This leads to more accurate predictions and a significant reduction", "bbox": {"l": 134.765, "t": 387.57477, "r": 480.58673, "b": 396.37173, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "in post-processing complexity, which is an undesired necessity in HTML-based", "bbox": {"l": 134.765, "t": 399.53076, "r": 480.58574999999996, "b": 408.32773, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Im2Seq models. Significant novelty lies in OTSL syntactical rules, which are few,", "bbox": {"l": 134.765, "t": 411.48575, "r": 480.58675999999997, "b": 420.28271, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "simple and always backwards looking. Each new token can be validated only by", "bbox": {"l": 134.765, "t": 423.44073, "r": 480.59482, "b": 432.23769999999996, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "analyzing the sequence of previous tokens, without requiring the entire sequence", "bbox": {"l": 134.765, "t": 435.39572, "r": 480.58777, "b": 444.19269, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "to detect mistakes. This in return allows to perform structural error detection", "bbox": {"l": 134.765, "t": 447.35071, "r": 480.58968999999996, "b": 456.14767, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "and correction on-the-fly during sequence generation.", "bbox": {"l": 134.765, "t": 459.30569, "r": 366.77698, "b": 468.10266, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Secondly, OTSL has more inherent structure and a significantly restricted vocabulary size. This allows autoregressive models to perform better in the TED metric, but especially with regards to prediction accuracy of the table-cell bounding boxes (see Table 2). As shown in Figure 5, we observe that the OTSL drastically reduces the drift for table cell bounding boxes at high row count and in sparse tables. This leads to more accurate predictions and a significant reduction in post-processing complexity, which is an undesired necessity in HTML-based Im2Seq models. Significant novelty lies in OTSL syntactical rules, which are few, simple and always backwards looking. Each new token can be validated only by analyzing the sequence of previous tokens, without requiring the entire sequence to detect mistakes. This in return allows to perform structural error detection and correction on-the-fly during sequence generation."}, {"label": "section_header", "id": 7, "page_no": 11, "cluster": {"id": 7, "label": "section_header", "bbox": {"l": 134.765, "t": 493.82083, "r": 197.68642, "b": 504.38922, "coord_origin": "TOPLEFT"}, "confidence": 0.9403266310691833, "cells": [{"id": 32, "text": "References", "bbox": {"l": 134.765, "t": 493.82083, "r": 197.68642, "b": 504.38922, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "References"}, {"label": "list_item", "id": 5, "page_no": 11, "cluster": {"id": 5, "label": "list_item", "bbox": {"l": 139.371, "t": 522.87985, "r": 480.5920100000001, "b": 563.87144, "coord_origin": "TOPLEFT"}, "confidence": 0.9698606729507446, "cells": [{"id": 33, "text": "1.", "bbox": {"l": 139.371, "t": 522.87985, "r": 146.46127, "b": 530.94962, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Auer, C., Dolfi, M., Carvalho, A., Ramis, C.B., Staar, P.W.J.: Delivering doc-", "bbox": {"l": 151.01955, "t": 522.87985, "r": 480.5920100000001, "b": 530.94962, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "ument conversion as a cloud service with high throughput and responsiveness.", "bbox": {"l": 151.51801, "t": 533.83887, "r": 480.58667, "b": 541.90862, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "CoRR", "bbox": {"l": 151.51801, "t": 544.79785, "r": 176.34149, "b": 552.86761, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "abs/2206.00785", "bbox": {"l": 179.464, "t": 544.73509, "r": 250.67963, "b": 552.66139, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "(2022).", "bbox": {"l": 253.804, "t": 544.79785, "r": 281.9567, "b": 552.86761, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "https://doi.org/10.48550/arXiv.2206.00785", "bbox": {"l": 285.078, "t": 545.44344, "r": 478.03403000000003, "b": 552.91245, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": ",", "bbox": {"l": 478.0319799999999, "t": 544.79785, "r": 480.59099999999995, "b": 552.86761, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "https://doi.org/10.48550/arXiv.2206.00785", "bbox": {"l": 151.51797, "t": 556.4024400000001, "r": 344.474, "b": 563.87144, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1. Auer, C., Dolfi, M., Carvalho, A., Ramis, C.B., Staar, P.W.J.: Delivering document conversion as a cloud service with high throughput and responsiveness. CoRR abs/2206.00785 (2022). https://doi.org/10.48550/arXiv.2206.00785 , https://doi.org/10.48550/arXiv.2206.00785"}, {"label": "list_item", "id": 4, "page_no": 11, "cluster": {"id": 4, "label": "list_item", "bbox": {"l": 139.37097, "t": 567.51884, "r": 480.5920100000001, "b": 608.46561, "coord_origin": "TOPLEFT"}, "confidence": 0.9730570316314697, "cells": [{"id": 42, "text": "2.", "bbox": {"l": 139.37097, "t": 567.51884, "r": 145.94186, "b": 575.58861, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Chen, B., Peng, D., Zhang, J., Ren, Y., Jin, L.: Complex table structure recognition", "bbox": {"l": 150.16624, "t": 567.51884, "r": 480.58636, "b": 575.58861, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "in the wild using transformer and identity matrix-based augmentation. In: Porwal,", "bbox": {"l": 151.51797, "t": 578.47784, "r": 480.59012, "b": 586.5476100000001, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "U., Forn\u00e9s, A., Shafait, F. (eds.) Frontiers in Handwriting Recognition. pp. 545-", "bbox": {"l": 151.51797, "t": 589.43684, "r": 480.5920100000001, "b": 597.50661, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "561. Springer International Publishing, Cham (2022)", "bbox": {"l": 151.51797, "t": 600.39584, "r": 364.17856, "b": 608.46561, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2. Chen, B., Peng, D., Zhang, J., Ren, Y., Jin, L.: Complex table structure recognition in the wild using transformer and identity matrix-based augmentation. In: Porwal, U., Forn\u00e9s, A., Shafait, F. (eds.) Frontiers in Handwriting Recognition. pp. 545561. Springer International Publishing, Cham (2022)"}, {"label": "list_item", "id": 6, "page_no": 11, "cluster": {"id": 6, "label": "list_item", "bbox": {"l": 139.37097, "t": 612.1588399999999, "r": 480.58731000000006, "b": 631.18761, "coord_origin": "TOPLEFT"}, "confidence": 0.9617196321487427, "cells": [{"id": 47, "text": "3.", "bbox": {"l": 139.37097, "t": 612.1588399999999, "r": 146.4379, "b": 620.22861, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Chi, Z., Huang, H., Xu, H.D., Yu, H., Yin, W., Mao, X.L.: Complicated table", "bbox": {"l": 150.98117, "t": 612.1588399999999, "r": 480.58731000000006, "b": 620.22861, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "structure recognition. arXiv preprint arXiv:1908.04729 (2019)", "bbox": {"l": 151.51797, "t": 623.11784, "r": 400.22525, "b": 631.18761, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3. Chi, Z., Huang, H., Xu, H.D., Yu, H., Yin, W., Mao, X.L.: Complicated table structure recognition. arXiv preprint arXiv:1908.04729 (2019)"}, {"label": "list_item", "id": 3, "page_no": 11, "cluster": {"id": 3, "label": "list_item", "bbox": {"l": 139.37097, "t": 634.88084, "r": 480.58826, "b": 664.86761, "coord_origin": "TOPLEFT"}, "confidence": 0.9754673838615417, "cells": [{"id": 50, "text": "4.", "bbox": {"l": 139.37097, "t": 634.88084, "r": 146.52443, "b": 642.95061, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Deng, Y., Rosenberg, D., Mann, G.: Challenges in end-to-end neural scientific", "bbox": {"l": 151.12335, "t": 634.88084, "r": 480.58826, "b": 642.95061, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "table recognition. In: 2019 International Conference on Document Analysis and", "bbox": {"l": 151.51797, "t": 645.83984, "r": 480.58752, "b": 653.9096099999999, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Recognition (ICDAR). pp. 894-901. IEEE (2019)", "bbox": {"l": 151.51797, "t": 656.79785, "r": 350.11115, "b": 664.86761, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4. Deng, Y., Rosenberg, D., Mann, G.: Challenges in end-to-end neural scientific table recognition. In: 2019 International Conference on Document Analysis and Recognition (ICDAR). pp. 894-901. IEEE (2019)"}], "body": [{"label": "section_header", "id": 8, "page_no": 11, "cluster": {"id": 8, "label": "section_header", "bbox": {"l": 134.765, "t": 117.54894999999988, "r": 219.25478999999999, "b": 128.11737000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.915635347366333, "cells": [{"id": 3, "text": "6", "bbox": {"l": 134.765, "t": 117.54894999999988, "r": 141.4886, "b": 128.11737000000005, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Conclusion", "bbox": {"l": 154.9382, "t": 117.54894999999988, "r": 219.25478999999999, "b": 128.11737000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "6 Conclusion"}, {"label": "text", "id": 2, "page_no": 11, "cluster": {"id": 2, "label": "text", "bbox": {"l": 134.765, "t": 146.86377000000005, "r": 480.59569999999997, "b": 203.48181, "coord_origin": "TOPLEFT"}, "confidence": 0.9806171655654907, "cells": [{"id": 5, "text": "We demonstrated that representing tables in HTML for the task of table struc-", "bbox": {"l": 134.765, "t": 146.86377000000005, "r": 480.59476, "b": 155.66076999999996, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "ture recognition with Im2Seq models is ill-suited and has serious limitations.", "bbox": {"l": 134.765, "t": 158.81879000000004, "r": 480.59476, "b": 167.61577999999997, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Furthermore, we presented in this paper an Optimized Table Structure Language", "bbox": {"l": 134.765, "t": 170.77380000000005, "r": 480.58978, "b": 179.57079999999996, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "(OTSL) which, when compared to commonly used general purpose languages,", "bbox": {"l": 134.765, "t": 182.72979999999995, "r": 480.59569999999997, "b": 191.52679, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "has several key benefits.", "bbox": {"l": 134.765, "t": 194.68480999999997, "r": 239.5387, "b": 203.48181, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "We demonstrated that representing tables in HTML for the task of table structure recognition with Im2Seq models is ill-suited and has serious limitations. Furthermore, we presented in this paper an Optimized Table Structure Language (OTSL) which, when compared to commonly used general purpose languages, has several key benefits."}, {"label": "text", "id": 0, "page_no": 11, "cluster": {"id": 0, "label": "text", "bbox": {"l": 134.765, "t": 207.44379000000004, "r": 480.59479, "b": 323.83679, "coord_origin": "TOPLEFT"}, "confidence": 0.9873476028442383, "cells": [{"id": 10, "text": "First and foremost, given the same network configuration, inference time for", "bbox": {"l": 149.709, "t": 207.44379000000004, "r": 480.59283000000005, "b": 216.24077999999997, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "a table-structure prediction is about 2 times faster compared to the conventional", "bbox": {"l": 134.765, "t": 219.39880000000005, "r": 480.59365999999994, "b": 228.19579999999996, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "HTML approach. This is primarily owed to the shorter sequence length of the", "bbox": {"l": 134.765, "t": 231.35382000000004, "r": 480.59079, "b": 240.15081999999995, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "OTSL representation. Additional performance benefits can be obtained with", "bbox": {"l": 134.765, "t": 243.30884000000003, "r": 480.58786000000003, "b": 252.10582999999997, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "HPO (hyper parameter optimization). As we demonstrate in our experiments,", "bbox": {"l": 134.765, "t": 255.26482999999996, "r": 480.59479, "b": 264.06183, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "models trained on OTSL can be significantly smaller, e.g. by reducing the number", "bbox": {"l": 134.765, "t": 267.21984999999995, "r": 480.5878000000001, "b": 276.01685, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "of encoder and decoder layers, while preserving comparatively good prediction", "bbox": {"l": 134.765, "t": 279.17487000000006, "r": 480.59268, "b": 287.97183, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "quality. This can further improve inference performance, yielding 5-6 times faster", "bbox": {"l": 134.765, "t": 291.12985, "r": 480.58871, "b": 299.92682, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "inference speed in OTSL with prediction quality comparable to models trained", "bbox": {"l": 134.765, "t": 303.08484, "r": 480.59375, "b": 311.88181, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "on HTML (see Table 1).", "bbox": {"l": 134.765, "t": 315.03983, "r": 240.92351000000002, "b": 323.83679, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "First and foremost, given the same network configuration, inference time for a table-structure prediction is about 2 times faster compared to the conventional HTML approach. This is primarily owed to the shorter sequence length of the OTSL representation. Additional performance benefits can be obtained with HPO (hyper parameter optimization). As we demonstrate in our experiments, models trained on OTSL can be significantly smaller, e.g. by reducing the number of encoder and decoder layers, while preserving comparatively good prediction quality. This can further improve inference performance, yielding 5-6 times faster inference speed in OTSL with prediction quality comparable to models trained on HTML (see Table 1)."}, {"label": "text", "id": 1, "page_no": 11, "cluster": {"id": 1, "label": "text", "bbox": {"l": 134.765, "t": 327.79883, "r": 480.59482, "b": 468.10266, "coord_origin": "TOPLEFT"}, "confidence": 0.9868747591972351, "cells": [{"id": 20, "text": "Secondly, OTSL has more inherent structure and a significantly restricted vo-", "bbox": {"l": 149.709, "t": 327.79883, "r": 480.58984, "b": 336.5957900000001, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "cabulary size. This allows autoregressive models to perform better in the TED", "bbox": {"l": 134.765, "t": 339.75482, "r": 480.59473, "b": 348.55179, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "metric, but especially with regards to prediction accuracy of the table-cell bound-", "bbox": {"l": 134.765, "t": 351.70981, "r": 480.58664, "b": 360.50677, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "ing boxes (see Table 2). As shown in Figure 5, we observe that the OTSL dras-", "bbox": {"l": 134.765, "t": 363.66479, "r": 480.59479, "b": 372.46176, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "tically reduces the drift for table cell bounding boxes at high row count and in", "bbox": {"l": 134.765, "t": 375.61978, "r": 480.58971999999994, "b": 384.41675, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "sparse tables. This leads to more accurate predictions and a significant reduction", "bbox": {"l": 134.765, "t": 387.57477, "r": 480.58673, "b": 396.37173, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "in post-processing complexity, which is an undesired necessity in HTML-based", "bbox": {"l": 134.765, "t": 399.53076, "r": 480.58574999999996, "b": 408.32773, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Im2Seq models. Significant novelty lies in OTSL syntactical rules, which are few,", "bbox": {"l": 134.765, "t": 411.48575, "r": 480.58675999999997, "b": 420.28271, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "simple and always backwards looking. Each new token can be validated only by", "bbox": {"l": 134.765, "t": 423.44073, "r": 480.59482, "b": 432.23769999999996, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "analyzing the sequence of previous tokens, without requiring the entire sequence", "bbox": {"l": 134.765, "t": 435.39572, "r": 480.58777, "b": 444.19269, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "to detect mistakes. This in return allows to perform structural error detection", "bbox": {"l": 134.765, "t": 447.35071, "r": 480.58968999999996, "b": 456.14767, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "and correction on-the-fly during sequence generation.", "bbox": {"l": 134.765, "t": 459.30569, "r": 366.77698, "b": 468.10266, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Secondly, OTSL has more inherent structure and a significantly restricted vocabulary size. This allows autoregressive models to perform better in the TED metric, but especially with regards to prediction accuracy of the table-cell bounding boxes (see Table 2). As shown in Figure 5, we observe that the OTSL drastically reduces the drift for table cell bounding boxes at high row count and in sparse tables. This leads to more accurate predictions and a significant reduction in post-processing complexity, which is an undesired necessity in HTML-based Im2Seq models. Significant novelty lies in OTSL syntactical rules, which are few, simple and always backwards looking. Each new token can be validated only by analyzing the sequence of previous tokens, without requiring the entire sequence to detect mistakes. This in return allows to perform structural error detection and correction on-the-fly during sequence generation."}, {"label": "section_header", "id": 7, "page_no": 11, "cluster": {"id": 7, "label": "section_header", "bbox": {"l": 134.765, "t": 493.82083, "r": 197.68642, "b": 504.38922, "coord_origin": "TOPLEFT"}, "confidence": 0.9403266310691833, "cells": [{"id": 32, "text": "References", "bbox": {"l": 134.765, "t": 493.82083, "r": 197.68642, "b": 504.38922, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "References"}, {"label": "list_item", "id": 5, "page_no": 11, "cluster": {"id": 5, "label": "list_item", "bbox": {"l": 139.371, "t": 522.87985, "r": 480.5920100000001, "b": 563.87144, "coord_origin": "TOPLEFT"}, "confidence": 0.9698606729507446, "cells": [{"id": 33, "text": "1.", "bbox": {"l": 139.371, "t": 522.87985, "r": 146.46127, "b": 530.94962, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Auer, C., Dolfi, M., Carvalho, A., Ramis, C.B., Staar, P.W.J.: Delivering doc-", "bbox": {"l": 151.01955, "t": 522.87985, "r": 480.5920100000001, "b": 530.94962, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "ument conversion as a cloud service with high throughput and responsiveness.", "bbox": {"l": 151.51801, "t": 533.83887, "r": 480.58667, "b": 541.90862, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "CoRR", "bbox": {"l": 151.51801, "t": 544.79785, "r": 176.34149, "b": 552.86761, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "abs/2206.00785", "bbox": {"l": 179.464, "t": 544.73509, "r": 250.67963, "b": 552.66139, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "(2022).", "bbox": {"l": 253.804, "t": 544.79785, "r": 281.9567, "b": 552.86761, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "https://doi.org/10.48550/arXiv.2206.00785", "bbox": {"l": 285.078, "t": 545.44344, "r": 478.03403000000003, "b": 552.91245, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": ",", "bbox": {"l": 478.0319799999999, "t": 544.79785, "r": 480.59099999999995, "b": 552.86761, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "https://doi.org/10.48550/arXiv.2206.00785", "bbox": {"l": 151.51797, "t": 556.4024400000001, "r": 344.474, "b": 563.87144, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1. Auer, C., Dolfi, M., Carvalho, A., Ramis, C.B., Staar, P.W.J.: Delivering document conversion as a cloud service with high throughput and responsiveness. CoRR abs/2206.00785 (2022). https://doi.org/10.48550/arXiv.2206.00785 , https://doi.org/10.48550/arXiv.2206.00785"}, {"label": "list_item", "id": 4, "page_no": 11, "cluster": {"id": 4, "label": "list_item", "bbox": {"l": 139.37097, "t": 567.51884, "r": 480.5920100000001, "b": 608.46561, "coord_origin": "TOPLEFT"}, "confidence": 0.9730570316314697, "cells": [{"id": 42, "text": "2.", "bbox": {"l": 139.37097, "t": 567.51884, "r": 145.94186, "b": 575.58861, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Chen, B., Peng, D., Zhang, J., Ren, Y., Jin, L.: Complex table structure recognition", "bbox": {"l": 150.16624, "t": 567.51884, "r": 480.58636, "b": 575.58861, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "in the wild using transformer and identity matrix-based augmentation. In: Porwal,", "bbox": {"l": 151.51797, "t": 578.47784, "r": 480.59012, "b": 586.5476100000001, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "U., Forn\u00e9s, A., Shafait, F. (eds.) Frontiers in Handwriting Recognition. pp. 545-", "bbox": {"l": 151.51797, "t": 589.43684, "r": 480.5920100000001, "b": 597.50661, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "561. Springer International Publishing, Cham (2022)", "bbox": {"l": 151.51797, "t": 600.39584, "r": 364.17856, "b": 608.46561, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2. Chen, B., Peng, D., Zhang, J., Ren, Y., Jin, L.: Complex table structure recognition in the wild using transformer and identity matrix-based augmentation. In: Porwal, U., Forn\u00e9s, A., Shafait, F. (eds.) Frontiers in Handwriting Recognition. pp. 545561. Springer International Publishing, Cham (2022)"}, {"label": "list_item", "id": 6, "page_no": 11, "cluster": {"id": 6, "label": "list_item", "bbox": {"l": 139.37097, "t": 612.1588399999999, "r": 480.58731000000006, "b": 631.18761, "coord_origin": "TOPLEFT"}, "confidence": 0.9617196321487427, "cells": [{"id": 47, "text": "3.", "bbox": {"l": 139.37097, "t": 612.1588399999999, "r": 146.4379, "b": 620.22861, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Chi, Z., Huang, H., Xu, H.D., Yu, H., Yin, W., Mao, X.L.: Complicated table", "bbox": {"l": 150.98117, "t": 612.1588399999999, "r": 480.58731000000006, "b": 620.22861, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "structure recognition. arXiv preprint arXiv:1908.04729 (2019)", "bbox": {"l": 151.51797, "t": 623.11784, "r": 400.22525, "b": 631.18761, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3. Chi, Z., Huang, H., Xu, H.D., Yu, H., Yin, W., Mao, X.L.: Complicated table structure recognition. arXiv preprint arXiv:1908.04729 (2019)"}, {"label": "list_item", "id": 3, "page_no": 11, "cluster": {"id": 3, "label": "list_item", "bbox": {"l": 139.37097, "t": 634.88084, "r": 480.58826, "b": 664.86761, "coord_origin": "TOPLEFT"}, "confidence": 0.9754673838615417, "cells": [{"id": 50, "text": "4.", "bbox": {"l": 139.37097, "t": 634.88084, "r": 146.52443, "b": 642.95061, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Deng, Y., Rosenberg, D., Mann, G.: Challenges in end-to-end neural scientific", "bbox": {"l": 151.12335, "t": 634.88084, "r": 480.58826, "b": 642.95061, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "table recognition. In: 2019 International Conference on Document Analysis and", "bbox": {"l": 151.51797, "t": 645.83984, "r": 480.58752, "b": 653.9096099999999, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Recognition (ICDAR). pp. 894-901. IEEE (2019)", "bbox": {"l": 151.51797, "t": 656.79785, "r": 350.11115, "b": 664.86761, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4. Deng, Y., Rosenberg, D., Mann, G.: Challenges in end-to-end neural scientific table recognition. In: 2019 International Conference on Document Analysis and Recognition (ICDAR). pp. 894-901. IEEE (2019)"}], "headers": [{"label": "page_header", "id": 10, "page_no": 11, "cluster": {"id": 10, "label": "page_header", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 143.97887, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8610832691192627, "cells": [{"id": 0, "text": "12", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 143.97887, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "12"}, {"label": "page_header", "id": 9, "page_no": 11, "cluster": {"id": 9, "label": "page_header", "bbox": {"l": 167.82053, "t": 93.77099999999996, "r": 231.72049000000004, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8927664756774902, "cells": [{"id": 1, "text": "M.", "bbox": {"l": 167.82053, "t": 93.77099999999996, "r": 178.08249, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37929, "t": 93.77099999999996, "r": 231.72049000000004, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "M. Lysak, et al."}]}}, {"page_no": 12, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "13", "bbox": {"l": 471.37561, "t": 93.77099999999996, "r": 480.5894799999999, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "5.", "bbox": {"l": 139.371, "t": 119.67400999999995, "r": 146.04857, "b": 127.74370999999985, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Kayal, P., Anand, M., Desai, H., Singh, M.: Tables to latex: structure and content", "bbox": {"l": 150.34157, "t": 119.67400999999995, "r": 480.58826, "b": 127.74370999999985, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "extraction from scientific tables. International Journal on Document Analysis and", "bbox": {"l": 151.51801, "t": 130.63300000000004, "r": 480.59479, "b": 138.70270000000005, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Recognition (IJDAR) pp. 1-10 (2022)", "bbox": {"l": 151.51801, "t": 141.59198000000004, "r": 304.04364, "b": 149.66168000000005, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "6.", "bbox": {"l": 139.371, "t": 152.56195000000002, "r": 145.93991, "b": 160.63165000000004, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Lee, E., Kwon, J., Yang, H., Park, J., Lee, S., Koo, H.I., Cho, N.I.: Table structure", "bbox": {"l": 150.16298, "t": 152.56195000000002, "r": 480.59015, "b": 160.63165000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "recognition based on grid shape graph. In: 2022 Asia-Pacific Signal and Information", "bbox": {"l": 151.51801, "t": 163.52094, "r": 480.5903, "b": 171.59064, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Processing Association Annual Summit and Conference (APSIPA ASC). pp. 1868-", "bbox": {"l": 151.51801, "t": 174.47992, "r": 480.59286000000003, "b": 182.54962, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "1873. IEEE (2022)", "bbox": {"l": 151.51801, "t": 185.4389, "r": 226.37399, "b": 193.50860999999998, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "7.", "bbox": {"l": 139.371, "t": 196.40886999999998, "r": 146.31418, "b": 204.47857999999997, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Li, M., Cui, L., Huang, S., Wei, F., Zhou, M., Li, Z.: Tablebank: A benchmark", "bbox": {"l": 150.77789, "t": 196.40886999999998, "r": 480.59012, "b": 204.47857999999997, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "dataset for table detection and recognition (2019)", "bbox": {"l": 151.51801, "t": 207.36785999999995, "r": 352.01746, "b": 215.43755999999996, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "8.", "bbox": {"l": 139.371, "t": 218.33887000000004, "r": 146.37106, "b": 226.40857000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Livathinos, N., Berrospi, C., Lysak, M., Kuropiatnyk, V., Nassar, A., Carvalho,", "bbox": {"l": 150.87132, "t": 218.33887000000004, "r": 480.58731000000006, "b": 226.40857000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "A., Dolfi, M., Auer, C., Dinkla, K., Staar, P.: Robust pdf document conversion", "bbox": {"l": 151.51801, "t": 229.29785000000004, "r": 480.59020999999996, "b": 237.36755000000005, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "using recurrent neural networks. Proceedings of the AAAI Conference on Artificial", "bbox": {"l": 151.51801, "t": 240.25684, "r": 480.59473, "b": 248.32654000000002, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Intelligence", "bbox": {"l": 151.51801, "t": 251.21582, "r": 197.08617, "b": 259.28552, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "35", "bbox": {"l": 199.40001, "t": 251.15301999999997, "r": 210.00726, "b": 259.07935, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "(17), 15137-15145 (May 2021),", "bbox": {"l": 210.007, "t": 251.21582, "r": 332.37683, "b": 259.28552, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "https://ojs.aaai.org/index.php/", "bbox": {"l": 334.69901, "t": 251.86139000000003, "r": 480.59039000000007, "b": 259.33038, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "AAAI/article/view/17777", "bbox": {"l": 151.51801, "t": 262.8194, "r": 259.75769, "b": 270.28839000000005, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "9.", "bbox": {"l": 139.371, "t": 273.14484000000004, "r": 146.14218, "b": 281.21457, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "Nassar, A., Livathinos, N., Lysak, M., Staar, P.: Tableformer: Table structure un-", "bbox": {"l": 150.49533, "t": 273.14484000000004, "r": 480.5881999999999, "b": 281.21457, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "derstanding with transformers. In: Proceedings of the IEEE/CVF Conference on", "bbox": {"l": 151.51801, "t": 284.10379, "r": 480.59387000000004, "b": 292.17355, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "Computer Vision and Pattern Recognition (CVPR). pp. 4614-4623 (June 2022)", "bbox": {"l": 151.51801, "t": 295.06277, "r": 473.44308000000007, "b": 303.13254, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "10.", "bbox": {"l": 134.76401, "t": 306.03277999999995, "r": 146.49922, "b": 314.10254000000003, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Pfitzmann, B., Auer, C., Dolfi, M., Nassar, A.S., Staar, P.W.J.: Doclaynet: A", "bbox": {"l": 151.09138, "t": 306.03277999999995, "r": 480.58905, "b": 314.10254000000003, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "large human-annotated dataset for document-layout segmentation. In: Zhang, A.,", "bbox": {"l": 151.51801, "t": 316.99179, "r": 480.59015, "b": 325.06155, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Rangwala, H. (eds.) KDD \u201922: The 28th ACM SIGKDD Conference on Knowledge", "bbox": {"l": 151.51801, "t": 327.95078, "r": 480.59113, "b": 336.02054, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Discovery and Data Mining, Washington, DC, USA, August 14 - 18, 2022. pp.", "bbox": {"l": 151.51801, "t": 338.90976, "r": 480.59113, "b": 346.97952, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "3743-3751. ACM (2022).", "bbox": {"l": 151.51801, "t": 349.86874, "r": 251.14098999999996, "b": 357.93851, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "https://doi.org/10.1145/3534678.3539043", "bbox": {"l": 253.99001, "t": 350.5143100000001, "r": 437.53311, "b": 357.98333999999994, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": ",", "bbox": {"l": 437.53201, "t": 349.86874, "r": 440.09102999999993, "b": 357.93851, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "https://", "bbox": {"l": 442.94202000000007, "t": 350.5143100000001, "r": 480.59372, "b": 357.98333999999994, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "doi.org/10.1145/3534678.3539043", "bbox": {"l": 151.51801, "t": 361.47329999999994, "r": 297.40939, "b": 368.94232, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "11.", "bbox": {"l": 134.76401, "t": 371.79773, "r": 146.03854, "b": 379.86749, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "Prasad, D., Gadpal, A., Kapadni, K., Visave, M., Sultanpure, K.: Cascadetabnet:", "bbox": {"l": 150.4505, "t": 371.79773, "r": 480.58914000000004, "b": 379.86749, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "An approach for end to end table detection and structure recognition from image-", "bbox": {"l": 151.51801, "t": 382.7567399999999, "r": 480.59296, "b": 390.82651, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "based documents. In: Proceedings of the IEEE/CVF conference on computer vision", "bbox": {"l": 151.51801, "t": 393.71573, "r": 480.59293, "b": 401.78549, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "and pattern recognition workshops. pp. 572-573 (2020)", "bbox": {"l": 151.51801, "t": 404.67471, "r": 373.82727, "b": 412.74448, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "12.", "bbox": {"l": 134.76401, "t": 415.64471, "r": 145.91106, "b": 423.71448000000004, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Schreiber, S., Agne, S., Wolf, I., Dengel, A., Ahmed, S.: Deepdesrt: Deep learning", "bbox": {"l": 150.27309, "t": 415.64471, "r": 480.5874, "b": 423.71448000000004, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "for detection and structure recognition of tables in document images. In: 2017 14th", "bbox": {"l": 151.51801, "t": 426.60373, "r": 480.59469999999993, "b": 434.67349, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "IAPR international conference on document analysis and recognition (ICDAR).", "bbox": {"l": 151.51801, "t": 437.5627099999999, "r": 480.58844, "b": 445.63248, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "vol. 1, pp. 1162-1167. IEEE (2017)", "bbox": {"l": 151.51801, "t": 448.5217, "r": 292.91455, "b": 456.59146, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "13.", "bbox": {"l": 134.76401, "t": 459.4917, "r": 145.7785, "b": 467.56146, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Siddiqui, S.A., Fateh, I.A., Rizvi, S.T.R., Dengel, A., Ahmed, S.: Deeptabstr: Deep", "bbox": {"l": 150.08871, "t": 459.4917, "r": 480.59006, "b": 467.56146, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "learning based table structure recognition. In: 2019 International Conference on", "bbox": {"l": 151.51801, "t": 470.45071, "r": 480.59116, "b": 478.52048, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Document Analysis and Recognition (ICDAR). pp. 1403-1409 (2019).", "bbox": {"l": 151.51801, "t": 481.4097, "r": 439.05963, "b": 489.47946, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "https://", "bbox": {"l": 442.94202000000007, "t": 482.05527, "r": 480.59372, "b": 489.52429, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "doi.org/10.1109/ICDAR.2019.00226", "bbox": {"l": 151.51801, "t": 493.01425, "r": 302.11584, "b": 500.48328, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "14.", "bbox": {"l": 134.76401, "t": 503.33868, "r": 146.15501, "b": 511.40845, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "Smock, B., Pesala, R., Abraham, R.: PubTables-1M: Towards comprehensive ta-", "bbox": {"l": 150.61252, "t": 503.33868, "r": 480.59088, "b": 511.40845, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "ble extraction from unstructured documents. In: Proceedings of the IEEE/CVF", "bbox": {"l": 151.51801, "t": 514.2977000000001, "r": 480.59286000000003, "b": 522.3674599999999, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Conference on Computer Vision and Pattern Recognition (CVPR). pp. 4634-4642", "bbox": {"l": 151.51801, "t": 525.25668, "r": 480.58838000000003, "b": 533.32645, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "(June 2022)", "bbox": {"l": 151.51801, "t": 536.21568, "r": 199.24704, "b": 544.28545, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "15.", "bbox": {"l": 134.76401, "t": 547.18568, "r": 146.16588, "b": 555.25545, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Staar, P.W.J., Dolfi, M., Auer, C., Bekas, C.: Corpus conversion service: A ma-", "bbox": {"l": 150.62764, "t": 547.18568, "r": 480.58734000000004, "b": 555.25545, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "chine learning platform to ingest documents at scale. In: Proceedings of the 24th", "bbox": {"l": 151.51801, "t": 558.14468, "r": 480.58838000000003, "b": 566.2144499999999, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "ACM SIGKDD International Conference on Knowledge Discovery & Data Min-", "bbox": {"l": 151.51801, "t": 569.1036799999999, "r": 480.59109, "b": 577.17345, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "ing. pp. 774-782. KDD \u201918, Association for Computing Machinery, New York, NY,", "bbox": {"l": 151.51801, "t": 580.06268, "r": 480.59195, "b": 588.1324500000001, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "USA (2018).", "bbox": {"l": 151.51801, "t": 591.0216800000001, "r": 200.75787, "b": 599.09145, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "https://doi.org/10.1145/3219819.3219834", "bbox": {"l": 202.916, "t": 591.66727, "r": 386.45911, "b": 599.1362799999999, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": ",", "bbox": {"l": 386.45801, "t": 591.0216800000001, "r": 389.01703, "b": 599.09145, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "https://doi.org/10.", "bbox": {"l": 391.173, "t": 591.66727, "r": 480.59583, "b": 599.1362799999999, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "1145/3219819.3219834", "bbox": {"l": 151.51801, "t": 602.62627, "r": 245.63831, "b": 610.09528, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "16.", "bbox": {"l": 134.76401, "t": 612.95068, "r": 146.62019, "b": 621.02045, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "Wang, X.: Tabular Abstraction, Editing, and Formatting. Ph.D. thesis, CAN", "bbox": {"l": 151.25977, "t": 612.95068, "r": 480.59542999999996, "b": 621.02045, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "(1996), aAINN09397", "bbox": {"l": 151.51801, "t": 623.90968, "r": 234.43031, "b": 631.97945, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "17.", "bbox": {"l": 134.76401, "t": 634.87968, "r": 146.30539, "b": 642.9494500000001, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "Xue, W., Li, Q., Tao, D.: Res2tim: Reconstruct syntactic structures from table", "bbox": {"l": 150.82175, "t": 634.87968, "r": 480.58731000000006, "b": 642.9494500000001, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "images. In: 2019 International Conference on Document Analysis and Recognition", "bbox": {"l": 151.51801, "t": 645.8386800000001, "r": 480.59119, "b": 653.90845, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "(ICDAR). pp. 749-755. IEEE (2019)", "bbox": {"l": 151.51801, "t": 656.79768, "r": 299.30307, "b": 664.86745, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 13, "label": "page_header", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9163166880607605, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "page_header", "bbox": {"l": 471.37561, "t": 93.77099999999996, "r": 480.5894799999999, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9061064720153809, "cells": [{"id": 1, "text": "13", "bbox": {"l": 471.37561, "t": 93.77099999999996, "r": 480.5894799999999, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "list_item", "bbox": {"l": 139.371, "t": 119.67400999999995, "r": 480.59479, "b": 149.66168000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9677112698554993, "cells": [{"id": 2, "text": "5.", "bbox": {"l": 139.371, "t": 119.67400999999995, "r": 146.04857, "b": 127.74370999999985, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Kayal, P., Anand, M., Desai, H., Singh, M.: Tables to latex: structure and content", "bbox": {"l": 150.34157, "t": 119.67400999999995, "r": 480.58826, "b": 127.74370999999985, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "extraction from scientific tables. International Journal on Document Analysis and", "bbox": {"l": 151.51801, "t": 130.63300000000004, "r": 480.59479, "b": 138.70270000000005, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Recognition (IJDAR) pp. 1-10 (2022)", "bbox": {"l": 151.51801, "t": 141.59198000000004, "r": 304.04364, "b": 149.66168000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "list_item", "bbox": {"l": 139.371, "t": 152.56195000000002, "r": 480.59286000000003, "b": 193.50860999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.973045289516449, "cells": [{"id": 6, "text": "6.", "bbox": {"l": 139.371, "t": 152.56195000000002, "r": 145.93991, "b": 160.63165000000004, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Lee, E., Kwon, J., Yang, H., Park, J., Lee, S., Koo, H.I., Cho, N.I.: Table structure", "bbox": {"l": 150.16298, "t": 152.56195000000002, "r": 480.59015, "b": 160.63165000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "recognition based on grid shape graph. In: 2022 Asia-Pacific Signal and Information", "bbox": {"l": 151.51801, "t": 163.52094, "r": 480.5903, "b": 171.59064, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Processing Association Annual Summit and Conference (APSIPA ASC). pp. 1868-", "bbox": {"l": 151.51801, "t": 174.47992, "r": 480.59286000000003, "b": 182.54962, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "1873. IEEE (2022)", "bbox": {"l": 151.51801, "t": 185.4389, "r": 226.37399, "b": 193.50860999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "list_item", "bbox": {"l": 139.371, "t": 196.40886999999998, "r": 480.59012, "b": 215.43755999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9582491517066956, "cells": [{"id": 11, "text": "7.", "bbox": {"l": 139.371, "t": 196.40886999999998, "r": 146.31418, "b": 204.47857999999997, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Li, M., Cui, L., Huang, S., Wei, F., Zhou, M., Li, Z.: Tablebank: A benchmark", "bbox": {"l": 150.77789, "t": 196.40886999999998, "r": 480.59012, "b": 204.47857999999997, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "dataset for table detection and recognition (2019)", "bbox": {"l": 151.51801, "t": 207.36785999999995, "r": 352.01746, "b": 215.43755999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "list_item", "bbox": {"l": 139.371, "t": 218.33887000000004, "r": 480.59473, "b": 270.28839000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.967814564704895, "cells": [{"id": 14, "text": "8.", "bbox": {"l": 139.371, "t": 218.33887000000004, "r": 146.37106, "b": 226.40857000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Livathinos, N., Berrospi, C., Lysak, M., Kuropiatnyk, V., Nassar, A., Carvalho,", "bbox": {"l": 150.87132, "t": 218.33887000000004, "r": 480.58731000000006, "b": 226.40857000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "A., Dolfi, M., Auer, C., Dinkla, K., Staar, P.: Robust pdf document conversion", "bbox": {"l": 151.51801, "t": 229.29785000000004, "r": 480.59020999999996, "b": 237.36755000000005, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "using recurrent neural networks. Proceedings of the AAAI Conference on Artificial", "bbox": {"l": 151.51801, "t": 240.25684, "r": 480.59473, "b": 248.32654000000002, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Intelligence", "bbox": {"l": 151.51801, "t": 251.21582, "r": 197.08617, "b": 259.28552, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "35", "bbox": {"l": 199.40001, "t": 251.15301999999997, "r": 210.00726, "b": 259.07935, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "(17), 15137-15145 (May 2021),", "bbox": {"l": 210.007, "t": 251.21582, "r": 332.37683, "b": 259.28552, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "https://ojs.aaai.org/index.php/", "bbox": {"l": 334.69901, "t": 251.86139000000003, "r": 480.59039000000007, "b": 259.33038, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "AAAI/article/view/17777", "bbox": {"l": 151.51801, "t": 262.8194, "r": 259.75769, "b": 270.28839000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "list_item", "bbox": {"l": 139.371, "t": 273.14484000000004, "r": 480.59387000000004, "b": 303.13254, "coord_origin": "TOPLEFT"}, "confidence": 0.9557179808616638, "cells": [{"id": 23, "text": "9.", "bbox": {"l": 139.371, "t": 273.14484000000004, "r": 146.14218, "b": 281.21457, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "Nassar, A., Livathinos, N., Lysak, M., Staar, P.: Tableformer: Table structure un-", "bbox": {"l": 150.49533, "t": 273.14484000000004, "r": 480.5881999999999, "b": 281.21457, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "derstanding with transformers. In: Proceedings of the IEEE/CVF Conference on", "bbox": {"l": 151.51801, "t": 284.10379, "r": 480.59387000000004, "b": 292.17355, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "Computer Vision and Pattern Recognition (CVPR). pp. 4614-4623 (June 2022)", "bbox": {"l": 151.51801, "t": 295.06277, "r": 473.44308000000007, "b": 303.13254, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "list_item", "bbox": {"l": 134.76401, "t": 306.03277999999995, "r": 480.59372, "b": 368.94232, "coord_origin": "TOPLEFT"}, "confidence": 0.9639304876327515, "cells": [{"id": 27, "text": "10.", "bbox": {"l": 134.76401, "t": 306.03277999999995, "r": 146.49922, "b": 314.10254000000003, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Pfitzmann, B., Auer, C., Dolfi, M., Nassar, A.S., Staar, P.W.J.: Doclaynet: A", "bbox": {"l": 151.09138, "t": 306.03277999999995, "r": 480.58905, "b": 314.10254000000003, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "large human-annotated dataset for document-layout segmentation. In: Zhang, A.,", "bbox": {"l": 151.51801, "t": 316.99179, "r": 480.59015, "b": 325.06155, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Rangwala, H. (eds.) KDD \u201922: The 28th ACM SIGKDD Conference on Knowledge", "bbox": {"l": 151.51801, "t": 327.95078, "r": 480.59113, "b": 336.02054, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Discovery and Data Mining, Washington, DC, USA, August 14 - 18, 2022. pp.", "bbox": {"l": 151.51801, "t": 338.90976, "r": 480.59113, "b": 346.97952, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "3743-3751. ACM (2022).", "bbox": {"l": 151.51801, "t": 349.86874, "r": 251.14098999999996, "b": 357.93851, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "https://doi.org/10.1145/3534678.3539043", "bbox": {"l": 253.99001, "t": 350.5143100000001, "r": 437.53311, "b": 357.98333999999994, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": ",", "bbox": {"l": 437.53201, "t": 349.86874, "r": 440.09102999999993, "b": 357.93851, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "https://", "bbox": {"l": 442.94202000000007, "t": 350.5143100000001, "r": 480.59372, "b": 357.98333999999994, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "doi.org/10.1145/3534678.3539043", "bbox": {"l": 151.51801, "t": 361.47329999999994, "r": 297.40939, "b": 368.94232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "list_item", "bbox": {"l": 134.76401, "t": 371.79773, "r": 480.59296, "b": 412.74448, "coord_origin": "TOPLEFT"}, "confidence": 0.9752162098884583, "cells": [{"id": 37, "text": "11.", "bbox": {"l": 134.76401, "t": 371.79773, "r": 146.03854, "b": 379.86749, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "Prasad, D., Gadpal, A., Kapadni, K., Visave, M., Sultanpure, K.: Cascadetabnet:", "bbox": {"l": 150.4505, "t": 371.79773, "r": 480.58914000000004, "b": 379.86749, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "An approach for end to end table detection and structure recognition from image-", "bbox": {"l": 151.51801, "t": 382.7567399999999, "r": 480.59296, "b": 390.82651, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "based documents. In: Proceedings of the IEEE/CVF conference on computer vision", "bbox": {"l": 151.51801, "t": 393.71573, "r": 480.59293, "b": 401.78549, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "and pattern recognition workshops. pp. 572-573 (2020)", "bbox": {"l": 151.51801, "t": 404.67471, "r": 373.82727, "b": 412.74448, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "list_item", "bbox": {"l": 134.76401, "t": 415.64471, "r": 480.59469999999993, "b": 456.59146, "coord_origin": "TOPLEFT"}, "confidence": 0.9707236886024475, "cells": [{"id": 42, "text": "12.", "bbox": {"l": 134.76401, "t": 415.64471, "r": 145.91106, "b": 423.71448000000004, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Schreiber, S., Agne, S., Wolf, I., Dengel, A., Ahmed, S.: Deepdesrt: Deep learning", "bbox": {"l": 150.27309, "t": 415.64471, "r": 480.5874, "b": 423.71448000000004, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "for detection and structure recognition of tables in document images. In: 2017 14th", "bbox": {"l": 151.51801, "t": 426.60373, "r": 480.59469999999993, "b": 434.67349, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "IAPR international conference on document analysis and recognition (ICDAR).", "bbox": {"l": 151.51801, "t": 437.5627099999999, "r": 480.58844, "b": 445.63248, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "vol. 1, pp. 1162-1167. IEEE (2017)", "bbox": {"l": 151.51801, "t": 448.5217, "r": 292.91455, "b": 456.59146, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "list_item", "bbox": {"l": 134.76401, "t": 459.4917, "r": 480.59372, "b": 500.48328, "coord_origin": "TOPLEFT"}, "confidence": 0.9658119678497314, "cells": [{"id": 47, "text": "13.", "bbox": {"l": 134.76401, "t": 459.4917, "r": 145.7785, "b": 467.56146, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Siddiqui, S.A., Fateh, I.A., Rizvi, S.T.R., Dengel, A., Ahmed, S.: Deeptabstr: Deep", "bbox": {"l": 150.08871, "t": 459.4917, "r": 480.59006, "b": 467.56146, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "learning based table structure recognition. In: 2019 International Conference on", "bbox": {"l": 151.51801, "t": 470.45071, "r": 480.59116, "b": 478.52048, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Document Analysis and Recognition (ICDAR). pp. 1403-1409 (2019).", "bbox": {"l": 151.51801, "t": 481.4097, "r": 439.05963, "b": 489.47946, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "https://", "bbox": {"l": 442.94202000000007, "t": 482.05527, "r": 480.59372, "b": 489.52429, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "doi.org/10.1109/ICDAR.2019.00226", "bbox": {"l": 151.51801, "t": 493.01425, "r": 302.11584, "b": 500.48328, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "list_item", "bbox": {"l": 134.76401, "t": 503.33868, "r": 480.59286000000003, "b": 544.28545, "coord_origin": "TOPLEFT"}, "confidence": 0.972225546836853, "cells": [{"id": 53, "text": "14.", "bbox": {"l": 134.76401, "t": 503.33868, "r": 146.15501, "b": 511.40845, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "Smock, B., Pesala, R., Abraham, R.: PubTables-1M: Towards comprehensive ta-", "bbox": {"l": 150.61252, "t": 503.33868, "r": 480.59088, "b": 511.40845, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "ble extraction from unstructured documents. In: Proceedings of the IEEE/CVF", "bbox": {"l": 151.51801, "t": 514.2977000000001, "r": 480.59286000000003, "b": 522.3674599999999, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Conference on Computer Vision and Pattern Recognition (CVPR). pp. 4634-4642", "bbox": {"l": 151.51801, "t": 525.25668, "r": 480.58838000000003, "b": 533.32645, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "(June 2022)", "bbox": {"l": 151.51801, "t": 536.21568, "r": 199.24704, "b": 544.28545, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "list_item", "bbox": {"l": 134.76401, "t": 547.18568, "r": 480.59583, "b": 610.09528, "coord_origin": "TOPLEFT"}, "confidence": 0.9674034714698792, "cells": [{"id": 58, "text": "15.", "bbox": {"l": 134.76401, "t": 547.18568, "r": 146.16588, "b": 555.25545, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Staar, P.W.J., Dolfi, M., Auer, C., Bekas, C.: Corpus conversion service: A ma-", "bbox": {"l": 150.62764, "t": 547.18568, "r": 480.58734000000004, "b": 555.25545, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "chine learning platform to ingest documents at scale. In: Proceedings of the 24th", "bbox": {"l": 151.51801, "t": 558.14468, "r": 480.58838000000003, "b": 566.2144499999999, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "ACM SIGKDD International Conference on Knowledge Discovery & Data Min-", "bbox": {"l": 151.51801, "t": 569.1036799999999, "r": 480.59109, "b": 577.17345, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "ing. pp. 774-782. KDD \u201918, Association for Computing Machinery, New York, NY,", "bbox": {"l": 151.51801, "t": 580.06268, "r": 480.59195, "b": 588.1324500000001, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "USA (2018).", "bbox": {"l": 151.51801, "t": 591.0216800000001, "r": 200.75787, "b": 599.09145, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "https://doi.org/10.1145/3219819.3219834", "bbox": {"l": 202.916, "t": 591.66727, "r": 386.45911, "b": 599.1362799999999, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": ",", "bbox": {"l": 386.45801, "t": 591.0216800000001, "r": 389.01703, "b": 599.09145, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "https://doi.org/10.", "bbox": {"l": 391.173, "t": 591.66727, "r": 480.59583, "b": 599.1362799999999, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "1145/3219819.3219834", "bbox": {"l": 151.51801, "t": 602.62627, "r": 245.63831, "b": 610.09528, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "list_item", "bbox": {"l": 134.76401, "t": 612.95068, "r": 480.59542999999996, "b": 631.97945, "coord_origin": "TOPLEFT"}, "confidence": 0.9416429996490479, "cells": [{"id": 68, "text": "16.", "bbox": {"l": 134.76401, "t": 612.95068, "r": 146.62019, "b": 621.02045, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "Wang, X.: Tabular Abstraction, Editing, and Formatting. Ph.D. thesis, CAN", "bbox": {"l": 151.25977, "t": 612.95068, "r": 480.59542999999996, "b": 621.02045, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "(1996), aAINN09397", "bbox": {"l": 151.51801, "t": 623.90968, "r": 234.43031, "b": 631.97945, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "list_item", "bbox": {"l": 134.76401, "t": 634.87968, "r": 480.59119, "b": 664.86745, "coord_origin": "TOPLEFT"}, "confidence": 0.9646382331848145, "cells": [{"id": 71, "text": "17.", "bbox": {"l": 134.76401, "t": 634.87968, "r": 146.30539, "b": 642.9494500000001, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "Xue, W., Li, Q., Tao, D.: Res2tim: Reconstruct syntactic structures from table", "bbox": {"l": 150.82175, "t": 634.87968, "r": 480.58731000000006, "b": 642.9494500000001, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "images. In: 2019 International Conference on Document Analysis and Recognition", "bbox": {"l": 151.51801, "t": 645.8386800000001, "r": 480.59119, "b": 653.90845, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "(ICDAR). pp. 749-755. IEEE (2019)", "bbox": {"l": 151.51801, "t": 656.79768, "r": 299.30307, "b": 664.86745, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_header", "id": 13, "page_no": 12, "cluster": {"id": 13, "label": "page_header", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9163166880607605, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Optimized Table Tokenization for Table Structure Recognition"}, {"label": "page_header", "id": 14, "page_no": 12, "cluster": {"id": 14, "label": "page_header", "bbox": {"l": 471.37561, "t": 93.77099999999996, "r": 480.5894799999999, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9061064720153809, "cells": [{"id": 1, "text": "13", "bbox": {"l": 471.37561, "t": 93.77099999999996, "r": 480.5894799999999, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "13"}, {"label": "list_item", "id": 5, "page_no": 12, "cluster": {"id": 5, "label": "list_item", "bbox": {"l": 139.371, "t": 119.67400999999995, "r": 480.59479, "b": 149.66168000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9677112698554993, "cells": [{"id": 2, "text": "5.", "bbox": {"l": 139.371, "t": 119.67400999999995, "r": 146.04857, "b": 127.74370999999985, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Kayal, P., Anand, M., Desai, H., Singh, M.: Tables to latex: structure and content", "bbox": {"l": 150.34157, "t": 119.67400999999995, "r": 480.58826, "b": 127.74370999999985, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "extraction from scientific tables. International Journal on Document Analysis and", "bbox": {"l": 151.51801, "t": 130.63300000000004, "r": 480.59479, "b": 138.70270000000005, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Recognition (IJDAR) pp. 1-10 (2022)", "bbox": {"l": 151.51801, "t": 141.59198000000004, "r": 304.04364, "b": 149.66168000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5. Kayal, P., Anand, M., Desai, H., Singh, M.: Tables to latex: structure and content extraction from scientific tables. International Journal on Document Analysis and Recognition (IJDAR) pp. 1-10 (2022)"}, {"label": "list_item", "id": 1, "page_no": 12, "cluster": {"id": 1, "label": "list_item", "bbox": {"l": 139.371, "t": 152.56195000000002, "r": 480.59286000000003, "b": 193.50860999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.973045289516449, "cells": [{"id": 6, "text": "6.", "bbox": {"l": 139.371, "t": 152.56195000000002, "r": 145.93991, "b": 160.63165000000004, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Lee, E., Kwon, J., Yang, H., Park, J., Lee, S., Koo, H.I., Cho, N.I.: Table structure", "bbox": {"l": 150.16298, "t": 152.56195000000002, "r": 480.59015, "b": 160.63165000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "recognition based on grid shape graph. In: 2022 Asia-Pacific Signal and Information", "bbox": {"l": 151.51801, "t": 163.52094, "r": 480.5903, "b": 171.59064, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Processing Association Annual Summit and Conference (APSIPA ASC). pp. 1868-", "bbox": {"l": 151.51801, "t": 174.47992, "r": 480.59286000000003, "b": 182.54962, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "1873. IEEE (2022)", "bbox": {"l": 151.51801, "t": 185.4389, "r": 226.37399, "b": 193.50860999999998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "6. Lee, E., Kwon, J., Yang, H., Park, J., Lee, S., Koo, H.I., Cho, N.I.: Table structure recognition based on grid shape graph. In: 2022 Asia-Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC). pp. 18681873. IEEE (2022)"}, {"label": "list_item", "id": 10, "page_no": 12, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 139.371, "t": 196.40886999999998, "r": 480.59012, "b": 215.43755999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9582491517066956, "cells": [{"id": 11, "text": "7.", "bbox": {"l": 139.371, "t": 196.40886999999998, "r": 146.31418, "b": 204.47857999999997, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Li, M., Cui, L., Huang, S., Wei, F., Zhou, M., Li, Z.: Tablebank: A benchmark", "bbox": {"l": 150.77789, "t": 196.40886999999998, "r": 480.59012, "b": 204.47857999999997, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "dataset for table detection and recognition (2019)", "bbox": {"l": 151.51801, "t": 207.36785999999995, "r": 352.01746, "b": 215.43755999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "7. Li, M., Cui, L., Huang, S., Wei, F., Zhou, M., Li, Z.: Tablebank: A benchmark dataset for table detection and recognition (2019)"}, {"label": "list_item", "id": 4, "page_no": 12, "cluster": {"id": 4, "label": "list_item", "bbox": {"l": 139.371, "t": 218.33887000000004, "r": 480.59473, "b": 270.28839000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.967814564704895, "cells": [{"id": 14, "text": "8.", "bbox": {"l": 139.371, "t": 218.33887000000004, "r": 146.37106, "b": 226.40857000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Livathinos, N., Berrospi, C., Lysak, M., Kuropiatnyk, V., Nassar, A., Carvalho,", "bbox": {"l": 150.87132, "t": 218.33887000000004, "r": 480.58731000000006, "b": 226.40857000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "A., Dolfi, M., Auer, C., Dinkla, K., Staar, P.: Robust pdf document conversion", "bbox": {"l": 151.51801, "t": 229.29785000000004, "r": 480.59020999999996, "b": 237.36755000000005, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "using recurrent neural networks. Proceedings of the AAAI Conference on Artificial", "bbox": {"l": 151.51801, "t": 240.25684, "r": 480.59473, "b": 248.32654000000002, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Intelligence", "bbox": {"l": 151.51801, "t": 251.21582, "r": 197.08617, "b": 259.28552, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "35", "bbox": {"l": 199.40001, "t": 251.15301999999997, "r": 210.00726, "b": 259.07935, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "(17), 15137-15145 (May 2021),", "bbox": {"l": 210.007, "t": 251.21582, "r": 332.37683, "b": 259.28552, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "https://ojs.aaai.org/index.php/", "bbox": {"l": 334.69901, "t": 251.86139000000003, "r": 480.59039000000007, "b": 259.33038, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "AAAI/article/view/17777", "bbox": {"l": 151.51801, "t": 262.8194, "r": 259.75769, "b": 270.28839000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "8. Livathinos, N., Berrospi, C., Lysak, M., Kuropiatnyk, V., Nassar, A., Carvalho, A., Dolfi, M., Auer, C., Dinkla, K., Staar, P.: Robust pdf document conversion using recurrent neural networks. Proceedings of the AAAI Conference on Artificial Intelligence 35 (17), 15137-15145 (May 2021), https://ojs.aaai.org/index.php/ AAAI/article/view/17777"}, {"label": "list_item", "id": 11, "page_no": 12, "cluster": {"id": 11, "label": "list_item", "bbox": {"l": 139.371, "t": 273.14484000000004, "r": 480.59387000000004, "b": 303.13254, "coord_origin": "TOPLEFT"}, "confidence": 0.9557179808616638, "cells": [{"id": 23, "text": "9.", "bbox": {"l": 139.371, "t": 273.14484000000004, "r": 146.14218, "b": 281.21457, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "Nassar, A., Livathinos, N., Lysak, M., Staar, P.: Tableformer: Table structure un-", "bbox": {"l": 150.49533, "t": 273.14484000000004, "r": 480.5881999999999, "b": 281.21457, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "derstanding with transformers. In: Proceedings of the IEEE/CVF Conference on", "bbox": {"l": 151.51801, "t": 284.10379, "r": 480.59387000000004, "b": 292.17355, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "Computer Vision and Pattern Recognition (CVPR). pp. 4614-4623 (June 2022)", "bbox": {"l": 151.51801, "t": 295.06277, "r": 473.44308000000007, "b": 303.13254, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "9. Nassar, A., Livathinos, N., Lysak, M., Staar, P.: Tableformer: Table structure understanding with transformers. In: Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). pp. 4614-4623 (June 2022)"}, {"label": "list_item", "id": 9, "page_no": 12, "cluster": {"id": 9, "label": "list_item", "bbox": {"l": 134.76401, "t": 306.03277999999995, "r": 480.59372, "b": 368.94232, "coord_origin": "TOPLEFT"}, "confidence": 0.9639304876327515, "cells": [{"id": 27, "text": "10.", "bbox": {"l": 134.76401, "t": 306.03277999999995, "r": 146.49922, "b": 314.10254000000003, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Pfitzmann, B., Auer, C., Dolfi, M., Nassar, A.S., Staar, P.W.J.: Doclaynet: A", "bbox": {"l": 151.09138, "t": 306.03277999999995, "r": 480.58905, "b": 314.10254000000003, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "large human-annotated dataset for document-layout segmentation. In: Zhang, A.,", "bbox": {"l": 151.51801, "t": 316.99179, "r": 480.59015, "b": 325.06155, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Rangwala, H. (eds.) KDD \u201922: The 28th ACM SIGKDD Conference on Knowledge", "bbox": {"l": 151.51801, "t": 327.95078, "r": 480.59113, "b": 336.02054, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Discovery and Data Mining, Washington, DC, USA, August 14 - 18, 2022. pp.", "bbox": {"l": 151.51801, "t": 338.90976, "r": 480.59113, "b": 346.97952, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "3743-3751. ACM (2022).", "bbox": {"l": 151.51801, "t": 349.86874, "r": 251.14098999999996, "b": 357.93851, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "https://doi.org/10.1145/3534678.3539043", "bbox": {"l": 253.99001, "t": 350.5143100000001, "r": 437.53311, "b": 357.98333999999994, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": ",", "bbox": {"l": 437.53201, "t": 349.86874, "r": 440.09102999999993, "b": 357.93851, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "https://", "bbox": {"l": 442.94202000000007, "t": 350.5143100000001, "r": 480.59372, "b": 357.98333999999994, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "doi.org/10.1145/3534678.3539043", "bbox": {"l": 151.51801, "t": 361.47329999999994, "r": 297.40939, "b": 368.94232, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "10. Pfitzmann, B., Auer, C., Dolfi, M., Nassar, A.S., Staar, P.W.J.: Doclaynet: A large human-annotated dataset for document-layout segmentation. In: Zhang, A., Rangwala, H. (eds.) KDD '22: The 28th ACM SIGKDD Conference on Knowledge Discovery and Data Mining, Washington, DC, USA, August 14 - 18, 2022. pp. 3743-3751. ACM (2022). https://doi.org/10.1145/3534678.3539043 , https:// doi.org/10.1145/3534678.3539043"}, {"label": "list_item", "id": 0, "page_no": 12, "cluster": {"id": 0, "label": "list_item", "bbox": {"l": 134.76401, "t": 371.79773, "r": 480.59296, "b": 412.74448, "coord_origin": "TOPLEFT"}, "confidence": 0.9752162098884583, "cells": [{"id": 37, "text": "11.", "bbox": {"l": 134.76401, "t": 371.79773, "r": 146.03854, "b": 379.86749, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "Prasad, D., Gadpal, A., Kapadni, K., Visave, M., Sultanpure, K.: Cascadetabnet:", "bbox": {"l": 150.4505, "t": 371.79773, "r": 480.58914000000004, "b": 379.86749, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "An approach for end to end table detection and structure recognition from image-", "bbox": {"l": 151.51801, "t": 382.7567399999999, "r": 480.59296, "b": 390.82651, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "based documents. In: Proceedings of the IEEE/CVF conference on computer vision", "bbox": {"l": 151.51801, "t": 393.71573, "r": 480.59293, "b": 401.78549, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "and pattern recognition workshops. pp. 572-573 (2020)", "bbox": {"l": 151.51801, "t": 404.67471, "r": 373.82727, "b": 412.74448, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "11. Prasad, D., Gadpal, A., Kapadni, K., Visave, M., Sultanpure, K.: Cascadetabnet: An approach for end to end table detection and structure recognition from imagebased documents. In: Proceedings of the IEEE/CVF conference on computer vision and pattern recognition workshops. pp. 572-573 (2020)"}, {"label": "list_item", "id": 3, "page_no": 12, "cluster": {"id": 3, "label": "list_item", "bbox": {"l": 134.76401, "t": 415.64471, "r": 480.59469999999993, "b": 456.59146, "coord_origin": "TOPLEFT"}, "confidence": 0.9707236886024475, "cells": [{"id": 42, "text": "12.", "bbox": {"l": 134.76401, "t": 415.64471, "r": 145.91106, "b": 423.71448000000004, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Schreiber, S., Agne, S., Wolf, I., Dengel, A., Ahmed, S.: Deepdesrt: Deep learning", "bbox": {"l": 150.27309, "t": 415.64471, "r": 480.5874, "b": 423.71448000000004, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "for detection and structure recognition of tables in document images. In: 2017 14th", "bbox": {"l": 151.51801, "t": 426.60373, "r": 480.59469999999993, "b": 434.67349, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "IAPR international conference on document analysis and recognition (ICDAR).", "bbox": {"l": 151.51801, "t": 437.5627099999999, "r": 480.58844, "b": 445.63248, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "vol. 1, pp. 1162-1167. IEEE (2017)", "bbox": {"l": 151.51801, "t": 448.5217, "r": 292.91455, "b": 456.59146, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "12. Schreiber, S., Agne, S., Wolf, I., Dengel, A., Ahmed, S.: Deepdesrt: Deep learning for detection and structure recognition of tables in document images. In: 2017 14th IAPR international conference on document analysis and recognition (ICDAR). vol. 1, pp. 1162-1167. IEEE (2017)"}, {"label": "list_item", "id": 7, "page_no": 12, "cluster": {"id": 7, "label": "list_item", "bbox": {"l": 134.76401, "t": 459.4917, "r": 480.59372, "b": 500.48328, "coord_origin": "TOPLEFT"}, "confidence": 0.9658119678497314, "cells": [{"id": 47, "text": "13.", "bbox": {"l": 134.76401, "t": 459.4917, "r": 145.7785, "b": 467.56146, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Siddiqui, S.A., Fateh, I.A., Rizvi, S.T.R., Dengel, A., Ahmed, S.: Deeptabstr: Deep", "bbox": {"l": 150.08871, "t": 459.4917, "r": 480.59006, "b": 467.56146, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "learning based table structure recognition. In: 2019 International Conference on", "bbox": {"l": 151.51801, "t": 470.45071, "r": 480.59116, "b": 478.52048, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Document Analysis and Recognition (ICDAR). pp. 1403-1409 (2019).", "bbox": {"l": 151.51801, "t": 481.4097, "r": 439.05963, "b": 489.47946, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "https://", "bbox": {"l": 442.94202000000007, "t": 482.05527, "r": 480.59372, "b": 489.52429, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "doi.org/10.1109/ICDAR.2019.00226", "bbox": {"l": 151.51801, "t": 493.01425, "r": 302.11584, "b": 500.48328, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "13. Siddiqui, S.A., Fateh, I.A., Rizvi, S.T.R., Dengel, A., Ahmed, S.: Deeptabstr: Deep learning based table structure recognition. In: 2019 International Conference on Document Analysis and Recognition (ICDAR). pp. 1403-1409 (2019). https:// doi.org/10.1109/ICDAR.2019.00226"}, {"label": "list_item", "id": 2, "page_no": 12, "cluster": {"id": 2, "label": "list_item", "bbox": {"l": 134.76401, "t": 503.33868, "r": 480.59286000000003, "b": 544.28545, "coord_origin": "TOPLEFT"}, "confidence": 0.972225546836853, "cells": [{"id": 53, "text": "14.", "bbox": {"l": 134.76401, "t": 503.33868, "r": 146.15501, "b": 511.40845, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "Smock, B., Pesala, R., Abraham, R.: PubTables-1M: Towards comprehensive ta-", "bbox": {"l": 150.61252, "t": 503.33868, "r": 480.59088, "b": 511.40845, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "ble extraction from unstructured documents. In: Proceedings of the IEEE/CVF", "bbox": {"l": 151.51801, "t": 514.2977000000001, "r": 480.59286000000003, "b": 522.3674599999999, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Conference on Computer Vision and Pattern Recognition (CVPR). pp. 4634-4642", "bbox": {"l": 151.51801, "t": 525.25668, "r": 480.58838000000003, "b": 533.32645, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "(June 2022)", "bbox": {"l": 151.51801, "t": 536.21568, "r": 199.24704, "b": 544.28545, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "14. Smock, B., Pesala, R., Abraham, R.: PubTables-1M: Towards comprehensive table extraction from unstructured documents. In: Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). pp. 4634-4642 (June 2022)"}, {"label": "list_item", "id": 6, "page_no": 12, "cluster": {"id": 6, "label": "list_item", "bbox": {"l": 134.76401, "t": 547.18568, "r": 480.59583, "b": 610.09528, "coord_origin": "TOPLEFT"}, "confidence": 0.9674034714698792, "cells": [{"id": 58, "text": "15.", "bbox": {"l": 134.76401, "t": 547.18568, "r": 146.16588, "b": 555.25545, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Staar, P.W.J., Dolfi, M., Auer, C., Bekas, C.: Corpus conversion service: A ma-", "bbox": {"l": 150.62764, "t": 547.18568, "r": 480.58734000000004, "b": 555.25545, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "chine learning platform to ingest documents at scale. In: Proceedings of the 24th", "bbox": {"l": 151.51801, "t": 558.14468, "r": 480.58838000000003, "b": 566.2144499999999, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "ACM SIGKDD International Conference on Knowledge Discovery & Data Min-", "bbox": {"l": 151.51801, "t": 569.1036799999999, "r": 480.59109, "b": 577.17345, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "ing. pp. 774-782. KDD \u201918, Association for Computing Machinery, New York, NY,", "bbox": {"l": 151.51801, "t": 580.06268, "r": 480.59195, "b": 588.1324500000001, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "USA (2018).", "bbox": {"l": 151.51801, "t": 591.0216800000001, "r": 200.75787, "b": 599.09145, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "https://doi.org/10.1145/3219819.3219834", "bbox": {"l": 202.916, "t": 591.66727, "r": 386.45911, "b": 599.1362799999999, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": ",", "bbox": {"l": 386.45801, "t": 591.0216800000001, "r": 389.01703, "b": 599.09145, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "https://doi.org/10.", "bbox": {"l": 391.173, "t": 591.66727, "r": 480.59583, "b": 599.1362799999999, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "1145/3219819.3219834", "bbox": {"l": 151.51801, "t": 602.62627, "r": 245.63831, "b": 610.09528, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "15. Staar, P.W.J., Dolfi, M., Auer, C., Bekas, C.: Corpus conversion service: A machine learning platform to ingest documents at scale. In: Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining. pp. 774-782. KDD '18, Association for Computing Machinery, New York, NY, USA (2018). https://doi.org/10.1145/3219819.3219834 , https://doi.org/10. 1145/3219819.3219834"}, {"label": "list_item", "id": 12, "page_no": 12, "cluster": {"id": 12, "label": "list_item", "bbox": {"l": 134.76401, "t": 612.95068, "r": 480.59542999999996, "b": 631.97945, "coord_origin": "TOPLEFT"}, "confidence": 0.9416429996490479, "cells": [{"id": 68, "text": "16.", "bbox": {"l": 134.76401, "t": 612.95068, "r": 146.62019, "b": 621.02045, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "Wang, X.: Tabular Abstraction, Editing, and Formatting. Ph.D. thesis, CAN", "bbox": {"l": 151.25977, "t": 612.95068, "r": 480.59542999999996, "b": 621.02045, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "(1996), aAINN09397", "bbox": {"l": 151.51801, "t": 623.90968, "r": 234.43031, "b": 631.97945, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "16. Wang, X.: Tabular Abstraction, Editing, and Formatting. Ph.D. thesis, CAN (1996), aAINN09397"}, {"label": "list_item", "id": 8, "page_no": 12, "cluster": {"id": 8, "label": "list_item", "bbox": {"l": 134.76401, "t": 634.87968, "r": 480.59119, "b": 664.86745, "coord_origin": "TOPLEFT"}, "confidence": 0.9646382331848145, "cells": [{"id": 71, "text": "17.", "bbox": {"l": 134.76401, "t": 634.87968, "r": 146.30539, "b": 642.9494500000001, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "Xue, W., Li, Q., Tao, D.: Res2tim: Reconstruct syntactic structures from table", "bbox": {"l": 150.82175, "t": 634.87968, "r": 480.58731000000006, "b": 642.9494500000001, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "images. In: 2019 International Conference on Document Analysis and Recognition", "bbox": {"l": 151.51801, "t": 645.8386800000001, "r": 480.59119, "b": 653.90845, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "(ICDAR). pp. 749-755. IEEE (2019)", "bbox": {"l": 151.51801, "t": 656.79768, "r": 299.30307, "b": 664.86745, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "17. Xue, W., Li, Q., Tao, D.: Res2tim: Reconstruct syntactic structures from table images. In: 2019 International Conference on Document Analysis and Recognition (ICDAR). pp. 749-755. IEEE (2019)"}], "body": [{"label": "list_item", "id": 5, "page_no": 12, "cluster": {"id": 5, "label": "list_item", "bbox": {"l": 139.371, "t": 119.67400999999995, "r": 480.59479, "b": 149.66168000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9677112698554993, "cells": [{"id": 2, "text": "5.", "bbox": {"l": 139.371, "t": 119.67400999999995, "r": 146.04857, "b": 127.74370999999985, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Kayal, P., Anand, M., Desai, H., Singh, M.: Tables to latex: structure and content", "bbox": {"l": 150.34157, "t": 119.67400999999995, "r": 480.58826, "b": 127.74370999999985, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "extraction from scientific tables. International Journal on Document Analysis and", "bbox": {"l": 151.51801, "t": 130.63300000000004, "r": 480.59479, "b": 138.70270000000005, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Recognition (IJDAR) pp. 1-10 (2022)", "bbox": {"l": 151.51801, "t": 141.59198000000004, "r": 304.04364, "b": 149.66168000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5. Kayal, P., Anand, M., Desai, H., Singh, M.: Tables to latex: structure and content extraction from scientific tables. International Journal on Document Analysis and Recognition (IJDAR) pp. 1-10 (2022)"}, {"label": "list_item", "id": 1, "page_no": 12, "cluster": {"id": 1, "label": "list_item", "bbox": {"l": 139.371, "t": 152.56195000000002, "r": 480.59286000000003, "b": 193.50860999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.973045289516449, "cells": [{"id": 6, "text": "6.", "bbox": {"l": 139.371, "t": 152.56195000000002, "r": 145.93991, "b": 160.63165000000004, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Lee, E., Kwon, J., Yang, H., Park, J., Lee, S., Koo, H.I., Cho, N.I.: Table structure", "bbox": {"l": 150.16298, "t": 152.56195000000002, "r": 480.59015, "b": 160.63165000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "recognition based on grid shape graph. In: 2022 Asia-Pacific Signal and Information", "bbox": {"l": 151.51801, "t": 163.52094, "r": 480.5903, "b": 171.59064, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Processing Association Annual Summit and Conference (APSIPA ASC). pp. 1868-", "bbox": {"l": 151.51801, "t": 174.47992, "r": 480.59286000000003, "b": 182.54962, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "1873. IEEE (2022)", "bbox": {"l": 151.51801, "t": 185.4389, "r": 226.37399, "b": 193.50860999999998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "6. Lee, E., Kwon, J., Yang, H., Park, J., Lee, S., Koo, H.I., Cho, N.I.: Table structure recognition based on grid shape graph. In: 2022 Asia-Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC). pp. 18681873. IEEE (2022)"}, {"label": "list_item", "id": 10, "page_no": 12, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 139.371, "t": 196.40886999999998, "r": 480.59012, "b": 215.43755999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9582491517066956, "cells": [{"id": 11, "text": "7.", "bbox": {"l": 139.371, "t": 196.40886999999998, "r": 146.31418, "b": 204.47857999999997, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Li, M., Cui, L., Huang, S., Wei, F., Zhou, M., Li, Z.: Tablebank: A benchmark", "bbox": {"l": 150.77789, "t": 196.40886999999998, "r": 480.59012, "b": 204.47857999999997, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "dataset for table detection and recognition (2019)", "bbox": {"l": 151.51801, "t": 207.36785999999995, "r": 352.01746, "b": 215.43755999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "7. Li, M., Cui, L., Huang, S., Wei, F., Zhou, M., Li, Z.: Tablebank: A benchmark dataset for table detection and recognition (2019)"}, {"label": "list_item", "id": 4, "page_no": 12, "cluster": {"id": 4, "label": "list_item", "bbox": {"l": 139.371, "t": 218.33887000000004, "r": 480.59473, "b": 270.28839000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.967814564704895, "cells": [{"id": 14, "text": "8.", "bbox": {"l": 139.371, "t": 218.33887000000004, "r": 146.37106, "b": 226.40857000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Livathinos, N., Berrospi, C., Lysak, M., Kuropiatnyk, V., Nassar, A., Carvalho,", "bbox": {"l": 150.87132, "t": 218.33887000000004, "r": 480.58731000000006, "b": 226.40857000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "A., Dolfi, M., Auer, C., Dinkla, K., Staar, P.: Robust pdf document conversion", "bbox": {"l": 151.51801, "t": 229.29785000000004, "r": 480.59020999999996, "b": 237.36755000000005, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "using recurrent neural networks. Proceedings of the AAAI Conference on Artificial", "bbox": {"l": 151.51801, "t": 240.25684, "r": 480.59473, "b": 248.32654000000002, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Intelligence", "bbox": {"l": 151.51801, "t": 251.21582, "r": 197.08617, "b": 259.28552, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "35", "bbox": {"l": 199.40001, "t": 251.15301999999997, "r": 210.00726, "b": 259.07935, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "(17), 15137-15145 (May 2021),", "bbox": {"l": 210.007, "t": 251.21582, "r": 332.37683, "b": 259.28552, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "https://ojs.aaai.org/index.php/", "bbox": {"l": 334.69901, "t": 251.86139000000003, "r": 480.59039000000007, "b": 259.33038, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "AAAI/article/view/17777", "bbox": {"l": 151.51801, "t": 262.8194, "r": 259.75769, "b": 270.28839000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "8. Livathinos, N., Berrospi, C., Lysak, M., Kuropiatnyk, V., Nassar, A., Carvalho, A., Dolfi, M., Auer, C., Dinkla, K., Staar, P.: Robust pdf document conversion using recurrent neural networks. Proceedings of the AAAI Conference on Artificial Intelligence 35 (17), 15137-15145 (May 2021), https://ojs.aaai.org/index.php/ AAAI/article/view/17777"}, {"label": "list_item", "id": 11, "page_no": 12, "cluster": {"id": 11, "label": "list_item", "bbox": {"l": 139.371, "t": 273.14484000000004, "r": 480.59387000000004, "b": 303.13254, "coord_origin": "TOPLEFT"}, "confidence": 0.9557179808616638, "cells": [{"id": 23, "text": "9.", "bbox": {"l": 139.371, "t": 273.14484000000004, "r": 146.14218, "b": 281.21457, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "Nassar, A., Livathinos, N., Lysak, M., Staar, P.: Tableformer: Table structure un-", "bbox": {"l": 150.49533, "t": 273.14484000000004, "r": 480.5881999999999, "b": 281.21457, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "derstanding with transformers. In: Proceedings of the IEEE/CVF Conference on", "bbox": {"l": 151.51801, "t": 284.10379, "r": 480.59387000000004, "b": 292.17355, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "Computer Vision and Pattern Recognition (CVPR). pp. 4614-4623 (June 2022)", "bbox": {"l": 151.51801, "t": 295.06277, "r": 473.44308000000007, "b": 303.13254, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "9. Nassar, A., Livathinos, N., Lysak, M., Staar, P.: Tableformer: Table structure understanding with transformers. In: Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). pp. 4614-4623 (June 2022)"}, {"label": "list_item", "id": 9, "page_no": 12, "cluster": {"id": 9, "label": "list_item", "bbox": {"l": 134.76401, "t": 306.03277999999995, "r": 480.59372, "b": 368.94232, "coord_origin": "TOPLEFT"}, "confidence": 0.9639304876327515, "cells": [{"id": 27, "text": "10.", "bbox": {"l": 134.76401, "t": 306.03277999999995, "r": 146.49922, "b": 314.10254000000003, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Pfitzmann, B., Auer, C., Dolfi, M., Nassar, A.S., Staar, P.W.J.: Doclaynet: A", "bbox": {"l": 151.09138, "t": 306.03277999999995, "r": 480.58905, "b": 314.10254000000003, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "large human-annotated dataset for document-layout segmentation. In: Zhang, A.,", "bbox": {"l": 151.51801, "t": 316.99179, "r": 480.59015, "b": 325.06155, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Rangwala, H. (eds.) KDD \u201922: The 28th ACM SIGKDD Conference on Knowledge", "bbox": {"l": 151.51801, "t": 327.95078, "r": 480.59113, "b": 336.02054, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Discovery and Data Mining, Washington, DC, USA, August 14 - 18, 2022. pp.", "bbox": {"l": 151.51801, "t": 338.90976, "r": 480.59113, "b": 346.97952, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "3743-3751. ACM (2022).", "bbox": {"l": 151.51801, "t": 349.86874, "r": 251.14098999999996, "b": 357.93851, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "https://doi.org/10.1145/3534678.3539043", "bbox": {"l": 253.99001, "t": 350.5143100000001, "r": 437.53311, "b": 357.98333999999994, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": ",", "bbox": {"l": 437.53201, "t": 349.86874, "r": 440.09102999999993, "b": 357.93851, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "https://", "bbox": {"l": 442.94202000000007, "t": 350.5143100000001, "r": 480.59372, "b": 357.98333999999994, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "doi.org/10.1145/3534678.3539043", "bbox": {"l": 151.51801, "t": 361.47329999999994, "r": 297.40939, "b": 368.94232, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "10. Pfitzmann, B., Auer, C., Dolfi, M., Nassar, A.S., Staar, P.W.J.: Doclaynet: A large human-annotated dataset for document-layout segmentation. In: Zhang, A., Rangwala, H. (eds.) KDD '22: The 28th ACM SIGKDD Conference on Knowledge Discovery and Data Mining, Washington, DC, USA, August 14 - 18, 2022. pp. 3743-3751. ACM (2022). https://doi.org/10.1145/3534678.3539043 , https:// doi.org/10.1145/3534678.3539043"}, {"label": "list_item", "id": 0, "page_no": 12, "cluster": {"id": 0, "label": "list_item", "bbox": {"l": 134.76401, "t": 371.79773, "r": 480.59296, "b": 412.74448, "coord_origin": "TOPLEFT"}, "confidence": 0.9752162098884583, "cells": [{"id": 37, "text": "11.", "bbox": {"l": 134.76401, "t": 371.79773, "r": 146.03854, "b": 379.86749, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "Prasad, D., Gadpal, A., Kapadni, K., Visave, M., Sultanpure, K.: Cascadetabnet:", "bbox": {"l": 150.4505, "t": 371.79773, "r": 480.58914000000004, "b": 379.86749, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "An approach for end to end table detection and structure recognition from image-", "bbox": {"l": 151.51801, "t": 382.7567399999999, "r": 480.59296, "b": 390.82651, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "based documents. In: Proceedings of the IEEE/CVF conference on computer vision", "bbox": {"l": 151.51801, "t": 393.71573, "r": 480.59293, "b": 401.78549, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "and pattern recognition workshops. pp. 572-573 (2020)", "bbox": {"l": 151.51801, "t": 404.67471, "r": 373.82727, "b": 412.74448, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "11. Prasad, D., Gadpal, A., Kapadni, K., Visave, M., Sultanpure, K.: Cascadetabnet: An approach for end to end table detection and structure recognition from imagebased documents. In: Proceedings of the IEEE/CVF conference on computer vision and pattern recognition workshops. pp. 572-573 (2020)"}, {"label": "list_item", "id": 3, "page_no": 12, "cluster": {"id": 3, "label": "list_item", "bbox": {"l": 134.76401, "t": 415.64471, "r": 480.59469999999993, "b": 456.59146, "coord_origin": "TOPLEFT"}, "confidence": 0.9707236886024475, "cells": [{"id": 42, "text": "12.", "bbox": {"l": 134.76401, "t": 415.64471, "r": 145.91106, "b": 423.71448000000004, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Schreiber, S., Agne, S., Wolf, I., Dengel, A., Ahmed, S.: Deepdesrt: Deep learning", "bbox": {"l": 150.27309, "t": 415.64471, "r": 480.5874, "b": 423.71448000000004, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "for detection and structure recognition of tables in document images. In: 2017 14th", "bbox": {"l": 151.51801, "t": 426.60373, "r": 480.59469999999993, "b": 434.67349, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "IAPR international conference on document analysis and recognition (ICDAR).", "bbox": {"l": 151.51801, "t": 437.5627099999999, "r": 480.58844, "b": 445.63248, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "vol. 1, pp. 1162-1167. IEEE (2017)", "bbox": {"l": 151.51801, "t": 448.5217, "r": 292.91455, "b": 456.59146, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "12. Schreiber, S., Agne, S., Wolf, I., Dengel, A., Ahmed, S.: Deepdesrt: Deep learning for detection and structure recognition of tables in document images. In: 2017 14th IAPR international conference on document analysis and recognition (ICDAR). vol. 1, pp. 1162-1167. IEEE (2017)"}, {"label": "list_item", "id": 7, "page_no": 12, "cluster": {"id": 7, "label": "list_item", "bbox": {"l": 134.76401, "t": 459.4917, "r": 480.59372, "b": 500.48328, "coord_origin": "TOPLEFT"}, "confidence": 0.9658119678497314, "cells": [{"id": 47, "text": "13.", "bbox": {"l": 134.76401, "t": 459.4917, "r": 145.7785, "b": 467.56146, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Siddiqui, S.A., Fateh, I.A., Rizvi, S.T.R., Dengel, A., Ahmed, S.: Deeptabstr: Deep", "bbox": {"l": 150.08871, "t": 459.4917, "r": 480.59006, "b": 467.56146, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "learning based table structure recognition. In: 2019 International Conference on", "bbox": {"l": 151.51801, "t": 470.45071, "r": 480.59116, "b": 478.52048, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Document Analysis and Recognition (ICDAR). pp. 1403-1409 (2019).", "bbox": {"l": 151.51801, "t": 481.4097, "r": 439.05963, "b": 489.47946, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "https://", "bbox": {"l": 442.94202000000007, "t": 482.05527, "r": 480.59372, "b": 489.52429, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "doi.org/10.1109/ICDAR.2019.00226", "bbox": {"l": 151.51801, "t": 493.01425, "r": 302.11584, "b": 500.48328, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "13. Siddiqui, S.A., Fateh, I.A., Rizvi, S.T.R., Dengel, A., Ahmed, S.: Deeptabstr: Deep learning based table structure recognition. In: 2019 International Conference on Document Analysis and Recognition (ICDAR). pp. 1403-1409 (2019). https:// doi.org/10.1109/ICDAR.2019.00226"}, {"label": "list_item", "id": 2, "page_no": 12, "cluster": {"id": 2, "label": "list_item", "bbox": {"l": 134.76401, "t": 503.33868, "r": 480.59286000000003, "b": 544.28545, "coord_origin": "TOPLEFT"}, "confidence": 0.972225546836853, "cells": [{"id": 53, "text": "14.", "bbox": {"l": 134.76401, "t": 503.33868, "r": 146.15501, "b": 511.40845, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "Smock, B., Pesala, R., Abraham, R.: PubTables-1M: Towards comprehensive ta-", "bbox": {"l": 150.61252, "t": 503.33868, "r": 480.59088, "b": 511.40845, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "ble extraction from unstructured documents. In: Proceedings of the IEEE/CVF", "bbox": {"l": 151.51801, "t": 514.2977000000001, "r": 480.59286000000003, "b": 522.3674599999999, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Conference on Computer Vision and Pattern Recognition (CVPR). pp. 4634-4642", "bbox": {"l": 151.51801, "t": 525.25668, "r": 480.58838000000003, "b": 533.32645, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "(June 2022)", "bbox": {"l": 151.51801, "t": 536.21568, "r": 199.24704, "b": 544.28545, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "14. Smock, B., Pesala, R., Abraham, R.: PubTables-1M: Towards comprehensive table extraction from unstructured documents. In: Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). pp. 4634-4642 (June 2022)"}, {"label": "list_item", "id": 6, "page_no": 12, "cluster": {"id": 6, "label": "list_item", "bbox": {"l": 134.76401, "t": 547.18568, "r": 480.59583, "b": 610.09528, "coord_origin": "TOPLEFT"}, "confidence": 0.9674034714698792, "cells": [{"id": 58, "text": "15.", "bbox": {"l": 134.76401, "t": 547.18568, "r": 146.16588, "b": 555.25545, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Staar, P.W.J., Dolfi, M., Auer, C., Bekas, C.: Corpus conversion service: A ma-", "bbox": {"l": 150.62764, "t": 547.18568, "r": 480.58734000000004, "b": 555.25545, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "chine learning platform to ingest documents at scale. In: Proceedings of the 24th", "bbox": {"l": 151.51801, "t": 558.14468, "r": 480.58838000000003, "b": 566.2144499999999, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "ACM SIGKDD International Conference on Knowledge Discovery & Data Min-", "bbox": {"l": 151.51801, "t": 569.1036799999999, "r": 480.59109, "b": 577.17345, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "ing. pp. 774-782. KDD \u201918, Association for Computing Machinery, New York, NY,", "bbox": {"l": 151.51801, "t": 580.06268, "r": 480.59195, "b": 588.1324500000001, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "USA (2018).", "bbox": {"l": 151.51801, "t": 591.0216800000001, "r": 200.75787, "b": 599.09145, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "https://doi.org/10.1145/3219819.3219834", "bbox": {"l": 202.916, "t": 591.66727, "r": 386.45911, "b": 599.1362799999999, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": ",", "bbox": {"l": 386.45801, "t": 591.0216800000001, "r": 389.01703, "b": 599.09145, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "https://doi.org/10.", "bbox": {"l": 391.173, "t": 591.66727, "r": 480.59583, "b": 599.1362799999999, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "1145/3219819.3219834", "bbox": {"l": 151.51801, "t": 602.62627, "r": 245.63831, "b": 610.09528, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "15. Staar, P.W.J., Dolfi, M., Auer, C., Bekas, C.: Corpus conversion service: A machine learning platform to ingest documents at scale. In: Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining. pp. 774-782. KDD '18, Association for Computing Machinery, New York, NY, USA (2018). https://doi.org/10.1145/3219819.3219834 , https://doi.org/10. 1145/3219819.3219834"}, {"label": "list_item", "id": 12, "page_no": 12, "cluster": {"id": 12, "label": "list_item", "bbox": {"l": 134.76401, "t": 612.95068, "r": 480.59542999999996, "b": 631.97945, "coord_origin": "TOPLEFT"}, "confidence": 0.9416429996490479, "cells": [{"id": 68, "text": "16.", "bbox": {"l": 134.76401, "t": 612.95068, "r": 146.62019, "b": 621.02045, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "Wang, X.: Tabular Abstraction, Editing, and Formatting. Ph.D. thesis, CAN", "bbox": {"l": 151.25977, "t": 612.95068, "r": 480.59542999999996, "b": 621.02045, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "(1996), aAINN09397", "bbox": {"l": 151.51801, "t": 623.90968, "r": 234.43031, "b": 631.97945, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "16. Wang, X.: Tabular Abstraction, Editing, and Formatting. Ph.D. thesis, CAN (1996), aAINN09397"}, {"label": "list_item", "id": 8, "page_no": 12, "cluster": {"id": 8, "label": "list_item", "bbox": {"l": 134.76401, "t": 634.87968, "r": 480.59119, "b": 664.86745, "coord_origin": "TOPLEFT"}, "confidence": 0.9646382331848145, "cells": [{"id": 71, "text": "17.", "bbox": {"l": 134.76401, "t": 634.87968, "r": 146.30539, "b": 642.9494500000001, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "Xue, W., Li, Q., Tao, D.: Res2tim: Reconstruct syntactic structures from table", "bbox": {"l": 150.82175, "t": 634.87968, "r": 480.58731000000006, "b": 642.9494500000001, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "images. In: 2019 International Conference on Document Analysis and Recognition", "bbox": {"l": 151.51801, "t": 645.8386800000001, "r": 480.59119, "b": 653.90845, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "(ICDAR). pp. 749-755. IEEE (2019)", "bbox": {"l": 151.51801, "t": 656.79768, "r": 299.30307, "b": 664.86745, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "17. Xue, W., Li, Q., Tao, D.: Res2tim: Reconstruct syntactic structures from table images. In: 2019 International Conference on Document Analysis and Recognition (ICDAR). pp. 749-755. IEEE (2019)"}], "headers": [{"label": "page_header", "id": 13, "page_no": 12, "cluster": {"id": 13, "label": "page_header", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9163166880607605, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Optimized Table Tokenization for Table Structure Recognition"}, {"label": "page_header", "id": 14, "page_no": 12, "cluster": {"id": 14, "label": "page_header", "bbox": {"l": 471.37561, "t": 93.77099999999996, "r": 480.5894799999999, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9061064720153809, "cells": [{"id": 1, "text": "13", "bbox": {"l": 471.37561, "t": 93.77099999999996, "r": 480.5894799999999, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "13"}]}}, {"page_no": 13, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "14", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 143.97887, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "M.", "bbox": {"l": 167.82053, "t": 93.77099999999996, "r": 178.08249, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37929, "t": 93.77099999999996, "r": 231.72049000000004, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "18.", "bbox": {"l": 134.765, "t": 119.67400999999995, "r": 146.07936, "b": 127.74370999999985, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Xue, W., Yu, B., Wang, W., Tao, D., Li, Q.: Tgrnet: A table graph reconstruc-", "bbox": {"l": 150.5069, "t": 119.67400999999995, "r": 480.5892, "b": 127.74370999999985, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "tion network for table structure recognition. In: Proceedings of the IEEE/CVF", "bbox": {"l": 151.51801, "t": 130.63300000000004, "r": 480.59113, "b": 138.70270000000005, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "International Conference on Computer Vision. pp. 1295-1304 (2021)", "bbox": {"l": 151.51801, "t": 141.59198000000004, "r": 427.53329, "b": 149.66168000000005, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "19.", "bbox": {"l": 134.765, "t": 152.55096000000003, "r": 146.19109, "b": 160.62067000000002, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Ye, J., Qi, X., He, Y., Chen, Y., Gu, D., Gao, P., Xiao, R.: Pingan-vcgroup\u2019s", "bbox": {"l": 150.66234, "t": 152.55096000000003, "r": 480.5936899999999, "b": 160.62067000000002, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "solution for icdar 2021 competition on scientific literature parsing task b: Ta-", "bbox": {"l": 151.51801, "t": 163.50995, "r": 480.59469999999993, "b": 171.57965000000002, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "ble recognition to html (2021).", "bbox": {"l": 151.51801, "t": 174.46893, "r": 280.64047, "b": 182.53864, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "https://doi.org/10.48550/ARXIV.2105.01848", "bbox": {"l": 285.078, "t": 175.11450000000002, "r": 478.03403000000003, "b": 182.58349999999996, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": ",", "bbox": {"l": 478.0319799999999, "t": 174.46893, "r": 480.59099999999995, "b": 182.53864, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "https://arxiv.org/abs/2105.01848", "bbox": {"l": 151.51797, "t": 186.07349, "r": 302.11584, "b": 193.54247999999995, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "20.", "bbox": {"l": 134.76497, "t": 196.38689999999997, "r": 145.65964, "b": 204.45659999999998, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Zhang, Z., Zhang, J., Du, J., Wang, F.: Split, embed and merge: An accurate table", "bbox": {"l": 149.92294, "t": 196.38689999999997, "r": 480.5935400000001, "b": 204.45659999999998, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "structure recognizer. Pattern Recognition", "bbox": {"l": 151.51797, "t": 207.34491000000003, "r": 318.55124, "b": 215.41461000000004, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "126", "bbox": {"l": 321.62097, "t": 207.2821, "r": 337.53186, "b": 215.20844, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": ", 108565 (2022)", "bbox": {"l": 337.53296, "t": 207.34491000000003, "r": 399.46927, "b": 215.41461000000004, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "21.", "bbox": {"l": 134.76495, "t": 218.30389000000002, "r": 145.7213, "b": 226.3736, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Zheng, X., Burdick, D., Popa, L., Zhong, X., Wang, N.X.R.: Global table extractor", "bbox": {"l": 150.00871, "t": 218.30389000000002, "r": 480.59012, "b": 226.3736, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "(gte): A framework for joint table identification and cell structure recognition using", "bbox": {"l": 151.51796, "t": 229.26288, "r": 480.59102999999993, "b": 237.33258, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "visual context. In: 2021 IEEE Winter Conference on Applications of Computer Vi-", "bbox": {"l": 151.51796, "t": 240.22186, "r": 480.59119, "b": 248.29156, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "sion (WACV). pp. 697-706 (2021).", "bbox": {"l": 151.51796, "t": 251.18084999999996, "r": 293.44086, "b": 259.25055, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "https://doi.org/10.1109/WACV48630.2021.", "bbox": {"l": 297.04996, "t": 251.82641999999998, "r": 480.59305000000006, "b": 259.29540999999995, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "00074", "bbox": {"l": 151.51796, "t": 262.7854, "r": 175.05028, "b": 270.25438999999994, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "22.", "bbox": {"l": 134.76495, "t": 273.09882000000005, "r": 146.36798, "b": 281.16855000000004, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Zhong, X., ShafieiBavani, E., Jimeno Yepes, A.: Image-based table recognition:", "bbox": {"l": 150.90846, "t": 273.09882000000005, "r": 480.59094, "b": 281.16855000000004, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Data, model, and evaluation. In: Vedaldi, A., Bischof, H., Brox, T., Frahm, J.M.", "bbox": {"l": 151.51796, "t": 284.05777, "r": 480.58832000000007, "b": 292.12753, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "(eds.) Computer Vision - ECCV 2020. pp. 564-580. Springer International Pub-", "bbox": {"l": 151.51796, "t": 295.01675, "r": 480.59558, "b": 303.08651999999995, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "lishing, Cham (2020)", "bbox": {"l": 151.51796, "t": 305.97574, "r": 236.02359, "b": 314.0455, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "23.", "bbox": {"l": 134.76495, "t": 316.93472, "r": 145.69547, "b": 325.00449000000003, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Zhong, X., Tang, J., Yepes, A.J.: Publaynet: largest dataset ever for document lay-", "bbox": {"l": 149.97276, "t": 316.93472, "r": 480.59454, "b": 325.00449000000003, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "out analysis. In: 2019 International Conference on Document Analysis and Recog-", "bbox": {"l": 151.51796, "t": 327.8927299999999, "r": 480.59387000000004, "b": 335.96249, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "nition (ICDAR). pp. 1015-1022. IEEE (2019)", "bbox": {"l": 151.51796, "t": 338.85172, "r": 335.13635, "b": 346.92148, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 7, "label": "page_header", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 143.97887, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.7012730240821838, "cells": [{"id": 0, "text": "14", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 143.97887, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "page_header", "bbox": {"l": 167.82053, "t": 93.77099999999996, "r": 231.72049000000004, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.7889755964279175, "cells": [{"id": 1, "text": "M.", "bbox": {"l": 167.82053, "t": 93.77099999999996, "r": 178.08249, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37929, "t": 93.77099999999996, "r": 231.72049000000004, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "list_item", "bbox": {"l": 134.765, "t": 119.67400999999995, "r": 480.59113, "b": 149.66168000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9444757699966431, "cells": [{"id": 3, "text": "18.", "bbox": {"l": 134.765, "t": 119.67400999999995, "r": 146.07936, "b": 127.74370999999985, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Xue, W., Yu, B., Wang, W., Tao, D., Li, Q.: Tgrnet: A table graph reconstruc-", "bbox": {"l": 150.5069, "t": 119.67400999999995, "r": 480.5892, "b": 127.74370999999985, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "tion network for table structure recognition. In: Proceedings of the IEEE/CVF", "bbox": {"l": 151.51801, "t": 130.63300000000004, "r": 480.59113, "b": 138.70270000000005, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "International Conference on Computer Vision. pp. 1295-1304 (2021)", "bbox": {"l": 151.51801, "t": 141.59198000000004, "r": 427.53329, "b": 149.66168000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "list_item", "bbox": {"l": 134.765, "t": 152.55096000000003, "r": 480.59469999999993, "b": 193.54247999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9540892243385315, "cells": [{"id": 7, "text": "19.", "bbox": {"l": 134.765, "t": 152.55096000000003, "r": 146.19109, "b": 160.62067000000002, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Ye, J., Qi, X., He, Y., Chen, Y., Gu, D., Gao, P., Xiao, R.: Pingan-vcgroup\u2019s", "bbox": {"l": 150.66234, "t": 152.55096000000003, "r": 480.5936899999999, "b": 160.62067000000002, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "solution for icdar 2021 competition on scientific literature parsing task b: Ta-", "bbox": {"l": 151.51801, "t": 163.50995, "r": 480.59469999999993, "b": 171.57965000000002, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "ble recognition to html (2021).", "bbox": {"l": 151.51801, "t": 174.46893, "r": 280.64047, "b": 182.53864, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "https://doi.org/10.48550/ARXIV.2105.01848", "bbox": {"l": 285.078, "t": 175.11450000000002, "r": 478.03403000000003, "b": 182.58349999999996, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": ",", "bbox": {"l": 478.0319799999999, "t": 174.46893, "r": 480.59099999999995, "b": 182.53864, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "https://arxiv.org/abs/2105.01848", "bbox": {"l": 151.51797, "t": 186.07349, "r": 302.11584, "b": 193.54247999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "list_item", "bbox": {"l": 134.76497, "t": 196.38689999999997, "r": 480.5935400000001, "b": 215.41461000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9531471729278564, "cells": [{"id": 14, "text": "20.", "bbox": {"l": 134.76497, "t": 196.38689999999997, "r": 145.65964, "b": 204.45659999999998, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Zhang, Z., Zhang, J., Du, J., Wang, F.: Split, embed and merge: An accurate table", "bbox": {"l": 149.92294, "t": 196.38689999999997, "r": 480.5935400000001, "b": 204.45659999999998, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "structure recognizer. Pattern Recognition", "bbox": {"l": 151.51797, "t": 207.34491000000003, "r": 318.55124, "b": 215.41461000000004, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "126", "bbox": {"l": 321.62097, "t": 207.2821, "r": 337.53186, "b": 215.20844, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": ", 108565 (2022)", "bbox": {"l": 337.53296, "t": 207.34491000000003, "r": 399.46927, "b": 215.41461000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "list_item", "bbox": {"l": 134.76495, "t": 218.30389000000002, "r": 480.59305000000006, "b": 270.25438999999994, "coord_origin": "TOPLEFT"}, "confidence": 0.972027063369751, "cells": [{"id": 19, "text": "21.", "bbox": {"l": 134.76495, "t": 218.30389000000002, "r": 145.7213, "b": 226.3736, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Zheng, X., Burdick, D., Popa, L., Zhong, X., Wang, N.X.R.: Global table extractor", "bbox": {"l": 150.00871, "t": 218.30389000000002, "r": 480.59012, "b": 226.3736, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "(gte): A framework for joint table identification and cell structure recognition using", "bbox": {"l": 151.51796, "t": 229.26288, "r": 480.59102999999993, "b": 237.33258, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "visual context. In: 2021 IEEE Winter Conference on Applications of Computer Vi-", "bbox": {"l": 151.51796, "t": 240.22186, "r": 480.59119, "b": 248.29156, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "sion (WACV). pp. 697-706 (2021).", "bbox": {"l": 151.51796, "t": 251.18084999999996, "r": 293.44086, "b": 259.25055, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "https://doi.org/10.1109/WACV48630.2021.", "bbox": {"l": 297.04996, "t": 251.82641999999998, "r": 480.59305000000006, "b": 259.29540999999995, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "00074", "bbox": {"l": 151.51796, "t": 262.7854, "r": 175.05028, "b": 270.25438999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "list_item", "bbox": {"l": 134.76495, "t": 273.09882000000005, "r": 480.59558, "b": 314.0455, "coord_origin": "TOPLEFT"}, "confidence": 0.9685125946998596, "cells": [{"id": 26, "text": "22.", "bbox": {"l": 134.76495, "t": 273.09882000000005, "r": 146.36798, "b": 281.16855000000004, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Zhong, X., ShafieiBavani, E., Jimeno Yepes, A.: Image-based table recognition:", "bbox": {"l": 150.90846, "t": 273.09882000000005, "r": 480.59094, "b": 281.16855000000004, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Data, model, and evaluation. In: Vedaldi, A., Bischof, H., Brox, T., Frahm, J.M.", "bbox": {"l": 151.51796, "t": 284.05777, "r": 480.58832000000007, "b": 292.12753, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "(eds.) Computer Vision - ECCV 2020. pp. 564-580. Springer International Pub-", "bbox": {"l": 151.51796, "t": 295.01675, "r": 480.59558, "b": 303.08651999999995, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "lishing, Cham (2020)", "bbox": {"l": 151.51796, "t": 305.97574, "r": 236.02359, "b": 314.0455, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "list_item", "bbox": {"l": 134.76495, "t": 316.93472, "r": 480.59454, "b": 346.92148, "coord_origin": "TOPLEFT"}, "confidence": 0.9668973684310913, "cells": [{"id": 31, "text": "23.", "bbox": {"l": 134.76495, "t": 316.93472, "r": 145.69547, "b": 325.00449000000003, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Zhong, X., Tang, J., Yepes, A.J.: Publaynet: largest dataset ever for document lay-", "bbox": {"l": 149.97276, "t": 316.93472, "r": 480.59454, "b": 325.00449000000003, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "out analysis. In: 2019 International Conference on Document Analysis and Recog-", "bbox": {"l": 151.51796, "t": 327.8927299999999, "r": 480.59387000000004, "b": 335.96249, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "nition (ICDAR). pp. 1015-1022. IEEE (2019)", "bbox": {"l": 151.51796, "t": 338.85172, "r": 335.13635, "b": 346.92148, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_header", "id": 7, "page_no": 13, "cluster": {"id": 7, "label": "page_header", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 143.97887, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.7012730240821838, "cells": [{"id": 0, "text": "14", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 143.97887, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "14"}, {"label": "page_header", "id": 6, "page_no": 13, "cluster": {"id": 6, "label": "page_header", "bbox": {"l": 167.82053, "t": 93.77099999999996, "r": 231.72049000000004, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.7889755964279175, "cells": [{"id": 1, "text": "M.", "bbox": {"l": 167.82053, "t": 93.77099999999996, "r": 178.08249, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37929, "t": 93.77099999999996, "r": 231.72049000000004, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "M. Lysak, et al."}, {"label": "list_item", "id": 5, "page_no": 13, "cluster": {"id": 5, "label": "list_item", "bbox": {"l": 134.765, "t": 119.67400999999995, "r": 480.59113, "b": 149.66168000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9444757699966431, "cells": [{"id": 3, "text": "18.", "bbox": {"l": 134.765, "t": 119.67400999999995, "r": 146.07936, "b": 127.74370999999985, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Xue, W., Yu, B., Wang, W., Tao, D., Li, Q.: Tgrnet: A table graph reconstruc-", "bbox": {"l": 150.5069, "t": 119.67400999999995, "r": 480.5892, "b": 127.74370999999985, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "tion network for table structure recognition. In: Proceedings of the IEEE/CVF", "bbox": {"l": 151.51801, "t": 130.63300000000004, "r": 480.59113, "b": 138.70270000000005, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "International Conference on Computer Vision. pp. 1295-1304 (2021)", "bbox": {"l": 151.51801, "t": 141.59198000000004, "r": 427.53329, "b": 149.66168000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "18. Xue, W., Yu, B., Wang, W., Tao, D., Li, Q.: Tgrnet: A table graph reconstruction network for table structure recognition. In: Proceedings of the IEEE/CVF International Conference on Computer Vision. pp. 1295-1304 (2021)"}, {"label": "list_item", "id": 3, "page_no": 13, "cluster": {"id": 3, "label": "list_item", "bbox": {"l": 134.765, "t": 152.55096000000003, "r": 480.59469999999993, "b": 193.54247999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9540892243385315, "cells": [{"id": 7, "text": "19.", "bbox": {"l": 134.765, "t": 152.55096000000003, "r": 146.19109, "b": 160.62067000000002, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Ye, J., Qi, X., He, Y., Chen, Y., Gu, D., Gao, P., Xiao, R.: Pingan-vcgroup\u2019s", "bbox": {"l": 150.66234, "t": 152.55096000000003, "r": 480.5936899999999, "b": 160.62067000000002, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "solution for icdar 2021 competition on scientific literature parsing task b: Ta-", "bbox": {"l": 151.51801, "t": 163.50995, "r": 480.59469999999993, "b": 171.57965000000002, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "ble recognition to html (2021).", "bbox": {"l": 151.51801, "t": 174.46893, "r": 280.64047, "b": 182.53864, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "https://doi.org/10.48550/ARXIV.2105.01848", "bbox": {"l": 285.078, "t": 175.11450000000002, "r": 478.03403000000003, "b": 182.58349999999996, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": ",", "bbox": {"l": 478.0319799999999, "t": 174.46893, "r": 480.59099999999995, "b": 182.53864, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "https://arxiv.org/abs/2105.01848", "bbox": {"l": 151.51797, "t": 186.07349, "r": 302.11584, "b": 193.54247999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "19. Ye, J., Qi, X., He, Y., Chen, Y., Gu, D., Gao, P., Xiao, R.: Pingan-vcgroup's solution for icdar 2021 competition on scientific literature parsing task b: Table recognition to html (2021). https://doi.org/10.48550/ARXIV.2105.01848 , https://arxiv.org/abs/2105.01848"}, {"label": "list_item", "id": 4, "page_no": 13, "cluster": {"id": 4, "label": "list_item", "bbox": {"l": 134.76497, "t": 196.38689999999997, "r": 480.5935400000001, "b": 215.41461000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9531471729278564, "cells": [{"id": 14, "text": "20.", "bbox": {"l": 134.76497, "t": 196.38689999999997, "r": 145.65964, "b": 204.45659999999998, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Zhang, Z., Zhang, J., Du, J., Wang, F.: Split, embed and merge: An accurate table", "bbox": {"l": 149.92294, "t": 196.38689999999997, "r": 480.5935400000001, "b": 204.45659999999998, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "structure recognizer. Pattern Recognition", "bbox": {"l": 151.51797, "t": 207.34491000000003, "r": 318.55124, "b": 215.41461000000004, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "126", "bbox": {"l": 321.62097, "t": 207.2821, "r": 337.53186, "b": 215.20844, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": ", 108565 (2022)", "bbox": {"l": 337.53296, "t": 207.34491000000003, "r": 399.46927, "b": 215.41461000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "20. Zhang, Z., Zhang, J., Du, J., Wang, F.: Split, embed and merge: An accurate table structure recognizer. Pattern Recognition 126 , 108565 (2022)"}, {"label": "list_item", "id": 0, "page_no": 13, "cluster": {"id": 0, "label": "list_item", "bbox": {"l": 134.76495, "t": 218.30389000000002, "r": 480.59305000000006, "b": 270.25438999999994, "coord_origin": "TOPLEFT"}, "confidence": 0.972027063369751, "cells": [{"id": 19, "text": "21.", "bbox": {"l": 134.76495, "t": 218.30389000000002, "r": 145.7213, "b": 226.3736, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Zheng, X., Burdick, D., Popa, L., Zhong, X., Wang, N.X.R.: Global table extractor", "bbox": {"l": 150.00871, "t": 218.30389000000002, "r": 480.59012, "b": 226.3736, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "(gte): A framework for joint table identification and cell structure recognition using", "bbox": {"l": 151.51796, "t": 229.26288, "r": 480.59102999999993, "b": 237.33258, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "visual context. In: 2021 IEEE Winter Conference on Applications of Computer Vi-", "bbox": {"l": 151.51796, "t": 240.22186, "r": 480.59119, "b": 248.29156, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "sion (WACV). pp. 697-706 (2021).", "bbox": {"l": 151.51796, "t": 251.18084999999996, "r": 293.44086, "b": 259.25055, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "https://doi.org/10.1109/WACV48630.2021.", "bbox": {"l": 297.04996, "t": 251.82641999999998, "r": 480.59305000000006, "b": 259.29540999999995, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "00074", "bbox": {"l": 151.51796, "t": 262.7854, "r": 175.05028, "b": 270.25438999999994, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "21. Zheng, X., Burdick, D., Popa, L., Zhong, X., Wang, N.X.R.: Global table extractor (gte): A framework for joint table identification and cell structure recognition using visual context. In: 2021 IEEE Winter Conference on Applications of Computer Vision (WACV). pp. 697-706 (2021). https://doi.org/10.1109/WACV48630.2021. 00074"}, {"label": "list_item", "id": 1, "page_no": 13, "cluster": {"id": 1, "label": "list_item", "bbox": {"l": 134.76495, "t": 273.09882000000005, "r": 480.59558, "b": 314.0455, "coord_origin": "TOPLEFT"}, "confidence": 0.9685125946998596, "cells": [{"id": 26, "text": "22.", "bbox": {"l": 134.76495, "t": 273.09882000000005, "r": 146.36798, "b": 281.16855000000004, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Zhong, X., ShafieiBavani, E., Jimeno Yepes, A.: Image-based table recognition:", "bbox": {"l": 150.90846, "t": 273.09882000000005, "r": 480.59094, "b": 281.16855000000004, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Data, model, and evaluation. In: Vedaldi, A., Bischof, H., Brox, T., Frahm, J.M.", "bbox": {"l": 151.51796, "t": 284.05777, "r": 480.58832000000007, "b": 292.12753, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "(eds.) Computer Vision - ECCV 2020. pp. 564-580. Springer International Pub-", "bbox": {"l": 151.51796, "t": 295.01675, "r": 480.59558, "b": 303.08651999999995, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "lishing, Cham (2020)", "bbox": {"l": 151.51796, "t": 305.97574, "r": 236.02359, "b": 314.0455, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "22. Zhong, X., ShafieiBavani, E., Jimeno Yepes, A.: Image-based table recognition: Data, model, and evaluation. In: Vedaldi, A., Bischof, H., Brox, T., Frahm, J.M. (eds.) Computer Vision - ECCV 2020. pp. 564-580. Springer International Publishing, Cham (2020)"}, {"label": "list_item", "id": 2, "page_no": 13, "cluster": {"id": 2, "label": "list_item", "bbox": {"l": 134.76495, "t": 316.93472, "r": 480.59454, "b": 346.92148, "coord_origin": "TOPLEFT"}, "confidence": 0.9668973684310913, "cells": [{"id": 31, "text": "23.", "bbox": {"l": 134.76495, "t": 316.93472, "r": 145.69547, "b": 325.00449000000003, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Zhong, X., Tang, J., Yepes, A.J.: Publaynet: largest dataset ever for document lay-", "bbox": {"l": 149.97276, "t": 316.93472, "r": 480.59454, "b": 325.00449000000003, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "out analysis. In: 2019 International Conference on Document Analysis and Recog-", "bbox": {"l": 151.51796, "t": 327.8927299999999, "r": 480.59387000000004, "b": 335.96249, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "nition (ICDAR). pp. 1015-1022. IEEE (2019)", "bbox": {"l": 151.51796, "t": 338.85172, "r": 335.13635, "b": 346.92148, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "23. Zhong, X., Tang, J., Yepes, A.J.: Publaynet: largest dataset ever for document layout analysis. In: 2019 International Conference on Document Analysis and Recognition (ICDAR). pp. 1015-1022. IEEE (2019)"}], "body": [{"label": "list_item", "id": 5, "page_no": 13, "cluster": {"id": 5, "label": "list_item", "bbox": {"l": 134.765, "t": 119.67400999999995, "r": 480.59113, "b": 149.66168000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9444757699966431, "cells": [{"id": 3, "text": "18.", "bbox": {"l": 134.765, "t": 119.67400999999995, "r": 146.07936, "b": 127.74370999999985, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Xue, W., Yu, B., Wang, W., Tao, D., Li, Q.: Tgrnet: A table graph reconstruc-", "bbox": {"l": 150.5069, "t": 119.67400999999995, "r": 480.5892, "b": 127.74370999999985, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "tion network for table structure recognition. In: Proceedings of the IEEE/CVF", "bbox": {"l": 151.51801, "t": 130.63300000000004, "r": 480.59113, "b": 138.70270000000005, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "International Conference on Computer Vision. pp. 1295-1304 (2021)", "bbox": {"l": 151.51801, "t": 141.59198000000004, "r": 427.53329, "b": 149.66168000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "18. Xue, W., Yu, B., Wang, W., Tao, D., Li, Q.: Tgrnet: A table graph reconstruction network for table structure recognition. In: Proceedings of the IEEE/CVF International Conference on Computer Vision. pp. 1295-1304 (2021)"}, {"label": "list_item", "id": 3, "page_no": 13, "cluster": {"id": 3, "label": "list_item", "bbox": {"l": 134.765, "t": 152.55096000000003, "r": 480.59469999999993, "b": 193.54247999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9540892243385315, "cells": [{"id": 7, "text": "19.", "bbox": {"l": 134.765, "t": 152.55096000000003, "r": 146.19109, "b": 160.62067000000002, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Ye, J., Qi, X., He, Y., Chen, Y., Gu, D., Gao, P., Xiao, R.: Pingan-vcgroup\u2019s", "bbox": {"l": 150.66234, "t": 152.55096000000003, "r": 480.5936899999999, "b": 160.62067000000002, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "solution for icdar 2021 competition on scientific literature parsing task b: Ta-", "bbox": {"l": 151.51801, "t": 163.50995, "r": 480.59469999999993, "b": 171.57965000000002, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "ble recognition to html (2021).", "bbox": {"l": 151.51801, "t": 174.46893, "r": 280.64047, "b": 182.53864, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "https://doi.org/10.48550/ARXIV.2105.01848", "bbox": {"l": 285.078, "t": 175.11450000000002, "r": 478.03403000000003, "b": 182.58349999999996, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": ",", "bbox": {"l": 478.0319799999999, "t": 174.46893, "r": 480.59099999999995, "b": 182.53864, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "https://arxiv.org/abs/2105.01848", "bbox": {"l": 151.51797, "t": 186.07349, "r": 302.11584, "b": 193.54247999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "19. Ye, J., Qi, X., He, Y., Chen, Y., Gu, D., Gao, P., Xiao, R.: Pingan-vcgroup's solution for icdar 2021 competition on scientific literature parsing task b: Table recognition to html (2021). https://doi.org/10.48550/ARXIV.2105.01848 , https://arxiv.org/abs/2105.01848"}, {"label": "list_item", "id": 4, "page_no": 13, "cluster": {"id": 4, "label": "list_item", "bbox": {"l": 134.76497, "t": 196.38689999999997, "r": 480.5935400000001, "b": 215.41461000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9531471729278564, "cells": [{"id": 14, "text": "20.", "bbox": {"l": 134.76497, "t": 196.38689999999997, "r": 145.65964, "b": 204.45659999999998, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Zhang, Z., Zhang, J., Du, J., Wang, F.: Split, embed and merge: An accurate table", "bbox": {"l": 149.92294, "t": 196.38689999999997, "r": 480.5935400000001, "b": 204.45659999999998, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "structure recognizer. Pattern Recognition", "bbox": {"l": 151.51797, "t": 207.34491000000003, "r": 318.55124, "b": 215.41461000000004, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "126", "bbox": {"l": 321.62097, "t": 207.2821, "r": 337.53186, "b": 215.20844, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": ", 108565 (2022)", "bbox": {"l": 337.53296, "t": 207.34491000000003, "r": 399.46927, "b": 215.41461000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "20. Zhang, Z., Zhang, J., Du, J., Wang, F.: Split, embed and merge: An accurate table structure recognizer. Pattern Recognition 126 , 108565 (2022)"}, {"label": "list_item", "id": 0, "page_no": 13, "cluster": {"id": 0, "label": "list_item", "bbox": {"l": 134.76495, "t": 218.30389000000002, "r": 480.59305000000006, "b": 270.25438999999994, "coord_origin": "TOPLEFT"}, "confidence": 0.972027063369751, "cells": [{"id": 19, "text": "21.", "bbox": {"l": 134.76495, "t": 218.30389000000002, "r": 145.7213, "b": 226.3736, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Zheng, X., Burdick, D., Popa, L., Zhong, X., Wang, N.X.R.: Global table extractor", "bbox": {"l": 150.00871, "t": 218.30389000000002, "r": 480.59012, "b": 226.3736, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "(gte): A framework for joint table identification and cell structure recognition using", "bbox": {"l": 151.51796, "t": 229.26288, "r": 480.59102999999993, "b": 237.33258, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "visual context. In: 2021 IEEE Winter Conference on Applications of Computer Vi-", "bbox": {"l": 151.51796, "t": 240.22186, "r": 480.59119, "b": 248.29156, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "sion (WACV). pp. 697-706 (2021).", "bbox": {"l": 151.51796, "t": 251.18084999999996, "r": 293.44086, "b": 259.25055, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "https://doi.org/10.1109/WACV48630.2021.", "bbox": {"l": 297.04996, "t": 251.82641999999998, "r": 480.59305000000006, "b": 259.29540999999995, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "00074", "bbox": {"l": 151.51796, "t": 262.7854, "r": 175.05028, "b": 270.25438999999994, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "21. Zheng, X., Burdick, D., Popa, L., Zhong, X., Wang, N.X.R.: Global table extractor (gte): A framework for joint table identification and cell structure recognition using visual context. In: 2021 IEEE Winter Conference on Applications of Computer Vision (WACV). pp. 697-706 (2021). https://doi.org/10.1109/WACV48630.2021. 00074"}, {"label": "list_item", "id": 1, "page_no": 13, "cluster": {"id": 1, "label": "list_item", "bbox": {"l": 134.76495, "t": 273.09882000000005, "r": 480.59558, "b": 314.0455, "coord_origin": "TOPLEFT"}, "confidence": 0.9685125946998596, "cells": [{"id": 26, "text": "22.", "bbox": {"l": 134.76495, "t": 273.09882000000005, "r": 146.36798, "b": 281.16855000000004, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Zhong, X., ShafieiBavani, E., Jimeno Yepes, A.: Image-based table recognition:", "bbox": {"l": 150.90846, "t": 273.09882000000005, "r": 480.59094, "b": 281.16855000000004, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Data, model, and evaluation. In: Vedaldi, A., Bischof, H., Brox, T., Frahm, J.M.", "bbox": {"l": 151.51796, "t": 284.05777, "r": 480.58832000000007, "b": 292.12753, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "(eds.) Computer Vision - ECCV 2020. pp. 564-580. Springer International Pub-", "bbox": {"l": 151.51796, "t": 295.01675, "r": 480.59558, "b": 303.08651999999995, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "lishing, Cham (2020)", "bbox": {"l": 151.51796, "t": 305.97574, "r": 236.02359, "b": 314.0455, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "22. Zhong, X., ShafieiBavani, E., Jimeno Yepes, A.: Image-based table recognition: Data, model, and evaluation. In: Vedaldi, A., Bischof, H., Brox, T., Frahm, J.M. (eds.) Computer Vision - ECCV 2020. pp. 564-580. Springer International Publishing, Cham (2020)"}, {"label": "list_item", "id": 2, "page_no": 13, "cluster": {"id": 2, "label": "list_item", "bbox": {"l": 134.76495, "t": 316.93472, "r": 480.59454, "b": 346.92148, "coord_origin": "TOPLEFT"}, "confidence": 0.9668973684310913, "cells": [{"id": 31, "text": "23.", "bbox": {"l": 134.76495, "t": 316.93472, "r": 145.69547, "b": 325.00449000000003, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Zhong, X., Tang, J., Yepes, A.J.: Publaynet: largest dataset ever for document lay-", "bbox": {"l": 149.97276, "t": 316.93472, "r": 480.59454, "b": 325.00449000000003, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "out analysis. In: 2019 International Conference on Document Analysis and Recog-", "bbox": {"l": 151.51796, "t": 327.8927299999999, "r": 480.59387000000004, "b": 335.96249, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "nition (ICDAR). pp. 1015-1022. IEEE (2019)", "bbox": {"l": 151.51796, "t": 338.85172, "r": 335.13635, "b": 346.92148, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "23. Zhong, X., Tang, J., Yepes, A.J.: Publaynet: largest dataset ever for document layout analysis. In: 2019 International Conference on Document Analysis and Recognition (ICDAR). pp. 1015-1022. IEEE (2019)"}], "headers": [{"label": "page_header", "id": 7, "page_no": 13, "cluster": {"id": 7, "label": "page_header", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 143.97887, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.7012730240821838, "cells": [{"id": 0, "text": "14", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 143.97887, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "14"}, {"label": "page_header", "id": 6, "page_no": 13, "cluster": {"id": 6, "label": "page_header", "bbox": {"l": 167.82053, "t": 93.77099999999996, "r": 231.72049000000004, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.7889755964279175, "cells": [{"id": 1, "text": "M.", "bbox": {"l": 167.82053, "t": 93.77099999999996, "r": 178.08249, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37929, "t": 93.77099999999996, "r": 231.72049000000004, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "M. Lysak, et al."}]}}]
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v1/amt_handbook_sample.doctags.txt b/tests/data/groundtruth/docling_v1/amt_handbook_sample.doctags.txt
index b6e4f1c5..4d42a575 100644
--- a/tests/data/groundtruth/docling_v1/amt_handbook_sample.doctags.txt
+++ b/tests/data/groundtruth/docling_v1/amt_handbook_sample.doctags.txt
@@ -6,7 +6,6 @@
 <paragraph><location><page_1><loc_12><loc_52><loc_53><loc_62></location>The spring keeps the locking and load-carrying sections such a distance apart that the two sets of threads are out of phase or spaced so that a bolt, which has been screwed through the load-carrying section, must push the locking section outward against the force of the spring to engage the threads of the locking section properly.</paragraph>
 <paragraph><location><page_1><loc_12><loc_38><loc_54><loc_50></location>The spring, through the medium of the locking section, exerts a constant locking force on the bolt in the same direction as a force that would tighten the nut. In this nut, the load-carrying section has the thread strength of a standard nut of comparable size, while the locking section presses against the threads of the bolt and locks the nut firmly in position. Only a wrench applied to the nut loosens it. The nut can be removed and reused without impairing its efficiency.</paragraph>
 <paragraph><location><page_1><loc_12><loc_33><loc_53><loc_36></location>Boots self-locking nuts are made with three different spring styles and in various shapes and sizes. The wing type that is</paragraph>
-<caption><location><page_1><loc_12><loc_8><loc_31><loc_9></location>Figure 7-26. Self-locking nuts.</caption>
 <figure>
 <location><page_1><loc_12><loc_10><loc_52><loc_31></location>
 <caption>Figure 7-26. Self-locking nuts.</caption>
@@ -17,7 +16,6 @@
 <paragraph><location><page_1><loc_54><loc_54><loc_96><loc_81></location>The stainless steel self-locking nut may be spun on and off by hand as its locking action takes places only when the nut is seated against a solid surface and tightened. The nut consists of two parts: a case with a beveled locking shoulder and key and a thread insert with a locking shoulder and slotted keyway. Until the nut is tightened, it spins on the bolt easily, because the threaded insert is the proper size for the bolt. However, when the nut is seated against a solid surface and tightened, the locking shoulder of the insert is pulled downward and wedged against the locking shoulder of the case. This action compresses the threaded insert and causes it to clench the bolt tightly. The cross-sectional view in Figure 7-27 shows how the key of the case fits into the slotted keyway of the insert so that when the case is turned, the threaded insert is turned with it. Note that the slot is wider than the key. This permits the slot to be narrowed and the insert to be compressed when the nut is tightened.</paragraph>
 <subtitle-level-1><location><page_1><loc_54><loc_51><loc_65><loc_52></location>Elastic Stop Nut</subtitle-level-1>
 <paragraph><location><page_1><loc_54><loc_47><loc_93><loc_50></location>The elastic stop nut is a standard nut with the height increased to accommodate a fiber locking collar. This</paragraph>
-<caption><location><page_1><loc_54><loc_8><loc_81><loc_10></location>Figure 7-27. Stainless steel self-locking nut.</caption>
 <figure>
 <location><page_1><loc_54><loc_11><loc_94><loc_46></location>
 <caption>Figure 7-27. Stainless steel self-locking nut.</caption>
diff --git a/tests/data/groundtruth/docling_v1/amt_handbook_sample.json b/tests/data/groundtruth/docling_v1/amt_handbook_sample.json
index 588b92f6..12dca92c 100644
--- a/tests/data/groundtruth/docling_v1/amt_handbook_sample.json
+++ b/tests/data/groundtruth/docling_v1/amt_handbook_sample.json
@@ -1 +1 @@
-{"_name": "", "type": "pdf-document", "description": {"title": null, "abstract": null, "authors": null, "affiliations": null, "subjects": null, "keywords": null, "publication_date": null, "languages": null, "license": null, "publishers": null, "url_refs": null, "references": null, "publication": null, "reference_count": null, "citation_count": null, "citation_date": null, "advanced": null, "analytics": null, "logs": [], "collection": null, "acquisition": null}, "file-info": {"filename": "amt_handbook_sample.pdf", "filename-prov": null, "document-hash": "4ba7cdbd9ce8155d692d8f477f88bb3ec1acc2a463cf1e0209d1e624e58ebce9", "#-pages": 1, "collection-name": null, "description": null, "page-hashes": [{"hash": "f31706a847734c62e1e41f9f792c756283d1d4955552c1cc7f5e23c351bdd7cb", "model": "default", "page": 1}]}, "main-text": [{"prov": [{"bbox": [71.99212646484375, 681.3463745117188, 314.11212158203125, 730.3163452148438], "page": 1, "span": [0, 244], "__ref_s3_data": null}], "text": "pulleys, provided the inner race of the bearing is clamped to the supporting structure by the nut and bolt. Plates must be attached to the structure in a positive manner to eliminate rotation or misalignment when tightening the bolts or screws.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [71.99230194091797, 593.8463745117188, 313.15460205078125, 667.8163452148438], "page": 1, "span": [0, 376], "__ref_s3_data": null}], "text": "The two general types of self-locking nuts currently in use are the all-metal type and the fiber lock type. For the sake of simplicity, only three typical kinds of self-locking nuts are considered in this handbook: the Boots self-locking and the stainless steel self-locking nuts, representing the all-metal types; and the elastic stop nut, representing the fiber insert type.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [71.99230194091797, 568.8463745117188, 167.27230834960938, 580.1864013671875], "page": 1, "span": [0, 22], "__ref_s3_data": null}], "text": "Boots Self-Locking Nut", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [71.99229431152344, 491.84637451171875, 318.49224853515625, 565.8163452148438], "page": 1, "span": [0, 319], "__ref_s3_data": null}], "text": "The Boots self-locking nut is of one piece, all-metal construction designed to hold tight despite severe vibration. Note in Figure 7-26 that it has two sections and is essentially two nuts in one: a locking nut and a load-carrying nut. The two sections are connected with a spring, which is an integral part of the nut.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [71.99229431152344, 404.34637451171875, 316.65728759765625, 478.3163757324219], "page": 1, "span": [0, 332], "__ref_s3_data": null}], "text": "The spring keeps the locking and load-carrying sections such a distance apart that the two sets of threads are out of phase or spaced so that a bolt, which has been screwed through the load-carrying section, must push the locking section outward against the force of the spring to engage the threads of the locking section properly.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [71.99229431152344, 291.84637451171875, 318.8122863769531, 390.8163757324219], "page": 1, "span": [0, 477], "__ref_s3_data": null}], "text": "The spring, through the medium of the locking section, exerts a constant locking force on the bolt in the same direction as a force that would tighten the nut. In this nut, the load-carrying section has the thread strength of a standard nut of comparable size, while the locking section presses against the threads of the bolt and locks the nut firmly in position. Only a wrench applied to the nut loosens it. The nut can be removed and reused without impairing its efficiency.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [71.99229431152344, 254.34637451171875, 313.91229248046875, 278.3163757324219], "page": 1, "span": [0, 122], "__ref_s3_data": null}], "text": "Boots self-locking nuts are made with three different spring styles and in various shapes and sizes. The wing type that is", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [72.0, 60.99040222167969, 184.14828491210938, 71.80239868164062], "page": 1, "span": [0, 31], "__ref_s3_data": null}], "text": "Figure 7-26. Self-locking nuts.", "type": "caption", "payload": null, "name": "Caption", "font": null}, {"name": "Picture", "type": "figure", "$ref": "#/figures/0"}, {"prov": [{"bbox": [320.9923095703125, 656.3463745117188, 561.808349609375, 730.3163452148438], "page": 1, "span": [0, 368], "__ref_s3_data": null}], "text": "the most common ranges in size for No. 6 up to 1 / 4 inch, the Rol-top ranges from 1 / 4 inch to 1 / 6 inch, and the bellows type ranges in size from No. 8 up to 3 / 8 inch. Wing-type nuts are made of anodized aluminum alloy, cadmium-plated carbon steel, or stainless steel. The Rol-top nut is cadmium-plated steel, and the bellows type is made of aluminum alloy only.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [320.99542236328125, 643.8463745117188, 325.99542236328125, 655.3163452148438], "page": 1, "span": [0, 1], "__ref_s3_data": null}], "text": ".", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [320.99542236328125, 631.3463745117188, 450.99542236328125, 642.6864013671875], "page": 1, "span": [0, 32], "__ref_s3_data": null}], "text": "Stainless Steel Self-Locking Nut", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [320.99542236328125, 416.84637451171875, 568.00439453125, 628.3163452148438], "page": 1, "span": [0, 1015], "__ref_s3_data": null}], "text": "The stainless steel self-locking nut may be spun on and off by hand as its locking action takes places only when the nut is seated against a solid surface and tightened. The nut consists of two parts: a case with a beveled locking shoulder and key and a thread insert with a locking shoulder and slotted keyway. Until the nut is tightened, it spins on the bolt easily, because the threaded insert is the proper size for the bolt. However, when the nut is seated against a solid surface and tightened, the locking shoulder of the insert is pulled downward and wedged against the locking shoulder of the case. This action compresses the threaded insert and causes it to clench the bolt tightly. The cross-sectional view in Figure 7-27 shows how the key of the case fits into the slotted keyway of the insert so that when the case is turned, the threaded insert is turned with it. Note that the slot is wider than the key. This permits the slot to be narrowed and the insert to be compressed when the nut is tightened.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [320.99542236328125, 391.84637451171875, 388.50543212890625, 403.1863708496094], "page": 1, "span": [0, 16], "__ref_s3_data": null}], "text": "Elastic Stop Nut", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [320.99542236328125, 364.84637451171875, 552.351318359375, 388.8163757324219], "page": 1, "span": [0, 108], "__ref_s3_data": null}], "text": "The elastic stop nut is a standard nut with the height increased to accommodate a fiber locking collar. This", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [321.0, 63.01040267944336, 481.6493225097656, 73.82240295410156], "page": 1, "span": [0, 46], "__ref_s3_data": null}], "text": "Figure 7-27. Stainless steel self-locking nut.", "type": "caption", "payload": null, "name": "Caption", "font": null}, {"name": "Picture", "type": "figure", "$ref": "#/figures/1"}, {"prov": [{"bbox": [537.9854125976562, 33.70970153808594, 560.775390625, 46.01969909667969], "page": 1, "span": [0, 4], "__ref_s3_data": null}], "text": "7-45", "type": "page-footer", "payload": null, "name": "Page-footer", "font": null}], "figures": [{"prov": [{"bbox": [70.59269714355469, 79.6090087890625, 309.863037109375, 242.77777099609375], "page": 1, "span": [0, 31], "__ref_s3_data": null}], "text": "Figure 7-26. Self-locking nuts.", "type": "figure", "payload": null, "bounding-box": null}, {"prov": [{"bbox": [320.4467468261719, 81.689208984375, 558.8576049804688, 352.359375], "page": 1, "span": [0, 46], "__ref_s3_data": null}], "text": "Figure 7-27. Stainless steel self-locking nut.", "type": "figure", "payload": null, "bounding-box": null}], "tables": [], "bitmaps": null, "equations": [], "footnotes": [], "page-dimensions": [{"height": 774.0, "page": 1, "width": 594.0}], "page-footers": [], "page-headers": [], "_s3_data": null, "identifiers": null}
\ No newline at end of file
+{"_name": "", "type": "pdf-document", "description": {"title": null, "abstract": null, "authors": null, "affiliations": null, "subjects": null, "keywords": null, "publication_date": null, "languages": null, "license": null, "publishers": null, "url_refs": null, "references": null, "publication": null, "reference_count": null, "citation_count": null, "citation_date": null, "advanced": null, "analytics": null, "logs": [], "collection": null, "acquisition": null}, "file-info": {"filename": "amt_handbook_sample.pdf", "filename-prov": null, "document-hash": "4ba7cdbd9ce8155d692d8f477f88bb3ec1acc2a463cf1e0209d1e624e58ebce9", "#-pages": 1, "collection-name": null, "description": null, "page-hashes": [{"hash": "f31706a847734c62e1e41f9f792c756283d1d4955552c1cc7f5e23c351bdd7cb", "model": "default", "page": 1}]}, "main-text": [{"prov": [{"bbox": [71.992126, 681.34637, 314.11212, 730.31635], "page": 1, "span": [0, 244], "__ref_s3_data": null}], "text": "pulleys, provided the inner race of the bearing is clamped to the supporting structure by the nut and bolt. Plates must be attached to the structure in a positive manner to eliminate rotation or misalignment when tightening the bolts or screws.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [71.992302, 593.84637, 313.1546, 667.81635], "page": 1, "span": [0, 376], "__ref_s3_data": null}], "text": "The two general types of self-locking nuts currently in use are the all-metal type and the fiber lock type. For the sake of simplicity, only three typical kinds of self-locking nuts are considered in this handbook: the Boots self-locking and the stainless steel self-locking nuts, representing the all-metal types; and the elastic stop nut, representing the fiber insert type.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [71.992302, 568.84637, 167.27231, 580.1864], "page": 1, "span": [0, 22], "__ref_s3_data": null}], "text": "Boots Self-Locking Nut", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [71.992294, 491.84637000000004, 318.49225, 565.81635], "page": 1, "span": [0, 319], "__ref_s3_data": null}], "text": "The Boots self-locking nut is of one piece, all-metal construction designed to hold tight despite severe vibration. Note in Figure 7-26 that it has two sections and is essentially two nuts in one: a locking nut and a load-carrying nut. The two sections are connected with a spring, which is an integral part of the nut.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [71.992294, 404.34637000000004, 316.65729, 478.31638000000004], "page": 1, "span": [0, 332], "__ref_s3_data": null}], "text": "The spring keeps the locking and load-carrying sections such a distance apart that the two sets of threads are out of phase or spaced so that a bolt, which has been screwed through the load-carrying section, must push the locking section outward against the force of the spring to engage the threads of the locking section properly.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [71.992294, 291.84637, 318.81229, 390.81638000000004], "page": 1, "span": [0, 477], "__ref_s3_data": null}], "text": "The spring, through the medium of the locking section, exerts a constant locking force on the bolt in the same direction as a force that would tighten the nut. In this nut, the load-carrying section has the thread strength of a standard nut of comparable size, while the locking section presses against the threads of the bolt and locks the nut firmly in position. Only a wrench applied to the nut loosens it. The nut can be removed and reused without impairing its efficiency.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [71.992294, 254.34636999999998, 313.91229, 278.31638], "page": 1, "span": [0, 122], "__ref_s3_data": null}], "text": "Boots self-locking nuts are made with three different spring styles and in various shapes and sizes. The wing type that is", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"name": "Picture", "type": "figure", "$ref": "#/figures/0"}, {"prov": [{"bbox": [320.99231, 656.34637, 561.80835, 730.31635], "page": 1, "span": [0, 368], "__ref_s3_data": null}], "text": "the most common ranges in size for No. 6 up to 1 / 4 inch, the Rol-top ranges from 1 / 4 inch to 1 / 6 inch, and the bellows type ranges in size from No. 8 up to 3 / 8 inch. Wing-type nuts are made of anodized aluminum alloy, cadmium-plated carbon steel, or stainless steel. The Rol-top nut is cadmium-plated steel, and the bellows type is made of aluminum alloy only.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [320.99542, 643.84637, 325.99542, 655.31635], "page": 1, "span": [0, 1], "__ref_s3_data": null}], "text": ".", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [320.99542, 631.34637, 450.99542, 642.6864], "page": 1, "span": [0, 32], "__ref_s3_data": null}], "text": "Stainless Steel Self-Locking Nut", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [320.99542, 416.84637000000004, 568.00439, 628.31635], "page": 1, "span": [0, 1015], "__ref_s3_data": null}], "text": "The stainless steel self-locking nut may be spun on and off by hand as its locking action takes places only when the nut is seated against a solid surface and tightened. The nut consists of two parts: a case with a beveled locking shoulder and key and a thread insert with a locking shoulder and slotted keyway. Until the nut is tightened, it spins on the bolt easily, because the threaded insert is the proper size for the bolt. However, when the nut is seated against a solid surface and tightened, the locking shoulder of the insert is pulled downward and wedged against the locking shoulder of the case. This action compresses the threaded insert and causes it to clench the bolt tightly. The cross-sectional view in Figure 7-27 shows how the key of the case fits into the slotted keyway of the insert so that when the case is turned, the threaded insert is turned with it. Note that the slot is wider than the key. This permits the slot to be narrowed and the insert to be compressed when the nut is tightened.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [320.99542, 391.84637000000004, 388.50543, 403.18636999999995], "page": 1, "span": [0, 16], "__ref_s3_data": null}], "text": "Elastic Stop Nut", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [320.99542, 364.84637000000004, 552.35132, 388.81638000000004], "page": 1, "span": [0, 108], "__ref_s3_data": null}], "text": "The elastic stop nut is a standard nut with the height increased to accommodate a fiber locking collar. This", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"name": "Picture", "type": "figure", "$ref": "#/figures/1"}], "figures": [{"prov": [{"bbox": [70.59269714355469, 79.6090087890625, 309.863037109375, 242.77777099609375], "page": 1, "span": [0, 31], "__ref_s3_data": null}], "text": "Figure 7-26. Self-locking nuts.", "type": "figure", "payload": null, "bounding-box": null}, {"prov": [{"bbox": [320.4467468261719, 81.689208984375, 558.8576049804688, 352.359375], "page": 1, "span": [0, 46], "__ref_s3_data": null}], "text": "Figure 7-27. Stainless steel self-locking nut.", "type": "figure", "payload": null, "bounding-box": null}], "tables": [], "bitmaps": null, "equations": [], "footnotes": [], "page-dimensions": [{"height": 774.0, "page": 1, "width": 594.0}], "page-footers": [], "page-headers": [], "_s3_data": null, "identifiers": null}
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v1/amt_handbook_sample.pages.json b/tests/data/groundtruth/docling_v1/amt_handbook_sample.pages.json
index 4bbc5e28..7586ceaf 100644
--- a/tests/data/groundtruth/docling_v1/amt_handbook_sample.pages.json
+++ b/tests/data/groundtruth/docling_v1/amt_handbook_sample.pages.json
@@ -1 +1 @@
-[{"page_no": 0, "size": {"width": 594.0, "height": 774.0}, "cells": [{"id": 0, "text": "pulleys, provided the inner race of the bearing is clamped ", "bbox": {"l": 71.992126, "t": 43.68364999999994, "r": 300.23203, "b": 55.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "to the supporting structure by the nut and bolt. Plates must ", "bbox": {"l": 71.992126, "t": 56.18364999999994, "r": 302.00214, "b": 67.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "be attached to the structure in a positive manner to eliminate ", "bbox": {"l": 71.992126, "t": 68.68364999999994, "r": 309.82214, "b": 80.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "rotation or misalignment when tightening the bolts or screws. ", "bbox": {"l": 71.992126, "t": 81.18364999999994, "r": 314.11212, "b": 92.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "The two general types of self-locking nuts currently in use ", "bbox": {"l": 71.992302, "t": 106.18364999999994, "r": 305.15311, "b": 117.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "are the all-metal type and the fiber lock type. For the sake of ", "bbox": {"l": 71.993103, "t": 118.68364999999994, "r": 309.98309, "b": 130.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "simplicity, only three typical kinds of self-locking nuts are ", "bbox": {"l": 71.993103, "t": 131.18364999999994, "r": 302.44312, "b": 142.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "considered in this handbook: the Boots self-locking and the ", "bbox": {"l": 71.993103, "t": 143.68364999999994, "r": 306.25311, "b": 155.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "stainless steel self-locking nuts, representing the all-metal ", "bbox": {"l": 71.993103, "t": 156.18364999999994, "r": 303.9931, "b": 167.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "types; and the elastic stop nut, representing ", "bbox": {"l": 71.993103, "t": 168.68364999999994, "r": 238.6723, "b": 180.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "the fiber insert type. ", "bbox": {"l": 234.26460000000003, "t": 168.68364999999994, "r": 313.1546, "b": 180.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Boots Self-Locking Nut ", "bbox": {"l": 71.992302, "t": 193.81359999999995, "r": 167.27231, "b": 205.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "The Boots self-locking nut is of one piece, all-metal ", "bbox": {"l": 71.992302, "t": 208.18364999999994, "r": 302.27719, "b": 219.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "construction designed to hold tight despite severe vibration. ", "bbox": {"l": 71.992294, "t": 220.68364999999994, "r": 313.33026, "b": 232.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Note in ", "bbox": {"l": 71.992294, "t": 233.18364999999994, "r": 104.12231, "b": 244.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Figure 7-26", "bbox": {"l": 104.12231, "t": 233.31359999999995, "r": 152.05231, "b": 244.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": " that it has two sections and is essentially ", "bbox": {"l": 152.05231, "t": 233.18364999999994, "r": 318.49225, "b": 244.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "two nuts in one: a locking nut and a load-carrying nut. The ", "bbox": {"l": 71.992294, "t": 245.68364999999994, "r": 309.42929, "b": 257.15363, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "two sections are connected with a spring, which is an integral ", "bbox": {"l": 71.992294, "t": 258.18364999999994, "r": 317.76227, "b": 269.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "part of the nut. ", "bbox": {"l": 71.992294, "t": 270.68361999999996, "r": 133.3723, "b": 282.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "The spring keeps the locking and load-carrying sections such ", "bbox": {"l": 71.992294, "t": 295.68361999999996, "r": 316.41028, "b": 307.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "a distance apart that the two sets of threads are out of phase ", "bbox": {"l": 71.992294, "t": 308.18361999999996, "r": 312.20731, "b": 319.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "or spaced so that a bolt, which has been screwed through the ", "bbox": {"l": 71.992294, "t": 320.68361999999996, "r": 316.65729, "b": 332.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "load-carrying section, must push the locking section outward ", "bbox": {"l": 71.992294, "t": 333.18361999999996, "r": 315.91229, "b": 344.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "against the force of the spring to engage the threads of the ", "bbox": {"l": 71.992294, "t": 345.68361999999996, "r": 306.34927, "b": 357.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "locking section properly. ", "bbox": {"l": 71.992294, "t": 358.18361999999996, "r": 174.2023, "b": 369.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "The spring, through the medium of the locking section, exerts ", "bbox": {"l": 71.992294, "t": 383.18361999999996, "r": 317.07227, "b": 394.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "a constant locking force on the bolt in the same direction as a ", "bbox": {"l": 71.992294, "t": 395.68361999999996, "r": 318.81229, "b": 407.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "force that would tighten the nut. In this nut, the load-carrying ", "bbox": {"l": 71.992294, "t": 408.18361999999996, "r": 317.5123, "b": 419.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "section has the thread strength of a standard nut of comparable ", "bbox": {"l": 71.992294, "t": 420.68361999999996, "r": 317.31229, "b": 432.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "size, while the locking section presses against the threads of ", "bbox": {"l": 71.992294, "t": 433.18361999999996, "r": 314.45929, "b": 444.65363, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "the bolt and locks the nut firmly in position. Only a wrench ", "bbox": {"l": 71.992294, "t": 445.68362, "r": 311.7023, "b": 457.15363, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "applied to the nut loosens it. The nut can be removed and ", "bbox": {"l": 71.992294, "t": 458.18362, "r": 303.35229, "b": 469.65363, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "reused without impairing its efficiency. ", "bbox": {"l": 71.992294, "t": 470.68362, "r": 231.97228999999996, "b": 482.15363, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Boots self-locking nuts are made with three different spring ", "bbox": {"l": 71.992294, "t": 495.68362, "r": 313.34229, "b": 507.15363, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "styles and in various shapes and sizes. The wing type that is ", "bbox": {"l": 71.992294, "t": 508.18362, "r": 313.91229, "b": 519.65363, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "the most common ranges in size for No. 6 up to ", "bbox": {"l": 320.99231, "t": 43.68364999999994, "r": 513.74628, "b": 55.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "1", "bbox": {"l": 514.06342, "t": 44.52013999999997, "r": 516.81342, "b": 50.828610000000026, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "\u2044", "bbox": {"l": 516.81342, "t": 43.68364999999994, "r": 518.4834, "b": 55.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "4", "bbox": {"l": 518.25842, "t": 47.72014999999999, "r": 523.00525, "b": 54.02863000000002, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "inch, the ", "bbox": {"l": 525.37872, "t": 47.72014999999999, "r": 560.44843, "b": 54.02863000000002, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Rol-top ranges from ", "bbox": {"l": 320.99841, "t": 56.18364999999994, "r": 404.58441, "b": 67.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "1", "bbox": {"l": 404.48981, "t": 57.02013999999997, "r": 407.23981, "b": 63.328610000000026, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "\u2044", "bbox": {"l": 407.23981, "t": 56.18364999999994, "r": 408.90982, "b": 67.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "4", "bbox": {"l": 408.68481, "t": 60.22014999999999, "r": 413.38376, "b": 66.52863000000002, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "inch to ", "bbox": {"l": 415.73322, "t": 60.22014999999999, "r": 443.92681999999996, "b": 66.52863000000002, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "1", "bbox": {"l": 443.82598999999993, "t": 57.02013999999997, "r": 446.57598999999993, "b": 63.328610000000026, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "\u2044", "bbox": {"l": 446.57598999999993, "t": 56.18364999999994, "r": 448.24600000000004, "b": 67.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "6", "bbox": {"l": 448.22588999999994, "t": 60.22014999999999, "r": 453.12659, "b": 66.52863000000002, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "inch, and the bellows type ", "bbox": {"l": 455.57697, "t": 60.22014999999999, "r": 560.6579, "b": 66.52863000000002, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "ranges in size from No. 8 up to ", "bbox": {"l": 320.99591, "t": 68.68364999999994, "r": 447.36591000000004, "b": 80.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "3", "bbox": {"l": 448.79668999999996, "t": 69.52013999999997, "r": 451.54668999999996, "b": 75.82861000000003, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "\u2044", "bbox": {"l": 451.50549, "t": 68.68364999999994, "r": 453.17551, "b": 80.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "8", "bbox": {"l": 453.17542000000003, "t": 72.72014999999999, "r": 458.07175000000007, "b": 79.02863000000002, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "inch. Wing-type nuts are ", "bbox": {"l": 460.51993, "t": 72.72014999999999, "r": 559.78839, "b": 79.02863000000002, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "made of anodized aluminum alloy, cadmium-plated carbon ", "bbox": {"l": 320.99542, "t": 81.18364999999994, "r": 559.77844, "b": 92.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "steel, or stainless steel. The Rol-top nut is cadmium-plated ", "bbox": {"l": 320.99542, "t": 93.68364999999994, "r": 557.87738, "b": 105.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "steel, and the bellows type is made of aluminum alloy only. ", "bbox": {"l": 320.99542, "t": 106.18364999999994, "r": 561.80835, "b": 117.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": ". ", "bbox": {"l": 320.99542, "t": 118.68364999999994, "r": 325.99542, "b": 130.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Stainless Steel Self-Locking Nut ", "bbox": {"l": 320.99542, "t": 131.31359999999995, "r": 450.99542, "b": 142.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "The stainless steel self-locking nut may be spun on and off ", "bbox": {"l": 320.99542, "t": 145.68364999999994, "r": 558.39838, "b": 157.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "by hand as its locking action takes places only when the ", "bbox": {"l": 320.99542, "t": 158.18364999999994, "r": 547.92542, "b": 169.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "nut is seated against a solid surface and tightened. The nut ", "bbox": {"l": 320.99542, "t": 170.68364999999994, "r": 556.50842, "b": 182.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "consists of two parts: a case with a beveled locking shoulder ", "bbox": {"l": 320.99542, "t": 183.18364999999994, "r": 565.11346, "b": 194.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "and key and a thread insert with a locking shoulder and ", "bbox": {"l": 320.99542, "t": 195.68364999999994, "r": 547.93744, "b": 207.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "slotted keyway. Until the nut is tightened, it spins on the ", "bbox": {"l": 320.99542, "t": 208.18364999999994, "r": 549.00647, "b": 219.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "bolt easily, because the threaded insert is the proper size ", "bbox": {"l": 320.99542, "t": 220.68364999999994, "r": 549.0755, "b": 232.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "for the bolt. However, when the nut is seated against a solid ", "bbox": {"l": 320.99542, "t": 233.18364999999994, "r": 562.60242, "b": 244.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "surface and tightened, the locking shoulder of the insert is ", "bbox": {"l": 320.99542, "t": 245.68364999999994, "r": 555.11243, "b": 257.15363, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "pulled downward and wedged against the locking shoulder ", "bbox": {"l": 320.99542, "t": 258.18364999999994, "r": 558.74146, "b": 269.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "of the case. This action compresses the threaded insert and ", "bbox": {"l": 320.99542, "t": 270.68361999999996, "r": 557.88538, "b": 282.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "causes it to clench the bolt tightly. The cross-sectional view ", "bbox": {"l": 320.99542, "t": 283.18361999999996, "r": 562.3114, "b": 294.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "in ", "bbox": {"l": 320.99542, "t": 295.68361999999996, "r": 331.27542, "b": 307.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "Figure 7-27", "bbox": {"l": 331.81543, "t": 295.81363000000005, "r": 379.86542, "b": 307.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": " shows how the key of the case fits into the ", "bbox": {"l": 379.86542, "t": 295.68361999999996, "r": 554.56543, "b": 307.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "slotted keyway of the insert so that when the case is turned, ", "bbox": {"l": 320.99542, "t": 308.18361999999996, "r": 561.16339, "b": 319.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "the threaded insert is turned with it. Note that the slot is wider ", "bbox": {"l": 320.99542, "t": 320.68361999999996, "r": 568.00439, "b": 332.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "than the key. This permits the slot to be narrowed and the ", "bbox": {"l": 320.99542, "t": 333.18361999999996, "r": 553.46545, "b": 344.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "insert to be compressed when the nut is tightened. ", "bbox": {"l": 320.99542, "t": 345.68361999999996, "r": 523.19543, "b": 357.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "Elastic Stop Nut ", "bbox": {"l": 320.99542, "t": 370.81363000000005, "r": 388.50543, "b": 382.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "The elastic stop nut is a standard nut with the height ", "bbox": {"l": 320.99542, "t": 385.18361999999996, "r": 548.72437, "b": 396.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "increased to accommodate a fiber locking collar. This ", "bbox": {"l": 320.99542, "t": 397.68361999999996, "r": 552.35132, "b": 409.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "Tightened nut ", "bbox": {"l": 479.1354999999999, "t": 672.7346, "r": 531.16748, "b": 682.646599, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "Untightened nut ", "bbox": {"l": 474.3699, "t": 531.8918, "r": 535.23389, "b": 541.8037999999999, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "Nut case ", "bbox": {"l": 456.7558900000001, "t": 431.99741, "r": 487.08388999999994, "b": 441.6134, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "Threaded nut core ", "bbox": {"l": 434.62299, "t": 577.8235, "r": 497.47183000000007, "b": 587.4395, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Locking shoulder ", "bbox": {"l": 448.55081, "t": 553.3206, "r": 507.686, "b": 562.9366, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Keyway ", "bbox": {"l": 424.78421, "t": 664.1116, "r": 452.10339000000005, "b": 673.7275999999999, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "Boots aircraft nut ", "bbox": {"l": 102.4155, "t": 587.76491, "r": 161.3187, "b": 597.38091, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "Flexloc nut ", "bbox": {"l": 91.685997, "t": 679.309799, "r": 129.77399, "b": 688.925797, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "Fiber locknut ", "bbox": {"l": 162.48109, "t": 679.309799, "r": 207.85629, "b": 688.925797, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "Elastic stop nut ", "bbox": {"l": 237.31379999999996, "t": 679.309799, "r": 289.561, "b": 688.925797, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Elastic anchor nut ", "bbox": {"l": 216.9326, "t": 587.76491, "r": 277.7966, "b": 597.38091, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "Figure 7-26. ", "bbox": {"l": 72.0, "t": 702.457596, "r": 119.12800000000001, "b": 713.009598, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "Self-locking nuts. ", "bbox": {"l": 119.4023, "t": 702.197601, "r": 184.14828, "b": 712.403599, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "Figure 7-27. ", "bbox": {"l": 321.0, "t": 700.437599, "r": 368.12799, "b": 710.989597, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "Stainless steel self-locking nut. ", "bbox": {"l": 368.40231, "t": 700.177597, "r": 481.64931999999993, "b": 710.383598, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "7-45 ", "bbox": {"l": 537.98541, "t": 727.980301, "r": 560.77539, "b": 740.290298, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 8, "label": "text", "bbox": {"l": 71.992126, "t": 43.68364999999994, "r": 314.11212, "b": 92.65363000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9851651191711426, "cells": [{"id": 0, "text": "pulleys, provided the inner race of the bearing is clamped ", "bbox": {"l": 71.992126, "t": 43.68364999999994, "r": 300.23203, "b": 55.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "to the supporting structure by the nut and bolt. Plates must ", "bbox": {"l": 71.992126, "t": 56.18364999999994, "r": 302.00214, "b": 67.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "be attached to the structure in a positive manner to eliminate ", "bbox": {"l": 71.992126, "t": 68.68364999999994, "r": 309.82214, "b": 80.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "rotation or misalignment when tightening the bolts or screws. ", "bbox": {"l": 71.992126, "t": 81.18364999999994, "r": 314.11212, "b": 92.65363000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "text", "bbox": {"l": 71.992302, "t": 106.18364999999994, "r": 313.1546, "b": 180.15363000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9873439073562622, "cells": [{"id": 4, "text": "The two general types of self-locking nuts currently in use ", "bbox": {"l": 71.992302, "t": 106.18364999999994, "r": 305.15311, "b": 117.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "are the all-metal type and the fiber lock type. For the sake of ", "bbox": {"l": 71.993103, "t": 118.68364999999994, "r": 309.98309, "b": 130.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "simplicity, only three typical kinds of self-locking nuts are ", "bbox": {"l": 71.993103, "t": 131.18364999999994, "r": 302.44312, "b": 142.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "considered in this handbook: the Boots self-locking and the ", "bbox": {"l": 71.993103, "t": 143.68364999999994, "r": 306.25311, "b": 155.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "stainless steel self-locking nuts, representing the all-metal ", "bbox": {"l": 71.993103, "t": 156.18364999999994, "r": 303.9931, "b": 167.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "types; and the elastic stop nut, representing ", "bbox": {"l": 71.993103, "t": 168.68364999999994, "r": 238.6723, "b": 180.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "the fiber insert type. ", "bbox": {"l": 234.26460000000003, "t": 168.68364999999994, "r": 313.1546, "b": 180.15363000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "section_header", "bbox": {"l": 71.992302, "t": 193.81359999999995, "r": 167.27231, "b": 205.15363000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9309079647064209, "cells": [{"id": 11, "text": "Boots Self-Locking Nut ", "bbox": {"l": 71.992302, "t": 193.81359999999995, "r": 167.27231, "b": 205.15363000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "text", "bbox": {"l": 71.992294, "t": 208.18364999999994, "r": 318.49225, "b": 282.15362999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9866572022438049, "cells": [{"id": 12, "text": "The Boots self-locking nut is of one piece, all-metal ", "bbox": {"l": 71.992302, "t": 208.18364999999994, "r": 302.27719, "b": 219.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "construction designed to hold tight despite severe vibration. ", "bbox": {"l": 71.992294, "t": 220.68364999999994, "r": 313.33026, "b": 232.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Note in ", "bbox": {"l": 71.992294, "t": 233.18364999999994, "r": 104.12231, "b": 244.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Figure 7-26", "bbox": {"l": 104.12231, "t": 233.31359999999995, "r": 152.05231, "b": 244.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": " that it has two sections and is essentially ", "bbox": {"l": 152.05231, "t": 233.18364999999994, "r": 318.49225, "b": 244.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "two nuts in one: a locking nut and a load-carrying nut. The ", "bbox": {"l": 71.992294, "t": 245.68364999999994, "r": 309.42929, "b": 257.15363, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "two sections are connected with a spring, which is an integral ", "bbox": {"l": 71.992294, "t": 258.18364999999994, "r": 317.76227, "b": 269.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "part of the nut. ", "bbox": {"l": 71.992294, "t": 270.68361999999996, "r": 133.3723, "b": 282.15362999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 71.992294, "t": 295.68361999999996, "r": 316.65729, "b": 369.65362999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9881331324577332, "cells": [{"id": 20, "text": "The spring keeps the locking and load-carrying sections such ", "bbox": {"l": 71.992294, "t": 295.68361999999996, "r": 316.41028, "b": 307.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "a distance apart that the two sets of threads are out of phase ", "bbox": {"l": 71.992294, "t": 308.18361999999996, "r": 312.20731, "b": 319.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "or spaced so that a bolt, which has been screwed through the ", "bbox": {"l": 71.992294, "t": 320.68361999999996, "r": 316.65729, "b": 332.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "load-carrying section, must push the locking section outward ", "bbox": {"l": 71.992294, "t": 333.18361999999996, "r": 315.91229, "b": 344.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "against the force of the spring to engage the threads of the ", "bbox": {"l": 71.992294, "t": 345.68361999999996, "r": 306.34927, "b": 357.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "locking section properly. ", "bbox": {"l": 71.992294, "t": 358.18361999999996, "r": 174.2023, "b": 369.65362999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 71.992294, "t": 383.18361999999996, "r": 318.81229, "b": 482.15363, "coord_origin": "TOPLEFT"}, "confidence": 0.9882921576499939, "cells": [{"id": 26, "text": "The spring, through the medium of the locking section, exerts ", "bbox": {"l": 71.992294, "t": 383.18361999999996, "r": 317.07227, "b": 394.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "a constant locking force on the bolt in the same direction as a ", "bbox": {"l": 71.992294, "t": 395.68361999999996, "r": 318.81229, "b": 407.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "force that would tighten the nut. In this nut, the load-carrying ", "bbox": {"l": 71.992294, "t": 408.18361999999996, "r": 317.5123, "b": 419.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "section has the thread strength of a standard nut of comparable ", "bbox": {"l": 71.992294, "t": 420.68361999999996, "r": 317.31229, "b": 432.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "size, while the locking section presses against the threads of ", "bbox": {"l": 71.992294, "t": 433.18361999999996, "r": 314.45929, "b": 444.65363, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "the bolt and locks the nut firmly in position. Only a wrench ", "bbox": {"l": 71.992294, "t": 445.68362, "r": 311.7023, "b": 457.15363, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "applied to the nut loosens it. The nut can be removed and ", "bbox": {"l": 71.992294, "t": 458.18362, "r": 303.35229, "b": 469.65363, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "reused without impairing its efficiency. ", "bbox": {"l": 71.992294, "t": 470.68362, "r": 231.97228999999996, "b": 482.15363, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 71.992294, "t": 495.68362, "r": 313.91229, "b": 519.65363, "coord_origin": "TOPLEFT"}, "confidence": 0.9695364832878113, "cells": [{"id": 34, "text": "Boots self-locking nuts are made with three different spring ", "bbox": {"l": 71.992294, "t": 495.68362, "r": 313.34229, "b": 507.15363, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "styles and in various shapes and sizes. The wing type that is ", "bbox": {"l": 71.992294, "t": 508.18362, "r": 313.91229, "b": 519.65363, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "text", "bbox": {"l": 320.99231, "t": 43.68364999999994, "r": 561.80835, "b": 117.65363000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9870070219039917, "cells": [{"id": 36, "text": "the most common ranges in size for No. 6 up to ", "bbox": {"l": 320.99231, "t": 43.68364999999994, "r": 513.74628, "b": 55.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "1", "bbox": {"l": 514.06342, "t": 44.52013999999997, "r": 516.81342, "b": 50.828610000000026, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "\u2044", "bbox": {"l": 516.81342, "t": 43.68364999999994, "r": 518.4834, "b": 55.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "4", "bbox": {"l": 518.25842, "t": 47.72014999999999, "r": 523.00525, "b": 54.02863000000002, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "inch, the ", "bbox": {"l": 525.37872, "t": 47.72014999999999, "r": 560.44843, "b": 54.02863000000002, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Rol-top ranges from ", "bbox": {"l": 320.99841, "t": 56.18364999999994, "r": 404.58441, "b": 67.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "1", "bbox": {"l": 404.48981, "t": 57.02013999999997, "r": 407.23981, "b": 63.328610000000026, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "\u2044", "bbox": {"l": 407.23981, "t": 56.18364999999994, "r": 408.90982, "b": 67.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "4", "bbox": {"l": 408.68481, "t": 60.22014999999999, "r": 413.38376, "b": 66.52863000000002, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "inch to ", "bbox": {"l": 415.73322, "t": 60.22014999999999, "r": 443.92681999999996, "b": 66.52863000000002, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "1", "bbox": {"l": 443.82598999999993, "t": 57.02013999999997, "r": 446.57598999999993, "b": 63.328610000000026, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "\u2044", "bbox": {"l": 446.57598999999993, "t": 56.18364999999994, "r": 448.24600000000004, "b": 67.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "6", "bbox": {"l": 448.22588999999994, "t": 60.22014999999999, "r": 453.12659, "b": 66.52863000000002, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "inch, and the bellows type ", "bbox": {"l": 455.57697, "t": 60.22014999999999, "r": 560.6579, "b": 66.52863000000002, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "ranges in size from No. 8 up to ", "bbox": {"l": 320.99591, "t": 68.68364999999994, "r": 447.36591000000004, "b": 80.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "3", "bbox": {"l": 448.79668999999996, "t": 69.52013999999997, "r": 451.54668999999996, "b": 75.82861000000003, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "\u2044", "bbox": {"l": 451.50549, "t": 68.68364999999994, "r": 453.17551, "b": 80.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "8", "bbox": {"l": 453.17542000000003, "t": 72.72014999999999, "r": 458.07175000000007, "b": 79.02863000000002, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "inch. Wing-type nuts are ", "bbox": {"l": 460.51993, "t": 72.72014999999999, "r": 559.78839, "b": 79.02863000000002, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "made of anodized aluminum alloy, cadmium-plated carbon ", "bbox": {"l": 320.99542, "t": 81.18364999999994, "r": 559.77844, "b": 92.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "steel, or stainless steel. The Rol-top nut is cadmium-plated ", "bbox": {"l": 320.99542, "t": 93.68364999999994, "r": 557.87738, "b": 105.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "steel, and the bellows type is made of aluminum alloy only. ", "bbox": {"l": 320.99542, "t": 106.18364999999994, "r": 561.80835, "b": 117.65363000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 320.99542, "t": 118.68364999999994, "r": 325.99542, "b": 130.15363000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": ". ", "bbox": {"l": 320.99542, "t": 118.68364999999994, "r": 325.99542, "b": 130.15363000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "section_header", "bbox": {"l": 320.99542, "t": 131.31359999999995, "r": 450.99542, "b": 142.65363000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9263731241226196, "cells": [{"id": 59, "text": "Stainless Steel Self-Locking Nut ", "bbox": {"l": 320.99542, "t": 131.31359999999995, "r": 450.99542, "b": 142.65363000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 320.99542, "t": 145.68364999999994, "r": 568.00439, "b": 357.15362999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9879258871078491, "cells": [{"id": 60, "text": "The stainless steel self-locking nut may be spun on and off ", "bbox": {"l": 320.99542, "t": 145.68364999999994, "r": 558.39838, "b": 157.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "by hand as its locking action takes places only when the ", "bbox": {"l": 320.99542, "t": 158.18364999999994, "r": 547.92542, "b": 169.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "nut is seated against a solid surface and tightened. The nut ", "bbox": {"l": 320.99542, "t": 170.68364999999994, "r": 556.50842, "b": 182.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "consists of two parts: a case with a beveled locking shoulder ", "bbox": {"l": 320.99542, "t": 183.18364999999994, "r": 565.11346, "b": 194.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "and key and a thread insert with a locking shoulder and ", "bbox": {"l": 320.99542, "t": 195.68364999999994, "r": 547.93744, "b": 207.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "slotted keyway. Until the nut is tightened, it spins on the ", "bbox": {"l": 320.99542, "t": 208.18364999999994, "r": 549.00647, "b": 219.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "bolt easily, because the threaded insert is the proper size ", "bbox": {"l": 320.99542, "t": 220.68364999999994, "r": 549.0755, "b": 232.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "for the bolt. However, when the nut is seated against a solid ", "bbox": {"l": 320.99542, "t": 233.18364999999994, "r": 562.60242, "b": 244.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "surface and tightened, the locking shoulder of the insert is ", "bbox": {"l": 320.99542, "t": 245.68364999999994, "r": 555.11243, "b": 257.15363, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "pulled downward and wedged against the locking shoulder ", "bbox": {"l": 320.99542, "t": 258.18364999999994, "r": 558.74146, "b": 269.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "of the case. This action compresses the threaded insert and ", "bbox": {"l": 320.99542, "t": 270.68361999999996, "r": 557.88538, "b": 282.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "causes it to clench the bolt tightly. The cross-sectional view ", "bbox": {"l": 320.99542, "t": 283.18361999999996, "r": 562.3114, "b": 294.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "in ", "bbox": {"l": 320.99542, "t": 295.68361999999996, "r": 331.27542, "b": 307.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "Figure 7-27", "bbox": {"l": 331.81543, "t": 295.81363000000005, "r": 379.86542, "b": 307.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": " shows how the key of the case fits into the ", "bbox": {"l": 379.86542, "t": 295.68361999999996, "r": 554.56543, "b": 307.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "slotted keyway of the insert so that when the case is turned, ", "bbox": {"l": 320.99542, "t": 308.18361999999996, "r": 561.16339, "b": 319.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "the threaded insert is turned with it. Note that the slot is wider ", "bbox": {"l": 320.99542, "t": 320.68361999999996, "r": 568.00439, "b": 332.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "than the key. This permits the slot to be narrowed and the ", "bbox": {"l": 320.99542, "t": 333.18361999999996, "r": 553.46545, "b": 344.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "insert to be compressed when the nut is tightened. ", "bbox": {"l": 320.99542, "t": 345.68361999999996, "r": 523.19543, "b": 357.15362999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "section_header", "bbox": {"l": 320.99542, "t": 370.81363000000005, "r": 388.50543, "b": 382.15362999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9253151416778564, "cells": [{"id": 79, "text": "Elastic Stop Nut ", "bbox": {"l": 320.99542, "t": 370.81363000000005, "r": 388.50543, "b": 382.15362999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "text", "bbox": {"l": 320.99542, "t": 385.18361999999996, "r": 552.35132, "b": 409.15362999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9676452875137329, "cells": [{"id": 80, "text": "The elastic stop nut is a standard nut with the height ", "bbox": {"l": 320.99542, "t": 385.18361999999996, "r": 548.72437, "b": 396.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "increased to accommodate a fiber locking collar. This ", "bbox": {"l": 320.99542, "t": 397.68361999999996, "r": 552.35132, "b": 409.15362999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "picture", "bbox": {"l": 320.4467468261719, "t": 421.640625, "r": 558.8576049804688, "b": 692.310791015625, "coord_origin": "TOPLEFT"}, "confidence": 0.9881086945533752, "cells": [{"id": 82, "text": "Tightened nut ", "bbox": {"l": 479.1354999999999, "t": 672.7346, "r": 531.16748, "b": 682.646599, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "Untightened nut ", "bbox": {"l": 474.3699, "t": 531.8918, "r": 535.23389, "b": 541.8037999999999, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "Nut case ", "bbox": {"l": 456.7558900000001, "t": 431.99741, "r": 487.08388999999994, "b": 441.6134, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "Threaded nut core ", "bbox": {"l": 434.62299, "t": 577.8235, "r": 497.47183000000007, "b": 587.4395, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Locking shoulder ", "bbox": {"l": 448.55081, "t": 553.3206, "r": 507.686, "b": 562.9366, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Keyway ", "bbox": {"l": 424.78421, "t": 664.1116, "r": 452.10339000000005, "b": 673.7275999999999, "coord_origin": "TOPLEFT"}}], "children": [{"id": 18, "label": "text", "bbox": {"l": 479.1354999999999, "t": 672.7346, "r": 531.16748, "b": 682.646599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "Tightened nut ", "bbox": {"l": 479.1354999999999, "t": 672.7346, "r": 531.16748, "b": 682.646599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 474.3699, "t": 531.8918, "r": 535.23389, "b": 541.8037999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "Untightened nut ", "bbox": {"l": 474.3699, "t": 531.8918, "r": 535.23389, "b": 541.8037999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 456.7558900000001, "t": 431.99741, "r": 487.08388999999994, "b": 441.6134, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "Nut case ", "bbox": {"l": 456.7558900000001, "t": 431.99741, "r": 487.08388999999994, "b": 441.6134, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 434.62299, "t": 577.8235, "r": 497.47183000000007, "b": 587.4395, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "Threaded nut core ", "bbox": {"l": 434.62299, "t": 577.8235, "r": 497.47183000000007, "b": 587.4395, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 448.55081, "t": 553.3206, "r": 507.686, "b": 562.9366, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "Locking shoulder ", "bbox": {"l": 448.55081, "t": 553.3206, "r": 507.686, "b": 562.9366, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 424.78421, "t": 664.1116, "r": 452.10339000000005, "b": 673.7275999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "Keyway ", "bbox": {"l": 424.78421, "t": 664.1116, "r": 452.10339000000005, "b": 673.7275999999999, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 7, "label": "picture", "bbox": {"l": 70.59269714355469, "t": 531.2222290039062, "r": 309.863037109375, "b": 694.3909912109375, "coord_origin": "TOPLEFT"}, "confidence": 0.9858751893043518, "cells": [{"id": 88, "text": "Boots aircraft nut ", "bbox": {"l": 102.4155, "t": 587.76491, "r": 161.3187, "b": 597.38091, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "Flexloc nut ", "bbox": {"l": 91.685997, "t": 679.309799, "r": 129.77399, "b": 688.925797, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "Fiber locknut ", "bbox": {"l": 162.48109, "t": 679.309799, "r": 207.85629, "b": 688.925797, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "Elastic stop nut ", "bbox": {"l": 237.31379999999996, "t": 679.309799, "r": 289.561, "b": 688.925797, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Elastic anchor nut ", "bbox": {"l": 216.9326, "t": 587.76491, "r": 277.7966, "b": 597.38091, "coord_origin": "TOPLEFT"}}], "children": [{"id": 24, "label": "text", "bbox": {"l": 102.4155, "t": 587.76491, "r": 161.3187, "b": 597.38091, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "Boots aircraft nut ", "bbox": {"l": 102.4155, "t": 587.76491, "r": 161.3187, "b": 597.38091, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 91.685997, "t": 679.309799, "r": 129.77399, "b": 688.925797, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "Flexloc nut ", "bbox": {"l": 91.685997, "t": 679.309799, "r": 129.77399, "b": 688.925797, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 162.48109, "t": 679.309799, "r": 207.85629, "b": 688.925797, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "Fiber locknut ", "bbox": {"l": 162.48109, "t": 679.309799, "r": 207.85629, "b": 688.925797, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 237.31379999999996, "t": 679.309799, "r": 289.561, "b": 688.925797, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "Elastic stop nut ", "bbox": {"l": 237.31379999999996, "t": 679.309799, "r": 289.561, "b": 688.925797, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 216.9326, "t": 587.76491, "r": 277.7966, "b": 597.38091, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "Elastic anchor nut ", "bbox": {"l": 216.9326, "t": 587.76491, "r": 277.7966, "b": 597.38091, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 12, "label": "caption", "bbox": {"l": 72.0, "t": 702.197601, "r": 184.14828, "b": 713.009598, "coord_origin": "TOPLEFT"}, "confidence": 0.9449448585510254, "cells": [{"id": 93, "text": "Figure 7-26. ", "bbox": {"l": 72.0, "t": 702.457596, "r": 119.12800000000001, "b": 713.009598, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "Self-locking nuts. ", "bbox": {"l": 119.4023, "t": 702.197601, "r": 184.14828, "b": 712.403599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "caption", "bbox": {"l": 321.0, "t": 700.177597, "r": 481.64931999999993, "b": 710.989597, "coord_origin": "TOPLEFT"}, "confidence": 0.9497623443603516, "cells": [{"id": 95, "text": "Figure 7-27. ", "bbox": {"l": 321.0, "t": 700.437599, "r": 368.12799, "b": 710.989597, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "Stainless steel self-locking nut. ", "bbox": {"l": 368.40231, "t": 700.177597, "r": 481.64931999999993, "b": 710.383598, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "page_footer", "bbox": {"l": 537.98541, "t": 727.980301, "r": 560.77539, "b": 740.290298, "coord_origin": "TOPLEFT"}, "confidence": 0.9368571043014526, "cells": [{"id": 97, "text": "7-45 ", "bbox": {"l": 537.98541, "t": 727.980301, "r": 560.77539, "b": 740.290298, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "text", "id": 8, "page_no": 0, "cluster": {"id": 8, "label": "text", "bbox": {"l": 71.992126, "t": 43.68364999999994, "r": 314.11212, "b": 92.65363000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9851651191711426, "cells": [{"id": 0, "text": "pulleys, provided the inner race of the bearing is clamped ", "bbox": {"l": 71.992126, "t": 43.68364999999994, "r": 300.23203, "b": 55.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "to the supporting structure by the nut and bolt. Plates must ", "bbox": {"l": 71.992126, "t": 56.18364999999994, "r": 302.00214, "b": 67.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "be attached to the structure in a positive manner to eliminate ", "bbox": {"l": 71.992126, "t": 68.68364999999994, "r": 309.82214, "b": 80.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "rotation or misalignment when tightening the bolts or screws. ", "bbox": {"l": 71.992126, "t": 81.18364999999994, "r": 314.11212, "b": 92.65363000000002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "pulleys, provided the inner race of the bearing is clamped to the supporting structure by the nut and bolt. Plates must be attached to the structure in a positive manner to eliminate rotation or misalignment when tightening the bolts or screws."}, {"label": "text", "id": 4, "page_no": 0, "cluster": {"id": 4, "label": "text", "bbox": {"l": 71.992302, "t": 106.18364999999994, "r": 313.1546, "b": 180.15363000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9873439073562622, "cells": [{"id": 4, "text": "The two general types of self-locking nuts currently in use ", "bbox": {"l": 71.992302, "t": 106.18364999999994, "r": 305.15311, "b": 117.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "are the all-metal type and the fiber lock type. For the sake of ", "bbox": {"l": 71.993103, "t": 118.68364999999994, "r": 309.98309, "b": 130.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "simplicity, only three typical kinds of self-locking nuts are ", "bbox": {"l": 71.993103, "t": 131.18364999999994, "r": 302.44312, "b": 142.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "considered in this handbook: the Boots self-locking and the ", "bbox": {"l": 71.993103, "t": 143.68364999999994, "r": 306.25311, "b": 155.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "stainless steel self-locking nuts, representing the all-metal ", "bbox": {"l": 71.993103, "t": 156.18364999999994, "r": 303.9931, "b": 167.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "types; and the elastic stop nut, representing ", "bbox": {"l": 71.993103, "t": 168.68364999999994, "r": 238.6723, "b": 180.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "the fiber insert type. ", "bbox": {"l": 234.26460000000003, "t": 168.68364999999994, "r": 313.1546, "b": 180.15363000000002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The two general types of self-locking nuts currently in use are the all-metal type and the fiber lock type. For the sake of simplicity, only three typical kinds of self-locking nuts are considered in this handbook: the Boots self-locking and the stainless steel self-locking nuts, representing the all-metal types; and the elastic stop nut, representing the fiber insert type."}, {"label": "section_header", "id": 14, "page_no": 0, "cluster": {"id": 14, "label": "section_header", "bbox": {"l": 71.992302, "t": 193.81359999999995, "r": 167.27231, "b": 205.15363000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9309079647064209, "cells": [{"id": 11, "text": "Boots Self-Locking Nut ", "bbox": {"l": 71.992302, "t": 193.81359999999995, "r": 167.27231, "b": 205.15363000000002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Boots Self-Locking Nut"}, {"label": "text", "id": 6, "page_no": 0, "cluster": {"id": 6, "label": "text", "bbox": {"l": 71.992294, "t": 208.18364999999994, "r": 318.49225, "b": 282.15362999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9866572022438049, "cells": [{"id": 12, "text": "The Boots self-locking nut is of one piece, all-metal ", "bbox": {"l": 71.992302, "t": 208.18364999999994, "r": 302.27719, "b": 219.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "construction designed to hold tight despite severe vibration. ", "bbox": {"l": 71.992294, "t": 220.68364999999994, "r": 313.33026, "b": 232.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Note in ", "bbox": {"l": 71.992294, "t": 233.18364999999994, "r": 104.12231, "b": 244.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Figure 7-26", "bbox": {"l": 104.12231, "t": 233.31359999999995, "r": 152.05231, "b": 244.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": " that it has two sections and is essentially ", "bbox": {"l": 152.05231, "t": 233.18364999999994, "r": 318.49225, "b": 244.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "two nuts in one: a locking nut and a load-carrying nut. The ", "bbox": {"l": 71.992294, "t": 245.68364999999994, "r": 309.42929, "b": 257.15363, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "two sections are connected with a spring, which is an integral ", "bbox": {"l": 71.992294, "t": 258.18364999999994, "r": 317.76227, "b": 269.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "part of the nut. ", "bbox": {"l": 71.992294, "t": 270.68361999999996, "r": 133.3723, "b": 282.15362999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The Boots self-locking nut is of one piece, all-metal construction designed to hold tight despite severe vibration. Note in Figure 7-26 that it has two sections and is essentially two nuts in one: a locking nut and a load-carrying nut. The two sections are connected with a spring, which is an integral part of the nut."}, {"label": "text", "id": 1, "page_no": 0, "cluster": {"id": 1, "label": "text", "bbox": {"l": 71.992294, "t": 295.68361999999996, "r": 316.65729, "b": 369.65362999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9881331324577332, "cells": [{"id": 20, "text": "The spring keeps the locking and load-carrying sections such ", "bbox": {"l": 71.992294, "t": 295.68361999999996, "r": 316.41028, "b": 307.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "a distance apart that the two sets of threads are out of phase ", "bbox": {"l": 71.992294, "t": 308.18361999999996, "r": 312.20731, "b": 319.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "or spaced so that a bolt, which has been screwed through the ", "bbox": {"l": 71.992294, "t": 320.68361999999996, "r": 316.65729, "b": 332.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "load-carrying section, must push the locking section outward ", "bbox": {"l": 71.992294, "t": 333.18361999999996, "r": 315.91229, "b": 344.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "against the force of the spring to engage the threads of the ", "bbox": {"l": 71.992294, "t": 345.68361999999996, "r": 306.34927, "b": 357.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "locking section properly. ", "bbox": {"l": 71.992294, "t": 358.18361999999996, "r": 174.2023, "b": 369.65362999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The spring keeps the locking and load-carrying sections such a distance apart that the two sets of threads are out of phase or spaced so that a bolt, which has been screwed through the load-carrying section, must push the locking section outward against the force of the spring to engage the threads of the locking section properly."}, {"label": "text", "id": 0, "page_no": 0, "cluster": {"id": 0, "label": "text", "bbox": {"l": 71.992294, "t": 383.18361999999996, "r": 318.81229, "b": 482.15363, "coord_origin": "TOPLEFT"}, "confidence": 0.9882921576499939, "cells": [{"id": 26, "text": "The spring, through the medium of the locking section, exerts ", "bbox": {"l": 71.992294, "t": 383.18361999999996, "r": 317.07227, "b": 394.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "a constant locking force on the bolt in the same direction as a ", "bbox": {"l": 71.992294, "t": 395.68361999999996, "r": 318.81229, "b": 407.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "force that would tighten the nut. In this nut, the load-carrying ", "bbox": {"l": 71.992294, "t": 408.18361999999996, "r": 317.5123, "b": 419.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "section has the thread strength of a standard nut of comparable ", "bbox": {"l": 71.992294, "t": 420.68361999999996, "r": 317.31229, "b": 432.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "size, while the locking section presses against the threads of ", "bbox": {"l": 71.992294, "t": 433.18361999999996, "r": 314.45929, "b": 444.65363, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "the bolt and locks the nut firmly in position. Only a wrench ", "bbox": {"l": 71.992294, "t": 445.68362, "r": 311.7023, "b": 457.15363, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "applied to the nut loosens it. The nut can be removed and ", "bbox": {"l": 71.992294, "t": 458.18362, "r": 303.35229, "b": 469.65363, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "reused without impairing its efficiency. ", "bbox": {"l": 71.992294, "t": 470.68362, "r": 231.97228999999996, "b": 482.15363, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The spring, through the medium of the locking section, exerts a constant locking force on the bolt in the same direction as a force that would tighten the nut. In this nut, the load-carrying section has the thread strength of a standard nut of comparable size, while the locking section presses against the threads of the bolt and locks the nut firmly in position. Only a wrench applied to the nut loosens it. The nut can be removed and reused without impairing its efficiency."}, {"label": "text", "id": 9, "page_no": 0, "cluster": {"id": 9, "label": "text", "bbox": {"l": 71.992294, "t": 495.68362, "r": 313.91229, "b": 519.65363, "coord_origin": "TOPLEFT"}, "confidence": 0.9695364832878113, "cells": [{"id": 34, "text": "Boots self-locking nuts are made with three different spring ", "bbox": {"l": 71.992294, "t": 495.68362, "r": 313.34229, "b": 507.15363, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "styles and in various shapes and sizes. The wing type that is ", "bbox": {"l": 71.992294, "t": 508.18362, "r": 313.91229, "b": 519.65363, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Boots self-locking nuts are made with three different spring styles and in various shapes and sizes. The wing type that is"}, {"label": "text", "id": 5, "page_no": 0, "cluster": {"id": 5, "label": "text", "bbox": {"l": 320.99231, "t": 43.68364999999994, "r": 561.80835, "b": 117.65363000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9870070219039917, "cells": [{"id": 36, "text": "the most common ranges in size for No. 6 up to ", "bbox": {"l": 320.99231, "t": 43.68364999999994, "r": 513.74628, "b": 55.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "1", "bbox": {"l": 514.06342, "t": 44.52013999999997, "r": 516.81342, "b": 50.828610000000026, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "\u2044", "bbox": {"l": 516.81342, "t": 43.68364999999994, "r": 518.4834, "b": 55.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "4", "bbox": {"l": 518.25842, "t": 47.72014999999999, "r": 523.00525, "b": 54.02863000000002, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "inch, the ", "bbox": {"l": 525.37872, "t": 47.72014999999999, "r": 560.44843, "b": 54.02863000000002, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Rol-top ranges from ", "bbox": {"l": 320.99841, "t": 56.18364999999994, "r": 404.58441, "b": 67.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "1", "bbox": {"l": 404.48981, "t": 57.02013999999997, "r": 407.23981, "b": 63.328610000000026, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "\u2044", "bbox": {"l": 407.23981, "t": 56.18364999999994, "r": 408.90982, "b": 67.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "4", "bbox": {"l": 408.68481, "t": 60.22014999999999, "r": 413.38376, "b": 66.52863000000002, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "inch to ", "bbox": {"l": 415.73322, "t": 60.22014999999999, "r": 443.92681999999996, "b": 66.52863000000002, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "1", "bbox": {"l": 443.82598999999993, "t": 57.02013999999997, "r": 446.57598999999993, "b": 63.328610000000026, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "\u2044", "bbox": {"l": 446.57598999999993, "t": 56.18364999999994, "r": 448.24600000000004, "b": 67.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "6", "bbox": {"l": 448.22588999999994, "t": 60.22014999999999, "r": 453.12659, "b": 66.52863000000002, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "inch, and the bellows type ", "bbox": {"l": 455.57697, "t": 60.22014999999999, "r": 560.6579, "b": 66.52863000000002, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "ranges in size from No. 8 up to ", "bbox": {"l": 320.99591, "t": 68.68364999999994, "r": 447.36591000000004, "b": 80.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "3", "bbox": {"l": 448.79668999999996, "t": 69.52013999999997, "r": 451.54668999999996, "b": 75.82861000000003, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "\u2044", "bbox": {"l": 451.50549, "t": 68.68364999999994, "r": 453.17551, "b": 80.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "8", "bbox": {"l": 453.17542000000003, "t": 72.72014999999999, "r": 458.07175000000007, "b": 79.02863000000002, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "inch. Wing-type nuts are ", "bbox": {"l": 460.51993, "t": 72.72014999999999, "r": 559.78839, "b": 79.02863000000002, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "made of anodized aluminum alloy, cadmium-plated carbon ", "bbox": {"l": 320.99542, "t": 81.18364999999994, "r": 559.77844, "b": 92.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "steel, or stainless steel. The Rol-top nut is cadmium-plated ", "bbox": {"l": 320.99542, "t": 93.68364999999994, "r": 557.87738, "b": 105.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "steel, and the bellows type is made of aluminum alloy only. ", "bbox": {"l": 320.99542, "t": 106.18364999999994, "r": 561.80835, "b": 117.65363000000002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "the most common ranges in size for No. 6 up to 1 \u2044 4 inch, the Rol-top ranges from 1 \u2044 4 inch to 1 \u2044 6 inch, and the bellows type ranges in size from No. 8 up to 3 \u2044 8 inch. Wing-type nuts are made of anodized aluminum alloy, cadmium-plated carbon steel, or stainless steel. The Rol-top nut is cadmium-plated steel, and the bellows type is made of aluminum alloy only."}, {"label": "text", "id": 17, "page_no": 0, "cluster": {"id": 17, "label": "text", "bbox": {"l": 320.99542, "t": 118.68364999999994, "r": 325.99542, "b": 130.15363000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": ". ", "bbox": {"l": 320.99542, "t": 118.68364999999994, "r": 325.99542, "b": 130.15363000000002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "."}, {"label": "section_header", "id": 15, "page_no": 0, "cluster": {"id": 15, "label": "section_header", "bbox": {"l": 320.99542, "t": 131.31359999999995, "r": 450.99542, "b": 142.65363000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9263731241226196, "cells": [{"id": 59, "text": "Stainless Steel Self-Locking Nut ", "bbox": {"l": 320.99542, "t": 131.31359999999995, "r": 450.99542, "b": 142.65363000000002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Stainless Steel Self-Locking Nut"}, {"label": "text", "id": 3, "page_no": 0, "cluster": {"id": 3, "label": "text", "bbox": {"l": 320.99542, "t": 145.68364999999994, "r": 568.00439, "b": 357.15362999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9879258871078491, "cells": [{"id": 60, "text": "The stainless steel self-locking nut may be spun on and off ", "bbox": {"l": 320.99542, "t": 145.68364999999994, "r": 558.39838, "b": 157.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "by hand as its locking action takes places only when the ", "bbox": {"l": 320.99542, "t": 158.18364999999994, "r": 547.92542, "b": 169.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "nut is seated against a solid surface and tightened. The nut ", "bbox": {"l": 320.99542, "t": 170.68364999999994, "r": 556.50842, "b": 182.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "consists of two parts: a case with a beveled locking shoulder ", "bbox": {"l": 320.99542, "t": 183.18364999999994, "r": 565.11346, "b": 194.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "and key and a thread insert with a locking shoulder and ", "bbox": {"l": 320.99542, "t": 195.68364999999994, "r": 547.93744, "b": 207.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "slotted keyway. Until the nut is tightened, it spins on the ", "bbox": {"l": 320.99542, "t": 208.18364999999994, "r": 549.00647, "b": 219.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "bolt easily, because the threaded insert is the proper size ", "bbox": {"l": 320.99542, "t": 220.68364999999994, "r": 549.0755, "b": 232.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "for the bolt. However, when the nut is seated against a solid ", "bbox": {"l": 320.99542, "t": 233.18364999999994, "r": 562.60242, "b": 244.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "surface and tightened, the locking shoulder of the insert is ", "bbox": {"l": 320.99542, "t": 245.68364999999994, "r": 555.11243, "b": 257.15363, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "pulled downward and wedged against the locking shoulder ", "bbox": {"l": 320.99542, "t": 258.18364999999994, "r": 558.74146, "b": 269.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "of the case. This action compresses the threaded insert and ", "bbox": {"l": 320.99542, "t": 270.68361999999996, "r": 557.88538, "b": 282.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "causes it to clench the bolt tightly. The cross-sectional view ", "bbox": {"l": 320.99542, "t": 283.18361999999996, "r": 562.3114, "b": 294.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "in ", "bbox": {"l": 320.99542, "t": 295.68361999999996, "r": 331.27542, "b": 307.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "Figure 7-27", "bbox": {"l": 331.81543, "t": 295.81363000000005, "r": 379.86542, "b": 307.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": " shows how the key of the case fits into the ", "bbox": {"l": 379.86542, "t": 295.68361999999996, "r": 554.56543, "b": 307.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "slotted keyway of the insert so that when the case is turned, ", "bbox": {"l": 320.99542, "t": 308.18361999999996, "r": 561.16339, "b": 319.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "the threaded insert is turned with it. Note that the slot is wider ", "bbox": {"l": 320.99542, "t": 320.68361999999996, "r": 568.00439, "b": 332.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "than the key. This permits the slot to be narrowed and the ", "bbox": {"l": 320.99542, "t": 333.18361999999996, "r": 553.46545, "b": 344.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "insert to be compressed when the nut is tightened. ", "bbox": {"l": 320.99542, "t": 345.68361999999996, "r": 523.19543, "b": 357.15362999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The stainless steel self-locking nut may be spun on and off by hand as its locking action takes places only when the nut is seated against a solid surface and tightened. The nut consists of two parts: a case with a beveled locking shoulder and key and a thread insert with a locking shoulder and slotted keyway. Until the nut is tightened, it spins on the bolt easily, because the threaded insert is the proper size for the bolt. However, when the nut is seated against a solid surface and tightened, the locking shoulder of the insert is pulled downward and wedged against the locking shoulder of the case. This action compresses the threaded insert and causes it to clench the bolt tightly. The cross-sectional view in Figure 7-27 shows how the key of the case fits into the slotted keyway of the insert so that when the case is turned, the threaded insert is turned with it. Note that the slot is wider than the key. This permits the slot to be narrowed and the insert to be compressed when the nut is tightened."}, {"label": "section_header", "id": 16, "page_no": 0, "cluster": {"id": 16, "label": "section_header", "bbox": {"l": 320.99542, "t": 370.81363000000005, "r": 388.50543, "b": 382.15362999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9253151416778564, "cells": [{"id": 79, "text": "Elastic Stop Nut ", "bbox": {"l": 320.99542, "t": 370.81363000000005, "r": 388.50543, "b": 382.15362999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Elastic Stop Nut"}, {"label": "text", "id": 10, "page_no": 0, "cluster": {"id": 10, "label": "text", "bbox": {"l": 320.99542, "t": 385.18361999999996, "r": 552.35132, "b": 409.15362999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9676452875137329, "cells": [{"id": 80, "text": "The elastic stop nut is a standard nut with the height ", "bbox": {"l": 320.99542, "t": 385.18361999999996, "r": 548.72437, "b": 396.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "increased to accommodate a fiber locking collar. This ", "bbox": {"l": 320.99542, "t": 397.68361999999996, "r": 552.35132, "b": 409.15362999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The elastic stop nut is a standard nut with the height increased to accommodate a fiber locking collar. This"}, {"label": "picture", "id": 2, "page_no": 0, "cluster": {"id": 2, "label": "picture", "bbox": {"l": 320.4467468261719, "t": 421.640625, "r": 558.8576049804688, "b": 692.310791015625, "coord_origin": "TOPLEFT"}, "confidence": 0.9881086945533752, "cells": [{"id": 82, "text": "Tightened nut ", "bbox": {"l": 479.1354999999999, "t": 672.7346, "r": 531.16748, "b": 682.646599, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "Untightened nut ", "bbox": {"l": 474.3699, "t": 531.8918, "r": 535.23389, "b": 541.8037999999999, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "Nut case ", "bbox": {"l": 456.7558900000001, "t": 431.99741, "r": 487.08388999999994, "b": 441.6134, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "Threaded nut core ", "bbox": {"l": 434.62299, "t": 577.8235, "r": 497.47183000000007, "b": 587.4395, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Locking shoulder ", "bbox": {"l": 448.55081, "t": 553.3206, "r": 507.686, "b": 562.9366, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Keyway ", "bbox": {"l": 424.78421, "t": 664.1116, "r": 452.10339000000005, "b": 673.7275999999999, "coord_origin": "TOPLEFT"}}], "children": [{"id": 18, "label": "text", "bbox": {"l": 479.1354999999999, "t": 672.7346, "r": 531.16748, "b": 682.646599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "Tightened nut ", "bbox": {"l": 479.1354999999999, "t": 672.7346, "r": 531.16748, "b": 682.646599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 474.3699, "t": 531.8918, "r": 535.23389, "b": 541.8037999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "Untightened nut ", "bbox": {"l": 474.3699, "t": 531.8918, "r": 535.23389, "b": 541.8037999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 456.7558900000001, "t": 431.99741, "r": 487.08388999999994, "b": 441.6134, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "Nut case ", "bbox": {"l": 456.7558900000001, "t": 431.99741, "r": 487.08388999999994, "b": 441.6134, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 434.62299, "t": 577.8235, "r": 497.47183000000007, "b": 587.4395, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "Threaded nut core ", "bbox": {"l": 434.62299, "t": 577.8235, "r": 497.47183000000007, "b": 587.4395, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 448.55081, "t": 553.3206, "r": 507.686, "b": 562.9366, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "Locking shoulder ", "bbox": {"l": 448.55081, "t": 553.3206, "r": 507.686, "b": 562.9366, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 424.78421, "t": 664.1116, "r": 452.10339000000005, "b": 673.7275999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "Keyway ", "bbox": {"l": 424.78421, "t": 664.1116, "r": 452.10339000000005, "b": 673.7275999999999, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "picture", "id": 7, "page_no": 0, "cluster": {"id": 7, "label": "picture", "bbox": {"l": 70.59269714355469, "t": 531.2222290039062, "r": 309.863037109375, "b": 694.3909912109375, "coord_origin": "TOPLEFT"}, "confidence": 0.9858751893043518, "cells": [{"id": 88, "text": "Boots aircraft nut ", "bbox": {"l": 102.4155, "t": 587.76491, "r": 161.3187, "b": 597.38091, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "Flexloc nut ", "bbox": {"l": 91.685997, "t": 679.309799, "r": 129.77399, "b": 688.925797, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "Fiber locknut ", "bbox": {"l": 162.48109, "t": 679.309799, "r": 207.85629, "b": 688.925797, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "Elastic stop nut ", "bbox": {"l": 237.31379999999996, "t": 679.309799, "r": 289.561, "b": 688.925797, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Elastic anchor nut ", "bbox": {"l": 216.9326, "t": 587.76491, "r": 277.7966, "b": 597.38091, "coord_origin": "TOPLEFT"}}], "children": [{"id": 24, "label": "text", "bbox": {"l": 102.4155, "t": 587.76491, "r": 161.3187, "b": 597.38091, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "Boots aircraft nut ", "bbox": {"l": 102.4155, "t": 587.76491, "r": 161.3187, "b": 597.38091, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 91.685997, "t": 679.309799, "r": 129.77399, "b": 688.925797, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "Flexloc nut ", "bbox": {"l": 91.685997, "t": 679.309799, "r": 129.77399, "b": 688.925797, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 162.48109, "t": 679.309799, "r": 207.85629, "b": 688.925797, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "Fiber locknut ", "bbox": {"l": 162.48109, "t": 679.309799, "r": 207.85629, "b": 688.925797, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 237.31379999999996, "t": 679.309799, "r": 289.561, "b": 688.925797, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "Elastic stop nut ", "bbox": {"l": 237.31379999999996, "t": 679.309799, "r": 289.561, "b": 688.925797, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 216.9326, "t": 587.76491, "r": 277.7966, "b": 597.38091, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "Elastic anchor nut ", "bbox": {"l": 216.9326, "t": 587.76491, "r": 277.7966, "b": 597.38091, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "caption", "id": 12, "page_no": 0, "cluster": {"id": 12, "label": "caption", "bbox": {"l": 72.0, "t": 702.197601, "r": 184.14828, "b": 713.009598, "coord_origin": "TOPLEFT"}, "confidence": 0.9449448585510254, "cells": [{"id": 93, "text": "Figure 7-26. ", "bbox": {"l": 72.0, "t": 702.457596, "r": 119.12800000000001, "b": 713.009598, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "Self-locking nuts. ", "bbox": {"l": 119.4023, "t": 702.197601, "r": 184.14828, "b": 712.403599, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 7-26. Self-locking nuts."}, {"label": "caption", "id": 11, "page_no": 0, "cluster": {"id": 11, "label": "caption", "bbox": {"l": 321.0, "t": 700.177597, "r": 481.64931999999993, "b": 710.989597, "coord_origin": "TOPLEFT"}, "confidence": 0.9497623443603516, "cells": [{"id": 95, "text": "Figure 7-27. ", "bbox": {"l": 321.0, "t": 700.437599, "r": 368.12799, "b": 710.989597, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "Stainless steel self-locking nut. ", "bbox": {"l": 368.40231, "t": 700.177597, "r": 481.64931999999993, "b": 710.383598, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 7-27. Stainless steel self-locking nut."}, {"label": "page_footer", "id": 13, "page_no": 0, "cluster": {"id": 13, "label": "page_footer", "bbox": {"l": 537.98541, "t": 727.980301, "r": 560.77539, "b": 740.290298, "coord_origin": "TOPLEFT"}, "confidence": 0.9368571043014526, "cells": [{"id": 97, "text": "7-45 ", "bbox": {"l": 537.98541, "t": 727.980301, "r": 560.77539, "b": 740.290298, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "7-45"}], "body": [{"label": "text", "id": 8, "page_no": 0, "cluster": {"id": 8, "label": "text", "bbox": {"l": 71.992126, "t": 43.68364999999994, "r": 314.11212, "b": 92.65363000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9851651191711426, "cells": [{"id": 0, "text": "pulleys, provided the inner race of the bearing is clamped ", "bbox": {"l": 71.992126, "t": 43.68364999999994, "r": 300.23203, "b": 55.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "to the supporting structure by the nut and bolt. Plates must ", "bbox": {"l": 71.992126, "t": 56.18364999999994, "r": 302.00214, "b": 67.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "be attached to the structure in a positive manner to eliminate ", "bbox": {"l": 71.992126, "t": 68.68364999999994, "r": 309.82214, "b": 80.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "rotation or misalignment when tightening the bolts or screws. ", "bbox": {"l": 71.992126, "t": 81.18364999999994, "r": 314.11212, "b": 92.65363000000002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "pulleys, provided the inner race of the bearing is clamped to the supporting structure by the nut and bolt. Plates must be attached to the structure in a positive manner to eliminate rotation or misalignment when tightening the bolts or screws."}, {"label": "text", "id": 4, "page_no": 0, "cluster": {"id": 4, "label": "text", "bbox": {"l": 71.992302, "t": 106.18364999999994, "r": 313.1546, "b": 180.15363000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9873439073562622, "cells": [{"id": 4, "text": "The two general types of self-locking nuts currently in use ", "bbox": {"l": 71.992302, "t": 106.18364999999994, "r": 305.15311, "b": 117.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "are the all-metal type and the fiber lock type. For the sake of ", "bbox": {"l": 71.993103, "t": 118.68364999999994, "r": 309.98309, "b": 130.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "simplicity, only three typical kinds of self-locking nuts are ", "bbox": {"l": 71.993103, "t": 131.18364999999994, "r": 302.44312, "b": 142.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "considered in this handbook: the Boots self-locking and the ", "bbox": {"l": 71.993103, "t": 143.68364999999994, "r": 306.25311, "b": 155.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "stainless steel self-locking nuts, representing the all-metal ", "bbox": {"l": 71.993103, "t": 156.18364999999994, "r": 303.9931, "b": 167.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "types; and the elastic stop nut, representing ", "bbox": {"l": 71.993103, "t": 168.68364999999994, "r": 238.6723, "b": 180.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "the fiber insert type. ", "bbox": {"l": 234.26460000000003, "t": 168.68364999999994, "r": 313.1546, "b": 180.15363000000002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The two general types of self-locking nuts currently in use are the all-metal type and the fiber lock type. For the sake of simplicity, only three typical kinds of self-locking nuts are considered in this handbook: the Boots self-locking and the stainless steel self-locking nuts, representing the all-metal types; and the elastic stop nut, representing the fiber insert type."}, {"label": "section_header", "id": 14, "page_no": 0, "cluster": {"id": 14, "label": "section_header", "bbox": {"l": 71.992302, "t": 193.81359999999995, "r": 167.27231, "b": 205.15363000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9309079647064209, "cells": [{"id": 11, "text": "Boots Self-Locking Nut ", "bbox": {"l": 71.992302, "t": 193.81359999999995, "r": 167.27231, "b": 205.15363000000002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Boots Self-Locking Nut"}, {"label": "text", "id": 6, "page_no": 0, "cluster": {"id": 6, "label": "text", "bbox": {"l": 71.992294, "t": 208.18364999999994, "r": 318.49225, "b": 282.15362999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9866572022438049, "cells": [{"id": 12, "text": "The Boots self-locking nut is of one piece, all-metal ", "bbox": {"l": 71.992302, "t": 208.18364999999994, "r": 302.27719, "b": 219.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "construction designed to hold tight despite severe vibration. ", "bbox": {"l": 71.992294, "t": 220.68364999999994, "r": 313.33026, "b": 232.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Note in ", "bbox": {"l": 71.992294, "t": 233.18364999999994, "r": 104.12231, "b": 244.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Figure 7-26", "bbox": {"l": 104.12231, "t": 233.31359999999995, "r": 152.05231, "b": 244.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": " that it has two sections and is essentially ", "bbox": {"l": 152.05231, "t": 233.18364999999994, "r": 318.49225, "b": 244.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "two nuts in one: a locking nut and a load-carrying nut. The ", "bbox": {"l": 71.992294, "t": 245.68364999999994, "r": 309.42929, "b": 257.15363, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "two sections are connected with a spring, which is an integral ", "bbox": {"l": 71.992294, "t": 258.18364999999994, "r": 317.76227, "b": 269.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "part of the nut. ", "bbox": {"l": 71.992294, "t": 270.68361999999996, "r": 133.3723, "b": 282.15362999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The Boots self-locking nut is of one piece, all-metal construction designed to hold tight despite severe vibration. Note in Figure 7-26 that it has two sections and is essentially two nuts in one: a locking nut and a load-carrying nut. The two sections are connected with a spring, which is an integral part of the nut."}, {"label": "text", "id": 1, "page_no": 0, "cluster": {"id": 1, "label": "text", "bbox": {"l": 71.992294, "t": 295.68361999999996, "r": 316.65729, "b": 369.65362999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9881331324577332, "cells": [{"id": 20, "text": "The spring keeps the locking and load-carrying sections such ", "bbox": {"l": 71.992294, "t": 295.68361999999996, "r": 316.41028, "b": 307.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "a distance apart that the two sets of threads are out of phase ", "bbox": {"l": 71.992294, "t": 308.18361999999996, "r": 312.20731, "b": 319.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "or spaced so that a bolt, which has been screwed through the ", "bbox": {"l": 71.992294, "t": 320.68361999999996, "r": 316.65729, "b": 332.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "load-carrying section, must push the locking section outward ", "bbox": {"l": 71.992294, "t": 333.18361999999996, "r": 315.91229, "b": 344.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "against the force of the spring to engage the threads of the ", "bbox": {"l": 71.992294, "t": 345.68361999999996, "r": 306.34927, "b": 357.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "locking section properly. ", "bbox": {"l": 71.992294, "t": 358.18361999999996, "r": 174.2023, "b": 369.65362999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The spring keeps the locking and load-carrying sections such a distance apart that the two sets of threads are out of phase or spaced so that a bolt, which has been screwed through the load-carrying section, must push the locking section outward against the force of the spring to engage the threads of the locking section properly."}, {"label": "text", "id": 0, "page_no": 0, "cluster": {"id": 0, "label": "text", "bbox": {"l": 71.992294, "t": 383.18361999999996, "r": 318.81229, "b": 482.15363, "coord_origin": "TOPLEFT"}, "confidence": 0.9882921576499939, "cells": [{"id": 26, "text": "The spring, through the medium of the locking section, exerts ", "bbox": {"l": 71.992294, "t": 383.18361999999996, "r": 317.07227, "b": 394.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "a constant locking force on the bolt in the same direction as a ", "bbox": {"l": 71.992294, "t": 395.68361999999996, "r": 318.81229, "b": 407.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "force that would tighten the nut. In this nut, the load-carrying ", "bbox": {"l": 71.992294, "t": 408.18361999999996, "r": 317.5123, "b": 419.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "section has the thread strength of a standard nut of comparable ", "bbox": {"l": 71.992294, "t": 420.68361999999996, "r": 317.31229, "b": 432.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "size, while the locking section presses against the threads of ", "bbox": {"l": 71.992294, "t": 433.18361999999996, "r": 314.45929, "b": 444.65363, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "the bolt and locks the nut firmly in position. Only a wrench ", "bbox": {"l": 71.992294, "t": 445.68362, "r": 311.7023, "b": 457.15363, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "applied to the nut loosens it. The nut can be removed and ", "bbox": {"l": 71.992294, "t": 458.18362, "r": 303.35229, "b": 469.65363, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "reused without impairing its efficiency. ", "bbox": {"l": 71.992294, "t": 470.68362, "r": 231.97228999999996, "b": 482.15363, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The spring, through the medium of the locking section, exerts a constant locking force on the bolt in the same direction as a force that would tighten the nut. In this nut, the load-carrying section has the thread strength of a standard nut of comparable size, while the locking section presses against the threads of the bolt and locks the nut firmly in position. Only a wrench applied to the nut loosens it. The nut can be removed and reused without impairing its efficiency."}, {"label": "text", "id": 9, "page_no": 0, "cluster": {"id": 9, "label": "text", "bbox": {"l": 71.992294, "t": 495.68362, "r": 313.91229, "b": 519.65363, "coord_origin": "TOPLEFT"}, "confidence": 0.9695364832878113, "cells": [{"id": 34, "text": "Boots self-locking nuts are made with three different spring ", "bbox": {"l": 71.992294, "t": 495.68362, "r": 313.34229, "b": 507.15363, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "styles and in various shapes and sizes. The wing type that is ", "bbox": {"l": 71.992294, "t": 508.18362, "r": 313.91229, "b": 519.65363, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Boots self-locking nuts are made with three different spring styles and in various shapes and sizes. The wing type that is"}, {"label": "text", "id": 5, "page_no": 0, "cluster": {"id": 5, "label": "text", "bbox": {"l": 320.99231, "t": 43.68364999999994, "r": 561.80835, "b": 117.65363000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9870070219039917, "cells": [{"id": 36, "text": "the most common ranges in size for No. 6 up to ", "bbox": {"l": 320.99231, "t": 43.68364999999994, "r": 513.74628, "b": 55.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "1", "bbox": {"l": 514.06342, "t": 44.52013999999997, "r": 516.81342, "b": 50.828610000000026, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "\u2044", "bbox": {"l": 516.81342, "t": 43.68364999999994, "r": 518.4834, "b": 55.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "4", "bbox": {"l": 518.25842, "t": 47.72014999999999, "r": 523.00525, "b": 54.02863000000002, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "inch, the ", "bbox": {"l": 525.37872, "t": 47.72014999999999, "r": 560.44843, "b": 54.02863000000002, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Rol-top ranges from ", "bbox": {"l": 320.99841, "t": 56.18364999999994, "r": 404.58441, "b": 67.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "1", "bbox": {"l": 404.48981, "t": 57.02013999999997, "r": 407.23981, "b": 63.328610000000026, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "\u2044", "bbox": {"l": 407.23981, "t": 56.18364999999994, "r": 408.90982, "b": 67.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "4", "bbox": {"l": 408.68481, "t": 60.22014999999999, "r": 413.38376, "b": 66.52863000000002, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "inch to ", "bbox": {"l": 415.73322, "t": 60.22014999999999, "r": 443.92681999999996, "b": 66.52863000000002, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "1", "bbox": {"l": 443.82598999999993, "t": 57.02013999999997, "r": 446.57598999999993, "b": 63.328610000000026, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "\u2044", "bbox": {"l": 446.57598999999993, "t": 56.18364999999994, "r": 448.24600000000004, "b": 67.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "6", "bbox": {"l": 448.22588999999994, "t": 60.22014999999999, "r": 453.12659, "b": 66.52863000000002, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "inch, and the bellows type ", "bbox": {"l": 455.57697, "t": 60.22014999999999, "r": 560.6579, "b": 66.52863000000002, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "ranges in size from No. 8 up to ", "bbox": {"l": 320.99591, "t": 68.68364999999994, "r": 447.36591000000004, "b": 80.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "3", "bbox": {"l": 448.79668999999996, "t": 69.52013999999997, "r": 451.54668999999996, "b": 75.82861000000003, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "\u2044", "bbox": {"l": 451.50549, "t": 68.68364999999994, "r": 453.17551, "b": 80.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "8", "bbox": {"l": 453.17542000000003, "t": 72.72014999999999, "r": 458.07175000000007, "b": 79.02863000000002, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "inch. Wing-type nuts are ", "bbox": {"l": 460.51993, "t": 72.72014999999999, "r": 559.78839, "b": 79.02863000000002, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "made of anodized aluminum alloy, cadmium-plated carbon ", "bbox": {"l": 320.99542, "t": 81.18364999999994, "r": 559.77844, "b": 92.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "steel, or stainless steel. The Rol-top nut is cadmium-plated ", "bbox": {"l": 320.99542, "t": 93.68364999999994, "r": 557.87738, "b": 105.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "steel, and the bellows type is made of aluminum alloy only. ", "bbox": {"l": 320.99542, "t": 106.18364999999994, "r": 561.80835, "b": 117.65363000000002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "the most common ranges in size for No. 6 up to 1 \u2044 4 inch, the Rol-top ranges from 1 \u2044 4 inch to 1 \u2044 6 inch, and the bellows type ranges in size from No. 8 up to 3 \u2044 8 inch. Wing-type nuts are made of anodized aluminum alloy, cadmium-plated carbon steel, or stainless steel. The Rol-top nut is cadmium-plated steel, and the bellows type is made of aluminum alloy only."}, {"label": "text", "id": 17, "page_no": 0, "cluster": {"id": 17, "label": "text", "bbox": {"l": 320.99542, "t": 118.68364999999994, "r": 325.99542, "b": 130.15363000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": ". ", "bbox": {"l": 320.99542, "t": 118.68364999999994, "r": 325.99542, "b": 130.15363000000002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "."}, {"label": "section_header", "id": 15, "page_no": 0, "cluster": {"id": 15, "label": "section_header", "bbox": {"l": 320.99542, "t": 131.31359999999995, "r": 450.99542, "b": 142.65363000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9263731241226196, "cells": [{"id": 59, "text": "Stainless Steel Self-Locking Nut ", "bbox": {"l": 320.99542, "t": 131.31359999999995, "r": 450.99542, "b": 142.65363000000002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Stainless Steel Self-Locking Nut"}, {"label": "text", "id": 3, "page_no": 0, "cluster": {"id": 3, "label": "text", "bbox": {"l": 320.99542, "t": 145.68364999999994, "r": 568.00439, "b": 357.15362999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9879258871078491, "cells": [{"id": 60, "text": "The stainless steel self-locking nut may be spun on and off ", "bbox": {"l": 320.99542, "t": 145.68364999999994, "r": 558.39838, "b": 157.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "by hand as its locking action takes places only when the ", "bbox": {"l": 320.99542, "t": 158.18364999999994, "r": 547.92542, "b": 169.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "nut is seated against a solid surface and tightened. The nut ", "bbox": {"l": 320.99542, "t": 170.68364999999994, "r": 556.50842, "b": 182.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "consists of two parts: a case with a beveled locking shoulder ", "bbox": {"l": 320.99542, "t": 183.18364999999994, "r": 565.11346, "b": 194.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "and key and a thread insert with a locking shoulder and ", "bbox": {"l": 320.99542, "t": 195.68364999999994, "r": 547.93744, "b": 207.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "slotted keyway. Until the nut is tightened, it spins on the ", "bbox": {"l": 320.99542, "t": 208.18364999999994, "r": 549.00647, "b": 219.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "bolt easily, because the threaded insert is the proper size ", "bbox": {"l": 320.99542, "t": 220.68364999999994, "r": 549.0755, "b": 232.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "for the bolt. However, when the nut is seated against a solid ", "bbox": {"l": 320.99542, "t": 233.18364999999994, "r": 562.60242, "b": 244.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "surface and tightened, the locking shoulder of the insert is ", "bbox": {"l": 320.99542, "t": 245.68364999999994, "r": 555.11243, "b": 257.15363, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "pulled downward and wedged against the locking shoulder ", "bbox": {"l": 320.99542, "t": 258.18364999999994, "r": 558.74146, "b": 269.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "of the case. This action compresses the threaded insert and ", "bbox": {"l": 320.99542, "t": 270.68361999999996, "r": 557.88538, "b": 282.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "causes it to clench the bolt tightly. The cross-sectional view ", "bbox": {"l": 320.99542, "t": 283.18361999999996, "r": 562.3114, "b": 294.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "in ", "bbox": {"l": 320.99542, "t": 295.68361999999996, "r": 331.27542, "b": 307.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "Figure 7-27", "bbox": {"l": 331.81543, "t": 295.81363000000005, "r": 379.86542, "b": 307.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": " shows how the key of the case fits into the ", "bbox": {"l": 379.86542, "t": 295.68361999999996, "r": 554.56543, "b": 307.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "slotted keyway of the insert so that when the case is turned, ", "bbox": {"l": 320.99542, "t": 308.18361999999996, "r": 561.16339, "b": 319.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "the threaded insert is turned with it. Note that the slot is wider ", "bbox": {"l": 320.99542, "t": 320.68361999999996, "r": 568.00439, "b": 332.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "than the key. This permits the slot to be narrowed and the ", "bbox": {"l": 320.99542, "t": 333.18361999999996, "r": 553.46545, "b": 344.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "insert to be compressed when the nut is tightened. ", "bbox": {"l": 320.99542, "t": 345.68361999999996, "r": 523.19543, "b": 357.15362999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The stainless steel self-locking nut may be spun on and off by hand as its locking action takes places only when the nut is seated against a solid surface and tightened. The nut consists of two parts: a case with a beveled locking shoulder and key and a thread insert with a locking shoulder and slotted keyway. Until the nut is tightened, it spins on the bolt easily, because the threaded insert is the proper size for the bolt. However, when the nut is seated against a solid surface and tightened, the locking shoulder of the insert is pulled downward and wedged against the locking shoulder of the case. This action compresses the threaded insert and causes it to clench the bolt tightly. The cross-sectional view in Figure 7-27 shows how the key of the case fits into the slotted keyway of the insert so that when the case is turned, the threaded insert is turned with it. Note that the slot is wider than the key. This permits the slot to be narrowed and the insert to be compressed when the nut is tightened."}, {"label": "section_header", "id": 16, "page_no": 0, "cluster": {"id": 16, "label": "section_header", "bbox": {"l": 320.99542, "t": 370.81363000000005, "r": 388.50543, "b": 382.15362999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9253151416778564, "cells": [{"id": 79, "text": "Elastic Stop Nut ", "bbox": {"l": 320.99542, "t": 370.81363000000005, "r": 388.50543, "b": 382.15362999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Elastic Stop Nut"}, {"label": "text", "id": 10, "page_no": 0, "cluster": {"id": 10, "label": "text", "bbox": {"l": 320.99542, "t": 385.18361999999996, "r": 552.35132, "b": 409.15362999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9676452875137329, "cells": [{"id": 80, "text": "The elastic stop nut is a standard nut with the height ", "bbox": {"l": 320.99542, "t": 385.18361999999996, "r": 548.72437, "b": 396.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "increased to accommodate a fiber locking collar. This ", "bbox": {"l": 320.99542, "t": 397.68361999999996, "r": 552.35132, "b": 409.15362999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The elastic stop nut is a standard nut with the height increased to accommodate a fiber locking collar. This"}, {"label": "picture", "id": 2, "page_no": 0, "cluster": {"id": 2, "label": "picture", "bbox": {"l": 320.4467468261719, "t": 421.640625, "r": 558.8576049804688, "b": 692.310791015625, "coord_origin": "TOPLEFT"}, "confidence": 0.9881086945533752, "cells": [{"id": 82, "text": "Tightened nut ", "bbox": {"l": 479.1354999999999, "t": 672.7346, "r": 531.16748, "b": 682.646599, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "Untightened nut ", "bbox": {"l": 474.3699, "t": 531.8918, "r": 535.23389, "b": 541.8037999999999, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "Nut case ", "bbox": {"l": 456.7558900000001, "t": 431.99741, "r": 487.08388999999994, "b": 441.6134, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "Threaded nut core ", "bbox": {"l": 434.62299, "t": 577.8235, "r": 497.47183000000007, "b": 587.4395, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Locking shoulder ", "bbox": {"l": 448.55081, "t": 553.3206, "r": 507.686, "b": 562.9366, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Keyway ", "bbox": {"l": 424.78421, "t": 664.1116, "r": 452.10339000000005, "b": 673.7275999999999, "coord_origin": "TOPLEFT"}}], "children": [{"id": 18, "label": "text", "bbox": {"l": 479.1354999999999, "t": 672.7346, "r": 531.16748, "b": 682.646599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "Tightened nut ", "bbox": {"l": 479.1354999999999, "t": 672.7346, "r": 531.16748, "b": 682.646599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 474.3699, "t": 531.8918, "r": 535.23389, "b": 541.8037999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "Untightened nut ", "bbox": {"l": 474.3699, "t": 531.8918, "r": 535.23389, "b": 541.8037999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 456.7558900000001, "t": 431.99741, "r": 487.08388999999994, "b": 441.6134, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "Nut case ", "bbox": {"l": 456.7558900000001, "t": 431.99741, "r": 487.08388999999994, "b": 441.6134, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 434.62299, "t": 577.8235, "r": 497.47183000000007, "b": 587.4395, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "Threaded nut core ", "bbox": {"l": 434.62299, "t": 577.8235, "r": 497.47183000000007, "b": 587.4395, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 448.55081, "t": 553.3206, "r": 507.686, "b": 562.9366, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "Locking shoulder ", "bbox": {"l": 448.55081, "t": 553.3206, "r": 507.686, "b": 562.9366, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 424.78421, "t": 664.1116, "r": 452.10339000000005, "b": 673.7275999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "Keyway ", "bbox": {"l": 424.78421, "t": 664.1116, "r": 452.10339000000005, "b": 673.7275999999999, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "picture", "id": 7, "page_no": 0, "cluster": {"id": 7, "label": "picture", "bbox": {"l": 70.59269714355469, "t": 531.2222290039062, "r": 309.863037109375, "b": 694.3909912109375, "coord_origin": "TOPLEFT"}, "confidence": 0.9858751893043518, "cells": [{"id": 88, "text": "Boots aircraft nut ", "bbox": {"l": 102.4155, "t": 587.76491, "r": 161.3187, "b": 597.38091, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "Flexloc nut ", "bbox": {"l": 91.685997, "t": 679.309799, "r": 129.77399, "b": 688.925797, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "Fiber locknut ", "bbox": {"l": 162.48109, "t": 679.309799, "r": 207.85629, "b": 688.925797, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "Elastic stop nut ", "bbox": {"l": 237.31379999999996, "t": 679.309799, "r": 289.561, "b": 688.925797, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Elastic anchor nut ", "bbox": {"l": 216.9326, "t": 587.76491, "r": 277.7966, "b": 597.38091, "coord_origin": "TOPLEFT"}}], "children": [{"id": 24, "label": "text", "bbox": {"l": 102.4155, "t": 587.76491, "r": 161.3187, "b": 597.38091, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "Boots aircraft nut ", "bbox": {"l": 102.4155, "t": 587.76491, "r": 161.3187, "b": 597.38091, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 91.685997, "t": 679.309799, "r": 129.77399, "b": 688.925797, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "Flexloc nut ", "bbox": {"l": 91.685997, "t": 679.309799, "r": 129.77399, "b": 688.925797, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 162.48109, "t": 679.309799, "r": 207.85629, "b": 688.925797, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "Fiber locknut ", "bbox": {"l": 162.48109, "t": 679.309799, "r": 207.85629, "b": 688.925797, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 237.31379999999996, "t": 679.309799, "r": 289.561, "b": 688.925797, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "Elastic stop nut ", "bbox": {"l": 237.31379999999996, "t": 679.309799, "r": 289.561, "b": 688.925797, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 216.9326, "t": 587.76491, "r": 277.7966, "b": 597.38091, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "Elastic anchor nut ", "bbox": {"l": 216.9326, "t": 587.76491, "r": 277.7966, "b": 597.38091, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "caption", "id": 12, "page_no": 0, "cluster": {"id": 12, "label": "caption", "bbox": {"l": 72.0, "t": 702.197601, "r": 184.14828, "b": 713.009598, "coord_origin": "TOPLEFT"}, "confidence": 0.9449448585510254, "cells": [{"id": 93, "text": "Figure 7-26. ", "bbox": {"l": 72.0, "t": 702.457596, "r": 119.12800000000001, "b": 713.009598, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "Self-locking nuts. ", "bbox": {"l": 119.4023, "t": 702.197601, "r": 184.14828, "b": 712.403599, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 7-26. Self-locking nuts."}, {"label": "caption", "id": 11, "page_no": 0, "cluster": {"id": 11, "label": "caption", "bbox": {"l": 321.0, "t": 700.177597, "r": 481.64931999999993, "b": 710.989597, "coord_origin": "TOPLEFT"}, "confidence": 0.9497623443603516, "cells": [{"id": 95, "text": "Figure 7-27. ", "bbox": {"l": 321.0, "t": 700.437599, "r": 368.12799, "b": 710.989597, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "Stainless steel self-locking nut. ", "bbox": {"l": 368.40231, "t": 700.177597, "r": 481.64931999999993, "b": 710.383598, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 7-27. Stainless steel self-locking nut."}], "headers": [{"label": "page_footer", "id": 13, "page_no": 0, "cluster": {"id": 13, "label": "page_footer", "bbox": {"l": 537.98541, "t": 727.980301, "r": 560.77539, "b": 740.290298, "coord_origin": "TOPLEFT"}, "confidence": 0.9368571043014526, "cells": [{"id": 97, "text": "7-45 ", "bbox": {"l": 537.98541, "t": 727.980301, "r": 560.77539, "b": 740.290298, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "7-45"}]}}]
\ No newline at end of file
+[{"page_no": 0, "size": {"width": 594.0, "height": 774.0}, "cells": [{"id": 0, "text": "pulleys, provided the inner race of the bearing is clamped ", "bbox": {"l": 71.992126, "t": 43.68364999999994, "r": 300.23203, "b": 55.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "to the supporting structure by the nut and bolt. Plates must ", "bbox": {"l": 71.992126, "t": 56.18364999999994, "r": 302.00214, "b": 67.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "be attached to the structure in a positive manner to eliminate ", "bbox": {"l": 71.992126, "t": 68.68364999999994, "r": 309.82214, "b": 80.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "rotation or misalignment when tightening the bolts or screws. ", "bbox": {"l": 71.992126, "t": 81.18364999999994, "r": 314.11212, "b": 92.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "The two general types of self-locking nuts currently in use ", "bbox": {"l": 71.992302, "t": 106.18364999999994, "r": 305.15311, "b": 117.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "are the all-metal type and the fiber lock type. For the sake of ", "bbox": {"l": 71.993103, "t": 118.68364999999994, "r": 309.98309, "b": 130.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "simplicity, only three typical kinds of self-locking nuts are ", "bbox": {"l": 71.993103, "t": 131.18364999999994, "r": 302.44312, "b": 142.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "considered in this handbook: the Boots self-locking and the ", "bbox": {"l": 71.993103, "t": 143.68364999999994, "r": 306.25311, "b": 155.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "stainless steel self-locking nuts, representing the all-metal ", "bbox": {"l": 71.993103, "t": 156.18364999999994, "r": 303.9931, "b": 167.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "types; and the elastic stop nut, representing ", "bbox": {"l": 71.993103, "t": 168.68364999999994, "r": 238.6723, "b": 180.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "the fiber insert type. ", "bbox": {"l": 234.26460000000003, "t": 168.68364999999994, "r": 313.1546, "b": 180.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Boots Self-Locking Nut ", "bbox": {"l": 71.992302, "t": 193.81359999999995, "r": 167.27231, "b": 205.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "The Boots self-locking nut is of one piece, all-metal ", "bbox": {"l": 71.992302, "t": 208.18364999999994, "r": 302.27719, "b": 219.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "construction designed to hold tight despite severe vibration. ", "bbox": {"l": 71.992294, "t": 220.68364999999994, "r": 313.33026, "b": 232.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Note in ", "bbox": {"l": 71.992294, "t": 233.18364999999994, "r": 104.12231, "b": 244.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Figure 7-26", "bbox": {"l": 104.12231, "t": 233.31359999999995, "r": 152.05231, "b": 244.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": " that it has two sections and is essentially ", "bbox": {"l": 152.05231, "t": 233.18364999999994, "r": 318.49225, "b": 244.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "two nuts in one: a locking nut and a load-carrying nut. The ", "bbox": {"l": 71.992294, "t": 245.68364999999994, "r": 309.42929, "b": 257.15363, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "two sections are connected with a spring, which is an integral ", "bbox": {"l": 71.992294, "t": 258.18364999999994, "r": 317.76227, "b": 269.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "part of the nut. ", "bbox": {"l": 71.992294, "t": 270.68361999999996, "r": 133.3723, "b": 282.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "The spring keeps the locking and load-carrying sections such ", "bbox": {"l": 71.992294, "t": 295.68361999999996, "r": 316.41028, "b": 307.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "a distance apart that the two sets of threads are out of phase ", "bbox": {"l": 71.992294, "t": 308.18361999999996, "r": 312.20731, "b": 319.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "or spaced so that a bolt, which has been screwed through the ", "bbox": {"l": 71.992294, "t": 320.68361999999996, "r": 316.65729, "b": 332.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "load-carrying section, must push the locking section outward ", "bbox": {"l": 71.992294, "t": 333.18361999999996, "r": 315.91229, "b": 344.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "against the force of the spring to engage the threads of the ", "bbox": {"l": 71.992294, "t": 345.68361999999996, "r": 306.34927, "b": 357.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "locking section properly. ", "bbox": {"l": 71.992294, "t": 358.18361999999996, "r": 174.2023, "b": 369.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "The spring, through the medium of the locking section, exerts ", "bbox": {"l": 71.992294, "t": 383.18361999999996, "r": 317.07227, "b": 394.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "a constant locking force on the bolt in the same direction as a ", "bbox": {"l": 71.992294, "t": 395.68361999999996, "r": 318.81229, "b": 407.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "force that would tighten the nut. In this nut, the load-carrying ", "bbox": {"l": 71.992294, "t": 408.18361999999996, "r": 317.5123, "b": 419.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "section has the thread strength of a standard nut of comparable ", "bbox": {"l": 71.992294, "t": 420.68361999999996, "r": 317.31229, "b": 432.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "size, while the locking section presses against the threads of ", "bbox": {"l": 71.992294, "t": 433.18361999999996, "r": 314.45929, "b": 444.65363, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "the bolt and locks the nut firmly in position. Only a wrench ", "bbox": {"l": 71.992294, "t": 445.68362, "r": 311.7023, "b": 457.15363, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "applied to the nut loosens it. The nut can be removed and ", "bbox": {"l": 71.992294, "t": 458.18362, "r": 303.35229, "b": 469.65363, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "reused without impairing its efficiency. ", "bbox": {"l": 71.992294, "t": 470.68362, "r": 231.97228999999996, "b": 482.15363, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Boots self-locking nuts are made with three different spring ", "bbox": {"l": 71.992294, "t": 495.68362, "r": 313.34229, "b": 507.15363, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "styles and in various shapes and sizes. The wing type that is ", "bbox": {"l": 71.992294, "t": 508.18362, "r": 313.91229, "b": 519.65363, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "the most common ranges in size for No. 6 up to ", "bbox": {"l": 320.99231, "t": 43.68364999999994, "r": 513.74628, "b": 55.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "1", "bbox": {"l": 514.06342, "t": 44.52013999999997, "r": 516.81342, "b": 50.828610000000026, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "\u2044", "bbox": {"l": 516.81342, "t": 43.68364999999994, "r": 518.4834, "b": 55.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "4", "bbox": {"l": 518.25842, "t": 47.72014999999999, "r": 523.00525, "b": 54.02863000000002, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "inch, the ", "bbox": {"l": 525.37872, "t": 47.72014999999999, "r": 560.44843, "b": 54.02863000000002, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Rol-top ranges from ", "bbox": {"l": 320.99841, "t": 56.18364999999994, "r": 404.58441, "b": 67.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "1", "bbox": {"l": 404.48981, "t": 57.02013999999997, "r": 407.23981, "b": 63.328610000000026, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "\u2044", "bbox": {"l": 407.23981, "t": 56.18364999999994, "r": 408.90982, "b": 67.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "4", "bbox": {"l": 408.68481, "t": 60.22014999999999, "r": 413.38376, "b": 66.52863000000002, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "inch to ", "bbox": {"l": 415.73322, "t": 60.22014999999999, "r": 443.92681999999996, "b": 66.52863000000002, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "1", "bbox": {"l": 443.82598999999993, "t": 57.02013999999997, "r": 446.57598999999993, "b": 63.328610000000026, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "\u2044", "bbox": {"l": 446.57598999999993, "t": 56.18364999999994, "r": 448.24600000000004, "b": 67.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "6", "bbox": {"l": 448.22588999999994, "t": 60.22014999999999, "r": 453.12659, "b": 66.52863000000002, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "inch, and the bellows type ", "bbox": {"l": 455.57697, "t": 60.22014999999999, "r": 560.6579, "b": 66.52863000000002, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "ranges in size from No. 8 up to ", "bbox": {"l": 320.99591, "t": 68.68364999999994, "r": 447.36591000000004, "b": 80.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "3", "bbox": {"l": 448.79668999999996, "t": 69.52013999999997, "r": 451.54668999999996, "b": 75.82861000000003, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "\u2044", "bbox": {"l": 451.50549, "t": 68.68364999999994, "r": 453.17551, "b": 80.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "8", "bbox": {"l": 453.17542000000003, "t": 72.72014999999999, "r": 458.07175000000007, "b": 79.02863000000002, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "inch. Wing-type nuts are ", "bbox": {"l": 460.51993, "t": 72.72014999999999, "r": 559.78839, "b": 79.02863000000002, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "made of anodized aluminum alloy, cadmium-plated carbon ", "bbox": {"l": 320.99542, "t": 81.18364999999994, "r": 559.77844, "b": 92.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "steel, or stainless steel. The Rol-top nut is cadmium-plated ", "bbox": {"l": 320.99542, "t": 93.68364999999994, "r": 557.87738, "b": 105.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "steel, and the bellows type is made of aluminum alloy only. ", "bbox": {"l": 320.99542, "t": 106.18364999999994, "r": 561.80835, "b": 117.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": ". ", "bbox": {"l": 320.99542, "t": 118.68364999999994, "r": 325.99542, "b": 130.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Stainless Steel Self-Locking Nut ", "bbox": {"l": 320.99542, "t": 131.31359999999995, "r": 450.99542, "b": 142.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "The stainless steel self-locking nut may be spun on and off ", "bbox": {"l": 320.99542, "t": 145.68364999999994, "r": 558.39838, "b": 157.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "by hand as its locking action takes places only when the ", "bbox": {"l": 320.99542, "t": 158.18364999999994, "r": 547.92542, "b": 169.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "nut is seated against a solid surface and tightened. The nut ", "bbox": {"l": 320.99542, "t": 170.68364999999994, "r": 556.50842, "b": 182.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "consists of two parts: a case with a beveled locking shoulder ", "bbox": {"l": 320.99542, "t": 183.18364999999994, "r": 565.11346, "b": 194.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "and key and a thread insert with a locking shoulder and ", "bbox": {"l": 320.99542, "t": 195.68364999999994, "r": 547.93744, "b": 207.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "slotted keyway. Until the nut is tightened, it spins on the ", "bbox": {"l": 320.99542, "t": 208.18364999999994, "r": 549.00647, "b": 219.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "bolt easily, because the threaded insert is the proper size ", "bbox": {"l": 320.99542, "t": 220.68364999999994, "r": 549.0755, "b": 232.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "for the bolt. However, when the nut is seated against a solid ", "bbox": {"l": 320.99542, "t": 233.18364999999994, "r": 562.60242, "b": 244.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "surface and tightened, the locking shoulder of the insert is ", "bbox": {"l": 320.99542, "t": 245.68364999999994, "r": 555.11243, "b": 257.15363, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "pulled downward and wedged against the locking shoulder ", "bbox": {"l": 320.99542, "t": 258.18364999999994, "r": 558.74146, "b": 269.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "of the case. This action compresses the threaded insert and ", "bbox": {"l": 320.99542, "t": 270.68361999999996, "r": 557.88538, "b": 282.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "causes it to clench the bolt tightly. The cross-sectional view ", "bbox": {"l": 320.99542, "t": 283.18361999999996, "r": 562.3114, "b": 294.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "in ", "bbox": {"l": 320.99542, "t": 295.68361999999996, "r": 331.27542, "b": 307.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "Figure 7-27", "bbox": {"l": 331.81543, "t": 295.81363000000005, "r": 379.86542, "b": 307.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": " shows how the key of the case fits into the ", "bbox": {"l": 379.86542, "t": 295.68361999999996, "r": 554.56543, "b": 307.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "slotted keyway of the insert so that when the case is turned, ", "bbox": {"l": 320.99542, "t": 308.18361999999996, "r": 561.16339, "b": 319.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "the threaded insert is turned with it. Note that the slot is wider ", "bbox": {"l": 320.99542, "t": 320.68361999999996, "r": 568.00439, "b": 332.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "than the key. This permits the slot to be narrowed and the ", "bbox": {"l": 320.99542, "t": 333.18361999999996, "r": 553.46545, "b": 344.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "insert to be compressed when the nut is tightened. ", "bbox": {"l": 320.99542, "t": 345.68361999999996, "r": 523.19543, "b": 357.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "Elastic Stop Nut ", "bbox": {"l": 320.99542, "t": 370.81363000000005, "r": 388.50543, "b": 382.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "The elastic stop nut is a standard nut with the height ", "bbox": {"l": 320.99542, "t": 385.18361999999996, "r": 548.72437, "b": 396.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "increased to accommodate a fiber locking collar. This ", "bbox": {"l": 320.99542, "t": 397.68361999999996, "r": 552.35132, "b": 409.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "Tightened nut ", "bbox": {"l": 479.1354999999999, "t": 672.7346, "r": 531.16748, "b": 682.646599, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "Untightened nut ", "bbox": {"l": 474.3699, "t": 531.8918, "r": 535.23389, "b": 541.8037999999999, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "Nut case ", "bbox": {"l": 456.7558900000001, "t": 431.99741, "r": 487.08388999999994, "b": 441.6134, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "Threaded nut core ", "bbox": {"l": 434.62299, "t": 577.8235, "r": 497.47183000000007, "b": 587.4395, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Locking shoulder ", "bbox": {"l": 448.55081, "t": 553.3206, "r": 507.686, "b": 562.9366, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Keyway ", "bbox": {"l": 424.78421, "t": 664.1116, "r": 452.10339000000005, "b": 673.7275999999999, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "Boots aircraft nut ", "bbox": {"l": 102.4155, "t": 587.76491, "r": 161.3187, "b": 597.38091, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "Flexloc nut ", "bbox": {"l": 91.685997, "t": 679.309799, "r": 129.77399, "b": 688.925797, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "Fiber locknut ", "bbox": {"l": 162.48109, "t": 679.309799, "r": 207.85629, "b": 688.925797, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "Elastic stop nut ", "bbox": {"l": 237.31379999999996, "t": 679.309799, "r": 289.561, "b": 688.925797, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Elastic anchor nut ", "bbox": {"l": 216.9326, "t": 587.76491, "r": 277.7966, "b": 597.38091, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "Figure 7-26. ", "bbox": {"l": 72.0, "t": 702.457596, "r": 119.12800000000001, "b": 713.009598, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "Self-locking nuts. ", "bbox": {"l": 119.4023, "t": 702.197601, "r": 184.14828, "b": 712.403599, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "Figure 7-27. ", "bbox": {"l": 321.0, "t": 700.437599, "r": 368.12799, "b": 710.989597, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "Stainless steel self-locking nut. ", "bbox": {"l": 368.40231, "t": 700.177597, "r": 481.64931999999993, "b": 710.383598, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "7-45 ", "bbox": {"l": 537.98541, "t": 727.980301, "r": 560.77539, "b": 740.290298, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 8, "label": "text", "bbox": {"l": 71.992126, "t": 43.68364999999994, "r": 314.11212, "b": 92.65363000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9851651191711426, "cells": [{"id": 0, "text": "pulleys, provided the inner race of the bearing is clamped ", "bbox": {"l": 71.992126, "t": 43.68364999999994, "r": 300.23203, "b": 55.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "to the supporting structure by the nut and bolt. Plates must ", "bbox": {"l": 71.992126, "t": 56.18364999999994, "r": 302.00214, "b": 67.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "be attached to the structure in a positive manner to eliminate ", "bbox": {"l": 71.992126, "t": 68.68364999999994, "r": 309.82214, "b": 80.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "rotation or misalignment when tightening the bolts or screws. ", "bbox": {"l": 71.992126, "t": 81.18364999999994, "r": 314.11212, "b": 92.65363000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "text", "bbox": {"l": 71.992302, "t": 106.18364999999994, "r": 313.1546, "b": 180.15363000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9873439073562622, "cells": [{"id": 4, "text": "The two general types of self-locking nuts currently in use ", "bbox": {"l": 71.992302, "t": 106.18364999999994, "r": 305.15311, "b": 117.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "are the all-metal type and the fiber lock type. For the sake of ", "bbox": {"l": 71.993103, "t": 118.68364999999994, "r": 309.98309, "b": 130.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "simplicity, only three typical kinds of self-locking nuts are ", "bbox": {"l": 71.993103, "t": 131.18364999999994, "r": 302.44312, "b": 142.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "considered in this handbook: the Boots self-locking and the ", "bbox": {"l": 71.993103, "t": 143.68364999999994, "r": 306.25311, "b": 155.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "stainless steel self-locking nuts, representing the all-metal ", "bbox": {"l": 71.993103, "t": 156.18364999999994, "r": 303.9931, "b": 167.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "types; and the elastic stop nut, representing ", "bbox": {"l": 71.993103, "t": 168.68364999999994, "r": 238.6723, "b": 180.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "the fiber insert type. ", "bbox": {"l": 234.26460000000003, "t": 168.68364999999994, "r": 313.1546, "b": 180.15363000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "section_header", "bbox": {"l": 71.992302, "t": 193.81359999999995, "r": 167.27231, "b": 205.15363000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9309079647064209, "cells": [{"id": 11, "text": "Boots Self-Locking Nut ", "bbox": {"l": 71.992302, "t": 193.81359999999995, "r": 167.27231, "b": 205.15363000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "text", "bbox": {"l": 71.992294, "t": 208.18364999999994, "r": 318.49225, "b": 282.15362999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9866572022438049, "cells": [{"id": 12, "text": "The Boots self-locking nut is of one piece, all-metal ", "bbox": {"l": 71.992302, "t": 208.18364999999994, "r": 302.27719, "b": 219.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "construction designed to hold tight despite severe vibration. ", "bbox": {"l": 71.992294, "t": 220.68364999999994, "r": 313.33026, "b": 232.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Note in ", "bbox": {"l": 71.992294, "t": 233.18364999999994, "r": 104.12231, "b": 244.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Figure 7-26", "bbox": {"l": 104.12231, "t": 233.31359999999995, "r": 152.05231, "b": 244.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": " that it has two sections and is essentially ", "bbox": {"l": 152.05231, "t": 233.18364999999994, "r": 318.49225, "b": 244.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "two nuts in one: a locking nut and a load-carrying nut. The ", "bbox": {"l": 71.992294, "t": 245.68364999999994, "r": 309.42929, "b": 257.15363, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "two sections are connected with a spring, which is an integral ", "bbox": {"l": 71.992294, "t": 258.18364999999994, "r": 317.76227, "b": 269.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "part of the nut. ", "bbox": {"l": 71.992294, "t": 270.68361999999996, "r": 133.3723, "b": 282.15362999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 71.992294, "t": 295.68361999999996, "r": 316.65729, "b": 369.65362999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9881331324577332, "cells": [{"id": 20, "text": "The spring keeps the locking and load-carrying sections such ", "bbox": {"l": 71.992294, "t": 295.68361999999996, "r": 316.41028, "b": 307.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "a distance apart that the two sets of threads are out of phase ", "bbox": {"l": 71.992294, "t": 308.18361999999996, "r": 312.20731, "b": 319.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "or spaced so that a bolt, which has been screwed through the ", "bbox": {"l": 71.992294, "t": 320.68361999999996, "r": 316.65729, "b": 332.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "load-carrying section, must push the locking section outward ", "bbox": {"l": 71.992294, "t": 333.18361999999996, "r": 315.91229, "b": 344.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "against the force of the spring to engage the threads of the ", "bbox": {"l": 71.992294, "t": 345.68361999999996, "r": 306.34927, "b": 357.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "locking section properly. ", "bbox": {"l": 71.992294, "t": 358.18361999999996, "r": 174.2023, "b": 369.65362999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 71.992294, "t": 383.18361999999996, "r": 318.81229, "b": 482.15363, "coord_origin": "TOPLEFT"}, "confidence": 0.9882921576499939, "cells": [{"id": 26, "text": "The spring, through the medium of the locking section, exerts ", "bbox": {"l": 71.992294, "t": 383.18361999999996, "r": 317.07227, "b": 394.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "a constant locking force on the bolt in the same direction as a ", "bbox": {"l": 71.992294, "t": 395.68361999999996, "r": 318.81229, "b": 407.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "force that would tighten the nut. In this nut, the load-carrying ", "bbox": {"l": 71.992294, "t": 408.18361999999996, "r": 317.5123, "b": 419.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "section has the thread strength of a standard nut of comparable ", "bbox": {"l": 71.992294, "t": 420.68361999999996, "r": 317.31229, "b": 432.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "size, while the locking section presses against the threads of ", "bbox": {"l": 71.992294, "t": 433.18361999999996, "r": 314.45929, "b": 444.65363, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "the bolt and locks the nut firmly in position. Only a wrench ", "bbox": {"l": 71.992294, "t": 445.68362, "r": 311.7023, "b": 457.15363, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "applied to the nut loosens it. The nut can be removed and ", "bbox": {"l": 71.992294, "t": 458.18362, "r": 303.35229, "b": 469.65363, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "reused without impairing its efficiency. ", "bbox": {"l": 71.992294, "t": 470.68362, "r": 231.97228999999996, "b": 482.15363, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 71.992294, "t": 495.68362, "r": 313.91229, "b": 519.65363, "coord_origin": "TOPLEFT"}, "confidence": 0.9695363640785217, "cells": [{"id": 34, "text": "Boots self-locking nuts are made with three different spring ", "bbox": {"l": 71.992294, "t": 495.68362, "r": 313.34229, "b": 507.15363, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "styles and in various shapes and sizes. The wing type that is ", "bbox": {"l": 71.992294, "t": 508.18362, "r": 313.91229, "b": 519.65363, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "text", "bbox": {"l": 320.99231, "t": 43.68364999999994, "r": 561.80835, "b": 117.65363000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9870070219039917, "cells": [{"id": 36, "text": "the most common ranges in size for No. 6 up to ", "bbox": {"l": 320.99231, "t": 43.68364999999994, "r": 513.74628, "b": 55.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "1", "bbox": {"l": 514.06342, "t": 44.52013999999997, "r": 516.81342, "b": 50.828610000000026, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "\u2044", "bbox": {"l": 516.81342, "t": 43.68364999999994, "r": 518.4834, "b": 55.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "4", "bbox": {"l": 518.25842, "t": 47.72014999999999, "r": 523.00525, "b": 54.02863000000002, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "inch, the ", "bbox": {"l": 525.37872, "t": 47.72014999999999, "r": 560.44843, "b": 54.02863000000002, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Rol-top ranges from ", "bbox": {"l": 320.99841, "t": 56.18364999999994, "r": 404.58441, "b": 67.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "1", "bbox": {"l": 404.48981, "t": 57.02013999999997, "r": 407.23981, "b": 63.328610000000026, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "\u2044", "bbox": {"l": 407.23981, "t": 56.18364999999994, "r": 408.90982, "b": 67.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "4", "bbox": {"l": 408.68481, "t": 60.22014999999999, "r": 413.38376, "b": 66.52863000000002, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "inch to ", "bbox": {"l": 415.73322, "t": 60.22014999999999, "r": 443.92681999999996, "b": 66.52863000000002, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "1", "bbox": {"l": 443.82598999999993, "t": 57.02013999999997, "r": 446.57598999999993, "b": 63.328610000000026, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "\u2044", "bbox": {"l": 446.57598999999993, "t": 56.18364999999994, "r": 448.24600000000004, "b": 67.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "6", "bbox": {"l": 448.22588999999994, "t": 60.22014999999999, "r": 453.12659, "b": 66.52863000000002, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "inch, and the bellows type ", "bbox": {"l": 455.57697, "t": 60.22014999999999, "r": 560.6579, "b": 66.52863000000002, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "ranges in size from No. 8 up to ", "bbox": {"l": 320.99591, "t": 68.68364999999994, "r": 447.36591000000004, "b": 80.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "3", "bbox": {"l": 448.79668999999996, "t": 69.52013999999997, "r": 451.54668999999996, "b": 75.82861000000003, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "\u2044", "bbox": {"l": 451.50549, "t": 68.68364999999994, "r": 453.17551, "b": 80.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "8", "bbox": {"l": 453.17542000000003, "t": 72.72014999999999, "r": 458.07175000000007, "b": 79.02863000000002, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "inch. Wing-type nuts are ", "bbox": {"l": 460.51993, "t": 72.72014999999999, "r": 559.78839, "b": 79.02863000000002, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "made of anodized aluminum alloy, cadmium-plated carbon ", "bbox": {"l": 320.99542, "t": 81.18364999999994, "r": 559.77844, "b": 92.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "steel, or stainless steel. The Rol-top nut is cadmium-plated ", "bbox": {"l": 320.99542, "t": 93.68364999999994, "r": 557.87738, "b": 105.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "steel, and the bellows type is made of aluminum alloy only. ", "bbox": {"l": 320.99542, "t": 106.18364999999994, "r": 561.80835, "b": 117.65363000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 320.99542, "t": 118.68364999999994, "r": 325.99542, "b": 130.15363000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": ". ", "bbox": {"l": 320.99542, "t": 118.68364999999994, "r": 325.99542, "b": 130.15363000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "section_header", "bbox": {"l": 320.99542, "t": 131.31359999999995, "r": 450.99542, "b": 142.65363000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9263731241226196, "cells": [{"id": 59, "text": "Stainless Steel Self-Locking Nut ", "bbox": {"l": 320.99542, "t": 131.31359999999995, "r": 450.99542, "b": 142.65363000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 320.99542, "t": 145.68364999999994, "r": 568.00439, "b": 357.15362999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9879258871078491, "cells": [{"id": 60, "text": "The stainless steel self-locking nut may be spun on and off ", "bbox": {"l": 320.99542, "t": 145.68364999999994, "r": 558.39838, "b": 157.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "by hand as its locking action takes places only when the ", "bbox": {"l": 320.99542, "t": 158.18364999999994, "r": 547.92542, "b": 169.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "nut is seated against a solid surface and tightened. The nut ", "bbox": {"l": 320.99542, "t": 170.68364999999994, "r": 556.50842, "b": 182.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "consists of two parts: a case with a beveled locking shoulder ", "bbox": {"l": 320.99542, "t": 183.18364999999994, "r": 565.11346, "b": 194.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "and key and a thread insert with a locking shoulder and ", "bbox": {"l": 320.99542, "t": 195.68364999999994, "r": 547.93744, "b": 207.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "slotted keyway. Until the nut is tightened, it spins on the ", "bbox": {"l": 320.99542, "t": 208.18364999999994, "r": 549.00647, "b": 219.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "bolt easily, because the threaded insert is the proper size ", "bbox": {"l": 320.99542, "t": 220.68364999999994, "r": 549.0755, "b": 232.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "for the bolt. However, when the nut is seated against a solid ", "bbox": {"l": 320.99542, "t": 233.18364999999994, "r": 562.60242, "b": 244.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "surface and tightened, the locking shoulder of the insert is ", "bbox": {"l": 320.99542, "t": 245.68364999999994, "r": 555.11243, "b": 257.15363, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "pulled downward and wedged against the locking shoulder ", "bbox": {"l": 320.99542, "t": 258.18364999999994, "r": 558.74146, "b": 269.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "of the case. This action compresses the threaded insert and ", "bbox": {"l": 320.99542, "t": 270.68361999999996, "r": 557.88538, "b": 282.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "causes it to clench the bolt tightly. The cross-sectional view ", "bbox": {"l": 320.99542, "t": 283.18361999999996, "r": 562.3114, "b": 294.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "in ", "bbox": {"l": 320.99542, "t": 295.68361999999996, "r": 331.27542, "b": 307.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "Figure 7-27", "bbox": {"l": 331.81543, "t": 295.81363000000005, "r": 379.86542, "b": 307.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": " shows how the key of the case fits into the ", "bbox": {"l": 379.86542, "t": 295.68361999999996, "r": 554.56543, "b": 307.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "slotted keyway of the insert so that when the case is turned, ", "bbox": {"l": 320.99542, "t": 308.18361999999996, "r": 561.16339, "b": 319.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "the threaded insert is turned with it. Note that the slot is wider ", "bbox": {"l": 320.99542, "t": 320.68361999999996, "r": 568.00439, "b": 332.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "than the key. This permits the slot to be narrowed and the ", "bbox": {"l": 320.99542, "t": 333.18361999999996, "r": 553.46545, "b": 344.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "insert to be compressed when the nut is tightened. ", "bbox": {"l": 320.99542, "t": 345.68361999999996, "r": 523.19543, "b": 357.15362999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "section_header", "bbox": {"l": 320.99542, "t": 370.81363000000005, "r": 388.50543, "b": 382.15362999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9253152012825012, "cells": [{"id": 79, "text": "Elastic Stop Nut ", "bbox": {"l": 320.99542, "t": 370.81363000000005, "r": 388.50543, "b": 382.15362999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "text", "bbox": {"l": 320.99542, "t": 385.18361999999996, "r": 552.35132, "b": 409.15362999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9676451683044434, "cells": [{"id": 80, "text": "The elastic stop nut is a standard nut with the height ", "bbox": {"l": 320.99542, "t": 385.18361999999996, "r": 548.72437, "b": 396.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "increased to accommodate a fiber locking collar. This ", "bbox": {"l": 320.99542, "t": 397.68361999999996, "r": 552.35132, "b": 409.15362999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "picture", "bbox": {"l": 320.4467468261719, "t": 421.640625, "r": 558.8576049804688, "b": 692.310791015625, "coord_origin": "TOPLEFT"}, "confidence": 0.9881086945533752, "cells": [{"id": 82, "text": "Tightened nut ", "bbox": {"l": 479.1354999999999, "t": 672.7346, "r": 531.16748, "b": 682.646599, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "Untightened nut ", "bbox": {"l": 474.3699, "t": 531.8918, "r": 535.23389, "b": 541.8037999999999, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "Nut case ", "bbox": {"l": 456.7558900000001, "t": 431.99741, "r": 487.08388999999994, "b": 441.6134, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "Threaded nut core ", "bbox": {"l": 434.62299, "t": 577.8235, "r": 497.47183000000007, "b": 587.4395, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Locking shoulder ", "bbox": {"l": 448.55081, "t": 553.3206, "r": 507.686, "b": 562.9366, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Keyway ", "bbox": {"l": 424.78421, "t": 664.1116, "r": 452.10339000000005, "b": 673.7275999999999, "coord_origin": "TOPLEFT"}}], "children": [{"id": 18, "label": "text", "bbox": {"l": 479.1354999999999, "t": 672.7346, "r": 531.16748, "b": 682.646599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "Tightened nut ", "bbox": {"l": 479.1354999999999, "t": 672.7346, "r": 531.16748, "b": 682.646599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 474.3699, "t": 531.8918, "r": 535.23389, "b": 541.8037999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "Untightened nut ", "bbox": {"l": 474.3699, "t": 531.8918, "r": 535.23389, "b": 541.8037999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 456.7558900000001, "t": 431.99741, "r": 487.08388999999994, "b": 441.6134, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "Nut case ", "bbox": {"l": 456.7558900000001, "t": 431.99741, "r": 487.08388999999994, "b": 441.6134, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 434.62299, "t": 577.8235, "r": 497.47183000000007, "b": 587.4395, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "Threaded nut core ", "bbox": {"l": 434.62299, "t": 577.8235, "r": 497.47183000000007, "b": 587.4395, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 448.55081, "t": 553.3206, "r": 507.686, "b": 562.9366, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "Locking shoulder ", "bbox": {"l": 448.55081, "t": 553.3206, "r": 507.686, "b": 562.9366, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 424.78421, "t": 664.1116, "r": 452.10339000000005, "b": 673.7275999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "Keyway ", "bbox": {"l": 424.78421, "t": 664.1116, "r": 452.10339000000005, "b": 673.7275999999999, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 7, "label": "picture", "bbox": {"l": 70.59269714355469, "t": 531.2222290039062, "r": 309.863037109375, "b": 694.3909912109375, "coord_origin": "TOPLEFT"}, "confidence": 0.9858751893043518, "cells": [{"id": 88, "text": "Boots aircraft nut ", "bbox": {"l": 102.4155, "t": 587.76491, "r": 161.3187, "b": 597.38091, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "Flexloc nut ", "bbox": {"l": 91.685997, "t": 679.309799, "r": 129.77399, "b": 688.925797, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "Fiber locknut ", "bbox": {"l": 162.48109, "t": 679.309799, "r": 207.85629, "b": 688.925797, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "Elastic stop nut ", "bbox": {"l": 237.31379999999996, "t": 679.309799, "r": 289.561, "b": 688.925797, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Elastic anchor nut ", "bbox": {"l": 216.9326, "t": 587.76491, "r": 277.7966, "b": 597.38091, "coord_origin": "TOPLEFT"}}], "children": [{"id": 24, "label": "text", "bbox": {"l": 102.4155, "t": 587.76491, "r": 161.3187, "b": 597.38091, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "Boots aircraft nut ", "bbox": {"l": 102.4155, "t": 587.76491, "r": 161.3187, "b": 597.38091, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 91.685997, "t": 679.309799, "r": 129.77399, "b": 688.925797, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "Flexloc nut ", "bbox": {"l": 91.685997, "t": 679.309799, "r": 129.77399, "b": 688.925797, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 162.48109, "t": 679.309799, "r": 207.85629, "b": 688.925797, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "Fiber locknut ", "bbox": {"l": 162.48109, "t": 679.309799, "r": 207.85629, "b": 688.925797, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 237.31379999999996, "t": 679.309799, "r": 289.561, "b": 688.925797, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "Elastic stop nut ", "bbox": {"l": 237.31379999999996, "t": 679.309799, "r": 289.561, "b": 688.925797, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 216.9326, "t": 587.76491, "r": 277.7966, "b": 597.38091, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "Elastic anchor nut ", "bbox": {"l": 216.9326, "t": 587.76491, "r": 277.7966, "b": 597.38091, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 12, "label": "caption", "bbox": {"l": 72.0, "t": 702.197601, "r": 184.14828, "b": 713.009598, "coord_origin": "TOPLEFT"}, "confidence": 0.9449448585510254, "cells": [{"id": 93, "text": "Figure 7-26. ", "bbox": {"l": 72.0, "t": 702.457596, "r": 119.12800000000001, "b": 713.009598, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "Self-locking nuts. ", "bbox": {"l": 119.4023, "t": 702.197601, "r": 184.14828, "b": 712.403599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "caption", "bbox": {"l": 321.0, "t": 700.177597, "r": 481.64931999999993, "b": 710.989597, "coord_origin": "TOPLEFT"}, "confidence": 0.9497622847557068, "cells": [{"id": 95, "text": "Figure 7-27. ", "bbox": {"l": 321.0, "t": 700.437599, "r": 368.12799, "b": 710.989597, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "Stainless steel self-locking nut. ", "bbox": {"l": 368.40231, "t": 700.177597, "r": 481.64931999999993, "b": 710.383598, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "page_footer", "bbox": {"l": 537.98541, "t": 727.980301, "r": 560.77539, "b": 740.290298, "coord_origin": "TOPLEFT"}, "confidence": 0.9368568658828735, "cells": [{"id": 97, "text": "7-45 ", "bbox": {"l": 537.98541, "t": 727.980301, "r": 560.77539, "b": 740.290298, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "text", "id": 8, "page_no": 0, "cluster": {"id": 8, "label": "text", "bbox": {"l": 71.992126, "t": 43.68364999999994, "r": 314.11212, "b": 92.65363000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9851651191711426, "cells": [{"id": 0, "text": "pulleys, provided the inner race of the bearing is clamped ", "bbox": {"l": 71.992126, "t": 43.68364999999994, "r": 300.23203, "b": 55.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "to the supporting structure by the nut and bolt. Plates must ", "bbox": {"l": 71.992126, "t": 56.18364999999994, "r": 302.00214, "b": 67.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "be attached to the structure in a positive manner to eliminate ", "bbox": {"l": 71.992126, "t": 68.68364999999994, "r": 309.82214, "b": 80.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "rotation or misalignment when tightening the bolts or screws. ", "bbox": {"l": 71.992126, "t": 81.18364999999994, "r": 314.11212, "b": 92.65363000000002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "pulleys, provided the inner race of the bearing is clamped to the supporting structure by the nut and bolt. Plates must be attached to the structure in a positive manner to eliminate rotation or misalignment when tightening the bolts or screws."}, {"label": "text", "id": 4, "page_no": 0, "cluster": {"id": 4, "label": "text", "bbox": {"l": 71.992302, "t": 106.18364999999994, "r": 313.1546, "b": 180.15363000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9873439073562622, "cells": [{"id": 4, "text": "The two general types of self-locking nuts currently in use ", "bbox": {"l": 71.992302, "t": 106.18364999999994, "r": 305.15311, "b": 117.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "are the all-metal type and the fiber lock type. For the sake of ", "bbox": {"l": 71.993103, "t": 118.68364999999994, "r": 309.98309, "b": 130.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "simplicity, only three typical kinds of self-locking nuts are ", "bbox": {"l": 71.993103, "t": 131.18364999999994, "r": 302.44312, "b": 142.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "considered in this handbook: the Boots self-locking and the ", "bbox": {"l": 71.993103, "t": 143.68364999999994, "r": 306.25311, "b": 155.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "stainless steel self-locking nuts, representing the all-metal ", "bbox": {"l": 71.993103, "t": 156.18364999999994, "r": 303.9931, "b": 167.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "types; and the elastic stop nut, representing ", "bbox": {"l": 71.993103, "t": 168.68364999999994, "r": 238.6723, "b": 180.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "the fiber insert type. ", "bbox": {"l": 234.26460000000003, "t": 168.68364999999994, "r": 313.1546, "b": 180.15363000000002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The two general types of self-locking nuts currently in use are the all-metal type and the fiber lock type. For the sake of simplicity, only three typical kinds of self-locking nuts are considered in this handbook: the Boots self-locking and the stainless steel self-locking nuts, representing the all-metal types; and the elastic stop nut, representing the fiber insert type."}, {"label": "section_header", "id": 14, "page_no": 0, "cluster": {"id": 14, "label": "section_header", "bbox": {"l": 71.992302, "t": 193.81359999999995, "r": 167.27231, "b": 205.15363000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9309079647064209, "cells": [{"id": 11, "text": "Boots Self-Locking Nut ", "bbox": {"l": 71.992302, "t": 193.81359999999995, "r": 167.27231, "b": 205.15363000000002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Boots Self-Locking Nut"}, {"label": "text", "id": 6, "page_no": 0, "cluster": {"id": 6, "label": "text", "bbox": {"l": 71.992294, "t": 208.18364999999994, "r": 318.49225, "b": 282.15362999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9866572022438049, "cells": [{"id": 12, "text": "The Boots self-locking nut is of one piece, all-metal ", "bbox": {"l": 71.992302, "t": 208.18364999999994, "r": 302.27719, "b": 219.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "construction designed to hold tight despite severe vibration. ", "bbox": {"l": 71.992294, "t": 220.68364999999994, "r": 313.33026, "b": 232.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Note in ", "bbox": {"l": 71.992294, "t": 233.18364999999994, "r": 104.12231, "b": 244.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Figure 7-26", "bbox": {"l": 104.12231, "t": 233.31359999999995, "r": 152.05231, "b": 244.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": " that it has two sections and is essentially ", "bbox": {"l": 152.05231, "t": 233.18364999999994, "r": 318.49225, "b": 244.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "two nuts in one: a locking nut and a load-carrying nut. The ", "bbox": {"l": 71.992294, "t": 245.68364999999994, "r": 309.42929, "b": 257.15363, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "two sections are connected with a spring, which is an integral ", "bbox": {"l": 71.992294, "t": 258.18364999999994, "r": 317.76227, "b": 269.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "part of the nut. ", "bbox": {"l": 71.992294, "t": 270.68361999999996, "r": 133.3723, "b": 282.15362999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The Boots self-locking nut is of one piece, all-metal construction designed to hold tight despite severe vibration. Note in Figure 7-26 that it has two sections and is essentially two nuts in one: a locking nut and a load-carrying nut. The two sections are connected with a spring, which is an integral part of the nut."}, {"label": "text", "id": 1, "page_no": 0, "cluster": {"id": 1, "label": "text", "bbox": {"l": 71.992294, "t": 295.68361999999996, "r": 316.65729, "b": 369.65362999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9881331324577332, "cells": [{"id": 20, "text": "The spring keeps the locking and load-carrying sections such ", "bbox": {"l": 71.992294, "t": 295.68361999999996, "r": 316.41028, "b": 307.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "a distance apart that the two sets of threads are out of phase ", "bbox": {"l": 71.992294, "t": 308.18361999999996, "r": 312.20731, "b": 319.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "or spaced so that a bolt, which has been screwed through the ", "bbox": {"l": 71.992294, "t": 320.68361999999996, "r": 316.65729, "b": 332.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "load-carrying section, must push the locking section outward ", "bbox": {"l": 71.992294, "t": 333.18361999999996, "r": 315.91229, "b": 344.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "against the force of the spring to engage the threads of the ", "bbox": {"l": 71.992294, "t": 345.68361999999996, "r": 306.34927, "b": 357.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "locking section properly. ", "bbox": {"l": 71.992294, "t": 358.18361999999996, "r": 174.2023, "b": 369.65362999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The spring keeps the locking and load-carrying sections such a distance apart that the two sets of threads are out of phase or spaced so that a bolt, which has been screwed through the load-carrying section, must push the locking section outward against the force of the spring to engage the threads of the locking section properly."}, {"label": "text", "id": 0, "page_no": 0, "cluster": {"id": 0, "label": "text", "bbox": {"l": 71.992294, "t": 383.18361999999996, "r": 318.81229, "b": 482.15363, "coord_origin": "TOPLEFT"}, "confidence": 0.9882921576499939, "cells": [{"id": 26, "text": "The spring, through the medium of the locking section, exerts ", "bbox": {"l": 71.992294, "t": 383.18361999999996, "r": 317.07227, "b": 394.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "a constant locking force on the bolt in the same direction as a ", "bbox": {"l": 71.992294, "t": 395.68361999999996, "r": 318.81229, "b": 407.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "force that would tighten the nut. In this nut, the load-carrying ", "bbox": {"l": 71.992294, "t": 408.18361999999996, "r": 317.5123, "b": 419.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "section has the thread strength of a standard nut of comparable ", "bbox": {"l": 71.992294, "t": 420.68361999999996, "r": 317.31229, "b": 432.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "size, while the locking section presses against the threads of ", "bbox": {"l": 71.992294, "t": 433.18361999999996, "r": 314.45929, "b": 444.65363, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "the bolt and locks the nut firmly in position. Only a wrench ", "bbox": {"l": 71.992294, "t": 445.68362, "r": 311.7023, "b": 457.15363, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "applied to the nut loosens it. The nut can be removed and ", "bbox": {"l": 71.992294, "t": 458.18362, "r": 303.35229, "b": 469.65363, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "reused without impairing its efficiency. ", "bbox": {"l": 71.992294, "t": 470.68362, "r": 231.97228999999996, "b": 482.15363, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The spring, through the medium of the locking section, exerts a constant locking force on the bolt in the same direction as a force that would tighten the nut. In this nut, the load-carrying section has the thread strength of a standard nut of comparable size, while the locking section presses against the threads of the bolt and locks the nut firmly in position. Only a wrench applied to the nut loosens it. The nut can be removed and reused without impairing its efficiency."}, {"label": "text", "id": 9, "page_no": 0, "cluster": {"id": 9, "label": "text", "bbox": {"l": 71.992294, "t": 495.68362, "r": 313.91229, "b": 519.65363, "coord_origin": "TOPLEFT"}, "confidence": 0.9695363640785217, "cells": [{"id": 34, "text": "Boots self-locking nuts are made with three different spring ", "bbox": {"l": 71.992294, "t": 495.68362, "r": 313.34229, "b": 507.15363, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "styles and in various shapes and sizes. The wing type that is ", "bbox": {"l": 71.992294, "t": 508.18362, "r": 313.91229, "b": 519.65363, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Boots self-locking nuts are made with three different spring styles and in various shapes and sizes. The wing type that is"}, {"label": "text", "id": 5, "page_no": 0, "cluster": {"id": 5, "label": "text", "bbox": {"l": 320.99231, "t": 43.68364999999994, "r": 561.80835, "b": 117.65363000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9870070219039917, "cells": [{"id": 36, "text": "the most common ranges in size for No. 6 up to ", "bbox": {"l": 320.99231, "t": 43.68364999999994, "r": 513.74628, "b": 55.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "1", "bbox": {"l": 514.06342, "t": 44.52013999999997, "r": 516.81342, "b": 50.828610000000026, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "\u2044", "bbox": {"l": 516.81342, "t": 43.68364999999994, "r": 518.4834, "b": 55.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "4", "bbox": {"l": 518.25842, "t": 47.72014999999999, "r": 523.00525, "b": 54.02863000000002, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "inch, the ", "bbox": {"l": 525.37872, "t": 47.72014999999999, "r": 560.44843, "b": 54.02863000000002, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Rol-top ranges from ", "bbox": {"l": 320.99841, "t": 56.18364999999994, "r": 404.58441, "b": 67.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "1", "bbox": {"l": 404.48981, "t": 57.02013999999997, "r": 407.23981, "b": 63.328610000000026, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "\u2044", "bbox": {"l": 407.23981, "t": 56.18364999999994, "r": 408.90982, "b": 67.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "4", "bbox": {"l": 408.68481, "t": 60.22014999999999, "r": 413.38376, "b": 66.52863000000002, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "inch to ", "bbox": {"l": 415.73322, "t": 60.22014999999999, "r": 443.92681999999996, "b": 66.52863000000002, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "1", "bbox": {"l": 443.82598999999993, "t": 57.02013999999997, "r": 446.57598999999993, "b": 63.328610000000026, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "\u2044", "bbox": {"l": 446.57598999999993, "t": 56.18364999999994, "r": 448.24600000000004, "b": 67.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "6", "bbox": {"l": 448.22588999999994, "t": 60.22014999999999, "r": 453.12659, "b": 66.52863000000002, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "inch, and the bellows type ", "bbox": {"l": 455.57697, "t": 60.22014999999999, "r": 560.6579, "b": 66.52863000000002, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "ranges in size from No. 8 up to ", "bbox": {"l": 320.99591, "t": 68.68364999999994, "r": 447.36591000000004, "b": 80.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "3", "bbox": {"l": 448.79668999999996, "t": 69.52013999999997, "r": 451.54668999999996, "b": 75.82861000000003, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "\u2044", "bbox": {"l": 451.50549, "t": 68.68364999999994, "r": 453.17551, "b": 80.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "8", "bbox": {"l": 453.17542000000003, "t": 72.72014999999999, "r": 458.07175000000007, "b": 79.02863000000002, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "inch. Wing-type nuts are ", "bbox": {"l": 460.51993, "t": 72.72014999999999, "r": 559.78839, "b": 79.02863000000002, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "made of anodized aluminum alloy, cadmium-plated carbon ", "bbox": {"l": 320.99542, "t": 81.18364999999994, "r": 559.77844, "b": 92.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "steel, or stainless steel. The Rol-top nut is cadmium-plated ", "bbox": {"l": 320.99542, "t": 93.68364999999994, "r": 557.87738, "b": 105.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "steel, and the bellows type is made of aluminum alloy only. ", "bbox": {"l": 320.99542, "t": 106.18364999999994, "r": 561.80835, "b": 117.65363000000002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "the most common ranges in size for No. 6 up to 1 / 4 inch, the Rol-top ranges from 1 / 4 inch to 1 / 6 inch, and the bellows type ranges in size from No. 8 up to 3 / 8 inch. Wing-type nuts are made of anodized aluminum alloy, cadmium-plated carbon steel, or stainless steel. The Rol-top nut is cadmium-plated steel, and the bellows type is made of aluminum alloy only."}, {"label": "text", "id": 17, "page_no": 0, "cluster": {"id": 17, "label": "text", "bbox": {"l": 320.99542, "t": 118.68364999999994, "r": 325.99542, "b": 130.15363000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": ". ", "bbox": {"l": 320.99542, "t": 118.68364999999994, "r": 325.99542, "b": 130.15363000000002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "."}, {"label": "section_header", "id": 15, "page_no": 0, "cluster": {"id": 15, "label": "section_header", "bbox": {"l": 320.99542, "t": 131.31359999999995, "r": 450.99542, "b": 142.65363000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9263731241226196, "cells": [{"id": 59, "text": "Stainless Steel Self-Locking Nut ", "bbox": {"l": 320.99542, "t": 131.31359999999995, "r": 450.99542, "b": 142.65363000000002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Stainless Steel Self-Locking Nut"}, {"label": "text", "id": 3, "page_no": 0, "cluster": {"id": 3, "label": "text", "bbox": {"l": 320.99542, "t": 145.68364999999994, "r": 568.00439, "b": 357.15362999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9879258871078491, "cells": [{"id": 60, "text": "The stainless steel self-locking nut may be spun on and off ", "bbox": {"l": 320.99542, "t": 145.68364999999994, "r": 558.39838, "b": 157.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "by hand as its locking action takes places only when the ", "bbox": {"l": 320.99542, "t": 158.18364999999994, "r": 547.92542, "b": 169.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "nut is seated against a solid surface and tightened. The nut ", "bbox": {"l": 320.99542, "t": 170.68364999999994, "r": 556.50842, "b": 182.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "consists of two parts: a case with a beveled locking shoulder ", "bbox": {"l": 320.99542, "t": 183.18364999999994, "r": 565.11346, "b": 194.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "and key and a thread insert with a locking shoulder and ", "bbox": {"l": 320.99542, "t": 195.68364999999994, "r": 547.93744, "b": 207.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "slotted keyway. Until the nut is tightened, it spins on the ", "bbox": {"l": 320.99542, "t": 208.18364999999994, "r": 549.00647, "b": 219.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "bolt easily, because the threaded insert is the proper size ", "bbox": {"l": 320.99542, "t": 220.68364999999994, "r": 549.0755, "b": 232.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "for the bolt. However, when the nut is seated against a solid ", "bbox": {"l": 320.99542, "t": 233.18364999999994, "r": 562.60242, "b": 244.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "surface and tightened, the locking shoulder of the insert is ", "bbox": {"l": 320.99542, "t": 245.68364999999994, "r": 555.11243, "b": 257.15363, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "pulled downward and wedged against the locking shoulder ", "bbox": {"l": 320.99542, "t": 258.18364999999994, "r": 558.74146, "b": 269.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "of the case. This action compresses the threaded insert and ", "bbox": {"l": 320.99542, "t": 270.68361999999996, "r": 557.88538, "b": 282.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "causes it to clench the bolt tightly. The cross-sectional view ", "bbox": {"l": 320.99542, "t": 283.18361999999996, "r": 562.3114, "b": 294.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "in ", "bbox": {"l": 320.99542, "t": 295.68361999999996, "r": 331.27542, "b": 307.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "Figure 7-27", "bbox": {"l": 331.81543, "t": 295.81363000000005, "r": 379.86542, "b": 307.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": " shows how the key of the case fits into the ", "bbox": {"l": 379.86542, "t": 295.68361999999996, "r": 554.56543, "b": 307.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "slotted keyway of the insert so that when the case is turned, ", "bbox": {"l": 320.99542, "t": 308.18361999999996, "r": 561.16339, "b": 319.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "the threaded insert is turned with it. Note that the slot is wider ", "bbox": {"l": 320.99542, "t": 320.68361999999996, "r": 568.00439, "b": 332.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "than the key. This permits the slot to be narrowed and the ", "bbox": {"l": 320.99542, "t": 333.18361999999996, "r": 553.46545, "b": 344.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "insert to be compressed when the nut is tightened. ", "bbox": {"l": 320.99542, "t": 345.68361999999996, "r": 523.19543, "b": 357.15362999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The stainless steel self-locking nut may be spun on and off by hand as its locking action takes places only when the nut is seated against a solid surface and tightened. The nut consists of two parts: a case with a beveled locking shoulder and key and a thread insert with a locking shoulder and slotted keyway. Until the nut is tightened, it spins on the bolt easily, because the threaded insert is the proper size for the bolt. However, when the nut is seated against a solid surface and tightened, the locking shoulder of the insert is pulled downward and wedged against the locking shoulder of the case. This action compresses the threaded insert and causes it to clench the bolt tightly. The cross-sectional view in Figure 7-27 shows how the key of the case fits into the slotted keyway of the insert so that when the case is turned, the threaded insert is turned with it. Note that the slot is wider than the key. This permits the slot to be narrowed and the insert to be compressed when the nut is tightened."}, {"label": "section_header", "id": 16, "page_no": 0, "cluster": {"id": 16, "label": "section_header", "bbox": {"l": 320.99542, "t": 370.81363000000005, "r": 388.50543, "b": 382.15362999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9253152012825012, "cells": [{"id": 79, "text": "Elastic Stop Nut ", "bbox": {"l": 320.99542, "t": 370.81363000000005, "r": 388.50543, "b": 382.15362999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Elastic Stop Nut"}, {"label": "text", "id": 10, "page_no": 0, "cluster": {"id": 10, "label": "text", "bbox": {"l": 320.99542, "t": 385.18361999999996, "r": 552.35132, "b": 409.15362999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9676451683044434, "cells": [{"id": 80, "text": "The elastic stop nut is a standard nut with the height ", "bbox": {"l": 320.99542, "t": 385.18361999999996, "r": 548.72437, "b": 396.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "increased to accommodate a fiber locking collar. This ", "bbox": {"l": 320.99542, "t": 397.68361999999996, "r": 552.35132, "b": 409.15362999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The elastic stop nut is a standard nut with the height increased to accommodate a fiber locking collar. This"}, {"label": "picture", "id": 2, "page_no": 0, "cluster": {"id": 2, "label": "picture", "bbox": {"l": 320.4467468261719, "t": 421.640625, "r": 558.8576049804688, "b": 692.310791015625, "coord_origin": "TOPLEFT"}, "confidence": 0.9881086945533752, "cells": [{"id": 82, "text": "Tightened nut ", "bbox": {"l": 479.1354999999999, "t": 672.7346, "r": 531.16748, "b": 682.646599, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "Untightened nut ", "bbox": {"l": 474.3699, "t": 531.8918, "r": 535.23389, "b": 541.8037999999999, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "Nut case ", "bbox": {"l": 456.7558900000001, "t": 431.99741, "r": 487.08388999999994, "b": 441.6134, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "Threaded nut core ", "bbox": {"l": 434.62299, "t": 577.8235, "r": 497.47183000000007, "b": 587.4395, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Locking shoulder ", "bbox": {"l": 448.55081, "t": 553.3206, "r": 507.686, "b": 562.9366, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Keyway ", "bbox": {"l": 424.78421, "t": 664.1116, "r": 452.10339000000005, "b": 673.7275999999999, "coord_origin": "TOPLEFT"}}], "children": [{"id": 18, "label": "text", "bbox": {"l": 479.1354999999999, "t": 672.7346, "r": 531.16748, "b": 682.646599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "Tightened nut ", "bbox": {"l": 479.1354999999999, "t": 672.7346, "r": 531.16748, "b": 682.646599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 474.3699, "t": 531.8918, "r": 535.23389, "b": 541.8037999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "Untightened nut ", "bbox": {"l": 474.3699, "t": 531.8918, "r": 535.23389, "b": 541.8037999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 456.7558900000001, "t": 431.99741, "r": 487.08388999999994, "b": 441.6134, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "Nut case ", "bbox": {"l": 456.7558900000001, "t": 431.99741, "r": 487.08388999999994, "b": 441.6134, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 434.62299, "t": 577.8235, "r": 497.47183000000007, "b": 587.4395, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "Threaded nut core ", "bbox": {"l": 434.62299, "t": 577.8235, "r": 497.47183000000007, "b": 587.4395, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 448.55081, "t": 553.3206, "r": 507.686, "b": 562.9366, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "Locking shoulder ", "bbox": {"l": 448.55081, "t": 553.3206, "r": 507.686, "b": 562.9366, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 424.78421, "t": 664.1116, "r": 452.10339000000005, "b": 673.7275999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "Keyway ", "bbox": {"l": 424.78421, "t": 664.1116, "r": 452.10339000000005, "b": 673.7275999999999, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "picture", "id": 7, "page_no": 0, "cluster": {"id": 7, "label": "picture", "bbox": {"l": 70.59269714355469, "t": 531.2222290039062, "r": 309.863037109375, "b": 694.3909912109375, "coord_origin": "TOPLEFT"}, "confidence": 0.9858751893043518, "cells": [{"id": 88, "text": "Boots aircraft nut ", "bbox": {"l": 102.4155, "t": 587.76491, "r": 161.3187, "b": 597.38091, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "Flexloc nut ", "bbox": {"l": 91.685997, "t": 679.309799, "r": 129.77399, "b": 688.925797, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "Fiber locknut ", "bbox": {"l": 162.48109, "t": 679.309799, "r": 207.85629, "b": 688.925797, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "Elastic stop nut ", "bbox": {"l": 237.31379999999996, "t": 679.309799, "r": 289.561, "b": 688.925797, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Elastic anchor nut ", "bbox": {"l": 216.9326, "t": 587.76491, "r": 277.7966, "b": 597.38091, "coord_origin": "TOPLEFT"}}], "children": [{"id": 24, "label": "text", "bbox": {"l": 102.4155, "t": 587.76491, "r": 161.3187, "b": 597.38091, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "Boots aircraft nut ", "bbox": {"l": 102.4155, "t": 587.76491, "r": 161.3187, "b": 597.38091, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 91.685997, "t": 679.309799, "r": 129.77399, "b": 688.925797, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "Flexloc nut ", "bbox": {"l": 91.685997, "t": 679.309799, "r": 129.77399, "b": 688.925797, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 162.48109, "t": 679.309799, "r": 207.85629, "b": 688.925797, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "Fiber locknut ", "bbox": {"l": 162.48109, "t": 679.309799, "r": 207.85629, "b": 688.925797, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 237.31379999999996, "t": 679.309799, "r": 289.561, "b": 688.925797, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "Elastic stop nut ", "bbox": {"l": 237.31379999999996, "t": 679.309799, "r": 289.561, "b": 688.925797, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 216.9326, "t": 587.76491, "r": 277.7966, "b": 597.38091, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "Elastic anchor nut ", "bbox": {"l": 216.9326, "t": 587.76491, "r": 277.7966, "b": 597.38091, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "caption", "id": 12, "page_no": 0, "cluster": {"id": 12, "label": "caption", "bbox": {"l": 72.0, "t": 702.197601, "r": 184.14828, "b": 713.009598, "coord_origin": "TOPLEFT"}, "confidence": 0.9449448585510254, "cells": [{"id": 93, "text": "Figure 7-26. ", "bbox": {"l": 72.0, "t": 702.457596, "r": 119.12800000000001, "b": 713.009598, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "Self-locking nuts. ", "bbox": {"l": 119.4023, "t": 702.197601, "r": 184.14828, "b": 712.403599, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 7-26. Self-locking nuts."}, {"label": "caption", "id": 11, "page_no": 0, "cluster": {"id": 11, "label": "caption", "bbox": {"l": 321.0, "t": 700.177597, "r": 481.64931999999993, "b": 710.989597, "coord_origin": "TOPLEFT"}, "confidence": 0.9497622847557068, "cells": [{"id": 95, "text": "Figure 7-27. ", "bbox": {"l": 321.0, "t": 700.437599, "r": 368.12799, "b": 710.989597, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "Stainless steel self-locking nut. ", "bbox": {"l": 368.40231, "t": 700.177597, "r": 481.64931999999993, "b": 710.383598, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 7-27. Stainless steel self-locking nut."}, {"label": "page_footer", "id": 13, "page_no": 0, "cluster": {"id": 13, "label": "page_footer", "bbox": {"l": 537.98541, "t": 727.980301, "r": 560.77539, "b": 740.290298, "coord_origin": "TOPLEFT"}, "confidence": 0.9368568658828735, "cells": [{"id": 97, "text": "7-45 ", "bbox": {"l": 537.98541, "t": 727.980301, "r": 560.77539, "b": 740.290298, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "7-45"}], "body": [{"label": "text", "id": 8, "page_no": 0, "cluster": {"id": 8, "label": "text", "bbox": {"l": 71.992126, "t": 43.68364999999994, "r": 314.11212, "b": 92.65363000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9851651191711426, "cells": [{"id": 0, "text": "pulleys, provided the inner race of the bearing is clamped ", "bbox": {"l": 71.992126, "t": 43.68364999999994, "r": 300.23203, "b": 55.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "to the supporting structure by the nut and bolt. Plates must ", "bbox": {"l": 71.992126, "t": 56.18364999999994, "r": 302.00214, "b": 67.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "be attached to the structure in a positive manner to eliminate ", "bbox": {"l": 71.992126, "t": 68.68364999999994, "r": 309.82214, "b": 80.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "rotation or misalignment when tightening the bolts or screws. ", "bbox": {"l": 71.992126, "t": 81.18364999999994, "r": 314.11212, "b": 92.65363000000002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "pulleys, provided the inner race of the bearing is clamped to the supporting structure by the nut and bolt. Plates must be attached to the structure in a positive manner to eliminate rotation or misalignment when tightening the bolts or screws."}, {"label": "text", "id": 4, "page_no": 0, "cluster": {"id": 4, "label": "text", "bbox": {"l": 71.992302, "t": 106.18364999999994, "r": 313.1546, "b": 180.15363000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9873439073562622, "cells": [{"id": 4, "text": "The two general types of self-locking nuts currently in use ", "bbox": {"l": 71.992302, "t": 106.18364999999994, "r": 305.15311, "b": 117.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "are the all-metal type and the fiber lock type. For the sake of ", "bbox": {"l": 71.993103, "t": 118.68364999999994, "r": 309.98309, "b": 130.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "simplicity, only three typical kinds of self-locking nuts are ", "bbox": {"l": 71.993103, "t": 131.18364999999994, "r": 302.44312, "b": 142.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "considered in this handbook: the Boots self-locking and the ", "bbox": {"l": 71.993103, "t": 143.68364999999994, "r": 306.25311, "b": 155.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "stainless steel self-locking nuts, representing the all-metal ", "bbox": {"l": 71.993103, "t": 156.18364999999994, "r": 303.9931, "b": 167.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "types; and the elastic stop nut, representing ", "bbox": {"l": 71.993103, "t": 168.68364999999994, "r": 238.6723, "b": 180.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "the fiber insert type. ", "bbox": {"l": 234.26460000000003, "t": 168.68364999999994, "r": 313.1546, "b": 180.15363000000002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The two general types of self-locking nuts currently in use are the all-metal type and the fiber lock type. For the sake of simplicity, only three typical kinds of self-locking nuts are considered in this handbook: the Boots self-locking and the stainless steel self-locking nuts, representing the all-metal types; and the elastic stop nut, representing the fiber insert type."}, {"label": "section_header", "id": 14, "page_no": 0, "cluster": {"id": 14, "label": "section_header", "bbox": {"l": 71.992302, "t": 193.81359999999995, "r": 167.27231, "b": 205.15363000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9309079647064209, "cells": [{"id": 11, "text": "Boots Self-Locking Nut ", "bbox": {"l": 71.992302, "t": 193.81359999999995, "r": 167.27231, "b": 205.15363000000002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Boots Self-Locking Nut"}, {"label": "text", "id": 6, "page_no": 0, "cluster": {"id": 6, "label": "text", "bbox": {"l": 71.992294, "t": 208.18364999999994, "r": 318.49225, "b": 282.15362999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9866572022438049, "cells": [{"id": 12, "text": "The Boots self-locking nut is of one piece, all-metal ", "bbox": {"l": 71.992302, "t": 208.18364999999994, "r": 302.27719, "b": 219.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "construction designed to hold tight despite severe vibration. ", "bbox": {"l": 71.992294, "t": 220.68364999999994, "r": 313.33026, "b": 232.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Note in ", "bbox": {"l": 71.992294, "t": 233.18364999999994, "r": 104.12231, "b": 244.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Figure 7-26", "bbox": {"l": 104.12231, "t": 233.31359999999995, "r": 152.05231, "b": 244.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": " that it has two sections and is essentially ", "bbox": {"l": 152.05231, "t": 233.18364999999994, "r": 318.49225, "b": 244.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "two nuts in one: a locking nut and a load-carrying nut. The ", "bbox": {"l": 71.992294, "t": 245.68364999999994, "r": 309.42929, "b": 257.15363, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "two sections are connected with a spring, which is an integral ", "bbox": {"l": 71.992294, "t": 258.18364999999994, "r": 317.76227, "b": 269.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "part of the nut. ", "bbox": {"l": 71.992294, "t": 270.68361999999996, "r": 133.3723, "b": 282.15362999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The Boots self-locking nut is of one piece, all-metal construction designed to hold tight despite severe vibration. Note in Figure 7-26 that it has two sections and is essentially two nuts in one: a locking nut and a load-carrying nut. The two sections are connected with a spring, which is an integral part of the nut."}, {"label": "text", "id": 1, "page_no": 0, "cluster": {"id": 1, "label": "text", "bbox": {"l": 71.992294, "t": 295.68361999999996, "r": 316.65729, "b": 369.65362999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9881331324577332, "cells": [{"id": 20, "text": "The spring keeps the locking and load-carrying sections such ", "bbox": {"l": 71.992294, "t": 295.68361999999996, "r": 316.41028, "b": 307.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "a distance apart that the two sets of threads are out of phase ", "bbox": {"l": 71.992294, "t": 308.18361999999996, "r": 312.20731, "b": 319.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "or spaced so that a bolt, which has been screwed through the ", "bbox": {"l": 71.992294, "t": 320.68361999999996, "r": 316.65729, "b": 332.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "load-carrying section, must push the locking section outward ", "bbox": {"l": 71.992294, "t": 333.18361999999996, "r": 315.91229, "b": 344.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "against the force of the spring to engage the threads of the ", "bbox": {"l": 71.992294, "t": 345.68361999999996, "r": 306.34927, "b": 357.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "locking section properly. ", "bbox": {"l": 71.992294, "t": 358.18361999999996, "r": 174.2023, "b": 369.65362999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The spring keeps the locking and load-carrying sections such a distance apart that the two sets of threads are out of phase or spaced so that a bolt, which has been screwed through the load-carrying section, must push the locking section outward against the force of the spring to engage the threads of the locking section properly."}, {"label": "text", "id": 0, "page_no": 0, "cluster": {"id": 0, "label": "text", "bbox": {"l": 71.992294, "t": 383.18361999999996, "r": 318.81229, "b": 482.15363, "coord_origin": "TOPLEFT"}, "confidence": 0.9882921576499939, "cells": [{"id": 26, "text": "The spring, through the medium of the locking section, exerts ", "bbox": {"l": 71.992294, "t": 383.18361999999996, "r": 317.07227, "b": 394.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "a constant locking force on the bolt in the same direction as a ", "bbox": {"l": 71.992294, "t": 395.68361999999996, "r": 318.81229, "b": 407.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "force that would tighten the nut. In this nut, the load-carrying ", "bbox": {"l": 71.992294, "t": 408.18361999999996, "r": 317.5123, "b": 419.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "section has the thread strength of a standard nut of comparable ", "bbox": {"l": 71.992294, "t": 420.68361999999996, "r": 317.31229, "b": 432.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "size, while the locking section presses against the threads of ", "bbox": {"l": 71.992294, "t": 433.18361999999996, "r": 314.45929, "b": 444.65363, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "the bolt and locks the nut firmly in position. Only a wrench ", "bbox": {"l": 71.992294, "t": 445.68362, "r": 311.7023, "b": 457.15363, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "applied to the nut loosens it. The nut can be removed and ", "bbox": {"l": 71.992294, "t": 458.18362, "r": 303.35229, "b": 469.65363, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "reused without impairing its efficiency. ", "bbox": {"l": 71.992294, "t": 470.68362, "r": 231.97228999999996, "b": 482.15363, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The spring, through the medium of the locking section, exerts a constant locking force on the bolt in the same direction as a force that would tighten the nut. In this nut, the load-carrying section has the thread strength of a standard nut of comparable size, while the locking section presses against the threads of the bolt and locks the nut firmly in position. Only a wrench applied to the nut loosens it. The nut can be removed and reused without impairing its efficiency."}, {"label": "text", "id": 9, "page_no": 0, "cluster": {"id": 9, "label": "text", "bbox": {"l": 71.992294, "t": 495.68362, "r": 313.91229, "b": 519.65363, "coord_origin": "TOPLEFT"}, "confidence": 0.9695363640785217, "cells": [{"id": 34, "text": "Boots self-locking nuts are made with three different spring ", "bbox": {"l": 71.992294, "t": 495.68362, "r": 313.34229, "b": 507.15363, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "styles and in various shapes and sizes. The wing type that is ", "bbox": {"l": 71.992294, "t": 508.18362, "r": 313.91229, "b": 519.65363, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Boots self-locking nuts are made with three different spring styles and in various shapes and sizes. The wing type that is"}, {"label": "text", "id": 5, "page_no": 0, "cluster": {"id": 5, "label": "text", "bbox": {"l": 320.99231, "t": 43.68364999999994, "r": 561.80835, "b": 117.65363000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9870070219039917, "cells": [{"id": 36, "text": "the most common ranges in size for No. 6 up to ", "bbox": {"l": 320.99231, "t": 43.68364999999994, "r": 513.74628, "b": 55.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "1", "bbox": {"l": 514.06342, "t": 44.52013999999997, "r": 516.81342, "b": 50.828610000000026, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "\u2044", "bbox": {"l": 516.81342, "t": 43.68364999999994, "r": 518.4834, "b": 55.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "4", "bbox": {"l": 518.25842, "t": 47.72014999999999, "r": 523.00525, "b": 54.02863000000002, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "inch, the ", "bbox": {"l": 525.37872, "t": 47.72014999999999, "r": 560.44843, "b": 54.02863000000002, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Rol-top ranges from ", "bbox": {"l": 320.99841, "t": 56.18364999999994, "r": 404.58441, "b": 67.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "1", "bbox": {"l": 404.48981, "t": 57.02013999999997, "r": 407.23981, "b": 63.328610000000026, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "\u2044", "bbox": {"l": 407.23981, "t": 56.18364999999994, "r": 408.90982, "b": 67.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "4", "bbox": {"l": 408.68481, "t": 60.22014999999999, "r": 413.38376, "b": 66.52863000000002, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "inch to ", "bbox": {"l": 415.73322, "t": 60.22014999999999, "r": 443.92681999999996, "b": 66.52863000000002, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "1", "bbox": {"l": 443.82598999999993, "t": 57.02013999999997, "r": 446.57598999999993, "b": 63.328610000000026, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "\u2044", "bbox": {"l": 446.57598999999993, "t": 56.18364999999994, "r": 448.24600000000004, "b": 67.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "6", "bbox": {"l": 448.22588999999994, "t": 60.22014999999999, "r": 453.12659, "b": 66.52863000000002, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "inch, and the bellows type ", "bbox": {"l": 455.57697, "t": 60.22014999999999, "r": 560.6579, "b": 66.52863000000002, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "ranges in size from No. 8 up to ", "bbox": {"l": 320.99591, "t": 68.68364999999994, "r": 447.36591000000004, "b": 80.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "3", "bbox": {"l": 448.79668999999996, "t": 69.52013999999997, "r": 451.54668999999996, "b": 75.82861000000003, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "\u2044", "bbox": {"l": 451.50549, "t": 68.68364999999994, "r": 453.17551, "b": 80.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "8", "bbox": {"l": 453.17542000000003, "t": 72.72014999999999, "r": 458.07175000000007, "b": 79.02863000000002, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "inch. Wing-type nuts are ", "bbox": {"l": 460.51993, "t": 72.72014999999999, "r": 559.78839, "b": 79.02863000000002, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "made of anodized aluminum alloy, cadmium-plated carbon ", "bbox": {"l": 320.99542, "t": 81.18364999999994, "r": 559.77844, "b": 92.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "steel, or stainless steel. The Rol-top nut is cadmium-plated ", "bbox": {"l": 320.99542, "t": 93.68364999999994, "r": 557.87738, "b": 105.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "steel, and the bellows type is made of aluminum alloy only. ", "bbox": {"l": 320.99542, "t": 106.18364999999994, "r": 561.80835, "b": 117.65363000000002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "the most common ranges in size for No. 6 up to 1 / 4 inch, the Rol-top ranges from 1 / 4 inch to 1 / 6 inch, and the bellows type ranges in size from No. 8 up to 3 / 8 inch. Wing-type nuts are made of anodized aluminum alloy, cadmium-plated carbon steel, or stainless steel. The Rol-top nut is cadmium-plated steel, and the bellows type is made of aluminum alloy only."}, {"label": "text", "id": 17, "page_no": 0, "cluster": {"id": 17, "label": "text", "bbox": {"l": 320.99542, "t": 118.68364999999994, "r": 325.99542, "b": 130.15363000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": ". ", "bbox": {"l": 320.99542, "t": 118.68364999999994, "r": 325.99542, "b": 130.15363000000002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "."}, {"label": "section_header", "id": 15, "page_no": 0, "cluster": {"id": 15, "label": "section_header", "bbox": {"l": 320.99542, "t": 131.31359999999995, "r": 450.99542, "b": 142.65363000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9263731241226196, "cells": [{"id": 59, "text": "Stainless Steel Self-Locking Nut ", "bbox": {"l": 320.99542, "t": 131.31359999999995, "r": 450.99542, "b": 142.65363000000002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Stainless Steel Self-Locking Nut"}, {"label": "text", "id": 3, "page_no": 0, "cluster": {"id": 3, "label": "text", "bbox": {"l": 320.99542, "t": 145.68364999999994, "r": 568.00439, "b": 357.15362999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9879258871078491, "cells": [{"id": 60, "text": "The stainless steel self-locking nut may be spun on and off ", "bbox": {"l": 320.99542, "t": 145.68364999999994, "r": 558.39838, "b": 157.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "by hand as its locking action takes places only when the ", "bbox": {"l": 320.99542, "t": 158.18364999999994, "r": 547.92542, "b": 169.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "nut is seated against a solid surface and tightened. The nut ", "bbox": {"l": 320.99542, "t": 170.68364999999994, "r": 556.50842, "b": 182.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "consists of two parts: a case with a beveled locking shoulder ", "bbox": {"l": 320.99542, "t": 183.18364999999994, "r": 565.11346, "b": 194.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "and key and a thread insert with a locking shoulder and ", "bbox": {"l": 320.99542, "t": 195.68364999999994, "r": 547.93744, "b": 207.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "slotted keyway. Until the nut is tightened, it spins on the ", "bbox": {"l": 320.99542, "t": 208.18364999999994, "r": 549.00647, "b": 219.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "bolt easily, because the threaded insert is the proper size ", "bbox": {"l": 320.99542, "t": 220.68364999999994, "r": 549.0755, "b": 232.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "for the bolt. However, when the nut is seated against a solid ", "bbox": {"l": 320.99542, "t": 233.18364999999994, "r": 562.60242, "b": 244.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "surface and tightened, the locking shoulder of the insert is ", "bbox": {"l": 320.99542, "t": 245.68364999999994, "r": 555.11243, "b": 257.15363, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "pulled downward and wedged against the locking shoulder ", "bbox": {"l": 320.99542, "t": 258.18364999999994, "r": 558.74146, "b": 269.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "of the case. This action compresses the threaded insert and ", "bbox": {"l": 320.99542, "t": 270.68361999999996, "r": 557.88538, "b": 282.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "causes it to clench the bolt tightly. The cross-sectional view ", "bbox": {"l": 320.99542, "t": 283.18361999999996, "r": 562.3114, "b": 294.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "in ", "bbox": {"l": 320.99542, "t": 295.68361999999996, "r": 331.27542, "b": 307.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "Figure 7-27", "bbox": {"l": 331.81543, "t": 295.81363000000005, "r": 379.86542, "b": 307.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": " shows how the key of the case fits into the ", "bbox": {"l": 379.86542, "t": 295.68361999999996, "r": 554.56543, "b": 307.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "slotted keyway of the insert so that when the case is turned, ", "bbox": {"l": 320.99542, "t": 308.18361999999996, "r": 561.16339, "b": 319.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "the threaded insert is turned with it. Note that the slot is wider ", "bbox": {"l": 320.99542, "t": 320.68361999999996, "r": 568.00439, "b": 332.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "than the key. This permits the slot to be narrowed and the ", "bbox": {"l": 320.99542, "t": 333.18361999999996, "r": 553.46545, "b": 344.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "insert to be compressed when the nut is tightened. ", "bbox": {"l": 320.99542, "t": 345.68361999999996, "r": 523.19543, "b": 357.15362999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The stainless steel self-locking nut may be spun on and off by hand as its locking action takes places only when the nut is seated against a solid surface and tightened. The nut consists of two parts: a case with a beveled locking shoulder and key and a thread insert with a locking shoulder and slotted keyway. Until the nut is tightened, it spins on the bolt easily, because the threaded insert is the proper size for the bolt. However, when the nut is seated against a solid surface and tightened, the locking shoulder of the insert is pulled downward and wedged against the locking shoulder of the case. This action compresses the threaded insert and causes it to clench the bolt tightly. The cross-sectional view in Figure 7-27 shows how the key of the case fits into the slotted keyway of the insert so that when the case is turned, the threaded insert is turned with it. Note that the slot is wider than the key. This permits the slot to be narrowed and the insert to be compressed when the nut is tightened."}, {"label": "section_header", "id": 16, "page_no": 0, "cluster": {"id": 16, "label": "section_header", "bbox": {"l": 320.99542, "t": 370.81363000000005, "r": 388.50543, "b": 382.15362999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9253152012825012, "cells": [{"id": 79, "text": "Elastic Stop Nut ", "bbox": {"l": 320.99542, "t": 370.81363000000005, "r": 388.50543, "b": 382.15362999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Elastic Stop Nut"}, {"label": "text", "id": 10, "page_no": 0, "cluster": {"id": 10, "label": "text", "bbox": {"l": 320.99542, "t": 385.18361999999996, "r": 552.35132, "b": 409.15362999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9676451683044434, "cells": [{"id": 80, "text": "The elastic stop nut is a standard nut with the height ", "bbox": {"l": 320.99542, "t": 385.18361999999996, "r": 548.72437, "b": 396.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "increased to accommodate a fiber locking collar. This ", "bbox": {"l": 320.99542, "t": 397.68361999999996, "r": 552.35132, "b": 409.15362999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The elastic stop nut is a standard nut with the height increased to accommodate a fiber locking collar. This"}, {"label": "picture", "id": 2, "page_no": 0, "cluster": {"id": 2, "label": "picture", "bbox": {"l": 320.4467468261719, "t": 421.640625, "r": 558.8576049804688, "b": 692.310791015625, "coord_origin": "TOPLEFT"}, "confidence": 0.9881086945533752, "cells": [{"id": 82, "text": "Tightened nut ", "bbox": {"l": 479.1354999999999, "t": 672.7346, "r": 531.16748, "b": 682.646599, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "Untightened nut ", "bbox": {"l": 474.3699, "t": 531.8918, "r": 535.23389, "b": 541.8037999999999, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "Nut case ", "bbox": {"l": 456.7558900000001, "t": 431.99741, "r": 487.08388999999994, "b": 441.6134, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "Threaded nut core ", "bbox": {"l": 434.62299, "t": 577.8235, "r": 497.47183000000007, "b": 587.4395, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Locking shoulder ", "bbox": {"l": 448.55081, "t": 553.3206, "r": 507.686, "b": 562.9366, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Keyway ", "bbox": {"l": 424.78421, "t": 664.1116, "r": 452.10339000000005, "b": 673.7275999999999, "coord_origin": "TOPLEFT"}}], "children": [{"id": 18, "label": "text", "bbox": {"l": 479.1354999999999, "t": 672.7346, "r": 531.16748, "b": 682.646599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "Tightened nut ", "bbox": {"l": 479.1354999999999, "t": 672.7346, "r": 531.16748, "b": 682.646599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 474.3699, "t": 531.8918, "r": 535.23389, "b": 541.8037999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "Untightened nut ", "bbox": {"l": 474.3699, "t": 531.8918, "r": 535.23389, "b": 541.8037999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 456.7558900000001, "t": 431.99741, "r": 487.08388999999994, "b": 441.6134, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "Nut case ", "bbox": {"l": 456.7558900000001, "t": 431.99741, "r": 487.08388999999994, "b": 441.6134, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 434.62299, "t": 577.8235, "r": 497.47183000000007, "b": 587.4395, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "Threaded nut core ", "bbox": {"l": 434.62299, "t": 577.8235, "r": 497.47183000000007, "b": 587.4395, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 448.55081, "t": 553.3206, "r": 507.686, "b": 562.9366, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "Locking shoulder ", "bbox": {"l": 448.55081, "t": 553.3206, "r": 507.686, "b": 562.9366, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 424.78421, "t": 664.1116, "r": 452.10339000000005, "b": 673.7275999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "Keyway ", "bbox": {"l": 424.78421, "t": 664.1116, "r": 452.10339000000005, "b": 673.7275999999999, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "picture", "id": 7, "page_no": 0, "cluster": {"id": 7, "label": "picture", "bbox": {"l": 70.59269714355469, "t": 531.2222290039062, "r": 309.863037109375, "b": 694.3909912109375, "coord_origin": "TOPLEFT"}, "confidence": 0.9858751893043518, "cells": [{"id": 88, "text": "Boots aircraft nut ", "bbox": {"l": 102.4155, "t": 587.76491, "r": 161.3187, "b": 597.38091, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "Flexloc nut ", "bbox": {"l": 91.685997, "t": 679.309799, "r": 129.77399, "b": 688.925797, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "Fiber locknut ", "bbox": {"l": 162.48109, "t": 679.309799, "r": 207.85629, "b": 688.925797, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "Elastic stop nut ", "bbox": {"l": 237.31379999999996, "t": 679.309799, "r": 289.561, "b": 688.925797, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Elastic anchor nut ", "bbox": {"l": 216.9326, "t": 587.76491, "r": 277.7966, "b": 597.38091, "coord_origin": "TOPLEFT"}}], "children": [{"id": 24, "label": "text", "bbox": {"l": 102.4155, "t": 587.76491, "r": 161.3187, "b": 597.38091, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "Boots aircraft nut ", "bbox": {"l": 102.4155, "t": 587.76491, "r": 161.3187, "b": 597.38091, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 91.685997, "t": 679.309799, "r": 129.77399, "b": 688.925797, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "Flexloc nut ", "bbox": {"l": 91.685997, "t": 679.309799, "r": 129.77399, "b": 688.925797, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 162.48109, "t": 679.309799, "r": 207.85629, "b": 688.925797, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "Fiber locknut ", "bbox": {"l": 162.48109, "t": 679.309799, "r": 207.85629, "b": 688.925797, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 237.31379999999996, "t": 679.309799, "r": 289.561, "b": 688.925797, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "Elastic stop nut ", "bbox": {"l": 237.31379999999996, "t": 679.309799, "r": 289.561, "b": 688.925797, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 216.9326, "t": 587.76491, "r": 277.7966, "b": 597.38091, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "Elastic anchor nut ", "bbox": {"l": 216.9326, "t": 587.76491, "r": 277.7966, "b": 597.38091, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "caption", "id": 12, "page_no": 0, "cluster": {"id": 12, "label": "caption", "bbox": {"l": 72.0, "t": 702.197601, "r": 184.14828, "b": 713.009598, "coord_origin": "TOPLEFT"}, "confidence": 0.9449448585510254, "cells": [{"id": 93, "text": "Figure 7-26. ", "bbox": {"l": 72.0, "t": 702.457596, "r": 119.12800000000001, "b": 713.009598, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "Self-locking nuts. ", "bbox": {"l": 119.4023, "t": 702.197601, "r": 184.14828, "b": 712.403599, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 7-26. Self-locking nuts."}, {"label": "caption", "id": 11, "page_no": 0, "cluster": {"id": 11, "label": "caption", "bbox": {"l": 321.0, "t": 700.177597, "r": 481.64931999999993, "b": 710.989597, "coord_origin": "TOPLEFT"}, "confidence": 0.9497622847557068, "cells": [{"id": 95, "text": "Figure 7-27. ", "bbox": {"l": 321.0, "t": 700.437599, "r": 368.12799, "b": 710.989597, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "Stainless steel self-locking nut. ", "bbox": {"l": 368.40231, "t": 700.177597, "r": 481.64931999999993, "b": 710.383598, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 7-27. Stainless steel self-locking nut."}], "headers": [{"label": "page_footer", "id": 13, "page_no": 0, "cluster": {"id": 13, "label": "page_footer", "bbox": {"l": 537.98541, "t": 727.980301, "r": 560.77539, "b": 740.290298, "coord_origin": "TOPLEFT"}, "confidence": 0.9368568658828735, "cells": [{"id": 97, "text": "7-45 ", "bbox": {"l": 537.98541, "t": 727.980301, "r": 560.77539, "b": 740.290298, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "7-45"}]}}]
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v1/code_and_formula.doctags.txt b/tests/data/groundtruth/docling_v1/code_and_formula.doctags.txt
index 1f1a0db7..8d6e9411 100644
--- a/tests/data/groundtruth/docling_v1/code_and_formula.doctags.txt
+++ b/tests/data/groundtruth/docling_v1/code_and_formula.doctags.txt
@@ -1,13 +1,15 @@
 <document>
-<subtitle-level-1><location><page_1><loc_22><loc_83><loc_45><loc_84></location>Java Code Example</subtitle-level-1>
+<subtitle-level-1><location><page_1><loc_22><loc_83><loc_52><loc_84></location>JavaScript Code Example</subtitle-level-1>
 <paragraph><location><page_1><loc_22><loc_63><loc_78><loc_81></location>Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet.</paragraph>
-<paragraph><location><page_1><loc_39><loc_61><loc_61><loc_62></location>Listing 1: Simple Java Program</paragraph>
-<paragraph><location><page_1><loc_22><loc_56><loc_55><loc_60></location>public static void print() { System.out.println( "Java Code" ); }</paragraph>
-<paragraph><location><page_1><loc_22><loc_37><loc_78><loc_55></location>Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet.</paragraph>
+<paragraph><location><page_1><loc_22><loc_57><loc_78><loc_63></location>Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore te feugait nulla facilisi. Lorem ipsum dolor sit amet,</paragraph>
+<paragraph><location><page_1><loc_22><loc_49><loc_43><loc_54></location>function add(a, b) { return a + b; } console.log(add(3, 5));</paragraph>
+<caption><location><page_1><loc_36><loc_55><loc_63><loc_56></location>Listing 1: Simple JavaScript Program</caption>
+<paragraph><location><page_1><loc_22><loc_29><loc_78><loc_47></location>Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet.</paragraph>
+<paragraph><location><page_1><loc_22><loc_23><loc_78><loc_29></location>Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore te feugait nulla facilisi. Lorem ipsum dolor sit amet,</paragraph>
 <subtitle-level-1><location><page_2><loc_22><loc_84><loc_32><loc_85></location>Formula</subtitle-level-1>
-<paragraph><location><page_2><loc_22><loc_65><loc_80><loc_82></location>Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet.</paragraph>
+<paragraph><location><page_2><loc_22><loc_66><loc_80><loc_82></location>Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet.</paragraph>
 <paragraph><location><page_2><loc_22><loc_58><loc_80><loc_65></location>Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore te feugait nulla facilisi. Lorem ipsum dolor sit amet, consectetuer adipiscing elit, sed diam nonummy nibh euismod tincidunt.</paragraph>
 <paragraph><location><page_2><loc_22><loc_38><loc_80><loc_55></location>Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet.</paragraph>
-<paragraph><location><page_2><loc_22><loc_29><loc_80><loc_38></location>Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore te feugait nulla facilisi. Lorem ipsum dolor sit amet, consectetuer adipiscing elit, sed diam nonummy nibh euismod tincidunt ut laoreet dolore magna aliquam erat volutpat.</paragraph>
+<paragraph><location><page_2><loc_22><loc_29><loc_80><loc_37></location>Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore te feugait nulla facilisi. Lorem ipsum dolor sit amet, consectetuer adipiscing elit, sed diam nonummy nibh euismod tincidunt ut laoreet dolore magna aliquam erat volutpat.</paragraph>
 <paragraph><location><page_2><loc_22><loc_21><loc_80><loc_29></location>Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore te feugait nulla facilisi. Lorem ipsum dolor sit amet, consectetuer adipiscing elit, sed diam nonummy nibh euismod tincidunt ut laoreet dolore magna aliquam erat volutpat.</paragraph>
 </document>
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v1/code_and_formula.json b/tests/data/groundtruth/docling_v1/code_and_formula.json
index 8b90e794..36f97962 100644
--- a/tests/data/groundtruth/docling_v1/code_and_formula.json
+++ b/tests/data/groundtruth/docling_v1/code_and_formula.json
@@ -1 +1 @@
-{"_name": "", "type": "pdf-document", "description": {"title": null, "abstract": null, "authors": null, "affiliations": null, "subjects": null, "keywords": null, "publication_date": null, "languages": null, "license": null, "publishers": null, "url_refs": null, "references": null, "publication": null, "reference_count": null, "citation_count": null, "citation_date": null, "advanced": null, "analytics": null, "logs": [], "collection": null, "acquisition": null}, "file-info": {"filename": "code_and_formula.pdf", "filename-prov": null, "document-hash": "71dd5c52aa241a6d5275d5f681023b6bb3dee3346e171075d1247c87d49e7a82", "#-pages": 2, "collection-name": null, "description": null, "page-hashes": [{"hash": "d3280840ba2dff9749506fce3f05166336b768d2096f6b332fcbfacbc0540edf", "model": "default", "page": 1}, {"hash": "e9aac72f810d71aeb3710b13689d8c55e6eeda390fb497f09e865f1e94f74f2b", "model": "default", "page": 2}]}, "main-text": [{"prov": [{"bbox": [133.76800537109375, 653.6340942382812, 273.4540100097656, 667.99462890625], "page": 1, "span": [0, 17], "__ref_s3_data": null}], "text": "Java Code Example", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [133.76800537109375, 501.4163513183594, 477.48065185546875, 642.8859252929688], "page": 1, "span": [0, 887], "__ref_s3_data": null}], "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [236.17599487304688, 480.4953308105469, 375.069580078125, 490.45794677734375], "page": 1, "span": [0, 30], "__ref_s3_data": null}], "text": "Listing 1: Simple Java Program", "type": "paragraph", "payload": null, "name": "paragraph", "font": null}, {"prov": [{"bbox": [134.23899841308594, 443.9358215332031, 337.5928649902344, 474.2005310058594], "page": 1, "span": [0, 65], "__ref_s3_data": null}], "text": "public static void print() { System.out.println( \"Java Code\" ); }", "type": "paragraph", "payload": null, "name": "Code", "font": null}, {"prov": [{"bbox": [133.76800537109375, 290.80633544921875, 477.47589111328125, 432.27593994140625], "page": 1, "span": [0, 887], "__ref_s3_data": null}], "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [303.13299560546875, 86.87435150146484, 308.1142883300781, 96.83694458007812], "page": 1, "span": [0, 1], "__ref_s3_data": null}], "text": "1", "type": "page-footer", "payload": null, "name": "Page-footer", "font": null}, {"prov": [{"bbox": [133.76800537109375, 703.5241088867188, 191.51429748535156, 717.8846435546875], "page": 2, "span": [0, 7], "__ref_s3_data": null}], "text": "Formula", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [133.76800537109375, 551.3063354492188, 477.48065185546875, 692.7759399414062], "page": 2, "span": [0, 887], "__ref_s3_data": null}], "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [133.76800537109375, 491.53033447265625, 477.4748229980469, 549.3139038085938], "page": 2, "span": [0, 369], "__ref_s3_data": null}], "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore te feugait nulla facilisi. Lorem ipsum dolor sit amet, consectetuer adipiscing elit, sed diam nonummy nibh euismod tincidunt.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [280.5539855957031, 467.6203308105469, 330.69659423828125, 479.4553527832031], "page": 2, "span": [0, 12], "__ref_s3_data": null}], "text": "a 2 + 8 = 12", "type": "equation", "payload": null, "name": "Formula", "font": null}, {"prov": [{"bbox": [133.76800537109375, 318.1803283691406, 477.47589111328125, 459.64996337890625], "page": 2, "span": [0, 887], "__ref_s3_data": null}], "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [133.76800537109375, 246.44935607910156, 477.4748229980469, 316.1879577636719], "page": 2, "span": [0, 415], "__ref_s3_data": null}], "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore te feugait nulla facilisi. Lorem ipsum dolor sit amet, consectetuer adipiscing elit, sed diam nonummy nibh euismod tincidunt ut laoreet dolore magna aliquam erat volutpat.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [133.76800537109375, 174.71835327148438, 477.4748229980469, 244.4569549560547], "page": 2, "span": [0, 415], "__ref_s3_data": null}], "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore te feugait nulla facilisi. Lorem ipsum dolor sit amet, consectetuer adipiscing elit, sed diam nonummy nibh euismod tincidunt ut laoreet dolore magna aliquam erat volutpat.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [303.13299560546875, 136.7633514404297, 308.1142883300781, 146.7259521484375], "page": 2, "span": [0, 1], "__ref_s3_data": null}], "text": "1", "type": "page-footer", "payload": null, "name": "Page-footer", "font": null}], "figures": [], "tables": [], "bitmaps": null, "equations": [], "footnotes": [], "page-dimensions": [{"height": 792.0, "page": 1, "width": 612.0}, {"height": 841.8900146484375, "page": 2, "width": 595.2760009765625}], "page-footers": [], "page-headers": [], "_s3_data": null, "identifiers": null}
\ No newline at end of file
+{"_name": "", "type": "pdf-document", "description": {"title": null, "abstract": null, "authors": null, "affiliations": null, "subjects": null, "keywords": null, "publication_date": null, "languages": null, "license": null, "publishers": null, "url_refs": null, "references": null, "publication": null, "reference_count": null, "citation_count": null, "citation_date": null, "advanced": null, "analytics": null, "logs": [], "collection": null, "acquisition": null}, "file-info": {"filename": "code_and_formula.pdf", "filename-prov": null, "document-hash": "821fdb0aa6d749c0adf24279b59d8030f6725a82e6566b5710c69c635d6a5e5f", "#-pages": 2, "collection-name": null, "description": null, "page-hashes": [{"hash": "321a2b1c88480306c4b1861c6db6764166f689017eb00dc38cfd50b526a68274", "model": "default", "page": 1}, {"hash": "6b116ec9598ebf64cc6de54e9ab2e896990e68d68a5e0fdf6b6bd314b29cdd5d", "model": "default", "page": 2}]}, "main-text": [{"prov": [{"bbox": [133.76801, 654.45184, 315.91595, 667.19122], "page": 1, "span": [0, 23], "__ref_s3_data": null}], "text": "JavaScript Code Example", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [133.76801, 501.97412, 477.48276, 642.32806], "page": 1, "span": [0, 887], "__ref_s3_data": null}], "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [133.76801, 454.15417, 477.47876, 498.86591], "page": 1, "span": [0, 298], "__ref_s3_data": null}], "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore te feugait nulla facilisi. Lorem ipsum dolor sit amet,", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [134.239, 385.25446, 263.22409, 425.6004899999999], "page": 1, "span": [0, 60], "__ref_s3_data": null}], "text": "function add(a, b) { return a + b; } console.log(add(3, 5));", "type": "paragraph", "payload": null, "name": "Code", "font": null}, {"prov": [{"bbox": [223.15500000000003, 433.23218, 388.09375, 442.07895], "page": 1, "span": [0, 36], "__ref_s3_data": null}], "text": "Listing 1: Simple JavaScript Program", "type": "caption", "payload": null, "name": "Caption", "font": null}, {"prov": [{"bbox": [133.76801, 232.58536000000004, 477.48172000000005, 372.93902999999995], "page": 1, "span": [0, 887], "__ref_s3_data": null}], "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [133.76801, 184.76436, 477.47876, 229.47713999999996], "page": 1, "span": [0, 298], "__ref_s3_data": null}], "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore te feugait nulla facilisi. Lorem ipsum dolor sit amet,", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [133.76801021944917, 704.341863888975, 191.5272403142044, 717.0812439593145], "page": 2, "span": [0, 7], "__ref_s3_data": null}], "text": "Formula", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [133.76801021944917, 551.8641430470798, 477.48276078332026, 692.2180838220343], "page": 2, "span": [0, 887], "__ref_s3_data": null}], "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [133.76801021944917, 492.0881027170305, 477.48163078331845, 548.7559230299179], "page": 2, "span": [0, 369], "__ref_s3_data": null}], "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore te feugait nulla facilisi. Lorem ipsum dolor sit amet, consectetuer adipiscing elit, sed diam nonummy nibh euismod tincidunt.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [280.5540204602546, 468.178102585013, 330.6965605425145, 479.06467264512247], "page": 2, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "equation", "payload": null, "name": "Formula", "font": null}, {"prov": [{"bbox": [133.76799021944913, 318.7382217598911, 477.4816907833186, 459.091862534844], "page": 2, "span": [0, 887], "__ref_s3_data": null}], "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [133.76799021944913, 247.0072913638337, 477.48370078332186, 315.6300017427293], "page": 2, "span": [0, 415], "__ref_s3_data": null}], "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore te feugait nulla facilisi. Lorem ipsum dolor sit amet, consectetuer adipiscing elit, sed diam nonummy nibh euismod tincidunt ut laoreet dolore magna aliquam erat volutpat.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [133.76799021944913, 175.27629096777594, 477.48370078332186, 243.8990813466719], "page": 2, "span": [0, 415], "__ref_s3_data": null}], "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore te feugait nulla facilisi. Lorem ipsum dolor sit amet, consectetuer adipiscing elit, sed diam nonummy nibh euismod tincidunt ut laoreet dolore magna aliquam erat volutpat.", "type": "paragraph", "payload": null, "name": "Text", "font": null}], "figures": [], "tables": [], "bitmaps": null, "equations": [], "footnotes": [], "page-dimensions": [{"height": 792.0, "page": 1, "width": 612.0}, {"height": 841.8900146484375, "page": 2, "width": 595.2760009765625}], "page-footers": [], "page-headers": [], "_s3_data": null, "identifiers": null}
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v1/code_and_formula.md b/tests/data/groundtruth/docling_v1/code_and_formula.md
index 4d77dc5c..9a5dcee5 100644
--- a/tests/data/groundtruth/docling_v1/code_and_formula.md
+++ b/tests/data/groundtruth/docling_v1/code_and_formula.md
@@ -1,13 +1,17 @@
-## Java Code Example
+## JavaScript Code Example
 
 Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet.
 
-Listing 1: Simple Java Program
+Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore te feugait nulla facilisi. Lorem ipsum dolor sit amet,
 
-public static void print() { System.out.println( "Java Code" ); }
+function add(a, b) { return a + b; } console.log(add(3, 5));
+
+Listing 1: Simple JavaScript Program
 
 Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet.
 
+Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore te feugait nulla facilisi. Lorem ipsum dolor sit amet,
+
 ## Formula
 
 Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet.
diff --git a/tests/data/groundtruth/docling_v1/code_and_formula.pages.json b/tests/data/groundtruth/docling_v1/code_and_formula.pages.json
index 27682fdd..a2e04507 100644
--- a/tests/data/groundtruth/docling_v1/code_and_formula.pages.json
+++ b/tests/data/groundtruth/docling_v1/code_and_formula.pages.json
@@ -1 +1 @@
-[{"page_no": 0, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "Java Code Example", "bbox": {"l": 133.76801, "t": 124.00536999999997, "r": 273.45401, "b": 138.36590999999999, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eir-", "bbox": {"l": 133.76801, "t": 149.11406999999997, "r": 477.47687, "b": 159.07665999999995, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "mod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam volup-", "bbox": {"l": 133.76801, "t": 161.06908999999996, "r": 477.47781000000003, "b": 171.03168000000005, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "tua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd", "bbox": {"l": 133.76801, "t": 173.02405, "r": 477.46985, "b": 182.98663, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ip-", "bbox": {"l": 133.76801, "t": 184.97906, "r": 477.47186, "b": 194.94164999999998, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "sum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor", "bbox": {"l": 133.76801, "t": 196.93408, "r": 477.46993999999995, "b": 206.89666999999997, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero", "bbox": {"l": 133.76801, "t": 208.88909999999998, "r": 477.4806500000001, "b": 218.85168, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "eos et accusam et justo duo dolores et ea rebum.", "bbox": {"l": 133.76801, "t": 220.84509000000003, "r": 355.20087, "b": 230.80768, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Stet clita kasd gubergren,", "bbox": {"l": 362.60107, "t": 220.84509000000003, "r": 477.47495000000004, "b": 230.80768, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor", "bbox": {"l": 133.76801, "t": 232.80005000000006, "r": 477.47083, "b": 242.76262999999994, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt", "bbox": {"l": 133.76801, "t": 244.75507000000005, "r": 477.47092, "b": 254.71765000000005, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et", "bbox": {"l": 133.76801, "t": 256.71007999999995, "r": 477.46588, "b": 266.67267000000004, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea", "bbox": {"l": 133.76801, "t": 268.66510000000005, "r": 477.47586, "b": 278.62769000000003, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "takimata sanctus est Lorem ipsum dolor sit amet.", "bbox": {"l": 133.76801, "t": 280.62103, "r": 351.47672, "b": 290.58365, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Listing 1: Simple Java Program", "bbox": {"l": 236.17598999999998, "t": 301.54204999999996, "r": 375.06958, "b": 311.50467, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "public static void", "bbox": {"l": 134.575, "t": 317.79947000000004, "r": 235.44695, "b": 326.14719, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "print() {", "bbox": {"l": 241.8759, "t": 317.79947000000004, "r": 292.24908, "b": 326.14719, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "System.out.println(", "bbox": {"l": 157.17101, "t": 328.75745, "r": 264.02368, "b": 337.10516000000007, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "\"Java Code\"", "bbox": {"l": 264.15811, "t": 328.75745, "r": 325.35376, "b": 337.10516000000007, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": ");", "bbox": {"l": 326.2952, "t": 328.75745, "r": 337.59286, "b": 337.10516000000007, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "}", "bbox": {"l": 134.239, "t": 339.71646, "r": 138.94637, "b": 348.06418, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy", "bbox": {"l": 148.71201, "t": 359.72406, "r": 477.46985, "b": 369.68667999999997, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam", "bbox": {"l": 133.76801, "t": 371.67905, "r": 477.4758, "b": 381.64166000000006, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita", "bbox": {"l": 133.76801, "t": 383.63403, "r": 477.4758, "b": 393.59665, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem", "bbox": {"l": 133.76801, "t": 395.58905, "r": 477.47284, "b": 405.55167, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod", "bbox": {"l": 133.76801, "t": 407.54404, "r": 477.47589, "b": 417.50665, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At", "bbox": {"l": 133.76801, "t": 419.50003000000004, "r": 477.47177000000005, "b": 429.46265, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren,", "bbox": {"l": 133.76801, "t": 431.45505, "r": 477.47387999999995, "b": 441.41766000000007, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor", "bbox": {"l": 133.76801, "t": 443.41003, "r": 477.47083, "b": 453.37265, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt", "bbox": {"l": 133.76801, "t": 455.36505, "r": 477.47092, "b": 465.32767, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et", "bbox": {"l": 133.76801, "t": 467.32004, "r": 477.46585, "b": 477.28265, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea", "bbox": {"l": 133.76801, "t": 479.27603, "r": 477.47586, "b": 489.23865, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "takimata sanctus est Lorem ipsum dolor sit amet.", "bbox": {"l": 133.76801, "t": 491.23105, "r": 351.47672, "b": 501.19366, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "1", "bbox": {"l": 303.133, "t": 695.163055, "r": 308.11429, "b": 705.125648, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 2, "label": "section_header", "bbox": {"l": 133.76801, "t": 124.00536999999997, "r": 273.45401, "b": 138.36590999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9581764936447144, "cells": [{"id": 0, "text": "Java Code Example", "bbox": {"l": 133.76801, "t": 124.00536999999997, "r": 273.45401, "b": 138.36590999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 133.76801, "t": 149.11406999999997, "r": 477.4806500000001, "b": 290.58365, "coord_origin": "TOPLEFT"}, "confidence": 0.9872456789016724, "cells": [{"id": 1, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eir-", "bbox": {"l": 133.76801, "t": 149.11406999999997, "r": 477.47687, "b": 159.07665999999995, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "mod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam volup-", "bbox": {"l": 133.76801, "t": 161.06908999999996, "r": 477.47781000000003, "b": 171.03168000000005, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "tua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd", "bbox": {"l": 133.76801, "t": 173.02405, "r": 477.46985, "b": 182.98663, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ip-", "bbox": {"l": 133.76801, "t": 184.97906, "r": 477.47186, "b": 194.94164999999998, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "sum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor", "bbox": {"l": 133.76801, "t": 196.93408, "r": 477.46993999999995, "b": 206.89666999999997, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero", "bbox": {"l": 133.76801, "t": 208.88909999999998, "r": 477.4806500000001, "b": 218.85168, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "eos et accusam et justo duo dolores et ea rebum.", "bbox": {"l": 133.76801, "t": 220.84509000000003, "r": 355.20087, "b": 230.80768, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Stet clita kasd gubergren,", "bbox": {"l": 362.60107, "t": 220.84509000000003, "r": 477.47495000000004, "b": 230.80768, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor", "bbox": {"l": 133.76801, "t": 232.80005000000006, "r": 477.47083, "b": 242.76262999999994, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt", "bbox": {"l": 133.76801, "t": 244.75507000000005, "r": 477.47092, "b": 254.71765000000005, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et", "bbox": {"l": 133.76801, "t": 256.71007999999995, "r": 477.46588, "b": 266.67267000000004, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea", "bbox": {"l": 133.76801, "t": 268.66510000000005, "r": 477.47586, "b": 278.62769000000003, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "takimata sanctus est Lorem ipsum dolor sit amet.", "bbox": {"l": 133.76801, "t": 280.62103, "r": 351.47672, "b": 290.58365, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "caption", "bbox": {"l": 236.17598999999998, "t": 301.54204999999996, "r": 375.06958, "b": 311.50467, "coord_origin": "TOPLEFT"}, "confidence": 0.5425266027450562, "cells": [{"id": 14, "text": "Listing 1: Simple Java Program", "bbox": {"l": 236.17598999999998, "t": 301.54204999999996, "r": 375.06958, "b": 311.50467, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "code", "bbox": {"l": 134.239, "t": 317.79947000000004, "r": 337.59286, "b": 348.06418, "coord_origin": "TOPLEFT"}, "confidence": 0.6383119821548462, "cells": [{"id": 15, "text": "public static void", "bbox": {"l": 134.575, "t": 317.79947000000004, "r": 235.44695, "b": 326.14719, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "print() {", "bbox": {"l": 241.8759, "t": 317.79947000000004, "r": 292.24908, "b": 326.14719, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "System.out.println(", "bbox": {"l": 157.17101, "t": 328.75745, "r": 264.02368, "b": 337.10516000000007, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "\"Java Code\"", "bbox": {"l": 264.15811, "t": 328.75745, "r": 325.35376, "b": 337.10516000000007, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": ");", "bbox": {"l": 326.2952, "t": 328.75745, "r": 337.59286, "b": 337.10516000000007, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "}", "bbox": {"l": 134.239, "t": 339.71646, "r": 138.94637, "b": 348.06418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 133.76801, "t": 359.72406, "r": 477.47589, "b": 501.19366, "coord_origin": "TOPLEFT"}, "confidence": 0.9869542717933655, "cells": [{"id": 21, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy", "bbox": {"l": 148.71201, "t": 359.72406, "r": 477.46985, "b": 369.68667999999997, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam", "bbox": {"l": 133.76801, "t": 371.67905, "r": 477.4758, "b": 381.64166000000006, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita", "bbox": {"l": 133.76801, "t": 383.63403, "r": 477.4758, "b": 393.59665, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem", "bbox": {"l": 133.76801, "t": 395.58905, "r": 477.47284, "b": 405.55167, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod", "bbox": {"l": 133.76801, "t": 407.54404, "r": 477.47589, "b": 417.50665, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At", "bbox": {"l": 133.76801, "t": 419.50003000000004, "r": 477.47177000000005, "b": 429.46265, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren,", "bbox": {"l": 133.76801, "t": 431.45505, "r": 477.47387999999995, "b": 441.41766000000007, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor", "bbox": {"l": 133.76801, "t": 443.41003, "r": 477.47083, "b": 453.37265, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt", "bbox": {"l": 133.76801, "t": 455.36505, "r": 477.47092, "b": 465.32767, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et", "bbox": {"l": 133.76801, "t": 467.32004, "r": 477.46585, "b": 477.28265, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea", "bbox": {"l": 133.76801, "t": 479.27603, "r": 477.47586, "b": 489.23865, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "takimata sanctus est Lorem ipsum dolor sit amet.", "bbox": {"l": 133.76801, "t": 491.23105, "r": 351.47672, "b": 501.19366, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "page_footer", "bbox": {"l": 303.133, "t": 695.163055, "r": 308.11429, "b": 705.125648, "coord_origin": "TOPLEFT"}, "confidence": 0.8374724984169006, "cells": [{"id": 33, "text": "1", "bbox": {"l": 303.133, "t": 695.163055, "r": 308.11429, "b": 705.125648, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "section_header", "id": 2, "page_no": 0, "cluster": {"id": 2, "label": "section_header", "bbox": {"l": 133.76801, "t": 124.00536999999997, "r": 273.45401, "b": 138.36590999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9581764936447144, "cells": [{"id": 0, "text": "Java Code Example", "bbox": {"l": 133.76801, "t": 124.00536999999997, "r": 273.45401, "b": 138.36590999999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Java Code Example"}, {"label": "text", "id": 0, "page_no": 0, "cluster": {"id": 0, "label": "text", "bbox": {"l": 133.76801, "t": 149.11406999999997, "r": 477.4806500000001, "b": 290.58365, "coord_origin": "TOPLEFT"}, "confidence": 0.9872456789016724, "cells": [{"id": 1, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eir-", "bbox": {"l": 133.76801, "t": 149.11406999999997, "r": 477.47687, "b": 159.07665999999995, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "mod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam volup-", "bbox": {"l": 133.76801, "t": 161.06908999999996, "r": 477.47781000000003, "b": 171.03168000000005, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "tua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd", "bbox": {"l": 133.76801, "t": 173.02405, "r": 477.46985, "b": 182.98663, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ip-", "bbox": {"l": 133.76801, "t": 184.97906, "r": 477.47186, "b": 194.94164999999998, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "sum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor", "bbox": {"l": 133.76801, "t": 196.93408, "r": 477.46993999999995, "b": 206.89666999999997, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero", "bbox": {"l": 133.76801, "t": 208.88909999999998, "r": 477.4806500000001, "b": 218.85168, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "eos et accusam et justo duo dolores et ea rebum.", "bbox": {"l": 133.76801, "t": 220.84509000000003, "r": 355.20087, "b": 230.80768, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Stet clita kasd gubergren,", "bbox": {"l": 362.60107, "t": 220.84509000000003, "r": 477.47495000000004, "b": 230.80768, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor", "bbox": {"l": 133.76801, "t": 232.80005000000006, "r": 477.47083, "b": 242.76262999999994, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt", "bbox": {"l": 133.76801, "t": 244.75507000000005, "r": 477.47092, "b": 254.71765000000005, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et", "bbox": {"l": 133.76801, "t": 256.71007999999995, "r": 477.46588, "b": 266.67267000000004, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea", "bbox": {"l": 133.76801, "t": 268.66510000000005, "r": 477.47586, "b": 278.62769000000003, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "takimata sanctus est Lorem ipsum dolor sit amet.", "bbox": {"l": 133.76801, "t": 280.62103, "r": 351.47672, "b": 290.58365, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet."}, {"label": "caption", "id": 5, "page_no": 0, "cluster": {"id": 5, "label": "caption", "bbox": {"l": 236.17598999999998, "t": 301.54204999999996, "r": 375.06958, "b": 311.50467, "coord_origin": "TOPLEFT"}, "confidence": 0.5425266027450562, "cells": [{"id": 14, "text": "Listing 1: Simple Java Program", "bbox": {"l": 236.17598999999998, "t": 301.54204999999996, "r": 375.06958, "b": 311.50467, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Listing 1: Simple Java Program"}, {"label": "code", "id": 4, "page_no": 0, "cluster": {"id": 4, "label": "code", "bbox": {"l": 134.239, "t": 317.79947000000004, "r": 337.59286, "b": 348.06418, "coord_origin": "TOPLEFT"}, "confidence": 0.6383119821548462, "cells": [{"id": 15, "text": "public static void", "bbox": {"l": 134.575, "t": 317.79947000000004, "r": 235.44695, "b": 326.14719, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "print() {", "bbox": {"l": 241.8759, "t": 317.79947000000004, "r": 292.24908, "b": 326.14719, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "System.out.println(", "bbox": {"l": 157.17101, "t": 328.75745, "r": 264.02368, "b": 337.10516000000007, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "\"Java Code\"", "bbox": {"l": 264.15811, "t": 328.75745, "r": 325.35376, "b": 337.10516000000007, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": ");", "bbox": {"l": 326.2952, "t": 328.75745, "r": 337.59286, "b": 337.10516000000007, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "}", "bbox": {"l": 134.239, "t": 339.71646, "r": 138.94637, "b": 348.06418, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "public static void print() { System.out.println( \"Java Code\" ); }"}, {"label": "text", "id": 1, "page_no": 0, "cluster": {"id": 1, "label": "text", "bbox": {"l": 133.76801, "t": 359.72406, "r": 477.47589, "b": 501.19366, "coord_origin": "TOPLEFT"}, "confidence": 0.9869542717933655, "cells": [{"id": 21, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy", "bbox": {"l": 148.71201, "t": 359.72406, "r": 477.46985, "b": 369.68667999999997, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam", "bbox": {"l": 133.76801, "t": 371.67905, "r": 477.4758, "b": 381.64166000000006, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita", "bbox": {"l": 133.76801, "t": 383.63403, "r": 477.4758, "b": 393.59665, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem", "bbox": {"l": 133.76801, "t": 395.58905, "r": 477.47284, "b": 405.55167, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod", "bbox": {"l": 133.76801, "t": 407.54404, "r": 477.47589, "b": 417.50665, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At", "bbox": {"l": 133.76801, "t": 419.50003000000004, "r": 477.47177000000005, "b": 429.46265, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren,", "bbox": {"l": 133.76801, "t": 431.45505, "r": 477.47387999999995, "b": 441.41766000000007, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor", "bbox": {"l": 133.76801, "t": 443.41003, "r": 477.47083, "b": 453.37265, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt", "bbox": {"l": 133.76801, "t": 455.36505, "r": 477.47092, "b": 465.32767, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et", "bbox": {"l": 133.76801, "t": 467.32004, "r": 477.46585, "b": 477.28265, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea", "bbox": {"l": 133.76801, "t": 479.27603, "r": 477.47586, "b": 489.23865, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "takimata sanctus est Lorem ipsum dolor sit amet.", "bbox": {"l": 133.76801, "t": 491.23105, "r": 351.47672, "b": 501.19366, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet."}, {"label": "page_footer", "id": 3, "page_no": 0, "cluster": {"id": 3, "label": "page_footer", "bbox": {"l": 303.133, "t": 695.163055, "r": 308.11429, "b": 705.125648, "coord_origin": "TOPLEFT"}, "confidence": 0.8374724984169006, "cells": [{"id": 33, "text": "1", "bbox": {"l": 303.133, "t": 695.163055, "r": 308.11429, "b": 705.125648, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1"}], "body": [{"label": "section_header", "id": 2, "page_no": 0, "cluster": {"id": 2, "label": "section_header", "bbox": {"l": 133.76801, "t": 124.00536999999997, "r": 273.45401, "b": 138.36590999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9581764936447144, "cells": [{"id": 0, "text": "Java Code Example", "bbox": {"l": 133.76801, "t": 124.00536999999997, "r": 273.45401, "b": 138.36590999999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Java Code Example"}, {"label": "text", "id": 0, "page_no": 0, "cluster": {"id": 0, "label": "text", "bbox": {"l": 133.76801, "t": 149.11406999999997, "r": 477.4806500000001, "b": 290.58365, "coord_origin": "TOPLEFT"}, "confidence": 0.9872456789016724, "cells": [{"id": 1, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eir-", "bbox": {"l": 133.76801, "t": 149.11406999999997, "r": 477.47687, "b": 159.07665999999995, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "mod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam volup-", "bbox": {"l": 133.76801, "t": 161.06908999999996, "r": 477.47781000000003, "b": 171.03168000000005, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "tua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd", "bbox": {"l": 133.76801, "t": 173.02405, "r": 477.46985, "b": 182.98663, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ip-", "bbox": {"l": 133.76801, "t": 184.97906, "r": 477.47186, "b": 194.94164999999998, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "sum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor", "bbox": {"l": 133.76801, "t": 196.93408, "r": 477.46993999999995, "b": 206.89666999999997, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero", "bbox": {"l": 133.76801, "t": 208.88909999999998, "r": 477.4806500000001, "b": 218.85168, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "eos et accusam et justo duo dolores et ea rebum.", "bbox": {"l": 133.76801, "t": 220.84509000000003, "r": 355.20087, "b": 230.80768, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Stet clita kasd gubergren,", "bbox": {"l": 362.60107, "t": 220.84509000000003, "r": 477.47495000000004, "b": 230.80768, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor", "bbox": {"l": 133.76801, "t": 232.80005000000006, "r": 477.47083, "b": 242.76262999999994, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt", "bbox": {"l": 133.76801, "t": 244.75507000000005, "r": 477.47092, "b": 254.71765000000005, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et", "bbox": {"l": 133.76801, "t": 256.71007999999995, "r": 477.46588, "b": 266.67267000000004, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea", "bbox": {"l": 133.76801, "t": 268.66510000000005, "r": 477.47586, "b": 278.62769000000003, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "takimata sanctus est Lorem ipsum dolor sit amet.", "bbox": {"l": 133.76801, "t": 280.62103, "r": 351.47672, "b": 290.58365, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet."}, {"label": "caption", "id": 5, "page_no": 0, "cluster": {"id": 5, "label": "caption", "bbox": {"l": 236.17598999999998, "t": 301.54204999999996, "r": 375.06958, "b": 311.50467, "coord_origin": "TOPLEFT"}, "confidence": 0.5425266027450562, "cells": [{"id": 14, "text": "Listing 1: Simple Java Program", "bbox": {"l": 236.17598999999998, "t": 301.54204999999996, "r": 375.06958, "b": 311.50467, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Listing 1: Simple Java Program"}, {"label": "code", "id": 4, "page_no": 0, "cluster": {"id": 4, "label": "code", "bbox": {"l": 134.239, "t": 317.79947000000004, "r": 337.59286, "b": 348.06418, "coord_origin": "TOPLEFT"}, "confidence": 0.6383119821548462, "cells": [{"id": 15, "text": "public static void", "bbox": {"l": 134.575, "t": 317.79947000000004, "r": 235.44695, "b": 326.14719, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "print() {", "bbox": {"l": 241.8759, "t": 317.79947000000004, "r": 292.24908, "b": 326.14719, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "System.out.println(", "bbox": {"l": 157.17101, "t": 328.75745, "r": 264.02368, "b": 337.10516000000007, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "\"Java Code\"", "bbox": {"l": 264.15811, "t": 328.75745, "r": 325.35376, "b": 337.10516000000007, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": ");", "bbox": {"l": 326.2952, "t": 328.75745, "r": 337.59286, "b": 337.10516000000007, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "}", "bbox": {"l": 134.239, "t": 339.71646, "r": 138.94637, "b": 348.06418, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "public static void print() { System.out.println( \"Java Code\" ); }"}, {"label": "text", "id": 1, "page_no": 0, "cluster": {"id": 1, "label": "text", "bbox": {"l": 133.76801, "t": 359.72406, "r": 477.47589, "b": 501.19366, "coord_origin": "TOPLEFT"}, "confidence": 0.9869542717933655, "cells": [{"id": 21, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy", "bbox": {"l": 148.71201, "t": 359.72406, "r": 477.46985, "b": 369.68667999999997, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam", "bbox": {"l": 133.76801, "t": 371.67905, "r": 477.4758, "b": 381.64166000000006, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita", "bbox": {"l": 133.76801, "t": 383.63403, "r": 477.4758, "b": 393.59665, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem", "bbox": {"l": 133.76801, "t": 395.58905, "r": 477.47284, "b": 405.55167, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod", "bbox": {"l": 133.76801, "t": 407.54404, "r": 477.47589, "b": 417.50665, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At", "bbox": {"l": 133.76801, "t": 419.50003000000004, "r": 477.47177000000005, "b": 429.46265, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren,", "bbox": {"l": 133.76801, "t": 431.45505, "r": 477.47387999999995, "b": 441.41766000000007, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor", "bbox": {"l": 133.76801, "t": 443.41003, "r": 477.47083, "b": 453.37265, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt", "bbox": {"l": 133.76801, "t": 455.36505, "r": 477.47092, "b": 465.32767, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et", "bbox": {"l": 133.76801, "t": 467.32004, "r": 477.46585, "b": 477.28265, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea", "bbox": {"l": 133.76801, "t": 479.27603, "r": 477.47586, "b": 489.23865, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "takimata sanctus est Lorem ipsum dolor sit amet.", "bbox": {"l": 133.76801, "t": 491.23105, "r": 351.47672, "b": 501.19366, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet."}], "headers": [{"label": "page_footer", "id": 3, "page_no": 0, "cluster": {"id": 3, "label": "page_footer", "bbox": {"l": 303.133, "t": 695.163055, "r": 308.11429, "b": 705.125648, "coord_origin": "TOPLEFT"}, "confidence": 0.8374724984169006, "cells": [{"id": 33, "text": "1", "bbox": {"l": 303.133, "t": 695.163055, "r": 308.11429, "b": 705.125648, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1"}]}}, {"page_no": 1, "size": {"width": 595.2760009765625, "height": 841.8900146484375}, "cells": [{"id": 0, "text": "Formula", "bbox": {"l": 133.76801021944917, "t": 124.00537068468714, "r": 191.51430031418315, "b": 138.36590076397772, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eir-", "bbox": {"l": 133.76801021944917, "t": 149.114070823323, "r": 477.47687078331063, "b": 159.0766608783307, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "mod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam volup-", "bbox": {"l": 133.76801021944917, "t": 161.06909088933185, "r": 477.4778107833122, "b": 171.03167094433945, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "tua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd", "bbox": {"l": 133.76801021944917, "t": 173.0241009553406, "r": 477.46985078329914, "b": 182.9866910103483, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ip-", "bbox": {"l": 133.76801021944917, "t": 184.97906102134914, "r": 477.4718607833024, "b": 194.94165107635683, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "sum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor", "bbox": {"l": 133.76801021944917, "t": 196.93511108736357, "r": 477.4699407832993, "b": 206.89770114237137, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero", "bbox": {"l": 133.76801021944917, "t": 208.890071153372, "r": 477.4806507833169, "b": 218.8526612083799, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "eos et accusam et justo duo dolores et ea rebum.", "bbox": {"l": 133.76801021944917, "t": 220.84509121938083, "r": 355.20087058271434, "b": 230.80767127438855, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Stet clita kasd gubergren,", "bbox": {"l": 362.6010705948545, "t": 220.84509121938083, "r": 477.4749507833075, "b": 230.80767127438855, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor", "bbox": {"l": 133.76801021944917, "t": 232.8001112853898, "r": 477.4708307833007, "b": 242.76269134039728, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt", "bbox": {"l": 133.76801021944917, "t": 244.75506135139813, "r": 477.4709207833008, "b": 254.71765140640582, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et", "bbox": {"l": 133.76801021944917, "t": 256.71008141740685, "r": 477.4658807832926, "b": 266.6726614724146, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea", "bbox": {"l": 133.76801021944917, "t": 268.6660714834211, "r": 477.47586078330903, "b": 278.6286615384289, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "takimata sanctus est Lorem ipsum dolor sit amet.", "bbox": {"l": 133.76801021944917, "t": 280.62109154942993, "r": 351.4767205766048, "b": 290.58367160443765, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie", "bbox": {"l": 148.71201024396512, "t": 292.5761116154388, "r": 477.4710707833011, "b": 302.5386916704465, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et", "bbox": {"l": 133.76801021944917, "t": 304.5310616814471, "r": 477.47293078330415, "b": 314.4936517364549, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore", "bbox": {"l": 133.76801021944917, "t": 316.48608174745607, "r": 477.47482078330734, "b": 326.4486618024637, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "te feugait nulla facilisi. Lorem ipsum dolor sit amet, consectetuer adipiscing elit,", "bbox": {"l": 133.76801021944917, "t": 328.4411018134648, "r": 477.472810783304, "b": 338.40368186847246, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "sed diam nonummy nibh euismod tincidunt.", "bbox": {"l": 133.76801021944917, "t": 340.3970618794788, "r": 326.20752053515014, "b": 350.3596819344868, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "a", "bbox": {"l": 280.5539904602546, "t": 364.3070620114962, "r": 285.8142404688841, "b": 374.2696820665041, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "2", "bbox": {"l": 285.8200104688936, "t": 362.4346620011579, "r": 289.78809047540335, "b": 369.40844203966316, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "+ 8 = 12", "bbox": {"l": 292.50400047985886, "t": 364.3070620114962, "r": 330.6965905425146, "b": 374.2696820665041, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy", "bbox": {"l": 148.71201024396512, "t": 382.24005211051195, "r": 477.4698807832991, "b": 392.2026621655199, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam", "bbox": {"l": 133.76801021944917, "t": 394.19506217652076, "r": 477.47580078330884, "b": 404.15768223152867, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita", "bbox": {"l": 133.76801021944917, "t": 406.15005224252945, "r": 477.47580078330884, "b": 416.1126722975373, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem", "bbox": {"l": 133.76801021944917, "t": 418.10507230853824, "r": 477.47284078330404, "b": 428.06768236354606, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod", "bbox": {"l": 133.76801021944917, "t": 430.0600523745468, "r": 477.47589078330907, "b": 440.0226724295547, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At", "bbox": {"l": 133.76801021944917, "t": 442.01605244056105, "r": 477.4717707833023, "b": 451.97866249556887, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren,", "bbox": {"l": 133.76801021944917, "t": 453.9710625065698, "r": 477.47388078330573, "b": 463.93368256157777, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor", "bbox": {"l": 133.76801021944917, "t": 465.9260525725785, "r": 477.4708307833007, "b": 475.88867262758635, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt", "bbox": {"l": 133.76801021944917, "t": 477.8810726385873, "r": 477.4709207833008, "b": 487.84368269359516, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et", "bbox": {"l": 133.76801021944917, "t": 489.8360527045959, "r": 477.4658807832926, "b": 499.7986727596038, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea", "bbox": {"l": 133.76801021944917, "t": 501.7910427706045, "r": 477.47586078330903, "b": 511.7536628256125, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "takimata sanctus est Lorem ipsum dolor sit amet.", "bbox": {"l": 133.76801021944917, "t": 513.7470728366188, "r": 351.4767205766048, "b": 523.7096828916267, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie", "bbox": {"l": 148.71201024396512, "t": 525.7020529026275, "r": 477.4710707833011, "b": 535.6646729576354, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et", "bbox": {"l": 133.76801021944917, "t": 537.6570729686364, "r": 477.47293078330415, "b": 547.6196930236442, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore", "bbox": {"l": 133.76801021944917, "t": 549.612063034645, "r": 477.47482078330734, "b": 559.5746730896528, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "te feugait nulla facilisi. Lorem ipsum dolor sit amet, consectetuer adipiscing elit,", "bbox": {"l": 133.76801021944917, "t": 561.5670431006536, "r": 477.472810783304, "b": 571.5296631556615, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "sed diam nonummy nibh euismod tincidunt ut laoreet dolore magna aliquam erat", "bbox": {"l": 133.76801021944917, "t": 573.5220631666624, "r": 477.47479078330724, "b": 583.4846832216704, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "volutpat.", "bbox": {"l": 133.76801021944917, "t": 585.4780532326765, "r": 173.0565202839028, "b": 595.4406532876844, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie", "bbox": {"l": 148.71201024396512, "t": 597.4330632986853, "r": 477.4710707833011, "b": 607.3956633536932, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et", "bbox": {"l": 133.76801021944917, "t": 609.3880633646941, "r": 477.47293078330415, "b": 619.3506634197018, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore", "bbox": {"l": 133.76801021944917, "t": 621.3430634307027, "r": 477.47482078330734, "b": 631.3056634857105, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "te feugait nulla facilisi. Lorem ipsum dolor sit amet, consectetuer adipiscing elit,", "bbox": {"l": 133.76801021944917, "t": 633.2980634967114, "r": 477.472810783304, "b": 643.2606635517193, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "sed diam nonummy nibh euismod tincidunt ut laoreet dolore magna aliquam erat", "bbox": {"l": 133.76801021944917, "t": 645.2540535627256, "r": 477.47479078330724, "b": 655.2166536177334, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "volutpat.", "bbox": {"l": 133.76801021944917, "t": 657.2090636287344, "r": 173.0565202839028, "b": 667.1716636837423, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "1", "bbox": {"l": 303.13300049729594, "t": 695.1640638383003, "r": 308.1142905054678, "b": 705.1266638933081, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 5, "label": "section_header", "bbox": {"l": 133.76801021944917, "t": 124.00537068468714, "r": 191.51430031418315, "b": 138.36590076397772, "coord_origin": "TOPLEFT"}, "confidence": 0.95060133934021, "cells": [{"id": 0, "text": "Formula", "bbox": {"l": 133.76801021944917, "t": 124.00537068468714, "r": 191.51430031418315, "b": 138.36590076397772, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 133.76801021944917, "t": 149.114070823323, "r": 477.4806507833169, "b": 290.58367160443765, "coord_origin": "TOPLEFT"}, "confidence": 0.9878177046775818, "cells": [{"id": 1, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eir-", "bbox": {"l": 133.76801021944917, "t": 149.114070823323, "r": 477.47687078331063, "b": 159.0766608783307, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "mod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam volup-", "bbox": {"l": 133.76801021944917, "t": 161.06909088933185, "r": 477.4778107833122, "b": 171.03167094433945, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "tua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd", "bbox": {"l": 133.76801021944917, "t": 173.0241009553406, "r": 477.46985078329914, "b": 182.9866910103483, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ip-", "bbox": {"l": 133.76801021944917, "t": 184.97906102134914, "r": 477.4718607833024, "b": 194.94165107635683, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "sum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor", "bbox": {"l": 133.76801021944917, "t": 196.93511108736357, "r": 477.4699407832993, "b": 206.89770114237137, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero", "bbox": {"l": 133.76801021944917, "t": 208.890071153372, "r": 477.4806507833169, "b": 218.8526612083799, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "eos et accusam et justo duo dolores et ea rebum.", "bbox": {"l": 133.76801021944917, "t": 220.84509121938083, "r": 355.20087058271434, "b": 230.80767127438855, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Stet clita kasd gubergren,", "bbox": {"l": 362.6010705948545, "t": 220.84509121938083, "r": 477.4749507833075, "b": 230.80767127438855, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor", "bbox": {"l": 133.76801021944917, "t": 232.8001112853898, "r": 477.4708307833007, "b": 242.76269134039728, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt", "bbox": {"l": 133.76801021944917, "t": 244.75506135139813, "r": 477.4709207833008, "b": 254.71765140640582, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et", "bbox": {"l": 133.76801021944917, "t": 256.71008141740685, "r": 477.4658807832926, "b": 266.6726614724146, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea", "bbox": {"l": 133.76801021944917, "t": 268.6660714834211, "r": 477.47586078330903, "b": 278.6286615384289, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "takimata sanctus est Lorem ipsum dolor sit amet.", "bbox": {"l": 133.76801021944917, "t": 280.62109154942993, "r": 351.4767205766048, "b": 290.58367160443765, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 133.76801021944917, "t": 292.5761116154388, "r": 477.47482078330734, "b": 350.3596819344868, "coord_origin": "TOPLEFT"}, "confidence": 0.9855858683586121, "cells": [{"id": 14, "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie", "bbox": {"l": 148.71201024396512, "t": 292.5761116154388, "r": 477.4710707833011, "b": 302.5386916704465, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et", "bbox": {"l": 133.76801021944917, "t": 304.5310616814471, "r": 477.47293078330415, "b": 314.4936517364549, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore", "bbox": {"l": 133.76801021944917, "t": 316.48608174745607, "r": 477.47482078330734, "b": 326.4486618024637, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "te feugait nulla facilisi. Lorem ipsum dolor sit amet, consectetuer adipiscing elit,", "bbox": {"l": 133.76801021944917, "t": 328.4411018134648, "r": 477.472810783304, "b": 338.40368186847246, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "sed diam nonummy nibh euismod tincidunt.", "bbox": {"l": 133.76801021944917, "t": 340.3970618794788, "r": 326.20752053515014, "b": 350.3596819344868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "formula", "bbox": {"l": 280.5539904602546, "t": 362.4346620011579, "r": 330.6965905425146, "b": 374.2696820665041, "coord_origin": "TOPLEFT"}, "confidence": 0.8711639046669006, "cells": [{"id": 19, "text": "a", "bbox": {"l": 280.5539904602546, "t": 364.3070620114962, "r": 285.8142404688841, "b": 374.2696820665041, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "2", "bbox": {"l": 285.8200104688936, "t": 362.4346620011579, "r": 289.78809047540335, "b": 369.40844203966316, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "+ 8 = 12", "bbox": {"l": 292.50400047985886, "t": 364.3070620114962, "r": 330.6965905425146, "b": 374.2696820665041, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 133.76801021944917, "t": 382.24005211051195, "r": 477.47589078330907, "b": 523.7096828916267, "coord_origin": "TOPLEFT"}, "confidence": 0.9880034923553467, "cells": [{"id": 22, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy", "bbox": {"l": 148.71201024396512, "t": 382.24005211051195, "r": 477.4698807832991, "b": 392.2026621655199, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam", "bbox": {"l": 133.76801021944917, "t": 394.19506217652076, "r": 477.47580078330884, "b": 404.15768223152867, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita", "bbox": {"l": 133.76801021944917, "t": 406.15005224252945, "r": 477.47580078330884, "b": 416.1126722975373, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem", "bbox": {"l": 133.76801021944917, "t": 418.10507230853824, "r": 477.47284078330404, "b": 428.06768236354606, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod", "bbox": {"l": 133.76801021944917, "t": 430.0600523745468, "r": 477.47589078330907, "b": 440.0226724295547, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At", "bbox": {"l": 133.76801021944917, "t": 442.01605244056105, "r": 477.4717707833023, "b": 451.97866249556887, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren,", "bbox": {"l": 133.76801021944917, "t": 453.9710625065698, "r": 477.47388078330573, "b": 463.93368256157777, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor", "bbox": {"l": 133.76801021944917, "t": 465.9260525725785, "r": 477.4708307833007, "b": 475.88867262758635, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt", "bbox": {"l": 133.76801021944917, "t": 477.8810726385873, "r": 477.4709207833008, "b": 487.84368269359516, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et", "bbox": {"l": 133.76801021944917, "t": 489.8360527045959, "r": 477.4658807832926, "b": 499.7986727596038, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea", "bbox": {"l": 133.76801021944917, "t": 501.7910427706045, "r": 477.47586078330903, "b": 511.7536628256125, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "takimata sanctus est Lorem ipsum dolor sit amet.", "bbox": {"l": 133.76801021944917, "t": 513.7470728366188, "r": 351.4767205766048, "b": 523.7096828916267, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "text", "bbox": {"l": 133.76801021944917, "t": 525.7020529026275, "r": 477.47482078330734, "b": 595.4406532876844, "coord_origin": "TOPLEFT"}, "confidence": 0.9844803214073181, "cells": [{"id": 34, "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie", "bbox": {"l": 148.71201024396512, "t": 525.7020529026275, "r": 477.4710707833011, "b": 535.6646729576354, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et", "bbox": {"l": 133.76801021944917, "t": 537.6570729686364, "r": 477.47293078330415, "b": 547.6196930236442, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore", "bbox": {"l": 133.76801021944917, "t": 549.612063034645, "r": 477.47482078330734, "b": 559.5746730896528, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "te feugait nulla facilisi. Lorem ipsum dolor sit amet, consectetuer adipiscing elit,", "bbox": {"l": 133.76801021944917, "t": 561.5670431006536, "r": 477.472810783304, "b": 571.5296631556615, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "sed diam nonummy nibh euismod tincidunt ut laoreet dolore magna aliquam erat", "bbox": {"l": 133.76801021944917, "t": 573.5220631666624, "r": 477.47479078330724, "b": 583.4846832216704, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "volutpat.", "bbox": {"l": 133.76801021944917, "t": 585.4780532326765, "r": 173.0565202839028, "b": 595.4406532876844, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 133.76801021944917, "t": 597.4330632986853, "r": 477.47482078330734, "b": 667.1716636837423, "coord_origin": "TOPLEFT"}, "confidence": 0.9872003793716431, "cells": [{"id": 40, "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie", "bbox": {"l": 148.71201024396512, "t": 597.4330632986853, "r": 477.4710707833011, "b": 607.3956633536932, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et", "bbox": {"l": 133.76801021944917, "t": 609.3880633646941, "r": 477.47293078330415, "b": 619.3506634197018, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore", "bbox": {"l": 133.76801021944917, "t": 621.3430634307027, "r": 477.47482078330734, "b": 631.3056634857105, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "te feugait nulla facilisi. Lorem ipsum dolor sit amet, consectetuer adipiscing elit,", "bbox": {"l": 133.76801021944917, "t": 633.2980634967114, "r": 477.472810783304, "b": 643.2606635517193, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "sed diam nonummy nibh euismod tincidunt ut laoreet dolore magna aliquam erat", "bbox": {"l": 133.76801021944917, "t": 645.2540535627256, "r": 477.47479078330724, "b": 655.2166536177334, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "volutpat.", "bbox": {"l": 133.76801021944917, "t": 657.2090636287344, "r": 173.0565202839028, "b": 667.1716636837423, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "page_footer", "bbox": {"l": 303.13300049729594, "t": 695.1640638383003, "r": 308.1142905054678, "b": 705.1266638933081, "coord_origin": "TOPLEFT"}, "confidence": 0.850279688835144, "cells": [{"id": 46, "text": "1", "bbox": {"l": 303.13300049729594, "t": 695.1640638383003, "r": 308.1142905054678, "b": 705.1266638933081, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "section_header", "id": 5, "page_no": 1, "cluster": {"id": 5, "label": "section_header", "bbox": {"l": 133.76801021944917, "t": 124.00537068468714, "r": 191.51430031418315, "b": 138.36590076397772, "coord_origin": "TOPLEFT"}, "confidence": 0.95060133934021, "cells": [{"id": 0, "text": "Formula", "bbox": {"l": 133.76801021944917, "t": 124.00537068468714, "r": 191.51430031418315, "b": 138.36590076397772, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Formula"}, {"label": "text", "id": 1, "page_no": 1, "cluster": {"id": 1, "label": "text", "bbox": {"l": 133.76801021944917, "t": 149.114070823323, "r": 477.4806507833169, "b": 290.58367160443765, "coord_origin": "TOPLEFT"}, "confidence": 0.9878177046775818, "cells": [{"id": 1, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eir-", "bbox": {"l": 133.76801021944917, "t": 149.114070823323, "r": 477.47687078331063, "b": 159.0766608783307, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "mod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam volup-", "bbox": {"l": 133.76801021944917, "t": 161.06909088933185, "r": 477.4778107833122, "b": 171.03167094433945, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "tua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd", "bbox": {"l": 133.76801021944917, "t": 173.0241009553406, "r": 477.46985078329914, "b": 182.9866910103483, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ip-", "bbox": {"l": 133.76801021944917, "t": 184.97906102134914, "r": 477.4718607833024, "b": 194.94165107635683, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "sum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor", "bbox": {"l": 133.76801021944917, "t": 196.93511108736357, "r": 477.4699407832993, "b": 206.89770114237137, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero", "bbox": {"l": 133.76801021944917, "t": 208.890071153372, "r": 477.4806507833169, "b": 218.8526612083799, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "eos et accusam et justo duo dolores et ea rebum.", "bbox": {"l": 133.76801021944917, "t": 220.84509121938083, "r": 355.20087058271434, "b": 230.80767127438855, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Stet clita kasd gubergren,", "bbox": {"l": 362.6010705948545, "t": 220.84509121938083, "r": 477.4749507833075, "b": 230.80767127438855, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor", "bbox": {"l": 133.76801021944917, "t": 232.8001112853898, "r": 477.4708307833007, "b": 242.76269134039728, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt", "bbox": {"l": 133.76801021944917, "t": 244.75506135139813, "r": 477.4709207833008, "b": 254.71765140640582, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et", "bbox": {"l": 133.76801021944917, "t": 256.71008141740685, "r": 477.4658807832926, "b": 266.6726614724146, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea", "bbox": {"l": 133.76801021944917, "t": 268.6660714834211, "r": 477.47586078330903, "b": 278.6286615384289, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "takimata sanctus est Lorem ipsum dolor sit amet.", "bbox": {"l": 133.76801021944917, "t": 280.62109154942993, "r": 351.4767205766048, "b": 290.58367160443765, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet."}, {"label": "text", "id": 3, "page_no": 1, "cluster": {"id": 3, "label": "text", "bbox": {"l": 133.76801021944917, "t": 292.5761116154388, "r": 477.47482078330734, "b": 350.3596819344868, "coord_origin": "TOPLEFT"}, "confidence": 0.9855858683586121, "cells": [{"id": 14, "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie", "bbox": {"l": 148.71201024396512, "t": 292.5761116154388, "r": 477.4710707833011, "b": 302.5386916704465, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et", "bbox": {"l": 133.76801021944917, "t": 304.5310616814471, "r": 477.47293078330415, "b": 314.4936517364549, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore", "bbox": {"l": 133.76801021944917, "t": 316.48608174745607, "r": 477.47482078330734, "b": 326.4486618024637, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "te feugait nulla facilisi. Lorem ipsum dolor sit amet, consectetuer adipiscing elit,", "bbox": {"l": 133.76801021944917, "t": 328.4411018134648, "r": 477.472810783304, "b": 338.40368186847246, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "sed diam nonummy nibh euismod tincidunt.", "bbox": {"l": 133.76801021944917, "t": 340.3970618794788, "r": 326.20752053515014, "b": 350.3596819344868, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore te feugait nulla facilisi. Lorem ipsum dolor sit amet, consectetuer adipiscing elit, sed diam nonummy nibh euismod tincidunt."}, {"label": "formula", "id": 6, "page_no": 1, "cluster": {"id": 6, "label": "formula", "bbox": {"l": 280.5539904602546, "t": 362.4346620011579, "r": 330.6965905425146, "b": 374.2696820665041, "coord_origin": "TOPLEFT"}, "confidence": 0.8711639046669006, "cells": [{"id": 19, "text": "a", "bbox": {"l": 280.5539904602546, "t": 364.3070620114962, "r": 285.8142404688841, "b": 374.2696820665041, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "2", "bbox": {"l": 285.8200104688936, "t": 362.4346620011579, "r": 289.78809047540335, "b": 369.40844203966316, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "+ 8 = 12", "bbox": {"l": 292.50400047985886, "t": 364.3070620114962, "r": 330.6965905425146, "b": 374.2696820665041, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "a 2 + 8 = 12"}, {"label": "text", "id": 0, "page_no": 1, "cluster": {"id": 0, "label": "text", "bbox": {"l": 133.76801021944917, "t": 382.24005211051195, "r": 477.47589078330907, "b": 523.7096828916267, "coord_origin": "TOPLEFT"}, "confidence": 0.9880034923553467, "cells": [{"id": 22, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy", "bbox": {"l": 148.71201024396512, "t": 382.24005211051195, "r": 477.4698807832991, "b": 392.2026621655199, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam", "bbox": {"l": 133.76801021944917, "t": 394.19506217652076, "r": 477.47580078330884, "b": 404.15768223152867, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita", "bbox": {"l": 133.76801021944917, "t": 406.15005224252945, "r": 477.47580078330884, "b": 416.1126722975373, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem", "bbox": {"l": 133.76801021944917, "t": 418.10507230853824, "r": 477.47284078330404, "b": 428.06768236354606, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod", "bbox": {"l": 133.76801021944917, "t": 430.0600523745468, "r": 477.47589078330907, "b": 440.0226724295547, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At", "bbox": {"l": 133.76801021944917, "t": 442.01605244056105, "r": 477.4717707833023, "b": 451.97866249556887, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren,", "bbox": {"l": 133.76801021944917, "t": 453.9710625065698, "r": 477.47388078330573, "b": 463.93368256157777, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor", "bbox": {"l": 133.76801021944917, "t": 465.9260525725785, "r": 477.4708307833007, "b": 475.88867262758635, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt", "bbox": {"l": 133.76801021944917, "t": 477.8810726385873, "r": 477.4709207833008, "b": 487.84368269359516, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et", "bbox": {"l": 133.76801021944917, "t": 489.8360527045959, "r": 477.4658807832926, "b": 499.7986727596038, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea", "bbox": {"l": 133.76801021944917, "t": 501.7910427706045, "r": 477.47586078330903, "b": 511.7536628256125, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "takimata sanctus est Lorem ipsum dolor sit amet.", "bbox": {"l": 133.76801021944917, "t": 513.7470728366188, "r": 351.4767205766048, "b": 523.7096828916267, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet."}, {"label": "text", "id": 4, "page_no": 1, "cluster": {"id": 4, "label": "text", "bbox": {"l": 133.76801021944917, "t": 525.7020529026275, "r": 477.47482078330734, "b": 595.4406532876844, "coord_origin": "TOPLEFT"}, "confidence": 0.9844803214073181, "cells": [{"id": 34, "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie", "bbox": {"l": 148.71201024396512, "t": 525.7020529026275, "r": 477.4710707833011, "b": 535.6646729576354, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et", "bbox": {"l": 133.76801021944917, "t": 537.6570729686364, "r": 477.47293078330415, "b": 547.6196930236442, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore", "bbox": {"l": 133.76801021944917, "t": 549.612063034645, "r": 477.47482078330734, "b": 559.5746730896528, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "te feugait nulla facilisi. Lorem ipsum dolor sit amet, consectetuer adipiscing elit,", "bbox": {"l": 133.76801021944917, "t": 561.5670431006536, "r": 477.472810783304, "b": 571.5296631556615, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "sed diam nonummy nibh euismod tincidunt ut laoreet dolore magna aliquam erat", "bbox": {"l": 133.76801021944917, "t": 573.5220631666624, "r": 477.47479078330724, "b": 583.4846832216704, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "volutpat.", "bbox": {"l": 133.76801021944917, "t": 585.4780532326765, "r": 173.0565202839028, "b": 595.4406532876844, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore te feugait nulla facilisi. Lorem ipsum dolor sit amet, consectetuer adipiscing elit, sed diam nonummy nibh euismod tincidunt ut laoreet dolore magna aliquam erat volutpat."}, {"label": "text", "id": 2, "page_no": 1, "cluster": {"id": 2, "label": "text", "bbox": {"l": 133.76801021944917, "t": 597.4330632986853, "r": 477.47482078330734, "b": 667.1716636837423, "coord_origin": "TOPLEFT"}, "confidence": 0.9872003793716431, "cells": [{"id": 40, "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie", "bbox": {"l": 148.71201024396512, "t": 597.4330632986853, "r": 477.4710707833011, "b": 607.3956633536932, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et", "bbox": {"l": 133.76801021944917, "t": 609.3880633646941, "r": 477.47293078330415, "b": 619.3506634197018, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore", "bbox": {"l": 133.76801021944917, "t": 621.3430634307027, "r": 477.47482078330734, "b": 631.3056634857105, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "te feugait nulla facilisi. Lorem ipsum dolor sit amet, consectetuer adipiscing elit,", "bbox": {"l": 133.76801021944917, "t": 633.2980634967114, "r": 477.472810783304, "b": 643.2606635517193, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "sed diam nonummy nibh euismod tincidunt ut laoreet dolore magna aliquam erat", "bbox": {"l": 133.76801021944917, "t": 645.2540535627256, "r": 477.47479078330724, "b": 655.2166536177334, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "volutpat.", "bbox": {"l": 133.76801021944917, "t": 657.2090636287344, "r": 173.0565202839028, "b": 667.1716636837423, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore te feugait nulla facilisi. Lorem ipsum dolor sit amet, consectetuer adipiscing elit, sed diam nonummy nibh euismod tincidunt ut laoreet dolore magna aliquam erat volutpat."}, {"label": "page_footer", "id": 7, "page_no": 1, "cluster": {"id": 7, "label": "page_footer", "bbox": {"l": 303.13300049729594, "t": 695.1640638383003, "r": 308.1142905054678, "b": 705.1266638933081, "coord_origin": "TOPLEFT"}, "confidence": 0.850279688835144, "cells": [{"id": 46, "text": "1", "bbox": {"l": 303.13300049729594, "t": 695.1640638383003, "r": 308.1142905054678, "b": 705.1266638933081, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1"}], "body": [{"label": "section_header", "id": 5, "page_no": 1, "cluster": {"id": 5, "label": "section_header", "bbox": {"l": 133.76801021944917, "t": 124.00537068468714, "r": 191.51430031418315, "b": 138.36590076397772, "coord_origin": "TOPLEFT"}, "confidence": 0.95060133934021, "cells": [{"id": 0, "text": "Formula", "bbox": {"l": 133.76801021944917, "t": 124.00537068468714, "r": 191.51430031418315, "b": 138.36590076397772, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Formula"}, {"label": "text", "id": 1, "page_no": 1, "cluster": {"id": 1, "label": "text", "bbox": {"l": 133.76801021944917, "t": 149.114070823323, "r": 477.4806507833169, "b": 290.58367160443765, "coord_origin": "TOPLEFT"}, "confidence": 0.9878177046775818, "cells": [{"id": 1, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eir-", "bbox": {"l": 133.76801021944917, "t": 149.114070823323, "r": 477.47687078331063, "b": 159.0766608783307, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "mod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam volup-", "bbox": {"l": 133.76801021944917, "t": 161.06909088933185, "r": 477.4778107833122, "b": 171.03167094433945, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "tua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd", "bbox": {"l": 133.76801021944917, "t": 173.0241009553406, "r": 477.46985078329914, "b": 182.9866910103483, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ip-", "bbox": {"l": 133.76801021944917, "t": 184.97906102134914, "r": 477.4718607833024, "b": 194.94165107635683, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "sum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor", "bbox": {"l": 133.76801021944917, "t": 196.93511108736357, "r": 477.4699407832993, "b": 206.89770114237137, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero", "bbox": {"l": 133.76801021944917, "t": 208.890071153372, "r": 477.4806507833169, "b": 218.8526612083799, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "eos et accusam et justo duo dolores et ea rebum.", "bbox": {"l": 133.76801021944917, "t": 220.84509121938083, "r": 355.20087058271434, "b": 230.80767127438855, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Stet clita kasd gubergren,", "bbox": {"l": 362.6010705948545, "t": 220.84509121938083, "r": 477.4749507833075, "b": 230.80767127438855, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor", "bbox": {"l": 133.76801021944917, "t": 232.8001112853898, "r": 477.4708307833007, "b": 242.76269134039728, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt", "bbox": {"l": 133.76801021944917, "t": 244.75506135139813, "r": 477.4709207833008, "b": 254.71765140640582, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et", "bbox": {"l": 133.76801021944917, "t": 256.71008141740685, "r": 477.4658807832926, "b": 266.6726614724146, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea", "bbox": {"l": 133.76801021944917, "t": 268.6660714834211, "r": 477.47586078330903, "b": 278.6286615384289, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "takimata sanctus est Lorem ipsum dolor sit amet.", "bbox": {"l": 133.76801021944917, "t": 280.62109154942993, "r": 351.4767205766048, "b": 290.58367160443765, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet."}, {"label": "text", "id": 3, "page_no": 1, "cluster": {"id": 3, "label": "text", "bbox": {"l": 133.76801021944917, "t": 292.5761116154388, "r": 477.47482078330734, "b": 350.3596819344868, "coord_origin": "TOPLEFT"}, "confidence": 0.9855858683586121, "cells": [{"id": 14, "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie", "bbox": {"l": 148.71201024396512, "t": 292.5761116154388, "r": 477.4710707833011, "b": 302.5386916704465, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et", "bbox": {"l": 133.76801021944917, "t": 304.5310616814471, "r": 477.47293078330415, "b": 314.4936517364549, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore", "bbox": {"l": 133.76801021944917, "t": 316.48608174745607, "r": 477.47482078330734, "b": 326.4486618024637, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "te feugait nulla facilisi. Lorem ipsum dolor sit amet, consectetuer adipiscing elit,", "bbox": {"l": 133.76801021944917, "t": 328.4411018134648, "r": 477.472810783304, "b": 338.40368186847246, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "sed diam nonummy nibh euismod tincidunt.", "bbox": {"l": 133.76801021944917, "t": 340.3970618794788, "r": 326.20752053515014, "b": 350.3596819344868, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore te feugait nulla facilisi. Lorem ipsum dolor sit amet, consectetuer adipiscing elit, sed diam nonummy nibh euismod tincidunt."}, {"label": "formula", "id": 6, "page_no": 1, "cluster": {"id": 6, "label": "formula", "bbox": {"l": 280.5539904602546, "t": 362.4346620011579, "r": 330.6965905425146, "b": 374.2696820665041, "coord_origin": "TOPLEFT"}, "confidence": 0.8711639046669006, "cells": [{"id": 19, "text": "a", "bbox": {"l": 280.5539904602546, "t": 364.3070620114962, "r": 285.8142404688841, "b": 374.2696820665041, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "2", "bbox": {"l": 285.8200104688936, "t": 362.4346620011579, "r": 289.78809047540335, "b": 369.40844203966316, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "+ 8 = 12", "bbox": {"l": 292.50400047985886, "t": 364.3070620114962, "r": 330.6965905425146, "b": 374.2696820665041, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "a 2 + 8 = 12"}, {"label": "text", "id": 0, "page_no": 1, "cluster": {"id": 0, "label": "text", "bbox": {"l": 133.76801021944917, "t": 382.24005211051195, "r": 477.47589078330907, "b": 523.7096828916267, "coord_origin": "TOPLEFT"}, "confidence": 0.9880034923553467, "cells": [{"id": 22, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy", "bbox": {"l": 148.71201024396512, "t": 382.24005211051195, "r": 477.4698807832991, "b": 392.2026621655199, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam", "bbox": {"l": 133.76801021944917, "t": 394.19506217652076, "r": 477.47580078330884, "b": 404.15768223152867, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita", "bbox": {"l": 133.76801021944917, "t": 406.15005224252945, "r": 477.47580078330884, "b": 416.1126722975373, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem", "bbox": {"l": 133.76801021944917, "t": 418.10507230853824, "r": 477.47284078330404, "b": 428.06768236354606, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod", "bbox": {"l": 133.76801021944917, "t": 430.0600523745468, "r": 477.47589078330907, "b": 440.0226724295547, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At", "bbox": {"l": 133.76801021944917, "t": 442.01605244056105, "r": 477.4717707833023, "b": 451.97866249556887, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren,", "bbox": {"l": 133.76801021944917, "t": 453.9710625065698, "r": 477.47388078330573, "b": 463.93368256157777, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor", "bbox": {"l": 133.76801021944917, "t": 465.9260525725785, "r": 477.4708307833007, "b": 475.88867262758635, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt", "bbox": {"l": 133.76801021944917, "t": 477.8810726385873, "r": 477.4709207833008, "b": 487.84368269359516, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et", "bbox": {"l": 133.76801021944917, "t": 489.8360527045959, "r": 477.4658807832926, "b": 499.7986727596038, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea", "bbox": {"l": 133.76801021944917, "t": 501.7910427706045, "r": 477.47586078330903, "b": 511.7536628256125, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "takimata sanctus est Lorem ipsum dolor sit amet.", "bbox": {"l": 133.76801021944917, "t": 513.7470728366188, "r": 351.4767205766048, "b": 523.7096828916267, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet."}, {"label": "text", "id": 4, "page_no": 1, "cluster": {"id": 4, "label": "text", "bbox": {"l": 133.76801021944917, "t": 525.7020529026275, "r": 477.47482078330734, "b": 595.4406532876844, "coord_origin": "TOPLEFT"}, "confidence": 0.9844803214073181, "cells": [{"id": 34, "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie", "bbox": {"l": 148.71201024396512, "t": 525.7020529026275, "r": 477.4710707833011, "b": 535.6646729576354, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et", "bbox": {"l": 133.76801021944917, "t": 537.6570729686364, "r": 477.47293078330415, "b": 547.6196930236442, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore", "bbox": {"l": 133.76801021944917, "t": 549.612063034645, "r": 477.47482078330734, "b": 559.5746730896528, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "te feugait nulla facilisi. Lorem ipsum dolor sit amet, consectetuer adipiscing elit,", "bbox": {"l": 133.76801021944917, "t": 561.5670431006536, "r": 477.472810783304, "b": 571.5296631556615, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "sed diam nonummy nibh euismod tincidunt ut laoreet dolore magna aliquam erat", "bbox": {"l": 133.76801021944917, "t": 573.5220631666624, "r": 477.47479078330724, "b": 583.4846832216704, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "volutpat.", "bbox": {"l": 133.76801021944917, "t": 585.4780532326765, "r": 173.0565202839028, "b": 595.4406532876844, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore te feugait nulla facilisi. Lorem ipsum dolor sit amet, consectetuer adipiscing elit, sed diam nonummy nibh euismod tincidunt ut laoreet dolore magna aliquam erat volutpat."}, {"label": "text", "id": 2, "page_no": 1, "cluster": {"id": 2, "label": "text", "bbox": {"l": 133.76801021944917, "t": 597.4330632986853, "r": 477.47482078330734, "b": 667.1716636837423, "coord_origin": "TOPLEFT"}, "confidence": 0.9872003793716431, "cells": [{"id": 40, "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie", "bbox": {"l": 148.71201024396512, "t": 597.4330632986853, "r": 477.4710707833011, "b": 607.3956633536932, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et", "bbox": {"l": 133.76801021944917, "t": 609.3880633646941, "r": 477.47293078330415, "b": 619.3506634197018, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore", "bbox": {"l": 133.76801021944917, "t": 621.3430634307027, "r": 477.47482078330734, "b": 631.3056634857105, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "te feugait nulla facilisi. Lorem ipsum dolor sit amet, consectetuer adipiscing elit,", "bbox": {"l": 133.76801021944917, "t": 633.2980634967114, "r": 477.472810783304, "b": 643.2606635517193, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "sed diam nonummy nibh euismod tincidunt ut laoreet dolore magna aliquam erat", "bbox": {"l": 133.76801021944917, "t": 645.2540535627256, "r": 477.47479078330724, "b": 655.2166536177334, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "volutpat.", "bbox": {"l": 133.76801021944917, "t": 657.2090636287344, "r": 173.0565202839028, "b": 667.1716636837423, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore te feugait nulla facilisi. Lorem ipsum dolor sit amet, consectetuer adipiscing elit, sed diam nonummy nibh euismod tincidunt ut laoreet dolore magna aliquam erat volutpat."}], "headers": [{"label": "page_footer", "id": 7, "page_no": 1, "cluster": {"id": 7, "label": "page_footer", "bbox": {"l": 303.13300049729594, "t": 695.1640638383003, "r": 308.1142905054678, "b": 705.1266638933081, "coord_origin": "TOPLEFT"}, "confidence": 0.850279688835144, "cells": [{"id": 46, "text": "1", "bbox": {"l": 303.13300049729594, "t": 695.1640638383003, "r": 308.1142905054678, "b": 705.1266638933081, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1"}]}}]
\ No newline at end of file
+[{"page_no": 0, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "JavaScript Code Example", "bbox": {"l": 133.76801, "t": 124.80877999999996, "r": 315.91595, "b": 137.54816000000005, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eir-", "bbox": {"l": 133.76801, "t": 149.67193999999995, "r": 477.47971, "b": 158.51873999999998, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "mod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam volup-", "bbox": {"l": 133.76801, "t": 161.62694999999997, "r": 477.4806500000001, "b": 170.47375, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "tua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd", "bbox": {"l": 133.76801, "t": 173.58196999999996, "r": 477.47571000000005, "b": 182.42877, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ip-", "bbox": {"l": 133.76801, "t": 185.53698999999995, "r": 477.47466999999995, "b": 194.38378999999998, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "sum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor", "bbox": {"l": 133.76801, "t": 197.49199999999996, "r": 477.47668, "b": 206.33880999999997, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero", "bbox": {"l": 133.76801, "t": 209.44701999999995, "r": 477.48068000000006, "b": 218.29381999999998, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "eos et accusam et justo duo dolores et ea rebum.", "bbox": {"l": 133.76801, "t": 221.40301999999997, "r": 355.20874, "b": 230.24982, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Stet clita kasd gubergren,", "bbox": {"l": 362.60098, "t": 221.40301999999997, "r": 477.48276, "b": 230.24982, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor", "bbox": {"l": 133.76801, "t": 233.35802999999999, "r": 477.47772, "b": 242.20483000000002, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt", "bbox": {"l": 133.76801, "t": 245.31304999999998, "r": 477.47971, "b": 254.15985, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et", "bbox": {"l": 133.76801, "t": 257.26806999999997, "r": 477.47473, "b": 266.11487, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea", "bbox": {"l": 133.76801, "t": 269.22308, "r": 477.47571000000005, "b": 278.06989, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "takimata sanctus est Lorem ipsum dolor sit amet.", "bbox": {"l": 133.76801, "t": 281.17911, "r": 351.48471, "b": 290.02588, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie", "bbox": {"l": 148.71201, "t": 293.13409, "r": 477.47479, "b": 301.98087, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan", "bbox": {"l": 133.76801, "t": 305.08908, "r": 477.47876, "b": 313.9358500000001, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "et iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis", "bbox": {"l": 133.76801, "t": 317.04407, "r": 477.47668, "b": 325.89084, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "dolore te feugait nulla facilisi. Lorem ipsum dolor sit amet,", "bbox": {"l": 133.76801, "t": 328.99905, "r": 391.79935, "b": 337.84583, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Listing 1: Simple JavaScript Program", "bbox": {"l": 223.15500000000003, "t": 349.92105, "r": 388.09375, "b": 358.76782, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "function", "bbox": {"l": 134.605, "t": 366.3995100000001, "r": 178.11899, "b": 373.86853, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "add(a, b) {", "bbox": {"l": 185.31004, "t": 366.3995100000001, "r": 246.27264000000002, "b": 373.86853, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "return a + b;", "bbox": {"l": 157.17101, "t": 377.35852, "r": 229.32368, "b": 384.82755, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "}", "bbox": {"l": 134.239, "t": 388.31750000000005, "r": 138.94637, "b": 395.78653, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "console.log(add(3, 5));", "bbox": {"l": 134.592, "t": 399.27652, "r": 263.22409, "b": 406.74554, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy", "bbox": {"l": 148.71201, "t": 419.06097000000005, "r": 477.47786999999994, "b": 427.90775, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam", "bbox": {"l": 133.76801, "t": 431.01697, "r": 477.47860999999995, "b": 439.86374, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita", "bbox": {"l": 133.76801, "t": 442.97195, "r": 477.47571000000005, "b": 451.81873, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem", "bbox": {"l": 133.76801, "t": 454.92694, "r": 477.47559, "b": 463.77371, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod", "bbox": {"l": 133.76801, "t": 466.88193, "r": 477.48169000000007, "b": 475.7287, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At", "bbox": {"l": 133.76801, "t": 478.83691, "r": 477.48062, "b": 487.68369, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren,", "bbox": {"l": 133.76801, "t": 490.7919, "r": 477.48172000000005, "b": 499.63867, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor", "bbox": {"l": 133.76801, "t": 502.74789, "r": 477.47772, "b": 511.59467, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt", "bbox": {"l": 133.76801, "t": 514.70288, "r": 477.47971, "b": 523.5496499999999, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et", "bbox": {"l": 133.76801, "t": 526.65787, "r": 477.47473, "b": 535.50464, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea", "bbox": {"l": 133.76801, "t": 538.61285, "r": 477.47571000000005, "b": 547.45964, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "takimata sanctus est Lorem ipsum dolor sit amet.", "bbox": {"l": 133.76801, "t": 550.56786, "r": 351.48471, "b": 559.41464, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie", "bbox": {"l": 148.71201, "t": 562.52286, "r": 477.47479, "b": 571.36964, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan", "bbox": {"l": 133.76801, "t": 574.47885, "r": 477.47876, "b": 583.32564, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "et iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis", "bbox": {"l": 133.76801, "t": 586.43385, "r": 477.47668, "b": 595.28064, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "dolore te feugait nulla facilisi. Lorem ipsum dolor sit amet,", "bbox": {"l": 133.76801, "t": 598.38885, "r": 391.79935, "b": 607.23564, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "1", "bbox": {"l": 303.133, "t": 695.720856, "r": 308.11429, "b": 704.56765, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 4, "label": "section_header", "bbox": {"l": 133.76801, "t": 124.80877999999996, "r": 315.91595, "b": 137.54816000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9606584310531616, "cells": [{"id": 0, "text": "JavaScript Code Example", "bbox": {"l": 133.76801, "t": 124.80877999999996, "r": 315.91595, "b": 137.54816000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 133.76801, "t": 149.67193999999995, "r": 477.48276, "b": 290.02588, "coord_origin": "TOPLEFT"}, "confidence": 0.9871246814727783, "cells": [{"id": 1, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eir-", "bbox": {"l": 133.76801, "t": 149.67193999999995, "r": 477.47971, "b": 158.51873999999998, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "mod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam volup-", "bbox": {"l": 133.76801, "t": 161.62694999999997, "r": 477.4806500000001, "b": 170.47375, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "tua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd", "bbox": {"l": 133.76801, "t": 173.58196999999996, "r": 477.47571000000005, "b": 182.42877, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ip-", "bbox": {"l": 133.76801, "t": 185.53698999999995, "r": 477.47466999999995, "b": 194.38378999999998, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "sum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor", "bbox": {"l": 133.76801, "t": 197.49199999999996, "r": 477.47668, "b": 206.33880999999997, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero", "bbox": {"l": 133.76801, "t": 209.44701999999995, "r": 477.48068000000006, "b": 218.29381999999998, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "eos et accusam et justo duo dolores et ea rebum.", "bbox": {"l": 133.76801, "t": 221.40301999999997, "r": 355.20874, "b": 230.24982, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Stet clita kasd gubergren,", "bbox": {"l": 362.60098, "t": 221.40301999999997, "r": 477.48276, "b": 230.24982, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor", "bbox": {"l": 133.76801, "t": 233.35802999999999, "r": 477.47772, "b": 242.20483000000002, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt", "bbox": {"l": 133.76801, "t": 245.31304999999998, "r": 477.47971, "b": 254.15985, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et", "bbox": {"l": 133.76801, "t": 257.26806999999997, "r": 477.47473, "b": 266.11487, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea", "bbox": {"l": 133.76801, "t": 269.22308, "r": 477.47571000000005, "b": 278.06989, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "takimata sanctus est Lorem ipsum dolor sit amet.", "bbox": {"l": 133.76801, "t": 281.17911, "r": 351.48471, "b": 290.02588, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 133.76801, "t": 293.13409, "r": 477.47876, "b": 337.84583, "coord_origin": "TOPLEFT"}, "confidence": 0.9834160804748535, "cells": [{"id": 14, "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie", "bbox": {"l": 148.71201, "t": 293.13409, "r": 477.47479, "b": 301.98087, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan", "bbox": {"l": 133.76801, "t": 305.08908, "r": 477.47876, "b": 313.9358500000001, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "et iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis", "bbox": {"l": 133.76801, "t": 317.04407, "r": 477.47668, "b": 325.89084, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "dolore te feugait nulla facilisi. Lorem ipsum dolor sit amet,", "bbox": {"l": 133.76801, "t": 328.99905, "r": 391.79935, "b": 337.84583, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "caption", "bbox": {"l": 223.15500000000003, "t": 349.92105, "r": 388.09375, "b": 358.76782, "coord_origin": "TOPLEFT"}, "confidence": 0.5588350296020508, "cells": [{"id": 18, "text": "Listing 1: Simple JavaScript Program", "bbox": {"l": 223.15500000000003, "t": 349.92105, "r": 388.09375, "b": 358.76782, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "code", "bbox": {"l": 134.239, "t": 366.3995100000001, "r": 263.22409, "b": 406.74554, "coord_origin": "TOPLEFT"}, "confidence": 0.6312209963798523, "cells": [{"id": 19, "text": "function", "bbox": {"l": 134.605, "t": 366.3995100000001, "r": 178.11899, "b": 373.86853, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "add(a, b) {", "bbox": {"l": 185.31004, "t": 366.3995100000001, "r": 246.27264000000002, "b": 373.86853, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "return a + b;", "bbox": {"l": 157.17101, "t": 377.35852, "r": 229.32368, "b": 384.82755, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "}", "bbox": {"l": 134.239, "t": 388.31750000000005, "r": 138.94637, "b": 395.78653, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "console.log(add(3, 5));", "bbox": {"l": 134.592, "t": 399.27652, "r": 263.22409, "b": 406.74554, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 133.76801, "t": 419.06097000000005, "r": 477.48172000000005, "b": 559.41464, "coord_origin": "TOPLEFT"}, "confidence": 0.987352728843689, "cells": [{"id": 24, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy", "bbox": {"l": 148.71201, "t": 419.06097000000005, "r": 477.47786999999994, "b": 427.90775, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam", "bbox": {"l": 133.76801, "t": 431.01697, "r": 477.47860999999995, "b": 439.86374, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita", "bbox": {"l": 133.76801, "t": 442.97195, "r": 477.47571000000005, "b": 451.81873, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem", "bbox": {"l": 133.76801, "t": 454.92694, "r": 477.47559, "b": 463.77371, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod", "bbox": {"l": 133.76801, "t": 466.88193, "r": 477.48169000000007, "b": 475.7287, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At", "bbox": {"l": 133.76801, "t": 478.83691, "r": 477.48062, "b": 487.68369, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren,", "bbox": {"l": 133.76801, "t": 490.7919, "r": 477.48172000000005, "b": 499.63867, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor", "bbox": {"l": 133.76801, "t": 502.74789, "r": 477.47772, "b": 511.59467, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt", "bbox": {"l": 133.76801, "t": 514.70288, "r": 477.47971, "b": 523.5496499999999, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et", "bbox": {"l": 133.76801, "t": 526.65787, "r": 477.47473, "b": 535.50464, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea", "bbox": {"l": 133.76801, "t": 538.61285, "r": 477.47571000000005, "b": 547.45964, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "takimata sanctus est Lorem ipsum dolor sit amet.", "bbox": {"l": 133.76801, "t": 550.56786, "r": 351.48471, "b": 559.41464, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 133.76801, "t": 562.52286, "r": 477.47876, "b": 607.23564, "coord_origin": "TOPLEFT"}, "confidence": 0.9843751788139343, "cells": [{"id": 36, "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie", "bbox": {"l": 148.71201, "t": 562.52286, "r": 477.47479, "b": 571.36964, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan", "bbox": {"l": 133.76801, "t": 574.47885, "r": 477.47876, "b": 583.32564, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "et iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis", "bbox": {"l": 133.76801, "t": 586.43385, "r": 477.47668, "b": 595.28064, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "dolore te feugait nulla facilisi. Lorem ipsum dolor sit amet,", "bbox": {"l": 133.76801, "t": 598.38885, "r": 391.79935, "b": 607.23564, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "page_footer", "bbox": {"l": 303.133, "t": 695.720856, "r": 308.11429, "b": 704.56765, "coord_origin": "TOPLEFT"}, "confidence": 0.8444077372550964, "cells": [{"id": 40, "text": "1", "bbox": {"l": 303.133, "t": 695.720856, "r": 308.11429, "b": 704.56765, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "section_header", "id": 4, "page_no": 0, "cluster": {"id": 4, "label": "section_header", "bbox": {"l": 133.76801, "t": 124.80877999999996, "r": 315.91595, "b": 137.54816000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9606584310531616, "cells": [{"id": 0, "text": "JavaScript Code Example", "bbox": {"l": 133.76801, "t": 124.80877999999996, "r": 315.91595, "b": 137.54816000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "JavaScript Code Example"}, {"label": "text", "id": 1, "page_no": 0, "cluster": {"id": 1, "label": "text", "bbox": {"l": 133.76801, "t": 149.67193999999995, "r": 477.48276, "b": 290.02588, "coord_origin": "TOPLEFT"}, "confidence": 0.9871246814727783, "cells": [{"id": 1, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eir-", "bbox": {"l": 133.76801, "t": 149.67193999999995, "r": 477.47971, "b": 158.51873999999998, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "mod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam volup-", "bbox": {"l": 133.76801, "t": 161.62694999999997, "r": 477.4806500000001, "b": 170.47375, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "tua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd", "bbox": {"l": 133.76801, "t": 173.58196999999996, "r": 477.47571000000005, "b": 182.42877, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ip-", "bbox": {"l": 133.76801, "t": 185.53698999999995, "r": 477.47466999999995, "b": 194.38378999999998, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "sum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor", "bbox": {"l": 133.76801, "t": 197.49199999999996, "r": 477.47668, "b": 206.33880999999997, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero", "bbox": {"l": 133.76801, "t": 209.44701999999995, "r": 477.48068000000006, "b": 218.29381999999998, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "eos et accusam et justo duo dolores et ea rebum.", "bbox": {"l": 133.76801, "t": 221.40301999999997, "r": 355.20874, "b": 230.24982, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Stet clita kasd gubergren,", "bbox": {"l": 362.60098, "t": 221.40301999999997, "r": 477.48276, "b": 230.24982, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor", "bbox": {"l": 133.76801, "t": 233.35802999999999, "r": 477.47772, "b": 242.20483000000002, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt", "bbox": {"l": 133.76801, "t": 245.31304999999998, "r": 477.47971, "b": 254.15985, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et", "bbox": {"l": 133.76801, "t": 257.26806999999997, "r": 477.47473, "b": 266.11487, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea", "bbox": {"l": 133.76801, "t": 269.22308, "r": 477.47571000000005, "b": 278.06989, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "takimata sanctus est Lorem ipsum dolor sit amet.", "bbox": {"l": 133.76801, "t": 281.17911, "r": 351.48471, "b": 290.02588, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet."}, {"label": "text", "id": 3, "page_no": 0, "cluster": {"id": 3, "label": "text", "bbox": {"l": 133.76801, "t": 293.13409, "r": 477.47876, "b": 337.84583, "coord_origin": "TOPLEFT"}, "confidence": 0.9834160804748535, "cells": [{"id": 14, "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie", "bbox": {"l": 148.71201, "t": 293.13409, "r": 477.47479, "b": 301.98087, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan", "bbox": {"l": 133.76801, "t": 305.08908, "r": 477.47876, "b": 313.9358500000001, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "et iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis", "bbox": {"l": 133.76801, "t": 317.04407, "r": 477.47668, "b": 325.89084, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "dolore te feugait nulla facilisi. Lorem ipsum dolor sit amet,", "bbox": {"l": 133.76801, "t": 328.99905, "r": 391.79935, "b": 337.84583, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore te feugait nulla facilisi. Lorem ipsum dolor sit amet,"}, {"label": "caption", "id": 7, "page_no": 0, "cluster": {"id": 7, "label": "caption", "bbox": {"l": 223.15500000000003, "t": 349.92105, "r": 388.09375, "b": 358.76782, "coord_origin": "TOPLEFT"}, "confidence": 0.5588350296020508, "cells": [{"id": 18, "text": "Listing 1: Simple JavaScript Program", "bbox": {"l": 223.15500000000003, "t": 349.92105, "r": 388.09375, "b": 358.76782, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Listing 1: Simple JavaScript Program"}, {"label": "code", "id": 6, "page_no": 0, "cluster": {"id": 6, "label": "code", "bbox": {"l": 134.239, "t": 366.3995100000001, "r": 263.22409, "b": 406.74554, "coord_origin": "TOPLEFT"}, "confidence": 0.6312209963798523, "cells": [{"id": 19, "text": "function", "bbox": {"l": 134.605, "t": 366.3995100000001, "r": 178.11899, "b": 373.86853, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "add(a, b) {", "bbox": {"l": 185.31004, "t": 366.3995100000001, "r": 246.27264000000002, "b": 373.86853, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "return a + b;", "bbox": {"l": 157.17101, "t": 377.35852, "r": 229.32368, "b": 384.82755, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "}", "bbox": {"l": 134.239, "t": 388.31750000000005, "r": 138.94637, "b": 395.78653, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "console.log(add(3, 5));", "bbox": {"l": 134.592, "t": 399.27652, "r": 263.22409, "b": 406.74554, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "function add(a, b) { return a + b; } console.log(add(3, 5));"}, {"label": "text", "id": 0, "page_no": 0, "cluster": {"id": 0, "label": "text", "bbox": {"l": 133.76801, "t": 419.06097000000005, "r": 477.48172000000005, "b": 559.41464, "coord_origin": "TOPLEFT"}, "confidence": 0.987352728843689, "cells": [{"id": 24, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy", "bbox": {"l": 148.71201, "t": 419.06097000000005, "r": 477.47786999999994, "b": 427.90775, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam", "bbox": {"l": 133.76801, "t": 431.01697, "r": 477.47860999999995, "b": 439.86374, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita", "bbox": {"l": 133.76801, "t": 442.97195, "r": 477.47571000000005, "b": 451.81873, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem", "bbox": {"l": 133.76801, "t": 454.92694, "r": 477.47559, "b": 463.77371, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod", "bbox": {"l": 133.76801, "t": 466.88193, "r": 477.48169000000007, "b": 475.7287, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At", "bbox": {"l": 133.76801, "t": 478.83691, "r": 477.48062, "b": 487.68369, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren,", "bbox": {"l": 133.76801, "t": 490.7919, "r": 477.48172000000005, "b": 499.63867, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor", "bbox": {"l": 133.76801, "t": 502.74789, "r": 477.47772, "b": 511.59467, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt", "bbox": {"l": 133.76801, "t": 514.70288, "r": 477.47971, "b": 523.5496499999999, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et", "bbox": {"l": 133.76801, "t": 526.65787, "r": 477.47473, "b": 535.50464, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea", "bbox": {"l": 133.76801, "t": 538.61285, "r": 477.47571000000005, "b": 547.45964, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "takimata sanctus est Lorem ipsum dolor sit amet.", "bbox": {"l": 133.76801, "t": 550.56786, "r": 351.48471, "b": 559.41464, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet."}, {"label": "text", "id": 2, "page_no": 0, "cluster": {"id": 2, "label": "text", "bbox": {"l": 133.76801, "t": 562.52286, "r": 477.47876, "b": 607.23564, "coord_origin": "TOPLEFT"}, "confidence": 0.9843751788139343, "cells": [{"id": 36, "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie", "bbox": {"l": 148.71201, "t": 562.52286, "r": 477.47479, "b": 571.36964, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan", "bbox": {"l": 133.76801, "t": 574.47885, "r": 477.47876, "b": 583.32564, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "et iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis", "bbox": {"l": 133.76801, "t": 586.43385, "r": 477.47668, "b": 595.28064, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "dolore te feugait nulla facilisi. Lorem ipsum dolor sit amet,", "bbox": {"l": 133.76801, "t": 598.38885, "r": 391.79935, "b": 607.23564, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore te feugait nulla facilisi. Lorem ipsum dolor sit amet,"}, {"label": "page_footer", "id": 5, "page_no": 0, "cluster": {"id": 5, "label": "page_footer", "bbox": {"l": 303.133, "t": 695.720856, "r": 308.11429, "b": 704.56765, "coord_origin": "TOPLEFT"}, "confidence": 0.8444077372550964, "cells": [{"id": 40, "text": "1", "bbox": {"l": 303.133, "t": 695.720856, "r": 308.11429, "b": 704.56765, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1"}], "body": [{"label": "section_header", "id": 4, "page_no": 0, "cluster": {"id": 4, "label": "section_header", "bbox": {"l": 133.76801, "t": 124.80877999999996, "r": 315.91595, "b": 137.54816000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9606584310531616, "cells": [{"id": 0, "text": "JavaScript Code Example", "bbox": {"l": 133.76801, "t": 124.80877999999996, "r": 315.91595, "b": 137.54816000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "JavaScript Code Example"}, {"label": "text", "id": 1, "page_no": 0, "cluster": {"id": 1, "label": "text", "bbox": {"l": 133.76801, "t": 149.67193999999995, "r": 477.48276, "b": 290.02588, "coord_origin": "TOPLEFT"}, "confidence": 0.9871246814727783, "cells": [{"id": 1, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eir-", "bbox": {"l": 133.76801, "t": 149.67193999999995, "r": 477.47971, "b": 158.51873999999998, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "mod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam volup-", "bbox": {"l": 133.76801, "t": 161.62694999999997, "r": 477.4806500000001, "b": 170.47375, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "tua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd", "bbox": {"l": 133.76801, "t": 173.58196999999996, "r": 477.47571000000005, "b": 182.42877, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ip-", "bbox": {"l": 133.76801, "t": 185.53698999999995, "r": 477.47466999999995, "b": 194.38378999999998, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "sum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor", "bbox": {"l": 133.76801, "t": 197.49199999999996, "r": 477.47668, "b": 206.33880999999997, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero", "bbox": {"l": 133.76801, "t": 209.44701999999995, "r": 477.48068000000006, "b": 218.29381999999998, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "eos et accusam et justo duo dolores et ea rebum.", "bbox": {"l": 133.76801, "t": 221.40301999999997, "r": 355.20874, "b": 230.24982, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Stet clita kasd gubergren,", "bbox": {"l": 362.60098, "t": 221.40301999999997, "r": 477.48276, "b": 230.24982, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor", "bbox": {"l": 133.76801, "t": 233.35802999999999, "r": 477.47772, "b": 242.20483000000002, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt", "bbox": {"l": 133.76801, "t": 245.31304999999998, "r": 477.47971, "b": 254.15985, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et", "bbox": {"l": 133.76801, "t": 257.26806999999997, "r": 477.47473, "b": 266.11487, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea", "bbox": {"l": 133.76801, "t": 269.22308, "r": 477.47571000000005, "b": 278.06989, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "takimata sanctus est Lorem ipsum dolor sit amet.", "bbox": {"l": 133.76801, "t": 281.17911, "r": 351.48471, "b": 290.02588, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet."}, {"label": "text", "id": 3, "page_no": 0, "cluster": {"id": 3, "label": "text", "bbox": {"l": 133.76801, "t": 293.13409, "r": 477.47876, "b": 337.84583, "coord_origin": "TOPLEFT"}, "confidence": 0.9834160804748535, "cells": [{"id": 14, "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie", "bbox": {"l": 148.71201, "t": 293.13409, "r": 477.47479, "b": 301.98087, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan", "bbox": {"l": 133.76801, "t": 305.08908, "r": 477.47876, "b": 313.9358500000001, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "et iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis", "bbox": {"l": 133.76801, "t": 317.04407, "r": 477.47668, "b": 325.89084, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "dolore te feugait nulla facilisi. Lorem ipsum dolor sit amet,", "bbox": {"l": 133.76801, "t": 328.99905, "r": 391.79935, "b": 337.84583, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore te feugait nulla facilisi. Lorem ipsum dolor sit amet,"}, {"label": "caption", "id": 7, "page_no": 0, "cluster": {"id": 7, "label": "caption", "bbox": {"l": 223.15500000000003, "t": 349.92105, "r": 388.09375, "b": 358.76782, "coord_origin": "TOPLEFT"}, "confidence": 0.5588350296020508, "cells": [{"id": 18, "text": "Listing 1: Simple JavaScript Program", "bbox": {"l": 223.15500000000003, "t": 349.92105, "r": 388.09375, "b": 358.76782, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Listing 1: Simple JavaScript Program"}, {"label": "code", "id": 6, "page_no": 0, "cluster": {"id": 6, "label": "code", "bbox": {"l": 134.239, "t": 366.3995100000001, "r": 263.22409, "b": 406.74554, "coord_origin": "TOPLEFT"}, "confidence": 0.6312209963798523, "cells": [{"id": 19, "text": "function", "bbox": {"l": 134.605, "t": 366.3995100000001, "r": 178.11899, "b": 373.86853, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "add(a, b) {", "bbox": {"l": 185.31004, "t": 366.3995100000001, "r": 246.27264000000002, "b": 373.86853, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "return a + b;", "bbox": {"l": 157.17101, "t": 377.35852, "r": 229.32368, "b": 384.82755, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "}", "bbox": {"l": 134.239, "t": 388.31750000000005, "r": 138.94637, "b": 395.78653, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "console.log(add(3, 5));", "bbox": {"l": 134.592, "t": 399.27652, "r": 263.22409, "b": 406.74554, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "function add(a, b) { return a + b; } console.log(add(3, 5));"}, {"label": "text", "id": 0, "page_no": 0, "cluster": {"id": 0, "label": "text", "bbox": {"l": 133.76801, "t": 419.06097000000005, "r": 477.48172000000005, "b": 559.41464, "coord_origin": "TOPLEFT"}, "confidence": 0.987352728843689, "cells": [{"id": 24, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy", "bbox": {"l": 148.71201, "t": 419.06097000000005, "r": 477.47786999999994, "b": 427.90775, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam", "bbox": {"l": 133.76801, "t": 431.01697, "r": 477.47860999999995, "b": 439.86374, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita", "bbox": {"l": 133.76801, "t": 442.97195, "r": 477.47571000000005, "b": 451.81873, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem", "bbox": {"l": 133.76801, "t": 454.92694, "r": 477.47559, "b": 463.77371, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod", "bbox": {"l": 133.76801, "t": 466.88193, "r": 477.48169000000007, "b": 475.7287, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At", "bbox": {"l": 133.76801, "t": 478.83691, "r": 477.48062, "b": 487.68369, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren,", "bbox": {"l": 133.76801, "t": 490.7919, "r": 477.48172000000005, "b": 499.63867, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor", "bbox": {"l": 133.76801, "t": 502.74789, "r": 477.47772, "b": 511.59467, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt", "bbox": {"l": 133.76801, "t": 514.70288, "r": 477.47971, "b": 523.5496499999999, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et", "bbox": {"l": 133.76801, "t": 526.65787, "r": 477.47473, "b": 535.50464, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea", "bbox": {"l": 133.76801, "t": 538.61285, "r": 477.47571000000005, "b": 547.45964, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "takimata sanctus est Lorem ipsum dolor sit amet.", "bbox": {"l": 133.76801, "t": 550.56786, "r": 351.48471, "b": 559.41464, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet."}, {"label": "text", "id": 2, "page_no": 0, "cluster": {"id": 2, "label": "text", "bbox": {"l": 133.76801, "t": 562.52286, "r": 477.47876, "b": 607.23564, "coord_origin": "TOPLEFT"}, "confidence": 0.9843751788139343, "cells": [{"id": 36, "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie", "bbox": {"l": 148.71201, "t": 562.52286, "r": 477.47479, "b": 571.36964, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan", "bbox": {"l": 133.76801, "t": 574.47885, "r": 477.47876, "b": 583.32564, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "et iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis", "bbox": {"l": 133.76801, "t": 586.43385, "r": 477.47668, "b": 595.28064, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "dolore te feugait nulla facilisi. Lorem ipsum dolor sit amet,", "bbox": {"l": 133.76801, "t": 598.38885, "r": 391.79935, "b": 607.23564, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore te feugait nulla facilisi. Lorem ipsum dolor sit amet,"}], "headers": [{"label": "page_footer", "id": 5, "page_no": 0, "cluster": {"id": 5, "label": "page_footer", "bbox": {"l": 303.133, "t": 695.720856, "r": 308.11429, "b": 704.56765, "coord_origin": "TOPLEFT"}, "confidence": 0.8444077372550964, "cells": [{"id": 40, "text": "1", "bbox": {"l": 303.133, "t": 695.720856, "r": 308.11429, "b": 704.56765, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1"}]}}, {"page_no": 1, "size": {"width": 595.2760009765625, "height": 841.8900146484375}, "cells": [{"id": 0, "text": "Formula", "bbox": {"l": 133.76801021944917, "t": 124.80877068912298, "r": 191.5272403142044, "b": 137.5481507594625, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eir-", "bbox": {"l": 133.76801021944917, "t": 149.67193082640324, "r": 477.47971078331534, "b": 158.5187308752503, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "mod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam volup-", "bbox": {"l": 133.76801021944917, "t": 161.62695089241197, "r": 477.4806507833169, "b": 170.47375094125903, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "tua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd", "bbox": {"l": 133.76801021944917, "t": 173.5819709584208, "r": 477.4757107833087, "b": 182.42877100726787, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ip-", "bbox": {"l": 133.76801021944917, "t": 185.53698102442956, "r": 477.47467078330703, "b": 194.38378107327662, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "sum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor", "bbox": {"l": 133.76801021944917, "t": 197.4929810904439, "r": 477.4766807833103, "b": 206.33978113929084, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero", "bbox": {"l": 133.76801021944917, "t": 209.44799115645253, "r": 477.48068078331687, "b": 218.29480120529956, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "eos et accusam et justo duo dolores et ea rebum.", "bbox": {"l": 133.76801021944917, "t": 221.40301122246137, "r": 355.2087405827272, "b": 230.24981127130832, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Stet clita kasd gubergren,", "bbox": {"l": 362.6009805948544, "t": 221.40301122246137, "r": 477.48276078332026, "b": 230.24981127130832, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor", "bbox": {"l": 133.76801021944917, "t": 233.35803128847022, "r": 477.47772078331195, "b": 242.20483133731727, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt", "bbox": {"l": 133.76801021944917, "t": 245.31304135447897, "r": 477.47971078331534, "b": 254.159851403326, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et", "bbox": {"l": 133.76801021944917, "t": 257.2680614204878, "r": 477.47473078330717, "b": 266.11486146933476, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea", "bbox": {"l": 133.76801021944917, "t": 269.22406148650214, "r": 477.4757107833087, "b": 278.07086153534897, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "takimata sanctus est Lorem ipsum dolor sit amet.", "bbox": {"l": 133.76801021944917, "t": 281.17907155251066, "r": 351.48471057661794, "b": 290.0258716013577, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie", "bbox": {"l": 148.71201024396512, "t": 293.1340916185196, "r": 477.47479078330724, "b": 301.98089166736656, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et", "bbox": {"l": 133.76801021944917, "t": 305.08911168452846, "r": 477.48163078331845, "b": 313.9359117333753, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore", "bbox": {"l": 133.76801021944917, "t": 317.0441217505371, "r": 477.47867078331365, "b": 325.89093179938413, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "te feugait nulla facilisi. Lorem ipsum dolor sit amet, consectetuer adipiscing elit,", "bbox": {"l": 133.76801021944917, "t": 328.99914181654606, "r": 477.48071078331697, "b": 337.8459118653928, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "sed diam nonummy nibh euismod tincidunt.", "bbox": {"l": 133.76801021944917, "t": 340.9551318825601, "r": 326.21555053516335, "b": 349.801911931407, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "a", "bbox": {"l": 280.5540204602546, "t": 364.8651420145776, "r": 285.820250468894, "b": 373.7119120634245, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "2", "bbox": {"l": 285.8200104688936, "t": 362.82534200331503, "r": 289.7916004754091, "b": 369.0180620375076, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "+ 8 = 12", "bbox": {"l": 292.50400047985886, "t": 364.8651420145776, "r": 330.6965605425145, "b": 373.7119120634245, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy", "bbox": {"l": 148.71199024396506, "t": 382.7981521135935, "r": 477.47787078331226, "b": 391.6449221624403, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam", "bbox": {"l": 133.76799021944913, "t": 394.75314217960215, "r": 477.4786107833135, "b": 403.599912228449, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita", "bbox": {"l": 133.76799021944913, "t": 406.70813224561084, "r": 477.4756507833086, "b": 415.55490229445763, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem", "bbox": {"l": 133.76799021944913, "t": 418.6631123116194, "r": 477.4755607833085, "b": 427.50988236046624, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod", "bbox": {"l": 133.76799021944913, "t": 430.618102377628, "r": 477.4816907833186, "b": 439.4648724264749, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At", "bbox": {"l": 133.76799021944913, "t": 442.5740924436422, "r": 477.48062078331674, "b": 451.42086249248905, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren,", "bbox": {"l": 133.76799021944913, "t": 454.5290825096509, "r": 477.48166078331843, "b": 463.3758525584977, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor", "bbox": {"l": 133.76799021944913, "t": 466.4840725756595, "r": 477.47772078331195, "b": 475.3308426245064, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt", "bbox": {"l": 133.76799021944913, "t": 478.43905264166807, "r": 477.47968078331525, "b": 487.285822690515, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et", "bbox": {"l": 133.76799021944913, "t": 490.39404270767676, "r": 477.47473078330717, "b": 499.2408127565236, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea", "bbox": {"l": 133.76799021944913, "t": 502.34902277368536, "r": 477.4756507833086, "b": 511.1958028225323, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "takimata sanctus est Lorem ipsum dolor sit amet.", "bbox": {"l": 133.76799021944913, "t": 514.3050228396996, "r": 351.48471057661794, "b": 523.1517928885464, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie", "bbox": {"l": 148.71199024396506, "t": 526.2600129057082, "r": 477.47479078330724, "b": 535.1067829545551, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et", "bbox": {"l": 133.76799021944913, "t": 538.2149929717168, "r": 477.48163078331845, "b": 547.0617630205636, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore", "bbox": {"l": 133.76799021944913, "t": 550.1699830377255, "r": 477.47864078331355, "b": 559.0167530865724, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "te feugait nulla facilisi. Lorem ipsum dolor sit amet, consectetuer adipiscing elit,", "bbox": {"l": 133.76799021944913, "t": 562.1249631037342, "r": 477.48071078331697, "b": 570.971743152581, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "sed diam nonummy nibh euismod tincidunt ut laoreet dolore magna aliquam erat", "bbox": {"l": 133.76799021944913, "t": 574.0799531697428, "r": 477.48370078332186, "b": 582.9267232185896, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "volutpat.", "bbox": {"l": 133.76799021944913, "t": 586.0359332357568, "r": 173.06447028391582, "b": 594.8827232846038, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie", "bbox": {"l": 148.71199024396506, "t": 597.9909333017656, "r": 477.47479078330724, "b": 606.8377233506126, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et", "bbox": {"l": 133.76799021944913, "t": 609.9459333677743, "r": 477.48163078331845, "b": 618.7927234166212, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore", "bbox": {"l": 133.76799021944913, "t": 621.900943433783, "r": 477.47864078331355, "b": 630.7477234826299, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "te feugait nulla facilisi. Lorem ipsum dolor sit amet, consectetuer adipiscing elit,", "bbox": {"l": 133.76799021944913, "t": 633.8559434997917, "r": 477.48071078331697, "b": 642.7027235486387, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "sed diam nonummy nibh euismod tincidunt ut laoreet dolore magna aliquam erat", "bbox": {"l": 133.76799021944913, "t": 645.8119335658059, "r": 477.48370078332186, "b": 654.6587236146529, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "volutpat.", "bbox": {"l": 133.76799021944913, "t": 657.7669336318146, "r": 173.06447028391582, "b": 666.6137236806616, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "1", "bbox": {"l": 303.13300049729594, "t": 695.7219338413805, "r": 308.1142905054678, "b": 704.5687238902275, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 5, "label": "section_header", "bbox": {"l": 133.76801021944917, "t": 124.80877068912298, "r": 191.5272403142044, "b": 137.5481507594625, "coord_origin": "TOPLEFT"}, "confidence": 0.950506865978241, "cells": [{"id": 0, "text": "Formula", "bbox": {"l": 133.76801021944917, "t": 124.80877068912298, "r": 191.5272403142044, "b": 137.5481507594625, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 133.76801021944917, "t": 149.67193082640324, "r": 477.48276078332026, "b": 290.0258716013577, "coord_origin": "TOPLEFT"}, "confidence": 0.9877254366874695, "cells": [{"id": 1, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eir-", "bbox": {"l": 133.76801021944917, "t": 149.67193082640324, "r": 477.47971078331534, "b": 158.5187308752503, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "mod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam volup-", "bbox": {"l": 133.76801021944917, "t": 161.62695089241197, "r": 477.4806507833169, "b": 170.47375094125903, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "tua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd", "bbox": {"l": 133.76801021944917, "t": 173.5819709584208, "r": 477.4757107833087, "b": 182.42877100726787, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ip-", "bbox": {"l": 133.76801021944917, "t": 185.53698102442956, "r": 477.47467078330703, "b": 194.38378107327662, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "sum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor", "bbox": {"l": 133.76801021944917, "t": 197.4929810904439, "r": 477.4766807833103, "b": 206.33978113929084, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero", "bbox": {"l": 133.76801021944917, "t": 209.44799115645253, "r": 477.48068078331687, "b": 218.29480120529956, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "eos et accusam et justo duo dolores et ea rebum.", "bbox": {"l": 133.76801021944917, "t": 221.40301122246137, "r": 355.2087405827272, "b": 230.24981127130832, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Stet clita kasd gubergren,", "bbox": {"l": 362.6009805948544, "t": 221.40301122246137, "r": 477.48276078332026, "b": 230.24981127130832, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor", "bbox": {"l": 133.76801021944917, "t": 233.35803128847022, "r": 477.47772078331195, "b": 242.20483133731727, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt", "bbox": {"l": 133.76801021944917, "t": 245.31304135447897, "r": 477.47971078331534, "b": 254.159851403326, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et", "bbox": {"l": 133.76801021944917, "t": 257.2680614204878, "r": 477.47473078330717, "b": 266.11486146933476, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea", "bbox": {"l": 133.76801021944917, "t": 269.22406148650214, "r": 477.4757107833087, "b": 278.07086153534897, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "takimata sanctus est Lorem ipsum dolor sit amet.", "bbox": {"l": 133.76801021944917, "t": 281.17907155251066, "r": 351.48471057661794, "b": 290.0258716013577, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 133.76801021944917, "t": 293.1340916185196, "r": 477.48163078331845, "b": 349.801911931407, "coord_origin": "TOPLEFT"}, "confidence": 0.9853153228759766, "cells": [{"id": 14, "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie", "bbox": {"l": 148.71201024396512, "t": 293.1340916185196, "r": 477.47479078330724, "b": 301.98089166736656, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et", "bbox": {"l": 133.76801021944917, "t": 305.08911168452846, "r": 477.48163078331845, "b": 313.9359117333753, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore", "bbox": {"l": 133.76801021944917, "t": 317.0441217505371, "r": 477.47867078331365, "b": 325.89093179938413, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "te feugait nulla facilisi. Lorem ipsum dolor sit amet, consectetuer adipiscing elit,", "bbox": {"l": 133.76801021944917, "t": 328.99914181654606, "r": 477.48071078331697, "b": 337.8459118653928, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "sed diam nonummy nibh euismod tincidunt.", "bbox": {"l": 133.76801021944917, "t": 340.9551318825601, "r": 326.21555053516335, "b": 349.801911931407, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "formula", "bbox": {"l": 280.5540204602546, "t": 362.82534200331503, "r": 330.6965605425145, "b": 373.7119120634245, "coord_origin": "TOPLEFT"}, "confidence": 0.8727474808692932, "cells": [{"id": 19, "text": "a", "bbox": {"l": 280.5540204602546, "t": 364.8651420145776, "r": 285.820250468894, "b": 373.7119120634245, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "2", "bbox": {"l": 285.8200104688936, "t": 362.82534200331503, "r": 289.7916004754091, "b": 369.0180620375076, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "+ 8 = 12", "bbox": {"l": 292.50400047985886, "t": 364.8651420145776, "r": 330.6965605425145, "b": 373.7119120634245, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 133.76799021944913, "t": 382.7981521135935, "r": 477.4816907833186, "b": 523.1517928885464, "coord_origin": "TOPLEFT"}, "confidence": 0.9879696369171143, "cells": [{"id": 22, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy", "bbox": {"l": 148.71199024396506, "t": 382.7981521135935, "r": 477.47787078331226, "b": 391.6449221624403, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam", "bbox": {"l": 133.76799021944913, "t": 394.75314217960215, "r": 477.4786107833135, "b": 403.599912228449, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita", "bbox": {"l": 133.76799021944913, "t": 406.70813224561084, "r": 477.4756507833086, "b": 415.55490229445763, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem", "bbox": {"l": 133.76799021944913, "t": 418.6631123116194, "r": 477.4755607833085, "b": 427.50988236046624, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod", "bbox": {"l": 133.76799021944913, "t": 430.618102377628, "r": 477.4816907833186, "b": 439.4648724264749, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At", "bbox": {"l": 133.76799021944913, "t": 442.5740924436422, "r": 477.48062078331674, "b": 451.42086249248905, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren,", "bbox": {"l": 133.76799021944913, "t": 454.5290825096509, "r": 477.48166078331843, "b": 463.3758525584977, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor", "bbox": {"l": 133.76799021944913, "t": 466.4840725756595, "r": 477.47772078331195, "b": 475.3308426245064, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt", "bbox": {"l": 133.76799021944913, "t": 478.43905264166807, "r": 477.47968078331525, "b": 487.285822690515, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et", "bbox": {"l": 133.76799021944913, "t": 490.39404270767676, "r": 477.47473078330717, "b": 499.2408127565236, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea", "bbox": {"l": 133.76799021944913, "t": 502.34902277368536, "r": 477.4756507833086, "b": 511.1958028225323, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "takimata sanctus est Lorem ipsum dolor sit amet.", "bbox": {"l": 133.76799021944913, "t": 514.3050228396996, "r": 351.48471057661794, "b": 523.1517928885464, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "text", "bbox": {"l": 133.76799021944913, "t": 526.2600129057082, "r": 477.48370078332186, "b": 594.8827232846038, "coord_origin": "TOPLEFT"}, "confidence": 0.9845718145370483, "cells": [{"id": 34, "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie", "bbox": {"l": 148.71199024396506, "t": 526.2600129057082, "r": 477.47479078330724, "b": 535.1067829545551, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et", "bbox": {"l": 133.76799021944913, "t": 538.2149929717168, "r": 477.48163078331845, "b": 547.0617630205636, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore", "bbox": {"l": 133.76799021944913, "t": 550.1699830377255, "r": 477.47864078331355, "b": 559.0167530865724, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "te feugait nulla facilisi. Lorem ipsum dolor sit amet, consectetuer adipiscing elit,", "bbox": {"l": 133.76799021944913, "t": 562.1249631037342, "r": 477.48071078331697, "b": 570.971743152581, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "sed diam nonummy nibh euismod tincidunt ut laoreet dolore magna aliquam erat", "bbox": {"l": 133.76799021944913, "t": 574.0799531697428, "r": 477.48370078332186, "b": 582.9267232185896, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "volutpat.", "bbox": {"l": 133.76799021944913, "t": 586.0359332357568, "r": 173.06447028391582, "b": 594.8827232846038, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 133.76799021944913, "t": 597.9909333017656, "r": 477.48370078332186, "b": 666.6137236806616, "coord_origin": "TOPLEFT"}, "confidence": 0.98720782995224, "cells": [{"id": 40, "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie", "bbox": {"l": 148.71199024396506, "t": 597.9909333017656, "r": 477.47479078330724, "b": 606.8377233506126, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et", "bbox": {"l": 133.76799021944913, "t": 609.9459333677743, "r": 477.48163078331845, "b": 618.7927234166212, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore", "bbox": {"l": 133.76799021944913, "t": 621.900943433783, "r": 477.47864078331355, "b": 630.7477234826299, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "te feugait nulla facilisi. Lorem ipsum dolor sit amet, consectetuer adipiscing elit,", "bbox": {"l": 133.76799021944913, "t": 633.8559434997917, "r": 477.48071078331697, "b": 642.7027235486387, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "sed diam nonummy nibh euismod tincidunt ut laoreet dolore magna aliquam erat", "bbox": {"l": 133.76799021944913, "t": 645.8119335658059, "r": 477.48370078332186, "b": 654.6587236146529, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "volutpat.", "bbox": {"l": 133.76799021944913, "t": 657.7669336318146, "r": 173.06447028391582, "b": 666.6137236806616, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "page_footer", "bbox": {"l": 303.13300049729594, "t": 695.7219338413805, "r": 308.1142905054678, "b": 704.5687238902275, "coord_origin": "TOPLEFT"}, "confidence": 0.8504500389099121, "cells": [{"id": 46, "text": "1", "bbox": {"l": 303.13300049729594, "t": 695.7219338413805, "r": 308.1142905054678, "b": 704.5687238902275, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "section_header", "id": 5, "page_no": 1, "cluster": {"id": 5, "label": "section_header", "bbox": {"l": 133.76801021944917, "t": 124.80877068912298, "r": 191.5272403142044, "b": 137.5481507594625, "coord_origin": "TOPLEFT"}, "confidence": 0.950506865978241, "cells": [{"id": 0, "text": "Formula", "bbox": {"l": 133.76801021944917, "t": 124.80877068912298, "r": 191.5272403142044, "b": 137.5481507594625, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Formula"}, {"label": "text", "id": 1, "page_no": 1, "cluster": {"id": 1, "label": "text", "bbox": {"l": 133.76801021944917, "t": 149.67193082640324, "r": 477.48276078332026, "b": 290.0258716013577, "coord_origin": "TOPLEFT"}, "confidence": 0.9877254366874695, "cells": [{"id": 1, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eir-", "bbox": {"l": 133.76801021944917, "t": 149.67193082640324, "r": 477.47971078331534, "b": 158.5187308752503, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "mod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam volup-", "bbox": {"l": 133.76801021944917, "t": 161.62695089241197, "r": 477.4806507833169, "b": 170.47375094125903, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "tua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd", "bbox": {"l": 133.76801021944917, "t": 173.5819709584208, "r": 477.4757107833087, "b": 182.42877100726787, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ip-", "bbox": {"l": 133.76801021944917, "t": 185.53698102442956, "r": 477.47467078330703, "b": 194.38378107327662, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "sum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor", "bbox": {"l": 133.76801021944917, "t": 197.4929810904439, "r": 477.4766807833103, "b": 206.33978113929084, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero", "bbox": {"l": 133.76801021944917, "t": 209.44799115645253, "r": 477.48068078331687, "b": 218.29480120529956, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "eos et accusam et justo duo dolores et ea rebum.", "bbox": {"l": 133.76801021944917, "t": 221.40301122246137, "r": 355.2087405827272, "b": 230.24981127130832, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Stet clita kasd gubergren,", "bbox": {"l": 362.6009805948544, "t": 221.40301122246137, "r": 477.48276078332026, "b": 230.24981127130832, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor", "bbox": {"l": 133.76801021944917, "t": 233.35803128847022, "r": 477.47772078331195, "b": 242.20483133731727, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt", "bbox": {"l": 133.76801021944917, "t": 245.31304135447897, "r": 477.47971078331534, "b": 254.159851403326, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et", "bbox": {"l": 133.76801021944917, "t": 257.2680614204878, "r": 477.47473078330717, "b": 266.11486146933476, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea", "bbox": {"l": 133.76801021944917, "t": 269.22406148650214, "r": 477.4757107833087, "b": 278.07086153534897, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "takimata sanctus est Lorem ipsum dolor sit amet.", "bbox": {"l": 133.76801021944917, "t": 281.17907155251066, "r": 351.48471057661794, "b": 290.0258716013577, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet."}, {"label": "text", "id": 3, "page_no": 1, "cluster": {"id": 3, "label": "text", "bbox": {"l": 133.76801021944917, "t": 293.1340916185196, "r": 477.48163078331845, "b": 349.801911931407, "coord_origin": "TOPLEFT"}, "confidence": 0.9853153228759766, "cells": [{"id": 14, "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie", "bbox": {"l": 148.71201024396512, "t": 293.1340916185196, "r": 477.47479078330724, "b": 301.98089166736656, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et", "bbox": {"l": 133.76801021944917, "t": 305.08911168452846, "r": 477.48163078331845, "b": 313.9359117333753, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore", "bbox": {"l": 133.76801021944917, "t": 317.0441217505371, "r": 477.47867078331365, "b": 325.89093179938413, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "te feugait nulla facilisi. Lorem ipsum dolor sit amet, consectetuer adipiscing elit,", "bbox": {"l": 133.76801021944917, "t": 328.99914181654606, "r": 477.48071078331697, "b": 337.8459118653928, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "sed diam nonummy nibh euismod tincidunt.", "bbox": {"l": 133.76801021944917, "t": 340.9551318825601, "r": 326.21555053516335, "b": 349.801911931407, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore te feugait nulla facilisi. Lorem ipsum dolor sit amet, consectetuer adipiscing elit, sed diam nonummy nibh euismod tincidunt."}, {"label": "formula", "id": 6, "page_no": 1, "cluster": {"id": 6, "label": "formula", "bbox": {"l": 280.5540204602546, "t": 362.82534200331503, "r": 330.6965605425145, "b": 373.7119120634245, "coord_origin": "TOPLEFT"}, "confidence": 0.8727474808692932, "cells": [{"id": 19, "text": "a", "bbox": {"l": 280.5540204602546, "t": 364.8651420145776, "r": 285.820250468894, "b": 373.7119120634245, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "2", "bbox": {"l": 285.8200104688936, "t": 362.82534200331503, "r": 289.7916004754091, "b": 369.0180620375076, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "+ 8 = 12", "bbox": {"l": 292.50400047985886, "t": 364.8651420145776, "r": 330.6965605425145, "b": 373.7119120634245, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "a 2 + 8 = 12"}, {"label": "text", "id": 0, "page_no": 1, "cluster": {"id": 0, "label": "text", "bbox": {"l": 133.76799021944913, "t": 382.7981521135935, "r": 477.4816907833186, "b": 523.1517928885464, "coord_origin": "TOPLEFT"}, "confidence": 0.9879696369171143, "cells": [{"id": 22, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy", "bbox": {"l": 148.71199024396506, "t": 382.7981521135935, "r": 477.47787078331226, "b": 391.6449221624403, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam", "bbox": {"l": 133.76799021944913, "t": 394.75314217960215, "r": 477.4786107833135, "b": 403.599912228449, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita", "bbox": {"l": 133.76799021944913, "t": 406.70813224561084, "r": 477.4756507833086, "b": 415.55490229445763, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem", "bbox": {"l": 133.76799021944913, "t": 418.6631123116194, "r": 477.4755607833085, "b": 427.50988236046624, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod", "bbox": {"l": 133.76799021944913, "t": 430.618102377628, "r": 477.4816907833186, "b": 439.4648724264749, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At", "bbox": {"l": 133.76799021944913, "t": 442.5740924436422, "r": 477.48062078331674, "b": 451.42086249248905, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren,", "bbox": {"l": 133.76799021944913, "t": 454.5290825096509, "r": 477.48166078331843, "b": 463.3758525584977, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor", "bbox": {"l": 133.76799021944913, "t": 466.4840725756595, "r": 477.47772078331195, "b": 475.3308426245064, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt", "bbox": {"l": 133.76799021944913, "t": 478.43905264166807, "r": 477.47968078331525, "b": 487.285822690515, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et", "bbox": {"l": 133.76799021944913, "t": 490.39404270767676, "r": 477.47473078330717, "b": 499.2408127565236, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea", "bbox": {"l": 133.76799021944913, "t": 502.34902277368536, "r": 477.4756507833086, "b": 511.1958028225323, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "takimata sanctus est Lorem ipsum dolor sit amet.", "bbox": {"l": 133.76799021944913, "t": 514.3050228396996, "r": 351.48471057661794, "b": 523.1517928885464, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet."}, {"label": "text", "id": 4, "page_no": 1, "cluster": {"id": 4, "label": "text", "bbox": {"l": 133.76799021944913, "t": 526.2600129057082, "r": 477.48370078332186, "b": 594.8827232846038, "coord_origin": "TOPLEFT"}, "confidence": 0.9845718145370483, "cells": [{"id": 34, "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie", "bbox": {"l": 148.71199024396506, "t": 526.2600129057082, "r": 477.47479078330724, "b": 535.1067829545551, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et", "bbox": {"l": 133.76799021944913, "t": 538.2149929717168, "r": 477.48163078331845, "b": 547.0617630205636, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore", "bbox": {"l": 133.76799021944913, "t": 550.1699830377255, "r": 477.47864078331355, "b": 559.0167530865724, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "te feugait nulla facilisi. Lorem ipsum dolor sit amet, consectetuer adipiscing elit,", "bbox": {"l": 133.76799021944913, "t": 562.1249631037342, "r": 477.48071078331697, "b": 570.971743152581, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "sed diam nonummy nibh euismod tincidunt ut laoreet dolore magna aliquam erat", "bbox": {"l": 133.76799021944913, "t": 574.0799531697428, "r": 477.48370078332186, "b": 582.9267232185896, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "volutpat.", "bbox": {"l": 133.76799021944913, "t": 586.0359332357568, "r": 173.06447028391582, "b": 594.8827232846038, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore te feugait nulla facilisi. Lorem ipsum dolor sit amet, consectetuer adipiscing elit, sed diam nonummy nibh euismod tincidunt ut laoreet dolore magna aliquam erat volutpat."}, {"label": "text", "id": 2, "page_no": 1, "cluster": {"id": 2, "label": "text", "bbox": {"l": 133.76799021944913, "t": 597.9909333017656, "r": 477.48370078332186, "b": 666.6137236806616, "coord_origin": "TOPLEFT"}, "confidence": 0.98720782995224, "cells": [{"id": 40, "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie", "bbox": {"l": 148.71199024396506, "t": 597.9909333017656, "r": 477.47479078330724, "b": 606.8377233506126, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et", "bbox": {"l": 133.76799021944913, "t": 609.9459333677743, "r": 477.48163078331845, "b": 618.7927234166212, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore", "bbox": {"l": 133.76799021944913, "t": 621.900943433783, "r": 477.47864078331355, "b": 630.7477234826299, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "te feugait nulla facilisi. Lorem ipsum dolor sit amet, consectetuer adipiscing elit,", "bbox": {"l": 133.76799021944913, "t": 633.8559434997917, "r": 477.48071078331697, "b": 642.7027235486387, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "sed diam nonummy nibh euismod tincidunt ut laoreet dolore magna aliquam erat", "bbox": {"l": 133.76799021944913, "t": 645.8119335658059, "r": 477.48370078332186, "b": 654.6587236146529, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "volutpat.", "bbox": {"l": 133.76799021944913, "t": 657.7669336318146, "r": 173.06447028391582, "b": 666.6137236806616, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore te feugait nulla facilisi. Lorem ipsum dolor sit amet, consectetuer adipiscing elit, sed diam nonummy nibh euismod tincidunt ut laoreet dolore magna aliquam erat volutpat."}, {"label": "page_footer", "id": 7, "page_no": 1, "cluster": {"id": 7, "label": "page_footer", "bbox": {"l": 303.13300049729594, "t": 695.7219338413805, "r": 308.1142905054678, "b": 704.5687238902275, "coord_origin": "TOPLEFT"}, "confidence": 0.8504500389099121, "cells": [{"id": 46, "text": "1", "bbox": {"l": 303.13300049729594, "t": 695.7219338413805, "r": 308.1142905054678, "b": 704.5687238902275, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1"}], "body": [{"label": "section_header", "id": 5, "page_no": 1, "cluster": {"id": 5, "label": "section_header", "bbox": {"l": 133.76801021944917, "t": 124.80877068912298, "r": 191.5272403142044, "b": 137.5481507594625, "coord_origin": "TOPLEFT"}, "confidence": 0.950506865978241, "cells": [{"id": 0, "text": "Formula", "bbox": {"l": 133.76801021944917, "t": 124.80877068912298, "r": 191.5272403142044, "b": 137.5481507594625, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Formula"}, {"label": "text", "id": 1, "page_no": 1, "cluster": {"id": 1, "label": "text", "bbox": {"l": 133.76801021944917, "t": 149.67193082640324, "r": 477.48276078332026, "b": 290.0258716013577, "coord_origin": "TOPLEFT"}, "confidence": 0.9877254366874695, "cells": [{"id": 1, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eir-", "bbox": {"l": 133.76801021944917, "t": 149.67193082640324, "r": 477.47971078331534, "b": 158.5187308752503, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "mod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam volup-", "bbox": {"l": 133.76801021944917, "t": 161.62695089241197, "r": 477.4806507833169, "b": 170.47375094125903, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "tua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd", "bbox": {"l": 133.76801021944917, "t": 173.5819709584208, "r": 477.4757107833087, "b": 182.42877100726787, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ip-", "bbox": {"l": 133.76801021944917, "t": 185.53698102442956, "r": 477.47467078330703, "b": 194.38378107327662, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "sum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor", "bbox": {"l": 133.76801021944917, "t": 197.4929810904439, "r": 477.4766807833103, "b": 206.33978113929084, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero", "bbox": {"l": 133.76801021944917, "t": 209.44799115645253, "r": 477.48068078331687, "b": 218.29480120529956, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "eos et accusam et justo duo dolores et ea rebum.", "bbox": {"l": 133.76801021944917, "t": 221.40301122246137, "r": 355.2087405827272, "b": 230.24981127130832, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Stet clita kasd gubergren,", "bbox": {"l": 362.6009805948544, "t": 221.40301122246137, "r": 477.48276078332026, "b": 230.24981127130832, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor", "bbox": {"l": 133.76801021944917, "t": 233.35803128847022, "r": 477.47772078331195, "b": 242.20483133731727, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt", "bbox": {"l": 133.76801021944917, "t": 245.31304135447897, "r": 477.47971078331534, "b": 254.159851403326, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et", "bbox": {"l": 133.76801021944917, "t": 257.2680614204878, "r": 477.47473078330717, "b": 266.11486146933476, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea", "bbox": {"l": 133.76801021944917, "t": 269.22406148650214, "r": 477.4757107833087, "b": 278.07086153534897, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "takimata sanctus est Lorem ipsum dolor sit amet.", "bbox": {"l": 133.76801021944917, "t": 281.17907155251066, "r": 351.48471057661794, "b": 290.0258716013577, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet."}, {"label": "text", "id": 3, "page_no": 1, "cluster": {"id": 3, "label": "text", "bbox": {"l": 133.76801021944917, "t": 293.1340916185196, "r": 477.48163078331845, "b": 349.801911931407, "coord_origin": "TOPLEFT"}, "confidence": 0.9853153228759766, "cells": [{"id": 14, "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie", "bbox": {"l": 148.71201024396512, "t": 293.1340916185196, "r": 477.47479078330724, "b": 301.98089166736656, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et", "bbox": {"l": 133.76801021944917, "t": 305.08911168452846, "r": 477.48163078331845, "b": 313.9359117333753, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore", "bbox": {"l": 133.76801021944917, "t": 317.0441217505371, "r": 477.47867078331365, "b": 325.89093179938413, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "te feugait nulla facilisi. Lorem ipsum dolor sit amet, consectetuer adipiscing elit,", "bbox": {"l": 133.76801021944917, "t": 328.99914181654606, "r": 477.48071078331697, "b": 337.8459118653928, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "sed diam nonummy nibh euismod tincidunt.", "bbox": {"l": 133.76801021944917, "t": 340.9551318825601, "r": 326.21555053516335, "b": 349.801911931407, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore te feugait nulla facilisi. Lorem ipsum dolor sit amet, consectetuer adipiscing elit, sed diam nonummy nibh euismod tincidunt."}, {"label": "formula", "id": 6, "page_no": 1, "cluster": {"id": 6, "label": "formula", "bbox": {"l": 280.5540204602546, "t": 362.82534200331503, "r": 330.6965605425145, "b": 373.7119120634245, "coord_origin": "TOPLEFT"}, "confidence": 0.8727474808692932, "cells": [{"id": 19, "text": "a", "bbox": {"l": 280.5540204602546, "t": 364.8651420145776, "r": 285.820250468894, "b": 373.7119120634245, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "2", "bbox": {"l": 285.8200104688936, "t": 362.82534200331503, "r": 289.7916004754091, "b": 369.0180620375076, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "+ 8 = 12", "bbox": {"l": 292.50400047985886, "t": 364.8651420145776, "r": 330.6965605425145, "b": 373.7119120634245, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "a 2 + 8 = 12"}, {"label": "text", "id": 0, "page_no": 1, "cluster": {"id": 0, "label": "text", "bbox": {"l": 133.76799021944913, "t": 382.7981521135935, "r": 477.4816907833186, "b": 523.1517928885464, "coord_origin": "TOPLEFT"}, "confidence": 0.9879696369171143, "cells": [{"id": 22, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy", "bbox": {"l": 148.71199024396506, "t": 382.7981521135935, "r": 477.47787078331226, "b": 391.6449221624403, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam", "bbox": {"l": 133.76799021944913, "t": 394.75314217960215, "r": 477.4786107833135, "b": 403.599912228449, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita", "bbox": {"l": 133.76799021944913, "t": 406.70813224561084, "r": 477.4756507833086, "b": 415.55490229445763, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem", "bbox": {"l": 133.76799021944913, "t": 418.6631123116194, "r": 477.4755607833085, "b": 427.50988236046624, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod", "bbox": {"l": 133.76799021944913, "t": 430.618102377628, "r": 477.4816907833186, "b": 439.4648724264749, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At", "bbox": {"l": 133.76799021944913, "t": 442.5740924436422, "r": 477.48062078331674, "b": 451.42086249248905, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren,", "bbox": {"l": 133.76799021944913, "t": 454.5290825096509, "r": 477.48166078331843, "b": 463.3758525584977, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor", "bbox": {"l": 133.76799021944913, "t": 466.4840725756595, "r": 477.47772078331195, "b": 475.3308426245064, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt", "bbox": {"l": 133.76799021944913, "t": 478.43905264166807, "r": 477.47968078331525, "b": 487.285822690515, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et", "bbox": {"l": 133.76799021944913, "t": 490.39404270767676, "r": 477.47473078330717, "b": 499.2408127565236, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea", "bbox": {"l": 133.76799021944913, "t": 502.34902277368536, "r": 477.4756507833086, "b": 511.1958028225323, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "takimata sanctus est Lorem ipsum dolor sit amet.", "bbox": {"l": 133.76799021944913, "t": 514.3050228396996, "r": 351.48471057661794, "b": 523.1517928885464, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet."}, {"label": "text", "id": 4, "page_no": 1, "cluster": {"id": 4, "label": "text", "bbox": {"l": 133.76799021944913, "t": 526.2600129057082, "r": 477.48370078332186, "b": 594.8827232846038, "coord_origin": "TOPLEFT"}, "confidence": 0.9845718145370483, "cells": [{"id": 34, "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie", "bbox": {"l": 148.71199024396506, "t": 526.2600129057082, "r": 477.47479078330724, "b": 535.1067829545551, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et", "bbox": {"l": 133.76799021944913, "t": 538.2149929717168, "r": 477.48163078331845, "b": 547.0617630205636, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore", "bbox": {"l": 133.76799021944913, "t": 550.1699830377255, "r": 477.47864078331355, "b": 559.0167530865724, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "te feugait nulla facilisi. Lorem ipsum dolor sit amet, consectetuer adipiscing elit,", "bbox": {"l": 133.76799021944913, "t": 562.1249631037342, "r": 477.48071078331697, "b": 570.971743152581, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "sed diam nonummy nibh euismod tincidunt ut laoreet dolore magna aliquam erat", "bbox": {"l": 133.76799021944913, "t": 574.0799531697428, "r": 477.48370078332186, "b": 582.9267232185896, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "volutpat.", "bbox": {"l": 133.76799021944913, "t": 586.0359332357568, "r": 173.06447028391582, "b": 594.8827232846038, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore te feugait nulla facilisi. Lorem ipsum dolor sit amet, consectetuer adipiscing elit, sed diam nonummy nibh euismod tincidunt ut laoreet dolore magna aliquam erat volutpat."}, {"label": "text", "id": 2, "page_no": 1, "cluster": {"id": 2, "label": "text", "bbox": {"l": 133.76799021944913, "t": 597.9909333017656, "r": 477.48370078332186, "b": 666.6137236806616, "coord_origin": "TOPLEFT"}, "confidence": 0.98720782995224, "cells": [{"id": 40, "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie", "bbox": {"l": 148.71199024396506, "t": 597.9909333017656, "r": 477.47479078330724, "b": 606.8377233506126, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et", "bbox": {"l": 133.76799021944913, "t": 609.9459333677743, "r": 477.48163078331845, "b": 618.7927234166212, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore", "bbox": {"l": 133.76799021944913, "t": 621.900943433783, "r": 477.47864078331355, "b": 630.7477234826299, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "te feugait nulla facilisi. Lorem ipsum dolor sit amet, consectetuer adipiscing elit,", "bbox": {"l": 133.76799021944913, "t": 633.8559434997917, "r": 477.48071078331697, "b": 642.7027235486387, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "sed diam nonummy nibh euismod tincidunt ut laoreet dolore magna aliquam erat", "bbox": {"l": 133.76799021944913, "t": 645.8119335658059, "r": 477.48370078332186, "b": 654.6587236146529, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "volutpat.", "bbox": {"l": 133.76799021944913, "t": 657.7669336318146, "r": 173.06447028391582, "b": 666.6137236806616, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore te feugait nulla facilisi. Lorem ipsum dolor sit amet, consectetuer adipiscing elit, sed diam nonummy nibh euismod tincidunt ut laoreet dolore magna aliquam erat volutpat."}], "headers": [{"label": "page_footer", "id": 7, "page_no": 1, "cluster": {"id": 7, "label": "page_footer", "bbox": {"l": 303.13300049729594, "t": 695.7219338413805, "r": 308.1142905054678, "b": 704.5687238902275, "coord_origin": "TOPLEFT"}, "confidence": 0.8504500389099121, "cells": [{"id": 46, "text": "1", "bbox": {"l": 303.13300049729594, "t": 695.7219338413805, "r": 308.1142905054678, "b": 704.5687238902275, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1"}]}}]
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v1/picture_classification.doctags.txt b/tests/data/groundtruth/docling_v1/picture_classification.doctags.txt
index cbcde73f..f6ac7324 100644
--- a/tests/data/groundtruth/docling_v1/picture_classification.doctags.txt
+++ b/tests/data/groundtruth/docling_v1/picture_classification.doctags.txt
@@ -1,14 +1,12 @@
 <document>
 <subtitle-level-1><location><page_1><loc_22><loc_83><loc_41><loc_84></location>Figures Example</subtitle-level-1>
 <paragraph><location><page_1><loc_22><loc_63><loc_78><loc_81></location>Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet.</paragraph>
-<caption><location><page_1><loc_37><loc_32><loc_63><loc_33></location>Figure 1: This is an example image.</caption>
 <figure>
 <location><page_1><loc_22><loc_36><loc_78><loc_62></location>
 <caption>Figure 1: This is an example image.</caption>
 </figure>
 <paragraph><location><page_1><loc_22><loc_15><loc_78><loc_30></location>Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua.</paragraph>
 <paragraph><location><page_2><loc_22><loc_66><loc_78><loc_84></location>Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet.</paragraph>
-<caption><location><page_2><loc_37><loc_33><loc_63><loc_34></location>Figure 2: This is an example image.</caption>
 <figure>
 <location><page_2><loc_36><loc_36><loc_64><loc_65></location>
 <caption>Figure 2: This is an example image.</caption>
diff --git a/tests/data/groundtruth/docling_v1/picture_classification.json b/tests/data/groundtruth/docling_v1/picture_classification.json
index ad1bc5c2..89b2fc89 100644
--- a/tests/data/groundtruth/docling_v1/picture_classification.json
+++ b/tests/data/groundtruth/docling_v1/picture_classification.json
@@ -1 +1 @@
-{"_name": "", "type": "pdf-document", "description": {"title": null, "abstract": null, "authors": null, "affiliations": null, "subjects": null, "keywords": null, "publication_date": null, "languages": null, "license": null, "publishers": null, "url_refs": null, "references": null, "publication": null, "reference_count": null, "citation_count": null, "citation_date": null, "advanced": null, "analytics": null, "logs": [], "collection": null, "acquisition": null}, "file-info": {"filename": "picture_classification.pdf", "filename-prov": null, "document-hash": "959854dff729acaa22404d629a45cefcad8d942e595961185fc03a80d9fcc3a1", "#-pages": 2, "collection-name": null, "description": null, "page-hashes": [{"hash": "d9e3fc1226356b30c66012f05ad14089b00c59ea129195cd6ff8a0c68bda6f39", "model": "default", "page": 1}, {"hash": "9386884e13a97ce9662210a7e4258bbbb4f2e0e00663636160918e55b2806575", "model": "default", "page": 2}]}, "main-text": [{"prov": [{"bbox": [133.76800537109375, 654.4518432617188, 252.35513305664062, 667.1912231445312], "page": 1, "span": [0, 15], "__ref_s3_data": null}], "text": "Figures Example", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [133.76800537109375, 501.97412109375, 477.4827575683594, 642.3280639648438], "page": 1, "span": [0, 887], "__ref_s3_data": null}], "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [226.89100646972656, 254.0182647705078, 384.35479736328125, 262.86505126953125], "page": 1, "span": [0, 35], "__ref_s3_data": null}], "text": "Figure 1: This is an example image.", "type": "caption", "payload": null, "name": "Caption", "font": null}, {"name": "Picture", "type": "figure", "$ref": "#/figures/0"}, {"prov": [{"bbox": [133.76800537109375, 122.51225280761719, 477.4817199707031, 238.95504760742188], "page": 1, "span": [0, 747], "__ref_s3_data": null}], "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [303.13299560546875, 87.43224334716797, 308.1142883300781, 96.27903747558594], "page": 1, "span": [0, 1], "__ref_s3_data": null}], "text": "1", "type": "page-footer", "payload": null, "name": "Page-footer", "font": null}, {"prov": [{"bbox": [133.76800537109375, 523.7951049804688, 477.4817199707031, 664.1490478515625], "page": 2, "span": [0, 887], "__ref_s3_data": null}], "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [226.89100646972656, 259.9422607421875, 384.35479736328125, 268.7890319824219], "page": 2, "span": [0, 35], "__ref_s3_data": null}], "text": "Figure 2: This is an example image.", "type": "caption", "payload": null, "name": "Caption", "font": null}, {"name": "Picture", "type": "figure", "$ref": "#/figures/1"}, {"prov": [{"bbox": [133.76800537109375, 117.32023620605469, 477.4817199707031, 245.71804809570312], "page": 2, "span": [0, 804], "__ref_s3_data": null}], "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [303.13299560546875, 87.43224334716797, 308.1142883300781, 96.27903747558594], "page": 2, "span": [0, 1], "__ref_s3_data": null}], "text": "2", "type": "page-footer", "payload": null, "name": "Page-footer", "font": null}], "figures": [{"prov": [{"bbox": [134.92005920410156, 281.78173828125, 475.66351318359375, 487.109375], "page": 1, "span": [0, 35], "__ref_s3_data": null}], "text": "Figure 1: This is an example image.", "type": "figure", "payload": null, "bounding-box": null}, {"prov": [{"bbox": [218.8155517578125, 283.10589599609375, 391.96246337890625, 513.984619140625], "page": 2, "span": [0, 35], "__ref_s3_data": null}], "text": "Figure 2: This is an example image.", "type": "figure", "payload": null, "bounding-box": null}], "tables": [], "bitmaps": null, "equations": [], "footnotes": [], "page-dimensions": [{"height": 792.0, "page": 1, "width": 612.0}, {"height": 792.0, "page": 2, "width": 612.0}], "page-footers": [], "page-headers": [], "_s3_data": null, "identifiers": null}
\ No newline at end of file
+{"_name": "", "type": "pdf-document", "description": {"title": null, "abstract": null, "authors": null, "affiliations": null, "subjects": null, "keywords": null, "publication_date": null, "languages": null, "license": null, "publishers": null, "url_refs": null, "references": null, "publication": null, "reference_count": null, "citation_count": null, "citation_date": null, "advanced": null, "analytics": null, "logs": [], "collection": null, "acquisition": null}, "file-info": {"filename": "picture_classification.pdf", "filename-prov": null, "document-hash": "959854dff729acaa22404d629a45cefcad8d942e595961185fc03a80d9fcc3a1", "#-pages": 2, "collection-name": null, "description": null, "page-hashes": [{"hash": "d9e3fc1226356b30c66012f05ad14089b00c59ea129195cd6ff8a0c68bda6f39", "model": "default", "page": 1}, {"hash": "9386884e13a97ce9662210a7e4258bbbb4f2e0e00663636160918e55b2806575", "model": "default", "page": 2}]}, "main-text": [{"prov": [{"bbox": [133.76801, 654.45184, 252.35513, 667.19122], "page": 1, "span": [0, 15], "__ref_s3_data": null}], "text": "Figures Example", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [133.76801, 501.97412, 477.48276, 642.32806], "page": 1, "span": [0, 887], "__ref_s3_data": null}], "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"name": "Picture", "type": "figure", "$ref": "#/figures/0"}, {"prov": [{"bbox": [133.76801, 122.51225, 477.48172000000005, 238.95505000000003], "page": 1, "span": [0, 747], "__ref_s3_data": null}], "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [133.76801, 523.7951, 477.48172000000005, 664.1490499999999], "page": 2, "span": [0, 887], "__ref_s3_data": null}], "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"name": "Picture", "type": "figure", "$ref": "#/figures/1"}, {"prov": [{"bbox": [133.76801, 117.32024000000001, 477.48172000000005, 245.71804999999995], "page": 2, "span": [0, 804], "__ref_s3_data": null}], "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum.", "type": "paragraph", "payload": null, "name": "Text", "font": null}], "figures": [{"prov": [{"bbox": [134.9200439453125, 281.78173828125, 475.6635437011719, 487.109375], "page": 1, "span": [0, 35], "__ref_s3_data": null}], "text": "Figure 1: This is an example image.", "type": "figure", "payload": null, "bounding-box": null}, {"prov": [{"bbox": [218.8155517578125, 283.10589599609375, 391.96246337890625, 513.9846496582031], "page": 2, "span": [0, 35], "__ref_s3_data": null}], "text": "Figure 2: This is an example image.", "type": "figure", "payload": null, "bounding-box": null}], "tables": [], "bitmaps": null, "equations": [], "footnotes": [], "page-dimensions": [{"height": 792.0, "page": 1, "width": 612.0}, {"height": 792.0, "page": 2, "width": 612.0}], "page-footers": [], "page-headers": [], "_s3_data": null, "identifiers": null}
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v1/picture_classification.pages.json b/tests/data/groundtruth/docling_v1/picture_classification.pages.json
index 744f54fb..eb873e97 100644
--- a/tests/data/groundtruth/docling_v1/picture_classification.pages.json
+++ b/tests/data/groundtruth/docling_v1/picture_classification.pages.json
@@ -1 +1 @@
-[{"page_no": 0, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "Figures Example", "bbox": {"l": 133.76801, "t": 124.80877999999996, "r": 252.35513, "b": 137.54816000000005, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eir-", "bbox": {"l": 133.76801, "t": 149.67193999999995, "r": 477.47971, "b": 158.51873999999998, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "mod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam volup-", "bbox": {"l": 133.76801, "t": 161.62694999999997, "r": 477.4806500000001, "b": 170.47375, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "tua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd", "bbox": {"l": 133.76801, "t": 173.58196999999996, "r": 477.47571000000005, "b": 182.42877, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ip-", "bbox": {"l": 133.76801, "t": 185.53698999999995, "r": 477.47466999999995, "b": 194.38378999999998, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "sum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor", "bbox": {"l": 133.76801, "t": 197.49199999999996, "r": 477.47668, "b": 206.33880999999997, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero", "bbox": {"l": 133.76801, "t": 209.44701999999995, "r": 477.48068000000006, "b": 218.29381999999998, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "eos et accusam et justo duo dolores et ea rebum.", "bbox": {"l": 133.76801, "t": 221.40301999999997, "r": 355.20874, "b": 230.24982, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Stet clita kasd gubergren,", "bbox": {"l": 362.60098, "t": 221.40301999999997, "r": 477.48276, "b": 230.24982, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor", "bbox": {"l": 133.76801, "t": 233.35802999999999, "r": 477.47772, "b": 242.20483000000002, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt", "bbox": {"l": 133.76801, "t": 245.31304999999998, "r": 477.47971, "b": 254.15985, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et", "bbox": {"l": 133.76801, "t": 257.26806999999997, "r": 477.47473, "b": 266.11487, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea", "bbox": {"l": 133.76801, "t": 269.22308, "r": 477.47571000000005, "b": 278.06989, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "takimata sanctus est Lorem ipsum dolor sit amet.", "bbox": {"l": 133.76801, "t": 281.17911, "r": 351.48471, "b": 290.02588, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Figure 1: This is an example image.", "bbox": {"l": 226.89101, "t": 529.13495, "r": 384.3548, "b": 537.98174, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy", "bbox": {"l": 148.71201, "t": 553.04495, "r": 477.47786999999994, "b": 561.89174, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam", "bbox": {"l": 133.76801, "t": 564.99995, "r": 477.47860999999995, "b": 573.84674, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita", "bbox": {"l": 133.76801, "t": 576.95496, "r": 477.47571000000005, "b": 585.80174, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem", "bbox": {"l": 133.76801, "t": 588.90996, "r": 477.47559, "b": 597.75674, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod", "bbox": {"l": 133.76801, "t": 600.86595, "r": 477.48169000000007, "b": 609.7127399999999, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At", "bbox": {"l": 133.76801, "t": 612.82095, "r": 477.48062, "b": 621.66774, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren,", "bbox": {"l": 133.76801, "t": 624.7759599999999, "r": 477.48172000000005, "b": 633.62274, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor", "bbox": {"l": 133.76801, "t": 636.73096, "r": 477.47772, "b": 645.57774, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt", "bbox": {"l": 133.76801, "t": 648.68596, "r": 477.47971, "b": 657.53275, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "ut labore et dolore magna aliquyam erat, sed diam voluptua.", "bbox": {"l": 133.76801, "t": 660.64096, "r": 399.57816, "b": 669.48775, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "1", "bbox": {"l": 303.133, "t": 695.720963, "r": 308.11429, "b": 704.567757, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 3, "label": "section_header", "bbox": {"l": 133.76801, "t": 124.80877999999996, "r": 252.35513, "b": 137.54816000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9627318382263184, "cells": [{"id": 0, "text": "Figures Example", "bbox": {"l": 133.76801, "t": 124.80877999999996, "r": 252.35513, "b": 137.54816000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 133.76801, "t": 149.67193999999995, "r": 477.48276, "b": 290.02588, "coord_origin": "TOPLEFT"}, "confidence": 0.9869933128356934, "cells": [{"id": 1, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eir-", "bbox": {"l": 133.76801, "t": 149.67193999999995, "r": 477.47971, "b": 158.51873999999998, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "mod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam volup-", "bbox": {"l": 133.76801, "t": 161.62694999999997, "r": 477.4806500000001, "b": 170.47375, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "tua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd", "bbox": {"l": 133.76801, "t": 173.58196999999996, "r": 477.47571000000005, "b": 182.42877, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ip-", "bbox": {"l": 133.76801, "t": 185.53698999999995, "r": 477.47466999999995, "b": 194.38378999999998, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "sum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor", "bbox": {"l": 133.76801, "t": 197.49199999999996, "r": 477.47668, "b": 206.33880999999997, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero", "bbox": {"l": 133.76801, "t": 209.44701999999995, "r": 477.48068000000006, "b": 218.29381999999998, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "eos et accusam et justo duo dolores et ea rebum.", "bbox": {"l": 133.76801, "t": 221.40301999999997, "r": 355.20874, "b": 230.24982, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Stet clita kasd gubergren,", "bbox": {"l": 362.60098, "t": 221.40301999999997, "r": 477.48276, "b": 230.24982, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor", "bbox": {"l": 133.76801, "t": 233.35802999999999, "r": 477.47772, "b": 242.20483000000002, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt", "bbox": {"l": 133.76801, "t": 245.31304999999998, "r": 477.47971, "b": 254.15985, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et", "bbox": {"l": 133.76801, "t": 257.26806999999997, "r": 477.47473, "b": 266.11487, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea", "bbox": {"l": 133.76801, "t": 269.22308, "r": 477.47571000000005, "b": 278.06989, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "takimata sanctus est Lorem ipsum dolor sit amet.", "bbox": {"l": 133.76801, "t": 281.17911, "r": 351.48471, "b": 290.02588, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "caption", "bbox": {"l": 226.89101, "t": 529.13495, "r": 384.3548, "b": 537.98174, "coord_origin": "TOPLEFT"}, "confidence": 0.9477447271347046, "cells": [{"id": 14, "text": "Figure 1: This is an example image.", "bbox": {"l": 226.89101, "t": 529.13495, "r": 384.3548, "b": 537.98174, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 133.76801, "t": 553.04495, "r": 477.48172000000005, "b": 669.48775, "coord_origin": "TOPLEFT"}, "confidence": 0.9862836599349976, "cells": [{"id": 15, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy", "bbox": {"l": 148.71201, "t": 553.04495, "r": 477.47786999999994, "b": 561.89174, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam", "bbox": {"l": 133.76801, "t": 564.99995, "r": 477.47860999999995, "b": 573.84674, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita", "bbox": {"l": 133.76801, "t": 576.95496, "r": 477.47571000000005, "b": 585.80174, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem", "bbox": {"l": 133.76801, "t": 588.90996, "r": 477.47559, "b": 597.75674, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod", "bbox": {"l": 133.76801, "t": 600.86595, "r": 477.48169000000007, "b": 609.7127399999999, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At", "bbox": {"l": 133.76801, "t": 612.82095, "r": 477.48062, "b": 621.66774, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren,", "bbox": {"l": 133.76801, "t": 624.7759599999999, "r": 477.48172000000005, "b": 633.62274, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor", "bbox": {"l": 133.76801, "t": 636.73096, "r": 477.47772, "b": 645.57774, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt", "bbox": {"l": 133.76801, "t": 648.68596, "r": 477.47971, "b": 657.53275, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "ut labore et dolore magna aliquyam erat, sed diam voluptua.", "bbox": {"l": 133.76801, "t": 660.64096, "r": 399.57816, "b": 669.48775, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "page_footer", "bbox": {"l": 303.133, "t": 695.720963, "r": 308.11429, "b": 704.567757, "coord_origin": "TOPLEFT"}, "confidence": 0.8646790981292725, "cells": [{"id": 25, "text": "1", "bbox": {"l": 303.133, "t": 695.720963, "r": 308.11429, "b": 704.567757, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "picture", "bbox": {"l": 134.92005920410156, "t": 304.890625, "r": 475.66351318359375, "b": 510.21826171875, "coord_origin": "TOPLEFT"}, "confidence": 0.9803217053413391, "cells": [], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "section_header", "id": 3, "page_no": 0, "cluster": {"id": 3, "label": "section_header", "bbox": {"l": 133.76801, "t": 124.80877999999996, "r": 252.35513, "b": 137.54816000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9627318382263184, "cells": [{"id": 0, "text": "Figures Example", "bbox": {"l": 133.76801, "t": 124.80877999999996, "r": 252.35513, "b": 137.54816000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figures Example"}, {"label": "text", "id": 0, "page_no": 0, "cluster": {"id": 0, "label": "text", "bbox": {"l": 133.76801, "t": 149.67193999999995, "r": 477.48276, "b": 290.02588, "coord_origin": "TOPLEFT"}, "confidence": 0.9869933128356934, "cells": [{"id": 1, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eir-", "bbox": {"l": 133.76801, "t": 149.67193999999995, "r": 477.47971, "b": 158.51873999999998, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "mod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam volup-", "bbox": {"l": 133.76801, "t": 161.62694999999997, "r": 477.4806500000001, "b": 170.47375, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "tua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd", "bbox": {"l": 133.76801, "t": 173.58196999999996, "r": 477.47571000000005, "b": 182.42877, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ip-", "bbox": {"l": 133.76801, "t": 185.53698999999995, "r": 477.47466999999995, "b": 194.38378999999998, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "sum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor", "bbox": {"l": 133.76801, "t": 197.49199999999996, "r": 477.47668, "b": 206.33880999999997, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero", "bbox": {"l": 133.76801, "t": 209.44701999999995, "r": 477.48068000000006, "b": 218.29381999999998, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "eos et accusam et justo duo dolores et ea rebum.", "bbox": {"l": 133.76801, "t": 221.40301999999997, "r": 355.20874, "b": 230.24982, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Stet clita kasd gubergren,", "bbox": {"l": 362.60098, "t": 221.40301999999997, "r": 477.48276, "b": 230.24982, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor", "bbox": {"l": 133.76801, "t": 233.35802999999999, "r": 477.47772, "b": 242.20483000000002, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt", "bbox": {"l": 133.76801, "t": 245.31304999999998, "r": 477.47971, "b": 254.15985, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et", "bbox": {"l": 133.76801, "t": 257.26806999999997, "r": 477.47473, "b": 266.11487, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea", "bbox": {"l": 133.76801, "t": 269.22308, "r": 477.47571000000005, "b": 278.06989, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "takimata sanctus est Lorem ipsum dolor sit amet.", "bbox": {"l": 133.76801, "t": 281.17911, "r": 351.48471, "b": 290.02588, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet."}, {"label": "caption", "id": 4, "page_no": 0, "cluster": {"id": 4, "label": "caption", "bbox": {"l": 226.89101, "t": 529.13495, "r": 384.3548, "b": 537.98174, "coord_origin": "TOPLEFT"}, "confidence": 0.9477447271347046, "cells": [{"id": 14, "text": "Figure 1: This is an example image.", "bbox": {"l": 226.89101, "t": 529.13495, "r": 384.3548, "b": 537.98174, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 1: This is an example image."}, {"label": "text", "id": 1, "page_no": 0, "cluster": {"id": 1, "label": "text", "bbox": {"l": 133.76801, "t": 553.04495, "r": 477.48172000000005, "b": 669.48775, "coord_origin": "TOPLEFT"}, "confidence": 0.9862836599349976, "cells": [{"id": 15, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy", "bbox": {"l": 148.71201, "t": 553.04495, "r": 477.47786999999994, "b": 561.89174, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam", "bbox": {"l": 133.76801, "t": 564.99995, "r": 477.47860999999995, "b": 573.84674, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita", "bbox": {"l": 133.76801, "t": 576.95496, "r": 477.47571000000005, "b": 585.80174, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem", "bbox": {"l": 133.76801, "t": 588.90996, "r": 477.47559, "b": 597.75674, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod", "bbox": {"l": 133.76801, "t": 600.86595, "r": 477.48169000000007, "b": 609.7127399999999, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At", "bbox": {"l": 133.76801, "t": 612.82095, "r": 477.48062, "b": 621.66774, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren,", "bbox": {"l": 133.76801, "t": 624.7759599999999, "r": 477.48172000000005, "b": 633.62274, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor", "bbox": {"l": 133.76801, "t": 636.73096, "r": 477.47772, "b": 645.57774, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt", "bbox": {"l": 133.76801, "t": 648.68596, "r": 477.47971, "b": 657.53275, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "ut labore et dolore magna aliquyam erat, sed diam voluptua.", "bbox": {"l": 133.76801, "t": 660.64096, "r": 399.57816, "b": 669.48775, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua."}, {"label": "page_footer", "id": 5, "page_no": 0, "cluster": {"id": 5, "label": "page_footer", "bbox": {"l": 303.133, "t": 695.720963, "r": 308.11429, "b": 704.567757, "coord_origin": "TOPLEFT"}, "confidence": 0.8646790981292725, "cells": [{"id": 25, "text": "1", "bbox": {"l": 303.133, "t": 695.720963, "r": 308.11429, "b": 704.567757, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1"}, {"label": "picture", "id": 2, "page_no": 0, "cluster": {"id": 2, "label": "picture", "bbox": {"l": 134.92005920410156, "t": 304.890625, "r": 475.66351318359375, "b": 510.21826171875, "coord_origin": "TOPLEFT"}, "confidence": 0.9803217053413391, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "body": [{"label": "section_header", "id": 3, "page_no": 0, "cluster": {"id": 3, "label": "section_header", "bbox": {"l": 133.76801, "t": 124.80877999999996, "r": 252.35513, "b": 137.54816000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9627318382263184, "cells": [{"id": 0, "text": "Figures Example", "bbox": {"l": 133.76801, "t": 124.80877999999996, "r": 252.35513, "b": 137.54816000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figures Example"}, {"label": "text", "id": 0, "page_no": 0, "cluster": {"id": 0, "label": "text", "bbox": {"l": 133.76801, "t": 149.67193999999995, "r": 477.48276, "b": 290.02588, "coord_origin": "TOPLEFT"}, "confidence": 0.9869933128356934, "cells": [{"id": 1, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eir-", "bbox": {"l": 133.76801, "t": 149.67193999999995, "r": 477.47971, "b": 158.51873999999998, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "mod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam volup-", "bbox": {"l": 133.76801, "t": 161.62694999999997, "r": 477.4806500000001, "b": 170.47375, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "tua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd", "bbox": {"l": 133.76801, "t": 173.58196999999996, "r": 477.47571000000005, "b": 182.42877, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ip-", "bbox": {"l": 133.76801, "t": 185.53698999999995, "r": 477.47466999999995, "b": 194.38378999999998, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "sum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor", "bbox": {"l": 133.76801, "t": 197.49199999999996, "r": 477.47668, "b": 206.33880999999997, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero", "bbox": {"l": 133.76801, "t": 209.44701999999995, "r": 477.48068000000006, "b": 218.29381999999998, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "eos et accusam et justo duo dolores et ea rebum.", "bbox": {"l": 133.76801, "t": 221.40301999999997, "r": 355.20874, "b": 230.24982, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Stet clita kasd gubergren,", "bbox": {"l": 362.60098, "t": 221.40301999999997, "r": 477.48276, "b": 230.24982, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor", "bbox": {"l": 133.76801, "t": 233.35802999999999, "r": 477.47772, "b": 242.20483000000002, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt", "bbox": {"l": 133.76801, "t": 245.31304999999998, "r": 477.47971, "b": 254.15985, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et", "bbox": {"l": 133.76801, "t": 257.26806999999997, "r": 477.47473, "b": 266.11487, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea", "bbox": {"l": 133.76801, "t": 269.22308, "r": 477.47571000000005, "b": 278.06989, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "takimata sanctus est Lorem ipsum dolor sit amet.", "bbox": {"l": 133.76801, "t": 281.17911, "r": 351.48471, "b": 290.02588, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet."}, {"label": "caption", "id": 4, "page_no": 0, "cluster": {"id": 4, "label": "caption", "bbox": {"l": 226.89101, "t": 529.13495, "r": 384.3548, "b": 537.98174, "coord_origin": "TOPLEFT"}, "confidence": 0.9477447271347046, "cells": [{"id": 14, "text": "Figure 1: This is an example image.", "bbox": {"l": 226.89101, "t": 529.13495, "r": 384.3548, "b": 537.98174, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 1: This is an example image."}, {"label": "text", "id": 1, "page_no": 0, "cluster": {"id": 1, "label": "text", "bbox": {"l": 133.76801, "t": 553.04495, "r": 477.48172000000005, "b": 669.48775, "coord_origin": "TOPLEFT"}, "confidence": 0.9862836599349976, "cells": [{"id": 15, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy", "bbox": {"l": 148.71201, "t": 553.04495, "r": 477.47786999999994, "b": 561.89174, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam", "bbox": {"l": 133.76801, "t": 564.99995, "r": 477.47860999999995, "b": 573.84674, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita", "bbox": {"l": 133.76801, "t": 576.95496, "r": 477.47571000000005, "b": 585.80174, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem", "bbox": {"l": 133.76801, "t": 588.90996, "r": 477.47559, "b": 597.75674, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod", "bbox": {"l": 133.76801, "t": 600.86595, "r": 477.48169000000007, "b": 609.7127399999999, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At", "bbox": {"l": 133.76801, "t": 612.82095, "r": 477.48062, "b": 621.66774, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren,", "bbox": {"l": 133.76801, "t": 624.7759599999999, "r": 477.48172000000005, "b": 633.62274, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor", "bbox": {"l": 133.76801, "t": 636.73096, "r": 477.47772, "b": 645.57774, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt", "bbox": {"l": 133.76801, "t": 648.68596, "r": 477.47971, "b": 657.53275, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "ut labore et dolore magna aliquyam erat, sed diam voluptua.", "bbox": {"l": 133.76801, "t": 660.64096, "r": 399.57816, "b": 669.48775, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua."}, {"label": "picture", "id": 2, "page_no": 0, "cluster": {"id": 2, "label": "picture", "bbox": {"l": 134.92005920410156, "t": 304.890625, "r": 475.66351318359375, "b": 510.21826171875, "coord_origin": "TOPLEFT"}, "confidence": 0.9803217053413391, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "headers": [{"label": "page_footer", "id": 5, "page_no": 0, "cluster": {"id": 5, "label": "page_footer", "bbox": {"l": 303.133, "t": 695.720963, "r": 308.11429, "b": 704.567757, "coord_origin": "TOPLEFT"}, "confidence": 0.8646790981292725, "cells": [{"id": 25, "text": "1", "bbox": {"l": 303.133, "t": 695.720963, "r": 308.11429, "b": 704.567757, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1"}]}}, {"page_no": 1, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy", "bbox": {"l": 148.71201, "t": 127.85095000000013, "r": 477.47786999999994, "b": 136.69775000000004, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam", "bbox": {"l": 133.76801, "t": 139.80597, "r": 477.47860999999995, "b": 148.65277000000003, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita", "bbox": {"l": 133.76801, "t": 151.76099, "r": 477.47571000000005, "b": 160.60779000000002, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem", "bbox": {"l": 133.76801, "t": 163.716, "r": 477.47559, "b": 172.56281, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod", "bbox": {"l": 133.76801, "t": 175.67102, "r": 477.48169000000007, "b": 184.51782000000003, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At", "bbox": {"l": 133.76801, "t": 187.62701000000004, "r": 477.48062, "b": 196.47382000000005, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren,", "bbox": {"l": 133.76801, "t": 199.58203000000003, "r": 477.48172000000005, "b": 208.42882999999995, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor", "bbox": {"l": 133.76801, "t": 211.53705000000002, "r": 477.47772, "b": 220.38385000000005, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt", "bbox": {"l": 133.76801, "t": 223.49207, "r": 477.47971, "b": 232.33887000000004, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et", "bbox": {"l": 133.76801, "t": 235.44708000000003, "r": 477.47473, "b": 244.29387999999994, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea", "bbox": {"l": 133.76801, "t": 247.40210000000002, "r": 477.47571000000005, "b": 256.24890000000005, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "takimata sanctus est Lorem ipsum dolor sit amet.", "bbox": {"l": 133.76801, "t": 259.35808999999995, "r": 351.48471, "b": 268.20489999999995, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Figure 2: This is an example image.", "bbox": {"l": 226.89101, "t": 523.21097, "r": 384.3548, "b": 532.05774, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy", "bbox": {"l": 148.71201, "t": 546.28195, "r": 477.47786999999994, "b": 555.12874, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam", "bbox": {"l": 133.76801, "t": 558.23695, "r": 477.47860999999995, "b": 567.08374, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita", "bbox": {"l": 133.76801, "t": 570.19196, "r": 477.47571000000005, "b": 579.03874, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem", "bbox": {"l": 133.76801, "t": 582.14696, "r": 477.47559, "b": 590.99374, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod", "bbox": {"l": 133.76801, "t": 594.10196, "r": 477.48169000000007, "b": 602.94875, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At", "bbox": {"l": 133.76801, "t": 606.05696, "r": 477.48062, "b": 614.90375, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren,", "bbox": {"l": 133.76801, "t": 618.01295, "r": 477.48172000000005, "b": 626.85974, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor", "bbox": {"l": 133.76801, "t": 629.96796, "r": 477.47772, "b": 638.81474, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt", "bbox": {"l": 133.76801, "t": 641.92296, "r": 477.47971, "b": 650.76974, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et", "bbox": {"l": 133.76801, "t": 653.87796, "r": 477.47473, "b": 662.72475, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "accusam et justo duo dolores et ea rebum.", "bbox": {"l": 133.76801, "t": 665.83296, "r": 318.01736, "b": 674.67976, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "2", "bbox": {"l": 303.133, "t": 695.720963, "r": 308.11429, "b": 704.567757, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 1, "label": "text", "bbox": {"l": 133.76801, "t": 127.85095000000013, "r": 477.48172000000005, "b": 268.20489999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.987092912197113, "cells": [{"id": 0, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy", "bbox": {"l": 148.71201, "t": 127.85095000000013, "r": 477.47786999999994, "b": 136.69775000000004, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam", "bbox": {"l": 133.76801, "t": 139.80597, "r": 477.47860999999995, "b": 148.65277000000003, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita", "bbox": {"l": 133.76801, "t": 151.76099, "r": 477.47571000000005, "b": 160.60779000000002, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem", "bbox": {"l": 133.76801, "t": 163.716, "r": 477.47559, "b": 172.56281, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod", "bbox": {"l": 133.76801, "t": 175.67102, "r": 477.48169000000007, "b": 184.51782000000003, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At", "bbox": {"l": 133.76801, "t": 187.62701000000004, "r": 477.48062, "b": 196.47382000000005, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren,", "bbox": {"l": 133.76801, "t": 199.58203000000003, "r": 477.48172000000005, "b": 208.42882999999995, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor", "bbox": {"l": 133.76801, "t": 211.53705000000002, "r": 477.47772, "b": 220.38385000000005, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt", "bbox": {"l": 133.76801, "t": 223.49207, "r": 477.47971, "b": 232.33887000000004, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et", "bbox": {"l": 133.76801, "t": 235.44708000000003, "r": 477.47473, "b": 244.29387999999994, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea", "bbox": {"l": 133.76801, "t": 247.40210000000002, "r": 477.47571000000005, "b": 256.24890000000005, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "takimata sanctus est Lorem ipsum dolor sit amet.", "bbox": {"l": 133.76801, "t": 259.35808999999995, "r": 351.48471, "b": 268.20489999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "caption", "bbox": {"l": 226.89101, "t": 523.21097, "r": 384.3548, "b": 532.05774, "coord_origin": "TOPLEFT"}, "confidence": 0.9494235515594482, "cells": [{"id": 12, "text": "Figure 2: This is an example image.", "bbox": {"l": 226.89101, "t": 523.21097, "r": 384.3548, "b": 532.05774, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 133.76801, "t": 546.28195, "r": 477.48172000000005, "b": 674.67976, "coord_origin": "TOPLEFT"}, "confidence": 0.9874356985092163, "cells": [{"id": 13, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy", "bbox": {"l": 148.71201, "t": 546.28195, "r": 477.47786999999994, "b": 555.12874, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam", "bbox": {"l": 133.76801, "t": 558.23695, "r": 477.47860999999995, "b": 567.08374, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita", "bbox": {"l": 133.76801, "t": 570.19196, "r": 477.47571000000005, "b": 579.03874, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem", "bbox": {"l": 133.76801, "t": 582.14696, "r": 477.47559, "b": 590.99374, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod", "bbox": {"l": 133.76801, "t": 594.10196, "r": 477.48169000000007, "b": 602.94875, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At", "bbox": {"l": 133.76801, "t": 606.05696, "r": 477.48062, "b": 614.90375, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren,", "bbox": {"l": 133.76801, "t": 618.01295, "r": 477.48172000000005, "b": 626.85974, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor", "bbox": {"l": 133.76801, "t": 629.96796, "r": 477.47772, "b": 638.81474, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt", "bbox": {"l": 133.76801, "t": 641.92296, "r": 477.47971, "b": 650.76974, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et", "bbox": {"l": 133.76801, "t": 653.87796, "r": 477.47473, "b": 662.72475, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "accusam et justo duo dolores et ea rebum.", "bbox": {"l": 133.76801, "t": 665.83296, "r": 318.01736, "b": 674.67976, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "page_footer", "bbox": {"l": 303.133, "t": 695.720963, "r": 308.11429, "b": 704.567757, "coord_origin": "TOPLEFT"}, "confidence": 0.888852059841156, "cells": [{"id": 24, "text": "2", "bbox": {"l": 303.133, "t": 695.720963, "r": 308.11429, "b": 704.567757, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "picture", "bbox": {"l": 218.8155517578125, "t": 278.0154113769531, "r": 391.96246337890625, "b": 508.89410400390625, "coord_origin": "TOPLEFT"}, "confidence": 0.9837717413902283, "cells": [], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "text", "id": 1, "page_no": 1, "cluster": {"id": 1, "label": "text", "bbox": {"l": 133.76801, "t": 127.85095000000013, "r": 477.48172000000005, "b": 268.20489999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.987092912197113, "cells": [{"id": 0, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy", "bbox": {"l": 148.71201, "t": 127.85095000000013, "r": 477.47786999999994, "b": 136.69775000000004, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam", "bbox": {"l": 133.76801, "t": 139.80597, "r": 477.47860999999995, "b": 148.65277000000003, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita", "bbox": {"l": 133.76801, "t": 151.76099, "r": 477.47571000000005, "b": 160.60779000000002, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem", "bbox": {"l": 133.76801, "t": 163.716, "r": 477.47559, "b": 172.56281, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod", "bbox": {"l": 133.76801, "t": 175.67102, "r": 477.48169000000007, "b": 184.51782000000003, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At", "bbox": {"l": 133.76801, "t": 187.62701000000004, "r": 477.48062, "b": 196.47382000000005, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren,", "bbox": {"l": 133.76801, "t": 199.58203000000003, "r": 477.48172000000005, "b": 208.42882999999995, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor", "bbox": {"l": 133.76801, "t": 211.53705000000002, "r": 477.47772, "b": 220.38385000000005, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt", "bbox": {"l": 133.76801, "t": 223.49207, "r": 477.47971, "b": 232.33887000000004, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et", "bbox": {"l": 133.76801, "t": 235.44708000000003, "r": 477.47473, "b": 244.29387999999994, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea", "bbox": {"l": 133.76801, "t": 247.40210000000002, "r": 477.47571000000005, "b": 256.24890000000005, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "takimata sanctus est Lorem ipsum dolor sit amet.", "bbox": {"l": 133.76801, "t": 259.35808999999995, "r": 351.48471, "b": 268.20489999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet."}, {"label": "caption", "id": 3, "page_no": 1, "cluster": {"id": 3, "label": "caption", "bbox": {"l": 226.89101, "t": 523.21097, "r": 384.3548, "b": 532.05774, "coord_origin": "TOPLEFT"}, "confidence": 0.9494235515594482, "cells": [{"id": 12, "text": "Figure 2: This is an example image.", "bbox": {"l": 226.89101, "t": 523.21097, "r": 384.3548, "b": 532.05774, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 2: This is an example image."}, {"label": "text", "id": 0, "page_no": 1, "cluster": {"id": 0, "label": "text", "bbox": {"l": 133.76801, "t": 546.28195, "r": 477.48172000000005, "b": 674.67976, "coord_origin": "TOPLEFT"}, "confidence": 0.9874356985092163, "cells": [{"id": 13, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy", "bbox": {"l": 148.71201, "t": 546.28195, "r": 477.47786999999994, "b": 555.12874, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam", "bbox": {"l": 133.76801, "t": 558.23695, "r": 477.47860999999995, "b": 567.08374, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita", "bbox": {"l": 133.76801, "t": 570.19196, "r": 477.47571000000005, "b": 579.03874, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem", "bbox": {"l": 133.76801, "t": 582.14696, "r": 477.47559, "b": 590.99374, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod", "bbox": {"l": 133.76801, "t": 594.10196, "r": 477.48169000000007, "b": 602.94875, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At", "bbox": {"l": 133.76801, "t": 606.05696, "r": 477.48062, "b": 614.90375, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren,", "bbox": {"l": 133.76801, "t": 618.01295, "r": 477.48172000000005, "b": 626.85974, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor", "bbox": {"l": 133.76801, "t": 629.96796, "r": 477.47772, "b": 638.81474, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt", "bbox": {"l": 133.76801, "t": 641.92296, "r": 477.47971, "b": 650.76974, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et", "bbox": {"l": 133.76801, "t": 653.87796, "r": 477.47473, "b": 662.72475, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "accusam et justo duo dolores et ea rebum.", "bbox": {"l": 133.76801, "t": 665.83296, "r": 318.01736, "b": 674.67976, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum."}, {"label": "page_footer", "id": 4, "page_no": 1, "cluster": {"id": 4, "label": "page_footer", "bbox": {"l": 303.133, "t": 695.720963, "r": 308.11429, "b": 704.567757, "coord_origin": "TOPLEFT"}, "confidence": 0.888852059841156, "cells": [{"id": 24, "text": "2", "bbox": {"l": 303.133, "t": 695.720963, "r": 308.11429, "b": 704.567757, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2"}, {"label": "picture", "id": 2, "page_no": 1, "cluster": {"id": 2, "label": "picture", "bbox": {"l": 218.8155517578125, "t": 278.0154113769531, "r": 391.96246337890625, "b": 508.89410400390625, "coord_origin": "TOPLEFT"}, "confidence": 0.9837717413902283, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "body": [{"label": "text", "id": 1, "page_no": 1, "cluster": {"id": 1, "label": "text", "bbox": {"l": 133.76801, "t": 127.85095000000013, "r": 477.48172000000005, "b": 268.20489999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.987092912197113, "cells": [{"id": 0, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy", "bbox": {"l": 148.71201, "t": 127.85095000000013, "r": 477.47786999999994, "b": 136.69775000000004, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam", "bbox": {"l": 133.76801, "t": 139.80597, "r": 477.47860999999995, "b": 148.65277000000003, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita", "bbox": {"l": 133.76801, "t": 151.76099, "r": 477.47571000000005, "b": 160.60779000000002, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem", "bbox": {"l": 133.76801, "t": 163.716, "r": 477.47559, "b": 172.56281, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod", "bbox": {"l": 133.76801, "t": 175.67102, "r": 477.48169000000007, "b": 184.51782000000003, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At", "bbox": {"l": 133.76801, "t": 187.62701000000004, "r": 477.48062, "b": 196.47382000000005, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren,", "bbox": {"l": 133.76801, "t": 199.58203000000003, "r": 477.48172000000005, "b": 208.42882999999995, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor", "bbox": {"l": 133.76801, "t": 211.53705000000002, "r": 477.47772, "b": 220.38385000000005, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt", "bbox": {"l": 133.76801, "t": 223.49207, "r": 477.47971, "b": 232.33887000000004, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et", "bbox": {"l": 133.76801, "t": 235.44708000000003, "r": 477.47473, "b": 244.29387999999994, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea", "bbox": {"l": 133.76801, "t": 247.40210000000002, "r": 477.47571000000005, "b": 256.24890000000005, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "takimata sanctus est Lorem ipsum dolor sit amet.", "bbox": {"l": 133.76801, "t": 259.35808999999995, "r": 351.48471, "b": 268.20489999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet."}, {"label": "caption", "id": 3, "page_no": 1, "cluster": {"id": 3, "label": "caption", "bbox": {"l": 226.89101, "t": 523.21097, "r": 384.3548, "b": 532.05774, "coord_origin": "TOPLEFT"}, "confidence": 0.9494235515594482, "cells": [{"id": 12, "text": "Figure 2: This is an example image.", "bbox": {"l": 226.89101, "t": 523.21097, "r": 384.3548, "b": 532.05774, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 2: This is an example image."}, {"label": "text", "id": 0, "page_no": 1, "cluster": {"id": 0, "label": "text", "bbox": {"l": 133.76801, "t": 546.28195, "r": 477.48172000000005, "b": 674.67976, "coord_origin": "TOPLEFT"}, "confidence": 0.9874356985092163, "cells": [{"id": 13, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy", "bbox": {"l": 148.71201, "t": 546.28195, "r": 477.47786999999994, "b": 555.12874, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam", "bbox": {"l": 133.76801, "t": 558.23695, "r": 477.47860999999995, "b": 567.08374, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita", "bbox": {"l": 133.76801, "t": 570.19196, "r": 477.47571000000005, "b": 579.03874, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem", "bbox": {"l": 133.76801, "t": 582.14696, "r": 477.47559, "b": 590.99374, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod", "bbox": {"l": 133.76801, "t": 594.10196, "r": 477.48169000000007, "b": 602.94875, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At", "bbox": {"l": 133.76801, "t": 606.05696, "r": 477.48062, "b": 614.90375, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren,", "bbox": {"l": 133.76801, "t": 618.01295, "r": 477.48172000000005, "b": 626.85974, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor", "bbox": {"l": 133.76801, "t": 629.96796, "r": 477.47772, "b": 638.81474, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt", "bbox": {"l": 133.76801, "t": 641.92296, "r": 477.47971, "b": 650.76974, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et", "bbox": {"l": 133.76801, "t": 653.87796, "r": 477.47473, "b": 662.72475, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "accusam et justo duo dolores et ea rebum.", "bbox": {"l": 133.76801, "t": 665.83296, "r": 318.01736, "b": 674.67976, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum."}, {"label": "picture", "id": 2, "page_no": 1, "cluster": {"id": 2, "label": "picture", "bbox": {"l": 218.8155517578125, "t": 278.0154113769531, "r": 391.96246337890625, "b": 508.89410400390625, "coord_origin": "TOPLEFT"}, "confidence": 0.9837717413902283, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "headers": [{"label": "page_footer", "id": 4, "page_no": 1, "cluster": {"id": 4, "label": "page_footer", "bbox": {"l": 303.133, "t": 695.720963, "r": 308.11429, "b": 704.567757, "coord_origin": "TOPLEFT"}, "confidence": 0.888852059841156, "cells": [{"id": 24, "text": "2", "bbox": {"l": 303.133, "t": 695.720963, "r": 308.11429, "b": 704.567757, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2"}]}}]
\ No newline at end of file
+[{"page_no": 0, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "Figures Example", "bbox": {"l": 133.76801, "t": 124.80877999999996, "r": 252.35513, "b": 137.54816000000005, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eir-", "bbox": {"l": 133.76801, "t": 149.67193999999995, "r": 477.47971, "b": 158.51873999999998, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "mod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam volup-", "bbox": {"l": 133.76801, "t": 161.62694999999997, "r": 477.4806500000001, "b": 170.47375, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "tua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd", "bbox": {"l": 133.76801, "t": 173.58196999999996, "r": 477.47571000000005, "b": 182.42877, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ip-", "bbox": {"l": 133.76801, "t": 185.53698999999995, "r": 477.47466999999995, "b": 194.38378999999998, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "sum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor", "bbox": {"l": 133.76801, "t": 197.49199999999996, "r": 477.47668, "b": 206.33880999999997, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero", "bbox": {"l": 133.76801, "t": 209.44701999999995, "r": 477.48068000000006, "b": 218.29381999999998, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "eos et accusam et justo duo dolores et ea rebum.", "bbox": {"l": 133.76801, "t": 221.40301999999997, "r": 355.20874, "b": 230.24982, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Stet clita kasd gubergren,", "bbox": {"l": 362.60098, "t": 221.40301999999997, "r": 477.48276, "b": 230.24982, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor", "bbox": {"l": 133.76801, "t": 233.35802999999999, "r": 477.47772, "b": 242.20483000000002, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt", "bbox": {"l": 133.76801, "t": 245.31304999999998, "r": 477.47971, "b": 254.15985, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et", "bbox": {"l": 133.76801, "t": 257.26806999999997, "r": 477.47473, "b": 266.11487, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea", "bbox": {"l": 133.76801, "t": 269.22308, "r": 477.47571000000005, "b": 278.06989, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "takimata sanctus est Lorem ipsum dolor sit amet.", "bbox": {"l": 133.76801, "t": 281.17911, "r": 351.48471, "b": 290.02588, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Figure 1: This is an example image.", "bbox": {"l": 226.89101, "t": 529.13495, "r": 384.3548, "b": 537.98174, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy", "bbox": {"l": 148.71201, "t": 553.04495, "r": 477.47786999999994, "b": 561.89174, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam", "bbox": {"l": 133.76801, "t": 564.99995, "r": 477.47860999999995, "b": 573.84674, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita", "bbox": {"l": 133.76801, "t": 576.95496, "r": 477.47571000000005, "b": 585.80174, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem", "bbox": {"l": 133.76801, "t": 588.90996, "r": 477.47559, "b": 597.75674, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod", "bbox": {"l": 133.76801, "t": 600.86595, "r": 477.48169000000007, "b": 609.7127399999999, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At", "bbox": {"l": 133.76801, "t": 612.82095, "r": 477.48062, "b": 621.66774, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren,", "bbox": {"l": 133.76801, "t": 624.7759599999999, "r": 477.48172000000005, "b": 633.62274, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor", "bbox": {"l": 133.76801, "t": 636.73096, "r": 477.47772, "b": 645.57774, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt", "bbox": {"l": 133.76801, "t": 648.68596, "r": 477.47971, "b": 657.53275, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "ut labore et dolore magna aliquyam erat, sed diam voluptua.", "bbox": {"l": 133.76801, "t": 660.64096, "r": 399.57816, "b": 669.48775, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "1", "bbox": {"l": 303.133, "t": 695.720963, "r": 308.11429, "b": 704.567757, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 3, "label": "section_header", "bbox": {"l": 133.76801, "t": 124.80877999999996, "r": 252.35513, "b": 137.54816000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9627318382263184, "cells": [{"id": 0, "text": "Figures Example", "bbox": {"l": 133.76801, "t": 124.80877999999996, "r": 252.35513, "b": 137.54816000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 133.76801, "t": 149.67193999999995, "r": 477.48276, "b": 290.02588, "coord_origin": "TOPLEFT"}, "confidence": 0.9869934320449829, "cells": [{"id": 1, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eir-", "bbox": {"l": 133.76801, "t": 149.67193999999995, "r": 477.47971, "b": 158.51873999999998, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "mod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam volup-", "bbox": {"l": 133.76801, "t": 161.62694999999997, "r": 477.4806500000001, "b": 170.47375, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "tua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd", "bbox": {"l": 133.76801, "t": 173.58196999999996, "r": 477.47571000000005, "b": 182.42877, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ip-", "bbox": {"l": 133.76801, "t": 185.53698999999995, "r": 477.47466999999995, "b": 194.38378999999998, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "sum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor", "bbox": {"l": 133.76801, "t": 197.49199999999996, "r": 477.47668, "b": 206.33880999999997, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero", "bbox": {"l": 133.76801, "t": 209.44701999999995, "r": 477.48068000000006, "b": 218.29381999999998, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "eos et accusam et justo duo dolores et ea rebum.", "bbox": {"l": 133.76801, "t": 221.40301999999997, "r": 355.20874, "b": 230.24982, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Stet clita kasd gubergren,", "bbox": {"l": 362.60098, "t": 221.40301999999997, "r": 477.48276, "b": 230.24982, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor", "bbox": {"l": 133.76801, "t": 233.35802999999999, "r": 477.47772, "b": 242.20483000000002, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt", "bbox": {"l": 133.76801, "t": 245.31304999999998, "r": 477.47971, "b": 254.15985, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et", "bbox": {"l": 133.76801, "t": 257.26806999999997, "r": 477.47473, "b": 266.11487, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea", "bbox": {"l": 133.76801, "t": 269.22308, "r": 477.47571000000005, "b": 278.06989, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "takimata sanctus est Lorem ipsum dolor sit amet.", "bbox": {"l": 133.76801, "t": 281.17911, "r": 351.48471, "b": 290.02588, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "caption", "bbox": {"l": 226.89101, "t": 529.13495, "r": 384.3548, "b": 537.98174, "coord_origin": "TOPLEFT"}, "confidence": 0.9477447271347046, "cells": [{"id": 14, "text": "Figure 1: This is an example image.", "bbox": {"l": 226.89101, "t": 529.13495, "r": 384.3548, "b": 537.98174, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 133.76801, "t": 553.04495, "r": 477.48172000000005, "b": 669.48775, "coord_origin": "TOPLEFT"}, "confidence": 0.9862836599349976, "cells": [{"id": 15, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy", "bbox": {"l": 148.71201, "t": 553.04495, "r": 477.47786999999994, "b": 561.89174, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam", "bbox": {"l": 133.76801, "t": 564.99995, "r": 477.47860999999995, "b": 573.84674, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita", "bbox": {"l": 133.76801, "t": 576.95496, "r": 477.47571000000005, "b": 585.80174, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem", "bbox": {"l": 133.76801, "t": 588.90996, "r": 477.47559, "b": 597.75674, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod", "bbox": {"l": 133.76801, "t": 600.86595, "r": 477.48169000000007, "b": 609.7127399999999, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At", "bbox": {"l": 133.76801, "t": 612.82095, "r": 477.48062, "b": 621.66774, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren,", "bbox": {"l": 133.76801, "t": 624.7759599999999, "r": 477.48172000000005, "b": 633.62274, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor", "bbox": {"l": 133.76801, "t": 636.73096, "r": 477.47772, "b": 645.57774, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt", "bbox": {"l": 133.76801, "t": 648.68596, "r": 477.47971, "b": 657.53275, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "ut labore et dolore magna aliquyam erat, sed diam voluptua.", "bbox": {"l": 133.76801, "t": 660.64096, "r": 399.57816, "b": 669.48775, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "page_footer", "bbox": {"l": 303.133, "t": 695.720963, "r": 308.11429, "b": 704.567757, "coord_origin": "TOPLEFT"}, "confidence": 0.8646790981292725, "cells": [{"id": 25, "text": "1", "bbox": {"l": 303.133, "t": 695.720963, "r": 308.11429, "b": 704.567757, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "picture", "bbox": {"l": 134.9200439453125, "t": 304.890625, "r": 475.6635437011719, "b": 510.21826171875, "coord_origin": "TOPLEFT"}, "confidence": 0.9803217053413391, "cells": [], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "section_header", "id": 3, "page_no": 0, "cluster": {"id": 3, "label": "section_header", "bbox": {"l": 133.76801, "t": 124.80877999999996, "r": 252.35513, "b": 137.54816000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9627318382263184, "cells": [{"id": 0, "text": "Figures Example", "bbox": {"l": 133.76801, "t": 124.80877999999996, "r": 252.35513, "b": 137.54816000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figures Example"}, {"label": "text", "id": 0, "page_no": 0, "cluster": {"id": 0, "label": "text", "bbox": {"l": 133.76801, "t": 149.67193999999995, "r": 477.48276, "b": 290.02588, "coord_origin": "TOPLEFT"}, "confidence": 0.9869934320449829, "cells": [{"id": 1, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eir-", "bbox": {"l": 133.76801, "t": 149.67193999999995, "r": 477.47971, "b": 158.51873999999998, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "mod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam volup-", "bbox": {"l": 133.76801, "t": 161.62694999999997, "r": 477.4806500000001, "b": 170.47375, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "tua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd", "bbox": {"l": 133.76801, "t": 173.58196999999996, "r": 477.47571000000005, "b": 182.42877, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ip-", "bbox": {"l": 133.76801, "t": 185.53698999999995, "r": 477.47466999999995, "b": 194.38378999999998, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "sum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor", "bbox": {"l": 133.76801, "t": 197.49199999999996, "r": 477.47668, "b": 206.33880999999997, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero", "bbox": {"l": 133.76801, "t": 209.44701999999995, "r": 477.48068000000006, "b": 218.29381999999998, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "eos et accusam et justo duo dolores et ea rebum.", "bbox": {"l": 133.76801, "t": 221.40301999999997, "r": 355.20874, "b": 230.24982, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Stet clita kasd gubergren,", "bbox": {"l": 362.60098, "t": 221.40301999999997, "r": 477.48276, "b": 230.24982, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor", "bbox": {"l": 133.76801, "t": 233.35802999999999, "r": 477.47772, "b": 242.20483000000002, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt", "bbox": {"l": 133.76801, "t": 245.31304999999998, "r": 477.47971, "b": 254.15985, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et", "bbox": {"l": 133.76801, "t": 257.26806999999997, "r": 477.47473, "b": 266.11487, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea", "bbox": {"l": 133.76801, "t": 269.22308, "r": 477.47571000000005, "b": 278.06989, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "takimata sanctus est Lorem ipsum dolor sit amet.", "bbox": {"l": 133.76801, "t": 281.17911, "r": 351.48471, "b": 290.02588, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet."}, {"label": "caption", "id": 4, "page_no": 0, "cluster": {"id": 4, "label": "caption", "bbox": {"l": 226.89101, "t": 529.13495, "r": 384.3548, "b": 537.98174, "coord_origin": "TOPLEFT"}, "confidence": 0.9477447271347046, "cells": [{"id": 14, "text": "Figure 1: This is an example image.", "bbox": {"l": 226.89101, "t": 529.13495, "r": 384.3548, "b": 537.98174, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 1: This is an example image."}, {"label": "text", "id": 1, "page_no": 0, "cluster": {"id": 1, "label": "text", "bbox": {"l": 133.76801, "t": 553.04495, "r": 477.48172000000005, "b": 669.48775, "coord_origin": "TOPLEFT"}, "confidence": 0.9862836599349976, "cells": [{"id": 15, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy", "bbox": {"l": 148.71201, "t": 553.04495, "r": 477.47786999999994, "b": 561.89174, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam", "bbox": {"l": 133.76801, "t": 564.99995, "r": 477.47860999999995, "b": 573.84674, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita", "bbox": {"l": 133.76801, "t": 576.95496, "r": 477.47571000000005, "b": 585.80174, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem", "bbox": {"l": 133.76801, "t": 588.90996, "r": 477.47559, "b": 597.75674, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod", "bbox": {"l": 133.76801, "t": 600.86595, "r": 477.48169000000007, "b": 609.7127399999999, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At", "bbox": {"l": 133.76801, "t": 612.82095, "r": 477.48062, "b": 621.66774, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren,", "bbox": {"l": 133.76801, "t": 624.7759599999999, "r": 477.48172000000005, "b": 633.62274, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor", "bbox": {"l": 133.76801, "t": 636.73096, "r": 477.47772, "b": 645.57774, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt", "bbox": {"l": 133.76801, "t": 648.68596, "r": 477.47971, "b": 657.53275, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "ut labore et dolore magna aliquyam erat, sed diam voluptua.", "bbox": {"l": 133.76801, "t": 660.64096, "r": 399.57816, "b": 669.48775, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua."}, {"label": "page_footer", "id": 5, "page_no": 0, "cluster": {"id": 5, "label": "page_footer", "bbox": {"l": 303.133, "t": 695.720963, "r": 308.11429, "b": 704.567757, "coord_origin": "TOPLEFT"}, "confidence": 0.8646790981292725, "cells": [{"id": 25, "text": "1", "bbox": {"l": 303.133, "t": 695.720963, "r": 308.11429, "b": 704.567757, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1"}, {"label": "picture", "id": 2, "page_no": 0, "cluster": {"id": 2, "label": "picture", "bbox": {"l": 134.9200439453125, "t": 304.890625, "r": 475.6635437011719, "b": 510.21826171875, "coord_origin": "TOPLEFT"}, "confidence": 0.9803217053413391, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "body": [{"label": "section_header", "id": 3, "page_no": 0, "cluster": {"id": 3, "label": "section_header", "bbox": {"l": 133.76801, "t": 124.80877999999996, "r": 252.35513, "b": 137.54816000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9627318382263184, "cells": [{"id": 0, "text": "Figures Example", "bbox": {"l": 133.76801, "t": 124.80877999999996, "r": 252.35513, "b": 137.54816000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figures Example"}, {"label": "text", "id": 0, "page_no": 0, "cluster": {"id": 0, "label": "text", "bbox": {"l": 133.76801, "t": 149.67193999999995, "r": 477.48276, "b": 290.02588, "coord_origin": "TOPLEFT"}, "confidence": 0.9869934320449829, "cells": [{"id": 1, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eir-", "bbox": {"l": 133.76801, "t": 149.67193999999995, "r": 477.47971, "b": 158.51873999999998, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "mod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam volup-", "bbox": {"l": 133.76801, "t": 161.62694999999997, "r": 477.4806500000001, "b": 170.47375, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "tua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd", "bbox": {"l": 133.76801, "t": 173.58196999999996, "r": 477.47571000000005, "b": 182.42877, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ip-", "bbox": {"l": 133.76801, "t": 185.53698999999995, "r": 477.47466999999995, "b": 194.38378999999998, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "sum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor", "bbox": {"l": 133.76801, "t": 197.49199999999996, "r": 477.47668, "b": 206.33880999999997, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero", "bbox": {"l": 133.76801, "t": 209.44701999999995, "r": 477.48068000000006, "b": 218.29381999999998, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "eos et accusam et justo duo dolores et ea rebum.", "bbox": {"l": 133.76801, "t": 221.40301999999997, "r": 355.20874, "b": 230.24982, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Stet clita kasd gubergren,", "bbox": {"l": 362.60098, "t": 221.40301999999997, "r": 477.48276, "b": 230.24982, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor", "bbox": {"l": 133.76801, "t": 233.35802999999999, "r": 477.47772, "b": 242.20483000000002, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt", "bbox": {"l": 133.76801, "t": 245.31304999999998, "r": 477.47971, "b": 254.15985, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et", "bbox": {"l": 133.76801, "t": 257.26806999999997, "r": 477.47473, "b": 266.11487, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea", "bbox": {"l": 133.76801, "t": 269.22308, "r": 477.47571000000005, "b": 278.06989, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "takimata sanctus est Lorem ipsum dolor sit amet.", "bbox": {"l": 133.76801, "t": 281.17911, "r": 351.48471, "b": 290.02588, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet."}, {"label": "caption", "id": 4, "page_no": 0, "cluster": {"id": 4, "label": "caption", "bbox": {"l": 226.89101, "t": 529.13495, "r": 384.3548, "b": 537.98174, "coord_origin": "TOPLEFT"}, "confidence": 0.9477447271347046, "cells": [{"id": 14, "text": "Figure 1: This is an example image.", "bbox": {"l": 226.89101, "t": 529.13495, "r": 384.3548, "b": 537.98174, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 1: This is an example image."}, {"label": "text", "id": 1, "page_no": 0, "cluster": {"id": 1, "label": "text", "bbox": {"l": 133.76801, "t": 553.04495, "r": 477.48172000000005, "b": 669.48775, "coord_origin": "TOPLEFT"}, "confidence": 0.9862836599349976, "cells": [{"id": 15, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy", "bbox": {"l": 148.71201, "t": 553.04495, "r": 477.47786999999994, "b": 561.89174, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam", "bbox": {"l": 133.76801, "t": 564.99995, "r": 477.47860999999995, "b": 573.84674, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita", "bbox": {"l": 133.76801, "t": 576.95496, "r": 477.47571000000005, "b": 585.80174, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem", "bbox": {"l": 133.76801, "t": 588.90996, "r": 477.47559, "b": 597.75674, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod", "bbox": {"l": 133.76801, "t": 600.86595, "r": 477.48169000000007, "b": 609.7127399999999, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At", "bbox": {"l": 133.76801, "t": 612.82095, "r": 477.48062, "b": 621.66774, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren,", "bbox": {"l": 133.76801, "t": 624.7759599999999, "r": 477.48172000000005, "b": 633.62274, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor", "bbox": {"l": 133.76801, "t": 636.73096, "r": 477.47772, "b": 645.57774, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt", "bbox": {"l": 133.76801, "t": 648.68596, "r": 477.47971, "b": 657.53275, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "ut labore et dolore magna aliquyam erat, sed diam voluptua.", "bbox": {"l": 133.76801, "t": 660.64096, "r": 399.57816, "b": 669.48775, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua."}, {"label": "picture", "id": 2, "page_no": 0, "cluster": {"id": 2, "label": "picture", "bbox": {"l": 134.9200439453125, "t": 304.890625, "r": 475.6635437011719, "b": 510.21826171875, "coord_origin": "TOPLEFT"}, "confidence": 0.9803217053413391, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "headers": [{"label": "page_footer", "id": 5, "page_no": 0, "cluster": {"id": 5, "label": "page_footer", "bbox": {"l": 303.133, "t": 695.720963, "r": 308.11429, "b": 704.567757, "coord_origin": "TOPLEFT"}, "confidence": 0.8646790981292725, "cells": [{"id": 25, "text": "1", "bbox": {"l": 303.133, "t": 695.720963, "r": 308.11429, "b": 704.567757, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1"}]}}, {"page_no": 1, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy", "bbox": {"l": 148.71201, "t": 127.85095000000013, "r": 477.47786999999994, "b": 136.69775000000004, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam", "bbox": {"l": 133.76801, "t": 139.80597, "r": 477.47860999999995, "b": 148.65277000000003, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita", "bbox": {"l": 133.76801, "t": 151.76099, "r": 477.47571000000005, "b": 160.60779000000002, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem", "bbox": {"l": 133.76801, "t": 163.716, "r": 477.47559, "b": 172.56281, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod", "bbox": {"l": 133.76801, "t": 175.67102, "r": 477.48169000000007, "b": 184.51782000000003, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At", "bbox": {"l": 133.76801, "t": 187.62701000000004, "r": 477.48062, "b": 196.47382000000005, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren,", "bbox": {"l": 133.76801, "t": 199.58203000000003, "r": 477.48172000000005, "b": 208.42882999999995, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor", "bbox": {"l": 133.76801, "t": 211.53705000000002, "r": 477.47772, "b": 220.38385000000005, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt", "bbox": {"l": 133.76801, "t": 223.49207, "r": 477.47971, "b": 232.33887000000004, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et", "bbox": {"l": 133.76801, "t": 235.44708000000003, "r": 477.47473, "b": 244.29387999999994, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea", "bbox": {"l": 133.76801, "t": 247.40210000000002, "r": 477.47571000000005, "b": 256.24890000000005, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "takimata sanctus est Lorem ipsum dolor sit amet.", "bbox": {"l": 133.76801, "t": 259.35808999999995, "r": 351.48471, "b": 268.20489999999995, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Figure 2: This is an example image.", "bbox": {"l": 226.89101, "t": 523.21097, "r": 384.3548, "b": 532.05774, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy", "bbox": {"l": 148.71201, "t": 546.28195, "r": 477.47786999999994, "b": 555.12874, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam", "bbox": {"l": 133.76801, "t": 558.23695, "r": 477.47860999999995, "b": 567.08374, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita", "bbox": {"l": 133.76801, "t": 570.19196, "r": 477.47571000000005, "b": 579.03874, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem", "bbox": {"l": 133.76801, "t": 582.14696, "r": 477.47559, "b": 590.99374, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod", "bbox": {"l": 133.76801, "t": 594.10196, "r": 477.48169000000007, "b": 602.94875, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At", "bbox": {"l": 133.76801, "t": 606.05696, "r": 477.48062, "b": 614.90375, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren,", "bbox": {"l": 133.76801, "t": 618.01295, "r": 477.48172000000005, "b": 626.85974, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor", "bbox": {"l": 133.76801, "t": 629.96796, "r": 477.47772, "b": 638.81474, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt", "bbox": {"l": 133.76801, "t": 641.92296, "r": 477.47971, "b": 650.76974, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et", "bbox": {"l": 133.76801, "t": 653.87796, "r": 477.47473, "b": 662.72475, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "accusam et justo duo dolores et ea rebum.", "bbox": {"l": 133.76801, "t": 665.83296, "r": 318.01736, "b": 674.67976, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "2", "bbox": {"l": 303.133, "t": 695.720963, "r": 308.11429, "b": 704.567757, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 1, "label": "text", "bbox": {"l": 133.76801, "t": 127.85095000000013, "r": 477.48172000000005, "b": 268.20489999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9870928525924683, "cells": [{"id": 0, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy", "bbox": {"l": 148.71201, "t": 127.85095000000013, "r": 477.47786999999994, "b": 136.69775000000004, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam", "bbox": {"l": 133.76801, "t": 139.80597, "r": 477.47860999999995, "b": 148.65277000000003, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita", "bbox": {"l": 133.76801, "t": 151.76099, "r": 477.47571000000005, "b": 160.60779000000002, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem", "bbox": {"l": 133.76801, "t": 163.716, "r": 477.47559, "b": 172.56281, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod", "bbox": {"l": 133.76801, "t": 175.67102, "r": 477.48169000000007, "b": 184.51782000000003, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At", "bbox": {"l": 133.76801, "t": 187.62701000000004, "r": 477.48062, "b": 196.47382000000005, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren,", "bbox": {"l": 133.76801, "t": 199.58203000000003, "r": 477.48172000000005, "b": 208.42882999999995, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor", "bbox": {"l": 133.76801, "t": 211.53705000000002, "r": 477.47772, "b": 220.38385000000005, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt", "bbox": {"l": 133.76801, "t": 223.49207, "r": 477.47971, "b": 232.33887000000004, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et", "bbox": {"l": 133.76801, "t": 235.44708000000003, "r": 477.47473, "b": 244.29387999999994, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea", "bbox": {"l": 133.76801, "t": 247.40210000000002, "r": 477.47571000000005, "b": 256.24890000000005, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "takimata sanctus est Lorem ipsum dolor sit amet.", "bbox": {"l": 133.76801, "t": 259.35808999999995, "r": 351.48471, "b": 268.20489999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "caption", "bbox": {"l": 226.89101, "t": 523.21097, "r": 384.3548, "b": 532.05774, "coord_origin": "TOPLEFT"}, "confidence": 0.9494236707687378, "cells": [{"id": 12, "text": "Figure 2: This is an example image.", "bbox": {"l": 226.89101, "t": 523.21097, "r": 384.3548, "b": 532.05774, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 133.76801, "t": 546.28195, "r": 477.48172000000005, "b": 674.67976, "coord_origin": "TOPLEFT"}, "confidence": 0.9874356985092163, "cells": [{"id": 13, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy", "bbox": {"l": 148.71201, "t": 546.28195, "r": 477.47786999999994, "b": 555.12874, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam", "bbox": {"l": 133.76801, "t": 558.23695, "r": 477.47860999999995, "b": 567.08374, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita", "bbox": {"l": 133.76801, "t": 570.19196, "r": 477.47571000000005, "b": 579.03874, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem", "bbox": {"l": 133.76801, "t": 582.14696, "r": 477.47559, "b": 590.99374, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod", "bbox": {"l": 133.76801, "t": 594.10196, "r": 477.48169000000007, "b": 602.94875, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At", "bbox": {"l": 133.76801, "t": 606.05696, "r": 477.48062, "b": 614.90375, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren,", "bbox": {"l": 133.76801, "t": 618.01295, "r": 477.48172000000005, "b": 626.85974, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor", "bbox": {"l": 133.76801, "t": 629.96796, "r": 477.47772, "b": 638.81474, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt", "bbox": {"l": 133.76801, "t": 641.92296, "r": 477.47971, "b": 650.76974, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et", "bbox": {"l": 133.76801, "t": 653.87796, "r": 477.47473, "b": 662.72475, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "accusam et justo duo dolores et ea rebum.", "bbox": {"l": 133.76801, "t": 665.83296, "r": 318.01736, "b": 674.67976, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "page_footer", "bbox": {"l": 303.133, "t": 695.720963, "r": 308.11429, "b": 704.567757, "coord_origin": "TOPLEFT"}, "confidence": 0.8888521790504456, "cells": [{"id": 24, "text": "2", "bbox": {"l": 303.133, "t": 695.720963, "r": 308.11429, "b": 704.567757, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "picture", "bbox": {"l": 218.8155517578125, "t": 278.0153503417969, "r": 391.96246337890625, "b": 508.89410400390625, "coord_origin": "TOPLEFT"}, "confidence": 0.9837717413902283, "cells": [], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "text", "id": 1, "page_no": 1, "cluster": {"id": 1, "label": "text", "bbox": {"l": 133.76801, "t": 127.85095000000013, "r": 477.48172000000005, "b": 268.20489999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9870928525924683, "cells": [{"id": 0, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy", "bbox": {"l": 148.71201, "t": 127.85095000000013, "r": 477.47786999999994, "b": 136.69775000000004, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam", "bbox": {"l": 133.76801, "t": 139.80597, "r": 477.47860999999995, "b": 148.65277000000003, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita", "bbox": {"l": 133.76801, "t": 151.76099, "r": 477.47571000000005, "b": 160.60779000000002, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem", "bbox": {"l": 133.76801, "t": 163.716, "r": 477.47559, "b": 172.56281, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod", "bbox": {"l": 133.76801, "t": 175.67102, "r": 477.48169000000007, "b": 184.51782000000003, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At", "bbox": {"l": 133.76801, "t": 187.62701000000004, "r": 477.48062, "b": 196.47382000000005, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren,", "bbox": {"l": 133.76801, "t": 199.58203000000003, "r": 477.48172000000005, "b": 208.42882999999995, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor", "bbox": {"l": 133.76801, "t": 211.53705000000002, "r": 477.47772, "b": 220.38385000000005, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt", "bbox": {"l": 133.76801, "t": 223.49207, "r": 477.47971, "b": 232.33887000000004, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et", "bbox": {"l": 133.76801, "t": 235.44708000000003, "r": 477.47473, "b": 244.29387999999994, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea", "bbox": {"l": 133.76801, "t": 247.40210000000002, "r": 477.47571000000005, "b": 256.24890000000005, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "takimata sanctus est Lorem ipsum dolor sit amet.", "bbox": {"l": 133.76801, "t": 259.35808999999995, "r": 351.48471, "b": 268.20489999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet."}, {"label": "caption", "id": 3, "page_no": 1, "cluster": {"id": 3, "label": "caption", "bbox": {"l": 226.89101, "t": 523.21097, "r": 384.3548, "b": 532.05774, "coord_origin": "TOPLEFT"}, "confidence": 0.9494236707687378, "cells": [{"id": 12, "text": "Figure 2: This is an example image.", "bbox": {"l": 226.89101, "t": 523.21097, "r": 384.3548, "b": 532.05774, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 2: This is an example image."}, {"label": "text", "id": 0, "page_no": 1, "cluster": {"id": 0, "label": "text", "bbox": {"l": 133.76801, "t": 546.28195, "r": 477.48172000000005, "b": 674.67976, "coord_origin": "TOPLEFT"}, "confidence": 0.9874356985092163, "cells": [{"id": 13, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy", "bbox": {"l": 148.71201, "t": 546.28195, "r": 477.47786999999994, "b": 555.12874, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam", "bbox": {"l": 133.76801, "t": 558.23695, "r": 477.47860999999995, "b": 567.08374, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita", "bbox": {"l": 133.76801, "t": 570.19196, "r": 477.47571000000005, "b": 579.03874, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem", "bbox": {"l": 133.76801, "t": 582.14696, "r": 477.47559, "b": 590.99374, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod", "bbox": {"l": 133.76801, "t": 594.10196, "r": 477.48169000000007, "b": 602.94875, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At", "bbox": {"l": 133.76801, "t": 606.05696, "r": 477.48062, "b": 614.90375, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren,", "bbox": {"l": 133.76801, "t": 618.01295, "r": 477.48172000000005, "b": 626.85974, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor", "bbox": {"l": 133.76801, "t": 629.96796, "r": 477.47772, "b": 638.81474, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt", "bbox": {"l": 133.76801, "t": 641.92296, "r": 477.47971, "b": 650.76974, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et", "bbox": {"l": 133.76801, "t": 653.87796, "r": 477.47473, "b": 662.72475, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "accusam et justo duo dolores et ea rebum.", "bbox": {"l": 133.76801, "t": 665.83296, "r": 318.01736, "b": 674.67976, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum."}, {"label": "page_footer", "id": 4, "page_no": 1, "cluster": {"id": 4, "label": "page_footer", "bbox": {"l": 303.133, "t": 695.720963, "r": 308.11429, "b": 704.567757, "coord_origin": "TOPLEFT"}, "confidence": 0.8888521790504456, "cells": [{"id": 24, "text": "2", "bbox": {"l": 303.133, "t": 695.720963, "r": 308.11429, "b": 704.567757, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2"}, {"label": "picture", "id": 2, "page_no": 1, "cluster": {"id": 2, "label": "picture", "bbox": {"l": 218.8155517578125, "t": 278.0153503417969, "r": 391.96246337890625, "b": 508.89410400390625, "coord_origin": "TOPLEFT"}, "confidence": 0.9837717413902283, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "body": [{"label": "text", "id": 1, "page_no": 1, "cluster": {"id": 1, "label": "text", "bbox": {"l": 133.76801, "t": 127.85095000000013, "r": 477.48172000000005, "b": 268.20489999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9870928525924683, "cells": [{"id": 0, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy", "bbox": {"l": 148.71201, "t": 127.85095000000013, "r": 477.47786999999994, "b": 136.69775000000004, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam", "bbox": {"l": 133.76801, "t": 139.80597, "r": 477.47860999999995, "b": 148.65277000000003, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita", "bbox": {"l": 133.76801, "t": 151.76099, "r": 477.47571000000005, "b": 160.60779000000002, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem", "bbox": {"l": 133.76801, "t": 163.716, "r": 477.47559, "b": 172.56281, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod", "bbox": {"l": 133.76801, "t": 175.67102, "r": 477.48169000000007, "b": 184.51782000000003, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At", "bbox": {"l": 133.76801, "t": 187.62701000000004, "r": 477.48062, "b": 196.47382000000005, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren,", "bbox": {"l": 133.76801, "t": 199.58203000000003, "r": 477.48172000000005, "b": 208.42882999999995, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor", "bbox": {"l": 133.76801, "t": 211.53705000000002, "r": 477.47772, "b": 220.38385000000005, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt", "bbox": {"l": 133.76801, "t": 223.49207, "r": 477.47971, "b": 232.33887000000004, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et", "bbox": {"l": 133.76801, "t": 235.44708000000003, "r": 477.47473, "b": 244.29387999999994, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea", "bbox": {"l": 133.76801, "t": 247.40210000000002, "r": 477.47571000000005, "b": 256.24890000000005, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "takimata sanctus est Lorem ipsum dolor sit amet.", "bbox": {"l": 133.76801, "t": 259.35808999999995, "r": 351.48471, "b": 268.20489999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet."}, {"label": "caption", "id": 3, "page_no": 1, "cluster": {"id": 3, "label": "caption", "bbox": {"l": 226.89101, "t": 523.21097, "r": 384.3548, "b": 532.05774, "coord_origin": "TOPLEFT"}, "confidence": 0.9494236707687378, "cells": [{"id": 12, "text": "Figure 2: This is an example image.", "bbox": {"l": 226.89101, "t": 523.21097, "r": 384.3548, "b": 532.05774, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 2: This is an example image."}, {"label": "text", "id": 0, "page_no": 1, "cluster": {"id": 0, "label": "text", "bbox": {"l": 133.76801, "t": 546.28195, "r": 477.48172000000005, "b": 674.67976, "coord_origin": "TOPLEFT"}, "confidence": 0.9874356985092163, "cells": [{"id": 13, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy", "bbox": {"l": 148.71201, "t": 546.28195, "r": 477.47786999999994, "b": 555.12874, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam", "bbox": {"l": 133.76801, "t": 558.23695, "r": 477.47860999999995, "b": 567.08374, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita", "bbox": {"l": 133.76801, "t": 570.19196, "r": 477.47571000000005, "b": 579.03874, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem", "bbox": {"l": 133.76801, "t": 582.14696, "r": 477.47559, "b": 590.99374, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod", "bbox": {"l": 133.76801, "t": 594.10196, "r": 477.48169000000007, "b": 602.94875, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At", "bbox": {"l": 133.76801, "t": 606.05696, "r": 477.48062, "b": 614.90375, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren,", "bbox": {"l": 133.76801, "t": 618.01295, "r": 477.48172000000005, "b": 626.85974, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor", "bbox": {"l": 133.76801, "t": 629.96796, "r": 477.47772, "b": 638.81474, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt", "bbox": {"l": 133.76801, "t": 641.92296, "r": 477.47971, "b": 650.76974, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et", "bbox": {"l": 133.76801, "t": 653.87796, "r": 477.47473, "b": 662.72475, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "accusam et justo duo dolores et ea rebum.", "bbox": {"l": 133.76801, "t": 665.83296, "r": 318.01736, "b": 674.67976, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum."}, {"label": "picture", "id": 2, "page_no": 1, "cluster": {"id": 2, "label": "picture", "bbox": {"l": 218.8155517578125, "t": 278.0153503417969, "r": 391.96246337890625, "b": 508.89410400390625, "coord_origin": "TOPLEFT"}, "confidence": 0.9837717413902283, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "headers": [{"label": "page_footer", "id": 4, "page_no": 1, "cluster": {"id": 4, "label": "page_footer", "bbox": {"l": 303.133, "t": 695.720963, "r": 308.11429, "b": 704.567757, "coord_origin": "TOPLEFT"}, "confidence": 0.8888521790504456, "cells": [{"id": 24, "text": "2", "bbox": {"l": 303.133, "t": 695.720963, "r": 308.11429, "b": 704.567757, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2"}]}}]
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v1/redp5110_sampled.doctags.txt b/tests/data/groundtruth/docling_v1/redp5110_sampled.doctags.txt
index 6a6ac073..09a09bb7 100644
--- a/tests/data/groundtruth/docling_v1/redp5110_sampled.doctags.txt
+++ b/tests/data/groundtruth/docling_v1/redp5110_sampled.doctags.txt
@@ -7,9 +7,7 @@
 <figure>
 <location><page_1><loc_5><loc_11><loc_96><loc_63></location>
 </figure>
-<figure>
-<location><page_1><loc_52><loc_2><loc_95><loc_10></location>
-</figure>
+<paragraph><location><page_1><loc_47><loc_94><loc_68><loc_96></location>Front cover</paragraph>
 <subtitle-level-1><location><page_2><loc_11><loc_88><loc_28><loc_91></location>Contents</subtitle-level-1>
 <paragraph><location><page_3><loc_11><loc_89><loc_39><loc_91></location>DB2 for i Center of Excellence</paragraph>
 <paragraph><location><page_3><loc_15><loc_80><loc_38><loc_83></location>Solution Brief IBM Systems Lab Services and Training</paragraph>
@@ -49,17 +47,17 @@
 <figure>
 <location><page_4><loc_23><loc_36><loc_41><loc_53></location>
 </figure>
+<paragraph><location><page_4><loc_43><loc_35><loc_88><loc_53></location>Jim Bainbridge is a senior DB2 consultant on the DB2 for i Center of Excellence team in the IBM Lab Services and Training organization. His primary role is training and implementation services for IBM DB2 Web Query for i and business analytics. Jim began his career with IBM 30 years ago in the IBM Rochester Development Lab, where he developed cooperative processing products that paired IBM PCs with IBM S/36 and AS/.400 systems. In the years since, Jim has held numerous technical roles, including independent software vendors technical support on a broad range of IBM technologies and products, and supporting customers in the IBM Executive Briefing Center and IBM Project Office.</paragraph>
 <figure>
 <location><page_4><loc_24><loc_20><loc_41><loc_33></location>
 </figure>
-<paragraph><location><page_4><loc_43><loc_35><loc_88><loc_53></location>Jim Bainbridge is a senior DB2 consultant on the DB2 for i Center of Excellence team in the IBM Lab Services and Training organization. His primary role is training and implementation services for IBM DB2 Web Query for i and business analytics. Jim began his career with IBM 30 years ago in the IBM Rochester Development Lab, where he developed cooperative processing products that paired IBM PCs with IBM S/36 and AS/.400 systems. In the years since, Jim has held numerous technical roles, including independent software vendors technical support on a broad range of IBM technologies and products, and supporting customers in the IBM Executive Briefing Center and IBM Project Office.</paragraph>
 <paragraph><location><page_4><loc_43><loc_14><loc_88><loc_33></location>Hernando Bedoya is a Senior IT Specialist at STG Lab Services and Training in Rochester, Minnesota. He writes extensively and teaches IBM classes worldwide in all areas of DB2 for i. Before joining STG Lab Services, he worked in the ITSO for nine years writing multiple IBM Redbooksfi publications. He also worked for IBM Colombia as an IBM AS/400fi IT Specialist doing presales support for the Andean countries. He has 28 years of experience in the computing field and has taught database classes in Colombian universities. He holds a Master's degree in Computer Science from EAFIT, Colombia. His areas of expertise are database technology, performance, and data warehousing. Hernando can be contacted at hbedoya@us.ibm.com .</paragraph>
 <subtitle-level-1><location><page_4><loc_11><loc_62><loc_20><loc_64></location>Authors</subtitle-level-1>
 <figure>
 <location><page_5><loc_5><loc_70><loc_39><loc_91></location>
 </figure>
-<paragraph><location><page_5><loc_13><loc_65><loc_19><loc_66></location>Chapter 1.</paragraph>
 <paragraph><location><page_5><loc_82><loc_84><loc_85><loc_88></location>1</paragraph>
+<paragraph><location><page_5><loc_13><loc_65><loc_19><loc_66></location>Chapter 1.</paragraph>
 <subtitle-level-1><location><page_5><loc_22><loc_61><loc_89><loc_68></location>Securing and protecting IBM DB2 data</subtitle-level-1>
 <paragraph><location><page_5><loc_22><loc_46><loc_89><loc_56></location>Recent news headlines are filled with reports of data breaches and cyber-attacks impacting global businesses of all sizes. The Identity Theft Resource Center$^{1}$ reports that almost 5000 data breaches have occurred since 2005, exposing over 600 million records of data. The financial cost of these data breaches is skyrocketing. Studies from the Ponemon Institute$^{2}$ revealed that the average cost of a data breach increased in 2013 by 15% globally and resulted in a brand equity loss of $9.4 million per attack. The average cost that is incurred for each lost record containing sensitive information increased more than 9% to $145 per record.</paragraph>
 <paragraph><location><page_5><loc_22><loc_38><loc_86><loc_44></location>Businesses must make a serious effort to secure their data and recognize that securing information assets is a cost of doing business. In many parts of the world and in many industries, securing the data is required by law and subject to audits. Data security is no longer an option; it is a requirement.</paragraph>
@@ -83,7 +81,6 @@
 <paragraph><location><page_7><loc_22><loc_68><loc_88><loc_75></location>Some IBM i clients have tried augmenting the all-or-nothing object-level security with SQL views (or logical files) and application logic, as shown in Figure 1-2. However, application-based logic is easy to bypass with all of the different data access interfaces that are provided by the IBM i operating system, such as Open Database Connectivity (ODBC) and System i Navigator.</paragraph>
 <paragraph><location><page_7><loc_22><loc_60><loc_89><loc_66></location>Using SQL views to limit access to a subset of the data in a table also has its own set of challenges. First, there is the complexity of managing all of the SQL view objects that are used for securing data access. Second, scaling a view-based security solution can be difficult as the amount of data grows and the number of users increases.</paragraph>
 <paragraph><location><page_7><loc_22><loc_54><loc_89><loc_59></location>Even if you are willing to live with these performance and management issues, a user with *ALLOBJ access still can directly access all of the data in the underlying DB2 table and easily bypass the security controls that are built into an SQL view.</paragraph>
-<caption><location><page_7><loc_22><loc_12><loc_52><loc_13></location>Figure 1-2 Existing row and column controls</caption>
 <figure>
 <location><page_7><loc_22><loc_13><loc_89><loc_53></location>
 <caption>Figure 1-2 Existing row and column controls</caption>
@@ -97,7 +94,6 @@
 <paragraph><location><page_8><loc_22><loc_75><loc_72><loc_76></location>CHGFCNUSG FCNID(QIBM_DB_SECADM) USER(HBEDOYA) USAGE(*ALLOWED)</paragraph>
 <subtitle-level-1><location><page_8><loc_11><loc_71><loc_89><loc_72></location>2.1.7 Verifying function usage IDs for RCAC with the FUNCTION_USAGE view</subtitle-level-1>
 <paragraph><location><page_8><loc_22><loc_66><loc_85><loc_69></location>The FUNCTION_USAGE view contains function usage configuration details. Table 2-1 describes the columns in the FUNCTION_USAGE view.</paragraph>
-<caption><location><page_8><loc_22><loc_64><loc_46><loc_65></location>Table 2-1 FUNCTION_USAGE view</caption>
 <table>
 <location><page_8><loc_22><loc_44><loc_89><loc_63></location>
 <caption>Table 2-1 FUNCTION_USAGE view</caption>
@@ -107,8 +103,9 @@
 <row_3><col_0><body>USAGE</col_0><col_1><body>VARCHAR(7)</col_1><col_2><body>Usage setting: GLYPH<SM590000> ALLOWED: The user profile is allowed to use the function. GLYPH<SM590000> DENIED: The user profile is not allowed to use the function.</col_2></row_3>
 <row_4><col_0><body>USER_TYPE</col_0><col_1><body>VARCHAR(5)</col_1><col_2><body>Type of user profile: GLYPH<SM590000> USER: The user profile is a user. GLYPH<SM590000> GROUP: The user profile is a group.</col_2></row_4>
 </table>
+<caption><location><page_8><loc_22><loc_64><loc_46><loc_65></location>Table 2-1 FUNCTION_USAGE view</caption>
 <paragraph><location><page_8><loc_22><loc_40><loc_89><loc_43></location>To discover who has authorization to define and manage RCAC, you can use the query that is shown in Example 2-1.</paragraph>
-<paragraph><location><page_8><loc_22><loc_38><loc_76><loc_39></location>Example 2-1 Query to determine who has authority to define and manage RCAC</paragraph>
+<caption><location><page_8><loc_22><loc_38><loc_76><loc_39></location>Example 2-1 Query to determine who has authority to define and manage RCAC</caption>
 <paragraph><location><page_8><loc_22><loc_35><loc_28><loc_36></location>SELECT</paragraph>
 <paragraph><location><page_8><loc_30><loc_35><loc_41><loc_36></location>function_id,</paragraph>
 <paragraph><location><page_8><loc_27><loc_34><loc_39><loc_35></location>user_name,</paragraph>
@@ -128,16 +125,15 @@
 <paragraph><location><page_9><loc_22><loc_65><loc_89><loc_69></location>QIBM_DB_SECADM also is responsible for administering RCAC, which restricts which rows a user is allowed to access in a table and whether a user is allowed to see information in certain columns of a table.</paragraph>
 <paragraph><location><page_9><loc_22><loc_57><loc_88><loc_63></location>A preferred practice is that the RCAC administrator has the QIBM_DB_SECADM function usage ID, but absolutely no other data privileges. The result is that the RCAC administrator can deploy and maintain the RCAC constructs, but cannot grant themselves unauthorized access to data itself.</paragraph>
 <paragraph><location><page_9><loc_22><loc_53><loc_89><loc_56></location>Table 2-2 shows a comparison of the different function usage IDs and *JOBCTL authority to the different CL commands and DB2 for i tools.</paragraph>
-<caption><location><page_9><loc_11><loc_51><loc_64><loc_52></location>Table 2-2 Comparison of the different function usage IDs and *JOBCTL authority</caption>
 <table>
 <location><page_9><loc_11><loc_9><loc_89><loc_50></location>
 <caption>Table 2-2 Comparison of the different function usage IDs and *JOBCTL authority</caption>
 <row_0><col_0><row_header>User action</col_0><col_1><body>*JOBCTL</col_1><col_2><body>QIBM_DB_SECADM</col_2><col_3><body>QIBM_DB_SQLADM</col_3><col_4><body>QIBM_DB_SYSMON</col_4><col_5><body>No Authority</col_5></row_0>
 <row_1><col_0><row_header>SET CURRENT DEGREE  (SQL statement)</col_0><col_1><body>X</col_1><col_2><body></col_2><col_3><body>X</col_3><col_4><body></col_4><col_5><body></col_5></row_1>
-<row_2><col_0><row_header>CHGQRYA  command targeting a different user's job</col_0><col_1><body>X</col_1><col_2><body></col_2><col_3><body>X</col_3><col_4><body></col_4><col_5><body></col_5></row_2>
-<row_3><col_0><row_header>STRDBMON  or  ENDDBMON  commands targeting a different user's job</col_0><col_1><body>X</col_1><col_2><body></col_2><col_3><body>X</col_3><col_4><body></col_4><col_5><body></col_5></row_3>
+<row_2><col_0><row_header>CHGQRYA  command targeting a different user’s job</col_0><col_1><body>X</col_1><col_2><body></col_2><col_3><body>X</col_3><col_4><body></col_4><col_5><body></col_5></row_2>
+<row_3><col_0><row_header>STRDBMON  or  ENDDBMON  commands targeting a different user’s job</col_0><col_1><body>X</col_1><col_2><body></col_2><col_3><body>X</col_3><col_4><body></col_4><col_5><body></col_5></row_3>
 <row_4><col_0><row_header>STRDBMON  or  ENDDBMON  commands targeting a job that matches the current user</col_0><col_1><body>X</col_1><col_2><body></col_2><col_3><body>X</col_3><col_4><body>X</col_4><col_5><body>X</col_5></row_4>
-<row_5><col_0><row_header>QUSRJOBI() API format 900 or System i Navigator's SQL Details for Job</col_0><col_1><body>X</col_1><col_2><body></col_2><col_3><body>X</col_3><col_4><body>X</col_4><col_5><body></col_5></row_5>
+<row_5><col_0><row_header>QUSRJOBI() API format 900 or System i Navigator’s SQL Details for Job</col_0><col_1><body>X</col_1><col_2><body></col_2><col_3><body>X</col_3><col_4><body>X</col_4><col_5><body></col_5></row_5>
 <row_6><col_0><row_header>Visual Explain within Run SQL scripts</col_0><col_1><body>X</col_1><col_2><body></col_2><col_3><body>X</col_3><col_4><body>X</col_4><col_5><body>X</col_5></row_6>
 <row_7><col_0><row_header>Visual Explain outside of Run SQL scripts</col_0><col_1><body>X</col_1><col_2><body></col_2><col_3><body>X</col_3><col_4><body></col_4><col_5><body></col_5></row_7>
 <row_8><col_0><row_header>ANALYZE PLAN CACHE procedure</col_0><col_1><body>X</col_1><col_2><body></col_2><col_3><body>X</col_3><col_4><body></col_4><col_5><body></col_5></row_8>
@@ -146,16 +142,15 @@
 <row_11><col_0><row_header>MODIFY PLAN CACHE PROPERTIES procedure (currently does not check authority)</col_0><col_1><body>X</col_1><col_2><body></col_2><col_3><body>X</col_3><col_4><body></col_4><col_5><body></col_5></row_11>
 <row_12><col_0><row_header>CHANGE PLAN CACHE SIZE procedure (currently does not check authority)</col_0><col_1><body>X</col_1><col_2><body></col_2><col_3><body>X</col_3><col_4><body></col_4><col_5><body></col_5></row_12>
 </table>
+<caption><location><page_9><loc_11><loc_51><loc_64><loc_52></location>Table 2-2 Comparison of the different function usage IDs and *JOBCTL authority</caption>
 <caption><location><page_10><loc_22><loc_88><loc_86><loc_91></location>The SQL CREATE PERMISSION statement that is shown in Figure 3-1 is used to define and initially enable or disable the row access rules.</caption>
-<caption><location><page_10><loc_22><loc_47><loc_56><loc_48></location>Figure 3-1 CREATE PERMISSION SQL statement</caption>
 <figure>
 <location><page_10><loc_22><loc_48><loc_89><loc_86></location>
-<caption>The SQL CREATE PERMISSION statement that is shown in Figure 3-1 is used to define and initially enable or disable the row access rules.Figure 3-1 CREATE PERMISSION SQL statement</caption>
+<caption>Figure 3-1 CREATE PERMISSION SQL statement</caption>
 </figure>
 <subtitle-level-1><location><page_10><loc_22><loc_43><loc_35><loc_44></location>Column mask</subtitle-level-1>
 <paragraph><location><page_10><loc_22><loc_37><loc_89><loc_43></location>A column mask is a database object that manifests a column value access control rule for a specific column in a specific table. It uses a CASE expression that describes what you see when you access the column. For example, a teller can see only the last four digits of a tax identification number.</paragraph>
-<paragraph><location><page_11><loc_22><loc_90><loc_67><loc_91></location>Table 3-1 summarizes these special registers and their values.</paragraph>
-<caption><location><page_11><loc_22><loc_87><loc_61><loc_88></location>Table 3-1 Special registers and their corresponding values</caption>
+<caption><location><page_11><loc_22><loc_90><loc_67><loc_91></location>Table 3-1 summarizes these special registers and their values.</caption>
 <table>
 <location><page_11><loc_22><loc_74><loc_89><loc_87></location>
 <caption>Table 3-1 Special registers and their corresponding values</caption>
@@ -164,13 +159,13 @@
 <row_2><col_0><body>CURRENT_USER</col_0><col_1><body>The effective user of the thread including adopted authority. When no adopted  authority is present, this has the same value as USER.</col_1></row_2>
 <row_3><col_0><body>SYSTEM_USER</col_0><col_1><body>The authorization ID that initiated the connection.</col_1></row_3>
 </table>
+<caption><location><page_11><loc_22><loc_87><loc_61><loc_88></location>Table 3-1 Special registers and their corresponding values</caption>
 <paragraph><location><page_11><loc_22><loc_70><loc_88><loc_73></location>Figure 3-5 shows the difference in the special register values when an adopted authority is used:</paragraph>
 <paragraph><location><page_11><loc_22><loc_68><loc_67><loc_69></location>- GLYPH<SM590000> A user connects to the server using the user profile ALICE.</paragraph>
 <paragraph><location><page_11><loc_22><loc_66><loc_74><loc_67></location>- GLYPH<SM590000> USER and CURRENT USER initially have the same value of ALICE.</paragraph>
 <paragraph><location><page_11><loc_22><loc_62><loc_88><loc_65></location>- GLYPH<SM590000> ALICE calls an SQL procedure that is named proc1, which is owned by user profile JOE and was created to adopt JOE's authority when it is called.</paragraph>
 <paragraph><location><page_11><loc_22><loc_57><loc_89><loc_61></location>- GLYPH<SM590000> While the procedure is running, the special register USER still contains the value of ALICE because it excludes any adopted authority. The special register CURRENT USER contains the value of JOE because it includes any adopted authority.</paragraph>
 <paragraph><location><page_11><loc_22><loc_53><loc_89><loc_56></location>- GLYPH<SM590000> When proc1 ends, the session reverts to its original state with both USER and CURRENT USER having the value of ALICE.</paragraph>
-<caption><location><page_11><loc_22><loc_24><loc_56><loc_25></location>Figure 3-5 Special registers and adopted authority</caption>
 <figure>
 <location><page_11><loc_22><loc_25><loc_49><loc_51></location>
 <caption>Figure 3-5 Special registers and adopted authority</caption>
@@ -179,7 +174,6 @@
 <paragraph><location><page_11><loc_22><loc_15><loc_85><loc_18></location>Built-in global variables are provided with the database manager and are used in SQL statements to retrieve scalar values that are associated with the variables.</paragraph>
 <paragraph><location><page_11><loc_22><loc_9><loc_87><loc_13></location>IBM DB2 for i supports nine different built-in global variables that are read only and maintained by the system. These global variables can be used to identify attributes of the database connection and used as part of the RCAC logic.</paragraph>
 <paragraph><location><page_12><loc_22><loc_90><loc_56><loc_91></location>Table 3-2 lists the nine built-in global variables.</paragraph>
-<caption><location><page_12><loc_11><loc_87><loc_33><loc_88></location>Table 3-2 Built-in global variables</caption>
 <table>
 <location><page_12><loc_10><loc_63><loc_90><loc_87></location>
 <caption>Table 3-2 Built-in global variables</caption>
@@ -194,6 +188,7 @@
 <row_8><col_0><body>ROUTINE_SPECIFIC_NAME</col_0><col_1><body>VARCHAR(128)</col_1><col_2><body>Name of the currently running routine</col_2></row_8>
 <row_9><col_0><body>ROUTINE_TYPE</col_0><col_1><body>CHAR(1)</col_1><col_2><body>Type of the currently running routine</col_2></row_9>
 </table>
+<caption><location><page_12><loc_11><loc_87><loc_33><loc_88></location>Table 3-2 Built-in global variables</caption>
 <subtitle-level-1><location><page_12><loc_11><loc_57><loc_63><loc_59></location>3.3 VERIFY_GROUP_FOR_USER function</subtitle-level-1>
 <paragraph><location><page_12><loc_22><loc_45><loc_89><loc_55></location>The VERIFY_GROUP_FOR_USER function was added in IBM i 7.2. Although it is primarily intended for use with RCAC permissions and masks, it can be used in other SQL statements. The first parameter must be one of these three special registers: SESSION_USER, USER, or CURRENT_USER. The second and subsequent parameters are a list of user or group profiles. Each of these values must be 1 - 10 characters in length. These values are not validated for their existence, which means that you can specify the names of user profiles that do not exist without receiving any kind of error.</paragraph>
 <paragraph><location><page_12><loc_22><loc_39><loc_89><loc_43></location>If a special register value is in the list of user profiles or it is a member of a group profile included in the list, the function returns a long integer value of 1. Otherwise, it returns a value of 0. It never returns the null value.</paragraph>
@@ -211,10 +206,9 @@
 <paragraph><location><page_13><loc_25><loc_55><loc_89><loc_57></location>- -Managers see a masked version of TAX_ID with the first five characters replaced with the X character (for example, XXX-XX-1234).</paragraph>
 <paragraph><location><page_13><loc_25><loc_52><loc_87><loc_54></location>- -Any other person sees the entire TAX_ID as masked, for example, XXX-XX-XXXX.</paragraph>
 <paragraph><location><page_13><loc_25><loc_50><loc_87><loc_51></location>- To implement this column mask, run the SQL statement that is shown in Example 3-9.</paragraph>
-<paragraph><location><page_13><loc_22><loc_48><loc_58><loc_49></location>Example 3-9 Creating a mask on the TAX_ID column</paragraph>
 <paragraph><location><page_13><loc_22><loc_14><loc_86><loc_47></location>CREATE MASK HR_SCHEMA.MASK_TAX_ID_ON_EMPLOYEES ON HR_SCHEMA.EMPLOYEES AS EMPLOYEES FOR COLUMN TAX_ID RETURN CASE WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'HR' ) = 1 THEN EMPLOYEES . TAX_ID WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1 AND SESSION_USER = EMPLOYEES . USER_ID THEN EMPLOYEES . TAX_ID WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1 AND SESSION_USER <> EMPLOYEES . USER_ID THEN ( 'XXX-XX-' CONCAT QSYS2 . SUBSTR ( EMPLOYEES . TAX_ID , 8 , 4 ) ) WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'EMP' ) = 1 THEN EMPLOYEES . TAX_ID ELSE 'XXX-XX-XXXX' END ENABLE ;</paragraph>
+<caption><location><page_13><loc_22><loc_48><loc_58><loc_49></location>Example 3-9 Creating a mask on the TAX_ID column</caption>
 <paragraph><location><page_14><loc_22><loc_90><loc_74><loc_91></location>- 3. Figure 3-10 shows the masks that are created in the HR_SCHEMA.</paragraph>
-<caption><location><page_14><loc_11><loc_77><loc_48><loc_78></location>Figure 3-10 Column masks shown in System i Navigator</caption>
 <figure>
 <location><page_14><loc_10><loc_79><loc_89><loc_88></location>
 <caption>Figure 3-10 Column masks shown in System i Navigator</caption>
@@ -230,19 +224,16 @@
 <paragraph><location><page_14><loc_22><loc_55><loc_44><loc_56></location>ACTIVATE ROW ACCESS CONTROL</paragraph>
 <paragraph><location><page_14><loc_22><loc_54><loc_48><loc_55></location>ACTIVATE COLUMN ACCESS CONTROL;</paragraph>
 <paragraph><location><page_14><loc_22><loc_48><loc_88><loc_52></location>- 2. Look at the definition of the EMPLOYEE table, as shown in Figure 3-11. To do this, from the main navigation pane of System i Navigator, click Schemas  HR_SCHEMA  Tables , right-click the EMPLOYEES table, and click Definition .</paragraph>
-<caption><location><page_14><loc_11><loc_17><loc_57><loc_18></location>Figure 3-11 Selecting the EMPLOYEES table from System i Navigator</caption>
 <figure>
 <location><page_14><loc_10><loc_18><loc_87><loc_46></location>
 <caption>Figure 3-11 Selecting the EMPLOYEES table from System i Navigator</caption>
 </figure>
 <paragraph><location><page_15><loc_22><loc_87><loc_84><loc_91></location>- 2. Figure 4-68 shows the Visual Explain of the same SQL statement, but with RCAC enabled. It is clear that the implementation of the SQL statement is more complex because the row permission rule becomes part of the WHERE clause.</paragraph>
-<caption><location><page_15><loc_22><loc_38><loc_53><loc_39></location>Figure 4-68 Visual Explain with RCAC enabled</caption>
+<paragraph><location><page_15><loc_22><loc_32><loc_89><loc_36></location>- 3. Compare the advised indexes that are provided by the Optimizer without RCAC and with RCAC enabled. Figure 4-69 shows the index advice for the SQL statement without RCAC enabled. The index being advised is for the ORDER BY clause.</paragraph>
 <figure>
 <location><page_15><loc_22><loc_40><loc_89><loc_85></location>
 <caption>Figure 4-68 Visual Explain with RCAC enabled</caption>
 </figure>
-<paragraph><location><page_15><loc_22><loc_32><loc_89><loc_36></location>- 3. Compare the advised indexes that are provided by the Optimizer without RCAC and with RCAC enabled. Figure 4-69 shows the index advice for the SQL statement without RCAC enabled. The index being advised is for the ORDER BY clause.</paragraph>
-<caption><location><page_15><loc_11><loc_15><loc_37><loc_16></location>Figure 4-69 Index advice with no RCAC</caption>
 <figure>
 <location><page_15><loc_11><loc_16><loc_83><loc_30></location>
 <caption>Figure 4-69 Index advice with no RCAC</caption>
@@ -252,8 +243,8 @@
 <subtitle-level-1><location><page_18><loc_4><loc_82><loc_73><loc_91></location>Row and Column Access Control Support in IBM DB2 for i</subtitle-level-1>
 <paragraph><location><page_18><loc_4><loc_66><loc_21><loc_69></location>Implement roles and separation of duties</paragraph>
 <paragraph><location><page_18><loc_4><loc_59><loc_20><loc_64></location>Leverage row permissions on the database</paragraph>
-<paragraph><location><page_18><loc_4><loc_52><loc_20><loc_57></location>Protect columns by defining column masks</paragraph>
 <paragraph><location><page_18><loc_25><loc_59><loc_68><loc_69></location>This IBM Redpaper publication provides information about the IBM i 7.2 feature of IBM DB2 for i Row and Column Access Control (RCAC). It offers a broad description of the function and advantages of controlling access to data in a comprehensive and transparent way. This publication helps you understand the capabilities of RCAC and provides examples of defining, creating, and implementing the row permissions and column masks in a relational database environment.</paragraph>
+<paragraph><location><page_18><loc_4><loc_52><loc_20><loc_57></location>Protect columns by defining column masks</paragraph>
 <paragraph><location><page_18><loc_25><loc_51><loc_68><loc_58></location>This paper is intended for database engineers, data-centric application developers, and security officers who want to design and implement RCAC as a part of their data control and governance policy. A solid background in IBM i object level security, DB2 for i relational database concepts, and SQL is assumed.</paragraph>
 <figure>
 <location><page_18><loc_79><loc_93><loc_93><loc_97></location>
diff --git a/tests/data/groundtruth/docling_v1/redp5110_sampled.json b/tests/data/groundtruth/docling_v1/redp5110_sampled.json
index 4f35cf91..221d8aa1 100644
--- a/tests/data/groundtruth/docling_v1/redp5110_sampled.json
+++ b/tests/data/groundtruth/docling_v1/redp5110_sampled.json
@@ -1 +1 @@
-{"_name": "", "type": "pdf-document", "description": {"title": null, "abstract": null, "authors": null, "affiliations": null, "subjects": null, "keywords": null, "publication_date": null, "languages": null, "license": null, "publishers": null, "url_refs": null, "references": null, "publication": null, "reference_count": null, "citation_count": null, "citation_date": null, "advanced": null, "analytics": null, "logs": [], "collection": null, "acquisition": null}, "file-info": {"filename": "redp5110_sampled.pdf", "filename-prov": null, "document-hash": "bbf706f95c6042a4bcfa73a17f1472d798886d79065340ed2772992ea399a12f", "#-pages": 18, "collection-name": null, "description": null, "page-hashes": [{"hash": "8633d627a4ae407aaaede920b471d3058de656dab15d04e7d469632352890d4f", "model": "default", "page": 1}, {"hash": "ffca227099d3b581b935322e37806bb2115d104b59824ae47123f96c3717d8d4", "model": "default", "page": 2}, {"hash": "8450a101294966dc3666779e939d5d1c42dc98d2def2ac182e6a4742db908373", "model": "default", "page": 3}, {"hash": "6adc167183cbcf48541b4c076619508c0bb4a29d700308bc2a6e25a03ee35187", "model": "default", "page": 4}, {"hash": "3432d7c0892def70d3f5c2f4370fdcd728318810b6dc4a6c518f67ae1b2447cc", "model": "default", "page": 5}, {"hash": "cbddc773b2827bccbef5ffbd40190cb8eae1ee4956e57d02e0c98aff49cb7649", "model": "default", "page": 6}, {"hash": "02469ba69dff12aa1f322353cceb8b6a77a4bd92f457db01588f2bdc5f4290fe", "model": "default", "page": 7}, {"hash": "07c07b53d33e143a39b310225d156917a90398dcdf1d703f1556f952202d1474", "model": "default", "page": 8}, {"hash": "79fd01636330ea2c4b059ef3be69cfe67456924c319b3843c2cf01610f191354", "model": "default", "page": 9}, {"hash": "beac1aa99a1b5263bd18cab36cda3b4bb32308c70f8a80f5e4d088fb4feb5d41", "model": "default", "page": 10}, {"hash": "cebcf723129cb1260b0aaf0de2c9441d5b733bf9a5b494f0121b46d9e99cf6e9", "model": "default", "page": 11}, {"hash": "9d262e1cb504e092ecd989740dff6d2483a202fc36c4707230e3cdca094d2b38", "model": "default", "page": 12}, {"hash": "19a4949dea604878e01bb7fd5cc3fc0d719735fabdef3b0d43928af5c8b1730c", "model": "default", "page": 13}, {"hash": "b557acf2a8fd0918b3dc7f8c220b64f841e799325fd85796b2557c969fc1e1d0", "model": "default", "page": 14}, {"hash": "79b6d9cc327fde220894a8e04ffd5787dd8d862377e3deea082166e7aaa55a2f", "model": "default", "page": 15}, {"hash": "568a57bc2161bbb06ed17d48180e72826cdf7c8281e4914b9079c63c6373ad73", "model": "default", "page": 16}, {"hash": "3a1997b2253e42313f5b6c9eecf2f2f09f36a2b92da062d3972d13d06a6b0c8c", "model": "default", "page": 17}, {"hash": "8f11363a05bd1a5ba2ad45f12697bd8113576602c302f34ba6b50e8fc6f43047", "model": "default", "page": 18}]}, "main-text": [{"prov": [{"bbox": [287.82000732421875, 741.251953125, 418.83355712890625, 763.4519653320312], "page": 1, "span": [0, 11], "__ref_s3_data": null}], "text": "Front cover", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"name": "Picture", "type": "figure", "$ref": "#/figures/0"}, {"prov": [{"bbox": [35.70000076293945, 626.1588745117188, 584.6428833007812, 707.4134521484375], "page": 1, "span": [0, 54], "__ref_s3_data": null}], "text": "Row and Column Access Control Support in IBM DB2 for i", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"name": "Picture", "type": "figure", "$ref": "#/figures/1"}, {"prov": [{"bbox": [36.900001525878906, 26.895000457763672, 164.45849609375, 40.77000045776367], "page": 1, "span": [0, 17], "__ref_s3_data": null}], "text": "ibm.com /redbooks", "type": "page-footer", "payload": null, "name": "Page-footer", "font": null}, {"name": "Picture", "type": "figure", "$ref": "#/figures/2"}, {"prov": [{"bbox": [64.80000305175781, 695.9519653320312, 168.73440551757812, 718.1519775390625], "page": 2, "span": [0, 8], "__ref_s3_data": null}], "text": "Contents", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"name": "Document Index", "type": "table-of-contents", "$ref": "#/tables/0"}, {"prov": [{"bbox": [64.80000305175781, 28.136999130249023, 257.24334716796875, 36.461997985839844], "page": 2, "span": [0, 48], "__ref_s3_data": null}], "text": "' Copyright IBM Corp. 2014. All rights reserved.", "type": "page-footer", "payload": null, "name": "Page-footer", "font": null}, {"prov": [{"bbox": [538.8599853515625, 27.93828010559082, 547.25927734375, 37.15127944946289], "page": 2, "span": [0, 3], "__ref_s3_data": null}], "text": "iii", "type": "page-footer", "payload": null, "name": "Page-footer", "font": null}, {"prov": [{"bbox": [64.80000305175781, 706.416015625, 235.86239624023438, 717.5160522460938], "page": 3, "span": [0, 30], "__ref_s3_data": null}], "text": "DB2 for i Center of Excellence", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [94.13269805908203, 636.66357421875, 233.99972534179688, 653.5498657226562], "page": 3, "span": [0, 52], "__ref_s3_data": null}], "text": "Solution Brief IBM Systems Lab Services and Training", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"name": "Picture", "type": "figure", "$ref": "#/figures/3"}, {"prov": [{"bbox": [144.8892059326172, 455.1859436035156, 188.74681091308594, 464.5383605957031], "page": 3, "span": [0, 10], "__ref_s3_data": null}], "text": "Highlights", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [144.8892059326172, 433.3105773925781, 242.87388610839844, 446.7829284667969], "page": 3, "span": [0, 532], "__ref_s3_data": null}], "text": "- GLYPH<g115>GLYPH<g3> GLYPH<g40>GLYPH<g81>GLYPH<g75>GLYPH<g68>GLYPH<g81>GLYPH<g70>GLYPH<g72>GLYPH<g3> GLYPH<g87>GLYPH<g75>GLYPH<g72>GLYPH<g3> GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g73>GLYPH<g82>GLYPH<g85>GLYPH<g80>GLYPH<g68>GLYPH<g81>GLYPH<g70>GLYPH<g72>GLYPH<g3> GLYPH<g82>GLYPH<g73>GLYPH<g3> GLYPH<g92>GLYPH<g82>GLYPH<g88>GLYPH<g85> GLYPH<g3> GLYPH<g71>GLYPH<g68>GLYPH<g87>GLYPH<g68>GLYPH<g69>GLYPH<g68>GLYPH<g86>GLYPH<g72>GLYPH<g3> GLYPH<g82>GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g68>GLYPH<g87>GLYPH<g76>GLYPH<g82>GLYPH<g81>GLYPH<g86>", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [144.8892059326172, 402.7626953125, 259.22869873046875, 424.06781005859375], "page": 3, "span": [0, 876], "__ref_s3_data": null}], "text": "- GLYPH<g115>GLYPH<g3> GLYPH<g40>GLYPH<g68>GLYPH<g85> GLYPH<g81>GLYPH<g3> GLYPH<g74>GLYPH<g85>GLYPH<g72>GLYPH<g68>GLYPH<g87>GLYPH<g72>GLYPH<g85>GLYPH<g3> GLYPH<g85>GLYPH<g72>GLYPH<g87>GLYPH<g88>GLYPH<g85> GLYPH<g81>GLYPH<g3> GLYPH<g82>GLYPH<g81>GLYPH<g3> GLYPH<g44>GLYPH<g55>GLYPH<g3> GLYPH<g83>GLYPH<g85>GLYPH<g82>GLYPH<g77>GLYPH<g72>GLYPH<g70>GLYPH<g87>GLYPH<g86> GLYPH<g3> GLYPH<g87>GLYPH<g75>GLYPH<g85>GLYPH<g82>GLYPH<g88>GLYPH<g74>GLYPH<g75>GLYPH<g3> GLYPH<g80>GLYPH<g82>GLYPH<g71>GLYPH<g72>GLYPH<g85> GLYPH<g81>GLYPH<g76>GLYPH<g93>GLYPH<g68>GLYPH<g87>GLYPH<g76>GLYPH<g82>GLYPH<g81>GLYPH<g3> GLYPH<g82>GLYPH<g73>GLYPH<g3> GLYPH<g71>GLYPH<g68>GLYPH<g87>GLYPH<g68>GLYPH<g69>GLYPH<g68>GLYPH<g86>GLYPH<g72>GLYPH<g3> GLYPH<g68>GLYPH<g81>GLYPH<g71> GLYPH<g3> GLYPH<g68>GLYPH<g83>GLYPH<g83>GLYPH<g79>GLYPH<g76>GLYPH<g70>GLYPH<g68>GLYPH<g87>GLYPH<g76>GLYPH<g82>GLYPH<g81>GLYPH<g86>", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [144.8892059326172, 380.0474548339844, 249.8356170654297, 393.5198059082031], "page": 3, "span": [0, 672], "__ref_s3_data": null}], "text": "- GLYPH<g115>GLYPH<g3> GLYPH<g53>GLYPH<g72>GLYPH<g79>GLYPH<g92>GLYPH<g3> GLYPH<g82>GLYPH<g81>GLYPH<g3> GLYPH<g44>GLYPH<g37>GLYPH<g48>GLYPH<g3> GLYPH<g72>GLYPH<g91>GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g87>GLYPH<g3> GLYPH<g70>GLYPH<g82>GLYPH<g81>GLYPH<g86>GLYPH<g88>GLYPH<g79>GLYPH<g87>GLYPH<g76>GLYPH<g81>GLYPH<g74>GLYPH<g15>GLYPH<g3> GLYPH<g86>GLYPH<g78>GLYPH<g76>GLYPH<g79>GLYPH<g79>GLYPH<g86> GLYPH<g3> GLYPH<g86>GLYPH<g75>GLYPH<g68>GLYPH<g85>GLYPH<g76>GLYPH<g81>GLYPH<g74>GLYPH<g3> GLYPH<g68>GLYPH<g81>GLYPH<g71>GLYPH<g3> GLYPH<g85>GLYPH<g72>GLYPH<g81>GLYPH<g82>GLYPH<g90>GLYPH<g81>GLYPH<g3> GLYPH<g86>GLYPH<g72>GLYPH<g85>GLYPH<g89>GLYPH<g76>GLYPH<g70>GLYPH<g72>GLYPH<g86>", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [144.8892059326172, 357.3323669433594, 234.2516326904297, 370.8047180175781], "page": 3, "span": [0, 613], "__ref_s3_data": null}], "text": "- GLYPH<g115>GLYPH<g3> GLYPH<g55> GLYPH<g68>GLYPH<g78>GLYPH<g72>GLYPH<g3> GLYPH<g68>GLYPH<g71>GLYPH<g89>GLYPH<g68>GLYPH<g81>GLYPH<g87>GLYPH<g68>GLYPH<g74>GLYPH<g72>GLYPH<g3> GLYPH<g82>GLYPH<g73>GLYPH<g3> GLYPH<g68>GLYPH<g70>GLYPH<g70>GLYPH<g72>GLYPH<g86>GLYPH<g86>GLYPH<g3> GLYPH<g87>GLYPH<g82>GLYPH<g3> GLYPH<g68> GLYPH<g3> GLYPH<g90>GLYPH<g82>GLYPH<g85>GLYPH<g79>GLYPH<g71>GLYPH<g90>GLYPH<g76>GLYPH<g71>GLYPH<g72>GLYPH<g3> GLYPH<g86>GLYPH<g82>GLYPH<g88>GLYPH<g85>GLYPH<g70>GLYPH<g72>GLYPH<g3> GLYPH<g82>GLYPH<g73>GLYPH<g3> GLYPH<g72>GLYPH<g91>GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g87>GLYPH<g76>GLYPH<g86>GLYPH<g72>", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"name": "Picture", "type": "figure", "$ref": "#/figures/4"}, {"prov": [{"bbox": [461.0885925292969, 646.5781860351562, 506.26177978515625, 653.5924682617188], "page": 3, "span": [0, 14], "__ref_s3_data": null}], "text": "Power Services", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [280.2401123046875, 515.3794555664062, 463.8094177246094, 552.6573486328125], "page": 3, "span": [0, 30], "__ref_s3_data": null}], "text": "DB2 for i Center of Excellence", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [280.2401123046875, 504.5404052734375, 483.29571533203125, 514.4097290039062], "page": 3, "span": [0, 49], "__ref_s3_data": null}], "text": "Expert help to achieve your business requirements", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [280.2401123046875, 467.1043395996094, 443.2821044921875, 476.1183776855469], "page": 3, "span": [0, 37], "__ref_s3_data": null}], "text": "We build confident, satisfied clients", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [280.2401123046875, 447.0404968261719, 488.1546630859375, 464.6240539550781], "page": 3, "span": [0, 122], "__ref_s3_data": null}], "text": "No one else has the vast consulting experiences, skills sharing and renown service offerings to do what we can do for you.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [280.2401123046875, 427.2699890136719, 367.8602294921875, 434.6739807128906], "page": 3, "span": [0, 27], "__ref_s3_data": null}], "text": "Because no one else is IBM.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [280.2401123046875, 366.77972412109375, 500.321044921875, 414.9019775390625], "page": 3, "span": [0, 318], "__ref_s3_data": null}], "text": "With combined experiences and direct access to development groups, we're the experts in IBM DB2\u00ae for i. The DB2 for i Center of Excellence (CoE) can help you achieve-perhaps reexamine and exceed-your business requirements and gain more confidence and satisfaction in IBM product data management products and solutions.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [280.2401123046875, 345.1319274902344, 434.8320617675781, 354.1459655761719], "page": 3, "span": [0, 30], "__ref_s3_data": null}], "text": "Who we are, some of what we do", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [280.2401123046875, 335.2477722167969, 434.56317138671875, 342.6517639160156], "page": 3, "span": [0, 46], "__ref_s3_data": null}], "text": "Global CoE engagements cover topics including:", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [280.2401123046875, 315.4777526855469, 401.5641174316406, 322.8817443847656], "page": 3, "span": [0, 38], "__ref_s3_data": null}], "text": "- r Database performance and scalability", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [280.2401123046875, 305.2950439453125, 424.9964599609375, 312.69903564453125], "page": 3, "span": [0, 44], "__ref_s3_data": null}], "text": "- r Advanced SQL knowledge and skills transfer", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [280.2401123046875, 295.1124572753906, 392.158447265625, 302.5164489746094], "page": 3, "span": [0, 37], "__ref_s3_data": null}], "text": "- r Business intelligence and analytics", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [280.2401123046875, 284.92974853515625, 339.94354248046875, 292.333740234375], "page": 3, "span": [0, 15], "__ref_s3_data": null}], "text": "- r DB2 Web Query", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [280.2401123046875, 274.7471618652344, 504.1931457519531, 282.1511535644531], "page": 3, "span": [0, 72], "__ref_s3_data": null}], "text": "- r Query/400 modernization for better reporting and analysis capabilities", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [280.2401123046875, 264.564453125, 423.002197265625, 271.96844482421875], "page": 3, "span": [0, 43], "__ref_s3_data": null}], "text": "- r Database modernization and re-engineering", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [280.2401123046875, 254.38186645507812, 399.6517333984375, 261.7858581542969], "page": 3, "span": [0, 38], "__ref_s3_data": null}], "text": "- r Data-centric architecture and design", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [280.2401123046875, 244.1992645263672, 466.77880859375, 251.60325622558594], "page": 3, "span": [0, 58], "__ref_s3_data": null}], "text": "- r Extremely large database and overcoming limits to growth", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [280.2401123046875, 234.0165557861328, 382.2095642089844, 241.42054748535156], "page": 3, "span": [0, 30], "__ref_s3_data": null}], "text": "- r ISV education and enablement", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [64.80000305175781, 695.9519653320312, 151.46160888671875, 718.1519775390625], "page": 4, "span": [0, 7], "__ref_s3_data": null}], "text": "Preface", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [136.79983520507812, 590.1392822265625, 547.3082275390625, 659.3513793945312], "page": 4, "span": [0, 469], "__ref_s3_data": null}], "text": "This IBMfi Redpaper\u2122 publication provides information about the IBM i 7.2 feature of IBM DB2fi for i Row and Column Access Control (RCAC). It offers a broad description of the function and advantages of controlling access to data in a comprehensive and transparent way. This publication helps you understand the capabilities of RCAC and provides examples of defining, creating, and implementing the row permissions and column masks in a relational database environment.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [136.79986572265625, 532.1800537109375, 546.4656982421875, 577.3925170898438], "page": 4, "span": [0, 309], "__ref_s3_data": null}], "text": "This paper is intended for database engineers, data-centric application developers, and security officers who want to design and implement RCAC as a part of their data control and governance policy. A solid background in IBM i object level security, DB2 for i relational database concepts, and SQL is assumed.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [136.8000030517578, 450.1584777832031, 547.2366943359375, 471.37127685546875], "page": 4, "span": [0, 172], "__ref_s3_data": null}], "text": "This paper was produced by the IBM DB2 for i Center of Excellence team in partnership with the International Technical Support Organization (ITSO), Rochester, Minnesota US.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"name": "Picture", "type": "figure", "$ref": "#/figures/5"}, {"name": "Picture", "type": "figure", "$ref": "#/figures/6"}, {"prov": [{"bbox": [64.80000305175781, 28.136999130249023, 257.24334716796875, 36.461997985839844], "page": 4, "span": [0, 48], "__ref_s3_data": null}], "text": "' Copyright IBM Corp. 2014. All rights reserved.", "type": "page-footer", "payload": null, "name": "Page-footer", "font": null}, {"prov": [{"bbox": [538.8599853515625, 27.93828010559082, 547.2503051757812, 37.15127944946289], "page": 4, "span": [0, 2], "__ref_s3_data": null}], "text": "xi", "type": "page-footer", "payload": null, "name": "Page-footer", "font": null}, {"prov": [{"bbox": [263.3995666503906, 275.1402587890625, 541.2507934570312, 416.3512268066406], "page": 4, "span": [0, 684], "__ref_s3_data": null}], "text": "Jim Bainbridge is a senior DB2 consultant on the DB2 for i Center of Excellence team in the IBM Lab Services and Training organization. His primary role is training and implementation services for IBM DB2 Web Query for i and business analytics. Jim began his career with IBM 30 years ago in the IBM Rochester Development Lab, where he developed cooperative processing products that paired IBM PCs with IBM S/36 and AS/.400 systems. In the years since, Jim has held numerous technical roles, including independent software vendors technical support on a broad range of IBM technologies and products, and supporting customers in the IBM Executive Briefing Center and IBM Project Office.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [263.39959716796875, 111.162841796875, 541.2737426757812, 264.37347412109375], "page": 4, "span": [0, 726], "__ref_s3_data": null}], "text": "Hernando Bedoya is a Senior IT Specialist at STG Lab Services and Training in Rochester, Minnesota. He writes extensively and teaches IBM classes worldwide in all areas of DB2 for i. Before joining STG Lab Services, he worked in the ITSO for nine years writing multiple IBM Redbooksfi publications. He also worked for IBM Colombia as an IBM AS/400fi IT Specialist doing presales support for the Andean countries. He has 28 years of experience in the computing field and has taught database classes in Colombian universities. He holds a Master's degree in Computer Science from EAFIT, Colombia. His areas of expertise are database technology, performance, and data warehousing. Hernando can be contacted at hbedoya@us.ibm.com .", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [64.80000305175781, 488.9364013671875, 125.36660766601562, 503.69940185546875], "page": 4, "span": [0, 7], "__ref_s3_data": null}], "text": "Authors", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"name": "Picture", "type": "figure", "$ref": "#/figures/7"}, {"prov": [{"bbox": [81.0, 517.019287109375, 115.13253021240234, 523.457275390625], "page": 5, "span": [0, 10], "__ref_s3_data": null}], "text": "Chapter 1.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [500.3999938964844, 661.8682861328125, 522.6177368164062, 698.831298828125], "page": 5, "span": [0, 1], "__ref_s3_data": null}], "text": "1", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [136.8000030517578, 482.1217956542969, 547.3047485351562, 537.1136474609375], "page": 5, "span": [0, 36], "__ref_s3_data": null}], "text": "Securing and protecting IBM DB2 data", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [136.79965209960938, 362.078857421875, 547.2540283203125, 443.2912902832031], "page": 5, "span": [0, 648], "__ref_s3_data": null}], "text": "Recent news headlines are filled with reports of data breaches and cyber-attacks impacting global businesses of all sizes. The Identity Theft Resource Center$^{1}$ reports that almost 5000 data breaches have occurred since 2005, exposing over 600 million records of data. The financial cost of these data breaches is skyrocketing. Studies from the Ponemon Institute$^{2}$ revealed that the average cost of a data breach increased in 2013 by 15% globally and resulted in a brand equity loss of $9.4 million per attack. The average cost that is incurred for each lost record containing sensitive information increased more than 9% to $145 per record.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [136.80023193359375, 304.0598449707031, 527.206298828125, 349.27227783203125], "page": 5, "span": [0, 304], "__ref_s3_data": null}], "text": "Businesses must make a serious effort to secure their data and recognize that securing information assets is a cost of doing business. In many parts of the world and in many industries, securing the data is required by law and subject to audits. Data security is no longer an option; it is a requirement.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [136.8002471923828, 270.1002197265625, 547.1551513671875, 291.3130187988281], "page": 5, "span": [0, 122], "__ref_s3_data": null}], "text": "This chapter describes how you can secure and protect data in DB2 for i. The following topics are covered in this chapter:", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [136.8002471923828, 253.06063842773438, 250.23167419433594, 262.2736511230469], "page": 5, "span": [0, 37], "__ref_s3_data": null}], "text": "- GLYPH<SM590000> Security fundamentals", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [136.8002471923828, 241.0608367919922, 282.98114013671875, 250.27383422851562], "page": 5, "span": [0, 47], "__ref_s3_data": null}], "text": "- GLYPH<SM590000> Current state of IBM i security", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [136.8002471923828, 229.06103515625, 264.8818664550781, 238.27403259277344], "page": 5, "span": [0, 43], "__ref_s3_data": null}], "text": "- GLYPH<SM590000> DB2 for i security controls", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [136.8000030517578, 67.21955871582031, 258.362548828125, 74.24993896484375], "page": 5, "span": [0, 35], "__ref_s3_data": null}], "text": "$^{1 }$http://www.idtheftcenter.org", "type": "footnote", "payload": null, "name": "Footnote", "font": null}, {"prov": [{"bbox": [136.8000030517578, 57.02824020385742, 234.05880737304688, 64.40973663330078], "page": 5, "span": [0, 31], "__ref_s3_data": null}], "text": "$^{2 }$http://www.ponemon.org /", "type": "footnote", "payload": null, "name": "Footnote", "font": null}, {"prov": [{"bbox": [64.80000305175781, 28.136999130249023, 257.24334716796875, 36.461997985839844], "page": 5, "span": [0, 48], "__ref_s3_data": null}], "text": "' Copyright IBM Corp. 2014. All rights reserved.", "type": "page-footer", "payload": null, "name": "Page-footer", "font": null}, {"prov": [{"bbox": [541.6798706054688, 27.93828010559082, 547.2176513671875, 37.15127944946289], "page": 5, "span": [0, 1], "__ref_s3_data": null}], "text": "1", "type": "page-footer", "payload": null, "name": "Page-footer", "font": null}, {"prov": [{"bbox": [64.80000305175781, 702.8963012695312, 267.40582275390625, 717.6593017578125], "page": 6, "span": [0, 25], "__ref_s3_data": null}], "text": "1.1 Security fundamentals", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [136.8000030517578, 664.178466796875, 545.0048217773438, 685.3912963867188], "page": 6, "span": [0, 133], "__ref_s3_data": null}], "text": "Before reviewing database security techniques, there are two fundamental steps in securing information assets that must be described:", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [136.8000030517578, 611.138916015625, 547.1642456054688, 656.8751220703125], "page": 6, "span": [0, 361], "__ref_s3_data": null}], "text": "- GLYPH<SM590000> First, and most important, is the definition of a company's security policy . Without a security policy, there is no definition of what are acceptable practices for using, accessing, and storing information by who, what, when, where, and how. A security policy should minimally address three things: confidentiality, integrity, and availability.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [151.199462890625, 522.1602172851562, 547.2608642578125, 603.3721313476562], "page": 6, "span": [0, 587], "__ref_s3_data": null}], "text": "- The monitoring and assessment of adherence to the security policy determines whether your security strategy is working. Often, IBM security consultants are asked to perform security assessments for companies without regard to the security policy. Although these assessments can be useful for observing how the system is defined and how data is being accessed, they cannot determine the level of security without a security policy. Without a security policy, it really is not an assessment as much as it is a baseline for monitoring the changes in the security settings that are captured.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [151.199462890625, 505.180419921875, 541.9920043945312, 514.3934326171875], "page": 6, "span": [0, 90], "__ref_s3_data": null}], "text": "A security policy is what defines whether the system and its settings are secure (or not).", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [136.79930114746094, 416.139404296875, 547.1582641601562, 497.8750305175781], "page": 6, "span": [0, 573], "__ref_s3_data": null}], "text": "- GLYPH<SM590000> The second fundamental in securing data assets is the use of resource security . If implemented properly, resource security prevents data breaches from both internal and external intrusions. Resource security controls are closely tied to the part of the security policy that defines who should have access to what information resources. A hacker might be good enough to get through your company firewalls and sift his way through to your system, but if they do not have explicit access to your database, the hacker cannot compromise your information assets.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [136.8002166748047, 382.1797790527344, 535.3616943359375, 403.392578125], "page": 6, "span": [0, 179], "__ref_s3_data": null}], "text": "With your eyes now open to the importance of securing information assets, the rest of this chapter reviews the methods that are available for securing database resources on IBM i.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [64.80000305175781, 338.936279296875, 323.3839111328125, 353.69927978515625], "page": 6, "span": [0, 35], "__ref_s3_data": null}], "text": "1.2 Current state of IBM i security", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [136.8000030517578, 276.1588439941406, 547.3182373046875, 321.37127685546875], "page": 6, "span": [0, 306], "__ref_s3_data": null}], "text": "Because of the inherently secure nature of IBM i, many clients rely on the default system settings to protect their business data that is stored in DB2 for i. In most cases, this means no data protection because the default setting for the Create default public authority (QCRTAUT) system value is *CHANGE.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [136.8000030517578, 206.1400604248047, 547.284423828125, 263.3522644042969], "page": 6, "span": [0, 405], "__ref_s3_data": null}], "text": "Even more disturbing is that many IBM i clients remain in this state, despite the news headlines and the significant costs that are involved with databases being compromised. This default security configuration makes it quite challenging to implement basic security policies. A tighter implementation is required if you really want to protect one of your company's most valuable assets, which is the data.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [136.8000030517578, 112.12167358398438, 547.2832641601562, 193.33349609375], "page": 6, "span": [0, 640], "__ref_s3_data": null}], "text": "Traditionally, IBM i applications have employed menu-based security to counteract this default configuration that gives all users access to the data. The theory is that data is protected by the menu options controlling what database operations that the user can perform. This approach is ineffective, even if the user profile is restricted from running interactive commands. The reason is that in today's connected world there are a multitude of interfaces into the system, from web browsers to PC clients, that bypass application menus. If there are no object-level controls, users of these newer interfaces have an open door to your data.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [64.80000305175781, 27.93828010559082, 72.8219985961914, 37.15127944946289], "page": 6, "span": [0, 1], "__ref_s3_data": null}], "text": "2", "type": "page-footer", "payload": null, "name": "Page-footer", "font": null}, {"prov": [{"bbox": [87.84030151367188, 28.136999130249023, 328.7253723144531, 36.461997985839844], "page": 6, "span": [0, 54], "__ref_s3_data": null}], "text": "Row and Column Access Control Support in IBM DB2 for i", "type": "page-footer", "payload": null, "name": "Page-footer", "font": null}, {"prov": [{"bbox": [64.80000305175781, 27.93828010559082, 72.8219985961914, 37.15127944946289], "page": 7, "span": [0, 1], "__ref_s3_data": null}], "text": "4", "type": "page-footer", "payload": null, "name": "Page-footer", "font": null}, {"prov": [{"bbox": [87.84030151367188, 28.136999130249023, 328.7253723144531, 36.461997985839844], "page": 7, "span": [0, 54], "__ref_s3_data": null}], "text": "Row and Column Access Control Support in IBM DB2 for i", "type": "page-footer", "payload": null, "name": "Page-footer", "font": null}, {"prov": [{"bbox": [136.8000030517578, 639.2794189453125, 544.3033447265625, 720.4913330078125], "page": 7, "span": [0, 589], "__ref_s3_data": null}], "text": "Many businesses are trying to limit data access to a need-to-know basis. This security goal means that users should be given access only to the minimum set of data that is required to perform their job. Often, users with object-level access are given access to row and column values that are beyond what their business task requires because that object-level security provides an all-or-nothing solution. For example, object-level controls allow a manager to access data about all employees. Most security policies limit a manager to accessing data only for the employees that they manage.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [64.80000305175781, 606.67724609375, 301.4690246582031, 618.665283203125], "page": 7, "span": [0, 37], "__ref_s3_data": null}], "text": "1.3.1 Existing row and column control", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [136.79998779296875, 535.2990112304688, 541.5673828125, 592.5112915039062], "page": 7, "span": [0, 377], "__ref_s3_data": null}], "text": "Some IBM i clients have tried augmenting the all-or-nothing object-level security with SQL views (or logical files) and application logic, as shown in Figure 1-2. However, application-based logic is easy to bypass with all of the different data access interfaces that are provided by the IBM i operating system, such as Open Database Connectivity (ODBC) and System i Navigator.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [136.79998779296875, 477.27996826171875, 547.4407958984375, 522.492431640625], "page": 7, "span": [0, 340], "__ref_s3_data": null}], "text": "Using SQL views to limit access to a subset of the data in a table also has its own set of challenges. First, there is the complexity of managing all of the SQL view objects that are used for securing data access. Second, scaling a view-based security solution can be difficult as the amount of data grows and the number of users increases.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [136.79998779296875, 431.2607727050781, 547.232666015625, 464.473388671875], "page": 7, "span": [0, 247], "__ref_s3_data": null}], "text": "Even if you are willing to live with these performance and management issues, a user with *ALLOBJ access still can directly access all of the data in the underlying DB2 table and easily bypass the security controls that are built into an SQL view.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [136.8000030517578, 91.85700225830078, 316.447265625, 100.18199920654297], "page": 7, "span": [0, 43], "__ref_s3_data": null}], "text": "Figure 1-2 Existing row and column controls", "type": "caption", "payload": null, "name": "Caption", "font": null}, {"name": "Picture", "type": "figure", "$ref": "#/figures/8"}, {"prov": [{"bbox": [64.80000305175781, 708.67724609375, 335.4955139160156, 720.665283203125], "page": 8, "span": [0, 38], "__ref_s3_data": null}], "text": "2.1.6 Change Function Usage CL command", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [136.8000030517578, 685.2982788085938, 547.284423828125, 694.5112915039062], "page": 8, "span": [0, 90], "__ref_s3_data": null}], "text": "The following CL commands can be used to work with, display, or change function usage IDs:", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [136.8000030517578, 668.2587280273438, 301.5174865722656, 677.4717407226562], "page": 8, "span": [0, 49], "__ref_s3_data": null}], "text": "- GLYPH<SM590000> Work Function Usage ( WRKFCNUSG )", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [136.80099487304688, 656.2589111328125, 313.39776611328125, 665.471923828125], "page": 8, "span": [0, 51], "__ref_s3_data": null}], "text": "- GLYPH<SM590000> Change Function Usage ( CHGFCNUSG )", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [136.8009796142578, 644.2590942382812, 310.8171081542969, 653.4721069335938], "page": 8, "span": [0, 52], "__ref_s3_data": null}], "text": "- GLYPH<SM590000> Display Function Usage ( DSPFCNUSG )", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [136.7999725341797, 610.2994995117188, 512.5380249023438, 631.5123291015625], "page": 8, "span": [0, 126], "__ref_s3_data": null}], "text": "For example, the following CHGFCNUSG command shows granting authorization to user HBEDOYA to administer and manage RCAC rules:", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [136.80096435546875, 593.5487670898438, 441.59686279296875, 602.3235473632812], "page": 8, "span": [0, 61], "__ref_s3_data": null}], "text": "CHGFCNUSG FCNID(QIBM_DB_SECADM) USER(HBEDOYA) USAGE(*ALLOWED)", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [64.80000305175781, 560.6572875976562, 544.4754638671875, 572.6453247070312], "page": 8, "span": [0, 72], "__ref_s3_data": null}], "text": "2.1.7 Verifying function usage IDs for RCAC with the FUNCTION_USAGE view", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [136.8000030517578, 525.2785034179688, 519.5179443359375, 546.4913330078125], "page": 8, "span": [0, 130], "__ref_s3_data": null}], "text": "The FUNCTION_USAGE view contains function usage configuration details. Table 2-1 describes the columns in the FUNCTION_USAGE view.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [136.8000030517578, 504.11700439453125, 283.9680480957031, 512.4420166015625], "page": 8, "span": [0, 29], "__ref_s3_data": null}], "text": "Table 2-1 FUNCTION_USAGE view", "type": "caption", "payload": null, "name": "Caption", "font": null}, {"name": "Table", "type": "table", "$ref": "#/tables/1"}, {"prov": [{"bbox": [136.8000030517578, 318.2784729003906, 547.2803955078125, 339.49127197265625], "page": 8, "span": [0, 112], "__ref_s3_data": null}], "text": "To discover who has authorization to define and manage RCAC, you can use the query that is shown in Example 2-1.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [136.8000030517578, 297.11700439453125, 462.35418701171875, 305.4420166015625], "page": 8, "span": [0, 74], "__ref_s3_data": null}], "text": "Example 2-1 Query to determine who has authority to define and manage RCAC", "type": "paragraph", "payload": null, "name": "paragraph", "font": null}, {"prov": [{"bbox": [136.8, 279.56719999999996, 171.26956, 288.34198], "page": 8, "span": [0, 6], "__ref_s3_data": null}], "text": "SELECT", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [182.75941, 279.56719999999996, 251.69853, 288.34198], "page": 8, "span": [0, 12], "__ref_s3_data": null}], "text": "function_id,", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [166.78244, 267.56737999999996, 241.73852999999997, 276.3421599999999], "page": 8, "span": [0, 10], "__ref_s3_data": null}], "text": "user_name,", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [170.75961, 255.56758000000002, 221.69901999999996, 264.34235], "page": 8, "span": [0, 6], "__ref_s3_data": null}], "text": "usage,", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [167.53809, 243.56777999999997, 236.69878, 252.34253], "page": 8, "span": [0, 9], "__ref_s3_data": null}], "text": "user_type", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [136.8, 231.56798000000003, 160.59396, 240.34272999999996], "page": 8, "span": [0, 4], "__ref_s3_data": null}], "text": "FROM", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [178.43944, 231.56798000000003, 261.71829, 240.34272999999996], "page": 8, "span": [0, 14], "__ref_s3_data": null}], "text": "function_usage", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [136.8, 219.56817999999998, 162.44176, 228.34293000000002], "page": 8, "span": [0, 5], "__ref_s3_data": null}], "text": "WHERE", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [177.8268, 219.56817999999998, 331.67731, 228.34293000000002], "page": 8, "span": [0, 28], "__ref_s3_data": null}], "text": "function_id=\u2019QIBM_DB_SECADM\u2019", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [136.8, 207.56836999999996, 178.77542, 216.34312], "page": 8, "span": [0, 8], "__ref_s3_data": null}], "text": "ORDER BY", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [189.26929, 207.56836999999996, 241.73856, 216.34312], "page": 8, "span": [0, 10], "__ref_s3_data": null}], "text": "user_name;", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [64.80000305175781, 157.01637268066406, 249.59605407714844, 171.7793731689453], "page": 8, "span": [0, 24], "__ref_s3_data": null}], "text": "2.2 Separation of duties", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [136.8000030517578, 82.23904418945312, 547.2234497070312, 139.45127868652344], "page": 8, "span": [0, 463], "__ref_s3_data": null}], "text": "Separation of duties helps businesses comply with industry regulations or organizational requirements and simplifies the management of authorities. Separation of duties is commonly used to prevent fraudulent activities or errors by a single person. It provides the ability for administrative functions to be divided across individuals without overlapping responsibilities, so that one user does not possess unlimited authority, such as with the *ALLOBJ authority.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [64.80000305175781, 27.93828010559082, 78.4020004272461, 37.15127944946289], "page": 8, "span": [0, 2], "__ref_s3_data": null}], "text": "10", "type": "page-footer", "payload": null, "name": "Page-footer", "font": null}, {"prov": [{"bbox": [93.42030334472656, 28.136999130249023, 334.4214172363281, 36.461997985839844], "page": 8, "span": [0, 54], "__ref_s3_data": null}], "text": "Row and Column Access Control Support in IBM DB2 for i", "type": "page-footer", "payload": null, "name": "Page-footer", "font": null}, {"prov": [{"bbox": [136.79959106445312, 651.2788696289062, 542.6943359375, 720.490966796875], "page": 9, "span": [0, 516], "__ref_s3_data": null}], "text": "For example, assume that a business has assigned the duty to manage security on IBM i to Theresa. Before release IBM i 7.2, to grant privileges, Theresa had to have the same privileges Theresa was granting to others. Therefore, to grant *USE privileges to the PAYROLL table, Theresa had to have *OBJMGT and *USE authority (or a higher level of authority, such as *ALLOBJ). This requirement allowed Theresa to access the data in the PAYROLL table even though Theresa's job description was only to manage its security.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [136.79959106445312, 593.2598266601562, 547.303955078125, 638.4722900390625], "page": 9, "span": [0, 285], "__ref_s3_data": null}], "text": "In IBM i 7.2, the QIBM_DB_SECADM function usage grants authorities, revokes authorities, changes ownership, or changes the primary group without giving access to the object or, in the case of a database table, to the data that is in the table or allowing other operations on the table.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [136.79959106445312, 559.3002319335938, 538.6507568359375, 580.5130615234375], "page": 9, "span": [0, 129], "__ref_s3_data": null}], "text": "QIBM_DB_SECADM function usage can be granted only by a user with *SECADM special authority and can be given to a user or a group.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [136.79959106445312, 513.281005859375, 545.7960205078125, 546.49365234375], "page": 9, "span": [0, 204], "__ref_s3_data": null}], "text": "QIBM_DB_SECADM also is responsible for administering RCAC, which restricts which rows a user is allowed to access in a table and whether a user is allowed to see information in certain columns of a table.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [136.79959106445312, 455.2619934082031, 539.80712890625, 500.47442626953125], "page": 9, "span": [0, 285], "__ref_s3_data": null}], "text": "A preferred practice is that the RCAC administrator has the QIBM_DB_SECADM function usage ID, but absolutely no other data privileges. The result is that the RCAC administrator can deploy and maintain the RCAC constructs, but cannot grant themselves unauthorized access to data itself.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [136.79959106445312, 421.3023681640625, 543.067138671875, 442.5151672363281], "page": 9, "span": [0, 136], "__ref_s3_data": null}], "text": "Table 2-2 shows a comparison of the different function usage IDs and *JOBCTL authority to the different CL commands and DB2 for i tools.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [64.80000305175781, 400.1369934082031, 391.754638671875, 408.4620056152344], "page": 9, "span": [0, 78], "__ref_s3_data": null}], "text": "Table 2-2 Comparison of the different function usage IDs and *JOBCTL authority", "type": "caption", "payload": null, "name": "Caption", "font": null}, {"name": "Table", "type": "table", "$ref": "#/tables/2"}, {"prov": [{"bbox": [355.32000732421875, 28.136999130249023, 523.5407104492188, 36.461997985839844], "page": 9, "span": [0, 41], "__ref_s3_data": null}], "text": "Chapter 2. Roles and separation of duties", "type": "page-footer", "payload": null, "name": "Page-footer", "font": null}, {"prov": [{"bbox": [536.0999755859375, 27.93828010559082, 547.2591552734375, 37.15127944946289], "page": 9, "span": [0, 2], "__ref_s3_data": null}], "text": "11", "type": "page-footer", "payload": null, "name": "Page-footer", "font": null}, {"prov": [{"bbox": [136.799560546875, 699.2781372070312, 528.7305908203125, 720.490966796875], "page": 10, "span": [0, 135], "__ref_s3_data": null}], "text": "The SQL CREATE PERMISSION statement that is shown in Figure 3-1 is used to define and initially enable or disable the row access rules.", "type": "caption", "payload": null, "name": "Caption", "font": null}, {"prov": [{"bbox": [136.8000030517578, 369.5369873046875, 341.9765930175781, 377.86199951171875], "page": 10, "span": [0, 42], "__ref_s3_data": null}], "text": "Figure 3-1 CREATE PERMISSION SQL statement", "type": "caption", "payload": null, "name": "Caption", "font": null}, {"name": "Picture", "type": "figure", "$ref": "#/figures/9"}, {"prov": [{"bbox": [136.8000030517578, 340.95599365234375, 215.37600708007812, 352.0559997558594], "page": 10, "span": [0, 11], "__ref_s3_data": null}], "text": "Column mask", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [136.8000030517578, 291.6988525390625, 542.7664794921875, 336.9112854003906], "page": 10, "span": [0, 297], "__ref_s3_data": null}], "text": "A column mask is a database object that manifests a column value access control rule for a specific column in a specific table. It uses a CASE expression that describes what you see when you access the column. For example, a teller can see only the last four digits of a tax identification number.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [344.94000244140625, 28.136999130249023, 523.6016235351562, 36.461997985839844], "page": 10, "span": [0, 40], "__ref_s3_data": null}], "text": "Chapter 3. Row and Column Access Control", "type": "page-footer", "payload": null, "name": "Page-footer", "font": null}, {"prov": [{"bbox": [536.0999755859375, 27.93828010559082, 547.2591552734375, 37.15127944946289], "page": 10, "span": [0, 2], "__ref_s3_data": null}], "text": "15", "type": "page-footer", "payload": null, "name": "Page-footer", "font": null}, {"prov": [{"bbox": [136.79959106445312, 711.2779541015625, 412.20758056640625, 720.490966796875], "page": 11, "span": [0, 62], "__ref_s3_data": null}], "text": "Table 3-1 summarizes these special registers and their values.", "type": "paragraph", "payload": null, "name": "paragraph", "font": null}, {"prov": [{"bbox": [136.8000030517578, 690.177001953125, 372.6036376953125, 698.501953125], "page": 11, "span": [0, 58], "__ref_s3_data": null}], "text": "Table 3-1 Special registers and their corresponding values", "type": "caption", "payload": null, "name": "Caption", "font": null}, {"name": "Table", "type": "table", "$ref": "#/tables/3"}, {"prov": [{"bbox": [136.8000030517578, 556.2984619140625, 538.493896484375, 577.5112915039062], "page": 11, "span": [0, 97], "__ref_s3_data": null}], "text": "Figure 3-5 shows the difference in the special register values when an adopted authority is used:", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [136.8000030517578, 539.2589111328125, 411.36138916015625, 548.471923828125], "page": 11, "span": [0, 75], "__ref_s3_data": null}], "text": "- GLYPH<SM590000> A user connects to the server using the user profile ALICE.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [136.8000030517578, 522.2791137695312, 453.2580871582031, 531.4921264648438], "page": 11, "span": [0, 77], "__ref_s3_data": null}], "text": "- GLYPH<SM590000> USER and CURRENT USER initially have the same value of ALICE.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [136.8000030517578, 493.29949951171875, 541.4498291015625, 514.5123291015625], "page": 11, "span": [0, 160], "__ref_s3_data": null}], "text": "- GLYPH<SM590000> ALICE calls an SQL procedure that is named proc1, which is owned by user profile JOE and was created to adopt JOE's authority when it is called.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [136.8000030517578, 452.2602844238281, 547.2167358398438, 485.472900390625], "page": 11, "span": [0, 253], "__ref_s3_data": null}], "text": "- GLYPH<SM590000> While the procedure is running, the special register USER still contains the value of ALICE because it excludes any adopted authority. The special register CURRENT USER contains the value of JOE because it includes any adopted authority.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [136.80101013183594, 423.2806701660156, 547.3540649414062, 444.49346923828125], "page": 11, "span": [0, 133], "__ref_s3_data": null}], "text": "- GLYPH<SM590000> When proc1 ends, the session reverts to its original state with both USER and CURRENT USER having the value of ALICE.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [136.8000030517578, 186.95709228515625, 341.2566223144531, 195.2821044921875], "page": 11, "span": [0, 50], "__ref_s3_data": null}], "text": "Figure 3-5 Special registers and adopted authority", "type": "caption", "payload": null, "name": "Caption", "font": null}, {"name": "Picture", "type": "figure", "$ref": "#/figures/10"}, {"prov": [{"bbox": [64.80000305175781, 154.457275390625, 247.02536010742188, 166.44528198242188], "page": 11, "span": [0, 31], "__ref_s3_data": null}], "text": "3.2.2 Built-in global variables", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [136.8000030517578, 119.0784683227539, 518.0011596679688, 140.29127502441406], "page": 11, "span": [0, 161], "__ref_s3_data": null}], "text": "Built-in global variables are provided with the database manager and are used in SQL statements to retrieve scalar values that are associated with the variables.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [136.8000030517578, 73.05928039550781, 532.3385009765625, 106.27189636230469], "page": 11, "span": [0, 233], "__ref_s3_data": null}], "text": "IBM DB2 for i supports nine different built-in global variables that are read only and maintained by the system. These global variables can be used to identify attributes of the database connection and used as part of the RCAC logic.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [344.94000244140625, 28.136999130249023, 523.6016235351562, 36.461997985839844], "page": 11, "span": [0, 40], "__ref_s3_data": null}], "text": "Chapter 3. Row and Column Access Control", "type": "page-footer", "payload": null, "name": "Page-footer", "font": null}, {"prov": [{"bbox": [536.0999755859375, 27.93828010559082, 547.2591552734375, 37.15127944946289], "page": 11, "span": [0, 2], "__ref_s3_data": null}], "text": "19", "type": "page-footer", "payload": null, "name": "Page-footer", "font": null}, {"prov": [{"bbox": [64.80000305175781, 27.93828010559082, 78.4020004272461, 37.15127944946289], "page": 12, "span": [0, 2], "__ref_s3_data": null}], "text": "20", "type": "page-footer", "payload": null, "name": "Page-footer", "font": null}, {"prov": [{"bbox": [93.42030334472656, 28.136999130249023, 334.4214172363281, 36.461997985839844], "page": 12, "span": [0, 54], "__ref_s3_data": null}], "text": "Row and Column Access Control Support in IBM DB2 for i", "type": "page-footer", "payload": null, "name": "Page-footer", "font": null}, {"prov": [{"bbox": [136.8000030517578, 711.2783203125, 342.5477294921875, 720.4913330078125], "page": 12, "span": [0, 51], "__ref_s3_data": null}], "text": "Table 3-2 lists the nine built-in global variables.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [64.80000305175781, 690.177001953125, 201.1814727783203, 698.501953125], "page": 12, "span": [0, 35], "__ref_s3_data": null}], "text": "Table 3-2 Built-in global variables", "type": "caption", "payload": null, "name": "Caption", "font": null}, {"name": "Table", "type": "table", "$ref": "#/tables/4"}, {"prov": [{"bbox": [64.80000305175781, 455.0362854003906, 384.3638916015625, 469.7992858886719], "page": 12, "span": [0, 34], "__ref_s3_data": null}], "text": "3.3 VERIFY_GROUP_FOR_USER function", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [136.8000030517578, 356.2593994140625, 547.2347412109375, 437.4712829589844], "page": 12, "span": [0, 576], "__ref_s3_data": null}], "text": "The VERIFY_GROUP_FOR_USER function was added in IBM i 7.2. Although it is primarily intended for use with RCAC permissions and masks, it can be used in other SQL statements. The first parameter must be one of these three special registers: SESSION_USER, USER, or CURRENT_USER. The second and subsequent parameters are a list of user or group profiles. Each of these values must be 1 - 10 characters in length. These values are not validated for their existence, which means that you can specify the names of user profiles that do not exist without receiving any kind of error.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [136.80001831054688, 310.2999572753906, 547.2573852539062, 343.5125732421875], "page": 12, "span": [0, 235], "__ref_s3_data": null}], "text": "If a special register value is in the list of user profiles or it is a member of a group profile included in the list, the function returns a long integer value of 1. Otherwise, it returns a value of 0. It never returns the null value.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [136.80001831054688, 288.2803955078125, 458.44525146484375, 297.4933776855469], "page": 12, "span": [0, 63], "__ref_s3_data": null}], "text": "Here is an example of using the VERIFY_GROUP_FOR_USER function:", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [136.80001831054688, 271.2408142089844, 406.0775146484375, 280.45379638671875], "page": 12, "span": [0, 57], "__ref_s3_data": null}], "text": "- 1. There are user profiles for MGR, JANE, JUDY, and TONY.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [136.80001831054688, 254.26100158691406, 396.9881591796875, 263.4739990234375], "page": 12, "span": [0, 58], "__ref_s3_data": null}], "text": "- 2. The user profile JANE specifies a group profile of MGR.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [136.80001831054688, 225.28138732910156, 536.568603515625, 246.4941864013672], "page": 12, "span": [0, 127], "__ref_s3_data": null}], "text": "- 3. If a user is connected to the server using user profile JANE, all of the following function invocations return a value of 1:", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [151.20018005371094, 150.57144165039062, 451.01605224609375, 217.305419921875], "page": 12, "span": [0, 265], "__ref_s3_data": null}], "text": "VERIFY_GROUP_FOR_USER (CURRENT_USER, 'MGR') VERIFY_GROUP_FOR_USER (CURRENT_USER, 'JANE', 'MGR') VERIFY_GROUP_FOR_USER (CURRENT_USER, 'JANE', 'MGR', 'STEVE') The following function invocation returns a value of 0: VERIFY_GROUP_FOR_USER (CURRENT_USER, 'JUDY', 'TONY')", "type": "paragraph", "payload": null, "name": "Code", "font": null}, {"prov": [{"bbox": [136.79959106445312, 711.5667724609375, 166.73934936523438, 720.341552734375], "page": 13, "span": [0, 6], "__ref_s3_data": null}], "text": "RETURN", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [136.79959106445312, 699.5669555664062, 156.7793426513672, 708.3417358398438], "page": 13, "span": [0, 4], "__ref_s3_data": null}], "text": "CASE", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [136.79959106445312, 531.5695190429688, 521.5742797851562, 696.3419189453125], "page": 13, "span": [0, 437], "__ref_s3_data": null}], "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'HR', 'EMP' ) = 1 THEN EMPLOYEES . DATE_OF_BIRTH WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1 AND SESSION_USER = EMPLOYEES . USER_ID THEN EMPLOYEES . DATE_OF_BIRTH WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1 AND SESSION_USER <> EMPLOYEES . USER_ID THEN ( 9999 || '-' || MONTH ( EMPLOYEES . DATE_OF_BIRTH ) || '-' || DAY (EMPLOYEES.DATE_OF_BIRTH )) ELSE NULL END ENABLE ;", "type": "paragraph", "payload": null, "name": "Code", "font": null}, {"prov": [{"bbox": [136.79959106445312, 495.2812805175781, 547.2122192382812, 516.4940795898438], "page": 13, "span": [0, 136], "__ref_s3_data": null}], "text": "- 2. The other column to mask in this example is the TAX_ID information. In this example, the rules to enforce include the following ones:", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [152.03939819335938, 478.3014831542969, 469.1528015136719, 487.51446533203125], "page": 13, "span": [0, 62], "__ref_s3_data": null}], "text": "- -Human Resources can see the unmasked TAX_ID of the employees.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [152.03939819335938, 461.26190185546875, 403.95953369140625, 470.4748840332031], "page": 13, "span": [0, 50], "__ref_s3_data": null}], "text": "- -Employees can see only their own unmasked TAX_ID.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [152.03939819335938, 432.28228759765625, 545.16845703125, 453.4950866699219], "page": 13, "span": [0, 129], "__ref_s3_data": null}], "text": "- -Managers see a masked version of TAX_ID with the first five characters replaced with the X character (for example, XXX-XX-1234).", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [152.03939819335938, 415.302490234375, 529.463623046875, 424.5154724121094], "page": 13, "span": [0, 77], "__ref_s3_data": null}], "text": "- -Any other person sees the entire TAX_ID as masked, for example, XXX-XX-XXXX.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [151.1997833251953, 398.2629089355469, 530.060302734375, 407.47589111328125], "page": 13, "span": [0, 82], "__ref_s3_data": null}], "text": "- To implement this column mask, run the SQL statement that is shown in Example 3-9.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [136.8000030517578, 377.156982421875, 351.9873046875, 385.48199462890625], "page": 13, "span": [0, 48], "__ref_s3_data": null}], "text": "Example 3-9 Creating a mask on the TAX_ID column", "type": "paragraph", "payload": null, "name": "paragraph", "font": null}, {"prov": [{"bbox": [136.8000030517578, 107.55116271972656, 526.5546875, 368.3218994140625], "page": 13, "span": [0, 590], "__ref_s3_data": null}], "text": "CREATE MASK HR_SCHEMA.MASK_TAX_ID_ON_EMPLOYEES ON HR_SCHEMA.EMPLOYEES AS EMPLOYEES FOR COLUMN TAX_ID RETURN CASE WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'HR' ) = 1 THEN EMPLOYEES . TAX_ID WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1 AND SESSION_USER = EMPLOYEES . USER_ID THEN EMPLOYEES . TAX_ID WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1 AND SESSION_USER <> EMPLOYEES . USER_ID THEN ( 'XXX-XX-' CONCAT QSYS2 . SUBSTR ( EMPLOYEES . TAX_ID , 8 , 4 ) ) WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'EMP' ) = 1 THEN EMPLOYEES . TAX_ID ELSE 'XXX-XX-XXXX' END ENABLE ;", "type": "paragraph", "payload": null, "name": "Code", "font": null}, {"prov": [{"bbox": [344.94000244140625, 28.136999130249023, 523.6016235351562, 36.461997985839844], "page": 13, "span": [0, 40], "__ref_s3_data": null}], "text": "Chapter 3. Row and Column Access Control", "type": "page-footer", "payload": null, "name": "Page-footer", "font": null}, {"prov": [{"bbox": [536.0999755859375, 27.93828010559082, 547.2591552734375, 37.15127944946289], "page": 13, "span": [0, 2], "__ref_s3_data": null}], "text": "27", "type": "page-footer", "payload": null, "name": "Page-footer", "font": null}, {"prov": [{"bbox": [136.8000030517578, 711.2783203125, 449.952392578125, 720.4913330078125], "page": 14, "span": [0, 65], "__ref_s3_data": null}], "text": "- 3. Figure 3-10 shows the masks that are created in the HR_SCHEMA.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [64.80000305175781, 610.1370239257812, 293.1380920410156, 618.4619750976562], "page": 14, "span": [0, 52], "__ref_s3_data": null}], "text": "Figure 3-10 Column masks shown in System i Navigator", "type": "caption", "payload": null, "name": "Caption", "font": null}, {"name": "Picture", "type": "figure", "$ref": "#/figures/11"}, {"prov": [{"bbox": [64.80000305175781, 577.6372680664062, 203.98521423339844, 589.6253051757812], "page": 14, "span": [0, 21], "__ref_s3_data": null}], "text": "3.6.6 Activating RCAC", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [136.8000030517578, 530.2586669921875, 547.2256469726562, 563.4713134765625], "page": 14, "span": [0, 265], "__ref_s3_data": null}], "text": "Now that you have created the row permission and the two column masks, RCAC must be activated. The row permission and the two column masks are enabled (last clause in the scripts), but now you must activate RCAC on the table. To do so, complete the following steps:", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [136.8000030517578, 513.2788696289062, 409.4788818359375, 522.4918823242188], "page": 14, "span": [0, 57], "__ref_s3_data": null}], "text": "- 1. Run the SQL statements that are shown in Example 3-10.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [136.8000030517578, 492.11700439453125, 375.2909851074219, 500.4420166015625], "page": 14, "span": [0, 51], "__ref_s3_data": null}], "text": "Example 3-10 Activating RCAC on the EMPLOYEES table", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [136.8000030517578, 474.5671081542969, 376.6766052246094, 483.3418884277344], "page": 14, "span": [0, 45], "__ref_s3_data": null}], "text": "- /* Active Row Access Control (permissions) */", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [136.8000030517578, 462.5672912597656, 354.86962890625, 471.3420715332031], "page": 14, "span": [0, 39], "__ref_s3_data": null}], "text": "- /* Active Column Access Control (masks)", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [365.77313232421875, 462.5672912597656, 376.6766052246094, 471.3420715332031], "page": 14, "span": [0, 2], "__ref_s3_data": null}], "text": "*/", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [136.8000030517578, 450.5674743652344, 291.7178039550781, 459.3422546386719], "page": 14, "span": [0, 31], "__ref_s3_data": null}], "text": "ALTER TABLE HR_SCHEMA.EMPLOYEES", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [136.8000030517578, 438.5676574707031, 271.6783142089844, 447.3424377441406], "page": 14, "span": [0, 27], "__ref_s3_data": null}], "text": "ACTIVATE ROW ACCESS CONTROL", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [136.8000030517578, 426.5678405761719, 291.7178039550781, 435.3426208496094], "page": 14, "span": [0, 31], "__ref_s3_data": null}], "text": "ACTIVATE COLUMN ACCESS CONTROL;", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [136.8000030517578, 378.27978515625, 540.8014526367188, 411.4924011230469], "page": 14, "span": [0, 231], "__ref_s3_data": null}], "text": "- 2. Look at the definition of the EMPLOYEE table, as shown in Figure 3-11. To do this, from the main navigation pane of System i Navigator, click Schemas \uf0ae HR_SCHEMA \uf0ae Tables , right-click the EMPLOYEES table, and click Definition .", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [64.80000305175781, 134.63710021972656, 347.4305419921875, 142.9621124267578], "page": 14, "span": [0, 65], "__ref_s3_data": null}], "text": "Figure 3-11 Selecting the EMPLOYEES table from System i Navigator", "type": "caption", "payload": null, "name": "Caption", "font": null}, {"name": "Picture", "type": "figure", "$ref": "#/figures/12"}, {"prov": [{"bbox": [64.80000305175781, 27.93828010559082, 78.4020004272461, 37.15127944946289], "page": 14, "span": [0, 2], "__ref_s3_data": null}], "text": "28", "type": "page-footer", "payload": null, "name": "Page-footer", "font": null}, {"prov": [{"bbox": [93.42030334472656, 28.136999130249023, 334.4214172363281, 36.461997985839844], "page": 14, "span": [0, 54], "__ref_s3_data": null}], "text": "Row and Column Access Control Support in IBM DB2 for i", "type": "page-footer", "payload": null, "name": "Page-footer", "font": null}, {"prov": [{"bbox": [136.79959106445312, 687.2783203125, 514.048583984375, 720.490966796875], "page": 15, "span": [0, 228], "__ref_s3_data": null}], "text": "- 2. Figure 4-68 shows the Visual Explain of the same SQL statement, but with RCAC enabled. It is clear that the implementation of the SQL statement is more complex because the row permission rule becomes part of the WHERE clause.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [136.8000030517578, 303.11700439453125, 327.0932922363281, 311.4420166015625], "page": 15, "span": [0, 44], "__ref_s3_data": null}], "text": "Figure 4-68 Visual Explain with RCAC enabled", "type": "caption", "payload": null, "name": "Caption", "font": null}, {"name": "Picture", "type": "figure", "$ref": "#/figures/13"}, {"prov": [{"bbox": [136.8000030517578, 252.21875, 547.2394409179688, 285.4313659667969], "page": 15, "span": [0, 232], "__ref_s3_data": null}], "text": "- 3. Compare the advised indexes that are provided by the Optimizer without RCAC and with RCAC enabled. Figure 4-69 shows the index advice for the SQL statement without RCAC enabled. The index being advised is for the ORDER BY clause.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [64.80000305175781, 116.15709686279297, 227.1014862060547, 124.48210144042969], "page": 15, "span": [0, 37], "__ref_s3_data": null}], "text": "Figure 4-69 Index advice with no RCAC", "type": "caption", "payload": null, "name": "Caption", "font": null}, {"name": "Picture", "type": "figure", "$ref": "#/figures/14"}, {"prov": [{"bbox": [214.8000030517578, 28.136999130249023, 523.5935668945312, 36.461997985839844], "page": 15, "span": [0, 70], "__ref_s3_data": null}], "text": "Chapter 4. Implementing Row and Column Access Control: Banking example", "type": "page-footer", "payload": null, "name": "Page-footer", "font": null}, {"prov": [{"bbox": [536.0999755859375, 27.93828010559082, 547.2591552734375, 37.15127944946289], "page": 15, "span": [0, 2], "__ref_s3_data": null}], "text": "77", "type": "page-footer", "payload": null, "name": "Page-footer", "font": null}, {"prov": [{"bbox": [64.80030822753906, 85.39237976074219, 500.697265625, 720.3270263671875], "page": 16, "span": [0, 1998], "__ref_s3_data": null}], "text": "THEN C . CUSTOMER_TAX_ID WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'TELLER' ) = 1 THEN ( 'XXX-XX-' CONCAT QSYS2 . SUBSTR ( C . CUSTOMER_TAX_ID , 8 , 4 ) ) WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 THEN C . CUSTOMER_TAX_ID ELSE 'XXX-XX-XXXX' END ENABLE ; CREATE MASK BANK_SCHEMA.MASK_DRIVERS_LICENSE_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C FOR COLUMN CUSTOMER_DRIVERS_LICENSE_NUMBER RETURN CASE WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 THEN C . CUSTOMER_DRIVERS_LICENSE_NUMBER WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'TELLER' ) = 1 THEN C . CUSTOMER_DRIVERS_LICENSE_NUMBER WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 THEN C . CUSTOMER_DRIVERS_LICENSE_NUMBER ELSE '*************' END ENABLE ; CREATE MASK BANK_SCHEMA.MASK_LOGIN_ID_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C FOR COLUMN CUSTOMER_LOGIN_ID RETURN CASE WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 THEN C . CUSTOMER_LOGIN_ID WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 THEN C . CUSTOMER_LOGIN_ID ELSE '*****' END ENABLE ; CREATE MASK BANK_SCHEMA.MASK_SECURITY_QUESTION_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C FOR COLUMN CUSTOMER_SECURITY_QUESTION RETURN CASE WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 THEN C . CUSTOMER_SECURITY_QUESTION WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 THEN C . CUSTOMER_SECURITY_QUESTION ELSE '*****' END ENABLE ; CREATE MASK BANK_SCHEMA.MASK_SECURITY_QUESTION_ANSWER_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C FOR COLUMN CUSTOMER_SECURITY_QUESTION_ANSWER RETURN CASE WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 THEN C . CUSTOMER_SECURITY_QUESTION_ANSWER WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 THEN C . CUSTOMER_SECURITY_QUESTION_ANSWER ELSE '*****' END ENABLE ; ALTER TABLE BANK_SCHEMA.CUSTOMERS ACTIVATE ROW ACCESS CONTROL ACTIVATE COLUMN ACCESS CONTROL ;", "type": "paragraph", "payload": null, "name": "Code", "font": null}, {"prov": [{"bbox": [64.80000305175781, 27.93828010559082, 83.98200225830078, 37.15127944946289], "page": 16, "span": [0, 3], "__ref_s3_data": null}], "text": "124", "type": "page-footer", "payload": null, "name": "Page-footer", "font": null}, {"prov": [{"bbox": [98.94000244140625, 28.136999130249023, 339.819580078125, 36.461997985839844], "page": 16, "span": [0, 54], "__ref_s3_data": null}], "text": "Row and Column Access Control Support in IBM DB2 for i", "type": "page-footer", "payload": null, "name": "Page-footer", "font": null}, {"prov": [{"bbox": [287.2200012207031, 741.251953125, 414.24481201171875, 763.4519653320312], "page": 18, "span": [0, 10], "__ref_s3_data": null}], "text": "Back cover", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [27.0, 651.5399780273438, 447.3600158691406, 718.3619995117188], "page": 18, "span": [0, 54], "__ref_s3_data": null}], "text": "Row and Column Access Control Support in IBM DB2 for i", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [26.700000762939453, 525.1680297851562, 127.443603515625, 549.8280029296875], "page": 18, "span": [0, 40], "__ref_s3_data": null}], "text": "Implement roles and separation of duties", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [26.700000762939453, 469.1280212402344, 120.283203125, 507.8280334472656], "page": 18, "span": [0, 40], "__ref_s3_data": null}], "text": "Leverage row permissions on the database", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [26.700000762939453, 413.14801025390625, 121.44960021972656, 451.8480224609375], "page": 18, "span": [0, 40], "__ref_s3_data": null}], "text": "Protect columns by defining column masks", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [152.94000244140625, 468.4081115722656, 414.084228515625, 549.2714233398438], "page": 18, "span": [0, 464], "__ref_s3_data": null}], "text": "This IBM Redpaper publication provides information about the IBM i 7.2 feature of IBM DB2 for i Row and Column Access Control (RCAC). It offers a broad description of the function and advantages of controlling access to data in a comprehensive and transparent way. This publication helps you understand the capabilities of RCAC and provides examples of defining, creating, and implementing the row permissions and column masks in a relational database environment.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [152.9400177001953, 403.4290466308594, 414.173828125, 460.292724609375], "page": 18, "span": [0, 309], "__ref_s3_data": null}], "text": "This paper is intended for database engineers, data-centric application developers, and security officers who want to design and implement RCAC as a part of their data control and governance policy. A solid background in IBM i object level security, DB2 for i relational database concepts, and SQL is assumed.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [171.0, 152.3369903564453, 231.8876953125, 160.66200256347656], "page": 18, "span": [0, 12], "__ref_s3_data": null}], "text": "REDP-5110-00", "type": "page-footer", "payload": null, "name": "Page-footer", "font": null}, {"name": "Picture", "type": "figure", "$ref": "#/figures/15"}, {"name": "Picture", "type": "figure", "$ref": "#/figures/16"}, {"prov": [{"bbox": [467.3399963378906, 489.8393859863281, 559.809326171875, 544.2816772460938], "page": 18, "span": [0, 44], "__ref_s3_data": null}], "text": "INTERNATIONAL TECHNICAL SUPPORT ORGANIZATION", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [467.3399963378906, 405.52801513671875, 587.38916015625, 440.2080078125], "page": 18, "span": [0, 60], "__ref_s3_data": null}], "text": "BUILDING TECHNICAL INFORMATION BASED ON PRACTICAL EXPERIENCE", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [467.3399963378906, 250.36593627929688, 587.5205078125, 392.13970947265625], "page": 18, "span": [0, 323], "__ref_s3_data": null}], "text": "IBM Redbooks are developed by the IBM International Technical Support Organization. Experts from IBM, Customers and Partners from around the world create timely technical information based on realistic scenarios. Specific recommendations are provided to help you implement IT solutions more effectively in your environment.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [467.3399963378906, 190.48809814453125, 570.947998046875, 213.1680908203125], "page": 18, "span": [0, 39], "__ref_s3_data": null}], "text": "For more information: ibm.com /redbooks", "type": "paragraph", "payload": null, "name": "Text", "font": null}], "figures": [{"prov": [{"bbox": [513.4560546875, 737.1808471679688, 586.1583251953125, 765.9149169921875], "page": 1, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "figure", "payload": null, "bounding-box": null}, {"prov": [{"bbox": [33.090599060058594, 89.5469970703125, 585.1502075195312, 498.9671630859375], "page": 1, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "figure", "payload": null, "bounding-box": null}, {"prov": [{"bbox": [316.94049072265625, 17.57415771484375, 581.3547973632812, 81.8721923828125], "page": 1, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "figure", "payload": null, "bounding-box": null}, {"prov": [{"bbox": [143.39866638183594, 506.378662109375, 179.56256103515625, 521.7388916015625], "page": 3, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "figure", "payload": null, "bounding-box": null}, {"prov": [{"bbox": [64.16704559326172, 103.87176513671875, 258.77435302734375, 188.49365234375], "page": 3, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "figure", "payload": null, "bounding-box": null}, {"prov": [{"bbox": [142.52883911132812, 288.79351806640625, 251.47850036621094, 416.9550476074219], "page": 4, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "figure", "payload": null, "bounding-box": null}, {"prov": [{"bbox": [145.41445922851562, 156.616943359375, 252.08840942382812, 264.7552490234375], "page": 4, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "figure", "payload": null, "bounding-box": null}, {"prov": [{"bbox": [32.075252532958984, 554.0420532226562, 239.620361328125, 721.422607421875], "page": 5, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "figure", "payload": null, "bounding-box": null}, {"prov": [{"bbox": [135.92466735839844, 103.39019775390625, 546.4456176757812, 416.0727844238281], "page": 7, "span": [0, 43], "__ref_s3_data": null}], "text": "Figure 1-2 Existing row and column controls", "type": "figure", "payload": null, "bounding-box": null}, {"prov": [{"bbox": [135.9717559814453, 381.39068603515625, 545.4180908203125, 684.5892333984375], "page": 10, "span": [0, 177], "__ref_s3_data": null}], "text": "The SQL CREATE PERMISSION statement that is shown in Figure 3-1 is used to define and initially enable or disable the row access rules.Figure 3-1 CREATE PERMISSION SQL statement", "type": "figure", "payload": null, "bounding-box": null}, {"prov": [{"bbox": [135.64837646484375, 197.24334716796875, 301.2367248535156, 407.8263244628906], "page": 11, "span": [0, 50], "__ref_s3_data": null}], "text": "Figure 3-5 Special registers and adopted authority", "type": "figure", "payload": null, "bounding-box": null}, {"prov": [{"bbox": [63.80192184448242, 621.9678955078125, 547.11474609375, 696.6176147460938], "page": 14, "span": [0, 52], "__ref_s3_data": null}], "text": "Figure 3-10 Column masks shown in System i Navigator", "type": "figure", "payload": null, "bounding-box": null}, {"prov": [{"bbox": [63.985130310058594, 145.86041259765625, 530.0478515625, 364.0950012207031], "page": 14, "span": [0, 65], "__ref_s3_data": null}], "text": "Figure 3-11 Selecting the EMPLOYEES table from System i Navigator", "type": "figure", "payload": null, "bounding-box": null}, {"prov": [{"bbox": [136.5016632080078, 314.45880126953125, 545.4508666992188, 672.7509155273438], "page": 15, "span": [0, 44], "__ref_s3_data": null}], "text": "Figure 4-68 Visual Explain with RCAC enabled", "type": "figure", "payload": null, "bounding-box": null}, {"prov": [{"bbox": [64.27847290039062, 127.91290283203125, 506.39263916015625, 238.41851806640625], "page": 15, "span": [0, 37], "__ref_s3_data": null}], "text": "Figure 4-69 Index advice with no RCAC", "type": "figure", "payload": null, "bounding-box": null}, {"prov": [{"bbox": [485.1698303222656, 737.8084106445312, 566.2962036132812, 766.7407836914062], "page": 18, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "figure", "payload": null, "bounding-box": null}, {"prov": [{"bbox": [474.35540771484375, 602.1873779296875, 592.2726440429688, 711.9486694335938], "page": 18, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "figure", "payload": null, "bounding-box": null}], "tables": [{"prov": [{"bbox": [136.1495819091797, 76.34844970703125, 547.52685546875, 659.9669799804688], "page": 2, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "table-of-contents", "payload": null, "#-cols": 2, "#-rows": 43, "data": [[{"bbox": [136.8000030517578, 650.1383666992188, 172.89404296875, 659.3513793945312], "spans": [[0, 0]], "text": "Notices", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [175.01951599121094, 650.1383666992188, 547.1898193359375, 659.3513793945312], "spans": [[0, 1]], "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vii", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 0, "row-header": false, "row-span": [0, 1]}], [{"bbox": [136.79901123046875, 637.6585083007812, 189.86537170410156, 646.8715209960938], "spans": [[1, 0]], "text": "Trademarks", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [195.3968505859375, 637.6585083007812, 547.182861328125, 646.8715209960938], "spans": [[1, 1]], "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . viii", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 1, "row-header": false, "row-span": [1, 2]}], [{"bbox": [136.79901123046875, 615.1588745117188, 279.3973083496094, 624.3718872070312], "spans": [[2, 0]], "text": "DB2 for i Center of Excellence", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [280.6194152832031, 615.1588745117188, 547.1907958984375, 624.3718872070312], "spans": [[2, 1]], "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ix", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 2, "row-header": false, "row-span": [2, 3]}], [{"bbox": [136.79901123046875, 592.6592407226562, 172.84423828125, 601.8722534179688], "spans": [[3, 0]], "text": "Preface", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [175.01852416992188, 592.6592407226562, 547.182861328125, 601.8722534179688], "spans": [[3, 1]], "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 3, "row-header": false, "row-span": [3, 4]}], [{"bbox": [136.79803466796875, 580.1793823242188, 547.1808471679688, 589.3923950195312], "spans": [[4, 0]], "text": "Authors . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": null, "spans": [[4, 1]], "text": "", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 4, "row-header": false, "row-span": [4, 5]}], [{"bbox": [136.79803466796875, 567.6397705078125, 339.18292236328125, 576.852783203125], "spans": [[5, 0]], "text": "Now you can become a published author, too!", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [344.714111328125, 567.6397705078125, 547.1387939453125, 576.852783203125], "spans": [[5, 1]], "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xiii", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 5, "row-header": false, "row-span": [5, 6]}], [{"bbox": [136.79803466796875, 555.159912109375, 529.9950561523438, 564.3729248046875], "spans": [[6, 0]], "text": "Comments welcome. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [535.5494995117188, 555.159912109375, 547.1978759765625, 564.3729248046875], "spans": [[6, 1]], "text": "xiii", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 6, "row-header": false, "row-span": [6, 7]}], [{"bbox": [136.79806518554688, 542.6800537109375, 284.0286560058594, 551.89306640625], "spans": [[7, 0]], "text": "Stay connected to IBM Redbooks", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 7, "row-header": false, "row-span": [7, 8]}, {"bbox": [289.54449462890625, 542.6800537109375, 547.1211547851562, 551.89306640625], "spans": [[7, 1]], "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xiv", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 7, "row-header": false, "row-span": [7, 8]}], [{"bbox": [136.79806518554688, 520.180419921875, 536.0958862304688, 529.3934326171875], "spans": [[8, 0]], "text": "Chapter 1. Securing and protecting IBM DB2 data  . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 8, "row-header": false, "row-span": [8, 9]}, {"bbox": [541.6468505859375, 520.180419921875, 547.1978149414062, 529.3934326171875], "spans": [[8, 1]], "text": "1", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 8, "row-header": false, "row-span": [8, 9]}], [{"bbox": [136.79808044433594, 508.18060302734375, 549.8472290039062, 517.3936157226562], "spans": [[9, 0]], "text": "1.1 Security fundamentals. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 9, "row-header": false, "row-span": [9, 10]}, {"bbox": null, "spans": [[9, 1]], "text": "", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 9, "row-header": false, "row-span": [9, 10]}], [{"bbox": [136.79806518554688, 495.6409606933594, 536.1293334960938, 504.85394287109375], "spans": [[10, 0]], "text": "1.2 Current state of IBM i security . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 10, "row-header": false, "row-span": [10, 11]}, {"bbox": [541.6611328125, 495.6409606933594, 547.19287109375, 504.85394287109375], "spans": [[10, 1]], "text": "2", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 10, "row-header": false, "row-span": [10, 11]}], [{"bbox": [136.79806518554688, 483.16107177734375, 549.8472290039062, 492.3740539550781], "spans": [[11, 0]], "text": "1.3 DB2 for i security controls . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 11, "row-header": false, "row-span": [11, 12]}, {"bbox": null, "spans": [[11, 1]], "text": "", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 11, "row-header": false, "row-span": [11, 12]}], [{"bbox": [151.19720458984375, 470.6811828613281, 536.0551147460938, 479.8941650390625], "spans": [[12, 0]], "text": "1.3.1 Existing row and column control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 12, "row-header": false, "row-span": [12, 13]}, {"bbox": [541.6015014648438, 470.6811828613281, 547.14794921875, 479.8941650390625], "spans": [[12, 1]], "text": "4", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 12, "row-header": false, "row-span": [12, 13]}], [{"bbox": [151.19720458984375, 458.14154052734375, 536.080078125, 467.3545227050781], "spans": [[13, 0]], "text": "1.3.2 New controls: Row and Column Access Control. . . . . . . . . . . . . . . . . . . . . . . . . . .", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 13, "row-header": false, "row-span": [13, 14]}, {"bbox": [541.635498046875, 458.14154052734375, 547.19091796875, 467.3545227050781], "spans": [[13, 1]], "text": "5", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 13, "row-header": false, "row-span": [13, 14]}], [{"bbox": [136.7970428466797, 435.64190673828125, 536.0908813476562, 444.8548889160156], "spans": [[14, 0]], "text": "Chapter 2. Roles and separation of duties . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 14, "row-header": false, "row-span": [14, 15]}, {"bbox": [541.642822265625, 435.64190673828125, 547.1947631835938, 444.8548889160156], "spans": [[14, 1]], "text": "7", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 14, "row-header": false, "row-span": [14, 15]}], [{"bbox": [136.7970428466797, 423.64208984375, 536.1271362304688, 432.8550720214844], "spans": [[15, 0]], "text": "2.1 Roles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 15, "row-header": false, "row-span": [15, 16]}, {"bbox": [541.6658935546875, 423.64208984375, 547.2047119140625, 432.8550720214844], "spans": [[15, 1]], "text": "8", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 15, "row-header": false, "row-span": [15, 16]}], [{"bbox": [151.19720458984375, 411.1622009277344, 535.9526977539062, 420.37518310546875], "spans": [[16, 0]], "text": "2.1.1 DDM and DRDA application server access: QIBM_DB_DDMDRDA . . . . . . . . . . .", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 16, "row-header": false, "row-span": [16, 17]}, {"bbox": [541.5558471679688, 411.1622009277344, 547.1590576171875, 420.37518310546875], "spans": [[16, 1]], "text": "8", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 16, "row-header": false, "row-span": [16, 17]}], [{"bbox": [151.19720458984375, 398.68231201171875, 536.0410766601562, 407.8952941894531], "spans": [[17, 0]], "text": "2.1.2 Toolbox application server access: QIBM_DB_ZDA. . . . . . . . . . . . . . . . . . . . . . . .", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 17, "row-header": false, "row-span": [17, 18]}, {"bbox": [541.595947265625, 398.68231201171875, 547.1508178710938, 407.8952941894531], "spans": [[17, 1]], "text": "8", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 17, "row-header": false, "row-span": [17, 18]}], [{"bbox": [151.19720458984375, 386.1426696777344, 536.0748901367188, 395.35565185546875], "spans": [[18, 0]], "text": "2.1.3 Database Administrator function: QIBM_DB_SQLADM . . . . . . . . . . . . . . . . . . . . .", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 18, "row-header": false, "row-span": [18, 19]}, {"bbox": [541.6302490234375, 386.1426696777344, 547.1856079101562, 395.35565185546875], "spans": [[18, 1]], "text": "9", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 18, "row-header": false, "row-span": [18, 19]}], [{"bbox": [151.19720458984375, 373.66278076171875, 411.2704772949219, 382.8757629394531], "spans": [[19, 0]], "text": "2.1.4 Database Information function: QIBM_DB_SYSMON", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 19, "row-header": false, "row-span": [19, 20]}, {"bbox": [416.8177490234375, 373.66278076171875, 547.1786499023438, 382.8757629394531], "spans": [[19, 1]], "text": ". . . . . . . . . . . . . . . . . . . . . . 9", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 19, "row-header": false, "row-span": [19, 20]}], [{"bbox": [151.19720458984375, 361.1828918457031, 536.035888671875, 370.3958740234375], "spans": [[20, 0]], "text": "2.1.5 Security Administrator function: QIBM_DB_SECADM . . . . . . . . . . . . . . . . . . . . . .", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 20, "row-header": false, "row-span": [20, 21]}, {"bbox": [541.5989379882812, 361.1828918457031, 547.1619262695312, 370.3958740234375], "spans": [[20, 1]], "text": "9", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 20, "row-header": false, "row-span": [20, 21]}], [{"bbox": [151.19720458984375, 348.64324951171875, 530.5731811523438, 357.8562316894531], "spans": [[21, 0]], "text": "2.1.6 Change Function Usage CL command . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 21, "row-header": false, "row-span": [21, 22]}, {"bbox": [536.1044311523438, 348.64324951171875, 547.1668701171875, 357.8562316894531], "spans": [[21, 1]], "text": "10", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 21, "row-header": false, "row-span": [21, 22]}], [{"bbox": [151.19720458984375, 336.1633605957031, 530.5352172851562, 345.3763427734375], "spans": [[22, 0]], "text": "2.1.7 Verifying function usage IDs for RCAC with the FUNCTION_USAGE view . . . . .", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 22, "row-header": false, "row-span": [22, 23]}, {"bbox": [536.0755004882812, 336.1633605957031, 547.156005859375, 345.3763427734375], "spans": [[22, 1]], "text": "10", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 22, "row-header": false, "row-span": [22, 23]}], [{"bbox": [136.7970428466797, 323.6834716796875, 547.256591796875, 332.8964538574219], "spans": [[23, 0]], "text": "2.2 Separation of duties . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 23, "row-header": false, "row-span": [23, 24]}, {"bbox": null, "spans": [[23, 1]], "text": "", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 23, "row-header": false, "row-span": [23, 24]}], [{"bbox": [136.79702758789062, 301.183837890625, 530.5396118164062, 310.3968200683594], "spans": [[24, 0]], "text": "Chapter 3. Row and Column Access Control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 24, "row-header": false, "row-span": [24, 25]}, {"bbox": [536.0916748046875, 301.183837890625, 547.19580078125, 310.3968200683594], "spans": [[24, 1]], "text": "13", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 24, "row-header": false, "row-span": [24, 25]}], [{"bbox": [136.79702758789062, 289.18402099609375, 530.4808959960938, 298.3970031738281], "spans": [[25, 0]], "text": "3.1 Explanation of RCAC and the concept of access control . . . . . . . . . . . . . . . . . . . . . . .", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 25, "row-header": false, "row-span": [25, 26]}, {"bbox": [536.04248046875, 289.18402099609375, 547.1657104492188, 298.3970031738281], "spans": [[25, 1]], "text": "14", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 25, "row-header": false, "row-span": [25, 26]}], [{"bbox": [151.1971893310547, 276.6443786621094, 378.2078552246094, 285.85736083984375], "spans": [[26, 0]], "text": "3.1.1 Row permission and column mask definitions", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 26, "row-header": false, "row-span": [26, 27]}, {"bbox": [383.74713134765625, 276.6443786621094, 547.15576171875, 285.85736083984375], "spans": [[26, 1]], "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . 14", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 26, "row-header": false, "row-span": [26, 27]}], [{"bbox": [151.1971893310547, 264.16448974609375, 530.4347534179688, 273.3774719238281], "spans": [[27, 0]], "text": "3.1.2 Enabling and activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 27, "row-header": false, "row-span": [27, 28]}, {"bbox": [535.9962158203125, 264.16448974609375, 547.1190795898438, 273.3774719238281], "spans": [[27, 1]], "text": "16", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 27, "row-header": false, "row-span": [27, 28]}], [{"bbox": [136.79702758789062, 251.6248321533203, 530.528076171875, 260.83782958984375], "spans": [[28, 0]], "text": "3.2 Special registers and built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 28, "row-header": false, "row-span": [28, 29]}, {"bbox": [536.0670166015625, 251.6248321533203, 547.1448364257812, 260.83782958984375], "spans": [[28, 1]], "text": "18", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 28, "row-header": false, "row-span": [28, 29]}], [{"bbox": [151.1971893310547, 239.14495849609375, 530.4978637695312, 248.3579559326172], "spans": [[29, 0]], "text": "3.2.1 Special registers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 29, "row-header": false, "row-span": [29, 30]}, {"bbox": [536.0518798828125, 239.14495849609375, 547.159912109375, 248.3579559326172], "spans": [[29, 1]], "text": "18", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 29, "row-header": false, "row-span": [29, 30]}], [{"bbox": [151.1971893310547, 226.6650848388672, 530.5602416992188, 235.87808227539062], "spans": [[30, 0]], "text": "3.2.2 Built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 30, "row-header": false, "row-span": [30, 31]}, {"bbox": [536.09912109375, 226.6650848388672, 547.1768798828125, 235.87808227539062], "spans": [[30, 1]], "text": "19", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 30, "row-header": false, "row-span": [30, 31]}], [{"bbox": [136.79702758789062, 214.1254425048828, 530.5302734375, 223.33843994140625], "spans": [[31, 0]], "text": "3.3 VERIFY_GROUP_FOR_USER function . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 31, "row-header": false, "row-span": [31, 32]}, {"bbox": [536.0615234375, 214.1254425048828, 547.1240234375, 223.33843994140625], "spans": [[31, 1]], "text": "20", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 31, "row-header": false, "row-span": [31, 32]}], [{"bbox": [136.79702758789062, 201.64556884765625, 530.6299438476562, 210.8585662841797], "spans": [[32, 0]], "text": "3.4 Establishing and controlling accessibility by using the RCAC rule text . . . . . . . . . . . . .", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 32, "row-header": false, "row-span": [32, 33]}, {"bbox": [536.1631469726562, 201.64556884765625, 547.2295532226562, 210.8585662841797], "spans": [[32, 1]], "text": "21", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 32, "row-header": false, "row-span": [32, 33]}], [{"bbox": [400.3206481933594, 189.1656951904297, 530.4835815429688, 198.37869262695312], "spans": [[33, 0]], "text": ". . . . . . . . . . . . . . . . . . . . . . . .", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 33, "row-header": false, "row-span": [33, 34]}, {"bbox": [536.0223999023438, 189.1656951904297, 547.10009765625, 198.37869262695312], "spans": [[33, 1]], "text": "22", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 33, "row-header": false, "row-span": [33, 34]}], [{"bbox": [136.79701232910156, 176.6260528564453, 530.5651245117188, 198.37869262695312], "spans": [[34, 0]], "text": "3.5 SELECT, INSERT, and UPDATE behavior with RCAC 3.6 Human resources example . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 34, "row-header": false, "row-span": [34, 35]}, {"bbox": [536.1119995117188, 176.6260528564453, 547.2057495117188, 185.83905029296875], "spans": [[34, 1]], "text": "22", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 34, "row-header": false, "row-span": [34, 35]}], [{"bbox": [151.19717407226562, 164.14617919921875, 530.4913940429688, 173.3591766357422], "spans": [[35, 0]], "text": "3.6.1 Assigning the QIBM_DB_SECADM function ID to the consultants. . . . . . . . . . . .", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 35, "row-header": false, "row-span": [35, 36]}, {"bbox": [536.0463256835938, 164.14617919921875, 547.1561889648438, 173.3591766357422], "spans": [[35, 1]], "text": "23", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 35, "row-header": false, "row-span": [35, 36]}], [{"bbox": [151.19717407226562, 151.6663055419922, 530.5645751953125, 160.87930297851562], "spans": [[36, 0]], "text": "3.6.2 Creating group profiles for the users and their roles . . . . . . . . . . . . . . . . . . . . . . .", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 36, "row-header": false, "row-span": [36, 37]}, {"bbox": [536.0960083007812, 151.6663055419922, 547.1587524414062, 160.87930297851562], "spans": [[36, 1]], "text": "23", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 36, "row-header": false, "row-span": [36, 37]}], [{"bbox": [151.19717407226562, 139.1266632080078, 530.5569458007812, 148.33966064453125], "spans": [[37, 0]], "text": "3.6.3 Demonstrating data access without RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 37, "row-header": false, "row-span": [37, 38]}, {"bbox": [536.0881958007812, 139.1266632080078, 547.1507568359375, 148.33966064453125], "spans": [[37, 1]], "text": "24", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 37, "row-header": false, "row-span": [37, 38]}], [{"bbox": [151.19717407226562, 126.64678955078125, 530.5341186523438, 135.8597869873047], "spans": [[38, 0]], "text": "3.6.4 Defining and creating row permissions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 38, "row-header": false, "row-span": [38, 39]}, {"bbox": [536.072998046875, 126.64678955078125, 547.15087890625, 135.8597869873047], "spans": [[38, 1]], "text": "25", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 38, "row-header": false, "row-span": [38, 39]}], [{"bbox": [151.19717407226562, 114.16690826416016, 339.4510498046875, 123.37991333007812], "spans": [[39, 0]], "text": "3.6.5 Defining and creating column masks", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 39, "row-header": false, "row-span": [39, 40]}, {"bbox": [344.9899597167969, 114.16690826416016, 547.160888671875, 123.37991333007812], "spans": [[39, 1]], "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 39, "row-header": false, "row-span": [39, 40]}], [{"bbox": [151.19717407226562, 101.62727355957031, 530.541015625, 110.84027099609375], "spans": [[40, 0]], "text": "3.6.6 Activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 40, "row-header": false, "row-span": [40, 41]}, {"bbox": [536.087646484375, 101.62727355957031, 547.1808471679688, 110.84027099609375], "spans": [[40, 1]], "text": "28", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 40, "row-header": false, "row-span": [40, 41]}], [{"bbox": [151.19717407226562, 89.14738464355469, 530.5750732421875, 98.36038970947266], "spans": [[41, 0]], "text": "3.6.7 Demonstrating data access with RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 41, "row-header": false, "row-span": [41, 42]}, {"bbox": [536.1066284179688, 89.14738464355469, 547.169677734375, 98.36038970947266], "spans": [[41, 1]], "text": "29", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 41, "row-header": false, "row-span": [41, 42]}], [{"bbox": [151.19717407226562, 76.6675033569336, 530.436279296875, 85.88050842285156], "spans": [[42, 0]], "text": "3.6.8 Demonstrating data access with a view and RCAC . . . . . . . . . . . . . . . . . . . . . . .", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 42, "row-header": false, "row-span": [42, 43]}, {"bbox": [535.9984741210938, 76.6675033569336, 547.1228637695312, 85.88050842285156], "spans": [[42, 1]], "text": "32", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 42, "row-header": false, "row-span": [42, 43]}]], "model": null, "bounding-box": null}, {"prov": [{"bbox": [135.52462768554688, 349.949462890625, 545.8714599609375, 502.2747802734375], "page": 8, "span": [0, 0], "__ref_s3_data": null}], "text": "Table 2-1 FUNCTION_USAGE view", "type": "table", "payload": null, "#-cols": 3, "#-rows": 5, "data": [[{"bbox": [142.8000030517578, 487.1369934082031, 202.2449951171875, 495.4620056152344], "spans": [[0, 0]], "text": "Column name", "type": "col_header", "col": 0, "col-header": true, "col-span": [0, 1], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [216.8087921142578, 487.1369934082031, 257.210693359375, 495.4620056152344], "spans": [[0, 1]], "text": "Data type", "type": "col_header", "col": 1, "col-header": true, "col-span": [1, 2], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [289.47479248046875, 487.1369934082031, 338.8946838378906, 495.4620056152344], "spans": [[0, 2]], "text": "Description", "type": "col_header", "col": 2, "col-header": true, "col-span": [2, 3], "row": 0, "row-header": false, "row-span": [0, 1]}], [{"bbox": [142.8000030517578, 468.1172790527344, 203.2322998046875, 476.4422912597656], "spans": [[1, 0]], "text": "FUNCTION_ID", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [216.785400390625, 468.1172790527344, 276.00360107421875, 476.4422912597656], "spans": [[1, 1]], "text": "VARCHAR(30)", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [289.45770263671875, 468.1172790527344, 359.85394287109375, 476.4422912597656], "spans": [[1, 2]], "text": "ID of the function.", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 1, "row-header": false, "row-span": [1, 2]}], [{"bbox": [142.8000030517578, 449.156982421875, 198.66929626464844, 457.48199462890625], "spans": [[2, 0]], "text": "USER_NAME", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [216.74130249023438, 449.156982421875, 275.9234924316406, 457.48199462890625], "spans": [[2, 1]], "text": "VARCHAR(10)", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [289.382080078125, 438.1166687011719, 515.0535888671875, 457.48199462890625], "spans": [[2, 2]], "text": "Name of the user profile that has a usage setting for this  function.", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 2, "row-header": false, "row-span": [2, 3]}], [{"bbox": [142.79998779296875, 419.1563720703125, 173.98318481445312, 427.48138427734375], "spans": [[3, 0]], "text": "USAGE", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [216.773681640625, 419.1563720703125, 270.9797668457031, 427.48138427734375], "spans": [[3, 1]], "text": "VARCHAR(7)", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [289.416259765625, 397.13604736328125, 539.1071166992188, 427.48138427734375], "spans": [[3, 2]], "text": "Usage setting: GLYPH<SM590000> ALLOWED: The user profile is allowed to use the function. GLYPH<SM590000> DENIED: The user profile is not allowed to use the function.", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 3, "row-header": false, "row-span": [3, 4]}], [{"bbox": [142.8000030517578, 378.1163330078125, 196.2248992919922, 386.44134521484375], "spans": [[4, 0]], "text": "USER_TYPE", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [216.75210571289062, 378.1163330078125, 270.99871826171875, 386.44134521484375], "spans": [[4, 1]], "text": "VARCHAR(5)", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [289.4316101074219, 356.15631103515625, 448.11962890625, 386.44134521484375], "spans": [[4, 2]], "text": "Type of user profile: GLYPH<SM590000> USER: The user profile is a user. GLYPH<SM590000> GROUP: The user profile is a group.", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 4, "row-header": false, "row-span": [4, 5]}]], "model": null, "bounding-box": null}, {"prov": [{"bbox": [64.41139221191406, 70.39208984375, 547.3950805664062, 398.3863830566406], "page": 9, "span": [0, 0], "__ref_s3_data": null}], "text": "Table 2-2 Comparison of the different function usage IDs and *JOBCTL authority", "type": "table", "payload": null, "#-cols": 6, "#-rows": 13, "data": [[{"bbox": [70.80030059814453, 383.1567077636719, 119.78550720214844, 391.4817199707031], "spans": [[0, 0]], "text": "User action", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 0, "row-header": true, "row-span": [0, 1]}, {"bbox": [424.93804931640625, 304.9800109863281, 433.2629699707031, 344.4774475097656], "spans": [[0, 1]], "text": "*JOBCTL", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [450.1380615234375, 304.9800109863281, 458.4629821777344, 390.3999328613281], "spans": [[0, 2]], "text": "QIBM_DB_SECADM", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [475.9383544921875, 304.9800109863281, 484.2632751464844, 390.465576171875], "spans": [[0, 3]], "text": "QIBM_DB_SQLADM", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [501.13836669921875, 304.9800109863281, 509.4632873535156, 390.385498046875], "spans": [[0, 4]], "text": "QIBM_DB_SYSMON", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [526.3986206054688, 304.9799499511719, 534.7235717773438, 359.2005615234375], "spans": [[0, 5]], "text": "No Authority", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 0, "row-header": false, "row-span": [0, 1]}], [{"bbox": [70.80000305175781, 285.11700439453125, 220.1568145751953, 293.4420166015625], "spans": [[1, 0]], "text": "SET CURRENT DEGREE  (SQL statement)", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 1, "row-header": true, "row-span": [1, 2]}, {"bbox": [429.0, 285.11700439453125, 435.00299072265625, 293.4420166015625], "spans": [[1, 1]], "text": "X", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": null, "spans": [[1, 2]], "text": "", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [480.00030517578125, 285.11700439453125, 486.0032958984375, 293.4420166015625], "spans": [[1, 3]], "text": "X", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": null, "spans": [[1, 4]], "text": "", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": null, "spans": [[1, 5]], "text": "", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 1, "row-header": false, "row-span": [1, 2]}], [{"bbox": [70.80001831054688, 266.1567077636719, 264.5538024902344, 274.4817199707031], "spans": [[2, 0]], "text": "CHGQRYA  command targeting a different user's job", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 2, "row-header": true, "row-span": [2, 3]}, {"bbox": [429.0000305175781, 266.1567077636719, 435.0030212402344, 274.4817199707031], "spans": [[2, 1]], "text": "X", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": null, "spans": [[2, 2]], "text": "", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [480.0003356933594, 266.1567077636719, 486.0033264160156, 274.4817199707031], "spans": [[2, 3]], "text": "X", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": null, "spans": [[2, 4]], "text": "", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": null, "spans": [[2, 5]], "text": "", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 2, "row-header": false, "row-span": [2, 3]}], [{"bbox": [70.800048828125, 247.1370086669922, 322.5057373046875, 255.46202087402344], "spans": [[3, 0]], "text": "STRDBMON  or  ENDDBMON  commands targeting a different user's job", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 3, "row-header": true, "row-span": [3, 4]}, {"bbox": [429.0000305175781, 247.1370086669922, 435.0030212402344, 255.46202087402344], "spans": [[3, 1]], "text": "X", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": null, "spans": [[3, 2]], "text": "", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [480.0003356933594, 247.1370086669922, 486.0033264160156, 255.46202087402344], "spans": [[3, 3]], "text": "X", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": null, "spans": [[3, 4]], "text": "", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": null, "spans": [[3, 5]], "text": "", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 3, "row-header": false, "row-span": [3, 4]}], [{"bbox": [70.800048828125, 228.1173095703125, 381.0218505859375, 236.44232177734375], "spans": [[4, 0]], "text": "STRDBMON  or  ENDDBMON  commands targeting a job that matches the current user", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 4, "row-header": true, "row-span": [4, 5]}, {"bbox": [429.0000305175781, 228.1173095703125, 435.0030212402344, 236.44232177734375], "spans": [[4, 1]], "text": "X", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": null, "spans": [[4, 2]], "text": "", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [480.0003356933594, 228.1173095703125, 486.0033264160156, 236.44232177734375], "spans": [[4, 3]], "text": "X", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [505.2606201171875, 228.1173095703125, 511.26361083984375, 236.44232177734375], "spans": [[4, 4]], "text": "X", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [530.7603149414062, 228.1173095703125, 536.7633056640625, 236.44232177734375], "spans": [[4, 5]], "text": "X", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 4, "row-header": false, "row-span": [4, 5]}], [{"bbox": [70.800048828125, 209.15701293945312, 359.5173645019531, 217.48202514648438], "spans": [[5, 0]], "text": "QUSRJOBI() API format 900 or System i Navigator's SQL Details for Job", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 5, "row-header": true, "row-span": [5, 6]}, {"bbox": [429.00006103515625, 209.15701293945312, 435.0030517578125, 217.48202514648438], "spans": [[5, 1]], "text": "X", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": null, "spans": [[5, 2]], "text": "", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [480.0003662109375, 209.15701293945312, 486.00335693359375, 217.48202514648438], "spans": [[5, 3]], "text": "X", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [505.26068115234375, 209.15701293945312, 511.263671875, 217.48202514648438], "spans": [[5, 4]], "text": "X", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": null, "spans": [[5, 5]], "text": "", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 5, "row-header": false, "row-span": [5, 6]}], [{"bbox": [70.80007934570312, 190.13731384277344, 220.7517852783203, 198.4623260498047], "spans": [[6, 0]], "text": "Visual Explain within Run SQL scripts", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 6, "row-header": true, "row-span": [6, 7]}, {"bbox": [429.00006103515625, 190.13731384277344, 435.0030517578125, 198.4623260498047], "spans": [[6, 1]], "text": "X", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": null, "spans": [[6, 2]], "text": "", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [480.0003662109375, 190.13731384277344, 486.00335693359375, 198.4623260498047], "spans": [[6, 3]], "text": "X", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [505.26068115234375, 190.13731384277344, 511.263671875, 198.4623260498047], "spans": [[6, 4]], "text": "X", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [530.7603759765625, 190.13731384277344, 536.7633666992188, 198.4623260498047], "spans": [[6, 5]], "text": "X", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 6, "row-header": false, "row-span": [6, 7]}], [{"bbox": [70.80007934570312, 171.11761474609375, 236.65480041503906, 179.442626953125], "spans": [[7, 0]], "text": "Visual Explain outside of Run SQL scripts", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 7, "row-header": true, "row-span": [7, 8]}, {"bbox": [429.00006103515625, 171.11761474609375, 435.0030517578125, 179.442626953125], "spans": [[7, 1]], "text": "X", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 7, "row-header": false, "row-span": [7, 8]}, {"bbox": null, "spans": [[7, 2]], "text": "", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 7, "row-header": false, "row-span": [7, 8]}, {"bbox": [480.0003662109375, 171.11761474609375, 486.00335693359375, 179.442626953125], "spans": [[7, 3]], "text": "X", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 7, "row-header": false, "row-span": [7, 8]}, {"bbox": null, "spans": [[7, 4]], "text": "", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 7, "row-header": false, "row-span": [7, 8]}, {"bbox": null, "spans": [[7, 5]], "text": "", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 7, "row-header": false, "row-span": [7, 8]}], [{"bbox": [70.80007934570312, 152.15731811523438, 213.1296844482422, 160.48233032226562], "spans": [[8, 0]], "text": "ANALYZE PLAN CACHE procedure", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 8, "row-header": true, "row-span": [8, 9]}, {"bbox": [429.00006103515625, 152.15731811523438, 435.0030517578125, 160.48233032226562], "spans": [[8, 1]], "text": "X", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 8, "row-header": false, "row-span": [8, 9]}, {"bbox": null, "spans": [[8, 2]], "text": "", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 8, "row-header": false, "row-span": [8, 9]}, {"bbox": [480.0003662109375, 152.15731811523438, 486.00335693359375, 160.48233032226562], "spans": [[8, 3]], "text": "X", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 8, "row-header": false, "row-span": [8, 9]}, {"bbox": null, "spans": [[8, 4]], "text": "", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 8, "row-header": false, "row-span": [8, 9]}, {"bbox": null, "spans": [[8, 5]], "text": "", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 8, "row-header": false, "row-span": [8, 9]}], [{"bbox": [70.80007934570312, 133.1376190185547, 199.87808227539062, 141.46263122558594], "spans": [[9, 0]], "text": "DUMP PLAN CACHE procedure", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 9, "row-header": true, "row-span": [9, 10]}, {"bbox": [429.00006103515625, 133.1376190185547, 435.0030517578125, 141.46263122558594], "spans": [[9, 1]], "text": "X", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 9, "row-header": false, "row-span": [9, 10]}, {"bbox": null, "spans": [[9, 2]], "text": "", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 9, "row-header": false, "row-span": [9, 10]}, {"bbox": [480.0003662109375, 133.1376190185547, 486.00335693359375, 141.46263122558594], "spans": [[9, 3]], "text": "X", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 9, "row-header": false, "row-span": [9, 10]}, {"bbox": null, "spans": [[9, 4]], "text": "", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 9, "row-header": false, "row-span": [9, 10]}, {"bbox": null, "spans": [[9, 5]], "text": "", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 9, "row-header": false, "row-span": [9, 10]}], [{"bbox": [70.80007934570312, 114.11792755126953, 208.36776733398438, 122.44291687011719], "spans": [[10, 0]], "text": "MODIFY PLAN CACHE procedure", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 10, "row-header": true, "row-span": [10, 11]}, {"bbox": [429.00006103515625, 114.11792755126953, 435.0030517578125, 122.44291687011719], "spans": [[10, 1]], "text": "X", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 10, "row-header": false, "row-span": [10, 11]}, {"bbox": null, "spans": [[10, 2]], "text": "", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 10, "row-header": false, "row-span": [10, 11]}, {"bbox": [480.0003662109375, 114.11792755126953, 486.00335693359375, 122.44291687011719], "spans": [[10, 3]], "text": "X", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 10, "row-header": false, "row-span": [10, 11]}, {"bbox": null, "spans": [[10, 4]], "text": "", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 10, "row-header": false, "row-span": [10, 11]}, {"bbox": null, "spans": [[10, 5]], "text": "", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 10, "row-header": false, "row-span": [10, 11]}], [{"bbox": [70.80007934570312, 95.09822845458984, 411.20263671875, 103.42323303222656], "spans": [[11, 0]], "text": "MODIFY PLAN CACHE PROPERTIES procedure (currently does not check authority)", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 11, "row-header": true, "row-span": [11, 12]}, {"bbox": [429.00006103515625, 95.09822845458984, 435.0030517578125, 103.42323303222656], "spans": [[11, 1]], "text": "X", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 11, "row-header": false, "row-span": [11, 12]}, {"bbox": null, "spans": [[11, 2]], "text": "", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 11, "row-header": false, "row-span": [11, 12]}, {"bbox": [480.0003662109375, 95.09822845458984, 486.00335693359375, 103.42323303222656], "spans": [[11, 3]], "text": "X", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 11, "row-header": false, "row-span": [11, 12]}, {"bbox": null, "spans": [[11, 4]], "text": "", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 11, "row-header": false, "row-span": [11, 12]}, {"bbox": null, "spans": [[11, 5]], "text": "", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 11, "row-header": false, "row-span": [11, 12]}], [{"bbox": [70.80007934570312, 76.13793182373047, 377.1258544921875, 84.46292877197266], "spans": [[12, 0]], "text": "CHANGE PLAN CACHE SIZE procedure (currently does not check authority)", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 12, "row-header": true, "row-span": [12, 13]}, {"bbox": [429.00006103515625, 76.13793182373047, 435.0030517578125, 84.46292877197266], "spans": [[12, 1]], "text": "X", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 12, "row-header": false, "row-span": [12, 13]}, {"bbox": null, "spans": [[12, 2]], "text": "", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 12, "row-header": false, "row-span": [12, 13]}, {"bbox": [480.0003662109375, 76.13793182373047, 486.00335693359375, 84.46292877197266], "spans": [[12, 3]], "text": "X", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 12, "row-header": false, "row-span": [12, 13]}, {"bbox": null, "spans": [[12, 4]], "text": "", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 12, "row-header": false, "row-span": [12, 13]}, {"bbox": null, "spans": [[12, 5]], "text": "", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 12, "row-header": false, "row-span": [12, 13]}]], "model": null, "bounding-box": null}, {"prov": [{"bbox": [134.5463104248047, 587.7283935546875, 542.0460205078125, 688.5811157226562], "page": 11, "span": [0, 0], "__ref_s3_data": null}], "text": "Table 3-1 Special registers and their corresponding values", "type": "table", "payload": null, "#-cols": 2, "#-rows": 4, "data": [[{"bbox": [142.8000030517578, 673.1370239257812, 209.67091369628906, 681.4619750976562], "spans": [[0, 0]], "text": "Special register", "type": "col_header", "col": 0, "col-header": true, "col-span": [0, 1], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [230.18911743164062, 673.1370239257812, 319.9352722167969, 681.4619750976562], "spans": [[0, 1]], "text": "Corresponding value", "type": "col_header", "col": 1, "col-header": true, "col-span": [1, 2], "row": 0, "row-header": false, "row-span": [0, 1]}], [{"bbox": [142.80001831054688, 643.1364135742188, 212.7012176513672, 662.5016479492188], "spans": [[1, 0]], "text": "USER or SESSION_USER", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [230.2197265625, 654.1766967773438, 467.9906921386719, 662.5016479492188], "spans": [[1, 1]], "text": "The effective user of the thread excluding adopted authority.", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 1, "row-header": false, "row-span": [1, 2]}], [{"bbox": [142.80003356933594, 624.11669921875, 216.63963317871094, 632.441650390625], "spans": [[2, 0]], "text": "CURRENT_USER", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [230.19813537597656, 613.13671875, 535.6508178710938, 632.441650390625], "spans": [[2, 1]], "text": "The effective user of the thread including adopted authority. When no adopted  authority is present, this has the same value as USER.", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 2, "row-header": false, "row-span": [2, 3]}], [{"bbox": [142.8009033203125, 594.1170043945312, 209.73570251464844, 602.4419555664062], "spans": [[3, 0]], "text": "SYSTEM_USER", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [230.24490356445312, 594.1170043945312, 425.64569091796875, 602.4419555664062], "spans": [[3, 1]], "text": "The authorization ID that initiated the connection.", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 3, "row-header": false, "row-span": [3, 4]}]], "model": null, "bounding-box": null}, {"prov": [{"bbox": [63.55636978149414, 495.77532958984375, 548.5687255859375, 687.76611328125], "page": 12, "span": [0, 0], "__ref_s3_data": null}], "text": "Table 3-2 Built-in global variables", "type": "table", "payload": null, "#-cols": 3, "#-rows": 10, "data": [[{"bbox": [70.80000305175781, 673.1370239257812, 134.99070739746094, 681.4619750976562], "spans": [[0, 0]], "text": "Global variable", "type": "col_header", "col": 0, "col-header": true, "col-span": [0, 1], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [202.889404296875, 673.1370239257812, 223.34640502929688, 681.4619750976562], "spans": [[0, 1]], "text": "Type", "type": "col_header", "col": 1, "col-header": true, "col-span": [1, 2], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [281.8247985839844, 673.1370239257812, 331.3428039550781, 681.4619750976562], "spans": [[0, 2]], "text": "Description", "type": "col_header", "col": 2, "col-header": true, "col-span": [2, 3], "row": 0, "row-header": false, "row-span": [0, 1]}], [{"bbox": [70.80000305175781, 654.1766967773438, 132.7209014892578, 662.5016479492188], "spans": [[1, 0]], "text": "CLIENT_HOST", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [202.89028930664062, 654.1766967773438, 267.0765075683594, 662.5016479492188], "spans": [[1, 1]], "text": "VARCHAR(255)", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [281.8473205566406, 654.1766967773438, 510.17547607421875, 662.5016479492188], "spans": [[1, 2]], "text": "Host name of the current client as returned by the system", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 1, "row-header": false, "row-span": [1, 2]}], [{"bbox": [70.80001831054688, 635.156982421875, 140.66522216796875, 643.48193359375], "spans": [[2, 0]], "text": "CLIENT_IPADDR", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [202.872314453125, 635.156982421875, 267.077392578125, 643.48193359375], "spans": [[2, 1]], "text": "VARCHAR(128)", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [281.8454895019531, 635.156982421875, 509.6058349609375, 643.48193359375], "spans": [[2, 2]], "text": "IP address of the current client as returned by the system", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 2, "row-header": false, "row-span": [2, 3]}], [{"bbox": [70.80001831054688, 616.1372680664062, 134.98263549804688, 624.4622192382812], "spans": [[3, 0]], "text": "CLIENT_PORT", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [202.90293884277344, 616.1372680664062, 242.80084228515625, 624.4622192382812], "spans": [[3, 1]], "text": "INTEGER", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [281.7978515625, 616.1372680664062, 527.5922241210938, 624.4622192382812], "spans": [[3, 2]], "text": "Port used by the current client to communicate with the server", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 3, "row-header": false, "row-span": [3, 4]}], [{"bbox": [70.80001831054688, 597.1175537109375, 143.50924682617188, 605.4425048828125], "spans": [[4, 0]], "text": "PACKAGE_NAME", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [202.80575561523438, 597.1175537109375, 267.0693664550781, 605.4425048828125], "spans": [[4, 1]], "text": "VARCHAR(128)", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [281.85186767578125, 597.1175537109375, 436.5726013183594, 605.4425048828125], "spans": [[4, 2]], "text": "Name of the currently running package", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 4, "row-header": false, "row-span": [4, 5]}], [{"bbox": [70.80001831054688, 578.1572265625, 156.01654052734375, 586.482177734375], "spans": [[5, 0]], "text": "PACKAGE_SCHEMA", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [202.83544921875, 578.1572265625, 267.0864562988281, 586.482177734375], "spans": [[5, 1]], "text": "VARCHAR(128)", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [281.8707580566406, 578.1572265625, 470.44677734375, 586.482177734375], "spans": [[5, 2]], "text": "Schema name of the currently running package", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 5, "row-header": false, "row-span": [5, 6]}], [{"bbox": [70.80001831054688, 559.1375122070312, 157.89932250976562, 567.4624633789062], "spans": [[6, 0]], "text": "PACKAGE_VERSION", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [202.72471618652344, 559.1375122070312, 261.9825439453125, 567.4624633789062], "spans": [[6, 1]], "text": "VARCHAR(64)", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [281.7492370605469, 559.1375122070312, 478.84381103515625, 567.4624633789062], "spans": [[6, 2]], "text": "Version identifier of the currently running package", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 6, "row-header": false, "row-span": [6, 7]}], [{"bbox": [70.80001831054688, 540.1177978515625, 154.419921875, 548.4427490234375], "spans": [[7, 0]], "text": "ROUTINE_SCHEMA", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 7, "row-header": false, "row-span": [7, 8]}, {"bbox": [202.79312133789062, 540.1177978515625, 267.0927429199219, 548.4427490234375], "spans": [[7, 1]], "text": "VARCHAR(128)", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 7, "row-header": false, "row-span": [7, 8]}, {"bbox": [281.87164306640625, 540.1177978515625, 464.2602233886719, 548.4427490234375], "spans": [[7, 2]], "text": "Schema name of the currently running routine", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 7, "row-header": false, "row-span": [7, 8]}], [{"bbox": [70.80001831054688, 521.157470703125, 188.43991088867188, 529.482421875], "spans": [[8, 0]], "text": "ROUTINE_SPECIFIC_NAME", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 8, "row-header": false, "row-span": [8, 9]}, {"bbox": [202.8444061279297, 521.157470703125, 267.03692626953125, 529.482421875], "spans": [[8, 1]], "text": "VARCHAR(128)", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 8, "row-header": false, "row-span": [8, 9]}, {"bbox": [281.80682373046875, 521.157470703125, 430.40045166015625, 529.482421875], "spans": [[8, 2]], "text": "Name of the currently running routine", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 8, "row-header": false, "row-span": [8, 9]}], [{"bbox": [70.80003356933594, 502.1377258300781, 139.4313507080078, 510.4627380371094], "spans": [[9, 0]], "text": "ROUTINE_TYPE", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 9, "row-header": false, "row-span": [9, 10]}, {"bbox": [202.74635314941406, 502.1377258300781, 239.2899627685547, 510.4627380371094], "spans": [[9, 1]], "text": "CHAR(1)", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 9, "row-header": false, "row-span": [9, 10]}, {"bbox": [281.7906494140625, 502.1377258300781, 425.09130859375, 510.4627380371094], "spans": [[9, 2]], "text": "Type of the currently running routine", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 9, "row-header": false, "row-span": [9, 10]}]], "model": null, "bounding-box": null}], "bitmaps": null, "equations": [], "footnotes": [], "page-dimensions": [{"height": 792.0, "page": 1, "width": 612.0}, {"height": 792.0, "page": 2, "width": 612.0}, {"height": 792.0, "page": 3, "width": 612.0}, {"height": 792.0, "page": 4, "width": 612.0}, {"height": 792.0, "page": 5, "width": 612.0}, {"height": 792.0, "page": 6, "width": 612.0}, {"height": 792.0, "page": 7, "width": 612.0}, {"height": 792.0, "page": 8, "width": 612.0}, {"height": 792.0, "page": 9, "width": 612.0}, {"height": 792.0, "page": 10, "width": 612.0}, {"height": 792.0, "page": 11, "width": 612.0}, {"height": 792.0, "page": 12, "width": 612.0}, {"height": 792.0, "page": 13, "width": 612.0}, {"height": 792.0, "page": 14, "width": 612.0}, {"height": 792.0, "page": 15, "width": 612.0}, {"height": 792.0, "page": 16, "width": 612.0}, {"height": 792.0, "page": 17, "width": 612.0}, {"height": 792.0, "page": 18, "width": 612.0}], "page-footers": [], "page-headers": [], "_s3_data": null, "identifiers": null}
\ No newline at end of file
+{"_name": "", "type": "pdf-document", "description": {"title": null, "abstract": null, "authors": null, "affiliations": null, "subjects": null, "keywords": null, "publication_date": null, "languages": null, "license": null, "publishers": null, "url_refs": null, "references": null, "publication": null, "reference_count": null, "citation_count": null, "citation_date": null, "advanced": null, "analytics": null, "logs": [], "collection": null, "acquisition": null}, "file-info": {"filename": "redp5110_sampled.pdf", "filename-prov": null, "document-hash": "bbf706f95c6042a4bcfa73a17f1472d798886d79065340ed2772992ea399a12f", "#-pages": 18, "collection-name": null, "description": null, "page-hashes": [{"hash": "8633d627a4ae407aaaede920b471d3058de656dab15d04e7d469632352890d4f", "model": "default", "page": 1}, {"hash": "ffca227099d3b581b935322e37806bb2115d104b59824ae47123f96c3717d8d4", "model": "default", "page": 2}, {"hash": "8450a101294966dc3666779e939d5d1c42dc98d2def2ac182e6a4742db908373", "model": "default", "page": 3}, {"hash": "6adc167183cbcf48541b4c076619508c0bb4a29d700308bc2a6e25a03ee35187", "model": "default", "page": 4}, {"hash": "3432d7c0892def70d3f5c2f4370fdcd728318810b6dc4a6c518f67ae1b2447cc", "model": "default", "page": 5}, {"hash": "cbddc773b2827bccbef5ffbd40190cb8eae1ee4956e57d02e0c98aff49cb7649", "model": "default", "page": 6}, {"hash": "02469ba69dff12aa1f322353cceb8b6a77a4bd92f457db01588f2bdc5f4290fe", "model": "default", "page": 7}, {"hash": "07c07b53d33e143a39b310225d156917a90398dcdf1d703f1556f952202d1474", "model": "default", "page": 8}, {"hash": "79fd01636330ea2c4b059ef3be69cfe67456924c319b3843c2cf01610f191354", "model": "default", "page": 9}, {"hash": "beac1aa99a1b5263bd18cab36cda3b4bb32308c70f8a80f5e4d088fb4feb5d41", "model": "default", "page": 10}, {"hash": "cebcf723129cb1260b0aaf0de2c9441d5b733bf9a5b494f0121b46d9e99cf6e9", "model": "default", "page": 11}, {"hash": "9d262e1cb504e092ecd989740dff6d2483a202fc36c4707230e3cdca094d2b38", "model": "default", "page": 12}, {"hash": "19a4949dea604878e01bb7fd5cc3fc0d719735fabdef3b0d43928af5c8b1730c", "model": "default", "page": 13}, {"hash": "b557acf2a8fd0918b3dc7f8c220b64f841e799325fd85796b2557c969fc1e1d0", "model": "default", "page": 14}, {"hash": "79b6d9cc327fde220894a8e04ffd5787dd8d862377e3deea082166e7aaa55a2f", "model": "default", "page": 15}, {"hash": "568a57bc2161bbb06ed17d48180e72826cdf7c8281e4914b9079c63c6373ad73", "model": "default", "page": 16}, {"hash": "3a1997b2253e42313f5b6c9eecf2f2f09f36a2b92da062d3972d13d06a6b0c8c", "model": "default", "page": 17}, {"hash": "8f11363a05bd1a5ba2ad45f12697bd8113576602c302f34ba6b50e8fc6f43047", "model": "default", "page": 18}]}, "main-text": [{"prov": [{"bbox": [287.82001, 741.25195, 418.83356, 763.45197], "page": 1, "span": [0, 11], "__ref_s3_data": null}], "text": "Front cover", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"name": "Picture", "type": "figure", "$ref": "#/figures/0"}, {"prov": [{"bbox": [35.700001, 626.15887, 584.64288, 707.4134500000001], "page": 1, "span": [0, 54], "__ref_s3_data": null}], "text": "Row and Column Access Control Support in IBM DB2 for i", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"name": "Picture", "type": "figure", "$ref": "#/figures/1"}, {"prov": [{"bbox": [287.82001, 741.25195, 418.83356, 763.45197], "page": 1, "span": [0, 11], "__ref_s3_data": null}], "text": "Front cover", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [64.800003, 695.95197, 168.73441, 718.15198], "page": 2, "span": [0, 8], "__ref_s3_data": null}], "text": "Contents", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"name": "Document Index", "type": "table-of-contents", "$ref": "#/tables/0"}, {"prov": [{"bbox": [64.800003, 706.41602, 235.8624, 717.51605], "page": 3, "span": [0, 30], "__ref_s3_data": null}], "text": "DB2 for i Center of Excellence", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [94.132698, 636.66357, 233.99973, 653.54987], "page": 3, "span": [0, 52], "__ref_s3_data": null}], "text": "Solution Brief IBM Systems Lab Services and Training", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"name": "Picture", "type": "figure", "$ref": "#/figures/2"}, {"prov": [{"bbox": [144.88921, 455.18594, 188.74681, 464.53836000000007], "page": 3, "span": [0, 10], "__ref_s3_data": null}], "text": "Highlights", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [144.88921, 433.31058, 242.87389000000002, 446.78293], "page": 3, "span": [0, 532], "__ref_s3_data": null}], "text": "- GLYPH<g115>GLYPH<g3> GLYPH<g40>GLYPH<g81>GLYPH<g75>GLYPH<g68>GLYPH<g81>GLYPH<g70>GLYPH<g72>GLYPH<g3> GLYPH<g87>GLYPH<g75>GLYPH<g72>GLYPH<g3> GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g73>GLYPH<g82>GLYPH<g85>GLYPH<g80>GLYPH<g68>GLYPH<g81>GLYPH<g70>GLYPH<g72>GLYPH<g3> GLYPH<g82>GLYPH<g73>GLYPH<g3> GLYPH<g92>GLYPH<g82>GLYPH<g88>GLYPH<g85> GLYPH<g3> GLYPH<g71>GLYPH<g68>GLYPH<g87>GLYPH<g68>GLYPH<g69>GLYPH<g68>GLYPH<g86>GLYPH<g72>GLYPH<g3> GLYPH<g82>GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g68>GLYPH<g87>GLYPH<g76>GLYPH<g82>GLYPH<g81>GLYPH<g86>", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [144.88921, 402.7627, 259.2287, 424.06781], "page": 3, "span": [0, 876], "__ref_s3_data": null}], "text": "- GLYPH<g115>GLYPH<g3> GLYPH<g40>GLYPH<g68>GLYPH<g85> GLYPH<g81>GLYPH<g3> GLYPH<g74>GLYPH<g85>GLYPH<g72>GLYPH<g68>GLYPH<g87>GLYPH<g72>GLYPH<g85>GLYPH<g3> GLYPH<g85>GLYPH<g72>GLYPH<g87>GLYPH<g88>GLYPH<g85> GLYPH<g81>GLYPH<g3> GLYPH<g82>GLYPH<g81>GLYPH<g3> GLYPH<g44>GLYPH<g55>GLYPH<g3> GLYPH<g83>GLYPH<g85>GLYPH<g82>GLYPH<g77>GLYPH<g72>GLYPH<g70>GLYPH<g87>GLYPH<g86> GLYPH<g3> GLYPH<g87>GLYPH<g75>GLYPH<g85>GLYPH<g82>GLYPH<g88>GLYPH<g74>GLYPH<g75>GLYPH<g3> GLYPH<g80>GLYPH<g82>GLYPH<g71>GLYPH<g72>GLYPH<g85> GLYPH<g81>GLYPH<g76>GLYPH<g93>GLYPH<g68>GLYPH<g87>GLYPH<g76>GLYPH<g82>GLYPH<g81>GLYPH<g3> GLYPH<g82>GLYPH<g73>GLYPH<g3> GLYPH<g71>GLYPH<g68>GLYPH<g87>GLYPH<g68>GLYPH<g69>GLYPH<g68>GLYPH<g86>GLYPH<g72>GLYPH<g3> GLYPH<g68>GLYPH<g81>GLYPH<g71> GLYPH<g3> GLYPH<g68>GLYPH<g83>GLYPH<g83>GLYPH<g79>GLYPH<g76>GLYPH<g70>GLYPH<g68>GLYPH<g87>GLYPH<g76>GLYPH<g82>GLYPH<g81>GLYPH<g86>", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [144.88921, 380.04745, 249.83562, 393.51981], "page": 3, "span": [0, 672], "__ref_s3_data": null}], "text": "- GLYPH<g115>GLYPH<g3> GLYPH<g53>GLYPH<g72>GLYPH<g79>GLYPH<g92>GLYPH<g3> GLYPH<g82>GLYPH<g81>GLYPH<g3> GLYPH<g44>GLYPH<g37>GLYPH<g48>GLYPH<g3> GLYPH<g72>GLYPH<g91>GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g87>GLYPH<g3> GLYPH<g70>GLYPH<g82>GLYPH<g81>GLYPH<g86>GLYPH<g88>GLYPH<g79>GLYPH<g87>GLYPH<g76>GLYPH<g81>GLYPH<g74>GLYPH<g15>GLYPH<g3> GLYPH<g86>GLYPH<g78>GLYPH<g76>GLYPH<g79>GLYPH<g79>GLYPH<g86> GLYPH<g3> GLYPH<g86>GLYPH<g75>GLYPH<g68>GLYPH<g85>GLYPH<g76>GLYPH<g81>GLYPH<g74>GLYPH<g3> GLYPH<g68>GLYPH<g81>GLYPH<g71>GLYPH<g3> GLYPH<g85>GLYPH<g72>GLYPH<g81>GLYPH<g82>GLYPH<g90>GLYPH<g81>GLYPH<g3> GLYPH<g86>GLYPH<g72>GLYPH<g85>GLYPH<g89>GLYPH<g76>GLYPH<g70>GLYPH<g72>GLYPH<g86>", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [144.88921, 357.33237, 234.25163000000003, 370.8047199999999], "page": 3, "span": [0, 613], "__ref_s3_data": null}], "text": "- GLYPH<g115>GLYPH<g3> GLYPH<g55> GLYPH<g68>GLYPH<g78>GLYPH<g72>GLYPH<g3> GLYPH<g68>GLYPH<g71>GLYPH<g89>GLYPH<g68>GLYPH<g81>GLYPH<g87>GLYPH<g68>GLYPH<g74>GLYPH<g72>GLYPH<g3> GLYPH<g82>GLYPH<g73>GLYPH<g3> GLYPH<g68>GLYPH<g70>GLYPH<g70>GLYPH<g72>GLYPH<g86>GLYPH<g86>GLYPH<g3> GLYPH<g87>GLYPH<g82>GLYPH<g3> GLYPH<g68> GLYPH<g3> GLYPH<g90>GLYPH<g82>GLYPH<g85>GLYPH<g79>GLYPH<g71>GLYPH<g90>GLYPH<g76>GLYPH<g71>GLYPH<g72>GLYPH<g3> GLYPH<g86>GLYPH<g82>GLYPH<g88>GLYPH<g85>GLYPH<g70>GLYPH<g72>GLYPH<g3> GLYPH<g82>GLYPH<g73>GLYPH<g3> GLYPH<g72>GLYPH<g91>GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g87>GLYPH<g76>GLYPH<g86>GLYPH<g72>", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"name": "Picture", "type": "figure", "$ref": "#/figures/3"}, {"prov": [{"bbox": [461.08859000000007, 646.57819, 506.26178, 653.59247], "page": 3, "span": [0, 14], "__ref_s3_data": null}], "text": "Power Services", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [280.24011, 515.37946, 463.80942, 552.65735], "page": 3, "span": [0, 30], "__ref_s3_data": null}], "text": "DB2 for i Center of Excellence", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [280.24011, 504.54041, 483.29572, 514.40973], "page": 3, "span": [0, 49], "__ref_s3_data": null}], "text": "Expert help to achieve your business requirements", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [280.24011, 467.10434, 443.28210000000007, 476.11838000000006], "page": 3, "span": [0, 37], "__ref_s3_data": null}], "text": "We build confident, satisfied clients", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [280.24011, 447.0405, 488.15466, 464.62405], "page": 3, "span": [0, 122], "__ref_s3_data": null}], "text": "No one else has the vast consulting experiences, skills sharing and renown service offerings to do what we can do for you.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [280.24011, 427.26999, 367.86023, 434.6739799999999], "page": 3, "span": [0, 27], "__ref_s3_data": null}], "text": "Because no one else is IBM.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [280.24011, 366.77972000000005, 500.32104000000004, 414.90198000000004], "page": 3, "span": [0, 318], "__ref_s3_data": null}], "text": "With combined experiences and direct access to development groups, we're the experts in IBM DB2\u00ae for i. The DB2 for i Center of Excellence (CoE) can help you achieve-perhaps reexamine and exceed-your business requirements and gain more confidence and satisfaction in IBM product data management products and solutions.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [280.24011, 345.13193, 434.83205999999996, 354.14597], "page": 3, "span": [0, 30], "__ref_s3_data": null}], "text": "Who we are, some of what we do", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [280.24011, 335.24777, 434.56316999999996, 342.65175999999997], "page": 3, "span": [0, 46], "__ref_s3_data": null}], "text": "Global CoE engagements cover topics including:", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [280.24011, 315.47775, 401.56412, 322.88174], "page": 3, "span": [0, 38], "__ref_s3_data": null}], "text": "- r Database performance and scalability", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [280.24011, 305.29504, 424.99646, 312.69904], "page": 3, "span": [0, 44], "__ref_s3_data": null}], "text": "- r Advanced SQL knowledge and skills transfer", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [280.24011, 295.11246, 392.15845, 302.51645], "page": 3, "span": [0, 37], "__ref_s3_data": null}], "text": "- r Business intelligence and analytics", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [280.24011, 284.92975, 339.94354, 292.33374], "page": 3, "span": [0, 15], "__ref_s3_data": null}], "text": "- r DB2 Web Query", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [280.24011, 274.74716, 504.19314999999995, 282.15115], "page": 3, "span": [0, 72], "__ref_s3_data": null}], "text": "- r Query/400 modernization for better reporting and analysis capabilities", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [280.24011, 264.5644500000001, 423.0022, 271.96844], "page": 3, "span": [0, 43], "__ref_s3_data": null}], "text": "- r Database modernization and re-engineering", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [280.24011, 254.38187000000005, 399.65173, 261.78585999999996], "page": 3, "span": [0, 38], "__ref_s3_data": null}], "text": "- r Data-centric architecture and design", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [280.24011, 244.19925999999998, 466.77881, 251.60325999999998], "page": 3, "span": [0, 58], "__ref_s3_data": null}], "text": "- r Extremely large database and overcoming limits to growth", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [280.24011, 234.01656000000003, 382.20956, 241.42054999999993], "page": 3, "span": [0, 30], "__ref_s3_data": null}], "text": "- r ISV education and enablement", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [64.800003, 695.95197, 151.46161, 718.15198], "page": 4, "span": [0, 7], "__ref_s3_data": null}], "text": "Preface", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [136.79984, 590.13928, 547.30823, 659.35138], "page": 4, "span": [0, 469], "__ref_s3_data": null}], "text": "This IBMfi Redpaper\u2122 publication provides information about the IBM i 7.2 feature of IBM DB2fi for i Row and Column Access Control (RCAC). It offers a broad description of the function and advantages of controlling access to data in a comprehensive and transparent way. This publication helps you understand the capabilities of RCAC and provides examples of defining, creating, and implementing the row permissions and column masks in a relational database environment.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [136.79987, 532.18005, 546.4657, 577.39252], "page": 4, "span": [0, 309], "__ref_s3_data": null}], "text": "This paper is intended for database engineers, data-centric application developers, and security officers who want to design and implement RCAC as a part of their data control and governance policy. A solid background in IBM i object level security, DB2 for i relational database concepts, and SQL is assumed.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [136.8, 450.15848, 547.23669, 471.37128000000007], "page": 4, "span": [0, 172], "__ref_s3_data": null}], "text": "This paper was produced by the IBM DB2 for i Center of Excellence team in partnership with the International Technical Support Organization (ITSO), Rochester, Minnesota US.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"name": "Picture", "type": "figure", "$ref": "#/figures/4"}, {"prov": [{"bbox": [263.39957, 275.14026, 541.25079, 416.35123], "page": 4, "span": [0, 684], "__ref_s3_data": null}], "text": "Jim Bainbridge is a senior DB2 consultant on the DB2 for i Center of Excellence team in the IBM Lab Services and Training organization. His primary role is training and implementation services for IBM DB2 Web Query for i and business analytics. Jim began his career with IBM 30 years ago in the IBM Rochester Development Lab, where he developed cooperative processing products that paired IBM PCs with IBM S/36 and AS/.400 systems. In the years since, Jim has held numerous technical roles, including independent software vendors technical support on a broad range of IBM technologies and products, and supporting customers in the IBM Executive Briefing Center and IBM Project Office.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"name": "Picture", "type": "figure", "$ref": "#/figures/5"}, {"prov": [{"bbox": [263.3996, 111.16283999999996, 541.27374, 264.37347], "page": 4, "span": [0, 726], "__ref_s3_data": null}], "text": "Hernando Bedoya is a Senior IT Specialist at STG Lab Services and Training in Rochester, Minnesota. He writes extensively and teaches IBM classes worldwide in all areas of DB2 for i. Before joining STG Lab Services, he worked in the ITSO for nine years writing multiple IBM Redbooksfi publications. He also worked for IBM Colombia as an IBM AS/400fi IT Specialist doing presales support for the Andean countries. He has 28 years of experience in the computing field and has taught database classes in Colombian universities. He holds a Master's degree in Computer Science from EAFIT, Colombia. His areas of expertise are database technology, performance, and data warehousing. Hernando can be contacted at hbedoya@us.ibm.com .", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [64.800003, 488.9364, 125.36661, 503.6994], "page": 4, "span": [0, 7], "__ref_s3_data": null}], "text": "Authors", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"name": "Picture", "type": "figure", "$ref": "#/figures/6"}, {"prov": [{"bbox": [500.39999, 661.86829, 522.61774, 698.8312999999999], "page": 5, "span": [0, 1], "__ref_s3_data": null}], "text": "1", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [81.0, 517.01929, 115.13253, 523.45728], "page": 5, "span": [0, 10], "__ref_s3_data": null}], "text": "Chapter 1.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [136.8, 482.1218, 547.30475, 537.11365], "page": 5, "span": [0, 36], "__ref_s3_data": null}], "text": "Securing and protecting IBM DB2 data", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [136.79965, 362.07886, 547.25403, 443.29129], "page": 5, "span": [0, 648], "__ref_s3_data": null}], "text": "Recent news headlines are filled with reports of data breaches and cyber-attacks impacting global businesses of all sizes. The Identity Theft Resource Center$^{1}$ reports that almost 5000 data breaches have occurred since 2005, exposing over 600 million records of data. The financial cost of these data breaches is skyrocketing. Studies from the Ponemon Institute$^{2}$ revealed that the average cost of a data breach increased in 2013 by 15% globally and resulted in a brand equity loss of $9.4 million per attack. The average cost that is incurred for each lost record containing sensitive information increased more than 9% to $145 per record.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [136.80023, 304.05984, 527.2063, 349.2722800000001], "page": 5, "span": [0, 304], "__ref_s3_data": null}], "text": "Businesses must make a serious effort to secure their data and recognize that securing information assets is a cost of doing business. In many parts of the world and in many industries, securing the data is required by law and subject to audits. Data security is no longer an option; it is a requirement.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [136.80025, 270.10022000000004, 547.15515, 291.31302], "page": 5, "span": [0, 122], "__ref_s3_data": null}], "text": "This chapter describes how you can secure and protect data in DB2 for i. The following topics are covered in this chapter:", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [136.80025, 253.06064000000003, 250.23166999999998, 262.27365], "page": 5, "span": [0, 37], "__ref_s3_data": null}], "text": "- GLYPH<SM590000> Security fundamentals", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [136.80025, 241.06083999999998, 282.98114, 250.27382999999998], "page": 5, "span": [0, 47], "__ref_s3_data": null}], "text": "- GLYPH<SM590000> Current state of IBM i security", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [136.80025, 229.06104000000005, 264.88187, 238.27403000000004], "page": 5, "span": [0, 43], "__ref_s3_data": null}], "text": "- GLYPH<SM590000> DB2 for i security controls", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [136.8, 67.219559, 258.36255, 74.24993900000004], "page": 5, "span": [0, 35], "__ref_s3_data": null}], "text": "$^{1 }$http://www.idtheftcenter.org", "type": "footnote", "payload": null, "name": "Footnote", "font": null}, {"prov": [{"bbox": [136.8, 57.02823999999998, 234.05881, 64.40973699999995], "page": 5, "span": [0, 31], "__ref_s3_data": null}], "text": "$^{2 }$http://www.ponemon.org /", "type": "footnote", "payload": null, "name": "Footnote", "font": null}, {"prov": [{"bbox": [64.800003, 702.8963, 267.40582, 717.6593], "page": 6, "span": [0, 25], "__ref_s3_data": null}], "text": "1.1 Security fundamentals", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [136.8, 664.17847, 545.00482, 685.3913], "page": 6, "span": [0, 133], "__ref_s3_data": null}], "text": "Before reviewing database security techniques, there are two fundamental steps in securing information assets that must be described:", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [136.8, 611.13892, 547.16425, 656.87512], "page": 6, "span": [0, 361], "__ref_s3_data": null}], "text": "- GLYPH<SM590000> First, and most important, is the definition of a company's security policy . Without a security policy, there is no definition of what are acceptable practices for using, accessing, and storing information by who, what, when, where, and how. A security policy should minimally address three things: confidentiality, integrity, and availability.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [151.19946, 522.16022, 547.26086, 603.37213], "page": 6, "span": [0, 587], "__ref_s3_data": null}], "text": "- The monitoring and assessment of adherence to the security policy determines whether your security strategy is working. Often, IBM security consultants are asked to perform security assessments for companies without regard to the security policy. Although these assessments can be useful for observing how the system is defined and how data is being accessed, they cannot determine the level of security without a security policy. Without a security policy, it really is not an assessment as much as it is a baseline for monitoring the changes in the security settings that are captured.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [151.19946, 505.18042, 541.992, 514.39343], "page": 6, "span": [0, 90], "__ref_s3_data": null}], "text": "A security policy is what defines whether the system and its settings are secure (or not).", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [136.7993, 416.1394, 547.15826, 497.87503000000004], "page": 6, "span": [0, 573], "__ref_s3_data": null}], "text": "- GLYPH<SM590000> The second fundamental in securing data assets is the use of resource security . If implemented properly, resource security prevents data breaches from both internal and external intrusions. Resource security controls are closely tied to the part of the security policy that defines who should have access to what information resources. A hacker might be good enough to get through your company firewalls and sift his way through to your system, but if they do not have explicit access to your database, the hacker cannot compromise your information assets.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [136.80022, 382.17978, 535.36169, 403.39258], "page": 6, "span": [0, 179], "__ref_s3_data": null}], "text": "With your eyes now open to the importance of securing information assets, the rest of this chapter reviews the methods that are available for securing database resources on IBM i.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [64.800003, 338.93628, 323.38391, 353.69928], "page": 6, "span": [0, 35], "__ref_s3_data": null}], "text": "1.2 Current state of IBM i security", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [136.8, 276.15884000000005, 547.31824, 321.37128], "page": 6, "span": [0, 306], "__ref_s3_data": null}], "text": "Because of the inherently secure nature of IBM i, many clients rely on the default system settings to protect their business data that is stored in DB2 for i. In most cases, this means no data protection because the default setting for the Create default public authority (QCRTAUT) system value is *CHANGE.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [136.8, 206.14005999999995, 547.28442, 263.35226], "page": 6, "span": [0, 405], "__ref_s3_data": null}], "text": "Even more disturbing is that many IBM i clients remain in this state, despite the news headlines and the significant costs that are involved with databases being compromised. This default security configuration makes it quite challenging to implement basic security policies. A tighter implementation is required if you really want to protect one of your company's most valuable assets, which is the data.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [136.8, 112.12167, 547.28326, 193.33349999999996], "page": 6, "span": [0, 640], "__ref_s3_data": null}], "text": "Traditionally, IBM i applications have employed menu-based security to counteract this default configuration that gives all users access to the data. The theory is that data is protected by the menu options controlling what database operations that the user can perform. This approach is ineffective, even if the user profile is restricted from running interactive commands. The reason is that in today's connected world there are a multitude of interfaces into the system, from web browsers to PC clients, that bypass application menus. If there are no object-level controls, users of these newer interfaces have an open door to your data.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [136.8, 639.27942, 544.30334, 720.49133], "page": 7, "span": [0, 589], "__ref_s3_data": null}], "text": "Many businesses are trying to limit data access to a need-to-know basis. This security goal means that users should be given access only to the minimum set of data that is required to perform their job. Often, users with object-level access are given access to row and column values that are beyond what their business task requires because that object-level security provides an all-or-nothing solution. For example, object-level controls allow a manager to access data about all employees. Most security policies limit a manager to accessing data only for the employees that they manage.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [64.800003, 606.67725, 301.46902, 618.66528], "page": 7, "span": [0, 37], "__ref_s3_data": null}], "text": "1.3.1 Existing row and column control", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [136.79999, 535.29901, 541.56738, 592.51129], "page": 7, "span": [0, 377], "__ref_s3_data": null}], "text": "Some IBM i clients have tried augmenting the all-or-nothing object-level security with SQL views (or logical files) and application logic, as shown in Figure 1-2. However, application-based logic is easy to bypass with all of the different data access interfaces that are provided by the IBM i operating system, such as Open Database Connectivity (ODBC) and System i Navigator.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [136.79999, 477.27997, 547.4408, 522.49243], "page": 7, "span": [0, 340], "__ref_s3_data": null}], "text": "Using SQL views to limit access to a subset of the data in a table also has its own set of challenges. First, there is the complexity of managing all of the SQL view objects that are used for securing data access. Second, scaling a view-based security solution can be difficult as the amount of data grows and the number of users increases.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [136.79999, 431.26077, 547.23267, 464.47339], "page": 7, "span": [0, 247], "__ref_s3_data": null}], "text": "Even if you are willing to live with these performance and management issues, a user with *ALLOBJ access still can directly access all of the data in the underlying DB2 table and easily bypass the security controls that are built into an SQL view.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"name": "Picture", "type": "figure", "$ref": "#/figures/7"}, {"prov": [{"bbox": [64.800003, 708.67725, 335.49551, 720.66528], "page": 8, "span": [0, 38], "__ref_s3_data": null}], "text": "2.1.6 Change Function Usage CL command", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [136.8, 685.2982799999999, 547.28442, 694.51129], "page": 8, "span": [0, 90], "__ref_s3_data": null}], "text": "The following CL commands can be used to work with, display, or change function usage IDs:", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [136.8, 668.25873, 301.51749, 677.47174], "page": 8, "span": [0, 49], "__ref_s3_data": null}], "text": "- GLYPH<SM590000> Work Function Usage ( WRKFCNUSG )", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [136.80099, 656.25891, 313.39777, 665.47192], "page": 8, "span": [0, 51], "__ref_s3_data": null}], "text": "- GLYPH<SM590000> Change Function Usage ( CHGFCNUSG )", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [136.80098, 644.25909, 310.81711, 653.47211], "page": 8, "span": [0, 52], "__ref_s3_data": null}], "text": "- GLYPH<SM590000> Display Function Usage ( DSPFCNUSG )", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [136.79997, 610.2995, 512.53802, 631.51233], "page": 8, "span": [0, 126], "__ref_s3_data": null}], "text": "For example, the following CHGFCNUSG command shows granting authorization to user HBEDOYA to administer and manage RCAC rules:", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [136.80096, 593.54877, 441.59686, 602.32355], "page": 8, "span": [0, 61], "__ref_s3_data": null}], "text": "CHGFCNUSG FCNID(QIBM_DB_SECADM) USER(HBEDOYA) USAGE(*ALLOWED)", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [64.800003, 560.65729, 544.47546, 572.64532], "page": 8, "span": [0, 72], "__ref_s3_data": null}], "text": "2.1.7 Verifying function usage IDs for RCAC with the FUNCTION_USAGE view", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [136.8, 525.2785, 519.51794, 546.49133], "page": 8, "span": [0, 130], "__ref_s3_data": null}], "text": "The FUNCTION_USAGE view contains function usage configuration details. Table 2-1 describes the columns in the FUNCTION_USAGE view.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"name": "Table", "type": "table", "$ref": "#/tables/1"}, {"prov": [{"bbox": [136.8, 504.11699999999996, 283.96805, 512.44202], "page": 8, "span": [0, 29], "__ref_s3_data": null}], "text": "Table 2-1 FUNCTION_USAGE view", "type": "caption", "payload": null, "name": "Caption", "font": null}, {"prov": [{"bbox": [136.8, 318.27847, 547.2804, 339.49127000000004], "page": 8, "span": [0, 112], "__ref_s3_data": null}], "text": "To discover who has authorization to define and manage RCAC, you can use the query that is shown in Example 2-1.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [136.8, 297.117, 462.35419, 305.44202], "page": 8, "span": [0, 74], "__ref_s3_data": null}], "text": "Example 2-1 Query to determine who has authority to define and manage RCAC", "type": "caption", "payload": null, "name": "Caption", "font": null}, {"prov": [{"bbox": [136.8, 279.56719999999996, 171.26956, 288.34198], "page": 8, "span": [0, 6], "__ref_s3_data": null}], "text": "SELECT", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [182.75941, 279.56719999999996, 251.69853, 288.34198], "page": 8, "span": [0, 12], "__ref_s3_data": null}], "text": "function_id,", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [166.78244, 267.56737999999996, 241.73852999999997, 276.3421599999999], "page": 8, "span": [0, 10], "__ref_s3_data": null}], "text": "user_name,", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [170.75961, 255.56758000000002, 221.69901999999996, 264.34235], "page": 8, "span": [0, 6], "__ref_s3_data": null}], "text": "usage,", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [167.53809, 243.56777999999997, 236.69878, 252.34253], "page": 8, "span": [0, 9], "__ref_s3_data": null}], "text": "user_type", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [136.8, 231.56798000000003, 160.59396, 240.34272999999996], "page": 8, "span": [0, 4], "__ref_s3_data": null}], "text": "FROM", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [178.43944, 231.56798000000003, 261.71829, 240.34272999999996], "page": 8, "span": [0, 14], "__ref_s3_data": null}], "text": "function_usage", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [136.8, 219.56817999999998, 162.44176, 228.34293000000002], "page": 8, "span": [0, 5], "__ref_s3_data": null}], "text": "WHERE", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [177.8268, 219.56817999999998, 331.67731, 228.34293000000002], "page": 8, "span": [0, 28], "__ref_s3_data": null}], "text": "function_id=\u2019QIBM_DB_SECADM\u2019", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [136.8, 207.56836999999996, 178.77542, 216.34312], "page": 8, "span": [0, 8], "__ref_s3_data": null}], "text": "ORDER BY", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [189.26929, 207.56836999999996, 241.73856, 216.34312], "page": 8, "span": [0, 10], "__ref_s3_data": null}], "text": "user_name;", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [64.800003, 157.01637000000005, 249.59605000000002, 171.77936999999997], "page": 8, "span": [0, 24], "__ref_s3_data": null}], "text": "2.2 Separation of duties", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [136.8, 82.23904400000004, 547.22345, 139.45128], "page": 8, "span": [0, 463], "__ref_s3_data": null}], "text": "Separation of duties helps businesses comply with industry regulations or organizational requirements and simplifies the management of authorities. Separation of duties is commonly used to prevent fraudulent activities or errors by a single person. It provides the ability for administrative functions to be divided across individuals without overlapping responsibilities, so that one user does not possess unlimited authority, such as with the *ALLOBJ authority.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [136.79959, 651.27887, 542.69434, 720.49097], "page": 9, "span": [0, 516], "__ref_s3_data": null}], "text": "For example, assume that a business has assigned the duty to manage security on IBM i to Theresa. Before release IBM i 7.2, to grant privileges, Theresa had to have the same privileges Theresa was granting to others. Therefore, to grant *USE privileges to the PAYROLL table, Theresa had to have *OBJMGT and *USE authority (or a higher level of authority, such as *ALLOBJ). This requirement allowed Theresa to access the data in the PAYROLL table even though Theresa's job description was only to manage its security.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [136.79959, 593.25983, 547.30396, 638.47229], "page": 9, "span": [0, 285], "__ref_s3_data": null}], "text": "In IBM i 7.2, the QIBM_DB_SECADM function usage grants authorities, revokes authorities, changes ownership, or changes the primary group without giving access to the object or, in the case of a database table, to the data that is in the table or allowing other operations on the table.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [136.79959, 559.30023, 538.65076, 580.51306], "page": 9, "span": [0, 129], "__ref_s3_data": null}], "text": "QIBM_DB_SECADM function usage can be granted only by a user with *SECADM special authority and can be given to a user or a group.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [136.79959, 513.28101, 545.79602, 546.49365], "page": 9, "span": [0, 204], "__ref_s3_data": null}], "text": "QIBM_DB_SECADM also is responsible for administering RCAC, which restricts which rows a user is allowed to access in a table and whether a user is allowed to see information in certain columns of a table.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [136.79959, 455.26199, 539.80713, 500.47443], "page": 9, "span": [0, 285], "__ref_s3_data": null}], "text": "A preferred practice is that the RCAC administrator has the QIBM_DB_SECADM function usage ID, but absolutely no other data privileges. The result is that the RCAC administrator can deploy and maintain the RCAC constructs, but cannot grant themselves unauthorized access to data itself.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [136.79959, 421.30236999999994, 543.06714, 442.51517], "page": 9, "span": [0, 136], "__ref_s3_data": null}], "text": "Table 2-2 shows a comparison of the different function usage IDs and *JOBCTL authority to the different CL commands and DB2 for i tools.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"name": "Table", "type": "table", "$ref": "#/tables/2"}, {"prov": [{"bbox": [64.800003, 400.13699, 391.75464, 408.4620100000001], "page": 9, "span": [0, 78], "__ref_s3_data": null}], "text": "Table 2-2 Comparison of the different function usage IDs and *JOBCTL authority", "type": "caption", "payload": null, "name": "Caption", "font": null}, {"prov": [{"bbox": [136.79956, 699.27814, 528.73059, 720.49097], "page": 10, "span": [0, 135], "__ref_s3_data": null}], "text": "The SQL CREATE PERMISSION statement that is shown in Figure 3-1 is used to define and initially enable or disable the row access rules.", "type": "caption", "payload": null, "name": "Caption", "font": null}, {"name": "Picture", "type": "figure", "$ref": "#/figures/8"}, {"prov": [{"bbox": [136.8, 340.95599, 215.37601, 352.05600000000004], "page": 10, "span": [0, 11], "__ref_s3_data": null}], "text": "Column mask", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [136.8, 291.69885, 542.76648, 336.91128999999995], "page": 10, "span": [0, 297], "__ref_s3_data": null}], "text": "A column mask is a database object that manifests a column value access control rule for a specific column in a specific table. It uses a CASE expression that describes what you see when you access the column. For example, a teller can see only the last four digits of a tax identification number.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [136.79959, 711.2779500000001, 412.20758, 720.49097], "page": 11, "span": [0, 62], "__ref_s3_data": null}], "text": "Table 3-1 summarizes these special registers and their values.", "type": "caption", "payload": null, "name": "Caption", "font": null}, {"name": "Table", "type": "table", "$ref": "#/tables/3"}, {"prov": [{"bbox": [136.8, 690.177, 372.60364, 698.50195], "page": 11, "span": [0, 58], "__ref_s3_data": null}], "text": "Table 3-1 Special registers and their corresponding values", "type": "caption", "payload": null, "name": "Caption", "font": null}, {"prov": [{"bbox": [136.8, 556.29846, 538.4939, 577.51129], "page": 11, "span": [0, 97], "__ref_s3_data": null}], "text": "Figure 3-5 shows the difference in the special register values when an adopted authority is used:", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [136.8, 539.25891, 411.36139, 548.47192], "page": 11, "span": [0, 75], "__ref_s3_data": null}], "text": "- GLYPH<SM590000> A user connects to the server using the user profile ALICE.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [136.8, 522.27911, 453.2580899999999, 531.49213], "page": 11, "span": [0, 77], "__ref_s3_data": null}], "text": "- GLYPH<SM590000> USER and CURRENT USER initially have the same value of ALICE.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [136.8, 493.2995, 541.44983, 514.51233], "page": 11, "span": [0, 160], "__ref_s3_data": null}], "text": "- GLYPH<SM590000> ALICE calls an SQL procedure that is named proc1, which is owned by user profile JOE and was created to adopt JOE's authority when it is called.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [136.8, 452.26028, 547.21674, 485.4729], "page": 11, "span": [0, 253], "__ref_s3_data": null}], "text": "- GLYPH<SM590000> While the procedure is running, the special register USER still contains the value of ALICE because it excludes any adopted authority. The special register CURRENT USER contains the value of JOE because it includes any adopted authority.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [136.80101, 423.28066999999993, 547.35406, 444.49347], "page": 11, "span": [0, 133], "__ref_s3_data": null}], "text": "- GLYPH<SM590000> When proc1 ends, the session reverts to its original state with both USER and CURRENT USER having the value of ALICE.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"name": "Picture", "type": "figure", "$ref": "#/figures/9"}, {"prov": [{"bbox": [64.800003, 154.45727999999997, 247.02536, 166.44528000000003], "page": 11, "span": [0, 31], "__ref_s3_data": null}], "text": "3.2.2 Built-in global variables", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [136.8, 119.07847000000004, 518.00116, 140.29128000000003], "page": 11, "span": [0, 161], "__ref_s3_data": null}], "text": "Built-in global variables are provided with the database manager and are used in SQL statements to retrieve scalar values that are associated with the variables.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [136.8, 73.05927999999994, 532.3385, 106.27189999999996], "page": 11, "span": [0, 233], "__ref_s3_data": null}], "text": "IBM DB2 for i supports nine different built-in global variables that are read only and maintained by the system. These global variables can be used to identify attributes of the database connection and used as part of the RCAC logic.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [136.8, 711.27832, 342.54773, 720.49133], "page": 12, "span": [0, 51], "__ref_s3_data": null}], "text": "Table 3-2 lists the nine built-in global variables.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"name": "Table", "type": "table", "$ref": "#/tables/4"}, {"prov": [{"bbox": [64.800003, 690.177, 201.18147, 698.50195], "page": 12, "span": [0, 35], "__ref_s3_data": null}], "text": "Table 3-2 Built-in global variables", "type": "caption", "payload": null, "name": "Caption", "font": null}, {"prov": [{"bbox": [64.800003, 455.03628999999995, 384.36389, 469.79929], "page": 12, "span": [0, 34], "__ref_s3_data": null}], "text": "3.3 VERIFY_GROUP_FOR_USER function", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [136.8, 356.25939999999997, 547.23474, 437.47128], "page": 12, "span": [0, 576], "__ref_s3_data": null}], "text": "The VERIFY_GROUP_FOR_USER function was added in IBM i 7.2. Although it is primarily intended for use with RCAC permissions and masks, it can be used in other SQL statements. The first parameter must be one of these three special registers: SESSION_USER, USER, or CURRENT_USER. The second and subsequent parameters are a list of user or group profiles. Each of these values must be 1 - 10 characters in length. These values are not validated for their existence, which means that you can specify the names of user profiles that do not exist without receiving any kind of error.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [136.80002, 310.29996, 547.25739, 343.51257], "page": 12, "span": [0, 235], "__ref_s3_data": null}], "text": "If a special register value is in the list of user profiles or it is a member of a group profile included in the list, the function returns a long integer value of 1. Otherwise, it returns a value of 0. It never returns the null value.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [136.80002, 288.2804, 458.44525000000004, 297.49338], "page": 12, "span": [0, 63], "__ref_s3_data": null}], "text": "Here is an example of using the VERIFY_GROUP_FOR_USER function:", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [136.80002, 271.24081, 406.07751, 280.4538], "page": 12, "span": [0, 57], "__ref_s3_data": null}], "text": "- 1. There are user profiles for MGR, JANE, JUDY, and TONY.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [136.80002, 254.26099999999997, 396.98816, 263.47399999999993], "page": 12, "span": [0, 58], "__ref_s3_data": null}], "text": "- 2. The user profile JANE specifies a group profile of MGR.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [136.80002, 225.28139, 536.5686, 246.49419], "page": 12, "span": [0, 127], "__ref_s3_data": null}], "text": "- 3. If a user is connected to the server using user profile JANE, all of the following function invocations return a value of 1:", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [151.20018, 150.57143999999994, 451.01605, 217.30542000000003], "page": 12, "span": [0, 265], "__ref_s3_data": null}], "text": "VERIFY_GROUP_FOR_USER (CURRENT_USER, 'MGR') VERIFY_GROUP_FOR_USER (CURRENT_USER, 'JANE', 'MGR') VERIFY_GROUP_FOR_USER (CURRENT_USER, 'JANE', 'MGR', 'STEVE') The following function invocation returns a value of 0: VERIFY_GROUP_FOR_USER (CURRENT_USER, 'JUDY', 'TONY')", "type": "paragraph", "payload": null, "name": "Code", "font": null}, {"prov": [{"bbox": [136.79959, 711.56677, 166.73935, 720.34155], "page": 13, "span": [0, 6], "__ref_s3_data": null}], "text": "RETURN", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [136.79959, 699.56696, 156.77934, 708.34174], "page": 13, "span": [0, 4], "__ref_s3_data": null}], "text": "CASE", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [136.79959, 531.56952, 521.57428, 696.3419199999998], "page": 13, "span": [0, 437], "__ref_s3_data": null}], "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'HR', 'EMP' ) = 1 THEN EMPLOYEES . DATE_OF_BIRTH WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1 AND SESSION_USER = EMPLOYEES . USER_ID THEN EMPLOYEES . DATE_OF_BIRTH WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1 AND SESSION_USER <> EMPLOYEES . USER_ID THEN ( 9999 || '-' || MONTH ( EMPLOYEES . DATE_OF_BIRTH ) || '-' || DAY (EMPLOYEES.DATE_OF_BIRTH )) ELSE NULL END ENABLE ;", "type": "paragraph", "payload": null, "name": "Code", "font": null}, {"prov": [{"bbox": [136.79959, 495.28128000000004, 547.21222, 516.49408], "page": 13, "span": [0, 136], "__ref_s3_data": null}], "text": "- 2. The other column to mask in this example is the TAX_ID information. In this example, the rules to enforce include the following ones:", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [152.0394, 478.30147999999997, 469.1528, 487.51446999999996], "page": 13, "span": [0, 62], "__ref_s3_data": null}], "text": "- -Human Resources can see the unmasked TAX_ID of the employees.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [152.0394, 461.2619, 403.95953, 470.47488], "page": 13, "span": [0, 50], "__ref_s3_data": null}], "text": "- -Employees can see only their own unmasked TAX_ID.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [152.0394, 432.28229, 545.16846, 453.49509], "page": 13, "span": [0, 129], "__ref_s3_data": null}], "text": "- -Managers see a masked version of TAX_ID with the first five characters replaced with the X character (for example, XXX-XX-1234).", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [152.0394, 415.3024899999999, 529.46362, 424.51547], "page": 13, "span": [0, 77], "__ref_s3_data": null}], "text": "- -Any other person sees the entire TAX_ID as masked, for example, XXX-XX-XXXX.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [151.19978, 398.26291, 530.0603, 407.47589], "page": 13, "span": [0, 82], "__ref_s3_data": null}], "text": "- To implement this column mask, run the SQL statement that is shown in Example 3-9.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [136.8, 107.55115999999998, 526.55469, 368.32189999999997], "page": 13, "span": [0, 590], "__ref_s3_data": null}], "text": "CREATE MASK HR_SCHEMA.MASK_TAX_ID_ON_EMPLOYEES ON HR_SCHEMA.EMPLOYEES AS EMPLOYEES FOR COLUMN TAX_ID RETURN CASE WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'HR' ) = 1 THEN EMPLOYEES . TAX_ID WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1 AND SESSION_USER = EMPLOYEES . USER_ID THEN EMPLOYEES . TAX_ID WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1 AND SESSION_USER <> EMPLOYEES . USER_ID THEN ( 'XXX-XX-' CONCAT QSYS2 . SUBSTR ( EMPLOYEES . TAX_ID , 8 , 4 ) ) WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'EMP' ) = 1 THEN EMPLOYEES . TAX_ID ELSE 'XXX-XX-XXXX' END ENABLE ;", "type": "paragraph", "payload": null, "name": "Code", "font": null}, {"prov": [{"bbox": [136.8, 377.15698, 351.9873, 385.48199], "page": 13, "span": [0, 48], "__ref_s3_data": null}], "text": "Example 3-9 Creating a mask on the TAX_ID column", "type": "caption", "payload": null, "name": "Caption", "font": null}, {"prov": [{"bbox": [136.8, 711.27832, 449.9523899999999, 720.49133], "page": 14, "span": [0, 65], "__ref_s3_data": null}], "text": "- 3. Figure 3-10 shows the masks that are created in the HR_SCHEMA.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"name": "Picture", "type": "figure", "$ref": "#/figures/10"}, {"prov": [{"bbox": [64.800003, 577.63727, 203.98521, 589.62531], "page": 14, "span": [0, 21], "__ref_s3_data": null}], "text": "3.6.6 Activating RCAC", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [136.8, 530.25867, 547.22565, 563.47131], "page": 14, "span": [0, 265], "__ref_s3_data": null}], "text": "Now that you have created the row permission and the two column masks, RCAC must be activated. The row permission and the two column masks are enabled (last clause in the scripts), but now you must activate RCAC on the table. To do so, complete the following steps:", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [136.8, 513.27887, 409.47888, 522.49188], "page": 14, "span": [0, 57], "__ref_s3_data": null}], "text": "- 1. Run the SQL statements that are shown in Example 3-10.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [136.8, 492.11699999999996, 375.29099, 500.44202], "page": 14, "span": [0, 51], "__ref_s3_data": null}], "text": "Example 3-10 Activating RCAC on the EMPLOYEES table", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [136.8, 474.56711, 376.67661, 483.34189], "page": 14, "span": [0, 45], "__ref_s3_data": null}], "text": "- /* Active Row Access Control (permissions) */", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [136.8, 462.56729, 354.86963, 471.34207], "page": 14, "span": [0, 39], "__ref_s3_data": null}], "text": "- /* Active Column Access Control (masks)", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [365.77313, 462.56729, 376.67661, 471.34207], "page": 14, "span": [0, 2], "__ref_s3_data": null}], "text": "*/", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [136.8, 450.56747, 291.7178, 459.34225], "page": 14, "span": [0, 31], "__ref_s3_data": null}], "text": "ALTER TABLE HR_SCHEMA.EMPLOYEES", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [136.8, 438.56765999999993, 271.67831, 447.34244], "page": 14, "span": [0, 27], "__ref_s3_data": null}], "text": "ACTIVATE ROW ACCESS CONTROL", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [136.8, 426.56784, 291.7178, 435.34262], "page": 14, "span": [0, 31], "__ref_s3_data": null}], "text": "ACTIVATE COLUMN ACCESS CONTROL;", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [136.8, 378.27979, 540.80145, 411.4924], "page": 14, "span": [0, 231], "__ref_s3_data": null}], "text": "- 2. Look at the definition of the EMPLOYEE table, as shown in Figure 3-11. To do this, from the main navigation pane of System i Navigator, click Schemas \uf0ae HR_SCHEMA \uf0ae Tables , right-click the EMPLOYEES table, and click Definition .", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"name": "Picture", "type": "figure", "$ref": "#/figures/11"}, {"prov": [{"bbox": [136.79959, 687.27832, 514.04858, 720.49097], "page": 15, "span": [0, 228], "__ref_s3_data": null}], "text": "- 2. Figure 4-68 shows the Visual Explain of the same SQL statement, but with RCAC enabled. It is clear that the implementation of the SQL statement is more complex because the row permission rule becomes part of the WHERE clause.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"prov": [{"bbox": [136.8, 252.21875, 547.23944, 285.43137], "page": 15, "span": [0, 232], "__ref_s3_data": null}], "text": "- 3. Compare the advised indexes that are provided by the Optimizer without RCAC and with RCAC enabled. Figure 4-69 shows the index advice for the SQL statement without RCAC enabled. The index being advised is for the ORDER BY clause.", "type": "paragraph", "payload": null, "name": "List-item", "font": null}, {"name": "Picture", "type": "figure", "$ref": "#/figures/12"}, {"name": "Picture", "type": "figure", "$ref": "#/figures/13"}, {"prov": [{"bbox": [64.800308, 85.39238, 500.69727, 720.32703], "page": 16, "span": [0, 1998], "__ref_s3_data": null}], "text": "THEN C . CUSTOMER_TAX_ID WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'TELLER' ) = 1 THEN ( 'XXX-XX-' CONCAT QSYS2 . SUBSTR ( C . CUSTOMER_TAX_ID , 8 , 4 ) ) WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 THEN C . CUSTOMER_TAX_ID ELSE 'XXX-XX-XXXX' END ENABLE ; CREATE MASK BANK_SCHEMA.MASK_DRIVERS_LICENSE_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C FOR COLUMN CUSTOMER_DRIVERS_LICENSE_NUMBER RETURN CASE WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 THEN C . CUSTOMER_DRIVERS_LICENSE_NUMBER WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'TELLER' ) = 1 THEN C . CUSTOMER_DRIVERS_LICENSE_NUMBER WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 THEN C . CUSTOMER_DRIVERS_LICENSE_NUMBER ELSE '*************' END ENABLE ; CREATE MASK BANK_SCHEMA.MASK_LOGIN_ID_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C FOR COLUMN CUSTOMER_LOGIN_ID RETURN CASE WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 THEN C . CUSTOMER_LOGIN_ID WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 THEN C . CUSTOMER_LOGIN_ID ELSE '*****' END ENABLE ; CREATE MASK BANK_SCHEMA.MASK_SECURITY_QUESTION_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C FOR COLUMN CUSTOMER_SECURITY_QUESTION RETURN CASE WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 THEN C . CUSTOMER_SECURITY_QUESTION WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 THEN C . CUSTOMER_SECURITY_QUESTION ELSE '*****' END ENABLE ; CREATE MASK BANK_SCHEMA.MASK_SECURITY_QUESTION_ANSWER_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C FOR COLUMN CUSTOMER_SECURITY_QUESTION_ANSWER RETURN CASE WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 THEN C . CUSTOMER_SECURITY_QUESTION_ANSWER WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 THEN C . CUSTOMER_SECURITY_QUESTION_ANSWER ELSE '*****' END ENABLE ; ALTER TABLE BANK_SCHEMA.CUSTOMERS ACTIVATE ROW ACCESS CONTROL ACTIVATE COLUMN ACCESS CONTROL ;", "type": "paragraph", "payload": null, "name": "Code", "font": null}, {"prov": [{"bbox": [287.22, 741.25195, 414.24481, 763.45197], "page": 18, "span": [0, 10], "__ref_s3_data": null}], "text": "Back cover", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [27.0, 651.53998, 447.36002, 718.3620000000001], "page": 18, "span": [0, 54], "__ref_s3_data": null}], "text": "Row and Column Access Control Support in IBM DB2 for i", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [26.700001, 525.16803, 127.4436, 549.828], "page": 18, "span": [0, 40], "__ref_s3_data": null}], "text": "Implement roles and separation of duties", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [26.700001, 469.12802, 120.28319999999998, 507.82803], "page": 18, "span": [0, 40], "__ref_s3_data": null}], "text": "Leverage row permissions on the database", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [152.94, 468.40811, 414.08423, 549.27142], "page": 18, "span": [0, 464], "__ref_s3_data": null}], "text": "This IBM Redpaper publication provides information about the IBM i 7.2 feature of IBM DB2 for i Row and Column Access Control (RCAC). It offers a broad description of the function and advantages of controlling access to data in a comprehensive and transparent way. This publication helps you understand the capabilities of RCAC and provides examples of defining, creating, and implementing the row permissions and column masks in a relational database environment.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [26.700001, 413.14801, 121.44960000000002, 451.84801999999996], "page": 18, "span": [0, 40], "__ref_s3_data": null}], "text": "Protect columns by defining column masks", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [152.94002, 403.42905, 414.17383, 460.29272], "page": 18, "span": [0, 309], "__ref_s3_data": null}], "text": "This paper is intended for database engineers, data-centric application developers, and security officers who want to design and implement RCAC as a part of their data control and governance policy. A solid background in IBM i object level security, DB2 for i relational database concepts, and SQL is assumed.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"name": "Picture", "type": "figure", "$ref": "#/figures/14"}, {"name": "Picture", "type": "figure", "$ref": "#/figures/15"}, {"prov": [{"bbox": [467.3399999999999, 489.83939, 559.80933, 544.28168], "page": 18, "span": [0, 44], "__ref_s3_data": null}], "text": "INTERNATIONAL TECHNICAL SUPPORT ORGANIZATION", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [467.3399999999999, 405.52802, 587.38916, 440.20801], "page": 18, "span": [0, 60], "__ref_s3_data": null}], "text": "BUILDING TECHNICAL INFORMATION BASED ON PRACTICAL EXPERIENCE", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [467.3399999999999, 250.36594000000002, 587.52051, 392.1397099999999], "page": 18, "span": [0, 323], "__ref_s3_data": null}], "text": "IBM Redbooks are developed by the IBM International Technical Support Organization. Experts from IBM, Customers and Partners from around the world create timely technical information based on realistic scenarios. Specific recommendations are provided to help you implement IT solutions more effectively in your environment.", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [467.3399999999999, 190.48810000000003, 570.948, 213.16809], "page": 18, "span": [0, 39], "__ref_s3_data": null}], "text": "For more information: ibm.com /redbooks", "type": "paragraph", "payload": null, "name": "Text", "font": null}], "figures": [{"prov": [{"bbox": [513.4560546875, 737.1808471679688, 586.1583251953125, 765.9149017333984], "page": 1, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "figure", "payload": null, "bounding-box": null}, {"prov": [{"bbox": [33.09040069580078, 89.5469970703125, 585.1502075195312, 498.9671630859375], "page": 1, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "figure", "payload": null, "bounding-box": null}, {"prov": [{"bbox": [143.39866638183594, 506.378662109375, 179.56256103515625, 521.7389221191406], "page": 3, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "figure", "payload": null, "bounding-box": null}, {"prov": [{"bbox": [64.1669921875, 103.87176513671875, 258.7742919921875, 188.49365234375], "page": 3, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "figure", "payload": null, "bounding-box": null}, {"prov": [{"bbox": [142.52883911132812, 288.79351806640625, 251.47850036621094, 416.9550476074219], "page": 4, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "figure", "payload": null, "bounding-box": null}, {"prov": [{"bbox": [145.4144744873047, 156.616943359375, 252.08840942382812, 264.7552490234375], "page": 4, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "figure", "payload": null, "bounding-box": null}, {"prov": [{"bbox": [32.075252532958984, 554.0420684814453, 239.620361328125, 721.4226226806641], "page": 5, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "figure", "payload": null, "bounding-box": null}, {"prov": [{"bbox": [135.92466735839844, 103.39019775390625, 546.4456176757812, 416.0727844238281], "page": 7, "span": [0, 43], "__ref_s3_data": null}], "text": "Figure 1-2 Existing row and column controls", "type": "figure", "payload": null, "bounding-box": null}, {"prov": [{"bbox": [135.97177124023438, 381.39068603515625, 545.4180908203125, 684.5892486572266], "page": 10, "span": [0, 42], "__ref_s3_data": null}], "text": "Figure 3-1 CREATE PERMISSION SQL statement", "type": "figure", "payload": null, "bounding-box": null}, {"prov": [{"bbox": [135.64837646484375, 197.24334716796875, 301.2367248535156, 407.8262939453125], "page": 11, "span": [0, 50], "__ref_s3_data": null}], "text": "Figure 3-5 Special registers and adopted authority", "type": "figure", "payload": null, "bounding-box": null}, {"prov": [{"bbox": [63.801902770996094, 621.9678497314453, 547.11474609375, 696.6175842285156], "page": 14, "span": [0, 52], "__ref_s3_data": null}], "text": "Figure 3-10 Column masks shown in System i Navigator", "type": "figure", "payload": null, "bounding-box": null}, {"prov": [{"bbox": [63.985130310058594, 145.8603515625, 530.0478515625, 364.09503173828125], "page": 14, "span": [0, 65], "__ref_s3_data": null}], "text": "Figure 3-11 Selecting the EMPLOYEES table from System i Navigator", "type": "figure", "payload": null, "bounding-box": null}, {"prov": [{"bbox": [136.5016632080078, 314.4587707519531, 545.4508666992188, 672.7508773803711], "page": 15, "span": [0, 44], "__ref_s3_data": null}], "text": "Figure 4-68 Visual Explain with RCAC enabled", "type": "figure", "payload": null, "bounding-box": null}, {"prov": [{"bbox": [64.27847290039062, 127.91290283203125, 506.39263916015625, 238.41851806640625], "page": 15, "span": [0, 37], "__ref_s3_data": null}], "text": "Figure 4-69 Index advice with no RCAC", "type": "figure", "payload": null, "bounding-box": null}, {"prov": [{"bbox": [485.1698303222656, 737.8084144592285, 566.2962036132812, 766.7408027648926], "page": 18, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "figure", "payload": null, "bounding-box": null}, {"prov": [{"bbox": [474.35540771484375, 602.1873931884766, 592.2726440429688, 711.9486846923828], "page": 18, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "figure", "payload": null, "bounding-box": null}], "tables": [{"prov": [{"bbox": [136.1496124267578, 76.34844970703125, 547.5267944335938, 659.9669647216797], "page": 2, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "table-of-contents", "payload": null, "#-cols": 2, "#-rows": 43, "data": [[{"bbox": [136.8, 132.64862000000005, 172.89404, 141.86163], "spans": [[0, 0]], "text": "Notices", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [175.01952, 132.64862000000005, 547.18982, 141.86163], "spans": [[0, 1]], "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vii", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 0, "row-header": false, "row-span": [0, 1]}], [{"bbox": [136.79901, 145.12847999999997, 189.86537, 154.34149000000002], "spans": [[1, 0]], "text": "Trademarks", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [195.39685, 145.12847999999997, 547.18286, 154.34149000000002], "spans": [[1, 1]], "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . viii", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 1, "row-header": false, "row-span": [1, 2]}], [{"bbox": [136.79901, 167.62811, 279.39731, 176.84113000000002], "spans": [[2, 0]], "text": "DB2 for i Center of Excellence", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [280.61942, 167.62811, 547.1908, 176.84113000000002], "spans": [[2, 1]], "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ix", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 2, "row-header": false, "row-span": [2, 3]}], [{"bbox": [136.79901, 190.12775, 172.84424, 199.34076000000005], "spans": [[3, 0]], "text": "Preface", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [175.01852, 190.12775, 547.18286, 199.34076000000005], "spans": [[3, 1]], "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 3, "row-header": false, "row-span": [3, 4]}], [{"bbox": [136.79803, 202.60760000000005, 547.18085, 211.82061999999996], "spans": [[4, 0]], "text": "Authors . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": null, "spans": [[4, 1]], "text": "", "type": "body"}], [{"bbox": [136.79803, 215.14721999999995, 339.18292, 224.36023], "spans": [[5, 0]], "text": "Now you can become a published author, too!", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [344.71411, 215.14721999999995, 547.13879, 224.36023], "spans": [[5, 1]], "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xiii", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 5, "row-header": false, "row-span": [5, 6]}], [{"bbox": [136.79803, 227.62707999999998, 529.99506, 236.84009000000003], "spans": [[6, 0]], "text": "Comments welcome. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [535.5495, 227.62707999999998, 547.19788, 236.84009000000003], "spans": [[6, 1]], "text": "xiii", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 6, "row-header": false, "row-span": [6, 7]}], [{"bbox": [136.79807, 240.10693000000003, 284.02866, 249.31994999999995], "spans": [[7, 0]], "text": "Stay connected to IBM Redbooks", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 7, "row-header": false, "row-span": [7, 8]}, {"bbox": [289.54449, 240.10693000000003, 547.12115, 249.31994999999995], "spans": [[7, 1]], "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xiv", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 7, "row-header": false, "row-span": [7, 8]}], [{"bbox": [136.79807, 262.60657000000003, 536.09589, 271.81958], "spans": [[8, 0]], "text": "Chapter 1. Securing and protecting IBM DB2 data  . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 8, "row-header": false, "row-span": [8, 9]}, {"bbox": [541.64685, 262.60657000000003, 547.19781, 271.81958], "spans": [[8, 1]], "text": "1", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 8, "row-header": false, "row-span": [8, 9]}], [{"bbox": [136.79808, 274.60637999999994, 549.84723, 283.8194], "spans": [[9, 0]], "text": "1.1 Security fundamentals. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 9, "row-header": false, "row-span": [9, 10]}, {"bbox": null, "spans": [[9, 1]], "text": "", "type": "body"}], [{"bbox": [136.79807, 287.14606000000003, 536.12933, 296.35904], "spans": [[10, 0]], "text": "1.2 Current state of IBM i security . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 10, "row-header": false, "row-span": [10, 11]}, {"bbox": [541.66113, 287.14606000000003, 547.19287, 296.35904], "spans": [[10, 1]], "text": "2", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 10, "row-header": false, "row-span": [10, 11]}], [{"bbox": [136.79807, 299.62595, 549.84723, 308.83893], "spans": [[11, 0]], "text": "1.3 DB2 for i security controls . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 11, "row-header": false, "row-span": [11, 12]}, {"bbox": null, "spans": [[11, 1]], "text": "", "type": "body"}], [{"bbox": [151.1972, 312.1058300000001, 536.05511, 321.3188200000001], "spans": [[12, 0]], "text": "1.3.1 Existing row and column control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 12, "row-header": false, "row-span": [12, 13]}, {"bbox": [541.6015, 312.1058300000001, 547.14795, 321.3188200000001], "spans": [[12, 1]], "text": "4", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 12, "row-header": false, "row-span": [12, 13]}], [{"bbox": [151.1972, 324.64548, 536.08008, 333.8584599999999], "spans": [[13, 0]], "text": "1.3.2 New controls: Row and Column Access Control. . . . . . . . . . . . . . . . . . . . . . . . . . .", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 13, "row-header": false, "row-span": [13, 14]}, {"bbox": [541.6355, 324.64548, 547.19092, 333.8584599999999], "spans": [[13, 1]], "text": "5", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 13, "row-header": false, "row-span": [13, 14]}], [{"bbox": [136.79704, 347.14511, 536.09088, 356.35809], "spans": [[14, 0]], "text": "Chapter 2. Roles and separation of duties . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 14, "row-header": false, "row-span": [14, 15]}, {"bbox": [541.64282, 347.14511, 547.19476, 356.35809], "spans": [[14, 1]], "text": "7", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 14, "row-header": false, "row-span": [14, 15]}], [{"bbox": [136.79704, 359.14493, 536.12714, 368.35791], "spans": [[15, 0]], "text": "2.1 Roles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 15, "row-header": false, "row-span": [15, 16]}, {"bbox": [541.66589, 359.14493, 547.20471, 368.35791], "spans": [[15, 1]], "text": "8", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 15, "row-header": false, "row-span": [15, 16]}], [{"bbox": [151.1972, 371.62482, 535.9527, 380.8378000000001], "spans": [[16, 0]], "text": "2.1.1 DDM and DRDA application server access: QIBM_DB_DDMDRDA . . . . . . . . . . .", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 16, "row-header": false, "row-span": [16, 17]}, {"bbox": [541.55585, 371.62482, 547.15906, 380.8378000000001], "spans": [[16, 1]], "text": "8", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 16, "row-header": false, "row-span": [16, 17]}], [{"bbox": [151.1972, 384.10470999999995, 536.04108, 393.31769], "spans": [[17, 0]], "text": "2.1.2 Toolbox application server access: QIBM_DB_ZDA. . . . . . . . . . . . . . . . . . . . . . . .", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 17, "row-header": false, "row-span": [17, 18]}, {"bbox": [541.59595, 384.10470999999995, 547.15082, 393.31769], "spans": [[17, 1]], "text": "8", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 17, "row-header": false, "row-span": [17, 18]}], [{"bbox": [151.1972, 396.64435, 536.07489, 405.85733], "spans": [[18, 0]], "text": "2.1.3 Database Administrator function: QIBM_DB_SQLADM . . . . . . . . . . . . . . . . . . . . .", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 18, "row-header": false, "row-span": [18, 19]}, {"bbox": [541.63025, 396.64435, 547.18561, 405.85733], "spans": [[18, 1]], "text": "9", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 18, "row-header": false, "row-span": [18, 19]}], [{"bbox": [151.1972, 409.12424000000004, 411.27048, 418.33722], "spans": [[19, 0]], "text": "2.1.4 Database Information function: QIBM_DB_SYSMON", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 19, "row-header": false, "row-span": [19, 20]}, {"bbox": [416.81775, 409.12424000000004, 547.17865, 418.33722], "spans": [[19, 1]], "text": ". . . . . . . . . . . . . . . . . . . . . . 9", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 19, "row-header": false, "row-span": [19, 20]}], [{"bbox": [151.1972, 421.60413, 536.03589, 430.81711], "spans": [[20, 0]], "text": "2.1.5 Security Administrator function: QIBM_DB_SECADM . . . . . . . . . . . . . . . . . . . . . .", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 20, "row-header": false, "row-span": [20, 21]}, {"bbox": [541.59894, 421.60413, 547.16193, 430.81711], "spans": [[20, 1]], "text": "9", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 20, "row-header": false, "row-span": [20, 21]}], [{"bbox": [151.1972, 434.1437700000001, 530.57318, 443.35675], "spans": [[21, 0]], "text": "2.1.6 Change Function Usage CL command . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 21, "row-header": false, "row-span": [21, 22]}, {"bbox": [536.10443, 434.1437700000001, 547.16687, 443.35675], "spans": [[21, 1]], "text": "10", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 21, "row-header": false, "row-span": [21, 22]}], [{"bbox": [151.1972, 446.62366, 530.53522, 455.83663999999993], "spans": [[22, 0]], "text": "2.1.7 Verifying function usage IDs for RCAC with the FUNCTION_USAGE view . . . . .", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 22, "row-header": false, "row-span": [22, 23]}, {"bbox": [536.0755, 446.62366, 547.15601, 455.83663999999993], "spans": [[22, 1]], "text": "10", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 22, "row-header": false, "row-span": [22, 23]}], [{"bbox": [136.79704, 459.10355, 547.25659, 468.31653], "spans": [[23, 0]], "text": "2.2 Separation of duties . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 23, "row-header": false, "row-span": [23, 24]}, {"bbox": null, "spans": [[23, 1]], "text": "", "type": "body"}], [{"bbox": [136.79703, 481.60318, 530.53961, 490.81616], "spans": [[24, 0]], "text": "Chapter 3. Row and Column Access Control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 24, "row-header": false, "row-span": [24, 25]}, {"bbox": [536.09167, 481.60318, 547.1958, 490.81616], "spans": [[24, 1]], "text": "13", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 24, "row-header": false, "row-span": [24, 25]}], [{"bbox": [136.79703, 493.603, 530.4809, 502.81598], "spans": [[25, 0]], "text": "3.1 Explanation of RCAC and the concept of access control . . . . . . . . . . . . . . . . . . . . . . .", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 25, "row-header": false, "row-span": [25, 26]}, {"bbox": [536.04248, 493.603, 547.16571, 502.81598], "spans": [[25, 1]], "text": "14", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 25, "row-header": false, "row-span": [25, 26]}], [{"bbox": [151.19719, 506.14264, 378.20786, 515.35562], "spans": [[26, 0]], "text": "3.1.1 Row permission and column mask definitions", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 26, "row-header": false, "row-span": [26, 27]}, {"bbox": [383.74713, 506.14264, 547.15576, 515.35562], "spans": [[26, 1]], "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . 14", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 26, "row-header": false, "row-span": [26, 27]}], [{"bbox": [151.19719, 518.62253, 530.43475, 527.83551], "spans": [[27, 0]], "text": "3.1.2 Enabling and activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 27, "row-header": false, "row-span": [27, 28]}, {"bbox": [535.99622, 518.62253, 547.11908, 527.83551], "spans": [[27, 1]], "text": "16", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 27, "row-header": false, "row-span": [27, 28]}], [{"bbox": [136.79703, 531.1621700000001, 530.52808, 540.37517], "spans": [[28, 0]], "text": "3.2 Special registers and built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 28, "row-header": false, "row-span": [28, 29]}, {"bbox": [536.06702, 531.1621700000001, 547.14484, 540.37517], "spans": [[28, 1]], "text": "18", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 28, "row-header": false, "row-span": [28, 29]}], [{"bbox": [151.19719, 543.64204, 530.49786, 552.8550399999999], "spans": [[29, 0]], "text": "3.2.1 Special registers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 29, "row-header": false, "row-span": [29, 30]}, {"bbox": [536.05188, 543.64204, 547.15991, 552.8550399999999], "spans": [[29, 1]], "text": "18", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 29, "row-header": false, "row-span": [29, 30]}], [{"bbox": [151.19719, 556.12192, 530.56024, 565.33492], "spans": [[30, 0]], "text": "3.2.2 Built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 30, "row-header": false, "row-span": [30, 31]}, {"bbox": [536.09912, 556.12192, 547.17688, 565.33492], "spans": [[30, 1]], "text": "19", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 30, "row-header": false, "row-span": [30, 31]}], [{"bbox": [136.79703, 568.66156, 530.53027, 577.87456], "spans": [[31, 0]], "text": "3.3 VERIFY_GROUP_FOR_USER function . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 31, "row-header": false, "row-span": [31, 32]}, {"bbox": [536.06152, 568.66156, 547.12402, 577.87456], "spans": [[31, 1]], "text": "20", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 31, "row-header": false, "row-span": [31, 32]}], [{"bbox": [136.79703, 581.14143, 530.62994, 590.35443], "spans": [[32, 0]], "text": "3.4 Establishing and controlling accessibility by using the RCAC rule text . . . . . . . . . . . . .", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 32, "row-header": false, "row-span": [32, 33]}, {"bbox": [536.16315, 581.14143, 547.22955, 590.35443], "spans": [[32, 1]], "text": "21", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 32, "row-header": false, "row-span": [32, 33]}], [{"bbox": [400.32065, 593.62131, 530.48358, 602.8343], "spans": [[33, 0]], "text": ". . . . . . . . . . . . . . . . . . . . . . . .", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 33, "row-header": false, "row-span": [33, 34]}, {"bbox": [536.0224, 593.62131, 547.1001, 602.8343], "spans": [[33, 1]], "text": "22", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 33, "row-header": false, "row-span": [33, 34]}], [{"bbox": [136.79701, 593.62131, 530.56512, 615.37395], "spans": [[34, 0]], "text": "3.5 SELECT, INSERT, and UPDATE behavior with RCAC 3.6 Human resources example . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 34, "row-header": false, "row-span": [34, 35]}, {"bbox": [536.112, 606.16095, 547.20575, 615.37395], "spans": [[34, 1]], "text": "22", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 34, "row-header": false, "row-span": [34, 35]}], [{"bbox": [151.19717, 618.64082, 530.49139, 627.85382], "spans": [[35, 0]], "text": "3.6.1 Assigning the QIBM_DB_SECADM function ID to the consultants. . . . . . . . . . . .", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 35, "row-header": false, "row-span": [35, 36]}, {"bbox": [536.04633, 618.64082, 547.15619, 627.85382], "spans": [[35, 1]], "text": "23", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 35, "row-header": false, "row-span": [35, 36]}], [{"bbox": [151.19717, 631.1206999999999, 530.56458, 640.3336899999999], "spans": [[36, 0]], "text": "3.6.2 Creating group profiles for the users and their roles . . . . . . . . . . . . . . . . . . . . . . .", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 36, "row-header": false, "row-span": [36, 37]}, {"bbox": [536.09601, 631.1206999999999, 547.15875, 640.3336899999999], "spans": [[36, 1]], "text": "23", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 36, "row-header": false, "row-span": [36, 37]}], [{"bbox": [151.19717, 643.66034, 530.55695, 652.87334], "spans": [[37, 0]], "text": "3.6.3 Demonstrating data access without RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 37, "row-header": false, "row-span": [37, 38]}, {"bbox": [536.0882, 643.66034, 547.15076, 652.87334], "spans": [[37, 1]], "text": "24", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 37, "row-header": false, "row-span": [37, 38]}], [{"bbox": [151.19717, 656.14021, 530.53412, 665.35321], "spans": [[38, 0]], "text": "3.6.4 Defining and creating row permissions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 38, "row-header": false, "row-span": [38, 39]}, {"bbox": [536.073, 656.14021, 547.15088, 665.35321], "spans": [[38, 1]], "text": "25", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 38, "row-header": false, "row-span": [38, 39]}], [{"bbox": [151.19717, 668.62009, 339.45105, 677.83309], "spans": [[39, 0]], "text": "3.6.5 Defining and creating column masks", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 39, "row-header": false, "row-span": [39, 40]}, {"bbox": [344.98996, 668.62009, 547.16089, 677.83309], "spans": [[39, 1]], "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 39, "row-header": false, "row-span": [39, 40]}], [{"bbox": [151.19717, 681.15973, 530.54102, 690.37273], "spans": [[40, 0]], "text": "3.6.6 Activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 40, "row-header": false, "row-span": [40, 41]}, {"bbox": [536.08765, 681.15973, 547.18085, 690.37273], "spans": [[40, 1]], "text": "28", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 40, "row-header": false, "row-span": [40, 41]}], [{"bbox": [151.19717, 693.63961, 530.57507, 702.852615], "spans": [[41, 0]], "text": "3.6.7 Demonstrating data access with RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 41, "row-header": false, "row-span": [41, 42]}, {"bbox": [536.10663, 693.63961, 547.16968, 702.852615], "spans": [[41, 1]], "text": "29", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 41, "row-header": false, "row-span": [41, 42]}], [{"bbox": [151.19717, 706.119492, 530.43628, 715.332497], "spans": [[42, 0]], "text": "3.6.8 Demonstrating data access with a view and RCAC . . . . . . . . . . . . . . . . . . . . . . .", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 42, "row-header": false, "row-span": [42, 43]}, {"bbox": [535.99847, 706.119492, 547.12286, 715.332497], "spans": [[42, 1]], "text": "32", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 42, "row-header": false, "row-span": [42, 43]}]], "model": null, "bounding-box": null}, {"prov": [{"bbox": [135.52462768554688, 349.949462890625, 545.8714599609375, 502.2747802734375], "page": 8, "span": [0, 0], "__ref_s3_data": null}], "text": "Table 2-1 FUNCTION_USAGE view", "type": "table", "payload": null, "#-cols": 3, "#-rows": 5, "data": [[{"bbox": [142.8, 296.5379899999999, 202.245, 304.86301], "spans": [[0, 0]], "text": "Column name", "type": "col_header", "col": 0, "col-header": true, "col-span": [0, 1], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [216.80878999999996, 296.5379899999999, 257.21069, 304.86301], "spans": [[0, 1]], "text": "Data type", "type": "col_header", "col": 1, "col-header": true, "col-span": [1, 2], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [289.47479, 296.5379899999999, 338.89468, 304.86301], "spans": [[0, 2]], "text": "Description", "type": "col_header", "col": 2, "col-header": true, "col-span": [2, 3], "row": 0, "row-header": false, "row-span": [0, 1]}], [{"bbox": [142.8, 315.55771, 203.2323, 323.88272], "spans": [[1, 0]], "text": "FUNCTION_ID", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [216.7854, 315.55771, 276.0036, 323.88272], "spans": [[1, 1]], "text": "VARCHAR(30)", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [289.4577, 315.55771, 359.85394, 323.88272], "spans": [[1, 2]], "text": "ID of the function.", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 1, "row-header": false, "row-span": [1, 2]}], [{"bbox": [142.8, 334.51801, 198.6693, 342.84302], "spans": [[2, 0]], "text": "USER_NAME", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [216.74129999999997, 334.51801, 275.92349, 342.84302], "spans": [[2, 1]], "text": "VARCHAR(10)", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [289.38208, 334.51801, 515.05359, 353.88333], "spans": [[2, 2]], "text": "Name of the user profile that has a usage setting for this  function.", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 2, "row-header": false, "row-span": [2, 3]}], [{"bbox": [142.79999, 364.51862, 173.98318, 372.84363], "spans": [[3, 0]], "text": "USAGE", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [216.77367999999998, 364.51862, 270.97977, 372.84363], "spans": [[3, 1]], "text": "VARCHAR(7)", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [289.41626, 364.51862, 539.10712, 394.86395], "spans": [[3, 2]], "text": "Usage setting: GLYPH<SM590000> ALLOWED: The user profile is allowed to use the function. GLYPH<SM590000> DENIED: The user profile is not allowed to use the function.", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 3, "row-header": false, "row-span": [3, 4]}], [{"bbox": [142.8, 405.55865, 196.2249, 413.88367000000005], "spans": [[4, 0]], "text": "USER_TYPE", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [216.75211, 405.55865, 270.99872, 413.88367000000005], "spans": [[4, 1]], "text": "VARCHAR(5)", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [289.43161, 405.55865, 448.11963000000003, 435.84369], "spans": [[4, 2]], "text": "Type of user profile: GLYPH<SM590000> USER: The user profile is a user. GLYPH<SM590000> GROUP: The user profile is a group.", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 4, "row-header": false, "row-span": [4, 5]}]], "model": null, "bounding-box": null}, {"prov": [{"bbox": [64.41139221191406, 70.39208984375, 547.3950805664062, 398.3863830566406], "page": 9, "span": [0, 0], "__ref_s3_data": null}], "text": "Table 2-2 Comparison of the different function usage IDs and *JOBCTL authority", "type": "table", "payload": null, "#-cols": 6, "#-rows": 13, "data": [[{"bbox": [70.800301, 400.51827999999995, 119.78551, 408.84329], "spans": [[0, 0]], "text": "User action", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 0, "row-header": true, "row-span": [0, 1]}, {"bbox": [424.93805, 447.52255, 433.26297000000005, 487.01999], "spans": [[0, 1]], "text": "*JOBCTL", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [450.13806, 401.6000700000001, 458.46298, 487.01999], "spans": [[0, 2]], "text": "QIBM_DB_SECADM", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [475.93835000000007, 401.53442, 484.26327999999995, 487.01999], "spans": [[0, 3]], "text": "QIBM_DB_SQLADM", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [501.13837, 401.6145, 509.46329, 487.01999], "spans": [[0, 4]], "text": "QIBM_DB_SYSMON", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [526.39862, 432.79944, 534.72357, 487.02005], "spans": [[0, 5]], "text": "No Authority", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 0, "row-header": false, "row-span": [0, 1]}], [{"bbox": [70.800003, 498.55798, 220.15681000000004, 506.883], "spans": [[1, 0]], "text": "SET CURRENT DEGREE  (SQL statement)", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 1, "row-header": true, "row-span": [1, 2]}, {"bbox": [429.0, 498.55798, 435.00299000000007, 506.883], "spans": [[1, 1]], "text": "X", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": null, "spans": [[1, 2]], "text": "", "type": "body"}, {"bbox": [480.00031, 498.55798, 486.0033, 506.883], "spans": [[1, 3]], "text": "X", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": null, "spans": [[1, 4]], "text": "", "type": "body"}, {"bbox": null, "spans": [[1, 5]], "text": "", "type": "body"}], [{"bbox": [70.800018, 517.51828, 264.5538, 525.84329], "spans": [[2, 0]], "text": "CHGQRYA  command targeting a different user\u2019s job", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 2, "row-header": true, "row-span": [2, 3]}, {"bbox": [429.00003, 517.51828, 435.00302000000005, 525.84329], "spans": [[2, 1]], "text": "X", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": null, "spans": [[2, 2]], "text": "", "type": "body"}, {"bbox": [480.00034, 517.51828, 486.00333, 525.84329], "spans": [[2, 3]], "text": "X", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": null, "spans": [[2, 4]], "text": "", "type": "body"}, {"bbox": null, "spans": [[2, 5]], "text": "", "type": "body"}], [{"bbox": [70.800049, 536.5379800000001, 322.50574, 544.8629900000001], "spans": [[3, 0]], "text": "STRDBMON  or  ENDDBMON  commands targeting a different user\u2019s job", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 3, "row-header": true, "row-span": [3, 4]}, {"bbox": [429.00003, 536.5379800000001, 435.00302000000005, 544.8629900000001], "spans": [[3, 1]], "text": "X", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": null, "spans": [[3, 2]], "text": "", "type": "body"}, {"bbox": [480.00034, 536.5379800000001, 486.00333, 544.8629900000001], "spans": [[3, 3]], "text": "X", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": null, "spans": [[3, 4]], "text": "", "type": "body"}, {"bbox": null, "spans": [[3, 5]], "text": "", "type": "body"}], [{"bbox": [70.800049, 555.55768, 381.02185, 563.8826899999999], "spans": [[4, 0]], "text": "STRDBMON  or  ENDDBMON  commands targeting a job that matches the current user", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 4, "row-header": true, "row-span": [4, 5]}, {"bbox": [429.00003, 555.55768, 435.00302000000005, 563.8826899999999], "spans": [[4, 1]], "text": "X", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": null, "spans": [[4, 2]], "text": "", "type": "body"}, {"bbox": [480.00034, 555.55768, 486.00333, 563.8826899999999], "spans": [[4, 3]], "text": "X", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [505.26061999999996, 555.55768, 511.26361, 563.8826899999999], "spans": [[4, 4]], "text": "X", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [530.76031, 555.55768, 536.76331, 563.8826899999999], "spans": [[4, 5]], "text": "X", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 4, "row-header": false, "row-span": [4, 5]}], [{"bbox": [70.800049, 574.51797, 359.51736, 582.84299], "spans": [[5, 0]], "text": "QUSRJOBI() API format 900 or System i Navigator\u2019s SQL Details for Job", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 5, "row-header": true, "row-span": [5, 6]}, {"bbox": [429.0000600000001, 574.51797, 435.00305000000003, 582.84299], "spans": [[5, 1]], "text": "X", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": null, "spans": [[5, 2]], "text": "", "type": "body"}, {"bbox": [480.00037, 574.51797, 486.00335999999993, 582.84299], "spans": [[5, 3]], "text": "X", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [505.2606799999999, 574.51797, 511.26367, 582.84299], "spans": [[5, 4]], "text": "X", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": null, "spans": [[5, 5]], "text": "", "type": "body"}], [{"bbox": [70.800079, 593.5376699999999, 220.75178999999997, 601.8626899999999], "spans": [[6, 0]], "text": "Visual Explain within Run SQL scripts", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 6, "row-header": true, "row-span": [6, 7]}, {"bbox": [429.0000600000001, 593.5376699999999, 435.00305000000003, 601.8626899999999], "spans": [[6, 1]], "text": "X", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": null, "spans": [[6, 2]], "text": "", "type": "body"}, {"bbox": [480.00037, 593.5376699999999, 486.00335999999993, 601.8626899999999], "spans": [[6, 3]], "text": "X", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [505.2606799999999, 593.5376699999999, 511.26367, 601.8626899999999], "spans": [[6, 4]], "text": "X", "type": "body", "col": 4, "col-header": false, "col-span": [4, 5], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [530.76038, 593.5376699999999, 536.76337, 601.8626899999999], "spans": [[6, 5]], "text": "X", "type": "body", "col": 5, "col-header": false, "col-span": [5, 6], "row": 6, "row-header": false, "row-span": [6, 7]}], [{"bbox": [70.800079, 612.55737, 236.6548, 620.88239], "spans": [[7, 0]], "text": "Visual Explain outside of Run SQL scripts", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 7, "row-header": true, "row-span": [7, 8]}, {"bbox": [429.0000600000001, 612.55737, 435.00305000000003, 620.88239], "spans": [[7, 1]], "text": "X", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 7, "row-header": false, "row-span": [7, 8]}, {"bbox": null, "spans": [[7, 2]], "text": "", "type": "body"}, {"bbox": [480.00037, 612.55737, 486.00335999999993, 620.88239], "spans": [[7, 3]], "text": "X", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 7, "row-header": false, "row-span": [7, 8]}, {"bbox": null, "spans": [[7, 4]], "text": "", "type": "body"}, {"bbox": null, "spans": [[7, 5]], "text": "", "type": "body"}], [{"bbox": [70.800079, 631.51767, 213.12968, 639.84268], "spans": [[8, 0]], "text": "ANALYZE PLAN CACHE procedure", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 8, "row-header": true, "row-span": [8, 9]}, {"bbox": [429.0000600000001, 631.51767, 435.00305000000003, 639.84268], "spans": [[8, 1]], "text": "X", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 8, "row-header": false, "row-span": [8, 9]}, {"bbox": null, "spans": [[8, 2]], "text": "", "type": "body"}, {"bbox": [480.00037, 631.51767, 486.00335999999993, 639.84268], "spans": [[8, 3]], "text": "X", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 8, "row-header": false, "row-span": [8, 9]}, {"bbox": null, "spans": [[8, 4]], "text": "", "type": "body"}, {"bbox": null, "spans": [[8, 5]], "text": "", "type": "body"}], [{"bbox": [70.800079, 650.53737, 199.87808, 658.86238], "spans": [[9, 0]], "text": "DUMP PLAN CACHE procedure", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 9, "row-header": true, "row-span": [9, 10]}, {"bbox": [429.0000600000001, 650.53737, 435.00305000000003, 658.86238], "spans": [[9, 1]], "text": "X", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 9, "row-header": false, "row-span": [9, 10]}, {"bbox": null, "spans": [[9, 2]], "text": "", "type": "body"}, {"bbox": [480.00037, 650.53737, 486.00335999999993, 658.86238], "spans": [[9, 3]], "text": "X", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 9, "row-header": false, "row-span": [9, 10]}, {"bbox": null, "spans": [[9, 4]], "text": "", "type": "body"}, {"bbox": null, "spans": [[9, 5]], "text": "", "type": "body"}], [{"bbox": [70.800079, 669.55708, 208.36777, 677.88207], "spans": [[10, 0]], "text": "MODIFY PLAN CACHE procedure", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 10, "row-header": true, "row-span": [10, 11]}, {"bbox": [429.0000600000001, 669.55708, 435.00305000000003, 677.88207], "spans": [[10, 1]], "text": "X", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 10, "row-header": false, "row-span": [10, 11]}, {"bbox": null, "spans": [[10, 2]], "text": "", "type": "body"}, {"bbox": [480.00037, 669.55708, 486.00335999999993, 677.88207], "spans": [[10, 3]], "text": "X", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 10, "row-header": false, "row-span": [10, 11]}, {"bbox": null, "spans": [[10, 4]], "text": "", "type": "body"}, {"bbox": null, "spans": [[10, 5]], "text": "", "type": "body"}], [{"bbox": [70.800079, 688.57677, 411.20264, 696.9017719999999], "spans": [[11, 0]], "text": "MODIFY PLAN CACHE PROPERTIES procedure (currently does not check authority)", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 11, "row-header": true, "row-span": [11, 12]}, {"bbox": [429.0000600000001, 688.57677, 435.00305000000003, 696.9017719999999], "spans": [[11, 1]], "text": "X", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 11, "row-header": false, "row-span": [11, 12]}, {"bbox": null, "spans": [[11, 2]], "text": "", "type": "body"}, {"bbox": [480.00037, 688.57677, 486.00335999999993, 696.9017719999999], "spans": [[11, 3]], "text": "X", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 11, "row-header": false, "row-span": [11, 12]}, {"bbox": null, "spans": [[11, 4]], "text": "", "type": "body"}, {"bbox": null, "spans": [[11, 5]], "text": "", "type": "body"}], [{"bbox": [70.800079, 707.537071, 377.12585, 715.862068], "spans": [[12, 0]], "text": "CHANGE PLAN CACHE SIZE procedure (currently does not check authority)", "type": "row_header", "col": 0, "col-header": false, "col-span": [0, 1], "row": 12, "row-header": true, "row-span": [12, 13]}, {"bbox": [429.0000600000001, 707.537071, 435.00305000000003, 715.862068], "spans": [[12, 1]], "text": "X", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 12, "row-header": false, "row-span": [12, 13]}, {"bbox": null, "spans": [[12, 2]], "text": "", "type": "body"}, {"bbox": [480.00037, 707.537071, 486.00335999999993, 715.862068], "spans": [[12, 3]], "text": "X", "type": "body", "col": 3, "col-header": false, "col-span": [3, 4], "row": 12, "row-header": false, "row-span": [12, 13]}, {"bbox": null, "spans": [[12, 4]], "text": "", "type": "body"}, {"bbox": null, "spans": [[12, 5]], "text": "", "type": "body"}]], "model": null, "bounding-box": null}, {"prov": [{"bbox": [134.5462646484375, 587.7283935546875, 542.0460815429688, 688.5811080932617], "page": 11, "span": [0, 0], "__ref_s3_data": null}], "text": "Table 3-1 Special registers and their corresponding values", "type": "table", "payload": null, "#-cols": 2, "#-rows": 4, "data": [[{"bbox": [142.8, 110.53801999999985, 209.67091, 118.86298], "spans": [[0, 0]], "text": "Special register", "type": "col_header", "col": 0, "col-header": true, "col-span": [0, 1], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [230.18912000000003, 110.53801999999985, 319.93527, 118.86298], "spans": [[0, 1]], "text": "Corresponding value", "type": "col_header", "col": 1, "col-header": true, "col-span": [1, 2], "row": 0, "row-header": false, "row-span": [0, 1]}], [{"bbox": [142.80002, 129.49834999999996, 212.70122, 148.86359000000004], "spans": [[1, 0]], "text": "USER or SESSION_USER", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [230.21973000000003, 129.49834999999996, 467.99069000000003, 137.82330000000002], "spans": [[1, 1]], "text": "The effective user of the thread excluding adopted authority.", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 1, "row-header": false, "row-span": [1, 2]}], [{"bbox": [142.80003, 159.55835000000002, 216.63962999999998, 167.88329999999996], "spans": [[2, 0]], "text": "CURRENT_USER", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [230.19814, 159.55835000000002, 535.65082, 178.86328000000003], "spans": [[2, 1]], "text": "The effective user of the thread including adopted authority. When no adopted  authority is present, this has the same value as USER.", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 2, "row-header": false, "row-span": [2, 3]}], [{"bbox": [142.8009, 189.55804, 209.7357, 197.88300000000004], "spans": [[3, 0]], "text": "SYSTEM_USER", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [230.2449, 189.55804, 425.64569, 197.88300000000004], "spans": [[3, 1]], "text": "The authorization ID that initiated the connection.", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 3, "row-header": false, "row-span": [3, 4]}]], "model": null, "bounding-box": null}, {"prov": [{"bbox": [63.55636978149414, 495.77532958984375, 548.5687255859375, 687.7661285400391], "page": 12, "span": [0, 0], "__ref_s3_data": null}], "text": "Table 3-2 Built-in global variables", "type": "table", "payload": null, "#-cols": 3, "#-rows": 10, "data": [[{"bbox": [70.800003, 110.53801999999985, 134.99071, 118.86298], "spans": [[0, 0]], "text": "Global variable", "type": "col_header", "col": 0, "col-header": true, "col-span": [0, 1], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [202.8894, 110.53801999999985, 223.34641, 118.86298], "spans": [[0, 1]], "text": "Type", "type": "col_header", "col": 1, "col-header": true, "col-span": [1, 2], "row": 0, "row-header": false, "row-span": [0, 1]}, {"bbox": [281.8248, 110.53801999999985, 331.3428, 118.86298], "spans": [[0, 2]], "text": "Description", "type": "col_header", "col": 2, "col-header": true, "col-span": [2, 3], "row": 0, "row-header": false, "row-span": [0, 1]}], [{"bbox": [70.800003, 129.49834999999996, 132.7209, 137.82330000000002], "spans": [[1, 0]], "text": "CLIENT_HOST", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [202.89029, 129.49834999999996, 267.07651, 137.82330000000002], "spans": [[1, 1]], "text": "VARCHAR(255)", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 1, "row-header": false, "row-span": [1, 2]}, {"bbox": [281.84732, 129.49834999999996, 510.17548, 137.82330000000002], "spans": [[1, 2]], "text": "Host name of the current client as returned by the system", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 1, "row-header": false, "row-span": [1, 2]}], [{"bbox": [70.800018, 148.51806999999997, 140.66522, 156.84302000000002], "spans": [[2, 0]], "text": "CLIENT_IPADDR", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [202.87231, 148.51806999999997, 267.07739, 156.84302000000002], "spans": [[2, 1]], "text": "VARCHAR(128)", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 2, "row-header": false, "row-span": [2, 3]}, {"bbox": [281.84549, 148.51806999999997, 509.60583, 156.84302000000002], "spans": [[2, 2]], "text": "IP address of the current client as returned by the system", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 2, "row-header": false, "row-span": [2, 3]}], [{"bbox": [70.800018, 167.53778, 134.98264, 175.86273000000006], "spans": [[3, 0]], "text": "CLIENT_PORT", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [202.90294, 167.53778, 242.80084, 175.86273000000006], "spans": [[3, 1]], "text": "INTEGER", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 3, "row-header": false, "row-span": [3, 4]}, {"bbox": [281.79785, 167.53778, 527.59222, 175.86273000000006], "spans": [[3, 2]], "text": "Port used by the current client to communicate with the server", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 3, "row-header": false, "row-span": [3, 4]}], [{"bbox": [70.800018, 186.5575, 143.50925, 194.88244999999995], "spans": [[4, 0]], "text": "PACKAGE_NAME", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [202.80576, 186.5575, 267.06937, 194.88244999999995], "spans": [[4, 1]], "text": "VARCHAR(128)", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 4, "row-header": false, "row-span": [4, 5]}, {"bbox": [281.85187, 186.5575, 436.57259999999997, 194.88244999999995], "spans": [[4, 2]], "text": "Name of the currently running package", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 4, "row-header": false, "row-span": [4, 5]}], [{"bbox": [70.800018, 205.51782000000003, 156.01654, 213.84276999999997], "spans": [[5, 0]], "text": "PACKAGE_SCHEMA", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [202.83545, 205.51782000000003, 267.08646, 213.84276999999997], "spans": [[5, 1]], "text": "VARCHAR(128)", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 5, "row-header": false, "row-span": [5, 6]}, {"bbox": [281.87076, 205.51782000000003, 470.44678, 213.84276999999997], "spans": [[5, 2]], "text": "Schema name of the currently running package", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 5, "row-header": false, "row-span": [5, 6]}], [{"bbox": [70.800018, 224.53754000000004, 157.89932, 232.86248999999998], "spans": [[6, 0]], "text": "PACKAGE_VERSION", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [202.72472, 224.53754000000004, 261.98254, 232.86248999999998], "spans": [[6, 1]], "text": "VARCHAR(64)", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 6, "row-header": false, "row-span": [6, 7]}, {"bbox": [281.74924, 224.53754000000004, 478.8438100000001, 232.86248999999998], "spans": [[6, 2]], "text": "Version identifier of the currently running package", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 6, "row-header": false, "row-span": [6, 7]}], [{"bbox": [70.800018, 243.55724999999995, 154.41992, 251.8822], "spans": [[7, 0]], "text": "ROUTINE_SCHEMA", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 7, "row-header": false, "row-span": [7, 8]}, {"bbox": [202.79312, 243.55724999999995, 267.09274, 251.8822], "spans": [[7, 1]], "text": "VARCHAR(128)", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 7, "row-header": false, "row-span": [7, 8]}, {"bbox": [281.87164, 243.55724999999995, 464.26022, 251.8822], "spans": [[7, 2]], "text": "Schema name of the currently running routine", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 7, "row-header": false, "row-span": [7, 8]}], [{"bbox": [70.800018, 262.51757999999995, 188.43991, 270.84253], "spans": [[8, 0]], "text": "ROUTINE_SPECIFIC_NAME", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 8, "row-header": false, "row-span": [8, 9]}, {"bbox": [202.84441, 262.51757999999995, 267.03693, 270.84253], "spans": [[8, 1]], "text": "VARCHAR(128)", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 8, "row-header": false, "row-span": [8, 9]}, {"bbox": [281.80682, 262.51757999999995, 430.40045, 270.84253], "spans": [[8, 2]], "text": "Name of the currently running routine", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 8, "row-header": false, "row-span": [8, 9]}], [{"bbox": [70.800034, 281.53726, 139.43135, 289.86227], "spans": [[9, 0]], "text": "ROUTINE_TYPE", "type": "body", "col": 0, "col-header": false, "col-span": [0, 1], "row": 9, "row-header": false, "row-span": [9, 10]}, {"bbox": [202.74635, 281.53726, 239.28996000000004, 289.86227], "spans": [[9, 1]], "text": "CHAR(1)", "type": "body", "col": 1, "col-header": false, "col-span": [1, 2], "row": 9, "row-header": false, "row-span": [9, 10]}, {"bbox": [281.79065, 281.53726, 425.09131, 289.86227], "spans": [[9, 2]], "text": "Type of the currently running routine", "type": "body", "col": 2, "col-header": false, "col-span": [2, 3], "row": 9, "row-header": false, "row-span": [9, 10]}]], "model": null, "bounding-box": null}], "bitmaps": null, "equations": [], "footnotes": [], "page-dimensions": [{"height": 792.0, "page": 1, "width": 612.0}, {"height": 792.0, "page": 2, "width": 612.0}, {"height": 792.0, "page": 3, "width": 612.0}, {"height": 792.0, "page": 4, "width": 612.0}, {"height": 792.0, "page": 5, "width": 612.0}, {"height": 792.0, "page": 6, "width": 612.0}, {"height": 792.0, "page": 7, "width": 612.0}, {"height": 792.0, "page": 8, "width": 612.0}, {"height": 792.0, "page": 9, "width": 612.0}, {"height": 792.0, "page": 10, "width": 612.0}, {"height": 792.0, "page": 11, "width": 612.0}, {"height": 792.0, "page": 12, "width": 612.0}, {"height": 792.0, "page": 13, "width": 612.0}, {"height": 792.0, "page": 14, "width": 612.0}, {"height": 792.0, "page": 15, "width": 612.0}, {"height": 792.0, "page": 16, "width": 612.0}, {"height": 792.0, "page": 17, "width": 612.0}, {"height": 792.0, "page": 18, "width": 612.0}], "page-footers": [], "page-headers": [], "_s3_data": null, "identifiers": null}
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v1/redp5110_sampled.md b/tests/data/groundtruth/docling_v1/redp5110_sampled.md
index f1fc6572..c40ea958 100644
--- a/tests/data/groundtruth/docling_v1/redp5110_sampled.md
+++ b/tests/data/groundtruth/docling_v1/redp5110_sampled.md
@@ -6,7 +6,7 @@ Front cover
 
 <!-- image -->
 
-<!-- image -->
+Front cover
 
 ## Contents
 
@@ -74,20 +74,20 @@ This paper was produced by the IBM DB2 for i Center of Excellence team in partne
 
 <!-- image -->
 
-<!-- image -->
-
 Jim Bainbridge is a senior DB2 consultant on the DB2 for i Center of Excellence team in the IBM Lab Services and Training organization. His primary role is training and implementation services for IBM DB2 Web Query for i and business analytics. Jim began his career with IBM 30 years ago in the IBM Rochester Development Lab, where he developed cooperative processing products that paired IBM PCs with IBM S/36 and AS/.400 systems. In the years since, Jim has held numerous technical roles, including independent software vendors technical support on a broad range of IBM technologies and products, and supporting customers in the IBM Executive Briefing Center and IBM Project Office.
 
+<!-- image -->
+
 Hernando Bedoya is a Senior IT Specialist at STG Lab Services and Training in Rochester, Minnesota. He writes extensively and teaches IBM classes worldwide in all areas of DB2 for i. Before joining STG Lab Services, he worked in the ITSO for nine years writing multiple IBM Redbooksfi publications. He also worked for IBM Colombia as an IBM AS/400fi IT Specialist doing presales support for the Andean countries. He has 28 years of experience in the computing field and has taught database classes in Colombian universities. He holds a Master's degree in Computer Science from EAFIT, Colombia. His areas of expertise are database technology, performance, and data warehousing. Hernando can be contacted at hbedoya@us.ibm.com .
 
 ## Authors
 
 <!-- image -->
 
-Chapter 1.
-
 1
 
+Chapter 1.
+
 ## Securing and protecting IBM DB2 data
 
 Recent news headlines are filled with reports of data breaches and cyber-attacks impacting global businesses of all sizes. The Identity Theft Resource Center$^{1}$ reports that almost 5000 data breaches have occurred since 2005, exposing over 600 million records of data. The financial cost of these data breaches is skyrocketing. Studies from the Ponemon Institute$^{2}$ revealed that the average cost of a data breach increased in 2013 by 15% globally and resulted in a brand equity loss of $9.4 million per attack. The average cost that is incurred for each lost record containing sensitive information increased more than 9% to $145 per record.
@@ -211,10 +211,10 @@ Table 2-2 Comparison of the different function usage IDs and *JOBCTL authority
 | User action                                                                    | *JOBCTL   | QIBM_DB_SECADM   | QIBM_DB_SQLADM   | QIBM_DB_SYSMON   | No Authority   |
 |--------------------------------------------------------------------------------|-----------|------------------|------------------|------------------|----------------|
 | SET CURRENT DEGREE  (SQL statement)                                            | X         |                  | X                |                  |                |
-| CHGQRYA  command targeting a different user's job                              | X         |                  | X                |                  |                |
-| STRDBMON  or  ENDDBMON  commands targeting a different user's job              | X         |                  | X                |                  |                |
+| CHGQRYA  command targeting a different user’s job                              | X         |                  | X                |                  |                |
+| STRDBMON  or  ENDDBMON  commands targeting a different user’s job              | X         |                  | X                |                  |                |
 | STRDBMON  or  ENDDBMON  commands targeting a job that matches the current user | X         |                  | X                | X                | X              |
-| QUSRJOBI() API format 900 or System i Navigator's SQL Details for Job          | X         |                  | X                | X                |                |
+| QUSRJOBI() API format 900 or System i Navigator’s SQL Details for Job          | X         |                  | X                | X                |                |
 | Visual Explain within Run SQL scripts                                          | X         |                  | X                | X                | X              |
 | Visual Explain outside of Run SQL scripts                                      | X         |                  | X                |                  |                |
 | ANALYZE PLAN CACHE procedure                                                   | X         |                  | X                |                  |                |
@@ -226,8 +226,6 @@ Table 2-2 Comparison of the different function usage IDs and *JOBCTL authority
 The SQL CREATE PERMISSION statement that is shown in Figure 3-1 is used to define and initially enable or disable the row access rules.
 
 Figure 3-1 CREATE PERMISSION SQL statement
-
-The SQL CREATE PERMISSION statement that is shown in Figure 3-1 is used to define and initially enable or disable the row access rules.Figure 3-1 CREATE PERMISSION SQL statement
 <!-- image -->
 
 ## Column mask
@@ -315,10 +313,10 @@ WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'HR', 'EMP' ) = 1 THEN EMPLOYEES . D
 
 - To implement this column mask, run the SQL statement that is shown in Example 3-9.
 
-Example 3-9 Creating a mask on the TAX_ID column
-
 CREATE MASK HR_SCHEMA.MASK_TAX_ID_ON_EMPLOYEES ON HR_SCHEMA.EMPLOYEES AS EMPLOYEES FOR COLUMN TAX_ID RETURN CASE WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'HR' ) = 1 THEN EMPLOYEES . TAX_ID WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1 AND SESSION_USER = EMPLOYEES . USER_ID THEN EMPLOYEES . TAX_ID WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1 AND SESSION_USER <> EMPLOYEES . USER_ID THEN ( 'XXX-XX-' CONCAT QSYS2 . SUBSTR ( EMPLOYEES . TAX_ID , 8 , 4 ) ) WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'EMP' ) = 1 THEN EMPLOYEES . TAX_ID ELSE 'XXX-XX-XXXX' END ENABLE ;
 
+Example 3-9 Creating a mask on the TAX_ID column
+
 - 3. Figure 3-10 shows the masks that are created in the HR_SCHEMA.
 
 Figure 3-10 Column masks shown in System i Navigator
@@ -351,11 +349,11 @@ Figure 3-11 Selecting the EMPLOYEES table from System i Navigator
 
 - 2. Figure 4-68 shows the Visual Explain of the same SQL statement, but with RCAC enabled. It is clear that the implementation of the SQL statement is more complex because the row permission rule becomes part of the WHERE clause.
 
+- 3. Compare the advised indexes that are provided by the Optimizer without RCAC and with RCAC enabled. Figure 4-69 shows the index advice for the SQL statement without RCAC enabled. The index being advised is for the ORDER BY clause.
+
 Figure 4-68 Visual Explain with RCAC enabled
 <!-- image -->
 
-- 3. Compare the advised indexes that are provided by the Optimizer without RCAC and with RCAC enabled. Figure 4-69 shows the index advice for the SQL statement without RCAC enabled. The index being advised is for the ORDER BY clause.
-
 Figure 4-69 Index advice with no RCAC
 <!-- image -->
 
@@ -369,10 +367,10 @@ Implement roles and separation of duties
 
 Leverage row permissions on the database
 
-Protect columns by defining column masks
-
 This IBM Redpaper publication provides information about the IBM i 7.2 feature of IBM DB2 for i Row and Column Access Control (RCAC). It offers a broad description of the function and advantages of controlling access to data in a comprehensive and transparent way. This publication helps you understand the capabilities of RCAC and provides examples of defining, creating, and implementing the row permissions and column masks in a relational database environment.
 
+Protect columns by defining column masks
+
 This paper is intended for database engineers, data-centric application developers, and security officers who want to design and implement RCAC as a part of their data control and governance policy. A solid background in IBM i object level security, DB2 for i relational database concepts, and SQL is assumed.
 
 <!-- image -->
diff --git a/tests/data/groundtruth/docling_v1/redp5110_sampled.pages.json b/tests/data/groundtruth/docling_v1/redp5110_sampled.pages.json
index 65921be8..dc72db6d 100644
--- a/tests/data/groundtruth/docling_v1/redp5110_sampled.pages.json
+++ b/tests/data/groundtruth/docling_v1/redp5110_sampled.pages.json
@@ -1 +1 @@
-[{"page_no": 0, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "ibm.com", "bbox": {"l": 36.900002, "t": 751.23, "r": 98.600998, "b": 765.105, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "/redbooks", "bbox": {"l": 98.580002, "t": 751.23, "r": 164.4585, "b": 765.105, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Redpaper", "bbox": {"l": 314.70001, "t": 711.50856, "r": 580.52002, "b": 773.772959, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Front cover", "bbox": {"l": 287.82001, "t": 28.54803000000004, "r": 418.83356, "b": 50.748050000000035, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Row and Column Access Control ", "bbox": {"l": 35.700001, "t": 84.58654999999987, "r": 584.64288, "b": 122.82097999999996, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Support in IBM DB2 for i", "bbox": {"l": 35.700001, "t": 127.60668999999996, "r": 447.66919000000007, "b": 165.84113000000002, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Jim Bainbridge", "bbox": {"l": 509.22, "t": 575.71201, "r": 581.34119, "b": 586.392, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Hernando Bedoya", "bbox": {"l": 497.70001, "t": 589.752, "r": 581.3736, "b": 600.43199, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Rob Bestgen", "bbox": {"l": 521.40002, "t": 603.73199, "r": 581.34003, "b": 614.4119900000001, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Mike Cain", "bbox": {"l": 534.12, "t": 617.71199, "r": 581.31598, "b": 628.39198, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Dan Cruikshank", "bbox": {"l": 505.43999999999994, "t": 631.75198, "r": 581.29077, "b": 642.4319800000001, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Jim Denton", "bbox": {"l": 527.22003, "t": 645.73198, "r": 581.29926, "b": 656.41197, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Doug Mack", "bbox": {"l": 527.64001, "t": 659.71198, "r": 581.30884, "b": 670.39197, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Tom McKinley", "bbox": {"l": 514.38, "t": 673.75197, "r": 581.38678, "b": 684.43197, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Kent Milligan", "bbox": {"l": 518.82001, "t": 687.73197, "r": 581.33759, "b": 698.411972, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Implement roles and separation ", "bbox": {"l": 36.119999, "t": 296.13828, "r": 216.00064, "b": 308.58047, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "of duties", "bbox": {"l": 36.119999, "t": 313.11838000000006, "r": 84.527145, "b": 325.56058, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "Leverage", "bbox": {"l": 35.759315, "t": 350.13881999999995, "r": 80.409691, "b": 362.58102, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "row permissions on ", "bbox": {"l": 151.8503, "t": 350.13881999999995, "r": 202.45404, "b": 362.58102, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "the", "bbox": {"l": 35.759315, "t": 367.11893, "r": 50.758106, "b": 379.56112999999993, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "database", "bbox": {"l": 86.755211, "t": 367.11893, "r": 107.75352000000001, "b": 379.56112999999993, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Protect", "bbox": {"l": 36.059887, "t": 404.13937, "r": 73.020607, "b": 416.58157, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "columns by defining ", "bbox": {"l": 152.62831, "t": 404.13937, "r": 195.2753, "b": 416.58157, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "column", "bbox": {"l": 36.059887, "t": 421.11948, "r": 73.311806, "b": 433.56167999999997, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "masks", "bbox": {"l": 73.311806, "t": 421.11948, "r": 117.33681, "b": 433.56167999999997, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 6, "label": "page_footer", "bbox": {"l": 36.900002, "t": 751.23, "r": 164.4585, "b": 765.105, "coord_origin": "TOPLEFT"}, "confidence": 0.7180285453796387, "cells": [{"id": 0, "text": "ibm.com", "bbox": {"l": 36.900002, "t": 751.23, "r": 98.600998, "b": 765.105, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "/redbooks", "bbox": {"l": 98.580002, "t": 751.23, "r": 164.4585, "b": 765.105, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "picture", "bbox": {"l": 316.94049072265625, "t": 710.1278076171875, "r": 581.3547973632812, "b": 774.4258422851562, "coord_origin": "TOPLEFT"}, "confidence": 0.5777517557144165, "cells": [{"id": 2, "text": "Redpaper", "bbox": {"l": 314.70001, "t": 711.50856, "r": 580.52002, "b": 773.772959, "coord_origin": "TOPLEFT"}}], "children": [{"id": 11, "label": "text", "bbox": {"l": 314.70001, "t": 711.50856, "r": 580.52002, "b": 773.772959, "coord_origin": "TOPLEFT"}, "confidence": 0.5870782732963562, "cells": [{"id": 2, "text": "Redpaper", "bbox": {"l": 314.70001, "t": 711.50856, "r": 580.52002, "b": 773.772959, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 12, "label": "text", "bbox": {"l": 287.82001, "t": 28.54803000000004, "r": 418.83356, "b": 50.748050000000035, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 3, "text": "Front cover", "bbox": {"l": 287.82001, "t": 28.54803000000004, "r": 418.83356, "b": 50.748050000000035, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "section_header", "bbox": {"l": 35.700001, "t": 84.58654999999987, "r": 584.64288, "b": 165.84113000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.8281131982803345, "cells": [{"id": 4, "text": "Row and Column Access Control ", "bbox": {"l": 35.700001, "t": 84.58654999999987, "r": 584.64288, "b": 122.82097999999996, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Support in IBM DB2 for i", "bbox": {"l": 35.700001, "t": 127.60668999999996, "r": 447.66919000000007, "b": 165.84113000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "picture", "bbox": {"l": 33.090599060058594, "t": 293.0328369140625, "r": 585.1502075195312, "b": 702.4530029296875, "coord_origin": "TOPLEFT"}, "confidence": 0.5889503359794617, "cells": [{"id": 6, "text": "Jim Bainbridge", "bbox": {"l": 509.22, "t": 575.71201, "r": 581.34119, "b": 586.392, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Hernando Bedoya", "bbox": {"l": 497.70001, "t": 589.752, "r": 581.3736, "b": 600.43199, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Rob Bestgen", "bbox": {"l": 521.40002, "t": 603.73199, "r": 581.34003, "b": 614.4119900000001, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Mike Cain", "bbox": {"l": 534.12, "t": 617.71199, "r": 581.31598, "b": 628.39198, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Dan Cruikshank", "bbox": {"l": 505.43999999999994, "t": 631.75198, "r": 581.29077, "b": 642.4319800000001, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Jim Denton", "bbox": {"l": 527.22003, "t": 645.73198, "r": 581.29926, "b": 656.41197, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Doug Mack", "bbox": {"l": 527.64001, "t": 659.71198, "r": 581.30884, "b": 670.39197, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Tom McKinley", "bbox": {"l": 514.38, "t": 673.75197, "r": 581.38678, "b": 684.43197, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Kent Milligan", "bbox": {"l": 518.82001, "t": 687.73197, "r": 581.33759, "b": 698.411972, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Implement roles and separation ", "bbox": {"l": 36.119999, "t": 296.13828, "r": 216.00064, "b": 308.58047, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "of duties", "bbox": {"l": 36.119999, "t": 313.11838000000006, "r": 84.527145, "b": 325.56058, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "Leverage", "bbox": {"l": 35.759315, "t": 350.13881999999995, "r": 80.409691, "b": 362.58102, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "row permissions on ", "bbox": {"l": 151.8503, "t": 350.13881999999995, "r": 202.45404, "b": 362.58102, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "the", "bbox": {"l": 35.759315, "t": 367.11893, "r": 50.758106, "b": 379.56112999999993, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "database", "bbox": {"l": 86.755211, "t": 367.11893, "r": 107.75352000000001, "b": 379.56112999999993, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Protect", "bbox": {"l": 36.059887, "t": 404.13937, "r": 73.020607, "b": 416.58157, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "columns by defining ", "bbox": {"l": 152.62831, "t": 404.13937, "r": 195.2753, "b": 416.58157, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "column", "bbox": {"l": 36.059887, "t": 421.11948, "r": 73.311806, "b": 433.56167999999997, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "masks", "bbox": {"l": 73.311806, "t": 421.11948, "r": 117.33681, "b": 433.56167999999997, "coord_origin": "TOPLEFT"}}], "children": [{"id": 5, "label": "text", "bbox": {"l": 497.70001, "t": 575.71201, "r": 581.38678, "b": 698.411972, "coord_origin": "TOPLEFT"}, "confidence": 0.7621809840202332, "cells": [{"id": 6, "text": "Jim Bainbridge", "bbox": {"l": 509.22, "t": 575.71201, "r": 581.34119, "b": 586.392, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Hernando Bedoya", "bbox": {"l": 497.70001, "t": 589.752, "r": 581.3736, "b": 600.43199, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Rob Bestgen", "bbox": {"l": 521.40002, "t": 603.73199, "r": 581.34003, "b": 614.4119900000001, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Mike Cain", "bbox": {"l": 534.12, "t": 617.71199, "r": 581.31598, "b": 628.39198, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Dan Cruikshank", "bbox": {"l": 505.43999999999994, "t": 631.75198, "r": 581.29077, "b": 642.4319800000001, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Jim Denton", "bbox": {"l": 527.22003, "t": 645.73198, "r": 581.29926, "b": 656.41197, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Doug Mack", "bbox": {"l": 527.64001, "t": 659.71198, "r": 581.30884, "b": 670.39197, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Tom McKinley", "bbox": {"l": 514.38, "t": 673.75197, "r": 581.38678, "b": 684.43197, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Kent Milligan", "bbox": {"l": 518.82001, "t": 687.73197, "r": 581.33759, "b": 698.411972, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 36.119999, "t": 296.13828, "r": 216.00064, "b": 325.56058, "coord_origin": "TOPLEFT"}, "confidence": 0.8502887487411499, "cells": [{"id": 15, "text": "Implement roles and separation ", "bbox": {"l": 36.119999, "t": 296.13828, "r": 216.00064, "b": 308.58047, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "of duties", "bbox": {"l": 36.119999, "t": 313.11838000000006, "r": 84.527145, "b": 325.56058, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 35.759315, "t": 350.13881999999995, "r": 202.45404, "b": 379.56112999999993, "coord_origin": "TOPLEFT"}, "confidence": 0.8639552593231201, "cells": [{"id": 17, "text": "Leverage", "bbox": {"l": 35.759315, "t": 350.13881999999995, "r": 80.409691, "b": 362.58102, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "row permissions on ", "bbox": {"l": 151.8503, "t": 350.13881999999995, "r": 202.45404, "b": 362.58102, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "the", "bbox": {"l": 35.759315, "t": 367.11893, "r": 50.758106, "b": 379.56112999999993, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "database", "bbox": {"l": 86.755211, "t": 367.11893, "r": 107.75352000000001, "b": 379.56112999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 36.059887, "t": 404.13937, "r": 195.2753, "b": 433.56167999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8421136140823364, "cells": [{"id": 21, "text": "Protect", "bbox": {"l": 36.059887, "t": 404.13937, "r": 73.020607, "b": 416.58157, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "columns by defining ", "bbox": {"l": 152.62831, "t": 404.13937, "r": 195.2753, "b": 416.58157, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "column", "bbox": {"l": 36.059887, "t": 421.11948, "r": 73.311806, "b": 433.56167999999997, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "masks", "bbox": {"l": 73.311806, "t": 421.11948, "r": 117.33681, "b": 433.56167999999997, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 0, "label": "picture", "bbox": {"l": 513.4560546875, "t": 26.085105895996094, "r": 586.1583251953125, "b": 54.819149017333984, "coord_origin": "TOPLEFT"}, "confidence": 0.9272358417510986, "cells": [], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_footer", "id": 6, "page_no": 0, "cluster": {"id": 6, "label": "page_footer", "bbox": {"l": 36.900002, "t": 751.23, "r": 164.4585, "b": 765.105, "coord_origin": "TOPLEFT"}, "confidence": 0.7180285453796387, "cells": [{"id": 0, "text": "ibm.com", "bbox": {"l": 36.900002, "t": 751.23, "r": 98.600998, "b": 765.105, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "/redbooks", "bbox": {"l": 98.580002, "t": 751.23, "r": 164.4585, "b": 765.105, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "ibm.com /redbooks"}, {"label": "picture", "id": 12, "page_no": 0, "cluster": {"id": 12, "label": "picture", "bbox": {"l": 316.94049072265625, "t": 710.1278076171875, "r": 581.3547973632812, "b": 774.4258422851562, "coord_origin": "TOPLEFT"}, "confidence": 0.5777517557144165, "cells": [{"id": 2, "text": "Redpaper", "bbox": {"l": 314.70001, "t": 711.50856, "r": 580.52002, "b": 773.772959, "coord_origin": "TOPLEFT"}}], "children": [{"id": 11, "label": "text", "bbox": {"l": 314.70001, "t": 711.50856, "r": 580.52002, "b": 773.772959, "coord_origin": "TOPLEFT"}, "confidence": 0.5870782732963562, "cells": [{"id": 2, "text": "Redpaper", "bbox": {"l": 314.70001, "t": 711.50856, "r": 580.52002, "b": 773.772959, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "text", "id": 12, "page_no": 0, "cluster": {"id": 12, "label": "text", "bbox": {"l": 287.82001, "t": 28.54803000000004, "r": 418.83356, "b": 50.748050000000035, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 3, "text": "Front cover", "bbox": {"l": 287.82001, "t": 28.54803000000004, "r": 418.83356, "b": 50.748050000000035, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Front cover"}, {"label": "section_header", "id": 4, "page_no": 0, "cluster": {"id": 4, "label": "section_header", "bbox": {"l": 35.700001, "t": 84.58654999999987, "r": 584.64288, "b": 165.84113000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.8281131982803345, "cells": [{"id": 4, "text": "Row and Column Access Control ", "bbox": {"l": 35.700001, "t": 84.58654999999987, "r": 584.64288, "b": 122.82097999999996, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Support in IBM DB2 for i", "bbox": {"l": 35.700001, "t": 127.60668999999996, "r": 447.66919000000007, "b": 165.84113000000002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Row and Column Access Control Support in IBM DB2 for i"}, {"label": "picture", "id": 10, "page_no": 0, "cluster": {"id": 10, "label": "picture", "bbox": {"l": 33.090599060058594, "t": 293.0328369140625, "r": 585.1502075195312, "b": 702.4530029296875, "coord_origin": "TOPLEFT"}, "confidence": 0.5889503359794617, "cells": [{"id": 6, "text": "Jim Bainbridge", "bbox": {"l": 509.22, "t": 575.71201, "r": 581.34119, "b": 586.392, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Hernando Bedoya", "bbox": {"l": 497.70001, "t": 589.752, "r": 581.3736, "b": 600.43199, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Rob Bestgen", "bbox": {"l": 521.40002, "t": 603.73199, "r": 581.34003, "b": 614.4119900000001, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Mike Cain", "bbox": {"l": 534.12, "t": 617.71199, "r": 581.31598, "b": 628.39198, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Dan Cruikshank", "bbox": {"l": 505.43999999999994, "t": 631.75198, "r": 581.29077, "b": 642.4319800000001, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Jim Denton", "bbox": {"l": 527.22003, "t": 645.73198, "r": 581.29926, "b": 656.41197, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Doug Mack", "bbox": {"l": 527.64001, "t": 659.71198, "r": 581.30884, "b": 670.39197, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Tom McKinley", "bbox": {"l": 514.38, "t": 673.75197, "r": 581.38678, "b": 684.43197, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Kent Milligan", "bbox": {"l": 518.82001, "t": 687.73197, "r": 581.33759, "b": 698.411972, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Implement roles and separation ", "bbox": {"l": 36.119999, "t": 296.13828, "r": 216.00064, "b": 308.58047, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "of duties", "bbox": {"l": 36.119999, "t": 313.11838000000006, "r": 84.527145, "b": 325.56058, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "Leverage", "bbox": {"l": 35.759315, "t": 350.13881999999995, "r": 80.409691, "b": 362.58102, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "row permissions on ", "bbox": {"l": 151.8503, "t": 350.13881999999995, "r": 202.45404, "b": 362.58102, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "the", "bbox": {"l": 35.759315, "t": 367.11893, "r": 50.758106, "b": 379.56112999999993, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "database", "bbox": {"l": 86.755211, "t": 367.11893, "r": 107.75352000000001, "b": 379.56112999999993, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Protect", "bbox": {"l": 36.059887, "t": 404.13937, "r": 73.020607, "b": 416.58157, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "columns by defining ", "bbox": {"l": 152.62831, "t": 404.13937, "r": 195.2753, "b": 416.58157, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "column", "bbox": {"l": 36.059887, "t": 421.11948, "r": 73.311806, "b": 433.56167999999997, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "masks", "bbox": {"l": 73.311806, "t": 421.11948, "r": 117.33681, "b": 433.56167999999997, "coord_origin": "TOPLEFT"}}], "children": [{"id": 5, "label": "text", "bbox": {"l": 497.70001, "t": 575.71201, "r": 581.38678, "b": 698.411972, "coord_origin": "TOPLEFT"}, "confidence": 0.7621809840202332, "cells": [{"id": 6, "text": "Jim Bainbridge", "bbox": {"l": 509.22, "t": 575.71201, "r": 581.34119, "b": 586.392, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Hernando Bedoya", "bbox": {"l": 497.70001, "t": 589.752, "r": 581.3736, "b": 600.43199, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Rob Bestgen", "bbox": {"l": 521.40002, "t": 603.73199, "r": 581.34003, "b": 614.4119900000001, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Mike Cain", "bbox": {"l": 534.12, "t": 617.71199, "r": 581.31598, "b": 628.39198, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Dan Cruikshank", "bbox": {"l": 505.43999999999994, "t": 631.75198, "r": 581.29077, "b": 642.4319800000001, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Jim Denton", "bbox": {"l": 527.22003, "t": 645.73198, "r": 581.29926, "b": 656.41197, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Doug Mack", "bbox": {"l": 527.64001, "t": 659.71198, "r": 581.30884, "b": 670.39197, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Tom McKinley", "bbox": {"l": 514.38, "t": 673.75197, "r": 581.38678, "b": 684.43197, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Kent Milligan", "bbox": {"l": 518.82001, "t": 687.73197, "r": 581.33759, "b": 698.411972, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 36.119999, "t": 296.13828, "r": 216.00064, "b": 325.56058, "coord_origin": "TOPLEFT"}, "confidence": 0.8502887487411499, "cells": [{"id": 15, "text": "Implement roles and separation ", "bbox": {"l": 36.119999, "t": 296.13828, "r": 216.00064, "b": 308.58047, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "of duties", "bbox": {"l": 36.119999, "t": 313.11838000000006, "r": 84.527145, "b": 325.56058, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 35.759315, "t": 350.13881999999995, "r": 202.45404, "b": 379.56112999999993, "coord_origin": "TOPLEFT"}, "confidence": 0.8639552593231201, "cells": [{"id": 17, "text": "Leverage", "bbox": {"l": 35.759315, "t": 350.13881999999995, "r": 80.409691, "b": 362.58102, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "row permissions on ", "bbox": {"l": 151.8503, "t": 350.13881999999995, "r": 202.45404, "b": 362.58102, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "the", "bbox": {"l": 35.759315, "t": 367.11893, "r": 50.758106, "b": 379.56112999999993, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "database", "bbox": {"l": 86.755211, "t": 367.11893, "r": 107.75352000000001, "b": 379.56112999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 36.059887, "t": 404.13937, "r": 195.2753, "b": 433.56167999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8421136140823364, "cells": [{"id": 21, "text": "Protect", "bbox": {"l": 36.059887, "t": 404.13937, "r": 73.020607, "b": 416.58157, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "columns by defining ", "bbox": {"l": 152.62831, "t": 404.13937, "r": 195.2753, "b": 416.58157, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "column", "bbox": {"l": 36.059887, "t": 421.11948, "r": 73.311806, "b": 433.56167999999997, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "masks", "bbox": {"l": 73.311806, "t": 421.11948, "r": 117.33681, "b": 433.56167999999997, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "picture", "id": 0, "page_no": 0, "cluster": {"id": 0, "label": "picture", "bbox": {"l": 513.4560546875, "t": 26.085105895996094, "r": 586.1583251953125, "b": 54.819149017333984, "coord_origin": "TOPLEFT"}, "confidence": 0.9272358417510986, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "body": [{"label": "picture", "id": 12, "page_no": 0, "cluster": {"id": 12, "label": "picture", "bbox": {"l": 316.94049072265625, "t": 710.1278076171875, "r": 581.3547973632812, "b": 774.4258422851562, "coord_origin": "TOPLEFT"}, "confidence": 0.5777517557144165, "cells": [{"id": 2, "text": "Redpaper", "bbox": {"l": 314.70001, "t": 711.50856, "r": 580.52002, "b": 773.772959, "coord_origin": "TOPLEFT"}}], "children": [{"id": 11, "label": "text", "bbox": {"l": 314.70001, "t": 711.50856, "r": 580.52002, "b": 773.772959, "coord_origin": "TOPLEFT"}, "confidence": 0.5870782732963562, "cells": [{"id": 2, "text": "Redpaper", "bbox": {"l": 314.70001, "t": 711.50856, "r": 580.52002, "b": 773.772959, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "text", "id": 12, "page_no": 0, "cluster": {"id": 12, "label": "text", "bbox": {"l": 287.82001, "t": 28.54803000000004, "r": 418.83356, "b": 50.748050000000035, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 3, "text": "Front cover", "bbox": {"l": 287.82001, "t": 28.54803000000004, "r": 418.83356, "b": 50.748050000000035, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Front cover"}, {"label": "section_header", "id": 4, "page_no": 0, "cluster": {"id": 4, "label": "section_header", "bbox": {"l": 35.700001, "t": 84.58654999999987, "r": 584.64288, "b": 165.84113000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.8281131982803345, "cells": [{"id": 4, "text": "Row and Column Access Control ", "bbox": {"l": 35.700001, "t": 84.58654999999987, "r": 584.64288, "b": 122.82097999999996, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Support in IBM DB2 for i", "bbox": {"l": 35.700001, "t": 127.60668999999996, "r": 447.66919000000007, "b": 165.84113000000002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Row and Column Access Control Support in IBM DB2 for i"}, {"label": "picture", "id": 10, "page_no": 0, "cluster": {"id": 10, "label": "picture", "bbox": {"l": 33.090599060058594, "t": 293.0328369140625, "r": 585.1502075195312, "b": 702.4530029296875, "coord_origin": "TOPLEFT"}, "confidence": 0.5889503359794617, "cells": [{"id": 6, "text": "Jim Bainbridge", "bbox": {"l": 509.22, "t": 575.71201, "r": 581.34119, "b": 586.392, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Hernando Bedoya", "bbox": {"l": 497.70001, "t": 589.752, "r": 581.3736, "b": 600.43199, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Rob Bestgen", "bbox": {"l": 521.40002, "t": 603.73199, "r": 581.34003, "b": 614.4119900000001, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Mike Cain", "bbox": {"l": 534.12, "t": 617.71199, "r": 581.31598, "b": 628.39198, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Dan Cruikshank", "bbox": {"l": 505.43999999999994, "t": 631.75198, "r": 581.29077, "b": 642.4319800000001, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Jim Denton", "bbox": {"l": 527.22003, "t": 645.73198, "r": 581.29926, "b": 656.41197, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Doug Mack", "bbox": {"l": 527.64001, "t": 659.71198, "r": 581.30884, "b": 670.39197, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Tom McKinley", "bbox": {"l": 514.38, "t": 673.75197, "r": 581.38678, "b": 684.43197, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Kent Milligan", "bbox": {"l": 518.82001, "t": 687.73197, "r": 581.33759, "b": 698.411972, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Implement roles and separation ", "bbox": {"l": 36.119999, "t": 296.13828, "r": 216.00064, "b": 308.58047, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "of duties", "bbox": {"l": 36.119999, "t": 313.11838000000006, "r": 84.527145, "b": 325.56058, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "Leverage", "bbox": {"l": 35.759315, "t": 350.13881999999995, "r": 80.409691, "b": 362.58102, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "row permissions on ", "bbox": {"l": 151.8503, "t": 350.13881999999995, "r": 202.45404, "b": 362.58102, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "the", "bbox": {"l": 35.759315, "t": 367.11893, "r": 50.758106, "b": 379.56112999999993, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "database", "bbox": {"l": 86.755211, "t": 367.11893, "r": 107.75352000000001, "b": 379.56112999999993, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Protect", "bbox": {"l": 36.059887, "t": 404.13937, "r": 73.020607, "b": 416.58157, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "columns by defining ", "bbox": {"l": 152.62831, "t": 404.13937, "r": 195.2753, "b": 416.58157, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "column", "bbox": {"l": 36.059887, "t": 421.11948, "r": 73.311806, "b": 433.56167999999997, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "masks", "bbox": {"l": 73.311806, "t": 421.11948, "r": 117.33681, "b": 433.56167999999997, "coord_origin": "TOPLEFT"}}], "children": [{"id": 5, "label": "text", "bbox": {"l": 497.70001, "t": 575.71201, "r": 581.38678, "b": 698.411972, "coord_origin": "TOPLEFT"}, "confidence": 0.7621809840202332, "cells": [{"id": 6, "text": "Jim Bainbridge", "bbox": {"l": 509.22, "t": 575.71201, "r": 581.34119, "b": 586.392, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Hernando Bedoya", "bbox": {"l": 497.70001, "t": 589.752, "r": 581.3736, "b": 600.43199, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Rob Bestgen", "bbox": {"l": 521.40002, "t": 603.73199, "r": 581.34003, "b": 614.4119900000001, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Mike Cain", "bbox": {"l": 534.12, "t": 617.71199, "r": 581.31598, "b": 628.39198, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Dan Cruikshank", "bbox": {"l": 505.43999999999994, "t": 631.75198, "r": 581.29077, "b": 642.4319800000001, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Jim Denton", "bbox": {"l": 527.22003, "t": 645.73198, "r": 581.29926, "b": 656.41197, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Doug Mack", "bbox": {"l": 527.64001, "t": 659.71198, "r": 581.30884, "b": 670.39197, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Tom McKinley", "bbox": {"l": 514.38, "t": 673.75197, "r": 581.38678, "b": 684.43197, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Kent Milligan", "bbox": {"l": 518.82001, "t": 687.73197, "r": 581.33759, "b": 698.411972, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 36.119999, "t": 296.13828, "r": 216.00064, "b": 325.56058, "coord_origin": "TOPLEFT"}, "confidence": 0.8502887487411499, "cells": [{"id": 15, "text": "Implement roles and separation ", "bbox": {"l": 36.119999, "t": 296.13828, "r": 216.00064, "b": 308.58047, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "of duties", "bbox": {"l": 36.119999, "t": 313.11838000000006, "r": 84.527145, "b": 325.56058, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 35.759315, "t": 350.13881999999995, "r": 202.45404, "b": 379.56112999999993, "coord_origin": "TOPLEFT"}, "confidence": 0.8639552593231201, "cells": [{"id": 17, "text": "Leverage", "bbox": {"l": 35.759315, "t": 350.13881999999995, "r": 80.409691, "b": 362.58102, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "row permissions on ", "bbox": {"l": 151.8503, "t": 350.13881999999995, "r": 202.45404, "b": 362.58102, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "the", "bbox": {"l": 35.759315, "t": 367.11893, "r": 50.758106, "b": 379.56112999999993, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "database", "bbox": {"l": 86.755211, "t": 367.11893, "r": 107.75352000000001, "b": 379.56112999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 36.059887, "t": 404.13937, "r": 195.2753, "b": 433.56167999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8421136140823364, "cells": [{"id": 21, "text": "Protect", "bbox": {"l": 36.059887, "t": 404.13937, "r": 73.020607, "b": 416.58157, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "columns by defining ", "bbox": {"l": 152.62831, "t": 404.13937, "r": 195.2753, "b": 416.58157, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "column", "bbox": {"l": 36.059887, "t": 421.11948, "r": 73.311806, "b": 433.56167999999997, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "masks", "bbox": {"l": 73.311806, "t": 421.11948, "r": 117.33681, "b": 433.56167999999997, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "picture", "id": 0, "page_no": 0, "cluster": {"id": 0, "label": "picture", "bbox": {"l": 513.4560546875, "t": 26.085105895996094, "r": 586.1583251953125, "b": 54.819149017333984, "coord_origin": "TOPLEFT"}, "confidence": 0.9272358417510986, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "headers": [{"label": "page_footer", "id": 6, "page_no": 0, "cluster": {"id": 6, "label": "page_footer", "bbox": {"l": 36.900002, "t": 751.23, "r": 164.4585, "b": 765.105, "coord_origin": "TOPLEFT"}, "confidence": 0.7180285453796387, "cells": [{"id": 0, "text": "ibm.com", "bbox": {"l": 36.900002, "t": 751.23, "r": 98.600998, "b": 765.105, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "/redbooks", "bbox": {"l": 98.580002, "t": 751.23, "r": 164.4585, "b": 765.105, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "ibm.com /redbooks"}]}}, {"page_no": 1, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "' Copyright IBM Corp. 2014. All rights reserved.", "bbox": {"l": 64.800003, "t": 755.538002, "r": 257.24335, "b": 763.863001, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "iii", "bbox": {"l": 538.85999, "t": 754.848721, "r": 547.25928, "b": 764.06172, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Contents", "bbox": {"l": 64.800003, "t": 73.84802000000002, "r": 168.73441, "b": 96.04803000000004, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Notices", "bbox": {"l": 136.8, "t": 132.64862000000005, "r": 172.89404, "b": 141.86163, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vii", "bbox": {"l": 175.01952, "t": 132.64862000000005, "r": 547.18982, "b": 141.86163, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Trademarks", "bbox": {"l": 136.79901, "t": 145.12847999999997, "r": 189.86537, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 195.39685, "t": 145.12847999999997, "r": 530.05121, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "viii", "bbox": {"l": 535.5827, "t": 145.12847999999997, "r": 547.18286, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "DB2 for i Center of Excellence", "bbox": {"l": 136.79901, "t": 167.62811, "r": 279.39731, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ix", "bbox": {"l": 280.61942, "t": 167.62811, "r": 547.1908, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Preface", "bbox": {"l": 136.79901, "t": 190.12775, "r": 172.84424, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi", "bbox": {"l": 175.01852, "t": 190.12775, "r": 547.18286, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Authors . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi", "bbox": {"l": 136.79803, "t": 202.60760000000005, "r": 547.18085, "b": 211.82061999999996, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Now you can become a published author, too!", "bbox": {"l": 136.79803, "t": 215.14721999999995, "r": 339.18292, "b": 224.36023, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 344.71411, "t": 215.14721999999995, "r": 530.00812, "b": 224.36023, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "xiii", "bbox": {"l": 535.53925, "t": 215.14721999999995, "r": 547.13879, "b": 224.36023, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Comments welcome. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 136.79803, "t": 227.62707999999998, "r": 529.99506, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "xiii", "bbox": {"l": 535.5495, "t": 227.62707999999998, "r": 547.19788, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Stay connected to IBM Redbooks", "bbox": {"l": 136.79807, "t": 240.10693000000003, "r": 284.02866, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 289.54449, "t": 240.10693000000003, "r": 529.48242, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "xiv", "bbox": {"l": 534.99829, "t": 240.10693000000003, "r": 547.12115, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Chapter 1. Securing and protecting IBM DB2 data", "bbox": {"l": 136.79807, "t": 262.60657000000003, "r": 373.17566, "b": 271.81958, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 375.11798, "t": 262.60657000000003, "r": 536.09589, "b": 271.81958, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "1", "bbox": {"l": 541.64685, "t": 262.60657000000003, "r": 547.19781, "b": 271.81958, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "1.1", "bbox": {"l": 136.79808, "t": 274.60637999999994, "r": 150.88702, "b": 283.8194, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "Security fundamentals. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2", "bbox": {"l": 156.5226, "t": 274.60637999999994, "r": 549.84723, "b": 283.8194, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "1.2", "bbox": {"l": 136.79807, "t": 287.14606000000003, "r": 150.62746, "b": 296.35904, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Current state of IBM i security . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.15923, "t": 287.14606000000003, "r": 536.12933, "b": 296.35904, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "2", "bbox": {"l": 541.66113, "t": 287.14606000000003, "r": 547.19287, "b": 296.35904, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "1.3", "bbox": {"l": 136.79807, "t": 299.62595, "r": 150.84943, "b": 308.83893, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "DB2 for i security controls . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3", "bbox": {"l": 156.46996, "t": 299.62595, "r": 549.84723, "b": 308.83893, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "1.3.1", "bbox": {"l": 151.1972, "t": 312.1058300000001, "r": 173.38289, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Existing row and column control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.92932, "t": 312.1058300000001, "r": 536.05511, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "4", "bbox": {"l": 541.6015, "t": 312.1058300000001, "r": 547.14795, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "1.3.2", "bbox": {"l": 151.1972, "t": 324.64548, "r": 173.4189, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "New controls: Row and Column Access Control. . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.97432, "t": 324.64548, "r": 536.08008, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "5", "bbox": {"l": 541.6355, "t": 324.64548, "r": 547.19092, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "Chapter 2. Roles and separation of duties", "bbox": {"l": 136.79704, "t": 347.14511, "r": 336.82071, "b": 356.35809, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 338.99701, "t": 347.14511, "r": 536.09088, "b": 356.35809, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "7", "bbox": {"l": 541.64282, "t": 347.14511, "r": 547.19476, "b": 356.35809, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "2.1", "bbox": {"l": 136.79704, "t": 359.14493, "r": 150.644, "b": 368.35791, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Roles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.18277, "t": 359.14493, "r": 536.12714, "b": 368.35791, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "8", "bbox": {"l": 541.66589, "t": 359.14493, "r": 547.20471, "b": 368.35791, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "2.1.1", "bbox": {"l": 151.1972, "t": 371.62482, "r": 173.60995, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "DDM and DRDA application server access: QIBM_DB_DDMDRDA . . . . . . . . . . .", "bbox": {"l": 176.41154, "t": 371.62482, "r": 535.9527, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "8", "bbox": {"l": 541.55585, "t": 371.62482, "r": 547.15906, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "2.1.2", "bbox": {"l": 151.1972, "t": 384.10470999999995, "r": 173.41664, "b": 393.31769, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "Toolbox application server access: QIBM_DB_ZDA. . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.97151, "t": 384.10470999999995, "r": 536.04108, "b": 393.31769, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "8", "bbox": {"l": 541.59595, "t": 384.10470999999995, "r": 547.15082, "b": 393.31769, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "2.1.3", "bbox": {"l": 151.1972, "t": 396.64435, "r": 173.41859, "b": 405.85733, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Database Administrator function: QIBM_DB_SQLADM . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.97394, "t": 396.64435, "r": 536.07489, "b": 405.85733, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "9", "bbox": {"l": 541.63025, "t": 396.64435, "r": 547.18561, "b": 405.85733, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "2.1.4", "bbox": {"l": 151.1972, "t": 409.12424000000004, "r": 173.38629, "b": 418.33722, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Database Information function: QIBM_DB_SYSMON", "bbox": {"l": 178.93356, "t": 409.12424000000004, "r": 411.27048, "b": 418.33722, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": ". . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 416.81775, "t": 409.12424000000004, "r": 536.08411, "b": 418.33722, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "9", "bbox": {"l": 541.63135, "t": 409.12424000000004, "r": 547.17865, "b": 418.33722, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "2.1.5", "bbox": {"l": 151.1972, "t": 421.60413, "r": 173.44926, "b": 430.81711, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Security Administrator function: QIBM_DB_SECADM . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 179.01228, "t": 421.60413, "r": 536.03589, "b": 430.81711, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "9", "bbox": {"l": 541.59894, "t": 421.60413, "r": 547.16193, "b": 430.81711, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "2.1.6", "bbox": {"l": 151.1972, "t": 434.1437700000001, "r": 173.32208, "b": 443.35675, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Change Function Usage CL command . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.8533, "t": 434.1437700000001, "r": 530.57318, "b": 443.35675, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "10", "bbox": {"l": 536.10443, "t": 434.1437700000001, "r": 547.16687, "b": 443.35675, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "2.1.7", "bbox": {"l": 151.1972, "t": 446.62366, "r": 173.35822, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "Verifying function usage IDs for RCAC with the FUNCTION_USAGE view . . . . .", "bbox": {"l": 178.89848, "t": 446.62366, "r": 530.53522, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "10", "bbox": {"l": 536.0755, "t": 446.62366, "r": 547.15601, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "2.2", "bbox": {"l": 136.79704, "t": 459.10355, "r": 150.85457, "b": 468.31653, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "Separation of duties . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10", "bbox": {"l": 156.47758, "t": 459.10355, "r": 547.25659, "b": 468.31653, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "Chapter 3. Row and Column Access Control", "bbox": {"l": 136.79703, "t": 481.60318, "r": 348.68503, "b": 490.81616, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 350.09741, "t": 481.60318, "r": 530.53961, "b": 490.81616, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "13", "bbox": {"l": 536.09167, "t": 481.60318, "r": 547.1958, "b": 490.81616, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "3.1", "bbox": {"l": 136.79703, "t": 493.603, "r": 150.70105, "b": 502.81598, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Explanation of RCAC and the concept of access control . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.26266, "t": 493.603, "r": 530.4809, "b": 502.81598, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "14", "bbox": {"l": 536.04248, "t": 493.603, "r": 547.16571, "b": 502.81598, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "3.1.1", "bbox": {"l": 151.19719, "t": 506.14264, "r": 173.35429, "b": 515.35562, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "Row permission and column mask definitions", "bbox": {"l": 178.89357, "t": 506.14264, "r": 378.20786, "b": 515.35562, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 383.74713, "t": 506.14264, "r": 530.5379, "b": 515.35562, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "14", "bbox": {"l": 536.07721, "t": 506.14264, "r": 547.15576, "b": 515.35562, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "3.1.2", "bbox": {"l": 151.19719, "t": 518.62253, "r": 173.44292, "b": 527.83551, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "Enabling and activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 179.00435, "t": 518.62253, "r": 530.43475, "b": 527.83551, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "16", "bbox": {"l": 535.99622, "t": 518.62253, "r": 547.11908, "b": 527.83551, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "3.2", "bbox": {"l": 136.79703, "t": 531.1621700000001, "r": 150.64432, "b": 540.37517, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Special registers and built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.18323, "t": 531.1621700000001, "r": 530.52808, "b": 540.37517, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "18", "bbox": {"l": 536.06702, "t": 531.1621700000001, "r": 547.14484, "b": 540.37517, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "3.2.1", "bbox": {"l": 151.19719, "t": 543.64204, "r": 173.41321, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "Special registers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.96722, "t": 543.64204, "r": 530.49786, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "18", "bbox": {"l": 536.05188, "t": 543.64204, "r": 547.15991, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "3.2.2", "bbox": {"l": 151.19719, "t": 556.12192, "r": 173.35269, "b": 565.33492, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.89156, "t": 556.12192, "r": 530.56024, "b": 565.33492, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "19", "bbox": {"l": 536.09912, "t": 556.12192, "r": 547.17688, "b": 565.33492, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "3.3", "bbox": {"l": 136.79703, "t": 568.66156, "r": 150.62514, "b": 577.87456, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "VERIFY_GROUP_FOR_USER function . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.15639, "t": 568.66156, "r": 530.53027, "b": 577.87456, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "20", "bbox": {"l": 536.06152, "t": 568.66156, "r": 547.12402, "b": 577.87456, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "3.4", "bbox": {"l": 136.79703, "t": 581.14143, "r": 150.63004, "b": 590.35443, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "Establishing and controlling accessibility by using the RCAC rule text . . . . . . . . . . . . .", "bbox": {"l": 156.16325, "t": 581.14143, "r": 530.62994, "b": 590.35443, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "21", "bbox": {"l": 536.16315, "t": 581.14143, "r": 547.22955, "b": 590.35443, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "3.5", "bbox": {"l": 136.79701, "t": 593.62131, "r": 150.64413, "b": 602.8343, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "SELECT, INSERT, and UPDATE behavior with RCAC", "bbox": {"l": 156.18298, "t": 593.62131, "r": 394.7818, "b": 602.8343, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": ". . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 400.32065, "t": 593.62131, "r": 530.48358, "b": 602.8343, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "22", "bbox": {"l": 536.0224, "t": 593.62131, "r": 547.1001, "b": 602.8343, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "3.6", "bbox": {"l": 136.79701, "t": 606.16095, "r": 150.6642, "b": 615.37395, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "Human resources example . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.21107, "t": 606.16095, "r": 530.56512, "b": 615.37395, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "22", "bbox": {"l": 536.112, "t": 606.16095, "r": 547.20575, "b": 615.37395, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "3.6.1", "bbox": {"l": 151.19717, "t": 618.64082, "r": 173.41692, "b": 627.85382, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "Assigning the QIBM_DB_SECADM function ID to the consultants. . . . . . . . . . . .", "bbox": {"l": 178.97185, "t": 618.64082, "r": 530.49139, "b": 627.85382, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "23", "bbox": {"l": 536.04633, "t": 618.64082, "r": 547.15619, "b": 627.85382, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "3.6.2", "bbox": {"l": 151.19717, "t": 631.1206999999999, "r": 173.32271, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "Creating group profiles for the users and their roles . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.8541, "t": 631.1206999999999, "r": 530.56458, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "23", "bbox": {"l": 536.09601, "t": 631.1206999999999, "r": 547.15875, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "3.6.3", "bbox": {"l": 151.19717, "t": 643.66034, "r": 173.32227, "b": 652.87334, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "Demonstrating data access without RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.85353, "t": 643.66034, "r": 530.55695, "b": 652.87334, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "24", "bbox": {"l": 536.0882, "t": 643.66034, "r": 547.15076, "b": 652.87334, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "3.6.4", "bbox": {"l": 151.19717, "t": 656.14021, "r": 173.35289, "b": 665.35321, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "Defining and creating row permissions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.89182, "t": 656.14021, "r": 530.53412, "b": 665.35321, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "25", "bbox": {"l": 536.073, "t": 656.14021, "r": 547.15088, "b": 665.35321, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "3.6.5", "bbox": {"l": 151.19717, "t": 668.62009, "r": 173.35289, "b": 677.83309, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "Defining and creating column masks", "bbox": {"l": 178.89182, "t": 668.62009, "r": 339.45105, "b": 677.83309, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 344.98996, "t": 668.62009, "r": 530.54413, "b": 677.83309, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "26", "bbox": {"l": 536.08301, "t": 668.62009, "r": 547.16089, "b": 677.83309, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "3.6.6", "bbox": {"l": 151.19717, "t": 681.15973, "r": 173.38359, "b": 690.37273, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "Activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.93019, "t": 681.15973, "r": 530.54102, "b": 690.37273, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "28", "bbox": {"l": 536.08765, "t": 681.15973, "r": 547.18085, "b": 690.37273, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "3.6.7", "bbox": {"l": 151.19717, "t": 693.63961, "r": 173.32332, "b": 702.852615, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Demonstrating data access with RCAC", "bbox": {"l": 178.85486, "t": 693.63961, "r": 350.80011, "b": 702.852615, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 356.33163, "t": 693.63961, "r": 530.57507, "b": 702.852615, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "29", "bbox": {"l": 536.10663, "t": 693.63961, "r": 547.16968, "b": 702.852615, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "3.6.8", "bbox": {"l": 151.19717, "t": 706.119492, "r": 173.44592, "b": 715.332497, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "Demonstrating data access with a view and RCAC . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 179.00812, "t": 706.119492, "r": 530.43628, "b": 715.332497, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "32", "bbox": {"l": 535.99847, "t": 706.119492, "r": 547.12286, "b": 715.332497, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 2, "label": "page_footer", "bbox": {"l": 64.800003, "t": 755.538002, "r": 257.24335, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9473597407341003, "cells": [{"id": 0, "text": "' Copyright IBM Corp. 2014. All rights reserved.", "bbox": {"l": 64.800003, "t": 755.538002, "r": 257.24335, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "page_footer", "bbox": {"l": 538.85999, "t": 754.848721, "r": 547.25928, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.892627477645874, "cells": [{"id": 1, "text": "iii", "bbox": {"l": 538.85999, "t": 754.848721, "r": 547.25928, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "section_header", "bbox": {"l": 64.800003, "t": 73.84802000000002, "r": 168.73441, "b": 96.04803000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9509141445159912, "cells": [{"id": 2, "text": "Contents", "bbox": {"l": 64.800003, "t": 73.84802000000002, "r": 168.73441, "b": 96.04803000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "document_index", "bbox": {"l": 136.1495819091797, "t": 132.0330352783203, "r": 547.52685546875, "b": 715.6515502929688, "coord_origin": "TOPLEFT"}, "confidence": 0.9803680181503296, "cells": [{"id": 3, "text": "Notices", "bbox": {"l": 136.8, "t": 132.64862000000005, "r": 172.89404, "b": 141.86163, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vii", "bbox": {"l": 175.01952, "t": 132.64862000000005, "r": 547.18982, "b": 141.86163, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Trademarks", "bbox": {"l": 136.79901, "t": 145.12847999999997, "r": 189.86537, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 195.39685, "t": 145.12847999999997, "r": 530.05121, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "viii", "bbox": {"l": 535.5827, "t": 145.12847999999997, "r": 547.18286, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "DB2 for i Center of Excellence", "bbox": {"l": 136.79901, "t": 167.62811, "r": 279.39731, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ix", "bbox": {"l": 280.61942, "t": 167.62811, "r": 547.1908, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Preface", "bbox": {"l": 136.79901, "t": 190.12775, "r": 172.84424, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi", "bbox": {"l": 175.01852, "t": 190.12775, "r": 547.18286, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Authors . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi", "bbox": {"l": 136.79803, "t": 202.60760000000005, "r": 547.18085, "b": 211.82061999999996, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Now you can become a published author, too!", "bbox": {"l": 136.79803, "t": 215.14721999999995, "r": 339.18292, "b": 224.36023, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 344.71411, "t": 215.14721999999995, "r": 530.00812, "b": 224.36023, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "xiii", "bbox": {"l": 535.53925, "t": 215.14721999999995, "r": 547.13879, "b": 224.36023, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Comments welcome. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 136.79803, "t": 227.62707999999998, "r": 529.99506, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "xiii", "bbox": {"l": 535.5495, "t": 227.62707999999998, "r": 547.19788, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Stay connected to IBM Redbooks", "bbox": {"l": 136.79807, "t": 240.10693000000003, "r": 284.02866, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 289.54449, "t": 240.10693000000003, "r": 529.48242, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "xiv", "bbox": {"l": 534.99829, "t": 240.10693000000003, "r": 547.12115, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Chapter 1. Securing and protecting IBM DB2 data", "bbox": {"l": 136.79807, "t": 262.60657000000003, "r": 373.17566, "b": 271.81958, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 375.11798, "t": 262.60657000000003, "r": 536.09589, "b": 271.81958, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "1", "bbox": {"l": 541.64685, "t": 262.60657000000003, "r": 547.19781, "b": 271.81958, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "1.1", "bbox": {"l": 136.79808, "t": 274.60637999999994, "r": 150.88702, "b": 283.8194, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "Security fundamentals. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2", "bbox": {"l": 156.5226, "t": 274.60637999999994, "r": 549.84723, "b": 283.8194, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "1.2", "bbox": {"l": 136.79807, "t": 287.14606000000003, "r": 150.62746, "b": 296.35904, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Current state of IBM i security . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.15923, "t": 287.14606000000003, "r": 536.12933, "b": 296.35904, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "2", "bbox": {"l": 541.66113, "t": 287.14606000000003, "r": 547.19287, "b": 296.35904, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "1.3", "bbox": {"l": 136.79807, "t": 299.62595, "r": 150.84943, "b": 308.83893, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "DB2 for i security controls . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3", "bbox": {"l": 156.46996, "t": 299.62595, "r": 549.84723, "b": 308.83893, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "1.3.1", "bbox": {"l": 151.1972, "t": 312.1058300000001, "r": 173.38289, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Existing row and column control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.92932, "t": 312.1058300000001, "r": 536.05511, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "4", "bbox": {"l": 541.6015, "t": 312.1058300000001, "r": 547.14795, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "1.3.2", "bbox": {"l": 151.1972, "t": 324.64548, "r": 173.4189, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "New controls: Row and Column Access Control. . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.97432, "t": 324.64548, "r": 536.08008, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "5", "bbox": {"l": 541.6355, "t": 324.64548, "r": 547.19092, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "Chapter 2. Roles and separation of duties", "bbox": {"l": 136.79704, "t": 347.14511, "r": 336.82071, "b": 356.35809, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 338.99701, "t": 347.14511, "r": 536.09088, "b": 356.35809, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "7", "bbox": {"l": 541.64282, "t": 347.14511, "r": 547.19476, "b": 356.35809, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "2.1", "bbox": {"l": 136.79704, "t": 359.14493, "r": 150.644, "b": 368.35791, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Roles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.18277, "t": 359.14493, "r": 536.12714, "b": 368.35791, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "8", "bbox": {"l": 541.66589, "t": 359.14493, "r": 547.20471, "b": 368.35791, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "2.1.1", "bbox": {"l": 151.1972, "t": 371.62482, "r": 173.60995, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "DDM and DRDA application server access: QIBM_DB_DDMDRDA . . . . . . . . . . .", "bbox": {"l": 176.41154, "t": 371.62482, "r": 535.9527, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "8", "bbox": {"l": 541.55585, "t": 371.62482, "r": 547.15906, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "2.1.2", "bbox": {"l": 151.1972, "t": 384.10470999999995, "r": 173.41664, "b": 393.31769, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "Toolbox application server access: QIBM_DB_ZDA. . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.97151, "t": 384.10470999999995, "r": 536.04108, "b": 393.31769, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "8", "bbox": {"l": 541.59595, "t": 384.10470999999995, "r": 547.15082, "b": 393.31769, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "2.1.3", "bbox": {"l": 151.1972, "t": 396.64435, "r": 173.41859, "b": 405.85733, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Database Administrator function: QIBM_DB_SQLADM . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.97394, "t": 396.64435, "r": 536.07489, "b": 405.85733, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "9", "bbox": {"l": 541.63025, "t": 396.64435, "r": 547.18561, "b": 405.85733, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "2.1.4", "bbox": {"l": 151.1972, "t": 409.12424000000004, "r": 173.38629, "b": 418.33722, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Database Information function: QIBM_DB_SYSMON", "bbox": {"l": 178.93356, "t": 409.12424000000004, "r": 411.27048, "b": 418.33722, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": ". . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 416.81775, "t": 409.12424000000004, "r": 536.08411, "b": 418.33722, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "9", "bbox": {"l": 541.63135, "t": 409.12424000000004, "r": 547.17865, "b": 418.33722, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "2.1.5", "bbox": {"l": 151.1972, "t": 421.60413, "r": 173.44926, "b": 430.81711, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Security Administrator function: QIBM_DB_SECADM . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 179.01228, "t": 421.60413, "r": 536.03589, "b": 430.81711, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "9", "bbox": {"l": 541.59894, "t": 421.60413, "r": 547.16193, "b": 430.81711, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "2.1.6", "bbox": {"l": 151.1972, "t": 434.1437700000001, "r": 173.32208, "b": 443.35675, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Change Function Usage CL command . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.8533, "t": 434.1437700000001, "r": 530.57318, "b": 443.35675, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "10", "bbox": {"l": 536.10443, "t": 434.1437700000001, "r": 547.16687, "b": 443.35675, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "2.1.7", "bbox": {"l": 151.1972, "t": 446.62366, "r": 173.35822, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "Verifying function usage IDs for RCAC with the FUNCTION_USAGE view . . . . .", "bbox": {"l": 178.89848, "t": 446.62366, "r": 530.53522, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "10", "bbox": {"l": 536.0755, "t": 446.62366, "r": 547.15601, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "2.2", "bbox": {"l": 136.79704, "t": 459.10355, "r": 150.85457, "b": 468.31653, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "Separation of duties . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10", "bbox": {"l": 156.47758, "t": 459.10355, "r": 547.25659, "b": 468.31653, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "Chapter 3. Row and Column Access Control", "bbox": {"l": 136.79703, "t": 481.60318, "r": 348.68503, "b": 490.81616, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 350.09741, "t": 481.60318, "r": 530.53961, "b": 490.81616, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "13", "bbox": {"l": 536.09167, "t": 481.60318, "r": 547.1958, "b": 490.81616, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "3.1", "bbox": {"l": 136.79703, "t": 493.603, "r": 150.70105, "b": 502.81598, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Explanation of RCAC and the concept of access control . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.26266, "t": 493.603, "r": 530.4809, "b": 502.81598, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "14", "bbox": {"l": 536.04248, "t": 493.603, "r": 547.16571, "b": 502.81598, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "3.1.1", "bbox": {"l": 151.19719, "t": 506.14264, "r": 173.35429, "b": 515.35562, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "Row permission and column mask definitions", "bbox": {"l": 178.89357, "t": 506.14264, "r": 378.20786, "b": 515.35562, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 383.74713, "t": 506.14264, "r": 530.5379, "b": 515.35562, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "14", "bbox": {"l": 536.07721, "t": 506.14264, "r": 547.15576, "b": 515.35562, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "3.1.2", "bbox": {"l": 151.19719, "t": 518.62253, "r": 173.44292, "b": 527.83551, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "Enabling and activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 179.00435, "t": 518.62253, "r": 530.43475, "b": 527.83551, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "16", "bbox": {"l": 535.99622, "t": 518.62253, "r": 547.11908, "b": 527.83551, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "3.2", "bbox": {"l": 136.79703, "t": 531.1621700000001, "r": 150.64432, "b": 540.37517, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Special registers and built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.18323, "t": 531.1621700000001, "r": 530.52808, "b": 540.37517, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "18", "bbox": {"l": 536.06702, "t": 531.1621700000001, "r": 547.14484, "b": 540.37517, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "3.2.1", "bbox": {"l": 151.19719, "t": 543.64204, "r": 173.41321, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "Special registers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.96722, "t": 543.64204, "r": 530.49786, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "18", "bbox": {"l": 536.05188, "t": 543.64204, "r": 547.15991, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "3.2.2", "bbox": {"l": 151.19719, "t": 556.12192, "r": 173.35269, "b": 565.33492, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.89156, "t": 556.12192, "r": 530.56024, "b": 565.33492, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "19", "bbox": {"l": 536.09912, "t": 556.12192, "r": 547.17688, "b": 565.33492, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "3.3", "bbox": {"l": 136.79703, "t": 568.66156, "r": 150.62514, "b": 577.87456, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "VERIFY_GROUP_FOR_USER function . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.15639, "t": 568.66156, "r": 530.53027, "b": 577.87456, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "20", "bbox": {"l": 536.06152, "t": 568.66156, "r": 547.12402, "b": 577.87456, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "3.4", "bbox": {"l": 136.79703, "t": 581.14143, "r": 150.63004, "b": 590.35443, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "Establishing and controlling accessibility by using the RCAC rule text . . . . . . . . . . . . .", "bbox": {"l": 156.16325, "t": 581.14143, "r": 530.62994, "b": 590.35443, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "21", "bbox": {"l": 536.16315, "t": 581.14143, "r": 547.22955, "b": 590.35443, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "3.5", "bbox": {"l": 136.79701, "t": 593.62131, "r": 150.64413, "b": 602.8343, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "SELECT, INSERT, and UPDATE behavior with RCAC", "bbox": {"l": 156.18298, "t": 593.62131, "r": 394.7818, "b": 602.8343, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": ". . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 400.32065, "t": 593.62131, "r": 530.48358, "b": 602.8343, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "22", "bbox": {"l": 536.0224, "t": 593.62131, "r": 547.1001, "b": 602.8343, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "3.6", "bbox": {"l": 136.79701, "t": 606.16095, "r": 150.6642, "b": 615.37395, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "Human resources example . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.21107, "t": 606.16095, "r": 530.56512, "b": 615.37395, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "22", "bbox": {"l": 536.112, "t": 606.16095, "r": 547.20575, "b": 615.37395, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "3.6.1", "bbox": {"l": 151.19717, "t": 618.64082, "r": 173.41692, "b": 627.85382, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "Assigning the QIBM_DB_SECADM function ID to the consultants. . . . . . . . . . . .", "bbox": {"l": 178.97185, "t": 618.64082, "r": 530.49139, "b": 627.85382, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "23", "bbox": {"l": 536.04633, "t": 618.64082, "r": 547.15619, "b": 627.85382, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "3.6.2", "bbox": {"l": 151.19717, "t": 631.1206999999999, "r": 173.32271, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "Creating group profiles for the users and their roles . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.8541, "t": 631.1206999999999, "r": 530.56458, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "23", "bbox": {"l": 536.09601, "t": 631.1206999999999, "r": 547.15875, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "3.6.3", "bbox": {"l": 151.19717, "t": 643.66034, "r": 173.32227, "b": 652.87334, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "Demonstrating data access without RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.85353, "t": 643.66034, "r": 530.55695, "b": 652.87334, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "24", "bbox": {"l": 536.0882, "t": 643.66034, "r": 547.15076, "b": 652.87334, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "3.6.4", "bbox": {"l": 151.19717, "t": 656.14021, "r": 173.35289, "b": 665.35321, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "Defining and creating row permissions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.89182, "t": 656.14021, "r": 530.53412, "b": 665.35321, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "25", "bbox": {"l": 536.073, "t": 656.14021, "r": 547.15088, "b": 665.35321, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "3.6.5", "bbox": {"l": 151.19717, "t": 668.62009, "r": 173.35289, "b": 677.83309, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "Defining and creating column masks", "bbox": {"l": 178.89182, "t": 668.62009, "r": 339.45105, "b": 677.83309, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 344.98996, "t": 668.62009, "r": 530.54413, "b": 677.83309, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "26", "bbox": {"l": 536.08301, "t": 668.62009, "r": 547.16089, "b": 677.83309, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "3.6.6", "bbox": {"l": 151.19717, "t": 681.15973, "r": 173.38359, "b": 690.37273, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "Activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.93019, "t": 681.15973, "r": 530.54102, "b": 690.37273, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "28", "bbox": {"l": 536.08765, "t": 681.15973, "r": 547.18085, "b": 690.37273, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "3.6.7", "bbox": {"l": 151.19717, "t": 693.63961, "r": 173.32332, "b": 702.852615, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Demonstrating data access with RCAC", "bbox": {"l": 178.85486, "t": 693.63961, "r": 350.80011, "b": 702.852615, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 356.33163, "t": 693.63961, "r": 530.57507, "b": 702.852615, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "29", "bbox": {"l": 536.10663, "t": 693.63961, "r": 547.16968, "b": 702.852615, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "3.6.8", "bbox": {"l": 151.19717, "t": 706.119492, "r": 173.44592, "b": 715.332497, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "Demonstrating data access with a view and RCAC . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 179.00812, "t": 706.119492, "r": 530.43628, "b": 715.332497, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "32", "bbox": {"l": 535.99847, "t": 706.119492, "r": 547.12286, "b": 715.332497, "coord_origin": "TOPLEFT"}}], "children": [{"id": 4, "label": "text", "bbox": {"l": 136.8, "t": 132.64862000000005, "r": 172.89404, "b": 141.86163, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 3, "text": "Notices", "bbox": {"l": 136.8, "t": 132.64862000000005, "r": 172.89404, "b": 141.86163, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "text", "bbox": {"l": 175.01952, "t": 132.64862000000005, "r": 547.18982, "b": 141.86163, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 4, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vii", "bbox": {"l": 175.01952, "t": 132.64862000000005, "r": 547.18982, "b": 141.86163, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "text", "bbox": {"l": 136.79901, "t": 145.12847999999997, "r": 189.86537, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 5, "text": "Trademarks", "bbox": {"l": 136.79901, "t": 145.12847999999997, "r": 189.86537, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "text", "bbox": {"l": 195.39685, "t": 145.12847999999997, "r": 530.05121, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 195.39685, "t": 145.12847999999997, "r": 530.05121, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "text", "bbox": {"l": 535.5827, "t": 145.12847999999997, "r": 547.18286, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "viii", "bbox": {"l": 535.5827, "t": 145.12847999999997, "r": 547.18286, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 136.79901, "t": 167.62811, "r": 279.39731, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "DB2 for i Center of Excellence", "bbox": {"l": 136.79901, "t": 167.62811, "r": 279.39731, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "text", "bbox": {"l": 280.61942, "t": 167.62811, "r": 547.1908, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ix", "bbox": {"l": 280.61942, "t": 167.62811, "r": 547.1908, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 136.79901, "t": 190.12775, "r": 172.84424, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "Preface", "bbox": {"l": 136.79901, "t": 190.12775, "r": 172.84424, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 175.01852, "t": 190.12775, "r": 547.18286, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi", "bbox": {"l": 175.01852, "t": 190.12775, "r": 547.18286, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 136.79803, "t": 202.60760000000005, "r": 547.18085, "b": 211.82061999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "Authors . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi", "bbox": {"l": 136.79803, "t": 202.60760000000005, "r": 547.18085, "b": 211.82061999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 136.79803, "t": 215.14721999999995, "r": 339.18292, "b": 224.36023, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "Now you can become a published author, too!", "bbox": {"l": 136.79803, "t": 215.14721999999995, "r": 339.18292, "b": 224.36023, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 344.71411, "t": 215.14721999999995, "r": 530.00812, "b": 224.36023, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 344.71411, "t": 215.14721999999995, "r": 530.00812, "b": 224.36023, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 535.53925, "t": 215.14721999999995, "r": 547.13879, "b": 224.36023, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "xiii", "bbox": {"l": 535.53925, "t": 215.14721999999995, "r": 547.13879, "b": 224.36023, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 136.79803, "t": 227.62707999999998, "r": 529.99506, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "Comments welcome. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 136.79803, "t": 227.62707999999998, "r": 529.99506, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 535.5495, "t": 227.62707999999998, "r": 547.19788, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "xiii", "bbox": {"l": 535.5495, "t": 227.62707999999998, "r": 547.19788, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 136.79807, "t": 240.10693000000003, "r": 284.02866, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "Stay connected to IBM Redbooks", "bbox": {"l": 136.79807, "t": 240.10693000000003, "r": 284.02866, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 289.54449, "t": 240.10693000000003, "r": 529.48242, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 289.54449, "t": 240.10693000000003, "r": 529.48242, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 534.99829, "t": 240.10693000000003, "r": 547.12115, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "xiv", "bbox": {"l": 534.99829, "t": 240.10693000000003, "r": 547.12115, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 136.79807, "t": 262.60657000000003, "r": 373.17566, "b": 271.81958, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "Chapter 1. Securing and protecting IBM DB2 data", "bbox": {"l": 136.79807, "t": 262.60657000000003, "r": 373.17566, "b": 271.81958, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 375.11798, "t": 262.60657000000003, "r": 536.09589, "b": 271.81958, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 375.11798, "t": 262.60657000000003, "r": 536.09589, "b": 271.81958, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 541.64685, "t": 262.60657000000003, "r": 547.19781, "b": 271.81958, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "1", "bbox": {"l": 541.64685, "t": 262.60657000000003, "r": 547.19781, "b": 271.81958, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 136.79808, "t": 274.60637999999994, "r": 150.88702, "b": 283.8194, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "1.1", "bbox": {"l": 136.79808, "t": 274.60637999999994, "r": 150.88702, "b": 283.8194, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 156.5226, "t": 274.60637999999994, "r": 549.84723, "b": 283.8194, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "Security fundamentals. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2", "bbox": {"l": 156.5226, "t": 274.60637999999994, "r": 549.84723, "b": 283.8194, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 136.79807, "t": 287.14606000000003, "r": 150.62746, "b": 296.35904, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "1.2", "bbox": {"l": 136.79807, "t": 287.14606000000003, "r": 150.62746, "b": 296.35904, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 156.15923, "t": 287.14606000000003, "r": 536.12933, "b": 296.35904, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "Current state of IBM i security . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.15923, "t": 287.14606000000003, "r": 536.12933, "b": 296.35904, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 541.66113, "t": 287.14606000000003, "r": 547.19287, "b": 296.35904, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "2", "bbox": {"l": 541.66113, "t": 287.14606000000003, "r": 547.19287, "b": 296.35904, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 136.79807, "t": 299.62595, "r": 150.84943, "b": 308.83893, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "1.3", "bbox": {"l": 136.79807, "t": 299.62595, "r": 150.84943, "b": 308.83893, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 156.46996, "t": 299.62595, "r": 549.84723, "b": 308.83893, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "DB2 for i security controls . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3", "bbox": {"l": 156.46996, "t": 299.62595, "r": 549.84723, "b": 308.83893, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 151.1972, "t": 312.1058300000001, "r": 173.38289, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "1.3.1", "bbox": {"l": 151.1972, "t": 312.1058300000001, "r": 173.38289, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 178.92932, "t": 312.1058300000001, "r": 536.05511, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "Existing row and column control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.92932, "t": 312.1058300000001, "r": 536.05511, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 541.6015, "t": 312.1058300000001, "r": 547.14795, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "4", "bbox": {"l": 541.6015, "t": 312.1058300000001, "r": 547.14795, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 151.1972, "t": 324.64548, "r": 173.4189, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "1.3.2", "bbox": {"l": 151.1972, "t": 324.64548, "r": 173.4189, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 178.97432, "t": 324.64548, "r": 536.08008, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "New controls: Row and Column Access Control. . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.97432, "t": 324.64548, "r": 536.08008, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 541.6355, "t": 324.64548, "r": 547.19092, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "5", "bbox": {"l": 541.6355, "t": 324.64548, "r": 547.19092, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 136.79704, "t": 347.14511, "r": 336.82071, "b": 356.35809, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "Chapter 2. Roles and separation of duties", "bbox": {"l": 136.79704, "t": 347.14511, "r": 336.82071, "b": 356.35809, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 338.99701, "t": 347.14511, "r": 536.09088, "b": 356.35809, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 338.99701, "t": 347.14511, "r": 536.09088, "b": 356.35809, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 541.64282, "t": 347.14511, "r": 547.19476, "b": 356.35809, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "7", "bbox": {"l": 541.64282, "t": 347.14511, "r": 547.19476, "b": 356.35809, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 136.79704, "t": 359.14493, "r": 150.644, "b": 368.35791, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "2.1", "bbox": {"l": 136.79704, "t": 359.14493, "r": 150.644, "b": 368.35791, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 156.18277, "t": 359.14493, "r": 536.12714, "b": 368.35791, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "Roles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.18277, "t": 359.14493, "r": 536.12714, "b": 368.35791, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 541.66589, "t": 359.14493, "r": 547.20471, "b": 368.35791, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "8", "bbox": {"l": 541.66589, "t": 359.14493, "r": 547.20471, "b": 368.35791, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 151.1972, "t": 371.62482, "r": 173.60995, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "2.1.1", "bbox": {"l": 151.1972, "t": 371.62482, "r": 173.60995, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 176.41154, "t": 371.62482, "r": 535.9527, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "DDM and DRDA application server access: QIBM_DB_DDMDRDA . . . . . . . . . . .", "bbox": {"l": 176.41154, "t": 371.62482, "r": 535.9527, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 541.55585, "t": 371.62482, "r": 547.15906, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "8", "bbox": {"l": 541.55585, "t": 371.62482, "r": 547.15906, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 151.1972, "t": 384.10470999999995, "r": 173.41664, "b": 393.31769, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "2.1.2", "bbox": {"l": 151.1972, "t": 384.10470999999995, "r": 173.41664, "b": 393.31769, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 178.97151, "t": 384.10470999999995, "r": 536.04108, "b": 393.31769, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "Toolbox application server access: QIBM_DB_ZDA. . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.97151, "t": 384.10470999999995, "r": 536.04108, "b": 393.31769, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 541.59595, "t": 384.10470999999995, "r": 547.15082, "b": 393.31769, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "8", "bbox": {"l": 541.59595, "t": 384.10470999999995, "r": 547.15082, "b": 393.31769, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 151.1972, "t": 396.64435, "r": 173.41859, "b": 405.85733, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "2.1.3", "bbox": {"l": 151.1972, "t": 396.64435, "r": 173.41859, "b": 405.85733, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 178.97394, "t": 396.64435, "r": 536.07489, "b": 405.85733, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "Database Administrator function: QIBM_DB_SQLADM . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.97394, "t": 396.64435, "r": 536.07489, "b": 405.85733, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 541.63025, "t": 396.64435, "r": 547.18561, "b": 405.85733, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "9", "bbox": {"l": 541.63025, "t": 396.64435, "r": 547.18561, "b": 405.85733, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 151.1972, "t": 409.12424000000004, "r": 173.38629, "b": 418.33722, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "2.1.4", "bbox": {"l": 151.1972, "t": 409.12424000000004, "r": 173.38629, "b": 418.33722, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 178.93356, "t": 409.12424000000004, "r": 411.27048, "b": 418.33722, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "Database Information function: QIBM_DB_SYSMON", "bbox": {"l": 178.93356, "t": 409.12424000000004, "r": 411.27048, "b": 418.33722, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 416.81775, "t": 409.12424000000004, "r": 536.08411, "b": 418.33722, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": ". . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 416.81775, "t": 409.12424000000004, "r": 536.08411, "b": 418.33722, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 541.63135, "t": 409.12424000000004, "r": 547.17865, "b": 418.33722, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "9", "bbox": {"l": 541.63135, "t": 409.12424000000004, "r": 547.17865, "b": 418.33722, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 151.1972, "t": 421.60413, "r": 173.44926, "b": 430.81711, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "2.1.5", "bbox": {"l": 151.1972, "t": 421.60413, "r": 173.44926, "b": 430.81711, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 179.01228, "t": 421.60413, "r": 536.03589, "b": 430.81711, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "Security Administrator function: QIBM_DB_SECADM . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 179.01228, "t": 421.60413, "r": 536.03589, "b": 430.81711, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 541.59894, "t": 421.60413, "r": 547.16193, "b": 430.81711, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "9", "bbox": {"l": 541.59894, "t": 421.60413, "r": 547.16193, "b": 430.81711, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 151.1972, "t": 434.1437700000001, "r": 173.32208, "b": 443.35675, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "2.1.6", "bbox": {"l": 151.1972, "t": 434.1437700000001, "r": 173.32208, "b": 443.35675, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 178.8533, "t": 434.1437700000001, "r": 530.57318, "b": 443.35675, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "Change Function Usage CL command . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.8533, "t": 434.1437700000001, "r": 530.57318, "b": 443.35675, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 536.10443, "t": 434.1437700000001, "r": 547.16687, "b": 443.35675, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "10", "bbox": {"l": 536.10443, "t": 434.1437700000001, "r": 547.16687, "b": 443.35675, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 151.1972, "t": 446.62366, "r": 173.35822, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "2.1.7", "bbox": {"l": 151.1972, "t": 446.62366, "r": 173.35822, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 178.89848, "t": 446.62366, "r": 530.53522, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "Verifying function usage IDs for RCAC with the FUNCTION_USAGE view . . . . .", "bbox": {"l": 178.89848, "t": 446.62366, "r": 530.53522, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 536.0755, "t": 446.62366, "r": 547.15601, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "10", "bbox": {"l": 536.0755, "t": 446.62366, "r": 547.15601, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 136.79704, "t": 459.10355, "r": 150.85457, "b": 468.31653, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "2.2", "bbox": {"l": 136.79704, "t": 459.10355, "r": 150.85457, "b": 468.31653, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 156.47758, "t": 459.10355, "r": 547.25659, "b": 468.31653, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "Separation of duties . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10", "bbox": {"l": 156.47758, "t": 459.10355, "r": 547.25659, "b": 468.31653, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 136.79703, "t": 481.60318, "r": 348.68503, "b": 490.81616, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "Chapter 3. Row and Column Access Control", "bbox": {"l": 136.79703, "t": 481.60318, "r": 348.68503, "b": 490.81616, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 350.09741, "t": 481.60318, "r": 530.53961, "b": 490.81616, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 350.09741, "t": 481.60318, "r": 530.53961, "b": 490.81616, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 536.09167, "t": 481.60318, "r": 547.1958, "b": 490.81616, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "13", "bbox": {"l": 536.09167, "t": 481.60318, "r": 547.1958, "b": 490.81616, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 136.79703, "t": 493.603, "r": 150.70105, "b": 502.81598, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "3.1", "bbox": {"l": 136.79703, "t": 493.603, "r": 150.70105, "b": 502.81598, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 156.26266, "t": 493.603, "r": 530.4809, "b": 502.81598, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "Explanation of RCAC and the concept of access control . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.26266, "t": 493.603, "r": 530.4809, "b": 502.81598, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 536.04248, "t": 493.603, "r": 547.16571, "b": 502.81598, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "14", "bbox": {"l": 536.04248, "t": 493.603, "r": 547.16571, "b": 502.81598, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 151.19719, "t": 506.14264, "r": 173.35429, "b": 515.35562, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "3.1.1", "bbox": {"l": 151.19719, "t": 506.14264, "r": 173.35429, "b": 515.35562, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 178.89357, "t": 506.14264, "r": 378.20786, "b": 515.35562, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "Row permission and column mask definitions", "bbox": {"l": 178.89357, "t": 506.14264, "r": 378.20786, "b": 515.35562, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 383.74713, "t": 506.14264, "r": 530.5379, "b": 515.35562, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 383.74713, "t": 506.14264, "r": 530.5379, "b": 515.35562, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 536.07721, "t": 506.14264, "r": 547.15576, "b": 515.35562, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "14", "bbox": {"l": 536.07721, "t": 506.14264, "r": 547.15576, "b": 515.35562, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 151.19719, "t": 518.62253, "r": 173.44292, "b": 527.83551, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "3.1.2", "bbox": {"l": 151.19719, "t": 518.62253, "r": 173.44292, "b": 527.83551, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 179.00435, "t": 518.62253, "r": 530.43475, "b": 527.83551, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "Enabling and activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 179.00435, "t": 518.62253, "r": 530.43475, "b": 527.83551, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 535.99622, "t": 518.62253, "r": 547.11908, "b": 527.83551, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "16", "bbox": {"l": 535.99622, "t": 518.62253, "r": 547.11908, "b": 527.83551, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 136.79703, "t": 531.1621700000001, "r": 150.64432, "b": 540.37517, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "3.2", "bbox": {"l": 136.79703, "t": 531.1621700000001, "r": 150.64432, "b": 540.37517, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 156.18323, "t": 531.1621700000001, "r": 530.52808, "b": 540.37517, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "Special registers and built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.18323, "t": 531.1621700000001, "r": 530.52808, "b": 540.37517, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 536.06702, "t": 531.1621700000001, "r": 547.14484, "b": 540.37517, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "18", "bbox": {"l": 536.06702, "t": 531.1621700000001, "r": 547.14484, "b": 540.37517, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 151.19719, "t": 543.64204, "r": 173.41321, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "3.2.1", "bbox": {"l": 151.19719, "t": 543.64204, "r": 173.41321, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 178.96722, "t": 543.64204, "r": 530.49786, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "Special registers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.96722, "t": 543.64204, "r": 530.49786, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 536.05188, "t": 543.64204, "r": 547.15991, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "18", "bbox": {"l": 536.05188, "t": 543.64204, "r": 547.15991, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 151.19719, "t": 556.12192, "r": 173.35269, "b": 565.33492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "3.2.2", "bbox": {"l": 151.19719, "t": 556.12192, "r": 173.35269, "b": 565.33492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 178.89156, "t": 556.12192, "r": 530.56024, "b": 565.33492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "Built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.89156, "t": 556.12192, "r": 530.56024, "b": 565.33492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 536.09912, "t": 556.12192, "r": 547.17688, "b": 565.33492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "19", "bbox": {"l": 536.09912, "t": 556.12192, "r": 547.17688, "b": 565.33492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 136.79703, "t": 568.66156, "r": 150.62514, "b": 577.87456, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "3.3", "bbox": {"l": 136.79703, "t": 568.66156, "r": 150.62514, "b": 577.87456, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 156.15639, "t": 568.66156, "r": 530.53027, "b": 577.87456, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "VERIFY_GROUP_FOR_USER function . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.15639, "t": 568.66156, "r": 530.53027, "b": 577.87456, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 536.06152, "t": 568.66156, "r": 547.12402, "b": 577.87456, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "20", "bbox": {"l": 536.06152, "t": 568.66156, "r": 547.12402, "b": 577.87456, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 136.79703, "t": 581.14143, "r": 150.63004, "b": 590.35443, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "3.4", "bbox": {"l": 136.79703, "t": 581.14143, "r": 150.63004, "b": 590.35443, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 156.16325, "t": 581.14143, "r": 530.62994, "b": 590.35443, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "Establishing and controlling accessibility by using the RCAC rule text . . . . . . . . . . . . .", "bbox": {"l": 156.16325, "t": 581.14143, "r": 530.62994, "b": 590.35443, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 536.16315, "t": 581.14143, "r": 547.22955, "b": 590.35443, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "21", "bbox": {"l": 536.16315, "t": 581.14143, "r": 547.22955, "b": 590.35443, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 136.79701, "t": 593.62131, "r": 150.64413, "b": 602.8343, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "3.5", "bbox": {"l": 136.79701, "t": 593.62131, "r": 150.64413, "b": 602.8343, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 156.18298, "t": 593.62131, "r": 394.7818, "b": 602.8343, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "SELECT, INSERT, and UPDATE behavior with RCAC", "bbox": {"l": 156.18298, "t": 593.62131, "r": 394.7818, "b": 602.8343, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 400.32065, "t": 593.62131, "r": 530.48358, "b": 602.8343, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": ". . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 400.32065, "t": 593.62131, "r": 530.48358, "b": 602.8343, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 536.0224, "t": 593.62131, "r": 547.1001, "b": 602.8343, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "22", "bbox": {"l": 536.0224, "t": 593.62131, "r": 547.1001, "b": 602.8343, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 136.79701, "t": 606.16095, "r": 150.6642, "b": 615.37395, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "3.6", "bbox": {"l": 136.79701, "t": 606.16095, "r": 150.6642, "b": 615.37395, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 156.21107, "t": 606.16095, "r": 530.56512, "b": 615.37395, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "Human resources example . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.21107, "t": 606.16095, "r": 530.56512, "b": 615.37395, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 536.112, "t": 606.16095, "r": 547.20575, "b": 615.37395, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "22", "bbox": {"l": 536.112, "t": 606.16095, "r": 547.20575, "b": 615.37395, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 151.19717, "t": 618.64082, "r": 173.41692, "b": 627.85382, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "3.6.1", "bbox": {"l": 151.19717, "t": 618.64082, "r": 173.41692, "b": 627.85382, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 178.97185, "t": 618.64082, "r": 530.49139, "b": 627.85382, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": "Assigning the QIBM_DB_SECADM function ID to the consultants. . . . . . . . . . . .", "bbox": {"l": 178.97185, "t": 618.64082, "r": 530.49139, "b": 627.85382, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 536.04633, "t": 618.64082, "r": 547.15619, "b": 627.85382, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "23", "bbox": {"l": 536.04633, "t": 618.64082, "r": 547.15619, "b": 627.85382, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 151.19717, "t": 631.1206999999999, "r": 173.32271, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "3.6.2", "bbox": {"l": 151.19717, "t": 631.1206999999999, "r": 173.32271, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 178.8541, "t": 631.1206999999999, "r": 530.56458, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": "Creating group profiles for the users and their roles . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.8541, "t": 631.1206999999999, "r": 530.56458, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 536.09601, "t": 631.1206999999999, "r": 547.15875, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 107, "text": "23", "bbox": {"l": 536.09601, "t": 631.1206999999999, "r": 547.15875, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 151.19717, "t": 643.66034, "r": 173.32227, "b": 652.87334, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 108, "text": "3.6.3", "bbox": {"l": 151.19717, "t": 643.66034, "r": 173.32227, "b": 652.87334, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 178.85353, "t": 643.66034, "r": 530.55695, "b": 652.87334, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 109, "text": "Demonstrating data access without RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.85353, "t": 643.66034, "r": 530.55695, "b": 652.87334, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 536.0882, "t": 643.66034, "r": 547.15076, "b": 652.87334, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 110, "text": "24", "bbox": {"l": 536.0882, "t": 643.66034, "r": 547.15076, "b": 652.87334, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 151.19717, "t": 656.14021, "r": 173.35289, "b": 665.35321, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 111, "text": "3.6.4", "bbox": {"l": 151.19717, "t": 656.14021, "r": 173.35289, "b": 665.35321, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 178.89182, "t": 656.14021, "r": 530.53412, "b": 665.35321, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 112, "text": "Defining and creating row permissions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.89182, "t": 656.14021, "r": 530.53412, "b": 665.35321, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 114, "label": "text", "bbox": {"l": 536.073, "t": 656.14021, "r": 547.15088, "b": 665.35321, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 113, "text": "25", "bbox": {"l": 536.073, "t": 656.14021, "r": 547.15088, "b": 665.35321, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 115, "label": "text", "bbox": {"l": 151.19717, "t": 668.62009, "r": 173.35289, "b": 677.83309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 114, "text": "3.6.5", "bbox": {"l": 151.19717, "t": 668.62009, "r": 173.35289, "b": 677.83309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 116, "label": "text", "bbox": {"l": 178.89182, "t": 668.62009, "r": 339.45105, "b": 677.83309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 115, "text": "Defining and creating column masks", "bbox": {"l": 178.89182, "t": 668.62009, "r": 339.45105, "b": 677.83309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 117, "label": "text", "bbox": {"l": 344.98996, "t": 668.62009, "r": 530.54413, "b": 677.83309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 116, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 344.98996, "t": 668.62009, "r": 530.54413, "b": 677.83309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 118, "label": "text", "bbox": {"l": 536.08301, "t": 668.62009, "r": 547.16089, "b": 677.83309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 117, "text": "26", "bbox": {"l": 536.08301, "t": 668.62009, "r": 547.16089, "b": 677.83309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 119, "label": "text", "bbox": {"l": 151.19717, "t": 681.15973, "r": 173.38359, "b": 690.37273, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 118, "text": "3.6.6", "bbox": {"l": 151.19717, "t": 681.15973, "r": 173.38359, "b": 690.37273, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 120, "label": "text", "bbox": {"l": 178.93019, "t": 681.15973, "r": 530.54102, "b": 690.37273, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 119, "text": "Activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.93019, "t": 681.15973, "r": 530.54102, "b": 690.37273, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 121, "label": "text", "bbox": {"l": 536.08765, "t": 681.15973, "r": 547.18085, "b": 690.37273, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 120, "text": "28", "bbox": {"l": 536.08765, "t": 681.15973, "r": 547.18085, "b": 690.37273, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 122, "label": "text", "bbox": {"l": 151.19717, "t": 693.63961, "r": 173.32332, "b": 702.852615, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 121, "text": "3.6.7", "bbox": {"l": 151.19717, "t": 693.63961, "r": 173.32332, "b": 702.852615, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 123, "label": "text", "bbox": {"l": 178.85486, "t": 693.63961, "r": 350.80011, "b": 702.852615, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 122, "text": "Demonstrating data access with RCAC", "bbox": {"l": 178.85486, "t": 693.63961, "r": 350.80011, "b": 702.852615, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 124, "label": "text", "bbox": {"l": 356.33163, "t": 693.63961, "r": 530.57507, "b": 702.852615, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 123, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 356.33163, "t": 693.63961, "r": 530.57507, "b": 702.852615, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 125, "label": "text", "bbox": {"l": 536.10663, "t": 693.63961, "r": 547.16968, "b": 702.852615, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 124, "text": "29", "bbox": {"l": 536.10663, "t": 693.63961, "r": 547.16968, "b": 702.852615, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 126, "label": "text", "bbox": {"l": 151.19717, "t": 706.119492, "r": 173.44592, "b": 715.332497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 125, "text": "3.6.8", "bbox": {"l": 151.19717, "t": 706.119492, "r": 173.44592, "b": 715.332497, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 127, "label": "text", "bbox": {"l": 179.00812, "t": 706.119492, "r": 530.43628, "b": 715.332497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 126, "text": "Demonstrating data access with a view and RCAC . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 179.00812, "t": 706.119492, "r": 530.43628, "b": 715.332497, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 128, "label": "text", "bbox": {"l": 535.99847, "t": 706.119492, "r": 547.12286, "b": 715.332497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 127, "text": "32", "bbox": {"l": 535.99847, "t": 706.119492, "r": 547.12286, "b": 715.332497, "coord_origin": "TOPLEFT"}}], "children": []}]}]}, "tablestructure": {"table_map": {"0": {"label": "document_index", "id": 0, "page_no": 1, "cluster": {"id": 0, "label": "document_index", "bbox": {"l": 136.1495819091797, "t": 132.0330352783203, "r": 547.52685546875, "b": 715.6515502929688, "coord_origin": "TOPLEFT"}, "confidence": 0.9803680181503296, "cells": [{"id": 3, "text": "Notices", "bbox": {"l": 136.8, "t": 132.64862000000005, "r": 172.89404, "b": 141.86163, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vii", "bbox": {"l": 175.01952, "t": 132.64862000000005, "r": 547.18982, "b": 141.86163, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Trademarks", "bbox": {"l": 136.79901, "t": 145.12847999999997, "r": 189.86537, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 195.39685, "t": 145.12847999999997, "r": 530.05121, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "viii", "bbox": {"l": 535.5827, "t": 145.12847999999997, "r": 547.18286, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "DB2 for i Center of Excellence", "bbox": {"l": 136.79901, "t": 167.62811, "r": 279.39731, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ix", "bbox": {"l": 280.61942, "t": 167.62811, "r": 547.1908, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Preface", "bbox": {"l": 136.79901, "t": 190.12775, "r": 172.84424, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi", "bbox": {"l": 175.01852, "t": 190.12775, "r": 547.18286, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Authors . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi", "bbox": {"l": 136.79803, "t": 202.60760000000005, "r": 547.18085, "b": 211.82061999999996, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Now you can become a published author, too!", "bbox": {"l": 136.79803, "t": 215.14721999999995, "r": 339.18292, "b": 224.36023, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 344.71411, "t": 215.14721999999995, "r": 530.00812, "b": 224.36023, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "xiii", "bbox": {"l": 535.53925, "t": 215.14721999999995, "r": 547.13879, "b": 224.36023, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Comments welcome. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 136.79803, "t": 227.62707999999998, "r": 529.99506, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "xiii", "bbox": {"l": 535.5495, "t": 227.62707999999998, "r": 547.19788, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Stay connected to IBM Redbooks", "bbox": {"l": 136.79807, "t": 240.10693000000003, "r": 284.02866, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 289.54449, "t": 240.10693000000003, "r": 529.48242, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "xiv", "bbox": {"l": 534.99829, "t": 240.10693000000003, "r": 547.12115, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Chapter 1. Securing and protecting IBM DB2 data", "bbox": {"l": 136.79807, "t": 262.60657000000003, "r": 373.17566, "b": 271.81958, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 375.11798, "t": 262.60657000000003, "r": 536.09589, "b": 271.81958, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "1", "bbox": {"l": 541.64685, "t": 262.60657000000003, "r": 547.19781, "b": 271.81958, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "1.1", "bbox": {"l": 136.79808, "t": 274.60637999999994, "r": 150.88702, "b": 283.8194, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "Security fundamentals. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2", "bbox": {"l": 156.5226, "t": 274.60637999999994, "r": 549.84723, "b": 283.8194, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "1.2", "bbox": {"l": 136.79807, "t": 287.14606000000003, "r": 150.62746, "b": 296.35904, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Current state of IBM i security . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.15923, "t": 287.14606000000003, "r": 536.12933, "b": 296.35904, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "2", "bbox": {"l": 541.66113, "t": 287.14606000000003, "r": 547.19287, "b": 296.35904, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "1.3", "bbox": {"l": 136.79807, "t": 299.62595, "r": 150.84943, "b": 308.83893, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "DB2 for i security controls . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3", "bbox": {"l": 156.46996, "t": 299.62595, "r": 549.84723, "b": 308.83893, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "1.3.1", "bbox": {"l": 151.1972, "t": 312.1058300000001, "r": 173.38289, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Existing row and column control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.92932, "t": 312.1058300000001, "r": 536.05511, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "4", "bbox": {"l": 541.6015, "t": 312.1058300000001, "r": 547.14795, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "1.3.2", "bbox": {"l": 151.1972, "t": 324.64548, "r": 173.4189, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "New controls: Row and Column Access Control. . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.97432, "t": 324.64548, "r": 536.08008, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "5", "bbox": {"l": 541.6355, "t": 324.64548, "r": 547.19092, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "Chapter 2. Roles and separation of duties", "bbox": {"l": 136.79704, "t": 347.14511, "r": 336.82071, "b": 356.35809, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 338.99701, "t": 347.14511, "r": 536.09088, "b": 356.35809, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "7", "bbox": {"l": 541.64282, "t": 347.14511, "r": 547.19476, "b": 356.35809, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "2.1", "bbox": {"l": 136.79704, "t": 359.14493, "r": 150.644, "b": 368.35791, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Roles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.18277, "t": 359.14493, "r": 536.12714, "b": 368.35791, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "8", "bbox": {"l": 541.66589, "t": 359.14493, "r": 547.20471, "b": 368.35791, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "2.1.1", "bbox": {"l": 151.1972, "t": 371.62482, "r": 173.60995, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "DDM and DRDA application server access: QIBM_DB_DDMDRDA . . . . . . . . . . .", "bbox": {"l": 176.41154, "t": 371.62482, "r": 535.9527, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "8", "bbox": {"l": 541.55585, "t": 371.62482, "r": 547.15906, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "2.1.2", "bbox": {"l": 151.1972, "t": 384.10470999999995, "r": 173.41664, "b": 393.31769, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "Toolbox application server access: QIBM_DB_ZDA. . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.97151, "t": 384.10470999999995, "r": 536.04108, "b": 393.31769, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "8", "bbox": {"l": 541.59595, "t": 384.10470999999995, "r": 547.15082, "b": 393.31769, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "2.1.3", "bbox": {"l": 151.1972, "t": 396.64435, "r": 173.41859, "b": 405.85733, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Database Administrator function: QIBM_DB_SQLADM . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.97394, "t": 396.64435, "r": 536.07489, "b": 405.85733, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "9", "bbox": {"l": 541.63025, "t": 396.64435, "r": 547.18561, "b": 405.85733, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "2.1.4", "bbox": {"l": 151.1972, "t": 409.12424000000004, "r": 173.38629, "b": 418.33722, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Database Information function: QIBM_DB_SYSMON", "bbox": {"l": 178.93356, "t": 409.12424000000004, "r": 411.27048, "b": 418.33722, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": ". . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 416.81775, "t": 409.12424000000004, "r": 536.08411, "b": 418.33722, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "9", "bbox": {"l": 541.63135, "t": 409.12424000000004, "r": 547.17865, "b": 418.33722, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "2.1.5", "bbox": {"l": 151.1972, "t": 421.60413, "r": 173.44926, "b": 430.81711, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Security Administrator function: QIBM_DB_SECADM . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 179.01228, "t": 421.60413, "r": 536.03589, "b": 430.81711, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "9", "bbox": {"l": 541.59894, "t": 421.60413, "r": 547.16193, "b": 430.81711, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "2.1.6", "bbox": {"l": 151.1972, "t": 434.1437700000001, "r": 173.32208, "b": 443.35675, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Change Function Usage CL command . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.8533, "t": 434.1437700000001, "r": 530.57318, "b": 443.35675, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "10", "bbox": {"l": 536.10443, "t": 434.1437700000001, "r": 547.16687, "b": 443.35675, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "2.1.7", "bbox": {"l": 151.1972, "t": 446.62366, "r": 173.35822, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "Verifying function usage IDs for RCAC with the FUNCTION_USAGE view . . . . .", "bbox": {"l": 178.89848, "t": 446.62366, "r": 530.53522, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "10", "bbox": {"l": 536.0755, "t": 446.62366, "r": 547.15601, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "2.2", "bbox": {"l": 136.79704, "t": 459.10355, "r": 150.85457, "b": 468.31653, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "Separation of duties . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10", "bbox": {"l": 156.47758, "t": 459.10355, "r": 547.25659, "b": 468.31653, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "Chapter 3. Row and Column Access Control", "bbox": {"l": 136.79703, "t": 481.60318, "r": 348.68503, "b": 490.81616, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 350.09741, "t": 481.60318, "r": 530.53961, "b": 490.81616, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "13", "bbox": {"l": 536.09167, "t": 481.60318, "r": 547.1958, "b": 490.81616, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "3.1", "bbox": {"l": 136.79703, "t": 493.603, "r": 150.70105, "b": 502.81598, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Explanation of RCAC and the concept of access control . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.26266, "t": 493.603, "r": 530.4809, "b": 502.81598, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "14", "bbox": {"l": 536.04248, "t": 493.603, "r": 547.16571, "b": 502.81598, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "3.1.1", "bbox": {"l": 151.19719, "t": 506.14264, "r": 173.35429, "b": 515.35562, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "Row permission and column mask definitions", "bbox": {"l": 178.89357, "t": 506.14264, "r": 378.20786, "b": 515.35562, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 383.74713, "t": 506.14264, "r": 530.5379, "b": 515.35562, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "14", "bbox": {"l": 536.07721, "t": 506.14264, "r": 547.15576, "b": 515.35562, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "3.1.2", "bbox": {"l": 151.19719, "t": 518.62253, "r": 173.44292, "b": 527.83551, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "Enabling and activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 179.00435, "t": 518.62253, "r": 530.43475, "b": 527.83551, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "16", "bbox": {"l": 535.99622, "t": 518.62253, "r": 547.11908, "b": 527.83551, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "3.2", "bbox": {"l": 136.79703, "t": 531.1621700000001, "r": 150.64432, "b": 540.37517, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Special registers and built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.18323, "t": 531.1621700000001, "r": 530.52808, "b": 540.37517, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "18", "bbox": {"l": 536.06702, "t": 531.1621700000001, "r": 547.14484, "b": 540.37517, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "3.2.1", "bbox": {"l": 151.19719, "t": 543.64204, "r": 173.41321, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "Special registers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.96722, "t": 543.64204, "r": 530.49786, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "18", "bbox": {"l": 536.05188, "t": 543.64204, "r": 547.15991, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "3.2.2", "bbox": {"l": 151.19719, "t": 556.12192, "r": 173.35269, "b": 565.33492, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.89156, "t": 556.12192, "r": 530.56024, "b": 565.33492, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "19", "bbox": {"l": 536.09912, "t": 556.12192, "r": 547.17688, "b": 565.33492, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "3.3", "bbox": {"l": 136.79703, "t": 568.66156, "r": 150.62514, "b": 577.87456, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "VERIFY_GROUP_FOR_USER function . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.15639, "t": 568.66156, "r": 530.53027, "b": 577.87456, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "20", "bbox": {"l": 536.06152, "t": 568.66156, "r": 547.12402, "b": 577.87456, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "3.4", "bbox": {"l": 136.79703, "t": 581.14143, "r": 150.63004, "b": 590.35443, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "Establishing and controlling accessibility by using the RCAC rule text . . . . . . . . . . . . .", "bbox": {"l": 156.16325, "t": 581.14143, "r": 530.62994, "b": 590.35443, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "21", "bbox": {"l": 536.16315, "t": 581.14143, "r": 547.22955, "b": 590.35443, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "3.5", "bbox": {"l": 136.79701, "t": 593.62131, "r": 150.64413, "b": 602.8343, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "SELECT, INSERT, and UPDATE behavior with RCAC", "bbox": {"l": 156.18298, "t": 593.62131, "r": 394.7818, "b": 602.8343, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": ". . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 400.32065, "t": 593.62131, "r": 530.48358, "b": 602.8343, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "22", "bbox": {"l": 536.0224, "t": 593.62131, "r": 547.1001, "b": 602.8343, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "3.6", "bbox": {"l": 136.79701, "t": 606.16095, "r": 150.6642, "b": 615.37395, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "Human resources example . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.21107, "t": 606.16095, "r": 530.56512, "b": 615.37395, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "22", "bbox": {"l": 536.112, "t": 606.16095, "r": 547.20575, "b": 615.37395, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "3.6.1", "bbox": {"l": 151.19717, "t": 618.64082, "r": 173.41692, "b": 627.85382, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "Assigning the QIBM_DB_SECADM function ID to the consultants. . . . . . . . . . . .", "bbox": {"l": 178.97185, "t": 618.64082, "r": 530.49139, "b": 627.85382, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "23", "bbox": {"l": 536.04633, "t": 618.64082, "r": 547.15619, "b": 627.85382, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "3.6.2", "bbox": {"l": 151.19717, "t": 631.1206999999999, "r": 173.32271, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "Creating group profiles for the users and their roles . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.8541, "t": 631.1206999999999, "r": 530.56458, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "23", "bbox": {"l": 536.09601, "t": 631.1206999999999, "r": 547.15875, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "3.6.3", "bbox": {"l": 151.19717, "t": 643.66034, "r": 173.32227, "b": 652.87334, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "Demonstrating data access without RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.85353, "t": 643.66034, "r": 530.55695, "b": 652.87334, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "24", "bbox": {"l": 536.0882, "t": 643.66034, "r": 547.15076, "b": 652.87334, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "3.6.4", "bbox": {"l": 151.19717, "t": 656.14021, "r": 173.35289, "b": 665.35321, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "Defining and creating row permissions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.89182, "t": 656.14021, "r": 530.53412, "b": 665.35321, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "25", "bbox": {"l": 536.073, "t": 656.14021, "r": 547.15088, "b": 665.35321, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "3.6.5", "bbox": {"l": 151.19717, "t": 668.62009, "r": 173.35289, "b": 677.83309, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "Defining and creating column masks", "bbox": {"l": 178.89182, "t": 668.62009, "r": 339.45105, "b": 677.83309, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 344.98996, "t": 668.62009, "r": 530.54413, "b": 677.83309, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "26", "bbox": {"l": 536.08301, "t": 668.62009, "r": 547.16089, "b": 677.83309, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "3.6.6", "bbox": {"l": 151.19717, "t": 681.15973, "r": 173.38359, "b": 690.37273, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "Activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.93019, "t": 681.15973, "r": 530.54102, "b": 690.37273, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "28", "bbox": {"l": 536.08765, "t": 681.15973, "r": 547.18085, "b": 690.37273, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "3.6.7", "bbox": {"l": 151.19717, "t": 693.63961, "r": 173.32332, "b": 702.852615, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Demonstrating data access with RCAC", "bbox": {"l": 178.85486, "t": 693.63961, "r": 350.80011, "b": 702.852615, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 356.33163, "t": 693.63961, "r": 530.57507, "b": 702.852615, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "29", "bbox": {"l": 536.10663, "t": 693.63961, "r": 547.16968, "b": 702.852615, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "3.6.8", "bbox": {"l": 151.19717, "t": 706.119492, "r": 173.44592, "b": 715.332497, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "Demonstrating data access with a view and RCAC . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 179.00812, "t": 706.119492, "r": 530.43628, "b": 715.332497, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "32", "bbox": {"l": 535.99847, "t": 706.119492, "r": 547.12286, "b": 715.332497, "coord_origin": "TOPLEFT"}}], "children": [{"id": 4, "label": "text", "bbox": {"l": 136.8, "t": 132.64862000000005, "r": 172.89404, "b": 141.86163, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 3, "text": "Notices", "bbox": {"l": 136.8, "t": 132.64862000000005, "r": 172.89404, "b": 141.86163, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "text", "bbox": {"l": 175.01952, "t": 132.64862000000005, "r": 547.18982, "b": 141.86163, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 4, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vii", "bbox": {"l": 175.01952, "t": 132.64862000000005, "r": 547.18982, "b": 141.86163, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "text", "bbox": {"l": 136.79901, "t": 145.12847999999997, "r": 189.86537, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 5, "text": "Trademarks", "bbox": {"l": 136.79901, "t": 145.12847999999997, "r": 189.86537, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "text", "bbox": {"l": 195.39685, "t": 145.12847999999997, "r": 530.05121, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 195.39685, "t": 145.12847999999997, "r": 530.05121, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "text", "bbox": {"l": 535.5827, "t": 145.12847999999997, "r": 547.18286, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "viii", "bbox": {"l": 535.5827, "t": 145.12847999999997, "r": 547.18286, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 136.79901, "t": 167.62811, "r": 279.39731, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "DB2 for i Center of Excellence", "bbox": {"l": 136.79901, "t": 167.62811, "r": 279.39731, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "text", "bbox": {"l": 280.61942, "t": 167.62811, "r": 547.1908, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ix", "bbox": {"l": 280.61942, "t": 167.62811, "r": 547.1908, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 136.79901, "t": 190.12775, "r": 172.84424, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "Preface", "bbox": {"l": 136.79901, "t": 190.12775, "r": 172.84424, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 175.01852, "t": 190.12775, "r": 547.18286, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi", "bbox": {"l": 175.01852, "t": 190.12775, "r": 547.18286, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 136.79803, "t": 202.60760000000005, "r": 547.18085, "b": 211.82061999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "Authors . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi", "bbox": {"l": 136.79803, "t": 202.60760000000005, "r": 547.18085, "b": 211.82061999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 136.79803, "t": 215.14721999999995, "r": 339.18292, "b": 224.36023, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "Now you can become a published author, too!", "bbox": {"l": 136.79803, "t": 215.14721999999995, "r": 339.18292, "b": 224.36023, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 344.71411, "t": 215.14721999999995, "r": 530.00812, "b": 224.36023, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 344.71411, "t": 215.14721999999995, "r": 530.00812, "b": 224.36023, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 535.53925, "t": 215.14721999999995, "r": 547.13879, "b": 224.36023, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "xiii", "bbox": {"l": 535.53925, "t": 215.14721999999995, "r": 547.13879, "b": 224.36023, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 136.79803, "t": 227.62707999999998, "r": 529.99506, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "Comments welcome. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 136.79803, "t": 227.62707999999998, "r": 529.99506, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 535.5495, "t": 227.62707999999998, "r": 547.19788, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "xiii", "bbox": {"l": 535.5495, "t": 227.62707999999998, "r": 547.19788, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 136.79807, "t": 240.10693000000003, "r": 284.02866, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "Stay connected to IBM Redbooks", "bbox": {"l": 136.79807, "t": 240.10693000000003, "r": 284.02866, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 289.54449, "t": 240.10693000000003, "r": 529.48242, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 289.54449, "t": 240.10693000000003, "r": 529.48242, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 534.99829, "t": 240.10693000000003, "r": 547.12115, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "xiv", "bbox": {"l": 534.99829, "t": 240.10693000000003, "r": 547.12115, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 136.79807, "t": 262.60657000000003, "r": 373.17566, "b": 271.81958, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "Chapter 1. Securing and protecting IBM DB2 data", "bbox": {"l": 136.79807, "t": 262.60657000000003, "r": 373.17566, "b": 271.81958, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 375.11798, "t": 262.60657000000003, "r": 536.09589, "b": 271.81958, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 375.11798, "t": 262.60657000000003, "r": 536.09589, "b": 271.81958, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 541.64685, "t": 262.60657000000003, "r": 547.19781, "b": 271.81958, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "1", "bbox": {"l": 541.64685, "t": 262.60657000000003, "r": 547.19781, "b": 271.81958, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 136.79808, "t": 274.60637999999994, "r": 150.88702, "b": 283.8194, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "1.1", "bbox": {"l": 136.79808, "t": 274.60637999999994, "r": 150.88702, "b": 283.8194, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 156.5226, "t": 274.60637999999994, "r": 549.84723, "b": 283.8194, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "Security fundamentals. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2", "bbox": {"l": 156.5226, "t": 274.60637999999994, "r": 549.84723, "b": 283.8194, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 136.79807, "t": 287.14606000000003, "r": 150.62746, "b": 296.35904, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "1.2", "bbox": {"l": 136.79807, "t": 287.14606000000003, "r": 150.62746, "b": 296.35904, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 156.15923, "t": 287.14606000000003, "r": 536.12933, "b": 296.35904, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "Current state of IBM i security . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.15923, "t": 287.14606000000003, "r": 536.12933, "b": 296.35904, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 541.66113, "t": 287.14606000000003, "r": 547.19287, "b": 296.35904, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "2", "bbox": {"l": 541.66113, "t": 287.14606000000003, "r": 547.19287, "b": 296.35904, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 136.79807, "t": 299.62595, "r": 150.84943, "b": 308.83893, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "1.3", "bbox": {"l": 136.79807, "t": 299.62595, "r": 150.84943, "b": 308.83893, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 156.46996, "t": 299.62595, "r": 549.84723, "b": 308.83893, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "DB2 for i security controls . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3", "bbox": {"l": 156.46996, "t": 299.62595, "r": 549.84723, "b": 308.83893, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 151.1972, "t": 312.1058300000001, "r": 173.38289, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "1.3.1", "bbox": {"l": 151.1972, "t": 312.1058300000001, "r": 173.38289, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 178.92932, "t": 312.1058300000001, "r": 536.05511, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "Existing row and column control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.92932, "t": 312.1058300000001, "r": 536.05511, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 541.6015, "t": 312.1058300000001, "r": 547.14795, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "4", "bbox": {"l": 541.6015, "t": 312.1058300000001, "r": 547.14795, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 151.1972, "t": 324.64548, "r": 173.4189, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "1.3.2", "bbox": {"l": 151.1972, "t": 324.64548, "r": 173.4189, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 178.97432, "t": 324.64548, "r": 536.08008, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "New controls: Row and Column Access Control. . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.97432, "t": 324.64548, "r": 536.08008, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 541.6355, "t": 324.64548, "r": 547.19092, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "5", "bbox": {"l": 541.6355, "t": 324.64548, "r": 547.19092, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 136.79704, "t": 347.14511, "r": 336.82071, "b": 356.35809, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "Chapter 2. Roles and separation of duties", "bbox": {"l": 136.79704, "t": 347.14511, "r": 336.82071, "b": 356.35809, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 338.99701, "t": 347.14511, "r": 536.09088, "b": 356.35809, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 338.99701, "t": 347.14511, "r": 536.09088, "b": 356.35809, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 541.64282, "t": 347.14511, "r": 547.19476, "b": 356.35809, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "7", "bbox": {"l": 541.64282, "t": 347.14511, "r": 547.19476, "b": 356.35809, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 136.79704, "t": 359.14493, "r": 150.644, "b": 368.35791, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "2.1", "bbox": {"l": 136.79704, "t": 359.14493, "r": 150.644, "b": 368.35791, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 156.18277, "t": 359.14493, "r": 536.12714, "b": 368.35791, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "Roles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.18277, "t": 359.14493, "r": 536.12714, "b": 368.35791, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 541.66589, "t": 359.14493, "r": 547.20471, "b": 368.35791, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "8", "bbox": {"l": 541.66589, "t": 359.14493, "r": 547.20471, "b": 368.35791, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 151.1972, "t": 371.62482, "r": 173.60995, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "2.1.1", "bbox": {"l": 151.1972, "t": 371.62482, "r": 173.60995, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 176.41154, "t": 371.62482, "r": 535.9527, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "DDM and DRDA application server access: QIBM_DB_DDMDRDA . . . . . . . . . . .", "bbox": {"l": 176.41154, "t": 371.62482, "r": 535.9527, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 541.55585, "t": 371.62482, "r": 547.15906, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "8", "bbox": {"l": 541.55585, "t": 371.62482, "r": 547.15906, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 151.1972, "t": 384.10470999999995, "r": 173.41664, "b": 393.31769, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "2.1.2", "bbox": {"l": 151.1972, "t": 384.10470999999995, "r": 173.41664, "b": 393.31769, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 178.97151, "t": 384.10470999999995, "r": 536.04108, "b": 393.31769, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "Toolbox application server access: QIBM_DB_ZDA. . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.97151, "t": 384.10470999999995, "r": 536.04108, "b": 393.31769, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 541.59595, "t": 384.10470999999995, "r": 547.15082, "b": 393.31769, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "8", "bbox": {"l": 541.59595, "t": 384.10470999999995, "r": 547.15082, "b": 393.31769, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 151.1972, "t": 396.64435, "r": 173.41859, "b": 405.85733, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "2.1.3", "bbox": {"l": 151.1972, "t": 396.64435, "r": 173.41859, "b": 405.85733, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 178.97394, "t": 396.64435, "r": 536.07489, "b": 405.85733, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "Database Administrator function: QIBM_DB_SQLADM . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.97394, "t": 396.64435, "r": 536.07489, "b": 405.85733, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 541.63025, "t": 396.64435, "r": 547.18561, "b": 405.85733, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "9", "bbox": {"l": 541.63025, "t": 396.64435, "r": 547.18561, "b": 405.85733, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 151.1972, "t": 409.12424000000004, "r": 173.38629, "b": 418.33722, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "2.1.4", "bbox": {"l": 151.1972, "t": 409.12424000000004, "r": 173.38629, "b": 418.33722, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 178.93356, "t": 409.12424000000004, "r": 411.27048, "b": 418.33722, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "Database Information function: QIBM_DB_SYSMON", "bbox": {"l": 178.93356, "t": 409.12424000000004, "r": 411.27048, "b": 418.33722, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 416.81775, "t": 409.12424000000004, "r": 536.08411, "b": 418.33722, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": ". . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 416.81775, "t": 409.12424000000004, "r": 536.08411, "b": 418.33722, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 541.63135, "t": 409.12424000000004, "r": 547.17865, "b": 418.33722, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "9", "bbox": {"l": 541.63135, "t": 409.12424000000004, "r": 547.17865, "b": 418.33722, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 151.1972, "t": 421.60413, "r": 173.44926, "b": 430.81711, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "2.1.5", "bbox": {"l": 151.1972, "t": 421.60413, "r": 173.44926, "b": 430.81711, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 179.01228, "t": 421.60413, "r": 536.03589, "b": 430.81711, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "Security Administrator function: QIBM_DB_SECADM . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 179.01228, "t": 421.60413, "r": 536.03589, "b": 430.81711, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 541.59894, "t": 421.60413, "r": 547.16193, "b": 430.81711, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "9", "bbox": {"l": 541.59894, "t": 421.60413, "r": 547.16193, "b": 430.81711, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 151.1972, "t": 434.1437700000001, "r": 173.32208, "b": 443.35675, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "2.1.6", "bbox": {"l": 151.1972, "t": 434.1437700000001, "r": 173.32208, "b": 443.35675, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 178.8533, "t": 434.1437700000001, "r": 530.57318, "b": 443.35675, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "Change Function Usage CL command . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.8533, "t": 434.1437700000001, "r": 530.57318, "b": 443.35675, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 536.10443, "t": 434.1437700000001, "r": 547.16687, "b": 443.35675, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "10", "bbox": {"l": 536.10443, "t": 434.1437700000001, "r": 547.16687, "b": 443.35675, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 151.1972, "t": 446.62366, "r": 173.35822, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "2.1.7", "bbox": {"l": 151.1972, "t": 446.62366, "r": 173.35822, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 178.89848, "t": 446.62366, "r": 530.53522, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "Verifying function usage IDs for RCAC with the FUNCTION_USAGE view . . . . .", "bbox": {"l": 178.89848, "t": 446.62366, "r": 530.53522, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 536.0755, "t": 446.62366, "r": 547.15601, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "10", "bbox": {"l": 536.0755, "t": 446.62366, "r": 547.15601, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 136.79704, "t": 459.10355, "r": 150.85457, "b": 468.31653, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "2.2", "bbox": {"l": 136.79704, "t": 459.10355, "r": 150.85457, "b": 468.31653, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 156.47758, "t": 459.10355, "r": 547.25659, "b": 468.31653, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "Separation of duties . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10", "bbox": {"l": 156.47758, "t": 459.10355, "r": 547.25659, "b": 468.31653, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 136.79703, "t": 481.60318, "r": 348.68503, "b": 490.81616, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "Chapter 3. Row and Column Access Control", "bbox": {"l": 136.79703, "t": 481.60318, "r": 348.68503, "b": 490.81616, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 350.09741, "t": 481.60318, "r": 530.53961, "b": 490.81616, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 350.09741, "t": 481.60318, "r": 530.53961, "b": 490.81616, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 536.09167, "t": 481.60318, "r": 547.1958, "b": 490.81616, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "13", "bbox": {"l": 536.09167, "t": 481.60318, "r": 547.1958, "b": 490.81616, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 136.79703, "t": 493.603, "r": 150.70105, "b": 502.81598, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "3.1", "bbox": {"l": 136.79703, "t": 493.603, "r": 150.70105, "b": 502.81598, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 156.26266, "t": 493.603, "r": 530.4809, "b": 502.81598, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "Explanation of RCAC and the concept of access control . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.26266, "t": 493.603, "r": 530.4809, "b": 502.81598, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 536.04248, "t": 493.603, "r": 547.16571, "b": 502.81598, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "14", "bbox": {"l": 536.04248, "t": 493.603, "r": 547.16571, "b": 502.81598, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 151.19719, "t": 506.14264, "r": 173.35429, "b": 515.35562, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "3.1.1", "bbox": {"l": 151.19719, "t": 506.14264, "r": 173.35429, "b": 515.35562, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 178.89357, "t": 506.14264, "r": 378.20786, "b": 515.35562, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "Row permission and column mask definitions", "bbox": {"l": 178.89357, "t": 506.14264, "r": 378.20786, "b": 515.35562, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 383.74713, "t": 506.14264, "r": 530.5379, "b": 515.35562, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 383.74713, "t": 506.14264, "r": 530.5379, "b": 515.35562, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 536.07721, "t": 506.14264, "r": 547.15576, "b": 515.35562, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "14", "bbox": {"l": 536.07721, "t": 506.14264, "r": 547.15576, "b": 515.35562, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 151.19719, "t": 518.62253, "r": 173.44292, "b": 527.83551, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "3.1.2", "bbox": {"l": 151.19719, "t": 518.62253, "r": 173.44292, "b": 527.83551, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 179.00435, "t": 518.62253, "r": 530.43475, "b": 527.83551, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "Enabling and activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 179.00435, "t": 518.62253, "r": 530.43475, "b": 527.83551, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 535.99622, "t": 518.62253, "r": 547.11908, "b": 527.83551, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "16", "bbox": {"l": 535.99622, "t": 518.62253, "r": 547.11908, "b": 527.83551, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 136.79703, "t": 531.1621700000001, "r": 150.64432, "b": 540.37517, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "3.2", "bbox": {"l": 136.79703, "t": 531.1621700000001, "r": 150.64432, "b": 540.37517, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 156.18323, "t": 531.1621700000001, "r": 530.52808, "b": 540.37517, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "Special registers and built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.18323, "t": 531.1621700000001, "r": 530.52808, "b": 540.37517, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 536.06702, "t": 531.1621700000001, "r": 547.14484, "b": 540.37517, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "18", "bbox": {"l": 536.06702, "t": 531.1621700000001, "r": 547.14484, "b": 540.37517, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 151.19719, "t": 543.64204, "r": 173.41321, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "3.2.1", "bbox": {"l": 151.19719, "t": 543.64204, "r": 173.41321, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 178.96722, "t": 543.64204, "r": 530.49786, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "Special registers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.96722, "t": 543.64204, "r": 530.49786, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 536.05188, "t": 543.64204, "r": 547.15991, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "18", "bbox": {"l": 536.05188, "t": 543.64204, "r": 547.15991, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 151.19719, "t": 556.12192, "r": 173.35269, "b": 565.33492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "3.2.2", "bbox": {"l": 151.19719, "t": 556.12192, "r": 173.35269, "b": 565.33492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 178.89156, "t": 556.12192, "r": 530.56024, "b": 565.33492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "Built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.89156, "t": 556.12192, "r": 530.56024, "b": 565.33492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 536.09912, "t": 556.12192, "r": 547.17688, "b": 565.33492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "19", "bbox": {"l": 536.09912, "t": 556.12192, "r": 547.17688, "b": 565.33492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 136.79703, "t": 568.66156, "r": 150.62514, "b": 577.87456, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "3.3", "bbox": {"l": 136.79703, "t": 568.66156, "r": 150.62514, "b": 577.87456, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 156.15639, "t": 568.66156, "r": 530.53027, "b": 577.87456, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "VERIFY_GROUP_FOR_USER function . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.15639, "t": 568.66156, "r": 530.53027, "b": 577.87456, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 536.06152, "t": 568.66156, "r": 547.12402, "b": 577.87456, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "20", "bbox": {"l": 536.06152, "t": 568.66156, "r": 547.12402, "b": 577.87456, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 136.79703, "t": 581.14143, "r": 150.63004, "b": 590.35443, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "3.4", "bbox": {"l": 136.79703, "t": 581.14143, "r": 150.63004, "b": 590.35443, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 156.16325, "t": 581.14143, "r": 530.62994, "b": 590.35443, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "Establishing and controlling accessibility by using the RCAC rule text . . . . . . . . . . . . .", "bbox": {"l": 156.16325, "t": 581.14143, "r": 530.62994, "b": 590.35443, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 536.16315, "t": 581.14143, "r": 547.22955, "b": 590.35443, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "21", "bbox": {"l": 536.16315, "t": 581.14143, "r": 547.22955, "b": 590.35443, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 136.79701, "t": 593.62131, "r": 150.64413, "b": 602.8343, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "3.5", "bbox": {"l": 136.79701, "t": 593.62131, "r": 150.64413, "b": 602.8343, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 156.18298, "t": 593.62131, "r": 394.7818, "b": 602.8343, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "SELECT, INSERT, and UPDATE behavior with RCAC", "bbox": {"l": 156.18298, "t": 593.62131, "r": 394.7818, "b": 602.8343, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 400.32065, "t": 593.62131, "r": 530.48358, "b": 602.8343, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": ". . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 400.32065, "t": 593.62131, "r": 530.48358, "b": 602.8343, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 536.0224, "t": 593.62131, "r": 547.1001, "b": 602.8343, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "22", "bbox": {"l": 536.0224, "t": 593.62131, "r": 547.1001, "b": 602.8343, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 136.79701, "t": 606.16095, "r": 150.6642, "b": 615.37395, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "3.6", "bbox": {"l": 136.79701, "t": 606.16095, "r": 150.6642, "b": 615.37395, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 156.21107, "t": 606.16095, "r": 530.56512, "b": 615.37395, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "Human resources example . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.21107, "t": 606.16095, "r": 530.56512, "b": 615.37395, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 536.112, "t": 606.16095, "r": 547.20575, "b": 615.37395, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "22", "bbox": {"l": 536.112, "t": 606.16095, "r": 547.20575, "b": 615.37395, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 151.19717, "t": 618.64082, "r": 173.41692, "b": 627.85382, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "3.6.1", "bbox": {"l": 151.19717, "t": 618.64082, "r": 173.41692, "b": 627.85382, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 178.97185, "t": 618.64082, "r": 530.49139, "b": 627.85382, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": "Assigning the QIBM_DB_SECADM function ID to the consultants. . . . . . . . . . . .", "bbox": {"l": 178.97185, "t": 618.64082, "r": 530.49139, "b": 627.85382, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 536.04633, "t": 618.64082, "r": 547.15619, "b": 627.85382, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "23", "bbox": {"l": 536.04633, "t": 618.64082, "r": 547.15619, "b": 627.85382, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 151.19717, "t": 631.1206999999999, "r": 173.32271, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "3.6.2", "bbox": {"l": 151.19717, "t": 631.1206999999999, "r": 173.32271, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 178.8541, "t": 631.1206999999999, "r": 530.56458, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": "Creating group profiles for the users and their roles . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.8541, "t": 631.1206999999999, "r": 530.56458, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 536.09601, "t": 631.1206999999999, "r": 547.15875, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 107, "text": "23", "bbox": {"l": 536.09601, "t": 631.1206999999999, "r": 547.15875, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 151.19717, "t": 643.66034, "r": 173.32227, "b": 652.87334, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 108, "text": "3.6.3", "bbox": {"l": 151.19717, "t": 643.66034, "r": 173.32227, "b": 652.87334, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 178.85353, "t": 643.66034, "r": 530.55695, "b": 652.87334, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 109, "text": "Demonstrating data access without RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.85353, "t": 643.66034, "r": 530.55695, "b": 652.87334, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 536.0882, "t": 643.66034, "r": 547.15076, "b": 652.87334, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 110, "text": "24", "bbox": {"l": 536.0882, "t": 643.66034, "r": 547.15076, "b": 652.87334, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 151.19717, "t": 656.14021, "r": 173.35289, "b": 665.35321, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 111, "text": "3.6.4", "bbox": {"l": 151.19717, "t": 656.14021, "r": 173.35289, "b": 665.35321, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 178.89182, "t": 656.14021, "r": 530.53412, "b": 665.35321, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 112, "text": "Defining and creating row permissions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.89182, "t": 656.14021, "r": 530.53412, "b": 665.35321, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 114, "label": "text", "bbox": {"l": 536.073, "t": 656.14021, "r": 547.15088, "b": 665.35321, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 113, "text": "25", "bbox": {"l": 536.073, "t": 656.14021, "r": 547.15088, "b": 665.35321, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 115, "label": "text", "bbox": {"l": 151.19717, "t": 668.62009, "r": 173.35289, "b": 677.83309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 114, "text": "3.6.5", "bbox": {"l": 151.19717, "t": 668.62009, "r": 173.35289, "b": 677.83309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 116, "label": "text", "bbox": {"l": 178.89182, "t": 668.62009, "r": 339.45105, "b": 677.83309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 115, "text": "Defining and creating column masks", "bbox": {"l": 178.89182, "t": 668.62009, "r": 339.45105, "b": 677.83309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 117, "label": "text", "bbox": {"l": 344.98996, "t": 668.62009, "r": 530.54413, "b": 677.83309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 116, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 344.98996, "t": 668.62009, "r": 530.54413, "b": 677.83309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 118, "label": "text", "bbox": {"l": 536.08301, "t": 668.62009, "r": 547.16089, "b": 677.83309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 117, "text": "26", "bbox": {"l": 536.08301, "t": 668.62009, "r": 547.16089, "b": 677.83309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 119, "label": "text", "bbox": {"l": 151.19717, "t": 681.15973, "r": 173.38359, "b": 690.37273, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 118, "text": "3.6.6", "bbox": {"l": 151.19717, "t": 681.15973, "r": 173.38359, "b": 690.37273, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 120, "label": "text", "bbox": {"l": 178.93019, "t": 681.15973, "r": 530.54102, "b": 690.37273, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 119, "text": "Activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.93019, "t": 681.15973, "r": 530.54102, "b": 690.37273, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 121, "label": "text", "bbox": {"l": 536.08765, "t": 681.15973, "r": 547.18085, "b": 690.37273, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 120, "text": "28", "bbox": {"l": 536.08765, "t": 681.15973, "r": 547.18085, "b": 690.37273, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 122, "label": "text", "bbox": {"l": 151.19717, "t": 693.63961, "r": 173.32332, "b": 702.852615, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 121, "text": "3.6.7", "bbox": {"l": 151.19717, "t": 693.63961, "r": 173.32332, "b": 702.852615, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 123, "label": "text", "bbox": {"l": 178.85486, "t": 693.63961, "r": 350.80011, "b": 702.852615, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 122, "text": "Demonstrating data access with RCAC", "bbox": {"l": 178.85486, "t": 693.63961, "r": 350.80011, "b": 702.852615, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 124, "label": "text", "bbox": {"l": 356.33163, "t": 693.63961, "r": 530.57507, "b": 702.852615, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 123, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 356.33163, "t": 693.63961, "r": 530.57507, "b": 702.852615, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 125, "label": "text", "bbox": {"l": 536.10663, "t": 693.63961, "r": 547.16968, "b": 702.852615, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 124, "text": "29", "bbox": {"l": 536.10663, "t": 693.63961, "r": 547.16968, "b": 702.852615, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 126, "label": "text", "bbox": {"l": 151.19717, "t": 706.119492, "r": 173.44592, "b": 715.332497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 125, "text": "3.6.8", "bbox": {"l": 151.19717, "t": 706.119492, "r": 173.44592, "b": 715.332497, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 127, "label": "text", "bbox": {"l": 179.00812, "t": 706.119492, "r": 530.43628, "b": 715.332497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 126, "text": "Demonstrating data access with a view and RCAC . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 179.00812, "t": 706.119492, "r": 530.43628, "b": 715.332497, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 128, "label": "text", "bbox": {"l": 535.99847, "t": 706.119492, "r": 547.12286, "b": 715.332497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 127, "text": "32", "bbox": {"l": 535.99847, "t": 706.119492, "r": 547.12286, "b": 715.332497, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 43, "num_cols": 2, "table_cells": [{"bbox": {"l": 136.8, "t": 132.64862000000005, "r": 172.89404, "b": 141.86163, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Notices", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 175.01952, "t": 132.64862000000005, "r": 547.18982, "b": 141.86163, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vii", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79901, "t": 145.12847999999997, "r": 189.86537, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Trademarks", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 195.39685, "t": 145.12847999999997, "r": 547.18286, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . viii", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79901, "t": 167.62811, "r": 279.39731, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "DB2 for i Center of Excellence", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.61942, "t": 167.62811, "r": 547.1908, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ix", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79901, "t": 190.12775, "r": 172.84424, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Preface", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 175.01852, "t": 190.12775, "r": 547.18286, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79803, "t": 202.60760000000005, "r": 547.18085, "b": 211.82061999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Authors . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79803, "t": 215.14721999999995, "r": 339.18292, "b": 224.36023, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Now you can become a published author, too!", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 344.71411, "t": 215.14721999999995, "r": 547.13879, "b": 224.36023, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xiii", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79803, "t": 227.62707999999998, "r": 529.99506, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Comments welcome. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 535.5495, "t": 227.62707999999998, "r": 547.19788, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "xiii", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79807, "t": 240.10693000000003, "r": 284.02866, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Stay connected to IBM Redbooks", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.54449, "t": 240.10693000000003, "r": 547.12115, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xiv", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79807, "t": 262.60657000000003, "r": 536.09589, "b": 271.81958, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Chapter 1. Securing and protecting IBM DB2 data  . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.64685, "t": 262.60657000000003, "r": 547.19781, "b": 271.81958, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79808, "t": 274.60637999999994, "r": 549.84723, "b": 283.8194, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "1.1 Security fundamentals. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79807, "t": 287.14606000000003, "r": 536.12933, "b": 296.35904, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "1.2 Current state of IBM i security . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.66113, "t": 287.14606000000003, "r": 547.19287, "b": 296.35904, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79807, "t": 299.62595, "r": 549.84723, "b": 308.83893, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "1.3 DB2 for i security controls . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 312.1058300000001, "r": 536.05511, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "1.3.1 Existing row and column control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.6015, "t": 312.1058300000001, "r": 547.14795, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 324.64548, "r": 536.08008, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "1.3.2 New controls: Row and Column Access Control. . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.6355, "t": 324.64548, "r": 547.19092, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79704, "t": 347.14511, "r": 536.09088, "b": 356.35809, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 14, "end_row_offset_idx": 15, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Chapter 2. Roles and separation of duties . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.64282, "t": 347.14511, "r": 547.19476, "b": 356.35809, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 14, "end_row_offset_idx": 15, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79704, "t": 359.14493, "r": 536.12714, "b": 368.35791, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 15, "end_row_offset_idx": 16, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1 Roles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.66589, "t": 359.14493, "r": 547.20471, "b": 368.35791, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 15, "end_row_offset_idx": 16, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 371.62482, "r": 535.9527, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 16, "end_row_offset_idx": 17, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.1 DDM and DRDA application server access: QIBM_DB_DDMDRDA . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.55585, "t": 371.62482, "r": 547.15906, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 16, "end_row_offset_idx": 17, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 384.10470999999995, "r": 536.04108, "b": 393.31769, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 17, "end_row_offset_idx": 18, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.2 Toolbox application server access: QIBM_DB_ZDA. . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.59595, "t": 384.10470999999995, "r": 547.15082, "b": 393.31769, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 17, "end_row_offset_idx": 18, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 396.64435, "r": 536.07489, "b": 405.85733, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 18, "end_row_offset_idx": 19, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.3 Database Administrator function: QIBM_DB_SQLADM . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.63025, "t": 396.64435, "r": 547.18561, "b": 405.85733, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 18, "end_row_offset_idx": 19, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 409.12424000000004, "r": 411.27048, "b": 418.33722, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 19, "end_row_offset_idx": 20, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.4 Database Information function: QIBM_DB_SYSMON", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 416.81775, "t": 409.12424000000004, "r": 547.17865, "b": 418.33722, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 19, "end_row_offset_idx": 20, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . 9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 421.60413, "r": 536.03589, "b": 430.81711, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 20, "end_row_offset_idx": 21, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.5 Security Administrator function: QIBM_DB_SECADM . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.59894, "t": 421.60413, "r": 547.16193, "b": 430.81711, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 20, "end_row_offset_idx": 21, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 434.1437700000001, "r": 530.57318, "b": 443.35675, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 21, "end_row_offset_idx": 22, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.6 Change Function Usage CL command . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.10443, "t": 434.1437700000001, "r": 547.16687, "b": 443.35675, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 21, "end_row_offset_idx": 22, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "10", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 446.62366, "r": 530.53522, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 22, "end_row_offset_idx": 23, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.7 Verifying function usage IDs for RCAC with the FUNCTION_USAGE view . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.0755, "t": 446.62366, "r": 547.15601, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 22, "end_row_offset_idx": 23, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "10", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79704, "t": 459.10355, "r": 547.25659, "b": 468.31653, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 23, "end_row_offset_idx": 24, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.2 Separation of duties . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79703, "t": 481.60318, "r": 530.53961, "b": 490.81616, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 24, "end_row_offset_idx": 25, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Chapter 3. Row and Column Access Control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.09167, "t": 481.60318, "r": 547.1958, "b": 490.81616, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 24, "end_row_offset_idx": 25, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "13", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79703, "t": 493.603, "r": 530.4809, "b": 502.81598, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 25, "end_row_offset_idx": 26, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.1 Explanation of RCAC and the concept of access control . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.04248, "t": 493.603, "r": 547.16571, "b": 502.81598, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 25, "end_row_offset_idx": 26, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "14", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19719, "t": 506.14264, "r": 378.20786, "b": 515.35562, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 26, "end_row_offset_idx": 27, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.1.1 Row permission and column mask definitions", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 383.74713, "t": 506.14264, "r": 547.15576, "b": 515.35562, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 26, "end_row_offset_idx": 27, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . 14", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19719, "t": 518.62253, "r": 530.43475, "b": 527.83551, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 27, "end_row_offset_idx": 28, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.1.2 Enabling and activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 535.99622, "t": 518.62253, "r": 547.11908, "b": 527.83551, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 27, "end_row_offset_idx": 28, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "16", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79703, "t": 531.1621700000001, "r": 530.52808, "b": 540.37517, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 28, "end_row_offset_idx": 29, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.2 Special registers and built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.06702, "t": 531.1621700000001, "r": 547.14484, "b": 540.37517, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 28, "end_row_offset_idx": 29, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "18", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19719, "t": 543.64204, "r": 530.49786, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 29, "end_row_offset_idx": 30, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.2.1 Special registers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.05188, "t": 543.64204, "r": 547.15991, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 29, "end_row_offset_idx": 30, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "18", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19719, "t": 556.12192, "r": 530.56024, "b": 565.33492, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 30, "end_row_offset_idx": 31, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.2.2 Built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.09912, "t": 556.12192, "r": 547.17688, "b": 565.33492, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 30, "end_row_offset_idx": 31, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "19", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79703, "t": 568.66156, "r": 530.53027, "b": 577.87456, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 31, "end_row_offset_idx": 32, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.3 VERIFY_GROUP_FOR_USER function . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.06152, "t": 568.66156, "r": 547.12402, "b": 577.87456, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 31, "end_row_offset_idx": 32, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "20", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79703, "t": 581.14143, "r": 530.62994, "b": 590.35443, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 32, "end_row_offset_idx": 33, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.4 Establishing and controlling accessibility by using the RCAC rule text . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.16315, "t": 581.14143, "r": 547.22955, "b": 590.35443, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 32, "end_row_offset_idx": 33, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "21", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79701, "t": 593.62131, "r": 530.56512, "b": 615.37395, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 34, "end_row_offset_idx": 35, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.5 SELECT, INSERT, and UPDATE behavior with RCAC 3.6 Human resources example . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 400.32065, "t": 593.62131, "r": 530.48358, "b": 602.8343, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 33, "end_row_offset_idx": 34, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": ". . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.0224, "t": 593.62131, "r": 547.1001, "b": 602.8343, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 33, "end_row_offset_idx": 34, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "22", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.112, "t": 606.16095, "r": 547.20575, "b": 615.37395, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 34, "end_row_offset_idx": 35, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "22", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717, "t": 618.64082, "r": 530.49139, "b": 627.85382, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 35, "end_row_offset_idx": 36, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.1 Assigning the QIBM_DB_SECADM function ID to the consultants. . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.04633, "t": 618.64082, "r": 547.15619, "b": 627.85382, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 35, "end_row_offset_idx": 36, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "23", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717, "t": 631.1206999999999, "r": 530.56458, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 36, "end_row_offset_idx": 37, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.2 Creating group profiles for the users and their roles . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.09601, "t": 631.1206999999999, "r": 547.15875, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 36, "end_row_offset_idx": 37, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "23", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717, "t": 643.66034, "r": 530.55695, "b": 652.87334, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 37, "end_row_offset_idx": 38, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.3 Demonstrating data access without RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.0882, "t": 643.66034, "r": 547.15076, "b": 652.87334, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 37, "end_row_offset_idx": 38, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "24", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717, "t": 656.14021, "r": 530.53412, "b": 665.35321, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 38, "end_row_offset_idx": 39, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.4 Defining and creating row permissions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.073, "t": 656.14021, "r": 547.15088, "b": 665.35321, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 38, "end_row_offset_idx": 39, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "25", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717, "t": 668.62009, "r": 339.45105, "b": 677.83309, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 39, "end_row_offset_idx": 40, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.5 Defining and creating column masks", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 344.98996, "t": 668.62009, "r": 547.16089, "b": 677.83309, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 39, "end_row_offset_idx": 40, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717, "t": 681.15973, "r": 530.54102, "b": 690.37273, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 40, "end_row_offset_idx": 41, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.6 Activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.08765, "t": 681.15973, "r": 547.18085, "b": 690.37273, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 40, "end_row_offset_idx": 41, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "28", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717, "t": 693.63961, "r": 530.57507, "b": 702.852615, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 41, "end_row_offset_idx": 42, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.7 Demonstrating data access with RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.10663, "t": 693.63961, "r": 547.16968, "b": 702.852615, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 41, "end_row_offset_idx": 42, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "29", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717, "t": 706.119492, "r": 530.43628, "b": 715.332497, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 42, "end_row_offset_idx": 43, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.8 Demonstrating data access with a view and RCAC . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 535.99847, "t": 706.119492, "r": 547.12286, "b": 715.332497, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 42, "end_row_offset_idx": 43, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "32", "column_header": false, "row_header": false, "row_section": false}]}}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_footer", "id": 2, "page_no": 1, "cluster": {"id": 2, "label": "page_footer", "bbox": {"l": 64.800003, "t": 755.538002, "r": 257.24335, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9473597407341003, "cells": [{"id": 0, "text": "' Copyright IBM Corp. 2014. All rights reserved.", "bbox": {"l": 64.800003, "t": 755.538002, "r": 257.24335, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "' Copyright IBM Corp. 2014. All rights reserved."}, {"label": "page_footer", "id": 3, "page_no": 1, "cluster": {"id": 3, "label": "page_footer", "bbox": {"l": 538.85999, "t": 754.848721, "r": 547.25928, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.892627477645874, "cells": [{"id": 1, "text": "iii", "bbox": {"l": 538.85999, "t": 754.848721, "r": 547.25928, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "iii"}, {"label": "section_header", "id": 1, "page_no": 1, "cluster": {"id": 1, "label": "section_header", "bbox": {"l": 64.800003, "t": 73.84802000000002, "r": 168.73441, "b": 96.04803000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9509141445159912, "cells": [{"id": 2, "text": "Contents", "bbox": {"l": 64.800003, "t": 73.84802000000002, "r": 168.73441, "b": 96.04803000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Contents"}, {"label": "document_index", "id": 0, "page_no": 1, "cluster": {"id": 0, "label": "document_index", "bbox": {"l": 136.1495819091797, "t": 132.0330352783203, "r": 547.52685546875, "b": 715.6515502929688, "coord_origin": "TOPLEFT"}, "confidence": 0.9803680181503296, "cells": [{"id": 3, "text": "Notices", "bbox": {"l": 136.8, "t": 132.64862000000005, "r": 172.89404, "b": 141.86163, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vii", "bbox": {"l": 175.01952, "t": 132.64862000000005, "r": 547.18982, "b": 141.86163, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Trademarks", "bbox": {"l": 136.79901, "t": 145.12847999999997, "r": 189.86537, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 195.39685, "t": 145.12847999999997, "r": 530.05121, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "viii", "bbox": {"l": 535.5827, "t": 145.12847999999997, "r": 547.18286, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "DB2 for i Center of Excellence", "bbox": {"l": 136.79901, "t": 167.62811, "r": 279.39731, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ix", "bbox": {"l": 280.61942, "t": 167.62811, "r": 547.1908, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Preface", "bbox": {"l": 136.79901, "t": 190.12775, "r": 172.84424, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi", "bbox": {"l": 175.01852, "t": 190.12775, "r": 547.18286, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Authors . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi", "bbox": {"l": 136.79803, "t": 202.60760000000005, "r": 547.18085, "b": 211.82061999999996, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Now you can become a published author, too!", "bbox": {"l": 136.79803, "t": 215.14721999999995, "r": 339.18292, "b": 224.36023, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 344.71411, "t": 215.14721999999995, "r": 530.00812, "b": 224.36023, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "xiii", "bbox": {"l": 535.53925, "t": 215.14721999999995, "r": 547.13879, "b": 224.36023, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Comments welcome. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 136.79803, "t": 227.62707999999998, "r": 529.99506, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "xiii", "bbox": {"l": 535.5495, "t": 227.62707999999998, "r": 547.19788, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Stay connected to IBM Redbooks", "bbox": {"l": 136.79807, "t": 240.10693000000003, "r": 284.02866, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 289.54449, "t": 240.10693000000003, "r": 529.48242, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "xiv", "bbox": {"l": 534.99829, "t": 240.10693000000003, "r": 547.12115, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Chapter 1. Securing and protecting IBM DB2 data", "bbox": {"l": 136.79807, "t": 262.60657000000003, "r": 373.17566, "b": 271.81958, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 375.11798, "t": 262.60657000000003, "r": 536.09589, "b": 271.81958, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "1", "bbox": {"l": 541.64685, "t": 262.60657000000003, "r": 547.19781, "b": 271.81958, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "1.1", "bbox": {"l": 136.79808, "t": 274.60637999999994, "r": 150.88702, "b": 283.8194, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "Security fundamentals. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2", "bbox": {"l": 156.5226, "t": 274.60637999999994, "r": 549.84723, "b": 283.8194, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "1.2", "bbox": {"l": 136.79807, "t": 287.14606000000003, "r": 150.62746, "b": 296.35904, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Current state of IBM i security . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.15923, "t": 287.14606000000003, "r": 536.12933, "b": 296.35904, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "2", "bbox": {"l": 541.66113, "t": 287.14606000000003, "r": 547.19287, "b": 296.35904, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "1.3", "bbox": {"l": 136.79807, "t": 299.62595, "r": 150.84943, "b": 308.83893, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "DB2 for i security controls . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3", "bbox": {"l": 156.46996, "t": 299.62595, "r": 549.84723, "b": 308.83893, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "1.3.1", "bbox": {"l": 151.1972, "t": 312.1058300000001, "r": 173.38289, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Existing row and column control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.92932, "t": 312.1058300000001, "r": 536.05511, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "4", "bbox": {"l": 541.6015, "t": 312.1058300000001, "r": 547.14795, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "1.3.2", "bbox": {"l": 151.1972, "t": 324.64548, "r": 173.4189, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "New controls: Row and Column Access Control. . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.97432, "t": 324.64548, "r": 536.08008, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "5", "bbox": {"l": 541.6355, "t": 324.64548, "r": 547.19092, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "Chapter 2. Roles and separation of duties", "bbox": {"l": 136.79704, "t": 347.14511, "r": 336.82071, "b": 356.35809, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 338.99701, "t": 347.14511, "r": 536.09088, "b": 356.35809, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "7", "bbox": {"l": 541.64282, "t": 347.14511, "r": 547.19476, "b": 356.35809, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "2.1", "bbox": {"l": 136.79704, "t": 359.14493, "r": 150.644, "b": 368.35791, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Roles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.18277, "t": 359.14493, "r": 536.12714, "b": 368.35791, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "8", "bbox": {"l": 541.66589, "t": 359.14493, "r": 547.20471, "b": 368.35791, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "2.1.1", "bbox": {"l": 151.1972, "t": 371.62482, "r": 173.60995, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "DDM and DRDA application server access: QIBM_DB_DDMDRDA . . . . . . . . . . .", "bbox": {"l": 176.41154, "t": 371.62482, "r": 535.9527, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "8", "bbox": {"l": 541.55585, "t": 371.62482, "r": 547.15906, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "2.1.2", "bbox": {"l": 151.1972, "t": 384.10470999999995, "r": 173.41664, "b": 393.31769, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "Toolbox application server access: QIBM_DB_ZDA. . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.97151, "t": 384.10470999999995, "r": 536.04108, "b": 393.31769, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "8", "bbox": {"l": 541.59595, "t": 384.10470999999995, "r": 547.15082, "b": 393.31769, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "2.1.3", "bbox": {"l": 151.1972, "t": 396.64435, "r": 173.41859, "b": 405.85733, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Database Administrator function: QIBM_DB_SQLADM . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.97394, "t": 396.64435, "r": 536.07489, "b": 405.85733, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "9", "bbox": {"l": 541.63025, "t": 396.64435, "r": 547.18561, "b": 405.85733, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "2.1.4", "bbox": {"l": 151.1972, "t": 409.12424000000004, "r": 173.38629, "b": 418.33722, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Database Information function: QIBM_DB_SYSMON", "bbox": {"l": 178.93356, "t": 409.12424000000004, "r": 411.27048, "b": 418.33722, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": ". . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 416.81775, "t": 409.12424000000004, "r": 536.08411, "b": 418.33722, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "9", "bbox": {"l": 541.63135, "t": 409.12424000000004, "r": 547.17865, "b": 418.33722, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "2.1.5", "bbox": {"l": 151.1972, "t": 421.60413, "r": 173.44926, "b": 430.81711, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Security Administrator function: QIBM_DB_SECADM . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 179.01228, "t": 421.60413, "r": 536.03589, "b": 430.81711, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "9", "bbox": {"l": 541.59894, "t": 421.60413, "r": 547.16193, "b": 430.81711, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "2.1.6", "bbox": {"l": 151.1972, "t": 434.1437700000001, "r": 173.32208, "b": 443.35675, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Change Function Usage CL command . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.8533, "t": 434.1437700000001, "r": 530.57318, "b": 443.35675, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "10", "bbox": {"l": 536.10443, "t": 434.1437700000001, "r": 547.16687, "b": 443.35675, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "2.1.7", "bbox": {"l": 151.1972, "t": 446.62366, "r": 173.35822, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "Verifying function usage IDs for RCAC with the FUNCTION_USAGE view . . . . .", "bbox": {"l": 178.89848, "t": 446.62366, "r": 530.53522, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "10", "bbox": {"l": 536.0755, "t": 446.62366, "r": 547.15601, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "2.2", "bbox": {"l": 136.79704, "t": 459.10355, "r": 150.85457, "b": 468.31653, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "Separation of duties . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10", "bbox": {"l": 156.47758, "t": 459.10355, "r": 547.25659, "b": 468.31653, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "Chapter 3. Row and Column Access Control", "bbox": {"l": 136.79703, "t": 481.60318, "r": 348.68503, "b": 490.81616, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 350.09741, "t": 481.60318, "r": 530.53961, "b": 490.81616, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "13", "bbox": {"l": 536.09167, "t": 481.60318, "r": 547.1958, "b": 490.81616, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "3.1", "bbox": {"l": 136.79703, "t": 493.603, "r": 150.70105, "b": 502.81598, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Explanation of RCAC and the concept of access control . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.26266, "t": 493.603, "r": 530.4809, "b": 502.81598, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "14", "bbox": {"l": 536.04248, "t": 493.603, "r": 547.16571, "b": 502.81598, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "3.1.1", "bbox": {"l": 151.19719, "t": 506.14264, "r": 173.35429, "b": 515.35562, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "Row permission and column mask definitions", "bbox": {"l": 178.89357, "t": 506.14264, "r": 378.20786, "b": 515.35562, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 383.74713, "t": 506.14264, "r": 530.5379, "b": 515.35562, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "14", "bbox": {"l": 536.07721, "t": 506.14264, "r": 547.15576, "b": 515.35562, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "3.1.2", "bbox": {"l": 151.19719, "t": 518.62253, "r": 173.44292, "b": 527.83551, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "Enabling and activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 179.00435, "t": 518.62253, "r": 530.43475, "b": 527.83551, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "16", "bbox": {"l": 535.99622, "t": 518.62253, "r": 547.11908, "b": 527.83551, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "3.2", "bbox": {"l": 136.79703, "t": 531.1621700000001, "r": 150.64432, "b": 540.37517, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Special registers and built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.18323, "t": 531.1621700000001, "r": 530.52808, "b": 540.37517, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "18", "bbox": {"l": 536.06702, "t": 531.1621700000001, "r": 547.14484, "b": 540.37517, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "3.2.1", "bbox": {"l": 151.19719, "t": 543.64204, "r": 173.41321, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "Special registers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.96722, "t": 543.64204, "r": 530.49786, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "18", "bbox": {"l": 536.05188, "t": 543.64204, "r": 547.15991, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "3.2.2", "bbox": {"l": 151.19719, "t": 556.12192, "r": 173.35269, "b": 565.33492, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.89156, "t": 556.12192, "r": 530.56024, "b": 565.33492, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "19", "bbox": {"l": 536.09912, "t": 556.12192, "r": 547.17688, "b": 565.33492, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "3.3", "bbox": {"l": 136.79703, "t": 568.66156, "r": 150.62514, "b": 577.87456, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "VERIFY_GROUP_FOR_USER function . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.15639, "t": 568.66156, "r": 530.53027, "b": 577.87456, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "20", "bbox": {"l": 536.06152, "t": 568.66156, "r": 547.12402, "b": 577.87456, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "3.4", "bbox": {"l": 136.79703, "t": 581.14143, "r": 150.63004, "b": 590.35443, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "Establishing and controlling accessibility by using the RCAC rule text . . . . . . . . . . . . .", "bbox": {"l": 156.16325, "t": 581.14143, "r": 530.62994, "b": 590.35443, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "21", "bbox": {"l": 536.16315, "t": 581.14143, "r": 547.22955, "b": 590.35443, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "3.5", "bbox": {"l": 136.79701, "t": 593.62131, "r": 150.64413, "b": 602.8343, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "SELECT, INSERT, and UPDATE behavior with RCAC", "bbox": {"l": 156.18298, "t": 593.62131, "r": 394.7818, "b": 602.8343, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": ". . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 400.32065, "t": 593.62131, "r": 530.48358, "b": 602.8343, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "22", "bbox": {"l": 536.0224, "t": 593.62131, "r": 547.1001, "b": 602.8343, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "3.6", "bbox": {"l": 136.79701, "t": 606.16095, "r": 150.6642, "b": 615.37395, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "Human resources example . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.21107, "t": 606.16095, "r": 530.56512, "b": 615.37395, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "22", "bbox": {"l": 536.112, "t": 606.16095, "r": 547.20575, "b": 615.37395, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "3.6.1", "bbox": {"l": 151.19717, "t": 618.64082, "r": 173.41692, "b": 627.85382, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "Assigning the QIBM_DB_SECADM function ID to the consultants. . . . . . . . . . . .", "bbox": {"l": 178.97185, "t": 618.64082, "r": 530.49139, "b": 627.85382, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "23", "bbox": {"l": 536.04633, "t": 618.64082, "r": 547.15619, "b": 627.85382, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "3.6.2", "bbox": {"l": 151.19717, "t": 631.1206999999999, "r": 173.32271, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "Creating group profiles for the users and their roles . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.8541, "t": 631.1206999999999, "r": 530.56458, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "23", "bbox": {"l": 536.09601, "t": 631.1206999999999, "r": 547.15875, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "3.6.3", "bbox": {"l": 151.19717, "t": 643.66034, "r": 173.32227, "b": 652.87334, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "Demonstrating data access without RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.85353, "t": 643.66034, "r": 530.55695, "b": 652.87334, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "24", "bbox": {"l": 536.0882, "t": 643.66034, "r": 547.15076, "b": 652.87334, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "3.6.4", "bbox": {"l": 151.19717, "t": 656.14021, "r": 173.35289, "b": 665.35321, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "Defining and creating row permissions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.89182, "t": 656.14021, "r": 530.53412, "b": 665.35321, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "25", "bbox": {"l": 536.073, "t": 656.14021, "r": 547.15088, "b": 665.35321, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "3.6.5", "bbox": {"l": 151.19717, "t": 668.62009, "r": 173.35289, "b": 677.83309, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "Defining and creating column masks", "bbox": {"l": 178.89182, "t": 668.62009, "r": 339.45105, "b": 677.83309, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 344.98996, "t": 668.62009, "r": 530.54413, "b": 677.83309, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "26", "bbox": {"l": 536.08301, "t": 668.62009, "r": 547.16089, "b": 677.83309, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "3.6.6", "bbox": {"l": 151.19717, "t": 681.15973, "r": 173.38359, "b": 690.37273, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "Activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.93019, "t": 681.15973, "r": 530.54102, "b": 690.37273, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "28", "bbox": {"l": 536.08765, "t": 681.15973, "r": 547.18085, "b": 690.37273, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "3.6.7", "bbox": {"l": 151.19717, "t": 693.63961, "r": 173.32332, "b": 702.852615, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Demonstrating data access with RCAC", "bbox": {"l": 178.85486, "t": 693.63961, "r": 350.80011, "b": 702.852615, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 356.33163, "t": 693.63961, "r": 530.57507, "b": 702.852615, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "29", "bbox": {"l": 536.10663, "t": 693.63961, "r": 547.16968, "b": 702.852615, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "3.6.8", "bbox": {"l": 151.19717, "t": 706.119492, "r": 173.44592, "b": 715.332497, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "Demonstrating data access with a view and RCAC . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 179.00812, "t": 706.119492, "r": 530.43628, "b": 715.332497, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "32", "bbox": {"l": 535.99847, "t": 706.119492, "r": 547.12286, "b": 715.332497, "coord_origin": "TOPLEFT"}}], "children": [{"id": 4, "label": "text", "bbox": {"l": 136.8, "t": 132.64862000000005, "r": 172.89404, "b": 141.86163, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 3, "text": "Notices", "bbox": {"l": 136.8, "t": 132.64862000000005, "r": 172.89404, "b": 141.86163, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "text", "bbox": {"l": 175.01952, "t": 132.64862000000005, "r": 547.18982, "b": 141.86163, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 4, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vii", "bbox": {"l": 175.01952, "t": 132.64862000000005, "r": 547.18982, "b": 141.86163, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "text", "bbox": {"l": 136.79901, "t": 145.12847999999997, "r": 189.86537, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 5, "text": "Trademarks", "bbox": {"l": 136.79901, "t": 145.12847999999997, "r": 189.86537, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "text", "bbox": {"l": 195.39685, "t": 145.12847999999997, "r": 530.05121, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 195.39685, "t": 145.12847999999997, "r": 530.05121, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "text", "bbox": {"l": 535.5827, "t": 145.12847999999997, "r": 547.18286, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "viii", "bbox": {"l": 535.5827, "t": 145.12847999999997, "r": 547.18286, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 136.79901, "t": 167.62811, "r": 279.39731, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "DB2 for i Center of Excellence", "bbox": {"l": 136.79901, "t": 167.62811, "r": 279.39731, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "text", "bbox": {"l": 280.61942, "t": 167.62811, "r": 547.1908, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ix", "bbox": {"l": 280.61942, "t": 167.62811, "r": 547.1908, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 136.79901, "t": 190.12775, "r": 172.84424, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "Preface", "bbox": {"l": 136.79901, "t": 190.12775, "r": 172.84424, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 175.01852, "t": 190.12775, "r": 547.18286, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi", "bbox": {"l": 175.01852, "t": 190.12775, "r": 547.18286, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 136.79803, "t": 202.60760000000005, "r": 547.18085, "b": 211.82061999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "Authors . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi", "bbox": {"l": 136.79803, "t": 202.60760000000005, "r": 547.18085, "b": 211.82061999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 136.79803, "t": 215.14721999999995, "r": 339.18292, "b": 224.36023, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "Now you can become a published author, too!", "bbox": {"l": 136.79803, "t": 215.14721999999995, "r": 339.18292, "b": 224.36023, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 344.71411, "t": 215.14721999999995, "r": 530.00812, "b": 224.36023, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 344.71411, "t": 215.14721999999995, "r": 530.00812, "b": 224.36023, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 535.53925, "t": 215.14721999999995, "r": 547.13879, "b": 224.36023, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "xiii", "bbox": {"l": 535.53925, "t": 215.14721999999995, "r": 547.13879, "b": 224.36023, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 136.79803, "t": 227.62707999999998, "r": 529.99506, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "Comments welcome. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 136.79803, "t": 227.62707999999998, "r": 529.99506, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 535.5495, "t": 227.62707999999998, "r": 547.19788, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "xiii", "bbox": {"l": 535.5495, "t": 227.62707999999998, "r": 547.19788, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 136.79807, "t": 240.10693000000003, "r": 284.02866, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "Stay connected to IBM Redbooks", "bbox": {"l": 136.79807, "t": 240.10693000000003, "r": 284.02866, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 289.54449, "t": 240.10693000000003, "r": 529.48242, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 289.54449, "t": 240.10693000000003, "r": 529.48242, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 534.99829, "t": 240.10693000000003, "r": 547.12115, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "xiv", "bbox": {"l": 534.99829, "t": 240.10693000000003, "r": 547.12115, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 136.79807, "t": 262.60657000000003, "r": 373.17566, "b": 271.81958, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "Chapter 1. Securing and protecting IBM DB2 data", "bbox": {"l": 136.79807, "t": 262.60657000000003, "r": 373.17566, "b": 271.81958, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 375.11798, "t": 262.60657000000003, "r": 536.09589, "b": 271.81958, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 375.11798, "t": 262.60657000000003, "r": 536.09589, "b": 271.81958, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 541.64685, "t": 262.60657000000003, "r": 547.19781, "b": 271.81958, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "1", "bbox": {"l": 541.64685, "t": 262.60657000000003, "r": 547.19781, "b": 271.81958, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 136.79808, "t": 274.60637999999994, "r": 150.88702, "b": 283.8194, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "1.1", "bbox": {"l": 136.79808, "t": 274.60637999999994, "r": 150.88702, "b": 283.8194, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 156.5226, "t": 274.60637999999994, "r": 549.84723, "b": 283.8194, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "Security fundamentals. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2", "bbox": {"l": 156.5226, "t": 274.60637999999994, "r": 549.84723, "b": 283.8194, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 136.79807, "t": 287.14606000000003, "r": 150.62746, "b": 296.35904, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "1.2", "bbox": {"l": 136.79807, "t": 287.14606000000003, "r": 150.62746, "b": 296.35904, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 156.15923, "t": 287.14606000000003, "r": 536.12933, "b": 296.35904, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "Current state of IBM i security . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.15923, "t": 287.14606000000003, "r": 536.12933, "b": 296.35904, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 541.66113, "t": 287.14606000000003, "r": 547.19287, "b": 296.35904, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "2", "bbox": {"l": 541.66113, "t": 287.14606000000003, "r": 547.19287, "b": 296.35904, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 136.79807, "t": 299.62595, "r": 150.84943, "b": 308.83893, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "1.3", "bbox": {"l": 136.79807, "t": 299.62595, "r": 150.84943, "b": 308.83893, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 156.46996, "t": 299.62595, "r": 549.84723, "b": 308.83893, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "DB2 for i security controls . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3", "bbox": {"l": 156.46996, "t": 299.62595, "r": 549.84723, "b": 308.83893, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 151.1972, "t": 312.1058300000001, "r": 173.38289, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "1.3.1", "bbox": {"l": 151.1972, "t": 312.1058300000001, "r": 173.38289, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 178.92932, "t": 312.1058300000001, "r": 536.05511, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "Existing row and column control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.92932, "t": 312.1058300000001, "r": 536.05511, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 541.6015, "t": 312.1058300000001, "r": 547.14795, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "4", "bbox": {"l": 541.6015, "t": 312.1058300000001, "r": 547.14795, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 151.1972, "t": 324.64548, "r": 173.4189, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "1.3.2", "bbox": {"l": 151.1972, "t": 324.64548, "r": 173.4189, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 178.97432, "t": 324.64548, "r": 536.08008, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "New controls: Row and Column Access Control. . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.97432, "t": 324.64548, "r": 536.08008, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 541.6355, "t": 324.64548, "r": 547.19092, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "5", "bbox": {"l": 541.6355, "t": 324.64548, "r": 547.19092, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 136.79704, "t": 347.14511, "r": 336.82071, "b": 356.35809, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "Chapter 2. Roles and separation of duties", "bbox": {"l": 136.79704, "t": 347.14511, "r": 336.82071, "b": 356.35809, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 338.99701, "t": 347.14511, "r": 536.09088, "b": 356.35809, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 338.99701, "t": 347.14511, "r": 536.09088, "b": 356.35809, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 541.64282, "t": 347.14511, "r": 547.19476, "b": 356.35809, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "7", "bbox": {"l": 541.64282, "t": 347.14511, "r": 547.19476, "b": 356.35809, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 136.79704, "t": 359.14493, "r": 150.644, "b": 368.35791, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "2.1", "bbox": {"l": 136.79704, "t": 359.14493, "r": 150.644, "b": 368.35791, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 156.18277, "t": 359.14493, "r": 536.12714, "b": 368.35791, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "Roles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.18277, "t": 359.14493, "r": 536.12714, "b": 368.35791, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 541.66589, "t": 359.14493, "r": 547.20471, "b": 368.35791, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "8", "bbox": {"l": 541.66589, "t": 359.14493, "r": 547.20471, "b": 368.35791, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 151.1972, "t": 371.62482, "r": 173.60995, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "2.1.1", "bbox": {"l": 151.1972, "t": 371.62482, "r": 173.60995, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 176.41154, "t": 371.62482, "r": 535.9527, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "DDM and DRDA application server access: QIBM_DB_DDMDRDA . . . . . . . . . . .", "bbox": {"l": 176.41154, "t": 371.62482, "r": 535.9527, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 541.55585, "t": 371.62482, "r": 547.15906, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "8", "bbox": {"l": 541.55585, "t": 371.62482, "r": 547.15906, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 151.1972, "t": 384.10470999999995, "r": 173.41664, "b": 393.31769, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "2.1.2", "bbox": {"l": 151.1972, "t": 384.10470999999995, "r": 173.41664, "b": 393.31769, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 178.97151, "t": 384.10470999999995, "r": 536.04108, "b": 393.31769, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "Toolbox application server access: QIBM_DB_ZDA. . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.97151, "t": 384.10470999999995, "r": 536.04108, "b": 393.31769, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 541.59595, "t": 384.10470999999995, "r": 547.15082, "b": 393.31769, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "8", "bbox": {"l": 541.59595, "t": 384.10470999999995, "r": 547.15082, "b": 393.31769, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 151.1972, "t": 396.64435, "r": 173.41859, "b": 405.85733, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "2.1.3", "bbox": {"l": 151.1972, "t": 396.64435, "r": 173.41859, "b": 405.85733, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 178.97394, "t": 396.64435, "r": 536.07489, "b": 405.85733, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "Database Administrator function: QIBM_DB_SQLADM . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.97394, "t": 396.64435, "r": 536.07489, "b": 405.85733, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 541.63025, "t": 396.64435, "r": 547.18561, "b": 405.85733, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "9", "bbox": {"l": 541.63025, "t": 396.64435, "r": 547.18561, "b": 405.85733, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 151.1972, "t": 409.12424000000004, "r": 173.38629, "b": 418.33722, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "2.1.4", "bbox": {"l": 151.1972, "t": 409.12424000000004, "r": 173.38629, "b": 418.33722, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 178.93356, "t": 409.12424000000004, "r": 411.27048, "b": 418.33722, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "Database Information function: QIBM_DB_SYSMON", "bbox": {"l": 178.93356, "t": 409.12424000000004, "r": 411.27048, "b": 418.33722, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 416.81775, "t": 409.12424000000004, "r": 536.08411, "b": 418.33722, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": ". . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 416.81775, "t": 409.12424000000004, "r": 536.08411, "b": 418.33722, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 541.63135, "t": 409.12424000000004, "r": 547.17865, "b": 418.33722, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "9", "bbox": {"l": 541.63135, "t": 409.12424000000004, "r": 547.17865, "b": 418.33722, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 151.1972, "t": 421.60413, "r": 173.44926, "b": 430.81711, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "2.1.5", "bbox": {"l": 151.1972, "t": 421.60413, "r": 173.44926, "b": 430.81711, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 179.01228, "t": 421.60413, "r": 536.03589, "b": 430.81711, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "Security Administrator function: QIBM_DB_SECADM . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 179.01228, "t": 421.60413, "r": 536.03589, "b": 430.81711, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 541.59894, "t": 421.60413, "r": 547.16193, "b": 430.81711, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "9", "bbox": {"l": 541.59894, "t": 421.60413, "r": 547.16193, "b": 430.81711, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 151.1972, "t": 434.1437700000001, "r": 173.32208, "b": 443.35675, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "2.1.6", "bbox": {"l": 151.1972, "t": 434.1437700000001, "r": 173.32208, "b": 443.35675, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 178.8533, "t": 434.1437700000001, "r": 530.57318, "b": 443.35675, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "Change Function Usage CL command . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.8533, "t": 434.1437700000001, "r": 530.57318, "b": 443.35675, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 536.10443, "t": 434.1437700000001, "r": 547.16687, "b": 443.35675, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "10", "bbox": {"l": 536.10443, "t": 434.1437700000001, "r": 547.16687, "b": 443.35675, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 151.1972, "t": 446.62366, "r": 173.35822, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "2.1.7", "bbox": {"l": 151.1972, "t": 446.62366, "r": 173.35822, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 178.89848, "t": 446.62366, "r": 530.53522, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "Verifying function usage IDs for RCAC with the FUNCTION_USAGE view . . . . .", "bbox": {"l": 178.89848, "t": 446.62366, "r": 530.53522, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 536.0755, "t": 446.62366, "r": 547.15601, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "10", "bbox": {"l": 536.0755, "t": 446.62366, "r": 547.15601, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 136.79704, "t": 459.10355, "r": 150.85457, "b": 468.31653, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "2.2", "bbox": {"l": 136.79704, "t": 459.10355, "r": 150.85457, "b": 468.31653, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 156.47758, "t": 459.10355, "r": 547.25659, "b": 468.31653, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "Separation of duties . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10", "bbox": {"l": 156.47758, "t": 459.10355, "r": 547.25659, "b": 468.31653, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 136.79703, "t": 481.60318, "r": 348.68503, "b": 490.81616, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "Chapter 3. Row and Column Access Control", "bbox": {"l": 136.79703, "t": 481.60318, "r": 348.68503, "b": 490.81616, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 350.09741, "t": 481.60318, "r": 530.53961, "b": 490.81616, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 350.09741, "t": 481.60318, "r": 530.53961, "b": 490.81616, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 536.09167, "t": 481.60318, "r": 547.1958, "b": 490.81616, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "13", "bbox": {"l": 536.09167, "t": 481.60318, "r": 547.1958, "b": 490.81616, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 136.79703, "t": 493.603, "r": 150.70105, "b": 502.81598, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "3.1", "bbox": {"l": 136.79703, "t": 493.603, "r": 150.70105, "b": 502.81598, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 156.26266, "t": 493.603, "r": 530.4809, "b": 502.81598, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "Explanation of RCAC and the concept of access control . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.26266, "t": 493.603, "r": 530.4809, "b": 502.81598, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 536.04248, "t": 493.603, "r": 547.16571, "b": 502.81598, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "14", "bbox": {"l": 536.04248, "t": 493.603, "r": 547.16571, "b": 502.81598, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 151.19719, "t": 506.14264, "r": 173.35429, "b": 515.35562, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "3.1.1", "bbox": {"l": 151.19719, "t": 506.14264, "r": 173.35429, "b": 515.35562, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 178.89357, "t": 506.14264, "r": 378.20786, "b": 515.35562, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "Row permission and column mask definitions", "bbox": {"l": 178.89357, "t": 506.14264, "r": 378.20786, "b": 515.35562, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 383.74713, "t": 506.14264, "r": 530.5379, "b": 515.35562, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 383.74713, "t": 506.14264, "r": 530.5379, "b": 515.35562, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 536.07721, "t": 506.14264, "r": 547.15576, "b": 515.35562, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "14", "bbox": {"l": 536.07721, "t": 506.14264, "r": 547.15576, "b": 515.35562, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 151.19719, "t": 518.62253, "r": 173.44292, "b": 527.83551, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "3.1.2", "bbox": {"l": 151.19719, "t": 518.62253, "r": 173.44292, "b": 527.83551, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 179.00435, "t": 518.62253, "r": 530.43475, "b": 527.83551, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "Enabling and activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 179.00435, "t": 518.62253, "r": 530.43475, "b": 527.83551, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 535.99622, "t": 518.62253, "r": 547.11908, "b": 527.83551, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "16", "bbox": {"l": 535.99622, "t": 518.62253, "r": 547.11908, "b": 527.83551, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 136.79703, "t": 531.1621700000001, "r": 150.64432, "b": 540.37517, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "3.2", "bbox": {"l": 136.79703, "t": 531.1621700000001, "r": 150.64432, "b": 540.37517, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 156.18323, "t": 531.1621700000001, "r": 530.52808, "b": 540.37517, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "Special registers and built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.18323, "t": 531.1621700000001, "r": 530.52808, "b": 540.37517, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 536.06702, "t": 531.1621700000001, "r": 547.14484, "b": 540.37517, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "18", "bbox": {"l": 536.06702, "t": 531.1621700000001, "r": 547.14484, "b": 540.37517, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 151.19719, "t": 543.64204, "r": 173.41321, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "3.2.1", "bbox": {"l": 151.19719, "t": 543.64204, "r": 173.41321, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 178.96722, "t": 543.64204, "r": 530.49786, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "Special registers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.96722, "t": 543.64204, "r": 530.49786, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 536.05188, "t": 543.64204, "r": 547.15991, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "18", "bbox": {"l": 536.05188, "t": 543.64204, "r": 547.15991, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 151.19719, "t": 556.12192, "r": 173.35269, "b": 565.33492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "3.2.2", "bbox": {"l": 151.19719, "t": 556.12192, "r": 173.35269, "b": 565.33492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 178.89156, "t": 556.12192, "r": 530.56024, "b": 565.33492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "Built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.89156, "t": 556.12192, "r": 530.56024, "b": 565.33492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 536.09912, "t": 556.12192, "r": 547.17688, "b": 565.33492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "19", "bbox": {"l": 536.09912, "t": 556.12192, "r": 547.17688, "b": 565.33492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 136.79703, "t": 568.66156, "r": 150.62514, "b": 577.87456, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "3.3", "bbox": {"l": 136.79703, "t": 568.66156, "r": 150.62514, "b": 577.87456, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 156.15639, "t": 568.66156, "r": 530.53027, "b": 577.87456, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "VERIFY_GROUP_FOR_USER function . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.15639, "t": 568.66156, "r": 530.53027, "b": 577.87456, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 536.06152, "t": 568.66156, "r": 547.12402, "b": 577.87456, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "20", "bbox": {"l": 536.06152, "t": 568.66156, "r": 547.12402, "b": 577.87456, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 136.79703, "t": 581.14143, "r": 150.63004, "b": 590.35443, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "3.4", "bbox": {"l": 136.79703, "t": 581.14143, "r": 150.63004, "b": 590.35443, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 156.16325, "t": 581.14143, "r": 530.62994, "b": 590.35443, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "Establishing and controlling accessibility by using the RCAC rule text . . . . . . . . . . . . .", "bbox": {"l": 156.16325, "t": 581.14143, "r": 530.62994, "b": 590.35443, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 536.16315, "t": 581.14143, "r": 547.22955, "b": 590.35443, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "21", "bbox": {"l": 536.16315, "t": 581.14143, "r": 547.22955, "b": 590.35443, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 136.79701, "t": 593.62131, "r": 150.64413, "b": 602.8343, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "3.5", "bbox": {"l": 136.79701, "t": 593.62131, "r": 150.64413, "b": 602.8343, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 156.18298, "t": 593.62131, "r": 394.7818, "b": 602.8343, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "SELECT, INSERT, and UPDATE behavior with RCAC", "bbox": {"l": 156.18298, "t": 593.62131, "r": 394.7818, "b": 602.8343, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 400.32065, "t": 593.62131, "r": 530.48358, "b": 602.8343, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": ". . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 400.32065, "t": 593.62131, "r": 530.48358, "b": 602.8343, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 536.0224, "t": 593.62131, "r": 547.1001, "b": 602.8343, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "22", "bbox": {"l": 536.0224, "t": 593.62131, "r": 547.1001, "b": 602.8343, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 136.79701, "t": 606.16095, "r": 150.6642, "b": 615.37395, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "3.6", "bbox": {"l": 136.79701, "t": 606.16095, "r": 150.6642, "b": 615.37395, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 156.21107, "t": 606.16095, "r": 530.56512, "b": 615.37395, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "Human resources example . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.21107, "t": 606.16095, "r": 530.56512, "b": 615.37395, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 536.112, "t": 606.16095, "r": 547.20575, "b": 615.37395, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "22", "bbox": {"l": 536.112, "t": 606.16095, "r": 547.20575, "b": 615.37395, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 151.19717, "t": 618.64082, "r": 173.41692, "b": 627.85382, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "3.6.1", "bbox": {"l": 151.19717, "t": 618.64082, "r": 173.41692, "b": 627.85382, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 178.97185, "t": 618.64082, "r": 530.49139, "b": 627.85382, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": "Assigning the QIBM_DB_SECADM function ID to the consultants. . . . . . . . . . . .", "bbox": {"l": 178.97185, "t": 618.64082, "r": 530.49139, "b": 627.85382, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 536.04633, "t": 618.64082, "r": 547.15619, "b": 627.85382, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "23", "bbox": {"l": 536.04633, "t": 618.64082, "r": 547.15619, "b": 627.85382, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 151.19717, "t": 631.1206999999999, "r": 173.32271, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "3.6.2", "bbox": {"l": 151.19717, "t": 631.1206999999999, "r": 173.32271, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 178.8541, "t": 631.1206999999999, "r": 530.56458, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": "Creating group profiles for the users and their roles . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.8541, "t": 631.1206999999999, "r": 530.56458, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 536.09601, "t": 631.1206999999999, "r": 547.15875, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 107, "text": "23", "bbox": {"l": 536.09601, "t": 631.1206999999999, "r": 547.15875, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 151.19717, "t": 643.66034, "r": 173.32227, "b": 652.87334, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 108, "text": "3.6.3", "bbox": {"l": 151.19717, "t": 643.66034, "r": 173.32227, "b": 652.87334, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 178.85353, "t": 643.66034, "r": 530.55695, "b": 652.87334, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 109, "text": "Demonstrating data access without RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.85353, "t": 643.66034, "r": 530.55695, "b": 652.87334, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 536.0882, "t": 643.66034, "r": 547.15076, "b": 652.87334, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 110, "text": "24", "bbox": {"l": 536.0882, "t": 643.66034, "r": 547.15076, "b": 652.87334, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 151.19717, "t": 656.14021, "r": 173.35289, "b": 665.35321, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 111, "text": "3.6.4", "bbox": {"l": 151.19717, "t": 656.14021, "r": 173.35289, "b": 665.35321, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 178.89182, "t": 656.14021, "r": 530.53412, "b": 665.35321, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 112, "text": "Defining and creating row permissions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.89182, "t": 656.14021, "r": 530.53412, "b": 665.35321, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 114, "label": "text", "bbox": {"l": 536.073, "t": 656.14021, "r": 547.15088, "b": 665.35321, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 113, "text": "25", "bbox": {"l": 536.073, "t": 656.14021, "r": 547.15088, "b": 665.35321, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 115, "label": "text", "bbox": {"l": 151.19717, "t": 668.62009, "r": 173.35289, "b": 677.83309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 114, "text": "3.6.5", "bbox": {"l": 151.19717, "t": 668.62009, "r": 173.35289, "b": 677.83309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 116, "label": "text", "bbox": {"l": 178.89182, "t": 668.62009, "r": 339.45105, "b": 677.83309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 115, "text": "Defining and creating column masks", "bbox": {"l": 178.89182, "t": 668.62009, "r": 339.45105, "b": 677.83309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 117, "label": "text", "bbox": {"l": 344.98996, "t": 668.62009, "r": 530.54413, "b": 677.83309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 116, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 344.98996, "t": 668.62009, "r": 530.54413, "b": 677.83309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 118, "label": "text", "bbox": {"l": 536.08301, "t": 668.62009, "r": 547.16089, "b": 677.83309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 117, "text": "26", "bbox": {"l": 536.08301, "t": 668.62009, "r": 547.16089, "b": 677.83309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 119, "label": "text", "bbox": {"l": 151.19717, "t": 681.15973, "r": 173.38359, "b": 690.37273, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 118, "text": "3.6.6", "bbox": {"l": 151.19717, "t": 681.15973, "r": 173.38359, "b": 690.37273, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 120, "label": "text", "bbox": {"l": 178.93019, "t": 681.15973, "r": 530.54102, "b": 690.37273, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 119, "text": "Activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.93019, "t": 681.15973, "r": 530.54102, "b": 690.37273, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 121, "label": "text", "bbox": {"l": 536.08765, "t": 681.15973, "r": 547.18085, "b": 690.37273, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 120, "text": "28", "bbox": {"l": 536.08765, "t": 681.15973, "r": 547.18085, "b": 690.37273, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 122, "label": "text", "bbox": {"l": 151.19717, "t": 693.63961, "r": 173.32332, "b": 702.852615, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 121, "text": "3.6.7", "bbox": {"l": 151.19717, "t": 693.63961, "r": 173.32332, "b": 702.852615, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 123, "label": "text", "bbox": {"l": 178.85486, "t": 693.63961, "r": 350.80011, "b": 702.852615, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 122, "text": "Demonstrating data access with RCAC", "bbox": {"l": 178.85486, "t": 693.63961, "r": 350.80011, "b": 702.852615, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 124, "label": "text", "bbox": {"l": 356.33163, "t": 693.63961, "r": 530.57507, "b": 702.852615, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 123, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 356.33163, "t": 693.63961, "r": 530.57507, "b": 702.852615, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 125, "label": "text", "bbox": {"l": 536.10663, "t": 693.63961, "r": 547.16968, "b": 702.852615, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 124, "text": "29", "bbox": {"l": 536.10663, "t": 693.63961, "r": 547.16968, "b": 702.852615, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 126, "label": "text", "bbox": {"l": 151.19717, "t": 706.119492, "r": 173.44592, "b": 715.332497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 125, "text": "3.6.8", "bbox": {"l": 151.19717, "t": 706.119492, "r": 173.44592, "b": 715.332497, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 127, "label": "text", "bbox": {"l": 179.00812, "t": 706.119492, "r": 530.43628, "b": 715.332497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 126, "text": "Demonstrating data access with a view and RCAC . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 179.00812, "t": 706.119492, "r": 530.43628, "b": 715.332497, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 128, "label": "text", "bbox": {"l": 535.99847, "t": 706.119492, "r": 547.12286, "b": 715.332497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 127, "text": "32", "bbox": {"l": 535.99847, "t": 706.119492, "r": 547.12286, "b": 715.332497, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 43, "num_cols": 2, "table_cells": [{"bbox": {"l": 136.8, "t": 132.64862000000005, "r": 172.89404, "b": 141.86163, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Notices", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 175.01952, "t": 132.64862000000005, "r": 547.18982, "b": 141.86163, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vii", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79901, "t": 145.12847999999997, "r": 189.86537, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Trademarks", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 195.39685, "t": 145.12847999999997, "r": 547.18286, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . viii", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79901, "t": 167.62811, "r": 279.39731, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "DB2 for i Center of Excellence", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.61942, "t": 167.62811, "r": 547.1908, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ix", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79901, "t": 190.12775, "r": 172.84424, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Preface", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 175.01852, "t": 190.12775, "r": 547.18286, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79803, "t": 202.60760000000005, "r": 547.18085, "b": 211.82061999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Authors . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79803, "t": 215.14721999999995, "r": 339.18292, "b": 224.36023, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Now you can become a published author, too!", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 344.71411, "t": 215.14721999999995, "r": 547.13879, "b": 224.36023, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xiii", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79803, "t": 227.62707999999998, "r": 529.99506, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Comments welcome. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 535.5495, "t": 227.62707999999998, "r": 547.19788, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "xiii", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79807, "t": 240.10693000000003, "r": 284.02866, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Stay connected to IBM Redbooks", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.54449, "t": 240.10693000000003, "r": 547.12115, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xiv", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79807, "t": 262.60657000000003, "r": 536.09589, "b": 271.81958, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Chapter 1. Securing and protecting IBM DB2 data  . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.64685, "t": 262.60657000000003, "r": 547.19781, "b": 271.81958, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79808, "t": 274.60637999999994, "r": 549.84723, "b": 283.8194, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "1.1 Security fundamentals. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79807, "t": 287.14606000000003, "r": 536.12933, "b": 296.35904, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "1.2 Current state of IBM i security . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.66113, "t": 287.14606000000003, "r": 547.19287, "b": 296.35904, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79807, "t": 299.62595, "r": 549.84723, "b": 308.83893, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "1.3 DB2 for i security controls . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 312.1058300000001, "r": 536.05511, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "1.3.1 Existing row and column control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.6015, "t": 312.1058300000001, "r": 547.14795, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 324.64548, "r": 536.08008, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "1.3.2 New controls: Row and Column Access Control. . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.6355, "t": 324.64548, "r": 547.19092, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79704, "t": 347.14511, "r": 536.09088, "b": 356.35809, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 14, "end_row_offset_idx": 15, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Chapter 2. Roles and separation of duties . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.64282, "t": 347.14511, "r": 547.19476, "b": 356.35809, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 14, "end_row_offset_idx": 15, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79704, "t": 359.14493, "r": 536.12714, "b": 368.35791, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 15, "end_row_offset_idx": 16, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1 Roles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.66589, "t": 359.14493, "r": 547.20471, "b": 368.35791, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 15, "end_row_offset_idx": 16, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 371.62482, "r": 535.9527, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 16, "end_row_offset_idx": 17, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.1 DDM and DRDA application server access: QIBM_DB_DDMDRDA . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.55585, "t": 371.62482, "r": 547.15906, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 16, "end_row_offset_idx": 17, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 384.10470999999995, "r": 536.04108, "b": 393.31769, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 17, "end_row_offset_idx": 18, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.2 Toolbox application server access: QIBM_DB_ZDA. . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.59595, "t": 384.10470999999995, "r": 547.15082, "b": 393.31769, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 17, "end_row_offset_idx": 18, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 396.64435, "r": 536.07489, "b": 405.85733, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 18, "end_row_offset_idx": 19, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.3 Database Administrator function: QIBM_DB_SQLADM . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.63025, "t": 396.64435, "r": 547.18561, "b": 405.85733, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 18, "end_row_offset_idx": 19, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 409.12424000000004, "r": 411.27048, "b": 418.33722, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 19, "end_row_offset_idx": 20, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.4 Database Information function: QIBM_DB_SYSMON", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 416.81775, "t": 409.12424000000004, "r": 547.17865, "b": 418.33722, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 19, "end_row_offset_idx": 20, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . 9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 421.60413, "r": 536.03589, "b": 430.81711, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 20, "end_row_offset_idx": 21, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.5 Security Administrator function: QIBM_DB_SECADM . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.59894, "t": 421.60413, "r": 547.16193, "b": 430.81711, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 20, "end_row_offset_idx": 21, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 434.1437700000001, "r": 530.57318, "b": 443.35675, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 21, "end_row_offset_idx": 22, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.6 Change Function Usage CL command . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.10443, "t": 434.1437700000001, "r": 547.16687, "b": 443.35675, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 21, "end_row_offset_idx": 22, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "10", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 446.62366, "r": 530.53522, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 22, "end_row_offset_idx": 23, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.7 Verifying function usage IDs for RCAC with the FUNCTION_USAGE view . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.0755, "t": 446.62366, "r": 547.15601, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 22, "end_row_offset_idx": 23, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "10", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79704, "t": 459.10355, "r": 547.25659, "b": 468.31653, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 23, "end_row_offset_idx": 24, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.2 Separation of duties . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79703, "t": 481.60318, "r": 530.53961, "b": 490.81616, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 24, "end_row_offset_idx": 25, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Chapter 3. Row and Column Access Control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.09167, "t": 481.60318, "r": 547.1958, "b": 490.81616, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 24, "end_row_offset_idx": 25, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "13", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79703, "t": 493.603, "r": 530.4809, "b": 502.81598, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 25, "end_row_offset_idx": 26, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.1 Explanation of RCAC and the concept of access control . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.04248, "t": 493.603, "r": 547.16571, "b": 502.81598, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 25, "end_row_offset_idx": 26, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "14", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19719, "t": 506.14264, "r": 378.20786, "b": 515.35562, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 26, "end_row_offset_idx": 27, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.1.1 Row permission and column mask definitions", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 383.74713, "t": 506.14264, "r": 547.15576, "b": 515.35562, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 26, "end_row_offset_idx": 27, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . 14", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19719, "t": 518.62253, "r": 530.43475, "b": 527.83551, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 27, "end_row_offset_idx": 28, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.1.2 Enabling and activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 535.99622, "t": 518.62253, "r": 547.11908, "b": 527.83551, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 27, "end_row_offset_idx": 28, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "16", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79703, "t": 531.1621700000001, "r": 530.52808, "b": 540.37517, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 28, "end_row_offset_idx": 29, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.2 Special registers and built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.06702, "t": 531.1621700000001, "r": 547.14484, "b": 540.37517, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 28, "end_row_offset_idx": 29, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "18", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19719, "t": 543.64204, "r": 530.49786, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 29, "end_row_offset_idx": 30, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.2.1 Special registers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.05188, "t": 543.64204, "r": 547.15991, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 29, "end_row_offset_idx": 30, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "18", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19719, "t": 556.12192, "r": 530.56024, "b": 565.33492, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 30, "end_row_offset_idx": 31, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.2.2 Built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.09912, "t": 556.12192, "r": 547.17688, "b": 565.33492, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 30, "end_row_offset_idx": 31, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "19", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79703, "t": 568.66156, "r": 530.53027, "b": 577.87456, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 31, "end_row_offset_idx": 32, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.3 VERIFY_GROUP_FOR_USER function . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.06152, "t": 568.66156, "r": 547.12402, "b": 577.87456, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 31, "end_row_offset_idx": 32, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "20", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79703, "t": 581.14143, "r": 530.62994, "b": 590.35443, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 32, "end_row_offset_idx": 33, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.4 Establishing and controlling accessibility by using the RCAC rule text . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.16315, "t": 581.14143, "r": 547.22955, "b": 590.35443, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 32, "end_row_offset_idx": 33, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "21", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79701, "t": 593.62131, "r": 530.56512, "b": 615.37395, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 34, "end_row_offset_idx": 35, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.5 SELECT, INSERT, and UPDATE behavior with RCAC 3.6 Human resources example . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 400.32065, "t": 593.62131, "r": 530.48358, "b": 602.8343, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 33, "end_row_offset_idx": 34, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": ". . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.0224, "t": 593.62131, "r": 547.1001, "b": 602.8343, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 33, "end_row_offset_idx": 34, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "22", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.112, "t": 606.16095, "r": 547.20575, "b": 615.37395, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 34, "end_row_offset_idx": 35, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "22", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717, "t": 618.64082, "r": 530.49139, "b": 627.85382, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 35, "end_row_offset_idx": 36, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.1 Assigning the QIBM_DB_SECADM function ID to the consultants. . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.04633, "t": 618.64082, "r": 547.15619, "b": 627.85382, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 35, "end_row_offset_idx": 36, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "23", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717, "t": 631.1206999999999, "r": 530.56458, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 36, "end_row_offset_idx": 37, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.2 Creating group profiles for the users and their roles . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.09601, "t": 631.1206999999999, "r": 547.15875, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 36, "end_row_offset_idx": 37, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "23", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717, "t": 643.66034, "r": 530.55695, "b": 652.87334, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 37, "end_row_offset_idx": 38, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.3 Demonstrating data access without RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.0882, "t": 643.66034, "r": 547.15076, "b": 652.87334, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 37, "end_row_offset_idx": 38, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "24", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717, "t": 656.14021, "r": 530.53412, "b": 665.35321, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 38, "end_row_offset_idx": 39, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.4 Defining and creating row permissions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.073, "t": 656.14021, "r": 547.15088, "b": 665.35321, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 38, "end_row_offset_idx": 39, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "25", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717, "t": 668.62009, "r": 339.45105, "b": 677.83309, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 39, "end_row_offset_idx": 40, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.5 Defining and creating column masks", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 344.98996, "t": 668.62009, "r": 547.16089, "b": 677.83309, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 39, "end_row_offset_idx": 40, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717, "t": 681.15973, "r": 530.54102, "b": 690.37273, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 40, "end_row_offset_idx": 41, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.6 Activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.08765, "t": 681.15973, "r": 547.18085, "b": 690.37273, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 40, "end_row_offset_idx": 41, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "28", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717, "t": 693.63961, "r": 530.57507, "b": 702.852615, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 41, "end_row_offset_idx": 42, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.7 Demonstrating data access with RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.10663, "t": 693.63961, "r": 547.16968, "b": 702.852615, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 41, "end_row_offset_idx": 42, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "29", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717, "t": 706.119492, "r": 530.43628, "b": 715.332497, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 42, "end_row_offset_idx": 43, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.8 Demonstrating data access with a view and RCAC . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 535.99847, "t": 706.119492, "r": 547.12286, "b": 715.332497, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 42, "end_row_offset_idx": 43, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "32", "column_header": false, "row_header": false, "row_section": false}]}], "body": [{"label": "section_header", "id": 1, "page_no": 1, "cluster": {"id": 1, "label": "section_header", "bbox": {"l": 64.800003, "t": 73.84802000000002, "r": 168.73441, "b": 96.04803000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9509141445159912, "cells": [{"id": 2, "text": "Contents", "bbox": {"l": 64.800003, "t": 73.84802000000002, "r": 168.73441, "b": 96.04803000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Contents"}, {"label": "document_index", "id": 0, "page_no": 1, "cluster": {"id": 0, "label": "document_index", "bbox": {"l": 136.1495819091797, "t": 132.0330352783203, "r": 547.52685546875, "b": 715.6515502929688, "coord_origin": "TOPLEFT"}, "confidence": 0.9803680181503296, "cells": [{"id": 3, "text": "Notices", "bbox": {"l": 136.8, "t": 132.64862000000005, "r": 172.89404, "b": 141.86163, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vii", "bbox": {"l": 175.01952, "t": 132.64862000000005, "r": 547.18982, "b": 141.86163, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Trademarks", "bbox": {"l": 136.79901, "t": 145.12847999999997, "r": 189.86537, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 195.39685, "t": 145.12847999999997, "r": 530.05121, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "viii", "bbox": {"l": 535.5827, "t": 145.12847999999997, "r": 547.18286, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "DB2 for i Center of Excellence", "bbox": {"l": 136.79901, "t": 167.62811, "r": 279.39731, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ix", "bbox": {"l": 280.61942, "t": 167.62811, "r": 547.1908, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Preface", "bbox": {"l": 136.79901, "t": 190.12775, "r": 172.84424, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi", "bbox": {"l": 175.01852, "t": 190.12775, "r": 547.18286, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Authors . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi", "bbox": {"l": 136.79803, "t": 202.60760000000005, "r": 547.18085, "b": 211.82061999999996, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Now you can become a published author, too!", "bbox": {"l": 136.79803, "t": 215.14721999999995, "r": 339.18292, "b": 224.36023, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 344.71411, "t": 215.14721999999995, "r": 530.00812, "b": 224.36023, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "xiii", "bbox": {"l": 535.53925, "t": 215.14721999999995, "r": 547.13879, "b": 224.36023, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Comments welcome. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 136.79803, "t": 227.62707999999998, "r": 529.99506, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "xiii", "bbox": {"l": 535.5495, "t": 227.62707999999998, "r": 547.19788, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Stay connected to IBM Redbooks", "bbox": {"l": 136.79807, "t": 240.10693000000003, "r": 284.02866, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 289.54449, "t": 240.10693000000003, "r": 529.48242, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "xiv", "bbox": {"l": 534.99829, "t": 240.10693000000003, "r": 547.12115, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Chapter 1. Securing and protecting IBM DB2 data", "bbox": {"l": 136.79807, "t": 262.60657000000003, "r": 373.17566, "b": 271.81958, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 375.11798, "t": 262.60657000000003, "r": 536.09589, "b": 271.81958, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "1", "bbox": {"l": 541.64685, "t": 262.60657000000003, "r": 547.19781, "b": 271.81958, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "1.1", "bbox": {"l": 136.79808, "t": 274.60637999999994, "r": 150.88702, "b": 283.8194, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "Security fundamentals. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2", "bbox": {"l": 156.5226, "t": 274.60637999999994, "r": 549.84723, "b": 283.8194, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "1.2", "bbox": {"l": 136.79807, "t": 287.14606000000003, "r": 150.62746, "b": 296.35904, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Current state of IBM i security . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.15923, "t": 287.14606000000003, "r": 536.12933, "b": 296.35904, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "2", "bbox": {"l": 541.66113, "t": 287.14606000000003, "r": 547.19287, "b": 296.35904, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "1.3", "bbox": {"l": 136.79807, "t": 299.62595, "r": 150.84943, "b": 308.83893, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "DB2 for i security controls . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3", "bbox": {"l": 156.46996, "t": 299.62595, "r": 549.84723, "b": 308.83893, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "1.3.1", "bbox": {"l": 151.1972, "t": 312.1058300000001, "r": 173.38289, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Existing row and column control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.92932, "t": 312.1058300000001, "r": 536.05511, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "4", "bbox": {"l": 541.6015, "t": 312.1058300000001, "r": 547.14795, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "1.3.2", "bbox": {"l": 151.1972, "t": 324.64548, "r": 173.4189, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "New controls: Row and Column Access Control. . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.97432, "t": 324.64548, "r": 536.08008, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "5", "bbox": {"l": 541.6355, "t": 324.64548, "r": 547.19092, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "Chapter 2. Roles and separation of duties", "bbox": {"l": 136.79704, "t": 347.14511, "r": 336.82071, "b": 356.35809, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 338.99701, "t": 347.14511, "r": 536.09088, "b": 356.35809, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "7", "bbox": {"l": 541.64282, "t": 347.14511, "r": 547.19476, "b": 356.35809, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "2.1", "bbox": {"l": 136.79704, "t": 359.14493, "r": 150.644, "b": 368.35791, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Roles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.18277, "t": 359.14493, "r": 536.12714, "b": 368.35791, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "8", "bbox": {"l": 541.66589, "t": 359.14493, "r": 547.20471, "b": 368.35791, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "2.1.1", "bbox": {"l": 151.1972, "t": 371.62482, "r": 173.60995, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "DDM and DRDA application server access: QIBM_DB_DDMDRDA . . . . . . . . . . .", "bbox": {"l": 176.41154, "t": 371.62482, "r": 535.9527, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "8", "bbox": {"l": 541.55585, "t": 371.62482, "r": 547.15906, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "2.1.2", "bbox": {"l": 151.1972, "t": 384.10470999999995, "r": 173.41664, "b": 393.31769, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "Toolbox application server access: QIBM_DB_ZDA. . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.97151, "t": 384.10470999999995, "r": 536.04108, "b": 393.31769, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "8", "bbox": {"l": 541.59595, "t": 384.10470999999995, "r": 547.15082, "b": 393.31769, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "2.1.3", "bbox": {"l": 151.1972, "t": 396.64435, "r": 173.41859, "b": 405.85733, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Database Administrator function: QIBM_DB_SQLADM . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.97394, "t": 396.64435, "r": 536.07489, "b": 405.85733, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "9", "bbox": {"l": 541.63025, "t": 396.64435, "r": 547.18561, "b": 405.85733, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "2.1.4", "bbox": {"l": 151.1972, "t": 409.12424000000004, "r": 173.38629, "b": 418.33722, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Database Information function: QIBM_DB_SYSMON", "bbox": {"l": 178.93356, "t": 409.12424000000004, "r": 411.27048, "b": 418.33722, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": ". . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 416.81775, "t": 409.12424000000004, "r": 536.08411, "b": 418.33722, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "9", "bbox": {"l": 541.63135, "t": 409.12424000000004, "r": 547.17865, "b": 418.33722, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "2.1.5", "bbox": {"l": 151.1972, "t": 421.60413, "r": 173.44926, "b": 430.81711, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Security Administrator function: QIBM_DB_SECADM . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 179.01228, "t": 421.60413, "r": 536.03589, "b": 430.81711, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "9", "bbox": {"l": 541.59894, "t": 421.60413, "r": 547.16193, "b": 430.81711, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "2.1.6", "bbox": {"l": 151.1972, "t": 434.1437700000001, "r": 173.32208, "b": 443.35675, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Change Function Usage CL command . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.8533, "t": 434.1437700000001, "r": 530.57318, "b": 443.35675, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "10", "bbox": {"l": 536.10443, "t": 434.1437700000001, "r": 547.16687, "b": 443.35675, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "2.1.7", "bbox": {"l": 151.1972, "t": 446.62366, "r": 173.35822, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "Verifying function usage IDs for RCAC with the FUNCTION_USAGE view . . . . .", "bbox": {"l": 178.89848, "t": 446.62366, "r": 530.53522, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "10", "bbox": {"l": 536.0755, "t": 446.62366, "r": 547.15601, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "2.2", "bbox": {"l": 136.79704, "t": 459.10355, "r": 150.85457, "b": 468.31653, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "Separation of duties . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10", "bbox": {"l": 156.47758, "t": 459.10355, "r": 547.25659, "b": 468.31653, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "Chapter 3. Row and Column Access Control", "bbox": {"l": 136.79703, "t": 481.60318, "r": 348.68503, "b": 490.81616, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 350.09741, "t": 481.60318, "r": 530.53961, "b": 490.81616, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "13", "bbox": {"l": 536.09167, "t": 481.60318, "r": 547.1958, "b": 490.81616, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "3.1", "bbox": {"l": 136.79703, "t": 493.603, "r": 150.70105, "b": 502.81598, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Explanation of RCAC and the concept of access control . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.26266, "t": 493.603, "r": 530.4809, "b": 502.81598, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "14", "bbox": {"l": 536.04248, "t": 493.603, "r": 547.16571, "b": 502.81598, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "3.1.1", "bbox": {"l": 151.19719, "t": 506.14264, "r": 173.35429, "b": 515.35562, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "Row permission and column mask definitions", "bbox": {"l": 178.89357, "t": 506.14264, "r": 378.20786, "b": 515.35562, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 383.74713, "t": 506.14264, "r": 530.5379, "b": 515.35562, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "14", "bbox": {"l": 536.07721, "t": 506.14264, "r": 547.15576, "b": 515.35562, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "3.1.2", "bbox": {"l": 151.19719, "t": 518.62253, "r": 173.44292, "b": 527.83551, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "Enabling and activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 179.00435, "t": 518.62253, "r": 530.43475, "b": 527.83551, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "16", "bbox": {"l": 535.99622, "t": 518.62253, "r": 547.11908, "b": 527.83551, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "3.2", "bbox": {"l": 136.79703, "t": 531.1621700000001, "r": 150.64432, "b": 540.37517, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Special registers and built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.18323, "t": 531.1621700000001, "r": 530.52808, "b": 540.37517, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "18", "bbox": {"l": 536.06702, "t": 531.1621700000001, "r": 547.14484, "b": 540.37517, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "3.2.1", "bbox": {"l": 151.19719, "t": 543.64204, "r": 173.41321, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "Special registers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.96722, "t": 543.64204, "r": 530.49786, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "18", "bbox": {"l": 536.05188, "t": 543.64204, "r": 547.15991, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "3.2.2", "bbox": {"l": 151.19719, "t": 556.12192, "r": 173.35269, "b": 565.33492, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.89156, "t": 556.12192, "r": 530.56024, "b": 565.33492, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "19", "bbox": {"l": 536.09912, "t": 556.12192, "r": 547.17688, "b": 565.33492, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "3.3", "bbox": {"l": 136.79703, "t": 568.66156, "r": 150.62514, "b": 577.87456, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "VERIFY_GROUP_FOR_USER function . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.15639, "t": 568.66156, "r": 530.53027, "b": 577.87456, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "20", "bbox": {"l": 536.06152, "t": 568.66156, "r": 547.12402, "b": 577.87456, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "3.4", "bbox": {"l": 136.79703, "t": 581.14143, "r": 150.63004, "b": 590.35443, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "Establishing and controlling accessibility by using the RCAC rule text . . . . . . . . . . . . .", "bbox": {"l": 156.16325, "t": 581.14143, "r": 530.62994, "b": 590.35443, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "21", "bbox": {"l": 536.16315, "t": 581.14143, "r": 547.22955, "b": 590.35443, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "3.5", "bbox": {"l": 136.79701, "t": 593.62131, "r": 150.64413, "b": 602.8343, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "SELECT, INSERT, and UPDATE behavior with RCAC", "bbox": {"l": 156.18298, "t": 593.62131, "r": 394.7818, "b": 602.8343, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": ". . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 400.32065, "t": 593.62131, "r": 530.48358, "b": 602.8343, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "22", "bbox": {"l": 536.0224, "t": 593.62131, "r": 547.1001, "b": 602.8343, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "3.6", "bbox": {"l": 136.79701, "t": 606.16095, "r": 150.6642, "b": 615.37395, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "Human resources example . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.21107, "t": 606.16095, "r": 530.56512, "b": 615.37395, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "22", "bbox": {"l": 536.112, "t": 606.16095, "r": 547.20575, "b": 615.37395, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "3.6.1", "bbox": {"l": 151.19717, "t": 618.64082, "r": 173.41692, "b": 627.85382, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "Assigning the QIBM_DB_SECADM function ID to the consultants. . . . . . . . . . . .", "bbox": {"l": 178.97185, "t": 618.64082, "r": 530.49139, "b": 627.85382, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "23", "bbox": {"l": 536.04633, "t": 618.64082, "r": 547.15619, "b": 627.85382, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "3.6.2", "bbox": {"l": 151.19717, "t": 631.1206999999999, "r": 173.32271, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "Creating group profiles for the users and their roles . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.8541, "t": 631.1206999999999, "r": 530.56458, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "23", "bbox": {"l": 536.09601, "t": 631.1206999999999, "r": 547.15875, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "3.6.3", "bbox": {"l": 151.19717, "t": 643.66034, "r": 173.32227, "b": 652.87334, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "Demonstrating data access without RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.85353, "t": 643.66034, "r": 530.55695, "b": 652.87334, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "24", "bbox": {"l": 536.0882, "t": 643.66034, "r": 547.15076, "b": 652.87334, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "3.6.4", "bbox": {"l": 151.19717, "t": 656.14021, "r": 173.35289, "b": 665.35321, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "Defining and creating row permissions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.89182, "t": 656.14021, "r": 530.53412, "b": 665.35321, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "25", "bbox": {"l": 536.073, "t": 656.14021, "r": 547.15088, "b": 665.35321, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "3.6.5", "bbox": {"l": 151.19717, "t": 668.62009, "r": 173.35289, "b": 677.83309, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "Defining and creating column masks", "bbox": {"l": 178.89182, "t": 668.62009, "r": 339.45105, "b": 677.83309, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 344.98996, "t": 668.62009, "r": 530.54413, "b": 677.83309, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "26", "bbox": {"l": 536.08301, "t": 668.62009, "r": 547.16089, "b": 677.83309, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "3.6.6", "bbox": {"l": 151.19717, "t": 681.15973, "r": 173.38359, "b": 690.37273, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "Activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.93019, "t": 681.15973, "r": 530.54102, "b": 690.37273, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "28", "bbox": {"l": 536.08765, "t": 681.15973, "r": 547.18085, "b": 690.37273, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "3.6.7", "bbox": {"l": 151.19717, "t": 693.63961, "r": 173.32332, "b": 702.852615, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Demonstrating data access with RCAC", "bbox": {"l": 178.85486, "t": 693.63961, "r": 350.80011, "b": 702.852615, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 356.33163, "t": 693.63961, "r": 530.57507, "b": 702.852615, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "29", "bbox": {"l": 536.10663, "t": 693.63961, "r": 547.16968, "b": 702.852615, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "3.6.8", "bbox": {"l": 151.19717, "t": 706.119492, "r": 173.44592, "b": 715.332497, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "Demonstrating data access with a view and RCAC . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 179.00812, "t": 706.119492, "r": 530.43628, "b": 715.332497, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "32", "bbox": {"l": 535.99847, "t": 706.119492, "r": 547.12286, "b": 715.332497, "coord_origin": "TOPLEFT"}}], "children": [{"id": 4, "label": "text", "bbox": {"l": 136.8, "t": 132.64862000000005, "r": 172.89404, "b": 141.86163, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 3, "text": "Notices", "bbox": {"l": 136.8, "t": 132.64862000000005, "r": 172.89404, "b": 141.86163, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "text", "bbox": {"l": 175.01952, "t": 132.64862000000005, "r": 547.18982, "b": 141.86163, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 4, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vii", "bbox": {"l": 175.01952, "t": 132.64862000000005, "r": 547.18982, "b": 141.86163, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "text", "bbox": {"l": 136.79901, "t": 145.12847999999997, "r": 189.86537, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 5, "text": "Trademarks", "bbox": {"l": 136.79901, "t": 145.12847999999997, "r": 189.86537, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "text", "bbox": {"l": 195.39685, "t": 145.12847999999997, "r": 530.05121, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 195.39685, "t": 145.12847999999997, "r": 530.05121, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "text", "bbox": {"l": 535.5827, "t": 145.12847999999997, "r": 547.18286, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "viii", "bbox": {"l": 535.5827, "t": 145.12847999999997, "r": 547.18286, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 136.79901, "t": 167.62811, "r": 279.39731, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "DB2 for i Center of Excellence", "bbox": {"l": 136.79901, "t": 167.62811, "r": 279.39731, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "text", "bbox": {"l": 280.61942, "t": 167.62811, "r": 547.1908, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ix", "bbox": {"l": 280.61942, "t": 167.62811, "r": 547.1908, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 136.79901, "t": 190.12775, "r": 172.84424, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "Preface", "bbox": {"l": 136.79901, "t": 190.12775, "r": 172.84424, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 175.01852, "t": 190.12775, "r": 547.18286, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi", "bbox": {"l": 175.01852, "t": 190.12775, "r": 547.18286, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 136.79803, "t": 202.60760000000005, "r": 547.18085, "b": 211.82061999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "Authors . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi", "bbox": {"l": 136.79803, "t": 202.60760000000005, "r": 547.18085, "b": 211.82061999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 136.79803, "t": 215.14721999999995, "r": 339.18292, "b": 224.36023, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "Now you can become a published author, too!", "bbox": {"l": 136.79803, "t": 215.14721999999995, "r": 339.18292, "b": 224.36023, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 344.71411, "t": 215.14721999999995, "r": 530.00812, "b": 224.36023, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 344.71411, "t": 215.14721999999995, "r": 530.00812, "b": 224.36023, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 535.53925, "t": 215.14721999999995, "r": 547.13879, "b": 224.36023, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "xiii", "bbox": {"l": 535.53925, "t": 215.14721999999995, "r": 547.13879, "b": 224.36023, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 136.79803, "t": 227.62707999999998, "r": 529.99506, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "Comments welcome. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 136.79803, "t": 227.62707999999998, "r": 529.99506, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 535.5495, "t": 227.62707999999998, "r": 547.19788, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "xiii", "bbox": {"l": 535.5495, "t": 227.62707999999998, "r": 547.19788, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 136.79807, "t": 240.10693000000003, "r": 284.02866, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "Stay connected to IBM Redbooks", "bbox": {"l": 136.79807, "t": 240.10693000000003, "r": 284.02866, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 289.54449, "t": 240.10693000000003, "r": 529.48242, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 289.54449, "t": 240.10693000000003, "r": 529.48242, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 534.99829, "t": 240.10693000000003, "r": 547.12115, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "xiv", "bbox": {"l": 534.99829, "t": 240.10693000000003, "r": 547.12115, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 136.79807, "t": 262.60657000000003, "r": 373.17566, "b": 271.81958, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "Chapter 1. Securing and protecting IBM DB2 data", "bbox": {"l": 136.79807, "t": 262.60657000000003, "r": 373.17566, "b": 271.81958, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 375.11798, "t": 262.60657000000003, "r": 536.09589, "b": 271.81958, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 375.11798, "t": 262.60657000000003, "r": 536.09589, "b": 271.81958, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 541.64685, "t": 262.60657000000003, "r": 547.19781, "b": 271.81958, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "1", "bbox": {"l": 541.64685, "t": 262.60657000000003, "r": 547.19781, "b": 271.81958, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 136.79808, "t": 274.60637999999994, "r": 150.88702, "b": 283.8194, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "1.1", "bbox": {"l": 136.79808, "t": 274.60637999999994, "r": 150.88702, "b": 283.8194, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 156.5226, "t": 274.60637999999994, "r": 549.84723, "b": 283.8194, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "Security fundamentals. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2", "bbox": {"l": 156.5226, "t": 274.60637999999994, "r": 549.84723, "b": 283.8194, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 136.79807, "t": 287.14606000000003, "r": 150.62746, "b": 296.35904, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "1.2", "bbox": {"l": 136.79807, "t": 287.14606000000003, "r": 150.62746, "b": 296.35904, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 156.15923, "t": 287.14606000000003, "r": 536.12933, "b": 296.35904, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "Current state of IBM i security . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.15923, "t": 287.14606000000003, "r": 536.12933, "b": 296.35904, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 541.66113, "t": 287.14606000000003, "r": 547.19287, "b": 296.35904, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "2", "bbox": {"l": 541.66113, "t": 287.14606000000003, "r": 547.19287, "b": 296.35904, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 136.79807, "t": 299.62595, "r": 150.84943, "b": 308.83893, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "1.3", "bbox": {"l": 136.79807, "t": 299.62595, "r": 150.84943, "b": 308.83893, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 156.46996, "t": 299.62595, "r": 549.84723, "b": 308.83893, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "DB2 for i security controls . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3", "bbox": {"l": 156.46996, "t": 299.62595, "r": 549.84723, "b": 308.83893, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 151.1972, "t": 312.1058300000001, "r": 173.38289, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "1.3.1", "bbox": {"l": 151.1972, "t": 312.1058300000001, "r": 173.38289, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 178.92932, "t": 312.1058300000001, "r": 536.05511, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "Existing row and column control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.92932, "t": 312.1058300000001, "r": 536.05511, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 541.6015, "t": 312.1058300000001, "r": 547.14795, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "4", "bbox": {"l": 541.6015, "t": 312.1058300000001, "r": 547.14795, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 151.1972, "t": 324.64548, "r": 173.4189, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "1.3.2", "bbox": {"l": 151.1972, "t": 324.64548, "r": 173.4189, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 178.97432, "t": 324.64548, "r": 536.08008, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "New controls: Row and Column Access Control. . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.97432, "t": 324.64548, "r": 536.08008, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 541.6355, "t": 324.64548, "r": 547.19092, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "5", "bbox": {"l": 541.6355, "t": 324.64548, "r": 547.19092, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 136.79704, "t": 347.14511, "r": 336.82071, "b": 356.35809, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "Chapter 2. Roles and separation of duties", "bbox": {"l": 136.79704, "t": 347.14511, "r": 336.82071, "b": 356.35809, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 338.99701, "t": 347.14511, "r": 536.09088, "b": 356.35809, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 338.99701, "t": 347.14511, "r": 536.09088, "b": 356.35809, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 541.64282, "t": 347.14511, "r": 547.19476, "b": 356.35809, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "7", "bbox": {"l": 541.64282, "t": 347.14511, "r": 547.19476, "b": 356.35809, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 136.79704, "t": 359.14493, "r": 150.644, "b": 368.35791, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "2.1", "bbox": {"l": 136.79704, "t": 359.14493, "r": 150.644, "b": 368.35791, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 156.18277, "t": 359.14493, "r": 536.12714, "b": 368.35791, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "Roles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.18277, "t": 359.14493, "r": 536.12714, "b": 368.35791, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 541.66589, "t": 359.14493, "r": 547.20471, "b": 368.35791, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "8", "bbox": {"l": 541.66589, "t": 359.14493, "r": 547.20471, "b": 368.35791, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 151.1972, "t": 371.62482, "r": 173.60995, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "2.1.1", "bbox": {"l": 151.1972, "t": 371.62482, "r": 173.60995, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 176.41154, "t": 371.62482, "r": 535.9527, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "DDM and DRDA application server access: QIBM_DB_DDMDRDA . . . . . . . . . . .", "bbox": {"l": 176.41154, "t": 371.62482, "r": 535.9527, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 541.55585, "t": 371.62482, "r": 547.15906, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "8", "bbox": {"l": 541.55585, "t": 371.62482, "r": 547.15906, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 151.1972, "t": 384.10470999999995, "r": 173.41664, "b": 393.31769, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "2.1.2", "bbox": {"l": 151.1972, "t": 384.10470999999995, "r": 173.41664, "b": 393.31769, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 178.97151, "t": 384.10470999999995, "r": 536.04108, "b": 393.31769, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "Toolbox application server access: QIBM_DB_ZDA. . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.97151, "t": 384.10470999999995, "r": 536.04108, "b": 393.31769, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 541.59595, "t": 384.10470999999995, "r": 547.15082, "b": 393.31769, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "8", "bbox": {"l": 541.59595, "t": 384.10470999999995, "r": 547.15082, "b": 393.31769, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 151.1972, "t": 396.64435, "r": 173.41859, "b": 405.85733, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "2.1.3", "bbox": {"l": 151.1972, "t": 396.64435, "r": 173.41859, "b": 405.85733, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 178.97394, "t": 396.64435, "r": 536.07489, "b": 405.85733, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "Database Administrator function: QIBM_DB_SQLADM . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.97394, "t": 396.64435, "r": 536.07489, "b": 405.85733, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 541.63025, "t": 396.64435, "r": 547.18561, "b": 405.85733, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "9", "bbox": {"l": 541.63025, "t": 396.64435, "r": 547.18561, "b": 405.85733, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 151.1972, "t": 409.12424000000004, "r": 173.38629, "b": 418.33722, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "2.1.4", "bbox": {"l": 151.1972, "t": 409.12424000000004, "r": 173.38629, "b": 418.33722, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 178.93356, "t": 409.12424000000004, "r": 411.27048, "b": 418.33722, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "Database Information function: QIBM_DB_SYSMON", "bbox": {"l": 178.93356, "t": 409.12424000000004, "r": 411.27048, "b": 418.33722, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 416.81775, "t": 409.12424000000004, "r": 536.08411, "b": 418.33722, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": ". . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 416.81775, "t": 409.12424000000004, "r": 536.08411, "b": 418.33722, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 541.63135, "t": 409.12424000000004, "r": 547.17865, "b": 418.33722, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "9", "bbox": {"l": 541.63135, "t": 409.12424000000004, "r": 547.17865, "b": 418.33722, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 151.1972, "t": 421.60413, "r": 173.44926, "b": 430.81711, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "2.1.5", "bbox": {"l": 151.1972, "t": 421.60413, "r": 173.44926, "b": 430.81711, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 179.01228, "t": 421.60413, "r": 536.03589, "b": 430.81711, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "Security Administrator function: QIBM_DB_SECADM . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 179.01228, "t": 421.60413, "r": 536.03589, "b": 430.81711, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 541.59894, "t": 421.60413, "r": 547.16193, "b": 430.81711, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "9", "bbox": {"l": 541.59894, "t": 421.60413, "r": 547.16193, "b": 430.81711, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 151.1972, "t": 434.1437700000001, "r": 173.32208, "b": 443.35675, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "2.1.6", "bbox": {"l": 151.1972, "t": 434.1437700000001, "r": 173.32208, "b": 443.35675, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 178.8533, "t": 434.1437700000001, "r": 530.57318, "b": 443.35675, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "Change Function Usage CL command . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.8533, "t": 434.1437700000001, "r": 530.57318, "b": 443.35675, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 536.10443, "t": 434.1437700000001, "r": 547.16687, "b": 443.35675, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "10", "bbox": {"l": 536.10443, "t": 434.1437700000001, "r": 547.16687, "b": 443.35675, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 151.1972, "t": 446.62366, "r": 173.35822, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "2.1.7", "bbox": {"l": 151.1972, "t": 446.62366, "r": 173.35822, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 178.89848, "t": 446.62366, "r": 530.53522, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "Verifying function usage IDs for RCAC with the FUNCTION_USAGE view . . . . .", "bbox": {"l": 178.89848, "t": 446.62366, "r": 530.53522, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 536.0755, "t": 446.62366, "r": 547.15601, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "10", "bbox": {"l": 536.0755, "t": 446.62366, "r": 547.15601, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 136.79704, "t": 459.10355, "r": 150.85457, "b": 468.31653, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "2.2", "bbox": {"l": 136.79704, "t": 459.10355, "r": 150.85457, "b": 468.31653, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 156.47758, "t": 459.10355, "r": 547.25659, "b": 468.31653, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "Separation of duties . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10", "bbox": {"l": 156.47758, "t": 459.10355, "r": 547.25659, "b": 468.31653, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 136.79703, "t": 481.60318, "r": 348.68503, "b": 490.81616, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "Chapter 3. Row and Column Access Control", "bbox": {"l": 136.79703, "t": 481.60318, "r": 348.68503, "b": 490.81616, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 350.09741, "t": 481.60318, "r": 530.53961, "b": 490.81616, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 350.09741, "t": 481.60318, "r": 530.53961, "b": 490.81616, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 536.09167, "t": 481.60318, "r": 547.1958, "b": 490.81616, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "13", "bbox": {"l": 536.09167, "t": 481.60318, "r": 547.1958, "b": 490.81616, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 136.79703, "t": 493.603, "r": 150.70105, "b": 502.81598, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "3.1", "bbox": {"l": 136.79703, "t": 493.603, "r": 150.70105, "b": 502.81598, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 156.26266, "t": 493.603, "r": 530.4809, "b": 502.81598, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "Explanation of RCAC and the concept of access control . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.26266, "t": 493.603, "r": 530.4809, "b": 502.81598, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 536.04248, "t": 493.603, "r": 547.16571, "b": 502.81598, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "14", "bbox": {"l": 536.04248, "t": 493.603, "r": 547.16571, "b": 502.81598, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 151.19719, "t": 506.14264, "r": 173.35429, "b": 515.35562, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "3.1.1", "bbox": {"l": 151.19719, "t": 506.14264, "r": 173.35429, "b": 515.35562, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 178.89357, "t": 506.14264, "r": 378.20786, "b": 515.35562, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "Row permission and column mask definitions", "bbox": {"l": 178.89357, "t": 506.14264, "r": 378.20786, "b": 515.35562, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 383.74713, "t": 506.14264, "r": 530.5379, "b": 515.35562, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 383.74713, "t": 506.14264, "r": 530.5379, "b": 515.35562, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 536.07721, "t": 506.14264, "r": 547.15576, "b": 515.35562, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "14", "bbox": {"l": 536.07721, "t": 506.14264, "r": 547.15576, "b": 515.35562, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 151.19719, "t": 518.62253, "r": 173.44292, "b": 527.83551, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "3.1.2", "bbox": {"l": 151.19719, "t": 518.62253, "r": 173.44292, "b": 527.83551, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 179.00435, "t": 518.62253, "r": 530.43475, "b": 527.83551, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "Enabling and activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 179.00435, "t": 518.62253, "r": 530.43475, "b": 527.83551, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 535.99622, "t": 518.62253, "r": 547.11908, "b": 527.83551, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "16", "bbox": {"l": 535.99622, "t": 518.62253, "r": 547.11908, "b": 527.83551, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 136.79703, "t": 531.1621700000001, "r": 150.64432, "b": 540.37517, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "3.2", "bbox": {"l": 136.79703, "t": 531.1621700000001, "r": 150.64432, "b": 540.37517, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 156.18323, "t": 531.1621700000001, "r": 530.52808, "b": 540.37517, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "Special registers and built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.18323, "t": 531.1621700000001, "r": 530.52808, "b": 540.37517, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 536.06702, "t": 531.1621700000001, "r": 547.14484, "b": 540.37517, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "18", "bbox": {"l": 536.06702, "t": 531.1621700000001, "r": 547.14484, "b": 540.37517, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 151.19719, "t": 543.64204, "r": 173.41321, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "3.2.1", "bbox": {"l": 151.19719, "t": 543.64204, "r": 173.41321, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 178.96722, "t": 543.64204, "r": 530.49786, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "Special registers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.96722, "t": 543.64204, "r": 530.49786, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 536.05188, "t": 543.64204, "r": 547.15991, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "18", "bbox": {"l": 536.05188, "t": 543.64204, "r": 547.15991, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 151.19719, "t": 556.12192, "r": 173.35269, "b": 565.33492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "3.2.2", "bbox": {"l": 151.19719, "t": 556.12192, "r": 173.35269, "b": 565.33492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 178.89156, "t": 556.12192, "r": 530.56024, "b": 565.33492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "Built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.89156, "t": 556.12192, "r": 530.56024, "b": 565.33492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 536.09912, "t": 556.12192, "r": 547.17688, "b": 565.33492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "19", "bbox": {"l": 536.09912, "t": 556.12192, "r": 547.17688, "b": 565.33492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 136.79703, "t": 568.66156, "r": 150.62514, "b": 577.87456, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "3.3", "bbox": {"l": 136.79703, "t": 568.66156, "r": 150.62514, "b": 577.87456, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 156.15639, "t": 568.66156, "r": 530.53027, "b": 577.87456, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "VERIFY_GROUP_FOR_USER function . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.15639, "t": 568.66156, "r": 530.53027, "b": 577.87456, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 536.06152, "t": 568.66156, "r": 547.12402, "b": 577.87456, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "20", "bbox": {"l": 536.06152, "t": 568.66156, "r": 547.12402, "b": 577.87456, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 136.79703, "t": 581.14143, "r": 150.63004, "b": 590.35443, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "3.4", "bbox": {"l": 136.79703, "t": 581.14143, "r": 150.63004, "b": 590.35443, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 156.16325, "t": 581.14143, "r": 530.62994, "b": 590.35443, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "Establishing and controlling accessibility by using the RCAC rule text . . . . . . . . . . . . .", "bbox": {"l": 156.16325, "t": 581.14143, "r": 530.62994, "b": 590.35443, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 536.16315, "t": 581.14143, "r": 547.22955, "b": 590.35443, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "21", "bbox": {"l": 536.16315, "t": 581.14143, "r": 547.22955, "b": 590.35443, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 136.79701, "t": 593.62131, "r": 150.64413, "b": 602.8343, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "3.5", "bbox": {"l": 136.79701, "t": 593.62131, "r": 150.64413, "b": 602.8343, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 156.18298, "t": 593.62131, "r": 394.7818, "b": 602.8343, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "SELECT, INSERT, and UPDATE behavior with RCAC", "bbox": {"l": 156.18298, "t": 593.62131, "r": 394.7818, "b": 602.8343, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 400.32065, "t": 593.62131, "r": 530.48358, "b": 602.8343, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": ". . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 400.32065, "t": 593.62131, "r": 530.48358, "b": 602.8343, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 536.0224, "t": 593.62131, "r": 547.1001, "b": 602.8343, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "22", "bbox": {"l": 536.0224, "t": 593.62131, "r": 547.1001, "b": 602.8343, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 136.79701, "t": 606.16095, "r": 150.6642, "b": 615.37395, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "3.6", "bbox": {"l": 136.79701, "t": 606.16095, "r": 150.6642, "b": 615.37395, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 156.21107, "t": 606.16095, "r": 530.56512, "b": 615.37395, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "Human resources example . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.21107, "t": 606.16095, "r": 530.56512, "b": 615.37395, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 536.112, "t": 606.16095, "r": 547.20575, "b": 615.37395, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "22", "bbox": {"l": 536.112, "t": 606.16095, "r": 547.20575, "b": 615.37395, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 151.19717, "t": 618.64082, "r": 173.41692, "b": 627.85382, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "3.6.1", "bbox": {"l": 151.19717, "t": 618.64082, "r": 173.41692, "b": 627.85382, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 178.97185, "t": 618.64082, "r": 530.49139, "b": 627.85382, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": "Assigning the QIBM_DB_SECADM function ID to the consultants. . . . . . . . . . . .", "bbox": {"l": 178.97185, "t": 618.64082, "r": 530.49139, "b": 627.85382, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 536.04633, "t": 618.64082, "r": 547.15619, "b": 627.85382, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "23", "bbox": {"l": 536.04633, "t": 618.64082, "r": 547.15619, "b": 627.85382, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 151.19717, "t": 631.1206999999999, "r": 173.32271, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "3.6.2", "bbox": {"l": 151.19717, "t": 631.1206999999999, "r": 173.32271, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 178.8541, "t": 631.1206999999999, "r": 530.56458, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": "Creating group profiles for the users and their roles . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.8541, "t": 631.1206999999999, "r": 530.56458, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 536.09601, "t": 631.1206999999999, "r": 547.15875, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 107, "text": "23", "bbox": {"l": 536.09601, "t": 631.1206999999999, "r": 547.15875, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 151.19717, "t": 643.66034, "r": 173.32227, "b": 652.87334, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 108, "text": "3.6.3", "bbox": {"l": 151.19717, "t": 643.66034, "r": 173.32227, "b": 652.87334, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 178.85353, "t": 643.66034, "r": 530.55695, "b": 652.87334, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 109, "text": "Demonstrating data access without RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.85353, "t": 643.66034, "r": 530.55695, "b": 652.87334, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 536.0882, "t": 643.66034, "r": 547.15076, "b": 652.87334, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 110, "text": "24", "bbox": {"l": 536.0882, "t": 643.66034, "r": 547.15076, "b": 652.87334, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 151.19717, "t": 656.14021, "r": 173.35289, "b": 665.35321, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 111, "text": "3.6.4", "bbox": {"l": 151.19717, "t": 656.14021, "r": 173.35289, "b": 665.35321, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 178.89182, "t": 656.14021, "r": 530.53412, "b": 665.35321, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 112, "text": "Defining and creating row permissions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.89182, "t": 656.14021, "r": 530.53412, "b": 665.35321, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 114, "label": "text", "bbox": {"l": 536.073, "t": 656.14021, "r": 547.15088, "b": 665.35321, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 113, "text": "25", "bbox": {"l": 536.073, "t": 656.14021, "r": 547.15088, "b": 665.35321, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 115, "label": "text", "bbox": {"l": 151.19717, "t": 668.62009, "r": 173.35289, "b": 677.83309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 114, "text": "3.6.5", "bbox": {"l": 151.19717, "t": 668.62009, "r": 173.35289, "b": 677.83309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 116, "label": "text", "bbox": {"l": 178.89182, "t": 668.62009, "r": 339.45105, "b": 677.83309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 115, "text": "Defining and creating column masks", "bbox": {"l": 178.89182, "t": 668.62009, "r": 339.45105, "b": 677.83309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 117, "label": "text", "bbox": {"l": 344.98996, "t": 668.62009, "r": 530.54413, "b": 677.83309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 116, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 344.98996, "t": 668.62009, "r": 530.54413, "b": 677.83309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 118, "label": "text", "bbox": {"l": 536.08301, "t": 668.62009, "r": 547.16089, "b": 677.83309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 117, "text": "26", "bbox": {"l": 536.08301, "t": 668.62009, "r": 547.16089, "b": 677.83309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 119, "label": "text", "bbox": {"l": 151.19717, "t": 681.15973, "r": 173.38359, "b": 690.37273, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 118, "text": "3.6.6", "bbox": {"l": 151.19717, "t": 681.15973, "r": 173.38359, "b": 690.37273, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 120, "label": "text", "bbox": {"l": 178.93019, "t": 681.15973, "r": 530.54102, "b": 690.37273, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 119, "text": "Activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.93019, "t": 681.15973, "r": 530.54102, "b": 690.37273, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 121, "label": "text", "bbox": {"l": 536.08765, "t": 681.15973, "r": 547.18085, "b": 690.37273, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 120, "text": "28", "bbox": {"l": 536.08765, "t": 681.15973, "r": 547.18085, "b": 690.37273, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 122, "label": "text", "bbox": {"l": 151.19717, "t": 693.63961, "r": 173.32332, "b": 702.852615, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 121, "text": "3.6.7", "bbox": {"l": 151.19717, "t": 693.63961, "r": 173.32332, "b": 702.852615, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 123, "label": "text", "bbox": {"l": 178.85486, "t": 693.63961, "r": 350.80011, "b": 702.852615, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 122, "text": "Demonstrating data access with RCAC", "bbox": {"l": 178.85486, "t": 693.63961, "r": 350.80011, "b": 702.852615, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 124, "label": "text", "bbox": {"l": 356.33163, "t": 693.63961, "r": 530.57507, "b": 702.852615, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 123, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 356.33163, "t": 693.63961, "r": 530.57507, "b": 702.852615, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 125, "label": "text", "bbox": {"l": 536.10663, "t": 693.63961, "r": 547.16968, "b": 702.852615, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 124, "text": "29", "bbox": {"l": 536.10663, "t": 693.63961, "r": 547.16968, "b": 702.852615, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 126, "label": "text", "bbox": {"l": 151.19717, "t": 706.119492, "r": 173.44592, "b": 715.332497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 125, "text": "3.6.8", "bbox": {"l": 151.19717, "t": 706.119492, "r": 173.44592, "b": 715.332497, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 127, "label": "text", "bbox": {"l": 179.00812, "t": 706.119492, "r": 530.43628, "b": 715.332497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 126, "text": "Demonstrating data access with a view and RCAC . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 179.00812, "t": 706.119492, "r": 530.43628, "b": 715.332497, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 128, "label": "text", "bbox": {"l": 535.99847, "t": 706.119492, "r": 547.12286, "b": 715.332497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 127, "text": "32", "bbox": {"l": 535.99847, "t": 706.119492, "r": 547.12286, "b": 715.332497, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 43, "num_cols": 2, "table_cells": [{"bbox": {"l": 136.8, "t": 132.64862000000005, "r": 172.89404, "b": 141.86163, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Notices", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 175.01952, "t": 132.64862000000005, "r": 547.18982, "b": 141.86163, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vii", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79901, "t": 145.12847999999997, "r": 189.86537, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Trademarks", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 195.39685, "t": 145.12847999999997, "r": 547.18286, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . viii", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79901, "t": 167.62811, "r": 279.39731, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "DB2 for i Center of Excellence", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.61942, "t": 167.62811, "r": 547.1908, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ix", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79901, "t": 190.12775, "r": 172.84424, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Preface", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 175.01852, "t": 190.12775, "r": 547.18286, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79803, "t": 202.60760000000005, "r": 547.18085, "b": 211.82061999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Authors . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79803, "t": 215.14721999999995, "r": 339.18292, "b": 224.36023, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Now you can become a published author, too!", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 344.71411, "t": 215.14721999999995, "r": 547.13879, "b": 224.36023, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xiii", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79803, "t": 227.62707999999998, "r": 529.99506, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Comments welcome. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 535.5495, "t": 227.62707999999998, "r": 547.19788, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "xiii", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79807, "t": 240.10693000000003, "r": 284.02866, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Stay connected to IBM Redbooks", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.54449, "t": 240.10693000000003, "r": 547.12115, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xiv", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79807, "t": 262.60657000000003, "r": 536.09589, "b": 271.81958, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Chapter 1. Securing and protecting IBM DB2 data  . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.64685, "t": 262.60657000000003, "r": 547.19781, "b": 271.81958, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79808, "t": 274.60637999999994, "r": 549.84723, "b": 283.8194, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "1.1 Security fundamentals. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79807, "t": 287.14606000000003, "r": 536.12933, "b": 296.35904, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "1.2 Current state of IBM i security . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.66113, "t": 287.14606000000003, "r": 547.19287, "b": 296.35904, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79807, "t": 299.62595, "r": 549.84723, "b": 308.83893, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "1.3 DB2 for i security controls . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 312.1058300000001, "r": 536.05511, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "1.3.1 Existing row and column control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.6015, "t": 312.1058300000001, "r": 547.14795, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 324.64548, "r": 536.08008, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "1.3.2 New controls: Row and Column Access Control. . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.6355, "t": 324.64548, "r": 547.19092, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79704, "t": 347.14511, "r": 536.09088, "b": 356.35809, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 14, "end_row_offset_idx": 15, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Chapter 2. Roles and separation of duties . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.64282, "t": 347.14511, "r": 547.19476, "b": 356.35809, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 14, "end_row_offset_idx": 15, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79704, "t": 359.14493, "r": 536.12714, "b": 368.35791, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 15, "end_row_offset_idx": 16, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1 Roles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.66589, "t": 359.14493, "r": 547.20471, "b": 368.35791, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 15, "end_row_offset_idx": 16, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 371.62482, "r": 535.9527, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 16, "end_row_offset_idx": 17, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.1 DDM and DRDA application server access: QIBM_DB_DDMDRDA . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.55585, "t": 371.62482, "r": 547.15906, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 16, "end_row_offset_idx": 17, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 384.10470999999995, "r": 536.04108, "b": 393.31769, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 17, "end_row_offset_idx": 18, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.2 Toolbox application server access: QIBM_DB_ZDA. . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.59595, "t": 384.10470999999995, "r": 547.15082, "b": 393.31769, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 17, "end_row_offset_idx": 18, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 396.64435, "r": 536.07489, "b": 405.85733, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 18, "end_row_offset_idx": 19, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.3 Database Administrator function: QIBM_DB_SQLADM . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.63025, "t": 396.64435, "r": 547.18561, "b": 405.85733, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 18, "end_row_offset_idx": 19, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 409.12424000000004, "r": 411.27048, "b": 418.33722, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 19, "end_row_offset_idx": 20, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.4 Database Information function: QIBM_DB_SYSMON", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 416.81775, "t": 409.12424000000004, "r": 547.17865, "b": 418.33722, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 19, "end_row_offset_idx": 20, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . 9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 421.60413, "r": 536.03589, "b": 430.81711, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 20, "end_row_offset_idx": 21, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.5 Security Administrator function: QIBM_DB_SECADM . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.59894, "t": 421.60413, "r": 547.16193, "b": 430.81711, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 20, "end_row_offset_idx": 21, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 434.1437700000001, "r": 530.57318, "b": 443.35675, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 21, "end_row_offset_idx": 22, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.6 Change Function Usage CL command . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.10443, "t": 434.1437700000001, "r": 547.16687, "b": 443.35675, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 21, "end_row_offset_idx": 22, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "10", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 446.62366, "r": 530.53522, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 22, "end_row_offset_idx": 23, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.7 Verifying function usage IDs for RCAC with the FUNCTION_USAGE view . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.0755, "t": 446.62366, "r": 547.15601, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 22, "end_row_offset_idx": 23, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "10", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79704, "t": 459.10355, "r": 547.25659, "b": 468.31653, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 23, "end_row_offset_idx": 24, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.2 Separation of duties . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79703, "t": 481.60318, "r": 530.53961, "b": 490.81616, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 24, "end_row_offset_idx": 25, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Chapter 3. Row and Column Access Control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.09167, "t": 481.60318, "r": 547.1958, "b": 490.81616, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 24, "end_row_offset_idx": 25, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "13", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79703, "t": 493.603, "r": 530.4809, "b": 502.81598, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 25, "end_row_offset_idx": 26, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.1 Explanation of RCAC and the concept of access control . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.04248, "t": 493.603, "r": 547.16571, "b": 502.81598, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 25, "end_row_offset_idx": 26, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "14", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19719, "t": 506.14264, "r": 378.20786, "b": 515.35562, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 26, "end_row_offset_idx": 27, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.1.1 Row permission and column mask definitions", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 383.74713, "t": 506.14264, "r": 547.15576, "b": 515.35562, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 26, "end_row_offset_idx": 27, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . 14", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19719, "t": 518.62253, "r": 530.43475, "b": 527.83551, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 27, "end_row_offset_idx": 28, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.1.2 Enabling and activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 535.99622, "t": 518.62253, "r": 547.11908, "b": 527.83551, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 27, "end_row_offset_idx": 28, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "16", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79703, "t": 531.1621700000001, "r": 530.52808, "b": 540.37517, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 28, "end_row_offset_idx": 29, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.2 Special registers and built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.06702, "t": 531.1621700000001, "r": 547.14484, "b": 540.37517, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 28, "end_row_offset_idx": 29, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "18", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19719, "t": 543.64204, "r": 530.49786, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 29, "end_row_offset_idx": 30, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.2.1 Special registers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.05188, "t": 543.64204, "r": 547.15991, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 29, "end_row_offset_idx": 30, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "18", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19719, "t": 556.12192, "r": 530.56024, "b": 565.33492, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 30, "end_row_offset_idx": 31, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.2.2 Built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.09912, "t": 556.12192, "r": 547.17688, "b": 565.33492, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 30, "end_row_offset_idx": 31, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "19", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79703, "t": 568.66156, "r": 530.53027, "b": 577.87456, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 31, "end_row_offset_idx": 32, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.3 VERIFY_GROUP_FOR_USER function . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.06152, "t": 568.66156, "r": 547.12402, "b": 577.87456, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 31, "end_row_offset_idx": 32, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "20", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79703, "t": 581.14143, "r": 530.62994, "b": 590.35443, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 32, "end_row_offset_idx": 33, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.4 Establishing and controlling accessibility by using the RCAC rule text . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.16315, "t": 581.14143, "r": 547.22955, "b": 590.35443, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 32, "end_row_offset_idx": 33, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "21", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79701, "t": 593.62131, "r": 530.56512, "b": 615.37395, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 34, "end_row_offset_idx": 35, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.5 SELECT, INSERT, and UPDATE behavior with RCAC 3.6 Human resources example . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 400.32065, "t": 593.62131, "r": 530.48358, "b": 602.8343, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 33, "end_row_offset_idx": 34, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": ". . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.0224, "t": 593.62131, "r": 547.1001, "b": 602.8343, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 33, "end_row_offset_idx": 34, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "22", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.112, "t": 606.16095, "r": 547.20575, "b": 615.37395, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 34, "end_row_offset_idx": 35, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "22", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717, "t": 618.64082, "r": 530.49139, "b": 627.85382, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 35, "end_row_offset_idx": 36, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.1 Assigning the QIBM_DB_SECADM function ID to the consultants. . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.04633, "t": 618.64082, "r": 547.15619, "b": 627.85382, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 35, "end_row_offset_idx": 36, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "23", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717, "t": 631.1206999999999, "r": 530.56458, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 36, "end_row_offset_idx": 37, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.2 Creating group profiles for the users and their roles . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.09601, "t": 631.1206999999999, "r": 547.15875, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 36, "end_row_offset_idx": 37, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "23", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717, "t": 643.66034, "r": 530.55695, "b": 652.87334, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 37, "end_row_offset_idx": 38, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.3 Demonstrating data access without RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.0882, "t": 643.66034, "r": 547.15076, "b": 652.87334, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 37, "end_row_offset_idx": 38, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "24", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717, "t": 656.14021, "r": 530.53412, "b": 665.35321, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 38, "end_row_offset_idx": 39, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.4 Defining and creating row permissions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.073, "t": 656.14021, "r": 547.15088, "b": 665.35321, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 38, "end_row_offset_idx": 39, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "25", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717, "t": 668.62009, "r": 339.45105, "b": 677.83309, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 39, "end_row_offset_idx": 40, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.5 Defining and creating column masks", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 344.98996, "t": 668.62009, "r": 547.16089, "b": 677.83309, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 39, "end_row_offset_idx": 40, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717, "t": 681.15973, "r": 530.54102, "b": 690.37273, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 40, "end_row_offset_idx": 41, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.6 Activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.08765, "t": 681.15973, "r": 547.18085, "b": 690.37273, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 40, "end_row_offset_idx": 41, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "28", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717, "t": 693.63961, "r": 530.57507, "b": 702.852615, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 41, "end_row_offset_idx": 42, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.7 Demonstrating data access with RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.10663, "t": 693.63961, "r": 547.16968, "b": 702.852615, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 41, "end_row_offset_idx": 42, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "29", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717, "t": 706.119492, "r": 530.43628, "b": 715.332497, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 42, "end_row_offset_idx": 43, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.8 Demonstrating data access with a view and RCAC . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 535.99847, "t": 706.119492, "r": 547.12286, "b": 715.332497, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 42, "end_row_offset_idx": 43, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "32", "column_header": false, "row_header": false, "row_section": false}]}], "headers": [{"label": "page_footer", "id": 2, "page_no": 1, "cluster": {"id": 2, "label": "page_footer", "bbox": {"l": 64.800003, "t": 755.538002, "r": 257.24335, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9473597407341003, "cells": [{"id": 0, "text": "' Copyright IBM Corp. 2014. All rights reserved.", "bbox": {"l": 64.800003, "t": 755.538002, "r": 257.24335, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "' Copyright IBM Corp. 2014. All rights reserved."}, {"label": "page_footer", "id": 3, "page_no": 1, "cluster": {"id": 3, "label": "page_footer", "bbox": {"l": 538.85999, "t": 754.848721, "r": 547.25928, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.892627477645874, "cells": [{"id": 1, "text": "iii", "bbox": {"l": 538.85999, "t": 754.848721, "r": 547.25928, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "iii"}]}}, {"page_no": 2, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "DB2 for i Center of Excellence", "bbox": {"l": 64.800003, "t": 74.48395000000005, "r": 235.8624, "b": 85.58398, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Solution Brief", "bbox": {"l": 94.132698, "t": 148.63933999999995, "r": 139.54634, "b": 155.33642999999995, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "IBM Systems Lab Services and Training", "bbox": {"l": 94.134933, "t": 138.45012999999994, "r": 233.99973, "b": 145.22162000000003, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Power Services", "bbox": {"l": 461.08859000000007, "t": 138.40752999999995, "r": 506.26178, "b": 145.42181000000005, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "DB2 for i", "bbox": {"l": 280.24011, "t": 239.34265000000005, "r": 354.57022, "b": 256.26153999999997, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Center of Excellence ", "bbox": {"l": 280.24011, "t": 259.70165999999995, "r": 463.80942, "b": 276.62054, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Expert help to achieve your business requirements", "bbox": {"l": 280.24011, "t": 277.59027000000003, "r": 483.29572, "b": 287.45959, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "We build confident, satisfied clients", "bbox": {"l": 280.24011, "t": 315.88161999999994, "r": 443.28210000000007, "b": 324.89566, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "No one else has the vast consulting experiences, skills sharing and ", "bbox": {"l": 280.24011, "t": 327.37595, "r": 488.15466, "b": 334.77994, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "renown service offerings to do what we can do for you.", "bbox": {"l": 280.24011, "t": 337.55551, "r": 452.34018, "b": 344.9595, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Because no one else is IBM.", "bbox": {"l": 280.24011, "t": 357.3260200000001, "r": 367.86023, "b": 364.73001, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "With combined experiences and direct access to development groups, ", "bbox": {"l": 280.24011, "t": 377.09801999999996, "r": 500.32104000000004, "b": 384.50201, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "we\u2019re the experts in IBM DB2\u00ae for i. The DB2 for i Center of ", "bbox": {"l": 280.24011, "t": 387.27759, "r": 479.25497, "b": 394.68158, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Excellence (CoE) can help you achieve-perhaps reexamine and ", "bbox": {"l": 280.24011, "t": 397.45715, "r": 483.4667400000001, "b": 404.86115, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "exceed-your business requirements and gain more confidence and ", "bbox": {"l": 280.24011, "t": 407.63672, "r": 492.97656, "b": 415.04071000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "satisfaction in IBM product data management products and solutions.", "bbox": {"l": 280.24011, "t": 417.81628, "r": 498.87, "b": 425.22027999999995, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Who we are, some of what we do", "bbox": {"l": 280.24011, "t": 437.85403, "r": 434.83205999999996, "b": 446.86807, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "Global CoE engagements cover topics including:", "bbox": {"l": 280.24011, "t": 449.34824000000003, "r": 434.56316999999996, "b": 456.75223, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "r ", "bbox": {"l": 280.24011, "t": 470.95236, "r": 284.0993, "b": 476.16074, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Database performance and scalability", "bbox": {"l": 287.28961, "t": 469.11826, "r": 401.56412, "b": 476.52225, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "r ", "bbox": {"l": 280.24011, "t": 481.13507, "r": 284.0993, "b": 486.34344, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Advanced SQL knowledge and skills transfer", "bbox": {"l": 287.28961, "t": 479.30096, "r": 424.99646, "b": 486.70496, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "r ", "bbox": {"l": 280.24011, "t": 491.31766, "r": 284.0993, "b": 496.52603, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Business intelligence and analytics", "bbox": {"l": 287.28961, "t": 489.48355, "r": 392.15845, "b": 496.88754, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "r ", "bbox": {"l": 280.24011, "t": 501.50037, "r": 284.0993, "b": 506.70874, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "DB2 Web Query", "bbox": {"l": 287.28961, "t": 499.66626, "r": 339.94354, "b": 507.07025, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "r ", "bbox": {"l": 280.24011, "t": 511.68295, "r": 284.0993, "b": 516.8913299999999, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Query/400 modernization for better reporting and analysis capabilities", "bbox": {"l": 287.28961, "t": 509.84885, "r": 504.19314999999995, "b": 517.25284, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "r ", "bbox": {"l": 280.24011, "t": 521.8656599999999, "r": 284.0993, "b": 527.07404, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Database modernization and re-engineering", "bbox": {"l": 287.28961, "t": 520.03156, "r": 423.0022, "b": 527.4355499999999, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "r ", "bbox": {"l": 280.24011, "t": 532.04825, "r": 284.0993, "b": 537.2566400000001, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Data-centric architecture and design", "bbox": {"l": 287.28961, "t": 530.21414, "r": 399.65173, "b": 537.61813, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "r ", "bbox": {"l": 280.24011, "t": 542.23083, "r": 284.0993, "b": 547.43924, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "Extremely large database and overcoming limits to growth", "bbox": {"l": 287.28961, "t": 540.39674, "r": 466.77881, "b": 547.80074, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "r ", "bbox": {"l": 280.24011, "t": 552.41354, "r": 284.0993, "b": 557.62195, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "ISV education and enablement", "bbox": {"l": 287.28961, "t": 550.5794500000001, "r": 382.20956, "b": 557.98344, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Highlights ", "bbox": {"l": 144.88921, "t": 327.46163999999993, "r": 188.74681, "b": 336.81406, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "GLYPH<g115>GLYPH<g3>", "bbox": {"l": 144.88921, "t": 346.01953, "r": 148.68732, "b": 350.60168, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "GLYPH<g40>GLYPH<g81>GLYPH<g75>GLYPH<g68>GLYPH<g81>GLYPH<g70>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 151.9388, "t": 345.21707, "r": 177.25424, "b": 350.85666, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "GLYPH<g87>GLYPH<g75>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 176.9472, "t": 345.21707, "r": 187.11098, "b": 350.85666, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g73>GLYPH<g82>GLYPH<g85>GLYPH<g80>GLYPH<g68>GLYPH<g81>GLYPH<g70>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 186.7914, "t": 345.21707, "r": 222.95989999999998, "b": 350.85666, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "GLYPH<g82>GLYPH<g73>GLYPH<g3>", "bbox": {"l": 222.65912, "t": 345.21707, "r": 229.55193999999997, "b": 350.85666, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "GLYPH<g92>GLYPH<g82>GLYPH<g88>GLYPH<g85> GLYPH<g3>", "bbox": {"l": 229.2261, "t": 345.21707, "r": 242.87389000000002, "b": 350.85666, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "GLYPH<g71>GLYPH<g68>GLYPH<g87>GLYPH<g68>GLYPH<g69>GLYPH<g68>GLYPH<g86>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 151.93253, "t": 353.04984, "r": 178.77066, "b": 358.68942, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "GLYPH<g82>GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g68>GLYPH<g87>GLYPH<g76>GLYPH<g82>GLYPH<g81>GLYPH<g86>", "bbox": {"l": 178.46362, "t": 353.04984, "r": 207.16908, "b": 358.68942, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "GLYPH<g115>GLYPH<g3>", "bbox": {"l": 144.88921, "t": 368.73465, "r": 148.68732, "b": 373.3168, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "GLYPH<g40>GLYPH<g68>GLYPH<g85> GLYPH<g81>GLYPH<g3>", "bbox": {"l": 151.9388, "t": 367.93219, "r": 166.05655, "b": 373.57178, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "GLYPH<g74>GLYPH<g85>GLYPH<g72>GLYPH<g68>GLYPH<g87>GLYPH<g72>GLYPH<g85>GLYPH<g3>", "bbox": {"l": 165.73697, "t": 367.93219, "r": 186.40289, "b": 373.57178, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "GLYPH<g85>GLYPH<g72>GLYPH<g87>GLYPH<g88>GLYPH<g85> GLYPH<g81>GLYPH<g3>", "bbox": {"l": 186.09586, "t": 367.93219, "r": 203.61617, "b": 373.57178, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "GLYPH<g82>GLYPH<g81>GLYPH<g3>", "bbox": {"l": 203.30286, "t": 367.93219, "r": 211.82489, "b": 373.57178, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "GLYPH<g44>GLYPH<g55>GLYPH<g3>", "bbox": {"l": 211.49905, "t": 367.93219, "r": 218.16002, "b": 373.57178, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "GLYPH<g83>GLYPH<g85>GLYPH<g82>GLYPH<g77>GLYPH<g72>GLYPH<g70>GLYPH<g87>GLYPH<g86> GLYPH<g3>", "bbox": {"l": 217.83418, "t": 367.93219, "r": 241.30737, "b": 373.57178, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "GLYPH<g87>GLYPH<g75>GLYPH<g85>GLYPH<g82>GLYPH<g88>GLYPH<g74>GLYPH<g75>GLYPH<g3>", "bbox": {"l": 151.93253, "t": 375.76495, "r": 174.46577, "b": 381.40454, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "GLYPH<g80>GLYPH<g82>GLYPH<g71>GLYPH<g72>GLYPH<g85> GLYPH<g81>GLYPH<g76>GLYPH<g93>GLYPH<g68>GLYPH<g87>GLYPH<g76>GLYPH<g82>GLYPH<g81>GLYPH<g3>", "bbox": {"l": 174.15874, "t": 375.76495, "r": 214.4128, "b": 381.40454, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "GLYPH<g82>GLYPH<g73>GLYPH<g3>", "bbox": {"l": 214.11829, "t": 375.76495, "r": 221.01110999999997, "b": 381.40454, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "GLYPH<g71>GLYPH<g68>GLYPH<g87>GLYPH<g68>GLYPH<g69>GLYPH<g68>GLYPH<g86>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 220.68527, "t": 375.76495, "r": 247.52341000000004, "b": 381.40454, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "GLYPH<g68>GLYPH<g81>GLYPH<g71> GLYPH<g3>", "bbox": {"l": 247.21637, "t": 375.76495, "r": 259.2287, "b": 381.40454, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "GLYPH<g68>GLYPH<g83>GLYPH<g83>GLYPH<g79>GLYPH<g76>GLYPH<g70>GLYPH<g68>GLYPH<g87>GLYPH<g76>GLYPH<g82>GLYPH<g81>GLYPH<g86>", "bbox": {"l": 151.93253, "t": 383.59772, "r": 184.61703, "b": 389.2373, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "GLYPH<g115>GLYPH<g3>", "bbox": {"l": 144.88921, "t": 399.28265, "r": 148.68732, "b": 403.86481000000003, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "GLYPH<g53>GLYPH<g72>GLYPH<g79>GLYPH<g92>GLYPH<g3>", "bbox": {"l": 151.9388, "t": 398.48019, "r": 165.36099, "b": 404.11978, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "GLYPH<g82>GLYPH<g81>GLYPH<g3>", "bbox": {"l": 165.04141, "t": 398.48019, "r": 173.56345, "b": 404.11978, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "GLYPH<g44>GLYPH<g37>GLYPH<g48>GLYPH<g3>", "bbox": {"l": 173.23761, "t": 398.48019, "r": 185.95174, "b": 404.11978, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "GLYPH<g72>GLYPH<g91>GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g87>GLYPH<g3>", "bbox": {"l": 185.63216, "t": 398.48019, "r": 204.42448, "b": 404.11978, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "GLYPH<g70>GLYPH<g82>GLYPH<g81>GLYPH<g86>GLYPH<g88>GLYPH<g79>GLYPH<g87>GLYPH<g76>GLYPH<g81>GLYPH<g74>GLYPH<g15>GLYPH<g3>", "bbox": {"l": 204.11118, "t": 398.48019, "r": 235.29178, "b": 404.11978, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "GLYPH<g86>GLYPH<g78>GLYPH<g76>GLYPH<g79>GLYPH<g79>GLYPH<g86> GLYPH<g3>", "bbox": {"l": 234.99099999999999, "t": 398.48019, "r": 249.83562, "b": 404.11978, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "GLYPH<g86>GLYPH<g75>GLYPH<g68>GLYPH<g85>GLYPH<g76>GLYPH<g81>GLYPH<g74>GLYPH<g3>", "bbox": {"l": 151.93253, "t": 406.31296, "r": 173.41306, "b": 411.95255, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "GLYPH<g68>GLYPH<g81>GLYPH<g71>GLYPH<g3>", "bbox": {"l": 173.10602, "t": 406.31296, "r": 185.0118, "b": 411.95255, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "GLYPH<g85>GLYPH<g72>GLYPH<g81>GLYPH<g82>GLYPH<g90>GLYPH<g81>GLYPH<g3>", "bbox": {"l": 184.69221, "t": 406.31296, "r": 206.3858, "b": 411.95255, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "GLYPH<g86>GLYPH<g72>GLYPH<g85>GLYPH<g89>GLYPH<g76>GLYPH<g70>GLYPH<g72>GLYPH<g86>", "bbox": {"l": 206.07249, "t": 406.31296, "r": 228.24231000000003, "b": 411.95255, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "GLYPH<g115>GLYPH<g3>", "bbox": {"l": 144.88921, "t": 421.99773999999996, "r": 148.68732, "b": 426.5799, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "GLYPH<g55>", "bbox": {"l": 151.9388, "t": 421.1952800000001, "r": 155.43533, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "GLYPH<g68>GLYPH<g78>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 154.73979, "t": 421.1952800000001, "r": 166.06282, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "GLYPH<g68>GLYPH<g71>GLYPH<g89>GLYPH<g68>GLYPH<g81>GLYPH<g87>GLYPH<g68>GLYPH<g74>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 165.74324, "t": 421.1952800000001, "r": 195.84607, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "GLYPH<g82>GLYPH<g73>GLYPH<g3>", "bbox": {"l": 195.53903, "t": 421.1952800000001, "r": 202.43185, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "GLYPH<g68>GLYPH<g70>GLYPH<g70>GLYPH<g72>GLYPH<g86>GLYPH<g86>GLYPH<g3>", "bbox": {"l": 202.10602, "t": 421.1952800000001, "r": 222.87220999999997, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "GLYPH<g87>GLYPH<g82>GLYPH<g3>", "bbox": {"l": 222.55890000000002, "t": 421.1952800000001, "r": 229.57077, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "GLYPH<g68> GLYPH<g3>", "bbox": {"l": 229.24492999999998, "t": 421.1952800000001, "r": 234.25163000000003, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "GLYPH<g90>GLYPH<g82>GLYPH<g85>GLYPH<g79>GLYPH<g71>GLYPH<g90>GLYPH<g76>GLYPH<g71>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 151.92627, "t": 429.02805, "r": 181.42754, "b": 434.66763, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "GLYPH<g86>GLYPH<g82>GLYPH<g88>GLYPH<g85>GLYPH<g70>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 181.1205, "t": 429.02805, "r": 201.07835, "b": 434.66763, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "GLYPH<g82>GLYPH<g73>GLYPH<g3>", "bbox": {"l": 200.76505, "t": 429.02805, "r": 207.65787, "b": 434.66763, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "GLYPH<g72>GLYPH<g91>GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g87>GLYPH<g76>GLYPH<g86>GLYPH<g72>", "bbox": {"l": 207.33203, "t": 429.02805, "r": 232.07098000000002, "b": 434.66763, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 26, "label": "text", "bbox": {"l": 64.800003, "t": 74.48395000000005, "r": 235.8624, "b": 85.58398, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 0, "text": "DB2 for i Center of Excellence", "bbox": {"l": 64.800003, "t": 74.48395000000005, "r": 235.8624, "b": 85.58398, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 94.132698, "t": 138.45012999999994, "r": 233.99973, "b": 155.33642999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.7431558966636658, "cells": [{"id": 1, "text": "Solution Brief", "bbox": {"l": 94.132698, "t": 148.63933999999995, "r": 139.54634, "b": 155.33642999999995, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "IBM Systems Lab Services and Training", "bbox": {"l": 94.134933, "t": 138.45012999999994, "r": 233.99973, "b": 145.22162000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 461.08859000000007, "t": 138.40752999999995, "r": 506.26178, "b": 145.42181000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.7798987627029419, "cells": [{"id": 3, "text": "Power Services", "bbox": {"l": 461.08859000000007, "t": 138.40752999999995, "r": 506.26178, "b": 145.42181000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "section_header", "bbox": {"l": 280.24011, "t": 239.34265000000005, "r": 463.80942, "b": 276.62054, "coord_origin": "TOPLEFT"}, "confidence": 0.7587862610816956, "cells": [{"id": 4, "text": "DB2 for i", "bbox": {"l": 280.24011, "t": 239.34265000000005, "r": 354.57022, "b": 256.26153999999997, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Center of Excellence ", "bbox": {"l": 280.24011, "t": 259.70165999999995, "r": 463.80942, "b": 276.62054, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 280.24011, "t": 277.59027000000003, "r": 483.29572, "b": 287.45959, "coord_origin": "TOPLEFT"}, "confidence": 0.7965631484985352, "cells": [{"id": 6, "text": "Expert help to achieve your business requirements", "bbox": {"l": 280.24011, "t": 277.59027000000003, "r": 483.29572, "b": 287.45959, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "section_header", "bbox": {"l": 280.24011, "t": 315.88161999999994, "r": 443.28210000000007, "b": 324.89566, "coord_origin": "TOPLEFT"}, "confidence": 0.8913540840148926, "cells": [{"id": 7, "text": "We build confident, satisfied clients", "bbox": {"l": 280.24011, "t": 315.88161999999994, "r": 443.28210000000007, "b": 324.89566, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 280.24011, "t": 327.37595, "r": 488.15466, "b": 344.9595, "coord_origin": "TOPLEFT"}, "confidence": 0.9560742378234863, "cells": [{"id": 8, "text": "No one else has the vast consulting experiences, skills sharing and ", "bbox": {"l": 280.24011, "t": 327.37595, "r": 488.15466, "b": 334.77994, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "renown service offerings to do what we can do for you.", "bbox": {"l": 280.24011, "t": 337.55551, "r": 452.34018, "b": 344.9595, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 280.24011, "t": 357.3260200000001, "r": 367.86023, "b": 364.73001, "coord_origin": "TOPLEFT"}, "confidence": 0.8260757327079773, "cells": [{"id": 10, "text": "Because no one else is IBM.", "bbox": {"l": 280.24011, "t": 357.3260200000001, "r": 367.86023, "b": 364.73001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 280.24011, "t": 377.09801999999996, "r": 500.32104000000004, "b": 425.22027999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9764721989631653, "cells": [{"id": 11, "text": "With combined experiences and direct access to development groups, ", "bbox": {"l": 280.24011, "t": 377.09801999999996, "r": 500.32104000000004, "b": 384.50201, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "we\u2019re the experts in IBM DB2\u00ae for i. The DB2 for i Center of ", "bbox": {"l": 280.24011, "t": 387.27759, "r": 479.25497, "b": 394.68158, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Excellence (CoE) can help you achieve-perhaps reexamine and ", "bbox": {"l": 280.24011, "t": 397.45715, "r": 483.4667400000001, "b": 404.86115, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "exceed-your business requirements and gain more confidence and ", "bbox": {"l": 280.24011, "t": 407.63672, "r": 492.97656, "b": 415.04071000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "satisfaction in IBM product data management products and solutions.", "bbox": {"l": 280.24011, "t": 417.81628, "r": 498.87, "b": 425.22027999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "section_header", "bbox": {"l": 280.24011, "t": 437.85403, "r": 434.83205999999996, "b": 446.86807, "coord_origin": "TOPLEFT"}, "confidence": 0.8492125272750854, "cells": [{"id": 16, "text": "Who we are, some of what we do", "bbox": {"l": 280.24011, "t": 437.85403, "r": 434.83205999999996, "b": 446.86807, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 280.24011, "t": 449.34824000000003, "r": 434.56316999999996, "b": 456.75223, "coord_origin": "TOPLEFT"}, "confidence": 0.8440337777137756, "cells": [{"id": 17, "text": "Global CoE engagements cover topics including:", "bbox": {"l": 280.24011, "t": 449.34824000000003, "r": 434.56316999999996, "b": 456.75223, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "list_item", "bbox": {"l": 280.24011, "t": 469.11826, "r": 401.56412, "b": 476.52225, "coord_origin": "TOPLEFT"}, "confidence": 0.9239599108695984, "cells": [{"id": 18, "text": "r ", "bbox": {"l": 280.24011, "t": 470.95236, "r": 284.0993, "b": 476.16074, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Database performance and scalability", "bbox": {"l": 287.28961, "t": 469.11826, "r": 401.56412, "b": 476.52225, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "list_item", "bbox": {"l": 280.24011, "t": 479.30096, "r": 424.99646, "b": 486.70496, "coord_origin": "TOPLEFT"}, "confidence": 0.9239723086357117, "cells": [{"id": 20, "text": "r ", "bbox": {"l": 280.24011, "t": 481.13507, "r": 284.0993, "b": 486.34344, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Advanced SQL knowledge and skills transfer", "bbox": {"l": 287.28961, "t": 479.30096, "r": 424.99646, "b": 486.70496, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "list_item", "bbox": {"l": 280.24011, "t": 489.48355, "r": 392.15845, "b": 496.88754, "coord_origin": "TOPLEFT"}, "confidence": 0.9157899022102356, "cells": [{"id": 22, "text": "r ", "bbox": {"l": 280.24011, "t": 491.31766, "r": 284.0993, "b": 496.52603, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Business intelligence and analytics", "bbox": {"l": 287.28961, "t": 489.48355, "r": 392.15845, "b": 496.88754, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "list_item", "bbox": {"l": 280.24011, "t": 499.66626, "r": 339.94354, "b": 507.07025, "coord_origin": "TOPLEFT"}, "confidence": 0.8733456134796143, "cells": [{"id": 24, "text": "r ", "bbox": {"l": 280.24011, "t": 501.50037, "r": 284.0993, "b": 506.70874, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "DB2 Web Query", "bbox": {"l": 287.28961, "t": 499.66626, "r": 339.94354, "b": 507.07025, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "list_item", "bbox": {"l": 280.24011, "t": 509.84885, "r": 504.19314999999995, "b": 517.25284, "coord_origin": "TOPLEFT"}, "confidence": 0.9249240756034851, "cells": [{"id": 26, "text": "r ", "bbox": {"l": 280.24011, "t": 511.68295, "r": 284.0993, "b": 516.8913299999999, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Query/400 modernization for better reporting and analysis capabilities", "bbox": {"l": 287.28961, "t": 509.84885, "r": 504.19314999999995, "b": 517.25284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "list_item", "bbox": {"l": 280.24011, "t": 520.03156, "r": 423.0022, "b": 527.4355499999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9109315276145935, "cells": [{"id": 28, "text": "r ", "bbox": {"l": 280.24011, "t": 521.8656599999999, "r": 284.0993, "b": 527.07404, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Database modernization and re-engineering", "bbox": {"l": 287.28961, "t": 520.03156, "r": 423.0022, "b": 527.4355499999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "list_item", "bbox": {"l": 280.24011, "t": 530.21414, "r": 399.65173, "b": 537.61813, "coord_origin": "TOPLEFT"}, "confidence": 0.8977465033531189, "cells": [{"id": 30, "text": "r ", "bbox": {"l": 280.24011, "t": 532.04825, "r": 284.0993, "b": 537.2566400000001, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Data-centric architecture and design", "bbox": {"l": 287.28961, "t": 530.21414, "r": 399.65173, "b": 537.61813, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "list_item", "bbox": {"l": 280.24011, "t": 540.39674, "r": 466.77881, "b": 547.80074, "coord_origin": "TOPLEFT"}, "confidence": 0.9218332767486572, "cells": [{"id": 32, "text": "r ", "bbox": {"l": 280.24011, "t": 542.23083, "r": 284.0993, "b": 547.43924, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "Extremely large database and overcoming limits to growth", "bbox": {"l": 287.28961, "t": 540.39674, "r": 466.77881, "b": 547.80074, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "list_item", "bbox": {"l": 280.24011, "t": 550.5794500000001, "r": 382.20956, "b": 557.98344, "coord_origin": "TOPLEFT"}, "confidence": 0.9075438976287842, "cells": [{"id": 34, "text": "r ", "bbox": {"l": 280.24011, "t": 552.41354, "r": 284.0993, "b": 557.62195, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "ISV education and enablement", "bbox": {"l": 287.28961, "t": 550.5794500000001, "r": 382.20956, "b": 557.98344, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "section_header", "bbox": {"l": 144.88921, "t": 327.46163999999993, "r": 188.74681, "b": 336.81406, "coord_origin": "TOPLEFT"}, "confidence": 0.9098502993583679, "cells": [{"id": 36, "text": "Highlights ", "bbox": {"l": 144.88921, "t": 327.46163999999993, "r": 188.74681, "b": 336.81406, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "list_item", "bbox": {"l": 144.88921, "t": 345.21707, "r": 242.87389000000002, "b": 358.68942, "coord_origin": "TOPLEFT"}, "confidence": 0.9571698904037476, "cells": [{"id": 37, "text": "GLYPH<g115>GLYPH<g3>", "bbox": {"l": 144.88921, "t": 346.01953, "r": 148.68732, "b": 350.60168, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "GLYPH<g40>GLYPH<g81>GLYPH<g75>GLYPH<g68>GLYPH<g81>GLYPH<g70>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 151.9388, "t": 345.21707, "r": 177.25424, "b": 350.85666, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "GLYPH<g87>GLYPH<g75>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 176.9472, "t": 345.21707, "r": 187.11098, "b": 350.85666, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g73>GLYPH<g82>GLYPH<g85>GLYPH<g80>GLYPH<g68>GLYPH<g81>GLYPH<g70>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 186.7914, "t": 345.21707, "r": 222.95989999999998, "b": 350.85666, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "GLYPH<g82>GLYPH<g73>GLYPH<g3>", "bbox": {"l": 222.65912, "t": 345.21707, "r": 229.55193999999997, "b": 350.85666, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "GLYPH<g92>GLYPH<g82>GLYPH<g88>GLYPH<g85> GLYPH<g3>", "bbox": {"l": 229.2261, "t": 345.21707, "r": 242.87389000000002, "b": 350.85666, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "GLYPH<g71>GLYPH<g68>GLYPH<g87>GLYPH<g68>GLYPH<g69>GLYPH<g68>GLYPH<g86>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 151.93253, "t": 353.04984, "r": 178.77066, "b": 358.68942, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "GLYPH<g82>GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g68>GLYPH<g87>GLYPH<g76>GLYPH<g82>GLYPH<g81>GLYPH<g86>", "bbox": {"l": 178.46362, "t": 353.04984, "r": 207.16908, "b": 358.68942, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "list_item", "bbox": {"l": 144.88921, "t": 367.93219, "r": 259.2287, "b": 389.2373, "coord_origin": "TOPLEFT"}, "confidence": 0.9634580612182617, "cells": [{"id": 45, "text": "GLYPH<g115>GLYPH<g3>", "bbox": {"l": 144.88921, "t": 368.73465, "r": 148.68732, "b": 373.3168, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "GLYPH<g40>GLYPH<g68>GLYPH<g85> GLYPH<g81>GLYPH<g3>", "bbox": {"l": 151.9388, "t": 367.93219, "r": 166.05655, "b": 373.57178, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "GLYPH<g74>GLYPH<g85>GLYPH<g72>GLYPH<g68>GLYPH<g87>GLYPH<g72>GLYPH<g85>GLYPH<g3>", "bbox": {"l": 165.73697, "t": 367.93219, "r": 186.40289, "b": 373.57178, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "GLYPH<g85>GLYPH<g72>GLYPH<g87>GLYPH<g88>GLYPH<g85> GLYPH<g81>GLYPH<g3>", "bbox": {"l": 186.09586, "t": 367.93219, "r": 203.61617, "b": 373.57178, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "GLYPH<g82>GLYPH<g81>GLYPH<g3>", "bbox": {"l": 203.30286, "t": 367.93219, "r": 211.82489, "b": 373.57178, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "GLYPH<g44>GLYPH<g55>GLYPH<g3>", "bbox": {"l": 211.49905, "t": 367.93219, "r": 218.16002, "b": 373.57178, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "GLYPH<g83>GLYPH<g85>GLYPH<g82>GLYPH<g77>GLYPH<g72>GLYPH<g70>GLYPH<g87>GLYPH<g86> GLYPH<g3>", "bbox": {"l": 217.83418, "t": 367.93219, "r": 241.30737, "b": 373.57178, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "GLYPH<g87>GLYPH<g75>GLYPH<g85>GLYPH<g82>GLYPH<g88>GLYPH<g74>GLYPH<g75>GLYPH<g3>", "bbox": {"l": 151.93253, "t": 375.76495, "r": 174.46577, "b": 381.40454, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "GLYPH<g80>GLYPH<g82>GLYPH<g71>GLYPH<g72>GLYPH<g85> GLYPH<g81>GLYPH<g76>GLYPH<g93>GLYPH<g68>GLYPH<g87>GLYPH<g76>GLYPH<g82>GLYPH<g81>GLYPH<g3>", "bbox": {"l": 174.15874, "t": 375.76495, "r": 214.4128, "b": 381.40454, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "GLYPH<g82>GLYPH<g73>GLYPH<g3>", "bbox": {"l": 214.11829, "t": 375.76495, "r": 221.01110999999997, "b": 381.40454, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "GLYPH<g71>GLYPH<g68>GLYPH<g87>GLYPH<g68>GLYPH<g69>GLYPH<g68>GLYPH<g86>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 220.68527, "t": 375.76495, "r": 247.52341000000004, "b": 381.40454, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "GLYPH<g68>GLYPH<g81>GLYPH<g71> GLYPH<g3>", "bbox": {"l": 247.21637, "t": 375.76495, "r": 259.2287, "b": 381.40454, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "GLYPH<g68>GLYPH<g83>GLYPH<g83>GLYPH<g79>GLYPH<g76>GLYPH<g70>GLYPH<g68>GLYPH<g87>GLYPH<g76>GLYPH<g82>GLYPH<g81>GLYPH<g86>", "bbox": {"l": 151.93253, "t": 383.59772, "r": 184.61703, "b": 389.2373, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "list_item", "bbox": {"l": 144.88921, "t": 398.48019, "r": 249.83562, "b": 411.95255, "coord_origin": "TOPLEFT"}, "confidence": 0.9541198015213013, "cells": [{"id": 58, "text": "GLYPH<g115>GLYPH<g3>", "bbox": {"l": 144.88921, "t": 399.28265, "r": 148.68732, "b": 403.86481000000003, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "GLYPH<g53>GLYPH<g72>GLYPH<g79>GLYPH<g92>GLYPH<g3>", "bbox": {"l": 151.9388, "t": 398.48019, "r": 165.36099, "b": 404.11978, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "GLYPH<g82>GLYPH<g81>GLYPH<g3>", "bbox": {"l": 165.04141, "t": 398.48019, "r": 173.56345, "b": 404.11978, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "GLYPH<g44>GLYPH<g37>GLYPH<g48>GLYPH<g3>", "bbox": {"l": 173.23761, "t": 398.48019, "r": 185.95174, "b": 404.11978, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "GLYPH<g72>GLYPH<g91>GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g87>GLYPH<g3>", "bbox": {"l": 185.63216, "t": 398.48019, "r": 204.42448, "b": 404.11978, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "GLYPH<g70>GLYPH<g82>GLYPH<g81>GLYPH<g86>GLYPH<g88>GLYPH<g79>GLYPH<g87>GLYPH<g76>GLYPH<g81>GLYPH<g74>GLYPH<g15>GLYPH<g3>", "bbox": {"l": 204.11118, "t": 398.48019, "r": 235.29178, "b": 404.11978, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "GLYPH<g86>GLYPH<g78>GLYPH<g76>GLYPH<g79>GLYPH<g79>GLYPH<g86> GLYPH<g3>", "bbox": {"l": 234.99099999999999, "t": 398.48019, "r": 249.83562, "b": 404.11978, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "GLYPH<g86>GLYPH<g75>GLYPH<g68>GLYPH<g85>GLYPH<g76>GLYPH<g81>GLYPH<g74>GLYPH<g3>", "bbox": {"l": 151.93253, "t": 406.31296, "r": 173.41306, "b": 411.95255, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "GLYPH<g68>GLYPH<g81>GLYPH<g71>GLYPH<g3>", "bbox": {"l": 173.10602, "t": 406.31296, "r": 185.0118, "b": 411.95255, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "GLYPH<g85>GLYPH<g72>GLYPH<g81>GLYPH<g82>GLYPH<g90>GLYPH<g81>GLYPH<g3>", "bbox": {"l": 184.69221, "t": 406.31296, "r": 206.3858, "b": 411.95255, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "GLYPH<g86>GLYPH<g72>GLYPH<g85>GLYPH<g89>GLYPH<g76>GLYPH<g70>GLYPH<g72>GLYPH<g86>", "bbox": {"l": 206.07249, "t": 406.31296, "r": 228.24231000000003, "b": 411.95255, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "list_item", "bbox": {"l": 144.88921, "t": 421.1952800000001, "r": 234.25163000000003, "b": 434.66763, "coord_origin": "TOPLEFT"}, "confidence": 0.9440371990203857, "cells": [{"id": 69, "text": "GLYPH<g115>GLYPH<g3>", "bbox": {"l": 144.88921, "t": 421.99773999999996, "r": 148.68732, "b": 426.5799, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "GLYPH<g55>", "bbox": {"l": 151.9388, "t": 421.1952800000001, "r": 155.43533, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "GLYPH<g68>GLYPH<g78>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 154.73979, "t": 421.1952800000001, "r": 166.06282, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "GLYPH<g68>GLYPH<g71>GLYPH<g89>GLYPH<g68>GLYPH<g81>GLYPH<g87>GLYPH<g68>GLYPH<g74>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 165.74324, "t": 421.1952800000001, "r": 195.84607, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "GLYPH<g82>GLYPH<g73>GLYPH<g3>", "bbox": {"l": 195.53903, "t": 421.1952800000001, "r": 202.43185, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "GLYPH<g68>GLYPH<g70>GLYPH<g70>GLYPH<g72>GLYPH<g86>GLYPH<g86>GLYPH<g3>", "bbox": {"l": 202.10602, "t": 421.1952800000001, "r": 222.87220999999997, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "GLYPH<g87>GLYPH<g82>GLYPH<g3>", "bbox": {"l": 222.55890000000002, "t": 421.1952800000001, "r": 229.57077, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "GLYPH<g68> GLYPH<g3>", "bbox": {"l": 229.24492999999998, "t": 421.1952800000001, "r": 234.25163000000003, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "GLYPH<g90>GLYPH<g82>GLYPH<g85>GLYPH<g79>GLYPH<g71>GLYPH<g90>GLYPH<g76>GLYPH<g71>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 151.92627, "t": 429.02805, "r": 181.42754, "b": 434.66763, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "GLYPH<g86>GLYPH<g82>GLYPH<g88>GLYPH<g85>GLYPH<g70>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 181.1205, "t": 429.02805, "r": 201.07835, "b": 434.66763, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "GLYPH<g82>GLYPH<g73>GLYPH<g3>", "bbox": {"l": 200.76505, "t": 429.02805, "r": 207.65787, "b": 434.66763, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "GLYPH<g72>GLYPH<g91>GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g87>GLYPH<g76>GLYPH<g86>GLYPH<g72>", "bbox": {"l": 207.33203, "t": 429.02805, "r": 232.07098000000002, "b": 434.66763, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "picture", "bbox": {"l": 143.39866638183594, "t": 270.2610778808594, "r": 179.56256103515625, "b": 285.621337890625, "coord_origin": "TOPLEFT"}, "confidence": 0.7491769194602966, "cells": [], "children": []}, {"id": 15, "label": "picture", "bbox": {"l": 64.16704559326172, "t": 603.50634765625, "r": 258.77435302734375, "b": 688.1282348632812, "coord_origin": "TOPLEFT"}, "confidence": 0.8925827741622925, "cells": [], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "text", "id": 26, "page_no": 2, "cluster": {"id": 26, "label": "text", "bbox": {"l": 64.800003, "t": 74.48395000000005, "r": 235.8624, "b": 85.58398, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 0, "text": "DB2 for i Center of Excellence", "bbox": {"l": 64.800003, "t": 74.48395000000005, "r": 235.8624, "b": 85.58398, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "DB2 for i Center of Excellence"}, {"label": "text", "id": 25, "page_no": 2, "cluster": {"id": 25, "label": "text", "bbox": {"l": 94.132698, "t": 138.45012999999994, "r": 233.99973, "b": 155.33642999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.7431558966636658, "cells": [{"id": 1, "text": "Solution Brief", "bbox": {"l": 94.132698, "t": 148.63933999999995, "r": 139.54634, "b": 155.33642999999995, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "IBM Systems Lab Services and Training", "bbox": {"l": 94.134933, "t": 138.45012999999994, "r": 233.99973, "b": 145.22162000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Solution Brief IBM Systems Lab Services and Training"}, {"label": "text", "id": 22, "page_no": 2, "cluster": {"id": 22, "label": "text", "bbox": {"l": 461.08859000000007, "t": 138.40752999999995, "r": 506.26178, "b": 145.42181000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.7798987627029419, "cells": [{"id": 3, "text": "Power Services", "bbox": {"l": 461.08859000000007, "t": 138.40752999999995, "r": 506.26178, "b": 145.42181000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Power Services"}, {"label": "section_header", "id": 23, "page_no": 2, "cluster": {"id": 23, "label": "section_header", "bbox": {"l": 280.24011, "t": 239.34265000000005, "r": 463.80942, "b": 276.62054, "coord_origin": "TOPLEFT"}, "confidence": 0.7587862610816956, "cells": [{"id": 4, "text": "DB2 for i", "bbox": {"l": 280.24011, "t": 239.34265000000005, "r": 354.57022, "b": 256.26153999999997, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Center of Excellence ", "bbox": {"l": 280.24011, "t": 259.70165999999995, "r": 463.80942, "b": 276.62054, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "DB2 for i Center of Excellence"}, {"label": "text", "id": 21, "page_no": 2, "cluster": {"id": 21, "label": "text", "bbox": {"l": 280.24011, "t": 277.59027000000003, "r": 483.29572, "b": 287.45959, "coord_origin": "TOPLEFT"}, "confidence": 0.7965631484985352, "cells": [{"id": 6, "text": "Expert help to achieve your business requirements", "bbox": {"l": 280.24011, "t": 277.59027000000003, "r": 483.29572, "b": 287.45959, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Expert help to achieve your business requirements"}, {"label": "section_header", "id": 16, "page_no": 2, "cluster": {"id": 16, "label": "section_header", "bbox": {"l": 280.24011, "t": 315.88161999999994, "r": 443.28210000000007, "b": 324.89566, "coord_origin": "TOPLEFT"}, "confidence": 0.8913540840148926, "cells": [{"id": 7, "text": "We build confident, satisfied clients", "bbox": {"l": 280.24011, "t": 315.88161999999994, "r": 443.28210000000007, "b": 324.89566, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "We build confident, satisfied clients"}, {"label": "text", "id": 3, "page_no": 2, "cluster": {"id": 3, "label": "text", "bbox": {"l": 280.24011, "t": 327.37595, "r": 488.15466, "b": 344.9595, "coord_origin": "TOPLEFT"}, "confidence": 0.9560742378234863, "cells": [{"id": 8, "text": "No one else has the vast consulting experiences, skills sharing and ", "bbox": {"l": 280.24011, "t": 327.37595, "r": 488.15466, "b": 334.77994, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "renown service offerings to do what we can do for you.", "bbox": {"l": 280.24011, "t": 337.55551, "r": 452.34018, "b": 344.9595, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "No one else has the vast consulting experiences, skills sharing and renown service offerings to do what we can do for you."}, {"label": "text", "id": 20, "page_no": 2, "cluster": {"id": 20, "label": "text", "bbox": {"l": 280.24011, "t": 357.3260200000001, "r": 367.86023, "b": 364.73001, "coord_origin": "TOPLEFT"}, "confidence": 0.8260757327079773, "cells": [{"id": 10, "text": "Because no one else is IBM.", "bbox": {"l": 280.24011, "t": 357.3260200000001, "r": 367.86023, "b": 364.73001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Because no one else is IBM."}, {"label": "text", "id": 0, "page_no": 2, "cluster": {"id": 0, "label": "text", "bbox": {"l": 280.24011, "t": 377.09801999999996, "r": 500.32104000000004, "b": 425.22027999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9764721989631653, "cells": [{"id": 11, "text": "With combined experiences and direct access to development groups, ", "bbox": {"l": 280.24011, "t": 377.09801999999996, "r": 500.32104000000004, "b": 384.50201, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "we\u2019re the experts in IBM DB2\u00ae for i. The DB2 for i Center of ", "bbox": {"l": 280.24011, "t": 387.27759, "r": 479.25497, "b": 394.68158, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Excellence (CoE) can help you achieve-perhaps reexamine and ", "bbox": {"l": 280.24011, "t": 397.45715, "r": 483.4667400000001, "b": 404.86115, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "exceed-your business requirements and gain more confidence and ", "bbox": {"l": 280.24011, "t": 407.63672, "r": 492.97656, "b": 415.04071000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "satisfaction in IBM product data management products and solutions.", "bbox": {"l": 280.24011, "t": 417.81628, "r": 498.87, "b": 425.22027999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "With combined experiences and direct access to development groups, we\u2019re the experts in IBM DB2\u00ae for i. The DB2 for i Center of Excellence (CoE) can help you achieve-perhaps reexamine and exceed-your business requirements and gain more confidence and satisfaction in IBM product data management products and solutions."}, {"label": "section_header", "id": 18, "page_no": 2, "cluster": {"id": 18, "label": "section_header", "bbox": {"l": 280.24011, "t": 437.85403, "r": 434.83205999999996, "b": 446.86807, "coord_origin": "TOPLEFT"}, "confidence": 0.8492125272750854, "cells": [{"id": 16, "text": "Who we are, some of what we do", "bbox": {"l": 280.24011, "t": 437.85403, "r": 434.83205999999996, "b": 446.86807, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Who we are, some of what we do"}, {"label": "text", "id": 19, "page_no": 2, "cluster": {"id": 19, "label": "text", "bbox": {"l": 280.24011, "t": 449.34824000000003, "r": 434.56316999999996, "b": 456.75223, "coord_origin": "TOPLEFT"}, "confidence": 0.8440337777137756, "cells": [{"id": 17, "text": "Global CoE engagements cover topics including:", "bbox": {"l": 280.24011, "t": 449.34824000000003, "r": 434.56316999999996, "b": 456.75223, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Global CoE engagements cover topics including:"}, {"label": "list_item", "id": 8, "page_no": 2, "cluster": {"id": 8, "label": "list_item", "bbox": {"l": 280.24011, "t": 469.11826, "r": 401.56412, "b": 476.52225, "coord_origin": "TOPLEFT"}, "confidence": 0.9239599108695984, "cells": [{"id": 18, "text": "r ", "bbox": {"l": 280.24011, "t": 470.95236, "r": 284.0993, "b": 476.16074, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Database performance and scalability", "bbox": {"l": 287.28961, "t": 469.11826, "r": 401.56412, "b": 476.52225, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "r Database performance and scalability"}, {"label": "list_item", "id": 7, "page_no": 2, "cluster": {"id": 7, "label": "list_item", "bbox": {"l": 280.24011, "t": 479.30096, "r": 424.99646, "b": 486.70496, "coord_origin": "TOPLEFT"}, "confidence": 0.9239723086357117, "cells": [{"id": 20, "text": "r ", "bbox": {"l": 280.24011, "t": 481.13507, "r": 284.0993, "b": 486.34344, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Advanced SQL knowledge and skills transfer", "bbox": {"l": 287.28961, "t": 479.30096, "r": 424.99646, "b": 486.70496, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "r Advanced SQL knowledge and skills transfer"}, {"label": "list_item", "id": 10, "page_no": 2, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 280.24011, "t": 489.48355, "r": 392.15845, "b": 496.88754, "coord_origin": "TOPLEFT"}, "confidence": 0.9157899022102356, "cells": [{"id": 22, "text": "r ", "bbox": {"l": 280.24011, "t": 491.31766, "r": 284.0993, "b": 496.52603, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Business intelligence and analytics", "bbox": {"l": 287.28961, "t": 489.48355, "r": 392.15845, "b": 496.88754, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "r Business intelligence and analytics"}, {"label": "list_item", "id": 17, "page_no": 2, "cluster": {"id": 17, "label": "list_item", "bbox": {"l": 280.24011, "t": 499.66626, "r": 339.94354, "b": 507.07025, "coord_origin": "TOPLEFT"}, "confidence": 0.8733456134796143, "cells": [{"id": 24, "text": "r ", "bbox": {"l": 280.24011, "t": 501.50037, "r": 284.0993, "b": 506.70874, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "DB2 Web Query", "bbox": {"l": 287.28961, "t": 499.66626, "r": 339.94354, "b": 507.07025, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "r DB2 Web Query"}, {"label": "list_item", "id": 6, "page_no": 2, "cluster": {"id": 6, "label": "list_item", "bbox": {"l": 280.24011, "t": 509.84885, "r": 504.19314999999995, "b": 517.25284, "coord_origin": "TOPLEFT"}, "confidence": 0.9249240756034851, "cells": [{"id": 26, "text": "r ", "bbox": {"l": 280.24011, "t": 511.68295, "r": 284.0993, "b": 516.8913299999999, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Query/400 modernization for better reporting and analysis capabilities", "bbox": {"l": 287.28961, "t": 509.84885, "r": 504.19314999999995, "b": 517.25284, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "r Query/400 modernization for better reporting and analysis capabilities"}, {"label": "list_item", "id": 11, "page_no": 2, "cluster": {"id": 11, "label": "list_item", "bbox": {"l": 280.24011, "t": 520.03156, "r": 423.0022, "b": 527.4355499999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9109315276145935, "cells": [{"id": 28, "text": "r ", "bbox": {"l": 280.24011, "t": 521.8656599999999, "r": 284.0993, "b": 527.07404, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Database modernization and re-engineering", "bbox": {"l": 287.28961, "t": 520.03156, "r": 423.0022, "b": 527.4355499999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "r Database modernization and re-engineering"}, {"label": "list_item", "id": 14, "page_no": 2, "cluster": {"id": 14, "label": "list_item", "bbox": {"l": 280.24011, "t": 530.21414, "r": 399.65173, "b": 537.61813, "coord_origin": "TOPLEFT"}, "confidence": 0.8977465033531189, "cells": [{"id": 30, "text": "r ", "bbox": {"l": 280.24011, "t": 532.04825, "r": 284.0993, "b": 537.2566400000001, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Data-centric architecture and design", "bbox": {"l": 287.28961, "t": 530.21414, "r": 399.65173, "b": 537.61813, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "r Data-centric architecture and design"}, {"label": "list_item", "id": 9, "page_no": 2, "cluster": {"id": 9, "label": "list_item", "bbox": {"l": 280.24011, "t": 540.39674, "r": 466.77881, "b": 547.80074, "coord_origin": "TOPLEFT"}, "confidence": 0.9218332767486572, "cells": [{"id": 32, "text": "r ", "bbox": {"l": 280.24011, "t": 542.23083, "r": 284.0993, "b": 547.43924, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "Extremely large database and overcoming limits to growth", "bbox": {"l": 287.28961, "t": 540.39674, "r": 466.77881, "b": 547.80074, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "r Extremely large database and overcoming limits to growth"}, {"label": "list_item", "id": 13, "page_no": 2, "cluster": {"id": 13, "label": "list_item", "bbox": {"l": 280.24011, "t": 550.5794500000001, "r": 382.20956, "b": 557.98344, "coord_origin": "TOPLEFT"}, "confidence": 0.9075438976287842, "cells": [{"id": 34, "text": "r ", "bbox": {"l": 280.24011, "t": 552.41354, "r": 284.0993, "b": 557.62195, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "ISV education and enablement", "bbox": {"l": 287.28961, "t": 550.5794500000001, "r": 382.20956, "b": 557.98344, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "r ISV education and enablement"}, {"label": "section_header", "id": 12, "page_no": 2, "cluster": {"id": 12, "label": "section_header", "bbox": {"l": 144.88921, "t": 327.46163999999993, "r": 188.74681, "b": 336.81406, "coord_origin": "TOPLEFT"}, "confidence": 0.9098502993583679, "cells": [{"id": 36, "text": "Highlights ", "bbox": {"l": 144.88921, "t": 327.46163999999993, "r": 188.74681, "b": 336.81406, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Highlights"}, {"label": "list_item", "id": 2, "page_no": 2, "cluster": {"id": 2, "label": "list_item", "bbox": {"l": 144.88921, "t": 345.21707, "r": 242.87389000000002, "b": 358.68942, "coord_origin": "TOPLEFT"}, "confidence": 0.9571698904037476, "cells": [{"id": 37, "text": "GLYPH<g115>GLYPH<g3>", "bbox": {"l": 144.88921, "t": 346.01953, "r": 148.68732, "b": 350.60168, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "GLYPH<g40>GLYPH<g81>GLYPH<g75>GLYPH<g68>GLYPH<g81>GLYPH<g70>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 151.9388, "t": 345.21707, "r": 177.25424, "b": 350.85666, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "GLYPH<g87>GLYPH<g75>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 176.9472, "t": 345.21707, "r": 187.11098, "b": 350.85666, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g73>GLYPH<g82>GLYPH<g85>GLYPH<g80>GLYPH<g68>GLYPH<g81>GLYPH<g70>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 186.7914, "t": 345.21707, "r": 222.95989999999998, "b": 350.85666, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "GLYPH<g82>GLYPH<g73>GLYPH<g3>", "bbox": {"l": 222.65912, "t": 345.21707, "r": 229.55193999999997, "b": 350.85666, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "GLYPH<g92>GLYPH<g82>GLYPH<g88>GLYPH<g85> GLYPH<g3>", "bbox": {"l": 229.2261, "t": 345.21707, "r": 242.87389000000002, "b": 350.85666, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "GLYPH<g71>GLYPH<g68>GLYPH<g87>GLYPH<g68>GLYPH<g69>GLYPH<g68>GLYPH<g86>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 151.93253, "t": 353.04984, "r": 178.77066, "b": 358.68942, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "GLYPH<g82>GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g68>GLYPH<g87>GLYPH<g76>GLYPH<g82>GLYPH<g81>GLYPH<g86>", "bbox": {"l": 178.46362, "t": 353.04984, "r": 207.16908, "b": 358.68942, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<g115>GLYPH<g3> GLYPH<g40>GLYPH<g81>GLYPH<g75>GLYPH<g68>GLYPH<g81>GLYPH<g70>GLYPH<g72>GLYPH<g3> GLYPH<g87>GLYPH<g75>GLYPH<g72>GLYPH<g3> GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g73>GLYPH<g82>GLYPH<g85>GLYPH<g80>GLYPH<g68>GLYPH<g81>GLYPH<g70>GLYPH<g72>GLYPH<g3> GLYPH<g82>GLYPH<g73>GLYPH<g3> GLYPH<g92>GLYPH<g82>GLYPH<g88>GLYPH<g85> GLYPH<g3> GLYPH<g71>GLYPH<g68>GLYPH<g87>GLYPH<g68>GLYPH<g69>GLYPH<g68>GLYPH<g86>GLYPH<g72>GLYPH<g3> GLYPH<g82>GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g68>GLYPH<g87>GLYPH<g76>GLYPH<g82>GLYPH<g81>GLYPH<g86>"}, {"label": "list_item", "id": 1, "page_no": 2, "cluster": {"id": 1, "label": "list_item", "bbox": {"l": 144.88921, "t": 367.93219, "r": 259.2287, "b": 389.2373, "coord_origin": "TOPLEFT"}, "confidence": 0.9634580612182617, "cells": [{"id": 45, "text": "GLYPH<g115>GLYPH<g3>", "bbox": {"l": 144.88921, "t": 368.73465, "r": 148.68732, "b": 373.3168, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "GLYPH<g40>GLYPH<g68>GLYPH<g85> GLYPH<g81>GLYPH<g3>", "bbox": {"l": 151.9388, "t": 367.93219, "r": 166.05655, "b": 373.57178, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "GLYPH<g74>GLYPH<g85>GLYPH<g72>GLYPH<g68>GLYPH<g87>GLYPH<g72>GLYPH<g85>GLYPH<g3>", "bbox": {"l": 165.73697, "t": 367.93219, "r": 186.40289, "b": 373.57178, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "GLYPH<g85>GLYPH<g72>GLYPH<g87>GLYPH<g88>GLYPH<g85> GLYPH<g81>GLYPH<g3>", "bbox": {"l": 186.09586, "t": 367.93219, "r": 203.61617, "b": 373.57178, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "GLYPH<g82>GLYPH<g81>GLYPH<g3>", "bbox": {"l": 203.30286, "t": 367.93219, "r": 211.82489, "b": 373.57178, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "GLYPH<g44>GLYPH<g55>GLYPH<g3>", "bbox": {"l": 211.49905, "t": 367.93219, "r": 218.16002, "b": 373.57178, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "GLYPH<g83>GLYPH<g85>GLYPH<g82>GLYPH<g77>GLYPH<g72>GLYPH<g70>GLYPH<g87>GLYPH<g86> GLYPH<g3>", "bbox": {"l": 217.83418, "t": 367.93219, "r": 241.30737, "b": 373.57178, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "GLYPH<g87>GLYPH<g75>GLYPH<g85>GLYPH<g82>GLYPH<g88>GLYPH<g74>GLYPH<g75>GLYPH<g3>", "bbox": {"l": 151.93253, "t": 375.76495, "r": 174.46577, "b": 381.40454, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "GLYPH<g80>GLYPH<g82>GLYPH<g71>GLYPH<g72>GLYPH<g85> GLYPH<g81>GLYPH<g76>GLYPH<g93>GLYPH<g68>GLYPH<g87>GLYPH<g76>GLYPH<g82>GLYPH<g81>GLYPH<g3>", "bbox": {"l": 174.15874, "t": 375.76495, "r": 214.4128, "b": 381.40454, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "GLYPH<g82>GLYPH<g73>GLYPH<g3>", "bbox": {"l": 214.11829, "t": 375.76495, "r": 221.01110999999997, "b": 381.40454, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "GLYPH<g71>GLYPH<g68>GLYPH<g87>GLYPH<g68>GLYPH<g69>GLYPH<g68>GLYPH<g86>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 220.68527, "t": 375.76495, "r": 247.52341000000004, "b": 381.40454, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "GLYPH<g68>GLYPH<g81>GLYPH<g71> GLYPH<g3>", "bbox": {"l": 247.21637, "t": 375.76495, "r": 259.2287, "b": 381.40454, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "GLYPH<g68>GLYPH<g83>GLYPH<g83>GLYPH<g79>GLYPH<g76>GLYPH<g70>GLYPH<g68>GLYPH<g87>GLYPH<g76>GLYPH<g82>GLYPH<g81>GLYPH<g86>", "bbox": {"l": 151.93253, "t": 383.59772, "r": 184.61703, "b": 389.2373, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<g115>GLYPH<g3> GLYPH<g40>GLYPH<g68>GLYPH<g85> GLYPH<g81>GLYPH<g3> GLYPH<g74>GLYPH<g85>GLYPH<g72>GLYPH<g68>GLYPH<g87>GLYPH<g72>GLYPH<g85>GLYPH<g3> GLYPH<g85>GLYPH<g72>GLYPH<g87>GLYPH<g88>GLYPH<g85> GLYPH<g81>GLYPH<g3> GLYPH<g82>GLYPH<g81>GLYPH<g3> GLYPH<g44>GLYPH<g55>GLYPH<g3> GLYPH<g83>GLYPH<g85>GLYPH<g82>GLYPH<g77>GLYPH<g72>GLYPH<g70>GLYPH<g87>GLYPH<g86> GLYPH<g3> GLYPH<g87>GLYPH<g75>GLYPH<g85>GLYPH<g82>GLYPH<g88>GLYPH<g74>GLYPH<g75>GLYPH<g3> GLYPH<g80>GLYPH<g82>GLYPH<g71>GLYPH<g72>GLYPH<g85> GLYPH<g81>GLYPH<g76>GLYPH<g93>GLYPH<g68>GLYPH<g87>GLYPH<g76>GLYPH<g82>GLYPH<g81>GLYPH<g3> GLYPH<g82>GLYPH<g73>GLYPH<g3> GLYPH<g71>GLYPH<g68>GLYPH<g87>GLYPH<g68>GLYPH<g69>GLYPH<g68>GLYPH<g86>GLYPH<g72>GLYPH<g3> GLYPH<g68>GLYPH<g81>GLYPH<g71> GLYPH<g3> GLYPH<g68>GLYPH<g83>GLYPH<g83>GLYPH<g79>GLYPH<g76>GLYPH<g70>GLYPH<g68>GLYPH<g87>GLYPH<g76>GLYPH<g82>GLYPH<g81>GLYPH<g86>"}, {"label": "list_item", "id": 4, "page_no": 2, "cluster": {"id": 4, "label": "list_item", "bbox": {"l": 144.88921, "t": 398.48019, "r": 249.83562, "b": 411.95255, "coord_origin": "TOPLEFT"}, "confidence": 0.9541198015213013, "cells": [{"id": 58, "text": "GLYPH<g115>GLYPH<g3>", "bbox": {"l": 144.88921, "t": 399.28265, "r": 148.68732, "b": 403.86481000000003, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "GLYPH<g53>GLYPH<g72>GLYPH<g79>GLYPH<g92>GLYPH<g3>", "bbox": {"l": 151.9388, "t": 398.48019, "r": 165.36099, "b": 404.11978, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "GLYPH<g82>GLYPH<g81>GLYPH<g3>", "bbox": {"l": 165.04141, "t": 398.48019, "r": 173.56345, "b": 404.11978, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "GLYPH<g44>GLYPH<g37>GLYPH<g48>GLYPH<g3>", "bbox": {"l": 173.23761, "t": 398.48019, "r": 185.95174, "b": 404.11978, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "GLYPH<g72>GLYPH<g91>GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g87>GLYPH<g3>", "bbox": {"l": 185.63216, "t": 398.48019, "r": 204.42448, "b": 404.11978, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "GLYPH<g70>GLYPH<g82>GLYPH<g81>GLYPH<g86>GLYPH<g88>GLYPH<g79>GLYPH<g87>GLYPH<g76>GLYPH<g81>GLYPH<g74>GLYPH<g15>GLYPH<g3>", "bbox": {"l": 204.11118, "t": 398.48019, "r": 235.29178, "b": 404.11978, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "GLYPH<g86>GLYPH<g78>GLYPH<g76>GLYPH<g79>GLYPH<g79>GLYPH<g86> GLYPH<g3>", "bbox": {"l": 234.99099999999999, "t": 398.48019, "r": 249.83562, "b": 404.11978, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "GLYPH<g86>GLYPH<g75>GLYPH<g68>GLYPH<g85>GLYPH<g76>GLYPH<g81>GLYPH<g74>GLYPH<g3>", "bbox": {"l": 151.93253, "t": 406.31296, "r": 173.41306, "b": 411.95255, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "GLYPH<g68>GLYPH<g81>GLYPH<g71>GLYPH<g3>", "bbox": {"l": 173.10602, "t": 406.31296, "r": 185.0118, "b": 411.95255, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "GLYPH<g85>GLYPH<g72>GLYPH<g81>GLYPH<g82>GLYPH<g90>GLYPH<g81>GLYPH<g3>", "bbox": {"l": 184.69221, "t": 406.31296, "r": 206.3858, "b": 411.95255, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "GLYPH<g86>GLYPH<g72>GLYPH<g85>GLYPH<g89>GLYPH<g76>GLYPH<g70>GLYPH<g72>GLYPH<g86>", "bbox": {"l": 206.07249, "t": 406.31296, "r": 228.24231000000003, "b": 411.95255, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<g115>GLYPH<g3> GLYPH<g53>GLYPH<g72>GLYPH<g79>GLYPH<g92>GLYPH<g3> GLYPH<g82>GLYPH<g81>GLYPH<g3> GLYPH<g44>GLYPH<g37>GLYPH<g48>GLYPH<g3> GLYPH<g72>GLYPH<g91>GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g87>GLYPH<g3> GLYPH<g70>GLYPH<g82>GLYPH<g81>GLYPH<g86>GLYPH<g88>GLYPH<g79>GLYPH<g87>GLYPH<g76>GLYPH<g81>GLYPH<g74>GLYPH<g15>GLYPH<g3> GLYPH<g86>GLYPH<g78>GLYPH<g76>GLYPH<g79>GLYPH<g79>GLYPH<g86> GLYPH<g3> GLYPH<g86>GLYPH<g75>GLYPH<g68>GLYPH<g85>GLYPH<g76>GLYPH<g81>GLYPH<g74>GLYPH<g3> GLYPH<g68>GLYPH<g81>GLYPH<g71>GLYPH<g3> GLYPH<g85>GLYPH<g72>GLYPH<g81>GLYPH<g82>GLYPH<g90>GLYPH<g81>GLYPH<g3> GLYPH<g86>GLYPH<g72>GLYPH<g85>GLYPH<g89>GLYPH<g76>GLYPH<g70>GLYPH<g72>GLYPH<g86>"}, {"label": "list_item", "id": 5, "page_no": 2, "cluster": {"id": 5, "label": "list_item", "bbox": {"l": 144.88921, "t": 421.1952800000001, "r": 234.25163000000003, "b": 434.66763, "coord_origin": "TOPLEFT"}, "confidence": 0.9440371990203857, "cells": [{"id": 69, "text": "GLYPH<g115>GLYPH<g3>", "bbox": {"l": 144.88921, "t": 421.99773999999996, "r": 148.68732, "b": 426.5799, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "GLYPH<g55>", "bbox": {"l": 151.9388, "t": 421.1952800000001, "r": 155.43533, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "GLYPH<g68>GLYPH<g78>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 154.73979, "t": 421.1952800000001, "r": 166.06282, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "GLYPH<g68>GLYPH<g71>GLYPH<g89>GLYPH<g68>GLYPH<g81>GLYPH<g87>GLYPH<g68>GLYPH<g74>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 165.74324, "t": 421.1952800000001, "r": 195.84607, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "GLYPH<g82>GLYPH<g73>GLYPH<g3>", "bbox": {"l": 195.53903, "t": 421.1952800000001, "r": 202.43185, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "GLYPH<g68>GLYPH<g70>GLYPH<g70>GLYPH<g72>GLYPH<g86>GLYPH<g86>GLYPH<g3>", "bbox": {"l": 202.10602, "t": 421.1952800000001, "r": 222.87220999999997, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "GLYPH<g87>GLYPH<g82>GLYPH<g3>", "bbox": {"l": 222.55890000000002, "t": 421.1952800000001, "r": 229.57077, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "GLYPH<g68> GLYPH<g3>", "bbox": {"l": 229.24492999999998, "t": 421.1952800000001, "r": 234.25163000000003, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "GLYPH<g90>GLYPH<g82>GLYPH<g85>GLYPH<g79>GLYPH<g71>GLYPH<g90>GLYPH<g76>GLYPH<g71>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 151.92627, "t": 429.02805, "r": 181.42754, "b": 434.66763, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "GLYPH<g86>GLYPH<g82>GLYPH<g88>GLYPH<g85>GLYPH<g70>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 181.1205, "t": 429.02805, "r": 201.07835, "b": 434.66763, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "GLYPH<g82>GLYPH<g73>GLYPH<g3>", "bbox": {"l": 200.76505, "t": 429.02805, "r": 207.65787, "b": 434.66763, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "GLYPH<g72>GLYPH<g91>GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g87>GLYPH<g76>GLYPH<g86>GLYPH<g72>", "bbox": {"l": 207.33203, "t": 429.02805, "r": 232.07098000000002, "b": 434.66763, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<g115>GLYPH<g3> GLYPH<g55> GLYPH<g68>GLYPH<g78>GLYPH<g72>GLYPH<g3> GLYPH<g68>GLYPH<g71>GLYPH<g89>GLYPH<g68>GLYPH<g81>GLYPH<g87>GLYPH<g68>GLYPH<g74>GLYPH<g72>GLYPH<g3> GLYPH<g82>GLYPH<g73>GLYPH<g3> GLYPH<g68>GLYPH<g70>GLYPH<g70>GLYPH<g72>GLYPH<g86>GLYPH<g86>GLYPH<g3> GLYPH<g87>GLYPH<g82>GLYPH<g3> GLYPH<g68> GLYPH<g3> GLYPH<g90>GLYPH<g82>GLYPH<g85>GLYPH<g79>GLYPH<g71>GLYPH<g90>GLYPH<g76>GLYPH<g71>GLYPH<g72>GLYPH<g3> GLYPH<g86>GLYPH<g82>GLYPH<g88>GLYPH<g85>GLYPH<g70>GLYPH<g72>GLYPH<g3> GLYPH<g82>GLYPH<g73>GLYPH<g3> GLYPH<g72>GLYPH<g91>GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g87>GLYPH<g76>GLYPH<g86>GLYPH<g72>"}, {"label": "picture", "id": 24, "page_no": 2, "cluster": {"id": 24, "label": "picture", "bbox": {"l": 143.39866638183594, "t": 270.2610778808594, "r": 179.56256103515625, "b": 285.621337890625, "coord_origin": "TOPLEFT"}, "confidence": 0.7491769194602966, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "picture", "id": 15, "page_no": 2, "cluster": {"id": 15, "label": "picture", "bbox": {"l": 64.16704559326172, "t": 603.50634765625, "r": 258.77435302734375, "b": 688.1282348632812, "coord_origin": "TOPLEFT"}, "confidence": 0.8925827741622925, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "body": [{"label": "text", "id": 26, "page_no": 2, "cluster": {"id": 26, "label": "text", "bbox": {"l": 64.800003, "t": 74.48395000000005, "r": 235.8624, "b": 85.58398, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 0, "text": "DB2 for i Center of Excellence", "bbox": {"l": 64.800003, "t": 74.48395000000005, "r": 235.8624, "b": 85.58398, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "DB2 for i Center of Excellence"}, {"label": "text", "id": 25, "page_no": 2, "cluster": {"id": 25, "label": "text", "bbox": {"l": 94.132698, "t": 138.45012999999994, "r": 233.99973, "b": 155.33642999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.7431558966636658, "cells": [{"id": 1, "text": "Solution Brief", "bbox": {"l": 94.132698, "t": 148.63933999999995, "r": 139.54634, "b": 155.33642999999995, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "IBM Systems Lab Services and Training", "bbox": {"l": 94.134933, "t": 138.45012999999994, "r": 233.99973, "b": 145.22162000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Solution Brief IBM Systems Lab Services and Training"}, {"label": "text", "id": 22, "page_no": 2, "cluster": {"id": 22, "label": "text", "bbox": {"l": 461.08859000000007, "t": 138.40752999999995, "r": 506.26178, "b": 145.42181000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.7798987627029419, "cells": [{"id": 3, "text": "Power Services", "bbox": {"l": 461.08859000000007, "t": 138.40752999999995, "r": 506.26178, "b": 145.42181000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Power Services"}, {"label": "section_header", "id": 23, "page_no": 2, "cluster": {"id": 23, "label": "section_header", "bbox": {"l": 280.24011, "t": 239.34265000000005, "r": 463.80942, "b": 276.62054, "coord_origin": "TOPLEFT"}, "confidence": 0.7587862610816956, "cells": [{"id": 4, "text": "DB2 for i", "bbox": {"l": 280.24011, "t": 239.34265000000005, "r": 354.57022, "b": 256.26153999999997, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Center of Excellence ", "bbox": {"l": 280.24011, "t": 259.70165999999995, "r": 463.80942, "b": 276.62054, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "DB2 for i Center of Excellence"}, {"label": "text", "id": 21, "page_no": 2, "cluster": {"id": 21, "label": "text", "bbox": {"l": 280.24011, "t": 277.59027000000003, "r": 483.29572, "b": 287.45959, "coord_origin": "TOPLEFT"}, "confidence": 0.7965631484985352, "cells": [{"id": 6, "text": "Expert help to achieve your business requirements", "bbox": {"l": 280.24011, "t": 277.59027000000003, "r": 483.29572, "b": 287.45959, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Expert help to achieve your business requirements"}, {"label": "section_header", "id": 16, "page_no": 2, "cluster": {"id": 16, "label": "section_header", "bbox": {"l": 280.24011, "t": 315.88161999999994, "r": 443.28210000000007, "b": 324.89566, "coord_origin": "TOPLEFT"}, "confidence": 0.8913540840148926, "cells": [{"id": 7, "text": "We build confident, satisfied clients", "bbox": {"l": 280.24011, "t": 315.88161999999994, "r": 443.28210000000007, "b": 324.89566, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "We build confident, satisfied clients"}, {"label": "text", "id": 3, "page_no": 2, "cluster": {"id": 3, "label": "text", "bbox": {"l": 280.24011, "t": 327.37595, "r": 488.15466, "b": 344.9595, "coord_origin": "TOPLEFT"}, "confidence": 0.9560742378234863, "cells": [{"id": 8, "text": "No one else has the vast consulting experiences, skills sharing and ", "bbox": {"l": 280.24011, "t": 327.37595, "r": 488.15466, "b": 334.77994, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "renown service offerings to do what we can do for you.", "bbox": {"l": 280.24011, "t": 337.55551, "r": 452.34018, "b": 344.9595, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "No one else has the vast consulting experiences, skills sharing and renown service offerings to do what we can do for you."}, {"label": "text", "id": 20, "page_no": 2, "cluster": {"id": 20, "label": "text", "bbox": {"l": 280.24011, "t": 357.3260200000001, "r": 367.86023, "b": 364.73001, "coord_origin": "TOPLEFT"}, "confidence": 0.8260757327079773, "cells": [{"id": 10, "text": "Because no one else is IBM.", "bbox": {"l": 280.24011, "t": 357.3260200000001, "r": 367.86023, "b": 364.73001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Because no one else is IBM."}, {"label": "text", "id": 0, "page_no": 2, "cluster": {"id": 0, "label": "text", "bbox": {"l": 280.24011, "t": 377.09801999999996, "r": 500.32104000000004, "b": 425.22027999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9764721989631653, "cells": [{"id": 11, "text": "With combined experiences and direct access to development groups, ", "bbox": {"l": 280.24011, "t": 377.09801999999996, "r": 500.32104000000004, "b": 384.50201, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "we\u2019re the experts in IBM DB2\u00ae for i. The DB2 for i Center of ", "bbox": {"l": 280.24011, "t": 387.27759, "r": 479.25497, "b": 394.68158, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Excellence (CoE) can help you achieve-perhaps reexamine and ", "bbox": {"l": 280.24011, "t": 397.45715, "r": 483.4667400000001, "b": 404.86115, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "exceed-your business requirements and gain more confidence and ", "bbox": {"l": 280.24011, "t": 407.63672, "r": 492.97656, "b": 415.04071000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "satisfaction in IBM product data management products and solutions.", "bbox": {"l": 280.24011, "t": 417.81628, "r": 498.87, "b": 425.22027999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "With combined experiences and direct access to development groups, we\u2019re the experts in IBM DB2\u00ae for i. The DB2 for i Center of Excellence (CoE) can help you achieve-perhaps reexamine and exceed-your business requirements and gain more confidence and satisfaction in IBM product data management products and solutions."}, {"label": "section_header", "id": 18, "page_no": 2, "cluster": {"id": 18, "label": "section_header", "bbox": {"l": 280.24011, "t": 437.85403, "r": 434.83205999999996, "b": 446.86807, "coord_origin": "TOPLEFT"}, "confidence": 0.8492125272750854, "cells": [{"id": 16, "text": "Who we are, some of what we do", "bbox": {"l": 280.24011, "t": 437.85403, "r": 434.83205999999996, "b": 446.86807, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Who we are, some of what we do"}, {"label": "text", "id": 19, "page_no": 2, "cluster": {"id": 19, "label": "text", "bbox": {"l": 280.24011, "t": 449.34824000000003, "r": 434.56316999999996, "b": 456.75223, "coord_origin": "TOPLEFT"}, "confidence": 0.8440337777137756, "cells": [{"id": 17, "text": "Global CoE engagements cover topics including:", "bbox": {"l": 280.24011, "t": 449.34824000000003, "r": 434.56316999999996, "b": 456.75223, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Global CoE engagements cover topics including:"}, {"label": "list_item", "id": 8, "page_no": 2, "cluster": {"id": 8, "label": "list_item", "bbox": {"l": 280.24011, "t": 469.11826, "r": 401.56412, "b": 476.52225, "coord_origin": "TOPLEFT"}, "confidence": 0.9239599108695984, "cells": [{"id": 18, "text": "r ", "bbox": {"l": 280.24011, "t": 470.95236, "r": 284.0993, "b": 476.16074, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Database performance and scalability", "bbox": {"l": 287.28961, "t": 469.11826, "r": 401.56412, "b": 476.52225, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "r Database performance and scalability"}, {"label": "list_item", "id": 7, "page_no": 2, "cluster": {"id": 7, "label": "list_item", "bbox": {"l": 280.24011, "t": 479.30096, "r": 424.99646, "b": 486.70496, "coord_origin": "TOPLEFT"}, "confidence": 0.9239723086357117, "cells": [{"id": 20, "text": "r ", "bbox": {"l": 280.24011, "t": 481.13507, "r": 284.0993, "b": 486.34344, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Advanced SQL knowledge and skills transfer", "bbox": {"l": 287.28961, "t": 479.30096, "r": 424.99646, "b": 486.70496, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "r Advanced SQL knowledge and skills transfer"}, {"label": "list_item", "id": 10, "page_no": 2, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 280.24011, "t": 489.48355, "r": 392.15845, "b": 496.88754, "coord_origin": "TOPLEFT"}, "confidence": 0.9157899022102356, "cells": [{"id": 22, "text": "r ", "bbox": {"l": 280.24011, "t": 491.31766, "r": 284.0993, "b": 496.52603, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Business intelligence and analytics", "bbox": {"l": 287.28961, "t": 489.48355, "r": 392.15845, "b": 496.88754, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "r Business intelligence and analytics"}, {"label": "list_item", "id": 17, "page_no": 2, "cluster": {"id": 17, "label": "list_item", "bbox": {"l": 280.24011, "t": 499.66626, "r": 339.94354, "b": 507.07025, "coord_origin": "TOPLEFT"}, "confidence": 0.8733456134796143, "cells": [{"id": 24, "text": "r ", "bbox": {"l": 280.24011, "t": 501.50037, "r": 284.0993, "b": 506.70874, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "DB2 Web Query", "bbox": {"l": 287.28961, "t": 499.66626, "r": 339.94354, "b": 507.07025, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "r DB2 Web Query"}, {"label": "list_item", "id": 6, "page_no": 2, "cluster": {"id": 6, "label": "list_item", "bbox": {"l": 280.24011, "t": 509.84885, "r": 504.19314999999995, "b": 517.25284, "coord_origin": "TOPLEFT"}, "confidence": 0.9249240756034851, "cells": [{"id": 26, "text": "r ", "bbox": {"l": 280.24011, "t": 511.68295, "r": 284.0993, "b": 516.8913299999999, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Query/400 modernization for better reporting and analysis capabilities", "bbox": {"l": 287.28961, "t": 509.84885, "r": 504.19314999999995, "b": 517.25284, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "r Query/400 modernization for better reporting and analysis capabilities"}, {"label": "list_item", "id": 11, "page_no": 2, "cluster": {"id": 11, "label": "list_item", "bbox": {"l": 280.24011, "t": 520.03156, "r": 423.0022, "b": 527.4355499999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9109315276145935, "cells": [{"id": 28, "text": "r ", "bbox": {"l": 280.24011, "t": 521.8656599999999, "r": 284.0993, "b": 527.07404, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Database modernization and re-engineering", "bbox": {"l": 287.28961, "t": 520.03156, "r": 423.0022, "b": 527.4355499999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "r Database modernization and re-engineering"}, {"label": "list_item", "id": 14, "page_no": 2, "cluster": {"id": 14, "label": "list_item", "bbox": {"l": 280.24011, "t": 530.21414, "r": 399.65173, "b": 537.61813, "coord_origin": "TOPLEFT"}, "confidence": 0.8977465033531189, "cells": [{"id": 30, "text": "r ", "bbox": {"l": 280.24011, "t": 532.04825, "r": 284.0993, "b": 537.2566400000001, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Data-centric architecture and design", "bbox": {"l": 287.28961, "t": 530.21414, "r": 399.65173, "b": 537.61813, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "r Data-centric architecture and design"}, {"label": "list_item", "id": 9, "page_no": 2, "cluster": {"id": 9, "label": "list_item", "bbox": {"l": 280.24011, "t": 540.39674, "r": 466.77881, "b": 547.80074, "coord_origin": "TOPLEFT"}, "confidence": 0.9218332767486572, "cells": [{"id": 32, "text": "r ", "bbox": {"l": 280.24011, "t": 542.23083, "r": 284.0993, "b": 547.43924, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "Extremely large database and overcoming limits to growth", "bbox": {"l": 287.28961, "t": 540.39674, "r": 466.77881, "b": 547.80074, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "r Extremely large database and overcoming limits to growth"}, {"label": "list_item", "id": 13, "page_no": 2, "cluster": {"id": 13, "label": "list_item", "bbox": {"l": 280.24011, "t": 550.5794500000001, "r": 382.20956, "b": 557.98344, "coord_origin": "TOPLEFT"}, "confidence": 0.9075438976287842, "cells": [{"id": 34, "text": "r ", "bbox": {"l": 280.24011, "t": 552.41354, "r": 284.0993, "b": 557.62195, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "ISV education and enablement", "bbox": {"l": 287.28961, "t": 550.5794500000001, "r": 382.20956, "b": 557.98344, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "r ISV education and enablement"}, {"label": "section_header", "id": 12, "page_no": 2, "cluster": {"id": 12, "label": "section_header", "bbox": {"l": 144.88921, "t": 327.46163999999993, "r": 188.74681, "b": 336.81406, "coord_origin": "TOPLEFT"}, "confidence": 0.9098502993583679, "cells": [{"id": 36, "text": "Highlights ", "bbox": {"l": 144.88921, "t": 327.46163999999993, "r": 188.74681, "b": 336.81406, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Highlights"}, {"label": "list_item", "id": 2, "page_no": 2, "cluster": {"id": 2, "label": "list_item", "bbox": {"l": 144.88921, "t": 345.21707, "r": 242.87389000000002, "b": 358.68942, "coord_origin": "TOPLEFT"}, "confidence": 0.9571698904037476, "cells": [{"id": 37, "text": "GLYPH<g115>GLYPH<g3>", "bbox": {"l": 144.88921, "t": 346.01953, "r": 148.68732, "b": 350.60168, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "GLYPH<g40>GLYPH<g81>GLYPH<g75>GLYPH<g68>GLYPH<g81>GLYPH<g70>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 151.9388, "t": 345.21707, "r": 177.25424, "b": 350.85666, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "GLYPH<g87>GLYPH<g75>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 176.9472, "t": 345.21707, "r": 187.11098, "b": 350.85666, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g73>GLYPH<g82>GLYPH<g85>GLYPH<g80>GLYPH<g68>GLYPH<g81>GLYPH<g70>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 186.7914, "t": 345.21707, "r": 222.95989999999998, "b": 350.85666, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "GLYPH<g82>GLYPH<g73>GLYPH<g3>", "bbox": {"l": 222.65912, "t": 345.21707, "r": 229.55193999999997, "b": 350.85666, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "GLYPH<g92>GLYPH<g82>GLYPH<g88>GLYPH<g85> GLYPH<g3>", "bbox": {"l": 229.2261, "t": 345.21707, "r": 242.87389000000002, "b": 350.85666, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "GLYPH<g71>GLYPH<g68>GLYPH<g87>GLYPH<g68>GLYPH<g69>GLYPH<g68>GLYPH<g86>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 151.93253, "t": 353.04984, "r": 178.77066, "b": 358.68942, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "GLYPH<g82>GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g68>GLYPH<g87>GLYPH<g76>GLYPH<g82>GLYPH<g81>GLYPH<g86>", "bbox": {"l": 178.46362, "t": 353.04984, "r": 207.16908, "b": 358.68942, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<g115>GLYPH<g3> GLYPH<g40>GLYPH<g81>GLYPH<g75>GLYPH<g68>GLYPH<g81>GLYPH<g70>GLYPH<g72>GLYPH<g3> GLYPH<g87>GLYPH<g75>GLYPH<g72>GLYPH<g3> GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g73>GLYPH<g82>GLYPH<g85>GLYPH<g80>GLYPH<g68>GLYPH<g81>GLYPH<g70>GLYPH<g72>GLYPH<g3> GLYPH<g82>GLYPH<g73>GLYPH<g3> GLYPH<g92>GLYPH<g82>GLYPH<g88>GLYPH<g85> GLYPH<g3> GLYPH<g71>GLYPH<g68>GLYPH<g87>GLYPH<g68>GLYPH<g69>GLYPH<g68>GLYPH<g86>GLYPH<g72>GLYPH<g3> GLYPH<g82>GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g68>GLYPH<g87>GLYPH<g76>GLYPH<g82>GLYPH<g81>GLYPH<g86>"}, {"label": "list_item", "id": 1, "page_no": 2, "cluster": {"id": 1, "label": "list_item", "bbox": {"l": 144.88921, "t": 367.93219, "r": 259.2287, "b": 389.2373, "coord_origin": "TOPLEFT"}, "confidence": 0.9634580612182617, "cells": [{"id": 45, "text": "GLYPH<g115>GLYPH<g3>", "bbox": {"l": 144.88921, "t": 368.73465, "r": 148.68732, "b": 373.3168, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "GLYPH<g40>GLYPH<g68>GLYPH<g85> GLYPH<g81>GLYPH<g3>", "bbox": {"l": 151.9388, "t": 367.93219, "r": 166.05655, "b": 373.57178, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "GLYPH<g74>GLYPH<g85>GLYPH<g72>GLYPH<g68>GLYPH<g87>GLYPH<g72>GLYPH<g85>GLYPH<g3>", "bbox": {"l": 165.73697, "t": 367.93219, "r": 186.40289, "b": 373.57178, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "GLYPH<g85>GLYPH<g72>GLYPH<g87>GLYPH<g88>GLYPH<g85> GLYPH<g81>GLYPH<g3>", "bbox": {"l": 186.09586, "t": 367.93219, "r": 203.61617, "b": 373.57178, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "GLYPH<g82>GLYPH<g81>GLYPH<g3>", "bbox": {"l": 203.30286, "t": 367.93219, "r": 211.82489, "b": 373.57178, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "GLYPH<g44>GLYPH<g55>GLYPH<g3>", "bbox": {"l": 211.49905, "t": 367.93219, "r": 218.16002, "b": 373.57178, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "GLYPH<g83>GLYPH<g85>GLYPH<g82>GLYPH<g77>GLYPH<g72>GLYPH<g70>GLYPH<g87>GLYPH<g86> GLYPH<g3>", "bbox": {"l": 217.83418, "t": 367.93219, "r": 241.30737, "b": 373.57178, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "GLYPH<g87>GLYPH<g75>GLYPH<g85>GLYPH<g82>GLYPH<g88>GLYPH<g74>GLYPH<g75>GLYPH<g3>", "bbox": {"l": 151.93253, "t": 375.76495, "r": 174.46577, "b": 381.40454, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "GLYPH<g80>GLYPH<g82>GLYPH<g71>GLYPH<g72>GLYPH<g85> GLYPH<g81>GLYPH<g76>GLYPH<g93>GLYPH<g68>GLYPH<g87>GLYPH<g76>GLYPH<g82>GLYPH<g81>GLYPH<g3>", "bbox": {"l": 174.15874, "t": 375.76495, "r": 214.4128, "b": 381.40454, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "GLYPH<g82>GLYPH<g73>GLYPH<g3>", "bbox": {"l": 214.11829, "t": 375.76495, "r": 221.01110999999997, "b": 381.40454, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "GLYPH<g71>GLYPH<g68>GLYPH<g87>GLYPH<g68>GLYPH<g69>GLYPH<g68>GLYPH<g86>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 220.68527, "t": 375.76495, "r": 247.52341000000004, "b": 381.40454, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "GLYPH<g68>GLYPH<g81>GLYPH<g71> GLYPH<g3>", "bbox": {"l": 247.21637, "t": 375.76495, "r": 259.2287, "b": 381.40454, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "GLYPH<g68>GLYPH<g83>GLYPH<g83>GLYPH<g79>GLYPH<g76>GLYPH<g70>GLYPH<g68>GLYPH<g87>GLYPH<g76>GLYPH<g82>GLYPH<g81>GLYPH<g86>", "bbox": {"l": 151.93253, "t": 383.59772, "r": 184.61703, "b": 389.2373, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<g115>GLYPH<g3> GLYPH<g40>GLYPH<g68>GLYPH<g85> GLYPH<g81>GLYPH<g3> GLYPH<g74>GLYPH<g85>GLYPH<g72>GLYPH<g68>GLYPH<g87>GLYPH<g72>GLYPH<g85>GLYPH<g3> GLYPH<g85>GLYPH<g72>GLYPH<g87>GLYPH<g88>GLYPH<g85> GLYPH<g81>GLYPH<g3> GLYPH<g82>GLYPH<g81>GLYPH<g3> GLYPH<g44>GLYPH<g55>GLYPH<g3> GLYPH<g83>GLYPH<g85>GLYPH<g82>GLYPH<g77>GLYPH<g72>GLYPH<g70>GLYPH<g87>GLYPH<g86> GLYPH<g3> GLYPH<g87>GLYPH<g75>GLYPH<g85>GLYPH<g82>GLYPH<g88>GLYPH<g74>GLYPH<g75>GLYPH<g3> GLYPH<g80>GLYPH<g82>GLYPH<g71>GLYPH<g72>GLYPH<g85> GLYPH<g81>GLYPH<g76>GLYPH<g93>GLYPH<g68>GLYPH<g87>GLYPH<g76>GLYPH<g82>GLYPH<g81>GLYPH<g3> GLYPH<g82>GLYPH<g73>GLYPH<g3> GLYPH<g71>GLYPH<g68>GLYPH<g87>GLYPH<g68>GLYPH<g69>GLYPH<g68>GLYPH<g86>GLYPH<g72>GLYPH<g3> GLYPH<g68>GLYPH<g81>GLYPH<g71> GLYPH<g3> GLYPH<g68>GLYPH<g83>GLYPH<g83>GLYPH<g79>GLYPH<g76>GLYPH<g70>GLYPH<g68>GLYPH<g87>GLYPH<g76>GLYPH<g82>GLYPH<g81>GLYPH<g86>"}, {"label": "list_item", "id": 4, "page_no": 2, "cluster": {"id": 4, "label": "list_item", "bbox": {"l": 144.88921, "t": 398.48019, "r": 249.83562, "b": 411.95255, "coord_origin": "TOPLEFT"}, "confidence": 0.9541198015213013, "cells": [{"id": 58, "text": "GLYPH<g115>GLYPH<g3>", "bbox": {"l": 144.88921, "t": 399.28265, "r": 148.68732, "b": 403.86481000000003, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "GLYPH<g53>GLYPH<g72>GLYPH<g79>GLYPH<g92>GLYPH<g3>", "bbox": {"l": 151.9388, "t": 398.48019, "r": 165.36099, "b": 404.11978, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "GLYPH<g82>GLYPH<g81>GLYPH<g3>", "bbox": {"l": 165.04141, "t": 398.48019, "r": 173.56345, "b": 404.11978, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "GLYPH<g44>GLYPH<g37>GLYPH<g48>GLYPH<g3>", "bbox": {"l": 173.23761, "t": 398.48019, "r": 185.95174, "b": 404.11978, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "GLYPH<g72>GLYPH<g91>GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g87>GLYPH<g3>", "bbox": {"l": 185.63216, "t": 398.48019, "r": 204.42448, "b": 404.11978, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "GLYPH<g70>GLYPH<g82>GLYPH<g81>GLYPH<g86>GLYPH<g88>GLYPH<g79>GLYPH<g87>GLYPH<g76>GLYPH<g81>GLYPH<g74>GLYPH<g15>GLYPH<g3>", "bbox": {"l": 204.11118, "t": 398.48019, "r": 235.29178, "b": 404.11978, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "GLYPH<g86>GLYPH<g78>GLYPH<g76>GLYPH<g79>GLYPH<g79>GLYPH<g86> GLYPH<g3>", "bbox": {"l": 234.99099999999999, "t": 398.48019, "r": 249.83562, "b": 404.11978, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "GLYPH<g86>GLYPH<g75>GLYPH<g68>GLYPH<g85>GLYPH<g76>GLYPH<g81>GLYPH<g74>GLYPH<g3>", "bbox": {"l": 151.93253, "t": 406.31296, "r": 173.41306, "b": 411.95255, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "GLYPH<g68>GLYPH<g81>GLYPH<g71>GLYPH<g3>", "bbox": {"l": 173.10602, "t": 406.31296, "r": 185.0118, "b": 411.95255, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "GLYPH<g85>GLYPH<g72>GLYPH<g81>GLYPH<g82>GLYPH<g90>GLYPH<g81>GLYPH<g3>", "bbox": {"l": 184.69221, "t": 406.31296, "r": 206.3858, "b": 411.95255, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "GLYPH<g86>GLYPH<g72>GLYPH<g85>GLYPH<g89>GLYPH<g76>GLYPH<g70>GLYPH<g72>GLYPH<g86>", "bbox": {"l": 206.07249, "t": 406.31296, "r": 228.24231000000003, "b": 411.95255, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<g115>GLYPH<g3> GLYPH<g53>GLYPH<g72>GLYPH<g79>GLYPH<g92>GLYPH<g3> GLYPH<g82>GLYPH<g81>GLYPH<g3> GLYPH<g44>GLYPH<g37>GLYPH<g48>GLYPH<g3> GLYPH<g72>GLYPH<g91>GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g87>GLYPH<g3> GLYPH<g70>GLYPH<g82>GLYPH<g81>GLYPH<g86>GLYPH<g88>GLYPH<g79>GLYPH<g87>GLYPH<g76>GLYPH<g81>GLYPH<g74>GLYPH<g15>GLYPH<g3> GLYPH<g86>GLYPH<g78>GLYPH<g76>GLYPH<g79>GLYPH<g79>GLYPH<g86> GLYPH<g3> GLYPH<g86>GLYPH<g75>GLYPH<g68>GLYPH<g85>GLYPH<g76>GLYPH<g81>GLYPH<g74>GLYPH<g3> GLYPH<g68>GLYPH<g81>GLYPH<g71>GLYPH<g3> GLYPH<g85>GLYPH<g72>GLYPH<g81>GLYPH<g82>GLYPH<g90>GLYPH<g81>GLYPH<g3> GLYPH<g86>GLYPH<g72>GLYPH<g85>GLYPH<g89>GLYPH<g76>GLYPH<g70>GLYPH<g72>GLYPH<g86>"}, {"label": "list_item", "id": 5, "page_no": 2, "cluster": {"id": 5, "label": "list_item", "bbox": {"l": 144.88921, "t": 421.1952800000001, "r": 234.25163000000003, "b": 434.66763, "coord_origin": "TOPLEFT"}, "confidence": 0.9440371990203857, "cells": [{"id": 69, "text": "GLYPH<g115>GLYPH<g3>", "bbox": {"l": 144.88921, "t": 421.99773999999996, "r": 148.68732, "b": 426.5799, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "GLYPH<g55>", "bbox": {"l": 151.9388, "t": 421.1952800000001, "r": 155.43533, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "GLYPH<g68>GLYPH<g78>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 154.73979, "t": 421.1952800000001, "r": 166.06282, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "GLYPH<g68>GLYPH<g71>GLYPH<g89>GLYPH<g68>GLYPH<g81>GLYPH<g87>GLYPH<g68>GLYPH<g74>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 165.74324, "t": 421.1952800000001, "r": 195.84607, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "GLYPH<g82>GLYPH<g73>GLYPH<g3>", "bbox": {"l": 195.53903, "t": 421.1952800000001, "r": 202.43185, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "GLYPH<g68>GLYPH<g70>GLYPH<g70>GLYPH<g72>GLYPH<g86>GLYPH<g86>GLYPH<g3>", "bbox": {"l": 202.10602, "t": 421.1952800000001, "r": 222.87220999999997, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "GLYPH<g87>GLYPH<g82>GLYPH<g3>", "bbox": {"l": 222.55890000000002, "t": 421.1952800000001, "r": 229.57077, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "GLYPH<g68> GLYPH<g3>", "bbox": {"l": 229.24492999999998, "t": 421.1952800000001, "r": 234.25163000000003, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "GLYPH<g90>GLYPH<g82>GLYPH<g85>GLYPH<g79>GLYPH<g71>GLYPH<g90>GLYPH<g76>GLYPH<g71>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 151.92627, "t": 429.02805, "r": 181.42754, "b": 434.66763, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "GLYPH<g86>GLYPH<g82>GLYPH<g88>GLYPH<g85>GLYPH<g70>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 181.1205, "t": 429.02805, "r": 201.07835, "b": 434.66763, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "GLYPH<g82>GLYPH<g73>GLYPH<g3>", "bbox": {"l": 200.76505, "t": 429.02805, "r": 207.65787, "b": 434.66763, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "GLYPH<g72>GLYPH<g91>GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g87>GLYPH<g76>GLYPH<g86>GLYPH<g72>", "bbox": {"l": 207.33203, "t": 429.02805, "r": 232.07098000000002, "b": 434.66763, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<g115>GLYPH<g3> GLYPH<g55> GLYPH<g68>GLYPH<g78>GLYPH<g72>GLYPH<g3> GLYPH<g68>GLYPH<g71>GLYPH<g89>GLYPH<g68>GLYPH<g81>GLYPH<g87>GLYPH<g68>GLYPH<g74>GLYPH<g72>GLYPH<g3> GLYPH<g82>GLYPH<g73>GLYPH<g3> GLYPH<g68>GLYPH<g70>GLYPH<g70>GLYPH<g72>GLYPH<g86>GLYPH<g86>GLYPH<g3> GLYPH<g87>GLYPH<g82>GLYPH<g3> GLYPH<g68> GLYPH<g3> GLYPH<g90>GLYPH<g82>GLYPH<g85>GLYPH<g79>GLYPH<g71>GLYPH<g90>GLYPH<g76>GLYPH<g71>GLYPH<g72>GLYPH<g3> GLYPH<g86>GLYPH<g82>GLYPH<g88>GLYPH<g85>GLYPH<g70>GLYPH<g72>GLYPH<g3> GLYPH<g82>GLYPH<g73>GLYPH<g3> GLYPH<g72>GLYPH<g91>GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g87>GLYPH<g76>GLYPH<g86>GLYPH<g72>"}, {"label": "picture", "id": 24, "page_no": 2, "cluster": {"id": 24, "label": "picture", "bbox": {"l": 143.39866638183594, "t": 270.2610778808594, "r": 179.56256103515625, "b": 285.621337890625, "coord_origin": "TOPLEFT"}, "confidence": 0.7491769194602966, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "picture", "id": 15, "page_no": 2, "cluster": {"id": 15, "label": "picture", "bbox": {"l": 64.16704559326172, "t": 603.50634765625, "r": 258.77435302734375, "b": 688.1282348632812, "coord_origin": "TOPLEFT"}, "confidence": 0.8925827741622925, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "headers": []}}, {"page_no": 3, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "' Copyright IBM Corp. 2014. All rights reserved.", "bbox": {"l": 64.800003, "t": 755.538002, "r": 257.24335, "b": 763.863001, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "xi", "bbox": {"l": 538.85999, "t": 754.848721, "r": 547.25031, "b": 764.06172, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Preface", "bbox": {"l": 64.800003, "t": 73.84802000000002, "r": 151.46161, "b": 96.04803000000004, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "This IBMfi Redpaper\u2122 publication provides information about the IBM i 7.2 feature of IBM ", "bbox": {"l": 136.8, "t": 132.64862000000005, "r": 542.91888, "b": 141.86163, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "DB2fi for i Row and Column Access Control (RCAC). It offers a broad description of the ", "bbox": {"l": 136.79984, "t": 144.64844000000005, "r": 526.65509, "b": 153.86145, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "function and advantages of controlling access to data in a comprehensive and transparent ", "bbox": {"l": 136.79984, "t": 156.64824999999996, "r": 536.82135, "b": 165.86127, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "way. This publication helps you understand the capabilities of RCAC and provides examples ", "bbox": {"l": 136.79987, "t": 168.64806999999996, "r": 544.67975, "b": 177.86108000000002, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "of defining, creating, and implementing the row permissions and column masks in a relational ", "bbox": {"l": 136.79987, "t": 180.64788999999996, "r": 547.30823, "b": 189.86090000000002, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "database environment.", "bbox": {"l": 136.79987, "t": 192.64770999999996, "r": 238.32117, "b": 201.86072000000001, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "This paper is intended for database engineers, data-centric application developers, and ", "bbox": {"l": 136.79987, "t": 214.60748, "r": 524.18518, "b": 223.82050000000004, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "security officers who want to design and implement RCAC as a part of their data control and ", "bbox": {"l": 136.79987, "t": 226.6073, "r": 546.4657, "b": 235.82030999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "governance policy. A solid background in IBM i object level security, DB2 for i relational ", "bbox": {"l": 136.79987, "t": 238.60712, "r": 521.25488, "b": 247.82012999999995, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "database concepts, and SQL is assumed.", "bbox": {"l": 136.79987, "t": 250.60693000000003, "r": 321.69434, "b": 259.81994999999995, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Authors", "bbox": {"l": 64.800003, "t": 288.3006, "r": 125.36661, "b": 303.0636, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "This paper was produced by the IBM DB2 for i Center of Excellence team in partnership with ", "bbox": {"l": 136.8, "t": 320.62871999999993, "r": 547.23669, "b": 329.8417099999999, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "the International Technical Support Organization (ITSO), Rochester, Minnesota US.", "bbox": {"l": 136.8, "t": 332.62854, "r": 505.05518, "b": 341.84152, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Jim Bainbridge", "bbox": {"l": 263.39957, "t": 375.64877, "r": 335.7251, "b": 384.86176, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": " is a senior DB2 consultant on the DB2 for i ", "bbox": {"l": 335.69922, "t": 375.64877, "r": 529.34259, "b": 384.86176, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Center of Excellence team in the IBM Lab Services and ", "bbox": {"l": 263.3996, "t": 387.64859, "r": 511.50717, "b": 396.86157, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Training organization. His primary role is training and ", "bbox": {"l": 263.3996, "t": 399.64841, "r": 499.077, "b": 408.86139, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "implementation services for IBM DB2 Web Query for i and ", "bbox": {"l": 263.3996, "t": 411.64822, "r": 522.51996, "b": 420.86121, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "business analytics. Jim began his career with IBM 30 years ago ", "bbox": {"l": 263.3996, "t": 423.64804, "r": 541.25079, "b": 432.86102, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "in the IBM Rochester Development Lab, where he developed ", "bbox": {"l": 263.3996, "t": 435.64786, "r": 534.71411, "b": 444.86084, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "cooperative processing products that paired IBM PCs with IBM ", "bbox": {"l": 263.3996, "t": 447.64767, "r": 541.22375, "b": 456.86066, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "S/36 and AS/.400 systems. In the years since, Jim has held ", "bbox": {"l": 263.3996, "t": 459.64749, "r": 528.91016, "b": 468.86047, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "numerous technical roles, including independent software ", "bbox": {"l": 263.3996, "t": 471.64731, "r": 520.24207, "b": 480.86029, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "vendors technical support on a broad range of IBM ", "bbox": {"l": 263.3996, "t": 483.64713, "r": 490.6967200000001, "b": 492.86011, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "technologies and products, and supporting customers in the ", "bbox": {"l": 263.3996, "t": 495.64694, "r": 530.95514, "b": 504.85992, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "IBM Executive Briefing Center and IBM Project Office.", "bbox": {"l": 263.3996, "t": 507.64676, "r": 501.62973, "b": 516.85974, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Hernando Bedoya", "bbox": {"l": 263.3996, "t": 527.62653, "r": 348.38229, "b": 536.83952, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": " is a Senior IT Specialist at STG Lab ", "bbox": {"l": 348.41916, "t": 527.62653, "r": 512.3429, "b": 536.83952, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Services and Training in Rochester, Minnesota. He writes ", "bbox": {"l": 263.3996, "t": 539.62633, "r": 519.26306, "b": 548.83932, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "extensively and teaches IBM classes worldwide in all areas of ", "bbox": {"l": 263.3996, "t": 551.62613, "r": 538.40308, "b": 560.8391300000001, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "DB2 for i. Before joining STG Lab Services, he worked in the ", "bbox": {"l": 263.3996, "t": 563.62593, "r": 533.95715, "b": 572.83893, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "ITSO for nine years writing multiple IBM Redbooksfi ", "bbox": {"l": 263.3996, "t": 575.62573, "r": 496.94464, "b": 584.8387299999999, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "publications. He also worked for IBM Colombia as an IBM ", "bbox": {"l": 263.3996, "t": 587.62553, "r": 520.38562, "b": 596.83853, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "AS/400fi IT Specialist doing presales support for the Andean ", "bbox": {"l": 263.3996, "t": 599.62534, "r": 535.99078, "b": 608.83833, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "countries. He has 28 years of experience in the computing field ", "bbox": {"l": 263.3996, "t": 611.62514, "r": 541.27374, "b": 620.83813, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "and has taught database classes in Colombian universities. He ", "bbox": {"l": 263.3996, "t": 623.62494, "r": 541.26465, "b": 632.83794, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "holds a Master\u2019s degree in Computer Science from EAFIT, ", "bbox": {"l": 263.3996, "t": 635.62474, "r": 523.22211, "b": 644.8377399999999, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "Colombia. His areas of expertise are database technology, ", "bbox": {"l": 263.3996, "t": 647.62454, "r": 524.77386, "b": 656.83754, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "performance, and data warehousing. Hernando can be ", "bbox": {"l": 263.3996, "t": 659.62434, "r": 508.27124, "b": 668.83735, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "contacted at ", "bbox": {"l": 263.3996, "t": 671.62415, "r": 320.63568, "b": 680.83716, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "hbedoya@us.ibm.com", "bbox": {"l": 320.63971, "t": 671.77356, "r": 410.57852, "b": 680.54832, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": ".", "bbox": {"l": 410.5795, "t": 671.62415, "r": 413.34839, "b": 680.83716, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 7, "label": "page_footer", "bbox": {"l": 64.800003, "t": 755.538002, "r": 257.24335, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9469243884086609, "cells": [{"id": 0, "text": "' Copyright IBM Corp. 2014. All rights reserved.", "bbox": {"l": 64.800003, "t": 755.538002, "r": 257.24335, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "page_footer", "bbox": {"l": 538.85999, "t": 754.848721, "r": 547.25031, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.9040942788124084, "cells": [{"id": 1, "text": "xi", "bbox": {"l": 538.85999, "t": 754.848721, "r": 547.25031, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "section_header", "bbox": {"l": 64.800003, "t": 73.84802000000002, "r": 151.46161, "b": 96.04803000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9174709916114807, "cells": [{"id": 2, "text": "Preface", "bbox": {"l": 64.800003, "t": 73.84802000000002, "r": 151.46161, "b": 96.04803000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 136.79984, "t": 132.64862000000005, "r": 547.30823, "b": 201.86072000000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9869155883789062, "cells": [{"id": 3, "text": "This IBMfi Redpaper\u2122 publication provides information about the IBM i 7.2 feature of IBM ", "bbox": {"l": 136.8, "t": 132.64862000000005, "r": 542.91888, "b": 141.86163, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "DB2fi for i Row and Column Access Control (RCAC). It offers a broad description of the ", "bbox": {"l": 136.79984, "t": 144.64844000000005, "r": 526.65509, "b": 153.86145, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "function and advantages of controlling access to data in a comprehensive and transparent ", "bbox": {"l": 136.79984, "t": 156.64824999999996, "r": 536.82135, "b": 165.86127, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "way. This publication helps you understand the capabilities of RCAC and provides examples ", "bbox": {"l": 136.79987, "t": 168.64806999999996, "r": 544.67975, "b": 177.86108000000002, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "of defining, creating, and implementing the row permissions and column masks in a relational ", "bbox": {"l": 136.79987, "t": 180.64788999999996, "r": 547.30823, "b": 189.86090000000002, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "database environment.", "bbox": {"l": 136.79987, "t": 192.64770999999996, "r": 238.32117, "b": 201.86072000000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 136.79987, "t": 214.60748, "r": 546.4657, "b": 259.81994999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9872201681137085, "cells": [{"id": 9, "text": "This paper is intended for database engineers, data-centric application developers, and ", "bbox": {"l": 136.79987, "t": 214.60748, "r": 524.18518, "b": 223.82050000000004, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "security officers who want to design and implement RCAC as a part of their data control and ", "bbox": {"l": 136.79987, "t": 226.6073, "r": 546.4657, "b": 235.82030999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "governance policy. A solid background in IBM i object level security, DB2 for i relational ", "bbox": {"l": 136.79987, "t": 238.60712, "r": 521.25488, "b": 247.82012999999995, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "database concepts, and SQL is assumed.", "bbox": {"l": 136.79987, "t": 250.60693000000003, "r": 321.69434, "b": 259.81994999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "section_header", "bbox": {"l": 64.800003, "t": 288.3006, "r": 125.36661, "b": 303.0636, "coord_origin": "TOPLEFT"}, "confidence": 0.9255505204200745, "cells": [{"id": 13, "text": "Authors", "bbox": {"l": 64.800003, "t": 288.3006, "r": 125.36661, "b": 303.0636, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "text", "bbox": {"l": 136.8, "t": 320.62871999999993, "r": 547.23669, "b": 341.84152, "coord_origin": "TOPLEFT"}, "confidence": 0.9713318943977356, "cells": [{"id": 14, "text": "This paper was produced by the IBM DB2 for i Center of Excellence team in partnership with ", "bbox": {"l": 136.8, "t": 320.62871999999993, "r": 547.23669, "b": 329.8417099999999, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "the International Technical Support Organization (ITSO), Rochester, Minnesota US.", "bbox": {"l": 136.8, "t": 332.62854, "r": 505.05518, "b": 341.84152, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "text", "bbox": {"l": 263.39957, "t": 375.64877, "r": 541.25079, "b": 516.85974, "coord_origin": "TOPLEFT"}, "confidence": 0.9842760562896729, "cells": [{"id": 16, "text": "Jim Bainbridge", "bbox": {"l": 263.39957, "t": 375.64877, "r": 335.7251, "b": 384.86176, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": " is a senior DB2 consultant on the DB2 for i ", "bbox": {"l": 335.69922, "t": 375.64877, "r": 529.34259, "b": 384.86176, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Center of Excellence team in the IBM Lab Services and ", "bbox": {"l": 263.3996, "t": 387.64859, "r": 511.50717, "b": 396.86157, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Training organization. His primary role is training and ", "bbox": {"l": 263.3996, "t": 399.64841, "r": 499.077, "b": 408.86139, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "implementation services for IBM DB2 Web Query for i and ", "bbox": {"l": 263.3996, "t": 411.64822, "r": 522.51996, "b": 420.86121, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "business analytics. Jim began his career with IBM 30 years ago ", "bbox": {"l": 263.3996, "t": 423.64804, "r": 541.25079, "b": 432.86102, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "in the IBM Rochester Development Lab, where he developed ", "bbox": {"l": 263.3996, "t": 435.64786, "r": 534.71411, "b": 444.86084, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "cooperative processing products that paired IBM PCs with IBM ", "bbox": {"l": 263.3996, "t": 447.64767, "r": 541.22375, "b": 456.86066, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "S/36 and AS/.400 systems. In the years since, Jim has held ", "bbox": {"l": 263.3996, "t": 459.64749, "r": 528.91016, "b": 468.86047, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "numerous technical roles, including independent software ", "bbox": {"l": 263.3996, "t": 471.64731, "r": 520.24207, "b": 480.86029, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "vendors technical support on a broad range of IBM ", "bbox": {"l": 263.3996, "t": 483.64713, "r": 490.6967200000001, "b": 492.86011, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "technologies and products, and supporting customers in the ", "bbox": {"l": 263.3996, "t": 495.64694, "r": 530.95514, "b": 504.85992, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "IBM Executive Briefing Center and IBM Project Office.", "bbox": {"l": 263.3996, "t": 507.64676, "r": 501.62973, "b": 516.85974, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "text", "bbox": {"l": 263.3996, "t": 527.62653, "r": 541.27374, "b": 680.83716, "coord_origin": "TOPLEFT"}, "confidence": 0.9823779463768005, "cells": [{"id": 29, "text": "Hernando Bedoya", "bbox": {"l": 263.3996, "t": 527.62653, "r": 348.38229, "b": 536.83952, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": " is a Senior IT Specialist at STG Lab ", "bbox": {"l": 348.41916, "t": 527.62653, "r": 512.3429, "b": 536.83952, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Services and Training in Rochester, Minnesota. He writes ", "bbox": {"l": 263.3996, "t": 539.62633, "r": 519.26306, "b": 548.83932, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "extensively and teaches IBM classes worldwide in all areas of ", "bbox": {"l": 263.3996, "t": 551.62613, "r": 538.40308, "b": 560.8391300000001, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "DB2 for i. Before joining STG Lab Services, he worked in the ", "bbox": {"l": 263.3996, "t": 563.62593, "r": 533.95715, "b": 572.83893, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "ITSO for nine years writing multiple IBM Redbooksfi ", "bbox": {"l": 263.3996, "t": 575.62573, "r": 496.94464, "b": 584.8387299999999, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "publications. He also worked for IBM Colombia as an IBM ", "bbox": {"l": 263.3996, "t": 587.62553, "r": 520.38562, "b": 596.83853, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "AS/400fi IT Specialist doing presales support for the Andean ", "bbox": {"l": 263.3996, "t": 599.62534, "r": 535.99078, "b": 608.83833, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "countries. He has 28 years of experience in the computing field ", "bbox": {"l": 263.3996, "t": 611.62514, "r": 541.27374, "b": 620.83813, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "and has taught database classes in Colombian universities. He ", "bbox": {"l": 263.3996, "t": 623.62494, "r": 541.26465, "b": 632.83794, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "holds a Master\u2019s degree in Computer Science from EAFIT, ", "bbox": {"l": 263.3996, "t": 635.62474, "r": 523.22211, "b": 644.8377399999999, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "Colombia. His areas of expertise are database technology, ", "bbox": {"l": 263.3996, "t": 647.62454, "r": 524.77386, "b": 656.83754, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "performance, and data warehousing. Hernando can be ", "bbox": {"l": 263.3996, "t": 659.62434, "r": 508.27124, "b": 668.83735, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "contacted at ", "bbox": {"l": 263.3996, "t": 671.62415, "r": 320.63568, "b": 680.83716, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "hbedoya@us.ibm.com", "bbox": {"l": 320.63971, "t": 671.77356, "r": 410.57852, "b": 680.54832, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": ".", "bbox": {"l": 410.5795, "t": 671.62415, "r": 413.34839, "b": 680.83716, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "picture", "bbox": {"l": 142.52883911132812, "t": 375.0449523925781, "r": 251.47850036621094, "b": 503.20648193359375, "coord_origin": "TOPLEFT"}, "confidence": 0.9862572550773621, "cells": [], "children": []}, {"id": 1, "label": "picture", "bbox": {"l": 145.41445922851562, "t": 527.2447509765625, "r": 252.08840942382812, "b": 635.383056640625, "coord_origin": "TOPLEFT"}, "confidence": 0.987165629863739, "cells": [], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_footer", "id": 7, "page_no": 3, "cluster": {"id": 7, "label": "page_footer", "bbox": {"l": 64.800003, "t": 755.538002, "r": 257.24335, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9469243884086609, "cells": [{"id": 0, "text": "' Copyright IBM Corp. 2014. All rights reserved.", "bbox": {"l": 64.800003, "t": 755.538002, "r": 257.24335, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "' Copyright IBM Corp. 2014. All rights reserved."}, {"label": "page_footer", "id": 10, "page_no": 3, "cluster": {"id": 10, "label": "page_footer", "bbox": {"l": 538.85999, "t": 754.848721, "r": 547.25031, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.9040942788124084, "cells": [{"id": 1, "text": "xi", "bbox": {"l": 538.85999, "t": 754.848721, "r": 547.25031, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "xi"}, {"label": "section_header", "id": 9, "page_no": 3, "cluster": {"id": 9, "label": "section_header", "bbox": {"l": 64.800003, "t": 73.84802000000002, "r": 151.46161, "b": 96.04803000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9174709916114807, "cells": [{"id": 2, "text": "Preface", "bbox": {"l": 64.800003, "t": 73.84802000000002, "r": 151.46161, "b": 96.04803000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Preface"}, {"label": "text", "id": 2, "page_no": 3, "cluster": {"id": 2, "label": "text", "bbox": {"l": 136.79984, "t": 132.64862000000005, "r": 547.30823, "b": 201.86072000000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9869155883789062, "cells": [{"id": 3, "text": "This IBMfi Redpaper\u2122 publication provides information about the IBM i 7.2 feature of IBM ", "bbox": {"l": 136.8, "t": 132.64862000000005, "r": 542.91888, "b": 141.86163, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "DB2fi for i Row and Column Access Control (RCAC). It offers a broad description of the ", "bbox": {"l": 136.79984, "t": 144.64844000000005, "r": 526.65509, "b": 153.86145, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "function and advantages of controlling access to data in a comprehensive and transparent ", "bbox": {"l": 136.79984, "t": 156.64824999999996, "r": 536.82135, "b": 165.86127, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "way. This publication helps you understand the capabilities of RCAC and provides examples ", "bbox": {"l": 136.79987, "t": 168.64806999999996, "r": 544.67975, "b": 177.86108000000002, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "of defining, creating, and implementing the row permissions and column masks in a relational ", "bbox": {"l": 136.79987, "t": 180.64788999999996, "r": 547.30823, "b": 189.86090000000002, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "database environment.", "bbox": {"l": 136.79987, "t": 192.64770999999996, "r": 238.32117, "b": 201.86072000000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "This IBMfi Redpaper\u2122 publication provides information about the IBM i 7.2 feature of IBM DB2fi for i Row and Column Access Control (RCAC). It offers a broad description of the function and advantages of controlling access to data in a comprehensive and transparent way. This publication helps you understand the capabilities of RCAC and provides examples of defining, creating, and implementing the row permissions and column masks in a relational database environment."}, {"label": "text", "id": 0, "page_no": 3, "cluster": {"id": 0, "label": "text", "bbox": {"l": 136.79987, "t": 214.60748, "r": 546.4657, "b": 259.81994999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9872201681137085, "cells": [{"id": 9, "text": "This paper is intended for database engineers, data-centric application developers, and ", "bbox": {"l": 136.79987, "t": 214.60748, "r": 524.18518, "b": 223.82050000000004, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "security officers who want to design and implement RCAC as a part of their data control and ", "bbox": {"l": 136.79987, "t": 226.6073, "r": 546.4657, "b": 235.82030999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "governance policy. A solid background in IBM i object level security, DB2 for i relational ", "bbox": {"l": 136.79987, "t": 238.60712, "r": 521.25488, "b": 247.82012999999995, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "database concepts, and SQL is assumed.", "bbox": {"l": 136.79987, "t": 250.60693000000003, "r": 321.69434, "b": 259.81994999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "This paper is intended for database engineers, data-centric application developers, and security officers who want to design and implement RCAC as a part of their data control and governance policy. A solid background in IBM i object level security, DB2 for i relational database concepts, and SQL is assumed."}, {"label": "section_header", "id": 8, "page_no": 3, "cluster": {"id": 8, "label": "section_header", "bbox": {"l": 64.800003, "t": 288.3006, "r": 125.36661, "b": 303.0636, "coord_origin": "TOPLEFT"}, "confidence": 0.9255505204200745, "cells": [{"id": 13, "text": "Authors", "bbox": {"l": 64.800003, "t": 288.3006, "r": 125.36661, "b": 303.0636, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Authors"}, {"label": "text", "id": 6, "page_no": 3, "cluster": {"id": 6, "label": "text", "bbox": {"l": 136.8, "t": 320.62871999999993, "r": 547.23669, "b": 341.84152, "coord_origin": "TOPLEFT"}, "confidence": 0.9713318943977356, "cells": [{"id": 14, "text": "This paper was produced by the IBM DB2 for i Center of Excellence team in partnership with ", "bbox": {"l": 136.8, "t": 320.62871999999993, "r": 547.23669, "b": 329.8417099999999, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "the International Technical Support Organization (ITSO), Rochester, Minnesota US.", "bbox": {"l": 136.8, "t": 332.62854, "r": 505.05518, "b": 341.84152, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "This paper was produced by the IBM DB2 for i Center of Excellence team in partnership with the International Technical Support Organization (ITSO), Rochester, Minnesota US."}, {"label": "text", "id": 4, "page_no": 3, "cluster": {"id": 4, "label": "text", "bbox": {"l": 263.39957, "t": 375.64877, "r": 541.25079, "b": 516.85974, "coord_origin": "TOPLEFT"}, "confidence": 0.9842760562896729, "cells": [{"id": 16, "text": "Jim Bainbridge", "bbox": {"l": 263.39957, "t": 375.64877, "r": 335.7251, "b": 384.86176, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": " is a senior DB2 consultant on the DB2 for i ", "bbox": {"l": 335.69922, "t": 375.64877, "r": 529.34259, "b": 384.86176, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Center of Excellence team in the IBM Lab Services and ", "bbox": {"l": 263.3996, "t": 387.64859, "r": 511.50717, "b": 396.86157, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Training organization. His primary role is training and ", "bbox": {"l": 263.3996, "t": 399.64841, "r": 499.077, "b": 408.86139, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "implementation services for IBM DB2 Web Query for i and ", "bbox": {"l": 263.3996, "t": 411.64822, "r": 522.51996, "b": 420.86121, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "business analytics. Jim began his career with IBM 30 years ago ", "bbox": {"l": 263.3996, "t": 423.64804, "r": 541.25079, "b": 432.86102, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "in the IBM Rochester Development Lab, where he developed ", "bbox": {"l": 263.3996, "t": 435.64786, "r": 534.71411, "b": 444.86084, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "cooperative processing products that paired IBM PCs with IBM ", "bbox": {"l": 263.3996, "t": 447.64767, "r": 541.22375, "b": 456.86066, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "S/36 and AS/.400 systems. In the years since, Jim has held ", "bbox": {"l": 263.3996, "t": 459.64749, "r": 528.91016, "b": 468.86047, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "numerous technical roles, including independent software ", "bbox": {"l": 263.3996, "t": 471.64731, "r": 520.24207, "b": 480.86029, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "vendors technical support on a broad range of IBM ", "bbox": {"l": 263.3996, "t": 483.64713, "r": 490.6967200000001, "b": 492.86011, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "technologies and products, and supporting customers in the ", "bbox": {"l": 263.3996, "t": 495.64694, "r": 530.95514, "b": 504.85992, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "IBM Executive Briefing Center and IBM Project Office.", "bbox": {"l": 263.3996, "t": 507.64676, "r": 501.62973, "b": 516.85974, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Jim Bainbridge is a senior DB2 consultant on the DB2 for i Center of Excellence team in the IBM Lab Services and Training organization. His primary role is training and implementation services for IBM DB2 Web Query for i and business analytics. Jim began his career with IBM 30 years ago in the IBM Rochester Development Lab, where he developed cooperative processing products that paired IBM PCs with IBM S/36 and AS/.400 systems. In the years since, Jim has held numerous technical roles, including independent software vendors technical support on a broad range of IBM technologies and products, and supporting customers in the IBM Executive Briefing Center and IBM Project Office."}, {"label": "text", "id": 5, "page_no": 3, "cluster": {"id": 5, "label": "text", "bbox": {"l": 263.3996, "t": 527.62653, "r": 541.27374, "b": 680.83716, "coord_origin": "TOPLEFT"}, "confidence": 0.9823779463768005, "cells": [{"id": 29, "text": "Hernando Bedoya", "bbox": {"l": 263.3996, "t": 527.62653, "r": 348.38229, "b": 536.83952, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": " is a Senior IT Specialist at STG Lab ", "bbox": {"l": 348.41916, "t": 527.62653, "r": 512.3429, "b": 536.83952, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Services and Training in Rochester, Minnesota. He writes ", "bbox": {"l": 263.3996, "t": 539.62633, "r": 519.26306, "b": 548.83932, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "extensively and teaches IBM classes worldwide in all areas of ", "bbox": {"l": 263.3996, "t": 551.62613, "r": 538.40308, "b": 560.8391300000001, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "DB2 for i. Before joining STG Lab Services, he worked in the ", "bbox": {"l": 263.3996, "t": 563.62593, "r": 533.95715, "b": 572.83893, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "ITSO for nine years writing multiple IBM Redbooksfi ", "bbox": {"l": 263.3996, "t": 575.62573, "r": 496.94464, "b": 584.8387299999999, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "publications. He also worked for IBM Colombia as an IBM ", "bbox": {"l": 263.3996, "t": 587.62553, "r": 520.38562, "b": 596.83853, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "AS/400fi IT Specialist doing presales support for the Andean ", "bbox": {"l": 263.3996, "t": 599.62534, "r": 535.99078, "b": 608.83833, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "countries. He has 28 years of experience in the computing field ", "bbox": {"l": 263.3996, "t": 611.62514, "r": 541.27374, "b": 620.83813, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "and has taught database classes in Colombian universities. He ", "bbox": {"l": 263.3996, "t": 623.62494, "r": 541.26465, "b": 632.83794, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "holds a Master\u2019s degree in Computer Science from EAFIT, ", "bbox": {"l": 263.3996, "t": 635.62474, "r": 523.22211, "b": 644.8377399999999, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "Colombia. His areas of expertise are database technology, ", "bbox": {"l": 263.3996, "t": 647.62454, "r": 524.77386, "b": 656.83754, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "performance, and data warehousing. Hernando can be ", "bbox": {"l": 263.3996, "t": 659.62434, "r": 508.27124, "b": 668.83735, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "contacted at ", "bbox": {"l": 263.3996, "t": 671.62415, "r": 320.63568, "b": 680.83716, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "hbedoya@us.ibm.com", "bbox": {"l": 320.63971, "t": 671.77356, "r": 410.57852, "b": 680.54832, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": ".", "bbox": {"l": 410.5795, "t": 671.62415, "r": 413.34839, "b": 680.83716, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Hernando Bedoya is a Senior IT Specialist at STG Lab Services and Training in Rochester, Minnesota. He writes extensively and teaches IBM classes worldwide in all areas of DB2 for i. Before joining STG Lab Services, he worked in the ITSO for nine years writing multiple IBM Redbooksfi publications. He also worked for IBM Colombia as an IBM AS/400fi IT Specialist doing presales support for the Andean countries. He has 28 years of experience in the computing field and has taught database classes in Colombian universities. He holds a Master\u2019s degree in Computer Science from EAFIT, Colombia. His areas of expertise are database technology, performance, and data warehousing. Hernando can be contacted at hbedoya@us.ibm.com ."}, {"label": "picture", "id": 3, "page_no": 3, "cluster": {"id": 3, "label": "picture", "bbox": {"l": 142.52883911132812, "t": 375.0449523925781, "r": 251.47850036621094, "b": 503.20648193359375, "coord_origin": "TOPLEFT"}, "confidence": 0.9862572550773621, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "picture", "id": 1, "page_no": 3, "cluster": {"id": 1, "label": "picture", "bbox": {"l": 145.41445922851562, "t": 527.2447509765625, "r": 252.08840942382812, "b": 635.383056640625, "coord_origin": "TOPLEFT"}, "confidence": 0.987165629863739, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "body": [{"label": "section_header", "id": 9, "page_no": 3, "cluster": {"id": 9, "label": "section_header", "bbox": {"l": 64.800003, "t": 73.84802000000002, "r": 151.46161, "b": 96.04803000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9174709916114807, "cells": [{"id": 2, "text": "Preface", "bbox": {"l": 64.800003, "t": 73.84802000000002, "r": 151.46161, "b": 96.04803000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Preface"}, {"label": "text", "id": 2, "page_no": 3, "cluster": {"id": 2, "label": "text", "bbox": {"l": 136.79984, "t": 132.64862000000005, "r": 547.30823, "b": 201.86072000000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9869155883789062, "cells": [{"id": 3, "text": "This IBMfi Redpaper\u2122 publication provides information about the IBM i 7.2 feature of IBM ", "bbox": {"l": 136.8, "t": 132.64862000000005, "r": 542.91888, "b": 141.86163, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "DB2fi for i Row and Column Access Control (RCAC). It offers a broad description of the ", "bbox": {"l": 136.79984, "t": 144.64844000000005, "r": 526.65509, "b": 153.86145, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "function and advantages of controlling access to data in a comprehensive and transparent ", "bbox": {"l": 136.79984, "t": 156.64824999999996, "r": 536.82135, "b": 165.86127, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "way. This publication helps you understand the capabilities of RCAC and provides examples ", "bbox": {"l": 136.79987, "t": 168.64806999999996, "r": 544.67975, "b": 177.86108000000002, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "of defining, creating, and implementing the row permissions and column masks in a relational ", "bbox": {"l": 136.79987, "t": 180.64788999999996, "r": 547.30823, "b": 189.86090000000002, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "database environment.", "bbox": {"l": 136.79987, "t": 192.64770999999996, "r": 238.32117, "b": 201.86072000000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "This IBMfi Redpaper\u2122 publication provides information about the IBM i 7.2 feature of IBM DB2fi for i Row and Column Access Control (RCAC). It offers a broad description of the function and advantages of controlling access to data in a comprehensive and transparent way. This publication helps you understand the capabilities of RCAC and provides examples of defining, creating, and implementing the row permissions and column masks in a relational database environment."}, {"label": "text", "id": 0, "page_no": 3, "cluster": {"id": 0, "label": "text", "bbox": {"l": 136.79987, "t": 214.60748, "r": 546.4657, "b": 259.81994999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9872201681137085, "cells": [{"id": 9, "text": "This paper is intended for database engineers, data-centric application developers, and ", "bbox": {"l": 136.79987, "t": 214.60748, "r": 524.18518, "b": 223.82050000000004, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "security officers who want to design and implement RCAC as a part of their data control and ", "bbox": {"l": 136.79987, "t": 226.6073, "r": 546.4657, "b": 235.82030999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "governance policy. A solid background in IBM i object level security, DB2 for i relational ", "bbox": {"l": 136.79987, "t": 238.60712, "r": 521.25488, "b": 247.82012999999995, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "database concepts, and SQL is assumed.", "bbox": {"l": 136.79987, "t": 250.60693000000003, "r": 321.69434, "b": 259.81994999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "This paper is intended for database engineers, data-centric application developers, and security officers who want to design and implement RCAC as a part of their data control and governance policy. A solid background in IBM i object level security, DB2 for i relational database concepts, and SQL is assumed."}, {"label": "section_header", "id": 8, "page_no": 3, "cluster": {"id": 8, "label": "section_header", "bbox": {"l": 64.800003, "t": 288.3006, "r": 125.36661, "b": 303.0636, "coord_origin": "TOPLEFT"}, "confidence": 0.9255505204200745, "cells": [{"id": 13, "text": "Authors", "bbox": {"l": 64.800003, "t": 288.3006, "r": 125.36661, "b": 303.0636, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Authors"}, {"label": "text", "id": 6, "page_no": 3, "cluster": {"id": 6, "label": "text", "bbox": {"l": 136.8, "t": 320.62871999999993, "r": 547.23669, "b": 341.84152, "coord_origin": "TOPLEFT"}, "confidence": 0.9713318943977356, "cells": [{"id": 14, "text": "This paper was produced by the IBM DB2 for i Center of Excellence team in partnership with ", "bbox": {"l": 136.8, "t": 320.62871999999993, "r": 547.23669, "b": 329.8417099999999, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "the International Technical Support Organization (ITSO), Rochester, Minnesota US.", "bbox": {"l": 136.8, "t": 332.62854, "r": 505.05518, "b": 341.84152, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "This paper was produced by the IBM DB2 for i Center of Excellence team in partnership with the International Technical Support Organization (ITSO), Rochester, Minnesota US."}, {"label": "text", "id": 4, "page_no": 3, "cluster": {"id": 4, "label": "text", "bbox": {"l": 263.39957, "t": 375.64877, "r": 541.25079, "b": 516.85974, "coord_origin": "TOPLEFT"}, "confidence": 0.9842760562896729, "cells": [{"id": 16, "text": "Jim Bainbridge", "bbox": {"l": 263.39957, "t": 375.64877, "r": 335.7251, "b": 384.86176, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": " is a senior DB2 consultant on the DB2 for i ", "bbox": {"l": 335.69922, "t": 375.64877, "r": 529.34259, "b": 384.86176, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Center of Excellence team in the IBM Lab Services and ", "bbox": {"l": 263.3996, "t": 387.64859, "r": 511.50717, "b": 396.86157, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Training organization. His primary role is training and ", "bbox": {"l": 263.3996, "t": 399.64841, "r": 499.077, "b": 408.86139, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "implementation services for IBM DB2 Web Query for i and ", "bbox": {"l": 263.3996, "t": 411.64822, "r": 522.51996, "b": 420.86121, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "business analytics. Jim began his career with IBM 30 years ago ", "bbox": {"l": 263.3996, "t": 423.64804, "r": 541.25079, "b": 432.86102, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "in the IBM Rochester Development Lab, where he developed ", "bbox": {"l": 263.3996, "t": 435.64786, "r": 534.71411, "b": 444.86084, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "cooperative processing products that paired IBM PCs with IBM ", "bbox": {"l": 263.3996, "t": 447.64767, "r": 541.22375, "b": 456.86066, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "S/36 and AS/.400 systems. In the years since, Jim has held ", "bbox": {"l": 263.3996, "t": 459.64749, "r": 528.91016, "b": 468.86047, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "numerous technical roles, including independent software ", "bbox": {"l": 263.3996, "t": 471.64731, "r": 520.24207, "b": 480.86029, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "vendors technical support on a broad range of IBM ", "bbox": {"l": 263.3996, "t": 483.64713, "r": 490.6967200000001, "b": 492.86011, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "technologies and products, and supporting customers in the ", "bbox": {"l": 263.3996, "t": 495.64694, "r": 530.95514, "b": 504.85992, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "IBM Executive Briefing Center and IBM Project Office.", "bbox": {"l": 263.3996, "t": 507.64676, "r": 501.62973, "b": 516.85974, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Jim Bainbridge is a senior DB2 consultant on the DB2 for i Center of Excellence team in the IBM Lab Services and Training organization. His primary role is training and implementation services for IBM DB2 Web Query for i and business analytics. Jim began his career with IBM 30 years ago in the IBM Rochester Development Lab, where he developed cooperative processing products that paired IBM PCs with IBM S/36 and AS/.400 systems. In the years since, Jim has held numerous technical roles, including independent software vendors technical support on a broad range of IBM technologies and products, and supporting customers in the IBM Executive Briefing Center and IBM Project Office."}, {"label": "text", "id": 5, "page_no": 3, "cluster": {"id": 5, "label": "text", "bbox": {"l": 263.3996, "t": 527.62653, "r": 541.27374, "b": 680.83716, "coord_origin": "TOPLEFT"}, "confidence": 0.9823779463768005, "cells": [{"id": 29, "text": "Hernando Bedoya", "bbox": {"l": 263.3996, "t": 527.62653, "r": 348.38229, "b": 536.83952, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": " is a Senior IT Specialist at STG Lab ", "bbox": {"l": 348.41916, "t": 527.62653, "r": 512.3429, "b": 536.83952, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Services and Training in Rochester, Minnesota. He writes ", "bbox": {"l": 263.3996, "t": 539.62633, "r": 519.26306, "b": 548.83932, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "extensively and teaches IBM classes worldwide in all areas of ", "bbox": {"l": 263.3996, "t": 551.62613, "r": 538.40308, "b": 560.8391300000001, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "DB2 for i. Before joining STG Lab Services, he worked in the ", "bbox": {"l": 263.3996, "t": 563.62593, "r": 533.95715, "b": 572.83893, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "ITSO for nine years writing multiple IBM Redbooksfi ", "bbox": {"l": 263.3996, "t": 575.62573, "r": 496.94464, "b": 584.8387299999999, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "publications. He also worked for IBM Colombia as an IBM ", "bbox": {"l": 263.3996, "t": 587.62553, "r": 520.38562, "b": 596.83853, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "AS/400fi IT Specialist doing presales support for the Andean ", "bbox": {"l": 263.3996, "t": 599.62534, "r": 535.99078, "b": 608.83833, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "countries. He has 28 years of experience in the computing field ", "bbox": {"l": 263.3996, "t": 611.62514, "r": 541.27374, "b": 620.83813, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "and has taught database classes in Colombian universities. He ", "bbox": {"l": 263.3996, "t": 623.62494, "r": 541.26465, "b": 632.83794, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "holds a Master\u2019s degree in Computer Science from EAFIT, ", "bbox": {"l": 263.3996, "t": 635.62474, "r": 523.22211, "b": 644.8377399999999, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "Colombia. His areas of expertise are database technology, ", "bbox": {"l": 263.3996, "t": 647.62454, "r": 524.77386, "b": 656.83754, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "performance, and data warehousing. Hernando can be ", "bbox": {"l": 263.3996, "t": 659.62434, "r": 508.27124, "b": 668.83735, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "contacted at ", "bbox": {"l": 263.3996, "t": 671.62415, "r": 320.63568, "b": 680.83716, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "hbedoya@us.ibm.com", "bbox": {"l": 320.63971, "t": 671.77356, "r": 410.57852, "b": 680.54832, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": ".", "bbox": {"l": 410.5795, "t": 671.62415, "r": 413.34839, "b": 680.83716, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Hernando Bedoya is a Senior IT Specialist at STG Lab Services and Training in Rochester, Minnesota. He writes extensively and teaches IBM classes worldwide in all areas of DB2 for i. Before joining STG Lab Services, he worked in the ITSO for nine years writing multiple IBM Redbooksfi publications. He also worked for IBM Colombia as an IBM AS/400fi IT Specialist doing presales support for the Andean countries. He has 28 years of experience in the computing field and has taught database classes in Colombian universities. He holds a Master\u2019s degree in Computer Science from EAFIT, Colombia. His areas of expertise are database technology, performance, and data warehousing. Hernando can be contacted at hbedoya@us.ibm.com ."}, {"label": "picture", "id": 3, "page_no": 3, "cluster": {"id": 3, "label": "picture", "bbox": {"l": 142.52883911132812, "t": 375.0449523925781, "r": 251.47850036621094, "b": 503.20648193359375, "coord_origin": "TOPLEFT"}, "confidence": 0.9862572550773621, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "picture", "id": 1, "page_no": 3, "cluster": {"id": 1, "label": "picture", "bbox": {"l": 145.41445922851562, "t": 527.2447509765625, "r": 252.08840942382812, "b": 635.383056640625, "coord_origin": "TOPLEFT"}, "confidence": 0.987165629863739, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "headers": [{"label": "page_footer", "id": 7, "page_no": 3, "cluster": {"id": 7, "label": "page_footer", "bbox": {"l": 64.800003, "t": 755.538002, "r": 257.24335, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9469243884086609, "cells": [{"id": 0, "text": "' Copyright IBM Corp. 2014. All rights reserved.", "bbox": {"l": 64.800003, "t": 755.538002, "r": 257.24335, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "' Copyright IBM Corp. 2014. All rights reserved."}, {"label": "page_footer", "id": 10, "page_no": 3, "cluster": {"id": 10, "label": "page_footer", "bbox": {"l": 538.85999, "t": 754.848721, "r": 547.25031, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.9040942788124084, "cells": [{"id": 1, "text": "xi", "bbox": {"l": 538.85999, "t": 754.848721, "r": 547.25031, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "xi"}]}}, {"page_no": 4, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "' Copyright IBM Corp. 2014. All rights reserved.", "bbox": {"l": 64.800003, "t": 755.538002, "r": 257.24335, "b": 763.863001, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "1", "bbox": {"l": 541.67987, "t": 754.848721, "r": 547.21765, "b": 764.06172, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Chapter 1.", "bbox": {"l": 81.0, "t": 268.54272000000003, "r": 115.13253, "b": 274.98071000000004, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Securing and protecting IBM DB2 ", "bbox": {"l": 136.8, "t": 254.88635, "r": 547.30475, "b": 278.91785000000004, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "data", "bbox": {"l": 136.8, "t": 285.84671, "r": 190.29802, "b": 309.8782, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Recent news headlines are filled with reports of data breaches and cyber-attacks impacting ", "bbox": {"l": 136.8, "t": 348.70871, "r": 542.25665, "b": 357.92169, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "global businesses of all sizes. The Identity Theft Resource Center$^{1}$ reports that almost 5000 ", "bbox": {"l": 136.80096, "t": 360.70853, "r": 544.96643, "b": 369.92150999999996, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "data breaches have occurred since 2005, exposing over 600 million records of data. The ", "bbox": {"l": 136.79965, "t": 372.70853, "r": 529.53839, "b": 381.92150999999996, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "financial cost of these data breaches is skyrocketing. Studies from the Ponemon Institute$^{2}$ ", "bbox": {"l": 136.79965, "t": 384.7083400000001, "r": 535.32874, "b": 393.92133000000007, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "revealed that the average cost of a data breach increased in 2013 by 15% globally and ", "bbox": {"l": 136.80026, "t": 396.70853, "r": 521.64374, "b": 405.92150999999996, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "resulted in a brand equity loss of $9.4 million per attack. The average cost that is incurred for ", "bbox": {"l": 136.80026, "t": 408.7083400000001, "r": 547.13135, "b": 417.92133000000007, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "each lost record containing sensitive information increased more than 9% to $145 per record. ", "bbox": {"l": 136.80023, "t": 420.70816, "r": 547.25403, "b": 429.92114, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Businesses must make a serious effort to secure their data and recognize that securing ", "bbox": {"l": 136.80023, "t": 442.7277199999999, "r": 525.06482, "b": 451.9407, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "information assets is a cost of doing business. In many parts of the world and in many ", "bbox": {"l": 136.80025, "t": 454.72754000000003, "r": 518.26825, "b": 463.94052, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "industries, securing the data is required by law and subject to audits. Data security is no ", "bbox": {"l": 136.80025, "t": 466.72736, "r": 527.2063, "b": 475.94034, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "longer an option; it is a requirement.", "bbox": {"l": 136.80025, "t": 478.72717, "r": 296.31067, "b": 487.94016, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "This chapter describes how you can secure and protect data in DB2 for i. The following topics ", "bbox": {"l": 136.80025, "t": 500.68698, "r": 547.15515, "b": 509.89996, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "are covered in this chapter:", "bbox": {"l": 136.80025, "t": 512.6868, "r": 257.28036, "b": 521.89978, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "GLYPH<SM590000>", "bbox": {"l": 136.80025, "t": 529.87576, "r": 141.78024, "b": 538.6505099999999, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Security fundamentals", "bbox": {"l": 151.20041, "t": 529.72635, "r": 250.23166999999998, "b": 538.93936, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "GLYPH<SM590000>", "bbox": {"l": 136.80025, "t": 541.87556, "r": 141.78024, "b": 550.65031, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Current state of IBM i security", "bbox": {"l": 151.20041, "t": 541.72617, "r": 282.98114, "b": 550.93916, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "GLYPH<SM590000>", "bbox": {"l": 136.80025, "t": 553.87537, "r": 141.78024, "b": 562.65012, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "DB2 for i security controls", "bbox": {"l": 151.20041, "t": 553.72597, "r": 264.88187, "b": 562.93896, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "1", "bbox": {"l": 500.39999, "t": 93.16870000000006, "r": 522.61774, "b": 130.13171, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "$^{1 }$http://www.idtheftcenter.org", "bbox": {"l": 136.8, "t": 717.750061, "r": 258.36255, "b": 724.780441, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "$^{2 }$http://www.ponemon.org", "bbox": {"l": 136.8, "t": 727.709961, "r": 231.90257, "b": 734.740341, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "/", "bbox": {"l": 231.84036, "t": 727.590263, "r": 234.05881, "b": 734.97176, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 6, "label": "page_footer", "bbox": {"l": 64.800003, "t": 755.538002, "r": 257.24335, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9364772439002991, "cells": [{"id": 0, "text": "' Copyright IBM Corp. 2014. All rights reserved.", "bbox": {"l": 64.800003, "t": 755.538002, "r": 257.24335, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "page_footer", "bbox": {"l": 541.67987, "t": 754.848721, "r": 547.21765, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.8511815071105957, "cells": [{"id": 1, "text": "1", "bbox": {"l": 541.67987, "t": 754.848721, "r": 547.21765, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 81.0, "t": 268.54272000000003, "r": 115.13253, "b": 274.98071000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 2, "text": "Chapter 1.", "bbox": {"l": 81.0, "t": 268.54272000000003, "r": 115.13253, "b": 274.98071000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "section_header", "bbox": {"l": 136.8, "t": 254.88635, "r": 547.30475, "b": 309.8782, "coord_origin": "TOPLEFT"}, "confidence": 0.9371160268783569, "cells": [{"id": 3, "text": "Securing and protecting IBM DB2 ", "bbox": {"l": 136.8, "t": 254.88635, "r": 547.30475, "b": 278.91785000000004, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "data", "bbox": {"l": 136.8, "t": 285.84671, "r": 190.29802, "b": 309.8782, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 136.79965, "t": 348.70871, "r": 547.25403, "b": 429.92114, "coord_origin": "TOPLEFT"}, "confidence": 0.9868631362915039, "cells": [{"id": 5, "text": "Recent news headlines are filled with reports of data breaches and cyber-attacks impacting ", "bbox": {"l": 136.8, "t": 348.70871, "r": 542.25665, "b": 357.92169, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "global businesses of all sizes. The Identity Theft Resource Center$^{1}$ reports that almost 5000 ", "bbox": {"l": 136.80096, "t": 360.70853, "r": 544.96643, "b": 369.92150999999996, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "data breaches have occurred since 2005, exposing over 600 million records of data. The ", "bbox": {"l": 136.79965, "t": 372.70853, "r": 529.53839, "b": 381.92150999999996, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "financial cost of these data breaches is skyrocketing. Studies from the Ponemon Institute$^{2}$ ", "bbox": {"l": 136.79965, "t": 384.7083400000001, "r": 535.32874, "b": 393.92133000000007, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "revealed that the average cost of a data breach increased in 2013 by 15% globally and ", "bbox": {"l": 136.80026, "t": 396.70853, "r": 521.64374, "b": 405.92150999999996, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "resulted in a brand equity loss of $9.4 million per attack. The average cost that is incurred for ", "bbox": {"l": 136.80026, "t": 408.7083400000001, "r": 547.13135, "b": 417.92133000000007, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "each lost record containing sensitive information increased more than 9% to $145 per record. ", "bbox": {"l": 136.80023, "t": 420.70816, "r": 547.25403, "b": 429.92114, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 136.80023, "t": 442.7277199999999, "r": 527.2063, "b": 487.94016, "coord_origin": "TOPLEFT"}, "confidence": 0.9865840077400208, "cells": [{"id": 12, "text": "Businesses must make a serious effort to secure their data and recognize that securing ", "bbox": {"l": 136.80023, "t": 442.7277199999999, "r": 525.06482, "b": 451.9407, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "information assets is a cost of doing business. In many parts of the world and in many ", "bbox": {"l": 136.80025, "t": 454.72754000000003, "r": 518.26825, "b": 463.94052, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "industries, securing the data is required by law and subject to audits. Data security is no ", "bbox": {"l": 136.80025, "t": 466.72736, "r": 527.2063, "b": 475.94034, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "longer an option; it is a requirement.", "bbox": {"l": 136.80025, "t": 478.72717, "r": 296.31067, "b": 487.94016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 136.80025, "t": 500.68698, "r": 547.15515, "b": 521.89978, "coord_origin": "TOPLEFT"}, "confidence": 0.9734062552452087, "cells": [{"id": 16, "text": "This chapter describes how you can secure and protect data in DB2 for i. The following topics ", "bbox": {"l": 136.80025, "t": 500.68698, "r": 547.15515, "b": 509.89996, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "are covered in this chapter:", "bbox": {"l": 136.80025, "t": 512.6868, "r": 257.28036, "b": 521.89978, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "list_item", "bbox": {"l": 136.80025, "t": 529.72635, "r": 250.23166999999998, "b": 538.93936, "coord_origin": "TOPLEFT"}, "confidence": 0.9373418688774109, "cells": [{"id": 18, "text": "GLYPH<SM590000>", "bbox": {"l": 136.80025, "t": 529.87576, "r": 141.78024, "b": 538.6505099999999, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Security fundamentals", "bbox": {"l": 151.20041, "t": 529.72635, "r": 250.23166999999998, "b": 538.93936, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "list_item", "bbox": {"l": 136.80025, "t": 541.72617, "r": 282.98114, "b": 550.93916, "coord_origin": "TOPLEFT"}, "confidence": 0.9334256649017334, "cells": [{"id": 20, "text": "GLYPH<SM590000>", "bbox": {"l": 136.80025, "t": 541.87556, "r": 141.78024, "b": 550.65031, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Current state of IBM i security", "bbox": {"l": 151.20041, "t": 541.72617, "r": 282.98114, "b": 550.93916, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "list_item", "bbox": {"l": 136.80025, "t": 553.72597, "r": 264.88187, "b": 562.93896, "coord_origin": "TOPLEFT"}, "confidence": 0.9462205767631531, "cells": [{"id": 22, "text": "GLYPH<SM590000>", "bbox": {"l": 136.80025, "t": 553.87537, "r": 141.78024, "b": 562.65012, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "DB2 for i security controls", "bbox": {"l": 151.20041, "t": 553.72597, "r": 264.88187, "b": 562.93896, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 500.39999, "t": 93.16870000000006, "r": 522.61774, "b": 130.13171, "coord_origin": "TOPLEFT"}, "confidence": 0.7085077166557312, "cells": [{"id": 24, "text": "1", "bbox": {"l": 500.39999, "t": 93.16870000000006, "r": 522.61774, "b": 130.13171, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "footnote", "bbox": {"l": 136.8, "t": 717.750061, "r": 258.36255, "b": 724.780441, "coord_origin": "TOPLEFT"}, "confidence": 0.5138105750083923, "cells": [{"id": 25, "text": "$^{1 }$http://www.idtheftcenter.org", "bbox": {"l": 136.8, "t": 717.750061, "r": 258.36255, "b": 724.780441, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "footnote", "bbox": {"l": 136.8, "t": 727.590263, "r": 234.05881, "b": 734.97176, "coord_origin": "TOPLEFT"}, "confidence": 0.7965558171272278, "cells": [{"id": 26, "text": "$^{2 }$http://www.ponemon.org", "bbox": {"l": 136.8, "t": 727.709961, "r": 231.90257, "b": 734.740341, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "/", "bbox": {"l": 231.84036, "t": 727.590263, "r": 234.05881, "b": 734.97176, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "picture", "bbox": {"l": 32.075252532958984, "t": 70.57737731933594, "r": 239.620361328125, "b": 237.9579315185547, "coord_origin": "TOPLEFT"}, "confidence": 0.7509333491325378, "cells": [], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_footer", "id": 6, "page_no": 4, "cluster": {"id": 6, "label": "page_footer", "bbox": {"l": 64.800003, "t": 755.538002, "r": 257.24335, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9364772439002991, "cells": [{"id": 0, "text": "' Copyright IBM Corp. 2014. All rights reserved.", "bbox": {"l": 64.800003, "t": 755.538002, "r": 257.24335, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "' Copyright IBM Corp. 2014. All rights reserved."}, {"label": "page_footer", "id": 8, "page_no": 4, "cluster": {"id": 8, "label": "page_footer", "bbox": {"l": 541.67987, "t": 754.848721, "r": 547.21765, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.8511815071105957, "cells": [{"id": 1, "text": "1", "bbox": {"l": 541.67987, "t": 754.848721, "r": 547.21765, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1"}, {"label": "text", "id": 14, "page_no": 4, "cluster": {"id": 14, "label": "text", "bbox": {"l": 81.0, "t": 268.54272000000003, "r": 115.13253, "b": 274.98071000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 2, "text": "Chapter 1.", "bbox": {"l": 81.0, "t": 268.54272000000003, "r": 115.13253, "b": 274.98071000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Chapter 1."}, {"label": "section_header", "id": 5, "page_no": 4, "cluster": {"id": 5, "label": "section_header", "bbox": {"l": 136.8, "t": 254.88635, "r": 547.30475, "b": 309.8782, "coord_origin": "TOPLEFT"}, "confidence": 0.9371160268783569, "cells": [{"id": 3, "text": "Securing and protecting IBM DB2 ", "bbox": {"l": 136.8, "t": 254.88635, "r": 547.30475, "b": 278.91785000000004, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "data", "bbox": {"l": 136.8, "t": 285.84671, "r": 190.29802, "b": 309.8782, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Securing and protecting IBM DB2 data"}, {"label": "text", "id": 0, "page_no": 4, "cluster": {"id": 0, "label": "text", "bbox": {"l": 136.79965, "t": 348.70871, "r": 547.25403, "b": 429.92114, "coord_origin": "TOPLEFT"}, "confidence": 0.9868631362915039, "cells": [{"id": 5, "text": "Recent news headlines are filled with reports of data breaches and cyber-attacks impacting ", "bbox": {"l": 136.8, "t": 348.70871, "r": 542.25665, "b": 357.92169, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "global businesses of all sizes. The Identity Theft Resource Center$^{1}$ reports that almost 5000 ", "bbox": {"l": 136.80096, "t": 360.70853, "r": 544.96643, "b": 369.92150999999996, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "data breaches have occurred since 2005, exposing over 600 million records of data. The ", "bbox": {"l": 136.79965, "t": 372.70853, "r": 529.53839, "b": 381.92150999999996, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "financial cost of these data breaches is skyrocketing. Studies from the Ponemon Institute$^{2}$ ", "bbox": {"l": 136.79965, "t": 384.7083400000001, "r": 535.32874, "b": 393.92133000000007, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "revealed that the average cost of a data breach increased in 2013 by 15% globally and ", "bbox": {"l": 136.80026, "t": 396.70853, "r": 521.64374, "b": 405.92150999999996, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "resulted in a brand equity loss of $9.4 million per attack. The average cost that is incurred for ", "bbox": {"l": 136.80026, "t": 408.7083400000001, "r": 547.13135, "b": 417.92133000000007, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "each lost record containing sensitive information increased more than 9% to $145 per record. ", "bbox": {"l": 136.80023, "t": 420.70816, "r": 547.25403, "b": 429.92114, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Recent news headlines are filled with reports of data breaches and cyber-attacks impacting global businesses of all sizes. The Identity Theft Resource Center$^{1}$ reports that almost 5000 data breaches have occurred since 2005, exposing over 600 million records of data. The financial cost of these data breaches is skyrocketing. Studies from the Ponemon Institute$^{2}$ revealed that the average cost of a data breach increased in 2013 by 15% globally and resulted in a brand equity loss of $9.4 million per attack. The average cost that is incurred for each lost record containing sensitive information increased more than 9% to $145 per record."}, {"label": "text", "id": 1, "page_no": 4, "cluster": {"id": 1, "label": "text", "bbox": {"l": 136.80023, "t": 442.7277199999999, "r": 527.2063, "b": 487.94016, "coord_origin": "TOPLEFT"}, "confidence": 0.9865840077400208, "cells": [{"id": 12, "text": "Businesses must make a serious effort to secure their data and recognize that securing ", "bbox": {"l": 136.80023, "t": 442.7277199999999, "r": 525.06482, "b": 451.9407, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "information assets is a cost of doing business. In many parts of the world and in many ", "bbox": {"l": 136.80025, "t": 454.72754000000003, "r": 518.26825, "b": 463.94052, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "industries, securing the data is required by law and subject to audits. Data security is no ", "bbox": {"l": 136.80025, "t": 466.72736, "r": 527.2063, "b": 475.94034, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "longer an option; it is a requirement.", "bbox": {"l": 136.80025, "t": 478.72717, "r": 296.31067, "b": 487.94016, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Businesses must make a serious effort to secure their data and recognize that securing information assets is a cost of doing business. In many parts of the world and in many industries, securing the data is required by law and subject to audits. Data security is no longer an option; it is a requirement."}, {"label": "text", "id": 2, "page_no": 4, "cluster": {"id": 2, "label": "text", "bbox": {"l": 136.80025, "t": 500.68698, "r": 547.15515, "b": 521.89978, "coord_origin": "TOPLEFT"}, "confidence": 0.9734062552452087, "cells": [{"id": 16, "text": "This chapter describes how you can secure and protect data in DB2 for i. The following topics ", "bbox": {"l": 136.80025, "t": 500.68698, "r": 547.15515, "b": 509.89996, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "are covered in this chapter:", "bbox": {"l": 136.80025, "t": 512.6868, "r": 257.28036, "b": 521.89978, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "This chapter describes how you can secure and protect data in DB2 for i. The following topics are covered in this chapter:"}, {"label": "list_item", "id": 4, "page_no": 4, "cluster": {"id": 4, "label": "list_item", "bbox": {"l": 136.80025, "t": 529.72635, "r": 250.23166999999998, "b": 538.93936, "coord_origin": "TOPLEFT"}, "confidence": 0.9373418688774109, "cells": [{"id": 18, "text": "GLYPH<SM590000>", "bbox": {"l": 136.80025, "t": 529.87576, "r": 141.78024, "b": 538.6505099999999, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Security fundamentals", "bbox": {"l": 151.20041, "t": 529.72635, "r": 250.23166999999998, "b": 538.93936, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<SM590000> Security fundamentals"}, {"label": "list_item", "id": 7, "page_no": 4, "cluster": {"id": 7, "label": "list_item", "bbox": {"l": 136.80025, "t": 541.72617, "r": 282.98114, "b": 550.93916, "coord_origin": "TOPLEFT"}, "confidence": 0.9334256649017334, "cells": [{"id": 20, "text": "GLYPH<SM590000>", "bbox": {"l": 136.80025, "t": 541.87556, "r": 141.78024, "b": 550.65031, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Current state of IBM i security", "bbox": {"l": 151.20041, "t": 541.72617, "r": 282.98114, "b": 550.93916, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<SM590000> Current state of IBM i security"}, {"label": "list_item", "id": 3, "page_no": 4, "cluster": {"id": 3, "label": "list_item", "bbox": {"l": 136.80025, "t": 553.72597, "r": 264.88187, "b": 562.93896, "coord_origin": "TOPLEFT"}, "confidence": 0.9462205767631531, "cells": [{"id": 22, "text": "GLYPH<SM590000>", "bbox": {"l": 136.80025, "t": 553.87537, "r": 141.78024, "b": 562.65012, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "DB2 for i security controls", "bbox": {"l": 151.20041, "t": 553.72597, "r": 264.88187, "b": 562.93896, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<SM590000> DB2 for i security controls"}, {"label": "text", "id": 12, "page_no": 4, "cluster": {"id": 12, "label": "text", "bbox": {"l": 500.39999, "t": 93.16870000000006, "r": 522.61774, "b": 130.13171, "coord_origin": "TOPLEFT"}, "confidence": 0.7085077166557312, "cells": [{"id": 24, "text": "1", "bbox": {"l": 500.39999, "t": 93.16870000000006, "r": 522.61774, "b": 130.13171, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1"}, {"label": "footnote", "id": 13, "page_no": 4, "cluster": {"id": 13, "label": "footnote", "bbox": {"l": 136.8, "t": 717.750061, "r": 258.36255, "b": 724.780441, "coord_origin": "TOPLEFT"}, "confidence": 0.5138105750083923, "cells": [{"id": 25, "text": "$^{1 }$http://www.idtheftcenter.org", "bbox": {"l": 136.8, "t": 717.750061, "r": 258.36255, "b": 724.780441, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "$^{1 }$http://www.idtheftcenter.org"}, {"label": "footnote", "id": 9, "page_no": 4, "cluster": {"id": 9, "label": "footnote", "bbox": {"l": 136.8, "t": 727.590263, "r": 234.05881, "b": 734.97176, "coord_origin": "TOPLEFT"}, "confidence": 0.7965558171272278, "cells": [{"id": 26, "text": "$^{2 }$http://www.ponemon.org", "bbox": {"l": 136.8, "t": 727.709961, "r": 231.90257, "b": 734.740341, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "/", "bbox": {"l": 231.84036, "t": 727.590263, "r": 234.05881, "b": 734.97176, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "$^{2 }$http://www.ponemon.org /"}, {"label": "picture", "id": 11, "page_no": 4, "cluster": {"id": 11, "label": "picture", "bbox": {"l": 32.075252532958984, "t": 70.57737731933594, "r": 239.620361328125, "b": 237.9579315185547, "coord_origin": "TOPLEFT"}, "confidence": 0.7509333491325378, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "body": [{"label": "text", "id": 14, "page_no": 4, "cluster": {"id": 14, "label": "text", "bbox": {"l": 81.0, "t": 268.54272000000003, "r": 115.13253, "b": 274.98071000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 2, "text": "Chapter 1.", "bbox": {"l": 81.0, "t": 268.54272000000003, "r": 115.13253, "b": 274.98071000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Chapter 1."}, {"label": "section_header", "id": 5, "page_no": 4, "cluster": {"id": 5, "label": "section_header", "bbox": {"l": 136.8, "t": 254.88635, "r": 547.30475, "b": 309.8782, "coord_origin": "TOPLEFT"}, "confidence": 0.9371160268783569, "cells": [{"id": 3, "text": "Securing and protecting IBM DB2 ", "bbox": {"l": 136.8, "t": 254.88635, "r": 547.30475, "b": 278.91785000000004, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "data", "bbox": {"l": 136.8, "t": 285.84671, "r": 190.29802, "b": 309.8782, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Securing and protecting IBM DB2 data"}, {"label": "text", "id": 0, "page_no": 4, "cluster": {"id": 0, "label": "text", "bbox": {"l": 136.79965, "t": 348.70871, "r": 547.25403, "b": 429.92114, "coord_origin": "TOPLEFT"}, "confidence": 0.9868631362915039, "cells": [{"id": 5, "text": "Recent news headlines are filled with reports of data breaches and cyber-attacks impacting ", "bbox": {"l": 136.8, "t": 348.70871, "r": 542.25665, "b": 357.92169, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "global businesses of all sizes. The Identity Theft Resource Center$^{1}$ reports that almost 5000 ", "bbox": {"l": 136.80096, "t": 360.70853, "r": 544.96643, "b": 369.92150999999996, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "data breaches have occurred since 2005, exposing over 600 million records of data. The ", "bbox": {"l": 136.79965, "t": 372.70853, "r": 529.53839, "b": 381.92150999999996, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "financial cost of these data breaches is skyrocketing. Studies from the Ponemon Institute$^{2}$ ", "bbox": {"l": 136.79965, "t": 384.7083400000001, "r": 535.32874, "b": 393.92133000000007, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "revealed that the average cost of a data breach increased in 2013 by 15% globally and ", "bbox": {"l": 136.80026, "t": 396.70853, "r": 521.64374, "b": 405.92150999999996, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "resulted in a brand equity loss of $9.4 million per attack. The average cost that is incurred for ", "bbox": {"l": 136.80026, "t": 408.7083400000001, "r": 547.13135, "b": 417.92133000000007, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "each lost record containing sensitive information increased more than 9% to $145 per record. ", "bbox": {"l": 136.80023, "t": 420.70816, "r": 547.25403, "b": 429.92114, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Recent news headlines are filled with reports of data breaches and cyber-attacks impacting global businesses of all sizes. The Identity Theft Resource Center$^{1}$ reports that almost 5000 data breaches have occurred since 2005, exposing over 600 million records of data. The financial cost of these data breaches is skyrocketing. Studies from the Ponemon Institute$^{2}$ revealed that the average cost of a data breach increased in 2013 by 15% globally and resulted in a brand equity loss of $9.4 million per attack. The average cost that is incurred for each lost record containing sensitive information increased more than 9% to $145 per record."}, {"label": "text", "id": 1, "page_no": 4, "cluster": {"id": 1, "label": "text", "bbox": {"l": 136.80023, "t": 442.7277199999999, "r": 527.2063, "b": 487.94016, "coord_origin": "TOPLEFT"}, "confidence": 0.9865840077400208, "cells": [{"id": 12, "text": "Businesses must make a serious effort to secure their data and recognize that securing ", "bbox": {"l": 136.80023, "t": 442.7277199999999, "r": 525.06482, "b": 451.9407, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "information assets is a cost of doing business. In many parts of the world and in many ", "bbox": {"l": 136.80025, "t": 454.72754000000003, "r": 518.26825, "b": 463.94052, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "industries, securing the data is required by law and subject to audits. Data security is no ", "bbox": {"l": 136.80025, "t": 466.72736, "r": 527.2063, "b": 475.94034, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "longer an option; it is a requirement.", "bbox": {"l": 136.80025, "t": 478.72717, "r": 296.31067, "b": 487.94016, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Businesses must make a serious effort to secure their data and recognize that securing information assets is a cost of doing business. In many parts of the world and in many industries, securing the data is required by law and subject to audits. Data security is no longer an option; it is a requirement."}, {"label": "text", "id": 2, "page_no": 4, "cluster": {"id": 2, "label": "text", "bbox": {"l": 136.80025, "t": 500.68698, "r": 547.15515, "b": 521.89978, "coord_origin": "TOPLEFT"}, "confidence": 0.9734062552452087, "cells": [{"id": 16, "text": "This chapter describes how you can secure and protect data in DB2 for i. The following topics ", "bbox": {"l": 136.80025, "t": 500.68698, "r": 547.15515, "b": 509.89996, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "are covered in this chapter:", "bbox": {"l": 136.80025, "t": 512.6868, "r": 257.28036, "b": 521.89978, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "This chapter describes how you can secure and protect data in DB2 for i. The following topics are covered in this chapter:"}, {"label": "list_item", "id": 4, "page_no": 4, "cluster": {"id": 4, "label": "list_item", "bbox": {"l": 136.80025, "t": 529.72635, "r": 250.23166999999998, "b": 538.93936, "coord_origin": "TOPLEFT"}, "confidence": 0.9373418688774109, "cells": [{"id": 18, "text": "GLYPH<SM590000>", "bbox": {"l": 136.80025, "t": 529.87576, "r": 141.78024, "b": 538.6505099999999, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Security fundamentals", "bbox": {"l": 151.20041, "t": 529.72635, "r": 250.23166999999998, "b": 538.93936, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<SM590000> Security fundamentals"}, {"label": "list_item", "id": 7, "page_no": 4, "cluster": {"id": 7, "label": "list_item", "bbox": {"l": 136.80025, "t": 541.72617, "r": 282.98114, "b": 550.93916, "coord_origin": "TOPLEFT"}, "confidence": 0.9334256649017334, "cells": [{"id": 20, "text": "GLYPH<SM590000>", "bbox": {"l": 136.80025, "t": 541.87556, "r": 141.78024, "b": 550.65031, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Current state of IBM i security", "bbox": {"l": 151.20041, "t": 541.72617, "r": 282.98114, "b": 550.93916, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<SM590000> Current state of IBM i security"}, {"label": "list_item", "id": 3, "page_no": 4, "cluster": {"id": 3, "label": "list_item", "bbox": {"l": 136.80025, "t": 553.72597, "r": 264.88187, "b": 562.93896, "coord_origin": "TOPLEFT"}, "confidence": 0.9462205767631531, "cells": [{"id": 22, "text": "GLYPH<SM590000>", "bbox": {"l": 136.80025, "t": 553.87537, "r": 141.78024, "b": 562.65012, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "DB2 for i security controls", "bbox": {"l": 151.20041, "t": 553.72597, "r": 264.88187, "b": 562.93896, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<SM590000> DB2 for i security controls"}, {"label": "text", "id": 12, "page_no": 4, "cluster": {"id": 12, "label": "text", "bbox": {"l": 500.39999, "t": 93.16870000000006, "r": 522.61774, "b": 130.13171, "coord_origin": "TOPLEFT"}, "confidence": 0.7085077166557312, "cells": [{"id": 24, "text": "1", "bbox": {"l": 500.39999, "t": 93.16870000000006, "r": 522.61774, "b": 130.13171, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1"}, {"label": "footnote", "id": 13, "page_no": 4, "cluster": {"id": 13, "label": "footnote", "bbox": {"l": 136.8, "t": 717.750061, "r": 258.36255, "b": 724.780441, "coord_origin": "TOPLEFT"}, "confidence": 0.5138105750083923, "cells": [{"id": 25, "text": "$^{1 }$http://www.idtheftcenter.org", "bbox": {"l": 136.8, "t": 717.750061, "r": 258.36255, "b": 724.780441, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "$^{1 }$http://www.idtheftcenter.org"}, {"label": "footnote", "id": 9, "page_no": 4, "cluster": {"id": 9, "label": "footnote", "bbox": {"l": 136.8, "t": 727.590263, "r": 234.05881, "b": 734.97176, "coord_origin": "TOPLEFT"}, "confidence": 0.7965558171272278, "cells": [{"id": 26, "text": "$^{2 }$http://www.ponemon.org", "bbox": {"l": 136.8, "t": 727.709961, "r": 231.90257, "b": 734.740341, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "/", "bbox": {"l": 231.84036, "t": 727.590263, "r": 234.05881, "b": 734.97176, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "$^{2 }$http://www.ponemon.org /"}, {"label": "picture", "id": 11, "page_no": 4, "cluster": {"id": 11, "label": "picture", "bbox": {"l": 32.075252532958984, "t": 70.57737731933594, "r": 239.620361328125, "b": 237.9579315185547, "coord_origin": "TOPLEFT"}, "confidence": 0.7509333491325378, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "headers": [{"label": "page_footer", "id": 6, "page_no": 4, "cluster": {"id": 6, "label": "page_footer", "bbox": {"l": 64.800003, "t": 755.538002, "r": 257.24335, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9364772439002991, "cells": [{"id": 0, "text": "' Copyright IBM Corp. 2014. All rights reserved.", "bbox": {"l": 64.800003, "t": 755.538002, "r": 257.24335, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "' Copyright IBM Corp. 2014. All rights reserved."}, {"label": "page_footer", "id": 8, "page_no": 4, "cluster": {"id": 8, "label": "page_footer", "bbox": {"l": 541.67987, "t": 754.848721, "r": 547.21765, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.8511815071105957, "cells": [{"id": 1, "text": "1", "bbox": {"l": 541.67987, "t": 754.848721, "r": 547.21765, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1"}]}}, {"page_no": 5, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "2 ", "bbox": {"l": 64.800003, "t": 754.848721, "r": 72.821999, "b": 764.06172, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Row and Column Access Control Support in IBM DB2 for i", "bbox": {"l": 87.840302, "t": 755.538002, "r": 328.72537, "b": 763.863001, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "1.1", "bbox": {"l": 64.800003, "t": 74.34069999999997, "r": 87.524292, "b": 89.1037, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Security fundamentals", "bbox": {"l": 92.069145, "t": 74.34069999999997, "r": 267.40582, "b": 89.1037, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Before reviewing database security techniques, there are two fundamental steps in securing ", "bbox": {"l": 136.8, "t": 106.6087, "r": 545.00482, "b": 115.82172000000003, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "information assets that must be described:", "bbox": {"l": 136.8, "t": 118.60852, "r": 324.47229, "b": 127.82153000000005, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "GLYPH<SM590000>", "bbox": {"l": 136.8, "t": 135.79749000000004, "r": 141.78, "b": 144.57227, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "First, and most important, is the definition of a company\u2019s ", "bbox": {"l": 151.20016, "t": 135.64806999999996, "r": 406.67715, "b": 144.86108000000002, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "security policy", "bbox": {"l": 406.67999, "t": 135.12487999999996, "r": 471.03815, "b": 145.18262000000004, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": ". Without a ", "bbox": {"l": 470.04001000000005, "t": 135.64862000000005, "r": 520.59796, "b": 144.86163, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "security policy, there is no definition of what are acceptable practices for using, accessing, ", "bbox": {"l": 151.19949, "t": 147.64844000000005, "r": 547.16425, "b": 156.86145, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "and storing information by who, what, when, where, and how. A security policy should ", "bbox": {"l": 151.19948, "t": 159.64824999999996, "r": 531.02008, "b": 168.86127, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "minimally address three things: confidentiality, integrity, and availability.", "bbox": {"l": 151.19948, "t": 171.64806999999996, "r": 463.3578499999999, "b": 180.86108000000002, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "The monitoring and assessment of adherence to the security policy determines whether ", "bbox": {"l": 151.19948, "t": 188.62787000000003, "r": 541.70514, "b": 197.84087999999997, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "your security strategy is working. Often, IBM security consultants are asked to perform ", "bbox": {"l": 151.19948, "t": 200.62769000000003, "r": 534.83002, "b": 209.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "security assessments for companies without regard to the security policy. Although these ", "bbox": {"l": 151.19948, "t": 212.62750000000005, "r": 545.79773, "b": 221.84051999999997, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "assessments can be useful for observing how the system is defined and how data is being ", "bbox": {"l": 151.19948, "t": 224.62732000000005, "r": 547.26086, "b": 233.84033, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "accessed, they cannot determine the level of security without a security policy. Without a ", "bbox": {"l": 151.19948, "t": 236.62714000000005, "r": 543.91528, "b": 245.84015, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "security policy, it really is not an assessment as much as it is a baseline for monitoring the ", "bbox": {"l": 151.19948, "t": 248.62694999999997, "r": 547.25989, "b": 257.83997, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "changes in the security settings that are captured.", "bbox": {"l": 151.19946, "t": 260.62676999999996, "r": 371.8692, "b": 269.83978, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "A security policy is what defines whether the system and its settings are secure (or not). ", "bbox": {"l": 151.19946, "t": 277.60657000000003, "r": 541.992, "b": 286.81958, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "GLYPH<SM590000>", "bbox": {"l": 136.7993, "t": 294.7955600000001, "r": 141.7793, "b": 303.57034, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "The second fundamental in securing data assets is the use of ", "bbox": {"l": 151.19946, "t": 294.64618, "r": 425.86029, "b": 303.85916, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "resource security", "bbox": {"l": 425.82001, "t": 294.12496999999996, "r": 501.60065, "b": 304.18265, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": ". If ", "bbox": {"l": 500.64001, "t": 294.64871, "r": 514.49933, "b": 303.86169, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "implemented properly, resource security prevents data breaches from both internal and ", "bbox": {"l": 151.20038, "t": 306.64853, "r": 537.87421, "b": 315.86151, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "external intrusions. Resource security controls are closely tied to the part of the security ", "bbox": {"l": 151.20038, "t": 318.64834999999994, "r": 541.33636, "b": 327.86133, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "policy that defines who should have access to what information resources. A hacker might ", "bbox": {"l": 151.20038, "t": 330.64816, "r": 547.15826, "b": 339.86115, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "be good enough to get through your company firewalls and sift his way through to your ", "bbox": {"l": 151.20038, "t": 342.64798, "r": 534.86066, "b": 351.86096, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "system, but if they do not have explicit access to your database, the hacker cannot ", "bbox": {"l": 151.20038, "t": 354.6478, "r": 517.00739, "b": 363.86078, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "compromise your information assets.", "bbox": {"l": 151.20038, "t": 366.64761, "r": 314.03534, "b": 375.8606, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "With your eyes now open to the importance of securing information assets, the rest of this ", "bbox": {"l": 136.80022, "t": 388.60742, "r": 535.36169, "b": 397.82040000000006, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "chapter reviews the methods that are available for securing database resources on IBM i. ", "bbox": {"l": 136.80022, "t": 400.60724, "r": 532.755, "b": 409.82022, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "1.2", "bbox": {"l": 64.800003, "t": 438.30072, "r": 87.415726, "b": 453.06372, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Current state of IBM i security", "bbox": {"l": 91.93885, "t": 438.30072, "r": 323.38391, "b": 453.06372, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "Because of the inherently secure nature of IBM i, many clients rely on the default system ", "bbox": {"l": 136.8, "t": 470.62872, "r": 530.30463, "b": 479.84171, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "settings to protect their business data that is stored in DB2 for i. In most cases, this means no ", "bbox": {"l": 136.8, "t": 482.62854, "r": 547.31824, "b": 491.84152, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "data protection because the default setting for the Create default public authority (QCRTAUT) ", "bbox": {"l": 136.8, "t": 494.62836, "r": 547.19586, "b": 503.84134, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "system value is *CHANGE.", "bbox": {"l": 136.8, "t": 506.62817, "r": 257.04709, "b": 515.84116, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "Even more disturbing is that many IBM i clients remain in this state, despite the news ", "bbox": {"l": 136.8, "t": 528.64774, "r": 513.90448, "b": 537.86073, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "headlines and the significant costs that are involved with databases being compromised. This ", "bbox": {"l": 136.8, "t": 540.6475399999999, "r": 547.28442, "b": 549.86053, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "default security configuration makes it quite challenging to implement basic security policies. ", "bbox": {"l": 136.8, "t": 552.64734, "r": 546.27533, "b": 561.86034, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "A tighter implementation is required if you really want to protect one of your company\u2019s most ", "bbox": {"l": 136.8, "t": 564.64714, "r": 545.08014, "b": 573.86014, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "valuable assets, which is the data.", "bbox": {"l": 136.8, "t": 576.64694, "r": 287.80057, "b": 585.85994, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "Traditionally, IBM i applications have employed menu-based security to counteract this default ", "bbox": {"l": 136.8, "t": 598.6665, "r": 547.28326, "b": 607.8795, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "configuration that gives all users access to the data. The theory is that data is protected by ", "bbox": {"l": 136.8, "t": 610.6663100000001, "r": 538.6767, "b": 619.8793000000001, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "the menu options controlling what database operations that the user can perform. This ", "bbox": {"l": 136.8, "t": 622.66611, "r": 520.35364, "b": 631.8791, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "approach is ineffective, even if the user profile is restricted from running interactive ", "bbox": {"l": 136.80002, "t": 634.6659099999999, "r": 502.77115000000003, "b": 643.87891, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "commands. The reason is that in today\u2019s connected world there are a multitude of interfaces ", "bbox": {"l": 136.80002, "t": 646.66571, "r": 545.16492, "b": 655.87871, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "into the system, from web browsers to PC clients, that bypass application menus. If there are ", "bbox": {"l": 136.80002, "t": 658.66551, "r": 547.23376, "b": 667.87852, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "no object-level controls, users of these newer interfaces have an open door to your data.", "bbox": {"l": 136.80002, "t": 670.66532, "r": 526.04187, "b": 679.87833, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 10, "label": "page_footer", "bbox": {"l": 64.800003, "t": 754.848721, "r": 72.821999, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.8889443874359131, "cells": [{"id": 0, "text": "2 ", "bbox": {"l": 64.800003, "t": 754.848721, "r": 72.821999, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "page_footer", "bbox": {"l": 87.840302, "t": 755.538002, "r": 328.72537, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9476425051689148, "cells": [{"id": 1, "text": "Row and Column Access Control Support in IBM DB2 for i", "bbox": {"l": 87.840302, "t": 755.538002, "r": 328.72537, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "section_header", "bbox": {"l": 64.800003, "t": 74.34069999999997, "r": 267.40582, "b": 89.1037, "coord_origin": "TOPLEFT"}, "confidence": 0.9651358723640442, "cells": [{"id": 2, "text": "1.1", "bbox": {"l": 64.800003, "t": 74.34069999999997, "r": 87.524292, "b": 89.1037, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Security fundamentals", "bbox": {"l": 92.069145, "t": 74.34069999999997, "r": 267.40582, "b": 89.1037, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "text", "bbox": {"l": 136.8, "t": 106.6087, "r": 545.00482, "b": 127.82153000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9663435220718384, "cells": [{"id": 4, "text": "Before reviewing database security techniques, there are two fundamental steps in securing ", "bbox": {"l": 136.8, "t": 106.6087, "r": 545.00482, "b": 115.82172000000003, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "information assets that must be described:", "bbox": {"l": 136.8, "t": 118.60852, "r": 324.47229, "b": 127.82153000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "list_item", "bbox": {"l": 136.8, "t": 135.12487999999996, "r": 547.16425, "b": 180.86108000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9835494756698608, "cells": [{"id": 6, "text": "GLYPH<SM590000>", "bbox": {"l": 136.8, "t": 135.79749000000004, "r": 141.78, "b": 144.57227, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "First, and most important, is the definition of a company\u2019s ", "bbox": {"l": 151.20016, "t": 135.64806999999996, "r": 406.67715, "b": 144.86108000000002, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "security policy", "bbox": {"l": 406.67999, "t": 135.12487999999996, "r": 471.03815, "b": 145.18262000000004, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": ". Without a ", "bbox": {"l": 470.04001000000005, "t": 135.64862000000005, "r": 520.59796, "b": 144.86163, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "security policy, there is no definition of what are acceptable practices for using, accessing, ", "bbox": {"l": 151.19949, "t": 147.64844000000005, "r": 547.16425, "b": 156.86145, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "and storing information by who, what, when, where, and how. A security policy should ", "bbox": {"l": 151.19948, "t": 159.64824999999996, "r": 531.02008, "b": 168.86127, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "minimally address three things: confidentiality, integrity, and availability.", "bbox": {"l": 151.19948, "t": 171.64806999999996, "r": 463.3578499999999, "b": 180.86108000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "list_item", "bbox": {"l": 151.19946, "t": 188.62787000000003, "r": 547.26086, "b": 269.83978, "coord_origin": "TOPLEFT"}, "confidence": 0.8077319264411926, "cells": [{"id": 13, "text": "The monitoring and assessment of adherence to the security policy determines whether ", "bbox": {"l": 151.19948, "t": 188.62787000000003, "r": 541.70514, "b": 197.84087999999997, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "your security strategy is working. Often, IBM security consultants are asked to perform ", "bbox": {"l": 151.19948, "t": 200.62769000000003, "r": 534.83002, "b": 209.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "security assessments for companies without regard to the security policy. Although these ", "bbox": {"l": 151.19948, "t": 212.62750000000005, "r": 545.79773, "b": 221.84051999999997, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "assessments can be useful for observing how the system is defined and how data is being ", "bbox": {"l": 151.19948, "t": 224.62732000000005, "r": 547.26086, "b": 233.84033, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "accessed, they cannot determine the level of security without a security policy. Without a ", "bbox": {"l": 151.19948, "t": 236.62714000000005, "r": 543.91528, "b": 245.84015, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "security policy, it really is not an assessment as much as it is a baseline for monitoring the ", "bbox": {"l": 151.19948, "t": 248.62694999999997, "r": 547.25989, "b": 257.83997, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "changes in the security settings that are captured.", "bbox": {"l": 151.19946, "t": 260.62676999999996, "r": 371.8692, "b": 269.83978, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 151.19946, "t": 277.60657000000003, "r": 541.992, "b": 286.81958, "coord_origin": "TOPLEFT"}, "confidence": 0.7967224717140198, "cells": [{"id": 20, "text": "A security policy is what defines whether the system and its settings are secure (or not). ", "bbox": {"l": 151.19946, "t": 277.60657000000003, "r": 541.992, "b": 286.81958, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "list_item", "bbox": {"l": 136.7993, "t": 294.12496999999996, "r": 547.15826, "b": 375.8606, "coord_origin": "TOPLEFT"}, "confidence": 0.9837489128112793, "cells": [{"id": 21, "text": "GLYPH<SM590000>", "bbox": {"l": 136.7993, "t": 294.7955600000001, "r": 141.7793, "b": 303.57034, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "The second fundamental in securing data assets is the use of ", "bbox": {"l": 151.19946, "t": 294.64618, "r": 425.86029, "b": 303.85916, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "resource security", "bbox": {"l": 425.82001, "t": 294.12496999999996, "r": 501.60065, "b": 304.18265, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": ". If ", "bbox": {"l": 500.64001, "t": 294.64871, "r": 514.49933, "b": 303.86169, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "implemented properly, resource security prevents data breaches from both internal and ", "bbox": {"l": 151.20038, "t": 306.64853, "r": 537.87421, "b": 315.86151, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "external intrusions. Resource security controls are closely tied to the part of the security ", "bbox": {"l": 151.20038, "t": 318.64834999999994, "r": 541.33636, "b": 327.86133, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "policy that defines who should have access to what information resources. A hacker might ", "bbox": {"l": 151.20038, "t": 330.64816, "r": 547.15826, "b": 339.86115, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "be good enough to get through your company firewalls and sift his way through to your ", "bbox": {"l": 151.20038, "t": 342.64798, "r": 534.86066, "b": 351.86096, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "system, but if they do not have explicit access to your database, the hacker cannot ", "bbox": {"l": 151.20038, "t": 354.6478, "r": 517.00739, "b": 363.86078, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "compromise your information assets.", "bbox": {"l": 151.20038, "t": 366.64761, "r": 314.03534, "b": 375.8606, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "text", "bbox": {"l": 136.80022, "t": 388.60742, "r": 535.36169, "b": 409.82022, "coord_origin": "TOPLEFT"}, "confidence": 0.9621999263763428, "cells": [{"id": 31, "text": "With your eyes now open to the importance of securing information assets, the rest of this ", "bbox": {"l": 136.80022, "t": 388.60742, "r": 535.36169, "b": 397.82040000000006, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "chapter reviews the methods that are available for securing database resources on IBM i. ", "bbox": {"l": 136.80022, "t": 400.60724, "r": 532.755, "b": 409.82022, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "section_header", "bbox": {"l": 64.800003, "t": 438.30072, "r": 323.38391, "b": 453.06372, "coord_origin": "TOPLEFT"}, "confidence": 0.9650285243988037, "cells": [{"id": 33, "text": "1.2", "bbox": {"l": 64.800003, "t": 438.30072, "r": 87.415726, "b": 453.06372, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Current state of IBM i security", "bbox": {"l": 91.93885, "t": 438.30072, "r": 323.38391, "b": 453.06372, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 136.8, "t": 470.62872, "r": 547.31824, "b": 515.84116, "coord_origin": "TOPLEFT"}, "confidence": 0.9848750233650208, "cells": [{"id": 35, "text": "Because of the inherently secure nature of IBM i, many clients rely on the default system ", "bbox": {"l": 136.8, "t": 470.62872, "r": 530.30463, "b": 479.84171, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "settings to protect their business data that is stored in DB2 for i. In most cases, this means no ", "bbox": {"l": 136.8, "t": 482.62854, "r": 547.31824, "b": 491.84152, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "data protection because the default setting for the Create default public authority (QCRTAUT) ", "bbox": {"l": 136.8, "t": 494.62836, "r": 547.19586, "b": 503.84134, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "system value is *CHANGE.", "bbox": {"l": 136.8, "t": 506.62817, "r": 257.04709, "b": 515.84116, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 136.8, "t": 528.64774, "r": 547.28442, "b": 585.85994, "coord_origin": "TOPLEFT"}, "confidence": 0.9848474860191345, "cells": [{"id": 39, "text": "Even more disturbing is that many IBM i clients remain in this state, despite the news ", "bbox": {"l": 136.8, "t": 528.64774, "r": 513.90448, "b": 537.86073, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "headlines and the significant costs that are involved with databases being compromised. This ", "bbox": {"l": 136.8, "t": 540.6475399999999, "r": 547.28442, "b": 549.86053, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "default security configuration makes it quite challenging to implement basic security policies. ", "bbox": {"l": 136.8, "t": 552.64734, "r": 546.27533, "b": 561.86034, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "A tighter implementation is required if you really want to protect one of your company\u2019s most ", "bbox": {"l": 136.8, "t": 564.64714, "r": 545.08014, "b": 573.86014, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "valuable assets, which is the data.", "bbox": {"l": 136.8, "t": 576.64694, "r": 287.80057, "b": 585.85994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 136.8, "t": 598.6665, "r": 547.28326, "b": 679.87833, "coord_origin": "TOPLEFT"}, "confidence": 0.9870818853378296, "cells": [{"id": 44, "text": "Traditionally, IBM i applications have employed menu-based security to counteract this default ", "bbox": {"l": 136.8, "t": 598.6665, "r": 547.28326, "b": 607.8795, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "configuration that gives all users access to the data. The theory is that data is protected by ", "bbox": {"l": 136.8, "t": 610.6663100000001, "r": 538.6767, "b": 619.8793000000001, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "the menu options controlling what database operations that the user can perform. This ", "bbox": {"l": 136.8, "t": 622.66611, "r": 520.35364, "b": 631.8791, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "approach is ineffective, even if the user profile is restricted from running interactive ", "bbox": {"l": 136.80002, "t": 634.6659099999999, "r": 502.77115000000003, "b": 643.87891, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "commands. The reason is that in today\u2019s connected world there are a multitude of interfaces ", "bbox": {"l": 136.80002, "t": 646.66571, "r": 545.16492, "b": 655.87871, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "into the system, from web browsers to PC clients, that bypass application menus. If there are ", "bbox": {"l": 136.80002, "t": 658.66551, "r": 547.23376, "b": 667.87852, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "no object-level controls, users of these newer interfaces have an open door to your data.", "bbox": {"l": 136.80002, "t": 670.66532, "r": 526.04187, "b": 679.87833, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_footer", "id": 10, "page_no": 5, "cluster": {"id": 10, "label": "page_footer", "bbox": {"l": 64.800003, "t": 754.848721, "r": 72.821999, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.8889443874359131, "cells": [{"id": 0, "text": "2 ", "bbox": {"l": 64.800003, "t": 754.848721, "r": 72.821999, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2"}, {"label": "page_footer", "id": 9, "page_no": 5, "cluster": {"id": 9, "label": "page_footer", "bbox": {"l": 87.840302, "t": 755.538002, "r": 328.72537, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9476425051689148, "cells": [{"id": 1, "text": "Row and Column Access Control Support in IBM DB2 for i", "bbox": {"l": 87.840302, "t": 755.538002, "r": 328.72537, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Row and Column Access Control Support in IBM DB2 for i"}, {"label": "section_header", "id": 6, "page_no": 5, "cluster": {"id": 6, "label": "section_header", "bbox": {"l": 64.800003, "t": 74.34069999999997, "r": 267.40582, "b": 89.1037, "coord_origin": "TOPLEFT"}, "confidence": 0.9651358723640442, "cells": [{"id": 2, "text": "1.1", "bbox": {"l": 64.800003, "t": 74.34069999999997, "r": 87.524292, "b": 89.1037, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Security fundamentals", "bbox": {"l": 92.069145, "t": 74.34069999999997, "r": 267.40582, "b": 89.1037, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1.1 Security fundamentals"}, {"label": "text", "id": 5, "page_no": 5, "cluster": {"id": 5, "label": "text", "bbox": {"l": 136.8, "t": 106.6087, "r": 545.00482, "b": 127.82153000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9663435220718384, "cells": [{"id": 4, "text": "Before reviewing database security techniques, there are two fundamental steps in securing ", "bbox": {"l": 136.8, "t": 106.6087, "r": 545.00482, "b": 115.82172000000003, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "information assets that must be described:", "bbox": {"l": 136.8, "t": 118.60852, "r": 324.47229, "b": 127.82153000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Before reviewing database security techniques, there are two fundamental steps in securing information assets that must be described:"}, {"label": "list_item", "id": 4, "page_no": 5, "cluster": {"id": 4, "label": "list_item", "bbox": {"l": 136.8, "t": 135.12487999999996, "r": 547.16425, "b": 180.86108000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9835494756698608, "cells": [{"id": 6, "text": "GLYPH<SM590000>", "bbox": {"l": 136.8, "t": 135.79749000000004, "r": 141.78, "b": 144.57227, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "First, and most important, is the definition of a company\u2019s ", "bbox": {"l": 151.20016, "t": 135.64806999999996, "r": 406.67715, "b": 144.86108000000002, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "security policy", "bbox": {"l": 406.67999, "t": 135.12487999999996, "r": 471.03815, "b": 145.18262000000004, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": ". Without a ", "bbox": {"l": 470.04001000000005, "t": 135.64862000000005, "r": 520.59796, "b": 144.86163, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "security policy, there is no definition of what are acceptable practices for using, accessing, ", "bbox": {"l": 151.19949, "t": 147.64844000000005, "r": 547.16425, "b": 156.86145, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "and storing information by who, what, when, where, and how. A security policy should ", "bbox": {"l": 151.19948, "t": 159.64824999999996, "r": 531.02008, "b": 168.86127, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "minimally address three things: confidentiality, integrity, and availability.", "bbox": {"l": 151.19948, "t": 171.64806999999996, "r": 463.3578499999999, "b": 180.86108000000002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<SM590000> First, and most important, is the definition of a company\u2019s security policy . Without a security policy, there is no definition of what are acceptable practices for using, accessing, and storing information by who, what, when, where, and how. A security policy should minimally address three things: confidentiality, integrity, and availability."}, {"label": "list_item", "id": 11, "page_no": 5, "cluster": {"id": 11, "label": "list_item", "bbox": {"l": 151.19946, "t": 188.62787000000003, "r": 547.26086, "b": 269.83978, "coord_origin": "TOPLEFT"}, "confidence": 0.8077319264411926, "cells": [{"id": 13, "text": "The monitoring and assessment of adherence to the security policy determines whether ", "bbox": {"l": 151.19948, "t": 188.62787000000003, "r": 541.70514, "b": 197.84087999999997, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "your security strategy is working. Often, IBM security consultants are asked to perform ", "bbox": {"l": 151.19948, "t": 200.62769000000003, "r": 534.83002, "b": 209.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "security assessments for companies without regard to the security policy. Although these ", "bbox": {"l": 151.19948, "t": 212.62750000000005, "r": 545.79773, "b": 221.84051999999997, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "assessments can be useful for observing how the system is defined and how data is being ", "bbox": {"l": 151.19948, "t": 224.62732000000005, "r": 547.26086, "b": 233.84033, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "accessed, they cannot determine the level of security without a security policy. Without a ", "bbox": {"l": 151.19948, "t": 236.62714000000005, "r": 543.91528, "b": 245.84015, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "security policy, it really is not an assessment as much as it is a baseline for monitoring the ", "bbox": {"l": 151.19948, "t": 248.62694999999997, "r": 547.25989, "b": 257.83997, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "changes in the security settings that are captured.", "bbox": {"l": 151.19946, "t": 260.62676999999996, "r": 371.8692, "b": 269.83978, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The monitoring and assessment of adherence to the security policy determines whether your security strategy is working. Often, IBM security consultants are asked to perform security assessments for companies without regard to the security policy. Although these assessments can be useful for observing how the system is defined and how data is being accessed, they cannot determine the level of security without a security policy. Without a security policy, it really is not an assessment as much as it is a baseline for monitoring the changes in the security settings that are captured."}, {"label": "text", "id": 12, "page_no": 5, "cluster": {"id": 12, "label": "text", "bbox": {"l": 151.19946, "t": 277.60657000000003, "r": 541.992, "b": 286.81958, "coord_origin": "TOPLEFT"}, "confidence": 0.7967224717140198, "cells": [{"id": 20, "text": "A security policy is what defines whether the system and its settings are secure (or not). ", "bbox": {"l": 151.19946, "t": 277.60657000000003, "r": 541.992, "b": 286.81958, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "A security policy is what defines whether the system and its settings are secure (or not)."}, {"label": "list_item", "id": 3, "page_no": 5, "cluster": {"id": 3, "label": "list_item", "bbox": {"l": 136.7993, "t": 294.12496999999996, "r": 547.15826, "b": 375.8606, "coord_origin": "TOPLEFT"}, "confidence": 0.9837489128112793, "cells": [{"id": 21, "text": "GLYPH<SM590000>", "bbox": {"l": 136.7993, "t": 294.7955600000001, "r": 141.7793, "b": 303.57034, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "The second fundamental in securing data assets is the use of ", "bbox": {"l": 151.19946, "t": 294.64618, "r": 425.86029, "b": 303.85916, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "resource security", "bbox": {"l": 425.82001, "t": 294.12496999999996, "r": 501.60065, "b": 304.18265, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": ". If ", "bbox": {"l": 500.64001, "t": 294.64871, "r": 514.49933, "b": 303.86169, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "implemented properly, resource security prevents data breaches from both internal and ", "bbox": {"l": 151.20038, "t": 306.64853, "r": 537.87421, "b": 315.86151, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "external intrusions. Resource security controls are closely tied to the part of the security ", "bbox": {"l": 151.20038, "t": 318.64834999999994, "r": 541.33636, "b": 327.86133, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "policy that defines who should have access to what information resources. A hacker might ", "bbox": {"l": 151.20038, "t": 330.64816, "r": 547.15826, "b": 339.86115, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "be good enough to get through your company firewalls and sift his way through to your ", "bbox": {"l": 151.20038, "t": 342.64798, "r": 534.86066, "b": 351.86096, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "system, but if they do not have explicit access to your database, the hacker cannot ", "bbox": {"l": 151.20038, "t": 354.6478, "r": 517.00739, "b": 363.86078, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "compromise your information assets.", "bbox": {"l": 151.20038, "t": 366.64761, "r": 314.03534, "b": 375.8606, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<SM590000> The second fundamental in securing data assets is the use of resource security . If implemented properly, resource security prevents data breaches from both internal and external intrusions. Resource security controls are closely tied to the part of the security policy that defines who should have access to what information resources. A hacker might be good enough to get through your company firewalls and sift his way through to your system, but if they do not have explicit access to your database, the hacker cannot compromise your information assets."}, {"label": "text", "id": 8, "page_no": 5, "cluster": {"id": 8, "label": "text", "bbox": {"l": 136.80022, "t": 388.60742, "r": 535.36169, "b": 409.82022, "coord_origin": "TOPLEFT"}, "confidence": 0.9621999263763428, "cells": [{"id": 31, "text": "With your eyes now open to the importance of securing information assets, the rest of this ", "bbox": {"l": 136.80022, "t": 388.60742, "r": 535.36169, "b": 397.82040000000006, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "chapter reviews the methods that are available for securing database resources on IBM i. ", "bbox": {"l": 136.80022, "t": 400.60724, "r": 532.755, "b": 409.82022, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "With your eyes now open to the importance of securing information assets, the rest of this chapter reviews the methods that are available for securing database resources on IBM i."}, {"label": "section_header", "id": 7, "page_no": 5, "cluster": {"id": 7, "label": "section_header", "bbox": {"l": 64.800003, "t": 438.30072, "r": 323.38391, "b": 453.06372, "coord_origin": "TOPLEFT"}, "confidence": 0.9650285243988037, "cells": [{"id": 33, "text": "1.2", "bbox": {"l": 64.800003, "t": 438.30072, "r": 87.415726, "b": 453.06372, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Current state of IBM i security", "bbox": {"l": 91.93885, "t": 438.30072, "r": 323.38391, "b": 453.06372, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1.2 Current state of IBM i security"}, {"label": "text", "id": 1, "page_no": 5, "cluster": {"id": 1, "label": "text", "bbox": {"l": 136.8, "t": 470.62872, "r": 547.31824, "b": 515.84116, "coord_origin": "TOPLEFT"}, "confidence": 0.9848750233650208, "cells": [{"id": 35, "text": "Because of the inherently secure nature of IBM i, many clients rely on the default system ", "bbox": {"l": 136.8, "t": 470.62872, "r": 530.30463, "b": 479.84171, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "settings to protect their business data that is stored in DB2 for i. In most cases, this means no ", "bbox": {"l": 136.8, "t": 482.62854, "r": 547.31824, "b": 491.84152, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "data protection because the default setting for the Create default public authority (QCRTAUT) ", "bbox": {"l": 136.8, "t": 494.62836, "r": 547.19586, "b": 503.84134, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "system value is *CHANGE.", "bbox": {"l": 136.8, "t": 506.62817, "r": 257.04709, "b": 515.84116, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Because of the inherently secure nature of IBM i, many clients rely on the default system settings to protect their business data that is stored in DB2 for i. In most cases, this means no data protection because the default setting for the Create default public authority (QCRTAUT) system value is *CHANGE."}, {"label": "text", "id": 2, "page_no": 5, "cluster": {"id": 2, "label": "text", "bbox": {"l": 136.8, "t": 528.64774, "r": 547.28442, "b": 585.85994, "coord_origin": "TOPLEFT"}, "confidence": 0.9848474860191345, "cells": [{"id": 39, "text": "Even more disturbing is that many IBM i clients remain in this state, despite the news ", "bbox": {"l": 136.8, "t": 528.64774, "r": 513.90448, "b": 537.86073, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "headlines and the significant costs that are involved with databases being compromised. This ", "bbox": {"l": 136.8, "t": 540.6475399999999, "r": 547.28442, "b": 549.86053, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "default security configuration makes it quite challenging to implement basic security policies. ", "bbox": {"l": 136.8, "t": 552.64734, "r": 546.27533, "b": 561.86034, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "A tighter implementation is required if you really want to protect one of your company\u2019s most ", "bbox": {"l": 136.8, "t": 564.64714, "r": 545.08014, "b": 573.86014, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "valuable assets, which is the data.", "bbox": {"l": 136.8, "t": 576.64694, "r": 287.80057, "b": 585.85994, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Even more disturbing is that many IBM i clients remain in this state, despite the news headlines and the significant costs that are involved with databases being compromised. This default security configuration makes it quite challenging to implement basic security policies. A tighter implementation is required if you really want to protect one of your company\u2019s most valuable assets, which is the data."}, {"label": "text", "id": 0, "page_no": 5, "cluster": {"id": 0, "label": "text", "bbox": {"l": 136.8, "t": 598.6665, "r": 547.28326, "b": 679.87833, "coord_origin": "TOPLEFT"}, "confidence": 0.9870818853378296, "cells": [{"id": 44, "text": "Traditionally, IBM i applications have employed menu-based security to counteract this default ", "bbox": {"l": 136.8, "t": 598.6665, "r": 547.28326, "b": 607.8795, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "configuration that gives all users access to the data. The theory is that data is protected by ", "bbox": {"l": 136.8, "t": 610.6663100000001, "r": 538.6767, "b": 619.8793000000001, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "the menu options controlling what database operations that the user can perform. This ", "bbox": {"l": 136.8, "t": 622.66611, "r": 520.35364, "b": 631.8791, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "approach is ineffective, even if the user profile is restricted from running interactive ", "bbox": {"l": 136.80002, "t": 634.6659099999999, "r": 502.77115000000003, "b": 643.87891, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "commands. The reason is that in today\u2019s connected world there are a multitude of interfaces ", "bbox": {"l": 136.80002, "t": 646.66571, "r": 545.16492, "b": 655.87871, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "into the system, from web browsers to PC clients, that bypass application menus. If there are ", "bbox": {"l": 136.80002, "t": 658.66551, "r": 547.23376, "b": 667.87852, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "no object-level controls, users of these newer interfaces have an open door to your data.", "bbox": {"l": 136.80002, "t": 670.66532, "r": 526.04187, "b": 679.87833, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Traditionally, IBM i applications have employed menu-based security to counteract this default configuration that gives all users access to the data. The theory is that data is protected by the menu options controlling what database operations that the user can perform. This approach is ineffective, even if the user profile is restricted from running interactive commands. The reason is that in today\u2019s connected world there are a multitude of interfaces into the system, from web browsers to PC clients, that bypass application menus. If there are no object-level controls, users of these newer interfaces have an open door to your data."}], "body": [{"label": "section_header", "id": 6, "page_no": 5, "cluster": {"id": 6, "label": "section_header", "bbox": {"l": 64.800003, "t": 74.34069999999997, "r": 267.40582, "b": 89.1037, "coord_origin": "TOPLEFT"}, "confidence": 0.9651358723640442, "cells": [{"id": 2, "text": "1.1", "bbox": {"l": 64.800003, "t": 74.34069999999997, "r": 87.524292, "b": 89.1037, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Security fundamentals", "bbox": {"l": 92.069145, "t": 74.34069999999997, "r": 267.40582, "b": 89.1037, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1.1 Security fundamentals"}, {"label": "text", "id": 5, "page_no": 5, "cluster": {"id": 5, "label": "text", "bbox": {"l": 136.8, "t": 106.6087, "r": 545.00482, "b": 127.82153000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9663435220718384, "cells": [{"id": 4, "text": "Before reviewing database security techniques, there are two fundamental steps in securing ", "bbox": {"l": 136.8, "t": 106.6087, "r": 545.00482, "b": 115.82172000000003, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "information assets that must be described:", "bbox": {"l": 136.8, "t": 118.60852, "r": 324.47229, "b": 127.82153000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Before reviewing database security techniques, there are two fundamental steps in securing information assets that must be described:"}, {"label": "list_item", "id": 4, "page_no": 5, "cluster": {"id": 4, "label": "list_item", "bbox": {"l": 136.8, "t": 135.12487999999996, "r": 547.16425, "b": 180.86108000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9835494756698608, "cells": [{"id": 6, "text": "GLYPH<SM590000>", "bbox": {"l": 136.8, "t": 135.79749000000004, "r": 141.78, "b": 144.57227, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "First, and most important, is the definition of a company\u2019s ", "bbox": {"l": 151.20016, "t": 135.64806999999996, "r": 406.67715, "b": 144.86108000000002, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "security policy", "bbox": {"l": 406.67999, "t": 135.12487999999996, "r": 471.03815, "b": 145.18262000000004, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": ". Without a ", "bbox": {"l": 470.04001000000005, "t": 135.64862000000005, "r": 520.59796, "b": 144.86163, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "security policy, there is no definition of what are acceptable practices for using, accessing, ", "bbox": {"l": 151.19949, "t": 147.64844000000005, "r": 547.16425, "b": 156.86145, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "and storing information by who, what, when, where, and how. A security policy should ", "bbox": {"l": 151.19948, "t": 159.64824999999996, "r": 531.02008, "b": 168.86127, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "minimally address three things: confidentiality, integrity, and availability.", "bbox": {"l": 151.19948, "t": 171.64806999999996, "r": 463.3578499999999, "b": 180.86108000000002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<SM590000> First, and most important, is the definition of a company\u2019s security policy . Without a security policy, there is no definition of what are acceptable practices for using, accessing, and storing information by who, what, when, where, and how. A security policy should minimally address three things: confidentiality, integrity, and availability."}, {"label": "list_item", "id": 11, "page_no": 5, "cluster": {"id": 11, "label": "list_item", "bbox": {"l": 151.19946, "t": 188.62787000000003, "r": 547.26086, "b": 269.83978, "coord_origin": "TOPLEFT"}, "confidence": 0.8077319264411926, "cells": [{"id": 13, "text": "The monitoring and assessment of adherence to the security policy determines whether ", "bbox": {"l": 151.19948, "t": 188.62787000000003, "r": 541.70514, "b": 197.84087999999997, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "your security strategy is working. Often, IBM security consultants are asked to perform ", "bbox": {"l": 151.19948, "t": 200.62769000000003, "r": 534.83002, "b": 209.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "security assessments for companies without regard to the security policy. Although these ", "bbox": {"l": 151.19948, "t": 212.62750000000005, "r": 545.79773, "b": 221.84051999999997, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "assessments can be useful for observing how the system is defined and how data is being ", "bbox": {"l": 151.19948, "t": 224.62732000000005, "r": 547.26086, "b": 233.84033, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "accessed, they cannot determine the level of security without a security policy. Without a ", "bbox": {"l": 151.19948, "t": 236.62714000000005, "r": 543.91528, "b": 245.84015, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "security policy, it really is not an assessment as much as it is a baseline for monitoring the ", "bbox": {"l": 151.19948, "t": 248.62694999999997, "r": 547.25989, "b": 257.83997, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "changes in the security settings that are captured.", "bbox": {"l": 151.19946, "t": 260.62676999999996, "r": 371.8692, "b": 269.83978, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The monitoring and assessment of adherence to the security policy determines whether your security strategy is working. Often, IBM security consultants are asked to perform security assessments for companies without regard to the security policy. Although these assessments can be useful for observing how the system is defined and how data is being accessed, they cannot determine the level of security without a security policy. Without a security policy, it really is not an assessment as much as it is a baseline for monitoring the changes in the security settings that are captured."}, {"label": "text", "id": 12, "page_no": 5, "cluster": {"id": 12, "label": "text", "bbox": {"l": 151.19946, "t": 277.60657000000003, "r": 541.992, "b": 286.81958, "coord_origin": "TOPLEFT"}, "confidence": 0.7967224717140198, "cells": [{"id": 20, "text": "A security policy is what defines whether the system and its settings are secure (or not). ", "bbox": {"l": 151.19946, "t": 277.60657000000003, "r": 541.992, "b": 286.81958, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "A security policy is what defines whether the system and its settings are secure (or not)."}, {"label": "list_item", "id": 3, "page_no": 5, "cluster": {"id": 3, "label": "list_item", "bbox": {"l": 136.7993, "t": 294.12496999999996, "r": 547.15826, "b": 375.8606, "coord_origin": "TOPLEFT"}, "confidence": 0.9837489128112793, "cells": [{"id": 21, "text": "GLYPH<SM590000>", "bbox": {"l": 136.7993, "t": 294.7955600000001, "r": 141.7793, "b": 303.57034, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "The second fundamental in securing data assets is the use of ", "bbox": {"l": 151.19946, "t": 294.64618, "r": 425.86029, "b": 303.85916, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "resource security", "bbox": {"l": 425.82001, "t": 294.12496999999996, "r": 501.60065, "b": 304.18265, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": ". If ", "bbox": {"l": 500.64001, "t": 294.64871, "r": 514.49933, "b": 303.86169, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "implemented properly, resource security prevents data breaches from both internal and ", "bbox": {"l": 151.20038, "t": 306.64853, "r": 537.87421, "b": 315.86151, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "external intrusions. Resource security controls are closely tied to the part of the security ", "bbox": {"l": 151.20038, "t": 318.64834999999994, "r": 541.33636, "b": 327.86133, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "policy that defines who should have access to what information resources. A hacker might ", "bbox": {"l": 151.20038, "t": 330.64816, "r": 547.15826, "b": 339.86115, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "be good enough to get through your company firewalls and sift his way through to your ", "bbox": {"l": 151.20038, "t": 342.64798, "r": 534.86066, "b": 351.86096, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "system, but if they do not have explicit access to your database, the hacker cannot ", "bbox": {"l": 151.20038, "t": 354.6478, "r": 517.00739, "b": 363.86078, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "compromise your information assets.", "bbox": {"l": 151.20038, "t": 366.64761, "r": 314.03534, "b": 375.8606, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<SM590000> The second fundamental in securing data assets is the use of resource security . If implemented properly, resource security prevents data breaches from both internal and external intrusions. Resource security controls are closely tied to the part of the security policy that defines who should have access to what information resources. A hacker might be good enough to get through your company firewalls and sift his way through to your system, but if they do not have explicit access to your database, the hacker cannot compromise your information assets."}, {"label": "text", "id": 8, "page_no": 5, "cluster": {"id": 8, "label": "text", "bbox": {"l": 136.80022, "t": 388.60742, "r": 535.36169, "b": 409.82022, "coord_origin": "TOPLEFT"}, "confidence": 0.9621999263763428, "cells": [{"id": 31, "text": "With your eyes now open to the importance of securing information assets, the rest of this ", "bbox": {"l": 136.80022, "t": 388.60742, "r": 535.36169, "b": 397.82040000000006, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "chapter reviews the methods that are available for securing database resources on IBM i. ", "bbox": {"l": 136.80022, "t": 400.60724, "r": 532.755, "b": 409.82022, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "With your eyes now open to the importance of securing information assets, the rest of this chapter reviews the methods that are available for securing database resources on IBM i."}, {"label": "section_header", "id": 7, "page_no": 5, "cluster": {"id": 7, "label": "section_header", "bbox": {"l": 64.800003, "t": 438.30072, "r": 323.38391, "b": 453.06372, "coord_origin": "TOPLEFT"}, "confidence": 0.9650285243988037, "cells": [{"id": 33, "text": "1.2", "bbox": {"l": 64.800003, "t": 438.30072, "r": 87.415726, "b": 453.06372, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Current state of IBM i security", "bbox": {"l": 91.93885, "t": 438.30072, "r": 323.38391, "b": 453.06372, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1.2 Current state of IBM i security"}, {"label": "text", "id": 1, "page_no": 5, "cluster": {"id": 1, "label": "text", "bbox": {"l": 136.8, "t": 470.62872, "r": 547.31824, "b": 515.84116, "coord_origin": "TOPLEFT"}, "confidence": 0.9848750233650208, "cells": [{"id": 35, "text": "Because of the inherently secure nature of IBM i, many clients rely on the default system ", "bbox": {"l": 136.8, "t": 470.62872, "r": 530.30463, "b": 479.84171, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "settings to protect their business data that is stored in DB2 for i. In most cases, this means no ", "bbox": {"l": 136.8, "t": 482.62854, "r": 547.31824, "b": 491.84152, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "data protection because the default setting for the Create default public authority (QCRTAUT) ", "bbox": {"l": 136.8, "t": 494.62836, "r": 547.19586, "b": 503.84134, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "system value is *CHANGE.", "bbox": {"l": 136.8, "t": 506.62817, "r": 257.04709, "b": 515.84116, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Because of the inherently secure nature of IBM i, many clients rely on the default system settings to protect their business data that is stored in DB2 for i. In most cases, this means no data protection because the default setting for the Create default public authority (QCRTAUT) system value is *CHANGE."}, {"label": "text", "id": 2, "page_no": 5, "cluster": {"id": 2, "label": "text", "bbox": {"l": 136.8, "t": 528.64774, "r": 547.28442, "b": 585.85994, "coord_origin": "TOPLEFT"}, "confidence": 0.9848474860191345, "cells": [{"id": 39, "text": "Even more disturbing is that many IBM i clients remain in this state, despite the news ", "bbox": {"l": 136.8, "t": 528.64774, "r": 513.90448, "b": 537.86073, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "headlines and the significant costs that are involved with databases being compromised. This ", "bbox": {"l": 136.8, "t": 540.6475399999999, "r": 547.28442, "b": 549.86053, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "default security configuration makes it quite challenging to implement basic security policies. ", "bbox": {"l": 136.8, "t": 552.64734, "r": 546.27533, "b": 561.86034, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "A tighter implementation is required if you really want to protect one of your company\u2019s most ", "bbox": {"l": 136.8, "t": 564.64714, "r": 545.08014, "b": 573.86014, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "valuable assets, which is the data.", "bbox": {"l": 136.8, "t": 576.64694, "r": 287.80057, "b": 585.85994, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Even more disturbing is that many IBM i clients remain in this state, despite the news headlines and the significant costs that are involved with databases being compromised. This default security configuration makes it quite challenging to implement basic security policies. A tighter implementation is required if you really want to protect one of your company\u2019s most valuable assets, which is the data."}, {"label": "text", "id": 0, "page_no": 5, "cluster": {"id": 0, "label": "text", "bbox": {"l": 136.8, "t": 598.6665, "r": 547.28326, "b": 679.87833, "coord_origin": "TOPLEFT"}, "confidence": 0.9870818853378296, "cells": [{"id": 44, "text": "Traditionally, IBM i applications have employed menu-based security to counteract this default ", "bbox": {"l": 136.8, "t": 598.6665, "r": 547.28326, "b": 607.8795, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "configuration that gives all users access to the data. The theory is that data is protected by ", "bbox": {"l": 136.8, "t": 610.6663100000001, "r": 538.6767, "b": 619.8793000000001, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "the menu options controlling what database operations that the user can perform. This ", "bbox": {"l": 136.8, "t": 622.66611, "r": 520.35364, "b": 631.8791, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "approach is ineffective, even if the user profile is restricted from running interactive ", "bbox": {"l": 136.80002, "t": 634.6659099999999, "r": 502.77115000000003, "b": 643.87891, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "commands. The reason is that in today\u2019s connected world there are a multitude of interfaces ", "bbox": {"l": 136.80002, "t": 646.66571, "r": 545.16492, "b": 655.87871, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "into the system, from web browsers to PC clients, that bypass application menus. If there are ", "bbox": {"l": 136.80002, "t": 658.66551, "r": 547.23376, "b": 667.87852, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "no object-level controls, users of these newer interfaces have an open door to your data.", "bbox": {"l": 136.80002, "t": 670.66532, "r": 526.04187, "b": 679.87833, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Traditionally, IBM i applications have employed menu-based security to counteract this default configuration that gives all users access to the data. The theory is that data is protected by the menu options controlling what database operations that the user can perform. This approach is ineffective, even if the user profile is restricted from running interactive commands. The reason is that in today\u2019s connected world there are a multitude of interfaces into the system, from web browsers to PC clients, that bypass application menus. If there are no object-level controls, users of these newer interfaces have an open door to your data."}], "headers": [{"label": "page_footer", "id": 10, "page_no": 5, "cluster": {"id": 10, "label": "page_footer", "bbox": {"l": 64.800003, "t": 754.848721, "r": 72.821999, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.8889443874359131, "cells": [{"id": 0, "text": "2 ", "bbox": {"l": 64.800003, "t": 754.848721, "r": 72.821999, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2"}, {"label": "page_footer", "id": 9, "page_no": 5, "cluster": {"id": 9, "label": "page_footer", "bbox": {"l": 87.840302, "t": 755.538002, "r": 328.72537, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9476425051689148, "cells": [{"id": 1, "text": "Row and Column Access Control Support in IBM DB2 for i", "bbox": {"l": 87.840302, "t": 755.538002, "r": 328.72537, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Row and Column Access Control Support in IBM DB2 for i"}]}}, {"page_no": 6, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "4 ", "bbox": {"l": 64.800003, "t": 754.848721, "r": 72.821999, "b": 764.06172, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Row and Column Access Control Support in IBM DB2 for i", "bbox": {"l": 87.840302, "t": 755.538002, "r": 328.72537, "b": 763.863001, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Many businesses are trying to limit data access to a need-to-know basis. This security goal ", "bbox": {"l": 136.8, "t": 71.50867000000005, "r": 541.19006, "b": 80.72167999999999, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "means that users should be given access only to the minimum set of data that is required to ", "bbox": {"l": 136.8, "t": 83.50847999999996, "r": 544.30334, "b": 92.72149999999999, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "perform their job. Often, users with object-level access are given access to row and column ", "bbox": {"l": 136.8, "t": 95.50829999999996, "r": 540.94299, "b": 104.72131000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "values that are beyond what their business task requires because that object-level security ", "bbox": {"l": 136.80002, "t": 107.50811999999996, "r": 538.27454, "b": 116.72113000000002, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "provides an all-or-nothing solution. For example, object-level controls allow a manager to ", "bbox": {"l": 136.80002, "t": 119.50792999999999, "r": 530.23004, "b": 128.72095000000002, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "access data about all employees. Most security policies limit a manager to accessing data ", "bbox": {"l": 136.80002, "t": 131.50775, "r": 536.26263, "b": 140.72076000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "only for the employees that they manage.", "bbox": {"l": 136.80002, "t": 143.50757, "r": 319.04318, "b": 152.72058000000004, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "1.3.1", "bbox": {"l": 64.800003, "t": 173.33471999999995, "r": 94.033653, "b": 185.32275000000004, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Existing row and column control", "bbox": {"l": 97.687859, "t": 173.33471999999995, "r": 301.46902, "b": 185.32275000000004, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Some IBM i clients have tried augmenting the all-or-nothing object-level security with SQL ", "bbox": {"l": 136.8, "t": 199.48870999999997, "r": 534.90112, "b": 208.70172000000002, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "views (or logical files) and application logic, as shown in Figure 1-2. However, ", "bbox": {"l": 136.8, "t": 211.48852999999997, "r": 480.47281000000004, "b": 220.70154000000002, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "application-based logic is easy to bypass with all of the different data access interfaces that ", "bbox": {"l": 136.8, "t": 223.48834, "r": 541.56738, "b": 232.70135000000005, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "are provided by the IBM i operating system, such as Open Database Connectivity (ODBC) ", "bbox": {"l": 136.8, "t": 235.48816, "r": 537.39423, "b": 244.70117000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "and System i Navigator.", "bbox": {"l": 136.79999, "t": 247.48798, "r": 242.24352000000002, "b": 256.70099000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Using SQL views to limit access to a subset of the data in a table also has its own set of ", "bbox": {"l": 136.79999, "t": 269.50757, "r": 526.88428, "b": 278.72058000000004, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "challenges. First, there is the complexity of managing all of the SQL view objects that are ", "bbox": {"l": 136.79999, "t": 281.50742, "r": 531.77087, "b": 290.7203999999999, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "used for securing data access. Second, scaling a view-based security solution can be difficult ", "bbox": {"l": 136.79999, "t": 293.50723000000005, "r": 547.4408, "b": 302.72021, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "as the amount of data grows and the number of users increases.", "bbox": {"l": 136.79999, "t": 305.50705, "r": 421.86725, "b": 314.72003, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Even if you are willing to live with these performance and management issues, a user with ", "bbox": {"l": 136.79999, "t": 327.52661, "r": 536.46692, "b": 336.7395900000001, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "*ALLOBJ access still can directly access all of the data in the underlying DB2 table and easily ", "bbox": {"l": 136.79999, "t": 339.52643, "r": 547.23267, "b": 348.73941, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "bypass the security controls that are built into an SQL view.", "bbox": {"l": 136.79999, "t": 351.52624999999995, "r": 397.88553, "b": 360.73923, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Figure 1-2 Existing row and column controls", "bbox": {"l": 136.8, "t": 691.818, "r": 316.44727, "b": 700.142998, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "User with", "bbox": {"l": 180.95911, "t": 383.45612, "r": 209.08017, "b": 389.0784, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "*ALLOBJ access", "bbox": {"l": 170.00624, "t": 390.95251, "r": 220.10355, "b": 396.57480000000004, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 8, "label": "page_footer", "bbox": {"l": 64.800003, "t": 754.848721, "r": 72.821999, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.8578535318374634, "cells": [{"id": 0, "text": "4 ", "bbox": {"l": 64.800003, "t": 754.848721, "r": 72.821999, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "page_footer", "bbox": {"l": 87.840302, "t": 755.538002, "r": 328.72537, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.949161946773529, "cells": [{"id": 1, "text": "Row and Column Access Control Support in IBM DB2 for i", "bbox": {"l": 87.840302, "t": 755.538002, "r": 328.72537, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 136.8, "t": 71.50867000000005, "r": 544.30334, "b": 152.72058000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9872740507125854, "cells": [{"id": 2, "text": "Many businesses are trying to limit data access to a need-to-know basis. This security goal ", "bbox": {"l": 136.8, "t": 71.50867000000005, "r": 541.19006, "b": 80.72167999999999, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "means that users should be given access only to the minimum set of data that is required to ", "bbox": {"l": 136.8, "t": 83.50847999999996, "r": 544.30334, "b": 92.72149999999999, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "perform their job. Often, users with object-level access are given access to row and column ", "bbox": {"l": 136.8, "t": 95.50829999999996, "r": 540.94299, "b": 104.72131000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "values that are beyond what their business task requires because that object-level security ", "bbox": {"l": 136.80002, "t": 107.50811999999996, "r": 538.27454, "b": 116.72113000000002, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "provides an all-or-nothing solution. For example, object-level controls allow a manager to ", "bbox": {"l": 136.80002, "t": 119.50792999999999, "r": 530.23004, "b": 128.72095000000002, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "access data about all employees. Most security policies limit a manager to accessing data ", "bbox": {"l": 136.80002, "t": 131.50775, "r": 536.26263, "b": 140.72076000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "only for the employees that they manage.", "bbox": {"l": 136.80002, "t": 143.50757, "r": 319.04318, "b": 152.72058000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "section_header", "bbox": {"l": 64.800003, "t": 173.33471999999995, "r": 301.46902, "b": 185.32275000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9626136422157288, "cells": [{"id": 9, "text": "1.3.1", "bbox": {"l": 64.800003, "t": 173.33471999999995, "r": 94.033653, "b": 185.32275000000004, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Existing row and column control", "bbox": {"l": 97.687859, "t": 173.33471999999995, "r": 301.46902, "b": 185.32275000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 136.79999, "t": 199.48870999999997, "r": 541.56738, "b": 256.70099000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9858148097991943, "cells": [{"id": 11, "text": "Some IBM i clients have tried augmenting the all-or-nothing object-level security with SQL ", "bbox": {"l": 136.8, "t": 199.48870999999997, "r": 534.90112, "b": 208.70172000000002, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "views (or logical files) and application logic, as shown in Figure 1-2. However, ", "bbox": {"l": 136.8, "t": 211.48852999999997, "r": 480.47281000000004, "b": 220.70154000000002, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "application-based logic is easy to bypass with all of the different data access interfaces that ", "bbox": {"l": 136.8, "t": 223.48834, "r": 541.56738, "b": 232.70135000000005, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "are provided by the IBM i operating system, such as Open Database Connectivity (ODBC) ", "bbox": {"l": 136.8, "t": 235.48816, "r": 537.39423, "b": 244.70117000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "and System i Navigator.", "bbox": {"l": 136.79999, "t": 247.48798, "r": 242.24352000000002, "b": 256.70099000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 136.79999, "t": 269.50757, "r": 547.4408, "b": 314.72003, "coord_origin": "TOPLEFT"}, "confidence": 0.9875384569168091, "cells": [{"id": 16, "text": "Using SQL views to limit access to a subset of the data in a table also has its own set of ", "bbox": {"l": 136.79999, "t": 269.50757, "r": 526.88428, "b": 278.72058000000004, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "challenges. First, there is the complexity of managing all of the SQL view objects that are ", "bbox": {"l": 136.79999, "t": 281.50742, "r": 531.77087, "b": 290.7203999999999, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "used for securing data access. Second, scaling a view-based security solution can be difficult ", "bbox": {"l": 136.79999, "t": 293.50723000000005, "r": 547.4408, "b": 302.72021, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "as the amount of data grows and the number of users increases.", "bbox": {"l": 136.79999, "t": 305.50705, "r": 421.86725, "b": 314.72003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "text", "bbox": {"l": 136.79999, "t": 327.52661, "r": 547.23267, "b": 360.73923, "coord_origin": "TOPLEFT"}, "confidence": 0.9757603406906128, "cells": [{"id": 20, "text": "Even if you are willing to live with these performance and management issues, a user with ", "bbox": {"l": 136.79999, "t": 327.52661, "r": 536.46692, "b": 336.7395900000001, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "*ALLOBJ access still can directly access all of the data in the underlying DB2 table and easily ", "bbox": {"l": 136.79999, "t": 339.52643, "r": 547.23267, "b": 348.73941, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "bypass the security controls that are built into an SQL view.", "bbox": {"l": 136.79999, "t": 351.52624999999995, "r": 397.88553, "b": 360.73923, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "caption", "bbox": {"l": 136.8, "t": 691.818, "r": 316.44727, "b": 700.142998, "coord_origin": "TOPLEFT"}, "confidence": 0.9457826614379883, "cells": [{"id": 23, "text": "Figure 1-2 Existing row and column controls", "bbox": {"l": 136.8, "t": 691.818, "r": 316.44727, "b": 700.142998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "picture", "bbox": {"l": 135.92466735839844, "t": 375.9272155761719, "r": 546.4456176757812, "b": 688.6098022460938, "coord_origin": "TOPLEFT"}, "confidence": 0.9838991165161133, "cells": [{"id": 24, "text": "User with", "bbox": {"l": 180.95911, "t": 383.45612, "r": 209.08017, "b": 389.0784, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "*ALLOBJ access", "bbox": {"l": 170.00624, "t": 390.95251, "r": 220.10355, "b": 396.57480000000004, "coord_origin": "TOPLEFT"}}], "children": [{"id": 9, "label": "text", "bbox": {"l": 180.95911, "t": 383.45612, "r": 209.08017, "b": 389.0784, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "User with", "bbox": {"l": 180.95911, "t": 383.45612, "r": 209.08017, "b": 389.0784, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "text", "bbox": {"l": 170.00624, "t": 390.95251, "r": 220.10355, "b": 396.57480000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "*ALLOBJ access", "bbox": {"l": 170.00624, "t": 390.95251, "r": 220.10355, "b": 396.57480000000004, "coord_origin": "TOPLEFT"}}], "children": []}]}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_footer", "id": 8, "page_no": 6, "cluster": {"id": 8, "label": "page_footer", "bbox": {"l": 64.800003, "t": 754.848721, "r": 72.821999, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.8578535318374634, "cells": [{"id": 0, "text": "4 ", "bbox": {"l": 64.800003, "t": 754.848721, "r": 72.821999, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4"}, {"label": "page_footer", "id": 6, "page_no": 6, "cluster": {"id": 6, "label": "page_footer", "bbox": {"l": 87.840302, "t": 755.538002, "r": 328.72537, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.949161946773529, "cells": [{"id": 1, "text": "Row and Column Access Control Support in IBM DB2 for i", "bbox": {"l": 87.840302, "t": 755.538002, "r": 328.72537, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Row and Column Access Control Support in IBM DB2 for i"}, {"label": "text", "id": 1, "page_no": 6, "cluster": {"id": 1, "label": "text", "bbox": {"l": 136.8, "t": 71.50867000000005, "r": 544.30334, "b": 152.72058000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9872740507125854, "cells": [{"id": 2, "text": "Many businesses are trying to limit data access to a need-to-know basis. This security goal ", "bbox": {"l": 136.8, "t": 71.50867000000005, "r": 541.19006, "b": 80.72167999999999, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "means that users should be given access only to the minimum set of data that is required to ", "bbox": {"l": 136.8, "t": 83.50847999999996, "r": 544.30334, "b": 92.72149999999999, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "perform their job. Often, users with object-level access are given access to row and column ", "bbox": {"l": 136.8, "t": 95.50829999999996, "r": 540.94299, "b": 104.72131000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "values that are beyond what their business task requires because that object-level security ", "bbox": {"l": 136.80002, "t": 107.50811999999996, "r": 538.27454, "b": 116.72113000000002, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "provides an all-or-nothing solution. For example, object-level controls allow a manager to ", "bbox": {"l": 136.80002, "t": 119.50792999999999, "r": 530.23004, "b": 128.72095000000002, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "access data about all employees. Most security policies limit a manager to accessing data ", "bbox": {"l": 136.80002, "t": 131.50775, "r": 536.26263, "b": 140.72076000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "only for the employees that they manage.", "bbox": {"l": 136.80002, "t": 143.50757, "r": 319.04318, "b": 152.72058000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Many businesses are trying to limit data access to a need-to-know basis. This security goal means that users should be given access only to the minimum set of data that is required to perform their job. Often, users with object-level access are given access to row and column values that are beyond what their business task requires because that object-level security provides an all-or-nothing solution. For example, object-level controls allow a manager to access data about all employees. Most security policies limit a manager to accessing data only for the employees that they manage."}, {"label": "section_header", "id": 5, "page_no": 6, "cluster": {"id": 5, "label": "section_header", "bbox": {"l": 64.800003, "t": 173.33471999999995, "r": 301.46902, "b": 185.32275000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9626136422157288, "cells": [{"id": 9, "text": "1.3.1", "bbox": {"l": 64.800003, "t": 173.33471999999995, "r": 94.033653, "b": 185.32275000000004, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Existing row and column control", "bbox": {"l": 97.687859, "t": 173.33471999999995, "r": 301.46902, "b": 185.32275000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1.3.1 Existing row and column control"}, {"label": "text", "id": 2, "page_no": 6, "cluster": {"id": 2, "label": "text", "bbox": {"l": 136.79999, "t": 199.48870999999997, "r": 541.56738, "b": 256.70099000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9858148097991943, "cells": [{"id": 11, "text": "Some IBM i clients have tried augmenting the all-or-nothing object-level security with SQL ", "bbox": {"l": 136.8, "t": 199.48870999999997, "r": 534.90112, "b": 208.70172000000002, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "views (or logical files) and application logic, as shown in Figure 1-2. However, ", "bbox": {"l": 136.8, "t": 211.48852999999997, "r": 480.47281000000004, "b": 220.70154000000002, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "application-based logic is easy to bypass with all of the different data access interfaces that ", "bbox": {"l": 136.8, "t": 223.48834, "r": 541.56738, "b": 232.70135000000005, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "are provided by the IBM i operating system, such as Open Database Connectivity (ODBC) ", "bbox": {"l": 136.8, "t": 235.48816, "r": 537.39423, "b": 244.70117000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "and System i Navigator.", "bbox": {"l": 136.79999, "t": 247.48798, "r": 242.24352000000002, "b": 256.70099000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Some IBM i clients have tried augmenting the all-or-nothing object-level security with SQL views (or logical files) and application logic, as shown in Figure 1-2. However, application-based logic is easy to bypass with all of the different data access interfaces that are provided by the IBM i operating system, such as Open Database Connectivity (ODBC) and System i Navigator."}, {"label": "text", "id": 0, "page_no": 6, "cluster": {"id": 0, "label": "text", "bbox": {"l": 136.79999, "t": 269.50757, "r": 547.4408, "b": 314.72003, "coord_origin": "TOPLEFT"}, "confidence": 0.9875384569168091, "cells": [{"id": 16, "text": "Using SQL views to limit access to a subset of the data in a table also has its own set of ", "bbox": {"l": 136.79999, "t": 269.50757, "r": 526.88428, "b": 278.72058000000004, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "challenges. First, there is the complexity of managing all of the SQL view objects that are ", "bbox": {"l": 136.79999, "t": 281.50742, "r": 531.77087, "b": 290.7203999999999, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "used for securing data access. Second, scaling a view-based security solution can be difficult ", "bbox": {"l": 136.79999, "t": 293.50723000000005, "r": 547.4408, "b": 302.72021, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "as the amount of data grows and the number of users increases.", "bbox": {"l": 136.79999, "t": 305.50705, "r": 421.86725, "b": 314.72003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Using SQL views to limit access to a subset of the data in a table also has its own set of challenges. First, there is the complexity of managing all of the SQL view objects that are used for securing data access. Second, scaling a view-based security solution can be difficult as the amount of data grows and the number of users increases."}, {"label": "text", "id": 4, "page_no": 6, "cluster": {"id": 4, "label": "text", "bbox": {"l": 136.79999, "t": 327.52661, "r": 547.23267, "b": 360.73923, "coord_origin": "TOPLEFT"}, "confidence": 0.9757603406906128, "cells": [{"id": 20, "text": "Even if you are willing to live with these performance and management issues, a user with ", "bbox": {"l": 136.79999, "t": 327.52661, "r": 536.46692, "b": 336.7395900000001, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "*ALLOBJ access still can directly access all of the data in the underlying DB2 table and easily ", "bbox": {"l": 136.79999, "t": 339.52643, "r": 547.23267, "b": 348.73941, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "bypass the security controls that are built into an SQL view.", "bbox": {"l": 136.79999, "t": 351.52624999999995, "r": 397.88553, "b": 360.73923, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Even if you are willing to live with these performance and management issues, a user with *ALLOBJ access still can directly access all of the data in the underlying DB2 table and easily bypass the security controls that are built into an SQL view."}, {"label": "caption", "id": 7, "page_no": 6, "cluster": {"id": 7, "label": "caption", "bbox": {"l": 136.8, "t": 691.818, "r": 316.44727, "b": 700.142998, "coord_origin": "TOPLEFT"}, "confidence": 0.9457826614379883, "cells": [{"id": 23, "text": "Figure 1-2 Existing row and column controls", "bbox": {"l": 136.8, "t": 691.818, "r": 316.44727, "b": 700.142998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 1-2 Existing row and column controls"}, {"label": "picture", "id": 3, "page_no": 6, "cluster": {"id": 3, "label": "picture", "bbox": {"l": 135.92466735839844, "t": 375.9272155761719, "r": 546.4456176757812, "b": 688.6098022460938, "coord_origin": "TOPLEFT"}, "confidence": 0.9838991165161133, "cells": [{"id": 24, "text": "User with", "bbox": {"l": 180.95911, "t": 383.45612, "r": 209.08017, "b": 389.0784, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "*ALLOBJ access", "bbox": {"l": 170.00624, "t": 390.95251, "r": 220.10355, "b": 396.57480000000004, "coord_origin": "TOPLEFT"}}], "children": [{"id": 9, "label": "text", "bbox": {"l": 180.95911, "t": 383.45612, "r": 209.08017, "b": 389.0784, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "User with", "bbox": {"l": 180.95911, "t": 383.45612, "r": 209.08017, "b": 389.0784, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "text", "bbox": {"l": 170.00624, "t": 390.95251, "r": 220.10355, "b": 396.57480000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "*ALLOBJ access", "bbox": {"l": 170.00624, "t": 390.95251, "r": 220.10355, "b": 396.57480000000004, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "body": [{"label": "text", "id": 1, "page_no": 6, "cluster": {"id": 1, "label": "text", "bbox": {"l": 136.8, "t": 71.50867000000005, "r": 544.30334, "b": 152.72058000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9872740507125854, "cells": [{"id": 2, "text": "Many businesses are trying to limit data access to a need-to-know basis. This security goal ", "bbox": {"l": 136.8, "t": 71.50867000000005, "r": 541.19006, "b": 80.72167999999999, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "means that users should be given access only to the minimum set of data that is required to ", "bbox": {"l": 136.8, "t": 83.50847999999996, "r": 544.30334, "b": 92.72149999999999, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "perform their job. Often, users with object-level access are given access to row and column ", "bbox": {"l": 136.8, "t": 95.50829999999996, "r": 540.94299, "b": 104.72131000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "values that are beyond what their business task requires because that object-level security ", "bbox": {"l": 136.80002, "t": 107.50811999999996, "r": 538.27454, "b": 116.72113000000002, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "provides an all-or-nothing solution. For example, object-level controls allow a manager to ", "bbox": {"l": 136.80002, "t": 119.50792999999999, "r": 530.23004, "b": 128.72095000000002, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "access data about all employees. Most security policies limit a manager to accessing data ", "bbox": {"l": 136.80002, "t": 131.50775, "r": 536.26263, "b": 140.72076000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "only for the employees that they manage.", "bbox": {"l": 136.80002, "t": 143.50757, "r": 319.04318, "b": 152.72058000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Many businesses are trying to limit data access to a need-to-know basis. This security goal means that users should be given access only to the minimum set of data that is required to perform their job. Often, users with object-level access are given access to row and column values that are beyond what their business task requires because that object-level security provides an all-or-nothing solution. For example, object-level controls allow a manager to access data about all employees. Most security policies limit a manager to accessing data only for the employees that they manage."}, {"label": "section_header", "id": 5, "page_no": 6, "cluster": {"id": 5, "label": "section_header", "bbox": {"l": 64.800003, "t": 173.33471999999995, "r": 301.46902, "b": 185.32275000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9626136422157288, "cells": [{"id": 9, "text": "1.3.1", "bbox": {"l": 64.800003, "t": 173.33471999999995, "r": 94.033653, "b": 185.32275000000004, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Existing row and column control", "bbox": {"l": 97.687859, "t": 173.33471999999995, "r": 301.46902, "b": 185.32275000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1.3.1 Existing row and column control"}, {"label": "text", "id": 2, "page_no": 6, "cluster": {"id": 2, "label": "text", "bbox": {"l": 136.79999, "t": 199.48870999999997, "r": 541.56738, "b": 256.70099000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9858148097991943, "cells": [{"id": 11, "text": "Some IBM i clients have tried augmenting the all-or-nothing object-level security with SQL ", "bbox": {"l": 136.8, "t": 199.48870999999997, "r": 534.90112, "b": 208.70172000000002, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "views (or logical files) and application logic, as shown in Figure 1-2. However, ", "bbox": {"l": 136.8, "t": 211.48852999999997, "r": 480.47281000000004, "b": 220.70154000000002, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "application-based logic is easy to bypass with all of the different data access interfaces that ", "bbox": {"l": 136.8, "t": 223.48834, "r": 541.56738, "b": 232.70135000000005, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "are provided by the IBM i operating system, such as Open Database Connectivity (ODBC) ", "bbox": {"l": 136.8, "t": 235.48816, "r": 537.39423, "b": 244.70117000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "and System i Navigator.", "bbox": {"l": 136.79999, "t": 247.48798, "r": 242.24352000000002, "b": 256.70099000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Some IBM i clients have tried augmenting the all-or-nothing object-level security with SQL views (or logical files) and application logic, as shown in Figure 1-2. However, application-based logic is easy to bypass with all of the different data access interfaces that are provided by the IBM i operating system, such as Open Database Connectivity (ODBC) and System i Navigator."}, {"label": "text", "id": 0, "page_no": 6, "cluster": {"id": 0, "label": "text", "bbox": {"l": 136.79999, "t": 269.50757, "r": 547.4408, "b": 314.72003, "coord_origin": "TOPLEFT"}, "confidence": 0.9875384569168091, "cells": [{"id": 16, "text": "Using SQL views to limit access to a subset of the data in a table also has its own set of ", "bbox": {"l": 136.79999, "t": 269.50757, "r": 526.88428, "b": 278.72058000000004, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "challenges. First, there is the complexity of managing all of the SQL view objects that are ", "bbox": {"l": 136.79999, "t": 281.50742, "r": 531.77087, "b": 290.7203999999999, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "used for securing data access. Second, scaling a view-based security solution can be difficult ", "bbox": {"l": 136.79999, "t": 293.50723000000005, "r": 547.4408, "b": 302.72021, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "as the amount of data grows and the number of users increases.", "bbox": {"l": 136.79999, "t": 305.50705, "r": 421.86725, "b": 314.72003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Using SQL views to limit access to a subset of the data in a table also has its own set of challenges. First, there is the complexity of managing all of the SQL view objects that are used for securing data access. Second, scaling a view-based security solution can be difficult as the amount of data grows and the number of users increases."}, {"label": "text", "id": 4, "page_no": 6, "cluster": {"id": 4, "label": "text", "bbox": {"l": 136.79999, "t": 327.52661, "r": 547.23267, "b": 360.73923, "coord_origin": "TOPLEFT"}, "confidence": 0.9757603406906128, "cells": [{"id": 20, "text": "Even if you are willing to live with these performance and management issues, a user with ", "bbox": {"l": 136.79999, "t": 327.52661, "r": 536.46692, "b": 336.7395900000001, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "*ALLOBJ access still can directly access all of the data in the underlying DB2 table and easily ", "bbox": {"l": 136.79999, "t": 339.52643, "r": 547.23267, "b": 348.73941, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "bypass the security controls that are built into an SQL view.", "bbox": {"l": 136.79999, "t": 351.52624999999995, "r": 397.88553, "b": 360.73923, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Even if you are willing to live with these performance and management issues, a user with *ALLOBJ access still can directly access all of the data in the underlying DB2 table and easily bypass the security controls that are built into an SQL view."}, {"label": "caption", "id": 7, "page_no": 6, "cluster": {"id": 7, "label": "caption", "bbox": {"l": 136.8, "t": 691.818, "r": 316.44727, "b": 700.142998, "coord_origin": "TOPLEFT"}, "confidence": 0.9457826614379883, "cells": [{"id": 23, "text": "Figure 1-2 Existing row and column controls", "bbox": {"l": 136.8, "t": 691.818, "r": 316.44727, "b": 700.142998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 1-2 Existing row and column controls"}, {"label": "picture", "id": 3, "page_no": 6, "cluster": {"id": 3, "label": "picture", "bbox": {"l": 135.92466735839844, "t": 375.9272155761719, "r": 546.4456176757812, "b": 688.6098022460938, "coord_origin": "TOPLEFT"}, "confidence": 0.9838991165161133, "cells": [{"id": 24, "text": "User with", "bbox": {"l": 180.95911, "t": 383.45612, "r": 209.08017, "b": 389.0784, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "*ALLOBJ access", "bbox": {"l": 170.00624, "t": 390.95251, "r": 220.10355, "b": 396.57480000000004, "coord_origin": "TOPLEFT"}}], "children": [{"id": 9, "label": "text", "bbox": {"l": 180.95911, "t": 383.45612, "r": 209.08017, "b": 389.0784, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "User with", "bbox": {"l": 180.95911, "t": 383.45612, "r": 209.08017, "b": 389.0784, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "text", "bbox": {"l": 170.00624, "t": 390.95251, "r": 220.10355, "b": 396.57480000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "*ALLOBJ access", "bbox": {"l": 170.00624, "t": 390.95251, "r": 220.10355, "b": 396.57480000000004, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "headers": [{"label": "page_footer", "id": 8, "page_no": 6, "cluster": {"id": 8, "label": "page_footer", "bbox": {"l": 64.800003, "t": 754.848721, "r": 72.821999, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.8578535318374634, "cells": [{"id": 0, "text": "4 ", "bbox": {"l": 64.800003, "t": 754.848721, "r": 72.821999, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4"}, {"label": "page_footer", "id": 6, "page_no": 6, "cluster": {"id": 6, "label": "page_footer", "bbox": {"l": 87.840302, "t": 755.538002, "r": 328.72537, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.949161946773529, "cells": [{"id": 1, "text": "Row and Column Access Control Support in IBM DB2 for i", "bbox": {"l": 87.840302, "t": 755.538002, "r": 328.72537, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Row and Column Access Control Support in IBM DB2 for i"}]}}, {"page_no": 7, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "10 ", "bbox": {"l": 64.800003, "t": 754.848721, "r": 78.402, "b": 764.06172, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Row and Column Access Control Support in IBM DB2 for i", "bbox": {"l": 93.420303, "t": 755.538002, "r": 334.42142, "b": 763.863001, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "2.1.6", "bbox": {"l": 64.800003, "t": 71.33471999999995, "r": 94.081459, "b": 83.32275000000004, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Change Function Usage CL command", "bbox": {"l": 97.741661, "t": 71.33471999999995, "r": 335.49551, "b": 83.32275000000004, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "The following CL commands can be used to work with, display, or change function usage IDs:", "bbox": {"l": 136.8, "t": 97.48870999999997, "r": 547.28442, "b": 106.70172000000014, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "GLYPH<SM590000>", "bbox": {"l": 136.8, "t": 114.67767000000003, "r": 141.78, "b": 123.45245, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Work Function Usage (", "bbox": {"l": 151.20016, "t": 114.52826000000005, "r": 253.26227000000003, "b": 123.74126999999999, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "WRKFCNUSG", "bbox": {"l": 253.26028, "t": 114.67767000000003, "r": 298.1998, "b": 123.50225999999998, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": ")", "bbox": {"l": 298.20081, "t": 114.52826000000005, "r": 301.51749, "b": 123.74126999999999, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "GLYPH<SM590000>", "bbox": {"l": 136.80099, "t": 126.67749000000003, "r": 141.78099, "b": 135.45227, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Change Function Usage (", "bbox": {"l": 151.20116, "t": 126.52808000000005, "r": 265.13354, "b": 135.74108999999999, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "CHGFCNUSG", "bbox": {"l": 265.08081, "t": 126.67749000000003, "r": 310.02032, "b": 135.50207999999998, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": ")", "bbox": {"l": 310.08109, "t": 126.52808000000005, "r": 313.39777, "b": 135.74108999999999, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "GLYPH<SM590000>", "bbox": {"l": 136.80098, "t": 138.67731000000003, "r": 141.78098, "b": 147.45209, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Display Function Usage (", "bbox": {"l": 151.20114, "t": 138.52788999999996, "r": 262.5639, "b": 147.74090999999999, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "DSPFCNUSG", "bbox": {"l": 262.56091, "t": 138.67731000000003, "r": 307.50043, "b": 147.50189, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": ")", "bbox": {"l": 307.50043, "t": 138.52788999999996, "r": 310.81711, "b": 147.74090999999999, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "For example, the following ", "bbox": {"l": 136.79997, "t": 160.48766999999998, "r": 255.09984000000003, "b": 169.70068000000003, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "CHGFCNUSG", "bbox": {"l": 255.00027, "t": 160.63707999999997, "r": 299.99957, "b": 169.46167000000003, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": " command shows granting authorization to user ", "bbox": {"l": 300.00055, "t": 160.48766999999998, "r": 512.53802, "b": 169.70068000000003, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "HBEDOYA to administer and manage RCAC rules:", "bbox": {"l": 136.80096, "t": 172.48748999999998, "r": 360.41989, "b": 181.70050000000003, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "CHGFCNUSG FCNID(QIBM_DB_SECADM) USER(HBEDOYA) USAGE(*ALLOWED)", "bbox": {"l": 136.80096, "t": 189.67645000000005, "r": 441.59686, "b": 198.45123, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "2.1.7", "bbox": {"l": 64.800003, "t": 219.35468000000003, "r": 93.757614, "b": 231.34271, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Verifying function usage IDs for RCAC with the FUNCTION_USAGE view", "bbox": {"l": 97.377296, "t": 219.35468000000003, "r": 544.47546, "b": 231.34271, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "The FUNCTION_USAGE view contains function usage configuration details. Table 2-1 ", "bbox": {"l": 136.8, "t": 245.50867000000005, "r": 519.51794, "b": 254.72168, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "describes the columns in the FUNCTION_USAGE view.", "bbox": {"l": 136.8, "t": 257.50847999999996, "r": 382.94443, "b": 266.7215, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "Table 2-1 FUNCTION_USAGE view", "bbox": {"l": 136.8, "t": 279.55798000000004, "r": 283.96805, "b": 287.88300000000004, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "To discover who has authorization to define and manage RCAC, you can use the query that is ", "bbox": {"l": 136.8, "t": 452.50872999999996, "r": 547.2804, "b": 461.72171, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "shown in Example 2-1.", "bbox": {"l": 136.8, "t": 464.50854, "r": 237.76951999999997, "b": 473.72153, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Example 2-1 Query to determine who has authority to define and manage RCAC", "bbox": {"l": 136.8, "t": 486.55798, "r": 462.35419, "b": 494.883, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "SELECT", "bbox": {"l": 136.8, "t": 503.65802, "r": 171.26956, "b": 512.4328, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "function_id,", "bbox": {"l": 182.75941, "t": 503.65802, "r": 251.69853, "b": 512.4328, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "user_name,", "bbox": {"l": 166.78244, "t": 515.6578400000001, "r": 241.73852999999997, "b": 524.43262, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "usage,", "bbox": {"l": 170.75961, "t": 527.65765, "r": 221.69901999999996, "b": 536.43242, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "user_type", "bbox": {"l": 167.53809, "t": 539.65747, "r": 236.69878, "b": 548.43222, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "FROM", "bbox": {"l": 136.8, "t": 551.65727, "r": 160.59396, "b": 560.43202, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "function_usage", "bbox": {"l": 178.43944, "t": 551.65727, "r": 261.71829, "b": 560.43202, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "WHERE", "bbox": {"l": 136.8, "t": 563.65707, "r": 162.44176, "b": 572.43182, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "function_id=\u2019QIBM_DB_SECADM\u2019", "bbox": {"l": 177.8268, "t": 563.65707, "r": 331.67731, "b": 572.43182, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "ORDER BY", "bbox": {"l": 136.8, "t": 575.65688, "r": 178.77542, "b": 584.43163, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "user_name;", "bbox": {"l": 189.26929, "t": 575.65688, "r": 241.73856, "b": 584.43163, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "2.2", "bbox": {"l": 64.800003, "t": 620.22063, "r": 87.569839, "b": 634.98363, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "Separation of duties", "bbox": {"l": 92.123802, "t": 620.22063, "r": 249.59605000000002, "b": 634.98363, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Separation of duties helps businesses comply with industry regulations or organizational ", "bbox": {"l": 136.8, "t": 652.54872, "r": 529.09357, "b": 661.76172, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "requirements and simplifies the management of authorities. Separation of duties is commonly ", "bbox": {"l": 136.8, "t": 664.54852, "r": 547.22345, "b": 673.76153, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "used to prevent fraudulent activities or errors by a single person. It provides the ability for ", "bbox": {"l": 136.8, "t": 676.54833, "r": 530.89716, "b": 685.76134, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "administrative functions to be divided across individuals without overlapping responsibilities, ", "bbox": {"l": 136.80002, "t": 688.54814, "r": 544.33832, "b": 697.7611469999999, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "so that one user does not possess unlimited authority, such as with the *ALLOBJ authority.", "bbox": {"l": 136.80002, "t": 700.547951, "r": 536.28363, "b": 709.760956, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Column name", "bbox": {"l": 142.8, "t": 296.5379899999999, "r": 202.245, "b": 304.86301, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "Data type", "bbox": {"l": 216.80878999999996, "t": 296.5379899999999, "r": 257.21069, "b": 304.86301, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Description", "bbox": {"l": 289.47479, "t": 296.5379899999999, "r": 338.89468, "b": 304.86301, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "FUNCTION_ID", "bbox": {"l": 142.8, "t": 315.55771, "r": 203.2323, "b": 323.88272, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "VARCHAR(30)", "bbox": {"l": 216.7854, "t": 315.55771, "r": 276.0036, "b": 323.88272, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "ID of the function.", "bbox": {"l": 289.4577, "t": 315.55771, "r": 359.85394, "b": 323.88272, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "USER_NAME", "bbox": {"l": 142.8, "t": 334.51801, "r": 198.6693, "b": 342.84302, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "VARCHAR(10)", "bbox": {"l": 216.74129999999997, "t": 334.51801, "r": 275.92349, "b": 342.84302, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Name of the user profile that has a usage setting for this ", "bbox": {"l": 289.38208, "t": 334.51801, "r": 515.05359, "b": 342.84302, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "function.", "bbox": {"l": 289.4397, "t": 345.55832, "r": 323.43362, "b": 353.88333, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "USAGE", "bbox": {"l": 142.79999, "t": 364.51862, "r": 173.98318, "b": 372.84363, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "VARCHAR(7)", "bbox": {"l": 216.77367999999998, "t": 364.51862, "r": 270.97977, "b": 372.84363, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Usage setting:", "bbox": {"l": 289.41626, "t": 364.51862, "r": 346.88757, "b": 372.84363, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 375.69394000000005, "r": 293.9397, "b": 383.62292, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "ALLOWED: The user profile is allowed to use the function.", "bbox": {"l": 303.83969, "t": 375.55893, "r": 535.16766, "b": 383.88394, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 386.67395, "r": 293.9397, "b": 394.60294, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "DENIED: The user profile is not allowed to use the function.", "bbox": {"l": 303.83969, "t": 386.53894, "r": 539.10712, "b": 394.86395, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "USER_TYPE", "bbox": {"l": 142.8, "t": 405.55865, "r": 196.2249, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "VARCHAR(5)", "bbox": {"l": 216.75211, "t": 405.55865, "r": 270.99872, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "Type of user profile:", "bbox": {"l": 289.43161, "t": 405.55865, "r": 367.8009, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 416.67368000000005, "r": 293.9397, "b": 424.60266, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "USER: The user profile is a user.", "bbox": {"l": 303.83969, "t": 416.53867, "r": 434.78159, "b": 424.86368, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 427.65369, "r": 293.9397, "b": 435.58267000000006, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "GROUP: The user profile is a group.", "bbox": {"l": 303.83969, "t": 427.51868, "r": 448.11963000000003, "b": 435.84369, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 14, "label": "page_footer", "bbox": {"l": 64.800003, "t": 754.848721, "r": 78.402, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.9166396856307983, "cells": [{"id": 0, "text": "10 ", "bbox": {"l": 64.800003, "t": 754.848721, "r": 78.402, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "page_footer", "bbox": {"l": 93.420303, "t": 755.538002, "r": 334.42142, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9530044198036194, "cells": [{"id": 1, "text": "Row and Column Access Control Support in IBM DB2 for i", "bbox": {"l": 93.420303, "t": 755.538002, "r": 334.42142, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "section_header", "bbox": {"l": 64.800003, "t": 71.33471999999995, "r": 335.49551, "b": 83.32275000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9697521328926086, "cells": [{"id": 2, "text": "2.1.6", "bbox": {"l": 64.800003, "t": 71.33471999999995, "r": 94.081459, "b": 83.32275000000004, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Change Function Usage CL command", "bbox": {"l": 97.741661, "t": 71.33471999999995, "r": 335.49551, "b": 83.32275000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 136.8, "t": 97.48870999999997, "r": 547.28442, "b": 106.70172000000014, "coord_origin": "TOPLEFT"}, "confidence": 0.9551584124565125, "cells": [{"id": 4, "text": "The following CL commands can be used to work with, display, or change function usage IDs:", "bbox": {"l": 136.8, "t": 97.48870999999997, "r": 547.28442, "b": 106.70172000000014, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "list_item", "bbox": {"l": 136.8, "t": 114.52826000000005, "r": 301.51749, "b": 123.74126999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9410832524299622, "cells": [{"id": 5, "text": "GLYPH<SM590000>", "bbox": {"l": 136.8, "t": 114.67767000000003, "r": 141.78, "b": 123.45245, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Work Function Usage (", "bbox": {"l": 151.20016, "t": 114.52826000000005, "r": 253.26227000000003, "b": 123.74126999999999, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "WRKFCNUSG", "bbox": {"l": 253.26028, "t": 114.67767000000003, "r": 298.1998, "b": 123.50225999999998, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": ")", "bbox": {"l": 298.20081, "t": 114.52826000000005, "r": 301.51749, "b": 123.74126999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "list_item", "bbox": {"l": 136.80099, "t": 126.52808000000005, "r": 313.39777, "b": 135.74108999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9418092966079712, "cells": [{"id": 9, "text": "GLYPH<SM590000>", "bbox": {"l": 136.80099, "t": 126.67749000000003, "r": 141.78099, "b": 135.45227, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Change Function Usage (", "bbox": {"l": 151.20116, "t": 126.52808000000005, "r": 265.13354, "b": 135.74108999999999, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "CHGFCNUSG", "bbox": {"l": 265.08081, "t": 126.67749000000003, "r": 310.02032, "b": 135.50207999999998, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": ")", "bbox": {"l": 310.08109, "t": 126.52808000000005, "r": 313.39777, "b": 135.74108999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "list_item", "bbox": {"l": 136.80098, "t": 138.52788999999996, "r": 310.81711, "b": 147.74090999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9562349915504456, "cells": [{"id": 13, "text": "GLYPH<SM590000>", "bbox": {"l": 136.80098, "t": 138.67731000000003, "r": 141.78098, "b": 147.45209, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Display Function Usage (", "bbox": {"l": 151.20114, "t": 138.52788999999996, "r": 262.5639, "b": 147.74090999999999, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "DSPFCNUSG", "bbox": {"l": 262.56091, "t": 138.67731000000003, "r": 307.50043, "b": 147.50189, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": ")", "bbox": {"l": 307.50043, "t": 138.52788999999996, "r": 310.81711, "b": 147.74090999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "text", "bbox": {"l": 136.79997, "t": 160.48766999999998, "r": 512.53802, "b": 181.70050000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9682500958442688, "cells": [{"id": 17, "text": "For example, the following ", "bbox": {"l": 136.79997, "t": 160.48766999999998, "r": 255.09984000000003, "b": 169.70068000000003, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "CHGFCNUSG", "bbox": {"l": 255.00027, "t": 160.63707999999997, "r": 299.99957, "b": 169.46167000000003, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": " command shows granting authorization to user ", "bbox": {"l": 300.00055, "t": 160.48766999999998, "r": 512.53802, "b": 169.70068000000003, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "HBEDOYA to administer and manage RCAC rules:", "bbox": {"l": 136.80096, "t": 172.48748999999998, "r": 360.41989, "b": 181.70050000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 136.80096, "t": 189.67645000000005, "r": 441.59686, "b": 198.45123, "coord_origin": "TOPLEFT"}, "confidence": 0.905712902545929, "cells": [{"id": 21, "text": "CHGFCNUSG FCNID(QIBM_DB_SECADM) USER(HBEDOYA) USAGE(*ALLOWED)", "bbox": {"l": 136.80096, "t": 189.67645000000005, "r": 441.59686, "b": 198.45123, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "section_header", "bbox": {"l": 64.800003, "t": 219.35468000000003, "r": 544.47546, "b": 231.34271, "coord_origin": "TOPLEFT"}, "confidence": 0.9636710286140442, "cells": [{"id": 22, "text": "2.1.7", "bbox": {"l": 64.800003, "t": 219.35468000000003, "r": 93.757614, "b": 231.34271, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Verifying function usage IDs for RCAC with the FUNCTION_USAGE view", "bbox": {"l": 97.377296, "t": 219.35468000000003, "r": 544.47546, "b": 231.34271, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 136.8, "t": 245.50867000000005, "r": 519.51794, "b": 266.7215, "coord_origin": "TOPLEFT"}, "confidence": 0.9737311601638794, "cells": [{"id": 24, "text": "The FUNCTION_USAGE view contains function usage configuration details. Table 2-1 ", "bbox": {"l": 136.8, "t": 245.50867000000005, "r": 519.51794, "b": 254.72168, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "describes the columns in the FUNCTION_USAGE view.", "bbox": {"l": 136.8, "t": 257.50847999999996, "r": 382.94443, "b": 266.7215, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "caption", "bbox": {"l": 136.8, "t": 279.55798000000004, "r": 283.96805, "b": 287.88300000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9196997284889221, "cells": [{"id": 26, "text": "Table 2-1 FUNCTION_USAGE view", "bbox": {"l": 136.8, "t": 279.55798000000004, "r": 283.96805, "b": 287.88300000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "text", "bbox": {"l": 136.8, "t": 452.50872999999996, "r": 547.2804, "b": 473.72153, "coord_origin": "TOPLEFT"}, "confidence": 0.9647753834724426, "cells": [{"id": 27, "text": "To discover who has authorization to define and manage RCAC, you can use the query that is ", "bbox": {"l": 136.8, "t": 452.50872999999996, "r": 547.2804, "b": 461.72171, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "shown in Example 2-1.", "bbox": {"l": 136.8, "t": 464.50854, "r": 237.76951999999997, "b": 473.72153, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "caption", "bbox": {"l": 136.8, "t": 486.55798, "r": 462.35419, "b": 494.883, "coord_origin": "TOPLEFT"}, "confidence": 0.8159966468811035, "cells": [{"id": 29, "text": "Example 2-1 Query to determine who has authority to define and manage RCAC", "bbox": {"l": 136.8, "t": 486.55798, "r": 462.35419, "b": 494.883, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "key_value_region", "bbox": {"l": 136.8, "t": 503.65802, "r": 331.67731, "b": 584.43163, "coord_origin": "TOPLEFT"}, "confidence": 0.5808269381523132, "cells": [{"id": 30, "text": "SELECT", "bbox": {"l": 136.8, "t": 503.65802, "r": 171.26956, "b": 512.4328, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "function_id,", "bbox": {"l": 182.75941, "t": 503.65802, "r": 251.69853, "b": 512.4328, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "user_name,", "bbox": {"l": 166.78244, "t": 515.6578400000001, "r": 241.73852999999997, "b": 524.43262, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "usage,", "bbox": {"l": 170.75961, "t": 527.65765, "r": 221.69901999999996, "b": 536.43242, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "user_type", "bbox": {"l": 167.53809, "t": 539.65747, "r": 236.69878, "b": 548.43222, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "FROM", "bbox": {"l": 136.8, "t": 551.65727, "r": 160.59396, "b": 560.43202, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "function_usage", "bbox": {"l": 178.43944, "t": 551.65727, "r": 261.71829, "b": 560.43202, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "WHERE", "bbox": {"l": 136.8, "t": 563.65707, "r": 162.44176, "b": 572.43182, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "function_id=\u2019QIBM_DB_SECADM\u2019", "bbox": {"l": 177.8268, "t": 563.65707, "r": 331.67731, "b": 572.43182, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "ORDER BY", "bbox": {"l": 136.8, "t": 575.65688, "r": 178.77542, "b": 584.43163, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "user_name;", "bbox": {"l": 189.26929, "t": 575.65688, "r": 241.73856, "b": 584.43163, "coord_origin": "TOPLEFT"}}], "children": [{"id": 19, "label": "text", "bbox": {"l": 136.8, "t": 503.65802, "r": 171.26956, "b": 512.4328, "coord_origin": "TOPLEFT"}, "confidence": 0.5631120204925537, "cells": [{"id": 30, "text": "SELECT", "bbox": {"l": 136.8, "t": 503.65802, "r": 171.26956, "b": 512.4328, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 182.75941, "t": 503.65802, "r": 251.69853, "b": 512.4328, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "function_id,", "bbox": {"l": 182.75941, "t": 503.65802, "r": 251.69853, "b": 512.4328, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 166.78244, "t": 515.6578400000001, "r": 241.73852999999997, "b": 524.43262, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "user_name,", "bbox": {"l": 166.78244, "t": 515.6578400000001, "r": 241.73852999999997, "b": 524.43262, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 170.75961, "t": 527.65765, "r": 221.69901999999996, "b": 536.43242, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "usage,", "bbox": {"l": 170.75961, "t": 527.65765, "r": 221.69901999999996, "b": 536.43242, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 167.53809, "t": 539.65747, "r": 236.69878, "b": 548.43222, "coord_origin": "TOPLEFT"}, "confidence": 0.5346829891204834, "cells": [{"id": 34, "text": "user_type", "bbox": {"l": 167.53809, "t": 539.65747, "r": 236.69878, "b": 548.43222, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 136.8, "t": 551.65727, "r": 160.59396, "b": 560.43202, "coord_origin": "TOPLEFT"}, "confidence": 0.5818389058113098, "cells": [{"id": 35, "text": "FROM", "bbox": {"l": 136.8, "t": 551.65727, "r": 160.59396, "b": 560.43202, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 178.43944, "t": 551.65727, "r": 261.71829, "b": 560.43202, "coord_origin": "TOPLEFT"}, "confidence": 0.5035732388496399, "cells": [{"id": 36, "text": "function_usage", "bbox": {"l": 178.43944, "t": 551.65727, "r": 261.71829, "b": 560.43202, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 136.8, "t": 563.65707, "r": 162.44176, "b": 572.43182, "coord_origin": "TOPLEFT"}, "confidence": 0.5340272188186646, "cells": [{"id": 37, "text": "WHERE", "bbox": {"l": 136.8, "t": 563.65707, "r": 162.44176, "b": 572.43182, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 177.8268, "t": 563.65707, "r": 331.67731, "b": 572.43182, "coord_origin": "TOPLEFT"}, "confidence": 0.5171727538108826, "cells": [{"id": 38, "text": "function_id=\u2019QIBM_DB_SECADM\u2019", "bbox": {"l": 177.8268, "t": 563.65707, "r": 331.67731, "b": 572.43182, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 136.8, "t": 575.65688, "r": 178.77542, "b": 584.43163, "coord_origin": "TOPLEFT"}, "confidence": 0.537347137928009, "cells": [{"id": 39, "text": "ORDER BY", "bbox": {"l": 136.8, "t": 575.65688, "r": 178.77542, "b": 584.43163, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 189.26929, "t": 575.65688, "r": 241.73856, "b": 584.43163, "coord_origin": "TOPLEFT"}, "confidence": 0.5167021751403809, "cells": [{"id": 40, "text": "user_name;", "bbox": {"l": 189.26929, "t": 575.65688, "r": 241.73856, "b": 584.43163, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 5, "label": "section_header", "bbox": {"l": 64.800003, "t": 620.22063, "r": 249.59605000000002, "b": 634.98363, "coord_origin": "TOPLEFT"}, "confidence": 0.9656103849411011, "cells": [{"id": 41, "text": "2.2", "bbox": {"l": 64.800003, "t": 620.22063, "r": 87.569839, "b": 634.98363, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "Separation of duties", "bbox": {"l": 92.123802, "t": 620.22063, "r": 249.59605000000002, "b": 634.98363, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 136.8, "t": 652.54872, "r": 547.22345, "b": 709.760956, "coord_origin": "TOPLEFT"}, "confidence": 0.9853070974349976, "cells": [{"id": 43, "text": "Separation of duties helps businesses comply with industry regulations or organizational ", "bbox": {"l": 136.8, "t": 652.54872, "r": 529.09357, "b": 661.76172, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "requirements and simplifies the management of authorities. Separation of duties is commonly ", "bbox": {"l": 136.8, "t": 664.54852, "r": 547.22345, "b": 673.76153, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "used to prevent fraudulent activities or errors by a single person. It provides the ability for ", "bbox": {"l": 136.8, "t": 676.54833, "r": 530.89716, "b": 685.76134, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "administrative functions to be divided across individuals without overlapping responsibilities, ", "bbox": {"l": 136.80002, "t": 688.54814, "r": 544.33832, "b": 697.7611469999999, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "so that one user does not possess unlimited authority, such as with the *ALLOBJ authority.", "bbox": {"l": 136.80002, "t": 700.547951, "r": 536.28363, "b": 709.760956, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "table", "bbox": {"l": 135.52462768554688, "t": 289.7252197265625, "r": 545.8714599609375, "b": 442.050537109375, "coord_origin": "TOPLEFT"}, "confidence": 0.9851690530776978, "cells": [{"id": 48, "text": "Column name", "bbox": {"l": 142.8, "t": 296.5379899999999, "r": 202.245, "b": 304.86301, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "Data type", "bbox": {"l": 216.80878999999996, "t": 296.5379899999999, "r": 257.21069, "b": 304.86301, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Description", "bbox": {"l": 289.47479, "t": 296.5379899999999, "r": 338.89468, "b": 304.86301, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "FUNCTION_ID", "bbox": {"l": 142.8, "t": 315.55771, "r": 203.2323, "b": 323.88272, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "VARCHAR(30)", "bbox": {"l": 216.7854, "t": 315.55771, "r": 276.0036, "b": 323.88272, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "ID of the function.", "bbox": {"l": 289.4577, "t": 315.55771, "r": 359.85394, "b": 323.88272, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "USER_NAME", "bbox": {"l": 142.8, "t": 334.51801, "r": 198.6693, "b": 342.84302, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "VARCHAR(10)", "bbox": {"l": 216.74129999999997, "t": 334.51801, "r": 275.92349, "b": 342.84302, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Name of the user profile that has a usage setting for this ", "bbox": {"l": 289.38208, "t": 334.51801, "r": 515.05359, "b": 342.84302, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "function.", "bbox": {"l": 289.4397, "t": 345.55832, "r": 323.43362, "b": 353.88333, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "USAGE", "bbox": {"l": 142.79999, "t": 364.51862, "r": 173.98318, "b": 372.84363, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "VARCHAR(7)", "bbox": {"l": 216.77367999999998, "t": 364.51862, "r": 270.97977, "b": 372.84363, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Usage setting:", "bbox": {"l": 289.41626, "t": 364.51862, "r": 346.88757, "b": 372.84363, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 375.69394000000005, "r": 293.9397, "b": 383.62292, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "ALLOWED: The user profile is allowed to use the function.", "bbox": {"l": 303.83969, "t": 375.55893, "r": 535.16766, "b": 383.88394, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 386.67395, "r": 293.9397, "b": 394.60294, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "DENIED: The user profile is not allowed to use the function.", "bbox": {"l": 303.83969, "t": 386.53894, "r": 539.10712, "b": 394.86395, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "USER_TYPE", "bbox": {"l": 142.8, "t": 405.55865, "r": 196.2249, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "VARCHAR(5)", "bbox": {"l": 216.75211, "t": 405.55865, "r": 270.99872, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "Type of user profile:", "bbox": {"l": 289.43161, "t": 405.55865, "r": 367.8009, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 416.67368000000005, "r": 293.9397, "b": 424.60266, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "USER: The user profile is a user.", "bbox": {"l": 303.83969, "t": 416.53867, "r": 434.78159, "b": 424.86368, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 427.65369, "r": 293.9397, "b": 435.58267000000006, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "GROUP: The user profile is a group.", "bbox": {"l": 303.83969, "t": 427.51868, "r": 448.11963000000003, "b": 435.84369, "coord_origin": "TOPLEFT"}}], "children": [{"id": 31, "label": "text", "bbox": {"l": 142.8, "t": 296.5379899999999, "r": 202.245, "b": 304.86301, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "Column name", "bbox": {"l": 142.8, "t": 296.5379899999999, "r": 202.245, "b": 304.86301, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 216.80878999999996, "t": 296.5379899999999, "r": 257.21069, "b": 304.86301, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "Data type", "bbox": {"l": 216.80878999999996, "t": 296.5379899999999, "r": 257.21069, "b": 304.86301, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 289.47479, "t": 296.5379899999999, "r": 338.89468, "b": 304.86301, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "Description", "bbox": {"l": 289.47479, "t": 296.5379899999999, "r": 338.89468, "b": 304.86301, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 142.8, "t": 315.55771, "r": 203.2323, "b": 323.88272, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "FUNCTION_ID", "bbox": {"l": 142.8, "t": 315.55771, "r": 203.2323, "b": 323.88272, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 216.7854, "t": 315.55771, "r": 276.0036, "b": 323.88272, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "VARCHAR(30)", "bbox": {"l": 216.7854, "t": 315.55771, "r": 276.0036, "b": 323.88272, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 289.4577, "t": 315.55771, "r": 359.85394, "b": 323.88272, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "ID of the function.", "bbox": {"l": 289.4577, "t": 315.55771, "r": 359.85394, "b": 323.88272, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 142.8, "t": 334.51801, "r": 198.6693, "b": 342.84302, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "USER_NAME", "bbox": {"l": 142.8, "t": 334.51801, "r": 198.6693, "b": 342.84302, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 216.74129999999997, "t": 334.51801, "r": 275.92349, "b": 342.84302, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "VARCHAR(10)", "bbox": {"l": 216.74129999999997, "t": 334.51801, "r": 275.92349, "b": 342.84302, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 289.38208, "t": 334.51801, "r": 515.05359, "b": 342.84302, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "Name of the user profile that has a usage setting for this ", "bbox": {"l": 289.38208, "t": 334.51801, "r": 515.05359, "b": 342.84302, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 289.4397, "t": 345.55832, "r": 323.43362, "b": 353.88333, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "function.", "bbox": {"l": 289.4397, "t": 345.55832, "r": 323.43362, "b": 353.88333, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 142.79999, "t": 364.51862, "r": 173.98318, "b": 372.84363, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "USAGE", "bbox": {"l": 142.79999, "t": 364.51862, "r": 173.98318, "b": 372.84363, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 216.77367999999998, "t": 364.51862, "r": 270.97977, "b": 372.84363, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "VARCHAR(7)", "bbox": {"l": 216.77367999999998, "t": 364.51862, "r": 270.97977, "b": 372.84363, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 289.41626, "t": 364.51862, "r": 346.88757, "b": 372.84363, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "Usage setting:", "bbox": {"l": 289.41626, "t": 364.51862, "r": 346.88757, "b": 372.84363, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 289.4397, "t": 375.69394000000005, "r": 293.9397, "b": 383.62292, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 375.69394000000005, "r": 293.9397, "b": 383.62292, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 303.83969, "t": 375.55893, "r": 535.16766, "b": 383.88394, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "ALLOWED: The user profile is allowed to use the function.", "bbox": {"l": 303.83969, "t": 375.55893, "r": 535.16766, "b": 383.88394, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 289.4397, "t": 386.67395, "r": 293.9397, "b": 394.60294, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 386.67395, "r": 293.9397, "b": 394.60294, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 303.83969, "t": 386.53894, "r": 539.10712, "b": 394.86395, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "DENIED: The user profile is not allowed to use the function.", "bbox": {"l": 303.83969, "t": 386.53894, "r": 539.10712, "b": 394.86395, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 142.8, "t": 405.55865, "r": 196.2249, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "USER_TYPE", "bbox": {"l": 142.8, "t": 405.55865, "r": 196.2249, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 216.75211, "t": 405.55865, "r": 270.99872, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "VARCHAR(5)", "bbox": {"l": 216.75211, "t": 405.55865, "r": 270.99872, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 289.43161, "t": 405.55865, "r": 367.8009, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "Type of user profile:", "bbox": {"l": 289.43161, "t": 405.55865, "r": 367.8009, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 289.4397, "t": 416.67368000000005, "r": 293.9397, "b": 424.60266, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 416.67368000000005, "r": 293.9397, "b": 424.60266, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 303.83969, "t": 416.53867, "r": 434.78159, "b": 424.86368, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "USER: The user profile is a user.", "bbox": {"l": 303.83969, "t": 416.53867, "r": 434.78159, "b": 424.86368, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 289.4397, "t": 427.65369, "r": 293.9397, "b": 435.58267000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 427.65369, "r": 293.9397, "b": 435.58267000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 303.83969, "t": 427.51868, "r": 448.11963000000003, "b": 435.84369, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "GROUP: The user profile is a group.", "bbox": {"l": 303.83969, "t": 427.51868, "r": 448.11963000000003, "b": 435.84369, "coord_origin": "TOPLEFT"}}], "children": []}]}]}, "tablestructure": {"table_map": {"1": {"label": "table", "id": 1, "page_no": 7, "cluster": {"id": 1, "label": "table", "bbox": {"l": 135.52462768554688, "t": 289.7252197265625, "r": 545.8714599609375, "b": 442.050537109375, "coord_origin": "TOPLEFT"}, "confidence": 0.9851690530776978, "cells": [{"id": 48, "text": "Column name", "bbox": {"l": 142.8, "t": 296.5379899999999, "r": 202.245, "b": 304.86301, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "Data type", "bbox": {"l": 216.80878999999996, "t": 296.5379899999999, "r": 257.21069, "b": 304.86301, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Description", "bbox": {"l": 289.47479, "t": 296.5379899999999, "r": 338.89468, "b": 304.86301, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "FUNCTION_ID", "bbox": {"l": 142.8, "t": 315.55771, "r": 203.2323, "b": 323.88272, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "VARCHAR(30)", "bbox": {"l": 216.7854, "t": 315.55771, "r": 276.0036, "b": 323.88272, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "ID of the function.", "bbox": {"l": 289.4577, "t": 315.55771, "r": 359.85394, "b": 323.88272, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "USER_NAME", "bbox": {"l": 142.8, "t": 334.51801, "r": 198.6693, "b": 342.84302, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "VARCHAR(10)", "bbox": {"l": 216.74129999999997, "t": 334.51801, "r": 275.92349, "b": 342.84302, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Name of the user profile that has a usage setting for this ", "bbox": {"l": 289.38208, "t": 334.51801, "r": 515.05359, "b": 342.84302, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "function.", "bbox": {"l": 289.4397, "t": 345.55832, "r": 323.43362, "b": 353.88333, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "USAGE", "bbox": {"l": 142.79999, "t": 364.51862, "r": 173.98318, "b": 372.84363, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "VARCHAR(7)", "bbox": {"l": 216.77367999999998, "t": 364.51862, "r": 270.97977, "b": 372.84363, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Usage setting:", "bbox": {"l": 289.41626, "t": 364.51862, "r": 346.88757, "b": 372.84363, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 375.69394000000005, "r": 293.9397, "b": 383.62292, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "ALLOWED: The user profile is allowed to use the function.", "bbox": {"l": 303.83969, "t": 375.55893, "r": 535.16766, "b": 383.88394, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 386.67395, "r": 293.9397, "b": 394.60294, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "DENIED: The user profile is not allowed to use the function.", "bbox": {"l": 303.83969, "t": 386.53894, "r": 539.10712, "b": 394.86395, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "USER_TYPE", "bbox": {"l": 142.8, "t": 405.55865, "r": 196.2249, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "VARCHAR(5)", "bbox": {"l": 216.75211, "t": 405.55865, "r": 270.99872, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "Type of user profile:", "bbox": {"l": 289.43161, "t": 405.55865, "r": 367.8009, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 416.67368000000005, "r": 293.9397, "b": 424.60266, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "USER: The user profile is a user.", "bbox": {"l": 303.83969, "t": 416.53867, "r": 434.78159, "b": 424.86368, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 427.65369, "r": 293.9397, "b": 435.58267000000006, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "GROUP: The user profile is a group.", "bbox": {"l": 303.83969, "t": 427.51868, "r": 448.11963000000003, "b": 435.84369, "coord_origin": "TOPLEFT"}}], "children": [{"id": 31, "label": "text", "bbox": {"l": 142.8, "t": 296.5379899999999, "r": 202.245, "b": 304.86301, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "Column name", "bbox": {"l": 142.8, "t": 296.5379899999999, "r": 202.245, "b": 304.86301, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 216.80878999999996, "t": 296.5379899999999, "r": 257.21069, "b": 304.86301, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "Data type", "bbox": {"l": 216.80878999999996, "t": 296.5379899999999, "r": 257.21069, "b": 304.86301, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 289.47479, "t": 296.5379899999999, "r": 338.89468, "b": 304.86301, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "Description", "bbox": {"l": 289.47479, "t": 296.5379899999999, "r": 338.89468, "b": 304.86301, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 142.8, "t": 315.55771, "r": 203.2323, "b": 323.88272, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "FUNCTION_ID", "bbox": {"l": 142.8, "t": 315.55771, "r": 203.2323, "b": 323.88272, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 216.7854, "t": 315.55771, "r": 276.0036, "b": 323.88272, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "VARCHAR(30)", "bbox": {"l": 216.7854, "t": 315.55771, "r": 276.0036, "b": 323.88272, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 289.4577, "t": 315.55771, "r": 359.85394, "b": 323.88272, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "ID of the function.", "bbox": {"l": 289.4577, "t": 315.55771, "r": 359.85394, "b": 323.88272, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 142.8, "t": 334.51801, "r": 198.6693, "b": 342.84302, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "USER_NAME", "bbox": {"l": 142.8, "t": 334.51801, "r": 198.6693, "b": 342.84302, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 216.74129999999997, "t": 334.51801, "r": 275.92349, "b": 342.84302, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "VARCHAR(10)", "bbox": {"l": 216.74129999999997, "t": 334.51801, "r": 275.92349, "b": 342.84302, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 289.38208, "t": 334.51801, "r": 515.05359, "b": 342.84302, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "Name of the user profile that has a usage setting for this ", "bbox": {"l": 289.38208, "t": 334.51801, "r": 515.05359, "b": 342.84302, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 289.4397, "t": 345.55832, "r": 323.43362, "b": 353.88333, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "function.", "bbox": {"l": 289.4397, "t": 345.55832, "r": 323.43362, "b": 353.88333, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 142.79999, "t": 364.51862, "r": 173.98318, "b": 372.84363, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "USAGE", "bbox": {"l": 142.79999, "t": 364.51862, "r": 173.98318, "b": 372.84363, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 216.77367999999998, "t": 364.51862, "r": 270.97977, "b": 372.84363, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "VARCHAR(7)", "bbox": {"l": 216.77367999999998, "t": 364.51862, "r": 270.97977, "b": 372.84363, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 289.41626, "t": 364.51862, "r": 346.88757, "b": 372.84363, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "Usage setting:", "bbox": {"l": 289.41626, "t": 364.51862, "r": 346.88757, "b": 372.84363, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 289.4397, "t": 375.69394000000005, "r": 293.9397, "b": 383.62292, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 375.69394000000005, "r": 293.9397, "b": 383.62292, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 303.83969, "t": 375.55893, "r": 535.16766, "b": 383.88394, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "ALLOWED: The user profile is allowed to use the function.", "bbox": {"l": 303.83969, "t": 375.55893, "r": 535.16766, "b": 383.88394, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 289.4397, "t": 386.67395, "r": 293.9397, "b": 394.60294, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 386.67395, "r": 293.9397, "b": 394.60294, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 303.83969, "t": 386.53894, "r": 539.10712, "b": 394.86395, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "DENIED: The user profile is not allowed to use the function.", "bbox": {"l": 303.83969, "t": 386.53894, "r": 539.10712, "b": 394.86395, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 142.8, "t": 405.55865, "r": 196.2249, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "USER_TYPE", "bbox": {"l": 142.8, "t": 405.55865, "r": 196.2249, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 216.75211, "t": 405.55865, "r": 270.99872, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "VARCHAR(5)", "bbox": {"l": 216.75211, "t": 405.55865, "r": 270.99872, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 289.43161, "t": 405.55865, "r": 367.8009, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "Type of user profile:", "bbox": {"l": 289.43161, "t": 405.55865, "r": 367.8009, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 289.4397, "t": 416.67368000000005, "r": 293.9397, "b": 424.60266, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 416.67368000000005, "r": 293.9397, "b": 424.60266, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 303.83969, "t": 416.53867, "r": 434.78159, "b": 424.86368, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "USER: The user profile is a user.", "bbox": {"l": 303.83969, "t": 416.53867, "r": 434.78159, "b": 424.86368, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 289.4397, "t": 427.65369, "r": 293.9397, "b": 435.58267000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 427.65369, "r": 293.9397, "b": 435.58267000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 303.83969, "t": 427.51868, "r": 448.11963000000003, "b": 435.84369, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "GROUP: The user profile is a group.", "bbox": {"l": 303.83969, "t": 427.51868, "r": 448.11963000000003, "b": 435.84369, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl"], "num_rows": 5, "num_cols": 3, "table_cells": [{"bbox": {"l": 142.8, "t": 296.5379899999999, "r": 202.245, "b": 304.86301, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Column name", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 216.80878999999996, "t": 296.5379899999999, "r": 257.21069, "b": 304.86301, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Data type", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 289.47479, "t": 296.5379899999999, "r": 338.89468, "b": 304.86301, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Description", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 142.8, "t": 315.55771, "r": 203.2323, "b": 323.88272, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "FUNCTION_ID", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 216.7854, "t": 315.55771, "r": 276.0036, "b": 323.88272, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(30)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.4577, "t": 315.55771, "r": 359.85394, "b": 323.88272, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "ID of the function.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 142.8, "t": 334.51801, "r": 198.6693, "b": 342.84302, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "USER_NAME", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 216.74129999999997, "t": 334.51801, "r": 275.92349, "b": 342.84302, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(10)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.38208, "t": 334.51801, "r": 515.05359, "b": 353.88333, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Name of the user profile that has a usage setting for this  function.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 142.79999, "t": 364.51862, "r": 173.98318, "b": 372.84363, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "USAGE", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 216.77367999999998, "t": 364.51862, "r": 270.97977, "b": 372.84363, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(7)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.41626, "t": 364.51862, "r": 539.10712, "b": 394.86395, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Usage setting: GLYPH<SM590000> ALLOWED: The user profile is allowed to use the function. GLYPH<SM590000> DENIED: The user profile is not allowed to use the function.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 142.8, "t": 405.55865, "r": 196.2249, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "USER_TYPE", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 216.75211, "t": 405.55865, "r": 270.99872, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(5)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.43161, "t": 405.55865, "r": 448.11963000000003, "b": 435.84369, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Type of user profile: GLYPH<SM590000> USER: The user profile is a user. GLYPH<SM590000> GROUP: The user profile is a group.", "column_header": false, "row_header": false, "row_section": false}]}}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_footer", "id": 14, "page_no": 7, "cluster": {"id": 14, "label": "page_footer", "bbox": {"l": 64.800003, "t": 754.848721, "r": 78.402, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.9166396856307983, "cells": [{"id": 0, "text": "10 ", "bbox": {"l": 64.800003, "t": 754.848721, "r": 78.402, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "10"}, {"label": "page_footer", "id": 10, "page_no": 7, "cluster": {"id": 10, "label": "page_footer", "bbox": {"l": 93.420303, "t": 755.538002, "r": 334.42142, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9530044198036194, "cells": [{"id": 1, "text": "Row and Column Access Control Support in IBM DB2 for i", "bbox": {"l": 93.420303, "t": 755.538002, "r": 334.42142, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Row and Column Access Control Support in IBM DB2 for i"}, {"label": "section_header", "id": 3, "page_no": 7, "cluster": {"id": 3, "label": "section_header", "bbox": {"l": 64.800003, "t": 71.33471999999995, "r": 335.49551, "b": 83.32275000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9697521328926086, "cells": [{"id": 2, "text": "2.1.6", "bbox": {"l": 64.800003, "t": 71.33471999999995, "r": 94.081459, "b": 83.32275000000004, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Change Function Usage CL command", "bbox": {"l": 97.741661, "t": 71.33471999999995, "r": 335.49551, "b": 83.32275000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2.1.6 Change Function Usage CL command"}, {"label": "text", "id": 9, "page_no": 7, "cluster": {"id": 9, "label": "text", "bbox": {"l": 136.8, "t": 97.48870999999997, "r": 547.28442, "b": 106.70172000000014, "coord_origin": "TOPLEFT"}, "confidence": 0.9551584124565125, "cells": [{"id": 4, "text": "The following CL commands can be used to work with, display, or change function usage IDs:", "bbox": {"l": 136.8, "t": 97.48870999999997, "r": 547.28442, "b": 106.70172000000014, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The following CL commands can be used to work with, display, or change function usage IDs:"}, {"label": "list_item", "id": 12, "page_no": 7, "cluster": {"id": 12, "label": "list_item", "bbox": {"l": 136.8, "t": 114.52826000000005, "r": 301.51749, "b": 123.74126999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9410832524299622, "cells": [{"id": 5, "text": "GLYPH<SM590000>", "bbox": {"l": 136.8, "t": 114.67767000000003, "r": 141.78, "b": 123.45245, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Work Function Usage (", "bbox": {"l": 151.20016, "t": 114.52826000000005, "r": 253.26227000000003, "b": 123.74126999999999, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "WRKFCNUSG", "bbox": {"l": 253.26028, "t": 114.67767000000003, "r": 298.1998, "b": 123.50225999999998, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": ")", "bbox": {"l": 298.20081, "t": 114.52826000000005, "r": 301.51749, "b": 123.74126999999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<SM590000> Work Function Usage ( WRKFCNUSG )"}, {"label": "list_item", "id": 11, "page_no": 7, "cluster": {"id": 11, "label": "list_item", "bbox": {"l": 136.80099, "t": 126.52808000000005, "r": 313.39777, "b": 135.74108999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9418092966079712, "cells": [{"id": 9, "text": "GLYPH<SM590000>", "bbox": {"l": 136.80099, "t": 126.67749000000003, "r": 141.78099, "b": 135.45227, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Change Function Usage (", "bbox": {"l": 151.20116, "t": 126.52808000000005, "r": 265.13354, "b": 135.74108999999999, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "CHGFCNUSG", "bbox": {"l": 265.08081, "t": 126.67749000000003, "r": 310.02032, "b": 135.50207999999998, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": ")", "bbox": {"l": 310.08109, "t": 126.52808000000005, "r": 313.39777, "b": 135.74108999999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<SM590000> Change Function Usage ( CHGFCNUSG )"}, {"label": "list_item", "id": 8, "page_no": 7, "cluster": {"id": 8, "label": "list_item", "bbox": {"l": 136.80098, "t": 138.52788999999996, "r": 310.81711, "b": 147.74090999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9562349915504456, "cells": [{"id": 13, "text": "GLYPH<SM590000>", "bbox": {"l": 136.80098, "t": 138.67731000000003, "r": 141.78098, "b": 147.45209, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Display Function Usage (", "bbox": {"l": 151.20114, "t": 138.52788999999996, "r": 262.5639, "b": 147.74090999999999, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "DSPFCNUSG", "bbox": {"l": 262.56091, "t": 138.67731000000003, "r": 307.50043, "b": 147.50189, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": ")", "bbox": {"l": 307.50043, "t": 138.52788999999996, "r": 310.81711, "b": 147.74090999999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<SM590000> Display Function Usage ( DSPFCNUSG )"}, {"label": "text", "id": 4, "page_no": 7, "cluster": {"id": 4, "label": "text", "bbox": {"l": 136.79997, "t": 160.48766999999998, "r": 512.53802, "b": 181.70050000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9682500958442688, "cells": [{"id": 17, "text": "For example, the following ", "bbox": {"l": 136.79997, "t": 160.48766999999998, "r": 255.09984000000003, "b": 169.70068000000003, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "CHGFCNUSG", "bbox": {"l": 255.00027, "t": 160.63707999999997, "r": 299.99957, "b": 169.46167000000003, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": " command shows granting authorization to user ", "bbox": {"l": 300.00055, "t": 160.48766999999998, "r": 512.53802, "b": 169.70068000000003, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "HBEDOYA to administer and manage RCAC rules:", "bbox": {"l": 136.80096, "t": 172.48748999999998, "r": 360.41989, "b": 181.70050000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "For example, the following CHGFCNUSG command shows granting authorization to user HBEDOYA to administer and manage RCAC rules:"}, {"label": "text", "id": 15, "page_no": 7, "cluster": {"id": 15, "label": "text", "bbox": {"l": 136.80096, "t": 189.67645000000005, "r": 441.59686, "b": 198.45123, "coord_origin": "TOPLEFT"}, "confidence": 0.905712902545929, "cells": [{"id": 21, "text": "CHGFCNUSG FCNID(QIBM_DB_SECADM) USER(HBEDOYA) USAGE(*ALLOWED)", "bbox": {"l": 136.80096, "t": 189.67645000000005, "r": 441.59686, "b": 198.45123, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "CHGFCNUSG FCNID(QIBM_DB_SECADM) USER(HBEDOYA) USAGE(*ALLOWED)"}, {"label": "section_header", "id": 7, "page_no": 7, "cluster": {"id": 7, "label": "section_header", "bbox": {"l": 64.800003, "t": 219.35468000000003, "r": 544.47546, "b": 231.34271, "coord_origin": "TOPLEFT"}, "confidence": 0.9636710286140442, "cells": [{"id": 22, "text": "2.1.7", "bbox": {"l": 64.800003, "t": 219.35468000000003, "r": 93.757614, "b": 231.34271, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Verifying function usage IDs for RCAC with the FUNCTION_USAGE view", "bbox": {"l": 97.377296, "t": 219.35468000000003, "r": 544.47546, "b": 231.34271, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2.1.7 Verifying function usage IDs for RCAC with the FUNCTION_USAGE view"}, {"label": "text", "id": 2, "page_no": 7, "cluster": {"id": 2, "label": "text", "bbox": {"l": 136.8, "t": 245.50867000000005, "r": 519.51794, "b": 266.7215, "coord_origin": "TOPLEFT"}, "confidence": 0.9737311601638794, "cells": [{"id": 24, "text": "The FUNCTION_USAGE view contains function usage configuration details. Table 2-1 ", "bbox": {"l": 136.8, "t": 245.50867000000005, "r": 519.51794, "b": 254.72168, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "describes the columns in the FUNCTION_USAGE view.", "bbox": {"l": 136.8, "t": 257.50847999999996, "r": 382.94443, "b": 266.7215, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The FUNCTION_USAGE view contains function usage configuration details. Table 2-1 describes the columns in the FUNCTION_USAGE view."}, {"label": "caption", "id": 13, "page_no": 7, "cluster": {"id": 13, "label": "caption", "bbox": {"l": 136.8, "t": 279.55798000000004, "r": 283.96805, "b": 287.88300000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9196997284889221, "cells": [{"id": 26, "text": "Table 2-1 FUNCTION_USAGE view", "bbox": {"l": 136.8, "t": 279.55798000000004, "r": 283.96805, "b": 287.88300000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 2-1 FUNCTION_USAGE view"}, {"label": "text", "id": 6, "page_no": 7, "cluster": {"id": 6, "label": "text", "bbox": {"l": 136.8, "t": 452.50872999999996, "r": 547.2804, "b": 473.72153, "coord_origin": "TOPLEFT"}, "confidence": 0.9647753834724426, "cells": [{"id": 27, "text": "To discover who has authorization to define and manage RCAC, you can use the query that is ", "bbox": {"l": 136.8, "t": 452.50872999999996, "r": 547.2804, "b": 461.72171, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "shown in Example 2-1.", "bbox": {"l": 136.8, "t": 464.50854, "r": 237.76951999999997, "b": 473.72153, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "To discover who has authorization to define and manage RCAC, you can use the query that is shown in Example 2-1."}, {"label": "caption", "id": 16, "page_no": 7, "cluster": {"id": 16, "label": "caption", "bbox": {"l": 136.8, "t": 486.55798, "r": 462.35419, "b": 494.883, "coord_origin": "TOPLEFT"}, "confidence": 0.8159966468811035, "cells": [{"id": 29, "text": "Example 2-1 Query to determine who has authority to define and manage RCAC", "bbox": {"l": 136.8, "t": 486.55798, "r": 462.35419, "b": 494.883, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Example 2-1 Query to determine who has authority to define and manage RCAC"}, {"label": "key_value_region", "id": 18, "page_no": 7, "cluster": {"id": 18, "label": "key_value_region", "bbox": {"l": 136.8, "t": 503.65802, "r": 331.67731, "b": 584.43163, "coord_origin": "TOPLEFT"}, "confidence": 0.5808269381523132, "cells": [{"id": 30, "text": "SELECT", "bbox": {"l": 136.8, "t": 503.65802, "r": 171.26956, "b": 512.4328, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "function_id,", "bbox": {"l": 182.75941, "t": 503.65802, "r": 251.69853, "b": 512.4328, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "user_name,", "bbox": {"l": 166.78244, "t": 515.6578400000001, "r": 241.73852999999997, "b": 524.43262, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "usage,", "bbox": {"l": 170.75961, "t": 527.65765, "r": 221.69901999999996, "b": 536.43242, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "user_type", "bbox": {"l": 167.53809, "t": 539.65747, "r": 236.69878, "b": 548.43222, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "FROM", "bbox": {"l": 136.8, "t": 551.65727, "r": 160.59396, "b": 560.43202, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "function_usage", "bbox": {"l": 178.43944, "t": 551.65727, "r": 261.71829, "b": 560.43202, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "WHERE", "bbox": {"l": 136.8, "t": 563.65707, "r": 162.44176, "b": 572.43182, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "function_id=\u2019QIBM_DB_SECADM\u2019", "bbox": {"l": 177.8268, "t": 563.65707, "r": 331.67731, "b": 572.43182, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "ORDER BY", "bbox": {"l": 136.8, "t": 575.65688, "r": 178.77542, "b": 584.43163, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "user_name;", "bbox": {"l": 189.26929, "t": 575.65688, "r": 241.73856, "b": 584.43163, "coord_origin": "TOPLEFT"}}], "children": [{"id": 19, "label": "text", "bbox": {"l": 136.8, "t": 503.65802, "r": 171.26956, "b": 512.4328, "coord_origin": "TOPLEFT"}, "confidence": 0.5631120204925537, "cells": [{"id": 30, "text": "SELECT", "bbox": {"l": 136.8, "t": 503.65802, "r": 171.26956, "b": 512.4328, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 182.75941, "t": 503.65802, "r": 251.69853, "b": 512.4328, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "function_id,", "bbox": {"l": 182.75941, "t": 503.65802, "r": 251.69853, "b": 512.4328, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 166.78244, "t": 515.6578400000001, "r": 241.73852999999997, "b": 524.43262, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "user_name,", "bbox": {"l": 166.78244, "t": 515.6578400000001, "r": 241.73852999999997, "b": 524.43262, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 170.75961, "t": 527.65765, "r": 221.69901999999996, "b": 536.43242, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "usage,", "bbox": {"l": 170.75961, "t": 527.65765, "r": 221.69901999999996, "b": 536.43242, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 167.53809, "t": 539.65747, "r": 236.69878, "b": 548.43222, "coord_origin": "TOPLEFT"}, "confidence": 0.5346829891204834, "cells": [{"id": 34, "text": "user_type", "bbox": {"l": 167.53809, "t": 539.65747, "r": 236.69878, "b": 548.43222, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 136.8, "t": 551.65727, "r": 160.59396, "b": 560.43202, "coord_origin": "TOPLEFT"}, "confidence": 0.5818389058113098, "cells": [{"id": 35, "text": "FROM", "bbox": {"l": 136.8, "t": 551.65727, "r": 160.59396, "b": 560.43202, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 178.43944, "t": 551.65727, "r": 261.71829, "b": 560.43202, "coord_origin": "TOPLEFT"}, "confidence": 0.5035732388496399, "cells": [{"id": 36, "text": "function_usage", "bbox": {"l": 178.43944, "t": 551.65727, "r": 261.71829, "b": 560.43202, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 136.8, "t": 563.65707, "r": 162.44176, "b": 572.43182, "coord_origin": "TOPLEFT"}, "confidence": 0.5340272188186646, "cells": [{"id": 37, "text": "WHERE", "bbox": {"l": 136.8, "t": 563.65707, "r": 162.44176, "b": 572.43182, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 177.8268, "t": 563.65707, "r": 331.67731, "b": 572.43182, "coord_origin": "TOPLEFT"}, "confidence": 0.5171727538108826, "cells": [{"id": 38, "text": "function_id=\u2019QIBM_DB_SECADM\u2019", "bbox": {"l": 177.8268, "t": 563.65707, "r": 331.67731, "b": 572.43182, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 136.8, "t": 575.65688, "r": 178.77542, "b": 584.43163, "coord_origin": "TOPLEFT"}, "confidence": 0.537347137928009, "cells": [{"id": 39, "text": "ORDER BY", "bbox": {"l": 136.8, "t": 575.65688, "r": 178.77542, "b": 584.43163, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 189.26929, "t": 575.65688, "r": 241.73856, "b": 584.43163, "coord_origin": "TOPLEFT"}, "confidence": 0.5167021751403809, "cells": [{"id": 40, "text": "user_name;", "bbox": {"l": 189.26929, "t": 575.65688, "r": 241.73856, "b": 584.43163, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null}, {"label": "section_header", "id": 5, "page_no": 7, "cluster": {"id": 5, "label": "section_header", "bbox": {"l": 64.800003, "t": 620.22063, "r": 249.59605000000002, "b": 634.98363, "coord_origin": "TOPLEFT"}, "confidence": 0.9656103849411011, "cells": [{"id": 41, "text": "2.2", "bbox": {"l": 64.800003, "t": 620.22063, "r": 87.569839, "b": 634.98363, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "Separation of duties", "bbox": {"l": 92.123802, "t": 620.22063, "r": 249.59605000000002, "b": 634.98363, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2.2 Separation of duties"}, {"label": "text", "id": 0, "page_no": 7, "cluster": {"id": 0, "label": "text", "bbox": {"l": 136.8, "t": 652.54872, "r": 547.22345, "b": 709.760956, "coord_origin": "TOPLEFT"}, "confidence": 0.9853070974349976, "cells": [{"id": 43, "text": "Separation of duties helps businesses comply with industry regulations or organizational ", "bbox": {"l": 136.8, "t": 652.54872, "r": 529.09357, "b": 661.76172, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "requirements and simplifies the management of authorities. Separation of duties is commonly ", "bbox": {"l": 136.8, "t": 664.54852, "r": 547.22345, "b": 673.76153, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "used to prevent fraudulent activities or errors by a single person. It provides the ability for ", "bbox": {"l": 136.8, "t": 676.54833, "r": 530.89716, "b": 685.76134, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "administrative functions to be divided across individuals without overlapping responsibilities, ", "bbox": {"l": 136.80002, "t": 688.54814, "r": 544.33832, "b": 697.7611469999999, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "so that one user does not possess unlimited authority, such as with the *ALLOBJ authority.", "bbox": {"l": 136.80002, "t": 700.547951, "r": 536.28363, "b": 709.760956, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Separation of duties helps businesses comply with industry regulations or organizational requirements and simplifies the management of authorities. Separation of duties is commonly used to prevent fraudulent activities or errors by a single person. It provides the ability for administrative functions to be divided across individuals without overlapping responsibilities, so that one user does not possess unlimited authority, such as with the *ALLOBJ authority."}, {"label": "table", "id": 1, "page_no": 7, "cluster": {"id": 1, "label": "table", "bbox": {"l": 135.52462768554688, "t": 289.7252197265625, "r": 545.8714599609375, "b": 442.050537109375, "coord_origin": "TOPLEFT"}, "confidence": 0.9851690530776978, "cells": [{"id": 48, "text": "Column name", "bbox": {"l": 142.8, "t": 296.5379899999999, "r": 202.245, "b": 304.86301, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "Data type", "bbox": {"l": 216.80878999999996, "t": 296.5379899999999, "r": 257.21069, "b": 304.86301, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Description", "bbox": {"l": 289.47479, "t": 296.5379899999999, "r": 338.89468, "b": 304.86301, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "FUNCTION_ID", "bbox": {"l": 142.8, "t": 315.55771, "r": 203.2323, "b": 323.88272, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "VARCHAR(30)", "bbox": {"l": 216.7854, "t": 315.55771, "r": 276.0036, "b": 323.88272, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "ID of the function.", "bbox": {"l": 289.4577, "t": 315.55771, "r": 359.85394, "b": 323.88272, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "USER_NAME", "bbox": {"l": 142.8, "t": 334.51801, "r": 198.6693, "b": 342.84302, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "VARCHAR(10)", "bbox": {"l": 216.74129999999997, "t": 334.51801, "r": 275.92349, "b": 342.84302, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Name of the user profile that has a usage setting for this ", "bbox": {"l": 289.38208, "t": 334.51801, "r": 515.05359, "b": 342.84302, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "function.", "bbox": {"l": 289.4397, "t": 345.55832, "r": 323.43362, "b": 353.88333, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "USAGE", "bbox": {"l": 142.79999, "t": 364.51862, "r": 173.98318, "b": 372.84363, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "VARCHAR(7)", "bbox": {"l": 216.77367999999998, "t": 364.51862, "r": 270.97977, "b": 372.84363, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Usage setting:", "bbox": {"l": 289.41626, "t": 364.51862, "r": 346.88757, "b": 372.84363, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 375.69394000000005, "r": 293.9397, "b": 383.62292, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "ALLOWED: The user profile is allowed to use the function.", "bbox": {"l": 303.83969, "t": 375.55893, "r": 535.16766, "b": 383.88394, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 386.67395, "r": 293.9397, "b": 394.60294, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "DENIED: The user profile is not allowed to use the function.", "bbox": {"l": 303.83969, "t": 386.53894, "r": 539.10712, "b": 394.86395, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "USER_TYPE", "bbox": {"l": 142.8, "t": 405.55865, "r": 196.2249, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "VARCHAR(5)", "bbox": {"l": 216.75211, "t": 405.55865, "r": 270.99872, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "Type of user profile:", "bbox": {"l": 289.43161, "t": 405.55865, "r": 367.8009, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 416.67368000000005, "r": 293.9397, "b": 424.60266, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "USER: The user profile is a user.", "bbox": {"l": 303.83969, "t": 416.53867, "r": 434.78159, "b": 424.86368, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 427.65369, "r": 293.9397, "b": 435.58267000000006, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "GROUP: The user profile is a group.", "bbox": {"l": 303.83969, "t": 427.51868, "r": 448.11963000000003, "b": 435.84369, "coord_origin": "TOPLEFT"}}], "children": [{"id": 31, "label": "text", "bbox": {"l": 142.8, "t": 296.5379899999999, "r": 202.245, "b": 304.86301, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "Column name", "bbox": {"l": 142.8, "t": 296.5379899999999, "r": 202.245, "b": 304.86301, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 216.80878999999996, "t": 296.5379899999999, "r": 257.21069, "b": 304.86301, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "Data type", "bbox": {"l": 216.80878999999996, "t": 296.5379899999999, "r": 257.21069, "b": 304.86301, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 289.47479, "t": 296.5379899999999, "r": 338.89468, "b": 304.86301, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "Description", "bbox": {"l": 289.47479, "t": 296.5379899999999, "r": 338.89468, "b": 304.86301, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 142.8, "t": 315.55771, "r": 203.2323, "b": 323.88272, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "FUNCTION_ID", "bbox": {"l": 142.8, "t": 315.55771, "r": 203.2323, "b": 323.88272, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 216.7854, "t": 315.55771, "r": 276.0036, "b": 323.88272, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "VARCHAR(30)", "bbox": {"l": 216.7854, "t": 315.55771, "r": 276.0036, "b": 323.88272, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 289.4577, "t": 315.55771, "r": 359.85394, "b": 323.88272, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "ID of the function.", "bbox": {"l": 289.4577, "t": 315.55771, "r": 359.85394, "b": 323.88272, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 142.8, "t": 334.51801, "r": 198.6693, "b": 342.84302, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "USER_NAME", "bbox": {"l": 142.8, "t": 334.51801, "r": 198.6693, "b": 342.84302, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 216.74129999999997, "t": 334.51801, "r": 275.92349, "b": 342.84302, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "VARCHAR(10)", "bbox": {"l": 216.74129999999997, "t": 334.51801, "r": 275.92349, "b": 342.84302, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 289.38208, "t": 334.51801, "r": 515.05359, "b": 342.84302, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "Name of the user profile that has a usage setting for this ", "bbox": {"l": 289.38208, "t": 334.51801, "r": 515.05359, "b": 342.84302, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 289.4397, "t": 345.55832, "r": 323.43362, "b": 353.88333, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "function.", "bbox": {"l": 289.4397, "t": 345.55832, "r": 323.43362, "b": 353.88333, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 142.79999, "t": 364.51862, "r": 173.98318, "b": 372.84363, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "USAGE", "bbox": {"l": 142.79999, "t": 364.51862, "r": 173.98318, "b": 372.84363, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 216.77367999999998, "t": 364.51862, "r": 270.97977, "b": 372.84363, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "VARCHAR(7)", "bbox": {"l": 216.77367999999998, "t": 364.51862, "r": 270.97977, "b": 372.84363, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 289.41626, "t": 364.51862, "r": 346.88757, "b": 372.84363, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "Usage setting:", "bbox": {"l": 289.41626, "t": 364.51862, "r": 346.88757, "b": 372.84363, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 289.4397, "t": 375.69394000000005, "r": 293.9397, "b": 383.62292, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 375.69394000000005, "r": 293.9397, "b": 383.62292, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 303.83969, "t": 375.55893, "r": 535.16766, "b": 383.88394, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "ALLOWED: The user profile is allowed to use the function.", "bbox": {"l": 303.83969, "t": 375.55893, "r": 535.16766, "b": 383.88394, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 289.4397, "t": 386.67395, "r": 293.9397, "b": 394.60294, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 386.67395, "r": 293.9397, "b": 394.60294, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 303.83969, "t": 386.53894, "r": 539.10712, "b": 394.86395, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "DENIED: The user profile is not allowed to use the function.", "bbox": {"l": 303.83969, "t": 386.53894, "r": 539.10712, "b": 394.86395, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 142.8, "t": 405.55865, "r": 196.2249, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "USER_TYPE", "bbox": {"l": 142.8, "t": 405.55865, "r": 196.2249, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 216.75211, "t": 405.55865, "r": 270.99872, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "VARCHAR(5)", "bbox": {"l": 216.75211, "t": 405.55865, "r": 270.99872, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 289.43161, "t": 405.55865, "r": 367.8009, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "Type of user profile:", "bbox": {"l": 289.43161, "t": 405.55865, "r": 367.8009, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 289.4397, "t": 416.67368000000005, "r": 293.9397, "b": 424.60266, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 416.67368000000005, "r": 293.9397, "b": 424.60266, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 303.83969, "t": 416.53867, "r": 434.78159, "b": 424.86368, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "USER: The user profile is a user.", "bbox": {"l": 303.83969, "t": 416.53867, "r": 434.78159, "b": 424.86368, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 289.4397, "t": 427.65369, "r": 293.9397, "b": 435.58267000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 427.65369, "r": 293.9397, "b": 435.58267000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 303.83969, "t": 427.51868, "r": 448.11963000000003, "b": 435.84369, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "GROUP: The user profile is a group.", "bbox": {"l": 303.83969, "t": 427.51868, "r": 448.11963000000003, "b": 435.84369, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl"], "num_rows": 5, "num_cols": 3, "table_cells": [{"bbox": {"l": 142.8, "t": 296.5379899999999, "r": 202.245, "b": 304.86301, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Column name", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 216.80878999999996, "t": 296.5379899999999, "r": 257.21069, "b": 304.86301, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Data type", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 289.47479, "t": 296.5379899999999, "r": 338.89468, "b": 304.86301, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Description", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 142.8, "t": 315.55771, "r": 203.2323, "b": 323.88272, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "FUNCTION_ID", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 216.7854, "t": 315.55771, "r": 276.0036, "b": 323.88272, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(30)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.4577, "t": 315.55771, "r": 359.85394, "b": 323.88272, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "ID of the function.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 142.8, "t": 334.51801, "r": 198.6693, "b": 342.84302, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "USER_NAME", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 216.74129999999997, "t": 334.51801, "r": 275.92349, "b": 342.84302, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(10)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.38208, "t": 334.51801, "r": 515.05359, "b": 353.88333, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Name of the user profile that has a usage setting for this  function.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 142.79999, "t": 364.51862, "r": 173.98318, "b": 372.84363, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "USAGE", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 216.77367999999998, "t": 364.51862, "r": 270.97977, "b": 372.84363, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(7)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.41626, "t": 364.51862, "r": 539.10712, "b": 394.86395, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Usage setting: GLYPH<SM590000> ALLOWED: The user profile is allowed to use the function. GLYPH<SM590000> DENIED: The user profile is not allowed to use the function.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 142.8, "t": 405.55865, "r": 196.2249, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "USER_TYPE", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 216.75211, "t": 405.55865, "r": 270.99872, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(5)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.43161, "t": 405.55865, "r": 448.11963000000003, "b": 435.84369, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Type of user profile: GLYPH<SM590000> USER: The user profile is a user. GLYPH<SM590000> GROUP: The user profile is a group.", "column_header": false, "row_header": false, "row_section": false}]}], "body": [{"label": "section_header", "id": 3, "page_no": 7, "cluster": {"id": 3, "label": "section_header", "bbox": {"l": 64.800003, "t": 71.33471999999995, "r": 335.49551, "b": 83.32275000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9697521328926086, "cells": [{"id": 2, "text": "2.1.6", "bbox": {"l": 64.800003, "t": 71.33471999999995, "r": 94.081459, "b": 83.32275000000004, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Change Function Usage CL command", "bbox": {"l": 97.741661, "t": 71.33471999999995, "r": 335.49551, "b": 83.32275000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2.1.6 Change Function Usage CL command"}, {"label": "text", "id": 9, "page_no": 7, "cluster": {"id": 9, "label": "text", "bbox": {"l": 136.8, "t": 97.48870999999997, "r": 547.28442, "b": 106.70172000000014, "coord_origin": "TOPLEFT"}, "confidence": 0.9551584124565125, "cells": [{"id": 4, "text": "The following CL commands can be used to work with, display, or change function usage IDs:", "bbox": {"l": 136.8, "t": 97.48870999999997, "r": 547.28442, "b": 106.70172000000014, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The following CL commands can be used to work with, display, or change function usage IDs:"}, {"label": "list_item", "id": 12, "page_no": 7, "cluster": {"id": 12, "label": "list_item", "bbox": {"l": 136.8, "t": 114.52826000000005, "r": 301.51749, "b": 123.74126999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9410832524299622, "cells": [{"id": 5, "text": "GLYPH<SM590000>", "bbox": {"l": 136.8, "t": 114.67767000000003, "r": 141.78, "b": 123.45245, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Work Function Usage (", "bbox": {"l": 151.20016, "t": 114.52826000000005, "r": 253.26227000000003, "b": 123.74126999999999, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "WRKFCNUSG", "bbox": {"l": 253.26028, "t": 114.67767000000003, "r": 298.1998, "b": 123.50225999999998, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": ")", "bbox": {"l": 298.20081, "t": 114.52826000000005, "r": 301.51749, "b": 123.74126999999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<SM590000> Work Function Usage ( WRKFCNUSG )"}, {"label": "list_item", "id": 11, "page_no": 7, "cluster": {"id": 11, "label": "list_item", "bbox": {"l": 136.80099, "t": 126.52808000000005, "r": 313.39777, "b": 135.74108999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9418092966079712, "cells": [{"id": 9, "text": "GLYPH<SM590000>", "bbox": {"l": 136.80099, "t": 126.67749000000003, "r": 141.78099, "b": 135.45227, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Change Function Usage (", "bbox": {"l": 151.20116, "t": 126.52808000000005, "r": 265.13354, "b": 135.74108999999999, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "CHGFCNUSG", "bbox": {"l": 265.08081, "t": 126.67749000000003, "r": 310.02032, "b": 135.50207999999998, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": ")", "bbox": {"l": 310.08109, "t": 126.52808000000005, "r": 313.39777, "b": 135.74108999999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<SM590000> Change Function Usage ( CHGFCNUSG )"}, {"label": "list_item", "id": 8, "page_no": 7, "cluster": {"id": 8, "label": "list_item", "bbox": {"l": 136.80098, "t": 138.52788999999996, "r": 310.81711, "b": 147.74090999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9562349915504456, "cells": [{"id": 13, "text": "GLYPH<SM590000>", "bbox": {"l": 136.80098, "t": 138.67731000000003, "r": 141.78098, "b": 147.45209, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Display Function Usage (", "bbox": {"l": 151.20114, "t": 138.52788999999996, "r": 262.5639, "b": 147.74090999999999, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "DSPFCNUSG", "bbox": {"l": 262.56091, "t": 138.67731000000003, "r": 307.50043, "b": 147.50189, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": ")", "bbox": {"l": 307.50043, "t": 138.52788999999996, "r": 310.81711, "b": 147.74090999999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<SM590000> Display Function Usage ( DSPFCNUSG )"}, {"label": "text", "id": 4, "page_no": 7, "cluster": {"id": 4, "label": "text", "bbox": {"l": 136.79997, "t": 160.48766999999998, "r": 512.53802, "b": 181.70050000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9682500958442688, "cells": [{"id": 17, "text": "For example, the following ", "bbox": {"l": 136.79997, "t": 160.48766999999998, "r": 255.09984000000003, "b": 169.70068000000003, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "CHGFCNUSG", "bbox": {"l": 255.00027, "t": 160.63707999999997, "r": 299.99957, "b": 169.46167000000003, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": " command shows granting authorization to user ", "bbox": {"l": 300.00055, "t": 160.48766999999998, "r": 512.53802, "b": 169.70068000000003, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "HBEDOYA to administer and manage RCAC rules:", "bbox": {"l": 136.80096, "t": 172.48748999999998, "r": 360.41989, "b": 181.70050000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "For example, the following CHGFCNUSG command shows granting authorization to user HBEDOYA to administer and manage RCAC rules:"}, {"label": "text", "id": 15, "page_no": 7, "cluster": {"id": 15, "label": "text", "bbox": {"l": 136.80096, "t": 189.67645000000005, "r": 441.59686, "b": 198.45123, "coord_origin": "TOPLEFT"}, "confidence": 0.905712902545929, "cells": [{"id": 21, "text": "CHGFCNUSG FCNID(QIBM_DB_SECADM) USER(HBEDOYA) USAGE(*ALLOWED)", "bbox": {"l": 136.80096, "t": 189.67645000000005, "r": 441.59686, "b": 198.45123, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "CHGFCNUSG FCNID(QIBM_DB_SECADM) USER(HBEDOYA) USAGE(*ALLOWED)"}, {"label": "section_header", "id": 7, "page_no": 7, "cluster": {"id": 7, "label": "section_header", "bbox": {"l": 64.800003, "t": 219.35468000000003, "r": 544.47546, "b": 231.34271, "coord_origin": "TOPLEFT"}, "confidence": 0.9636710286140442, "cells": [{"id": 22, "text": "2.1.7", "bbox": {"l": 64.800003, "t": 219.35468000000003, "r": 93.757614, "b": 231.34271, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Verifying function usage IDs for RCAC with the FUNCTION_USAGE view", "bbox": {"l": 97.377296, "t": 219.35468000000003, "r": 544.47546, "b": 231.34271, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2.1.7 Verifying function usage IDs for RCAC with the FUNCTION_USAGE view"}, {"label": "text", "id": 2, "page_no": 7, "cluster": {"id": 2, "label": "text", "bbox": {"l": 136.8, "t": 245.50867000000005, "r": 519.51794, "b": 266.7215, "coord_origin": "TOPLEFT"}, "confidence": 0.9737311601638794, "cells": [{"id": 24, "text": "The FUNCTION_USAGE view contains function usage configuration details. Table 2-1 ", "bbox": {"l": 136.8, "t": 245.50867000000005, "r": 519.51794, "b": 254.72168, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "describes the columns in the FUNCTION_USAGE view.", "bbox": {"l": 136.8, "t": 257.50847999999996, "r": 382.94443, "b": 266.7215, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The FUNCTION_USAGE view contains function usage configuration details. Table 2-1 describes the columns in the FUNCTION_USAGE view."}, {"label": "caption", "id": 13, "page_no": 7, "cluster": {"id": 13, "label": "caption", "bbox": {"l": 136.8, "t": 279.55798000000004, "r": 283.96805, "b": 287.88300000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9196997284889221, "cells": [{"id": 26, "text": "Table 2-1 FUNCTION_USAGE view", "bbox": {"l": 136.8, "t": 279.55798000000004, "r": 283.96805, "b": 287.88300000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 2-1 FUNCTION_USAGE view"}, {"label": "text", "id": 6, "page_no": 7, "cluster": {"id": 6, "label": "text", "bbox": {"l": 136.8, "t": 452.50872999999996, "r": 547.2804, "b": 473.72153, "coord_origin": "TOPLEFT"}, "confidence": 0.9647753834724426, "cells": [{"id": 27, "text": "To discover who has authorization to define and manage RCAC, you can use the query that is ", "bbox": {"l": 136.8, "t": 452.50872999999996, "r": 547.2804, "b": 461.72171, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "shown in Example 2-1.", "bbox": {"l": 136.8, "t": 464.50854, "r": 237.76951999999997, "b": 473.72153, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "To discover who has authorization to define and manage RCAC, you can use the query that is shown in Example 2-1."}, {"label": "caption", "id": 16, "page_no": 7, "cluster": {"id": 16, "label": "caption", "bbox": {"l": 136.8, "t": 486.55798, "r": 462.35419, "b": 494.883, "coord_origin": "TOPLEFT"}, "confidence": 0.8159966468811035, "cells": [{"id": 29, "text": "Example 2-1 Query to determine who has authority to define and manage RCAC", "bbox": {"l": 136.8, "t": 486.55798, "r": 462.35419, "b": 494.883, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Example 2-1 Query to determine who has authority to define and manage RCAC"}, {"label": "key_value_region", "id": 18, "page_no": 7, "cluster": {"id": 18, "label": "key_value_region", "bbox": {"l": 136.8, "t": 503.65802, "r": 331.67731, "b": 584.43163, "coord_origin": "TOPLEFT"}, "confidence": 0.5808269381523132, "cells": [{"id": 30, "text": "SELECT", "bbox": {"l": 136.8, "t": 503.65802, "r": 171.26956, "b": 512.4328, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "function_id,", "bbox": {"l": 182.75941, "t": 503.65802, "r": 251.69853, "b": 512.4328, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "user_name,", "bbox": {"l": 166.78244, "t": 515.6578400000001, "r": 241.73852999999997, "b": 524.43262, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "usage,", "bbox": {"l": 170.75961, "t": 527.65765, "r": 221.69901999999996, "b": 536.43242, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "user_type", "bbox": {"l": 167.53809, "t": 539.65747, "r": 236.69878, "b": 548.43222, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "FROM", "bbox": {"l": 136.8, "t": 551.65727, "r": 160.59396, "b": 560.43202, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "function_usage", "bbox": {"l": 178.43944, "t": 551.65727, "r": 261.71829, "b": 560.43202, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "WHERE", "bbox": {"l": 136.8, "t": 563.65707, "r": 162.44176, "b": 572.43182, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "function_id=\u2019QIBM_DB_SECADM\u2019", "bbox": {"l": 177.8268, "t": 563.65707, "r": 331.67731, "b": 572.43182, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "ORDER BY", "bbox": {"l": 136.8, "t": 575.65688, "r": 178.77542, "b": 584.43163, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "user_name;", "bbox": {"l": 189.26929, "t": 575.65688, "r": 241.73856, "b": 584.43163, "coord_origin": "TOPLEFT"}}], "children": [{"id": 19, "label": "text", "bbox": {"l": 136.8, "t": 503.65802, "r": 171.26956, "b": 512.4328, "coord_origin": "TOPLEFT"}, "confidence": 0.5631120204925537, "cells": [{"id": 30, "text": "SELECT", "bbox": {"l": 136.8, "t": 503.65802, "r": 171.26956, "b": 512.4328, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 182.75941, "t": 503.65802, "r": 251.69853, "b": 512.4328, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "function_id,", "bbox": {"l": 182.75941, "t": 503.65802, "r": 251.69853, "b": 512.4328, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 166.78244, "t": 515.6578400000001, "r": 241.73852999999997, "b": 524.43262, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "user_name,", "bbox": {"l": 166.78244, "t": 515.6578400000001, "r": 241.73852999999997, "b": 524.43262, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 170.75961, "t": 527.65765, "r": 221.69901999999996, "b": 536.43242, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "usage,", "bbox": {"l": 170.75961, "t": 527.65765, "r": 221.69901999999996, "b": 536.43242, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 167.53809, "t": 539.65747, "r": 236.69878, "b": 548.43222, "coord_origin": "TOPLEFT"}, "confidence": 0.5346829891204834, "cells": [{"id": 34, "text": "user_type", "bbox": {"l": 167.53809, "t": 539.65747, "r": 236.69878, "b": 548.43222, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 136.8, "t": 551.65727, "r": 160.59396, "b": 560.43202, "coord_origin": "TOPLEFT"}, "confidence": 0.5818389058113098, "cells": [{"id": 35, "text": "FROM", "bbox": {"l": 136.8, "t": 551.65727, "r": 160.59396, "b": 560.43202, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 178.43944, "t": 551.65727, "r": 261.71829, "b": 560.43202, "coord_origin": "TOPLEFT"}, "confidence": 0.5035732388496399, "cells": [{"id": 36, "text": "function_usage", "bbox": {"l": 178.43944, "t": 551.65727, "r": 261.71829, "b": 560.43202, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 136.8, "t": 563.65707, "r": 162.44176, "b": 572.43182, "coord_origin": "TOPLEFT"}, "confidence": 0.5340272188186646, "cells": [{"id": 37, "text": "WHERE", "bbox": {"l": 136.8, "t": 563.65707, "r": 162.44176, "b": 572.43182, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 177.8268, "t": 563.65707, "r": 331.67731, "b": 572.43182, "coord_origin": "TOPLEFT"}, "confidence": 0.5171727538108826, "cells": [{"id": 38, "text": "function_id=\u2019QIBM_DB_SECADM\u2019", "bbox": {"l": 177.8268, "t": 563.65707, "r": 331.67731, "b": 572.43182, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 136.8, "t": 575.65688, "r": 178.77542, "b": 584.43163, "coord_origin": "TOPLEFT"}, "confidence": 0.537347137928009, "cells": [{"id": 39, "text": "ORDER BY", "bbox": {"l": 136.8, "t": 575.65688, "r": 178.77542, "b": 584.43163, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 189.26929, "t": 575.65688, "r": 241.73856, "b": 584.43163, "coord_origin": "TOPLEFT"}, "confidence": 0.5167021751403809, "cells": [{"id": 40, "text": "user_name;", "bbox": {"l": 189.26929, "t": 575.65688, "r": 241.73856, "b": 584.43163, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null}, {"label": "section_header", "id": 5, "page_no": 7, "cluster": {"id": 5, "label": "section_header", "bbox": {"l": 64.800003, "t": 620.22063, "r": 249.59605000000002, "b": 634.98363, "coord_origin": "TOPLEFT"}, "confidence": 0.9656103849411011, "cells": [{"id": 41, "text": "2.2", "bbox": {"l": 64.800003, "t": 620.22063, "r": 87.569839, "b": 634.98363, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "Separation of duties", "bbox": {"l": 92.123802, "t": 620.22063, "r": 249.59605000000002, "b": 634.98363, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2.2 Separation of duties"}, {"label": "text", "id": 0, "page_no": 7, "cluster": {"id": 0, "label": "text", "bbox": {"l": 136.8, "t": 652.54872, "r": 547.22345, "b": 709.760956, "coord_origin": "TOPLEFT"}, "confidence": 0.9853070974349976, "cells": [{"id": 43, "text": "Separation of duties helps businesses comply with industry regulations or organizational ", "bbox": {"l": 136.8, "t": 652.54872, "r": 529.09357, "b": 661.76172, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "requirements and simplifies the management of authorities. Separation of duties is commonly ", "bbox": {"l": 136.8, "t": 664.54852, "r": 547.22345, "b": 673.76153, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "used to prevent fraudulent activities or errors by a single person. It provides the ability for ", "bbox": {"l": 136.8, "t": 676.54833, "r": 530.89716, "b": 685.76134, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "administrative functions to be divided across individuals without overlapping responsibilities, ", "bbox": {"l": 136.80002, "t": 688.54814, "r": 544.33832, "b": 697.7611469999999, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "so that one user does not possess unlimited authority, such as with the *ALLOBJ authority.", "bbox": {"l": 136.80002, "t": 700.547951, "r": 536.28363, "b": 709.760956, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Separation of duties helps businesses comply with industry regulations or organizational requirements and simplifies the management of authorities. Separation of duties is commonly used to prevent fraudulent activities or errors by a single person. It provides the ability for administrative functions to be divided across individuals without overlapping responsibilities, so that one user does not possess unlimited authority, such as with the *ALLOBJ authority."}, {"label": "table", "id": 1, "page_no": 7, "cluster": {"id": 1, "label": "table", "bbox": {"l": 135.52462768554688, "t": 289.7252197265625, "r": 545.8714599609375, "b": 442.050537109375, "coord_origin": "TOPLEFT"}, "confidence": 0.9851690530776978, "cells": [{"id": 48, "text": "Column name", "bbox": {"l": 142.8, "t": 296.5379899999999, "r": 202.245, "b": 304.86301, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "Data type", "bbox": {"l": 216.80878999999996, "t": 296.5379899999999, "r": 257.21069, "b": 304.86301, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Description", "bbox": {"l": 289.47479, "t": 296.5379899999999, "r": 338.89468, "b": 304.86301, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "FUNCTION_ID", "bbox": {"l": 142.8, "t": 315.55771, "r": 203.2323, "b": 323.88272, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "VARCHAR(30)", "bbox": {"l": 216.7854, "t": 315.55771, "r": 276.0036, "b": 323.88272, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "ID of the function.", "bbox": {"l": 289.4577, "t": 315.55771, "r": 359.85394, "b": 323.88272, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "USER_NAME", "bbox": {"l": 142.8, "t": 334.51801, "r": 198.6693, "b": 342.84302, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "VARCHAR(10)", "bbox": {"l": 216.74129999999997, "t": 334.51801, "r": 275.92349, "b": 342.84302, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Name of the user profile that has a usage setting for this ", "bbox": {"l": 289.38208, "t": 334.51801, "r": 515.05359, "b": 342.84302, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "function.", "bbox": {"l": 289.4397, "t": 345.55832, "r": 323.43362, "b": 353.88333, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "USAGE", "bbox": {"l": 142.79999, "t": 364.51862, "r": 173.98318, "b": 372.84363, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "VARCHAR(7)", "bbox": {"l": 216.77367999999998, "t": 364.51862, "r": 270.97977, "b": 372.84363, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Usage setting:", "bbox": {"l": 289.41626, "t": 364.51862, "r": 346.88757, "b": 372.84363, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 375.69394000000005, "r": 293.9397, "b": 383.62292, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "ALLOWED: The user profile is allowed to use the function.", "bbox": {"l": 303.83969, "t": 375.55893, "r": 535.16766, "b": 383.88394, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 386.67395, "r": 293.9397, "b": 394.60294, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "DENIED: The user profile is not allowed to use the function.", "bbox": {"l": 303.83969, "t": 386.53894, "r": 539.10712, "b": 394.86395, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "USER_TYPE", "bbox": {"l": 142.8, "t": 405.55865, "r": 196.2249, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "VARCHAR(5)", "bbox": {"l": 216.75211, "t": 405.55865, "r": 270.99872, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "Type of user profile:", "bbox": {"l": 289.43161, "t": 405.55865, "r": 367.8009, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 416.67368000000005, "r": 293.9397, "b": 424.60266, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "USER: The user profile is a user.", "bbox": {"l": 303.83969, "t": 416.53867, "r": 434.78159, "b": 424.86368, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 427.65369, "r": 293.9397, "b": 435.58267000000006, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "GROUP: The user profile is a group.", "bbox": {"l": 303.83969, "t": 427.51868, "r": 448.11963000000003, "b": 435.84369, "coord_origin": "TOPLEFT"}}], "children": [{"id": 31, "label": "text", "bbox": {"l": 142.8, "t": 296.5379899999999, "r": 202.245, "b": 304.86301, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "Column name", "bbox": {"l": 142.8, "t": 296.5379899999999, "r": 202.245, "b": 304.86301, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 216.80878999999996, "t": 296.5379899999999, "r": 257.21069, "b": 304.86301, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "Data type", "bbox": {"l": 216.80878999999996, "t": 296.5379899999999, "r": 257.21069, "b": 304.86301, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 289.47479, "t": 296.5379899999999, "r": 338.89468, "b": 304.86301, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "Description", "bbox": {"l": 289.47479, "t": 296.5379899999999, "r": 338.89468, "b": 304.86301, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 142.8, "t": 315.55771, "r": 203.2323, "b": 323.88272, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "FUNCTION_ID", "bbox": {"l": 142.8, "t": 315.55771, "r": 203.2323, "b": 323.88272, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 216.7854, "t": 315.55771, "r": 276.0036, "b": 323.88272, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "VARCHAR(30)", "bbox": {"l": 216.7854, "t": 315.55771, "r": 276.0036, "b": 323.88272, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 289.4577, "t": 315.55771, "r": 359.85394, "b": 323.88272, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "ID of the function.", "bbox": {"l": 289.4577, "t": 315.55771, "r": 359.85394, "b": 323.88272, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 142.8, "t": 334.51801, "r": 198.6693, "b": 342.84302, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "USER_NAME", "bbox": {"l": 142.8, "t": 334.51801, "r": 198.6693, "b": 342.84302, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 216.74129999999997, "t": 334.51801, "r": 275.92349, "b": 342.84302, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "VARCHAR(10)", "bbox": {"l": 216.74129999999997, "t": 334.51801, "r": 275.92349, "b": 342.84302, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 289.38208, "t": 334.51801, "r": 515.05359, "b": 342.84302, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "Name of the user profile that has a usage setting for this ", "bbox": {"l": 289.38208, "t": 334.51801, "r": 515.05359, "b": 342.84302, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 289.4397, "t": 345.55832, "r": 323.43362, "b": 353.88333, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "function.", "bbox": {"l": 289.4397, "t": 345.55832, "r": 323.43362, "b": 353.88333, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 142.79999, "t": 364.51862, "r": 173.98318, "b": 372.84363, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "USAGE", "bbox": {"l": 142.79999, "t": 364.51862, "r": 173.98318, "b": 372.84363, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 216.77367999999998, "t": 364.51862, "r": 270.97977, "b": 372.84363, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "VARCHAR(7)", "bbox": {"l": 216.77367999999998, "t": 364.51862, "r": 270.97977, "b": 372.84363, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 289.41626, "t": 364.51862, "r": 346.88757, "b": 372.84363, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "Usage setting:", "bbox": {"l": 289.41626, "t": 364.51862, "r": 346.88757, "b": 372.84363, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 289.4397, "t": 375.69394000000005, "r": 293.9397, "b": 383.62292, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 375.69394000000005, "r": 293.9397, "b": 383.62292, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 303.83969, "t": 375.55893, "r": 535.16766, "b": 383.88394, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "ALLOWED: The user profile is allowed to use the function.", "bbox": {"l": 303.83969, "t": 375.55893, "r": 535.16766, "b": 383.88394, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 289.4397, "t": 386.67395, "r": 293.9397, "b": 394.60294, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 386.67395, "r": 293.9397, "b": 394.60294, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 303.83969, "t": 386.53894, "r": 539.10712, "b": 394.86395, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "DENIED: The user profile is not allowed to use the function.", "bbox": {"l": 303.83969, "t": 386.53894, "r": 539.10712, "b": 394.86395, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 142.8, "t": 405.55865, "r": 196.2249, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "USER_TYPE", "bbox": {"l": 142.8, "t": 405.55865, "r": 196.2249, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 216.75211, "t": 405.55865, "r": 270.99872, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "VARCHAR(5)", "bbox": {"l": 216.75211, "t": 405.55865, "r": 270.99872, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 289.43161, "t": 405.55865, "r": 367.8009, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "Type of user profile:", "bbox": {"l": 289.43161, "t": 405.55865, "r": 367.8009, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 289.4397, "t": 416.67368000000005, "r": 293.9397, "b": 424.60266, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 416.67368000000005, "r": 293.9397, "b": 424.60266, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 303.83969, "t": 416.53867, "r": 434.78159, "b": 424.86368, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "USER: The user profile is a user.", "bbox": {"l": 303.83969, "t": 416.53867, "r": 434.78159, "b": 424.86368, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 289.4397, "t": 427.65369, "r": 293.9397, "b": 435.58267000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 427.65369, "r": 293.9397, "b": 435.58267000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 303.83969, "t": 427.51868, "r": 448.11963000000003, "b": 435.84369, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "GROUP: The user profile is a group.", "bbox": {"l": 303.83969, "t": 427.51868, "r": 448.11963000000003, "b": 435.84369, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl"], "num_rows": 5, "num_cols": 3, "table_cells": [{"bbox": {"l": 142.8, "t": 296.5379899999999, "r": 202.245, "b": 304.86301, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Column name", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 216.80878999999996, "t": 296.5379899999999, "r": 257.21069, "b": 304.86301, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Data type", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 289.47479, "t": 296.5379899999999, "r": 338.89468, "b": 304.86301, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Description", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 142.8, "t": 315.55771, "r": 203.2323, "b": 323.88272, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "FUNCTION_ID", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 216.7854, "t": 315.55771, "r": 276.0036, "b": 323.88272, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(30)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.4577, "t": 315.55771, "r": 359.85394, "b": 323.88272, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "ID of the function.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 142.8, "t": 334.51801, "r": 198.6693, "b": 342.84302, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "USER_NAME", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 216.74129999999997, "t": 334.51801, "r": 275.92349, "b": 342.84302, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(10)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.38208, "t": 334.51801, "r": 515.05359, "b": 353.88333, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Name of the user profile that has a usage setting for this  function.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 142.79999, "t": 364.51862, "r": 173.98318, "b": 372.84363, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "USAGE", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 216.77367999999998, "t": 364.51862, "r": 270.97977, "b": 372.84363, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(7)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.41626, "t": 364.51862, "r": 539.10712, "b": 394.86395, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Usage setting: GLYPH<SM590000> ALLOWED: The user profile is allowed to use the function. GLYPH<SM590000> DENIED: The user profile is not allowed to use the function.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 142.8, "t": 405.55865, "r": 196.2249, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "USER_TYPE", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 216.75211, "t": 405.55865, "r": 270.99872, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(5)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.43161, "t": 405.55865, "r": 448.11963000000003, "b": 435.84369, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Type of user profile: GLYPH<SM590000> USER: The user profile is a user. GLYPH<SM590000> GROUP: The user profile is a group.", "column_header": false, "row_header": false, "row_section": false}]}], "headers": [{"label": "page_footer", "id": 14, "page_no": 7, "cluster": {"id": 14, "label": "page_footer", "bbox": {"l": 64.800003, "t": 754.848721, "r": 78.402, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.9166396856307983, "cells": [{"id": 0, "text": "10 ", "bbox": {"l": 64.800003, "t": 754.848721, "r": 78.402, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "10"}, {"label": "page_footer", "id": 10, "page_no": 7, "cluster": {"id": 10, "label": "page_footer", "bbox": {"l": 93.420303, "t": 755.538002, "r": 334.42142, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9530044198036194, "cells": [{"id": 1, "text": "Row and Column Access Control Support in IBM DB2 for i", "bbox": {"l": 93.420303, "t": 755.538002, "r": 334.42142, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Row and Column Access Control Support in IBM DB2 for i"}]}}, {"page_no": 8, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "Chapter 2. Roles and separation of duties ", "bbox": {"l": 355.32001, "t": 755.538002, "r": 523.54071, "b": 763.863001, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "11", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "For example, assume that a business has assigned the duty to manage security on IBM i to ", "bbox": {"l": 136.79959, "t": 71.50903000000005, "r": 542.69434, "b": 80.72204999999985, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Theresa. Before release IBM i 7.2, to grant privileges, Theresa had to have the same ", "bbox": {"l": 136.79959, "t": 83.50885000000017, "r": 513.67804, "b": 92.72185999999999, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "privileges Theresa was granting to others. Therefore, to grant *USE privileges to the ", "bbox": {"l": 136.79959, "t": 95.50867000000005, "r": 509.71902, "b": 104.72167999999999, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "PAYROLL table, Theresa had to have *OBJMGT and *USE authority (or a higher level of ", "bbox": {"l": 136.79959, "t": 107.50847999999996, "r": 528.20184, "b": 116.72149999999999, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "authority, such as *ALLOBJ). This requirement allowed Theresa to access the data in the ", "bbox": {"l": 136.79959, "t": 119.50829999999996, "r": 531.84015, "b": 128.72131000000002, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "PAYROLL table even though Theresa\u2019s job description was only to manage its security.", "bbox": {"l": 136.79959, "t": 131.50811999999996, "r": 519.24982, "b": 140.72113000000002, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "In IBM i 7.2, the QIBM_DB_SECADM function usage grants authorities, revokes authorities, ", "bbox": {"l": 136.79959, "t": 153.52770999999996, "r": 544.16064, "b": 162.74072, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "changes ownership, or changes the primary group without giving access to the object or, in ", "bbox": {"l": 136.79959, "t": 165.52752999999996, "r": 540.66156, "b": 174.74054, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "the case of a database table, to the data that is in the table or allowing other operations on the ", "bbox": {"l": 136.79959, "t": 177.52733999999998, "r": 547.30396, "b": 186.74036, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "table. ", "bbox": {"l": 136.79959, "t": 189.52715999999998, "r": 163.6189, "b": 198.74017000000003, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "QIBM_DB_SECADM function usage can be granted only by a user with *SECADM special ", "bbox": {"l": 136.79959, "t": 211.48694, "r": 538.65076, "b": 220.69994999999994, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "authority and can be given to a user or a group.", "bbox": {"l": 136.79959, "t": 223.48676, "r": 346.34808, "b": 232.69976999999994, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "QIBM_DB_SECADM also is responsible for administering RCAC, which restricts which rows ", "bbox": {"l": 136.79959, "t": 245.50635, "r": 545.79602, "b": 254.71936000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "a user is allowed to access in a table and whether a user is allowed to see information in ", "bbox": {"l": 136.79959, "t": 257.50616, "r": 529.46149, "b": 266.71918000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "certain columns of a table.", "bbox": {"l": 136.79959, "t": 269.50598, "r": 253.47696999999997, "b": 278.71898999999996, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "A preferred practice is that the RCAC administrator has the QIBM_DB_SECADM function ", "bbox": {"l": 136.79959, "t": 291.52557, "r": 533.78137, "b": 300.73856, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "usage ID, but absolutely no other data privileges. The result is that the RCAC administrator ", "bbox": {"l": 136.79959, "t": 303.52539, "r": 539.80713, "b": 312.73837000000003, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "can deploy and maintain the RCAC constructs, but cannot grant themselves unauthorized ", "bbox": {"l": 136.79959, "t": 315.52521, "r": 534.5741, "b": 324.73819, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "access to data itself.", "bbox": {"l": 136.79959, "t": 327.52502, "r": 227.02324, "b": 336.73801, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Table 2-2 shows a comparison of the different function usage IDs and *JOBCTL authority to ", "bbox": {"l": 136.79959, "t": 349.48483, "r": 543.06714, "b": 358.69780999999995, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "the different CL commands and DB2 for i tools.", "bbox": {"l": 136.79959, "t": 361.48465, "r": 343.79236, "b": 370.69763000000006, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Table 2-2 Comparison of the different function usage IDs and *JOBCTL authority", "bbox": {"l": 64.800003, "t": 383.5379899999999, "r": 391.75464, "b": 391.86301, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "User action", "bbox": {"l": 70.800301, "t": 400.51827999999995, "r": 119.78551, "b": 408.84329, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "*JOBCTL", "bbox": {"l": 424.93805, "t": 447.52255, "r": 433.26297000000005, "b": 487.01999, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "QIBM_DB_SECADM", "bbox": {"l": 450.13806, "t": 401.6000700000001, "r": 458.46298, "b": 487.01999, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "QIBM_DB_SQLADM", "bbox": {"l": 475.93835000000007, "t": 401.53442, "r": 484.26327999999995, "b": 487.01999, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "QIBM_DB_SYSMON", "bbox": {"l": 501.13837, "t": 401.6145, "r": 509.46329, "b": 487.01999, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "No Authority", "bbox": {"l": 526.39862, "t": 432.79944, "r": 534.72357, "b": 487.02005, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "SET CURRENT DEGREE", "bbox": {"l": 70.800003, "t": 498.69299, "r": 151.6794, "b": 506.66699, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": " (SQL statement)", "bbox": {"l": 151.6803, "t": 498.55798, "r": 220.15681000000004, "b": 506.883, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "X", "bbox": {"l": 429.0, "t": 498.55798, "r": 435.00299000000007, "b": 506.883, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "X", "bbox": {"l": 480.00031, "t": 498.55798, "r": 486.0033, "b": 506.883, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "CHGQRYA", "bbox": {"l": 70.800018, "t": 517.65329, "r": 102.23972, "b": 525.62729, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": " command targeting a different user\u2019s job", "bbox": {"l": 102.23972, "t": 517.51828, "r": 264.5538, "b": 525.84329, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "X", "bbox": {"l": 429.00003, "t": 517.51828, "r": 435.00302000000005, "b": 525.84329, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "X", "bbox": {"l": 480.00034, "t": 517.51828, "r": 486.00333, "b": 525.84329, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "STRDBMON", "bbox": {"l": 70.800049, "t": 536.67299, "r": 106.73975, "b": 544.64699, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": " or ", "bbox": {"l": 106.73975, "t": 536.5379800000001, "r": 119.77895, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "ENDDBMON", "bbox": {"l": 119.69975000000001, "t": 536.67299, "r": 155.69974, "b": 544.64699, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": " commands targeting a different user\u2019s job", "bbox": {"l": 155.69974, "t": 536.5379800000001, "r": 322.50574, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "X", "bbox": {"l": 429.00003, "t": 536.5379800000001, "r": 435.00302000000005, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "X", "bbox": {"l": 480.00034, "t": 536.5379800000001, "r": 486.00333, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "STRDBMON", "bbox": {"l": 70.800049, "t": 555.69269, "r": 106.73975, "b": 563.66669, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": " or ", "bbox": {"l": 106.73975, "t": 555.55768, "r": 119.77895, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "ENDDBMON", "bbox": {"l": 119.69975000000001, "t": 555.69269, "r": 155.69974, "b": 563.66669, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": " commands targeting a job that matches the current user", "bbox": {"l": 155.69974, "t": 555.55768, "r": 381.02185, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "X", "bbox": {"l": 429.00003, "t": 555.55768, "r": 435.00302000000005, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "X", "bbox": {"l": 480.00034, "t": 555.55768, "r": 486.00333, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "X", "bbox": {"l": 505.26061999999996, "t": 555.55768, "r": 511.26361, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "X", "bbox": {"l": 530.76031, "t": 555.55768, "r": 536.76331, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "QUSRJOBI() API format 900 or System i Navigator\u2019s SQL Details for Job", "bbox": {"l": 70.800049, "t": 574.51797, "r": 359.51736, "b": 582.84299, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "X", "bbox": {"l": 429.0000600000001, "t": 574.51797, "r": 435.00305000000003, "b": 582.84299, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "X", "bbox": {"l": 480.00037, "t": 574.51797, "r": 486.00335999999993, "b": 582.84299, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "X", "bbox": {"l": 505.2606799999999, "t": 574.51797, "r": 511.26367, "b": 582.84299, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Visual Explain within Run SQL scripts", "bbox": {"l": 70.800079, "t": 593.5376699999999, "r": 220.75178999999997, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "X", "bbox": {"l": 429.0000600000001, "t": 593.5376699999999, "r": 435.00305000000003, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "X", "bbox": {"l": 480.00037, "t": 593.5376699999999, "r": 486.00335999999993, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "X", "bbox": {"l": 505.2606799999999, "t": 593.5376699999999, "r": 511.26367, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "X", "bbox": {"l": 530.76038, "t": 593.5376699999999, "r": 536.76337, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "Visual Explain outside of Run SQL scripts", "bbox": {"l": 70.800079, "t": 612.55737, "r": 236.6548, "b": 620.88239, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "X", "bbox": {"l": 429.0000600000001, "t": 612.55737, "r": 435.00305000000003, "b": 620.88239, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "X", "bbox": {"l": 480.00037, "t": 612.55737, "r": 486.00335999999993, "b": 620.88239, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "ANALYZE PLAN CACHE procedure", "bbox": {"l": 70.800079, "t": 631.51767, "r": 213.12968, "b": 639.84268, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "X", "bbox": {"l": 429.0000600000001, "t": 631.51767, "r": 435.00305000000003, "b": 639.84268, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "X", "bbox": {"l": 480.00037, "t": 631.51767, "r": 486.00335999999993, "b": 639.84268, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "DUMP PLAN CACHE procedure", "bbox": {"l": 70.800079, "t": 650.53737, "r": 199.87808, "b": 658.86238, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "X", "bbox": {"l": 429.0000600000001, "t": 650.53737, "r": 435.00305000000003, "b": 658.86238, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "X", "bbox": {"l": 480.00037, "t": 650.53737, "r": 486.00335999999993, "b": 658.86238, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "MODIFY PLAN CACHE procedure", "bbox": {"l": 70.800079, "t": 669.55708, "r": 208.36777, "b": 677.88207, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "X", "bbox": {"l": 429.0000600000001, "t": 669.55708, "r": 435.00305000000003, "b": 677.88207, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "X", "bbox": {"l": 480.00037, "t": 669.55708, "r": 486.00335999999993, "b": 677.88207, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "MODIFY PLAN CACHE PROPERTIES procedure (currently does not check authority)", "bbox": {"l": 70.800079, "t": 688.57677, "r": 411.20264, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "X", "bbox": {"l": 429.0000600000001, "t": 688.57677, "r": 435.00305000000003, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "X", "bbox": {"l": 480.00037, "t": 688.57677, "r": 486.00335999999993, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "CHANGE PLAN CACHE SIZE procedure (currently does not check authority)", "bbox": {"l": 70.800079, "t": 707.537071, "r": 377.12585, "b": 715.862068, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "X", "bbox": {"l": 429.0000600000001, "t": 707.537071, "r": 435.00305000000003, "b": 715.862068, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "X", "bbox": {"l": 480.00037, "t": 707.537071, "r": 486.00335999999993, "b": 715.862068, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 7, "label": "page_footer", "bbox": {"l": 355.32001, "t": 755.538002, "r": 523.54071, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9508126974105835, "cells": [{"id": 0, "text": "Chapter 2. Roles and separation of duties ", "bbox": {"l": 355.32001, "t": 755.538002, "r": 523.54071, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "page_footer", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.8987306356430054, "cells": [{"id": 1, "text": "11", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 136.79959, "t": 71.50903000000005, "r": 542.69434, "b": 140.72113000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9789126515388489, "cells": [{"id": 2, "text": "For example, assume that a business has assigned the duty to manage security on IBM i to ", "bbox": {"l": 136.79959, "t": 71.50903000000005, "r": 542.69434, "b": 80.72204999999985, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Theresa. Before release IBM i 7.2, to grant privileges, Theresa had to have the same ", "bbox": {"l": 136.79959, "t": 83.50885000000017, "r": 513.67804, "b": 92.72185999999999, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "privileges Theresa was granting to others. Therefore, to grant *USE privileges to the ", "bbox": {"l": 136.79959, "t": 95.50867000000005, "r": 509.71902, "b": 104.72167999999999, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "PAYROLL table, Theresa had to have *OBJMGT and *USE authority (or a higher level of ", "bbox": {"l": 136.79959, "t": 107.50847999999996, "r": 528.20184, "b": 116.72149999999999, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "authority, such as *ALLOBJ). This requirement allowed Theresa to access the data in the ", "bbox": {"l": 136.79959, "t": 119.50829999999996, "r": 531.84015, "b": 128.72131000000002, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "PAYROLL table even though Theresa\u2019s job description was only to manage its security.", "bbox": {"l": 136.79959, "t": 131.50811999999996, "r": 519.24982, "b": 140.72113000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "text", "bbox": {"l": 136.79959, "t": 153.52770999999996, "r": 547.30396, "b": 198.74017000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9665539860725403, "cells": [{"id": 8, "text": "In IBM i 7.2, the QIBM_DB_SECADM function usage grants authorities, revokes authorities, ", "bbox": {"l": 136.79959, "t": 153.52770999999996, "r": 544.16064, "b": 162.74072, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "changes ownership, or changes the primary group without giving access to the object or, in ", "bbox": {"l": 136.79959, "t": 165.52752999999996, "r": 540.66156, "b": 174.74054, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "the case of a database table, to the data that is in the table or allowing other operations on the ", "bbox": {"l": 136.79959, "t": 177.52733999999998, "r": 547.30396, "b": 186.74036, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "table. ", "bbox": {"l": 136.79959, "t": 189.52715999999998, "r": 163.6189, "b": 198.74017000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "text", "bbox": {"l": 136.79959, "t": 211.48694, "r": 538.65076, "b": 232.69976999999994, "coord_origin": "TOPLEFT"}, "confidence": 0.9691813588142395, "cells": [{"id": 12, "text": "QIBM_DB_SECADM function usage can be granted only by a user with *SECADM special ", "bbox": {"l": 136.79959, "t": 211.48694, "r": 538.65076, "b": 220.69994999999994, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "authority and can be given to a user or a group.", "bbox": {"l": 136.79959, "t": 223.48676, "r": 346.34808, "b": 232.69976999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 136.79959, "t": 245.50635, "r": 545.79602, "b": 278.71898999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9729602336883545, "cells": [{"id": 14, "text": "QIBM_DB_SECADM also is responsible for administering RCAC, which restricts which rows ", "bbox": {"l": 136.79959, "t": 245.50635, "r": 545.79602, "b": 254.71936000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "a user is allowed to access in a table and whether a user is allowed to see information in ", "bbox": {"l": 136.79959, "t": 257.50616, "r": 529.46149, "b": 266.71918000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "certain columns of a table.", "bbox": {"l": 136.79959, "t": 269.50598, "r": 253.47696999999997, "b": 278.71898999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 136.79959, "t": 291.52557, "r": 539.80713, "b": 336.73801, "coord_origin": "TOPLEFT"}, "confidence": 0.9815152883529663, "cells": [{"id": 17, "text": "A preferred practice is that the RCAC administrator has the QIBM_DB_SECADM function ", "bbox": {"l": 136.79959, "t": 291.52557, "r": 533.78137, "b": 300.73856, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "usage ID, but absolutely no other data privileges. The result is that the RCAC administrator ", "bbox": {"l": 136.79959, "t": 303.52539, "r": 539.80713, "b": 312.73837000000003, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "can deploy and maintain the RCAC constructs, but cannot grant themselves unauthorized ", "bbox": {"l": 136.79959, "t": 315.52521, "r": 534.5741, "b": 324.73819, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "access to data itself.", "bbox": {"l": 136.79959, "t": 327.52502, "r": 227.02324, "b": 336.73801, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "text", "bbox": {"l": 136.79959, "t": 349.48483, "r": 543.06714, "b": 370.69763000000006, "coord_origin": "TOPLEFT"}, "confidence": 0.9672255516052246, "cells": [{"id": 21, "text": "Table 2-2 shows a comparison of the different function usage IDs and *JOBCTL authority to ", "bbox": {"l": 136.79959, "t": 349.48483, "r": 543.06714, "b": 358.69780999999995, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "the different CL commands and DB2 for i tools.", "bbox": {"l": 136.79959, "t": 361.48465, "r": 343.79236, "b": 370.69763000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "caption", "bbox": {"l": 64.800003, "t": 383.5379899999999, "r": 391.75464, "b": 391.86301, "coord_origin": "TOPLEFT"}, "confidence": 0.9337190985679626, "cells": [{"id": 23, "text": "Table 2-2 Comparison of the different function usage IDs and *JOBCTL authority", "bbox": {"l": 64.800003, "t": 383.5379899999999, "r": 391.75464, "b": 391.86301, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "table", "bbox": {"l": 64.41139221191406, "t": 393.6136169433594, "r": 547.3950805664062, "b": 721.60791015625, "coord_origin": "TOPLEFT"}, "confidence": 0.9899572730064392, "cells": [{"id": 24, "text": "User action", "bbox": {"l": 70.800301, "t": 400.51827999999995, "r": 119.78551, "b": 408.84329, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "*JOBCTL", "bbox": {"l": 424.93805, "t": 447.52255, "r": 433.26297000000005, "b": 487.01999, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "QIBM_DB_SECADM", "bbox": {"l": 450.13806, "t": 401.6000700000001, "r": 458.46298, "b": 487.01999, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "QIBM_DB_SQLADM", "bbox": {"l": 475.93835000000007, "t": 401.53442, "r": 484.26327999999995, "b": 487.01999, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "QIBM_DB_SYSMON", "bbox": {"l": 501.13837, "t": 401.6145, "r": 509.46329, "b": 487.01999, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "No Authority", "bbox": {"l": 526.39862, "t": 432.79944, "r": 534.72357, "b": 487.02005, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "SET CURRENT DEGREE", "bbox": {"l": 70.800003, "t": 498.69299, "r": 151.6794, "b": 506.66699, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": " (SQL statement)", "bbox": {"l": 151.6803, "t": 498.55798, "r": 220.15681000000004, "b": 506.883, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "X", "bbox": {"l": 429.0, "t": 498.55798, "r": 435.00299000000007, "b": 506.883, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "X", "bbox": {"l": 480.00031, "t": 498.55798, "r": 486.0033, "b": 506.883, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "CHGQRYA", "bbox": {"l": 70.800018, "t": 517.65329, "r": 102.23972, "b": 525.62729, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": " command targeting a different user\u2019s job", "bbox": {"l": 102.23972, "t": 517.51828, "r": 264.5538, "b": 525.84329, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "X", "bbox": {"l": 429.00003, "t": 517.51828, "r": 435.00302000000005, "b": 525.84329, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "X", "bbox": {"l": 480.00034, "t": 517.51828, "r": 486.00333, "b": 525.84329, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "STRDBMON", "bbox": {"l": 70.800049, "t": 536.67299, "r": 106.73975, "b": 544.64699, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": " or ", "bbox": {"l": 106.73975, "t": 536.5379800000001, "r": 119.77895, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "ENDDBMON", "bbox": {"l": 119.69975000000001, "t": 536.67299, "r": 155.69974, "b": 544.64699, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": " commands targeting a different user\u2019s job", "bbox": {"l": 155.69974, "t": 536.5379800000001, "r": 322.50574, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "X", "bbox": {"l": 429.00003, "t": 536.5379800000001, "r": 435.00302000000005, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "X", "bbox": {"l": 480.00034, "t": 536.5379800000001, "r": 486.00333, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "STRDBMON", "bbox": {"l": 70.800049, "t": 555.69269, "r": 106.73975, "b": 563.66669, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": " or ", "bbox": {"l": 106.73975, "t": 555.55768, "r": 119.77895, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "ENDDBMON", "bbox": {"l": 119.69975000000001, "t": 555.69269, "r": 155.69974, "b": 563.66669, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": " commands targeting a job that matches the current user", "bbox": {"l": 155.69974, "t": 555.55768, "r": 381.02185, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "X", "bbox": {"l": 429.00003, "t": 555.55768, "r": 435.00302000000005, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "X", "bbox": {"l": 480.00034, "t": 555.55768, "r": 486.00333, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "X", "bbox": {"l": 505.26061999999996, "t": 555.55768, "r": 511.26361, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "X", "bbox": {"l": 530.76031, "t": 555.55768, "r": 536.76331, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "QUSRJOBI() API format 900 or System i Navigator\u2019s SQL Details for Job", "bbox": {"l": 70.800049, "t": 574.51797, "r": 359.51736, "b": 582.84299, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "X", "bbox": {"l": 429.0000600000001, "t": 574.51797, "r": 435.00305000000003, "b": 582.84299, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "X", "bbox": {"l": 480.00037, "t": 574.51797, "r": 486.00335999999993, "b": 582.84299, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "X", "bbox": {"l": 505.2606799999999, "t": 574.51797, "r": 511.26367, "b": 582.84299, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Visual Explain within Run SQL scripts", "bbox": {"l": 70.800079, "t": 593.5376699999999, "r": 220.75178999999997, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "X", "bbox": {"l": 429.0000600000001, "t": 593.5376699999999, "r": 435.00305000000003, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "X", "bbox": {"l": 480.00037, "t": 593.5376699999999, "r": 486.00335999999993, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "X", "bbox": {"l": 505.2606799999999, "t": 593.5376699999999, "r": 511.26367, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "X", "bbox": {"l": 530.76038, "t": 593.5376699999999, "r": 536.76337, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "Visual Explain outside of Run SQL scripts", "bbox": {"l": 70.800079, "t": 612.55737, "r": 236.6548, "b": 620.88239, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "X", "bbox": {"l": 429.0000600000001, "t": 612.55737, "r": 435.00305000000003, "b": 620.88239, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "X", "bbox": {"l": 480.00037, "t": 612.55737, "r": 486.00335999999993, "b": 620.88239, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "ANALYZE PLAN CACHE procedure", "bbox": {"l": 70.800079, "t": 631.51767, "r": 213.12968, "b": 639.84268, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "X", "bbox": {"l": 429.0000600000001, "t": 631.51767, "r": 435.00305000000003, "b": 639.84268, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "X", "bbox": {"l": 480.00037, "t": 631.51767, "r": 486.00335999999993, "b": 639.84268, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "DUMP PLAN CACHE procedure", "bbox": {"l": 70.800079, "t": 650.53737, "r": 199.87808, "b": 658.86238, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "X", "bbox": {"l": 429.0000600000001, "t": 650.53737, "r": 435.00305000000003, "b": 658.86238, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "X", "bbox": {"l": 480.00037, "t": 650.53737, "r": 486.00335999999993, "b": 658.86238, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "MODIFY PLAN CACHE procedure", "bbox": {"l": 70.800079, "t": 669.55708, "r": 208.36777, "b": 677.88207, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "X", "bbox": {"l": 429.0000600000001, "t": 669.55708, "r": 435.00305000000003, "b": 677.88207, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "X", "bbox": {"l": 480.00037, "t": 669.55708, "r": 486.00335999999993, "b": 677.88207, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "MODIFY PLAN CACHE PROPERTIES procedure (currently does not check authority)", "bbox": {"l": 70.800079, "t": 688.57677, "r": 411.20264, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "X", "bbox": {"l": 429.0000600000001, "t": 688.57677, "r": 435.00305000000003, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "X", "bbox": {"l": 480.00037, "t": 688.57677, "r": 486.00335999999993, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "CHANGE PLAN CACHE SIZE procedure (currently does not check authority)", "bbox": {"l": 70.800079, "t": 707.537071, "r": 377.12585, "b": 715.862068, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "X", "bbox": {"l": 429.0000600000001, "t": 707.537071, "r": 435.00305000000003, "b": 715.862068, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "X", "bbox": {"l": 480.00037, "t": 707.537071, "r": 486.00335999999993, "b": 715.862068, "coord_origin": "TOPLEFT"}}], "children": [{"id": 10, "label": "text", "bbox": {"l": 70.800301, "t": 400.51827999999995, "r": 119.78551, "b": 408.84329, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "User action", "bbox": {"l": 70.800301, "t": 400.51827999999995, "r": 119.78551, "b": 408.84329, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 424.93805, "t": 447.52255, "r": 433.26297000000005, "b": 487.01999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "*JOBCTL", "bbox": {"l": 424.93805, "t": 447.52255, "r": 433.26297000000005, "b": 487.01999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 450.13806, "t": 401.6000700000001, "r": 458.46298, "b": 487.01999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "QIBM_DB_SECADM", "bbox": {"l": 450.13806, "t": 401.6000700000001, "r": 458.46298, "b": 487.01999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 475.93835000000007, "t": 401.53442, "r": 484.26327999999995, "b": 487.01999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "QIBM_DB_SQLADM", "bbox": {"l": 475.93835000000007, "t": 401.53442, "r": 484.26327999999995, "b": 487.01999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 501.13837, "t": 401.6145, "r": 509.46329, "b": 487.01999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "QIBM_DB_SYSMON", "bbox": {"l": 501.13837, "t": 401.6145, "r": 509.46329, "b": 487.01999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 526.39862, "t": 432.79944, "r": 534.72357, "b": 487.02005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "No Authority", "bbox": {"l": 526.39862, "t": 432.79944, "r": 534.72357, "b": 487.02005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 70.800003, "t": 498.69299, "r": 151.6794, "b": 506.66699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "SET CURRENT DEGREE", "bbox": {"l": 70.800003, "t": 498.69299, "r": 151.6794, "b": 506.66699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 151.6803, "t": 498.55798, "r": 220.15681000000004, "b": 506.883, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": " (SQL statement)", "bbox": {"l": 151.6803, "t": 498.55798, "r": 220.15681000000004, "b": 506.883, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 429.0, "t": 498.55798, "r": 435.00299000000007, "b": 506.883, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "X", "bbox": {"l": 429.0, "t": 498.55798, "r": 435.00299000000007, "b": 506.883, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 480.00031, "t": 498.55798, "r": 486.0033, "b": 506.883, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "X", "bbox": {"l": 480.00031, "t": 498.55798, "r": 486.0033, "b": 506.883, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 70.800018, "t": 517.65329, "r": 102.23972, "b": 525.62729, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "CHGQRYA", "bbox": {"l": 70.800018, "t": 517.65329, "r": 102.23972, "b": 525.62729, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 102.23972, "t": 517.51828, "r": 264.5538, "b": 525.84329, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": " command targeting a different user\u2019s job", "bbox": {"l": 102.23972, "t": 517.51828, "r": 264.5538, "b": 525.84329, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 429.00003, "t": 517.51828, "r": 435.00302000000005, "b": 525.84329, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "X", "bbox": {"l": 429.00003, "t": 517.51828, "r": 435.00302000000005, "b": 525.84329, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 480.00034, "t": 517.51828, "r": 486.00333, "b": 525.84329, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "X", "bbox": {"l": 480.00034, "t": 517.51828, "r": 486.00333, "b": 525.84329, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 70.800049, "t": 536.67299, "r": 106.73975, "b": 544.64699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "STRDBMON", "bbox": {"l": 70.800049, "t": 536.67299, "r": 106.73975, "b": 544.64699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 106.73975, "t": 536.5379800000001, "r": 119.77895, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": " or ", "bbox": {"l": 106.73975, "t": 536.5379800000001, "r": 119.77895, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 119.69975000000001, "t": 536.67299, "r": 155.69974, "b": 544.64699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "ENDDBMON", "bbox": {"l": 119.69975000000001, "t": 536.67299, "r": 155.69974, "b": 544.64699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 155.69974, "t": 536.5379800000001, "r": 322.50574, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": " commands targeting a different user\u2019s job", "bbox": {"l": 155.69974, "t": 536.5379800000001, "r": 322.50574, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 429.00003, "t": 536.5379800000001, "r": 435.00302000000005, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "X", "bbox": {"l": 429.00003, "t": 536.5379800000001, "r": 435.00302000000005, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 480.00034, "t": 536.5379800000001, "r": 486.00333, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "X", "bbox": {"l": 480.00034, "t": 536.5379800000001, "r": 486.00333, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 70.800049, "t": 555.69269, "r": 106.73975, "b": 563.66669, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "STRDBMON", "bbox": {"l": 70.800049, "t": 555.69269, "r": 106.73975, "b": 563.66669, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 106.73975, "t": 555.55768, "r": 119.77895, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": " or ", "bbox": {"l": 106.73975, "t": 555.55768, "r": 119.77895, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 119.69975000000001, "t": 555.69269, "r": 155.69974, "b": 563.66669, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "ENDDBMON", "bbox": {"l": 119.69975000000001, "t": 555.69269, "r": 155.69974, "b": 563.66669, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 155.69974, "t": 555.55768, "r": 381.02185, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": " commands targeting a job that matches the current user", "bbox": {"l": 155.69974, "t": 555.55768, "r": 381.02185, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 429.00003, "t": 555.55768, "r": 435.00302000000005, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "X", "bbox": {"l": 429.00003, "t": 555.55768, "r": 435.00302000000005, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 480.00034, "t": 555.55768, "r": 486.00333, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "X", "bbox": {"l": 480.00034, "t": 555.55768, "r": 486.00333, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 505.26061999999996, "t": 555.55768, "r": 511.26361, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "X", "bbox": {"l": 505.26061999999996, "t": 555.55768, "r": 511.26361, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 530.76031, "t": 555.55768, "r": 536.76331, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "X", "bbox": {"l": 530.76031, "t": 555.55768, "r": 536.76331, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 70.800049, "t": 574.51797, "r": 359.51736, "b": 582.84299, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "QUSRJOBI() API format 900 or System i Navigator\u2019s SQL Details for Job", "bbox": {"l": 70.800049, "t": 574.51797, "r": 359.51736, "b": 582.84299, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 429.0000600000001, "t": 574.51797, "r": 435.00305000000003, "b": 582.84299, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "X", "bbox": {"l": 429.0000600000001, "t": 574.51797, "r": 435.00305000000003, "b": 582.84299, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 480.00037, "t": 574.51797, "r": 486.00335999999993, "b": 582.84299, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "X", "bbox": {"l": 480.00037, "t": 574.51797, "r": 486.00335999999993, "b": 582.84299, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 505.2606799999999, "t": 574.51797, "r": 511.26367, "b": 582.84299, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "X", "bbox": {"l": 505.2606799999999, "t": 574.51797, "r": 511.26367, "b": 582.84299, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 70.800079, "t": 593.5376699999999, "r": 220.75178999999997, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "Visual Explain within Run SQL scripts", "bbox": {"l": 70.800079, "t": 593.5376699999999, "r": 220.75178999999997, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 429.0000600000001, "t": 593.5376699999999, "r": 435.00305000000003, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "X", "bbox": {"l": 429.0000600000001, "t": 593.5376699999999, "r": 435.00305000000003, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 480.00037, "t": 593.5376699999999, "r": 486.00335999999993, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "X", "bbox": {"l": 480.00037, "t": 593.5376699999999, "r": 486.00335999999993, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 505.2606799999999, "t": 593.5376699999999, "r": 511.26367, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "X", "bbox": {"l": 505.2606799999999, "t": 593.5376699999999, "r": 511.26367, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 530.76038, "t": 593.5376699999999, "r": 536.76337, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "X", "bbox": {"l": 530.76038, "t": 593.5376699999999, "r": 536.76337, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 70.800079, "t": 612.55737, "r": 236.6548, "b": 620.88239, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "Visual Explain outside of Run SQL scripts", "bbox": {"l": 70.800079, "t": 612.55737, "r": 236.6548, "b": 620.88239, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 429.0000600000001, "t": 612.55737, "r": 435.00305000000003, "b": 620.88239, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "X", "bbox": {"l": 429.0000600000001, "t": 612.55737, "r": 435.00305000000003, "b": 620.88239, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 480.00037, "t": 612.55737, "r": 486.00335999999993, "b": 620.88239, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "X", "bbox": {"l": 480.00037, "t": 612.55737, "r": 486.00335999999993, "b": 620.88239, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 70.800079, "t": 631.51767, "r": 213.12968, "b": 639.84268, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "ANALYZE PLAN CACHE procedure", "bbox": {"l": 70.800079, "t": 631.51767, "r": 213.12968, "b": 639.84268, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 429.0000600000001, "t": 631.51767, "r": 435.00305000000003, "b": 639.84268, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "X", "bbox": {"l": 429.0000600000001, "t": 631.51767, "r": 435.00305000000003, "b": 639.84268, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 480.00037, "t": 631.51767, "r": 486.00335999999993, "b": 639.84268, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "X", "bbox": {"l": 480.00037, "t": 631.51767, "r": 486.00335999999993, "b": 639.84268, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 70.800079, "t": 650.53737, "r": 199.87808, "b": 658.86238, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "DUMP PLAN CACHE procedure", "bbox": {"l": 70.800079, "t": 650.53737, "r": 199.87808, "b": 658.86238, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 429.0000600000001, "t": 650.53737, "r": 435.00305000000003, "b": 658.86238, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "X", "bbox": {"l": 429.0000600000001, "t": 650.53737, "r": 435.00305000000003, "b": 658.86238, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 480.00037, "t": 650.53737, "r": 486.00335999999993, "b": 658.86238, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "X", "bbox": {"l": 480.00037, "t": 650.53737, "r": 486.00335999999993, "b": 658.86238, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 70.800079, "t": 669.55708, "r": 208.36777, "b": 677.88207, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "MODIFY PLAN CACHE procedure", "bbox": {"l": 70.800079, "t": 669.55708, "r": 208.36777, "b": 677.88207, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 429.0000600000001, "t": 669.55708, "r": 435.00305000000003, "b": 677.88207, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "X", "bbox": {"l": 429.0000600000001, "t": 669.55708, "r": 435.00305000000003, "b": 677.88207, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 480.00037, "t": 669.55708, "r": 486.00335999999993, "b": 677.88207, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "X", "bbox": {"l": 480.00037, "t": 669.55708, "r": 486.00335999999993, "b": 677.88207, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 70.800079, "t": 688.57677, "r": 411.20264, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "MODIFY PLAN CACHE PROPERTIES procedure (currently does not check authority)", "bbox": {"l": 70.800079, "t": 688.57677, "r": 411.20264, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 429.0000600000001, "t": 688.57677, "r": 435.00305000000003, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "X", "bbox": {"l": 429.0000600000001, "t": 688.57677, "r": 435.00305000000003, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 480.00037, "t": 688.57677, "r": 486.00335999999993, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "X", "bbox": {"l": 480.00037, "t": 688.57677, "r": 486.00335999999993, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 70.800079, "t": 707.537071, "r": 377.12585, "b": 715.862068, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "CHANGE PLAN CACHE SIZE procedure (currently does not check authority)", "bbox": {"l": 70.800079, "t": 707.537071, "r": 377.12585, "b": 715.862068, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 429.0000600000001, "t": 707.537071, "r": 435.00305000000003, "b": 715.862068, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "X", "bbox": {"l": 429.0000600000001, "t": 707.537071, "r": 435.00305000000003, "b": 715.862068, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 480.00037, "t": 707.537071, "r": 486.00335999999993, "b": 715.862068, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "X", "bbox": {"l": 480.00037, "t": 707.537071, "r": 486.00335999999993, "b": 715.862068, "coord_origin": "TOPLEFT"}}], "children": []}]}]}, "tablestructure": {"table_map": {"0": {"label": "table", "id": 0, "page_no": 8, "cluster": {"id": 0, "label": "table", "bbox": {"l": 64.41139221191406, "t": 393.6136169433594, "r": 547.3950805664062, "b": 721.60791015625, "coord_origin": "TOPLEFT"}, "confidence": 0.9899572730064392, "cells": [{"id": 24, "text": "User action", "bbox": {"l": 70.800301, "t": 400.51827999999995, "r": 119.78551, "b": 408.84329, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "*JOBCTL", "bbox": {"l": 424.93805, "t": 447.52255, "r": 433.26297000000005, "b": 487.01999, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "QIBM_DB_SECADM", "bbox": {"l": 450.13806, "t": 401.6000700000001, "r": 458.46298, "b": 487.01999, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "QIBM_DB_SQLADM", "bbox": {"l": 475.93835000000007, "t": 401.53442, "r": 484.26327999999995, "b": 487.01999, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "QIBM_DB_SYSMON", "bbox": {"l": 501.13837, "t": 401.6145, "r": 509.46329, "b": 487.01999, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "No Authority", "bbox": {"l": 526.39862, "t": 432.79944, "r": 534.72357, "b": 487.02005, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "SET CURRENT DEGREE", "bbox": {"l": 70.800003, "t": 498.69299, "r": 151.6794, "b": 506.66699, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": " (SQL statement)", "bbox": {"l": 151.6803, "t": 498.55798, "r": 220.15681000000004, "b": 506.883, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "X", "bbox": {"l": 429.0, "t": 498.55798, "r": 435.00299000000007, "b": 506.883, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "X", "bbox": {"l": 480.00031, "t": 498.55798, "r": 486.0033, "b": 506.883, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "CHGQRYA", "bbox": {"l": 70.800018, "t": 517.65329, "r": 102.23972, "b": 525.62729, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": " command targeting a different user\u2019s job", "bbox": {"l": 102.23972, "t": 517.51828, "r": 264.5538, "b": 525.84329, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "X", "bbox": {"l": 429.00003, "t": 517.51828, "r": 435.00302000000005, "b": 525.84329, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "X", "bbox": {"l": 480.00034, "t": 517.51828, "r": 486.00333, "b": 525.84329, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "STRDBMON", "bbox": {"l": 70.800049, "t": 536.67299, "r": 106.73975, "b": 544.64699, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": " or ", "bbox": {"l": 106.73975, "t": 536.5379800000001, "r": 119.77895, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "ENDDBMON", "bbox": {"l": 119.69975000000001, "t": 536.67299, "r": 155.69974, "b": 544.64699, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": " commands targeting a different user\u2019s job", "bbox": {"l": 155.69974, "t": 536.5379800000001, "r": 322.50574, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "X", "bbox": {"l": 429.00003, "t": 536.5379800000001, "r": 435.00302000000005, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "X", "bbox": {"l": 480.00034, "t": 536.5379800000001, "r": 486.00333, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "STRDBMON", "bbox": {"l": 70.800049, "t": 555.69269, "r": 106.73975, "b": 563.66669, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": " or ", "bbox": {"l": 106.73975, "t": 555.55768, "r": 119.77895, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "ENDDBMON", "bbox": {"l": 119.69975000000001, "t": 555.69269, "r": 155.69974, "b": 563.66669, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": " commands targeting a job that matches the current user", "bbox": {"l": 155.69974, "t": 555.55768, "r": 381.02185, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "X", "bbox": {"l": 429.00003, "t": 555.55768, "r": 435.00302000000005, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "X", "bbox": {"l": 480.00034, "t": 555.55768, "r": 486.00333, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "X", "bbox": {"l": 505.26061999999996, "t": 555.55768, "r": 511.26361, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "X", "bbox": {"l": 530.76031, "t": 555.55768, "r": 536.76331, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "QUSRJOBI() API format 900 or System i Navigator\u2019s SQL Details for Job", "bbox": {"l": 70.800049, "t": 574.51797, "r": 359.51736, "b": 582.84299, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "X", "bbox": {"l": 429.0000600000001, "t": 574.51797, "r": 435.00305000000003, "b": 582.84299, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "X", "bbox": {"l": 480.00037, "t": 574.51797, "r": 486.00335999999993, "b": 582.84299, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "X", "bbox": {"l": 505.2606799999999, "t": 574.51797, "r": 511.26367, "b": 582.84299, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Visual Explain within Run SQL scripts", "bbox": {"l": 70.800079, "t": 593.5376699999999, "r": 220.75178999999997, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "X", "bbox": {"l": 429.0000600000001, "t": 593.5376699999999, "r": 435.00305000000003, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "X", "bbox": {"l": 480.00037, "t": 593.5376699999999, "r": 486.00335999999993, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "X", "bbox": {"l": 505.2606799999999, "t": 593.5376699999999, "r": 511.26367, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "X", "bbox": {"l": 530.76038, "t": 593.5376699999999, "r": 536.76337, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "Visual Explain outside of Run SQL scripts", "bbox": {"l": 70.800079, "t": 612.55737, "r": 236.6548, "b": 620.88239, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "X", "bbox": {"l": 429.0000600000001, "t": 612.55737, "r": 435.00305000000003, "b": 620.88239, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "X", "bbox": {"l": 480.00037, "t": 612.55737, "r": 486.00335999999993, "b": 620.88239, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "ANALYZE PLAN CACHE procedure", "bbox": {"l": 70.800079, "t": 631.51767, "r": 213.12968, "b": 639.84268, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "X", "bbox": {"l": 429.0000600000001, "t": 631.51767, "r": 435.00305000000003, "b": 639.84268, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "X", "bbox": {"l": 480.00037, "t": 631.51767, "r": 486.00335999999993, "b": 639.84268, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "DUMP PLAN CACHE procedure", "bbox": {"l": 70.800079, "t": 650.53737, "r": 199.87808, "b": 658.86238, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "X", "bbox": {"l": 429.0000600000001, "t": 650.53737, "r": 435.00305000000003, "b": 658.86238, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "X", "bbox": {"l": 480.00037, "t": 650.53737, "r": 486.00335999999993, "b": 658.86238, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "MODIFY PLAN CACHE procedure", "bbox": {"l": 70.800079, "t": 669.55708, "r": 208.36777, "b": 677.88207, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "X", "bbox": {"l": 429.0000600000001, "t": 669.55708, "r": 435.00305000000003, "b": 677.88207, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "X", "bbox": {"l": 480.00037, "t": 669.55708, "r": 486.00335999999993, "b": 677.88207, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "MODIFY PLAN CACHE PROPERTIES procedure (currently does not check authority)", "bbox": {"l": 70.800079, "t": 688.57677, "r": 411.20264, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "X", "bbox": {"l": 429.0000600000001, "t": 688.57677, "r": 435.00305000000003, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "X", "bbox": {"l": 480.00037, "t": 688.57677, "r": 486.00335999999993, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "CHANGE PLAN CACHE SIZE procedure (currently does not check authority)", "bbox": {"l": 70.800079, "t": 707.537071, "r": 377.12585, "b": 715.862068, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "X", "bbox": {"l": 429.0000600000001, "t": 707.537071, "r": 435.00305000000003, "b": 715.862068, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "X", "bbox": {"l": 480.00037, "t": 707.537071, "r": 486.00335999999993, "b": 715.862068, "coord_origin": "TOPLEFT"}}], "children": [{"id": 10, "label": "text", "bbox": {"l": 70.800301, "t": 400.51827999999995, "r": 119.78551, "b": 408.84329, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "User action", "bbox": {"l": 70.800301, "t": 400.51827999999995, "r": 119.78551, "b": 408.84329, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 424.93805, "t": 447.52255, "r": 433.26297000000005, "b": 487.01999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "*JOBCTL", "bbox": {"l": 424.93805, "t": 447.52255, "r": 433.26297000000005, "b": 487.01999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 450.13806, "t": 401.6000700000001, "r": 458.46298, "b": 487.01999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "QIBM_DB_SECADM", "bbox": {"l": 450.13806, "t": 401.6000700000001, "r": 458.46298, "b": 487.01999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 475.93835000000007, "t": 401.53442, "r": 484.26327999999995, "b": 487.01999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "QIBM_DB_SQLADM", "bbox": {"l": 475.93835000000007, "t": 401.53442, "r": 484.26327999999995, "b": 487.01999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 501.13837, "t": 401.6145, "r": 509.46329, "b": 487.01999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "QIBM_DB_SYSMON", "bbox": {"l": 501.13837, "t": 401.6145, "r": 509.46329, "b": 487.01999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 526.39862, "t": 432.79944, "r": 534.72357, "b": 487.02005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "No Authority", "bbox": {"l": 526.39862, "t": 432.79944, "r": 534.72357, "b": 487.02005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 70.800003, "t": 498.69299, "r": 151.6794, "b": 506.66699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "SET CURRENT DEGREE", "bbox": {"l": 70.800003, "t": 498.69299, "r": 151.6794, "b": 506.66699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 151.6803, "t": 498.55798, "r": 220.15681000000004, "b": 506.883, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": " (SQL statement)", "bbox": {"l": 151.6803, "t": 498.55798, "r": 220.15681000000004, "b": 506.883, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 429.0, "t": 498.55798, "r": 435.00299000000007, "b": 506.883, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "X", "bbox": {"l": 429.0, "t": 498.55798, "r": 435.00299000000007, "b": 506.883, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 480.00031, "t": 498.55798, "r": 486.0033, "b": 506.883, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "X", "bbox": {"l": 480.00031, "t": 498.55798, "r": 486.0033, "b": 506.883, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 70.800018, "t": 517.65329, "r": 102.23972, "b": 525.62729, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "CHGQRYA", "bbox": {"l": 70.800018, "t": 517.65329, "r": 102.23972, "b": 525.62729, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 102.23972, "t": 517.51828, "r": 264.5538, "b": 525.84329, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": " command targeting a different user\u2019s job", "bbox": {"l": 102.23972, "t": 517.51828, "r": 264.5538, "b": 525.84329, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 429.00003, "t": 517.51828, "r": 435.00302000000005, "b": 525.84329, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "X", "bbox": {"l": 429.00003, "t": 517.51828, "r": 435.00302000000005, "b": 525.84329, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 480.00034, "t": 517.51828, "r": 486.00333, "b": 525.84329, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "X", "bbox": {"l": 480.00034, "t": 517.51828, "r": 486.00333, "b": 525.84329, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 70.800049, "t": 536.67299, "r": 106.73975, "b": 544.64699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "STRDBMON", "bbox": {"l": 70.800049, "t": 536.67299, "r": 106.73975, "b": 544.64699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 106.73975, "t": 536.5379800000001, "r": 119.77895, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": " or ", "bbox": {"l": 106.73975, "t": 536.5379800000001, "r": 119.77895, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 119.69975000000001, "t": 536.67299, "r": 155.69974, "b": 544.64699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "ENDDBMON", "bbox": {"l": 119.69975000000001, "t": 536.67299, "r": 155.69974, "b": 544.64699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 155.69974, "t": 536.5379800000001, "r": 322.50574, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": " commands targeting a different user\u2019s job", "bbox": {"l": 155.69974, "t": 536.5379800000001, "r": 322.50574, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 429.00003, "t": 536.5379800000001, "r": 435.00302000000005, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "X", "bbox": {"l": 429.00003, "t": 536.5379800000001, "r": 435.00302000000005, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 480.00034, "t": 536.5379800000001, "r": 486.00333, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "X", "bbox": {"l": 480.00034, "t": 536.5379800000001, "r": 486.00333, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 70.800049, "t": 555.69269, "r": 106.73975, "b": 563.66669, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "STRDBMON", "bbox": {"l": 70.800049, "t": 555.69269, "r": 106.73975, "b": 563.66669, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 106.73975, "t": 555.55768, "r": 119.77895, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": " or ", "bbox": {"l": 106.73975, "t": 555.55768, "r": 119.77895, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 119.69975000000001, "t": 555.69269, "r": 155.69974, "b": 563.66669, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "ENDDBMON", "bbox": {"l": 119.69975000000001, "t": 555.69269, "r": 155.69974, "b": 563.66669, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 155.69974, "t": 555.55768, "r": 381.02185, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": " commands targeting a job that matches the current user", "bbox": {"l": 155.69974, "t": 555.55768, "r": 381.02185, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 429.00003, "t": 555.55768, "r": 435.00302000000005, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "X", "bbox": {"l": 429.00003, "t": 555.55768, "r": 435.00302000000005, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 480.00034, "t": 555.55768, "r": 486.00333, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "X", "bbox": {"l": 480.00034, "t": 555.55768, "r": 486.00333, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 505.26061999999996, "t": 555.55768, "r": 511.26361, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "X", "bbox": {"l": 505.26061999999996, "t": 555.55768, "r": 511.26361, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 530.76031, "t": 555.55768, "r": 536.76331, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "X", "bbox": {"l": 530.76031, "t": 555.55768, "r": 536.76331, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 70.800049, "t": 574.51797, "r": 359.51736, "b": 582.84299, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "QUSRJOBI() API format 900 or System i Navigator\u2019s SQL Details for Job", "bbox": {"l": 70.800049, "t": 574.51797, "r": 359.51736, "b": 582.84299, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 429.0000600000001, "t": 574.51797, "r": 435.00305000000003, "b": 582.84299, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "X", "bbox": {"l": 429.0000600000001, "t": 574.51797, "r": 435.00305000000003, "b": 582.84299, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 480.00037, "t": 574.51797, "r": 486.00335999999993, "b": 582.84299, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "X", "bbox": {"l": 480.00037, "t": 574.51797, "r": 486.00335999999993, "b": 582.84299, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 505.2606799999999, "t": 574.51797, "r": 511.26367, "b": 582.84299, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "X", "bbox": {"l": 505.2606799999999, "t": 574.51797, "r": 511.26367, "b": 582.84299, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 70.800079, "t": 593.5376699999999, "r": 220.75178999999997, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "Visual Explain within Run SQL scripts", "bbox": {"l": 70.800079, "t": 593.5376699999999, "r": 220.75178999999997, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 429.0000600000001, "t": 593.5376699999999, "r": 435.00305000000003, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "X", "bbox": {"l": 429.0000600000001, "t": 593.5376699999999, "r": 435.00305000000003, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 480.00037, "t": 593.5376699999999, "r": 486.00335999999993, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "X", "bbox": {"l": 480.00037, "t": 593.5376699999999, "r": 486.00335999999993, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 505.2606799999999, "t": 593.5376699999999, "r": 511.26367, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "X", "bbox": {"l": 505.2606799999999, "t": 593.5376699999999, "r": 511.26367, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 530.76038, "t": 593.5376699999999, "r": 536.76337, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "X", "bbox": {"l": 530.76038, "t": 593.5376699999999, "r": 536.76337, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 70.800079, "t": 612.55737, "r": 236.6548, "b": 620.88239, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "Visual Explain outside of Run SQL scripts", "bbox": {"l": 70.800079, "t": 612.55737, "r": 236.6548, "b": 620.88239, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 429.0000600000001, "t": 612.55737, "r": 435.00305000000003, "b": 620.88239, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "X", "bbox": {"l": 429.0000600000001, "t": 612.55737, "r": 435.00305000000003, "b": 620.88239, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 480.00037, "t": 612.55737, "r": 486.00335999999993, "b": 620.88239, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "X", "bbox": {"l": 480.00037, "t": 612.55737, "r": 486.00335999999993, "b": 620.88239, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 70.800079, "t": 631.51767, "r": 213.12968, "b": 639.84268, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "ANALYZE PLAN CACHE procedure", "bbox": {"l": 70.800079, "t": 631.51767, "r": 213.12968, "b": 639.84268, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 429.0000600000001, "t": 631.51767, "r": 435.00305000000003, "b": 639.84268, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "X", "bbox": {"l": 429.0000600000001, "t": 631.51767, "r": 435.00305000000003, "b": 639.84268, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 480.00037, "t": 631.51767, "r": 486.00335999999993, "b": 639.84268, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "X", "bbox": {"l": 480.00037, "t": 631.51767, "r": 486.00335999999993, "b": 639.84268, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 70.800079, "t": 650.53737, "r": 199.87808, "b": 658.86238, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "DUMP PLAN CACHE procedure", "bbox": {"l": 70.800079, "t": 650.53737, "r": 199.87808, "b": 658.86238, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 429.0000600000001, "t": 650.53737, "r": 435.00305000000003, "b": 658.86238, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "X", "bbox": {"l": 429.0000600000001, "t": 650.53737, "r": 435.00305000000003, "b": 658.86238, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 480.00037, "t": 650.53737, "r": 486.00335999999993, "b": 658.86238, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "X", "bbox": {"l": 480.00037, "t": 650.53737, "r": 486.00335999999993, "b": 658.86238, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 70.800079, "t": 669.55708, "r": 208.36777, "b": 677.88207, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "MODIFY PLAN CACHE procedure", "bbox": {"l": 70.800079, "t": 669.55708, "r": 208.36777, "b": 677.88207, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 429.0000600000001, "t": 669.55708, "r": 435.00305000000003, "b": 677.88207, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "X", "bbox": {"l": 429.0000600000001, "t": 669.55708, "r": 435.00305000000003, "b": 677.88207, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 480.00037, "t": 669.55708, "r": 486.00335999999993, "b": 677.88207, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "X", "bbox": {"l": 480.00037, "t": 669.55708, "r": 486.00335999999993, "b": 677.88207, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 70.800079, "t": 688.57677, "r": 411.20264, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "MODIFY PLAN CACHE PROPERTIES procedure (currently does not check authority)", "bbox": {"l": 70.800079, "t": 688.57677, "r": 411.20264, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 429.0000600000001, "t": 688.57677, "r": 435.00305000000003, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "X", "bbox": {"l": 429.0000600000001, "t": 688.57677, "r": 435.00305000000003, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 480.00037, "t": 688.57677, "r": 486.00335999999993, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "X", "bbox": {"l": 480.00037, "t": 688.57677, "r": 486.00335999999993, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 70.800079, "t": 707.537071, "r": 377.12585, "b": 715.862068, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "CHANGE PLAN CACHE SIZE procedure (currently does not check authority)", "bbox": {"l": 70.800079, "t": 707.537071, "r": 377.12585, "b": 715.862068, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 429.0000600000001, "t": 707.537071, "r": 435.00305000000003, "b": 715.862068, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "X", "bbox": {"l": 429.0000600000001, "t": 707.537071, "r": 435.00305000000003, "b": 715.862068, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 480.00037, "t": 707.537071, "r": 486.00335999999993, "b": 715.862068, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "X", "bbox": {"l": 480.00037, "t": 707.537071, "r": 486.00335999999993, "b": 715.862068, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "ecel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "ecel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "ecel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "ecel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "ecel", "fcel", "fcel", "ecel", "nl", "rhed", "fcel", "ecel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "ecel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "ecel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "ecel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "ecel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "ecel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "ecel", "fcel", "ecel", "ecel", "nl"], "num_rows": 13, "num_cols": 6, "table_cells": [{"bbox": {"l": 70.800301, "t": 400.51827999999995, "r": 119.78551, "b": 408.84329, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "User action", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 424.93805, "t": 447.52255, "r": 433.26297000000005, "b": 487.01999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "*JOBCTL", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 450.13806, "t": 401.6000700000001, "r": 458.46298, "b": 487.01999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "QIBM_DB_SECADM", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 475.93835000000007, "t": 401.53442, "r": 484.26327999999995, "b": 487.01999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "QIBM_DB_SQLADM", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 501.13837, "t": 401.6145, "r": 509.46329, "b": 487.01999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "QIBM_DB_SYSMON", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 526.39862, "t": 432.79944, "r": 534.72357, "b": 487.02005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "No Authority", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800003, "t": 498.55798, "r": 220.15681000000004, "b": 506.883, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "SET CURRENT DEGREE  (SQL statement)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0, "t": 498.55798, "r": 435.00299000000007, "b": 506.883, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00031, "t": 498.55798, "r": 486.0033, "b": 506.883, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800018, "t": 517.51828, "r": 264.5538, "b": 525.84329, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "CHGQRYA  command targeting a different user\u2019s job", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.00003, "t": 517.51828, "r": 435.00302000000005, "b": 525.84329, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00034, "t": 517.51828, "r": 486.00333, "b": 525.84329, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800049, "t": 536.5379800000001, "r": 322.50574, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "STRDBMON  or  ENDDBMON  commands targeting a different user\u2019s job", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.00003, "t": 536.5379800000001, "r": 435.00302000000005, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00034, "t": 536.5379800000001, "r": 486.00333, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800049, "t": 555.55768, "r": 381.02185, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "STRDBMON  or  ENDDBMON  commands targeting a job that matches the current user", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.00003, "t": 555.55768, "r": 435.00302000000005, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00034, "t": 555.55768, "r": 486.00333, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 505.26061999999996, "t": 555.55768, "r": 511.26361, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 530.76031, "t": 555.55768, "r": 536.76331, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800049, "t": 574.51797, "r": 359.51736, "b": 582.84299, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "QUSRJOBI() API format 900 or System i Navigator\u2019s SQL Details for Job", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 574.51797, "r": 435.00305000000003, "b": 582.84299, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 574.51797, "r": 486.00335999999993, "b": 582.84299, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 505.2606799999999, "t": 574.51797, "r": 511.26367, "b": 582.84299, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800079, "t": 593.5376699999999, "r": 220.75178999999997, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Visual Explain within Run SQL scripts", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 593.5376699999999, "r": 435.00305000000003, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 593.5376699999999, "r": 486.00335999999993, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 505.2606799999999, "t": 593.5376699999999, "r": 511.26367, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 530.76038, "t": 593.5376699999999, "r": 536.76337, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800079, "t": 612.55737, "r": 236.6548, "b": 620.88239, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Visual Explain outside of Run SQL scripts", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 612.55737, "r": 435.00305000000003, "b": 620.88239, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 612.55737, "r": 486.00335999999993, "b": 620.88239, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800079, "t": 631.51767, "r": 213.12968, "b": 639.84268, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "ANALYZE PLAN CACHE procedure", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 631.51767, "r": 435.00305000000003, "b": 639.84268, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 631.51767, "r": 486.00335999999993, "b": 639.84268, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800079, "t": 650.53737, "r": 199.87808, "b": 658.86238, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "DUMP PLAN CACHE procedure", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 650.53737, "r": 435.00305000000003, "b": 658.86238, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 650.53737, "r": 486.00335999999993, "b": 658.86238, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800079, "t": 669.55708, "r": 208.36777, "b": 677.88207, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "MODIFY PLAN CACHE procedure", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 669.55708, "r": 435.00305000000003, "b": 677.88207, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 669.55708, "r": 486.00335999999993, "b": 677.88207, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800079, "t": 688.57677, "r": 411.20264, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "MODIFY PLAN CACHE PROPERTIES procedure (currently does not check authority)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 688.57677, "r": 435.00305000000003, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 688.57677, "r": 486.00335999999993, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800079, "t": 707.537071, "r": 377.12585, "b": 715.862068, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "CHANGE PLAN CACHE SIZE procedure (currently does not check authority)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 707.537071, "r": 435.00305000000003, "b": 715.862068, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 707.537071, "r": 486.00335999999993, "b": 715.862068, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}]}}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_footer", "id": 7, "page_no": 8, "cluster": {"id": 7, "label": "page_footer", "bbox": {"l": 355.32001, "t": 755.538002, "r": 523.54071, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9508126974105835, "cells": [{"id": 0, "text": "Chapter 2. Roles and separation of duties ", "bbox": {"l": 355.32001, "t": 755.538002, "r": 523.54071, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Chapter 2. Roles and separation of duties"}, {"label": "page_footer", "id": 9, "page_no": 8, "cluster": {"id": 9, "label": "page_footer", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.8987306356430054, "cells": [{"id": 1, "text": "11", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "11"}, {"label": "text", "id": 2, "page_no": 8, "cluster": {"id": 2, "label": "text", "bbox": {"l": 136.79959, "t": 71.50903000000005, "r": 542.69434, "b": 140.72113000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9789126515388489, "cells": [{"id": 2, "text": "For example, assume that a business has assigned the duty to manage security on IBM i to ", "bbox": {"l": 136.79959, "t": 71.50903000000005, "r": 542.69434, "b": 80.72204999999985, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Theresa. Before release IBM i 7.2, to grant privileges, Theresa had to have the same ", "bbox": {"l": 136.79959, "t": 83.50885000000017, "r": 513.67804, "b": 92.72185999999999, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "privileges Theresa was granting to others. Therefore, to grant *USE privileges to the ", "bbox": {"l": 136.79959, "t": 95.50867000000005, "r": 509.71902, "b": 104.72167999999999, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "PAYROLL table, Theresa had to have *OBJMGT and *USE authority (or a higher level of ", "bbox": {"l": 136.79959, "t": 107.50847999999996, "r": 528.20184, "b": 116.72149999999999, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "authority, such as *ALLOBJ). This requirement allowed Theresa to access the data in the ", "bbox": {"l": 136.79959, "t": 119.50829999999996, "r": 531.84015, "b": 128.72131000000002, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "PAYROLL table even though Theresa\u2019s job description was only to manage its security.", "bbox": {"l": 136.79959, "t": 131.50811999999996, "r": 519.24982, "b": 140.72113000000002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "For example, assume that a business has assigned the duty to manage security on IBM i to Theresa. Before release IBM i 7.2, to grant privileges, Theresa had to have the same privileges Theresa was granting to others. Therefore, to grant *USE privileges to the PAYROLL table, Theresa had to have *OBJMGT and *USE authority (or a higher level of authority, such as *ALLOBJ). This requirement allowed Theresa to access the data in the PAYROLL table even though Theresa\u2019s job description was only to manage its security."}, {"label": "text", "id": 6, "page_no": 8, "cluster": {"id": 6, "label": "text", "bbox": {"l": 136.79959, "t": 153.52770999999996, "r": 547.30396, "b": 198.74017000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9665539860725403, "cells": [{"id": 8, "text": "In IBM i 7.2, the QIBM_DB_SECADM function usage grants authorities, revokes authorities, ", "bbox": {"l": 136.79959, "t": 153.52770999999996, "r": 544.16064, "b": 162.74072, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "changes ownership, or changes the primary group without giving access to the object or, in ", "bbox": {"l": 136.79959, "t": 165.52752999999996, "r": 540.66156, "b": 174.74054, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "the case of a database table, to the data that is in the table or allowing other operations on the ", "bbox": {"l": 136.79959, "t": 177.52733999999998, "r": 547.30396, "b": 186.74036, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "table. ", "bbox": {"l": 136.79959, "t": 189.52715999999998, "r": 163.6189, "b": 198.74017000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In IBM i 7.2, the QIBM_DB_SECADM function usage grants authorities, revokes authorities, changes ownership, or changes the primary group without giving access to the object or, in the case of a database table, to the data that is in the table or allowing other operations on the table."}, {"label": "text", "id": 4, "page_no": 8, "cluster": {"id": 4, "label": "text", "bbox": {"l": 136.79959, "t": 211.48694, "r": 538.65076, "b": 232.69976999999994, "coord_origin": "TOPLEFT"}, "confidence": 0.9691813588142395, "cells": [{"id": 12, "text": "QIBM_DB_SECADM function usage can be granted only by a user with *SECADM special ", "bbox": {"l": 136.79959, "t": 211.48694, "r": 538.65076, "b": 220.69994999999994, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "authority and can be given to a user or a group.", "bbox": {"l": 136.79959, "t": 223.48676, "r": 346.34808, "b": 232.69976999999994, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "QIBM_DB_SECADM function usage can be granted only by a user with *SECADM special authority and can be given to a user or a group."}, {"label": "text", "id": 3, "page_no": 8, "cluster": {"id": 3, "label": "text", "bbox": {"l": 136.79959, "t": 245.50635, "r": 545.79602, "b": 278.71898999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9729602336883545, "cells": [{"id": 14, "text": "QIBM_DB_SECADM also is responsible for administering RCAC, which restricts which rows ", "bbox": {"l": 136.79959, "t": 245.50635, "r": 545.79602, "b": 254.71936000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "a user is allowed to access in a table and whether a user is allowed to see information in ", "bbox": {"l": 136.79959, "t": 257.50616, "r": 529.46149, "b": 266.71918000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "certain columns of a table.", "bbox": {"l": 136.79959, "t": 269.50598, "r": 253.47696999999997, "b": 278.71898999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "QIBM_DB_SECADM also is responsible for administering RCAC, which restricts which rows a user is allowed to access in a table and whether a user is allowed to see information in certain columns of a table."}, {"label": "text", "id": 1, "page_no": 8, "cluster": {"id": 1, "label": "text", "bbox": {"l": 136.79959, "t": 291.52557, "r": 539.80713, "b": 336.73801, "coord_origin": "TOPLEFT"}, "confidence": 0.9815152883529663, "cells": [{"id": 17, "text": "A preferred practice is that the RCAC administrator has the QIBM_DB_SECADM function ", "bbox": {"l": 136.79959, "t": 291.52557, "r": 533.78137, "b": 300.73856, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "usage ID, but absolutely no other data privileges. The result is that the RCAC administrator ", "bbox": {"l": 136.79959, "t": 303.52539, "r": 539.80713, "b": 312.73837000000003, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "can deploy and maintain the RCAC constructs, but cannot grant themselves unauthorized ", "bbox": {"l": 136.79959, "t": 315.52521, "r": 534.5741, "b": 324.73819, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "access to data itself.", "bbox": {"l": 136.79959, "t": 327.52502, "r": 227.02324, "b": 336.73801, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "A preferred practice is that the RCAC administrator has the QIBM_DB_SECADM function usage ID, but absolutely no other data privileges. The result is that the RCAC administrator can deploy and maintain the RCAC constructs, but cannot grant themselves unauthorized access to data itself."}, {"label": "text", "id": 5, "page_no": 8, "cluster": {"id": 5, "label": "text", "bbox": {"l": 136.79959, "t": 349.48483, "r": 543.06714, "b": 370.69763000000006, "coord_origin": "TOPLEFT"}, "confidence": 0.9672255516052246, "cells": [{"id": 21, "text": "Table 2-2 shows a comparison of the different function usage IDs and *JOBCTL authority to ", "bbox": {"l": 136.79959, "t": 349.48483, "r": 543.06714, "b": 358.69780999999995, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "the different CL commands and DB2 for i tools.", "bbox": {"l": 136.79959, "t": 361.48465, "r": 343.79236, "b": 370.69763000000006, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 2-2 shows a comparison of the different function usage IDs and *JOBCTL authority to the different CL commands and DB2 for i tools."}, {"label": "caption", "id": 8, "page_no": 8, "cluster": {"id": 8, "label": "caption", "bbox": {"l": 64.800003, "t": 383.5379899999999, "r": 391.75464, "b": 391.86301, "coord_origin": "TOPLEFT"}, "confidence": 0.9337190985679626, "cells": [{"id": 23, "text": "Table 2-2 Comparison of the different function usage IDs and *JOBCTL authority", "bbox": {"l": 64.800003, "t": 383.5379899999999, "r": 391.75464, "b": 391.86301, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 2-2 Comparison of the different function usage IDs and *JOBCTL authority"}, {"label": "table", "id": 0, "page_no": 8, "cluster": {"id": 0, "label": "table", "bbox": {"l": 64.41139221191406, "t": 393.6136169433594, "r": 547.3950805664062, "b": 721.60791015625, "coord_origin": "TOPLEFT"}, "confidence": 0.9899572730064392, "cells": [{"id": 24, "text": "User action", "bbox": {"l": 70.800301, "t": 400.51827999999995, "r": 119.78551, "b": 408.84329, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "*JOBCTL", "bbox": {"l": 424.93805, "t": 447.52255, "r": 433.26297000000005, "b": 487.01999, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "QIBM_DB_SECADM", "bbox": {"l": 450.13806, "t": 401.6000700000001, "r": 458.46298, "b": 487.01999, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "QIBM_DB_SQLADM", "bbox": {"l": 475.93835000000007, "t": 401.53442, "r": 484.26327999999995, "b": 487.01999, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "QIBM_DB_SYSMON", "bbox": {"l": 501.13837, "t": 401.6145, "r": 509.46329, "b": 487.01999, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "No Authority", "bbox": {"l": 526.39862, "t": 432.79944, "r": 534.72357, "b": 487.02005, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "SET CURRENT DEGREE", "bbox": {"l": 70.800003, "t": 498.69299, "r": 151.6794, "b": 506.66699, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": " (SQL statement)", "bbox": {"l": 151.6803, "t": 498.55798, "r": 220.15681000000004, "b": 506.883, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "X", "bbox": {"l": 429.0, "t": 498.55798, "r": 435.00299000000007, "b": 506.883, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "X", "bbox": {"l": 480.00031, "t": 498.55798, "r": 486.0033, "b": 506.883, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "CHGQRYA", "bbox": {"l": 70.800018, "t": 517.65329, "r": 102.23972, "b": 525.62729, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": " command targeting a different user\u2019s job", "bbox": {"l": 102.23972, "t": 517.51828, "r": 264.5538, "b": 525.84329, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "X", "bbox": {"l": 429.00003, "t": 517.51828, "r": 435.00302000000005, "b": 525.84329, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "X", "bbox": {"l": 480.00034, "t": 517.51828, "r": 486.00333, "b": 525.84329, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "STRDBMON", "bbox": {"l": 70.800049, "t": 536.67299, "r": 106.73975, "b": 544.64699, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": " or ", "bbox": {"l": 106.73975, "t": 536.5379800000001, "r": 119.77895, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "ENDDBMON", "bbox": {"l": 119.69975000000001, "t": 536.67299, "r": 155.69974, "b": 544.64699, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": " commands targeting a different user\u2019s job", "bbox": {"l": 155.69974, "t": 536.5379800000001, "r": 322.50574, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "X", "bbox": {"l": 429.00003, "t": 536.5379800000001, "r": 435.00302000000005, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "X", "bbox": {"l": 480.00034, "t": 536.5379800000001, "r": 486.00333, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "STRDBMON", "bbox": {"l": 70.800049, "t": 555.69269, "r": 106.73975, "b": 563.66669, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": " or ", "bbox": {"l": 106.73975, "t": 555.55768, "r": 119.77895, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "ENDDBMON", "bbox": {"l": 119.69975000000001, "t": 555.69269, "r": 155.69974, "b": 563.66669, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": " commands targeting a job that matches the current user", "bbox": {"l": 155.69974, "t": 555.55768, "r": 381.02185, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "X", "bbox": {"l": 429.00003, "t": 555.55768, "r": 435.00302000000005, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "X", "bbox": {"l": 480.00034, "t": 555.55768, "r": 486.00333, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "X", "bbox": {"l": 505.26061999999996, "t": 555.55768, "r": 511.26361, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "X", "bbox": {"l": 530.76031, "t": 555.55768, "r": 536.76331, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "QUSRJOBI() API format 900 or System i Navigator\u2019s SQL Details for Job", "bbox": {"l": 70.800049, "t": 574.51797, "r": 359.51736, "b": 582.84299, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "X", "bbox": {"l": 429.0000600000001, "t": 574.51797, "r": 435.00305000000003, "b": 582.84299, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "X", "bbox": {"l": 480.00037, "t": 574.51797, "r": 486.00335999999993, "b": 582.84299, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "X", "bbox": {"l": 505.2606799999999, "t": 574.51797, "r": 511.26367, "b": 582.84299, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Visual Explain within Run SQL scripts", "bbox": {"l": 70.800079, "t": 593.5376699999999, "r": 220.75178999999997, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "X", "bbox": {"l": 429.0000600000001, "t": 593.5376699999999, "r": 435.00305000000003, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "X", "bbox": {"l": 480.00037, "t": 593.5376699999999, "r": 486.00335999999993, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "X", "bbox": {"l": 505.2606799999999, "t": 593.5376699999999, "r": 511.26367, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "X", "bbox": {"l": 530.76038, "t": 593.5376699999999, "r": 536.76337, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "Visual Explain outside of Run SQL scripts", "bbox": {"l": 70.800079, "t": 612.55737, "r": 236.6548, "b": 620.88239, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "X", "bbox": {"l": 429.0000600000001, "t": 612.55737, "r": 435.00305000000003, "b": 620.88239, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "X", "bbox": {"l": 480.00037, "t": 612.55737, "r": 486.00335999999993, "b": 620.88239, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "ANALYZE PLAN CACHE procedure", "bbox": {"l": 70.800079, "t": 631.51767, "r": 213.12968, "b": 639.84268, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "X", "bbox": {"l": 429.0000600000001, "t": 631.51767, "r": 435.00305000000003, "b": 639.84268, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "X", "bbox": {"l": 480.00037, "t": 631.51767, "r": 486.00335999999993, "b": 639.84268, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "DUMP PLAN CACHE procedure", "bbox": {"l": 70.800079, "t": 650.53737, "r": 199.87808, "b": 658.86238, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "X", "bbox": {"l": 429.0000600000001, "t": 650.53737, "r": 435.00305000000003, "b": 658.86238, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "X", "bbox": {"l": 480.00037, "t": 650.53737, "r": 486.00335999999993, "b": 658.86238, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "MODIFY PLAN CACHE procedure", "bbox": {"l": 70.800079, "t": 669.55708, "r": 208.36777, "b": 677.88207, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "X", "bbox": {"l": 429.0000600000001, "t": 669.55708, "r": 435.00305000000003, "b": 677.88207, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "X", "bbox": {"l": 480.00037, "t": 669.55708, "r": 486.00335999999993, "b": 677.88207, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "MODIFY PLAN CACHE PROPERTIES procedure (currently does not check authority)", "bbox": {"l": 70.800079, "t": 688.57677, "r": 411.20264, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "X", "bbox": {"l": 429.0000600000001, "t": 688.57677, "r": 435.00305000000003, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "X", "bbox": {"l": 480.00037, "t": 688.57677, "r": 486.00335999999993, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "CHANGE PLAN CACHE SIZE procedure (currently does not check authority)", "bbox": {"l": 70.800079, "t": 707.537071, "r": 377.12585, "b": 715.862068, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "X", "bbox": {"l": 429.0000600000001, "t": 707.537071, "r": 435.00305000000003, "b": 715.862068, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "X", "bbox": {"l": 480.00037, "t": 707.537071, "r": 486.00335999999993, "b": 715.862068, "coord_origin": "TOPLEFT"}}], "children": [{"id": 10, "label": "text", "bbox": {"l": 70.800301, "t": 400.51827999999995, "r": 119.78551, "b": 408.84329, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "User action", "bbox": {"l": 70.800301, "t": 400.51827999999995, "r": 119.78551, "b": 408.84329, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 424.93805, "t": 447.52255, "r": 433.26297000000005, "b": 487.01999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "*JOBCTL", "bbox": {"l": 424.93805, "t": 447.52255, "r": 433.26297000000005, "b": 487.01999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 450.13806, "t": 401.6000700000001, "r": 458.46298, "b": 487.01999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "QIBM_DB_SECADM", "bbox": {"l": 450.13806, "t": 401.6000700000001, "r": 458.46298, "b": 487.01999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 475.93835000000007, "t": 401.53442, "r": 484.26327999999995, "b": 487.01999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "QIBM_DB_SQLADM", "bbox": {"l": 475.93835000000007, "t": 401.53442, "r": 484.26327999999995, "b": 487.01999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 501.13837, "t": 401.6145, "r": 509.46329, "b": 487.01999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "QIBM_DB_SYSMON", "bbox": {"l": 501.13837, "t": 401.6145, "r": 509.46329, "b": 487.01999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 526.39862, "t": 432.79944, "r": 534.72357, "b": 487.02005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "No Authority", "bbox": {"l": 526.39862, "t": 432.79944, "r": 534.72357, "b": 487.02005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 70.800003, "t": 498.69299, "r": 151.6794, "b": 506.66699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "SET CURRENT DEGREE", "bbox": {"l": 70.800003, "t": 498.69299, "r": 151.6794, "b": 506.66699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 151.6803, "t": 498.55798, "r": 220.15681000000004, "b": 506.883, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": " (SQL statement)", "bbox": {"l": 151.6803, "t": 498.55798, "r": 220.15681000000004, "b": 506.883, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 429.0, "t": 498.55798, "r": 435.00299000000007, "b": 506.883, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "X", "bbox": {"l": 429.0, "t": 498.55798, "r": 435.00299000000007, "b": 506.883, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 480.00031, "t": 498.55798, "r": 486.0033, "b": 506.883, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "X", "bbox": {"l": 480.00031, "t": 498.55798, "r": 486.0033, "b": 506.883, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 70.800018, "t": 517.65329, "r": 102.23972, "b": 525.62729, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "CHGQRYA", "bbox": {"l": 70.800018, "t": 517.65329, "r": 102.23972, "b": 525.62729, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 102.23972, "t": 517.51828, "r": 264.5538, "b": 525.84329, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": " command targeting a different user\u2019s job", "bbox": {"l": 102.23972, "t": 517.51828, "r": 264.5538, "b": 525.84329, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 429.00003, "t": 517.51828, "r": 435.00302000000005, "b": 525.84329, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "X", "bbox": {"l": 429.00003, "t": 517.51828, "r": 435.00302000000005, "b": 525.84329, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 480.00034, "t": 517.51828, "r": 486.00333, "b": 525.84329, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "X", "bbox": {"l": 480.00034, "t": 517.51828, "r": 486.00333, "b": 525.84329, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 70.800049, "t": 536.67299, "r": 106.73975, "b": 544.64699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "STRDBMON", "bbox": {"l": 70.800049, "t": 536.67299, "r": 106.73975, "b": 544.64699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 106.73975, "t": 536.5379800000001, "r": 119.77895, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": " or ", "bbox": {"l": 106.73975, "t": 536.5379800000001, "r": 119.77895, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 119.69975000000001, "t": 536.67299, "r": 155.69974, "b": 544.64699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "ENDDBMON", "bbox": {"l": 119.69975000000001, "t": 536.67299, "r": 155.69974, "b": 544.64699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 155.69974, "t": 536.5379800000001, "r": 322.50574, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": " commands targeting a different user\u2019s job", "bbox": {"l": 155.69974, "t": 536.5379800000001, "r": 322.50574, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 429.00003, "t": 536.5379800000001, "r": 435.00302000000005, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "X", "bbox": {"l": 429.00003, "t": 536.5379800000001, "r": 435.00302000000005, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 480.00034, "t": 536.5379800000001, "r": 486.00333, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "X", "bbox": {"l": 480.00034, "t": 536.5379800000001, "r": 486.00333, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 70.800049, "t": 555.69269, "r": 106.73975, "b": 563.66669, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "STRDBMON", "bbox": {"l": 70.800049, "t": 555.69269, "r": 106.73975, "b": 563.66669, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 106.73975, "t": 555.55768, "r": 119.77895, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": " or ", "bbox": {"l": 106.73975, "t": 555.55768, "r": 119.77895, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 119.69975000000001, "t": 555.69269, "r": 155.69974, "b": 563.66669, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "ENDDBMON", "bbox": {"l": 119.69975000000001, "t": 555.69269, "r": 155.69974, "b": 563.66669, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 155.69974, "t": 555.55768, "r": 381.02185, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": " commands targeting a job that matches the current user", "bbox": {"l": 155.69974, "t": 555.55768, "r": 381.02185, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 429.00003, "t": 555.55768, "r": 435.00302000000005, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "X", "bbox": {"l": 429.00003, "t": 555.55768, "r": 435.00302000000005, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 480.00034, "t": 555.55768, "r": 486.00333, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "X", "bbox": {"l": 480.00034, "t": 555.55768, "r": 486.00333, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 505.26061999999996, "t": 555.55768, "r": 511.26361, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "X", "bbox": {"l": 505.26061999999996, "t": 555.55768, "r": 511.26361, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 530.76031, "t": 555.55768, "r": 536.76331, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "X", "bbox": {"l": 530.76031, "t": 555.55768, "r": 536.76331, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 70.800049, "t": 574.51797, "r": 359.51736, "b": 582.84299, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "QUSRJOBI() API format 900 or System i Navigator\u2019s SQL Details for Job", "bbox": {"l": 70.800049, "t": 574.51797, "r": 359.51736, "b": 582.84299, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 429.0000600000001, "t": 574.51797, "r": 435.00305000000003, "b": 582.84299, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "X", "bbox": {"l": 429.0000600000001, "t": 574.51797, "r": 435.00305000000003, "b": 582.84299, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 480.00037, "t": 574.51797, "r": 486.00335999999993, "b": 582.84299, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "X", "bbox": {"l": 480.00037, "t": 574.51797, "r": 486.00335999999993, "b": 582.84299, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 505.2606799999999, "t": 574.51797, "r": 511.26367, "b": 582.84299, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "X", "bbox": {"l": 505.2606799999999, "t": 574.51797, "r": 511.26367, "b": 582.84299, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 70.800079, "t": 593.5376699999999, "r": 220.75178999999997, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "Visual Explain within Run SQL scripts", "bbox": {"l": 70.800079, "t": 593.5376699999999, "r": 220.75178999999997, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 429.0000600000001, "t": 593.5376699999999, "r": 435.00305000000003, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "X", "bbox": {"l": 429.0000600000001, "t": 593.5376699999999, "r": 435.00305000000003, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 480.00037, "t": 593.5376699999999, "r": 486.00335999999993, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "X", "bbox": {"l": 480.00037, "t": 593.5376699999999, "r": 486.00335999999993, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 505.2606799999999, "t": 593.5376699999999, "r": 511.26367, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "X", "bbox": {"l": 505.2606799999999, "t": 593.5376699999999, "r": 511.26367, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 530.76038, "t": 593.5376699999999, "r": 536.76337, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "X", "bbox": {"l": 530.76038, "t": 593.5376699999999, "r": 536.76337, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 70.800079, "t": 612.55737, "r": 236.6548, "b": 620.88239, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "Visual Explain outside of Run SQL scripts", "bbox": {"l": 70.800079, "t": 612.55737, "r": 236.6548, "b": 620.88239, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 429.0000600000001, "t": 612.55737, "r": 435.00305000000003, "b": 620.88239, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "X", "bbox": {"l": 429.0000600000001, "t": 612.55737, "r": 435.00305000000003, "b": 620.88239, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 480.00037, "t": 612.55737, "r": 486.00335999999993, "b": 620.88239, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "X", "bbox": {"l": 480.00037, "t": 612.55737, "r": 486.00335999999993, "b": 620.88239, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 70.800079, "t": 631.51767, "r": 213.12968, "b": 639.84268, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "ANALYZE PLAN CACHE procedure", "bbox": {"l": 70.800079, "t": 631.51767, "r": 213.12968, "b": 639.84268, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 429.0000600000001, "t": 631.51767, "r": 435.00305000000003, "b": 639.84268, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "X", "bbox": {"l": 429.0000600000001, "t": 631.51767, "r": 435.00305000000003, "b": 639.84268, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 480.00037, "t": 631.51767, "r": 486.00335999999993, "b": 639.84268, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "X", "bbox": {"l": 480.00037, "t": 631.51767, "r": 486.00335999999993, "b": 639.84268, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 70.800079, "t": 650.53737, "r": 199.87808, "b": 658.86238, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "DUMP PLAN CACHE procedure", "bbox": {"l": 70.800079, "t": 650.53737, "r": 199.87808, "b": 658.86238, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 429.0000600000001, "t": 650.53737, "r": 435.00305000000003, "b": 658.86238, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "X", "bbox": {"l": 429.0000600000001, "t": 650.53737, "r": 435.00305000000003, "b": 658.86238, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 480.00037, "t": 650.53737, "r": 486.00335999999993, "b": 658.86238, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "X", "bbox": {"l": 480.00037, "t": 650.53737, "r": 486.00335999999993, "b": 658.86238, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 70.800079, "t": 669.55708, "r": 208.36777, "b": 677.88207, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "MODIFY PLAN CACHE procedure", "bbox": {"l": 70.800079, "t": 669.55708, "r": 208.36777, "b": 677.88207, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 429.0000600000001, "t": 669.55708, "r": 435.00305000000003, "b": 677.88207, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "X", "bbox": {"l": 429.0000600000001, "t": 669.55708, "r": 435.00305000000003, "b": 677.88207, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 480.00037, "t": 669.55708, "r": 486.00335999999993, "b": 677.88207, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "X", "bbox": {"l": 480.00037, "t": 669.55708, "r": 486.00335999999993, "b": 677.88207, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 70.800079, "t": 688.57677, "r": 411.20264, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "MODIFY PLAN CACHE PROPERTIES procedure (currently does not check authority)", "bbox": {"l": 70.800079, "t": 688.57677, "r": 411.20264, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 429.0000600000001, "t": 688.57677, "r": 435.00305000000003, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "X", "bbox": {"l": 429.0000600000001, "t": 688.57677, "r": 435.00305000000003, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 480.00037, "t": 688.57677, "r": 486.00335999999993, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "X", "bbox": {"l": 480.00037, "t": 688.57677, "r": 486.00335999999993, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 70.800079, "t": 707.537071, "r": 377.12585, "b": 715.862068, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "CHANGE PLAN CACHE SIZE procedure (currently does not check authority)", "bbox": {"l": 70.800079, "t": 707.537071, "r": 377.12585, "b": 715.862068, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 429.0000600000001, "t": 707.537071, "r": 435.00305000000003, "b": 715.862068, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "X", "bbox": {"l": 429.0000600000001, "t": 707.537071, "r": 435.00305000000003, "b": 715.862068, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 480.00037, "t": 707.537071, "r": 486.00335999999993, "b": 715.862068, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "X", "bbox": {"l": 480.00037, "t": 707.537071, "r": 486.00335999999993, "b": 715.862068, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "ecel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "ecel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "ecel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "ecel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "ecel", "fcel", "fcel", "ecel", "nl", "rhed", "fcel", "ecel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "ecel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "ecel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "ecel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "ecel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "ecel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "ecel", "fcel", "ecel", "ecel", "nl"], "num_rows": 13, "num_cols": 6, "table_cells": [{"bbox": {"l": 70.800301, "t": 400.51827999999995, "r": 119.78551, "b": 408.84329, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "User action", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 424.93805, "t": 447.52255, "r": 433.26297000000005, "b": 487.01999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "*JOBCTL", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 450.13806, "t": 401.6000700000001, "r": 458.46298, "b": 487.01999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "QIBM_DB_SECADM", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 475.93835000000007, "t": 401.53442, "r": 484.26327999999995, "b": 487.01999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "QIBM_DB_SQLADM", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 501.13837, "t": 401.6145, "r": 509.46329, "b": 487.01999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "QIBM_DB_SYSMON", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 526.39862, "t": 432.79944, "r": 534.72357, "b": 487.02005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "No Authority", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800003, "t": 498.55798, "r": 220.15681000000004, "b": 506.883, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "SET CURRENT DEGREE  (SQL statement)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0, "t": 498.55798, "r": 435.00299000000007, "b": 506.883, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00031, "t": 498.55798, "r": 486.0033, "b": 506.883, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800018, "t": 517.51828, "r": 264.5538, "b": 525.84329, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "CHGQRYA  command targeting a different user\u2019s job", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.00003, "t": 517.51828, "r": 435.00302000000005, "b": 525.84329, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00034, "t": 517.51828, "r": 486.00333, "b": 525.84329, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800049, "t": 536.5379800000001, "r": 322.50574, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "STRDBMON  or  ENDDBMON  commands targeting a different user\u2019s job", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.00003, "t": 536.5379800000001, "r": 435.00302000000005, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00034, "t": 536.5379800000001, "r": 486.00333, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800049, "t": 555.55768, "r": 381.02185, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "STRDBMON  or  ENDDBMON  commands targeting a job that matches the current user", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.00003, "t": 555.55768, "r": 435.00302000000005, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00034, "t": 555.55768, "r": 486.00333, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 505.26061999999996, "t": 555.55768, "r": 511.26361, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 530.76031, "t": 555.55768, "r": 536.76331, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800049, "t": 574.51797, "r": 359.51736, "b": 582.84299, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "QUSRJOBI() API format 900 or System i Navigator\u2019s SQL Details for Job", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 574.51797, "r": 435.00305000000003, "b": 582.84299, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 574.51797, "r": 486.00335999999993, "b": 582.84299, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 505.2606799999999, "t": 574.51797, "r": 511.26367, "b": 582.84299, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800079, "t": 593.5376699999999, "r": 220.75178999999997, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Visual Explain within Run SQL scripts", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 593.5376699999999, "r": 435.00305000000003, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 593.5376699999999, "r": 486.00335999999993, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 505.2606799999999, "t": 593.5376699999999, "r": 511.26367, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 530.76038, "t": 593.5376699999999, "r": 536.76337, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800079, "t": 612.55737, "r": 236.6548, "b": 620.88239, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Visual Explain outside of Run SQL scripts", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 612.55737, "r": 435.00305000000003, "b": 620.88239, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 612.55737, "r": 486.00335999999993, "b": 620.88239, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800079, "t": 631.51767, "r": 213.12968, "b": 639.84268, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "ANALYZE PLAN CACHE procedure", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 631.51767, "r": 435.00305000000003, "b": 639.84268, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 631.51767, "r": 486.00335999999993, "b": 639.84268, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800079, "t": 650.53737, "r": 199.87808, "b": 658.86238, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "DUMP PLAN CACHE procedure", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 650.53737, "r": 435.00305000000003, "b": 658.86238, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 650.53737, "r": 486.00335999999993, "b": 658.86238, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800079, "t": 669.55708, "r": 208.36777, "b": 677.88207, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "MODIFY PLAN CACHE procedure", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 669.55708, "r": 435.00305000000003, "b": 677.88207, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 669.55708, "r": 486.00335999999993, "b": 677.88207, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800079, "t": 688.57677, "r": 411.20264, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "MODIFY PLAN CACHE PROPERTIES procedure (currently does not check authority)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 688.57677, "r": 435.00305000000003, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 688.57677, "r": 486.00335999999993, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800079, "t": 707.537071, "r": 377.12585, "b": 715.862068, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "CHANGE PLAN CACHE SIZE procedure (currently does not check authority)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 707.537071, "r": 435.00305000000003, "b": 715.862068, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 707.537071, "r": 486.00335999999993, "b": 715.862068, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}]}], "body": [{"label": "text", "id": 2, "page_no": 8, "cluster": {"id": 2, "label": "text", "bbox": {"l": 136.79959, "t": 71.50903000000005, "r": 542.69434, "b": 140.72113000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9789126515388489, "cells": [{"id": 2, "text": "For example, assume that a business has assigned the duty to manage security on IBM i to ", "bbox": {"l": 136.79959, "t": 71.50903000000005, "r": 542.69434, "b": 80.72204999999985, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Theresa. Before release IBM i 7.2, to grant privileges, Theresa had to have the same ", "bbox": {"l": 136.79959, "t": 83.50885000000017, "r": 513.67804, "b": 92.72185999999999, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "privileges Theresa was granting to others. Therefore, to grant *USE privileges to the ", "bbox": {"l": 136.79959, "t": 95.50867000000005, "r": 509.71902, "b": 104.72167999999999, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "PAYROLL table, Theresa had to have *OBJMGT and *USE authority (or a higher level of ", "bbox": {"l": 136.79959, "t": 107.50847999999996, "r": 528.20184, "b": 116.72149999999999, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "authority, such as *ALLOBJ). This requirement allowed Theresa to access the data in the ", "bbox": {"l": 136.79959, "t": 119.50829999999996, "r": 531.84015, "b": 128.72131000000002, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "PAYROLL table even though Theresa\u2019s job description was only to manage its security.", "bbox": {"l": 136.79959, "t": 131.50811999999996, "r": 519.24982, "b": 140.72113000000002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "For example, assume that a business has assigned the duty to manage security on IBM i to Theresa. Before release IBM i 7.2, to grant privileges, Theresa had to have the same privileges Theresa was granting to others. Therefore, to grant *USE privileges to the PAYROLL table, Theresa had to have *OBJMGT and *USE authority (or a higher level of authority, such as *ALLOBJ). This requirement allowed Theresa to access the data in the PAYROLL table even though Theresa\u2019s job description was only to manage its security."}, {"label": "text", "id": 6, "page_no": 8, "cluster": {"id": 6, "label": "text", "bbox": {"l": 136.79959, "t": 153.52770999999996, "r": 547.30396, "b": 198.74017000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9665539860725403, "cells": [{"id": 8, "text": "In IBM i 7.2, the QIBM_DB_SECADM function usage grants authorities, revokes authorities, ", "bbox": {"l": 136.79959, "t": 153.52770999999996, "r": 544.16064, "b": 162.74072, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "changes ownership, or changes the primary group without giving access to the object or, in ", "bbox": {"l": 136.79959, "t": 165.52752999999996, "r": 540.66156, "b": 174.74054, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "the case of a database table, to the data that is in the table or allowing other operations on the ", "bbox": {"l": 136.79959, "t": 177.52733999999998, "r": 547.30396, "b": 186.74036, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "table. ", "bbox": {"l": 136.79959, "t": 189.52715999999998, "r": 163.6189, "b": 198.74017000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In IBM i 7.2, the QIBM_DB_SECADM function usage grants authorities, revokes authorities, changes ownership, or changes the primary group without giving access to the object or, in the case of a database table, to the data that is in the table or allowing other operations on the table."}, {"label": "text", "id": 4, "page_no": 8, "cluster": {"id": 4, "label": "text", "bbox": {"l": 136.79959, "t": 211.48694, "r": 538.65076, "b": 232.69976999999994, "coord_origin": "TOPLEFT"}, "confidence": 0.9691813588142395, "cells": [{"id": 12, "text": "QIBM_DB_SECADM function usage can be granted only by a user with *SECADM special ", "bbox": {"l": 136.79959, "t": 211.48694, "r": 538.65076, "b": 220.69994999999994, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "authority and can be given to a user or a group.", "bbox": {"l": 136.79959, "t": 223.48676, "r": 346.34808, "b": 232.69976999999994, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "QIBM_DB_SECADM function usage can be granted only by a user with *SECADM special authority and can be given to a user or a group."}, {"label": "text", "id": 3, "page_no": 8, "cluster": {"id": 3, "label": "text", "bbox": {"l": 136.79959, "t": 245.50635, "r": 545.79602, "b": 278.71898999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9729602336883545, "cells": [{"id": 14, "text": "QIBM_DB_SECADM also is responsible for administering RCAC, which restricts which rows ", "bbox": {"l": 136.79959, "t": 245.50635, "r": 545.79602, "b": 254.71936000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "a user is allowed to access in a table and whether a user is allowed to see information in ", "bbox": {"l": 136.79959, "t": 257.50616, "r": 529.46149, "b": 266.71918000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "certain columns of a table.", "bbox": {"l": 136.79959, "t": 269.50598, "r": 253.47696999999997, "b": 278.71898999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "QIBM_DB_SECADM also is responsible for administering RCAC, which restricts which rows a user is allowed to access in a table and whether a user is allowed to see information in certain columns of a table."}, {"label": "text", "id": 1, "page_no": 8, "cluster": {"id": 1, "label": "text", "bbox": {"l": 136.79959, "t": 291.52557, "r": 539.80713, "b": 336.73801, "coord_origin": "TOPLEFT"}, "confidence": 0.9815152883529663, "cells": [{"id": 17, "text": "A preferred practice is that the RCAC administrator has the QIBM_DB_SECADM function ", "bbox": {"l": 136.79959, "t": 291.52557, "r": 533.78137, "b": 300.73856, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "usage ID, but absolutely no other data privileges. The result is that the RCAC administrator ", "bbox": {"l": 136.79959, "t": 303.52539, "r": 539.80713, "b": 312.73837000000003, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "can deploy and maintain the RCAC constructs, but cannot grant themselves unauthorized ", "bbox": {"l": 136.79959, "t": 315.52521, "r": 534.5741, "b": 324.73819, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "access to data itself.", "bbox": {"l": 136.79959, "t": 327.52502, "r": 227.02324, "b": 336.73801, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "A preferred practice is that the RCAC administrator has the QIBM_DB_SECADM function usage ID, but absolutely no other data privileges. The result is that the RCAC administrator can deploy and maintain the RCAC constructs, but cannot grant themselves unauthorized access to data itself."}, {"label": "text", "id": 5, "page_no": 8, "cluster": {"id": 5, "label": "text", "bbox": {"l": 136.79959, "t": 349.48483, "r": 543.06714, "b": 370.69763000000006, "coord_origin": "TOPLEFT"}, "confidence": 0.9672255516052246, "cells": [{"id": 21, "text": "Table 2-2 shows a comparison of the different function usage IDs and *JOBCTL authority to ", "bbox": {"l": 136.79959, "t": 349.48483, "r": 543.06714, "b": 358.69780999999995, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "the different CL commands and DB2 for i tools.", "bbox": {"l": 136.79959, "t": 361.48465, "r": 343.79236, "b": 370.69763000000006, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 2-2 shows a comparison of the different function usage IDs and *JOBCTL authority to the different CL commands and DB2 for i tools."}, {"label": "caption", "id": 8, "page_no": 8, "cluster": {"id": 8, "label": "caption", "bbox": {"l": 64.800003, "t": 383.5379899999999, "r": 391.75464, "b": 391.86301, "coord_origin": "TOPLEFT"}, "confidence": 0.9337190985679626, "cells": [{"id": 23, "text": "Table 2-2 Comparison of the different function usage IDs and *JOBCTL authority", "bbox": {"l": 64.800003, "t": 383.5379899999999, "r": 391.75464, "b": 391.86301, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 2-2 Comparison of the different function usage IDs and *JOBCTL authority"}, {"label": "table", "id": 0, "page_no": 8, "cluster": {"id": 0, "label": "table", "bbox": {"l": 64.41139221191406, "t": 393.6136169433594, "r": 547.3950805664062, "b": 721.60791015625, "coord_origin": "TOPLEFT"}, "confidence": 0.9899572730064392, "cells": [{"id": 24, "text": "User action", "bbox": {"l": 70.800301, "t": 400.51827999999995, "r": 119.78551, "b": 408.84329, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "*JOBCTL", "bbox": {"l": 424.93805, "t": 447.52255, "r": 433.26297000000005, "b": 487.01999, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "QIBM_DB_SECADM", "bbox": {"l": 450.13806, "t": 401.6000700000001, "r": 458.46298, "b": 487.01999, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "QIBM_DB_SQLADM", "bbox": {"l": 475.93835000000007, "t": 401.53442, "r": 484.26327999999995, "b": 487.01999, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "QIBM_DB_SYSMON", "bbox": {"l": 501.13837, "t": 401.6145, "r": 509.46329, "b": 487.01999, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "No Authority", "bbox": {"l": 526.39862, "t": 432.79944, "r": 534.72357, "b": 487.02005, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "SET CURRENT DEGREE", "bbox": {"l": 70.800003, "t": 498.69299, "r": 151.6794, "b": 506.66699, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": " (SQL statement)", "bbox": {"l": 151.6803, "t": 498.55798, "r": 220.15681000000004, "b": 506.883, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "X", "bbox": {"l": 429.0, "t": 498.55798, "r": 435.00299000000007, "b": 506.883, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "X", "bbox": {"l": 480.00031, "t": 498.55798, "r": 486.0033, "b": 506.883, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "CHGQRYA", "bbox": {"l": 70.800018, "t": 517.65329, "r": 102.23972, "b": 525.62729, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": " command targeting a different user\u2019s job", "bbox": {"l": 102.23972, "t": 517.51828, "r": 264.5538, "b": 525.84329, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "X", "bbox": {"l": 429.00003, "t": 517.51828, "r": 435.00302000000005, "b": 525.84329, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "X", "bbox": {"l": 480.00034, "t": 517.51828, "r": 486.00333, "b": 525.84329, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "STRDBMON", "bbox": {"l": 70.800049, "t": 536.67299, "r": 106.73975, "b": 544.64699, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": " or ", "bbox": {"l": 106.73975, "t": 536.5379800000001, "r": 119.77895, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "ENDDBMON", "bbox": {"l": 119.69975000000001, "t": 536.67299, "r": 155.69974, "b": 544.64699, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": " commands targeting a different user\u2019s job", "bbox": {"l": 155.69974, "t": 536.5379800000001, "r": 322.50574, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "X", "bbox": {"l": 429.00003, "t": 536.5379800000001, "r": 435.00302000000005, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "X", "bbox": {"l": 480.00034, "t": 536.5379800000001, "r": 486.00333, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "STRDBMON", "bbox": {"l": 70.800049, "t": 555.69269, "r": 106.73975, "b": 563.66669, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": " or ", "bbox": {"l": 106.73975, "t": 555.55768, "r": 119.77895, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "ENDDBMON", "bbox": {"l": 119.69975000000001, "t": 555.69269, "r": 155.69974, "b": 563.66669, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": " commands targeting a job that matches the current user", "bbox": {"l": 155.69974, "t": 555.55768, "r": 381.02185, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "X", "bbox": {"l": 429.00003, "t": 555.55768, "r": 435.00302000000005, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "X", "bbox": {"l": 480.00034, "t": 555.55768, "r": 486.00333, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "X", "bbox": {"l": 505.26061999999996, "t": 555.55768, "r": 511.26361, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "X", "bbox": {"l": 530.76031, "t": 555.55768, "r": 536.76331, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "QUSRJOBI() API format 900 or System i Navigator\u2019s SQL Details for Job", "bbox": {"l": 70.800049, "t": 574.51797, "r": 359.51736, "b": 582.84299, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "X", "bbox": {"l": 429.0000600000001, "t": 574.51797, "r": 435.00305000000003, "b": 582.84299, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "X", "bbox": {"l": 480.00037, "t": 574.51797, "r": 486.00335999999993, "b": 582.84299, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "X", "bbox": {"l": 505.2606799999999, "t": 574.51797, "r": 511.26367, "b": 582.84299, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Visual Explain within Run SQL scripts", "bbox": {"l": 70.800079, "t": 593.5376699999999, "r": 220.75178999999997, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "X", "bbox": {"l": 429.0000600000001, "t": 593.5376699999999, "r": 435.00305000000003, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "X", "bbox": {"l": 480.00037, "t": 593.5376699999999, "r": 486.00335999999993, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "X", "bbox": {"l": 505.2606799999999, "t": 593.5376699999999, "r": 511.26367, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "X", "bbox": {"l": 530.76038, "t": 593.5376699999999, "r": 536.76337, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "Visual Explain outside of Run SQL scripts", "bbox": {"l": 70.800079, "t": 612.55737, "r": 236.6548, "b": 620.88239, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "X", "bbox": {"l": 429.0000600000001, "t": 612.55737, "r": 435.00305000000003, "b": 620.88239, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "X", "bbox": {"l": 480.00037, "t": 612.55737, "r": 486.00335999999993, "b": 620.88239, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "ANALYZE PLAN CACHE procedure", "bbox": {"l": 70.800079, "t": 631.51767, "r": 213.12968, "b": 639.84268, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "X", "bbox": {"l": 429.0000600000001, "t": 631.51767, "r": 435.00305000000003, "b": 639.84268, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "X", "bbox": {"l": 480.00037, "t": 631.51767, "r": 486.00335999999993, "b": 639.84268, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "DUMP PLAN CACHE procedure", "bbox": {"l": 70.800079, "t": 650.53737, "r": 199.87808, "b": 658.86238, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "X", "bbox": {"l": 429.0000600000001, "t": 650.53737, "r": 435.00305000000003, "b": 658.86238, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "X", "bbox": {"l": 480.00037, "t": 650.53737, "r": 486.00335999999993, "b": 658.86238, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "MODIFY PLAN CACHE procedure", "bbox": {"l": 70.800079, "t": 669.55708, "r": 208.36777, "b": 677.88207, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "X", "bbox": {"l": 429.0000600000001, "t": 669.55708, "r": 435.00305000000003, "b": 677.88207, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "X", "bbox": {"l": 480.00037, "t": 669.55708, "r": 486.00335999999993, "b": 677.88207, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "MODIFY PLAN CACHE PROPERTIES procedure (currently does not check authority)", "bbox": {"l": 70.800079, "t": 688.57677, "r": 411.20264, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "X", "bbox": {"l": 429.0000600000001, "t": 688.57677, "r": 435.00305000000003, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "X", "bbox": {"l": 480.00037, "t": 688.57677, "r": 486.00335999999993, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "CHANGE PLAN CACHE SIZE procedure (currently does not check authority)", "bbox": {"l": 70.800079, "t": 707.537071, "r": 377.12585, "b": 715.862068, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "X", "bbox": {"l": 429.0000600000001, "t": 707.537071, "r": 435.00305000000003, "b": 715.862068, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "X", "bbox": {"l": 480.00037, "t": 707.537071, "r": 486.00335999999993, "b": 715.862068, "coord_origin": "TOPLEFT"}}], "children": [{"id": 10, "label": "text", "bbox": {"l": 70.800301, "t": 400.51827999999995, "r": 119.78551, "b": 408.84329, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "User action", "bbox": {"l": 70.800301, "t": 400.51827999999995, "r": 119.78551, "b": 408.84329, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 424.93805, "t": 447.52255, "r": 433.26297000000005, "b": 487.01999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "*JOBCTL", "bbox": {"l": 424.93805, "t": 447.52255, "r": 433.26297000000005, "b": 487.01999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 450.13806, "t": 401.6000700000001, "r": 458.46298, "b": 487.01999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "QIBM_DB_SECADM", "bbox": {"l": 450.13806, "t": 401.6000700000001, "r": 458.46298, "b": 487.01999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 475.93835000000007, "t": 401.53442, "r": 484.26327999999995, "b": 487.01999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "QIBM_DB_SQLADM", "bbox": {"l": 475.93835000000007, "t": 401.53442, "r": 484.26327999999995, "b": 487.01999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 501.13837, "t": 401.6145, "r": 509.46329, "b": 487.01999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "QIBM_DB_SYSMON", "bbox": {"l": 501.13837, "t": 401.6145, "r": 509.46329, "b": 487.01999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 526.39862, "t": 432.79944, "r": 534.72357, "b": 487.02005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "No Authority", "bbox": {"l": 526.39862, "t": 432.79944, "r": 534.72357, "b": 487.02005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 70.800003, "t": 498.69299, "r": 151.6794, "b": 506.66699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "SET CURRENT DEGREE", "bbox": {"l": 70.800003, "t": 498.69299, "r": 151.6794, "b": 506.66699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 151.6803, "t": 498.55798, "r": 220.15681000000004, "b": 506.883, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": " (SQL statement)", "bbox": {"l": 151.6803, "t": 498.55798, "r": 220.15681000000004, "b": 506.883, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 429.0, "t": 498.55798, "r": 435.00299000000007, "b": 506.883, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "X", "bbox": {"l": 429.0, "t": 498.55798, "r": 435.00299000000007, "b": 506.883, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 480.00031, "t": 498.55798, "r": 486.0033, "b": 506.883, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "X", "bbox": {"l": 480.00031, "t": 498.55798, "r": 486.0033, "b": 506.883, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 70.800018, "t": 517.65329, "r": 102.23972, "b": 525.62729, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "CHGQRYA", "bbox": {"l": 70.800018, "t": 517.65329, "r": 102.23972, "b": 525.62729, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 102.23972, "t": 517.51828, "r": 264.5538, "b": 525.84329, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": " command targeting a different user\u2019s job", "bbox": {"l": 102.23972, "t": 517.51828, "r": 264.5538, "b": 525.84329, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 429.00003, "t": 517.51828, "r": 435.00302000000005, "b": 525.84329, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "X", "bbox": {"l": 429.00003, "t": 517.51828, "r": 435.00302000000005, "b": 525.84329, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 480.00034, "t": 517.51828, "r": 486.00333, "b": 525.84329, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "X", "bbox": {"l": 480.00034, "t": 517.51828, "r": 486.00333, "b": 525.84329, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 70.800049, "t": 536.67299, "r": 106.73975, "b": 544.64699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "STRDBMON", "bbox": {"l": 70.800049, "t": 536.67299, "r": 106.73975, "b": 544.64699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 106.73975, "t": 536.5379800000001, "r": 119.77895, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": " or ", "bbox": {"l": 106.73975, "t": 536.5379800000001, "r": 119.77895, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 119.69975000000001, "t": 536.67299, "r": 155.69974, "b": 544.64699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "ENDDBMON", "bbox": {"l": 119.69975000000001, "t": 536.67299, "r": 155.69974, "b": 544.64699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 155.69974, "t": 536.5379800000001, "r": 322.50574, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": " commands targeting a different user\u2019s job", "bbox": {"l": 155.69974, "t": 536.5379800000001, "r": 322.50574, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 429.00003, "t": 536.5379800000001, "r": 435.00302000000005, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "X", "bbox": {"l": 429.00003, "t": 536.5379800000001, "r": 435.00302000000005, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 480.00034, "t": 536.5379800000001, "r": 486.00333, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "X", "bbox": {"l": 480.00034, "t": 536.5379800000001, "r": 486.00333, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 70.800049, "t": 555.69269, "r": 106.73975, "b": 563.66669, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "STRDBMON", "bbox": {"l": 70.800049, "t": 555.69269, "r": 106.73975, "b": 563.66669, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 106.73975, "t": 555.55768, "r": 119.77895, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": " or ", "bbox": {"l": 106.73975, "t": 555.55768, "r": 119.77895, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 119.69975000000001, "t": 555.69269, "r": 155.69974, "b": 563.66669, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "ENDDBMON", "bbox": {"l": 119.69975000000001, "t": 555.69269, "r": 155.69974, "b": 563.66669, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 155.69974, "t": 555.55768, "r": 381.02185, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": " commands targeting a job that matches the current user", "bbox": {"l": 155.69974, "t": 555.55768, "r": 381.02185, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 429.00003, "t": 555.55768, "r": 435.00302000000005, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "X", "bbox": {"l": 429.00003, "t": 555.55768, "r": 435.00302000000005, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 480.00034, "t": 555.55768, "r": 486.00333, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "X", "bbox": {"l": 480.00034, "t": 555.55768, "r": 486.00333, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 505.26061999999996, "t": 555.55768, "r": 511.26361, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "X", "bbox": {"l": 505.26061999999996, "t": 555.55768, "r": 511.26361, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 530.76031, "t": 555.55768, "r": 536.76331, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "X", "bbox": {"l": 530.76031, "t": 555.55768, "r": 536.76331, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 70.800049, "t": 574.51797, "r": 359.51736, "b": 582.84299, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "QUSRJOBI() API format 900 or System i Navigator\u2019s SQL Details for Job", "bbox": {"l": 70.800049, "t": 574.51797, "r": 359.51736, "b": 582.84299, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 429.0000600000001, "t": 574.51797, "r": 435.00305000000003, "b": 582.84299, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "X", "bbox": {"l": 429.0000600000001, "t": 574.51797, "r": 435.00305000000003, "b": 582.84299, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 480.00037, "t": 574.51797, "r": 486.00335999999993, "b": 582.84299, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "X", "bbox": {"l": 480.00037, "t": 574.51797, "r": 486.00335999999993, "b": 582.84299, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 505.2606799999999, "t": 574.51797, "r": 511.26367, "b": 582.84299, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "X", "bbox": {"l": 505.2606799999999, "t": 574.51797, "r": 511.26367, "b": 582.84299, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 70.800079, "t": 593.5376699999999, "r": 220.75178999999997, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "Visual Explain within Run SQL scripts", "bbox": {"l": 70.800079, "t": 593.5376699999999, "r": 220.75178999999997, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 429.0000600000001, "t": 593.5376699999999, "r": 435.00305000000003, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "X", "bbox": {"l": 429.0000600000001, "t": 593.5376699999999, "r": 435.00305000000003, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 480.00037, "t": 593.5376699999999, "r": 486.00335999999993, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "X", "bbox": {"l": 480.00037, "t": 593.5376699999999, "r": 486.00335999999993, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 505.2606799999999, "t": 593.5376699999999, "r": 511.26367, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "X", "bbox": {"l": 505.2606799999999, "t": 593.5376699999999, "r": 511.26367, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 530.76038, "t": 593.5376699999999, "r": 536.76337, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "X", "bbox": {"l": 530.76038, "t": 593.5376699999999, "r": 536.76337, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 70.800079, "t": 612.55737, "r": 236.6548, "b": 620.88239, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "Visual Explain outside of Run SQL scripts", "bbox": {"l": 70.800079, "t": 612.55737, "r": 236.6548, "b": 620.88239, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 429.0000600000001, "t": 612.55737, "r": 435.00305000000003, "b": 620.88239, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "X", "bbox": {"l": 429.0000600000001, "t": 612.55737, "r": 435.00305000000003, "b": 620.88239, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 480.00037, "t": 612.55737, "r": 486.00335999999993, "b": 620.88239, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "X", "bbox": {"l": 480.00037, "t": 612.55737, "r": 486.00335999999993, "b": 620.88239, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 70.800079, "t": 631.51767, "r": 213.12968, "b": 639.84268, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "ANALYZE PLAN CACHE procedure", "bbox": {"l": 70.800079, "t": 631.51767, "r": 213.12968, "b": 639.84268, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 429.0000600000001, "t": 631.51767, "r": 435.00305000000003, "b": 639.84268, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "X", "bbox": {"l": 429.0000600000001, "t": 631.51767, "r": 435.00305000000003, "b": 639.84268, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 480.00037, "t": 631.51767, "r": 486.00335999999993, "b": 639.84268, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "X", "bbox": {"l": 480.00037, "t": 631.51767, "r": 486.00335999999993, "b": 639.84268, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 70.800079, "t": 650.53737, "r": 199.87808, "b": 658.86238, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "DUMP PLAN CACHE procedure", "bbox": {"l": 70.800079, "t": 650.53737, "r": 199.87808, "b": 658.86238, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 429.0000600000001, "t": 650.53737, "r": 435.00305000000003, "b": 658.86238, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "X", "bbox": {"l": 429.0000600000001, "t": 650.53737, "r": 435.00305000000003, "b": 658.86238, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 480.00037, "t": 650.53737, "r": 486.00335999999993, "b": 658.86238, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "X", "bbox": {"l": 480.00037, "t": 650.53737, "r": 486.00335999999993, "b": 658.86238, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 70.800079, "t": 669.55708, "r": 208.36777, "b": 677.88207, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "MODIFY PLAN CACHE procedure", "bbox": {"l": 70.800079, "t": 669.55708, "r": 208.36777, "b": 677.88207, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 429.0000600000001, "t": 669.55708, "r": 435.00305000000003, "b": 677.88207, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "X", "bbox": {"l": 429.0000600000001, "t": 669.55708, "r": 435.00305000000003, "b": 677.88207, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 480.00037, "t": 669.55708, "r": 486.00335999999993, "b": 677.88207, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "X", "bbox": {"l": 480.00037, "t": 669.55708, "r": 486.00335999999993, "b": 677.88207, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 70.800079, "t": 688.57677, "r": 411.20264, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "MODIFY PLAN CACHE PROPERTIES procedure (currently does not check authority)", "bbox": {"l": 70.800079, "t": 688.57677, "r": 411.20264, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 429.0000600000001, "t": 688.57677, "r": 435.00305000000003, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "X", "bbox": {"l": 429.0000600000001, "t": 688.57677, "r": 435.00305000000003, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 480.00037, "t": 688.57677, "r": 486.00335999999993, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "X", "bbox": {"l": 480.00037, "t": 688.57677, "r": 486.00335999999993, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 70.800079, "t": 707.537071, "r": 377.12585, "b": 715.862068, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "CHANGE PLAN CACHE SIZE procedure (currently does not check authority)", "bbox": {"l": 70.800079, "t": 707.537071, "r": 377.12585, "b": 715.862068, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 429.0000600000001, "t": 707.537071, "r": 435.00305000000003, "b": 715.862068, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "X", "bbox": {"l": 429.0000600000001, "t": 707.537071, "r": 435.00305000000003, "b": 715.862068, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 480.00037, "t": 707.537071, "r": 486.00335999999993, "b": 715.862068, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "X", "bbox": {"l": 480.00037, "t": 707.537071, "r": 486.00335999999993, "b": 715.862068, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "ecel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "ecel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "ecel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "ecel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "ecel", "fcel", "fcel", "ecel", "nl", "rhed", "fcel", "ecel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "ecel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "ecel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "ecel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "ecel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "ecel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "ecel", "fcel", "ecel", "ecel", "nl"], "num_rows": 13, "num_cols": 6, "table_cells": [{"bbox": {"l": 70.800301, "t": 400.51827999999995, "r": 119.78551, "b": 408.84329, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "User action", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 424.93805, "t": 447.52255, "r": 433.26297000000005, "b": 487.01999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "*JOBCTL", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 450.13806, "t": 401.6000700000001, "r": 458.46298, "b": 487.01999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "QIBM_DB_SECADM", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 475.93835000000007, "t": 401.53442, "r": 484.26327999999995, "b": 487.01999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "QIBM_DB_SQLADM", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 501.13837, "t": 401.6145, "r": 509.46329, "b": 487.01999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "QIBM_DB_SYSMON", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 526.39862, "t": 432.79944, "r": 534.72357, "b": 487.02005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "No Authority", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800003, "t": 498.55798, "r": 220.15681000000004, "b": 506.883, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "SET CURRENT DEGREE  (SQL statement)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0, "t": 498.55798, "r": 435.00299000000007, "b": 506.883, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00031, "t": 498.55798, "r": 486.0033, "b": 506.883, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800018, "t": 517.51828, "r": 264.5538, "b": 525.84329, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "CHGQRYA  command targeting a different user\u2019s job", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.00003, "t": 517.51828, "r": 435.00302000000005, "b": 525.84329, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00034, "t": 517.51828, "r": 486.00333, "b": 525.84329, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800049, "t": 536.5379800000001, "r": 322.50574, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "STRDBMON  or  ENDDBMON  commands targeting a different user\u2019s job", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.00003, "t": 536.5379800000001, "r": 435.00302000000005, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00034, "t": 536.5379800000001, "r": 486.00333, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800049, "t": 555.55768, "r": 381.02185, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "STRDBMON  or  ENDDBMON  commands targeting a job that matches the current user", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.00003, "t": 555.55768, "r": 435.00302000000005, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00034, "t": 555.55768, "r": 486.00333, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 505.26061999999996, "t": 555.55768, "r": 511.26361, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 530.76031, "t": 555.55768, "r": 536.76331, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800049, "t": 574.51797, "r": 359.51736, "b": 582.84299, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "QUSRJOBI() API format 900 or System i Navigator\u2019s SQL Details for Job", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 574.51797, "r": 435.00305000000003, "b": 582.84299, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 574.51797, "r": 486.00335999999993, "b": 582.84299, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 505.2606799999999, "t": 574.51797, "r": 511.26367, "b": 582.84299, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800079, "t": 593.5376699999999, "r": 220.75178999999997, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Visual Explain within Run SQL scripts", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 593.5376699999999, "r": 435.00305000000003, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 593.5376699999999, "r": 486.00335999999993, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 505.2606799999999, "t": 593.5376699999999, "r": 511.26367, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 530.76038, "t": 593.5376699999999, "r": 536.76337, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800079, "t": 612.55737, "r": 236.6548, "b": 620.88239, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Visual Explain outside of Run SQL scripts", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 612.55737, "r": 435.00305000000003, "b": 620.88239, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 612.55737, "r": 486.00335999999993, "b": 620.88239, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800079, "t": 631.51767, "r": 213.12968, "b": 639.84268, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "ANALYZE PLAN CACHE procedure", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 631.51767, "r": 435.00305000000003, "b": 639.84268, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 631.51767, "r": 486.00335999999993, "b": 639.84268, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800079, "t": 650.53737, "r": 199.87808, "b": 658.86238, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "DUMP PLAN CACHE procedure", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 650.53737, "r": 435.00305000000003, "b": 658.86238, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 650.53737, "r": 486.00335999999993, "b": 658.86238, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800079, "t": 669.55708, "r": 208.36777, "b": 677.88207, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "MODIFY PLAN CACHE procedure", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 669.55708, "r": 435.00305000000003, "b": 677.88207, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 669.55708, "r": 486.00335999999993, "b": 677.88207, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800079, "t": 688.57677, "r": 411.20264, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "MODIFY PLAN CACHE PROPERTIES procedure (currently does not check authority)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 688.57677, "r": 435.00305000000003, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 688.57677, "r": 486.00335999999993, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800079, "t": 707.537071, "r": 377.12585, "b": 715.862068, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "CHANGE PLAN CACHE SIZE procedure (currently does not check authority)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 707.537071, "r": 435.00305000000003, "b": 715.862068, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 707.537071, "r": 486.00335999999993, "b": 715.862068, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}]}], "headers": [{"label": "page_footer", "id": 7, "page_no": 8, "cluster": {"id": 7, "label": "page_footer", "bbox": {"l": 355.32001, "t": 755.538002, "r": 523.54071, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9508126974105835, "cells": [{"id": 0, "text": "Chapter 2. Roles and separation of duties ", "bbox": {"l": 355.32001, "t": 755.538002, "r": 523.54071, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Chapter 2. Roles and separation of duties"}, {"label": "page_footer", "id": 9, "page_no": 8, "cluster": {"id": 9, "label": "page_footer", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.8987306356430054, "cells": [{"id": 1, "text": "11", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "11"}]}}, {"page_no": 9, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "Chapter 3. Row and Column Access Control ", "bbox": {"l": 344.94, "t": 755.538002, "r": 523.60162, "b": 763.863001, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "15", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "The SQL ", "bbox": {"l": 136.79959, "t": 71.50903000000005, "r": 179.58179, "b": 80.72204999999985, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "CREATE PERMISSION", "bbox": {"l": 179.57977, "t": 71.65845000000002, "r": 264.47879, "b": 80.48302999999999, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": " statement that is shown in Figure 3-1 is used to define and ", "bbox": {"l": 264.53955, "t": 71.50903000000005, "r": 528.73059, "b": 80.72204999999985, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "initially enable or disable the row access rules.", "bbox": {"l": 136.79956, "t": 83.50885000000017, "r": 341.71762, "b": 92.72185999999999, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Figure 3-1 CREATE PERMISSION SQL statement", "bbox": {"l": 136.8, "t": 414.138, "r": 341.97659, "b": 422.46301, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Column mask", "bbox": {"l": 136.8, "t": 439.94399999999996, "r": 215.37601, "b": 451.04401, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "A column mask is a database object that manifests a column value access control rule for a ", "bbox": {"l": 136.8, "t": 455.08871000000005, "r": 542.76648, "b": 464.3017, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "specific column in a specific table. It uses a CASE expression that describes what you see ", "bbox": {"l": 136.8, "t": 467.08853, "r": 537.84125, "b": 476.30151, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "when you access the column. For example, a teller can see only the last four digits of a tax ", "bbox": {"l": 136.8, "t": 479.08835, "r": 538.80927, "b": 488.30133, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "identification number.", "bbox": {"l": 136.8, "t": 491.08817, "r": 231.20888, "b": 500.30115, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "CREATE PERMISSION", "bbox": {"l": 148.1337, "t": 139.67969000000005, "r": 246.7961, "b": 149.50982999999997, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "<", "bbox": {"l": 251.86685, "t": 139.67969000000005, "r": 257.58578, "b": 149.49834999999996, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "permission name", "bbox": {"l": 257.59152, "t": 139.67969000000005, "r": 336.99741, "b": 149.50982999999997, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": ">", "bbox": {"l": 337.01233, "t": 139.67969000000005, "r": 342.73126, "b": 149.49834999999996, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Names the row permission for row access control", "bbox": {"l": 346.56491, "t": 121.46252000000004, "r": 530.74371, "b": 129.33507999999995, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "ON", "bbox": {"l": 148.1337, "t": 181.06255999999996, "r": 163.45079, "b": 190.8927, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "<", "bbox": {"l": 168.58405, "t": 181.06255999999996, "r": 174.30298, "b": 190.88122999999996, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "table name", "bbox": {"l": 174.30872, "t": 181.06255999999996, "r": 226.86777, "b": 190.8927, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": ">", "bbox": {"l": 226.86548000000002, "t": 181.06255999999996, "r": 232.58441, "b": 190.88122999999996, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Identifies the table on which the row ", "bbox": {"l": 311.3204, "t": 166.29413, "r": 450.77191000000005, "b": 174.16669000000002, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "permission is created", "bbox": {"l": 450.86123999999995, "t": 166.29413, "r": 529.93134, "b": 174.16669000000002, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "AS ", "bbox": {"l": 148.1337, "t": 222.44550000000004, "r": 163.10973, "b": 232.27562999999998, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "<", "bbox": {"l": 165.68669, "t": 222.44550000000004, "r": 171.40562, "b": 232.26415999999995, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "correlation name", "bbox": {"l": 171.41136, "t": 222.44550000000004, "r": 251.20424000000003, "b": 232.27562999999998, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": ">", "bbox": {"l": 251.21115, "t": 222.44550000000004, "r": 256.93008, "b": 232.26415999999995, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Specifies an optional correlation name that ca", "bbox": {"l": 235.79649, "t": 204.22839, "r": 406.62051, "b": 212.10095, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "be used within search-condition", "bbox": {"l": 480.53094, "t": 204.22839, "r": 532.89496, "b": 212.10095, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "FOR ROWS", "bbox": {"l": 148.1337, "t": 263.82836999999995, "r": 199.72467, "b": 273.65851, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Indicates that a row permission is cr", "bbox": {"l": 321.56271, "t": 246.09411999999998, "r": 455.3432, "b": 253.96667000000002, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "eated", "bbox": {"l": 455.20786000000004, "t": 246.09411999999998, "r": 476.48404, "b": 253.96667000000002, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Specifies a condition that can be ", "bbox": {"l": 321.5972, "t": 266.30267000000003, "r": 444.0292400000001, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "true,", "bbox": {"l": 444.07986, "t": 266.30267000000003, "r": 459.08678999999995, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "false, or unknown", "bbox": {"l": 464.2088, "t": 266.30267000000003, "r": 530.94897, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "WHERE", "bbox": {"l": 148.1337, "t": 291.41708, "r": 183.42342, "b": 301.24722, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "<", "bbox": {"l": 188.61984, "t": 291.41708, "r": 194.33878, "b": 301.23572, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "logic to test: user and/or group and/or column value", "bbox": {"l": 194.34451, "t": 291.41708, "r": 437.04659999999996, "b": 301.24722, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": ">", "bbox": {"l": 437.09020999999996, "t": 291.41708, "r": 442.80914000000007, "b": 301.23572, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "ENFORCED FOR ALL ACCESS", "bbox": {"l": 148.1337, "t": 332.79999, "r": 278.77805, "b": 342.63013, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "Specifies that the row permission applies to all ref", "bbox": {"l": 271.55829, "t": 314.58276, "r": 457.4451, "b": 322.45535, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "erences of the table", "bbox": {"l": 457.19281, "t": 314.58276, "r": 531.74939, "b": 322.45535, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "ENABLE", "bbox": {"l": 148.1337, "t": 374.18289, "r": 185.17584, "b": 384.01302999999996, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Specifies that the row permission is to", "bbox": {"l": 312.28601, "t": 355.96576000000005, "r": 454.33505, "b": 363.83835, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": " be initially enabled", "bbox": {"l": 454.3461, "t": 355.96576000000005, "r": 527.05286, "b": 363.83835, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "S", "bbox": {"l": 311.73431, "t": 376.65717, "r": 315.94684, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "ifith t th", "bbox": {"l": 329.28326, "t": 376.65717, "r": 371.71786, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "i", "bbox": {"l": 415.0014, "t": 376.65717, "r": 417.09616, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "i", "bbox": {"l": 424.27356, "t": 376.65717, "r": 426.36832, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "i", "bbox": {"l": 438.13208, "t": 376.65717, "r": 440.2268399999999, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "t", "bbox": {"l": 445.88681, "t": 376.65717, "r": 448.95757999999995, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "b", "bbox": {"l": 455.8532400000001, "t": 376.65717, "r": 460.67346000000003, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "i", "bbox": {"l": 467.36746, "t": 376.65717, "r": 470.06998000000004, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "iti ll", "bbox": {"l": 472.73705999999993, "t": 376.65717, "r": 490.1676, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "di", "bbox": {"l": 496.33661, "t": 376.65717, "r": 503.2608, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "bl d", "bbox": {"l": 511.26138, "t": 376.65717, "r": 527.59674, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "DISABLE", "bbox": {"l": 148.1337, "t": 387.9772, "r": 187.6265, "b": 397.80734000000007, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": ";", "bbox": {"l": 187.58514, "t": 387.9772, "r": 190.6628, "b": 397.79583999999994, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Specifies that the row permission is to ", "bbox": {"l": 311.73431, "t": 376.65717, "r": 455.83047000000005, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "be initially disabled", "bbox": {"l": 455.8848, "t": 376.65717, "r": 527.62122, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 2, "label": "page_footer", "bbox": {"l": 344.94, "t": 755.538002, "r": 523.60162, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9526246786117554, "cells": [{"id": 0, "text": "Chapter 3. Row and Column Access Control ", "bbox": {"l": 344.94, "t": 755.538002, "r": 523.60162, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "page_footer", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.9071077704429626, "cells": [{"id": 1, "text": "15", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "caption", "bbox": {"l": 136.79956, "t": 71.50903000000005, "r": 528.73059, "b": 92.72185999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.8728439211845398, "cells": [{"id": 2, "text": "The SQL ", "bbox": {"l": 136.79959, "t": 71.50903000000005, "r": 179.58179, "b": 80.72204999999985, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "CREATE PERMISSION", "bbox": {"l": 179.57977, "t": 71.65845000000002, "r": 264.47879, "b": 80.48302999999999, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": " statement that is shown in Figure 3-1 is used to define and ", "bbox": {"l": 264.53955, "t": 71.50903000000005, "r": 528.73059, "b": 80.72204999999985, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "initially enable or disable the row access rules.", "bbox": {"l": 136.79956, "t": 83.50885000000017, "r": 341.71762, "b": 92.72185999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "caption", "bbox": {"l": 136.8, "t": 414.138, "r": 341.97659, "b": 422.46301, "coord_origin": "TOPLEFT"}, "confidence": 0.9387834072113037, "cells": [{"id": 6, "text": "Figure 3-1 CREATE PERMISSION SQL statement", "bbox": {"l": 136.8, "t": 414.138, "r": 341.97659, "b": 422.46301, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "section_header", "bbox": {"l": 136.8, "t": 439.94399999999996, "r": 215.37601, "b": 451.04401, "coord_origin": "TOPLEFT"}, "confidence": 0.9477567076683044, "cells": [{"id": 7, "text": "Column mask", "bbox": {"l": 136.8, "t": 439.94399999999996, "r": 215.37601, "b": 451.04401, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 136.8, "t": 455.08871000000005, "r": 542.76648, "b": 500.30115, "coord_origin": "TOPLEFT"}, "confidence": 0.9843974709510803, "cells": [{"id": 8, "text": "A column mask is a database object that manifests a column value access control rule for a ", "bbox": {"l": 136.8, "t": 455.08871000000005, "r": 542.76648, "b": 464.3017, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "specific column in a specific table. It uses a CASE expression that describes what you see ", "bbox": {"l": 136.8, "t": 467.08853, "r": 537.84125, "b": 476.30151, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "when you access the column. For example, a teller can see only the last four digits of a tax ", "bbox": {"l": 136.8, "t": 479.08835, "r": 538.80927, "b": 488.30133, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "identification number.", "bbox": {"l": 136.8, "t": 491.08817, "r": 231.20888, "b": 500.30115, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "picture", "bbox": {"l": 135.9717559814453, "t": 107.4107437133789, "r": 545.4180908203125, "b": 410.60931396484375, "coord_origin": "TOPLEFT"}, "confidence": 0.9788318872451782, "cells": [{"id": 12, "text": "CREATE PERMISSION", "bbox": {"l": 148.1337, "t": 139.67969000000005, "r": 246.7961, "b": 149.50982999999997, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "<", "bbox": {"l": 251.86685, "t": 139.67969000000005, "r": 257.58578, "b": 149.49834999999996, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "permission name", "bbox": {"l": 257.59152, "t": 139.67969000000005, "r": 336.99741, "b": 149.50982999999997, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": ">", "bbox": {"l": 337.01233, "t": 139.67969000000005, "r": 342.73126, "b": 149.49834999999996, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Names the row permission for row access control", "bbox": {"l": 346.56491, "t": 121.46252000000004, "r": 530.74371, "b": 129.33507999999995, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "ON", "bbox": {"l": 148.1337, "t": 181.06255999999996, "r": 163.45079, "b": 190.8927, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "<", "bbox": {"l": 168.58405, "t": 181.06255999999996, "r": 174.30298, "b": 190.88122999999996, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "table name", "bbox": {"l": 174.30872, "t": 181.06255999999996, "r": 226.86777, "b": 190.8927, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": ">", "bbox": {"l": 226.86548000000002, "t": 181.06255999999996, "r": 232.58441, "b": 190.88122999999996, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Identifies the table on which the row ", "bbox": {"l": 311.3204, "t": 166.29413, "r": 450.77191000000005, "b": 174.16669000000002, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "permission is created", "bbox": {"l": 450.86123999999995, "t": 166.29413, "r": 529.93134, "b": 174.16669000000002, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "AS ", "bbox": {"l": 148.1337, "t": 222.44550000000004, "r": 163.10973, "b": 232.27562999999998, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "<", "bbox": {"l": 165.68669, "t": 222.44550000000004, "r": 171.40562, "b": 232.26415999999995, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "correlation name", "bbox": {"l": 171.41136, "t": 222.44550000000004, "r": 251.20424000000003, "b": 232.27562999999998, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": ">", "bbox": {"l": 251.21115, "t": 222.44550000000004, "r": 256.93008, "b": 232.26415999999995, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Specifies an optional correlation name that ca", "bbox": {"l": 235.79649, "t": 204.22839, "r": 406.62051, "b": 212.10095, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "be used within search-condition", "bbox": {"l": 480.53094, "t": 204.22839, "r": 532.89496, "b": 212.10095, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "FOR ROWS", "bbox": {"l": 148.1337, "t": 263.82836999999995, "r": 199.72467, "b": 273.65851, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Indicates that a row permission is cr", "bbox": {"l": 321.56271, "t": 246.09411999999998, "r": 455.3432, "b": 253.96667000000002, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "eated", "bbox": {"l": 455.20786000000004, "t": 246.09411999999998, "r": 476.48404, "b": 253.96667000000002, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Specifies a condition that can be ", "bbox": {"l": 321.5972, "t": 266.30267000000003, "r": 444.0292400000001, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "true,", "bbox": {"l": 444.07986, "t": 266.30267000000003, "r": 459.08678999999995, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "false, or unknown", "bbox": {"l": 464.2088, "t": 266.30267000000003, "r": 530.94897, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "WHERE", "bbox": {"l": 148.1337, "t": 291.41708, "r": 183.42342, "b": 301.24722, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "<", "bbox": {"l": 188.61984, "t": 291.41708, "r": 194.33878, "b": 301.23572, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "logic to test: user and/or group and/or column value", "bbox": {"l": 194.34451, "t": 291.41708, "r": 437.04659999999996, "b": 301.24722, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": ">", "bbox": {"l": 437.09020999999996, "t": 291.41708, "r": 442.80914000000007, "b": 301.23572, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "ENFORCED FOR ALL ACCESS", "bbox": {"l": 148.1337, "t": 332.79999, "r": 278.77805, "b": 342.63013, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "Specifies that the row permission applies to all ref", "bbox": {"l": 271.55829, "t": 314.58276, "r": 457.4451, "b": 322.45535, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "erences of the table", "bbox": {"l": 457.19281, "t": 314.58276, "r": 531.74939, "b": 322.45535, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "ENABLE", "bbox": {"l": 148.1337, "t": 374.18289, "r": 185.17584, "b": 384.01302999999996, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Specifies that the row permission is to", "bbox": {"l": 312.28601, "t": 355.96576000000005, "r": 454.33505, "b": 363.83835, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": " be initially enabled", "bbox": {"l": 454.3461, "t": 355.96576000000005, "r": 527.05286, "b": 363.83835, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "S", "bbox": {"l": 311.73431, "t": 376.65717, "r": 315.94684, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "ifith t th", "bbox": {"l": 329.28326, "t": 376.65717, "r": 371.71786, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "i", "bbox": {"l": 415.0014, "t": 376.65717, "r": 417.09616, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "i", "bbox": {"l": 424.27356, "t": 376.65717, "r": 426.36832, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "i", "bbox": {"l": 438.13208, "t": 376.65717, "r": 440.2268399999999, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "t", "bbox": {"l": 445.88681, "t": 376.65717, "r": 448.95757999999995, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "b", "bbox": {"l": 455.8532400000001, "t": 376.65717, "r": 460.67346000000003, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "i", "bbox": {"l": 467.36746, "t": 376.65717, "r": 470.06998000000004, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "iti ll", "bbox": {"l": 472.73705999999993, "t": 376.65717, "r": 490.1676, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "di", "bbox": {"l": 496.33661, "t": 376.65717, "r": 503.2608, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "bl d", "bbox": {"l": 511.26138, "t": 376.65717, "r": 527.59674, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "DISABLE", "bbox": {"l": 148.1337, "t": 387.9772, "r": 187.6265, "b": 397.80734000000007, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": ";", "bbox": {"l": 187.58514, "t": 387.9772, "r": 190.6628, "b": 397.79583999999994, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Specifies that the row permission is to ", "bbox": {"l": 311.73431, "t": 376.65717, "r": 455.83047000000005, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "be initially disabled", "bbox": {"l": 455.8848, "t": 376.65717, "r": 527.62122, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": [{"id": 7, "label": "text", "bbox": {"l": 148.1337, "t": 139.67969000000005, "r": 246.7961, "b": 149.50982999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "CREATE PERMISSION", "bbox": {"l": 148.1337, "t": 139.67969000000005, "r": 246.7961, "b": 149.50982999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "text", "bbox": {"l": 251.86685, "t": 139.67969000000005, "r": 257.58578, "b": 149.49834999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "<", "bbox": {"l": 251.86685, "t": 139.67969000000005, "r": 257.58578, "b": 149.49834999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 257.59152, "t": 139.67969000000005, "r": 336.99741, "b": 149.50982999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "permission name", "bbox": {"l": 257.59152, "t": 139.67969000000005, "r": 336.99741, "b": 149.50982999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "text", "bbox": {"l": 337.01233, "t": 139.67969000000005, "r": 342.73126, "b": 149.49834999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": ">", "bbox": {"l": 337.01233, "t": 139.67969000000005, "r": 342.73126, "b": 149.49834999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 346.56491, "t": 121.46252000000004, "r": 530.74371, "b": 129.33507999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "Names the row permission for row access control", "bbox": {"l": 346.56491, "t": 121.46252000000004, "r": 530.74371, "b": 129.33507999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 148.1337, "t": 181.06255999999996, "r": 163.45079, "b": 190.8927, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "ON", "bbox": {"l": 148.1337, "t": 181.06255999999996, "r": 163.45079, "b": 190.8927, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 168.58405, "t": 181.06255999999996, "r": 174.30298, "b": 190.88122999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "<", "bbox": {"l": 168.58405, "t": 181.06255999999996, "r": 174.30298, "b": 190.88122999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 174.30872, "t": 181.06255999999996, "r": 226.86777, "b": 190.8927, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "table name", "bbox": {"l": 174.30872, "t": 181.06255999999996, "r": 226.86777, "b": 190.8927, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 226.86548000000002, "t": 181.06255999999996, "r": 232.58441, "b": 190.88122999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": ">", "bbox": {"l": 226.86548000000002, "t": 181.06255999999996, "r": 232.58441, "b": 190.88122999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 311.3204, "t": 166.29413, "r": 450.77191000000005, "b": 174.16669000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "Identifies the table on which the row ", "bbox": {"l": 311.3204, "t": 166.29413, "r": 450.77191000000005, "b": 174.16669000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 450.86123999999995, "t": 166.29413, "r": 529.93134, "b": 174.16669000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "permission is created", "bbox": {"l": 450.86123999999995, "t": 166.29413, "r": 529.93134, "b": 174.16669000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 148.1337, "t": 222.44550000000004, "r": 163.10973, "b": 232.27562999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "AS ", "bbox": {"l": 148.1337, "t": 222.44550000000004, "r": 163.10973, "b": 232.27562999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 165.68669, "t": 222.44550000000004, "r": 171.40562, "b": 232.26415999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "<", "bbox": {"l": 165.68669, "t": 222.44550000000004, "r": 171.40562, "b": 232.26415999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 171.41136, "t": 222.44550000000004, "r": 251.20424000000003, "b": 232.27562999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "correlation name", "bbox": {"l": 171.41136, "t": 222.44550000000004, "r": 251.20424000000003, "b": 232.27562999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 251.21115, "t": 222.44550000000004, "r": 256.93008, "b": 232.26415999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": ">", "bbox": {"l": 251.21115, "t": 222.44550000000004, "r": 256.93008, "b": 232.26415999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 235.79649, "t": 204.22839, "r": 406.62051, "b": 212.10095, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "Specifies an optional correlation name that ca", "bbox": {"l": 235.79649, "t": 204.22839, "r": 406.62051, "b": 212.10095, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 480.53094, "t": 204.22839, "r": 532.89496, "b": 212.10095, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "be used within search-condition", "bbox": {"l": 480.53094, "t": 204.22839, "r": 532.89496, "b": 212.10095, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 148.1337, "t": 263.82836999999995, "r": 199.72467, "b": 273.65851, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "FOR ROWS", "bbox": {"l": 148.1337, "t": 263.82836999999995, "r": 199.72467, "b": 273.65851, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 321.56271, "t": 246.09411999999998, "r": 455.3432, "b": 253.96667000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "Indicates that a row permission is cr", "bbox": {"l": 321.56271, "t": 246.09411999999998, "r": 455.3432, "b": 253.96667000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 455.20786000000004, "t": 246.09411999999998, "r": 476.48404, "b": 253.96667000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "eated", "bbox": {"l": 455.20786000000004, "t": 246.09411999999998, "r": 476.48404, "b": 253.96667000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 321.5972, "t": 266.30267000000003, "r": 444.0292400000001, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "Specifies a condition that can be ", "bbox": {"l": 321.5972, "t": 266.30267000000003, "r": 444.0292400000001, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 444.07986, "t": 266.30267000000003, "r": 459.08678999999995, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "true,", "bbox": {"l": 444.07986, "t": 266.30267000000003, "r": 459.08678999999995, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 464.2088, "t": 266.30267000000003, "r": 530.94897, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "false, or unknown", "bbox": {"l": 464.2088, "t": 266.30267000000003, "r": 530.94897, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 148.1337, "t": 291.41708, "r": 183.42342, "b": 301.24722, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "WHERE", "bbox": {"l": 148.1337, "t": 291.41708, "r": 183.42342, "b": 301.24722, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 188.61984, "t": 291.41708, "r": 194.33878, "b": 301.23572, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "<", "bbox": {"l": 188.61984, "t": 291.41708, "r": 194.33878, "b": 301.23572, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 194.34451, "t": 291.41708, "r": 437.04659999999996, "b": 301.24722, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "logic to test: user and/or group and/or column value", "bbox": {"l": 194.34451, "t": 291.41708, "r": 437.04659999999996, "b": 301.24722, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 437.09020999999996, "t": 291.41708, "r": 442.80914000000007, "b": 301.23572, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": ">", "bbox": {"l": 437.09020999999996, "t": 291.41708, "r": 442.80914000000007, "b": 301.23572, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 148.1337, "t": 332.79999, "r": 278.77805, "b": 342.63013, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "ENFORCED FOR ALL ACCESS", "bbox": {"l": 148.1337, "t": 332.79999, "r": 278.77805, "b": 342.63013, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 271.55829, "t": 314.58276, "r": 457.4451, "b": 322.45535, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "Specifies that the row permission applies to all ref", "bbox": {"l": 271.55829, "t": 314.58276, "r": 457.4451, "b": 322.45535, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 457.19281, "t": 314.58276, "r": 531.74939, "b": 322.45535, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "erences of the table", "bbox": {"l": 457.19281, "t": 314.58276, "r": 531.74939, "b": 322.45535, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 148.1337, "t": 374.18289, "r": 185.17584, "b": 384.01302999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "ENABLE", "bbox": {"l": 148.1337, "t": 374.18289, "r": 185.17584, "b": 384.01302999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 312.28601, "t": 355.96576000000005, "r": 454.33505, "b": 363.83835, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "Specifies that the row permission is to", "bbox": {"l": 312.28601, "t": 355.96576000000005, "r": 454.33505, "b": 363.83835, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 454.3461, "t": 355.96576000000005, "r": 527.05286, "b": 363.83835, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": " be initially enabled", "bbox": {"l": 454.3461, "t": 355.96576000000005, "r": 527.05286, "b": 363.83835, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 311.73431, "t": 376.65717, "r": 315.94684, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "S", "bbox": {"l": 311.73431, "t": 376.65717, "r": 315.94684, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 329.28326, "t": 376.65717, "r": 371.71786, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "ifith t th", "bbox": {"l": 329.28326, "t": 376.65717, "r": 371.71786, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 415.0014, "t": 376.65717, "r": 417.09616, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "i", "bbox": {"l": 415.0014, "t": 376.65717, "r": 417.09616, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 424.27356, "t": 376.65717, "r": 426.36832, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "i", "bbox": {"l": 424.27356, "t": 376.65717, "r": 426.36832, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 438.13208, "t": 376.65717, "r": 440.2268399999999, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "i", "bbox": {"l": 438.13208, "t": 376.65717, "r": 440.2268399999999, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 445.88681, "t": 376.65717, "r": 448.95757999999995, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "t", "bbox": {"l": 445.88681, "t": 376.65717, "r": 448.95757999999995, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 455.8532400000001, "t": 376.65717, "r": 460.67346000000003, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "b", "bbox": {"l": 455.8532400000001, "t": 376.65717, "r": 460.67346000000003, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 467.36746, "t": 376.65717, "r": 470.06998000000004, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "i", "bbox": {"l": 467.36746, "t": 376.65717, "r": 470.06998000000004, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 472.73705999999993, "t": 376.65717, "r": 490.1676, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "iti ll", "bbox": {"l": 472.73705999999993, "t": 376.65717, "r": 490.1676, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 496.33661, "t": 376.65717, "r": 503.2608, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "di", "bbox": {"l": 496.33661, "t": 376.65717, "r": 503.2608, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 511.26138, "t": 376.65717, "r": 527.59674, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "bl d", "bbox": {"l": 511.26138, "t": 376.65717, "r": 527.59674, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 148.1337, "t": 387.9772, "r": 187.6265, "b": 397.80734000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "DISABLE", "bbox": {"l": 148.1337, "t": 387.9772, "r": 187.6265, "b": 397.80734000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 187.58514, "t": 387.9772, "r": 190.6628, "b": 397.79583999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": ";", "bbox": {"l": 187.58514, "t": 387.9772, "r": 190.6628, "b": 397.79583999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 311.73431, "t": 376.65717, "r": 455.83047000000005, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "Specifies that the row permission is to ", "bbox": {"l": 311.73431, "t": 376.65717, "r": 455.83047000000005, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 455.8848, "t": 376.65717, "r": 527.62122, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "be initially disabled", "bbox": {"l": 455.8848, "t": 376.65717, "r": 527.62122, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}]}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_footer", "id": 2, "page_no": 9, "cluster": {"id": 2, "label": "page_footer", "bbox": {"l": 344.94, "t": 755.538002, "r": 523.60162, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9526246786117554, "cells": [{"id": 0, "text": "Chapter 3. Row and Column Access Control ", "bbox": {"l": 344.94, "t": 755.538002, "r": 523.60162, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Chapter 3. Row and Column Access Control"}, {"label": "page_footer", "id": 5, "page_no": 9, "cluster": {"id": 5, "label": "page_footer", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.9071077704429626, "cells": [{"id": 1, "text": "15", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "15"}, {"label": "caption", "id": 6, "page_no": 9, "cluster": {"id": 6, "label": "caption", "bbox": {"l": 136.79956, "t": 71.50903000000005, "r": 528.73059, "b": 92.72185999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.8728439211845398, "cells": [{"id": 2, "text": "The SQL ", "bbox": {"l": 136.79959, "t": 71.50903000000005, "r": 179.58179, "b": 80.72204999999985, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "CREATE PERMISSION", "bbox": {"l": 179.57977, "t": 71.65845000000002, "r": 264.47879, "b": 80.48302999999999, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": " statement that is shown in Figure 3-1 is used to define and ", "bbox": {"l": 264.53955, "t": 71.50903000000005, "r": 528.73059, "b": 80.72204999999985, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "initially enable or disable the row access rules.", "bbox": {"l": 136.79956, "t": 83.50885000000017, "r": 341.71762, "b": 92.72185999999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The SQL CREATE PERMISSION statement that is shown in Figure 3-1 is used to define and initially enable or disable the row access rules."}, {"label": "caption", "id": 4, "page_no": 9, "cluster": {"id": 4, "label": "caption", "bbox": {"l": 136.8, "t": 414.138, "r": 341.97659, "b": 422.46301, "coord_origin": "TOPLEFT"}, "confidence": 0.9387834072113037, "cells": [{"id": 6, "text": "Figure 3-1 CREATE PERMISSION SQL statement", "bbox": {"l": 136.8, "t": 414.138, "r": 341.97659, "b": 422.46301, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 3-1 CREATE PERMISSION SQL statement"}, {"label": "section_header", "id": 3, "page_no": 9, "cluster": {"id": 3, "label": "section_header", "bbox": {"l": 136.8, "t": 439.94399999999996, "r": 215.37601, "b": 451.04401, "coord_origin": "TOPLEFT"}, "confidence": 0.9477567076683044, "cells": [{"id": 7, "text": "Column mask", "bbox": {"l": 136.8, "t": 439.94399999999996, "r": 215.37601, "b": 451.04401, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Column mask"}, {"label": "text", "id": 0, "page_no": 9, "cluster": {"id": 0, "label": "text", "bbox": {"l": 136.8, "t": 455.08871000000005, "r": 542.76648, "b": 500.30115, "coord_origin": "TOPLEFT"}, "confidence": 0.9843974709510803, "cells": [{"id": 8, "text": "A column mask is a database object that manifests a column value access control rule for a ", "bbox": {"l": 136.8, "t": 455.08871000000005, "r": 542.76648, "b": 464.3017, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "specific column in a specific table. It uses a CASE expression that describes what you see ", "bbox": {"l": 136.8, "t": 467.08853, "r": 537.84125, "b": 476.30151, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "when you access the column. For example, a teller can see only the last four digits of a tax ", "bbox": {"l": 136.8, "t": 479.08835, "r": 538.80927, "b": 488.30133, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "identification number.", "bbox": {"l": 136.8, "t": 491.08817, "r": 231.20888, "b": 500.30115, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "A column mask is a database object that manifests a column value access control rule for a specific column in a specific table. It uses a CASE expression that describes what you see when you access the column. For example, a teller can see only the last four digits of a tax identification number."}, {"label": "picture", "id": 1, "page_no": 9, "cluster": {"id": 1, "label": "picture", "bbox": {"l": 135.9717559814453, "t": 107.4107437133789, "r": 545.4180908203125, "b": 410.60931396484375, "coord_origin": "TOPLEFT"}, "confidence": 0.9788318872451782, "cells": [{"id": 12, "text": "CREATE PERMISSION", "bbox": {"l": 148.1337, "t": 139.67969000000005, "r": 246.7961, "b": 149.50982999999997, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "<", "bbox": {"l": 251.86685, "t": 139.67969000000005, "r": 257.58578, "b": 149.49834999999996, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "permission name", "bbox": {"l": 257.59152, "t": 139.67969000000005, "r": 336.99741, "b": 149.50982999999997, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": ">", "bbox": {"l": 337.01233, "t": 139.67969000000005, "r": 342.73126, "b": 149.49834999999996, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Names the row permission for row access control", "bbox": {"l": 346.56491, "t": 121.46252000000004, "r": 530.74371, "b": 129.33507999999995, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "ON", "bbox": {"l": 148.1337, "t": 181.06255999999996, "r": 163.45079, "b": 190.8927, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "<", "bbox": {"l": 168.58405, "t": 181.06255999999996, "r": 174.30298, "b": 190.88122999999996, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "table name", "bbox": {"l": 174.30872, "t": 181.06255999999996, "r": 226.86777, "b": 190.8927, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": ">", "bbox": {"l": 226.86548000000002, "t": 181.06255999999996, "r": 232.58441, "b": 190.88122999999996, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Identifies the table on which the row ", "bbox": {"l": 311.3204, "t": 166.29413, "r": 450.77191000000005, "b": 174.16669000000002, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "permission is created", "bbox": {"l": 450.86123999999995, "t": 166.29413, "r": 529.93134, "b": 174.16669000000002, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "AS ", "bbox": {"l": 148.1337, "t": 222.44550000000004, "r": 163.10973, "b": 232.27562999999998, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "<", "bbox": {"l": 165.68669, "t": 222.44550000000004, "r": 171.40562, "b": 232.26415999999995, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "correlation name", "bbox": {"l": 171.41136, "t": 222.44550000000004, "r": 251.20424000000003, "b": 232.27562999999998, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": ">", "bbox": {"l": 251.21115, "t": 222.44550000000004, "r": 256.93008, "b": 232.26415999999995, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Specifies an optional correlation name that ca", "bbox": {"l": 235.79649, "t": 204.22839, "r": 406.62051, "b": 212.10095, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "be used within search-condition", "bbox": {"l": 480.53094, "t": 204.22839, "r": 532.89496, "b": 212.10095, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "FOR ROWS", "bbox": {"l": 148.1337, "t": 263.82836999999995, "r": 199.72467, "b": 273.65851, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Indicates that a row permission is cr", "bbox": {"l": 321.56271, "t": 246.09411999999998, "r": 455.3432, "b": 253.96667000000002, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "eated", "bbox": {"l": 455.20786000000004, "t": 246.09411999999998, "r": 476.48404, "b": 253.96667000000002, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Specifies a condition that can be ", "bbox": {"l": 321.5972, "t": 266.30267000000003, "r": 444.0292400000001, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "true,", "bbox": {"l": 444.07986, "t": 266.30267000000003, "r": 459.08678999999995, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "false, or unknown", "bbox": {"l": 464.2088, "t": 266.30267000000003, "r": 530.94897, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "WHERE", "bbox": {"l": 148.1337, "t": 291.41708, "r": 183.42342, "b": 301.24722, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "<", "bbox": {"l": 188.61984, "t": 291.41708, "r": 194.33878, "b": 301.23572, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "logic to test: user and/or group and/or column value", "bbox": {"l": 194.34451, "t": 291.41708, "r": 437.04659999999996, "b": 301.24722, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": ">", "bbox": {"l": 437.09020999999996, "t": 291.41708, "r": 442.80914000000007, "b": 301.23572, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "ENFORCED FOR ALL ACCESS", "bbox": {"l": 148.1337, "t": 332.79999, "r": 278.77805, "b": 342.63013, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "Specifies that the row permission applies to all ref", "bbox": {"l": 271.55829, "t": 314.58276, "r": 457.4451, "b": 322.45535, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "erences of the table", "bbox": {"l": 457.19281, "t": 314.58276, "r": 531.74939, "b": 322.45535, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "ENABLE", "bbox": {"l": 148.1337, "t": 374.18289, "r": 185.17584, "b": 384.01302999999996, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Specifies that the row permission is to", "bbox": {"l": 312.28601, "t": 355.96576000000005, "r": 454.33505, "b": 363.83835, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": " be initially enabled", "bbox": {"l": 454.3461, "t": 355.96576000000005, "r": 527.05286, "b": 363.83835, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "S", "bbox": {"l": 311.73431, "t": 376.65717, "r": 315.94684, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "ifith t th", "bbox": {"l": 329.28326, "t": 376.65717, "r": 371.71786, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "i", "bbox": {"l": 415.0014, "t": 376.65717, "r": 417.09616, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "i", "bbox": {"l": 424.27356, "t": 376.65717, "r": 426.36832, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "i", "bbox": {"l": 438.13208, "t": 376.65717, "r": 440.2268399999999, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "t", "bbox": {"l": 445.88681, "t": 376.65717, "r": 448.95757999999995, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "b", "bbox": {"l": 455.8532400000001, "t": 376.65717, "r": 460.67346000000003, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "i", "bbox": {"l": 467.36746, "t": 376.65717, "r": 470.06998000000004, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "iti ll", "bbox": {"l": 472.73705999999993, "t": 376.65717, "r": 490.1676, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "di", "bbox": {"l": 496.33661, "t": 376.65717, "r": 503.2608, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "bl d", "bbox": {"l": 511.26138, "t": 376.65717, "r": 527.59674, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "DISABLE", "bbox": {"l": 148.1337, "t": 387.9772, "r": 187.6265, "b": 397.80734000000007, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": ";", "bbox": {"l": 187.58514, "t": 387.9772, "r": 190.6628, "b": 397.79583999999994, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Specifies that the row permission is to ", "bbox": {"l": 311.73431, "t": 376.65717, "r": 455.83047000000005, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "be initially disabled", "bbox": {"l": 455.8848, "t": 376.65717, "r": 527.62122, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": [{"id": 7, "label": "text", "bbox": {"l": 148.1337, "t": 139.67969000000005, "r": 246.7961, "b": 149.50982999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "CREATE PERMISSION", "bbox": {"l": 148.1337, "t": 139.67969000000005, "r": 246.7961, "b": 149.50982999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "text", "bbox": {"l": 251.86685, "t": 139.67969000000005, "r": 257.58578, "b": 149.49834999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "<", "bbox": {"l": 251.86685, "t": 139.67969000000005, "r": 257.58578, "b": 149.49834999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 257.59152, "t": 139.67969000000005, "r": 336.99741, "b": 149.50982999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "permission name", "bbox": {"l": 257.59152, "t": 139.67969000000005, "r": 336.99741, "b": 149.50982999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "text", "bbox": {"l": 337.01233, "t": 139.67969000000005, "r": 342.73126, "b": 149.49834999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": ">", "bbox": {"l": 337.01233, "t": 139.67969000000005, "r": 342.73126, "b": 149.49834999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 346.56491, "t": 121.46252000000004, "r": 530.74371, "b": 129.33507999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "Names the row permission for row access control", "bbox": {"l": 346.56491, "t": 121.46252000000004, "r": 530.74371, "b": 129.33507999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 148.1337, "t": 181.06255999999996, "r": 163.45079, "b": 190.8927, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "ON", "bbox": {"l": 148.1337, "t": 181.06255999999996, "r": 163.45079, "b": 190.8927, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 168.58405, "t": 181.06255999999996, "r": 174.30298, "b": 190.88122999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "<", "bbox": {"l": 168.58405, "t": 181.06255999999996, "r": 174.30298, "b": 190.88122999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 174.30872, "t": 181.06255999999996, "r": 226.86777, "b": 190.8927, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "table name", "bbox": {"l": 174.30872, "t": 181.06255999999996, "r": 226.86777, "b": 190.8927, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 226.86548000000002, "t": 181.06255999999996, "r": 232.58441, "b": 190.88122999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": ">", "bbox": {"l": 226.86548000000002, "t": 181.06255999999996, "r": 232.58441, "b": 190.88122999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 311.3204, "t": 166.29413, "r": 450.77191000000005, "b": 174.16669000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "Identifies the table on which the row ", "bbox": {"l": 311.3204, "t": 166.29413, "r": 450.77191000000005, "b": 174.16669000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 450.86123999999995, "t": 166.29413, "r": 529.93134, "b": 174.16669000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "permission is created", "bbox": {"l": 450.86123999999995, "t": 166.29413, "r": 529.93134, "b": 174.16669000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 148.1337, "t": 222.44550000000004, "r": 163.10973, "b": 232.27562999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "AS ", "bbox": {"l": 148.1337, "t": 222.44550000000004, "r": 163.10973, "b": 232.27562999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 165.68669, "t": 222.44550000000004, "r": 171.40562, "b": 232.26415999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "<", "bbox": {"l": 165.68669, "t": 222.44550000000004, "r": 171.40562, "b": 232.26415999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 171.41136, "t": 222.44550000000004, "r": 251.20424000000003, "b": 232.27562999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "correlation name", "bbox": {"l": 171.41136, "t": 222.44550000000004, "r": 251.20424000000003, "b": 232.27562999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 251.21115, "t": 222.44550000000004, "r": 256.93008, "b": 232.26415999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": ">", "bbox": {"l": 251.21115, "t": 222.44550000000004, "r": 256.93008, "b": 232.26415999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 235.79649, "t": 204.22839, "r": 406.62051, "b": 212.10095, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "Specifies an optional correlation name that ca", "bbox": {"l": 235.79649, "t": 204.22839, "r": 406.62051, "b": 212.10095, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 480.53094, "t": 204.22839, "r": 532.89496, "b": 212.10095, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "be used within search-condition", "bbox": {"l": 480.53094, "t": 204.22839, "r": 532.89496, "b": 212.10095, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 148.1337, "t": 263.82836999999995, "r": 199.72467, "b": 273.65851, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "FOR ROWS", "bbox": {"l": 148.1337, "t": 263.82836999999995, "r": 199.72467, "b": 273.65851, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 321.56271, "t": 246.09411999999998, "r": 455.3432, "b": 253.96667000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "Indicates that a row permission is cr", "bbox": {"l": 321.56271, "t": 246.09411999999998, "r": 455.3432, "b": 253.96667000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 455.20786000000004, "t": 246.09411999999998, "r": 476.48404, "b": 253.96667000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "eated", "bbox": {"l": 455.20786000000004, "t": 246.09411999999998, "r": 476.48404, "b": 253.96667000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 321.5972, "t": 266.30267000000003, "r": 444.0292400000001, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "Specifies a condition that can be ", "bbox": {"l": 321.5972, "t": 266.30267000000003, "r": 444.0292400000001, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 444.07986, "t": 266.30267000000003, "r": 459.08678999999995, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "true,", "bbox": {"l": 444.07986, "t": 266.30267000000003, "r": 459.08678999999995, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 464.2088, "t": 266.30267000000003, "r": 530.94897, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "false, or unknown", "bbox": {"l": 464.2088, "t": 266.30267000000003, "r": 530.94897, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 148.1337, "t": 291.41708, "r": 183.42342, "b": 301.24722, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "WHERE", "bbox": {"l": 148.1337, "t": 291.41708, "r": 183.42342, "b": 301.24722, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 188.61984, "t": 291.41708, "r": 194.33878, "b": 301.23572, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "<", "bbox": {"l": 188.61984, "t": 291.41708, "r": 194.33878, "b": 301.23572, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 194.34451, "t": 291.41708, "r": 437.04659999999996, "b": 301.24722, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "logic to test: user and/or group and/or column value", "bbox": {"l": 194.34451, "t": 291.41708, "r": 437.04659999999996, "b": 301.24722, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 437.09020999999996, "t": 291.41708, "r": 442.80914000000007, "b": 301.23572, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": ">", "bbox": {"l": 437.09020999999996, "t": 291.41708, "r": 442.80914000000007, "b": 301.23572, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 148.1337, "t": 332.79999, "r": 278.77805, "b": 342.63013, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "ENFORCED FOR ALL ACCESS", "bbox": {"l": 148.1337, "t": 332.79999, "r": 278.77805, "b": 342.63013, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 271.55829, "t": 314.58276, "r": 457.4451, "b": 322.45535, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "Specifies that the row permission applies to all ref", "bbox": {"l": 271.55829, "t": 314.58276, "r": 457.4451, "b": 322.45535, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 457.19281, "t": 314.58276, "r": 531.74939, "b": 322.45535, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "erences of the table", "bbox": {"l": 457.19281, "t": 314.58276, "r": 531.74939, "b": 322.45535, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 148.1337, "t": 374.18289, "r": 185.17584, "b": 384.01302999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "ENABLE", "bbox": {"l": 148.1337, "t": 374.18289, "r": 185.17584, "b": 384.01302999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 312.28601, "t": 355.96576000000005, "r": 454.33505, "b": 363.83835, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "Specifies that the row permission is to", "bbox": {"l": 312.28601, "t": 355.96576000000005, "r": 454.33505, "b": 363.83835, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 454.3461, "t": 355.96576000000005, "r": 527.05286, "b": 363.83835, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": " be initially enabled", "bbox": {"l": 454.3461, "t": 355.96576000000005, "r": 527.05286, "b": 363.83835, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 311.73431, "t": 376.65717, "r": 315.94684, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "S", "bbox": {"l": 311.73431, "t": 376.65717, "r": 315.94684, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 329.28326, "t": 376.65717, "r": 371.71786, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "ifith t th", "bbox": {"l": 329.28326, "t": 376.65717, "r": 371.71786, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 415.0014, "t": 376.65717, "r": 417.09616, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "i", "bbox": {"l": 415.0014, "t": 376.65717, "r": 417.09616, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 424.27356, "t": 376.65717, "r": 426.36832, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "i", "bbox": {"l": 424.27356, "t": 376.65717, "r": 426.36832, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 438.13208, "t": 376.65717, "r": 440.2268399999999, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "i", "bbox": {"l": 438.13208, "t": 376.65717, "r": 440.2268399999999, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 445.88681, "t": 376.65717, "r": 448.95757999999995, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "t", "bbox": {"l": 445.88681, "t": 376.65717, "r": 448.95757999999995, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 455.8532400000001, "t": 376.65717, "r": 460.67346000000003, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "b", "bbox": {"l": 455.8532400000001, "t": 376.65717, "r": 460.67346000000003, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 467.36746, "t": 376.65717, "r": 470.06998000000004, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "i", "bbox": {"l": 467.36746, "t": 376.65717, "r": 470.06998000000004, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 472.73705999999993, "t": 376.65717, "r": 490.1676, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "iti ll", "bbox": {"l": 472.73705999999993, "t": 376.65717, "r": 490.1676, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 496.33661, "t": 376.65717, "r": 503.2608, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "di", "bbox": {"l": 496.33661, "t": 376.65717, "r": 503.2608, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 511.26138, "t": 376.65717, "r": 527.59674, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "bl d", "bbox": {"l": 511.26138, "t": 376.65717, "r": 527.59674, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 148.1337, "t": 387.9772, "r": 187.6265, "b": 397.80734000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "DISABLE", "bbox": {"l": 148.1337, "t": 387.9772, "r": 187.6265, "b": 397.80734000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 187.58514, "t": 387.9772, "r": 190.6628, "b": 397.79583999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": ";", "bbox": {"l": 187.58514, "t": 387.9772, "r": 190.6628, "b": 397.79583999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 311.73431, "t": 376.65717, "r": 455.83047000000005, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "Specifies that the row permission is to ", "bbox": {"l": 311.73431, "t": 376.65717, "r": 455.83047000000005, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 455.8848, "t": 376.65717, "r": 527.62122, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "be initially disabled", "bbox": {"l": 455.8848, "t": 376.65717, "r": 527.62122, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "body": [{"label": "caption", "id": 6, "page_no": 9, "cluster": {"id": 6, "label": "caption", "bbox": {"l": 136.79956, "t": 71.50903000000005, "r": 528.73059, "b": 92.72185999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.8728439211845398, "cells": [{"id": 2, "text": "The SQL ", "bbox": {"l": 136.79959, "t": 71.50903000000005, "r": 179.58179, "b": 80.72204999999985, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "CREATE PERMISSION", "bbox": {"l": 179.57977, "t": 71.65845000000002, "r": 264.47879, "b": 80.48302999999999, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": " statement that is shown in Figure 3-1 is used to define and ", "bbox": {"l": 264.53955, "t": 71.50903000000005, "r": 528.73059, "b": 80.72204999999985, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "initially enable or disable the row access rules.", "bbox": {"l": 136.79956, "t": 83.50885000000017, "r": 341.71762, "b": 92.72185999999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The SQL CREATE PERMISSION statement that is shown in Figure 3-1 is used to define and initially enable or disable the row access rules."}, {"label": "caption", "id": 4, "page_no": 9, "cluster": {"id": 4, "label": "caption", "bbox": {"l": 136.8, "t": 414.138, "r": 341.97659, "b": 422.46301, "coord_origin": "TOPLEFT"}, "confidence": 0.9387834072113037, "cells": [{"id": 6, "text": "Figure 3-1 CREATE PERMISSION SQL statement", "bbox": {"l": 136.8, "t": 414.138, "r": 341.97659, "b": 422.46301, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 3-1 CREATE PERMISSION SQL statement"}, {"label": "section_header", "id": 3, "page_no": 9, "cluster": {"id": 3, "label": "section_header", "bbox": {"l": 136.8, "t": 439.94399999999996, "r": 215.37601, "b": 451.04401, "coord_origin": "TOPLEFT"}, "confidence": 0.9477567076683044, "cells": [{"id": 7, "text": "Column mask", "bbox": {"l": 136.8, "t": 439.94399999999996, "r": 215.37601, "b": 451.04401, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Column mask"}, {"label": "text", "id": 0, "page_no": 9, "cluster": {"id": 0, "label": "text", "bbox": {"l": 136.8, "t": 455.08871000000005, "r": 542.76648, "b": 500.30115, "coord_origin": "TOPLEFT"}, "confidence": 0.9843974709510803, "cells": [{"id": 8, "text": "A column mask is a database object that manifests a column value access control rule for a ", "bbox": {"l": 136.8, "t": 455.08871000000005, "r": 542.76648, "b": 464.3017, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "specific column in a specific table. It uses a CASE expression that describes what you see ", "bbox": {"l": 136.8, "t": 467.08853, "r": 537.84125, "b": 476.30151, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "when you access the column. For example, a teller can see only the last four digits of a tax ", "bbox": {"l": 136.8, "t": 479.08835, "r": 538.80927, "b": 488.30133, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "identification number.", "bbox": {"l": 136.8, "t": 491.08817, "r": 231.20888, "b": 500.30115, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "A column mask is a database object that manifests a column value access control rule for a specific column in a specific table. It uses a CASE expression that describes what you see when you access the column. For example, a teller can see only the last four digits of a tax identification number."}, {"label": "picture", "id": 1, "page_no": 9, "cluster": {"id": 1, "label": "picture", "bbox": {"l": 135.9717559814453, "t": 107.4107437133789, "r": 545.4180908203125, "b": 410.60931396484375, "coord_origin": "TOPLEFT"}, "confidence": 0.9788318872451782, "cells": [{"id": 12, "text": "CREATE PERMISSION", "bbox": {"l": 148.1337, "t": 139.67969000000005, "r": 246.7961, "b": 149.50982999999997, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "<", "bbox": {"l": 251.86685, "t": 139.67969000000005, "r": 257.58578, "b": 149.49834999999996, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "permission name", "bbox": {"l": 257.59152, "t": 139.67969000000005, "r": 336.99741, "b": 149.50982999999997, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": ">", "bbox": {"l": 337.01233, "t": 139.67969000000005, "r": 342.73126, "b": 149.49834999999996, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Names the row permission for row access control", "bbox": {"l": 346.56491, "t": 121.46252000000004, "r": 530.74371, "b": 129.33507999999995, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "ON", "bbox": {"l": 148.1337, "t": 181.06255999999996, "r": 163.45079, "b": 190.8927, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "<", "bbox": {"l": 168.58405, "t": 181.06255999999996, "r": 174.30298, "b": 190.88122999999996, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "table name", "bbox": {"l": 174.30872, "t": 181.06255999999996, "r": 226.86777, "b": 190.8927, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": ">", "bbox": {"l": 226.86548000000002, "t": 181.06255999999996, "r": 232.58441, "b": 190.88122999999996, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Identifies the table on which the row ", "bbox": {"l": 311.3204, "t": 166.29413, "r": 450.77191000000005, "b": 174.16669000000002, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "permission is created", "bbox": {"l": 450.86123999999995, "t": 166.29413, "r": 529.93134, "b": 174.16669000000002, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "AS ", "bbox": {"l": 148.1337, "t": 222.44550000000004, "r": 163.10973, "b": 232.27562999999998, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "<", "bbox": {"l": 165.68669, "t": 222.44550000000004, "r": 171.40562, "b": 232.26415999999995, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "correlation name", "bbox": {"l": 171.41136, "t": 222.44550000000004, "r": 251.20424000000003, "b": 232.27562999999998, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": ">", "bbox": {"l": 251.21115, "t": 222.44550000000004, "r": 256.93008, "b": 232.26415999999995, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Specifies an optional correlation name that ca", "bbox": {"l": 235.79649, "t": 204.22839, "r": 406.62051, "b": 212.10095, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "be used within search-condition", "bbox": {"l": 480.53094, "t": 204.22839, "r": 532.89496, "b": 212.10095, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "FOR ROWS", "bbox": {"l": 148.1337, "t": 263.82836999999995, "r": 199.72467, "b": 273.65851, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Indicates that a row permission is cr", "bbox": {"l": 321.56271, "t": 246.09411999999998, "r": 455.3432, "b": 253.96667000000002, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "eated", "bbox": {"l": 455.20786000000004, "t": 246.09411999999998, "r": 476.48404, "b": 253.96667000000002, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Specifies a condition that can be ", "bbox": {"l": 321.5972, "t": 266.30267000000003, "r": 444.0292400000001, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "true,", "bbox": {"l": 444.07986, "t": 266.30267000000003, "r": 459.08678999999995, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "false, or unknown", "bbox": {"l": 464.2088, "t": 266.30267000000003, "r": 530.94897, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "WHERE", "bbox": {"l": 148.1337, "t": 291.41708, "r": 183.42342, "b": 301.24722, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "<", "bbox": {"l": 188.61984, "t": 291.41708, "r": 194.33878, "b": 301.23572, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "logic to test: user and/or group and/or column value", "bbox": {"l": 194.34451, "t": 291.41708, "r": 437.04659999999996, "b": 301.24722, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": ">", "bbox": {"l": 437.09020999999996, "t": 291.41708, "r": 442.80914000000007, "b": 301.23572, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "ENFORCED FOR ALL ACCESS", "bbox": {"l": 148.1337, "t": 332.79999, "r": 278.77805, "b": 342.63013, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "Specifies that the row permission applies to all ref", "bbox": {"l": 271.55829, "t": 314.58276, "r": 457.4451, "b": 322.45535, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "erences of the table", "bbox": {"l": 457.19281, "t": 314.58276, "r": 531.74939, "b": 322.45535, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "ENABLE", "bbox": {"l": 148.1337, "t": 374.18289, "r": 185.17584, "b": 384.01302999999996, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Specifies that the row permission is to", "bbox": {"l": 312.28601, "t": 355.96576000000005, "r": 454.33505, "b": 363.83835, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": " be initially enabled", "bbox": {"l": 454.3461, "t": 355.96576000000005, "r": 527.05286, "b": 363.83835, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "S", "bbox": {"l": 311.73431, "t": 376.65717, "r": 315.94684, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "ifith t th", "bbox": {"l": 329.28326, "t": 376.65717, "r": 371.71786, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "i", "bbox": {"l": 415.0014, "t": 376.65717, "r": 417.09616, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "i", "bbox": {"l": 424.27356, "t": 376.65717, "r": 426.36832, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "i", "bbox": {"l": 438.13208, "t": 376.65717, "r": 440.2268399999999, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "t", "bbox": {"l": 445.88681, "t": 376.65717, "r": 448.95757999999995, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "b", "bbox": {"l": 455.8532400000001, "t": 376.65717, "r": 460.67346000000003, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "i", "bbox": {"l": 467.36746, "t": 376.65717, "r": 470.06998000000004, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "iti ll", "bbox": {"l": 472.73705999999993, "t": 376.65717, "r": 490.1676, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "di", "bbox": {"l": 496.33661, "t": 376.65717, "r": 503.2608, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "bl d", "bbox": {"l": 511.26138, "t": 376.65717, "r": 527.59674, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "DISABLE", "bbox": {"l": 148.1337, "t": 387.9772, "r": 187.6265, "b": 397.80734000000007, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": ";", "bbox": {"l": 187.58514, "t": 387.9772, "r": 190.6628, "b": 397.79583999999994, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Specifies that the row permission is to ", "bbox": {"l": 311.73431, "t": 376.65717, "r": 455.83047000000005, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "be initially disabled", "bbox": {"l": 455.8848, "t": 376.65717, "r": 527.62122, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": [{"id": 7, "label": "text", "bbox": {"l": 148.1337, "t": 139.67969000000005, "r": 246.7961, "b": 149.50982999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "CREATE PERMISSION", "bbox": {"l": 148.1337, "t": 139.67969000000005, "r": 246.7961, "b": 149.50982999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "text", "bbox": {"l": 251.86685, "t": 139.67969000000005, "r": 257.58578, "b": 149.49834999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "<", "bbox": {"l": 251.86685, "t": 139.67969000000005, "r": 257.58578, "b": 149.49834999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 257.59152, "t": 139.67969000000005, "r": 336.99741, "b": 149.50982999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "permission name", "bbox": {"l": 257.59152, "t": 139.67969000000005, "r": 336.99741, "b": 149.50982999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "text", "bbox": {"l": 337.01233, "t": 139.67969000000005, "r": 342.73126, "b": 149.49834999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": ">", "bbox": {"l": 337.01233, "t": 139.67969000000005, "r": 342.73126, "b": 149.49834999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 346.56491, "t": 121.46252000000004, "r": 530.74371, "b": 129.33507999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "Names the row permission for row access control", "bbox": {"l": 346.56491, "t": 121.46252000000004, "r": 530.74371, "b": 129.33507999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 148.1337, "t": 181.06255999999996, "r": 163.45079, "b": 190.8927, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "ON", "bbox": {"l": 148.1337, "t": 181.06255999999996, "r": 163.45079, "b": 190.8927, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 168.58405, "t": 181.06255999999996, "r": 174.30298, "b": 190.88122999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "<", "bbox": {"l": 168.58405, "t": 181.06255999999996, "r": 174.30298, "b": 190.88122999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 174.30872, "t": 181.06255999999996, "r": 226.86777, "b": 190.8927, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "table name", "bbox": {"l": 174.30872, "t": 181.06255999999996, "r": 226.86777, "b": 190.8927, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 226.86548000000002, "t": 181.06255999999996, "r": 232.58441, "b": 190.88122999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": ">", "bbox": {"l": 226.86548000000002, "t": 181.06255999999996, "r": 232.58441, "b": 190.88122999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 311.3204, "t": 166.29413, "r": 450.77191000000005, "b": 174.16669000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "Identifies the table on which the row ", "bbox": {"l": 311.3204, "t": 166.29413, "r": 450.77191000000005, "b": 174.16669000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 450.86123999999995, "t": 166.29413, "r": 529.93134, "b": 174.16669000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "permission is created", "bbox": {"l": 450.86123999999995, "t": 166.29413, "r": 529.93134, "b": 174.16669000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 148.1337, "t": 222.44550000000004, "r": 163.10973, "b": 232.27562999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "AS ", "bbox": {"l": 148.1337, "t": 222.44550000000004, "r": 163.10973, "b": 232.27562999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 165.68669, "t": 222.44550000000004, "r": 171.40562, "b": 232.26415999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "<", "bbox": {"l": 165.68669, "t": 222.44550000000004, "r": 171.40562, "b": 232.26415999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 171.41136, "t": 222.44550000000004, "r": 251.20424000000003, "b": 232.27562999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "correlation name", "bbox": {"l": 171.41136, "t": 222.44550000000004, "r": 251.20424000000003, "b": 232.27562999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 251.21115, "t": 222.44550000000004, "r": 256.93008, "b": 232.26415999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": ">", "bbox": {"l": 251.21115, "t": 222.44550000000004, "r": 256.93008, "b": 232.26415999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 235.79649, "t": 204.22839, "r": 406.62051, "b": 212.10095, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "Specifies an optional correlation name that ca", "bbox": {"l": 235.79649, "t": 204.22839, "r": 406.62051, "b": 212.10095, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 480.53094, "t": 204.22839, "r": 532.89496, "b": 212.10095, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "be used within search-condition", "bbox": {"l": 480.53094, "t": 204.22839, "r": 532.89496, "b": 212.10095, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 148.1337, "t": 263.82836999999995, "r": 199.72467, "b": 273.65851, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "FOR ROWS", "bbox": {"l": 148.1337, "t": 263.82836999999995, "r": 199.72467, "b": 273.65851, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 321.56271, "t": 246.09411999999998, "r": 455.3432, "b": 253.96667000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "Indicates that a row permission is cr", "bbox": {"l": 321.56271, "t": 246.09411999999998, "r": 455.3432, "b": 253.96667000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 455.20786000000004, "t": 246.09411999999998, "r": 476.48404, "b": 253.96667000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "eated", "bbox": {"l": 455.20786000000004, "t": 246.09411999999998, "r": 476.48404, "b": 253.96667000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 321.5972, "t": 266.30267000000003, "r": 444.0292400000001, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "Specifies a condition that can be ", "bbox": {"l": 321.5972, "t": 266.30267000000003, "r": 444.0292400000001, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 444.07986, "t": 266.30267000000003, "r": 459.08678999999995, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "true,", "bbox": {"l": 444.07986, "t": 266.30267000000003, "r": 459.08678999999995, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 464.2088, "t": 266.30267000000003, "r": 530.94897, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "false, or unknown", "bbox": {"l": 464.2088, "t": 266.30267000000003, "r": 530.94897, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 148.1337, "t": 291.41708, "r": 183.42342, "b": 301.24722, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "WHERE", "bbox": {"l": 148.1337, "t": 291.41708, "r": 183.42342, "b": 301.24722, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 188.61984, "t": 291.41708, "r": 194.33878, "b": 301.23572, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "<", "bbox": {"l": 188.61984, "t": 291.41708, "r": 194.33878, "b": 301.23572, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 194.34451, "t": 291.41708, "r": 437.04659999999996, "b": 301.24722, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "logic to test: user and/or group and/or column value", "bbox": {"l": 194.34451, "t": 291.41708, "r": 437.04659999999996, "b": 301.24722, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 437.09020999999996, "t": 291.41708, "r": 442.80914000000007, "b": 301.23572, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": ">", "bbox": {"l": 437.09020999999996, "t": 291.41708, "r": 442.80914000000007, "b": 301.23572, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 148.1337, "t": 332.79999, "r": 278.77805, "b": 342.63013, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "ENFORCED FOR ALL ACCESS", "bbox": {"l": 148.1337, "t": 332.79999, "r": 278.77805, "b": 342.63013, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 271.55829, "t": 314.58276, "r": 457.4451, "b": 322.45535, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "Specifies that the row permission applies to all ref", "bbox": {"l": 271.55829, "t": 314.58276, "r": 457.4451, "b": 322.45535, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 457.19281, "t": 314.58276, "r": 531.74939, "b": 322.45535, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "erences of the table", "bbox": {"l": 457.19281, "t": 314.58276, "r": 531.74939, "b": 322.45535, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 148.1337, "t": 374.18289, "r": 185.17584, "b": 384.01302999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "ENABLE", "bbox": {"l": 148.1337, "t": 374.18289, "r": 185.17584, "b": 384.01302999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 312.28601, "t": 355.96576000000005, "r": 454.33505, "b": 363.83835, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "Specifies that the row permission is to", "bbox": {"l": 312.28601, "t": 355.96576000000005, "r": 454.33505, "b": 363.83835, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 454.3461, "t": 355.96576000000005, "r": 527.05286, "b": 363.83835, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": " be initially enabled", "bbox": {"l": 454.3461, "t": 355.96576000000005, "r": 527.05286, "b": 363.83835, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 311.73431, "t": 376.65717, "r": 315.94684, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "S", "bbox": {"l": 311.73431, "t": 376.65717, "r": 315.94684, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 329.28326, "t": 376.65717, "r": 371.71786, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "ifith t th", "bbox": {"l": 329.28326, "t": 376.65717, "r": 371.71786, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 415.0014, "t": 376.65717, "r": 417.09616, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "i", "bbox": {"l": 415.0014, "t": 376.65717, "r": 417.09616, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 424.27356, "t": 376.65717, "r": 426.36832, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "i", "bbox": {"l": 424.27356, "t": 376.65717, "r": 426.36832, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 438.13208, "t": 376.65717, "r": 440.2268399999999, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "i", "bbox": {"l": 438.13208, "t": 376.65717, "r": 440.2268399999999, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 445.88681, "t": 376.65717, "r": 448.95757999999995, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "t", "bbox": {"l": 445.88681, "t": 376.65717, "r": 448.95757999999995, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 455.8532400000001, "t": 376.65717, "r": 460.67346000000003, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "b", "bbox": {"l": 455.8532400000001, "t": 376.65717, "r": 460.67346000000003, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 467.36746, "t": 376.65717, "r": 470.06998000000004, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "i", "bbox": {"l": 467.36746, "t": 376.65717, "r": 470.06998000000004, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 472.73705999999993, "t": 376.65717, "r": 490.1676, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "iti ll", "bbox": {"l": 472.73705999999993, "t": 376.65717, "r": 490.1676, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 496.33661, "t": 376.65717, "r": 503.2608, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "di", "bbox": {"l": 496.33661, "t": 376.65717, "r": 503.2608, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 511.26138, "t": 376.65717, "r": 527.59674, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "bl d", "bbox": {"l": 511.26138, "t": 376.65717, "r": 527.59674, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 148.1337, "t": 387.9772, "r": 187.6265, "b": 397.80734000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "DISABLE", "bbox": {"l": 148.1337, "t": 387.9772, "r": 187.6265, "b": 397.80734000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 187.58514, "t": 387.9772, "r": 190.6628, "b": 397.79583999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": ";", "bbox": {"l": 187.58514, "t": 387.9772, "r": 190.6628, "b": 397.79583999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 311.73431, "t": 376.65717, "r": 455.83047000000005, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "Specifies that the row permission is to ", "bbox": {"l": 311.73431, "t": 376.65717, "r": 455.83047000000005, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 455.8848, "t": 376.65717, "r": 527.62122, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "be initially disabled", "bbox": {"l": 455.8848, "t": 376.65717, "r": 527.62122, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "headers": [{"label": "page_footer", "id": 2, "page_no": 9, "cluster": {"id": 2, "label": "page_footer", "bbox": {"l": 344.94, "t": 755.538002, "r": 523.60162, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9526246786117554, "cells": [{"id": 0, "text": "Chapter 3. Row and Column Access Control ", "bbox": {"l": 344.94, "t": 755.538002, "r": 523.60162, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Chapter 3. Row and Column Access Control"}, {"label": "page_footer", "id": 5, "page_no": 9, "cluster": {"id": 5, "label": "page_footer", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.9071077704429626, "cells": [{"id": 1, "text": "15", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "15"}]}}, {"page_no": 10, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "Chapter 3. Row and Column Access Control ", "bbox": {"l": 344.94, "t": 755.538002, "r": 523.60162, "b": 763.863001, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "19", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Table 3-1 summarizes these special registers and their values.", "bbox": {"l": 136.79959, "t": 71.50903000000005, "r": 412.20758, "b": 80.72204999999985, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Table 3-1 Special registers and their corresponding values", "bbox": {"l": 136.8, "t": 93.49805000000003, "r": 372.60364, "b": 101.82299999999998, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Figure 3-5 shows the difference in the special register values when an adopted authority is ", "bbox": {"l": 136.8, "t": 214.48870999999997, "r": 538.4939, "b": 223.70172000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "used:", "bbox": {"l": 136.8, "t": 226.48852999999997, "r": 161.20995, "b": 235.70154000000002, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "GLYPH<SM590000>", "bbox": {"l": 136.8, "t": 243.67749000000003, "r": 141.78, "b": 252.45227, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "A user connects to the server using the user profile ALICE.", "bbox": {"l": 151.20016, "t": 243.52808000000005, "r": 411.36139, "b": 252.74108999999999, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "GLYPH<SM590000>", "bbox": {"l": 136.8, "t": 260.65729, "r": 141.78, "b": 269.43206999999995, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "USER and CURRENT USER initially have the same value of ALICE.", "bbox": {"l": 151.20016, "t": 260.50787, "r": 453.2580899999999, "b": 269.72089000000005, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "GLYPH<SM590000>", "bbox": {"l": 136.8, "t": 277.63707999999997, "r": 141.78, "b": 286.41187, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "ALICE calls an SQL procedure that is named proc1, which is owned by user profile JOE ", "bbox": {"l": 151.20016, "t": 277.48767, "r": 541.44983, "b": 286.70068, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "and was created to adopt JOE\u2019s authority when it is called.", "bbox": {"l": 151.20016, "t": 289.4875200000001, "r": 409.82953, "b": 298.7005, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "GLYPH<SM590000>", "bbox": {"l": 136.8, "t": 306.67647999999997, "r": 141.78, "b": 315.45126000000005, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "While the procedure is running, the special register USER still contains the value of ALICE ", "bbox": {"l": 151.20016, "t": 306.5271, "r": 547.21674, "b": 315.74008, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "because it excludes any adopted authority. The special register CURRENT USER ", "bbox": {"l": 151.20117, "t": 318.52691999999996, "r": 514.32971, "b": 327.7399, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "contains the value of JOE because it includes any adopted authority.", "bbox": {"l": 151.20117, "t": 330.52673, "r": 453.3249200000001, "b": 339.73972, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "GLYPH<SM590000>", "bbox": {"l": 136.80101, "t": 347.65591, "r": 141.78101, "b": 356.43069, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "When proc1 ends, the session reverts to its original state with both USER and CURRENT ", "bbox": {"l": 151.20117, "t": 347.50653, "r": 547.35406, "b": 356.71950999999996, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "USER having the value of ALICE.", "bbox": {"l": 151.20117, "t": 359.50635, "r": 299.57532, "b": 368.71933000000007, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Figure 3-5 Special registers and adopted authority", "bbox": {"l": 136.8, "t": 596.7179, "r": 341.25662, "b": 605.04291, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "3.2.2", "bbox": {"l": 64.800003, "t": 625.55472, "r": 94.20356, "b": 637.54272, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "Built-in global variables", "bbox": {"l": 97.879005, "t": 625.55472, "r": 247.02536, "b": 637.54272, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Built-in global variables are provided with the database manager and are used in SQL ", "bbox": {"l": 136.8, "t": 651.70872, "r": 518.00116, "b": 660.92172, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "statements to retrieve scalar values that are associated with the variables.", "bbox": {"l": 136.8, "t": 663.70853, "r": 462.81759999999997, "b": 672.92153, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "IBM DB2 for i supports nine different built-in global variables that are read only and ", "bbox": {"l": 136.8, "t": 685.7281, "r": 504.44669, "b": 694.941101, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "maintained by the system. These global variables can be used to identify attributes of the ", "bbox": {"l": 136.8, "t": 697.727905, "r": 532.3385, "b": 706.94091, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "database connection and used as part of the RCAC logic.", "bbox": {"l": 136.8, "t": 709.727715, "r": 391.38257, "b": 718.94072, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Special register", "bbox": {"l": 142.8, "t": 110.53801999999985, "r": 209.67091, "b": 118.86298, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Corresponding value", "bbox": {"l": 230.18912000000003, "t": 110.53801999999985, "r": 319.93527, "b": 118.86298, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "USER or", "bbox": {"l": 142.80002, "t": 129.49834999999996, "r": 178.26361, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "SESSION_USER", "bbox": {"l": 142.80002, "t": 140.53864, "r": 212.70122, "b": 148.86359000000004, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "The effective user of the thread excluding adopted authority.", "bbox": {"l": 230.21973000000003, "t": 129.49834999999996, "r": 467.99069000000003, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "CURRENT_USER", "bbox": {"l": 142.80003, "t": 159.55835000000002, "r": 216.63962999999998, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "The effective user of the thread including adopted authority. When no adopted ", "bbox": {"l": 230.19814, "t": 159.55835000000002, "r": 535.65082, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "authority is present, this has the same value as USER.", "bbox": {"l": 230.22061, "t": 170.53832999999997, "r": 447.36533, "b": 178.86328000000003, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "SYSTEM_USER", "bbox": {"l": 142.8009, "t": 189.55804, "r": 209.7357, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "The authorization ID that initiated the connection.", "bbox": {"l": 230.2449, "t": 189.55804, "r": 425.64569, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "SignedonasALICE", "bbox": {"l": 140.7323, "t": 386.98453, "r": 218.71170000000004, "b": 395.49527, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "Signed on as ALICE", "bbox": {"l": 140.7323, "t": 386.98453, "r": 216.40009, "b": 395.49527, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "USER = ALICE", "bbox": {"l": 138.476, "t": 410.87441999999993, "r": 191.70256, "b": 419.38516, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "CURRENT USER = ALICE", "bbox": {"l": 138.476, "t": 422.81934, "r": 232.56117, "b": 431.33008, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "CALL proc1", "bbox": {"l": 138.476, "t": 446.70923000000005, "r": 183.26944, "b": 455.21997, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "P1", "bbox": {"l": 148.4301, "t": 473.58524, "r": 184.17328, "b": 482.09598, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "Proc1:", "bbox": {"l": 148.4301, "t": 473.58524, "r": 174.05859, "b": 482.09598, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Owner = JOE", "bbox": {"l": 157.52185, "t": 485.53015, "r": 209.103, "b": 494.04089, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "SET OPTION USRPRF=*OWNER", "bbox": {"l": 157.52185, "t": 497.47507, "r": 281.68927, "b": 505.98581, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "USER = ALICE", "bbox": {"l": 148.4301, "t": 521.36493, "r": 201.65666, "b": 529.87567, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "CURRENT USER = JOE", "bbox": {"l": 148.4301, "t": 533.30984, "r": 234.57686999999999, "b": 541.82059, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "USER = ALICE", "bbox": {"l": 138.476, "t": 566.15842, "r": 191.70256, "b": 574.66917, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "CURRENT USER = ALICE", "bbox": {"l": 138.476, "t": 578.10333, "r": 232.56117, "b": 586.61409, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 7, "label": "page_footer", "bbox": {"l": 344.94, "t": 755.538002, "r": 523.60162, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9557498693466187, "cells": [{"id": 0, "text": "Chapter 3. Row and Column Access Control ", "bbox": {"l": 344.94, "t": 755.538002, "r": 523.60162, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "page_footer", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.9130509495735168, "cells": [{"id": 1, "text": "19", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "caption", "bbox": {"l": 136.79959, "t": 71.50903000000005, "r": 412.20758, "b": 80.72204999999985, "coord_origin": "TOPLEFT"}, "confidence": 0.7875164747238159, "cells": [{"id": 2, "text": "Table 3-1 summarizes these special registers and their values.", "bbox": {"l": 136.79959, "t": 71.50903000000005, "r": 412.20758, "b": 80.72204999999985, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "caption", "bbox": {"l": 136.8, "t": 93.49805000000003, "r": 372.60364, "b": 101.82299999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.9253707528114319, "cells": [{"id": 3, "text": "Table 3-1 Special registers and their corresponding values", "bbox": {"l": 136.8, "t": 93.49805000000003, "r": 372.60364, "b": 101.82299999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 136.8, "t": 214.48870999999997, "r": 538.4939, "b": 235.70154000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9466660022735596, "cells": [{"id": 4, "text": "Figure 3-5 shows the difference in the special register values when an adopted authority is ", "bbox": {"l": 136.8, "t": 214.48870999999997, "r": 538.4939, "b": 223.70172000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "used:", "bbox": {"l": 136.8, "t": 226.48852999999997, "r": 161.20995, "b": 235.70154000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "list_item", "bbox": {"l": 136.8, "t": 243.52808000000005, "r": 411.36139, "b": 252.74108999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9504424333572388, "cells": [{"id": 6, "text": "GLYPH<SM590000>", "bbox": {"l": 136.8, "t": 243.67749000000003, "r": 141.78, "b": 252.45227, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "A user connects to the server using the user profile ALICE.", "bbox": {"l": 151.20016, "t": 243.52808000000005, "r": 411.36139, "b": 252.74108999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "list_item", "bbox": {"l": 136.8, "t": 260.50787, "r": 453.2580899999999, "b": 269.72089000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9445975422859192, "cells": [{"id": 8, "text": "GLYPH<SM590000>", "bbox": {"l": 136.8, "t": 260.65729, "r": 141.78, "b": 269.43206999999995, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "USER and CURRENT USER initially have the same value of ALICE.", "bbox": {"l": 151.20016, "t": 260.50787, "r": 453.2580899999999, "b": 269.72089000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "list_item", "bbox": {"l": 136.8, "t": 277.48767, "r": 541.44983, "b": 298.7005, "coord_origin": "TOPLEFT"}, "confidence": 0.9742953777313232, "cells": [{"id": 10, "text": "GLYPH<SM590000>", "bbox": {"l": 136.8, "t": 277.63707999999997, "r": 141.78, "b": 286.41187, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "ALICE calls an SQL procedure that is named proc1, which is owned by user profile JOE ", "bbox": {"l": 151.20016, "t": 277.48767, "r": 541.44983, "b": 286.70068, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "and was created to adopt JOE\u2019s authority when it is called.", "bbox": {"l": 151.20016, "t": 289.4875200000001, "r": 409.82953, "b": 298.7005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "list_item", "bbox": {"l": 136.8, "t": 306.5271, "r": 547.21674, "b": 339.73972, "coord_origin": "TOPLEFT"}, "confidence": 0.981132447719574, "cells": [{"id": 13, "text": "GLYPH<SM590000>", "bbox": {"l": 136.8, "t": 306.67647999999997, "r": 141.78, "b": 315.45126000000005, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "While the procedure is running, the special register USER still contains the value of ALICE ", "bbox": {"l": 151.20016, "t": 306.5271, "r": 547.21674, "b": 315.74008, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "because it excludes any adopted authority. The special register CURRENT USER ", "bbox": {"l": 151.20117, "t": 318.52691999999996, "r": 514.32971, "b": 327.7399, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "contains the value of JOE because it includes any adopted authority.", "bbox": {"l": 151.20117, "t": 330.52673, "r": 453.3249200000001, "b": 339.73972, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "list_item", "bbox": {"l": 136.80101, "t": 347.50653, "r": 547.35406, "b": 368.71933000000007, "coord_origin": "TOPLEFT"}, "confidence": 0.9748277068138123, "cells": [{"id": 17, "text": "GLYPH<SM590000>", "bbox": {"l": 136.80101, "t": 347.65591, "r": 141.78101, "b": 356.43069, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "When proc1 ends, the session reverts to its original state with both USER and CURRENT ", "bbox": {"l": 151.20117, "t": 347.50653, "r": 547.35406, "b": 356.71950999999996, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "USER having the value of ALICE.", "bbox": {"l": 151.20117, "t": 359.50635, "r": 299.57532, "b": 368.71933000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "caption", "bbox": {"l": 136.8, "t": 596.7179, "r": 341.25662, "b": 605.04291, "coord_origin": "TOPLEFT"}, "confidence": 0.9274529814720154, "cells": [{"id": 20, "text": "Figure 3-5 Special registers and adopted authority", "bbox": {"l": 136.8, "t": 596.7179, "r": 341.25662, "b": 605.04291, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "section_header", "bbox": {"l": 64.800003, "t": 625.55472, "r": 247.02536, "b": 637.54272, "coord_origin": "TOPLEFT"}, "confidence": 0.9659212827682495, "cells": [{"id": 21, "text": "3.2.2", "bbox": {"l": 64.800003, "t": 625.55472, "r": 94.20356, "b": 637.54272, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "Built-in global variables", "bbox": {"l": 97.879005, "t": 625.55472, "r": 247.02536, "b": 637.54272, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "text", "bbox": {"l": 136.8, "t": 651.70872, "r": 518.00116, "b": 672.92153, "coord_origin": "TOPLEFT"}, "confidence": 0.9696778059005737, "cells": [{"id": 23, "text": "Built-in global variables are provided with the database manager and are used in SQL ", "bbox": {"l": 136.8, "t": 651.70872, "r": 518.00116, "b": 660.92172, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "statements to retrieve scalar values that are associated with the variables.", "bbox": {"l": 136.8, "t": 663.70853, "r": 462.81759999999997, "b": 672.92153, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 136.8, "t": 685.7281, "r": 532.3385, "b": 718.94072, "coord_origin": "TOPLEFT"}, "confidence": 0.978398323059082, "cells": [{"id": 25, "text": "IBM DB2 for i supports nine different built-in global variables that are read only and ", "bbox": {"l": 136.8, "t": 685.7281, "r": 504.44669, "b": 694.941101, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "maintained by the system. These global variables can be used to identify attributes of the ", "bbox": {"l": 136.8, "t": 697.727905, "r": 532.3385, "b": 706.94091, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "database connection and used as part of the RCAC logic.", "bbox": {"l": 136.8, "t": 709.727715, "r": 391.38257, "b": 718.94072, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "table", "bbox": {"l": 134.5463104248047, "t": 103.41889190673828, "r": 542.0460205078125, "b": 204.2716064453125, "coord_origin": "TOPLEFT"}, "confidence": 0.9731299877166748, "cells": [{"id": 28, "text": "Special register", "bbox": {"l": 142.8, "t": 110.53801999999985, "r": 209.67091, "b": 118.86298, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Corresponding value", "bbox": {"l": 230.18912000000003, "t": 110.53801999999985, "r": 319.93527, "b": 118.86298, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "USER or", "bbox": {"l": 142.80002, "t": 129.49834999999996, "r": 178.26361, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "SESSION_USER", "bbox": {"l": 142.80002, "t": 140.53864, "r": 212.70122, "b": 148.86359000000004, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "The effective user of the thread excluding adopted authority.", "bbox": {"l": 230.21973000000003, "t": 129.49834999999996, "r": 467.99069000000003, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "CURRENT_USER", "bbox": {"l": 142.80003, "t": 159.55835000000002, "r": 216.63962999999998, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "The effective user of the thread including adopted authority. When no adopted ", "bbox": {"l": 230.19814, "t": 159.55835000000002, "r": 535.65082, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "authority is present, this has the same value as USER.", "bbox": {"l": 230.22061, "t": 170.53832999999997, "r": 447.36533, "b": 178.86328000000003, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "SYSTEM_USER", "bbox": {"l": 142.8009, "t": 189.55804, "r": 209.7357, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "The authorization ID that initiated the connection.", "bbox": {"l": 230.2449, "t": 189.55804, "r": 425.64569, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}}], "children": [{"id": 26, "label": "text", "bbox": {"l": 142.8, "t": 110.53801999999985, "r": 209.67091, "b": 118.86298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "Special register", "bbox": {"l": 142.8, "t": 110.53801999999985, "r": 209.67091, "b": 118.86298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 230.18912000000003, "t": 110.53801999999985, "r": 319.93527, "b": 118.86298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "Corresponding value", "bbox": {"l": 230.18912000000003, "t": 110.53801999999985, "r": 319.93527, "b": 118.86298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 142.80002, "t": 129.49834999999996, "r": 178.26361, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "USER or", "bbox": {"l": 142.80002, "t": 129.49834999999996, "r": 178.26361, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 142.80002, "t": 140.53864, "r": 212.70122, "b": 148.86359000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "SESSION_USER", "bbox": {"l": 142.80002, "t": 140.53864, "r": 212.70122, "b": 148.86359000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 230.21973000000003, "t": 129.49834999999996, "r": 467.99069000000003, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "The effective user of the thread excluding adopted authority.", "bbox": {"l": 230.21973000000003, "t": 129.49834999999996, "r": 467.99069000000003, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 142.80003, "t": 159.55835000000002, "r": 216.63962999999998, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "CURRENT_USER", "bbox": {"l": 142.80003, "t": 159.55835000000002, "r": 216.63962999999998, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 230.19814, "t": 159.55835000000002, "r": 535.65082, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "The effective user of the thread including adopted authority. When no adopted ", "bbox": {"l": 230.19814, "t": 159.55835000000002, "r": 535.65082, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 230.22061, "t": 170.53832999999997, "r": 447.36533, "b": 178.86328000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "authority is present, this has the same value as USER.", "bbox": {"l": 230.22061, "t": 170.53832999999997, "r": 447.36533, "b": 178.86328000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 142.8009, "t": 189.55804, "r": 209.7357, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "SYSTEM_USER", "bbox": {"l": 142.8009, "t": 189.55804, "r": 209.7357, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 230.2449, "t": 189.55804, "r": 425.64569, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "The authorization ID that initiated the connection.", "bbox": {"l": 230.2449, "t": 189.55804, "r": 425.64569, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 16, "label": "picture", "bbox": {"l": 135.64837646484375, "t": 384.1736755371094, "r": 301.2367248535156, "b": 594.7566528320312, "coord_origin": "TOPLEFT"}, "confidence": 0.7221462726593018, "cells": [{"id": 38, "text": "SignedonasALICE", "bbox": {"l": 140.7323, "t": 386.98453, "r": 218.71170000000004, "b": 395.49527, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "Signed on as ALICE", "bbox": {"l": 140.7323, "t": 386.98453, "r": 216.40009, "b": 395.49527, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "USER = ALICE", "bbox": {"l": 138.476, "t": 410.87441999999993, "r": 191.70256, "b": 419.38516, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "CURRENT USER = ALICE", "bbox": {"l": 138.476, "t": 422.81934, "r": 232.56117, "b": 431.33008, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "CALL proc1", "bbox": {"l": 138.476, "t": 446.70923000000005, "r": 183.26944, "b": 455.21997, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "P1", "bbox": {"l": 148.4301, "t": 473.58524, "r": 184.17328, "b": 482.09598, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "Proc1:", "bbox": {"l": 148.4301, "t": 473.58524, "r": 174.05859, "b": 482.09598, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Owner = JOE", "bbox": {"l": 157.52185, "t": 485.53015, "r": 209.103, "b": 494.04089, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "SET OPTION USRPRF=*OWNER", "bbox": {"l": 157.52185, "t": 497.47507, "r": 281.68927, "b": 505.98581, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "USER = ALICE", "bbox": {"l": 148.4301, "t": 521.36493, "r": 201.65666, "b": 529.87567, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "CURRENT USER = JOE", "bbox": {"l": 148.4301, "t": 533.30984, "r": 234.57686999999999, "b": 541.82059, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "USER = ALICE", "bbox": {"l": 138.476, "t": 566.15842, "r": 191.70256, "b": 574.66917, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "CURRENT USER = ALICE", "bbox": {"l": 138.476, "t": 578.10333, "r": 232.56117, "b": 586.61409, "coord_origin": "TOPLEFT"}}], "children": [{"id": 15, "label": "text", "bbox": {"l": 140.7323, "t": 386.98453, "r": 218.71170000000004, "b": 395.49527, "coord_origin": "TOPLEFT"}, "confidence": 0.7616674900054932, "cells": [{"id": 38, "text": "SignedonasALICE", "bbox": {"l": 140.7323, "t": 386.98453, "r": 218.71170000000004, "b": 395.49527, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "Signed on as ALICE", "bbox": {"l": 140.7323, "t": 386.98453, "r": 216.40009, "b": 395.49527, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 138.476, "t": 410.87441999999993, "r": 191.70256, "b": 419.38516, "coord_origin": "TOPLEFT"}, "confidence": 0.53738933801651, "cells": [{"id": 40, "text": "USER = ALICE", "bbox": {"l": 138.476, "t": 410.87441999999993, "r": 191.70256, "b": 419.38516, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 138.476, "t": 422.81934, "r": 232.56117, "b": 431.33008, "coord_origin": "TOPLEFT"}, "confidence": 0.5213789939880371, "cells": [{"id": 41, "text": "CURRENT USER = ALICE", "bbox": {"l": 138.476, "t": 422.81934, "r": 232.56117, "b": 431.33008, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 138.476, "t": 446.70923000000005, "r": 183.26944, "b": 455.21997, "coord_origin": "TOPLEFT"}, "confidence": 0.6404176950454712, "cells": [{"id": 42, "text": "CALL proc1", "bbox": {"l": 138.476, "t": 446.70923000000005, "r": 183.26944, "b": 455.21997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 148.4301, "t": 473.58524, "r": 184.17328, "b": 482.09598, "coord_origin": "TOPLEFT"}, "confidence": 0.5759296417236328, "cells": [{"id": 43, "text": "P1", "bbox": {"l": 148.4301, "t": 473.58524, "r": 184.17328, "b": 482.09598, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "Proc1:", "bbox": {"l": 148.4301, "t": 473.58524, "r": 174.05859, "b": 482.09598, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 157.52185, "t": 485.53015, "r": 209.103, "b": 494.04089, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "Owner = JOE", "bbox": {"l": 157.52185, "t": 485.53015, "r": 209.103, "b": 494.04089, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 157.52185, "t": 497.47507, "r": 281.68927, "b": 505.98581, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "SET OPTION USRPRF=*OWNER", "bbox": {"l": 157.52185, "t": 497.47507, "r": 281.68927, "b": 505.98581, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 148.4301, "t": 521.36493, "r": 201.65666, "b": 529.87567, "coord_origin": "TOPLEFT"}, "confidence": 0.535086452960968, "cells": [{"id": 47, "text": "USER = ALICE", "bbox": {"l": 148.4301, "t": 521.36493, "r": 201.65666, "b": 529.87567, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 148.4301, "t": 533.30984, "r": 234.57686999999999, "b": 541.82059, "coord_origin": "TOPLEFT"}, "confidence": 0.5008324384689331, "cells": [{"id": 48, "text": "CURRENT USER = JOE", "bbox": {"l": 148.4301, "t": 533.30984, "r": 234.57686999999999, "b": 541.82059, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 138.476, "t": 566.15842, "r": 232.56117, "b": 586.61409, "coord_origin": "TOPLEFT"}, "confidence": 0.5024971961975098, "cells": [{"id": 49, "text": "USER = ALICE", "bbox": {"l": 138.476, "t": 566.15842, "r": 191.70256, "b": 574.66917, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "CURRENT USER = ALICE", "bbox": {"l": 138.476, "t": 578.10333, "r": 232.56117, "b": 586.61409, "coord_origin": "TOPLEFT"}}], "children": []}]}]}, "tablestructure": {"table_map": {"4": {"label": "table", "id": 4, "page_no": 10, "cluster": {"id": 4, "label": "table", "bbox": {"l": 134.5463104248047, "t": 103.41889190673828, "r": 542.0460205078125, "b": 204.2716064453125, "coord_origin": "TOPLEFT"}, "confidence": 0.9731299877166748, "cells": [{"id": 28, "text": "Special register", "bbox": {"l": 142.8, "t": 110.53801999999985, "r": 209.67091, "b": 118.86298, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Corresponding value", "bbox": {"l": 230.18912000000003, "t": 110.53801999999985, "r": 319.93527, "b": 118.86298, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "USER or", "bbox": {"l": 142.80002, "t": 129.49834999999996, "r": 178.26361, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "SESSION_USER", "bbox": {"l": 142.80002, "t": 140.53864, "r": 212.70122, "b": 148.86359000000004, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "The effective user of the thread excluding adopted authority.", "bbox": {"l": 230.21973000000003, "t": 129.49834999999996, "r": 467.99069000000003, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "CURRENT_USER", "bbox": {"l": 142.80003, "t": 159.55835000000002, "r": 216.63962999999998, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "The effective user of the thread including adopted authority. When no adopted ", "bbox": {"l": 230.19814, "t": 159.55835000000002, "r": 535.65082, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "authority is present, this has the same value as USER.", "bbox": {"l": 230.22061, "t": 170.53832999999997, "r": 447.36533, "b": 178.86328000000003, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "SYSTEM_USER", "bbox": {"l": 142.8009, "t": 189.55804, "r": 209.7357, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "The authorization ID that initiated the connection.", "bbox": {"l": 230.2449, "t": 189.55804, "r": 425.64569, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}}], "children": [{"id": 26, "label": "text", "bbox": {"l": 142.8, "t": 110.53801999999985, "r": 209.67091, "b": 118.86298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "Special register", "bbox": {"l": 142.8, "t": 110.53801999999985, "r": 209.67091, "b": 118.86298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 230.18912000000003, "t": 110.53801999999985, "r": 319.93527, "b": 118.86298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "Corresponding value", "bbox": {"l": 230.18912000000003, "t": 110.53801999999985, "r": 319.93527, "b": 118.86298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 142.80002, "t": 129.49834999999996, "r": 178.26361, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "USER or", "bbox": {"l": 142.80002, "t": 129.49834999999996, "r": 178.26361, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 142.80002, "t": 140.53864, "r": 212.70122, "b": 148.86359000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "SESSION_USER", "bbox": {"l": 142.80002, "t": 140.53864, "r": 212.70122, "b": 148.86359000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 230.21973000000003, "t": 129.49834999999996, "r": 467.99069000000003, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "The effective user of the thread excluding adopted authority.", "bbox": {"l": 230.21973000000003, "t": 129.49834999999996, "r": 467.99069000000003, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 142.80003, "t": 159.55835000000002, "r": 216.63962999999998, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "CURRENT_USER", "bbox": {"l": 142.80003, "t": 159.55835000000002, "r": 216.63962999999998, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 230.19814, "t": 159.55835000000002, "r": 535.65082, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "The effective user of the thread including adopted authority. When no adopted ", "bbox": {"l": 230.19814, "t": 159.55835000000002, "r": 535.65082, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 230.22061, "t": 170.53832999999997, "r": 447.36533, "b": 178.86328000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "authority is present, this has the same value as USER.", "bbox": {"l": 230.22061, "t": 170.53832999999997, "r": 447.36533, "b": 178.86328000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 142.8009, "t": 189.55804, "r": 209.7357, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "SYSTEM_USER", "bbox": {"l": 142.8009, "t": 189.55804, "r": 209.7357, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 230.2449, "t": 189.55804, "r": 425.64569, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "The authorization ID that initiated the connection.", "bbox": {"l": 230.2449, "t": 189.55804, "r": 425.64569, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 4, "num_cols": 2, "table_cells": [{"bbox": {"l": 142.8, "t": 110.53801999999985, "r": 209.67091, "b": 118.86298, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Special register", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 230.18912000000003, "t": 110.53801999999985, "r": 319.93527, "b": 118.86298, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Corresponding value", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 142.80002, "t": 129.49834999999996, "r": 212.70122, "b": 148.86359000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "USER or SESSION_USER", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 230.21973000000003, "t": 129.49834999999996, "r": 467.99069000000003, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "The effective user of the thread excluding adopted authority.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 142.80003, "t": 159.55835000000002, "r": 216.63962999999998, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "CURRENT_USER", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 230.19814, "t": 159.55835000000002, "r": 535.65082, "b": 178.86328000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "The effective user of the thread including adopted authority. When no adopted  authority is present, this has the same value as USER.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 142.8009, "t": 189.55804, "r": 209.7357, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "SYSTEM_USER", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 230.2449, "t": 189.55804, "r": 425.64569, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "The authorization ID that initiated the connection.", "column_header": false, "row_header": false, "row_section": false}]}}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_footer", "id": 7, "page_no": 10, "cluster": {"id": 7, "label": "page_footer", "bbox": {"l": 344.94, "t": 755.538002, "r": 523.60162, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9557498693466187, "cells": [{"id": 0, "text": "Chapter 3. Row and Column Access Control ", "bbox": {"l": 344.94, "t": 755.538002, "r": 523.60162, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Chapter 3. Row and Column Access Control"}, {"label": "page_footer", "id": 13, "page_no": 10, "cluster": {"id": 13, "label": "page_footer", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.9130509495735168, "cells": [{"id": 1, "text": "19", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "19"}, {"label": "caption", "id": 14, "page_no": 10, "cluster": {"id": 14, "label": "caption", "bbox": {"l": 136.79959, "t": 71.50903000000005, "r": 412.20758, "b": 80.72204999999985, "coord_origin": "TOPLEFT"}, "confidence": 0.7875164747238159, "cells": [{"id": 2, "text": "Table 3-1 summarizes these special registers and their values.", "bbox": {"l": 136.79959, "t": 71.50903000000005, "r": 412.20758, "b": 80.72204999999985, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 3-1 summarizes these special registers and their values."}, {"label": "caption", "id": 12, "page_no": 10, "cluster": {"id": 12, "label": "caption", "bbox": {"l": 136.8, "t": 93.49805000000003, "r": 372.60364, "b": 101.82299999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.9253707528114319, "cells": [{"id": 3, "text": "Table 3-1 Special registers and their corresponding values", "bbox": {"l": 136.8, "t": 93.49805000000003, "r": 372.60364, "b": 101.82299999999998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 3-1 Special registers and their corresponding values"}, {"label": "text", "id": 9, "page_no": 10, "cluster": {"id": 9, "label": "text", "bbox": {"l": 136.8, "t": 214.48870999999997, "r": 538.4939, "b": 235.70154000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9466660022735596, "cells": [{"id": 4, "text": "Figure 3-5 shows the difference in the special register values when an adopted authority is ", "bbox": {"l": 136.8, "t": 214.48870999999997, "r": 538.4939, "b": 223.70172000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "used:", "bbox": {"l": 136.8, "t": 226.48852999999997, "r": 161.20995, "b": 235.70154000000002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 3-5 shows the difference in the special register values when an adopted authority is used:"}, {"label": "list_item", "id": 8, "page_no": 10, "cluster": {"id": 8, "label": "list_item", "bbox": {"l": 136.8, "t": 243.52808000000005, "r": 411.36139, "b": 252.74108999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9504424333572388, "cells": [{"id": 6, "text": "GLYPH<SM590000>", "bbox": {"l": 136.8, "t": 243.67749000000003, "r": 141.78, "b": 252.45227, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "A user connects to the server using the user profile ALICE.", "bbox": {"l": 151.20016, "t": 243.52808000000005, "r": 411.36139, "b": 252.74108999999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<SM590000> A user connects to the server using the user profile ALICE."}, {"label": "list_item", "id": 10, "page_no": 10, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 136.8, "t": 260.50787, "r": 453.2580899999999, "b": 269.72089000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9445975422859192, "cells": [{"id": 8, "text": "GLYPH<SM590000>", "bbox": {"l": 136.8, "t": 260.65729, "r": 141.78, "b": 269.43206999999995, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "USER and CURRENT USER initially have the same value of ALICE.", "bbox": {"l": 151.20016, "t": 260.50787, "r": 453.2580899999999, "b": 269.72089000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<SM590000> USER and CURRENT USER initially have the same value of ALICE."}, {"label": "list_item", "id": 3, "page_no": 10, "cluster": {"id": 3, "label": "list_item", "bbox": {"l": 136.8, "t": 277.48767, "r": 541.44983, "b": 298.7005, "coord_origin": "TOPLEFT"}, "confidence": 0.9742953777313232, "cells": [{"id": 10, "text": "GLYPH<SM590000>", "bbox": {"l": 136.8, "t": 277.63707999999997, "r": 141.78, "b": 286.41187, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "ALICE calls an SQL procedure that is named proc1, which is owned by user profile JOE ", "bbox": {"l": 151.20016, "t": 277.48767, "r": 541.44983, "b": 286.70068, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "and was created to adopt JOE\u2019s authority when it is called.", "bbox": {"l": 151.20016, "t": 289.4875200000001, "r": 409.82953, "b": 298.7005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<SM590000> ALICE calls an SQL procedure that is named proc1, which is owned by user profile JOE and was created to adopt JOE\u2019s authority when it is called."}, {"label": "list_item", "id": 0, "page_no": 10, "cluster": {"id": 0, "label": "list_item", "bbox": {"l": 136.8, "t": 306.5271, "r": 547.21674, "b": 339.73972, "coord_origin": "TOPLEFT"}, "confidence": 0.981132447719574, "cells": [{"id": 13, "text": "GLYPH<SM590000>", "bbox": {"l": 136.8, "t": 306.67647999999997, "r": 141.78, "b": 315.45126000000005, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "While the procedure is running, the special register USER still contains the value of ALICE ", "bbox": {"l": 151.20016, "t": 306.5271, "r": 547.21674, "b": 315.74008, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "because it excludes any adopted authority. The special register CURRENT USER ", "bbox": {"l": 151.20117, "t": 318.52691999999996, "r": 514.32971, "b": 327.7399, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "contains the value of JOE because it includes any adopted authority.", "bbox": {"l": 151.20117, "t": 330.52673, "r": 453.3249200000001, "b": 339.73972, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<SM590000> While the procedure is running, the special register USER still contains the value of ALICE because it excludes any adopted authority. The special register CURRENT USER contains the value of JOE because it includes any adopted authority."}, {"label": "list_item", "id": 2, "page_no": 10, "cluster": {"id": 2, "label": "list_item", "bbox": {"l": 136.80101, "t": 347.50653, "r": 547.35406, "b": 368.71933000000007, "coord_origin": "TOPLEFT"}, "confidence": 0.9748277068138123, "cells": [{"id": 17, "text": "GLYPH<SM590000>", "bbox": {"l": 136.80101, "t": 347.65591, "r": 141.78101, "b": 356.43069, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "When proc1 ends, the session reverts to its original state with both USER and CURRENT ", "bbox": {"l": 151.20117, "t": 347.50653, "r": 547.35406, "b": 356.71950999999996, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "USER having the value of ALICE.", "bbox": {"l": 151.20117, "t": 359.50635, "r": 299.57532, "b": 368.71933000000007, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<SM590000> When proc1 ends, the session reverts to its original state with both USER and CURRENT USER having the value of ALICE."}, {"label": "caption", "id": 11, "page_no": 10, "cluster": {"id": 11, "label": "caption", "bbox": {"l": 136.8, "t": 596.7179, "r": 341.25662, "b": 605.04291, "coord_origin": "TOPLEFT"}, "confidence": 0.9274529814720154, "cells": [{"id": 20, "text": "Figure 3-5 Special registers and adopted authority", "bbox": {"l": 136.8, "t": 596.7179, "r": 341.25662, "b": 605.04291, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 3-5 Special registers and adopted authority"}, {"label": "section_header", "id": 6, "page_no": 10, "cluster": {"id": 6, "label": "section_header", "bbox": {"l": 64.800003, "t": 625.55472, "r": 247.02536, "b": 637.54272, "coord_origin": "TOPLEFT"}, "confidence": 0.9659212827682495, "cells": [{"id": 21, "text": "3.2.2", "bbox": {"l": 64.800003, "t": 625.55472, "r": 94.20356, "b": 637.54272, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "Built-in global variables", "bbox": {"l": 97.879005, "t": 625.55472, "r": 247.02536, "b": 637.54272, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3.2.2 Built-in global variables"}, {"label": "text", "id": 5, "page_no": 10, "cluster": {"id": 5, "label": "text", "bbox": {"l": 136.8, "t": 651.70872, "r": 518.00116, "b": 672.92153, "coord_origin": "TOPLEFT"}, "confidence": 0.9696778059005737, "cells": [{"id": 23, "text": "Built-in global variables are provided with the database manager and are used in SQL ", "bbox": {"l": 136.8, "t": 651.70872, "r": 518.00116, "b": 660.92172, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "statements to retrieve scalar values that are associated with the variables.", "bbox": {"l": 136.8, "t": 663.70853, "r": 462.81759999999997, "b": 672.92153, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Built-in global variables are provided with the database manager and are used in SQL statements to retrieve scalar values that are associated with the variables."}, {"label": "text", "id": 1, "page_no": 10, "cluster": {"id": 1, "label": "text", "bbox": {"l": 136.8, "t": 685.7281, "r": 532.3385, "b": 718.94072, "coord_origin": "TOPLEFT"}, "confidence": 0.978398323059082, "cells": [{"id": 25, "text": "IBM DB2 for i supports nine different built-in global variables that are read only and ", "bbox": {"l": 136.8, "t": 685.7281, "r": 504.44669, "b": 694.941101, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "maintained by the system. These global variables can be used to identify attributes of the ", "bbox": {"l": 136.8, "t": 697.727905, "r": 532.3385, "b": 706.94091, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "database connection and used as part of the RCAC logic.", "bbox": {"l": 136.8, "t": 709.727715, "r": 391.38257, "b": 718.94072, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "IBM DB2 for i supports nine different built-in global variables that are read only and maintained by the system. These global variables can be used to identify attributes of the database connection and used as part of the RCAC logic."}, {"label": "table", "id": 4, "page_no": 10, "cluster": {"id": 4, "label": "table", "bbox": {"l": 134.5463104248047, "t": 103.41889190673828, "r": 542.0460205078125, "b": 204.2716064453125, "coord_origin": "TOPLEFT"}, "confidence": 0.9731299877166748, "cells": [{"id": 28, "text": "Special register", "bbox": {"l": 142.8, "t": 110.53801999999985, "r": 209.67091, "b": 118.86298, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Corresponding value", "bbox": {"l": 230.18912000000003, "t": 110.53801999999985, "r": 319.93527, "b": 118.86298, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "USER or", "bbox": {"l": 142.80002, "t": 129.49834999999996, "r": 178.26361, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "SESSION_USER", "bbox": {"l": 142.80002, "t": 140.53864, "r": 212.70122, "b": 148.86359000000004, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "The effective user of the thread excluding adopted authority.", "bbox": {"l": 230.21973000000003, "t": 129.49834999999996, "r": 467.99069000000003, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "CURRENT_USER", "bbox": {"l": 142.80003, "t": 159.55835000000002, "r": 216.63962999999998, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "The effective user of the thread including adopted authority. When no adopted ", "bbox": {"l": 230.19814, "t": 159.55835000000002, "r": 535.65082, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "authority is present, this has the same value as USER.", "bbox": {"l": 230.22061, "t": 170.53832999999997, "r": 447.36533, "b": 178.86328000000003, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "SYSTEM_USER", "bbox": {"l": 142.8009, "t": 189.55804, "r": 209.7357, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "The authorization ID that initiated the connection.", "bbox": {"l": 230.2449, "t": 189.55804, "r": 425.64569, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}}], "children": [{"id": 26, "label": "text", "bbox": {"l": 142.8, "t": 110.53801999999985, "r": 209.67091, "b": 118.86298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "Special register", "bbox": {"l": 142.8, "t": 110.53801999999985, "r": 209.67091, "b": 118.86298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 230.18912000000003, "t": 110.53801999999985, "r": 319.93527, "b": 118.86298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "Corresponding value", "bbox": {"l": 230.18912000000003, "t": 110.53801999999985, "r": 319.93527, "b": 118.86298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 142.80002, "t": 129.49834999999996, "r": 178.26361, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "USER or", "bbox": {"l": 142.80002, "t": 129.49834999999996, "r": 178.26361, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 142.80002, "t": 140.53864, "r": 212.70122, "b": 148.86359000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "SESSION_USER", "bbox": {"l": 142.80002, "t": 140.53864, "r": 212.70122, "b": 148.86359000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 230.21973000000003, "t": 129.49834999999996, "r": 467.99069000000003, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "The effective user of the thread excluding adopted authority.", "bbox": {"l": 230.21973000000003, "t": 129.49834999999996, "r": 467.99069000000003, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 142.80003, "t": 159.55835000000002, "r": 216.63962999999998, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "CURRENT_USER", "bbox": {"l": 142.80003, "t": 159.55835000000002, "r": 216.63962999999998, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 230.19814, "t": 159.55835000000002, "r": 535.65082, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "The effective user of the thread including adopted authority. When no adopted ", "bbox": {"l": 230.19814, "t": 159.55835000000002, "r": 535.65082, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 230.22061, "t": 170.53832999999997, "r": 447.36533, "b": 178.86328000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "authority is present, this has the same value as USER.", "bbox": {"l": 230.22061, "t": 170.53832999999997, "r": 447.36533, "b": 178.86328000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 142.8009, "t": 189.55804, "r": 209.7357, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "SYSTEM_USER", "bbox": {"l": 142.8009, "t": 189.55804, "r": 209.7357, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 230.2449, "t": 189.55804, "r": 425.64569, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "The authorization ID that initiated the connection.", "bbox": {"l": 230.2449, "t": 189.55804, "r": 425.64569, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 4, "num_cols": 2, "table_cells": [{"bbox": {"l": 142.8, "t": 110.53801999999985, "r": 209.67091, "b": 118.86298, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Special register", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 230.18912000000003, "t": 110.53801999999985, "r": 319.93527, "b": 118.86298, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Corresponding value", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 142.80002, "t": 129.49834999999996, "r": 212.70122, "b": 148.86359000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "USER or SESSION_USER", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 230.21973000000003, "t": 129.49834999999996, "r": 467.99069000000003, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "The effective user of the thread excluding adopted authority.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 142.80003, "t": 159.55835000000002, "r": 216.63962999999998, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "CURRENT_USER", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 230.19814, "t": 159.55835000000002, "r": 535.65082, "b": 178.86328000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "The effective user of the thread including adopted authority. When no adopted  authority is present, this has the same value as USER.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 142.8009, "t": 189.55804, "r": 209.7357, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "SYSTEM_USER", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 230.2449, "t": 189.55804, "r": 425.64569, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "The authorization ID that initiated the connection.", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "picture", "id": 16, "page_no": 10, "cluster": {"id": 16, "label": "picture", "bbox": {"l": 135.64837646484375, "t": 384.1736755371094, "r": 301.2367248535156, "b": 594.7566528320312, "coord_origin": "TOPLEFT"}, "confidence": 0.7221462726593018, "cells": [{"id": 38, "text": "SignedonasALICE", "bbox": {"l": 140.7323, "t": 386.98453, "r": 218.71170000000004, "b": 395.49527, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "Signed on as ALICE", "bbox": {"l": 140.7323, "t": 386.98453, "r": 216.40009, "b": 395.49527, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "USER = ALICE", "bbox": {"l": 138.476, "t": 410.87441999999993, "r": 191.70256, "b": 419.38516, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "CURRENT USER = ALICE", "bbox": {"l": 138.476, "t": 422.81934, "r": 232.56117, "b": 431.33008, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "CALL proc1", "bbox": {"l": 138.476, "t": 446.70923000000005, "r": 183.26944, "b": 455.21997, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "P1", "bbox": {"l": 148.4301, "t": 473.58524, "r": 184.17328, "b": 482.09598, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "Proc1:", "bbox": {"l": 148.4301, "t": 473.58524, "r": 174.05859, "b": 482.09598, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Owner = JOE", "bbox": {"l": 157.52185, "t": 485.53015, "r": 209.103, "b": 494.04089, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "SET OPTION USRPRF=*OWNER", "bbox": {"l": 157.52185, "t": 497.47507, "r": 281.68927, "b": 505.98581, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "USER = ALICE", "bbox": {"l": 148.4301, "t": 521.36493, "r": 201.65666, "b": 529.87567, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "CURRENT USER = JOE", "bbox": {"l": 148.4301, "t": 533.30984, "r": 234.57686999999999, "b": 541.82059, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "USER = ALICE", "bbox": {"l": 138.476, "t": 566.15842, "r": 191.70256, "b": 574.66917, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "CURRENT USER = ALICE", "bbox": {"l": 138.476, "t": 578.10333, "r": 232.56117, "b": 586.61409, "coord_origin": "TOPLEFT"}}], "children": [{"id": 15, "label": "text", "bbox": {"l": 140.7323, "t": 386.98453, "r": 218.71170000000004, "b": 395.49527, "coord_origin": "TOPLEFT"}, "confidence": 0.7616674900054932, "cells": [{"id": 38, "text": "SignedonasALICE", "bbox": {"l": 140.7323, "t": 386.98453, "r": 218.71170000000004, "b": 395.49527, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "Signed on as ALICE", "bbox": {"l": 140.7323, "t": 386.98453, "r": 216.40009, "b": 395.49527, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 138.476, "t": 410.87441999999993, "r": 191.70256, "b": 419.38516, "coord_origin": "TOPLEFT"}, "confidence": 0.53738933801651, "cells": [{"id": 40, "text": "USER = ALICE", "bbox": {"l": 138.476, "t": 410.87441999999993, "r": 191.70256, "b": 419.38516, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 138.476, "t": 422.81934, "r": 232.56117, "b": 431.33008, "coord_origin": "TOPLEFT"}, "confidence": 0.5213789939880371, "cells": [{"id": 41, "text": "CURRENT USER = ALICE", "bbox": {"l": 138.476, "t": 422.81934, "r": 232.56117, "b": 431.33008, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 138.476, "t": 446.70923000000005, "r": 183.26944, "b": 455.21997, "coord_origin": "TOPLEFT"}, "confidence": 0.6404176950454712, "cells": [{"id": 42, "text": "CALL proc1", "bbox": {"l": 138.476, "t": 446.70923000000005, "r": 183.26944, "b": 455.21997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 148.4301, "t": 473.58524, "r": 184.17328, "b": 482.09598, "coord_origin": "TOPLEFT"}, "confidence": 0.5759296417236328, "cells": [{"id": 43, "text": "P1", "bbox": {"l": 148.4301, "t": 473.58524, "r": 184.17328, "b": 482.09598, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "Proc1:", "bbox": {"l": 148.4301, "t": 473.58524, "r": 174.05859, "b": 482.09598, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 157.52185, "t": 485.53015, "r": 209.103, "b": 494.04089, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "Owner = JOE", "bbox": {"l": 157.52185, "t": 485.53015, "r": 209.103, "b": 494.04089, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 157.52185, "t": 497.47507, "r": 281.68927, "b": 505.98581, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "SET OPTION USRPRF=*OWNER", "bbox": {"l": 157.52185, "t": 497.47507, "r": 281.68927, "b": 505.98581, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 148.4301, "t": 521.36493, "r": 201.65666, "b": 529.87567, "coord_origin": "TOPLEFT"}, "confidence": 0.535086452960968, "cells": [{"id": 47, "text": "USER = ALICE", "bbox": {"l": 148.4301, "t": 521.36493, "r": 201.65666, "b": 529.87567, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 148.4301, "t": 533.30984, "r": 234.57686999999999, "b": 541.82059, "coord_origin": "TOPLEFT"}, "confidence": 0.5008324384689331, "cells": [{"id": 48, "text": "CURRENT USER = JOE", "bbox": {"l": 148.4301, "t": 533.30984, "r": 234.57686999999999, "b": 541.82059, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 138.476, "t": 566.15842, "r": 232.56117, "b": 586.61409, "coord_origin": "TOPLEFT"}, "confidence": 0.5024971961975098, "cells": [{"id": 49, "text": "USER = ALICE", "bbox": {"l": 138.476, "t": 566.15842, "r": 191.70256, "b": 574.66917, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "CURRENT USER = ALICE", "bbox": {"l": 138.476, "t": 578.10333, "r": 232.56117, "b": 586.61409, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "body": [{"label": "caption", "id": 14, "page_no": 10, "cluster": {"id": 14, "label": "caption", "bbox": {"l": 136.79959, "t": 71.50903000000005, "r": 412.20758, "b": 80.72204999999985, "coord_origin": "TOPLEFT"}, "confidence": 0.7875164747238159, "cells": [{"id": 2, "text": "Table 3-1 summarizes these special registers and their values.", "bbox": {"l": 136.79959, "t": 71.50903000000005, "r": 412.20758, "b": 80.72204999999985, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 3-1 summarizes these special registers and their values."}, {"label": "caption", "id": 12, "page_no": 10, "cluster": {"id": 12, "label": "caption", "bbox": {"l": 136.8, "t": 93.49805000000003, "r": 372.60364, "b": 101.82299999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.9253707528114319, "cells": [{"id": 3, "text": "Table 3-1 Special registers and their corresponding values", "bbox": {"l": 136.8, "t": 93.49805000000003, "r": 372.60364, "b": 101.82299999999998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 3-1 Special registers and their corresponding values"}, {"label": "text", "id": 9, "page_no": 10, "cluster": {"id": 9, "label": "text", "bbox": {"l": 136.8, "t": 214.48870999999997, "r": 538.4939, "b": 235.70154000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9466660022735596, "cells": [{"id": 4, "text": "Figure 3-5 shows the difference in the special register values when an adopted authority is ", "bbox": {"l": 136.8, "t": 214.48870999999997, "r": 538.4939, "b": 223.70172000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "used:", "bbox": {"l": 136.8, "t": 226.48852999999997, "r": 161.20995, "b": 235.70154000000002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 3-5 shows the difference in the special register values when an adopted authority is used:"}, {"label": "list_item", "id": 8, "page_no": 10, "cluster": {"id": 8, "label": "list_item", "bbox": {"l": 136.8, "t": 243.52808000000005, "r": 411.36139, "b": 252.74108999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9504424333572388, "cells": [{"id": 6, "text": "GLYPH<SM590000>", "bbox": {"l": 136.8, "t": 243.67749000000003, "r": 141.78, "b": 252.45227, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "A user connects to the server using the user profile ALICE.", "bbox": {"l": 151.20016, "t": 243.52808000000005, "r": 411.36139, "b": 252.74108999999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<SM590000> A user connects to the server using the user profile ALICE."}, {"label": "list_item", "id": 10, "page_no": 10, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 136.8, "t": 260.50787, "r": 453.2580899999999, "b": 269.72089000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9445975422859192, "cells": [{"id": 8, "text": "GLYPH<SM590000>", "bbox": {"l": 136.8, "t": 260.65729, "r": 141.78, "b": 269.43206999999995, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "USER and CURRENT USER initially have the same value of ALICE.", "bbox": {"l": 151.20016, "t": 260.50787, "r": 453.2580899999999, "b": 269.72089000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<SM590000> USER and CURRENT USER initially have the same value of ALICE."}, {"label": "list_item", "id": 3, "page_no": 10, "cluster": {"id": 3, "label": "list_item", "bbox": {"l": 136.8, "t": 277.48767, "r": 541.44983, "b": 298.7005, "coord_origin": "TOPLEFT"}, "confidence": 0.9742953777313232, "cells": [{"id": 10, "text": "GLYPH<SM590000>", "bbox": {"l": 136.8, "t": 277.63707999999997, "r": 141.78, "b": 286.41187, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "ALICE calls an SQL procedure that is named proc1, which is owned by user profile JOE ", "bbox": {"l": 151.20016, "t": 277.48767, "r": 541.44983, "b": 286.70068, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "and was created to adopt JOE\u2019s authority when it is called.", "bbox": {"l": 151.20016, "t": 289.4875200000001, "r": 409.82953, "b": 298.7005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<SM590000> ALICE calls an SQL procedure that is named proc1, which is owned by user profile JOE and was created to adopt JOE\u2019s authority when it is called."}, {"label": "list_item", "id": 0, "page_no": 10, "cluster": {"id": 0, "label": "list_item", "bbox": {"l": 136.8, "t": 306.5271, "r": 547.21674, "b": 339.73972, "coord_origin": "TOPLEFT"}, "confidence": 0.981132447719574, "cells": [{"id": 13, "text": "GLYPH<SM590000>", "bbox": {"l": 136.8, "t": 306.67647999999997, "r": 141.78, "b": 315.45126000000005, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "While the procedure is running, the special register USER still contains the value of ALICE ", "bbox": {"l": 151.20016, "t": 306.5271, "r": 547.21674, "b": 315.74008, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "because it excludes any adopted authority. The special register CURRENT USER ", "bbox": {"l": 151.20117, "t": 318.52691999999996, "r": 514.32971, "b": 327.7399, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "contains the value of JOE because it includes any adopted authority.", "bbox": {"l": 151.20117, "t": 330.52673, "r": 453.3249200000001, "b": 339.73972, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<SM590000> While the procedure is running, the special register USER still contains the value of ALICE because it excludes any adopted authority. The special register CURRENT USER contains the value of JOE because it includes any adopted authority."}, {"label": "list_item", "id": 2, "page_no": 10, "cluster": {"id": 2, "label": "list_item", "bbox": {"l": 136.80101, "t": 347.50653, "r": 547.35406, "b": 368.71933000000007, "coord_origin": "TOPLEFT"}, "confidence": 0.9748277068138123, "cells": [{"id": 17, "text": "GLYPH<SM590000>", "bbox": {"l": 136.80101, "t": 347.65591, "r": 141.78101, "b": 356.43069, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "When proc1 ends, the session reverts to its original state with both USER and CURRENT ", "bbox": {"l": 151.20117, "t": 347.50653, "r": 547.35406, "b": 356.71950999999996, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "USER having the value of ALICE.", "bbox": {"l": 151.20117, "t": 359.50635, "r": 299.57532, "b": 368.71933000000007, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<SM590000> When proc1 ends, the session reverts to its original state with both USER and CURRENT USER having the value of ALICE."}, {"label": "caption", "id": 11, "page_no": 10, "cluster": {"id": 11, "label": "caption", "bbox": {"l": 136.8, "t": 596.7179, "r": 341.25662, "b": 605.04291, "coord_origin": "TOPLEFT"}, "confidence": 0.9274529814720154, "cells": [{"id": 20, "text": "Figure 3-5 Special registers and adopted authority", "bbox": {"l": 136.8, "t": 596.7179, "r": 341.25662, "b": 605.04291, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 3-5 Special registers and adopted authority"}, {"label": "section_header", "id": 6, "page_no": 10, "cluster": {"id": 6, "label": "section_header", "bbox": {"l": 64.800003, "t": 625.55472, "r": 247.02536, "b": 637.54272, "coord_origin": "TOPLEFT"}, "confidence": 0.9659212827682495, "cells": [{"id": 21, "text": "3.2.2", "bbox": {"l": 64.800003, "t": 625.55472, "r": 94.20356, "b": 637.54272, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "Built-in global variables", "bbox": {"l": 97.879005, "t": 625.55472, "r": 247.02536, "b": 637.54272, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3.2.2 Built-in global variables"}, {"label": "text", "id": 5, "page_no": 10, "cluster": {"id": 5, "label": "text", "bbox": {"l": 136.8, "t": 651.70872, "r": 518.00116, "b": 672.92153, "coord_origin": "TOPLEFT"}, "confidence": 0.9696778059005737, "cells": [{"id": 23, "text": "Built-in global variables are provided with the database manager and are used in SQL ", "bbox": {"l": 136.8, "t": 651.70872, "r": 518.00116, "b": 660.92172, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "statements to retrieve scalar values that are associated with the variables.", "bbox": {"l": 136.8, "t": 663.70853, "r": 462.81759999999997, "b": 672.92153, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Built-in global variables are provided with the database manager and are used in SQL statements to retrieve scalar values that are associated with the variables."}, {"label": "text", "id": 1, "page_no": 10, "cluster": {"id": 1, "label": "text", "bbox": {"l": 136.8, "t": 685.7281, "r": 532.3385, "b": 718.94072, "coord_origin": "TOPLEFT"}, "confidence": 0.978398323059082, "cells": [{"id": 25, "text": "IBM DB2 for i supports nine different built-in global variables that are read only and ", "bbox": {"l": 136.8, "t": 685.7281, "r": 504.44669, "b": 694.941101, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "maintained by the system. These global variables can be used to identify attributes of the ", "bbox": {"l": 136.8, "t": 697.727905, "r": 532.3385, "b": 706.94091, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "database connection and used as part of the RCAC logic.", "bbox": {"l": 136.8, "t": 709.727715, "r": 391.38257, "b": 718.94072, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "IBM DB2 for i supports nine different built-in global variables that are read only and maintained by the system. These global variables can be used to identify attributes of the database connection and used as part of the RCAC logic."}, {"label": "table", "id": 4, "page_no": 10, "cluster": {"id": 4, "label": "table", "bbox": {"l": 134.5463104248047, "t": 103.41889190673828, "r": 542.0460205078125, "b": 204.2716064453125, "coord_origin": "TOPLEFT"}, "confidence": 0.9731299877166748, "cells": [{"id": 28, "text": "Special register", "bbox": {"l": 142.8, "t": 110.53801999999985, "r": 209.67091, "b": 118.86298, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Corresponding value", "bbox": {"l": 230.18912000000003, "t": 110.53801999999985, "r": 319.93527, "b": 118.86298, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "USER or", "bbox": {"l": 142.80002, "t": 129.49834999999996, "r": 178.26361, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "SESSION_USER", "bbox": {"l": 142.80002, "t": 140.53864, "r": 212.70122, "b": 148.86359000000004, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "The effective user of the thread excluding adopted authority.", "bbox": {"l": 230.21973000000003, "t": 129.49834999999996, "r": 467.99069000000003, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "CURRENT_USER", "bbox": {"l": 142.80003, "t": 159.55835000000002, "r": 216.63962999999998, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "The effective user of the thread including adopted authority. When no adopted ", "bbox": {"l": 230.19814, "t": 159.55835000000002, "r": 535.65082, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "authority is present, this has the same value as USER.", "bbox": {"l": 230.22061, "t": 170.53832999999997, "r": 447.36533, "b": 178.86328000000003, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "SYSTEM_USER", "bbox": {"l": 142.8009, "t": 189.55804, "r": 209.7357, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "The authorization ID that initiated the connection.", "bbox": {"l": 230.2449, "t": 189.55804, "r": 425.64569, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}}], "children": [{"id": 26, "label": "text", "bbox": {"l": 142.8, "t": 110.53801999999985, "r": 209.67091, "b": 118.86298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "Special register", "bbox": {"l": 142.8, "t": 110.53801999999985, "r": 209.67091, "b": 118.86298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 230.18912000000003, "t": 110.53801999999985, "r": 319.93527, "b": 118.86298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "Corresponding value", "bbox": {"l": 230.18912000000003, "t": 110.53801999999985, "r": 319.93527, "b": 118.86298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 142.80002, "t": 129.49834999999996, "r": 178.26361, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "USER or", "bbox": {"l": 142.80002, "t": 129.49834999999996, "r": 178.26361, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 142.80002, "t": 140.53864, "r": 212.70122, "b": 148.86359000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "SESSION_USER", "bbox": {"l": 142.80002, "t": 140.53864, "r": 212.70122, "b": 148.86359000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 230.21973000000003, "t": 129.49834999999996, "r": 467.99069000000003, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "The effective user of the thread excluding adopted authority.", "bbox": {"l": 230.21973000000003, "t": 129.49834999999996, "r": 467.99069000000003, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 142.80003, "t": 159.55835000000002, "r": 216.63962999999998, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "CURRENT_USER", "bbox": {"l": 142.80003, "t": 159.55835000000002, "r": 216.63962999999998, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 230.19814, "t": 159.55835000000002, "r": 535.65082, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "The effective user of the thread including adopted authority. When no adopted ", "bbox": {"l": 230.19814, "t": 159.55835000000002, "r": 535.65082, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 230.22061, "t": 170.53832999999997, "r": 447.36533, "b": 178.86328000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "authority is present, this has the same value as USER.", "bbox": {"l": 230.22061, "t": 170.53832999999997, "r": 447.36533, "b": 178.86328000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 142.8009, "t": 189.55804, "r": 209.7357, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "SYSTEM_USER", "bbox": {"l": 142.8009, "t": 189.55804, "r": 209.7357, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 230.2449, "t": 189.55804, "r": 425.64569, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "The authorization ID that initiated the connection.", "bbox": {"l": 230.2449, "t": 189.55804, "r": 425.64569, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 4, "num_cols": 2, "table_cells": [{"bbox": {"l": 142.8, "t": 110.53801999999985, "r": 209.67091, "b": 118.86298, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Special register", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 230.18912000000003, "t": 110.53801999999985, "r": 319.93527, "b": 118.86298, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Corresponding value", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 142.80002, "t": 129.49834999999996, "r": 212.70122, "b": 148.86359000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "USER or SESSION_USER", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 230.21973000000003, "t": 129.49834999999996, "r": 467.99069000000003, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "The effective user of the thread excluding adopted authority.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 142.80003, "t": 159.55835000000002, "r": 216.63962999999998, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "CURRENT_USER", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 230.19814, "t": 159.55835000000002, "r": 535.65082, "b": 178.86328000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "The effective user of the thread including adopted authority. When no adopted  authority is present, this has the same value as USER.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 142.8009, "t": 189.55804, "r": 209.7357, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "SYSTEM_USER", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 230.2449, "t": 189.55804, "r": 425.64569, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "The authorization ID that initiated the connection.", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "picture", "id": 16, "page_no": 10, "cluster": {"id": 16, "label": "picture", "bbox": {"l": 135.64837646484375, "t": 384.1736755371094, "r": 301.2367248535156, "b": 594.7566528320312, "coord_origin": "TOPLEFT"}, "confidence": 0.7221462726593018, "cells": [{"id": 38, "text": "SignedonasALICE", "bbox": {"l": 140.7323, "t": 386.98453, "r": 218.71170000000004, "b": 395.49527, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "Signed on as ALICE", "bbox": {"l": 140.7323, "t": 386.98453, "r": 216.40009, "b": 395.49527, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "USER = ALICE", "bbox": {"l": 138.476, "t": 410.87441999999993, "r": 191.70256, "b": 419.38516, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "CURRENT USER = ALICE", "bbox": {"l": 138.476, "t": 422.81934, "r": 232.56117, "b": 431.33008, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "CALL proc1", "bbox": {"l": 138.476, "t": 446.70923000000005, "r": 183.26944, "b": 455.21997, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "P1", "bbox": {"l": 148.4301, "t": 473.58524, "r": 184.17328, "b": 482.09598, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "Proc1:", "bbox": {"l": 148.4301, "t": 473.58524, "r": 174.05859, "b": 482.09598, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Owner = JOE", "bbox": {"l": 157.52185, "t": 485.53015, "r": 209.103, "b": 494.04089, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "SET OPTION USRPRF=*OWNER", "bbox": {"l": 157.52185, "t": 497.47507, "r": 281.68927, "b": 505.98581, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "USER = ALICE", "bbox": {"l": 148.4301, "t": 521.36493, "r": 201.65666, "b": 529.87567, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "CURRENT USER = JOE", "bbox": {"l": 148.4301, "t": 533.30984, "r": 234.57686999999999, "b": 541.82059, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "USER = ALICE", "bbox": {"l": 138.476, "t": 566.15842, "r": 191.70256, "b": 574.66917, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "CURRENT USER = ALICE", "bbox": {"l": 138.476, "t": 578.10333, "r": 232.56117, "b": 586.61409, "coord_origin": "TOPLEFT"}}], "children": [{"id": 15, "label": "text", "bbox": {"l": 140.7323, "t": 386.98453, "r": 218.71170000000004, "b": 395.49527, "coord_origin": "TOPLEFT"}, "confidence": 0.7616674900054932, "cells": [{"id": 38, "text": "SignedonasALICE", "bbox": {"l": 140.7323, "t": 386.98453, "r": 218.71170000000004, "b": 395.49527, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "Signed on as ALICE", "bbox": {"l": 140.7323, "t": 386.98453, "r": 216.40009, "b": 395.49527, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 138.476, "t": 410.87441999999993, "r": 191.70256, "b": 419.38516, "coord_origin": "TOPLEFT"}, "confidence": 0.53738933801651, "cells": [{"id": 40, "text": "USER = ALICE", "bbox": {"l": 138.476, "t": 410.87441999999993, "r": 191.70256, "b": 419.38516, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 138.476, "t": 422.81934, "r": 232.56117, "b": 431.33008, "coord_origin": "TOPLEFT"}, "confidence": 0.5213789939880371, "cells": [{"id": 41, "text": "CURRENT USER = ALICE", "bbox": {"l": 138.476, "t": 422.81934, "r": 232.56117, "b": 431.33008, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 138.476, "t": 446.70923000000005, "r": 183.26944, "b": 455.21997, "coord_origin": "TOPLEFT"}, "confidence": 0.6404176950454712, "cells": [{"id": 42, "text": "CALL proc1", "bbox": {"l": 138.476, "t": 446.70923000000005, "r": 183.26944, "b": 455.21997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 148.4301, "t": 473.58524, "r": 184.17328, "b": 482.09598, "coord_origin": "TOPLEFT"}, "confidence": 0.5759296417236328, "cells": [{"id": 43, "text": "P1", "bbox": {"l": 148.4301, "t": 473.58524, "r": 184.17328, "b": 482.09598, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "Proc1:", "bbox": {"l": 148.4301, "t": 473.58524, "r": 174.05859, "b": 482.09598, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 157.52185, "t": 485.53015, "r": 209.103, "b": 494.04089, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "Owner = JOE", "bbox": {"l": 157.52185, "t": 485.53015, "r": 209.103, "b": 494.04089, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 157.52185, "t": 497.47507, "r": 281.68927, "b": 505.98581, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "SET OPTION USRPRF=*OWNER", "bbox": {"l": 157.52185, "t": 497.47507, "r": 281.68927, "b": 505.98581, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 148.4301, "t": 521.36493, "r": 201.65666, "b": 529.87567, "coord_origin": "TOPLEFT"}, "confidence": 0.535086452960968, "cells": [{"id": 47, "text": "USER = ALICE", "bbox": {"l": 148.4301, "t": 521.36493, "r": 201.65666, "b": 529.87567, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 148.4301, "t": 533.30984, "r": 234.57686999999999, "b": 541.82059, "coord_origin": "TOPLEFT"}, "confidence": 0.5008324384689331, "cells": [{"id": 48, "text": "CURRENT USER = JOE", "bbox": {"l": 148.4301, "t": 533.30984, "r": 234.57686999999999, "b": 541.82059, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 138.476, "t": 566.15842, "r": 232.56117, "b": 586.61409, "coord_origin": "TOPLEFT"}, "confidence": 0.5024971961975098, "cells": [{"id": 49, "text": "USER = ALICE", "bbox": {"l": 138.476, "t": 566.15842, "r": 191.70256, "b": 574.66917, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "CURRENT USER = ALICE", "bbox": {"l": 138.476, "t": 578.10333, "r": 232.56117, "b": 586.61409, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "headers": [{"label": "page_footer", "id": 7, "page_no": 10, "cluster": {"id": 7, "label": "page_footer", "bbox": {"l": 344.94, "t": 755.538002, "r": 523.60162, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9557498693466187, "cells": [{"id": 0, "text": "Chapter 3. Row and Column Access Control ", "bbox": {"l": 344.94, "t": 755.538002, "r": 523.60162, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Chapter 3. Row and Column Access Control"}, {"label": "page_footer", "id": 13, "page_no": 10, "cluster": {"id": 13, "label": "page_footer", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.9130509495735168, "cells": [{"id": 1, "text": "19", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "19"}]}}, {"page_no": 11, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "20 ", "bbox": {"l": 64.800003, "t": 754.848721, "r": 78.402, "b": 764.06172, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Row and Column Access Control Support in IBM DB2 for i", "bbox": {"l": 93.420303, "t": 755.538002, "r": 334.42142, "b": 763.863001, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Table 3-2 lists the nine built-in global variables.", "bbox": {"l": 136.8, "t": 71.50867000000005, "r": 342.54773, "b": 80.72167999999999, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Table 3-2 Built-in global variables", "bbox": {"l": 64.800003, "t": 93.49805000000003, "r": 201.18147, "b": 101.82299999999998, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "3.3", "bbox": {"l": 64.800003, "t": 322.20071, "r": 87.318192, "b": 336.96371000000005, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "VERIFY_GROUP_FOR_USER function", "bbox": {"l": 91.821815, "t": 322.20071, "r": 384.36389, "b": 336.96371000000005, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "The VERIFY_GROUP_FOR_USER function was added in IBM i 7.2. Although it is primarily ", "bbox": {"l": 136.8, "t": 354.52872, "r": 542.83539, "b": 363.7417, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "intended for use with RCAC permissions and masks, it can be used in other SQL statements. ", "bbox": {"l": 136.8, "t": 366.52853, "r": 547.14783, "b": 375.74152, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "The first parameter must be one of these three special registers: SESSION_USER, USER, or ", "bbox": {"l": 136.8, "t": 378.52835, "r": 547.15106, "b": 387.74132999999995, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "CURRENT_USER. The second and subsequent parameters are a list of user or group ", "bbox": {"l": 136.80002, "t": 390.52817, "r": 520.62958, "b": 399.74115000000006, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "profiles. Each of these values must be 1 - 10 characters in length. These values are not ", "bbox": {"l": 136.80002, "t": 402.52798, "r": 524.88824, "b": 411.74097, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "validated for their existence, which means that you can specify the names of user profiles that ", "bbox": {"l": 136.80002, "t": 414.5278, "r": 547.23474, "b": 423.7407799999999, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "do not exist without receiving any kind of error.", "bbox": {"l": 136.80002, "t": 426.52762, "r": 342.04672, "b": 435.74060000000003, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "If a special register value is in the list of user profiles or it is a member of a group profile ", "bbox": {"l": 136.80002, "t": 448.48743, "r": 525.1474, "b": 457.70041, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "included in the list, the function returns a long integer value of 1. Otherwise, it returns a value ", "bbox": {"l": 136.80002, "t": 460.48724, "r": 547.25739, "b": 469.70023, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "of 0. It never returns the null value.", "bbox": {"l": 136.80002, "t": 472.48706, "r": 289.84335, "b": 481.70004, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Here is an example of using the VERIFY_GROUP_FOR_USER function:", "bbox": {"l": 136.80002, "t": 494.50662, "r": 458.44525000000004, "b": 503.7196, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "1.", "bbox": {"l": 136.80002, "t": 511.5462, "r": 145.09804, "b": 520.75919, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "There are user profiles for MGR, JANE, JUDY, and TONY.", "bbox": {"l": 147.86403, "t": 511.5462, "r": 406.07751, "b": 520.75919, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "2.", "bbox": {"l": 136.80002, "t": 528.5260000000001, "r": 145.23297, "b": 537.739, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "The user profile JANE specifies a group profile of MGR.", "bbox": {"l": 148.04396, "t": 528.5260000000001, "r": 396.98816, "b": 537.739, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "3.", "bbox": {"l": 136.80002, "t": 545.50581, "r": 145.18951, "b": 554.71881, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "If a user is connected to the server using user profile JANE, all of the following function ", "bbox": {"l": 147.98601, "t": 545.50581, "r": 536.5686, "b": 554.71881, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "invocations return a value of 1:", "bbox": {"l": 151.20018, "t": 557.50562, "r": 286.84641, "b": 566.71861, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "VERIFY_GROUP_FOR_USER (CURRENT_USER, 'MGR')", "bbox": {"l": 151.20018, "t": 574.69458, "r": 366.05725, "b": 583.46933, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "VERIFY_GROUP_FOR_USER (CURRENT_USER, 'JANE', 'MGR')", "bbox": {"l": 151.20018, "t": 586.69438, "r": 406.01678, "b": 595.46913, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "VERIFY_GROUP_FOR_USER (CURRENT_USER, 'JANE', 'MGR', 'STEVE')", "bbox": {"l": 151.20018, "t": 598.69418, "r": 451.01605, "b": 607.46893, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "The following function invocation returns a value of 0:", "bbox": {"l": 151.20018, "t": 615.5246, "r": 385.87271, "b": 624.73759, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "VERIFY_GROUP_FOR_USER (CURRENT_USER, 'JUDY', 'TONY')", "bbox": {"l": 151.20018, "t": 632.65381, "r": 411.05655, "b": 641.4285600000001, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Global variable", "bbox": {"l": 70.800003, "t": 110.53801999999985, "r": 134.99071, "b": 118.86298, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Type", "bbox": {"l": 202.8894, "t": 110.53801999999985, "r": 223.34641, "b": 118.86298, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Description", "bbox": {"l": 281.8248, "t": 110.53801999999985, "r": 331.3428, "b": 118.86298, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "CLIENT_HOST", "bbox": {"l": 70.800003, "t": 129.49834999999996, "r": 132.7209, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "VARCHAR(255)", "bbox": {"l": 202.89029, "t": 129.49834999999996, "r": 267.07651, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Host name of the current client as returned by the system", "bbox": {"l": 281.84732, "t": 129.49834999999996, "r": 510.17548, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "CLIENT_IPADDR", "bbox": {"l": 70.800018, "t": 148.51806999999997, "r": 140.66522, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "VARCHAR(128)", "bbox": {"l": 202.87231, "t": 148.51806999999997, "r": 267.07739, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "IP address of the current client as returned by the system", "bbox": {"l": 281.84549, "t": 148.51806999999997, "r": 509.60583, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "CLIENT_PORT ", "bbox": {"l": 70.800018, "t": 167.53778, "r": 134.98264, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "INTEGER", "bbox": {"l": 202.90294, "t": 167.53778, "r": 242.80084, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "Port used by the current client to communicate with the server", "bbox": {"l": 281.79785, "t": 167.53778, "r": 527.59222, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "PACKAGE_NAME", "bbox": {"l": 70.800018, "t": 186.5575, "r": 143.50925, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "VARCHAR(128)", "bbox": {"l": 202.80576, "t": 186.5575, "r": 267.06937, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Name of the currently running package", "bbox": {"l": 281.85187, "t": 186.5575, "r": 436.57259999999997, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "PACKAGE_SCHEMA", "bbox": {"l": 70.800018, "t": 205.51782000000003, "r": 156.01654, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "VARCHAR(128)", "bbox": {"l": 202.83545, "t": 205.51782000000003, "r": 267.08646, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "Schema name of the currently running package", "bbox": {"l": 281.87076, "t": 205.51782000000003, "r": 470.44678, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "PACKAGE_VERSION", "bbox": {"l": 70.800018, "t": 224.53754000000004, "r": 157.89932, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "VARCHAR(64)", "bbox": {"l": 202.72472, "t": 224.53754000000004, "r": 261.98254, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "Version identifier of the currently running package", "bbox": {"l": 281.74924, "t": 224.53754000000004, "r": 478.8438100000001, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "ROUTINE_SCHEMA", "bbox": {"l": 70.800018, "t": 243.55724999999995, "r": 154.41992, "b": 251.8822, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "VARCHAR(128)", "bbox": {"l": 202.79312, "t": 243.55724999999995, "r": 267.09274, "b": 251.8822, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Schema name of the currently running routine", "bbox": {"l": 281.87164, "t": 243.55724999999995, "r": 464.26022, "b": 251.8822, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "ROUTINE_SPECIFIC_NAME", "bbox": {"l": 70.800018, "t": 262.51757999999995, "r": 188.43991, "b": 270.84253, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "VARCHAR(128)", "bbox": {"l": 202.84441, "t": 262.51757999999995, "r": 267.03693, "b": 270.84253, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "Name of the currently running routine", "bbox": {"l": 281.80682, "t": 262.51757999999995, "r": 430.40045, "b": 270.84253, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "ROUTINE_TYPE", "bbox": {"l": 70.800034, "t": 281.53726, "r": 139.43135, "b": 289.86227, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "CHAR(1)", "bbox": {"l": 202.74635, "t": 281.53726, "r": 239.28996000000004, "b": 289.86227, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Type of the currently running routine", "bbox": {"l": 281.79065, "t": 281.53726, "r": 425.09131, "b": 289.86227, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 9, "label": "page_footer", "bbox": {"l": 64.800003, "t": 754.848721, "r": 78.402, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.9187921285629272, "cells": [{"id": 0, "text": "20 ", "bbox": {"l": 64.800003, "t": 754.848721, "r": 78.402, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "page_footer", "bbox": {"l": 93.420303, "t": 755.538002, "r": 334.42142, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9505080580711365, "cells": [{"id": 1, "text": "Row and Column Access Control Support in IBM DB2 for i", "bbox": {"l": 93.420303, "t": 755.538002, "r": 334.42142, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 136.8, "t": 71.50867000000005, "r": 342.54773, "b": 80.72167999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.8370980620384216, "cells": [{"id": 2, "text": "Table 3-2 lists the nine built-in global variables.", "bbox": {"l": 136.8, "t": 71.50867000000005, "r": 342.54773, "b": 80.72167999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "caption", "bbox": {"l": 64.800003, "t": 93.49805000000003, "r": 201.18147, "b": 101.82299999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.9132355451583862, "cells": [{"id": 3, "text": "Table 3-2 Built-in global variables", "bbox": {"l": 64.800003, "t": 93.49805000000003, "r": 201.18147, "b": 101.82299999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "section_header", "bbox": {"l": 64.800003, "t": 322.20071, "r": 384.36389, "b": 336.96371000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9645338654518127, "cells": [{"id": 4, "text": "3.3", "bbox": {"l": 64.800003, "t": 322.20071, "r": 87.318192, "b": 336.96371000000005, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "VERIFY_GROUP_FOR_USER function", "bbox": {"l": 91.821815, "t": 322.20071, "r": 384.36389, "b": 336.96371000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 136.8, "t": 354.52872, "r": 547.23474, "b": 435.74060000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9864333868026733, "cells": [{"id": 6, "text": "The VERIFY_GROUP_FOR_USER function was added in IBM i 7.2. Although it is primarily ", "bbox": {"l": 136.8, "t": 354.52872, "r": 542.83539, "b": 363.7417, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "intended for use with RCAC permissions and masks, it can be used in other SQL statements. ", "bbox": {"l": 136.8, "t": 366.52853, "r": 547.14783, "b": 375.74152, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "The first parameter must be one of these three special registers: SESSION_USER, USER, or ", "bbox": {"l": 136.8, "t": 378.52835, "r": 547.15106, "b": 387.74132999999995, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "CURRENT_USER. The second and subsequent parameters are a list of user or group ", "bbox": {"l": 136.80002, "t": 390.52817, "r": 520.62958, "b": 399.74115000000006, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "profiles. Each of these values must be 1 - 10 characters in length. These values are not ", "bbox": {"l": 136.80002, "t": 402.52798, "r": 524.88824, "b": 411.74097, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "validated for their existence, which means that you can specify the names of user profiles that ", "bbox": {"l": 136.80002, "t": 414.5278, "r": 547.23474, "b": 423.7407799999999, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "do not exist without receiving any kind of error.", "bbox": {"l": 136.80002, "t": 426.52762, "r": 342.04672, "b": 435.74060000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 136.80002, "t": 448.48743, "r": 547.25739, "b": 481.70004, "coord_origin": "TOPLEFT"}, "confidence": 0.9807308912277222, "cells": [{"id": 13, "text": "If a special register value is in the list of user profiles or it is a member of a group profile ", "bbox": {"l": 136.80002, "t": 448.48743, "r": 525.1474, "b": 457.70041, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "included in the list, the function returns a long integer value of 1. Otherwise, it returns a value ", "bbox": {"l": 136.80002, "t": 460.48724, "r": 547.25739, "b": 469.70023, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "of 0. It never returns the null value.", "bbox": {"l": 136.80002, "t": 472.48706, "r": 289.84335, "b": 481.70004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "text", "bbox": {"l": 136.80002, "t": 494.50662, "r": 458.44525000000004, "b": 503.7196, "coord_origin": "TOPLEFT"}, "confidence": 0.9237534403800964, "cells": [{"id": 16, "text": "Here is an example of using the VERIFY_GROUP_FOR_USER function:", "bbox": {"l": 136.80002, "t": 494.50662, "r": 458.44525000000004, "b": 503.7196, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "list_item", "bbox": {"l": 136.80002, "t": 511.5462, "r": 406.07751, "b": 520.75919, "coord_origin": "TOPLEFT"}, "confidence": 0.9338628649711609, "cells": [{"id": 17, "text": "1.", "bbox": {"l": 136.80002, "t": 511.5462, "r": 145.09804, "b": 520.75919, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "There are user profiles for MGR, JANE, JUDY, and TONY.", "bbox": {"l": 147.86403, "t": 511.5462, "r": 406.07751, "b": 520.75919, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "list_item", "bbox": {"l": 136.80002, "t": 528.5260000000001, "r": 396.98816, "b": 537.739, "coord_origin": "TOPLEFT"}, "confidence": 0.9514462947845459, "cells": [{"id": 19, "text": "2.", "bbox": {"l": 136.80002, "t": 528.5260000000001, "r": 145.23297, "b": 537.739, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "The user profile JANE specifies a group profile of MGR.", "bbox": {"l": 148.04396, "t": 528.5260000000001, "r": 396.98816, "b": 537.739, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "list_item", "bbox": {"l": 136.80002, "t": 545.50581, "r": 536.5686, "b": 566.71861, "coord_origin": "TOPLEFT"}, "confidence": 0.9512302875518799, "cells": [{"id": 21, "text": "3.", "bbox": {"l": 136.80002, "t": 545.50581, "r": 145.18951, "b": 554.71881, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "If a user is connected to the server using user profile JANE, all of the following function ", "bbox": {"l": 147.98601, "t": 545.50581, "r": 536.5686, "b": 554.71881, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "invocations return a value of 1:", "bbox": {"l": 151.20018, "t": 557.50562, "r": 286.84641, "b": 566.71861, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "code", "bbox": {"l": 151.20018, "t": 574.69458, "r": 451.01605, "b": 641.4285600000001, "coord_origin": "TOPLEFT"}, "confidence": 0.706649661064148, "cells": [{"id": 24, "text": "VERIFY_GROUP_FOR_USER (CURRENT_USER, 'MGR')", "bbox": {"l": 151.20018, "t": 574.69458, "r": 366.05725, "b": 583.46933, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "VERIFY_GROUP_FOR_USER (CURRENT_USER, 'JANE', 'MGR')", "bbox": {"l": 151.20018, "t": 586.69438, "r": 406.01678, "b": 595.46913, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "VERIFY_GROUP_FOR_USER (CURRENT_USER, 'JANE', 'MGR', 'STEVE')", "bbox": {"l": 151.20018, "t": 598.69418, "r": 451.01605, "b": 607.46893, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "The following function invocation returns a value of 0:", "bbox": {"l": 151.20018, "t": 615.5246, "r": 385.87271, "b": 624.73759, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "VERIFY_GROUP_FOR_USER (CURRENT_USER, 'JUDY', 'TONY')", "bbox": {"l": 151.20018, "t": 632.65381, "r": 411.05655, "b": 641.4285600000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "table", "bbox": {"l": 63.55636978149414, "t": 104.23387145996094, "r": 548.5687255859375, "b": 296.22467041015625, "coord_origin": "TOPLEFT"}, "confidence": 0.9868634939193726, "cells": [{"id": 29, "text": "Global variable", "bbox": {"l": 70.800003, "t": 110.53801999999985, "r": 134.99071, "b": 118.86298, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Type", "bbox": {"l": 202.8894, "t": 110.53801999999985, "r": 223.34641, "b": 118.86298, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Description", "bbox": {"l": 281.8248, "t": 110.53801999999985, "r": 331.3428, "b": 118.86298, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "CLIENT_HOST", "bbox": {"l": 70.800003, "t": 129.49834999999996, "r": 132.7209, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "VARCHAR(255)", "bbox": {"l": 202.89029, "t": 129.49834999999996, "r": 267.07651, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Host name of the current client as returned by the system", "bbox": {"l": 281.84732, "t": 129.49834999999996, "r": 510.17548, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "CLIENT_IPADDR", "bbox": {"l": 70.800018, "t": 148.51806999999997, "r": 140.66522, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "VARCHAR(128)", "bbox": {"l": 202.87231, "t": 148.51806999999997, "r": 267.07739, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "IP address of the current client as returned by the system", "bbox": {"l": 281.84549, "t": 148.51806999999997, "r": 509.60583, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "CLIENT_PORT ", "bbox": {"l": 70.800018, "t": 167.53778, "r": 134.98264, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "INTEGER", "bbox": {"l": 202.90294, "t": 167.53778, "r": 242.80084, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "Port used by the current client to communicate with the server", "bbox": {"l": 281.79785, "t": 167.53778, "r": 527.59222, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "PACKAGE_NAME", "bbox": {"l": 70.800018, "t": 186.5575, "r": 143.50925, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "VARCHAR(128)", "bbox": {"l": 202.80576, "t": 186.5575, "r": 267.06937, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Name of the currently running package", "bbox": {"l": 281.85187, "t": 186.5575, "r": 436.57259999999997, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "PACKAGE_SCHEMA", "bbox": {"l": 70.800018, "t": 205.51782000000003, "r": 156.01654, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "VARCHAR(128)", "bbox": {"l": 202.83545, "t": 205.51782000000003, "r": 267.08646, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "Schema name of the currently running package", "bbox": {"l": 281.87076, "t": 205.51782000000003, "r": 470.44678, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "PACKAGE_VERSION", "bbox": {"l": 70.800018, "t": 224.53754000000004, "r": 157.89932, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "VARCHAR(64)", "bbox": {"l": 202.72472, "t": 224.53754000000004, "r": 261.98254, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "Version identifier of the currently running package", "bbox": {"l": 281.74924, "t": 224.53754000000004, "r": 478.8438100000001, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "ROUTINE_SCHEMA", "bbox": {"l": 70.800018, "t": 243.55724999999995, "r": 154.41992, "b": 251.8822, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "VARCHAR(128)", "bbox": {"l": 202.79312, "t": 243.55724999999995, "r": 267.09274, "b": 251.8822, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Schema name of the currently running routine", "bbox": {"l": 281.87164, "t": 243.55724999999995, "r": 464.26022, "b": 251.8822, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "ROUTINE_SPECIFIC_NAME", "bbox": {"l": 70.800018, "t": 262.51757999999995, "r": 188.43991, "b": 270.84253, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "VARCHAR(128)", "bbox": {"l": 202.84441, "t": 262.51757999999995, "r": 267.03693, "b": 270.84253, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "Name of the currently running routine", "bbox": {"l": 281.80682, "t": 262.51757999999995, "r": 430.40045, "b": 270.84253, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "ROUTINE_TYPE", "bbox": {"l": 70.800034, "t": 281.53726, "r": 139.43135, "b": 289.86227, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "CHAR(1)", "bbox": {"l": 202.74635, "t": 281.53726, "r": 239.28996000000004, "b": 289.86227, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Type of the currently running routine", "bbox": {"l": 281.79065, "t": 281.53726, "r": 425.09131, "b": 289.86227, "coord_origin": "TOPLEFT"}}], "children": [{"id": 14, "label": "text", "bbox": {"l": 70.800003, "t": 110.53801999999985, "r": 134.99071, "b": 118.86298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "Global variable", "bbox": {"l": 70.800003, "t": 110.53801999999985, "r": 134.99071, "b": 118.86298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 202.8894, "t": 110.53801999999985, "r": 223.34641, "b": 118.86298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "Type", "bbox": {"l": 202.8894, "t": 110.53801999999985, "r": 223.34641, "b": 118.86298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 281.8248, "t": 110.53801999999985, "r": 331.3428, "b": 118.86298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "Description", "bbox": {"l": 281.8248, "t": 110.53801999999985, "r": 331.3428, "b": 118.86298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 70.800003, "t": 129.49834999999996, "r": 132.7209, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "CLIENT_HOST", "bbox": {"l": 70.800003, "t": 129.49834999999996, "r": 132.7209, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 202.89029, "t": 129.49834999999996, "r": 267.07651, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "VARCHAR(255)", "bbox": {"l": 202.89029, "t": 129.49834999999996, "r": 267.07651, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 281.84732, "t": 129.49834999999996, "r": 510.17548, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "Host name of the current client as returned by the system", "bbox": {"l": 281.84732, "t": 129.49834999999996, "r": 510.17548, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 70.800018, "t": 148.51806999999997, "r": 140.66522, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "CLIENT_IPADDR", "bbox": {"l": 70.800018, "t": 148.51806999999997, "r": 140.66522, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 202.87231, "t": 148.51806999999997, "r": 267.07739, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "VARCHAR(128)", "bbox": {"l": 202.87231, "t": 148.51806999999997, "r": 267.07739, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 281.84549, "t": 148.51806999999997, "r": 509.60583, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "IP address of the current client as returned by the system", "bbox": {"l": 281.84549, "t": 148.51806999999997, "r": 509.60583, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 70.800018, "t": 167.53778, "r": 134.98264, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "CLIENT_PORT ", "bbox": {"l": 70.800018, "t": 167.53778, "r": 134.98264, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 202.90294, "t": 167.53778, "r": 242.80084, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "INTEGER", "bbox": {"l": 202.90294, "t": 167.53778, "r": 242.80084, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 281.79785, "t": 167.53778, "r": 527.59222, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "Port used by the current client to communicate with the server", "bbox": {"l": 281.79785, "t": 167.53778, "r": 527.59222, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 70.800018, "t": 186.5575, "r": 143.50925, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "PACKAGE_NAME", "bbox": {"l": 70.800018, "t": 186.5575, "r": 143.50925, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 202.80576, "t": 186.5575, "r": 267.06937, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "VARCHAR(128)", "bbox": {"l": 202.80576, "t": 186.5575, "r": 267.06937, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 281.85187, "t": 186.5575, "r": 436.57259999999997, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "Name of the currently running package", "bbox": {"l": 281.85187, "t": 186.5575, "r": 436.57259999999997, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 70.800018, "t": 205.51782000000003, "r": 156.01654, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "PACKAGE_SCHEMA", "bbox": {"l": 70.800018, "t": 205.51782000000003, "r": 156.01654, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 202.83545, "t": 205.51782000000003, "r": 267.08646, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "VARCHAR(128)", "bbox": {"l": 202.83545, "t": 205.51782000000003, "r": 267.08646, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 281.87076, "t": 205.51782000000003, "r": 470.44678, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "Schema name of the currently running package", "bbox": {"l": 281.87076, "t": 205.51782000000003, "r": 470.44678, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 70.800018, "t": 224.53754000000004, "r": 157.89932, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "PACKAGE_VERSION", "bbox": {"l": 70.800018, "t": 224.53754000000004, "r": 157.89932, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 202.72472, "t": 224.53754000000004, "r": 261.98254, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "VARCHAR(64)", "bbox": {"l": 202.72472, "t": 224.53754000000004, "r": 261.98254, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 281.74924, "t": 224.53754000000004, "r": 478.8438100000001, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "Version identifier of the currently running package", "bbox": {"l": 281.74924, "t": 224.53754000000004, "r": 478.8438100000001, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 70.800018, "t": 243.55724999999995, "r": 154.41992, "b": 251.8822, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "ROUTINE_SCHEMA", "bbox": {"l": 70.800018, "t": 243.55724999999995, "r": 154.41992, "b": 251.8822, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 202.79312, "t": 243.55724999999995, "r": 267.09274, "b": 251.8822, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "VARCHAR(128)", "bbox": {"l": 202.79312, "t": 243.55724999999995, "r": 267.09274, "b": 251.8822, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 281.87164, "t": 243.55724999999995, "r": 464.26022, "b": 251.8822, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "Schema name of the currently running routine", "bbox": {"l": 281.87164, "t": 243.55724999999995, "r": 464.26022, "b": 251.8822, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 70.800018, "t": 262.51757999999995, "r": 188.43991, "b": 270.84253, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "ROUTINE_SPECIFIC_NAME", "bbox": {"l": 70.800018, "t": 262.51757999999995, "r": 188.43991, "b": 270.84253, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 202.84441, "t": 262.51757999999995, "r": 267.03693, "b": 270.84253, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "VARCHAR(128)", "bbox": {"l": 202.84441, "t": 262.51757999999995, "r": 267.03693, "b": 270.84253, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 281.80682, "t": 262.51757999999995, "r": 430.40045, "b": 270.84253, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "Name of the currently running routine", "bbox": {"l": 281.80682, "t": 262.51757999999995, "r": 430.40045, "b": 270.84253, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 70.800034, "t": 281.53726, "r": 139.43135, "b": 289.86227, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "ROUTINE_TYPE", "bbox": {"l": 70.800034, "t": 281.53726, "r": 139.43135, "b": 289.86227, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 202.74635, "t": 281.53726, "r": 239.28996000000004, "b": 289.86227, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "CHAR(1)", "bbox": {"l": 202.74635, "t": 281.53726, "r": 239.28996000000004, "b": 289.86227, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 281.79065, "t": 281.53726, "r": 425.09131, "b": 289.86227, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "Type of the currently running routine", "bbox": {"l": 281.79065, "t": 281.53726, "r": 425.09131, "b": 289.86227, "coord_origin": "TOPLEFT"}}], "children": []}]}]}, "tablestructure": {"table_map": {"0": {"label": "table", "id": 0, "page_no": 11, "cluster": {"id": 0, "label": "table", "bbox": {"l": 63.55636978149414, "t": 104.23387145996094, "r": 548.5687255859375, "b": 296.22467041015625, "coord_origin": "TOPLEFT"}, "confidence": 0.9868634939193726, "cells": [{"id": 29, "text": "Global variable", "bbox": {"l": 70.800003, "t": 110.53801999999985, "r": 134.99071, "b": 118.86298, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Type", "bbox": {"l": 202.8894, "t": 110.53801999999985, "r": 223.34641, "b": 118.86298, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Description", "bbox": {"l": 281.8248, "t": 110.53801999999985, "r": 331.3428, "b": 118.86298, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "CLIENT_HOST", "bbox": {"l": 70.800003, "t": 129.49834999999996, "r": 132.7209, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "VARCHAR(255)", "bbox": {"l": 202.89029, "t": 129.49834999999996, "r": 267.07651, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Host name of the current client as returned by the system", "bbox": {"l": 281.84732, "t": 129.49834999999996, "r": 510.17548, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "CLIENT_IPADDR", "bbox": {"l": 70.800018, "t": 148.51806999999997, "r": 140.66522, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "VARCHAR(128)", "bbox": {"l": 202.87231, "t": 148.51806999999997, "r": 267.07739, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "IP address of the current client as returned by the system", "bbox": {"l": 281.84549, "t": 148.51806999999997, "r": 509.60583, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "CLIENT_PORT ", "bbox": {"l": 70.800018, "t": 167.53778, "r": 134.98264, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "INTEGER", "bbox": {"l": 202.90294, "t": 167.53778, "r": 242.80084, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "Port used by the current client to communicate with the server", "bbox": {"l": 281.79785, "t": 167.53778, "r": 527.59222, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "PACKAGE_NAME", "bbox": {"l": 70.800018, "t": 186.5575, "r": 143.50925, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "VARCHAR(128)", "bbox": {"l": 202.80576, "t": 186.5575, "r": 267.06937, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Name of the currently running package", "bbox": {"l": 281.85187, "t": 186.5575, "r": 436.57259999999997, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "PACKAGE_SCHEMA", "bbox": {"l": 70.800018, "t": 205.51782000000003, "r": 156.01654, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "VARCHAR(128)", "bbox": {"l": 202.83545, "t": 205.51782000000003, "r": 267.08646, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "Schema name of the currently running package", "bbox": {"l": 281.87076, "t": 205.51782000000003, "r": 470.44678, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "PACKAGE_VERSION", "bbox": {"l": 70.800018, "t": 224.53754000000004, "r": 157.89932, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "VARCHAR(64)", "bbox": {"l": 202.72472, "t": 224.53754000000004, "r": 261.98254, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "Version identifier of the currently running package", "bbox": {"l": 281.74924, "t": 224.53754000000004, "r": 478.8438100000001, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "ROUTINE_SCHEMA", "bbox": {"l": 70.800018, "t": 243.55724999999995, "r": 154.41992, "b": 251.8822, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "VARCHAR(128)", "bbox": {"l": 202.79312, "t": 243.55724999999995, "r": 267.09274, "b": 251.8822, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Schema name of the currently running routine", "bbox": {"l": 281.87164, "t": 243.55724999999995, "r": 464.26022, "b": 251.8822, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "ROUTINE_SPECIFIC_NAME", "bbox": {"l": 70.800018, "t": 262.51757999999995, "r": 188.43991, "b": 270.84253, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "VARCHAR(128)", "bbox": {"l": 202.84441, "t": 262.51757999999995, "r": 267.03693, "b": 270.84253, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "Name of the currently running routine", "bbox": {"l": 281.80682, "t": 262.51757999999995, "r": 430.40045, "b": 270.84253, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "ROUTINE_TYPE", "bbox": {"l": 70.800034, "t": 281.53726, "r": 139.43135, "b": 289.86227, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "CHAR(1)", "bbox": {"l": 202.74635, "t": 281.53726, "r": 239.28996000000004, "b": 289.86227, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Type of the currently running routine", "bbox": {"l": 281.79065, "t": 281.53726, "r": 425.09131, "b": 289.86227, "coord_origin": "TOPLEFT"}}], "children": [{"id": 14, "label": "text", "bbox": {"l": 70.800003, "t": 110.53801999999985, "r": 134.99071, "b": 118.86298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "Global variable", "bbox": {"l": 70.800003, "t": 110.53801999999985, "r": 134.99071, "b": 118.86298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 202.8894, "t": 110.53801999999985, "r": 223.34641, "b": 118.86298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "Type", "bbox": {"l": 202.8894, "t": 110.53801999999985, "r": 223.34641, "b": 118.86298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 281.8248, "t": 110.53801999999985, "r": 331.3428, "b": 118.86298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "Description", "bbox": {"l": 281.8248, "t": 110.53801999999985, "r": 331.3428, "b": 118.86298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 70.800003, "t": 129.49834999999996, "r": 132.7209, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "CLIENT_HOST", "bbox": {"l": 70.800003, "t": 129.49834999999996, "r": 132.7209, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 202.89029, "t": 129.49834999999996, "r": 267.07651, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "VARCHAR(255)", "bbox": {"l": 202.89029, "t": 129.49834999999996, "r": 267.07651, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 281.84732, "t": 129.49834999999996, "r": 510.17548, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "Host name of the current client as returned by the system", "bbox": {"l": 281.84732, "t": 129.49834999999996, "r": 510.17548, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 70.800018, "t": 148.51806999999997, "r": 140.66522, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "CLIENT_IPADDR", "bbox": {"l": 70.800018, "t": 148.51806999999997, "r": 140.66522, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 202.87231, "t": 148.51806999999997, "r": 267.07739, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "VARCHAR(128)", "bbox": {"l": 202.87231, "t": 148.51806999999997, "r": 267.07739, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 281.84549, "t": 148.51806999999997, "r": 509.60583, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "IP address of the current client as returned by the system", "bbox": {"l": 281.84549, "t": 148.51806999999997, "r": 509.60583, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 70.800018, "t": 167.53778, "r": 134.98264, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "CLIENT_PORT ", "bbox": {"l": 70.800018, "t": 167.53778, "r": 134.98264, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 202.90294, "t": 167.53778, "r": 242.80084, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "INTEGER", "bbox": {"l": 202.90294, "t": 167.53778, "r": 242.80084, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 281.79785, "t": 167.53778, "r": 527.59222, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "Port used by the current client to communicate with the server", "bbox": {"l": 281.79785, "t": 167.53778, "r": 527.59222, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 70.800018, "t": 186.5575, "r": 143.50925, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "PACKAGE_NAME", "bbox": {"l": 70.800018, "t": 186.5575, "r": 143.50925, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 202.80576, "t": 186.5575, "r": 267.06937, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "VARCHAR(128)", "bbox": {"l": 202.80576, "t": 186.5575, "r": 267.06937, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 281.85187, "t": 186.5575, "r": 436.57259999999997, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "Name of the currently running package", "bbox": {"l": 281.85187, "t": 186.5575, "r": 436.57259999999997, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 70.800018, "t": 205.51782000000003, "r": 156.01654, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "PACKAGE_SCHEMA", "bbox": {"l": 70.800018, "t": 205.51782000000003, "r": 156.01654, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 202.83545, "t": 205.51782000000003, "r": 267.08646, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "VARCHAR(128)", "bbox": {"l": 202.83545, "t": 205.51782000000003, "r": 267.08646, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 281.87076, "t": 205.51782000000003, "r": 470.44678, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "Schema name of the currently running package", "bbox": {"l": 281.87076, "t": 205.51782000000003, "r": 470.44678, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 70.800018, "t": 224.53754000000004, "r": 157.89932, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "PACKAGE_VERSION", "bbox": {"l": 70.800018, "t": 224.53754000000004, "r": 157.89932, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 202.72472, "t": 224.53754000000004, "r": 261.98254, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "VARCHAR(64)", "bbox": {"l": 202.72472, "t": 224.53754000000004, "r": 261.98254, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 281.74924, "t": 224.53754000000004, "r": 478.8438100000001, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "Version identifier of the currently running package", "bbox": {"l": 281.74924, "t": 224.53754000000004, "r": 478.8438100000001, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 70.800018, "t": 243.55724999999995, "r": 154.41992, "b": 251.8822, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "ROUTINE_SCHEMA", "bbox": {"l": 70.800018, "t": 243.55724999999995, "r": 154.41992, "b": 251.8822, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 202.79312, "t": 243.55724999999995, "r": 267.09274, "b": 251.8822, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "VARCHAR(128)", "bbox": {"l": 202.79312, "t": 243.55724999999995, "r": 267.09274, "b": 251.8822, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 281.87164, "t": 243.55724999999995, "r": 464.26022, "b": 251.8822, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "Schema name of the currently running routine", "bbox": {"l": 281.87164, "t": 243.55724999999995, "r": 464.26022, "b": 251.8822, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 70.800018, "t": 262.51757999999995, "r": 188.43991, "b": 270.84253, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "ROUTINE_SPECIFIC_NAME", "bbox": {"l": 70.800018, "t": 262.51757999999995, "r": 188.43991, "b": 270.84253, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 202.84441, "t": 262.51757999999995, "r": 267.03693, "b": 270.84253, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "VARCHAR(128)", "bbox": {"l": 202.84441, "t": 262.51757999999995, "r": 267.03693, "b": 270.84253, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 281.80682, "t": 262.51757999999995, "r": 430.40045, "b": 270.84253, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "Name of the currently running routine", "bbox": {"l": 281.80682, "t": 262.51757999999995, "r": 430.40045, "b": 270.84253, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 70.800034, "t": 281.53726, "r": 139.43135, "b": 289.86227, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "ROUTINE_TYPE", "bbox": {"l": 70.800034, "t": 281.53726, "r": 139.43135, "b": 289.86227, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 202.74635, "t": 281.53726, "r": 239.28996000000004, "b": 289.86227, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "CHAR(1)", "bbox": {"l": 202.74635, "t": 281.53726, "r": 239.28996000000004, "b": 289.86227, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 281.79065, "t": 281.53726, "r": 425.09131, "b": 289.86227, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "Type of the currently running routine", "bbox": {"l": 281.79065, "t": 281.53726, "r": 425.09131, "b": 289.86227, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl"], "num_rows": 10, "num_cols": 3, "table_cells": [{"bbox": {"l": 70.800003, "t": 110.53801999999985, "r": 134.99071, "b": 118.86298, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Global variable", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 202.8894, "t": 110.53801999999985, "r": 223.34641, "b": 118.86298, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Type", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 281.8248, "t": 110.53801999999985, "r": 331.3428, "b": 118.86298, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Description", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800003, "t": 129.49834999999996, "r": 132.7209, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "CLIENT_HOST", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.89029, "t": 129.49834999999996, "r": 267.07651, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(255)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.84732, "t": 129.49834999999996, "r": 510.17548, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Host name of the current client as returned by the system", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800018, "t": 148.51806999999997, "r": 140.66522, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "CLIENT_IPADDR", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.87231, "t": 148.51806999999997, "r": 267.07739, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(128)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.84549, "t": 148.51806999999997, "r": 509.60583, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "IP address of the current client as returned by the system", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800018, "t": 167.53778, "r": 134.98264, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "CLIENT_PORT", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.90294, "t": 167.53778, "r": 242.80084, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "INTEGER", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.79785, "t": 167.53778, "r": 527.59222, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Port used by the current client to communicate with the server", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800018, "t": 186.5575, "r": 143.50925, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PACKAGE_NAME", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.80576, "t": 186.5575, "r": 267.06937, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(128)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.85187, "t": 186.5575, "r": 436.57259999999997, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Name of the currently running package", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800018, "t": 205.51782000000003, "r": 156.01654, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PACKAGE_SCHEMA", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.83545, "t": 205.51782000000003, "r": 267.08646, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(128)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.87076, "t": 205.51782000000003, "r": 470.44678, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Schema name of the currently running package", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800018, "t": 224.53754000000004, "r": 157.89932, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PACKAGE_VERSION", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.72472, "t": 224.53754000000004, "r": 261.98254, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(64)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.74924, "t": 224.53754000000004, "r": 478.8438100000001, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Version identifier of the currently running package", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800018, "t": 243.55724999999995, "r": 154.41992, "b": 251.8822, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "ROUTINE_SCHEMA", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.79312, "t": 243.55724999999995, "r": 267.09274, "b": 251.8822, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(128)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.87164, "t": 243.55724999999995, "r": 464.26022, "b": 251.8822, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Schema name of the currently running routine", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800018, "t": 262.51757999999995, "r": 188.43991, "b": 270.84253, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "ROUTINE_SPECIFIC_NAME", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.84441, "t": 262.51757999999995, "r": 267.03693, "b": 270.84253, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(128)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.80682, "t": 262.51757999999995, "r": 430.40045, "b": 270.84253, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Name of the currently running routine", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800034, "t": 281.53726, "r": 139.43135, "b": 289.86227, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "ROUTINE_TYPE", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.74635, "t": 281.53726, "r": 239.28996000000004, "b": 289.86227, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "CHAR(1)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.79065, "t": 281.53726, "r": 425.09131, "b": 289.86227, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Type of the currently running routine", "column_header": false, "row_header": false, "row_section": false}]}}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_footer", "id": 9, "page_no": 11, "cluster": {"id": 9, "label": "page_footer", "bbox": {"l": 64.800003, "t": 754.848721, "r": 78.402, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.9187921285629272, "cells": [{"id": 0, "text": "20 ", "bbox": {"l": 64.800003, "t": 754.848721, "r": 78.402, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "20"}, {"label": "page_footer", "id": 6, "page_no": 11, "cluster": {"id": 6, "label": "page_footer", "bbox": {"l": 93.420303, "t": 755.538002, "r": 334.42142, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9505080580711365, "cells": [{"id": 1, "text": "Row and Column Access Control Support in IBM DB2 for i", "bbox": {"l": 93.420303, "t": 755.538002, "r": 334.42142, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Row and Column Access Control Support in IBM DB2 for i"}, {"label": "text", "id": 11, "page_no": 11, "cluster": {"id": 11, "label": "text", "bbox": {"l": 136.8, "t": 71.50867000000005, "r": 342.54773, "b": 80.72167999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.8370980620384216, "cells": [{"id": 2, "text": "Table 3-2 lists the nine built-in global variables.", "bbox": {"l": 136.8, "t": 71.50867000000005, "r": 342.54773, "b": 80.72167999999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 3-2 lists the nine built-in global variables."}, {"label": "caption", "id": 10, "page_no": 11, "cluster": {"id": 10, "label": "caption", "bbox": {"l": 64.800003, "t": 93.49805000000003, "r": 201.18147, "b": 101.82299999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.9132355451583862, "cells": [{"id": 3, "text": "Table 3-2 Built-in global variables", "bbox": {"l": 64.800003, "t": 93.49805000000003, "r": 201.18147, "b": 101.82299999999998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 3-2 Built-in global variables"}, {"label": "section_header", "id": 3, "page_no": 11, "cluster": {"id": 3, "label": "section_header", "bbox": {"l": 64.800003, "t": 322.20071, "r": 384.36389, "b": 336.96371000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9645338654518127, "cells": [{"id": 4, "text": "3.3", "bbox": {"l": 64.800003, "t": 322.20071, "r": 87.318192, "b": 336.96371000000005, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "VERIFY_GROUP_FOR_USER function", "bbox": {"l": 91.821815, "t": 322.20071, "r": 384.36389, "b": 336.96371000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3.3 VERIFY_GROUP_FOR_USER function"}, {"label": "text", "id": 1, "page_no": 11, "cluster": {"id": 1, "label": "text", "bbox": {"l": 136.8, "t": 354.52872, "r": 547.23474, "b": 435.74060000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9864333868026733, "cells": [{"id": 6, "text": "The VERIFY_GROUP_FOR_USER function was added in IBM i 7.2. Although it is primarily ", "bbox": {"l": 136.8, "t": 354.52872, "r": 542.83539, "b": 363.7417, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "intended for use with RCAC permissions and masks, it can be used in other SQL statements. ", "bbox": {"l": 136.8, "t": 366.52853, "r": 547.14783, "b": 375.74152, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "The first parameter must be one of these three special registers: SESSION_USER, USER, or ", "bbox": {"l": 136.8, "t": 378.52835, "r": 547.15106, "b": 387.74132999999995, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "CURRENT_USER. The second and subsequent parameters are a list of user or group ", "bbox": {"l": 136.80002, "t": 390.52817, "r": 520.62958, "b": 399.74115000000006, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "profiles. Each of these values must be 1 - 10 characters in length. These values are not ", "bbox": {"l": 136.80002, "t": 402.52798, "r": 524.88824, "b": 411.74097, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "validated for their existence, which means that you can specify the names of user profiles that ", "bbox": {"l": 136.80002, "t": 414.5278, "r": 547.23474, "b": 423.7407799999999, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "do not exist without receiving any kind of error.", "bbox": {"l": 136.80002, "t": 426.52762, "r": 342.04672, "b": 435.74060000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The VERIFY_GROUP_FOR_USER function was added in IBM i 7.2. Although it is primarily intended for use with RCAC permissions and masks, it can be used in other SQL statements. The first parameter must be one of these three special registers: SESSION_USER, USER, or CURRENT_USER. The second and subsequent parameters are a list of user or group profiles. Each of these values must be 1 - 10 characters in length. These values are not validated for their existence, which means that you can specify the names of user profiles that do not exist without receiving any kind of error."}, {"label": "text", "id": 2, "page_no": 11, "cluster": {"id": 2, "label": "text", "bbox": {"l": 136.80002, "t": 448.48743, "r": 547.25739, "b": 481.70004, "coord_origin": "TOPLEFT"}, "confidence": 0.9807308912277222, "cells": [{"id": 13, "text": "If a special register value is in the list of user profiles or it is a member of a group profile ", "bbox": {"l": 136.80002, "t": 448.48743, "r": 525.1474, "b": 457.70041, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "included in the list, the function returns a long integer value of 1. Otherwise, it returns a value ", "bbox": {"l": 136.80002, "t": 460.48724, "r": 547.25739, "b": 469.70023, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "of 0. It never returns the null value.", "bbox": {"l": 136.80002, "t": 472.48706, "r": 289.84335, "b": 481.70004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "If a special register value is in the list of user profiles or it is a member of a group profile included in the list, the function returns a long integer value of 1. Otherwise, it returns a value of 0. It never returns the null value."}, {"label": "text", "id": 8, "page_no": 11, "cluster": {"id": 8, "label": "text", "bbox": {"l": 136.80002, "t": 494.50662, "r": 458.44525000000004, "b": 503.7196, "coord_origin": "TOPLEFT"}, "confidence": 0.9237534403800964, "cells": [{"id": 16, "text": "Here is an example of using the VERIFY_GROUP_FOR_USER function:", "bbox": {"l": 136.80002, "t": 494.50662, "r": 458.44525000000004, "b": 503.7196, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Here is an example of using the VERIFY_GROUP_FOR_USER function:"}, {"label": "list_item", "id": 7, "page_no": 11, "cluster": {"id": 7, "label": "list_item", "bbox": {"l": 136.80002, "t": 511.5462, "r": 406.07751, "b": 520.75919, "coord_origin": "TOPLEFT"}, "confidence": 0.9338628649711609, "cells": [{"id": 17, "text": "1.", "bbox": {"l": 136.80002, "t": 511.5462, "r": 145.09804, "b": 520.75919, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "There are user profiles for MGR, JANE, JUDY, and TONY.", "bbox": {"l": 147.86403, "t": 511.5462, "r": 406.07751, "b": 520.75919, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1. There are user profiles for MGR, JANE, JUDY, and TONY."}, {"label": "list_item", "id": 4, "page_no": 11, "cluster": {"id": 4, "label": "list_item", "bbox": {"l": 136.80002, "t": 528.5260000000001, "r": 396.98816, "b": 537.739, "coord_origin": "TOPLEFT"}, "confidence": 0.9514462947845459, "cells": [{"id": 19, "text": "2.", "bbox": {"l": 136.80002, "t": 528.5260000000001, "r": 145.23297, "b": 537.739, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "The user profile JANE specifies a group profile of MGR.", "bbox": {"l": 148.04396, "t": 528.5260000000001, "r": 396.98816, "b": 537.739, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2. The user profile JANE specifies a group profile of MGR."}, {"label": "list_item", "id": 5, "page_no": 11, "cluster": {"id": 5, "label": "list_item", "bbox": {"l": 136.80002, "t": 545.50581, "r": 536.5686, "b": 566.71861, "coord_origin": "TOPLEFT"}, "confidence": 0.9512302875518799, "cells": [{"id": 21, "text": "3.", "bbox": {"l": 136.80002, "t": 545.50581, "r": 145.18951, "b": 554.71881, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "If a user is connected to the server using user profile JANE, all of the following function ", "bbox": {"l": 147.98601, "t": 545.50581, "r": 536.5686, "b": 554.71881, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "invocations return a value of 1:", "bbox": {"l": 151.20018, "t": 557.50562, "r": 286.84641, "b": 566.71861, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3. If a user is connected to the server using user profile JANE, all of the following function invocations return a value of 1:"}, {"label": "code", "id": 12, "page_no": 11, "cluster": {"id": 12, "label": "code", "bbox": {"l": 151.20018, "t": 574.69458, "r": 451.01605, "b": 641.4285600000001, "coord_origin": "TOPLEFT"}, "confidence": 0.706649661064148, "cells": [{"id": 24, "text": "VERIFY_GROUP_FOR_USER (CURRENT_USER, 'MGR')", "bbox": {"l": 151.20018, "t": 574.69458, "r": 366.05725, "b": 583.46933, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "VERIFY_GROUP_FOR_USER (CURRENT_USER, 'JANE', 'MGR')", "bbox": {"l": 151.20018, "t": 586.69438, "r": 406.01678, "b": 595.46913, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "VERIFY_GROUP_FOR_USER (CURRENT_USER, 'JANE', 'MGR', 'STEVE')", "bbox": {"l": 151.20018, "t": 598.69418, "r": 451.01605, "b": 607.46893, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "The following function invocation returns a value of 0:", "bbox": {"l": 151.20018, "t": 615.5246, "r": 385.87271, "b": 624.73759, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "VERIFY_GROUP_FOR_USER (CURRENT_USER, 'JUDY', 'TONY')", "bbox": {"l": 151.20018, "t": 632.65381, "r": 411.05655, "b": 641.4285600000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "VERIFY_GROUP_FOR_USER (CURRENT_USER, 'MGR') VERIFY_GROUP_FOR_USER (CURRENT_USER, 'JANE', 'MGR') VERIFY_GROUP_FOR_USER (CURRENT_USER, 'JANE', 'MGR', 'STEVE') The following function invocation returns a value of 0: VERIFY_GROUP_FOR_USER (CURRENT_USER, 'JUDY', 'TONY')"}, {"label": "table", "id": 0, "page_no": 11, "cluster": {"id": 0, "label": "table", "bbox": {"l": 63.55636978149414, "t": 104.23387145996094, "r": 548.5687255859375, "b": 296.22467041015625, "coord_origin": "TOPLEFT"}, "confidence": 0.9868634939193726, "cells": [{"id": 29, "text": "Global variable", "bbox": {"l": 70.800003, "t": 110.53801999999985, "r": 134.99071, "b": 118.86298, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Type", "bbox": {"l": 202.8894, "t": 110.53801999999985, "r": 223.34641, "b": 118.86298, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Description", "bbox": {"l": 281.8248, "t": 110.53801999999985, "r": 331.3428, "b": 118.86298, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "CLIENT_HOST", "bbox": {"l": 70.800003, "t": 129.49834999999996, "r": 132.7209, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "VARCHAR(255)", "bbox": {"l": 202.89029, "t": 129.49834999999996, "r": 267.07651, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Host name of the current client as returned by the system", "bbox": {"l": 281.84732, "t": 129.49834999999996, "r": 510.17548, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "CLIENT_IPADDR", "bbox": {"l": 70.800018, "t": 148.51806999999997, "r": 140.66522, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "VARCHAR(128)", "bbox": {"l": 202.87231, "t": 148.51806999999997, "r": 267.07739, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "IP address of the current client as returned by the system", "bbox": {"l": 281.84549, "t": 148.51806999999997, "r": 509.60583, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "CLIENT_PORT ", "bbox": {"l": 70.800018, "t": 167.53778, "r": 134.98264, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "INTEGER", "bbox": {"l": 202.90294, "t": 167.53778, "r": 242.80084, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "Port used by the current client to communicate with the server", "bbox": {"l": 281.79785, "t": 167.53778, "r": 527.59222, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "PACKAGE_NAME", "bbox": {"l": 70.800018, "t": 186.5575, "r": 143.50925, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "VARCHAR(128)", "bbox": {"l": 202.80576, "t": 186.5575, "r": 267.06937, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Name of the currently running package", "bbox": {"l": 281.85187, "t": 186.5575, "r": 436.57259999999997, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "PACKAGE_SCHEMA", "bbox": {"l": 70.800018, "t": 205.51782000000003, "r": 156.01654, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "VARCHAR(128)", "bbox": {"l": 202.83545, "t": 205.51782000000003, "r": 267.08646, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "Schema name of the currently running package", "bbox": {"l": 281.87076, "t": 205.51782000000003, "r": 470.44678, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "PACKAGE_VERSION", "bbox": {"l": 70.800018, "t": 224.53754000000004, "r": 157.89932, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "VARCHAR(64)", "bbox": {"l": 202.72472, "t": 224.53754000000004, "r": 261.98254, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "Version identifier of the currently running package", "bbox": {"l": 281.74924, "t": 224.53754000000004, "r": 478.8438100000001, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "ROUTINE_SCHEMA", "bbox": {"l": 70.800018, "t": 243.55724999999995, "r": 154.41992, "b": 251.8822, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "VARCHAR(128)", "bbox": {"l": 202.79312, "t": 243.55724999999995, "r": 267.09274, "b": 251.8822, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Schema name of the currently running routine", "bbox": {"l": 281.87164, "t": 243.55724999999995, "r": 464.26022, "b": 251.8822, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "ROUTINE_SPECIFIC_NAME", "bbox": {"l": 70.800018, "t": 262.51757999999995, "r": 188.43991, "b": 270.84253, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "VARCHAR(128)", "bbox": {"l": 202.84441, "t": 262.51757999999995, "r": 267.03693, "b": 270.84253, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "Name of the currently running routine", "bbox": {"l": 281.80682, "t": 262.51757999999995, "r": 430.40045, "b": 270.84253, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "ROUTINE_TYPE", "bbox": {"l": 70.800034, "t": 281.53726, "r": 139.43135, "b": 289.86227, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "CHAR(1)", "bbox": {"l": 202.74635, "t": 281.53726, "r": 239.28996000000004, "b": 289.86227, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Type of the currently running routine", "bbox": {"l": 281.79065, "t": 281.53726, "r": 425.09131, "b": 289.86227, "coord_origin": "TOPLEFT"}}], "children": [{"id": 14, "label": "text", "bbox": {"l": 70.800003, "t": 110.53801999999985, "r": 134.99071, "b": 118.86298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "Global variable", "bbox": {"l": 70.800003, "t": 110.53801999999985, "r": 134.99071, "b": 118.86298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 202.8894, "t": 110.53801999999985, "r": 223.34641, "b": 118.86298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "Type", "bbox": {"l": 202.8894, "t": 110.53801999999985, "r": 223.34641, "b": 118.86298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 281.8248, "t": 110.53801999999985, "r": 331.3428, "b": 118.86298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "Description", "bbox": {"l": 281.8248, "t": 110.53801999999985, "r": 331.3428, "b": 118.86298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 70.800003, "t": 129.49834999999996, "r": 132.7209, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "CLIENT_HOST", "bbox": {"l": 70.800003, "t": 129.49834999999996, "r": 132.7209, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 202.89029, "t": 129.49834999999996, "r": 267.07651, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "VARCHAR(255)", "bbox": {"l": 202.89029, "t": 129.49834999999996, "r": 267.07651, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 281.84732, "t": 129.49834999999996, "r": 510.17548, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "Host name of the current client as returned by the system", "bbox": {"l": 281.84732, "t": 129.49834999999996, "r": 510.17548, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 70.800018, "t": 148.51806999999997, "r": 140.66522, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "CLIENT_IPADDR", "bbox": {"l": 70.800018, "t": 148.51806999999997, "r": 140.66522, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 202.87231, "t": 148.51806999999997, "r": 267.07739, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "VARCHAR(128)", "bbox": {"l": 202.87231, "t": 148.51806999999997, "r": 267.07739, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 281.84549, "t": 148.51806999999997, "r": 509.60583, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "IP address of the current client as returned by the system", "bbox": {"l": 281.84549, "t": 148.51806999999997, "r": 509.60583, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 70.800018, "t": 167.53778, "r": 134.98264, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "CLIENT_PORT ", "bbox": {"l": 70.800018, "t": 167.53778, "r": 134.98264, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 202.90294, "t": 167.53778, "r": 242.80084, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "INTEGER", "bbox": {"l": 202.90294, "t": 167.53778, "r": 242.80084, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 281.79785, "t": 167.53778, "r": 527.59222, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "Port used by the current client to communicate with the server", "bbox": {"l": 281.79785, "t": 167.53778, "r": 527.59222, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 70.800018, "t": 186.5575, "r": 143.50925, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "PACKAGE_NAME", "bbox": {"l": 70.800018, "t": 186.5575, "r": 143.50925, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 202.80576, "t": 186.5575, "r": 267.06937, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "VARCHAR(128)", "bbox": {"l": 202.80576, "t": 186.5575, "r": 267.06937, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 281.85187, "t": 186.5575, "r": 436.57259999999997, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "Name of the currently running package", "bbox": {"l": 281.85187, "t": 186.5575, "r": 436.57259999999997, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 70.800018, "t": 205.51782000000003, "r": 156.01654, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "PACKAGE_SCHEMA", "bbox": {"l": 70.800018, "t": 205.51782000000003, "r": 156.01654, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 202.83545, "t": 205.51782000000003, "r": 267.08646, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "VARCHAR(128)", "bbox": {"l": 202.83545, "t": 205.51782000000003, "r": 267.08646, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 281.87076, "t": 205.51782000000003, "r": 470.44678, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "Schema name of the currently running package", "bbox": {"l": 281.87076, "t": 205.51782000000003, "r": 470.44678, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 70.800018, "t": 224.53754000000004, "r": 157.89932, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "PACKAGE_VERSION", "bbox": {"l": 70.800018, "t": 224.53754000000004, "r": 157.89932, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 202.72472, "t": 224.53754000000004, "r": 261.98254, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "VARCHAR(64)", "bbox": {"l": 202.72472, "t": 224.53754000000004, "r": 261.98254, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 281.74924, "t": 224.53754000000004, "r": 478.8438100000001, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "Version identifier of the currently running package", "bbox": {"l": 281.74924, "t": 224.53754000000004, "r": 478.8438100000001, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 70.800018, "t": 243.55724999999995, "r": 154.41992, "b": 251.8822, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "ROUTINE_SCHEMA", "bbox": {"l": 70.800018, "t": 243.55724999999995, "r": 154.41992, "b": 251.8822, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 202.79312, "t": 243.55724999999995, "r": 267.09274, "b": 251.8822, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "VARCHAR(128)", "bbox": {"l": 202.79312, "t": 243.55724999999995, "r": 267.09274, "b": 251.8822, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 281.87164, "t": 243.55724999999995, "r": 464.26022, "b": 251.8822, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "Schema name of the currently running routine", "bbox": {"l": 281.87164, "t": 243.55724999999995, "r": 464.26022, "b": 251.8822, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 70.800018, "t": 262.51757999999995, "r": 188.43991, "b": 270.84253, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "ROUTINE_SPECIFIC_NAME", "bbox": {"l": 70.800018, "t": 262.51757999999995, "r": 188.43991, "b": 270.84253, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 202.84441, "t": 262.51757999999995, "r": 267.03693, "b": 270.84253, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "VARCHAR(128)", "bbox": {"l": 202.84441, "t": 262.51757999999995, "r": 267.03693, "b": 270.84253, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 281.80682, "t": 262.51757999999995, "r": 430.40045, "b": 270.84253, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "Name of the currently running routine", "bbox": {"l": 281.80682, "t": 262.51757999999995, "r": 430.40045, "b": 270.84253, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 70.800034, "t": 281.53726, "r": 139.43135, "b": 289.86227, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "ROUTINE_TYPE", "bbox": {"l": 70.800034, "t": 281.53726, "r": 139.43135, "b": 289.86227, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 202.74635, "t": 281.53726, "r": 239.28996000000004, "b": 289.86227, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "CHAR(1)", "bbox": {"l": 202.74635, "t": 281.53726, "r": 239.28996000000004, "b": 289.86227, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 281.79065, "t": 281.53726, "r": 425.09131, "b": 289.86227, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "Type of the currently running routine", "bbox": {"l": 281.79065, "t": 281.53726, "r": 425.09131, "b": 289.86227, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl"], "num_rows": 10, "num_cols": 3, "table_cells": [{"bbox": {"l": 70.800003, "t": 110.53801999999985, "r": 134.99071, "b": 118.86298, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Global variable", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 202.8894, "t": 110.53801999999985, "r": 223.34641, "b": 118.86298, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Type", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 281.8248, "t": 110.53801999999985, "r": 331.3428, "b": 118.86298, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Description", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800003, "t": 129.49834999999996, "r": 132.7209, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "CLIENT_HOST", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.89029, "t": 129.49834999999996, "r": 267.07651, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(255)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.84732, "t": 129.49834999999996, "r": 510.17548, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Host name of the current client as returned by the system", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800018, "t": 148.51806999999997, "r": 140.66522, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "CLIENT_IPADDR", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.87231, "t": 148.51806999999997, "r": 267.07739, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(128)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.84549, "t": 148.51806999999997, "r": 509.60583, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "IP address of the current client as returned by the system", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800018, "t": 167.53778, "r": 134.98264, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "CLIENT_PORT", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.90294, "t": 167.53778, "r": 242.80084, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "INTEGER", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.79785, "t": 167.53778, "r": 527.59222, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Port used by the current client to communicate with the server", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800018, "t": 186.5575, "r": 143.50925, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PACKAGE_NAME", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.80576, "t": 186.5575, "r": 267.06937, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(128)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.85187, "t": 186.5575, "r": 436.57259999999997, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Name of the currently running package", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800018, "t": 205.51782000000003, "r": 156.01654, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PACKAGE_SCHEMA", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.83545, "t": 205.51782000000003, "r": 267.08646, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(128)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.87076, "t": 205.51782000000003, "r": 470.44678, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Schema name of the currently running package", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800018, "t": 224.53754000000004, "r": 157.89932, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PACKAGE_VERSION", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.72472, "t": 224.53754000000004, "r": 261.98254, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(64)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.74924, "t": 224.53754000000004, "r": 478.8438100000001, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Version identifier of the currently running package", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800018, "t": 243.55724999999995, "r": 154.41992, "b": 251.8822, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "ROUTINE_SCHEMA", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.79312, "t": 243.55724999999995, "r": 267.09274, "b": 251.8822, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(128)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.87164, "t": 243.55724999999995, "r": 464.26022, "b": 251.8822, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Schema name of the currently running routine", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800018, "t": 262.51757999999995, "r": 188.43991, "b": 270.84253, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "ROUTINE_SPECIFIC_NAME", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.84441, "t": 262.51757999999995, "r": 267.03693, "b": 270.84253, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(128)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.80682, "t": 262.51757999999995, "r": 430.40045, "b": 270.84253, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Name of the currently running routine", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800034, "t": 281.53726, "r": 139.43135, "b": 289.86227, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "ROUTINE_TYPE", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.74635, "t": 281.53726, "r": 239.28996000000004, "b": 289.86227, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "CHAR(1)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.79065, "t": 281.53726, "r": 425.09131, "b": 289.86227, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Type of the currently running routine", "column_header": false, "row_header": false, "row_section": false}]}], "body": [{"label": "text", "id": 11, "page_no": 11, "cluster": {"id": 11, "label": "text", "bbox": {"l": 136.8, "t": 71.50867000000005, "r": 342.54773, "b": 80.72167999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.8370980620384216, "cells": [{"id": 2, "text": "Table 3-2 lists the nine built-in global variables.", "bbox": {"l": 136.8, "t": 71.50867000000005, "r": 342.54773, "b": 80.72167999999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 3-2 lists the nine built-in global variables."}, {"label": "caption", "id": 10, "page_no": 11, "cluster": {"id": 10, "label": "caption", "bbox": {"l": 64.800003, "t": 93.49805000000003, "r": 201.18147, "b": 101.82299999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.9132355451583862, "cells": [{"id": 3, "text": "Table 3-2 Built-in global variables", "bbox": {"l": 64.800003, "t": 93.49805000000003, "r": 201.18147, "b": 101.82299999999998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 3-2 Built-in global variables"}, {"label": "section_header", "id": 3, "page_no": 11, "cluster": {"id": 3, "label": "section_header", "bbox": {"l": 64.800003, "t": 322.20071, "r": 384.36389, "b": 336.96371000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9645338654518127, "cells": [{"id": 4, "text": "3.3", "bbox": {"l": 64.800003, "t": 322.20071, "r": 87.318192, "b": 336.96371000000005, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "VERIFY_GROUP_FOR_USER function", "bbox": {"l": 91.821815, "t": 322.20071, "r": 384.36389, "b": 336.96371000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3.3 VERIFY_GROUP_FOR_USER function"}, {"label": "text", "id": 1, "page_no": 11, "cluster": {"id": 1, "label": "text", "bbox": {"l": 136.8, "t": 354.52872, "r": 547.23474, "b": 435.74060000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9864333868026733, "cells": [{"id": 6, "text": "The VERIFY_GROUP_FOR_USER function was added in IBM i 7.2. Although it is primarily ", "bbox": {"l": 136.8, "t": 354.52872, "r": 542.83539, "b": 363.7417, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "intended for use with RCAC permissions and masks, it can be used in other SQL statements. ", "bbox": {"l": 136.8, "t": 366.52853, "r": 547.14783, "b": 375.74152, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "The first parameter must be one of these three special registers: SESSION_USER, USER, or ", "bbox": {"l": 136.8, "t": 378.52835, "r": 547.15106, "b": 387.74132999999995, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "CURRENT_USER. The second and subsequent parameters are a list of user or group ", "bbox": {"l": 136.80002, "t": 390.52817, "r": 520.62958, "b": 399.74115000000006, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "profiles. Each of these values must be 1 - 10 characters in length. These values are not ", "bbox": {"l": 136.80002, "t": 402.52798, "r": 524.88824, "b": 411.74097, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "validated for their existence, which means that you can specify the names of user profiles that ", "bbox": {"l": 136.80002, "t": 414.5278, "r": 547.23474, "b": 423.7407799999999, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "do not exist without receiving any kind of error.", "bbox": {"l": 136.80002, "t": 426.52762, "r": 342.04672, "b": 435.74060000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The VERIFY_GROUP_FOR_USER function was added in IBM i 7.2. Although it is primarily intended for use with RCAC permissions and masks, it can be used in other SQL statements. The first parameter must be one of these three special registers: SESSION_USER, USER, or CURRENT_USER. The second and subsequent parameters are a list of user or group profiles. Each of these values must be 1 - 10 characters in length. These values are not validated for their existence, which means that you can specify the names of user profiles that do not exist without receiving any kind of error."}, {"label": "text", "id": 2, "page_no": 11, "cluster": {"id": 2, "label": "text", "bbox": {"l": 136.80002, "t": 448.48743, "r": 547.25739, "b": 481.70004, "coord_origin": "TOPLEFT"}, "confidence": 0.9807308912277222, "cells": [{"id": 13, "text": "If a special register value is in the list of user profiles or it is a member of a group profile ", "bbox": {"l": 136.80002, "t": 448.48743, "r": 525.1474, "b": 457.70041, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "included in the list, the function returns a long integer value of 1. Otherwise, it returns a value ", "bbox": {"l": 136.80002, "t": 460.48724, "r": 547.25739, "b": 469.70023, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "of 0. It never returns the null value.", "bbox": {"l": 136.80002, "t": 472.48706, "r": 289.84335, "b": 481.70004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "If a special register value is in the list of user profiles or it is a member of a group profile included in the list, the function returns a long integer value of 1. Otherwise, it returns a value of 0. It never returns the null value."}, {"label": "text", "id": 8, "page_no": 11, "cluster": {"id": 8, "label": "text", "bbox": {"l": 136.80002, "t": 494.50662, "r": 458.44525000000004, "b": 503.7196, "coord_origin": "TOPLEFT"}, "confidence": 0.9237534403800964, "cells": [{"id": 16, "text": "Here is an example of using the VERIFY_GROUP_FOR_USER function:", "bbox": {"l": 136.80002, "t": 494.50662, "r": 458.44525000000004, "b": 503.7196, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Here is an example of using the VERIFY_GROUP_FOR_USER function:"}, {"label": "list_item", "id": 7, "page_no": 11, "cluster": {"id": 7, "label": "list_item", "bbox": {"l": 136.80002, "t": 511.5462, "r": 406.07751, "b": 520.75919, "coord_origin": "TOPLEFT"}, "confidence": 0.9338628649711609, "cells": [{"id": 17, "text": "1.", "bbox": {"l": 136.80002, "t": 511.5462, "r": 145.09804, "b": 520.75919, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "There are user profiles for MGR, JANE, JUDY, and TONY.", "bbox": {"l": 147.86403, "t": 511.5462, "r": 406.07751, "b": 520.75919, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1. There are user profiles for MGR, JANE, JUDY, and TONY."}, {"label": "list_item", "id": 4, "page_no": 11, "cluster": {"id": 4, "label": "list_item", "bbox": {"l": 136.80002, "t": 528.5260000000001, "r": 396.98816, "b": 537.739, "coord_origin": "TOPLEFT"}, "confidence": 0.9514462947845459, "cells": [{"id": 19, "text": "2.", "bbox": {"l": 136.80002, "t": 528.5260000000001, "r": 145.23297, "b": 537.739, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "The user profile JANE specifies a group profile of MGR.", "bbox": {"l": 148.04396, "t": 528.5260000000001, "r": 396.98816, "b": 537.739, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2. The user profile JANE specifies a group profile of MGR."}, {"label": "list_item", "id": 5, "page_no": 11, "cluster": {"id": 5, "label": "list_item", "bbox": {"l": 136.80002, "t": 545.50581, "r": 536.5686, "b": 566.71861, "coord_origin": "TOPLEFT"}, "confidence": 0.9512302875518799, "cells": [{"id": 21, "text": "3.", "bbox": {"l": 136.80002, "t": 545.50581, "r": 145.18951, "b": 554.71881, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "If a user is connected to the server using user profile JANE, all of the following function ", "bbox": {"l": 147.98601, "t": 545.50581, "r": 536.5686, "b": 554.71881, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "invocations return a value of 1:", "bbox": {"l": 151.20018, "t": 557.50562, "r": 286.84641, "b": 566.71861, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3. If a user is connected to the server using user profile JANE, all of the following function invocations return a value of 1:"}, {"label": "code", "id": 12, "page_no": 11, "cluster": {"id": 12, "label": "code", "bbox": {"l": 151.20018, "t": 574.69458, "r": 451.01605, "b": 641.4285600000001, "coord_origin": "TOPLEFT"}, "confidence": 0.706649661064148, "cells": [{"id": 24, "text": "VERIFY_GROUP_FOR_USER (CURRENT_USER, 'MGR')", "bbox": {"l": 151.20018, "t": 574.69458, "r": 366.05725, "b": 583.46933, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "VERIFY_GROUP_FOR_USER (CURRENT_USER, 'JANE', 'MGR')", "bbox": {"l": 151.20018, "t": 586.69438, "r": 406.01678, "b": 595.46913, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "VERIFY_GROUP_FOR_USER (CURRENT_USER, 'JANE', 'MGR', 'STEVE')", "bbox": {"l": 151.20018, "t": 598.69418, "r": 451.01605, "b": 607.46893, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "The following function invocation returns a value of 0:", "bbox": {"l": 151.20018, "t": 615.5246, "r": 385.87271, "b": 624.73759, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "VERIFY_GROUP_FOR_USER (CURRENT_USER, 'JUDY', 'TONY')", "bbox": {"l": 151.20018, "t": 632.65381, "r": 411.05655, "b": 641.4285600000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "VERIFY_GROUP_FOR_USER (CURRENT_USER, 'MGR') VERIFY_GROUP_FOR_USER (CURRENT_USER, 'JANE', 'MGR') VERIFY_GROUP_FOR_USER (CURRENT_USER, 'JANE', 'MGR', 'STEVE') The following function invocation returns a value of 0: VERIFY_GROUP_FOR_USER (CURRENT_USER, 'JUDY', 'TONY')"}, {"label": "table", "id": 0, "page_no": 11, "cluster": {"id": 0, "label": "table", "bbox": {"l": 63.55636978149414, "t": 104.23387145996094, "r": 548.5687255859375, "b": 296.22467041015625, "coord_origin": "TOPLEFT"}, "confidence": 0.9868634939193726, "cells": [{"id": 29, "text": "Global variable", "bbox": {"l": 70.800003, "t": 110.53801999999985, "r": 134.99071, "b": 118.86298, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Type", "bbox": {"l": 202.8894, "t": 110.53801999999985, "r": 223.34641, "b": 118.86298, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Description", "bbox": {"l": 281.8248, "t": 110.53801999999985, "r": 331.3428, "b": 118.86298, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "CLIENT_HOST", "bbox": {"l": 70.800003, "t": 129.49834999999996, "r": 132.7209, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "VARCHAR(255)", "bbox": {"l": 202.89029, "t": 129.49834999999996, "r": 267.07651, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Host name of the current client as returned by the system", "bbox": {"l": 281.84732, "t": 129.49834999999996, "r": 510.17548, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "CLIENT_IPADDR", "bbox": {"l": 70.800018, "t": 148.51806999999997, "r": 140.66522, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "VARCHAR(128)", "bbox": {"l": 202.87231, "t": 148.51806999999997, "r": 267.07739, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "IP address of the current client as returned by the system", "bbox": {"l": 281.84549, "t": 148.51806999999997, "r": 509.60583, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "CLIENT_PORT ", "bbox": {"l": 70.800018, "t": 167.53778, "r": 134.98264, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "INTEGER", "bbox": {"l": 202.90294, "t": 167.53778, "r": 242.80084, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "Port used by the current client to communicate with the server", "bbox": {"l": 281.79785, "t": 167.53778, "r": 527.59222, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "PACKAGE_NAME", "bbox": {"l": 70.800018, "t": 186.5575, "r": 143.50925, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "VARCHAR(128)", "bbox": {"l": 202.80576, "t": 186.5575, "r": 267.06937, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Name of the currently running package", "bbox": {"l": 281.85187, "t": 186.5575, "r": 436.57259999999997, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "PACKAGE_SCHEMA", "bbox": {"l": 70.800018, "t": 205.51782000000003, "r": 156.01654, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "VARCHAR(128)", "bbox": {"l": 202.83545, "t": 205.51782000000003, "r": 267.08646, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "Schema name of the currently running package", "bbox": {"l": 281.87076, "t": 205.51782000000003, "r": 470.44678, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "PACKAGE_VERSION", "bbox": {"l": 70.800018, "t": 224.53754000000004, "r": 157.89932, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "VARCHAR(64)", "bbox": {"l": 202.72472, "t": 224.53754000000004, "r": 261.98254, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "Version identifier of the currently running package", "bbox": {"l": 281.74924, "t": 224.53754000000004, "r": 478.8438100000001, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "ROUTINE_SCHEMA", "bbox": {"l": 70.800018, "t": 243.55724999999995, "r": 154.41992, "b": 251.8822, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "VARCHAR(128)", "bbox": {"l": 202.79312, "t": 243.55724999999995, "r": 267.09274, "b": 251.8822, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Schema name of the currently running routine", "bbox": {"l": 281.87164, "t": 243.55724999999995, "r": 464.26022, "b": 251.8822, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "ROUTINE_SPECIFIC_NAME", "bbox": {"l": 70.800018, "t": 262.51757999999995, "r": 188.43991, "b": 270.84253, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "VARCHAR(128)", "bbox": {"l": 202.84441, "t": 262.51757999999995, "r": 267.03693, "b": 270.84253, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "Name of the currently running routine", "bbox": {"l": 281.80682, "t": 262.51757999999995, "r": 430.40045, "b": 270.84253, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "ROUTINE_TYPE", "bbox": {"l": 70.800034, "t": 281.53726, "r": 139.43135, "b": 289.86227, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "CHAR(1)", "bbox": {"l": 202.74635, "t": 281.53726, "r": 239.28996000000004, "b": 289.86227, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Type of the currently running routine", "bbox": {"l": 281.79065, "t": 281.53726, "r": 425.09131, "b": 289.86227, "coord_origin": "TOPLEFT"}}], "children": [{"id": 14, "label": "text", "bbox": {"l": 70.800003, "t": 110.53801999999985, "r": 134.99071, "b": 118.86298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "Global variable", "bbox": {"l": 70.800003, "t": 110.53801999999985, "r": 134.99071, "b": 118.86298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 202.8894, "t": 110.53801999999985, "r": 223.34641, "b": 118.86298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "Type", "bbox": {"l": 202.8894, "t": 110.53801999999985, "r": 223.34641, "b": 118.86298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 281.8248, "t": 110.53801999999985, "r": 331.3428, "b": 118.86298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "Description", "bbox": {"l": 281.8248, "t": 110.53801999999985, "r": 331.3428, "b": 118.86298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 70.800003, "t": 129.49834999999996, "r": 132.7209, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "CLIENT_HOST", "bbox": {"l": 70.800003, "t": 129.49834999999996, "r": 132.7209, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 202.89029, "t": 129.49834999999996, "r": 267.07651, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "VARCHAR(255)", "bbox": {"l": 202.89029, "t": 129.49834999999996, "r": 267.07651, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 281.84732, "t": 129.49834999999996, "r": 510.17548, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "Host name of the current client as returned by the system", "bbox": {"l": 281.84732, "t": 129.49834999999996, "r": 510.17548, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 70.800018, "t": 148.51806999999997, "r": 140.66522, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "CLIENT_IPADDR", "bbox": {"l": 70.800018, "t": 148.51806999999997, "r": 140.66522, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 202.87231, "t": 148.51806999999997, "r": 267.07739, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "VARCHAR(128)", "bbox": {"l": 202.87231, "t": 148.51806999999997, "r": 267.07739, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 281.84549, "t": 148.51806999999997, "r": 509.60583, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "IP address of the current client as returned by the system", "bbox": {"l": 281.84549, "t": 148.51806999999997, "r": 509.60583, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 70.800018, "t": 167.53778, "r": 134.98264, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "CLIENT_PORT ", "bbox": {"l": 70.800018, "t": 167.53778, "r": 134.98264, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 202.90294, "t": 167.53778, "r": 242.80084, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "INTEGER", "bbox": {"l": 202.90294, "t": 167.53778, "r": 242.80084, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 281.79785, "t": 167.53778, "r": 527.59222, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "Port used by the current client to communicate with the server", "bbox": {"l": 281.79785, "t": 167.53778, "r": 527.59222, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 70.800018, "t": 186.5575, "r": 143.50925, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "PACKAGE_NAME", "bbox": {"l": 70.800018, "t": 186.5575, "r": 143.50925, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 202.80576, "t": 186.5575, "r": 267.06937, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "VARCHAR(128)", "bbox": {"l": 202.80576, "t": 186.5575, "r": 267.06937, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 281.85187, "t": 186.5575, "r": 436.57259999999997, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "Name of the currently running package", "bbox": {"l": 281.85187, "t": 186.5575, "r": 436.57259999999997, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 70.800018, "t": 205.51782000000003, "r": 156.01654, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "PACKAGE_SCHEMA", "bbox": {"l": 70.800018, "t": 205.51782000000003, "r": 156.01654, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 202.83545, "t": 205.51782000000003, "r": 267.08646, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "VARCHAR(128)", "bbox": {"l": 202.83545, "t": 205.51782000000003, "r": 267.08646, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 281.87076, "t": 205.51782000000003, "r": 470.44678, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "Schema name of the currently running package", "bbox": {"l": 281.87076, "t": 205.51782000000003, "r": 470.44678, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 70.800018, "t": 224.53754000000004, "r": 157.89932, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "PACKAGE_VERSION", "bbox": {"l": 70.800018, "t": 224.53754000000004, "r": 157.89932, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 202.72472, "t": 224.53754000000004, "r": 261.98254, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "VARCHAR(64)", "bbox": {"l": 202.72472, "t": 224.53754000000004, "r": 261.98254, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 281.74924, "t": 224.53754000000004, "r": 478.8438100000001, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "Version identifier of the currently running package", "bbox": {"l": 281.74924, "t": 224.53754000000004, "r": 478.8438100000001, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 70.800018, "t": 243.55724999999995, "r": 154.41992, "b": 251.8822, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "ROUTINE_SCHEMA", "bbox": {"l": 70.800018, "t": 243.55724999999995, "r": 154.41992, "b": 251.8822, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 202.79312, "t": 243.55724999999995, "r": 267.09274, "b": 251.8822, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "VARCHAR(128)", "bbox": {"l": 202.79312, "t": 243.55724999999995, "r": 267.09274, "b": 251.8822, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 281.87164, "t": 243.55724999999995, "r": 464.26022, "b": 251.8822, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "Schema name of the currently running routine", "bbox": {"l": 281.87164, "t": 243.55724999999995, "r": 464.26022, "b": 251.8822, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 70.800018, "t": 262.51757999999995, "r": 188.43991, "b": 270.84253, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "ROUTINE_SPECIFIC_NAME", "bbox": {"l": 70.800018, "t": 262.51757999999995, "r": 188.43991, "b": 270.84253, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 202.84441, "t": 262.51757999999995, "r": 267.03693, "b": 270.84253, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "VARCHAR(128)", "bbox": {"l": 202.84441, "t": 262.51757999999995, "r": 267.03693, "b": 270.84253, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 281.80682, "t": 262.51757999999995, "r": 430.40045, "b": 270.84253, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "Name of the currently running routine", "bbox": {"l": 281.80682, "t": 262.51757999999995, "r": 430.40045, "b": 270.84253, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 70.800034, "t": 281.53726, "r": 139.43135, "b": 289.86227, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "ROUTINE_TYPE", "bbox": {"l": 70.800034, "t": 281.53726, "r": 139.43135, "b": 289.86227, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 202.74635, "t": 281.53726, "r": 239.28996000000004, "b": 289.86227, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "CHAR(1)", "bbox": {"l": 202.74635, "t": 281.53726, "r": 239.28996000000004, "b": 289.86227, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 281.79065, "t": 281.53726, "r": 425.09131, "b": 289.86227, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "Type of the currently running routine", "bbox": {"l": 281.79065, "t": 281.53726, "r": 425.09131, "b": 289.86227, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl"], "num_rows": 10, "num_cols": 3, "table_cells": [{"bbox": {"l": 70.800003, "t": 110.53801999999985, "r": 134.99071, "b": 118.86298, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Global variable", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 202.8894, "t": 110.53801999999985, "r": 223.34641, "b": 118.86298, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Type", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 281.8248, "t": 110.53801999999985, "r": 331.3428, "b": 118.86298, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Description", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800003, "t": 129.49834999999996, "r": 132.7209, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "CLIENT_HOST", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.89029, "t": 129.49834999999996, "r": 267.07651, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(255)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.84732, "t": 129.49834999999996, "r": 510.17548, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Host name of the current client as returned by the system", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800018, "t": 148.51806999999997, "r": 140.66522, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "CLIENT_IPADDR", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.87231, "t": 148.51806999999997, "r": 267.07739, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(128)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.84549, "t": 148.51806999999997, "r": 509.60583, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "IP address of the current client as returned by the system", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800018, "t": 167.53778, "r": 134.98264, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "CLIENT_PORT", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.90294, "t": 167.53778, "r": 242.80084, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "INTEGER", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.79785, "t": 167.53778, "r": 527.59222, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Port used by the current client to communicate with the server", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800018, "t": 186.5575, "r": 143.50925, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PACKAGE_NAME", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.80576, "t": 186.5575, "r": 267.06937, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(128)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.85187, "t": 186.5575, "r": 436.57259999999997, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Name of the currently running package", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800018, "t": 205.51782000000003, "r": 156.01654, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PACKAGE_SCHEMA", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.83545, "t": 205.51782000000003, "r": 267.08646, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(128)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.87076, "t": 205.51782000000003, "r": 470.44678, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Schema name of the currently running package", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800018, "t": 224.53754000000004, "r": 157.89932, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PACKAGE_VERSION", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.72472, "t": 224.53754000000004, "r": 261.98254, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(64)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.74924, "t": 224.53754000000004, "r": 478.8438100000001, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Version identifier of the currently running package", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800018, "t": 243.55724999999995, "r": 154.41992, "b": 251.8822, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "ROUTINE_SCHEMA", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.79312, "t": 243.55724999999995, "r": 267.09274, "b": 251.8822, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(128)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.87164, "t": 243.55724999999995, "r": 464.26022, "b": 251.8822, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Schema name of the currently running routine", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800018, "t": 262.51757999999995, "r": 188.43991, "b": 270.84253, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "ROUTINE_SPECIFIC_NAME", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.84441, "t": 262.51757999999995, "r": 267.03693, "b": 270.84253, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(128)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.80682, "t": 262.51757999999995, "r": 430.40045, "b": 270.84253, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Name of the currently running routine", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800034, "t": 281.53726, "r": 139.43135, "b": 289.86227, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "ROUTINE_TYPE", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.74635, "t": 281.53726, "r": 239.28996000000004, "b": 289.86227, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "CHAR(1)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.79065, "t": 281.53726, "r": 425.09131, "b": 289.86227, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Type of the currently running routine", "column_header": false, "row_header": false, "row_section": false}]}], "headers": [{"label": "page_footer", "id": 9, "page_no": 11, "cluster": {"id": 9, "label": "page_footer", "bbox": {"l": 64.800003, "t": 754.848721, "r": 78.402, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.9187921285629272, "cells": [{"id": 0, "text": "20 ", "bbox": {"l": 64.800003, "t": 754.848721, "r": 78.402, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "20"}, {"label": "page_footer", "id": 6, "page_no": 11, "cluster": {"id": 6, "label": "page_footer", "bbox": {"l": 93.420303, "t": 755.538002, "r": 334.42142, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9505080580711365, "cells": [{"id": 1, "text": "Row and Column Access Control Support in IBM DB2 for i", "bbox": {"l": 93.420303, "t": 755.538002, "r": 334.42142, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Row and Column Access Control Support in IBM DB2 for i"}]}}, {"page_no": 12, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "Chapter 3. Row and Column Access Control ", "bbox": {"l": 344.94, "t": 755.538002, "r": 523.60162, "b": 763.863001, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "27", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "RETURN", "bbox": {"l": 136.79959, "t": 71.65845000000002, "r": 166.73935, "b": 80.43322999999998, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "CASE", "bbox": {"l": 136.79959, "t": 83.65826000000004, "r": 156.77934, "b": 92.43304, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'HR', 'EMP' ) = 1", "bbox": {"l": 147.26993, "t": 95.65808000000015, "r": 466.61502, "b": 104.43286000000012, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "THEN EMPLOYEES . DATE_OF_BIRTH", "bbox": {"l": 147.73068, "t": 107.65790000000004, "r": 311.69717, "b": 116.43268, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1", "bbox": {"l": 147.31944, "t": 131.65752999999995, "r": 436.61547999999993, "b": 140.43231000000003, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "AND SESSION_USER = EMPLOYEES . USER_ID", "bbox": {"l": 147.54245, "t": 143.65734999999995, "r": 351.65668, "b": 152.43213000000003, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "THEN EMPLOYEES . DATE_OF_BIRTH", "bbox": {"l": 147.73068, "t": 155.65716999999995, "r": 311.69717, "b": 164.43195000000003, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1", "bbox": {"l": 147.31944, "t": 179.65679999999998, "r": 436.61547999999993, "b": 188.43158000000005, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "AND SESSION_USER <> EMPLOYEES . USER_ID", "bbox": {"l": 147.52335, "t": 191.65661999999998, "r": 356.63669, "b": 200.43140000000005, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "THEN ( 9999 || '-' ||", "bbox": {"l": 147.63832, "t": 203.65643, "r": 261.44492, "b": 212.43120999999996, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "MONTH ( EMPLOYEES . DATE_OF_BIRTH ) || '-'", "bbox": {"l": 272.28363, "t": 203.65643, "r": 499.89682, "b": 212.43120999999996, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "||", "bbox": {"l": 510.73557, "t": 203.65643, "r": 521.57428, "b": 212.43120999999996, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "DAY (EMPLOYEES.DATE_OF_BIRTH ))", "bbox": {"l": 160.78555, "t": 215.65625, "r": 346.6767, "b": 224.43102999999996, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "ELSE NULL", "bbox": {"l": 149.51941, "t": 227.65607, "r": 206.75861, "b": 236.43084999999996, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": " END", "bbox": {"l": 136.79959, "t": 239.65588000000002, "r": 156.77934, "b": 248.43066, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": " ENABLE ;", "bbox": {"l": 136.79959, "t": 251.65570000000002, "r": 186.7191, "b": 260.43048, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "2.", "bbox": {"l": 136.79959, "t": 275.50591999999995, "r": 145.18994, "b": 284.7189, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "The other column to mask in this example is the TAX_ID information. In this example, the ", "bbox": {"l": 147.98672, "t": 275.50591999999995, "r": 547.21222, "b": 284.7189, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "rules to enforce include the following ones:", "bbox": {"l": 151.19977, "t": 287.50574, "r": 339.37903, "b": 296.71871999999996, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "-", "bbox": {"l": 152.0394, "t": 304.48553000000004, "r": 157.61201, "b": 313.69852000000003, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "Human Resources can see the unmasked TAX_ID of the employees.", "bbox": {"l": 165.59894, "t": 304.48553000000004, "r": 469.1528, "b": 313.69852000000003, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "-", "bbox": {"l": 152.0394, "t": 321.52512, "r": 157.60504, "b": 330.7381, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "Employees can see only their own unmasked TAX_ID.", "bbox": {"l": 165.59894, "t": 321.52512, "r": 403.95953, "b": 330.7381, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "-", "bbox": {"l": 152.0394, "t": 338.50491, "r": 157.57019, "b": 347.7179, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "Managers see a masked version of TAX_ID with the first five characters replaced with ", "bbox": {"l": 165.59894, "t": 338.50491, "r": 545.16846, "b": 347.7179, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "the X character (for example, XXX-XX-1234).", "bbox": {"l": 165.59894, "t": 350.50473, "r": 364.67947, "b": 359.71771, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "-", "bbox": {"l": 152.0394, "t": 367.48453, "r": 157.59309, "b": 376.6975100000001, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Any other person sees the entire TAX_ID as masked, for example, XXX-XX-XXXX.", "bbox": {"l": 165.59995, "t": 367.48453, "r": 529.46362, "b": 376.6975100000001, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "To implement this column mask, run the SQL statement that is shown in Example 3-9.", "bbox": {"l": 151.19978, "t": 384.52411, "r": 530.0603, "b": 393.73709, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Example 3-9 Creating a mask on the TAX_ID column", "bbox": {"l": 136.8, "t": 406.51801, "r": 351.9873, "b": 414.84302, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "CREATE MASK", "bbox": {"l": 136.8, "t": 423.67810000000003, "r": 192.91296, "b": 432.45287999999994, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "HR_SCHEMA.MASK_TAX_ID_ON_EMPLOYEES ", "bbox": {"l": 203.11533, "t": 423.67810000000003, "r": 381.65659, "b": 432.45287999999994, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "ON", "bbox": {"l": 136.8, "t": 435.67792, "r": 148.54184, "b": 444.45270000000005, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "HR_SCHEMA.EMPLOYEES AS EMPLOYEES ", "bbox": {"l": 177.89645, "t": 435.67792, "r": 371.63684, "b": 444.45270000000005, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "FOR COLUMN", "bbox": {"l": 136.8, "t": 447.67773, "r": 199.25916, "b": 456.45251, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "TAX_ID", "bbox": {"l": 211.75098, "t": 447.67773, "r": 249.22647, "b": 456.45251, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "RETURN ", "bbox": {"l": 136.8, "t": 459.67755, "r": 176.75952, "b": 468.45233, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "CASE ", "bbox": {"l": 136.8, "t": 471.67737, "r": 161.75977, "b": 480.45215, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'HR' ) = 1", "bbox": {"l": 152.84189, "t": 483.67719, "r": 441.59589, "b": 492.45197, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "THEN EMPLOYEES . TAX_ID ", "bbox": {"l": 154.01309, "t": 495.677, "r": 291.7178, "b": 504.45178, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1 ", "bbox": {"l": 152.80757, "t": 519.67661, "r": 451.6156, "b": 528.45139, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "AND SESSION_USER = EMPLOYEES . USER_ID ", "bbox": {"l": 153.21835, "t": 531.67642, "r": 366.65683, "b": 540.45117, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "THEN EMPLOYEES . TAX_ID", "bbox": {"l": 154.09363, "t": 543.6762200000001, "r": 286.67804, "b": 552.45097, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1", "bbox": {"l": 152.82599, "t": 567.67583, "r": 446.63561999999996, "b": 576.45058, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "AND SESSION_USER <> EMPLOYEES . USER_ID ", "bbox": {"l": 153.18398, "t": 579.67563, "r": 371.63684, "b": 588.45038, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "THEN ( 'XXX-XX-' CONCAT QSYS2 . SUBSTR ( EMPLOYEES . TAX_ID , 8 , 4 ) )", "bbox": {"l": 152.60088, "t": 591.67543, "r": 526.55469, "b": 600.45018, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'EMP' ) = 1 ", "bbox": {"l": 152.80757, "t": 615.67505, "r": 451.6156, "b": 624.4498, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "THEN EMPLOYEES . TAX_ID ", "bbox": {"l": 154.01309, "t": 627.67485, "r": 291.7178, "b": 636.4496, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "ELSE 'XXX-XX-XXXX' ", "bbox": {"l": 154.5134, "t": 651.67447, "r": 266.69827, "b": 660.44922, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "END", "bbox": {"l": 136.8, "t": 663.67427, "r": 157.7877, "b": 672.44904, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "ENABLE ;", "bbox": {"l": 136.8, "t": 675.67409, "r": 181.73952, "b": 684.44884, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 1, "label": "page_footer", "bbox": {"l": 344.94, "t": 755.538002, "r": 523.60162, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9556925892829895, "cells": [{"id": 0, "text": "Chapter 3. Row and Column Access Control ", "bbox": {"l": 344.94, "t": 755.538002, "r": 523.60162, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "page_footer", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.910578727722168, "cells": [{"id": 1, "text": "27", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 136.79959, "t": 71.65845000000002, "r": 166.73935, "b": 80.43322999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.5606333613395691, "cells": [{"id": 2, "text": "RETURN", "bbox": {"l": 136.79959, "t": 71.65845000000002, "r": 166.73935, "b": 80.43322999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 136.79959, "t": 83.65826000000004, "r": 156.77934, "b": 92.43304, "coord_origin": "TOPLEFT"}, "confidence": 0.5897271037101746, "cells": [{"id": 3, "text": "CASE", "bbox": {"l": 136.79959, "t": 83.65826000000004, "r": 156.77934, "b": 92.43304, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "code", "bbox": {"l": 136.79959, "t": 95.65808000000015, "r": 521.57428, "b": 260.43048, "coord_origin": "TOPLEFT"}, "confidence": 0.7785220146179199, "cells": [{"id": 4, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'HR', 'EMP' ) = 1", "bbox": {"l": 147.26993, "t": 95.65808000000015, "r": 466.61502, "b": 104.43286000000012, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "THEN EMPLOYEES . DATE_OF_BIRTH", "bbox": {"l": 147.73068, "t": 107.65790000000004, "r": 311.69717, "b": 116.43268, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1", "bbox": {"l": 147.31944, "t": 131.65752999999995, "r": 436.61547999999993, "b": 140.43231000000003, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "AND SESSION_USER = EMPLOYEES . USER_ID", "bbox": {"l": 147.54245, "t": 143.65734999999995, "r": 351.65668, "b": 152.43213000000003, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "THEN EMPLOYEES . DATE_OF_BIRTH", "bbox": {"l": 147.73068, "t": 155.65716999999995, "r": 311.69717, "b": 164.43195000000003, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1", "bbox": {"l": 147.31944, "t": 179.65679999999998, "r": 436.61547999999993, "b": 188.43158000000005, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "AND SESSION_USER <> EMPLOYEES . USER_ID", "bbox": {"l": 147.52335, "t": 191.65661999999998, "r": 356.63669, "b": 200.43140000000005, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "THEN ( 9999 || '-' ||", "bbox": {"l": 147.63832, "t": 203.65643, "r": 261.44492, "b": 212.43120999999996, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "MONTH ( EMPLOYEES . DATE_OF_BIRTH ) || '-'", "bbox": {"l": 272.28363, "t": 203.65643, "r": 499.89682, "b": 212.43120999999996, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "||", "bbox": {"l": 510.73557, "t": 203.65643, "r": 521.57428, "b": 212.43120999999996, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "DAY (EMPLOYEES.DATE_OF_BIRTH ))", "bbox": {"l": 160.78555, "t": 215.65625, "r": 346.6767, "b": 224.43102999999996, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "ELSE NULL", "bbox": {"l": 149.51941, "t": 227.65607, "r": 206.75861, "b": 236.43084999999996, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": " END", "bbox": {"l": 136.79959, "t": 239.65588000000002, "r": 156.77934, "b": 248.43066, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": " ENABLE ;", "bbox": {"l": 136.79959, "t": 251.65570000000002, "r": 186.7191, "b": 260.43048, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "list_item", "bbox": {"l": 136.79959, "t": 275.50591999999995, "r": 547.21222, "b": 296.71871999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.8678944706916809, "cells": [{"id": 18, "text": "2.", "bbox": {"l": 136.79959, "t": 275.50591999999995, "r": 145.18994, "b": 284.7189, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "The other column to mask in this example is the TAX_ID information. In this example, the ", "bbox": {"l": 147.98672, "t": 275.50591999999995, "r": 547.21222, "b": 284.7189, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "rules to enforce include the following ones:", "bbox": {"l": 151.19977, "t": 287.50574, "r": 339.37903, "b": 296.71871999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "list_item", "bbox": {"l": 152.0394, "t": 304.48553000000004, "r": 469.1528, "b": 313.69852000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9461130499839783, "cells": [{"id": 21, "text": "-", "bbox": {"l": 152.0394, "t": 304.48553000000004, "r": 157.61201, "b": 313.69852000000003, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "Human Resources can see the unmasked TAX_ID of the employees.", "bbox": {"l": 165.59894, "t": 304.48553000000004, "r": 469.1528, "b": 313.69852000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "list_item", "bbox": {"l": 152.0394, "t": 321.52512, "r": 403.95953, "b": 330.7381, "coord_origin": "TOPLEFT"}, "confidence": 0.9467734694480896, "cells": [{"id": 23, "text": "-", "bbox": {"l": 152.0394, "t": 321.52512, "r": 157.60504, "b": 330.7381, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "Employees can see only their own unmasked TAX_ID.", "bbox": {"l": 165.59894, "t": 321.52512, "r": 403.95953, "b": 330.7381, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "list_item", "bbox": {"l": 152.0394, "t": 338.50491, "r": 545.16846, "b": 359.71771, "coord_origin": "TOPLEFT"}, "confidence": 0.9705167412757874, "cells": [{"id": 25, "text": "-", "bbox": {"l": 152.0394, "t": 338.50491, "r": 157.57019, "b": 347.7179, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "Managers see a masked version of TAX_ID with the first five characters replaced with ", "bbox": {"l": 165.59894, "t": 338.50491, "r": 545.16846, "b": 347.7179, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "the X character (for example, XXX-XX-1234).", "bbox": {"l": 165.59894, "t": 350.50473, "r": 364.67947, "b": 359.71771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "list_item", "bbox": {"l": 152.0394, "t": 367.48453, "r": 529.46362, "b": 376.6975100000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9469641447067261, "cells": [{"id": 28, "text": "-", "bbox": {"l": 152.0394, "t": 367.48453, "r": 157.59309, "b": 376.6975100000001, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Any other person sees the entire TAX_ID as masked, for example, XXX-XX-XXXX.", "bbox": {"l": 165.59995, "t": 367.48453, "r": 529.46362, "b": 376.6975100000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "list_item", "bbox": {"l": 151.19978, "t": 384.52411, "r": 530.0603, "b": 393.73709, "coord_origin": "TOPLEFT"}, "confidence": 0.7003496885299683, "cells": [{"id": 30, "text": "To implement this column mask, run the SQL statement that is shown in Example 3-9.", "bbox": {"l": 151.19978, "t": 384.52411, "r": 530.0603, "b": 393.73709, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "caption", "bbox": {"l": 136.8, "t": 406.51801, "r": 351.9873, "b": 414.84302, "coord_origin": "TOPLEFT"}, "confidence": 0.848820149898529, "cells": [{"id": 31, "text": "Example 3-9 Creating a mask on the TAX_ID column", "bbox": {"l": 136.8, "t": 406.51801, "r": 351.9873, "b": 414.84302, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "code", "bbox": {"l": 136.8, "t": 423.67810000000003, "r": 526.55469, "b": 684.44884, "coord_origin": "TOPLEFT"}, "confidence": 0.8411225080490112, "cells": [{"id": 32, "text": "CREATE MASK", "bbox": {"l": 136.8, "t": 423.67810000000003, "r": 192.91296, "b": 432.45287999999994, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "HR_SCHEMA.MASK_TAX_ID_ON_EMPLOYEES ", "bbox": {"l": 203.11533, "t": 423.67810000000003, "r": 381.65659, "b": 432.45287999999994, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "ON", "bbox": {"l": 136.8, "t": 435.67792, "r": 148.54184, "b": 444.45270000000005, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "HR_SCHEMA.EMPLOYEES AS EMPLOYEES ", "bbox": {"l": 177.89645, "t": 435.67792, "r": 371.63684, "b": 444.45270000000005, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "FOR COLUMN", "bbox": {"l": 136.8, "t": 447.67773, "r": 199.25916, "b": 456.45251, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "TAX_ID", "bbox": {"l": 211.75098, "t": 447.67773, "r": 249.22647, "b": 456.45251, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "RETURN ", "bbox": {"l": 136.8, "t": 459.67755, "r": 176.75952, "b": 468.45233, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "CASE ", "bbox": {"l": 136.8, "t": 471.67737, "r": 161.75977, "b": 480.45215, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'HR' ) = 1", "bbox": {"l": 152.84189, "t": 483.67719, "r": 441.59589, "b": 492.45197, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "THEN EMPLOYEES . TAX_ID ", "bbox": {"l": 154.01309, "t": 495.677, "r": 291.7178, "b": 504.45178, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1 ", "bbox": {"l": 152.80757, "t": 519.67661, "r": 451.6156, "b": 528.45139, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "AND SESSION_USER = EMPLOYEES . USER_ID ", "bbox": {"l": 153.21835, "t": 531.67642, "r": 366.65683, "b": 540.45117, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "THEN EMPLOYEES . TAX_ID", "bbox": {"l": 154.09363, "t": 543.6762200000001, "r": 286.67804, "b": 552.45097, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1", "bbox": {"l": 152.82599, "t": 567.67583, "r": 446.63561999999996, "b": 576.45058, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "AND SESSION_USER <> EMPLOYEES . USER_ID ", "bbox": {"l": 153.18398, "t": 579.67563, "r": 371.63684, "b": 588.45038, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "THEN ( 'XXX-XX-' CONCAT QSYS2 . SUBSTR ( EMPLOYEES . TAX_ID , 8 , 4 ) )", "bbox": {"l": 152.60088, "t": 591.67543, "r": 526.55469, "b": 600.45018, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'EMP' ) = 1 ", "bbox": {"l": 152.80757, "t": 615.67505, "r": 451.6156, "b": 624.4498, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "THEN EMPLOYEES . TAX_ID ", "bbox": {"l": 154.01309, "t": 627.67485, "r": 291.7178, "b": 636.4496, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "ELSE 'XXX-XX-XXXX' ", "bbox": {"l": 154.5134, "t": 651.67447, "r": 266.69827, "b": 660.44922, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "END", "bbox": {"l": 136.8, "t": 663.67427, "r": 157.7877, "b": 672.44904, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "ENABLE ;", "bbox": {"l": 136.8, "t": 675.67409, "r": 181.73952, "b": 684.44884, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_footer", "id": 1, "page_no": 12, "cluster": {"id": 1, "label": "page_footer", "bbox": {"l": 344.94, "t": 755.538002, "r": 523.60162, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9556925892829895, "cells": [{"id": 0, "text": "Chapter 3. Row and Column Access Control ", "bbox": {"l": 344.94, "t": 755.538002, "r": 523.60162, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Chapter 3. Row and Column Access Control"}, {"label": "page_footer", "id": 5, "page_no": 12, "cluster": {"id": 5, "label": "page_footer", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.910578727722168, "cells": [{"id": 1, "text": "27", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "27"}, {"label": "text", "id": 13, "page_no": 12, "cluster": {"id": 13, "label": "text", "bbox": {"l": 136.79959, "t": 71.65845000000002, "r": 166.73935, "b": 80.43322999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.5606333613395691, "cells": [{"id": 2, "text": "RETURN", "bbox": {"l": 136.79959, "t": 71.65845000000002, "r": 166.73935, "b": 80.43322999999998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "RETURN"}, {"label": "text", "id": 12, "page_no": 12, "cluster": {"id": 12, "label": "text", "bbox": {"l": 136.79959, "t": 83.65826000000004, "r": 156.77934, "b": 92.43304, "coord_origin": "TOPLEFT"}, "confidence": 0.5897271037101746, "cells": [{"id": 3, "text": "CASE", "bbox": {"l": 136.79959, "t": 83.65826000000004, "r": 156.77934, "b": 92.43304, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "CASE"}, {"label": "code", "id": 9, "page_no": 12, "cluster": {"id": 9, "label": "code", "bbox": {"l": 136.79959, "t": 95.65808000000015, "r": 521.57428, "b": 260.43048, "coord_origin": "TOPLEFT"}, "confidence": 0.7785220146179199, "cells": [{"id": 4, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'HR', 'EMP' ) = 1", "bbox": {"l": 147.26993, "t": 95.65808000000015, "r": 466.61502, "b": 104.43286000000012, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "THEN EMPLOYEES . DATE_OF_BIRTH", "bbox": {"l": 147.73068, "t": 107.65790000000004, "r": 311.69717, "b": 116.43268, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1", "bbox": {"l": 147.31944, "t": 131.65752999999995, "r": 436.61547999999993, "b": 140.43231000000003, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "AND SESSION_USER = EMPLOYEES . USER_ID", "bbox": {"l": 147.54245, "t": 143.65734999999995, "r": 351.65668, "b": 152.43213000000003, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "THEN EMPLOYEES . DATE_OF_BIRTH", "bbox": {"l": 147.73068, "t": 155.65716999999995, "r": 311.69717, "b": 164.43195000000003, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1", "bbox": {"l": 147.31944, "t": 179.65679999999998, "r": 436.61547999999993, "b": 188.43158000000005, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "AND SESSION_USER <> EMPLOYEES . USER_ID", "bbox": {"l": 147.52335, "t": 191.65661999999998, "r": 356.63669, "b": 200.43140000000005, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "THEN ( 9999 || '-' ||", "bbox": {"l": 147.63832, "t": 203.65643, "r": 261.44492, "b": 212.43120999999996, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "MONTH ( EMPLOYEES . DATE_OF_BIRTH ) || '-'", "bbox": {"l": 272.28363, "t": 203.65643, "r": 499.89682, "b": 212.43120999999996, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "||", "bbox": {"l": 510.73557, "t": 203.65643, "r": 521.57428, "b": 212.43120999999996, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "DAY (EMPLOYEES.DATE_OF_BIRTH ))", "bbox": {"l": 160.78555, "t": 215.65625, "r": 346.6767, "b": 224.43102999999996, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "ELSE NULL", "bbox": {"l": 149.51941, "t": 227.65607, "r": 206.75861, "b": 236.43084999999996, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": " END", "bbox": {"l": 136.79959, "t": 239.65588000000002, "r": 156.77934, "b": 248.43066, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": " ENABLE ;", "bbox": {"l": 136.79959, "t": 251.65570000000002, "r": 186.7191, "b": 260.43048, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'HR', 'EMP' ) = 1 THEN EMPLOYEES . DATE_OF_BIRTH WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1 AND SESSION_USER = EMPLOYEES . USER_ID THEN EMPLOYEES . DATE_OF_BIRTH WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1 AND SESSION_USER <> EMPLOYEES . USER_ID THEN ( 9999 || '-' || MONTH ( EMPLOYEES . DATE_OF_BIRTH ) || '-' || DAY (EMPLOYEES.DATE_OF_BIRTH )) ELSE NULL END ENABLE ;"}, {"label": "list_item", "id": 6, "page_no": 12, "cluster": {"id": 6, "label": "list_item", "bbox": {"l": 136.79959, "t": 275.50591999999995, "r": 547.21222, "b": 296.71871999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.8678944706916809, "cells": [{"id": 18, "text": "2.", "bbox": {"l": 136.79959, "t": 275.50591999999995, "r": 145.18994, "b": 284.7189, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "The other column to mask in this example is the TAX_ID information. In this example, the ", "bbox": {"l": 147.98672, "t": 275.50591999999995, "r": 547.21222, "b": 284.7189, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "rules to enforce include the following ones:", "bbox": {"l": 151.19977, "t": 287.50574, "r": 339.37903, "b": 296.71871999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2. The other column to mask in this example is the TAX_ID information. In this example, the rules to enforce include the following ones:"}, {"label": "list_item", "id": 4, "page_no": 12, "cluster": {"id": 4, "label": "list_item", "bbox": {"l": 152.0394, "t": 304.48553000000004, "r": 469.1528, "b": 313.69852000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9461130499839783, "cells": [{"id": 21, "text": "-", "bbox": {"l": 152.0394, "t": 304.48553000000004, "r": 157.61201, "b": 313.69852000000003, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "Human Resources can see the unmasked TAX_ID of the employees.", "bbox": {"l": 165.59894, "t": 304.48553000000004, "r": 469.1528, "b": 313.69852000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "-Human Resources can see the unmasked TAX_ID of the employees."}, {"label": "list_item", "id": 3, "page_no": 12, "cluster": {"id": 3, "label": "list_item", "bbox": {"l": 152.0394, "t": 321.52512, "r": 403.95953, "b": 330.7381, "coord_origin": "TOPLEFT"}, "confidence": 0.9467734694480896, "cells": [{"id": 23, "text": "-", "bbox": {"l": 152.0394, "t": 321.52512, "r": 157.60504, "b": 330.7381, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "Employees can see only their own unmasked TAX_ID.", "bbox": {"l": 165.59894, "t": 321.52512, "r": 403.95953, "b": 330.7381, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "-Employees can see only their own unmasked TAX_ID."}, {"label": "list_item", "id": 0, "page_no": 12, "cluster": {"id": 0, "label": "list_item", "bbox": {"l": 152.0394, "t": 338.50491, "r": 545.16846, "b": 359.71771, "coord_origin": "TOPLEFT"}, "confidence": 0.9705167412757874, "cells": [{"id": 25, "text": "-", "bbox": {"l": 152.0394, "t": 338.50491, "r": 157.57019, "b": 347.7179, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "Managers see a masked version of TAX_ID with the first five characters replaced with ", "bbox": {"l": 165.59894, "t": 338.50491, "r": 545.16846, "b": 347.7179, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "the X character (for example, XXX-XX-1234).", "bbox": {"l": 165.59894, "t": 350.50473, "r": 364.67947, "b": 359.71771, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "-Managers see a masked version of TAX_ID with the first five characters replaced with the X character (for example, XXX-XX-1234)."}, {"label": "list_item", "id": 2, "page_no": 12, "cluster": {"id": 2, "label": "list_item", "bbox": {"l": 152.0394, "t": 367.48453, "r": 529.46362, "b": 376.6975100000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9469641447067261, "cells": [{"id": 28, "text": "-", "bbox": {"l": 152.0394, "t": 367.48453, "r": 157.59309, "b": 376.6975100000001, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Any other person sees the entire TAX_ID as masked, for example, XXX-XX-XXXX.", "bbox": {"l": 165.59995, "t": 367.48453, "r": 529.46362, "b": 376.6975100000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "-Any other person sees the entire TAX_ID as masked, for example, XXX-XX-XXXX."}, {"label": "list_item", "id": 10, "page_no": 12, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 151.19978, "t": 384.52411, "r": 530.0603, "b": 393.73709, "coord_origin": "TOPLEFT"}, "confidence": 0.7003496885299683, "cells": [{"id": 30, "text": "To implement this column mask, run the SQL statement that is shown in Example 3-9.", "bbox": {"l": 151.19978, "t": 384.52411, "r": 530.0603, "b": 393.73709, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "To implement this column mask, run the SQL statement that is shown in Example 3-9."}, {"label": "caption", "id": 7, "page_no": 12, "cluster": {"id": 7, "label": "caption", "bbox": {"l": 136.8, "t": 406.51801, "r": 351.9873, "b": 414.84302, "coord_origin": "TOPLEFT"}, "confidence": 0.848820149898529, "cells": [{"id": 31, "text": "Example 3-9 Creating a mask on the TAX_ID column", "bbox": {"l": 136.8, "t": 406.51801, "r": 351.9873, "b": 414.84302, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Example 3-9 Creating a mask on the TAX_ID column"}, {"label": "code", "id": 8, "page_no": 12, "cluster": {"id": 8, "label": "code", "bbox": {"l": 136.8, "t": 423.67810000000003, "r": 526.55469, "b": 684.44884, "coord_origin": "TOPLEFT"}, "confidence": 0.8411225080490112, "cells": [{"id": 32, "text": "CREATE MASK", "bbox": {"l": 136.8, "t": 423.67810000000003, "r": 192.91296, "b": 432.45287999999994, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "HR_SCHEMA.MASK_TAX_ID_ON_EMPLOYEES ", "bbox": {"l": 203.11533, "t": 423.67810000000003, "r": 381.65659, "b": 432.45287999999994, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "ON", "bbox": {"l": 136.8, "t": 435.67792, "r": 148.54184, "b": 444.45270000000005, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "HR_SCHEMA.EMPLOYEES AS EMPLOYEES ", "bbox": {"l": 177.89645, "t": 435.67792, "r": 371.63684, "b": 444.45270000000005, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "FOR COLUMN", "bbox": {"l": 136.8, "t": 447.67773, "r": 199.25916, "b": 456.45251, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "TAX_ID", "bbox": {"l": 211.75098, "t": 447.67773, "r": 249.22647, "b": 456.45251, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "RETURN ", "bbox": {"l": 136.8, "t": 459.67755, "r": 176.75952, "b": 468.45233, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "CASE ", "bbox": {"l": 136.8, "t": 471.67737, "r": 161.75977, "b": 480.45215, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'HR' ) = 1", "bbox": {"l": 152.84189, "t": 483.67719, "r": 441.59589, "b": 492.45197, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "THEN EMPLOYEES . TAX_ID ", "bbox": {"l": 154.01309, "t": 495.677, "r": 291.7178, "b": 504.45178, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1 ", "bbox": {"l": 152.80757, "t": 519.67661, "r": 451.6156, "b": 528.45139, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "AND SESSION_USER = EMPLOYEES . USER_ID ", "bbox": {"l": 153.21835, "t": 531.67642, "r": 366.65683, "b": 540.45117, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "THEN EMPLOYEES . TAX_ID", "bbox": {"l": 154.09363, "t": 543.6762200000001, "r": 286.67804, "b": 552.45097, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1", "bbox": {"l": 152.82599, "t": 567.67583, "r": 446.63561999999996, "b": 576.45058, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "AND SESSION_USER <> EMPLOYEES . USER_ID ", "bbox": {"l": 153.18398, "t": 579.67563, "r": 371.63684, "b": 588.45038, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "THEN ( 'XXX-XX-' CONCAT QSYS2 . SUBSTR ( EMPLOYEES . TAX_ID , 8 , 4 ) )", "bbox": {"l": 152.60088, "t": 591.67543, "r": 526.55469, "b": 600.45018, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'EMP' ) = 1 ", "bbox": {"l": 152.80757, "t": 615.67505, "r": 451.6156, "b": 624.4498, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "THEN EMPLOYEES . TAX_ID ", "bbox": {"l": 154.01309, "t": 627.67485, "r": 291.7178, "b": 636.4496, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "ELSE 'XXX-XX-XXXX' ", "bbox": {"l": 154.5134, "t": 651.67447, "r": 266.69827, "b": 660.44922, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "END", "bbox": {"l": 136.8, "t": 663.67427, "r": 157.7877, "b": 672.44904, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "ENABLE ;", "bbox": {"l": 136.8, "t": 675.67409, "r": 181.73952, "b": 684.44884, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "CREATE MASK HR_SCHEMA.MASK_TAX_ID_ON_EMPLOYEES ON HR_SCHEMA.EMPLOYEES AS EMPLOYEES FOR COLUMN TAX_ID RETURN CASE WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'HR' ) = 1 THEN EMPLOYEES . TAX_ID WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1 AND SESSION_USER = EMPLOYEES . USER_ID THEN EMPLOYEES . TAX_ID WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1 AND SESSION_USER <> EMPLOYEES . USER_ID THEN ( 'XXX-XX-' CONCAT QSYS2 . SUBSTR ( EMPLOYEES . TAX_ID , 8 , 4 ) ) WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'EMP' ) = 1 THEN EMPLOYEES . TAX_ID ELSE 'XXX-XX-XXXX' END ENABLE ;"}], "body": [{"label": "text", "id": 13, "page_no": 12, "cluster": {"id": 13, "label": "text", "bbox": {"l": 136.79959, "t": 71.65845000000002, "r": 166.73935, "b": 80.43322999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.5606333613395691, "cells": [{"id": 2, "text": "RETURN", "bbox": {"l": 136.79959, "t": 71.65845000000002, "r": 166.73935, "b": 80.43322999999998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "RETURN"}, {"label": "text", "id": 12, "page_no": 12, "cluster": {"id": 12, "label": "text", "bbox": {"l": 136.79959, "t": 83.65826000000004, "r": 156.77934, "b": 92.43304, "coord_origin": "TOPLEFT"}, "confidence": 0.5897271037101746, "cells": [{"id": 3, "text": "CASE", "bbox": {"l": 136.79959, "t": 83.65826000000004, "r": 156.77934, "b": 92.43304, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "CASE"}, {"label": "code", "id": 9, "page_no": 12, "cluster": {"id": 9, "label": "code", "bbox": {"l": 136.79959, "t": 95.65808000000015, "r": 521.57428, "b": 260.43048, "coord_origin": "TOPLEFT"}, "confidence": 0.7785220146179199, "cells": [{"id": 4, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'HR', 'EMP' ) = 1", "bbox": {"l": 147.26993, "t": 95.65808000000015, "r": 466.61502, "b": 104.43286000000012, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "THEN EMPLOYEES . DATE_OF_BIRTH", "bbox": {"l": 147.73068, "t": 107.65790000000004, "r": 311.69717, "b": 116.43268, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1", "bbox": {"l": 147.31944, "t": 131.65752999999995, "r": 436.61547999999993, "b": 140.43231000000003, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "AND SESSION_USER = EMPLOYEES . USER_ID", "bbox": {"l": 147.54245, "t": 143.65734999999995, "r": 351.65668, "b": 152.43213000000003, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "THEN EMPLOYEES . DATE_OF_BIRTH", "bbox": {"l": 147.73068, "t": 155.65716999999995, "r": 311.69717, "b": 164.43195000000003, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1", "bbox": {"l": 147.31944, "t": 179.65679999999998, "r": 436.61547999999993, "b": 188.43158000000005, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "AND SESSION_USER <> EMPLOYEES . USER_ID", "bbox": {"l": 147.52335, "t": 191.65661999999998, "r": 356.63669, "b": 200.43140000000005, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "THEN ( 9999 || '-' ||", "bbox": {"l": 147.63832, "t": 203.65643, "r": 261.44492, "b": 212.43120999999996, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "MONTH ( EMPLOYEES . DATE_OF_BIRTH ) || '-'", "bbox": {"l": 272.28363, "t": 203.65643, "r": 499.89682, "b": 212.43120999999996, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "||", "bbox": {"l": 510.73557, "t": 203.65643, "r": 521.57428, "b": 212.43120999999996, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "DAY (EMPLOYEES.DATE_OF_BIRTH ))", "bbox": {"l": 160.78555, "t": 215.65625, "r": 346.6767, "b": 224.43102999999996, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "ELSE NULL", "bbox": {"l": 149.51941, "t": 227.65607, "r": 206.75861, "b": 236.43084999999996, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": " END", "bbox": {"l": 136.79959, "t": 239.65588000000002, "r": 156.77934, "b": 248.43066, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": " ENABLE ;", "bbox": {"l": 136.79959, "t": 251.65570000000002, "r": 186.7191, "b": 260.43048, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'HR', 'EMP' ) = 1 THEN EMPLOYEES . DATE_OF_BIRTH WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1 AND SESSION_USER = EMPLOYEES . USER_ID THEN EMPLOYEES . DATE_OF_BIRTH WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1 AND SESSION_USER <> EMPLOYEES . USER_ID THEN ( 9999 || '-' || MONTH ( EMPLOYEES . DATE_OF_BIRTH ) || '-' || DAY (EMPLOYEES.DATE_OF_BIRTH )) ELSE NULL END ENABLE ;"}, {"label": "list_item", "id": 6, "page_no": 12, "cluster": {"id": 6, "label": "list_item", "bbox": {"l": 136.79959, "t": 275.50591999999995, "r": 547.21222, "b": 296.71871999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.8678944706916809, "cells": [{"id": 18, "text": "2.", "bbox": {"l": 136.79959, "t": 275.50591999999995, "r": 145.18994, "b": 284.7189, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "The other column to mask in this example is the TAX_ID information. In this example, the ", "bbox": {"l": 147.98672, "t": 275.50591999999995, "r": 547.21222, "b": 284.7189, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "rules to enforce include the following ones:", "bbox": {"l": 151.19977, "t": 287.50574, "r": 339.37903, "b": 296.71871999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2. The other column to mask in this example is the TAX_ID information. In this example, the rules to enforce include the following ones:"}, {"label": "list_item", "id": 4, "page_no": 12, "cluster": {"id": 4, "label": "list_item", "bbox": {"l": 152.0394, "t": 304.48553000000004, "r": 469.1528, "b": 313.69852000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9461130499839783, "cells": [{"id": 21, "text": "-", "bbox": {"l": 152.0394, "t": 304.48553000000004, "r": 157.61201, "b": 313.69852000000003, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "Human Resources can see the unmasked TAX_ID of the employees.", "bbox": {"l": 165.59894, "t": 304.48553000000004, "r": 469.1528, "b": 313.69852000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "-Human Resources can see the unmasked TAX_ID of the employees."}, {"label": "list_item", "id": 3, "page_no": 12, "cluster": {"id": 3, "label": "list_item", "bbox": {"l": 152.0394, "t": 321.52512, "r": 403.95953, "b": 330.7381, "coord_origin": "TOPLEFT"}, "confidence": 0.9467734694480896, "cells": [{"id": 23, "text": "-", "bbox": {"l": 152.0394, "t": 321.52512, "r": 157.60504, "b": 330.7381, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "Employees can see only their own unmasked TAX_ID.", "bbox": {"l": 165.59894, "t": 321.52512, "r": 403.95953, "b": 330.7381, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "-Employees can see only their own unmasked TAX_ID."}, {"label": "list_item", "id": 0, "page_no": 12, "cluster": {"id": 0, "label": "list_item", "bbox": {"l": 152.0394, "t": 338.50491, "r": 545.16846, "b": 359.71771, "coord_origin": "TOPLEFT"}, "confidence": 0.9705167412757874, "cells": [{"id": 25, "text": "-", "bbox": {"l": 152.0394, "t": 338.50491, "r": 157.57019, "b": 347.7179, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "Managers see a masked version of TAX_ID with the first five characters replaced with ", "bbox": {"l": 165.59894, "t": 338.50491, "r": 545.16846, "b": 347.7179, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "the X character (for example, XXX-XX-1234).", "bbox": {"l": 165.59894, "t": 350.50473, "r": 364.67947, "b": 359.71771, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "-Managers see a masked version of TAX_ID with the first five characters replaced with the X character (for example, XXX-XX-1234)."}, {"label": "list_item", "id": 2, "page_no": 12, "cluster": {"id": 2, "label": "list_item", "bbox": {"l": 152.0394, "t": 367.48453, "r": 529.46362, "b": 376.6975100000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9469641447067261, "cells": [{"id": 28, "text": "-", "bbox": {"l": 152.0394, "t": 367.48453, "r": 157.59309, "b": 376.6975100000001, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Any other person sees the entire TAX_ID as masked, for example, XXX-XX-XXXX.", "bbox": {"l": 165.59995, "t": 367.48453, "r": 529.46362, "b": 376.6975100000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "-Any other person sees the entire TAX_ID as masked, for example, XXX-XX-XXXX."}, {"label": "list_item", "id": 10, "page_no": 12, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 151.19978, "t": 384.52411, "r": 530.0603, "b": 393.73709, "coord_origin": "TOPLEFT"}, "confidence": 0.7003496885299683, "cells": [{"id": 30, "text": "To implement this column mask, run the SQL statement that is shown in Example 3-9.", "bbox": {"l": 151.19978, "t": 384.52411, "r": 530.0603, "b": 393.73709, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "To implement this column mask, run the SQL statement that is shown in Example 3-9."}, {"label": "caption", "id": 7, "page_no": 12, "cluster": {"id": 7, "label": "caption", "bbox": {"l": 136.8, "t": 406.51801, "r": 351.9873, "b": 414.84302, "coord_origin": "TOPLEFT"}, "confidence": 0.848820149898529, "cells": [{"id": 31, "text": "Example 3-9 Creating a mask on the TAX_ID column", "bbox": {"l": 136.8, "t": 406.51801, "r": 351.9873, "b": 414.84302, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Example 3-9 Creating a mask on the TAX_ID column"}, {"label": "code", "id": 8, "page_no": 12, "cluster": {"id": 8, "label": "code", "bbox": {"l": 136.8, "t": 423.67810000000003, "r": 526.55469, "b": 684.44884, "coord_origin": "TOPLEFT"}, "confidence": 0.8411225080490112, "cells": [{"id": 32, "text": "CREATE MASK", "bbox": {"l": 136.8, "t": 423.67810000000003, "r": 192.91296, "b": 432.45287999999994, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "HR_SCHEMA.MASK_TAX_ID_ON_EMPLOYEES ", "bbox": {"l": 203.11533, "t": 423.67810000000003, "r": 381.65659, "b": 432.45287999999994, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "ON", "bbox": {"l": 136.8, "t": 435.67792, "r": 148.54184, "b": 444.45270000000005, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "HR_SCHEMA.EMPLOYEES AS EMPLOYEES ", "bbox": {"l": 177.89645, "t": 435.67792, "r": 371.63684, "b": 444.45270000000005, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "FOR COLUMN", "bbox": {"l": 136.8, "t": 447.67773, "r": 199.25916, "b": 456.45251, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "TAX_ID", "bbox": {"l": 211.75098, "t": 447.67773, "r": 249.22647, "b": 456.45251, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "RETURN ", "bbox": {"l": 136.8, "t": 459.67755, "r": 176.75952, "b": 468.45233, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "CASE ", "bbox": {"l": 136.8, "t": 471.67737, "r": 161.75977, "b": 480.45215, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'HR' ) = 1", "bbox": {"l": 152.84189, "t": 483.67719, "r": 441.59589, "b": 492.45197, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "THEN EMPLOYEES . TAX_ID ", "bbox": {"l": 154.01309, "t": 495.677, "r": 291.7178, "b": 504.45178, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1 ", "bbox": {"l": 152.80757, "t": 519.67661, "r": 451.6156, "b": 528.45139, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "AND SESSION_USER = EMPLOYEES . USER_ID ", "bbox": {"l": 153.21835, "t": 531.67642, "r": 366.65683, "b": 540.45117, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "THEN EMPLOYEES . TAX_ID", "bbox": {"l": 154.09363, "t": 543.6762200000001, "r": 286.67804, "b": 552.45097, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1", "bbox": {"l": 152.82599, "t": 567.67583, "r": 446.63561999999996, "b": 576.45058, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "AND SESSION_USER <> EMPLOYEES . USER_ID ", "bbox": {"l": 153.18398, "t": 579.67563, "r": 371.63684, "b": 588.45038, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "THEN ( 'XXX-XX-' CONCAT QSYS2 . SUBSTR ( EMPLOYEES . TAX_ID , 8 , 4 ) )", "bbox": {"l": 152.60088, "t": 591.67543, "r": 526.55469, "b": 600.45018, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'EMP' ) = 1 ", "bbox": {"l": 152.80757, "t": 615.67505, "r": 451.6156, "b": 624.4498, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "THEN EMPLOYEES . TAX_ID ", "bbox": {"l": 154.01309, "t": 627.67485, "r": 291.7178, "b": 636.4496, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "ELSE 'XXX-XX-XXXX' ", "bbox": {"l": 154.5134, "t": 651.67447, "r": 266.69827, "b": 660.44922, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "END", "bbox": {"l": 136.8, "t": 663.67427, "r": 157.7877, "b": 672.44904, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "ENABLE ;", "bbox": {"l": 136.8, "t": 675.67409, "r": 181.73952, "b": 684.44884, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "CREATE MASK HR_SCHEMA.MASK_TAX_ID_ON_EMPLOYEES ON HR_SCHEMA.EMPLOYEES AS EMPLOYEES FOR COLUMN TAX_ID RETURN CASE WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'HR' ) = 1 THEN EMPLOYEES . TAX_ID WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1 AND SESSION_USER = EMPLOYEES . USER_ID THEN EMPLOYEES . TAX_ID WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1 AND SESSION_USER <> EMPLOYEES . USER_ID THEN ( 'XXX-XX-' CONCAT QSYS2 . SUBSTR ( EMPLOYEES . TAX_ID , 8 , 4 ) ) WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'EMP' ) = 1 THEN EMPLOYEES . TAX_ID ELSE 'XXX-XX-XXXX' END ENABLE ;"}], "headers": [{"label": "page_footer", "id": 1, "page_no": 12, "cluster": {"id": 1, "label": "page_footer", "bbox": {"l": 344.94, "t": 755.538002, "r": 523.60162, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9556925892829895, "cells": [{"id": 0, "text": "Chapter 3. Row and Column Access Control ", "bbox": {"l": 344.94, "t": 755.538002, "r": 523.60162, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Chapter 3. Row and Column Access Control"}, {"label": "page_footer", "id": 5, "page_no": 12, "cluster": {"id": 5, "label": "page_footer", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.910578727722168, "cells": [{"id": 1, "text": "27", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "27"}]}}, {"page_no": 13, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "28 ", "bbox": {"l": 64.800003, "t": 754.848721, "r": 78.402, "b": 764.06172, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Row and Column Access Control Support in IBM DB2 for i", "bbox": {"l": 93.420303, "t": 755.538002, "r": 334.42142, "b": 763.863001, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "3.", "bbox": {"l": 136.8, "t": 71.50867000000005, "r": 145.22156, "b": 80.72167999999999, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Figure 3-10 shows the masks that are created in the HR_SCHEMA.", "bbox": {"l": 148.02872, "t": 71.50867000000005, "r": 449.9523899999999, "b": 80.72167999999999, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Figure 3-10 Column masks shown in System i Navigator", "bbox": {"l": 64.800003, "t": 173.53801999999996, "r": 293.13809, "b": 181.86298, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "3.6.6", "bbox": {"l": 64.800003, "t": 202.37469, "r": 94.275139, "b": 214.36273000000006, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Activating RCAC", "bbox": {"l": 97.959534, "t": 202.37469, "r": 203.98521, "b": 214.36273000000006, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Now that you have created the row permission and the two column masks, RCAC must be ", "bbox": {"l": 136.8, "t": 228.52868999999998, "r": 537.09131, "b": 237.74170000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "activated. The row permission and the two column masks are enabled (last clause in the ", "bbox": {"l": 136.8, "t": 240.5285, "r": 529.20422, "b": 249.74152000000004, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "scripts), but now you must activate RCAC on the table. To do so, complete the following steps:", "bbox": {"l": 136.8, "t": 252.52832, "r": 547.22565, "b": 261.74132999999995, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "1.", "bbox": {"l": 136.8, "t": 269.50811999999996, "r": 145.32378, "b": 278.72113, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Run the SQL statements that are shown in Example 3-10.", "bbox": {"l": 148.16501, "t": 269.50811999999996, "r": 409.47888, "b": 278.72113, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Example 3-10 Activating RCAC on the EMPLOYEES table ", "bbox": {"l": 136.8, "t": 291.55798, "r": 375.29099, "b": 299.88300000000004, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "/*", "bbox": {"l": 136.8, "t": 308.65811, "r": 147.22942, "b": 317.43289, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Active Row Access Control (permissions) */", "bbox": {"l": 157.65884, "t": 308.65811, "r": 376.67661, "b": 317.43289, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "/*", "bbox": {"l": 136.8, "t": 320.65793, "r": 147.70349, "b": 329.43271, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Active Column Access Control (masks)", "bbox": {"l": 158.60696, "t": 320.65793, "r": 354.86963, "b": 329.43271, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "*/", "bbox": {"l": 365.77313, "t": 320.65793, "r": 376.67661, "b": 329.43271, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "ALTER TABLE HR_SCHEMA.EMPLOYEES", "bbox": {"l": 136.8, "t": 332.65775, "r": 291.7178, "b": 341.43253, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "ACTIVATE ROW ACCESS CONTROL", "bbox": {"l": 136.8, "t": 344.65756, "r": 271.67831, "b": 353.43234000000007, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "ACTIVATE COLUMN ACCESS CONTROL;", "bbox": {"l": 136.8, "t": 356.65738, "r": 291.7178, "b": 365.43216, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "2.", "bbox": {"l": 136.8, "t": 380.5076, "r": 145.14954, "b": 389.72058, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "Look at the definition of the EMPLOYEE table, as shown in Figure 3-11. To do this, from ", "bbox": {"l": 147.93271, "t": 380.5076, "r": 540.80145, "b": 389.72058, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "the main navigation pane of System i Navigator, click ", "bbox": {"l": 151.20013, "t": 392.50742, "r": 387.36169, "b": 401.7203999999999, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "Schemas", "bbox": {"l": 387.29993, "t": 392.50742, "r": 431.07614, "b": 401.7203999999999, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "\uf0ae", "bbox": {"l": 433.85992000000005, "t": 389.64889999999997, "r": 443.69043, "b": 401.83994, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "HR_SCHEMA", "bbox": {"l": 446.51906999999994, "t": 392.50742, "r": 509.73618000000005, "b": 401.7203999999999, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "\uf0ae", "bbox": {"l": 512.5788, "t": 389.64889999999997, "r": 522.4093, "b": 401.83994, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Tables", "bbox": {"l": 151.19812, "t": 404.50723000000005, "r": 181.12892, "b": 413.72021, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": ", right-click the ", "bbox": {"l": 181.79823, "t": 404.50723000000005, "r": 248.99638, "b": 413.72021, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "EMPLOYEES", "bbox": {"l": 248.93860000000004, "t": 404.50723000000005, "r": 310.44357, "b": 413.72021, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": " table, and click ", "bbox": {"l": 310.49835, "t": 404.50723000000005, "r": 381.53305, "b": 413.72021, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Definition", "bbox": {"l": 381.59882, "t": 404.50723000000005, "r": 427.68176, "b": 413.72021, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": ".", "bbox": {"l": 427.67877, "t": 404.50723000000005, "r": 430.4476599999999, "b": 413.72021, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Figure 3-11 Selecting the EMPLOYEES table from System i Navigator", "bbox": {"l": 64.800003, "t": 649.0378900000001, "r": 347.43054, "b": 657.3629, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 8, "label": "page_footer", "bbox": {"l": 64.800003, "t": 754.848721, "r": 78.402, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.9161999821662903, "cells": [{"id": 0, "text": "28 ", "bbox": {"l": 64.800003, "t": 754.848721, "r": 78.402, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "page_footer", "bbox": {"l": 93.420303, "t": 755.538002, "r": 334.42142, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9540064334869385, "cells": [{"id": 1, "text": "Row and Column Access Control Support in IBM DB2 for i", "bbox": {"l": 93.420303, "t": 755.538002, "r": 334.42142, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "list_item", "bbox": {"l": 136.8, "t": 71.50867000000005, "r": 449.9523899999999, "b": 80.72167999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.8751050233840942, "cells": [{"id": 2, "text": "3.", "bbox": {"l": 136.8, "t": 71.50867000000005, "r": 145.22156, "b": 80.72167999999999, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Figure 3-10 shows the masks that are created in the HR_SCHEMA.", "bbox": {"l": 148.02872, "t": 71.50867000000005, "r": 449.9523899999999, "b": 80.72167999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "caption", "bbox": {"l": 64.800003, "t": 173.53801999999996, "r": 293.13809, "b": 181.86298, "coord_origin": "TOPLEFT"}, "confidence": 0.944426953792572, "cells": [{"id": 4, "text": "Figure 3-10 Column masks shown in System i Navigator", "bbox": {"l": 64.800003, "t": 173.53801999999996, "r": 293.13809, "b": 181.86298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "section_header", "bbox": {"l": 64.800003, "t": 202.37469, "r": 203.98521, "b": 214.36273000000006, "coord_origin": "TOPLEFT"}, "confidence": 0.9645015001296997, "cells": [{"id": 5, "text": "3.6.6", "bbox": {"l": 64.800003, "t": 202.37469, "r": 94.275139, "b": 214.36273000000006, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Activating RCAC", "bbox": {"l": 97.959534, "t": 202.37469, "r": 203.98521, "b": 214.36273000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 136.8, "t": 228.52868999999998, "r": 547.22565, "b": 261.74132999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9768574237823486, "cells": [{"id": 7, "text": "Now that you have created the row permission and the two column masks, RCAC must be ", "bbox": {"l": 136.8, "t": 228.52868999999998, "r": 537.09131, "b": 237.74170000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "activated. The row permission and the two column masks are enabled (last clause in the ", "bbox": {"l": 136.8, "t": 240.5285, "r": 529.20422, "b": 249.74152000000004, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "scripts), but now you must activate RCAC on the table. To do so, complete the following steps:", "bbox": {"l": 136.8, "t": 252.52832, "r": 547.22565, "b": 261.74132999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "list_item", "bbox": {"l": 136.8, "t": 269.50811999999996, "r": 409.47888, "b": 278.72113, "coord_origin": "TOPLEFT"}, "confidence": 0.9059441685676575, "cells": [{"id": 10, "text": "1.", "bbox": {"l": 136.8, "t": 269.50811999999996, "r": 145.32378, "b": 278.72113, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Run the SQL statements that are shown in Example 3-10.", "bbox": {"l": 148.16501, "t": 269.50811999999996, "r": 409.47888, "b": 278.72113, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "section_header", "bbox": {"l": 136.8, "t": 291.55798, "r": 375.29099, "b": 299.88300000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.6570101976394653, "cells": [{"id": 12, "text": "Example 3-10 Activating RCAC on the EMPLOYEES table ", "bbox": {"l": 136.8, "t": 291.55798, "r": 375.29099, "b": 299.88300000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "list_item", "bbox": {"l": 136.8, "t": 308.65811, "r": 376.67661, "b": 317.43289, "coord_origin": "TOPLEFT"}, "confidence": 0.600240170955658, "cells": [{"id": 13, "text": "/*", "bbox": {"l": 136.8, "t": 308.65811, "r": 147.22942, "b": 317.43289, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Active Row Access Control (permissions) */", "bbox": {"l": 157.65884, "t": 308.65811, "r": 376.67661, "b": 317.43289, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "list_item", "bbox": {"l": 136.8, "t": 320.65793, "r": 354.86963, "b": 329.43271, "coord_origin": "TOPLEFT"}, "confidence": 0.5985856056213379, "cells": [{"id": 15, "text": "/*", "bbox": {"l": 136.8, "t": 320.65793, "r": 147.70349, "b": 329.43271, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Active Column Access Control (masks)", "bbox": {"l": 158.60696, "t": 320.65793, "r": 354.86963, "b": 329.43271, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 365.77313, "t": 320.65793, "r": 376.67661, "b": 329.43271, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "*/", "bbox": {"l": 365.77313, "t": 320.65793, "r": 376.67661, "b": 329.43271, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 136.8, "t": 332.65775, "r": 291.7178, "b": 341.43253, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "ALTER TABLE HR_SCHEMA.EMPLOYEES", "bbox": {"l": 136.8, "t": 332.65775, "r": 291.7178, "b": 341.43253, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 136.8, "t": 344.65756, "r": 271.67831, "b": 353.43234000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "ACTIVATE ROW ACCESS CONTROL", "bbox": {"l": 136.8, "t": 344.65756, "r": 271.67831, "b": 353.43234000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 136.8, "t": 356.65738, "r": 291.7178, "b": 365.43216, "coord_origin": "TOPLEFT"}, "confidence": 0.5431806445121765, "cells": [{"id": 20, "text": "ACTIVATE COLUMN ACCESS CONTROL;", "bbox": {"l": 136.8, "t": 356.65738, "r": 291.7178, "b": 365.43216, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "list_item", "bbox": {"l": 136.8, "t": 380.5076, "r": 540.80145, "b": 413.72021, "coord_origin": "TOPLEFT"}, "confidence": 0.9449256062507629, "cells": [{"id": 21, "text": "2.", "bbox": {"l": 136.8, "t": 380.5076, "r": 145.14954, "b": 389.72058, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "Look at the definition of the EMPLOYEE table, as shown in Figure 3-11. To do this, from ", "bbox": {"l": 147.93271, "t": 380.5076, "r": 540.80145, "b": 389.72058, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "the main navigation pane of System i Navigator, click ", "bbox": {"l": 151.20013, "t": 392.50742, "r": 387.36169, "b": 401.7203999999999, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "Schemas", "bbox": {"l": 387.29993, "t": 392.50742, "r": 431.07614, "b": 401.7203999999999, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "\uf0ae", "bbox": {"l": 433.85992000000005, "t": 389.64889999999997, "r": 443.69043, "b": 401.83994, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "HR_SCHEMA", "bbox": {"l": 446.51906999999994, "t": 392.50742, "r": 509.73618000000005, "b": 401.7203999999999, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "\uf0ae", "bbox": {"l": 512.5788, "t": 389.64889999999997, "r": 522.4093, "b": 401.83994, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Tables", "bbox": {"l": 151.19812, "t": 404.50723000000005, "r": 181.12892, "b": 413.72021, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": ", right-click the ", "bbox": {"l": 181.79823, "t": 404.50723000000005, "r": 248.99638, "b": 413.72021, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "EMPLOYEES", "bbox": {"l": 248.93860000000004, "t": 404.50723000000005, "r": 310.44357, "b": 413.72021, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": " table, and click ", "bbox": {"l": 310.49835, "t": 404.50723000000005, "r": 381.53305, "b": 413.72021, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Definition", "bbox": {"l": 381.59882, "t": 404.50723000000005, "r": 427.68176, "b": 413.72021, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": ".", "bbox": {"l": 427.67877, "t": 404.50723000000005, "r": 430.4476599999999, "b": 413.72021, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "caption", "bbox": {"l": 64.800003, "t": 649.0378900000001, "r": 347.43054, "b": 657.3629, "coord_origin": "TOPLEFT"}, "confidence": 0.9499983787536621, "cells": [{"id": 34, "text": "Figure 3-11 Selecting the EMPLOYEES table from System i Navigator", "bbox": {"l": 64.800003, "t": 649.0378900000001, "r": 347.43054, "b": 657.3629, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "picture", "bbox": {"l": 63.80192184448242, "t": 95.38238525390625, "r": 547.11474609375, "b": 170.0321044921875, "coord_origin": "TOPLEFT"}, "confidence": 0.9635388851165771, "cells": [], "children": []}, {"id": 0, "label": "picture", "bbox": {"l": 63.985130310058594, "t": 427.9049987792969, "r": 530.0478515625, "b": 646.1395874023438, "coord_origin": "TOPLEFT"}, "confidence": 0.9801458716392517, "cells": [], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_footer", "id": 8, "page_no": 13, "cluster": {"id": 8, "label": "page_footer", "bbox": {"l": 64.800003, "t": 754.848721, "r": 78.402, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.9161999821662903, "cells": [{"id": 0, "text": "28 ", "bbox": {"l": 64.800003, "t": 754.848721, "r": 78.402, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "28"}, {"label": "page_footer", "id": 4, "page_no": 13, "cluster": {"id": 4, "label": "page_footer", "bbox": {"l": 93.420303, "t": 755.538002, "r": 334.42142, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9540064334869385, "cells": [{"id": 1, "text": "Row and Column Access Control Support in IBM DB2 for i", "bbox": {"l": 93.420303, "t": 755.538002, "r": 334.42142, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Row and Column Access Control Support in IBM DB2 for i"}, {"label": "list_item", "id": 10, "page_no": 13, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 136.8, "t": 71.50867000000005, "r": 449.9523899999999, "b": 80.72167999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.8751050233840942, "cells": [{"id": 2, "text": "3.", "bbox": {"l": 136.8, "t": 71.50867000000005, "r": 145.22156, "b": 80.72167999999999, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Figure 3-10 shows the masks that are created in the HR_SCHEMA.", "bbox": {"l": 148.02872, "t": 71.50867000000005, "r": 449.9523899999999, "b": 80.72167999999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3. Figure 3-10 shows the masks that are created in the HR_SCHEMA."}, {"label": "caption", "id": 7, "page_no": 13, "cluster": {"id": 7, "label": "caption", "bbox": {"l": 64.800003, "t": 173.53801999999996, "r": 293.13809, "b": 181.86298, "coord_origin": "TOPLEFT"}, "confidence": 0.944426953792572, "cells": [{"id": 4, "text": "Figure 3-10 Column masks shown in System i Navigator", "bbox": {"l": 64.800003, "t": 173.53801999999996, "r": 293.13809, "b": 181.86298, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 3-10 Column masks shown in System i Navigator"}, {"label": "section_header", "id": 2, "page_no": 13, "cluster": {"id": 2, "label": "section_header", "bbox": {"l": 64.800003, "t": 202.37469, "r": 203.98521, "b": 214.36273000000006, "coord_origin": "TOPLEFT"}, "confidence": 0.9645015001296997, "cells": [{"id": 5, "text": "3.6.6", "bbox": {"l": 64.800003, "t": 202.37469, "r": 94.275139, "b": 214.36273000000006, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Activating RCAC", "bbox": {"l": 97.959534, "t": 202.37469, "r": 203.98521, "b": 214.36273000000006, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3.6.6 Activating RCAC"}, {"label": "text", "id": 1, "page_no": 13, "cluster": {"id": 1, "label": "text", "bbox": {"l": 136.8, "t": 228.52868999999998, "r": 547.22565, "b": 261.74132999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9768574237823486, "cells": [{"id": 7, "text": "Now that you have created the row permission and the two column masks, RCAC must be ", "bbox": {"l": 136.8, "t": 228.52868999999998, "r": 537.09131, "b": 237.74170000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "activated. The row permission and the two column masks are enabled (last clause in the ", "bbox": {"l": 136.8, "t": 240.5285, "r": 529.20422, "b": 249.74152000000004, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "scripts), but now you must activate RCAC on the table. To do so, complete the following steps:", "bbox": {"l": 136.8, "t": 252.52832, "r": 547.22565, "b": 261.74132999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Now that you have created the row permission and the two column masks, RCAC must be activated. The row permission and the two column masks are enabled (last clause in the scripts), but now you must activate RCAC on the table. To do so, complete the following steps:"}, {"label": "list_item", "id": 9, "page_no": 13, "cluster": {"id": 9, "label": "list_item", "bbox": {"l": 136.8, "t": 269.50811999999996, "r": 409.47888, "b": 278.72113, "coord_origin": "TOPLEFT"}, "confidence": 0.9059441685676575, "cells": [{"id": 10, "text": "1.", "bbox": {"l": 136.8, "t": 269.50811999999996, "r": 145.32378, "b": 278.72113, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Run the SQL statements that are shown in Example 3-10.", "bbox": {"l": 148.16501, "t": 269.50811999999996, "r": 409.47888, "b": 278.72113, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1. Run the SQL statements that are shown in Example 3-10."}, {"label": "section_header", "id": 11, "page_no": 13, "cluster": {"id": 11, "label": "section_header", "bbox": {"l": 136.8, "t": 291.55798, "r": 375.29099, "b": 299.88300000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.6570101976394653, "cells": [{"id": 12, "text": "Example 3-10 Activating RCAC on the EMPLOYEES table ", "bbox": {"l": 136.8, "t": 291.55798, "r": 375.29099, "b": 299.88300000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Example 3-10 Activating RCAC on the EMPLOYEES table"}, {"label": "list_item", "id": 13, "page_no": 13, "cluster": {"id": 13, "label": "list_item", "bbox": {"l": 136.8, "t": 308.65811, "r": 376.67661, "b": 317.43289, "coord_origin": "TOPLEFT"}, "confidence": 0.600240170955658, "cells": [{"id": 13, "text": "/*", "bbox": {"l": 136.8, "t": 308.65811, "r": 147.22942, "b": 317.43289, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Active Row Access Control (permissions) */", "bbox": {"l": 157.65884, "t": 308.65811, "r": 376.67661, "b": 317.43289, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "/* Active Row Access Control (permissions) */"}, {"label": "list_item", "id": 14, "page_no": 13, "cluster": {"id": 14, "label": "list_item", "bbox": {"l": 136.8, "t": 320.65793, "r": 354.86963, "b": 329.43271, "coord_origin": "TOPLEFT"}, "confidence": 0.5985856056213379, "cells": [{"id": 15, "text": "/*", "bbox": {"l": 136.8, "t": 320.65793, "r": 147.70349, "b": 329.43271, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Active Column Access Control (masks)", "bbox": {"l": 158.60696, "t": 320.65793, "r": 354.86963, "b": 329.43271, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "/* Active Column Access Control (masks)"}, {"label": "text", "id": 16, "page_no": 13, "cluster": {"id": 16, "label": "text", "bbox": {"l": 365.77313, "t": 320.65793, "r": 376.67661, "b": 329.43271, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "*/", "bbox": {"l": 365.77313, "t": 320.65793, "r": 376.67661, "b": 329.43271, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "*/"}, {"label": "text", "id": 17, "page_no": 13, "cluster": {"id": 17, "label": "text", "bbox": {"l": 136.8, "t": 332.65775, "r": 291.7178, "b": 341.43253, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "ALTER TABLE HR_SCHEMA.EMPLOYEES", "bbox": {"l": 136.8, "t": 332.65775, "r": 291.7178, "b": 341.43253, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "ALTER TABLE HR_SCHEMA.EMPLOYEES"}, {"label": "text", "id": 18, "page_no": 13, "cluster": {"id": 18, "label": "text", "bbox": {"l": 136.8, "t": 344.65756, "r": 271.67831, "b": 353.43234000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "ACTIVATE ROW ACCESS CONTROL", "bbox": {"l": 136.8, "t": 344.65756, "r": 271.67831, "b": 353.43234000000007, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "ACTIVATE ROW ACCESS CONTROL"}, {"label": "text", "id": 15, "page_no": 13, "cluster": {"id": 15, "label": "text", "bbox": {"l": 136.8, "t": 356.65738, "r": 291.7178, "b": 365.43216, "coord_origin": "TOPLEFT"}, "confidence": 0.5431806445121765, "cells": [{"id": 20, "text": "ACTIVATE COLUMN ACCESS CONTROL;", "bbox": {"l": 136.8, "t": 356.65738, "r": 291.7178, "b": 365.43216, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "ACTIVATE COLUMN ACCESS CONTROL;"}, {"label": "list_item", "id": 6, "page_no": 13, "cluster": {"id": 6, "label": "list_item", "bbox": {"l": 136.8, "t": 380.5076, "r": 540.80145, "b": 413.72021, "coord_origin": "TOPLEFT"}, "confidence": 0.9449256062507629, "cells": [{"id": 21, "text": "2.", "bbox": {"l": 136.8, "t": 380.5076, "r": 145.14954, "b": 389.72058, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "Look at the definition of the EMPLOYEE table, as shown in Figure 3-11. To do this, from ", "bbox": {"l": 147.93271, "t": 380.5076, "r": 540.80145, "b": 389.72058, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "the main navigation pane of System i Navigator, click ", "bbox": {"l": 151.20013, "t": 392.50742, "r": 387.36169, "b": 401.7203999999999, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "Schemas", "bbox": {"l": 387.29993, "t": 392.50742, "r": 431.07614, "b": 401.7203999999999, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "\uf0ae", "bbox": {"l": 433.85992000000005, "t": 389.64889999999997, "r": 443.69043, "b": 401.83994, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "HR_SCHEMA", "bbox": {"l": 446.51906999999994, "t": 392.50742, "r": 509.73618000000005, "b": 401.7203999999999, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "\uf0ae", "bbox": {"l": 512.5788, "t": 389.64889999999997, "r": 522.4093, "b": 401.83994, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Tables", "bbox": {"l": 151.19812, "t": 404.50723000000005, "r": 181.12892, "b": 413.72021, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": ", right-click the ", "bbox": {"l": 181.79823, "t": 404.50723000000005, "r": 248.99638, "b": 413.72021, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "EMPLOYEES", "bbox": {"l": 248.93860000000004, "t": 404.50723000000005, "r": 310.44357, "b": 413.72021, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": " table, and click ", "bbox": {"l": 310.49835, "t": 404.50723000000005, "r": 381.53305, "b": 413.72021, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Definition", "bbox": {"l": 381.59882, "t": 404.50723000000005, "r": 427.68176, "b": 413.72021, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": ".", "bbox": {"l": 427.67877, "t": 404.50723000000005, "r": 430.4476599999999, "b": 413.72021, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2. Look at the definition of the EMPLOYEE table, as shown in Figure 3-11. To do this, from the main navigation pane of System i Navigator, click Schemas \uf0ae HR_SCHEMA \uf0ae Tables , right-click the EMPLOYEES table, and click Definition ."}, {"label": "caption", "id": 5, "page_no": 13, "cluster": {"id": 5, "label": "caption", "bbox": {"l": 64.800003, "t": 649.0378900000001, "r": 347.43054, "b": 657.3629, "coord_origin": "TOPLEFT"}, "confidence": 0.9499983787536621, "cells": [{"id": 34, "text": "Figure 3-11 Selecting the EMPLOYEES table from System i Navigator", "bbox": {"l": 64.800003, "t": 649.0378900000001, "r": 347.43054, "b": 657.3629, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 3-11 Selecting the EMPLOYEES table from System i Navigator"}, {"label": "picture", "id": 3, "page_no": 13, "cluster": {"id": 3, "label": "picture", "bbox": {"l": 63.80192184448242, "t": 95.38238525390625, "r": 547.11474609375, "b": 170.0321044921875, "coord_origin": "TOPLEFT"}, "confidence": 0.9635388851165771, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "picture", "id": 0, "page_no": 13, "cluster": {"id": 0, "label": "picture", "bbox": {"l": 63.985130310058594, "t": 427.9049987792969, "r": 530.0478515625, "b": 646.1395874023438, "coord_origin": "TOPLEFT"}, "confidence": 0.9801458716392517, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "body": [{"label": "list_item", "id": 10, "page_no": 13, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 136.8, "t": 71.50867000000005, "r": 449.9523899999999, "b": 80.72167999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.8751050233840942, "cells": [{"id": 2, "text": "3.", "bbox": {"l": 136.8, "t": 71.50867000000005, "r": 145.22156, "b": 80.72167999999999, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Figure 3-10 shows the masks that are created in the HR_SCHEMA.", "bbox": {"l": 148.02872, "t": 71.50867000000005, "r": 449.9523899999999, "b": 80.72167999999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3. Figure 3-10 shows the masks that are created in the HR_SCHEMA."}, {"label": "caption", "id": 7, "page_no": 13, "cluster": {"id": 7, "label": "caption", "bbox": {"l": 64.800003, "t": 173.53801999999996, "r": 293.13809, "b": 181.86298, "coord_origin": "TOPLEFT"}, "confidence": 0.944426953792572, "cells": [{"id": 4, "text": "Figure 3-10 Column masks shown in System i Navigator", "bbox": {"l": 64.800003, "t": 173.53801999999996, "r": 293.13809, "b": 181.86298, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 3-10 Column masks shown in System i Navigator"}, {"label": "section_header", "id": 2, "page_no": 13, "cluster": {"id": 2, "label": "section_header", "bbox": {"l": 64.800003, "t": 202.37469, "r": 203.98521, "b": 214.36273000000006, "coord_origin": "TOPLEFT"}, "confidence": 0.9645015001296997, "cells": [{"id": 5, "text": "3.6.6", "bbox": {"l": 64.800003, "t": 202.37469, "r": 94.275139, "b": 214.36273000000006, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Activating RCAC", "bbox": {"l": 97.959534, "t": 202.37469, "r": 203.98521, "b": 214.36273000000006, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3.6.6 Activating RCAC"}, {"label": "text", "id": 1, "page_no": 13, "cluster": {"id": 1, "label": "text", "bbox": {"l": 136.8, "t": 228.52868999999998, "r": 547.22565, "b": 261.74132999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9768574237823486, "cells": [{"id": 7, "text": "Now that you have created the row permission and the two column masks, RCAC must be ", "bbox": {"l": 136.8, "t": 228.52868999999998, "r": 537.09131, "b": 237.74170000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "activated. The row permission and the two column masks are enabled (last clause in the ", "bbox": {"l": 136.8, "t": 240.5285, "r": 529.20422, "b": 249.74152000000004, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "scripts), but now you must activate RCAC on the table. To do so, complete the following steps:", "bbox": {"l": 136.8, "t": 252.52832, "r": 547.22565, "b": 261.74132999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Now that you have created the row permission and the two column masks, RCAC must be activated. The row permission and the two column masks are enabled (last clause in the scripts), but now you must activate RCAC on the table. To do so, complete the following steps:"}, {"label": "list_item", "id": 9, "page_no": 13, "cluster": {"id": 9, "label": "list_item", "bbox": {"l": 136.8, "t": 269.50811999999996, "r": 409.47888, "b": 278.72113, "coord_origin": "TOPLEFT"}, "confidence": 0.9059441685676575, "cells": [{"id": 10, "text": "1.", "bbox": {"l": 136.8, "t": 269.50811999999996, "r": 145.32378, "b": 278.72113, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Run the SQL statements that are shown in Example 3-10.", "bbox": {"l": 148.16501, "t": 269.50811999999996, "r": 409.47888, "b": 278.72113, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1. Run the SQL statements that are shown in Example 3-10."}, {"label": "section_header", "id": 11, "page_no": 13, "cluster": {"id": 11, "label": "section_header", "bbox": {"l": 136.8, "t": 291.55798, "r": 375.29099, "b": 299.88300000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.6570101976394653, "cells": [{"id": 12, "text": "Example 3-10 Activating RCAC on the EMPLOYEES table ", "bbox": {"l": 136.8, "t": 291.55798, "r": 375.29099, "b": 299.88300000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Example 3-10 Activating RCAC on the EMPLOYEES table"}, {"label": "list_item", "id": 13, "page_no": 13, "cluster": {"id": 13, "label": "list_item", "bbox": {"l": 136.8, "t": 308.65811, "r": 376.67661, "b": 317.43289, "coord_origin": "TOPLEFT"}, "confidence": 0.600240170955658, "cells": [{"id": 13, "text": "/*", "bbox": {"l": 136.8, "t": 308.65811, "r": 147.22942, "b": 317.43289, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Active Row Access Control (permissions) */", "bbox": {"l": 157.65884, "t": 308.65811, "r": 376.67661, "b": 317.43289, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "/* Active Row Access Control (permissions) */"}, {"label": "list_item", "id": 14, "page_no": 13, "cluster": {"id": 14, "label": "list_item", "bbox": {"l": 136.8, "t": 320.65793, "r": 354.86963, "b": 329.43271, "coord_origin": "TOPLEFT"}, "confidence": 0.5985856056213379, "cells": [{"id": 15, "text": "/*", "bbox": {"l": 136.8, "t": 320.65793, "r": 147.70349, "b": 329.43271, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Active Column Access Control (masks)", "bbox": {"l": 158.60696, "t": 320.65793, "r": 354.86963, "b": 329.43271, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "/* Active Column Access Control (masks)"}, {"label": "text", "id": 16, "page_no": 13, "cluster": {"id": 16, "label": "text", "bbox": {"l": 365.77313, "t": 320.65793, "r": 376.67661, "b": 329.43271, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "*/", "bbox": {"l": 365.77313, "t": 320.65793, "r": 376.67661, "b": 329.43271, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "*/"}, {"label": "text", "id": 17, "page_no": 13, "cluster": {"id": 17, "label": "text", "bbox": {"l": 136.8, "t": 332.65775, "r": 291.7178, "b": 341.43253, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "ALTER TABLE HR_SCHEMA.EMPLOYEES", "bbox": {"l": 136.8, "t": 332.65775, "r": 291.7178, "b": 341.43253, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "ALTER TABLE HR_SCHEMA.EMPLOYEES"}, {"label": "text", "id": 18, "page_no": 13, "cluster": {"id": 18, "label": "text", "bbox": {"l": 136.8, "t": 344.65756, "r": 271.67831, "b": 353.43234000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "ACTIVATE ROW ACCESS CONTROL", "bbox": {"l": 136.8, "t": 344.65756, "r": 271.67831, "b": 353.43234000000007, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "ACTIVATE ROW ACCESS CONTROL"}, {"label": "text", "id": 15, "page_no": 13, "cluster": {"id": 15, "label": "text", "bbox": {"l": 136.8, "t": 356.65738, "r": 291.7178, "b": 365.43216, "coord_origin": "TOPLEFT"}, "confidence": 0.5431806445121765, "cells": [{"id": 20, "text": "ACTIVATE COLUMN ACCESS CONTROL;", "bbox": {"l": 136.8, "t": 356.65738, "r": 291.7178, "b": 365.43216, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "ACTIVATE COLUMN ACCESS CONTROL;"}, {"label": "list_item", "id": 6, "page_no": 13, "cluster": {"id": 6, "label": "list_item", "bbox": {"l": 136.8, "t": 380.5076, "r": 540.80145, "b": 413.72021, "coord_origin": "TOPLEFT"}, "confidence": 0.9449256062507629, "cells": [{"id": 21, "text": "2.", "bbox": {"l": 136.8, "t": 380.5076, "r": 145.14954, "b": 389.72058, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "Look at the definition of the EMPLOYEE table, as shown in Figure 3-11. To do this, from ", "bbox": {"l": 147.93271, "t": 380.5076, "r": 540.80145, "b": 389.72058, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "the main navigation pane of System i Navigator, click ", "bbox": {"l": 151.20013, "t": 392.50742, "r": 387.36169, "b": 401.7203999999999, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "Schemas", "bbox": {"l": 387.29993, "t": 392.50742, "r": 431.07614, "b": 401.7203999999999, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "\uf0ae", "bbox": {"l": 433.85992000000005, "t": 389.64889999999997, "r": 443.69043, "b": 401.83994, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "HR_SCHEMA", "bbox": {"l": 446.51906999999994, "t": 392.50742, "r": 509.73618000000005, "b": 401.7203999999999, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "\uf0ae", "bbox": {"l": 512.5788, "t": 389.64889999999997, "r": 522.4093, "b": 401.83994, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Tables", "bbox": {"l": 151.19812, "t": 404.50723000000005, "r": 181.12892, "b": 413.72021, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": ", right-click the ", "bbox": {"l": 181.79823, "t": 404.50723000000005, "r": 248.99638, "b": 413.72021, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "EMPLOYEES", "bbox": {"l": 248.93860000000004, "t": 404.50723000000005, "r": 310.44357, "b": 413.72021, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": " table, and click ", "bbox": {"l": 310.49835, "t": 404.50723000000005, "r": 381.53305, "b": 413.72021, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Definition", "bbox": {"l": 381.59882, "t": 404.50723000000005, "r": 427.68176, "b": 413.72021, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": ".", "bbox": {"l": 427.67877, "t": 404.50723000000005, "r": 430.4476599999999, "b": 413.72021, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2. Look at the definition of the EMPLOYEE table, as shown in Figure 3-11. To do this, from the main navigation pane of System i Navigator, click Schemas \uf0ae HR_SCHEMA \uf0ae Tables , right-click the EMPLOYEES table, and click Definition ."}, {"label": "caption", "id": 5, "page_no": 13, "cluster": {"id": 5, "label": "caption", "bbox": {"l": 64.800003, "t": 649.0378900000001, "r": 347.43054, "b": 657.3629, "coord_origin": "TOPLEFT"}, "confidence": 0.9499983787536621, "cells": [{"id": 34, "text": "Figure 3-11 Selecting the EMPLOYEES table from System i Navigator", "bbox": {"l": 64.800003, "t": 649.0378900000001, "r": 347.43054, "b": 657.3629, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 3-11 Selecting the EMPLOYEES table from System i Navigator"}, {"label": "picture", "id": 3, "page_no": 13, "cluster": {"id": 3, "label": "picture", "bbox": {"l": 63.80192184448242, "t": 95.38238525390625, "r": 547.11474609375, "b": 170.0321044921875, "coord_origin": "TOPLEFT"}, "confidence": 0.9635388851165771, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "picture", "id": 0, "page_no": 13, "cluster": {"id": 0, "label": "picture", "bbox": {"l": 63.985130310058594, "t": 427.9049987792969, "r": 530.0478515625, "b": 646.1395874023438, "coord_origin": "TOPLEFT"}, "confidence": 0.9801458716392517, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "headers": [{"label": "page_footer", "id": 8, "page_no": 13, "cluster": {"id": 8, "label": "page_footer", "bbox": {"l": 64.800003, "t": 754.848721, "r": 78.402, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.9161999821662903, "cells": [{"id": 0, "text": "28 ", "bbox": {"l": 64.800003, "t": 754.848721, "r": 78.402, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "28"}, {"label": "page_footer", "id": 4, "page_no": 13, "cluster": {"id": 4, "label": "page_footer", "bbox": {"l": 93.420303, "t": 755.538002, "r": 334.42142, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9540064334869385, "cells": [{"id": 1, "text": "Row and Column Access Control Support in IBM DB2 for i", "bbox": {"l": 93.420303, "t": 755.538002, "r": 334.42142, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Row and Column Access Control Support in IBM DB2 for i"}]}}, {"page_no": 14, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "Chapter 4. Implementing Row and Column Access Control: Banking example ", "bbox": {"l": 214.8, "t": 755.538002, "r": 523.59357, "b": 763.863001, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "77", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "2.", "bbox": {"l": 136.79959, "t": 71.50903000000005, "r": 145.19554, "b": 80.72204999999985, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Figure 4-68 shows the Visual Explain of the same SQL statement, but with RCAC ", "bbox": {"l": 147.9942, "t": 71.50903000000005, "r": 513.35919, "b": 80.72204999999985, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "enabled. It is clear that the implementation of the SQL statement is more complex ", "bbox": {"l": 151.19975, "t": 83.50885000000017, "r": 514.04858, "b": 92.72185999999999, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "because the row permission rule becomes part of the ", "bbox": {"l": 151.19975, "t": 95.50867000000005, "r": 389.64822, "b": 104.72167999999999, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "WHERE", "bbox": {"l": 389.57941, "t": 95.65808000000015, "r": 414.53918, "b": 104.48266999999998, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": " clause.", "bbox": {"l": 414.59991, "t": 95.50867000000005, "r": 448.8892200000001, "b": 104.72167999999999, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Figure 4-68 Visual Explain with RCAC enabled", "bbox": {"l": 136.8, "t": 480.55798, "r": 327.09329, "b": 488.883, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "3.", "bbox": {"l": 136.8, "t": 506.56863, "r": 145.17432, "b": 515.78162, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Compare the advised indexes that are provided by the Optimizer without RCAC and with ", "bbox": {"l": 147.96574, "t": 506.56863, "r": 543.63715, "b": 515.78162, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "RCAC enabled. Figure 4-69 shows the index advice for the SQL statement without RCAC ", "bbox": {"l": 151.20016, "t": 518.56845, "r": 547.23944, "b": 527.78143, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "enabled. The index being advised is for the ORDER BY clause.", "bbox": {"l": 151.20016, "t": 530.5682400000001, "r": 430.28333, "b": 539.78125, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Figure 4-69 Index advice with no RCAC", "bbox": {"l": 64.800003, "t": 667.5179, "r": 227.10149, "b": 675.8429, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 4, "label": "page_footer", "bbox": {"l": 214.8, "t": 755.538002, "r": 523.59357, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9557602405548096, "cells": [{"id": 0, "text": "Chapter 4. Implementing Row and Column Access Control: Banking example ", "bbox": {"l": 214.8, "t": 755.538002, "r": 523.59357, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "page_footer", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.9056528806686401, "cells": [{"id": 1, "text": "77", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "list_item", "bbox": {"l": 136.79959, "t": 71.50903000000005, "r": 514.04858, "b": 104.72167999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9761855006217957, "cells": [{"id": 2, "text": "2.", "bbox": {"l": 136.79959, "t": 71.50903000000005, "r": 145.19554, "b": 80.72204999999985, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Figure 4-68 shows the Visual Explain of the same SQL statement, but with RCAC ", "bbox": {"l": 147.9942, "t": 71.50903000000005, "r": 513.35919, "b": 80.72204999999985, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "enabled. It is clear that the implementation of the SQL statement is more complex ", "bbox": {"l": 151.19975, "t": 83.50885000000017, "r": 514.04858, "b": 92.72185999999999, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "because the row permission rule becomes part of the ", "bbox": {"l": 151.19975, "t": 95.50867000000005, "r": 389.64822, "b": 104.72167999999999, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "WHERE", "bbox": {"l": 389.57941, "t": 95.65808000000015, "r": 414.53918, "b": 104.48266999999998, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": " clause.", "bbox": {"l": 414.59991, "t": 95.50867000000005, "r": 448.8892200000001, "b": 104.72167999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "caption", "bbox": {"l": 136.8, "t": 480.55798, "r": 327.09329, "b": 488.883, "coord_origin": "TOPLEFT"}, "confidence": 0.9529654383659363, "cells": [{"id": 8, "text": "Figure 4-68 Visual Explain with RCAC enabled", "bbox": {"l": 136.8, "t": 480.55798, "r": 327.09329, "b": 488.883, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "list_item", "bbox": {"l": 136.8, "t": 506.56863, "r": 547.23944, "b": 539.78125, "coord_origin": "TOPLEFT"}, "confidence": 0.9766737818717957, "cells": [{"id": 9, "text": "3.", "bbox": {"l": 136.8, "t": 506.56863, "r": 145.17432, "b": 515.78162, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Compare the advised indexes that are provided by the Optimizer without RCAC and with ", "bbox": {"l": 147.96574, "t": 506.56863, "r": 543.63715, "b": 515.78162, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "RCAC enabled. Figure 4-69 shows the index advice for the SQL statement without RCAC ", "bbox": {"l": 151.20016, "t": 518.56845, "r": 547.23944, "b": 527.78143, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "enabled. The index being advised is for the ORDER BY clause.", "bbox": {"l": 151.20016, "t": 530.5682400000001, "r": 430.28333, "b": 539.78125, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "caption", "bbox": {"l": 64.800003, "t": 667.5179, "r": 227.10149, "b": 675.8429, "coord_origin": "TOPLEFT"}, "confidence": 0.9514288306236267, "cells": [{"id": 13, "text": "Figure 4-69 Index advice with no RCAC", "bbox": {"l": 64.800003, "t": 667.5179, "r": 227.10149, "b": 675.8429, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "picture", "bbox": {"l": 136.5016632080078, "t": 119.24909210205078, "r": 545.4508666992188, "b": 477.54119873046875, "coord_origin": "TOPLEFT"}, "confidence": 0.9864527583122253, "cells": [], "children": []}, {"id": 1, "label": "picture", "bbox": {"l": 64.27847290039062, "t": 553.5814819335938, "r": 506.39263916015625, "b": 664.0870971679688, "coord_origin": "TOPLEFT"}, "confidence": 0.9797717928886414, "cells": [], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_footer", "id": 4, "page_no": 14, "cluster": {"id": 4, "label": "page_footer", "bbox": {"l": 214.8, "t": 755.538002, "r": 523.59357, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9557602405548096, "cells": [{"id": 0, "text": "Chapter 4. Implementing Row and Column Access Control: Banking example ", "bbox": {"l": 214.8, "t": 755.538002, "r": 523.59357, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Chapter 4. Implementing Row and Column Access Control: Banking example"}, {"label": "page_footer", "id": 7, "page_no": 14, "cluster": {"id": 7, "label": "page_footer", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.9056528806686401, "cells": [{"id": 1, "text": "77", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "77"}, {"label": "list_item", "id": 3, "page_no": 14, "cluster": {"id": 3, "label": "list_item", "bbox": {"l": 136.79959, "t": 71.50903000000005, "r": 514.04858, "b": 104.72167999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9761855006217957, "cells": [{"id": 2, "text": "2.", "bbox": {"l": 136.79959, "t": 71.50903000000005, "r": 145.19554, "b": 80.72204999999985, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Figure 4-68 shows the Visual Explain of the same SQL statement, but with RCAC ", "bbox": {"l": 147.9942, "t": 71.50903000000005, "r": 513.35919, "b": 80.72204999999985, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "enabled. It is clear that the implementation of the SQL statement is more complex ", "bbox": {"l": 151.19975, "t": 83.50885000000017, "r": 514.04858, "b": 92.72185999999999, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "because the row permission rule becomes part of the ", "bbox": {"l": 151.19975, "t": 95.50867000000005, "r": 389.64822, "b": 104.72167999999999, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "WHERE", "bbox": {"l": 389.57941, "t": 95.65808000000015, "r": 414.53918, "b": 104.48266999999998, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": " clause.", "bbox": {"l": 414.59991, "t": 95.50867000000005, "r": 448.8892200000001, "b": 104.72167999999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2. Figure 4-68 shows the Visual Explain of the same SQL statement, but with RCAC enabled. It is clear that the implementation of the SQL statement is more complex because the row permission rule becomes part of the WHERE clause."}, {"label": "caption", "id": 5, "page_no": 14, "cluster": {"id": 5, "label": "caption", "bbox": {"l": 136.8, "t": 480.55798, "r": 327.09329, "b": 488.883, "coord_origin": "TOPLEFT"}, "confidence": 0.9529654383659363, "cells": [{"id": 8, "text": "Figure 4-68 Visual Explain with RCAC enabled", "bbox": {"l": 136.8, "t": 480.55798, "r": 327.09329, "b": 488.883, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 4-68 Visual Explain with RCAC enabled"}, {"label": "list_item", "id": 2, "page_no": 14, "cluster": {"id": 2, "label": "list_item", "bbox": {"l": 136.8, "t": 506.56863, "r": 547.23944, "b": 539.78125, "coord_origin": "TOPLEFT"}, "confidence": 0.9766737818717957, "cells": [{"id": 9, "text": "3.", "bbox": {"l": 136.8, "t": 506.56863, "r": 145.17432, "b": 515.78162, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Compare the advised indexes that are provided by the Optimizer without RCAC and with ", "bbox": {"l": 147.96574, "t": 506.56863, "r": 543.63715, "b": 515.78162, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "RCAC enabled. Figure 4-69 shows the index advice for the SQL statement without RCAC ", "bbox": {"l": 151.20016, "t": 518.56845, "r": 547.23944, "b": 527.78143, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "enabled. The index being advised is for the ORDER BY clause.", "bbox": {"l": 151.20016, "t": 530.5682400000001, "r": 430.28333, "b": 539.78125, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3. Compare the advised indexes that are provided by the Optimizer without RCAC and with RCAC enabled. Figure 4-69 shows the index advice for the SQL statement without RCAC enabled. The index being advised is for the ORDER BY clause."}, {"label": "caption", "id": 6, "page_no": 14, "cluster": {"id": 6, "label": "caption", "bbox": {"l": 64.800003, "t": 667.5179, "r": 227.10149, "b": 675.8429, "coord_origin": "TOPLEFT"}, "confidence": 0.9514288306236267, "cells": [{"id": 13, "text": "Figure 4-69 Index advice with no RCAC", "bbox": {"l": 64.800003, "t": 667.5179, "r": 227.10149, "b": 675.8429, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 4-69 Index advice with no RCAC"}, {"label": "picture", "id": 0, "page_no": 14, "cluster": {"id": 0, "label": "picture", "bbox": {"l": 136.5016632080078, "t": 119.24909210205078, "r": 545.4508666992188, "b": 477.54119873046875, "coord_origin": "TOPLEFT"}, "confidence": 0.9864527583122253, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "picture", "id": 1, "page_no": 14, "cluster": {"id": 1, "label": "picture", "bbox": {"l": 64.27847290039062, "t": 553.5814819335938, "r": 506.39263916015625, "b": 664.0870971679688, "coord_origin": "TOPLEFT"}, "confidence": 0.9797717928886414, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "body": [{"label": "list_item", "id": 3, "page_no": 14, "cluster": {"id": 3, "label": "list_item", "bbox": {"l": 136.79959, "t": 71.50903000000005, "r": 514.04858, "b": 104.72167999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9761855006217957, "cells": [{"id": 2, "text": "2.", "bbox": {"l": 136.79959, "t": 71.50903000000005, "r": 145.19554, "b": 80.72204999999985, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Figure 4-68 shows the Visual Explain of the same SQL statement, but with RCAC ", "bbox": {"l": 147.9942, "t": 71.50903000000005, "r": 513.35919, "b": 80.72204999999985, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "enabled. It is clear that the implementation of the SQL statement is more complex ", "bbox": {"l": 151.19975, "t": 83.50885000000017, "r": 514.04858, "b": 92.72185999999999, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "because the row permission rule becomes part of the ", "bbox": {"l": 151.19975, "t": 95.50867000000005, "r": 389.64822, "b": 104.72167999999999, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "WHERE", "bbox": {"l": 389.57941, "t": 95.65808000000015, "r": 414.53918, "b": 104.48266999999998, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": " clause.", "bbox": {"l": 414.59991, "t": 95.50867000000005, "r": 448.8892200000001, "b": 104.72167999999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2. Figure 4-68 shows the Visual Explain of the same SQL statement, but with RCAC enabled. It is clear that the implementation of the SQL statement is more complex because the row permission rule becomes part of the WHERE clause."}, {"label": "caption", "id": 5, "page_no": 14, "cluster": {"id": 5, "label": "caption", "bbox": {"l": 136.8, "t": 480.55798, "r": 327.09329, "b": 488.883, "coord_origin": "TOPLEFT"}, "confidence": 0.9529654383659363, "cells": [{"id": 8, "text": "Figure 4-68 Visual Explain with RCAC enabled", "bbox": {"l": 136.8, "t": 480.55798, "r": 327.09329, "b": 488.883, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 4-68 Visual Explain with RCAC enabled"}, {"label": "list_item", "id": 2, "page_no": 14, "cluster": {"id": 2, "label": "list_item", "bbox": {"l": 136.8, "t": 506.56863, "r": 547.23944, "b": 539.78125, "coord_origin": "TOPLEFT"}, "confidence": 0.9766737818717957, "cells": [{"id": 9, "text": "3.", "bbox": {"l": 136.8, "t": 506.56863, "r": 145.17432, "b": 515.78162, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Compare the advised indexes that are provided by the Optimizer without RCAC and with ", "bbox": {"l": 147.96574, "t": 506.56863, "r": 543.63715, "b": 515.78162, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "RCAC enabled. Figure 4-69 shows the index advice for the SQL statement without RCAC ", "bbox": {"l": 151.20016, "t": 518.56845, "r": 547.23944, "b": 527.78143, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "enabled. The index being advised is for the ORDER BY clause.", "bbox": {"l": 151.20016, "t": 530.5682400000001, "r": 430.28333, "b": 539.78125, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3. Compare the advised indexes that are provided by the Optimizer without RCAC and with RCAC enabled. Figure 4-69 shows the index advice for the SQL statement without RCAC enabled. The index being advised is for the ORDER BY clause."}, {"label": "caption", "id": 6, "page_no": 14, "cluster": {"id": 6, "label": "caption", "bbox": {"l": 64.800003, "t": 667.5179, "r": 227.10149, "b": 675.8429, "coord_origin": "TOPLEFT"}, "confidence": 0.9514288306236267, "cells": [{"id": 13, "text": "Figure 4-69 Index advice with no RCAC", "bbox": {"l": 64.800003, "t": 667.5179, "r": 227.10149, "b": 675.8429, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 4-69 Index advice with no RCAC"}, {"label": "picture", "id": 0, "page_no": 14, "cluster": {"id": 0, "label": "picture", "bbox": {"l": 136.5016632080078, "t": 119.24909210205078, "r": 545.4508666992188, "b": 477.54119873046875, "coord_origin": "TOPLEFT"}, "confidence": 0.9864527583122253, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "picture", "id": 1, "page_no": 14, "cluster": {"id": 1, "label": "picture", "bbox": {"l": 64.27847290039062, "t": 553.5814819335938, "r": 506.39263916015625, "b": 664.0870971679688, "coord_origin": "TOPLEFT"}, "confidence": 0.9797717928886414, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "headers": [{"label": "page_footer", "id": 4, "page_no": 14, "cluster": {"id": 4, "label": "page_footer", "bbox": {"l": 214.8, "t": 755.538002, "r": 523.59357, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9557602405548096, "cells": [{"id": 0, "text": "Chapter 4. Implementing Row and Column Access Control: Banking example ", "bbox": {"l": 214.8, "t": 755.538002, "r": 523.59357, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Chapter 4. Implementing Row and Column Access Control: Banking example"}, {"label": "page_footer", "id": 7, "page_no": 14, "cluster": {"id": 7, "label": "page_footer", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.9056528806686401, "cells": [{"id": 1, "text": "77", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "77"}]}}, {"page_no": 15, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "124 ", "bbox": {"l": 64.800003, "t": 754.848721, "r": 83.982002, "b": 764.06172, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Row and Column Access Control Support in IBM DB2 for i", "bbox": {"l": 98.940002, "t": 755.538002, "r": 339.81958, "b": 763.863001, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "THEN C . CUSTOMER_TAX_ID ", "bbox": {"l": 64.800308, "t": 71.67296999999996, "r": 177.1194, "b": 79.60199, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'TELLER' ) = 1 ", "bbox": {"l": 64.800308, "t": 82.65295000000015, "r": 365.87817, "b": 90.58196999999996, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "THEN ( 'XXX-XX-' CONCAT QSYS2 . SUBSTR ( C . CUSTOMER_TAX_ID , 8 , 4 ) ) ", "bbox": {"l": 64.800308, "t": 93.63292999999999, "r": 392.81787, "b": 101.56195000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 ", "bbox": {"l": 64.800308, "t": 104.67322000000001, "r": 374.87817, "b": 112.60222999999996, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "THEN C . CUSTOMER_TAX_ID ", "bbox": {"l": 64.800308, "t": 115.65319999999997, "r": 177.1194, "b": 123.58220999999992, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "ELSE 'XXX-XX-XXXX' ", "bbox": {"l": 64.800308, "t": 126.63318000000015, "r": 150.1797, "b": 134.56219, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "END ", "bbox": {"l": 64.800308, "t": 137.67345999999998, "r": 96.240005, "b": 145.60248, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "ENABLE ; ", "bbox": {"l": 79.20031, "t": 148.65344000000005, "r": 124.14001, "b": 156.58245999999997, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "CREATE MASK BANK_SCHEMA.MASK_DRIVERS_LICENSE_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C ", "bbox": {"l": 64.800308, "t": 170.67377, "r": 460.25757, "b": 178.60278000000005, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "FOR COLUMN CUSTOMER_DRIVERS_LICENSE_NUMBER ", "bbox": {"l": 79.20031, "t": 181.65374999999995, "r": 272.45911, "b": 189.58276, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "RETURN CASE ", "bbox": {"l": 79.20031, "t": 192.69403, "r": 137.64001, "b": 200.62305000000003, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 ", "bbox": {"l": 64.800308, "t": 203.67400999999995, "r": 361.37817, "b": 211.60303, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "THEN C . CUSTOMER_DRIVERS_LICENSE_NUMBER ", "bbox": {"l": 64.800308, "t": 214.65399000000002, "r": 249.0591, "b": 222.58300999999994, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'TELLER' ) = 1 ", "bbox": {"l": 64.800308, "t": 225.69426999999996, "r": 365.87817, "b": 233.62329, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "THEN C . CUSTOMER_DRIVERS_LICENSE_NUMBER ", "bbox": {"l": 64.800308, "t": 236.67426, "r": 249.0591, "b": 244.60326999999995, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 ", "bbox": {"l": 64.800308, "t": 247.65423999999996, "r": 374.87817, "b": 255.58325000000002, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "THEN C . CUSTOMER_DRIVERS_LICENSE_NUMBER ", "bbox": {"l": 64.800308, "t": 258.69452, "r": 249.0591, "b": 266.62354000000005, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "ELSE '*************' ", "bbox": {"l": 64.800308, "t": 269.67449999999997, "r": 159.1797, "b": 277.60352, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "END ", "bbox": {"l": 64.800308, "t": 280.65454, "r": 96.240005, "b": 288.58353, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "ENABLE ; ", "bbox": {"l": 79.20031, "t": 291.69485000000003, "r": 124.14001, "b": 299.62384, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "CREATE MASK BANK_SCHEMA.MASK_LOGIN_ID_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C ", "bbox": {"l": 64.800308, "t": 313.65485, "r": 428.81786999999997, "b": 321.58383, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "FOR COLUMN CUSTOMER_LOGIN_ID ", "bbox": {"l": 79.20031, "t": 324.69516, "r": 209.51941, "b": 332.62415, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "RETURN CASE ", "bbox": {"l": 79.20031, "t": 335.67517, "r": 137.64001, "b": 343.6041599999999, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 ", "bbox": {"l": 64.800308, "t": 346.65518, "r": 361.37817, "b": 354.58417, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "THEN C . CUSTOMER_LOGIN_ID ", "bbox": {"l": 64.800308, "t": 357.69550000000004, "r": 186.1194, "b": 365.62448, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 ", "bbox": {"l": 64.800308, "t": 368.67551, "r": 374.87817, "b": 376.60449, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "THEN C . CUSTOMER_LOGIN_ID ", "bbox": {"l": 64.800308, "t": 379.65552, "r": 186.1194, "b": 387.5845, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "ELSE '*****' ", "bbox": {"l": 64.800308, "t": 390.69583, "r": 123.24001, "b": 398.62482, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "END ", "bbox": {"l": 64.800308, "t": 401.67584, "r": 96.240005, "b": 409.60482999999994, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "ENABLE ; ", "bbox": {"l": 79.20031, "t": 412.65585, "r": 124.14001, "b": 420.58484, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "CREATE MASK BANK_SCHEMA.MASK_SECURITY_QUESTION_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C ", "bbox": {"l": 64.800308, "t": 434.67615, "r": 469.25757, "b": 442.60513, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "FOR COLUMN CUSTOMER_SECURITY_QUESTION ", "bbox": {"l": 79.20031, "t": 445.65616000000006, "r": 249.95911, "b": 453.58514, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "RETURN CASE ", "bbox": {"l": 79.20031, "t": 456.6964699999999, "r": 137.64001, "b": 464.62546, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 ", "bbox": {"l": 64.800308, "t": 467.67648, "r": 361.37817, "b": 475.60547, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "THEN C . CUSTOMER_SECURITY_QUESTION ", "bbox": {"l": 64.800308, "t": 478.65649, "r": 226.5591, "b": 486.58548, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 ", "bbox": {"l": 64.800308, "t": 489.69681, "r": 374.87817, "b": 497.62579, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "THEN C . CUSTOMER_SECURITY_QUESTION ", "bbox": {"l": 64.800308, "t": 500.67682, "r": 226.5591, "b": 508.6058, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "ELSE '*****' ", "bbox": {"l": 64.800308, "t": 511.65683, "r": 123.24001, "b": 519.58582, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "END ", "bbox": {"l": 64.800308, "t": 522.69714, "r": 96.240005, "b": 530.62613, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "ENABLE ; ", "bbox": {"l": 79.20031, "t": 533.6771200000001, "r": 124.14001, "b": 541.60614, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "CREATE MASK BANK_SCHEMA.MASK_SECURITY_QUESTION_ANSWER_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C ", "bbox": {"l": 64.800308, "t": 555.69745, "r": 500.69727, "b": 563.62645, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "FOR COLUMN CUSTOMER_SECURITY_QUESTION_ANSWER ", "bbox": {"l": 79.20031, "t": 566.6774399999999, "r": 281.3988, "b": 574.60645, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "RETURN CASE ", "bbox": {"l": 79.20031, "t": 577.65744, "r": 137.64001, "b": 585.58644, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 ", "bbox": {"l": 64.800308, "t": 588.6977400000001, "r": 361.37817, "b": 596.62674, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "THEN C . CUSTOMER_SECURITY_QUESTION_ANSWER ", "bbox": {"l": 64.800308, "t": 599.67773, "r": 258.05908, "b": 607.60674, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 ", "bbox": {"l": 64.800308, "t": 610.65773, "r": 374.87817, "b": 618.58673, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "THEN C . CUSTOMER_SECURITY_QUESTION_ANSWER ", "bbox": {"l": 64.800308, "t": 621.69803, "r": 258.05908, "b": 629.62703, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "ELSE '*****' ", "bbox": {"l": 64.800308, "t": 632.6780200000001, "r": 123.24001, "b": 640.60703, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "END ", "bbox": {"l": 64.800308, "t": 643.71832, "r": 96.240005, "b": 651.64732, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "ENABLE ; ", "bbox": {"l": 79.20031, "t": 654.69832, "r": 124.14001, "b": 662.62732, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "ALTER TABLE BANK_SCHEMA.CUSTOMERS ", "bbox": {"l": 64.800308, "t": 676.71861, "r": 226.5591, "b": 684.64761, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "ACTIVATE ROW ACCESS CONTROL ", "bbox": {"l": 79.20031, "t": 687.69862, "r": 214.01941, "b": 695.627617, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "ACTIVATE COLUMN ACCESS CONTROL ;", "bbox": {"l": 79.20031, "t": 698.678619, "r": 223.01941, "b": 706.60762, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 1, "label": "page_footer", "bbox": {"l": 64.800003, "t": 754.848721, "r": 83.982002, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.8994000554084778, "cells": [{"id": 0, "text": "124 ", "bbox": {"l": 64.800003, "t": 754.848721, "r": 83.982002, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "page_footer", "bbox": {"l": 98.940002, "t": 755.538002, "r": 339.81958, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.943077027797699, "cells": [{"id": 1, "text": "Row and Column Access Control Support in IBM DB2 for i", "bbox": {"l": 98.940002, "t": 755.538002, "r": 339.81958, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "code", "bbox": {"l": 64.800308, "t": 71.67296999999996, "r": 500.69727, "b": 706.60762, "coord_origin": "TOPLEFT"}, "confidence": 0.7632163763046265, "cells": [{"id": 2, "text": "THEN C . CUSTOMER_TAX_ID ", "bbox": {"l": 64.800308, "t": 71.67296999999996, "r": 177.1194, "b": 79.60199, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'TELLER' ) = 1 ", "bbox": {"l": 64.800308, "t": 82.65295000000015, "r": 365.87817, "b": 90.58196999999996, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "THEN ( 'XXX-XX-' CONCAT QSYS2 . SUBSTR ( C . CUSTOMER_TAX_ID , 8 , 4 ) ) ", "bbox": {"l": 64.800308, "t": 93.63292999999999, "r": 392.81787, "b": 101.56195000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 ", "bbox": {"l": 64.800308, "t": 104.67322000000001, "r": 374.87817, "b": 112.60222999999996, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "THEN C . CUSTOMER_TAX_ID ", "bbox": {"l": 64.800308, "t": 115.65319999999997, "r": 177.1194, "b": 123.58220999999992, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "ELSE 'XXX-XX-XXXX' ", "bbox": {"l": 64.800308, "t": 126.63318000000015, "r": 150.1797, "b": 134.56219, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "END ", "bbox": {"l": 64.800308, "t": 137.67345999999998, "r": 96.240005, "b": 145.60248, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "ENABLE ; ", "bbox": {"l": 79.20031, "t": 148.65344000000005, "r": 124.14001, "b": 156.58245999999997, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "CREATE MASK BANK_SCHEMA.MASK_DRIVERS_LICENSE_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C ", "bbox": {"l": 64.800308, "t": 170.67377, "r": 460.25757, "b": 178.60278000000005, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "FOR COLUMN CUSTOMER_DRIVERS_LICENSE_NUMBER ", "bbox": {"l": 79.20031, "t": 181.65374999999995, "r": 272.45911, "b": 189.58276, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "RETURN CASE ", "bbox": {"l": 79.20031, "t": 192.69403, "r": 137.64001, "b": 200.62305000000003, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 ", "bbox": {"l": 64.800308, "t": 203.67400999999995, "r": 361.37817, "b": 211.60303, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "THEN C . CUSTOMER_DRIVERS_LICENSE_NUMBER ", "bbox": {"l": 64.800308, "t": 214.65399000000002, "r": 249.0591, "b": 222.58300999999994, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'TELLER' ) = 1 ", "bbox": {"l": 64.800308, "t": 225.69426999999996, "r": 365.87817, "b": 233.62329, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "THEN C . CUSTOMER_DRIVERS_LICENSE_NUMBER ", "bbox": {"l": 64.800308, "t": 236.67426, "r": 249.0591, "b": 244.60326999999995, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 ", "bbox": {"l": 64.800308, "t": 247.65423999999996, "r": 374.87817, "b": 255.58325000000002, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "THEN C . CUSTOMER_DRIVERS_LICENSE_NUMBER ", "bbox": {"l": 64.800308, "t": 258.69452, "r": 249.0591, "b": 266.62354000000005, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "ELSE '*************' ", "bbox": {"l": 64.800308, "t": 269.67449999999997, "r": 159.1797, "b": 277.60352, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "END ", "bbox": {"l": 64.800308, "t": 280.65454, "r": 96.240005, "b": 288.58353, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "ENABLE ; ", "bbox": {"l": 79.20031, "t": 291.69485000000003, "r": 124.14001, "b": 299.62384, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "CREATE MASK BANK_SCHEMA.MASK_LOGIN_ID_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C ", "bbox": {"l": 64.800308, "t": 313.65485, "r": 428.81786999999997, "b": 321.58383, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "FOR COLUMN CUSTOMER_LOGIN_ID ", "bbox": {"l": 79.20031, "t": 324.69516, "r": 209.51941, "b": 332.62415, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "RETURN CASE ", "bbox": {"l": 79.20031, "t": 335.67517, "r": 137.64001, "b": 343.6041599999999, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 ", "bbox": {"l": 64.800308, "t": 346.65518, "r": 361.37817, "b": 354.58417, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "THEN C . CUSTOMER_LOGIN_ID ", "bbox": {"l": 64.800308, "t": 357.69550000000004, "r": 186.1194, "b": 365.62448, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 ", "bbox": {"l": 64.800308, "t": 368.67551, "r": 374.87817, "b": 376.60449, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "THEN C . CUSTOMER_LOGIN_ID ", "bbox": {"l": 64.800308, "t": 379.65552, "r": 186.1194, "b": 387.5845, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "ELSE '*****' ", "bbox": {"l": 64.800308, "t": 390.69583, "r": 123.24001, "b": 398.62482, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "END ", "bbox": {"l": 64.800308, "t": 401.67584, "r": 96.240005, "b": 409.60482999999994, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "ENABLE ; ", "bbox": {"l": 79.20031, "t": 412.65585, "r": 124.14001, "b": 420.58484, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "CREATE MASK BANK_SCHEMA.MASK_SECURITY_QUESTION_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C ", "bbox": {"l": 64.800308, "t": 434.67615, "r": 469.25757, "b": 442.60513, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "FOR COLUMN CUSTOMER_SECURITY_QUESTION ", "bbox": {"l": 79.20031, "t": 445.65616000000006, "r": 249.95911, "b": 453.58514, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "RETURN CASE ", "bbox": {"l": 79.20031, "t": 456.6964699999999, "r": 137.64001, "b": 464.62546, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 ", "bbox": {"l": 64.800308, "t": 467.67648, "r": 361.37817, "b": 475.60547, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "THEN C . CUSTOMER_SECURITY_QUESTION ", "bbox": {"l": 64.800308, "t": 478.65649, "r": 226.5591, "b": 486.58548, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 ", "bbox": {"l": 64.800308, "t": 489.69681, "r": 374.87817, "b": 497.62579, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "THEN C . CUSTOMER_SECURITY_QUESTION ", "bbox": {"l": 64.800308, "t": 500.67682, "r": 226.5591, "b": 508.6058, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "ELSE '*****' ", "bbox": {"l": 64.800308, "t": 511.65683, "r": 123.24001, "b": 519.58582, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "END ", "bbox": {"l": 64.800308, "t": 522.69714, "r": 96.240005, "b": 530.62613, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "ENABLE ; ", "bbox": {"l": 79.20031, "t": 533.6771200000001, "r": 124.14001, "b": 541.60614, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "CREATE MASK BANK_SCHEMA.MASK_SECURITY_QUESTION_ANSWER_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C ", "bbox": {"l": 64.800308, "t": 555.69745, "r": 500.69727, "b": 563.62645, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "FOR COLUMN CUSTOMER_SECURITY_QUESTION_ANSWER ", "bbox": {"l": 79.20031, "t": 566.6774399999999, "r": 281.3988, "b": 574.60645, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "RETURN CASE ", "bbox": {"l": 79.20031, "t": 577.65744, "r": 137.64001, "b": 585.58644, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 ", "bbox": {"l": 64.800308, "t": 588.6977400000001, "r": 361.37817, "b": 596.62674, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "THEN C . CUSTOMER_SECURITY_QUESTION_ANSWER ", "bbox": {"l": 64.800308, "t": 599.67773, "r": 258.05908, "b": 607.60674, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 ", "bbox": {"l": 64.800308, "t": 610.65773, "r": 374.87817, "b": 618.58673, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "THEN C . CUSTOMER_SECURITY_QUESTION_ANSWER ", "bbox": {"l": 64.800308, "t": 621.69803, "r": 258.05908, "b": 629.62703, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "ELSE '*****' ", "bbox": {"l": 64.800308, "t": 632.6780200000001, "r": 123.24001, "b": 640.60703, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "END ", "bbox": {"l": 64.800308, "t": 643.71832, "r": 96.240005, "b": 651.64732, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "ENABLE ; ", "bbox": {"l": 79.20031, "t": 654.69832, "r": 124.14001, "b": 662.62732, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "ALTER TABLE BANK_SCHEMA.CUSTOMERS ", "bbox": {"l": 64.800308, "t": 676.71861, "r": 226.5591, "b": 684.64761, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "ACTIVATE ROW ACCESS CONTROL ", "bbox": {"l": 79.20031, "t": 687.69862, "r": 214.01941, "b": 695.627617, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "ACTIVATE COLUMN ACCESS CONTROL ;", "bbox": {"l": 79.20031, "t": 698.678619, "r": 223.01941, "b": 706.60762, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_footer", "id": 1, "page_no": 15, "cluster": {"id": 1, "label": "page_footer", "bbox": {"l": 64.800003, "t": 754.848721, "r": 83.982002, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.8994000554084778, "cells": [{"id": 0, "text": "124 ", "bbox": {"l": 64.800003, "t": 754.848721, "r": 83.982002, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "124"}, {"label": "page_footer", "id": 0, "page_no": 15, "cluster": {"id": 0, "label": "page_footer", "bbox": {"l": 98.940002, "t": 755.538002, "r": 339.81958, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.943077027797699, "cells": [{"id": 1, "text": "Row and Column Access Control Support in IBM DB2 for i", "bbox": {"l": 98.940002, "t": 755.538002, "r": 339.81958, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Row and Column Access Control Support in IBM DB2 for i"}, {"label": "code", "id": 2, "page_no": 15, "cluster": {"id": 2, "label": "code", "bbox": {"l": 64.800308, "t": 71.67296999999996, "r": 500.69727, "b": 706.60762, "coord_origin": "TOPLEFT"}, "confidence": 0.7632163763046265, "cells": [{"id": 2, "text": "THEN C . CUSTOMER_TAX_ID ", "bbox": {"l": 64.800308, "t": 71.67296999999996, "r": 177.1194, "b": 79.60199, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'TELLER' ) = 1 ", "bbox": {"l": 64.800308, "t": 82.65295000000015, "r": 365.87817, "b": 90.58196999999996, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "THEN ( 'XXX-XX-' CONCAT QSYS2 . SUBSTR ( C . CUSTOMER_TAX_ID , 8 , 4 ) ) ", "bbox": {"l": 64.800308, "t": 93.63292999999999, "r": 392.81787, "b": 101.56195000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 ", "bbox": {"l": 64.800308, "t": 104.67322000000001, "r": 374.87817, "b": 112.60222999999996, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "THEN C . CUSTOMER_TAX_ID ", "bbox": {"l": 64.800308, "t": 115.65319999999997, "r": 177.1194, "b": 123.58220999999992, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "ELSE 'XXX-XX-XXXX' ", "bbox": {"l": 64.800308, "t": 126.63318000000015, "r": 150.1797, "b": 134.56219, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "END ", "bbox": {"l": 64.800308, "t": 137.67345999999998, "r": 96.240005, "b": 145.60248, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "ENABLE ; ", "bbox": {"l": 79.20031, "t": 148.65344000000005, "r": 124.14001, "b": 156.58245999999997, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "CREATE MASK BANK_SCHEMA.MASK_DRIVERS_LICENSE_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C ", "bbox": {"l": 64.800308, "t": 170.67377, "r": 460.25757, "b": 178.60278000000005, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "FOR COLUMN CUSTOMER_DRIVERS_LICENSE_NUMBER ", "bbox": {"l": 79.20031, "t": 181.65374999999995, "r": 272.45911, "b": 189.58276, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "RETURN CASE ", "bbox": {"l": 79.20031, "t": 192.69403, "r": 137.64001, "b": 200.62305000000003, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 ", "bbox": {"l": 64.800308, "t": 203.67400999999995, "r": 361.37817, "b": 211.60303, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "THEN C . CUSTOMER_DRIVERS_LICENSE_NUMBER ", "bbox": {"l": 64.800308, "t": 214.65399000000002, "r": 249.0591, "b": 222.58300999999994, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'TELLER' ) = 1 ", "bbox": {"l": 64.800308, "t": 225.69426999999996, "r": 365.87817, "b": 233.62329, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "THEN C . CUSTOMER_DRIVERS_LICENSE_NUMBER ", "bbox": {"l": 64.800308, "t": 236.67426, "r": 249.0591, "b": 244.60326999999995, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 ", "bbox": {"l": 64.800308, "t": 247.65423999999996, "r": 374.87817, "b": 255.58325000000002, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "THEN C . CUSTOMER_DRIVERS_LICENSE_NUMBER ", "bbox": {"l": 64.800308, "t": 258.69452, "r": 249.0591, "b": 266.62354000000005, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "ELSE '*************' ", "bbox": {"l": 64.800308, "t": 269.67449999999997, "r": 159.1797, "b": 277.60352, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "END ", "bbox": {"l": 64.800308, "t": 280.65454, "r": 96.240005, "b": 288.58353, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "ENABLE ; ", "bbox": {"l": 79.20031, "t": 291.69485000000003, "r": 124.14001, "b": 299.62384, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "CREATE MASK BANK_SCHEMA.MASK_LOGIN_ID_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C ", "bbox": {"l": 64.800308, "t": 313.65485, "r": 428.81786999999997, "b": 321.58383, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "FOR COLUMN CUSTOMER_LOGIN_ID ", "bbox": {"l": 79.20031, "t": 324.69516, "r": 209.51941, "b": 332.62415, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "RETURN CASE ", "bbox": {"l": 79.20031, "t": 335.67517, "r": 137.64001, "b": 343.6041599999999, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 ", "bbox": {"l": 64.800308, "t": 346.65518, "r": 361.37817, "b": 354.58417, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "THEN C . CUSTOMER_LOGIN_ID ", "bbox": {"l": 64.800308, "t": 357.69550000000004, "r": 186.1194, "b": 365.62448, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 ", "bbox": {"l": 64.800308, "t": 368.67551, "r": 374.87817, "b": 376.60449, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "THEN C . CUSTOMER_LOGIN_ID ", "bbox": {"l": 64.800308, "t": 379.65552, "r": 186.1194, "b": 387.5845, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "ELSE '*****' ", "bbox": {"l": 64.800308, "t": 390.69583, "r": 123.24001, "b": 398.62482, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "END ", "bbox": {"l": 64.800308, "t": 401.67584, "r": 96.240005, "b": 409.60482999999994, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "ENABLE ; ", "bbox": {"l": 79.20031, "t": 412.65585, "r": 124.14001, "b": 420.58484, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "CREATE MASK BANK_SCHEMA.MASK_SECURITY_QUESTION_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C ", "bbox": {"l": 64.800308, "t": 434.67615, "r": 469.25757, "b": 442.60513, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "FOR COLUMN CUSTOMER_SECURITY_QUESTION ", "bbox": {"l": 79.20031, "t": 445.65616000000006, "r": 249.95911, "b": 453.58514, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "RETURN CASE ", "bbox": {"l": 79.20031, "t": 456.6964699999999, "r": 137.64001, "b": 464.62546, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 ", "bbox": {"l": 64.800308, "t": 467.67648, "r": 361.37817, "b": 475.60547, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "THEN C . CUSTOMER_SECURITY_QUESTION ", "bbox": {"l": 64.800308, "t": 478.65649, "r": 226.5591, "b": 486.58548, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 ", "bbox": {"l": 64.800308, "t": 489.69681, "r": 374.87817, "b": 497.62579, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "THEN C . CUSTOMER_SECURITY_QUESTION ", "bbox": {"l": 64.800308, "t": 500.67682, "r": 226.5591, "b": 508.6058, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "ELSE '*****' ", "bbox": {"l": 64.800308, "t": 511.65683, "r": 123.24001, "b": 519.58582, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "END ", "bbox": {"l": 64.800308, "t": 522.69714, "r": 96.240005, "b": 530.62613, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "ENABLE ; ", "bbox": {"l": 79.20031, "t": 533.6771200000001, "r": 124.14001, "b": 541.60614, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "CREATE MASK BANK_SCHEMA.MASK_SECURITY_QUESTION_ANSWER_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C ", "bbox": {"l": 64.800308, "t": 555.69745, "r": 500.69727, "b": 563.62645, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "FOR COLUMN CUSTOMER_SECURITY_QUESTION_ANSWER ", "bbox": {"l": 79.20031, "t": 566.6774399999999, "r": 281.3988, "b": 574.60645, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "RETURN CASE ", "bbox": {"l": 79.20031, "t": 577.65744, "r": 137.64001, "b": 585.58644, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 ", "bbox": {"l": 64.800308, "t": 588.6977400000001, "r": 361.37817, "b": 596.62674, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "THEN C . CUSTOMER_SECURITY_QUESTION_ANSWER ", "bbox": {"l": 64.800308, "t": 599.67773, "r": 258.05908, "b": 607.60674, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 ", "bbox": {"l": 64.800308, "t": 610.65773, "r": 374.87817, "b": 618.58673, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "THEN C . CUSTOMER_SECURITY_QUESTION_ANSWER ", "bbox": {"l": 64.800308, "t": 621.69803, "r": 258.05908, "b": 629.62703, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "ELSE '*****' ", "bbox": {"l": 64.800308, "t": 632.6780200000001, "r": 123.24001, "b": 640.60703, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "END ", "bbox": {"l": 64.800308, "t": 643.71832, "r": 96.240005, "b": 651.64732, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "ENABLE ; ", "bbox": {"l": 79.20031, "t": 654.69832, "r": 124.14001, "b": 662.62732, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "ALTER TABLE BANK_SCHEMA.CUSTOMERS ", "bbox": {"l": 64.800308, "t": 676.71861, "r": 226.5591, "b": 684.64761, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "ACTIVATE ROW ACCESS CONTROL ", "bbox": {"l": 79.20031, "t": 687.69862, "r": 214.01941, "b": 695.627617, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "ACTIVATE COLUMN ACCESS CONTROL ;", "bbox": {"l": 79.20031, "t": 698.678619, "r": 223.01941, "b": 706.60762, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "THEN C . CUSTOMER_TAX_ID WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'TELLER' ) = 1 THEN ( 'XXX-XX-' CONCAT QSYS2 . SUBSTR ( C . CUSTOMER_TAX_ID , 8 , 4 ) ) WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 THEN C . CUSTOMER_TAX_ID ELSE 'XXX-XX-XXXX' END ENABLE ; CREATE MASK BANK_SCHEMA.MASK_DRIVERS_LICENSE_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C FOR COLUMN CUSTOMER_DRIVERS_LICENSE_NUMBER RETURN CASE WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 THEN C . CUSTOMER_DRIVERS_LICENSE_NUMBER WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'TELLER' ) = 1 THEN C . CUSTOMER_DRIVERS_LICENSE_NUMBER WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 THEN C . CUSTOMER_DRIVERS_LICENSE_NUMBER ELSE '*************' END ENABLE ; CREATE MASK BANK_SCHEMA.MASK_LOGIN_ID_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C FOR COLUMN CUSTOMER_LOGIN_ID RETURN CASE WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 THEN C . CUSTOMER_LOGIN_ID WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 THEN C . CUSTOMER_LOGIN_ID ELSE '*****' END ENABLE ; CREATE MASK BANK_SCHEMA.MASK_SECURITY_QUESTION_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C FOR COLUMN CUSTOMER_SECURITY_QUESTION RETURN CASE WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 THEN C . CUSTOMER_SECURITY_QUESTION WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 THEN C . CUSTOMER_SECURITY_QUESTION ELSE '*****' END ENABLE ; CREATE MASK BANK_SCHEMA.MASK_SECURITY_QUESTION_ANSWER_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C FOR COLUMN CUSTOMER_SECURITY_QUESTION_ANSWER RETURN CASE WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 THEN C . CUSTOMER_SECURITY_QUESTION_ANSWER WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 THEN C . CUSTOMER_SECURITY_QUESTION_ANSWER ELSE '*****' END ENABLE ; ALTER TABLE BANK_SCHEMA.CUSTOMERS ACTIVATE ROW ACCESS CONTROL ACTIVATE COLUMN ACCESS CONTROL ;"}], "body": [{"label": "code", "id": 2, "page_no": 15, "cluster": {"id": 2, "label": "code", "bbox": {"l": 64.800308, "t": 71.67296999999996, "r": 500.69727, "b": 706.60762, "coord_origin": "TOPLEFT"}, "confidence": 0.7632163763046265, "cells": [{"id": 2, "text": "THEN C . CUSTOMER_TAX_ID ", "bbox": {"l": 64.800308, "t": 71.67296999999996, "r": 177.1194, "b": 79.60199, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'TELLER' ) = 1 ", "bbox": {"l": 64.800308, "t": 82.65295000000015, "r": 365.87817, "b": 90.58196999999996, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "THEN ( 'XXX-XX-' CONCAT QSYS2 . SUBSTR ( C . CUSTOMER_TAX_ID , 8 , 4 ) ) ", "bbox": {"l": 64.800308, "t": 93.63292999999999, "r": 392.81787, "b": 101.56195000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 ", "bbox": {"l": 64.800308, "t": 104.67322000000001, "r": 374.87817, "b": 112.60222999999996, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "THEN C . CUSTOMER_TAX_ID ", "bbox": {"l": 64.800308, "t": 115.65319999999997, "r": 177.1194, "b": 123.58220999999992, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "ELSE 'XXX-XX-XXXX' ", "bbox": {"l": 64.800308, "t": 126.63318000000015, "r": 150.1797, "b": 134.56219, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "END ", "bbox": {"l": 64.800308, "t": 137.67345999999998, "r": 96.240005, "b": 145.60248, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "ENABLE ; ", "bbox": {"l": 79.20031, "t": 148.65344000000005, "r": 124.14001, "b": 156.58245999999997, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "CREATE MASK BANK_SCHEMA.MASK_DRIVERS_LICENSE_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C ", "bbox": {"l": 64.800308, "t": 170.67377, "r": 460.25757, "b": 178.60278000000005, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "FOR COLUMN CUSTOMER_DRIVERS_LICENSE_NUMBER ", "bbox": {"l": 79.20031, "t": 181.65374999999995, "r": 272.45911, "b": 189.58276, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "RETURN CASE ", "bbox": {"l": 79.20031, "t": 192.69403, "r": 137.64001, "b": 200.62305000000003, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 ", "bbox": {"l": 64.800308, "t": 203.67400999999995, "r": 361.37817, "b": 211.60303, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "THEN C . CUSTOMER_DRIVERS_LICENSE_NUMBER ", "bbox": {"l": 64.800308, "t": 214.65399000000002, "r": 249.0591, "b": 222.58300999999994, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'TELLER' ) = 1 ", "bbox": {"l": 64.800308, "t": 225.69426999999996, "r": 365.87817, "b": 233.62329, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "THEN C . CUSTOMER_DRIVERS_LICENSE_NUMBER ", "bbox": {"l": 64.800308, "t": 236.67426, "r": 249.0591, "b": 244.60326999999995, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 ", "bbox": {"l": 64.800308, "t": 247.65423999999996, "r": 374.87817, "b": 255.58325000000002, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "THEN C . CUSTOMER_DRIVERS_LICENSE_NUMBER ", "bbox": {"l": 64.800308, "t": 258.69452, "r": 249.0591, "b": 266.62354000000005, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "ELSE '*************' ", "bbox": {"l": 64.800308, "t": 269.67449999999997, "r": 159.1797, "b": 277.60352, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "END ", "bbox": {"l": 64.800308, "t": 280.65454, "r": 96.240005, "b": 288.58353, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "ENABLE ; ", "bbox": {"l": 79.20031, "t": 291.69485000000003, "r": 124.14001, "b": 299.62384, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "CREATE MASK BANK_SCHEMA.MASK_LOGIN_ID_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C ", "bbox": {"l": 64.800308, "t": 313.65485, "r": 428.81786999999997, "b": 321.58383, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "FOR COLUMN CUSTOMER_LOGIN_ID ", "bbox": {"l": 79.20031, "t": 324.69516, "r": 209.51941, "b": 332.62415, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "RETURN CASE ", "bbox": {"l": 79.20031, "t": 335.67517, "r": 137.64001, "b": 343.6041599999999, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 ", "bbox": {"l": 64.800308, "t": 346.65518, "r": 361.37817, "b": 354.58417, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "THEN C . CUSTOMER_LOGIN_ID ", "bbox": {"l": 64.800308, "t": 357.69550000000004, "r": 186.1194, "b": 365.62448, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 ", "bbox": {"l": 64.800308, "t": 368.67551, "r": 374.87817, "b": 376.60449, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "THEN C . CUSTOMER_LOGIN_ID ", "bbox": {"l": 64.800308, "t": 379.65552, "r": 186.1194, "b": 387.5845, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "ELSE '*****' ", "bbox": {"l": 64.800308, "t": 390.69583, "r": 123.24001, "b": 398.62482, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "END ", "bbox": {"l": 64.800308, "t": 401.67584, "r": 96.240005, "b": 409.60482999999994, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "ENABLE ; ", "bbox": {"l": 79.20031, "t": 412.65585, "r": 124.14001, "b": 420.58484, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "CREATE MASK BANK_SCHEMA.MASK_SECURITY_QUESTION_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C ", "bbox": {"l": 64.800308, "t": 434.67615, "r": 469.25757, "b": 442.60513, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "FOR COLUMN CUSTOMER_SECURITY_QUESTION ", "bbox": {"l": 79.20031, "t": 445.65616000000006, "r": 249.95911, "b": 453.58514, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "RETURN CASE ", "bbox": {"l": 79.20031, "t": 456.6964699999999, "r": 137.64001, "b": 464.62546, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 ", "bbox": {"l": 64.800308, "t": 467.67648, "r": 361.37817, "b": 475.60547, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "THEN C . CUSTOMER_SECURITY_QUESTION ", "bbox": {"l": 64.800308, "t": 478.65649, "r": 226.5591, "b": 486.58548, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 ", "bbox": {"l": 64.800308, "t": 489.69681, "r": 374.87817, "b": 497.62579, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "THEN C . CUSTOMER_SECURITY_QUESTION ", "bbox": {"l": 64.800308, "t": 500.67682, "r": 226.5591, "b": 508.6058, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "ELSE '*****' ", "bbox": {"l": 64.800308, "t": 511.65683, "r": 123.24001, "b": 519.58582, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "END ", "bbox": {"l": 64.800308, "t": 522.69714, "r": 96.240005, "b": 530.62613, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "ENABLE ; ", "bbox": {"l": 79.20031, "t": 533.6771200000001, "r": 124.14001, "b": 541.60614, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "CREATE MASK BANK_SCHEMA.MASK_SECURITY_QUESTION_ANSWER_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C ", "bbox": {"l": 64.800308, "t": 555.69745, "r": 500.69727, "b": 563.62645, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "FOR COLUMN CUSTOMER_SECURITY_QUESTION_ANSWER ", "bbox": {"l": 79.20031, "t": 566.6774399999999, "r": 281.3988, "b": 574.60645, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "RETURN CASE ", "bbox": {"l": 79.20031, "t": 577.65744, "r": 137.64001, "b": 585.58644, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 ", "bbox": {"l": 64.800308, "t": 588.6977400000001, "r": 361.37817, "b": 596.62674, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "THEN C . CUSTOMER_SECURITY_QUESTION_ANSWER ", "bbox": {"l": 64.800308, "t": 599.67773, "r": 258.05908, "b": 607.60674, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 ", "bbox": {"l": 64.800308, "t": 610.65773, "r": 374.87817, "b": 618.58673, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "THEN C . CUSTOMER_SECURITY_QUESTION_ANSWER ", "bbox": {"l": 64.800308, "t": 621.69803, "r": 258.05908, "b": 629.62703, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "ELSE '*****' ", "bbox": {"l": 64.800308, "t": 632.6780200000001, "r": 123.24001, "b": 640.60703, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "END ", "bbox": {"l": 64.800308, "t": 643.71832, "r": 96.240005, "b": 651.64732, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "ENABLE ; ", "bbox": {"l": 79.20031, "t": 654.69832, "r": 124.14001, "b": 662.62732, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "ALTER TABLE BANK_SCHEMA.CUSTOMERS ", "bbox": {"l": 64.800308, "t": 676.71861, "r": 226.5591, "b": 684.64761, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "ACTIVATE ROW ACCESS CONTROL ", "bbox": {"l": 79.20031, "t": 687.69862, "r": 214.01941, "b": 695.627617, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "ACTIVATE COLUMN ACCESS CONTROL ;", "bbox": {"l": 79.20031, "t": 698.678619, "r": 223.01941, "b": 706.60762, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "THEN C . CUSTOMER_TAX_ID WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'TELLER' ) = 1 THEN ( 'XXX-XX-' CONCAT QSYS2 . SUBSTR ( C . CUSTOMER_TAX_ID , 8 , 4 ) ) WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 THEN C . CUSTOMER_TAX_ID ELSE 'XXX-XX-XXXX' END ENABLE ; CREATE MASK BANK_SCHEMA.MASK_DRIVERS_LICENSE_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C FOR COLUMN CUSTOMER_DRIVERS_LICENSE_NUMBER RETURN CASE WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 THEN C . CUSTOMER_DRIVERS_LICENSE_NUMBER WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'TELLER' ) = 1 THEN C . CUSTOMER_DRIVERS_LICENSE_NUMBER WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 THEN C . CUSTOMER_DRIVERS_LICENSE_NUMBER ELSE '*************' END ENABLE ; CREATE MASK BANK_SCHEMA.MASK_LOGIN_ID_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C FOR COLUMN CUSTOMER_LOGIN_ID RETURN CASE WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 THEN C . CUSTOMER_LOGIN_ID WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 THEN C . CUSTOMER_LOGIN_ID ELSE '*****' END ENABLE ; CREATE MASK BANK_SCHEMA.MASK_SECURITY_QUESTION_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C FOR COLUMN CUSTOMER_SECURITY_QUESTION RETURN CASE WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 THEN C . CUSTOMER_SECURITY_QUESTION WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 THEN C . CUSTOMER_SECURITY_QUESTION ELSE '*****' END ENABLE ; CREATE MASK BANK_SCHEMA.MASK_SECURITY_QUESTION_ANSWER_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C FOR COLUMN CUSTOMER_SECURITY_QUESTION_ANSWER RETURN CASE WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 THEN C . CUSTOMER_SECURITY_QUESTION_ANSWER WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 THEN C . CUSTOMER_SECURITY_QUESTION_ANSWER ELSE '*****' END ENABLE ; ALTER TABLE BANK_SCHEMA.CUSTOMERS ACTIVATE ROW ACCESS CONTROL ACTIVATE COLUMN ACCESS CONTROL ;"}], "headers": [{"label": "page_footer", "id": 1, "page_no": 15, "cluster": {"id": 1, "label": "page_footer", "bbox": {"l": 64.800003, "t": 754.848721, "r": 83.982002, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.8994000554084778, "cells": [{"id": 0, "text": "124 ", "bbox": {"l": 64.800003, "t": 754.848721, "r": 83.982002, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "124"}, {"label": "page_footer", "id": 0, "page_no": 15, "cluster": {"id": 0, "label": "page_footer", "bbox": {"l": 98.940002, "t": 755.538002, "r": 339.81958, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.943077027797699, "cells": [{"id": 1, "text": "Row and Column Access Control Support in IBM DB2 for i", "bbox": {"l": 98.940002, "t": 755.538002, "r": 339.81958, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Row and Column Access Control Support in IBM DB2 for i"}]}}, {"page_no": 16, "size": {"width": 612.0, "height": 792.0}, "cells": [], "predictions": {"layout": {"clusters": [{"id": 0, "label": "form", "bbox": {"l": 0.4932013750076294, "t": 0.0, "r": 610.2305297851562, "b": 791.654541015625, "coord_origin": "TOPLEFT"}, "confidence": 0.6497195363044739, "cells": [], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "form", "id": 0, "page_no": 16, "cluster": {"id": 0, "label": "form", "bbox": {"l": 0.4932013750076294, "t": 0.0, "r": 610.2305297851562, "b": 791.654541015625, "coord_origin": "TOPLEFT"}, "confidence": 0.6497195363044739, "cells": [], "children": []}, "text": null}], "body": [{"label": "form", "id": 0, "page_no": 16, "cluster": {"id": 0, "label": "form", "bbox": {"l": 0.4932013750076294, "t": 0.0, "r": 610.2305297851562, "b": 791.654541015625, "coord_origin": "TOPLEFT"}, "confidence": 0.6497195363044739, "cells": [], "children": []}, "text": null}], "headers": []}}, {"page_no": 17, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "fi", "bbox": {"l": 558.11987, "t": 45.468689999999924, "r": 565.46039, "b": 54.68169999999998, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "REDP-5110-00", "bbox": {"l": 171.0, "t": 631.338, "r": 231.88769999999997, "b": 639.66301, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "INTERNATIONAL ", "bbox": {"l": 467.3399999999999, "t": 247.71831999999995, "r": 559.80933, "b": 260.16052, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "TECHNICAL", "bbox": {"l": 467.3399999999999, "t": 261.75842, "r": 529.50208, "b": 274.20061999999996, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "SUPPORT", "bbox": {"l": 467.3399999999999, "t": 275.73839999999996, "r": 518.93317, "b": 288.1806, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "ORGANIZATION", "bbox": {"l": 467.3399999999999, "t": 289.71841, "r": 550.7475, "b": 302.16061, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "BUILDING TECHNICAL ", "bbox": {"l": 467.3399999999999, "t": 351.79199, "r": 571.70758, "b": 362.47198, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "INFORMATION BASED ON ", "bbox": {"l": 467.3399999999999, "t": 363.79199, "r": 587.38916, "b": 374.47198, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "PRACTICAL EXPERIENCE", "bbox": {"l": 467.3399999999999, "t": 375.79199, "r": 582.5556, "b": 386.47198, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "IBM Redbooks are developed ", "bbox": {"l": 467.3399999999999, "t": 399.8602900000001, "r": 587.46674, "b": 409.63251, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "by the IBM International ", "bbox": {"l": 467.3399999999999, "t": 410.90067, "r": 566.34229, "b": 420.67285, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Technical Support ", "bbox": {"l": 467.3399999999999, "t": 421.88068, "r": 543.20404, "b": 431.65289, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Organization. Experts from ", "bbox": {"l": 467.3399999999999, "t": 432.8606899999999, "r": 577.76697, "b": 442.63287, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "IBM, Customers and Partners ", "bbox": {"l": 467.3399999999999, "t": 443.90106, "r": 587.40948, "b": 453.67328, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "from around the world create ", "bbox": {"l": 467.3399999999999, "t": 454.88107, "r": 587.52051, "b": 464.65326, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "timely technical information ", "bbox": {"l": 467.3399999999999, "t": 465.86108, "r": 582.67505, "b": 475.6333, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "based on realistic scenarios. ", "bbox": {"l": 467.3399999999999, "t": 476.90146, "r": 585.46722, "b": 486.67365, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "Specific recommendations ", "bbox": {"l": 467.3399999999999, "t": 487.88147, "r": 577.70874, "b": 497.65369, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "are provided to help you ", "bbox": {"l": 467.3399999999999, "t": 498.86148, "r": 568.03546, "b": 508.63367, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "implement IT solutions more ", "bbox": {"l": 467.3399999999999, "t": 509.90186, "r": 585.44525, "b": 519.67407, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "effectively in your ", "bbox": {"l": 467.3399999999999, "t": 520.8818699999999, "r": 541.4967, "b": 530.65405, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "environment.", "bbox": {"l": 467.3399999999999, "t": 531.8618799999999, "r": 520.64893, "b": 541.63406, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "For more information:", "bbox": {"l": 467.3399999999999, "t": 578.83191, "r": 570.948, "b": 589.5119, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "ibm.com", "bbox": {"l": 467.3399999999999, "t": 590.83191, "r": 508.59961, "b": 601.5119, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "/redbooks", "bbox": {"l": 508.56000000000006, "t": 590.83191, "r": 552.74518, "b": 601.5119, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "Redpaper", "bbox": {"l": 474.60001, "t": 164.05658000000005, "r": 580.88989, "b": 188.94097999999997, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "\u2122", "bbox": {"l": 582.53992, "t": 172.32714999999996, "r": 592.13989, "b": 181.20714999999996, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Row and Column Access Control ", "bbox": {"l": 27.0, "t": 73.63799999999992, "r": 447.36002, "b": 103.00800000000004, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Support in IBM DB2 for i", "bbox": {"l": 27.0, "t": 113.76000999999997, "r": 314.43002, "b": 140.46002, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Implement roles and ", "bbox": {"l": 26.700001, "t": 242.17200000000003, "r": 127.4436, "b": 252.85199, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "separation of duties", "bbox": {"l": 26.700001, "t": 256.15198, "r": 121.6608, "b": 266.83196999999996, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Leverage row ", "bbox": {"l": 26.700001, "t": 284.17197, "r": 93.970795, "b": 294.85196, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "permissions on the ", "bbox": {"l": 26.700001, "t": 298.15198000000004, "r": 120.28319999999998, "b": 308.83197, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "database", "bbox": {"l": 26.700001, "t": 312.19199000000003, "r": 70.413605, "b": 322.87198, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Protect columns by ", "bbox": {"l": 26.700001, "t": 340.15198000000004, "r": 121.44960000000002, "b": 350.83197, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "defining column ", "bbox": {"l": 26.700001, "t": 354.19199000000003, "r": 106.5696, "b": 364.87198, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "masks", "bbox": {"l": 26.700001, "t": 368.1720000000001, "r": 58.194, "b": 378.85199, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "This IBM Redpaper publication provides information about the IBM i 7.2 ", "bbox": {"l": 152.94, "t": 242.72857999999997, "r": 413.99057, "b": 251.59295999999995, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "feature of IBM DB2 for i Row and Column Access Control (RCAC). It ", "bbox": {"l": 152.94002, "t": 254.72839, "r": 401.85635, "b": 263.59277, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "offers a broad description of the function and advantages of controlling ", "bbox": {"l": 152.94002, "t": 266.72821, "r": 414.08423, "b": 275.59259, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "access to data in a comprehensive and transparent way. This ", "bbox": {"l": 152.94002, "t": 278.72803, "r": 381.24014, "b": 287.59244, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "publication helps you understand the capabilities of RCAC and provides ", "bbox": {"l": 152.94002, "t": 290.72784, "r": 414.07031, "b": 299.59225, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "examples of defining, creating, and implementing the row permissions ", "bbox": {"l": 152.94002, "t": 302.72766, "r": 414.05447, "b": 311.59207, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "and column masks in a relational database environment.", "bbox": {"l": 152.94002, "t": 314.72747999999996, "r": 362.3291, "b": 323.59189, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "This paper is intended for database engineers, data-centric application ", "bbox": {"l": 152.94002, "t": 331.70728, "r": 414.17383, "b": 340.57169, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "developers, and security officers who want to design and implement ", "bbox": {"l": 152.94002, "t": 343.70709, "r": 407.61029, "b": 352.5715, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "RCAC as a part of their data control and governance policy. A solid ", "bbox": {"l": 152.94002, "t": 355.70691, "r": 399.29565, "b": 364.57132, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "background in IBM i object level security, DB2 for i relational database ", "bbox": {"l": 152.94002, "t": 367.70673, "r": 414.0603, "b": 376.57114, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "concepts, and SQL is assumed.", "bbox": {"l": 152.94002, "t": 379.70654, "r": 268.86945, "b": 388.57095, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "Back cover", "bbox": {"l": 287.22, "t": 28.54803000000004, "r": 414.24481, "b": 50.748050000000035, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 4, "label": "picture", "bbox": {"l": 485.1698303222656, "t": 25.259197235107422, "r": 566.2962036132812, "b": 54.191585540771484, "coord_origin": "TOPLEFT"}, "confidence": 0.940425455570221, "cells": [{"id": 0, "text": "fi", "bbox": {"l": 558.11987, "t": 45.468689999999924, "r": 565.46039, "b": 54.68169999999998, "coord_origin": "TOPLEFT"}}], "children": [{"id": 13, "label": "text", "bbox": {"l": 558.11987, "t": 45.468689999999924, "r": 565.46039, "b": 54.68169999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 0, "text": "fi", "bbox": {"l": 558.11987, "t": 45.468689999999924, "r": 565.46039, "b": 54.68169999999998, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 10, "label": "page_footer", "bbox": {"l": 171.0, "t": 631.338, "r": 231.88769999999997, "b": 639.66301, "coord_origin": "TOPLEFT"}, "confidence": 0.770024836063385, "cells": [{"id": 1, "text": "REDP-5110-00", "bbox": {"l": 171.0, "t": 631.338, "r": 231.88769999999997, "b": 639.66301, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "text", "bbox": {"l": 467.3399999999999, "t": 247.71831999999995, "r": 559.80933, "b": 302.16061, "coord_origin": "TOPLEFT"}, "confidence": 0.8532668352127075, "cells": [{"id": 2, "text": "INTERNATIONAL ", "bbox": {"l": 467.3399999999999, "t": 247.71831999999995, "r": 559.80933, "b": 260.16052, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "TECHNICAL", "bbox": {"l": 467.3399999999999, "t": 261.75842, "r": 529.50208, "b": 274.20061999999996, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "SUPPORT", "bbox": {"l": 467.3399999999999, "t": 275.73839999999996, "r": 518.93317, "b": 288.1806, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "ORGANIZATION", "bbox": {"l": 467.3399999999999, "t": 289.71841, "r": 550.7475, "b": 302.16061, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 467.3399999999999, "t": 351.79199, "r": 587.38916, "b": 386.47198, "coord_origin": "TOPLEFT"}, "confidence": 0.7157139778137207, "cells": [{"id": 6, "text": "BUILDING TECHNICAL ", "bbox": {"l": 467.3399999999999, "t": 351.79199, "r": 571.70758, "b": 362.47198, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "INFORMATION BASED ON ", "bbox": {"l": 467.3399999999999, "t": 363.79199, "r": 587.38916, "b": 374.47198, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "PRACTICAL EXPERIENCE", "bbox": {"l": 467.3399999999999, "t": 375.79199, "r": 582.5556, "b": 386.47198, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 467.3399999999999, "t": 399.8602900000001, "r": 587.52051, "b": 541.63406, "coord_origin": "TOPLEFT"}, "confidence": 0.9518947005271912, "cells": [{"id": 9, "text": "IBM Redbooks are developed ", "bbox": {"l": 467.3399999999999, "t": 399.8602900000001, "r": 587.46674, "b": 409.63251, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "by the IBM International ", "bbox": {"l": 467.3399999999999, "t": 410.90067, "r": 566.34229, "b": 420.67285, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Technical Support ", "bbox": {"l": 467.3399999999999, "t": 421.88068, "r": 543.20404, "b": 431.65289, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Organization. Experts from ", "bbox": {"l": 467.3399999999999, "t": 432.8606899999999, "r": 577.76697, "b": 442.63287, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "IBM, Customers and Partners ", "bbox": {"l": 467.3399999999999, "t": 443.90106, "r": 587.40948, "b": 453.67328, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "from around the world create ", "bbox": {"l": 467.3399999999999, "t": 454.88107, "r": 587.52051, "b": 464.65326, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "timely technical information ", "bbox": {"l": 467.3399999999999, "t": 465.86108, "r": 582.67505, "b": 475.6333, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "based on realistic scenarios. ", "bbox": {"l": 467.3399999999999, "t": 476.90146, "r": 585.46722, "b": 486.67365, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "Specific recommendations ", "bbox": {"l": 467.3399999999999, "t": 487.88147, "r": 577.70874, "b": 497.65369, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "are provided to help you ", "bbox": {"l": 467.3399999999999, "t": 498.86148, "r": 568.03546, "b": 508.63367, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "implement IT solutions more ", "bbox": {"l": 467.3399999999999, "t": 509.90186, "r": 585.44525, "b": 519.67407, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "effectively in your ", "bbox": {"l": 467.3399999999999, "t": 520.8818699999999, "r": 541.4967, "b": 530.65405, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "environment.", "bbox": {"l": 467.3399999999999, "t": 531.8618799999999, "r": 520.64893, "b": 541.63406, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 467.3399999999999, "t": 578.83191, "r": 570.948, "b": 601.5119, "coord_origin": "TOPLEFT"}, "confidence": 0.823000431060791, "cells": [{"id": 22, "text": "For more information:", "bbox": {"l": 467.3399999999999, "t": 578.83191, "r": 570.948, "b": 589.5119, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "ibm.com", "bbox": {"l": 467.3399999999999, "t": 590.83191, "r": 508.59961, "b": 601.5119, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "/redbooks", "bbox": {"l": 508.56000000000006, "t": 590.83191, "r": 552.74518, "b": 601.5119, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "picture", "bbox": {"l": 474.35540771484375, "t": 80.05132293701172, "r": 592.2726440429688, "b": 189.81260681152344, "coord_origin": "TOPLEFT"}, "confidence": 0.9696109890937805, "cells": [{"id": 25, "text": "Redpaper", "bbox": {"l": 474.60001, "t": 164.05658000000005, "r": 580.88989, "b": 188.94097999999997, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "\u2122", "bbox": {"l": 582.53992, "t": 172.32714999999996, "r": 592.13989, "b": 181.20714999999996, "coord_origin": "TOPLEFT"}}], "children": [{"id": 14, "label": "text", "bbox": {"l": 474.60001, "t": 164.05658000000005, "r": 580.88989, "b": 188.94097999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "Redpaper", "bbox": {"l": 474.60001, "t": 164.05658000000005, "r": 580.88989, "b": 188.94097999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 582.53992, "t": 172.32714999999996, "r": 592.13989, "b": 181.20714999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "\u2122", "bbox": {"l": 582.53992, "t": 172.32714999999996, "r": 592.13989, "b": 181.20714999999996, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 12, "label": "section_header", "bbox": {"l": 27.0, "t": 73.63799999999992, "r": 447.36002, "b": 140.46002, "coord_origin": "TOPLEFT"}, "confidence": 0.7128155827522278, "cells": [{"id": 27, "text": "Row and Column Access Control ", "bbox": {"l": 27.0, "t": 73.63799999999992, "r": 447.36002, "b": 103.00800000000004, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Support in IBM DB2 for i", "bbox": {"l": 27.0, "t": 113.76000999999997, "r": 314.43002, "b": 140.46002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "text", "bbox": {"l": 26.700001, "t": 242.17200000000003, "r": 127.4436, "b": 266.83196999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.8400373458862305, "cells": [{"id": 29, "text": "Implement roles and ", "bbox": {"l": 26.700001, "t": 242.17200000000003, "r": 127.4436, "b": 252.85199, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "separation of duties", "bbox": {"l": 26.700001, "t": 256.15198, "r": 121.6608, "b": 266.83196999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "text", "bbox": {"l": 26.700001, "t": 284.17197, "r": 120.28319999999998, "b": 322.87198, "coord_origin": "TOPLEFT"}, "confidence": 0.8828511834144592, "cells": [{"id": 31, "text": "Leverage row ", "bbox": {"l": 26.700001, "t": 284.17197, "r": 93.970795, "b": 294.85196, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "permissions on the ", "bbox": {"l": 26.700001, "t": 298.15198000000004, "r": 120.28319999999998, "b": 308.83197, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "database", "bbox": {"l": 26.700001, "t": 312.19199000000003, "r": 70.413605, "b": 322.87198, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "text", "bbox": {"l": 26.700001, "t": 340.15198000000004, "r": 121.44960000000002, "b": 378.85199, "coord_origin": "TOPLEFT"}, "confidence": 0.9064872860908508, "cells": [{"id": 34, "text": "Protect columns by ", "bbox": {"l": 26.700001, "t": 340.15198000000004, "r": 121.44960000000002, "b": 350.83197, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "defining column ", "bbox": {"l": 26.700001, "t": 354.19199000000003, "r": 106.5696, "b": 364.87198, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "masks", "bbox": {"l": 26.700001, "t": 368.1720000000001, "r": 58.194, "b": 378.85199, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 152.94, "t": 242.72857999999997, "r": 414.08423, "b": 323.59189, "coord_origin": "TOPLEFT"}, "confidence": 0.9789719581604004, "cells": [{"id": 37, "text": "This IBM Redpaper publication provides information about the IBM i 7.2 ", "bbox": {"l": 152.94, "t": 242.72857999999997, "r": 413.99057, "b": 251.59295999999995, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "feature of IBM DB2 for i Row and Column Access Control (RCAC). It ", "bbox": {"l": 152.94002, "t": 254.72839, "r": 401.85635, "b": 263.59277, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "offers a broad description of the function and advantages of controlling ", "bbox": {"l": 152.94002, "t": 266.72821, "r": 414.08423, "b": 275.59259, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "access to data in a comprehensive and transparent way. This ", "bbox": {"l": 152.94002, "t": 278.72803, "r": 381.24014, "b": 287.59244, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "publication helps you understand the capabilities of RCAC and provides ", "bbox": {"l": 152.94002, "t": 290.72784, "r": 414.07031, "b": 299.59225, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "examples of defining, creating, and implementing the row permissions ", "bbox": {"l": 152.94002, "t": 302.72766, "r": 414.05447, "b": 311.59207, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "and column masks in a relational database environment.", "bbox": {"l": 152.94002, "t": 314.72747999999996, "r": 362.3291, "b": 323.59189, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 152.94002, "t": 331.70728, "r": 414.17383, "b": 388.57095, "coord_origin": "TOPLEFT"}, "confidence": 0.9799742698669434, "cells": [{"id": 44, "text": "This paper is intended for database engineers, data-centric application ", "bbox": {"l": 152.94002, "t": 331.70728, "r": 414.17383, "b": 340.57169, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "developers, and security officers who want to design and implement ", "bbox": {"l": 152.94002, "t": 343.70709, "r": 407.61029, "b": 352.5715, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "RCAC as a part of their data control and governance policy. A solid ", "bbox": {"l": 152.94002, "t": 355.70691, "r": 399.29565, "b": 364.57132, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "background in IBM i object level security, DB2 for i relational database ", "bbox": {"l": 152.94002, "t": 367.70673, "r": 414.0603, "b": 376.57114, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "concepts, and SQL is assumed.", "bbox": {"l": 152.94002, "t": 379.70654, "r": 268.86945, "b": 388.57095, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 287.22, "t": 28.54803000000004, "r": 414.24481, "b": 50.748050000000035, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "Back cover", "bbox": {"l": 287.22, "t": 28.54803000000004, "r": 414.24481, "b": 50.748050000000035, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "picture", "id": 4, "page_no": 17, "cluster": {"id": 4, "label": "picture", "bbox": {"l": 485.1698303222656, "t": 25.259197235107422, "r": 566.2962036132812, "b": 54.191585540771484, "coord_origin": "TOPLEFT"}, "confidence": 0.940425455570221, "cells": [{"id": 0, "text": "fi", "bbox": {"l": 558.11987, "t": 45.468689999999924, "r": 565.46039, "b": 54.68169999999998, "coord_origin": "TOPLEFT"}}], "children": [{"id": 13, "label": "text", "bbox": {"l": 558.11987, "t": 45.468689999999924, "r": 565.46039, "b": 54.68169999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 0, "text": "fi", "bbox": {"l": 558.11987, "t": 45.468689999999924, "r": 565.46039, "b": 54.68169999999998, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "page_footer", "id": 10, "page_no": 17, "cluster": {"id": 10, "label": "page_footer", "bbox": {"l": 171.0, "t": 631.338, "r": 231.88769999999997, "b": 639.66301, "coord_origin": "TOPLEFT"}, "confidence": 0.770024836063385, "cells": [{"id": 1, "text": "REDP-5110-00", "bbox": {"l": 171.0, "t": 631.338, "r": 231.88769999999997, "b": 639.66301, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "REDP-5110-00"}, {"label": "text", "id": 7, "page_no": 17, "cluster": {"id": 7, "label": "text", "bbox": {"l": 467.3399999999999, "t": 247.71831999999995, "r": 559.80933, "b": 302.16061, "coord_origin": "TOPLEFT"}, "confidence": 0.8532668352127075, "cells": [{"id": 2, "text": "INTERNATIONAL ", "bbox": {"l": 467.3399999999999, "t": 247.71831999999995, "r": 559.80933, "b": 260.16052, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "TECHNICAL", "bbox": {"l": 467.3399999999999, "t": 261.75842, "r": 529.50208, "b": 274.20061999999996, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "SUPPORT", "bbox": {"l": 467.3399999999999, "t": 275.73839999999996, "r": 518.93317, "b": 288.1806, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "ORGANIZATION", "bbox": {"l": 467.3399999999999, "t": 289.71841, "r": 550.7475, "b": 302.16061, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "INTERNATIONAL TECHNICAL SUPPORT ORGANIZATION"}, {"label": "text", "id": 11, "page_no": 17, "cluster": {"id": 11, "label": "text", "bbox": {"l": 467.3399999999999, "t": 351.79199, "r": 587.38916, "b": 386.47198, "coord_origin": "TOPLEFT"}, "confidence": 0.7157139778137207, "cells": [{"id": 6, "text": "BUILDING TECHNICAL ", "bbox": {"l": 467.3399999999999, "t": 351.79199, "r": 571.70758, "b": 362.47198, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "INFORMATION BASED ON ", "bbox": {"l": 467.3399999999999, "t": 363.79199, "r": 587.38916, "b": 374.47198, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "PRACTICAL EXPERIENCE", "bbox": {"l": 467.3399999999999, "t": 375.79199, "r": 582.5556, "b": 386.47198, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "BUILDING TECHNICAL INFORMATION BASED ON PRACTICAL EXPERIENCE"}, {"label": "text", "id": 3, "page_no": 17, "cluster": {"id": 3, "label": "text", "bbox": {"l": 467.3399999999999, "t": 399.8602900000001, "r": 587.52051, "b": 541.63406, "coord_origin": "TOPLEFT"}, "confidence": 0.9518947005271912, "cells": [{"id": 9, "text": "IBM Redbooks are developed ", "bbox": {"l": 467.3399999999999, "t": 399.8602900000001, "r": 587.46674, "b": 409.63251, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "by the IBM International ", "bbox": {"l": 467.3399999999999, "t": 410.90067, "r": 566.34229, "b": 420.67285, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Technical Support ", "bbox": {"l": 467.3399999999999, "t": 421.88068, "r": 543.20404, "b": 431.65289, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Organization. Experts from ", "bbox": {"l": 467.3399999999999, "t": 432.8606899999999, "r": 577.76697, "b": 442.63287, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "IBM, Customers and Partners ", "bbox": {"l": 467.3399999999999, "t": 443.90106, "r": 587.40948, "b": 453.67328, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "from around the world create ", "bbox": {"l": 467.3399999999999, "t": 454.88107, "r": 587.52051, "b": 464.65326, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "timely technical information ", "bbox": {"l": 467.3399999999999, "t": 465.86108, "r": 582.67505, "b": 475.6333, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "based on realistic scenarios. ", "bbox": {"l": 467.3399999999999, "t": 476.90146, "r": 585.46722, "b": 486.67365, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "Specific recommendations ", "bbox": {"l": 467.3399999999999, "t": 487.88147, "r": 577.70874, "b": 497.65369, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "are provided to help you ", "bbox": {"l": 467.3399999999999, "t": 498.86148, "r": 568.03546, "b": 508.63367, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "implement IT solutions more ", "bbox": {"l": 467.3399999999999, "t": 509.90186, "r": 585.44525, "b": 519.67407, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "effectively in your ", "bbox": {"l": 467.3399999999999, "t": 520.8818699999999, "r": 541.4967, "b": 530.65405, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "environment.", "bbox": {"l": 467.3399999999999, "t": 531.8618799999999, "r": 520.64893, "b": 541.63406, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "IBM Redbooks are developed by the IBM International Technical Support Organization. Experts from IBM, Customers and Partners from around the world create timely technical information based on realistic scenarios. Specific recommendations are provided to help you implement IT solutions more effectively in your environment."}, {"label": "text", "id": 9, "page_no": 17, "cluster": {"id": 9, "label": "text", "bbox": {"l": 467.3399999999999, "t": 578.83191, "r": 570.948, "b": 601.5119, "coord_origin": "TOPLEFT"}, "confidence": 0.823000431060791, "cells": [{"id": 22, "text": "For more information:", "bbox": {"l": 467.3399999999999, "t": 578.83191, "r": 570.948, "b": 589.5119, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "ibm.com", "bbox": {"l": 467.3399999999999, "t": 590.83191, "r": 508.59961, "b": 601.5119, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "/redbooks", "bbox": {"l": 508.56000000000006, "t": 590.83191, "r": 552.74518, "b": 601.5119, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "For more information: ibm.com /redbooks"}, {"label": "picture", "id": 2, "page_no": 17, "cluster": {"id": 2, "label": "picture", "bbox": {"l": 474.35540771484375, "t": 80.05132293701172, "r": 592.2726440429688, "b": 189.81260681152344, "coord_origin": "TOPLEFT"}, "confidence": 0.9696109890937805, "cells": [{"id": 25, "text": "Redpaper", "bbox": {"l": 474.60001, "t": 164.05658000000005, "r": 580.88989, "b": 188.94097999999997, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "\u2122", "bbox": {"l": 582.53992, "t": 172.32714999999996, "r": 592.13989, "b": 181.20714999999996, "coord_origin": "TOPLEFT"}}], "children": [{"id": 14, "label": "text", "bbox": {"l": 474.60001, "t": 164.05658000000005, "r": 580.88989, "b": 188.94097999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "Redpaper", "bbox": {"l": 474.60001, "t": 164.05658000000005, "r": 580.88989, "b": 188.94097999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 582.53992, "t": 172.32714999999996, "r": 592.13989, "b": 181.20714999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "\u2122", "bbox": {"l": 582.53992, "t": 172.32714999999996, "r": 592.13989, "b": 181.20714999999996, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "section_header", "id": 12, "page_no": 17, "cluster": {"id": 12, "label": "section_header", "bbox": {"l": 27.0, "t": 73.63799999999992, "r": 447.36002, "b": 140.46002, "coord_origin": "TOPLEFT"}, "confidence": 0.7128155827522278, "cells": [{"id": 27, "text": "Row and Column Access Control ", "bbox": {"l": 27.0, "t": 73.63799999999992, "r": 447.36002, "b": 103.00800000000004, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Support in IBM DB2 for i", "bbox": {"l": 27.0, "t": 113.76000999999997, "r": 314.43002, "b": 140.46002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Row and Column Access Control Support in IBM DB2 for i"}, {"label": "text", "id": 8, "page_no": 17, "cluster": {"id": 8, "label": "text", "bbox": {"l": 26.700001, "t": 242.17200000000003, "r": 127.4436, "b": 266.83196999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.8400373458862305, "cells": [{"id": 29, "text": "Implement roles and ", "bbox": {"l": 26.700001, "t": 242.17200000000003, "r": 127.4436, "b": 252.85199, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "separation of duties", "bbox": {"l": 26.700001, "t": 256.15198, "r": 121.6608, "b": 266.83196999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Implement roles and separation of duties"}, {"label": "text", "id": 6, "page_no": 17, "cluster": {"id": 6, "label": "text", "bbox": {"l": 26.700001, "t": 284.17197, "r": 120.28319999999998, "b": 322.87198, "coord_origin": "TOPLEFT"}, "confidence": 0.8828511834144592, "cells": [{"id": 31, "text": "Leverage row ", "bbox": {"l": 26.700001, "t": 284.17197, "r": 93.970795, "b": 294.85196, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "permissions on the ", "bbox": {"l": 26.700001, "t": 298.15198000000004, "r": 120.28319999999998, "b": 308.83197, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "database", "bbox": {"l": 26.700001, "t": 312.19199000000003, "r": 70.413605, "b": 322.87198, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Leverage row permissions on the database"}, {"label": "text", "id": 5, "page_no": 17, "cluster": {"id": 5, "label": "text", "bbox": {"l": 26.700001, "t": 340.15198000000004, "r": 121.44960000000002, "b": 378.85199, "coord_origin": "TOPLEFT"}, "confidence": 0.9064872860908508, "cells": [{"id": 34, "text": "Protect columns by ", "bbox": {"l": 26.700001, "t": 340.15198000000004, "r": 121.44960000000002, "b": 350.83197, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "defining column ", "bbox": {"l": 26.700001, "t": 354.19199000000003, "r": 106.5696, "b": 364.87198, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "masks", "bbox": {"l": 26.700001, "t": 368.1720000000001, "r": 58.194, "b": 378.85199, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Protect columns by defining column masks"}, {"label": "text", "id": 1, "page_no": 17, "cluster": {"id": 1, "label": "text", "bbox": {"l": 152.94, "t": 242.72857999999997, "r": 414.08423, "b": 323.59189, "coord_origin": "TOPLEFT"}, "confidence": 0.9789719581604004, "cells": [{"id": 37, "text": "This IBM Redpaper publication provides information about the IBM i 7.2 ", "bbox": {"l": 152.94, "t": 242.72857999999997, "r": 413.99057, "b": 251.59295999999995, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "feature of IBM DB2 for i Row and Column Access Control (RCAC). It ", "bbox": {"l": 152.94002, "t": 254.72839, "r": 401.85635, "b": 263.59277, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "offers a broad description of the function and advantages of controlling ", "bbox": {"l": 152.94002, "t": 266.72821, "r": 414.08423, "b": 275.59259, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "access to data in a comprehensive and transparent way. This ", "bbox": {"l": 152.94002, "t": 278.72803, "r": 381.24014, "b": 287.59244, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "publication helps you understand the capabilities of RCAC and provides ", "bbox": {"l": 152.94002, "t": 290.72784, "r": 414.07031, "b": 299.59225, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "examples of defining, creating, and implementing the row permissions ", "bbox": {"l": 152.94002, "t": 302.72766, "r": 414.05447, "b": 311.59207, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "and column masks in a relational database environment.", "bbox": {"l": 152.94002, "t": 314.72747999999996, "r": 362.3291, "b": 323.59189, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "This IBM Redpaper publication provides information about the IBM i 7.2 feature of IBM DB2 for i Row and Column Access Control (RCAC). It offers a broad description of the function and advantages of controlling access to data in a comprehensive and transparent way. This publication helps you understand the capabilities of RCAC and provides examples of defining, creating, and implementing the row permissions and column masks in a relational database environment."}, {"label": "text", "id": 0, "page_no": 17, "cluster": {"id": 0, "label": "text", "bbox": {"l": 152.94002, "t": 331.70728, "r": 414.17383, "b": 388.57095, "coord_origin": "TOPLEFT"}, "confidence": 0.9799742698669434, "cells": [{"id": 44, "text": "This paper is intended for database engineers, data-centric application ", "bbox": {"l": 152.94002, "t": 331.70728, "r": 414.17383, "b": 340.57169, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "developers, and security officers who want to design and implement ", "bbox": {"l": 152.94002, "t": 343.70709, "r": 407.61029, "b": 352.5715, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "RCAC as a part of their data control and governance policy. A solid ", "bbox": {"l": 152.94002, "t": 355.70691, "r": 399.29565, "b": 364.57132, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "background in IBM i object level security, DB2 for i relational database ", "bbox": {"l": 152.94002, "t": 367.70673, "r": 414.0603, "b": 376.57114, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "concepts, and SQL is assumed.", "bbox": {"l": 152.94002, "t": 379.70654, "r": 268.86945, "b": 388.57095, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "This paper is intended for database engineers, data-centric application developers, and security officers who want to design and implement RCAC as a part of their data control and governance policy. A solid background in IBM i object level security, DB2 for i relational database concepts, and SQL is assumed."}, {"label": "text", "id": 16, "page_no": 17, "cluster": {"id": 16, "label": "text", "bbox": {"l": 287.22, "t": 28.54803000000004, "r": 414.24481, "b": 50.748050000000035, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "Back cover", "bbox": {"l": 287.22, "t": 28.54803000000004, "r": 414.24481, "b": 50.748050000000035, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Back cover"}], "body": [{"label": "picture", "id": 4, "page_no": 17, "cluster": {"id": 4, "label": "picture", "bbox": {"l": 485.1698303222656, "t": 25.259197235107422, "r": 566.2962036132812, "b": 54.191585540771484, "coord_origin": "TOPLEFT"}, "confidence": 0.940425455570221, "cells": [{"id": 0, "text": "fi", "bbox": {"l": 558.11987, "t": 45.468689999999924, "r": 565.46039, "b": 54.68169999999998, "coord_origin": "TOPLEFT"}}], "children": [{"id": 13, "label": "text", "bbox": {"l": 558.11987, "t": 45.468689999999924, "r": 565.46039, "b": 54.68169999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 0, "text": "fi", "bbox": {"l": 558.11987, "t": 45.468689999999924, "r": 565.46039, "b": 54.68169999999998, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "text", "id": 7, "page_no": 17, "cluster": {"id": 7, "label": "text", "bbox": {"l": 467.3399999999999, "t": 247.71831999999995, "r": 559.80933, "b": 302.16061, "coord_origin": "TOPLEFT"}, "confidence": 0.8532668352127075, "cells": [{"id": 2, "text": "INTERNATIONAL ", "bbox": {"l": 467.3399999999999, "t": 247.71831999999995, "r": 559.80933, "b": 260.16052, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "TECHNICAL", "bbox": {"l": 467.3399999999999, "t": 261.75842, "r": 529.50208, "b": 274.20061999999996, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "SUPPORT", "bbox": {"l": 467.3399999999999, "t": 275.73839999999996, "r": 518.93317, "b": 288.1806, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "ORGANIZATION", "bbox": {"l": 467.3399999999999, "t": 289.71841, "r": 550.7475, "b": 302.16061, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "INTERNATIONAL TECHNICAL SUPPORT ORGANIZATION"}, {"label": "text", "id": 11, "page_no": 17, "cluster": {"id": 11, "label": "text", "bbox": {"l": 467.3399999999999, "t": 351.79199, "r": 587.38916, "b": 386.47198, "coord_origin": "TOPLEFT"}, "confidence": 0.7157139778137207, "cells": [{"id": 6, "text": "BUILDING TECHNICAL ", "bbox": {"l": 467.3399999999999, "t": 351.79199, "r": 571.70758, "b": 362.47198, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "INFORMATION BASED ON ", "bbox": {"l": 467.3399999999999, "t": 363.79199, "r": 587.38916, "b": 374.47198, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "PRACTICAL EXPERIENCE", "bbox": {"l": 467.3399999999999, "t": 375.79199, "r": 582.5556, "b": 386.47198, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "BUILDING TECHNICAL INFORMATION BASED ON PRACTICAL EXPERIENCE"}, {"label": "text", "id": 3, "page_no": 17, "cluster": {"id": 3, "label": "text", "bbox": {"l": 467.3399999999999, "t": 399.8602900000001, "r": 587.52051, "b": 541.63406, "coord_origin": "TOPLEFT"}, "confidence": 0.9518947005271912, "cells": [{"id": 9, "text": "IBM Redbooks are developed ", "bbox": {"l": 467.3399999999999, "t": 399.8602900000001, "r": 587.46674, "b": 409.63251, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "by the IBM International ", "bbox": {"l": 467.3399999999999, "t": 410.90067, "r": 566.34229, "b": 420.67285, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Technical Support ", "bbox": {"l": 467.3399999999999, "t": 421.88068, "r": 543.20404, "b": 431.65289, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Organization. Experts from ", "bbox": {"l": 467.3399999999999, "t": 432.8606899999999, "r": 577.76697, "b": 442.63287, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "IBM, Customers and Partners ", "bbox": {"l": 467.3399999999999, "t": 443.90106, "r": 587.40948, "b": 453.67328, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "from around the world create ", "bbox": {"l": 467.3399999999999, "t": 454.88107, "r": 587.52051, "b": 464.65326, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "timely technical information ", "bbox": {"l": 467.3399999999999, "t": 465.86108, "r": 582.67505, "b": 475.6333, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "based on realistic scenarios. ", "bbox": {"l": 467.3399999999999, "t": 476.90146, "r": 585.46722, "b": 486.67365, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "Specific recommendations ", "bbox": {"l": 467.3399999999999, "t": 487.88147, "r": 577.70874, "b": 497.65369, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "are provided to help you ", "bbox": {"l": 467.3399999999999, "t": 498.86148, "r": 568.03546, "b": 508.63367, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "implement IT solutions more ", "bbox": {"l": 467.3399999999999, "t": 509.90186, "r": 585.44525, "b": 519.67407, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "effectively in your ", "bbox": {"l": 467.3399999999999, "t": 520.8818699999999, "r": 541.4967, "b": 530.65405, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "environment.", "bbox": {"l": 467.3399999999999, "t": 531.8618799999999, "r": 520.64893, "b": 541.63406, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "IBM Redbooks are developed by the IBM International Technical Support Organization. Experts from IBM, Customers and Partners from around the world create timely technical information based on realistic scenarios. Specific recommendations are provided to help you implement IT solutions more effectively in your environment."}, {"label": "text", "id": 9, "page_no": 17, "cluster": {"id": 9, "label": "text", "bbox": {"l": 467.3399999999999, "t": 578.83191, "r": 570.948, "b": 601.5119, "coord_origin": "TOPLEFT"}, "confidence": 0.823000431060791, "cells": [{"id": 22, "text": "For more information:", "bbox": {"l": 467.3399999999999, "t": 578.83191, "r": 570.948, "b": 589.5119, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "ibm.com", "bbox": {"l": 467.3399999999999, "t": 590.83191, "r": 508.59961, "b": 601.5119, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "/redbooks", "bbox": {"l": 508.56000000000006, "t": 590.83191, "r": 552.74518, "b": 601.5119, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "For more information: ibm.com /redbooks"}, {"label": "picture", "id": 2, "page_no": 17, "cluster": {"id": 2, "label": "picture", "bbox": {"l": 474.35540771484375, "t": 80.05132293701172, "r": 592.2726440429688, "b": 189.81260681152344, "coord_origin": "TOPLEFT"}, "confidence": 0.9696109890937805, "cells": [{"id": 25, "text": "Redpaper", "bbox": {"l": 474.60001, "t": 164.05658000000005, "r": 580.88989, "b": 188.94097999999997, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "\u2122", "bbox": {"l": 582.53992, "t": 172.32714999999996, "r": 592.13989, "b": 181.20714999999996, "coord_origin": "TOPLEFT"}}], "children": [{"id": 14, "label": "text", "bbox": {"l": 474.60001, "t": 164.05658000000005, "r": 580.88989, "b": 188.94097999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "Redpaper", "bbox": {"l": 474.60001, "t": 164.05658000000005, "r": 580.88989, "b": 188.94097999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 582.53992, "t": 172.32714999999996, "r": 592.13989, "b": 181.20714999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "\u2122", "bbox": {"l": 582.53992, "t": 172.32714999999996, "r": 592.13989, "b": 181.20714999999996, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "section_header", "id": 12, "page_no": 17, "cluster": {"id": 12, "label": "section_header", "bbox": {"l": 27.0, "t": 73.63799999999992, "r": 447.36002, "b": 140.46002, "coord_origin": "TOPLEFT"}, "confidence": 0.7128155827522278, "cells": [{"id": 27, "text": "Row and Column Access Control ", "bbox": {"l": 27.0, "t": 73.63799999999992, "r": 447.36002, "b": 103.00800000000004, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Support in IBM DB2 for i", "bbox": {"l": 27.0, "t": 113.76000999999997, "r": 314.43002, "b": 140.46002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Row and Column Access Control Support in IBM DB2 for i"}, {"label": "text", "id": 8, "page_no": 17, "cluster": {"id": 8, "label": "text", "bbox": {"l": 26.700001, "t": 242.17200000000003, "r": 127.4436, "b": 266.83196999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.8400373458862305, "cells": [{"id": 29, "text": "Implement roles and ", "bbox": {"l": 26.700001, "t": 242.17200000000003, "r": 127.4436, "b": 252.85199, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "separation of duties", "bbox": {"l": 26.700001, "t": 256.15198, "r": 121.6608, "b": 266.83196999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Implement roles and separation of duties"}, {"label": "text", "id": 6, "page_no": 17, "cluster": {"id": 6, "label": "text", "bbox": {"l": 26.700001, "t": 284.17197, "r": 120.28319999999998, "b": 322.87198, "coord_origin": "TOPLEFT"}, "confidence": 0.8828511834144592, "cells": [{"id": 31, "text": "Leverage row ", "bbox": {"l": 26.700001, "t": 284.17197, "r": 93.970795, "b": 294.85196, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "permissions on the ", "bbox": {"l": 26.700001, "t": 298.15198000000004, "r": 120.28319999999998, "b": 308.83197, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "database", "bbox": {"l": 26.700001, "t": 312.19199000000003, "r": 70.413605, "b": 322.87198, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Leverage row permissions on the database"}, {"label": "text", "id": 5, "page_no": 17, "cluster": {"id": 5, "label": "text", "bbox": {"l": 26.700001, "t": 340.15198000000004, "r": 121.44960000000002, "b": 378.85199, "coord_origin": "TOPLEFT"}, "confidence": 0.9064872860908508, "cells": [{"id": 34, "text": "Protect columns by ", "bbox": {"l": 26.700001, "t": 340.15198000000004, "r": 121.44960000000002, "b": 350.83197, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "defining column ", "bbox": {"l": 26.700001, "t": 354.19199000000003, "r": 106.5696, "b": 364.87198, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "masks", "bbox": {"l": 26.700001, "t": 368.1720000000001, "r": 58.194, "b": 378.85199, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Protect columns by defining column masks"}, {"label": "text", "id": 1, "page_no": 17, "cluster": {"id": 1, "label": "text", "bbox": {"l": 152.94, "t": 242.72857999999997, "r": 414.08423, "b": 323.59189, "coord_origin": "TOPLEFT"}, "confidence": 0.9789719581604004, "cells": [{"id": 37, "text": "This IBM Redpaper publication provides information about the IBM i 7.2 ", "bbox": {"l": 152.94, "t": 242.72857999999997, "r": 413.99057, "b": 251.59295999999995, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "feature of IBM DB2 for i Row and Column Access Control (RCAC). It ", "bbox": {"l": 152.94002, "t": 254.72839, "r": 401.85635, "b": 263.59277, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "offers a broad description of the function and advantages of controlling ", "bbox": {"l": 152.94002, "t": 266.72821, "r": 414.08423, "b": 275.59259, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "access to data in a comprehensive and transparent way. This ", "bbox": {"l": 152.94002, "t": 278.72803, "r": 381.24014, "b": 287.59244, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "publication helps you understand the capabilities of RCAC and provides ", "bbox": {"l": 152.94002, "t": 290.72784, "r": 414.07031, "b": 299.59225, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "examples of defining, creating, and implementing the row permissions ", "bbox": {"l": 152.94002, "t": 302.72766, "r": 414.05447, "b": 311.59207, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "and column masks in a relational database environment.", "bbox": {"l": 152.94002, "t": 314.72747999999996, "r": 362.3291, "b": 323.59189, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "This IBM Redpaper publication provides information about the IBM i 7.2 feature of IBM DB2 for i Row and Column Access Control (RCAC). It offers a broad description of the function and advantages of controlling access to data in a comprehensive and transparent way. This publication helps you understand the capabilities of RCAC and provides examples of defining, creating, and implementing the row permissions and column masks in a relational database environment."}, {"label": "text", "id": 0, "page_no": 17, "cluster": {"id": 0, "label": "text", "bbox": {"l": 152.94002, "t": 331.70728, "r": 414.17383, "b": 388.57095, "coord_origin": "TOPLEFT"}, "confidence": 0.9799742698669434, "cells": [{"id": 44, "text": "This paper is intended for database engineers, data-centric application ", "bbox": {"l": 152.94002, "t": 331.70728, "r": 414.17383, "b": 340.57169, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "developers, and security officers who want to design and implement ", "bbox": {"l": 152.94002, "t": 343.70709, "r": 407.61029, "b": 352.5715, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "RCAC as a part of their data control and governance policy. A solid ", "bbox": {"l": 152.94002, "t": 355.70691, "r": 399.29565, "b": 364.57132, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "background in IBM i object level security, DB2 for i relational database ", "bbox": {"l": 152.94002, "t": 367.70673, "r": 414.0603, "b": 376.57114, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "concepts, and SQL is assumed.", "bbox": {"l": 152.94002, "t": 379.70654, "r": 268.86945, "b": 388.57095, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "This paper is intended for database engineers, data-centric application developers, and security officers who want to design and implement RCAC as a part of their data control and governance policy. A solid background in IBM i object level security, DB2 for i relational database concepts, and SQL is assumed."}, {"label": "text", "id": 16, "page_no": 17, "cluster": {"id": 16, "label": "text", "bbox": {"l": 287.22, "t": 28.54803000000004, "r": 414.24481, "b": 50.748050000000035, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "Back cover", "bbox": {"l": 287.22, "t": 28.54803000000004, "r": 414.24481, "b": 50.748050000000035, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Back cover"}], "headers": [{"label": "page_footer", "id": 10, "page_no": 17, "cluster": {"id": 10, "label": "page_footer", "bbox": {"l": 171.0, "t": 631.338, "r": 231.88769999999997, "b": 639.66301, "coord_origin": "TOPLEFT"}, "confidence": 0.770024836063385, "cells": [{"id": 1, "text": "REDP-5110-00", "bbox": {"l": 171.0, "t": 631.338, "r": 231.88769999999997, "b": 639.66301, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "REDP-5110-00"}]}}]
\ No newline at end of file
+[{"page_no": 0, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "ibm.com", "bbox": {"l": 36.900002, "t": 751.23, "r": 98.600998, "b": 765.105, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "/redbooks", "bbox": {"l": 98.580002, "t": 751.23, "r": 164.4585, "b": 765.105, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Redpaper", "bbox": {"l": 314.70001, "t": 711.50856, "r": 580.52002, "b": 773.772959, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Front cover", "bbox": {"l": 287.82001, "t": 28.54803000000004, "r": 418.83356, "b": 50.748050000000035, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Row and Column Access Control ", "bbox": {"l": 35.700001, "t": 84.58654999999987, "r": 584.64288, "b": 122.82097999999996, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Support in IBM DB2 for i", "bbox": {"l": 35.700001, "t": 127.60668999999996, "r": 447.66919000000007, "b": 165.84113000000002, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Jim Bainbridge", "bbox": {"l": 509.22, "t": 575.71201, "r": 581.34119, "b": 586.392, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Hernando Bedoya", "bbox": {"l": 497.70001, "t": 589.752, "r": 581.3736, "b": 600.43199, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Rob Bestgen", "bbox": {"l": 521.40002, "t": 603.73199, "r": 581.34003, "b": 614.4119900000001, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Mike Cain", "bbox": {"l": 534.12, "t": 617.71199, "r": 581.31598, "b": 628.39198, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Dan Cruikshank", "bbox": {"l": 505.43999999999994, "t": 631.75198, "r": 581.29077, "b": 642.4319800000001, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Jim Denton", "bbox": {"l": 527.22003, "t": 645.73198, "r": 581.29926, "b": 656.41197, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Doug Mack", "bbox": {"l": 527.64001, "t": 659.71198, "r": 581.30884, "b": 670.39197, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Tom McKinley", "bbox": {"l": 514.38, "t": 673.75197, "r": 581.38678, "b": 684.43197, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Kent Milligan", "bbox": {"l": 518.82001, "t": 687.73197, "r": 581.33759, "b": 698.411972, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Implement roles and separation ", "bbox": {"l": 36.119999, "t": 296.13828, "r": 216.00064, "b": 308.58047, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "of duties", "bbox": {"l": 36.119999, "t": 313.11838000000006, "r": 84.527145, "b": 325.56058, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "Leverage", "bbox": {"l": 35.759315, "t": 350.13881999999995, "r": 80.409691, "b": 362.58102, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "row permissions on ", "bbox": {"l": 151.8503, "t": 350.13881999999995, "r": 202.45404, "b": 362.58102, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "the", "bbox": {"l": 35.759315, "t": 367.11893, "r": 50.758106, "b": 379.56112999999993, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "database", "bbox": {"l": 86.755211, "t": 367.11893, "r": 107.75352000000001, "b": 379.56112999999993, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Protect", "bbox": {"l": 36.059887, "t": 404.13937, "r": 73.020607, "b": 416.58157, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "columns by defining ", "bbox": {"l": 152.62831, "t": 404.13937, "r": 195.2753, "b": 416.58157, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "column", "bbox": {"l": 36.059887, "t": 421.11948, "r": 73.311806, "b": 433.56167999999997, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "masks", "bbox": {"l": 73.311806, "t": 421.11948, "r": 117.33681, "b": 433.56167999999997, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 6, "label": "page_footer", "bbox": {"l": 36.900002, "t": 751.23, "r": 164.4585, "b": 765.105, "coord_origin": "TOPLEFT"}, "confidence": 0.7180292010307312, "cells": [{"id": 0, "text": "ibm.com", "bbox": {"l": 36.900002, "t": 751.23, "r": 98.600998, "b": 765.105, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "/redbooks", "bbox": {"l": 98.580002, "t": 751.23, "r": 164.4585, "b": 765.105, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "picture", "bbox": {"l": 316.9404296875, "t": 710.1278686523438, "r": 581.354736328125, "b": 774.4259033203125, "coord_origin": "TOPLEFT"}, "confidence": 0.577752947807312, "cells": [{"id": 2, "text": "Redpaper", "bbox": {"l": 314.70001, "t": 711.50856, "r": 580.52002, "b": 773.772959, "coord_origin": "TOPLEFT"}}], "children": [{"id": 11, "label": "text", "bbox": {"l": 314.70001, "t": 711.50856, "r": 580.52002, "b": 773.772959, "coord_origin": "TOPLEFT"}, "confidence": 0.5870781540870667, "cells": [{"id": 2, "text": "Redpaper", "bbox": {"l": 314.70001, "t": 711.50856, "r": 580.52002, "b": 773.772959, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 12, "label": "text", "bbox": {"l": 287.82001, "t": 28.54803000000004, "r": 418.83356, "b": 50.748050000000035, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 3, "text": "Front cover", "bbox": {"l": 287.82001, "t": 28.54803000000004, "r": 418.83356, "b": 50.748050000000035, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "section_header", "bbox": {"l": 35.700001, "t": 84.58654999999987, "r": 584.64288, "b": 165.84113000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.8281130790710449, "cells": [{"id": 4, "text": "Row and Column Access Control ", "bbox": {"l": 35.700001, "t": 84.58654999999987, "r": 584.64288, "b": 122.82097999999996, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Support in IBM DB2 for i", "bbox": {"l": 35.700001, "t": 127.60668999999996, "r": 447.66919000000007, "b": 165.84113000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "picture", "bbox": {"l": 33.09040069580078, "t": 293.0328369140625, "r": 585.1502075195312, "b": 702.4530029296875, "coord_origin": "TOPLEFT"}, "confidence": 0.5889471173286438, "cells": [{"id": 6, "text": "Jim Bainbridge", "bbox": {"l": 509.22, "t": 575.71201, "r": 581.34119, "b": 586.392, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Hernando Bedoya", "bbox": {"l": 497.70001, "t": 589.752, "r": 581.3736, "b": 600.43199, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Rob Bestgen", "bbox": {"l": 521.40002, "t": 603.73199, "r": 581.34003, "b": 614.4119900000001, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Mike Cain", "bbox": {"l": 534.12, "t": 617.71199, "r": 581.31598, "b": 628.39198, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Dan Cruikshank", "bbox": {"l": 505.43999999999994, "t": 631.75198, "r": 581.29077, "b": 642.4319800000001, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Jim Denton", "bbox": {"l": 527.22003, "t": 645.73198, "r": 581.29926, "b": 656.41197, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Doug Mack", "bbox": {"l": 527.64001, "t": 659.71198, "r": 581.30884, "b": 670.39197, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Tom McKinley", "bbox": {"l": 514.38, "t": 673.75197, "r": 581.38678, "b": 684.43197, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Kent Milligan", "bbox": {"l": 518.82001, "t": 687.73197, "r": 581.33759, "b": 698.411972, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Implement roles and separation ", "bbox": {"l": 36.119999, "t": 296.13828, "r": 216.00064, "b": 308.58047, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "of duties", "bbox": {"l": 36.119999, "t": 313.11838000000006, "r": 84.527145, "b": 325.56058, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "Leverage", "bbox": {"l": 35.759315, "t": 350.13881999999995, "r": 80.409691, "b": 362.58102, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "row permissions on ", "bbox": {"l": 151.8503, "t": 350.13881999999995, "r": 202.45404, "b": 362.58102, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "the", "bbox": {"l": 35.759315, "t": 367.11893, "r": 50.758106, "b": 379.56112999999993, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "database", "bbox": {"l": 86.755211, "t": 367.11893, "r": 107.75352000000001, "b": 379.56112999999993, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Protect", "bbox": {"l": 36.059887, "t": 404.13937, "r": 73.020607, "b": 416.58157, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "columns by defining ", "bbox": {"l": 152.62831, "t": 404.13937, "r": 195.2753, "b": 416.58157, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "column", "bbox": {"l": 36.059887, "t": 421.11948, "r": 73.311806, "b": 433.56167999999997, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "masks", "bbox": {"l": 73.311806, "t": 421.11948, "r": 117.33681, "b": 433.56167999999997, "coord_origin": "TOPLEFT"}}], "children": [{"id": 5, "label": "text", "bbox": {"l": 497.70001, "t": 575.71201, "r": 581.38678, "b": 698.411972, "coord_origin": "TOPLEFT"}, "confidence": 0.762180745601654, "cells": [{"id": 6, "text": "Jim Bainbridge", "bbox": {"l": 509.22, "t": 575.71201, "r": 581.34119, "b": 586.392, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Hernando Bedoya", "bbox": {"l": 497.70001, "t": 589.752, "r": 581.3736, "b": 600.43199, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Rob Bestgen", "bbox": {"l": 521.40002, "t": 603.73199, "r": 581.34003, "b": 614.4119900000001, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Mike Cain", "bbox": {"l": 534.12, "t": 617.71199, "r": 581.31598, "b": 628.39198, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Dan Cruikshank", "bbox": {"l": 505.43999999999994, "t": 631.75198, "r": 581.29077, "b": 642.4319800000001, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Jim Denton", "bbox": {"l": 527.22003, "t": 645.73198, "r": 581.29926, "b": 656.41197, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Doug Mack", "bbox": {"l": 527.64001, "t": 659.71198, "r": 581.30884, "b": 670.39197, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Tom McKinley", "bbox": {"l": 514.38, "t": 673.75197, "r": 581.38678, "b": 684.43197, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Kent Milligan", "bbox": {"l": 518.82001, "t": 687.73197, "r": 581.33759, "b": 698.411972, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 36.119999, "t": 296.13828, "r": 216.00064, "b": 325.56058, "coord_origin": "TOPLEFT"}, "confidence": 0.8502885103225708, "cells": [{"id": 15, "text": "Implement roles and separation ", "bbox": {"l": 36.119999, "t": 296.13828, "r": 216.00064, "b": 308.58047, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "of duties", "bbox": {"l": 36.119999, "t": 313.11838000000006, "r": 84.527145, "b": 325.56058, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 35.759315, "t": 350.13881999999995, "r": 202.45404, "b": 379.56112999999993, "coord_origin": "TOPLEFT"}, "confidence": 0.8639556169509888, "cells": [{"id": 17, "text": "Leverage", "bbox": {"l": 35.759315, "t": 350.13881999999995, "r": 80.409691, "b": 362.58102, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "row permissions on ", "bbox": {"l": 151.8503, "t": 350.13881999999995, "r": 202.45404, "b": 362.58102, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "the", "bbox": {"l": 35.759315, "t": 367.11893, "r": 50.758106, "b": 379.56112999999993, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "database", "bbox": {"l": 86.755211, "t": 367.11893, "r": 107.75352000000001, "b": 379.56112999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 36.059887, "t": 404.13937, "r": 195.2753, "b": 433.56167999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.842113196849823, "cells": [{"id": 21, "text": "Protect", "bbox": {"l": 36.059887, "t": 404.13937, "r": 73.020607, "b": 416.58157, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "columns by defining ", "bbox": {"l": 152.62831, "t": 404.13937, "r": 195.2753, "b": 416.58157, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "column", "bbox": {"l": 36.059887, "t": 421.11948, "r": 73.311806, "b": 433.56167999999997, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "masks", "bbox": {"l": 73.311806, "t": 421.11948, "r": 117.33681, "b": 433.56167999999997, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 0, "label": "picture", "bbox": {"l": 513.4560546875, "t": 26.085098266601562, "r": 586.1583251953125, "b": 54.81915283203125, "coord_origin": "TOPLEFT"}, "confidence": 0.9272358417510986, "cells": [], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_footer", "id": 6, "page_no": 0, "cluster": {"id": 6, "label": "page_footer", "bbox": {"l": 36.900002, "t": 751.23, "r": 164.4585, "b": 765.105, "coord_origin": "TOPLEFT"}, "confidence": 0.7180292010307312, "cells": [{"id": 0, "text": "ibm.com", "bbox": {"l": 36.900002, "t": 751.23, "r": 98.600998, "b": 765.105, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "/redbooks", "bbox": {"l": 98.580002, "t": 751.23, "r": 164.4585, "b": 765.105, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "ibm.com /redbooks"}, {"label": "picture", "id": 12, "page_no": 0, "cluster": {"id": 12, "label": "picture", "bbox": {"l": 316.9404296875, "t": 710.1278686523438, "r": 581.354736328125, "b": 774.4259033203125, "coord_origin": "TOPLEFT"}, "confidence": 0.577752947807312, "cells": [{"id": 2, "text": "Redpaper", "bbox": {"l": 314.70001, "t": 711.50856, "r": 580.52002, "b": 773.772959, "coord_origin": "TOPLEFT"}}], "children": [{"id": 11, "label": "text", "bbox": {"l": 314.70001, "t": 711.50856, "r": 580.52002, "b": 773.772959, "coord_origin": "TOPLEFT"}, "confidence": 0.5870781540870667, "cells": [{"id": 2, "text": "Redpaper", "bbox": {"l": 314.70001, "t": 711.50856, "r": 580.52002, "b": 773.772959, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "text", "id": 12, "page_no": 0, "cluster": {"id": 12, "label": "text", "bbox": {"l": 287.82001, "t": 28.54803000000004, "r": 418.83356, "b": 50.748050000000035, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 3, "text": "Front cover", "bbox": {"l": 287.82001, "t": 28.54803000000004, "r": 418.83356, "b": 50.748050000000035, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Front cover"}, {"label": "section_header", "id": 4, "page_no": 0, "cluster": {"id": 4, "label": "section_header", "bbox": {"l": 35.700001, "t": 84.58654999999987, "r": 584.64288, "b": 165.84113000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.8281130790710449, "cells": [{"id": 4, "text": "Row and Column Access Control ", "bbox": {"l": 35.700001, "t": 84.58654999999987, "r": 584.64288, "b": 122.82097999999996, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Support in IBM DB2 for i", "bbox": {"l": 35.700001, "t": 127.60668999999996, "r": 447.66919000000007, "b": 165.84113000000002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Row and Column Access Control Support in IBM DB2 for i"}, {"label": "picture", "id": 10, "page_no": 0, "cluster": {"id": 10, "label": "picture", "bbox": {"l": 33.09040069580078, "t": 293.0328369140625, "r": 585.1502075195312, "b": 702.4530029296875, "coord_origin": "TOPLEFT"}, "confidence": 0.5889471173286438, "cells": [{"id": 6, "text": "Jim Bainbridge", "bbox": {"l": 509.22, "t": 575.71201, "r": 581.34119, "b": 586.392, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Hernando Bedoya", "bbox": {"l": 497.70001, "t": 589.752, "r": 581.3736, "b": 600.43199, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Rob Bestgen", "bbox": {"l": 521.40002, "t": 603.73199, "r": 581.34003, "b": 614.4119900000001, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Mike Cain", "bbox": {"l": 534.12, "t": 617.71199, "r": 581.31598, "b": 628.39198, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Dan Cruikshank", "bbox": {"l": 505.43999999999994, "t": 631.75198, "r": 581.29077, "b": 642.4319800000001, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Jim Denton", "bbox": {"l": 527.22003, "t": 645.73198, "r": 581.29926, "b": 656.41197, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Doug Mack", "bbox": {"l": 527.64001, "t": 659.71198, "r": 581.30884, "b": 670.39197, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Tom McKinley", "bbox": {"l": 514.38, "t": 673.75197, "r": 581.38678, "b": 684.43197, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Kent Milligan", "bbox": {"l": 518.82001, "t": 687.73197, "r": 581.33759, "b": 698.411972, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Implement roles and separation ", "bbox": {"l": 36.119999, "t": 296.13828, "r": 216.00064, "b": 308.58047, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "of duties", "bbox": {"l": 36.119999, "t": 313.11838000000006, "r": 84.527145, "b": 325.56058, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "Leverage", "bbox": {"l": 35.759315, "t": 350.13881999999995, "r": 80.409691, "b": 362.58102, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "row permissions on ", "bbox": {"l": 151.8503, "t": 350.13881999999995, "r": 202.45404, "b": 362.58102, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "the", "bbox": {"l": 35.759315, "t": 367.11893, "r": 50.758106, "b": 379.56112999999993, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "database", "bbox": {"l": 86.755211, "t": 367.11893, "r": 107.75352000000001, "b": 379.56112999999993, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Protect", "bbox": {"l": 36.059887, "t": 404.13937, "r": 73.020607, "b": 416.58157, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "columns by defining ", "bbox": {"l": 152.62831, "t": 404.13937, "r": 195.2753, "b": 416.58157, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "column", "bbox": {"l": 36.059887, "t": 421.11948, "r": 73.311806, "b": 433.56167999999997, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "masks", "bbox": {"l": 73.311806, "t": 421.11948, "r": 117.33681, "b": 433.56167999999997, "coord_origin": "TOPLEFT"}}], "children": [{"id": 5, "label": "text", "bbox": {"l": 497.70001, "t": 575.71201, "r": 581.38678, "b": 698.411972, "coord_origin": "TOPLEFT"}, "confidence": 0.762180745601654, "cells": [{"id": 6, "text": "Jim Bainbridge", "bbox": {"l": 509.22, "t": 575.71201, "r": 581.34119, "b": 586.392, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Hernando Bedoya", "bbox": {"l": 497.70001, "t": 589.752, "r": 581.3736, "b": 600.43199, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Rob Bestgen", "bbox": {"l": 521.40002, "t": 603.73199, "r": 581.34003, "b": 614.4119900000001, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Mike Cain", "bbox": {"l": 534.12, "t": 617.71199, "r": 581.31598, "b": 628.39198, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Dan Cruikshank", "bbox": {"l": 505.43999999999994, "t": 631.75198, "r": 581.29077, "b": 642.4319800000001, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Jim Denton", "bbox": {"l": 527.22003, "t": 645.73198, "r": 581.29926, "b": 656.41197, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Doug Mack", "bbox": {"l": 527.64001, "t": 659.71198, "r": 581.30884, "b": 670.39197, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Tom McKinley", "bbox": {"l": 514.38, "t": 673.75197, "r": 581.38678, "b": 684.43197, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Kent Milligan", "bbox": {"l": 518.82001, "t": 687.73197, "r": 581.33759, "b": 698.411972, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 36.119999, "t": 296.13828, "r": 216.00064, "b": 325.56058, "coord_origin": "TOPLEFT"}, "confidence": 0.8502885103225708, "cells": [{"id": 15, "text": "Implement roles and separation ", "bbox": {"l": 36.119999, "t": 296.13828, "r": 216.00064, "b": 308.58047, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "of duties", "bbox": {"l": 36.119999, "t": 313.11838000000006, "r": 84.527145, "b": 325.56058, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 35.759315, "t": 350.13881999999995, "r": 202.45404, "b": 379.56112999999993, "coord_origin": "TOPLEFT"}, "confidence": 0.8639556169509888, "cells": [{"id": 17, "text": "Leverage", "bbox": {"l": 35.759315, "t": 350.13881999999995, "r": 80.409691, "b": 362.58102, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "row permissions on ", "bbox": {"l": 151.8503, "t": 350.13881999999995, "r": 202.45404, "b": 362.58102, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "the", "bbox": {"l": 35.759315, "t": 367.11893, "r": 50.758106, "b": 379.56112999999993, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "database", "bbox": {"l": 86.755211, "t": 367.11893, "r": 107.75352000000001, "b": 379.56112999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 36.059887, "t": 404.13937, "r": 195.2753, "b": 433.56167999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.842113196849823, "cells": [{"id": 21, "text": "Protect", "bbox": {"l": 36.059887, "t": 404.13937, "r": 73.020607, "b": 416.58157, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "columns by defining ", "bbox": {"l": 152.62831, "t": 404.13937, "r": 195.2753, "b": 416.58157, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "column", "bbox": {"l": 36.059887, "t": 421.11948, "r": 73.311806, "b": 433.56167999999997, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "masks", "bbox": {"l": 73.311806, "t": 421.11948, "r": 117.33681, "b": 433.56167999999997, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "picture", "id": 0, "page_no": 0, "cluster": {"id": 0, "label": "picture", "bbox": {"l": 513.4560546875, "t": 26.085098266601562, "r": 586.1583251953125, "b": 54.81915283203125, "coord_origin": "TOPLEFT"}, "confidence": 0.9272358417510986, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "body": [{"label": "picture", "id": 12, "page_no": 0, "cluster": {"id": 12, "label": "picture", "bbox": {"l": 316.9404296875, "t": 710.1278686523438, "r": 581.354736328125, "b": 774.4259033203125, "coord_origin": "TOPLEFT"}, "confidence": 0.577752947807312, "cells": [{"id": 2, "text": "Redpaper", "bbox": {"l": 314.70001, "t": 711.50856, "r": 580.52002, "b": 773.772959, "coord_origin": "TOPLEFT"}}], "children": [{"id": 11, "label": "text", "bbox": {"l": 314.70001, "t": 711.50856, "r": 580.52002, "b": 773.772959, "coord_origin": "TOPLEFT"}, "confidence": 0.5870781540870667, "cells": [{"id": 2, "text": "Redpaper", "bbox": {"l": 314.70001, "t": 711.50856, "r": 580.52002, "b": 773.772959, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "text", "id": 12, "page_no": 0, "cluster": {"id": 12, "label": "text", "bbox": {"l": 287.82001, "t": 28.54803000000004, "r": 418.83356, "b": 50.748050000000035, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 3, "text": "Front cover", "bbox": {"l": 287.82001, "t": 28.54803000000004, "r": 418.83356, "b": 50.748050000000035, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Front cover"}, {"label": "section_header", "id": 4, "page_no": 0, "cluster": {"id": 4, "label": "section_header", "bbox": {"l": 35.700001, "t": 84.58654999999987, "r": 584.64288, "b": 165.84113000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.8281130790710449, "cells": [{"id": 4, "text": "Row and Column Access Control ", "bbox": {"l": 35.700001, "t": 84.58654999999987, "r": 584.64288, "b": 122.82097999999996, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Support in IBM DB2 for i", "bbox": {"l": 35.700001, "t": 127.60668999999996, "r": 447.66919000000007, "b": 165.84113000000002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Row and Column Access Control Support in IBM DB2 for i"}, {"label": "picture", "id": 10, "page_no": 0, "cluster": {"id": 10, "label": "picture", "bbox": {"l": 33.09040069580078, "t": 293.0328369140625, "r": 585.1502075195312, "b": 702.4530029296875, "coord_origin": "TOPLEFT"}, "confidence": 0.5889471173286438, "cells": [{"id": 6, "text": "Jim Bainbridge", "bbox": {"l": 509.22, "t": 575.71201, "r": 581.34119, "b": 586.392, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Hernando Bedoya", "bbox": {"l": 497.70001, "t": 589.752, "r": 581.3736, "b": 600.43199, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Rob Bestgen", "bbox": {"l": 521.40002, "t": 603.73199, "r": 581.34003, "b": 614.4119900000001, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Mike Cain", "bbox": {"l": 534.12, "t": 617.71199, "r": 581.31598, "b": 628.39198, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Dan Cruikshank", "bbox": {"l": 505.43999999999994, "t": 631.75198, "r": 581.29077, "b": 642.4319800000001, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Jim Denton", "bbox": {"l": 527.22003, "t": 645.73198, "r": 581.29926, "b": 656.41197, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Doug Mack", "bbox": {"l": 527.64001, "t": 659.71198, "r": 581.30884, "b": 670.39197, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Tom McKinley", "bbox": {"l": 514.38, "t": 673.75197, "r": 581.38678, "b": 684.43197, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Kent Milligan", "bbox": {"l": 518.82001, "t": 687.73197, "r": 581.33759, "b": 698.411972, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Implement roles and separation ", "bbox": {"l": 36.119999, "t": 296.13828, "r": 216.00064, "b": 308.58047, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "of duties", "bbox": {"l": 36.119999, "t": 313.11838000000006, "r": 84.527145, "b": 325.56058, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "Leverage", "bbox": {"l": 35.759315, "t": 350.13881999999995, "r": 80.409691, "b": 362.58102, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "row permissions on ", "bbox": {"l": 151.8503, "t": 350.13881999999995, "r": 202.45404, "b": 362.58102, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "the", "bbox": {"l": 35.759315, "t": 367.11893, "r": 50.758106, "b": 379.56112999999993, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "database", "bbox": {"l": 86.755211, "t": 367.11893, "r": 107.75352000000001, "b": 379.56112999999993, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Protect", "bbox": {"l": 36.059887, "t": 404.13937, "r": 73.020607, "b": 416.58157, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "columns by defining ", "bbox": {"l": 152.62831, "t": 404.13937, "r": 195.2753, "b": 416.58157, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "column", "bbox": {"l": 36.059887, "t": 421.11948, "r": 73.311806, "b": 433.56167999999997, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "masks", "bbox": {"l": 73.311806, "t": 421.11948, "r": 117.33681, "b": 433.56167999999997, "coord_origin": "TOPLEFT"}}], "children": [{"id": 5, "label": "text", "bbox": {"l": 497.70001, "t": 575.71201, "r": 581.38678, "b": 698.411972, "coord_origin": "TOPLEFT"}, "confidence": 0.762180745601654, "cells": [{"id": 6, "text": "Jim Bainbridge", "bbox": {"l": 509.22, "t": 575.71201, "r": 581.34119, "b": 586.392, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Hernando Bedoya", "bbox": {"l": 497.70001, "t": 589.752, "r": 581.3736, "b": 600.43199, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Rob Bestgen", "bbox": {"l": 521.40002, "t": 603.73199, "r": 581.34003, "b": 614.4119900000001, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Mike Cain", "bbox": {"l": 534.12, "t": 617.71199, "r": 581.31598, "b": 628.39198, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Dan Cruikshank", "bbox": {"l": 505.43999999999994, "t": 631.75198, "r": 581.29077, "b": 642.4319800000001, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Jim Denton", "bbox": {"l": 527.22003, "t": 645.73198, "r": 581.29926, "b": 656.41197, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Doug Mack", "bbox": {"l": 527.64001, "t": 659.71198, "r": 581.30884, "b": 670.39197, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Tom McKinley", "bbox": {"l": 514.38, "t": 673.75197, "r": 581.38678, "b": 684.43197, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Kent Milligan", "bbox": {"l": 518.82001, "t": 687.73197, "r": 581.33759, "b": 698.411972, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 36.119999, "t": 296.13828, "r": 216.00064, "b": 325.56058, "coord_origin": "TOPLEFT"}, "confidence": 0.8502885103225708, "cells": [{"id": 15, "text": "Implement roles and separation ", "bbox": {"l": 36.119999, "t": 296.13828, "r": 216.00064, "b": 308.58047, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "of duties", "bbox": {"l": 36.119999, "t": 313.11838000000006, "r": 84.527145, "b": 325.56058, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 35.759315, "t": 350.13881999999995, "r": 202.45404, "b": 379.56112999999993, "coord_origin": "TOPLEFT"}, "confidence": 0.8639556169509888, "cells": [{"id": 17, "text": "Leverage", "bbox": {"l": 35.759315, "t": 350.13881999999995, "r": 80.409691, "b": 362.58102, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "row permissions on ", "bbox": {"l": 151.8503, "t": 350.13881999999995, "r": 202.45404, "b": 362.58102, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "the", "bbox": {"l": 35.759315, "t": 367.11893, "r": 50.758106, "b": 379.56112999999993, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "database", "bbox": {"l": 86.755211, "t": 367.11893, "r": 107.75352000000001, "b": 379.56112999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 36.059887, "t": 404.13937, "r": 195.2753, "b": 433.56167999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.842113196849823, "cells": [{"id": 21, "text": "Protect", "bbox": {"l": 36.059887, "t": 404.13937, "r": 73.020607, "b": 416.58157, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "columns by defining ", "bbox": {"l": 152.62831, "t": 404.13937, "r": 195.2753, "b": 416.58157, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "column", "bbox": {"l": 36.059887, "t": 421.11948, "r": 73.311806, "b": 433.56167999999997, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "masks", "bbox": {"l": 73.311806, "t": 421.11948, "r": 117.33681, "b": 433.56167999999997, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "picture", "id": 0, "page_no": 0, "cluster": {"id": 0, "label": "picture", "bbox": {"l": 513.4560546875, "t": 26.085098266601562, "r": 586.1583251953125, "b": 54.81915283203125, "coord_origin": "TOPLEFT"}, "confidence": 0.9272358417510986, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "headers": [{"label": "page_footer", "id": 6, "page_no": 0, "cluster": {"id": 6, "label": "page_footer", "bbox": {"l": 36.900002, "t": 751.23, "r": 164.4585, "b": 765.105, "coord_origin": "TOPLEFT"}, "confidence": 0.7180292010307312, "cells": [{"id": 0, "text": "ibm.com", "bbox": {"l": 36.900002, "t": 751.23, "r": 98.600998, "b": 765.105, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "/redbooks", "bbox": {"l": 98.580002, "t": 751.23, "r": 164.4585, "b": 765.105, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "ibm.com /redbooks"}]}}, {"page_no": 1, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "' Copyright IBM Corp. 2014. All rights reserved.", "bbox": {"l": 64.800003, "t": 755.538002, "r": 257.24335, "b": 763.863001, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "iii", "bbox": {"l": 538.85999, "t": 754.848721, "r": 547.25928, "b": 764.06172, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Contents", "bbox": {"l": 64.800003, "t": 73.84802000000002, "r": 168.73441, "b": 96.04803000000004, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Notices", "bbox": {"l": 136.8, "t": 132.64862000000005, "r": 172.89404, "b": 141.86163, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vii", "bbox": {"l": 175.01952, "t": 132.64862000000005, "r": 547.18982, "b": 141.86163, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Trademarks", "bbox": {"l": 136.79901, "t": 145.12847999999997, "r": 189.86537, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 195.39685, "t": 145.12847999999997, "r": 530.05121, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "viii", "bbox": {"l": 535.5827, "t": 145.12847999999997, "r": 547.18286, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "DB2 for i Center of Excellence", "bbox": {"l": 136.79901, "t": 167.62811, "r": 279.39731, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ix", "bbox": {"l": 280.61942, "t": 167.62811, "r": 547.1908, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Preface", "bbox": {"l": 136.79901, "t": 190.12775, "r": 172.84424, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi", "bbox": {"l": 175.01852, "t": 190.12775, "r": 547.18286, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Authors . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi", "bbox": {"l": 136.79803, "t": 202.60760000000005, "r": 547.18085, "b": 211.82061999999996, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Now you can become a published author, too!", "bbox": {"l": 136.79803, "t": 215.14721999999995, "r": 339.18292, "b": 224.36023, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 344.71411, "t": 215.14721999999995, "r": 530.00812, "b": 224.36023, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "xiii", "bbox": {"l": 535.53925, "t": 215.14721999999995, "r": 547.13879, "b": 224.36023, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Comments welcome. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 136.79803, "t": 227.62707999999998, "r": 529.99506, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "xiii", "bbox": {"l": 535.5495, "t": 227.62707999999998, "r": 547.19788, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Stay connected to IBM Redbooks", "bbox": {"l": 136.79807, "t": 240.10693000000003, "r": 284.02866, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 289.54449, "t": 240.10693000000003, "r": 529.48242, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "xiv", "bbox": {"l": 534.99829, "t": 240.10693000000003, "r": 547.12115, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Chapter 1. Securing and protecting IBM DB2 data", "bbox": {"l": 136.79807, "t": 262.60657000000003, "r": 373.17566, "b": 271.81958, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 375.11798, "t": 262.60657000000003, "r": 536.09589, "b": 271.81958, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "1", "bbox": {"l": 541.64685, "t": 262.60657000000003, "r": 547.19781, "b": 271.81958, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "1.1", "bbox": {"l": 136.79808, "t": 274.60637999999994, "r": 150.88702, "b": 283.8194, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "Security fundamentals. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2", "bbox": {"l": 156.5226, "t": 274.60637999999994, "r": 549.84723, "b": 283.8194, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "1.2", "bbox": {"l": 136.79807, "t": 287.14606000000003, "r": 150.62746, "b": 296.35904, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Current state of IBM i security . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.15923, "t": 287.14606000000003, "r": 536.12933, "b": 296.35904, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "2", "bbox": {"l": 541.66113, "t": 287.14606000000003, "r": 547.19287, "b": 296.35904, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "1.3", "bbox": {"l": 136.79807, "t": 299.62595, "r": 150.84943, "b": 308.83893, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "DB2 for i security controls . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3", "bbox": {"l": 156.46996, "t": 299.62595, "r": 549.84723, "b": 308.83893, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "1.3.1", "bbox": {"l": 151.1972, "t": 312.1058300000001, "r": 173.38289, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Existing row and column control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.92932, "t": 312.1058300000001, "r": 536.05511, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "4", "bbox": {"l": 541.6015, "t": 312.1058300000001, "r": 547.14795, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "1.3.2", "bbox": {"l": 151.1972, "t": 324.64548, "r": 173.4189, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "New controls: Row and Column Access Control. . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.97432, "t": 324.64548, "r": 536.08008, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "5", "bbox": {"l": 541.6355, "t": 324.64548, "r": 547.19092, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "Chapter 2. Roles and separation of duties", "bbox": {"l": 136.79704, "t": 347.14511, "r": 336.82071, "b": 356.35809, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 338.99701, "t": 347.14511, "r": 536.09088, "b": 356.35809, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "7", "bbox": {"l": 541.64282, "t": 347.14511, "r": 547.19476, "b": 356.35809, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "2.1", "bbox": {"l": 136.79704, "t": 359.14493, "r": 150.644, "b": 368.35791, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Roles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.18277, "t": 359.14493, "r": 536.12714, "b": 368.35791, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "8", "bbox": {"l": 541.66589, "t": 359.14493, "r": 547.20471, "b": 368.35791, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "2.1.1", "bbox": {"l": 151.1972, "t": 371.62482, "r": 173.60995, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "DDM and DRDA application server access: QIBM_DB_DDMDRDA . . . . . . . . . . .", "bbox": {"l": 176.41154, "t": 371.62482, "r": 535.9527, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "8", "bbox": {"l": 541.55585, "t": 371.62482, "r": 547.15906, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "2.1.2", "bbox": {"l": 151.1972, "t": 384.10470999999995, "r": 173.41664, "b": 393.31769, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "Toolbox application server access: QIBM_DB_ZDA. . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.97151, "t": 384.10470999999995, "r": 536.04108, "b": 393.31769, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "8", "bbox": {"l": 541.59595, "t": 384.10470999999995, "r": 547.15082, "b": 393.31769, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "2.1.3", "bbox": {"l": 151.1972, "t": 396.64435, "r": 173.41859, "b": 405.85733, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Database Administrator function: QIBM_DB_SQLADM . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.97394, "t": 396.64435, "r": 536.07489, "b": 405.85733, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "9", "bbox": {"l": 541.63025, "t": 396.64435, "r": 547.18561, "b": 405.85733, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "2.1.4", "bbox": {"l": 151.1972, "t": 409.12424000000004, "r": 173.38629, "b": 418.33722, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Database Information function: QIBM_DB_SYSMON", "bbox": {"l": 178.93356, "t": 409.12424000000004, "r": 411.27048, "b": 418.33722, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": ". . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 416.81775, "t": 409.12424000000004, "r": 536.08411, "b": 418.33722, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "9", "bbox": {"l": 541.63135, "t": 409.12424000000004, "r": 547.17865, "b": 418.33722, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "2.1.5", "bbox": {"l": 151.1972, "t": 421.60413, "r": 173.44926, "b": 430.81711, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Security Administrator function: QIBM_DB_SECADM . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 179.01228, "t": 421.60413, "r": 536.03589, "b": 430.81711, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "9", "bbox": {"l": 541.59894, "t": 421.60413, "r": 547.16193, "b": 430.81711, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "2.1.6", "bbox": {"l": 151.1972, "t": 434.1437700000001, "r": 173.32208, "b": 443.35675, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Change Function Usage CL command . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.8533, "t": 434.1437700000001, "r": 530.57318, "b": 443.35675, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "10", "bbox": {"l": 536.10443, "t": 434.1437700000001, "r": 547.16687, "b": 443.35675, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "2.1.7", "bbox": {"l": 151.1972, "t": 446.62366, "r": 173.35822, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "Verifying function usage IDs for RCAC with the FUNCTION_USAGE view . . . . .", "bbox": {"l": 178.89848, "t": 446.62366, "r": 530.53522, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "10", "bbox": {"l": 536.0755, "t": 446.62366, "r": 547.15601, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "2.2", "bbox": {"l": 136.79704, "t": 459.10355, "r": 150.85457, "b": 468.31653, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "Separation of duties . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10", "bbox": {"l": 156.47758, "t": 459.10355, "r": 547.25659, "b": 468.31653, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "Chapter 3. Row and Column Access Control", "bbox": {"l": 136.79703, "t": 481.60318, "r": 348.68503, "b": 490.81616, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 350.09741, "t": 481.60318, "r": 530.53961, "b": 490.81616, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "13", "bbox": {"l": 536.09167, "t": 481.60318, "r": 547.1958, "b": 490.81616, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "3.1", "bbox": {"l": 136.79703, "t": 493.603, "r": 150.70105, "b": 502.81598, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Explanation of RCAC and the concept of access control . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.26266, "t": 493.603, "r": 530.4809, "b": 502.81598, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "14", "bbox": {"l": 536.04248, "t": 493.603, "r": 547.16571, "b": 502.81598, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "3.1.1", "bbox": {"l": 151.19719, "t": 506.14264, "r": 173.35429, "b": 515.35562, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "Row permission and column mask definitions", "bbox": {"l": 178.89357, "t": 506.14264, "r": 378.20786, "b": 515.35562, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 383.74713, "t": 506.14264, "r": 530.5379, "b": 515.35562, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "14", "bbox": {"l": 536.07721, "t": 506.14264, "r": 547.15576, "b": 515.35562, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "3.1.2", "bbox": {"l": 151.19719, "t": 518.62253, "r": 173.44292, "b": 527.83551, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "Enabling and activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 179.00435, "t": 518.62253, "r": 530.43475, "b": 527.83551, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "16", "bbox": {"l": 535.99622, "t": 518.62253, "r": 547.11908, "b": 527.83551, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "3.2", "bbox": {"l": 136.79703, "t": 531.1621700000001, "r": 150.64432, "b": 540.37517, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Special registers and built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.18323, "t": 531.1621700000001, "r": 530.52808, "b": 540.37517, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "18", "bbox": {"l": 536.06702, "t": 531.1621700000001, "r": 547.14484, "b": 540.37517, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "3.2.1", "bbox": {"l": 151.19719, "t": 543.64204, "r": 173.41321, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "Special registers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.96722, "t": 543.64204, "r": 530.49786, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "18", "bbox": {"l": 536.05188, "t": 543.64204, "r": 547.15991, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "3.2.2", "bbox": {"l": 151.19719, "t": 556.12192, "r": 173.35269, "b": 565.33492, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.89156, "t": 556.12192, "r": 530.56024, "b": 565.33492, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "19", "bbox": {"l": 536.09912, "t": 556.12192, "r": 547.17688, "b": 565.33492, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "3.3", "bbox": {"l": 136.79703, "t": 568.66156, "r": 150.62514, "b": 577.87456, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "VERIFY_GROUP_FOR_USER function . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.15639, "t": 568.66156, "r": 530.53027, "b": 577.87456, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "20", "bbox": {"l": 536.06152, "t": 568.66156, "r": 547.12402, "b": 577.87456, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "3.4", "bbox": {"l": 136.79703, "t": 581.14143, "r": 150.63004, "b": 590.35443, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "Establishing and controlling accessibility by using the RCAC rule text . . . . . . . . . . . . .", "bbox": {"l": 156.16325, "t": 581.14143, "r": 530.62994, "b": 590.35443, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "21", "bbox": {"l": 536.16315, "t": 581.14143, "r": 547.22955, "b": 590.35443, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "3.5", "bbox": {"l": 136.79701, "t": 593.62131, "r": 150.64413, "b": 602.8343, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "SELECT, INSERT, and UPDATE behavior with RCAC", "bbox": {"l": 156.18298, "t": 593.62131, "r": 394.7818, "b": 602.8343, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": ". . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 400.32065, "t": 593.62131, "r": 530.48358, "b": 602.8343, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "22", "bbox": {"l": 536.0224, "t": 593.62131, "r": 547.1001, "b": 602.8343, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "3.6", "bbox": {"l": 136.79701, "t": 606.16095, "r": 150.6642, "b": 615.37395, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "Human resources example . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.21107, "t": 606.16095, "r": 530.56512, "b": 615.37395, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "22", "bbox": {"l": 536.112, "t": 606.16095, "r": 547.20575, "b": 615.37395, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "3.6.1", "bbox": {"l": 151.19717, "t": 618.64082, "r": 173.41692, "b": 627.85382, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "Assigning the QIBM_DB_SECADM function ID to the consultants. . . . . . . . . . . .", "bbox": {"l": 178.97185, "t": 618.64082, "r": 530.49139, "b": 627.85382, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "23", "bbox": {"l": 536.04633, "t": 618.64082, "r": 547.15619, "b": 627.85382, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "3.6.2", "bbox": {"l": 151.19717, "t": 631.1206999999999, "r": 173.32271, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "Creating group profiles for the users and their roles . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.8541, "t": 631.1206999999999, "r": 530.56458, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "23", "bbox": {"l": 536.09601, "t": 631.1206999999999, "r": 547.15875, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "3.6.3", "bbox": {"l": 151.19717, "t": 643.66034, "r": 173.32227, "b": 652.87334, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "Demonstrating data access without RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.85353, "t": 643.66034, "r": 530.55695, "b": 652.87334, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "24", "bbox": {"l": 536.0882, "t": 643.66034, "r": 547.15076, "b": 652.87334, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "3.6.4", "bbox": {"l": 151.19717, "t": 656.14021, "r": 173.35289, "b": 665.35321, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "Defining and creating row permissions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.89182, "t": 656.14021, "r": 530.53412, "b": 665.35321, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "25", "bbox": {"l": 536.073, "t": 656.14021, "r": 547.15088, "b": 665.35321, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "3.6.5", "bbox": {"l": 151.19717, "t": 668.62009, "r": 173.35289, "b": 677.83309, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "Defining and creating column masks", "bbox": {"l": 178.89182, "t": 668.62009, "r": 339.45105, "b": 677.83309, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 344.98996, "t": 668.62009, "r": 530.54413, "b": 677.83309, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "26", "bbox": {"l": 536.08301, "t": 668.62009, "r": 547.16089, "b": 677.83309, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "3.6.6", "bbox": {"l": 151.19717, "t": 681.15973, "r": 173.38359, "b": 690.37273, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "Activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.93019, "t": 681.15973, "r": 530.54102, "b": 690.37273, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "28", "bbox": {"l": 536.08765, "t": 681.15973, "r": 547.18085, "b": 690.37273, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "3.6.7", "bbox": {"l": 151.19717, "t": 693.63961, "r": 173.32332, "b": 702.852615, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Demonstrating data access with RCAC", "bbox": {"l": 178.85486, "t": 693.63961, "r": 350.80011, "b": 702.852615, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 356.33163, "t": 693.63961, "r": 530.57507, "b": 702.852615, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "29", "bbox": {"l": 536.10663, "t": 693.63961, "r": 547.16968, "b": 702.852615, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "3.6.8", "bbox": {"l": 151.19717, "t": 706.119492, "r": 173.44592, "b": 715.332497, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "Demonstrating data access with a view and RCAC . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 179.00812, "t": 706.119492, "r": 530.43628, "b": 715.332497, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "32", "bbox": {"l": 535.99847, "t": 706.119492, "r": 547.12286, "b": 715.332497, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 2, "label": "page_footer", "bbox": {"l": 64.800003, "t": 755.538002, "r": 257.24335, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9473597407341003, "cells": [{"id": 0, "text": "' Copyright IBM Corp. 2014. All rights reserved.", "bbox": {"l": 64.800003, "t": 755.538002, "r": 257.24335, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "page_footer", "bbox": {"l": 538.85999, "t": 754.848721, "r": 547.25928, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.8926277160644531, "cells": [{"id": 1, "text": "iii", "bbox": {"l": 538.85999, "t": 754.848721, "r": 547.25928, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "section_header", "bbox": {"l": 64.800003, "t": 73.84802000000002, "r": 168.73441, "b": 96.04803000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9509142637252808, "cells": [{"id": 2, "text": "Contents", "bbox": {"l": 64.800003, "t": 73.84802000000002, "r": 168.73441, "b": 96.04803000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "document_index", "bbox": {"l": 136.1496124267578, "t": 132.0330352783203, "r": 547.5267944335938, "b": 715.6515502929688, "coord_origin": "TOPLEFT"}, "confidence": 0.9803681373596191, "cells": [{"id": 3, "text": "Notices", "bbox": {"l": 136.8, "t": 132.64862000000005, "r": 172.89404, "b": 141.86163, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vii", "bbox": {"l": 175.01952, "t": 132.64862000000005, "r": 547.18982, "b": 141.86163, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Trademarks", "bbox": {"l": 136.79901, "t": 145.12847999999997, "r": 189.86537, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 195.39685, "t": 145.12847999999997, "r": 530.05121, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "viii", "bbox": {"l": 535.5827, "t": 145.12847999999997, "r": 547.18286, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "DB2 for i Center of Excellence", "bbox": {"l": 136.79901, "t": 167.62811, "r": 279.39731, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ix", "bbox": {"l": 280.61942, "t": 167.62811, "r": 547.1908, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Preface", "bbox": {"l": 136.79901, "t": 190.12775, "r": 172.84424, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi", "bbox": {"l": 175.01852, "t": 190.12775, "r": 547.18286, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Authors . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi", "bbox": {"l": 136.79803, "t": 202.60760000000005, "r": 547.18085, "b": 211.82061999999996, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Now you can become a published author, too!", "bbox": {"l": 136.79803, "t": 215.14721999999995, "r": 339.18292, "b": 224.36023, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 344.71411, "t": 215.14721999999995, "r": 530.00812, "b": 224.36023, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "xiii", "bbox": {"l": 535.53925, "t": 215.14721999999995, "r": 547.13879, "b": 224.36023, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Comments welcome. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 136.79803, "t": 227.62707999999998, "r": 529.99506, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "xiii", "bbox": {"l": 535.5495, "t": 227.62707999999998, "r": 547.19788, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Stay connected to IBM Redbooks", "bbox": {"l": 136.79807, "t": 240.10693000000003, "r": 284.02866, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 289.54449, "t": 240.10693000000003, "r": 529.48242, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "xiv", "bbox": {"l": 534.99829, "t": 240.10693000000003, "r": 547.12115, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Chapter 1. Securing and protecting IBM DB2 data", "bbox": {"l": 136.79807, "t": 262.60657000000003, "r": 373.17566, "b": 271.81958, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 375.11798, "t": 262.60657000000003, "r": 536.09589, "b": 271.81958, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "1", "bbox": {"l": 541.64685, "t": 262.60657000000003, "r": 547.19781, "b": 271.81958, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "1.1", "bbox": {"l": 136.79808, "t": 274.60637999999994, "r": 150.88702, "b": 283.8194, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "Security fundamentals. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2", "bbox": {"l": 156.5226, "t": 274.60637999999994, "r": 549.84723, "b": 283.8194, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "1.2", "bbox": {"l": 136.79807, "t": 287.14606000000003, "r": 150.62746, "b": 296.35904, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Current state of IBM i security . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.15923, "t": 287.14606000000003, "r": 536.12933, "b": 296.35904, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "2", "bbox": {"l": 541.66113, "t": 287.14606000000003, "r": 547.19287, "b": 296.35904, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "1.3", "bbox": {"l": 136.79807, "t": 299.62595, "r": 150.84943, "b": 308.83893, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "DB2 for i security controls . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3", "bbox": {"l": 156.46996, "t": 299.62595, "r": 549.84723, "b": 308.83893, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "1.3.1", "bbox": {"l": 151.1972, "t": 312.1058300000001, "r": 173.38289, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Existing row and column control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.92932, "t": 312.1058300000001, "r": 536.05511, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "4", "bbox": {"l": 541.6015, "t": 312.1058300000001, "r": 547.14795, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "1.3.2", "bbox": {"l": 151.1972, "t": 324.64548, "r": 173.4189, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "New controls: Row and Column Access Control. . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.97432, "t": 324.64548, "r": 536.08008, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "5", "bbox": {"l": 541.6355, "t": 324.64548, "r": 547.19092, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "Chapter 2. Roles and separation of duties", "bbox": {"l": 136.79704, "t": 347.14511, "r": 336.82071, "b": 356.35809, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 338.99701, "t": 347.14511, "r": 536.09088, "b": 356.35809, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "7", "bbox": {"l": 541.64282, "t": 347.14511, "r": 547.19476, "b": 356.35809, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "2.1", "bbox": {"l": 136.79704, "t": 359.14493, "r": 150.644, "b": 368.35791, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Roles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.18277, "t": 359.14493, "r": 536.12714, "b": 368.35791, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "8", "bbox": {"l": 541.66589, "t": 359.14493, "r": 547.20471, "b": 368.35791, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "2.1.1", "bbox": {"l": 151.1972, "t": 371.62482, "r": 173.60995, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "DDM and DRDA application server access: QIBM_DB_DDMDRDA . . . . . . . . . . .", "bbox": {"l": 176.41154, "t": 371.62482, "r": 535.9527, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "8", "bbox": {"l": 541.55585, "t": 371.62482, "r": 547.15906, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "2.1.2", "bbox": {"l": 151.1972, "t": 384.10470999999995, "r": 173.41664, "b": 393.31769, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "Toolbox application server access: QIBM_DB_ZDA. . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.97151, "t": 384.10470999999995, "r": 536.04108, "b": 393.31769, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "8", "bbox": {"l": 541.59595, "t": 384.10470999999995, "r": 547.15082, "b": 393.31769, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "2.1.3", "bbox": {"l": 151.1972, "t": 396.64435, "r": 173.41859, "b": 405.85733, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Database Administrator function: QIBM_DB_SQLADM . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.97394, "t": 396.64435, "r": 536.07489, "b": 405.85733, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "9", "bbox": {"l": 541.63025, "t": 396.64435, "r": 547.18561, "b": 405.85733, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "2.1.4", "bbox": {"l": 151.1972, "t": 409.12424000000004, "r": 173.38629, "b": 418.33722, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Database Information function: QIBM_DB_SYSMON", "bbox": {"l": 178.93356, "t": 409.12424000000004, "r": 411.27048, "b": 418.33722, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": ". . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 416.81775, "t": 409.12424000000004, "r": 536.08411, "b": 418.33722, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "9", "bbox": {"l": 541.63135, "t": 409.12424000000004, "r": 547.17865, "b": 418.33722, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "2.1.5", "bbox": {"l": 151.1972, "t": 421.60413, "r": 173.44926, "b": 430.81711, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Security Administrator function: QIBM_DB_SECADM . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 179.01228, "t": 421.60413, "r": 536.03589, "b": 430.81711, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "9", "bbox": {"l": 541.59894, "t": 421.60413, "r": 547.16193, "b": 430.81711, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "2.1.6", "bbox": {"l": 151.1972, "t": 434.1437700000001, "r": 173.32208, "b": 443.35675, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Change Function Usage CL command . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.8533, "t": 434.1437700000001, "r": 530.57318, "b": 443.35675, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "10", "bbox": {"l": 536.10443, "t": 434.1437700000001, "r": 547.16687, "b": 443.35675, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "2.1.7", "bbox": {"l": 151.1972, "t": 446.62366, "r": 173.35822, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "Verifying function usage IDs for RCAC with the FUNCTION_USAGE view . . . . .", "bbox": {"l": 178.89848, "t": 446.62366, "r": 530.53522, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "10", "bbox": {"l": 536.0755, "t": 446.62366, "r": 547.15601, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "2.2", "bbox": {"l": 136.79704, "t": 459.10355, "r": 150.85457, "b": 468.31653, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "Separation of duties . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10", "bbox": {"l": 156.47758, "t": 459.10355, "r": 547.25659, "b": 468.31653, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "Chapter 3. Row and Column Access Control", "bbox": {"l": 136.79703, "t": 481.60318, "r": 348.68503, "b": 490.81616, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 350.09741, "t": 481.60318, "r": 530.53961, "b": 490.81616, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "13", "bbox": {"l": 536.09167, "t": 481.60318, "r": 547.1958, "b": 490.81616, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "3.1", "bbox": {"l": 136.79703, "t": 493.603, "r": 150.70105, "b": 502.81598, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Explanation of RCAC and the concept of access control . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.26266, "t": 493.603, "r": 530.4809, "b": 502.81598, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "14", "bbox": {"l": 536.04248, "t": 493.603, "r": 547.16571, "b": 502.81598, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "3.1.1", "bbox": {"l": 151.19719, "t": 506.14264, "r": 173.35429, "b": 515.35562, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "Row permission and column mask definitions", "bbox": {"l": 178.89357, "t": 506.14264, "r": 378.20786, "b": 515.35562, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 383.74713, "t": 506.14264, "r": 530.5379, "b": 515.35562, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "14", "bbox": {"l": 536.07721, "t": 506.14264, "r": 547.15576, "b": 515.35562, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "3.1.2", "bbox": {"l": 151.19719, "t": 518.62253, "r": 173.44292, "b": 527.83551, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "Enabling and activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 179.00435, "t": 518.62253, "r": 530.43475, "b": 527.83551, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "16", "bbox": {"l": 535.99622, "t": 518.62253, "r": 547.11908, "b": 527.83551, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "3.2", "bbox": {"l": 136.79703, "t": 531.1621700000001, "r": 150.64432, "b": 540.37517, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Special registers and built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.18323, "t": 531.1621700000001, "r": 530.52808, "b": 540.37517, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "18", "bbox": {"l": 536.06702, "t": 531.1621700000001, "r": 547.14484, "b": 540.37517, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "3.2.1", "bbox": {"l": 151.19719, "t": 543.64204, "r": 173.41321, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "Special registers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.96722, "t": 543.64204, "r": 530.49786, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "18", "bbox": {"l": 536.05188, "t": 543.64204, "r": 547.15991, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "3.2.2", "bbox": {"l": 151.19719, "t": 556.12192, "r": 173.35269, "b": 565.33492, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.89156, "t": 556.12192, "r": 530.56024, "b": 565.33492, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "19", "bbox": {"l": 536.09912, "t": 556.12192, "r": 547.17688, "b": 565.33492, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "3.3", "bbox": {"l": 136.79703, "t": 568.66156, "r": 150.62514, "b": 577.87456, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "VERIFY_GROUP_FOR_USER function . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.15639, "t": 568.66156, "r": 530.53027, "b": 577.87456, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "20", "bbox": {"l": 536.06152, "t": 568.66156, "r": 547.12402, "b": 577.87456, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "3.4", "bbox": {"l": 136.79703, "t": 581.14143, "r": 150.63004, "b": 590.35443, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "Establishing and controlling accessibility by using the RCAC rule text . . . . . . . . . . . . .", "bbox": {"l": 156.16325, "t": 581.14143, "r": 530.62994, "b": 590.35443, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "21", "bbox": {"l": 536.16315, "t": 581.14143, "r": 547.22955, "b": 590.35443, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "3.5", "bbox": {"l": 136.79701, "t": 593.62131, "r": 150.64413, "b": 602.8343, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "SELECT, INSERT, and UPDATE behavior with RCAC", "bbox": {"l": 156.18298, "t": 593.62131, "r": 394.7818, "b": 602.8343, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": ". . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 400.32065, "t": 593.62131, "r": 530.48358, "b": 602.8343, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "22", "bbox": {"l": 536.0224, "t": 593.62131, "r": 547.1001, "b": 602.8343, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "3.6", "bbox": {"l": 136.79701, "t": 606.16095, "r": 150.6642, "b": 615.37395, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "Human resources example . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.21107, "t": 606.16095, "r": 530.56512, "b": 615.37395, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "22", "bbox": {"l": 536.112, "t": 606.16095, "r": 547.20575, "b": 615.37395, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "3.6.1", "bbox": {"l": 151.19717, "t": 618.64082, "r": 173.41692, "b": 627.85382, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "Assigning the QIBM_DB_SECADM function ID to the consultants. . . . . . . . . . . .", "bbox": {"l": 178.97185, "t": 618.64082, "r": 530.49139, "b": 627.85382, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "23", "bbox": {"l": 536.04633, "t": 618.64082, "r": 547.15619, "b": 627.85382, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "3.6.2", "bbox": {"l": 151.19717, "t": 631.1206999999999, "r": 173.32271, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "Creating group profiles for the users and their roles . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.8541, "t": 631.1206999999999, "r": 530.56458, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "23", "bbox": {"l": 536.09601, "t": 631.1206999999999, "r": 547.15875, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "3.6.3", "bbox": {"l": 151.19717, "t": 643.66034, "r": 173.32227, "b": 652.87334, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "Demonstrating data access without RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.85353, "t": 643.66034, "r": 530.55695, "b": 652.87334, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "24", "bbox": {"l": 536.0882, "t": 643.66034, "r": 547.15076, "b": 652.87334, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "3.6.4", "bbox": {"l": 151.19717, "t": 656.14021, "r": 173.35289, "b": 665.35321, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "Defining and creating row permissions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.89182, "t": 656.14021, "r": 530.53412, "b": 665.35321, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "25", "bbox": {"l": 536.073, "t": 656.14021, "r": 547.15088, "b": 665.35321, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "3.6.5", "bbox": {"l": 151.19717, "t": 668.62009, "r": 173.35289, "b": 677.83309, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "Defining and creating column masks", "bbox": {"l": 178.89182, "t": 668.62009, "r": 339.45105, "b": 677.83309, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 344.98996, "t": 668.62009, "r": 530.54413, "b": 677.83309, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "26", "bbox": {"l": 536.08301, "t": 668.62009, "r": 547.16089, "b": 677.83309, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "3.6.6", "bbox": {"l": 151.19717, "t": 681.15973, "r": 173.38359, "b": 690.37273, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "Activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.93019, "t": 681.15973, "r": 530.54102, "b": 690.37273, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "28", "bbox": {"l": 536.08765, "t": 681.15973, "r": 547.18085, "b": 690.37273, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "3.6.7", "bbox": {"l": 151.19717, "t": 693.63961, "r": 173.32332, "b": 702.852615, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Demonstrating data access with RCAC", "bbox": {"l": 178.85486, "t": 693.63961, "r": 350.80011, "b": 702.852615, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 356.33163, "t": 693.63961, "r": 530.57507, "b": 702.852615, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "29", "bbox": {"l": 536.10663, "t": 693.63961, "r": 547.16968, "b": 702.852615, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "3.6.8", "bbox": {"l": 151.19717, "t": 706.119492, "r": 173.44592, "b": 715.332497, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "Demonstrating data access with a view and RCAC . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 179.00812, "t": 706.119492, "r": 530.43628, "b": 715.332497, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "32", "bbox": {"l": 535.99847, "t": 706.119492, "r": 547.12286, "b": 715.332497, "coord_origin": "TOPLEFT"}}], "children": [{"id": 4, "label": "text", "bbox": {"l": 136.8, "t": 132.64862000000005, "r": 172.89404, "b": 141.86163, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 3, "text": "Notices", "bbox": {"l": 136.8, "t": 132.64862000000005, "r": 172.89404, "b": 141.86163, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "text", "bbox": {"l": 175.01952, "t": 132.64862000000005, "r": 547.18982, "b": 141.86163, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 4, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vii", "bbox": {"l": 175.01952, "t": 132.64862000000005, "r": 547.18982, "b": 141.86163, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "text", "bbox": {"l": 136.79901, "t": 145.12847999999997, "r": 189.86537, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 5, "text": "Trademarks", "bbox": {"l": 136.79901, "t": 145.12847999999997, "r": 189.86537, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "text", "bbox": {"l": 195.39685, "t": 145.12847999999997, "r": 530.05121, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 195.39685, "t": 145.12847999999997, "r": 530.05121, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "text", "bbox": {"l": 535.5827, "t": 145.12847999999997, "r": 547.18286, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "viii", "bbox": {"l": 535.5827, "t": 145.12847999999997, "r": 547.18286, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 136.79901, "t": 167.62811, "r": 279.39731, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "DB2 for i Center of Excellence", "bbox": {"l": 136.79901, "t": 167.62811, "r": 279.39731, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "text", "bbox": {"l": 280.61942, "t": 167.62811, "r": 547.1908, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ix", "bbox": {"l": 280.61942, "t": 167.62811, "r": 547.1908, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 136.79901, "t": 190.12775, "r": 172.84424, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "Preface", "bbox": {"l": 136.79901, "t": 190.12775, "r": 172.84424, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 175.01852, "t": 190.12775, "r": 547.18286, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi", "bbox": {"l": 175.01852, "t": 190.12775, "r": 547.18286, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 136.79803, "t": 202.60760000000005, "r": 547.18085, "b": 211.82061999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "Authors . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi", "bbox": {"l": 136.79803, "t": 202.60760000000005, "r": 547.18085, "b": 211.82061999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 136.79803, "t": 215.14721999999995, "r": 339.18292, "b": 224.36023, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "Now you can become a published author, too!", "bbox": {"l": 136.79803, "t": 215.14721999999995, "r": 339.18292, "b": 224.36023, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 344.71411, "t": 215.14721999999995, "r": 530.00812, "b": 224.36023, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 344.71411, "t": 215.14721999999995, "r": 530.00812, "b": 224.36023, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 535.53925, "t": 215.14721999999995, "r": 547.13879, "b": 224.36023, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "xiii", "bbox": {"l": 535.53925, "t": 215.14721999999995, "r": 547.13879, "b": 224.36023, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 136.79803, "t": 227.62707999999998, "r": 529.99506, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "Comments welcome. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 136.79803, "t": 227.62707999999998, "r": 529.99506, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 535.5495, "t": 227.62707999999998, "r": 547.19788, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "xiii", "bbox": {"l": 535.5495, "t": 227.62707999999998, "r": 547.19788, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 136.79807, "t": 240.10693000000003, "r": 284.02866, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "Stay connected to IBM Redbooks", "bbox": {"l": 136.79807, "t": 240.10693000000003, "r": 284.02866, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 289.54449, "t": 240.10693000000003, "r": 529.48242, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 289.54449, "t": 240.10693000000003, "r": 529.48242, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 534.99829, "t": 240.10693000000003, "r": 547.12115, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "xiv", "bbox": {"l": 534.99829, "t": 240.10693000000003, "r": 547.12115, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 136.79807, "t": 262.60657000000003, "r": 373.17566, "b": 271.81958, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "Chapter 1. Securing and protecting IBM DB2 data", "bbox": {"l": 136.79807, "t": 262.60657000000003, "r": 373.17566, "b": 271.81958, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 375.11798, "t": 262.60657000000003, "r": 536.09589, "b": 271.81958, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 375.11798, "t": 262.60657000000003, "r": 536.09589, "b": 271.81958, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 541.64685, "t": 262.60657000000003, "r": 547.19781, "b": 271.81958, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "1", "bbox": {"l": 541.64685, "t": 262.60657000000003, "r": 547.19781, "b": 271.81958, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 136.79808, "t": 274.60637999999994, "r": 150.88702, "b": 283.8194, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "1.1", "bbox": {"l": 136.79808, "t": 274.60637999999994, "r": 150.88702, "b": 283.8194, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 156.5226, "t": 274.60637999999994, "r": 549.84723, "b": 283.8194, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "Security fundamentals. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2", "bbox": {"l": 156.5226, "t": 274.60637999999994, "r": 549.84723, "b": 283.8194, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 136.79807, "t": 287.14606000000003, "r": 150.62746, "b": 296.35904, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "1.2", "bbox": {"l": 136.79807, "t": 287.14606000000003, "r": 150.62746, "b": 296.35904, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 156.15923, "t": 287.14606000000003, "r": 536.12933, "b": 296.35904, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "Current state of IBM i security . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.15923, "t": 287.14606000000003, "r": 536.12933, "b": 296.35904, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 541.66113, "t": 287.14606000000003, "r": 547.19287, "b": 296.35904, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "2", "bbox": {"l": 541.66113, "t": 287.14606000000003, "r": 547.19287, "b": 296.35904, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 136.79807, "t": 299.62595, "r": 150.84943, "b": 308.83893, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "1.3", "bbox": {"l": 136.79807, "t": 299.62595, "r": 150.84943, "b": 308.83893, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 156.46996, "t": 299.62595, "r": 549.84723, "b": 308.83893, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "DB2 for i security controls . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3", "bbox": {"l": 156.46996, "t": 299.62595, "r": 549.84723, "b": 308.83893, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 151.1972, "t": 312.1058300000001, "r": 173.38289, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "1.3.1", "bbox": {"l": 151.1972, "t": 312.1058300000001, "r": 173.38289, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 178.92932, "t": 312.1058300000001, "r": 536.05511, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "Existing row and column control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.92932, "t": 312.1058300000001, "r": 536.05511, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 541.6015, "t": 312.1058300000001, "r": 547.14795, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "4", "bbox": {"l": 541.6015, "t": 312.1058300000001, "r": 547.14795, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 151.1972, "t": 324.64548, "r": 173.4189, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "1.3.2", "bbox": {"l": 151.1972, "t": 324.64548, "r": 173.4189, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 178.97432, "t": 324.64548, "r": 536.08008, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "New controls: Row and Column Access Control. . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.97432, "t": 324.64548, "r": 536.08008, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 541.6355, "t": 324.64548, "r": 547.19092, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "5", "bbox": {"l": 541.6355, "t": 324.64548, "r": 547.19092, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 136.79704, "t": 347.14511, "r": 336.82071, "b": 356.35809, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "Chapter 2. Roles and separation of duties", "bbox": {"l": 136.79704, "t": 347.14511, "r": 336.82071, "b": 356.35809, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 338.99701, "t": 347.14511, "r": 536.09088, "b": 356.35809, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 338.99701, "t": 347.14511, "r": 536.09088, "b": 356.35809, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 541.64282, "t": 347.14511, "r": 547.19476, "b": 356.35809, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "7", "bbox": {"l": 541.64282, "t": 347.14511, "r": 547.19476, "b": 356.35809, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 136.79704, "t": 359.14493, "r": 150.644, "b": 368.35791, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "2.1", "bbox": {"l": 136.79704, "t": 359.14493, "r": 150.644, "b": 368.35791, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 156.18277, "t": 359.14493, "r": 536.12714, "b": 368.35791, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "Roles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.18277, "t": 359.14493, "r": 536.12714, "b": 368.35791, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 541.66589, "t": 359.14493, "r": 547.20471, "b": 368.35791, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "8", "bbox": {"l": 541.66589, "t": 359.14493, "r": 547.20471, "b": 368.35791, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 151.1972, "t": 371.62482, "r": 173.60995, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "2.1.1", "bbox": {"l": 151.1972, "t": 371.62482, "r": 173.60995, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 176.41154, "t": 371.62482, "r": 535.9527, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "DDM and DRDA application server access: QIBM_DB_DDMDRDA . . . . . . . . . . .", "bbox": {"l": 176.41154, "t": 371.62482, "r": 535.9527, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 541.55585, "t": 371.62482, "r": 547.15906, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "8", "bbox": {"l": 541.55585, "t": 371.62482, "r": 547.15906, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 151.1972, "t": 384.10470999999995, "r": 173.41664, "b": 393.31769, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "2.1.2", "bbox": {"l": 151.1972, "t": 384.10470999999995, "r": 173.41664, "b": 393.31769, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 178.97151, "t": 384.10470999999995, "r": 536.04108, "b": 393.31769, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "Toolbox application server access: QIBM_DB_ZDA. . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.97151, "t": 384.10470999999995, "r": 536.04108, "b": 393.31769, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 541.59595, "t": 384.10470999999995, "r": 547.15082, "b": 393.31769, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "8", "bbox": {"l": 541.59595, "t": 384.10470999999995, "r": 547.15082, "b": 393.31769, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 151.1972, "t": 396.64435, "r": 173.41859, "b": 405.85733, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "2.1.3", "bbox": {"l": 151.1972, "t": 396.64435, "r": 173.41859, "b": 405.85733, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 178.97394, "t": 396.64435, "r": 536.07489, "b": 405.85733, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "Database Administrator function: QIBM_DB_SQLADM . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.97394, "t": 396.64435, "r": 536.07489, "b": 405.85733, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 541.63025, "t": 396.64435, "r": 547.18561, "b": 405.85733, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "9", "bbox": {"l": 541.63025, "t": 396.64435, "r": 547.18561, "b": 405.85733, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 151.1972, "t": 409.12424000000004, "r": 173.38629, "b": 418.33722, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "2.1.4", "bbox": {"l": 151.1972, "t": 409.12424000000004, "r": 173.38629, "b": 418.33722, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 178.93356, "t": 409.12424000000004, "r": 411.27048, "b": 418.33722, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "Database Information function: QIBM_DB_SYSMON", "bbox": {"l": 178.93356, "t": 409.12424000000004, "r": 411.27048, "b": 418.33722, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 416.81775, "t": 409.12424000000004, "r": 536.08411, "b": 418.33722, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": ". . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 416.81775, "t": 409.12424000000004, "r": 536.08411, "b": 418.33722, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 541.63135, "t": 409.12424000000004, "r": 547.17865, "b": 418.33722, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "9", "bbox": {"l": 541.63135, "t": 409.12424000000004, "r": 547.17865, "b": 418.33722, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 151.1972, "t": 421.60413, "r": 173.44926, "b": 430.81711, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "2.1.5", "bbox": {"l": 151.1972, "t": 421.60413, "r": 173.44926, "b": 430.81711, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 179.01228, "t": 421.60413, "r": 536.03589, "b": 430.81711, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "Security Administrator function: QIBM_DB_SECADM . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 179.01228, "t": 421.60413, "r": 536.03589, "b": 430.81711, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 541.59894, "t": 421.60413, "r": 547.16193, "b": 430.81711, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "9", "bbox": {"l": 541.59894, "t": 421.60413, "r": 547.16193, "b": 430.81711, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 151.1972, "t": 434.1437700000001, "r": 173.32208, "b": 443.35675, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "2.1.6", "bbox": {"l": 151.1972, "t": 434.1437700000001, "r": 173.32208, "b": 443.35675, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 178.8533, "t": 434.1437700000001, "r": 530.57318, "b": 443.35675, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "Change Function Usage CL command . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.8533, "t": 434.1437700000001, "r": 530.57318, "b": 443.35675, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 536.10443, "t": 434.1437700000001, "r": 547.16687, "b": 443.35675, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "10", "bbox": {"l": 536.10443, "t": 434.1437700000001, "r": 547.16687, "b": 443.35675, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 151.1972, "t": 446.62366, "r": 173.35822, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "2.1.7", "bbox": {"l": 151.1972, "t": 446.62366, "r": 173.35822, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 178.89848, "t": 446.62366, "r": 530.53522, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "Verifying function usage IDs for RCAC with the FUNCTION_USAGE view . . . . .", "bbox": {"l": 178.89848, "t": 446.62366, "r": 530.53522, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 536.0755, "t": 446.62366, "r": 547.15601, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "10", "bbox": {"l": 536.0755, "t": 446.62366, "r": 547.15601, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 136.79704, "t": 459.10355, "r": 150.85457, "b": 468.31653, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "2.2", "bbox": {"l": 136.79704, "t": 459.10355, "r": 150.85457, "b": 468.31653, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 156.47758, "t": 459.10355, "r": 547.25659, "b": 468.31653, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "Separation of duties . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10", "bbox": {"l": 156.47758, "t": 459.10355, "r": 547.25659, "b": 468.31653, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 136.79703, "t": 481.60318, "r": 348.68503, "b": 490.81616, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "Chapter 3. Row and Column Access Control", "bbox": {"l": 136.79703, "t": 481.60318, "r": 348.68503, "b": 490.81616, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 350.09741, "t": 481.60318, "r": 530.53961, "b": 490.81616, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 350.09741, "t": 481.60318, "r": 530.53961, "b": 490.81616, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 536.09167, "t": 481.60318, "r": 547.1958, "b": 490.81616, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "13", "bbox": {"l": 536.09167, "t": 481.60318, "r": 547.1958, "b": 490.81616, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 136.79703, "t": 493.603, "r": 150.70105, "b": 502.81598, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "3.1", "bbox": {"l": 136.79703, "t": 493.603, "r": 150.70105, "b": 502.81598, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 156.26266, "t": 493.603, "r": 530.4809, "b": 502.81598, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "Explanation of RCAC and the concept of access control . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.26266, "t": 493.603, "r": 530.4809, "b": 502.81598, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 536.04248, "t": 493.603, "r": 547.16571, "b": 502.81598, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "14", "bbox": {"l": 536.04248, "t": 493.603, "r": 547.16571, "b": 502.81598, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 151.19719, "t": 506.14264, "r": 173.35429, "b": 515.35562, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "3.1.1", "bbox": {"l": 151.19719, "t": 506.14264, "r": 173.35429, "b": 515.35562, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 178.89357, "t": 506.14264, "r": 378.20786, "b": 515.35562, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "Row permission and column mask definitions", "bbox": {"l": 178.89357, "t": 506.14264, "r": 378.20786, "b": 515.35562, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 383.74713, "t": 506.14264, "r": 530.5379, "b": 515.35562, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 383.74713, "t": 506.14264, "r": 530.5379, "b": 515.35562, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 536.07721, "t": 506.14264, "r": 547.15576, "b": 515.35562, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "14", "bbox": {"l": 536.07721, "t": 506.14264, "r": 547.15576, "b": 515.35562, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 151.19719, "t": 518.62253, "r": 173.44292, "b": 527.83551, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "3.1.2", "bbox": {"l": 151.19719, "t": 518.62253, "r": 173.44292, "b": 527.83551, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 179.00435, "t": 518.62253, "r": 530.43475, "b": 527.83551, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "Enabling and activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 179.00435, "t": 518.62253, "r": 530.43475, "b": 527.83551, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 535.99622, "t": 518.62253, "r": 547.11908, "b": 527.83551, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "16", "bbox": {"l": 535.99622, "t": 518.62253, "r": 547.11908, "b": 527.83551, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 136.79703, "t": 531.1621700000001, "r": 150.64432, "b": 540.37517, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "3.2", "bbox": {"l": 136.79703, "t": 531.1621700000001, "r": 150.64432, "b": 540.37517, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 156.18323, "t": 531.1621700000001, "r": 530.52808, "b": 540.37517, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "Special registers and built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.18323, "t": 531.1621700000001, "r": 530.52808, "b": 540.37517, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 536.06702, "t": 531.1621700000001, "r": 547.14484, "b": 540.37517, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "18", "bbox": {"l": 536.06702, "t": 531.1621700000001, "r": 547.14484, "b": 540.37517, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 151.19719, "t": 543.64204, "r": 173.41321, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "3.2.1", "bbox": {"l": 151.19719, "t": 543.64204, "r": 173.41321, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 178.96722, "t": 543.64204, "r": 530.49786, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "Special registers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.96722, "t": 543.64204, "r": 530.49786, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 536.05188, "t": 543.64204, "r": 547.15991, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "18", "bbox": {"l": 536.05188, "t": 543.64204, "r": 547.15991, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 151.19719, "t": 556.12192, "r": 173.35269, "b": 565.33492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "3.2.2", "bbox": {"l": 151.19719, "t": 556.12192, "r": 173.35269, "b": 565.33492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 178.89156, "t": 556.12192, "r": 530.56024, "b": 565.33492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "Built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.89156, "t": 556.12192, "r": 530.56024, "b": 565.33492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 536.09912, "t": 556.12192, "r": 547.17688, "b": 565.33492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "19", "bbox": {"l": 536.09912, "t": 556.12192, "r": 547.17688, "b": 565.33492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 136.79703, "t": 568.66156, "r": 150.62514, "b": 577.87456, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "3.3", "bbox": {"l": 136.79703, "t": 568.66156, "r": 150.62514, "b": 577.87456, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 156.15639, "t": 568.66156, "r": 530.53027, "b": 577.87456, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "VERIFY_GROUP_FOR_USER function . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.15639, "t": 568.66156, "r": 530.53027, "b": 577.87456, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 536.06152, "t": 568.66156, "r": 547.12402, "b": 577.87456, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "20", "bbox": {"l": 536.06152, "t": 568.66156, "r": 547.12402, "b": 577.87456, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 136.79703, "t": 581.14143, "r": 150.63004, "b": 590.35443, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "3.4", "bbox": {"l": 136.79703, "t": 581.14143, "r": 150.63004, "b": 590.35443, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 156.16325, "t": 581.14143, "r": 530.62994, "b": 590.35443, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "Establishing and controlling accessibility by using the RCAC rule text . . . . . . . . . . . . .", "bbox": {"l": 156.16325, "t": 581.14143, "r": 530.62994, "b": 590.35443, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 536.16315, "t": 581.14143, "r": 547.22955, "b": 590.35443, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "21", "bbox": {"l": 536.16315, "t": 581.14143, "r": 547.22955, "b": 590.35443, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 136.79701, "t": 593.62131, "r": 150.64413, "b": 602.8343, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "3.5", "bbox": {"l": 136.79701, "t": 593.62131, "r": 150.64413, "b": 602.8343, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 156.18298, "t": 593.62131, "r": 394.7818, "b": 602.8343, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "SELECT, INSERT, and UPDATE behavior with RCAC", "bbox": {"l": 156.18298, "t": 593.62131, "r": 394.7818, "b": 602.8343, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 400.32065, "t": 593.62131, "r": 530.48358, "b": 602.8343, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": ". . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 400.32065, "t": 593.62131, "r": 530.48358, "b": 602.8343, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 536.0224, "t": 593.62131, "r": 547.1001, "b": 602.8343, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "22", "bbox": {"l": 536.0224, "t": 593.62131, "r": 547.1001, "b": 602.8343, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 136.79701, "t": 606.16095, "r": 150.6642, "b": 615.37395, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "3.6", "bbox": {"l": 136.79701, "t": 606.16095, "r": 150.6642, "b": 615.37395, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 156.21107, "t": 606.16095, "r": 530.56512, "b": 615.37395, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "Human resources example . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.21107, "t": 606.16095, "r": 530.56512, "b": 615.37395, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 536.112, "t": 606.16095, "r": 547.20575, "b": 615.37395, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "22", "bbox": {"l": 536.112, "t": 606.16095, "r": 547.20575, "b": 615.37395, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 151.19717, "t": 618.64082, "r": 173.41692, "b": 627.85382, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "3.6.1", "bbox": {"l": 151.19717, "t": 618.64082, "r": 173.41692, "b": 627.85382, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 178.97185, "t": 618.64082, "r": 530.49139, "b": 627.85382, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": "Assigning the QIBM_DB_SECADM function ID to the consultants. . . . . . . . . . . .", "bbox": {"l": 178.97185, "t": 618.64082, "r": 530.49139, "b": 627.85382, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 536.04633, "t": 618.64082, "r": 547.15619, "b": 627.85382, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "23", "bbox": {"l": 536.04633, "t": 618.64082, "r": 547.15619, "b": 627.85382, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 151.19717, "t": 631.1206999999999, "r": 173.32271, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "3.6.2", "bbox": {"l": 151.19717, "t": 631.1206999999999, "r": 173.32271, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 178.8541, "t": 631.1206999999999, "r": 530.56458, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": "Creating group profiles for the users and their roles . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.8541, "t": 631.1206999999999, "r": 530.56458, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 536.09601, "t": 631.1206999999999, "r": 547.15875, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 107, "text": "23", "bbox": {"l": 536.09601, "t": 631.1206999999999, "r": 547.15875, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 151.19717, "t": 643.66034, "r": 173.32227, "b": 652.87334, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 108, "text": "3.6.3", "bbox": {"l": 151.19717, "t": 643.66034, "r": 173.32227, "b": 652.87334, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 178.85353, "t": 643.66034, "r": 530.55695, "b": 652.87334, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 109, "text": "Demonstrating data access without RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.85353, "t": 643.66034, "r": 530.55695, "b": 652.87334, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 536.0882, "t": 643.66034, "r": 547.15076, "b": 652.87334, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 110, "text": "24", "bbox": {"l": 536.0882, "t": 643.66034, "r": 547.15076, "b": 652.87334, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 151.19717, "t": 656.14021, "r": 173.35289, "b": 665.35321, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 111, "text": "3.6.4", "bbox": {"l": 151.19717, "t": 656.14021, "r": 173.35289, "b": 665.35321, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 178.89182, "t": 656.14021, "r": 530.53412, "b": 665.35321, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 112, "text": "Defining and creating row permissions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.89182, "t": 656.14021, "r": 530.53412, "b": 665.35321, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 114, "label": "text", "bbox": {"l": 536.073, "t": 656.14021, "r": 547.15088, "b": 665.35321, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 113, "text": "25", "bbox": {"l": 536.073, "t": 656.14021, "r": 547.15088, "b": 665.35321, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 115, "label": "text", "bbox": {"l": 151.19717, "t": 668.62009, "r": 173.35289, "b": 677.83309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 114, "text": "3.6.5", "bbox": {"l": 151.19717, "t": 668.62009, "r": 173.35289, "b": 677.83309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 116, "label": "text", "bbox": {"l": 178.89182, "t": 668.62009, "r": 339.45105, "b": 677.83309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 115, "text": "Defining and creating column masks", "bbox": {"l": 178.89182, "t": 668.62009, "r": 339.45105, "b": 677.83309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 117, "label": "text", "bbox": {"l": 344.98996, "t": 668.62009, "r": 530.54413, "b": 677.83309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 116, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 344.98996, "t": 668.62009, "r": 530.54413, "b": 677.83309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 118, "label": "text", "bbox": {"l": 536.08301, "t": 668.62009, "r": 547.16089, "b": 677.83309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 117, "text": "26", "bbox": {"l": 536.08301, "t": 668.62009, "r": 547.16089, "b": 677.83309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 119, "label": "text", "bbox": {"l": 151.19717, "t": 681.15973, "r": 173.38359, "b": 690.37273, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 118, "text": "3.6.6", "bbox": {"l": 151.19717, "t": 681.15973, "r": 173.38359, "b": 690.37273, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 120, "label": "text", "bbox": {"l": 178.93019, "t": 681.15973, "r": 530.54102, "b": 690.37273, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 119, "text": "Activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.93019, "t": 681.15973, "r": 530.54102, "b": 690.37273, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 121, "label": "text", "bbox": {"l": 536.08765, "t": 681.15973, "r": 547.18085, "b": 690.37273, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 120, "text": "28", "bbox": {"l": 536.08765, "t": 681.15973, "r": 547.18085, "b": 690.37273, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 122, "label": "text", "bbox": {"l": 151.19717, "t": 693.63961, "r": 173.32332, "b": 702.852615, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 121, "text": "3.6.7", "bbox": {"l": 151.19717, "t": 693.63961, "r": 173.32332, "b": 702.852615, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 123, "label": "text", "bbox": {"l": 178.85486, "t": 693.63961, "r": 350.80011, "b": 702.852615, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 122, "text": "Demonstrating data access with RCAC", "bbox": {"l": 178.85486, "t": 693.63961, "r": 350.80011, "b": 702.852615, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 124, "label": "text", "bbox": {"l": 356.33163, "t": 693.63961, "r": 530.57507, "b": 702.852615, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 123, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 356.33163, "t": 693.63961, "r": 530.57507, "b": 702.852615, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 125, "label": "text", "bbox": {"l": 536.10663, "t": 693.63961, "r": 547.16968, "b": 702.852615, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 124, "text": "29", "bbox": {"l": 536.10663, "t": 693.63961, "r": 547.16968, "b": 702.852615, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 126, "label": "text", "bbox": {"l": 151.19717, "t": 706.119492, "r": 173.44592, "b": 715.332497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 125, "text": "3.6.8", "bbox": {"l": 151.19717, "t": 706.119492, "r": 173.44592, "b": 715.332497, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 127, "label": "text", "bbox": {"l": 179.00812, "t": 706.119492, "r": 530.43628, "b": 715.332497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 126, "text": "Demonstrating data access with a view and RCAC . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 179.00812, "t": 706.119492, "r": 530.43628, "b": 715.332497, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 128, "label": "text", "bbox": {"l": 535.99847, "t": 706.119492, "r": 547.12286, "b": 715.332497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 127, "text": "32", "bbox": {"l": 535.99847, "t": 706.119492, "r": 547.12286, "b": 715.332497, "coord_origin": "TOPLEFT"}}], "children": []}]}]}, "tablestructure": {"table_map": {"0": {"label": "document_index", "id": 0, "page_no": 1, "cluster": {"id": 0, "label": "document_index", "bbox": {"l": 136.1496124267578, "t": 132.0330352783203, "r": 547.5267944335938, "b": 715.6515502929688, "coord_origin": "TOPLEFT"}, "confidence": 0.9803681373596191, "cells": [{"id": 3, "text": "Notices", "bbox": {"l": 136.8, "t": 132.64862000000005, "r": 172.89404, "b": 141.86163, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vii", "bbox": {"l": 175.01952, "t": 132.64862000000005, "r": 547.18982, "b": 141.86163, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Trademarks", "bbox": {"l": 136.79901, "t": 145.12847999999997, "r": 189.86537, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 195.39685, "t": 145.12847999999997, "r": 530.05121, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "viii", "bbox": {"l": 535.5827, "t": 145.12847999999997, "r": 547.18286, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "DB2 for i Center of Excellence", "bbox": {"l": 136.79901, "t": 167.62811, "r": 279.39731, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ix", "bbox": {"l": 280.61942, "t": 167.62811, "r": 547.1908, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Preface", "bbox": {"l": 136.79901, "t": 190.12775, "r": 172.84424, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi", "bbox": {"l": 175.01852, "t": 190.12775, "r": 547.18286, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Authors . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi", "bbox": {"l": 136.79803, "t": 202.60760000000005, "r": 547.18085, "b": 211.82061999999996, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Now you can become a published author, too!", "bbox": {"l": 136.79803, "t": 215.14721999999995, "r": 339.18292, "b": 224.36023, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 344.71411, "t": 215.14721999999995, "r": 530.00812, "b": 224.36023, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "xiii", "bbox": {"l": 535.53925, "t": 215.14721999999995, "r": 547.13879, "b": 224.36023, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Comments welcome. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 136.79803, "t": 227.62707999999998, "r": 529.99506, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "xiii", "bbox": {"l": 535.5495, "t": 227.62707999999998, "r": 547.19788, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Stay connected to IBM Redbooks", "bbox": {"l": 136.79807, "t": 240.10693000000003, "r": 284.02866, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 289.54449, "t": 240.10693000000003, "r": 529.48242, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "xiv", "bbox": {"l": 534.99829, "t": 240.10693000000003, "r": 547.12115, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Chapter 1. Securing and protecting IBM DB2 data", "bbox": {"l": 136.79807, "t": 262.60657000000003, "r": 373.17566, "b": 271.81958, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 375.11798, "t": 262.60657000000003, "r": 536.09589, "b": 271.81958, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "1", "bbox": {"l": 541.64685, "t": 262.60657000000003, "r": 547.19781, "b": 271.81958, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "1.1", "bbox": {"l": 136.79808, "t": 274.60637999999994, "r": 150.88702, "b": 283.8194, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "Security fundamentals. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2", "bbox": {"l": 156.5226, "t": 274.60637999999994, "r": 549.84723, "b": 283.8194, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "1.2", "bbox": {"l": 136.79807, "t": 287.14606000000003, "r": 150.62746, "b": 296.35904, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Current state of IBM i security . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.15923, "t": 287.14606000000003, "r": 536.12933, "b": 296.35904, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "2", "bbox": {"l": 541.66113, "t": 287.14606000000003, "r": 547.19287, "b": 296.35904, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "1.3", "bbox": {"l": 136.79807, "t": 299.62595, "r": 150.84943, "b": 308.83893, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "DB2 for i security controls . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3", "bbox": {"l": 156.46996, "t": 299.62595, "r": 549.84723, "b": 308.83893, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "1.3.1", "bbox": {"l": 151.1972, "t": 312.1058300000001, "r": 173.38289, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Existing row and column control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.92932, "t": 312.1058300000001, "r": 536.05511, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "4", "bbox": {"l": 541.6015, "t": 312.1058300000001, "r": 547.14795, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "1.3.2", "bbox": {"l": 151.1972, "t": 324.64548, "r": 173.4189, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "New controls: Row and Column Access Control. . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.97432, "t": 324.64548, "r": 536.08008, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "5", "bbox": {"l": 541.6355, "t": 324.64548, "r": 547.19092, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "Chapter 2. Roles and separation of duties", "bbox": {"l": 136.79704, "t": 347.14511, "r": 336.82071, "b": 356.35809, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 338.99701, "t": 347.14511, "r": 536.09088, "b": 356.35809, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "7", "bbox": {"l": 541.64282, "t": 347.14511, "r": 547.19476, "b": 356.35809, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "2.1", "bbox": {"l": 136.79704, "t": 359.14493, "r": 150.644, "b": 368.35791, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Roles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.18277, "t": 359.14493, "r": 536.12714, "b": 368.35791, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "8", "bbox": {"l": 541.66589, "t": 359.14493, "r": 547.20471, "b": 368.35791, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "2.1.1", "bbox": {"l": 151.1972, "t": 371.62482, "r": 173.60995, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "DDM and DRDA application server access: QIBM_DB_DDMDRDA . . . . . . . . . . .", "bbox": {"l": 176.41154, "t": 371.62482, "r": 535.9527, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "8", "bbox": {"l": 541.55585, "t": 371.62482, "r": 547.15906, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "2.1.2", "bbox": {"l": 151.1972, "t": 384.10470999999995, "r": 173.41664, "b": 393.31769, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "Toolbox application server access: QIBM_DB_ZDA. . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.97151, "t": 384.10470999999995, "r": 536.04108, "b": 393.31769, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "8", "bbox": {"l": 541.59595, "t": 384.10470999999995, "r": 547.15082, "b": 393.31769, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "2.1.3", "bbox": {"l": 151.1972, "t": 396.64435, "r": 173.41859, "b": 405.85733, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Database Administrator function: QIBM_DB_SQLADM . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.97394, "t": 396.64435, "r": 536.07489, "b": 405.85733, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "9", "bbox": {"l": 541.63025, "t": 396.64435, "r": 547.18561, "b": 405.85733, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "2.1.4", "bbox": {"l": 151.1972, "t": 409.12424000000004, "r": 173.38629, "b": 418.33722, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Database Information function: QIBM_DB_SYSMON", "bbox": {"l": 178.93356, "t": 409.12424000000004, "r": 411.27048, "b": 418.33722, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": ". . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 416.81775, "t": 409.12424000000004, "r": 536.08411, "b": 418.33722, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "9", "bbox": {"l": 541.63135, "t": 409.12424000000004, "r": 547.17865, "b": 418.33722, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "2.1.5", "bbox": {"l": 151.1972, "t": 421.60413, "r": 173.44926, "b": 430.81711, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Security Administrator function: QIBM_DB_SECADM . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 179.01228, "t": 421.60413, "r": 536.03589, "b": 430.81711, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "9", "bbox": {"l": 541.59894, "t": 421.60413, "r": 547.16193, "b": 430.81711, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "2.1.6", "bbox": {"l": 151.1972, "t": 434.1437700000001, "r": 173.32208, "b": 443.35675, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Change Function Usage CL command . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.8533, "t": 434.1437700000001, "r": 530.57318, "b": 443.35675, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "10", "bbox": {"l": 536.10443, "t": 434.1437700000001, "r": 547.16687, "b": 443.35675, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "2.1.7", "bbox": {"l": 151.1972, "t": 446.62366, "r": 173.35822, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "Verifying function usage IDs for RCAC with the FUNCTION_USAGE view . . . . .", "bbox": {"l": 178.89848, "t": 446.62366, "r": 530.53522, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "10", "bbox": {"l": 536.0755, "t": 446.62366, "r": 547.15601, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "2.2", "bbox": {"l": 136.79704, "t": 459.10355, "r": 150.85457, "b": 468.31653, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "Separation of duties . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10", "bbox": {"l": 156.47758, "t": 459.10355, "r": 547.25659, "b": 468.31653, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "Chapter 3. Row and Column Access Control", "bbox": {"l": 136.79703, "t": 481.60318, "r": 348.68503, "b": 490.81616, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 350.09741, "t": 481.60318, "r": 530.53961, "b": 490.81616, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "13", "bbox": {"l": 536.09167, "t": 481.60318, "r": 547.1958, "b": 490.81616, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "3.1", "bbox": {"l": 136.79703, "t": 493.603, "r": 150.70105, "b": 502.81598, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Explanation of RCAC and the concept of access control . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.26266, "t": 493.603, "r": 530.4809, "b": 502.81598, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "14", "bbox": {"l": 536.04248, "t": 493.603, "r": 547.16571, "b": 502.81598, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "3.1.1", "bbox": {"l": 151.19719, "t": 506.14264, "r": 173.35429, "b": 515.35562, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "Row permission and column mask definitions", "bbox": {"l": 178.89357, "t": 506.14264, "r": 378.20786, "b": 515.35562, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 383.74713, "t": 506.14264, "r": 530.5379, "b": 515.35562, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "14", "bbox": {"l": 536.07721, "t": 506.14264, "r": 547.15576, "b": 515.35562, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "3.1.2", "bbox": {"l": 151.19719, "t": 518.62253, "r": 173.44292, "b": 527.83551, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "Enabling and activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 179.00435, "t": 518.62253, "r": 530.43475, "b": 527.83551, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "16", "bbox": {"l": 535.99622, "t": 518.62253, "r": 547.11908, "b": 527.83551, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "3.2", "bbox": {"l": 136.79703, "t": 531.1621700000001, "r": 150.64432, "b": 540.37517, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Special registers and built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.18323, "t": 531.1621700000001, "r": 530.52808, "b": 540.37517, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "18", "bbox": {"l": 536.06702, "t": 531.1621700000001, "r": 547.14484, "b": 540.37517, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "3.2.1", "bbox": {"l": 151.19719, "t": 543.64204, "r": 173.41321, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "Special registers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.96722, "t": 543.64204, "r": 530.49786, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "18", "bbox": {"l": 536.05188, "t": 543.64204, "r": 547.15991, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "3.2.2", "bbox": {"l": 151.19719, "t": 556.12192, "r": 173.35269, "b": 565.33492, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.89156, "t": 556.12192, "r": 530.56024, "b": 565.33492, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "19", "bbox": {"l": 536.09912, "t": 556.12192, "r": 547.17688, "b": 565.33492, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "3.3", "bbox": {"l": 136.79703, "t": 568.66156, "r": 150.62514, "b": 577.87456, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "VERIFY_GROUP_FOR_USER function . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.15639, "t": 568.66156, "r": 530.53027, "b": 577.87456, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "20", "bbox": {"l": 536.06152, "t": 568.66156, "r": 547.12402, "b": 577.87456, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "3.4", "bbox": {"l": 136.79703, "t": 581.14143, "r": 150.63004, "b": 590.35443, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "Establishing and controlling accessibility by using the RCAC rule text . . . . . . . . . . . . .", "bbox": {"l": 156.16325, "t": 581.14143, "r": 530.62994, "b": 590.35443, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "21", "bbox": {"l": 536.16315, "t": 581.14143, "r": 547.22955, "b": 590.35443, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "3.5", "bbox": {"l": 136.79701, "t": 593.62131, "r": 150.64413, "b": 602.8343, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "SELECT, INSERT, and UPDATE behavior with RCAC", "bbox": {"l": 156.18298, "t": 593.62131, "r": 394.7818, "b": 602.8343, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": ". . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 400.32065, "t": 593.62131, "r": 530.48358, "b": 602.8343, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "22", "bbox": {"l": 536.0224, "t": 593.62131, "r": 547.1001, "b": 602.8343, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "3.6", "bbox": {"l": 136.79701, "t": 606.16095, "r": 150.6642, "b": 615.37395, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "Human resources example . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.21107, "t": 606.16095, "r": 530.56512, "b": 615.37395, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "22", "bbox": {"l": 536.112, "t": 606.16095, "r": 547.20575, "b": 615.37395, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "3.6.1", "bbox": {"l": 151.19717, "t": 618.64082, "r": 173.41692, "b": 627.85382, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "Assigning the QIBM_DB_SECADM function ID to the consultants. . . . . . . . . . . .", "bbox": {"l": 178.97185, "t": 618.64082, "r": 530.49139, "b": 627.85382, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "23", "bbox": {"l": 536.04633, "t": 618.64082, "r": 547.15619, "b": 627.85382, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "3.6.2", "bbox": {"l": 151.19717, "t": 631.1206999999999, "r": 173.32271, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "Creating group profiles for the users and their roles . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.8541, "t": 631.1206999999999, "r": 530.56458, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "23", "bbox": {"l": 536.09601, "t": 631.1206999999999, "r": 547.15875, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "3.6.3", "bbox": {"l": 151.19717, "t": 643.66034, "r": 173.32227, "b": 652.87334, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "Demonstrating data access without RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.85353, "t": 643.66034, "r": 530.55695, "b": 652.87334, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "24", "bbox": {"l": 536.0882, "t": 643.66034, "r": 547.15076, "b": 652.87334, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "3.6.4", "bbox": {"l": 151.19717, "t": 656.14021, "r": 173.35289, "b": 665.35321, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "Defining and creating row permissions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.89182, "t": 656.14021, "r": 530.53412, "b": 665.35321, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "25", "bbox": {"l": 536.073, "t": 656.14021, "r": 547.15088, "b": 665.35321, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "3.6.5", "bbox": {"l": 151.19717, "t": 668.62009, "r": 173.35289, "b": 677.83309, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "Defining and creating column masks", "bbox": {"l": 178.89182, "t": 668.62009, "r": 339.45105, "b": 677.83309, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 344.98996, "t": 668.62009, "r": 530.54413, "b": 677.83309, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "26", "bbox": {"l": 536.08301, "t": 668.62009, "r": 547.16089, "b": 677.83309, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "3.6.6", "bbox": {"l": 151.19717, "t": 681.15973, "r": 173.38359, "b": 690.37273, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "Activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.93019, "t": 681.15973, "r": 530.54102, "b": 690.37273, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "28", "bbox": {"l": 536.08765, "t": 681.15973, "r": 547.18085, "b": 690.37273, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "3.6.7", "bbox": {"l": 151.19717, "t": 693.63961, "r": 173.32332, "b": 702.852615, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Demonstrating data access with RCAC", "bbox": {"l": 178.85486, "t": 693.63961, "r": 350.80011, "b": 702.852615, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 356.33163, "t": 693.63961, "r": 530.57507, "b": 702.852615, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "29", "bbox": {"l": 536.10663, "t": 693.63961, "r": 547.16968, "b": 702.852615, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "3.6.8", "bbox": {"l": 151.19717, "t": 706.119492, "r": 173.44592, "b": 715.332497, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "Demonstrating data access with a view and RCAC . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 179.00812, "t": 706.119492, "r": 530.43628, "b": 715.332497, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "32", "bbox": {"l": 535.99847, "t": 706.119492, "r": 547.12286, "b": 715.332497, "coord_origin": "TOPLEFT"}}], "children": [{"id": 4, "label": "text", "bbox": {"l": 136.8, "t": 132.64862000000005, "r": 172.89404, "b": 141.86163, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 3, "text": "Notices", "bbox": {"l": 136.8, "t": 132.64862000000005, "r": 172.89404, "b": 141.86163, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "text", "bbox": {"l": 175.01952, "t": 132.64862000000005, "r": 547.18982, "b": 141.86163, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 4, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vii", "bbox": {"l": 175.01952, "t": 132.64862000000005, "r": 547.18982, "b": 141.86163, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "text", "bbox": {"l": 136.79901, "t": 145.12847999999997, "r": 189.86537, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 5, "text": "Trademarks", "bbox": {"l": 136.79901, "t": 145.12847999999997, "r": 189.86537, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "text", "bbox": {"l": 195.39685, "t": 145.12847999999997, "r": 530.05121, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 195.39685, "t": 145.12847999999997, "r": 530.05121, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "text", "bbox": {"l": 535.5827, "t": 145.12847999999997, "r": 547.18286, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "viii", "bbox": {"l": 535.5827, "t": 145.12847999999997, "r": 547.18286, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 136.79901, "t": 167.62811, "r": 279.39731, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "DB2 for i Center of Excellence", "bbox": {"l": 136.79901, "t": 167.62811, "r": 279.39731, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "text", "bbox": {"l": 280.61942, "t": 167.62811, "r": 547.1908, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ix", "bbox": {"l": 280.61942, "t": 167.62811, "r": 547.1908, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 136.79901, "t": 190.12775, "r": 172.84424, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "Preface", "bbox": {"l": 136.79901, "t": 190.12775, "r": 172.84424, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 175.01852, "t": 190.12775, "r": 547.18286, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi", "bbox": {"l": 175.01852, "t": 190.12775, "r": 547.18286, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 136.79803, "t": 202.60760000000005, "r": 547.18085, "b": 211.82061999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "Authors . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi", "bbox": {"l": 136.79803, "t": 202.60760000000005, "r": 547.18085, "b": 211.82061999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 136.79803, "t": 215.14721999999995, "r": 339.18292, "b": 224.36023, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "Now you can become a published author, too!", "bbox": {"l": 136.79803, "t": 215.14721999999995, "r": 339.18292, "b": 224.36023, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 344.71411, "t": 215.14721999999995, "r": 530.00812, "b": 224.36023, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 344.71411, "t": 215.14721999999995, "r": 530.00812, "b": 224.36023, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 535.53925, "t": 215.14721999999995, "r": 547.13879, "b": 224.36023, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "xiii", "bbox": {"l": 535.53925, "t": 215.14721999999995, "r": 547.13879, "b": 224.36023, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 136.79803, "t": 227.62707999999998, "r": 529.99506, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "Comments welcome. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 136.79803, "t": 227.62707999999998, "r": 529.99506, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 535.5495, "t": 227.62707999999998, "r": 547.19788, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "xiii", "bbox": {"l": 535.5495, "t": 227.62707999999998, "r": 547.19788, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 136.79807, "t": 240.10693000000003, "r": 284.02866, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "Stay connected to IBM Redbooks", "bbox": {"l": 136.79807, "t": 240.10693000000003, "r": 284.02866, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 289.54449, "t": 240.10693000000003, "r": 529.48242, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 289.54449, "t": 240.10693000000003, "r": 529.48242, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 534.99829, "t": 240.10693000000003, "r": 547.12115, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "xiv", "bbox": {"l": 534.99829, "t": 240.10693000000003, "r": 547.12115, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 136.79807, "t": 262.60657000000003, "r": 373.17566, "b": 271.81958, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "Chapter 1. Securing and protecting IBM DB2 data", "bbox": {"l": 136.79807, "t": 262.60657000000003, "r": 373.17566, "b": 271.81958, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 375.11798, "t": 262.60657000000003, "r": 536.09589, "b": 271.81958, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 375.11798, "t": 262.60657000000003, "r": 536.09589, "b": 271.81958, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 541.64685, "t": 262.60657000000003, "r": 547.19781, "b": 271.81958, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "1", "bbox": {"l": 541.64685, "t": 262.60657000000003, "r": 547.19781, "b": 271.81958, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 136.79808, "t": 274.60637999999994, "r": 150.88702, "b": 283.8194, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "1.1", "bbox": {"l": 136.79808, "t": 274.60637999999994, "r": 150.88702, "b": 283.8194, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 156.5226, "t": 274.60637999999994, "r": 549.84723, "b": 283.8194, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "Security fundamentals. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2", "bbox": {"l": 156.5226, "t": 274.60637999999994, "r": 549.84723, "b": 283.8194, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 136.79807, "t": 287.14606000000003, "r": 150.62746, "b": 296.35904, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "1.2", "bbox": {"l": 136.79807, "t": 287.14606000000003, "r": 150.62746, "b": 296.35904, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 156.15923, "t": 287.14606000000003, "r": 536.12933, "b": 296.35904, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "Current state of IBM i security . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.15923, "t": 287.14606000000003, "r": 536.12933, "b": 296.35904, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 541.66113, "t": 287.14606000000003, "r": 547.19287, "b": 296.35904, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "2", "bbox": {"l": 541.66113, "t": 287.14606000000003, "r": 547.19287, "b": 296.35904, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 136.79807, "t": 299.62595, "r": 150.84943, "b": 308.83893, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "1.3", "bbox": {"l": 136.79807, "t": 299.62595, "r": 150.84943, "b": 308.83893, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 156.46996, "t": 299.62595, "r": 549.84723, "b": 308.83893, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "DB2 for i security controls . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3", "bbox": {"l": 156.46996, "t": 299.62595, "r": 549.84723, "b": 308.83893, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 151.1972, "t": 312.1058300000001, "r": 173.38289, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "1.3.1", "bbox": {"l": 151.1972, "t": 312.1058300000001, "r": 173.38289, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 178.92932, "t": 312.1058300000001, "r": 536.05511, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "Existing row and column control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.92932, "t": 312.1058300000001, "r": 536.05511, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 541.6015, "t": 312.1058300000001, "r": 547.14795, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "4", "bbox": {"l": 541.6015, "t": 312.1058300000001, "r": 547.14795, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 151.1972, "t": 324.64548, "r": 173.4189, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "1.3.2", "bbox": {"l": 151.1972, "t": 324.64548, "r": 173.4189, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 178.97432, "t": 324.64548, "r": 536.08008, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "New controls: Row and Column Access Control. . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.97432, "t": 324.64548, "r": 536.08008, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 541.6355, "t": 324.64548, "r": 547.19092, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "5", "bbox": {"l": 541.6355, "t": 324.64548, "r": 547.19092, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 136.79704, "t": 347.14511, "r": 336.82071, "b": 356.35809, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "Chapter 2. Roles and separation of duties", "bbox": {"l": 136.79704, "t": 347.14511, "r": 336.82071, "b": 356.35809, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 338.99701, "t": 347.14511, "r": 536.09088, "b": 356.35809, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 338.99701, "t": 347.14511, "r": 536.09088, "b": 356.35809, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 541.64282, "t": 347.14511, "r": 547.19476, "b": 356.35809, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "7", "bbox": {"l": 541.64282, "t": 347.14511, "r": 547.19476, "b": 356.35809, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 136.79704, "t": 359.14493, "r": 150.644, "b": 368.35791, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "2.1", "bbox": {"l": 136.79704, "t": 359.14493, "r": 150.644, "b": 368.35791, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 156.18277, "t": 359.14493, "r": 536.12714, "b": 368.35791, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "Roles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.18277, "t": 359.14493, "r": 536.12714, "b": 368.35791, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 541.66589, "t": 359.14493, "r": 547.20471, "b": 368.35791, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "8", "bbox": {"l": 541.66589, "t": 359.14493, "r": 547.20471, "b": 368.35791, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 151.1972, "t": 371.62482, "r": 173.60995, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "2.1.1", "bbox": {"l": 151.1972, "t": 371.62482, "r": 173.60995, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 176.41154, "t": 371.62482, "r": 535.9527, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "DDM and DRDA application server access: QIBM_DB_DDMDRDA . . . . . . . . . . .", "bbox": {"l": 176.41154, "t": 371.62482, "r": 535.9527, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 541.55585, "t": 371.62482, "r": 547.15906, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "8", "bbox": {"l": 541.55585, "t": 371.62482, "r": 547.15906, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 151.1972, "t": 384.10470999999995, "r": 173.41664, "b": 393.31769, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "2.1.2", "bbox": {"l": 151.1972, "t": 384.10470999999995, "r": 173.41664, "b": 393.31769, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 178.97151, "t": 384.10470999999995, "r": 536.04108, "b": 393.31769, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "Toolbox application server access: QIBM_DB_ZDA. . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.97151, "t": 384.10470999999995, "r": 536.04108, "b": 393.31769, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 541.59595, "t": 384.10470999999995, "r": 547.15082, "b": 393.31769, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "8", "bbox": {"l": 541.59595, "t": 384.10470999999995, "r": 547.15082, "b": 393.31769, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 151.1972, "t": 396.64435, "r": 173.41859, "b": 405.85733, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "2.1.3", "bbox": {"l": 151.1972, "t": 396.64435, "r": 173.41859, "b": 405.85733, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 178.97394, "t": 396.64435, "r": 536.07489, "b": 405.85733, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "Database Administrator function: QIBM_DB_SQLADM . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.97394, "t": 396.64435, "r": 536.07489, "b": 405.85733, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 541.63025, "t": 396.64435, "r": 547.18561, "b": 405.85733, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "9", "bbox": {"l": 541.63025, "t": 396.64435, "r": 547.18561, "b": 405.85733, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 151.1972, "t": 409.12424000000004, "r": 173.38629, "b": 418.33722, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "2.1.4", "bbox": {"l": 151.1972, "t": 409.12424000000004, "r": 173.38629, "b": 418.33722, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 178.93356, "t": 409.12424000000004, "r": 411.27048, "b": 418.33722, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "Database Information function: QIBM_DB_SYSMON", "bbox": {"l": 178.93356, "t": 409.12424000000004, "r": 411.27048, "b": 418.33722, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 416.81775, "t": 409.12424000000004, "r": 536.08411, "b": 418.33722, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": ". . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 416.81775, "t": 409.12424000000004, "r": 536.08411, "b": 418.33722, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 541.63135, "t": 409.12424000000004, "r": 547.17865, "b": 418.33722, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "9", "bbox": {"l": 541.63135, "t": 409.12424000000004, "r": 547.17865, "b": 418.33722, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 151.1972, "t": 421.60413, "r": 173.44926, "b": 430.81711, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "2.1.5", "bbox": {"l": 151.1972, "t": 421.60413, "r": 173.44926, "b": 430.81711, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 179.01228, "t": 421.60413, "r": 536.03589, "b": 430.81711, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "Security Administrator function: QIBM_DB_SECADM . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 179.01228, "t": 421.60413, "r": 536.03589, "b": 430.81711, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 541.59894, "t": 421.60413, "r": 547.16193, "b": 430.81711, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "9", "bbox": {"l": 541.59894, "t": 421.60413, "r": 547.16193, "b": 430.81711, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 151.1972, "t": 434.1437700000001, "r": 173.32208, "b": 443.35675, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "2.1.6", "bbox": {"l": 151.1972, "t": 434.1437700000001, "r": 173.32208, "b": 443.35675, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 178.8533, "t": 434.1437700000001, "r": 530.57318, "b": 443.35675, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "Change Function Usage CL command . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.8533, "t": 434.1437700000001, "r": 530.57318, "b": 443.35675, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 536.10443, "t": 434.1437700000001, "r": 547.16687, "b": 443.35675, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "10", "bbox": {"l": 536.10443, "t": 434.1437700000001, "r": 547.16687, "b": 443.35675, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 151.1972, "t": 446.62366, "r": 173.35822, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "2.1.7", "bbox": {"l": 151.1972, "t": 446.62366, "r": 173.35822, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 178.89848, "t": 446.62366, "r": 530.53522, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "Verifying function usage IDs for RCAC with the FUNCTION_USAGE view . . . . .", "bbox": {"l": 178.89848, "t": 446.62366, "r": 530.53522, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 536.0755, "t": 446.62366, "r": 547.15601, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "10", "bbox": {"l": 536.0755, "t": 446.62366, "r": 547.15601, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 136.79704, "t": 459.10355, "r": 150.85457, "b": 468.31653, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "2.2", "bbox": {"l": 136.79704, "t": 459.10355, "r": 150.85457, "b": 468.31653, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 156.47758, "t": 459.10355, "r": 547.25659, "b": 468.31653, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "Separation of duties . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10", "bbox": {"l": 156.47758, "t": 459.10355, "r": 547.25659, "b": 468.31653, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 136.79703, "t": 481.60318, "r": 348.68503, "b": 490.81616, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "Chapter 3. Row and Column Access Control", "bbox": {"l": 136.79703, "t": 481.60318, "r": 348.68503, "b": 490.81616, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 350.09741, "t": 481.60318, "r": 530.53961, "b": 490.81616, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 350.09741, "t": 481.60318, "r": 530.53961, "b": 490.81616, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 536.09167, "t": 481.60318, "r": 547.1958, "b": 490.81616, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "13", "bbox": {"l": 536.09167, "t": 481.60318, "r": 547.1958, "b": 490.81616, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 136.79703, "t": 493.603, "r": 150.70105, "b": 502.81598, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "3.1", "bbox": {"l": 136.79703, "t": 493.603, "r": 150.70105, "b": 502.81598, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 156.26266, "t": 493.603, "r": 530.4809, "b": 502.81598, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "Explanation of RCAC and the concept of access control . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.26266, "t": 493.603, "r": 530.4809, "b": 502.81598, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 536.04248, "t": 493.603, "r": 547.16571, "b": 502.81598, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "14", "bbox": {"l": 536.04248, "t": 493.603, "r": 547.16571, "b": 502.81598, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 151.19719, "t": 506.14264, "r": 173.35429, "b": 515.35562, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "3.1.1", "bbox": {"l": 151.19719, "t": 506.14264, "r": 173.35429, "b": 515.35562, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 178.89357, "t": 506.14264, "r": 378.20786, "b": 515.35562, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "Row permission and column mask definitions", "bbox": {"l": 178.89357, "t": 506.14264, "r": 378.20786, "b": 515.35562, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 383.74713, "t": 506.14264, "r": 530.5379, "b": 515.35562, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 383.74713, "t": 506.14264, "r": 530.5379, "b": 515.35562, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 536.07721, "t": 506.14264, "r": 547.15576, "b": 515.35562, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "14", "bbox": {"l": 536.07721, "t": 506.14264, "r": 547.15576, "b": 515.35562, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 151.19719, "t": 518.62253, "r": 173.44292, "b": 527.83551, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "3.1.2", "bbox": {"l": 151.19719, "t": 518.62253, "r": 173.44292, "b": 527.83551, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 179.00435, "t": 518.62253, "r": 530.43475, "b": 527.83551, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "Enabling and activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 179.00435, "t": 518.62253, "r": 530.43475, "b": 527.83551, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 535.99622, "t": 518.62253, "r": 547.11908, "b": 527.83551, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "16", "bbox": {"l": 535.99622, "t": 518.62253, "r": 547.11908, "b": 527.83551, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 136.79703, "t": 531.1621700000001, "r": 150.64432, "b": 540.37517, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "3.2", "bbox": {"l": 136.79703, "t": 531.1621700000001, "r": 150.64432, "b": 540.37517, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 156.18323, "t": 531.1621700000001, "r": 530.52808, "b": 540.37517, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "Special registers and built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.18323, "t": 531.1621700000001, "r": 530.52808, "b": 540.37517, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 536.06702, "t": 531.1621700000001, "r": 547.14484, "b": 540.37517, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "18", "bbox": {"l": 536.06702, "t": 531.1621700000001, "r": 547.14484, "b": 540.37517, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 151.19719, "t": 543.64204, "r": 173.41321, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "3.2.1", "bbox": {"l": 151.19719, "t": 543.64204, "r": 173.41321, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 178.96722, "t": 543.64204, "r": 530.49786, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "Special registers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.96722, "t": 543.64204, "r": 530.49786, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 536.05188, "t": 543.64204, "r": 547.15991, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "18", "bbox": {"l": 536.05188, "t": 543.64204, "r": 547.15991, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 151.19719, "t": 556.12192, "r": 173.35269, "b": 565.33492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "3.2.2", "bbox": {"l": 151.19719, "t": 556.12192, "r": 173.35269, "b": 565.33492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 178.89156, "t": 556.12192, "r": 530.56024, "b": 565.33492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "Built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.89156, "t": 556.12192, "r": 530.56024, "b": 565.33492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 536.09912, "t": 556.12192, "r": 547.17688, "b": 565.33492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "19", "bbox": {"l": 536.09912, "t": 556.12192, "r": 547.17688, "b": 565.33492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 136.79703, "t": 568.66156, "r": 150.62514, "b": 577.87456, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "3.3", "bbox": {"l": 136.79703, "t": 568.66156, "r": 150.62514, "b": 577.87456, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 156.15639, "t": 568.66156, "r": 530.53027, "b": 577.87456, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "VERIFY_GROUP_FOR_USER function . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.15639, "t": 568.66156, "r": 530.53027, "b": 577.87456, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 536.06152, "t": 568.66156, "r": 547.12402, "b": 577.87456, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "20", "bbox": {"l": 536.06152, "t": 568.66156, "r": 547.12402, "b": 577.87456, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 136.79703, "t": 581.14143, "r": 150.63004, "b": 590.35443, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "3.4", "bbox": {"l": 136.79703, "t": 581.14143, "r": 150.63004, "b": 590.35443, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 156.16325, "t": 581.14143, "r": 530.62994, "b": 590.35443, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "Establishing and controlling accessibility by using the RCAC rule text . . . . . . . . . . . . .", "bbox": {"l": 156.16325, "t": 581.14143, "r": 530.62994, "b": 590.35443, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 536.16315, "t": 581.14143, "r": 547.22955, "b": 590.35443, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "21", "bbox": {"l": 536.16315, "t": 581.14143, "r": 547.22955, "b": 590.35443, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 136.79701, "t": 593.62131, "r": 150.64413, "b": 602.8343, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "3.5", "bbox": {"l": 136.79701, "t": 593.62131, "r": 150.64413, "b": 602.8343, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 156.18298, "t": 593.62131, "r": 394.7818, "b": 602.8343, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "SELECT, INSERT, and UPDATE behavior with RCAC", "bbox": {"l": 156.18298, "t": 593.62131, "r": 394.7818, "b": 602.8343, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 400.32065, "t": 593.62131, "r": 530.48358, "b": 602.8343, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": ". . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 400.32065, "t": 593.62131, "r": 530.48358, "b": 602.8343, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 536.0224, "t": 593.62131, "r": 547.1001, "b": 602.8343, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "22", "bbox": {"l": 536.0224, "t": 593.62131, "r": 547.1001, "b": 602.8343, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 136.79701, "t": 606.16095, "r": 150.6642, "b": 615.37395, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "3.6", "bbox": {"l": 136.79701, "t": 606.16095, "r": 150.6642, "b": 615.37395, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 156.21107, "t": 606.16095, "r": 530.56512, "b": 615.37395, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "Human resources example . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.21107, "t": 606.16095, "r": 530.56512, "b": 615.37395, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 536.112, "t": 606.16095, "r": 547.20575, "b": 615.37395, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "22", "bbox": {"l": 536.112, "t": 606.16095, "r": 547.20575, "b": 615.37395, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 151.19717, "t": 618.64082, "r": 173.41692, "b": 627.85382, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "3.6.1", "bbox": {"l": 151.19717, "t": 618.64082, "r": 173.41692, "b": 627.85382, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 178.97185, "t": 618.64082, "r": 530.49139, "b": 627.85382, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": "Assigning the QIBM_DB_SECADM function ID to the consultants. . . . . . . . . . . .", "bbox": {"l": 178.97185, "t": 618.64082, "r": 530.49139, "b": 627.85382, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 536.04633, "t": 618.64082, "r": 547.15619, "b": 627.85382, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "23", "bbox": {"l": 536.04633, "t": 618.64082, "r": 547.15619, "b": 627.85382, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 151.19717, "t": 631.1206999999999, "r": 173.32271, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "3.6.2", "bbox": {"l": 151.19717, "t": 631.1206999999999, "r": 173.32271, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 178.8541, "t": 631.1206999999999, "r": 530.56458, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": "Creating group profiles for the users and their roles . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.8541, "t": 631.1206999999999, "r": 530.56458, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 536.09601, "t": 631.1206999999999, "r": 547.15875, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 107, "text": "23", "bbox": {"l": 536.09601, "t": 631.1206999999999, "r": 547.15875, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 151.19717, "t": 643.66034, "r": 173.32227, "b": 652.87334, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 108, "text": "3.6.3", "bbox": {"l": 151.19717, "t": 643.66034, "r": 173.32227, "b": 652.87334, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 178.85353, "t": 643.66034, "r": 530.55695, "b": 652.87334, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 109, "text": "Demonstrating data access without RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.85353, "t": 643.66034, "r": 530.55695, "b": 652.87334, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 536.0882, "t": 643.66034, "r": 547.15076, "b": 652.87334, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 110, "text": "24", "bbox": {"l": 536.0882, "t": 643.66034, "r": 547.15076, "b": 652.87334, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 151.19717, "t": 656.14021, "r": 173.35289, "b": 665.35321, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 111, "text": "3.6.4", "bbox": {"l": 151.19717, "t": 656.14021, "r": 173.35289, "b": 665.35321, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 178.89182, "t": 656.14021, "r": 530.53412, "b": 665.35321, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 112, "text": "Defining and creating row permissions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.89182, "t": 656.14021, "r": 530.53412, "b": 665.35321, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 114, "label": "text", "bbox": {"l": 536.073, "t": 656.14021, "r": 547.15088, "b": 665.35321, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 113, "text": "25", "bbox": {"l": 536.073, "t": 656.14021, "r": 547.15088, "b": 665.35321, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 115, "label": "text", "bbox": {"l": 151.19717, "t": 668.62009, "r": 173.35289, "b": 677.83309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 114, "text": "3.6.5", "bbox": {"l": 151.19717, "t": 668.62009, "r": 173.35289, "b": 677.83309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 116, "label": "text", "bbox": {"l": 178.89182, "t": 668.62009, "r": 339.45105, "b": 677.83309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 115, "text": "Defining and creating column masks", "bbox": {"l": 178.89182, "t": 668.62009, "r": 339.45105, "b": 677.83309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 117, "label": "text", "bbox": {"l": 344.98996, "t": 668.62009, "r": 530.54413, "b": 677.83309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 116, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 344.98996, "t": 668.62009, "r": 530.54413, "b": 677.83309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 118, "label": "text", "bbox": {"l": 536.08301, "t": 668.62009, "r": 547.16089, "b": 677.83309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 117, "text": "26", "bbox": {"l": 536.08301, "t": 668.62009, "r": 547.16089, "b": 677.83309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 119, "label": "text", "bbox": {"l": 151.19717, "t": 681.15973, "r": 173.38359, "b": 690.37273, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 118, "text": "3.6.6", "bbox": {"l": 151.19717, "t": 681.15973, "r": 173.38359, "b": 690.37273, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 120, "label": "text", "bbox": {"l": 178.93019, "t": 681.15973, "r": 530.54102, "b": 690.37273, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 119, "text": "Activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.93019, "t": 681.15973, "r": 530.54102, "b": 690.37273, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 121, "label": "text", "bbox": {"l": 536.08765, "t": 681.15973, "r": 547.18085, "b": 690.37273, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 120, "text": "28", "bbox": {"l": 536.08765, "t": 681.15973, "r": 547.18085, "b": 690.37273, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 122, "label": "text", "bbox": {"l": 151.19717, "t": 693.63961, "r": 173.32332, "b": 702.852615, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 121, "text": "3.6.7", "bbox": {"l": 151.19717, "t": 693.63961, "r": 173.32332, "b": 702.852615, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 123, "label": "text", "bbox": {"l": 178.85486, "t": 693.63961, "r": 350.80011, "b": 702.852615, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 122, "text": "Demonstrating data access with RCAC", "bbox": {"l": 178.85486, "t": 693.63961, "r": 350.80011, "b": 702.852615, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 124, "label": "text", "bbox": {"l": 356.33163, "t": 693.63961, "r": 530.57507, "b": 702.852615, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 123, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 356.33163, "t": 693.63961, "r": 530.57507, "b": 702.852615, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 125, "label": "text", "bbox": {"l": 536.10663, "t": 693.63961, "r": 547.16968, "b": 702.852615, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 124, "text": "29", "bbox": {"l": 536.10663, "t": 693.63961, "r": 547.16968, "b": 702.852615, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 126, "label": "text", "bbox": {"l": 151.19717, "t": 706.119492, "r": 173.44592, "b": 715.332497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 125, "text": "3.6.8", "bbox": {"l": 151.19717, "t": 706.119492, "r": 173.44592, "b": 715.332497, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 127, "label": "text", "bbox": {"l": 179.00812, "t": 706.119492, "r": 530.43628, "b": 715.332497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 126, "text": "Demonstrating data access with a view and RCAC . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 179.00812, "t": 706.119492, "r": 530.43628, "b": 715.332497, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 128, "label": "text", "bbox": {"l": 535.99847, "t": 706.119492, "r": 547.12286, "b": 715.332497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 127, "text": "32", "bbox": {"l": 535.99847, "t": 706.119492, "r": 547.12286, "b": 715.332497, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 43, "num_cols": 2, "table_cells": [{"bbox": {"l": 136.8, "t": 132.64862000000005, "r": 172.89404, "b": 141.86163, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Notices", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 175.01952, "t": 132.64862000000005, "r": 547.18982, "b": 141.86163, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vii", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79901, "t": 145.12847999999997, "r": 189.86537, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Trademarks", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 195.39685, "t": 145.12847999999997, "r": 547.18286, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . viii", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79901, "t": 167.62811, "r": 279.39731, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "DB2 for i Center of Excellence", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.61942, "t": 167.62811, "r": 547.1908, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ix", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79901, "t": 190.12775, "r": 172.84424, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Preface", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 175.01852, "t": 190.12775, "r": 547.18286, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79803, "t": 202.60760000000005, "r": 547.18085, "b": 211.82061999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Authors . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79803, "t": 215.14721999999995, "r": 339.18292, "b": 224.36023, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Now you can become a published author, too!", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 344.71411, "t": 215.14721999999995, "r": 547.13879, "b": 224.36023, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xiii", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79803, "t": 227.62707999999998, "r": 529.99506, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Comments welcome. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 535.5495, "t": 227.62707999999998, "r": 547.19788, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "xiii", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79807, "t": 240.10693000000003, "r": 284.02866, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Stay connected to IBM Redbooks", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.54449, "t": 240.10693000000003, "r": 547.12115, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xiv", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79807, "t": 262.60657000000003, "r": 536.09589, "b": 271.81958, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Chapter 1. Securing and protecting IBM DB2 data  . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.64685, "t": 262.60657000000003, "r": 547.19781, "b": 271.81958, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79808, "t": 274.60637999999994, "r": 549.84723, "b": 283.8194, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "1.1 Security fundamentals. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79807, "t": 287.14606000000003, "r": 536.12933, "b": 296.35904, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "1.2 Current state of IBM i security . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.66113, "t": 287.14606000000003, "r": 547.19287, "b": 296.35904, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79807, "t": 299.62595, "r": 549.84723, "b": 308.83893, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "1.3 DB2 for i security controls . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 312.1058300000001, "r": 536.05511, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "1.3.1 Existing row and column control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.6015, "t": 312.1058300000001, "r": 547.14795, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 324.64548, "r": 536.08008, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "1.3.2 New controls: Row and Column Access Control. . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.6355, "t": 324.64548, "r": 547.19092, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79704, "t": 347.14511, "r": 536.09088, "b": 356.35809, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 14, "end_row_offset_idx": 15, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Chapter 2. Roles and separation of duties . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.64282, "t": 347.14511, "r": 547.19476, "b": 356.35809, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 14, "end_row_offset_idx": 15, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79704, "t": 359.14493, "r": 536.12714, "b": 368.35791, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 15, "end_row_offset_idx": 16, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1 Roles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.66589, "t": 359.14493, "r": 547.20471, "b": 368.35791, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 15, "end_row_offset_idx": 16, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 371.62482, "r": 535.9527, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 16, "end_row_offset_idx": 17, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.1 DDM and DRDA application server access: QIBM_DB_DDMDRDA . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.55585, "t": 371.62482, "r": 547.15906, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 16, "end_row_offset_idx": 17, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 384.10470999999995, "r": 536.04108, "b": 393.31769, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 17, "end_row_offset_idx": 18, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.2 Toolbox application server access: QIBM_DB_ZDA. . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.59595, "t": 384.10470999999995, "r": 547.15082, "b": 393.31769, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 17, "end_row_offset_idx": 18, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 396.64435, "r": 536.07489, "b": 405.85733, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 18, "end_row_offset_idx": 19, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.3 Database Administrator function: QIBM_DB_SQLADM . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.63025, "t": 396.64435, "r": 547.18561, "b": 405.85733, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 18, "end_row_offset_idx": 19, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 409.12424000000004, "r": 411.27048, "b": 418.33722, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 19, "end_row_offset_idx": 20, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.4 Database Information function: QIBM_DB_SYSMON", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 416.81775, "t": 409.12424000000004, "r": 547.17865, "b": 418.33722, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 19, "end_row_offset_idx": 20, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . 9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 421.60413, "r": 536.03589, "b": 430.81711, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 20, "end_row_offset_idx": 21, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.5 Security Administrator function: QIBM_DB_SECADM . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.59894, "t": 421.60413, "r": 547.16193, "b": 430.81711, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 20, "end_row_offset_idx": 21, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 434.1437700000001, "r": 530.57318, "b": 443.35675, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 21, "end_row_offset_idx": 22, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.6 Change Function Usage CL command . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.10443, "t": 434.1437700000001, "r": 547.16687, "b": 443.35675, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 21, "end_row_offset_idx": 22, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "10", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 446.62366, "r": 530.53522, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 22, "end_row_offset_idx": 23, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.7 Verifying function usage IDs for RCAC with the FUNCTION_USAGE view . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.0755, "t": 446.62366, "r": 547.15601, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 22, "end_row_offset_idx": 23, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "10", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79704, "t": 459.10355, "r": 547.25659, "b": 468.31653, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 23, "end_row_offset_idx": 24, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.2 Separation of duties . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79703, "t": 481.60318, "r": 530.53961, "b": 490.81616, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 24, "end_row_offset_idx": 25, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Chapter 3. Row and Column Access Control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.09167, "t": 481.60318, "r": 547.1958, "b": 490.81616, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 24, "end_row_offset_idx": 25, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "13", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79703, "t": 493.603, "r": 530.4809, "b": 502.81598, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 25, "end_row_offset_idx": 26, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.1 Explanation of RCAC and the concept of access control . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.04248, "t": 493.603, "r": 547.16571, "b": 502.81598, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 25, "end_row_offset_idx": 26, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "14", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19719, "t": 506.14264, "r": 378.20786, "b": 515.35562, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 26, "end_row_offset_idx": 27, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.1.1 Row permission and column mask definitions", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 383.74713, "t": 506.14264, "r": 547.15576, "b": 515.35562, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 26, "end_row_offset_idx": 27, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . 14", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19719, "t": 518.62253, "r": 530.43475, "b": 527.83551, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 27, "end_row_offset_idx": 28, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.1.2 Enabling and activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 535.99622, "t": 518.62253, "r": 547.11908, "b": 527.83551, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 27, "end_row_offset_idx": 28, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "16", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79703, "t": 531.1621700000001, "r": 530.52808, "b": 540.37517, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 28, "end_row_offset_idx": 29, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.2 Special registers and built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.06702, "t": 531.1621700000001, "r": 547.14484, "b": 540.37517, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 28, "end_row_offset_idx": 29, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "18", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19719, "t": 543.64204, "r": 530.49786, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 29, "end_row_offset_idx": 30, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.2.1 Special registers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.05188, "t": 543.64204, "r": 547.15991, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 29, "end_row_offset_idx": 30, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "18", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19719, "t": 556.12192, "r": 530.56024, "b": 565.33492, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 30, "end_row_offset_idx": 31, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.2.2 Built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.09912, "t": 556.12192, "r": 547.17688, "b": 565.33492, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 30, "end_row_offset_idx": 31, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "19", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79703, "t": 568.66156, "r": 530.53027, "b": 577.87456, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 31, "end_row_offset_idx": 32, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.3 VERIFY_GROUP_FOR_USER function . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.06152, "t": 568.66156, "r": 547.12402, "b": 577.87456, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 31, "end_row_offset_idx": 32, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "20", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79703, "t": 581.14143, "r": 530.62994, "b": 590.35443, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 32, "end_row_offset_idx": 33, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.4 Establishing and controlling accessibility by using the RCAC rule text . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.16315, "t": 581.14143, "r": 547.22955, "b": 590.35443, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 32, "end_row_offset_idx": 33, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "21", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79701, "t": 593.62131, "r": 530.56512, "b": 615.37395, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 34, "end_row_offset_idx": 35, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.5 SELECT, INSERT, and UPDATE behavior with RCAC 3.6 Human resources example . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 400.32065, "t": 593.62131, "r": 530.48358, "b": 602.8343, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 33, "end_row_offset_idx": 34, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": ". . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.0224, "t": 593.62131, "r": 547.1001, "b": 602.8343, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 33, "end_row_offset_idx": 34, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "22", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.112, "t": 606.16095, "r": 547.20575, "b": 615.37395, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 34, "end_row_offset_idx": 35, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "22", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717, "t": 618.64082, "r": 530.49139, "b": 627.85382, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 35, "end_row_offset_idx": 36, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.1 Assigning the QIBM_DB_SECADM function ID to the consultants. . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.04633, "t": 618.64082, "r": 547.15619, "b": 627.85382, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 35, "end_row_offset_idx": 36, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "23", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717, "t": 631.1206999999999, "r": 530.56458, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 36, "end_row_offset_idx": 37, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.2 Creating group profiles for the users and their roles . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.09601, "t": 631.1206999999999, "r": 547.15875, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 36, "end_row_offset_idx": 37, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "23", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717, "t": 643.66034, "r": 530.55695, "b": 652.87334, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 37, "end_row_offset_idx": 38, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.3 Demonstrating data access without RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.0882, "t": 643.66034, "r": 547.15076, "b": 652.87334, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 37, "end_row_offset_idx": 38, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "24", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717, "t": 656.14021, "r": 530.53412, "b": 665.35321, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 38, "end_row_offset_idx": 39, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.4 Defining and creating row permissions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.073, "t": 656.14021, "r": 547.15088, "b": 665.35321, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 38, "end_row_offset_idx": 39, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "25", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717, "t": 668.62009, "r": 339.45105, "b": 677.83309, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 39, "end_row_offset_idx": 40, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.5 Defining and creating column masks", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 344.98996, "t": 668.62009, "r": 547.16089, "b": 677.83309, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 39, "end_row_offset_idx": 40, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717, "t": 681.15973, "r": 530.54102, "b": 690.37273, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 40, "end_row_offset_idx": 41, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.6 Activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.08765, "t": 681.15973, "r": 547.18085, "b": 690.37273, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 40, "end_row_offset_idx": 41, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "28", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717, "t": 693.63961, "r": 530.57507, "b": 702.852615, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 41, "end_row_offset_idx": 42, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.7 Demonstrating data access with RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.10663, "t": 693.63961, "r": 547.16968, "b": 702.852615, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 41, "end_row_offset_idx": 42, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "29", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717, "t": 706.119492, "r": 530.43628, "b": 715.332497, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 42, "end_row_offset_idx": 43, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.8 Demonstrating data access with a view and RCAC . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 535.99847, "t": 706.119492, "r": 547.12286, "b": 715.332497, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 42, "end_row_offset_idx": 43, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "32", "column_header": false, "row_header": false, "row_section": false}]}}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_footer", "id": 2, "page_no": 1, "cluster": {"id": 2, "label": "page_footer", "bbox": {"l": 64.800003, "t": 755.538002, "r": 257.24335, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9473597407341003, "cells": [{"id": 0, "text": "' Copyright IBM Corp. 2014. All rights reserved.", "bbox": {"l": 64.800003, "t": 755.538002, "r": 257.24335, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "' Copyright IBM Corp. 2014. All rights reserved."}, {"label": "page_footer", "id": 3, "page_no": 1, "cluster": {"id": 3, "label": "page_footer", "bbox": {"l": 538.85999, "t": 754.848721, "r": 547.25928, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.8926277160644531, "cells": [{"id": 1, "text": "iii", "bbox": {"l": 538.85999, "t": 754.848721, "r": 547.25928, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "iii"}, {"label": "section_header", "id": 1, "page_no": 1, "cluster": {"id": 1, "label": "section_header", "bbox": {"l": 64.800003, "t": 73.84802000000002, "r": 168.73441, "b": 96.04803000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9509142637252808, "cells": [{"id": 2, "text": "Contents", "bbox": {"l": 64.800003, "t": 73.84802000000002, "r": 168.73441, "b": 96.04803000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Contents"}, {"label": "document_index", "id": 0, "page_no": 1, "cluster": {"id": 0, "label": "document_index", "bbox": {"l": 136.1496124267578, "t": 132.0330352783203, "r": 547.5267944335938, "b": 715.6515502929688, "coord_origin": "TOPLEFT"}, "confidence": 0.9803681373596191, "cells": [{"id": 3, "text": "Notices", "bbox": {"l": 136.8, "t": 132.64862000000005, "r": 172.89404, "b": 141.86163, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vii", "bbox": {"l": 175.01952, "t": 132.64862000000005, "r": 547.18982, "b": 141.86163, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Trademarks", "bbox": {"l": 136.79901, "t": 145.12847999999997, "r": 189.86537, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 195.39685, "t": 145.12847999999997, "r": 530.05121, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "viii", "bbox": {"l": 535.5827, "t": 145.12847999999997, "r": 547.18286, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "DB2 for i Center of Excellence", "bbox": {"l": 136.79901, "t": 167.62811, "r": 279.39731, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ix", "bbox": {"l": 280.61942, "t": 167.62811, "r": 547.1908, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Preface", "bbox": {"l": 136.79901, "t": 190.12775, "r": 172.84424, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi", "bbox": {"l": 175.01852, "t": 190.12775, "r": 547.18286, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Authors . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi", "bbox": {"l": 136.79803, "t": 202.60760000000005, "r": 547.18085, "b": 211.82061999999996, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Now you can become a published author, too!", "bbox": {"l": 136.79803, "t": 215.14721999999995, "r": 339.18292, "b": 224.36023, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 344.71411, "t": 215.14721999999995, "r": 530.00812, "b": 224.36023, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "xiii", "bbox": {"l": 535.53925, "t": 215.14721999999995, "r": 547.13879, "b": 224.36023, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Comments welcome. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 136.79803, "t": 227.62707999999998, "r": 529.99506, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "xiii", "bbox": {"l": 535.5495, "t": 227.62707999999998, "r": 547.19788, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Stay connected to IBM Redbooks", "bbox": {"l": 136.79807, "t": 240.10693000000003, "r": 284.02866, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 289.54449, "t": 240.10693000000003, "r": 529.48242, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "xiv", "bbox": {"l": 534.99829, "t": 240.10693000000003, "r": 547.12115, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Chapter 1. Securing and protecting IBM DB2 data", "bbox": {"l": 136.79807, "t": 262.60657000000003, "r": 373.17566, "b": 271.81958, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 375.11798, "t": 262.60657000000003, "r": 536.09589, "b": 271.81958, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "1", "bbox": {"l": 541.64685, "t": 262.60657000000003, "r": 547.19781, "b": 271.81958, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "1.1", "bbox": {"l": 136.79808, "t": 274.60637999999994, "r": 150.88702, "b": 283.8194, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "Security fundamentals. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2", "bbox": {"l": 156.5226, "t": 274.60637999999994, "r": 549.84723, "b": 283.8194, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "1.2", "bbox": {"l": 136.79807, "t": 287.14606000000003, "r": 150.62746, "b": 296.35904, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Current state of IBM i security . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.15923, "t": 287.14606000000003, "r": 536.12933, "b": 296.35904, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "2", "bbox": {"l": 541.66113, "t": 287.14606000000003, "r": 547.19287, "b": 296.35904, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "1.3", "bbox": {"l": 136.79807, "t": 299.62595, "r": 150.84943, "b": 308.83893, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "DB2 for i security controls . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3", "bbox": {"l": 156.46996, "t": 299.62595, "r": 549.84723, "b": 308.83893, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "1.3.1", "bbox": {"l": 151.1972, "t": 312.1058300000001, "r": 173.38289, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Existing row and column control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.92932, "t": 312.1058300000001, "r": 536.05511, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "4", "bbox": {"l": 541.6015, "t": 312.1058300000001, "r": 547.14795, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "1.3.2", "bbox": {"l": 151.1972, "t": 324.64548, "r": 173.4189, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "New controls: Row and Column Access Control. . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.97432, "t": 324.64548, "r": 536.08008, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "5", "bbox": {"l": 541.6355, "t": 324.64548, "r": 547.19092, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "Chapter 2. Roles and separation of duties", "bbox": {"l": 136.79704, "t": 347.14511, "r": 336.82071, "b": 356.35809, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 338.99701, "t": 347.14511, "r": 536.09088, "b": 356.35809, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "7", "bbox": {"l": 541.64282, "t": 347.14511, "r": 547.19476, "b": 356.35809, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "2.1", "bbox": {"l": 136.79704, "t": 359.14493, "r": 150.644, "b": 368.35791, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Roles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.18277, "t": 359.14493, "r": 536.12714, "b": 368.35791, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "8", "bbox": {"l": 541.66589, "t": 359.14493, "r": 547.20471, "b": 368.35791, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "2.1.1", "bbox": {"l": 151.1972, "t": 371.62482, "r": 173.60995, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "DDM and DRDA application server access: QIBM_DB_DDMDRDA . . . . . . . . . . .", "bbox": {"l": 176.41154, "t": 371.62482, "r": 535.9527, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "8", "bbox": {"l": 541.55585, "t": 371.62482, "r": 547.15906, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "2.1.2", "bbox": {"l": 151.1972, "t": 384.10470999999995, "r": 173.41664, "b": 393.31769, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "Toolbox application server access: QIBM_DB_ZDA. . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.97151, "t": 384.10470999999995, "r": 536.04108, "b": 393.31769, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "8", "bbox": {"l": 541.59595, "t": 384.10470999999995, "r": 547.15082, "b": 393.31769, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "2.1.3", "bbox": {"l": 151.1972, "t": 396.64435, "r": 173.41859, "b": 405.85733, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Database Administrator function: QIBM_DB_SQLADM . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.97394, "t": 396.64435, "r": 536.07489, "b": 405.85733, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "9", "bbox": {"l": 541.63025, "t": 396.64435, "r": 547.18561, "b": 405.85733, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "2.1.4", "bbox": {"l": 151.1972, "t": 409.12424000000004, "r": 173.38629, "b": 418.33722, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Database Information function: QIBM_DB_SYSMON", "bbox": {"l": 178.93356, "t": 409.12424000000004, "r": 411.27048, "b": 418.33722, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": ". . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 416.81775, "t": 409.12424000000004, "r": 536.08411, "b": 418.33722, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "9", "bbox": {"l": 541.63135, "t": 409.12424000000004, "r": 547.17865, "b": 418.33722, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "2.1.5", "bbox": {"l": 151.1972, "t": 421.60413, "r": 173.44926, "b": 430.81711, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Security Administrator function: QIBM_DB_SECADM . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 179.01228, "t": 421.60413, "r": 536.03589, "b": 430.81711, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "9", "bbox": {"l": 541.59894, "t": 421.60413, "r": 547.16193, "b": 430.81711, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "2.1.6", "bbox": {"l": 151.1972, "t": 434.1437700000001, "r": 173.32208, "b": 443.35675, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Change Function Usage CL command . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.8533, "t": 434.1437700000001, "r": 530.57318, "b": 443.35675, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "10", "bbox": {"l": 536.10443, "t": 434.1437700000001, "r": 547.16687, "b": 443.35675, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "2.1.7", "bbox": {"l": 151.1972, "t": 446.62366, "r": 173.35822, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "Verifying function usage IDs for RCAC with the FUNCTION_USAGE view . . . . .", "bbox": {"l": 178.89848, "t": 446.62366, "r": 530.53522, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "10", "bbox": {"l": 536.0755, "t": 446.62366, "r": 547.15601, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "2.2", "bbox": {"l": 136.79704, "t": 459.10355, "r": 150.85457, "b": 468.31653, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "Separation of duties . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10", "bbox": {"l": 156.47758, "t": 459.10355, "r": 547.25659, "b": 468.31653, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "Chapter 3. Row and Column Access Control", "bbox": {"l": 136.79703, "t": 481.60318, "r": 348.68503, "b": 490.81616, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 350.09741, "t": 481.60318, "r": 530.53961, "b": 490.81616, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "13", "bbox": {"l": 536.09167, "t": 481.60318, "r": 547.1958, "b": 490.81616, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "3.1", "bbox": {"l": 136.79703, "t": 493.603, "r": 150.70105, "b": 502.81598, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Explanation of RCAC and the concept of access control . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.26266, "t": 493.603, "r": 530.4809, "b": 502.81598, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "14", "bbox": {"l": 536.04248, "t": 493.603, "r": 547.16571, "b": 502.81598, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "3.1.1", "bbox": {"l": 151.19719, "t": 506.14264, "r": 173.35429, "b": 515.35562, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "Row permission and column mask definitions", "bbox": {"l": 178.89357, "t": 506.14264, "r": 378.20786, "b": 515.35562, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 383.74713, "t": 506.14264, "r": 530.5379, "b": 515.35562, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "14", "bbox": {"l": 536.07721, "t": 506.14264, "r": 547.15576, "b": 515.35562, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "3.1.2", "bbox": {"l": 151.19719, "t": 518.62253, "r": 173.44292, "b": 527.83551, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "Enabling and activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 179.00435, "t": 518.62253, "r": 530.43475, "b": 527.83551, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "16", "bbox": {"l": 535.99622, "t": 518.62253, "r": 547.11908, "b": 527.83551, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "3.2", "bbox": {"l": 136.79703, "t": 531.1621700000001, "r": 150.64432, "b": 540.37517, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Special registers and built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.18323, "t": 531.1621700000001, "r": 530.52808, "b": 540.37517, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "18", "bbox": {"l": 536.06702, "t": 531.1621700000001, "r": 547.14484, "b": 540.37517, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "3.2.1", "bbox": {"l": 151.19719, "t": 543.64204, "r": 173.41321, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "Special registers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.96722, "t": 543.64204, "r": 530.49786, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "18", "bbox": {"l": 536.05188, "t": 543.64204, "r": 547.15991, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "3.2.2", "bbox": {"l": 151.19719, "t": 556.12192, "r": 173.35269, "b": 565.33492, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.89156, "t": 556.12192, "r": 530.56024, "b": 565.33492, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "19", "bbox": {"l": 536.09912, "t": 556.12192, "r": 547.17688, "b": 565.33492, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "3.3", "bbox": {"l": 136.79703, "t": 568.66156, "r": 150.62514, "b": 577.87456, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "VERIFY_GROUP_FOR_USER function . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.15639, "t": 568.66156, "r": 530.53027, "b": 577.87456, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "20", "bbox": {"l": 536.06152, "t": 568.66156, "r": 547.12402, "b": 577.87456, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "3.4", "bbox": {"l": 136.79703, "t": 581.14143, "r": 150.63004, "b": 590.35443, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "Establishing and controlling accessibility by using the RCAC rule text . . . . . . . . . . . . .", "bbox": {"l": 156.16325, "t": 581.14143, "r": 530.62994, "b": 590.35443, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "21", "bbox": {"l": 536.16315, "t": 581.14143, "r": 547.22955, "b": 590.35443, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "3.5", "bbox": {"l": 136.79701, "t": 593.62131, "r": 150.64413, "b": 602.8343, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "SELECT, INSERT, and UPDATE behavior with RCAC", "bbox": {"l": 156.18298, "t": 593.62131, "r": 394.7818, "b": 602.8343, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": ". . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 400.32065, "t": 593.62131, "r": 530.48358, "b": 602.8343, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "22", "bbox": {"l": 536.0224, "t": 593.62131, "r": 547.1001, "b": 602.8343, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "3.6", "bbox": {"l": 136.79701, "t": 606.16095, "r": 150.6642, "b": 615.37395, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "Human resources example . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.21107, "t": 606.16095, "r": 530.56512, "b": 615.37395, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "22", "bbox": {"l": 536.112, "t": 606.16095, "r": 547.20575, "b": 615.37395, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "3.6.1", "bbox": {"l": 151.19717, "t": 618.64082, "r": 173.41692, "b": 627.85382, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "Assigning the QIBM_DB_SECADM function ID to the consultants. . . . . . . . . . . .", "bbox": {"l": 178.97185, "t": 618.64082, "r": 530.49139, "b": 627.85382, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "23", "bbox": {"l": 536.04633, "t": 618.64082, "r": 547.15619, "b": 627.85382, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "3.6.2", "bbox": {"l": 151.19717, "t": 631.1206999999999, "r": 173.32271, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "Creating group profiles for the users and their roles . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.8541, "t": 631.1206999999999, "r": 530.56458, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "23", "bbox": {"l": 536.09601, "t": 631.1206999999999, "r": 547.15875, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "3.6.3", "bbox": {"l": 151.19717, "t": 643.66034, "r": 173.32227, "b": 652.87334, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "Demonstrating data access without RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.85353, "t": 643.66034, "r": 530.55695, "b": 652.87334, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "24", "bbox": {"l": 536.0882, "t": 643.66034, "r": 547.15076, "b": 652.87334, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "3.6.4", "bbox": {"l": 151.19717, "t": 656.14021, "r": 173.35289, "b": 665.35321, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "Defining and creating row permissions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.89182, "t": 656.14021, "r": 530.53412, "b": 665.35321, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "25", "bbox": {"l": 536.073, "t": 656.14021, "r": 547.15088, "b": 665.35321, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "3.6.5", "bbox": {"l": 151.19717, "t": 668.62009, "r": 173.35289, "b": 677.83309, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "Defining and creating column masks", "bbox": {"l": 178.89182, "t": 668.62009, "r": 339.45105, "b": 677.83309, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 344.98996, "t": 668.62009, "r": 530.54413, "b": 677.83309, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "26", "bbox": {"l": 536.08301, "t": 668.62009, "r": 547.16089, "b": 677.83309, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "3.6.6", "bbox": {"l": 151.19717, "t": 681.15973, "r": 173.38359, "b": 690.37273, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "Activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.93019, "t": 681.15973, "r": 530.54102, "b": 690.37273, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "28", "bbox": {"l": 536.08765, "t": 681.15973, "r": 547.18085, "b": 690.37273, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "3.6.7", "bbox": {"l": 151.19717, "t": 693.63961, "r": 173.32332, "b": 702.852615, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Demonstrating data access with RCAC", "bbox": {"l": 178.85486, "t": 693.63961, "r": 350.80011, "b": 702.852615, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 356.33163, "t": 693.63961, "r": 530.57507, "b": 702.852615, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "29", "bbox": {"l": 536.10663, "t": 693.63961, "r": 547.16968, "b": 702.852615, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "3.6.8", "bbox": {"l": 151.19717, "t": 706.119492, "r": 173.44592, "b": 715.332497, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "Demonstrating data access with a view and RCAC . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 179.00812, "t": 706.119492, "r": 530.43628, "b": 715.332497, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "32", "bbox": {"l": 535.99847, "t": 706.119492, "r": 547.12286, "b": 715.332497, "coord_origin": "TOPLEFT"}}], "children": [{"id": 4, "label": "text", "bbox": {"l": 136.8, "t": 132.64862000000005, "r": 172.89404, "b": 141.86163, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 3, "text": "Notices", "bbox": {"l": 136.8, "t": 132.64862000000005, "r": 172.89404, "b": 141.86163, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "text", "bbox": {"l": 175.01952, "t": 132.64862000000005, "r": 547.18982, "b": 141.86163, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 4, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vii", "bbox": {"l": 175.01952, "t": 132.64862000000005, "r": 547.18982, "b": 141.86163, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "text", "bbox": {"l": 136.79901, "t": 145.12847999999997, "r": 189.86537, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 5, "text": "Trademarks", "bbox": {"l": 136.79901, "t": 145.12847999999997, "r": 189.86537, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "text", "bbox": {"l": 195.39685, "t": 145.12847999999997, "r": 530.05121, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 195.39685, "t": 145.12847999999997, "r": 530.05121, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "text", "bbox": {"l": 535.5827, "t": 145.12847999999997, "r": 547.18286, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "viii", "bbox": {"l": 535.5827, "t": 145.12847999999997, "r": 547.18286, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 136.79901, "t": 167.62811, "r": 279.39731, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "DB2 for i Center of Excellence", "bbox": {"l": 136.79901, "t": 167.62811, "r": 279.39731, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "text", "bbox": {"l": 280.61942, "t": 167.62811, "r": 547.1908, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ix", "bbox": {"l": 280.61942, "t": 167.62811, "r": 547.1908, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 136.79901, "t": 190.12775, "r": 172.84424, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "Preface", "bbox": {"l": 136.79901, "t": 190.12775, "r": 172.84424, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 175.01852, "t": 190.12775, "r": 547.18286, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi", "bbox": {"l": 175.01852, "t": 190.12775, "r": 547.18286, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 136.79803, "t": 202.60760000000005, "r": 547.18085, "b": 211.82061999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "Authors . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi", "bbox": {"l": 136.79803, "t": 202.60760000000005, "r": 547.18085, "b": 211.82061999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 136.79803, "t": 215.14721999999995, "r": 339.18292, "b": 224.36023, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "Now you can become a published author, too!", "bbox": {"l": 136.79803, "t": 215.14721999999995, "r": 339.18292, "b": 224.36023, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 344.71411, "t": 215.14721999999995, "r": 530.00812, "b": 224.36023, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 344.71411, "t": 215.14721999999995, "r": 530.00812, "b": 224.36023, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 535.53925, "t": 215.14721999999995, "r": 547.13879, "b": 224.36023, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "xiii", "bbox": {"l": 535.53925, "t": 215.14721999999995, "r": 547.13879, "b": 224.36023, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 136.79803, "t": 227.62707999999998, "r": 529.99506, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "Comments welcome. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 136.79803, "t": 227.62707999999998, "r": 529.99506, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 535.5495, "t": 227.62707999999998, "r": 547.19788, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "xiii", "bbox": {"l": 535.5495, "t": 227.62707999999998, "r": 547.19788, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 136.79807, "t": 240.10693000000003, "r": 284.02866, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "Stay connected to IBM Redbooks", "bbox": {"l": 136.79807, "t": 240.10693000000003, "r": 284.02866, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 289.54449, "t": 240.10693000000003, "r": 529.48242, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 289.54449, "t": 240.10693000000003, "r": 529.48242, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 534.99829, "t": 240.10693000000003, "r": 547.12115, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "xiv", "bbox": {"l": 534.99829, "t": 240.10693000000003, "r": 547.12115, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 136.79807, "t": 262.60657000000003, "r": 373.17566, "b": 271.81958, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "Chapter 1. Securing and protecting IBM DB2 data", "bbox": {"l": 136.79807, "t": 262.60657000000003, "r": 373.17566, "b": 271.81958, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 375.11798, "t": 262.60657000000003, "r": 536.09589, "b": 271.81958, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 375.11798, "t": 262.60657000000003, "r": 536.09589, "b": 271.81958, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 541.64685, "t": 262.60657000000003, "r": 547.19781, "b": 271.81958, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "1", "bbox": {"l": 541.64685, "t": 262.60657000000003, "r": 547.19781, "b": 271.81958, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 136.79808, "t": 274.60637999999994, "r": 150.88702, "b": 283.8194, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "1.1", "bbox": {"l": 136.79808, "t": 274.60637999999994, "r": 150.88702, "b": 283.8194, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 156.5226, "t": 274.60637999999994, "r": 549.84723, "b": 283.8194, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "Security fundamentals. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2", "bbox": {"l": 156.5226, "t": 274.60637999999994, "r": 549.84723, "b": 283.8194, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 136.79807, "t": 287.14606000000003, "r": 150.62746, "b": 296.35904, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "1.2", "bbox": {"l": 136.79807, "t": 287.14606000000003, "r": 150.62746, "b": 296.35904, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 156.15923, "t": 287.14606000000003, "r": 536.12933, "b": 296.35904, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "Current state of IBM i security . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.15923, "t": 287.14606000000003, "r": 536.12933, "b": 296.35904, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 541.66113, "t": 287.14606000000003, "r": 547.19287, "b": 296.35904, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "2", "bbox": {"l": 541.66113, "t": 287.14606000000003, "r": 547.19287, "b": 296.35904, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 136.79807, "t": 299.62595, "r": 150.84943, "b": 308.83893, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "1.3", "bbox": {"l": 136.79807, "t": 299.62595, "r": 150.84943, "b": 308.83893, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 156.46996, "t": 299.62595, "r": 549.84723, "b": 308.83893, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "DB2 for i security controls . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3", "bbox": {"l": 156.46996, "t": 299.62595, "r": 549.84723, "b": 308.83893, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 151.1972, "t": 312.1058300000001, "r": 173.38289, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "1.3.1", "bbox": {"l": 151.1972, "t": 312.1058300000001, "r": 173.38289, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 178.92932, "t": 312.1058300000001, "r": 536.05511, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "Existing row and column control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.92932, "t": 312.1058300000001, "r": 536.05511, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 541.6015, "t": 312.1058300000001, "r": 547.14795, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "4", "bbox": {"l": 541.6015, "t": 312.1058300000001, "r": 547.14795, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 151.1972, "t": 324.64548, "r": 173.4189, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "1.3.2", "bbox": {"l": 151.1972, "t": 324.64548, "r": 173.4189, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 178.97432, "t": 324.64548, "r": 536.08008, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "New controls: Row and Column Access Control. . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.97432, "t": 324.64548, "r": 536.08008, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 541.6355, "t": 324.64548, "r": 547.19092, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "5", "bbox": {"l": 541.6355, "t": 324.64548, "r": 547.19092, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 136.79704, "t": 347.14511, "r": 336.82071, "b": 356.35809, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "Chapter 2. Roles and separation of duties", "bbox": {"l": 136.79704, "t": 347.14511, "r": 336.82071, "b": 356.35809, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 338.99701, "t": 347.14511, "r": 536.09088, "b": 356.35809, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 338.99701, "t": 347.14511, "r": 536.09088, "b": 356.35809, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 541.64282, "t": 347.14511, "r": 547.19476, "b": 356.35809, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "7", "bbox": {"l": 541.64282, "t": 347.14511, "r": 547.19476, "b": 356.35809, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 136.79704, "t": 359.14493, "r": 150.644, "b": 368.35791, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "2.1", "bbox": {"l": 136.79704, "t": 359.14493, "r": 150.644, "b": 368.35791, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 156.18277, "t": 359.14493, "r": 536.12714, "b": 368.35791, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "Roles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.18277, "t": 359.14493, "r": 536.12714, "b": 368.35791, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 541.66589, "t": 359.14493, "r": 547.20471, "b": 368.35791, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "8", "bbox": {"l": 541.66589, "t": 359.14493, "r": 547.20471, "b": 368.35791, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 151.1972, "t": 371.62482, "r": 173.60995, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "2.1.1", "bbox": {"l": 151.1972, "t": 371.62482, "r": 173.60995, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 176.41154, "t": 371.62482, "r": 535.9527, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "DDM and DRDA application server access: QIBM_DB_DDMDRDA . . . . . . . . . . .", "bbox": {"l": 176.41154, "t": 371.62482, "r": 535.9527, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 541.55585, "t": 371.62482, "r": 547.15906, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "8", "bbox": {"l": 541.55585, "t": 371.62482, "r": 547.15906, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 151.1972, "t": 384.10470999999995, "r": 173.41664, "b": 393.31769, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "2.1.2", "bbox": {"l": 151.1972, "t": 384.10470999999995, "r": 173.41664, "b": 393.31769, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 178.97151, "t": 384.10470999999995, "r": 536.04108, "b": 393.31769, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "Toolbox application server access: QIBM_DB_ZDA. . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.97151, "t": 384.10470999999995, "r": 536.04108, "b": 393.31769, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 541.59595, "t": 384.10470999999995, "r": 547.15082, "b": 393.31769, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "8", "bbox": {"l": 541.59595, "t": 384.10470999999995, "r": 547.15082, "b": 393.31769, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 151.1972, "t": 396.64435, "r": 173.41859, "b": 405.85733, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "2.1.3", "bbox": {"l": 151.1972, "t": 396.64435, "r": 173.41859, "b": 405.85733, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 178.97394, "t": 396.64435, "r": 536.07489, "b": 405.85733, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "Database Administrator function: QIBM_DB_SQLADM . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.97394, "t": 396.64435, "r": 536.07489, "b": 405.85733, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 541.63025, "t": 396.64435, "r": 547.18561, "b": 405.85733, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "9", "bbox": {"l": 541.63025, "t": 396.64435, "r": 547.18561, "b": 405.85733, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 151.1972, "t": 409.12424000000004, "r": 173.38629, "b": 418.33722, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "2.1.4", "bbox": {"l": 151.1972, "t": 409.12424000000004, "r": 173.38629, "b": 418.33722, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 178.93356, "t": 409.12424000000004, "r": 411.27048, "b": 418.33722, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "Database Information function: QIBM_DB_SYSMON", "bbox": {"l": 178.93356, "t": 409.12424000000004, "r": 411.27048, "b": 418.33722, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 416.81775, "t": 409.12424000000004, "r": 536.08411, "b": 418.33722, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": ". . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 416.81775, "t": 409.12424000000004, "r": 536.08411, "b": 418.33722, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 541.63135, "t": 409.12424000000004, "r": 547.17865, "b": 418.33722, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "9", "bbox": {"l": 541.63135, "t": 409.12424000000004, "r": 547.17865, "b": 418.33722, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 151.1972, "t": 421.60413, "r": 173.44926, "b": 430.81711, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "2.1.5", "bbox": {"l": 151.1972, "t": 421.60413, "r": 173.44926, "b": 430.81711, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 179.01228, "t": 421.60413, "r": 536.03589, "b": 430.81711, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "Security Administrator function: QIBM_DB_SECADM . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 179.01228, "t": 421.60413, "r": 536.03589, "b": 430.81711, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 541.59894, "t": 421.60413, "r": 547.16193, "b": 430.81711, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "9", "bbox": {"l": 541.59894, "t": 421.60413, "r": 547.16193, "b": 430.81711, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 151.1972, "t": 434.1437700000001, "r": 173.32208, "b": 443.35675, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "2.1.6", "bbox": {"l": 151.1972, "t": 434.1437700000001, "r": 173.32208, "b": 443.35675, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 178.8533, "t": 434.1437700000001, "r": 530.57318, "b": 443.35675, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "Change Function Usage CL command . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.8533, "t": 434.1437700000001, "r": 530.57318, "b": 443.35675, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 536.10443, "t": 434.1437700000001, "r": 547.16687, "b": 443.35675, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "10", "bbox": {"l": 536.10443, "t": 434.1437700000001, "r": 547.16687, "b": 443.35675, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 151.1972, "t": 446.62366, "r": 173.35822, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "2.1.7", "bbox": {"l": 151.1972, "t": 446.62366, "r": 173.35822, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 178.89848, "t": 446.62366, "r": 530.53522, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "Verifying function usage IDs for RCAC with the FUNCTION_USAGE view . . . . .", "bbox": {"l": 178.89848, "t": 446.62366, "r": 530.53522, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 536.0755, "t": 446.62366, "r": 547.15601, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "10", "bbox": {"l": 536.0755, "t": 446.62366, "r": 547.15601, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 136.79704, "t": 459.10355, "r": 150.85457, "b": 468.31653, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "2.2", "bbox": {"l": 136.79704, "t": 459.10355, "r": 150.85457, "b": 468.31653, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 156.47758, "t": 459.10355, "r": 547.25659, "b": 468.31653, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "Separation of duties . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10", "bbox": {"l": 156.47758, "t": 459.10355, "r": 547.25659, "b": 468.31653, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 136.79703, "t": 481.60318, "r": 348.68503, "b": 490.81616, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "Chapter 3. Row and Column Access Control", "bbox": {"l": 136.79703, "t": 481.60318, "r": 348.68503, "b": 490.81616, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 350.09741, "t": 481.60318, "r": 530.53961, "b": 490.81616, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 350.09741, "t": 481.60318, "r": 530.53961, "b": 490.81616, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 536.09167, "t": 481.60318, "r": 547.1958, "b": 490.81616, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "13", "bbox": {"l": 536.09167, "t": 481.60318, "r": 547.1958, "b": 490.81616, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 136.79703, "t": 493.603, "r": 150.70105, "b": 502.81598, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "3.1", "bbox": {"l": 136.79703, "t": 493.603, "r": 150.70105, "b": 502.81598, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 156.26266, "t": 493.603, "r": 530.4809, "b": 502.81598, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "Explanation of RCAC and the concept of access control . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.26266, "t": 493.603, "r": 530.4809, "b": 502.81598, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 536.04248, "t": 493.603, "r": 547.16571, "b": 502.81598, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "14", "bbox": {"l": 536.04248, "t": 493.603, "r": 547.16571, "b": 502.81598, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 151.19719, "t": 506.14264, "r": 173.35429, "b": 515.35562, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "3.1.1", "bbox": {"l": 151.19719, "t": 506.14264, "r": 173.35429, "b": 515.35562, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 178.89357, "t": 506.14264, "r": 378.20786, "b": 515.35562, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "Row permission and column mask definitions", "bbox": {"l": 178.89357, "t": 506.14264, "r": 378.20786, "b": 515.35562, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 383.74713, "t": 506.14264, "r": 530.5379, "b": 515.35562, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 383.74713, "t": 506.14264, "r": 530.5379, "b": 515.35562, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 536.07721, "t": 506.14264, "r": 547.15576, "b": 515.35562, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "14", "bbox": {"l": 536.07721, "t": 506.14264, "r": 547.15576, "b": 515.35562, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 151.19719, "t": 518.62253, "r": 173.44292, "b": 527.83551, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "3.1.2", "bbox": {"l": 151.19719, "t": 518.62253, "r": 173.44292, "b": 527.83551, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 179.00435, "t": 518.62253, "r": 530.43475, "b": 527.83551, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "Enabling and activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 179.00435, "t": 518.62253, "r": 530.43475, "b": 527.83551, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 535.99622, "t": 518.62253, "r": 547.11908, "b": 527.83551, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "16", "bbox": {"l": 535.99622, "t": 518.62253, "r": 547.11908, "b": 527.83551, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 136.79703, "t": 531.1621700000001, "r": 150.64432, "b": 540.37517, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "3.2", "bbox": {"l": 136.79703, "t": 531.1621700000001, "r": 150.64432, "b": 540.37517, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 156.18323, "t": 531.1621700000001, "r": 530.52808, "b": 540.37517, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "Special registers and built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.18323, "t": 531.1621700000001, "r": 530.52808, "b": 540.37517, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 536.06702, "t": 531.1621700000001, "r": 547.14484, "b": 540.37517, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "18", "bbox": {"l": 536.06702, "t": 531.1621700000001, "r": 547.14484, "b": 540.37517, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 151.19719, "t": 543.64204, "r": 173.41321, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "3.2.1", "bbox": {"l": 151.19719, "t": 543.64204, "r": 173.41321, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 178.96722, "t": 543.64204, "r": 530.49786, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "Special registers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.96722, "t": 543.64204, "r": 530.49786, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 536.05188, "t": 543.64204, "r": 547.15991, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "18", "bbox": {"l": 536.05188, "t": 543.64204, "r": 547.15991, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 151.19719, "t": 556.12192, "r": 173.35269, "b": 565.33492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "3.2.2", "bbox": {"l": 151.19719, "t": 556.12192, "r": 173.35269, "b": 565.33492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 178.89156, "t": 556.12192, "r": 530.56024, "b": 565.33492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "Built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.89156, "t": 556.12192, "r": 530.56024, "b": 565.33492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 536.09912, "t": 556.12192, "r": 547.17688, "b": 565.33492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "19", "bbox": {"l": 536.09912, "t": 556.12192, "r": 547.17688, "b": 565.33492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 136.79703, "t": 568.66156, "r": 150.62514, "b": 577.87456, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "3.3", "bbox": {"l": 136.79703, "t": 568.66156, "r": 150.62514, "b": 577.87456, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 156.15639, "t": 568.66156, "r": 530.53027, "b": 577.87456, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "VERIFY_GROUP_FOR_USER function . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.15639, "t": 568.66156, "r": 530.53027, "b": 577.87456, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 536.06152, "t": 568.66156, "r": 547.12402, "b": 577.87456, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "20", "bbox": {"l": 536.06152, "t": 568.66156, "r": 547.12402, "b": 577.87456, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 136.79703, "t": 581.14143, "r": 150.63004, "b": 590.35443, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "3.4", "bbox": {"l": 136.79703, "t": 581.14143, "r": 150.63004, "b": 590.35443, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 156.16325, "t": 581.14143, "r": 530.62994, "b": 590.35443, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "Establishing and controlling accessibility by using the RCAC rule text . . . . . . . . . . . . .", "bbox": {"l": 156.16325, "t": 581.14143, "r": 530.62994, "b": 590.35443, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 536.16315, "t": 581.14143, "r": 547.22955, "b": 590.35443, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "21", "bbox": {"l": 536.16315, "t": 581.14143, "r": 547.22955, "b": 590.35443, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 136.79701, "t": 593.62131, "r": 150.64413, "b": 602.8343, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "3.5", "bbox": {"l": 136.79701, "t": 593.62131, "r": 150.64413, "b": 602.8343, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 156.18298, "t": 593.62131, "r": 394.7818, "b": 602.8343, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "SELECT, INSERT, and UPDATE behavior with RCAC", "bbox": {"l": 156.18298, "t": 593.62131, "r": 394.7818, "b": 602.8343, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 400.32065, "t": 593.62131, "r": 530.48358, "b": 602.8343, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": ". . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 400.32065, "t": 593.62131, "r": 530.48358, "b": 602.8343, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 536.0224, "t": 593.62131, "r": 547.1001, "b": 602.8343, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "22", "bbox": {"l": 536.0224, "t": 593.62131, "r": 547.1001, "b": 602.8343, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 136.79701, "t": 606.16095, "r": 150.6642, "b": 615.37395, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "3.6", "bbox": {"l": 136.79701, "t": 606.16095, "r": 150.6642, "b": 615.37395, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 156.21107, "t": 606.16095, "r": 530.56512, "b": 615.37395, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "Human resources example . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.21107, "t": 606.16095, "r": 530.56512, "b": 615.37395, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 536.112, "t": 606.16095, "r": 547.20575, "b": 615.37395, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "22", "bbox": {"l": 536.112, "t": 606.16095, "r": 547.20575, "b": 615.37395, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 151.19717, "t": 618.64082, "r": 173.41692, "b": 627.85382, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "3.6.1", "bbox": {"l": 151.19717, "t": 618.64082, "r": 173.41692, "b": 627.85382, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 178.97185, "t": 618.64082, "r": 530.49139, "b": 627.85382, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": "Assigning the QIBM_DB_SECADM function ID to the consultants. . . . . . . . . . . .", "bbox": {"l": 178.97185, "t": 618.64082, "r": 530.49139, "b": 627.85382, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 536.04633, "t": 618.64082, "r": 547.15619, "b": 627.85382, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "23", "bbox": {"l": 536.04633, "t": 618.64082, "r": 547.15619, "b": 627.85382, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 151.19717, "t": 631.1206999999999, "r": 173.32271, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "3.6.2", "bbox": {"l": 151.19717, "t": 631.1206999999999, "r": 173.32271, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 178.8541, "t": 631.1206999999999, "r": 530.56458, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": "Creating group profiles for the users and their roles . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.8541, "t": 631.1206999999999, "r": 530.56458, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 536.09601, "t": 631.1206999999999, "r": 547.15875, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 107, "text": "23", "bbox": {"l": 536.09601, "t": 631.1206999999999, "r": 547.15875, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 151.19717, "t": 643.66034, "r": 173.32227, "b": 652.87334, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 108, "text": "3.6.3", "bbox": {"l": 151.19717, "t": 643.66034, "r": 173.32227, "b": 652.87334, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 178.85353, "t": 643.66034, "r": 530.55695, "b": 652.87334, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 109, "text": "Demonstrating data access without RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.85353, "t": 643.66034, "r": 530.55695, "b": 652.87334, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 536.0882, "t": 643.66034, "r": 547.15076, "b": 652.87334, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 110, "text": "24", "bbox": {"l": 536.0882, "t": 643.66034, "r": 547.15076, "b": 652.87334, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 151.19717, "t": 656.14021, "r": 173.35289, "b": 665.35321, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 111, "text": "3.6.4", "bbox": {"l": 151.19717, "t": 656.14021, "r": 173.35289, "b": 665.35321, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 178.89182, "t": 656.14021, "r": 530.53412, "b": 665.35321, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 112, "text": "Defining and creating row permissions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.89182, "t": 656.14021, "r": 530.53412, "b": 665.35321, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 114, "label": "text", "bbox": {"l": 536.073, "t": 656.14021, "r": 547.15088, "b": 665.35321, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 113, "text": "25", "bbox": {"l": 536.073, "t": 656.14021, "r": 547.15088, "b": 665.35321, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 115, "label": "text", "bbox": {"l": 151.19717, "t": 668.62009, "r": 173.35289, "b": 677.83309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 114, "text": "3.6.5", "bbox": {"l": 151.19717, "t": 668.62009, "r": 173.35289, "b": 677.83309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 116, "label": "text", "bbox": {"l": 178.89182, "t": 668.62009, "r": 339.45105, "b": 677.83309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 115, "text": "Defining and creating column masks", "bbox": {"l": 178.89182, "t": 668.62009, "r": 339.45105, "b": 677.83309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 117, "label": "text", "bbox": {"l": 344.98996, "t": 668.62009, "r": 530.54413, "b": 677.83309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 116, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 344.98996, "t": 668.62009, "r": 530.54413, "b": 677.83309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 118, "label": "text", "bbox": {"l": 536.08301, "t": 668.62009, "r": 547.16089, "b": 677.83309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 117, "text": "26", "bbox": {"l": 536.08301, "t": 668.62009, "r": 547.16089, "b": 677.83309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 119, "label": "text", "bbox": {"l": 151.19717, "t": 681.15973, "r": 173.38359, "b": 690.37273, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 118, "text": "3.6.6", "bbox": {"l": 151.19717, "t": 681.15973, "r": 173.38359, "b": 690.37273, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 120, "label": "text", "bbox": {"l": 178.93019, "t": 681.15973, "r": 530.54102, "b": 690.37273, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 119, "text": "Activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.93019, "t": 681.15973, "r": 530.54102, "b": 690.37273, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 121, "label": "text", "bbox": {"l": 536.08765, "t": 681.15973, "r": 547.18085, "b": 690.37273, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 120, "text": "28", "bbox": {"l": 536.08765, "t": 681.15973, "r": 547.18085, "b": 690.37273, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 122, "label": "text", "bbox": {"l": 151.19717, "t": 693.63961, "r": 173.32332, "b": 702.852615, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 121, "text": "3.6.7", "bbox": {"l": 151.19717, "t": 693.63961, "r": 173.32332, "b": 702.852615, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 123, "label": "text", "bbox": {"l": 178.85486, "t": 693.63961, "r": 350.80011, "b": 702.852615, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 122, "text": "Demonstrating data access with RCAC", "bbox": {"l": 178.85486, "t": 693.63961, "r": 350.80011, "b": 702.852615, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 124, "label": "text", "bbox": {"l": 356.33163, "t": 693.63961, "r": 530.57507, "b": 702.852615, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 123, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 356.33163, "t": 693.63961, "r": 530.57507, "b": 702.852615, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 125, "label": "text", "bbox": {"l": 536.10663, "t": 693.63961, "r": 547.16968, "b": 702.852615, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 124, "text": "29", "bbox": {"l": 536.10663, "t": 693.63961, "r": 547.16968, "b": 702.852615, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 126, "label": "text", "bbox": {"l": 151.19717, "t": 706.119492, "r": 173.44592, "b": 715.332497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 125, "text": "3.6.8", "bbox": {"l": 151.19717, "t": 706.119492, "r": 173.44592, "b": 715.332497, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 127, "label": "text", "bbox": {"l": 179.00812, "t": 706.119492, "r": 530.43628, "b": 715.332497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 126, "text": "Demonstrating data access with a view and RCAC . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 179.00812, "t": 706.119492, "r": 530.43628, "b": 715.332497, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 128, "label": "text", "bbox": {"l": 535.99847, "t": 706.119492, "r": 547.12286, "b": 715.332497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 127, "text": "32", "bbox": {"l": 535.99847, "t": 706.119492, "r": 547.12286, "b": 715.332497, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 43, "num_cols": 2, "table_cells": [{"bbox": {"l": 136.8, "t": 132.64862000000005, "r": 172.89404, "b": 141.86163, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Notices", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 175.01952, "t": 132.64862000000005, "r": 547.18982, "b": 141.86163, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vii", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79901, "t": 145.12847999999997, "r": 189.86537, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Trademarks", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 195.39685, "t": 145.12847999999997, "r": 547.18286, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . viii", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79901, "t": 167.62811, "r": 279.39731, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "DB2 for i Center of Excellence", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.61942, "t": 167.62811, "r": 547.1908, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ix", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79901, "t": 190.12775, "r": 172.84424, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Preface", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 175.01852, "t": 190.12775, "r": 547.18286, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79803, "t": 202.60760000000005, "r": 547.18085, "b": 211.82061999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Authors . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79803, "t": 215.14721999999995, "r": 339.18292, "b": 224.36023, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Now you can become a published author, too!", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 344.71411, "t": 215.14721999999995, "r": 547.13879, "b": 224.36023, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xiii", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79803, "t": 227.62707999999998, "r": 529.99506, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Comments welcome. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 535.5495, "t": 227.62707999999998, "r": 547.19788, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "xiii", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79807, "t": 240.10693000000003, "r": 284.02866, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Stay connected to IBM Redbooks", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.54449, "t": 240.10693000000003, "r": 547.12115, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xiv", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79807, "t": 262.60657000000003, "r": 536.09589, "b": 271.81958, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Chapter 1. Securing and protecting IBM DB2 data  . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.64685, "t": 262.60657000000003, "r": 547.19781, "b": 271.81958, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79808, "t": 274.60637999999994, "r": 549.84723, "b": 283.8194, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "1.1 Security fundamentals. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79807, "t": 287.14606000000003, "r": 536.12933, "b": 296.35904, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "1.2 Current state of IBM i security . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.66113, "t": 287.14606000000003, "r": 547.19287, "b": 296.35904, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79807, "t": 299.62595, "r": 549.84723, "b": 308.83893, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "1.3 DB2 for i security controls . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 312.1058300000001, "r": 536.05511, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "1.3.1 Existing row and column control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.6015, "t": 312.1058300000001, "r": 547.14795, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 324.64548, "r": 536.08008, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "1.3.2 New controls: Row and Column Access Control. . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.6355, "t": 324.64548, "r": 547.19092, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79704, "t": 347.14511, "r": 536.09088, "b": 356.35809, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 14, "end_row_offset_idx": 15, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Chapter 2. Roles and separation of duties . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.64282, "t": 347.14511, "r": 547.19476, "b": 356.35809, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 14, "end_row_offset_idx": 15, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79704, "t": 359.14493, "r": 536.12714, "b": 368.35791, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 15, "end_row_offset_idx": 16, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1 Roles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.66589, "t": 359.14493, "r": 547.20471, "b": 368.35791, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 15, "end_row_offset_idx": 16, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 371.62482, "r": 535.9527, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 16, "end_row_offset_idx": 17, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.1 DDM and DRDA application server access: QIBM_DB_DDMDRDA . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.55585, "t": 371.62482, "r": 547.15906, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 16, "end_row_offset_idx": 17, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 384.10470999999995, "r": 536.04108, "b": 393.31769, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 17, "end_row_offset_idx": 18, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.2 Toolbox application server access: QIBM_DB_ZDA. . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.59595, "t": 384.10470999999995, "r": 547.15082, "b": 393.31769, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 17, "end_row_offset_idx": 18, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 396.64435, "r": 536.07489, "b": 405.85733, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 18, "end_row_offset_idx": 19, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.3 Database Administrator function: QIBM_DB_SQLADM . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.63025, "t": 396.64435, "r": 547.18561, "b": 405.85733, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 18, "end_row_offset_idx": 19, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 409.12424000000004, "r": 411.27048, "b": 418.33722, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 19, "end_row_offset_idx": 20, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.4 Database Information function: QIBM_DB_SYSMON", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 416.81775, "t": 409.12424000000004, "r": 547.17865, "b": 418.33722, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 19, "end_row_offset_idx": 20, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . 9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 421.60413, "r": 536.03589, "b": 430.81711, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 20, "end_row_offset_idx": 21, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.5 Security Administrator function: QIBM_DB_SECADM . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.59894, "t": 421.60413, "r": 547.16193, "b": 430.81711, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 20, "end_row_offset_idx": 21, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 434.1437700000001, "r": 530.57318, "b": 443.35675, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 21, "end_row_offset_idx": 22, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.6 Change Function Usage CL command . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.10443, "t": 434.1437700000001, "r": 547.16687, "b": 443.35675, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 21, "end_row_offset_idx": 22, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "10", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 446.62366, "r": 530.53522, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 22, "end_row_offset_idx": 23, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.7 Verifying function usage IDs for RCAC with the FUNCTION_USAGE view . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.0755, "t": 446.62366, "r": 547.15601, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 22, "end_row_offset_idx": 23, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "10", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79704, "t": 459.10355, "r": 547.25659, "b": 468.31653, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 23, "end_row_offset_idx": 24, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.2 Separation of duties . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79703, "t": 481.60318, "r": 530.53961, "b": 490.81616, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 24, "end_row_offset_idx": 25, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Chapter 3. Row and Column Access Control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.09167, "t": 481.60318, "r": 547.1958, "b": 490.81616, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 24, "end_row_offset_idx": 25, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "13", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79703, "t": 493.603, "r": 530.4809, "b": 502.81598, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 25, "end_row_offset_idx": 26, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.1 Explanation of RCAC and the concept of access control . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.04248, "t": 493.603, "r": 547.16571, "b": 502.81598, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 25, "end_row_offset_idx": 26, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "14", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19719, "t": 506.14264, "r": 378.20786, "b": 515.35562, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 26, "end_row_offset_idx": 27, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.1.1 Row permission and column mask definitions", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 383.74713, "t": 506.14264, "r": 547.15576, "b": 515.35562, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 26, "end_row_offset_idx": 27, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . 14", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19719, "t": 518.62253, "r": 530.43475, "b": 527.83551, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 27, "end_row_offset_idx": 28, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.1.2 Enabling and activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 535.99622, "t": 518.62253, "r": 547.11908, "b": 527.83551, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 27, "end_row_offset_idx": 28, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "16", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79703, "t": 531.1621700000001, "r": 530.52808, "b": 540.37517, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 28, "end_row_offset_idx": 29, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.2 Special registers and built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.06702, "t": 531.1621700000001, "r": 547.14484, "b": 540.37517, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 28, "end_row_offset_idx": 29, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "18", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19719, "t": 543.64204, "r": 530.49786, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 29, "end_row_offset_idx": 30, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.2.1 Special registers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.05188, "t": 543.64204, "r": 547.15991, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 29, "end_row_offset_idx": 30, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "18", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19719, "t": 556.12192, "r": 530.56024, "b": 565.33492, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 30, "end_row_offset_idx": 31, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.2.2 Built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.09912, "t": 556.12192, "r": 547.17688, "b": 565.33492, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 30, "end_row_offset_idx": 31, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "19", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79703, "t": 568.66156, "r": 530.53027, "b": 577.87456, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 31, "end_row_offset_idx": 32, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.3 VERIFY_GROUP_FOR_USER function . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.06152, "t": 568.66156, "r": 547.12402, "b": 577.87456, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 31, "end_row_offset_idx": 32, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "20", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79703, "t": 581.14143, "r": 530.62994, "b": 590.35443, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 32, "end_row_offset_idx": 33, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.4 Establishing and controlling accessibility by using the RCAC rule text . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.16315, "t": 581.14143, "r": 547.22955, "b": 590.35443, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 32, "end_row_offset_idx": 33, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "21", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79701, "t": 593.62131, "r": 530.56512, "b": 615.37395, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 34, "end_row_offset_idx": 35, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.5 SELECT, INSERT, and UPDATE behavior with RCAC 3.6 Human resources example . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 400.32065, "t": 593.62131, "r": 530.48358, "b": 602.8343, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 33, "end_row_offset_idx": 34, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": ". . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.0224, "t": 593.62131, "r": 547.1001, "b": 602.8343, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 33, "end_row_offset_idx": 34, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "22", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.112, "t": 606.16095, "r": 547.20575, "b": 615.37395, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 34, "end_row_offset_idx": 35, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "22", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717, "t": 618.64082, "r": 530.49139, "b": 627.85382, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 35, "end_row_offset_idx": 36, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.1 Assigning the QIBM_DB_SECADM function ID to the consultants. . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.04633, "t": 618.64082, "r": 547.15619, "b": 627.85382, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 35, "end_row_offset_idx": 36, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "23", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717, "t": 631.1206999999999, "r": 530.56458, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 36, "end_row_offset_idx": 37, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.2 Creating group profiles for the users and their roles . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.09601, "t": 631.1206999999999, "r": 547.15875, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 36, "end_row_offset_idx": 37, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "23", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717, "t": 643.66034, "r": 530.55695, "b": 652.87334, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 37, "end_row_offset_idx": 38, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.3 Demonstrating data access without RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.0882, "t": 643.66034, "r": 547.15076, "b": 652.87334, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 37, "end_row_offset_idx": 38, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "24", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717, "t": 656.14021, "r": 530.53412, "b": 665.35321, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 38, "end_row_offset_idx": 39, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.4 Defining and creating row permissions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.073, "t": 656.14021, "r": 547.15088, "b": 665.35321, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 38, "end_row_offset_idx": 39, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "25", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717, "t": 668.62009, "r": 339.45105, "b": 677.83309, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 39, "end_row_offset_idx": 40, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.5 Defining and creating column masks", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 344.98996, "t": 668.62009, "r": 547.16089, "b": 677.83309, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 39, "end_row_offset_idx": 40, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717, "t": 681.15973, "r": 530.54102, "b": 690.37273, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 40, "end_row_offset_idx": 41, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.6 Activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.08765, "t": 681.15973, "r": 547.18085, "b": 690.37273, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 40, "end_row_offset_idx": 41, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "28", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717, "t": 693.63961, "r": 530.57507, "b": 702.852615, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 41, "end_row_offset_idx": 42, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.7 Demonstrating data access with RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.10663, "t": 693.63961, "r": 547.16968, "b": 702.852615, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 41, "end_row_offset_idx": 42, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "29", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717, "t": 706.119492, "r": 530.43628, "b": 715.332497, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 42, "end_row_offset_idx": 43, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.8 Demonstrating data access with a view and RCAC . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 535.99847, "t": 706.119492, "r": 547.12286, "b": 715.332497, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 42, "end_row_offset_idx": 43, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "32", "column_header": false, "row_header": false, "row_section": false}]}], "body": [{"label": "section_header", "id": 1, "page_no": 1, "cluster": {"id": 1, "label": "section_header", "bbox": {"l": 64.800003, "t": 73.84802000000002, "r": 168.73441, "b": 96.04803000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9509142637252808, "cells": [{"id": 2, "text": "Contents", "bbox": {"l": 64.800003, "t": 73.84802000000002, "r": 168.73441, "b": 96.04803000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Contents"}, {"label": "document_index", "id": 0, "page_no": 1, "cluster": {"id": 0, "label": "document_index", "bbox": {"l": 136.1496124267578, "t": 132.0330352783203, "r": 547.5267944335938, "b": 715.6515502929688, "coord_origin": "TOPLEFT"}, "confidence": 0.9803681373596191, "cells": [{"id": 3, "text": "Notices", "bbox": {"l": 136.8, "t": 132.64862000000005, "r": 172.89404, "b": 141.86163, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vii", "bbox": {"l": 175.01952, "t": 132.64862000000005, "r": 547.18982, "b": 141.86163, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Trademarks", "bbox": {"l": 136.79901, "t": 145.12847999999997, "r": 189.86537, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 195.39685, "t": 145.12847999999997, "r": 530.05121, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "viii", "bbox": {"l": 535.5827, "t": 145.12847999999997, "r": 547.18286, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "DB2 for i Center of Excellence", "bbox": {"l": 136.79901, "t": 167.62811, "r": 279.39731, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ix", "bbox": {"l": 280.61942, "t": 167.62811, "r": 547.1908, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Preface", "bbox": {"l": 136.79901, "t": 190.12775, "r": 172.84424, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi", "bbox": {"l": 175.01852, "t": 190.12775, "r": 547.18286, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Authors . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi", "bbox": {"l": 136.79803, "t": 202.60760000000005, "r": 547.18085, "b": 211.82061999999996, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Now you can become a published author, too!", "bbox": {"l": 136.79803, "t": 215.14721999999995, "r": 339.18292, "b": 224.36023, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 344.71411, "t": 215.14721999999995, "r": 530.00812, "b": 224.36023, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "xiii", "bbox": {"l": 535.53925, "t": 215.14721999999995, "r": 547.13879, "b": 224.36023, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Comments welcome. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 136.79803, "t": 227.62707999999998, "r": 529.99506, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "xiii", "bbox": {"l": 535.5495, "t": 227.62707999999998, "r": 547.19788, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Stay connected to IBM Redbooks", "bbox": {"l": 136.79807, "t": 240.10693000000003, "r": 284.02866, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 289.54449, "t": 240.10693000000003, "r": 529.48242, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "xiv", "bbox": {"l": 534.99829, "t": 240.10693000000003, "r": 547.12115, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Chapter 1. Securing and protecting IBM DB2 data", "bbox": {"l": 136.79807, "t": 262.60657000000003, "r": 373.17566, "b": 271.81958, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 375.11798, "t": 262.60657000000003, "r": 536.09589, "b": 271.81958, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "1", "bbox": {"l": 541.64685, "t": 262.60657000000003, "r": 547.19781, "b": 271.81958, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "1.1", "bbox": {"l": 136.79808, "t": 274.60637999999994, "r": 150.88702, "b": 283.8194, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "Security fundamentals. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2", "bbox": {"l": 156.5226, "t": 274.60637999999994, "r": 549.84723, "b": 283.8194, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "1.2", "bbox": {"l": 136.79807, "t": 287.14606000000003, "r": 150.62746, "b": 296.35904, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Current state of IBM i security . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.15923, "t": 287.14606000000003, "r": 536.12933, "b": 296.35904, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "2", "bbox": {"l": 541.66113, "t": 287.14606000000003, "r": 547.19287, "b": 296.35904, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "1.3", "bbox": {"l": 136.79807, "t": 299.62595, "r": 150.84943, "b": 308.83893, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "DB2 for i security controls . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3", "bbox": {"l": 156.46996, "t": 299.62595, "r": 549.84723, "b": 308.83893, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "1.3.1", "bbox": {"l": 151.1972, "t": 312.1058300000001, "r": 173.38289, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Existing row and column control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.92932, "t": 312.1058300000001, "r": 536.05511, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "4", "bbox": {"l": 541.6015, "t": 312.1058300000001, "r": 547.14795, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "1.3.2", "bbox": {"l": 151.1972, "t": 324.64548, "r": 173.4189, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "New controls: Row and Column Access Control. . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.97432, "t": 324.64548, "r": 536.08008, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "5", "bbox": {"l": 541.6355, "t": 324.64548, "r": 547.19092, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "Chapter 2. Roles and separation of duties", "bbox": {"l": 136.79704, "t": 347.14511, "r": 336.82071, "b": 356.35809, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 338.99701, "t": 347.14511, "r": 536.09088, "b": 356.35809, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "7", "bbox": {"l": 541.64282, "t": 347.14511, "r": 547.19476, "b": 356.35809, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "2.1", "bbox": {"l": 136.79704, "t": 359.14493, "r": 150.644, "b": 368.35791, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Roles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.18277, "t": 359.14493, "r": 536.12714, "b": 368.35791, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "8", "bbox": {"l": 541.66589, "t": 359.14493, "r": 547.20471, "b": 368.35791, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "2.1.1", "bbox": {"l": 151.1972, "t": 371.62482, "r": 173.60995, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "DDM and DRDA application server access: QIBM_DB_DDMDRDA . . . . . . . . . . .", "bbox": {"l": 176.41154, "t": 371.62482, "r": 535.9527, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "8", "bbox": {"l": 541.55585, "t": 371.62482, "r": 547.15906, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "2.1.2", "bbox": {"l": 151.1972, "t": 384.10470999999995, "r": 173.41664, "b": 393.31769, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "Toolbox application server access: QIBM_DB_ZDA. . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.97151, "t": 384.10470999999995, "r": 536.04108, "b": 393.31769, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "8", "bbox": {"l": 541.59595, "t": 384.10470999999995, "r": 547.15082, "b": 393.31769, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "2.1.3", "bbox": {"l": 151.1972, "t": 396.64435, "r": 173.41859, "b": 405.85733, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Database Administrator function: QIBM_DB_SQLADM . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.97394, "t": 396.64435, "r": 536.07489, "b": 405.85733, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "9", "bbox": {"l": 541.63025, "t": 396.64435, "r": 547.18561, "b": 405.85733, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "2.1.4", "bbox": {"l": 151.1972, "t": 409.12424000000004, "r": 173.38629, "b": 418.33722, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Database Information function: QIBM_DB_SYSMON", "bbox": {"l": 178.93356, "t": 409.12424000000004, "r": 411.27048, "b": 418.33722, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": ". . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 416.81775, "t": 409.12424000000004, "r": 536.08411, "b": 418.33722, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "9", "bbox": {"l": 541.63135, "t": 409.12424000000004, "r": 547.17865, "b": 418.33722, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "2.1.5", "bbox": {"l": 151.1972, "t": 421.60413, "r": 173.44926, "b": 430.81711, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Security Administrator function: QIBM_DB_SECADM . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 179.01228, "t": 421.60413, "r": 536.03589, "b": 430.81711, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "9", "bbox": {"l": 541.59894, "t": 421.60413, "r": 547.16193, "b": 430.81711, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "2.1.6", "bbox": {"l": 151.1972, "t": 434.1437700000001, "r": 173.32208, "b": 443.35675, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Change Function Usage CL command . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.8533, "t": 434.1437700000001, "r": 530.57318, "b": 443.35675, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "10", "bbox": {"l": 536.10443, "t": 434.1437700000001, "r": 547.16687, "b": 443.35675, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "2.1.7", "bbox": {"l": 151.1972, "t": 446.62366, "r": 173.35822, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "Verifying function usage IDs for RCAC with the FUNCTION_USAGE view . . . . .", "bbox": {"l": 178.89848, "t": 446.62366, "r": 530.53522, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "10", "bbox": {"l": 536.0755, "t": 446.62366, "r": 547.15601, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "2.2", "bbox": {"l": 136.79704, "t": 459.10355, "r": 150.85457, "b": 468.31653, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "Separation of duties . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10", "bbox": {"l": 156.47758, "t": 459.10355, "r": 547.25659, "b": 468.31653, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "Chapter 3. Row and Column Access Control", "bbox": {"l": 136.79703, "t": 481.60318, "r": 348.68503, "b": 490.81616, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 350.09741, "t": 481.60318, "r": 530.53961, "b": 490.81616, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "13", "bbox": {"l": 536.09167, "t": 481.60318, "r": 547.1958, "b": 490.81616, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "3.1", "bbox": {"l": 136.79703, "t": 493.603, "r": 150.70105, "b": 502.81598, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Explanation of RCAC and the concept of access control . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.26266, "t": 493.603, "r": 530.4809, "b": 502.81598, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "14", "bbox": {"l": 536.04248, "t": 493.603, "r": 547.16571, "b": 502.81598, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "3.1.1", "bbox": {"l": 151.19719, "t": 506.14264, "r": 173.35429, "b": 515.35562, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "Row permission and column mask definitions", "bbox": {"l": 178.89357, "t": 506.14264, "r": 378.20786, "b": 515.35562, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 383.74713, "t": 506.14264, "r": 530.5379, "b": 515.35562, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "14", "bbox": {"l": 536.07721, "t": 506.14264, "r": 547.15576, "b": 515.35562, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "3.1.2", "bbox": {"l": 151.19719, "t": 518.62253, "r": 173.44292, "b": 527.83551, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "Enabling and activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 179.00435, "t": 518.62253, "r": 530.43475, "b": 527.83551, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "16", "bbox": {"l": 535.99622, "t": 518.62253, "r": 547.11908, "b": 527.83551, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "3.2", "bbox": {"l": 136.79703, "t": 531.1621700000001, "r": 150.64432, "b": 540.37517, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Special registers and built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.18323, "t": 531.1621700000001, "r": 530.52808, "b": 540.37517, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "18", "bbox": {"l": 536.06702, "t": 531.1621700000001, "r": 547.14484, "b": 540.37517, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "3.2.1", "bbox": {"l": 151.19719, "t": 543.64204, "r": 173.41321, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "Special registers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.96722, "t": 543.64204, "r": 530.49786, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "18", "bbox": {"l": 536.05188, "t": 543.64204, "r": 547.15991, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "3.2.2", "bbox": {"l": 151.19719, "t": 556.12192, "r": 173.35269, "b": 565.33492, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.89156, "t": 556.12192, "r": 530.56024, "b": 565.33492, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "19", "bbox": {"l": 536.09912, "t": 556.12192, "r": 547.17688, "b": 565.33492, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "3.3", "bbox": {"l": 136.79703, "t": 568.66156, "r": 150.62514, "b": 577.87456, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "VERIFY_GROUP_FOR_USER function . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.15639, "t": 568.66156, "r": 530.53027, "b": 577.87456, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "20", "bbox": {"l": 536.06152, "t": 568.66156, "r": 547.12402, "b": 577.87456, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "3.4", "bbox": {"l": 136.79703, "t": 581.14143, "r": 150.63004, "b": 590.35443, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "Establishing and controlling accessibility by using the RCAC rule text . . . . . . . . . . . . .", "bbox": {"l": 156.16325, "t": 581.14143, "r": 530.62994, "b": 590.35443, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "21", "bbox": {"l": 536.16315, "t": 581.14143, "r": 547.22955, "b": 590.35443, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "3.5", "bbox": {"l": 136.79701, "t": 593.62131, "r": 150.64413, "b": 602.8343, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "SELECT, INSERT, and UPDATE behavior with RCAC", "bbox": {"l": 156.18298, "t": 593.62131, "r": 394.7818, "b": 602.8343, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": ". . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 400.32065, "t": 593.62131, "r": 530.48358, "b": 602.8343, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "22", "bbox": {"l": 536.0224, "t": 593.62131, "r": 547.1001, "b": 602.8343, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "3.6", "bbox": {"l": 136.79701, "t": 606.16095, "r": 150.6642, "b": 615.37395, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "Human resources example . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.21107, "t": 606.16095, "r": 530.56512, "b": 615.37395, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "22", "bbox": {"l": 536.112, "t": 606.16095, "r": 547.20575, "b": 615.37395, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "3.6.1", "bbox": {"l": 151.19717, "t": 618.64082, "r": 173.41692, "b": 627.85382, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "Assigning the QIBM_DB_SECADM function ID to the consultants. . . . . . . . . . . .", "bbox": {"l": 178.97185, "t": 618.64082, "r": 530.49139, "b": 627.85382, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "23", "bbox": {"l": 536.04633, "t": 618.64082, "r": 547.15619, "b": 627.85382, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "3.6.2", "bbox": {"l": 151.19717, "t": 631.1206999999999, "r": 173.32271, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "Creating group profiles for the users and their roles . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.8541, "t": 631.1206999999999, "r": 530.56458, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "23", "bbox": {"l": 536.09601, "t": 631.1206999999999, "r": 547.15875, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "3.6.3", "bbox": {"l": 151.19717, "t": 643.66034, "r": 173.32227, "b": 652.87334, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "Demonstrating data access without RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.85353, "t": 643.66034, "r": 530.55695, "b": 652.87334, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "24", "bbox": {"l": 536.0882, "t": 643.66034, "r": 547.15076, "b": 652.87334, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "3.6.4", "bbox": {"l": 151.19717, "t": 656.14021, "r": 173.35289, "b": 665.35321, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "Defining and creating row permissions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.89182, "t": 656.14021, "r": 530.53412, "b": 665.35321, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "25", "bbox": {"l": 536.073, "t": 656.14021, "r": 547.15088, "b": 665.35321, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "3.6.5", "bbox": {"l": 151.19717, "t": 668.62009, "r": 173.35289, "b": 677.83309, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "Defining and creating column masks", "bbox": {"l": 178.89182, "t": 668.62009, "r": 339.45105, "b": 677.83309, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 344.98996, "t": 668.62009, "r": 530.54413, "b": 677.83309, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "26", "bbox": {"l": 536.08301, "t": 668.62009, "r": 547.16089, "b": 677.83309, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "3.6.6", "bbox": {"l": 151.19717, "t": 681.15973, "r": 173.38359, "b": 690.37273, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "Activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.93019, "t": 681.15973, "r": 530.54102, "b": 690.37273, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "28", "bbox": {"l": 536.08765, "t": 681.15973, "r": 547.18085, "b": 690.37273, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "3.6.7", "bbox": {"l": 151.19717, "t": 693.63961, "r": 173.32332, "b": 702.852615, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Demonstrating data access with RCAC", "bbox": {"l": 178.85486, "t": 693.63961, "r": 350.80011, "b": 702.852615, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 356.33163, "t": 693.63961, "r": 530.57507, "b": 702.852615, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "29", "bbox": {"l": 536.10663, "t": 693.63961, "r": 547.16968, "b": 702.852615, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "3.6.8", "bbox": {"l": 151.19717, "t": 706.119492, "r": 173.44592, "b": 715.332497, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "Demonstrating data access with a view and RCAC . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 179.00812, "t": 706.119492, "r": 530.43628, "b": 715.332497, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "32", "bbox": {"l": 535.99847, "t": 706.119492, "r": 547.12286, "b": 715.332497, "coord_origin": "TOPLEFT"}}], "children": [{"id": 4, "label": "text", "bbox": {"l": 136.8, "t": 132.64862000000005, "r": 172.89404, "b": 141.86163, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 3, "text": "Notices", "bbox": {"l": 136.8, "t": 132.64862000000005, "r": 172.89404, "b": 141.86163, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "text", "bbox": {"l": 175.01952, "t": 132.64862000000005, "r": 547.18982, "b": 141.86163, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 4, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vii", "bbox": {"l": 175.01952, "t": 132.64862000000005, "r": 547.18982, "b": 141.86163, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "text", "bbox": {"l": 136.79901, "t": 145.12847999999997, "r": 189.86537, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 5, "text": "Trademarks", "bbox": {"l": 136.79901, "t": 145.12847999999997, "r": 189.86537, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "text", "bbox": {"l": 195.39685, "t": 145.12847999999997, "r": 530.05121, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 195.39685, "t": 145.12847999999997, "r": 530.05121, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "text", "bbox": {"l": 535.5827, "t": 145.12847999999997, "r": 547.18286, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "viii", "bbox": {"l": 535.5827, "t": 145.12847999999997, "r": 547.18286, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 136.79901, "t": 167.62811, "r": 279.39731, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "DB2 for i Center of Excellence", "bbox": {"l": 136.79901, "t": 167.62811, "r": 279.39731, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "text", "bbox": {"l": 280.61942, "t": 167.62811, "r": 547.1908, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ix", "bbox": {"l": 280.61942, "t": 167.62811, "r": 547.1908, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 136.79901, "t": 190.12775, "r": 172.84424, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "Preface", "bbox": {"l": 136.79901, "t": 190.12775, "r": 172.84424, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 175.01852, "t": 190.12775, "r": 547.18286, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi", "bbox": {"l": 175.01852, "t": 190.12775, "r": 547.18286, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 136.79803, "t": 202.60760000000005, "r": 547.18085, "b": 211.82061999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "Authors . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi", "bbox": {"l": 136.79803, "t": 202.60760000000005, "r": 547.18085, "b": 211.82061999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 136.79803, "t": 215.14721999999995, "r": 339.18292, "b": 224.36023, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "Now you can become a published author, too!", "bbox": {"l": 136.79803, "t": 215.14721999999995, "r": 339.18292, "b": 224.36023, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 344.71411, "t": 215.14721999999995, "r": 530.00812, "b": 224.36023, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 344.71411, "t": 215.14721999999995, "r": 530.00812, "b": 224.36023, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 535.53925, "t": 215.14721999999995, "r": 547.13879, "b": 224.36023, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "xiii", "bbox": {"l": 535.53925, "t": 215.14721999999995, "r": 547.13879, "b": 224.36023, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 136.79803, "t": 227.62707999999998, "r": 529.99506, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "Comments welcome. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 136.79803, "t": 227.62707999999998, "r": 529.99506, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 535.5495, "t": 227.62707999999998, "r": 547.19788, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "xiii", "bbox": {"l": 535.5495, "t": 227.62707999999998, "r": 547.19788, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 136.79807, "t": 240.10693000000003, "r": 284.02866, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "Stay connected to IBM Redbooks", "bbox": {"l": 136.79807, "t": 240.10693000000003, "r": 284.02866, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 289.54449, "t": 240.10693000000003, "r": 529.48242, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 289.54449, "t": 240.10693000000003, "r": 529.48242, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 534.99829, "t": 240.10693000000003, "r": 547.12115, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "xiv", "bbox": {"l": 534.99829, "t": 240.10693000000003, "r": 547.12115, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 136.79807, "t": 262.60657000000003, "r": 373.17566, "b": 271.81958, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "Chapter 1. Securing and protecting IBM DB2 data", "bbox": {"l": 136.79807, "t": 262.60657000000003, "r": 373.17566, "b": 271.81958, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 375.11798, "t": 262.60657000000003, "r": 536.09589, "b": 271.81958, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 375.11798, "t": 262.60657000000003, "r": 536.09589, "b": 271.81958, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 541.64685, "t": 262.60657000000003, "r": 547.19781, "b": 271.81958, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "1", "bbox": {"l": 541.64685, "t": 262.60657000000003, "r": 547.19781, "b": 271.81958, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 136.79808, "t": 274.60637999999994, "r": 150.88702, "b": 283.8194, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "1.1", "bbox": {"l": 136.79808, "t": 274.60637999999994, "r": 150.88702, "b": 283.8194, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 156.5226, "t": 274.60637999999994, "r": 549.84723, "b": 283.8194, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "Security fundamentals. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2", "bbox": {"l": 156.5226, "t": 274.60637999999994, "r": 549.84723, "b": 283.8194, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 136.79807, "t": 287.14606000000003, "r": 150.62746, "b": 296.35904, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "1.2", "bbox": {"l": 136.79807, "t": 287.14606000000003, "r": 150.62746, "b": 296.35904, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 156.15923, "t": 287.14606000000003, "r": 536.12933, "b": 296.35904, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "Current state of IBM i security . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.15923, "t": 287.14606000000003, "r": 536.12933, "b": 296.35904, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 541.66113, "t": 287.14606000000003, "r": 547.19287, "b": 296.35904, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "2", "bbox": {"l": 541.66113, "t": 287.14606000000003, "r": 547.19287, "b": 296.35904, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 136.79807, "t": 299.62595, "r": 150.84943, "b": 308.83893, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "1.3", "bbox": {"l": 136.79807, "t": 299.62595, "r": 150.84943, "b": 308.83893, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 156.46996, "t": 299.62595, "r": 549.84723, "b": 308.83893, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "DB2 for i security controls . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3", "bbox": {"l": 156.46996, "t": 299.62595, "r": 549.84723, "b": 308.83893, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 151.1972, "t": 312.1058300000001, "r": 173.38289, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "1.3.1", "bbox": {"l": 151.1972, "t": 312.1058300000001, "r": 173.38289, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 178.92932, "t": 312.1058300000001, "r": 536.05511, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "Existing row and column control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.92932, "t": 312.1058300000001, "r": 536.05511, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 541.6015, "t": 312.1058300000001, "r": 547.14795, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "4", "bbox": {"l": 541.6015, "t": 312.1058300000001, "r": 547.14795, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 151.1972, "t": 324.64548, "r": 173.4189, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "1.3.2", "bbox": {"l": 151.1972, "t": 324.64548, "r": 173.4189, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 178.97432, "t": 324.64548, "r": 536.08008, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "New controls: Row and Column Access Control. . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.97432, "t": 324.64548, "r": 536.08008, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 541.6355, "t": 324.64548, "r": 547.19092, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "5", "bbox": {"l": 541.6355, "t": 324.64548, "r": 547.19092, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 136.79704, "t": 347.14511, "r": 336.82071, "b": 356.35809, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "Chapter 2. Roles and separation of duties", "bbox": {"l": 136.79704, "t": 347.14511, "r": 336.82071, "b": 356.35809, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 338.99701, "t": 347.14511, "r": 536.09088, "b": 356.35809, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 338.99701, "t": 347.14511, "r": 536.09088, "b": 356.35809, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 541.64282, "t": 347.14511, "r": 547.19476, "b": 356.35809, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "7", "bbox": {"l": 541.64282, "t": 347.14511, "r": 547.19476, "b": 356.35809, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 136.79704, "t": 359.14493, "r": 150.644, "b": 368.35791, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "2.1", "bbox": {"l": 136.79704, "t": 359.14493, "r": 150.644, "b": 368.35791, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 156.18277, "t": 359.14493, "r": 536.12714, "b": 368.35791, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "Roles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.18277, "t": 359.14493, "r": 536.12714, "b": 368.35791, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 541.66589, "t": 359.14493, "r": 547.20471, "b": 368.35791, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "8", "bbox": {"l": 541.66589, "t": 359.14493, "r": 547.20471, "b": 368.35791, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 151.1972, "t": 371.62482, "r": 173.60995, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "2.1.1", "bbox": {"l": 151.1972, "t": 371.62482, "r": 173.60995, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 176.41154, "t": 371.62482, "r": 535.9527, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "DDM and DRDA application server access: QIBM_DB_DDMDRDA . . . . . . . . . . .", "bbox": {"l": 176.41154, "t": 371.62482, "r": 535.9527, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 541.55585, "t": 371.62482, "r": 547.15906, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "8", "bbox": {"l": 541.55585, "t": 371.62482, "r": 547.15906, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 151.1972, "t": 384.10470999999995, "r": 173.41664, "b": 393.31769, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "2.1.2", "bbox": {"l": 151.1972, "t": 384.10470999999995, "r": 173.41664, "b": 393.31769, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 178.97151, "t": 384.10470999999995, "r": 536.04108, "b": 393.31769, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "Toolbox application server access: QIBM_DB_ZDA. . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.97151, "t": 384.10470999999995, "r": 536.04108, "b": 393.31769, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 541.59595, "t": 384.10470999999995, "r": 547.15082, "b": 393.31769, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "8", "bbox": {"l": 541.59595, "t": 384.10470999999995, "r": 547.15082, "b": 393.31769, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 151.1972, "t": 396.64435, "r": 173.41859, "b": 405.85733, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "2.1.3", "bbox": {"l": 151.1972, "t": 396.64435, "r": 173.41859, "b": 405.85733, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 178.97394, "t": 396.64435, "r": 536.07489, "b": 405.85733, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "Database Administrator function: QIBM_DB_SQLADM . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.97394, "t": 396.64435, "r": 536.07489, "b": 405.85733, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 541.63025, "t": 396.64435, "r": 547.18561, "b": 405.85733, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "9", "bbox": {"l": 541.63025, "t": 396.64435, "r": 547.18561, "b": 405.85733, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 151.1972, "t": 409.12424000000004, "r": 173.38629, "b": 418.33722, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "2.1.4", "bbox": {"l": 151.1972, "t": 409.12424000000004, "r": 173.38629, "b": 418.33722, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 178.93356, "t": 409.12424000000004, "r": 411.27048, "b": 418.33722, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "Database Information function: QIBM_DB_SYSMON", "bbox": {"l": 178.93356, "t": 409.12424000000004, "r": 411.27048, "b": 418.33722, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 416.81775, "t": 409.12424000000004, "r": 536.08411, "b": 418.33722, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": ". . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 416.81775, "t": 409.12424000000004, "r": 536.08411, "b": 418.33722, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 541.63135, "t": 409.12424000000004, "r": 547.17865, "b": 418.33722, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "9", "bbox": {"l": 541.63135, "t": 409.12424000000004, "r": 547.17865, "b": 418.33722, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 151.1972, "t": 421.60413, "r": 173.44926, "b": 430.81711, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "2.1.5", "bbox": {"l": 151.1972, "t": 421.60413, "r": 173.44926, "b": 430.81711, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 179.01228, "t": 421.60413, "r": 536.03589, "b": 430.81711, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "Security Administrator function: QIBM_DB_SECADM . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 179.01228, "t": 421.60413, "r": 536.03589, "b": 430.81711, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 541.59894, "t": 421.60413, "r": 547.16193, "b": 430.81711, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "9", "bbox": {"l": 541.59894, "t": 421.60413, "r": 547.16193, "b": 430.81711, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 151.1972, "t": 434.1437700000001, "r": 173.32208, "b": 443.35675, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "2.1.6", "bbox": {"l": 151.1972, "t": 434.1437700000001, "r": 173.32208, "b": 443.35675, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 178.8533, "t": 434.1437700000001, "r": 530.57318, "b": 443.35675, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "Change Function Usage CL command . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.8533, "t": 434.1437700000001, "r": 530.57318, "b": 443.35675, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 536.10443, "t": 434.1437700000001, "r": 547.16687, "b": 443.35675, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "10", "bbox": {"l": 536.10443, "t": 434.1437700000001, "r": 547.16687, "b": 443.35675, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 151.1972, "t": 446.62366, "r": 173.35822, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "2.1.7", "bbox": {"l": 151.1972, "t": 446.62366, "r": 173.35822, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 178.89848, "t": 446.62366, "r": 530.53522, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "Verifying function usage IDs for RCAC with the FUNCTION_USAGE view . . . . .", "bbox": {"l": 178.89848, "t": 446.62366, "r": 530.53522, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 536.0755, "t": 446.62366, "r": 547.15601, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "10", "bbox": {"l": 536.0755, "t": 446.62366, "r": 547.15601, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 136.79704, "t": 459.10355, "r": 150.85457, "b": 468.31653, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "2.2", "bbox": {"l": 136.79704, "t": 459.10355, "r": 150.85457, "b": 468.31653, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 156.47758, "t": 459.10355, "r": 547.25659, "b": 468.31653, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "Separation of duties . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10", "bbox": {"l": 156.47758, "t": 459.10355, "r": 547.25659, "b": 468.31653, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 136.79703, "t": 481.60318, "r": 348.68503, "b": 490.81616, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "Chapter 3. Row and Column Access Control", "bbox": {"l": 136.79703, "t": 481.60318, "r": 348.68503, "b": 490.81616, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 350.09741, "t": 481.60318, "r": 530.53961, "b": 490.81616, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 350.09741, "t": 481.60318, "r": 530.53961, "b": 490.81616, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 536.09167, "t": 481.60318, "r": 547.1958, "b": 490.81616, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "13", "bbox": {"l": 536.09167, "t": 481.60318, "r": 547.1958, "b": 490.81616, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 136.79703, "t": 493.603, "r": 150.70105, "b": 502.81598, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "3.1", "bbox": {"l": 136.79703, "t": 493.603, "r": 150.70105, "b": 502.81598, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 156.26266, "t": 493.603, "r": 530.4809, "b": 502.81598, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "Explanation of RCAC and the concept of access control . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.26266, "t": 493.603, "r": 530.4809, "b": 502.81598, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 536.04248, "t": 493.603, "r": 547.16571, "b": 502.81598, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "14", "bbox": {"l": 536.04248, "t": 493.603, "r": 547.16571, "b": 502.81598, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 151.19719, "t": 506.14264, "r": 173.35429, "b": 515.35562, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "3.1.1", "bbox": {"l": 151.19719, "t": 506.14264, "r": 173.35429, "b": 515.35562, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 178.89357, "t": 506.14264, "r": 378.20786, "b": 515.35562, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "Row permission and column mask definitions", "bbox": {"l": 178.89357, "t": 506.14264, "r": 378.20786, "b": 515.35562, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 383.74713, "t": 506.14264, "r": 530.5379, "b": 515.35562, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 383.74713, "t": 506.14264, "r": 530.5379, "b": 515.35562, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 536.07721, "t": 506.14264, "r": 547.15576, "b": 515.35562, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "14", "bbox": {"l": 536.07721, "t": 506.14264, "r": 547.15576, "b": 515.35562, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 151.19719, "t": 518.62253, "r": 173.44292, "b": 527.83551, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "3.1.2", "bbox": {"l": 151.19719, "t": 518.62253, "r": 173.44292, "b": 527.83551, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 179.00435, "t": 518.62253, "r": 530.43475, "b": 527.83551, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "Enabling and activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 179.00435, "t": 518.62253, "r": 530.43475, "b": 527.83551, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 535.99622, "t": 518.62253, "r": 547.11908, "b": 527.83551, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "16", "bbox": {"l": 535.99622, "t": 518.62253, "r": 547.11908, "b": 527.83551, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 136.79703, "t": 531.1621700000001, "r": 150.64432, "b": 540.37517, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "3.2", "bbox": {"l": 136.79703, "t": 531.1621700000001, "r": 150.64432, "b": 540.37517, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 156.18323, "t": 531.1621700000001, "r": 530.52808, "b": 540.37517, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "Special registers and built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.18323, "t": 531.1621700000001, "r": 530.52808, "b": 540.37517, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 536.06702, "t": 531.1621700000001, "r": 547.14484, "b": 540.37517, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "18", "bbox": {"l": 536.06702, "t": 531.1621700000001, "r": 547.14484, "b": 540.37517, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 151.19719, "t": 543.64204, "r": 173.41321, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "3.2.1", "bbox": {"l": 151.19719, "t": 543.64204, "r": 173.41321, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 178.96722, "t": 543.64204, "r": 530.49786, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "Special registers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.96722, "t": 543.64204, "r": 530.49786, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 536.05188, "t": 543.64204, "r": 547.15991, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "18", "bbox": {"l": 536.05188, "t": 543.64204, "r": 547.15991, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 151.19719, "t": 556.12192, "r": 173.35269, "b": 565.33492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "3.2.2", "bbox": {"l": 151.19719, "t": 556.12192, "r": 173.35269, "b": 565.33492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 178.89156, "t": 556.12192, "r": 530.56024, "b": 565.33492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "Built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.89156, "t": 556.12192, "r": 530.56024, "b": 565.33492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 536.09912, "t": 556.12192, "r": 547.17688, "b": 565.33492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "19", "bbox": {"l": 536.09912, "t": 556.12192, "r": 547.17688, "b": 565.33492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 136.79703, "t": 568.66156, "r": 150.62514, "b": 577.87456, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "3.3", "bbox": {"l": 136.79703, "t": 568.66156, "r": 150.62514, "b": 577.87456, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 156.15639, "t": 568.66156, "r": 530.53027, "b": 577.87456, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "VERIFY_GROUP_FOR_USER function . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.15639, "t": 568.66156, "r": 530.53027, "b": 577.87456, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 536.06152, "t": 568.66156, "r": 547.12402, "b": 577.87456, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "20", "bbox": {"l": 536.06152, "t": 568.66156, "r": 547.12402, "b": 577.87456, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 136.79703, "t": 581.14143, "r": 150.63004, "b": 590.35443, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "3.4", "bbox": {"l": 136.79703, "t": 581.14143, "r": 150.63004, "b": 590.35443, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 156.16325, "t": 581.14143, "r": 530.62994, "b": 590.35443, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "Establishing and controlling accessibility by using the RCAC rule text . . . . . . . . . . . . .", "bbox": {"l": 156.16325, "t": 581.14143, "r": 530.62994, "b": 590.35443, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 536.16315, "t": 581.14143, "r": 547.22955, "b": 590.35443, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "21", "bbox": {"l": 536.16315, "t": 581.14143, "r": 547.22955, "b": 590.35443, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 136.79701, "t": 593.62131, "r": 150.64413, "b": 602.8343, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "3.5", "bbox": {"l": 136.79701, "t": 593.62131, "r": 150.64413, "b": 602.8343, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 156.18298, "t": 593.62131, "r": 394.7818, "b": 602.8343, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "SELECT, INSERT, and UPDATE behavior with RCAC", "bbox": {"l": 156.18298, "t": 593.62131, "r": 394.7818, "b": 602.8343, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 400.32065, "t": 593.62131, "r": 530.48358, "b": 602.8343, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": ". . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 400.32065, "t": 593.62131, "r": 530.48358, "b": 602.8343, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 536.0224, "t": 593.62131, "r": 547.1001, "b": 602.8343, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "22", "bbox": {"l": 536.0224, "t": 593.62131, "r": 547.1001, "b": 602.8343, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 136.79701, "t": 606.16095, "r": 150.6642, "b": 615.37395, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "3.6", "bbox": {"l": 136.79701, "t": 606.16095, "r": 150.6642, "b": 615.37395, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 156.21107, "t": 606.16095, "r": 530.56512, "b": 615.37395, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "Human resources example . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.21107, "t": 606.16095, "r": 530.56512, "b": 615.37395, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 536.112, "t": 606.16095, "r": 547.20575, "b": 615.37395, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "22", "bbox": {"l": 536.112, "t": 606.16095, "r": 547.20575, "b": 615.37395, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 151.19717, "t": 618.64082, "r": 173.41692, "b": 627.85382, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "3.6.1", "bbox": {"l": 151.19717, "t": 618.64082, "r": 173.41692, "b": 627.85382, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 178.97185, "t": 618.64082, "r": 530.49139, "b": 627.85382, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": "Assigning the QIBM_DB_SECADM function ID to the consultants. . . . . . . . . . . .", "bbox": {"l": 178.97185, "t": 618.64082, "r": 530.49139, "b": 627.85382, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 536.04633, "t": 618.64082, "r": 547.15619, "b": 627.85382, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "23", "bbox": {"l": 536.04633, "t": 618.64082, "r": 547.15619, "b": 627.85382, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 151.19717, "t": 631.1206999999999, "r": 173.32271, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "3.6.2", "bbox": {"l": 151.19717, "t": 631.1206999999999, "r": 173.32271, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 178.8541, "t": 631.1206999999999, "r": 530.56458, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": "Creating group profiles for the users and their roles . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.8541, "t": 631.1206999999999, "r": 530.56458, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 536.09601, "t": 631.1206999999999, "r": 547.15875, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 107, "text": "23", "bbox": {"l": 536.09601, "t": 631.1206999999999, "r": 547.15875, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 151.19717, "t": 643.66034, "r": 173.32227, "b": 652.87334, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 108, "text": "3.6.3", "bbox": {"l": 151.19717, "t": 643.66034, "r": 173.32227, "b": 652.87334, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 178.85353, "t": 643.66034, "r": 530.55695, "b": 652.87334, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 109, "text": "Demonstrating data access without RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.85353, "t": 643.66034, "r": 530.55695, "b": 652.87334, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 536.0882, "t": 643.66034, "r": 547.15076, "b": 652.87334, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 110, "text": "24", "bbox": {"l": 536.0882, "t": 643.66034, "r": 547.15076, "b": 652.87334, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 151.19717, "t": 656.14021, "r": 173.35289, "b": 665.35321, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 111, "text": "3.6.4", "bbox": {"l": 151.19717, "t": 656.14021, "r": 173.35289, "b": 665.35321, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 178.89182, "t": 656.14021, "r": 530.53412, "b": 665.35321, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 112, "text": "Defining and creating row permissions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.89182, "t": 656.14021, "r": 530.53412, "b": 665.35321, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 114, "label": "text", "bbox": {"l": 536.073, "t": 656.14021, "r": 547.15088, "b": 665.35321, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 113, "text": "25", "bbox": {"l": 536.073, "t": 656.14021, "r": 547.15088, "b": 665.35321, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 115, "label": "text", "bbox": {"l": 151.19717, "t": 668.62009, "r": 173.35289, "b": 677.83309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 114, "text": "3.6.5", "bbox": {"l": 151.19717, "t": 668.62009, "r": 173.35289, "b": 677.83309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 116, "label": "text", "bbox": {"l": 178.89182, "t": 668.62009, "r": 339.45105, "b": 677.83309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 115, "text": "Defining and creating column masks", "bbox": {"l": 178.89182, "t": 668.62009, "r": 339.45105, "b": 677.83309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 117, "label": "text", "bbox": {"l": 344.98996, "t": 668.62009, "r": 530.54413, "b": 677.83309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 116, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 344.98996, "t": 668.62009, "r": 530.54413, "b": 677.83309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 118, "label": "text", "bbox": {"l": 536.08301, "t": 668.62009, "r": 547.16089, "b": 677.83309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 117, "text": "26", "bbox": {"l": 536.08301, "t": 668.62009, "r": 547.16089, "b": 677.83309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 119, "label": "text", "bbox": {"l": 151.19717, "t": 681.15973, "r": 173.38359, "b": 690.37273, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 118, "text": "3.6.6", "bbox": {"l": 151.19717, "t": 681.15973, "r": 173.38359, "b": 690.37273, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 120, "label": "text", "bbox": {"l": 178.93019, "t": 681.15973, "r": 530.54102, "b": 690.37273, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 119, "text": "Activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.93019, "t": 681.15973, "r": 530.54102, "b": 690.37273, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 121, "label": "text", "bbox": {"l": 536.08765, "t": 681.15973, "r": 547.18085, "b": 690.37273, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 120, "text": "28", "bbox": {"l": 536.08765, "t": 681.15973, "r": 547.18085, "b": 690.37273, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 122, "label": "text", "bbox": {"l": 151.19717, "t": 693.63961, "r": 173.32332, "b": 702.852615, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 121, "text": "3.6.7", "bbox": {"l": 151.19717, "t": 693.63961, "r": 173.32332, "b": 702.852615, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 123, "label": "text", "bbox": {"l": 178.85486, "t": 693.63961, "r": 350.80011, "b": 702.852615, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 122, "text": "Demonstrating data access with RCAC", "bbox": {"l": 178.85486, "t": 693.63961, "r": 350.80011, "b": 702.852615, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 124, "label": "text", "bbox": {"l": 356.33163, "t": 693.63961, "r": 530.57507, "b": 702.852615, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 123, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 356.33163, "t": 693.63961, "r": 530.57507, "b": 702.852615, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 125, "label": "text", "bbox": {"l": 536.10663, "t": 693.63961, "r": 547.16968, "b": 702.852615, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 124, "text": "29", "bbox": {"l": 536.10663, "t": 693.63961, "r": 547.16968, "b": 702.852615, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 126, "label": "text", "bbox": {"l": 151.19717, "t": 706.119492, "r": 173.44592, "b": 715.332497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 125, "text": "3.6.8", "bbox": {"l": 151.19717, "t": 706.119492, "r": 173.44592, "b": 715.332497, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 127, "label": "text", "bbox": {"l": 179.00812, "t": 706.119492, "r": 530.43628, "b": 715.332497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 126, "text": "Demonstrating data access with a view and RCAC . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 179.00812, "t": 706.119492, "r": 530.43628, "b": 715.332497, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 128, "label": "text", "bbox": {"l": 535.99847, "t": 706.119492, "r": 547.12286, "b": 715.332497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 127, "text": "32", "bbox": {"l": 535.99847, "t": 706.119492, "r": 547.12286, "b": 715.332497, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 43, "num_cols": 2, "table_cells": [{"bbox": {"l": 136.8, "t": 132.64862000000005, "r": 172.89404, "b": 141.86163, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Notices", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 175.01952, "t": 132.64862000000005, "r": 547.18982, "b": 141.86163, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vii", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79901, "t": 145.12847999999997, "r": 189.86537, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Trademarks", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 195.39685, "t": 145.12847999999997, "r": 547.18286, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . viii", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79901, "t": 167.62811, "r": 279.39731, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "DB2 for i Center of Excellence", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.61942, "t": 167.62811, "r": 547.1908, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ix", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79901, "t": 190.12775, "r": 172.84424, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Preface", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 175.01852, "t": 190.12775, "r": 547.18286, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79803, "t": 202.60760000000005, "r": 547.18085, "b": 211.82061999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Authors . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79803, "t": 215.14721999999995, "r": 339.18292, "b": 224.36023, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Now you can become a published author, too!", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 344.71411, "t": 215.14721999999995, "r": 547.13879, "b": 224.36023, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xiii", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79803, "t": 227.62707999999998, "r": 529.99506, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Comments welcome. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 535.5495, "t": 227.62707999999998, "r": 547.19788, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "xiii", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79807, "t": 240.10693000000003, "r": 284.02866, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Stay connected to IBM Redbooks", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.54449, "t": 240.10693000000003, "r": 547.12115, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xiv", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79807, "t": 262.60657000000003, "r": 536.09589, "b": 271.81958, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Chapter 1. Securing and protecting IBM DB2 data  . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.64685, "t": 262.60657000000003, "r": 547.19781, "b": 271.81958, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79808, "t": 274.60637999999994, "r": 549.84723, "b": 283.8194, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "1.1 Security fundamentals. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79807, "t": 287.14606000000003, "r": 536.12933, "b": 296.35904, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "1.2 Current state of IBM i security . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.66113, "t": 287.14606000000003, "r": 547.19287, "b": 296.35904, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79807, "t": 299.62595, "r": 549.84723, "b": 308.83893, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "1.3 DB2 for i security controls . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 312.1058300000001, "r": 536.05511, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "1.3.1 Existing row and column control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.6015, "t": 312.1058300000001, "r": 547.14795, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 324.64548, "r": 536.08008, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "1.3.2 New controls: Row and Column Access Control. . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.6355, "t": 324.64548, "r": 547.19092, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79704, "t": 347.14511, "r": 536.09088, "b": 356.35809, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 14, "end_row_offset_idx": 15, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Chapter 2. Roles and separation of duties . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.64282, "t": 347.14511, "r": 547.19476, "b": 356.35809, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 14, "end_row_offset_idx": 15, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79704, "t": 359.14493, "r": 536.12714, "b": 368.35791, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 15, "end_row_offset_idx": 16, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1 Roles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.66589, "t": 359.14493, "r": 547.20471, "b": 368.35791, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 15, "end_row_offset_idx": 16, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 371.62482, "r": 535.9527, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 16, "end_row_offset_idx": 17, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.1 DDM and DRDA application server access: QIBM_DB_DDMDRDA . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.55585, "t": 371.62482, "r": 547.15906, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 16, "end_row_offset_idx": 17, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 384.10470999999995, "r": 536.04108, "b": 393.31769, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 17, "end_row_offset_idx": 18, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.2 Toolbox application server access: QIBM_DB_ZDA. . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.59595, "t": 384.10470999999995, "r": 547.15082, "b": 393.31769, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 17, "end_row_offset_idx": 18, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 396.64435, "r": 536.07489, "b": 405.85733, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 18, "end_row_offset_idx": 19, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.3 Database Administrator function: QIBM_DB_SQLADM . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.63025, "t": 396.64435, "r": 547.18561, "b": 405.85733, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 18, "end_row_offset_idx": 19, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 409.12424000000004, "r": 411.27048, "b": 418.33722, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 19, "end_row_offset_idx": 20, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.4 Database Information function: QIBM_DB_SYSMON", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 416.81775, "t": 409.12424000000004, "r": 547.17865, "b": 418.33722, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 19, "end_row_offset_idx": 20, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . 9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 421.60413, "r": 536.03589, "b": 430.81711, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 20, "end_row_offset_idx": 21, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.5 Security Administrator function: QIBM_DB_SECADM . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.59894, "t": 421.60413, "r": 547.16193, "b": 430.81711, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 20, "end_row_offset_idx": 21, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 434.1437700000001, "r": 530.57318, "b": 443.35675, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 21, "end_row_offset_idx": 22, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.6 Change Function Usage CL command . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.10443, "t": 434.1437700000001, "r": 547.16687, "b": 443.35675, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 21, "end_row_offset_idx": 22, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "10", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 446.62366, "r": 530.53522, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 22, "end_row_offset_idx": 23, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.7 Verifying function usage IDs for RCAC with the FUNCTION_USAGE view . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.0755, "t": 446.62366, "r": 547.15601, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 22, "end_row_offset_idx": 23, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "10", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79704, "t": 459.10355, "r": 547.25659, "b": 468.31653, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 23, "end_row_offset_idx": 24, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.2 Separation of duties . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79703, "t": 481.60318, "r": 530.53961, "b": 490.81616, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 24, "end_row_offset_idx": 25, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Chapter 3. Row and Column Access Control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.09167, "t": 481.60318, "r": 547.1958, "b": 490.81616, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 24, "end_row_offset_idx": 25, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "13", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79703, "t": 493.603, "r": 530.4809, "b": 502.81598, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 25, "end_row_offset_idx": 26, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.1 Explanation of RCAC and the concept of access control . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.04248, "t": 493.603, "r": 547.16571, "b": 502.81598, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 25, "end_row_offset_idx": 26, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "14", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19719, "t": 506.14264, "r": 378.20786, "b": 515.35562, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 26, "end_row_offset_idx": 27, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.1.1 Row permission and column mask definitions", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 383.74713, "t": 506.14264, "r": 547.15576, "b": 515.35562, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 26, "end_row_offset_idx": 27, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . 14", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19719, "t": 518.62253, "r": 530.43475, "b": 527.83551, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 27, "end_row_offset_idx": 28, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.1.2 Enabling and activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 535.99622, "t": 518.62253, "r": 547.11908, "b": 527.83551, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 27, "end_row_offset_idx": 28, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "16", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79703, "t": 531.1621700000001, "r": 530.52808, "b": 540.37517, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 28, "end_row_offset_idx": 29, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.2 Special registers and built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.06702, "t": 531.1621700000001, "r": 547.14484, "b": 540.37517, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 28, "end_row_offset_idx": 29, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "18", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19719, "t": 543.64204, "r": 530.49786, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 29, "end_row_offset_idx": 30, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.2.1 Special registers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.05188, "t": 543.64204, "r": 547.15991, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 29, "end_row_offset_idx": 30, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "18", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19719, "t": 556.12192, "r": 530.56024, "b": 565.33492, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 30, "end_row_offset_idx": 31, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.2.2 Built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.09912, "t": 556.12192, "r": 547.17688, "b": 565.33492, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 30, "end_row_offset_idx": 31, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "19", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79703, "t": 568.66156, "r": 530.53027, "b": 577.87456, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 31, "end_row_offset_idx": 32, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.3 VERIFY_GROUP_FOR_USER function . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.06152, "t": 568.66156, "r": 547.12402, "b": 577.87456, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 31, "end_row_offset_idx": 32, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "20", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79703, "t": 581.14143, "r": 530.62994, "b": 590.35443, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 32, "end_row_offset_idx": 33, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.4 Establishing and controlling accessibility by using the RCAC rule text . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.16315, "t": 581.14143, "r": 547.22955, "b": 590.35443, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 32, "end_row_offset_idx": 33, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "21", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79701, "t": 593.62131, "r": 530.56512, "b": 615.37395, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 34, "end_row_offset_idx": 35, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.5 SELECT, INSERT, and UPDATE behavior with RCAC 3.6 Human resources example . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 400.32065, "t": 593.62131, "r": 530.48358, "b": 602.8343, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 33, "end_row_offset_idx": 34, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": ". . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.0224, "t": 593.62131, "r": 547.1001, "b": 602.8343, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 33, "end_row_offset_idx": 34, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "22", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.112, "t": 606.16095, "r": 547.20575, "b": 615.37395, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 34, "end_row_offset_idx": 35, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "22", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717, "t": 618.64082, "r": 530.49139, "b": 627.85382, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 35, "end_row_offset_idx": 36, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.1 Assigning the QIBM_DB_SECADM function ID to the consultants. . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.04633, "t": 618.64082, "r": 547.15619, "b": 627.85382, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 35, "end_row_offset_idx": 36, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "23", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717, "t": 631.1206999999999, "r": 530.56458, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 36, "end_row_offset_idx": 37, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.2 Creating group profiles for the users and their roles . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.09601, "t": 631.1206999999999, "r": 547.15875, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 36, "end_row_offset_idx": 37, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "23", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717, "t": 643.66034, "r": 530.55695, "b": 652.87334, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 37, "end_row_offset_idx": 38, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.3 Demonstrating data access without RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.0882, "t": 643.66034, "r": 547.15076, "b": 652.87334, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 37, "end_row_offset_idx": 38, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "24", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717, "t": 656.14021, "r": 530.53412, "b": 665.35321, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 38, "end_row_offset_idx": 39, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.4 Defining and creating row permissions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.073, "t": 656.14021, "r": 547.15088, "b": 665.35321, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 38, "end_row_offset_idx": 39, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "25", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717, "t": 668.62009, "r": 339.45105, "b": 677.83309, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 39, "end_row_offset_idx": 40, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.5 Defining and creating column masks", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 344.98996, "t": 668.62009, "r": 547.16089, "b": 677.83309, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 39, "end_row_offset_idx": 40, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717, "t": 681.15973, "r": 530.54102, "b": 690.37273, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 40, "end_row_offset_idx": 41, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.6 Activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.08765, "t": 681.15973, "r": 547.18085, "b": 690.37273, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 40, "end_row_offset_idx": 41, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "28", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717, "t": 693.63961, "r": 530.57507, "b": 702.852615, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 41, "end_row_offset_idx": 42, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.7 Demonstrating data access with RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.10663, "t": 693.63961, "r": 547.16968, "b": 702.852615, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 41, "end_row_offset_idx": 42, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "29", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717, "t": 706.119492, "r": 530.43628, "b": 715.332497, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 42, "end_row_offset_idx": 43, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.8 Demonstrating data access with a view and RCAC . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 535.99847, "t": 706.119492, "r": 547.12286, "b": 715.332497, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 42, "end_row_offset_idx": 43, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "32", "column_header": false, "row_header": false, "row_section": false}]}], "headers": [{"label": "page_footer", "id": 2, "page_no": 1, "cluster": {"id": 2, "label": "page_footer", "bbox": {"l": 64.800003, "t": 755.538002, "r": 257.24335, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9473597407341003, "cells": [{"id": 0, "text": "' Copyright IBM Corp. 2014. All rights reserved.", "bbox": {"l": 64.800003, "t": 755.538002, "r": 257.24335, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "' Copyright IBM Corp. 2014. All rights reserved."}, {"label": "page_footer", "id": 3, "page_no": 1, "cluster": {"id": 3, "label": "page_footer", "bbox": {"l": 538.85999, "t": 754.848721, "r": 547.25928, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.8926277160644531, "cells": [{"id": 1, "text": "iii", "bbox": {"l": 538.85999, "t": 754.848721, "r": 547.25928, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "iii"}]}}, {"page_no": 2, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "DB2 for i Center of Excellence", "bbox": {"l": 64.800003, "t": 74.48395000000005, "r": 235.8624, "b": 85.58398, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Solution Brief", "bbox": {"l": 94.132698, "t": 148.63933999999995, "r": 139.54634, "b": 155.33642999999995, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "IBM Systems Lab Services and Training", "bbox": {"l": 94.134933, "t": 138.45012999999994, "r": 233.99973, "b": 145.22162000000003, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Power Services", "bbox": {"l": 461.08859000000007, "t": 138.40752999999995, "r": 506.26178, "b": 145.42181000000005, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "DB2 for i", "bbox": {"l": 280.24011, "t": 239.34265000000005, "r": 354.57022, "b": 256.26153999999997, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Center of Excellence ", "bbox": {"l": 280.24011, "t": 259.70165999999995, "r": 463.80942, "b": 276.62054, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Expert help to achieve your business requirements", "bbox": {"l": 280.24011, "t": 277.59027000000003, "r": 483.29572, "b": 287.45959, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "We build confident, satisfied clients", "bbox": {"l": 280.24011, "t": 315.88161999999994, "r": 443.28210000000007, "b": 324.89566, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "No one else has the vast consulting experiences, skills sharing and ", "bbox": {"l": 280.24011, "t": 327.37595, "r": 488.15466, "b": 334.77994, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "renown service offerings to do what we can do for you.", "bbox": {"l": 280.24011, "t": 337.55551, "r": 452.34018, "b": 344.9595, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Because no one else is IBM.", "bbox": {"l": 280.24011, "t": 357.3260200000001, "r": 367.86023, "b": 364.73001, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "With combined experiences and direct access to development groups, ", "bbox": {"l": 280.24011, "t": 377.09801999999996, "r": 500.32104000000004, "b": 384.50201, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "we\u2019re the experts in IBM DB2\u00ae for i. The DB2 for i Center of ", "bbox": {"l": 280.24011, "t": 387.27759, "r": 479.25497, "b": 394.68158, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Excellence (CoE) can help you achieve-perhaps reexamine and ", "bbox": {"l": 280.24011, "t": 397.45715, "r": 483.4667400000001, "b": 404.86115, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "exceed-your business requirements and gain more confidence and ", "bbox": {"l": 280.24011, "t": 407.63672, "r": 492.97656, "b": 415.04071000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "satisfaction in IBM product data management products and solutions.", "bbox": {"l": 280.24011, "t": 417.81628, "r": 498.87, "b": 425.22027999999995, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Who we are, some of what we do", "bbox": {"l": 280.24011, "t": 437.85403, "r": 434.83205999999996, "b": 446.86807, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "Global CoE engagements cover topics including:", "bbox": {"l": 280.24011, "t": 449.34824000000003, "r": 434.56316999999996, "b": 456.75223, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "r ", "bbox": {"l": 280.24011, "t": 470.95236, "r": 284.0993, "b": 476.16074, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Database performance and scalability", "bbox": {"l": 287.28961, "t": 469.11826, "r": 401.56412, "b": 476.52225, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "r ", "bbox": {"l": 280.24011, "t": 481.13507, "r": 284.0993, "b": 486.34344, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Advanced SQL knowledge and skills transfer", "bbox": {"l": 287.28961, "t": 479.30096, "r": 424.99646, "b": 486.70496, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "r ", "bbox": {"l": 280.24011, "t": 491.31766, "r": 284.0993, "b": 496.52603, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Business intelligence and analytics", "bbox": {"l": 287.28961, "t": 489.48355, "r": 392.15845, "b": 496.88754, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "r ", "bbox": {"l": 280.24011, "t": 501.50037, "r": 284.0993, "b": 506.70874, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "DB2 Web Query", "bbox": {"l": 287.28961, "t": 499.66626, "r": 339.94354, "b": 507.07025, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "r ", "bbox": {"l": 280.24011, "t": 511.68295, "r": 284.0993, "b": 516.8913299999999, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Query/400 modernization for better reporting and analysis capabilities", "bbox": {"l": 287.28961, "t": 509.84885, "r": 504.19314999999995, "b": 517.25284, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "r ", "bbox": {"l": 280.24011, "t": 521.8656599999999, "r": 284.0993, "b": 527.07404, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Database modernization and re-engineering", "bbox": {"l": 287.28961, "t": 520.03156, "r": 423.0022, "b": 527.4355499999999, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "r ", "bbox": {"l": 280.24011, "t": 532.04825, "r": 284.0993, "b": 537.2566400000001, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Data-centric architecture and design", "bbox": {"l": 287.28961, "t": 530.21414, "r": 399.65173, "b": 537.61813, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "r ", "bbox": {"l": 280.24011, "t": 542.23083, "r": 284.0993, "b": 547.43924, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "Extremely large database and overcoming limits to growth", "bbox": {"l": 287.28961, "t": 540.39674, "r": 466.77881, "b": 547.80074, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "r ", "bbox": {"l": 280.24011, "t": 552.41354, "r": 284.0993, "b": 557.62195, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "ISV education and enablement", "bbox": {"l": 287.28961, "t": 550.5794500000001, "r": 382.20956, "b": 557.98344, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Highlights ", "bbox": {"l": 144.88921, "t": 327.46163999999993, "r": 188.74681, "b": 336.81406, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "GLYPH<g115>GLYPH<g3>", "bbox": {"l": 144.88921, "t": 346.01953, "r": 148.68732, "b": 350.60168, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "GLYPH<g40>GLYPH<g81>GLYPH<g75>GLYPH<g68>GLYPH<g81>GLYPH<g70>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 151.9388, "t": 345.21707, "r": 177.25424, "b": 350.85666, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "GLYPH<g87>GLYPH<g75>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 176.9472, "t": 345.21707, "r": 187.11098, "b": 350.85666, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g73>GLYPH<g82>GLYPH<g85>GLYPH<g80>GLYPH<g68>GLYPH<g81>GLYPH<g70>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 186.7914, "t": 345.21707, "r": 222.95989999999998, "b": 350.85666, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "GLYPH<g82>GLYPH<g73>GLYPH<g3>", "bbox": {"l": 222.65912, "t": 345.21707, "r": 229.55193999999997, "b": 350.85666, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "GLYPH<g92>GLYPH<g82>GLYPH<g88>GLYPH<g85> GLYPH<g3>", "bbox": {"l": 229.2261, "t": 345.21707, "r": 242.87389000000002, "b": 350.85666, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "GLYPH<g71>GLYPH<g68>GLYPH<g87>GLYPH<g68>GLYPH<g69>GLYPH<g68>GLYPH<g86>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 151.93253, "t": 353.04984, "r": 178.77066, "b": 358.68942, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "GLYPH<g82>GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g68>GLYPH<g87>GLYPH<g76>GLYPH<g82>GLYPH<g81>GLYPH<g86>", "bbox": {"l": 178.46362, "t": 353.04984, "r": 207.16908, "b": 358.68942, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "GLYPH<g115>GLYPH<g3>", "bbox": {"l": 144.88921, "t": 368.73465, "r": 148.68732, "b": 373.3168, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "GLYPH<g40>GLYPH<g68>GLYPH<g85> GLYPH<g81>GLYPH<g3>", "bbox": {"l": 151.9388, "t": 367.93219, "r": 166.05655, "b": 373.57178, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "GLYPH<g74>GLYPH<g85>GLYPH<g72>GLYPH<g68>GLYPH<g87>GLYPH<g72>GLYPH<g85>GLYPH<g3>", "bbox": {"l": 165.73697, "t": 367.93219, "r": 186.40289, "b": 373.57178, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "GLYPH<g85>GLYPH<g72>GLYPH<g87>GLYPH<g88>GLYPH<g85> GLYPH<g81>GLYPH<g3>", "bbox": {"l": 186.09586, "t": 367.93219, "r": 203.61617, "b": 373.57178, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "GLYPH<g82>GLYPH<g81>GLYPH<g3>", "bbox": {"l": 203.30286, "t": 367.93219, "r": 211.82489, "b": 373.57178, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "GLYPH<g44>GLYPH<g55>GLYPH<g3>", "bbox": {"l": 211.49905, "t": 367.93219, "r": 218.16002, "b": 373.57178, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "GLYPH<g83>GLYPH<g85>GLYPH<g82>GLYPH<g77>GLYPH<g72>GLYPH<g70>GLYPH<g87>GLYPH<g86> GLYPH<g3>", "bbox": {"l": 217.83418, "t": 367.93219, "r": 241.30737, "b": 373.57178, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "GLYPH<g87>GLYPH<g75>GLYPH<g85>GLYPH<g82>GLYPH<g88>GLYPH<g74>GLYPH<g75>GLYPH<g3>", "bbox": {"l": 151.93253, "t": 375.76495, "r": 174.46577, "b": 381.40454, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "GLYPH<g80>GLYPH<g82>GLYPH<g71>GLYPH<g72>GLYPH<g85> GLYPH<g81>GLYPH<g76>GLYPH<g93>GLYPH<g68>GLYPH<g87>GLYPH<g76>GLYPH<g82>GLYPH<g81>GLYPH<g3>", "bbox": {"l": 174.15874, "t": 375.76495, "r": 214.4128, "b": 381.40454, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "GLYPH<g82>GLYPH<g73>GLYPH<g3>", "bbox": {"l": 214.11829, "t": 375.76495, "r": 221.01110999999997, "b": 381.40454, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "GLYPH<g71>GLYPH<g68>GLYPH<g87>GLYPH<g68>GLYPH<g69>GLYPH<g68>GLYPH<g86>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 220.68527, "t": 375.76495, "r": 247.52341000000004, "b": 381.40454, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "GLYPH<g68>GLYPH<g81>GLYPH<g71> GLYPH<g3>", "bbox": {"l": 247.21637, "t": 375.76495, "r": 259.2287, "b": 381.40454, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "GLYPH<g68>GLYPH<g83>GLYPH<g83>GLYPH<g79>GLYPH<g76>GLYPH<g70>GLYPH<g68>GLYPH<g87>GLYPH<g76>GLYPH<g82>GLYPH<g81>GLYPH<g86>", "bbox": {"l": 151.93253, "t": 383.59772, "r": 184.61703, "b": 389.2373, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "GLYPH<g115>GLYPH<g3>", "bbox": {"l": 144.88921, "t": 399.28265, "r": 148.68732, "b": 403.86481000000003, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "GLYPH<g53>GLYPH<g72>GLYPH<g79>GLYPH<g92>GLYPH<g3>", "bbox": {"l": 151.9388, "t": 398.48019, "r": 165.36099, "b": 404.11978, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "GLYPH<g82>GLYPH<g81>GLYPH<g3>", "bbox": {"l": 165.04141, "t": 398.48019, "r": 173.56345, "b": 404.11978, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "GLYPH<g44>GLYPH<g37>GLYPH<g48>GLYPH<g3>", "bbox": {"l": 173.23761, "t": 398.48019, "r": 185.95174, "b": 404.11978, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "GLYPH<g72>GLYPH<g91>GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g87>GLYPH<g3>", "bbox": {"l": 185.63216, "t": 398.48019, "r": 204.42448, "b": 404.11978, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "GLYPH<g70>GLYPH<g82>GLYPH<g81>GLYPH<g86>GLYPH<g88>GLYPH<g79>GLYPH<g87>GLYPH<g76>GLYPH<g81>GLYPH<g74>GLYPH<g15>GLYPH<g3>", "bbox": {"l": 204.11118, "t": 398.48019, "r": 235.29178, "b": 404.11978, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "GLYPH<g86>GLYPH<g78>GLYPH<g76>GLYPH<g79>GLYPH<g79>GLYPH<g86> GLYPH<g3>", "bbox": {"l": 234.99099999999999, "t": 398.48019, "r": 249.83562, "b": 404.11978, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "GLYPH<g86>GLYPH<g75>GLYPH<g68>GLYPH<g85>GLYPH<g76>GLYPH<g81>GLYPH<g74>GLYPH<g3>", "bbox": {"l": 151.93253, "t": 406.31296, "r": 173.41306, "b": 411.95255, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "GLYPH<g68>GLYPH<g81>GLYPH<g71>GLYPH<g3>", "bbox": {"l": 173.10602, "t": 406.31296, "r": 185.0118, "b": 411.95255, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "GLYPH<g85>GLYPH<g72>GLYPH<g81>GLYPH<g82>GLYPH<g90>GLYPH<g81>GLYPH<g3>", "bbox": {"l": 184.69221, "t": 406.31296, "r": 206.3858, "b": 411.95255, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "GLYPH<g86>GLYPH<g72>GLYPH<g85>GLYPH<g89>GLYPH<g76>GLYPH<g70>GLYPH<g72>GLYPH<g86>", "bbox": {"l": 206.07249, "t": 406.31296, "r": 228.24231000000003, "b": 411.95255, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "GLYPH<g115>GLYPH<g3>", "bbox": {"l": 144.88921, "t": 421.99773999999996, "r": 148.68732, "b": 426.5799, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "GLYPH<g55>", "bbox": {"l": 151.9388, "t": 421.1952800000001, "r": 155.43533, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "GLYPH<g68>GLYPH<g78>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 154.73979, "t": 421.1952800000001, "r": 166.06282, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "GLYPH<g68>GLYPH<g71>GLYPH<g89>GLYPH<g68>GLYPH<g81>GLYPH<g87>GLYPH<g68>GLYPH<g74>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 165.74324, "t": 421.1952800000001, "r": 195.84607, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "GLYPH<g82>GLYPH<g73>GLYPH<g3>", "bbox": {"l": 195.53903, "t": 421.1952800000001, "r": 202.43185, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "GLYPH<g68>GLYPH<g70>GLYPH<g70>GLYPH<g72>GLYPH<g86>GLYPH<g86>GLYPH<g3>", "bbox": {"l": 202.10602, "t": 421.1952800000001, "r": 222.87220999999997, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "GLYPH<g87>GLYPH<g82>GLYPH<g3>", "bbox": {"l": 222.55890000000002, "t": 421.1952800000001, "r": 229.57077, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "GLYPH<g68> GLYPH<g3>", "bbox": {"l": 229.24492999999998, "t": 421.1952800000001, "r": 234.25163000000003, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "GLYPH<g90>GLYPH<g82>GLYPH<g85>GLYPH<g79>GLYPH<g71>GLYPH<g90>GLYPH<g76>GLYPH<g71>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 151.92627, "t": 429.02805, "r": 181.42754, "b": 434.66763, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "GLYPH<g86>GLYPH<g82>GLYPH<g88>GLYPH<g85>GLYPH<g70>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 181.1205, "t": 429.02805, "r": 201.07835, "b": 434.66763, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "GLYPH<g82>GLYPH<g73>GLYPH<g3>", "bbox": {"l": 200.76505, "t": 429.02805, "r": 207.65787, "b": 434.66763, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "GLYPH<g72>GLYPH<g91>GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g87>GLYPH<g76>GLYPH<g86>GLYPH<g72>", "bbox": {"l": 207.33203, "t": 429.02805, "r": 232.07098000000002, "b": 434.66763, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 26, "label": "text", "bbox": {"l": 64.800003, "t": 74.48395000000005, "r": 235.8624, "b": 85.58398, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 0, "text": "DB2 for i Center of Excellence", "bbox": {"l": 64.800003, "t": 74.48395000000005, "r": 235.8624, "b": 85.58398, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 94.132698, "t": 138.45012999999994, "r": 233.99973, "b": 155.33642999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.7431555986404419, "cells": [{"id": 1, "text": "Solution Brief", "bbox": {"l": 94.132698, "t": 148.63933999999995, "r": 139.54634, "b": 155.33642999999995, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "IBM Systems Lab Services and Training", "bbox": {"l": 94.134933, "t": 138.45012999999994, "r": 233.99973, "b": 145.22162000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 461.08859000000007, "t": 138.40752999999995, "r": 506.26178, "b": 145.42181000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.7798982858657837, "cells": [{"id": 3, "text": "Power Services", "bbox": {"l": 461.08859000000007, "t": 138.40752999999995, "r": 506.26178, "b": 145.42181000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "section_header", "bbox": {"l": 280.24011, "t": 239.34265000000005, "r": 463.80942, "b": 276.62054, "coord_origin": "TOPLEFT"}, "confidence": 0.7587865591049194, "cells": [{"id": 4, "text": "DB2 for i", "bbox": {"l": 280.24011, "t": 239.34265000000005, "r": 354.57022, "b": 256.26153999999997, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Center of Excellence ", "bbox": {"l": 280.24011, "t": 259.70165999999995, "r": 463.80942, "b": 276.62054, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 280.24011, "t": 277.59027000000003, "r": 483.29572, "b": 287.45959, "coord_origin": "TOPLEFT"}, "confidence": 0.7965622544288635, "cells": [{"id": 6, "text": "Expert help to achieve your business requirements", "bbox": {"l": 280.24011, "t": 277.59027000000003, "r": 483.29572, "b": 287.45959, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "section_header", "bbox": {"l": 280.24011, "t": 315.88161999999994, "r": 443.28210000000007, "b": 324.89566, "coord_origin": "TOPLEFT"}, "confidence": 0.8913541436195374, "cells": [{"id": 7, "text": "We build confident, satisfied clients", "bbox": {"l": 280.24011, "t": 315.88161999999994, "r": 443.28210000000007, "b": 324.89566, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 280.24011, "t": 327.37595, "r": 488.15466, "b": 344.9595, "coord_origin": "TOPLEFT"}, "confidence": 0.9560741782188416, "cells": [{"id": 8, "text": "No one else has the vast consulting experiences, skills sharing and ", "bbox": {"l": 280.24011, "t": 327.37595, "r": 488.15466, "b": 334.77994, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "renown service offerings to do what we can do for you.", "bbox": {"l": 280.24011, "t": 337.55551, "r": 452.34018, "b": 344.9595, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 280.24011, "t": 357.3260200000001, "r": 367.86023, "b": 364.73001, "coord_origin": "TOPLEFT"}, "confidence": 0.8260757923126221, "cells": [{"id": 10, "text": "Because no one else is IBM.", "bbox": {"l": 280.24011, "t": 357.3260200000001, "r": 367.86023, "b": 364.73001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 280.24011, "t": 377.09801999999996, "r": 500.32104000000004, "b": 425.22027999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9764723181724548, "cells": [{"id": 11, "text": "With combined experiences and direct access to development groups, ", "bbox": {"l": 280.24011, "t": 377.09801999999996, "r": 500.32104000000004, "b": 384.50201, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "we\u2019re the experts in IBM DB2\u00ae for i. The DB2 for i Center of ", "bbox": {"l": 280.24011, "t": 387.27759, "r": 479.25497, "b": 394.68158, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Excellence (CoE) can help you achieve-perhaps reexamine and ", "bbox": {"l": 280.24011, "t": 397.45715, "r": 483.4667400000001, "b": 404.86115, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "exceed-your business requirements and gain more confidence and ", "bbox": {"l": 280.24011, "t": 407.63672, "r": 492.97656, "b": 415.04071000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "satisfaction in IBM product data management products and solutions.", "bbox": {"l": 280.24011, "t": 417.81628, "r": 498.87, "b": 425.22027999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "section_header", "bbox": {"l": 280.24011, "t": 437.85403, "r": 434.83205999999996, "b": 446.86807, "coord_origin": "TOPLEFT"}, "confidence": 0.8492127060890198, "cells": [{"id": 16, "text": "Who we are, some of what we do", "bbox": {"l": 280.24011, "t": 437.85403, "r": 434.83205999999996, "b": 446.86807, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 280.24011, "t": 449.34824000000003, "r": 434.56316999999996, "b": 456.75223, "coord_origin": "TOPLEFT"}, "confidence": 0.8440335392951965, "cells": [{"id": 17, "text": "Global CoE engagements cover topics including:", "bbox": {"l": 280.24011, "t": 449.34824000000003, "r": 434.56316999999996, "b": 456.75223, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "list_item", "bbox": {"l": 280.24011, "t": 469.11826, "r": 401.56412, "b": 476.52225, "coord_origin": "TOPLEFT"}, "confidence": 0.9239600896835327, "cells": [{"id": 18, "text": "r ", "bbox": {"l": 280.24011, "t": 470.95236, "r": 284.0993, "b": 476.16074, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Database performance and scalability", "bbox": {"l": 287.28961, "t": 469.11826, "r": 401.56412, "b": 476.52225, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "list_item", "bbox": {"l": 280.24011, "t": 479.30096, "r": 424.99646, "b": 486.70496, "coord_origin": "TOPLEFT"}, "confidence": 0.9239721298217773, "cells": [{"id": 20, "text": "r ", "bbox": {"l": 280.24011, "t": 481.13507, "r": 284.0993, "b": 486.34344, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Advanced SQL knowledge and skills transfer", "bbox": {"l": 287.28961, "t": 479.30096, "r": 424.99646, "b": 486.70496, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "list_item", "bbox": {"l": 280.24011, "t": 489.48355, "r": 392.15845, "b": 496.88754, "coord_origin": "TOPLEFT"}, "confidence": 0.9157900214195251, "cells": [{"id": 22, "text": "r ", "bbox": {"l": 280.24011, "t": 491.31766, "r": 284.0993, "b": 496.52603, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Business intelligence and analytics", "bbox": {"l": 287.28961, "t": 489.48355, "r": 392.15845, "b": 496.88754, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "list_item", "bbox": {"l": 280.24011, "t": 499.66626, "r": 339.94354, "b": 507.07025, "coord_origin": "TOPLEFT"}, "confidence": 0.8733457326889038, "cells": [{"id": 24, "text": "r ", "bbox": {"l": 280.24011, "t": 501.50037, "r": 284.0993, "b": 506.70874, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "DB2 Web Query", "bbox": {"l": 287.28961, "t": 499.66626, "r": 339.94354, "b": 507.07025, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "list_item", "bbox": {"l": 280.24011, "t": 509.84885, "r": 504.19314999999995, "b": 517.25284, "coord_origin": "TOPLEFT"}, "confidence": 0.9249242544174194, "cells": [{"id": 26, "text": "r ", "bbox": {"l": 280.24011, "t": 511.68295, "r": 284.0993, "b": 516.8913299999999, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Query/400 modernization for better reporting and analysis capabilities", "bbox": {"l": 287.28961, "t": 509.84885, "r": 504.19314999999995, "b": 517.25284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "list_item", "bbox": {"l": 280.24011, "t": 520.03156, "r": 423.0022, "b": 527.4355499999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9109312891960144, "cells": [{"id": 28, "text": "r ", "bbox": {"l": 280.24011, "t": 521.8656599999999, "r": 284.0993, "b": 527.07404, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Database modernization and re-engineering", "bbox": {"l": 287.28961, "t": 520.03156, "r": 423.0022, "b": 527.4355499999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "list_item", "bbox": {"l": 280.24011, "t": 530.21414, "r": 399.65173, "b": 537.61813, "coord_origin": "TOPLEFT"}, "confidence": 0.8977466225624084, "cells": [{"id": 30, "text": "r ", "bbox": {"l": 280.24011, "t": 532.04825, "r": 284.0993, "b": 537.2566400000001, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Data-centric architecture and design", "bbox": {"l": 287.28961, "t": 530.21414, "r": 399.65173, "b": 537.61813, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "list_item", "bbox": {"l": 280.24011, "t": 540.39674, "r": 466.77881, "b": 547.80074, "coord_origin": "TOPLEFT"}, "confidence": 0.9218331575393677, "cells": [{"id": 32, "text": "r ", "bbox": {"l": 280.24011, "t": 542.23083, "r": 284.0993, "b": 547.43924, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "Extremely large database and overcoming limits to growth", "bbox": {"l": 287.28961, "t": 540.39674, "r": 466.77881, "b": 547.80074, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "list_item", "bbox": {"l": 280.24011, "t": 550.5794500000001, "r": 382.20956, "b": 557.98344, "coord_origin": "TOPLEFT"}, "confidence": 0.9075438976287842, "cells": [{"id": 34, "text": "r ", "bbox": {"l": 280.24011, "t": 552.41354, "r": 284.0993, "b": 557.62195, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "ISV education and enablement", "bbox": {"l": 287.28961, "t": 550.5794500000001, "r": 382.20956, "b": 557.98344, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "section_header", "bbox": {"l": 144.88921, "t": 327.46163999999993, "r": 188.74681, "b": 336.81406, "coord_origin": "TOPLEFT"}, "confidence": 0.9098502993583679, "cells": [{"id": 36, "text": "Highlights ", "bbox": {"l": 144.88921, "t": 327.46163999999993, "r": 188.74681, "b": 336.81406, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "list_item", "bbox": {"l": 144.88921, "t": 345.21707, "r": 242.87389000000002, "b": 358.68942, "coord_origin": "TOPLEFT"}, "confidence": 0.957169771194458, "cells": [{"id": 37, "text": "GLYPH<g115>GLYPH<g3>", "bbox": {"l": 144.88921, "t": 346.01953, "r": 148.68732, "b": 350.60168, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "GLYPH<g40>GLYPH<g81>GLYPH<g75>GLYPH<g68>GLYPH<g81>GLYPH<g70>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 151.9388, "t": 345.21707, "r": 177.25424, "b": 350.85666, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "GLYPH<g87>GLYPH<g75>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 176.9472, "t": 345.21707, "r": 187.11098, "b": 350.85666, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g73>GLYPH<g82>GLYPH<g85>GLYPH<g80>GLYPH<g68>GLYPH<g81>GLYPH<g70>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 186.7914, "t": 345.21707, "r": 222.95989999999998, "b": 350.85666, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "GLYPH<g82>GLYPH<g73>GLYPH<g3>", "bbox": {"l": 222.65912, "t": 345.21707, "r": 229.55193999999997, "b": 350.85666, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "GLYPH<g92>GLYPH<g82>GLYPH<g88>GLYPH<g85> GLYPH<g3>", "bbox": {"l": 229.2261, "t": 345.21707, "r": 242.87389000000002, "b": 350.85666, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "GLYPH<g71>GLYPH<g68>GLYPH<g87>GLYPH<g68>GLYPH<g69>GLYPH<g68>GLYPH<g86>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 151.93253, "t": 353.04984, "r": 178.77066, "b": 358.68942, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "GLYPH<g82>GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g68>GLYPH<g87>GLYPH<g76>GLYPH<g82>GLYPH<g81>GLYPH<g86>", "bbox": {"l": 178.46362, "t": 353.04984, "r": 207.16908, "b": 358.68942, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "list_item", "bbox": {"l": 144.88921, "t": 367.93219, "r": 259.2287, "b": 389.2373, "coord_origin": "TOPLEFT"}, "confidence": 0.9634580612182617, "cells": [{"id": 45, "text": "GLYPH<g115>GLYPH<g3>", "bbox": {"l": 144.88921, "t": 368.73465, "r": 148.68732, "b": 373.3168, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "GLYPH<g40>GLYPH<g68>GLYPH<g85> GLYPH<g81>GLYPH<g3>", "bbox": {"l": 151.9388, "t": 367.93219, "r": 166.05655, "b": 373.57178, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "GLYPH<g74>GLYPH<g85>GLYPH<g72>GLYPH<g68>GLYPH<g87>GLYPH<g72>GLYPH<g85>GLYPH<g3>", "bbox": {"l": 165.73697, "t": 367.93219, "r": 186.40289, "b": 373.57178, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "GLYPH<g85>GLYPH<g72>GLYPH<g87>GLYPH<g88>GLYPH<g85> GLYPH<g81>GLYPH<g3>", "bbox": {"l": 186.09586, "t": 367.93219, "r": 203.61617, "b": 373.57178, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "GLYPH<g82>GLYPH<g81>GLYPH<g3>", "bbox": {"l": 203.30286, "t": 367.93219, "r": 211.82489, "b": 373.57178, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "GLYPH<g44>GLYPH<g55>GLYPH<g3>", "bbox": {"l": 211.49905, "t": 367.93219, "r": 218.16002, "b": 373.57178, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "GLYPH<g83>GLYPH<g85>GLYPH<g82>GLYPH<g77>GLYPH<g72>GLYPH<g70>GLYPH<g87>GLYPH<g86> GLYPH<g3>", "bbox": {"l": 217.83418, "t": 367.93219, "r": 241.30737, "b": 373.57178, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "GLYPH<g87>GLYPH<g75>GLYPH<g85>GLYPH<g82>GLYPH<g88>GLYPH<g74>GLYPH<g75>GLYPH<g3>", "bbox": {"l": 151.93253, "t": 375.76495, "r": 174.46577, "b": 381.40454, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "GLYPH<g80>GLYPH<g82>GLYPH<g71>GLYPH<g72>GLYPH<g85> GLYPH<g81>GLYPH<g76>GLYPH<g93>GLYPH<g68>GLYPH<g87>GLYPH<g76>GLYPH<g82>GLYPH<g81>GLYPH<g3>", "bbox": {"l": 174.15874, "t": 375.76495, "r": 214.4128, "b": 381.40454, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "GLYPH<g82>GLYPH<g73>GLYPH<g3>", "bbox": {"l": 214.11829, "t": 375.76495, "r": 221.01110999999997, "b": 381.40454, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "GLYPH<g71>GLYPH<g68>GLYPH<g87>GLYPH<g68>GLYPH<g69>GLYPH<g68>GLYPH<g86>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 220.68527, "t": 375.76495, "r": 247.52341000000004, "b": 381.40454, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "GLYPH<g68>GLYPH<g81>GLYPH<g71> GLYPH<g3>", "bbox": {"l": 247.21637, "t": 375.76495, "r": 259.2287, "b": 381.40454, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "GLYPH<g68>GLYPH<g83>GLYPH<g83>GLYPH<g79>GLYPH<g76>GLYPH<g70>GLYPH<g68>GLYPH<g87>GLYPH<g76>GLYPH<g82>GLYPH<g81>GLYPH<g86>", "bbox": {"l": 151.93253, "t": 383.59772, "r": 184.61703, "b": 389.2373, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "list_item", "bbox": {"l": 144.88921, "t": 398.48019, "r": 249.83562, "b": 411.95255, "coord_origin": "TOPLEFT"}, "confidence": 0.9541196823120117, "cells": [{"id": 58, "text": "GLYPH<g115>GLYPH<g3>", "bbox": {"l": 144.88921, "t": 399.28265, "r": 148.68732, "b": 403.86481000000003, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "GLYPH<g53>GLYPH<g72>GLYPH<g79>GLYPH<g92>GLYPH<g3>", "bbox": {"l": 151.9388, "t": 398.48019, "r": 165.36099, "b": 404.11978, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "GLYPH<g82>GLYPH<g81>GLYPH<g3>", "bbox": {"l": 165.04141, "t": 398.48019, "r": 173.56345, "b": 404.11978, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "GLYPH<g44>GLYPH<g37>GLYPH<g48>GLYPH<g3>", "bbox": {"l": 173.23761, "t": 398.48019, "r": 185.95174, "b": 404.11978, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "GLYPH<g72>GLYPH<g91>GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g87>GLYPH<g3>", "bbox": {"l": 185.63216, "t": 398.48019, "r": 204.42448, "b": 404.11978, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "GLYPH<g70>GLYPH<g82>GLYPH<g81>GLYPH<g86>GLYPH<g88>GLYPH<g79>GLYPH<g87>GLYPH<g76>GLYPH<g81>GLYPH<g74>GLYPH<g15>GLYPH<g3>", "bbox": {"l": 204.11118, "t": 398.48019, "r": 235.29178, "b": 404.11978, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "GLYPH<g86>GLYPH<g78>GLYPH<g76>GLYPH<g79>GLYPH<g79>GLYPH<g86> GLYPH<g3>", "bbox": {"l": 234.99099999999999, "t": 398.48019, "r": 249.83562, "b": 404.11978, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "GLYPH<g86>GLYPH<g75>GLYPH<g68>GLYPH<g85>GLYPH<g76>GLYPH<g81>GLYPH<g74>GLYPH<g3>", "bbox": {"l": 151.93253, "t": 406.31296, "r": 173.41306, "b": 411.95255, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "GLYPH<g68>GLYPH<g81>GLYPH<g71>GLYPH<g3>", "bbox": {"l": 173.10602, "t": 406.31296, "r": 185.0118, "b": 411.95255, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "GLYPH<g85>GLYPH<g72>GLYPH<g81>GLYPH<g82>GLYPH<g90>GLYPH<g81>GLYPH<g3>", "bbox": {"l": 184.69221, "t": 406.31296, "r": 206.3858, "b": 411.95255, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "GLYPH<g86>GLYPH<g72>GLYPH<g85>GLYPH<g89>GLYPH<g76>GLYPH<g70>GLYPH<g72>GLYPH<g86>", "bbox": {"l": 206.07249, "t": 406.31296, "r": 228.24231000000003, "b": 411.95255, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "list_item", "bbox": {"l": 144.88921, "t": 421.1952800000001, "r": 234.25163000000003, "b": 434.66763, "coord_origin": "TOPLEFT"}, "confidence": 0.9440370798110962, "cells": [{"id": 69, "text": "GLYPH<g115>GLYPH<g3>", "bbox": {"l": 144.88921, "t": 421.99773999999996, "r": 148.68732, "b": 426.5799, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "GLYPH<g55>", "bbox": {"l": 151.9388, "t": 421.1952800000001, "r": 155.43533, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "GLYPH<g68>GLYPH<g78>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 154.73979, "t": 421.1952800000001, "r": 166.06282, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "GLYPH<g68>GLYPH<g71>GLYPH<g89>GLYPH<g68>GLYPH<g81>GLYPH<g87>GLYPH<g68>GLYPH<g74>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 165.74324, "t": 421.1952800000001, "r": 195.84607, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "GLYPH<g82>GLYPH<g73>GLYPH<g3>", "bbox": {"l": 195.53903, "t": 421.1952800000001, "r": 202.43185, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "GLYPH<g68>GLYPH<g70>GLYPH<g70>GLYPH<g72>GLYPH<g86>GLYPH<g86>GLYPH<g3>", "bbox": {"l": 202.10602, "t": 421.1952800000001, "r": 222.87220999999997, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "GLYPH<g87>GLYPH<g82>GLYPH<g3>", "bbox": {"l": 222.55890000000002, "t": 421.1952800000001, "r": 229.57077, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "GLYPH<g68> GLYPH<g3>", "bbox": {"l": 229.24492999999998, "t": 421.1952800000001, "r": 234.25163000000003, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "GLYPH<g90>GLYPH<g82>GLYPH<g85>GLYPH<g79>GLYPH<g71>GLYPH<g90>GLYPH<g76>GLYPH<g71>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 151.92627, "t": 429.02805, "r": 181.42754, "b": 434.66763, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "GLYPH<g86>GLYPH<g82>GLYPH<g88>GLYPH<g85>GLYPH<g70>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 181.1205, "t": 429.02805, "r": 201.07835, "b": 434.66763, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "GLYPH<g82>GLYPH<g73>GLYPH<g3>", "bbox": {"l": 200.76505, "t": 429.02805, "r": 207.65787, "b": 434.66763, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "GLYPH<g72>GLYPH<g91>GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g87>GLYPH<g76>GLYPH<g86>GLYPH<g72>", "bbox": {"l": 207.33203, "t": 429.02805, "r": 232.07098000000002, "b": 434.66763, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "picture", "bbox": {"l": 143.39866638183594, "t": 270.2610778808594, "r": 179.56256103515625, "b": 285.621337890625, "coord_origin": "TOPLEFT"}, "confidence": 0.7491768598556519, "cells": [], "children": []}, {"id": 15, "label": "picture", "bbox": {"l": 64.1669921875, "t": 603.50634765625, "r": 258.7742919921875, "b": 688.1282348632812, "coord_origin": "TOPLEFT"}, "confidence": 0.8925829529762268, "cells": [], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "text", "id": 26, "page_no": 2, "cluster": {"id": 26, "label": "text", "bbox": {"l": 64.800003, "t": 74.48395000000005, "r": 235.8624, "b": 85.58398, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 0, "text": "DB2 for i Center of Excellence", "bbox": {"l": 64.800003, "t": 74.48395000000005, "r": 235.8624, "b": 85.58398, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "DB2 for i Center of Excellence"}, {"label": "text", "id": 25, "page_no": 2, "cluster": {"id": 25, "label": "text", "bbox": {"l": 94.132698, "t": 138.45012999999994, "r": 233.99973, "b": 155.33642999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.7431555986404419, "cells": [{"id": 1, "text": "Solution Brief", "bbox": {"l": 94.132698, "t": 148.63933999999995, "r": 139.54634, "b": 155.33642999999995, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "IBM Systems Lab Services and Training", "bbox": {"l": 94.134933, "t": 138.45012999999994, "r": 233.99973, "b": 145.22162000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Solution Brief IBM Systems Lab Services and Training"}, {"label": "text", "id": 22, "page_no": 2, "cluster": {"id": 22, "label": "text", "bbox": {"l": 461.08859000000007, "t": 138.40752999999995, "r": 506.26178, "b": 145.42181000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.7798982858657837, "cells": [{"id": 3, "text": "Power Services", "bbox": {"l": 461.08859000000007, "t": 138.40752999999995, "r": 506.26178, "b": 145.42181000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Power Services"}, {"label": "section_header", "id": 23, "page_no": 2, "cluster": {"id": 23, "label": "section_header", "bbox": {"l": 280.24011, "t": 239.34265000000005, "r": 463.80942, "b": 276.62054, "coord_origin": "TOPLEFT"}, "confidence": 0.7587865591049194, "cells": [{"id": 4, "text": "DB2 for i", "bbox": {"l": 280.24011, "t": 239.34265000000005, "r": 354.57022, "b": 256.26153999999997, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Center of Excellence ", "bbox": {"l": 280.24011, "t": 259.70165999999995, "r": 463.80942, "b": 276.62054, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "DB2 for i Center of Excellence"}, {"label": "text", "id": 21, "page_no": 2, "cluster": {"id": 21, "label": "text", "bbox": {"l": 280.24011, "t": 277.59027000000003, "r": 483.29572, "b": 287.45959, "coord_origin": "TOPLEFT"}, "confidence": 0.7965622544288635, "cells": [{"id": 6, "text": "Expert help to achieve your business requirements", "bbox": {"l": 280.24011, "t": 277.59027000000003, "r": 483.29572, "b": 287.45959, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Expert help to achieve your business requirements"}, {"label": "section_header", "id": 16, "page_no": 2, "cluster": {"id": 16, "label": "section_header", "bbox": {"l": 280.24011, "t": 315.88161999999994, "r": 443.28210000000007, "b": 324.89566, "coord_origin": "TOPLEFT"}, "confidence": 0.8913541436195374, "cells": [{"id": 7, "text": "We build confident, satisfied clients", "bbox": {"l": 280.24011, "t": 315.88161999999994, "r": 443.28210000000007, "b": 324.89566, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "We build confident, satisfied clients"}, {"label": "text", "id": 3, "page_no": 2, "cluster": {"id": 3, "label": "text", "bbox": {"l": 280.24011, "t": 327.37595, "r": 488.15466, "b": 344.9595, "coord_origin": "TOPLEFT"}, "confidence": 0.9560741782188416, "cells": [{"id": 8, "text": "No one else has the vast consulting experiences, skills sharing and ", "bbox": {"l": 280.24011, "t": 327.37595, "r": 488.15466, "b": 334.77994, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "renown service offerings to do what we can do for you.", "bbox": {"l": 280.24011, "t": 337.55551, "r": 452.34018, "b": 344.9595, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "No one else has the vast consulting experiences, skills sharing and renown service offerings to do what we can do for you."}, {"label": "text", "id": 20, "page_no": 2, "cluster": {"id": 20, "label": "text", "bbox": {"l": 280.24011, "t": 357.3260200000001, "r": 367.86023, "b": 364.73001, "coord_origin": "TOPLEFT"}, "confidence": 0.8260757923126221, "cells": [{"id": 10, "text": "Because no one else is IBM.", "bbox": {"l": 280.24011, "t": 357.3260200000001, "r": 367.86023, "b": 364.73001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Because no one else is IBM."}, {"label": "text", "id": 0, "page_no": 2, "cluster": {"id": 0, "label": "text", "bbox": {"l": 280.24011, "t": 377.09801999999996, "r": 500.32104000000004, "b": 425.22027999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9764723181724548, "cells": [{"id": 11, "text": "With combined experiences and direct access to development groups, ", "bbox": {"l": 280.24011, "t": 377.09801999999996, "r": 500.32104000000004, "b": 384.50201, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "we\u2019re the experts in IBM DB2\u00ae for i. The DB2 for i Center of ", "bbox": {"l": 280.24011, "t": 387.27759, "r": 479.25497, "b": 394.68158, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Excellence (CoE) can help you achieve-perhaps reexamine and ", "bbox": {"l": 280.24011, "t": 397.45715, "r": 483.4667400000001, "b": 404.86115, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "exceed-your business requirements and gain more confidence and ", "bbox": {"l": 280.24011, "t": 407.63672, "r": 492.97656, "b": 415.04071000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "satisfaction in IBM product data management products and solutions.", "bbox": {"l": 280.24011, "t": 417.81628, "r": 498.87, "b": 425.22027999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "With combined experiences and direct access to development groups, we're the experts in IBM DB2\u00ae for i. The DB2 for i Center of Excellence (CoE) can help you achieve-perhaps reexamine and exceed-your business requirements and gain more confidence and satisfaction in IBM product data management products and solutions."}, {"label": "section_header", "id": 18, "page_no": 2, "cluster": {"id": 18, "label": "section_header", "bbox": {"l": 280.24011, "t": 437.85403, "r": 434.83205999999996, "b": 446.86807, "coord_origin": "TOPLEFT"}, "confidence": 0.8492127060890198, "cells": [{"id": 16, "text": "Who we are, some of what we do", "bbox": {"l": 280.24011, "t": 437.85403, "r": 434.83205999999996, "b": 446.86807, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Who we are, some of what we do"}, {"label": "text", "id": 19, "page_no": 2, "cluster": {"id": 19, "label": "text", "bbox": {"l": 280.24011, "t": 449.34824000000003, "r": 434.56316999999996, "b": 456.75223, "coord_origin": "TOPLEFT"}, "confidence": 0.8440335392951965, "cells": [{"id": 17, "text": "Global CoE engagements cover topics including:", "bbox": {"l": 280.24011, "t": 449.34824000000003, "r": 434.56316999999996, "b": 456.75223, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Global CoE engagements cover topics including:"}, {"label": "list_item", "id": 8, "page_no": 2, "cluster": {"id": 8, "label": "list_item", "bbox": {"l": 280.24011, "t": 469.11826, "r": 401.56412, "b": 476.52225, "coord_origin": "TOPLEFT"}, "confidence": 0.9239600896835327, "cells": [{"id": 18, "text": "r ", "bbox": {"l": 280.24011, "t": 470.95236, "r": 284.0993, "b": 476.16074, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Database performance and scalability", "bbox": {"l": 287.28961, "t": 469.11826, "r": 401.56412, "b": 476.52225, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "r Database performance and scalability"}, {"label": "list_item", "id": 7, "page_no": 2, "cluster": {"id": 7, "label": "list_item", "bbox": {"l": 280.24011, "t": 479.30096, "r": 424.99646, "b": 486.70496, "coord_origin": "TOPLEFT"}, "confidence": 0.9239721298217773, "cells": [{"id": 20, "text": "r ", "bbox": {"l": 280.24011, "t": 481.13507, "r": 284.0993, "b": 486.34344, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Advanced SQL knowledge and skills transfer", "bbox": {"l": 287.28961, "t": 479.30096, "r": 424.99646, "b": 486.70496, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "r Advanced SQL knowledge and skills transfer"}, {"label": "list_item", "id": 10, "page_no": 2, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 280.24011, "t": 489.48355, "r": 392.15845, "b": 496.88754, "coord_origin": "TOPLEFT"}, "confidence": 0.9157900214195251, "cells": [{"id": 22, "text": "r ", "bbox": {"l": 280.24011, "t": 491.31766, "r": 284.0993, "b": 496.52603, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Business intelligence and analytics", "bbox": {"l": 287.28961, "t": 489.48355, "r": 392.15845, "b": 496.88754, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "r Business intelligence and analytics"}, {"label": "list_item", "id": 17, "page_no": 2, "cluster": {"id": 17, "label": "list_item", "bbox": {"l": 280.24011, "t": 499.66626, "r": 339.94354, "b": 507.07025, "coord_origin": "TOPLEFT"}, "confidence": 0.8733457326889038, "cells": [{"id": 24, "text": "r ", "bbox": {"l": 280.24011, "t": 501.50037, "r": 284.0993, "b": 506.70874, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "DB2 Web Query", "bbox": {"l": 287.28961, "t": 499.66626, "r": 339.94354, "b": 507.07025, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "r DB2 Web Query"}, {"label": "list_item", "id": 6, "page_no": 2, "cluster": {"id": 6, "label": "list_item", "bbox": {"l": 280.24011, "t": 509.84885, "r": 504.19314999999995, "b": 517.25284, "coord_origin": "TOPLEFT"}, "confidence": 0.9249242544174194, "cells": [{"id": 26, "text": "r ", "bbox": {"l": 280.24011, "t": 511.68295, "r": 284.0993, "b": 516.8913299999999, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Query/400 modernization for better reporting and analysis capabilities", "bbox": {"l": 287.28961, "t": 509.84885, "r": 504.19314999999995, "b": 517.25284, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "r Query/400 modernization for better reporting and analysis capabilities"}, {"label": "list_item", "id": 11, "page_no": 2, "cluster": {"id": 11, "label": "list_item", "bbox": {"l": 280.24011, "t": 520.03156, "r": 423.0022, "b": 527.4355499999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9109312891960144, "cells": [{"id": 28, "text": "r ", "bbox": {"l": 280.24011, "t": 521.8656599999999, "r": 284.0993, "b": 527.07404, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Database modernization and re-engineering", "bbox": {"l": 287.28961, "t": 520.03156, "r": 423.0022, "b": 527.4355499999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "r Database modernization and re-engineering"}, {"label": "list_item", "id": 14, "page_no": 2, "cluster": {"id": 14, "label": "list_item", "bbox": {"l": 280.24011, "t": 530.21414, "r": 399.65173, "b": 537.61813, "coord_origin": "TOPLEFT"}, "confidence": 0.8977466225624084, "cells": [{"id": 30, "text": "r ", "bbox": {"l": 280.24011, "t": 532.04825, "r": 284.0993, "b": 537.2566400000001, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Data-centric architecture and design", "bbox": {"l": 287.28961, "t": 530.21414, "r": 399.65173, "b": 537.61813, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "r Data-centric architecture and design"}, {"label": "list_item", "id": 9, "page_no": 2, "cluster": {"id": 9, "label": "list_item", "bbox": {"l": 280.24011, "t": 540.39674, "r": 466.77881, "b": 547.80074, "coord_origin": "TOPLEFT"}, "confidence": 0.9218331575393677, "cells": [{"id": 32, "text": "r ", "bbox": {"l": 280.24011, "t": 542.23083, "r": 284.0993, "b": 547.43924, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "Extremely large database and overcoming limits to growth", "bbox": {"l": 287.28961, "t": 540.39674, "r": 466.77881, "b": 547.80074, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "r Extremely large database and overcoming limits to growth"}, {"label": "list_item", "id": 13, "page_no": 2, "cluster": {"id": 13, "label": "list_item", "bbox": {"l": 280.24011, "t": 550.5794500000001, "r": 382.20956, "b": 557.98344, "coord_origin": "TOPLEFT"}, "confidence": 0.9075438976287842, "cells": [{"id": 34, "text": "r ", "bbox": {"l": 280.24011, "t": 552.41354, "r": 284.0993, "b": 557.62195, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "ISV education and enablement", "bbox": {"l": 287.28961, "t": 550.5794500000001, "r": 382.20956, "b": 557.98344, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "r ISV education and enablement"}, {"label": "section_header", "id": 12, "page_no": 2, "cluster": {"id": 12, "label": "section_header", "bbox": {"l": 144.88921, "t": 327.46163999999993, "r": 188.74681, "b": 336.81406, "coord_origin": "TOPLEFT"}, "confidence": 0.9098502993583679, "cells": [{"id": 36, "text": "Highlights ", "bbox": {"l": 144.88921, "t": 327.46163999999993, "r": 188.74681, "b": 336.81406, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Highlights"}, {"label": "list_item", "id": 2, "page_no": 2, "cluster": {"id": 2, "label": "list_item", "bbox": {"l": 144.88921, "t": 345.21707, "r": 242.87389000000002, "b": 358.68942, "coord_origin": "TOPLEFT"}, "confidence": 0.957169771194458, "cells": [{"id": 37, "text": "GLYPH<g115>GLYPH<g3>", "bbox": {"l": 144.88921, "t": 346.01953, "r": 148.68732, "b": 350.60168, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "GLYPH<g40>GLYPH<g81>GLYPH<g75>GLYPH<g68>GLYPH<g81>GLYPH<g70>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 151.9388, "t": 345.21707, "r": 177.25424, "b": 350.85666, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "GLYPH<g87>GLYPH<g75>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 176.9472, "t": 345.21707, "r": 187.11098, "b": 350.85666, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g73>GLYPH<g82>GLYPH<g85>GLYPH<g80>GLYPH<g68>GLYPH<g81>GLYPH<g70>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 186.7914, "t": 345.21707, "r": 222.95989999999998, "b": 350.85666, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "GLYPH<g82>GLYPH<g73>GLYPH<g3>", "bbox": {"l": 222.65912, "t": 345.21707, "r": 229.55193999999997, "b": 350.85666, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "GLYPH<g92>GLYPH<g82>GLYPH<g88>GLYPH<g85> GLYPH<g3>", "bbox": {"l": 229.2261, "t": 345.21707, "r": 242.87389000000002, "b": 350.85666, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "GLYPH<g71>GLYPH<g68>GLYPH<g87>GLYPH<g68>GLYPH<g69>GLYPH<g68>GLYPH<g86>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 151.93253, "t": 353.04984, "r": 178.77066, "b": 358.68942, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "GLYPH<g82>GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g68>GLYPH<g87>GLYPH<g76>GLYPH<g82>GLYPH<g81>GLYPH<g86>", "bbox": {"l": 178.46362, "t": 353.04984, "r": 207.16908, "b": 358.68942, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<g115>GLYPH<g3> GLYPH<g40>GLYPH<g81>GLYPH<g75>GLYPH<g68>GLYPH<g81>GLYPH<g70>GLYPH<g72>GLYPH<g3> GLYPH<g87>GLYPH<g75>GLYPH<g72>GLYPH<g3> GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g73>GLYPH<g82>GLYPH<g85>GLYPH<g80>GLYPH<g68>GLYPH<g81>GLYPH<g70>GLYPH<g72>GLYPH<g3> GLYPH<g82>GLYPH<g73>GLYPH<g3> GLYPH<g92>GLYPH<g82>GLYPH<g88>GLYPH<g85> GLYPH<g3> GLYPH<g71>GLYPH<g68>GLYPH<g87>GLYPH<g68>GLYPH<g69>GLYPH<g68>GLYPH<g86>GLYPH<g72>GLYPH<g3> GLYPH<g82>GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g68>GLYPH<g87>GLYPH<g76>GLYPH<g82>GLYPH<g81>GLYPH<g86>"}, {"label": "list_item", "id": 1, "page_no": 2, "cluster": {"id": 1, "label": "list_item", "bbox": {"l": 144.88921, "t": 367.93219, "r": 259.2287, "b": 389.2373, "coord_origin": "TOPLEFT"}, "confidence": 0.9634580612182617, "cells": [{"id": 45, "text": "GLYPH<g115>GLYPH<g3>", "bbox": {"l": 144.88921, "t": 368.73465, "r": 148.68732, "b": 373.3168, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "GLYPH<g40>GLYPH<g68>GLYPH<g85> GLYPH<g81>GLYPH<g3>", "bbox": {"l": 151.9388, "t": 367.93219, "r": 166.05655, "b": 373.57178, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "GLYPH<g74>GLYPH<g85>GLYPH<g72>GLYPH<g68>GLYPH<g87>GLYPH<g72>GLYPH<g85>GLYPH<g3>", "bbox": {"l": 165.73697, "t": 367.93219, "r": 186.40289, "b": 373.57178, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "GLYPH<g85>GLYPH<g72>GLYPH<g87>GLYPH<g88>GLYPH<g85> GLYPH<g81>GLYPH<g3>", "bbox": {"l": 186.09586, "t": 367.93219, "r": 203.61617, "b": 373.57178, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "GLYPH<g82>GLYPH<g81>GLYPH<g3>", "bbox": {"l": 203.30286, "t": 367.93219, "r": 211.82489, "b": 373.57178, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "GLYPH<g44>GLYPH<g55>GLYPH<g3>", "bbox": {"l": 211.49905, "t": 367.93219, "r": 218.16002, "b": 373.57178, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "GLYPH<g83>GLYPH<g85>GLYPH<g82>GLYPH<g77>GLYPH<g72>GLYPH<g70>GLYPH<g87>GLYPH<g86> GLYPH<g3>", "bbox": {"l": 217.83418, "t": 367.93219, "r": 241.30737, "b": 373.57178, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "GLYPH<g87>GLYPH<g75>GLYPH<g85>GLYPH<g82>GLYPH<g88>GLYPH<g74>GLYPH<g75>GLYPH<g3>", "bbox": {"l": 151.93253, "t": 375.76495, "r": 174.46577, "b": 381.40454, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "GLYPH<g80>GLYPH<g82>GLYPH<g71>GLYPH<g72>GLYPH<g85> GLYPH<g81>GLYPH<g76>GLYPH<g93>GLYPH<g68>GLYPH<g87>GLYPH<g76>GLYPH<g82>GLYPH<g81>GLYPH<g3>", "bbox": {"l": 174.15874, "t": 375.76495, "r": 214.4128, "b": 381.40454, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "GLYPH<g82>GLYPH<g73>GLYPH<g3>", "bbox": {"l": 214.11829, "t": 375.76495, "r": 221.01110999999997, "b": 381.40454, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "GLYPH<g71>GLYPH<g68>GLYPH<g87>GLYPH<g68>GLYPH<g69>GLYPH<g68>GLYPH<g86>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 220.68527, "t": 375.76495, "r": 247.52341000000004, "b": 381.40454, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "GLYPH<g68>GLYPH<g81>GLYPH<g71> GLYPH<g3>", "bbox": {"l": 247.21637, "t": 375.76495, "r": 259.2287, "b": 381.40454, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "GLYPH<g68>GLYPH<g83>GLYPH<g83>GLYPH<g79>GLYPH<g76>GLYPH<g70>GLYPH<g68>GLYPH<g87>GLYPH<g76>GLYPH<g82>GLYPH<g81>GLYPH<g86>", "bbox": {"l": 151.93253, "t": 383.59772, "r": 184.61703, "b": 389.2373, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<g115>GLYPH<g3> GLYPH<g40>GLYPH<g68>GLYPH<g85> GLYPH<g81>GLYPH<g3> GLYPH<g74>GLYPH<g85>GLYPH<g72>GLYPH<g68>GLYPH<g87>GLYPH<g72>GLYPH<g85>GLYPH<g3> GLYPH<g85>GLYPH<g72>GLYPH<g87>GLYPH<g88>GLYPH<g85> GLYPH<g81>GLYPH<g3> GLYPH<g82>GLYPH<g81>GLYPH<g3> GLYPH<g44>GLYPH<g55>GLYPH<g3> GLYPH<g83>GLYPH<g85>GLYPH<g82>GLYPH<g77>GLYPH<g72>GLYPH<g70>GLYPH<g87>GLYPH<g86> GLYPH<g3> GLYPH<g87>GLYPH<g75>GLYPH<g85>GLYPH<g82>GLYPH<g88>GLYPH<g74>GLYPH<g75>GLYPH<g3> GLYPH<g80>GLYPH<g82>GLYPH<g71>GLYPH<g72>GLYPH<g85> GLYPH<g81>GLYPH<g76>GLYPH<g93>GLYPH<g68>GLYPH<g87>GLYPH<g76>GLYPH<g82>GLYPH<g81>GLYPH<g3> GLYPH<g82>GLYPH<g73>GLYPH<g3> GLYPH<g71>GLYPH<g68>GLYPH<g87>GLYPH<g68>GLYPH<g69>GLYPH<g68>GLYPH<g86>GLYPH<g72>GLYPH<g3> GLYPH<g68>GLYPH<g81>GLYPH<g71> GLYPH<g3> GLYPH<g68>GLYPH<g83>GLYPH<g83>GLYPH<g79>GLYPH<g76>GLYPH<g70>GLYPH<g68>GLYPH<g87>GLYPH<g76>GLYPH<g82>GLYPH<g81>GLYPH<g86>"}, {"label": "list_item", "id": 4, "page_no": 2, "cluster": {"id": 4, "label": "list_item", "bbox": {"l": 144.88921, "t": 398.48019, "r": 249.83562, "b": 411.95255, "coord_origin": "TOPLEFT"}, "confidence": 0.9541196823120117, "cells": [{"id": 58, "text": "GLYPH<g115>GLYPH<g3>", "bbox": {"l": 144.88921, "t": 399.28265, "r": 148.68732, "b": 403.86481000000003, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "GLYPH<g53>GLYPH<g72>GLYPH<g79>GLYPH<g92>GLYPH<g3>", "bbox": {"l": 151.9388, "t": 398.48019, "r": 165.36099, "b": 404.11978, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "GLYPH<g82>GLYPH<g81>GLYPH<g3>", "bbox": {"l": 165.04141, "t": 398.48019, "r": 173.56345, "b": 404.11978, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "GLYPH<g44>GLYPH<g37>GLYPH<g48>GLYPH<g3>", "bbox": {"l": 173.23761, "t": 398.48019, "r": 185.95174, "b": 404.11978, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "GLYPH<g72>GLYPH<g91>GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g87>GLYPH<g3>", "bbox": {"l": 185.63216, "t": 398.48019, "r": 204.42448, "b": 404.11978, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "GLYPH<g70>GLYPH<g82>GLYPH<g81>GLYPH<g86>GLYPH<g88>GLYPH<g79>GLYPH<g87>GLYPH<g76>GLYPH<g81>GLYPH<g74>GLYPH<g15>GLYPH<g3>", "bbox": {"l": 204.11118, "t": 398.48019, "r": 235.29178, "b": 404.11978, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "GLYPH<g86>GLYPH<g78>GLYPH<g76>GLYPH<g79>GLYPH<g79>GLYPH<g86> GLYPH<g3>", "bbox": {"l": 234.99099999999999, "t": 398.48019, "r": 249.83562, "b": 404.11978, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "GLYPH<g86>GLYPH<g75>GLYPH<g68>GLYPH<g85>GLYPH<g76>GLYPH<g81>GLYPH<g74>GLYPH<g3>", "bbox": {"l": 151.93253, "t": 406.31296, "r": 173.41306, "b": 411.95255, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "GLYPH<g68>GLYPH<g81>GLYPH<g71>GLYPH<g3>", "bbox": {"l": 173.10602, "t": 406.31296, "r": 185.0118, "b": 411.95255, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "GLYPH<g85>GLYPH<g72>GLYPH<g81>GLYPH<g82>GLYPH<g90>GLYPH<g81>GLYPH<g3>", "bbox": {"l": 184.69221, "t": 406.31296, "r": 206.3858, "b": 411.95255, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "GLYPH<g86>GLYPH<g72>GLYPH<g85>GLYPH<g89>GLYPH<g76>GLYPH<g70>GLYPH<g72>GLYPH<g86>", "bbox": {"l": 206.07249, "t": 406.31296, "r": 228.24231000000003, "b": 411.95255, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<g115>GLYPH<g3> GLYPH<g53>GLYPH<g72>GLYPH<g79>GLYPH<g92>GLYPH<g3> GLYPH<g82>GLYPH<g81>GLYPH<g3> GLYPH<g44>GLYPH<g37>GLYPH<g48>GLYPH<g3> GLYPH<g72>GLYPH<g91>GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g87>GLYPH<g3> GLYPH<g70>GLYPH<g82>GLYPH<g81>GLYPH<g86>GLYPH<g88>GLYPH<g79>GLYPH<g87>GLYPH<g76>GLYPH<g81>GLYPH<g74>GLYPH<g15>GLYPH<g3> GLYPH<g86>GLYPH<g78>GLYPH<g76>GLYPH<g79>GLYPH<g79>GLYPH<g86> GLYPH<g3> GLYPH<g86>GLYPH<g75>GLYPH<g68>GLYPH<g85>GLYPH<g76>GLYPH<g81>GLYPH<g74>GLYPH<g3> GLYPH<g68>GLYPH<g81>GLYPH<g71>GLYPH<g3> GLYPH<g85>GLYPH<g72>GLYPH<g81>GLYPH<g82>GLYPH<g90>GLYPH<g81>GLYPH<g3> GLYPH<g86>GLYPH<g72>GLYPH<g85>GLYPH<g89>GLYPH<g76>GLYPH<g70>GLYPH<g72>GLYPH<g86>"}, {"label": "list_item", "id": 5, "page_no": 2, "cluster": {"id": 5, "label": "list_item", "bbox": {"l": 144.88921, "t": 421.1952800000001, "r": 234.25163000000003, "b": 434.66763, "coord_origin": "TOPLEFT"}, "confidence": 0.9440370798110962, "cells": [{"id": 69, "text": "GLYPH<g115>GLYPH<g3>", "bbox": {"l": 144.88921, "t": 421.99773999999996, "r": 148.68732, "b": 426.5799, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "GLYPH<g55>", "bbox": {"l": 151.9388, "t": 421.1952800000001, "r": 155.43533, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "GLYPH<g68>GLYPH<g78>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 154.73979, "t": 421.1952800000001, "r": 166.06282, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "GLYPH<g68>GLYPH<g71>GLYPH<g89>GLYPH<g68>GLYPH<g81>GLYPH<g87>GLYPH<g68>GLYPH<g74>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 165.74324, "t": 421.1952800000001, "r": 195.84607, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "GLYPH<g82>GLYPH<g73>GLYPH<g3>", "bbox": {"l": 195.53903, "t": 421.1952800000001, "r": 202.43185, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "GLYPH<g68>GLYPH<g70>GLYPH<g70>GLYPH<g72>GLYPH<g86>GLYPH<g86>GLYPH<g3>", "bbox": {"l": 202.10602, "t": 421.1952800000001, "r": 222.87220999999997, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "GLYPH<g87>GLYPH<g82>GLYPH<g3>", "bbox": {"l": 222.55890000000002, "t": 421.1952800000001, "r": 229.57077, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "GLYPH<g68> GLYPH<g3>", "bbox": {"l": 229.24492999999998, "t": 421.1952800000001, "r": 234.25163000000003, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "GLYPH<g90>GLYPH<g82>GLYPH<g85>GLYPH<g79>GLYPH<g71>GLYPH<g90>GLYPH<g76>GLYPH<g71>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 151.92627, "t": 429.02805, "r": 181.42754, "b": 434.66763, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "GLYPH<g86>GLYPH<g82>GLYPH<g88>GLYPH<g85>GLYPH<g70>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 181.1205, "t": 429.02805, "r": 201.07835, "b": 434.66763, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "GLYPH<g82>GLYPH<g73>GLYPH<g3>", "bbox": {"l": 200.76505, "t": 429.02805, "r": 207.65787, "b": 434.66763, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "GLYPH<g72>GLYPH<g91>GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g87>GLYPH<g76>GLYPH<g86>GLYPH<g72>", "bbox": {"l": 207.33203, "t": 429.02805, "r": 232.07098000000002, "b": 434.66763, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<g115>GLYPH<g3> GLYPH<g55> GLYPH<g68>GLYPH<g78>GLYPH<g72>GLYPH<g3> GLYPH<g68>GLYPH<g71>GLYPH<g89>GLYPH<g68>GLYPH<g81>GLYPH<g87>GLYPH<g68>GLYPH<g74>GLYPH<g72>GLYPH<g3> GLYPH<g82>GLYPH<g73>GLYPH<g3> GLYPH<g68>GLYPH<g70>GLYPH<g70>GLYPH<g72>GLYPH<g86>GLYPH<g86>GLYPH<g3> GLYPH<g87>GLYPH<g82>GLYPH<g3> GLYPH<g68> GLYPH<g3> GLYPH<g90>GLYPH<g82>GLYPH<g85>GLYPH<g79>GLYPH<g71>GLYPH<g90>GLYPH<g76>GLYPH<g71>GLYPH<g72>GLYPH<g3> GLYPH<g86>GLYPH<g82>GLYPH<g88>GLYPH<g85>GLYPH<g70>GLYPH<g72>GLYPH<g3> GLYPH<g82>GLYPH<g73>GLYPH<g3> GLYPH<g72>GLYPH<g91>GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g87>GLYPH<g76>GLYPH<g86>GLYPH<g72>"}, {"label": "picture", "id": 24, "page_no": 2, "cluster": {"id": 24, "label": "picture", "bbox": {"l": 143.39866638183594, "t": 270.2610778808594, "r": 179.56256103515625, "b": 285.621337890625, "coord_origin": "TOPLEFT"}, "confidence": 0.7491768598556519, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "picture", "id": 15, "page_no": 2, "cluster": {"id": 15, "label": "picture", "bbox": {"l": 64.1669921875, "t": 603.50634765625, "r": 258.7742919921875, "b": 688.1282348632812, "coord_origin": "TOPLEFT"}, "confidence": 0.8925829529762268, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "body": [{"label": "text", "id": 26, "page_no": 2, "cluster": {"id": 26, "label": "text", "bbox": {"l": 64.800003, "t": 74.48395000000005, "r": 235.8624, "b": 85.58398, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 0, "text": "DB2 for i Center of Excellence", "bbox": {"l": 64.800003, "t": 74.48395000000005, "r": 235.8624, "b": 85.58398, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "DB2 for i Center of Excellence"}, {"label": "text", "id": 25, "page_no": 2, "cluster": {"id": 25, "label": "text", "bbox": {"l": 94.132698, "t": 138.45012999999994, "r": 233.99973, "b": 155.33642999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.7431555986404419, "cells": [{"id": 1, "text": "Solution Brief", "bbox": {"l": 94.132698, "t": 148.63933999999995, "r": 139.54634, "b": 155.33642999999995, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "IBM Systems Lab Services and Training", "bbox": {"l": 94.134933, "t": 138.45012999999994, "r": 233.99973, "b": 145.22162000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Solution Brief IBM Systems Lab Services and Training"}, {"label": "text", "id": 22, "page_no": 2, "cluster": {"id": 22, "label": "text", "bbox": {"l": 461.08859000000007, "t": 138.40752999999995, "r": 506.26178, "b": 145.42181000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.7798982858657837, "cells": [{"id": 3, "text": "Power Services", "bbox": {"l": 461.08859000000007, "t": 138.40752999999995, "r": 506.26178, "b": 145.42181000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Power Services"}, {"label": "section_header", "id": 23, "page_no": 2, "cluster": {"id": 23, "label": "section_header", "bbox": {"l": 280.24011, "t": 239.34265000000005, "r": 463.80942, "b": 276.62054, "coord_origin": "TOPLEFT"}, "confidence": 0.7587865591049194, "cells": [{"id": 4, "text": "DB2 for i", "bbox": {"l": 280.24011, "t": 239.34265000000005, "r": 354.57022, "b": 256.26153999999997, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Center of Excellence ", "bbox": {"l": 280.24011, "t": 259.70165999999995, "r": 463.80942, "b": 276.62054, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "DB2 for i Center of Excellence"}, {"label": "text", "id": 21, "page_no": 2, "cluster": {"id": 21, "label": "text", "bbox": {"l": 280.24011, "t": 277.59027000000003, "r": 483.29572, "b": 287.45959, "coord_origin": "TOPLEFT"}, "confidence": 0.7965622544288635, "cells": [{"id": 6, "text": "Expert help to achieve your business requirements", "bbox": {"l": 280.24011, "t": 277.59027000000003, "r": 483.29572, "b": 287.45959, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Expert help to achieve your business requirements"}, {"label": "section_header", "id": 16, "page_no": 2, "cluster": {"id": 16, "label": "section_header", "bbox": {"l": 280.24011, "t": 315.88161999999994, "r": 443.28210000000007, "b": 324.89566, "coord_origin": "TOPLEFT"}, "confidence": 0.8913541436195374, "cells": [{"id": 7, "text": "We build confident, satisfied clients", "bbox": {"l": 280.24011, "t": 315.88161999999994, "r": 443.28210000000007, "b": 324.89566, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "We build confident, satisfied clients"}, {"label": "text", "id": 3, "page_no": 2, "cluster": {"id": 3, "label": "text", "bbox": {"l": 280.24011, "t": 327.37595, "r": 488.15466, "b": 344.9595, "coord_origin": "TOPLEFT"}, "confidence": 0.9560741782188416, "cells": [{"id": 8, "text": "No one else has the vast consulting experiences, skills sharing and ", "bbox": {"l": 280.24011, "t": 327.37595, "r": 488.15466, "b": 334.77994, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "renown service offerings to do what we can do for you.", "bbox": {"l": 280.24011, "t": 337.55551, "r": 452.34018, "b": 344.9595, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "No one else has the vast consulting experiences, skills sharing and renown service offerings to do what we can do for you."}, {"label": "text", "id": 20, "page_no": 2, "cluster": {"id": 20, "label": "text", "bbox": {"l": 280.24011, "t": 357.3260200000001, "r": 367.86023, "b": 364.73001, "coord_origin": "TOPLEFT"}, "confidence": 0.8260757923126221, "cells": [{"id": 10, "text": "Because no one else is IBM.", "bbox": {"l": 280.24011, "t": 357.3260200000001, "r": 367.86023, "b": 364.73001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Because no one else is IBM."}, {"label": "text", "id": 0, "page_no": 2, "cluster": {"id": 0, "label": "text", "bbox": {"l": 280.24011, "t": 377.09801999999996, "r": 500.32104000000004, "b": 425.22027999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9764723181724548, "cells": [{"id": 11, "text": "With combined experiences and direct access to development groups, ", "bbox": {"l": 280.24011, "t": 377.09801999999996, "r": 500.32104000000004, "b": 384.50201, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "we\u2019re the experts in IBM DB2\u00ae for i. The DB2 for i Center of ", "bbox": {"l": 280.24011, "t": 387.27759, "r": 479.25497, "b": 394.68158, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Excellence (CoE) can help you achieve-perhaps reexamine and ", "bbox": {"l": 280.24011, "t": 397.45715, "r": 483.4667400000001, "b": 404.86115, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "exceed-your business requirements and gain more confidence and ", "bbox": {"l": 280.24011, "t": 407.63672, "r": 492.97656, "b": 415.04071000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "satisfaction in IBM product data management products and solutions.", "bbox": {"l": 280.24011, "t": 417.81628, "r": 498.87, "b": 425.22027999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "With combined experiences and direct access to development groups, we're the experts in IBM DB2\u00ae for i. The DB2 for i Center of Excellence (CoE) can help you achieve-perhaps reexamine and exceed-your business requirements and gain more confidence and satisfaction in IBM product data management products and solutions."}, {"label": "section_header", "id": 18, "page_no": 2, "cluster": {"id": 18, "label": "section_header", "bbox": {"l": 280.24011, "t": 437.85403, "r": 434.83205999999996, "b": 446.86807, "coord_origin": "TOPLEFT"}, "confidence": 0.8492127060890198, "cells": [{"id": 16, "text": "Who we are, some of what we do", "bbox": {"l": 280.24011, "t": 437.85403, "r": 434.83205999999996, "b": 446.86807, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Who we are, some of what we do"}, {"label": "text", "id": 19, "page_no": 2, "cluster": {"id": 19, "label": "text", "bbox": {"l": 280.24011, "t": 449.34824000000003, "r": 434.56316999999996, "b": 456.75223, "coord_origin": "TOPLEFT"}, "confidence": 0.8440335392951965, "cells": [{"id": 17, "text": "Global CoE engagements cover topics including:", "bbox": {"l": 280.24011, "t": 449.34824000000003, "r": 434.56316999999996, "b": 456.75223, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Global CoE engagements cover topics including:"}, {"label": "list_item", "id": 8, "page_no": 2, "cluster": {"id": 8, "label": "list_item", "bbox": {"l": 280.24011, "t": 469.11826, "r": 401.56412, "b": 476.52225, "coord_origin": "TOPLEFT"}, "confidence": 0.9239600896835327, "cells": [{"id": 18, "text": "r ", "bbox": {"l": 280.24011, "t": 470.95236, "r": 284.0993, "b": 476.16074, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Database performance and scalability", "bbox": {"l": 287.28961, "t": 469.11826, "r": 401.56412, "b": 476.52225, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "r Database performance and scalability"}, {"label": "list_item", "id": 7, "page_no": 2, "cluster": {"id": 7, "label": "list_item", "bbox": {"l": 280.24011, "t": 479.30096, "r": 424.99646, "b": 486.70496, "coord_origin": "TOPLEFT"}, "confidence": 0.9239721298217773, "cells": [{"id": 20, "text": "r ", "bbox": {"l": 280.24011, "t": 481.13507, "r": 284.0993, "b": 486.34344, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Advanced SQL knowledge and skills transfer", "bbox": {"l": 287.28961, "t": 479.30096, "r": 424.99646, "b": 486.70496, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "r Advanced SQL knowledge and skills transfer"}, {"label": "list_item", "id": 10, "page_no": 2, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 280.24011, "t": 489.48355, "r": 392.15845, "b": 496.88754, "coord_origin": "TOPLEFT"}, "confidence": 0.9157900214195251, "cells": [{"id": 22, "text": "r ", "bbox": {"l": 280.24011, "t": 491.31766, "r": 284.0993, "b": 496.52603, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Business intelligence and analytics", "bbox": {"l": 287.28961, "t": 489.48355, "r": 392.15845, "b": 496.88754, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "r Business intelligence and analytics"}, {"label": "list_item", "id": 17, "page_no": 2, "cluster": {"id": 17, "label": "list_item", "bbox": {"l": 280.24011, "t": 499.66626, "r": 339.94354, "b": 507.07025, "coord_origin": "TOPLEFT"}, "confidence": 0.8733457326889038, "cells": [{"id": 24, "text": "r ", "bbox": {"l": 280.24011, "t": 501.50037, "r": 284.0993, "b": 506.70874, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "DB2 Web Query", "bbox": {"l": 287.28961, "t": 499.66626, "r": 339.94354, "b": 507.07025, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "r DB2 Web Query"}, {"label": "list_item", "id": 6, "page_no": 2, "cluster": {"id": 6, "label": "list_item", "bbox": {"l": 280.24011, "t": 509.84885, "r": 504.19314999999995, "b": 517.25284, "coord_origin": "TOPLEFT"}, "confidence": 0.9249242544174194, "cells": [{"id": 26, "text": "r ", "bbox": {"l": 280.24011, "t": 511.68295, "r": 284.0993, "b": 516.8913299999999, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Query/400 modernization for better reporting and analysis capabilities", "bbox": {"l": 287.28961, "t": 509.84885, "r": 504.19314999999995, "b": 517.25284, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "r Query/400 modernization for better reporting and analysis capabilities"}, {"label": "list_item", "id": 11, "page_no": 2, "cluster": {"id": 11, "label": "list_item", "bbox": {"l": 280.24011, "t": 520.03156, "r": 423.0022, "b": 527.4355499999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9109312891960144, "cells": [{"id": 28, "text": "r ", "bbox": {"l": 280.24011, "t": 521.8656599999999, "r": 284.0993, "b": 527.07404, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Database modernization and re-engineering", "bbox": {"l": 287.28961, "t": 520.03156, "r": 423.0022, "b": 527.4355499999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "r Database modernization and re-engineering"}, {"label": "list_item", "id": 14, "page_no": 2, "cluster": {"id": 14, "label": "list_item", "bbox": {"l": 280.24011, "t": 530.21414, "r": 399.65173, "b": 537.61813, "coord_origin": "TOPLEFT"}, "confidence": 0.8977466225624084, "cells": [{"id": 30, "text": "r ", "bbox": {"l": 280.24011, "t": 532.04825, "r": 284.0993, "b": 537.2566400000001, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Data-centric architecture and design", "bbox": {"l": 287.28961, "t": 530.21414, "r": 399.65173, "b": 537.61813, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "r Data-centric architecture and design"}, {"label": "list_item", "id": 9, "page_no": 2, "cluster": {"id": 9, "label": "list_item", "bbox": {"l": 280.24011, "t": 540.39674, "r": 466.77881, "b": 547.80074, "coord_origin": "TOPLEFT"}, "confidence": 0.9218331575393677, "cells": [{"id": 32, "text": "r ", "bbox": {"l": 280.24011, "t": 542.23083, "r": 284.0993, "b": 547.43924, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "Extremely large database and overcoming limits to growth", "bbox": {"l": 287.28961, "t": 540.39674, "r": 466.77881, "b": 547.80074, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "r Extremely large database and overcoming limits to growth"}, {"label": "list_item", "id": 13, "page_no": 2, "cluster": {"id": 13, "label": "list_item", "bbox": {"l": 280.24011, "t": 550.5794500000001, "r": 382.20956, "b": 557.98344, "coord_origin": "TOPLEFT"}, "confidence": 0.9075438976287842, "cells": [{"id": 34, "text": "r ", "bbox": {"l": 280.24011, "t": 552.41354, "r": 284.0993, "b": 557.62195, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "ISV education and enablement", "bbox": {"l": 287.28961, "t": 550.5794500000001, "r": 382.20956, "b": 557.98344, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "r ISV education and enablement"}, {"label": "section_header", "id": 12, "page_no": 2, "cluster": {"id": 12, "label": "section_header", "bbox": {"l": 144.88921, "t": 327.46163999999993, "r": 188.74681, "b": 336.81406, "coord_origin": "TOPLEFT"}, "confidence": 0.9098502993583679, "cells": [{"id": 36, "text": "Highlights ", "bbox": {"l": 144.88921, "t": 327.46163999999993, "r": 188.74681, "b": 336.81406, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Highlights"}, {"label": "list_item", "id": 2, "page_no": 2, "cluster": {"id": 2, "label": "list_item", "bbox": {"l": 144.88921, "t": 345.21707, "r": 242.87389000000002, "b": 358.68942, "coord_origin": "TOPLEFT"}, "confidence": 0.957169771194458, "cells": [{"id": 37, "text": "GLYPH<g115>GLYPH<g3>", "bbox": {"l": 144.88921, "t": 346.01953, "r": 148.68732, "b": 350.60168, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "GLYPH<g40>GLYPH<g81>GLYPH<g75>GLYPH<g68>GLYPH<g81>GLYPH<g70>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 151.9388, "t": 345.21707, "r": 177.25424, "b": 350.85666, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "GLYPH<g87>GLYPH<g75>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 176.9472, "t": 345.21707, "r": 187.11098, "b": 350.85666, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g73>GLYPH<g82>GLYPH<g85>GLYPH<g80>GLYPH<g68>GLYPH<g81>GLYPH<g70>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 186.7914, "t": 345.21707, "r": 222.95989999999998, "b": 350.85666, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "GLYPH<g82>GLYPH<g73>GLYPH<g3>", "bbox": {"l": 222.65912, "t": 345.21707, "r": 229.55193999999997, "b": 350.85666, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "GLYPH<g92>GLYPH<g82>GLYPH<g88>GLYPH<g85> GLYPH<g3>", "bbox": {"l": 229.2261, "t": 345.21707, "r": 242.87389000000002, "b": 350.85666, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "GLYPH<g71>GLYPH<g68>GLYPH<g87>GLYPH<g68>GLYPH<g69>GLYPH<g68>GLYPH<g86>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 151.93253, "t": 353.04984, "r": 178.77066, "b": 358.68942, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "GLYPH<g82>GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g68>GLYPH<g87>GLYPH<g76>GLYPH<g82>GLYPH<g81>GLYPH<g86>", "bbox": {"l": 178.46362, "t": 353.04984, "r": 207.16908, "b": 358.68942, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<g115>GLYPH<g3> GLYPH<g40>GLYPH<g81>GLYPH<g75>GLYPH<g68>GLYPH<g81>GLYPH<g70>GLYPH<g72>GLYPH<g3> GLYPH<g87>GLYPH<g75>GLYPH<g72>GLYPH<g3> GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g73>GLYPH<g82>GLYPH<g85>GLYPH<g80>GLYPH<g68>GLYPH<g81>GLYPH<g70>GLYPH<g72>GLYPH<g3> GLYPH<g82>GLYPH<g73>GLYPH<g3> GLYPH<g92>GLYPH<g82>GLYPH<g88>GLYPH<g85> GLYPH<g3> GLYPH<g71>GLYPH<g68>GLYPH<g87>GLYPH<g68>GLYPH<g69>GLYPH<g68>GLYPH<g86>GLYPH<g72>GLYPH<g3> GLYPH<g82>GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g68>GLYPH<g87>GLYPH<g76>GLYPH<g82>GLYPH<g81>GLYPH<g86>"}, {"label": "list_item", "id": 1, "page_no": 2, "cluster": {"id": 1, "label": "list_item", "bbox": {"l": 144.88921, "t": 367.93219, "r": 259.2287, "b": 389.2373, "coord_origin": "TOPLEFT"}, "confidence": 0.9634580612182617, "cells": [{"id": 45, "text": "GLYPH<g115>GLYPH<g3>", "bbox": {"l": 144.88921, "t": 368.73465, "r": 148.68732, "b": 373.3168, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "GLYPH<g40>GLYPH<g68>GLYPH<g85> GLYPH<g81>GLYPH<g3>", "bbox": {"l": 151.9388, "t": 367.93219, "r": 166.05655, "b": 373.57178, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "GLYPH<g74>GLYPH<g85>GLYPH<g72>GLYPH<g68>GLYPH<g87>GLYPH<g72>GLYPH<g85>GLYPH<g3>", "bbox": {"l": 165.73697, "t": 367.93219, "r": 186.40289, "b": 373.57178, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "GLYPH<g85>GLYPH<g72>GLYPH<g87>GLYPH<g88>GLYPH<g85> GLYPH<g81>GLYPH<g3>", "bbox": {"l": 186.09586, "t": 367.93219, "r": 203.61617, "b": 373.57178, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "GLYPH<g82>GLYPH<g81>GLYPH<g3>", "bbox": {"l": 203.30286, "t": 367.93219, "r": 211.82489, "b": 373.57178, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "GLYPH<g44>GLYPH<g55>GLYPH<g3>", "bbox": {"l": 211.49905, "t": 367.93219, "r": 218.16002, "b": 373.57178, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "GLYPH<g83>GLYPH<g85>GLYPH<g82>GLYPH<g77>GLYPH<g72>GLYPH<g70>GLYPH<g87>GLYPH<g86> GLYPH<g3>", "bbox": {"l": 217.83418, "t": 367.93219, "r": 241.30737, "b": 373.57178, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "GLYPH<g87>GLYPH<g75>GLYPH<g85>GLYPH<g82>GLYPH<g88>GLYPH<g74>GLYPH<g75>GLYPH<g3>", "bbox": {"l": 151.93253, "t": 375.76495, "r": 174.46577, "b": 381.40454, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "GLYPH<g80>GLYPH<g82>GLYPH<g71>GLYPH<g72>GLYPH<g85> GLYPH<g81>GLYPH<g76>GLYPH<g93>GLYPH<g68>GLYPH<g87>GLYPH<g76>GLYPH<g82>GLYPH<g81>GLYPH<g3>", "bbox": {"l": 174.15874, "t": 375.76495, "r": 214.4128, "b": 381.40454, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "GLYPH<g82>GLYPH<g73>GLYPH<g3>", "bbox": {"l": 214.11829, "t": 375.76495, "r": 221.01110999999997, "b": 381.40454, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "GLYPH<g71>GLYPH<g68>GLYPH<g87>GLYPH<g68>GLYPH<g69>GLYPH<g68>GLYPH<g86>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 220.68527, "t": 375.76495, "r": 247.52341000000004, "b": 381.40454, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "GLYPH<g68>GLYPH<g81>GLYPH<g71> GLYPH<g3>", "bbox": {"l": 247.21637, "t": 375.76495, "r": 259.2287, "b": 381.40454, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "GLYPH<g68>GLYPH<g83>GLYPH<g83>GLYPH<g79>GLYPH<g76>GLYPH<g70>GLYPH<g68>GLYPH<g87>GLYPH<g76>GLYPH<g82>GLYPH<g81>GLYPH<g86>", "bbox": {"l": 151.93253, "t": 383.59772, "r": 184.61703, "b": 389.2373, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<g115>GLYPH<g3> GLYPH<g40>GLYPH<g68>GLYPH<g85> GLYPH<g81>GLYPH<g3> GLYPH<g74>GLYPH<g85>GLYPH<g72>GLYPH<g68>GLYPH<g87>GLYPH<g72>GLYPH<g85>GLYPH<g3> GLYPH<g85>GLYPH<g72>GLYPH<g87>GLYPH<g88>GLYPH<g85> GLYPH<g81>GLYPH<g3> GLYPH<g82>GLYPH<g81>GLYPH<g3> GLYPH<g44>GLYPH<g55>GLYPH<g3> GLYPH<g83>GLYPH<g85>GLYPH<g82>GLYPH<g77>GLYPH<g72>GLYPH<g70>GLYPH<g87>GLYPH<g86> GLYPH<g3> GLYPH<g87>GLYPH<g75>GLYPH<g85>GLYPH<g82>GLYPH<g88>GLYPH<g74>GLYPH<g75>GLYPH<g3> GLYPH<g80>GLYPH<g82>GLYPH<g71>GLYPH<g72>GLYPH<g85> GLYPH<g81>GLYPH<g76>GLYPH<g93>GLYPH<g68>GLYPH<g87>GLYPH<g76>GLYPH<g82>GLYPH<g81>GLYPH<g3> GLYPH<g82>GLYPH<g73>GLYPH<g3> GLYPH<g71>GLYPH<g68>GLYPH<g87>GLYPH<g68>GLYPH<g69>GLYPH<g68>GLYPH<g86>GLYPH<g72>GLYPH<g3> GLYPH<g68>GLYPH<g81>GLYPH<g71> GLYPH<g3> GLYPH<g68>GLYPH<g83>GLYPH<g83>GLYPH<g79>GLYPH<g76>GLYPH<g70>GLYPH<g68>GLYPH<g87>GLYPH<g76>GLYPH<g82>GLYPH<g81>GLYPH<g86>"}, {"label": "list_item", "id": 4, "page_no": 2, "cluster": {"id": 4, "label": "list_item", "bbox": {"l": 144.88921, "t": 398.48019, "r": 249.83562, "b": 411.95255, "coord_origin": "TOPLEFT"}, "confidence": 0.9541196823120117, "cells": [{"id": 58, "text": "GLYPH<g115>GLYPH<g3>", "bbox": {"l": 144.88921, "t": 399.28265, "r": 148.68732, "b": 403.86481000000003, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "GLYPH<g53>GLYPH<g72>GLYPH<g79>GLYPH<g92>GLYPH<g3>", "bbox": {"l": 151.9388, "t": 398.48019, "r": 165.36099, "b": 404.11978, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "GLYPH<g82>GLYPH<g81>GLYPH<g3>", "bbox": {"l": 165.04141, "t": 398.48019, "r": 173.56345, "b": 404.11978, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "GLYPH<g44>GLYPH<g37>GLYPH<g48>GLYPH<g3>", "bbox": {"l": 173.23761, "t": 398.48019, "r": 185.95174, "b": 404.11978, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "GLYPH<g72>GLYPH<g91>GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g87>GLYPH<g3>", "bbox": {"l": 185.63216, "t": 398.48019, "r": 204.42448, "b": 404.11978, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "GLYPH<g70>GLYPH<g82>GLYPH<g81>GLYPH<g86>GLYPH<g88>GLYPH<g79>GLYPH<g87>GLYPH<g76>GLYPH<g81>GLYPH<g74>GLYPH<g15>GLYPH<g3>", "bbox": {"l": 204.11118, "t": 398.48019, "r": 235.29178, "b": 404.11978, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "GLYPH<g86>GLYPH<g78>GLYPH<g76>GLYPH<g79>GLYPH<g79>GLYPH<g86> GLYPH<g3>", "bbox": {"l": 234.99099999999999, "t": 398.48019, "r": 249.83562, "b": 404.11978, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "GLYPH<g86>GLYPH<g75>GLYPH<g68>GLYPH<g85>GLYPH<g76>GLYPH<g81>GLYPH<g74>GLYPH<g3>", "bbox": {"l": 151.93253, "t": 406.31296, "r": 173.41306, "b": 411.95255, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "GLYPH<g68>GLYPH<g81>GLYPH<g71>GLYPH<g3>", "bbox": {"l": 173.10602, "t": 406.31296, "r": 185.0118, "b": 411.95255, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "GLYPH<g85>GLYPH<g72>GLYPH<g81>GLYPH<g82>GLYPH<g90>GLYPH<g81>GLYPH<g3>", "bbox": {"l": 184.69221, "t": 406.31296, "r": 206.3858, "b": 411.95255, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "GLYPH<g86>GLYPH<g72>GLYPH<g85>GLYPH<g89>GLYPH<g76>GLYPH<g70>GLYPH<g72>GLYPH<g86>", "bbox": {"l": 206.07249, "t": 406.31296, "r": 228.24231000000003, "b": 411.95255, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<g115>GLYPH<g3> GLYPH<g53>GLYPH<g72>GLYPH<g79>GLYPH<g92>GLYPH<g3> GLYPH<g82>GLYPH<g81>GLYPH<g3> GLYPH<g44>GLYPH<g37>GLYPH<g48>GLYPH<g3> GLYPH<g72>GLYPH<g91>GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g87>GLYPH<g3> GLYPH<g70>GLYPH<g82>GLYPH<g81>GLYPH<g86>GLYPH<g88>GLYPH<g79>GLYPH<g87>GLYPH<g76>GLYPH<g81>GLYPH<g74>GLYPH<g15>GLYPH<g3> GLYPH<g86>GLYPH<g78>GLYPH<g76>GLYPH<g79>GLYPH<g79>GLYPH<g86> GLYPH<g3> GLYPH<g86>GLYPH<g75>GLYPH<g68>GLYPH<g85>GLYPH<g76>GLYPH<g81>GLYPH<g74>GLYPH<g3> GLYPH<g68>GLYPH<g81>GLYPH<g71>GLYPH<g3> GLYPH<g85>GLYPH<g72>GLYPH<g81>GLYPH<g82>GLYPH<g90>GLYPH<g81>GLYPH<g3> GLYPH<g86>GLYPH<g72>GLYPH<g85>GLYPH<g89>GLYPH<g76>GLYPH<g70>GLYPH<g72>GLYPH<g86>"}, {"label": "list_item", "id": 5, "page_no": 2, "cluster": {"id": 5, "label": "list_item", "bbox": {"l": 144.88921, "t": 421.1952800000001, "r": 234.25163000000003, "b": 434.66763, "coord_origin": "TOPLEFT"}, "confidence": 0.9440370798110962, "cells": [{"id": 69, "text": "GLYPH<g115>GLYPH<g3>", "bbox": {"l": 144.88921, "t": 421.99773999999996, "r": 148.68732, "b": 426.5799, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "GLYPH<g55>", "bbox": {"l": 151.9388, "t": 421.1952800000001, "r": 155.43533, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "GLYPH<g68>GLYPH<g78>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 154.73979, "t": 421.1952800000001, "r": 166.06282, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "GLYPH<g68>GLYPH<g71>GLYPH<g89>GLYPH<g68>GLYPH<g81>GLYPH<g87>GLYPH<g68>GLYPH<g74>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 165.74324, "t": 421.1952800000001, "r": 195.84607, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "GLYPH<g82>GLYPH<g73>GLYPH<g3>", "bbox": {"l": 195.53903, "t": 421.1952800000001, "r": 202.43185, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "GLYPH<g68>GLYPH<g70>GLYPH<g70>GLYPH<g72>GLYPH<g86>GLYPH<g86>GLYPH<g3>", "bbox": {"l": 202.10602, "t": 421.1952800000001, "r": 222.87220999999997, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "GLYPH<g87>GLYPH<g82>GLYPH<g3>", "bbox": {"l": 222.55890000000002, "t": 421.1952800000001, "r": 229.57077, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "GLYPH<g68> GLYPH<g3>", "bbox": {"l": 229.24492999999998, "t": 421.1952800000001, "r": 234.25163000000003, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "GLYPH<g90>GLYPH<g82>GLYPH<g85>GLYPH<g79>GLYPH<g71>GLYPH<g90>GLYPH<g76>GLYPH<g71>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 151.92627, "t": 429.02805, "r": 181.42754, "b": 434.66763, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "GLYPH<g86>GLYPH<g82>GLYPH<g88>GLYPH<g85>GLYPH<g70>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 181.1205, "t": 429.02805, "r": 201.07835, "b": 434.66763, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "GLYPH<g82>GLYPH<g73>GLYPH<g3>", "bbox": {"l": 200.76505, "t": 429.02805, "r": 207.65787, "b": 434.66763, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "GLYPH<g72>GLYPH<g91>GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g87>GLYPH<g76>GLYPH<g86>GLYPH<g72>", "bbox": {"l": 207.33203, "t": 429.02805, "r": 232.07098000000002, "b": 434.66763, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<g115>GLYPH<g3> GLYPH<g55> GLYPH<g68>GLYPH<g78>GLYPH<g72>GLYPH<g3> GLYPH<g68>GLYPH<g71>GLYPH<g89>GLYPH<g68>GLYPH<g81>GLYPH<g87>GLYPH<g68>GLYPH<g74>GLYPH<g72>GLYPH<g3> GLYPH<g82>GLYPH<g73>GLYPH<g3> GLYPH<g68>GLYPH<g70>GLYPH<g70>GLYPH<g72>GLYPH<g86>GLYPH<g86>GLYPH<g3> GLYPH<g87>GLYPH<g82>GLYPH<g3> GLYPH<g68> GLYPH<g3> GLYPH<g90>GLYPH<g82>GLYPH<g85>GLYPH<g79>GLYPH<g71>GLYPH<g90>GLYPH<g76>GLYPH<g71>GLYPH<g72>GLYPH<g3> GLYPH<g86>GLYPH<g82>GLYPH<g88>GLYPH<g85>GLYPH<g70>GLYPH<g72>GLYPH<g3> GLYPH<g82>GLYPH<g73>GLYPH<g3> GLYPH<g72>GLYPH<g91>GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g87>GLYPH<g76>GLYPH<g86>GLYPH<g72>"}, {"label": "picture", "id": 24, "page_no": 2, "cluster": {"id": 24, "label": "picture", "bbox": {"l": 143.39866638183594, "t": 270.2610778808594, "r": 179.56256103515625, "b": 285.621337890625, "coord_origin": "TOPLEFT"}, "confidence": 0.7491768598556519, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "picture", "id": 15, "page_no": 2, "cluster": {"id": 15, "label": "picture", "bbox": {"l": 64.1669921875, "t": 603.50634765625, "r": 258.7742919921875, "b": 688.1282348632812, "coord_origin": "TOPLEFT"}, "confidence": 0.8925829529762268, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "headers": []}}, {"page_no": 3, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "' Copyright IBM Corp. 2014. All rights reserved.", "bbox": {"l": 64.800003, "t": 755.538002, "r": 257.24335, "b": 763.863001, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "xi", "bbox": {"l": 538.85999, "t": 754.848721, "r": 547.25031, "b": 764.06172, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Preface", "bbox": {"l": 64.800003, "t": 73.84802000000002, "r": 151.46161, "b": 96.04803000000004, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "This IBMfi Redpaper\u2122 publication provides information about the IBM i 7.2 feature of IBM ", "bbox": {"l": 136.8, "t": 132.64862000000005, "r": 542.91888, "b": 141.86163, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "DB2fi for i Row and Column Access Control (RCAC). It offers a broad description of the ", "bbox": {"l": 136.79984, "t": 144.64844000000005, "r": 526.65509, "b": 153.86145, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "function and advantages of controlling access to data in a comprehensive and transparent ", "bbox": {"l": 136.79984, "t": 156.64824999999996, "r": 536.82135, "b": 165.86127, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "way. This publication helps you understand the capabilities of RCAC and provides examples ", "bbox": {"l": 136.79987, "t": 168.64806999999996, "r": 544.67975, "b": 177.86108000000002, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "of defining, creating, and implementing the row permissions and column masks in a relational ", "bbox": {"l": 136.79987, "t": 180.64788999999996, "r": 547.30823, "b": 189.86090000000002, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "database environment.", "bbox": {"l": 136.79987, "t": 192.64770999999996, "r": 238.32117, "b": 201.86072000000001, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "This paper is intended for database engineers, data-centric application developers, and ", "bbox": {"l": 136.79987, "t": 214.60748, "r": 524.18518, "b": 223.82050000000004, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "security officers who want to design and implement RCAC as a part of their data control and ", "bbox": {"l": 136.79987, "t": 226.6073, "r": 546.4657, "b": 235.82030999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "governance policy. A solid background in IBM i object level security, DB2 for i relational ", "bbox": {"l": 136.79987, "t": 238.60712, "r": 521.25488, "b": 247.82012999999995, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "database concepts, and SQL is assumed.", "bbox": {"l": 136.79987, "t": 250.60693000000003, "r": 321.69434, "b": 259.81994999999995, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Authors", "bbox": {"l": 64.800003, "t": 288.3006, "r": 125.36661, "b": 303.0636, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "This paper was produced by the IBM DB2 for i Center of Excellence team in partnership with ", "bbox": {"l": 136.8, "t": 320.62871999999993, "r": 547.23669, "b": 329.8417099999999, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "the International Technical Support Organization (ITSO), Rochester, Minnesota US.", "bbox": {"l": 136.8, "t": 332.62854, "r": 505.05518, "b": 341.84152, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Jim Bainbridge", "bbox": {"l": 263.39957, "t": 375.64877, "r": 335.7251, "b": 384.86176, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": " is a senior DB2 consultant on the DB2 for i ", "bbox": {"l": 335.69922, "t": 375.64877, "r": 529.34259, "b": 384.86176, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Center of Excellence team in the IBM Lab Services and ", "bbox": {"l": 263.3996, "t": 387.64859, "r": 511.50717, "b": 396.86157, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Training organization. His primary role is training and ", "bbox": {"l": 263.3996, "t": 399.64841, "r": 499.077, "b": 408.86139, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "implementation services for IBM DB2 Web Query for i and ", "bbox": {"l": 263.3996, "t": 411.64822, "r": 522.51996, "b": 420.86121, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "business analytics. Jim began his career with IBM 30 years ago ", "bbox": {"l": 263.3996, "t": 423.64804, "r": 541.25079, "b": 432.86102, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "in the IBM Rochester Development Lab, where he developed ", "bbox": {"l": 263.3996, "t": 435.64786, "r": 534.71411, "b": 444.86084, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "cooperative processing products that paired IBM PCs with IBM ", "bbox": {"l": 263.3996, "t": 447.64767, "r": 541.22375, "b": 456.86066, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "S/36 and AS/.400 systems. In the years since, Jim has held ", "bbox": {"l": 263.3996, "t": 459.64749, "r": 528.91016, "b": 468.86047, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "numerous technical roles, including independent software ", "bbox": {"l": 263.3996, "t": 471.64731, "r": 520.24207, "b": 480.86029, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "vendors technical support on a broad range of IBM ", "bbox": {"l": 263.3996, "t": 483.64713, "r": 490.6967200000001, "b": 492.86011, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "technologies and products, and supporting customers in the ", "bbox": {"l": 263.3996, "t": 495.64694, "r": 530.95514, "b": 504.85992, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "IBM Executive Briefing Center and IBM Project Office.", "bbox": {"l": 263.3996, "t": 507.64676, "r": 501.62973, "b": 516.85974, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Hernando Bedoya", "bbox": {"l": 263.3996, "t": 527.62653, "r": 348.38229, "b": 536.83952, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": " is a Senior IT Specialist at STG Lab ", "bbox": {"l": 348.41916, "t": 527.62653, "r": 512.3429, "b": 536.83952, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Services and Training in Rochester, Minnesota. He writes ", "bbox": {"l": 263.3996, "t": 539.62633, "r": 519.26306, "b": 548.83932, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "extensively and teaches IBM classes worldwide in all areas of ", "bbox": {"l": 263.3996, "t": 551.62613, "r": 538.40308, "b": 560.8391300000001, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "DB2 for i. Before joining STG Lab Services, he worked in the ", "bbox": {"l": 263.3996, "t": 563.62593, "r": 533.95715, "b": 572.83893, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "ITSO for nine years writing multiple IBM Redbooksfi ", "bbox": {"l": 263.3996, "t": 575.62573, "r": 496.94464, "b": 584.8387299999999, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "publications. He also worked for IBM Colombia as an IBM ", "bbox": {"l": 263.3996, "t": 587.62553, "r": 520.38562, "b": 596.83853, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "AS/400fi IT Specialist doing presales support for the Andean ", "bbox": {"l": 263.3996, "t": 599.62534, "r": 535.99078, "b": 608.83833, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "countries. He has 28 years of experience in the computing field ", "bbox": {"l": 263.3996, "t": 611.62514, "r": 541.27374, "b": 620.83813, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "and has taught database classes in Colombian universities. He ", "bbox": {"l": 263.3996, "t": 623.62494, "r": 541.26465, "b": 632.83794, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "holds a Master\u2019s degree in Computer Science from EAFIT, ", "bbox": {"l": 263.3996, "t": 635.62474, "r": 523.22211, "b": 644.8377399999999, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "Colombia. His areas of expertise are database technology, ", "bbox": {"l": 263.3996, "t": 647.62454, "r": 524.77386, "b": 656.83754, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "performance, and data warehousing. Hernando can be ", "bbox": {"l": 263.3996, "t": 659.62434, "r": 508.27124, "b": 668.83735, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "contacted at ", "bbox": {"l": 263.3996, "t": 671.62415, "r": 320.63568, "b": 680.83716, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "hbedoya@us.ibm.com", "bbox": {"l": 320.63971, "t": 671.77356, "r": 410.57852, "b": 680.54832, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": ".", "bbox": {"l": 410.5795, "t": 671.62415, "r": 413.34839, "b": 680.83716, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 7, "label": "page_footer", "bbox": {"l": 64.800003, "t": 755.538002, "r": 257.24335, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9469243884086609, "cells": [{"id": 0, "text": "' Copyright IBM Corp. 2014. All rights reserved.", "bbox": {"l": 64.800003, "t": 755.538002, "r": 257.24335, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "page_footer", "bbox": {"l": 538.85999, "t": 754.848721, "r": 547.25031, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.904093861579895, "cells": [{"id": 1, "text": "xi", "bbox": {"l": 538.85999, "t": 754.848721, "r": 547.25031, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "section_header", "bbox": {"l": 64.800003, "t": 73.84802000000002, "r": 151.46161, "b": 96.04803000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9174711108207703, "cells": [{"id": 2, "text": "Preface", "bbox": {"l": 64.800003, "t": 73.84802000000002, "r": 151.46161, "b": 96.04803000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 136.79984, "t": 132.64862000000005, "r": 547.30823, "b": 201.86072000000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9869155883789062, "cells": [{"id": 3, "text": "This IBMfi Redpaper\u2122 publication provides information about the IBM i 7.2 feature of IBM ", "bbox": {"l": 136.8, "t": 132.64862000000005, "r": 542.91888, "b": 141.86163, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "DB2fi for i Row and Column Access Control (RCAC). It offers a broad description of the ", "bbox": {"l": 136.79984, "t": 144.64844000000005, "r": 526.65509, "b": 153.86145, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "function and advantages of controlling access to data in a comprehensive and transparent ", "bbox": {"l": 136.79984, "t": 156.64824999999996, "r": 536.82135, "b": 165.86127, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "way. This publication helps you understand the capabilities of RCAC and provides examples ", "bbox": {"l": 136.79987, "t": 168.64806999999996, "r": 544.67975, "b": 177.86108000000002, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "of defining, creating, and implementing the row permissions and column masks in a relational ", "bbox": {"l": 136.79987, "t": 180.64788999999996, "r": 547.30823, "b": 189.86090000000002, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "database environment.", "bbox": {"l": 136.79987, "t": 192.64770999999996, "r": 238.32117, "b": 201.86072000000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 136.79987, "t": 214.60748, "r": 546.4657, "b": 259.81994999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9872201681137085, "cells": [{"id": 9, "text": "This paper is intended for database engineers, data-centric application developers, and ", "bbox": {"l": 136.79987, "t": 214.60748, "r": 524.18518, "b": 223.82050000000004, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "security officers who want to design and implement RCAC as a part of their data control and ", "bbox": {"l": 136.79987, "t": 226.6073, "r": 546.4657, "b": 235.82030999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "governance policy. A solid background in IBM i object level security, DB2 for i relational ", "bbox": {"l": 136.79987, "t": 238.60712, "r": 521.25488, "b": 247.82012999999995, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "database concepts, and SQL is assumed.", "bbox": {"l": 136.79987, "t": 250.60693000000003, "r": 321.69434, "b": 259.81994999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "section_header", "bbox": {"l": 64.800003, "t": 288.3006, "r": 125.36661, "b": 303.0636, "coord_origin": "TOPLEFT"}, "confidence": 0.9255507588386536, "cells": [{"id": 13, "text": "Authors", "bbox": {"l": 64.800003, "t": 288.3006, "r": 125.36661, "b": 303.0636, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "text", "bbox": {"l": 136.8, "t": 320.62871999999993, "r": 547.23669, "b": 341.84152, "coord_origin": "TOPLEFT"}, "confidence": 0.9713318347930908, "cells": [{"id": 14, "text": "This paper was produced by the IBM DB2 for i Center of Excellence team in partnership with ", "bbox": {"l": 136.8, "t": 320.62871999999993, "r": 547.23669, "b": 329.8417099999999, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "the International Technical Support Organization (ITSO), Rochester, Minnesota US.", "bbox": {"l": 136.8, "t": 332.62854, "r": 505.05518, "b": 341.84152, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "text", "bbox": {"l": 263.39957, "t": 375.64877, "r": 541.25079, "b": 516.85974, "coord_origin": "TOPLEFT"}, "confidence": 0.9842760562896729, "cells": [{"id": 16, "text": "Jim Bainbridge", "bbox": {"l": 263.39957, "t": 375.64877, "r": 335.7251, "b": 384.86176, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": " is a senior DB2 consultant on the DB2 for i ", "bbox": {"l": 335.69922, "t": 375.64877, "r": 529.34259, "b": 384.86176, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Center of Excellence team in the IBM Lab Services and ", "bbox": {"l": 263.3996, "t": 387.64859, "r": 511.50717, "b": 396.86157, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Training organization. His primary role is training and ", "bbox": {"l": 263.3996, "t": 399.64841, "r": 499.077, "b": 408.86139, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "implementation services for IBM DB2 Web Query for i and ", "bbox": {"l": 263.3996, "t": 411.64822, "r": 522.51996, "b": 420.86121, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "business analytics. Jim began his career with IBM 30 years ago ", "bbox": {"l": 263.3996, "t": 423.64804, "r": 541.25079, "b": 432.86102, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "in the IBM Rochester Development Lab, where he developed ", "bbox": {"l": 263.3996, "t": 435.64786, "r": 534.71411, "b": 444.86084, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "cooperative processing products that paired IBM PCs with IBM ", "bbox": {"l": 263.3996, "t": 447.64767, "r": 541.22375, "b": 456.86066, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "S/36 and AS/.400 systems. In the years since, Jim has held ", "bbox": {"l": 263.3996, "t": 459.64749, "r": 528.91016, "b": 468.86047, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "numerous technical roles, including independent software ", "bbox": {"l": 263.3996, "t": 471.64731, "r": 520.24207, "b": 480.86029, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "vendors technical support on a broad range of IBM ", "bbox": {"l": 263.3996, "t": 483.64713, "r": 490.6967200000001, "b": 492.86011, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "technologies and products, and supporting customers in the ", "bbox": {"l": 263.3996, "t": 495.64694, "r": 530.95514, "b": 504.85992, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "IBM Executive Briefing Center and IBM Project Office.", "bbox": {"l": 263.3996, "t": 507.64676, "r": 501.62973, "b": 516.85974, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "text", "bbox": {"l": 263.3996, "t": 527.62653, "r": 541.27374, "b": 680.83716, "coord_origin": "TOPLEFT"}, "confidence": 0.9823779463768005, "cells": [{"id": 29, "text": "Hernando Bedoya", "bbox": {"l": 263.3996, "t": 527.62653, "r": 348.38229, "b": 536.83952, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": " is a Senior IT Specialist at STG Lab ", "bbox": {"l": 348.41916, "t": 527.62653, "r": 512.3429, "b": 536.83952, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Services and Training in Rochester, Minnesota. He writes ", "bbox": {"l": 263.3996, "t": 539.62633, "r": 519.26306, "b": 548.83932, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "extensively and teaches IBM classes worldwide in all areas of ", "bbox": {"l": 263.3996, "t": 551.62613, "r": 538.40308, "b": 560.8391300000001, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "DB2 for i. Before joining STG Lab Services, he worked in the ", "bbox": {"l": 263.3996, "t": 563.62593, "r": 533.95715, "b": 572.83893, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "ITSO for nine years writing multiple IBM Redbooksfi ", "bbox": {"l": 263.3996, "t": 575.62573, "r": 496.94464, "b": 584.8387299999999, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "publications. He also worked for IBM Colombia as an IBM ", "bbox": {"l": 263.3996, "t": 587.62553, "r": 520.38562, "b": 596.83853, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "AS/400fi IT Specialist doing presales support for the Andean ", "bbox": {"l": 263.3996, "t": 599.62534, "r": 535.99078, "b": 608.83833, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "countries. He has 28 years of experience in the computing field ", "bbox": {"l": 263.3996, "t": 611.62514, "r": 541.27374, "b": 620.83813, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "and has taught database classes in Colombian universities. He ", "bbox": {"l": 263.3996, "t": 623.62494, "r": 541.26465, "b": 632.83794, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "holds a Master\u2019s degree in Computer Science from EAFIT, ", "bbox": {"l": 263.3996, "t": 635.62474, "r": 523.22211, "b": 644.8377399999999, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "Colombia. His areas of expertise are database technology, ", "bbox": {"l": 263.3996, "t": 647.62454, "r": 524.77386, "b": 656.83754, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "performance, and data warehousing. Hernando can be ", "bbox": {"l": 263.3996, "t": 659.62434, "r": 508.27124, "b": 668.83735, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "contacted at ", "bbox": {"l": 263.3996, "t": 671.62415, "r": 320.63568, "b": 680.83716, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "hbedoya@us.ibm.com", "bbox": {"l": 320.63971, "t": 671.77356, "r": 410.57852, "b": 680.54832, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": ".", "bbox": {"l": 410.5795, "t": 671.62415, "r": 413.34839, "b": 680.83716, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "picture", "bbox": {"l": 142.52883911132812, "t": 375.0449523925781, "r": 251.47850036621094, "b": 503.20648193359375, "coord_origin": "TOPLEFT"}, "confidence": 0.9862572550773621, "cells": [], "children": []}, {"id": 1, "label": "picture", "bbox": {"l": 145.4144744873047, "t": 527.2447509765625, "r": 252.08840942382812, "b": 635.383056640625, "coord_origin": "TOPLEFT"}, "confidence": 0.9871657490730286, "cells": [], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_footer", "id": 7, "page_no": 3, "cluster": {"id": 7, "label": "page_footer", "bbox": {"l": 64.800003, "t": 755.538002, "r": 257.24335, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9469243884086609, "cells": [{"id": 0, "text": "' Copyright IBM Corp. 2014. All rights reserved.", "bbox": {"l": 64.800003, "t": 755.538002, "r": 257.24335, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "' Copyright IBM Corp. 2014. All rights reserved."}, {"label": "page_footer", "id": 10, "page_no": 3, "cluster": {"id": 10, "label": "page_footer", "bbox": {"l": 538.85999, "t": 754.848721, "r": 547.25031, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.904093861579895, "cells": [{"id": 1, "text": "xi", "bbox": {"l": 538.85999, "t": 754.848721, "r": 547.25031, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "xi"}, {"label": "section_header", "id": 9, "page_no": 3, "cluster": {"id": 9, "label": "section_header", "bbox": {"l": 64.800003, "t": 73.84802000000002, "r": 151.46161, "b": 96.04803000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9174711108207703, "cells": [{"id": 2, "text": "Preface", "bbox": {"l": 64.800003, "t": 73.84802000000002, "r": 151.46161, "b": 96.04803000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Preface"}, {"label": "text", "id": 2, "page_no": 3, "cluster": {"id": 2, "label": "text", "bbox": {"l": 136.79984, "t": 132.64862000000005, "r": 547.30823, "b": 201.86072000000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9869155883789062, "cells": [{"id": 3, "text": "This IBMfi Redpaper\u2122 publication provides information about the IBM i 7.2 feature of IBM ", "bbox": {"l": 136.8, "t": 132.64862000000005, "r": 542.91888, "b": 141.86163, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "DB2fi for i Row and Column Access Control (RCAC). It offers a broad description of the ", "bbox": {"l": 136.79984, "t": 144.64844000000005, "r": 526.65509, "b": 153.86145, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "function and advantages of controlling access to data in a comprehensive and transparent ", "bbox": {"l": 136.79984, "t": 156.64824999999996, "r": 536.82135, "b": 165.86127, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "way. This publication helps you understand the capabilities of RCAC and provides examples ", "bbox": {"l": 136.79987, "t": 168.64806999999996, "r": 544.67975, "b": 177.86108000000002, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "of defining, creating, and implementing the row permissions and column masks in a relational ", "bbox": {"l": 136.79987, "t": 180.64788999999996, "r": 547.30823, "b": 189.86090000000002, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "database environment.", "bbox": {"l": 136.79987, "t": 192.64770999999996, "r": 238.32117, "b": 201.86072000000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "This IBMfi Redpaper\u2122 publication provides information about the IBM i 7.2 feature of IBM DB2fi for i Row and Column Access Control (RCAC). It offers a broad description of the function and advantages of controlling access to data in a comprehensive and transparent way. This publication helps you understand the capabilities of RCAC and provides examples of defining, creating, and implementing the row permissions and column masks in a relational database environment."}, {"label": "text", "id": 0, "page_no": 3, "cluster": {"id": 0, "label": "text", "bbox": {"l": 136.79987, "t": 214.60748, "r": 546.4657, "b": 259.81994999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9872201681137085, "cells": [{"id": 9, "text": "This paper is intended for database engineers, data-centric application developers, and ", "bbox": {"l": 136.79987, "t": 214.60748, "r": 524.18518, "b": 223.82050000000004, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "security officers who want to design and implement RCAC as a part of their data control and ", "bbox": {"l": 136.79987, "t": 226.6073, "r": 546.4657, "b": 235.82030999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "governance policy. A solid background in IBM i object level security, DB2 for i relational ", "bbox": {"l": 136.79987, "t": 238.60712, "r": 521.25488, "b": 247.82012999999995, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "database concepts, and SQL is assumed.", "bbox": {"l": 136.79987, "t": 250.60693000000003, "r": 321.69434, "b": 259.81994999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "This paper is intended for database engineers, data-centric application developers, and security officers who want to design and implement RCAC as a part of their data control and governance policy. A solid background in IBM i object level security, DB2 for i relational database concepts, and SQL is assumed."}, {"label": "section_header", "id": 8, "page_no": 3, "cluster": {"id": 8, "label": "section_header", "bbox": {"l": 64.800003, "t": 288.3006, "r": 125.36661, "b": 303.0636, "coord_origin": "TOPLEFT"}, "confidence": 0.9255507588386536, "cells": [{"id": 13, "text": "Authors", "bbox": {"l": 64.800003, "t": 288.3006, "r": 125.36661, "b": 303.0636, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Authors"}, {"label": "text", "id": 6, "page_no": 3, "cluster": {"id": 6, "label": "text", "bbox": {"l": 136.8, "t": 320.62871999999993, "r": 547.23669, "b": 341.84152, "coord_origin": "TOPLEFT"}, "confidence": 0.9713318347930908, "cells": [{"id": 14, "text": "This paper was produced by the IBM DB2 for i Center of Excellence team in partnership with ", "bbox": {"l": 136.8, "t": 320.62871999999993, "r": 547.23669, "b": 329.8417099999999, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "the International Technical Support Organization (ITSO), Rochester, Minnesota US.", "bbox": {"l": 136.8, "t": 332.62854, "r": 505.05518, "b": 341.84152, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "This paper was produced by the IBM DB2 for i Center of Excellence team in partnership with the International Technical Support Organization (ITSO), Rochester, Minnesota US."}, {"label": "text", "id": 4, "page_no": 3, "cluster": {"id": 4, "label": "text", "bbox": {"l": 263.39957, "t": 375.64877, "r": 541.25079, "b": 516.85974, "coord_origin": "TOPLEFT"}, "confidence": 0.9842760562896729, "cells": [{"id": 16, "text": "Jim Bainbridge", "bbox": {"l": 263.39957, "t": 375.64877, "r": 335.7251, "b": 384.86176, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": " is a senior DB2 consultant on the DB2 for i ", "bbox": {"l": 335.69922, "t": 375.64877, "r": 529.34259, "b": 384.86176, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Center of Excellence team in the IBM Lab Services and ", "bbox": {"l": 263.3996, "t": 387.64859, "r": 511.50717, "b": 396.86157, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Training organization. His primary role is training and ", "bbox": {"l": 263.3996, "t": 399.64841, "r": 499.077, "b": 408.86139, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "implementation services for IBM DB2 Web Query for i and ", "bbox": {"l": 263.3996, "t": 411.64822, "r": 522.51996, "b": 420.86121, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "business analytics. Jim began his career with IBM 30 years ago ", "bbox": {"l": 263.3996, "t": 423.64804, "r": 541.25079, "b": 432.86102, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "in the IBM Rochester Development Lab, where he developed ", "bbox": {"l": 263.3996, "t": 435.64786, "r": 534.71411, "b": 444.86084, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "cooperative processing products that paired IBM PCs with IBM ", "bbox": {"l": 263.3996, "t": 447.64767, "r": 541.22375, "b": 456.86066, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "S/36 and AS/.400 systems. In the years since, Jim has held ", "bbox": {"l": 263.3996, "t": 459.64749, "r": 528.91016, "b": 468.86047, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "numerous technical roles, including independent software ", "bbox": {"l": 263.3996, "t": 471.64731, "r": 520.24207, "b": 480.86029, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "vendors technical support on a broad range of IBM ", "bbox": {"l": 263.3996, "t": 483.64713, "r": 490.6967200000001, "b": 492.86011, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "technologies and products, and supporting customers in the ", "bbox": {"l": 263.3996, "t": 495.64694, "r": 530.95514, "b": 504.85992, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "IBM Executive Briefing Center and IBM Project Office.", "bbox": {"l": 263.3996, "t": 507.64676, "r": 501.62973, "b": 516.85974, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Jim Bainbridge is a senior DB2 consultant on the DB2 for i Center of Excellence team in the IBM Lab Services and Training organization. His primary role is training and implementation services for IBM DB2 Web Query for i and business analytics. Jim began his career with IBM 30 years ago in the IBM Rochester Development Lab, where he developed cooperative processing products that paired IBM PCs with IBM S/36 and AS/.400 systems. In the years since, Jim has held numerous technical roles, including independent software vendors technical support on a broad range of IBM technologies and products, and supporting customers in the IBM Executive Briefing Center and IBM Project Office."}, {"label": "text", "id": 5, "page_no": 3, "cluster": {"id": 5, "label": "text", "bbox": {"l": 263.3996, "t": 527.62653, "r": 541.27374, "b": 680.83716, "coord_origin": "TOPLEFT"}, "confidence": 0.9823779463768005, "cells": [{"id": 29, "text": "Hernando Bedoya", "bbox": {"l": 263.3996, "t": 527.62653, "r": 348.38229, "b": 536.83952, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": " is a Senior IT Specialist at STG Lab ", "bbox": {"l": 348.41916, "t": 527.62653, "r": 512.3429, "b": 536.83952, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Services and Training in Rochester, Minnesota. He writes ", "bbox": {"l": 263.3996, "t": 539.62633, "r": 519.26306, "b": 548.83932, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "extensively and teaches IBM classes worldwide in all areas of ", "bbox": {"l": 263.3996, "t": 551.62613, "r": 538.40308, "b": 560.8391300000001, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "DB2 for i. Before joining STG Lab Services, he worked in the ", "bbox": {"l": 263.3996, "t": 563.62593, "r": 533.95715, "b": 572.83893, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "ITSO for nine years writing multiple IBM Redbooksfi ", "bbox": {"l": 263.3996, "t": 575.62573, "r": 496.94464, "b": 584.8387299999999, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "publications. He also worked for IBM Colombia as an IBM ", "bbox": {"l": 263.3996, "t": 587.62553, "r": 520.38562, "b": 596.83853, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "AS/400fi IT Specialist doing presales support for the Andean ", "bbox": {"l": 263.3996, "t": 599.62534, "r": 535.99078, "b": 608.83833, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "countries. He has 28 years of experience in the computing field ", "bbox": {"l": 263.3996, "t": 611.62514, "r": 541.27374, "b": 620.83813, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "and has taught database classes in Colombian universities. He ", "bbox": {"l": 263.3996, "t": 623.62494, "r": 541.26465, "b": 632.83794, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "holds a Master\u2019s degree in Computer Science from EAFIT, ", "bbox": {"l": 263.3996, "t": 635.62474, "r": 523.22211, "b": 644.8377399999999, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "Colombia. His areas of expertise are database technology, ", "bbox": {"l": 263.3996, "t": 647.62454, "r": 524.77386, "b": 656.83754, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "performance, and data warehousing. Hernando can be ", "bbox": {"l": 263.3996, "t": 659.62434, "r": 508.27124, "b": 668.83735, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "contacted at ", "bbox": {"l": 263.3996, "t": 671.62415, "r": 320.63568, "b": 680.83716, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "hbedoya@us.ibm.com", "bbox": {"l": 320.63971, "t": 671.77356, "r": 410.57852, "b": 680.54832, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": ".", "bbox": {"l": 410.5795, "t": 671.62415, "r": 413.34839, "b": 680.83716, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Hernando Bedoya is a Senior IT Specialist at STG Lab Services and Training in Rochester, Minnesota. He writes extensively and teaches IBM classes worldwide in all areas of DB2 for i. Before joining STG Lab Services, he worked in the ITSO for nine years writing multiple IBM Redbooksfi publications. He also worked for IBM Colombia as an IBM AS/400fi IT Specialist doing presales support for the Andean countries. He has 28 years of experience in the computing field and has taught database classes in Colombian universities. He holds a Master's degree in Computer Science from EAFIT, Colombia. His areas of expertise are database technology, performance, and data warehousing. Hernando can be contacted at hbedoya@us.ibm.com ."}, {"label": "picture", "id": 3, "page_no": 3, "cluster": {"id": 3, "label": "picture", "bbox": {"l": 142.52883911132812, "t": 375.0449523925781, "r": 251.47850036621094, "b": 503.20648193359375, "coord_origin": "TOPLEFT"}, "confidence": 0.9862572550773621, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "picture", "id": 1, "page_no": 3, "cluster": {"id": 1, "label": "picture", "bbox": {"l": 145.4144744873047, "t": 527.2447509765625, "r": 252.08840942382812, "b": 635.383056640625, "coord_origin": "TOPLEFT"}, "confidence": 0.9871657490730286, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "body": [{"label": "section_header", "id": 9, "page_no": 3, "cluster": {"id": 9, "label": "section_header", "bbox": {"l": 64.800003, "t": 73.84802000000002, "r": 151.46161, "b": 96.04803000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9174711108207703, "cells": [{"id": 2, "text": "Preface", "bbox": {"l": 64.800003, "t": 73.84802000000002, "r": 151.46161, "b": 96.04803000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Preface"}, {"label": "text", "id": 2, "page_no": 3, "cluster": {"id": 2, "label": "text", "bbox": {"l": 136.79984, "t": 132.64862000000005, "r": 547.30823, "b": 201.86072000000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9869155883789062, "cells": [{"id": 3, "text": "This IBMfi Redpaper\u2122 publication provides information about the IBM i 7.2 feature of IBM ", "bbox": {"l": 136.8, "t": 132.64862000000005, "r": 542.91888, "b": 141.86163, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "DB2fi for i Row and Column Access Control (RCAC). It offers a broad description of the ", "bbox": {"l": 136.79984, "t": 144.64844000000005, "r": 526.65509, "b": 153.86145, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "function and advantages of controlling access to data in a comprehensive and transparent ", "bbox": {"l": 136.79984, "t": 156.64824999999996, "r": 536.82135, "b": 165.86127, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "way. This publication helps you understand the capabilities of RCAC and provides examples ", "bbox": {"l": 136.79987, "t": 168.64806999999996, "r": 544.67975, "b": 177.86108000000002, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "of defining, creating, and implementing the row permissions and column masks in a relational ", "bbox": {"l": 136.79987, "t": 180.64788999999996, "r": 547.30823, "b": 189.86090000000002, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "database environment.", "bbox": {"l": 136.79987, "t": 192.64770999999996, "r": 238.32117, "b": 201.86072000000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "This IBMfi Redpaper\u2122 publication provides information about the IBM i 7.2 feature of IBM DB2fi for i Row and Column Access Control (RCAC). It offers a broad description of the function and advantages of controlling access to data in a comprehensive and transparent way. This publication helps you understand the capabilities of RCAC and provides examples of defining, creating, and implementing the row permissions and column masks in a relational database environment."}, {"label": "text", "id": 0, "page_no": 3, "cluster": {"id": 0, "label": "text", "bbox": {"l": 136.79987, "t": 214.60748, "r": 546.4657, "b": 259.81994999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9872201681137085, "cells": [{"id": 9, "text": "This paper is intended for database engineers, data-centric application developers, and ", "bbox": {"l": 136.79987, "t": 214.60748, "r": 524.18518, "b": 223.82050000000004, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "security officers who want to design and implement RCAC as a part of their data control and ", "bbox": {"l": 136.79987, "t": 226.6073, "r": 546.4657, "b": 235.82030999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "governance policy. A solid background in IBM i object level security, DB2 for i relational ", "bbox": {"l": 136.79987, "t": 238.60712, "r": 521.25488, "b": 247.82012999999995, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "database concepts, and SQL is assumed.", "bbox": {"l": 136.79987, "t": 250.60693000000003, "r": 321.69434, "b": 259.81994999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "This paper is intended for database engineers, data-centric application developers, and security officers who want to design and implement RCAC as a part of their data control and governance policy. A solid background in IBM i object level security, DB2 for i relational database concepts, and SQL is assumed."}, {"label": "section_header", "id": 8, "page_no": 3, "cluster": {"id": 8, "label": "section_header", "bbox": {"l": 64.800003, "t": 288.3006, "r": 125.36661, "b": 303.0636, "coord_origin": "TOPLEFT"}, "confidence": 0.9255507588386536, "cells": [{"id": 13, "text": "Authors", "bbox": {"l": 64.800003, "t": 288.3006, "r": 125.36661, "b": 303.0636, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Authors"}, {"label": "text", "id": 6, "page_no": 3, "cluster": {"id": 6, "label": "text", "bbox": {"l": 136.8, "t": 320.62871999999993, "r": 547.23669, "b": 341.84152, "coord_origin": "TOPLEFT"}, "confidence": 0.9713318347930908, "cells": [{"id": 14, "text": "This paper was produced by the IBM DB2 for i Center of Excellence team in partnership with ", "bbox": {"l": 136.8, "t": 320.62871999999993, "r": 547.23669, "b": 329.8417099999999, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "the International Technical Support Organization (ITSO), Rochester, Minnesota US.", "bbox": {"l": 136.8, "t": 332.62854, "r": 505.05518, "b": 341.84152, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "This paper was produced by the IBM DB2 for i Center of Excellence team in partnership with the International Technical Support Organization (ITSO), Rochester, Minnesota US."}, {"label": "text", "id": 4, "page_no": 3, "cluster": {"id": 4, "label": "text", "bbox": {"l": 263.39957, "t": 375.64877, "r": 541.25079, "b": 516.85974, "coord_origin": "TOPLEFT"}, "confidence": 0.9842760562896729, "cells": [{"id": 16, "text": "Jim Bainbridge", "bbox": {"l": 263.39957, "t": 375.64877, "r": 335.7251, "b": 384.86176, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": " is a senior DB2 consultant on the DB2 for i ", "bbox": {"l": 335.69922, "t": 375.64877, "r": 529.34259, "b": 384.86176, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Center of Excellence team in the IBM Lab Services and ", "bbox": {"l": 263.3996, "t": 387.64859, "r": 511.50717, "b": 396.86157, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Training organization. His primary role is training and ", "bbox": {"l": 263.3996, "t": 399.64841, "r": 499.077, "b": 408.86139, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "implementation services for IBM DB2 Web Query for i and ", "bbox": {"l": 263.3996, "t": 411.64822, "r": 522.51996, "b": 420.86121, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "business analytics. Jim began his career with IBM 30 years ago ", "bbox": {"l": 263.3996, "t": 423.64804, "r": 541.25079, "b": 432.86102, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "in the IBM Rochester Development Lab, where he developed ", "bbox": {"l": 263.3996, "t": 435.64786, "r": 534.71411, "b": 444.86084, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "cooperative processing products that paired IBM PCs with IBM ", "bbox": {"l": 263.3996, "t": 447.64767, "r": 541.22375, "b": 456.86066, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "S/36 and AS/.400 systems. In the years since, Jim has held ", "bbox": {"l": 263.3996, "t": 459.64749, "r": 528.91016, "b": 468.86047, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "numerous technical roles, including independent software ", "bbox": {"l": 263.3996, "t": 471.64731, "r": 520.24207, "b": 480.86029, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "vendors technical support on a broad range of IBM ", "bbox": {"l": 263.3996, "t": 483.64713, "r": 490.6967200000001, "b": 492.86011, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "technologies and products, and supporting customers in the ", "bbox": {"l": 263.3996, "t": 495.64694, "r": 530.95514, "b": 504.85992, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "IBM Executive Briefing Center and IBM Project Office.", "bbox": {"l": 263.3996, "t": 507.64676, "r": 501.62973, "b": 516.85974, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Jim Bainbridge is a senior DB2 consultant on the DB2 for i Center of Excellence team in the IBM Lab Services and Training organization. His primary role is training and implementation services for IBM DB2 Web Query for i and business analytics. Jim began his career with IBM 30 years ago in the IBM Rochester Development Lab, where he developed cooperative processing products that paired IBM PCs with IBM S/36 and AS/.400 systems. In the years since, Jim has held numerous technical roles, including independent software vendors technical support on a broad range of IBM technologies and products, and supporting customers in the IBM Executive Briefing Center and IBM Project Office."}, {"label": "text", "id": 5, "page_no": 3, "cluster": {"id": 5, "label": "text", "bbox": {"l": 263.3996, "t": 527.62653, "r": 541.27374, "b": 680.83716, "coord_origin": "TOPLEFT"}, "confidence": 0.9823779463768005, "cells": [{"id": 29, "text": "Hernando Bedoya", "bbox": {"l": 263.3996, "t": 527.62653, "r": 348.38229, "b": 536.83952, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": " is a Senior IT Specialist at STG Lab ", "bbox": {"l": 348.41916, "t": 527.62653, "r": 512.3429, "b": 536.83952, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Services and Training in Rochester, Minnesota. He writes ", "bbox": {"l": 263.3996, "t": 539.62633, "r": 519.26306, "b": 548.83932, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "extensively and teaches IBM classes worldwide in all areas of ", "bbox": {"l": 263.3996, "t": 551.62613, "r": 538.40308, "b": 560.8391300000001, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "DB2 for i. Before joining STG Lab Services, he worked in the ", "bbox": {"l": 263.3996, "t": 563.62593, "r": 533.95715, "b": 572.83893, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "ITSO for nine years writing multiple IBM Redbooksfi ", "bbox": {"l": 263.3996, "t": 575.62573, "r": 496.94464, "b": 584.8387299999999, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "publications. He also worked for IBM Colombia as an IBM ", "bbox": {"l": 263.3996, "t": 587.62553, "r": 520.38562, "b": 596.83853, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "AS/400fi IT Specialist doing presales support for the Andean ", "bbox": {"l": 263.3996, "t": 599.62534, "r": 535.99078, "b": 608.83833, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "countries. He has 28 years of experience in the computing field ", "bbox": {"l": 263.3996, "t": 611.62514, "r": 541.27374, "b": 620.83813, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "and has taught database classes in Colombian universities. He ", "bbox": {"l": 263.3996, "t": 623.62494, "r": 541.26465, "b": 632.83794, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "holds a Master\u2019s degree in Computer Science from EAFIT, ", "bbox": {"l": 263.3996, "t": 635.62474, "r": 523.22211, "b": 644.8377399999999, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "Colombia. His areas of expertise are database technology, ", "bbox": {"l": 263.3996, "t": 647.62454, "r": 524.77386, "b": 656.83754, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "performance, and data warehousing. Hernando can be ", "bbox": {"l": 263.3996, "t": 659.62434, "r": 508.27124, "b": 668.83735, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "contacted at ", "bbox": {"l": 263.3996, "t": 671.62415, "r": 320.63568, "b": 680.83716, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "hbedoya@us.ibm.com", "bbox": {"l": 320.63971, "t": 671.77356, "r": 410.57852, "b": 680.54832, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": ".", "bbox": {"l": 410.5795, "t": 671.62415, "r": 413.34839, "b": 680.83716, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Hernando Bedoya is a Senior IT Specialist at STG Lab Services and Training in Rochester, Minnesota. He writes extensively and teaches IBM classes worldwide in all areas of DB2 for i. Before joining STG Lab Services, he worked in the ITSO for nine years writing multiple IBM Redbooksfi publications. He also worked for IBM Colombia as an IBM AS/400fi IT Specialist doing presales support for the Andean countries. He has 28 years of experience in the computing field and has taught database classes in Colombian universities. He holds a Master's degree in Computer Science from EAFIT, Colombia. His areas of expertise are database technology, performance, and data warehousing. Hernando can be contacted at hbedoya@us.ibm.com ."}, {"label": "picture", "id": 3, "page_no": 3, "cluster": {"id": 3, "label": "picture", "bbox": {"l": 142.52883911132812, "t": 375.0449523925781, "r": 251.47850036621094, "b": 503.20648193359375, "coord_origin": "TOPLEFT"}, "confidence": 0.9862572550773621, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "picture", "id": 1, "page_no": 3, "cluster": {"id": 1, "label": "picture", "bbox": {"l": 145.4144744873047, "t": 527.2447509765625, "r": 252.08840942382812, "b": 635.383056640625, "coord_origin": "TOPLEFT"}, "confidence": 0.9871657490730286, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "headers": [{"label": "page_footer", "id": 7, "page_no": 3, "cluster": {"id": 7, "label": "page_footer", "bbox": {"l": 64.800003, "t": 755.538002, "r": 257.24335, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9469243884086609, "cells": [{"id": 0, "text": "' Copyright IBM Corp. 2014. All rights reserved.", "bbox": {"l": 64.800003, "t": 755.538002, "r": 257.24335, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "' Copyright IBM Corp. 2014. All rights reserved."}, {"label": "page_footer", "id": 10, "page_no": 3, "cluster": {"id": 10, "label": "page_footer", "bbox": {"l": 538.85999, "t": 754.848721, "r": 547.25031, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.904093861579895, "cells": [{"id": 1, "text": "xi", "bbox": {"l": 538.85999, "t": 754.848721, "r": 547.25031, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "xi"}]}}, {"page_no": 4, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "' Copyright IBM Corp. 2014. All rights reserved.", "bbox": {"l": 64.800003, "t": 755.538002, "r": 257.24335, "b": 763.863001, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "1", "bbox": {"l": 541.67987, "t": 754.848721, "r": 547.21765, "b": 764.06172, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Chapter 1.", "bbox": {"l": 81.0, "t": 268.54272000000003, "r": 115.13253, "b": 274.98071000000004, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Securing and protecting IBM DB2 ", "bbox": {"l": 136.8, "t": 254.88635, "r": 547.30475, "b": 278.91785000000004, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "data", "bbox": {"l": 136.8, "t": 285.84671, "r": 190.29802, "b": 309.8782, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Recent news headlines are filled with reports of data breaches and cyber-attacks impacting ", "bbox": {"l": 136.8, "t": 348.70871, "r": 542.25665, "b": 357.92169, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "global businesses of all sizes. The Identity Theft Resource Center$^{1}$ reports that almost 5000 ", "bbox": {"l": 136.80096, "t": 360.70853, "r": 544.96643, "b": 369.92150999999996, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "data breaches have occurred since 2005, exposing over 600 million records of data. The ", "bbox": {"l": 136.79965, "t": 372.70853, "r": 529.53839, "b": 381.92150999999996, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "financial cost of these data breaches is skyrocketing. Studies from the Ponemon Institute$^{2}$ ", "bbox": {"l": 136.79965, "t": 384.7083400000001, "r": 535.32874, "b": 393.92133000000007, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "revealed that the average cost of a data breach increased in 2013 by 15% globally and ", "bbox": {"l": 136.80026, "t": 396.70853, "r": 521.64374, "b": 405.92150999999996, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "resulted in a brand equity loss of $9.4 million per attack. The average cost that is incurred for ", "bbox": {"l": 136.80026, "t": 408.7083400000001, "r": 547.13135, "b": 417.92133000000007, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "each lost record containing sensitive information increased more than 9% to $145 per record. ", "bbox": {"l": 136.80023, "t": 420.70816, "r": 547.25403, "b": 429.92114, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Businesses must make a serious effort to secure their data and recognize that securing ", "bbox": {"l": 136.80023, "t": 442.7277199999999, "r": 525.06482, "b": 451.9407, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "information assets is a cost of doing business. In many parts of the world and in many ", "bbox": {"l": 136.80025, "t": 454.72754000000003, "r": 518.26825, "b": 463.94052, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "industries, securing the data is required by law and subject to audits. Data security is no ", "bbox": {"l": 136.80025, "t": 466.72736, "r": 527.2063, "b": 475.94034, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "longer an option; it is a requirement.", "bbox": {"l": 136.80025, "t": 478.72717, "r": 296.31067, "b": 487.94016, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "This chapter describes how you can secure and protect data in DB2 for i. The following topics ", "bbox": {"l": 136.80025, "t": 500.68698, "r": 547.15515, "b": 509.89996, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "are covered in this chapter:", "bbox": {"l": 136.80025, "t": 512.6868, "r": 257.28036, "b": 521.89978, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "GLYPH<SM590000>", "bbox": {"l": 136.80025, "t": 529.87576, "r": 141.78024, "b": 538.6505099999999, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Security fundamentals", "bbox": {"l": 151.20041, "t": 529.72635, "r": 250.23166999999998, "b": 538.93936, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "GLYPH<SM590000>", "bbox": {"l": 136.80025, "t": 541.87556, "r": 141.78024, "b": 550.65031, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Current state of IBM i security", "bbox": {"l": 151.20041, "t": 541.72617, "r": 282.98114, "b": 550.93916, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "GLYPH<SM590000>", "bbox": {"l": 136.80025, "t": 553.87537, "r": 141.78024, "b": 562.65012, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "DB2 for i security controls", "bbox": {"l": 151.20041, "t": 553.72597, "r": 264.88187, "b": 562.93896, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "1", "bbox": {"l": 500.39999, "t": 93.16870000000006, "r": 522.61774, "b": 130.13171, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "$^{1 }$http://www.idtheftcenter.org", "bbox": {"l": 136.8, "t": 717.750061, "r": 258.36255, "b": 724.780441, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "$^{2 }$http://www.ponemon.org", "bbox": {"l": 136.8, "t": 727.709961, "r": 231.90257, "b": 734.740341, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "/", "bbox": {"l": 231.84036, "t": 727.590263, "r": 234.05881, "b": 734.97176, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 6, "label": "page_footer", "bbox": {"l": 64.800003, "t": 755.538002, "r": 257.24335, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9364771246910095, "cells": [{"id": 0, "text": "' Copyright IBM Corp. 2014. All rights reserved.", "bbox": {"l": 64.800003, "t": 755.538002, "r": 257.24335, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "page_footer", "bbox": {"l": 541.67987, "t": 754.848721, "r": 547.21765, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.8511815071105957, "cells": [{"id": 1, "text": "1", "bbox": {"l": 541.67987, "t": 754.848721, "r": 547.21765, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 81.0, "t": 268.54272000000003, "r": 115.13253, "b": 274.98071000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 2, "text": "Chapter 1.", "bbox": {"l": 81.0, "t": 268.54272000000003, "r": 115.13253, "b": 274.98071000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "section_header", "bbox": {"l": 136.8, "t": 254.88635, "r": 547.30475, "b": 309.8782, "coord_origin": "TOPLEFT"}, "confidence": 0.9371159076690674, "cells": [{"id": 3, "text": "Securing and protecting IBM DB2 ", "bbox": {"l": 136.8, "t": 254.88635, "r": 547.30475, "b": 278.91785000000004, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "data", "bbox": {"l": 136.8, "t": 285.84671, "r": 190.29802, "b": 309.8782, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 136.79965, "t": 348.70871, "r": 547.25403, "b": 429.92114, "coord_origin": "TOPLEFT"}, "confidence": 0.9868631362915039, "cells": [{"id": 5, "text": "Recent news headlines are filled with reports of data breaches and cyber-attacks impacting ", "bbox": {"l": 136.8, "t": 348.70871, "r": 542.25665, "b": 357.92169, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "global businesses of all sizes. The Identity Theft Resource Center$^{1}$ reports that almost 5000 ", "bbox": {"l": 136.80096, "t": 360.70853, "r": 544.96643, "b": 369.92150999999996, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "data breaches have occurred since 2005, exposing over 600 million records of data. The ", "bbox": {"l": 136.79965, "t": 372.70853, "r": 529.53839, "b": 381.92150999999996, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "financial cost of these data breaches is skyrocketing. Studies from the Ponemon Institute$^{2}$ ", "bbox": {"l": 136.79965, "t": 384.7083400000001, "r": 535.32874, "b": 393.92133000000007, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "revealed that the average cost of a data breach increased in 2013 by 15% globally and ", "bbox": {"l": 136.80026, "t": 396.70853, "r": 521.64374, "b": 405.92150999999996, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "resulted in a brand equity loss of $9.4 million per attack. The average cost that is incurred for ", "bbox": {"l": 136.80026, "t": 408.7083400000001, "r": 547.13135, "b": 417.92133000000007, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "each lost record containing sensitive information increased more than 9% to $145 per record. ", "bbox": {"l": 136.80023, "t": 420.70816, "r": 547.25403, "b": 429.92114, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 136.80023, "t": 442.7277199999999, "r": 527.2063, "b": 487.94016, "coord_origin": "TOPLEFT"}, "confidence": 0.9865838885307312, "cells": [{"id": 12, "text": "Businesses must make a serious effort to secure their data and recognize that securing ", "bbox": {"l": 136.80023, "t": 442.7277199999999, "r": 525.06482, "b": 451.9407, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "information assets is a cost of doing business. In many parts of the world and in many ", "bbox": {"l": 136.80025, "t": 454.72754000000003, "r": 518.26825, "b": 463.94052, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "industries, securing the data is required by law and subject to audits. Data security is no ", "bbox": {"l": 136.80025, "t": 466.72736, "r": 527.2063, "b": 475.94034, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "longer an option; it is a requirement.", "bbox": {"l": 136.80025, "t": 478.72717, "r": 296.31067, "b": 487.94016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 136.80025, "t": 500.68698, "r": 547.15515, "b": 521.89978, "coord_origin": "TOPLEFT"}, "confidence": 0.9734062552452087, "cells": [{"id": 16, "text": "This chapter describes how you can secure and protect data in DB2 for i. The following topics ", "bbox": {"l": 136.80025, "t": 500.68698, "r": 547.15515, "b": 509.89996, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "are covered in this chapter:", "bbox": {"l": 136.80025, "t": 512.6868, "r": 257.28036, "b": 521.89978, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "list_item", "bbox": {"l": 136.80025, "t": 529.72635, "r": 250.23166999999998, "b": 538.93936, "coord_origin": "TOPLEFT"}, "confidence": 0.9373421669006348, "cells": [{"id": 18, "text": "GLYPH<SM590000>", "bbox": {"l": 136.80025, "t": 529.87576, "r": 141.78024, "b": 538.6505099999999, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Security fundamentals", "bbox": {"l": 151.20041, "t": 529.72635, "r": 250.23166999999998, "b": 538.93936, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "list_item", "bbox": {"l": 136.80025, "t": 541.72617, "r": 282.98114, "b": 550.93916, "coord_origin": "TOPLEFT"}, "confidence": 0.9334256649017334, "cells": [{"id": 20, "text": "GLYPH<SM590000>", "bbox": {"l": 136.80025, "t": 541.87556, "r": 141.78024, "b": 550.65031, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Current state of IBM i security", "bbox": {"l": 151.20041, "t": 541.72617, "r": 282.98114, "b": 550.93916, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "list_item", "bbox": {"l": 136.80025, "t": 553.72597, "r": 264.88187, "b": 562.93896, "coord_origin": "TOPLEFT"}, "confidence": 0.9462205767631531, "cells": [{"id": 22, "text": "GLYPH<SM590000>", "bbox": {"l": 136.80025, "t": 553.87537, "r": 141.78024, "b": 562.65012, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "DB2 for i security controls", "bbox": {"l": 151.20041, "t": 553.72597, "r": 264.88187, "b": 562.93896, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 500.39999, "t": 93.16870000000006, "r": 522.61774, "b": 130.13171, "coord_origin": "TOPLEFT"}, "confidence": 0.7085074782371521, "cells": [{"id": 24, "text": "1", "bbox": {"l": 500.39999, "t": 93.16870000000006, "r": 522.61774, "b": 130.13171, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "footnote", "bbox": {"l": 136.8, "t": 717.750061, "r": 258.36255, "b": 724.780441, "coord_origin": "TOPLEFT"}, "confidence": 0.5138102173805237, "cells": [{"id": 25, "text": "$^{1 }$http://www.idtheftcenter.org", "bbox": {"l": 136.8, "t": 717.750061, "r": 258.36255, "b": 724.780441, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "footnote", "bbox": {"l": 136.8, "t": 727.590263, "r": 234.05881, "b": 734.97176, "coord_origin": "TOPLEFT"}, "confidence": 0.7965563535690308, "cells": [{"id": 26, "text": "$^{2 }$http://www.ponemon.org", "bbox": {"l": 136.8, "t": 727.709961, "r": 231.90257, "b": 734.740341, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "/", "bbox": {"l": 231.84036, "t": 727.590263, "r": 234.05881, "b": 734.97176, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "picture", "bbox": {"l": 32.075252532958984, "t": 70.57737731933594, "r": 239.620361328125, "b": 237.9579315185547, "coord_origin": "TOPLEFT"}, "confidence": 0.7509335279464722, "cells": [], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_footer", "id": 6, "page_no": 4, "cluster": {"id": 6, "label": "page_footer", "bbox": {"l": 64.800003, "t": 755.538002, "r": 257.24335, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9364771246910095, "cells": [{"id": 0, "text": "' Copyright IBM Corp. 2014. All rights reserved.", "bbox": {"l": 64.800003, "t": 755.538002, "r": 257.24335, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "' Copyright IBM Corp. 2014. All rights reserved."}, {"label": "page_footer", "id": 8, "page_no": 4, "cluster": {"id": 8, "label": "page_footer", "bbox": {"l": 541.67987, "t": 754.848721, "r": 547.21765, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.8511815071105957, "cells": [{"id": 1, "text": "1", "bbox": {"l": 541.67987, "t": 754.848721, "r": 547.21765, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1"}, {"label": "text", "id": 14, "page_no": 4, "cluster": {"id": 14, "label": "text", "bbox": {"l": 81.0, "t": 268.54272000000003, "r": 115.13253, "b": 274.98071000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 2, "text": "Chapter 1.", "bbox": {"l": 81.0, "t": 268.54272000000003, "r": 115.13253, "b": 274.98071000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Chapter 1."}, {"label": "section_header", "id": 5, "page_no": 4, "cluster": {"id": 5, "label": "section_header", "bbox": {"l": 136.8, "t": 254.88635, "r": 547.30475, "b": 309.8782, "coord_origin": "TOPLEFT"}, "confidence": 0.9371159076690674, "cells": [{"id": 3, "text": "Securing and protecting IBM DB2 ", "bbox": {"l": 136.8, "t": 254.88635, "r": 547.30475, "b": 278.91785000000004, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "data", "bbox": {"l": 136.8, "t": 285.84671, "r": 190.29802, "b": 309.8782, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Securing and protecting IBM DB2 data"}, {"label": "text", "id": 0, "page_no": 4, "cluster": {"id": 0, "label": "text", "bbox": {"l": 136.79965, "t": 348.70871, "r": 547.25403, "b": 429.92114, "coord_origin": "TOPLEFT"}, "confidence": 0.9868631362915039, "cells": [{"id": 5, "text": "Recent news headlines are filled with reports of data breaches and cyber-attacks impacting ", "bbox": {"l": 136.8, "t": 348.70871, "r": 542.25665, "b": 357.92169, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "global businesses of all sizes. The Identity Theft Resource Center$^{1}$ reports that almost 5000 ", "bbox": {"l": 136.80096, "t": 360.70853, "r": 544.96643, "b": 369.92150999999996, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "data breaches have occurred since 2005, exposing over 600 million records of data. The ", "bbox": {"l": 136.79965, "t": 372.70853, "r": 529.53839, "b": 381.92150999999996, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "financial cost of these data breaches is skyrocketing. Studies from the Ponemon Institute$^{2}$ ", "bbox": {"l": 136.79965, "t": 384.7083400000001, "r": 535.32874, "b": 393.92133000000007, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "revealed that the average cost of a data breach increased in 2013 by 15% globally and ", "bbox": {"l": 136.80026, "t": 396.70853, "r": 521.64374, "b": 405.92150999999996, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "resulted in a brand equity loss of $9.4 million per attack. The average cost that is incurred for ", "bbox": {"l": 136.80026, "t": 408.7083400000001, "r": 547.13135, "b": 417.92133000000007, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "each lost record containing sensitive information increased more than 9% to $145 per record. ", "bbox": {"l": 136.80023, "t": 420.70816, "r": 547.25403, "b": 429.92114, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Recent news headlines are filled with reports of data breaches and cyber-attacks impacting global businesses of all sizes. The Identity Theft Resource Center$^{1}$ reports that almost 5000 data breaches have occurred since 2005, exposing over 600 million records of data. The financial cost of these data breaches is skyrocketing. Studies from the Ponemon Institute$^{2}$ revealed that the average cost of a data breach increased in 2013 by 15% globally and resulted in a brand equity loss of $9.4 million per attack. The average cost that is incurred for each lost record containing sensitive information increased more than 9% to $145 per record."}, {"label": "text", "id": 1, "page_no": 4, "cluster": {"id": 1, "label": "text", "bbox": {"l": 136.80023, "t": 442.7277199999999, "r": 527.2063, "b": 487.94016, "coord_origin": "TOPLEFT"}, "confidence": 0.9865838885307312, "cells": [{"id": 12, "text": "Businesses must make a serious effort to secure their data and recognize that securing ", "bbox": {"l": 136.80023, "t": 442.7277199999999, "r": 525.06482, "b": 451.9407, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "information assets is a cost of doing business. In many parts of the world and in many ", "bbox": {"l": 136.80025, "t": 454.72754000000003, "r": 518.26825, "b": 463.94052, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "industries, securing the data is required by law and subject to audits. Data security is no ", "bbox": {"l": 136.80025, "t": 466.72736, "r": 527.2063, "b": 475.94034, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "longer an option; it is a requirement.", "bbox": {"l": 136.80025, "t": 478.72717, "r": 296.31067, "b": 487.94016, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Businesses must make a serious effort to secure their data and recognize that securing information assets is a cost of doing business. In many parts of the world and in many industries, securing the data is required by law and subject to audits. Data security is no longer an option; it is a requirement."}, {"label": "text", "id": 2, "page_no": 4, "cluster": {"id": 2, "label": "text", "bbox": {"l": 136.80025, "t": 500.68698, "r": 547.15515, "b": 521.89978, "coord_origin": "TOPLEFT"}, "confidence": 0.9734062552452087, "cells": [{"id": 16, "text": "This chapter describes how you can secure and protect data in DB2 for i. The following topics ", "bbox": {"l": 136.80025, "t": 500.68698, "r": 547.15515, "b": 509.89996, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "are covered in this chapter:", "bbox": {"l": 136.80025, "t": 512.6868, "r": 257.28036, "b": 521.89978, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "This chapter describes how you can secure and protect data in DB2 for i. The following topics are covered in this chapter:"}, {"label": "list_item", "id": 4, "page_no": 4, "cluster": {"id": 4, "label": "list_item", "bbox": {"l": 136.80025, "t": 529.72635, "r": 250.23166999999998, "b": 538.93936, "coord_origin": "TOPLEFT"}, "confidence": 0.9373421669006348, "cells": [{"id": 18, "text": "GLYPH<SM590000>", "bbox": {"l": 136.80025, "t": 529.87576, "r": 141.78024, "b": 538.6505099999999, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Security fundamentals", "bbox": {"l": 151.20041, "t": 529.72635, "r": 250.23166999999998, "b": 538.93936, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<SM590000> Security fundamentals"}, {"label": "list_item", "id": 7, "page_no": 4, "cluster": {"id": 7, "label": "list_item", "bbox": {"l": 136.80025, "t": 541.72617, "r": 282.98114, "b": 550.93916, "coord_origin": "TOPLEFT"}, "confidence": 0.9334256649017334, "cells": [{"id": 20, "text": "GLYPH<SM590000>", "bbox": {"l": 136.80025, "t": 541.87556, "r": 141.78024, "b": 550.65031, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Current state of IBM i security", "bbox": {"l": 151.20041, "t": 541.72617, "r": 282.98114, "b": 550.93916, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<SM590000> Current state of IBM i security"}, {"label": "list_item", "id": 3, "page_no": 4, "cluster": {"id": 3, "label": "list_item", "bbox": {"l": 136.80025, "t": 553.72597, "r": 264.88187, "b": 562.93896, "coord_origin": "TOPLEFT"}, "confidence": 0.9462205767631531, "cells": [{"id": 22, "text": "GLYPH<SM590000>", "bbox": {"l": 136.80025, "t": 553.87537, "r": 141.78024, "b": 562.65012, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "DB2 for i security controls", "bbox": {"l": 151.20041, "t": 553.72597, "r": 264.88187, "b": 562.93896, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<SM590000> DB2 for i security controls"}, {"label": "text", "id": 12, "page_no": 4, "cluster": {"id": 12, "label": "text", "bbox": {"l": 500.39999, "t": 93.16870000000006, "r": 522.61774, "b": 130.13171, "coord_origin": "TOPLEFT"}, "confidence": 0.7085074782371521, "cells": [{"id": 24, "text": "1", "bbox": {"l": 500.39999, "t": 93.16870000000006, "r": 522.61774, "b": 130.13171, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1"}, {"label": "footnote", "id": 13, "page_no": 4, "cluster": {"id": 13, "label": "footnote", "bbox": {"l": 136.8, "t": 717.750061, "r": 258.36255, "b": 724.780441, "coord_origin": "TOPLEFT"}, "confidence": 0.5138102173805237, "cells": [{"id": 25, "text": "$^{1 }$http://www.idtheftcenter.org", "bbox": {"l": 136.8, "t": 717.750061, "r": 258.36255, "b": 724.780441, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "$^{1 }$http://www.idtheftcenter.org"}, {"label": "footnote", "id": 9, "page_no": 4, "cluster": {"id": 9, "label": "footnote", "bbox": {"l": 136.8, "t": 727.590263, "r": 234.05881, "b": 734.97176, "coord_origin": "TOPLEFT"}, "confidence": 0.7965563535690308, "cells": [{"id": 26, "text": "$^{2 }$http://www.ponemon.org", "bbox": {"l": 136.8, "t": 727.709961, "r": 231.90257, "b": 734.740341, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "/", "bbox": {"l": 231.84036, "t": 727.590263, "r": 234.05881, "b": 734.97176, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "$^{2 }$http://www.ponemon.org /"}, {"label": "picture", "id": 11, "page_no": 4, "cluster": {"id": 11, "label": "picture", "bbox": {"l": 32.075252532958984, "t": 70.57737731933594, "r": 239.620361328125, "b": 237.9579315185547, "coord_origin": "TOPLEFT"}, "confidence": 0.7509335279464722, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "body": [{"label": "text", "id": 14, "page_no": 4, "cluster": {"id": 14, "label": "text", "bbox": {"l": 81.0, "t": 268.54272000000003, "r": 115.13253, "b": 274.98071000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 2, "text": "Chapter 1.", "bbox": {"l": 81.0, "t": 268.54272000000003, "r": 115.13253, "b": 274.98071000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Chapter 1."}, {"label": "section_header", "id": 5, "page_no": 4, "cluster": {"id": 5, "label": "section_header", "bbox": {"l": 136.8, "t": 254.88635, "r": 547.30475, "b": 309.8782, "coord_origin": "TOPLEFT"}, "confidence": 0.9371159076690674, "cells": [{"id": 3, "text": "Securing and protecting IBM DB2 ", "bbox": {"l": 136.8, "t": 254.88635, "r": 547.30475, "b": 278.91785000000004, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "data", "bbox": {"l": 136.8, "t": 285.84671, "r": 190.29802, "b": 309.8782, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Securing and protecting IBM DB2 data"}, {"label": "text", "id": 0, "page_no": 4, "cluster": {"id": 0, "label": "text", "bbox": {"l": 136.79965, "t": 348.70871, "r": 547.25403, "b": 429.92114, "coord_origin": "TOPLEFT"}, "confidence": 0.9868631362915039, "cells": [{"id": 5, "text": "Recent news headlines are filled with reports of data breaches and cyber-attacks impacting ", "bbox": {"l": 136.8, "t": 348.70871, "r": 542.25665, "b": 357.92169, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "global businesses of all sizes. The Identity Theft Resource Center$^{1}$ reports that almost 5000 ", "bbox": {"l": 136.80096, "t": 360.70853, "r": 544.96643, "b": 369.92150999999996, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "data breaches have occurred since 2005, exposing over 600 million records of data. The ", "bbox": {"l": 136.79965, "t": 372.70853, "r": 529.53839, "b": 381.92150999999996, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "financial cost of these data breaches is skyrocketing. Studies from the Ponemon Institute$^{2}$ ", "bbox": {"l": 136.79965, "t": 384.7083400000001, "r": 535.32874, "b": 393.92133000000007, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "revealed that the average cost of a data breach increased in 2013 by 15% globally and ", "bbox": {"l": 136.80026, "t": 396.70853, "r": 521.64374, "b": 405.92150999999996, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "resulted in a brand equity loss of $9.4 million per attack. The average cost that is incurred for ", "bbox": {"l": 136.80026, "t": 408.7083400000001, "r": 547.13135, "b": 417.92133000000007, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "each lost record containing sensitive information increased more than 9% to $145 per record. ", "bbox": {"l": 136.80023, "t": 420.70816, "r": 547.25403, "b": 429.92114, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Recent news headlines are filled with reports of data breaches and cyber-attacks impacting global businesses of all sizes. The Identity Theft Resource Center$^{1}$ reports that almost 5000 data breaches have occurred since 2005, exposing over 600 million records of data. The financial cost of these data breaches is skyrocketing. Studies from the Ponemon Institute$^{2}$ revealed that the average cost of a data breach increased in 2013 by 15% globally and resulted in a brand equity loss of $9.4 million per attack. The average cost that is incurred for each lost record containing sensitive information increased more than 9% to $145 per record."}, {"label": "text", "id": 1, "page_no": 4, "cluster": {"id": 1, "label": "text", "bbox": {"l": 136.80023, "t": 442.7277199999999, "r": 527.2063, "b": 487.94016, "coord_origin": "TOPLEFT"}, "confidence": 0.9865838885307312, "cells": [{"id": 12, "text": "Businesses must make a serious effort to secure their data and recognize that securing ", "bbox": {"l": 136.80023, "t": 442.7277199999999, "r": 525.06482, "b": 451.9407, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "information assets is a cost of doing business. In many parts of the world and in many ", "bbox": {"l": 136.80025, "t": 454.72754000000003, "r": 518.26825, "b": 463.94052, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "industries, securing the data is required by law and subject to audits. Data security is no ", "bbox": {"l": 136.80025, "t": 466.72736, "r": 527.2063, "b": 475.94034, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "longer an option; it is a requirement.", "bbox": {"l": 136.80025, "t": 478.72717, "r": 296.31067, "b": 487.94016, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Businesses must make a serious effort to secure their data and recognize that securing information assets is a cost of doing business. In many parts of the world and in many industries, securing the data is required by law and subject to audits. Data security is no longer an option; it is a requirement."}, {"label": "text", "id": 2, "page_no": 4, "cluster": {"id": 2, "label": "text", "bbox": {"l": 136.80025, "t": 500.68698, "r": 547.15515, "b": 521.89978, "coord_origin": "TOPLEFT"}, "confidence": 0.9734062552452087, "cells": [{"id": 16, "text": "This chapter describes how you can secure and protect data in DB2 for i. The following topics ", "bbox": {"l": 136.80025, "t": 500.68698, "r": 547.15515, "b": 509.89996, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "are covered in this chapter:", "bbox": {"l": 136.80025, "t": 512.6868, "r": 257.28036, "b": 521.89978, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "This chapter describes how you can secure and protect data in DB2 for i. The following topics are covered in this chapter:"}, {"label": "list_item", "id": 4, "page_no": 4, "cluster": {"id": 4, "label": "list_item", "bbox": {"l": 136.80025, "t": 529.72635, "r": 250.23166999999998, "b": 538.93936, "coord_origin": "TOPLEFT"}, "confidence": 0.9373421669006348, "cells": [{"id": 18, "text": "GLYPH<SM590000>", "bbox": {"l": 136.80025, "t": 529.87576, "r": 141.78024, "b": 538.6505099999999, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Security fundamentals", "bbox": {"l": 151.20041, "t": 529.72635, "r": 250.23166999999998, "b": 538.93936, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<SM590000> Security fundamentals"}, {"label": "list_item", "id": 7, "page_no": 4, "cluster": {"id": 7, "label": "list_item", "bbox": {"l": 136.80025, "t": 541.72617, "r": 282.98114, "b": 550.93916, "coord_origin": "TOPLEFT"}, "confidence": 0.9334256649017334, "cells": [{"id": 20, "text": "GLYPH<SM590000>", "bbox": {"l": 136.80025, "t": 541.87556, "r": 141.78024, "b": 550.65031, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Current state of IBM i security", "bbox": {"l": 151.20041, "t": 541.72617, "r": 282.98114, "b": 550.93916, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<SM590000> Current state of IBM i security"}, {"label": "list_item", "id": 3, "page_no": 4, "cluster": {"id": 3, "label": "list_item", "bbox": {"l": 136.80025, "t": 553.72597, "r": 264.88187, "b": 562.93896, "coord_origin": "TOPLEFT"}, "confidence": 0.9462205767631531, "cells": [{"id": 22, "text": "GLYPH<SM590000>", "bbox": {"l": 136.80025, "t": 553.87537, "r": 141.78024, "b": 562.65012, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "DB2 for i security controls", "bbox": {"l": 151.20041, "t": 553.72597, "r": 264.88187, "b": 562.93896, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<SM590000> DB2 for i security controls"}, {"label": "text", "id": 12, "page_no": 4, "cluster": {"id": 12, "label": "text", "bbox": {"l": 500.39999, "t": 93.16870000000006, "r": 522.61774, "b": 130.13171, "coord_origin": "TOPLEFT"}, "confidence": 0.7085074782371521, "cells": [{"id": 24, "text": "1", "bbox": {"l": 500.39999, "t": 93.16870000000006, "r": 522.61774, "b": 130.13171, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1"}, {"label": "footnote", "id": 13, "page_no": 4, "cluster": {"id": 13, "label": "footnote", "bbox": {"l": 136.8, "t": 717.750061, "r": 258.36255, "b": 724.780441, "coord_origin": "TOPLEFT"}, "confidence": 0.5138102173805237, "cells": [{"id": 25, "text": "$^{1 }$http://www.idtheftcenter.org", "bbox": {"l": 136.8, "t": 717.750061, "r": 258.36255, "b": 724.780441, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "$^{1 }$http://www.idtheftcenter.org"}, {"label": "footnote", "id": 9, "page_no": 4, "cluster": {"id": 9, "label": "footnote", "bbox": {"l": 136.8, "t": 727.590263, "r": 234.05881, "b": 734.97176, "coord_origin": "TOPLEFT"}, "confidence": 0.7965563535690308, "cells": [{"id": 26, "text": "$^{2 }$http://www.ponemon.org", "bbox": {"l": 136.8, "t": 727.709961, "r": 231.90257, "b": 734.740341, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "/", "bbox": {"l": 231.84036, "t": 727.590263, "r": 234.05881, "b": 734.97176, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "$^{2 }$http://www.ponemon.org /"}, {"label": "picture", "id": 11, "page_no": 4, "cluster": {"id": 11, "label": "picture", "bbox": {"l": 32.075252532958984, "t": 70.57737731933594, "r": 239.620361328125, "b": 237.9579315185547, "coord_origin": "TOPLEFT"}, "confidence": 0.7509335279464722, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "headers": [{"label": "page_footer", "id": 6, "page_no": 4, "cluster": {"id": 6, "label": "page_footer", "bbox": {"l": 64.800003, "t": 755.538002, "r": 257.24335, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9364771246910095, "cells": [{"id": 0, "text": "' Copyright IBM Corp. 2014. All rights reserved.", "bbox": {"l": 64.800003, "t": 755.538002, "r": 257.24335, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "' Copyright IBM Corp. 2014. All rights reserved."}, {"label": "page_footer", "id": 8, "page_no": 4, "cluster": {"id": 8, "label": "page_footer", "bbox": {"l": 541.67987, "t": 754.848721, "r": 547.21765, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.8511815071105957, "cells": [{"id": 1, "text": "1", "bbox": {"l": 541.67987, "t": 754.848721, "r": 547.21765, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1"}]}}, {"page_no": 5, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "2 ", "bbox": {"l": 64.800003, "t": 754.848721, "r": 72.821999, "b": 764.06172, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Row and Column Access Control Support in IBM DB2 for i", "bbox": {"l": 87.840302, "t": 755.538002, "r": 328.72537, "b": 763.863001, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "1.1", "bbox": {"l": 64.800003, "t": 74.34069999999997, "r": 87.524292, "b": 89.1037, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Security fundamentals", "bbox": {"l": 92.069145, "t": 74.34069999999997, "r": 267.40582, "b": 89.1037, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Before reviewing database security techniques, there are two fundamental steps in securing ", "bbox": {"l": 136.8, "t": 106.6087, "r": 545.00482, "b": 115.82172000000003, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "information assets that must be described:", "bbox": {"l": 136.8, "t": 118.60852, "r": 324.47229, "b": 127.82153000000005, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "GLYPH<SM590000>", "bbox": {"l": 136.8, "t": 135.79749000000004, "r": 141.78, "b": 144.57227, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "First, and most important, is the definition of a company\u2019s ", "bbox": {"l": 151.20016, "t": 135.64806999999996, "r": 406.67715, "b": 144.86108000000002, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "security policy", "bbox": {"l": 406.67999, "t": 135.12487999999996, "r": 471.03815, "b": 145.18262000000004, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": ". Without a ", "bbox": {"l": 470.04001000000005, "t": 135.64862000000005, "r": 520.59796, "b": 144.86163, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "security policy, there is no definition of what are acceptable practices for using, accessing, ", "bbox": {"l": 151.19949, "t": 147.64844000000005, "r": 547.16425, "b": 156.86145, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "and storing information by who, what, when, where, and how. A security policy should ", "bbox": {"l": 151.19948, "t": 159.64824999999996, "r": 531.02008, "b": 168.86127, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "minimally address three things: confidentiality, integrity, and availability.", "bbox": {"l": 151.19948, "t": 171.64806999999996, "r": 463.3578499999999, "b": 180.86108000000002, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "The monitoring and assessment of adherence to the security policy determines whether ", "bbox": {"l": 151.19948, "t": 188.62787000000003, "r": 541.70514, "b": 197.84087999999997, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "your security strategy is working. Often, IBM security consultants are asked to perform ", "bbox": {"l": 151.19948, "t": 200.62769000000003, "r": 534.83002, "b": 209.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "security assessments for companies without regard to the security policy. Although these ", "bbox": {"l": 151.19948, "t": 212.62750000000005, "r": 545.79773, "b": 221.84051999999997, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "assessments can be useful for observing how the system is defined and how data is being ", "bbox": {"l": 151.19948, "t": 224.62732000000005, "r": 547.26086, "b": 233.84033, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "accessed, they cannot determine the level of security without a security policy. Without a ", "bbox": {"l": 151.19948, "t": 236.62714000000005, "r": 543.91528, "b": 245.84015, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "security policy, it really is not an assessment as much as it is a baseline for monitoring the ", "bbox": {"l": 151.19948, "t": 248.62694999999997, "r": 547.25989, "b": 257.83997, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "changes in the security settings that are captured.", "bbox": {"l": 151.19946, "t": 260.62676999999996, "r": 371.8692, "b": 269.83978, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "A security policy is what defines whether the system and its settings are secure (or not). ", "bbox": {"l": 151.19946, "t": 277.60657000000003, "r": 541.992, "b": 286.81958, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "GLYPH<SM590000>", "bbox": {"l": 136.7993, "t": 294.7955600000001, "r": 141.7793, "b": 303.57034, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "The second fundamental in securing data assets is the use of ", "bbox": {"l": 151.19946, "t": 294.64618, "r": 425.86029, "b": 303.85916, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "resource security", "bbox": {"l": 425.82001, "t": 294.12496999999996, "r": 501.60065, "b": 304.18265, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": ". If ", "bbox": {"l": 500.64001, "t": 294.64871, "r": 514.49933, "b": 303.86169, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "implemented properly, resource security prevents data breaches from both internal and ", "bbox": {"l": 151.20038, "t": 306.64853, "r": 537.87421, "b": 315.86151, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "external intrusions. Resource security controls are closely tied to the part of the security ", "bbox": {"l": 151.20038, "t": 318.64834999999994, "r": 541.33636, "b": 327.86133, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "policy that defines who should have access to what information resources. A hacker might ", "bbox": {"l": 151.20038, "t": 330.64816, "r": 547.15826, "b": 339.86115, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "be good enough to get through your company firewalls and sift his way through to your ", "bbox": {"l": 151.20038, "t": 342.64798, "r": 534.86066, "b": 351.86096, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "system, but if they do not have explicit access to your database, the hacker cannot ", "bbox": {"l": 151.20038, "t": 354.6478, "r": 517.00739, "b": 363.86078, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "compromise your information assets.", "bbox": {"l": 151.20038, "t": 366.64761, "r": 314.03534, "b": 375.8606, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "With your eyes now open to the importance of securing information assets, the rest of this ", "bbox": {"l": 136.80022, "t": 388.60742, "r": 535.36169, "b": 397.82040000000006, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "chapter reviews the methods that are available for securing database resources on IBM i. ", "bbox": {"l": 136.80022, "t": 400.60724, "r": 532.755, "b": 409.82022, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "1.2", "bbox": {"l": 64.800003, "t": 438.30072, "r": 87.415726, "b": 453.06372, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Current state of IBM i security", "bbox": {"l": 91.93885, "t": 438.30072, "r": 323.38391, "b": 453.06372, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "Because of the inherently secure nature of IBM i, many clients rely on the default system ", "bbox": {"l": 136.8, "t": 470.62872, "r": 530.30463, "b": 479.84171, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "settings to protect their business data that is stored in DB2 for i. In most cases, this means no ", "bbox": {"l": 136.8, "t": 482.62854, "r": 547.31824, "b": 491.84152, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "data protection because the default setting for the Create default public authority (QCRTAUT) ", "bbox": {"l": 136.8, "t": 494.62836, "r": 547.19586, "b": 503.84134, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "system value is *CHANGE.", "bbox": {"l": 136.8, "t": 506.62817, "r": 257.04709, "b": 515.84116, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "Even more disturbing is that many IBM i clients remain in this state, despite the news ", "bbox": {"l": 136.8, "t": 528.64774, "r": 513.90448, "b": 537.86073, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "headlines and the significant costs that are involved with databases being compromised. This ", "bbox": {"l": 136.8, "t": 540.6475399999999, "r": 547.28442, "b": 549.86053, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "default security configuration makes it quite challenging to implement basic security policies. ", "bbox": {"l": 136.8, "t": 552.64734, "r": 546.27533, "b": 561.86034, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "A tighter implementation is required if you really want to protect one of your company\u2019s most ", "bbox": {"l": 136.8, "t": 564.64714, "r": 545.08014, "b": 573.86014, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "valuable assets, which is the data.", "bbox": {"l": 136.8, "t": 576.64694, "r": 287.80057, "b": 585.85994, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "Traditionally, IBM i applications have employed menu-based security to counteract this default ", "bbox": {"l": 136.8, "t": 598.6665, "r": 547.28326, "b": 607.8795, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "configuration that gives all users access to the data. The theory is that data is protected by ", "bbox": {"l": 136.8, "t": 610.6663100000001, "r": 538.6767, "b": 619.8793000000001, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "the menu options controlling what database operations that the user can perform. This ", "bbox": {"l": 136.8, "t": 622.66611, "r": 520.35364, "b": 631.8791, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "approach is ineffective, even if the user profile is restricted from running interactive ", "bbox": {"l": 136.80002, "t": 634.6659099999999, "r": 502.77115000000003, "b": 643.87891, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "commands. The reason is that in today\u2019s connected world there are a multitude of interfaces ", "bbox": {"l": 136.80002, "t": 646.66571, "r": 545.16492, "b": 655.87871, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "into the system, from web browsers to PC clients, that bypass application menus. If there are ", "bbox": {"l": 136.80002, "t": 658.66551, "r": 547.23376, "b": 667.87852, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "no object-level controls, users of these newer interfaces have an open door to your data.", "bbox": {"l": 136.80002, "t": 670.66532, "r": 526.04187, "b": 679.87833, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 10, "label": "page_footer", "bbox": {"l": 64.800003, "t": 754.848721, "r": 72.821999, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.8889444470405579, "cells": [{"id": 0, "text": "2 ", "bbox": {"l": 64.800003, "t": 754.848721, "r": 72.821999, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "page_footer", "bbox": {"l": 87.840302, "t": 755.538002, "r": 328.72537, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9476422667503357, "cells": [{"id": 1, "text": "Row and Column Access Control Support in IBM DB2 for i", "bbox": {"l": 87.840302, "t": 755.538002, "r": 328.72537, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "section_header", "bbox": {"l": 64.800003, "t": 74.34069999999997, "r": 267.40582, "b": 89.1037, "coord_origin": "TOPLEFT"}, "confidence": 0.9651358723640442, "cells": [{"id": 2, "text": "1.1", "bbox": {"l": 64.800003, "t": 74.34069999999997, "r": 87.524292, "b": 89.1037, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Security fundamentals", "bbox": {"l": 92.069145, "t": 74.34069999999997, "r": 267.40582, "b": 89.1037, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "text", "bbox": {"l": 136.8, "t": 106.6087, "r": 545.00482, "b": 127.82153000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9663435220718384, "cells": [{"id": 4, "text": "Before reviewing database security techniques, there are two fundamental steps in securing ", "bbox": {"l": 136.8, "t": 106.6087, "r": 545.00482, "b": 115.82172000000003, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "information assets that must be described:", "bbox": {"l": 136.8, "t": 118.60852, "r": 324.47229, "b": 127.82153000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "list_item", "bbox": {"l": 136.8, "t": 135.12487999999996, "r": 547.16425, "b": 180.86108000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9835494756698608, "cells": [{"id": 6, "text": "GLYPH<SM590000>", "bbox": {"l": 136.8, "t": 135.79749000000004, "r": 141.78, "b": 144.57227, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "First, and most important, is the definition of a company\u2019s ", "bbox": {"l": 151.20016, "t": 135.64806999999996, "r": 406.67715, "b": 144.86108000000002, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "security policy", "bbox": {"l": 406.67999, "t": 135.12487999999996, "r": 471.03815, "b": 145.18262000000004, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": ". Without a ", "bbox": {"l": 470.04001000000005, "t": 135.64862000000005, "r": 520.59796, "b": 144.86163, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "security policy, there is no definition of what are acceptable practices for using, accessing, ", "bbox": {"l": 151.19949, "t": 147.64844000000005, "r": 547.16425, "b": 156.86145, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "and storing information by who, what, when, where, and how. A security policy should ", "bbox": {"l": 151.19948, "t": 159.64824999999996, "r": 531.02008, "b": 168.86127, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "minimally address three things: confidentiality, integrity, and availability.", "bbox": {"l": 151.19948, "t": 171.64806999999996, "r": 463.3578499999999, "b": 180.86108000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "list_item", "bbox": {"l": 151.19946, "t": 188.62787000000003, "r": 547.26086, "b": 269.83978, "coord_origin": "TOPLEFT"}, "confidence": 0.8077318072319031, "cells": [{"id": 13, "text": "The monitoring and assessment of adherence to the security policy determines whether ", "bbox": {"l": 151.19948, "t": 188.62787000000003, "r": 541.70514, "b": 197.84087999999997, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "your security strategy is working. Often, IBM security consultants are asked to perform ", "bbox": {"l": 151.19948, "t": 200.62769000000003, "r": 534.83002, "b": 209.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "security assessments for companies without regard to the security policy. Although these ", "bbox": {"l": 151.19948, "t": 212.62750000000005, "r": 545.79773, "b": 221.84051999999997, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "assessments can be useful for observing how the system is defined and how data is being ", "bbox": {"l": 151.19948, "t": 224.62732000000005, "r": 547.26086, "b": 233.84033, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "accessed, they cannot determine the level of security without a security policy. Without a ", "bbox": {"l": 151.19948, "t": 236.62714000000005, "r": 543.91528, "b": 245.84015, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "security policy, it really is not an assessment as much as it is a baseline for monitoring the ", "bbox": {"l": 151.19948, "t": 248.62694999999997, "r": 547.25989, "b": 257.83997, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "changes in the security settings that are captured.", "bbox": {"l": 151.19946, "t": 260.62676999999996, "r": 371.8692, "b": 269.83978, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 151.19946, "t": 277.60657000000003, "r": 541.992, "b": 286.81958, "coord_origin": "TOPLEFT"}, "confidence": 0.7967224717140198, "cells": [{"id": 20, "text": "A security policy is what defines whether the system and its settings are secure (or not). ", "bbox": {"l": 151.19946, "t": 277.60657000000003, "r": 541.992, "b": 286.81958, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "list_item", "bbox": {"l": 136.7993, "t": 294.12496999999996, "r": 547.15826, "b": 375.8606, "coord_origin": "TOPLEFT"}, "confidence": 0.9837487936019897, "cells": [{"id": 21, "text": "GLYPH<SM590000>", "bbox": {"l": 136.7993, "t": 294.7955600000001, "r": 141.7793, "b": 303.57034, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "The second fundamental in securing data assets is the use of ", "bbox": {"l": 151.19946, "t": 294.64618, "r": 425.86029, "b": 303.85916, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "resource security", "bbox": {"l": 425.82001, "t": 294.12496999999996, "r": 501.60065, "b": 304.18265, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": ". If ", "bbox": {"l": 500.64001, "t": 294.64871, "r": 514.49933, "b": 303.86169, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "implemented properly, resource security prevents data breaches from both internal and ", "bbox": {"l": 151.20038, "t": 306.64853, "r": 537.87421, "b": 315.86151, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "external intrusions. Resource security controls are closely tied to the part of the security ", "bbox": {"l": 151.20038, "t": 318.64834999999994, "r": 541.33636, "b": 327.86133, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "policy that defines who should have access to what information resources. A hacker might ", "bbox": {"l": 151.20038, "t": 330.64816, "r": 547.15826, "b": 339.86115, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "be good enough to get through your company firewalls and sift his way through to your ", "bbox": {"l": 151.20038, "t": 342.64798, "r": 534.86066, "b": 351.86096, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "system, but if they do not have explicit access to your database, the hacker cannot ", "bbox": {"l": 151.20038, "t": 354.6478, "r": 517.00739, "b": 363.86078, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "compromise your information assets.", "bbox": {"l": 151.20038, "t": 366.64761, "r": 314.03534, "b": 375.8606, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "text", "bbox": {"l": 136.80022, "t": 388.60742, "r": 535.36169, "b": 409.82022, "coord_origin": "TOPLEFT"}, "confidence": 0.9621998071670532, "cells": [{"id": 31, "text": "With your eyes now open to the importance of securing information assets, the rest of this ", "bbox": {"l": 136.80022, "t": 388.60742, "r": 535.36169, "b": 397.82040000000006, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "chapter reviews the methods that are available for securing database resources on IBM i. ", "bbox": {"l": 136.80022, "t": 400.60724, "r": 532.755, "b": 409.82022, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "section_header", "bbox": {"l": 64.800003, "t": 438.30072, "r": 323.38391, "b": 453.06372, "coord_origin": "TOPLEFT"}, "confidence": 0.9650285243988037, "cells": [{"id": 33, "text": "1.2", "bbox": {"l": 64.800003, "t": 438.30072, "r": 87.415726, "b": 453.06372, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Current state of IBM i security", "bbox": {"l": 91.93885, "t": 438.30072, "r": 323.38391, "b": 453.06372, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 136.8, "t": 470.62872, "r": 547.31824, "b": 515.84116, "coord_origin": "TOPLEFT"}, "confidence": 0.9848750233650208, "cells": [{"id": 35, "text": "Because of the inherently secure nature of IBM i, many clients rely on the default system ", "bbox": {"l": 136.8, "t": 470.62872, "r": 530.30463, "b": 479.84171, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "settings to protect their business data that is stored in DB2 for i. In most cases, this means no ", "bbox": {"l": 136.8, "t": 482.62854, "r": 547.31824, "b": 491.84152, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "data protection because the default setting for the Create default public authority (QCRTAUT) ", "bbox": {"l": 136.8, "t": 494.62836, "r": 547.19586, "b": 503.84134, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "system value is *CHANGE.", "bbox": {"l": 136.8, "t": 506.62817, "r": 257.04709, "b": 515.84116, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 136.8, "t": 528.64774, "r": 547.28442, "b": 585.85994, "coord_origin": "TOPLEFT"}, "confidence": 0.9848474860191345, "cells": [{"id": 39, "text": "Even more disturbing is that many IBM i clients remain in this state, despite the news ", "bbox": {"l": 136.8, "t": 528.64774, "r": 513.90448, "b": 537.86073, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "headlines and the significant costs that are involved with databases being compromised. This ", "bbox": {"l": 136.8, "t": 540.6475399999999, "r": 547.28442, "b": 549.86053, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "default security configuration makes it quite challenging to implement basic security policies. ", "bbox": {"l": 136.8, "t": 552.64734, "r": 546.27533, "b": 561.86034, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "A tighter implementation is required if you really want to protect one of your company\u2019s most ", "bbox": {"l": 136.8, "t": 564.64714, "r": 545.08014, "b": 573.86014, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "valuable assets, which is the data.", "bbox": {"l": 136.8, "t": 576.64694, "r": 287.80057, "b": 585.85994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 136.8, "t": 598.6665, "r": 547.28326, "b": 679.87833, "coord_origin": "TOPLEFT"}, "confidence": 0.9870820045471191, "cells": [{"id": 44, "text": "Traditionally, IBM i applications have employed menu-based security to counteract this default ", "bbox": {"l": 136.8, "t": 598.6665, "r": 547.28326, "b": 607.8795, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "configuration that gives all users access to the data. The theory is that data is protected by ", "bbox": {"l": 136.8, "t": 610.6663100000001, "r": 538.6767, "b": 619.8793000000001, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "the menu options controlling what database operations that the user can perform. This ", "bbox": {"l": 136.8, "t": 622.66611, "r": 520.35364, "b": 631.8791, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "approach is ineffective, even if the user profile is restricted from running interactive ", "bbox": {"l": 136.80002, "t": 634.6659099999999, "r": 502.77115000000003, "b": 643.87891, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "commands. The reason is that in today\u2019s connected world there are a multitude of interfaces ", "bbox": {"l": 136.80002, "t": 646.66571, "r": 545.16492, "b": 655.87871, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "into the system, from web browsers to PC clients, that bypass application menus. If there are ", "bbox": {"l": 136.80002, "t": 658.66551, "r": 547.23376, "b": 667.87852, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "no object-level controls, users of these newer interfaces have an open door to your data.", "bbox": {"l": 136.80002, "t": 670.66532, "r": 526.04187, "b": 679.87833, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_footer", "id": 10, "page_no": 5, "cluster": {"id": 10, "label": "page_footer", "bbox": {"l": 64.800003, "t": 754.848721, "r": 72.821999, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.8889444470405579, "cells": [{"id": 0, "text": "2 ", "bbox": {"l": 64.800003, "t": 754.848721, "r": 72.821999, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2"}, {"label": "page_footer", "id": 9, "page_no": 5, "cluster": {"id": 9, "label": "page_footer", "bbox": {"l": 87.840302, "t": 755.538002, "r": 328.72537, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9476422667503357, "cells": [{"id": 1, "text": "Row and Column Access Control Support in IBM DB2 for i", "bbox": {"l": 87.840302, "t": 755.538002, "r": 328.72537, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Row and Column Access Control Support in IBM DB2 for i"}, {"label": "section_header", "id": 6, "page_no": 5, "cluster": {"id": 6, "label": "section_header", "bbox": {"l": 64.800003, "t": 74.34069999999997, "r": 267.40582, "b": 89.1037, "coord_origin": "TOPLEFT"}, "confidence": 0.9651358723640442, "cells": [{"id": 2, "text": "1.1", "bbox": {"l": 64.800003, "t": 74.34069999999997, "r": 87.524292, "b": 89.1037, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Security fundamentals", "bbox": {"l": 92.069145, "t": 74.34069999999997, "r": 267.40582, "b": 89.1037, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1.1 Security fundamentals"}, {"label": "text", "id": 5, "page_no": 5, "cluster": {"id": 5, "label": "text", "bbox": {"l": 136.8, "t": 106.6087, "r": 545.00482, "b": 127.82153000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9663435220718384, "cells": [{"id": 4, "text": "Before reviewing database security techniques, there are two fundamental steps in securing ", "bbox": {"l": 136.8, "t": 106.6087, "r": 545.00482, "b": 115.82172000000003, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "information assets that must be described:", "bbox": {"l": 136.8, "t": 118.60852, "r": 324.47229, "b": 127.82153000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Before reviewing database security techniques, there are two fundamental steps in securing information assets that must be described:"}, {"label": "list_item", "id": 4, "page_no": 5, "cluster": {"id": 4, "label": "list_item", "bbox": {"l": 136.8, "t": 135.12487999999996, "r": 547.16425, "b": 180.86108000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9835494756698608, "cells": [{"id": 6, "text": "GLYPH<SM590000>", "bbox": {"l": 136.8, "t": 135.79749000000004, "r": 141.78, "b": 144.57227, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "First, and most important, is the definition of a company\u2019s ", "bbox": {"l": 151.20016, "t": 135.64806999999996, "r": 406.67715, "b": 144.86108000000002, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "security policy", "bbox": {"l": 406.67999, "t": 135.12487999999996, "r": 471.03815, "b": 145.18262000000004, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": ". Without a ", "bbox": {"l": 470.04001000000005, "t": 135.64862000000005, "r": 520.59796, "b": 144.86163, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "security policy, there is no definition of what are acceptable practices for using, accessing, ", "bbox": {"l": 151.19949, "t": 147.64844000000005, "r": 547.16425, "b": 156.86145, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "and storing information by who, what, when, where, and how. A security policy should ", "bbox": {"l": 151.19948, "t": 159.64824999999996, "r": 531.02008, "b": 168.86127, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "minimally address three things: confidentiality, integrity, and availability.", "bbox": {"l": 151.19948, "t": 171.64806999999996, "r": 463.3578499999999, "b": 180.86108000000002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<SM590000> First, and most important, is the definition of a company's security policy . Without a security policy, there is no definition of what are acceptable practices for using, accessing, and storing information by who, what, when, where, and how. A security policy should minimally address three things: confidentiality, integrity, and availability."}, {"label": "list_item", "id": 11, "page_no": 5, "cluster": {"id": 11, "label": "list_item", "bbox": {"l": 151.19946, "t": 188.62787000000003, "r": 547.26086, "b": 269.83978, "coord_origin": "TOPLEFT"}, "confidence": 0.8077318072319031, "cells": [{"id": 13, "text": "The monitoring and assessment of adherence to the security policy determines whether ", "bbox": {"l": 151.19948, "t": 188.62787000000003, "r": 541.70514, "b": 197.84087999999997, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "your security strategy is working. Often, IBM security consultants are asked to perform ", "bbox": {"l": 151.19948, "t": 200.62769000000003, "r": 534.83002, "b": 209.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "security assessments for companies without regard to the security policy. Although these ", "bbox": {"l": 151.19948, "t": 212.62750000000005, "r": 545.79773, "b": 221.84051999999997, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "assessments can be useful for observing how the system is defined and how data is being ", "bbox": {"l": 151.19948, "t": 224.62732000000005, "r": 547.26086, "b": 233.84033, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "accessed, they cannot determine the level of security without a security policy. Without a ", "bbox": {"l": 151.19948, "t": 236.62714000000005, "r": 543.91528, "b": 245.84015, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "security policy, it really is not an assessment as much as it is a baseline for monitoring the ", "bbox": {"l": 151.19948, "t": 248.62694999999997, "r": 547.25989, "b": 257.83997, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "changes in the security settings that are captured.", "bbox": {"l": 151.19946, "t": 260.62676999999996, "r": 371.8692, "b": 269.83978, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The monitoring and assessment of adherence to the security policy determines whether your security strategy is working. Often, IBM security consultants are asked to perform security assessments for companies without regard to the security policy. Although these assessments can be useful for observing how the system is defined and how data is being accessed, they cannot determine the level of security without a security policy. Without a security policy, it really is not an assessment as much as it is a baseline for monitoring the changes in the security settings that are captured."}, {"label": "text", "id": 12, "page_no": 5, "cluster": {"id": 12, "label": "text", "bbox": {"l": 151.19946, "t": 277.60657000000003, "r": 541.992, "b": 286.81958, "coord_origin": "TOPLEFT"}, "confidence": 0.7967224717140198, "cells": [{"id": 20, "text": "A security policy is what defines whether the system and its settings are secure (or not). ", "bbox": {"l": 151.19946, "t": 277.60657000000003, "r": 541.992, "b": 286.81958, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "A security policy is what defines whether the system and its settings are secure (or not)."}, {"label": "list_item", "id": 3, "page_no": 5, "cluster": {"id": 3, "label": "list_item", "bbox": {"l": 136.7993, "t": 294.12496999999996, "r": 547.15826, "b": 375.8606, "coord_origin": "TOPLEFT"}, "confidence": 0.9837487936019897, "cells": [{"id": 21, "text": "GLYPH<SM590000>", "bbox": {"l": 136.7993, "t": 294.7955600000001, "r": 141.7793, "b": 303.57034, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "The second fundamental in securing data assets is the use of ", "bbox": {"l": 151.19946, "t": 294.64618, "r": 425.86029, "b": 303.85916, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "resource security", "bbox": {"l": 425.82001, "t": 294.12496999999996, "r": 501.60065, "b": 304.18265, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": ". If ", "bbox": {"l": 500.64001, "t": 294.64871, "r": 514.49933, "b": 303.86169, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "implemented properly, resource security prevents data breaches from both internal and ", "bbox": {"l": 151.20038, "t": 306.64853, "r": 537.87421, "b": 315.86151, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "external intrusions. Resource security controls are closely tied to the part of the security ", "bbox": {"l": 151.20038, "t": 318.64834999999994, "r": 541.33636, "b": 327.86133, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "policy that defines who should have access to what information resources. A hacker might ", "bbox": {"l": 151.20038, "t": 330.64816, "r": 547.15826, "b": 339.86115, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "be good enough to get through your company firewalls and sift his way through to your ", "bbox": {"l": 151.20038, "t": 342.64798, "r": 534.86066, "b": 351.86096, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "system, but if they do not have explicit access to your database, the hacker cannot ", "bbox": {"l": 151.20038, "t": 354.6478, "r": 517.00739, "b": 363.86078, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "compromise your information assets.", "bbox": {"l": 151.20038, "t": 366.64761, "r": 314.03534, "b": 375.8606, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<SM590000> The second fundamental in securing data assets is the use of resource security . If implemented properly, resource security prevents data breaches from both internal and external intrusions. Resource security controls are closely tied to the part of the security policy that defines who should have access to what information resources. A hacker might be good enough to get through your company firewalls and sift his way through to your system, but if they do not have explicit access to your database, the hacker cannot compromise your information assets."}, {"label": "text", "id": 8, "page_no": 5, "cluster": {"id": 8, "label": "text", "bbox": {"l": 136.80022, "t": 388.60742, "r": 535.36169, "b": 409.82022, "coord_origin": "TOPLEFT"}, "confidence": 0.9621998071670532, "cells": [{"id": 31, "text": "With your eyes now open to the importance of securing information assets, the rest of this ", "bbox": {"l": 136.80022, "t": 388.60742, "r": 535.36169, "b": 397.82040000000006, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "chapter reviews the methods that are available for securing database resources on IBM i. ", "bbox": {"l": 136.80022, "t": 400.60724, "r": 532.755, "b": 409.82022, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "With your eyes now open to the importance of securing information assets, the rest of this chapter reviews the methods that are available for securing database resources on IBM i."}, {"label": "section_header", "id": 7, "page_no": 5, "cluster": {"id": 7, "label": "section_header", "bbox": {"l": 64.800003, "t": 438.30072, "r": 323.38391, "b": 453.06372, "coord_origin": "TOPLEFT"}, "confidence": 0.9650285243988037, "cells": [{"id": 33, "text": "1.2", "bbox": {"l": 64.800003, "t": 438.30072, "r": 87.415726, "b": 453.06372, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Current state of IBM i security", "bbox": {"l": 91.93885, "t": 438.30072, "r": 323.38391, "b": 453.06372, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1.2 Current state of IBM i security"}, {"label": "text", "id": 1, "page_no": 5, "cluster": {"id": 1, "label": "text", "bbox": {"l": 136.8, "t": 470.62872, "r": 547.31824, "b": 515.84116, "coord_origin": "TOPLEFT"}, "confidence": 0.9848750233650208, "cells": [{"id": 35, "text": "Because of the inherently secure nature of IBM i, many clients rely on the default system ", "bbox": {"l": 136.8, "t": 470.62872, "r": 530.30463, "b": 479.84171, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "settings to protect their business data that is stored in DB2 for i. In most cases, this means no ", "bbox": {"l": 136.8, "t": 482.62854, "r": 547.31824, "b": 491.84152, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "data protection because the default setting for the Create default public authority (QCRTAUT) ", "bbox": {"l": 136.8, "t": 494.62836, "r": 547.19586, "b": 503.84134, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "system value is *CHANGE.", "bbox": {"l": 136.8, "t": 506.62817, "r": 257.04709, "b": 515.84116, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Because of the inherently secure nature of IBM i, many clients rely on the default system settings to protect their business data that is stored in DB2 for i. In most cases, this means no data protection because the default setting for the Create default public authority (QCRTAUT) system value is *CHANGE."}, {"label": "text", "id": 2, "page_no": 5, "cluster": {"id": 2, "label": "text", "bbox": {"l": 136.8, "t": 528.64774, "r": 547.28442, "b": 585.85994, "coord_origin": "TOPLEFT"}, "confidence": 0.9848474860191345, "cells": [{"id": 39, "text": "Even more disturbing is that many IBM i clients remain in this state, despite the news ", "bbox": {"l": 136.8, "t": 528.64774, "r": 513.90448, "b": 537.86073, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "headlines and the significant costs that are involved with databases being compromised. This ", "bbox": {"l": 136.8, "t": 540.6475399999999, "r": 547.28442, "b": 549.86053, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "default security configuration makes it quite challenging to implement basic security policies. ", "bbox": {"l": 136.8, "t": 552.64734, "r": 546.27533, "b": 561.86034, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "A tighter implementation is required if you really want to protect one of your company\u2019s most ", "bbox": {"l": 136.8, "t": 564.64714, "r": 545.08014, "b": 573.86014, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "valuable assets, which is the data.", "bbox": {"l": 136.8, "t": 576.64694, "r": 287.80057, "b": 585.85994, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Even more disturbing is that many IBM i clients remain in this state, despite the news headlines and the significant costs that are involved with databases being compromised. This default security configuration makes it quite challenging to implement basic security policies. A tighter implementation is required if you really want to protect one of your company's most valuable assets, which is the data."}, {"label": "text", "id": 0, "page_no": 5, "cluster": {"id": 0, "label": "text", "bbox": {"l": 136.8, "t": 598.6665, "r": 547.28326, "b": 679.87833, "coord_origin": "TOPLEFT"}, "confidence": 0.9870820045471191, "cells": [{"id": 44, "text": "Traditionally, IBM i applications have employed menu-based security to counteract this default ", "bbox": {"l": 136.8, "t": 598.6665, "r": 547.28326, "b": 607.8795, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "configuration that gives all users access to the data. The theory is that data is protected by ", "bbox": {"l": 136.8, "t": 610.6663100000001, "r": 538.6767, "b": 619.8793000000001, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "the menu options controlling what database operations that the user can perform. This ", "bbox": {"l": 136.8, "t": 622.66611, "r": 520.35364, "b": 631.8791, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "approach is ineffective, even if the user profile is restricted from running interactive ", "bbox": {"l": 136.80002, "t": 634.6659099999999, "r": 502.77115000000003, "b": 643.87891, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "commands. The reason is that in today\u2019s connected world there are a multitude of interfaces ", "bbox": {"l": 136.80002, "t": 646.66571, "r": 545.16492, "b": 655.87871, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "into the system, from web browsers to PC clients, that bypass application menus. If there are ", "bbox": {"l": 136.80002, "t": 658.66551, "r": 547.23376, "b": 667.87852, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "no object-level controls, users of these newer interfaces have an open door to your data.", "bbox": {"l": 136.80002, "t": 670.66532, "r": 526.04187, "b": 679.87833, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Traditionally, IBM i applications have employed menu-based security to counteract this default configuration that gives all users access to the data. The theory is that data is protected by the menu options controlling what database operations that the user can perform. This approach is ineffective, even if the user profile is restricted from running interactive commands. The reason is that in today's connected world there are a multitude of interfaces into the system, from web browsers to PC clients, that bypass application menus. If there are no object-level controls, users of these newer interfaces have an open door to your data."}], "body": [{"label": "section_header", "id": 6, "page_no": 5, "cluster": {"id": 6, "label": "section_header", "bbox": {"l": 64.800003, "t": 74.34069999999997, "r": 267.40582, "b": 89.1037, "coord_origin": "TOPLEFT"}, "confidence": 0.9651358723640442, "cells": [{"id": 2, "text": "1.1", "bbox": {"l": 64.800003, "t": 74.34069999999997, "r": 87.524292, "b": 89.1037, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Security fundamentals", "bbox": {"l": 92.069145, "t": 74.34069999999997, "r": 267.40582, "b": 89.1037, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1.1 Security fundamentals"}, {"label": "text", "id": 5, "page_no": 5, "cluster": {"id": 5, "label": "text", "bbox": {"l": 136.8, "t": 106.6087, "r": 545.00482, "b": 127.82153000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9663435220718384, "cells": [{"id": 4, "text": "Before reviewing database security techniques, there are two fundamental steps in securing ", "bbox": {"l": 136.8, "t": 106.6087, "r": 545.00482, "b": 115.82172000000003, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "information assets that must be described:", "bbox": {"l": 136.8, "t": 118.60852, "r": 324.47229, "b": 127.82153000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Before reviewing database security techniques, there are two fundamental steps in securing information assets that must be described:"}, {"label": "list_item", "id": 4, "page_no": 5, "cluster": {"id": 4, "label": "list_item", "bbox": {"l": 136.8, "t": 135.12487999999996, "r": 547.16425, "b": 180.86108000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9835494756698608, "cells": [{"id": 6, "text": "GLYPH<SM590000>", "bbox": {"l": 136.8, "t": 135.79749000000004, "r": 141.78, "b": 144.57227, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "First, and most important, is the definition of a company\u2019s ", "bbox": {"l": 151.20016, "t": 135.64806999999996, "r": 406.67715, "b": 144.86108000000002, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "security policy", "bbox": {"l": 406.67999, "t": 135.12487999999996, "r": 471.03815, "b": 145.18262000000004, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": ". Without a ", "bbox": {"l": 470.04001000000005, "t": 135.64862000000005, "r": 520.59796, "b": 144.86163, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "security policy, there is no definition of what are acceptable practices for using, accessing, ", "bbox": {"l": 151.19949, "t": 147.64844000000005, "r": 547.16425, "b": 156.86145, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "and storing information by who, what, when, where, and how. A security policy should ", "bbox": {"l": 151.19948, "t": 159.64824999999996, "r": 531.02008, "b": 168.86127, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "minimally address three things: confidentiality, integrity, and availability.", "bbox": {"l": 151.19948, "t": 171.64806999999996, "r": 463.3578499999999, "b": 180.86108000000002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<SM590000> First, and most important, is the definition of a company's security policy . Without a security policy, there is no definition of what are acceptable practices for using, accessing, and storing information by who, what, when, where, and how. A security policy should minimally address three things: confidentiality, integrity, and availability."}, {"label": "list_item", "id": 11, "page_no": 5, "cluster": {"id": 11, "label": "list_item", "bbox": {"l": 151.19946, "t": 188.62787000000003, "r": 547.26086, "b": 269.83978, "coord_origin": "TOPLEFT"}, "confidence": 0.8077318072319031, "cells": [{"id": 13, "text": "The monitoring and assessment of adherence to the security policy determines whether ", "bbox": {"l": 151.19948, "t": 188.62787000000003, "r": 541.70514, "b": 197.84087999999997, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "your security strategy is working. Often, IBM security consultants are asked to perform ", "bbox": {"l": 151.19948, "t": 200.62769000000003, "r": 534.83002, "b": 209.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "security assessments for companies without regard to the security policy. Although these ", "bbox": {"l": 151.19948, "t": 212.62750000000005, "r": 545.79773, "b": 221.84051999999997, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "assessments can be useful for observing how the system is defined and how data is being ", "bbox": {"l": 151.19948, "t": 224.62732000000005, "r": 547.26086, "b": 233.84033, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "accessed, they cannot determine the level of security without a security policy. Without a ", "bbox": {"l": 151.19948, "t": 236.62714000000005, "r": 543.91528, "b": 245.84015, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "security policy, it really is not an assessment as much as it is a baseline for monitoring the ", "bbox": {"l": 151.19948, "t": 248.62694999999997, "r": 547.25989, "b": 257.83997, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "changes in the security settings that are captured.", "bbox": {"l": 151.19946, "t": 260.62676999999996, "r": 371.8692, "b": 269.83978, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The monitoring and assessment of adherence to the security policy determines whether your security strategy is working. Often, IBM security consultants are asked to perform security assessments for companies without regard to the security policy. Although these assessments can be useful for observing how the system is defined and how data is being accessed, they cannot determine the level of security without a security policy. Without a security policy, it really is not an assessment as much as it is a baseline for monitoring the changes in the security settings that are captured."}, {"label": "text", "id": 12, "page_no": 5, "cluster": {"id": 12, "label": "text", "bbox": {"l": 151.19946, "t": 277.60657000000003, "r": 541.992, "b": 286.81958, "coord_origin": "TOPLEFT"}, "confidence": 0.7967224717140198, "cells": [{"id": 20, "text": "A security policy is what defines whether the system and its settings are secure (or not). ", "bbox": {"l": 151.19946, "t": 277.60657000000003, "r": 541.992, "b": 286.81958, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "A security policy is what defines whether the system and its settings are secure (or not)."}, {"label": "list_item", "id": 3, "page_no": 5, "cluster": {"id": 3, "label": "list_item", "bbox": {"l": 136.7993, "t": 294.12496999999996, "r": 547.15826, "b": 375.8606, "coord_origin": "TOPLEFT"}, "confidence": 0.9837487936019897, "cells": [{"id": 21, "text": "GLYPH<SM590000>", "bbox": {"l": 136.7993, "t": 294.7955600000001, "r": 141.7793, "b": 303.57034, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "The second fundamental in securing data assets is the use of ", "bbox": {"l": 151.19946, "t": 294.64618, "r": 425.86029, "b": 303.85916, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "resource security", "bbox": {"l": 425.82001, "t": 294.12496999999996, "r": 501.60065, "b": 304.18265, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": ". If ", "bbox": {"l": 500.64001, "t": 294.64871, "r": 514.49933, "b": 303.86169, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "implemented properly, resource security prevents data breaches from both internal and ", "bbox": {"l": 151.20038, "t": 306.64853, "r": 537.87421, "b": 315.86151, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "external intrusions. Resource security controls are closely tied to the part of the security ", "bbox": {"l": 151.20038, "t": 318.64834999999994, "r": 541.33636, "b": 327.86133, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "policy that defines who should have access to what information resources. A hacker might ", "bbox": {"l": 151.20038, "t": 330.64816, "r": 547.15826, "b": 339.86115, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "be good enough to get through your company firewalls and sift his way through to your ", "bbox": {"l": 151.20038, "t": 342.64798, "r": 534.86066, "b": 351.86096, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "system, but if they do not have explicit access to your database, the hacker cannot ", "bbox": {"l": 151.20038, "t": 354.6478, "r": 517.00739, "b": 363.86078, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "compromise your information assets.", "bbox": {"l": 151.20038, "t": 366.64761, "r": 314.03534, "b": 375.8606, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<SM590000> The second fundamental in securing data assets is the use of resource security . If implemented properly, resource security prevents data breaches from both internal and external intrusions. Resource security controls are closely tied to the part of the security policy that defines who should have access to what information resources. A hacker might be good enough to get through your company firewalls and sift his way through to your system, but if they do not have explicit access to your database, the hacker cannot compromise your information assets."}, {"label": "text", "id": 8, "page_no": 5, "cluster": {"id": 8, "label": "text", "bbox": {"l": 136.80022, "t": 388.60742, "r": 535.36169, "b": 409.82022, "coord_origin": "TOPLEFT"}, "confidence": 0.9621998071670532, "cells": [{"id": 31, "text": "With your eyes now open to the importance of securing information assets, the rest of this ", "bbox": {"l": 136.80022, "t": 388.60742, "r": 535.36169, "b": 397.82040000000006, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "chapter reviews the methods that are available for securing database resources on IBM i. ", "bbox": {"l": 136.80022, "t": 400.60724, "r": 532.755, "b": 409.82022, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "With your eyes now open to the importance of securing information assets, the rest of this chapter reviews the methods that are available for securing database resources on IBM i."}, {"label": "section_header", "id": 7, "page_no": 5, "cluster": {"id": 7, "label": "section_header", "bbox": {"l": 64.800003, "t": 438.30072, "r": 323.38391, "b": 453.06372, "coord_origin": "TOPLEFT"}, "confidence": 0.9650285243988037, "cells": [{"id": 33, "text": "1.2", "bbox": {"l": 64.800003, "t": 438.30072, "r": 87.415726, "b": 453.06372, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Current state of IBM i security", "bbox": {"l": 91.93885, "t": 438.30072, "r": 323.38391, "b": 453.06372, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1.2 Current state of IBM i security"}, {"label": "text", "id": 1, "page_no": 5, "cluster": {"id": 1, "label": "text", "bbox": {"l": 136.8, "t": 470.62872, "r": 547.31824, "b": 515.84116, "coord_origin": "TOPLEFT"}, "confidence": 0.9848750233650208, "cells": [{"id": 35, "text": "Because of the inherently secure nature of IBM i, many clients rely on the default system ", "bbox": {"l": 136.8, "t": 470.62872, "r": 530.30463, "b": 479.84171, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "settings to protect their business data that is stored in DB2 for i. In most cases, this means no ", "bbox": {"l": 136.8, "t": 482.62854, "r": 547.31824, "b": 491.84152, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "data protection because the default setting for the Create default public authority (QCRTAUT) ", "bbox": {"l": 136.8, "t": 494.62836, "r": 547.19586, "b": 503.84134, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "system value is *CHANGE.", "bbox": {"l": 136.8, "t": 506.62817, "r": 257.04709, "b": 515.84116, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Because of the inherently secure nature of IBM i, many clients rely on the default system settings to protect their business data that is stored in DB2 for i. In most cases, this means no data protection because the default setting for the Create default public authority (QCRTAUT) system value is *CHANGE."}, {"label": "text", "id": 2, "page_no": 5, "cluster": {"id": 2, "label": "text", "bbox": {"l": 136.8, "t": 528.64774, "r": 547.28442, "b": 585.85994, "coord_origin": "TOPLEFT"}, "confidence": 0.9848474860191345, "cells": [{"id": 39, "text": "Even more disturbing is that many IBM i clients remain in this state, despite the news ", "bbox": {"l": 136.8, "t": 528.64774, "r": 513.90448, "b": 537.86073, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "headlines and the significant costs that are involved with databases being compromised. This ", "bbox": {"l": 136.8, "t": 540.6475399999999, "r": 547.28442, "b": 549.86053, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "default security configuration makes it quite challenging to implement basic security policies. ", "bbox": {"l": 136.8, "t": 552.64734, "r": 546.27533, "b": 561.86034, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "A tighter implementation is required if you really want to protect one of your company\u2019s most ", "bbox": {"l": 136.8, "t": 564.64714, "r": 545.08014, "b": 573.86014, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "valuable assets, which is the data.", "bbox": {"l": 136.8, "t": 576.64694, "r": 287.80057, "b": 585.85994, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Even more disturbing is that many IBM i clients remain in this state, despite the news headlines and the significant costs that are involved with databases being compromised. This default security configuration makes it quite challenging to implement basic security policies. A tighter implementation is required if you really want to protect one of your company's most valuable assets, which is the data."}, {"label": "text", "id": 0, "page_no": 5, "cluster": {"id": 0, "label": "text", "bbox": {"l": 136.8, "t": 598.6665, "r": 547.28326, "b": 679.87833, "coord_origin": "TOPLEFT"}, "confidence": 0.9870820045471191, "cells": [{"id": 44, "text": "Traditionally, IBM i applications have employed menu-based security to counteract this default ", "bbox": {"l": 136.8, "t": 598.6665, "r": 547.28326, "b": 607.8795, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "configuration that gives all users access to the data. The theory is that data is protected by ", "bbox": {"l": 136.8, "t": 610.6663100000001, "r": 538.6767, "b": 619.8793000000001, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "the menu options controlling what database operations that the user can perform. This ", "bbox": {"l": 136.8, "t": 622.66611, "r": 520.35364, "b": 631.8791, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "approach is ineffective, even if the user profile is restricted from running interactive ", "bbox": {"l": 136.80002, "t": 634.6659099999999, "r": 502.77115000000003, "b": 643.87891, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "commands. The reason is that in today\u2019s connected world there are a multitude of interfaces ", "bbox": {"l": 136.80002, "t": 646.66571, "r": 545.16492, "b": 655.87871, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "into the system, from web browsers to PC clients, that bypass application menus. If there are ", "bbox": {"l": 136.80002, "t": 658.66551, "r": 547.23376, "b": 667.87852, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "no object-level controls, users of these newer interfaces have an open door to your data.", "bbox": {"l": 136.80002, "t": 670.66532, "r": 526.04187, "b": 679.87833, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Traditionally, IBM i applications have employed menu-based security to counteract this default configuration that gives all users access to the data. The theory is that data is protected by the menu options controlling what database operations that the user can perform. This approach is ineffective, even if the user profile is restricted from running interactive commands. The reason is that in today's connected world there are a multitude of interfaces into the system, from web browsers to PC clients, that bypass application menus. If there are no object-level controls, users of these newer interfaces have an open door to your data."}], "headers": [{"label": "page_footer", "id": 10, "page_no": 5, "cluster": {"id": 10, "label": "page_footer", "bbox": {"l": 64.800003, "t": 754.848721, "r": 72.821999, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.8889444470405579, "cells": [{"id": 0, "text": "2 ", "bbox": {"l": 64.800003, "t": 754.848721, "r": 72.821999, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2"}, {"label": "page_footer", "id": 9, "page_no": 5, "cluster": {"id": 9, "label": "page_footer", "bbox": {"l": 87.840302, "t": 755.538002, "r": 328.72537, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9476422667503357, "cells": [{"id": 1, "text": "Row and Column Access Control Support in IBM DB2 for i", "bbox": {"l": 87.840302, "t": 755.538002, "r": 328.72537, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Row and Column Access Control Support in IBM DB2 for i"}]}}, {"page_no": 6, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "4 ", "bbox": {"l": 64.800003, "t": 754.848721, "r": 72.821999, "b": 764.06172, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Row and Column Access Control Support in IBM DB2 for i", "bbox": {"l": 87.840302, "t": 755.538002, "r": 328.72537, "b": 763.863001, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Many businesses are trying to limit data access to a need-to-know basis. This security goal ", "bbox": {"l": 136.8, "t": 71.50867000000005, "r": 541.19006, "b": 80.72167999999999, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "means that users should be given access only to the minimum set of data that is required to ", "bbox": {"l": 136.8, "t": 83.50847999999996, "r": 544.30334, "b": 92.72149999999999, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "perform their job. Often, users with object-level access are given access to row and column ", "bbox": {"l": 136.8, "t": 95.50829999999996, "r": 540.94299, "b": 104.72131000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "values that are beyond what their business task requires because that object-level security ", "bbox": {"l": 136.80002, "t": 107.50811999999996, "r": 538.27454, "b": 116.72113000000002, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "provides an all-or-nothing solution. For example, object-level controls allow a manager to ", "bbox": {"l": 136.80002, "t": 119.50792999999999, "r": 530.23004, "b": 128.72095000000002, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "access data about all employees. Most security policies limit a manager to accessing data ", "bbox": {"l": 136.80002, "t": 131.50775, "r": 536.26263, "b": 140.72076000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "only for the employees that they manage.", "bbox": {"l": 136.80002, "t": 143.50757, "r": 319.04318, "b": 152.72058000000004, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "1.3.1", "bbox": {"l": 64.800003, "t": 173.33471999999995, "r": 94.033653, "b": 185.32275000000004, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Existing row and column control", "bbox": {"l": 97.687859, "t": 173.33471999999995, "r": 301.46902, "b": 185.32275000000004, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Some IBM i clients have tried augmenting the all-or-nothing object-level security with SQL ", "bbox": {"l": 136.8, "t": 199.48870999999997, "r": 534.90112, "b": 208.70172000000002, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "views (or logical files) and application logic, as shown in Figure 1-2. However, ", "bbox": {"l": 136.8, "t": 211.48852999999997, "r": 480.47281000000004, "b": 220.70154000000002, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "application-based logic is easy to bypass with all of the different data access interfaces that ", "bbox": {"l": 136.8, "t": 223.48834, "r": 541.56738, "b": 232.70135000000005, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "are provided by the IBM i operating system, such as Open Database Connectivity (ODBC) ", "bbox": {"l": 136.8, "t": 235.48816, "r": 537.39423, "b": 244.70117000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "and System i Navigator.", "bbox": {"l": 136.79999, "t": 247.48798, "r": 242.24352000000002, "b": 256.70099000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Using SQL views to limit access to a subset of the data in a table also has its own set of ", "bbox": {"l": 136.79999, "t": 269.50757, "r": 526.88428, "b": 278.72058000000004, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "challenges. First, there is the complexity of managing all of the SQL view objects that are ", "bbox": {"l": 136.79999, "t": 281.50742, "r": 531.77087, "b": 290.7203999999999, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "used for securing data access. Second, scaling a view-based security solution can be difficult ", "bbox": {"l": 136.79999, "t": 293.50723000000005, "r": 547.4408, "b": 302.72021, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "as the amount of data grows and the number of users increases.", "bbox": {"l": 136.79999, "t": 305.50705, "r": 421.86725, "b": 314.72003, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Even if you are willing to live with these performance and management issues, a user with ", "bbox": {"l": 136.79999, "t": 327.52661, "r": 536.46692, "b": 336.7395900000001, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "*ALLOBJ access still can directly access all of the data in the underlying DB2 table and easily ", "bbox": {"l": 136.79999, "t": 339.52643, "r": 547.23267, "b": 348.73941, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "bypass the security controls that are built into an SQL view.", "bbox": {"l": 136.79999, "t": 351.52624999999995, "r": 397.88553, "b": 360.73923, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Figure 1-2 Existing row and column controls", "bbox": {"l": 136.8, "t": 691.818, "r": 316.44727, "b": 700.142998, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "User with", "bbox": {"l": 180.95911, "t": 383.45612, "r": 209.08017, "b": 389.0784, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "*ALLOBJ access", "bbox": {"l": 170.00624, "t": 390.95251, "r": 220.10355, "b": 396.57480000000004, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 8, "label": "page_footer", "bbox": {"l": 64.800003, "t": 754.848721, "r": 72.821999, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.8578535318374634, "cells": [{"id": 0, "text": "4 ", "bbox": {"l": 64.800003, "t": 754.848721, "r": 72.821999, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "page_footer", "bbox": {"l": 87.840302, "t": 755.538002, "r": 328.72537, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9491620659828186, "cells": [{"id": 1, "text": "Row and Column Access Control Support in IBM DB2 for i", "bbox": {"l": 87.840302, "t": 755.538002, "r": 328.72537, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 136.8, "t": 71.50867000000005, "r": 544.30334, "b": 152.72058000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9872740507125854, "cells": [{"id": 2, "text": "Many businesses are trying to limit data access to a need-to-know basis. This security goal ", "bbox": {"l": 136.8, "t": 71.50867000000005, "r": 541.19006, "b": 80.72167999999999, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "means that users should be given access only to the minimum set of data that is required to ", "bbox": {"l": 136.8, "t": 83.50847999999996, "r": 544.30334, "b": 92.72149999999999, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "perform their job. Often, users with object-level access are given access to row and column ", "bbox": {"l": 136.8, "t": 95.50829999999996, "r": 540.94299, "b": 104.72131000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "values that are beyond what their business task requires because that object-level security ", "bbox": {"l": 136.80002, "t": 107.50811999999996, "r": 538.27454, "b": 116.72113000000002, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "provides an all-or-nothing solution. For example, object-level controls allow a manager to ", "bbox": {"l": 136.80002, "t": 119.50792999999999, "r": 530.23004, "b": 128.72095000000002, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "access data about all employees. Most security policies limit a manager to accessing data ", "bbox": {"l": 136.80002, "t": 131.50775, "r": 536.26263, "b": 140.72076000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "only for the employees that they manage.", "bbox": {"l": 136.80002, "t": 143.50757, "r": 319.04318, "b": 152.72058000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "section_header", "bbox": {"l": 64.800003, "t": 173.33471999999995, "r": 301.46902, "b": 185.32275000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9626136422157288, "cells": [{"id": 9, "text": "1.3.1", "bbox": {"l": 64.800003, "t": 173.33471999999995, "r": 94.033653, "b": 185.32275000000004, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Existing row and column control", "bbox": {"l": 97.687859, "t": 173.33471999999995, "r": 301.46902, "b": 185.32275000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 136.79999, "t": 199.48870999999997, "r": 541.56738, "b": 256.70099000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9858147501945496, "cells": [{"id": 11, "text": "Some IBM i clients have tried augmenting the all-or-nothing object-level security with SQL ", "bbox": {"l": 136.8, "t": 199.48870999999997, "r": 534.90112, "b": 208.70172000000002, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "views (or logical files) and application logic, as shown in Figure 1-2. However, ", "bbox": {"l": 136.8, "t": 211.48852999999997, "r": 480.47281000000004, "b": 220.70154000000002, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "application-based logic is easy to bypass with all of the different data access interfaces that ", "bbox": {"l": 136.8, "t": 223.48834, "r": 541.56738, "b": 232.70135000000005, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "are provided by the IBM i operating system, such as Open Database Connectivity (ODBC) ", "bbox": {"l": 136.8, "t": 235.48816, "r": 537.39423, "b": 244.70117000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "and System i Navigator.", "bbox": {"l": 136.79999, "t": 247.48798, "r": 242.24352000000002, "b": 256.70099000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 136.79999, "t": 269.50757, "r": 547.4408, "b": 314.72003, "coord_origin": "TOPLEFT"}, "confidence": 0.9875384569168091, "cells": [{"id": 16, "text": "Using SQL views to limit access to a subset of the data in a table also has its own set of ", "bbox": {"l": 136.79999, "t": 269.50757, "r": 526.88428, "b": 278.72058000000004, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "challenges. First, there is the complexity of managing all of the SQL view objects that are ", "bbox": {"l": 136.79999, "t": 281.50742, "r": 531.77087, "b": 290.7203999999999, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "used for securing data access. Second, scaling a view-based security solution can be difficult ", "bbox": {"l": 136.79999, "t": 293.50723000000005, "r": 547.4408, "b": 302.72021, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "as the amount of data grows and the number of users increases.", "bbox": {"l": 136.79999, "t": 305.50705, "r": 421.86725, "b": 314.72003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "text", "bbox": {"l": 136.79999, "t": 327.52661, "r": 547.23267, "b": 360.73923, "coord_origin": "TOPLEFT"}, "confidence": 0.975760281085968, "cells": [{"id": 20, "text": "Even if you are willing to live with these performance and management issues, a user with ", "bbox": {"l": 136.79999, "t": 327.52661, "r": 536.46692, "b": 336.7395900000001, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "*ALLOBJ access still can directly access all of the data in the underlying DB2 table and easily ", "bbox": {"l": 136.79999, "t": 339.52643, "r": 547.23267, "b": 348.73941, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "bypass the security controls that are built into an SQL view.", "bbox": {"l": 136.79999, "t": 351.52624999999995, "r": 397.88553, "b": 360.73923, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "caption", "bbox": {"l": 136.8, "t": 691.818, "r": 316.44727, "b": 700.142998, "coord_origin": "TOPLEFT"}, "confidence": 0.9457826614379883, "cells": [{"id": 23, "text": "Figure 1-2 Existing row and column controls", "bbox": {"l": 136.8, "t": 691.818, "r": 316.44727, "b": 700.142998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "picture", "bbox": {"l": 135.92466735839844, "t": 375.9272155761719, "r": 546.4456176757812, "b": 688.6098022460938, "coord_origin": "TOPLEFT"}, "confidence": 0.9838992357254028, "cells": [{"id": 24, "text": "User with", "bbox": {"l": 180.95911, "t": 383.45612, "r": 209.08017, "b": 389.0784, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "*ALLOBJ access", "bbox": {"l": 170.00624, "t": 390.95251, "r": 220.10355, "b": 396.57480000000004, "coord_origin": "TOPLEFT"}}], "children": [{"id": 9, "label": "text", "bbox": {"l": 180.95911, "t": 383.45612, "r": 209.08017, "b": 389.0784, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "User with", "bbox": {"l": 180.95911, "t": 383.45612, "r": 209.08017, "b": 389.0784, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "text", "bbox": {"l": 170.00624, "t": 390.95251, "r": 220.10355, "b": 396.57480000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "*ALLOBJ access", "bbox": {"l": 170.00624, "t": 390.95251, "r": 220.10355, "b": 396.57480000000004, "coord_origin": "TOPLEFT"}}], "children": []}]}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_footer", "id": 8, "page_no": 6, "cluster": {"id": 8, "label": "page_footer", "bbox": {"l": 64.800003, "t": 754.848721, "r": 72.821999, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.8578535318374634, "cells": [{"id": 0, "text": "4 ", "bbox": {"l": 64.800003, "t": 754.848721, "r": 72.821999, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4"}, {"label": "page_footer", "id": 6, "page_no": 6, "cluster": {"id": 6, "label": "page_footer", "bbox": {"l": 87.840302, "t": 755.538002, "r": 328.72537, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9491620659828186, "cells": [{"id": 1, "text": "Row and Column Access Control Support in IBM DB2 for i", "bbox": {"l": 87.840302, "t": 755.538002, "r": 328.72537, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Row and Column Access Control Support in IBM DB2 for i"}, {"label": "text", "id": 1, "page_no": 6, "cluster": {"id": 1, "label": "text", "bbox": {"l": 136.8, "t": 71.50867000000005, "r": 544.30334, "b": 152.72058000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9872740507125854, "cells": [{"id": 2, "text": "Many businesses are trying to limit data access to a need-to-know basis. This security goal ", "bbox": {"l": 136.8, "t": 71.50867000000005, "r": 541.19006, "b": 80.72167999999999, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "means that users should be given access only to the minimum set of data that is required to ", "bbox": {"l": 136.8, "t": 83.50847999999996, "r": 544.30334, "b": 92.72149999999999, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "perform their job. Often, users with object-level access are given access to row and column ", "bbox": {"l": 136.8, "t": 95.50829999999996, "r": 540.94299, "b": 104.72131000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "values that are beyond what their business task requires because that object-level security ", "bbox": {"l": 136.80002, "t": 107.50811999999996, "r": 538.27454, "b": 116.72113000000002, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "provides an all-or-nothing solution. For example, object-level controls allow a manager to ", "bbox": {"l": 136.80002, "t": 119.50792999999999, "r": 530.23004, "b": 128.72095000000002, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "access data about all employees. Most security policies limit a manager to accessing data ", "bbox": {"l": 136.80002, "t": 131.50775, "r": 536.26263, "b": 140.72076000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "only for the employees that they manage.", "bbox": {"l": 136.80002, "t": 143.50757, "r": 319.04318, "b": 152.72058000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Many businesses are trying to limit data access to a need-to-know basis. This security goal means that users should be given access only to the minimum set of data that is required to perform their job. Often, users with object-level access are given access to row and column values that are beyond what their business task requires because that object-level security provides an all-or-nothing solution. For example, object-level controls allow a manager to access data about all employees. Most security policies limit a manager to accessing data only for the employees that they manage."}, {"label": "section_header", "id": 5, "page_no": 6, "cluster": {"id": 5, "label": "section_header", "bbox": {"l": 64.800003, "t": 173.33471999999995, "r": 301.46902, "b": 185.32275000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9626136422157288, "cells": [{"id": 9, "text": "1.3.1", "bbox": {"l": 64.800003, "t": 173.33471999999995, "r": 94.033653, "b": 185.32275000000004, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Existing row and column control", "bbox": {"l": 97.687859, "t": 173.33471999999995, "r": 301.46902, "b": 185.32275000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1.3.1 Existing row and column control"}, {"label": "text", "id": 2, "page_no": 6, "cluster": {"id": 2, "label": "text", "bbox": {"l": 136.79999, "t": 199.48870999999997, "r": 541.56738, "b": 256.70099000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9858147501945496, "cells": [{"id": 11, "text": "Some IBM i clients have tried augmenting the all-or-nothing object-level security with SQL ", "bbox": {"l": 136.8, "t": 199.48870999999997, "r": 534.90112, "b": 208.70172000000002, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "views (or logical files) and application logic, as shown in Figure 1-2. However, ", "bbox": {"l": 136.8, "t": 211.48852999999997, "r": 480.47281000000004, "b": 220.70154000000002, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "application-based logic is easy to bypass with all of the different data access interfaces that ", "bbox": {"l": 136.8, "t": 223.48834, "r": 541.56738, "b": 232.70135000000005, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "are provided by the IBM i operating system, such as Open Database Connectivity (ODBC) ", "bbox": {"l": 136.8, "t": 235.48816, "r": 537.39423, "b": 244.70117000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "and System i Navigator.", "bbox": {"l": 136.79999, "t": 247.48798, "r": 242.24352000000002, "b": 256.70099000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Some IBM i clients have tried augmenting the all-or-nothing object-level security with SQL views (or logical files) and application logic, as shown in Figure 1-2. However, application-based logic is easy to bypass with all of the different data access interfaces that are provided by the IBM i operating system, such as Open Database Connectivity (ODBC) and System i Navigator."}, {"label": "text", "id": 0, "page_no": 6, "cluster": {"id": 0, "label": "text", "bbox": {"l": 136.79999, "t": 269.50757, "r": 547.4408, "b": 314.72003, "coord_origin": "TOPLEFT"}, "confidence": 0.9875384569168091, "cells": [{"id": 16, "text": "Using SQL views to limit access to a subset of the data in a table also has its own set of ", "bbox": {"l": 136.79999, "t": 269.50757, "r": 526.88428, "b": 278.72058000000004, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "challenges. First, there is the complexity of managing all of the SQL view objects that are ", "bbox": {"l": 136.79999, "t": 281.50742, "r": 531.77087, "b": 290.7203999999999, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "used for securing data access. Second, scaling a view-based security solution can be difficult ", "bbox": {"l": 136.79999, "t": 293.50723000000005, "r": 547.4408, "b": 302.72021, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "as the amount of data grows and the number of users increases.", "bbox": {"l": 136.79999, "t": 305.50705, "r": 421.86725, "b": 314.72003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Using SQL views to limit access to a subset of the data in a table also has its own set of challenges. First, there is the complexity of managing all of the SQL view objects that are used for securing data access. Second, scaling a view-based security solution can be difficult as the amount of data grows and the number of users increases."}, {"label": "text", "id": 4, "page_no": 6, "cluster": {"id": 4, "label": "text", "bbox": {"l": 136.79999, "t": 327.52661, "r": 547.23267, "b": 360.73923, "coord_origin": "TOPLEFT"}, "confidence": 0.975760281085968, "cells": [{"id": 20, "text": "Even if you are willing to live with these performance and management issues, a user with ", "bbox": {"l": 136.79999, "t": 327.52661, "r": 536.46692, "b": 336.7395900000001, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "*ALLOBJ access still can directly access all of the data in the underlying DB2 table and easily ", "bbox": {"l": 136.79999, "t": 339.52643, "r": 547.23267, "b": 348.73941, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "bypass the security controls that are built into an SQL view.", "bbox": {"l": 136.79999, "t": 351.52624999999995, "r": 397.88553, "b": 360.73923, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Even if you are willing to live with these performance and management issues, a user with *ALLOBJ access still can directly access all of the data in the underlying DB2 table and easily bypass the security controls that are built into an SQL view."}, {"label": "caption", "id": 7, "page_no": 6, "cluster": {"id": 7, "label": "caption", "bbox": {"l": 136.8, "t": 691.818, "r": 316.44727, "b": 700.142998, "coord_origin": "TOPLEFT"}, "confidence": 0.9457826614379883, "cells": [{"id": 23, "text": "Figure 1-2 Existing row and column controls", "bbox": {"l": 136.8, "t": 691.818, "r": 316.44727, "b": 700.142998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 1-2 Existing row and column controls"}, {"label": "picture", "id": 3, "page_no": 6, "cluster": {"id": 3, "label": "picture", "bbox": {"l": 135.92466735839844, "t": 375.9272155761719, "r": 546.4456176757812, "b": 688.6098022460938, "coord_origin": "TOPLEFT"}, "confidence": 0.9838992357254028, "cells": [{"id": 24, "text": "User with", "bbox": {"l": 180.95911, "t": 383.45612, "r": 209.08017, "b": 389.0784, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "*ALLOBJ access", "bbox": {"l": 170.00624, "t": 390.95251, "r": 220.10355, "b": 396.57480000000004, "coord_origin": "TOPLEFT"}}], "children": [{"id": 9, "label": "text", "bbox": {"l": 180.95911, "t": 383.45612, "r": 209.08017, "b": 389.0784, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "User with", "bbox": {"l": 180.95911, "t": 383.45612, "r": 209.08017, "b": 389.0784, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "text", "bbox": {"l": 170.00624, "t": 390.95251, "r": 220.10355, "b": 396.57480000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "*ALLOBJ access", "bbox": {"l": 170.00624, "t": 390.95251, "r": 220.10355, "b": 396.57480000000004, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "body": [{"label": "text", "id": 1, "page_no": 6, "cluster": {"id": 1, "label": "text", "bbox": {"l": 136.8, "t": 71.50867000000005, "r": 544.30334, "b": 152.72058000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9872740507125854, "cells": [{"id": 2, "text": "Many businesses are trying to limit data access to a need-to-know basis. This security goal ", "bbox": {"l": 136.8, "t": 71.50867000000005, "r": 541.19006, "b": 80.72167999999999, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "means that users should be given access only to the minimum set of data that is required to ", "bbox": {"l": 136.8, "t": 83.50847999999996, "r": 544.30334, "b": 92.72149999999999, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "perform their job. Often, users with object-level access are given access to row and column ", "bbox": {"l": 136.8, "t": 95.50829999999996, "r": 540.94299, "b": 104.72131000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "values that are beyond what their business task requires because that object-level security ", "bbox": {"l": 136.80002, "t": 107.50811999999996, "r": 538.27454, "b": 116.72113000000002, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "provides an all-or-nothing solution. For example, object-level controls allow a manager to ", "bbox": {"l": 136.80002, "t": 119.50792999999999, "r": 530.23004, "b": 128.72095000000002, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "access data about all employees. Most security policies limit a manager to accessing data ", "bbox": {"l": 136.80002, "t": 131.50775, "r": 536.26263, "b": 140.72076000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "only for the employees that they manage.", "bbox": {"l": 136.80002, "t": 143.50757, "r": 319.04318, "b": 152.72058000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Many businesses are trying to limit data access to a need-to-know basis. This security goal means that users should be given access only to the minimum set of data that is required to perform their job. Often, users with object-level access are given access to row and column values that are beyond what their business task requires because that object-level security provides an all-or-nothing solution. For example, object-level controls allow a manager to access data about all employees. Most security policies limit a manager to accessing data only for the employees that they manage."}, {"label": "section_header", "id": 5, "page_no": 6, "cluster": {"id": 5, "label": "section_header", "bbox": {"l": 64.800003, "t": 173.33471999999995, "r": 301.46902, "b": 185.32275000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9626136422157288, "cells": [{"id": 9, "text": "1.3.1", "bbox": {"l": 64.800003, "t": 173.33471999999995, "r": 94.033653, "b": 185.32275000000004, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Existing row and column control", "bbox": {"l": 97.687859, "t": 173.33471999999995, "r": 301.46902, "b": 185.32275000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1.3.1 Existing row and column control"}, {"label": "text", "id": 2, "page_no": 6, "cluster": {"id": 2, "label": "text", "bbox": {"l": 136.79999, "t": 199.48870999999997, "r": 541.56738, "b": 256.70099000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9858147501945496, "cells": [{"id": 11, "text": "Some IBM i clients have tried augmenting the all-or-nothing object-level security with SQL ", "bbox": {"l": 136.8, "t": 199.48870999999997, "r": 534.90112, "b": 208.70172000000002, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "views (or logical files) and application logic, as shown in Figure 1-2. However, ", "bbox": {"l": 136.8, "t": 211.48852999999997, "r": 480.47281000000004, "b": 220.70154000000002, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "application-based logic is easy to bypass with all of the different data access interfaces that ", "bbox": {"l": 136.8, "t": 223.48834, "r": 541.56738, "b": 232.70135000000005, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "are provided by the IBM i operating system, such as Open Database Connectivity (ODBC) ", "bbox": {"l": 136.8, "t": 235.48816, "r": 537.39423, "b": 244.70117000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "and System i Navigator.", "bbox": {"l": 136.79999, "t": 247.48798, "r": 242.24352000000002, "b": 256.70099000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Some IBM i clients have tried augmenting the all-or-nothing object-level security with SQL views (or logical files) and application logic, as shown in Figure 1-2. However, application-based logic is easy to bypass with all of the different data access interfaces that are provided by the IBM i operating system, such as Open Database Connectivity (ODBC) and System i Navigator."}, {"label": "text", "id": 0, "page_no": 6, "cluster": {"id": 0, "label": "text", "bbox": {"l": 136.79999, "t": 269.50757, "r": 547.4408, "b": 314.72003, "coord_origin": "TOPLEFT"}, "confidence": 0.9875384569168091, "cells": [{"id": 16, "text": "Using SQL views to limit access to a subset of the data in a table also has its own set of ", "bbox": {"l": 136.79999, "t": 269.50757, "r": 526.88428, "b": 278.72058000000004, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "challenges. First, there is the complexity of managing all of the SQL view objects that are ", "bbox": {"l": 136.79999, "t": 281.50742, "r": 531.77087, "b": 290.7203999999999, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "used for securing data access. Second, scaling a view-based security solution can be difficult ", "bbox": {"l": 136.79999, "t": 293.50723000000005, "r": 547.4408, "b": 302.72021, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "as the amount of data grows and the number of users increases.", "bbox": {"l": 136.79999, "t": 305.50705, "r": 421.86725, "b": 314.72003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Using SQL views to limit access to a subset of the data in a table also has its own set of challenges. First, there is the complexity of managing all of the SQL view objects that are used for securing data access. Second, scaling a view-based security solution can be difficult as the amount of data grows and the number of users increases."}, {"label": "text", "id": 4, "page_no": 6, "cluster": {"id": 4, "label": "text", "bbox": {"l": 136.79999, "t": 327.52661, "r": 547.23267, "b": 360.73923, "coord_origin": "TOPLEFT"}, "confidence": 0.975760281085968, "cells": [{"id": 20, "text": "Even if you are willing to live with these performance and management issues, a user with ", "bbox": {"l": 136.79999, "t": 327.52661, "r": 536.46692, "b": 336.7395900000001, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "*ALLOBJ access still can directly access all of the data in the underlying DB2 table and easily ", "bbox": {"l": 136.79999, "t": 339.52643, "r": 547.23267, "b": 348.73941, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "bypass the security controls that are built into an SQL view.", "bbox": {"l": 136.79999, "t": 351.52624999999995, "r": 397.88553, "b": 360.73923, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Even if you are willing to live with these performance and management issues, a user with *ALLOBJ access still can directly access all of the data in the underlying DB2 table and easily bypass the security controls that are built into an SQL view."}, {"label": "caption", "id": 7, "page_no": 6, "cluster": {"id": 7, "label": "caption", "bbox": {"l": 136.8, "t": 691.818, "r": 316.44727, "b": 700.142998, "coord_origin": "TOPLEFT"}, "confidence": 0.9457826614379883, "cells": [{"id": 23, "text": "Figure 1-2 Existing row and column controls", "bbox": {"l": 136.8, "t": 691.818, "r": 316.44727, "b": 700.142998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 1-2 Existing row and column controls"}, {"label": "picture", "id": 3, "page_no": 6, "cluster": {"id": 3, "label": "picture", "bbox": {"l": 135.92466735839844, "t": 375.9272155761719, "r": 546.4456176757812, "b": 688.6098022460938, "coord_origin": "TOPLEFT"}, "confidence": 0.9838992357254028, "cells": [{"id": 24, "text": "User with", "bbox": {"l": 180.95911, "t": 383.45612, "r": 209.08017, "b": 389.0784, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "*ALLOBJ access", "bbox": {"l": 170.00624, "t": 390.95251, "r": 220.10355, "b": 396.57480000000004, "coord_origin": "TOPLEFT"}}], "children": [{"id": 9, "label": "text", "bbox": {"l": 180.95911, "t": 383.45612, "r": 209.08017, "b": 389.0784, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "User with", "bbox": {"l": 180.95911, "t": 383.45612, "r": 209.08017, "b": 389.0784, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "text", "bbox": {"l": 170.00624, "t": 390.95251, "r": 220.10355, "b": 396.57480000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "*ALLOBJ access", "bbox": {"l": 170.00624, "t": 390.95251, "r": 220.10355, "b": 396.57480000000004, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "headers": [{"label": "page_footer", "id": 8, "page_no": 6, "cluster": {"id": 8, "label": "page_footer", "bbox": {"l": 64.800003, "t": 754.848721, "r": 72.821999, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.8578535318374634, "cells": [{"id": 0, "text": "4 ", "bbox": {"l": 64.800003, "t": 754.848721, "r": 72.821999, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4"}, {"label": "page_footer", "id": 6, "page_no": 6, "cluster": {"id": 6, "label": "page_footer", "bbox": {"l": 87.840302, "t": 755.538002, "r": 328.72537, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9491620659828186, "cells": [{"id": 1, "text": "Row and Column Access Control Support in IBM DB2 for i", "bbox": {"l": 87.840302, "t": 755.538002, "r": 328.72537, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Row and Column Access Control Support in IBM DB2 for i"}]}}, {"page_no": 7, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "10 ", "bbox": {"l": 64.800003, "t": 754.848721, "r": 78.402, "b": 764.06172, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Row and Column Access Control Support in IBM DB2 for i", "bbox": {"l": 93.420303, "t": 755.538002, "r": 334.42142, "b": 763.863001, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "2.1.6", "bbox": {"l": 64.800003, "t": 71.33471999999995, "r": 94.081459, "b": 83.32275000000004, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Change Function Usage CL command", "bbox": {"l": 97.741661, "t": 71.33471999999995, "r": 335.49551, "b": 83.32275000000004, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "The following CL commands can be used to work with, display, or change function usage IDs:", "bbox": {"l": 136.8, "t": 97.48870999999997, "r": 547.28442, "b": 106.70172000000014, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "GLYPH<SM590000>", "bbox": {"l": 136.8, "t": 114.67767000000003, "r": 141.78, "b": 123.45245, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Work Function Usage (", "bbox": {"l": 151.20016, "t": 114.52826000000005, "r": 253.26227000000003, "b": 123.74126999999999, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "WRKFCNUSG", "bbox": {"l": 253.26028, "t": 114.67767000000003, "r": 298.1998, "b": 123.50225999999998, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": ")", "bbox": {"l": 298.20081, "t": 114.52826000000005, "r": 301.51749, "b": 123.74126999999999, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "GLYPH<SM590000>", "bbox": {"l": 136.80099, "t": 126.67749000000003, "r": 141.78099, "b": 135.45227, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Change Function Usage (", "bbox": {"l": 151.20116, "t": 126.52808000000005, "r": 265.13354, "b": 135.74108999999999, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "CHGFCNUSG", "bbox": {"l": 265.08081, "t": 126.67749000000003, "r": 310.02032, "b": 135.50207999999998, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": ")", "bbox": {"l": 310.08109, "t": 126.52808000000005, "r": 313.39777, "b": 135.74108999999999, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "GLYPH<SM590000>", "bbox": {"l": 136.80098, "t": 138.67731000000003, "r": 141.78098, "b": 147.45209, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Display Function Usage (", "bbox": {"l": 151.20114, "t": 138.52788999999996, "r": 262.5639, "b": 147.74090999999999, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "DSPFCNUSG", "bbox": {"l": 262.56091, "t": 138.67731000000003, "r": 307.50043, "b": 147.50189, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": ")", "bbox": {"l": 307.50043, "t": 138.52788999999996, "r": 310.81711, "b": 147.74090999999999, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "For example, the following ", "bbox": {"l": 136.79997, "t": 160.48766999999998, "r": 255.09984000000003, "b": 169.70068000000003, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "CHGFCNUSG", "bbox": {"l": 255.00027, "t": 160.63707999999997, "r": 299.99957, "b": 169.46167000000003, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": " command shows granting authorization to user ", "bbox": {"l": 300.00055, "t": 160.48766999999998, "r": 512.53802, "b": 169.70068000000003, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "HBEDOYA to administer and manage RCAC rules:", "bbox": {"l": 136.80096, "t": 172.48748999999998, "r": 360.41989, "b": 181.70050000000003, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "CHGFCNUSG FCNID(QIBM_DB_SECADM) USER(HBEDOYA) USAGE(*ALLOWED)", "bbox": {"l": 136.80096, "t": 189.67645000000005, "r": 441.59686, "b": 198.45123, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "2.1.7", "bbox": {"l": 64.800003, "t": 219.35468000000003, "r": 93.757614, "b": 231.34271, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Verifying function usage IDs for RCAC with the FUNCTION_USAGE view", "bbox": {"l": 97.377296, "t": 219.35468000000003, "r": 544.47546, "b": 231.34271, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "The FUNCTION_USAGE view contains function usage configuration details. Table 2-1 ", "bbox": {"l": 136.8, "t": 245.50867000000005, "r": 519.51794, "b": 254.72168, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "describes the columns in the FUNCTION_USAGE view.", "bbox": {"l": 136.8, "t": 257.50847999999996, "r": 382.94443, "b": 266.7215, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "Table 2-1 FUNCTION_USAGE view", "bbox": {"l": 136.8, "t": 279.55798000000004, "r": 283.96805, "b": 287.88300000000004, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "To discover who has authorization to define and manage RCAC, you can use the query that is ", "bbox": {"l": 136.8, "t": 452.50872999999996, "r": 547.2804, "b": 461.72171, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "shown in Example 2-1.", "bbox": {"l": 136.8, "t": 464.50854, "r": 237.76951999999997, "b": 473.72153, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Example 2-1 Query to determine who has authority to define and manage RCAC", "bbox": {"l": 136.8, "t": 486.55798, "r": 462.35419, "b": 494.883, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "SELECT", "bbox": {"l": 136.8, "t": 503.65802, "r": 171.26956, "b": 512.4328, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "function_id,", "bbox": {"l": 182.75941, "t": 503.65802, "r": 251.69853, "b": 512.4328, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "user_name,", "bbox": {"l": 166.78244, "t": 515.6578400000001, "r": 241.73852999999997, "b": 524.43262, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "usage,", "bbox": {"l": 170.75961, "t": 527.65765, "r": 221.69901999999996, "b": 536.43242, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "user_type", "bbox": {"l": 167.53809, "t": 539.65747, "r": 236.69878, "b": 548.43222, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "FROM", "bbox": {"l": 136.8, "t": 551.65727, "r": 160.59396, "b": 560.43202, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "function_usage", "bbox": {"l": 178.43944, "t": 551.65727, "r": 261.71829, "b": 560.43202, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "WHERE", "bbox": {"l": 136.8, "t": 563.65707, "r": 162.44176, "b": 572.43182, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "function_id=\u2019QIBM_DB_SECADM\u2019", "bbox": {"l": 177.8268, "t": 563.65707, "r": 331.67731, "b": 572.43182, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "ORDER BY", "bbox": {"l": 136.8, "t": 575.65688, "r": 178.77542, "b": 584.43163, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "user_name;", "bbox": {"l": 189.26929, "t": 575.65688, "r": 241.73856, "b": 584.43163, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "2.2", "bbox": {"l": 64.800003, "t": 620.22063, "r": 87.569839, "b": 634.98363, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "Separation of duties", "bbox": {"l": 92.123802, "t": 620.22063, "r": 249.59605000000002, "b": 634.98363, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Separation of duties helps businesses comply with industry regulations or organizational ", "bbox": {"l": 136.8, "t": 652.54872, "r": 529.09357, "b": 661.76172, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "requirements and simplifies the management of authorities. Separation of duties is commonly ", "bbox": {"l": 136.8, "t": 664.54852, "r": 547.22345, "b": 673.76153, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "used to prevent fraudulent activities or errors by a single person. It provides the ability for ", "bbox": {"l": 136.8, "t": 676.54833, "r": 530.89716, "b": 685.76134, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "administrative functions to be divided across individuals without overlapping responsibilities, ", "bbox": {"l": 136.80002, "t": 688.54814, "r": 544.33832, "b": 697.7611469999999, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "so that one user does not possess unlimited authority, such as with the *ALLOBJ authority.", "bbox": {"l": 136.80002, "t": 700.547951, "r": 536.28363, "b": 709.760956, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Column name", "bbox": {"l": 142.8, "t": 296.5379899999999, "r": 202.245, "b": 304.86301, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "Data type", "bbox": {"l": 216.80878999999996, "t": 296.5379899999999, "r": 257.21069, "b": 304.86301, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Description", "bbox": {"l": 289.47479, "t": 296.5379899999999, "r": 338.89468, "b": 304.86301, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "FUNCTION_ID", "bbox": {"l": 142.8, "t": 315.55771, "r": 203.2323, "b": 323.88272, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "VARCHAR(30)", "bbox": {"l": 216.7854, "t": 315.55771, "r": 276.0036, "b": 323.88272, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "ID of the function.", "bbox": {"l": 289.4577, "t": 315.55771, "r": 359.85394, "b": 323.88272, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "USER_NAME", "bbox": {"l": 142.8, "t": 334.51801, "r": 198.6693, "b": 342.84302, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "VARCHAR(10)", "bbox": {"l": 216.74129999999997, "t": 334.51801, "r": 275.92349, "b": 342.84302, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Name of the user profile that has a usage setting for this ", "bbox": {"l": 289.38208, "t": 334.51801, "r": 515.05359, "b": 342.84302, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "function.", "bbox": {"l": 289.4397, "t": 345.55832, "r": 323.43362, "b": 353.88333, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "USAGE", "bbox": {"l": 142.79999, "t": 364.51862, "r": 173.98318, "b": 372.84363, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "VARCHAR(7)", "bbox": {"l": 216.77367999999998, "t": 364.51862, "r": 270.97977, "b": 372.84363, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Usage setting:", "bbox": {"l": 289.41626, "t": 364.51862, "r": 346.88757, "b": 372.84363, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 375.69394000000005, "r": 293.9397, "b": 383.62292, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "ALLOWED: The user profile is allowed to use the function.", "bbox": {"l": 303.83969, "t": 375.55893, "r": 535.16766, "b": 383.88394, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 386.67395, "r": 293.9397, "b": 394.60294, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "DENIED: The user profile is not allowed to use the function.", "bbox": {"l": 303.83969, "t": 386.53894, "r": 539.10712, "b": 394.86395, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "USER_TYPE", "bbox": {"l": 142.8, "t": 405.55865, "r": 196.2249, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "VARCHAR(5)", "bbox": {"l": 216.75211, "t": 405.55865, "r": 270.99872, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "Type of user profile:", "bbox": {"l": 289.43161, "t": 405.55865, "r": 367.8009, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 416.67368000000005, "r": 293.9397, "b": 424.60266, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "USER: The user profile is a user.", "bbox": {"l": 303.83969, "t": 416.53867, "r": 434.78159, "b": 424.86368, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 427.65369, "r": 293.9397, "b": 435.58267000000006, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "GROUP: The user profile is a group.", "bbox": {"l": 303.83969, "t": 427.51868, "r": 448.11963000000003, "b": 435.84369, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 14, "label": "page_footer", "bbox": {"l": 64.800003, "t": 754.848721, "r": 78.402, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.9166396856307983, "cells": [{"id": 0, "text": "10 ", "bbox": {"l": 64.800003, "t": 754.848721, "r": 78.402, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "page_footer", "bbox": {"l": 93.420303, "t": 755.538002, "r": 334.42142, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9530044198036194, "cells": [{"id": 1, "text": "Row and Column Access Control Support in IBM DB2 for i", "bbox": {"l": 93.420303, "t": 755.538002, "r": 334.42142, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "section_header", "bbox": {"l": 64.800003, "t": 71.33471999999995, "r": 335.49551, "b": 83.32275000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9697521328926086, "cells": [{"id": 2, "text": "2.1.6", "bbox": {"l": 64.800003, "t": 71.33471999999995, "r": 94.081459, "b": 83.32275000000004, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Change Function Usage CL command", "bbox": {"l": 97.741661, "t": 71.33471999999995, "r": 335.49551, "b": 83.32275000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 136.8, "t": 97.48870999999997, "r": 547.28442, "b": 106.70172000000014, "coord_origin": "TOPLEFT"}, "confidence": 0.9551582932472229, "cells": [{"id": 4, "text": "The following CL commands can be used to work with, display, or change function usage IDs:", "bbox": {"l": 136.8, "t": 97.48870999999997, "r": 547.28442, "b": 106.70172000000014, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "list_item", "bbox": {"l": 136.8, "t": 114.52826000000005, "r": 301.51749, "b": 123.74126999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9410832524299622, "cells": [{"id": 5, "text": "GLYPH<SM590000>", "bbox": {"l": 136.8, "t": 114.67767000000003, "r": 141.78, "b": 123.45245, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Work Function Usage (", "bbox": {"l": 151.20016, "t": 114.52826000000005, "r": 253.26227000000003, "b": 123.74126999999999, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "WRKFCNUSG", "bbox": {"l": 253.26028, "t": 114.67767000000003, "r": 298.1998, "b": 123.50225999999998, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": ")", "bbox": {"l": 298.20081, "t": 114.52826000000005, "r": 301.51749, "b": 123.74126999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "list_item", "bbox": {"l": 136.80099, "t": 126.52808000000005, "r": 313.39777, "b": 135.74108999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9418092370033264, "cells": [{"id": 9, "text": "GLYPH<SM590000>", "bbox": {"l": 136.80099, "t": 126.67749000000003, "r": 141.78099, "b": 135.45227, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Change Function Usage (", "bbox": {"l": 151.20116, "t": 126.52808000000005, "r": 265.13354, "b": 135.74108999999999, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "CHGFCNUSG", "bbox": {"l": 265.08081, "t": 126.67749000000003, "r": 310.02032, "b": 135.50207999999998, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": ")", "bbox": {"l": 310.08109, "t": 126.52808000000005, "r": 313.39777, "b": 135.74108999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "list_item", "bbox": {"l": 136.80098, "t": 138.52788999999996, "r": 310.81711, "b": 147.74090999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9562349915504456, "cells": [{"id": 13, "text": "GLYPH<SM590000>", "bbox": {"l": 136.80098, "t": 138.67731000000003, "r": 141.78098, "b": 147.45209, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Display Function Usage (", "bbox": {"l": 151.20114, "t": 138.52788999999996, "r": 262.5639, "b": 147.74090999999999, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "DSPFCNUSG", "bbox": {"l": 262.56091, "t": 138.67731000000003, "r": 307.50043, "b": 147.50189, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": ")", "bbox": {"l": 307.50043, "t": 138.52788999999996, "r": 310.81711, "b": 147.74090999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "text", "bbox": {"l": 136.79997, "t": 160.48766999999998, "r": 512.53802, "b": 181.70050000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9682500958442688, "cells": [{"id": 17, "text": "For example, the following ", "bbox": {"l": 136.79997, "t": 160.48766999999998, "r": 255.09984000000003, "b": 169.70068000000003, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "CHGFCNUSG", "bbox": {"l": 255.00027, "t": 160.63707999999997, "r": 299.99957, "b": 169.46167000000003, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": " command shows granting authorization to user ", "bbox": {"l": 300.00055, "t": 160.48766999999998, "r": 512.53802, "b": 169.70068000000003, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "HBEDOYA to administer and manage RCAC rules:", "bbox": {"l": 136.80096, "t": 172.48748999999998, "r": 360.41989, "b": 181.70050000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 136.80096, "t": 189.67645000000005, "r": 441.59686, "b": 198.45123, "coord_origin": "TOPLEFT"}, "confidence": 0.905712902545929, "cells": [{"id": 21, "text": "CHGFCNUSG FCNID(QIBM_DB_SECADM) USER(HBEDOYA) USAGE(*ALLOWED)", "bbox": {"l": 136.80096, "t": 189.67645000000005, "r": 441.59686, "b": 198.45123, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "section_header", "bbox": {"l": 64.800003, "t": 219.35468000000003, "r": 544.47546, "b": 231.34271, "coord_origin": "TOPLEFT"}, "confidence": 0.9636710286140442, "cells": [{"id": 22, "text": "2.1.7", "bbox": {"l": 64.800003, "t": 219.35468000000003, "r": 93.757614, "b": 231.34271, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Verifying function usage IDs for RCAC with the FUNCTION_USAGE view", "bbox": {"l": 97.377296, "t": 219.35468000000003, "r": 544.47546, "b": 231.34271, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 136.8, "t": 245.50867000000005, "r": 519.51794, "b": 266.7215, "coord_origin": "TOPLEFT"}, "confidence": 0.9737311601638794, "cells": [{"id": 24, "text": "The FUNCTION_USAGE view contains function usage configuration details. Table 2-1 ", "bbox": {"l": 136.8, "t": 245.50867000000005, "r": 519.51794, "b": 254.72168, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "describes the columns in the FUNCTION_USAGE view.", "bbox": {"l": 136.8, "t": 257.50847999999996, "r": 382.94443, "b": 266.7215, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "caption", "bbox": {"l": 136.8, "t": 279.55798000000004, "r": 283.96805, "b": 287.88300000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9196999669075012, "cells": [{"id": 26, "text": "Table 2-1 FUNCTION_USAGE view", "bbox": {"l": 136.8, "t": 279.55798000000004, "r": 283.96805, "b": 287.88300000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "text", "bbox": {"l": 136.8, "t": 452.50872999999996, "r": 547.2804, "b": 473.72153, "coord_origin": "TOPLEFT"}, "confidence": 0.964775562286377, "cells": [{"id": 27, "text": "To discover who has authorization to define and manage RCAC, you can use the query that is ", "bbox": {"l": 136.8, "t": 452.50872999999996, "r": 547.2804, "b": 461.72171, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "shown in Example 2-1.", "bbox": {"l": 136.8, "t": 464.50854, "r": 237.76951999999997, "b": 473.72153, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "caption", "bbox": {"l": 136.8, "t": 486.55798, "r": 462.35419, "b": 494.883, "coord_origin": "TOPLEFT"}, "confidence": 0.8159958720207214, "cells": [{"id": 29, "text": "Example 2-1 Query to determine who has authority to define and manage RCAC", "bbox": {"l": 136.8, "t": 486.55798, "r": 462.35419, "b": 494.883, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "key_value_region", "bbox": {"l": 136.8, "t": 503.65802, "r": 331.67731, "b": 584.43163, "coord_origin": "TOPLEFT"}, "confidence": 0.5808265805244446, "cells": [{"id": 30, "text": "SELECT", "bbox": {"l": 136.8, "t": 503.65802, "r": 171.26956, "b": 512.4328, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "function_id,", "bbox": {"l": 182.75941, "t": 503.65802, "r": 251.69853, "b": 512.4328, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "user_name,", "bbox": {"l": 166.78244, "t": 515.6578400000001, "r": 241.73852999999997, "b": 524.43262, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "usage,", "bbox": {"l": 170.75961, "t": 527.65765, "r": 221.69901999999996, "b": 536.43242, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "user_type", "bbox": {"l": 167.53809, "t": 539.65747, "r": 236.69878, "b": 548.43222, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "FROM", "bbox": {"l": 136.8, "t": 551.65727, "r": 160.59396, "b": 560.43202, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "function_usage", "bbox": {"l": 178.43944, "t": 551.65727, "r": 261.71829, "b": 560.43202, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "WHERE", "bbox": {"l": 136.8, "t": 563.65707, "r": 162.44176, "b": 572.43182, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "function_id=\u2019QIBM_DB_SECADM\u2019", "bbox": {"l": 177.8268, "t": 563.65707, "r": 331.67731, "b": 572.43182, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "ORDER BY", "bbox": {"l": 136.8, "t": 575.65688, "r": 178.77542, "b": 584.43163, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "user_name;", "bbox": {"l": 189.26929, "t": 575.65688, "r": 241.73856, "b": 584.43163, "coord_origin": "TOPLEFT"}}], "children": [{"id": 19, "label": "text", "bbox": {"l": 136.8, "t": 503.65802, "r": 171.26956, "b": 512.4328, "coord_origin": "TOPLEFT"}, "confidence": 0.5631121397018433, "cells": [{"id": 30, "text": "SELECT", "bbox": {"l": 136.8, "t": 503.65802, "r": 171.26956, "b": 512.4328, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 182.75941, "t": 503.65802, "r": 251.69853, "b": 512.4328, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "function_id,", "bbox": {"l": 182.75941, "t": 503.65802, "r": 251.69853, "b": 512.4328, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 166.78244, "t": 515.6578400000001, "r": 241.73852999999997, "b": 524.43262, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "user_name,", "bbox": {"l": 166.78244, "t": 515.6578400000001, "r": 241.73852999999997, "b": 524.43262, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 170.75961, "t": 527.65765, "r": 221.69901999999996, "b": 536.43242, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "usage,", "bbox": {"l": 170.75961, "t": 527.65765, "r": 221.69901999999996, "b": 536.43242, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 167.53809, "t": 539.65747, "r": 236.69878, "b": 548.43222, "coord_origin": "TOPLEFT"}, "confidence": 0.5346826314926147, "cells": [{"id": 34, "text": "user_type", "bbox": {"l": 167.53809, "t": 539.65747, "r": 236.69878, "b": 548.43222, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 136.8, "t": 551.65727, "r": 160.59396, "b": 560.43202, "coord_origin": "TOPLEFT"}, "confidence": 0.581838846206665, "cells": [{"id": 35, "text": "FROM", "bbox": {"l": 136.8, "t": 551.65727, "r": 160.59396, "b": 560.43202, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 178.43944, "t": 551.65727, "r": 261.71829, "b": 560.43202, "coord_origin": "TOPLEFT"}, "confidence": 0.5035740733146667, "cells": [{"id": 36, "text": "function_usage", "bbox": {"l": 178.43944, "t": 551.65727, "r": 261.71829, "b": 560.43202, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 136.8, "t": 563.65707, "r": 162.44176, "b": 572.43182, "coord_origin": "TOPLEFT"}, "confidence": 0.534027099609375, "cells": [{"id": 37, "text": "WHERE", "bbox": {"l": 136.8, "t": 563.65707, "r": 162.44176, "b": 572.43182, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 177.8268, "t": 563.65707, "r": 331.67731, "b": 572.43182, "coord_origin": "TOPLEFT"}, "confidence": 0.5171723365783691, "cells": [{"id": 38, "text": "function_id=\u2019QIBM_DB_SECADM\u2019", "bbox": {"l": 177.8268, "t": 563.65707, "r": 331.67731, "b": 572.43182, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 136.8, "t": 575.65688, "r": 178.77542, "b": 584.43163, "coord_origin": "TOPLEFT"}, "confidence": 0.5373470187187195, "cells": [{"id": 39, "text": "ORDER BY", "bbox": {"l": 136.8, "t": 575.65688, "r": 178.77542, "b": 584.43163, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 189.26929, "t": 575.65688, "r": 241.73856, "b": 584.43163, "coord_origin": "TOPLEFT"}, "confidence": 0.5167025327682495, "cells": [{"id": 40, "text": "user_name;", "bbox": {"l": 189.26929, "t": 575.65688, "r": 241.73856, "b": 584.43163, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 5, "label": "section_header", "bbox": {"l": 64.800003, "t": 620.22063, "r": 249.59605000000002, "b": 634.98363, "coord_origin": "TOPLEFT"}, "confidence": 0.9656105041503906, "cells": [{"id": 41, "text": "2.2", "bbox": {"l": 64.800003, "t": 620.22063, "r": 87.569839, "b": 634.98363, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "Separation of duties", "bbox": {"l": 92.123802, "t": 620.22063, "r": 249.59605000000002, "b": 634.98363, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 136.8, "t": 652.54872, "r": 547.22345, "b": 709.760956, "coord_origin": "TOPLEFT"}, "confidence": 0.9853070974349976, "cells": [{"id": 43, "text": "Separation of duties helps businesses comply with industry regulations or organizational ", "bbox": {"l": 136.8, "t": 652.54872, "r": 529.09357, "b": 661.76172, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "requirements and simplifies the management of authorities. Separation of duties is commonly ", "bbox": {"l": 136.8, "t": 664.54852, "r": 547.22345, "b": 673.76153, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "used to prevent fraudulent activities or errors by a single person. It provides the ability for ", "bbox": {"l": 136.8, "t": 676.54833, "r": 530.89716, "b": 685.76134, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "administrative functions to be divided across individuals without overlapping responsibilities, ", "bbox": {"l": 136.80002, "t": 688.54814, "r": 544.33832, "b": 697.7611469999999, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "so that one user does not possess unlimited authority, such as with the *ALLOBJ authority.", "bbox": {"l": 136.80002, "t": 700.547951, "r": 536.28363, "b": 709.760956, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "table", "bbox": {"l": 135.52462768554688, "t": 289.7252197265625, "r": 545.8714599609375, "b": 442.050537109375, "coord_origin": "TOPLEFT"}, "confidence": 0.9851690530776978, "cells": [{"id": 48, "text": "Column name", "bbox": {"l": 142.8, "t": 296.5379899999999, "r": 202.245, "b": 304.86301, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "Data type", "bbox": {"l": 216.80878999999996, "t": 296.5379899999999, "r": 257.21069, "b": 304.86301, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Description", "bbox": {"l": 289.47479, "t": 296.5379899999999, "r": 338.89468, "b": 304.86301, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "FUNCTION_ID", "bbox": {"l": 142.8, "t": 315.55771, "r": 203.2323, "b": 323.88272, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "VARCHAR(30)", "bbox": {"l": 216.7854, "t": 315.55771, "r": 276.0036, "b": 323.88272, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "ID of the function.", "bbox": {"l": 289.4577, "t": 315.55771, "r": 359.85394, "b": 323.88272, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "USER_NAME", "bbox": {"l": 142.8, "t": 334.51801, "r": 198.6693, "b": 342.84302, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "VARCHAR(10)", "bbox": {"l": 216.74129999999997, "t": 334.51801, "r": 275.92349, "b": 342.84302, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Name of the user profile that has a usage setting for this ", "bbox": {"l": 289.38208, "t": 334.51801, "r": 515.05359, "b": 342.84302, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "function.", "bbox": {"l": 289.4397, "t": 345.55832, "r": 323.43362, "b": 353.88333, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "USAGE", "bbox": {"l": 142.79999, "t": 364.51862, "r": 173.98318, "b": 372.84363, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "VARCHAR(7)", "bbox": {"l": 216.77367999999998, "t": 364.51862, "r": 270.97977, "b": 372.84363, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Usage setting:", "bbox": {"l": 289.41626, "t": 364.51862, "r": 346.88757, "b": 372.84363, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 375.69394000000005, "r": 293.9397, "b": 383.62292, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "ALLOWED: The user profile is allowed to use the function.", "bbox": {"l": 303.83969, "t": 375.55893, "r": 535.16766, "b": 383.88394, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 386.67395, "r": 293.9397, "b": 394.60294, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "DENIED: The user profile is not allowed to use the function.", "bbox": {"l": 303.83969, "t": 386.53894, "r": 539.10712, "b": 394.86395, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "USER_TYPE", "bbox": {"l": 142.8, "t": 405.55865, "r": 196.2249, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "VARCHAR(5)", "bbox": {"l": 216.75211, "t": 405.55865, "r": 270.99872, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "Type of user profile:", "bbox": {"l": 289.43161, "t": 405.55865, "r": 367.8009, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 416.67368000000005, "r": 293.9397, "b": 424.60266, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "USER: The user profile is a user.", "bbox": {"l": 303.83969, "t": 416.53867, "r": 434.78159, "b": 424.86368, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 427.65369, "r": 293.9397, "b": 435.58267000000006, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "GROUP: The user profile is a group.", "bbox": {"l": 303.83969, "t": 427.51868, "r": 448.11963000000003, "b": 435.84369, "coord_origin": "TOPLEFT"}}], "children": [{"id": 31, "label": "text", "bbox": {"l": 142.8, "t": 296.5379899999999, "r": 202.245, "b": 304.86301, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "Column name", "bbox": {"l": 142.8, "t": 296.5379899999999, "r": 202.245, "b": 304.86301, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 216.80878999999996, "t": 296.5379899999999, "r": 257.21069, "b": 304.86301, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "Data type", "bbox": {"l": 216.80878999999996, "t": 296.5379899999999, "r": 257.21069, "b": 304.86301, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 289.47479, "t": 296.5379899999999, "r": 338.89468, "b": 304.86301, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "Description", "bbox": {"l": 289.47479, "t": 296.5379899999999, "r": 338.89468, "b": 304.86301, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 142.8, "t": 315.55771, "r": 203.2323, "b": 323.88272, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "FUNCTION_ID", "bbox": {"l": 142.8, "t": 315.55771, "r": 203.2323, "b": 323.88272, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 216.7854, "t": 315.55771, "r": 276.0036, "b": 323.88272, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "VARCHAR(30)", "bbox": {"l": 216.7854, "t": 315.55771, "r": 276.0036, "b": 323.88272, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 289.4577, "t": 315.55771, "r": 359.85394, "b": 323.88272, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "ID of the function.", "bbox": {"l": 289.4577, "t": 315.55771, "r": 359.85394, "b": 323.88272, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 142.8, "t": 334.51801, "r": 198.6693, "b": 342.84302, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "USER_NAME", "bbox": {"l": 142.8, "t": 334.51801, "r": 198.6693, "b": 342.84302, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 216.74129999999997, "t": 334.51801, "r": 275.92349, "b": 342.84302, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "VARCHAR(10)", "bbox": {"l": 216.74129999999997, "t": 334.51801, "r": 275.92349, "b": 342.84302, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 289.38208, "t": 334.51801, "r": 515.05359, "b": 342.84302, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "Name of the user profile that has a usage setting for this ", "bbox": {"l": 289.38208, "t": 334.51801, "r": 515.05359, "b": 342.84302, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 289.4397, "t": 345.55832, "r": 323.43362, "b": 353.88333, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "function.", "bbox": {"l": 289.4397, "t": 345.55832, "r": 323.43362, "b": 353.88333, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 142.79999, "t": 364.51862, "r": 173.98318, "b": 372.84363, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "USAGE", "bbox": {"l": 142.79999, "t": 364.51862, "r": 173.98318, "b": 372.84363, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 216.77367999999998, "t": 364.51862, "r": 270.97977, "b": 372.84363, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "VARCHAR(7)", "bbox": {"l": 216.77367999999998, "t": 364.51862, "r": 270.97977, "b": 372.84363, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 289.41626, "t": 364.51862, "r": 346.88757, "b": 372.84363, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "Usage setting:", "bbox": {"l": 289.41626, "t": 364.51862, "r": 346.88757, "b": 372.84363, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 289.4397, "t": 375.69394000000005, "r": 293.9397, "b": 383.62292, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 375.69394000000005, "r": 293.9397, "b": 383.62292, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 303.83969, "t": 375.55893, "r": 535.16766, "b": 383.88394, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "ALLOWED: The user profile is allowed to use the function.", "bbox": {"l": 303.83969, "t": 375.55893, "r": 535.16766, "b": 383.88394, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 289.4397, "t": 386.67395, "r": 293.9397, "b": 394.60294, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 386.67395, "r": 293.9397, "b": 394.60294, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 303.83969, "t": 386.53894, "r": 539.10712, "b": 394.86395, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "DENIED: The user profile is not allowed to use the function.", "bbox": {"l": 303.83969, "t": 386.53894, "r": 539.10712, "b": 394.86395, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 142.8, "t": 405.55865, "r": 196.2249, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "USER_TYPE", "bbox": {"l": 142.8, "t": 405.55865, "r": 196.2249, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 216.75211, "t": 405.55865, "r": 270.99872, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "VARCHAR(5)", "bbox": {"l": 216.75211, "t": 405.55865, "r": 270.99872, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 289.43161, "t": 405.55865, "r": 367.8009, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "Type of user profile:", "bbox": {"l": 289.43161, "t": 405.55865, "r": 367.8009, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 289.4397, "t": 416.67368000000005, "r": 293.9397, "b": 424.60266, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 416.67368000000005, "r": 293.9397, "b": 424.60266, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 303.83969, "t": 416.53867, "r": 434.78159, "b": 424.86368, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "USER: The user profile is a user.", "bbox": {"l": 303.83969, "t": 416.53867, "r": 434.78159, "b": 424.86368, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 289.4397, "t": 427.65369, "r": 293.9397, "b": 435.58267000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 427.65369, "r": 293.9397, "b": 435.58267000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 303.83969, "t": 427.51868, "r": 448.11963000000003, "b": 435.84369, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "GROUP: The user profile is a group.", "bbox": {"l": 303.83969, "t": 427.51868, "r": 448.11963000000003, "b": 435.84369, "coord_origin": "TOPLEFT"}}], "children": []}]}]}, "tablestructure": {"table_map": {"1": {"label": "table", "id": 1, "page_no": 7, "cluster": {"id": 1, "label": "table", "bbox": {"l": 135.52462768554688, "t": 289.7252197265625, "r": 545.8714599609375, "b": 442.050537109375, "coord_origin": "TOPLEFT"}, "confidence": 0.9851690530776978, "cells": [{"id": 48, "text": "Column name", "bbox": {"l": 142.8, "t": 296.5379899999999, "r": 202.245, "b": 304.86301, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "Data type", "bbox": {"l": 216.80878999999996, "t": 296.5379899999999, "r": 257.21069, "b": 304.86301, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Description", "bbox": {"l": 289.47479, "t": 296.5379899999999, "r": 338.89468, "b": 304.86301, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "FUNCTION_ID", "bbox": {"l": 142.8, "t": 315.55771, "r": 203.2323, "b": 323.88272, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "VARCHAR(30)", "bbox": {"l": 216.7854, "t": 315.55771, "r": 276.0036, "b": 323.88272, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "ID of the function.", "bbox": {"l": 289.4577, "t": 315.55771, "r": 359.85394, "b": 323.88272, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "USER_NAME", "bbox": {"l": 142.8, "t": 334.51801, "r": 198.6693, "b": 342.84302, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "VARCHAR(10)", "bbox": {"l": 216.74129999999997, "t": 334.51801, "r": 275.92349, "b": 342.84302, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Name of the user profile that has a usage setting for this ", "bbox": {"l": 289.38208, "t": 334.51801, "r": 515.05359, "b": 342.84302, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "function.", "bbox": {"l": 289.4397, "t": 345.55832, "r": 323.43362, "b": 353.88333, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "USAGE", "bbox": {"l": 142.79999, "t": 364.51862, "r": 173.98318, "b": 372.84363, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "VARCHAR(7)", "bbox": {"l": 216.77367999999998, "t": 364.51862, "r": 270.97977, "b": 372.84363, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Usage setting:", "bbox": {"l": 289.41626, "t": 364.51862, "r": 346.88757, "b": 372.84363, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 375.69394000000005, "r": 293.9397, "b": 383.62292, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "ALLOWED: The user profile is allowed to use the function.", "bbox": {"l": 303.83969, "t": 375.55893, "r": 535.16766, "b": 383.88394, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 386.67395, "r": 293.9397, "b": 394.60294, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "DENIED: The user profile is not allowed to use the function.", "bbox": {"l": 303.83969, "t": 386.53894, "r": 539.10712, "b": 394.86395, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "USER_TYPE", "bbox": {"l": 142.8, "t": 405.55865, "r": 196.2249, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "VARCHAR(5)", "bbox": {"l": 216.75211, "t": 405.55865, "r": 270.99872, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "Type of user profile:", "bbox": {"l": 289.43161, "t": 405.55865, "r": 367.8009, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 416.67368000000005, "r": 293.9397, "b": 424.60266, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "USER: The user profile is a user.", "bbox": {"l": 303.83969, "t": 416.53867, "r": 434.78159, "b": 424.86368, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 427.65369, "r": 293.9397, "b": 435.58267000000006, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "GROUP: The user profile is a group.", "bbox": {"l": 303.83969, "t": 427.51868, "r": 448.11963000000003, "b": 435.84369, "coord_origin": "TOPLEFT"}}], "children": [{"id": 31, "label": "text", "bbox": {"l": 142.8, "t": 296.5379899999999, "r": 202.245, "b": 304.86301, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "Column name", "bbox": {"l": 142.8, "t": 296.5379899999999, "r": 202.245, "b": 304.86301, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 216.80878999999996, "t": 296.5379899999999, "r": 257.21069, "b": 304.86301, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "Data type", "bbox": {"l": 216.80878999999996, "t": 296.5379899999999, "r": 257.21069, "b": 304.86301, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 289.47479, "t": 296.5379899999999, "r": 338.89468, "b": 304.86301, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "Description", "bbox": {"l": 289.47479, "t": 296.5379899999999, "r": 338.89468, "b": 304.86301, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 142.8, "t": 315.55771, "r": 203.2323, "b": 323.88272, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "FUNCTION_ID", "bbox": {"l": 142.8, "t": 315.55771, "r": 203.2323, "b": 323.88272, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 216.7854, "t": 315.55771, "r": 276.0036, "b": 323.88272, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "VARCHAR(30)", "bbox": {"l": 216.7854, "t": 315.55771, "r": 276.0036, "b": 323.88272, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 289.4577, "t": 315.55771, "r": 359.85394, "b": 323.88272, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "ID of the function.", "bbox": {"l": 289.4577, "t": 315.55771, "r": 359.85394, "b": 323.88272, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 142.8, "t": 334.51801, "r": 198.6693, "b": 342.84302, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "USER_NAME", "bbox": {"l": 142.8, "t": 334.51801, "r": 198.6693, "b": 342.84302, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 216.74129999999997, "t": 334.51801, "r": 275.92349, "b": 342.84302, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "VARCHAR(10)", "bbox": {"l": 216.74129999999997, "t": 334.51801, "r": 275.92349, "b": 342.84302, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 289.38208, "t": 334.51801, "r": 515.05359, "b": 342.84302, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "Name of the user profile that has a usage setting for this ", "bbox": {"l": 289.38208, "t": 334.51801, "r": 515.05359, "b": 342.84302, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 289.4397, "t": 345.55832, "r": 323.43362, "b": 353.88333, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "function.", "bbox": {"l": 289.4397, "t": 345.55832, "r": 323.43362, "b": 353.88333, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 142.79999, "t": 364.51862, "r": 173.98318, "b": 372.84363, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "USAGE", "bbox": {"l": 142.79999, "t": 364.51862, "r": 173.98318, "b": 372.84363, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 216.77367999999998, "t": 364.51862, "r": 270.97977, "b": 372.84363, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "VARCHAR(7)", "bbox": {"l": 216.77367999999998, "t": 364.51862, "r": 270.97977, "b": 372.84363, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 289.41626, "t": 364.51862, "r": 346.88757, "b": 372.84363, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "Usage setting:", "bbox": {"l": 289.41626, "t": 364.51862, "r": 346.88757, "b": 372.84363, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 289.4397, "t": 375.69394000000005, "r": 293.9397, "b": 383.62292, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 375.69394000000005, "r": 293.9397, "b": 383.62292, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 303.83969, "t": 375.55893, "r": 535.16766, "b": 383.88394, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "ALLOWED: The user profile is allowed to use the function.", "bbox": {"l": 303.83969, "t": 375.55893, "r": 535.16766, "b": 383.88394, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 289.4397, "t": 386.67395, "r": 293.9397, "b": 394.60294, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 386.67395, "r": 293.9397, "b": 394.60294, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 303.83969, "t": 386.53894, "r": 539.10712, "b": 394.86395, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "DENIED: The user profile is not allowed to use the function.", "bbox": {"l": 303.83969, "t": 386.53894, "r": 539.10712, "b": 394.86395, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 142.8, "t": 405.55865, "r": 196.2249, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "USER_TYPE", "bbox": {"l": 142.8, "t": 405.55865, "r": 196.2249, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 216.75211, "t": 405.55865, "r": 270.99872, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "VARCHAR(5)", "bbox": {"l": 216.75211, "t": 405.55865, "r": 270.99872, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 289.43161, "t": 405.55865, "r": 367.8009, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "Type of user profile:", "bbox": {"l": 289.43161, "t": 405.55865, "r": 367.8009, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 289.4397, "t": 416.67368000000005, "r": 293.9397, "b": 424.60266, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 416.67368000000005, "r": 293.9397, "b": 424.60266, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 303.83969, "t": 416.53867, "r": 434.78159, "b": 424.86368, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "USER: The user profile is a user.", "bbox": {"l": 303.83969, "t": 416.53867, "r": 434.78159, "b": 424.86368, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 289.4397, "t": 427.65369, "r": 293.9397, "b": 435.58267000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 427.65369, "r": 293.9397, "b": 435.58267000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 303.83969, "t": 427.51868, "r": 448.11963000000003, "b": 435.84369, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "GROUP: The user profile is a group.", "bbox": {"l": 303.83969, "t": 427.51868, "r": 448.11963000000003, "b": 435.84369, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl"], "num_rows": 5, "num_cols": 3, "table_cells": [{"bbox": {"l": 142.8, "t": 296.5379899999999, "r": 202.245, "b": 304.86301, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Column name", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 216.80878999999996, "t": 296.5379899999999, "r": 257.21069, "b": 304.86301, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Data type", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 289.47479, "t": 296.5379899999999, "r": 338.89468, "b": 304.86301, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Description", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 142.8, "t": 315.55771, "r": 203.2323, "b": 323.88272, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "FUNCTION_ID", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 216.7854, "t": 315.55771, "r": 276.0036, "b": 323.88272, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(30)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.4577, "t": 315.55771, "r": 359.85394, "b": 323.88272, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "ID of the function.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 142.8, "t": 334.51801, "r": 198.6693, "b": 342.84302, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "USER_NAME", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 216.74129999999997, "t": 334.51801, "r": 275.92349, "b": 342.84302, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(10)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.38208, "t": 334.51801, "r": 515.05359, "b": 353.88333, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Name of the user profile that has a usage setting for this  function.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 142.79999, "t": 364.51862, "r": 173.98318, "b": 372.84363, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "USAGE", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 216.77367999999998, "t": 364.51862, "r": 270.97977, "b": 372.84363, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(7)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.41626, "t": 364.51862, "r": 539.10712, "b": 394.86395, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Usage setting: GLYPH<SM590000> ALLOWED: The user profile is allowed to use the function. GLYPH<SM590000> DENIED: The user profile is not allowed to use the function.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 142.8, "t": 405.55865, "r": 196.2249, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "USER_TYPE", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 216.75211, "t": 405.55865, "r": 270.99872, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(5)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.43161, "t": 405.55865, "r": 448.11963000000003, "b": 435.84369, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Type of user profile: GLYPH<SM590000> USER: The user profile is a user. GLYPH<SM590000> GROUP: The user profile is a group.", "column_header": false, "row_header": false, "row_section": false}]}}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_footer", "id": 14, "page_no": 7, "cluster": {"id": 14, "label": "page_footer", "bbox": {"l": 64.800003, "t": 754.848721, "r": 78.402, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.9166396856307983, "cells": [{"id": 0, "text": "10 ", "bbox": {"l": 64.800003, "t": 754.848721, "r": 78.402, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "10"}, {"label": "page_footer", "id": 10, "page_no": 7, "cluster": {"id": 10, "label": "page_footer", "bbox": {"l": 93.420303, "t": 755.538002, "r": 334.42142, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9530044198036194, "cells": [{"id": 1, "text": "Row and Column Access Control Support in IBM DB2 for i", "bbox": {"l": 93.420303, "t": 755.538002, "r": 334.42142, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Row and Column Access Control Support in IBM DB2 for i"}, {"label": "section_header", "id": 3, "page_no": 7, "cluster": {"id": 3, "label": "section_header", "bbox": {"l": 64.800003, "t": 71.33471999999995, "r": 335.49551, "b": 83.32275000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9697521328926086, "cells": [{"id": 2, "text": "2.1.6", "bbox": {"l": 64.800003, "t": 71.33471999999995, "r": 94.081459, "b": 83.32275000000004, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Change Function Usage CL command", "bbox": {"l": 97.741661, "t": 71.33471999999995, "r": 335.49551, "b": 83.32275000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2.1.6 Change Function Usage CL command"}, {"label": "text", "id": 9, "page_no": 7, "cluster": {"id": 9, "label": "text", "bbox": {"l": 136.8, "t": 97.48870999999997, "r": 547.28442, "b": 106.70172000000014, "coord_origin": "TOPLEFT"}, "confidence": 0.9551582932472229, "cells": [{"id": 4, "text": "The following CL commands can be used to work with, display, or change function usage IDs:", "bbox": {"l": 136.8, "t": 97.48870999999997, "r": 547.28442, "b": 106.70172000000014, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The following CL commands can be used to work with, display, or change function usage IDs:"}, {"label": "list_item", "id": 12, "page_no": 7, "cluster": {"id": 12, "label": "list_item", "bbox": {"l": 136.8, "t": 114.52826000000005, "r": 301.51749, "b": 123.74126999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9410832524299622, "cells": [{"id": 5, "text": "GLYPH<SM590000>", "bbox": {"l": 136.8, "t": 114.67767000000003, "r": 141.78, "b": 123.45245, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Work Function Usage (", "bbox": {"l": 151.20016, "t": 114.52826000000005, "r": 253.26227000000003, "b": 123.74126999999999, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "WRKFCNUSG", "bbox": {"l": 253.26028, "t": 114.67767000000003, "r": 298.1998, "b": 123.50225999999998, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": ")", "bbox": {"l": 298.20081, "t": 114.52826000000005, "r": 301.51749, "b": 123.74126999999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<SM590000> Work Function Usage ( WRKFCNUSG )"}, {"label": "list_item", "id": 11, "page_no": 7, "cluster": {"id": 11, "label": "list_item", "bbox": {"l": 136.80099, "t": 126.52808000000005, "r": 313.39777, "b": 135.74108999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9418092370033264, "cells": [{"id": 9, "text": "GLYPH<SM590000>", "bbox": {"l": 136.80099, "t": 126.67749000000003, "r": 141.78099, "b": 135.45227, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Change Function Usage (", "bbox": {"l": 151.20116, "t": 126.52808000000005, "r": 265.13354, "b": 135.74108999999999, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "CHGFCNUSG", "bbox": {"l": 265.08081, "t": 126.67749000000003, "r": 310.02032, "b": 135.50207999999998, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": ")", "bbox": {"l": 310.08109, "t": 126.52808000000005, "r": 313.39777, "b": 135.74108999999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<SM590000> Change Function Usage ( CHGFCNUSG )"}, {"label": "list_item", "id": 8, "page_no": 7, "cluster": {"id": 8, "label": "list_item", "bbox": {"l": 136.80098, "t": 138.52788999999996, "r": 310.81711, "b": 147.74090999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9562349915504456, "cells": [{"id": 13, "text": "GLYPH<SM590000>", "bbox": {"l": 136.80098, "t": 138.67731000000003, "r": 141.78098, "b": 147.45209, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Display Function Usage (", "bbox": {"l": 151.20114, "t": 138.52788999999996, "r": 262.5639, "b": 147.74090999999999, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "DSPFCNUSG", "bbox": {"l": 262.56091, "t": 138.67731000000003, "r": 307.50043, "b": 147.50189, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": ")", "bbox": {"l": 307.50043, "t": 138.52788999999996, "r": 310.81711, "b": 147.74090999999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<SM590000> Display Function Usage ( DSPFCNUSG )"}, {"label": "text", "id": 4, "page_no": 7, "cluster": {"id": 4, "label": "text", "bbox": {"l": 136.79997, "t": 160.48766999999998, "r": 512.53802, "b": 181.70050000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9682500958442688, "cells": [{"id": 17, "text": "For example, the following ", "bbox": {"l": 136.79997, "t": 160.48766999999998, "r": 255.09984000000003, "b": 169.70068000000003, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "CHGFCNUSG", "bbox": {"l": 255.00027, "t": 160.63707999999997, "r": 299.99957, "b": 169.46167000000003, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": " command shows granting authorization to user ", "bbox": {"l": 300.00055, "t": 160.48766999999998, "r": 512.53802, "b": 169.70068000000003, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "HBEDOYA to administer and manage RCAC rules:", "bbox": {"l": 136.80096, "t": 172.48748999999998, "r": 360.41989, "b": 181.70050000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "For example, the following CHGFCNUSG command shows granting authorization to user HBEDOYA to administer and manage RCAC rules:"}, {"label": "text", "id": 15, "page_no": 7, "cluster": {"id": 15, "label": "text", "bbox": {"l": 136.80096, "t": 189.67645000000005, "r": 441.59686, "b": 198.45123, "coord_origin": "TOPLEFT"}, "confidence": 0.905712902545929, "cells": [{"id": 21, "text": "CHGFCNUSG FCNID(QIBM_DB_SECADM) USER(HBEDOYA) USAGE(*ALLOWED)", "bbox": {"l": 136.80096, "t": 189.67645000000005, "r": 441.59686, "b": 198.45123, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "CHGFCNUSG FCNID(QIBM_DB_SECADM) USER(HBEDOYA) USAGE(*ALLOWED)"}, {"label": "section_header", "id": 7, "page_no": 7, "cluster": {"id": 7, "label": "section_header", "bbox": {"l": 64.800003, "t": 219.35468000000003, "r": 544.47546, "b": 231.34271, "coord_origin": "TOPLEFT"}, "confidence": 0.9636710286140442, "cells": [{"id": 22, "text": "2.1.7", "bbox": {"l": 64.800003, "t": 219.35468000000003, "r": 93.757614, "b": 231.34271, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Verifying function usage IDs for RCAC with the FUNCTION_USAGE view", "bbox": {"l": 97.377296, "t": 219.35468000000003, "r": 544.47546, "b": 231.34271, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2.1.7 Verifying function usage IDs for RCAC with the FUNCTION_USAGE view"}, {"label": "text", "id": 2, "page_no": 7, "cluster": {"id": 2, "label": "text", "bbox": {"l": 136.8, "t": 245.50867000000005, "r": 519.51794, "b": 266.7215, "coord_origin": "TOPLEFT"}, "confidence": 0.9737311601638794, "cells": [{"id": 24, "text": "The FUNCTION_USAGE view contains function usage configuration details. Table 2-1 ", "bbox": {"l": 136.8, "t": 245.50867000000005, "r": 519.51794, "b": 254.72168, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "describes the columns in the FUNCTION_USAGE view.", "bbox": {"l": 136.8, "t": 257.50847999999996, "r": 382.94443, "b": 266.7215, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The FUNCTION_USAGE view contains function usage configuration details. Table 2-1 describes the columns in the FUNCTION_USAGE view."}, {"label": "caption", "id": 13, "page_no": 7, "cluster": {"id": 13, "label": "caption", "bbox": {"l": 136.8, "t": 279.55798000000004, "r": 283.96805, "b": 287.88300000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9196999669075012, "cells": [{"id": 26, "text": "Table 2-1 FUNCTION_USAGE view", "bbox": {"l": 136.8, "t": 279.55798000000004, "r": 283.96805, "b": 287.88300000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 2-1 FUNCTION_USAGE view"}, {"label": "text", "id": 6, "page_no": 7, "cluster": {"id": 6, "label": "text", "bbox": {"l": 136.8, "t": 452.50872999999996, "r": 547.2804, "b": 473.72153, "coord_origin": "TOPLEFT"}, "confidence": 0.964775562286377, "cells": [{"id": 27, "text": "To discover who has authorization to define and manage RCAC, you can use the query that is ", "bbox": {"l": 136.8, "t": 452.50872999999996, "r": 547.2804, "b": 461.72171, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "shown in Example 2-1.", "bbox": {"l": 136.8, "t": 464.50854, "r": 237.76951999999997, "b": 473.72153, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "To discover who has authorization to define and manage RCAC, you can use the query that is shown in Example 2-1."}, {"label": "caption", "id": 16, "page_no": 7, "cluster": {"id": 16, "label": "caption", "bbox": {"l": 136.8, "t": 486.55798, "r": 462.35419, "b": 494.883, "coord_origin": "TOPLEFT"}, "confidence": 0.8159958720207214, "cells": [{"id": 29, "text": "Example 2-1 Query to determine who has authority to define and manage RCAC", "bbox": {"l": 136.8, "t": 486.55798, "r": 462.35419, "b": 494.883, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Example 2-1 Query to determine who has authority to define and manage RCAC"}, {"label": "key_value_region", "id": 18, "page_no": 7, "cluster": {"id": 18, "label": "key_value_region", "bbox": {"l": 136.8, "t": 503.65802, "r": 331.67731, "b": 584.43163, "coord_origin": "TOPLEFT"}, "confidence": 0.5808265805244446, "cells": [{"id": 30, "text": "SELECT", "bbox": {"l": 136.8, "t": 503.65802, "r": 171.26956, "b": 512.4328, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "function_id,", "bbox": {"l": 182.75941, "t": 503.65802, "r": 251.69853, "b": 512.4328, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "user_name,", "bbox": {"l": 166.78244, "t": 515.6578400000001, "r": 241.73852999999997, "b": 524.43262, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "usage,", "bbox": {"l": 170.75961, "t": 527.65765, "r": 221.69901999999996, "b": 536.43242, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "user_type", "bbox": {"l": 167.53809, "t": 539.65747, "r": 236.69878, "b": 548.43222, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "FROM", "bbox": {"l": 136.8, "t": 551.65727, "r": 160.59396, "b": 560.43202, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "function_usage", "bbox": {"l": 178.43944, "t": 551.65727, "r": 261.71829, "b": 560.43202, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "WHERE", "bbox": {"l": 136.8, "t": 563.65707, "r": 162.44176, "b": 572.43182, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "function_id=\u2019QIBM_DB_SECADM\u2019", "bbox": {"l": 177.8268, "t": 563.65707, "r": 331.67731, "b": 572.43182, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "ORDER BY", "bbox": {"l": 136.8, "t": 575.65688, "r": 178.77542, "b": 584.43163, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "user_name;", "bbox": {"l": 189.26929, "t": 575.65688, "r": 241.73856, "b": 584.43163, "coord_origin": "TOPLEFT"}}], "children": [{"id": 19, "label": "text", "bbox": {"l": 136.8, "t": 503.65802, "r": 171.26956, "b": 512.4328, "coord_origin": "TOPLEFT"}, "confidence": 0.5631121397018433, "cells": [{"id": 30, "text": "SELECT", "bbox": {"l": 136.8, "t": 503.65802, "r": 171.26956, "b": 512.4328, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 182.75941, "t": 503.65802, "r": 251.69853, "b": 512.4328, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "function_id,", "bbox": {"l": 182.75941, "t": 503.65802, "r": 251.69853, "b": 512.4328, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 166.78244, "t": 515.6578400000001, "r": 241.73852999999997, "b": 524.43262, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "user_name,", "bbox": {"l": 166.78244, "t": 515.6578400000001, "r": 241.73852999999997, "b": 524.43262, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 170.75961, "t": 527.65765, "r": 221.69901999999996, "b": 536.43242, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "usage,", "bbox": {"l": 170.75961, "t": 527.65765, "r": 221.69901999999996, "b": 536.43242, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 167.53809, "t": 539.65747, "r": 236.69878, "b": 548.43222, "coord_origin": "TOPLEFT"}, "confidence": 0.5346826314926147, "cells": [{"id": 34, "text": "user_type", "bbox": {"l": 167.53809, "t": 539.65747, "r": 236.69878, "b": 548.43222, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 136.8, "t": 551.65727, "r": 160.59396, "b": 560.43202, "coord_origin": "TOPLEFT"}, "confidence": 0.581838846206665, "cells": [{"id": 35, "text": "FROM", "bbox": {"l": 136.8, "t": 551.65727, "r": 160.59396, "b": 560.43202, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 178.43944, "t": 551.65727, "r": 261.71829, "b": 560.43202, "coord_origin": "TOPLEFT"}, "confidence": 0.5035740733146667, "cells": [{"id": 36, "text": "function_usage", "bbox": {"l": 178.43944, "t": 551.65727, "r": 261.71829, "b": 560.43202, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 136.8, "t": 563.65707, "r": 162.44176, "b": 572.43182, "coord_origin": "TOPLEFT"}, "confidence": 0.534027099609375, "cells": [{"id": 37, "text": "WHERE", "bbox": {"l": 136.8, "t": 563.65707, "r": 162.44176, "b": 572.43182, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 177.8268, "t": 563.65707, "r": 331.67731, "b": 572.43182, "coord_origin": "TOPLEFT"}, "confidence": 0.5171723365783691, "cells": [{"id": 38, "text": "function_id=\u2019QIBM_DB_SECADM\u2019", "bbox": {"l": 177.8268, "t": 563.65707, "r": 331.67731, "b": 572.43182, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 136.8, "t": 575.65688, "r": 178.77542, "b": 584.43163, "coord_origin": "TOPLEFT"}, "confidence": 0.5373470187187195, "cells": [{"id": 39, "text": "ORDER BY", "bbox": {"l": 136.8, "t": 575.65688, "r": 178.77542, "b": 584.43163, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 189.26929, "t": 575.65688, "r": 241.73856, "b": 584.43163, "coord_origin": "TOPLEFT"}, "confidence": 0.5167025327682495, "cells": [{"id": 40, "text": "user_name;", "bbox": {"l": 189.26929, "t": 575.65688, "r": 241.73856, "b": 584.43163, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null}, {"label": "section_header", "id": 5, "page_no": 7, "cluster": {"id": 5, "label": "section_header", "bbox": {"l": 64.800003, "t": 620.22063, "r": 249.59605000000002, "b": 634.98363, "coord_origin": "TOPLEFT"}, "confidence": 0.9656105041503906, "cells": [{"id": 41, "text": "2.2", "bbox": {"l": 64.800003, "t": 620.22063, "r": 87.569839, "b": 634.98363, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "Separation of duties", "bbox": {"l": 92.123802, "t": 620.22063, "r": 249.59605000000002, "b": 634.98363, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2.2 Separation of duties"}, {"label": "text", "id": 0, "page_no": 7, "cluster": {"id": 0, "label": "text", "bbox": {"l": 136.8, "t": 652.54872, "r": 547.22345, "b": 709.760956, "coord_origin": "TOPLEFT"}, "confidence": 0.9853070974349976, "cells": [{"id": 43, "text": "Separation of duties helps businesses comply with industry regulations or organizational ", "bbox": {"l": 136.8, "t": 652.54872, "r": 529.09357, "b": 661.76172, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "requirements and simplifies the management of authorities. Separation of duties is commonly ", "bbox": {"l": 136.8, "t": 664.54852, "r": 547.22345, "b": 673.76153, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "used to prevent fraudulent activities or errors by a single person. It provides the ability for ", "bbox": {"l": 136.8, "t": 676.54833, "r": 530.89716, "b": 685.76134, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "administrative functions to be divided across individuals without overlapping responsibilities, ", "bbox": {"l": 136.80002, "t": 688.54814, "r": 544.33832, "b": 697.7611469999999, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "so that one user does not possess unlimited authority, such as with the *ALLOBJ authority.", "bbox": {"l": 136.80002, "t": 700.547951, "r": 536.28363, "b": 709.760956, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Separation of duties helps businesses comply with industry regulations or organizational requirements and simplifies the management of authorities. Separation of duties is commonly used to prevent fraudulent activities or errors by a single person. It provides the ability for administrative functions to be divided across individuals without overlapping responsibilities, so that one user does not possess unlimited authority, such as with the *ALLOBJ authority."}, {"label": "table", "id": 1, "page_no": 7, "cluster": {"id": 1, "label": "table", "bbox": {"l": 135.52462768554688, "t": 289.7252197265625, "r": 545.8714599609375, "b": 442.050537109375, "coord_origin": "TOPLEFT"}, "confidence": 0.9851690530776978, "cells": [{"id": 48, "text": "Column name", "bbox": {"l": 142.8, "t": 296.5379899999999, "r": 202.245, "b": 304.86301, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "Data type", "bbox": {"l": 216.80878999999996, "t": 296.5379899999999, "r": 257.21069, "b": 304.86301, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Description", "bbox": {"l": 289.47479, "t": 296.5379899999999, "r": 338.89468, "b": 304.86301, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "FUNCTION_ID", "bbox": {"l": 142.8, "t": 315.55771, "r": 203.2323, "b": 323.88272, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "VARCHAR(30)", "bbox": {"l": 216.7854, "t": 315.55771, "r": 276.0036, "b": 323.88272, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "ID of the function.", "bbox": {"l": 289.4577, "t": 315.55771, "r": 359.85394, "b": 323.88272, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "USER_NAME", "bbox": {"l": 142.8, "t": 334.51801, "r": 198.6693, "b": 342.84302, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "VARCHAR(10)", "bbox": {"l": 216.74129999999997, "t": 334.51801, "r": 275.92349, "b": 342.84302, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Name of the user profile that has a usage setting for this ", "bbox": {"l": 289.38208, "t": 334.51801, "r": 515.05359, "b": 342.84302, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "function.", "bbox": {"l": 289.4397, "t": 345.55832, "r": 323.43362, "b": 353.88333, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "USAGE", "bbox": {"l": 142.79999, "t": 364.51862, "r": 173.98318, "b": 372.84363, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "VARCHAR(7)", "bbox": {"l": 216.77367999999998, "t": 364.51862, "r": 270.97977, "b": 372.84363, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Usage setting:", "bbox": {"l": 289.41626, "t": 364.51862, "r": 346.88757, "b": 372.84363, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 375.69394000000005, "r": 293.9397, "b": 383.62292, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "ALLOWED: The user profile is allowed to use the function.", "bbox": {"l": 303.83969, "t": 375.55893, "r": 535.16766, "b": 383.88394, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 386.67395, "r": 293.9397, "b": 394.60294, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "DENIED: The user profile is not allowed to use the function.", "bbox": {"l": 303.83969, "t": 386.53894, "r": 539.10712, "b": 394.86395, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "USER_TYPE", "bbox": {"l": 142.8, "t": 405.55865, "r": 196.2249, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "VARCHAR(5)", "bbox": {"l": 216.75211, "t": 405.55865, "r": 270.99872, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "Type of user profile:", "bbox": {"l": 289.43161, "t": 405.55865, "r": 367.8009, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 416.67368000000005, "r": 293.9397, "b": 424.60266, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "USER: The user profile is a user.", "bbox": {"l": 303.83969, "t": 416.53867, "r": 434.78159, "b": 424.86368, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 427.65369, "r": 293.9397, "b": 435.58267000000006, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "GROUP: The user profile is a group.", "bbox": {"l": 303.83969, "t": 427.51868, "r": 448.11963000000003, "b": 435.84369, "coord_origin": "TOPLEFT"}}], "children": [{"id": 31, "label": "text", "bbox": {"l": 142.8, "t": 296.5379899999999, "r": 202.245, "b": 304.86301, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "Column name", "bbox": {"l": 142.8, "t": 296.5379899999999, "r": 202.245, "b": 304.86301, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 216.80878999999996, "t": 296.5379899999999, "r": 257.21069, "b": 304.86301, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "Data type", "bbox": {"l": 216.80878999999996, "t": 296.5379899999999, "r": 257.21069, "b": 304.86301, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 289.47479, "t": 296.5379899999999, "r": 338.89468, "b": 304.86301, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "Description", "bbox": {"l": 289.47479, "t": 296.5379899999999, "r": 338.89468, "b": 304.86301, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 142.8, "t": 315.55771, "r": 203.2323, "b": 323.88272, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "FUNCTION_ID", "bbox": {"l": 142.8, "t": 315.55771, "r": 203.2323, "b": 323.88272, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 216.7854, "t": 315.55771, "r": 276.0036, "b": 323.88272, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "VARCHAR(30)", "bbox": {"l": 216.7854, "t": 315.55771, "r": 276.0036, "b": 323.88272, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 289.4577, "t": 315.55771, "r": 359.85394, "b": 323.88272, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "ID of the function.", "bbox": {"l": 289.4577, "t": 315.55771, "r": 359.85394, "b": 323.88272, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 142.8, "t": 334.51801, "r": 198.6693, "b": 342.84302, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "USER_NAME", "bbox": {"l": 142.8, "t": 334.51801, "r": 198.6693, "b": 342.84302, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 216.74129999999997, "t": 334.51801, "r": 275.92349, "b": 342.84302, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "VARCHAR(10)", "bbox": {"l": 216.74129999999997, "t": 334.51801, "r": 275.92349, "b": 342.84302, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 289.38208, "t": 334.51801, "r": 515.05359, "b": 342.84302, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "Name of the user profile that has a usage setting for this ", "bbox": {"l": 289.38208, "t": 334.51801, "r": 515.05359, "b": 342.84302, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 289.4397, "t": 345.55832, "r": 323.43362, "b": 353.88333, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "function.", "bbox": {"l": 289.4397, "t": 345.55832, "r": 323.43362, "b": 353.88333, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 142.79999, "t": 364.51862, "r": 173.98318, "b": 372.84363, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "USAGE", "bbox": {"l": 142.79999, "t": 364.51862, "r": 173.98318, "b": 372.84363, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 216.77367999999998, "t": 364.51862, "r": 270.97977, "b": 372.84363, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "VARCHAR(7)", "bbox": {"l": 216.77367999999998, "t": 364.51862, "r": 270.97977, "b": 372.84363, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 289.41626, "t": 364.51862, "r": 346.88757, "b": 372.84363, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "Usage setting:", "bbox": {"l": 289.41626, "t": 364.51862, "r": 346.88757, "b": 372.84363, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 289.4397, "t": 375.69394000000005, "r": 293.9397, "b": 383.62292, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 375.69394000000005, "r": 293.9397, "b": 383.62292, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 303.83969, "t": 375.55893, "r": 535.16766, "b": 383.88394, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "ALLOWED: The user profile is allowed to use the function.", "bbox": {"l": 303.83969, "t": 375.55893, "r": 535.16766, "b": 383.88394, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 289.4397, "t": 386.67395, "r": 293.9397, "b": 394.60294, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 386.67395, "r": 293.9397, "b": 394.60294, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 303.83969, "t": 386.53894, "r": 539.10712, "b": 394.86395, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "DENIED: The user profile is not allowed to use the function.", "bbox": {"l": 303.83969, "t": 386.53894, "r": 539.10712, "b": 394.86395, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 142.8, "t": 405.55865, "r": 196.2249, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "USER_TYPE", "bbox": {"l": 142.8, "t": 405.55865, "r": 196.2249, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 216.75211, "t": 405.55865, "r": 270.99872, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "VARCHAR(5)", "bbox": {"l": 216.75211, "t": 405.55865, "r": 270.99872, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 289.43161, "t": 405.55865, "r": 367.8009, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "Type of user profile:", "bbox": {"l": 289.43161, "t": 405.55865, "r": 367.8009, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 289.4397, "t": 416.67368000000005, "r": 293.9397, "b": 424.60266, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 416.67368000000005, "r": 293.9397, "b": 424.60266, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 303.83969, "t": 416.53867, "r": 434.78159, "b": 424.86368, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "USER: The user profile is a user.", "bbox": {"l": 303.83969, "t": 416.53867, "r": 434.78159, "b": 424.86368, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 289.4397, "t": 427.65369, "r": 293.9397, "b": 435.58267000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 427.65369, "r": 293.9397, "b": 435.58267000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 303.83969, "t": 427.51868, "r": 448.11963000000003, "b": 435.84369, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "GROUP: The user profile is a group.", "bbox": {"l": 303.83969, "t": 427.51868, "r": 448.11963000000003, "b": 435.84369, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl"], "num_rows": 5, "num_cols": 3, "table_cells": [{"bbox": {"l": 142.8, "t": 296.5379899999999, "r": 202.245, "b": 304.86301, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Column name", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 216.80878999999996, "t": 296.5379899999999, "r": 257.21069, "b": 304.86301, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Data type", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 289.47479, "t": 296.5379899999999, "r": 338.89468, "b": 304.86301, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Description", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 142.8, "t": 315.55771, "r": 203.2323, "b": 323.88272, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "FUNCTION_ID", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 216.7854, "t": 315.55771, "r": 276.0036, "b": 323.88272, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(30)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.4577, "t": 315.55771, "r": 359.85394, "b": 323.88272, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "ID of the function.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 142.8, "t": 334.51801, "r": 198.6693, "b": 342.84302, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "USER_NAME", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 216.74129999999997, "t": 334.51801, "r": 275.92349, "b": 342.84302, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(10)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.38208, "t": 334.51801, "r": 515.05359, "b": 353.88333, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Name of the user profile that has a usage setting for this  function.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 142.79999, "t": 364.51862, "r": 173.98318, "b": 372.84363, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "USAGE", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 216.77367999999998, "t": 364.51862, "r": 270.97977, "b": 372.84363, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(7)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.41626, "t": 364.51862, "r": 539.10712, "b": 394.86395, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Usage setting: GLYPH<SM590000> ALLOWED: The user profile is allowed to use the function. GLYPH<SM590000> DENIED: The user profile is not allowed to use the function.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 142.8, "t": 405.55865, "r": 196.2249, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "USER_TYPE", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 216.75211, "t": 405.55865, "r": 270.99872, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(5)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.43161, "t": 405.55865, "r": 448.11963000000003, "b": 435.84369, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Type of user profile: GLYPH<SM590000> USER: The user profile is a user. GLYPH<SM590000> GROUP: The user profile is a group.", "column_header": false, "row_header": false, "row_section": false}]}], "body": [{"label": "section_header", "id": 3, "page_no": 7, "cluster": {"id": 3, "label": "section_header", "bbox": {"l": 64.800003, "t": 71.33471999999995, "r": 335.49551, "b": 83.32275000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9697521328926086, "cells": [{"id": 2, "text": "2.1.6", "bbox": {"l": 64.800003, "t": 71.33471999999995, "r": 94.081459, "b": 83.32275000000004, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Change Function Usage CL command", "bbox": {"l": 97.741661, "t": 71.33471999999995, "r": 335.49551, "b": 83.32275000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2.1.6 Change Function Usage CL command"}, {"label": "text", "id": 9, "page_no": 7, "cluster": {"id": 9, "label": "text", "bbox": {"l": 136.8, "t": 97.48870999999997, "r": 547.28442, "b": 106.70172000000014, "coord_origin": "TOPLEFT"}, "confidence": 0.9551582932472229, "cells": [{"id": 4, "text": "The following CL commands can be used to work with, display, or change function usage IDs:", "bbox": {"l": 136.8, "t": 97.48870999999997, "r": 547.28442, "b": 106.70172000000014, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The following CL commands can be used to work with, display, or change function usage IDs:"}, {"label": "list_item", "id": 12, "page_no": 7, "cluster": {"id": 12, "label": "list_item", "bbox": {"l": 136.8, "t": 114.52826000000005, "r": 301.51749, "b": 123.74126999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9410832524299622, "cells": [{"id": 5, "text": "GLYPH<SM590000>", "bbox": {"l": 136.8, "t": 114.67767000000003, "r": 141.78, "b": 123.45245, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Work Function Usage (", "bbox": {"l": 151.20016, "t": 114.52826000000005, "r": 253.26227000000003, "b": 123.74126999999999, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "WRKFCNUSG", "bbox": {"l": 253.26028, "t": 114.67767000000003, "r": 298.1998, "b": 123.50225999999998, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": ")", "bbox": {"l": 298.20081, "t": 114.52826000000005, "r": 301.51749, "b": 123.74126999999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<SM590000> Work Function Usage ( WRKFCNUSG )"}, {"label": "list_item", "id": 11, "page_no": 7, "cluster": {"id": 11, "label": "list_item", "bbox": {"l": 136.80099, "t": 126.52808000000005, "r": 313.39777, "b": 135.74108999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9418092370033264, "cells": [{"id": 9, "text": "GLYPH<SM590000>", "bbox": {"l": 136.80099, "t": 126.67749000000003, "r": 141.78099, "b": 135.45227, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Change Function Usage (", "bbox": {"l": 151.20116, "t": 126.52808000000005, "r": 265.13354, "b": 135.74108999999999, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "CHGFCNUSG", "bbox": {"l": 265.08081, "t": 126.67749000000003, "r": 310.02032, "b": 135.50207999999998, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": ")", "bbox": {"l": 310.08109, "t": 126.52808000000005, "r": 313.39777, "b": 135.74108999999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<SM590000> Change Function Usage ( CHGFCNUSG )"}, {"label": "list_item", "id": 8, "page_no": 7, "cluster": {"id": 8, "label": "list_item", "bbox": {"l": 136.80098, "t": 138.52788999999996, "r": 310.81711, "b": 147.74090999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9562349915504456, "cells": [{"id": 13, "text": "GLYPH<SM590000>", "bbox": {"l": 136.80098, "t": 138.67731000000003, "r": 141.78098, "b": 147.45209, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Display Function Usage (", "bbox": {"l": 151.20114, "t": 138.52788999999996, "r": 262.5639, "b": 147.74090999999999, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "DSPFCNUSG", "bbox": {"l": 262.56091, "t": 138.67731000000003, "r": 307.50043, "b": 147.50189, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": ")", "bbox": {"l": 307.50043, "t": 138.52788999999996, "r": 310.81711, "b": 147.74090999999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<SM590000> Display Function Usage ( DSPFCNUSG )"}, {"label": "text", "id": 4, "page_no": 7, "cluster": {"id": 4, "label": "text", "bbox": {"l": 136.79997, "t": 160.48766999999998, "r": 512.53802, "b": 181.70050000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9682500958442688, "cells": [{"id": 17, "text": "For example, the following ", "bbox": {"l": 136.79997, "t": 160.48766999999998, "r": 255.09984000000003, "b": 169.70068000000003, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "CHGFCNUSG", "bbox": {"l": 255.00027, "t": 160.63707999999997, "r": 299.99957, "b": 169.46167000000003, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": " command shows granting authorization to user ", "bbox": {"l": 300.00055, "t": 160.48766999999998, "r": 512.53802, "b": 169.70068000000003, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "HBEDOYA to administer and manage RCAC rules:", "bbox": {"l": 136.80096, "t": 172.48748999999998, "r": 360.41989, "b": 181.70050000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "For example, the following CHGFCNUSG command shows granting authorization to user HBEDOYA to administer and manage RCAC rules:"}, {"label": "text", "id": 15, "page_no": 7, "cluster": {"id": 15, "label": "text", "bbox": {"l": 136.80096, "t": 189.67645000000005, "r": 441.59686, "b": 198.45123, "coord_origin": "TOPLEFT"}, "confidence": 0.905712902545929, "cells": [{"id": 21, "text": "CHGFCNUSG FCNID(QIBM_DB_SECADM) USER(HBEDOYA) USAGE(*ALLOWED)", "bbox": {"l": 136.80096, "t": 189.67645000000005, "r": 441.59686, "b": 198.45123, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "CHGFCNUSG FCNID(QIBM_DB_SECADM) USER(HBEDOYA) USAGE(*ALLOWED)"}, {"label": "section_header", "id": 7, "page_no": 7, "cluster": {"id": 7, "label": "section_header", "bbox": {"l": 64.800003, "t": 219.35468000000003, "r": 544.47546, "b": 231.34271, "coord_origin": "TOPLEFT"}, "confidence": 0.9636710286140442, "cells": [{"id": 22, "text": "2.1.7", "bbox": {"l": 64.800003, "t": 219.35468000000003, "r": 93.757614, "b": 231.34271, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Verifying function usage IDs for RCAC with the FUNCTION_USAGE view", "bbox": {"l": 97.377296, "t": 219.35468000000003, "r": 544.47546, "b": 231.34271, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2.1.7 Verifying function usage IDs for RCAC with the FUNCTION_USAGE view"}, {"label": "text", "id": 2, "page_no": 7, "cluster": {"id": 2, "label": "text", "bbox": {"l": 136.8, "t": 245.50867000000005, "r": 519.51794, "b": 266.7215, "coord_origin": "TOPLEFT"}, "confidence": 0.9737311601638794, "cells": [{"id": 24, "text": "The FUNCTION_USAGE view contains function usage configuration details. Table 2-1 ", "bbox": {"l": 136.8, "t": 245.50867000000005, "r": 519.51794, "b": 254.72168, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "describes the columns in the FUNCTION_USAGE view.", "bbox": {"l": 136.8, "t": 257.50847999999996, "r": 382.94443, "b": 266.7215, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The FUNCTION_USAGE view contains function usage configuration details. Table 2-1 describes the columns in the FUNCTION_USAGE view."}, {"label": "caption", "id": 13, "page_no": 7, "cluster": {"id": 13, "label": "caption", "bbox": {"l": 136.8, "t": 279.55798000000004, "r": 283.96805, "b": 287.88300000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9196999669075012, "cells": [{"id": 26, "text": "Table 2-1 FUNCTION_USAGE view", "bbox": {"l": 136.8, "t": 279.55798000000004, "r": 283.96805, "b": 287.88300000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 2-1 FUNCTION_USAGE view"}, {"label": "text", "id": 6, "page_no": 7, "cluster": {"id": 6, "label": "text", "bbox": {"l": 136.8, "t": 452.50872999999996, "r": 547.2804, "b": 473.72153, "coord_origin": "TOPLEFT"}, "confidence": 0.964775562286377, "cells": [{"id": 27, "text": "To discover who has authorization to define and manage RCAC, you can use the query that is ", "bbox": {"l": 136.8, "t": 452.50872999999996, "r": 547.2804, "b": 461.72171, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "shown in Example 2-1.", "bbox": {"l": 136.8, "t": 464.50854, "r": 237.76951999999997, "b": 473.72153, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "To discover who has authorization to define and manage RCAC, you can use the query that is shown in Example 2-1."}, {"label": "caption", "id": 16, "page_no": 7, "cluster": {"id": 16, "label": "caption", "bbox": {"l": 136.8, "t": 486.55798, "r": 462.35419, "b": 494.883, "coord_origin": "TOPLEFT"}, "confidence": 0.8159958720207214, "cells": [{"id": 29, "text": "Example 2-1 Query to determine who has authority to define and manage RCAC", "bbox": {"l": 136.8, "t": 486.55798, "r": 462.35419, "b": 494.883, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Example 2-1 Query to determine who has authority to define and manage RCAC"}, {"label": "key_value_region", "id": 18, "page_no": 7, "cluster": {"id": 18, "label": "key_value_region", "bbox": {"l": 136.8, "t": 503.65802, "r": 331.67731, "b": 584.43163, "coord_origin": "TOPLEFT"}, "confidence": 0.5808265805244446, "cells": [{"id": 30, "text": "SELECT", "bbox": {"l": 136.8, "t": 503.65802, "r": 171.26956, "b": 512.4328, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "function_id,", "bbox": {"l": 182.75941, "t": 503.65802, "r": 251.69853, "b": 512.4328, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "user_name,", "bbox": {"l": 166.78244, "t": 515.6578400000001, "r": 241.73852999999997, "b": 524.43262, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "usage,", "bbox": {"l": 170.75961, "t": 527.65765, "r": 221.69901999999996, "b": 536.43242, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "user_type", "bbox": {"l": 167.53809, "t": 539.65747, "r": 236.69878, "b": 548.43222, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "FROM", "bbox": {"l": 136.8, "t": 551.65727, "r": 160.59396, "b": 560.43202, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "function_usage", "bbox": {"l": 178.43944, "t": 551.65727, "r": 261.71829, "b": 560.43202, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "WHERE", "bbox": {"l": 136.8, "t": 563.65707, "r": 162.44176, "b": 572.43182, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "function_id=\u2019QIBM_DB_SECADM\u2019", "bbox": {"l": 177.8268, "t": 563.65707, "r": 331.67731, "b": 572.43182, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "ORDER BY", "bbox": {"l": 136.8, "t": 575.65688, "r": 178.77542, "b": 584.43163, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "user_name;", "bbox": {"l": 189.26929, "t": 575.65688, "r": 241.73856, "b": 584.43163, "coord_origin": "TOPLEFT"}}], "children": [{"id": 19, "label": "text", "bbox": {"l": 136.8, "t": 503.65802, "r": 171.26956, "b": 512.4328, "coord_origin": "TOPLEFT"}, "confidence": 0.5631121397018433, "cells": [{"id": 30, "text": "SELECT", "bbox": {"l": 136.8, "t": 503.65802, "r": 171.26956, "b": 512.4328, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 182.75941, "t": 503.65802, "r": 251.69853, "b": 512.4328, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "function_id,", "bbox": {"l": 182.75941, "t": 503.65802, "r": 251.69853, "b": 512.4328, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 166.78244, "t": 515.6578400000001, "r": 241.73852999999997, "b": 524.43262, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "user_name,", "bbox": {"l": 166.78244, "t": 515.6578400000001, "r": 241.73852999999997, "b": 524.43262, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 170.75961, "t": 527.65765, "r": 221.69901999999996, "b": 536.43242, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "usage,", "bbox": {"l": 170.75961, "t": 527.65765, "r": 221.69901999999996, "b": 536.43242, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 167.53809, "t": 539.65747, "r": 236.69878, "b": 548.43222, "coord_origin": "TOPLEFT"}, "confidence": 0.5346826314926147, "cells": [{"id": 34, "text": "user_type", "bbox": {"l": 167.53809, "t": 539.65747, "r": 236.69878, "b": 548.43222, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 136.8, "t": 551.65727, "r": 160.59396, "b": 560.43202, "coord_origin": "TOPLEFT"}, "confidence": 0.581838846206665, "cells": [{"id": 35, "text": "FROM", "bbox": {"l": 136.8, "t": 551.65727, "r": 160.59396, "b": 560.43202, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 178.43944, "t": 551.65727, "r": 261.71829, "b": 560.43202, "coord_origin": "TOPLEFT"}, "confidence": 0.5035740733146667, "cells": [{"id": 36, "text": "function_usage", "bbox": {"l": 178.43944, "t": 551.65727, "r": 261.71829, "b": 560.43202, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 136.8, "t": 563.65707, "r": 162.44176, "b": 572.43182, "coord_origin": "TOPLEFT"}, "confidence": 0.534027099609375, "cells": [{"id": 37, "text": "WHERE", "bbox": {"l": 136.8, "t": 563.65707, "r": 162.44176, "b": 572.43182, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 177.8268, "t": 563.65707, "r": 331.67731, "b": 572.43182, "coord_origin": "TOPLEFT"}, "confidence": 0.5171723365783691, "cells": [{"id": 38, "text": "function_id=\u2019QIBM_DB_SECADM\u2019", "bbox": {"l": 177.8268, "t": 563.65707, "r": 331.67731, "b": 572.43182, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 136.8, "t": 575.65688, "r": 178.77542, "b": 584.43163, "coord_origin": "TOPLEFT"}, "confidence": 0.5373470187187195, "cells": [{"id": 39, "text": "ORDER BY", "bbox": {"l": 136.8, "t": 575.65688, "r": 178.77542, "b": 584.43163, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 189.26929, "t": 575.65688, "r": 241.73856, "b": 584.43163, "coord_origin": "TOPLEFT"}, "confidence": 0.5167025327682495, "cells": [{"id": 40, "text": "user_name;", "bbox": {"l": 189.26929, "t": 575.65688, "r": 241.73856, "b": 584.43163, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null}, {"label": "section_header", "id": 5, "page_no": 7, "cluster": {"id": 5, "label": "section_header", "bbox": {"l": 64.800003, "t": 620.22063, "r": 249.59605000000002, "b": 634.98363, "coord_origin": "TOPLEFT"}, "confidence": 0.9656105041503906, "cells": [{"id": 41, "text": "2.2", "bbox": {"l": 64.800003, "t": 620.22063, "r": 87.569839, "b": 634.98363, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "Separation of duties", "bbox": {"l": 92.123802, "t": 620.22063, "r": 249.59605000000002, "b": 634.98363, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2.2 Separation of duties"}, {"label": "text", "id": 0, "page_no": 7, "cluster": {"id": 0, "label": "text", "bbox": {"l": 136.8, "t": 652.54872, "r": 547.22345, "b": 709.760956, "coord_origin": "TOPLEFT"}, "confidence": 0.9853070974349976, "cells": [{"id": 43, "text": "Separation of duties helps businesses comply with industry regulations or organizational ", "bbox": {"l": 136.8, "t": 652.54872, "r": 529.09357, "b": 661.76172, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "requirements and simplifies the management of authorities. Separation of duties is commonly ", "bbox": {"l": 136.8, "t": 664.54852, "r": 547.22345, "b": 673.76153, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "used to prevent fraudulent activities or errors by a single person. It provides the ability for ", "bbox": {"l": 136.8, "t": 676.54833, "r": 530.89716, "b": 685.76134, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "administrative functions to be divided across individuals without overlapping responsibilities, ", "bbox": {"l": 136.80002, "t": 688.54814, "r": 544.33832, "b": 697.7611469999999, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "so that one user does not possess unlimited authority, such as with the *ALLOBJ authority.", "bbox": {"l": 136.80002, "t": 700.547951, "r": 536.28363, "b": 709.760956, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Separation of duties helps businesses comply with industry regulations or organizational requirements and simplifies the management of authorities. Separation of duties is commonly used to prevent fraudulent activities or errors by a single person. It provides the ability for administrative functions to be divided across individuals without overlapping responsibilities, so that one user does not possess unlimited authority, such as with the *ALLOBJ authority."}, {"label": "table", "id": 1, "page_no": 7, "cluster": {"id": 1, "label": "table", "bbox": {"l": 135.52462768554688, "t": 289.7252197265625, "r": 545.8714599609375, "b": 442.050537109375, "coord_origin": "TOPLEFT"}, "confidence": 0.9851690530776978, "cells": [{"id": 48, "text": "Column name", "bbox": {"l": 142.8, "t": 296.5379899999999, "r": 202.245, "b": 304.86301, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "Data type", "bbox": {"l": 216.80878999999996, "t": 296.5379899999999, "r": 257.21069, "b": 304.86301, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Description", "bbox": {"l": 289.47479, "t": 296.5379899999999, "r": 338.89468, "b": 304.86301, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "FUNCTION_ID", "bbox": {"l": 142.8, "t": 315.55771, "r": 203.2323, "b": 323.88272, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "VARCHAR(30)", "bbox": {"l": 216.7854, "t": 315.55771, "r": 276.0036, "b": 323.88272, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "ID of the function.", "bbox": {"l": 289.4577, "t": 315.55771, "r": 359.85394, "b": 323.88272, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "USER_NAME", "bbox": {"l": 142.8, "t": 334.51801, "r": 198.6693, "b": 342.84302, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "VARCHAR(10)", "bbox": {"l": 216.74129999999997, "t": 334.51801, "r": 275.92349, "b": 342.84302, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Name of the user profile that has a usage setting for this ", "bbox": {"l": 289.38208, "t": 334.51801, "r": 515.05359, "b": 342.84302, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "function.", "bbox": {"l": 289.4397, "t": 345.55832, "r": 323.43362, "b": 353.88333, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "USAGE", "bbox": {"l": 142.79999, "t": 364.51862, "r": 173.98318, "b": 372.84363, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "VARCHAR(7)", "bbox": {"l": 216.77367999999998, "t": 364.51862, "r": 270.97977, "b": 372.84363, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Usage setting:", "bbox": {"l": 289.41626, "t": 364.51862, "r": 346.88757, "b": 372.84363, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 375.69394000000005, "r": 293.9397, "b": 383.62292, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "ALLOWED: The user profile is allowed to use the function.", "bbox": {"l": 303.83969, "t": 375.55893, "r": 535.16766, "b": 383.88394, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 386.67395, "r": 293.9397, "b": 394.60294, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "DENIED: The user profile is not allowed to use the function.", "bbox": {"l": 303.83969, "t": 386.53894, "r": 539.10712, "b": 394.86395, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "USER_TYPE", "bbox": {"l": 142.8, "t": 405.55865, "r": 196.2249, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "VARCHAR(5)", "bbox": {"l": 216.75211, "t": 405.55865, "r": 270.99872, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "Type of user profile:", "bbox": {"l": 289.43161, "t": 405.55865, "r": 367.8009, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 416.67368000000005, "r": 293.9397, "b": 424.60266, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "USER: The user profile is a user.", "bbox": {"l": 303.83969, "t": 416.53867, "r": 434.78159, "b": 424.86368, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 427.65369, "r": 293.9397, "b": 435.58267000000006, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "GROUP: The user profile is a group.", "bbox": {"l": 303.83969, "t": 427.51868, "r": 448.11963000000003, "b": 435.84369, "coord_origin": "TOPLEFT"}}], "children": [{"id": 31, "label": "text", "bbox": {"l": 142.8, "t": 296.5379899999999, "r": 202.245, "b": 304.86301, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "Column name", "bbox": {"l": 142.8, "t": 296.5379899999999, "r": 202.245, "b": 304.86301, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 216.80878999999996, "t": 296.5379899999999, "r": 257.21069, "b": 304.86301, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "Data type", "bbox": {"l": 216.80878999999996, "t": 296.5379899999999, "r": 257.21069, "b": 304.86301, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 289.47479, "t": 296.5379899999999, "r": 338.89468, "b": 304.86301, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "Description", "bbox": {"l": 289.47479, "t": 296.5379899999999, "r": 338.89468, "b": 304.86301, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 142.8, "t": 315.55771, "r": 203.2323, "b": 323.88272, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "FUNCTION_ID", "bbox": {"l": 142.8, "t": 315.55771, "r": 203.2323, "b": 323.88272, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 216.7854, "t": 315.55771, "r": 276.0036, "b": 323.88272, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "VARCHAR(30)", "bbox": {"l": 216.7854, "t": 315.55771, "r": 276.0036, "b": 323.88272, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 289.4577, "t": 315.55771, "r": 359.85394, "b": 323.88272, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "ID of the function.", "bbox": {"l": 289.4577, "t": 315.55771, "r": 359.85394, "b": 323.88272, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 142.8, "t": 334.51801, "r": 198.6693, "b": 342.84302, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "USER_NAME", "bbox": {"l": 142.8, "t": 334.51801, "r": 198.6693, "b": 342.84302, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 216.74129999999997, "t": 334.51801, "r": 275.92349, "b": 342.84302, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "VARCHAR(10)", "bbox": {"l": 216.74129999999997, "t": 334.51801, "r": 275.92349, "b": 342.84302, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 289.38208, "t": 334.51801, "r": 515.05359, "b": 342.84302, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "Name of the user profile that has a usage setting for this ", "bbox": {"l": 289.38208, "t": 334.51801, "r": 515.05359, "b": 342.84302, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 289.4397, "t": 345.55832, "r": 323.43362, "b": 353.88333, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "function.", "bbox": {"l": 289.4397, "t": 345.55832, "r": 323.43362, "b": 353.88333, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 142.79999, "t": 364.51862, "r": 173.98318, "b": 372.84363, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "USAGE", "bbox": {"l": 142.79999, "t": 364.51862, "r": 173.98318, "b": 372.84363, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 216.77367999999998, "t": 364.51862, "r": 270.97977, "b": 372.84363, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "VARCHAR(7)", "bbox": {"l": 216.77367999999998, "t": 364.51862, "r": 270.97977, "b": 372.84363, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 289.41626, "t": 364.51862, "r": 346.88757, "b": 372.84363, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "Usage setting:", "bbox": {"l": 289.41626, "t": 364.51862, "r": 346.88757, "b": 372.84363, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 289.4397, "t": 375.69394000000005, "r": 293.9397, "b": 383.62292, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 375.69394000000005, "r": 293.9397, "b": 383.62292, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 303.83969, "t": 375.55893, "r": 535.16766, "b": 383.88394, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "ALLOWED: The user profile is allowed to use the function.", "bbox": {"l": 303.83969, "t": 375.55893, "r": 535.16766, "b": 383.88394, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 289.4397, "t": 386.67395, "r": 293.9397, "b": 394.60294, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 386.67395, "r": 293.9397, "b": 394.60294, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 303.83969, "t": 386.53894, "r": 539.10712, "b": 394.86395, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "DENIED: The user profile is not allowed to use the function.", "bbox": {"l": 303.83969, "t": 386.53894, "r": 539.10712, "b": 394.86395, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 142.8, "t": 405.55865, "r": 196.2249, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "USER_TYPE", "bbox": {"l": 142.8, "t": 405.55865, "r": 196.2249, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 216.75211, "t": 405.55865, "r": 270.99872, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "VARCHAR(5)", "bbox": {"l": 216.75211, "t": 405.55865, "r": 270.99872, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 289.43161, "t": 405.55865, "r": 367.8009, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "Type of user profile:", "bbox": {"l": 289.43161, "t": 405.55865, "r": 367.8009, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 289.4397, "t": 416.67368000000005, "r": 293.9397, "b": 424.60266, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 416.67368000000005, "r": 293.9397, "b": 424.60266, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 303.83969, "t": 416.53867, "r": 434.78159, "b": 424.86368, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "USER: The user profile is a user.", "bbox": {"l": 303.83969, "t": 416.53867, "r": 434.78159, "b": 424.86368, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 289.4397, "t": 427.65369, "r": 293.9397, "b": 435.58267000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 427.65369, "r": 293.9397, "b": 435.58267000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 303.83969, "t": 427.51868, "r": 448.11963000000003, "b": 435.84369, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "GROUP: The user profile is a group.", "bbox": {"l": 303.83969, "t": 427.51868, "r": 448.11963000000003, "b": 435.84369, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl"], "num_rows": 5, "num_cols": 3, "table_cells": [{"bbox": {"l": 142.8, "t": 296.5379899999999, "r": 202.245, "b": 304.86301, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Column name", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 216.80878999999996, "t": 296.5379899999999, "r": 257.21069, "b": 304.86301, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Data type", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 289.47479, "t": 296.5379899999999, "r": 338.89468, "b": 304.86301, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Description", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 142.8, "t": 315.55771, "r": 203.2323, "b": 323.88272, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "FUNCTION_ID", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 216.7854, "t": 315.55771, "r": 276.0036, "b": 323.88272, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(30)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.4577, "t": 315.55771, "r": 359.85394, "b": 323.88272, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "ID of the function.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 142.8, "t": 334.51801, "r": 198.6693, "b": 342.84302, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "USER_NAME", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 216.74129999999997, "t": 334.51801, "r": 275.92349, "b": 342.84302, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(10)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.38208, "t": 334.51801, "r": 515.05359, "b": 353.88333, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Name of the user profile that has a usage setting for this  function.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 142.79999, "t": 364.51862, "r": 173.98318, "b": 372.84363, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "USAGE", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 216.77367999999998, "t": 364.51862, "r": 270.97977, "b": 372.84363, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(7)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.41626, "t": 364.51862, "r": 539.10712, "b": 394.86395, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Usage setting: GLYPH<SM590000> ALLOWED: The user profile is allowed to use the function. GLYPH<SM590000> DENIED: The user profile is not allowed to use the function.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 142.8, "t": 405.55865, "r": 196.2249, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "USER_TYPE", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 216.75211, "t": 405.55865, "r": 270.99872, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(5)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.43161, "t": 405.55865, "r": 448.11963000000003, "b": 435.84369, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Type of user profile: GLYPH<SM590000> USER: The user profile is a user. GLYPH<SM590000> GROUP: The user profile is a group.", "column_header": false, "row_header": false, "row_section": false}]}], "headers": [{"label": "page_footer", "id": 14, "page_no": 7, "cluster": {"id": 14, "label": "page_footer", "bbox": {"l": 64.800003, "t": 754.848721, "r": 78.402, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.9166396856307983, "cells": [{"id": 0, "text": "10 ", "bbox": {"l": 64.800003, "t": 754.848721, "r": 78.402, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "10"}, {"label": "page_footer", "id": 10, "page_no": 7, "cluster": {"id": 10, "label": "page_footer", "bbox": {"l": 93.420303, "t": 755.538002, "r": 334.42142, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9530044198036194, "cells": [{"id": 1, "text": "Row and Column Access Control Support in IBM DB2 for i", "bbox": {"l": 93.420303, "t": 755.538002, "r": 334.42142, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Row and Column Access Control Support in IBM DB2 for i"}]}}, {"page_no": 8, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "Chapter 2. Roles and separation of duties ", "bbox": {"l": 355.32001, "t": 755.538002, "r": 523.54071, "b": 763.863001, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "11", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "For example, assume that a business has assigned the duty to manage security on IBM i to ", "bbox": {"l": 136.79959, "t": 71.50903000000005, "r": 542.69434, "b": 80.72204999999985, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Theresa. Before release IBM i 7.2, to grant privileges, Theresa had to have the same ", "bbox": {"l": 136.79959, "t": 83.50885000000017, "r": 513.67804, "b": 92.72185999999999, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "privileges Theresa was granting to others. Therefore, to grant *USE privileges to the ", "bbox": {"l": 136.79959, "t": 95.50867000000005, "r": 509.71902, "b": 104.72167999999999, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "PAYROLL table, Theresa had to have *OBJMGT and *USE authority (or a higher level of ", "bbox": {"l": 136.79959, "t": 107.50847999999996, "r": 528.20184, "b": 116.72149999999999, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "authority, such as *ALLOBJ). This requirement allowed Theresa to access the data in the ", "bbox": {"l": 136.79959, "t": 119.50829999999996, "r": 531.84015, "b": 128.72131000000002, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "PAYROLL table even though Theresa\u2019s job description was only to manage its security.", "bbox": {"l": 136.79959, "t": 131.50811999999996, "r": 519.24982, "b": 140.72113000000002, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "In IBM i 7.2, the QIBM_DB_SECADM function usage grants authorities, revokes authorities, ", "bbox": {"l": 136.79959, "t": 153.52770999999996, "r": 544.16064, "b": 162.74072, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "changes ownership, or changes the primary group without giving access to the object or, in ", "bbox": {"l": 136.79959, "t": 165.52752999999996, "r": 540.66156, "b": 174.74054, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "the case of a database table, to the data that is in the table or allowing other operations on the ", "bbox": {"l": 136.79959, "t": 177.52733999999998, "r": 547.30396, "b": 186.74036, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "table. ", "bbox": {"l": 136.79959, "t": 189.52715999999998, "r": 163.6189, "b": 198.74017000000003, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "QIBM_DB_SECADM function usage can be granted only by a user with *SECADM special ", "bbox": {"l": 136.79959, "t": 211.48694, "r": 538.65076, "b": 220.69994999999994, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "authority and can be given to a user or a group.", "bbox": {"l": 136.79959, "t": 223.48676, "r": 346.34808, "b": 232.69976999999994, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "QIBM_DB_SECADM also is responsible for administering RCAC, which restricts which rows ", "bbox": {"l": 136.79959, "t": 245.50635, "r": 545.79602, "b": 254.71936000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "a user is allowed to access in a table and whether a user is allowed to see information in ", "bbox": {"l": 136.79959, "t": 257.50616, "r": 529.46149, "b": 266.71918000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "certain columns of a table.", "bbox": {"l": 136.79959, "t": 269.50598, "r": 253.47696999999997, "b": 278.71898999999996, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "A preferred practice is that the RCAC administrator has the QIBM_DB_SECADM function ", "bbox": {"l": 136.79959, "t": 291.52557, "r": 533.78137, "b": 300.73856, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "usage ID, but absolutely no other data privileges. The result is that the RCAC administrator ", "bbox": {"l": 136.79959, "t": 303.52539, "r": 539.80713, "b": 312.73837000000003, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "can deploy and maintain the RCAC constructs, but cannot grant themselves unauthorized ", "bbox": {"l": 136.79959, "t": 315.52521, "r": 534.5741, "b": 324.73819, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "access to data itself.", "bbox": {"l": 136.79959, "t": 327.52502, "r": 227.02324, "b": 336.73801, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Table 2-2 shows a comparison of the different function usage IDs and *JOBCTL authority to ", "bbox": {"l": 136.79959, "t": 349.48483, "r": 543.06714, "b": 358.69780999999995, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "the different CL commands and DB2 for i tools.", "bbox": {"l": 136.79959, "t": 361.48465, "r": 343.79236, "b": 370.69763000000006, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Table 2-2 Comparison of the different function usage IDs and *JOBCTL authority", "bbox": {"l": 64.800003, "t": 383.5379899999999, "r": 391.75464, "b": 391.86301, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "User action", "bbox": {"l": 70.800301, "t": 400.51827999999995, "r": 119.78551, "b": 408.84329, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "*JOBCTL", "bbox": {"l": 424.93805, "t": 447.52255, "r": 433.26297000000005, "b": 487.01999, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "QIBM_DB_SECADM", "bbox": {"l": 450.13806, "t": 401.6000700000001, "r": 458.46298, "b": 487.01999, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "QIBM_DB_SQLADM", "bbox": {"l": 475.93835000000007, "t": 401.53442, "r": 484.26327999999995, "b": 487.01999, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "QIBM_DB_SYSMON", "bbox": {"l": 501.13837, "t": 401.6145, "r": 509.46329, "b": 487.01999, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "No Authority", "bbox": {"l": 526.39862, "t": 432.79944, "r": 534.72357, "b": 487.02005, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "SET CURRENT DEGREE", "bbox": {"l": 70.800003, "t": 498.69299, "r": 151.6794, "b": 506.66699, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": " (SQL statement)", "bbox": {"l": 151.6803, "t": 498.55798, "r": 220.15681000000004, "b": 506.883, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "X", "bbox": {"l": 429.0, "t": 498.55798, "r": 435.00299000000007, "b": 506.883, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "X", "bbox": {"l": 480.00031, "t": 498.55798, "r": 486.0033, "b": 506.883, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "CHGQRYA", "bbox": {"l": 70.800018, "t": 517.65329, "r": 102.23972, "b": 525.62729, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": " command targeting a different user\u2019s job", "bbox": {"l": 102.23972, "t": 517.51828, "r": 264.5538, "b": 525.84329, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "X", "bbox": {"l": 429.00003, "t": 517.51828, "r": 435.00302000000005, "b": 525.84329, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "X", "bbox": {"l": 480.00034, "t": 517.51828, "r": 486.00333, "b": 525.84329, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "STRDBMON", "bbox": {"l": 70.800049, "t": 536.67299, "r": 106.73975, "b": 544.64699, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": " or ", "bbox": {"l": 106.73975, "t": 536.5379800000001, "r": 119.77895, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "ENDDBMON", "bbox": {"l": 119.69975000000001, "t": 536.67299, "r": 155.69974, "b": 544.64699, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": " commands targeting a different user\u2019s job", "bbox": {"l": 155.69974, "t": 536.5379800000001, "r": 322.50574, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "X", "bbox": {"l": 429.00003, "t": 536.5379800000001, "r": 435.00302000000005, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "X", "bbox": {"l": 480.00034, "t": 536.5379800000001, "r": 486.00333, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "STRDBMON", "bbox": {"l": 70.800049, "t": 555.69269, "r": 106.73975, "b": 563.66669, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": " or ", "bbox": {"l": 106.73975, "t": 555.55768, "r": 119.77895, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "ENDDBMON", "bbox": {"l": 119.69975000000001, "t": 555.69269, "r": 155.69974, "b": 563.66669, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": " commands targeting a job that matches the current user", "bbox": {"l": 155.69974, "t": 555.55768, "r": 381.02185, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "X", "bbox": {"l": 429.00003, "t": 555.55768, "r": 435.00302000000005, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "X", "bbox": {"l": 480.00034, "t": 555.55768, "r": 486.00333, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "X", "bbox": {"l": 505.26061999999996, "t": 555.55768, "r": 511.26361, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "X", "bbox": {"l": 530.76031, "t": 555.55768, "r": 536.76331, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "QUSRJOBI() API format 900 or System i Navigator\u2019s SQL Details for Job", "bbox": {"l": 70.800049, "t": 574.51797, "r": 359.51736, "b": 582.84299, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "X", "bbox": {"l": 429.0000600000001, "t": 574.51797, "r": 435.00305000000003, "b": 582.84299, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "X", "bbox": {"l": 480.00037, "t": 574.51797, "r": 486.00335999999993, "b": 582.84299, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "X", "bbox": {"l": 505.2606799999999, "t": 574.51797, "r": 511.26367, "b": 582.84299, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Visual Explain within Run SQL scripts", "bbox": {"l": 70.800079, "t": 593.5376699999999, "r": 220.75178999999997, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "X", "bbox": {"l": 429.0000600000001, "t": 593.5376699999999, "r": 435.00305000000003, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "X", "bbox": {"l": 480.00037, "t": 593.5376699999999, "r": 486.00335999999993, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "X", "bbox": {"l": 505.2606799999999, "t": 593.5376699999999, "r": 511.26367, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "X", "bbox": {"l": 530.76038, "t": 593.5376699999999, "r": 536.76337, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "Visual Explain outside of Run SQL scripts", "bbox": {"l": 70.800079, "t": 612.55737, "r": 236.6548, "b": 620.88239, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "X", "bbox": {"l": 429.0000600000001, "t": 612.55737, "r": 435.00305000000003, "b": 620.88239, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "X", "bbox": {"l": 480.00037, "t": 612.55737, "r": 486.00335999999993, "b": 620.88239, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "ANALYZE PLAN CACHE procedure", "bbox": {"l": 70.800079, "t": 631.51767, "r": 213.12968, "b": 639.84268, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "X", "bbox": {"l": 429.0000600000001, "t": 631.51767, "r": 435.00305000000003, "b": 639.84268, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "X", "bbox": {"l": 480.00037, "t": 631.51767, "r": 486.00335999999993, "b": 639.84268, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "DUMP PLAN CACHE procedure", "bbox": {"l": 70.800079, "t": 650.53737, "r": 199.87808, "b": 658.86238, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "X", "bbox": {"l": 429.0000600000001, "t": 650.53737, "r": 435.00305000000003, "b": 658.86238, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "X", "bbox": {"l": 480.00037, "t": 650.53737, "r": 486.00335999999993, "b": 658.86238, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "MODIFY PLAN CACHE procedure", "bbox": {"l": 70.800079, "t": 669.55708, "r": 208.36777, "b": 677.88207, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "X", "bbox": {"l": 429.0000600000001, "t": 669.55708, "r": 435.00305000000003, "b": 677.88207, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "X", "bbox": {"l": 480.00037, "t": 669.55708, "r": 486.00335999999993, "b": 677.88207, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "MODIFY PLAN CACHE PROPERTIES procedure (currently does not check authority)", "bbox": {"l": 70.800079, "t": 688.57677, "r": 411.20264, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "X", "bbox": {"l": 429.0000600000001, "t": 688.57677, "r": 435.00305000000003, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "X", "bbox": {"l": 480.00037, "t": 688.57677, "r": 486.00335999999993, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "CHANGE PLAN CACHE SIZE procedure (currently does not check authority)", "bbox": {"l": 70.800079, "t": 707.537071, "r": 377.12585, "b": 715.862068, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "X", "bbox": {"l": 429.0000600000001, "t": 707.537071, "r": 435.00305000000003, "b": 715.862068, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "X", "bbox": {"l": 480.00037, "t": 707.537071, "r": 486.00335999999993, "b": 715.862068, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 7, "label": "page_footer", "bbox": {"l": 355.32001, "t": 755.538002, "r": 523.54071, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9508126378059387, "cells": [{"id": 0, "text": "Chapter 2. Roles and separation of duties ", "bbox": {"l": 355.32001, "t": 755.538002, "r": 523.54071, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "page_footer", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.8987301588058472, "cells": [{"id": 1, "text": "11", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 136.79959, "t": 71.50903000000005, "r": 542.69434, "b": 140.72113000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9789126515388489, "cells": [{"id": 2, "text": "For example, assume that a business has assigned the duty to manage security on IBM i to ", "bbox": {"l": 136.79959, "t": 71.50903000000005, "r": 542.69434, "b": 80.72204999999985, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Theresa. Before release IBM i 7.2, to grant privileges, Theresa had to have the same ", "bbox": {"l": 136.79959, "t": 83.50885000000017, "r": 513.67804, "b": 92.72185999999999, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "privileges Theresa was granting to others. Therefore, to grant *USE privileges to the ", "bbox": {"l": 136.79959, "t": 95.50867000000005, "r": 509.71902, "b": 104.72167999999999, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "PAYROLL table, Theresa had to have *OBJMGT and *USE authority (or a higher level of ", "bbox": {"l": 136.79959, "t": 107.50847999999996, "r": 528.20184, "b": 116.72149999999999, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "authority, such as *ALLOBJ). This requirement allowed Theresa to access the data in the ", "bbox": {"l": 136.79959, "t": 119.50829999999996, "r": 531.84015, "b": 128.72131000000002, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "PAYROLL table even though Theresa\u2019s job description was only to manage its security.", "bbox": {"l": 136.79959, "t": 131.50811999999996, "r": 519.24982, "b": 140.72113000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "text", "bbox": {"l": 136.79959, "t": 153.52770999999996, "r": 547.30396, "b": 198.74017000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9665538668632507, "cells": [{"id": 8, "text": "In IBM i 7.2, the QIBM_DB_SECADM function usage grants authorities, revokes authorities, ", "bbox": {"l": 136.79959, "t": 153.52770999999996, "r": 544.16064, "b": 162.74072, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "changes ownership, or changes the primary group without giving access to the object or, in ", "bbox": {"l": 136.79959, "t": 165.52752999999996, "r": 540.66156, "b": 174.74054, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "the case of a database table, to the data that is in the table or allowing other operations on the ", "bbox": {"l": 136.79959, "t": 177.52733999999998, "r": 547.30396, "b": 186.74036, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "table. ", "bbox": {"l": 136.79959, "t": 189.52715999999998, "r": 163.6189, "b": 198.74017000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "text", "bbox": {"l": 136.79959, "t": 211.48694, "r": 538.65076, "b": 232.69976999999994, "coord_origin": "TOPLEFT"}, "confidence": 0.9691813588142395, "cells": [{"id": 12, "text": "QIBM_DB_SECADM function usage can be granted only by a user with *SECADM special ", "bbox": {"l": 136.79959, "t": 211.48694, "r": 538.65076, "b": 220.69994999999994, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "authority and can be given to a user or a group.", "bbox": {"l": 136.79959, "t": 223.48676, "r": 346.34808, "b": 232.69976999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 136.79959, "t": 245.50635, "r": 545.79602, "b": 278.71898999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9729602336883545, "cells": [{"id": 14, "text": "QIBM_DB_SECADM also is responsible for administering RCAC, which restricts which rows ", "bbox": {"l": 136.79959, "t": 245.50635, "r": 545.79602, "b": 254.71936000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "a user is allowed to access in a table and whether a user is allowed to see information in ", "bbox": {"l": 136.79959, "t": 257.50616, "r": 529.46149, "b": 266.71918000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "certain columns of a table.", "bbox": {"l": 136.79959, "t": 269.50598, "r": 253.47696999999997, "b": 278.71898999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 136.79959, "t": 291.52557, "r": 539.80713, "b": 336.73801, "coord_origin": "TOPLEFT"}, "confidence": 0.9815152883529663, "cells": [{"id": 17, "text": "A preferred practice is that the RCAC administrator has the QIBM_DB_SECADM function ", "bbox": {"l": 136.79959, "t": 291.52557, "r": 533.78137, "b": 300.73856, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "usage ID, but absolutely no other data privileges. The result is that the RCAC administrator ", "bbox": {"l": 136.79959, "t": 303.52539, "r": 539.80713, "b": 312.73837000000003, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "can deploy and maintain the RCAC constructs, but cannot grant themselves unauthorized ", "bbox": {"l": 136.79959, "t": 315.52521, "r": 534.5741, "b": 324.73819, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "access to data itself.", "bbox": {"l": 136.79959, "t": 327.52502, "r": 227.02324, "b": 336.73801, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "text", "bbox": {"l": 136.79959, "t": 349.48483, "r": 543.06714, "b": 370.69763000000006, "coord_origin": "TOPLEFT"}, "confidence": 0.9672255516052246, "cells": [{"id": 21, "text": "Table 2-2 shows a comparison of the different function usage IDs and *JOBCTL authority to ", "bbox": {"l": 136.79959, "t": 349.48483, "r": 543.06714, "b": 358.69780999999995, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "the different CL commands and DB2 for i tools.", "bbox": {"l": 136.79959, "t": 361.48465, "r": 343.79236, "b": 370.69763000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "caption", "bbox": {"l": 64.800003, "t": 383.5379899999999, "r": 391.75464, "b": 391.86301, "coord_origin": "TOPLEFT"}, "confidence": 0.9337189793586731, "cells": [{"id": 23, "text": "Table 2-2 Comparison of the different function usage IDs and *JOBCTL authority", "bbox": {"l": 64.800003, "t": 383.5379899999999, "r": 391.75464, "b": 391.86301, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "table", "bbox": {"l": 64.41139221191406, "t": 393.6136169433594, "r": 547.3950805664062, "b": 721.60791015625, "coord_origin": "TOPLEFT"}, "confidence": 0.9899571537971497, "cells": [{"id": 24, "text": "User action", "bbox": {"l": 70.800301, "t": 400.51827999999995, "r": 119.78551, "b": 408.84329, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "*JOBCTL", "bbox": {"l": 424.93805, "t": 447.52255, "r": 433.26297000000005, "b": 487.01999, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "QIBM_DB_SECADM", "bbox": {"l": 450.13806, "t": 401.6000700000001, "r": 458.46298, "b": 487.01999, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "QIBM_DB_SQLADM", "bbox": {"l": 475.93835000000007, "t": 401.53442, "r": 484.26327999999995, "b": 487.01999, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "QIBM_DB_SYSMON", "bbox": {"l": 501.13837, "t": 401.6145, "r": 509.46329, "b": 487.01999, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "No Authority", "bbox": {"l": 526.39862, "t": 432.79944, "r": 534.72357, "b": 487.02005, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "SET CURRENT DEGREE", "bbox": {"l": 70.800003, "t": 498.69299, "r": 151.6794, "b": 506.66699, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": " (SQL statement)", "bbox": {"l": 151.6803, "t": 498.55798, "r": 220.15681000000004, "b": 506.883, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "X", "bbox": {"l": 429.0, "t": 498.55798, "r": 435.00299000000007, "b": 506.883, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "X", "bbox": {"l": 480.00031, "t": 498.55798, "r": 486.0033, "b": 506.883, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "CHGQRYA", "bbox": {"l": 70.800018, "t": 517.65329, "r": 102.23972, "b": 525.62729, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": " command targeting a different user\u2019s job", "bbox": {"l": 102.23972, "t": 517.51828, "r": 264.5538, "b": 525.84329, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "X", "bbox": {"l": 429.00003, "t": 517.51828, "r": 435.00302000000005, "b": 525.84329, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "X", "bbox": {"l": 480.00034, "t": 517.51828, "r": 486.00333, "b": 525.84329, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "STRDBMON", "bbox": {"l": 70.800049, "t": 536.67299, "r": 106.73975, "b": 544.64699, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": " or ", "bbox": {"l": 106.73975, "t": 536.5379800000001, "r": 119.77895, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "ENDDBMON", "bbox": {"l": 119.69975000000001, "t": 536.67299, "r": 155.69974, "b": 544.64699, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": " commands targeting a different user\u2019s job", "bbox": {"l": 155.69974, "t": 536.5379800000001, "r": 322.50574, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "X", "bbox": {"l": 429.00003, "t": 536.5379800000001, "r": 435.00302000000005, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "X", "bbox": {"l": 480.00034, "t": 536.5379800000001, "r": 486.00333, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "STRDBMON", "bbox": {"l": 70.800049, "t": 555.69269, "r": 106.73975, "b": 563.66669, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": " or ", "bbox": {"l": 106.73975, "t": 555.55768, "r": 119.77895, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "ENDDBMON", "bbox": {"l": 119.69975000000001, "t": 555.69269, "r": 155.69974, "b": 563.66669, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": " commands targeting a job that matches the current user", "bbox": {"l": 155.69974, "t": 555.55768, "r": 381.02185, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "X", "bbox": {"l": 429.00003, "t": 555.55768, "r": 435.00302000000005, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "X", "bbox": {"l": 480.00034, "t": 555.55768, "r": 486.00333, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "X", "bbox": {"l": 505.26061999999996, "t": 555.55768, "r": 511.26361, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "X", "bbox": {"l": 530.76031, "t": 555.55768, "r": 536.76331, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "QUSRJOBI() API format 900 or System i Navigator\u2019s SQL Details for Job", "bbox": {"l": 70.800049, "t": 574.51797, "r": 359.51736, "b": 582.84299, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "X", "bbox": {"l": 429.0000600000001, "t": 574.51797, "r": 435.00305000000003, "b": 582.84299, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "X", "bbox": {"l": 480.00037, "t": 574.51797, "r": 486.00335999999993, "b": 582.84299, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "X", "bbox": {"l": 505.2606799999999, "t": 574.51797, "r": 511.26367, "b": 582.84299, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Visual Explain within Run SQL scripts", "bbox": {"l": 70.800079, "t": 593.5376699999999, "r": 220.75178999999997, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "X", "bbox": {"l": 429.0000600000001, "t": 593.5376699999999, "r": 435.00305000000003, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "X", "bbox": {"l": 480.00037, "t": 593.5376699999999, "r": 486.00335999999993, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "X", "bbox": {"l": 505.2606799999999, "t": 593.5376699999999, "r": 511.26367, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "X", "bbox": {"l": 530.76038, "t": 593.5376699999999, "r": 536.76337, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "Visual Explain outside of Run SQL scripts", "bbox": {"l": 70.800079, "t": 612.55737, "r": 236.6548, "b": 620.88239, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "X", "bbox": {"l": 429.0000600000001, "t": 612.55737, "r": 435.00305000000003, "b": 620.88239, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "X", "bbox": {"l": 480.00037, "t": 612.55737, "r": 486.00335999999993, "b": 620.88239, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "ANALYZE PLAN CACHE procedure", "bbox": {"l": 70.800079, "t": 631.51767, "r": 213.12968, "b": 639.84268, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "X", "bbox": {"l": 429.0000600000001, "t": 631.51767, "r": 435.00305000000003, "b": 639.84268, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "X", "bbox": {"l": 480.00037, "t": 631.51767, "r": 486.00335999999993, "b": 639.84268, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "DUMP PLAN CACHE procedure", "bbox": {"l": 70.800079, "t": 650.53737, "r": 199.87808, "b": 658.86238, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "X", "bbox": {"l": 429.0000600000001, "t": 650.53737, "r": 435.00305000000003, "b": 658.86238, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "X", "bbox": {"l": 480.00037, "t": 650.53737, "r": 486.00335999999993, "b": 658.86238, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "MODIFY PLAN CACHE procedure", "bbox": {"l": 70.800079, "t": 669.55708, "r": 208.36777, "b": 677.88207, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "X", "bbox": {"l": 429.0000600000001, "t": 669.55708, "r": 435.00305000000003, "b": 677.88207, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "X", "bbox": {"l": 480.00037, "t": 669.55708, "r": 486.00335999999993, "b": 677.88207, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "MODIFY PLAN CACHE PROPERTIES procedure (currently does not check authority)", "bbox": {"l": 70.800079, "t": 688.57677, "r": 411.20264, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "X", "bbox": {"l": 429.0000600000001, "t": 688.57677, "r": 435.00305000000003, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "X", "bbox": {"l": 480.00037, "t": 688.57677, "r": 486.00335999999993, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "CHANGE PLAN CACHE SIZE procedure (currently does not check authority)", "bbox": {"l": 70.800079, "t": 707.537071, "r": 377.12585, "b": 715.862068, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "X", "bbox": {"l": 429.0000600000001, "t": 707.537071, "r": 435.00305000000003, "b": 715.862068, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "X", "bbox": {"l": 480.00037, "t": 707.537071, "r": 486.00335999999993, "b": 715.862068, "coord_origin": "TOPLEFT"}}], "children": [{"id": 10, "label": "text", "bbox": {"l": 70.800301, "t": 400.51827999999995, "r": 119.78551, "b": 408.84329, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "User action", "bbox": {"l": 70.800301, "t": 400.51827999999995, "r": 119.78551, "b": 408.84329, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 424.93805, "t": 447.52255, "r": 433.26297000000005, "b": 487.01999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "*JOBCTL", "bbox": {"l": 424.93805, "t": 447.52255, "r": 433.26297000000005, "b": 487.01999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 450.13806, "t": 401.6000700000001, "r": 458.46298, "b": 487.01999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "QIBM_DB_SECADM", "bbox": {"l": 450.13806, "t": 401.6000700000001, "r": 458.46298, "b": 487.01999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 475.93835000000007, "t": 401.53442, "r": 484.26327999999995, "b": 487.01999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "QIBM_DB_SQLADM", "bbox": {"l": 475.93835000000007, "t": 401.53442, "r": 484.26327999999995, "b": 487.01999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 501.13837, "t": 401.6145, "r": 509.46329, "b": 487.01999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "QIBM_DB_SYSMON", "bbox": {"l": 501.13837, "t": 401.6145, "r": 509.46329, "b": 487.01999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 526.39862, "t": 432.79944, "r": 534.72357, "b": 487.02005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "No Authority", "bbox": {"l": 526.39862, "t": 432.79944, "r": 534.72357, "b": 487.02005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 70.800003, "t": 498.69299, "r": 151.6794, "b": 506.66699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "SET CURRENT DEGREE", "bbox": {"l": 70.800003, "t": 498.69299, "r": 151.6794, "b": 506.66699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 151.6803, "t": 498.55798, "r": 220.15681000000004, "b": 506.883, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": " (SQL statement)", "bbox": {"l": 151.6803, "t": 498.55798, "r": 220.15681000000004, "b": 506.883, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 429.0, "t": 498.55798, "r": 435.00299000000007, "b": 506.883, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "X", "bbox": {"l": 429.0, "t": 498.55798, "r": 435.00299000000007, "b": 506.883, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 480.00031, "t": 498.55798, "r": 486.0033, "b": 506.883, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "X", "bbox": {"l": 480.00031, "t": 498.55798, "r": 486.0033, "b": 506.883, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 70.800018, "t": 517.65329, "r": 102.23972, "b": 525.62729, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "CHGQRYA", "bbox": {"l": 70.800018, "t": 517.65329, "r": 102.23972, "b": 525.62729, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 102.23972, "t": 517.51828, "r": 264.5538, "b": 525.84329, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": " command targeting a different user\u2019s job", "bbox": {"l": 102.23972, "t": 517.51828, "r": 264.5538, "b": 525.84329, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 429.00003, "t": 517.51828, "r": 435.00302000000005, "b": 525.84329, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "X", "bbox": {"l": 429.00003, "t": 517.51828, "r": 435.00302000000005, "b": 525.84329, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 480.00034, "t": 517.51828, "r": 486.00333, "b": 525.84329, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "X", "bbox": {"l": 480.00034, "t": 517.51828, "r": 486.00333, "b": 525.84329, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 70.800049, "t": 536.67299, "r": 106.73975, "b": 544.64699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "STRDBMON", "bbox": {"l": 70.800049, "t": 536.67299, "r": 106.73975, "b": 544.64699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 106.73975, "t": 536.5379800000001, "r": 119.77895, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": " or ", "bbox": {"l": 106.73975, "t": 536.5379800000001, "r": 119.77895, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 119.69975000000001, "t": 536.67299, "r": 155.69974, "b": 544.64699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "ENDDBMON", "bbox": {"l": 119.69975000000001, "t": 536.67299, "r": 155.69974, "b": 544.64699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 155.69974, "t": 536.5379800000001, "r": 322.50574, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": " commands targeting a different user\u2019s job", "bbox": {"l": 155.69974, "t": 536.5379800000001, "r": 322.50574, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 429.00003, "t": 536.5379800000001, "r": 435.00302000000005, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "X", "bbox": {"l": 429.00003, "t": 536.5379800000001, "r": 435.00302000000005, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 480.00034, "t": 536.5379800000001, "r": 486.00333, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "X", "bbox": {"l": 480.00034, "t": 536.5379800000001, "r": 486.00333, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 70.800049, "t": 555.69269, "r": 106.73975, "b": 563.66669, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "STRDBMON", "bbox": {"l": 70.800049, "t": 555.69269, "r": 106.73975, "b": 563.66669, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 106.73975, "t": 555.55768, "r": 119.77895, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": " or ", "bbox": {"l": 106.73975, "t": 555.55768, "r": 119.77895, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 119.69975000000001, "t": 555.69269, "r": 155.69974, "b": 563.66669, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "ENDDBMON", "bbox": {"l": 119.69975000000001, "t": 555.69269, "r": 155.69974, "b": 563.66669, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 155.69974, "t": 555.55768, "r": 381.02185, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": " commands targeting a job that matches the current user", "bbox": {"l": 155.69974, "t": 555.55768, "r": 381.02185, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 429.00003, "t": 555.55768, "r": 435.00302000000005, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "X", "bbox": {"l": 429.00003, "t": 555.55768, "r": 435.00302000000005, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 480.00034, "t": 555.55768, "r": 486.00333, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "X", "bbox": {"l": 480.00034, "t": 555.55768, "r": 486.00333, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 505.26061999999996, "t": 555.55768, "r": 511.26361, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "X", "bbox": {"l": 505.26061999999996, "t": 555.55768, "r": 511.26361, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 530.76031, "t": 555.55768, "r": 536.76331, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "X", "bbox": {"l": 530.76031, "t": 555.55768, "r": 536.76331, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 70.800049, "t": 574.51797, "r": 359.51736, "b": 582.84299, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "QUSRJOBI() API format 900 or System i Navigator\u2019s SQL Details for Job", "bbox": {"l": 70.800049, "t": 574.51797, "r": 359.51736, "b": 582.84299, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 429.0000600000001, "t": 574.51797, "r": 435.00305000000003, "b": 582.84299, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "X", "bbox": {"l": 429.0000600000001, "t": 574.51797, "r": 435.00305000000003, "b": 582.84299, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 480.00037, "t": 574.51797, "r": 486.00335999999993, "b": 582.84299, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "X", "bbox": {"l": 480.00037, "t": 574.51797, "r": 486.00335999999993, "b": 582.84299, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 505.2606799999999, "t": 574.51797, "r": 511.26367, "b": 582.84299, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "X", "bbox": {"l": 505.2606799999999, "t": 574.51797, "r": 511.26367, "b": 582.84299, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 70.800079, "t": 593.5376699999999, "r": 220.75178999999997, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "Visual Explain within Run SQL scripts", "bbox": {"l": 70.800079, "t": 593.5376699999999, "r": 220.75178999999997, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 429.0000600000001, "t": 593.5376699999999, "r": 435.00305000000003, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "X", "bbox": {"l": 429.0000600000001, "t": 593.5376699999999, "r": 435.00305000000003, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 480.00037, "t": 593.5376699999999, "r": 486.00335999999993, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "X", "bbox": {"l": 480.00037, "t": 593.5376699999999, "r": 486.00335999999993, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 505.2606799999999, "t": 593.5376699999999, "r": 511.26367, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "X", "bbox": {"l": 505.2606799999999, "t": 593.5376699999999, "r": 511.26367, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 530.76038, "t": 593.5376699999999, "r": 536.76337, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "X", "bbox": {"l": 530.76038, "t": 593.5376699999999, "r": 536.76337, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 70.800079, "t": 612.55737, "r": 236.6548, "b": 620.88239, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "Visual Explain outside of Run SQL scripts", "bbox": {"l": 70.800079, "t": 612.55737, "r": 236.6548, "b": 620.88239, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 429.0000600000001, "t": 612.55737, "r": 435.00305000000003, "b": 620.88239, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "X", "bbox": {"l": 429.0000600000001, "t": 612.55737, "r": 435.00305000000003, "b": 620.88239, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 480.00037, "t": 612.55737, "r": 486.00335999999993, "b": 620.88239, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "X", "bbox": {"l": 480.00037, "t": 612.55737, "r": 486.00335999999993, "b": 620.88239, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 70.800079, "t": 631.51767, "r": 213.12968, "b": 639.84268, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "ANALYZE PLAN CACHE procedure", "bbox": {"l": 70.800079, "t": 631.51767, "r": 213.12968, "b": 639.84268, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 429.0000600000001, "t": 631.51767, "r": 435.00305000000003, "b": 639.84268, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "X", "bbox": {"l": 429.0000600000001, "t": 631.51767, "r": 435.00305000000003, "b": 639.84268, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 480.00037, "t": 631.51767, "r": 486.00335999999993, "b": 639.84268, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "X", "bbox": {"l": 480.00037, "t": 631.51767, "r": 486.00335999999993, "b": 639.84268, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 70.800079, "t": 650.53737, "r": 199.87808, "b": 658.86238, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "DUMP PLAN CACHE procedure", "bbox": {"l": 70.800079, "t": 650.53737, "r": 199.87808, "b": 658.86238, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 429.0000600000001, "t": 650.53737, "r": 435.00305000000003, "b": 658.86238, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "X", "bbox": {"l": 429.0000600000001, "t": 650.53737, "r": 435.00305000000003, "b": 658.86238, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 480.00037, "t": 650.53737, "r": 486.00335999999993, "b": 658.86238, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "X", "bbox": {"l": 480.00037, "t": 650.53737, "r": 486.00335999999993, "b": 658.86238, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 70.800079, "t": 669.55708, "r": 208.36777, "b": 677.88207, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "MODIFY PLAN CACHE procedure", "bbox": {"l": 70.800079, "t": 669.55708, "r": 208.36777, "b": 677.88207, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 429.0000600000001, "t": 669.55708, "r": 435.00305000000003, "b": 677.88207, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "X", "bbox": {"l": 429.0000600000001, "t": 669.55708, "r": 435.00305000000003, "b": 677.88207, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 480.00037, "t": 669.55708, "r": 486.00335999999993, "b": 677.88207, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "X", "bbox": {"l": 480.00037, "t": 669.55708, "r": 486.00335999999993, "b": 677.88207, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 70.800079, "t": 688.57677, "r": 411.20264, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "MODIFY PLAN CACHE PROPERTIES procedure (currently does not check authority)", "bbox": {"l": 70.800079, "t": 688.57677, "r": 411.20264, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 429.0000600000001, "t": 688.57677, "r": 435.00305000000003, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "X", "bbox": {"l": 429.0000600000001, "t": 688.57677, "r": 435.00305000000003, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 480.00037, "t": 688.57677, "r": 486.00335999999993, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "X", "bbox": {"l": 480.00037, "t": 688.57677, "r": 486.00335999999993, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 70.800079, "t": 707.537071, "r": 377.12585, "b": 715.862068, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "CHANGE PLAN CACHE SIZE procedure (currently does not check authority)", "bbox": {"l": 70.800079, "t": 707.537071, "r": 377.12585, "b": 715.862068, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 429.0000600000001, "t": 707.537071, "r": 435.00305000000003, "b": 715.862068, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "X", "bbox": {"l": 429.0000600000001, "t": 707.537071, "r": 435.00305000000003, "b": 715.862068, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 480.00037, "t": 707.537071, "r": 486.00335999999993, "b": 715.862068, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "X", "bbox": {"l": 480.00037, "t": 707.537071, "r": 486.00335999999993, "b": 715.862068, "coord_origin": "TOPLEFT"}}], "children": []}]}]}, "tablestructure": {"table_map": {"0": {"label": "table", "id": 0, "page_no": 8, "cluster": {"id": 0, "label": "table", "bbox": {"l": 64.41139221191406, "t": 393.6136169433594, "r": 547.3950805664062, "b": 721.60791015625, "coord_origin": "TOPLEFT"}, "confidence": 0.9899571537971497, "cells": [{"id": 24, "text": "User action", "bbox": {"l": 70.800301, "t": 400.51827999999995, "r": 119.78551, "b": 408.84329, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "*JOBCTL", "bbox": {"l": 424.93805, "t": 447.52255, "r": 433.26297000000005, "b": 487.01999, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "QIBM_DB_SECADM", "bbox": {"l": 450.13806, "t": 401.6000700000001, "r": 458.46298, "b": 487.01999, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "QIBM_DB_SQLADM", "bbox": {"l": 475.93835000000007, "t": 401.53442, "r": 484.26327999999995, "b": 487.01999, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "QIBM_DB_SYSMON", "bbox": {"l": 501.13837, "t": 401.6145, "r": 509.46329, "b": 487.01999, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "No Authority", "bbox": {"l": 526.39862, "t": 432.79944, "r": 534.72357, "b": 487.02005, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "SET CURRENT DEGREE", "bbox": {"l": 70.800003, "t": 498.69299, "r": 151.6794, "b": 506.66699, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": " (SQL statement)", "bbox": {"l": 151.6803, "t": 498.55798, "r": 220.15681000000004, "b": 506.883, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "X", "bbox": {"l": 429.0, "t": 498.55798, "r": 435.00299000000007, "b": 506.883, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "X", "bbox": {"l": 480.00031, "t": 498.55798, "r": 486.0033, "b": 506.883, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "CHGQRYA", "bbox": {"l": 70.800018, "t": 517.65329, "r": 102.23972, "b": 525.62729, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": " command targeting a different user\u2019s job", "bbox": {"l": 102.23972, "t": 517.51828, "r": 264.5538, "b": 525.84329, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "X", "bbox": {"l": 429.00003, "t": 517.51828, "r": 435.00302000000005, "b": 525.84329, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "X", "bbox": {"l": 480.00034, "t": 517.51828, "r": 486.00333, "b": 525.84329, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "STRDBMON", "bbox": {"l": 70.800049, "t": 536.67299, "r": 106.73975, "b": 544.64699, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": " or ", "bbox": {"l": 106.73975, "t": 536.5379800000001, "r": 119.77895, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "ENDDBMON", "bbox": {"l": 119.69975000000001, "t": 536.67299, "r": 155.69974, "b": 544.64699, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": " commands targeting a different user\u2019s job", "bbox": {"l": 155.69974, "t": 536.5379800000001, "r": 322.50574, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "X", "bbox": {"l": 429.00003, "t": 536.5379800000001, "r": 435.00302000000005, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "X", "bbox": {"l": 480.00034, "t": 536.5379800000001, "r": 486.00333, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "STRDBMON", "bbox": {"l": 70.800049, "t": 555.69269, "r": 106.73975, "b": 563.66669, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": " or ", "bbox": {"l": 106.73975, "t": 555.55768, "r": 119.77895, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "ENDDBMON", "bbox": {"l": 119.69975000000001, "t": 555.69269, "r": 155.69974, "b": 563.66669, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": " commands targeting a job that matches the current user", "bbox": {"l": 155.69974, "t": 555.55768, "r": 381.02185, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "X", "bbox": {"l": 429.00003, "t": 555.55768, "r": 435.00302000000005, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "X", "bbox": {"l": 480.00034, "t": 555.55768, "r": 486.00333, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "X", "bbox": {"l": 505.26061999999996, "t": 555.55768, "r": 511.26361, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "X", "bbox": {"l": 530.76031, "t": 555.55768, "r": 536.76331, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "QUSRJOBI() API format 900 or System i Navigator\u2019s SQL Details for Job", "bbox": {"l": 70.800049, "t": 574.51797, "r": 359.51736, "b": 582.84299, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "X", "bbox": {"l": 429.0000600000001, "t": 574.51797, "r": 435.00305000000003, "b": 582.84299, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "X", "bbox": {"l": 480.00037, "t": 574.51797, "r": 486.00335999999993, "b": 582.84299, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "X", "bbox": {"l": 505.2606799999999, "t": 574.51797, "r": 511.26367, "b": 582.84299, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Visual Explain within Run SQL scripts", "bbox": {"l": 70.800079, "t": 593.5376699999999, "r": 220.75178999999997, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "X", "bbox": {"l": 429.0000600000001, "t": 593.5376699999999, "r": 435.00305000000003, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "X", "bbox": {"l": 480.00037, "t": 593.5376699999999, "r": 486.00335999999993, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "X", "bbox": {"l": 505.2606799999999, "t": 593.5376699999999, "r": 511.26367, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "X", "bbox": {"l": 530.76038, "t": 593.5376699999999, "r": 536.76337, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "Visual Explain outside of Run SQL scripts", "bbox": {"l": 70.800079, "t": 612.55737, "r": 236.6548, "b": 620.88239, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "X", "bbox": {"l": 429.0000600000001, "t": 612.55737, "r": 435.00305000000003, "b": 620.88239, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "X", "bbox": {"l": 480.00037, "t": 612.55737, "r": 486.00335999999993, "b": 620.88239, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "ANALYZE PLAN CACHE procedure", "bbox": {"l": 70.800079, "t": 631.51767, "r": 213.12968, "b": 639.84268, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "X", "bbox": {"l": 429.0000600000001, "t": 631.51767, "r": 435.00305000000003, "b": 639.84268, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "X", "bbox": {"l": 480.00037, "t": 631.51767, "r": 486.00335999999993, "b": 639.84268, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "DUMP PLAN CACHE procedure", "bbox": {"l": 70.800079, "t": 650.53737, "r": 199.87808, "b": 658.86238, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "X", "bbox": {"l": 429.0000600000001, "t": 650.53737, "r": 435.00305000000003, "b": 658.86238, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "X", "bbox": {"l": 480.00037, "t": 650.53737, "r": 486.00335999999993, "b": 658.86238, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "MODIFY PLAN CACHE procedure", "bbox": {"l": 70.800079, "t": 669.55708, "r": 208.36777, "b": 677.88207, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "X", "bbox": {"l": 429.0000600000001, "t": 669.55708, "r": 435.00305000000003, "b": 677.88207, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "X", "bbox": {"l": 480.00037, "t": 669.55708, "r": 486.00335999999993, "b": 677.88207, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "MODIFY PLAN CACHE PROPERTIES procedure (currently does not check authority)", "bbox": {"l": 70.800079, "t": 688.57677, "r": 411.20264, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "X", "bbox": {"l": 429.0000600000001, "t": 688.57677, "r": 435.00305000000003, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "X", "bbox": {"l": 480.00037, "t": 688.57677, "r": 486.00335999999993, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "CHANGE PLAN CACHE SIZE procedure (currently does not check authority)", "bbox": {"l": 70.800079, "t": 707.537071, "r": 377.12585, "b": 715.862068, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "X", "bbox": {"l": 429.0000600000001, "t": 707.537071, "r": 435.00305000000003, "b": 715.862068, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "X", "bbox": {"l": 480.00037, "t": 707.537071, "r": 486.00335999999993, "b": 715.862068, "coord_origin": "TOPLEFT"}}], "children": [{"id": 10, "label": "text", "bbox": {"l": 70.800301, "t": 400.51827999999995, "r": 119.78551, "b": 408.84329, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "User action", "bbox": {"l": 70.800301, "t": 400.51827999999995, "r": 119.78551, "b": 408.84329, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 424.93805, "t": 447.52255, "r": 433.26297000000005, "b": 487.01999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "*JOBCTL", "bbox": {"l": 424.93805, "t": 447.52255, "r": 433.26297000000005, "b": 487.01999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 450.13806, "t": 401.6000700000001, "r": 458.46298, "b": 487.01999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "QIBM_DB_SECADM", "bbox": {"l": 450.13806, "t": 401.6000700000001, "r": 458.46298, "b": 487.01999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 475.93835000000007, "t": 401.53442, "r": 484.26327999999995, "b": 487.01999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "QIBM_DB_SQLADM", "bbox": {"l": 475.93835000000007, "t": 401.53442, "r": 484.26327999999995, "b": 487.01999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 501.13837, "t": 401.6145, "r": 509.46329, "b": 487.01999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "QIBM_DB_SYSMON", "bbox": {"l": 501.13837, "t": 401.6145, "r": 509.46329, "b": 487.01999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 526.39862, "t": 432.79944, "r": 534.72357, "b": 487.02005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "No Authority", "bbox": {"l": 526.39862, "t": 432.79944, "r": 534.72357, "b": 487.02005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 70.800003, "t": 498.69299, "r": 151.6794, "b": 506.66699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "SET CURRENT DEGREE", "bbox": {"l": 70.800003, "t": 498.69299, "r": 151.6794, "b": 506.66699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 151.6803, "t": 498.55798, "r": 220.15681000000004, "b": 506.883, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": " (SQL statement)", "bbox": {"l": 151.6803, "t": 498.55798, "r": 220.15681000000004, "b": 506.883, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 429.0, "t": 498.55798, "r": 435.00299000000007, "b": 506.883, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "X", "bbox": {"l": 429.0, "t": 498.55798, "r": 435.00299000000007, "b": 506.883, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 480.00031, "t": 498.55798, "r": 486.0033, "b": 506.883, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "X", "bbox": {"l": 480.00031, "t": 498.55798, "r": 486.0033, "b": 506.883, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 70.800018, "t": 517.65329, "r": 102.23972, "b": 525.62729, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "CHGQRYA", "bbox": {"l": 70.800018, "t": 517.65329, "r": 102.23972, "b": 525.62729, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 102.23972, "t": 517.51828, "r": 264.5538, "b": 525.84329, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": " command targeting a different user\u2019s job", "bbox": {"l": 102.23972, "t": 517.51828, "r": 264.5538, "b": 525.84329, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 429.00003, "t": 517.51828, "r": 435.00302000000005, "b": 525.84329, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "X", "bbox": {"l": 429.00003, "t": 517.51828, "r": 435.00302000000005, "b": 525.84329, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 480.00034, "t": 517.51828, "r": 486.00333, "b": 525.84329, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "X", "bbox": {"l": 480.00034, "t": 517.51828, "r": 486.00333, "b": 525.84329, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 70.800049, "t": 536.67299, "r": 106.73975, "b": 544.64699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "STRDBMON", "bbox": {"l": 70.800049, "t": 536.67299, "r": 106.73975, "b": 544.64699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 106.73975, "t": 536.5379800000001, "r": 119.77895, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": " or ", "bbox": {"l": 106.73975, "t": 536.5379800000001, "r": 119.77895, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 119.69975000000001, "t": 536.67299, "r": 155.69974, "b": 544.64699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "ENDDBMON", "bbox": {"l": 119.69975000000001, "t": 536.67299, "r": 155.69974, "b": 544.64699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 155.69974, "t": 536.5379800000001, "r": 322.50574, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": " commands targeting a different user\u2019s job", "bbox": {"l": 155.69974, "t": 536.5379800000001, "r": 322.50574, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 429.00003, "t": 536.5379800000001, "r": 435.00302000000005, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "X", "bbox": {"l": 429.00003, "t": 536.5379800000001, "r": 435.00302000000005, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 480.00034, "t": 536.5379800000001, "r": 486.00333, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "X", "bbox": {"l": 480.00034, "t": 536.5379800000001, "r": 486.00333, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 70.800049, "t": 555.69269, "r": 106.73975, "b": 563.66669, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "STRDBMON", "bbox": {"l": 70.800049, "t": 555.69269, "r": 106.73975, "b": 563.66669, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 106.73975, "t": 555.55768, "r": 119.77895, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": " or ", "bbox": {"l": 106.73975, "t": 555.55768, "r": 119.77895, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 119.69975000000001, "t": 555.69269, "r": 155.69974, "b": 563.66669, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "ENDDBMON", "bbox": {"l": 119.69975000000001, "t": 555.69269, "r": 155.69974, "b": 563.66669, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 155.69974, "t": 555.55768, "r": 381.02185, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": " commands targeting a job that matches the current user", "bbox": {"l": 155.69974, "t": 555.55768, "r": 381.02185, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 429.00003, "t": 555.55768, "r": 435.00302000000005, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "X", "bbox": {"l": 429.00003, "t": 555.55768, "r": 435.00302000000005, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 480.00034, "t": 555.55768, "r": 486.00333, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "X", "bbox": {"l": 480.00034, "t": 555.55768, "r": 486.00333, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 505.26061999999996, "t": 555.55768, "r": 511.26361, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "X", "bbox": {"l": 505.26061999999996, "t": 555.55768, "r": 511.26361, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 530.76031, "t": 555.55768, "r": 536.76331, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "X", "bbox": {"l": 530.76031, "t": 555.55768, "r": 536.76331, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 70.800049, "t": 574.51797, "r": 359.51736, "b": 582.84299, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "QUSRJOBI() API format 900 or System i Navigator\u2019s SQL Details for Job", "bbox": {"l": 70.800049, "t": 574.51797, "r": 359.51736, "b": 582.84299, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 429.0000600000001, "t": 574.51797, "r": 435.00305000000003, "b": 582.84299, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "X", "bbox": {"l": 429.0000600000001, "t": 574.51797, "r": 435.00305000000003, "b": 582.84299, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 480.00037, "t": 574.51797, "r": 486.00335999999993, "b": 582.84299, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "X", "bbox": {"l": 480.00037, "t": 574.51797, "r": 486.00335999999993, "b": 582.84299, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 505.2606799999999, "t": 574.51797, "r": 511.26367, "b": 582.84299, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "X", "bbox": {"l": 505.2606799999999, "t": 574.51797, "r": 511.26367, "b": 582.84299, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 70.800079, "t": 593.5376699999999, "r": 220.75178999999997, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "Visual Explain within Run SQL scripts", "bbox": {"l": 70.800079, "t": 593.5376699999999, "r": 220.75178999999997, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 429.0000600000001, "t": 593.5376699999999, "r": 435.00305000000003, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "X", "bbox": {"l": 429.0000600000001, "t": 593.5376699999999, "r": 435.00305000000003, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 480.00037, "t": 593.5376699999999, "r": 486.00335999999993, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "X", "bbox": {"l": 480.00037, "t": 593.5376699999999, "r": 486.00335999999993, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 505.2606799999999, "t": 593.5376699999999, "r": 511.26367, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "X", "bbox": {"l": 505.2606799999999, "t": 593.5376699999999, "r": 511.26367, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 530.76038, "t": 593.5376699999999, "r": 536.76337, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "X", "bbox": {"l": 530.76038, "t": 593.5376699999999, "r": 536.76337, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 70.800079, "t": 612.55737, "r": 236.6548, "b": 620.88239, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "Visual Explain outside of Run SQL scripts", "bbox": {"l": 70.800079, "t": 612.55737, "r": 236.6548, "b": 620.88239, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 429.0000600000001, "t": 612.55737, "r": 435.00305000000003, "b": 620.88239, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "X", "bbox": {"l": 429.0000600000001, "t": 612.55737, "r": 435.00305000000003, "b": 620.88239, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 480.00037, "t": 612.55737, "r": 486.00335999999993, "b": 620.88239, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "X", "bbox": {"l": 480.00037, "t": 612.55737, "r": 486.00335999999993, "b": 620.88239, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 70.800079, "t": 631.51767, "r": 213.12968, "b": 639.84268, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "ANALYZE PLAN CACHE procedure", "bbox": {"l": 70.800079, "t": 631.51767, "r": 213.12968, "b": 639.84268, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 429.0000600000001, "t": 631.51767, "r": 435.00305000000003, "b": 639.84268, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "X", "bbox": {"l": 429.0000600000001, "t": 631.51767, "r": 435.00305000000003, "b": 639.84268, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 480.00037, "t": 631.51767, "r": 486.00335999999993, "b": 639.84268, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "X", "bbox": {"l": 480.00037, "t": 631.51767, "r": 486.00335999999993, "b": 639.84268, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 70.800079, "t": 650.53737, "r": 199.87808, "b": 658.86238, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "DUMP PLAN CACHE procedure", "bbox": {"l": 70.800079, "t": 650.53737, "r": 199.87808, "b": 658.86238, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 429.0000600000001, "t": 650.53737, "r": 435.00305000000003, "b": 658.86238, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "X", "bbox": {"l": 429.0000600000001, "t": 650.53737, "r": 435.00305000000003, "b": 658.86238, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 480.00037, "t": 650.53737, "r": 486.00335999999993, "b": 658.86238, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "X", "bbox": {"l": 480.00037, "t": 650.53737, "r": 486.00335999999993, "b": 658.86238, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 70.800079, "t": 669.55708, "r": 208.36777, "b": 677.88207, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "MODIFY PLAN CACHE procedure", "bbox": {"l": 70.800079, "t": 669.55708, "r": 208.36777, "b": 677.88207, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 429.0000600000001, "t": 669.55708, "r": 435.00305000000003, "b": 677.88207, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "X", "bbox": {"l": 429.0000600000001, "t": 669.55708, "r": 435.00305000000003, "b": 677.88207, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 480.00037, "t": 669.55708, "r": 486.00335999999993, "b": 677.88207, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "X", "bbox": {"l": 480.00037, "t": 669.55708, "r": 486.00335999999993, "b": 677.88207, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 70.800079, "t": 688.57677, "r": 411.20264, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "MODIFY PLAN CACHE PROPERTIES procedure (currently does not check authority)", "bbox": {"l": 70.800079, "t": 688.57677, "r": 411.20264, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 429.0000600000001, "t": 688.57677, "r": 435.00305000000003, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "X", "bbox": {"l": 429.0000600000001, "t": 688.57677, "r": 435.00305000000003, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 480.00037, "t": 688.57677, "r": 486.00335999999993, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "X", "bbox": {"l": 480.00037, "t": 688.57677, "r": 486.00335999999993, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 70.800079, "t": 707.537071, "r": 377.12585, "b": 715.862068, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "CHANGE PLAN CACHE SIZE procedure (currently does not check authority)", "bbox": {"l": 70.800079, "t": 707.537071, "r": 377.12585, "b": 715.862068, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 429.0000600000001, "t": 707.537071, "r": 435.00305000000003, "b": 715.862068, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "X", "bbox": {"l": 429.0000600000001, "t": 707.537071, "r": 435.00305000000003, "b": 715.862068, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 480.00037, "t": 707.537071, "r": 486.00335999999993, "b": 715.862068, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "X", "bbox": {"l": 480.00037, "t": 707.537071, "r": 486.00335999999993, "b": 715.862068, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "ecel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "ecel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "ecel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "ecel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "ecel", "fcel", "fcel", "ecel", "nl", "rhed", "fcel", "ecel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "ecel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "ecel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "ecel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "ecel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "ecel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "ecel", "fcel", "ecel", "ecel", "nl"], "num_rows": 13, "num_cols": 6, "table_cells": [{"bbox": {"l": 70.800301, "t": 400.51827999999995, "r": 119.78551, "b": 408.84329, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "User action", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 424.93805, "t": 447.52255, "r": 433.26297000000005, "b": 487.01999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "*JOBCTL", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 450.13806, "t": 401.6000700000001, "r": 458.46298, "b": 487.01999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "QIBM_DB_SECADM", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 475.93835000000007, "t": 401.53442, "r": 484.26327999999995, "b": 487.01999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "QIBM_DB_SQLADM", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 501.13837, "t": 401.6145, "r": 509.46329, "b": 487.01999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "QIBM_DB_SYSMON", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 526.39862, "t": 432.79944, "r": 534.72357, "b": 487.02005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "No Authority", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800003, "t": 498.55798, "r": 220.15681000000004, "b": 506.883, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "SET CURRENT DEGREE  (SQL statement)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0, "t": 498.55798, "r": 435.00299000000007, "b": 506.883, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00031, "t": 498.55798, "r": 486.0033, "b": 506.883, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800018, "t": 517.51828, "r": 264.5538, "b": 525.84329, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "CHGQRYA  command targeting a different user\u2019s job", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.00003, "t": 517.51828, "r": 435.00302000000005, "b": 525.84329, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00034, "t": 517.51828, "r": 486.00333, "b": 525.84329, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800049, "t": 536.5379800000001, "r": 322.50574, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "STRDBMON  or  ENDDBMON  commands targeting a different user\u2019s job", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.00003, "t": 536.5379800000001, "r": 435.00302000000005, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00034, "t": 536.5379800000001, "r": 486.00333, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800049, "t": 555.55768, "r": 381.02185, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "STRDBMON  or  ENDDBMON  commands targeting a job that matches the current user", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.00003, "t": 555.55768, "r": 435.00302000000005, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00034, "t": 555.55768, "r": 486.00333, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 505.26061999999996, "t": 555.55768, "r": 511.26361, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 530.76031, "t": 555.55768, "r": 536.76331, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800049, "t": 574.51797, "r": 359.51736, "b": 582.84299, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "QUSRJOBI() API format 900 or System i Navigator\u2019s SQL Details for Job", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 574.51797, "r": 435.00305000000003, "b": 582.84299, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 574.51797, "r": 486.00335999999993, "b": 582.84299, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 505.2606799999999, "t": 574.51797, "r": 511.26367, "b": 582.84299, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800079, "t": 593.5376699999999, "r": 220.75178999999997, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Visual Explain within Run SQL scripts", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 593.5376699999999, "r": 435.00305000000003, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 593.5376699999999, "r": 486.00335999999993, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 505.2606799999999, "t": 593.5376699999999, "r": 511.26367, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 530.76038, "t": 593.5376699999999, "r": 536.76337, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800079, "t": 612.55737, "r": 236.6548, "b": 620.88239, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Visual Explain outside of Run SQL scripts", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 612.55737, "r": 435.00305000000003, "b": 620.88239, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 612.55737, "r": 486.00335999999993, "b": 620.88239, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800079, "t": 631.51767, "r": 213.12968, "b": 639.84268, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "ANALYZE PLAN CACHE procedure", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 631.51767, "r": 435.00305000000003, "b": 639.84268, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 631.51767, "r": 486.00335999999993, "b": 639.84268, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800079, "t": 650.53737, "r": 199.87808, "b": 658.86238, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "DUMP PLAN CACHE procedure", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 650.53737, "r": 435.00305000000003, "b": 658.86238, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 650.53737, "r": 486.00335999999993, "b": 658.86238, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800079, "t": 669.55708, "r": 208.36777, "b": 677.88207, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "MODIFY PLAN CACHE procedure", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 669.55708, "r": 435.00305000000003, "b": 677.88207, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 669.55708, "r": 486.00335999999993, "b": 677.88207, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800079, "t": 688.57677, "r": 411.20264, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "MODIFY PLAN CACHE PROPERTIES procedure (currently does not check authority)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 688.57677, "r": 435.00305000000003, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 688.57677, "r": 486.00335999999993, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800079, "t": 707.537071, "r": 377.12585, "b": 715.862068, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "CHANGE PLAN CACHE SIZE procedure (currently does not check authority)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 707.537071, "r": 435.00305000000003, "b": 715.862068, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 707.537071, "r": 486.00335999999993, "b": 715.862068, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}]}}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_footer", "id": 7, "page_no": 8, "cluster": {"id": 7, "label": "page_footer", "bbox": {"l": 355.32001, "t": 755.538002, "r": 523.54071, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9508126378059387, "cells": [{"id": 0, "text": "Chapter 2. Roles and separation of duties ", "bbox": {"l": 355.32001, "t": 755.538002, "r": 523.54071, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Chapter 2. Roles and separation of duties"}, {"label": "page_footer", "id": 9, "page_no": 8, "cluster": {"id": 9, "label": "page_footer", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.8987301588058472, "cells": [{"id": 1, "text": "11", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "11"}, {"label": "text", "id": 2, "page_no": 8, "cluster": {"id": 2, "label": "text", "bbox": {"l": 136.79959, "t": 71.50903000000005, "r": 542.69434, "b": 140.72113000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9789126515388489, "cells": [{"id": 2, "text": "For example, assume that a business has assigned the duty to manage security on IBM i to ", "bbox": {"l": 136.79959, "t": 71.50903000000005, "r": 542.69434, "b": 80.72204999999985, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Theresa. Before release IBM i 7.2, to grant privileges, Theresa had to have the same ", "bbox": {"l": 136.79959, "t": 83.50885000000017, "r": 513.67804, "b": 92.72185999999999, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "privileges Theresa was granting to others. Therefore, to grant *USE privileges to the ", "bbox": {"l": 136.79959, "t": 95.50867000000005, "r": 509.71902, "b": 104.72167999999999, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "PAYROLL table, Theresa had to have *OBJMGT and *USE authority (or a higher level of ", "bbox": {"l": 136.79959, "t": 107.50847999999996, "r": 528.20184, "b": 116.72149999999999, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "authority, such as *ALLOBJ). This requirement allowed Theresa to access the data in the ", "bbox": {"l": 136.79959, "t": 119.50829999999996, "r": 531.84015, "b": 128.72131000000002, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "PAYROLL table even though Theresa\u2019s job description was only to manage its security.", "bbox": {"l": 136.79959, "t": 131.50811999999996, "r": 519.24982, "b": 140.72113000000002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "For example, assume that a business has assigned the duty to manage security on IBM i to Theresa. Before release IBM i 7.2, to grant privileges, Theresa had to have the same privileges Theresa was granting to others. Therefore, to grant *USE privileges to the PAYROLL table, Theresa had to have *OBJMGT and *USE authority (or a higher level of authority, such as *ALLOBJ). This requirement allowed Theresa to access the data in the PAYROLL table even though Theresa's job description was only to manage its security."}, {"label": "text", "id": 6, "page_no": 8, "cluster": {"id": 6, "label": "text", "bbox": {"l": 136.79959, "t": 153.52770999999996, "r": 547.30396, "b": 198.74017000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9665538668632507, "cells": [{"id": 8, "text": "In IBM i 7.2, the QIBM_DB_SECADM function usage grants authorities, revokes authorities, ", "bbox": {"l": 136.79959, "t": 153.52770999999996, "r": 544.16064, "b": 162.74072, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "changes ownership, or changes the primary group without giving access to the object or, in ", "bbox": {"l": 136.79959, "t": 165.52752999999996, "r": 540.66156, "b": 174.74054, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "the case of a database table, to the data that is in the table or allowing other operations on the ", "bbox": {"l": 136.79959, "t": 177.52733999999998, "r": 547.30396, "b": 186.74036, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "table. ", "bbox": {"l": 136.79959, "t": 189.52715999999998, "r": 163.6189, "b": 198.74017000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In IBM i 7.2, the QIBM_DB_SECADM function usage grants authorities, revokes authorities, changes ownership, or changes the primary group without giving access to the object or, in the case of a database table, to the data that is in the table or allowing other operations on the table."}, {"label": "text", "id": 4, "page_no": 8, "cluster": {"id": 4, "label": "text", "bbox": {"l": 136.79959, "t": 211.48694, "r": 538.65076, "b": 232.69976999999994, "coord_origin": "TOPLEFT"}, "confidence": 0.9691813588142395, "cells": [{"id": 12, "text": "QIBM_DB_SECADM function usage can be granted only by a user with *SECADM special ", "bbox": {"l": 136.79959, "t": 211.48694, "r": 538.65076, "b": 220.69994999999994, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "authority and can be given to a user or a group.", "bbox": {"l": 136.79959, "t": 223.48676, "r": 346.34808, "b": 232.69976999999994, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "QIBM_DB_SECADM function usage can be granted only by a user with *SECADM special authority and can be given to a user or a group."}, {"label": "text", "id": 3, "page_no": 8, "cluster": {"id": 3, "label": "text", "bbox": {"l": 136.79959, "t": 245.50635, "r": 545.79602, "b": 278.71898999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9729602336883545, "cells": [{"id": 14, "text": "QIBM_DB_SECADM also is responsible for administering RCAC, which restricts which rows ", "bbox": {"l": 136.79959, "t": 245.50635, "r": 545.79602, "b": 254.71936000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "a user is allowed to access in a table and whether a user is allowed to see information in ", "bbox": {"l": 136.79959, "t": 257.50616, "r": 529.46149, "b": 266.71918000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "certain columns of a table.", "bbox": {"l": 136.79959, "t": 269.50598, "r": 253.47696999999997, "b": 278.71898999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "QIBM_DB_SECADM also is responsible for administering RCAC, which restricts which rows a user is allowed to access in a table and whether a user is allowed to see information in certain columns of a table."}, {"label": "text", "id": 1, "page_no": 8, "cluster": {"id": 1, "label": "text", "bbox": {"l": 136.79959, "t": 291.52557, "r": 539.80713, "b": 336.73801, "coord_origin": "TOPLEFT"}, "confidence": 0.9815152883529663, "cells": [{"id": 17, "text": "A preferred practice is that the RCAC administrator has the QIBM_DB_SECADM function ", "bbox": {"l": 136.79959, "t": 291.52557, "r": 533.78137, "b": 300.73856, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "usage ID, but absolutely no other data privileges. The result is that the RCAC administrator ", "bbox": {"l": 136.79959, "t": 303.52539, "r": 539.80713, "b": 312.73837000000003, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "can deploy and maintain the RCAC constructs, but cannot grant themselves unauthorized ", "bbox": {"l": 136.79959, "t": 315.52521, "r": 534.5741, "b": 324.73819, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "access to data itself.", "bbox": {"l": 136.79959, "t": 327.52502, "r": 227.02324, "b": 336.73801, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "A preferred practice is that the RCAC administrator has the QIBM_DB_SECADM function usage ID, but absolutely no other data privileges. The result is that the RCAC administrator can deploy and maintain the RCAC constructs, but cannot grant themselves unauthorized access to data itself."}, {"label": "text", "id": 5, "page_no": 8, "cluster": {"id": 5, "label": "text", "bbox": {"l": 136.79959, "t": 349.48483, "r": 543.06714, "b": 370.69763000000006, "coord_origin": "TOPLEFT"}, "confidence": 0.9672255516052246, "cells": [{"id": 21, "text": "Table 2-2 shows a comparison of the different function usage IDs and *JOBCTL authority to ", "bbox": {"l": 136.79959, "t": 349.48483, "r": 543.06714, "b": 358.69780999999995, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "the different CL commands and DB2 for i tools.", "bbox": {"l": 136.79959, "t": 361.48465, "r": 343.79236, "b": 370.69763000000006, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 2-2 shows a comparison of the different function usage IDs and *JOBCTL authority to the different CL commands and DB2 for i tools."}, {"label": "caption", "id": 8, "page_no": 8, "cluster": {"id": 8, "label": "caption", "bbox": {"l": 64.800003, "t": 383.5379899999999, "r": 391.75464, "b": 391.86301, "coord_origin": "TOPLEFT"}, "confidence": 0.9337189793586731, "cells": [{"id": 23, "text": "Table 2-2 Comparison of the different function usage IDs and *JOBCTL authority", "bbox": {"l": 64.800003, "t": 383.5379899999999, "r": 391.75464, "b": 391.86301, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 2-2 Comparison of the different function usage IDs and *JOBCTL authority"}, {"label": "table", "id": 0, "page_no": 8, "cluster": {"id": 0, "label": "table", "bbox": {"l": 64.41139221191406, "t": 393.6136169433594, "r": 547.3950805664062, "b": 721.60791015625, "coord_origin": "TOPLEFT"}, "confidence": 0.9899571537971497, "cells": [{"id": 24, "text": "User action", "bbox": {"l": 70.800301, "t": 400.51827999999995, "r": 119.78551, "b": 408.84329, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "*JOBCTL", "bbox": {"l": 424.93805, "t": 447.52255, "r": 433.26297000000005, "b": 487.01999, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "QIBM_DB_SECADM", "bbox": {"l": 450.13806, "t": 401.6000700000001, "r": 458.46298, "b": 487.01999, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "QIBM_DB_SQLADM", "bbox": {"l": 475.93835000000007, "t": 401.53442, "r": 484.26327999999995, "b": 487.01999, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "QIBM_DB_SYSMON", "bbox": {"l": 501.13837, "t": 401.6145, "r": 509.46329, "b": 487.01999, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "No Authority", "bbox": {"l": 526.39862, "t": 432.79944, "r": 534.72357, "b": 487.02005, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "SET CURRENT DEGREE", "bbox": {"l": 70.800003, "t": 498.69299, "r": 151.6794, "b": 506.66699, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": " (SQL statement)", "bbox": {"l": 151.6803, "t": 498.55798, "r": 220.15681000000004, "b": 506.883, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "X", "bbox": {"l": 429.0, "t": 498.55798, "r": 435.00299000000007, "b": 506.883, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "X", "bbox": {"l": 480.00031, "t": 498.55798, "r": 486.0033, "b": 506.883, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "CHGQRYA", "bbox": {"l": 70.800018, "t": 517.65329, "r": 102.23972, "b": 525.62729, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": " command targeting a different user\u2019s job", "bbox": {"l": 102.23972, "t": 517.51828, "r": 264.5538, "b": 525.84329, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "X", "bbox": {"l": 429.00003, "t": 517.51828, "r": 435.00302000000005, "b": 525.84329, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "X", "bbox": {"l": 480.00034, "t": 517.51828, "r": 486.00333, "b": 525.84329, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "STRDBMON", "bbox": {"l": 70.800049, "t": 536.67299, "r": 106.73975, "b": 544.64699, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": " or ", "bbox": {"l": 106.73975, "t": 536.5379800000001, "r": 119.77895, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "ENDDBMON", "bbox": {"l": 119.69975000000001, "t": 536.67299, "r": 155.69974, "b": 544.64699, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": " commands targeting a different user\u2019s job", "bbox": {"l": 155.69974, "t": 536.5379800000001, "r": 322.50574, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "X", "bbox": {"l": 429.00003, "t": 536.5379800000001, "r": 435.00302000000005, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "X", "bbox": {"l": 480.00034, "t": 536.5379800000001, "r": 486.00333, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "STRDBMON", "bbox": {"l": 70.800049, "t": 555.69269, "r": 106.73975, "b": 563.66669, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": " or ", "bbox": {"l": 106.73975, "t": 555.55768, "r": 119.77895, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "ENDDBMON", "bbox": {"l": 119.69975000000001, "t": 555.69269, "r": 155.69974, "b": 563.66669, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": " commands targeting a job that matches the current user", "bbox": {"l": 155.69974, "t": 555.55768, "r": 381.02185, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "X", "bbox": {"l": 429.00003, "t": 555.55768, "r": 435.00302000000005, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "X", "bbox": {"l": 480.00034, "t": 555.55768, "r": 486.00333, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "X", "bbox": {"l": 505.26061999999996, "t": 555.55768, "r": 511.26361, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "X", "bbox": {"l": 530.76031, "t": 555.55768, "r": 536.76331, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "QUSRJOBI() API format 900 or System i Navigator\u2019s SQL Details for Job", "bbox": {"l": 70.800049, "t": 574.51797, "r": 359.51736, "b": 582.84299, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "X", "bbox": {"l": 429.0000600000001, "t": 574.51797, "r": 435.00305000000003, "b": 582.84299, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "X", "bbox": {"l": 480.00037, "t": 574.51797, "r": 486.00335999999993, "b": 582.84299, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "X", "bbox": {"l": 505.2606799999999, "t": 574.51797, "r": 511.26367, "b": 582.84299, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Visual Explain within Run SQL scripts", "bbox": {"l": 70.800079, "t": 593.5376699999999, "r": 220.75178999999997, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "X", "bbox": {"l": 429.0000600000001, "t": 593.5376699999999, "r": 435.00305000000003, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "X", "bbox": {"l": 480.00037, "t": 593.5376699999999, "r": 486.00335999999993, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "X", "bbox": {"l": 505.2606799999999, "t": 593.5376699999999, "r": 511.26367, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "X", "bbox": {"l": 530.76038, "t": 593.5376699999999, "r": 536.76337, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "Visual Explain outside of Run SQL scripts", "bbox": {"l": 70.800079, "t": 612.55737, "r": 236.6548, "b": 620.88239, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "X", "bbox": {"l": 429.0000600000001, "t": 612.55737, "r": 435.00305000000003, "b": 620.88239, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "X", "bbox": {"l": 480.00037, "t": 612.55737, "r": 486.00335999999993, "b": 620.88239, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "ANALYZE PLAN CACHE procedure", "bbox": {"l": 70.800079, "t": 631.51767, "r": 213.12968, "b": 639.84268, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "X", "bbox": {"l": 429.0000600000001, "t": 631.51767, "r": 435.00305000000003, "b": 639.84268, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "X", "bbox": {"l": 480.00037, "t": 631.51767, "r": 486.00335999999993, "b": 639.84268, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "DUMP PLAN CACHE procedure", "bbox": {"l": 70.800079, "t": 650.53737, "r": 199.87808, "b": 658.86238, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "X", "bbox": {"l": 429.0000600000001, "t": 650.53737, "r": 435.00305000000003, "b": 658.86238, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "X", "bbox": {"l": 480.00037, "t": 650.53737, "r": 486.00335999999993, "b": 658.86238, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "MODIFY PLAN CACHE procedure", "bbox": {"l": 70.800079, "t": 669.55708, "r": 208.36777, "b": 677.88207, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "X", "bbox": {"l": 429.0000600000001, "t": 669.55708, "r": 435.00305000000003, "b": 677.88207, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "X", "bbox": {"l": 480.00037, "t": 669.55708, "r": 486.00335999999993, "b": 677.88207, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "MODIFY PLAN CACHE PROPERTIES procedure (currently does not check authority)", "bbox": {"l": 70.800079, "t": 688.57677, "r": 411.20264, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "X", "bbox": {"l": 429.0000600000001, "t": 688.57677, "r": 435.00305000000003, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "X", "bbox": {"l": 480.00037, "t": 688.57677, "r": 486.00335999999993, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "CHANGE PLAN CACHE SIZE procedure (currently does not check authority)", "bbox": {"l": 70.800079, "t": 707.537071, "r": 377.12585, "b": 715.862068, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "X", "bbox": {"l": 429.0000600000001, "t": 707.537071, "r": 435.00305000000003, "b": 715.862068, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "X", "bbox": {"l": 480.00037, "t": 707.537071, "r": 486.00335999999993, "b": 715.862068, "coord_origin": "TOPLEFT"}}], "children": [{"id": 10, "label": "text", "bbox": {"l": 70.800301, "t": 400.51827999999995, "r": 119.78551, "b": 408.84329, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "User action", "bbox": {"l": 70.800301, "t": 400.51827999999995, "r": 119.78551, "b": 408.84329, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 424.93805, "t": 447.52255, "r": 433.26297000000005, "b": 487.01999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "*JOBCTL", "bbox": {"l": 424.93805, "t": 447.52255, "r": 433.26297000000005, "b": 487.01999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 450.13806, "t": 401.6000700000001, "r": 458.46298, "b": 487.01999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "QIBM_DB_SECADM", "bbox": {"l": 450.13806, "t": 401.6000700000001, "r": 458.46298, "b": 487.01999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 475.93835000000007, "t": 401.53442, "r": 484.26327999999995, "b": 487.01999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "QIBM_DB_SQLADM", "bbox": {"l": 475.93835000000007, "t": 401.53442, "r": 484.26327999999995, "b": 487.01999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 501.13837, "t": 401.6145, "r": 509.46329, "b": 487.01999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "QIBM_DB_SYSMON", "bbox": {"l": 501.13837, "t": 401.6145, "r": 509.46329, "b": 487.01999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 526.39862, "t": 432.79944, "r": 534.72357, "b": 487.02005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "No Authority", "bbox": {"l": 526.39862, "t": 432.79944, "r": 534.72357, "b": 487.02005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 70.800003, "t": 498.69299, "r": 151.6794, "b": 506.66699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "SET CURRENT DEGREE", "bbox": {"l": 70.800003, "t": 498.69299, "r": 151.6794, "b": 506.66699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 151.6803, "t": 498.55798, "r": 220.15681000000004, "b": 506.883, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": " (SQL statement)", "bbox": {"l": 151.6803, "t": 498.55798, "r": 220.15681000000004, "b": 506.883, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 429.0, "t": 498.55798, "r": 435.00299000000007, "b": 506.883, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "X", "bbox": {"l": 429.0, "t": 498.55798, "r": 435.00299000000007, "b": 506.883, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 480.00031, "t": 498.55798, "r": 486.0033, "b": 506.883, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "X", "bbox": {"l": 480.00031, "t": 498.55798, "r": 486.0033, "b": 506.883, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 70.800018, "t": 517.65329, "r": 102.23972, "b": 525.62729, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "CHGQRYA", "bbox": {"l": 70.800018, "t": 517.65329, "r": 102.23972, "b": 525.62729, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 102.23972, "t": 517.51828, "r": 264.5538, "b": 525.84329, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": " command targeting a different user\u2019s job", "bbox": {"l": 102.23972, "t": 517.51828, "r": 264.5538, "b": 525.84329, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 429.00003, "t": 517.51828, "r": 435.00302000000005, "b": 525.84329, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "X", "bbox": {"l": 429.00003, "t": 517.51828, "r": 435.00302000000005, "b": 525.84329, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 480.00034, "t": 517.51828, "r": 486.00333, "b": 525.84329, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "X", "bbox": {"l": 480.00034, "t": 517.51828, "r": 486.00333, "b": 525.84329, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 70.800049, "t": 536.67299, "r": 106.73975, "b": 544.64699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "STRDBMON", "bbox": {"l": 70.800049, "t": 536.67299, "r": 106.73975, "b": 544.64699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 106.73975, "t": 536.5379800000001, "r": 119.77895, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": " or ", "bbox": {"l": 106.73975, "t": 536.5379800000001, "r": 119.77895, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 119.69975000000001, "t": 536.67299, "r": 155.69974, "b": 544.64699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "ENDDBMON", "bbox": {"l": 119.69975000000001, "t": 536.67299, "r": 155.69974, "b": 544.64699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 155.69974, "t": 536.5379800000001, "r": 322.50574, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": " commands targeting a different user\u2019s job", "bbox": {"l": 155.69974, "t": 536.5379800000001, "r": 322.50574, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 429.00003, "t": 536.5379800000001, "r": 435.00302000000005, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "X", "bbox": {"l": 429.00003, "t": 536.5379800000001, "r": 435.00302000000005, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 480.00034, "t": 536.5379800000001, "r": 486.00333, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "X", "bbox": {"l": 480.00034, "t": 536.5379800000001, "r": 486.00333, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 70.800049, "t": 555.69269, "r": 106.73975, "b": 563.66669, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "STRDBMON", "bbox": {"l": 70.800049, "t": 555.69269, "r": 106.73975, "b": 563.66669, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 106.73975, "t": 555.55768, "r": 119.77895, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": " or ", "bbox": {"l": 106.73975, "t": 555.55768, "r": 119.77895, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 119.69975000000001, "t": 555.69269, "r": 155.69974, "b": 563.66669, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "ENDDBMON", "bbox": {"l": 119.69975000000001, "t": 555.69269, "r": 155.69974, "b": 563.66669, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 155.69974, "t": 555.55768, "r": 381.02185, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": " commands targeting a job that matches the current user", "bbox": {"l": 155.69974, "t": 555.55768, "r": 381.02185, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 429.00003, "t": 555.55768, "r": 435.00302000000005, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "X", "bbox": {"l": 429.00003, "t": 555.55768, "r": 435.00302000000005, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 480.00034, "t": 555.55768, "r": 486.00333, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "X", "bbox": {"l": 480.00034, "t": 555.55768, "r": 486.00333, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 505.26061999999996, "t": 555.55768, "r": 511.26361, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "X", "bbox": {"l": 505.26061999999996, "t": 555.55768, "r": 511.26361, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 530.76031, "t": 555.55768, "r": 536.76331, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "X", "bbox": {"l": 530.76031, "t": 555.55768, "r": 536.76331, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 70.800049, "t": 574.51797, "r": 359.51736, "b": 582.84299, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "QUSRJOBI() API format 900 or System i Navigator\u2019s SQL Details for Job", "bbox": {"l": 70.800049, "t": 574.51797, "r": 359.51736, "b": 582.84299, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 429.0000600000001, "t": 574.51797, "r": 435.00305000000003, "b": 582.84299, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "X", "bbox": {"l": 429.0000600000001, "t": 574.51797, "r": 435.00305000000003, "b": 582.84299, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 480.00037, "t": 574.51797, "r": 486.00335999999993, "b": 582.84299, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "X", "bbox": {"l": 480.00037, "t": 574.51797, "r": 486.00335999999993, "b": 582.84299, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 505.2606799999999, "t": 574.51797, "r": 511.26367, "b": 582.84299, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "X", "bbox": {"l": 505.2606799999999, "t": 574.51797, "r": 511.26367, "b": 582.84299, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 70.800079, "t": 593.5376699999999, "r": 220.75178999999997, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "Visual Explain within Run SQL scripts", "bbox": {"l": 70.800079, "t": 593.5376699999999, "r": 220.75178999999997, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 429.0000600000001, "t": 593.5376699999999, "r": 435.00305000000003, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "X", "bbox": {"l": 429.0000600000001, "t": 593.5376699999999, "r": 435.00305000000003, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 480.00037, "t": 593.5376699999999, "r": 486.00335999999993, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "X", "bbox": {"l": 480.00037, "t": 593.5376699999999, "r": 486.00335999999993, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 505.2606799999999, "t": 593.5376699999999, "r": 511.26367, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "X", "bbox": {"l": 505.2606799999999, "t": 593.5376699999999, "r": 511.26367, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 530.76038, "t": 593.5376699999999, "r": 536.76337, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "X", "bbox": {"l": 530.76038, "t": 593.5376699999999, "r": 536.76337, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 70.800079, "t": 612.55737, "r": 236.6548, "b": 620.88239, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "Visual Explain outside of Run SQL scripts", "bbox": {"l": 70.800079, "t": 612.55737, "r": 236.6548, "b": 620.88239, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 429.0000600000001, "t": 612.55737, "r": 435.00305000000003, "b": 620.88239, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "X", "bbox": {"l": 429.0000600000001, "t": 612.55737, "r": 435.00305000000003, "b": 620.88239, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 480.00037, "t": 612.55737, "r": 486.00335999999993, "b": 620.88239, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "X", "bbox": {"l": 480.00037, "t": 612.55737, "r": 486.00335999999993, "b": 620.88239, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 70.800079, "t": 631.51767, "r": 213.12968, "b": 639.84268, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "ANALYZE PLAN CACHE procedure", "bbox": {"l": 70.800079, "t": 631.51767, "r": 213.12968, "b": 639.84268, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 429.0000600000001, "t": 631.51767, "r": 435.00305000000003, "b": 639.84268, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "X", "bbox": {"l": 429.0000600000001, "t": 631.51767, "r": 435.00305000000003, "b": 639.84268, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 480.00037, "t": 631.51767, "r": 486.00335999999993, "b": 639.84268, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "X", "bbox": {"l": 480.00037, "t": 631.51767, "r": 486.00335999999993, "b": 639.84268, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 70.800079, "t": 650.53737, "r": 199.87808, "b": 658.86238, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "DUMP PLAN CACHE procedure", "bbox": {"l": 70.800079, "t": 650.53737, "r": 199.87808, "b": 658.86238, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 429.0000600000001, "t": 650.53737, "r": 435.00305000000003, "b": 658.86238, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "X", "bbox": {"l": 429.0000600000001, "t": 650.53737, "r": 435.00305000000003, "b": 658.86238, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 480.00037, "t": 650.53737, "r": 486.00335999999993, "b": 658.86238, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "X", "bbox": {"l": 480.00037, "t": 650.53737, "r": 486.00335999999993, "b": 658.86238, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 70.800079, "t": 669.55708, "r": 208.36777, "b": 677.88207, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "MODIFY PLAN CACHE procedure", "bbox": {"l": 70.800079, "t": 669.55708, "r": 208.36777, "b": 677.88207, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 429.0000600000001, "t": 669.55708, "r": 435.00305000000003, "b": 677.88207, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "X", "bbox": {"l": 429.0000600000001, "t": 669.55708, "r": 435.00305000000003, "b": 677.88207, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 480.00037, "t": 669.55708, "r": 486.00335999999993, "b": 677.88207, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "X", "bbox": {"l": 480.00037, "t": 669.55708, "r": 486.00335999999993, "b": 677.88207, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 70.800079, "t": 688.57677, "r": 411.20264, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "MODIFY PLAN CACHE PROPERTIES procedure (currently does not check authority)", "bbox": {"l": 70.800079, "t": 688.57677, "r": 411.20264, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 429.0000600000001, "t": 688.57677, "r": 435.00305000000003, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "X", "bbox": {"l": 429.0000600000001, "t": 688.57677, "r": 435.00305000000003, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 480.00037, "t": 688.57677, "r": 486.00335999999993, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "X", "bbox": {"l": 480.00037, "t": 688.57677, "r": 486.00335999999993, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 70.800079, "t": 707.537071, "r": 377.12585, "b": 715.862068, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "CHANGE PLAN CACHE SIZE procedure (currently does not check authority)", "bbox": {"l": 70.800079, "t": 707.537071, "r": 377.12585, "b": 715.862068, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 429.0000600000001, "t": 707.537071, "r": 435.00305000000003, "b": 715.862068, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "X", "bbox": {"l": 429.0000600000001, "t": 707.537071, "r": 435.00305000000003, "b": 715.862068, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 480.00037, "t": 707.537071, "r": 486.00335999999993, "b": 715.862068, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "X", "bbox": {"l": 480.00037, "t": 707.537071, "r": 486.00335999999993, "b": 715.862068, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "ecel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "ecel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "ecel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "ecel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "ecel", "fcel", "fcel", "ecel", "nl", "rhed", "fcel", "ecel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "ecel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "ecel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "ecel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "ecel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "ecel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "ecel", "fcel", "ecel", "ecel", "nl"], "num_rows": 13, "num_cols": 6, "table_cells": [{"bbox": {"l": 70.800301, "t": 400.51827999999995, "r": 119.78551, "b": 408.84329, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "User action", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 424.93805, "t": 447.52255, "r": 433.26297000000005, "b": 487.01999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "*JOBCTL", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 450.13806, "t": 401.6000700000001, "r": 458.46298, "b": 487.01999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "QIBM_DB_SECADM", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 475.93835000000007, "t": 401.53442, "r": 484.26327999999995, "b": 487.01999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "QIBM_DB_SQLADM", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 501.13837, "t": 401.6145, "r": 509.46329, "b": 487.01999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "QIBM_DB_SYSMON", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 526.39862, "t": 432.79944, "r": 534.72357, "b": 487.02005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "No Authority", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800003, "t": 498.55798, "r": 220.15681000000004, "b": 506.883, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "SET CURRENT DEGREE  (SQL statement)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0, "t": 498.55798, "r": 435.00299000000007, "b": 506.883, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00031, "t": 498.55798, "r": 486.0033, "b": 506.883, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800018, "t": 517.51828, "r": 264.5538, "b": 525.84329, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "CHGQRYA  command targeting a different user\u2019s job", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.00003, "t": 517.51828, "r": 435.00302000000005, "b": 525.84329, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00034, "t": 517.51828, "r": 486.00333, "b": 525.84329, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800049, "t": 536.5379800000001, "r": 322.50574, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "STRDBMON  or  ENDDBMON  commands targeting a different user\u2019s job", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.00003, "t": 536.5379800000001, "r": 435.00302000000005, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00034, "t": 536.5379800000001, "r": 486.00333, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800049, "t": 555.55768, "r": 381.02185, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "STRDBMON  or  ENDDBMON  commands targeting a job that matches the current user", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.00003, "t": 555.55768, "r": 435.00302000000005, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00034, "t": 555.55768, "r": 486.00333, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 505.26061999999996, "t": 555.55768, "r": 511.26361, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 530.76031, "t": 555.55768, "r": 536.76331, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800049, "t": 574.51797, "r": 359.51736, "b": 582.84299, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "QUSRJOBI() API format 900 or System i Navigator\u2019s SQL Details for Job", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 574.51797, "r": 435.00305000000003, "b": 582.84299, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 574.51797, "r": 486.00335999999993, "b": 582.84299, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 505.2606799999999, "t": 574.51797, "r": 511.26367, "b": 582.84299, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800079, "t": 593.5376699999999, "r": 220.75178999999997, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Visual Explain within Run SQL scripts", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 593.5376699999999, "r": 435.00305000000003, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 593.5376699999999, "r": 486.00335999999993, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 505.2606799999999, "t": 593.5376699999999, "r": 511.26367, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 530.76038, "t": 593.5376699999999, "r": 536.76337, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800079, "t": 612.55737, "r": 236.6548, "b": 620.88239, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Visual Explain outside of Run SQL scripts", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 612.55737, "r": 435.00305000000003, "b": 620.88239, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 612.55737, "r": 486.00335999999993, "b": 620.88239, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800079, "t": 631.51767, "r": 213.12968, "b": 639.84268, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "ANALYZE PLAN CACHE procedure", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 631.51767, "r": 435.00305000000003, "b": 639.84268, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 631.51767, "r": 486.00335999999993, "b": 639.84268, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800079, "t": 650.53737, "r": 199.87808, "b": 658.86238, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "DUMP PLAN CACHE procedure", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 650.53737, "r": 435.00305000000003, "b": 658.86238, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 650.53737, "r": 486.00335999999993, "b": 658.86238, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800079, "t": 669.55708, "r": 208.36777, "b": 677.88207, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "MODIFY PLAN CACHE procedure", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 669.55708, "r": 435.00305000000003, "b": 677.88207, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 669.55708, "r": 486.00335999999993, "b": 677.88207, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800079, "t": 688.57677, "r": 411.20264, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "MODIFY PLAN CACHE PROPERTIES procedure (currently does not check authority)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 688.57677, "r": 435.00305000000003, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 688.57677, "r": 486.00335999999993, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800079, "t": 707.537071, "r": 377.12585, "b": 715.862068, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "CHANGE PLAN CACHE SIZE procedure (currently does not check authority)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 707.537071, "r": 435.00305000000003, "b": 715.862068, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 707.537071, "r": 486.00335999999993, "b": 715.862068, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}]}], "body": [{"label": "text", "id": 2, "page_no": 8, "cluster": {"id": 2, "label": "text", "bbox": {"l": 136.79959, "t": 71.50903000000005, "r": 542.69434, "b": 140.72113000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9789126515388489, "cells": [{"id": 2, "text": "For example, assume that a business has assigned the duty to manage security on IBM i to ", "bbox": {"l": 136.79959, "t": 71.50903000000005, "r": 542.69434, "b": 80.72204999999985, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Theresa. Before release IBM i 7.2, to grant privileges, Theresa had to have the same ", "bbox": {"l": 136.79959, "t": 83.50885000000017, "r": 513.67804, "b": 92.72185999999999, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "privileges Theresa was granting to others. Therefore, to grant *USE privileges to the ", "bbox": {"l": 136.79959, "t": 95.50867000000005, "r": 509.71902, "b": 104.72167999999999, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "PAYROLL table, Theresa had to have *OBJMGT and *USE authority (or a higher level of ", "bbox": {"l": 136.79959, "t": 107.50847999999996, "r": 528.20184, "b": 116.72149999999999, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "authority, such as *ALLOBJ). This requirement allowed Theresa to access the data in the ", "bbox": {"l": 136.79959, "t": 119.50829999999996, "r": 531.84015, "b": 128.72131000000002, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "PAYROLL table even though Theresa\u2019s job description was only to manage its security.", "bbox": {"l": 136.79959, "t": 131.50811999999996, "r": 519.24982, "b": 140.72113000000002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "For example, assume that a business has assigned the duty to manage security on IBM i to Theresa. Before release IBM i 7.2, to grant privileges, Theresa had to have the same privileges Theresa was granting to others. Therefore, to grant *USE privileges to the PAYROLL table, Theresa had to have *OBJMGT and *USE authority (or a higher level of authority, such as *ALLOBJ). This requirement allowed Theresa to access the data in the PAYROLL table even though Theresa's job description was only to manage its security."}, {"label": "text", "id": 6, "page_no": 8, "cluster": {"id": 6, "label": "text", "bbox": {"l": 136.79959, "t": 153.52770999999996, "r": 547.30396, "b": 198.74017000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9665538668632507, "cells": [{"id": 8, "text": "In IBM i 7.2, the QIBM_DB_SECADM function usage grants authorities, revokes authorities, ", "bbox": {"l": 136.79959, "t": 153.52770999999996, "r": 544.16064, "b": 162.74072, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "changes ownership, or changes the primary group without giving access to the object or, in ", "bbox": {"l": 136.79959, "t": 165.52752999999996, "r": 540.66156, "b": 174.74054, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "the case of a database table, to the data that is in the table or allowing other operations on the ", "bbox": {"l": 136.79959, "t": 177.52733999999998, "r": 547.30396, "b": 186.74036, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "table. ", "bbox": {"l": 136.79959, "t": 189.52715999999998, "r": 163.6189, "b": 198.74017000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In IBM i 7.2, the QIBM_DB_SECADM function usage grants authorities, revokes authorities, changes ownership, or changes the primary group without giving access to the object or, in the case of a database table, to the data that is in the table or allowing other operations on the table."}, {"label": "text", "id": 4, "page_no": 8, "cluster": {"id": 4, "label": "text", "bbox": {"l": 136.79959, "t": 211.48694, "r": 538.65076, "b": 232.69976999999994, "coord_origin": "TOPLEFT"}, "confidence": 0.9691813588142395, "cells": [{"id": 12, "text": "QIBM_DB_SECADM function usage can be granted only by a user with *SECADM special ", "bbox": {"l": 136.79959, "t": 211.48694, "r": 538.65076, "b": 220.69994999999994, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "authority and can be given to a user or a group.", "bbox": {"l": 136.79959, "t": 223.48676, "r": 346.34808, "b": 232.69976999999994, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "QIBM_DB_SECADM function usage can be granted only by a user with *SECADM special authority and can be given to a user or a group."}, {"label": "text", "id": 3, "page_no": 8, "cluster": {"id": 3, "label": "text", "bbox": {"l": 136.79959, "t": 245.50635, "r": 545.79602, "b": 278.71898999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9729602336883545, "cells": [{"id": 14, "text": "QIBM_DB_SECADM also is responsible for administering RCAC, which restricts which rows ", "bbox": {"l": 136.79959, "t": 245.50635, "r": 545.79602, "b": 254.71936000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "a user is allowed to access in a table and whether a user is allowed to see information in ", "bbox": {"l": 136.79959, "t": 257.50616, "r": 529.46149, "b": 266.71918000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "certain columns of a table.", "bbox": {"l": 136.79959, "t": 269.50598, "r": 253.47696999999997, "b": 278.71898999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "QIBM_DB_SECADM also is responsible for administering RCAC, which restricts which rows a user is allowed to access in a table and whether a user is allowed to see information in certain columns of a table."}, {"label": "text", "id": 1, "page_no": 8, "cluster": {"id": 1, "label": "text", "bbox": {"l": 136.79959, "t": 291.52557, "r": 539.80713, "b": 336.73801, "coord_origin": "TOPLEFT"}, "confidence": 0.9815152883529663, "cells": [{"id": 17, "text": "A preferred practice is that the RCAC administrator has the QIBM_DB_SECADM function ", "bbox": {"l": 136.79959, "t": 291.52557, "r": 533.78137, "b": 300.73856, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "usage ID, but absolutely no other data privileges. The result is that the RCAC administrator ", "bbox": {"l": 136.79959, "t": 303.52539, "r": 539.80713, "b": 312.73837000000003, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "can deploy and maintain the RCAC constructs, but cannot grant themselves unauthorized ", "bbox": {"l": 136.79959, "t": 315.52521, "r": 534.5741, "b": 324.73819, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "access to data itself.", "bbox": {"l": 136.79959, "t": 327.52502, "r": 227.02324, "b": 336.73801, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "A preferred practice is that the RCAC administrator has the QIBM_DB_SECADM function usage ID, but absolutely no other data privileges. The result is that the RCAC administrator can deploy and maintain the RCAC constructs, but cannot grant themselves unauthorized access to data itself."}, {"label": "text", "id": 5, "page_no": 8, "cluster": {"id": 5, "label": "text", "bbox": {"l": 136.79959, "t": 349.48483, "r": 543.06714, "b": 370.69763000000006, "coord_origin": "TOPLEFT"}, "confidence": 0.9672255516052246, "cells": [{"id": 21, "text": "Table 2-2 shows a comparison of the different function usage IDs and *JOBCTL authority to ", "bbox": {"l": 136.79959, "t": 349.48483, "r": 543.06714, "b": 358.69780999999995, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "the different CL commands and DB2 for i tools.", "bbox": {"l": 136.79959, "t": 361.48465, "r": 343.79236, "b": 370.69763000000006, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 2-2 shows a comparison of the different function usage IDs and *JOBCTL authority to the different CL commands and DB2 for i tools."}, {"label": "caption", "id": 8, "page_no": 8, "cluster": {"id": 8, "label": "caption", "bbox": {"l": 64.800003, "t": 383.5379899999999, "r": 391.75464, "b": 391.86301, "coord_origin": "TOPLEFT"}, "confidence": 0.9337189793586731, "cells": [{"id": 23, "text": "Table 2-2 Comparison of the different function usage IDs and *JOBCTL authority", "bbox": {"l": 64.800003, "t": 383.5379899999999, "r": 391.75464, "b": 391.86301, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 2-2 Comparison of the different function usage IDs and *JOBCTL authority"}, {"label": "table", "id": 0, "page_no": 8, "cluster": {"id": 0, "label": "table", "bbox": {"l": 64.41139221191406, "t": 393.6136169433594, "r": 547.3950805664062, "b": 721.60791015625, "coord_origin": "TOPLEFT"}, "confidence": 0.9899571537971497, "cells": [{"id": 24, "text": "User action", "bbox": {"l": 70.800301, "t": 400.51827999999995, "r": 119.78551, "b": 408.84329, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "*JOBCTL", "bbox": {"l": 424.93805, "t": 447.52255, "r": 433.26297000000005, "b": 487.01999, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "QIBM_DB_SECADM", "bbox": {"l": 450.13806, "t": 401.6000700000001, "r": 458.46298, "b": 487.01999, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "QIBM_DB_SQLADM", "bbox": {"l": 475.93835000000007, "t": 401.53442, "r": 484.26327999999995, "b": 487.01999, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "QIBM_DB_SYSMON", "bbox": {"l": 501.13837, "t": 401.6145, "r": 509.46329, "b": 487.01999, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "No Authority", "bbox": {"l": 526.39862, "t": 432.79944, "r": 534.72357, "b": 487.02005, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "SET CURRENT DEGREE", "bbox": {"l": 70.800003, "t": 498.69299, "r": 151.6794, "b": 506.66699, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": " (SQL statement)", "bbox": {"l": 151.6803, "t": 498.55798, "r": 220.15681000000004, "b": 506.883, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "X", "bbox": {"l": 429.0, "t": 498.55798, "r": 435.00299000000007, "b": 506.883, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "X", "bbox": {"l": 480.00031, "t": 498.55798, "r": 486.0033, "b": 506.883, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "CHGQRYA", "bbox": {"l": 70.800018, "t": 517.65329, "r": 102.23972, "b": 525.62729, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": " command targeting a different user\u2019s job", "bbox": {"l": 102.23972, "t": 517.51828, "r": 264.5538, "b": 525.84329, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "X", "bbox": {"l": 429.00003, "t": 517.51828, "r": 435.00302000000005, "b": 525.84329, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "X", "bbox": {"l": 480.00034, "t": 517.51828, "r": 486.00333, "b": 525.84329, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "STRDBMON", "bbox": {"l": 70.800049, "t": 536.67299, "r": 106.73975, "b": 544.64699, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": " or ", "bbox": {"l": 106.73975, "t": 536.5379800000001, "r": 119.77895, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "ENDDBMON", "bbox": {"l": 119.69975000000001, "t": 536.67299, "r": 155.69974, "b": 544.64699, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": " commands targeting a different user\u2019s job", "bbox": {"l": 155.69974, "t": 536.5379800000001, "r": 322.50574, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "X", "bbox": {"l": 429.00003, "t": 536.5379800000001, "r": 435.00302000000005, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "X", "bbox": {"l": 480.00034, "t": 536.5379800000001, "r": 486.00333, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "STRDBMON", "bbox": {"l": 70.800049, "t": 555.69269, "r": 106.73975, "b": 563.66669, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": " or ", "bbox": {"l": 106.73975, "t": 555.55768, "r": 119.77895, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "ENDDBMON", "bbox": {"l": 119.69975000000001, "t": 555.69269, "r": 155.69974, "b": 563.66669, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": " commands targeting a job that matches the current user", "bbox": {"l": 155.69974, "t": 555.55768, "r": 381.02185, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "X", "bbox": {"l": 429.00003, "t": 555.55768, "r": 435.00302000000005, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "X", "bbox": {"l": 480.00034, "t": 555.55768, "r": 486.00333, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "X", "bbox": {"l": 505.26061999999996, "t": 555.55768, "r": 511.26361, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "X", "bbox": {"l": 530.76031, "t": 555.55768, "r": 536.76331, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "QUSRJOBI() API format 900 or System i Navigator\u2019s SQL Details for Job", "bbox": {"l": 70.800049, "t": 574.51797, "r": 359.51736, "b": 582.84299, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "X", "bbox": {"l": 429.0000600000001, "t": 574.51797, "r": 435.00305000000003, "b": 582.84299, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "X", "bbox": {"l": 480.00037, "t": 574.51797, "r": 486.00335999999993, "b": 582.84299, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "X", "bbox": {"l": 505.2606799999999, "t": 574.51797, "r": 511.26367, "b": 582.84299, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Visual Explain within Run SQL scripts", "bbox": {"l": 70.800079, "t": 593.5376699999999, "r": 220.75178999999997, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "X", "bbox": {"l": 429.0000600000001, "t": 593.5376699999999, "r": 435.00305000000003, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "X", "bbox": {"l": 480.00037, "t": 593.5376699999999, "r": 486.00335999999993, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "X", "bbox": {"l": 505.2606799999999, "t": 593.5376699999999, "r": 511.26367, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "X", "bbox": {"l": 530.76038, "t": 593.5376699999999, "r": 536.76337, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "Visual Explain outside of Run SQL scripts", "bbox": {"l": 70.800079, "t": 612.55737, "r": 236.6548, "b": 620.88239, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "X", "bbox": {"l": 429.0000600000001, "t": 612.55737, "r": 435.00305000000003, "b": 620.88239, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "X", "bbox": {"l": 480.00037, "t": 612.55737, "r": 486.00335999999993, "b": 620.88239, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "ANALYZE PLAN CACHE procedure", "bbox": {"l": 70.800079, "t": 631.51767, "r": 213.12968, "b": 639.84268, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "X", "bbox": {"l": 429.0000600000001, "t": 631.51767, "r": 435.00305000000003, "b": 639.84268, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "X", "bbox": {"l": 480.00037, "t": 631.51767, "r": 486.00335999999993, "b": 639.84268, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "DUMP PLAN CACHE procedure", "bbox": {"l": 70.800079, "t": 650.53737, "r": 199.87808, "b": 658.86238, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "X", "bbox": {"l": 429.0000600000001, "t": 650.53737, "r": 435.00305000000003, "b": 658.86238, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "X", "bbox": {"l": 480.00037, "t": 650.53737, "r": 486.00335999999993, "b": 658.86238, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "MODIFY PLAN CACHE procedure", "bbox": {"l": 70.800079, "t": 669.55708, "r": 208.36777, "b": 677.88207, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "X", "bbox": {"l": 429.0000600000001, "t": 669.55708, "r": 435.00305000000003, "b": 677.88207, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "X", "bbox": {"l": 480.00037, "t": 669.55708, "r": 486.00335999999993, "b": 677.88207, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "MODIFY PLAN CACHE PROPERTIES procedure (currently does not check authority)", "bbox": {"l": 70.800079, "t": 688.57677, "r": 411.20264, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "X", "bbox": {"l": 429.0000600000001, "t": 688.57677, "r": 435.00305000000003, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "X", "bbox": {"l": 480.00037, "t": 688.57677, "r": 486.00335999999993, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "CHANGE PLAN CACHE SIZE procedure (currently does not check authority)", "bbox": {"l": 70.800079, "t": 707.537071, "r": 377.12585, "b": 715.862068, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "X", "bbox": {"l": 429.0000600000001, "t": 707.537071, "r": 435.00305000000003, "b": 715.862068, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "X", "bbox": {"l": 480.00037, "t": 707.537071, "r": 486.00335999999993, "b": 715.862068, "coord_origin": "TOPLEFT"}}], "children": [{"id": 10, "label": "text", "bbox": {"l": 70.800301, "t": 400.51827999999995, "r": 119.78551, "b": 408.84329, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "User action", "bbox": {"l": 70.800301, "t": 400.51827999999995, "r": 119.78551, "b": 408.84329, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 424.93805, "t": 447.52255, "r": 433.26297000000005, "b": 487.01999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "*JOBCTL", "bbox": {"l": 424.93805, "t": 447.52255, "r": 433.26297000000005, "b": 487.01999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 450.13806, "t": 401.6000700000001, "r": 458.46298, "b": 487.01999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "QIBM_DB_SECADM", "bbox": {"l": 450.13806, "t": 401.6000700000001, "r": 458.46298, "b": 487.01999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 475.93835000000007, "t": 401.53442, "r": 484.26327999999995, "b": 487.01999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "QIBM_DB_SQLADM", "bbox": {"l": 475.93835000000007, "t": 401.53442, "r": 484.26327999999995, "b": 487.01999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 501.13837, "t": 401.6145, "r": 509.46329, "b": 487.01999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "QIBM_DB_SYSMON", "bbox": {"l": 501.13837, "t": 401.6145, "r": 509.46329, "b": 487.01999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 526.39862, "t": 432.79944, "r": 534.72357, "b": 487.02005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "No Authority", "bbox": {"l": 526.39862, "t": 432.79944, "r": 534.72357, "b": 487.02005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 70.800003, "t": 498.69299, "r": 151.6794, "b": 506.66699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "SET CURRENT DEGREE", "bbox": {"l": 70.800003, "t": 498.69299, "r": 151.6794, "b": 506.66699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 151.6803, "t": 498.55798, "r": 220.15681000000004, "b": 506.883, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": " (SQL statement)", "bbox": {"l": 151.6803, "t": 498.55798, "r": 220.15681000000004, "b": 506.883, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 429.0, "t": 498.55798, "r": 435.00299000000007, "b": 506.883, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "X", "bbox": {"l": 429.0, "t": 498.55798, "r": 435.00299000000007, "b": 506.883, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 480.00031, "t": 498.55798, "r": 486.0033, "b": 506.883, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "X", "bbox": {"l": 480.00031, "t": 498.55798, "r": 486.0033, "b": 506.883, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 70.800018, "t": 517.65329, "r": 102.23972, "b": 525.62729, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "CHGQRYA", "bbox": {"l": 70.800018, "t": 517.65329, "r": 102.23972, "b": 525.62729, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 102.23972, "t": 517.51828, "r": 264.5538, "b": 525.84329, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": " command targeting a different user\u2019s job", "bbox": {"l": 102.23972, "t": 517.51828, "r": 264.5538, "b": 525.84329, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 429.00003, "t": 517.51828, "r": 435.00302000000005, "b": 525.84329, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "X", "bbox": {"l": 429.00003, "t": 517.51828, "r": 435.00302000000005, "b": 525.84329, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 480.00034, "t": 517.51828, "r": 486.00333, "b": 525.84329, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "X", "bbox": {"l": 480.00034, "t": 517.51828, "r": 486.00333, "b": 525.84329, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 70.800049, "t": 536.67299, "r": 106.73975, "b": 544.64699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "STRDBMON", "bbox": {"l": 70.800049, "t": 536.67299, "r": 106.73975, "b": 544.64699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 106.73975, "t": 536.5379800000001, "r": 119.77895, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": " or ", "bbox": {"l": 106.73975, "t": 536.5379800000001, "r": 119.77895, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 119.69975000000001, "t": 536.67299, "r": 155.69974, "b": 544.64699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "ENDDBMON", "bbox": {"l": 119.69975000000001, "t": 536.67299, "r": 155.69974, "b": 544.64699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 155.69974, "t": 536.5379800000001, "r": 322.50574, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": " commands targeting a different user\u2019s job", "bbox": {"l": 155.69974, "t": 536.5379800000001, "r": 322.50574, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 429.00003, "t": 536.5379800000001, "r": 435.00302000000005, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "X", "bbox": {"l": 429.00003, "t": 536.5379800000001, "r": 435.00302000000005, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 480.00034, "t": 536.5379800000001, "r": 486.00333, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "X", "bbox": {"l": 480.00034, "t": 536.5379800000001, "r": 486.00333, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 70.800049, "t": 555.69269, "r": 106.73975, "b": 563.66669, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "STRDBMON", "bbox": {"l": 70.800049, "t": 555.69269, "r": 106.73975, "b": 563.66669, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 106.73975, "t": 555.55768, "r": 119.77895, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": " or ", "bbox": {"l": 106.73975, "t": 555.55768, "r": 119.77895, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 119.69975000000001, "t": 555.69269, "r": 155.69974, "b": 563.66669, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "ENDDBMON", "bbox": {"l": 119.69975000000001, "t": 555.69269, "r": 155.69974, "b": 563.66669, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 155.69974, "t": 555.55768, "r": 381.02185, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": " commands targeting a job that matches the current user", "bbox": {"l": 155.69974, "t": 555.55768, "r": 381.02185, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 429.00003, "t": 555.55768, "r": 435.00302000000005, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "X", "bbox": {"l": 429.00003, "t": 555.55768, "r": 435.00302000000005, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 480.00034, "t": 555.55768, "r": 486.00333, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "X", "bbox": {"l": 480.00034, "t": 555.55768, "r": 486.00333, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 505.26061999999996, "t": 555.55768, "r": 511.26361, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "X", "bbox": {"l": 505.26061999999996, "t": 555.55768, "r": 511.26361, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 530.76031, "t": 555.55768, "r": 536.76331, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "X", "bbox": {"l": 530.76031, "t": 555.55768, "r": 536.76331, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 70.800049, "t": 574.51797, "r": 359.51736, "b": 582.84299, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "QUSRJOBI() API format 900 or System i Navigator\u2019s SQL Details for Job", "bbox": {"l": 70.800049, "t": 574.51797, "r": 359.51736, "b": 582.84299, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 429.0000600000001, "t": 574.51797, "r": 435.00305000000003, "b": 582.84299, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "X", "bbox": {"l": 429.0000600000001, "t": 574.51797, "r": 435.00305000000003, "b": 582.84299, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 480.00037, "t": 574.51797, "r": 486.00335999999993, "b": 582.84299, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "X", "bbox": {"l": 480.00037, "t": 574.51797, "r": 486.00335999999993, "b": 582.84299, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 505.2606799999999, "t": 574.51797, "r": 511.26367, "b": 582.84299, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "X", "bbox": {"l": 505.2606799999999, "t": 574.51797, "r": 511.26367, "b": 582.84299, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 70.800079, "t": 593.5376699999999, "r": 220.75178999999997, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "Visual Explain within Run SQL scripts", "bbox": {"l": 70.800079, "t": 593.5376699999999, "r": 220.75178999999997, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 429.0000600000001, "t": 593.5376699999999, "r": 435.00305000000003, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "X", "bbox": {"l": 429.0000600000001, "t": 593.5376699999999, "r": 435.00305000000003, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 480.00037, "t": 593.5376699999999, "r": 486.00335999999993, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "X", "bbox": {"l": 480.00037, "t": 593.5376699999999, "r": 486.00335999999993, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 505.2606799999999, "t": 593.5376699999999, "r": 511.26367, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "X", "bbox": {"l": 505.2606799999999, "t": 593.5376699999999, "r": 511.26367, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 530.76038, "t": 593.5376699999999, "r": 536.76337, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "X", "bbox": {"l": 530.76038, "t": 593.5376699999999, "r": 536.76337, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 70.800079, "t": 612.55737, "r": 236.6548, "b": 620.88239, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "Visual Explain outside of Run SQL scripts", "bbox": {"l": 70.800079, "t": 612.55737, "r": 236.6548, "b": 620.88239, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 429.0000600000001, "t": 612.55737, "r": 435.00305000000003, "b": 620.88239, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "X", "bbox": {"l": 429.0000600000001, "t": 612.55737, "r": 435.00305000000003, "b": 620.88239, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 480.00037, "t": 612.55737, "r": 486.00335999999993, "b": 620.88239, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "X", "bbox": {"l": 480.00037, "t": 612.55737, "r": 486.00335999999993, "b": 620.88239, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 70.800079, "t": 631.51767, "r": 213.12968, "b": 639.84268, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "ANALYZE PLAN CACHE procedure", "bbox": {"l": 70.800079, "t": 631.51767, "r": 213.12968, "b": 639.84268, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 429.0000600000001, "t": 631.51767, "r": 435.00305000000003, "b": 639.84268, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "X", "bbox": {"l": 429.0000600000001, "t": 631.51767, "r": 435.00305000000003, "b": 639.84268, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 480.00037, "t": 631.51767, "r": 486.00335999999993, "b": 639.84268, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "X", "bbox": {"l": 480.00037, "t": 631.51767, "r": 486.00335999999993, "b": 639.84268, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 70.800079, "t": 650.53737, "r": 199.87808, "b": 658.86238, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "DUMP PLAN CACHE procedure", "bbox": {"l": 70.800079, "t": 650.53737, "r": 199.87808, "b": 658.86238, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 429.0000600000001, "t": 650.53737, "r": 435.00305000000003, "b": 658.86238, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "X", "bbox": {"l": 429.0000600000001, "t": 650.53737, "r": 435.00305000000003, "b": 658.86238, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 480.00037, "t": 650.53737, "r": 486.00335999999993, "b": 658.86238, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "X", "bbox": {"l": 480.00037, "t": 650.53737, "r": 486.00335999999993, "b": 658.86238, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 70.800079, "t": 669.55708, "r": 208.36777, "b": 677.88207, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "MODIFY PLAN CACHE procedure", "bbox": {"l": 70.800079, "t": 669.55708, "r": 208.36777, "b": 677.88207, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 429.0000600000001, "t": 669.55708, "r": 435.00305000000003, "b": 677.88207, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "X", "bbox": {"l": 429.0000600000001, "t": 669.55708, "r": 435.00305000000003, "b": 677.88207, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 480.00037, "t": 669.55708, "r": 486.00335999999993, "b": 677.88207, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "X", "bbox": {"l": 480.00037, "t": 669.55708, "r": 486.00335999999993, "b": 677.88207, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 70.800079, "t": 688.57677, "r": 411.20264, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "MODIFY PLAN CACHE PROPERTIES procedure (currently does not check authority)", "bbox": {"l": 70.800079, "t": 688.57677, "r": 411.20264, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 429.0000600000001, "t": 688.57677, "r": 435.00305000000003, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "X", "bbox": {"l": 429.0000600000001, "t": 688.57677, "r": 435.00305000000003, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 480.00037, "t": 688.57677, "r": 486.00335999999993, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "X", "bbox": {"l": 480.00037, "t": 688.57677, "r": 486.00335999999993, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 70.800079, "t": 707.537071, "r": 377.12585, "b": 715.862068, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "CHANGE PLAN CACHE SIZE procedure (currently does not check authority)", "bbox": {"l": 70.800079, "t": 707.537071, "r": 377.12585, "b": 715.862068, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 429.0000600000001, "t": 707.537071, "r": 435.00305000000003, "b": 715.862068, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "X", "bbox": {"l": 429.0000600000001, "t": 707.537071, "r": 435.00305000000003, "b": 715.862068, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 480.00037, "t": 707.537071, "r": 486.00335999999993, "b": 715.862068, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "X", "bbox": {"l": 480.00037, "t": 707.537071, "r": 486.00335999999993, "b": 715.862068, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "ecel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "ecel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "ecel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "ecel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "ecel", "fcel", "fcel", "ecel", "nl", "rhed", "fcel", "ecel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "ecel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "ecel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "ecel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "ecel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "ecel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "ecel", "fcel", "ecel", "ecel", "nl"], "num_rows": 13, "num_cols": 6, "table_cells": [{"bbox": {"l": 70.800301, "t": 400.51827999999995, "r": 119.78551, "b": 408.84329, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "User action", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 424.93805, "t": 447.52255, "r": 433.26297000000005, "b": 487.01999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "*JOBCTL", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 450.13806, "t": 401.6000700000001, "r": 458.46298, "b": 487.01999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "QIBM_DB_SECADM", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 475.93835000000007, "t": 401.53442, "r": 484.26327999999995, "b": 487.01999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "QIBM_DB_SQLADM", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 501.13837, "t": 401.6145, "r": 509.46329, "b": 487.01999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "QIBM_DB_SYSMON", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 526.39862, "t": 432.79944, "r": 534.72357, "b": 487.02005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "No Authority", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800003, "t": 498.55798, "r": 220.15681000000004, "b": 506.883, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "SET CURRENT DEGREE  (SQL statement)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0, "t": 498.55798, "r": 435.00299000000007, "b": 506.883, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00031, "t": 498.55798, "r": 486.0033, "b": 506.883, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800018, "t": 517.51828, "r": 264.5538, "b": 525.84329, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "CHGQRYA  command targeting a different user\u2019s job", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.00003, "t": 517.51828, "r": 435.00302000000005, "b": 525.84329, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00034, "t": 517.51828, "r": 486.00333, "b": 525.84329, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800049, "t": 536.5379800000001, "r": 322.50574, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "STRDBMON  or  ENDDBMON  commands targeting a different user\u2019s job", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.00003, "t": 536.5379800000001, "r": 435.00302000000005, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00034, "t": 536.5379800000001, "r": 486.00333, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800049, "t": 555.55768, "r": 381.02185, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "STRDBMON  or  ENDDBMON  commands targeting a job that matches the current user", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.00003, "t": 555.55768, "r": 435.00302000000005, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00034, "t": 555.55768, "r": 486.00333, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 505.26061999999996, "t": 555.55768, "r": 511.26361, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 530.76031, "t": 555.55768, "r": 536.76331, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800049, "t": 574.51797, "r": 359.51736, "b": 582.84299, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "QUSRJOBI() API format 900 or System i Navigator\u2019s SQL Details for Job", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 574.51797, "r": 435.00305000000003, "b": 582.84299, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 574.51797, "r": 486.00335999999993, "b": 582.84299, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 505.2606799999999, "t": 574.51797, "r": 511.26367, "b": 582.84299, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800079, "t": 593.5376699999999, "r": 220.75178999999997, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Visual Explain within Run SQL scripts", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 593.5376699999999, "r": 435.00305000000003, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 593.5376699999999, "r": 486.00335999999993, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 505.2606799999999, "t": 593.5376699999999, "r": 511.26367, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 530.76038, "t": 593.5376699999999, "r": 536.76337, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800079, "t": 612.55737, "r": 236.6548, "b": 620.88239, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Visual Explain outside of Run SQL scripts", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 612.55737, "r": 435.00305000000003, "b": 620.88239, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 612.55737, "r": 486.00335999999993, "b": 620.88239, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800079, "t": 631.51767, "r": 213.12968, "b": 639.84268, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "ANALYZE PLAN CACHE procedure", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 631.51767, "r": 435.00305000000003, "b": 639.84268, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 631.51767, "r": 486.00335999999993, "b": 639.84268, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800079, "t": 650.53737, "r": 199.87808, "b": 658.86238, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "DUMP PLAN CACHE procedure", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 650.53737, "r": 435.00305000000003, "b": 658.86238, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 650.53737, "r": 486.00335999999993, "b": 658.86238, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800079, "t": 669.55708, "r": 208.36777, "b": 677.88207, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "MODIFY PLAN CACHE procedure", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 669.55708, "r": 435.00305000000003, "b": 677.88207, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 669.55708, "r": 486.00335999999993, "b": 677.88207, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800079, "t": 688.57677, "r": 411.20264, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "MODIFY PLAN CACHE PROPERTIES procedure (currently does not check authority)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 688.57677, "r": 435.00305000000003, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 688.57677, "r": 486.00335999999993, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800079, "t": 707.537071, "r": 377.12585, "b": 715.862068, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "CHANGE PLAN CACHE SIZE procedure (currently does not check authority)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 707.537071, "r": 435.00305000000003, "b": 715.862068, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 707.537071, "r": 486.00335999999993, "b": 715.862068, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}]}], "headers": [{"label": "page_footer", "id": 7, "page_no": 8, "cluster": {"id": 7, "label": "page_footer", "bbox": {"l": 355.32001, "t": 755.538002, "r": 523.54071, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9508126378059387, "cells": [{"id": 0, "text": "Chapter 2. Roles and separation of duties ", "bbox": {"l": 355.32001, "t": 755.538002, "r": 523.54071, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Chapter 2. Roles and separation of duties"}, {"label": "page_footer", "id": 9, "page_no": 8, "cluster": {"id": 9, "label": "page_footer", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.8987301588058472, "cells": [{"id": 1, "text": "11", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "11"}]}}, {"page_no": 9, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "Chapter 3. Row and Column Access Control ", "bbox": {"l": 344.94, "t": 755.538002, "r": 523.60162, "b": 763.863001, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "15", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "The SQL ", "bbox": {"l": 136.79959, "t": 71.50903000000005, "r": 179.58179, "b": 80.72204999999985, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "CREATE PERMISSION", "bbox": {"l": 179.57977, "t": 71.65845000000002, "r": 264.47879, "b": 80.48302999999999, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": " statement that is shown in Figure 3-1 is used to define and ", "bbox": {"l": 264.53955, "t": 71.50903000000005, "r": 528.73059, "b": 80.72204999999985, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "initially enable or disable the row access rules.", "bbox": {"l": 136.79956, "t": 83.50885000000017, "r": 341.71762, "b": 92.72185999999999, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Figure 3-1 CREATE PERMISSION SQL statement", "bbox": {"l": 136.8, "t": 414.138, "r": 341.97659, "b": 422.46301, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Column mask", "bbox": {"l": 136.8, "t": 439.94399999999996, "r": 215.37601, "b": 451.04401, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "A column mask is a database object that manifests a column value access control rule for a ", "bbox": {"l": 136.8, "t": 455.08871000000005, "r": 542.76648, "b": 464.3017, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "specific column in a specific table. It uses a CASE expression that describes what you see ", "bbox": {"l": 136.8, "t": 467.08853, "r": 537.84125, "b": 476.30151, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "when you access the column. For example, a teller can see only the last four digits of a tax ", "bbox": {"l": 136.8, "t": 479.08835, "r": 538.80927, "b": 488.30133, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "identification number.", "bbox": {"l": 136.8, "t": 491.08817, "r": 231.20888, "b": 500.30115, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "CREATE PERMISSION", "bbox": {"l": 148.1337, "t": 139.67969000000005, "r": 246.7961, "b": 149.50982999999997, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "<", "bbox": {"l": 251.86685, "t": 139.67969000000005, "r": 257.58578, "b": 149.49834999999996, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "permission name", "bbox": {"l": 257.59152, "t": 139.67969000000005, "r": 336.99741, "b": 149.50982999999997, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": ">", "bbox": {"l": 337.01233, "t": 139.67969000000005, "r": 342.73126, "b": 149.49834999999996, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Names the row permission for row access control", "bbox": {"l": 346.56491, "t": 121.46252000000004, "r": 530.74371, "b": 129.33507999999995, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "ON", "bbox": {"l": 148.1337, "t": 181.06255999999996, "r": 163.45079, "b": 190.8927, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "<", "bbox": {"l": 168.58405, "t": 181.06255999999996, "r": 174.30298, "b": 190.88122999999996, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "table name", "bbox": {"l": 174.30872, "t": 181.06255999999996, "r": 226.86777, "b": 190.8927, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": ">", "bbox": {"l": 226.86548000000002, "t": 181.06255999999996, "r": 232.58441, "b": 190.88122999999996, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Identifies the table on which the row ", "bbox": {"l": 311.3204, "t": 166.29413, "r": 450.77191000000005, "b": 174.16669000000002, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "permission is created", "bbox": {"l": 450.86123999999995, "t": 166.29413, "r": 529.93134, "b": 174.16669000000002, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "AS ", "bbox": {"l": 148.1337, "t": 222.44550000000004, "r": 163.10973, "b": 232.27562999999998, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "<", "bbox": {"l": 165.68669, "t": 222.44550000000004, "r": 171.40562, "b": 232.26415999999995, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "correlation name", "bbox": {"l": 171.41136, "t": 222.44550000000004, "r": 251.20424000000003, "b": 232.27562999999998, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": ">", "bbox": {"l": 251.21115, "t": 222.44550000000004, "r": 256.93008, "b": 232.26415999999995, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Specifies an optional correlation name that ca", "bbox": {"l": 235.79649, "t": 204.22839, "r": 406.62051, "b": 212.10095, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "be used within search-condition", "bbox": {"l": 480.53094, "t": 204.22839, "r": 532.89496, "b": 212.10095, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "FOR ROWS", "bbox": {"l": 148.1337, "t": 263.82836999999995, "r": 199.72467, "b": 273.65851, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Indicates that a row permission is cr", "bbox": {"l": 321.56271, "t": 246.09411999999998, "r": 455.3432, "b": 253.96667000000002, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "eated", "bbox": {"l": 455.20786000000004, "t": 246.09411999999998, "r": 476.48404, "b": 253.96667000000002, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Specifies a condition that can be ", "bbox": {"l": 321.5972, "t": 266.30267000000003, "r": 444.0292400000001, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "true,", "bbox": {"l": 444.07986, "t": 266.30267000000003, "r": 459.08678999999995, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "false, or unknown", "bbox": {"l": 464.2088, "t": 266.30267000000003, "r": 530.94897, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "WHERE", "bbox": {"l": 148.1337, "t": 291.41708, "r": 183.42342, "b": 301.24722, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "<", "bbox": {"l": 188.61984, "t": 291.41708, "r": 194.33878, "b": 301.23572, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "logic to test: user and/or group and/or column value", "bbox": {"l": 194.34451, "t": 291.41708, "r": 437.04659999999996, "b": 301.24722, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": ">", "bbox": {"l": 437.09020999999996, "t": 291.41708, "r": 442.80914000000007, "b": 301.23572, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "ENFORCED FOR ALL ACCESS", "bbox": {"l": 148.1337, "t": 332.79999, "r": 278.77805, "b": 342.63013, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "Specifies that the row permission applies to all ref", "bbox": {"l": 271.55829, "t": 314.58276, "r": 457.4451, "b": 322.45535, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "erences of the table", "bbox": {"l": 457.19281, "t": 314.58276, "r": 531.74939, "b": 322.45535, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "ENABLE", "bbox": {"l": 148.1337, "t": 374.18289, "r": 185.17584, "b": 384.01302999999996, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Specifies that the row permission is to", "bbox": {"l": 312.28601, "t": 355.96576000000005, "r": 454.33505, "b": 363.83835, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": " be initially enabled", "bbox": {"l": 454.3461, "t": 355.96576000000005, "r": 527.05286, "b": 363.83835, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "S", "bbox": {"l": 311.73431, "t": 376.65717, "r": 315.94684, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "ifith t th", "bbox": {"l": 329.28326, "t": 376.65717, "r": 371.71786, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "i", "bbox": {"l": 415.0014, "t": 376.65717, "r": 417.09616, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "i", "bbox": {"l": 424.27356, "t": 376.65717, "r": 426.36832, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "i", "bbox": {"l": 438.13208, "t": 376.65717, "r": 440.2268399999999, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "t", "bbox": {"l": 445.88681, "t": 376.65717, "r": 448.95757999999995, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "b", "bbox": {"l": 455.8532400000001, "t": 376.65717, "r": 460.67346000000003, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "i", "bbox": {"l": 467.36746, "t": 376.65717, "r": 470.06998000000004, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "iti ll", "bbox": {"l": 472.73705999999993, "t": 376.65717, "r": 490.1676, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "di", "bbox": {"l": 496.33661, "t": 376.65717, "r": 503.2608, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "bl d", "bbox": {"l": 511.26138, "t": 376.65717, "r": 527.59674, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "DISABLE", "bbox": {"l": 148.1337, "t": 387.9772, "r": 187.6265, "b": 397.80734000000007, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": ";", "bbox": {"l": 187.58514, "t": 387.9772, "r": 190.6628, "b": 397.79583999999994, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Specifies that the row permission is to ", "bbox": {"l": 311.73431, "t": 376.65717, "r": 455.83047000000005, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "be initially disabled", "bbox": {"l": 455.8848, "t": 376.65717, "r": 527.62122, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 2, "label": "page_footer", "bbox": {"l": 344.94, "t": 755.538002, "r": 523.60162, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9526246786117554, "cells": [{"id": 0, "text": "Chapter 3. Row and Column Access Control ", "bbox": {"l": 344.94, "t": 755.538002, "r": 523.60162, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "page_footer", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.9071078896522522, "cells": [{"id": 1, "text": "15", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "caption", "bbox": {"l": 136.79956, "t": 71.50903000000005, "r": 528.73059, "b": 92.72185999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.872844398021698, "cells": [{"id": 2, "text": "The SQL ", "bbox": {"l": 136.79959, "t": 71.50903000000005, "r": 179.58179, "b": 80.72204999999985, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "CREATE PERMISSION", "bbox": {"l": 179.57977, "t": 71.65845000000002, "r": 264.47879, "b": 80.48302999999999, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": " statement that is shown in Figure 3-1 is used to define and ", "bbox": {"l": 264.53955, "t": 71.50903000000005, "r": 528.73059, "b": 80.72204999999985, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "initially enable or disable the row access rules.", "bbox": {"l": 136.79956, "t": 83.50885000000017, "r": 341.71762, "b": 92.72185999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "caption", "bbox": {"l": 136.8, "t": 414.138, "r": 341.97659, "b": 422.46301, "coord_origin": "TOPLEFT"}, "confidence": 0.938783586025238, "cells": [{"id": 6, "text": "Figure 3-1 CREATE PERMISSION SQL statement", "bbox": {"l": 136.8, "t": 414.138, "r": 341.97659, "b": 422.46301, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "section_header", "bbox": {"l": 136.8, "t": 439.94399999999996, "r": 215.37601, "b": 451.04401, "coord_origin": "TOPLEFT"}, "confidence": 0.9477567076683044, "cells": [{"id": 7, "text": "Column mask", "bbox": {"l": 136.8, "t": 439.94399999999996, "r": 215.37601, "b": 451.04401, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 136.8, "t": 455.08871000000005, "r": 542.76648, "b": 500.30115, "coord_origin": "TOPLEFT"}, "confidence": 0.9843975901603699, "cells": [{"id": 8, "text": "A column mask is a database object that manifests a column value access control rule for a ", "bbox": {"l": 136.8, "t": 455.08871000000005, "r": 542.76648, "b": 464.3017, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "specific column in a specific table. It uses a CASE expression that describes what you see ", "bbox": {"l": 136.8, "t": 467.08853, "r": 537.84125, "b": 476.30151, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "when you access the column. For example, a teller can see only the last four digits of a tax ", "bbox": {"l": 136.8, "t": 479.08835, "r": 538.80927, "b": 488.30133, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "identification number.", "bbox": {"l": 136.8, "t": 491.08817, "r": 231.20888, "b": 500.30115, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "picture", "bbox": {"l": 135.97177124023438, "t": 107.41075134277344, "r": 545.4180908203125, "b": 410.60931396484375, "coord_origin": "TOPLEFT"}, "confidence": 0.9788318872451782, "cells": [{"id": 12, "text": "CREATE PERMISSION", "bbox": {"l": 148.1337, "t": 139.67969000000005, "r": 246.7961, "b": 149.50982999999997, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "<", "bbox": {"l": 251.86685, "t": 139.67969000000005, "r": 257.58578, "b": 149.49834999999996, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "permission name", "bbox": {"l": 257.59152, "t": 139.67969000000005, "r": 336.99741, "b": 149.50982999999997, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": ">", "bbox": {"l": 337.01233, "t": 139.67969000000005, "r": 342.73126, "b": 149.49834999999996, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Names the row permission for row access control", "bbox": {"l": 346.56491, "t": 121.46252000000004, "r": 530.74371, "b": 129.33507999999995, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "ON", "bbox": {"l": 148.1337, "t": 181.06255999999996, "r": 163.45079, "b": 190.8927, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "<", "bbox": {"l": 168.58405, "t": 181.06255999999996, "r": 174.30298, "b": 190.88122999999996, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "table name", "bbox": {"l": 174.30872, "t": 181.06255999999996, "r": 226.86777, "b": 190.8927, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": ">", "bbox": {"l": 226.86548000000002, "t": 181.06255999999996, "r": 232.58441, "b": 190.88122999999996, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Identifies the table on which the row ", "bbox": {"l": 311.3204, "t": 166.29413, "r": 450.77191000000005, "b": 174.16669000000002, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "permission is created", "bbox": {"l": 450.86123999999995, "t": 166.29413, "r": 529.93134, "b": 174.16669000000002, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "AS ", "bbox": {"l": 148.1337, "t": 222.44550000000004, "r": 163.10973, "b": 232.27562999999998, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "<", "bbox": {"l": 165.68669, "t": 222.44550000000004, "r": 171.40562, "b": 232.26415999999995, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "correlation name", "bbox": {"l": 171.41136, "t": 222.44550000000004, "r": 251.20424000000003, "b": 232.27562999999998, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": ">", "bbox": {"l": 251.21115, "t": 222.44550000000004, "r": 256.93008, "b": 232.26415999999995, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Specifies an optional correlation name that ca", "bbox": {"l": 235.79649, "t": 204.22839, "r": 406.62051, "b": 212.10095, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "be used within search-condition", "bbox": {"l": 480.53094, "t": 204.22839, "r": 532.89496, "b": 212.10095, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "FOR ROWS", "bbox": {"l": 148.1337, "t": 263.82836999999995, "r": 199.72467, "b": 273.65851, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Indicates that a row permission is cr", "bbox": {"l": 321.56271, "t": 246.09411999999998, "r": 455.3432, "b": 253.96667000000002, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "eated", "bbox": {"l": 455.20786000000004, "t": 246.09411999999998, "r": 476.48404, "b": 253.96667000000002, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Specifies a condition that can be ", "bbox": {"l": 321.5972, "t": 266.30267000000003, "r": 444.0292400000001, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "true,", "bbox": {"l": 444.07986, "t": 266.30267000000003, "r": 459.08678999999995, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "false, or unknown", "bbox": {"l": 464.2088, "t": 266.30267000000003, "r": 530.94897, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "WHERE", "bbox": {"l": 148.1337, "t": 291.41708, "r": 183.42342, "b": 301.24722, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "<", "bbox": {"l": 188.61984, "t": 291.41708, "r": 194.33878, "b": 301.23572, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "logic to test: user and/or group and/or column value", "bbox": {"l": 194.34451, "t": 291.41708, "r": 437.04659999999996, "b": 301.24722, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": ">", "bbox": {"l": 437.09020999999996, "t": 291.41708, "r": 442.80914000000007, "b": 301.23572, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "ENFORCED FOR ALL ACCESS", "bbox": {"l": 148.1337, "t": 332.79999, "r": 278.77805, "b": 342.63013, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "Specifies that the row permission applies to all ref", "bbox": {"l": 271.55829, "t": 314.58276, "r": 457.4451, "b": 322.45535, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "erences of the table", "bbox": {"l": 457.19281, "t": 314.58276, "r": 531.74939, "b": 322.45535, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "ENABLE", "bbox": {"l": 148.1337, "t": 374.18289, "r": 185.17584, "b": 384.01302999999996, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Specifies that the row permission is to", "bbox": {"l": 312.28601, "t": 355.96576000000005, "r": 454.33505, "b": 363.83835, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": " be initially enabled", "bbox": {"l": 454.3461, "t": 355.96576000000005, "r": 527.05286, "b": 363.83835, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "S", "bbox": {"l": 311.73431, "t": 376.65717, "r": 315.94684, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "ifith t th", "bbox": {"l": 329.28326, "t": 376.65717, "r": 371.71786, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "i", "bbox": {"l": 415.0014, "t": 376.65717, "r": 417.09616, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "i", "bbox": {"l": 424.27356, "t": 376.65717, "r": 426.36832, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "i", "bbox": {"l": 438.13208, "t": 376.65717, "r": 440.2268399999999, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "t", "bbox": {"l": 445.88681, "t": 376.65717, "r": 448.95757999999995, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "b", "bbox": {"l": 455.8532400000001, "t": 376.65717, "r": 460.67346000000003, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "i", "bbox": {"l": 467.36746, "t": 376.65717, "r": 470.06998000000004, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "iti ll", "bbox": {"l": 472.73705999999993, "t": 376.65717, "r": 490.1676, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "di", "bbox": {"l": 496.33661, "t": 376.65717, "r": 503.2608, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "bl d", "bbox": {"l": 511.26138, "t": 376.65717, "r": 527.59674, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "DISABLE", "bbox": {"l": 148.1337, "t": 387.9772, "r": 187.6265, "b": 397.80734000000007, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": ";", "bbox": {"l": 187.58514, "t": 387.9772, "r": 190.6628, "b": 397.79583999999994, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Specifies that the row permission is to ", "bbox": {"l": 311.73431, "t": 376.65717, "r": 455.83047000000005, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "be initially disabled", "bbox": {"l": 455.8848, "t": 376.65717, "r": 527.62122, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": [{"id": 7, "label": "text", "bbox": {"l": 148.1337, "t": 139.67969000000005, "r": 246.7961, "b": 149.50982999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "CREATE PERMISSION", "bbox": {"l": 148.1337, "t": 139.67969000000005, "r": 246.7961, "b": 149.50982999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "text", "bbox": {"l": 251.86685, "t": 139.67969000000005, "r": 257.58578, "b": 149.49834999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "<", "bbox": {"l": 251.86685, "t": 139.67969000000005, "r": 257.58578, "b": 149.49834999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 257.59152, "t": 139.67969000000005, "r": 336.99741, "b": 149.50982999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "permission name", "bbox": {"l": 257.59152, "t": 139.67969000000005, "r": 336.99741, "b": 149.50982999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "text", "bbox": {"l": 337.01233, "t": 139.67969000000005, "r": 342.73126, "b": 149.49834999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": ">", "bbox": {"l": 337.01233, "t": 139.67969000000005, "r": 342.73126, "b": 149.49834999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 346.56491, "t": 121.46252000000004, "r": 530.74371, "b": 129.33507999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "Names the row permission for row access control", "bbox": {"l": 346.56491, "t": 121.46252000000004, "r": 530.74371, "b": 129.33507999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 148.1337, "t": 181.06255999999996, "r": 163.45079, "b": 190.8927, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "ON", "bbox": {"l": 148.1337, "t": 181.06255999999996, "r": 163.45079, "b": 190.8927, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 168.58405, "t": 181.06255999999996, "r": 174.30298, "b": 190.88122999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "<", "bbox": {"l": 168.58405, "t": 181.06255999999996, "r": 174.30298, "b": 190.88122999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 174.30872, "t": 181.06255999999996, "r": 226.86777, "b": 190.8927, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "table name", "bbox": {"l": 174.30872, "t": 181.06255999999996, "r": 226.86777, "b": 190.8927, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 226.86548000000002, "t": 181.06255999999996, "r": 232.58441, "b": 190.88122999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": ">", "bbox": {"l": 226.86548000000002, "t": 181.06255999999996, "r": 232.58441, "b": 190.88122999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 311.3204, "t": 166.29413, "r": 450.77191000000005, "b": 174.16669000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "Identifies the table on which the row ", "bbox": {"l": 311.3204, "t": 166.29413, "r": 450.77191000000005, "b": 174.16669000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 450.86123999999995, "t": 166.29413, "r": 529.93134, "b": 174.16669000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "permission is created", "bbox": {"l": 450.86123999999995, "t": 166.29413, "r": 529.93134, "b": 174.16669000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 148.1337, "t": 222.44550000000004, "r": 163.10973, "b": 232.27562999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "AS ", "bbox": {"l": 148.1337, "t": 222.44550000000004, "r": 163.10973, "b": 232.27562999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 165.68669, "t": 222.44550000000004, "r": 171.40562, "b": 232.26415999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "<", "bbox": {"l": 165.68669, "t": 222.44550000000004, "r": 171.40562, "b": 232.26415999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 171.41136, "t": 222.44550000000004, "r": 251.20424000000003, "b": 232.27562999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "correlation name", "bbox": {"l": 171.41136, "t": 222.44550000000004, "r": 251.20424000000003, "b": 232.27562999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 251.21115, "t": 222.44550000000004, "r": 256.93008, "b": 232.26415999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": ">", "bbox": {"l": 251.21115, "t": 222.44550000000004, "r": 256.93008, "b": 232.26415999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 235.79649, "t": 204.22839, "r": 406.62051, "b": 212.10095, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "Specifies an optional correlation name that ca", "bbox": {"l": 235.79649, "t": 204.22839, "r": 406.62051, "b": 212.10095, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 480.53094, "t": 204.22839, "r": 532.89496, "b": 212.10095, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "be used within search-condition", "bbox": {"l": 480.53094, "t": 204.22839, "r": 532.89496, "b": 212.10095, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 148.1337, "t": 263.82836999999995, "r": 199.72467, "b": 273.65851, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "FOR ROWS", "bbox": {"l": 148.1337, "t": 263.82836999999995, "r": 199.72467, "b": 273.65851, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 321.56271, "t": 246.09411999999998, "r": 455.3432, "b": 253.96667000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "Indicates that a row permission is cr", "bbox": {"l": 321.56271, "t": 246.09411999999998, "r": 455.3432, "b": 253.96667000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 455.20786000000004, "t": 246.09411999999998, "r": 476.48404, "b": 253.96667000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "eated", "bbox": {"l": 455.20786000000004, "t": 246.09411999999998, "r": 476.48404, "b": 253.96667000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 321.5972, "t": 266.30267000000003, "r": 444.0292400000001, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "Specifies a condition that can be ", "bbox": {"l": 321.5972, "t": 266.30267000000003, "r": 444.0292400000001, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 444.07986, "t": 266.30267000000003, "r": 459.08678999999995, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "true,", "bbox": {"l": 444.07986, "t": 266.30267000000003, "r": 459.08678999999995, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 464.2088, "t": 266.30267000000003, "r": 530.94897, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "false, or unknown", "bbox": {"l": 464.2088, "t": 266.30267000000003, "r": 530.94897, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 148.1337, "t": 291.41708, "r": 183.42342, "b": 301.24722, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "WHERE", "bbox": {"l": 148.1337, "t": 291.41708, "r": 183.42342, "b": 301.24722, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 188.61984, "t": 291.41708, "r": 194.33878, "b": 301.23572, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "<", "bbox": {"l": 188.61984, "t": 291.41708, "r": 194.33878, "b": 301.23572, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 194.34451, "t": 291.41708, "r": 437.04659999999996, "b": 301.24722, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "logic to test: user and/or group and/or column value", "bbox": {"l": 194.34451, "t": 291.41708, "r": 437.04659999999996, "b": 301.24722, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 437.09020999999996, "t": 291.41708, "r": 442.80914000000007, "b": 301.23572, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": ">", "bbox": {"l": 437.09020999999996, "t": 291.41708, "r": 442.80914000000007, "b": 301.23572, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 148.1337, "t": 332.79999, "r": 278.77805, "b": 342.63013, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "ENFORCED FOR ALL ACCESS", "bbox": {"l": 148.1337, "t": 332.79999, "r": 278.77805, "b": 342.63013, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 271.55829, "t": 314.58276, "r": 457.4451, "b": 322.45535, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "Specifies that the row permission applies to all ref", "bbox": {"l": 271.55829, "t": 314.58276, "r": 457.4451, "b": 322.45535, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 457.19281, "t": 314.58276, "r": 531.74939, "b": 322.45535, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "erences of the table", "bbox": {"l": 457.19281, "t": 314.58276, "r": 531.74939, "b": 322.45535, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 148.1337, "t": 374.18289, "r": 185.17584, "b": 384.01302999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "ENABLE", "bbox": {"l": 148.1337, "t": 374.18289, "r": 185.17584, "b": 384.01302999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 312.28601, "t": 355.96576000000005, "r": 454.33505, "b": 363.83835, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "Specifies that the row permission is to", "bbox": {"l": 312.28601, "t": 355.96576000000005, "r": 454.33505, "b": 363.83835, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 454.3461, "t": 355.96576000000005, "r": 527.05286, "b": 363.83835, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": " be initially enabled", "bbox": {"l": 454.3461, "t": 355.96576000000005, "r": 527.05286, "b": 363.83835, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 311.73431, "t": 376.65717, "r": 315.94684, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "S", "bbox": {"l": 311.73431, "t": 376.65717, "r": 315.94684, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 329.28326, "t": 376.65717, "r": 371.71786, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "ifith t th", "bbox": {"l": 329.28326, "t": 376.65717, "r": 371.71786, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 415.0014, "t": 376.65717, "r": 417.09616, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "i", "bbox": {"l": 415.0014, "t": 376.65717, "r": 417.09616, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 424.27356, "t": 376.65717, "r": 426.36832, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "i", "bbox": {"l": 424.27356, "t": 376.65717, "r": 426.36832, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 438.13208, "t": 376.65717, "r": 440.2268399999999, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "i", "bbox": {"l": 438.13208, "t": 376.65717, "r": 440.2268399999999, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 445.88681, "t": 376.65717, "r": 448.95757999999995, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "t", "bbox": {"l": 445.88681, "t": 376.65717, "r": 448.95757999999995, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 455.8532400000001, "t": 376.65717, "r": 460.67346000000003, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "b", "bbox": {"l": 455.8532400000001, "t": 376.65717, "r": 460.67346000000003, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 467.36746, "t": 376.65717, "r": 470.06998000000004, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "i", "bbox": {"l": 467.36746, "t": 376.65717, "r": 470.06998000000004, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 472.73705999999993, "t": 376.65717, "r": 490.1676, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "iti ll", "bbox": {"l": 472.73705999999993, "t": 376.65717, "r": 490.1676, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 496.33661, "t": 376.65717, "r": 503.2608, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "di", "bbox": {"l": 496.33661, "t": 376.65717, "r": 503.2608, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 511.26138, "t": 376.65717, "r": 527.59674, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "bl d", "bbox": {"l": 511.26138, "t": 376.65717, "r": 527.59674, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 148.1337, "t": 387.9772, "r": 187.6265, "b": 397.80734000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "DISABLE", "bbox": {"l": 148.1337, "t": 387.9772, "r": 187.6265, "b": 397.80734000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 187.58514, "t": 387.9772, "r": 190.6628, "b": 397.79583999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": ";", "bbox": {"l": 187.58514, "t": 387.9772, "r": 190.6628, "b": 397.79583999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 311.73431, "t": 376.65717, "r": 455.83047000000005, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "Specifies that the row permission is to ", "bbox": {"l": 311.73431, "t": 376.65717, "r": 455.83047000000005, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 455.8848, "t": 376.65717, "r": 527.62122, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "be initially disabled", "bbox": {"l": 455.8848, "t": 376.65717, "r": 527.62122, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}]}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_footer", "id": 2, "page_no": 9, "cluster": {"id": 2, "label": "page_footer", "bbox": {"l": 344.94, "t": 755.538002, "r": 523.60162, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9526246786117554, "cells": [{"id": 0, "text": "Chapter 3. Row and Column Access Control ", "bbox": {"l": 344.94, "t": 755.538002, "r": 523.60162, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Chapter 3. Row and Column Access Control"}, {"label": "page_footer", "id": 5, "page_no": 9, "cluster": {"id": 5, "label": "page_footer", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.9071078896522522, "cells": [{"id": 1, "text": "15", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "15"}, {"label": "caption", "id": 6, "page_no": 9, "cluster": {"id": 6, "label": "caption", "bbox": {"l": 136.79956, "t": 71.50903000000005, "r": 528.73059, "b": 92.72185999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.872844398021698, "cells": [{"id": 2, "text": "The SQL ", "bbox": {"l": 136.79959, "t": 71.50903000000005, "r": 179.58179, "b": 80.72204999999985, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "CREATE PERMISSION", "bbox": {"l": 179.57977, "t": 71.65845000000002, "r": 264.47879, "b": 80.48302999999999, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": " statement that is shown in Figure 3-1 is used to define and ", "bbox": {"l": 264.53955, "t": 71.50903000000005, "r": 528.73059, "b": 80.72204999999985, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "initially enable or disable the row access rules.", "bbox": {"l": 136.79956, "t": 83.50885000000017, "r": 341.71762, "b": 92.72185999999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The SQL CREATE PERMISSION statement that is shown in Figure 3-1 is used to define and initially enable or disable the row access rules."}, {"label": "caption", "id": 4, "page_no": 9, "cluster": {"id": 4, "label": "caption", "bbox": {"l": 136.8, "t": 414.138, "r": 341.97659, "b": 422.46301, "coord_origin": "TOPLEFT"}, "confidence": 0.938783586025238, "cells": [{"id": 6, "text": "Figure 3-1 CREATE PERMISSION SQL statement", "bbox": {"l": 136.8, "t": 414.138, "r": 341.97659, "b": 422.46301, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 3-1 CREATE PERMISSION SQL statement"}, {"label": "section_header", "id": 3, "page_no": 9, "cluster": {"id": 3, "label": "section_header", "bbox": {"l": 136.8, "t": 439.94399999999996, "r": 215.37601, "b": 451.04401, "coord_origin": "TOPLEFT"}, "confidence": 0.9477567076683044, "cells": [{"id": 7, "text": "Column mask", "bbox": {"l": 136.8, "t": 439.94399999999996, "r": 215.37601, "b": 451.04401, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Column mask"}, {"label": "text", "id": 0, "page_no": 9, "cluster": {"id": 0, "label": "text", "bbox": {"l": 136.8, "t": 455.08871000000005, "r": 542.76648, "b": 500.30115, "coord_origin": "TOPLEFT"}, "confidence": 0.9843975901603699, "cells": [{"id": 8, "text": "A column mask is a database object that manifests a column value access control rule for a ", "bbox": {"l": 136.8, "t": 455.08871000000005, "r": 542.76648, "b": 464.3017, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "specific column in a specific table. It uses a CASE expression that describes what you see ", "bbox": {"l": 136.8, "t": 467.08853, "r": 537.84125, "b": 476.30151, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "when you access the column. For example, a teller can see only the last four digits of a tax ", "bbox": {"l": 136.8, "t": 479.08835, "r": 538.80927, "b": 488.30133, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "identification number.", "bbox": {"l": 136.8, "t": 491.08817, "r": 231.20888, "b": 500.30115, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "A column mask is a database object that manifests a column value access control rule for a specific column in a specific table. It uses a CASE expression that describes what you see when you access the column. For example, a teller can see only the last four digits of a tax identification number."}, {"label": "picture", "id": 1, "page_no": 9, "cluster": {"id": 1, "label": "picture", "bbox": {"l": 135.97177124023438, "t": 107.41075134277344, "r": 545.4180908203125, "b": 410.60931396484375, "coord_origin": "TOPLEFT"}, "confidence": 0.9788318872451782, "cells": [{"id": 12, "text": "CREATE PERMISSION", "bbox": {"l": 148.1337, "t": 139.67969000000005, "r": 246.7961, "b": 149.50982999999997, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "<", "bbox": {"l": 251.86685, "t": 139.67969000000005, "r": 257.58578, "b": 149.49834999999996, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "permission name", "bbox": {"l": 257.59152, "t": 139.67969000000005, "r": 336.99741, "b": 149.50982999999997, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": ">", "bbox": {"l": 337.01233, "t": 139.67969000000005, "r": 342.73126, "b": 149.49834999999996, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Names the row permission for row access control", "bbox": {"l": 346.56491, "t": 121.46252000000004, "r": 530.74371, "b": 129.33507999999995, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "ON", "bbox": {"l": 148.1337, "t": 181.06255999999996, "r": 163.45079, "b": 190.8927, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "<", "bbox": {"l": 168.58405, "t": 181.06255999999996, "r": 174.30298, "b": 190.88122999999996, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "table name", "bbox": {"l": 174.30872, "t": 181.06255999999996, "r": 226.86777, "b": 190.8927, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": ">", "bbox": {"l": 226.86548000000002, "t": 181.06255999999996, "r": 232.58441, "b": 190.88122999999996, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Identifies the table on which the row ", "bbox": {"l": 311.3204, "t": 166.29413, "r": 450.77191000000005, "b": 174.16669000000002, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "permission is created", "bbox": {"l": 450.86123999999995, "t": 166.29413, "r": 529.93134, "b": 174.16669000000002, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "AS ", "bbox": {"l": 148.1337, "t": 222.44550000000004, "r": 163.10973, "b": 232.27562999999998, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "<", "bbox": {"l": 165.68669, "t": 222.44550000000004, "r": 171.40562, "b": 232.26415999999995, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "correlation name", "bbox": {"l": 171.41136, "t": 222.44550000000004, "r": 251.20424000000003, "b": 232.27562999999998, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": ">", "bbox": {"l": 251.21115, "t": 222.44550000000004, "r": 256.93008, "b": 232.26415999999995, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Specifies an optional correlation name that ca", "bbox": {"l": 235.79649, "t": 204.22839, "r": 406.62051, "b": 212.10095, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "be used within search-condition", "bbox": {"l": 480.53094, "t": 204.22839, "r": 532.89496, "b": 212.10095, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "FOR ROWS", "bbox": {"l": 148.1337, "t": 263.82836999999995, "r": 199.72467, "b": 273.65851, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Indicates that a row permission is cr", "bbox": {"l": 321.56271, "t": 246.09411999999998, "r": 455.3432, "b": 253.96667000000002, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "eated", "bbox": {"l": 455.20786000000004, "t": 246.09411999999998, "r": 476.48404, "b": 253.96667000000002, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Specifies a condition that can be ", "bbox": {"l": 321.5972, "t": 266.30267000000003, "r": 444.0292400000001, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "true,", "bbox": {"l": 444.07986, "t": 266.30267000000003, "r": 459.08678999999995, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "false, or unknown", "bbox": {"l": 464.2088, "t": 266.30267000000003, "r": 530.94897, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "WHERE", "bbox": {"l": 148.1337, "t": 291.41708, "r": 183.42342, "b": 301.24722, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "<", "bbox": {"l": 188.61984, "t": 291.41708, "r": 194.33878, "b": 301.23572, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "logic to test: user and/or group and/or column value", "bbox": {"l": 194.34451, "t": 291.41708, "r": 437.04659999999996, "b": 301.24722, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": ">", "bbox": {"l": 437.09020999999996, "t": 291.41708, "r": 442.80914000000007, "b": 301.23572, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "ENFORCED FOR ALL ACCESS", "bbox": {"l": 148.1337, "t": 332.79999, "r": 278.77805, "b": 342.63013, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "Specifies that the row permission applies to all ref", "bbox": {"l": 271.55829, "t": 314.58276, "r": 457.4451, "b": 322.45535, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "erences of the table", "bbox": {"l": 457.19281, "t": 314.58276, "r": 531.74939, "b": 322.45535, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "ENABLE", "bbox": {"l": 148.1337, "t": 374.18289, "r": 185.17584, "b": 384.01302999999996, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Specifies that the row permission is to", "bbox": {"l": 312.28601, "t": 355.96576000000005, "r": 454.33505, "b": 363.83835, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": " be initially enabled", "bbox": {"l": 454.3461, "t": 355.96576000000005, "r": 527.05286, "b": 363.83835, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "S", "bbox": {"l": 311.73431, "t": 376.65717, "r": 315.94684, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "ifith t th", "bbox": {"l": 329.28326, "t": 376.65717, "r": 371.71786, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "i", "bbox": {"l": 415.0014, "t": 376.65717, "r": 417.09616, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "i", "bbox": {"l": 424.27356, "t": 376.65717, "r": 426.36832, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "i", "bbox": {"l": 438.13208, "t": 376.65717, "r": 440.2268399999999, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "t", "bbox": {"l": 445.88681, "t": 376.65717, "r": 448.95757999999995, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "b", "bbox": {"l": 455.8532400000001, "t": 376.65717, "r": 460.67346000000003, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "i", "bbox": {"l": 467.36746, "t": 376.65717, "r": 470.06998000000004, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "iti ll", "bbox": {"l": 472.73705999999993, "t": 376.65717, "r": 490.1676, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "di", "bbox": {"l": 496.33661, "t": 376.65717, "r": 503.2608, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "bl d", "bbox": {"l": 511.26138, "t": 376.65717, "r": 527.59674, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "DISABLE", "bbox": {"l": 148.1337, "t": 387.9772, "r": 187.6265, "b": 397.80734000000007, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": ";", "bbox": {"l": 187.58514, "t": 387.9772, "r": 190.6628, "b": 397.79583999999994, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Specifies that the row permission is to ", "bbox": {"l": 311.73431, "t": 376.65717, "r": 455.83047000000005, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "be initially disabled", "bbox": {"l": 455.8848, "t": 376.65717, "r": 527.62122, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": [{"id": 7, "label": "text", "bbox": {"l": 148.1337, "t": 139.67969000000005, "r": 246.7961, "b": 149.50982999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "CREATE PERMISSION", "bbox": {"l": 148.1337, "t": 139.67969000000005, "r": 246.7961, "b": 149.50982999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "text", "bbox": {"l": 251.86685, "t": 139.67969000000005, "r": 257.58578, "b": 149.49834999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "<", "bbox": {"l": 251.86685, "t": 139.67969000000005, "r": 257.58578, "b": 149.49834999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 257.59152, "t": 139.67969000000005, "r": 336.99741, "b": 149.50982999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "permission name", "bbox": {"l": 257.59152, "t": 139.67969000000005, "r": 336.99741, "b": 149.50982999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "text", "bbox": {"l": 337.01233, "t": 139.67969000000005, "r": 342.73126, "b": 149.49834999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": ">", "bbox": {"l": 337.01233, "t": 139.67969000000005, "r": 342.73126, "b": 149.49834999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 346.56491, "t": 121.46252000000004, "r": 530.74371, "b": 129.33507999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "Names the row permission for row access control", "bbox": {"l": 346.56491, "t": 121.46252000000004, "r": 530.74371, "b": 129.33507999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 148.1337, "t": 181.06255999999996, "r": 163.45079, "b": 190.8927, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "ON", "bbox": {"l": 148.1337, "t": 181.06255999999996, "r": 163.45079, "b": 190.8927, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 168.58405, "t": 181.06255999999996, "r": 174.30298, "b": 190.88122999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "<", "bbox": {"l": 168.58405, "t": 181.06255999999996, "r": 174.30298, "b": 190.88122999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 174.30872, "t": 181.06255999999996, "r": 226.86777, "b": 190.8927, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "table name", "bbox": {"l": 174.30872, "t": 181.06255999999996, "r": 226.86777, "b": 190.8927, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 226.86548000000002, "t": 181.06255999999996, "r": 232.58441, "b": 190.88122999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": ">", "bbox": {"l": 226.86548000000002, "t": 181.06255999999996, "r": 232.58441, "b": 190.88122999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 311.3204, "t": 166.29413, "r": 450.77191000000005, "b": 174.16669000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "Identifies the table on which the row ", "bbox": {"l": 311.3204, "t": 166.29413, "r": 450.77191000000005, "b": 174.16669000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 450.86123999999995, "t": 166.29413, "r": 529.93134, "b": 174.16669000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "permission is created", "bbox": {"l": 450.86123999999995, "t": 166.29413, "r": 529.93134, "b": 174.16669000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 148.1337, "t": 222.44550000000004, "r": 163.10973, "b": 232.27562999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "AS ", "bbox": {"l": 148.1337, "t": 222.44550000000004, "r": 163.10973, "b": 232.27562999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 165.68669, "t": 222.44550000000004, "r": 171.40562, "b": 232.26415999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "<", "bbox": {"l": 165.68669, "t": 222.44550000000004, "r": 171.40562, "b": 232.26415999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 171.41136, "t": 222.44550000000004, "r": 251.20424000000003, "b": 232.27562999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "correlation name", "bbox": {"l": 171.41136, "t": 222.44550000000004, "r": 251.20424000000003, "b": 232.27562999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 251.21115, "t": 222.44550000000004, "r": 256.93008, "b": 232.26415999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": ">", "bbox": {"l": 251.21115, "t": 222.44550000000004, "r": 256.93008, "b": 232.26415999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 235.79649, "t": 204.22839, "r": 406.62051, "b": 212.10095, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "Specifies an optional correlation name that ca", "bbox": {"l": 235.79649, "t": 204.22839, "r": 406.62051, "b": 212.10095, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 480.53094, "t": 204.22839, "r": 532.89496, "b": 212.10095, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "be used within search-condition", "bbox": {"l": 480.53094, "t": 204.22839, "r": 532.89496, "b": 212.10095, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 148.1337, "t": 263.82836999999995, "r": 199.72467, "b": 273.65851, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "FOR ROWS", "bbox": {"l": 148.1337, "t": 263.82836999999995, "r": 199.72467, "b": 273.65851, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 321.56271, "t": 246.09411999999998, "r": 455.3432, "b": 253.96667000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "Indicates that a row permission is cr", "bbox": {"l": 321.56271, "t": 246.09411999999998, "r": 455.3432, "b": 253.96667000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 455.20786000000004, "t": 246.09411999999998, "r": 476.48404, "b": 253.96667000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "eated", "bbox": {"l": 455.20786000000004, "t": 246.09411999999998, "r": 476.48404, "b": 253.96667000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 321.5972, "t": 266.30267000000003, "r": 444.0292400000001, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "Specifies a condition that can be ", "bbox": {"l": 321.5972, "t": 266.30267000000003, "r": 444.0292400000001, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 444.07986, "t": 266.30267000000003, "r": 459.08678999999995, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "true,", "bbox": {"l": 444.07986, "t": 266.30267000000003, "r": 459.08678999999995, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 464.2088, "t": 266.30267000000003, "r": 530.94897, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "false, or unknown", "bbox": {"l": 464.2088, "t": 266.30267000000003, "r": 530.94897, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 148.1337, "t": 291.41708, "r": 183.42342, "b": 301.24722, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "WHERE", "bbox": {"l": 148.1337, "t": 291.41708, "r": 183.42342, "b": 301.24722, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 188.61984, "t": 291.41708, "r": 194.33878, "b": 301.23572, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "<", "bbox": {"l": 188.61984, "t": 291.41708, "r": 194.33878, "b": 301.23572, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 194.34451, "t": 291.41708, "r": 437.04659999999996, "b": 301.24722, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "logic to test: user and/or group and/or column value", "bbox": {"l": 194.34451, "t": 291.41708, "r": 437.04659999999996, "b": 301.24722, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 437.09020999999996, "t": 291.41708, "r": 442.80914000000007, "b": 301.23572, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": ">", "bbox": {"l": 437.09020999999996, "t": 291.41708, "r": 442.80914000000007, "b": 301.23572, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 148.1337, "t": 332.79999, "r": 278.77805, "b": 342.63013, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "ENFORCED FOR ALL ACCESS", "bbox": {"l": 148.1337, "t": 332.79999, "r": 278.77805, "b": 342.63013, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 271.55829, "t": 314.58276, "r": 457.4451, "b": 322.45535, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "Specifies that the row permission applies to all ref", "bbox": {"l": 271.55829, "t": 314.58276, "r": 457.4451, "b": 322.45535, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 457.19281, "t": 314.58276, "r": 531.74939, "b": 322.45535, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "erences of the table", "bbox": {"l": 457.19281, "t": 314.58276, "r": 531.74939, "b": 322.45535, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 148.1337, "t": 374.18289, "r": 185.17584, "b": 384.01302999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "ENABLE", "bbox": {"l": 148.1337, "t": 374.18289, "r": 185.17584, "b": 384.01302999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 312.28601, "t": 355.96576000000005, "r": 454.33505, "b": 363.83835, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "Specifies that the row permission is to", "bbox": {"l": 312.28601, "t": 355.96576000000005, "r": 454.33505, "b": 363.83835, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 454.3461, "t": 355.96576000000005, "r": 527.05286, "b": 363.83835, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": " be initially enabled", "bbox": {"l": 454.3461, "t": 355.96576000000005, "r": 527.05286, "b": 363.83835, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 311.73431, "t": 376.65717, "r": 315.94684, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "S", "bbox": {"l": 311.73431, "t": 376.65717, "r": 315.94684, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 329.28326, "t": 376.65717, "r": 371.71786, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "ifith t th", "bbox": {"l": 329.28326, "t": 376.65717, "r": 371.71786, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 415.0014, "t": 376.65717, "r": 417.09616, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "i", "bbox": {"l": 415.0014, "t": 376.65717, "r": 417.09616, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 424.27356, "t": 376.65717, "r": 426.36832, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "i", "bbox": {"l": 424.27356, "t": 376.65717, "r": 426.36832, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 438.13208, "t": 376.65717, "r": 440.2268399999999, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "i", "bbox": {"l": 438.13208, "t": 376.65717, "r": 440.2268399999999, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 445.88681, "t": 376.65717, "r": 448.95757999999995, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "t", "bbox": {"l": 445.88681, "t": 376.65717, "r": 448.95757999999995, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 455.8532400000001, "t": 376.65717, "r": 460.67346000000003, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "b", "bbox": {"l": 455.8532400000001, "t": 376.65717, "r": 460.67346000000003, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 467.36746, "t": 376.65717, "r": 470.06998000000004, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "i", "bbox": {"l": 467.36746, "t": 376.65717, "r": 470.06998000000004, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 472.73705999999993, "t": 376.65717, "r": 490.1676, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "iti ll", "bbox": {"l": 472.73705999999993, "t": 376.65717, "r": 490.1676, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 496.33661, "t": 376.65717, "r": 503.2608, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "di", "bbox": {"l": 496.33661, "t": 376.65717, "r": 503.2608, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 511.26138, "t": 376.65717, "r": 527.59674, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "bl d", "bbox": {"l": 511.26138, "t": 376.65717, "r": 527.59674, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 148.1337, "t": 387.9772, "r": 187.6265, "b": 397.80734000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "DISABLE", "bbox": {"l": 148.1337, "t": 387.9772, "r": 187.6265, "b": 397.80734000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 187.58514, "t": 387.9772, "r": 190.6628, "b": 397.79583999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": ";", "bbox": {"l": 187.58514, "t": 387.9772, "r": 190.6628, "b": 397.79583999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 311.73431, "t": 376.65717, "r": 455.83047000000005, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "Specifies that the row permission is to ", "bbox": {"l": 311.73431, "t": 376.65717, "r": 455.83047000000005, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 455.8848, "t": 376.65717, "r": 527.62122, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "be initially disabled", "bbox": {"l": 455.8848, "t": 376.65717, "r": 527.62122, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "body": [{"label": "caption", "id": 6, "page_no": 9, "cluster": {"id": 6, "label": "caption", "bbox": {"l": 136.79956, "t": 71.50903000000005, "r": 528.73059, "b": 92.72185999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.872844398021698, "cells": [{"id": 2, "text": "The SQL ", "bbox": {"l": 136.79959, "t": 71.50903000000005, "r": 179.58179, "b": 80.72204999999985, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "CREATE PERMISSION", "bbox": {"l": 179.57977, "t": 71.65845000000002, "r": 264.47879, "b": 80.48302999999999, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": " statement that is shown in Figure 3-1 is used to define and ", "bbox": {"l": 264.53955, "t": 71.50903000000005, "r": 528.73059, "b": 80.72204999999985, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "initially enable or disable the row access rules.", "bbox": {"l": 136.79956, "t": 83.50885000000017, "r": 341.71762, "b": 92.72185999999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The SQL CREATE PERMISSION statement that is shown in Figure 3-1 is used to define and initially enable or disable the row access rules."}, {"label": "caption", "id": 4, "page_no": 9, "cluster": {"id": 4, "label": "caption", "bbox": {"l": 136.8, "t": 414.138, "r": 341.97659, "b": 422.46301, "coord_origin": "TOPLEFT"}, "confidence": 0.938783586025238, "cells": [{"id": 6, "text": "Figure 3-1 CREATE PERMISSION SQL statement", "bbox": {"l": 136.8, "t": 414.138, "r": 341.97659, "b": 422.46301, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 3-1 CREATE PERMISSION SQL statement"}, {"label": "section_header", "id": 3, "page_no": 9, "cluster": {"id": 3, "label": "section_header", "bbox": {"l": 136.8, "t": 439.94399999999996, "r": 215.37601, "b": 451.04401, "coord_origin": "TOPLEFT"}, "confidence": 0.9477567076683044, "cells": [{"id": 7, "text": "Column mask", "bbox": {"l": 136.8, "t": 439.94399999999996, "r": 215.37601, "b": 451.04401, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Column mask"}, {"label": "text", "id": 0, "page_no": 9, "cluster": {"id": 0, "label": "text", "bbox": {"l": 136.8, "t": 455.08871000000005, "r": 542.76648, "b": 500.30115, "coord_origin": "TOPLEFT"}, "confidence": 0.9843975901603699, "cells": [{"id": 8, "text": "A column mask is a database object that manifests a column value access control rule for a ", "bbox": {"l": 136.8, "t": 455.08871000000005, "r": 542.76648, "b": 464.3017, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "specific column in a specific table. It uses a CASE expression that describes what you see ", "bbox": {"l": 136.8, "t": 467.08853, "r": 537.84125, "b": 476.30151, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "when you access the column. For example, a teller can see only the last four digits of a tax ", "bbox": {"l": 136.8, "t": 479.08835, "r": 538.80927, "b": 488.30133, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "identification number.", "bbox": {"l": 136.8, "t": 491.08817, "r": 231.20888, "b": 500.30115, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "A column mask is a database object that manifests a column value access control rule for a specific column in a specific table. It uses a CASE expression that describes what you see when you access the column. For example, a teller can see only the last four digits of a tax identification number."}, {"label": "picture", "id": 1, "page_no": 9, "cluster": {"id": 1, "label": "picture", "bbox": {"l": 135.97177124023438, "t": 107.41075134277344, "r": 545.4180908203125, "b": 410.60931396484375, "coord_origin": "TOPLEFT"}, "confidence": 0.9788318872451782, "cells": [{"id": 12, "text": "CREATE PERMISSION", "bbox": {"l": 148.1337, "t": 139.67969000000005, "r": 246.7961, "b": 149.50982999999997, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "<", "bbox": {"l": 251.86685, "t": 139.67969000000005, "r": 257.58578, "b": 149.49834999999996, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "permission name", "bbox": {"l": 257.59152, "t": 139.67969000000005, "r": 336.99741, "b": 149.50982999999997, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": ">", "bbox": {"l": 337.01233, "t": 139.67969000000005, "r": 342.73126, "b": 149.49834999999996, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Names the row permission for row access control", "bbox": {"l": 346.56491, "t": 121.46252000000004, "r": 530.74371, "b": 129.33507999999995, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "ON", "bbox": {"l": 148.1337, "t": 181.06255999999996, "r": 163.45079, "b": 190.8927, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "<", "bbox": {"l": 168.58405, "t": 181.06255999999996, "r": 174.30298, "b": 190.88122999999996, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "table name", "bbox": {"l": 174.30872, "t": 181.06255999999996, "r": 226.86777, "b": 190.8927, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": ">", "bbox": {"l": 226.86548000000002, "t": 181.06255999999996, "r": 232.58441, "b": 190.88122999999996, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Identifies the table on which the row ", "bbox": {"l": 311.3204, "t": 166.29413, "r": 450.77191000000005, "b": 174.16669000000002, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "permission is created", "bbox": {"l": 450.86123999999995, "t": 166.29413, "r": 529.93134, "b": 174.16669000000002, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "AS ", "bbox": {"l": 148.1337, "t": 222.44550000000004, "r": 163.10973, "b": 232.27562999999998, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "<", "bbox": {"l": 165.68669, "t": 222.44550000000004, "r": 171.40562, "b": 232.26415999999995, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "correlation name", "bbox": {"l": 171.41136, "t": 222.44550000000004, "r": 251.20424000000003, "b": 232.27562999999998, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": ">", "bbox": {"l": 251.21115, "t": 222.44550000000004, "r": 256.93008, "b": 232.26415999999995, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Specifies an optional correlation name that ca", "bbox": {"l": 235.79649, "t": 204.22839, "r": 406.62051, "b": 212.10095, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "be used within search-condition", "bbox": {"l": 480.53094, "t": 204.22839, "r": 532.89496, "b": 212.10095, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "FOR ROWS", "bbox": {"l": 148.1337, "t": 263.82836999999995, "r": 199.72467, "b": 273.65851, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Indicates that a row permission is cr", "bbox": {"l": 321.56271, "t": 246.09411999999998, "r": 455.3432, "b": 253.96667000000002, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "eated", "bbox": {"l": 455.20786000000004, "t": 246.09411999999998, "r": 476.48404, "b": 253.96667000000002, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Specifies a condition that can be ", "bbox": {"l": 321.5972, "t": 266.30267000000003, "r": 444.0292400000001, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "true,", "bbox": {"l": 444.07986, "t": 266.30267000000003, "r": 459.08678999999995, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "false, or unknown", "bbox": {"l": 464.2088, "t": 266.30267000000003, "r": 530.94897, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "WHERE", "bbox": {"l": 148.1337, "t": 291.41708, "r": 183.42342, "b": 301.24722, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "<", "bbox": {"l": 188.61984, "t": 291.41708, "r": 194.33878, "b": 301.23572, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "logic to test: user and/or group and/or column value", "bbox": {"l": 194.34451, "t": 291.41708, "r": 437.04659999999996, "b": 301.24722, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": ">", "bbox": {"l": 437.09020999999996, "t": 291.41708, "r": 442.80914000000007, "b": 301.23572, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "ENFORCED FOR ALL ACCESS", "bbox": {"l": 148.1337, "t": 332.79999, "r": 278.77805, "b": 342.63013, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "Specifies that the row permission applies to all ref", "bbox": {"l": 271.55829, "t": 314.58276, "r": 457.4451, "b": 322.45535, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "erences of the table", "bbox": {"l": 457.19281, "t": 314.58276, "r": 531.74939, "b": 322.45535, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "ENABLE", "bbox": {"l": 148.1337, "t": 374.18289, "r": 185.17584, "b": 384.01302999999996, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Specifies that the row permission is to", "bbox": {"l": 312.28601, "t": 355.96576000000005, "r": 454.33505, "b": 363.83835, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": " be initially enabled", "bbox": {"l": 454.3461, "t": 355.96576000000005, "r": 527.05286, "b": 363.83835, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "S", "bbox": {"l": 311.73431, "t": 376.65717, "r": 315.94684, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "ifith t th", "bbox": {"l": 329.28326, "t": 376.65717, "r": 371.71786, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "i", "bbox": {"l": 415.0014, "t": 376.65717, "r": 417.09616, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "i", "bbox": {"l": 424.27356, "t": 376.65717, "r": 426.36832, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "i", "bbox": {"l": 438.13208, "t": 376.65717, "r": 440.2268399999999, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "t", "bbox": {"l": 445.88681, "t": 376.65717, "r": 448.95757999999995, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "b", "bbox": {"l": 455.8532400000001, "t": 376.65717, "r": 460.67346000000003, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "i", "bbox": {"l": 467.36746, "t": 376.65717, "r": 470.06998000000004, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "iti ll", "bbox": {"l": 472.73705999999993, "t": 376.65717, "r": 490.1676, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "di", "bbox": {"l": 496.33661, "t": 376.65717, "r": 503.2608, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "bl d", "bbox": {"l": 511.26138, "t": 376.65717, "r": 527.59674, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "DISABLE", "bbox": {"l": 148.1337, "t": 387.9772, "r": 187.6265, "b": 397.80734000000007, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": ";", "bbox": {"l": 187.58514, "t": 387.9772, "r": 190.6628, "b": 397.79583999999994, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Specifies that the row permission is to ", "bbox": {"l": 311.73431, "t": 376.65717, "r": 455.83047000000005, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "be initially disabled", "bbox": {"l": 455.8848, "t": 376.65717, "r": 527.62122, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": [{"id": 7, "label": "text", "bbox": {"l": 148.1337, "t": 139.67969000000005, "r": 246.7961, "b": 149.50982999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "CREATE PERMISSION", "bbox": {"l": 148.1337, "t": 139.67969000000005, "r": 246.7961, "b": 149.50982999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "text", "bbox": {"l": 251.86685, "t": 139.67969000000005, "r": 257.58578, "b": 149.49834999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "<", "bbox": {"l": 251.86685, "t": 139.67969000000005, "r": 257.58578, "b": 149.49834999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 257.59152, "t": 139.67969000000005, "r": 336.99741, "b": 149.50982999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "permission name", "bbox": {"l": 257.59152, "t": 139.67969000000005, "r": 336.99741, "b": 149.50982999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "text", "bbox": {"l": 337.01233, "t": 139.67969000000005, "r": 342.73126, "b": 149.49834999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": ">", "bbox": {"l": 337.01233, "t": 139.67969000000005, "r": 342.73126, "b": 149.49834999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 346.56491, "t": 121.46252000000004, "r": 530.74371, "b": 129.33507999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "Names the row permission for row access control", "bbox": {"l": 346.56491, "t": 121.46252000000004, "r": 530.74371, "b": 129.33507999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 148.1337, "t": 181.06255999999996, "r": 163.45079, "b": 190.8927, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "ON", "bbox": {"l": 148.1337, "t": 181.06255999999996, "r": 163.45079, "b": 190.8927, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 168.58405, "t": 181.06255999999996, "r": 174.30298, "b": 190.88122999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "<", "bbox": {"l": 168.58405, "t": 181.06255999999996, "r": 174.30298, "b": 190.88122999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 174.30872, "t": 181.06255999999996, "r": 226.86777, "b": 190.8927, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "table name", "bbox": {"l": 174.30872, "t": 181.06255999999996, "r": 226.86777, "b": 190.8927, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 226.86548000000002, "t": 181.06255999999996, "r": 232.58441, "b": 190.88122999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": ">", "bbox": {"l": 226.86548000000002, "t": 181.06255999999996, "r": 232.58441, "b": 190.88122999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 311.3204, "t": 166.29413, "r": 450.77191000000005, "b": 174.16669000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "Identifies the table on which the row ", "bbox": {"l": 311.3204, "t": 166.29413, "r": 450.77191000000005, "b": 174.16669000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 450.86123999999995, "t": 166.29413, "r": 529.93134, "b": 174.16669000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "permission is created", "bbox": {"l": 450.86123999999995, "t": 166.29413, "r": 529.93134, "b": 174.16669000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 148.1337, "t": 222.44550000000004, "r": 163.10973, "b": 232.27562999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "AS ", "bbox": {"l": 148.1337, "t": 222.44550000000004, "r": 163.10973, "b": 232.27562999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 165.68669, "t": 222.44550000000004, "r": 171.40562, "b": 232.26415999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "<", "bbox": {"l": 165.68669, "t": 222.44550000000004, "r": 171.40562, "b": 232.26415999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 171.41136, "t": 222.44550000000004, "r": 251.20424000000003, "b": 232.27562999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "correlation name", "bbox": {"l": 171.41136, "t": 222.44550000000004, "r": 251.20424000000003, "b": 232.27562999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 251.21115, "t": 222.44550000000004, "r": 256.93008, "b": 232.26415999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": ">", "bbox": {"l": 251.21115, "t": 222.44550000000004, "r": 256.93008, "b": 232.26415999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 235.79649, "t": 204.22839, "r": 406.62051, "b": 212.10095, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "Specifies an optional correlation name that ca", "bbox": {"l": 235.79649, "t": 204.22839, "r": 406.62051, "b": 212.10095, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 480.53094, "t": 204.22839, "r": 532.89496, "b": 212.10095, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "be used within search-condition", "bbox": {"l": 480.53094, "t": 204.22839, "r": 532.89496, "b": 212.10095, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 148.1337, "t": 263.82836999999995, "r": 199.72467, "b": 273.65851, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "FOR ROWS", "bbox": {"l": 148.1337, "t": 263.82836999999995, "r": 199.72467, "b": 273.65851, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 321.56271, "t": 246.09411999999998, "r": 455.3432, "b": 253.96667000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "Indicates that a row permission is cr", "bbox": {"l": 321.56271, "t": 246.09411999999998, "r": 455.3432, "b": 253.96667000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 455.20786000000004, "t": 246.09411999999998, "r": 476.48404, "b": 253.96667000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "eated", "bbox": {"l": 455.20786000000004, "t": 246.09411999999998, "r": 476.48404, "b": 253.96667000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 321.5972, "t": 266.30267000000003, "r": 444.0292400000001, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "Specifies a condition that can be ", "bbox": {"l": 321.5972, "t": 266.30267000000003, "r": 444.0292400000001, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 444.07986, "t": 266.30267000000003, "r": 459.08678999999995, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "true,", "bbox": {"l": 444.07986, "t": 266.30267000000003, "r": 459.08678999999995, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 464.2088, "t": 266.30267000000003, "r": 530.94897, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "false, or unknown", "bbox": {"l": 464.2088, "t": 266.30267000000003, "r": 530.94897, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 148.1337, "t": 291.41708, "r": 183.42342, "b": 301.24722, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "WHERE", "bbox": {"l": 148.1337, "t": 291.41708, "r": 183.42342, "b": 301.24722, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 188.61984, "t": 291.41708, "r": 194.33878, "b": 301.23572, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "<", "bbox": {"l": 188.61984, "t": 291.41708, "r": 194.33878, "b": 301.23572, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 194.34451, "t": 291.41708, "r": 437.04659999999996, "b": 301.24722, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "logic to test: user and/or group and/or column value", "bbox": {"l": 194.34451, "t": 291.41708, "r": 437.04659999999996, "b": 301.24722, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 437.09020999999996, "t": 291.41708, "r": 442.80914000000007, "b": 301.23572, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": ">", "bbox": {"l": 437.09020999999996, "t": 291.41708, "r": 442.80914000000007, "b": 301.23572, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 148.1337, "t": 332.79999, "r": 278.77805, "b": 342.63013, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "ENFORCED FOR ALL ACCESS", "bbox": {"l": 148.1337, "t": 332.79999, "r": 278.77805, "b": 342.63013, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 271.55829, "t": 314.58276, "r": 457.4451, "b": 322.45535, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "Specifies that the row permission applies to all ref", "bbox": {"l": 271.55829, "t": 314.58276, "r": 457.4451, "b": 322.45535, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 457.19281, "t": 314.58276, "r": 531.74939, "b": 322.45535, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "erences of the table", "bbox": {"l": 457.19281, "t": 314.58276, "r": 531.74939, "b": 322.45535, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 148.1337, "t": 374.18289, "r": 185.17584, "b": 384.01302999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "ENABLE", "bbox": {"l": 148.1337, "t": 374.18289, "r": 185.17584, "b": 384.01302999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 312.28601, "t": 355.96576000000005, "r": 454.33505, "b": 363.83835, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "Specifies that the row permission is to", "bbox": {"l": 312.28601, "t": 355.96576000000005, "r": 454.33505, "b": 363.83835, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 454.3461, "t": 355.96576000000005, "r": 527.05286, "b": 363.83835, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": " be initially enabled", "bbox": {"l": 454.3461, "t": 355.96576000000005, "r": 527.05286, "b": 363.83835, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 311.73431, "t": 376.65717, "r": 315.94684, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "S", "bbox": {"l": 311.73431, "t": 376.65717, "r": 315.94684, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 329.28326, "t": 376.65717, "r": 371.71786, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "ifith t th", "bbox": {"l": 329.28326, "t": 376.65717, "r": 371.71786, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 415.0014, "t": 376.65717, "r": 417.09616, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "i", "bbox": {"l": 415.0014, "t": 376.65717, "r": 417.09616, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 424.27356, "t": 376.65717, "r": 426.36832, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "i", "bbox": {"l": 424.27356, "t": 376.65717, "r": 426.36832, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 438.13208, "t": 376.65717, "r": 440.2268399999999, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "i", "bbox": {"l": 438.13208, "t": 376.65717, "r": 440.2268399999999, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 445.88681, "t": 376.65717, "r": 448.95757999999995, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "t", "bbox": {"l": 445.88681, "t": 376.65717, "r": 448.95757999999995, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 455.8532400000001, "t": 376.65717, "r": 460.67346000000003, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "b", "bbox": {"l": 455.8532400000001, "t": 376.65717, "r": 460.67346000000003, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 467.36746, "t": 376.65717, "r": 470.06998000000004, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "i", "bbox": {"l": 467.36746, "t": 376.65717, "r": 470.06998000000004, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 472.73705999999993, "t": 376.65717, "r": 490.1676, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "iti ll", "bbox": {"l": 472.73705999999993, "t": 376.65717, "r": 490.1676, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 496.33661, "t": 376.65717, "r": 503.2608, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "di", "bbox": {"l": 496.33661, "t": 376.65717, "r": 503.2608, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 511.26138, "t": 376.65717, "r": 527.59674, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "bl d", "bbox": {"l": 511.26138, "t": 376.65717, "r": 527.59674, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 148.1337, "t": 387.9772, "r": 187.6265, "b": 397.80734000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "DISABLE", "bbox": {"l": 148.1337, "t": 387.9772, "r": 187.6265, "b": 397.80734000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 187.58514, "t": 387.9772, "r": 190.6628, "b": 397.79583999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": ";", "bbox": {"l": 187.58514, "t": 387.9772, "r": 190.6628, "b": 397.79583999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 311.73431, "t": 376.65717, "r": 455.83047000000005, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "Specifies that the row permission is to ", "bbox": {"l": 311.73431, "t": 376.65717, "r": 455.83047000000005, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 455.8848, "t": 376.65717, "r": 527.62122, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "be initially disabled", "bbox": {"l": 455.8848, "t": 376.65717, "r": 527.62122, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "headers": [{"label": "page_footer", "id": 2, "page_no": 9, "cluster": {"id": 2, "label": "page_footer", "bbox": {"l": 344.94, "t": 755.538002, "r": 523.60162, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9526246786117554, "cells": [{"id": 0, "text": "Chapter 3. Row and Column Access Control ", "bbox": {"l": 344.94, "t": 755.538002, "r": 523.60162, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Chapter 3. Row and Column Access Control"}, {"label": "page_footer", "id": 5, "page_no": 9, "cluster": {"id": 5, "label": "page_footer", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.9071078896522522, "cells": [{"id": 1, "text": "15", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "15"}]}}, {"page_no": 10, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "Chapter 3. Row and Column Access Control ", "bbox": {"l": 344.94, "t": 755.538002, "r": 523.60162, "b": 763.863001, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "19", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Table 3-1 summarizes these special registers and their values.", "bbox": {"l": 136.79959, "t": 71.50903000000005, "r": 412.20758, "b": 80.72204999999985, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Table 3-1 Special registers and their corresponding values", "bbox": {"l": 136.8, "t": 93.49805000000003, "r": 372.60364, "b": 101.82299999999998, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Figure 3-5 shows the difference in the special register values when an adopted authority is ", "bbox": {"l": 136.8, "t": 214.48870999999997, "r": 538.4939, "b": 223.70172000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "used:", "bbox": {"l": 136.8, "t": 226.48852999999997, "r": 161.20995, "b": 235.70154000000002, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "GLYPH<SM590000>", "bbox": {"l": 136.8, "t": 243.67749000000003, "r": 141.78, "b": 252.45227, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "A user connects to the server using the user profile ALICE.", "bbox": {"l": 151.20016, "t": 243.52808000000005, "r": 411.36139, "b": 252.74108999999999, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "GLYPH<SM590000>", "bbox": {"l": 136.8, "t": 260.65729, "r": 141.78, "b": 269.43206999999995, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "USER and CURRENT USER initially have the same value of ALICE.", "bbox": {"l": 151.20016, "t": 260.50787, "r": 453.2580899999999, "b": 269.72089000000005, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "GLYPH<SM590000>", "bbox": {"l": 136.8, "t": 277.63707999999997, "r": 141.78, "b": 286.41187, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "ALICE calls an SQL procedure that is named proc1, which is owned by user profile JOE ", "bbox": {"l": 151.20016, "t": 277.48767, "r": 541.44983, "b": 286.70068, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "and was created to adopt JOE\u2019s authority when it is called.", "bbox": {"l": 151.20016, "t": 289.4875200000001, "r": 409.82953, "b": 298.7005, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "GLYPH<SM590000>", "bbox": {"l": 136.8, "t": 306.67647999999997, "r": 141.78, "b": 315.45126000000005, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "While the procedure is running, the special register USER still contains the value of ALICE ", "bbox": {"l": 151.20016, "t": 306.5271, "r": 547.21674, "b": 315.74008, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "because it excludes any adopted authority. The special register CURRENT USER ", "bbox": {"l": 151.20117, "t": 318.52691999999996, "r": 514.32971, "b": 327.7399, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "contains the value of JOE because it includes any adopted authority.", "bbox": {"l": 151.20117, "t": 330.52673, "r": 453.3249200000001, "b": 339.73972, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "GLYPH<SM590000>", "bbox": {"l": 136.80101, "t": 347.65591, "r": 141.78101, "b": 356.43069, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "When proc1 ends, the session reverts to its original state with both USER and CURRENT ", "bbox": {"l": 151.20117, "t": 347.50653, "r": 547.35406, "b": 356.71950999999996, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "USER having the value of ALICE.", "bbox": {"l": 151.20117, "t": 359.50635, "r": 299.57532, "b": 368.71933000000007, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Figure 3-5 Special registers and adopted authority", "bbox": {"l": 136.8, "t": 596.7179, "r": 341.25662, "b": 605.04291, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "3.2.2", "bbox": {"l": 64.800003, "t": 625.55472, "r": 94.20356, "b": 637.54272, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "Built-in global variables", "bbox": {"l": 97.879005, "t": 625.55472, "r": 247.02536, "b": 637.54272, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Built-in global variables are provided with the database manager and are used in SQL ", "bbox": {"l": 136.8, "t": 651.70872, "r": 518.00116, "b": 660.92172, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "statements to retrieve scalar values that are associated with the variables.", "bbox": {"l": 136.8, "t": 663.70853, "r": 462.81759999999997, "b": 672.92153, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "IBM DB2 for i supports nine different built-in global variables that are read only and ", "bbox": {"l": 136.8, "t": 685.7281, "r": 504.44669, "b": 694.941101, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "maintained by the system. These global variables can be used to identify attributes of the ", "bbox": {"l": 136.8, "t": 697.727905, "r": 532.3385, "b": 706.94091, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "database connection and used as part of the RCAC logic.", "bbox": {"l": 136.8, "t": 709.727715, "r": 391.38257, "b": 718.94072, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Special register", "bbox": {"l": 142.8, "t": 110.53801999999985, "r": 209.67091, "b": 118.86298, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Corresponding value", "bbox": {"l": 230.18912000000003, "t": 110.53801999999985, "r": 319.93527, "b": 118.86298, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "USER or", "bbox": {"l": 142.80002, "t": 129.49834999999996, "r": 178.26361, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "SESSION_USER", "bbox": {"l": 142.80002, "t": 140.53864, "r": 212.70122, "b": 148.86359000000004, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "The effective user of the thread excluding adopted authority.", "bbox": {"l": 230.21973000000003, "t": 129.49834999999996, "r": 467.99069000000003, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "CURRENT_USER", "bbox": {"l": 142.80003, "t": 159.55835000000002, "r": 216.63962999999998, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "The effective user of the thread including adopted authority. When no adopted ", "bbox": {"l": 230.19814, "t": 159.55835000000002, "r": 535.65082, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "authority is present, this has the same value as USER.", "bbox": {"l": 230.22061, "t": 170.53832999999997, "r": 447.36533, "b": 178.86328000000003, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "SYSTEM_USER", "bbox": {"l": 142.8009, "t": 189.55804, "r": 209.7357, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "The authorization ID that initiated the connection.", "bbox": {"l": 230.2449, "t": 189.55804, "r": 425.64569, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "SignedonasALICE", "bbox": {"l": 140.7323, "t": 386.98453, "r": 218.71170000000004, "b": 395.49527, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "Signed on as ALICE", "bbox": {"l": 140.7323, "t": 386.98453, "r": 216.40009, "b": 395.49527, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "USER = ALICE", "bbox": {"l": 138.476, "t": 410.87441999999993, "r": 191.70256, "b": 419.38516, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "CURRENT USER = ALICE", "bbox": {"l": 138.476, "t": 422.81934, "r": 232.56117, "b": 431.33008, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "CALL proc1", "bbox": {"l": 138.476, "t": 446.70923000000005, "r": 183.26944, "b": 455.21997, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "P1", "bbox": {"l": 148.4301, "t": 473.58524, "r": 184.17328, "b": 482.09598, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "Proc1:", "bbox": {"l": 148.4301, "t": 473.58524, "r": 174.05859, "b": 482.09598, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Owner = JOE", "bbox": {"l": 157.52185, "t": 485.53015, "r": 209.103, "b": 494.04089, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "SET OPTION USRPRF=*OWNER", "bbox": {"l": 157.52185, "t": 497.47507, "r": 281.68927, "b": 505.98581, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "USER = ALICE", "bbox": {"l": 148.4301, "t": 521.36493, "r": 201.65666, "b": 529.87567, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "CURRENT USER = JOE", "bbox": {"l": 148.4301, "t": 533.30984, "r": 234.57686999999999, "b": 541.82059, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "USER = ALICE", "bbox": {"l": 138.476, "t": 566.15842, "r": 191.70256, "b": 574.66917, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "CURRENT USER = ALICE", "bbox": {"l": 138.476, "t": 578.10333, "r": 232.56117, "b": 586.61409, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 7, "label": "page_footer", "bbox": {"l": 344.94, "t": 755.538002, "r": 523.60162, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9557498693466187, "cells": [{"id": 0, "text": "Chapter 3. Row and Column Access Control ", "bbox": {"l": 344.94, "t": 755.538002, "r": 523.60162, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "page_footer", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.9130511283874512, "cells": [{"id": 1, "text": "19", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "caption", "bbox": {"l": 136.79959, "t": 71.50903000000005, "r": 412.20758, "b": 80.72204999999985, "coord_origin": "TOPLEFT"}, "confidence": 0.7875156402587891, "cells": [{"id": 2, "text": "Table 3-1 summarizes these special registers and their values.", "bbox": {"l": 136.79959, "t": 71.50903000000005, "r": 412.20758, "b": 80.72204999999985, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "caption", "bbox": {"l": 136.8, "t": 93.49805000000003, "r": 372.60364, "b": 101.82299999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.9253708720207214, "cells": [{"id": 3, "text": "Table 3-1 Special registers and their corresponding values", "bbox": {"l": 136.8, "t": 93.49805000000003, "r": 372.60364, "b": 101.82299999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 136.8, "t": 214.48870999999997, "r": 538.4939, "b": 235.70154000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9466660022735596, "cells": [{"id": 4, "text": "Figure 3-5 shows the difference in the special register values when an adopted authority is ", "bbox": {"l": 136.8, "t": 214.48870999999997, "r": 538.4939, "b": 223.70172000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "used:", "bbox": {"l": 136.8, "t": 226.48852999999997, "r": 161.20995, "b": 235.70154000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "list_item", "bbox": {"l": 136.8, "t": 243.52808000000005, "r": 411.36139, "b": 252.74108999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9504424333572388, "cells": [{"id": 6, "text": "GLYPH<SM590000>", "bbox": {"l": 136.8, "t": 243.67749000000003, "r": 141.78, "b": 252.45227, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "A user connects to the server using the user profile ALICE.", "bbox": {"l": 151.20016, "t": 243.52808000000005, "r": 411.36139, "b": 252.74108999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "list_item", "bbox": {"l": 136.8, "t": 260.50787, "r": 453.2580899999999, "b": 269.72089000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9445974230766296, "cells": [{"id": 8, "text": "GLYPH<SM590000>", "bbox": {"l": 136.8, "t": 260.65729, "r": 141.78, "b": 269.43206999999995, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "USER and CURRENT USER initially have the same value of ALICE.", "bbox": {"l": 151.20016, "t": 260.50787, "r": 453.2580899999999, "b": 269.72089000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "list_item", "bbox": {"l": 136.8, "t": 277.48767, "r": 541.44983, "b": 298.7005, "coord_origin": "TOPLEFT"}, "confidence": 0.9742953777313232, "cells": [{"id": 10, "text": "GLYPH<SM590000>", "bbox": {"l": 136.8, "t": 277.63707999999997, "r": 141.78, "b": 286.41187, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "ALICE calls an SQL procedure that is named proc1, which is owned by user profile JOE ", "bbox": {"l": 151.20016, "t": 277.48767, "r": 541.44983, "b": 286.70068, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "and was created to adopt JOE\u2019s authority when it is called.", "bbox": {"l": 151.20016, "t": 289.4875200000001, "r": 409.82953, "b": 298.7005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "list_item", "bbox": {"l": 136.8, "t": 306.5271, "r": 547.21674, "b": 339.73972, "coord_origin": "TOPLEFT"}, "confidence": 0.981132447719574, "cells": [{"id": 13, "text": "GLYPH<SM590000>", "bbox": {"l": 136.8, "t": 306.67647999999997, "r": 141.78, "b": 315.45126000000005, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "While the procedure is running, the special register USER still contains the value of ALICE ", "bbox": {"l": 151.20016, "t": 306.5271, "r": 547.21674, "b": 315.74008, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "because it excludes any adopted authority. The special register CURRENT USER ", "bbox": {"l": 151.20117, "t": 318.52691999999996, "r": 514.32971, "b": 327.7399, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "contains the value of JOE because it includes any adopted authority.", "bbox": {"l": 151.20117, "t": 330.52673, "r": 453.3249200000001, "b": 339.73972, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "list_item", "bbox": {"l": 136.80101, "t": 347.50653, "r": 547.35406, "b": 368.71933000000007, "coord_origin": "TOPLEFT"}, "confidence": 0.9748278260231018, "cells": [{"id": 17, "text": "GLYPH<SM590000>", "bbox": {"l": 136.80101, "t": 347.65591, "r": 141.78101, "b": 356.43069, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "When proc1 ends, the session reverts to its original state with both USER and CURRENT ", "bbox": {"l": 151.20117, "t": 347.50653, "r": 547.35406, "b": 356.71950999999996, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "USER having the value of ALICE.", "bbox": {"l": 151.20117, "t": 359.50635, "r": 299.57532, "b": 368.71933000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "caption", "bbox": {"l": 136.8, "t": 596.7179, "r": 341.25662, "b": 605.04291, "coord_origin": "TOPLEFT"}, "confidence": 0.9274530410766602, "cells": [{"id": 20, "text": "Figure 3-5 Special registers and adopted authority", "bbox": {"l": 136.8, "t": 596.7179, "r": 341.25662, "b": 605.04291, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "section_header", "bbox": {"l": 64.800003, "t": 625.55472, "r": 247.02536, "b": 637.54272, "coord_origin": "TOPLEFT"}, "confidence": 0.9659212827682495, "cells": [{"id": 21, "text": "3.2.2", "bbox": {"l": 64.800003, "t": 625.55472, "r": 94.20356, "b": 637.54272, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "Built-in global variables", "bbox": {"l": 97.879005, "t": 625.55472, "r": 247.02536, "b": 637.54272, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "text", "bbox": {"l": 136.8, "t": 651.70872, "r": 518.00116, "b": 672.92153, "coord_origin": "TOPLEFT"}, "confidence": 0.9696778059005737, "cells": [{"id": 23, "text": "Built-in global variables are provided with the database manager and are used in SQL ", "bbox": {"l": 136.8, "t": 651.70872, "r": 518.00116, "b": 660.92172, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "statements to retrieve scalar values that are associated with the variables.", "bbox": {"l": 136.8, "t": 663.70853, "r": 462.81759999999997, "b": 672.92153, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 136.8, "t": 685.7281, "r": 532.3385, "b": 718.94072, "coord_origin": "TOPLEFT"}, "confidence": 0.978398323059082, "cells": [{"id": 25, "text": "IBM DB2 for i supports nine different built-in global variables that are read only and ", "bbox": {"l": 136.8, "t": 685.7281, "r": 504.44669, "b": 694.941101, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "maintained by the system. These global variables can be used to identify attributes of the ", "bbox": {"l": 136.8, "t": 697.727905, "r": 532.3385, "b": 706.94091, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "database connection and used as part of the RCAC logic.", "bbox": {"l": 136.8, "t": 709.727715, "r": 391.38257, "b": 718.94072, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "table", "bbox": {"l": 134.5462646484375, "t": 103.41889190673828, "r": 542.0460815429688, "b": 204.2716064453125, "coord_origin": "TOPLEFT"}, "confidence": 0.9731299877166748, "cells": [{"id": 28, "text": "Special register", "bbox": {"l": 142.8, "t": 110.53801999999985, "r": 209.67091, "b": 118.86298, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Corresponding value", "bbox": {"l": 230.18912000000003, "t": 110.53801999999985, "r": 319.93527, "b": 118.86298, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "USER or", "bbox": {"l": 142.80002, "t": 129.49834999999996, "r": 178.26361, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "SESSION_USER", "bbox": {"l": 142.80002, "t": 140.53864, "r": 212.70122, "b": 148.86359000000004, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "The effective user of the thread excluding adopted authority.", "bbox": {"l": 230.21973000000003, "t": 129.49834999999996, "r": 467.99069000000003, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "CURRENT_USER", "bbox": {"l": 142.80003, "t": 159.55835000000002, "r": 216.63962999999998, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "The effective user of the thread including adopted authority. When no adopted ", "bbox": {"l": 230.19814, "t": 159.55835000000002, "r": 535.65082, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "authority is present, this has the same value as USER.", "bbox": {"l": 230.22061, "t": 170.53832999999997, "r": 447.36533, "b": 178.86328000000003, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "SYSTEM_USER", "bbox": {"l": 142.8009, "t": 189.55804, "r": 209.7357, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "The authorization ID that initiated the connection.", "bbox": {"l": 230.2449, "t": 189.55804, "r": 425.64569, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}}], "children": [{"id": 26, "label": "text", "bbox": {"l": 142.8, "t": 110.53801999999985, "r": 209.67091, "b": 118.86298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "Special register", "bbox": {"l": 142.8, "t": 110.53801999999985, "r": 209.67091, "b": 118.86298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 230.18912000000003, "t": 110.53801999999985, "r": 319.93527, "b": 118.86298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "Corresponding value", "bbox": {"l": 230.18912000000003, "t": 110.53801999999985, "r": 319.93527, "b": 118.86298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 142.80002, "t": 129.49834999999996, "r": 178.26361, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "USER or", "bbox": {"l": 142.80002, "t": 129.49834999999996, "r": 178.26361, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 142.80002, "t": 140.53864, "r": 212.70122, "b": 148.86359000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "SESSION_USER", "bbox": {"l": 142.80002, "t": 140.53864, "r": 212.70122, "b": 148.86359000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 230.21973000000003, "t": 129.49834999999996, "r": 467.99069000000003, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "The effective user of the thread excluding adopted authority.", "bbox": {"l": 230.21973000000003, "t": 129.49834999999996, "r": 467.99069000000003, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 142.80003, "t": 159.55835000000002, "r": 216.63962999999998, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "CURRENT_USER", "bbox": {"l": 142.80003, "t": 159.55835000000002, "r": 216.63962999999998, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 230.19814, "t": 159.55835000000002, "r": 535.65082, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "The effective user of the thread including adopted authority. When no adopted ", "bbox": {"l": 230.19814, "t": 159.55835000000002, "r": 535.65082, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 230.22061, "t": 170.53832999999997, "r": 447.36533, "b": 178.86328000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "authority is present, this has the same value as USER.", "bbox": {"l": 230.22061, "t": 170.53832999999997, "r": 447.36533, "b": 178.86328000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 142.8009, "t": 189.55804, "r": 209.7357, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "SYSTEM_USER", "bbox": {"l": 142.8009, "t": 189.55804, "r": 209.7357, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 230.2449, "t": 189.55804, "r": 425.64569, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "The authorization ID that initiated the connection.", "bbox": {"l": 230.2449, "t": 189.55804, "r": 425.64569, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 16, "label": "picture", "bbox": {"l": 135.64837646484375, "t": 384.1737060546875, "r": 301.2367248535156, "b": 594.7566528320312, "coord_origin": "TOPLEFT"}, "confidence": 0.7221468687057495, "cells": [{"id": 38, "text": "SignedonasALICE", "bbox": {"l": 140.7323, "t": 386.98453, "r": 218.71170000000004, "b": 395.49527, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "Signed on as ALICE", "bbox": {"l": 140.7323, "t": 386.98453, "r": 216.40009, "b": 395.49527, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "USER = ALICE", "bbox": {"l": 138.476, "t": 410.87441999999993, "r": 191.70256, "b": 419.38516, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "CURRENT USER = ALICE", "bbox": {"l": 138.476, "t": 422.81934, "r": 232.56117, "b": 431.33008, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "CALL proc1", "bbox": {"l": 138.476, "t": 446.70923000000005, "r": 183.26944, "b": 455.21997, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "P1", "bbox": {"l": 148.4301, "t": 473.58524, "r": 184.17328, "b": 482.09598, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "Proc1:", "bbox": {"l": 148.4301, "t": 473.58524, "r": 174.05859, "b": 482.09598, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Owner = JOE", "bbox": {"l": 157.52185, "t": 485.53015, "r": 209.103, "b": 494.04089, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "SET OPTION USRPRF=*OWNER", "bbox": {"l": 157.52185, "t": 497.47507, "r": 281.68927, "b": 505.98581, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "USER = ALICE", "bbox": {"l": 148.4301, "t": 521.36493, "r": 201.65666, "b": 529.87567, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "CURRENT USER = JOE", "bbox": {"l": 148.4301, "t": 533.30984, "r": 234.57686999999999, "b": 541.82059, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "USER = ALICE", "bbox": {"l": 138.476, "t": 566.15842, "r": 191.70256, "b": 574.66917, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "CURRENT USER = ALICE", "bbox": {"l": 138.476, "t": 578.10333, "r": 232.56117, "b": 586.61409, "coord_origin": "TOPLEFT"}}], "children": [{"id": 15, "label": "text", "bbox": {"l": 140.7323, "t": 386.98453, "r": 218.71170000000004, "b": 395.49527, "coord_origin": "TOPLEFT"}, "confidence": 0.7616674304008484, "cells": [{"id": 38, "text": "SignedonasALICE", "bbox": {"l": 140.7323, "t": 386.98453, "r": 218.71170000000004, "b": 395.49527, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "Signed on as ALICE", "bbox": {"l": 140.7323, "t": 386.98453, "r": 216.40009, "b": 395.49527, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 138.476, "t": 410.87441999999993, "r": 191.70256, "b": 419.38516, "coord_origin": "TOPLEFT"}, "confidence": 0.5373895764350891, "cells": [{"id": 40, "text": "USER = ALICE", "bbox": {"l": 138.476, "t": 410.87441999999993, "r": 191.70256, "b": 419.38516, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 138.476, "t": 422.81934, "r": 232.56117, "b": 431.33008, "coord_origin": "TOPLEFT"}, "confidence": 0.5213791728019714, "cells": [{"id": 41, "text": "CURRENT USER = ALICE", "bbox": {"l": 138.476, "t": 422.81934, "r": 232.56117, "b": 431.33008, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 138.476, "t": 446.70923000000005, "r": 183.26944, "b": 455.21997, "coord_origin": "TOPLEFT"}, "confidence": 0.6404178142547607, "cells": [{"id": 42, "text": "CALL proc1", "bbox": {"l": 138.476, "t": 446.70923000000005, "r": 183.26944, "b": 455.21997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 148.4301, "t": 473.58524, "r": 184.17328, "b": 482.09598, "coord_origin": "TOPLEFT"}, "confidence": 0.5759297609329224, "cells": [{"id": 43, "text": "P1", "bbox": {"l": 148.4301, "t": 473.58524, "r": 184.17328, "b": 482.09598, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "Proc1:", "bbox": {"l": 148.4301, "t": 473.58524, "r": 174.05859, "b": 482.09598, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 157.52185, "t": 485.53015, "r": 209.103, "b": 494.04089, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "Owner = JOE", "bbox": {"l": 157.52185, "t": 485.53015, "r": 209.103, "b": 494.04089, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 157.52185, "t": 497.47507, "r": 281.68927, "b": 505.98581, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "SET OPTION USRPRF=*OWNER", "bbox": {"l": 157.52185, "t": 497.47507, "r": 281.68927, "b": 505.98581, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 148.4301, "t": 521.36493, "r": 201.65666, "b": 529.87567, "coord_origin": "TOPLEFT"}, "confidence": 0.5350866913795471, "cells": [{"id": 47, "text": "USER = ALICE", "bbox": {"l": 148.4301, "t": 521.36493, "r": 201.65666, "b": 529.87567, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 148.4301, "t": 533.30984, "r": 234.57686999999999, "b": 541.82059, "coord_origin": "TOPLEFT"}, "confidence": 0.5008324384689331, "cells": [{"id": 48, "text": "CURRENT USER = JOE", "bbox": {"l": 148.4301, "t": 533.30984, "r": 234.57686999999999, "b": 541.82059, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 138.476, "t": 566.15842, "r": 232.56117, "b": 586.61409, "coord_origin": "TOPLEFT"}, "confidence": 0.5024971961975098, "cells": [{"id": 49, "text": "USER = ALICE", "bbox": {"l": 138.476, "t": 566.15842, "r": 191.70256, "b": 574.66917, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "CURRENT USER = ALICE", "bbox": {"l": 138.476, "t": 578.10333, "r": 232.56117, "b": 586.61409, "coord_origin": "TOPLEFT"}}], "children": []}]}]}, "tablestructure": {"table_map": {"4": {"label": "table", "id": 4, "page_no": 10, "cluster": {"id": 4, "label": "table", "bbox": {"l": 134.5462646484375, "t": 103.41889190673828, "r": 542.0460815429688, "b": 204.2716064453125, "coord_origin": "TOPLEFT"}, "confidence": 0.9731299877166748, "cells": [{"id": 28, "text": "Special register", "bbox": {"l": 142.8, "t": 110.53801999999985, "r": 209.67091, "b": 118.86298, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Corresponding value", "bbox": {"l": 230.18912000000003, "t": 110.53801999999985, "r": 319.93527, "b": 118.86298, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "USER or", "bbox": {"l": 142.80002, "t": 129.49834999999996, "r": 178.26361, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "SESSION_USER", "bbox": {"l": 142.80002, "t": 140.53864, "r": 212.70122, "b": 148.86359000000004, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "The effective user of the thread excluding adopted authority.", "bbox": {"l": 230.21973000000003, "t": 129.49834999999996, "r": 467.99069000000003, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "CURRENT_USER", "bbox": {"l": 142.80003, "t": 159.55835000000002, "r": 216.63962999999998, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "The effective user of the thread including adopted authority. When no adopted ", "bbox": {"l": 230.19814, "t": 159.55835000000002, "r": 535.65082, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "authority is present, this has the same value as USER.", "bbox": {"l": 230.22061, "t": 170.53832999999997, "r": 447.36533, "b": 178.86328000000003, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "SYSTEM_USER", "bbox": {"l": 142.8009, "t": 189.55804, "r": 209.7357, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "The authorization ID that initiated the connection.", "bbox": {"l": 230.2449, "t": 189.55804, "r": 425.64569, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}}], "children": [{"id": 26, "label": "text", "bbox": {"l": 142.8, "t": 110.53801999999985, "r": 209.67091, "b": 118.86298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "Special register", "bbox": {"l": 142.8, "t": 110.53801999999985, "r": 209.67091, "b": 118.86298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 230.18912000000003, "t": 110.53801999999985, "r": 319.93527, "b": 118.86298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "Corresponding value", "bbox": {"l": 230.18912000000003, "t": 110.53801999999985, "r": 319.93527, "b": 118.86298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 142.80002, "t": 129.49834999999996, "r": 178.26361, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "USER or", "bbox": {"l": 142.80002, "t": 129.49834999999996, "r": 178.26361, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 142.80002, "t": 140.53864, "r": 212.70122, "b": 148.86359000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "SESSION_USER", "bbox": {"l": 142.80002, "t": 140.53864, "r": 212.70122, "b": 148.86359000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 230.21973000000003, "t": 129.49834999999996, "r": 467.99069000000003, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "The effective user of the thread excluding adopted authority.", "bbox": {"l": 230.21973000000003, "t": 129.49834999999996, "r": 467.99069000000003, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 142.80003, "t": 159.55835000000002, "r": 216.63962999999998, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "CURRENT_USER", "bbox": {"l": 142.80003, "t": 159.55835000000002, "r": 216.63962999999998, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 230.19814, "t": 159.55835000000002, "r": 535.65082, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "The effective user of the thread including adopted authority. When no adopted ", "bbox": {"l": 230.19814, "t": 159.55835000000002, "r": 535.65082, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 230.22061, "t": 170.53832999999997, "r": 447.36533, "b": 178.86328000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "authority is present, this has the same value as USER.", "bbox": {"l": 230.22061, "t": 170.53832999999997, "r": 447.36533, "b": 178.86328000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 142.8009, "t": 189.55804, "r": 209.7357, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "SYSTEM_USER", "bbox": {"l": 142.8009, "t": 189.55804, "r": 209.7357, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 230.2449, "t": 189.55804, "r": 425.64569, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "The authorization ID that initiated the connection.", "bbox": {"l": 230.2449, "t": 189.55804, "r": 425.64569, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 4, "num_cols": 2, "table_cells": [{"bbox": {"l": 142.8, "t": 110.53801999999985, "r": 209.67091, "b": 118.86298, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Special register", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 230.18912000000003, "t": 110.53801999999985, "r": 319.93527, "b": 118.86298, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Corresponding value", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 142.80002, "t": 129.49834999999996, "r": 212.70122, "b": 148.86359000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "USER or SESSION_USER", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 230.21973000000003, "t": 129.49834999999996, "r": 467.99069000000003, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "The effective user of the thread excluding adopted authority.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 142.80003, "t": 159.55835000000002, "r": 216.63962999999998, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "CURRENT_USER", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 230.19814, "t": 159.55835000000002, "r": 535.65082, "b": 178.86328000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "The effective user of the thread including adopted authority. When no adopted  authority is present, this has the same value as USER.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 142.8009, "t": 189.55804, "r": 209.7357, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "SYSTEM_USER", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 230.2449, "t": 189.55804, "r": 425.64569, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "The authorization ID that initiated the connection.", "column_header": false, "row_header": false, "row_section": false}]}}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_footer", "id": 7, "page_no": 10, "cluster": {"id": 7, "label": "page_footer", "bbox": {"l": 344.94, "t": 755.538002, "r": 523.60162, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9557498693466187, "cells": [{"id": 0, "text": "Chapter 3. Row and Column Access Control ", "bbox": {"l": 344.94, "t": 755.538002, "r": 523.60162, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Chapter 3. Row and Column Access Control"}, {"label": "page_footer", "id": 13, "page_no": 10, "cluster": {"id": 13, "label": "page_footer", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.9130511283874512, "cells": [{"id": 1, "text": "19", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "19"}, {"label": "caption", "id": 14, "page_no": 10, "cluster": {"id": 14, "label": "caption", "bbox": {"l": 136.79959, "t": 71.50903000000005, "r": 412.20758, "b": 80.72204999999985, "coord_origin": "TOPLEFT"}, "confidence": 0.7875156402587891, "cells": [{"id": 2, "text": "Table 3-1 summarizes these special registers and their values.", "bbox": {"l": 136.79959, "t": 71.50903000000005, "r": 412.20758, "b": 80.72204999999985, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 3-1 summarizes these special registers and their values."}, {"label": "caption", "id": 12, "page_no": 10, "cluster": {"id": 12, "label": "caption", "bbox": {"l": 136.8, "t": 93.49805000000003, "r": 372.60364, "b": 101.82299999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.9253708720207214, "cells": [{"id": 3, "text": "Table 3-1 Special registers and their corresponding values", "bbox": {"l": 136.8, "t": 93.49805000000003, "r": 372.60364, "b": 101.82299999999998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 3-1 Special registers and their corresponding values"}, {"label": "text", "id": 9, "page_no": 10, "cluster": {"id": 9, "label": "text", "bbox": {"l": 136.8, "t": 214.48870999999997, "r": 538.4939, "b": 235.70154000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9466660022735596, "cells": [{"id": 4, "text": "Figure 3-5 shows the difference in the special register values when an adopted authority is ", "bbox": {"l": 136.8, "t": 214.48870999999997, "r": 538.4939, "b": 223.70172000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "used:", "bbox": {"l": 136.8, "t": 226.48852999999997, "r": 161.20995, "b": 235.70154000000002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 3-5 shows the difference in the special register values when an adopted authority is used:"}, {"label": "list_item", "id": 8, "page_no": 10, "cluster": {"id": 8, "label": "list_item", "bbox": {"l": 136.8, "t": 243.52808000000005, "r": 411.36139, "b": 252.74108999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9504424333572388, "cells": [{"id": 6, "text": "GLYPH<SM590000>", "bbox": {"l": 136.8, "t": 243.67749000000003, "r": 141.78, "b": 252.45227, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "A user connects to the server using the user profile ALICE.", "bbox": {"l": 151.20016, "t": 243.52808000000005, "r": 411.36139, "b": 252.74108999999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<SM590000> A user connects to the server using the user profile ALICE."}, {"label": "list_item", "id": 10, "page_no": 10, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 136.8, "t": 260.50787, "r": 453.2580899999999, "b": 269.72089000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9445974230766296, "cells": [{"id": 8, "text": "GLYPH<SM590000>", "bbox": {"l": 136.8, "t": 260.65729, "r": 141.78, "b": 269.43206999999995, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "USER and CURRENT USER initially have the same value of ALICE.", "bbox": {"l": 151.20016, "t": 260.50787, "r": 453.2580899999999, "b": 269.72089000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<SM590000> USER and CURRENT USER initially have the same value of ALICE."}, {"label": "list_item", "id": 3, "page_no": 10, "cluster": {"id": 3, "label": "list_item", "bbox": {"l": 136.8, "t": 277.48767, "r": 541.44983, "b": 298.7005, "coord_origin": "TOPLEFT"}, "confidence": 0.9742953777313232, "cells": [{"id": 10, "text": "GLYPH<SM590000>", "bbox": {"l": 136.8, "t": 277.63707999999997, "r": 141.78, "b": 286.41187, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "ALICE calls an SQL procedure that is named proc1, which is owned by user profile JOE ", "bbox": {"l": 151.20016, "t": 277.48767, "r": 541.44983, "b": 286.70068, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "and was created to adopt JOE\u2019s authority when it is called.", "bbox": {"l": 151.20016, "t": 289.4875200000001, "r": 409.82953, "b": 298.7005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<SM590000> ALICE calls an SQL procedure that is named proc1, which is owned by user profile JOE and was created to adopt JOE's authority when it is called."}, {"label": "list_item", "id": 0, "page_no": 10, "cluster": {"id": 0, "label": "list_item", "bbox": {"l": 136.8, "t": 306.5271, "r": 547.21674, "b": 339.73972, "coord_origin": "TOPLEFT"}, "confidence": 0.981132447719574, "cells": [{"id": 13, "text": "GLYPH<SM590000>", "bbox": {"l": 136.8, "t": 306.67647999999997, "r": 141.78, "b": 315.45126000000005, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "While the procedure is running, the special register USER still contains the value of ALICE ", "bbox": {"l": 151.20016, "t": 306.5271, "r": 547.21674, "b": 315.74008, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "because it excludes any adopted authority. The special register CURRENT USER ", "bbox": {"l": 151.20117, "t": 318.52691999999996, "r": 514.32971, "b": 327.7399, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "contains the value of JOE because it includes any adopted authority.", "bbox": {"l": 151.20117, "t": 330.52673, "r": 453.3249200000001, "b": 339.73972, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<SM590000> While the procedure is running, the special register USER still contains the value of ALICE because it excludes any adopted authority. The special register CURRENT USER contains the value of JOE because it includes any adopted authority."}, {"label": "list_item", "id": 2, "page_no": 10, "cluster": {"id": 2, "label": "list_item", "bbox": {"l": 136.80101, "t": 347.50653, "r": 547.35406, "b": 368.71933000000007, "coord_origin": "TOPLEFT"}, "confidence": 0.9748278260231018, "cells": [{"id": 17, "text": "GLYPH<SM590000>", "bbox": {"l": 136.80101, "t": 347.65591, "r": 141.78101, "b": 356.43069, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "When proc1 ends, the session reverts to its original state with both USER and CURRENT ", "bbox": {"l": 151.20117, "t": 347.50653, "r": 547.35406, "b": 356.71950999999996, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "USER having the value of ALICE.", "bbox": {"l": 151.20117, "t": 359.50635, "r": 299.57532, "b": 368.71933000000007, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<SM590000> When proc1 ends, the session reverts to its original state with both USER and CURRENT USER having the value of ALICE."}, {"label": "caption", "id": 11, "page_no": 10, "cluster": {"id": 11, "label": "caption", "bbox": {"l": 136.8, "t": 596.7179, "r": 341.25662, "b": 605.04291, "coord_origin": "TOPLEFT"}, "confidence": 0.9274530410766602, "cells": [{"id": 20, "text": "Figure 3-5 Special registers and adopted authority", "bbox": {"l": 136.8, "t": 596.7179, "r": 341.25662, "b": 605.04291, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 3-5 Special registers and adopted authority"}, {"label": "section_header", "id": 6, "page_no": 10, "cluster": {"id": 6, "label": "section_header", "bbox": {"l": 64.800003, "t": 625.55472, "r": 247.02536, "b": 637.54272, "coord_origin": "TOPLEFT"}, "confidence": 0.9659212827682495, "cells": [{"id": 21, "text": "3.2.2", "bbox": {"l": 64.800003, "t": 625.55472, "r": 94.20356, "b": 637.54272, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "Built-in global variables", "bbox": {"l": 97.879005, "t": 625.55472, "r": 247.02536, "b": 637.54272, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3.2.2 Built-in global variables"}, {"label": "text", "id": 5, "page_no": 10, "cluster": {"id": 5, "label": "text", "bbox": {"l": 136.8, "t": 651.70872, "r": 518.00116, "b": 672.92153, "coord_origin": "TOPLEFT"}, "confidence": 0.9696778059005737, "cells": [{"id": 23, "text": "Built-in global variables are provided with the database manager and are used in SQL ", "bbox": {"l": 136.8, "t": 651.70872, "r": 518.00116, "b": 660.92172, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "statements to retrieve scalar values that are associated with the variables.", "bbox": {"l": 136.8, "t": 663.70853, "r": 462.81759999999997, "b": 672.92153, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Built-in global variables are provided with the database manager and are used in SQL statements to retrieve scalar values that are associated with the variables."}, {"label": "text", "id": 1, "page_no": 10, "cluster": {"id": 1, "label": "text", "bbox": {"l": 136.8, "t": 685.7281, "r": 532.3385, "b": 718.94072, "coord_origin": "TOPLEFT"}, "confidence": 0.978398323059082, "cells": [{"id": 25, "text": "IBM DB2 for i supports nine different built-in global variables that are read only and ", "bbox": {"l": 136.8, "t": 685.7281, "r": 504.44669, "b": 694.941101, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "maintained by the system. These global variables can be used to identify attributes of the ", "bbox": {"l": 136.8, "t": 697.727905, "r": 532.3385, "b": 706.94091, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "database connection and used as part of the RCAC logic.", "bbox": {"l": 136.8, "t": 709.727715, "r": 391.38257, "b": 718.94072, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "IBM DB2 for i supports nine different built-in global variables that are read only and maintained by the system. These global variables can be used to identify attributes of the database connection and used as part of the RCAC logic."}, {"label": "table", "id": 4, "page_no": 10, "cluster": {"id": 4, "label": "table", "bbox": {"l": 134.5462646484375, "t": 103.41889190673828, "r": 542.0460815429688, "b": 204.2716064453125, "coord_origin": "TOPLEFT"}, "confidence": 0.9731299877166748, "cells": [{"id": 28, "text": "Special register", "bbox": {"l": 142.8, "t": 110.53801999999985, "r": 209.67091, "b": 118.86298, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Corresponding value", "bbox": {"l": 230.18912000000003, "t": 110.53801999999985, "r": 319.93527, "b": 118.86298, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "USER or", "bbox": {"l": 142.80002, "t": 129.49834999999996, "r": 178.26361, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "SESSION_USER", "bbox": {"l": 142.80002, "t": 140.53864, "r": 212.70122, "b": 148.86359000000004, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "The effective user of the thread excluding adopted authority.", "bbox": {"l": 230.21973000000003, "t": 129.49834999999996, "r": 467.99069000000003, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "CURRENT_USER", "bbox": {"l": 142.80003, "t": 159.55835000000002, "r": 216.63962999999998, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "The effective user of the thread including adopted authority. When no adopted ", "bbox": {"l": 230.19814, "t": 159.55835000000002, "r": 535.65082, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "authority is present, this has the same value as USER.", "bbox": {"l": 230.22061, "t": 170.53832999999997, "r": 447.36533, "b": 178.86328000000003, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "SYSTEM_USER", "bbox": {"l": 142.8009, "t": 189.55804, "r": 209.7357, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "The authorization ID that initiated the connection.", "bbox": {"l": 230.2449, "t": 189.55804, "r": 425.64569, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}}], "children": [{"id": 26, "label": "text", "bbox": {"l": 142.8, "t": 110.53801999999985, "r": 209.67091, "b": 118.86298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "Special register", "bbox": {"l": 142.8, "t": 110.53801999999985, "r": 209.67091, "b": 118.86298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 230.18912000000003, "t": 110.53801999999985, "r": 319.93527, "b": 118.86298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "Corresponding value", "bbox": {"l": 230.18912000000003, "t": 110.53801999999985, "r": 319.93527, "b": 118.86298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 142.80002, "t": 129.49834999999996, "r": 178.26361, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "USER or", "bbox": {"l": 142.80002, "t": 129.49834999999996, "r": 178.26361, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 142.80002, "t": 140.53864, "r": 212.70122, "b": 148.86359000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "SESSION_USER", "bbox": {"l": 142.80002, "t": 140.53864, "r": 212.70122, "b": 148.86359000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 230.21973000000003, "t": 129.49834999999996, "r": 467.99069000000003, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "The effective user of the thread excluding adopted authority.", "bbox": {"l": 230.21973000000003, "t": 129.49834999999996, "r": 467.99069000000003, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 142.80003, "t": 159.55835000000002, "r": 216.63962999999998, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "CURRENT_USER", "bbox": {"l": 142.80003, "t": 159.55835000000002, "r": 216.63962999999998, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 230.19814, "t": 159.55835000000002, "r": 535.65082, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "The effective user of the thread including adopted authority. When no adopted ", "bbox": {"l": 230.19814, "t": 159.55835000000002, "r": 535.65082, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 230.22061, "t": 170.53832999999997, "r": 447.36533, "b": 178.86328000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "authority is present, this has the same value as USER.", "bbox": {"l": 230.22061, "t": 170.53832999999997, "r": 447.36533, "b": 178.86328000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 142.8009, "t": 189.55804, "r": 209.7357, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "SYSTEM_USER", "bbox": {"l": 142.8009, "t": 189.55804, "r": 209.7357, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 230.2449, "t": 189.55804, "r": 425.64569, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "The authorization ID that initiated the connection.", "bbox": {"l": 230.2449, "t": 189.55804, "r": 425.64569, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 4, "num_cols": 2, "table_cells": [{"bbox": {"l": 142.8, "t": 110.53801999999985, "r": 209.67091, "b": 118.86298, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Special register", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 230.18912000000003, "t": 110.53801999999985, "r": 319.93527, "b": 118.86298, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Corresponding value", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 142.80002, "t": 129.49834999999996, "r": 212.70122, "b": 148.86359000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "USER or SESSION_USER", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 230.21973000000003, "t": 129.49834999999996, "r": 467.99069000000003, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "The effective user of the thread excluding adopted authority.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 142.80003, "t": 159.55835000000002, "r": 216.63962999999998, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "CURRENT_USER", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 230.19814, "t": 159.55835000000002, "r": 535.65082, "b": 178.86328000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "The effective user of the thread including adopted authority. When no adopted  authority is present, this has the same value as USER.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 142.8009, "t": 189.55804, "r": 209.7357, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "SYSTEM_USER", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 230.2449, "t": 189.55804, "r": 425.64569, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "The authorization ID that initiated the connection.", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "picture", "id": 16, "page_no": 10, "cluster": {"id": 16, "label": "picture", "bbox": {"l": 135.64837646484375, "t": 384.1737060546875, "r": 301.2367248535156, "b": 594.7566528320312, "coord_origin": "TOPLEFT"}, "confidence": 0.7221468687057495, "cells": [{"id": 38, "text": "SignedonasALICE", "bbox": {"l": 140.7323, "t": 386.98453, "r": 218.71170000000004, "b": 395.49527, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "Signed on as ALICE", "bbox": {"l": 140.7323, "t": 386.98453, "r": 216.40009, "b": 395.49527, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "USER = ALICE", "bbox": {"l": 138.476, "t": 410.87441999999993, "r": 191.70256, "b": 419.38516, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "CURRENT USER = ALICE", "bbox": {"l": 138.476, "t": 422.81934, "r": 232.56117, "b": 431.33008, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "CALL proc1", "bbox": {"l": 138.476, "t": 446.70923000000005, "r": 183.26944, "b": 455.21997, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "P1", "bbox": {"l": 148.4301, "t": 473.58524, "r": 184.17328, "b": 482.09598, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "Proc1:", "bbox": {"l": 148.4301, "t": 473.58524, "r": 174.05859, "b": 482.09598, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Owner = JOE", "bbox": {"l": 157.52185, "t": 485.53015, "r": 209.103, "b": 494.04089, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "SET OPTION USRPRF=*OWNER", "bbox": {"l": 157.52185, "t": 497.47507, "r": 281.68927, "b": 505.98581, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "USER = ALICE", "bbox": {"l": 148.4301, "t": 521.36493, "r": 201.65666, "b": 529.87567, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "CURRENT USER = JOE", "bbox": {"l": 148.4301, "t": 533.30984, "r": 234.57686999999999, "b": 541.82059, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "USER = ALICE", "bbox": {"l": 138.476, "t": 566.15842, "r": 191.70256, "b": 574.66917, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "CURRENT USER = ALICE", "bbox": {"l": 138.476, "t": 578.10333, "r": 232.56117, "b": 586.61409, "coord_origin": "TOPLEFT"}}], "children": [{"id": 15, "label": "text", "bbox": {"l": 140.7323, "t": 386.98453, "r": 218.71170000000004, "b": 395.49527, "coord_origin": "TOPLEFT"}, "confidence": 0.7616674304008484, "cells": [{"id": 38, "text": "SignedonasALICE", "bbox": {"l": 140.7323, "t": 386.98453, "r": 218.71170000000004, "b": 395.49527, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "Signed on as ALICE", "bbox": {"l": 140.7323, "t": 386.98453, "r": 216.40009, "b": 395.49527, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 138.476, "t": 410.87441999999993, "r": 191.70256, "b": 419.38516, "coord_origin": "TOPLEFT"}, "confidence": 0.5373895764350891, "cells": [{"id": 40, "text": "USER = ALICE", "bbox": {"l": 138.476, "t": 410.87441999999993, "r": 191.70256, "b": 419.38516, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 138.476, "t": 422.81934, "r": 232.56117, "b": 431.33008, "coord_origin": "TOPLEFT"}, "confidence": 0.5213791728019714, "cells": [{"id": 41, "text": "CURRENT USER = ALICE", "bbox": {"l": 138.476, "t": 422.81934, "r": 232.56117, "b": 431.33008, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 138.476, "t": 446.70923000000005, "r": 183.26944, "b": 455.21997, "coord_origin": "TOPLEFT"}, "confidence": 0.6404178142547607, "cells": [{"id": 42, "text": "CALL proc1", "bbox": {"l": 138.476, "t": 446.70923000000005, "r": 183.26944, "b": 455.21997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 148.4301, "t": 473.58524, "r": 184.17328, "b": 482.09598, "coord_origin": "TOPLEFT"}, "confidence": 0.5759297609329224, "cells": [{"id": 43, "text": "P1", "bbox": {"l": 148.4301, "t": 473.58524, "r": 184.17328, "b": 482.09598, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "Proc1:", "bbox": {"l": 148.4301, "t": 473.58524, "r": 174.05859, "b": 482.09598, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 157.52185, "t": 485.53015, "r": 209.103, "b": 494.04089, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "Owner = JOE", "bbox": {"l": 157.52185, "t": 485.53015, "r": 209.103, "b": 494.04089, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 157.52185, "t": 497.47507, "r": 281.68927, "b": 505.98581, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "SET OPTION USRPRF=*OWNER", "bbox": {"l": 157.52185, "t": 497.47507, "r": 281.68927, "b": 505.98581, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 148.4301, "t": 521.36493, "r": 201.65666, "b": 529.87567, "coord_origin": "TOPLEFT"}, "confidence": 0.5350866913795471, "cells": [{"id": 47, "text": "USER = ALICE", "bbox": {"l": 148.4301, "t": 521.36493, "r": 201.65666, "b": 529.87567, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 148.4301, "t": 533.30984, "r": 234.57686999999999, "b": 541.82059, "coord_origin": "TOPLEFT"}, "confidence": 0.5008324384689331, "cells": [{"id": 48, "text": "CURRENT USER = JOE", "bbox": {"l": 148.4301, "t": 533.30984, "r": 234.57686999999999, "b": 541.82059, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 138.476, "t": 566.15842, "r": 232.56117, "b": 586.61409, "coord_origin": "TOPLEFT"}, "confidence": 0.5024971961975098, "cells": [{"id": 49, "text": "USER = ALICE", "bbox": {"l": 138.476, "t": 566.15842, "r": 191.70256, "b": 574.66917, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "CURRENT USER = ALICE", "bbox": {"l": 138.476, "t": 578.10333, "r": 232.56117, "b": 586.61409, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "body": [{"label": "caption", "id": 14, "page_no": 10, "cluster": {"id": 14, "label": "caption", "bbox": {"l": 136.79959, "t": 71.50903000000005, "r": 412.20758, "b": 80.72204999999985, "coord_origin": "TOPLEFT"}, "confidence": 0.7875156402587891, "cells": [{"id": 2, "text": "Table 3-1 summarizes these special registers and their values.", "bbox": {"l": 136.79959, "t": 71.50903000000005, "r": 412.20758, "b": 80.72204999999985, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 3-1 summarizes these special registers and their values."}, {"label": "caption", "id": 12, "page_no": 10, "cluster": {"id": 12, "label": "caption", "bbox": {"l": 136.8, "t": 93.49805000000003, "r": 372.60364, "b": 101.82299999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.9253708720207214, "cells": [{"id": 3, "text": "Table 3-1 Special registers and their corresponding values", "bbox": {"l": 136.8, "t": 93.49805000000003, "r": 372.60364, "b": 101.82299999999998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 3-1 Special registers and their corresponding values"}, {"label": "text", "id": 9, "page_no": 10, "cluster": {"id": 9, "label": "text", "bbox": {"l": 136.8, "t": 214.48870999999997, "r": 538.4939, "b": 235.70154000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9466660022735596, "cells": [{"id": 4, "text": "Figure 3-5 shows the difference in the special register values when an adopted authority is ", "bbox": {"l": 136.8, "t": 214.48870999999997, "r": 538.4939, "b": 223.70172000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "used:", "bbox": {"l": 136.8, "t": 226.48852999999997, "r": 161.20995, "b": 235.70154000000002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 3-5 shows the difference in the special register values when an adopted authority is used:"}, {"label": "list_item", "id": 8, "page_no": 10, "cluster": {"id": 8, "label": "list_item", "bbox": {"l": 136.8, "t": 243.52808000000005, "r": 411.36139, "b": 252.74108999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9504424333572388, "cells": [{"id": 6, "text": "GLYPH<SM590000>", "bbox": {"l": 136.8, "t": 243.67749000000003, "r": 141.78, "b": 252.45227, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "A user connects to the server using the user profile ALICE.", "bbox": {"l": 151.20016, "t": 243.52808000000005, "r": 411.36139, "b": 252.74108999999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<SM590000> A user connects to the server using the user profile ALICE."}, {"label": "list_item", "id": 10, "page_no": 10, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 136.8, "t": 260.50787, "r": 453.2580899999999, "b": 269.72089000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9445974230766296, "cells": [{"id": 8, "text": "GLYPH<SM590000>", "bbox": {"l": 136.8, "t": 260.65729, "r": 141.78, "b": 269.43206999999995, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "USER and CURRENT USER initially have the same value of ALICE.", "bbox": {"l": 151.20016, "t": 260.50787, "r": 453.2580899999999, "b": 269.72089000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<SM590000> USER and CURRENT USER initially have the same value of ALICE."}, {"label": "list_item", "id": 3, "page_no": 10, "cluster": {"id": 3, "label": "list_item", "bbox": {"l": 136.8, "t": 277.48767, "r": 541.44983, "b": 298.7005, "coord_origin": "TOPLEFT"}, "confidence": 0.9742953777313232, "cells": [{"id": 10, "text": "GLYPH<SM590000>", "bbox": {"l": 136.8, "t": 277.63707999999997, "r": 141.78, "b": 286.41187, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "ALICE calls an SQL procedure that is named proc1, which is owned by user profile JOE ", "bbox": {"l": 151.20016, "t": 277.48767, "r": 541.44983, "b": 286.70068, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "and was created to adopt JOE\u2019s authority when it is called.", "bbox": {"l": 151.20016, "t": 289.4875200000001, "r": 409.82953, "b": 298.7005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<SM590000> ALICE calls an SQL procedure that is named proc1, which is owned by user profile JOE and was created to adopt JOE's authority when it is called."}, {"label": "list_item", "id": 0, "page_no": 10, "cluster": {"id": 0, "label": "list_item", "bbox": {"l": 136.8, "t": 306.5271, "r": 547.21674, "b": 339.73972, "coord_origin": "TOPLEFT"}, "confidence": 0.981132447719574, "cells": [{"id": 13, "text": "GLYPH<SM590000>", "bbox": {"l": 136.8, "t": 306.67647999999997, "r": 141.78, "b": 315.45126000000005, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "While the procedure is running, the special register USER still contains the value of ALICE ", "bbox": {"l": 151.20016, "t": 306.5271, "r": 547.21674, "b": 315.74008, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "because it excludes any adopted authority. The special register CURRENT USER ", "bbox": {"l": 151.20117, "t": 318.52691999999996, "r": 514.32971, "b": 327.7399, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "contains the value of JOE because it includes any adopted authority.", "bbox": {"l": 151.20117, "t": 330.52673, "r": 453.3249200000001, "b": 339.73972, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<SM590000> While the procedure is running, the special register USER still contains the value of ALICE because it excludes any adopted authority. The special register CURRENT USER contains the value of JOE because it includes any adopted authority."}, {"label": "list_item", "id": 2, "page_no": 10, "cluster": {"id": 2, "label": "list_item", "bbox": {"l": 136.80101, "t": 347.50653, "r": 547.35406, "b": 368.71933000000007, "coord_origin": "TOPLEFT"}, "confidence": 0.9748278260231018, "cells": [{"id": 17, "text": "GLYPH<SM590000>", "bbox": {"l": 136.80101, "t": 347.65591, "r": 141.78101, "b": 356.43069, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "When proc1 ends, the session reverts to its original state with both USER and CURRENT ", "bbox": {"l": 151.20117, "t": 347.50653, "r": 547.35406, "b": 356.71950999999996, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "USER having the value of ALICE.", "bbox": {"l": 151.20117, "t": 359.50635, "r": 299.57532, "b": 368.71933000000007, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<SM590000> When proc1 ends, the session reverts to its original state with both USER and CURRENT USER having the value of ALICE."}, {"label": "caption", "id": 11, "page_no": 10, "cluster": {"id": 11, "label": "caption", "bbox": {"l": 136.8, "t": 596.7179, "r": 341.25662, "b": 605.04291, "coord_origin": "TOPLEFT"}, "confidence": 0.9274530410766602, "cells": [{"id": 20, "text": "Figure 3-5 Special registers and adopted authority", "bbox": {"l": 136.8, "t": 596.7179, "r": 341.25662, "b": 605.04291, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 3-5 Special registers and adopted authority"}, {"label": "section_header", "id": 6, "page_no": 10, "cluster": {"id": 6, "label": "section_header", "bbox": {"l": 64.800003, "t": 625.55472, "r": 247.02536, "b": 637.54272, "coord_origin": "TOPLEFT"}, "confidence": 0.9659212827682495, "cells": [{"id": 21, "text": "3.2.2", "bbox": {"l": 64.800003, "t": 625.55472, "r": 94.20356, "b": 637.54272, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "Built-in global variables", "bbox": {"l": 97.879005, "t": 625.55472, "r": 247.02536, "b": 637.54272, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3.2.2 Built-in global variables"}, {"label": "text", "id": 5, "page_no": 10, "cluster": {"id": 5, "label": "text", "bbox": {"l": 136.8, "t": 651.70872, "r": 518.00116, "b": 672.92153, "coord_origin": "TOPLEFT"}, "confidence": 0.9696778059005737, "cells": [{"id": 23, "text": "Built-in global variables are provided with the database manager and are used in SQL ", "bbox": {"l": 136.8, "t": 651.70872, "r": 518.00116, "b": 660.92172, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "statements to retrieve scalar values that are associated with the variables.", "bbox": {"l": 136.8, "t": 663.70853, "r": 462.81759999999997, "b": 672.92153, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Built-in global variables are provided with the database manager and are used in SQL statements to retrieve scalar values that are associated with the variables."}, {"label": "text", "id": 1, "page_no": 10, "cluster": {"id": 1, "label": "text", "bbox": {"l": 136.8, "t": 685.7281, "r": 532.3385, "b": 718.94072, "coord_origin": "TOPLEFT"}, "confidence": 0.978398323059082, "cells": [{"id": 25, "text": "IBM DB2 for i supports nine different built-in global variables that are read only and ", "bbox": {"l": 136.8, "t": 685.7281, "r": 504.44669, "b": 694.941101, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "maintained by the system. These global variables can be used to identify attributes of the ", "bbox": {"l": 136.8, "t": 697.727905, "r": 532.3385, "b": 706.94091, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "database connection and used as part of the RCAC logic.", "bbox": {"l": 136.8, "t": 709.727715, "r": 391.38257, "b": 718.94072, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "IBM DB2 for i supports nine different built-in global variables that are read only and maintained by the system. These global variables can be used to identify attributes of the database connection and used as part of the RCAC logic."}, {"label": "table", "id": 4, "page_no": 10, "cluster": {"id": 4, "label": "table", "bbox": {"l": 134.5462646484375, "t": 103.41889190673828, "r": 542.0460815429688, "b": 204.2716064453125, "coord_origin": "TOPLEFT"}, "confidence": 0.9731299877166748, "cells": [{"id": 28, "text": "Special register", "bbox": {"l": 142.8, "t": 110.53801999999985, "r": 209.67091, "b": 118.86298, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Corresponding value", "bbox": {"l": 230.18912000000003, "t": 110.53801999999985, "r": 319.93527, "b": 118.86298, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "USER or", "bbox": {"l": 142.80002, "t": 129.49834999999996, "r": 178.26361, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "SESSION_USER", "bbox": {"l": 142.80002, "t": 140.53864, "r": 212.70122, "b": 148.86359000000004, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "The effective user of the thread excluding adopted authority.", "bbox": {"l": 230.21973000000003, "t": 129.49834999999996, "r": 467.99069000000003, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "CURRENT_USER", "bbox": {"l": 142.80003, "t": 159.55835000000002, "r": 216.63962999999998, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "The effective user of the thread including adopted authority. When no adopted ", "bbox": {"l": 230.19814, "t": 159.55835000000002, "r": 535.65082, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "authority is present, this has the same value as USER.", "bbox": {"l": 230.22061, "t": 170.53832999999997, "r": 447.36533, "b": 178.86328000000003, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "SYSTEM_USER", "bbox": {"l": 142.8009, "t": 189.55804, "r": 209.7357, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "The authorization ID that initiated the connection.", "bbox": {"l": 230.2449, "t": 189.55804, "r": 425.64569, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}}], "children": [{"id": 26, "label": "text", "bbox": {"l": 142.8, "t": 110.53801999999985, "r": 209.67091, "b": 118.86298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "Special register", "bbox": {"l": 142.8, "t": 110.53801999999985, "r": 209.67091, "b": 118.86298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 230.18912000000003, "t": 110.53801999999985, "r": 319.93527, "b": 118.86298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "Corresponding value", "bbox": {"l": 230.18912000000003, "t": 110.53801999999985, "r": 319.93527, "b": 118.86298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 142.80002, "t": 129.49834999999996, "r": 178.26361, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "USER or", "bbox": {"l": 142.80002, "t": 129.49834999999996, "r": 178.26361, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 142.80002, "t": 140.53864, "r": 212.70122, "b": 148.86359000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "SESSION_USER", "bbox": {"l": 142.80002, "t": 140.53864, "r": 212.70122, "b": 148.86359000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 230.21973000000003, "t": 129.49834999999996, "r": 467.99069000000003, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "The effective user of the thread excluding adopted authority.", "bbox": {"l": 230.21973000000003, "t": 129.49834999999996, "r": 467.99069000000003, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 142.80003, "t": 159.55835000000002, "r": 216.63962999999998, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "CURRENT_USER", "bbox": {"l": 142.80003, "t": 159.55835000000002, "r": 216.63962999999998, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 230.19814, "t": 159.55835000000002, "r": 535.65082, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "The effective user of the thread including adopted authority. When no adopted ", "bbox": {"l": 230.19814, "t": 159.55835000000002, "r": 535.65082, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 230.22061, "t": 170.53832999999997, "r": 447.36533, "b": 178.86328000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "authority is present, this has the same value as USER.", "bbox": {"l": 230.22061, "t": 170.53832999999997, "r": 447.36533, "b": 178.86328000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 142.8009, "t": 189.55804, "r": 209.7357, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "SYSTEM_USER", "bbox": {"l": 142.8009, "t": 189.55804, "r": 209.7357, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 230.2449, "t": 189.55804, "r": 425.64569, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "The authorization ID that initiated the connection.", "bbox": {"l": 230.2449, "t": 189.55804, "r": 425.64569, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 4, "num_cols": 2, "table_cells": [{"bbox": {"l": 142.8, "t": 110.53801999999985, "r": 209.67091, "b": 118.86298, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Special register", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 230.18912000000003, "t": 110.53801999999985, "r": 319.93527, "b": 118.86298, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Corresponding value", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 142.80002, "t": 129.49834999999996, "r": 212.70122, "b": 148.86359000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "USER or SESSION_USER", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 230.21973000000003, "t": 129.49834999999996, "r": 467.99069000000003, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "The effective user of the thread excluding adopted authority.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 142.80003, "t": 159.55835000000002, "r": 216.63962999999998, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "CURRENT_USER", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 230.19814, "t": 159.55835000000002, "r": 535.65082, "b": 178.86328000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "The effective user of the thread including adopted authority. When no adopted  authority is present, this has the same value as USER.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 142.8009, "t": 189.55804, "r": 209.7357, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "SYSTEM_USER", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 230.2449, "t": 189.55804, "r": 425.64569, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "The authorization ID that initiated the connection.", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "picture", "id": 16, "page_no": 10, "cluster": {"id": 16, "label": "picture", "bbox": {"l": 135.64837646484375, "t": 384.1737060546875, "r": 301.2367248535156, "b": 594.7566528320312, "coord_origin": "TOPLEFT"}, "confidence": 0.7221468687057495, "cells": [{"id": 38, "text": "SignedonasALICE", "bbox": {"l": 140.7323, "t": 386.98453, "r": 218.71170000000004, "b": 395.49527, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "Signed on as ALICE", "bbox": {"l": 140.7323, "t": 386.98453, "r": 216.40009, "b": 395.49527, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "USER = ALICE", "bbox": {"l": 138.476, "t": 410.87441999999993, "r": 191.70256, "b": 419.38516, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "CURRENT USER = ALICE", "bbox": {"l": 138.476, "t": 422.81934, "r": 232.56117, "b": 431.33008, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "CALL proc1", "bbox": {"l": 138.476, "t": 446.70923000000005, "r": 183.26944, "b": 455.21997, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "P1", "bbox": {"l": 148.4301, "t": 473.58524, "r": 184.17328, "b": 482.09598, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "Proc1:", "bbox": {"l": 148.4301, "t": 473.58524, "r": 174.05859, "b": 482.09598, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Owner = JOE", "bbox": {"l": 157.52185, "t": 485.53015, "r": 209.103, "b": 494.04089, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "SET OPTION USRPRF=*OWNER", "bbox": {"l": 157.52185, "t": 497.47507, "r": 281.68927, "b": 505.98581, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "USER = ALICE", "bbox": {"l": 148.4301, "t": 521.36493, "r": 201.65666, "b": 529.87567, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "CURRENT USER = JOE", "bbox": {"l": 148.4301, "t": 533.30984, "r": 234.57686999999999, "b": 541.82059, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "USER = ALICE", "bbox": {"l": 138.476, "t": 566.15842, "r": 191.70256, "b": 574.66917, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "CURRENT USER = ALICE", "bbox": {"l": 138.476, "t": 578.10333, "r": 232.56117, "b": 586.61409, "coord_origin": "TOPLEFT"}}], "children": [{"id": 15, "label": "text", "bbox": {"l": 140.7323, "t": 386.98453, "r": 218.71170000000004, "b": 395.49527, "coord_origin": "TOPLEFT"}, "confidence": 0.7616674304008484, "cells": [{"id": 38, "text": "SignedonasALICE", "bbox": {"l": 140.7323, "t": 386.98453, "r": 218.71170000000004, "b": 395.49527, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "Signed on as ALICE", "bbox": {"l": 140.7323, "t": 386.98453, "r": 216.40009, "b": 395.49527, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 138.476, "t": 410.87441999999993, "r": 191.70256, "b": 419.38516, "coord_origin": "TOPLEFT"}, "confidence": 0.5373895764350891, "cells": [{"id": 40, "text": "USER = ALICE", "bbox": {"l": 138.476, "t": 410.87441999999993, "r": 191.70256, "b": 419.38516, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 138.476, "t": 422.81934, "r": 232.56117, "b": 431.33008, "coord_origin": "TOPLEFT"}, "confidence": 0.5213791728019714, "cells": [{"id": 41, "text": "CURRENT USER = ALICE", "bbox": {"l": 138.476, "t": 422.81934, "r": 232.56117, "b": 431.33008, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 138.476, "t": 446.70923000000005, "r": 183.26944, "b": 455.21997, "coord_origin": "TOPLEFT"}, "confidence": 0.6404178142547607, "cells": [{"id": 42, "text": "CALL proc1", "bbox": {"l": 138.476, "t": 446.70923000000005, "r": 183.26944, "b": 455.21997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 148.4301, "t": 473.58524, "r": 184.17328, "b": 482.09598, "coord_origin": "TOPLEFT"}, "confidence": 0.5759297609329224, "cells": [{"id": 43, "text": "P1", "bbox": {"l": 148.4301, "t": 473.58524, "r": 184.17328, "b": 482.09598, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "Proc1:", "bbox": {"l": 148.4301, "t": 473.58524, "r": 174.05859, "b": 482.09598, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 157.52185, "t": 485.53015, "r": 209.103, "b": 494.04089, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "Owner = JOE", "bbox": {"l": 157.52185, "t": 485.53015, "r": 209.103, "b": 494.04089, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 157.52185, "t": 497.47507, "r": 281.68927, "b": 505.98581, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "SET OPTION USRPRF=*OWNER", "bbox": {"l": 157.52185, "t": 497.47507, "r": 281.68927, "b": 505.98581, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 148.4301, "t": 521.36493, "r": 201.65666, "b": 529.87567, "coord_origin": "TOPLEFT"}, "confidence": 0.5350866913795471, "cells": [{"id": 47, "text": "USER = ALICE", "bbox": {"l": 148.4301, "t": 521.36493, "r": 201.65666, "b": 529.87567, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 148.4301, "t": 533.30984, "r": 234.57686999999999, "b": 541.82059, "coord_origin": "TOPLEFT"}, "confidence": 0.5008324384689331, "cells": [{"id": 48, "text": "CURRENT USER = JOE", "bbox": {"l": 148.4301, "t": 533.30984, "r": 234.57686999999999, "b": 541.82059, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 138.476, "t": 566.15842, "r": 232.56117, "b": 586.61409, "coord_origin": "TOPLEFT"}, "confidence": 0.5024971961975098, "cells": [{"id": 49, "text": "USER = ALICE", "bbox": {"l": 138.476, "t": 566.15842, "r": 191.70256, "b": 574.66917, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "CURRENT USER = ALICE", "bbox": {"l": 138.476, "t": 578.10333, "r": 232.56117, "b": 586.61409, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "headers": [{"label": "page_footer", "id": 7, "page_no": 10, "cluster": {"id": 7, "label": "page_footer", "bbox": {"l": 344.94, "t": 755.538002, "r": 523.60162, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9557498693466187, "cells": [{"id": 0, "text": "Chapter 3. Row and Column Access Control ", "bbox": {"l": 344.94, "t": 755.538002, "r": 523.60162, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Chapter 3. Row and Column Access Control"}, {"label": "page_footer", "id": 13, "page_no": 10, "cluster": {"id": 13, "label": "page_footer", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.9130511283874512, "cells": [{"id": 1, "text": "19", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "19"}]}}, {"page_no": 11, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "20 ", "bbox": {"l": 64.800003, "t": 754.848721, "r": 78.402, "b": 764.06172, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Row and Column Access Control Support in IBM DB2 for i", "bbox": {"l": 93.420303, "t": 755.538002, "r": 334.42142, "b": 763.863001, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Table 3-2 lists the nine built-in global variables.", "bbox": {"l": 136.8, "t": 71.50867000000005, "r": 342.54773, "b": 80.72167999999999, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Table 3-2 Built-in global variables", "bbox": {"l": 64.800003, "t": 93.49805000000003, "r": 201.18147, "b": 101.82299999999998, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "3.3", "bbox": {"l": 64.800003, "t": 322.20071, "r": 87.318192, "b": 336.96371000000005, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "VERIFY_GROUP_FOR_USER function", "bbox": {"l": 91.821815, "t": 322.20071, "r": 384.36389, "b": 336.96371000000005, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "The VERIFY_GROUP_FOR_USER function was added in IBM i 7.2. Although it is primarily ", "bbox": {"l": 136.8, "t": 354.52872, "r": 542.83539, "b": 363.7417, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "intended for use with RCAC permissions and masks, it can be used in other SQL statements. ", "bbox": {"l": 136.8, "t": 366.52853, "r": 547.14783, "b": 375.74152, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "The first parameter must be one of these three special registers: SESSION_USER, USER, or ", "bbox": {"l": 136.8, "t": 378.52835, "r": 547.15106, "b": 387.74132999999995, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "CURRENT_USER. The second and subsequent parameters are a list of user or group ", "bbox": {"l": 136.80002, "t": 390.52817, "r": 520.62958, "b": 399.74115000000006, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "profiles. Each of these values must be 1 - 10 characters in length. These values are not ", "bbox": {"l": 136.80002, "t": 402.52798, "r": 524.88824, "b": 411.74097, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "validated for their existence, which means that you can specify the names of user profiles that ", "bbox": {"l": 136.80002, "t": 414.5278, "r": 547.23474, "b": 423.7407799999999, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "do not exist without receiving any kind of error.", "bbox": {"l": 136.80002, "t": 426.52762, "r": 342.04672, "b": 435.74060000000003, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "If a special register value is in the list of user profiles or it is a member of a group profile ", "bbox": {"l": 136.80002, "t": 448.48743, "r": 525.1474, "b": 457.70041, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "included in the list, the function returns a long integer value of 1. Otherwise, it returns a value ", "bbox": {"l": 136.80002, "t": 460.48724, "r": 547.25739, "b": 469.70023, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "of 0. It never returns the null value.", "bbox": {"l": 136.80002, "t": 472.48706, "r": 289.84335, "b": 481.70004, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Here is an example of using the VERIFY_GROUP_FOR_USER function:", "bbox": {"l": 136.80002, "t": 494.50662, "r": 458.44525000000004, "b": 503.7196, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "1.", "bbox": {"l": 136.80002, "t": 511.5462, "r": 145.09804, "b": 520.75919, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "There are user profiles for MGR, JANE, JUDY, and TONY.", "bbox": {"l": 147.86403, "t": 511.5462, "r": 406.07751, "b": 520.75919, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "2.", "bbox": {"l": 136.80002, "t": 528.5260000000001, "r": 145.23297, "b": 537.739, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "The user profile JANE specifies a group profile of MGR.", "bbox": {"l": 148.04396, "t": 528.5260000000001, "r": 396.98816, "b": 537.739, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "3.", "bbox": {"l": 136.80002, "t": 545.50581, "r": 145.18951, "b": 554.71881, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "If a user is connected to the server using user profile JANE, all of the following function ", "bbox": {"l": 147.98601, "t": 545.50581, "r": 536.5686, "b": 554.71881, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "invocations return a value of 1:", "bbox": {"l": 151.20018, "t": 557.50562, "r": 286.84641, "b": 566.71861, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "VERIFY_GROUP_FOR_USER (CURRENT_USER, 'MGR')", "bbox": {"l": 151.20018, "t": 574.69458, "r": 366.05725, "b": 583.46933, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "VERIFY_GROUP_FOR_USER (CURRENT_USER, 'JANE', 'MGR')", "bbox": {"l": 151.20018, "t": 586.69438, "r": 406.01678, "b": 595.46913, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "VERIFY_GROUP_FOR_USER (CURRENT_USER, 'JANE', 'MGR', 'STEVE')", "bbox": {"l": 151.20018, "t": 598.69418, "r": 451.01605, "b": 607.46893, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "The following function invocation returns a value of 0:", "bbox": {"l": 151.20018, "t": 615.5246, "r": 385.87271, "b": 624.73759, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "VERIFY_GROUP_FOR_USER (CURRENT_USER, 'JUDY', 'TONY')", "bbox": {"l": 151.20018, "t": 632.65381, "r": 411.05655, "b": 641.4285600000001, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Global variable", "bbox": {"l": 70.800003, "t": 110.53801999999985, "r": 134.99071, "b": 118.86298, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Type", "bbox": {"l": 202.8894, "t": 110.53801999999985, "r": 223.34641, "b": 118.86298, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Description", "bbox": {"l": 281.8248, "t": 110.53801999999985, "r": 331.3428, "b": 118.86298, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "CLIENT_HOST", "bbox": {"l": 70.800003, "t": 129.49834999999996, "r": 132.7209, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "VARCHAR(255)", "bbox": {"l": 202.89029, "t": 129.49834999999996, "r": 267.07651, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Host name of the current client as returned by the system", "bbox": {"l": 281.84732, "t": 129.49834999999996, "r": 510.17548, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "CLIENT_IPADDR", "bbox": {"l": 70.800018, "t": 148.51806999999997, "r": 140.66522, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "VARCHAR(128)", "bbox": {"l": 202.87231, "t": 148.51806999999997, "r": 267.07739, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "IP address of the current client as returned by the system", "bbox": {"l": 281.84549, "t": 148.51806999999997, "r": 509.60583, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "CLIENT_PORT ", "bbox": {"l": 70.800018, "t": 167.53778, "r": 134.98264, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "INTEGER", "bbox": {"l": 202.90294, "t": 167.53778, "r": 242.80084, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "Port used by the current client to communicate with the server", "bbox": {"l": 281.79785, "t": 167.53778, "r": 527.59222, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "PACKAGE_NAME", "bbox": {"l": 70.800018, "t": 186.5575, "r": 143.50925, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "VARCHAR(128)", "bbox": {"l": 202.80576, "t": 186.5575, "r": 267.06937, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Name of the currently running package", "bbox": {"l": 281.85187, "t": 186.5575, "r": 436.57259999999997, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "PACKAGE_SCHEMA", "bbox": {"l": 70.800018, "t": 205.51782000000003, "r": 156.01654, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "VARCHAR(128)", "bbox": {"l": 202.83545, "t": 205.51782000000003, "r": 267.08646, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "Schema name of the currently running package", "bbox": {"l": 281.87076, "t": 205.51782000000003, "r": 470.44678, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "PACKAGE_VERSION", "bbox": {"l": 70.800018, "t": 224.53754000000004, "r": 157.89932, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "VARCHAR(64)", "bbox": {"l": 202.72472, "t": 224.53754000000004, "r": 261.98254, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "Version identifier of the currently running package", "bbox": {"l": 281.74924, "t": 224.53754000000004, "r": 478.8438100000001, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "ROUTINE_SCHEMA", "bbox": {"l": 70.800018, "t": 243.55724999999995, "r": 154.41992, "b": 251.8822, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "VARCHAR(128)", "bbox": {"l": 202.79312, "t": 243.55724999999995, "r": 267.09274, "b": 251.8822, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Schema name of the currently running routine", "bbox": {"l": 281.87164, "t": 243.55724999999995, "r": 464.26022, "b": 251.8822, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "ROUTINE_SPECIFIC_NAME", "bbox": {"l": 70.800018, "t": 262.51757999999995, "r": 188.43991, "b": 270.84253, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "VARCHAR(128)", "bbox": {"l": 202.84441, "t": 262.51757999999995, "r": 267.03693, "b": 270.84253, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "Name of the currently running routine", "bbox": {"l": 281.80682, "t": 262.51757999999995, "r": 430.40045, "b": 270.84253, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "ROUTINE_TYPE", "bbox": {"l": 70.800034, "t": 281.53726, "r": 139.43135, "b": 289.86227, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "CHAR(1)", "bbox": {"l": 202.74635, "t": 281.53726, "r": 239.28996000000004, "b": 289.86227, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Type of the currently running routine", "bbox": {"l": 281.79065, "t": 281.53726, "r": 425.09131, "b": 289.86227, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 9, "label": "page_footer", "bbox": {"l": 64.800003, "t": 754.848721, "r": 78.402, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.9187920093536377, "cells": [{"id": 0, "text": "20 ", "bbox": {"l": 64.800003, "t": 754.848721, "r": 78.402, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "page_footer", "bbox": {"l": 93.420303, "t": 755.538002, "r": 334.42142, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9505079388618469, "cells": [{"id": 1, "text": "Row and Column Access Control Support in IBM DB2 for i", "bbox": {"l": 93.420303, "t": 755.538002, "r": 334.42142, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 136.8, "t": 71.50867000000005, "r": 342.54773, "b": 80.72167999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.8370978832244873, "cells": [{"id": 2, "text": "Table 3-2 lists the nine built-in global variables.", "bbox": {"l": 136.8, "t": 71.50867000000005, "r": 342.54773, "b": 80.72167999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "caption", "bbox": {"l": 64.800003, "t": 93.49805000000003, "r": 201.18147, "b": 101.82299999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.913235604763031, "cells": [{"id": 3, "text": "Table 3-2 Built-in global variables", "bbox": {"l": 64.800003, "t": 93.49805000000003, "r": 201.18147, "b": 101.82299999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "section_header", "bbox": {"l": 64.800003, "t": 322.20071, "r": 384.36389, "b": 336.96371000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9645338654518127, "cells": [{"id": 4, "text": "3.3", "bbox": {"l": 64.800003, "t": 322.20071, "r": 87.318192, "b": 336.96371000000005, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "VERIFY_GROUP_FOR_USER function", "bbox": {"l": 91.821815, "t": 322.20071, "r": 384.36389, "b": 336.96371000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 136.8, "t": 354.52872, "r": 547.23474, "b": 435.74060000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9864333868026733, "cells": [{"id": 6, "text": "The VERIFY_GROUP_FOR_USER function was added in IBM i 7.2. Although it is primarily ", "bbox": {"l": 136.8, "t": 354.52872, "r": 542.83539, "b": 363.7417, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "intended for use with RCAC permissions and masks, it can be used in other SQL statements. ", "bbox": {"l": 136.8, "t": 366.52853, "r": 547.14783, "b": 375.74152, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "The first parameter must be one of these three special registers: SESSION_USER, USER, or ", "bbox": {"l": 136.8, "t": 378.52835, "r": 547.15106, "b": 387.74132999999995, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "CURRENT_USER. The second and subsequent parameters are a list of user or group ", "bbox": {"l": 136.80002, "t": 390.52817, "r": 520.62958, "b": 399.74115000000006, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "profiles. Each of these values must be 1 - 10 characters in length. These values are not ", "bbox": {"l": 136.80002, "t": 402.52798, "r": 524.88824, "b": 411.74097, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "validated for their existence, which means that you can specify the names of user profiles that ", "bbox": {"l": 136.80002, "t": 414.5278, "r": 547.23474, "b": 423.7407799999999, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "do not exist without receiving any kind of error.", "bbox": {"l": 136.80002, "t": 426.52762, "r": 342.04672, "b": 435.74060000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 136.80002, "t": 448.48743, "r": 547.25739, "b": 481.70004, "coord_origin": "TOPLEFT"}, "confidence": 0.9807308912277222, "cells": [{"id": 13, "text": "If a special register value is in the list of user profiles or it is a member of a group profile ", "bbox": {"l": 136.80002, "t": 448.48743, "r": 525.1474, "b": 457.70041, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "included in the list, the function returns a long integer value of 1. Otherwise, it returns a value ", "bbox": {"l": 136.80002, "t": 460.48724, "r": 547.25739, "b": 469.70023, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "of 0. It never returns the null value.", "bbox": {"l": 136.80002, "t": 472.48706, "r": 289.84335, "b": 481.70004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "text", "bbox": {"l": 136.80002, "t": 494.50662, "r": 458.44525000000004, "b": 503.7196, "coord_origin": "TOPLEFT"}, "confidence": 0.9237529635429382, "cells": [{"id": 16, "text": "Here is an example of using the VERIFY_GROUP_FOR_USER function:", "bbox": {"l": 136.80002, "t": 494.50662, "r": 458.44525000000004, "b": 503.7196, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "list_item", "bbox": {"l": 136.80002, "t": 511.5462, "r": 406.07751, "b": 520.75919, "coord_origin": "TOPLEFT"}, "confidence": 0.9338629841804504, "cells": [{"id": 17, "text": "1.", "bbox": {"l": 136.80002, "t": 511.5462, "r": 145.09804, "b": 520.75919, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "There are user profiles for MGR, JANE, JUDY, and TONY.", "bbox": {"l": 147.86403, "t": 511.5462, "r": 406.07751, "b": 520.75919, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "list_item", "bbox": {"l": 136.80002, "t": 528.5260000000001, "r": 396.98816, "b": 537.739, "coord_origin": "TOPLEFT"}, "confidence": 0.9514460563659668, "cells": [{"id": 19, "text": "2.", "bbox": {"l": 136.80002, "t": 528.5260000000001, "r": 145.23297, "b": 537.739, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "The user profile JANE specifies a group profile of MGR.", "bbox": {"l": 148.04396, "t": 528.5260000000001, "r": 396.98816, "b": 537.739, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "list_item", "bbox": {"l": 136.80002, "t": 545.50581, "r": 536.5686, "b": 566.71861, "coord_origin": "TOPLEFT"}, "confidence": 0.951230525970459, "cells": [{"id": 21, "text": "3.", "bbox": {"l": 136.80002, "t": 545.50581, "r": 145.18951, "b": 554.71881, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "If a user is connected to the server using user profile JANE, all of the following function ", "bbox": {"l": 147.98601, "t": 545.50581, "r": 536.5686, "b": 554.71881, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "invocations return a value of 1:", "bbox": {"l": 151.20018, "t": 557.50562, "r": 286.84641, "b": 566.71861, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "code", "bbox": {"l": 151.20018, "t": 574.69458, "r": 451.01605, "b": 641.4285600000001, "coord_origin": "TOPLEFT"}, "confidence": 0.7066455483436584, "cells": [{"id": 24, "text": "VERIFY_GROUP_FOR_USER (CURRENT_USER, 'MGR')", "bbox": {"l": 151.20018, "t": 574.69458, "r": 366.05725, "b": 583.46933, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "VERIFY_GROUP_FOR_USER (CURRENT_USER, 'JANE', 'MGR')", "bbox": {"l": 151.20018, "t": 586.69438, "r": 406.01678, "b": 595.46913, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "VERIFY_GROUP_FOR_USER (CURRENT_USER, 'JANE', 'MGR', 'STEVE')", "bbox": {"l": 151.20018, "t": 598.69418, "r": 451.01605, "b": 607.46893, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "The following function invocation returns a value of 0:", "bbox": {"l": 151.20018, "t": 615.5246, "r": 385.87271, "b": 624.73759, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "VERIFY_GROUP_FOR_USER (CURRENT_USER, 'JUDY', 'TONY')", "bbox": {"l": 151.20018, "t": 632.65381, "r": 411.05655, "b": 641.4285600000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "table", "bbox": {"l": 63.55636978149414, "t": 104.23387145996094, "r": 548.5687255859375, "b": 296.22467041015625, "coord_origin": "TOPLEFT"}, "confidence": 0.9868634939193726, "cells": [{"id": 29, "text": "Global variable", "bbox": {"l": 70.800003, "t": 110.53801999999985, "r": 134.99071, "b": 118.86298, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Type", "bbox": {"l": 202.8894, "t": 110.53801999999985, "r": 223.34641, "b": 118.86298, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Description", "bbox": {"l": 281.8248, "t": 110.53801999999985, "r": 331.3428, "b": 118.86298, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "CLIENT_HOST", "bbox": {"l": 70.800003, "t": 129.49834999999996, "r": 132.7209, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "VARCHAR(255)", "bbox": {"l": 202.89029, "t": 129.49834999999996, "r": 267.07651, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Host name of the current client as returned by the system", "bbox": {"l": 281.84732, "t": 129.49834999999996, "r": 510.17548, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "CLIENT_IPADDR", "bbox": {"l": 70.800018, "t": 148.51806999999997, "r": 140.66522, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "VARCHAR(128)", "bbox": {"l": 202.87231, "t": 148.51806999999997, "r": 267.07739, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "IP address of the current client as returned by the system", "bbox": {"l": 281.84549, "t": 148.51806999999997, "r": 509.60583, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "CLIENT_PORT ", "bbox": {"l": 70.800018, "t": 167.53778, "r": 134.98264, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "INTEGER", "bbox": {"l": 202.90294, "t": 167.53778, "r": 242.80084, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "Port used by the current client to communicate with the server", "bbox": {"l": 281.79785, "t": 167.53778, "r": 527.59222, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "PACKAGE_NAME", "bbox": {"l": 70.800018, "t": 186.5575, "r": 143.50925, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "VARCHAR(128)", "bbox": {"l": 202.80576, "t": 186.5575, "r": 267.06937, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Name of the currently running package", "bbox": {"l": 281.85187, "t": 186.5575, "r": 436.57259999999997, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "PACKAGE_SCHEMA", "bbox": {"l": 70.800018, "t": 205.51782000000003, "r": 156.01654, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "VARCHAR(128)", "bbox": {"l": 202.83545, "t": 205.51782000000003, "r": 267.08646, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "Schema name of the currently running package", "bbox": {"l": 281.87076, "t": 205.51782000000003, "r": 470.44678, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "PACKAGE_VERSION", "bbox": {"l": 70.800018, "t": 224.53754000000004, "r": 157.89932, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "VARCHAR(64)", "bbox": {"l": 202.72472, "t": 224.53754000000004, "r": 261.98254, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "Version identifier of the currently running package", "bbox": {"l": 281.74924, "t": 224.53754000000004, "r": 478.8438100000001, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "ROUTINE_SCHEMA", "bbox": {"l": 70.800018, "t": 243.55724999999995, "r": 154.41992, "b": 251.8822, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "VARCHAR(128)", "bbox": {"l": 202.79312, "t": 243.55724999999995, "r": 267.09274, "b": 251.8822, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Schema name of the currently running routine", "bbox": {"l": 281.87164, "t": 243.55724999999995, "r": 464.26022, "b": 251.8822, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "ROUTINE_SPECIFIC_NAME", "bbox": {"l": 70.800018, "t": 262.51757999999995, "r": 188.43991, "b": 270.84253, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "VARCHAR(128)", "bbox": {"l": 202.84441, "t": 262.51757999999995, "r": 267.03693, "b": 270.84253, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "Name of the currently running routine", "bbox": {"l": 281.80682, "t": 262.51757999999995, "r": 430.40045, "b": 270.84253, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "ROUTINE_TYPE", "bbox": {"l": 70.800034, "t": 281.53726, "r": 139.43135, "b": 289.86227, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "CHAR(1)", "bbox": {"l": 202.74635, "t": 281.53726, "r": 239.28996000000004, "b": 289.86227, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Type of the currently running routine", "bbox": {"l": 281.79065, "t": 281.53726, "r": 425.09131, "b": 289.86227, "coord_origin": "TOPLEFT"}}], "children": [{"id": 14, "label": "text", "bbox": {"l": 70.800003, "t": 110.53801999999985, "r": 134.99071, "b": 118.86298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "Global variable", "bbox": {"l": 70.800003, "t": 110.53801999999985, "r": 134.99071, "b": 118.86298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 202.8894, "t": 110.53801999999985, "r": 223.34641, "b": 118.86298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "Type", "bbox": {"l": 202.8894, "t": 110.53801999999985, "r": 223.34641, "b": 118.86298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 281.8248, "t": 110.53801999999985, "r": 331.3428, "b": 118.86298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "Description", "bbox": {"l": 281.8248, "t": 110.53801999999985, "r": 331.3428, "b": 118.86298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 70.800003, "t": 129.49834999999996, "r": 132.7209, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "CLIENT_HOST", "bbox": {"l": 70.800003, "t": 129.49834999999996, "r": 132.7209, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 202.89029, "t": 129.49834999999996, "r": 267.07651, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "VARCHAR(255)", "bbox": {"l": 202.89029, "t": 129.49834999999996, "r": 267.07651, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 281.84732, "t": 129.49834999999996, "r": 510.17548, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "Host name of the current client as returned by the system", "bbox": {"l": 281.84732, "t": 129.49834999999996, "r": 510.17548, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 70.800018, "t": 148.51806999999997, "r": 140.66522, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "CLIENT_IPADDR", "bbox": {"l": 70.800018, "t": 148.51806999999997, "r": 140.66522, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 202.87231, "t": 148.51806999999997, "r": 267.07739, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "VARCHAR(128)", "bbox": {"l": 202.87231, "t": 148.51806999999997, "r": 267.07739, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 281.84549, "t": 148.51806999999997, "r": 509.60583, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "IP address of the current client as returned by the system", "bbox": {"l": 281.84549, "t": 148.51806999999997, "r": 509.60583, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 70.800018, "t": 167.53778, "r": 134.98264, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "CLIENT_PORT ", "bbox": {"l": 70.800018, "t": 167.53778, "r": 134.98264, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 202.90294, "t": 167.53778, "r": 242.80084, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "INTEGER", "bbox": {"l": 202.90294, "t": 167.53778, "r": 242.80084, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 281.79785, "t": 167.53778, "r": 527.59222, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "Port used by the current client to communicate with the server", "bbox": {"l": 281.79785, "t": 167.53778, "r": 527.59222, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 70.800018, "t": 186.5575, "r": 143.50925, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "PACKAGE_NAME", "bbox": {"l": 70.800018, "t": 186.5575, "r": 143.50925, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 202.80576, "t": 186.5575, "r": 267.06937, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "VARCHAR(128)", "bbox": {"l": 202.80576, "t": 186.5575, "r": 267.06937, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 281.85187, "t": 186.5575, "r": 436.57259999999997, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "Name of the currently running package", "bbox": {"l": 281.85187, "t": 186.5575, "r": 436.57259999999997, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 70.800018, "t": 205.51782000000003, "r": 156.01654, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "PACKAGE_SCHEMA", "bbox": {"l": 70.800018, "t": 205.51782000000003, "r": 156.01654, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 202.83545, "t": 205.51782000000003, "r": 267.08646, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "VARCHAR(128)", "bbox": {"l": 202.83545, "t": 205.51782000000003, "r": 267.08646, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 281.87076, "t": 205.51782000000003, "r": 470.44678, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "Schema name of the currently running package", "bbox": {"l": 281.87076, "t": 205.51782000000003, "r": 470.44678, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 70.800018, "t": 224.53754000000004, "r": 157.89932, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "PACKAGE_VERSION", "bbox": {"l": 70.800018, "t": 224.53754000000004, "r": 157.89932, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 202.72472, "t": 224.53754000000004, "r": 261.98254, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "VARCHAR(64)", "bbox": {"l": 202.72472, "t": 224.53754000000004, "r": 261.98254, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 281.74924, "t": 224.53754000000004, "r": 478.8438100000001, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "Version identifier of the currently running package", "bbox": {"l": 281.74924, "t": 224.53754000000004, "r": 478.8438100000001, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 70.800018, "t": 243.55724999999995, "r": 154.41992, "b": 251.8822, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "ROUTINE_SCHEMA", "bbox": {"l": 70.800018, "t": 243.55724999999995, "r": 154.41992, "b": 251.8822, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 202.79312, "t": 243.55724999999995, "r": 267.09274, "b": 251.8822, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "VARCHAR(128)", "bbox": {"l": 202.79312, "t": 243.55724999999995, "r": 267.09274, "b": 251.8822, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 281.87164, "t": 243.55724999999995, "r": 464.26022, "b": 251.8822, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "Schema name of the currently running routine", "bbox": {"l": 281.87164, "t": 243.55724999999995, "r": 464.26022, "b": 251.8822, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 70.800018, "t": 262.51757999999995, "r": 188.43991, "b": 270.84253, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "ROUTINE_SPECIFIC_NAME", "bbox": {"l": 70.800018, "t": 262.51757999999995, "r": 188.43991, "b": 270.84253, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 202.84441, "t": 262.51757999999995, "r": 267.03693, "b": 270.84253, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "VARCHAR(128)", "bbox": {"l": 202.84441, "t": 262.51757999999995, "r": 267.03693, "b": 270.84253, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 281.80682, "t": 262.51757999999995, "r": 430.40045, "b": 270.84253, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "Name of the currently running routine", "bbox": {"l": 281.80682, "t": 262.51757999999995, "r": 430.40045, "b": 270.84253, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 70.800034, "t": 281.53726, "r": 139.43135, "b": 289.86227, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "ROUTINE_TYPE", "bbox": {"l": 70.800034, "t": 281.53726, "r": 139.43135, "b": 289.86227, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 202.74635, "t": 281.53726, "r": 239.28996000000004, "b": 289.86227, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "CHAR(1)", "bbox": {"l": 202.74635, "t": 281.53726, "r": 239.28996000000004, "b": 289.86227, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 281.79065, "t": 281.53726, "r": 425.09131, "b": 289.86227, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "Type of the currently running routine", "bbox": {"l": 281.79065, "t": 281.53726, "r": 425.09131, "b": 289.86227, "coord_origin": "TOPLEFT"}}], "children": []}]}]}, "tablestructure": {"table_map": {"0": {"label": "table", "id": 0, "page_no": 11, "cluster": {"id": 0, "label": "table", "bbox": {"l": 63.55636978149414, "t": 104.23387145996094, "r": 548.5687255859375, "b": 296.22467041015625, "coord_origin": "TOPLEFT"}, "confidence": 0.9868634939193726, "cells": [{"id": 29, "text": "Global variable", "bbox": {"l": 70.800003, "t": 110.53801999999985, "r": 134.99071, "b": 118.86298, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Type", "bbox": {"l": 202.8894, "t": 110.53801999999985, "r": 223.34641, "b": 118.86298, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Description", "bbox": {"l": 281.8248, "t": 110.53801999999985, "r": 331.3428, "b": 118.86298, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "CLIENT_HOST", "bbox": {"l": 70.800003, "t": 129.49834999999996, "r": 132.7209, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "VARCHAR(255)", "bbox": {"l": 202.89029, "t": 129.49834999999996, "r": 267.07651, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Host name of the current client as returned by the system", "bbox": {"l": 281.84732, "t": 129.49834999999996, "r": 510.17548, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "CLIENT_IPADDR", "bbox": {"l": 70.800018, "t": 148.51806999999997, "r": 140.66522, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "VARCHAR(128)", "bbox": {"l": 202.87231, "t": 148.51806999999997, "r": 267.07739, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "IP address of the current client as returned by the system", "bbox": {"l": 281.84549, "t": 148.51806999999997, "r": 509.60583, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "CLIENT_PORT ", "bbox": {"l": 70.800018, "t": 167.53778, "r": 134.98264, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "INTEGER", "bbox": {"l": 202.90294, "t": 167.53778, "r": 242.80084, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "Port used by the current client to communicate with the server", "bbox": {"l": 281.79785, "t": 167.53778, "r": 527.59222, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "PACKAGE_NAME", "bbox": {"l": 70.800018, "t": 186.5575, "r": 143.50925, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "VARCHAR(128)", "bbox": {"l": 202.80576, "t": 186.5575, "r": 267.06937, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Name of the currently running package", "bbox": {"l": 281.85187, "t": 186.5575, "r": 436.57259999999997, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "PACKAGE_SCHEMA", "bbox": {"l": 70.800018, "t": 205.51782000000003, "r": 156.01654, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "VARCHAR(128)", "bbox": {"l": 202.83545, "t": 205.51782000000003, "r": 267.08646, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "Schema name of the currently running package", "bbox": {"l": 281.87076, "t": 205.51782000000003, "r": 470.44678, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "PACKAGE_VERSION", "bbox": {"l": 70.800018, "t": 224.53754000000004, "r": 157.89932, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "VARCHAR(64)", "bbox": {"l": 202.72472, "t": 224.53754000000004, "r": 261.98254, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "Version identifier of the currently running package", "bbox": {"l": 281.74924, "t": 224.53754000000004, "r": 478.8438100000001, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "ROUTINE_SCHEMA", "bbox": {"l": 70.800018, "t": 243.55724999999995, "r": 154.41992, "b": 251.8822, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "VARCHAR(128)", "bbox": {"l": 202.79312, "t": 243.55724999999995, "r": 267.09274, "b": 251.8822, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Schema name of the currently running routine", "bbox": {"l": 281.87164, "t": 243.55724999999995, "r": 464.26022, "b": 251.8822, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "ROUTINE_SPECIFIC_NAME", "bbox": {"l": 70.800018, "t": 262.51757999999995, "r": 188.43991, "b": 270.84253, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "VARCHAR(128)", "bbox": {"l": 202.84441, "t": 262.51757999999995, "r": 267.03693, "b": 270.84253, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "Name of the currently running routine", "bbox": {"l": 281.80682, "t": 262.51757999999995, "r": 430.40045, "b": 270.84253, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "ROUTINE_TYPE", "bbox": {"l": 70.800034, "t": 281.53726, "r": 139.43135, "b": 289.86227, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "CHAR(1)", "bbox": {"l": 202.74635, "t": 281.53726, "r": 239.28996000000004, "b": 289.86227, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Type of the currently running routine", "bbox": {"l": 281.79065, "t": 281.53726, "r": 425.09131, "b": 289.86227, "coord_origin": "TOPLEFT"}}], "children": [{"id": 14, "label": "text", "bbox": {"l": 70.800003, "t": 110.53801999999985, "r": 134.99071, "b": 118.86298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "Global variable", "bbox": {"l": 70.800003, "t": 110.53801999999985, "r": 134.99071, "b": 118.86298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 202.8894, "t": 110.53801999999985, "r": 223.34641, "b": 118.86298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "Type", "bbox": {"l": 202.8894, "t": 110.53801999999985, "r": 223.34641, "b": 118.86298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 281.8248, "t": 110.53801999999985, "r": 331.3428, "b": 118.86298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "Description", "bbox": {"l": 281.8248, "t": 110.53801999999985, "r": 331.3428, "b": 118.86298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 70.800003, "t": 129.49834999999996, "r": 132.7209, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "CLIENT_HOST", "bbox": {"l": 70.800003, "t": 129.49834999999996, "r": 132.7209, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 202.89029, "t": 129.49834999999996, "r": 267.07651, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "VARCHAR(255)", "bbox": {"l": 202.89029, "t": 129.49834999999996, "r": 267.07651, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 281.84732, "t": 129.49834999999996, "r": 510.17548, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "Host name of the current client as returned by the system", "bbox": {"l": 281.84732, "t": 129.49834999999996, "r": 510.17548, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 70.800018, "t": 148.51806999999997, "r": 140.66522, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "CLIENT_IPADDR", "bbox": {"l": 70.800018, "t": 148.51806999999997, "r": 140.66522, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 202.87231, "t": 148.51806999999997, "r": 267.07739, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "VARCHAR(128)", "bbox": {"l": 202.87231, "t": 148.51806999999997, "r": 267.07739, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 281.84549, "t": 148.51806999999997, "r": 509.60583, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "IP address of the current client as returned by the system", "bbox": {"l": 281.84549, "t": 148.51806999999997, "r": 509.60583, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 70.800018, "t": 167.53778, "r": 134.98264, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "CLIENT_PORT ", "bbox": {"l": 70.800018, "t": 167.53778, "r": 134.98264, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 202.90294, "t": 167.53778, "r": 242.80084, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "INTEGER", "bbox": {"l": 202.90294, "t": 167.53778, "r": 242.80084, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 281.79785, "t": 167.53778, "r": 527.59222, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "Port used by the current client to communicate with the server", "bbox": {"l": 281.79785, "t": 167.53778, "r": 527.59222, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 70.800018, "t": 186.5575, "r": 143.50925, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "PACKAGE_NAME", "bbox": {"l": 70.800018, "t": 186.5575, "r": 143.50925, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 202.80576, "t": 186.5575, "r": 267.06937, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "VARCHAR(128)", "bbox": {"l": 202.80576, "t": 186.5575, "r": 267.06937, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 281.85187, "t": 186.5575, "r": 436.57259999999997, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "Name of the currently running package", "bbox": {"l": 281.85187, "t": 186.5575, "r": 436.57259999999997, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 70.800018, "t": 205.51782000000003, "r": 156.01654, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "PACKAGE_SCHEMA", "bbox": {"l": 70.800018, "t": 205.51782000000003, "r": 156.01654, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 202.83545, "t": 205.51782000000003, "r": 267.08646, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "VARCHAR(128)", "bbox": {"l": 202.83545, "t": 205.51782000000003, "r": 267.08646, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 281.87076, "t": 205.51782000000003, "r": 470.44678, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "Schema name of the currently running package", "bbox": {"l": 281.87076, "t": 205.51782000000003, "r": 470.44678, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 70.800018, "t": 224.53754000000004, "r": 157.89932, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "PACKAGE_VERSION", "bbox": {"l": 70.800018, "t": 224.53754000000004, "r": 157.89932, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 202.72472, "t": 224.53754000000004, "r": 261.98254, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "VARCHAR(64)", "bbox": {"l": 202.72472, "t": 224.53754000000004, "r": 261.98254, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 281.74924, "t": 224.53754000000004, "r": 478.8438100000001, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "Version identifier of the currently running package", "bbox": {"l": 281.74924, "t": 224.53754000000004, "r": 478.8438100000001, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 70.800018, "t": 243.55724999999995, "r": 154.41992, "b": 251.8822, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "ROUTINE_SCHEMA", "bbox": {"l": 70.800018, "t": 243.55724999999995, "r": 154.41992, "b": 251.8822, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 202.79312, "t": 243.55724999999995, "r": 267.09274, "b": 251.8822, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "VARCHAR(128)", "bbox": {"l": 202.79312, "t": 243.55724999999995, "r": 267.09274, "b": 251.8822, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 281.87164, "t": 243.55724999999995, "r": 464.26022, "b": 251.8822, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "Schema name of the currently running routine", "bbox": {"l": 281.87164, "t": 243.55724999999995, "r": 464.26022, "b": 251.8822, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 70.800018, "t": 262.51757999999995, "r": 188.43991, "b": 270.84253, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "ROUTINE_SPECIFIC_NAME", "bbox": {"l": 70.800018, "t": 262.51757999999995, "r": 188.43991, "b": 270.84253, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 202.84441, "t": 262.51757999999995, "r": 267.03693, "b": 270.84253, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "VARCHAR(128)", "bbox": {"l": 202.84441, "t": 262.51757999999995, "r": 267.03693, "b": 270.84253, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 281.80682, "t": 262.51757999999995, "r": 430.40045, "b": 270.84253, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "Name of the currently running routine", "bbox": {"l": 281.80682, "t": 262.51757999999995, "r": 430.40045, "b": 270.84253, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 70.800034, "t": 281.53726, "r": 139.43135, "b": 289.86227, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "ROUTINE_TYPE", "bbox": {"l": 70.800034, "t": 281.53726, "r": 139.43135, "b": 289.86227, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 202.74635, "t": 281.53726, "r": 239.28996000000004, "b": 289.86227, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "CHAR(1)", "bbox": {"l": 202.74635, "t": 281.53726, "r": 239.28996000000004, "b": 289.86227, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 281.79065, "t": 281.53726, "r": 425.09131, "b": 289.86227, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "Type of the currently running routine", "bbox": {"l": 281.79065, "t": 281.53726, "r": 425.09131, "b": 289.86227, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl"], "num_rows": 10, "num_cols": 3, "table_cells": [{"bbox": {"l": 70.800003, "t": 110.53801999999985, "r": 134.99071, "b": 118.86298, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Global variable", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 202.8894, "t": 110.53801999999985, "r": 223.34641, "b": 118.86298, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Type", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 281.8248, "t": 110.53801999999985, "r": 331.3428, "b": 118.86298, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Description", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800003, "t": 129.49834999999996, "r": 132.7209, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "CLIENT_HOST", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.89029, "t": 129.49834999999996, "r": 267.07651, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(255)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.84732, "t": 129.49834999999996, "r": 510.17548, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Host name of the current client as returned by the system", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800018, "t": 148.51806999999997, "r": 140.66522, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "CLIENT_IPADDR", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.87231, "t": 148.51806999999997, "r": 267.07739, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(128)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.84549, "t": 148.51806999999997, "r": 509.60583, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "IP address of the current client as returned by the system", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800018, "t": 167.53778, "r": 134.98264, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "CLIENT_PORT", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.90294, "t": 167.53778, "r": 242.80084, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "INTEGER", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.79785, "t": 167.53778, "r": 527.59222, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Port used by the current client to communicate with the server", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800018, "t": 186.5575, "r": 143.50925, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PACKAGE_NAME", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.80576, "t": 186.5575, "r": 267.06937, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(128)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.85187, "t": 186.5575, "r": 436.57259999999997, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Name of the currently running package", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800018, "t": 205.51782000000003, "r": 156.01654, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PACKAGE_SCHEMA", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.83545, "t": 205.51782000000003, "r": 267.08646, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(128)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.87076, "t": 205.51782000000003, "r": 470.44678, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Schema name of the currently running package", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800018, "t": 224.53754000000004, "r": 157.89932, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PACKAGE_VERSION", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.72472, "t": 224.53754000000004, "r": 261.98254, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(64)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.74924, "t": 224.53754000000004, "r": 478.8438100000001, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Version identifier of the currently running package", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800018, "t": 243.55724999999995, "r": 154.41992, "b": 251.8822, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "ROUTINE_SCHEMA", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.79312, "t": 243.55724999999995, "r": 267.09274, "b": 251.8822, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(128)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.87164, "t": 243.55724999999995, "r": 464.26022, "b": 251.8822, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Schema name of the currently running routine", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800018, "t": 262.51757999999995, "r": 188.43991, "b": 270.84253, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "ROUTINE_SPECIFIC_NAME", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.84441, "t": 262.51757999999995, "r": 267.03693, "b": 270.84253, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(128)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.80682, "t": 262.51757999999995, "r": 430.40045, "b": 270.84253, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Name of the currently running routine", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800034, "t": 281.53726, "r": 139.43135, "b": 289.86227, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "ROUTINE_TYPE", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.74635, "t": 281.53726, "r": 239.28996000000004, "b": 289.86227, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "CHAR(1)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.79065, "t": 281.53726, "r": 425.09131, "b": 289.86227, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Type of the currently running routine", "column_header": false, "row_header": false, "row_section": false}]}}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_footer", "id": 9, "page_no": 11, "cluster": {"id": 9, "label": "page_footer", "bbox": {"l": 64.800003, "t": 754.848721, "r": 78.402, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.9187920093536377, "cells": [{"id": 0, "text": "20 ", "bbox": {"l": 64.800003, "t": 754.848721, "r": 78.402, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "20"}, {"label": "page_footer", "id": 6, "page_no": 11, "cluster": {"id": 6, "label": "page_footer", "bbox": {"l": 93.420303, "t": 755.538002, "r": 334.42142, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9505079388618469, "cells": [{"id": 1, "text": "Row and Column Access Control Support in IBM DB2 for i", "bbox": {"l": 93.420303, "t": 755.538002, "r": 334.42142, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Row and Column Access Control Support in IBM DB2 for i"}, {"label": "text", "id": 11, "page_no": 11, "cluster": {"id": 11, "label": "text", "bbox": {"l": 136.8, "t": 71.50867000000005, "r": 342.54773, "b": 80.72167999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.8370978832244873, "cells": [{"id": 2, "text": "Table 3-2 lists the nine built-in global variables.", "bbox": {"l": 136.8, "t": 71.50867000000005, "r": 342.54773, "b": 80.72167999999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 3-2 lists the nine built-in global variables."}, {"label": "caption", "id": 10, "page_no": 11, "cluster": {"id": 10, "label": "caption", "bbox": {"l": 64.800003, "t": 93.49805000000003, "r": 201.18147, "b": 101.82299999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.913235604763031, "cells": [{"id": 3, "text": "Table 3-2 Built-in global variables", "bbox": {"l": 64.800003, "t": 93.49805000000003, "r": 201.18147, "b": 101.82299999999998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 3-2 Built-in global variables"}, {"label": "section_header", "id": 3, "page_no": 11, "cluster": {"id": 3, "label": "section_header", "bbox": {"l": 64.800003, "t": 322.20071, "r": 384.36389, "b": 336.96371000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9645338654518127, "cells": [{"id": 4, "text": "3.3", "bbox": {"l": 64.800003, "t": 322.20071, "r": 87.318192, "b": 336.96371000000005, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "VERIFY_GROUP_FOR_USER function", "bbox": {"l": 91.821815, "t": 322.20071, "r": 384.36389, "b": 336.96371000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3.3 VERIFY_GROUP_FOR_USER function"}, {"label": "text", "id": 1, "page_no": 11, "cluster": {"id": 1, "label": "text", "bbox": {"l": 136.8, "t": 354.52872, "r": 547.23474, "b": 435.74060000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9864333868026733, "cells": [{"id": 6, "text": "The VERIFY_GROUP_FOR_USER function was added in IBM i 7.2. Although it is primarily ", "bbox": {"l": 136.8, "t": 354.52872, "r": 542.83539, "b": 363.7417, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "intended for use with RCAC permissions and masks, it can be used in other SQL statements. ", "bbox": {"l": 136.8, "t": 366.52853, "r": 547.14783, "b": 375.74152, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "The first parameter must be one of these three special registers: SESSION_USER, USER, or ", "bbox": {"l": 136.8, "t": 378.52835, "r": 547.15106, "b": 387.74132999999995, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "CURRENT_USER. The second and subsequent parameters are a list of user or group ", "bbox": {"l": 136.80002, "t": 390.52817, "r": 520.62958, "b": 399.74115000000006, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "profiles. Each of these values must be 1 - 10 characters in length. These values are not ", "bbox": {"l": 136.80002, "t": 402.52798, "r": 524.88824, "b": 411.74097, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "validated for their existence, which means that you can specify the names of user profiles that ", "bbox": {"l": 136.80002, "t": 414.5278, "r": 547.23474, "b": 423.7407799999999, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "do not exist without receiving any kind of error.", "bbox": {"l": 136.80002, "t": 426.52762, "r": 342.04672, "b": 435.74060000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The VERIFY_GROUP_FOR_USER function was added in IBM i 7.2. Although it is primarily intended for use with RCAC permissions and masks, it can be used in other SQL statements. The first parameter must be one of these three special registers: SESSION_USER, USER, or CURRENT_USER. The second and subsequent parameters are a list of user or group profiles. Each of these values must be 1 - 10 characters in length. These values are not validated for their existence, which means that you can specify the names of user profiles that do not exist without receiving any kind of error."}, {"label": "text", "id": 2, "page_no": 11, "cluster": {"id": 2, "label": "text", "bbox": {"l": 136.80002, "t": 448.48743, "r": 547.25739, "b": 481.70004, "coord_origin": "TOPLEFT"}, "confidence": 0.9807308912277222, "cells": [{"id": 13, "text": "If a special register value is in the list of user profiles or it is a member of a group profile ", "bbox": {"l": 136.80002, "t": 448.48743, "r": 525.1474, "b": 457.70041, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "included in the list, the function returns a long integer value of 1. Otherwise, it returns a value ", "bbox": {"l": 136.80002, "t": 460.48724, "r": 547.25739, "b": 469.70023, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "of 0. It never returns the null value.", "bbox": {"l": 136.80002, "t": 472.48706, "r": 289.84335, "b": 481.70004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "If a special register value is in the list of user profiles or it is a member of a group profile included in the list, the function returns a long integer value of 1. Otherwise, it returns a value of 0. It never returns the null value."}, {"label": "text", "id": 8, "page_no": 11, "cluster": {"id": 8, "label": "text", "bbox": {"l": 136.80002, "t": 494.50662, "r": 458.44525000000004, "b": 503.7196, "coord_origin": "TOPLEFT"}, "confidence": 0.9237529635429382, "cells": [{"id": 16, "text": "Here is an example of using the VERIFY_GROUP_FOR_USER function:", "bbox": {"l": 136.80002, "t": 494.50662, "r": 458.44525000000004, "b": 503.7196, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Here is an example of using the VERIFY_GROUP_FOR_USER function:"}, {"label": "list_item", "id": 7, "page_no": 11, "cluster": {"id": 7, "label": "list_item", "bbox": {"l": 136.80002, "t": 511.5462, "r": 406.07751, "b": 520.75919, "coord_origin": "TOPLEFT"}, "confidence": 0.9338629841804504, "cells": [{"id": 17, "text": "1.", "bbox": {"l": 136.80002, "t": 511.5462, "r": 145.09804, "b": 520.75919, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "There are user profiles for MGR, JANE, JUDY, and TONY.", "bbox": {"l": 147.86403, "t": 511.5462, "r": 406.07751, "b": 520.75919, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1. There are user profiles for MGR, JANE, JUDY, and TONY."}, {"label": "list_item", "id": 4, "page_no": 11, "cluster": {"id": 4, "label": "list_item", "bbox": {"l": 136.80002, "t": 528.5260000000001, "r": 396.98816, "b": 537.739, "coord_origin": "TOPLEFT"}, "confidence": 0.9514460563659668, "cells": [{"id": 19, "text": "2.", "bbox": {"l": 136.80002, "t": 528.5260000000001, "r": 145.23297, "b": 537.739, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "The user profile JANE specifies a group profile of MGR.", "bbox": {"l": 148.04396, "t": 528.5260000000001, "r": 396.98816, "b": 537.739, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2. The user profile JANE specifies a group profile of MGR."}, {"label": "list_item", "id": 5, "page_no": 11, "cluster": {"id": 5, "label": "list_item", "bbox": {"l": 136.80002, "t": 545.50581, "r": 536.5686, "b": 566.71861, "coord_origin": "TOPLEFT"}, "confidence": 0.951230525970459, "cells": [{"id": 21, "text": "3.", "bbox": {"l": 136.80002, "t": 545.50581, "r": 145.18951, "b": 554.71881, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "If a user is connected to the server using user profile JANE, all of the following function ", "bbox": {"l": 147.98601, "t": 545.50581, "r": 536.5686, "b": 554.71881, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "invocations return a value of 1:", "bbox": {"l": 151.20018, "t": 557.50562, "r": 286.84641, "b": 566.71861, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3. If a user is connected to the server using user profile JANE, all of the following function invocations return a value of 1:"}, {"label": "code", "id": 12, "page_no": 11, "cluster": {"id": 12, "label": "code", "bbox": {"l": 151.20018, "t": 574.69458, "r": 451.01605, "b": 641.4285600000001, "coord_origin": "TOPLEFT"}, "confidence": 0.7066455483436584, "cells": [{"id": 24, "text": "VERIFY_GROUP_FOR_USER (CURRENT_USER, 'MGR')", "bbox": {"l": 151.20018, "t": 574.69458, "r": 366.05725, "b": 583.46933, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "VERIFY_GROUP_FOR_USER (CURRENT_USER, 'JANE', 'MGR')", "bbox": {"l": 151.20018, "t": 586.69438, "r": 406.01678, "b": 595.46913, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "VERIFY_GROUP_FOR_USER (CURRENT_USER, 'JANE', 'MGR', 'STEVE')", "bbox": {"l": 151.20018, "t": 598.69418, "r": 451.01605, "b": 607.46893, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "The following function invocation returns a value of 0:", "bbox": {"l": 151.20018, "t": 615.5246, "r": 385.87271, "b": 624.73759, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "VERIFY_GROUP_FOR_USER (CURRENT_USER, 'JUDY', 'TONY')", "bbox": {"l": 151.20018, "t": 632.65381, "r": 411.05655, "b": 641.4285600000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "VERIFY_GROUP_FOR_USER (CURRENT_USER, 'MGR') VERIFY_GROUP_FOR_USER (CURRENT_USER, 'JANE', 'MGR') VERIFY_GROUP_FOR_USER (CURRENT_USER, 'JANE', 'MGR', 'STEVE') The following function invocation returns a value of 0: VERIFY_GROUP_FOR_USER (CURRENT_USER, 'JUDY', 'TONY')"}, {"label": "table", "id": 0, "page_no": 11, "cluster": {"id": 0, "label": "table", "bbox": {"l": 63.55636978149414, "t": 104.23387145996094, "r": 548.5687255859375, "b": 296.22467041015625, "coord_origin": "TOPLEFT"}, "confidence": 0.9868634939193726, "cells": [{"id": 29, "text": "Global variable", "bbox": {"l": 70.800003, "t": 110.53801999999985, "r": 134.99071, "b": 118.86298, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Type", "bbox": {"l": 202.8894, "t": 110.53801999999985, "r": 223.34641, "b": 118.86298, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Description", "bbox": {"l": 281.8248, "t": 110.53801999999985, "r": 331.3428, "b": 118.86298, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "CLIENT_HOST", "bbox": {"l": 70.800003, "t": 129.49834999999996, "r": 132.7209, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "VARCHAR(255)", "bbox": {"l": 202.89029, "t": 129.49834999999996, "r": 267.07651, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Host name of the current client as returned by the system", "bbox": {"l": 281.84732, "t": 129.49834999999996, "r": 510.17548, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "CLIENT_IPADDR", "bbox": {"l": 70.800018, "t": 148.51806999999997, "r": 140.66522, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "VARCHAR(128)", "bbox": {"l": 202.87231, "t": 148.51806999999997, "r": 267.07739, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "IP address of the current client as returned by the system", "bbox": {"l": 281.84549, "t": 148.51806999999997, "r": 509.60583, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "CLIENT_PORT ", "bbox": {"l": 70.800018, "t": 167.53778, "r": 134.98264, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "INTEGER", "bbox": {"l": 202.90294, "t": 167.53778, "r": 242.80084, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "Port used by the current client to communicate with the server", "bbox": {"l": 281.79785, "t": 167.53778, "r": 527.59222, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "PACKAGE_NAME", "bbox": {"l": 70.800018, "t": 186.5575, "r": 143.50925, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "VARCHAR(128)", "bbox": {"l": 202.80576, "t": 186.5575, "r": 267.06937, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Name of the currently running package", "bbox": {"l": 281.85187, "t": 186.5575, "r": 436.57259999999997, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "PACKAGE_SCHEMA", "bbox": {"l": 70.800018, "t": 205.51782000000003, "r": 156.01654, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "VARCHAR(128)", "bbox": {"l": 202.83545, "t": 205.51782000000003, "r": 267.08646, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "Schema name of the currently running package", "bbox": {"l": 281.87076, "t": 205.51782000000003, "r": 470.44678, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "PACKAGE_VERSION", "bbox": {"l": 70.800018, "t": 224.53754000000004, "r": 157.89932, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "VARCHAR(64)", "bbox": {"l": 202.72472, "t": 224.53754000000004, "r": 261.98254, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "Version identifier of the currently running package", "bbox": {"l": 281.74924, "t": 224.53754000000004, "r": 478.8438100000001, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "ROUTINE_SCHEMA", "bbox": {"l": 70.800018, "t": 243.55724999999995, "r": 154.41992, "b": 251.8822, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "VARCHAR(128)", "bbox": {"l": 202.79312, "t": 243.55724999999995, "r": 267.09274, "b": 251.8822, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Schema name of the currently running routine", "bbox": {"l": 281.87164, "t": 243.55724999999995, "r": 464.26022, "b": 251.8822, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "ROUTINE_SPECIFIC_NAME", "bbox": {"l": 70.800018, "t": 262.51757999999995, "r": 188.43991, "b": 270.84253, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "VARCHAR(128)", "bbox": {"l": 202.84441, "t": 262.51757999999995, "r": 267.03693, "b": 270.84253, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "Name of the currently running routine", "bbox": {"l": 281.80682, "t": 262.51757999999995, "r": 430.40045, "b": 270.84253, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "ROUTINE_TYPE", "bbox": {"l": 70.800034, "t": 281.53726, "r": 139.43135, "b": 289.86227, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "CHAR(1)", "bbox": {"l": 202.74635, "t": 281.53726, "r": 239.28996000000004, "b": 289.86227, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Type of the currently running routine", "bbox": {"l": 281.79065, "t": 281.53726, "r": 425.09131, "b": 289.86227, "coord_origin": "TOPLEFT"}}], "children": [{"id": 14, "label": "text", "bbox": {"l": 70.800003, "t": 110.53801999999985, "r": 134.99071, "b": 118.86298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "Global variable", "bbox": {"l": 70.800003, "t": 110.53801999999985, "r": 134.99071, "b": 118.86298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 202.8894, "t": 110.53801999999985, "r": 223.34641, "b": 118.86298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "Type", "bbox": {"l": 202.8894, "t": 110.53801999999985, "r": 223.34641, "b": 118.86298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 281.8248, "t": 110.53801999999985, "r": 331.3428, "b": 118.86298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "Description", "bbox": {"l": 281.8248, "t": 110.53801999999985, "r": 331.3428, "b": 118.86298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 70.800003, "t": 129.49834999999996, "r": 132.7209, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "CLIENT_HOST", "bbox": {"l": 70.800003, "t": 129.49834999999996, "r": 132.7209, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 202.89029, "t": 129.49834999999996, "r": 267.07651, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "VARCHAR(255)", "bbox": {"l": 202.89029, "t": 129.49834999999996, "r": 267.07651, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 281.84732, "t": 129.49834999999996, "r": 510.17548, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "Host name of the current client as returned by the system", "bbox": {"l": 281.84732, "t": 129.49834999999996, "r": 510.17548, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 70.800018, "t": 148.51806999999997, "r": 140.66522, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "CLIENT_IPADDR", "bbox": {"l": 70.800018, "t": 148.51806999999997, "r": 140.66522, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 202.87231, "t": 148.51806999999997, "r": 267.07739, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "VARCHAR(128)", "bbox": {"l": 202.87231, "t": 148.51806999999997, "r": 267.07739, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 281.84549, "t": 148.51806999999997, "r": 509.60583, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "IP address of the current client as returned by the system", "bbox": {"l": 281.84549, "t": 148.51806999999997, "r": 509.60583, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 70.800018, "t": 167.53778, "r": 134.98264, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "CLIENT_PORT ", "bbox": {"l": 70.800018, "t": 167.53778, "r": 134.98264, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 202.90294, "t": 167.53778, "r": 242.80084, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "INTEGER", "bbox": {"l": 202.90294, "t": 167.53778, "r": 242.80084, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 281.79785, "t": 167.53778, "r": 527.59222, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "Port used by the current client to communicate with the server", "bbox": {"l": 281.79785, "t": 167.53778, "r": 527.59222, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 70.800018, "t": 186.5575, "r": 143.50925, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "PACKAGE_NAME", "bbox": {"l": 70.800018, "t": 186.5575, "r": 143.50925, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 202.80576, "t": 186.5575, "r": 267.06937, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "VARCHAR(128)", "bbox": {"l": 202.80576, "t": 186.5575, "r": 267.06937, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 281.85187, "t": 186.5575, "r": 436.57259999999997, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "Name of the currently running package", "bbox": {"l": 281.85187, "t": 186.5575, "r": 436.57259999999997, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 70.800018, "t": 205.51782000000003, "r": 156.01654, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "PACKAGE_SCHEMA", "bbox": {"l": 70.800018, "t": 205.51782000000003, "r": 156.01654, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 202.83545, "t": 205.51782000000003, "r": 267.08646, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "VARCHAR(128)", "bbox": {"l": 202.83545, "t": 205.51782000000003, "r": 267.08646, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 281.87076, "t": 205.51782000000003, "r": 470.44678, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "Schema name of the currently running package", "bbox": {"l": 281.87076, "t": 205.51782000000003, "r": 470.44678, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 70.800018, "t": 224.53754000000004, "r": 157.89932, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "PACKAGE_VERSION", "bbox": {"l": 70.800018, "t": 224.53754000000004, "r": 157.89932, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 202.72472, "t": 224.53754000000004, "r": 261.98254, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "VARCHAR(64)", "bbox": {"l": 202.72472, "t": 224.53754000000004, "r": 261.98254, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 281.74924, "t": 224.53754000000004, "r": 478.8438100000001, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "Version identifier of the currently running package", "bbox": {"l": 281.74924, "t": 224.53754000000004, "r": 478.8438100000001, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 70.800018, "t": 243.55724999999995, "r": 154.41992, "b": 251.8822, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "ROUTINE_SCHEMA", "bbox": {"l": 70.800018, "t": 243.55724999999995, "r": 154.41992, "b": 251.8822, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 202.79312, "t": 243.55724999999995, "r": 267.09274, "b": 251.8822, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "VARCHAR(128)", "bbox": {"l": 202.79312, "t": 243.55724999999995, "r": 267.09274, "b": 251.8822, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 281.87164, "t": 243.55724999999995, "r": 464.26022, "b": 251.8822, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "Schema name of the currently running routine", "bbox": {"l": 281.87164, "t": 243.55724999999995, "r": 464.26022, "b": 251.8822, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 70.800018, "t": 262.51757999999995, "r": 188.43991, "b": 270.84253, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "ROUTINE_SPECIFIC_NAME", "bbox": {"l": 70.800018, "t": 262.51757999999995, "r": 188.43991, "b": 270.84253, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 202.84441, "t": 262.51757999999995, "r": 267.03693, "b": 270.84253, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "VARCHAR(128)", "bbox": {"l": 202.84441, "t": 262.51757999999995, "r": 267.03693, "b": 270.84253, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 281.80682, "t": 262.51757999999995, "r": 430.40045, "b": 270.84253, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "Name of the currently running routine", "bbox": {"l": 281.80682, "t": 262.51757999999995, "r": 430.40045, "b": 270.84253, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 70.800034, "t": 281.53726, "r": 139.43135, "b": 289.86227, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "ROUTINE_TYPE", "bbox": {"l": 70.800034, "t": 281.53726, "r": 139.43135, "b": 289.86227, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 202.74635, "t": 281.53726, "r": 239.28996000000004, "b": 289.86227, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "CHAR(1)", "bbox": {"l": 202.74635, "t": 281.53726, "r": 239.28996000000004, "b": 289.86227, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 281.79065, "t": 281.53726, "r": 425.09131, "b": 289.86227, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "Type of the currently running routine", "bbox": {"l": 281.79065, "t": 281.53726, "r": 425.09131, "b": 289.86227, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl"], "num_rows": 10, "num_cols": 3, "table_cells": [{"bbox": {"l": 70.800003, "t": 110.53801999999985, "r": 134.99071, "b": 118.86298, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Global variable", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 202.8894, "t": 110.53801999999985, "r": 223.34641, "b": 118.86298, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Type", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 281.8248, "t": 110.53801999999985, "r": 331.3428, "b": 118.86298, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Description", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800003, "t": 129.49834999999996, "r": 132.7209, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "CLIENT_HOST", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.89029, "t": 129.49834999999996, "r": 267.07651, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(255)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.84732, "t": 129.49834999999996, "r": 510.17548, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Host name of the current client as returned by the system", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800018, "t": 148.51806999999997, "r": 140.66522, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "CLIENT_IPADDR", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.87231, "t": 148.51806999999997, "r": 267.07739, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(128)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.84549, "t": 148.51806999999997, "r": 509.60583, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "IP address of the current client as returned by the system", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800018, "t": 167.53778, "r": 134.98264, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "CLIENT_PORT", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.90294, "t": 167.53778, "r": 242.80084, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "INTEGER", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.79785, "t": 167.53778, "r": 527.59222, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Port used by the current client to communicate with the server", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800018, "t": 186.5575, "r": 143.50925, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PACKAGE_NAME", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.80576, "t": 186.5575, "r": 267.06937, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(128)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.85187, "t": 186.5575, "r": 436.57259999999997, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Name of the currently running package", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800018, "t": 205.51782000000003, "r": 156.01654, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PACKAGE_SCHEMA", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.83545, "t": 205.51782000000003, "r": 267.08646, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(128)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.87076, "t": 205.51782000000003, "r": 470.44678, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Schema name of the currently running package", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800018, "t": 224.53754000000004, "r": 157.89932, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PACKAGE_VERSION", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.72472, "t": 224.53754000000004, "r": 261.98254, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(64)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.74924, "t": 224.53754000000004, "r": 478.8438100000001, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Version identifier of the currently running package", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800018, "t": 243.55724999999995, "r": 154.41992, "b": 251.8822, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "ROUTINE_SCHEMA", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.79312, "t": 243.55724999999995, "r": 267.09274, "b": 251.8822, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(128)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.87164, "t": 243.55724999999995, "r": 464.26022, "b": 251.8822, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Schema name of the currently running routine", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800018, "t": 262.51757999999995, "r": 188.43991, "b": 270.84253, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "ROUTINE_SPECIFIC_NAME", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.84441, "t": 262.51757999999995, "r": 267.03693, "b": 270.84253, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(128)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.80682, "t": 262.51757999999995, "r": 430.40045, "b": 270.84253, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Name of the currently running routine", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800034, "t": 281.53726, "r": 139.43135, "b": 289.86227, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "ROUTINE_TYPE", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.74635, "t": 281.53726, "r": 239.28996000000004, "b": 289.86227, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "CHAR(1)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.79065, "t": 281.53726, "r": 425.09131, "b": 289.86227, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Type of the currently running routine", "column_header": false, "row_header": false, "row_section": false}]}], "body": [{"label": "text", "id": 11, "page_no": 11, "cluster": {"id": 11, "label": "text", "bbox": {"l": 136.8, "t": 71.50867000000005, "r": 342.54773, "b": 80.72167999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.8370978832244873, "cells": [{"id": 2, "text": "Table 3-2 lists the nine built-in global variables.", "bbox": {"l": 136.8, "t": 71.50867000000005, "r": 342.54773, "b": 80.72167999999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 3-2 lists the nine built-in global variables."}, {"label": "caption", "id": 10, "page_no": 11, "cluster": {"id": 10, "label": "caption", "bbox": {"l": 64.800003, "t": 93.49805000000003, "r": 201.18147, "b": 101.82299999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.913235604763031, "cells": [{"id": 3, "text": "Table 3-2 Built-in global variables", "bbox": {"l": 64.800003, "t": 93.49805000000003, "r": 201.18147, "b": 101.82299999999998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 3-2 Built-in global variables"}, {"label": "section_header", "id": 3, "page_no": 11, "cluster": {"id": 3, "label": "section_header", "bbox": {"l": 64.800003, "t": 322.20071, "r": 384.36389, "b": 336.96371000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9645338654518127, "cells": [{"id": 4, "text": "3.3", "bbox": {"l": 64.800003, "t": 322.20071, "r": 87.318192, "b": 336.96371000000005, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "VERIFY_GROUP_FOR_USER function", "bbox": {"l": 91.821815, "t": 322.20071, "r": 384.36389, "b": 336.96371000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3.3 VERIFY_GROUP_FOR_USER function"}, {"label": "text", "id": 1, "page_no": 11, "cluster": {"id": 1, "label": "text", "bbox": {"l": 136.8, "t": 354.52872, "r": 547.23474, "b": 435.74060000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9864333868026733, "cells": [{"id": 6, "text": "The VERIFY_GROUP_FOR_USER function was added in IBM i 7.2. Although it is primarily ", "bbox": {"l": 136.8, "t": 354.52872, "r": 542.83539, "b": 363.7417, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "intended for use with RCAC permissions and masks, it can be used in other SQL statements. ", "bbox": {"l": 136.8, "t": 366.52853, "r": 547.14783, "b": 375.74152, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "The first parameter must be one of these three special registers: SESSION_USER, USER, or ", "bbox": {"l": 136.8, "t": 378.52835, "r": 547.15106, "b": 387.74132999999995, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "CURRENT_USER. The second and subsequent parameters are a list of user or group ", "bbox": {"l": 136.80002, "t": 390.52817, "r": 520.62958, "b": 399.74115000000006, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "profiles. Each of these values must be 1 - 10 characters in length. These values are not ", "bbox": {"l": 136.80002, "t": 402.52798, "r": 524.88824, "b": 411.74097, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "validated for their existence, which means that you can specify the names of user profiles that ", "bbox": {"l": 136.80002, "t": 414.5278, "r": 547.23474, "b": 423.7407799999999, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "do not exist without receiving any kind of error.", "bbox": {"l": 136.80002, "t": 426.52762, "r": 342.04672, "b": 435.74060000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The VERIFY_GROUP_FOR_USER function was added in IBM i 7.2. Although it is primarily intended for use with RCAC permissions and masks, it can be used in other SQL statements. The first parameter must be one of these three special registers: SESSION_USER, USER, or CURRENT_USER. The second and subsequent parameters are a list of user or group profiles. Each of these values must be 1 - 10 characters in length. These values are not validated for their existence, which means that you can specify the names of user profiles that do not exist without receiving any kind of error."}, {"label": "text", "id": 2, "page_no": 11, "cluster": {"id": 2, "label": "text", "bbox": {"l": 136.80002, "t": 448.48743, "r": 547.25739, "b": 481.70004, "coord_origin": "TOPLEFT"}, "confidence": 0.9807308912277222, "cells": [{"id": 13, "text": "If a special register value is in the list of user profiles or it is a member of a group profile ", "bbox": {"l": 136.80002, "t": 448.48743, "r": 525.1474, "b": 457.70041, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "included in the list, the function returns a long integer value of 1. Otherwise, it returns a value ", "bbox": {"l": 136.80002, "t": 460.48724, "r": 547.25739, "b": 469.70023, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "of 0. It never returns the null value.", "bbox": {"l": 136.80002, "t": 472.48706, "r": 289.84335, "b": 481.70004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "If a special register value is in the list of user profiles or it is a member of a group profile included in the list, the function returns a long integer value of 1. Otherwise, it returns a value of 0. It never returns the null value."}, {"label": "text", "id": 8, "page_no": 11, "cluster": {"id": 8, "label": "text", "bbox": {"l": 136.80002, "t": 494.50662, "r": 458.44525000000004, "b": 503.7196, "coord_origin": "TOPLEFT"}, "confidence": 0.9237529635429382, "cells": [{"id": 16, "text": "Here is an example of using the VERIFY_GROUP_FOR_USER function:", "bbox": {"l": 136.80002, "t": 494.50662, "r": 458.44525000000004, "b": 503.7196, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Here is an example of using the VERIFY_GROUP_FOR_USER function:"}, {"label": "list_item", "id": 7, "page_no": 11, "cluster": {"id": 7, "label": "list_item", "bbox": {"l": 136.80002, "t": 511.5462, "r": 406.07751, "b": 520.75919, "coord_origin": "TOPLEFT"}, "confidence": 0.9338629841804504, "cells": [{"id": 17, "text": "1.", "bbox": {"l": 136.80002, "t": 511.5462, "r": 145.09804, "b": 520.75919, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "There are user profiles for MGR, JANE, JUDY, and TONY.", "bbox": {"l": 147.86403, "t": 511.5462, "r": 406.07751, "b": 520.75919, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1. There are user profiles for MGR, JANE, JUDY, and TONY."}, {"label": "list_item", "id": 4, "page_no": 11, "cluster": {"id": 4, "label": "list_item", "bbox": {"l": 136.80002, "t": 528.5260000000001, "r": 396.98816, "b": 537.739, "coord_origin": "TOPLEFT"}, "confidence": 0.9514460563659668, "cells": [{"id": 19, "text": "2.", "bbox": {"l": 136.80002, "t": 528.5260000000001, "r": 145.23297, "b": 537.739, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "The user profile JANE specifies a group profile of MGR.", "bbox": {"l": 148.04396, "t": 528.5260000000001, "r": 396.98816, "b": 537.739, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2. The user profile JANE specifies a group profile of MGR."}, {"label": "list_item", "id": 5, "page_no": 11, "cluster": {"id": 5, "label": "list_item", "bbox": {"l": 136.80002, "t": 545.50581, "r": 536.5686, "b": 566.71861, "coord_origin": "TOPLEFT"}, "confidence": 0.951230525970459, "cells": [{"id": 21, "text": "3.", "bbox": {"l": 136.80002, "t": 545.50581, "r": 145.18951, "b": 554.71881, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "If a user is connected to the server using user profile JANE, all of the following function ", "bbox": {"l": 147.98601, "t": 545.50581, "r": 536.5686, "b": 554.71881, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "invocations return a value of 1:", "bbox": {"l": 151.20018, "t": 557.50562, "r": 286.84641, "b": 566.71861, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3. If a user is connected to the server using user profile JANE, all of the following function invocations return a value of 1:"}, {"label": "code", "id": 12, "page_no": 11, "cluster": {"id": 12, "label": "code", "bbox": {"l": 151.20018, "t": 574.69458, "r": 451.01605, "b": 641.4285600000001, "coord_origin": "TOPLEFT"}, "confidence": 0.7066455483436584, "cells": [{"id": 24, "text": "VERIFY_GROUP_FOR_USER (CURRENT_USER, 'MGR')", "bbox": {"l": 151.20018, "t": 574.69458, "r": 366.05725, "b": 583.46933, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "VERIFY_GROUP_FOR_USER (CURRENT_USER, 'JANE', 'MGR')", "bbox": {"l": 151.20018, "t": 586.69438, "r": 406.01678, "b": 595.46913, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "VERIFY_GROUP_FOR_USER (CURRENT_USER, 'JANE', 'MGR', 'STEVE')", "bbox": {"l": 151.20018, "t": 598.69418, "r": 451.01605, "b": 607.46893, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "The following function invocation returns a value of 0:", "bbox": {"l": 151.20018, "t": 615.5246, "r": 385.87271, "b": 624.73759, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "VERIFY_GROUP_FOR_USER (CURRENT_USER, 'JUDY', 'TONY')", "bbox": {"l": 151.20018, "t": 632.65381, "r": 411.05655, "b": 641.4285600000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "VERIFY_GROUP_FOR_USER (CURRENT_USER, 'MGR') VERIFY_GROUP_FOR_USER (CURRENT_USER, 'JANE', 'MGR') VERIFY_GROUP_FOR_USER (CURRENT_USER, 'JANE', 'MGR', 'STEVE') The following function invocation returns a value of 0: VERIFY_GROUP_FOR_USER (CURRENT_USER, 'JUDY', 'TONY')"}, {"label": "table", "id": 0, "page_no": 11, "cluster": {"id": 0, "label": "table", "bbox": {"l": 63.55636978149414, "t": 104.23387145996094, "r": 548.5687255859375, "b": 296.22467041015625, "coord_origin": "TOPLEFT"}, "confidence": 0.9868634939193726, "cells": [{"id": 29, "text": "Global variable", "bbox": {"l": 70.800003, "t": 110.53801999999985, "r": 134.99071, "b": 118.86298, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Type", "bbox": {"l": 202.8894, "t": 110.53801999999985, "r": 223.34641, "b": 118.86298, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Description", "bbox": {"l": 281.8248, "t": 110.53801999999985, "r": 331.3428, "b": 118.86298, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "CLIENT_HOST", "bbox": {"l": 70.800003, "t": 129.49834999999996, "r": 132.7209, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "VARCHAR(255)", "bbox": {"l": 202.89029, "t": 129.49834999999996, "r": 267.07651, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Host name of the current client as returned by the system", "bbox": {"l": 281.84732, "t": 129.49834999999996, "r": 510.17548, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "CLIENT_IPADDR", "bbox": {"l": 70.800018, "t": 148.51806999999997, "r": 140.66522, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "VARCHAR(128)", "bbox": {"l": 202.87231, "t": 148.51806999999997, "r": 267.07739, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "IP address of the current client as returned by the system", "bbox": {"l": 281.84549, "t": 148.51806999999997, "r": 509.60583, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "CLIENT_PORT ", "bbox": {"l": 70.800018, "t": 167.53778, "r": 134.98264, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "INTEGER", "bbox": {"l": 202.90294, "t": 167.53778, "r": 242.80084, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "Port used by the current client to communicate with the server", "bbox": {"l": 281.79785, "t": 167.53778, "r": 527.59222, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "PACKAGE_NAME", "bbox": {"l": 70.800018, "t": 186.5575, "r": 143.50925, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "VARCHAR(128)", "bbox": {"l": 202.80576, "t": 186.5575, "r": 267.06937, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Name of the currently running package", "bbox": {"l": 281.85187, "t": 186.5575, "r": 436.57259999999997, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "PACKAGE_SCHEMA", "bbox": {"l": 70.800018, "t": 205.51782000000003, "r": 156.01654, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "VARCHAR(128)", "bbox": {"l": 202.83545, "t": 205.51782000000003, "r": 267.08646, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "Schema name of the currently running package", "bbox": {"l": 281.87076, "t": 205.51782000000003, "r": 470.44678, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "PACKAGE_VERSION", "bbox": {"l": 70.800018, "t": 224.53754000000004, "r": 157.89932, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "VARCHAR(64)", "bbox": {"l": 202.72472, "t": 224.53754000000004, "r": 261.98254, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "Version identifier of the currently running package", "bbox": {"l": 281.74924, "t": 224.53754000000004, "r": 478.8438100000001, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "ROUTINE_SCHEMA", "bbox": {"l": 70.800018, "t": 243.55724999999995, "r": 154.41992, "b": 251.8822, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "VARCHAR(128)", "bbox": {"l": 202.79312, "t": 243.55724999999995, "r": 267.09274, "b": 251.8822, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Schema name of the currently running routine", "bbox": {"l": 281.87164, "t": 243.55724999999995, "r": 464.26022, "b": 251.8822, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "ROUTINE_SPECIFIC_NAME", "bbox": {"l": 70.800018, "t": 262.51757999999995, "r": 188.43991, "b": 270.84253, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "VARCHAR(128)", "bbox": {"l": 202.84441, "t": 262.51757999999995, "r": 267.03693, "b": 270.84253, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "Name of the currently running routine", "bbox": {"l": 281.80682, "t": 262.51757999999995, "r": 430.40045, "b": 270.84253, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "ROUTINE_TYPE", "bbox": {"l": 70.800034, "t": 281.53726, "r": 139.43135, "b": 289.86227, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "CHAR(1)", "bbox": {"l": 202.74635, "t": 281.53726, "r": 239.28996000000004, "b": 289.86227, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Type of the currently running routine", "bbox": {"l": 281.79065, "t": 281.53726, "r": 425.09131, "b": 289.86227, "coord_origin": "TOPLEFT"}}], "children": [{"id": 14, "label": "text", "bbox": {"l": 70.800003, "t": 110.53801999999985, "r": 134.99071, "b": 118.86298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "Global variable", "bbox": {"l": 70.800003, "t": 110.53801999999985, "r": 134.99071, "b": 118.86298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 202.8894, "t": 110.53801999999985, "r": 223.34641, "b": 118.86298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "Type", "bbox": {"l": 202.8894, "t": 110.53801999999985, "r": 223.34641, "b": 118.86298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 281.8248, "t": 110.53801999999985, "r": 331.3428, "b": 118.86298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "Description", "bbox": {"l": 281.8248, "t": 110.53801999999985, "r": 331.3428, "b": 118.86298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 70.800003, "t": 129.49834999999996, "r": 132.7209, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "CLIENT_HOST", "bbox": {"l": 70.800003, "t": 129.49834999999996, "r": 132.7209, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 202.89029, "t": 129.49834999999996, "r": 267.07651, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "VARCHAR(255)", "bbox": {"l": 202.89029, "t": 129.49834999999996, "r": 267.07651, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 281.84732, "t": 129.49834999999996, "r": 510.17548, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "Host name of the current client as returned by the system", "bbox": {"l": 281.84732, "t": 129.49834999999996, "r": 510.17548, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 70.800018, "t": 148.51806999999997, "r": 140.66522, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "CLIENT_IPADDR", "bbox": {"l": 70.800018, "t": 148.51806999999997, "r": 140.66522, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 202.87231, "t": 148.51806999999997, "r": 267.07739, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "VARCHAR(128)", "bbox": {"l": 202.87231, "t": 148.51806999999997, "r": 267.07739, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 281.84549, "t": 148.51806999999997, "r": 509.60583, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "IP address of the current client as returned by the system", "bbox": {"l": 281.84549, "t": 148.51806999999997, "r": 509.60583, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 70.800018, "t": 167.53778, "r": 134.98264, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "CLIENT_PORT ", "bbox": {"l": 70.800018, "t": 167.53778, "r": 134.98264, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 202.90294, "t": 167.53778, "r": 242.80084, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "INTEGER", "bbox": {"l": 202.90294, "t": 167.53778, "r": 242.80084, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 281.79785, "t": 167.53778, "r": 527.59222, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "Port used by the current client to communicate with the server", "bbox": {"l": 281.79785, "t": 167.53778, "r": 527.59222, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 70.800018, "t": 186.5575, "r": 143.50925, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "PACKAGE_NAME", "bbox": {"l": 70.800018, "t": 186.5575, "r": 143.50925, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 202.80576, "t": 186.5575, "r": 267.06937, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "VARCHAR(128)", "bbox": {"l": 202.80576, "t": 186.5575, "r": 267.06937, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 281.85187, "t": 186.5575, "r": 436.57259999999997, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "Name of the currently running package", "bbox": {"l": 281.85187, "t": 186.5575, "r": 436.57259999999997, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 70.800018, "t": 205.51782000000003, "r": 156.01654, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "PACKAGE_SCHEMA", "bbox": {"l": 70.800018, "t": 205.51782000000003, "r": 156.01654, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 202.83545, "t": 205.51782000000003, "r": 267.08646, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "VARCHAR(128)", "bbox": {"l": 202.83545, "t": 205.51782000000003, "r": 267.08646, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 281.87076, "t": 205.51782000000003, "r": 470.44678, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "Schema name of the currently running package", "bbox": {"l": 281.87076, "t": 205.51782000000003, "r": 470.44678, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 70.800018, "t": 224.53754000000004, "r": 157.89932, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "PACKAGE_VERSION", "bbox": {"l": 70.800018, "t": 224.53754000000004, "r": 157.89932, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 202.72472, "t": 224.53754000000004, "r": 261.98254, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "VARCHAR(64)", "bbox": {"l": 202.72472, "t": 224.53754000000004, "r": 261.98254, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 281.74924, "t": 224.53754000000004, "r": 478.8438100000001, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "Version identifier of the currently running package", "bbox": {"l": 281.74924, "t": 224.53754000000004, "r": 478.8438100000001, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 70.800018, "t": 243.55724999999995, "r": 154.41992, "b": 251.8822, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "ROUTINE_SCHEMA", "bbox": {"l": 70.800018, "t": 243.55724999999995, "r": 154.41992, "b": 251.8822, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 202.79312, "t": 243.55724999999995, "r": 267.09274, "b": 251.8822, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "VARCHAR(128)", "bbox": {"l": 202.79312, "t": 243.55724999999995, "r": 267.09274, "b": 251.8822, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 281.87164, "t": 243.55724999999995, "r": 464.26022, "b": 251.8822, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "Schema name of the currently running routine", "bbox": {"l": 281.87164, "t": 243.55724999999995, "r": 464.26022, "b": 251.8822, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 70.800018, "t": 262.51757999999995, "r": 188.43991, "b": 270.84253, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "ROUTINE_SPECIFIC_NAME", "bbox": {"l": 70.800018, "t": 262.51757999999995, "r": 188.43991, "b": 270.84253, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 202.84441, "t": 262.51757999999995, "r": 267.03693, "b": 270.84253, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "VARCHAR(128)", "bbox": {"l": 202.84441, "t": 262.51757999999995, "r": 267.03693, "b": 270.84253, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 281.80682, "t": 262.51757999999995, "r": 430.40045, "b": 270.84253, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "Name of the currently running routine", "bbox": {"l": 281.80682, "t": 262.51757999999995, "r": 430.40045, "b": 270.84253, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 70.800034, "t": 281.53726, "r": 139.43135, "b": 289.86227, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "ROUTINE_TYPE", "bbox": {"l": 70.800034, "t": 281.53726, "r": 139.43135, "b": 289.86227, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 202.74635, "t": 281.53726, "r": 239.28996000000004, "b": 289.86227, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "CHAR(1)", "bbox": {"l": 202.74635, "t": 281.53726, "r": 239.28996000000004, "b": 289.86227, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 281.79065, "t": 281.53726, "r": 425.09131, "b": 289.86227, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "Type of the currently running routine", "bbox": {"l": 281.79065, "t": 281.53726, "r": 425.09131, "b": 289.86227, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl"], "num_rows": 10, "num_cols": 3, "table_cells": [{"bbox": {"l": 70.800003, "t": 110.53801999999985, "r": 134.99071, "b": 118.86298, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Global variable", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 202.8894, "t": 110.53801999999985, "r": 223.34641, "b": 118.86298, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Type", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 281.8248, "t": 110.53801999999985, "r": 331.3428, "b": 118.86298, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Description", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800003, "t": 129.49834999999996, "r": 132.7209, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "CLIENT_HOST", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.89029, "t": 129.49834999999996, "r": 267.07651, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(255)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.84732, "t": 129.49834999999996, "r": 510.17548, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Host name of the current client as returned by the system", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800018, "t": 148.51806999999997, "r": 140.66522, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "CLIENT_IPADDR", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.87231, "t": 148.51806999999997, "r": 267.07739, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(128)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.84549, "t": 148.51806999999997, "r": 509.60583, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "IP address of the current client as returned by the system", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800018, "t": 167.53778, "r": 134.98264, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "CLIENT_PORT", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.90294, "t": 167.53778, "r": 242.80084, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "INTEGER", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.79785, "t": 167.53778, "r": 527.59222, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Port used by the current client to communicate with the server", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800018, "t": 186.5575, "r": 143.50925, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PACKAGE_NAME", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.80576, "t": 186.5575, "r": 267.06937, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(128)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.85187, "t": 186.5575, "r": 436.57259999999997, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Name of the currently running package", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800018, "t": 205.51782000000003, "r": 156.01654, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PACKAGE_SCHEMA", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.83545, "t": 205.51782000000003, "r": 267.08646, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(128)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.87076, "t": 205.51782000000003, "r": 470.44678, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Schema name of the currently running package", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800018, "t": 224.53754000000004, "r": 157.89932, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PACKAGE_VERSION", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.72472, "t": 224.53754000000004, "r": 261.98254, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(64)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.74924, "t": 224.53754000000004, "r": 478.8438100000001, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Version identifier of the currently running package", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800018, "t": 243.55724999999995, "r": 154.41992, "b": 251.8822, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "ROUTINE_SCHEMA", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.79312, "t": 243.55724999999995, "r": 267.09274, "b": 251.8822, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(128)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.87164, "t": 243.55724999999995, "r": 464.26022, "b": 251.8822, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Schema name of the currently running routine", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800018, "t": 262.51757999999995, "r": 188.43991, "b": 270.84253, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "ROUTINE_SPECIFIC_NAME", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.84441, "t": 262.51757999999995, "r": 267.03693, "b": 270.84253, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(128)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.80682, "t": 262.51757999999995, "r": 430.40045, "b": 270.84253, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Name of the currently running routine", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800034, "t": 281.53726, "r": 139.43135, "b": 289.86227, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "ROUTINE_TYPE", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.74635, "t": 281.53726, "r": 239.28996000000004, "b": 289.86227, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "CHAR(1)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.79065, "t": 281.53726, "r": 425.09131, "b": 289.86227, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Type of the currently running routine", "column_header": false, "row_header": false, "row_section": false}]}], "headers": [{"label": "page_footer", "id": 9, "page_no": 11, "cluster": {"id": 9, "label": "page_footer", "bbox": {"l": 64.800003, "t": 754.848721, "r": 78.402, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.9187920093536377, "cells": [{"id": 0, "text": "20 ", "bbox": {"l": 64.800003, "t": 754.848721, "r": 78.402, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "20"}, {"label": "page_footer", "id": 6, "page_no": 11, "cluster": {"id": 6, "label": "page_footer", "bbox": {"l": 93.420303, "t": 755.538002, "r": 334.42142, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9505079388618469, "cells": [{"id": 1, "text": "Row and Column Access Control Support in IBM DB2 for i", "bbox": {"l": 93.420303, "t": 755.538002, "r": 334.42142, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Row and Column Access Control Support in IBM DB2 for i"}]}}, {"page_no": 12, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "Chapter 3. Row and Column Access Control ", "bbox": {"l": 344.94, "t": 755.538002, "r": 523.60162, "b": 763.863001, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "27", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "RETURN", "bbox": {"l": 136.79959, "t": 71.65845000000002, "r": 166.73935, "b": 80.43322999999998, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "CASE", "bbox": {"l": 136.79959, "t": 83.65826000000004, "r": 156.77934, "b": 92.43304, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'HR', 'EMP' ) = 1", "bbox": {"l": 147.26993, "t": 95.65808000000015, "r": 466.61502, "b": 104.43286000000012, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "THEN EMPLOYEES . DATE_OF_BIRTH", "bbox": {"l": 147.73068, "t": 107.65790000000004, "r": 311.69717, "b": 116.43268, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1", "bbox": {"l": 147.31944, "t": 131.65752999999995, "r": 436.61547999999993, "b": 140.43231000000003, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "AND SESSION_USER = EMPLOYEES . USER_ID", "bbox": {"l": 147.54245, "t": 143.65734999999995, "r": 351.65668, "b": 152.43213000000003, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "THEN EMPLOYEES . DATE_OF_BIRTH", "bbox": {"l": 147.73068, "t": 155.65716999999995, "r": 311.69717, "b": 164.43195000000003, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1", "bbox": {"l": 147.31944, "t": 179.65679999999998, "r": 436.61547999999993, "b": 188.43158000000005, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "AND SESSION_USER <> EMPLOYEES . USER_ID", "bbox": {"l": 147.52335, "t": 191.65661999999998, "r": 356.63669, "b": 200.43140000000005, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "THEN ( 9999 || '-' ||", "bbox": {"l": 147.63832, "t": 203.65643, "r": 261.44492, "b": 212.43120999999996, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "MONTH ( EMPLOYEES . DATE_OF_BIRTH ) || '-'", "bbox": {"l": 272.28363, "t": 203.65643, "r": 499.89682, "b": 212.43120999999996, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "||", "bbox": {"l": 510.73557, "t": 203.65643, "r": 521.57428, "b": 212.43120999999996, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "DAY (EMPLOYEES.DATE_OF_BIRTH ))", "bbox": {"l": 160.78555, "t": 215.65625, "r": 346.6767, "b": 224.43102999999996, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "ELSE NULL", "bbox": {"l": 149.51941, "t": 227.65607, "r": 206.75861, "b": 236.43084999999996, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": " END", "bbox": {"l": 136.79959, "t": 239.65588000000002, "r": 156.77934, "b": 248.43066, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": " ENABLE ;", "bbox": {"l": 136.79959, "t": 251.65570000000002, "r": 186.7191, "b": 260.43048, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "2.", "bbox": {"l": 136.79959, "t": 275.50591999999995, "r": 145.18994, "b": 284.7189, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "The other column to mask in this example is the TAX_ID information. In this example, the ", "bbox": {"l": 147.98672, "t": 275.50591999999995, "r": 547.21222, "b": 284.7189, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "rules to enforce include the following ones:", "bbox": {"l": 151.19977, "t": 287.50574, "r": 339.37903, "b": 296.71871999999996, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "-", "bbox": {"l": 152.0394, "t": 304.48553000000004, "r": 157.61201, "b": 313.69852000000003, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "Human Resources can see the unmasked TAX_ID of the employees.", "bbox": {"l": 165.59894, "t": 304.48553000000004, "r": 469.1528, "b": 313.69852000000003, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "-", "bbox": {"l": 152.0394, "t": 321.52512, "r": 157.60504, "b": 330.7381, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "Employees can see only their own unmasked TAX_ID.", "bbox": {"l": 165.59894, "t": 321.52512, "r": 403.95953, "b": 330.7381, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "-", "bbox": {"l": 152.0394, "t": 338.50491, "r": 157.57019, "b": 347.7179, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "Managers see a masked version of TAX_ID with the first five characters replaced with ", "bbox": {"l": 165.59894, "t": 338.50491, "r": 545.16846, "b": 347.7179, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "the X character (for example, XXX-XX-1234).", "bbox": {"l": 165.59894, "t": 350.50473, "r": 364.67947, "b": 359.71771, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "-", "bbox": {"l": 152.0394, "t": 367.48453, "r": 157.59309, "b": 376.6975100000001, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Any other person sees the entire TAX_ID as masked, for example, XXX-XX-XXXX.", "bbox": {"l": 165.59995, "t": 367.48453, "r": 529.46362, "b": 376.6975100000001, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "To implement this column mask, run the SQL statement that is shown in Example 3-9.", "bbox": {"l": 151.19978, "t": 384.52411, "r": 530.0603, "b": 393.73709, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Example 3-9 Creating a mask on the TAX_ID column", "bbox": {"l": 136.8, "t": 406.51801, "r": 351.9873, "b": 414.84302, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "CREATE MASK", "bbox": {"l": 136.8, "t": 423.67810000000003, "r": 192.91296, "b": 432.45287999999994, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "HR_SCHEMA.MASK_TAX_ID_ON_EMPLOYEES ", "bbox": {"l": 203.11533, "t": 423.67810000000003, "r": 381.65659, "b": 432.45287999999994, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "ON", "bbox": {"l": 136.8, "t": 435.67792, "r": 148.54184, "b": 444.45270000000005, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "HR_SCHEMA.EMPLOYEES AS EMPLOYEES ", "bbox": {"l": 177.89645, "t": 435.67792, "r": 371.63684, "b": 444.45270000000005, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "FOR COLUMN", "bbox": {"l": 136.8, "t": 447.67773, "r": 199.25916, "b": 456.45251, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "TAX_ID", "bbox": {"l": 211.75098, "t": 447.67773, "r": 249.22647, "b": 456.45251, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "RETURN ", "bbox": {"l": 136.8, "t": 459.67755, "r": 176.75952, "b": 468.45233, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "CASE ", "bbox": {"l": 136.8, "t": 471.67737, "r": 161.75977, "b": 480.45215, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'HR' ) = 1", "bbox": {"l": 152.84189, "t": 483.67719, "r": 441.59589, "b": 492.45197, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "THEN EMPLOYEES . TAX_ID ", "bbox": {"l": 154.01309, "t": 495.677, "r": 291.7178, "b": 504.45178, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1 ", "bbox": {"l": 152.80757, "t": 519.67661, "r": 451.6156, "b": 528.45139, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "AND SESSION_USER = EMPLOYEES . USER_ID ", "bbox": {"l": 153.21835, "t": 531.67642, "r": 366.65683, "b": 540.45117, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "THEN EMPLOYEES . TAX_ID", "bbox": {"l": 154.09363, "t": 543.6762200000001, "r": 286.67804, "b": 552.45097, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1", "bbox": {"l": 152.82599, "t": 567.67583, "r": 446.63561999999996, "b": 576.45058, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "AND SESSION_USER <> EMPLOYEES . USER_ID ", "bbox": {"l": 153.18398, "t": 579.67563, "r": 371.63684, "b": 588.45038, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "THEN ( 'XXX-XX-' CONCAT QSYS2 . SUBSTR ( EMPLOYEES . TAX_ID , 8 , 4 ) )", "bbox": {"l": 152.60088, "t": 591.67543, "r": 526.55469, "b": 600.45018, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'EMP' ) = 1 ", "bbox": {"l": 152.80757, "t": 615.67505, "r": 451.6156, "b": 624.4498, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "THEN EMPLOYEES . TAX_ID ", "bbox": {"l": 154.01309, "t": 627.67485, "r": 291.7178, "b": 636.4496, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "ELSE 'XXX-XX-XXXX' ", "bbox": {"l": 154.5134, "t": 651.67447, "r": 266.69827, "b": 660.44922, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "END", "bbox": {"l": 136.8, "t": 663.67427, "r": 157.7877, "b": 672.44904, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "ENABLE ;", "bbox": {"l": 136.8, "t": 675.67409, "r": 181.73952, "b": 684.44884, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 1, "label": "page_footer", "bbox": {"l": 344.94, "t": 755.538002, "r": 523.60162, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9556925892829895, "cells": [{"id": 0, "text": "Chapter 3. Row and Column Access Control ", "bbox": {"l": 344.94, "t": 755.538002, "r": 523.60162, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "page_footer", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.9105783104896545, "cells": [{"id": 1, "text": "27", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 136.79959, "t": 71.65845000000002, "r": 166.73935, "b": 80.43322999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.5606335997581482, "cells": [{"id": 2, "text": "RETURN", "bbox": {"l": 136.79959, "t": 71.65845000000002, "r": 166.73935, "b": 80.43322999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 136.79959, "t": 83.65826000000004, "r": 156.77934, "b": 92.43304, "coord_origin": "TOPLEFT"}, "confidence": 0.589726984500885, "cells": [{"id": 3, "text": "CASE", "bbox": {"l": 136.79959, "t": 83.65826000000004, "r": 156.77934, "b": 92.43304, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "code", "bbox": {"l": 136.79959, "t": 95.65808000000015, "r": 521.57428, "b": 260.43048, "coord_origin": "TOPLEFT"}, "confidence": 0.778521716594696, "cells": [{"id": 4, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'HR', 'EMP' ) = 1", "bbox": {"l": 147.26993, "t": 95.65808000000015, "r": 466.61502, "b": 104.43286000000012, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "THEN EMPLOYEES . DATE_OF_BIRTH", "bbox": {"l": 147.73068, "t": 107.65790000000004, "r": 311.69717, "b": 116.43268, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1", "bbox": {"l": 147.31944, "t": 131.65752999999995, "r": 436.61547999999993, "b": 140.43231000000003, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "AND SESSION_USER = EMPLOYEES . USER_ID", "bbox": {"l": 147.54245, "t": 143.65734999999995, "r": 351.65668, "b": 152.43213000000003, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "THEN EMPLOYEES . DATE_OF_BIRTH", "bbox": {"l": 147.73068, "t": 155.65716999999995, "r": 311.69717, "b": 164.43195000000003, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1", "bbox": {"l": 147.31944, "t": 179.65679999999998, "r": 436.61547999999993, "b": 188.43158000000005, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "AND SESSION_USER <> EMPLOYEES . USER_ID", "bbox": {"l": 147.52335, "t": 191.65661999999998, "r": 356.63669, "b": 200.43140000000005, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "THEN ( 9999 || '-' ||", "bbox": {"l": 147.63832, "t": 203.65643, "r": 261.44492, "b": 212.43120999999996, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "MONTH ( EMPLOYEES . DATE_OF_BIRTH ) || '-'", "bbox": {"l": 272.28363, "t": 203.65643, "r": 499.89682, "b": 212.43120999999996, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "||", "bbox": {"l": 510.73557, "t": 203.65643, "r": 521.57428, "b": 212.43120999999996, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "DAY (EMPLOYEES.DATE_OF_BIRTH ))", "bbox": {"l": 160.78555, "t": 215.65625, "r": 346.6767, "b": 224.43102999999996, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "ELSE NULL", "bbox": {"l": 149.51941, "t": 227.65607, "r": 206.75861, "b": 236.43084999999996, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": " END", "bbox": {"l": 136.79959, "t": 239.65588000000002, "r": 156.77934, "b": 248.43066, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": " ENABLE ;", "bbox": {"l": 136.79959, "t": 251.65570000000002, "r": 186.7191, "b": 260.43048, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "list_item", "bbox": {"l": 136.79959, "t": 275.50591999999995, "r": 547.21222, "b": 296.71871999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.8678942918777466, "cells": [{"id": 18, "text": "2.", "bbox": {"l": 136.79959, "t": 275.50591999999995, "r": 145.18994, "b": 284.7189, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "The other column to mask in this example is the TAX_ID information. In this example, the ", "bbox": {"l": 147.98672, "t": 275.50591999999995, "r": 547.21222, "b": 284.7189, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "rules to enforce include the following ones:", "bbox": {"l": 151.19977, "t": 287.50574, "r": 339.37903, "b": 296.71871999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "list_item", "bbox": {"l": 152.0394, "t": 304.48553000000004, "r": 469.1528, "b": 313.69852000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9461130499839783, "cells": [{"id": 21, "text": "-", "bbox": {"l": 152.0394, "t": 304.48553000000004, "r": 157.61201, "b": 313.69852000000003, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "Human Resources can see the unmasked TAX_ID of the employees.", "bbox": {"l": 165.59894, "t": 304.48553000000004, "r": 469.1528, "b": 313.69852000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "list_item", "bbox": {"l": 152.0394, "t": 321.52512, "r": 403.95953, "b": 330.7381, "coord_origin": "TOPLEFT"}, "confidence": 0.9467733502388, "cells": [{"id": 23, "text": "-", "bbox": {"l": 152.0394, "t": 321.52512, "r": 157.60504, "b": 330.7381, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "Employees can see only their own unmasked TAX_ID.", "bbox": {"l": 165.59894, "t": 321.52512, "r": 403.95953, "b": 330.7381, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "list_item", "bbox": {"l": 152.0394, "t": 338.50491, "r": 545.16846, "b": 359.71771, "coord_origin": "TOPLEFT"}, "confidence": 0.9705166220664978, "cells": [{"id": 25, "text": "-", "bbox": {"l": 152.0394, "t": 338.50491, "r": 157.57019, "b": 347.7179, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "Managers see a masked version of TAX_ID with the first five characters replaced with ", "bbox": {"l": 165.59894, "t": 338.50491, "r": 545.16846, "b": 347.7179, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "the X character (for example, XXX-XX-1234).", "bbox": {"l": 165.59894, "t": 350.50473, "r": 364.67947, "b": 359.71771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "list_item", "bbox": {"l": 152.0394, "t": 367.48453, "r": 529.46362, "b": 376.6975100000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9469642639160156, "cells": [{"id": 28, "text": "-", "bbox": {"l": 152.0394, "t": 367.48453, "r": 157.59309, "b": 376.6975100000001, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Any other person sees the entire TAX_ID as masked, for example, XXX-XX-XXXX.", "bbox": {"l": 165.59995, "t": 367.48453, "r": 529.46362, "b": 376.6975100000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "list_item", "bbox": {"l": 151.19978, "t": 384.52411, "r": 530.0603, "b": 393.73709, "coord_origin": "TOPLEFT"}, "confidence": 0.7003502249717712, "cells": [{"id": 30, "text": "To implement this column mask, run the SQL statement that is shown in Example 3-9.", "bbox": {"l": 151.19978, "t": 384.52411, "r": 530.0603, "b": 393.73709, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "caption", "bbox": {"l": 136.8, "t": 406.51801, "r": 351.9873, "b": 414.84302, "coord_origin": "TOPLEFT"}, "confidence": 0.8488203287124634, "cells": [{"id": 31, "text": "Example 3-9 Creating a mask on the TAX_ID column", "bbox": {"l": 136.8, "t": 406.51801, "r": 351.9873, "b": 414.84302, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "code", "bbox": {"l": 136.8, "t": 423.67810000000003, "r": 526.55469, "b": 684.44884, "coord_origin": "TOPLEFT"}, "confidence": 0.8411229252815247, "cells": [{"id": 32, "text": "CREATE MASK", "bbox": {"l": 136.8, "t": 423.67810000000003, "r": 192.91296, "b": 432.45287999999994, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "HR_SCHEMA.MASK_TAX_ID_ON_EMPLOYEES ", "bbox": {"l": 203.11533, "t": 423.67810000000003, "r": 381.65659, "b": 432.45287999999994, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "ON", "bbox": {"l": 136.8, "t": 435.67792, "r": 148.54184, "b": 444.45270000000005, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "HR_SCHEMA.EMPLOYEES AS EMPLOYEES ", "bbox": {"l": 177.89645, "t": 435.67792, "r": 371.63684, "b": 444.45270000000005, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "FOR COLUMN", "bbox": {"l": 136.8, "t": 447.67773, "r": 199.25916, "b": 456.45251, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "TAX_ID", "bbox": {"l": 211.75098, "t": 447.67773, "r": 249.22647, "b": 456.45251, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "RETURN ", "bbox": {"l": 136.8, "t": 459.67755, "r": 176.75952, "b": 468.45233, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "CASE ", "bbox": {"l": 136.8, "t": 471.67737, "r": 161.75977, "b": 480.45215, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'HR' ) = 1", "bbox": {"l": 152.84189, "t": 483.67719, "r": 441.59589, "b": 492.45197, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "THEN EMPLOYEES . TAX_ID ", "bbox": {"l": 154.01309, "t": 495.677, "r": 291.7178, "b": 504.45178, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1 ", "bbox": {"l": 152.80757, "t": 519.67661, "r": 451.6156, "b": 528.45139, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "AND SESSION_USER = EMPLOYEES . USER_ID ", "bbox": {"l": 153.21835, "t": 531.67642, "r": 366.65683, "b": 540.45117, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "THEN EMPLOYEES . TAX_ID", "bbox": {"l": 154.09363, "t": 543.6762200000001, "r": 286.67804, "b": 552.45097, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1", "bbox": {"l": 152.82599, "t": 567.67583, "r": 446.63561999999996, "b": 576.45058, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "AND SESSION_USER <> EMPLOYEES . USER_ID ", "bbox": {"l": 153.18398, "t": 579.67563, "r": 371.63684, "b": 588.45038, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "THEN ( 'XXX-XX-' CONCAT QSYS2 . SUBSTR ( EMPLOYEES . TAX_ID , 8 , 4 ) )", "bbox": {"l": 152.60088, "t": 591.67543, "r": 526.55469, "b": 600.45018, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'EMP' ) = 1 ", "bbox": {"l": 152.80757, "t": 615.67505, "r": 451.6156, "b": 624.4498, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "THEN EMPLOYEES . TAX_ID ", "bbox": {"l": 154.01309, "t": 627.67485, "r": 291.7178, "b": 636.4496, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "ELSE 'XXX-XX-XXXX' ", "bbox": {"l": 154.5134, "t": 651.67447, "r": 266.69827, "b": 660.44922, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "END", "bbox": {"l": 136.8, "t": 663.67427, "r": 157.7877, "b": 672.44904, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "ENABLE ;", "bbox": {"l": 136.8, "t": 675.67409, "r": 181.73952, "b": 684.44884, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_footer", "id": 1, "page_no": 12, "cluster": {"id": 1, "label": "page_footer", "bbox": {"l": 344.94, "t": 755.538002, "r": 523.60162, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9556925892829895, "cells": [{"id": 0, "text": "Chapter 3. Row and Column Access Control ", "bbox": {"l": 344.94, "t": 755.538002, "r": 523.60162, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Chapter 3. Row and Column Access Control"}, {"label": "page_footer", "id": 5, "page_no": 12, "cluster": {"id": 5, "label": "page_footer", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.9105783104896545, "cells": [{"id": 1, "text": "27", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "27"}, {"label": "text", "id": 13, "page_no": 12, "cluster": {"id": 13, "label": "text", "bbox": {"l": 136.79959, "t": 71.65845000000002, "r": 166.73935, "b": 80.43322999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.5606335997581482, "cells": [{"id": 2, "text": "RETURN", "bbox": {"l": 136.79959, "t": 71.65845000000002, "r": 166.73935, "b": 80.43322999999998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "RETURN"}, {"label": "text", "id": 12, "page_no": 12, "cluster": {"id": 12, "label": "text", "bbox": {"l": 136.79959, "t": 83.65826000000004, "r": 156.77934, "b": 92.43304, "coord_origin": "TOPLEFT"}, "confidence": 0.589726984500885, "cells": [{"id": 3, "text": "CASE", "bbox": {"l": 136.79959, "t": 83.65826000000004, "r": 156.77934, "b": 92.43304, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "CASE"}, {"label": "code", "id": 9, "page_no": 12, "cluster": {"id": 9, "label": "code", "bbox": {"l": 136.79959, "t": 95.65808000000015, "r": 521.57428, "b": 260.43048, "coord_origin": "TOPLEFT"}, "confidence": 0.778521716594696, "cells": [{"id": 4, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'HR', 'EMP' ) = 1", "bbox": {"l": 147.26993, "t": 95.65808000000015, "r": 466.61502, "b": 104.43286000000012, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "THEN EMPLOYEES . DATE_OF_BIRTH", "bbox": {"l": 147.73068, "t": 107.65790000000004, "r": 311.69717, "b": 116.43268, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1", "bbox": {"l": 147.31944, "t": 131.65752999999995, "r": 436.61547999999993, "b": 140.43231000000003, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "AND SESSION_USER = EMPLOYEES . USER_ID", "bbox": {"l": 147.54245, "t": 143.65734999999995, "r": 351.65668, "b": 152.43213000000003, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "THEN EMPLOYEES . DATE_OF_BIRTH", "bbox": {"l": 147.73068, "t": 155.65716999999995, "r": 311.69717, "b": 164.43195000000003, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1", "bbox": {"l": 147.31944, "t": 179.65679999999998, "r": 436.61547999999993, "b": 188.43158000000005, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "AND SESSION_USER <> EMPLOYEES . USER_ID", "bbox": {"l": 147.52335, "t": 191.65661999999998, "r": 356.63669, "b": 200.43140000000005, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "THEN ( 9999 || '-' ||", "bbox": {"l": 147.63832, "t": 203.65643, "r": 261.44492, "b": 212.43120999999996, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "MONTH ( EMPLOYEES . DATE_OF_BIRTH ) || '-'", "bbox": {"l": 272.28363, "t": 203.65643, "r": 499.89682, "b": 212.43120999999996, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "||", "bbox": {"l": 510.73557, "t": 203.65643, "r": 521.57428, "b": 212.43120999999996, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "DAY (EMPLOYEES.DATE_OF_BIRTH ))", "bbox": {"l": 160.78555, "t": 215.65625, "r": 346.6767, "b": 224.43102999999996, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "ELSE NULL", "bbox": {"l": 149.51941, "t": 227.65607, "r": 206.75861, "b": 236.43084999999996, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": " END", "bbox": {"l": 136.79959, "t": 239.65588000000002, "r": 156.77934, "b": 248.43066, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": " ENABLE ;", "bbox": {"l": 136.79959, "t": 251.65570000000002, "r": 186.7191, "b": 260.43048, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'HR', 'EMP' ) = 1 THEN EMPLOYEES . DATE_OF_BIRTH WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1 AND SESSION_USER = EMPLOYEES . USER_ID THEN EMPLOYEES . DATE_OF_BIRTH WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1 AND SESSION_USER <> EMPLOYEES . USER_ID THEN ( 9999 || '-' || MONTH ( EMPLOYEES . DATE_OF_BIRTH ) || '-' || DAY (EMPLOYEES.DATE_OF_BIRTH )) ELSE NULL END ENABLE ;"}, {"label": "list_item", "id": 6, "page_no": 12, "cluster": {"id": 6, "label": "list_item", "bbox": {"l": 136.79959, "t": 275.50591999999995, "r": 547.21222, "b": 296.71871999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.8678942918777466, "cells": [{"id": 18, "text": "2.", "bbox": {"l": 136.79959, "t": 275.50591999999995, "r": 145.18994, "b": 284.7189, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "The other column to mask in this example is the TAX_ID information. In this example, the ", "bbox": {"l": 147.98672, "t": 275.50591999999995, "r": 547.21222, "b": 284.7189, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "rules to enforce include the following ones:", "bbox": {"l": 151.19977, "t": 287.50574, "r": 339.37903, "b": 296.71871999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2. The other column to mask in this example is the TAX_ID information. In this example, the rules to enforce include the following ones:"}, {"label": "list_item", "id": 4, "page_no": 12, "cluster": {"id": 4, "label": "list_item", "bbox": {"l": 152.0394, "t": 304.48553000000004, "r": 469.1528, "b": 313.69852000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9461130499839783, "cells": [{"id": 21, "text": "-", "bbox": {"l": 152.0394, "t": 304.48553000000004, "r": 157.61201, "b": 313.69852000000003, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "Human Resources can see the unmasked TAX_ID of the employees.", "bbox": {"l": 165.59894, "t": 304.48553000000004, "r": 469.1528, "b": 313.69852000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "-Human Resources can see the unmasked TAX_ID of the employees."}, {"label": "list_item", "id": 3, "page_no": 12, "cluster": {"id": 3, "label": "list_item", "bbox": {"l": 152.0394, "t": 321.52512, "r": 403.95953, "b": 330.7381, "coord_origin": "TOPLEFT"}, "confidence": 0.9467733502388, "cells": [{"id": 23, "text": "-", "bbox": {"l": 152.0394, "t": 321.52512, "r": 157.60504, "b": 330.7381, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "Employees can see only their own unmasked TAX_ID.", "bbox": {"l": 165.59894, "t": 321.52512, "r": 403.95953, "b": 330.7381, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "-Employees can see only their own unmasked TAX_ID."}, {"label": "list_item", "id": 0, "page_no": 12, "cluster": {"id": 0, "label": "list_item", "bbox": {"l": 152.0394, "t": 338.50491, "r": 545.16846, "b": 359.71771, "coord_origin": "TOPLEFT"}, "confidence": 0.9705166220664978, "cells": [{"id": 25, "text": "-", "bbox": {"l": 152.0394, "t": 338.50491, "r": 157.57019, "b": 347.7179, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "Managers see a masked version of TAX_ID with the first five characters replaced with ", "bbox": {"l": 165.59894, "t": 338.50491, "r": 545.16846, "b": 347.7179, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "the X character (for example, XXX-XX-1234).", "bbox": {"l": 165.59894, "t": 350.50473, "r": 364.67947, "b": 359.71771, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "-Managers see a masked version of TAX_ID with the first five characters replaced with the X character (for example, XXX-XX-1234)."}, {"label": "list_item", "id": 2, "page_no": 12, "cluster": {"id": 2, "label": "list_item", "bbox": {"l": 152.0394, "t": 367.48453, "r": 529.46362, "b": 376.6975100000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9469642639160156, "cells": [{"id": 28, "text": "-", "bbox": {"l": 152.0394, "t": 367.48453, "r": 157.59309, "b": 376.6975100000001, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Any other person sees the entire TAX_ID as masked, for example, XXX-XX-XXXX.", "bbox": {"l": 165.59995, "t": 367.48453, "r": 529.46362, "b": 376.6975100000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "-Any other person sees the entire TAX_ID as masked, for example, XXX-XX-XXXX."}, {"label": "list_item", "id": 10, "page_no": 12, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 151.19978, "t": 384.52411, "r": 530.0603, "b": 393.73709, "coord_origin": "TOPLEFT"}, "confidence": 0.7003502249717712, "cells": [{"id": 30, "text": "To implement this column mask, run the SQL statement that is shown in Example 3-9.", "bbox": {"l": 151.19978, "t": 384.52411, "r": 530.0603, "b": 393.73709, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "To implement this column mask, run the SQL statement that is shown in Example 3-9."}, {"label": "caption", "id": 7, "page_no": 12, "cluster": {"id": 7, "label": "caption", "bbox": {"l": 136.8, "t": 406.51801, "r": 351.9873, "b": 414.84302, "coord_origin": "TOPLEFT"}, "confidence": 0.8488203287124634, "cells": [{"id": 31, "text": "Example 3-9 Creating a mask on the TAX_ID column", "bbox": {"l": 136.8, "t": 406.51801, "r": 351.9873, "b": 414.84302, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Example 3-9 Creating a mask on the TAX_ID column"}, {"label": "code", "id": 8, "page_no": 12, "cluster": {"id": 8, "label": "code", "bbox": {"l": 136.8, "t": 423.67810000000003, "r": 526.55469, "b": 684.44884, "coord_origin": "TOPLEFT"}, "confidence": 0.8411229252815247, "cells": [{"id": 32, "text": "CREATE MASK", "bbox": {"l": 136.8, "t": 423.67810000000003, "r": 192.91296, "b": 432.45287999999994, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "HR_SCHEMA.MASK_TAX_ID_ON_EMPLOYEES ", "bbox": {"l": 203.11533, "t": 423.67810000000003, "r": 381.65659, "b": 432.45287999999994, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "ON", "bbox": {"l": 136.8, "t": 435.67792, "r": 148.54184, "b": 444.45270000000005, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "HR_SCHEMA.EMPLOYEES AS EMPLOYEES ", "bbox": {"l": 177.89645, "t": 435.67792, "r": 371.63684, "b": 444.45270000000005, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "FOR COLUMN", "bbox": {"l": 136.8, "t": 447.67773, "r": 199.25916, "b": 456.45251, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "TAX_ID", "bbox": {"l": 211.75098, "t": 447.67773, "r": 249.22647, "b": 456.45251, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "RETURN ", "bbox": {"l": 136.8, "t": 459.67755, "r": 176.75952, "b": 468.45233, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "CASE ", "bbox": {"l": 136.8, "t": 471.67737, "r": 161.75977, "b": 480.45215, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'HR' ) = 1", "bbox": {"l": 152.84189, "t": 483.67719, "r": 441.59589, "b": 492.45197, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "THEN EMPLOYEES . TAX_ID ", "bbox": {"l": 154.01309, "t": 495.677, "r": 291.7178, "b": 504.45178, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1 ", "bbox": {"l": 152.80757, "t": 519.67661, "r": 451.6156, "b": 528.45139, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "AND SESSION_USER = EMPLOYEES . USER_ID ", "bbox": {"l": 153.21835, "t": 531.67642, "r": 366.65683, "b": 540.45117, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "THEN EMPLOYEES . TAX_ID", "bbox": {"l": 154.09363, "t": 543.6762200000001, "r": 286.67804, "b": 552.45097, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1", "bbox": {"l": 152.82599, "t": 567.67583, "r": 446.63561999999996, "b": 576.45058, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "AND SESSION_USER <> EMPLOYEES . USER_ID ", "bbox": {"l": 153.18398, "t": 579.67563, "r": 371.63684, "b": 588.45038, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "THEN ( 'XXX-XX-' CONCAT QSYS2 . SUBSTR ( EMPLOYEES . TAX_ID , 8 , 4 ) )", "bbox": {"l": 152.60088, "t": 591.67543, "r": 526.55469, "b": 600.45018, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'EMP' ) = 1 ", "bbox": {"l": 152.80757, "t": 615.67505, "r": 451.6156, "b": 624.4498, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "THEN EMPLOYEES . TAX_ID ", "bbox": {"l": 154.01309, "t": 627.67485, "r": 291.7178, "b": 636.4496, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "ELSE 'XXX-XX-XXXX' ", "bbox": {"l": 154.5134, "t": 651.67447, "r": 266.69827, "b": 660.44922, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "END", "bbox": {"l": 136.8, "t": 663.67427, "r": 157.7877, "b": 672.44904, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "ENABLE ;", "bbox": {"l": 136.8, "t": 675.67409, "r": 181.73952, "b": 684.44884, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "CREATE MASK HR_SCHEMA.MASK_TAX_ID_ON_EMPLOYEES ON HR_SCHEMA.EMPLOYEES AS EMPLOYEES FOR COLUMN TAX_ID RETURN CASE WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'HR' ) = 1 THEN EMPLOYEES . TAX_ID WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1 AND SESSION_USER = EMPLOYEES . USER_ID THEN EMPLOYEES . TAX_ID WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1 AND SESSION_USER <> EMPLOYEES . USER_ID THEN ( 'XXX-XX-' CONCAT QSYS2 . SUBSTR ( EMPLOYEES . TAX_ID , 8 , 4 ) ) WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'EMP' ) = 1 THEN EMPLOYEES . TAX_ID ELSE 'XXX-XX-XXXX' END ENABLE ;"}], "body": [{"label": "text", "id": 13, "page_no": 12, "cluster": {"id": 13, "label": "text", "bbox": {"l": 136.79959, "t": 71.65845000000002, "r": 166.73935, "b": 80.43322999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.5606335997581482, "cells": [{"id": 2, "text": "RETURN", "bbox": {"l": 136.79959, "t": 71.65845000000002, "r": 166.73935, "b": 80.43322999999998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "RETURN"}, {"label": "text", "id": 12, "page_no": 12, "cluster": {"id": 12, "label": "text", "bbox": {"l": 136.79959, "t": 83.65826000000004, "r": 156.77934, "b": 92.43304, "coord_origin": "TOPLEFT"}, "confidence": 0.589726984500885, "cells": [{"id": 3, "text": "CASE", "bbox": {"l": 136.79959, "t": 83.65826000000004, "r": 156.77934, "b": 92.43304, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "CASE"}, {"label": "code", "id": 9, "page_no": 12, "cluster": {"id": 9, "label": "code", "bbox": {"l": 136.79959, "t": 95.65808000000015, "r": 521.57428, "b": 260.43048, "coord_origin": "TOPLEFT"}, "confidence": 0.778521716594696, "cells": [{"id": 4, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'HR', 'EMP' ) = 1", "bbox": {"l": 147.26993, "t": 95.65808000000015, "r": 466.61502, "b": 104.43286000000012, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "THEN EMPLOYEES . DATE_OF_BIRTH", "bbox": {"l": 147.73068, "t": 107.65790000000004, "r": 311.69717, "b": 116.43268, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1", "bbox": {"l": 147.31944, "t": 131.65752999999995, "r": 436.61547999999993, "b": 140.43231000000003, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "AND SESSION_USER = EMPLOYEES . USER_ID", "bbox": {"l": 147.54245, "t": 143.65734999999995, "r": 351.65668, "b": 152.43213000000003, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "THEN EMPLOYEES . DATE_OF_BIRTH", "bbox": {"l": 147.73068, "t": 155.65716999999995, "r": 311.69717, "b": 164.43195000000003, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1", "bbox": {"l": 147.31944, "t": 179.65679999999998, "r": 436.61547999999993, "b": 188.43158000000005, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "AND SESSION_USER <> EMPLOYEES . USER_ID", "bbox": {"l": 147.52335, "t": 191.65661999999998, "r": 356.63669, "b": 200.43140000000005, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "THEN ( 9999 || '-' ||", "bbox": {"l": 147.63832, "t": 203.65643, "r": 261.44492, "b": 212.43120999999996, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "MONTH ( EMPLOYEES . DATE_OF_BIRTH ) || '-'", "bbox": {"l": 272.28363, "t": 203.65643, "r": 499.89682, "b": 212.43120999999996, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "||", "bbox": {"l": 510.73557, "t": 203.65643, "r": 521.57428, "b": 212.43120999999996, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "DAY (EMPLOYEES.DATE_OF_BIRTH ))", "bbox": {"l": 160.78555, "t": 215.65625, "r": 346.6767, "b": 224.43102999999996, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "ELSE NULL", "bbox": {"l": 149.51941, "t": 227.65607, "r": 206.75861, "b": 236.43084999999996, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": " END", "bbox": {"l": 136.79959, "t": 239.65588000000002, "r": 156.77934, "b": 248.43066, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": " ENABLE ;", "bbox": {"l": 136.79959, "t": 251.65570000000002, "r": 186.7191, "b": 260.43048, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'HR', 'EMP' ) = 1 THEN EMPLOYEES . DATE_OF_BIRTH WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1 AND SESSION_USER = EMPLOYEES . USER_ID THEN EMPLOYEES . DATE_OF_BIRTH WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1 AND SESSION_USER <> EMPLOYEES . USER_ID THEN ( 9999 || '-' || MONTH ( EMPLOYEES . DATE_OF_BIRTH ) || '-' || DAY (EMPLOYEES.DATE_OF_BIRTH )) ELSE NULL END ENABLE ;"}, {"label": "list_item", "id": 6, "page_no": 12, "cluster": {"id": 6, "label": "list_item", "bbox": {"l": 136.79959, "t": 275.50591999999995, "r": 547.21222, "b": 296.71871999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.8678942918777466, "cells": [{"id": 18, "text": "2.", "bbox": {"l": 136.79959, "t": 275.50591999999995, "r": 145.18994, "b": 284.7189, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "The other column to mask in this example is the TAX_ID information. In this example, the ", "bbox": {"l": 147.98672, "t": 275.50591999999995, "r": 547.21222, "b": 284.7189, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "rules to enforce include the following ones:", "bbox": {"l": 151.19977, "t": 287.50574, "r": 339.37903, "b": 296.71871999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2. The other column to mask in this example is the TAX_ID information. In this example, the rules to enforce include the following ones:"}, {"label": "list_item", "id": 4, "page_no": 12, "cluster": {"id": 4, "label": "list_item", "bbox": {"l": 152.0394, "t": 304.48553000000004, "r": 469.1528, "b": 313.69852000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9461130499839783, "cells": [{"id": 21, "text": "-", "bbox": {"l": 152.0394, "t": 304.48553000000004, "r": 157.61201, "b": 313.69852000000003, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "Human Resources can see the unmasked TAX_ID of the employees.", "bbox": {"l": 165.59894, "t": 304.48553000000004, "r": 469.1528, "b": 313.69852000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "-Human Resources can see the unmasked TAX_ID of the employees."}, {"label": "list_item", "id": 3, "page_no": 12, "cluster": {"id": 3, "label": "list_item", "bbox": {"l": 152.0394, "t": 321.52512, "r": 403.95953, "b": 330.7381, "coord_origin": "TOPLEFT"}, "confidence": 0.9467733502388, "cells": [{"id": 23, "text": "-", "bbox": {"l": 152.0394, "t": 321.52512, "r": 157.60504, "b": 330.7381, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "Employees can see only their own unmasked TAX_ID.", "bbox": {"l": 165.59894, "t": 321.52512, "r": 403.95953, "b": 330.7381, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "-Employees can see only their own unmasked TAX_ID."}, {"label": "list_item", "id": 0, "page_no": 12, "cluster": {"id": 0, "label": "list_item", "bbox": {"l": 152.0394, "t": 338.50491, "r": 545.16846, "b": 359.71771, "coord_origin": "TOPLEFT"}, "confidence": 0.9705166220664978, "cells": [{"id": 25, "text": "-", "bbox": {"l": 152.0394, "t": 338.50491, "r": 157.57019, "b": 347.7179, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "Managers see a masked version of TAX_ID with the first five characters replaced with ", "bbox": {"l": 165.59894, "t": 338.50491, "r": 545.16846, "b": 347.7179, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "the X character (for example, XXX-XX-1234).", "bbox": {"l": 165.59894, "t": 350.50473, "r": 364.67947, "b": 359.71771, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "-Managers see a masked version of TAX_ID with the first five characters replaced with the X character (for example, XXX-XX-1234)."}, {"label": "list_item", "id": 2, "page_no": 12, "cluster": {"id": 2, "label": "list_item", "bbox": {"l": 152.0394, "t": 367.48453, "r": 529.46362, "b": 376.6975100000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9469642639160156, "cells": [{"id": 28, "text": "-", "bbox": {"l": 152.0394, "t": 367.48453, "r": 157.59309, "b": 376.6975100000001, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Any other person sees the entire TAX_ID as masked, for example, XXX-XX-XXXX.", "bbox": {"l": 165.59995, "t": 367.48453, "r": 529.46362, "b": 376.6975100000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "-Any other person sees the entire TAX_ID as masked, for example, XXX-XX-XXXX."}, {"label": "list_item", "id": 10, "page_no": 12, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 151.19978, "t": 384.52411, "r": 530.0603, "b": 393.73709, "coord_origin": "TOPLEFT"}, "confidence": 0.7003502249717712, "cells": [{"id": 30, "text": "To implement this column mask, run the SQL statement that is shown in Example 3-9.", "bbox": {"l": 151.19978, "t": 384.52411, "r": 530.0603, "b": 393.73709, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "To implement this column mask, run the SQL statement that is shown in Example 3-9."}, {"label": "caption", "id": 7, "page_no": 12, "cluster": {"id": 7, "label": "caption", "bbox": {"l": 136.8, "t": 406.51801, "r": 351.9873, "b": 414.84302, "coord_origin": "TOPLEFT"}, "confidence": 0.8488203287124634, "cells": [{"id": 31, "text": "Example 3-9 Creating a mask on the TAX_ID column", "bbox": {"l": 136.8, "t": 406.51801, "r": 351.9873, "b": 414.84302, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Example 3-9 Creating a mask on the TAX_ID column"}, {"label": "code", "id": 8, "page_no": 12, "cluster": {"id": 8, "label": "code", "bbox": {"l": 136.8, "t": 423.67810000000003, "r": 526.55469, "b": 684.44884, "coord_origin": "TOPLEFT"}, "confidence": 0.8411229252815247, "cells": [{"id": 32, "text": "CREATE MASK", "bbox": {"l": 136.8, "t": 423.67810000000003, "r": 192.91296, "b": 432.45287999999994, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "HR_SCHEMA.MASK_TAX_ID_ON_EMPLOYEES ", "bbox": {"l": 203.11533, "t": 423.67810000000003, "r": 381.65659, "b": 432.45287999999994, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "ON", "bbox": {"l": 136.8, "t": 435.67792, "r": 148.54184, "b": 444.45270000000005, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "HR_SCHEMA.EMPLOYEES AS EMPLOYEES ", "bbox": {"l": 177.89645, "t": 435.67792, "r": 371.63684, "b": 444.45270000000005, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "FOR COLUMN", "bbox": {"l": 136.8, "t": 447.67773, "r": 199.25916, "b": 456.45251, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "TAX_ID", "bbox": {"l": 211.75098, "t": 447.67773, "r": 249.22647, "b": 456.45251, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "RETURN ", "bbox": {"l": 136.8, "t": 459.67755, "r": 176.75952, "b": 468.45233, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "CASE ", "bbox": {"l": 136.8, "t": 471.67737, "r": 161.75977, "b": 480.45215, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'HR' ) = 1", "bbox": {"l": 152.84189, "t": 483.67719, "r": 441.59589, "b": 492.45197, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "THEN EMPLOYEES . TAX_ID ", "bbox": {"l": 154.01309, "t": 495.677, "r": 291.7178, "b": 504.45178, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1 ", "bbox": {"l": 152.80757, "t": 519.67661, "r": 451.6156, "b": 528.45139, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "AND SESSION_USER = EMPLOYEES . USER_ID ", "bbox": {"l": 153.21835, "t": 531.67642, "r": 366.65683, "b": 540.45117, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "THEN EMPLOYEES . TAX_ID", "bbox": {"l": 154.09363, "t": 543.6762200000001, "r": 286.67804, "b": 552.45097, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1", "bbox": {"l": 152.82599, "t": 567.67583, "r": 446.63561999999996, "b": 576.45058, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "AND SESSION_USER <> EMPLOYEES . USER_ID ", "bbox": {"l": 153.18398, "t": 579.67563, "r": 371.63684, "b": 588.45038, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "THEN ( 'XXX-XX-' CONCAT QSYS2 . SUBSTR ( EMPLOYEES . TAX_ID , 8 , 4 ) )", "bbox": {"l": 152.60088, "t": 591.67543, "r": 526.55469, "b": 600.45018, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'EMP' ) = 1 ", "bbox": {"l": 152.80757, "t": 615.67505, "r": 451.6156, "b": 624.4498, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "THEN EMPLOYEES . TAX_ID ", "bbox": {"l": 154.01309, "t": 627.67485, "r": 291.7178, "b": 636.4496, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "ELSE 'XXX-XX-XXXX' ", "bbox": {"l": 154.5134, "t": 651.67447, "r": 266.69827, "b": 660.44922, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "END", "bbox": {"l": 136.8, "t": 663.67427, "r": 157.7877, "b": 672.44904, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "ENABLE ;", "bbox": {"l": 136.8, "t": 675.67409, "r": 181.73952, "b": 684.44884, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "CREATE MASK HR_SCHEMA.MASK_TAX_ID_ON_EMPLOYEES ON HR_SCHEMA.EMPLOYEES AS EMPLOYEES FOR COLUMN TAX_ID RETURN CASE WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'HR' ) = 1 THEN EMPLOYEES . TAX_ID WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1 AND SESSION_USER = EMPLOYEES . USER_ID THEN EMPLOYEES . TAX_ID WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1 AND SESSION_USER <> EMPLOYEES . USER_ID THEN ( 'XXX-XX-' CONCAT QSYS2 . SUBSTR ( EMPLOYEES . TAX_ID , 8 , 4 ) ) WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'EMP' ) = 1 THEN EMPLOYEES . TAX_ID ELSE 'XXX-XX-XXXX' END ENABLE ;"}], "headers": [{"label": "page_footer", "id": 1, "page_no": 12, "cluster": {"id": 1, "label": "page_footer", "bbox": {"l": 344.94, "t": 755.538002, "r": 523.60162, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9556925892829895, "cells": [{"id": 0, "text": "Chapter 3. Row and Column Access Control ", "bbox": {"l": 344.94, "t": 755.538002, "r": 523.60162, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Chapter 3. Row and Column Access Control"}, {"label": "page_footer", "id": 5, "page_no": 12, "cluster": {"id": 5, "label": "page_footer", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.9105783104896545, "cells": [{"id": 1, "text": "27", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "27"}]}}, {"page_no": 13, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "28 ", "bbox": {"l": 64.800003, "t": 754.848721, "r": 78.402, "b": 764.06172, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Row and Column Access Control Support in IBM DB2 for i", "bbox": {"l": 93.420303, "t": 755.538002, "r": 334.42142, "b": 763.863001, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "3.", "bbox": {"l": 136.8, "t": 71.50867000000005, "r": 145.22156, "b": 80.72167999999999, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Figure 3-10 shows the masks that are created in the HR_SCHEMA.", "bbox": {"l": 148.02872, "t": 71.50867000000005, "r": 449.9523899999999, "b": 80.72167999999999, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Figure 3-10 Column masks shown in System i Navigator", "bbox": {"l": 64.800003, "t": 173.53801999999996, "r": 293.13809, "b": 181.86298, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "3.6.6", "bbox": {"l": 64.800003, "t": 202.37469, "r": 94.275139, "b": 214.36273000000006, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Activating RCAC", "bbox": {"l": 97.959534, "t": 202.37469, "r": 203.98521, "b": 214.36273000000006, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Now that you have created the row permission and the two column masks, RCAC must be ", "bbox": {"l": 136.8, "t": 228.52868999999998, "r": 537.09131, "b": 237.74170000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "activated. The row permission and the two column masks are enabled (last clause in the ", "bbox": {"l": 136.8, "t": 240.5285, "r": 529.20422, "b": 249.74152000000004, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "scripts), but now you must activate RCAC on the table. To do so, complete the following steps:", "bbox": {"l": 136.8, "t": 252.52832, "r": 547.22565, "b": 261.74132999999995, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "1.", "bbox": {"l": 136.8, "t": 269.50811999999996, "r": 145.32378, "b": 278.72113, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Run the SQL statements that are shown in Example 3-10.", "bbox": {"l": 148.16501, "t": 269.50811999999996, "r": 409.47888, "b": 278.72113, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Example 3-10 Activating RCAC on the EMPLOYEES table ", "bbox": {"l": 136.8, "t": 291.55798, "r": 375.29099, "b": 299.88300000000004, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "/*", "bbox": {"l": 136.8, "t": 308.65811, "r": 147.22942, "b": 317.43289, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Active Row Access Control (permissions) */", "bbox": {"l": 157.65884, "t": 308.65811, "r": 376.67661, "b": 317.43289, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "/*", "bbox": {"l": 136.8, "t": 320.65793, "r": 147.70349, "b": 329.43271, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Active Column Access Control (masks)", "bbox": {"l": 158.60696, "t": 320.65793, "r": 354.86963, "b": 329.43271, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "*/", "bbox": {"l": 365.77313, "t": 320.65793, "r": 376.67661, "b": 329.43271, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "ALTER TABLE HR_SCHEMA.EMPLOYEES", "bbox": {"l": 136.8, "t": 332.65775, "r": 291.7178, "b": 341.43253, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "ACTIVATE ROW ACCESS CONTROL", "bbox": {"l": 136.8, "t": 344.65756, "r": 271.67831, "b": 353.43234000000007, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "ACTIVATE COLUMN ACCESS CONTROL;", "bbox": {"l": 136.8, "t": 356.65738, "r": 291.7178, "b": 365.43216, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "2.", "bbox": {"l": 136.8, "t": 380.5076, "r": 145.14954, "b": 389.72058, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "Look at the definition of the EMPLOYEE table, as shown in Figure 3-11. To do this, from ", "bbox": {"l": 147.93271, "t": 380.5076, "r": 540.80145, "b": 389.72058, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "the main navigation pane of System i Navigator, click ", "bbox": {"l": 151.20013, "t": 392.50742, "r": 387.36169, "b": 401.7203999999999, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "Schemas", "bbox": {"l": 387.29993, "t": 392.50742, "r": 431.07614, "b": 401.7203999999999, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "\uf0ae", "bbox": {"l": 433.85992000000005, "t": 389.64889999999997, "r": 443.69043, "b": 401.83994, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "HR_SCHEMA", "bbox": {"l": 446.51906999999994, "t": 392.50742, "r": 509.73618000000005, "b": 401.7203999999999, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "\uf0ae", "bbox": {"l": 512.5788, "t": 389.64889999999997, "r": 522.4093, "b": 401.83994, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Tables", "bbox": {"l": 151.19812, "t": 404.50723000000005, "r": 181.12892, "b": 413.72021, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": ", right-click the ", "bbox": {"l": 181.79823, "t": 404.50723000000005, "r": 248.99638, "b": 413.72021, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "EMPLOYEES", "bbox": {"l": 248.93860000000004, "t": 404.50723000000005, "r": 310.44357, "b": 413.72021, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": " table, and click ", "bbox": {"l": 310.49835, "t": 404.50723000000005, "r": 381.53305, "b": 413.72021, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Definition", "bbox": {"l": 381.59882, "t": 404.50723000000005, "r": 427.68176, "b": 413.72021, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": ".", "bbox": {"l": 427.67877, "t": 404.50723000000005, "r": 430.4476599999999, "b": 413.72021, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Figure 3-11 Selecting the EMPLOYEES table from System i Navigator", "bbox": {"l": 64.800003, "t": 649.0378900000001, "r": 347.43054, "b": 657.3629, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 8, "label": "page_footer", "bbox": {"l": 64.800003, "t": 754.848721, "r": 78.402, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.9161998629570007, "cells": [{"id": 0, "text": "28 ", "bbox": {"l": 64.800003, "t": 754.848721, "r": 78.402, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "page_footer", "bbox": {"l": 93.420303, "t": 755.538002, "r": 334.42142, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9540064334869385, "cells": [{"id": 1, "text": "Row and Column Access Control Support in IBM DB2 for i", "bbox": {"l": 93.420303, "t": 755.538002, "r": 334.42142, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "list_item", "bbox": {"l": 136.8, "t": 71.50867000000005, "r": 449.9523899999999, "b": 80.72167999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.8751048445701599, "cells": [{"id": 2, "text": "3.", "bbox": {"l": 136.8, "t": 71.50867000000005, "r": 145.22156, "b": 80.72167999999999, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Figure 3-10 shows the masks that are created in the HR_SCHEMA.", "bbox": {"l": 148.02872, "t": 71.50867000000005, "r": 449.9523899999999, "b": 80.72167999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "caption", "bbox": {"l": 64.800003, "t": 173.53801999999996, "r": 293.13809, "b": 181.86298, "coord_origin": "TOPLEFT"}, "confidence": 0.944426953792572, "cells": [{"id": 4, "text": "Figure 3-10 Column masks shown in System i Navigator", "bbox": {"l": 64.800003, "t": 173.53801999999996, "r": 293.13809, "b": 181.86298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "section_header", "bbox": {"l": 64.800003, "t": 202.37469, "r": 203.98521, "b": 214.36273000000006, "coord_origin": "TOPLEFT"}, "confidence": 0.9645015001296997, "cells": [{"id": 5, "text": "3.6.6", "bbox": {"l": 64.800003, "t": 202.37469, "r": 94.275139, "b": 214.36273000000006, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Activating RCAC", "bbox": {"l": 97.959534, "t": 202.37469, "r": 203.98521, "b": 214.36273000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 136.8, "t": 228.52868999999998, "r": 547.22565, "b": 261.74132999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9768574237823486, "cells": [{"id": 7, "text": "Now that you have created the row permission and the two column masks, RCAC must be ", "bbox": {"l": 136.8, "t": 228.52868999999998, "r": 537.09131, "b": 237.74170000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "activated. The row permission and the two column masks are enabled (last clause in the ", "bbox": {"l": 136.8, "t": 240.5285, "r": 529.20422, "b": 249.74152000000004, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "scripts), but now you must activate RCAC on the table. To do so, complete the following steps:", "bbox": {"l": 136.8, "t": 252.52832, "r": 547.22565, "b": 261.74132999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "list_item", "bbox": {"l": 136.8, "t": 269.50811999999996, "r": 409.47888, "b": 278.72113, "coord_origin": "TOPLEFT"}, "confidence": 0.9059441685676575, "cells": [{"id": 10, "text": "1.", "bbox": {"l": 136.8, "t": 269.50811999999996, "r": 145.32378, "b": 278.72113, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Run the SQL statements that are shown in Example 3-10.", "bbox": {"l": 148.16501, "t": 269.50811999999996, "r": 409.47888, "b": 278.72113, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "section_header", "bbox": {"l": 136.8, "t": 291.55798, "r": 375.29099, "b": 299.88300000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.657009482383728, "cells": [{"id": 12, "text": "Example 3-10 Activating RCAC on the EMPLOYEES table ", "bbox": {"l": 136.8, "t": 291.55798, "r": 375.29099, "b": 299.88300000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "list_item", "bbox": {"l": 136.8, "t": 308.65811, "r": 376.67661, "b": 317.43289, "coord_origin": "TOPLEFT"}, "confidence": 0.6002400517463684, "cells": [{"id": 13, "text": "/*", "bbox": {"l": 136.8, "t": 308.65811, "r": 147.22942, "b": 317.43289, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Active Row Access Control (permissions) */", "bbox": {"l": 157.65884, "t": 308.65811, "r": 376.67661, "b": 317.43289, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "list_item", "bbox": {"l": 136.8, "t": 320.65793, "r": 354.86963, "b": 329.43271, "coord_origin": "TOPLEFT"}, "confidence": 0.598584771156311, "cells": [{"id": 15, "text": "/*", "bbox": {"l": 136.8, "t": 320.65793, "r": 147.70349, "b": 329.43271, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Active Column Access Control (masks)", "bbox": {"l": 158.60696, "t": 320.65793, "r": 354.86963, "b": 329.43271, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 365.77313, "t": 320.65793, "r": 376.67661, "b": 329.43271, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "*/", "bbox": {"l": 365.77313, "t": 320.65793, "r": 376.67661, "b": 329.43271, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 136.8, "t": 332.65775, "r": 291.7178, "b": 341.43253, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "ALTER TABLE HR_SCHEMA.EMPLOYEES", "bbox": {"l": 136.8, "t": 332.65775, "r": 291.7178, "b": 341.43253, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 136.8, "t": 344.65756, "r": 271.67831, "b": 353.43234000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "ACTIVATE ROW ACCESS CONTROL", "bbox": {"l": 136.8, "t": 344.65756, "r": 271.67831, "b": 353.43234000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 136.8, "t": 356.65738, "r": 291.7178, "b": 365.43216, "coord_origin": "TOPLEFT"}, "confidence": 0.5431806445121765, "cells": [{"id": 20, "text": "ACTIVATE COLUMN ACCESS CONTROL;", "bbox": {"l": 136.8, "t": 356.65738, "r": 291.7178, "b": 365.43216, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "list_item", "bbox": {"l": 136.8, "t": 380.5076, "r": 540.80145, "b": 413.72021, "coord_origin": "TOPLEFT"}, "confidence": 0.9449257850646973, "cells": [{"id": 21, "text": "2.", "bbox": {"l": 136.8, "t": 380.5076, "r": 145.14954, "b": 389.72058, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "Look at the definition of the EMPLOYEE table, as shown in Figure 3-11. To do this, from ", "bbox": {"l": 147.93271, "t": 380.5076, "r": 540.80145, "b": 389.72058, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "the main navigation pane of System i Navigator, click ", "bbox": {"l": 151.20013, "t": 392.50742, "r": 387.36169, "b": 401.7203999999999, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "Schemas", "bbox": {"l": 387.29993, "t": 392.50742, "r": 431.07614, "b": 401.7203999999999, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "\uf0ae", "bbox": {"l": 433.85992000000005, "t": 389.64889999999997, "r": 443.69043, "b": 401.83994, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "HR_SCHEMA", "bbox": {"l": 446.51906999999994, "t": 392.50742, "r": 509.73618000000005, "b": 401.7203999999999, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "\uf0ae", "bbox": {"l": 512.5788, "t": 389.64889999999997, "r": 522.4093, "b": 401.83994, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Tables", "bbox": {"l": 151.19812, "t": 404.50723000000005, "r": 181.12892, "b": 413.72021, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": ", right-click the ", "bbox": {"l": 181.79823, "t": 404.50723000000005, "r": 248.99638, "b": 413.72021, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "EMPLOYEES", "bbox": {"l": 248.93860000000004, "t": 404.50723000000005, "r": 310.44357, "b": 413.72021, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": " table, and click ", "bbox": {"l": 310.49835, "t": 404.50723000000005, "r": 381.53305, "b": 413.72021, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Definition", "bbox": {"l": 381.59882, "t": 404.50723000000005, "r": 427.68176, "b": 413.72021, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": ".", "bbox": {"l": 427.67877, "t": 404.50723000000005, "r": 430.4476599999999, "b": 413.72021, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "caption", "bbox": {"l": 64.800003, "t": 649.0378900000001, "r": 347.43054, "b": 657.3629, "coord_origin": "TOPLEFT"}, "confidence": 0.9499983787536621, "cells": [{"id": 34, "text": "Figure 3-11 Selecting the EMPLOYEES table from System i Navigator", "bbox": {"l": 64.800003, "t": 649.0378900000001, "r": 347.43054, "b": 657.3629, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "picture", "bbox": {"l": 63.801902770996094, "t": 95.38241577148438, "r": 547.11474609375, "b": 170.0321502685547, "coord_origin": "TOPLEFT"}, "confidence": 0.9635388851165771, "cells": [], "children": []}, {"id": 0, "label": "picture", "bbox": {"l": 63.985130310058594, "t": 427.90496826171875, "r": 530.0478515625, "b": 646.1396484375, "coord_origin": "TOPLEFT"}, "confidence": 0.9801459908485413, "cells": [], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_footer", "id": 8, "page_no": 13, "cluster": {"id": 8, "label": "page_footer", "bbox": {"l": 64.800003, "t": 754.848721, "r": 78.402, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.9161998629570007, "cells": [{"id": 0, "text": "28 ", "bbox": {"l": 64.800003, "t": 754.848721, "r": 78.402, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "28"}, {"label": "page_footer", "id": 4, "page_no": 13, "cluster": {"id": 4, "label": "page_footer", "bbox": {"l": 93.420303, "t": 755.538002, "r": 334.42142, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9540064334869385, "cells": [{"id": 1, "text": "Row and Column Access Control Support in IBM DB2 for i", "bbox": {"l": 93.420303, "t": 755.538002, "r": 334.42142, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Row and Column Access Control Support in IBM DB2 for i"}, {"label": "list_item", "id": 10, "page_no": 13, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 136.8, "t": 71.50867000000005, "r": 449.9523899999999, "b": 80.72167999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.8751048445701599, "cells": [{"id": 2, "text": "3.", "bbox": {"l": 136.8, "t": 71.50867000000005, "r": 145.22156, "b": 80.72167999999999, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Figure 3-10 shows the masks that are created in the HR_SCHEMA.", "bbox": {"l": 148.02872, "t": 71.50867000000005, "r": 449.9523899999999, "b": 80.72167999999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3. Figure 3-10 shows the masks that are created in the HR_SCHEMA."}, {"label": "caption", "id": 7, "page_no": 13, "cluster": {"id": 7, "label": "caption", "bbox": {"l": 64.800003, "t": 173.53801999999996, "r": 293.13809, "b": 181.86298, "coord_origin": "TOPLEFT"}, "confidence": 0.944426953792572, "cells": [{"id": 4, "text": "Figure 3-10 Column masks shown in System i Navigator", "bbox": {"l": 64.800003, "t": 173.53801999999996, "r": 293.13809, "b": 181.86298, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 3-10 Column masks shown in System i Navigator"}, {"label": "section_header", "id": 2, "page_no": 13, "cluster": {"id": 2, "label": "section_header", "bbox": {"l": 64.800003, "t": 202.37469, "r": 203.98521, "b": 214.36273000000006, "coord_origin": "TOPLEFT"}, "confidence": 0.9645015001296997, "cells": [{"id": 5, "text": "3.6.6", "bbox": {"l": 64.800003, "t": 202.37469, "r": 94.275139, "b": 214.36273000000006, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Activating RCAC", "bbox": {"l": 97.959534, "t": 202.37469, "r": 203.98521, "b": 214.36273000000006, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3.6.6 Activating RCAC"}, {"label": "text", "id": 1, "page_no": 13, "cluster": {"id": 1, "label": "text", "bbox": {"l": 136.8, "t": 228.52868999999998, "r": 547.22565, "b": 261.74132999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9768574237823486, "cells": [{"id": 7, "text": "Now that you have created the row permission and the two column masks, RCAC must be ", "bbox": {"l": 136.8, "t": 228.52868999999998, "r": 537.09131, "b": 237.74170000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "activated. The row permission and the two column masks are enabled (last clause in the ", "bbox": {"l": 136.8, "t": 240.5285, "r": 529.20422, "b": 249.74152000000004, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "scripts), but now you must activate RCAC on the table. To do so, complete the following steps:", "bbox": {"l": 136.8, "t": 252.52832, "r": 547.22565, "b": 261.74132999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Now that you have created the row permission and the two column masks, RCAC must be activated. The row permission and the two column masks are enabled (last clause in the scripts), but now you must activate RCAC on the table. To do so, complete the following steps:"}, {"label": "list_item", "id": 9, "page_no": 13, "cluster": {"id": 9, "label": "list_item", "bbox": {"l": 136.8, "t": 269.50811999999996, "r": 409.47888, "b": 278.72113, "coord_origin": "TOPLEFT"}, "confidence": 0.9059441685676575, "cells": [{"id": 10, "text": "1.", "bbox": {"l": 136.8, "t": 269.50811999999996, "r": 145.32378, "b": 278.72113, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Run the SQL statements that are shown in Example 3-10.", "bbox": {"l": 148.16501, "t": 269.50811999999996, "r": 409.47888, "b": 278.72113, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1. Run the SQL statements that are shown in Example 3-10."}, {"label": "section_header", "id": 11, "page_no": 13, "cluster": {"id": 11, "label": "section_header", "bbox": {"l": 136.8, "t": 291.55798, "r": 375.29099, "b": 299.88300000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.657009482383728, "cells": [{"id": 12, "text": "Example 3-10 Activating RCAC on the EMPLOYEES table ", "bbox": {"l": 136.8, "t": 291.55798, "r": 375.29099, "b": 299.88300000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Example 3-10 Activating RCAC on the EMPLOYEES table"}, {"label": "list_item", "id": 13, "page_no": 13, "cluster": {"id": 13, "label": "list_item", "bbox": {"l": 136.8, "t": 308.65811, "r": 376.67661, "b": 317.43289, "coord_origin": "TOPLEFT"}, "confidence": 0.6002400517463684, "cells": [{"id": 13, "text": "/*", "bbox": {"l": 136.8, "t": 308.65811, "r": 147.22942, "b": 317.43289, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Active Row Access Control (permissions) */", "bbox": {"l": 157.65884, "t": 308.65811, "r": 376.67661, "b": 317.43289, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "/* Active Row Access Control (permissions) */"}, {"label": "list_item", "id": 14, "page_no": 13, "cluster": {"id": 14, "label": "list_item", "bbox": {"l": 136.8, "t": 320.65793, "r": 354.86963, "b": 329.43271, "coord_origin": "TOPLEFT"}, "confidence": 0.598584771156311, "cells": [{"id": 15, "text": "/*", "bbox": {"l": 136.8, "t": 320.65793, "r": 147.70349, "b": 329.43271, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Active Column Access Control (masks)", "bbox": {"l": 158.60696, "t": 320.65793, "r": 354.86963, "b": 329.43271, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "/* Active Column Access Control (masks)"}, {"label": "text", "id": 16, "page_no": 13, "cluster": {"id": 16, "label": "text", "bbox": {"l": 365.77313, "t": 320.65793, "r": 376.67661, "b": 329.43271, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "*/", "bbox": {"l": 365.77313, "t": 320.65793, "r": 376.67661, "b": 329.43271, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "*/"}, {"label": "text", "id": 17, "page_no": 13, "cluster": {"id": 17, "label": "text", "bbox": {"l": 136.8, "t": 332.65775, "r": 291.7178, "b": 341.43253, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "ALTER TABLE HR_SCHEMA.EMPLOYEES", "bbox": {"l": 136.8, "t": 332.65775, "r": 291.7178, "b": 341.43253, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "ALTER TABLE HR_SCHEMA.EMPLOYEES"}, {"label": "text", "id": 18, "page_no": 13, "cluster": {"id": 18, "label": "text", "bbox": {"l": 136.8, "t": 344.65756, "r": 271.67831, "b": 353.43234000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "ACTIVATE ROW ACCESS CONTROL", "bbox": {"l": 136.8, "t": 344.65756, "r": 271.67831, "b": 353.43234000000007, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "ACTIVATE ROW ACCESS CONTROL"}, {"label": "text", "id": 15, "page_no": 13, "cluster": {"id": 15, "label": "text", "bbox": {"l": 136.8, "t": 356.65738, "r": 291.7178, "b": 365.43216, "coord_origin": "TOPLEFT"}, "confidence": 0.5431806445121765, "cells": [{"id": 20, "text": "ACTIVATE COLUMN ACCESS CONTROL;", "bbox": {"l": 136.8, "t": 356.65738, "r": 291.7178, "b": 365.43216, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "ACTIVATE COLUMN ACCESS CONTROL;"}, {"label": "list_item", "id": 6, "page_no": 13, "cluster": {"id": 6, "label": "list_item", "bbox": {"l": 136.8, "t": 380.5076, "r": 540.80145, "b": 413.72021, "coord_origin": "TOPLEFT"}, "confidence": 0.9449257850646973, "cells": [{"id": 21, "text": "2.", "bbox": {"l": 136.8, "t": 380.5076, "r": 145.14954, "b": 389.72058, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "Look at the definition of the EMPLOYEE table, as shown in Figure 3-11. To do this, from ", "bbox": {"l": 147.93271, "t": 380.5076, "r": 540.80145, "b": 389.72058, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "the main navigation pane of System i Navigator, click ", "bbox": {"l": 151.20013, "t": 392.50742, "r": 387.36169, "b": 401.7203999999999, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "Schemas", "bbox": {"l": 387.29993, "t": 392.50742, "r": 431.07614, "b": 401.7203999999999, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "\uf0ae", "bbox": {"l": 433.85992000000005, "t": 389.64889999999997, "r": 443.69043, "b": 401.83994, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "HR_SCHEMA", "bbox": {"l": 446.51906999999994, "t": 392.50742, "r": 509.73618000000005, "b": 401.7203999999999, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "\uf0ae", "bbox": {"l": 512.5788, "t": 389.64889999999997, "r": 522.4093, "b": 401.83994, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Tables", "bbox": {"l": 151.19812, "t": 404.50723000000005, "r": 181.12892, "b": 413.72021, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": ", right-click the ", "bbox": {"l": 181.79823, "t": 404.50723000000005, "r": 248.99638, "b": 413.72021, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "EMPLOYEES", "bbox": {"l": 248.93860000000004, "t": 404.50723000000005, "r": 310.44357, "b": 413.72021, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": " table, and click ", "bbox": {"l": 310.49835, "t": 404.50723000000005, "r": 381.53305, "b": 413.72021, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Definition", "bbox": {"l": 381.59882, "t": 404.50723000000005, "r": 427.68176, "b": 413.72021, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": ".", "bbox": {"l": 427.67877, "t": 404.50723000000005, "r": 430.4476599999999, "b": 413.72021, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2. Look at the definition of the EMPLOYEE table, as shown in Figure 3-11. To do this, from the main navigation pane of System i Navigator, click Schemas \uf0ae HR_SCHEMA \uf0ae Tables , right-click the EMPLOYEES table, and click Definition ."}, {"label": "caption", "id": 5, "page_no": 13, "cluster": {"id": 5, "label": "caption", "bbox": {"l": 64.800003, "t": 649.0378900000001, "r": 347.43054, "b": 657.3629, "coord_origin": "TOPLEFT"}, "confidence": 0.9499983787536621, "cells": [{"id": 34, "text": "Figure 3-11 Selecting the EMPLOYEES table from System i Navigator", "bbox": {"l": 64.800003, "t": 649.0378900000001, "r": 347.43054, "b": 657.3629, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 3-11 Selecting the EMPLOYEES table from System i Navigator"}, {"label": "picture", "id": 3, "page_no": 13, "cluster": {"id": 3, "label": "picture", "bbox": {"l": 63.801902770996094, "t": 95.38241577148438, "r": 547.11474609375, "b": 170.0321502685547, "coord_origin": "TOPLEFT"}, "confidence": 0.9635388851165771, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "picture", "id": 0, "page_no": 13, "cluster": {"id": 0, "label": "picture", "bbox": {"l": 63.985130310058594, "t": 427.90496826171875, "r": 530.0478515625, "b": 646.1396484375, "coord_origin": "TOPLEFT"}, "confidence": 0.9801459908485413, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "body": [{"label": "list_item", "id": 10, "page_no": 13, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 136.8, "t": 71.50867000000005, "r": 449.9523899999999, "b": 80.72167999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.8751048445701599, "cells": [{"id": 2, "text": "3.", "bbox": {"l": 136.8, "t": 71.50867000000005, "r": 145.22156, "b": 80.72167999999999, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Figure 3-10 shows the masks that are created in the HR_SCHEMA.", "bbox": {"l": 148.02872, "t": 71.50867000000005, "r": 449.9523899999999, "b": 80.72167999999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3. Figure 3-10 shows the masks that are created in the HR_SCHEMA."}, {"label": "caption", "id": 7, "page_no": 13, "cluster": {"id": 7, "label": "caption", "bbox": {"l": 64.800003, "t": 173.53801999999996, "r": 293.13809, "b": 181.86298, "coord_origin": "TOPLEFT"}, "confidence": 0.944426953792572, "cells": [{"id": 4, "text": "Figure 3-10 Column masks shown in System i Navigator", "bbox": {"l": 64.800003, "t": 173.53801999999996, "r": 293.13809, "b": 181.86298, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 3-10 Column masks shown in System i Navigator"}, {"label": "section_header", "id": 2, "page_no": 13, "cluster": {"id": 2, "label": "section_header", "bbox": {"l": 64.800003, "t": 202.37469, "r": 203.98521, "b": 214.36273000000006, "coord_origin": "TOPLEFT"}, "confidence": 0.9645015001296997, "cells": [{"id": 5, "text": "3.6.6", "bbox": {"l": 64.800003, "t": 202.37469, "r": 94.275139, "b": 214.36273000000006, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Activating RCAC", "bbox": {"l": 97.959534, "t": 202.37469, "r": 203.98521, "b": 214.36273000000006, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3.6.6 Activating RCAC"}, {"label": "text", "id": 1, "page_no": 13, "cluster": {"id": 1, "label": "text", "bbox": {"l": 136.8, "t": 228.52868999999998, "r": 547.22565, "b": 261.74132999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9768574237823486, "cells": [{"id": 7, "text": "Now that you have created the row permission and the two column masks, RCAC must be ", "bbox": {"l": 136.8, "t": 228.52868999999998, "r": 537.09131, "b": 237.74170000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "activated. The row permission and the two column masks are enabled (last clause in the ", "bbox": {"l": 136.8, "t": 240.5285, "r": 529.20422, "b": 249.74152000000004, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "scripts), but now you must activate RCAC on the table. To do so, complete the following steps:", "bbox": {"l": 136.8, "t": 252.52832, "r": 547.22565, "b": 261.74132999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Now that you have created the row permission and the two column masks, RCAC must be activated. The row permission and the two column masks are enabled (last clause in the scripts), but now you must activate RCAC on the table. To do so, complete the following steps:"}, {"label": "list_item", "id": 9, "page_no": 13, "cluster": {"id": 9, "label": "list_item", "bbox": {"l": 136.8, "t": 269.50811999999996, "r": 409.47888, "b": 278.72113, "coord_origin": "TOPLEFT"}, "confidence": 0.9059441685676575, "cells": [{"id": 10, "text": "1.", "bbox": {"l": 136.8, "t": 269.50811999999996, "r": 145.32378, "b": 278.72113, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Run the SQL statements that are shown in Example 3-10.", "bbox": {"l": 148.16501, "t": 269.50811999999996, "r": 409.47888, "b": 278.72113, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1. Run the SQL statements that are shown in Example 3-10."}, {"label": "section_header", "id": 11, "page_no": 13, "cluster": {"id": 11, "label": "section_header", "bbox": {"l": 136.8, "t": 291.55798, "r": 375.29099, "b": 299.88300000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.657009482383728, "cells": [{"id": 12, "text": "Example 3-10 Activating RCAC on the EMPLOYEES table ", "bbox": {"l": 136.8, "t": 291.55798, "r": 375.29099, "b": 299.88300000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Example 3-10 Activating RCAC on the EMPLOYEES table"}, {"label": "list_item", "id": 13, "page_no": 13, "cluster": {"id": 13, "label": "list_item", "bbox": {"l": 136.8, "t": 308.65811, "r": 376.67661, "b": 317.43289, "coord_origin": "TOPLEFT"}, "confidence": 0.6002400517463684, "cells": [{"id": 13, "text": "/*", "bbox": {"l": 136.8, "t": 308.65811, "r": 147.22942, "b": 317.43289, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Active Row Access Control (permissions) */", "bbox": {"l": 157.65884, "t": 308.65811, "r": 376.67661, "b": 317.43289, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "/* Active Row Access Control (permissions) */"}, {"label": "list_item", "id": 14, "page_no": 13, "cluster": {"id": 14, "label": "list_item", "bbox": {"l": 136.8, "t": 320.65793, "r": 354.86963, "b": 329.43271, "coord_origin": "TOPLEFT"}, "confidence": 0.598584771156311, "cells": [{"id": 15, "text": "/*", "bbox": {"l": 136.8, "t": 320.65793, "r": 147.70349, "b": 329.43271, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Active Column Access Control (masks)", "bbox": {"l": 158.60696, "t": 320.65793, "r": 354.86963, "b": 329.43271, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "/* Active Column Access Control (masks)"}, {"label": "text", "id": 16, "page_no": 13, "cluster": {"id": 16, "label": "text", "bbox": {"l": 365.77313, "t": 320.65793, "r": 376.67661, "b": 329.43271, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "*/", "bbox": {"l": 365.77313, "t": 320.65793, "r": 376.67661, "b": 329.43271, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "*/"}, {"label": "text", "id": 17, "page_no": 13, "cluster": {"id": 17, "label": "text", "bbox": {"l": 136.8, "t": 332.65775, "r": 291.7178, "b": 341.43253, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "ALTER TABLE HR_SCHEMA.EMPLOYEES", "bbox": {"l": 136.8, "t": 332.65775, "r": 291.7178, "b": 341.43253, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "ALTER TABLE HR_SCHEMA.EMPLOYEES"}, {"label": "text", "id": 18, "page_no": 13, "cluster": {"id": 18, "label": "text", "bbox": {"l": 136.8, "t": 344.65756, "r": 271.67831, "b": 353.43234000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "ACTIVATE ROW ACCESS CONTROL", "bbox": {"l": 136.8, "t": 344.65756, "r": 271.67831, "b": 353.43234000000007, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "ACTIVATE ROW ACCESS CONTROL"}, {"label": "text", "id": 15, "page_no": 13, "cluster": {"id": 15, "label": "text", "bbox": {"l": 136.8, "t": 356.65738, "r": 291.7178, "b": 365.43216, "coord_origin": "TOPLEFT"}, "confidence": 0.5431806445121765, "cells": [{"id": 20, "text": "ACTIVATE COLUMN ACCESS CONTROL;", "bbox": {"l": 136.8, "t": 356.65738, "r": 291.7178, "b": 365.43216, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "ACTIVATE COLUMN ACCESS CONTROL;"}, {"label": "list_item", "id": 6, "page_no": 13, "cluster": {"id": 6, "label": "list_item", "bbox": {"l": 136.8, "t": 380.5076, "r": 540.80145, "b": 413.72021, "coord_origin": "TOPLEFT"}, "confidence": 0.9449257850646973, "cells": [{"id": 21, "text": "2.", "bbox": {"l": 136.8, "t": 380.5076, "r": 145.14954, "b": 389.72058, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "Look at the definition of the EMPLOYEE table, as shown in Figure 3-11. To do this, from ", "bbox": {"l": 147.93271, "t": 380.5076, "r": 540.80145, "b": 389.72058, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "the main navigation pane of System i Navigator, click ", "bbox": {"l": 151.20013, "t": 392.50742, "r": 387.36169, "b": 401.7203999999999, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "Schemas", "bbox": {"l": 387.29993, "t": 392.50742, "r": 431.07614, "b": 401.7203999999999, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "\uf0ae", "bbox": {"l": 433.85992000000005, "t": 389.64889999999997, "r": 443.69043, "b": 401.83994, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "HR_SCHEMA", "bbox": {"l": 446.51906999999994, "t": 392.50742, "r": 509.73618000000005, "b": 401.7203999999999, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "\uf0ae", "bbox": {"l": 512.5788, "t": 389.64889999999997, "r": 522.4093, "b": 401.83994, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Tables", "bbox": {"l": 151.19812, "t": 404.50723000000005, "r": 181.12892, "b": 413.72021, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": ", right-click the ", "bbox": {"l": 181.79823, "t": 404.50723000000005, "r": 248.99638, "b": 413.72021, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "EMPLOYEES", "bbox": {"l": 248.93860000000004, "t": 404.50723000000005, "r": 310.44357, "b": 413.72021, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": " table, and click ", "bbox": {"l": 310.49835, "t": 404.50723000000005, "r": 381.53305, "b": 413.72021, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Definition", "bbox": {"l": 381.59882, "t": 404.50723000000005, "r": 427.68176, "b": 413.72021, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": ".", "bbox": {"l": 427.67877, "t": 404.50723000000005, "r": 430.4476599999999, "b": 413.72021, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2. Look at the definition of the EMPLOYEE table, as shown in Figure 3-11. To do this, from the main navigation pane of System i Navigator, click Schemas \uf0ae HR_SCHEMA \uf0ae Tables , right-click the EMPLOYEES table, and click Definition ."}, {"label": "caption", "id": 5, "page_no": 13, "cluster": {"id": 5, "label": "caption", "bbox": {"l": 64.800003, "t": 649.0378900000001, "r": 347.43054, "b": 657.3629, "coord_origin": "TOPLEFT"}, "confidence": 0.9499983787536621, "cells": [{"id": 34, "text": "Figure 3-11 Selecting the EMPLOYEES table from System i Navigator", "bbox": {"l": 64.800003, "t": 649.0378900000001, "r": 347.43054, "b": 657.3629, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 3-11 Selecting the EMPLOYEES table from System i Navigator"}, {"label": "picture", "id": 3, "page_no": 13, "cluster": {"id": 3, "label": "picture", "bbox": {"l": 63.801902770996094, "t": 95.38241577148438, "r": 547.11474609375, "b": 170.0321502685547, "coord_origin": "TOPLEFT"}, "confidence": 0.9635388851165771, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "picture", "id": 0, "page_no": 13, "cluster": {"id": 0, "label": "picture", "bbox": {"l": 63.985130310058594, "t": 427.90496826171875, "r": 530.0478515625, "b": 646.1396484375, "coord_origin": "TOPLEFT"}, "confidence": 0.9801459908485413, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "headers": [{"label": "page_footer", "id": 8, "page_no": 13, "cluster": {"id": 8, "label": "page_footer", "bbox": {"l": 64.800003, "t": 754.848721, "r": 78.402, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.9161998629570007, "cells": [{"id": 0, "text": "28 ", "bbox": {"l": 64.800003, "t": 754.848721, "r": 78.402, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "28"}, {"label": "page_footer", "id": 4, "page_no": 13, "cluster": {"id": 4, "label": "page_footer", "bbox": {"l": 93.420303, "t": 755.538002, "r": 334.42142, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9540064334869385, "cells": [{"id": 1, "text": "Row and Column Access Control Support in IBM DB2 for i", "bbox": {"l": 93.420303, "t": 755.538002, "r": 334.42142, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Row and Column Access Control Support in IBM DB2 for i"}]}}, {"page_no": 14, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "Chapter 4. Implementing Row and Column Access Control: Banking example ", "bbox": {"l": 214.8, "t": 755.538002, "r": 523.59357, "b": 763.863001, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "77", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "2.", "bbox": {"l": 136.79959, "t": 71.50903000000005, "r": 145.19554, "b": 80.72204999999985, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Figure 4-68 shows the Visual Explain of the same SQL statement, but with RCAC ", "bbox": {"l": 147.9942, "t": 71.50903000000005, "r": 513.35919, "b": 80.72204999999985, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "enabled. It is clear that the implementation of the SQL statement is more complex ", "bbox": {"l": 151.19975, "t": 83.50885000000017, "r": 514.04858, "b": 92.72185999999999, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "because the row permission rule becomes part of the ", "bbox": {"l": 151.19975, "t": 95.50867000000005, "r": 389.64822, "b": 104.72167999999999, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "WHERE", "bbox": {"l": 389.57941, "t": 95.65808000000015, "r": 414.53918, "b": 104.48266999999998, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": " clause.", "bbox": {"l": 414.59991, "t": 95.50867000000005, "r": 448.8892200000001, "b": 104.72167999999999, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Figure 4-68 Visual Explain with RCAC enabled", "bbox": {"l": 136.8, "t": 480.55798, "r": 327.09329, "b": 488.883, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "3.", "bbox": {"l": 136.8, "t": 506.56863, "r": 145.17432, "b": 515.78162, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Compare the advised indexes that are provided by the Optimizer without RCAC and with ", "bbox": {"l": 147.96574, "t": 506.56863, "r": 543.63715, "b": 515.78162, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "RCAC enabled. Figure 4-69 shows the index advice for the SQL statement without RCAC ", "bbox": {"l": 151.20016, "t": 518.56845, "r": 547.23944, "b": 527.78143, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "enabled. The index being advised is for the ORDER BY clause.", "bbox": {"l": 151.20016, "t": 530.5682400000001, "r": 430.28333, "b": 539.78125, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Figure 4-69 Index advice with no RCAC", "bbox": {"l": 64.800003, "t": 667.5179, "r": 227.10149, "b": 675.8429, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 4, "label": "page_footer", "bbox": {"l": 214.8, "t": 755.538002, "r": 523.59357, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.95576012134552, "cells": [{"id": 0, "text": "Chapter 4. Implementing Row and Column Access Control: Banking example ", "bbox": {"l": 214.8, "t": 755.538002, "r": 523.59357, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "page_footer", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.9056528806686401, "cells": [{"id": 1, "text": "77", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "list_item", "bbox": {"l": 136.79959, "t": 71.50903000000005, "r": 514.04858, "b": 104.72167999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9761855006217957, "cells": [{"id": 2, "text": "2.", "bbox": {"l": 136.79959, "t": 71.50903000000005, "r": 145.19554, "b": 80.72204999999985, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Figure 4-68 shows the Visual Explain of the same SQL statement, but with RCAC ", "bbox": {"l": 147.9942, "t": 71.50903000000005, "r": 513.35919, "b": 80.72204999999985, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "enabled. It is clear that the implementation of the SQL statement is more complex ", "bbox": {"l": 151.19975, "t": 83.50885000000017, "r": 514.04858, "b": 92.72185999999999, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "because the row permission rule becomes part of the ", "bbox": {"l": 151.19975, "t": 95.50867000000005, "r": 389.64822, "b": 104.72167999999999, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "WHERE", "bbox": {"l": 389.57941, "t": 95.65808000000015, "r": 414.53918, "b": 104.48266999999998, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": " clause.", "bbox": {"l": 414.59991, "t": 95.50867000000005, "r": 448.8892200000001, "b": 104.72167999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "caption", "bbox": {"l": 136.8, "t": 480.55798, "r": 327.09329, "b": 488.883, "coord_origin": "TOPLEFT"}, "confidence": 0.9529654383659363, "cells": [{"id": 8, "text": "Figure 4-68 Visual Explain with RCAC enabled", "bbox": {"l": 136.8, "t": 480.55798, "r": 327.09329, "b": 488.883, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "list_item", "bbox": {"l": 136.8, "t": 506.56863, "r": 547.23944, "b": 539.78125, "coord_origin": "TOPLEFT"}, "confidence": 0.9766736626625061, "cells": [{"id": 9, "text": "3.", "bbox": {"l": 136.8, "t": 506.56863, "r": 145.17432, "b": 515.78162, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Compare the advised indexes that are provided by the Optimizer without RCAC and with ", "bbox": {"l": 147.96574, "t": 506.56863, "r": 543.63715, "b": 515.78162, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "RCAC enabled. Figure 4-69 shows the index advice for the SQL statement without RCAC ", "bbox": {"l": 151.20016, "t": 518.56845, "r": 547.23944, "b": 527.78143, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "enabled. The index being advised is for the ORDER BY clause.", "bbox": {"l": 151.20016, "t": 530.5682400000001, "r": 430.28333, "b": 539.78125, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "caption", "bbox": {"l": 64.800003, "t": 667.5179, "r": 227.10149, "b": 675.8429, "coord_origin": "TOPLEFT"}, "confidence": 0.9514285922050476, "cells": [{"id": 13, "text": "Figure 4-69 Index advice with no RCAC", "bbox": {"l": 64.800003, "t": 667.5179, "r": 227.10149, "b": 675.8429, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "picture", "bbox": {"l": 136.5016632080078, "t": 119.2491226196289, "r": 545.4508666992188, "b": 477.5412292480469, "coord_origin": "TOPLEFT"}, "confidence": 0.9864527583122253, "cells": [], "children": []}, {"id": 1, "label": "picture", "bbox": {"l": 64.27847290039062, "t": 553.5814819335938, "r": 506.39263916015625, "b": 664.0870971679688, "coord_origin": "TOPLEFT"}, "confidence": 0.9797719120979309, "cells": [], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_footer", "id": 4, "page_no": 14, "cluster": {"id": 4, "label": "page_footer", "bbox": {"l": 214.8, "t": 755.538002, "r": 523.59357, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.95576012134552, "cells": [{"id": 0, "text": "Chapter 4. Implementing Row and Column Access Control: Banking example ", "bbox": {"l": 214.8, "t": 755.538002, "r": 523.59357, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Chapter 4. Implementing Row and Column Access Control: Banking example"}, {"label": "page_footer", "id": 7, "page_no": 14, "cluster": {"id": 7, "label": "page_footer", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.9056528806686401, "cells": [{"id": 1, "text": "77", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "77"}, {"label": "list_item", "id": 3, "page_no": 14, "cluster": {"id": 3, "label": "list_item", "bbox": {"l": 136.79959, "t": 71.50903000000005, "r": 514.04858, "b": 104.72167999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9761855006217957, "cells": [{"id": 2, "text": "2.", "bbox": {"l": 136.79959, "t": 71.50903000000005, "r": 145.19554, "b": 80.72204999999985, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Figure 4-68 shows the Visual Explain of the same SQL statement, but with RCAC ", "bbox": {"l": 147.9942, "t": 71.50903000000005, "r": 513.35919, "b": 80.72204999999985, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "enabled. It is clear that the implementation of the SQL statement is more complex ", "bbox": {"l": 151.19975, "t": 83.50885000000017, "r": 514.04858, "b": 92.72185999999999, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "because the row permission rule becomes part of the ", "bbox": {"l": 151.19975, "t": 95.50867000000005, "r": 389.64822, "b": 104.72167999999999, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "WHERE", "bbox": {"l": 389.57941, "t": 95.65808000000015, "r": 414.53918, "b": 104.48266999999998, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": " clause.", "bbox": {"l": 414.59991, "t": 95.50867000000005, "r": 448.8892200000001, "b": 104.72167999999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2. Figure 4-68 shows the Visual Explain of the same SQL statement, but with RCAC enabled. It is clear that the implementation of the SQL statement is more complex because the row permission rule becomes part of the WHERE clause."}, {"label": "caption", "id": 5, "page_no": 14, "cluster": {"id": 5, "label": "caption", "bbox": {"l": 136.8, "t": 480.55798, "r": 327.09329, "b": 488.883, "coord_origin": "TOPLEFT"}, "confidence": 0.9529654383659363, "cells": [{"id": 8, "text": "Figure 4-68 Visual Explain with RCAC enabled", "bbox": {"l": 136.8, "t": 480.55798, "r": 327.09329, "b": 488.883, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 4-68 Visual Explain with RCAC enabled"}, {"label": "list_item", "id": 2, "page_no": 14, "cluster": {"id": 2, "label": "list_item", "bbox": {"l": 136.8, "t": 506.56863, "r": 547.23944, "b": 539.78125, "coord_origin": "TOPLEFT"}, "confidence": 0.9766736626625061, "cells": [{"id": 9, "text": "3.", "bbox": {"l": 136.8, "t": 506.56863, "r": 145.17432, "b": 515.78162, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Compare the advised indexes that are provided by the Optimizer without RCAC and with ", "bbox": {"l": 147.96574, "t": 506.56863, "r": 543.63715, "b": 515.78162, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "RCAC enabled. Figure 4-69 shows the index advice for the SQL statement without RCAC ", "bbox": {"l": 151.20016, "t": 518.56845, "r": 547.23944, "b": 527.78143, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "enabled. The index being advised is for the ORDER BY clause.", "bbox": {"l": 151.20016, "t": 530.5682400000001, "r": 430.28333, "b": 539.78125, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3. Compare the advised indexes that are provided by the Optimizer without RCAC and with RCAC enabled. Figure 4-69 shows the index advice for the SQL statement without RCAC enabled. The index being advised is for the ORDER BY clause."}, {"label": "caption", "id": 6, "page_no": 14, "cluster": {"id": 6, "label": "caption", "bbox": {"l": 64.800003, "t": 667.5179, "r": 227.10149, "b": 675.8429, "coord_origin": "TOPLEFT"}, "confidence": 0.9514285922050476, "cells": [{"id": 13, "text": "Figure 4-69 Index advice with no RCAC", "bbox": {"l": 64.800003, "t": 667.5179, "r": 227.10149, "b": 675.8429, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 4-69 Index advice with no RCAC"}, {"label": "picture", "id": 0, "page_no": 14, "cluster": {"id": 0, "label": "picture", "bbox": {"l": 136.5016632080078, "t": 119.2491226196289, "r": 545.4508666992188, "b": 477.5412292480469, "coord_origin": "TOPLEFT"}, "confidence": 0.9864527583122253, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "picture", "id": 1, "page_no": 14, "cluster": {"id": 1, "label": "picture", "bbox": {"l": 64.27847290039062, "t": 553.5814819335938, "r": 506.39263916015625, "b": 664.0870971679688, "coord_origin": "TOPLEFT"}, "confidence": 0.9797719120979309, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "body": [{"label": "list_item", "id": 3, "page_no": 14, "cluster": {"id": 3, "label": "list_item", "bbox": {"l": 136.79959, "t": 71.50903000000005, "r": 514.04858, "b": 104.72167999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9761855006217957, "cells": [{"id": 2, "text": "2.", "bbox": {"l": 136.79959, "t": 71.50903000000005, "r": 145.19554, "b": 80.72204999999985, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Figure 4-68 shows the Visual Explain of the same SQL statement, but with RCAC ", "bbox": {"l": 147.9942, "t": 71.50903000000005, "r": 513.35919, "b": 80.72204999999985, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "enabled. It is clear that the implementation of the SQL statement is more complex ", "bbox": {"l": 151.19975, "t": 83.50885000000017, "r": 514.04858, "b": 92.72185999999999, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "because the row permission rule becomes part of the ", "bbox": {"l": 151.19975, "t": 95.50867000000005, "r": 389.64822, "b": 104.72167999999999, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "WHERE", "bbox": {"l": 389.57941, "t": 95.65808000000015, "r": 414.53918, "b": 104.48266999999998, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": " clause.", "bbox": {"l": 414.59991, "t": 95.50867000000005, "r": 448.8892200000001, "b": 104.72167999999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2. Figure 4-68 shows the Visual Explain of the same SQL statement, but with RCAC enabled. It is clear that the implementation of the SQL statement is more complex because the row permission rule becomes part of the WHERE clause."}, {"label": "caption", "id": 5, "page_no": 14, "cluster": {"id": 5, "label": "caption", "bbox": {"l": 136.8, "t": 480.55798, "r": 327.09329, "b": 488.883, "coord_origin": "TOPLEFT"}, "confidence": 0.9529654383659363, "cells": [{"id": 8, "text": "Figure 4-68 Visual Explain with RCAC enabled", "bbox": {"l": 136.8, "t": 480.55798, "r": 327.09329, "b": 488.883, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 4-68 Visual Explain with RCAC enabled"}, {"label": "list_item", "id": 2, "page_no": 14, "cluster": {"id": 2, "label": "list_item", "bbox": {"l": 136.8, "t": 506.56863, "r": 547.23944, "b": 539.78125, "coord_origin": "TOPLEFT"}, "confidence": 0.9766736626625061, "cells": [{"id": 9, "text": "3.", "bbox": {"l": 136.8, "t": 506.56863, "r": 145.17432, "b": 515.78162, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Compare the advised indexes that are provided by the Optimizer without RCAC and with ", "bbox": {"l": 147.96574, "t": 506.56863, "r": 543.63715, "b": 515.78162, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "RCAC enabled. Figure 4-69 shows the index advice for the SQL statement without RCAC ", "bbox": {"l": 151.20016, "t": 518.56845, "r": 547.23944, "b": 527.78143, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "enabled. The index being advised is for the ORDER BY clause.", "bbox": {"l": 151.20016, "t": 530.5682400000001, "r": 430.28333, "b": 539.78125, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3. Compare the advised indexes that are provided by the Optimizer without RCAC and with RCAC enabled. Figure 4-69 shows the index advice for the SQL statement without RCAC enabled. The index being advised is for the ORDER BY clause."}, {"label": "caption", "id": 6, "page_no": 14, "cluster": {"id": 6, "label": "caption", "bbox": {"l": 64.800003, "t": 667.5179, "r": 227.10149, "b": 675.8429, "coord_origin": "TOPLEFT"}, "confidence": 0.9514285922050476, "cells": [{"id": 13, "text": "Figure 4-69 Index advice with no RCAC", "bbox": {"l": 64.800003, "t": 667.5179, "r": 227.10149, "b": 675.8429, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 4-69 Index advice with no RCAC"}, {"label": "picture", "id": 0, "page_no": 14, "cluster": {"id": 0, "label": "picture", "bbox": {"l": 136.5016632080078, "t": 119.2491226196289, "r": 545.4508666992188, "b": 477.5412292480469, "coord_origin": "TOPLEFT"}, "confidence": 0.9864527583122253, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "picture", "id": 1, "page_no": 14, "cluster": {"id": 1, "label": "picture", "bbox": {"l": 64.27847290039062, "t": 553.5814819335938, "r": 506.39263916015625, "b": 664.0870971679688, "coord_origin": "TOPLEFT"}, "confidence": 0.9797719120979309, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "headers": [{"label": "page_footer", "id": 4, "page_no": 14, "cluster": {"id": 4, "label": "page_footer", "bbox": {"l": 214.8, "t": 755.538002, "r": 523.59357, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.95576012134552, "cells": [{"id": 0, "text": "Chapter 4. Implementing Row and Column Access Control: Banking example ", "bbox": {"l": 214.8, "t": 755.538002, "r": 523.59357, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Chapter 4. Implementing Row and Column Access Control: Banking example"}, {"label": "page_footer", "id": 7, "page_no": 14, "cluster": {"id": 7, "label": "page_footer", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.9056528806686401, "cells": [{"id": 1, "text": "77", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "77"}]}}, {"page_no": 15, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "124 ", "bbox": {"l": 64.800003, "t": 754.848721, "r": 83.982002, "b": 764.06172, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Row and Column Access Control Support in IBM DB2 for i", "bbox": {"l": 98.940002, "t": 755.538002, "r": 339.81958, "b": 763.863001, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "THEN C . CUSTOMER_TAX_ID ", "bbox": {"l": 64.800308, "t": 71.67296999999996, "r": 177.1194, "b": 79.60199, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'TELLER' ) = 1 ", "bbox": {"l": 64.800308, "t": 82.65295000000015, "r": 365.87817, "b": 90.58196999999996, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "THEN ( 'XXX-XX-' CONCAT QSYS2 . SUBSTR ( C . CUSTOMER_TAX_ID , 8 , 4 ) ) ", "bbox": {"l": 64.800308, "t": 93.63292999999999, "r": 392.81787, "b": 101.56195000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 ", "bbox": {"l": 64.800308, "t": 104.67322000000001, "r": 374.87817, "b": 112.60222999999996, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "THEN C . CUSTOMER_TAX_ID ", "bbox": {"l": 64.800308, "t": 115.65319999999997, "r": 177.1194, "b": 123.58220999999992, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "ELSE 'XXX-XX-XXXX' ", "bbox": {"l": 64.800308, "t": 126.63318000000015, "r": 150.1797, "b": 134.56219, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "END ", "bbox": {"l": 64.800308, "t": 137.67345999999998, "r": 96.240005, "b": 145.60248, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "ENABLE ; ", "bbox": {"l": 79.20031, "t": 148.65344000000005, "r": 124.14001, "b": 156.58245999999997, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "CREATE MASK BANK_SCHEMA.MASK_DRIVERS_LICENSE_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C ", "bbox": {"l": 64.800308, "t": 170.67377, "r": 460.25757, "b": 178.60278000000005, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "FOR COLUMN CUSTOMER_DRIVERS_LICENSE_NUMBER ", "bbox": {"l": 79.20031, "t": 181.65374999999995, "r": 272.45911, "b": 189.58276, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "RETURN CASE ", "bbox": {"l": 79.20031, "t": 192.69403, "r": 137.64001, "b": 200.62305000000003, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 ", "bbox": {"l": 64.800308, "t": 203.67400999999995, "r": 361.37817, "b": 211.60303, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "THEN C . CUSTOMER_DRIVERS_LICENSE_NUMBER ", "bbox": {"l": 64.800308, "t": 214.65399000000002, "r": 249.0591, "b": 222.58300999999994, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'TELLER' ) = 1 ", "bbox": {"l": 64.800308, "t": 225.69426999999996, "r": 365.87817, "b": 233.62329, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "THEN C . CUSTOMER_DRIVERS_LICENSE_NUMBER ", "bbox": {"l": 64.800308, "t": 236.67426, "r": 249.0591, "b": 244.60326999999995, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 ", "bbox": {"l": 64.800308, "t": 247.65423999999996, "r": 374.87817, "b": 255.58325000000002, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "THEN C . CUSTOMER_DRIVERS_LICENSE_NUMBER ", "bbox": {"l": 64.800308, "t": 258.69452, "r": 249.0591, "b": 266.62354000000005, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "ELSE '*************' ", "bbox": {"l": 64.800308, "t": 269.67449999999997, "r": 159.1797, "b": 277.60352, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "END ", "bbox": {"l": 64.800308, "t": 280.65454, "r": 96.240005, "b": 288.58353, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "ENABLE ; ", "bbox": {"l": 79.20031, "t": 291.69485000000003, "r": 124.14001, "b": 299.62384, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "CREATE MASK BANK_SCHEMA.MASK_LOGIN_ID_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C ", "bbox": {"l": 64.800308, "t": 313.65485, "r": 428.81786999999997, "b": 321.58383, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "FOR COLUMN CUSTOMER_LOGIN_ID ", "bbox": {"l": 79.20031, "t": 324.69516, "r": 209.51941, "b": 332.62415, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "RETURN CASE ", "bbox": {"l": 79.20031, "t": 335.67517, "r": 137.64001, "b": 343.6041599999999, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 ", "bbox": {"l": 64.800308, "t": 346.65518, "r": 361.37817, "b": 354.58417, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "THEN C . CUSTOMER_LOGIN_ID ", "bbox": {"l": 64.800308, "t": 357.69550000000004, "r": 186.1194, "b": 365.62448, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 ", "bbox": {"l": 64.800308, "t": 368.67551, "r": 374.87817, "b": 376.60449, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "THEN C . CUSTOMER_LOGIN_ID ", "bbox": {"l": 64.800308, "t": 379.65552, "r": 186.1194, "b": 387.5845, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "ELSE '*****' ", "bbox": {"l": 64.800308, "t": 390.69583, "r": 123.24001, "b": 398.62482, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "END ", "bbox": {"l": 64.800308, "t": 401.67584, "r": 96.240005, "b": 409.60482999999994, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "ENABLE ; ", "bbox": {"l": 79.20031, "t": 412.65585, "r": 124.14001, "b": 420.58484, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "CREATE MASK BANK_SCHEMA.MASK_SECURITY_QUESTION_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C ", "bbox": {"l": 64.800308, "t": 434.67615, "r": 469.25757, "b": 442.60513, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "FOR COLUMN CUSTOMER_SECURITY_QUESTION ", "bbox": {"l": 79.20031, "t": 445.65616000000006, "r": 249.95911, "b": 453.58514, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "RETURN CASE ", "bbox": {"l": 79.20031, "t": 456.6964699999999, "r": 137.64001, "b": 464.62546, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 ", "bbox": {"l": 64.800308, "t": 467.67648, "r": 361.37817, "b": 475.60547, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "THEN C . CUSTOMER_SECURITY_QUESTION ", "bbox": {"l": 64.800308, "t": 478.65649, "r": 226.5591, "b": 486.58548, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 ", "bbox": {"l": 64.800308, "t": 489.69681, "r": 374.87817, "b": 497.62579, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "THEN C . CUSTOMER_SECURITY_QUESTION ", "bbox": {"l": 64.800308, "t": 500.67682, "r": 226.5591, "b": 508.6058, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "ELSE '*****' ", "bbox": {"l": 64.800308, "t": 511.65683, "r": 123.24001, "b": 519.58582, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "END ", "bbox": {"l": 64.800308, "t": 522.69714, "r": 96.240005, "b": 530.62613, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "ENABLE ; ", "bbox": {"l": 79.20031, "t": 533.6771200000001, "r": 124.14001, "b": 541.60614, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "CREATE MASK BANK_SCHEMA.MASK_SECURITY_QUESTION_ANSWER_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C ", "bbox": {"l": 64.800308, "t": 555.69745, "r": 500.69727, "b": 563.62645, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "FOR COLUMN CUSTOMER_SECURITY_QUESTION_ANSWER ", "bbox": {"l": 79.20031, "t": 566.6774399999999, "r": 281.3988, "b": 574.60645, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "RETURN CASE ", "bbox": {"l": 79.20031, "t": 577.65744, "r": 137.64001, "b": 585.58644, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 ", "bbox": {"l": 64.800308, "t": 588.6977400000001, "r": 361.37817, "b": 596.62674, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "THEN C . CUSTOMER_SECURITY_QUESTION_ANSWER ", "bbox": {"l": 64.800308, "t": 599.67773, "r": 258.05908, "b": 607.60674, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 ", "bbox": {"l": 64.800308, "t": 610.65773, "r": 374.87817, "b": 618.58673, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "THEN C . CUSTOMER_SECURITY_QUESTION_ANSWER ", "bbox": {"l": 64.800308, "t": 621.69803, "r": 258.05908, "b": 629.62703, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "ELSE '*****' ", "bbox": {"l": 64.800308, "t": 632.6780200000001, "r": 123.24001, "b": 640.60703, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "END ", "bbox": {"l": 64.800308, "t": 643.71832, "r": 96.240005, "b": 651.64732, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "ENABLE ; ", "bbox": {"l": 79.20031, "t": 654.69832, "r": 124.14001, "b": 662.62732, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "ALTER TABLE BANK_SCHEMA.CUSTOMERS ", "bbox": {"l": 64.800308, "t": 676.71861, "r": 226.5591, "b": 684.64761, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "ACTIVATE ROW ACCESS CONTROL ", "bbox": {"l": 79.20031, "t": 687.69862, "r": 214.01941, "b": 695.627617, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "ACTIVATE COLUMN ACCESS CONTROL ;", "bbox": {"l": 79.20031, "t": 698.678619, "r": 223.01941, "b": 706.60762, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 1, "label": "page_footer", "bbox": {"l": 64.800003, "t": 754.848721, "r": 83.982002, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.8994001150131226, "cells": [{"id": 0, "text": "124 ", "bbox": {"l": 64.800003, "t": 754.848721, "r": 83.982002, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "page_footer", "bbox": {"l": 98.940002, "t": 755.538002, "r": 339.81958, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.943077027797699, "cells": [{"id": 1, "text": "Row and Column Access Control Support in IBM DB2 for i", "bbox": {"l": 98.940002, "t": 755.538002, "r": 339.81958, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "code", "bbox": {"l": 64.800308, "t": 71.67296999999996, "r": 500.69727, "b": 706.60762, "coord_origin": "TOPLEFT"}, "confidence": 0.7632161378860474, "cells": [{"id": 2, "text": "THEN C . CUSTOMER_TAX_ID ", "bbox": {"l": 64.800308, "t": 71.67296999999996, "r": 177.1194, "b": 79.60199, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'TELLER' ) = 1 ", "bbox": {"l": 64.800308, "t": 82.65295000000015, "r": 365.87817, "b": 90.58196999999996, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "THEN ( 'XXX-XX-' CONCAT QSYS2 . SUBSTR ( C . CUSTOMER_TAX_ID , 8 , 4 ) ) ", "bbox": {"l": 64.800308, "t": 93.63292999999999, "r": 392.81787, "b": 101.56195000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 ", "bbox": {"l": 64.800308, "t": 104.67322000000001, "r": 374.87817, "b": 112.60222999999996, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "THEN C . CUSTOMER_TAX_ID ", "bbox": {"l": 64.800308, "t": 115.65319999999997, "r": 177.1194, "b": 123.58220999999992, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "ELSE 'XXX-XX-XXXX' ", "bbox": {"l": 64.800308, "t": 126.63318000000015, "r": 150.1797, "b": 134.56219, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "END ", "bbox": {"l": 64.800308, "t": 137.67345999999998, "r": 96.240005, "b": 145.60248, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "ENABLE ; ", "bbox": {"l": 79.20031, "t": 148.65344000000005, "r": 124.14001, "b": 156.58245999999997, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "CREATE MASK BANK_SCHEMA.MASK_DRIVERS_LICENSE_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C ", "bbox": {"l": 64.800308, "t": 170.67377, "r": 460.25757, "b": 178.60278000000005, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "FOR COLUMN CUSTOMER_DRIVERS_LICENSE_NUMBER ", "bbox": {"l": 79.20031, "t": 181.65374999999995, "r": 272.45911, "b": 189.58276, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "RETURN CASE ", "bbox": {"l": 79.20031, "t": 192.69403, "r": 137.64001, "b": 200.62305000000003, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 ", "bbox": {"l": 64.800308, "t": 203.67400999999995, "r": 361.37817, "b": 211.60303, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "THEN C . CUSTOMER_DRIVERS_LICENSE_NUMBER ", "bbox": {"l": 64.800308, "t": 214.65399000000002, "r": 249.0591, "b": 222.58300999999994, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'TELLER' ) = 1 ", "bbox": {"l": 64.800308, "t": 225.69426999999996, "r": 365.87817, "b": 233.62329, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "THEN C . CUSTOMER_DRIVERS_LICENSE_NUMBER ", "bbox": {"l": 64.800308, "t": 236.67426, "r": 249.0591, "b": 244.60326999999995, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 ", "bbox": {"l": 64.800308, "t": 247.65423999999996, "r": 374.87817, "b": 255.58325000000002, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "THEN C . CUSTOMER_DRIVERS_LICENSE_NUMBER ", "bbox": {"l": 64.800308, "t": 258.69452, "r": 249.0591, "b": 266.62354000000005, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "ELSE '*************' ", "bbox": {"l": 64.800308, "t": 269.67449999999997, "r": 159.1797, "b": 277.60352, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "END ", "bbox": {"l": 64.800308, "t": 280.65454, "r": 96.240005, "b": 288.58353, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "ENABLE ; ", "bbox": {"l": 79.20031, "t": 291.69485000000003, "r": 124.14001, "b": 299.62384, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "CREATE MASK BANK_SCHEMA.MASK_LOGIN_ID_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C ", "bbox": {"l": 64.800308, "t": 313.65485, "r": 428.81786999999997, "b": 321.58383, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "FOR COLUMN CUSTOMER_LOGIN_ID ", "bbox": {"l": 79.20031, "t": 324.69516, "r": 209.51941, "b": 332.62415, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "RETURN CASE ", "bbox": {"l": 79.20031, "t": 335.67517, "r": 137.64001, "b": 343.6041599999999, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 ", "bbox": {"l": 64.800308, "t": 346.65518, "r": 361.37817, "b": 354.58417, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "THEN C . CUSTOMER_LOGIN_ID ", "bbox": {"l": 64.800308, "t": 357.69550000000004, "r": 186.1194, "b": 365.62448, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 ", "bbox": {"l": 64.800308, "t": 368.67551, "r": 374.87817, "b": 376.60449, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "THEN C . CUSTOMER_LOGIN_ID ", "bbox": {"l": 64.800308, "t": 379.65552, "r": 186.1194, "b": 387.5845, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "ELSE '*****' ", "bbox": {"l": 64.800308, "t": 390.69583, "r": 123.24001, "b": 398.62482, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "END ", "bbox": {"l": 64.800308, "t": 401.67584, "r": 96.240005, "b": 409.60482999999994, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "ENABLE ; ", "bbox": {"l": 79.20031, "t": 412.65585, "r": 124.14001, "b": 420.58484, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "CREATE MASK BANK_SCHEMA.MASK_SECURITY_QUESTION_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C ", "bbox": {"l": 64.800308, "t": 434.67615, "r": 469.25757, "b": 442.60513, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "FOR COLUMN CUSTOMER_SECURITY_QUESTION ", "bbox": {"l": 79.20031, "t": 445.65616000000006, "r": 249.95911, "b": 453.58514, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "RETURN CASE ", "bbox": {"l": 79.20031, "t": 456.6964699999999, "r": 137.64001, "b": 464.62546, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 ", "bbox": {"l": 64.800308, "t": 467.67648, "r": 361.37817, "b": 475.60547, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "THEN C . CUSTOMER_SECURITY_QUESTION ", "bbox": {"l": 64.800308, "t": 478.65649, "r": 226.5591, "b": 486.58548, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 ", "bbox": {"l": 64.800308, "t": 489.69681, "r": 374.87817, "b": 497.62579, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "THEN C . CUSTOMER_SECURITY_QUESTION ", "bbox": {"l": 64.800308, "t": 500.67682, "r": 226.5591, "b": 508.6058, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "ELSE '*****' ", "bbox": {"l": 64.800308, "t": 511.65683, "r": 123.24001, "b": 519.58582, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "END ", "bbox": {"l": 64.800308, "t": 522.69714, "r": 96.240005, "b": 530.62613, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "ENABLE ; ", "bbox": {"l": 79.20031, "t": 533.6771200000001, "r": 124.14001, "b": 541.60614, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "CREATE MASK BANK_SCHEMA.MASK_SECURITY_QUESTION_ANSWER_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C ", "bbox": {"l": 64.800308, "t": 555.69745, "r": 500.69727, "b": 563.62645, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "FOR COLUMN CUSTOMER_SECURITY_QUESTION_ANSWER ", "bbox": {"l": 79.20031, "t": 566.6774399999999, "r": 281.3988, "b": 574.60645, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "RETURN CASE ", "bbox": {"l": 79.20031, "t": 577.65744, "r": 137.64001, "b": 585.58644, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 ", "bbox": {"l": 64.800308, "t": 588.6977400000001, "r": 361.37817, "b": 596.62674, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "THEN C . CUSTOMER_SECURITY_QUESTION_ANSWER ", "bbox": {"l": 64.800308, "t": 599.67773, "r": 258.05908, "b": 607.60674, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 ", "bbox": {"l": 64.800308, "t": 610.65773, "r": 374.87817, "b": 618.58673, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "THEN C . CUSTOMER_SECURITY_QUESTION_ANSWER ", "bbox": {"l": 64.800308, "t": 621.69803, "r": 258.05908, "b": 629.62703, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "ELSE '*****' ", "bbox": {"l": 64.800308, "t": 632.6780200000001, "r": 123.24001, "b": 640.60703, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "END ", "bbox": {"l": 64.800308, "t": 643.71832, "r": 96.240005, "b": 651.64732, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "ENABLE ; ", "bbox": {"l": 79.20031, "t": 654.69832, "r": 124.14001, "b": 662.62732, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "ALTER TABLE BANK_SCHEMA.CUSTOMERS ", "bbox": {"l": 64.800308, "t": 676.71861, "r": 226.5591, "b": 684.64761, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "ACTIVATE ROW ACCESS CONTROL ", "bbox": {"l": 79.20031, "t": 687.69862, "r": 214.01941, "b": 695.627617, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "ACTIVATE COLUMN ACCESS CONTROL ;", "bbox": {"l": 79.20031, "t": 698.678619, "r": 223.01941, "b": 706.60762, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_footer", "id": 1, "page_no": 15, "cluster": {"id": 1, "label": "page_footer", "bbox": {"l": 64.800003, "t": 754.848721, "r": 83.982002, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.8994001150131226, "cells": [{"id": 0, "text": "124 ", "bbox": {"l": 64.800003, "t": 754.848721, "r": 83.982002, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "124"}, {"label": "page_footer", "id": 0, "page_no": 15, "cluster": {"id": 0, "label": "page_footer", "bbox": {"l": 98.940002, "t": 755.538002, "r": 339.81958, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.943077027797699, "cells": [{"id": 1, "text": "Row and Column Access Control Support in IBM DB2 for i", "bbox": {"l": 98.940002, "t": 755.538002, "r": 339.81958, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Row and Column Access Control Support in IBM DB2 for i"}, {"label": "code", "id": 2, "page_no": 15, "cluster": {"id": 2, "label": "code", "bbox": {"l": 64.800308, "t": 71.67296999999996, "r": 500.69727, "b": 706.60762, "coord_origin": "TOPLEFT"}, "confidence": 0.7632161378860474, "cells": [{"id": 2, "text": "THEN C . CUSTOMER_TAX_ID ", "bbox": {"l": 64.800308, "t": 71.67296999999996, "r": 177.1194, "b": 79.60199, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'TELLER' ) = 1 ", "bbox": {"l": 64.800308, "t": 82.65295000000015, "r": 365.87817, "b": 90.58196999999996, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "THEN ( 'XXX-XX-' CONCAT QSYS2 . SUBSTR ( C . CUSTOMER_TAX_ID , 8 , 4 ) ) ", "bbox": {"l": 64.800308, "t": 93.63292999999999, "r": 392.81787, "b": 101.56195000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 ", "bbox": {"l": 64.800308, "t": 104.67322000000001, "r": 374.87817, "b": 112.60222999999996, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "THEN C . CUSTOMER_TAX_ID ", "bbox": {"l": 64.800308, "t": 115.65319999999997, "r": 177.1194, "b": 123.58220999999992, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "ELSE 'XXX-XX-XXXX' ", "bbox": {"l": 64.800308, "t": 126.63318000000015, "r": 150.1797, "b": 134.56219, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "END ", "bbox": {"l": 64.800308, "t": 137.67345999999998, "r": 96.240005, "b": 145.60248, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "ENABLE ; ", "bbox": {"l": 79.20031, "t": 148.65344000000005, "r": 124.14001, "b": 156.58245999999997, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "CREATE MASK BANK_SCHEMA.MASK_DRIVERS_LICENSE_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C ", "bbox": {"l": 64.800308, "t": 170.67377, "r": 460.25757, "b": 178.60278000000005, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "FOR COLUMN CUSTOMER_DRIVERS_LICENSE_NUMBER ", "bbox": {"l": 79.20031, "t": 181.65374999999995, "r": 272.45911, "b": 189.58276, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "RETURN CASE ", "bbox": {"l": 79.20031, "t": 192.69403, "r": 137.64001, "b": 200.62305000000003, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 ", "bbox": {"l": 64.800308, "t": 203.67400999999995, "r": 361.37817, "b": 211.60303, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "THEN C . CUSTOMER_DRIVERS_LICENSE_NUMBER ", "bbox": {"l": 64.800308, "t": 214.65399000000002, "r": 249.0591, "b": 222.58300999999994, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'TELLER' ) = 1 ", "bbox": {"l": 64.800308, "t": 225.69426999999996, "r": 365.87817, "b": 233.62329, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "THEN C . CUSTOMER_DRIVERS_LICENSE_NUMBER ", "bbox": {"l": 64.800308, "t": 236.67426, "r": 249.0591, "b": 244.60326999999995, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 ", "bbox": {"l": 64.800308, "t": 247.65423999999996, "r": 374.87817, "b": 255.58325000000002, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "THEN C . CUSTOMER_DRIVERS_LICENSE_NUMBER ", "bbox": {"l": 64.800308, "t": 258.69452, "r": 249.0591, "b": 266.62354000000005, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "ELSE '*************' ", "bbox": {"l": 64.800308, "t": 269.67449999999997, "r": 159.1797, "b": 277.60352, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "END ", "bbox": {"l": 64.800308, "t": 280.65454, "r": 96.240005, "b": 288.58353, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "ENABLE ; ", "bbox": {"l": 79.20031, "t": 291.69485000000003, "r": 124.14001, "b": 299.62384, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "CREATE MASK BANK_SCHEMA.MASK_LOGIN_ID_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C ", "bbox": {"l": 64.800308, "t": 313.65485, "r": 428.81786999999997, "b": 321.58383, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "FOR COLUMN CUSTOMER_LOGIN_ID ", "bbox": {"l": 79.20031, "t": 324.69516, "r": 209.51941, "b": 332.62415, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "RETURN CASE ", "bbox": {"l": 79.20031, "t": 335.67517, "r": 137.64001, "b": 343.6041599999999, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 ", "bbox": {"l": 64.800308, "t": 346.65518, "r": 361.37817, "b": 354.58417, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "THEN C . CUSTOMER_LOGIN_ID ", "bbox": {"l": 64.800308, "t": 357.69550000000004, "r": 186.1194, "b": 365.62448, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 ", "bbox": {"l": 64.800308, "t": 368.67551, "r": 374.87817, "b": 376.60449, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "THEN C . CUSTOMER_LOGIN_ID ", "bbox": {"l": 64.800308, "t": 379.65552, "r": 186.1194, "b": 387.5845, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "ELSE '*****' ", "bbox": {"l": 64.800308, "t": 390.69583, "r": 123.24001, "b": 398.62482, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "END ", "bbox": {"l": 64.800308, "t": 401.67584, "r": 96.240005, "b": 409.60482999999994, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "ENABLE ; ", "bbox": {"l": 79.20031, "t": 412.65585, "r": 124.14001, "b": 420.58484, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "CREATE MASK BANK_SCHEMA.MASK_SECURITY_QUESTION_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C ", "bbox": {"l": 64.800308, "t": 434.67615, "r": 469.25757, "b": 442.60513, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "FOR COLUMN CUSTOMER_SECURITY_QUESTION ", "bbox": {"l": 79.20031, "t": 445.65616000000006, "r": 249.95911, "b": 453.58514, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "RETURN CASE ", "bbox": {"l": 79.20031, "t": 456.6964699999999, "r": 137.64001, "b": 464.62546, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 ", "bbox": {"l": 64.800308, "t": 467.67648, "r": 361.37817, "b": 475.60547, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "THEN C . CUSTOMER_SECURITY_QUESTION ", "bbox": {"l": 64.800308, "t": 478.65649, "r": 226.5591, "b": 486.58548, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 ", "bbox": {"l": 64.800308, "t": 489.69681, "r": 374.87817, "b": 497.62579, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "THEN C . CUSTOMER_SECURITY_QUESTION ", "bbox": {"l": 64.800308, "t": 500.67682, "r": 226.5591, "b": 508.6058, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "ELSE '*****' ", "bbox": {"l": 64.800308, "t": 511.65683, "r": 123.24001, "b": 519.58582, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "END ", "bbox": {"l": 64.800308, "t": 522.69714, "r": 96.240005, "b": 530.62613, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "ENABLE ; ", "bbox": {"l": 79.20031, "t": 533.6771200000001, "r": 124.14001, "b": 541.60614, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "CREATE MASK BANK_SCHEMA.MASK_SECURITY_QUESTION_ANSWER_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C ", "bbox": {"l": 64.800308, "t": 555.69745, "r": 500.69727, "b": 563.62645, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "FOR COLUMN CUSTOMER_SECURITY_QUESTION_ANSWER ", "bbox": {"l": 79.20031, "t": 566.6774399999999, "r": 281.3988, "b": 574.60645, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "RETURN CASE ", "bbox": {"l": 79.20031, "t": 577.65744, "r": 137.64001, "b": 585.58644, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 ", "bbox": {"l": 64.800308, "t": 588.6977400000001, "r": 361.37817, "b": 596.62674, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "THEN C . CUSTOMER_SECURITY_QUESTION_ANSWER ", "bbox": {"l": 64.800308, "t": 599.67773, "r": 258.05908, "b": 607.60674, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 ", "bbox": {"l": 64.800308, "t": 610.65773, "r": 374.87817, "b": 618.58673, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "THEN C . CUSTOMER_SECURITY_QUESTION_ANSWER ", "bbox": {"l": 64.800308, "t": 621.69803, "r": 258.05908, "b": 629.62703, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "ELSE '*****' ", "bbox": {"l": 64.800308, "t": 632.6780200000001, "r": 123.24001, "b": 640.60703, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "END ", "bbox": {"l": 64.800308, "t": 643.71832, "r": 96.240005, "b": 651.64732, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "ENABLE ; ", "bbox": {"l": 79.20031, "t": 654.69832, "r": 124.14001, "b": 662.62732, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "ALTER TABLE BANK_SCHEMA.CUSTOMERS ", "bbox": {"l": 64.800308, "t": 676.71861, "r": 226.5591, "b": 684.64761, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "ACTIVATE ROW ACCESS CONTROL ", "bbox": {"l": 79.20031, "t": 687.69862, "r": 214.01941, "b": 695.627617, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "ACTIVATE COLUMN ACCESS CONTROL ;", "bbox": {"l": 79.20031, "t": 698.678619, "r": 223.01941, "b": 706.60762, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "THEN C . CUSTOMER_TAX_ID WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'TELLER' ) = 1 THEN ( 'XXX-XX-' CONCAT QSYS2 . SUBSTR ( C . CUSTOMER_TAX_ID , 8 , 4 ) ) WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 THEN C . CUSTOMER_TAX_ID ELSE 'XXX-XX-XXXX' END ENABLE ; CREATE MASK BANK_SCHEMA.MASK_DRIVERS_LICENSE_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C FOR COLUMN CUSTOMER_DRIVERS_LICENSE_NUMBER RETURN CASE WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 THEN C . CUSTOMER_DRIVERS_LICENSE_NUMBER WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'TELLER' ) = 1 THEN C . CUSTOMER_DRIVERS_LICENSE_NUMBER WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 THEN C . CUSTOMER_DRIVERS_LICENSE_NUMBER ELSE '*************' END ENABLE ; CREATE MASK BANK_SCHEMA.MASK_LOGIN_ID_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C FOR COLUMN CUSTOMER_LOGIN_ID RETURN CASE WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 THEN C . CUSTOMER_LOGIN_ID WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 THEN C . CUSTOMER_LOGIN_ID ELSE '*****' END ENABLE ; CREATE MASK BANK_SCHEMA.MASK_SECURITY_QUESTION_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C FOR COLUMN CUSTOMER_SECURITY_QUESTION RETURN CASE WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 THEN C . CUSTOMER_SECURITY_QUESTION WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 THEN C . CUSTOMER_SECURITY_QUESTION ELSE '*****' END ENABLE ; CREATE MASK BANK_SCHEMA.MASK_SECURITY_QUESTION_ANSWER_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C FOR COLUMN CUSTOMER_SECURITY_QUESTION_ANSWER RETURN CASE WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 THEN C . CUSTOMER_SECURITY_QUESTION_ANSWER WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 THEN C . CUSTOMER_SECURITY_QUESTION_ANSWER ELSE '*****' END ENABLE ; ALTER TABLE BANK_SCHEMA.CUSTOMERS ACTIVATE ROW ACCESS CONTROL ACTIVATE COLUMN ACCESS CONTROL ;"}], "body": [{"label": "code", "id": 2, "page_no": 15, "cluster": {"id": 2, "label": "code", "bbox": {"l": 64.800308, "t": 71.67296999999996, "r": 500.69727, "b": 706.60762, "coord_origin": "TOPLEFT"}, "confidence": 0.7632161378860474, "cells": [{"id": 2, "text": "THEN C . CUSTOMER_TAX_ID ", "bbox": {"l": 64.800308, "t": 71.67296999999996, "r": 177.1194, "b": 79.60199, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'TELLER' ) = 1 ", "bbox": {"l": 64.800308, "t": 82.65295000000015, "r": 365.87817, "b": 90.58196999999996, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "THEN ( 'XXX-XX-' CONCAT QSYS2 . SUBSTR ( C . CUSTOMER_TAX_ID , 8 , 4 ) ) ", "bbox": {"l": 64.800308, "t": 93.63292999999999, "r": 392.81787, "b": 101.56195000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 ", "bbox": {"l": 64.800308, "t": 104.67322000000001, "r": 374.87817, "b": 112.60222999999996, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "THEN C . CUSTOMER_TAX_ID ", "bbox": {"l": 64.800308, "t": 115.65319999999997, "r": 177.1194, "b": 123.58220999999992, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "ELSE 'XXX-XX-XXXX' ", "bbox": {"l": 64.800308, "t": 126.63318000000015, "r": 150.1797, "b": 134.56219, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "END ", "bbox": {"l": 64.800308, "t": 137.67345999999998, "r": 96.240005, "b": 145.60248, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "ENABLE ; ", "bbox": {"l": 79.20031, "t": 148.65344000000005, "r": 124.14001, "b": 156.58245999999997, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "CREATE MASK BANK_SCHEMA.MASK_DRIVERS_LICENSE_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C ", "bbox": {"l": 64.800308, "t": 170.67377, "r": 460.25757, "b": 178.60278000000005, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "FOR COLUMN CUSTOMER_DRIVERS_LICENSE_NUMBER ", "bbox": {"l": 79.20031, "t": 181.65374999999995, "r": 272.45911, "b": 189.58276, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "RETURN CASE ", "bbox": {"l": 79.20031, "t": 192.69403, "r": 137.64001, "b": 200.62305000000003, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 ", "bbox": {"l": 64.800308, "t": 203.67400999999995, "r": 361.37817, "b": 211.60303, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "THEN C . CUSTOMER_DRIVERS_LICENSE_NUMBER ", "bbox": {"l": 64.800308, "t": 214.65399000000002, "r": 249.0591, "b": 222.58300999999994, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'TELLER' ) = 1 ", "bbox": {"l": 64.800308, "t": 225.69426999999996, "r": 365.87817, "b": 233.62329, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "THEN C . CUSTOMER_DRIVERS_LICENSE_NUMBER ", "bbox": {"l": 64.800308, "t": 236.67426, "r": 249.0591, "b": 244.60326999999995, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 ", "bbox": {"l": 64.800308, "t": 247.65423999999996, "r": 374.87817, "b": 255.58325000000002, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "THEN C . CUSTOMER_DRIVERS_LICENSE_NUMBER ", "bbox": {"l": 64.800308, "t": 258.69452, "r": 249.0591, "b": 266.62354000000005, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "ELSE '*************' ", "bbox": {"l": 64.800308, "t": 269.67449999999997, "r": 159.1797, "b": 277.60352, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "END ", "bbox": {"l": 64.800308, "t": 280.65454, "r": 96.240005, "b": 288.58353, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "ENABLE ; ", "bbox": {"l": 79.20031, "t": 291.69485000000003, "r": 124.14001, "b": 299.62384, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "CREATE MASK BANK_SCHEMA.MASK_LOGIN_ID_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C ", "bbox": {"l": 64.800308, "t": 313.65485, "r": 428.81786999999997, "b": 321.58383, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "FOR COLUMN CUSTOMER_LOGIN_ID ", "bbox": {"l": 79.20031, "t": 324.69516, "r": 209.51941, "b": 332.62415, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "RETURN CASE ", "bbox": {"l": 79.20031, "t": 335.67517, "r": 137.64001, "b": 343.6041599999999, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 ", "bbox": {"l": 64.800308, "t": 346.65518, "r": 361.37817, "b": 354.58417, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "THEN C . CUSTOMER_LOGIN_ID ", "bbox": {"l": 64.800308, "t": 357.69550000000004, "r": 186.1194, "b": 365.62448, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 ", "bbox": {"l": 64.800308, "t": 368.67551, "r": 374.87817, "b": 376.60449, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "THEN C . CUSTOMER_LOGIN_ID ", "bbox": {"l": 64.800308, "t": 379.65552, "r": 186.1194, "b": 387.5845, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "ELSE '*****' ", "bbox": {"l": 64.800308, "t": 390.69583, "r": 123.24001, "b": 398.62482, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "END ", "bbox": {"l": 64.800308, "t": 401.67584, "r": 96.240005, "b": 409.60482999999994, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "ENABLE ; ", "bbox": {"l": 79.20031, "t": 412.65585, "r": 124.14001, "b": 420.58484, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "CREATE MASK BANK_SCHEMA.MASK_SECURITY_QUESTION_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C ", "bbox": {"l": 64.800308, "t": 434.67615, "r": 469.25757, "b": 442.60513, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "FOR COLUMN CUSTOMER_SECURITY_QUESTION ", "bbox": {"l": 79.20031, "t": 445.65616000000006, "r": 249.95911, "b": 453.58514, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "RETURN CASE ", "bbox": {"l": 79.20031, "t": 456.6964699999999, "r": 137.64001, "b": 464.62546, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 ", "bbox": {"l": 64.800308, "t": 467.67648, "r": 361.37817, "b": 475.60547, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "THEN C . CUSTOMER_SECURITY_QUESTION ", "bbox": {"l": 64.800308, "t": 478.65649, "r": 226.5591, "b": 486.58548, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 ", "bbox": {"l": 64.800308, "t": 489.69681, "r": 374.87817, "b": 497.62579, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "THEN C . CUSTOMER_SECURITY_QUESTION ", "bbox": {"l": 64.800308, "t": 500.67682, "r": 226.5591, "b": 508.6058, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "ELSE '*****' ", "bbox": {"l": 64.800308, "t": 511.65683, "r": 123.24001, "b": 519.58582, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "END ", "bbox": {"l": 64.800308, "t": 522.69714, "r": 96.240005, "b": 530.62613, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "ENABLE ; ", "bbox": {"l": 79.20031, "t": 533.6771200000001, "r": 124.14001, "b": 541.60614, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "CREATE MASK BANK_SCHEMA.MASK_SECURITY_QUESTION_ANSWER_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C ", "bbox": {"l": 64.800308, "t": 555.69745, "r": 500.69727, "b": 563.62645, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "FOR COLUMN CUSTOMER_SECURITY_QUESTION_ANSWER ", "bbox": {"l": 79.20031, "t": 566.6774399999999, "r": 281.3988, "b": 574.60645, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "RETURN CASE ", "bbox": {"l": 79.20031, "t": 577.65744, "r": 137.64001, "b": 585.58644, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 ", "bbox": {"l": 64.800308, "t": 588.6977400000001, "r": 361.37817, "b": 596.62674, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "THEN C . CUSTOMER_SECURITY_QUESTION_ANSWER ", "bbox": {"l": 64.800308, "t": 599.67773, "r": 258.05908, "b": 607.60674, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 ", "bbox": {"l": 64.800308, "t": 610.65773, "r": 374.87817, "b": 618.58673, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "THEN C . CUSTOMER_SECURITY_QUESTION_ANSWER ", "bbox": {"l": 64.800308, "t": 621.69803, "r": 258.05908, "b": 629.62703, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "ELSE '*****' ", "bbox": {"l": 64.800308, "t": 632.6780200000001, "r": 123.24001, "b": 640.60703, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "END ", "bbox": {"l": 64.800308, "t": 643.71832, "r": 96.240005, "b": 651.64732, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "ENABLE ; ", "bbox": {"l": 79.20031, "t": 654.69832, "r": 124.14001, "b": 662.62732, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "ALTER TABLE BANK_SCHEMA.CUSTOMERS ", "bbox": {"l": 64.800308, "t": 676.71861, "r": 226.5591, "b": 684.64761, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "ACTIVATE ROW ACCESS CONTROL ", "bbox": {"l": 79.20031, "t": 687.69862, "r": 214.01941, "b": 695.627617, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "ACTIVATE COLUMN ACCESS CONTROL ;", "bbox": {"l": 79.20031, "t": 698.678619, "r": 223.01941, "b": 706.60762, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "THEN C . CUSTOMER_TAX_ID WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'TELLER' ) = 1 THEN ( 'XXX-XX-' CONCAT QSYS2 . SUBSTR ( C . CUSTOMER_TAX_ID , 8 , 4 ) ) WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 THEN C . CUSTOMER_TAX_ID ELSE 'XXX-XX-XXXX' END ENABLE ; CREATE MASK BANK_SCHEMA.MASK_DRIVERS_LICENSE_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C FOR COLUMN CUSTOMER_DRIVERS_LICENSE_NUMBER RETURN CASE WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 THEN C . CUSTOMER_DRIVERS_LICENSE_NUMBER WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'TELLER' ) = 1 THEN C . CUSTOMER_DRIVERS_LICENSE_NUMBER WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 THEN C . CUSTOMER_DRIVERS_LICENSE_NUMBER ELSE '*************' END ENABLE ; CREATE MASK BANK_SCHEMA.MASK_LOGIN_ID_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C FOR COLUMN CUSTOMER_LOGIN_ID RETURN CASE WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 THEN C . CUSTOMER_LOGIN_ID WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 THEN C . CUSTOMER_LOGIN_ID ELSE '*****' END ENABLE ; CREATE MASK BANK_SCHEMA.MASK_SECURITY_QUESTION_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C FOR COLUMN CUSTOMER_SECURITY_QUESTION RETURN CASE WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 THEN C . CUSTOMER_SECURITY_QUESTION WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 THEN C . CUSTOMER_SECURITY_QUESTION ELSE '*****' END ENABLE ; CREATE MASK BANK_SCHEMA.MASK_SECURITY_QUESTION_ANSWER_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C FOR COLUMN CUSTOMER_SECURITY_QUESTION_ANSWER RETURN CASE WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 THEN C . CUSTOMER_SECURITY_QUESTION_ANSWER WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 THEN C . CUSTOMER_SECURITY_QUESTION_ANSWER ELSE '*****' END ENABLE ; ALTER TABLE BANK_SCHEMA.CUSTOMERS ACTIVATE ROW ACCESS CONTROL ACTIVATE COLUMN ACCESS CONTROL ;"}], "headers": [{"label": "page_footer", "id": 1, "page_no": 15, "cluster": {"id": 1, "label": "page_footer", "bbox": {"l": 64.800003, "t": 754.848721, "r": 83.982002, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.8994001150131226, "cells": [{"id": 0, "text": "124 ", "bbox": {"l": 64.800003, "t": 754.848721, "r": 83.982002, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "124"}, {"label": "page_footer", "id": 0, "page_no": 15, "cluster": {"id": 0, "label": "page_footer", "bbox": {"l": 98.940002, "t": 755.538002, "r": 339.81958, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.943077027797699, "cells": [{"id": 1, "text": "Row and Column Access Control Support in IBM DB2 for i", "bbox": {"l": 98.940002, "t": 755.538002, "r": 339.81958, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Row and Column Access Control Support in IBM DB2 for i"}]}}, {"page_no": 16, "size": {"width": 612.0, "height": 792.0}, "cells": [], "predictions": {"layout": {"clusters": [{"id": 0, "label": "form", "bbox": {"l": 0.4932013750076294, "t": 0.0, "r": 610.2305297851562, "b": 791.654541015625, "coord_origin": "TOPLEFT"}, "confidence": 0.6497200131416321, "cells": [], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "form", "id": 0, "page_no": 16, "cluster": {"id": 0, "label": "form", "bbox": {"l": 0.4932013750076294, "t": 0.0, "r": 610.2305297851562, "b": 791.654541015625, "coord_origin": "TOPLEFT"}, "confidence": 0.6497200131416321, "cells": [], "children": []}, "text": null}], "body": [{"label": "form", "id": 0, "page_no": 16, "cluster": {"id": 0, "label": "form", "bbox": {"l": 0.4932013750076294, "t": 0.0, "r": 610.2305297851562, "b": 791.654541015625, "coord_origin": "TOPLEFT"}, "confidence": 0.6497200131416321, "cells": [], "children": []}, "text": null}], "headers": []}}, {"page_no": 17, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "fi", "bbox": {"l": 558.11987, "t": 45.468689999999924, "r": 565.46039, "b": 54.68169999999998, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "REDP-5110-00", "bbox": {"l": 171.0, "t": 631.338, "r": 231.88769999999997, "b": 639.66301, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "INTERNATIONAL ", "bbox": {"l": 467.3399999999999, "t": 247.71831999999995, "r": 559.80933, "b": 260.16052, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "TECHNICAL", "bbox": {"l": 467.3399999999999, "t": 261.75842, "r": 529.50208, "b": 274.20061999999996, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "SUPPORT", "bbox": {"l": 467.3399999999999, "t": 275.73839999999996, "r": 518.93317, "b": 288.1806, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "ORGANIZATION", "bbox": {"l": 467.3399999999999, "t": 289.71841, "r": 550.7475, "b": 302.16061, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "BUILDING TECHNICAL ", "bbox": {"l": 467.3399999999999, "t": 351.79199, "r": 571.70758, "b": 362.47198, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "INFORMATION BASED ON ", "bbox": {"l": 467.3399999999999, "t": 363.79199, "r": 587.38916, "b": 374.47198, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "PRACTICAL EXPERIENCE", "bbox": {"l": 467.3399999999999, "t": 375.79199, "r": 582.5556, "b": 386.47198, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "IBM Redbooks are developed ", "bbox": {"l": 467.3399999999999, "t": 399.8602900000001, "r": 587.46674, "b": 409.63251, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "by the IBM International ", "bbox": {"l": 467.3399999999999, "t": 410.90067, "r": 566.34229, "b": 420.67285, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Technical Support ", "bbox": {"l": 467.3399999999999, "t": 421.88068, "r": 543.20404, "b": 431.65289, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Organization. Experts from ", "bbox": {"l": 467.3399999999999, "t": 432.8606899999999, "r": 577.76697, "b": 442.63287, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "IBM, Customers and Partners ", "bbox": {"l": 467.3399999999999, "t": 443.90106, "r": 587.40948, "b": 453.67328, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "from around the world create ", "bbox": {"l": 467.3399999999999, "t": 454.88107, "r": 587.52051, "b": 464.65326, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "timely technical information ", "bbox": {"l": 467.3399999999999, "t": 465.86108, "r": 582.67505, "b": 475.6333, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "based on realistic scenarios. ", "bbox": {"l": 467.3399999999999, "t": 476.90146, "r": 585.46722, "b": 486.67365, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "Specific recommendations ", "bbox": {"l": 467.3399999999999, "t": 487.88147, "r": 577.70874, "b": 497.65369, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "are provided to help you ", "bbox": {"l": 467.3399999999999, "t": 498.86148, "r": 568.03546, "b": 508.63367, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "implement IT solutions more ", "bbox": {"l": 467.3399999999999, "t": 509.90186, "r": 585.44525, "b": 519.67407, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "effectively in your ", "bbox": {"l": 467.3399999999999, "t": 520.8818699999999, "r": 541.4967, "b": 530.65405, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "environment.", "bbox": {"l": 467.3399999999999, "t": 531.8618799999999, "r": 520.64893, "b": 541.63406, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "For more information:", "bbox": {"l": 467.3399999999999, "t": 578.83191, "r": 570.948, "b": 589.5119, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "ibm.com", "bbox": {"l": 467.3399999999999, "t": 590.83191, "r": 508.59961, "b": 601.5119, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "/redbooks", "bbox": {"l": 508.56000000000006, "t": 590.83191, "r": 552.74518, "b": 601.5119, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "Redpaper", "bbox": {"l": 474.60001, "t": 164.05658000000005, "r": 580.88989, "b": 188.94097999999997, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "\u2122", "bbox": {"l": 582.53992, "t": 172.32714999999996, "r": 592.13989, "b": 181.20714999999996, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Row and Column Access Control ", "bbox": {"l": 27.0, "t": 73.63799999999992, "r": 447.36002, "b": 103.00800000000004, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Support in IBM DB2 for i", "bbox": {"l": 27.0, "t": 113.76000999999997, "r": 314.43002, "b": 140.46002, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Implement roles and ", "bbox": {"l": 26.700001, "t": 242.17200000000003, "r": 127.4436, "b": 252.85199, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "separation of duties", "bbox": {"l": 26.700001, "t": 256.15198, "r": 121.6608, "b": 266.83196999999996, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Leverage row ", "bbox": {"l": 26.700001, "t": 284.17197, "r": 93.970795, "b": 294.85196, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "permissions on the ", "bbox": {"l": 26.700001, "t": 298.15198000000004, "r": 120.28319999999998, "b": 308.83197, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "database", "bbox": {"l": 26.700001, "t": 312.19199000000003, "r": 70.413605, "b": 322.87198, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Protect columns by ", "bbox": {"l": 26.700001, "t": 340.15198000000004, "r": 121.44960000000002, "b": 350.83197, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "defining column ", "bbox": {"l": 26.700001, "t": 354.19199000000003, "r": 106.5696, "b": 364.87198, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "masks", "bbox": {"l": 26.700001, "t": 368.1720000000001, "r": 58.194, "b": 378.85199, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "This IBM Redpaper publication provides information about the IBM i 7.2 ", "bbox": {"l": 152.94, "t": 242.72857999999997, "r": 413.99057, "b": 251.59295999999995, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "feature of IBM DB2 for i Row and Column Access Control (RCAC). It ", "bbox": {"l": 152.94002, "t": 254.72839, "r": 401.85635, "b": 263.59277, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "offers a broad description of the function and advantages of controlling ", "bbox": {"l": 152.94002, "t": 266.72821, "r": 414.08423, "b": 275.59259, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "access to data in a comprehensive and transparent way. This ", "bbox": {"l": 152.94002, "t": 278.72803, "r": 381.24014, "b": 287.59244, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "publication helps you understand the capabilities of RCAC and provides ", "bbox": {"l": 152.94002, "t": 290.72784, "r": 414.07031, "b": 299.59225, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "examples of defining, creating, and implementing the row permissions ", "bbox": {"l": 152.94002, "t": 302.72766, "r": 414.05447, "b": 311.59207, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "and column masks in a relational database environment.", "bbox": {"l": 152.94002, "t": 314.72747999999996, "r": 362.3291, "b": 323.59189, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "This paper is intended for database engineers, data-centric application ", "bbox": {"l": 152.94002, "t": 331.70728, "r": 414.17383, "b": 340.57169, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "developers, and security officers who want to design and implement ", "bbox": {"l": 152.94002, "t": 343.70709, "r": 407.61029, "b": 352.5715, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "RCAC as a part of their data control and governance policy. A solid ", "bbox": {"l": 152.94002, "t": 355.70691, "r": 399.29565, "b": 364.57132, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "background in IBM i object level security, DB2 for i relational database ", "bbox": {"l": 152.94002, "t": 367.70673, "r": 414.0603, "b": 376.57114, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "concepts, and SQL is assumed.", "bbox": {"l": 152.94002, "t": 379.70654, "r": 268.86945, "b": 388.57095, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "Back cover", "bbox": {"l": 287.22, "t": 28.54803000000004, "r": 414.24481, "b": 50.748050000000035, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 4, "label": "picture", "bbox": {"l": 485.1698303222656, "t": 25.259197235107422, "r": 566.2962036132812, "b": 54.191585540771484, "coord_origin": "TOPLEFT"}, "confidence": 0.9404253363609314, "cells": [{"id": 0, "text": "fi", "bbox": {"l": 558.11987, "t": 45.468689999999924, "r": 565.46039, "b": 54.68169999999998, "coord_origin": "TOPLEFT"}}], "children": [{"id": 13, "label": "text", "bbox": {"l": 558.11987, "t": 45.468689999999924, "r": 565.46039, "b": 54.68169999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 0, "text": "fi", "bbox": {"l": 558.11987, "t": 45.468689999999924, "r": 565.46039, "b": 54.68169999999998, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 10, "label": "page_footer", "bbox": {"l": 171.0, "t": 631.338, "r": 231.88769999999997, "b": 639.66301, "coord_origin": "TOPLEFT"}, "confidence": 0.7700252532958984, "cells": [{"id": 1, "text": "REDP-5110-00", "bbox": {"l": 171.0, "t": 631.338, "r": 231.88769999999997, "b": 639.66301, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "text", "bbox": {"l": 467.3399999999999, "t": 247.71831999999995, "r": 559.80933, "b": 302.16061, "coord_origin": "TOPLEFT"}, "confidence": 0.8532665967941284, "cells": [{"id": 2, "text": "INTERNATIONAL ", "bbox": {"l": 467.3399999999999, "t": 247.71831999999995, "r": 559.80933, "b": 260.16052, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "TECHNICAL", "bbox": {"l": 467.3399999999999, "t": 261.75842, "r": 529.50208, "b": 274.20061999999996, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "SUPPORT", "bbox": {"l": 467.3399999999999, "t": 275.73839999999996, "r": 518.93317, "b": 288.1806, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "ORGANIZATION", "bbox": {"l": 467.3399999999999, "t": 289.71841, "r": 550.7475, "b": 302.16061, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 467.3399999999999, "t": 351.79199, "r": 587.38916, "b": 386.47198, "coord_origin": "TOPLEFT"}, "confidence": 0.7157140374183655, "cells": [{"id": 6, "text": "BUILDING TECHNICAL ", "bbox": {"l": 467.3399999999999, "t": 351.79199, "r": 571.70758, "b": 362.47198, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "INFORMATION BASED ON ", "bbox": {"l": 467.3399999999999, "t": 363.79199, "r": 587.38916, "b": 374.47198, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "PRACTICAL EXPERIENCE", "bbox": {"l": 467.3399999999999, "t": 375.79199, "r": 582.5556, "b": 386.47198, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 467.3399999999999, "t": 399.8602900000001, "r": 587.52051, "b": 541.63406, "coord_origin": "TOPLEFT"}, "confidence": 0.9518947005271912, "cells": [{"id": 9, "text": "IBM Redbooks are developed ", "bbox": {"l": 467.3399999999999, "t": 399.8602900000001, "r": 587.46674, "b": 409.63251, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "by the IBM International ", "bbox": {"l": 467.3399999999999, "t": 410.90067, "r": 566.34229, "b": 420.67285, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Technical Support ", "bbox": {"l": 467.3399999999999, "t": 421.88068, "r": 543.20404, "b": 431.65289, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Organization. Experts from ", "bbox": {"l": 467.3399999999999, "t": 432.8606899999999, "r": 577.76697, "b": 442.63287, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "IBM, Customers and Partners ", "bbox": {"l": 467.3399999999999, "t": 443.90106, "r": 587.40948, "b": 453.67328, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "from around the world create ", "bbox": {"l": 467.3399999999999, "t": 454.88107, "r": 587.52051, "b": 464.65326, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "timely technical information ", "bbox": {"l": 467.3399999999999, "t": 465.86108, "r": 582.67505, "b": 475.6333, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "based on realistic scenarios. ", "bbox": {"l": 467.3399999999999, "t": 476.90146, "r": 585.46722, "b": 486.67365, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "Specific recommendations ", "bbox": {"l": 467.3399999999999, "t": 487.88147, "r": 577.70874, "b": 497.65369, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "are provided to help you ", "bbox": {"l": 467.3399999999999, "t": 498.86148, "r": 568.03546, "b": 508.63367, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "implement IT solutions more ", "bbox": {"l": 467.3399999999999, "t": 509.90186, "r": 585.44525, "b": 519.67407, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "effectively in your ", "bbox": {"l": 467.3399999999999, "t": 520.8818699999999, "r": 541.4967, "b": 530.65405, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "environment.", "bbox": {"l": 467.3399999999999, "t": 531.8618799999999, "r": 520.64893, "b": 541.63406, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 467.3399999999999, "t": 578.83191, "r": 570.948, "b": 601.5119, "coord_origin": "TOPLEFT"}, "confidence": 0.8230002522468567, "cells": [{"id": 22, "text": "For more information:", "bbox": {"l": 467.3399999999999, "t": 578.83191, "r": 570.948, "b": 589.5119, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "ibm.com", "bbox": {"l": 467.3399999999999, "t": 590.83191, "r": 508.59961, "b": 601.5119, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "/redbooks", "bbox": {"l": 508.56000000000006, "t": 590.83191, "r": 552.74518, "b": 601.5119, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "picture", "bbox": {"l": 474.35540771484375, "t": 80.05131530761719, "r": 592.2726440429688, "b": 189.81260681152344, "coord_origin": "TOPLEFT"}, "confidence": 0.9696109890937805, "cells": [{"id": 25, "text": "Redpaper", "bbox": {"l": 474.60001, "t": 164.05658000000005, "r": 580.88989, "b": 188.94097999999997, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "\u2122", "bbox": {"l": 582.53992, "t": 172.32714999999996, "r": 592.13989, "b": 181.20714999999996, "coord_origin": "TOPLEFT"}}], "children": [{"id": 14, "label": "text", "bbox": {"l": 474.60001, "t": 164.05658000000005, "r": 580.88989, "b": 188.94097999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "Redpaper", "bbox": {"l": 474.60001, "t": 164.05658000000005, "r": 580.88989, "b": 188.94097999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 582.53992, "t": 172.32714999999996, "r": 592.13989, "b": 181.20714999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "\u2122", "bbox": {"l": 582.53992, "t": 172.32714999999996, "r": 592.13989, "b": 181.20714999999996, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 12, "label": "section_header", "bbox": {"l": 27.0, "t": 73.63799999999992, "r": 447.36002, "b": 140.46002, "coord_origin": "TOPLEFT"}, "confidence": 0.7128154635429382, "cells": [{"id": 27, "text": "Row and Column Access Control ", "bbox": {"l": 27.0, "t": 73.63799999999992, "r": 447.36002, "b": 103.00800000000004, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Support in IBM DB2 for i", "bbox": {"l": 27.0, "t": 113.76000999999997, "r": 314.43002, "b": 140.46002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "text", "bbox": {"l": 26.700001, "t": 242.17200000000003, "r": 127.4436, "b": 266.83196999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.8400377631187439, "cells": [{"id": 29, "text": "Implement roles and ", "bbox": {"l": 26.700001, "t": 242.17200000000003, "r": 127.4436, "b": 252.85199, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "separation of duties", "bbox": {"l": 26.700001, "t": 256.15198, "r": 121.6608, "b": 266.83196999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "text", "bbox": {"l": 26.700001, "t": 284.17197, "r": 120.28319999999998, "b": 322.87198, "coord_origin": "TOPLEFT"}, "confidence": 0.8828511834144592, "cells": [{"id": 31, "text": "Leverage row ", "bbox": {"l": 26.700001, "t": 284.17197, "r": 93.970795, "b": 294.85196, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "permissions on the ", "bbox": {"l": 26.700001, "t": 298.15198000000004, "r": 120.28319999999998, "b": 308.83197, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "database", "bbox": {"l": 26.700001, "t": 312.19199000000003, "r": 70.413605, "b": 322.87198, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "text", "bbox": {"l": 26.700001, "t": 340.15198000000004, "r": 121.44960000000002, "b": 378.85199, "coord_origin": "TOPLEFT"}, "confidence": 0.9064874053001404, "cells": [{"id": 34, "text": "Protect columns by ", "bbox": {"l": 26.700001, "t": 340.15198000000004, "r": 121.44960000000002, "b": 350.83197, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "defining column ", "bbox": {"l": 26.700001, "t": 354.19199000000003, "r": 106.5696, "b": 364.87198, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "masks", "bbox": {"l": 26.700001, "t": 368.1720000000001, "r": 58.194, "b": 378.85199, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 152.94, "t": 242.72857999999997, "r": 414.08423, "b": 323.59189, "coord_origin": "TOPLEFT"}, "confidence": 0.9789719581604004, "cells": [{"id": 37, "text": "This IBM Redpaper publication provides information about the IBM i 7.2 ", "bbox": {"l": 152.94, "t": 242.72857999999997, "r": 413.99057, "b": 251.59295999999995, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "feature of IBM DB2 for i Row and Column Access Control (RCAC). It ", "bbox": {"l": 152.94002, "t": 254.72839, "r": 401.85635, "b": 263.59277, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "offers a broad description of the function and advantages of controlling ", "bbox": {"l": 152.94002, "t": 266.72821, "r": 414.08423, "b": 275.59259, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "access to data in a comprehensive and transparent way. This ", "bbox": {"l": 152.94002, "t": 278.72803, "r": 381.24014, "b": 287.59244, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "publication helps you understand the capabilities of RCAC and provides ", "bbox": {"l": 152.94002, "t": 290.72784, "r": 414.07031, "b": 299.59225, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "examples of defining, creating, and implementing the row permissions ", "bbox": {"l": 152.94002, "t": 302.72766, "r": 414.05447, "b": 311.59207, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "and column masks in a relational database environment.", "bbox": {"l": 152.94002, "t": 314.72747999999996, "r": 362.3291, "b": 323.59189, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 152.94002, "t": 331.70728, "r": 414.17383, "b": 388.57095, "coord_origin": "TOPLEFT"}, "confidence": 0.9799742698669434, "cells": [{"id": 44, "text": "This paper is intended for database engineers, data-centric application ", "bbox": {"l": 152.94002, "t": 331.70728, "r": 414.17383, "b": 340.57169, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "developers, and security officers who want to design and implement ", "bbox": {"l": 152.94002, "t": 343.70709, "r": 407.61029, "b": 352.5715, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "RCAC as a part of their data control and governance policy. A solid ", "bbox": {"l": 152.94002, "t": 355.70691, "r": 399.29565, "b": 364.57132, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "background in IBM i object level security, DB2 for i relational database ", "bbox": {"l": 152.94002, "t": 367.70673, "r": 414.0603, "b": 376.57114, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "concepts, and SQL is assumed.", "bbox": {"l": 152.94002, "t": 379.70654, "r": 268.86945, "b": 388.57095, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 287.22, "t": 28.54803000000004, "r": 414.24481, "b": 50.748050000000035, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "Back cover", "bbox": {"l": 287.22, "t": 28.54803000000004, "r": 414.24481, "b": 50.748050000000035, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "picture", "id": 4, "page_no": 17, "cluster": {"id": 4, "label": "picture", "bbox": {"l": 485.1698303222656, "t": 25.259197235107422, "r": 566.2962036132812, "b": 54.191585540771484, "coord_origin": "TOPLEFT"}, "confidence": 0.9404253363609314, "cells": [{"id": 0, "text": "fi", "bbox": {"l": 558.11987, "t": 45.468689999999924, "r": 565.46039, "b": 54.68169999999998, "coord_origin": "TOPLEFT"}}], "children": [{"id": 13, "label": "text", "bbox": {"l": 558.11987, "t": 45.468689999999924, "r": 565.46039, "b": 54.68169999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 0, "text": "fi", "bbox": {"l": 558.11987, "t": 45.468689999999924, "r": 565.46039, "b": 54.68169999999998, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "page_footer", "id": 10, "page_no": 17, "cluster": {"id": 10, "label": "page_footer", "bbox": {"l": 171.0, "t": 631.338, "r": 231.88769999999997, "b": 639.66301, "coord_origin": "TOPLEFT"}, "confidence": 0.7700252532958984, "cells": [{"id": 1, "text": "REDP-5110-00", "bbox": {"l": 171.0, "t": 631.338, "r": 231.88769999999997, "b": 639.66301, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "REDP-5110-00"}, {"label": "text", "id": 7, "page_no": 17, "cluster": {"id": 7, "label": "text", "bbox": {"l": 467.3399999999999, "t": 247.71831999999995, "r": 559.80933, "b": 302.16061, "coord_origin": "TOPLEFT"}, "confidence": 0.8532665967941284, "cells": [{"id": 2, "text": "INTERNATIONAL ", "bbox": {"l": 467.3399999999999, "t": 247.71831999999995, "r": 559.80933, "b": 260.16052, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "TECHNICAL", "bbox": {"l": 467.3399999999999, "t": 261.75842, "r": 529.50208, "b": 274.20061999999996, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "SUPPORT", "bbox": {"l": 467.3399999999999, "t": 275.73839999999996, "r": 518.93317, "b": 288.1806, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "ORGANIZATION", "bbox": {"l": 467.3399999999999, "t": 289.71841, "r": 550.7475, "b": 302.16061, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "INTERNATIONAL TECHNICAL SUPPORT ORGANIZATION"}, {"label": "text", "id": 11, "page_no": 17, "cluster": {"id": 11, "label": "text", "bbox": {"l": 467.3399999999999, "t": 351.79199, "r": 587.38916, "b": 386.47198, "coord_origin": "TOPLEFT"}, "confidence": 0.7157140374183655, "cells": [{"id": 6, "text": "BUILDING TECHNICAL ", "bbox": {"l": 467.3399999999999, "t": 351.79199, "r": 571.70758, "b": 362.47198, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "INFORMATION BASED ON ", "bbox": {"l": 467.3399999999999, "t": 363.79199, "r": 587.38916, "b": 374.47198, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "PRACTICAL EXPERIENCE", "bbox": {"l": 467.3399999999999, "t": 375.79199, "r": 582.5556, "b": 386.47198, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "BUILDING TECHNICAL INFORMATION BASED ON PRACTICAL EXPERIENCE"}, {"label": "text", "id": 3, "page_no": 17, "cluster": {"id": 3, "label": "text", "bbox": {"l": 467.3399999999999, "t": 399.8602900000001, "r": 587.52051, "b": 541.63406, "coord_origin": "TOPLEFT"}, "confidence": 0.9518947005271912, "cells": [{"id": 9, "text": "IBM Redbooks are developed ", "bbox": {"l": 467.3399999999999, "t": 399.8602900000001, "r": 587.46674, "b": 409.63251, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "by the IBM International ", "bbox": {"l": 467.3399999999999, "t": 410.90067, "r": 566.34229, "b": 420.67285, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Technical Support ", "bbox": {"l": 467.3399999999999, "t": 421.88068, "r": 543.20404, "b": 431.65289, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Organization. Experts from ", "bbox": {"l": 467.3399999999999, "t": 432.8606899999999, "r": 577.76697, "b": 442.63287, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "IBM, Customers and Partners ", "bbox": {"l": 467.3399999999999, "t": 443.90106, "r": 587.40948, "b": 453.67328, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "from around the world create ", "bbox": {"l": 467.3399999999999, "t": 454.88107, "r": 587.52051, "b": 464.65326, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "timely technical information ", "bbox": {"l": 467.3399999999999, "t": 465.86108, "r": 582.67505, "b": 475.6333, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "based on realistic scenarios. ", "bbox": {"l": 467.3399999999999, "t": 476.90146, "r": 585.46722, "b": 486.67365, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "Specific recommendations ", "bbox": {"l": 467.3399999999999, "t": 487.88147, "r": 577.70874, "b": 497.65369, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "are provided to help you ", "bbox": {"l": 467.3399999999999, "t": 498.86148, "r": 568.03546, "b": 508.63367, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "implement IT solutions more ", "bbox": {"l": 467.3399999999999, "t": 509.90186, "r": 585.44525, "b": 519.67407, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "effectively in your ", "bbox": {"l": 467.3399999999999, "t": 520.8818699999999, "r": 541.4967, "b": 530.65405, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "environment.", "bbox": {"l": 467.3399999999999, "t": 531.8618799999999, "r": 520.64893, "b": 541.63406, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "IBM Redbooks are developed by the IBM International Technical Support Organization. Experts from IBM, Customers and Partners from around the world create timely technical information based on realistic scenarios. Specific recommendations are provided to help you implement IT solutions more effectively in your environment."}, {"label": "text", "id": 9, "page_no": 17, "cluster": {"id": 9, "label": "text", "bbox": {"l": 467.3399999999999, "t": 578.83191, "r": 570.948, "b": 601.5119, "coord_origin": "TOPLEFT"}, "confidence": 0.8230002522468567, "cells": [{"id": 22, "text": "For more information:", "bbox": {"l": 467.3399999999999, "t": 578.83191, "r": 570.948, "b": 589.5119, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "ibm.com", "bbox": {"l": 467.3399999999999, "t": 590.83191, "r": 508.59961, "b": 601.5119, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "/redbooks", "bbox": {"l": 508.56000000000006, "t": 590.83191, "r": 552.74518, "b": 601.5119, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "For more information: ibm.com /redbooks"}, {"label": "picture", "id": 2, "page_no": 17, "cluster": {"id": 2, "label": "picture", "bbox": {"l": 474.35540771484375, "t": 80.05131530761719, "r": 592.2726440429688, "b": 189.81260681152344, "coord_origin": "TOPLEFT"}, "confidence": 0.9696109890937805, "cells": [{"id": 25, "text": "Redpaper", "bbox": {"l": 474.60001, "t": 164.05658000000005, "r": 580.88989, "b": 188.94097999999997, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "\u2122", "bbox": {"l": 582.53992, "t": 172.32714999999996, "r": 592.13989, "b": 181.20714999999996, "coord_origin": "TOPLEFT"}}], "children": [{"id": 14, "label": "text", "bbox": {"l": 474.60001, "t": 164.05658000000005, "r": 580.88989, "b": 188.94097999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "Redpaper", "bbox": {"l": 474.60001, "t": 164.05658000000005, "r": 580.88989, "b": 188.94097999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 582.53992, "t": 172.32714999999996, "r": 592.13989, "b": 181.20714999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "\u2122", "bbox": {"l": 582.53992, "t": 172.32714999999996, "r": 592.13989, "b": 181.20714999999996, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "section_header", "id": 12, "page_no": 17, "cluster": {"id": 12, "label": "section_header", "bbox": {"l": 27.0, "t": 73.63799999999992, "r": 447.36002, "b": 140.46002, "coord_origin": "TOPLEFT"}, "confidence": 0.7128154635429382, "cells": [{"id": 27, "text": "Row and Column Access Control ", "bbox": {"l": 27.0, "t": 73.63799999999992, "r": 447.36002, "b": 103.00800000000004, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Support in IBM DB2 for i", "bbox": {"l": 27.0, "t": 113.76000999999997, "r": 314.43002, "b": 140.46002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Row and Column Access Control Support in IBM DB2 for i"}, {"label": "text", "id": 8, "page_no": 17, "cluster": {"id": 8, "label": "text", "bbox": {"l": 26.700001, "t": 242.17200000000003, "r": 127.4436, "b": 266.83196999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.8400377631187439, "cells": [{"id": 29, "text": "Implement roles and ", "bbox": {"l": 26.700001, "t": 242.17200000000003, "r": 127.4436, "b": 252.85199, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "separation of duties", "bbox": {"l": 26.700001, "t": 256.15198, "r": 121.6608, "b": 266.83196999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Implement roles and separation of duties"}, {"label": "text", "id": 6, "page_no": 17, "cluster": {"id": 6, "label": "text", "bbox": {"l": 26.700001, "t": 284.17197, "r": 120.28319999999998, "b": 322.87198, "coord_origin": "TOPLEFT"}, "confidence": 0.8828511834144592, "cells": [{"id": 31, "text": "Leverage row ", "bbox": {"l": 26.700001, "t": 284.17197, "r": 93.970795, "b": 294.85196, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "permissions on the ", "bbox": {"l": 26.700001, "t": 298.15198000000004, "r": 120.28319999999998, "b": 308.83197, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "database", "bbox": {"l": 26.700001, "t": 312.19199000000003, "r": 70.413605, "b": 322.87198, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Leverage row permissions on the database"}, {"label": "text", "id": 5, "page_no": 17, "cluster": {"id": 5, "label": "text", "bbox": {"l": 26.700001, "t": 340.15198000000004, "r": 121.44960000000002, "b": 378.85199, "coord_origin": "TOPLEFT"}, "confidence": 0.9064874053001404, "cells": [{"id": 34, "text": "Protect columns by ", "bbox": {"l": 26.700001, "t": 340.15198000000004, "r": 121.44960000000002, "b": 350.83197, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "defining column ", "bbox": {"l": 26.700001, "t": 354.19199000000003, "r": 106.5696, "b": 364.87198, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "masks", "bbox": {"l": 26.700001, "t": 368.1720000000001, "r": 58.194, "b": 378.85199, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Protect columns by defining column masks"}, {"label": "text", "id": 1, "page_no": 17, "cluster": {"id": 1, "label": "text", "bbox": {"l": 152.94, "t": 242.72857999999997, "r": 414.08423, "b": 323.59189, "coord_origin": "TOPLEFT"}, "confidence": 0.9789719581604004, "cells": [{"id": 37, "text": "This IBM Redpaper publication provides information about the IBM i 7.2 ", "bbox": {"l": 152.94, "t": 242.72857999999997, "r": 413.99057, "b": 251.59295999999995, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "feature of IBM DB2 for i Row and Column Access Control (RCAC). It ", "bbox": {"l": 152.94002, "t": 254.72839, "r": 401.85635, "b": 263.59277, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "offers a broad description of the function and advantages of controlling ", "bbox": {"l": 152.94002, "t": 266.72821, "r": 414.08423, "b": 275.59259, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "access to data in a comprehensive and transparent way. This ", "bbox": {"l": 152.94002, "t": 278.72803, "r": 381.24014, "b": 287.59244, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "publication helps you understand the capabilities of RCAC and provides ", "bbox": {"l": 152.94002, "t": 290.72784, "r": 414.07031, "b": 299.59225, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "examples of defining, creating, and implementing the row permissions ", "bbox": {"l": 152.94002, "t": 302.72766, "r": 414.05447, "b": 311.59207, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "and column masks in a relational database environment.", "bbox": {"l": 152.94002, "t": 314.72747999999996, "r": 362.3291, "b": 323.59189, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "This IBM Redpaper publication provides information about the IBM i 7.2 feature of IBM DB2 for i Row and Column Access Control (RCAC). It offers a broad description of the function and advantages of controlling access to data in a comprehensive and transparent way. This publication helps you understand the capabilities of RCAC and provides examples of defining, creating, and implementing the row permissions and column masks in a relational database environment."}, {"label": "text", "id": 0, "page_no": 17, "cluster": {"id": 0, "label": "text", "bbox": {"l": 152.94002, "t": 331.70728, "r": 414.17383, "b": 388.57095, "coord_origin": "TOPLEFT"}, "confidence": 0.9799742698669434, "cells": [{"id": 44, "text": "This paper is intended for database engineers, data-centric application ", "bbox": {"l": 152.94002, "t": 331.70728, "r": 414.17383, "b": 340.57169, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "developers, and security officers who want to design and implement ", "bbox": {"l": 152.94002, "t": 343.70709, "r": 407.61029, "b": 352.5715, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "RCAC as a part of their data control and governance policy. A solid ", "bbox": {"l": 152.94002, "t": 355.70691, "r": 399.29565, "b": 364.57132, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "background in IBM i object level security, DB2 for i relational database ", "bbox": {"l": 152.94002, "t": 367.70673, "r": 414.0603, "b": 376.57114, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "concepts, and SQL is assumed.", "bbox": {"l": 152.94002, "t": 379.70654, "r": 268.86945, "b": 388.57095, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "This paper is intended for database engineers, data-centric application developers, and security officers who want to design and implement RCAC as a part of their data control and governance policy. A solid background in IBM i object level security, DB2 for i relational database concepts, and SQL is assumed."}, {"label": "text", "id": 16, "page_no": 17, "cluster": {"id": 16, "label": "text", "bbox": {"l": 287.22, "t": 28.54803000000004, "r": 414.24481, "b": 50.748050000000035, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "Back cover", "bbox": {"l": 287.22, "t": 28.54803000000004, "r": 414.24481, "b": 50.748050000000035, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Back cover"}], "body": [{"label": "picture", "id": 4, "page_no": 17, "cluster": {"id": 4, "label": "picture", "bbox": {"l": 485.1698303222656, "t": 25.259197235107422, "r": 566.2962036132812, "b": 54.191585540771484, "coord_origin": "TOPLEFT"}, "confidence": 0.9404253363609314, "cells": [{"id": 0, "text": "fi", "bbox": {"l": 558.11987, "t": 45.468689999999924, "r": 565.46039, "b": 54.68169999999998, "coord_origin": "TOPLEFT"}}], "children": [{"id": 13, "label": "text", "bbox": {"l": 558.11987, "t": 45.468689999999924, "r": 565.46039, "b": 54.68169999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 0, "text": "fi", "bbox": {"l": 558.11987, "t": 45.468689999999924, "r": 565.46039, "b": 54.68169999999998, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "text", "id": 7, "page_no": 17, "cluster": {"id": 7, "label": "text", "bbox": {"l": 467.3399999999999, "t": 247.71831999999995, "r": 559.80933, "b": 302.16061, "coord_origin": "TOPLEFT"}, "confidence": 0.8532665967941284, "cells": [{"id": 2, "text": "INTERNATIONAL ", "bbox": {"l": 467.3399999999999, "t": 247.71831999999995, "r": 559.80933, "b": 260.16052, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "TECHNICAL", "bbox": {"l": 467.3399999999999, "t": 261.75842, "r": 529.50208, "b": 274.20061999999996, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "SUPPORT", "bbox": {"l": 467.3399999999999, "t": 275.73839999999996, "r": 518.93317, "b": 288.1806, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "ORGANIZATION", "bbox": {"l": 467.3399999999999, "t": 289.71841, "r": 550.7475, "b": 302.16061, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "INTERNATIONAL TECHNICAL SUPPORT ORGANIZATION"}, {"label": "text", "id": 11, "page_no": 17, "cluster": {"id": 11, "label": "text", "bbox": {"l": 467.3399999999999, "t": 351.79199, "r": 587.38916, "b": 386.47198, "coord_origin": "TOPLEFT"}, "confidence": 0.7157140374183655, "cells": [{"id": 6, "text": "BUILDING TECHNICAL ", "bbox": {"l": 467.3399999999999, "t": 351.79199, "r": 571.70758, "b": 362.47198, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "INFORMATION BASED ON ", "bbox": {"l": 467.3399999999999, "t": 363.79199, "r": 587.38916, "b": 374.47198, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "PRACTICAL EXPERIENCE", "bbox": {"l": 467.3399999999999, "t": 375.79199, "r": 582.5556, "b": 386.47198, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "BUILDING TECHNICAL INFORMATION BASED ON PRACTICAL EXPERIENCE"}, {"label": "text", "id": 3, "page_no": 17, "cluster": {"id": 3, "label": "text", "bbox": {"l": 467.3399999999999, "t": 399.8602900000001, "r": 587.52051, "b": 541.63406, "coord_origin": "TOPLEFT"}, "confidence": 0.9518947005271912, "cells": [{"id": 9, "text": "IBM Redbooks are developed ", "bbox": {"l": 467.3399999999999, "t": 399.8602900000001, "r": 587.46674, "b": 409.63251, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "by the IBM International ", "bbox": {"l": 467.3399999999999, "t": 410.90067, "r": 566.34229, "b": 420.67285, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Technical Support ", "bbox": {"l": 467.3399999999999, "t": 421.88068, "r": 543.20404, "b": 431.65289, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Organization. Experts from ", "bbox": {"l": 467.3399999999999, "t": 432.8606899999999, "r": 577.76697, "b": 442.63287, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "IBM, Customers and Partners ", "bbox": {"l": 467.3399999999999, "t": 443.90106, "r": 587.40948, "b": 453.67328, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "from around the world create ", "bbox": {"l": 467.3399999999999, "t": 454.88107, "r": 587.52051, "b": 464.65326, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "timely technical information ", "bbox": {"l": 467.3399999999999, "t": 465.86108, "r": 582.67505, "b": 475.6333, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "based on realistic scenarios. ", "bbox": {"l": 467.3399999999999, "t": 476.90146, "r": 585.46722, "b": 486.67365, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "Specific recommendations ", "bbox": {"l": 467.3399999999999, "t": 487.88147, "r": 577.70874, "b": 497.65369, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "are provided to help you ", "bbox": {"l": 467.3399999999999, "t": 498.86148, "r": 568.03546, "b": 508.63367, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "implement IT solutions more ", "bbox": {"l": 467.3399999999999, "t": 509.90186, "r": 585.44525, "b": 519.67407, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "effectively in your ", "bbox": {"l": 467.3399999999999, "t": 520.8818699999999, "r": 541.4967, "b": 530.65405, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "environment.", "bbox": {"l": 467.3399999999999, "t": 531.8618799999999, "r": 520.64893, "b": 541.63406, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "IBM Redbooks are developed by the IBM International Technical Support Organization. Experts from IBM, Customers and Partners from around the world create timely technical information based on realistic scenarios. Specific recommendations are provided to help you implement IT solutions more effectively in your environment."}, {"label": "text", "id": 9, "page_no": 17, "cluster": {"id": 9, "label": "text", "bbox": {"l": 467.3399999999999, "t": 578.83191, "r": 570.948, "b": 601.5119, "coord_origin": "TOPLEFT"}, "confidence": 0.8230002522468567, "cells": [{"id": 22, "text": "For more information:", "bbox": {"l": 467.3399999999999, "t": 578.83191, "r": 570.948, "b": 589.5119, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "ibm.com", "bbox": {"l": 467.3399999999999, "t": 590.83191, "r": 508.59961, "b": 601.5119, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "/redbooks", "bbox": {"l": 508.56000000000006, "t": 590.83191, "r": 552.74518, "b": 601.5119, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "For more information: ibm.com /redbooks"}, {"label": "picture", "id": 2, "page_no": 17, "cluster": {"id": 2, "label": "picture", "bbox": {"l": 474.35540771484375, "t": 80.05131530761719, "r": 592.2726440429688, "b": 189.81260681152344, "coord_origin": "TOPLEFT"}, "confidence": 0.9696109890937805, "cells": [{"id": 25, "text": "Redpaper", "bbox": {"l": 474.60001, "t": 164.05658000000005, "r": 580.88989, "b": 188.94097999999997, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "\u2122", "bbox": {"l": 582.53992, "t": 172.32714999999996, "r": 592.13989, "b": 181.20714999999996, "coord_origin": "TOPLEFT"}}], "children": [{"id": 14, "label": "text", "bbox": {"l": 474.60001, "t": 164.05658000000005, "r": 580.88989, "b": 188.94097999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "Redpaper", "bbox": {"l": 474.60001, "t": 164.05658000000005, "r": 580.88989, "b": 188.94097999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 582.53992, "t": 172.32714999999996, "r": 592.13989, "b": 181.20714999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "\u2122", "bbox": {"l": 582.53992, "t": 172.32714999999996, "r": 592.13989, "b": 181.20714999999996, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "section_header", "id": 12, "page_no": 17, "cluster": {"id": 12, "label": "section_header", "bbox": {"l": 27.0, "t": 73.63799999999992, "r": 447.36002, "b": 140.46002, "coord_origin": "TOPLEFT"}, "confidence": 0.7128154635429382, "cells": [{"id": 27, "text": "Row and Column Access Control ", "bbox": {"l": 27.0, "t": 73.63799999999992, "r": 447.36002, "b": 103.00800000000004, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Support in IBM DB2 for i", "bbox": {"l": 27.0, "t": 113.76000999999997, "r": 314.43002, "b": 140.46002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Row and Column Access Control Support in IBM DB2 for i"}, {"label": "text", "id": 8, "page_no": 17, "cluster": {"id": 8, "label": "text", "bbox": {"l": 26.700001, "t": 242.17200000000003, "r": 127.4436, "b": 266.83196999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.8400377631187439, "cells": [{"id": 29, "text": "Implement roles and ", "bbox": {"l": 26.700001, "t": 242.17200000000003, "r": 127.4436, "b": 252.85199, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "separation of duties", "bbox": {"l": 26.700001, "t": 256.15198, "r": 121.6608, "b": 266.83196999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Implement roles and separation of duties"}, {"label": "text", "id": 6, "page_no": 17, "cluster": {"id": 6, "label": "text", "bbox": {"l": 26.700001, "t": 284.17197, "r": 120.28319999999998, "b": 322.87198, "coord_origin": "TOPLEFT"}, "confidence": 0.8828511834144592, "cells": [{"id": 31, "text": "Leverage row ", "bbox": {"l": 26.700001, "t": 284.17197, "r": 93.970795, "b": 294.85196, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "permissions on the ", "bbox": {"l": 26.700001, "t": 298.15198000000004, "r": 120.28319999999998, "b": 308.83197, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "database", "bbox": {"l": 26.700001, "t": 312.19199000000003, "r": 70.413605, "b": 322.87198, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Leverage row permissions on the database"}, {"label": "text", "id": 5, "page_no": 17, "cluster": {"id": 5, "label": "text", "bbox": {"l": 26.700001, "t": 340.15198000000004, "r": 121.44960000000002, "b": 378.85199, "coord_origin": "TOPLEFT"}, "confidence": 0.9064874053001404, "cells": [{"id": 34, "text": "Protect columns by ", "bbox": {"l": 26.700001, "t": 340.15198000000004, "r": 121.44960000000002, "b": 350.83197, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "defining column ", "bbox": {"l": 26.700001, "t": 354.19199000000003, "r": 106.5696, "b": 364.87198, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "masks", "bbox": {"l": 26.700001, "t": 368.1720000000001, "r": 58.194, "b": 378.85199, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Protect columns by defining column masks"}, {"label": "text", "id": 1, "page_no": 17, "cluster": {"id": 1, "label": "text", "bbox": {"l": 152.94, "t": 242.72857999999997, "r": 414.08423, "b": 323.59189, "coord_origin": "TOPLEFT"}, "confidence": 0.9789719581604004, "cells": [{"id": 37, "text": "This IBM Redpaper publication provides information about the IBM i 7.2 ", "bbox": {"l": 152.94, "t": 242.72857999999997, "r": 413.99057, "b": 251.59295999999995, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "feature of IBM DB2 for i Row and Column Access Control (RCAC). It ", "bbox": {"l": 152.94002, "t": 254.72839, "r": 401.85635, "b": 263.59277, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "offers a broad description of the function and advantages of controlling ", "bbox": {"l": 152.94002, "t": 266.72821, "r": 414.08423, "b": 275.59259, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "access to data in a comprehensive and transparent way. This ", "bbox": {"l": 152.94002, "t": 278.72803, "r": 381.24014, "b": 287.59244, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "publication helps you understand the capabilities of RCAC and provides ", "bbox": {"l": 152.94002, "t": 290.72784, "r": 414.07031, "b": 299.59225, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "examples of defining, creating, and implementing the row permissions ", "bbox": {"l": 152.94002, "t": 302.72766, "r": 414.05447, "b": 311.59207, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "and column masks in a relational database environment.", "bbox": {"l": 152.94002, "t": 314.72747999999996, "r": 362.3291, "b": 323.59189, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "This IBM Redpaper publication provides information about the IBM i 7.2 feature of IBM DB2 for i Row and Column Access Control (RCAC). It offers a broad description of the function and advantages of controlling access to data in a comprehensive and transparent way. This publication helps you understand the capabilities of RCAC and provides examples of defining, creating, and implementing the row permissions and column masks in a relational database environment."}, {"label": "text", "id": 0, "page_no": 17, "cluster": {"id": 0, "label": "text", "bbox": {"l": 152.94002, "t": 331.70728, "r": 414.17383, "b": 388.57095, "coord_origin": "TOPLEFT"}, "confidence": 0.9799742698669434, "cells": [{"id": 44, "text": "This paper is intended for database engineers, data-centric application ", "bbox": {"l": 152.94002, "t": 331.70728, "r": 414.17383, "b": 340.57169, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "developers, and security officers who want to design and implement ", "bbox": {"l": 152.94002, "t": 343.70709, "r": 407.61029, "b": 352.5715, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "RCAC as a part of their data control and governance policy. A solid ", "bbox": {"l": 152.94002, "t": 355.70691, "r": 399.29565, "b": 364.57132, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "background in IBM i object level security, DB2 for i relational database ", "bbox": {"l": 152.94002, "t": 367.70673, "r": 414.0603, "b": 376.57114, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "concepts, and SQL is assumed.", "bbox": {"l": 152.94002, "t": 379.70654, "r": 268.86945, "b": 388.57095, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "This paper is intended for database engineers, data-centric application developers, and security officers who want to design and implement RCAC as a part of their data control and governance policy. A solid background in IBM i object level security, DB2 for i relational database concepts, and SQL is assumed."}, {"label": "text", "id": 16, "page_no": 17, "cluster": {"id": 16, "label": "text", "bbox": {"l": 287.22, "t": 28.54803000000004, "r": 414.24481, "b": 50.748050000000035, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "Back cover", "bbox": {"l": 287.22, "t": 28.54803000000004, "r": 414.24481, "b": 50.748050000000035, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Back cover"}], "headers": [{"label": "page_footer", "id": 10, "page_no": 17, "cluster": {"id": 10, "label": "page_footer", "bbox": {"l": 171.0, "t": 631.338, "r": 231.88769999999997, "b": 639.66301, "coord_origin": "TOPLEFT"}, "confidence": 0.7700252532958984, "cells": [{"id": 1, "text": "REDP-5110-00", "bbox": {"l": 171.0, "t": 631.338, "r": 231.88769999999997, "b": 639.66301, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "REDP-5110-00"}]}}]
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v1/right_to_left_01.doctags.txt b/tests/data/groundtruth/docling_v1/right_to_left_01.doctags.txt
new file mode 100644
index 00000000..8cbfb6df
--- /dev/null
+++ b/tests/data/groundtruth/docling_v1/right_to_left_01.doctags.txt
@@ -0,0 +1,9 @@
+<document>
+<subtitle-level-1><location><page_1><loc_37><loc_89><loc_85><loc_91></location>Pythonو R ةغلب ةجمربلا للاخ نم تلاكشملا لحو ةيجاتنلإا نيسحت</subtitle-level-1>
+<paragraph><location><page_1><loc_15><loc_80><loc_85><loc_87></location>Python و R ةغلب ةجمربلا ربتعت ةلاعف لولح داجيإ يف دعاستو ةيجاتنلإا ززعت نأ نكمي يتلا ةيوقلا تاودلأا نم ءاملعلاو نيللحملا ىلع لهسي امم ،تانايبلا ليلحتل ةيلاثم اهلعجت ةديرف تازيمPython و R نم لك كلتمي .تلاكشملل ناك اذإ .ةلاعفو ةعيرس ةقيرطب ةدقعم تلايلحت ءارجإ مهسي نأ نكمي تاغللا هذه مادختسا نإف ،ةيليلحت ةيلقع كيدل .لمعلا جئاتن نيسحت يف ريبك لكشب</paragraph>
+<paragraph><location><page_1><loc_34><loc_73><loc_34><loc_75></location>ً</paragraph>
+<paragraph><location><page_1><loc_83><loc_71><loc_83><loc_73></location>ً</paragraph>
+<paragraph><location><page_1><loc_16><loc_71><loc_85><loc_78></location>جارختساو تانايبلا نم ةلئاه تايمك ةجلاعم نكمملا نم حبصي ،ةجمربلا تاراهم عم يليلحتلا ريكفتلا عمتجي امدنع ذيفنتلPython و R مادختسا نيجمربملل نكمي .اهنم تاهجوتلاو طامنلأا ةجذمنلا لثم ،ةمدقتم ةيليلحت تايلمع ةقد رثكأ تارارق ذاختا ىلإ ا ضيأ يدؤي نأ نكمي لب ،تقولا رفوي طقف سيل اذه .ةريبكلا تانايبلا ليلحتو ةيئاصحلإا تانايبلا ىلع ةمئاق تاجاتنتسا ىلع ءانب .</paragraph>
+<paragraph><location><page_1><loc_15><loc_63><loc_85><loc_70></location>ليلحتلا نم ،تاقيبطتلا نم ةعساو ةعومجم معدت ةينغ تاودأو تابتكمPython و R نم لك رفوت ،كلذ ىلع ةولاع ىلع .ةفلتخملا تلاكشملل ةركتبم لولح ريوطتل تابتكملا هذه نم ةدافتسلاا نيمدختسملل نكمي .يللآا ملعتلا ىلإ ينايبلا R رفوت امنيب ،ةءافكب تانايبلا ةرادلإ Python يف pandas ةبتكم مادختسا نكمي ،لاثملا ليبس مسرلل ةيوق تاودأ .نيللحملاو نيثحابلل ةيلاثم اهلعجي امم ،يئاصحلإا ليلحتلاو ينايبلا</paragraph>
+<paragraph><location><page_1><loc_16><loc_56><loc_85><loc_61></location>Python و R ةغلب ةجمربلا يدؤت نأ نكمي ،ةياهنلا يف ةركتبم لولح ريفوتو ةيجاتنلإا نيسحت ىلإ ةيليلحت ةيلقع عم اهل نوكت نأ نكمي ةبسانملا ةيجمربلا بيلاسلأا قيبطتو لاعف لكشب تانايبلا ليلحت ىلع ةردقلا نإ .ةدقعملا تلاكشملل .ينهملاو يصخشلا ءادلأا ىلع ىدملا ةديعب ةيباجيإ تاريثأت</paragraph>
+</document>
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v1/right_to_left_01.json b/tests/data/groundtruth/docling_v1/right_to_left_01.json
new file mode 100644
index 00000000..92975c5e
--- /dev/null
+++ b/tests/data/groundtruth/docling_v1/right_to_left_01.json
@@ -0,0 +1 @@
+{"_name": "", "type": "pdf-document", "description": {"title": null, "abstract": null, "authors": null, "affiliations": null, "subjects": null, "keywords": null, "publication_date": null, "languages": null, "license": null, "publishers": null, "url_refs": null, "references": null, "publication": null, "reference_count": null, "citation_count": null, "citation_date": null, "advanced": null, "analytics": null, "logs": [], "collection": null, "acquisition": null}, "file-info": {"filename": "right_to_left_01.pdf", "filename-prov": null, "document-hash": "85c9c0772fa51fd26f16eaae6abd522c96a4d169ceb7b72cbcfe3444ce22db79", "#-pages": 1, "collection-name": null, "description": null, "page-hashes": [{"hash": "6400df9d1750f707e1e0b310224d0b988ed99457bd230029715def0a6030dd06", "model": "default", "page": 1}]}, "main-text": [{"prov": [{"bbox": [223.85000999999997, 704.4510500000001, 521.98181, 719.4619800000002], "page": 1, "span": [0, 59], "__ref_s3_data": null}], "text": "Python\u0648 R \u0629\u063a\u0644\u0628 \u0629\u062c\u0645\u0631\u0628\u0644\u0627 \u0644\u0644\u0627\u062e \u0646\u0645 \u062a\u0644\u0627\u0643\u0634\u0645\u0644\u0627 \u0644\u062d\u0648 \u0629\u064a\u062c\u0627\u062a\u0646\u0644\u0625\u0627 \u0646\u064a\u0633\u062d\u062a", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [90.744003, 635.30804, 522.19, 689.992], "page": 1, "span": [0, 345], "__ref_s3_data": null}], "text": "Python \u0648 R \u0629\u063a\u0644\u0628 \u0629\u062c\u0645\u0631\u0628\u0644\u0627 \u0631\u0628\u062a\u0639\u062a \u0629\u0644\u0627\u0639\u0641 \u0644\u0648\u0644\u062d \u062f\u0627\u062c\u064a\u0625 \u064a\u0641 \u062f\u0639\u0627\u0633\u062a\u0648 \u0629\u064a\u062c\u0627\u062a\u0646\u0644\u0625\u0627 \u0632\u0632\u0639\u062a \u0646\u0623 \u0646\u0643\u0645\u064a \u064a\u062a\u0644\u0627 \u0629\u064a\u0648\u0642\u0644\u0627 \u062a\u0627\u0648\u062f\u0644\u0623\u0627 \u0646\u0645 \u0621\u0627\u0645\u0644\u0639\u0644\u0627\u0648 \u0646\u064a\u0644\u0644\u062d\u0645\u0644\u0627 \u0649\u0644\u0639 \u0644\u0647\u0633\u064a \u0627\u0645\u0645 \u060c\u062a\u0627\u0646\u0627\u064a\u0628\u0644\u0627 \u0644\u064a\u0644\u062d\u062a\u0644 \u0629\u064a\u0644\u0627\u062b\u0645 \u0627\u0647\u0644\u0639\u062c\u062a \u0629\u062f\u064a\u0631\u0641 \u062a\u0627\u0632\u064a\u0645Python \u0648 R \u0646\u0645 \u0644\u0643 \u0643\u0644\u062a\u0645\u064a .\u062a\u0644\u0627\u0643\u0634\u0645\u0644\u0644 \u0646\u0627\u0643 \u0627\u0630\u0625 .\u0629\u0644\u0627\u0639\u0641\u0648 \u0629\u0639\u064a\u0631\u0633 \u0629\u0642\u064a\u0631\u0637\u0628 \u0629\u062f\u0642\u0639\u0645 \u062a\u0644\u0627\u064a\u0644\u062d\u062a \u0621\u0627\u0631\u062c\u0625 \u0645\u0647\u0633\u064a \u0646\u0623 \u0646\u0643\u0645\u064a \u062a\u0627\u063a\u0644\u0644\u0627 \u0647\u0630\u0647 \u0645\u0627\u062f\u062e\u062a\u0633\u0627 \u0646\u0625\u0641 \u060c\u0629\u064a\u0644\u064a\u0644\u062d\u062a \u0629\u064a\u0644\u0642\u0639 \u0643\u064a\u062f\u0644 .\u0644\u0645\u0639\u0644\u0627 \u062c\u0626\u0627\u062a\u0646 \u0646\u064a\u0633\u062d\u062a \u064a\u0641 \u0631\u064a\u0628\u0643 \u0644\u0643\u0634\u0628", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [208.10402, 579.38806, 208.10402, 592.67206], "page": 1, "span": [0, 1], "__ref_s3_data": null}], "text": "\u064b", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [509.34990999999997, 564.74799, 509.34990999999997, 578.03198], "page": 1, "span": [0, 1], "__ref_s3_data": null}], "text": "\u064b", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [99.863998, 566.06799, 522.23792, 620.75201], "page": 1, "span": [0, 348], "__ref_s3_data": null}], "text": "\u062c\u0627\u0631\u062e\u062a\u0633\u0627\u0648 \u062a\u0627\u0646\u0627\u064a\u0628\u0644\u0627 \u0646\u0645 \u0629\u0644\u0626\u0627\u0647 \u062a\u0627\u064a\u0645\u0643 \u0629\u062c\u0644\u0627\u0639\u0645 \u0646\u0643\u0645\u0645\u0644\u0627 \u0646\u0645 \u062d\u0628\u0635\u064a \u060c\u0629\u062c\u0645\u0631\u0628\u0644\u0627 \u062a\u0627\u0631\u0627\u0647\u0645 \u0639\u0645 \u064a\u0644\u064a\u0644\u062d\u062a\u0644\u0627 \u0631\u064a\u0643\u0641\u062a\u0644\u0627 \u0639\u0645\u062a\u062c\u064a \u0627\u0645\u062f\u0646\u0639 \u0630\u064a\u0641\u0646\u062a\u0644Python \u0648 R \u0645\u0627\u062f\u062e\u062a\u0633\u0627 \u0646\u064a\u062c\u0645\u0631\u0628\u0645\u0644\u0644 \u0646\u0643\u0645\u064a .\u0627\u0647\u0646\u0645 \u062a\u0627\u0647\u062c\u0648\u062a\u0644\u0627\u0648 \u0637\u0627\u0645\u0646\u0644\u0623\u0627 \u0629\u062c\u0630\u0645\u0646\u0644\u0627 \u0644\u062b\u0645 \u060c\u0629\u0645\u062f\u0642\u062a\u0645 \u0629\u064a\u0644\u064a\u0644\u062d\u062a \u062a\u0627\u064a\u0644\u0645\u0639 \u0629\u0642\u062f \u0631\u062b\u0643\u0623 \u062a\u0627\u0631\u0627\u0631\u0642 \u0630\u0627\u062e\u062a\u0627 \u0649\u0644\u0625 \u0627 \u0636\u064a\u0623 \u064a\u062f\u0624\u064a \u0646\u0623 \u0646\u0643\u0645\u064a \u0644\u0628 \u060c\u062a\u0642\u0648\u0644\u0627 \u0631\u0641\u0648\u064a \u0637\u0642\u0641 \u0633\u064a\u0644 \u0627\u0630\u0647 .\u0629\u0631\u064a\u0628\u0643\u0644\u0627 \u062a\u0627\u0646\u0627\u064a\u0628\u0644\u0627 \u0644\u064a\u0644\u062d\u062a\u0648 \u0629\u064a\u0626\u0627\u0635\u062d\u0644\u0625\u0627 \u062a\u0627\u0646\u0627\u064a\u0628\u0644\u0627 \u0649\u0644\u0639 \u0629\u0645\u0626\u0627\u0642 \u062a\u0627\u062c\u0627\u062a\u0646\u062a\u0633\u0627 \u0649\u0644\u0639 \u0621\u0627\u0646\u0628 .", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [92.903999, 496.91799999999995, 522.10596, 551.63202], "page": 1, "span": [0, 375], "__ref_s3_data": null}], "text": "\u0644\u064a\u0644\u062d\u062a\u0644\u0627 \u0646\u0645 \u060c\u062a\u0627\u0642\u064a\u0628\u0637\u062a\u0644\u0627 \u0646\u0645 \u0629\u0639\u0633\u0627\u0648 \u0629\u0639\u0648\u0645\u062c\u0645 \u0645\u0639\u062f\u062a \u0629\u064a\u0646\u063a \u062a\u0627\u0648\u062f\u0623\u0648 \u062a\u0627\u0628\u062a\u0643\u0645Python \u0648 R \u0646\u0645 \u0644\u0643 \u0631\u0641\u0648\u062a \u060c\u0643\u0644\u0630 \u0649\u0644\u0639 \u0629\u0648\u0644\u0627\u0639 \u0649\u0644\u0639 .\u0629\u0641\u0644\u062a\u062e\u0645\u0644\u0627 \u062a\u0644\u0627\u0643\u0634\u0645\u0644\u0644 \u0629\u0631\u0643\u062a\u0628\u0645 \u0644\u0648\u0644\u062d \u0631\u064a\u0648\u0637\u062a\u0644 \u062a\u0627\u0628\u062a\u0643\u0645\u0644\u0627 \u0647\u0630\u0647 \u0646\u0645 \u0629\u062f\u0627\u0641\u062a\u0633\u0644\u0627\u0627 \u0646\u064a\u0645\u062f\u062e\u062a\u0633\u0645\u0644\u0644 \u0646\u0643\u0645\u064a .\u064a\u0644\u0644\u0622\u0627 \u0645\u0644\u0639\u062a\u0644\u0627 \u0649\u0644\u0625 \u064a\u0646\u0627\u064a\u0628\u0644\u0627 R \u0631\u0641\u0648\u062a \u0627\u0645\u0646\u064a\u0628 \u060c\u0629\u0621\u0627\u0641\u0643\u0628 \u062a\u0627\u0646\u0627\u064a\u0628\u0644\u0627 \u0629\u0631\u0627\u062f\u0644\u0625 Python \u064a\u0641 pandas \u0629\u0628\u062a\u0643\u0645 \u0645\u0627\u062f\u062e\u062a\u0633\u0627 \u0646\u0643\u0645\u064a \u060c\u0644\u0627\u062b\u0645\u0644\u0627 \u0644\u064a\u0628\u0633 \u0645\u0633\u0631\u0644\u0644 \u0629\u064a\u0648\u0642 \u062a\u0627\u0648\u062f\u0623 .\u0646\u064a\u0644\u0644\u062d\u0645\u0644\u0627\u0648 \u0646\u064a\u062b\u062d\u0627\u0628\u0644\u0644 \u0629\u064a\u0644\u0627\u062b\u0645 \u0627\u0647\u0644\u0639\u062c\u064a \u0627\u0645\u0645 \u060c\u064a\u0626\u0627\u0635\u062d\u0644\u0625\u0627 \u0644\u064a\u0644\u062d\u062a\u0644\u0627\u0648 \u064a\u0646\u0627\u064a\u0628\u0644\u0627", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [96.863998, 441.478, 522.07404, 482.362], "page": 1, "span": [0, 267], "__ref_s3_data": null}], "text": "Python \u0648 R \u0629\u063a\u0644\u0628 \u0629\u062c\u0645\u0631\u0628\u0644\u0627 \u064a\u062f\u0624\u062a \u0646\u0623 \u0646\u0643\u0645\u064a \u060c\u0629\u064a\u0627\u0647\u0646\u0644\u0627 \u064a\u0641 \u0629\u0631\u0643\u062a\u0628\u0645 \u0644\u0648\u0644\u062d \u0631\u064a\u0641\u0648\u062a\u0648 \u0629\u064a\u062c\u0627\u062a\u0646\u0644\u0625\u0627 \u0646\u064a\u0633\u062d\u062a \u0649\u0644\u0625 \u0629\u064a\u0644\u064a\u0644\u062d\u062a \u0629\u064a\u0644\u0642\u0639 \u0639\u0645 \u0627\u0647\u0644 \u0646\u0648\u0643\u062a \u0646\u0623 \u0646\u0643\u0645\u064a \u0629\u0628\u0633\u0627\u0646\u0645\u0644\u0627 \u0629\u064a\u062c\u0645\u0631\u0628\u0644\u0627 \u0628\u064a\u0644\u0627\u0633\u0644\u0623\u0627 \u0642\u064a\u0628\u0637\u062a\u0648 \u0644\u0627\u0639\u0641 \u0644\u0643\u0634\u0628 \u062a\u0627\u0646\u0627\u064a\u0628\u0644\u0627 \u0644\u064a\u0644\u062d\u062a \u0649\u0644\u0639 \u0629\u0631\u062f\u0642\u0644\u0627 \u0646\u0625 .\u0629\u062f\u0642\u0639\u0645\u0644\u0627 \u062a\u0644\u0627\u0643\u0634\u0645\u0644\u0644 .\u064a\u0646\u0647\u0645\u0644\u0627\u0648 \u064a\u0635\u062e\u0634\u0644\u0627 \u0621\u0627\u062f\u0644\u0623\u0627 \u0649\u0644\u0639 \u0649\u062f\u0645\u0644\u0627 \u0629\u062f\u064a\u0639\u0628 \u0629\u064a\u0628\u0627\u062c\u064a\u0625 \u062a\u0627\u0631\u064a\u062b\u0623\u062a", "type": "paragraph", "payload": null, "name": "Text", "font": null}], "figures": [], "tables": [], "bitmaps": null, "equations": [], "footnotes": [], "page-dimensions": [{"height": 792.0, "page": 1, "width": 612.0}], "page-footers": [], "page-headers": [], "_s3_data": null, "identifiers": null}
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v1/right_to_left_01.md b/tests/data/groundtruth/docling_v1/right_to_left_01.md
new file mode 100644
index 00000000..d7daba08
--- /dev/null
+++ b/tests/data/groundtruth/docling_v1/right_to_left_01.md
@@ -0,0 +1,11 @@
+## Pythonو R ةغلب ةجمربلا للاخ نم تلاكشملا لحو ةيجاتنلإا نيسحت
+
+Python و R ةغلب ةجمربلا ربتعت ةلاعف لولح داجيإ يف دعاستو ةيجاتنلإا ززعت نأ نكمي يتلا ةيوقلا تاودلأا نم ءاملعلاو نيللحملا ىلع لهسي امم ،تانايبلا ليلحتل ةيلاثم اهلعجت ةديرف تازيمPython و R نم لك كلتمي .تلاكشملل ناك اذإ .ةلاعفو ةعيرس ةقيرطب ةدقعم تلايلحت ءارجإ مهسي نأ نكمي تاغللا هذه مادختسا نإف ،ةيليلحت ةيلقع كيدل .لمعلا جئاتن نيسحت يف ريبك لكشب
+
+ً
+
+جارختساو تانايبلا نم ةلئاه تايمك ةجلاعم نكمملا نم حبصي ،ةجمربلا تاراهم عم يليلحتلا ريكفتلا عمتجي امدنع ذيفنتلPython و R مادختسا نيجمربملل نكمي .اهنم تاهجوتلاو طامنلأا ةجذمنلا لثم ،ةمدقتم ةيليلحت تايلمع ةقد رثكأ تارارق ذاختا ىلإ ا ضيأ يدؤي نأ نكمي لب ،تقولا رفوي طقف سيل اذه .ةريبكلا تانايبلا ليلحتو ةيئاصحلإا تانايبلا ىلع ةمئاق تاجاتنتسا ىلع ءانب .
+
+ليلحتلا نم ،تاقيبطتلا نم ةعساو ةعومجم معدت ةينغ تاودأو تابتكمPython و R نم لك رفوت ،كلذ ىلع ةولاع ىلع .ةفلتخملا تلاكشملل ةركتبم لولح ريوطتل تابتكملا هذه نم ةدافتسلاا نيمدختسملل نكمي .يللآا ملعتلا ىلإ ينايبلا R رفوت امنيب ،ةءافكب تانايبلا ةرادلإ Python يف pandas ةبتكم مادختسا نكمي ،لاثملا ليبس مسرلل ةيوق تاودأ .نيللحملاو نيثحابلل ةيلاثم اهلعجي امم ،يئاصحلإا ليلحتلاو ينايبلا
+
+Python و R ةغلب ةجمربلا يدؤت نأ نكمي ،ةياهنلا يف ةركتبم لولح ريفوتو ةيجاتنلإا نيسحت ىلإ ةيليلحت ةيلقع عم اهل نوكت نأ نكمي ةبسانملا ةيجمربلا بيلاسلأا قيبطتو لاعف لكشب تانايبلا ليلحت ىلع ةردقلا نإ .ةدقعملا تلاكشملل .ينهملاو يصخشلا ءادلأا ىلع ىدملا ةديعب ةيباجيإ تاريثأت
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v1/right_to_left_01.pages.json b/tests/data/groundtruth/docling_v1/right_to_left_01.pages.json
new file mode 100644
index 00000000..356e76d5
--- /dev/null
+++ b/tests/data/groundtruth/docling_v1/right_to_left_01.pages.json
@@ -0,0 +1 @@
+[{"page_no": 0, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "Python\u0648 R \u0629\u063a\u0644\u0628 \u0629\u062c\u0645\u0631\u0628\u0644\u0627 \u0644\u0644\u0627\u062e \u0646\u0645 \u062a\u0644\u0627\u0643\u0634\u0645\u0644\u0627 \u0644\u062d\u0648 \u0629\u064a\u062c\u0627\u062a\u0646\u0644\u0625\u0627 \u0646\u064a\u0633\u062d\u062a", "bbox": {"l": 223.85000999999997, "t": 72.53801999999985, "r": 521.98181, "b": 87.54894999999988, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Python \u0648 R \u0629\u063a\u0644\u0628 \u0629\u062c\u0645\u0631\u0628\u0644\u0627 \u0631\u0628\u062a\u0639\u062a", "bbox": {"l": 396.54999, "t": 102.00800000000004, "r": 522.19, "b": 115.29199000000006, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": " \u0629\u0644\u0627\u0639\u0641 \u0644\u0648\u0644\u062d \u062f\u0627\u062c\u064a\u0625 \u064a\u0641 \u062f\u0639\u0627\u0633\u062a\u0648 \u0629\u064a\u062c\u0627\u062a\u0646\u0644\u0625\u0627 \u0632\u0632\u0639\u062a \u0646\u0623 \u0646\u0643\u0645\u064a \u064a\u062a\u0644\u0627 \u0629\u064a\u0648\u0642\u0644\u0627 \u062a\u0627\u0648\u062f\u0644\u0623\u0627 \u0646\u0645", "bbox": {"l": 108.73999999999998, "t": 102.00800000000004, "r": 396.35596, "b": 115.29199000000006, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": " \u0621\u0627\u0645\u0644\u0639\u0644\u0627\u0648 \u0646\u064a\u0644\u0644\u062d\u0645\u0644\u0627 \u0649\u0644\u0639 \u0644\u0647\u0633\u064a \u0627\u0645\u0645 \u060c\u062a\u0627\u0646\u0627\u064a\u0628\u0644\u0627 \u0644\u064a\u0644\u062d\u062a\u0644 \u0629\u064a\u0644\u0627\u062b\u0645 \u0627\u0647\u0644\u0639\u062c\u062a \u0629\u062f\u064a\u0631\u0641 \u062a\u0627\u0632\u064a\u0645Python \u0648 R \u0646\u0645 \u0644\u0643 \u0643\u0644\u062a\u0645\u064a .\u062a\u0644\u0627\u0643\u0634\u0645\u0644\u0644", "bbox": {"l": 90.744003, "t": 115.80797999999993, "r": 522.08203, "b": 129.09198000000004, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": " \u0646\u0627\u0643 \u0627\u0630\u0625 .\u0629\u0644\u0627\u0639\u0641\u0648 \u0629\u0639\u064a\u0631\u0633 \u0629\u0642\u064a\u0631\u0637\u0628 \u0629\u062f\u0642\u0639\u0645 \u062a\u0644\u0627\u064a\u0644\u062d\u062a \u0621\u0627\u0631\u062c\u0625", "bbox": {"l": 325.97, "t": 129.60797000000014, "r": 522.04602, "b": 142.89197000000001, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": " \u0645\u0647\u0633\u064a \u0646\u0623 \u0646\u0643\u0645\u064a \u062a\u0627\u063a\u0644\u0644\u0627 \u0647\u0630\u0647 \u0645\u0627\u062f\u062e\u062a\u0633\u0627 \u0646\u0625\u0641 \u060c\u0629\u064a\u0644\u064a\u0644\u062d\u062a \u0629\u064a\u0644\u0642\u0639 \u0643\u064a\u062f\u0644", "bbox": {"l": 108.74001, "t": 129.60797000000014, "r": 325.78397, "b": 142.89197000000001, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": ".\u0644\u0645\u0639\u0644\u0627 \u062c\u0626\u0627\u062a\u0646 \u0646\u064a\u0633\u062d\u062a \u064a\u0641 \u0631\u064a\u0628\u0643 \u0644\u0643\u0634\u0628", "bbox": {"l": 394.03, "t": 143.40796, "r": 522.15405, "b": 156.69196, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": " \u062c\u0627\u0631\u062e\u062a\u0633\u0627\u0648 \u062a\u0627\u0646\u0627\u064a\u0628\u0644\u0627 \u0646\u0645 \u0629\u0644\u0626\u0627\u0647 \u062a\u0627\u064a\u0645\u0643 \u0629\u062c\u0644\u0627\u0639\u0645 \u0646\u0643\u0645\u0645\u0644\u0627 \u0646\u0645 \u062d\u0628\u0635\u064a \u060c\u0629\u062c\u0645\u0631\u0628\u0644\u0627 \u062a\u0627\u0631\u0627\u0647\u0645 \u0639\u0645 \u064a\u0644\u064a\u0644\u062d\u062a\u0644\u0627 \u0631\u064a\u0643\u0641\u062a\u0644\u0627 \u0639\u0645\u062a\u062c\u064a \u0627\u0645\u062f\u0646\u0639", "bbox": {"l": 101.42001, "t": 171.24798999999996, "r": 521.85193, "b": 184.53197999999998, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": " \u0630\u064a\u0641\u0646\u062a\u0644Python \u0648 R \u0645\u0627\u062f\u062e\u062a\u0633\u0627 \u0646\u064a\u062c\u0645\u0631\u0628\u0645\u0644\u0644 \u0646\u0643\u0645\u064a .\u0627\u0647\u0646\u0645 \u062a\u0627\u0647\u062c\u0648\u062a\u0644\u0627\u0648 \u0637\u0627\u0645\u0646\u0644\u0623\u0627", "bbox": {"l": 258.17001, "t": 185.04796999999996, "r": 522.034, "b": 198.33196999999996, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": " \u0629\u062c\u0630\u0645\u0646\u0644\u0627 \u0644\u062b\u0645 \u060c\u0629\u0645\u062f\u0642\u062a\u0645 \u0629\u064a\u0644\u064a\u0644\u062d\u062a \u062a\u0627\u064a\u0644\u0645\u0639", "bbox": {"l": 121.34, "t": 185.04796999999996, "r": 257.99597, "b": 198.33196999999996, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": " \u0629\u0642\u062f \u0631\u062b\u0643\u0623 \u062a\u0627\u0631\u0627\u0631\u0642 \u0630\u0627\u062e\u062a\u0627 \u0649\u0644\u0625 \u0627", "bbox": {"l": 99.863998, "t": 198.84795999999994, "r": 207.49202, "b": 212.13196000000005, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "\u064b", "bbox": {"l": 208.10402, "t": 199.32794, "r": 208.10402, "b": 212.61194, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "\u0636\u064a\u0623 \u064a\u062f\u0624\u064a \u0646\u0623 \u0646\u0643\u0645\u064a \u0644\u0628 \u060c\u062a\u0642\u0648\u0644\u0627 \u0631\u0641\u0648\u064a \u0637\u0642\u0641 \u0633\u064a\u0644 \u0627\u0630\u0647 .\u0629\u0631\u064a\u0628\u0643\u0644\u0627 \u062a\u0627\u0646\u0627\u064a\u0628\u0644\u0627 \u0644\u064a\u0644\u062d\u062a\u0648 \u0629\u064a\u0626\u0627\u0635\u062d\u0644\u0625\u0627", "bbox": {"l": 207.50401, "t": 198.84795999999994, "r": 522.10785, "b": 212.13196000000005, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "\u062a\u0627\u0646\u0627\u064a\u0628\u0644\u0627 \u0649\u0644\u0639 \u0629\u0645\u0626\u0627\u0642 \u062a\u0627\u062c\u0627\u062a\u0646\u062a\u0633\u0627 \u0649\u0644\u0639 ", "bbox": {"l": 378.07001, "t": 212.64801, "r": 508.74990999999994, "b": 225.93201, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "\u064b", "bbox": {"l": 509.34990999999997, "t": 213.96802000000002, "r": 509.34990999999997, "b": 227.25201000000004, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "\u0621\u0627\u0646\u0628", "bbox": {"l": 508.74990999999994, "t": 212.64801, "r": 522.23792, "b": 225.93201, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": ".", "bbox": {"l": 374.95001, "t": 212.64801, "r": 377.95001, "b": 225.93201, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": " \u0644\u064a\u0644\u062d\u062a\u0644\u0627 \u0646\u0645 \u060c\u062a\u0627\u0642\u064a\u0628\u0637\u062a\u0644\u0627 \u0646\u0645 \u0629\u0639\u0633\u0627\u0648 \u0629\u0639\u0648\u0645\u062c\u0645 \u0645\u0639\u062f\u062a \u0629\u064a\u0646\u063a \u062a\u0627\u0648\u062f\u0623\u0648 \u062a\u0627\u0628\u062a\u0643\u0645Python \u0648 R \u0646\u0645 \u0644\u0643 \u0631\u0641\u0648\u062a \u060c\u0643\u0644\u0630 \u0649\u0644\u0639 \u0629\u0648\u0644\u0627\u0639", "bbox": {"l": 95.783997, "t": 240.36798, "r": 522.07001, "b": 253.65197999999998, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": " \u0649\u0644\u0639 .\u0629\u0641\u0644\u062a\u062e\u0645\u0644\u0627 \u062a\u0644\u0627\u0643\u0634\u0645\u0644\u0644 \u0629\u0631\u0643\u062a\u0628\u0645 \u0644\u0648\u0644\u062d \u0631\u064a\u0648\u0637\u062a\u0644 \u062a\u0627\u0628\u062a\u0643\u0645\u0644\u0627 \u0647\u0630\u0647 \u0646\u0645 \u0629\u062f\u0627\u0641\u062a\u0633\u0644\u0627\u0627 \u0646\u064a\u0645\u062f\u062e\u062a\u0633\u0645\u0644\u0644 \u0646\u0643\u0645\u064a .\u064a\u0644\u0644\u0622\u0627 \u0645\u0644\u0639\u062a\u0644\u0627 \u0649\u0644\u0625 \u064a\u0646\u0627\u064a\u0628\u0644\u0627", "bbox": {"l": 92.903999, "t": 254.19799999999998, "r": 521.80798, "b": 267.48199, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": " R \u0631\u0641\u0648\u062a \u0627\u0645\u0646\u064a\u0628 \u060c\u0629\u0621\u0627\u0641\u0643\u0628 \u062a\u0627\u0646\u0627\u064a\u0628\u0644\u0627 \u0629\u0631\u0627\u062f\u0644\u0625 Python \u064a\u0641 pandas \u0629\u0628\u062a\u0643\u0645 \u0645\u0627\u062f\u062e\u062a\u0633\u0627 \u0646\u0643\u0645\u064a \u060c\u0644\u0627\u062b\u0645\u0644\u0627 \u0644\u064a\u0628\u0633", "bbox": {"l": 174.38, "t": 267.99798999999996, "r": 522.10596, "b": 281.28200999999996, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": " \u0645\u0633\u0631\u0644\u0644 \u0629\u064a\u0648\u0642 \u062a\u0627\u0648\u062f\u0623", "bbox": {"l": 105.38, "t": 267.99798999999996, "r": 174.30797, "b": 281.28200999999996, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": ".\u0646\u064a\u0644\u0644\u062d\u0645\u0644\u0627\u0648 \u0646\u064a\u062b\u062d\u0627\u0628\u0644\u0644 \u0629\u064a\u0644\u0627\u062b\u0645 \u0627\u0647\u0644\u0639\u062c\u064a \u0627\u0645\u0645 \u060c\u064a\u0626\u0627\u0635\u062d\u0644\u0625\u0627 \u0644\u064a\u0644\u062d\u062a\u0644\u0627\u0648 \u064a\u0646\u0627\u064a\u0628\u0644\u0627", "bbox": {"l": 280.37, "t": 281.798, "r": 522.09399, "b": 295.08200000000005, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "Python \u0648 R \u0629\u063a\u0644\u0628 \u0629\u062c\u0645\u0631\u0628\u0644\u0627 \u064a\u062f\u0624\u062a \u0646\u0623 \u0646\u0643\u0645\u064a \u060c\u0629\u064a\u0627\u0647\u0646\u0644\u0627 \u064a\u0641", "bbox": {"l": 319.60999, "t": 309.638, "r": 522.04596, "b": 322.9220000000001, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": " \u0629\u0631\u0643\u062a\u0628\u0645 \u0644\u0648\u0644\u062d \u0631\u064a\u0641\u0648\u062a\u0648 \u0629\u064a\u062c\u0627\u062a\u0646\u0644\u0625\u0627 \u0646\u064a\u0633\u062d\u062a \u0649\u0644\u0625 \u0629\u064a\u0644\u064a\u0644\u062d\u062a \u0629\u064a\u0644\u0642\u0639 \u0639\u0645", "bbox": {"l": 100.34, "t": 309.638, "r": 319.53198, "b": 322.9220000000001, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": " \u0627\u0647\u0644 \u0646\u0648\u0643\u062a \u0646\u0623 \u0646\u0643\u0645\u064a \u0629\u0628\u0633\u0627\u0646\u0645\u0644\u0627 \u0629\u064a\u062c\u0645\u0631\u0628\u0644\u0627 \u0628\u064a\u0644\u0627\u0633\u0644\u0623\u0627 \u0642\u064a\u0628\u0637\u062a\u0648 \u0644\u0627\u0639\u0641 \u0644\u0643\u0634\u0628 \u062a\u0627\u0646\u0627\u064a\u0628\u0644\u0627 \u0644\u064a\u0644\u062d\u062a \u0649\u0644\u0639 \u0629\u0631\u062f\u0642\u0644\u0627 \u0646\u0625 .\u0629\u062f\u0642\u0639\u0645\u0644\u0627 \u062a\u0644\u0627\u0643\u0634\u0645\u0644\u0644", "bbox": {"l": 96.863998, "t": 323.43802, "r": 521.79193, "b": 336.72202, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": ".\u064a\u0646\u0647\u0645\u0644\u0627\u0648 \u064a\u0635\u062e\u0634\u0644\u0627 \u0621\u0627\u062f\u0644\u0623\u0627 \u0649\u0644\u0639 \u0649\u062f\u0645\u0644\u0627 \u0629\u062f\u064a\u0639\u0628 \u0629\u064a\u0628\u0627\u062c\u064a\u0625 \u062a\u0627\u0631\u064a\u062b\u0623\u062a", "bbox": {"l": 304.60999, "t": 337.23801, "r": 522.07404, "b": 350.522, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 4, "label": "section_header", "bbox": {"l": 223.85000999999997, "t": 72.53801999999985, "r": 521.98181, "b": 87.54894999999988, "coord_origin": "TOPLEFT"}, "confidence": 0.9205371141433716, "cells": [{"id": 0, "text": "Python\u0648 R \u0629\u063a\u0644\u0628 \u0629\u062c\u0645\u0631\u0628\u0644\u0627 \u0644\u0644\u0627\u062e \u0646\u0645 \u062a\u0644\u0627\u0643\u0634\u0645\u0644\u0627 \u0644\u062d\u0648 \u0629\u064a\u062c\u0627\u062a\u0646\u0644\u0625\u0627 \u0646\u064a\u0633\u062d\u062a", "bbox": {"l": 223.85000999999997, "t": 72.53801999999985, "r": 521.98181, "b": 87.54894999999988, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 90.744003, "t": 102.00800000000004, "r": 522.19, "b": 156.69196, "coord_origin": "TOPLEFT"}, "confidence": 0.9738918542861938, "cells": [{"id": 1, "text": "Python \u0648 R \u0629\u063a\u0644\u0628 \u0629\u062c\u0645\u0631\u0628\u0644\u0627 \u0631\u0628\u062a\u0639\u062a", "bbox": {"l": 396.54999, "t": 102.00800000000004, "r": 522.19, "b": 115.29199000000006, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": " \u0629\u0644\u0627\u0639\u0641 \u0644\u0648\u0644\u062d \u062f\u0627\u062c\u064a\u0625 \u064a\u0641 \u062f\u0639\u0627\u0633\u062a\u0648 \u0629\u064a\u062c\u0627\u062a\u0646\u0644\u0625\u0627 \u0632\u0632\u0639\u062a \u0646\u0623 \u0646\u0643\u0645\u064a \u064a\u062a\u0644\u0627 \u0629\u064a\u0648\u0642\u0644\u0627 \u062a\u0627\u0648\u062f\u0644\u0623\u0627 \u0646\u0645", "bbox": {"l": 108.73999999999998, "t": 102.00800000000004, "r": 396.35596, "b": 115.29199000000006, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": " \u0621\u0627\u0645\u0644\u0639\u0644\u0627\u0648 \u0646\u064a\u0644\u0644\u062d\u0645\u0644\u0627 \u0649\u0644\u0639 \u0644\u0647\u0633\u064a \u0627\u0645\u0645 \u060c\u062a\u0627\u0646\u0627\u064a\u0628\u0644\u0627 \u0644\u064a\u0644\u062d\u062a\u0644 \u0629\u064a\u0644\u0627\u062b\u0645 \u0627\u0647\u0644\u0639\u062c\u062a \u0629\u062f\u064a\u0631\u0641 \u062a\u0627\u0632\u064a\u0645Python \u0648 R \u0646\u0645 \u0644\u0643 \u0643\u0644\u062a\u0645\u064a .\u062a\u0644\u0627\u0643\u0634\u0645\u0644\u0644", "bbox": {"l": 90.744003, "t": 115.80797999999993, "r": 522.08203, "b": 129.09198000000004, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": " \u0646\u0627\u0643 \u0627\u0630\u0625 .\u0629\u0644\u0627\u0639\u0641\u0648 \u0629\u0639\u064a\u0631\u0633 \u0629\u0642\u064a\u0631\u0637\u0628 \u0629\u062f\u0642\u0639\u0645 \u062a\u0644\u0627\u064a\u0644\u062d\u062a \u0621\u0627\u0631\u062c\u0625", "bbox": {"l": 325.97, "t": 129.60797000000014, "r": 522.04602, "b": 142.89197000000001, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": " \u0645\u0647\u0633\u064a \u0646\u0623 \u0646\u0643\u0645\u064a \u062a\u0627\u063a\u0644\u0644\u0627 \u0647\u0630\u0647 \u0645\u0627\u062f\u062e\u062a\u0633\u0627 \u0646\u0625\u0641 \u060c\u0629\u064a\u0644\u064a\u0644\u062d\u062a \u0629\u064a\u0644\u0642\u0639 \u0643\u064a\u062f\u0644", "bbox": {"l": 108.74001, "t": 129.60797000000014, "r": 325.78397, "b": 142.89197000000001, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": ".\u0644\u0645\u0639\u0644\u0627 \u062c\u0626\u0627\u062a\u0646 \u0646\u064a\u0633\u062d\u062a \u064a\u0641 \u0631\u064a\u0628\u0643 \u0644\u0643\u0634\u0628", "bbox": {"l": 394.03, "t": 143.40796, "r": 522.15405, "b": 156.69196, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 99.863998, "t": 171.24798999999996, "r": 522.23792, "b": 225.93201, "coord_origin": "TOPLEFT"}, "confidence": 0.9677387475967407, "cells": [{"id": 7, "text": " \u062c\u0627\u0631\u062e\u062a\u0633\u0627\u0648 \u062a\u0627\u0646\u0627\u064a\u0628\u0644\u0627 \u0646\u0645 \u0629\u0644\u0626\u0627\u0647 \u062a\u0627\u064a\u0645\u0643 \u0629\u062c\u0644\u0627\u0639\u0645 \u0646\u0643\u0645\u0645\u0644\u0627 \u0646\u0645 \u062d\u0628\u0635\u064a \u060c\u0629\u062c\u0645\u0631\u0628\u0644\u0627 \u062a\u0627\u0631\u0627\u0647\u0645 \u0639\u0645 \u064a\u0644\u064a\u0644\u062d\u062a\u0644\u0627 \u0631\u064a\u0643\u0641\u062a\u0644\u0627 \u0639\u0645\u062a\u062c\u064a \u0627\u0645\u062f\u0646\u0639", "bbox": {"l": 101.42001, "t": 171.24798999999996, "r": 521.85193, "b": 184.53197999999998, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": " \u0630\u064a\u0641\u0646\u062a\u0644Python \u0648 R \u0645\u0627\u062f\u062e\u062a\u0633\u0627 \u0646\u064a\u062c\u0645\u0631\u0628\u0645\u0644\u0644 \u0646\u0643\u0645\u064a .\u0627\u0647\u0646\u0645 \u062a\u0627\u0647\u062c\u0648\u062a\u0644\u0627\u0648 \u0637\u0627\u0645\u0646\u0644\u0623\u0627", "bbox": {"l": 258.17001, "t": 185.04796999999996, "r": 522.034, "b": 198.33196999999996, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": " \u0629\u062c\u0630\u0645\u0646\u0644\u0627 \u0644\u062b\u0645 \u060c\u0629\u0645\u062f\u0642\u062a\u0645 \u0629\u064a\u0644\u064a\u0644\u062d\u062a \u062a\u0627\u064a\u0644\u0645\u0639", "bbox": {"l": 121.34, "t": 185.04796999999996, "r": 257.99597, "b": 198.33196999999996, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": " \u0629\u0642\u062f \u0631\u062b\u0643\u0623 \u062a\u0627\u0631\u0627\u0631\u0642 \u0630\u0627\u062e\u062a\u0627 \u0649\u0644\u0625 \u0627", "bbox": {"l": 99.863998, "t": 198.84795999999994, "r": 207.49202, "b": 212.13196000000005, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "\u0636\u064a\u0623 \u064a\u062f\u0624\u064a \u0646\u0623 \u0646\u0643\u0645\u064a \u0644\u0628 \u060c\u062a\u0642\u0648\u0644\u0627 \u0631\u0641\u0648\u064a \u0637\u0642\u0641 \u0633\u064a\u0644 \u0627\u0630\u0647 .\u0629\u0631\u064a\u0628\u0643\u0644\u0627 \u062a\u0627\u0646\u0627\u064a\u0628\u0644\u0627 \u0644\u064a\u0644\u062d\u062a\u0648 \u0629\u064a\u0626\u0627\u0635\u062d\u0644\u0625\u0627", "bbox": {"l": 207.50401, "t": 198.84795999999994, "r": 522.10785, "b": 212.13196000000005, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "\u062a\u0627\u0646\u0627\u064a\u0628\u0644\u0627 \u0649\u0644\u0639 \u0629\u0645\u0626\u0627\u0642 \u062a\u0627\u062c\u0627\u062a\u0646\u062a\u0633\u0627 \u0649\u0644\u0639 ", "bbox": {"l": 378.07001, "t": 212.64801, "r": 508.74990999999994, "b": 225.93201, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "\u0621\u0627\u0646\u0628", "bbox": {"l": 508.74990999999994, "t": 212.64801, "r": 522.23792, "b": 225.93201, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": ".", "bbox": {"l": 374.95001, "t": 212.64801, "r": 377.95001, "b": 225.93201, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "text", "bbox": {"l": 208.10402, "t": 199.32794, "r": 208.10402, "b": 212.61194, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "\u064b", "bbox": {"l": 208.10402, "t": 199.32794, "r": 208.10402, "b": 212.61194, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "text", "bbox": {"l": 509.34990999999997, "t": 213.96802000000002, "r": 509.34990999999997, "b": 227.25201000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "\u064b", "bbox": {"l": 509.34990999999997, "t": 213.96802000000002, "r": 509.34990999999997, "b": 227.25201000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 92.903999, "t": 240.36798, "r": 522.10596, "b": 295.08200000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9547483325004578, "cells": [{"id": 17, "text": " \u0644\u064a\u0644\u062d\u062a\u0644\u0627 \u0646\u0645 \u060c\u062a\u0627\u0642\u064a\u0628\u0637\u062a\u0644\u0627 \u0646\u0645 \u0629\u0639\u0633\u0627\u0648 \u0629\u0639\u0648\u0645\u062c\u0645 \u0645\u0639\u062f\u062a \u0629\u064a\u0646\u063a \u062a\u0627\u0648\u062f\u0623\u0648 \u062a\u0627\u0628\u062a\u0643\u0645Python \u0648 R \u0646\u0645 \u0644\u0643 \u0631\u0641\u0648\u062a \u060c\u0643\u0644\u0630 \u0649\u0644\u0639 \u0629\u0648\u0644\u0627\u0639", "bbox": {"l": 95.783997, "t": 240.36798, "r": 522.07001, "b": 253.65197999999998, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": " \u0649\u0644\u0639 .\u0629\u0641\u0644\u062a\u062e\u0645\u0644\u0627 \u062a\u0644\u0627\u0643\u0634\u0645\u0644\u0644 \u0629\u0631\u0643\u062a\u0628\u0645 \u0644\u0648\u0644\u062d \u0631\u064a\u0648\u0637\u062a\u0644 \u062a\u0627\u0628\u062a\u0643\u0645\u0644\u0627 \u0647\u0630\u0647 \u0646\u0645 \u0629\u062f\u0627\u0641\u062a\u0633\u0644\u0627\u0627 \u0646\u064a\u0645\u062f\u062e\u062a\u0633\u0645\u0644\u0644 \u0646\u0643\u0645\u064a .\u064a\u0644\u0644\u0622\u0627 \u0645\u0644\u0639\u062a\u0644\u0627 \u0649\u0644\u0625 \u064a\u0646\u0627\u064a\u0628\u0644\u0627", "bbox": {"l": 92.903999, "t": 254.19799999999998, "r": 521.80798, "b": 267.48199, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": " R \u0631\u0641\u0648\u062a \u0627\u0645\u0646\u064a\u0628 \u060c\u0629\u0621\u0627\u0641\u0643\u0628 \u062a\u0627\u0646\u0627\u064a\u0628\u0644\u0627 \u0629\u0631\u0627\u062f\u0644\u0625 Python \u064a\u0641 pandas \u0629\u0628\u062a\u0643\u0645 \u0645\u0627\u062f\u062e\u062a\u0633\u0627 \u0646\u0643\u0645\u064a \u060c\u0644\u0627\u062b\u0645\u0644\u0627 \u0644\u064a\u0628\u0633", "bbox": {"l": 174.38, "t": 267.99798999999996, "r": 522.10596, "b": 281.28200999999996, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": " \u0645\u0633\u0631\u0644\u0644 \u0629\u064a\u0648\u0642 \u062a\u0627\u0648\u062f\u0623", "bbox": {"l": 105.38, "t": 267.99798999999996, "r": 174.30797, "b": 281.28200999999996, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": ".\u0646\u064a\u0644\u0644\u062d\u0645\u0644\u0627\u0648 \u0646\u064a\u062b\u062d\u0627\u0628\u0644\u0644 \u0629\u064a\u0644\u0627\u062b\u0645 \u0627\u0647\u0644\u0639\u062c\u064a \u0627\u0645\u0645 \u060c\u064a\u0626\u0627\u0635\u062d\u0644\u0625\u0627 \u0644\u064a\u0644\u062d\u062a\u0644\u0627\u0648 \u064a\u0646\u0627\u064a\u0628\u0644\u0627", "bbox": {"l": 280.37, "t": 281.798, "r": 522.09399, "b": 295.08200000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 96.863998, "t": 309.638, "r": 522.07404, "b": 350.522, "coord_origin": "TOPLEFT"}, "confidence": 0.9672117233276367, "cells": [{"id": 22, "text": "Python \u0648 R \u0629\u063a\u0644\u0628 \u0629\u062c\u0645\u0631\u0628\u0644\u0627 \u064a\u062f\u0624\u062a \u0646\u0623 \u0646\u0643\u0645\u064a \u060c\u0629\u064a\u0627\u0647\u0646\u0644\u0627 \u064a\u0641", "bbox": {"l": 319.60999, "t": 309.638, "r": 522.04596, "b": 322.9220000000001, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": " \u0629\u0631\u0643\u062a\u0628\u0645 \u0644\u0648\u0644\u062d \u0631\u064a\u0641\u0648\u062a\u0648 \u0629\u064a\u062c\u0627\u062a\u0646\u0644\u0625\u0627 \u0646\u064a\u0633\u062d\u062a \u0649\u0644\u0625 \u0629\u064a\u0644\u064a\u0644\u062d\u062a \u0629\u064a\u0644\u0642\u0639 \u0639\u0645", "bbox": {"l": 100.34, "t": 309.638, "r": 319.53198, "b": 322.9220000000001, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": " \u0627\u0647\u0644 \u0646\u0648\u0643\u062a \u0646\u0623 \u0646\u0643\u0645\u064a \u0629\u0628\u0633\u0627\u0646\u0645\u0644\u0627 \u0629\u064a\u062c\u0645\u0631\u0628\u0644\u0627 \u0628\u064a\u0644\u0627\u0633\u0644\u0623\u0627 \u0642\u064a\u0628\u0637\u062a\u0648 \u0644\u0627\u0639\u0641 \u0644\u0643\u0634\u0628 \u062a\u0627\u0646\u0627\u064a\u0628\u0644\u0627 \u0644\u064a\u0644\u062d\u062a \u0649\u0644\u0639 \u0629\u0631\u062f\u0642\u0644\u0627 \u0646\u0625 .\u0629\u062f\u0642\u0639\u0645\u0644\u0627 \u062a\u0644\u0627\u0643\u0634\u0645\u0644\u0644", "bbox": {"l": 96.863998, "t": 323.43802, "r": 521.79193, "b": 336.72202, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": ".\u064a\u0646\u0647\u0645\u0644\u0627\u0648 \u064a\u0635\u062e\u0634\u0644\u0627 \u0621\u0627\u062f\u0644\u0623\u0627 \u0649\u0644\u0639 \u0649\u062f\u0645\u0644\u0627 \u0629\u062f\u064a\u0639\u0628 \u0629\u064a\u0628\u0627\u062c\u064a\u0625 \u062a\u0627\u0631\u064a\u062b\u0623\u062a", "bbox": {"l": 304.60999, "t": 337.23801, "r": 522.07404, "b": 350.522, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "section_header", "id": 4, "page_no": 0, "cluster": {"id": 4, "label": "section_header", "bbox": {"l": 223.85000999999997, "t": 72.53801999999985, "r": 521.98181, "b": 87.54894999999988, "coord_origin": "TOPLEFT"}, "confidence": 0.9205371141433716, "cells": [{"id": 0, "text": "Python\u0648 R \u0629\u063a\u0644\u0628 \u0629\u062c\u0645\u0631\u0628\u0644\u0627 \u0644\u0644\u0627\u062e \u0646\u0645 \u062a\u0644\u0627\u0643\u0634\u0645\u0644\u0627 \u0644\u062d\u0648 \u0629\u064a\u062c\u0627\u062a\u0646\u0644\u0625\u0627 \u0646\u064a\u0633\u062d\u062a", "bbox": {"l": 223.85000999999997, "t": 72.53801999999985, "r": 521.98181, "b": 87.54894999999988, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Python\u0648 R \u0629\u063a\u0644\u0628 \u0629\u062c\u0645\u0631\u0628\u0644\u0627 \u0644\u0644\u0627\u062e \u0646\u0645 \u062a\u0644\u0627\u0643\u0634\u0645\u0644\u0627 \u0644\u062d\u0648 \u0629\u064a\u062c\u0627\u062a\u0646\u0644\u0625\u0627 \u0646\u064a\u0633\u062d\u062a"}, {"label": "text", "id": 0, "page_no": 0, "cluster": {"id": 0, "label": "text", "bbox": {"l": 90.744003, "t": 102.00800000000004, "r": 522.19, "b": 156.69196, "coord_origin": "TOPLEFT"}, "confidence": 0.9738918542861938, "cells": [{"id": 1, "text": "Python \u0648 R \u0629\u063a\u0644\u0628 \u0629\u062c\u0645\u0631\u0628\u0644\u0627 \u0631\u0628\u062a\u0639\u062a", "bbox": {"l": 396.54999, "t": 102.00800000000004, "r": 522.19, "b": 115.29199000000006, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": " \u0629\u0644\u0627\u0639\u0641 \u0644\u0648\u0644\u062d \u062f\u0627\u062c\u064a\u0625 \u064a\u0641 \u062f\u0639\u0627\u0633\u062a\u0648 \u0629\u064a\u062c\u0627\u062a\u0646\u0644\u0625\u0627 \u0632\u0632\u0639\u062a \u0646\u0623 \u0646\u0643\u0645\u064a \u064a\u062a\u0644\u0627 \u0629\u064a\u0648\u0642\u0644\u0627 \u062a\u0627\u0648\u062f\u0644\u0623\u0627 \u0646\u0645", "bbox": {"l": 108.73999999999998, "t": 102.00800000000004, "r": 396.35596, "b": 115.29199000000006, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": " \u0621\u0627\u0645\u0644\u0639\u0644\u0627\u0648 \u0646\u064a\u0644\u0644\u062d\u0645\u0644\u0627 \u0649\u0644\u0639 \u0644\u0647\u0633\u064a \u0627\u0645\u0645 \u060c\u062a\u0627\u0646\u0627\u064a\u0628\u0644\u0627 \u0644\u064a\u0644\u062d\u062a\u0644 \u0629\u064a\u0644\u0627\u062b\u0645 \u0627\u0647\u0644\u0639\u062c\u062a \u0629\u062f\u064a\u0631\u0641 \u062a\u0627\u0632\u064a\u0645Python \u0648 R \u0646\u0645 \u0644\u0643 \u0643\u0644\u062a\u0645\u064a .\u062a\u0644\u0627\u0643\u0634\u0645\u0644\u0644", "bbox": {"l": 90.744003, "t": 115.80797999999993, "r": 522.08203, "b": 129.09198000000004, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": " \u0646\u0627\u0643 \u0627\u0630\u0625 .\u0629\u0644\u0627\u0639\u0641\u0648 \u0629\u0639\u064a\u0631\u0633 \u0629\u0642\u064a\u0631\u0637\u0628 \u0629\u062f\u0642\u0639\u0645 \u062a\u0644\u0627\u064a\u0644\u062d\u062a \u0621\u0627\u0631\u062c\u0625", "bbox": {"l": 325.97, "t": 129.60797000000014, "r": 522.04602, "b": 142.89197000000001, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": " \u0645\u0647\u0633\u064a \u0646\u0623 \u0646\u0643\u0645\u064a \u062a\u0627\u063a\u0644\u0644\u0627 \u0647\u0630\u0647 \u0645\u0627\u062f\u062e\u062a\u0633\u0627 \u0646\u0625\u0641 \u060c\u0629\u064a\u0644\u064a\u0644\u062d\u062a \u0629\u064a\u0644\u0642\u0639 \u0643\u064a\u062f\u0644", "bbox": {"l": 108.74001, "t": 129.60797000000014, "r": 325.78397, "b": 142.89197000000001, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": ".\u0644\u0645\u0639\u0644\u0627 \u062c\u0626\u0627\u062a\u0646 \u0646\u064a\u0633\u062d\u062a \u064a\u0641 \u0631\u064a\u0628\u0643 \u0644\u0643\u0634\u0628", "bbox": {"l": 394.03, "t": 143.40796, "r": 522.15405, "b": 156.69196, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Python \u0648 R \u0629\u063a\u0644\u0628 \u0629\u062c\u0645\u0631\u0628\u0644\u0627 \u0631\u0628\u062a\u0639\u062a \u0629\u0644\u0627\u0639\u0641 \u0644\u0648\u0644\u062d \u062f\u0627\u062c\u064a\u0625 \u064a\u0641 \u062f\u0639\u0627\u0633\u062a\u0648 \u0629\u064a\u062c\u0627\u062a\u0646\u0644\u0625\u0627 \u0632\u0632\u0639\u062a \u0646\u0623 \u0646\u0643\u0645\u064a \u064a\u062a\u0644\u0627 \u0629\u064a\u0648\u0642\u0644\u0627 \u062a\u0627\u0648\u062f\u0644\u0623\u0627 \u0646\u0645 \u0621\u0627\u0645\u0644\u0639\u0644\u0627\u0648 \u0646\u064a\u0644\u0644\u062d\u0645\u0644\u0627 \u0649\u0644\u0639 \u0644\u0647\u0633\u064a \u0627\u0645\u0645 \u060c\u062a\u0627\u0646\u0627\u064a\u0628\u0644\u0627 \u0644\u064a\u0644\u062d\u062a\u0644 \u0629\u064a\u0644\u0627\u062b\u0645 \u0627\u0647\u0644\u0639\u062c\u062a \u0629\u062f\u064a\u0631\u0641 \u062a\u0627\u0632\u064a\u0645Python \u0648 R \u0646\u0645 \u0644\u0643 \u0643\u0644\u062a\u0645\u064a .\u062a\u0644\u0627\u0643\u0634\u0645\u0644\u0644 \u0646\u0627\u0643 \u0627\u0630\u0625 .\u0629\u0644\u0627\u0639\u0641\u0648 \u0629\u0639\u064a\u0631\u0633 \u0629\u0642\u064a\u0631\u0637\u0628 \u0629\u062f\u0642\u0639\u0645 \u062a\u0644\u0627\u064a\u0644\u062d\u062a \u0621\u0627\u0631\u062c\u0625 \u0645\u0647\u0633\u064a \u0646\u0623 \u0646\u0643\u0645\u064a \u062a\u0627\u063a\u0644\u0644\u0627 \u0647\u0630\u0647 \u0645\u0627\u062f\u062e\u062a\u0633\u0627 \u0646\u0625\u0641 \u060c\u0629\u064a\u0644\u064a\u0644\u062d\u062a \u0629\u064a\u0644\u0642\u0639 \u0643\u064a\u062f\u0644 .\u0644\u0645\u0639\u0644\u0627 \u062c\u0626\u0627\u062a\u0646 \u0646\u064a\u0633\u062d\u062a \u064a\u0641 \u0631\u064a\u0628\u0643 \u0644\u0643\u0634\u0628"}, {"label": "text", "id": 1, "page_no": 0, "cluster": {"id": 1, "label": "text", "bbox": {"l": 99.863998, "t": 171.24798999999996, "r": 522.23792, "b": 225.93201, "coord_origin": "TOPLEFT"}, "confidence": 0.9677387475967407, "cells": [{"id": 7, "text": " \u062c\u0627\u0631\u062e\u062a\u0633\u0627\u0648 \u062a\u0627\u0646\u0627\u064a\u0628\u0644\u0627 \u0646\u0645 \u0629\u0644\u0626\u0627\u0647 \u062a\u0627\u064a\u0645\u0643 \u0629\u062c\u0644\u0627\u0639\u0645 \u0646\u0643\u0645\u0645\u0644\u0627 \u0646\u0645 \u062d\u0628\u0635\u064a \u060c\u0629\u062c\u0645\u0631\u0628\u0644\u0627 \u062a\u0627\u0631\u0627\u0647\u0645 \u0639\u0645 \u064a\u0644\u064a\u0644\u062d\u062a\u0644\u0627 \u0631\u064a\u0643\u0641\u062a\u0644\u0627 \u0639\u0645\u062a\u062c\u064a \u0627\u0645\u062f\u0646\u0639", "bbox": {"l": 101.42001, "t": 171.24798999999996, "r": 521.85193, "b": 184.53197999999998, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": " \u0630\u064a\u0641\u0646\u062a\u0644Python \u0648 R \u0645\u0627\u062f\u062e\u062a\u0633\u0627 \u0646\u064a\u062c\u0645\u0631\u0628\u0645\u0644\u0644 \u0646\u0643\u0645\u064a .\u0627\u0647\u0646\u0645 \u062a\u0627\u0647\u062c\u0648\u062a\u0644\u0627\u0648 \u0637\u0627\u0645\u0646\u0644\u0623\u0627", "bbox": {"l": 258.17001, "t": 185.04796999999996, "r": 522.034, "b": 198.33196999999996, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": " \u0629\u062c\u0630\u0645\u0646\u0644\u0627 \u0644\u062b\u0645 \u060c\u0629\u0645\u062f\u0642\u062a\u0645 \u0629\u064a\u0644\u064a\u0644\u062d\u062a \u062a\u0627\u064a\u0644\u0645\u0639", "bbox": {"l": 121.34, "t": 185.04796999999996, "r": 257.99597, "b": 198.33196999999996, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": " \u0629\u0642\u062f \u0631\u062b\u0643\u0623 \u062a\u0627\u0631\u0627\u0631\u0642 \u0630\u0627\u062e\u062a\u0627 \u0649\u0644\u0625 \u0627", "bbox": {"l": 99.863998, "t": 198.84795999999994, "r": 207.49202, "b": 212.13196000000005, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "\u0636\u064a\u0623 \u064a\u062f\u0624\u064a \u0646\u0623 \u0646\u0643\u0645\u064a \u0644\u0628 \u060c\u062a\u0642\u0648\u0644\u0627 \u0631\u0641\u0648\u064a \u0637\u0642\u0641 \u0633\u064a\u0644 \u0627\u0630\u0647 .\u0629\u0631\u064a\u0628\u0643\u0644\u0627 \u062a\u0627\u0646\u0627\u064a\u0628\u0644\u0627 \u0644\u064a\u0644\u062d\u062a\u0648 \u0629\u064a\u0626\u0627\u0635\u062d\u0644\u0625\u0627", "bbox": {"l": 207.50401, "t": 198.84795999999994, "r": 522.10785, "b": 212.13196000000005, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "\u062a\u0627\u0646\u0627\u064a\u0628\u0644\u0627 \u0649\u0644\u0639 \u0629\u0645\u0626\u0627\u0642 \u062a\u0627\u062c\u0627\u062a\u0646\u062a\u0633\u0627 \u0649\u0644\u0639 ", "bbox": {"l": 378.07001, "t": 212.64801, "r": 508.74990999999994, "b": 225.93201, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "\u0621\u0627\u0646\u0628", "bbox": {"l": 508.74990999999994, "t": 212.64801, "r": 522.23792, "b": 225.93201, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": ".", "bbox": {"l": 374.95001, "t": 212.64801, "r": 377.95001, "b": 225.93201, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u062c\u0627\u0631\u062e\u062a\u0633\u0627\u0648 \u062a\u0627\u0646\u0627\u064a\u0628\u0644\u0627 \u0646\u0645 \u0629\u0644\u0626\u0627\u0647 \u062a\u0627\u064a\u0645\u0643 \u0629\u062c\u0644\u0627\u0639\u0645 \u0646\u0643\u0645\u0645\u0644\u0627 \u0646\u0645 \u062d\u0628\u0635\u064a \u060c\u0629\u062c\u0645\u0631\u0628\u0644\u0627 \u062a\u0627\u0631\u0627\u0647\u0645 \u0639\u0645 \u064a\u0644\u064a\u0644\u062d\u062a\u0644\u0627 \u0631\u064a\u0643\u0641\u062a\u0644\u0627 \u0639\u0645\u062a\u062c\u064a \u0627\u0645\u062f\u0646\u0639 \u0630\u064a\u0641\u0646\u062a\u0644Python \u0648 R \u0645\u0627\u062f\u062e\u062a\u0633\u0627 \u0646\u064a\u062c\u0645\u0631\u0628\u0645\u0644\u0644 \u0646\u0643\u0645\u064a .\u0627\u0647\u0646\u0645 \u062a\u0627\u0647\u062c\u0648\u062a\u0644\u0627\u0648 \u0637\u0627\u0645\u0646\u0644\u0623\u0627 \u0629\u062c\u0630\u0645\u0646\u0644\u0627 \u0644\u062b\u0645 \u060c\u0629\u0645\u062f\u0642\u062a\u0645 \u0629\u064a\u0644\u064a\u0644\u062d\u062a \u062a\u0627\u064a\u0644\u0645\u0639 \u0629\u0642\u062f \u0631\u062b\u0643\u0623 \u062a\u0627\u0631\u0627\u0631\u0642 \u0630\u0627\u062e\u062a\u0627 \u0649\u0644\u0625 \u0627 \u0636\u064a\u0623 \u064a\u062f\u0624\u064a \u0646\u0623 \u0646\u0643\u0645\u064a \u0644\u0628 \u060c\u062a\u0642\u0648\u0644\u0627 \u0631\u0641\u0648\u064a \u0637\u0642\u0641 \u0633\u064a\u0644 \u0627\u0630\u0647 .\u0629\u0631\u064a\u0628\u0643\u0644\u0627 \u062a\u0627\u0646\u0627\u064a\u0628\u0644\u0627 \u0644\u064a\u0644\u062d\u062a\u0648 \u0629\u064a\u0626\u0627\u0635\u062d\u0644\u0625\u0627 \u062a\u0627\u0646\u0627\u064a\u0628\u0644\u0627 \u0649\u0644\u0639 \u0629\u0645\u0626\u0627\u0642 \u062a\u0627\u062c\u0627\u062a\u0646\u062a\u0633\u0627 \u0649\u0644\u0639 \u0621\u0627\u0646\u0628 ."}, {"label": "text", "id": 5, "page_no": 0, "cluster": {"id": 5, "label": "text", "bbox": {"l": 208.10402, "t": 199.32794, "r": 208.10402, "b": 212.61194, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "\u064b", "bbox": {"l": 208.10402, "t": 199.32794, "r": 208.10402, "b": 212.61194, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u064b"}, {"label": "text", "id": 6, "page_no": 0, "cluster": {"id": 6, "label": "text", "bbox": {"l": 509.34990999999997, "t": 213.96802000000002, "r": 509.34990999999997, "b": 227.25201000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "\u064b", "bbox": {"l": 509.34990999999997, "t": 213.96802000000002, "r": 509.34990999999997, "b": 227.25201000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u064b"}, {"label": "text", "id": 3, "page_no": 0, "cluster": {"id": 3, "label": "text", "bbox": {"l": 92.903999, "t": 240.36798, "r": 522.10596, "b": 295.08200000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9547483325004578, "cells": [{"id": 17, "text": " \u0644\u064a\u0644\u062d\u062a\u0644\u0627 \u0646\u0645 \u060c\u062a\u0627\u0642\u064a\u0628\u0637\u062a\u0644\u0627 \u0646\u0645 \u0629\u0639\u0633\u0627\u0648 \u0629\u0639\u0648\u0645\u062c\u0645 \u0645\u0639\u062f\u062a \u0629\u064a\u0646\u063a \u062a\u0627\u0648\u062f\u0623\u0648 \u062a\u0627\u0628\u062a\u0643\u0645Python \u0648 R \u0646\u0645 \u0644\u0643 \u0631\u0641\u0648\u062a \u060c\u0643\u0644\u0630 \u0649\u0644\u0639 \u0629\u0648\u0644\u0627\u0639", "bbox": {"l": 95.783997, "t": 240.36798, "r": 522.07001, "b": 253.65197999999998, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": " \u0649\u0644\u0639 .\u0629\u0641\u0644\u062a\u062e\u0645\u0644\u0627 \u062a\u0644\u0627\u0643\u0634\u0645\u0644\u0644 \u0629\u0631\u0643\u062a\u0628\u0645 \u0644\u0648\u0644\u062d \u0631\u064a\u0648\u0637\u062a\u0644 \u062a\u0627\u0628\u062a\u0643\u0645\u0644\u0627 \u0647\u0630\u0647 \u0646\u0645 \u0629\u062f\u0627\u0641\u062a\u0633\u0644\u0627\u0627 \u0646\u064a\u0645\u062f\u062e\u062a\u0633\u0645\u0644\u0644 \u0646\u0643\u0645\u064a .\u064a\u0644\u0644\u0622\u0627 \u0645\u0644\u0639\u062a\u0644\u0627 \u0649\u0644\u0625 \u064a\u0646\u0627\u064a\u0628\u0644\u0627", "bbox": {"l": 92.903999, "t": 254.19799999999998, "r": 521.80798, "b": 267.48199, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": " R \u0631\u0641\u0648\u062a \u0627\u0645\u0646\u064a\u0628 \u060c\u0629\u0621\u0627\u0641\u0643\u0628 \u062a\u0627\u0646\u0627\u064a\u0628\u0644\u0627 \u0629\u0631\u0627\u062f\u0644\u0625 Python \u064a\u0641 pandas \u0629\u0628\u062a\u0643\u0645 \u0645\u0627\u062f\u062e\u062a\u0633\u0627 \u0646\u0643\u0645\u064a \u060c\u0644\u0627\u062b\u0645\u0644\u0627 \u0644\u064a\u0628\u0633", "bbox": {"l": 174.38, "t": 267.99798999999996, "r": 522.10596, "b": 281.28200999999996, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": " \u0645\u0633\u0631\u0644\u0644 \u0629\u064a\u0648\u0642 \u062a\u0627\u0648\u062f\u0623", "bbox": {"l": 105.38, "t": 267.99798999999996, "r": 174.30797, "b": 281.28200999999996, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": ".\u0646\u064a\u0644\u0644\u062d\u0645\u0644\u0627\u0648 \u0646\u064a\u062b\u062d\u0627\u0628\u0644\u0644 \u0629\u064a\u0644\u0627\u062b\u0645 \u0627\u0647\u0644\u0639\u062c\u064a \u0627\u0645\u0645 \u060c\u064a\u0626\u0627\u0635\u062d\u0644\u0625\u0627 \u0644\u064a\u0644\u062d\u062a\u0644\u0627\u0648 \u064a\u0646\u0627\u064a\u0628\u0644\u0627", "bbox": {"l": 280.37, "t": 281.798, "r": 522.09399, "b": 295.08200000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u0644\u064a\u0644\u062d\u062a\u0644\u0627 \u0646\u0645 \u060c\u062a\u0627\u0642\u064a\u0628\u0637\u062a\u0644\u0627 \u0646\u0645 \u0629\u0639\u0633\u0627\u0648 \u0629\u0639\u0648\u0645\u062c\u0645 \u0645\u0639\u062f\u062a \u0629\u064a\u0646\u063a \u062a\u0627\u0648\u062f\u0623\u0648 \u062a\u0627\u0628\u062a\u0643\u0645Python \u0648 R \u0646\u0645 \u0644\u0643 \u0631\u0641\u0648\u062a \u060c\u0643\u0644\u0630 \u0649\u0644\u0639 \u0629\u0648\u0644\u0627\u0639 \u0649\u0644\u0639 .\u0629\u0641\u0644\u062a\u062e\u0645\u0644\u0627 \u062a\u0644\u0627\u0643\u0634\u0645\u0644\u0644 \u0629\u0631\u0643\u062a\u0628\u0645 \u0644\u0648\u0644\u062d \u0631\u064a\u0648\u0637\u062a\u0644 \u062a\u0627\u0628\u062a\u0643\u0645\u0644\u0627 \u0647\u0630\u0647 \u0646\u0645 \u0629\u062f\u0627\u0641\u062a\u0633\u0644\u0627\u0627 \u0646\u064a\u0645\u062f\u062e\u062a\u0633\u0645\u0644\u0644 \u0646\u0643\u0645\u064a .\u064a\u0644\u0644\u0622\u0627 \u0645\u0644\u0639\u062a\u0644\u0627 \u0649\u0644\u0625 \u064a\u0646\u0627\u064a\u0628\u0644\u0627 R \u0631\u0641\u0648\u062a \u0627\u0645\u0646\u064a\u0628 \u060c\u0629\u0621\u0627\u0641\u0643\u0628 \u062a\u0627\u0646\u0627\u064a\u0628\u0644\u0627 \u0629\u0631\u0627\u062f\u0644\u0625 Python \u064a\u0641 pandas \u0629\u0628\u062a\u0643\u0645 \u0645\u0627\u062f\u062e\u062a\u0633\u0627 \u0646\u0643\u0645\u064a \u060c\u0644\u0627\u062b\u0645\u0644\u0627 \u0644\u064a\u0628\u0633 \u0645\u0633\u0631\u0644\u0644 \u0629\u064a\u0648\u0642 \u062a\u0627\u0648\u062f\u0623 .\u0646\u064a\u0644\u0644\u062d\u0645\u0644\u0627\u0648 \u0646\u064a\u062b\u062d\u0627\u0628\u0644\u0644 \u0629\u064a\u0644\u0627\u062b\u0645 \u0627\u0647\u0644\u0639\u062c\u064a \u0627\u0645\u0645 \u060c\u064a\u0626\u0627\u0635\u062d\u0644\u0625\u0627 \u0644\u064a\u0644\u062d\u062a\u0644\u0627\u0648 \u064a\u0646\u0627\u064a\u0628\u0644\u0627"}, {"label": "text", "id": 2, "page_no": 0, "cluster": {"id": 2, "label": "text", "bbox": {"l": 96.863998, "t": 309.638, "r": 522.07404, "b": 350.522, "coord_origin": "TOPLEFT"}, "confidence": 0.9672117233276367, "cells": [{"id": 22, "text": "Python \u0648 R \u0629\u063a\u0644\u0628 \u0629\u062c\u0645\u0631\u0628\u0644\u0627 \u064a\u062f\u0624\u062a \u0646\u0623 \u0646\u0643\u0645\u064a \u060c\u0629\u064a\u0627\u0647\u0646\u0644\u0627 \u064a\u0641", "bbox": {"l": 319.60999, "t": 309.638, "r": 522.04596, "b": 322.9220000000001, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": " \u0629\u0631\u0643\u062a\u0628\u0645 \u0644\u0648\u0644\u062d \u0631\u064a\u0641\u0648\u062a\u0648 \u0629\u064a\u062c\u0627\u062a\u0646\u0644\u0625\u0627 \u0646\u064a\u0633\u062d\u062a \u0649\u0644\u0625 \u0629\u064a\u0644\u064a\u0644\u062d\u062a \u0629\u064a\u0644\u0642\u0639 \u0639\u0645", "bbox": {"l": 100.34, "t": 309.638, "r": 319.53198, "b": 322.9220000000001, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": " \u0627\u0647\u0644 \u0646\u0648\u0643\u062a \u0646\u0623 \u0646\u0643\u0645\u064a \u0629\u0628\u0633\u0627\u0646\u0645\u0644\u0627 \u0629\u064a\u062c\u0645\u0631\u0628\u0644\u0627 \u0628\u064a\u0644\u0627\u0633\u0644\u0623\u0627 \u0642\u064a\u0628\u0637\u062a\u0648 \u0644\u0627\u0639\u0641 \u0644\u0643\u0634\u0628 \u062a\u0627\u0646\u0627\u064a\u0628\u0644\u0627 \u0644\u064a\u0644\u062d\u062a \u0649\u0644\u0639 \u0629\u0631\u062f\u0642\u0644\u0627 \u0646\u0625 .\u0629\u062f\u0642\u0639\u0645\u0644\u0627 \u062a\u0644\u0627\u0643\u0634\u0645\u0644\u0644", "bbox": {"l": 96.863998, "t": 323.43802, "r": 521.79193, "b": 336.72202, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": ".\u064a\u0646\u0647\u0645\u0644\u0627\u0648 \u064a\u0635\u062e\u0634\u0644\u0627 \u0621\u0627\u062f\u0644\u0623\u0627 \u0649\u0644\u0639 \u0649\u062f\u0645\u0644\u0627 \u0629\u062f\u064a\u0639\u0628 \u0629\u064a\u0628\u0627\u062c\u064a\u0625 \u062a\u0627\u0631\u064a\u062b\u0623\u062a", "bbox": {"l": 304.60999, "t": 337.23801, "r": 522.07404, "b": 350.522, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Python \u0648 R \u0629\u063a\u0644\u0628 \u0629\u062c\u0645\u0631\u0628\u0644\u0627 \u064a\u062f\u0624\u062a \u0646\u0623 \u0646\u0643\u0645\u064a \u060c\u0629\u064a\u0627\u0647\u0646\u0644\u0627 \u064a\u0641 \u0629\u0631\u0643\u062a\u0628\u0645 \u0644\u0648\u0644\u062d \u0631\u064a\u0641\u0648\u062a\u0648 \u0629\u064a\u062c\u0627\u062a\u0646\u0644\u0625\u0627 \u0646\u064a\u0633\u062d\u062a \u0649\u0644\u0625 \u0629\u064a\u0644\u064a\u0644\u062d\u062a \u0629\u064a\u0644\u0642\u0639 \u0639\u0645 \u0627\u0647\u0644 \u0646\u0648\u0643\u062a \u0646\u0623 \u0646\u0643\u0645\u064a \u0629\u0628\u0633\u0627\u0646\u0645\u0644\u0627 \u0629\u064a\u062c\u0645\u0631\u0628\u0644\u0627 \u0628\u064a\u0644\u0627\u0633\u0644\u0623\u0627 \u0642\u064a\u0628\u0637\u062a\u0648 \u0644\u0627\u0639\u0641 \u0644\u0643\u0634\u0628 \u062a\u0627\u0646\u0627\u064a\u0628\u0644\u0627 \u0644\u064a\u0644\u062d\u062a \u0649\u0644\u0639 \u0629\u0631\u062f\u0642\u0644\u0627 \u0646\u0625 .\u0629\u062f\u0642\u0639\u0645\u0644\u0627 \u062a\u0644\u0627\u0643\u0634\u0645\u0644\u0644 .\u064a\u0646\u0647\u0645\u0644\u0627\u0648 \u064a\u0635\u062e\u0634\u0644\u0627 \u0621\u0627\u062f\u0644\u0623\u0627 \u0649\u0644\u0639 \u0649\u062f\u0645\u0644\u0627 \u0629\u062f\u064a\u0639\u0628 \u0629\u064a\u0628\u0627\u062c\u064a\u0625 \u062a\u0627\u0631\u064a\u062b\u0623\u062a"}], "body": [{"label": "section_header", "id": 4, "page_no": 0, "cluster": {"id": 4, "label": "section_header", "bbox": {"l": 223.85000999999997, "t": 72.53801999999985, "r": 521.98181, "b": 87.54894999999988, "coord_origin": "TOPLEFT"}, "confidence": 0.9205371141433716, "cells": [{"id": 0, "text": "Python\u0648 R \u0629\u063a\u0644\u0628 \u0629\u062c\u0645\u0631\u0628\u0644\u0627 \u0644\u0644\u0627\u062e \u0646\u0645 \u062a\u0644\u0627\u0643\u0634\u0645\u0644\u0627 \u0644\u062d\u0648 \u0629\u064a\u062c\u0627\u062a\u0646\u0644\u0625\u0627 \u0646\u064a\u0633\u062d\u062a", "bbox": {"l": 223.85000999999997, "t": 72.53801999999985, "r": 521.98181, "b": 87.54894999999988, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Python\u0648 R \u0629\u063a\u0644\u0628 \u0629\u062c\u0645\u0631\u0628\u0644\u0627 \u0644\u0644\u0627\u062e \u0646\u0645 \u062a\u0644\u0627\u0643\u0634\u0645\u0644\u0627 \u0644\u062d\u0648 \u0629\u064a\u062c\u0627\u062a\u0646\u0644\u0625\u0627 \u0646\u064a\u0633\u062d\u062a"}, {"label": "text", "id": 0, "page_no": 0, "cluster": {"id": 0, "label": "text", "bbox": {"l": 90.744003, "t": 102.00800000000004, "r": 522.19, "b": 156.69196, "coord_origin": "TOPLEFT"}, "confidence": 0.9738918542861938, "cells": [{"id": 1, "text": "Python \u0648 R \u0629\u063a\u0644\u0628 \u0629\u062c\u0645\u0631\u0628\u0644\u0627 \u0631\u0628\u062a\u0639\u062a", "bbox": {"l": 396.54999, "t": 102.00800000000004, "r": 522.19, "b": 115.29199000000006, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": " \u0629\u0644\u0627\u0639\u0641 \u0644\u0648\u0644\u062d \u062f\u0627\u062c\u064a\u0625 \u064a\u0641 \u062f\u0639\u0627\u0633\u062a\u0648 \u0629\u064a\u062c\u0627\u062a\u0646\u0644\u0625\u0627 \u0632\u0632\u0639\u062a \u0646\u0623 \u0646\u0643\u0645\u064a \u064a\u062a\u0644\u0627 \u0629\u064a\u0648\u0642\u0644\u0627 \u062a\u0627\u0648\u062f\u0644\u0623\u0627 \u0646\u0645", "bbox": {"l": 108.73999999999998, "t": 102.00800000000004, "r": 396.35596, "b": 115.29199000000006, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": " \u0621\u0627\u0645\u0644\u0639\u0644\u0627\u0648 \u0646\u064a\u0644\u0644\u062d\u0645\u0644\u0627 \u0649\u0644\u0639 \u0644\u0647\u0633\u064a \u0627\u0645\u0645 \u060c\u062a\u0627\u0646\u0627\u064a\u0628\u0644\u0627 \u0644\u064a\u0644\u062d\u062a\u0644 \u0629\u064a\u0644\u0627\u062b\u0645 \u0627\u0647\u0644\u0639\u062c\u062a \u0629\u062f\u064a\u0631\u0641 \u062a\u0627\u0632\u064a\u0645Python \u0648 R \u0646\u0645 \u0644\u0643 \u0643\u0644\u062a\u0645\u064a .\u062a\u0644\u0627\u0643\u0634\u0645\u0644\u0644", "bbox": {"l": 90.744003, "t": 115.80797999999993, "r": 522.08203, "b": 129.09198000000004, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": " \u0646\u0627\u0643 \u0627\u0630\u0625 .\u0629\u0644\u0627\u0639\u0641\u0648 \u0629\u0639\u064a\u0631\u0633 \u0629\u0642\u064a\u0631\u0637\u0628 \u0629\u062f\u0642\u0639\u0645 \u062a\u0644\u0627\u064a\u0644\u062d\u062a \u0621\u0627\u0631\u062c\u0625", "bbox": {"l": 325.97, "t": 129.60797000000014, "r": 522.04602, "b": 142.89197000000001, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": " \u0645\u0647\u0633\u064a \u0646\u0623 \u0646\u0643\u0645\u064a \u062a\u0627\u063a\u0644\u0644\u0627 \u0647\u0630\u0647 \u0645\u0627\u062f\u062e\u062a\u0633\u0627 \u0646\u0625\u0641 \u060c\u0629\u064a\u0644\u064a\u0644\u062d\u062a \u0629\u064a\u0644\u0642\u0639 \u0643\u064a\u062f\u0644", "bbox": {"l": 108.74001, "t": 129.60797000000014, "r": 325.78397, "b": 142.89197000000001, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": ".\u0644\u0645\u0639\u0644\u0627 \u062c\u0626\u0627\u062a\u0646 \u0646\u064a\u0633\u062d\u062a \u064a\u0641 \u0631\u064a\u0628\u0643 \u0644\u0643\u0634\u0628", "bbox": {"l": 394.03, "t": 143.40796, "r": 522.15405, "b": 156.69196, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Python \u0648 R \u0629\u063a\u0644\u0628 \u0629\u062c\u0645\u0631\u0628\u0644\u0627 \u0631\u0628\u062a\u0639\u062a \u0629\u0644\u0627\u0639\u0641 \u0644\u0648\u0644\u062d \u062f\u0627\u062c\u064a\u0625 \u064a\u0641 \u062f\u0639\u0627\u0633\u062a\u0648 \u0629\u064a\u062c\u0627\u062a\u0646\u0644\u0625\u0627 \u0632\u0632\u0639\u062a \u0646\u0623 \u0646\u0643\u0645\u064a \u064a\u062a\u0644\u0627 \u0629\u064a\u0648\u0642\u0644\u0627 \u062a\u0627\u0648\u062f\u0644\u0623\u0627 \u0646\u0645 \u0621\u0627\u0645\u0644\u0639\u0644\u0627\u0648 \u0646\u064a\u0644\u0644\u062d\u0645\u0644\u0627 \u0649\u0644\u0639 \u0644\u0647\u0633\u064a \u0627\u0645\u0645 \u060c\u062a\u0627\u0646\u0627\u064a\u0628\u0644\u0627 \u0644\u064a\u0644\u062d\u062a\u0644 \u0629\u064a\u0644\u0627\u062b\u0645 \u0627\u0647\u0644\u0639\u062c\u062a \u0629\u062f\u064a\u0631\u0641 \u062a\u0627\u0632\u064a\u0645Python \u0648 R \u0646\u0645 \u0644\u0643 \u0643\u0644\u062a\u0645\u064a .\u062a\u0644\u0627\u0643\u0634\u0645\u0644\u0644 \u0646\u0627\u0643 \u0627\u0630\u0625 .\u0629\u0644\u0627\u0639\u0641\u0648 \u0629\u0639\u064a\u0631\u0633 \u0629\u0642\u064a\u0631\u0637\u0628 \u0629\u062f\u0642\u0639\u0645 \u062a\u0644\u0627\u064a\u0644\u062d\u062a \u0621\u0627\u0631\u062c\u0625 \u0645\u0647\u0633\u064a \u0646\u0623 \u0646\u0643\u0645\u064a \u062a\u0627\u063a\u0644\u0644\u0627 \u0647\u0630\u0647 \u0645\u0627\u062f\u062e\u062a\u0633\u0627 \u0646\u0625\u0641 \u060c\u0629\u064a\u0644\u064a\u0644\u062d\u062a \u0629\u064a\u0644\u0642\u0639 \u0643\u064a\u062f\u0644 .\u0644\u0645\u0639\u0644\u0627 \u062c\u0626\u0627\u062a\u0646 \u0646\u064a\u0633\u062d\u062a \u064a\u0641 \u0631\u064a\u0628\u0643 \u0644\u0643\u0634\u0628"}, {"label": "text", "id": 1, "page_no": 0, "cluster": {"id": 1, "label": "text", "bbox": {"l": 99.863998, "t": 171.24798999999996, "r": 522.23792, "b": 225.93201, "coord_origin": "TOPLEFT"}, "confidence": 0.9677387475967407, "cells": [{"id": 7, "text": " \u062c\u0627\u0631\u062e\u062a\u0633\u0627\u0648 \u062a\u0627\u0646\u0627\u064a\u0628\u0644\u0627 \u0646\u0645 \u0629\u0644\u0626\u0627\u0647 \u062a\u0627\u064a\u0645\u0643 \u0629\u062c\u0644\u0627\u0639\u0645 \u0646\u0643\u0645\u0645\u0644\u0627 \u0646\u0645 \u062d\u0628\u0635\u064a \u060c\u0629\u062c\u0645\u0631\u0628\u0644\u0627 \u062a\u0627\u0631\u0627\u0647\u0645 \u0639\u0645 \u064a\u0644\u064a\u0644\u062d\u062a\u0644\u0627 \u0631\u064a\u0643\u0641\u062a\u0644\u0627 \u0639\u0645\u062a\u062c\u064a \u0627\u0645\u062f\u0646\u0639", "bbox": {"l": 101.42001, "t": 171.24798999999996, "r": 521.85193, "b": 184.53197999999998, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": " \u0630\u064a\u0641\u0646\u062a\u0644Python \u0648 R \u0645\u0627\u062f\u062e\u062a\u0633\u0627 \u0646\u064a\u062c\u0645\u0631\u0628\u0645\u0644\u0644 \u0646\u0643\u0645\u064a .\u0627\u0647\u0646\u0645 \u062a\u0627\u0647\u062c\u0648\u062a\u0644\u0627\u0648 \u0637\u0627\u0645\u0646\u0644\u0623\u0627", "bbox": {"l": 258.17001, "t": 185.04796999999996, "r": 522.034, "b": 198.33196999999996, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": " \u0629\u062c\u0630\u0645\u0646\u0644\u0627 \u0644\u062b\u0645 \u060c\u0629\u0645\u062f\u0642\u062a\u0645 \u0629\u064a\u0644\u064a\u0644\u062d\u062a \u062a\u0627\u064a\u0644\u0645\u0639", "bbox": {"l": 121.34, "t": 185.04796999999996, "r": 257.99597, "b": 198.33196999999996, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": " \u0629\u0642\u062f \u0631\u062b\u0643\u0623 \u062a\u0627\u0631\u0627\u0631\u0642 \u0630\u0627\u062e\u062a\u0627 \u0649\u0644\u0625 \u0627", "bbox": {"l": 99.863998, "t": 198.84795999999994, "r": 207.49202, "b": 212.13196000000005, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "\u0636\u064a\u0623 \u064a\u062f\u0624\u064a \u0646\u0623 \u0646\u0643\u0645\u064a \u0644\u0628 \u060c\u062a\u0642\u0648\u0644\u0627 \u0631\u0641\u0648\u064a \u0637\u0642\u0641 \u0633\u064a\u0644 \u0627\u0630\u0647 .\u0629\u0631\u064a\u0628\u0643\u0644\u0627 \u062a\u0627\u0646\u0627\u064a\u0628\u0644\u0627 \u0644\u064a\u0644\u062d\u062a\u0648 \u0629\u064a\u0626\u0627\u0635\u062d\u0644\u0625\u0627", "bbox": {"l": 207.50401, "t": 198.84795999999994, "r": 522.10785, "b": 212.13196000000005, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "\u062a\u0627\u0646\u0627\u064a\u0628\u0644\u0627 \u0649\u0644\u0639 \u0629\u0645\u0626\u0627\u0642 \u062a\u0627\u062c\u0627\u062a\u0646\u062a\u0633\u0627 \u0649\u0644\u0639 ", "bbox": {"l": 378.07001, "t": 212.64801, "r": 508.74990999999994, "b": 225.93201, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "\u0621\u0627\u0646\u0628", "bbox": {"l": 508.74990999999994, "t": 212.64801, "r": 522.23792, "b": 225.93201, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": ".", "bbox": {"l": 374.95001, "t": 212.64801, "r": 377.95001, "b": 225.93201, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u062c\u0627\u0631\u062e\u062a\u0633\u0627\u0648 \u062a\u0627\u0646\u0627\u064a\u0628\u0644\u0627 \u0646\u0645 \u0629\u0644\u0626\u0627\u0647 \u062a\u0627\u064a\u0645\u0643 \u0629\u062c\u0644\u0627\u0639\u0645 \u0646\u0643\u0645\u0645\u0644\u0627 \u0646\u0645 \u062d\u0628\u0635\u064a \u060c\u0629\u062c\u0645\u0631\u0628\u0644\u0627 \u062a\u0627\u0631\u0627\u0647\u0645 \u0639\u0645 \u064a\u0644\u064a\u0644\u062d\u062a\u0644\u0627 \u0631\u064a\u0643\u0641\u062a\u0644\u0627 \u0639\u0645\u062a\u062c\u064a \u0627\u0645\u062f\u0646\u0639 \u0630\u064a\u0641\u0646\u062a\u0644Python \u0648 R \u0645\u0627\u062f\u062e\u062a\u0633\u0627 \u0646\u064a\u062c\u0645\u0631\u0628\u0645\u0644\u0644 \u0646\u0643\u0645\u064a .\u0627\u0647\u0646\u0645 \u062a\u0627\u0647\u062c\u0648\u062a\u0644\u0627\u0648 \u0637\u0627\u0645\u0646\u0644\u0623\u0627 \u0629\u062c\u0630\u0645\u0646\u0644\u0627 \u0644\u062b\u0645 \u060c\u0629\u0645\u062f\u0642\u062a\u0645 \u0629\u064a\u0644\u064a\u0644\u062d\u062a \u062a\u0627\u064a\u0644\u0645\u0639 \u0629\u0642\u062f \u0631\u062b\u0643\u0623 \u062a\u0627\u0631\u0627\u0631\u0642 \u0630\u0627\u062e\u062a\u0627 \u0649\u0644\u0625 \u0627 \u0636\u064a\u0623 \u064a\u062f\u0624\u064a \u0646\u0623 \u0646\u0643\u0645\u064a \u0644\u0628 \u060c\u062a\u0642\u0648\u0644\u0627 \u0631\u0641\u0648\u064a \u0637\u0642\u0641 \u0633\u064a\u0644 \u0627\u0630\u0647 .\u0629\u0631\u064a\u0628\u0643\u0644\u0627 \u062a\u0627\u0646\u0627\u064a\u0628\u0644\u0627 \u0644\u064a\u0644\u062d\u062a\u0648 \u0629\u064a\u0626\u0627\u0635\u062d\u0644\u0625\u0627 \u062a\u0627\u0646\u0627\u064a\u0628\u0644\u0627 \u0649\u0644\u0639 \u0629\u0645\u0626\u0627\u0642 \u062a\u0627\u062c\u0627\u062a\u0646\u062a\u0633\u0627 \u0649\u0644\u0639 \u0621\u0627\u0646\u0628 ."}, {"label": "text", "id": 5, "page_no": 0, "cluster": {"id": 5, "label": "text", "bbox": {"l": 208.10402, "t": 199.32794, "r": 208.10402, "b": 212.61194, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "\u064b", "bbox": {"l": 208.10402, "t": 199.32794, "r": 208.10402, "b": 212.61194, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u064b"}, {"label": "text", "id": 6, "page_no": 0, "cluster": {"id": 6, "label": "text", "bbox": {"l": 509.34990999999997, "t": 213.96802000000002, "r": 509.34990999999997, "b": 227.25201000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "\u064b", "bbox": {"l": 509.34990999999997, "t": 213.96802000000002, "r": 509.34990999999997, "b": 227.25201000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u064b"}, {"label": "text", "id": 3, "page_no": 0, "cluster": {"id": 3, "label": "text", "bbox": {"l": 92.903999, "t": 240.36798, "r": 522.10596, "b": 295.08200000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9547483325004578, "cells": [{"id": 17, "text": " \u0644\u064a\u0644\u062d\u062a\u0644\u0627 \u0646\u0645 \u060c\u062a\u0627\u0642\u064a\u0628\u0637\u062a\u0644\u0627 \u0646\u0645 \u0629\u0639\u0633\u0627\u0648 \u0629\u0639\u0648\u0645\u062c\u0645 \u0645\u0639\u062f\u062a \u0629\u064a\u0646\u063a \u062a\u0627\u0648\u062f\u0623\u0648 \u062a\u0627\u0628\u062a\u0643\u0645Python \u0648 R \u0646\u0645 \u0644\u0643 \u0631\u0641\u0648\u062a \u060c\u0643\u0644\u0630 \u0649\u0644\u0639 \u0629\u0648\u0644\u0627\u0639", "bbox": {"l": 95.783997, "t": 240.36798, "r": 522.07001, "b": 253.65197999999998, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": " \u0649\u0644\u0639 .\u0629\u0641\u0644\u062a\u062e\u0645\u0644\u0627 \u062a\u0644\u0627\u0643\u0634\u0645\u0644\u0644 \u0629\u0631\u0643\u062a\u0628\u0645 \u0644\u0648\u0644\u062d \u0631\u064a\u0648\u0637\u062a\u0644 \u062a\u0627\u0628\u062a\u0643\u0645\u0644\u0627 \u0647\u0630\u0647 \u0646\u0645 \u0629\u062f\u0627\u0641\u062a\u0633\u0644\u0627\u0627 \u0646\u064a\u0645\u062f\u062e\u062a\u0633\u0645\u0644\u0644 \u0646\u0643\u0645\u064a .\u064a\u0644\u0644\u0622\u0627 \u0645\u0644\u0639\u062a\u0644\u0627 \u0649\u0644\u0625 \u064a\u0646\u0627\u064a\u0628\u0644\u0627", "bbox": {"l": 92.903999, "t": 254.19799999999998, "r": 521.80798, "b": 267.48199, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": " R \u0631\u0641\u0648\u062a \u0627\u0645\u0646\u064a\u0628 \u060c\u0629\u0621\u0627\u0641\u0643\u0628 \u062a\u0627\u0646\u0627\u064a\u0628\u0644\u0627 \u0629\u0631\u0627\u062f\u0644\u0625 Python \u064a\u0641 pandas \u0629\u0628\u062a\u0643\u0645 \u0645\u0627\u062f\u062e\u062a\u0633\u0627 \u0646\u0643\u0645\u064a \u060c\u0644\u0627\u062b\u0645\u0644\u0627 \u0644\u064a\u0628\u0633", "bbox": {"l": 174.38, "t": 267.99798999999996, "r": 522.10596, "b": 281.28200999999996, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": " \u0645\u0633\u0631\u0644\u0644 \u0629\u064a\u0648\u0642 \u062a\u0627\u0648\u062f\u0623", "bbox": {"l": 105.38, "t": 267.99798999999996, "r": 174.30797, "b": 281.28200999999996, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": ".\u0646\u064a\u0644\u0644\u062d\u0645\u0644\u0627\u0648 \u0646\u064a\u062b\u062d\u0627\u0628\u0644\u0644 \u0629\u064a\u0644\u0627\u062b\u0645 \u0627\u0647\u0644\u0639\u062c\u064a \u0627\u0645\u0645 \u060c\u064a\u0626\u0627\u0635\u062d\u0644\u0625\u0627 \u0644\u064a\u0644\u062d\u062a\u0644\u0627\u0648 \u064a\u0646\u0627\u064a\u0628\u0644\u0627", "bbox": {"l": 280.37, "t": 281.798, "r": 522.09399, "b": 295.08200000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u0644\u064a\u0644\u062d\u062a\u0644\u0627 \u0646\u0645 \u060c\u062a\u0627\u0642\u064a\u0628\u0637\u062a\u0644\u0627 \u0646\u0645 \u0629\u0639\u0633\u0627\u0648 \u0629\u0639\u0648\u0645\u062c\u0645 \u0645\u0639\u062f\u062a \u0629\u064a\u0646\u063a \u062a\u0627\u0648\u062f\u0623\u0648 \u062a\u0627\u0628\u062a\u0643\u0645Python \u0648 R \u0646\u0645 \u0644\u0643 \u0631\u0641\u0648\u062a \u060c\u0643\u0644\u0630 \u0649\u0644\u0639 \u0629\u0648\u0644\u0627\u0639 \u0649\u0644\u0639 .\u0629\u0641\u0644\u062a\u062e\u0645\u0644\u0627 \u062a\u0644\u0627\u0643\u0634\u0645\u0644\u0644 \u0629\u0631\u0643\u062a\u0628\u0645 \u0644\u0648\u0644\u062d \u0631\u064a\u0648\u0637\u062a\u0644 \u062a\u0627\u0628\u062a\u0643\u0645\u0644\u0627 \u0647\u0630\u0647 \u0646\u0645 \u0629\u062f\u0627\u0641\u062a\u0633\u0644\u0627\u0627 \u0646\u064a\u0645\u062f\u062e\u062a\u0633\u0645\u0644\u0644 \u0646\u0643\u0645\u064a .\u064a\u0644\u0644\u0622\u0627 \u0645\u0644\u0639\u062a\u0644\u0627 \u0649\u0644\u0625 \u064a\u0646\u0627\u064a\u0628\u0644\u0627 R \u0631\u0641\u0648\u062a \u0627\u0645\u0646\u064a\u0628 \u060c\u0629\u0621\u0627\u0641\u0643\u0628 \u062a\u0627\u0646\u0627\u064a\u0628\u0644\u0627 \u0629\u0631\u0627\u062f\u0644\u0625 Python \u064a\u0641 pandas \u0629\u0628\u062a\u0643\u0645 \u0645\u0627\u062f\u062e\u062a\u0633\u0627 \u0646\u0643\u0645\u064a \u060c\u0644\u0627\u062b\u0645\u0644\u0627 \u0644\u064a\u0628\u0633 \u0645\u0633\u0631\u0644\u0644 \u0629\u064a\u0648\u0642 \u062a\u0627\u0648\u062f\u0623 .\u0646\u064a\u0644\u0644\u062d\u0645\u0644\u0627\u0648 \u0646\u064a\u062b\u062d\u0627\u0628\u0644\u0644 \u0629\u064a\u0644\u0627\u062b\u0645 \u0627\u0647\u0644\u0639\u062c\u064a \u0627\u0645\u0645 \u060c\u064a\u0626\u0627\u0635\u062d\u0644\u0625\u0627 \u0644\u064a\u0644\u062d\u062a\u0644\u0627\u0648 \u064a\u0646\u0627\u064a\u0628\u0644\u0627"}, {"label": "text", "id": 2, "page_no": 0, "cluster": {"id": 2, "label": "text", "bbox": {"l": 96.863998, "t": 309.638, "r": 522.07404, "b": 350.522, "coord_origin": "TOPLEFT"}, "confidence": 0.9672117233276367, "cells": [{"id": 22, "text": "Python \u0648 R \u0629\u063a\u0644\u0628 \u0629\u062c\u0645\u0631\u0628\u0644\u0627 \u064a\u062f\u0624\u062a \u0646\u0623 \u0646\u0643\u0645\u064a \u060c\u0629\u064a\u0627\u0647\u0646\u0644\u0627 \u064a\u0641", "bbox": {"l": 319.60999, "t": 309.638, "r": 522.04596, "b": 322.9220000000001, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": " \u0629\u0631\u0643\u062a\u0628\u0645 \u0644\u0648\u0644\u062d \u0631\u064a\u0641\u0648\u062a\u0648 \u0629\u064a\u062c\u0627\u062a\u0646\u0644\u0625\u0627 \u0646\u064a\u0633\u062d\u062a \u0649\u0644\u0625 \u0629\u064a\u0644\u064a\u0644\u062d\u062a \u0629\u064a\u0644\u0642\u0639 \u0639\u0645", "bbox": {"l": 100.34, "t": 309.638, "r": 319.53198, "b": 322.9220000000001, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": " \u0627\u0647\u0644 \u0646\u0648\u0643\u062a \u0646\u0623 \u0646\u0643\u0645\u064a \u0629\u0628\u0633\u0627\u0646\u0645\u0644\u0627 \u0629\u064a\u062c\u0645\u0631\u0628\u0644\u0627 \u0628\u064a\u0644\u0627\u0633\u0644\u0623\u0627 \u0642\u064a\u0628\u0637\u062a\u0648 \u0644\u0627\u0639\u0641 \u0644\u0643\u0634\u0628 \u062a\u0627\u0646\u0627\u064a\u0628\u0644\u0627 \u0644\u064a\u0644\u062d\u062a \u0649\u0644\u0639 \u0629\u0631\u062f\u0642\u0644\u0627 \u0646\u0625 .\u0629\u062f\u0642\u0639\u0645\u0644\u0627 \u062a\u0644\u0627\u0643\u0634\u0645\u0644\u0644", "bbox": {"l": 96.863998, "t": 323.43802, "r": 521.79193, "b": 336.72202, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": ".\u064a\u0646\u0647\u0645\u0644\u0627\u0648 \u064a\u0635\u062e\u0634\u0644\u0627 \u0621\u0627\u062f\u0644\u0623\u0627 \u0649\u0644\u0639 \u0649\u062f\u0645\u0644\u0627 \u0629\u062f\u064a\u0639\u0628 \u0629\u064a\u0628\u0627\u062c\u064a\u0625 \u062a\u0627\u0631\u064a\u062b\u0623\u062a", "bbox": {"l": 304.60999, "t": 337.23801, "r": 522.07404, "b": 350.522, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Python \u0648 R \u0629\u063a\u0644\u0628 \u0629\u062c\u0645\u0631\u0628\u0644\u0627 \u064a\u062f\u0624\u062a \u0646\u0623 \u0646\u0643\u0645\u064a \u060c\u0629\u064a\u0627\u0647\u0646\u0644\u0627 \u064a\u0641 \u0629\u0631\u0643\u062a\u0628\u0645 \u0644\u0648\u0644\u062d \u0631\u064a\u0641\u0648\u062a\u0648 \u0629\u064a\u062c\u0627\u062a\u0646\u0644\u0625\u0627 \u0646\u064a\u0633\u062d\u062a \u0649\u0644\u0625 \u0629\u064a\u0644\u064a\u0644\u062d\u062a \u0629\u064a\u0644\u0642\u0639 \u0639\u0645 \u0627\u0647\u0644 \u0646\u0648\u0643\u062a \u0646\u0623 \u0646\u0643\u0645\u064a \u0629\u0628\u0633\u0627\u0646\u0645\u0644\u0627 \u0629\u064a\u062c\u0645\u0631\u0628\u0644\u0627 \u0628\u064a\u0644\u0627\u0633\u0644\u0623\u0627 \u0642\u064a\u0628\u0637\u062a\u0648 \u0644\u0627\u0639\u0641 \u0644\u0643\u0634\u0628 \u062a\u0627\u0646\u0627\u064a\u0628\u0644\u0627 \u0644\u064a\u0644\u062d\u062a \u0649\u0644\u0639 \u0629\u0631\u062f\u0642\u0644\u0627 \u0646\u0625 .\u0629\u062f\u0642\u0639\u0645\u0644\u0627 \u062a\u0644\u0627\u0643\u0634\u0645\u0644\u0644 .\u064a\u0646\u0647\u0645\u0644\u0627\u0648 \u064a\u0635\u062e\u0634\u0644\u0627 \u0621\u0627\u062f\u0644\u0623\u0627 \u0649\u0644\u0639 \u0649\u062f\u0645\u0644\u0627 \u0629\u062f\u064a\u0639\u0628 \u0629\u064a\u0628\u0627\u062c\u064a\u0625 \u062a\u0627\u0631\u064a\u062b\u0623\u062a"}], "headers": []}}]
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v1/right_to_left_02.doctags.txt b/tests/data/groundtruth/docling_v1/right_to_left_02.doctags.txt
new file mode 100644
index 00000000..6603ae4d
--- /dev/null
+++ b/tests/data/groundtruth/docling_v1/right_to_left_02.doctags.txt
@@ -0,0 +1,10 @@
+<document>
+<paragraph><location><page_1><loc_8><loc_3><loc_10><loc_4></location>11</paragraph>
+<paragraph><location><page_1><loc_11><loc_50><loc_73><loc_75></location>،هيلعو ملا ةوا رملا لاول خواهييع ووص عضت ةيرص م لا ةموكح لا نإف ةو اب لأا نم ددي قي حت ىاي لمعلخب خال ةير وام جلا سي ئر د يسلا فياكت ا دو ه :خاسعر ىاي ويولولأا ةومئخق سعر ىا ي يرصملا نخسنلإا ءخهب فام عضو ، تخ ووومن تحدووعم قووي حت ىوو اي لو وم علا ،ليوواعللاو ةحووصلا تحخووجم اووف ةووصخل ىوووواي خوووو حلا ا وووو و ،تخوووو ي خل لا فوووواذع اووووف ةامخوووو و ةمادلووووسمو ةوووويوق وو يلودلاو ةوويمياقلإا تخيدوو حلل ا ءوووض اووف يرووصملا امووو لا نووملأا تاددووحم ،ة وو ام ةووعبخلم رارملووساو ،ةيووسخيسلا ة رخوواملا ر ي وو و لت د ووواو ةاووصاومو تخ ايوووو لاو ةوووفخ لا تخووو ام ريوووولت ، خوووهرلإا ةوووحفخ كمو ر ار لوووسحاو نوووملأا لي هخووو م وووسري ي ووولا وووو حهل ا ىووواي لدووولعملا اهيدووو لا خووولبلاو ،اه،وووولا .اعملجملا ماسلاو ةه،اوملا</paragraph>
+<paragraph><location><page_1><loc_13><loc_45><loc_74><loc_48></location>رول لا لاول ةيرو ص م لا ةو موكحلا امخونرب دالوسي ،قبس خمل خً فوو 2024( -)2026 اتلآا وحهلا ىاي اهو ،ةسيئر ةيجيتارلسا اد هع ةعبرع قي حت :</paragraph>
+<paragraph><location><page_1><loc_12><loc_37><loc_73><loc_40></location>نــــــــم ما ةــــــــيا م رـ صم لا يم وقل ا اــــسن ا ءاــــ نب رــــــــــــــــــــصم لا عاـــــصت ا ءاـــــ نب يــــــــــــــــــــــسبا نت قتسظا ق يقحت را ر يــــــــــــــــــــــــساي سلا</paragraph>
+<paragraph><location><page_1><loc_12><loc_23><loc_73><loc_31></location>خهلوسحخب امخونرب لا ت خفدالوسم ديدحت لت دق هن ع ىلإ رخ لإا ردجت لكواب د روووصم ةو ووي ر تخ فدال ووو س م ىووو اي سيوووئر 2023 ر اوو وو حلا تخووو ساو تخيوووصوتو ، كيال ا تخ اووصيل اه،ووولا امخوونربلاو ،تارا ووو لا ت خ فدا لوو سمو ،اه،ووولا ،ةوو ي ا ةيه، ولا تخ ي جيتا رلسحا فالبمو .</paragraph>
+<figure>
+<location><page_1><loc_75><loc_23><loc_100><loc_76></location>
+</figure>
+</document>
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v1/right_to_left_02.json b/tests/data/groundtruth/docling_v1/right_to_left_02.json
new file mode 100644
index 00000000..ab2cad82
--- /dev/null
+++ b/tests/data/groundtruth/docling_v1/right_to_left_02.json
@@ -0,0 +1 @@
+{"_name": "", "type": "pdf-document", "description": {"title": null, "abstract": null, "authors": null, "affiliations": null, "subjects": null, "keywords": null, "publication_date": null, "languages": null, "license": null, "publishers": null, "url_refs": null, "references": null, "publication": null, "reference_count": null, "citation_count": null, "citation_date": null, "advanced": null, "analytics": null, "logs": [], "collection": null, "acquisition": null}, "file-info": {"filename": "right_to_left_02.pdf", "filename-prov": null, "document-hash": "7c10c86372b57e92ef859a9beeafaba13793e29f0d91c6cac47cf7aaf67c9c13", "#-pages": 1, "collection-name": null, "description": null, "page-hashes": [{"hash": "6bbaeb8317aa6c61f11969884caceb4a282d52c4d6a9fabaae058bf53003e511", "model": "default", "page": 1}]}, "main-text": [{"prov": [{"bbox": [47.9520001778084, 23.787720082223927, 58.751999217855335, 37.827721130754185], "page": 1, "span": [0, 2], "__ref_s3_data": null}], "text": "11", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [67.9919972521177, 422.5932914607237, 437.42722162200187, 632.2632421854628], "page": 1, "span": [0, 745], "__ref_s3_data": null}], "text": "\u060c\u0647\u064a\u0644\u0639\u0648 \u0645\u0644\u0627 \u0629\u0648\u0627 \u0631\u0645\u0644\u0627 \u0644\u0627\u0648\u0644 \u062e\u0648\u0627\u0647\u064a\u064a\u0639 \u0648\u0648\u0635 \u0639\u0636\u062a \u0629\u064a\u0631\u0635 \u0645 \u0644\u0627 \u0629\u0645\u0648\u0643\u062d \u0644\u0627 \u0646\u0625\u0641 \u0629\u0648 \u0627\u0628 \u0644\u0623\u0627 \u0646\u0645 \u062f\u062f\u064a \u0642\u064a \u062d\u062a \u0649\u0627\u064a \u0644\u0645\u0639\u0644\u062e\u0628 \u062e\u0627\u0644 \u0629\u064a\u0631 \u0648\u0627\u0645 \u062c\u0644\u0627 \u0633\u064a \u0626\u0631 \u062f \u064a\u0633\u0644\u0627 \u0641\u064a\u0627\u0643\u062a \u0627 \u062f\u0648 \u0647 :\u062e\u0627\u0633\u0639\u0631 \u0649\u0627\u064a \u0648\u064a\u0648\u0644\u0648\u0644\u0623\u0627 \u0629\u0648\u0645\u0626\u062e\u0642 \u0633\u0639\u0631 \u0649\u0627 \u064a \u064a\u0631\u0635\u0645\u0644\u0627 \u0646\u062e\u0633\u0646\u0644\u0625\u0627 \u0621\u062e\u0647\u0628 \u0641\u0627\u0645 \u0639\u0636\u0648 \u060c \u062a\u062e \u0648\u0648\u0648\u0645\u0646 \u062a\u062d\u062f\u0648\u0648\u0639\u0645 \u0642\u0648\u0648\u064a \u062d\u062a \u0649\u0648\u0648 \u0627\u064a \u0644\u0648 \u0648\u0645 \u0639\u0644\u0627 \u060c\u0644\u064a\u0648\u0648\u0627\u0639\u0644\u0644\u0627\u0648 \u0629\u062d\u0648\u0648\u0635\u0644\u0627 \u062a\u062d\u062e\u0648\u0648\u062c\u0645 \u0627\u0648\u0648\u0641 \u0629\u0648\u0648\u0635\u062e\u0644 \u0649\u0648\u0648\u0648\u0648\u0627\u064a \u062e\u0648\u0648\u0648\u0648 \u062d\u0644\u0627 \u0627 \u0648\u0648\u0648\u0648 \u0648 \u060c\u062a\u062e\u0648\u0648\u0648\u0648 \u064a \u062e\u0644 \u0644\u0627 \u0641\u0648\u0648\u0648\u0648\u0627\u0630\u0639 \u0627\u0648\u0648\u0648\u0648\u0641 \u0629\u0627\u0645\u062e\u0648\u0648\u0648\u0648 \u0648 \u0629\u0645\u0627\u062f\u0644\u0648\u0648\u0648\u0648\u0633\u0645\u0648 \u0629\u0648\u0648\u0648\u0648\u064a\u0648\u0642 \u0648\u0648 \u064a\u0644\u0648\u062f\u0644\u0627\u0648 \u0629\u0648\u0648\u064a\u0645\u064a\u0627\u0642\u0644\u0625\u0627 \u062a\u062e\u064a\u062f\u0648\u0648 \u062d\u0644\u0644 \u0627 \u0621\u0648\u0648\u0648\u0636 \u0627\u0648\u0648\u0641 \u064a\u0631\u0648\u0648\u0635\u0645\u0644\u0627 \u0627\u0645\u0648\u0648\u0648 \u0644\u0627 \u0646\u0648\u0648\u0645\u0644\u0623\u0627 \u062a\u0627\u062f\u062f\u0648\u0648\u062d\u0645 \u060c\u0629 \u0648\u0648 \u0627\u0645 \u0629\u0648\u0648\u0639\u0628\u062e\u0644\u0645 \u0631\u0627\u0631\u0645\u0644\u0648\u0648\u0633\u0627\u0648 \u060c\u0629\u064a\u0648\u0648\u0633\u062e\u064a\u0633\u0644\u0627 \u0629 \u0631\u062e\u0648\u0648\u0627\u0645\u0644\u0627 \u0631 \u064a \u0648\u0648 \u0648 \u0644\u062a \u062f \u0648\u0648\u0648\u0627\u0648 \u0629\u0627\u0648\u0648\u0635\u0627\u0648\u0645\u0648 \u062a\u062e \u0627\u064a\u0648\u0648\u0648\u0648 \u0644\u0627\u0648 \u0629\u0648\u0648\u0648\u0641\u062e \u0644\u0627 \u062a\u062e\u0648\u0648\u0648 \u0627\u0645 \u0631\u064a\u0648\u0648\u0648\u0648\u0644\u062a \u060c \u062e\u0648\u0648\u0648\u0647\u0631\u0644\u0625\u0627 \u0629\u0648\u0648\u0648\u062d\u0641\u062e \u0643\u0645\u0648 \u0631 \u0627\u0631 \u0644\u0648\u0648\u0648\u0633\u062d\u0627\u0648 \u0646\u0648\u0648\u0648\u0645\u0644\u0623\u0627 \u0644\u064a \u0647\u062e\u0648\u0648\u0648 \u0645 \u0648\u0648\u0648\u0633\u0631\u064a \u064a \u0648\u0648\u0648\u0644\u0627 \u0648\u0648\u0648\u0648 \u062d\u0647\u0644 \u0627 \u0649\u0648\u0648\u0648\u0627\u064a \u0644\u062f\u0648\u0648\u0648\u0644\u0639\u0645\u0644\u0627 \u0627\u0647\u064a\u062f\u0648\u0648\u0648 \u0644\u0627 \u062e\u0648\u0648\u0648\u0644\u0628\u0644\u0627\u0648 \u060c\u0627\u0647\u060c\u0648\u0648\u0648\u0648\u0644\u0627 .\u0627\u0639\u0645\u0644\u062c\u0645\u0644\u0627 \u0645\u0627\u0633\u0644\u0627\u0648 \u0629\u0647\u060c\u0627\u0648\u0645\u0644\u0627", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [74.51999727632386, 376.3233013007883, 440.883241634817, 408.00330141029247], "page": 1, "span": [0, 135], "__ref_s3_data": null}], "text": "\u0631\u0648\u0644 \u0644\u0627 \u0644\u0627\u0648\u0644 \u0629\u064a\u0631\u0648 \u0635 \u0645 \u0644\u0627 \u0629\u0648 \u0645\u0648\u0643\u062d\u0644\u0627 \u0627\u0645\u062e\u0648\u0646\u0631\u0628 \u062f\u0627\u0644\u0648\u0633\u064a \u060c\u0642\u0628\u0633 \u062e\u0645\u0644 \u062e\u064b \u0641\u0648\u0648 2024( -)2026 \u0627\u062a\u0644\u0622\u0627 \u0648\u062d\u0647\u0644\u0627 \u0649\u0627\u064a \u0627\u0647\u0648 \u060c\u0629\u0633\u064a\u0626\u0631 \u0629\u064a\u062c\u064a\u062a\u0627\u0631\u0644\u0633\u0627 \u0627\u062f \u0647\u0639 \u0629\u0639\u0628\u0631\u0639 \u0642\u064a \u062d\u062a :", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [69.09600125621141, 307.8032810639438, 437.3132016215791, 334.49329115619986], "page": 1, "span": [0, 196], "__ref_s3_data": null}], "text": "\u0646\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0645 \u0645\u0627 \u0629\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u064a\u0627 \u0645 \u0631\u0640 \u0635\u0645 \u0644\u0627 \u064a\u0645 \u0648\u0642\u0644 \u0627 \u0627\u0640\u0640\u0640\u0640\u0633\u0646 \u0627 \u0621\u0627\u0640\u0640\u0640\u0640 \u0646\u0628 \u0631\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0635\u0645 \u0644\u0627 \u0639\u0627\u0640\u0640\u0640\u0640\u0640\u0635\u062a \u0627 \u0621\u0627\u0640\u0640\u0640\u0640\u0640 \u0646\u0628 \u064a\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0633\u0628\u0627 \u0646\u062a \u0642\u062a\u0633\u0638\u0627 \u0642 \u064a\u0642\u062d\u062a \u0631\u0627 \u0631 \u064a\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0633\u0627\u064a \u0633\u0644\u0627", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [72.94919627049924, 193.95328067041328, 437.29059162149525, 263.09326090940056], "page": 1, "span": [0, 280], "__ref_s3_data": null}], "text": "\u062e\u0647\u0644\u0648\u0633\u062d\u062e\u0628 \u0627\u0645\u062e\u0648\u0646\u0631\u0628 \u0644\u0627 \u062a \u062e\u0641\u062f\u0627\u0644\u0648\u0633\u0645 \u062f\u064a\u062f\u062d\u062a \u0644\u062a \u062f\u0642 \u0647\u0646 \u0639 \u0649\u0644\u0625 \u0631\u062e \u0644\u0625\u0627 \u0631\u062f\u062c\u062a \u0644\u0643\u0648\u0627\u0628 \u062f \u0631\u0648\u0648\u0648\u0635\u0645 \u0629\u0648 \u0648\u0648\u064a \u0631 \u062a\u062e \u0641\u062f\u0627\u0644 \u0648\u0648\u0648 \u0633 \u0645 \u0649\u0648\u0648\u0648 \u0627\u064a \u0633\u064a\u0648\u0648\u0648\u0626\u0631 2023 \u0631 \u0627\u0648\u0648 \u0648\u0648 \u062d\u0644\u0627 \u062a\u062e\u0648\u0648\u0648 \u0633\u0627\u0648 \u062a\u062e\u064a\u0648\u0648\u0648\u0635\u0648\u062a\u0648 \u060c \u0643\u064a\u0627\u0644 \u0627 \u062a\u062e \u0627\u0648\u0648\u0635\u064a\u0644 \u0627\u0647\u060c\u0648\u0648\u0648\u0644\u0627 \u0627\u0645\u062e\u0648\u0648\u0646\u0631\u0628\u0644\u0627\u0648 \u060c\u062a\u0627\u0631\u0627 \u0648\u0648\u0648 \u0644\u0627 \u062a \u062e \u0641\u062f\u0627 \u0644\u0648\u0648 \u0633\u0645\u0648 \u060c\u0627\u0647\u060c\u0648\u0648\u0648\u0644\u0627 \u060c\u0629\u0648\u0648 \u064a \u0627 \u0629\u064a\u0647\u060c \u0648\u0644\u0627 \u062a\u062e \u064a \u062c\u064a\u062a\u0627 \u0631\u0644\u0633\u062d\u0627 \u0641\u0627\u0644\u0628\u0645\u0648 .", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"name": "Picture", "type": "figure", "$ref": "#/figures/0"}], "figures": [{"prov": [{"bbox": [446.4657287597656, 191.27679443359375, 595.0, 641.2087554931641], "page": 1, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "figure", "payload": null, "bounding-box": null}], "tables": [], "bitmaps": null, "equations": [], "footnotes": [], "page-dimensions": [{"height": 841.9199829101562, "page": 1, "width": 595.2000122070312}], "page-footers": [], "page-headers": [], "_s3_data": null, "identifiers": null}
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v1/right_to_left_02.md b/tests/data/groundtruth/docling_v1/right_to_left_02.md
new file mode 100644
index 00000000..218e62be
--- /dev/null
+++ b/tests/data/groundtruth/docling_v1/right_to_left_02.md
@@ -0,0 +1,11 @@
+11
+
+،هيلعو ملا ةوا رملا لاول خواهييع ووص عضت ةيرص م لا ةموكح لا نإف ةو اب لأا نم ددي قي حت ىاي لمعلخب خال ةير وام جلا سي ئر د يسلا فياكت ا دو ه :خاسعر ىاي ويولولأا ةومئخق سعر ىا ي يرصملا نخسنلإا ءخهب فام عضو ، تخ ووومن تحدووعم قووي حت ىوو اي لو وم علا ،ليوواعللاو ةحووصلا تحخووجم اووف ةووصخل ىوووواي خوووو حلا ا وووو و ،تخوووو ي خل لا فوووواذع اووووف ةامخوووو و ةمادلووووسمو ةوووويوق وو يلودلاو ةوويمياقلإا تخيدوو حلل ا ءوووض اووف يرووصملا امووو لا نووملأا تاددووحم ،ة وو ام ةووعبخلم رارملووساو ،ةيووسخيسلا ة رخوواملا ر ي وو و لت د ووواو ةاووصاومو تخ ايوووو لاو ةوووفخ لا تخووو ام ريوووولت ، خوووهرلإا ةوووحفخ كمو ر ار لوووسحاو نوووملأا لي هخووو م وووسري ي ووولا وووو حهل ا ىووواي لدووولعملا اهيدووو لا خووولبلاو ،اه،وووولا .اعملجملا ماسلاو ةه،اوملا
+
+رول لا لاول ةيرو ص م لا ةو موكحلا امخونرب دالوسي ،قبس خمل خً فوو 2024( -)2026 اتلآا وحهلا ىاي اهو ،ةسيئر ةيجيتارلسا اد هع ةعبرع قي حت :
+
+نــــــــم ما ةــــــــيا م رـ صم لا يم وقل ا اــــسن ا ءاــــ نب رــــــــــــــــــــصم لا عاـــــصت ا ءاـــــ نب يــــــــــــــــــــــسبا نت قتسظا ق يقحت را ر يــــــــــــــــــــــــساي سلا
+
+خهلوسحخب امخونرب لا ت خفدالوسم ديدحت لت دق هن ع ىلإ رخ لإا ردجت لكواب د روووصم ةو ووي ر تخ فدال ووو س م ىووو اي سيوووئر 2023 ر اوو وو حلا تخووو ساو تخيوووصوتو ، كيال ا تخ اووصيل اه،ووولا امخوونربلاو ،تارا ووو لا ت خ فدا لوو سمو ،اه،ووولا ،ةوو ي ا ةيه، ولا تخ ي جيتا رلسحا فالبمو .
+
+<!-- image -->
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v1/right_to_left_02.pages.json b/tests/data/groundtruth/docling_v1/right_to_left_02.pages.json
new file mode 100644
index 00000000..083451d4
--- /dev/null
+++ b/tests/data/groundtruth/docling_v1/right_to_left_02.pages.json
@@ -0,0 +1 @@
+[{"page_no": 0, "size": {"width": 595.2000122070312, "height": 841.9199829101562}, "cells": [{"id": 0, "text": "11", "bbox": {"l": 47.9520001778084, "t": 804.0922617794021, "r": 58.751999217855335, "b": 818.1322628279323, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": " \u060c\u0647\u064a\u0644\u0639\u0648", "bbox": {"l": 399.260011480476, "t": 209.65674072469346, "r": 437.42722162200187, "b": 222.61670076949054, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "\u0645\u0644\u0627 \u0629\u0648\u0627", "bbox": {"l": 101.00520037453231, "t": 209.65674072469346, "r": 126.82584047027652, "b": 222.61670076949054, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "\u0631\u0645\u0644\u0627 \u0644\u0627\u0648\u0644 \u062e\u0648\u0627\u0647\u064a\u064a\u0639", "bbox": {"l": 130.05289048224256, "t": 209.65674072469346, "r": 229.27513085016358, "b": 222.61670076949054, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "\u0648\u0648\u0635", "bbox": {"l": 240.66298089239032, "t": 209.65674072469346, "r": 258.55817095874653, "b": 222.61670076949054, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "\u0639\u0636\u062a", "bbox": {"l": 265.06552098287614, "t": 209.65674072469346, "r": 281.6825010444927, "b": 222.61670076949054, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "\u0629\u064a\u0631\u0635", "bbox": {"l": 286.3310210617297, "t": 209.65674072469346, "r": 314.70044116692486, "b": 222.61670076949054, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "\u0645", "bbox": {"l": 314.739321167069, "t": 209.65674072469346, "r": 323.0726011979693, "b": 222.61670076949054, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "\u0644\u0627", "bbox": {"l": 323.02075119777703, "t": 209.65674072469346, "r": 330.06061122388115, "b": 222.61670076949054, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "\u0629\u0645\u0648\u0643\u062d", "bbox": {"l": 333.2073112355493, "t": 209.65674072469346, "r": 369.27499136929003, "b": 222.61670076949054, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "\u0644\u0627 ", "bbox": {"l": 369.3138713694342, "t": 209.65674072469346, "r": 379.37082140672584, "b": 222.61670076949054, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "\u0646\u0625\u0641", "bbox": {"l": 379.50043140720646, "t": 209.65674072469346, "r": 398.9274614792428, "b": 222.61670076949054, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "\u0629\u0648", "bbox": {"l": 78.1863332899188, "t": 209.65674072469346, "r": 79.31903829411894, "b": 222.61670076949054, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "\u0627\u0628", "bbox": {"l": 79.3838352943592, "t": 209.65674072469346, "r": 88.079994326605, "b": 222.61670076949054, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "\u0644\u0623\u0627", "bbox": {"l": 102.7000003808167, "t": 231.61676080059988, "r": 113.81968042204905, "b": 244.57672084539684, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "\u0646\u0645 \u062f\u062f\u064a \u0642\u064a \u062d\u062a \u0649\u0627\u064a \u0644\u0645\u0639\u0644\u062e\u0628 \u062e\u0627\u0644 \u0629\u064a\u0631", "bbox": {"l": 117.07263043411113, "t": 231.61676080059988, "r": 294.7153310928191, "b": 244.57672084539684, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "\u0648\u0627\u0645", "bbox": {"l": 294.75421109296326, "t": 231.61676080059988, "r": 318.5617411812428, "b": 244.57672084539684, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "\u062c\u0644\u0627", "bbox": {"l": 318.5098911810505, "t": 231.61676080059988, "r": 333.0000912347809, "b": 244.57672084539684, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "\u0633\u064a", "bbox": {"l": 337.2111512503957, "t": 231.61676080059988, "r": 359.59308133338897, "b": 244.57672084539684, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "\u0626\u0631 ", "bbox": {"l": 359.5282913331488, "t": 231.61676080059988, "r": 370.3110413731318, "b": 244.57672084539684, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "\u062f", "bbox": {"l": 370.5443113739967, "t": 231.61676080059988, "r": 377.2187213987458, "b": 244.57672084539684, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "\u064a\u0633\u0644\u0627 \u0641\u064a\u0627\u0643\u062a", "bbox": {"l": 377.25760139888996, "t": 231.61676080059988, "r": 437.04208162057375, "b": 244.57672084539684, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "\u0627", "bbox": {"l": 83.34959430906444, "t": 231.61676080059988, "r": 86.42111232045377, "b": 244.57672084539684, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "\u062f\u0648", "bbox": {"l": 86.48590932069406, "t": 231.61676080059988, "r": 94.70254535116175, "b": 244.57672084539684, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "\u0647", "bbox": {"l": 94.74142535130592, "t": 231.61676080059988, "r": 102.67294038071637, "b": 244.57672084539684, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": " :\u062e\u0627\u0633\u0639\u0631 \u0649\u0627\u064a", "bbox": {"l": 375.9800113941526, "t": 253.45672087609114, "r": 437.31921162160137, "b": 266.4166809208882, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "\u0648\u064a\u0648\u0644\u0648\u0644\u0623\u0627 \u0629\u0648\u0645\u0626\u062e\u0642 \u0633\u0639\u0631 \u0649\u0627", "bbox": {"l": 89.13600233052074, "t": 253.45672087609114, "r": 199.6070607401529, "b": 266.4166809208882, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "\u064a", "bbox": {"l": 199.56818074000876, "t": 253.45672087609114, "r": 206.72209076653579, "b": 266.4166809208882, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "\u064a\u0631\u0635\u0645\u0644\u0627 \u0646\u062e\u0633\u0646\u0644\u0625\u0627 \u0621\u062e\u0647\u0628 ", "bbox": {"l": 222.04082082333838, "t": 253.45672087609114, "r": 321.0293311903927, "b": 266.4166809208882, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "\u0641\u0627\u0645", "bbox": {"l": 321.1459711908252, "t": 253.45672087609114, "r": 342.4485212698161, "b": 266.4166809208882, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "\u0639\u0636\u0648", "bbox": {"l": 348.3749412917916, "t": 253.45672087609114, "r": 375.73349139323847, "b": 266.4166809208882, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "\u060c", "bbox": {"l": 72.94919627049924, "t": 253.45672087609114, "r": 73.94063627417555, "b": 266.4166809208882, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "\u062a\u062e", "bbox": {"l": 73.97951527431972, "t": 253.45672087609114, "r": 89.02607733011313, "b": 266.4166809208882, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": " \u0648\u0648\u0648\u0645\u0646 \u062a\u062d\u062f\u0648\u0648\u0639\u0645 \u0642\u0648\u0648\u064a \u062d\u062a", "bbox": {"l": 67.9919972521177, "t": 275.2967509515828, "r": 179.1887806644409, "b": 288.25671099637975, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "\u0649\u0648\u0648", "bbox": {"l": 190.77632070740808, "t": 275.2967509515828, "r": 192.97821071557277, "b": 288.25671099637975, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "\u0627\u064a", "bbox": {"l": 193.01709071571696, "t": 275.2967509515828, "r": 203.23216075359494, "b": 288.25671099637975, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "\u0644\u0648", "bbox": {"l": 207.64893076997257, "t": 275.2967509515828, "r": 218.53532081033984, "b": 288.25671099637975, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "\u0648\u0645", "bbox": {"l": 217.84845080779291, "t": 275.2967509515828, "r": 227.72397084441184, "b": 288.25671099637975, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "\u0639\u0644\u0627", "bbox": {"l": 227.6721308442196, "t": 275.2967509515828, "r": 241.0490108938217, "b": 288.25671099637975, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "\u060c\u0644\u064a\u0648\u0648\u0627\u0639\u0644\u0644\u0627\u0648 \u0629\u062d\u0648\u0648\u0635\u0644\u0627 \u062a\u062d\u062e\u0648\u0648\u062c\u0645 \u0627\u0648\u0648\u0641 \u0629\u0648\u0648\u0635\u062e\u0644", "bbox": {"l": 233.752530866766, "t": 275.2967509515828, "r": 437.0279516205213, "b": 288.25671099637975, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": " \u0649\u0648\u0648\u0648\u0648\u0627\u064a", "bbox": {"l": 67.9919972521177, "t": 297.16675102717795, "r": 96.06932135622982, "b": 310.126711071975, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "\u062e\u0648\u0648\u0648\u0648 \u062d\u0644\u0627 \u0627 \u0648\u0648\u0648\u0648", "bbox": {"l": 103.08865038225784, "t": 297.16675102717795, "r": 159.24330059048208, "b": 310.126711071975, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "\u0648 \u060c\u062a\u062e\u0648\u0648\u0648\u0648", "bbox": {"l": 187.1299706938872, "t": 297.16675102717795, "r": 197.68263073301702, "b": 310.126711071975, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "\u064a", "bbox": {"l": 197.72151073316118, "t": 297.16675102717795, "r": 204.87543075968827, "b": 310.126711071975, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "\u062e\u0644", "bbox": {"l": 204.91431075983246, "t": 297.16675102717795, "r": 214.81445079654264, "b": 310.126711071975, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "\u0644\u0627", "bbox": {"l": 239.12222088667707, "t": 297.16675102717795, "r": 244.1863409054551, "b": 310.126711071975, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "\u0641\u0648\u0648\u0648\u0648\u0627\u0630\u0639 \u0627\u0648\u0648\u0648\u0648\u0641 \u0629\u0627\u0645\u062e\u0648\u0648\u0648\u0648 \u0648 \u0629\u0645\u0627\u062f\u0644\u0648\u0648\u0648\u0648\u0633\u0645\u0648 \u0629\u0648\u0648\u0648\u0648\u064a\u0648\u0642", "bbox": {"l": 242.73946090009002, "t": 297.16675102717795, "r": 436.91122162008855, "b": 310.126711071975, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "\u0648\u0648", "bbox": {"l": 80.7360002993731, "t": 319.0067111026693, "r": 82.4855963058607, "b": 331.9666711474664, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "\u064a\u0644\u0648\u062f\u0644\u0627\u0648 \u0629\u0648\u0648\u064a\u0645\u064a\u0627\u0642\u0644\u0625\u0627 \u062a\u062e\u064a\u062f\u0648\u0648", "bbox": {"l": 82.52447530600485, "t": 319.0067111026693, "r": 198.30913073534012, "b": 331.9666711474664, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "\u062d\u0644\u0644", "bbox": {"l": 198.34801073548428, "t": 319.0067111026693, "r": 214.84608079665995, "b": 331.9666711474664, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "\u0627 \u0621\u0648\u0648\u0648\u0636 \u0627\u0648\u0648\u0641 \u064a\u0631\u0648\u0648\u0635\u0645\u0644\u0627", "bbox": {"l": 214.79425079646776, "t": 319.0067111026693, "r": 317.88953117875013, "b": 331.9666711474664, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "\u0627\u0645\u0648\u0648\u0648", "bbox": {"l": 330.88440122693584, "t": 319.0067111026693, "r": 342.81308127116796, "b": 331.9666711474664, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": " \u0644\u0627 \u0646\u0648\u0648\u0645\u0644\u0623\u0627 \u062a\u0627\u062f\u062f\u0648\u0648\u062d\u0645", "bbox": {"l": 342.8519612713121, "t": 319.0067111026693, "r": 437.0582616206338, "b": 331.9666711474664, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "\u060c\u0629", "bbox": {"l": 72.94919627049924, "t": 319.0067111026693, "r": 80.6927952992129, "b": 331.9666711474664, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "\u0648\u0648", "bbox": {"l": 86.25599731984153, "t": 340.84671117816094, "r": 88.48510732810718, "b": 353.806701222958, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "\u0627\u0645 \u0629\u0648\u0648\u0639\u0628\u062e\u0644\u0645 \u0631\u0627\u0631\u0645\u0644\u0648\u0648\u0633\u0627\u0648 \u060c\u0629\u064a\u0648\u0648\u0633\u062e\u064a\u0633\u0644\u0627 \u0629 \u0631\u062e\u0648\u0648\u0627\u0645\u0644\u0627 \u0631", "bbox": {"l": 117.17401043448704, "t": 340.84671117816094, "r": 322.67236119648516, "b": 353.806701222958, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "\u064a", "bbox": {"l": 322.7371511967254, "t": 340.84671117816094, "r": 326.5214812107579, "b": 353.806701222958, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "\u0648\u0648", "bbox": {"l": 326.56036121090204, "t": 340.84671117816094, "r": 334.78998124141793, "b": 353.806701222958, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "\u0648", "bbox": {"l": 333.88278123805395, "t": 340.84671117816094, "r": 335.38614124362846, "b": 353.806701222958, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "\u0644\u062a", "bbox": {"l": 335.4250212437726, "t": 340.84671117816094, "r": 348.4161112919443, "b": 353.806701222958, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "\u062f", "bbox": {"l": 354.00964131268535, "t": 340.84671117816094, "r": 359.8286713342626, "b": 353.806701222958, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "\u0648\u0648\u0648\u0627\u0648 \u0629\u0627\u0648\u0648\u0635\u0627\u0648\u0645\u0648", "bbox": {"l": 359.7638913340224, "t": 340.84671117816094, "r": 436.99252162039, "b": 353.806701222958, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "\u062a\u062e", "bbox": {"l": 84.35918431280804, "t": 340.84671117816094, "r": 86.1777573195514, "b": 353.806701222958, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "\u0627\u064a\u0648\u0648\u0648\u0648", "bbox": {"l": 93.20639834561395, "t": 362.68670125365236, "r": 97.68335736221475, "b": 375.6467012984495, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "\u0644\u0627\u0648", "bbox": {"l": 97.72223736235891, "t": 362.68670125365236, "r": 110.05368040808452, "b": 375.6467012984495, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "\u0629\u0648\u0648\u0648\u0641\u062e \u0644\u0627 \u062a\u062e\u0648\u0648\u0648 \u0627\u0645 \u0631\u064a\u0648\u0648\u0648\u0648\u0644\u062a \u060c \u062e\u0648\u0648\u0648\u0647\u0631\u0644\u0625\u0627 \u0629\u0648\u0648\u0648\u062d\u0641\u062e", "bbox": {"l": 107.81160039977077, "t": 362.68670125365236, "r": 319.73993118561157, "b": 375.6467012984495, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "\u0643\u0645\u0648", "bbox": {"l": 319.7788111857557, "t": 362.68670125365236, "r": 336.7513712486908, "b": 375.6467012984495, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "\u0631", "bbox": {"l": 327.4936212143627, "t": 362.68670125365236, "r": 347.5520912887404, "b": 375.6467012984495, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "\u0627\u0631", "bbox": {"l": 347.6039412889327, "t": 362.68670125365236, "r": 355.45767131805474, "b": 375.6467012984495, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "\u0644\u0648\u0648\u0648\u0633\u062d\u0627\u0648 \u0646\u0648\u0648\u0648\u0645\u0644\u0623\u0627", "bbox": {"l": 365.14093135396075, "t": 362.68670125365236, "r": 436.85941161989643, "b": 375.6467012984495, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "\u0644\u064a", "bbox": {"l": 77.3555982868384, "t": 384.52670132914386, "r": 83.62175831007363, "b": 397.486691373941, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "\u0647\u062e\u0648\u0648\u0648 \u0645 \u0648\u0648\u0648\u0633\u0631\u064a \u064a \u0648\u0648\u0648\u0644\u0627 \u0648\u0648\u0648\u0648", "bbox": {"l": 83.56991630988142, "t": 384.52670132914386, "r": 197.09950073085474, "b": 397.486691373941, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "\u062d\u0647\u0644", "bbox": {"l": 197.13838073099893, "t": 384.52670132914386, "r": 213.63646079217463, "b": 397.486691373941, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "\u0627 \u0649\u0648\u0648\u0648\u0627\u064a \u0644\u062f\u0648\u0648\u0648\u0644\u0639\u0645\u0644\u0627 \u0627\u0647\u064a\u062f\u0648\u0648\u0648", "bbox": {"l": 213.58463079198242, "t": 384.52670132914386, "r": 326.4273712104089, "b": 397.486691373941, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "\u0644\u0627", "bbox": {"l": 326.4662512105531, "t": 384.52670132914386, "r": 341.38971126589, "b": 397.486691373941, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "\u062e\u0648\u0648\u0648\u0644\u0628\u0644\u0627\u0648 \u060c\u0627\u0647\u060c\u0648\u0648\u0648\u0648\u0644\u0627", "bbox": {"l": 347.81137128970187, "t": 384.52670132914386, "r": 436.88547161999304, "b": 397.486691373941, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": ".\u0627\u0639\u0645\u0644\u062c\u0645\u0644\u0627 \u0645\u0627\u0633\u0644\u0627\u0648 \u0629\u0647\u060c\u0627\u0648\u0645\u0644\u0627", "bbox": {"l": 284.1600010536794, "t": 406.3667014046354, "r": 437.30203162153765, "b": 419.32669144943253, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": " \u0631\u0648\u0644 \u0644\u0627 \u0644\u0627\u0648\u0644 \u0629\u064a\u0631\u0648", "bbox": {"l": 107.16000039735461, "t": 433.9166814998638, "r": 187.44720069506354, "b": 446.876681544661, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "\u0635", "bbox": {"l": 187.4860806952077, "t": 433.9166814998638, "r": 200.6404907439849, "b": 446.876681544661, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "\u0645", "bbox": {"l": 200.67937074412907, "t": 433.9166814998638, "r": 209.0126507750293, "b": 446.876681544661, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "\u0644\u0627", "bbox": {"l": 208.96082077483712, "t": 433.9166814998638, "r": 216.06721080118794, "b": 446.876681544661, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "\u0629\u0648", "bbox": {"l": 218.09763080871687, "t": 433.9166814998638, "r": 227.2344208425965, "b": 446.876681544661, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "\u0645\u0648\u0643\u062d\u0644\u0627 \u0627\u0645\u062e\u0648\u0646\u0631\u0628", "bbox": {"l": 227.3121808428849, "t": 433.9166814998638, "r": 310.7486611522715, "b": 446.876681544661, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "\u062f\u0627\u0644\u0648\u0633\u064a \u060c\u0642\u0628\u0633 \u062e\u0645\u0644 \u062e\u064b \u0641\u0648\u0648", "bbox": {"l": 321.5573111923505, "t": 433.9166814998638, "r": 440.45236163321925, "b": 446.876681544661, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "2024(", "bbox": {"l": 81.36000130168694, "t": 433.9166814998638, "r": 104.00928038567159, "b": 446.876681544661, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "-", "bbox": {"l": 74.51999727632386, "t": 433.9166814998638, "r": 78.09695428958737, "b": 446.876681544661, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": " )2026", "bbox": {"l": 414.79001153806195, "t": 452.63669156457087, "r": 440.883241634817, "b": 465.596681609368, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "\u0627\u062a\u0644\u0622\u0627 \u0648\u062d\u0647\u0644\u0627 \u0649\u0627\u064a \u0627\u0647\u0648 \u060c\u0629\u0633\u064a\u0626\u0631 \u0629\u064a\u062c\u064a\u062a\u0627\u0631\u0644\u0633\u0627 \u0627\u062f", "bbox": {"l": 113.40000042049283, "t": 452.63669156457087, "r": 336.75259124869535, "b": 465.596681609368, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "\u0647\u0639", "bbox": {"l": 336.7914712488395, "t": 452.63669156457087, "r": 347.26965128769314, "b": 465.596681609368, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "\u0629\u0639\u0628\u0631\u0639 \u0642\u064a \u062d\u062a", "bbox": {"l": 344.2758812765921, "t": 452.63669156457087, "r": 414.4348115367449, "b": 465.596681609368, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": ":", "bbox": {"l": 110.52000040981365, "t": 452.63669156457087, "r": 113.42303042057824, "b": 465.596681609368, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "\u062e\u0647\u0644\u0648\u0633\u062d\u062e\u0628 \u0627\u0645\u062e\u0648\u0646\u0631\u0628", "bbox": {"l": 115.18000042709316, "t": 578.8267220007557, "r": 194.85806072254337, "b": 591.7867120455528, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "\u0644\u0627", "bbox": {"l": 194.8062307223512, "t": 578.8267220007557, "r": 205.46582076187747, "b": 591.7867120455528, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "\u062a", "bbox": {"l": 202.42023075058427, "t": 578.8267220007557, "r": 216.12543080140384, "b": 591.7867120455528, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "\u062e\u0641\u062f\u0627\u0644\u0648\u0633\u0645 \u062f\u064a\u062f\u062d\u062a \u0644\u062a \u062f\u0642", "bbox": {"l": 216.15135080149997, "t": 578.8267220007557, "r": 331.91013123073924, "b": 591.7867120455528, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "\u0647\u0646", "bbox": {"l": 337.0552412498176, "t": 578.8267220007557, "r": 347.5528312887431, "b": 591.7867120455528, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "\u0639 \u0649\u0644\u0625", "bbox": {"l": 347.6046812889354, "t": 578.8267220007557, "r": 372.38708138082984, "b": 591.7867120455528, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "\u0631\u062e \u0644\u0625\u0627 \u0631\u062f\u062c\u062a", "bbox": {"l": 382.3000514175876, "t": 578.8267220007557, "r": 436.8213216197552, "b": 591.7867120455528, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "\u0644\u0643\u0648\u0627\u0628 \u062f", "bbox": {"l": 87.43940032422965, "t": 578.8267220007557, "r": 115.1923104271388, "b": 591.7867120455528, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": " \u0631\u0648\u0648\u0648\u0635\u0645 \u0629\u0648", "bbox": {"l": 241.0800008939366, "t": 597.5312820654094, "r": 285.1217710572457, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "\u0648\u0648\u064a \u0631", "bbox": {"l": 285.18668105748645, "t": 597.5312820654094, "r": 302.2865911208937, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "\u062a\u062e", "bbox": {"l": 318.6840811816964, "t": 597.5312820654094, "r": 320.50314118844153, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "\u0641\u062f\u0627\u0644", "bbox": {"l": 320.54208118858594, "t": 597.5312820654094, "r": 347.354031288006, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "\u0648\u0648\u0648", "bbox": {"l": 347.3020912878134, "t": 597.5312820654094, "r": 351.67767130403826, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "\u0633", "bbox": {"l": 351.71661130418266, "t": 597.5312820654094, "r": 365.2199713542538, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "\u0645 \u0649\u0648\u0648\u0648", "bbox": {"l": 365.1550613540131, "t": 597.5312820654094, "r": 388.13672143923026, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "\u0627\u064a \u0633\u064a\u0648\u0648\u0648\u0626\u0631", "bbox": {"l": 388.1756614393746, "t": 597.5312820654094, "r": 437.1642516210267, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "2023", "bbox": {"l": 215.03999079737898, "t": 597.5312820654094, "r": 241.13783089415108, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "\u0631", "bbox": {"l": 73.95381227422442, "t": 597.5312820654094, "r": 75.14617927864577, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "\u0627\u0648\u0648", "bbox": {"l": 75.18513527879021, "t": 597.5312820654094, "r": 86.63702432125439, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "\u0648\u0648", "bbox": {"l": 86.68895732144696, "t": 597.5312820654094, "r": 89.51946333194262, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "\u062d\u0644\u0627", "bbox": {"l": 89.55841833208707, "t": 597.5312820654094, "r": 106.3337403942908, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "\u062a\u062e\u0648\u0648\u0648", "bbox": {"l": 103.28368038298102, "t": 597.5312820654094, "r": 127.52363047286396, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "\u0633\u0627\u0648 \u062a\u062e\u064a\u0648\u0648\u0648\u0635\u0648\u062a\u0648 \u060c", "bbox": {"l": 127.56258047300838, "t": 597.5312820654094, "r": 214.76315079635242, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "\u0643\u064a\u0627\u0644", "bbox": {"l": 91.17600333808515, "t": 616.2866921302387, "r": 114.98352042636462, "b": 629.2467021750359, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "\u0627 \u062a\u062e \u0627\u0648\u0648\u0635\u064a\u0644 \u0627\u0647\u060c\u0648\u0648\u0648\u0644\u0627 \u0627\u0645\u062e\u0648\u0648\u0646\u0631\u0628\u0644\u0627\u0648 \u060c\u062a\u0627\u0631\u0627 ", "bbox": {"l": 114.93168042617239, "t": 616.2866921302387, "r": 303.07190112380573, "b": 629.2467021750359, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "\u0648\u0648\u0648", "bbox": {"l": 303.1107811239498, "t": 616.2866921302387, "r": 311.57367115533066, "b": 629.2467021750359, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "\u0644\u0627", "bbox": {"l": 311.6125511554748, "t": 616.2866921302387, "r": 322.27216119500116, "b": 629.2467021750359, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "\u062a", "bbox": {"l": 319.22656118370793, "t": 616.2866921302387, "r": 332.9317612345275, "b": 629.2467021750359, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "\u062e", "bbox": {"l": 332.9576712346236, "t": 616.2866921302387, "r": 336.7420012486561, "b": 629.2467021750359, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "\u0641\u062f\u0627", "bbox": {"l": 336.78088124880026, "t": 616.2866921302387, "r": 359.1757513318415, "b": 629.2467021750359, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "\u0644\u0648\u0648", "bbox": {"l": 359.2016613319376, "t": 616.2866921302387, "r": 365.26694135442796, "b": 629.2467021750359, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "\u0633\u0645\u0648", "bbox": {"l": 365.3058213545721, "t": 616.2866921302387, "r": 392.46997145529815, "b": 629.2467021750359, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": " \u060c\u0627\u0647\u060c\u0648\u0648\u0648\u0644\u0627", "bbox": {"l": 392.431091455154, "t": 616.2866921302387, "r": 437.0264616205159, "b": 629.2467021750359, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "\u060c\u0629\u0648\u0648", "bbox": {"l": 72.94919627049924, "t": 616.2866921302387, "r": 82.44239030570048, "b": 629.2467021750359, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "\u064a", "bbox": {"l": 82.48127030584465, "t": 616.2866921302387, "r": 86.84879332203964, "b": 629.2467021750359, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "\u0627", "bbox": {"l": 86.79695132184742, "t": 616.2866921302387, "r": 91.12559533789825, "b": 629.2467021750359, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "\u0629\u064a\u0647\u060c", "bbox": {"l": 276.1200010238667, "t": 635.0067021949458, "r": 302.3251311210366, "b": 647.966702239743, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "\u0648\u0644\u0627", "bbox": {"l": 302.27328112084433, "t": 635.0067021949458, "r": 318.1881711798576, "b": 647.966702239743, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "\u062a\u062e", "bbox": {"l": 315.29456116912786, "t": 635.0067021949458, "r": 334.1030612388708, "b": 647.966702239743, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "\u064a", "bbox": {"l": 334.18082123915906, "t": 635.0067021949458, "r": 338.5483412553541, "b": 647.966702239743, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "\u062c\u064a\u062a\u0627", "bbox": {"l": 338.4964912551618, "t": 635.0067021949458, "r": 358.23456132835156, "b": 647.966702239743, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "\u0631\u0644\u0633\u062d\u0627 \u0641\u0627\u0644\u0628\u0645\u0648", "bbox": {"l": 358.2864113285438, "t": 635.0067021949458, "r": 437.29059162149525, "b": 647.966702239743, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": ".", "bbox": {"l": 272.6400110109627, "t": 635.0067021949458, "r": 276.0614610236496, "b": 647.966702239743, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": " \u0646\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0645", "bbox": {"l": 167.78000062213658, "t": 507.4266917539564, "r": 199.8948707412201, "b": 520.3866917987535, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "\u0645\u0627", "bbox": {"l": 199.92079074131624, "t": 507.4266917539564, "r": 211.63663078475915, "b": 520.3866917987535, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "\u0629\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u064a\u0627", "bbox": {"l": 221.8685508226996, "t": 507.4266917539564, "r": 241.72971089634578, "b": 520.3866917987535, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "\u0645 ", "bbox": {"l": 241.67787089615356, "t": 507.4266917539564, "r": 257.411320954494, "b": 520.3866917987535, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "\u0631\u0640", "bbox": {"l": 179.26880066473763, "t": 519.9067017970945, "r": 187.75760069621452, "b": 532.8667018418917, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "\u0635\u0645", "bbox": {"l": 187.79648069635869, "t": 519.9067017970945, "r": 209.58224077714138, "b": 532.8667018418917, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "\u0644\u0627", "bbox": {"l": 209.51744077690105, "t": 519.9067017970945, "r": 216.90465080429323, "b": 532.8667018418917, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": " \u064a\u0645", "bbox": {"l": 216.94353080443742, "t": 519.9067017970945, "r": 235.95586087493606, "b": 532.8667018418917, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "\u0648\u0642\u0644", "bbox": {"l": 235.99474087508025, "t": 519.9067017970945, "r": 254.0609709420707, "b": 532.8667018418917, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "\u0627", "bbox": {"l": 254.09985094221489, "t": 519.9067017970945, "r": 257.54721095499787, "b": 532.8667018418917, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": " \u0627\u0640\u0640\u0640\u0640\u0633\u0646 \u0627 \u0621\u0627\u0640\u0640\u0640\u0640", "bbox": {"l": 362.20999134309267, "t": 508.6766917582771, "r": 428.6688815895255, "b": 521.6366918030742, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "\u0646\u0628", "bbox": {"l": 428.7077615896697, "t": 508.6766917582771, "r": 437.3132016215791, "b": 521.6366918030742, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "\u0631\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0635\u0645", "bbox": {"l": 367.6023913630879, "t": 521.1567018014152, "r": 429.6149015930334, "b": 534.1167018462124, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "\u0644\u0627", "bbox": {"l": 429.5501115927932, "t": 521.1567018014152, "r": 436.93732162018534, "b": 534.1167018462124, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": " \u0639\u0627\u0640\u0640\u0640\u0640\u0640\u0635\u062a", "bbox": {"l": 270.07001100143304, "t": 507.4266917539564, "r": 308.6001011443045, "b": 520.3866917987535, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "\u0627 \u0621\u0627\u0640\u0640\u0640\u0640\u0640", "bbox": {"l": 331.3538212286764, "t": 507.4266917539564, "r": 340.23544126160994, "b": 520.3866917987535, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "\u0646\u0628", "bbox": {"l": 340.2743212617541, "t": 507.4266917539564, "r": 348.8797612936635, "b": 520.3866917987535, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "\u064a\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0633\u0628\u0627", "bbox": {"l": 273.0700110125572, "t": 519.9067017970945, "r": 340.08609126105614, "b": 532.8667018418917, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "\u0646\u062a", "bbox": {"l": 340.0213012608159, "t": 519.9067017970945, "r": 348.6267412927253, "b": 532.8667018418917, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "\u0642\u062a\u0633\u0638\u0627", "bbox": {"l": 85.41600031672677, "t": 508.33670175710193, "r": 117.0141004338941, "b": 521.296691801899, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "\u0642", "bbox": {"l": 129.65334048076102, "t": 508.33670175710193, "r": 135.9729605041945, "b": 521.296691801899, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "\u064a\u0642\u062d\u062a", "bbox": {"l": 136.02480050438672, "t": 508.33670175710193, "r": 160.44144059492484, "b": 521.296691801899, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": " \u0631\u0627 \u0631", "bbox": {"l": 69.09600125621141, "t": 508.33670175710193, "r": 85.41264331671432, "b": 521.296691801899, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "\u064a\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0633\u0627\u064a", "bbox": {"l": 72.09600126733555, "t": 520.81671180024, "r": 138.94359051520973, "b": 533.7767018450371, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "\u0633\u0644\u0627", "bbox": {"l": 138.8787805149694, "t": 520.81671180024, "r": 159.95175059310904, "b": 533.7767018450371, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 7, "label": "text", "bbox": {"l": 47.9520001778084, "t": 804.0922617794021, "r": 58.751999217855335, "b": 818.1322628279323, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 0, "text": "11", "bbox": {"l": 47.9520001778084, "t": 804.0922617794021, "r": 58.751999217855335, "b": 818.1322628279323, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 67.9919972521177, "t": 209.65674072469346, "r": 437.42722162200187, "b": 419.32669144943253, "coord_origin": "TOPLEFT"}, "confidence": 0.9685260057449341, "cells": [{"id": 1, "text": " \u060c\u0647\u064a\u0644\u0639\u0648", "bbox": {"l": 399.260011480476, "t": 209.65674072469346, "r": 437.42722162200187, "b": 222.61670076949054, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "\u0645\u0644\u0627 \u0629\u0648\u0627", "bbox": {"l": 101.00520037453231, "t": 209.65674072469346, "r": 126.82584047027652, "b": 222.61670076949054, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "\u0631\u0645\u0644\u0627 \u0644\u0627\u0648\u0644 \u062e\u0648\u0627\u0647\u064a\u064a\u0639", "bbox": {"l": 130.05289048224256, "t": 209.65674072469346, "r": 229.27513085016358, "b": 222.61670076949054, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "\u0648\u0648\u0635", "bbox": {"l": 240.66298089239032, "t": 209.65674072469346, "r": 258.55817095874653, "b": 222.61670076949054, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "\u0639\u0636\u062a", "bbox": {"l": 265.06552098287614, "t": 209.65674072469346, "r": 281.6825010444927, "b": 222.61670076949054, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "\u0629\u064a\u0631\u0635", "bbox": {"l": 286.3310210617297, "t": 209.65674072469346, "r": 314.70044116692486, "b": 222.61670076949054, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "\u0645", "bbox": {"l": 314.739321167069, "t": 209.65674072469346, "r": 323.0726011979693, "b": 222.61670076949054, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "\u0644\u0627", "bbox": {"l": 323.02075119777703, "t": 209.65674072469346, "r": 330.06061122388115, "b": 222.61670076949054, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "\u0629\u0645\u0648\u0643\u062d", "bbox": {"l": 333.2073112355493, "t": 209.65674072469346, "r": 369.27499136929003, "b": 222.61670076949054, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "\u0644\u0627 ", "bbox": {"l": 369.3138713694342, "t": 209.65674072469346, "r": 379.37082140672584, "b": 222.61670076949054, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "\u0646\u0625\u0641", "bbox": {"l": 379.50043140720646, "t": 209.65674072469346, "r": 398.9274614792428, "b": 222.61670076949054, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "\u0629\u0648", "bbox": {"l": 78.1863332899188, "t": 209.65674072469346, "r": 79.31903829411894, "b": 222.61670076949054, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "\u0627\u0628", "bbox": {"l": 79.3838352943592, "t": 209.65674072469346, "r": 88.079994326605, "b": 222.61670076949054, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "\u0644\u0623\u0627", "bbox": {"l": 102.7000003808167, "t": 231.61676080059988, "r": 113.81968042204905, "b": 244.57672084539684, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "\u0646\u0645 \u062f\u062f\u064a \u0642\u064a \u062d\u062a \u0649\u0627\u064a \u0644\u0645\u0639\u0644\u062e\u0628 \u062e\u0627\u0644 \u0629\u064a\u0631", "bbox": {"l": 117.07263043411113, "t": 231.61676080059988, "r": 294.7153310928191, "b": 244.57672084539684, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "\u0648\u0627\u0645", "bbox": {"l": 294.75421109296326, "t": 231.61676080059988, "r": 318.5617411812428, "b": 244.57672084539684, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "\u062c\u0644\u0627", "bbox": {"l": 318.5098911810505, "t": 231.61676080059988, "r": 333.0000912347809, "b": 244.57672084539684, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "\u0633\u064a", "bbox": {"l": 337.2111512503957, "t": 231.61676080059988, "r": 359.59308133338897, "b": 244.57672084539684, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "\u0626\u0631 ", "bbox": {"l": 359.5282913331488, "t": 231.61676080059988, "r": 370.3110413731318, "b": 244.57672084539684, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "\u062f", "bbox": {"l": 370.5443113739967, "t": 231.61676080059988, "r": 377.2187213987458, "b": 244.57672084539684, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "\u064a\u0633\u0644\u0627 \u0641\u064a\u0627\u0643\u062a", "bbox": {"l": 377.25760139888996, "t": 231.61676080059988, "r": 437.04208162057375, "b": 244.57672084539684, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "\u0627", "bbox": {"l": 83.34959430906444, "t": 231.61676080059988, "r": 86.42111232045377, "b": 244.57672084539684, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "\u062f\u0648", "bbox": {"l": 86.48590932069406, "t": 231.61676080059988, "r": 94.70254535116175, "b": 244.57672084539684, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "\u0647", "bbox": {"l": 94.74142535130592, "t": 231.61676080059988, "r": 102.67294038071637, "b": 244.57672084539684, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": " :\u062e\u0627\u0633\u0639\u0631 \u0649\u0627\u064a", "bbox": {"l": 375.9800113941526, "t": 253.45672087609114, "r": 437.31921162160137, "b": 266.4166809208882, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "\u0648\u064a\u0648\u0644\u0648\u0644\u0623\u0627 \u0629\u0648\u0645\u0626\u062e\u0642 \u0633\u0639\u0631 \u0649\u0627", "bbox": {"l": 89.13600233052074, "t": 253.45672087609114, "r": 199.6070607401529, "b": 266.4166809208882, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "\u064a", "bbox": {"l": 199.56818074000876, "t": 253.45672087609114, "r": 206.72209076653579, "b": 266.4166809208882, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "\u064a\u0631\u0635\u0645\u0644\u0627 \u0646\u062e\u0633\u0646\u0644\u0625\u0627 \u0621\u062e\u0647\u0628 ", "bbox": {"l": 222.04082082333838, "t": 253.45672087609114, "r": 321.0293311903927, "b": 266.4166809208882, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "\u0641\u0627\u0645", "bbox": {"l": 321.1459711908252, "t": 253.45672087609114, "r": 342.4485212698161, "b": 266.4166809208882, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "\u0639\u0636\u0648", "bbox": {"l": 348.3749412917916, "t": 253.45672087609114, "r": 375.73349139323847, "b": 266.4166809208882, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "\u060c", "bbox": {"l": 72.94919627049924, "t": 253.45672087609114, "r": 73.94063627417555, "b": 266.4166809208882, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "\u062a\u062e", "bbox": {"l": 73.97951527431972, "t": 253.45672087609114, "r": 89.02607733011313, "b": 266.4166809208882, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": " \u0648\u0648\u0648\u0645\u0646 \u062a\u062d\u062f\u0648\u0648\u0639\u0645 \u0642\u0648\u0648\u064a \u062d\u062a", "bbox": {"l": 67.9919972521177, "t": 275.2967509515828, "r": 179.1887806644409, "b": 288.25671099637975, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "\u0649\u0648\u0648", "bbox": {"l": 190.77632070740808, "t": 275.2967509515828, "r": 192.97821071557277, "b": 288.25671099637975, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "\u0627\u064a", "bbox": {"l": 193.01709071571696, "t": 275.2967509515828, "r": 203.23216075359494, "b": 288.25671099637975, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "\u0644\u0648", "bbox": {"l": 207.64893076997257, "t": 275.2967509515828, "r": 218.53532081033984, "b": 288.25671099637975, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "\u0648\u0645", "bbox": {"l": 217.84845080779291, "t": 275.2967509515828, "r": 227.72397084441184, "b": 288.25671099637975, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "\u0639\u0644\u0627", "bbox": {"l": 227.6721308442196, "t": 275.2967509515828, "r": 241.0490108938217, "b": 288.25671099637975, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "\u060c\u0644\u064a\u0648\u0648\u0627\u0639\u0644\u0644\u0627\u0648 \u0629\u062d\u0648\u0648\u0635\u0644\u0627 \u062a\u062d\u062e\u0648\u0648\u062c\u0645 \u0627\u0648\u0648\u0641 \u0629\u0648\u0648\u0635\u062e\u0644", "bbox": {"l": 233.752530866766, "t": 275.2967509515828, "r": 437.0279516205213, "b": 288.25671099637975, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": " \u0649\u0648\u0648\u0648\u0648\u0627\u064a", "bbox": {"l": 67.9919972521177, "t": 297.16675102717795, "r": 96.06932135622982, "b": 310.126711071975, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "\u062e\u0648\u0648\u0648\u0648 \u062d\u0644\u0627 \u0627 \u0648\u0648\u0648\u0648", "bbox": {"l": 103.08865038225784, "t": 297.16675102717795, "r": 159.24330059048208, "b": 310.126711071975, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "\u0648 \u060c\u062a\u062e\u0648\u0648\u0648\u0648", "bbox": {"l": 187.1299706938872, "t": 297.16675102717795, "r": 197.68263073301702, "b": 310.126711071975, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "\u064a", "bbox": {"l": 197.72151073316118, "t": 297.16675102717795, "r": 204.87543075968827, "b": 310.126711071975, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "\u062e\u0644", "bbox": {"l": 204.91431075983246, "t": 297.16675102717795, "r": 214.81445079654264, "b": 310.126711071975, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "\u0644\u0627", "bbox": {"l": 239.12222088667707, "t": 297.16675102717795, "r": 244.1863409054551, "b": 310.126711071975, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "\u0641\u0648\u0648\u0648\u0648\u0627\u0630\u0639 \u0627\u0648\u0648\u0648\u0648\u0641 \u0629\u0627\u0645\u062e\u0648\u0648\u0648\u0648 \u0648 \u0629\u0645\u0627\u062f\u0644\u0648\u0648\u0648\u0648\u0633\u0645\u0648 \u0629\u0648\u0648\u0648\u0648\u064a\u0648\u0642", "bbox": {"l": 242.73946090009002, "t": 297.16675102717795, "r": 436.91122162008855, "b": 310.126711071975, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "\u0648\u0648", "bbox": {"l": 80.7360002993731, "t": 319.0067111026693, "r": 82.4855963058607, "b": 331.9666711474664, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "\u064a\u0644\u0648\u062f\u0644\u0627\u0648 \u0629\u0648\u0648\u064a\u0645\u064a\u0627\u0642\u0644\u0625\u0627 \u062a\u062e\u064a\u062f\u0648\u0648", "bbox": {"l": 82.52447530600485, "t": 319.0067111026693, "r": 198.30913073534012, "b": 331.9666711474664, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "\u062d\u0644\u0644", "bbox": {"l": 198.34801073548428, "t": 319.0067111026693, "r": 214.84608079665995, "b": 331.9666711474664, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "\u0627 \u0621\u0648\u0648\u0648\u0636 \u0627\u0648\u0648\u0641 \u064a\u0631\u0648\u0648\u0635\u0645\u0644\u0627", "bbox": {"l": 214.79425079646776, "t": 319.0067111026693, "r": 317.88953117875013, "b": 331.9666711474664, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "\u0627\u0645\u0648\u0648\u0648", "bbox": {"l": 330.88440122693584, "t": 319.0067111026693, "r": 342.81308127116796, "b": 331.9666711474664, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": " \u0644\u0627 \u0646\u0648\u0648\u0645\u0644\u0623\u0627 \u062a\u0627\u062f\u062f\u0648\u0648\u062d\u0645", "bbox": {"l": 342.8519612713121, "t": 319.0067111026693, "r": 437.0582616206338, "b": 331.9666711474664, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "\u060c\u0629", "bbox": {"l": 72.94919627049924, "t": 319.0067111026693, "r": 80.6927952992129, "b": 331.9666711474664, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "\u0648\u0648", "bbox": {"l": 86.25599731984153, "t": 340.84671117816094, "r": 88.48510732810718, "b": 353.806701222958, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "\u0627\u0645 \u0629\u0648\u0648\u0639\u0628\u062e\u0644\u0645 \u0631\u0627\u0631\u0645\u0644\u0648\u0648\u0633\u0627\u0648 \u060c\u0629\u064a\u0648\u0648\u0633\u062e\u064a\u0633\u0644\u0627 \u0629 \u0631\u062e\u0648\u0648\u0627\u0645\u0644\u0627 \u0631", "bbox": {"l": 117.17401043448704, "t": 340.84671117816094, "r": 322.67236119648516, "b": 353.806701222958, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "\u064a", "bbox": {"l": 322.7371511967254, "t": 340.84671117816094, "r": 326.5214812107579, "b": 353.806701222958, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "\u0648\u0648", "bbox": {"l": 326.56036121090204, "t": 340.84671117816094, "r": 334.78998124141793, "b": 353.806701222958, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "\u0648", "bbox": {"l": 333.88278123805395, "t": 340.84671117816094, "r": 335.38614124362846, "b": 353.806701222958, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "\u0644\u062a", "bbox": {"l": 335.4250212437726, "t": 340.84671117816094, "r": 348.4161112919443, "b": 353.806701222958, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "\u062f", "bbox": {"l": 354.00964131268535, "t": 340.84671117816094, "r": 359.8286713342626, "b": 353.806701222958, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "\u0648\u0648\u0648\u0627\u0648 \u0629\u0627\u0648\u0648\u0635\u0627\u0648\u0645\u0648", "bbox": {"l": 359.7638913340224, "t": 340.84671117816094, "r": 436.99252162039, "b": 353.806701222958, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "\u062a\u062e", "bbox": {"l": 84.35918431280804, "t": 340.84671117816094, "r": 86.1777573195514, "b": 353.806701222958, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "\u0627\u064a\u0648\u0648\u0648\u0648", "bbox": {"l": 93.20639834561395, "t": 362.68670125365236, "r": 97.68335736221475, "b": 375.6467012984495, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "\u0644\u0627\u0648", "bbox": {"l": 97.72223736235891, "t": 362.68670125365236, "r": 110.05368040808452, "b": 375.6467012984495, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "\u0629\u0648\u0648\u0648\u0641\u062e \u0644\u0627 \u062a\u062e\u0648\u0648\u0648 \u0627\u0645 \u0631\u064a\u0648\u0648\u0648\u0648\u0644\u062a \u060c \u062e\u0648\u0648\u0648\u0647\u0631\u0644\u0625\u0627 \u0629\u0648\u0648\u0648\u062d\u0641\u062e", "bbox": {"l": 107.81160039977077, "t": 362.68670125365236, "r": 319.73993118561157, "b": 375.6467012984495, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "\u0643\u0645\u0648", "bbox": {"l": 319.7788111857557, "t": 362.68670125365236, "r": 336.7513712486908, "b": 375.6467012984495, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "\u0631", "bbox": {"l": 327.4936212143627, "t": 362.68670125365236, "r": 347.5520912887404, "b": 375.6467012984495, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "\u0627\u0631", "bbox": {"l": 347.6039412889327, "t": 362.68670125365236, "r": 355.45767131805474, "b": 375.6467012984495, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "\u0644\u0648\u0648\u0648\u0633\u062d\u0627\u0648 \u0646\u0648\u0648\u0648\u0645\u0644\u0623\u0627", "bbox": {"l": 365.14093135396075, "t": 362.68670125365236, "r": 436.85941161989643, "b": 375.6467012984495, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "\u0644\u064a", "bbox": {"l": 77.3555982868384, "t": 384.52670132914386, "r": 83.62175831007363, "b": 397.486691373941, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "\u0647\u062e\u0648\u0648\u0648 \u0645 \u0648\u0648\u0648\u0633\u0631\u064a \u064a \u0648\u0648\u0648\u0644\u0627 \u0648\u0648\u0648\u0648", "bbox": {"l": 83.56991630988142, "t": 384.52670132914386, "r": 197.09950073085474, "b": 397.486691373941, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "\u062d\u0647\u0644", "bbox": {"l": 197.13838073099893, "t": 384.52670132914386, "r": 213.63646079217463, "b": 397.486691373941, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "\u0627 \u0649\u0648\u0648\u0648\u0627\u064a \u0644\u062f\u0648\u0648\u0648\u0644\u0639\u0645\u0644\u0627 \u0627\u0647\u064a\u062f\u0648\u0648\u0648", "bbox": {"l": 213.58463079198242, "t": 384.52670132914386, "r": 326.4273712104089, "b": 397.486691373941, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "\u0644\u0627", "bbox": {"l": 326.4662512105531, "t": 384.52670132914386, "r": 341.38971126589, "b": 397.486691373941, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "\u062e\u0648\u0648\u0648\u0644\u0628\u0644\u0627\u0648 \u060c\u0627\u0647\u060c\u0648\u0648\u0648\u0648\u0644\u0627", "bbox": {"l": 347.81137128970187, "t": 384.52670132914386, "r": 436.88547161999304, "b": 397.486691373941, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": ".\u0627\u0639\u0645\u0644\u062c\u0645\u0644\u0627 \u0645\u0627\u0633\u0644\u0627\u0648 \u0629\u0647\u060c\u0627\u0648\u0645\u0644\u0627", "bbox": {"l": 284.1600010536794, "t": 406.3667014046354, "r": 437.30203162153765, "b": 419.32669144943253, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 74.51999727632386, "t": 433.9166814998638, "r": 440.883241634817, "b": 465.596681609368, "coord_origin": "TOPLEFT"}, "confidence": 0.9393879771232605, "cells": [{"id": 77, "text": " \u0631\u0648\u0644 \u0644\u0627 \u0644\u0627\u0648\u0644 \u0629\u064a\u0631\u0648", "bbox": {"l": 107.16000039735461, "t": 433.9166814998638, "r": 187.44720069506354, "b": 446.876681544661, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "\u0635", "bbox": {"l": 187.4860806952077, "t": 433.9166814998638, "r": 200.6404907439849, "b": 446.876681544661, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "\u0645", "bbox": {"l": 200.67937074412907, "t": 433.9166814998638, "r": 209.0126507750293, "b": 446.876681544661, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "\u0644\u0627", "bbox": {"l": 208.96082077483712, "t": 433.9166814998638, "r": 216.06721080118794, "b": 446.876681544661, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "\u0629\u0648", "bbox": {"l": 218.09763080871687, "t": 433.9166814998638, "r": 227.2344208425965, "b": 446.876681544661, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "\u0645\u0648\u0643\u062d\u0644\u0627 \u0627\u0645\u062e\u0648\u0646\u0631\u0628", "bbox": {"l": 227.3121808428849, "t": 433.9166814998638, "r": 310.7486611522715, "b": 446.876681544661, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "\u062f\u0627\u0644\u0648\u0633\u064a \u060c\u0642\u0628\u0633 \u062e\u0645\u0644 \u062e\u064b \u0641\u0648\u0648", "bbox": {"l": 321.5573111923505, "t": 433.9166814998638, "r": 440.45236163321925, "b": 446.876681544661, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "2024(", "bbox": {"l": 81.36000130168694, "t": 433.9166814998638, "r": 104.00928038567159, "b": 446.876681544661, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "-", "bbox": {"l": 74.51999727632386, "t": 433.9166814998638, "r": 78.09695428958737, "b": 446.876681544661, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": " )2026", "bbox": {"l": 414.79001153806195, "t": 452.63669156457087, "r": 440.883241634817, "b": 465.596681609368, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "\u0627\u062a\u0644\u0622\u0627 \u0648\u062d\u0647\u0644\u0627 \u0649\u0627\u064a \u0627\u0647\u0648 \u060c\u0629\u0633\u064a\u0626\u0631 \u0629\u064a\u062c\u064a\u062a\u0627\u0631\u0644\u0633\u0627 \u0627\u062f", "bbox": {"l": 113.40000042049283, "t": 452.63669156457087, "r": 336.75259124869535, "b": 465.596681609368, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "\u0647\u0639", "bbox": {"l": 336.7914712488395, "t": 452.63669156457087, "r": 347.26965128769314, "b": 465.596681609368, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "\u0629\u0639\u0628\u0631\u0639 \u0642\u064a \u062d\u062a", "bbox": {"l": 344.2758812765921, "t": 452.63669156457087, "r": 414.4348115367449, "b": 465.596681609368, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": ":", "bbox": {"l": 110.52000040981365, "t": 452.63669156457087, "r": 113.42303042057824, "b": 465.596681609368, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 72.94919627049924, "t": 578.8267220007557, "r": 437.29059162149525, "b": 647.966702239743, "coord_origin": "TOPLEFT"}, "confidence": 0.9558618068695068, "cells": [{"id": 91, "text": "\u062e\u0647\u0644\u0648\u0633\u062d\u062e\u0628 \u0627\u0645\u062e\u0648\u0646\u0631\u0628", "bbox": {"l": 115.18000042709316, "t": 578.8267220007557, "r": 194.85806072254337, "b": 591.7867120455528, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "\u0644\u0627", "bbox": {"l": 194.8062307223512, "t": 578.8267220007557, "r": 205.46582076187747, "b": 591.7867120455528, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "\u062a", "bbox": {"l": 202.42023075058427, "t": 578.8267220007557, "r": 216.12543080140384, "b": 591.7867120455528, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "\u062e\u0641\u062f\u0627\u0644\u0648\u0633\u0645 \u062f\u064a\u062f\u062d\u062a \u0644\u062a \u062f\u0642", "bbox": {"l": 216.15135080149997, "t": 578.8267220007557, "r": 331.91013123073924, "b": 591.7867120455528, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "\u0647\u0646", "bbox": {"l": 337.0552412498176, "t": 578.8267220007557, "r": 347.5528312887431, "b": 591.7867120455528, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "\u0639 \u0649\u0644\u0625", "bbox": {"l": 347.6046812889354, "t": 578.8267220007557, "r": 372.38708138082984, "b": 591.7867120455528, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "\u0631\u062e \u0644\u0625\u0627 \u0631\u062f\u062c\u062a", "bbox": {"l": 382.3000514175876, "t": 578.8267220007557, "r": 436.8213216197552, "b": 591.7867120455528, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "\u0644\u0643\u0648\u0627\u0628 \u062f", "bbox": {"l": 87.43940032422965, "t": 578.8267220007557, "r": 115.1923104271388, "b": 591.7867120455528, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": " \u0631\u0648\u0648\u0648\u0635\u0645 \u0629\u0648", "bbox": {"l": 241.0800008939366, "t": 597.5312820654094, "r": 285.1217710572457, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "\u0648\u0648\u064a \u0631", "bbox": {"l": 285.18668105748645, "t": 597.5312820654094, "r": 302.2865911208937, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "\u062a\u062e", "bbox": {"l": 318.6840811816964, "t": 597.5312820654094, "r": 320.50314118844153, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "\u0641\u062f\u0627\u0644", "bbox": {"l": 320.54208118858594, "t": 597.5312820654094, "r": 347.354031288006, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "\u0648\u0648\u0648", "bbox": {"l": 347.3020912878134, "t": 597.5312820654094, "r": 351.67767130403826, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "\u0633", "bbox": {"l": 351.71661130418266, "t": 597.5312820654094, "r": 365.2199713542538, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "\u0645 \u0649\u0648\u0648\u0648", "bbox": {"l": 365.1550613540131, "t": 597.5312820654094, "r": 388.13672143923026, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "\u0627\u064a \u0633\u064a\u0648\u0648\u0648\u0626\u0631", "bbox": {"l": 388.1756614393746, "t": 597.5312820654094, "r": 437.1642516210267, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "2023", "bbox": {"l": 215.03999079737898, "t": 597.5312820654094, "r": 241.13783089415108, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "\u0631", "bbox": {"l": 73.95381227422442, "t": 597.5312820654094, "r": 75.14617927864577, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "\u0627\u0648\u0648", "bbox": {"l": 75.18513527879021, "t": 597.5312820654094, "r": 86.63702432125439, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "\u0648\u0648", "bbox": {"l": 86.68895732144696, "t": 597.5312820654094, "r": 89.51946333194262, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "\u062d\u0644\u0627", "bbox": {"l": 89.55841833208707, "t": 597.5312820654094, "r": 106.3337403942908, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "\u062a\u062e\u0648\u0648\u0648", "bbox": {"l": 103.28368038298102, "t": 597.5312820654094, "r": 127.52363047286396, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "\u0633\u0627\u0648 \u062a\u062e\u064a\u0648\u0648\u0648\u0635\u0648\u062a\u0648 \u060c", "bbox": {"l": 127.56258047300838, "t": 597.5312820654094, "r": 214.76315079635242, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "\u0643\u064a\u0627\u0644", "bbox": {"l": 91.17600333808515, "t": 616.2866921302387, "r": 114.98352042636462, "b": 629.2467021750359, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "\u0627 \u062a\u062e \u0627\u0648\u0648\u0635\u064a\u0644 \u0627\u0647\u060c\u0648\u0648\u0648\u0644\u0627 \u0627\u0645\u062e\u0648\u0648\u0646\u0631\u0628\u0644\u0627\u0648 \u060c\u062a\u0627\u0631\u0627 ", "bbox": {"l": 114.93168042617239, "t": 616.2866921302387, "r": 303.07190112380573, "b": 629.2467021750359, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "\u0648\u0648\u0648", "bbox": {"l": 303.1107811239498, "t": 616.2866921302387, "r": 311.57367115533066, "b": 629.2467021750359, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "\u0644\u0627", "bbox": {"l": 311.6125511554748, "t": 616.2866921302387, "r": 322.27216119500116, "b": 629.2467021750359, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "\u062a", "bbox": {"l": 319.22656118370793, "t": 616.2866921302387, "r": 332.9317612345275, "b": 629.2467021750359, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "\u062e", "bbox": {"l": 332.9576712346236, "t": 616.2866921302387, "r": 336.7420012486561, "b": 629.2467021750359, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "\u0641\u062f\u0627", "bbox": {"l": 336.78088124880026, "t": 616.2866921302387, "r": 359.1757513318415, "b": 629.2467021750359, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "\u0644\u0648\u0648", "bbox": {"l": 359.2016613319376, "t": 616.2866921302387, "r": 365.26694135442796, "b": 629.2467021750359, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "\u0633\u0645\u0648", "bbox": {"l": 365.3058213545721, "t": 616.2866921302387, "r": 392.46997145529815, "b": 629.2467021750359, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": " \u060c\u0627\u0647\u060c\u0648\u0648\u0648\u0644\u0627", "bbox": {"l": 392.431091455154, "t": 616.2866921302387, "r": 437.0264616205159, "b": 629.2467021750359, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "\u060c\u0629\u0648\u0648", "bbox": {"l": 72.94919627049924, "t": 616.2866921302387, "r": 82.44239030570048, "b": 629.2467021750359, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "\u064a", "bbox": {"l": 82.48127030584465, "t": 616.2866921302387, "r": 86.84879332203964, "b": 629.2467021750359, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "\u0627", "bbox": {"l": 86.79695132184742, "t": 616.2866921302387, "r": 91.12559533789825, "b": 629.2467021750359, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "\u0629\u064a\u0647\u060c", "bbox": {"l": 276.1200010238667, "t": 635.0067021949458, "r": 302.3251311210366, "b": 647.966702239743, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "\u0648\u0644\u0627", "bbox": {"l": 302.27328112084433, "t": 635.0067021949458, "r": 318.1881711798576, "b": 647.966702239743, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "\u062a\u062e", "bbox": {"l": 315.29456116912786, "t": 635.0067021949458, "r": 334.1030612388708, "b": 647.966702239743, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "\u064a", "bbox": {"l": 334.18082123915906, "t": 635.0067021949458, "r": 338.5483412553541, "b": 647.966702239743, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "\u062c\u064a\u062a\u0627", "bbox": {"l": 338.4964912551618, "t": 635.0067021949458, "r": 358.23456132835156, "b": 647.966702239743, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "\u0631\u0644\u0633\u062d\u0627 \u0641\u0627\u0644\u0628\u0645\u0648", "bbox": {"l": 358.2864113285438, "t": 635.0067021949458, "r": 437.29059162149525, "b": 647.966702239743, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": ".", "bbox": {"l": 272.6400110109627, "t": 635.0067021949458, "r": 276.0614610236496, "b": 647.966702239743, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "text", "bbox": {"l": 69.09600125621141, "t": 507.4266917539564, "r": 437.3132016215791, "b": 534.1167018462124, "coord_origin": "TOPLEFT"}, "confidence": 0.5769620537757874, "cells": [{"id": 134, "text": " \u0646\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0645", "bbox": {"l": 167.78000062213658, "t": 507.4266917539564, "r": 199.8948707412201, "b": 520.3866917987535, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "\u0645\u0627", "bbox": {"l": 199.92079074131624, "t": 507.4266917539564, "r": 211.63663078475915, "b": 520.3866917987535, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "\u0629\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u064a\u0627", "bbox": {"l": 221.8685508226996, "t": 507.4266917539564, "r": 241.72971089634578, "b": 520.3866917987535, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "\u0645 ", "bbox": {"l": 241.67787089615356, "t": 507.4266917539564, "r": 257.411320954494, "b": 520.3866917987535, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "\u0631\u0640", "bbox": {"l": 179.26880066473763, "t": 519.9067017970945, "r": 187.75760069621452, "b": 532.8667018418917, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "\u0635\u0645", "bbox": {"l": 187.79648069635869, "t": 519.9067017970945, "r": 209.58224077714138, "b": 532.8667018418917, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "\u0644\u0627", "bbox": {"l": 209.51744077690105, "t": 519.9067017970945, "r": 216.90465080429323, "b": 532.8667018418917, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": " \u064a\u0645", "bbox": {"l": 216.94353080443742, "t": 519.9067017970945, "r": 235.95586087493606, "b": 532.8667018418917, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "\u0648\u0642\u0644", "bbox": {"l": 235.99474087508025, "t": 519.9067017970945, "r": 254.0609709420707, "b": 532.8667018418917, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "\u0627", "bbox": {"l": 254.09985094221489, "t": 519.9067017970945, "r": 257.54721095499787, "b": 532.8667018418917, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": " \u0627\u0640\u0640\u0640\u0640\u0633\u0646 \u0627 \u0621\u0627\u0640\u0640\u0640\u0640", "bbox": {"l": 362.20999134309267, "t": 508.6766917582771, "r": 428.6688815895255, "b": 521.6366918030742, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "\u0646\u0628", "bbox": {"l": 428.7077615896697, "t": 508.6766917582771, "r": 437.3132016215791, "b": 521.6366918030742, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "\u0631\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0635\u0645", "bbox": {"l": 367.6023913630879, "t": 521.1567018014152, "r": 429.6149015930334, "b": 534.1167018462124, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "\u0644\u0627", "bbox": {"l": 429.5501115927932, "t": 521.1567018014152, "r": 436.93732162018534, "b": 534.1167018462124, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": " \u0639\u0627\u0640\u0640\u0640\u0640\u0640\u0635\u062a", "bbox": {"l": 270.07001100143304, "t": 507.4266917539564, "r": 308.6001011443045, "b": 520.3866917987535, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "\u0627 \u0621\u0627\u0640\u0640\u0640\u0640\u0640", "bbox": {"l": 331.3538212286764, "t": 507.4266917539564, "r": 340.23544126160994, "b": 520.3866917987535, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "\u0646\u0628", "bbox": {"l": 340.2743212617541, "t": 507.4266917539564, "r": 348.8797612936635, "b": 520.3866917987535, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "\u064a\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0633\u0628\u0627", "bbox": {"l": 273.0700110125572, "t": 519.9067017970945, "r": 340.08609126105614, "b": 532.8667018418917, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "\u0646\u062a", "bbox": {"l": 340.0213012608159, "t": 519.9067017970945, "r": 348.6267412927253, "b": 532.8667018418917, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "\u0642\u062a\u0633\u0638\u0627", "bbox": {"l": 85.41600031672677, "t": 508.33670175710193, "r": 117.0141004338941, "b": 521.296691801899, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "\u0642", "bbox": {"l": 129.65334048076102, "t": 508.33670175710193, "r": 135.9729605041945, "b": 521.296691801899, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "\u064a\u0642\u062d\u062a", "bbox": {"l": 136.02480050438672, "t": 508.33670175710193, "r": 160.44144059492484, "b": 521.296691801899, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": " \u0631\u0627 \u0631", "bbox": {"l": 69.09600125621141, "t": 508.33670175710193, "r": 85.41264331671432, "b": 521.296691801899, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "\u064a\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0633\u0627\u064a", "bbox": {"l": 72.09600126733555, "t": 520.81671180024, "r": 138.94359051520973, "b": 533.7767018450371, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "\u0633\u0644\u0627", "bbox": {"l": 138.8787805149694, "t": 520.81671180024, "r": 159.95175059310904, "b": 533.7767018450371, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "picture", "bbox": {"l": 446.4657287597656, "t": 200.7112274169922, "r": 595.0, "b": 650.6431884765625, "coord_origin": "TOPLEFT"}, "confidence": 0.6444889903068542, "cells": [], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "text", "id": 7, "page_no": 0, "cluster": {"id": 7, "label": "text", "bbox": {"l": 47.9520001778084, "t": 804.0922617794021, "r": 58.751999217855335, "b": 818.1322628279323, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 0, "text": "11", "bbox": {"l": 47.9520001778084, "t": 804.0922617794021, "r": 58.751999217855335, "b": 818.1322628279323, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "11"}, {"label": "text", "id": 0, "page_no": 0, "cluster": {"id": 0, "label": "text", "bbox": {"l": 67.9919972521177, "t": 209.65674072469346, "r": 437.42722162200187, "b": 419.32669144943253, "coord_origin": "TOPLEFT"}, "confidence": 0.9685260057449341, "cells": [{"id": 1, "text": " \u060c\u0647\u064a\u0644\u0639\u0648", "bbox": {"l": 399.260011480476, "t": 209.65674072469346, "r": 437.42722162200187, "b": 222.61670076949054, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "\u0645\u0644\u0627 \u0629\u0648\u0627", "bbox": {"l": 101.00520037453231, "t": 209.65674072469346, "r": 126.82584047027652, "b": 222.61670076949054, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "\u0631\u0645\u0644\u0627 \u0644\u0627\u0648\u0644 \u062e\u0648\u0627\u0647\u064a\u064a\u0639", "bbox": {"l": 130.05289048224256, "t": 209.65674072469346, "r": 229.27513085016358, "b": 222.61670076949054, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "\u0648\u0648\u0635", "bbox": {"l": 240.66298089239032, "t": 209.65674072469346, "r": 258.55817095874653, "b": 222.61670076949054, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "\u0639\u0636\u062a", "bbox": {"l": 265.06552098287614, "t": 209.65674072469346, "r": 281.6825010444927, "b": 222.61670076949054, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "\u0629\u064a\u0631\u0635", "bbox": {"l": 286.3310210617297, "t": 209.65674072469346, "r": 314.70044116692486, "b": 222.61670076949054, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "\u0645", "bbox": {"l": 314.739321167069, "t": 209.65674072469346, "r": 323.0726011979693, "b": 222.61670076949054, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "\u0644\u0627", "bbox": {"l": 323.02075119777703, "t": 209.65674072469346, "r": 330.06061122388115, "b": 222.61670076949054, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "\u0629\u0645\u0648\u0643\u062d", "bbox": {"l": 333.2073112355493, "t": 209.65674072469346, "r": 369.27499136929003, "b": 222.61670076949054, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "\u0644\u0627 ", "bbox": {"l": 369.3138713694342, "t": 209.65674072469346, "r": 379.37082140672584, "b": 222.61670076949054, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "\u0646\u0625\u0641", "bbox": {"l": 379.50043140720646, "t": 209.65674072469346, "r": 398.9274614792428, "b": 222.61670076949054, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "\u0629\u0648", "bbox": {"l": 78.1863332899188, "t": 209.65674072469346, "r": 79.31903829411894, "b": 222.61670076949054, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "\u0627\u0628", "bbox": {"l": 79.3838352943592, "t": 209.65674072469346, "r": 88.079994326605, "b": 222.61670076949054, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "\u0644\u0623\u0627", "bbox": {"l": 102.7000003808167, "t": 231.61676080059988, "r": 113.81968042204905, "b": 244.57672084539684, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "\u0646\u0645 \u062f\u062f\u064a \u0642\u064a \u062d\u062a \u0649\u0627\u064a \u0644\u0645\u0639\u0644\u062e\u0628 \u062e\u0627\u0644 \u0629\u064a\u0631", "bbox": {"l": 117.07263043411113, "t": 231.61676080059988, "r": 294.7153310928191, "b": 244.57672084539684, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "\u0648\u0627\u0645", "bbox": {"l": 294.75421109296326, "t": 231.61676080059988, "r": 318.5617411812428, "b": 244.57672084539684, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "\u062c\u0644\u0627", "bbox": {"l": 318.5098911810505, "t": 231.61676080059988, "r": 333.0000912347809, "b": 244.57672084539684, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "\u0633\u064a", "bbox": {"l": 337.2111512503957, "t": 231.61676080059988, "r": 359.59308133338897, "b": 244.57672084539684, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "\u0626\u0631 ", "bbox": {"l": 359.5282913331488, "t": 231.61676080059988, "r": 370.3110413731318, "b": 244.57672084539684, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "\u062f", "bbox": {"l": 370.5443113739967, "t": 231.61676080059988, "r": 377.2187213987458, "b": 244.57672084539684, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "\u064a\u0633\u0644\u0627 \u0641\u064a\u0627\u0643\u062a", "bbox": {"l": 377.25760139888996, "t": 231.61676080059988, "r": 437.04208162057375, "b": 244.57672084539684, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "\u0627", "bbox": {"l": 83.34959430906444, "t": 231.61676080059988, "r": 86.42111232045377, "b": 244.57672084539684, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "\u062f\u0648", "bbox": {"l": 86.48590932069406, "t": 231.61676080059988, "r": 94.70254535116175, "b": 244.57672084539684, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "\u0647", "bbox": {"l": 94.74142535130592, "t": 231.61676080059988, "r": 102.67294038071637, "b": 244.57672084539684, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": " :\u062e\u0627\u0633\u0639\u0631 \u0649\u0627\u064a", "bbox": {"l": 375.9800113941526, "t": 253.45672087609114, "r": 437.31921162160137, "b": 266.4166809208882, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "\u0648\u064a\u0648\u0644\u0648\u0644\u0623\u0627 \u0629\u0648\u0645\u0626\u062e\u0642 \u0633\u0639\u0631 \u0649\u0627", "bbox": {"l": 89.13600233052074, "t": 253.45672087609114, "r": 199.6070607401529, "b": 266.4166809208882, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "\u064a", "bbox": {"l": 199.56818074000876, "t": 253.45672087609114, "r": 206.72209076653579, "b": 266.4166809208882, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "\u064a\u0631\u0635\u0645\u0644\u0627 \u0646\u062e\u0633\u0646\u0644\u0625\u0627 \u0621\u062e\u0647\u0628 ", "bbox": {"l": 222.04082082333838, "t": 253.45672087609114, "r": 321.0293311903927, "b": 266.4166809208882, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "\u0641\u0627\u0645", "bbox": {"l": 321.1459711908252, "t": 253.45672087609114, "r": 342.4485212698161, "b": 266.4166809208882, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "\u0639\u0636\u0648", "bbox": {"l": 348.3749412917916, "t": 253.45672087609114, "r": 375.73349139323847, "b": 266.4166809208882, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "\u060c", "bbox": {"l": 72.94919627049924, "t": 253.45672087609114, "r": 73.94063627417555, "b": 266.4166809208882, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "\u062a\u062e", "bbox": {"l": 73.97951527431972, "t": 253.45672087609114, "r": 89.02607733011313, "b": 266.4166809208882, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": " \u0648\u0648\u0648\u0645\u0646 \u062a\u062d\u062f\u0648\u0648\u0639\u0645 \u0642\u0648\u0648\u064a \u062d\u062a", "bbox": {"l": 67.9919972521177, "t": 275.2967509515828, "r": 179.1887806644409, "b": 288.25671099637975, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "\u0649\u0648\u0648", "bbox": {"l": 190.77632070740808, "t": 275.2967509515828, "r": 192.97821071557277, "b": 288.25671099637975, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "\u0627\u064a", "bbox": {"l": 193.01709071571696, "t": 275.2967509515828, "r": 203.23216075359494, "b": 288.25671099637975, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "\u0644\u0648", "bbox": {"l": 207.64893076997257, "t": 275.2967509515828, "r": 218.53532081033984, "b": 288.25671099637975, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "\u0648\u0645", "bbox": {"l": 217.84845080779291, "t": 275.2967509515828, "r": 227.72397084441184, "b": 288.25671099637975, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "\u0639\u0644\u0627", "bbox": {"l": 227.6721308442196, "t": 275.2967509515828, "r": 241.0490108938217, "b": 288.25671099637975, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "\u060c\u0644\u064a\u0648\u0648\u0627\u0639\u0644\u0644\u0627\u0648 \u0629\u062d\u0648\u0648\u0635\u0644\u0627 \u062a\u062d\u062e\u0648\u0648\u062c\u0645 \u0627\u0648\u0648\u0641 \u0629\u0648\u0648\u0635\u062e\u0644", "bbox": {"l": 233.752530866766, "t": 275.2967509515828, "r": 437.0279516205213, "b": 288.25671099637975, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": " \u0649\u0648\u0648\u0648\u0648\u0627\u064a", "bbox": {"l": 67.9919972521177, "t": 297.16675102717795, "r": 96.06932135622982, "b": 310.126711071975, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "\u062e\u0648\u0648\u0648\u0648 \u062d\u0644\u0627 \u0627 \u0648\u0648\u0648\u0648", "bbox": {"l": 103.08865038225784, "t": 297.16675102717795, "r": 159.24330059048208, "b": 310.126711071975, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "\u0648 \u060c\u062a\u062e\u0648\u0648\u0648\u0648", "bbox": {"l": 187.1299706938872, "t": 297.16675102717795, "r": 197.68263073301702, "b": 310.126711071975, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "\u064a", "bbox": {"l": 197.72151073316118, "t": 297.16675102717795, "r": 204.87543075968827, "b": 310.126711071975, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "\u062e\u0644", "bbox": {"l": 204.91431075983246, "t": 297.16675102717795, "r": 214.81445079654264, "b": 310.126711071975, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "\u0644\u0627", "bbox": {"l": 239.12222088667707, "t": 297.16675102717795, "r": 244.1863409054551, "b": 310.126711071975, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "\u0641\u0648\u0648\u0648\u0648\u0627\u0630\u0639 \u0627\u0648\u0648\u0648\u0648\u0641 \u0629\u0627\u0645\u062e\u0648\u0648\u0648\u0648 \u0648 \u0629\u0645\u0627\u062f\u0644\u0648\u0648\u0648\u0648\u0633\u0645\u0648 \u0629\u0648\u0648\u0648\u0648\u064a\u0648\u0642", "bbox": {"l": 242.73946090009002, "t": 297.16675102717795, "r": 436.91122162008855, "b": 310.126711071975, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "\u0648\u0648", "bbox": {"l": 80.7360002993731, "t": 319.0067111026693, "r": 82.4855963058607, "b": 331.9666711474664, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "\u064a\u0644\u0648\u062f\u0644\u0627\u0648 \u0629\u0648\u0648\u064a\u0645\u064a\u0627\u0642\u0644\u0625\u0627 \u062a\u062e\u064a\u062f\u0648\u0648", "bbox": {"l": 82.52447530600485, "t": 319.0067111026693, "r": 198.30913073534012, "b": 331.9666711474664, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "\u062d\u0644\u0644", "bbox": {"l": 198.34801073548428, "t": 319.0067111026693, "r": 214.84608079665995, "b": 331.9666711474664, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "\u0627 \u0621\u0648\u0648\u0648\u0636 \u0627\u0648\u0648\u0641 \u064a\u0631\u0648\u0648\u0635\u0645\u0644\u0627", "bbox": {"l": 214.79425079646776, "t": 319.0067111026693, "r": 317.88953117875013, "b": 331.9666711474664, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "\u0627\u0645\u0648\u0648\u0648", "bbox": {"l": 330.88440122693584, "t": 319.0067111026693, "r": 342.81308127116796, "b": 331.9666711474664, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": " \u0644\u0627 \u0646\u0648\u0648\u0645\u0644\u0623\u0627 \u062a\u0627\u062f\u062f\u0648\u0648\u062d\u0645", "bbox": {"l": 342.8519612713121, "t": 319.0067111026693, "r": 437.0582616206338, "b": 331.9666711474664, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "\u060c\u0629", "bbox": {"l": 72.94919627049924, "t": 319.0067111026693, "r": 80.6927952992129, "b": 331.9666711474664, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "\u0648\u0648", "bbox": {"l": 86.25599731984153, "t": 340.84671117816094, "r": 88.48510732810718, "b": 353.806701222958, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "\u0627\u0645 \u0629\u0648\u0648\u0639\u0628\u062e\u0644\u0645 \u0631\u0627\u0631\u0645\u0644\u0648\u0648\u0633\u0627\u0648 \u060c\u0629\u064a\u0648\u0648\u0633\u062e\u064a\u0633\u0644\u0627 \u0629 \u0631\u062e\u0648\u0648\u0627\u0645\u0644\u0627 \u0631", "bbox": {"l": 117.17401043448704, "t": 340.84671117816094, "r": 322.67236119648516, "b": 353.806701222958, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "\u064a", "bbox": {"l": 322.7371511967254, "t": 340.84671117816094, "r": 326.5214812107579, "b": 353.806701222958, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "\u0648\u0648", "bbox": {"l": 326.56036121090204, "t": 340.84671117816094, "r": 334.78998124141793, "b": 353.806701222958, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "\u0648", "bbox": {"l": 333.88278123805395, "t": 340.84671117816094, "r": 335.38614124362846, "b": 353.806701222958, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "\u0644\u062a", "bbox": {"l": 335.4250212437726, "t": 340.84671117816094, "r": 348.4161112919443, "b": 353.806701222958, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "\u062f", "bbox": {"l": 354.00964131268535, "t": 340.84671117816094, "r": 359.8286713342626, "b": 353.806701222958, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "\u0648\u0648\u0648\u0627\u0648 \u0629\u0627\u0648\u0648\u0635\u0627\u0648\u0645\u0648", "bbox": {"l": 359.7638913340224, "t": 340.84671117816094, "r": 436.99252162039, "b": 353.806701222958, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "\u062a\u062e", "bbox": {"l": 84.35918431280804, "t": 340.84671117816094, "r": 86.1777573195514, "b": 353.806701222958, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "\u0627\u064a\u0648\u0648\u0648\u0648", "bbox": {"l": 93.20639834561395, "t": 362.68670125365236, "r": 97.68335736221475, "b": 375.6467012984495, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "\u0644\u0627\u0648", "bbox": {"l": 97.72223736235891, "t": 362.68670125365236, "r": 110.05368040808452, "b": 375.6467012984495, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "\u0629\u0648\u0648\u0648\u0641\u062e \u0644\u0627 \u062a\u062e\u0648\u0648\u0648 \u0627\u0645 \u0631\u064a\u0648\u0648\u0648\u0648\u0644\u062a \u060c \u062e\u0648\u0648\u0648\u0647\u0631\u0644\u0625\u0627 \u0629\u0648\u0648\u0648\u062d\u0641\u062e", "bbox": {"l": 107.81160039977077, "t": 362.68670125365236, "r": 319.73993118561157, "b": 375.6467012984495, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "\u0643\u0645\u0648", "bbox": {"l": 319.7788111857557, "t": 362.68670125365236, "r": 336.7513712486908, "b": 375.6467012984495, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "\u0631", "bbox": {"l": 327.4936212143627, "t": 362.68670125365236, "r": 347.5520912887404, "b": 375.6467012984495, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "\u0627\u0631", "bbox": {"l": 347.6039412889327, "t": 362.68670125365236, "r": 355.45767131805474, "b": 375.6467012984495, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "\u0644\u0648\u0648\u0648\u0633\u062d\u0627\u0648 \u0646\u0648\u0648\u0648\u0645\u0644\u0623\u0627", "bbox": {"l": 365.14093135396075, "t": 362.68670125365236, "r": 436.85941161989643, "b": 375.6467012984495, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "\u0644\u064a", "bbox": {"l": 77.3555982868384, "t": 384.52670132914386, "r": 83.62175831007363, "b": 397.486691373941, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "\u0647\u062e\u0648\u0648\u0648 \u0645 \u0648\u0648\u0648\u0633\u0631\u064a \u064a \u0648\u0648\u0648\u0644\u0627 \u0648\u0648\u0648\u0648", "bbox": {"l": 83.56991630988142, "t": 384.52670132914386, "r": 197.09950073085474, "b": 397.486691373941, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "\u062d\u0647\u0644", "bbox": {"l": 197.13838073099893, "t": 384.52670132914386, "r": 213.63646079217463, "b": 397.486691373941, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "\u0627 \u0649\u0648\u0648\u0648\u0627\u064a \u0644\u062f\u0648\u0648\u0648\u0644\u0639\u0645\u0644\u0627 \u0627\u0647\u064a\u062f\u0648\u0648\u0648", "bbox": {"l": 213.58463079198242, "t": 384.52670132914386, "r": 326.4273712104089, "b": 397.486691373941, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "\u0644\u0627", "bbox": {"l": 326.4662512105531, "t": 384.52670132914386, "r": 341.38971126589, "b": 397.486691373941, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "\u062e\u0648\u0648\u0648\u0644\u0628\u0644\u0627\u0648 \u060c\u0627\u0647\u060c\u0648\u0648\u0648\u0648\u0644\u0627", "bbox": {"l": 347.81137128970187, "t": 384.52670132914386, "r": 436.88547161999304, "b": 397.486691373941, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": ".\u0627\u0639\u0645\u0644\u062c\u0645\u0644\u0627 \u0645\u0627\u0633\u0644\u0627\u0648 \u0629\u0647\u060c\u0627\u0648\u0645\u0644\u0627", "bbox": {"l": 284.1600010536794, "t": 406.3667014046354, "r": 437.30203162153765, "b": 419.32669144943253, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u060c\u0647\u064a\u0644\u0639\u0648 \u0645\u0644\u0627 \u0629\u0648\u0627 \u0631\u0645\u0644\u0627 \u0644\u0627\u0648\u0644 \u062e\u0648\u0627\u0647\u064a\u064a\u0639 \u0648\u0648\u0635 \u0639\u0636\u062a \u0629\u064a\u0631\u0635 \u0645 \u0644\u0627 \u0629\u0645\u0648\u0643\u062d \u0644\u0627 \u0646\u0625\u0641 \u0629\u0648 \u0627\u0628 \u0644\u0623\u0627 \u0646\u0645 \u062f\u062f\u064a \u0642\u064a \u062d\u062a \u0649\u0627\u064a \u0644\u0645\u0639\u0644\u062e\u0628 \u062e\u0627\u0644 \u0629\u064a\u0631 \u0648\u0627\u0645 \u062c\u0644\u0627 \u0633\u064a \u0626\u0631 \u062f \u064a\u0633\u0644\u0627 \u0641\u064a\u0627\u0643\u062a \u0627 \u062f\u0648 \u0647 :\u062e\u0627\u0633\u0639\u0631 \u0649\u0627\u064a \u0648\u064a\u0648\u0644\u0648\u0644\u0623\u0627 \u0629\u0648\u0645\u0626\u062e\u0642 \u0633\u0639\u0631 \u0649\u0627 \u064a \u064a\u0631\u0635\u0645\u0644\u0627 \u0646\u062e\u0633\u0646\u0644\u0625\u0627 \u0621\u062e\u0647\u0628 \u0641\u0627\u0645 \u0639\u0636\u0648 \u060c \u062a\u062e \u0648\u0648\u0648\u0645\u0646 \u062a\u062d\u062f\u0648\u0648\u0639\u0645 \u0642\u0648\u0648\u064a \u062d\u062a \u0649\u0648\u0648 \u0627\u064a \u0644\u0648 \u0648\u0645 \u0639\u0644\u0627 \u060c\u0644\u064a\u0648\u0648\u0627\u0639\u0644\u0644\u0627\u0648 \u0629\u062d\u0648\u0648\u0635\u0644\u0627 \u062a\u062d\u062e\u0648\u0648\u062c\u0645 \u0627\u0648\u0648\u0641 \u0629\u0648\u0648\u0635\u062e\u0644 \u0649\u0648\u0648\u0648\u0648\u0627\u064a \u062e\u0648\u0648\u0648\u0648 \u062d\u0644\u0627 \u0627 \u0648\u0648\u0648\u0648 \u0648 \u060c\u062a\u062e\u0648\u0648\u0648\u0648 \u064a \u062e\u0644 \u0644\u0627 \u0641\u0648\u0648\u0648\u0648\u0627\u0630\u0639 \u0627\u0648\u0648\u0648\u0648\u0641 \u0629\u0627\u0645\u062e\u0648\u0648\u0648\u0648 \u0648 \u0629\u0645\u0627\u062f\u0644\u0648\u0648\u0648\u0648\u0633\u0645\u0648 \u0629\u0648\u0648\u0648\u0648\u064a\u0648\u0642 \u0648\u0648 \u064a\u0644\u0648\u062f\u0644\u0627\u0648 \u0629\u0648\u0648\u064a\u0645\u064a\u0627\u0642\u0644\u0625\u0627 \u062a\u062e\u064a\u062f\u0648\u0648 \u062d\u0644\u0644 \u0627 \u0621\u0648\u0648\u0648\u0636 \u0627\u0648\u0648\u0641 \u064a\u0631\u0648\u0648\u0635\u0645\u0644\u0627 \u0627\u0645\u0648\u0648\u0648 \u0644\u0627 \u0646\u0648\u0648\u0645\u0644\u0623\u0627 \u062a\u0627\u062f\u062f\u0648\u0648\u062d\u0645 \u060c\u0629 \u0648\u0648 \u0627\u0645 \u0629\u0648\u0648\u0639\u0628\u062e\u0644\u0645 \u0631\u0627\u0631\u0645\u0644\u0648\u0648\u0633\u0627\u0648 \u060c\u0629\u064a\u0648\u0648\u0633\u062e\u064a\u0633\u0644\u0627 \u0629 \u0631\u062e\u0648\u0648\u0627\u0645\u0644\u0627 \u0631 \u064a \u0648\u0648 \u0648 \u0644\u062a \u062f \u0648\u0648\u0648\u0627\u0648 \u0629\u0627\u0648\u0648\u0635\u0627\u0648\u0645\u0648 \u062a\u062e \u0627\u064a\u0648\u0648\u0648\u0648 \u0644\u0627\u0648 \u0629\u0648\u0648\u0648\u0641\u062e \u0644\u0627 \u062a\u062e\u0648\u0648\u0648 \u0627\u0645 \u0631\u064a\u0648\u0648\u0648\u0648\u0644\u062a \u060c \u062e\u0648\u0648\u0648\u0647\u0631\u0644\u0625\u0627 \u0629\u0648\u0648\u0648\u062d\u0641\u062e \u0643\u0645\u0648 \u0631 \u0627\u0631 \u0644\u0648\u0648\u0648\u0633\u062d\u0627\u0648 \u0646\u0648\u0648\u0648\u0645\u0644\u0623\u0627 \u0644\u064a \u0647\u062e\u0648\u0648\u0648 \u0645 \u0648\u0648\u0648\u0633\u0631\u064a \u064a \u0648\u0648\u0648\u0644\u0627 \u0648\u0648\u0648\u0648 \u062d\u0647\u0644 \u0627 \u0649\u0648\u0648\u0648\u0627\u064a \u0644\u062f\u0648\u0648\u0648\u0644\u0639\u0645\u0644\u0627 \u0627\u0647\u064a\u062f\u0648\u0648\u0648 \u0644\u0627 \u062e\u0648\u0648\u0648\u0644\u0628\u0644\u0627\u0648 \u060c\u0627\u0647\u060c\u0648\u0648\u0648\u0648\u0644\u0627 .\u0627\u0639\u0645\u0644\u062c\u0645\u0644\u0627 \u0645\u0627\u0633\u0644\u0627\u0648 \u0629\u0647\u060c\u0627\u0648\u0645\u0644\u0627"}, {"label": "text", "id": 2, "page_no": 0, "cluster": {"id": 2, "label": "text", "bbox": {"l": 74.51999727632386, "t": 433.9166814998638, "r": 440.883241634817, "b": 465.596681609368, "coord_origin": "TOPLEFT"}, "confidence": 0.9393879771232605, "cells": [{"id": 77, "text": " \u0631\u0648\u0644 \u0644\u0627 \u0644\u0627\u0648\u0644 \u0629\u064a\u0631\u0648", "bbox": {"l": 107.16000039735461, "t": 433.9166814998638, "r": 187.44720069506354, "b": 446.876681544661, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "\u0635", "bbox": {"l": 187.4860806952077, "t": 433.9166814998638, "r": 200.6404907439849, "b": 446.876681544661, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "\u0645", "bbox": {"l": 200.67937074412907, "t": 433.9166814998638, "r": 209.0126507750293, "b": 446.876681544661, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "\u0644\u0627", "bbox": {"l": 208.96082077483712, "t": 433.9166814998638, "r": 216.06721080118794, "b": 446.876681544661, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "\u0629\u0648", "bbox": {"l": 218.09763080871687, "t": 433.9166814998638, "r": 227.2344208425965, "b": 446.876681544661, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "\u0645\u0648\u0643\u062d\u0644\u0627 \u0627\u0645\u062e\u0648\u0646\u0631\u0628", "bbox": {"l": 227.3121808428849, "t": 433.9166814998638, "r": 310.7486611522715, "b": 446.876681544661, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "\u062f\u0627\u0644\u0648\u0633\u064a \u060c\u0642\u0628\u0633 \u062e\u0645\u0644 \u062e\u064b \u0641\u0648\u0648", "bbox": {"l": 321.5573111923505, "t": 433.9166814998638, "r": 440.45236163321925, "b": 446.876681544661, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "2024(", "bbox": {"l": 81.36000130168694, "t": 433.9166814998638, "r": 104.00928038567159, "b": 446.876681544661, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "-", "bbox": {"l": 74.51999727632386, "t": 433.9166814998638, "r": 78.09695428958737, "b": 446.876681544661, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": " )2026", "bbox": {"l": 414.79001153806195, "t": 452.63669156457087, "r": 440.883241634817, "b": 465.596681609368, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "\u0627\u062a\u0644\u0622\u0627 \u0648\u062d\u0647\u0644\u0627 \u0649\u0627\u064a \u0627\u0647\u0648 \u060c\u0629\u0633\u064a\u0626\u0631 \u0629\u064a\u062c\u064a\u062a\u0627\u0631\u0644\u0633\u0627 \u0627\u062f", "bbox": {"l": 113.40000042049283, "t": 452.63669156457087, "r": 336.75259124869535, "b": 465.596681609368, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "\u0647\u0639", "bbox": {"l": 336.7914712488395, "t": 452.63669156457087, "r": 347.26965128769314, "b": 465.596681609368, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "\u0629\u0639\u0628\u0631\u0639 \u0642\u064a \u062d\u062a", "bbox": {"l": 344.2758812765921, "t": 452.63669156457087, "r": 414.4348115367449, "b": 465.596681609368, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": ":", "bbox": {"l": 110.52000040981365, "t": 452.63669156457087, "r": 113.42303042057824, "b": 465.596681609368, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u0631\u0648\u0644 \u0644\u0627 \u0644\u0627\u0648\u0644 \u0629\u064a\u0631\u0648 \u0635 \u0645 \u0644\u0627 \u0629\u0648 \u0645\u0648\u0643\u062d\u0644\u0627 \u0627\u0645\u062e\u0648\u0646\u0631\u0628 \u062f\u0627\u0644\u0648\u0633\u064a \u060c\u0642\u0628\u0633 \u062e\u0645\u0644 \u062e\u064b \u0641\u0648\u0648 2024( -)2026 \u0627\u062a\u0644\u0622\u0627 \u0648\u062d\u0647\u0644\u0627 \u0649\u0627\u064a \u0627\u0647\u0648 \u060c\u0629\u0633\u064a\u0626\u0631 \u0629\u064a\u062c\u064a\u062a\u0627\u0631\u0644\u0633\u0627 \u0627\u062f \u0647\u0639 \u0629\u0639\u0628\u0631\u0639 \u0642\u064a \u062d\u062a :"}, {"label": "text", "id": 1, "page_no": 0, "cluster": {"id": 1, "label": "text", "bbox": {"l": 72.94919627049924, "t": 578.8267220007557, "r": 437.29059162149525, "b": 647.966702239743, "coord_origin": "TOPLEFT"}, "confidence": 0.9558618068695068, "cells": [{"id": 91, "text": "\u062e\u0647\u0644\u0648\u0633\u062d\u062e\u0628 \u0627\u0645\u062e\u0648\u0646\u0631\u0628", "bbox": {"l": 115.18000042709316, "t": 578.8267220007557, "r": 194.85806072254337, "b": 591.7867120455528, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "\u0644\u0627", "bbox": {"l": 194.8062307223512, "t": 578.8267220007557, "r": 205.46582076187747, "b": 591.7867120455528, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "\u062a", "bbox": {"l": 202.42023075058427, "t": 578.8267220007557, "r": 216.12543080140384, "b": 591.7867120455528, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "\u062e\u0641\u062f\u0627\u0644\u0648\u0633\u0645 \u062f\u064a\u062f\u062d\u062a \u0644\u062a \u062f\u0642", "bbox": {"l": 216.15135080149997, "t": 578.8267220007557, "r": 331.91013123073924, "b": 591.7867120455528, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "\u0647\u0646", "bbox": {"l": 337.0552412498176, "t": 578.8267220007557, "r": 347.5528312887431, "b": 591.7867120455528, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "\u0639 \u0649\u0644\u0625", "bbox": {"l": 347.6046812889354, "t": 578.8267220007557, "r": 372.38708138082984, "b": 591.7867120455528, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "\u0631\u062e \u0644\u0625\u0627 \u0631\u062f\u062c\u062a", "bbox": {"l": 382.3000514175876, "t": 578.8267220007557, "r": 436.8213216197552, "b": 591.7867120455528, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "\u0644\u0643\u0648\u0627\u0628 \u062f", "bbox": {"l": 87.43940032422965, "t": 578.8267220007557, "r": 115.1923104271388, "b": 591.7867120455528, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": " \u0631\u0648\u0648\u0648\u0635\u0645 \u0629\u0648", "bbox": {"l": 241.0800008939366, "t": 597.5312820654094, "r": 285.1217710572457, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "\u0648\u0648\u064a \u0631", "bbox": {"l": 285.18668105748645, "t": 597.5312820654094, "r": 302.2865911208937, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "\u062a\u062e", "bbox": {"l": 318.6840811816964, "t": 597.5312820654094, "r": 320.50314118844153, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "\u0641\u062f\u0627\u0644", "bbox": {"l": 320.54208118858594, "t": 597.5312820654094, "r": 347.354031288006, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "\u0648\u0648\u0648", "bbox": {"l": 347.3020912878134, "t": 597.5312820654094, "r": 351.67767130403826, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "\u0633", "bbox": {"l": 351.71661130418266, "t": 597.5312820654094, "r": 365.2199713542538, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "\u0645 \u0649\u0648\u0648\u0648", "bbox": {"l": 365.1550613540131, "t": 597.5312820654094, "r": 388.13672143923026, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "\u0627\u064a \u0633\u064a\u0648\u0648\u0648\u0626\u0631", "bbox": {"l": 388.1756614393746, "t": 597.5312820654094, "r": 437.1642516210267, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "2023", "bbox": {"l": 215.03999079737898, "t": 597.5312820654094, "r": 241.13783089415108, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "\u0631", "bbox": {"l": 73.95381227422442, "t": 597.5312820654094, "r": 75.14617927864577, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "\u0627\u0648\u0648", "bbox": {"l": 75.18513527879021, "t": 597.5312820654094, "r": 86.63702432125439, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "\u0648\u0648", "bbox": {"l": 86.68895732144696, "t": 597.5312820654094, "r": 89.51946333194262, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "\u062d\u0644\u0627", "bbox": {"l": 89.55841833208707, "t": 597.5312820654094, "r": 106.3337403942908, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "\u062a\u062e\u0648\u0648\u0648", "bbox": {"l": 103.28368038298102, "t": 597.5312820654094, "r": 127.52363047286396, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "\u0633\u0627\u0648 \u062a\u062e\u064a\u0648\u0648\u0648\u0635\u0648\u062a\u0648 \u060c", "bbox": {"l": 127.56258047300838, "t": 597.5312820654094, "r": 214.76315079635242, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "\u0643\u064a\u0627\u0644", "bbox": {"l": 91.17600333808515, "t": 616.2866921302387, "r": 114.98352042636462, "b": 629.2467021750359, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "\u0627 \u062a\u062e \u0627\u0648\u0648\u0635\u064a\u0644 \u0627\u0647\u060c\u0648\u0648\u0648\u0644\u0627 \u0627\u0645\u062e\u0648\u0648\u0646\u0631\u0628\u0644\u0627\u0648 \u060c\u062a\u0627\u0631\u0627 ", "bbox": {"l": 114.93168042617239, "t": 616.2866921302387, "r": 303.07190112380573, "b": 629.2467021750359, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "\u0648\u0648\u0648", "bbox": {"l": 303.1107811239498, "t": 616.2866921302387, "r": 311.57367115533066, "b": 629.2467021750359, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "\u0644\u0627", "bbox": {"l": 311.6125511554748, "t": 616.2866921302387, "r": 322.27216119500116, "b": 629.2467021750359, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "\u062a", "bbox": {"l": 319.22656118370793, "t": 616.2866921302387, "r": 332.9317612345275, "b": 629.2467021750359, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "\u062e", "bbox": {"l": 332.9576712346236, "t": 616.2866921302387, "r": 336.7420012486561, "b": 629.2467021750359, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "\u0641\u062f\u0627", "bbox": {"l": 336.78088124880026, "t": 616.2866921302387, "r": 359.1757513318415, "b": 629.2467021750359, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "\u0644\u0648\u0648", "bbox": {"l": 359.2016613319376, "t": 616.2866921302387, "r": 365.26694135442796, "b": 629.2467021750359, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "\u0633\u0645\u0648", "bbox": {"l": 365.3058213545721, "t": 616.2866921302387, "r": 392.46997145529815, "b": 629.2467021750359, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": " \u060c\u0627\u0647\u060c\u0648\u0648\u0648\u0644\u0627", "bbox": {"l": 392.431091455154, "t": 616.2866921302387, "r": 437.0264616205159, "b": 629.2467021750359, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "\u060c\u0629\u0648\u0648", "bbox": {"l": 72.94919627049924, "t": 616.2866921302387, "r": 82.44239030570048, "b": 629.2467021750359, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "\u064a", "bbox": {"l": 82.48127030584465, "t": 616.2866921302387, "r": 86.84879332203964, "b": 629.2467021750359, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "\u0627", "bbox": {"l": 86.79695132184742, "t": 616.2866921302387, "r": 91.12559533789825, "b": 629.2467021750359, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "\u0629\u064a\u0647\u060c", "bbox": {"l": 276.1200010238667, "t": 635.0067021949458, "r": 302.3251311210366, "b": 647.966702239743, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "\u0648\u0644\u0627", "bbox": {"l": 302.27328112084433, "t": 635.0067021949458, "r": 318.1881711798576, "b": 647.966702239743, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "\u062a\u062e", "bbox": {"l": 315.29456116912786, "t": 635.0067021949458, "r": 334.1030612388708, "b": 647.966702239743, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "\u064a", "bbox": {"l": 334.18082123915906, "t": 635.0067021949458, "r": 338.5483412553541, "b": 647.966702239743, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "\u062c\u064a\u062a\u0627", "bbox": {"l": 338.4964912551618, "t": 635.0067021949458, "r": 358.23456132835156, "b": 647.966702239743, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "\u0631\u0644\u0633\u062d\u0627 \u0641\u0627\u0644\u0628\u0645\u0648", "bbox": {"l": 358.2864113285438, "t": 635.0067021949458, "r": 437.29059162149525, "b": 647.966702239743, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": ".", "bbox": {"l": 272.6400110109627, "t": 635.0067021949458, "r": 276.0614610236496, "b": 647.966702239743, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u062e\u0647\u0644\u0648\u0633\u062d\u062e\u0628 \u0627\u0645\u062e\u0648\u0646\u0631\u0628 \u0644\u0627 \u062a \u062e\u0641\u062f\u0627\u0644\u0648\u0633\u0645 \u062f\u064a\u062f\u062d\u062a \u0644\u062a \u062f\u0642 \u0647\u0646 \u0639 \u0649\u0644\u0625 \u0631\u062e \u0644\u0625\u0627 \u0631\u062f\u062c\u062a \u0644\u0643\u0648\u0627\u0628 \u062f \u0631\u0648\u0648\u0648\u0635\u0645 \u0629\u0648 \u0648\u0648\u064a \u0631 \u062a\u062e \u0641\u062f\u0627\u0644 \u0648\u0648\u0648 \u0633 \u0645 \u0649\u0648\u0648\u0648 \u0627\u064a \u0633\u064a\u0648\u0648\u0648\u0626\u0631 2023 \u0631 \u0627\u0648\u0648 \u0648\u0648 \u062d\u0644\u0627 \u062a\u062e\u0648\u0648\u0648 \u0633\u0627\u0648 \u062a\u062e\u064a\u0648\u0648\u0648\u0635\u0648\u062a\u0648 \u060c \u0643\u064a\u0627\u0644 \u0627 \u062a\u062e \u0627\u0648\u0648\u0635\u064a\u0644 \u0627\u0647\u060c\u0648\u0648\u0648\u0644\u0627 \u0627\u0645\u062e\u0648\u0648\u0646\u0631\u0628\u0644\u0627\u0648 \u060c\u062a\u0627\u0631\u0627 \u0648\u0648\u0648 \u0644\u0627 \u062a \u062e \u0641\u062f\u0627 \u0644\u0648\u0648 \u0633\u0645\u0648 \u060c\u0627\u0647\u060c\u0648\u0648\u0648\u0644\u0627 \u060c\u0629\u0648\u0648 \u064a \u0627 \u0629\u064a\u0647\u060c \u0648\u0644\u0627 \u062a\u062e \u064a \u062c\u064a\u062a\u0627 \u0631\u0644\u0633\u062d\u0627 \u0641\u0627\u0644\u0628\u0645\u0648 ."}, {"label": "text", "id": 4, "page_no": 0, "cluster": {"id": 4, "label": "text", "bbox": {"l": 69.09600125621141, "t": 507.4266917539564, "r": 437.3132016215791, "b": 534.1167018462124, "coord_origin": "TOPLEFT"}, "confidence": 0.5769620537757874, "cells": [{"id": 134, "text": " \u0646\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0645", "bbox": {"l": 167.78000062213658, "t": 507.4266917539564, "r": 199.8948707412201, "b": 520.3866917987535, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "\u0645\u0627", "bbox": {"l": 199.92079074131624, "t": 507.4266917539564, "r": 211.63663078475915, "b": 520.3866917987535, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "\u0629\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u064a\u0627", "bbox": {"l": 221.8685508226996, "t": 507.4266917539564, "r": 241.72971089634578, "b": 520.3866917987535, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "\u0645 ", "bbox": {"l": 241.67787089615356, "t": 507.4266917539564, "r": 257.411320954494, "b": 520.3866917987535, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "\u0631\u0640", "bbox": {"l": 179.26880066473763, "t": 519.9067017970945, "r": 187.75760069621452, "b": 532.8667018418917, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "\u0635\u0645", "bbox": {"l": 187.79648069635869, "t": 519.9067017970945, "r": 209.58224077714138, "b": 532.8667018418917, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "\u0644\u0627", "bbox": {"l": 209.51744077690105, "t": 519.9067017970945, "r": 216.90465080429323, "b": 532.8667018418917, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": " \u064a\u0645", "bbox": {"l": 216.94353080443742, "t": 519.9067017970945, "r": 235.95586087493606, "b": 532.8667018418917, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "\u0648\u0642\u0644", "bbox": {"l": 235.99474087508025, "t": 519.9067017970945, "r": 254.0609709420707, "b": 532.8667018418917, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "\u0627", "bbox": {"l": 254.09985094221489, "t": 519.9067017970945, "r": 257.54721095499787, "b": 532.8667018418917, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": " \u0627\u0640\u0640\u0640\u0640\u0633\u0646 \u0627 \u0621\u0627\u0640\u0640\u0640\u0640", "bbox": {"l": 362.20999134309267, "t": 508.6766917582771, "r": 428.6688815895255, "b": 521.6366918030742, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "\u0646\u0628", "bbox": {"l": 428.7077615896697, "t": 508.6766917582771, "r": 437.3132016215791, "b": 521.6366918030742, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "\u0631\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0635\u0645", "bbox": {"l": 367.6023913630879, "t": 521.1567018014152, "r": 429.6149015930334, "b": 534.1167018462124, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "\u0644\u0627", "bbox": {"l": 429.5501115927932, "t": 521.1567018014152, "r": 436.93732162018534, "b": 534.1167018462124, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": " \u0639\u0627\u0640\u0640\u0640\u0640\u0640\u0635\u062a", "bbox": {"l": 270.07001100143304, "t": 507.4266917539564, "r": 308.6001011443045, "b": 520.3866917987535, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "\u0627 \u0621\u0627\u0640\u0640\u0640\u0640\u0640", "bbox": {"l": 331.3538212286764, "t": 507.4266917539564, "r": 340.23544126160994, "b": 520.3866917987535, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "\u0646\u0628", "bbox": {"l": 340.2743212617541, "t": 507.4266917539564, "r": 348.8797612936635, "b": 520.3866917987535, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "\u064a\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0633\u0628\u0627", "bbox": {"l": 273.0700110125572, "t": 519.9067017970945, "r": 340.08609126105614, "b": 532.8667018418917, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "\u0646\u062a", "bbox": {"l": 340.0213012608159, "t": 519.9067017970945, "r": 348.6267412927253, "b": 532.8667018418917, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "\u0642\u062a\u0633\u0638\u0627", "bbox": {"l": 85.41600031672677, "t": 508.33670175710193, "r": 117.0141004338941, "b": 521.296691801899, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "\u0642", "bbox": {"l": 129.65334048076102, "t": 508.33670175710193, "r": 135.9729605041945, "b": 521.296691801899, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "\u064a\u0642\u062d\u062a", "bbox": {"l": 136.02480050438672, "t": 508.33670175710193, "r": 160.44144059492484, "b": 521.296691801899, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": " \u0631\u0627 \u0631", "bbox": {"l": 69.09600125621141, "t": 508.33670175710193, "r": 85.41264331671432, "b": 521.296691801899, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "\u064a\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0633\u0627\u064a", "bbox": {"l": 72.09600126733555, "t": 520.81671180024, "r": 138.94359051520973, "b": 533.7767018450371, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "\u0633\u0644\u0627", "bbox": {"l": 138.8787805149694, "t": 520.81671180024, "r": 159.95175059310904, "b": 533.7767018450371, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u0646\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0645 \u0645\u0627 \u0629\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u064a\u0627 \u0645 \u0631\u0640 \u0635\u0645 \u0644\u0627 \u064a\u0645 \u0648\u0642\u0644 \u0627 \u0627\u0640\u0640\u0640\u0640\u0633\u0646 \u0627 \u0621\u0627\u0640\u0640\u0640\u0640 \u0646\u0628 \u0631\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0635\u0645 \u0644\u0627 \u0639\u0627\u0640\u0640\u0640\u0640\u0640\u0635\u062a \u0627 \u0621\u0627\u0640\u0640\u0640\u0640\u0640 \u0646\u0628 \u064a\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0633\u0628\u0627 \u0646\u062a \u0642\u062a\u0633\u0638\u0627 \u0642 \u064a\u0642\u062d\u062a \u0631\u0627 \u0631 \u064a\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0633\u0627\u064a \u0633\u0644\u0627"}, {"label": "picture", "id": 3, "page_no": 0, "cluster": {"id": 3, "label": "picture", "bbox": {"l": 446.4657287597656, "t": 200.7112274169922, "r": 595.0, "b": 650.6431884765625, "coord_origin": "TOPLEFT"}, "confidence": 0.6444889903068542, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "body": [{"label": "text", "id": 7, "page_no": 0, "cluster": {"id": 7, "label": "text", "bbox": {"l": 47.9520001778084, "t": 804.0922617794021, "r": 58.751999217855335, "b": 818.1322628279323, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 0, "text": "11", "bbox": {"l": 47.9520001778084, "t": 804.0922617794021, "r": 58.751999217855335, "b": 818.1322628279323, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "11"}, {"label": "text", "id": 0, "page_no": 0, "cluster": {"id": 0, "label": "text", "bbox": {"l": 67.9919972521177, "t": 209.65674072469346, "r": 437.42722162200187, "b": 419.32669144943253, "coord_origin": "TOPLEFT"}, "confidence": 0.9685260057449341, "cells": [{"id": 1, "text": " \u060c\u0647\u064a\u0644\u0639\u0648", "bbox": {"l": 399.260011480476, "t": 209.65674072469346, "r": 437.42722162200187, "b": 222.61670076949054, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "\u0645\u0644\u0627 \u0629\u0648\u0627", "bbox": {"l": 101.00520037453231, "t": 209.65674072469346, "r": 126.82584047027652, "b": 222.61670076949054, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "\u0631\u0645\u0644\u0627 \u0644\u0627\u0648\u0644 \u062e\u0648\u0627\u0647\u064a\u064a\u0639", "bbox": {"l": 130.05289048224256, "t": 209.65674072469346, "r": 229.27513085016358, "b": 222.61670076949054, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "\u0648\u0648\u0635", "bbox": {"l": 240.66298089239032, "t": 209.65674072469346, "r": 258.55817095874653, "b": 222.61670076949054, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "\u0639\u0636\u062a", "bbox": {"l": 265.06552098287614, "t": 209.65674072469346, "r": 281.6825010444927, "b": 222.61670076949054, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "\u0629\u064a\u0631\u0635", "bbox": {"l": 286.3310210617297, "t": 209.65674072469346, "r": 314.70044116692486, "b": 222.61670076949054, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "\u0645", "bbox": {"l": 314.739321167069, "t": 209.65674072469346, "r": 323.0726011979693, "b": 222.61670076949054, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "\u0644\u0627", "bbox": {"l": 323.02075119777703, "t": 209.65674072469346, "r": 330.06061122388115, "b": 222.61670076949054, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "\u0629\u0645\u0648\u0643\u062d", "bbox": {"l": 333.2073112355493, "t": 209.65674072469346, "r": 369.27499136929003, "b": 222.61670076949054, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "\u0644\u0627 ", "bbox": {"l": 369.3138713694342, "t": 209.65674072469346, "r": 379.37082140672584, "b": 222.61670076949054, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "\u0646\u0625\u0641", "bbox": {"l": 379.50043140720646, "t": 209.65674072469346, "r": 398.9274614792428, "b": 222.61670076949054, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "\u0629\u0648", "bbox": {"l": 78.1863332899188, "t": 209.65674072469346, "r": 79.31903829411894, "b": 222.61670076949054, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "\u0627\u0628", "bbox": {"l": 79.3838352943592, "t": 209.65674072469346, "r": 88.079994326605, "b": 222.61670076949054, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "\u0644\u0623\u0627", "bbox": {"l": 102.7000003808167, "t": 231.61676080059988, "r": 113.81968042204905, "b": 244.57672084539684, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "\u0646\u0645 \u062f\u062f\u064a \u0642\u064a \u062d\u062a \u0649\u0627\u064a \u0644\u0645\u0639\u0644\u062e\u0628 \u062e\u0627\u0644 \u0629\u064a\u0631", "bbox": {"l": 117.07263043411113, "t": 231.61676080059988, "r": 294.7153310928191, "b": 244.57672084539684, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "\u0648\u0627\u0645", "bbox": {"l": 294.75421109296326, "t": 231.61676080059988, "r": 318.5617411812428, "b": 244.57672084539684, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "\u062c\u0644\u0627", "bbox": {"l": 318.5098911810505, "t": 231.61676080059988, "r": 333.0000912347809, "b": 244.57672084539684, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "\u0633\u064a", "bbox": {"l": 337.2111512503957, "t": 231.61676080059988, "r": 359.59308133338897, "b": 244.57672084539684, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "\u0626\u0631 ", "bbox": {"l": 359.5282913331488, "t": 231.61676080059988, "r": 370.3110413731318, "b": 244.57672084539684, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "\u062f", "bbox": {"l": 370.5443113739967, "t": 231.61676080059988, "r": 377.2187213987458, "b": 244.57672084539684, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "\u064a\u0633\u0644\u0627 \u0641\u064a\u0627\u0643\u062a", "bbox": {"l": 377.25760139888996, "t": 231.61676080059988, "r": 437.04208162057375, "b": 244.57672084539684, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "\u0627", "bbox": {"l": 83.34959430906444, "t": 231.61676080059988, "r": 86.42111232045377, "b": 244.57672084539684, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "\u062f\u0648", "bbox": {"l": 86.48590932069406, "t": 231.61676080059988, "r": 94.70254535116175, "b": 244.57672084539684, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "\u0647", "bbox": {"l": 94.74142535130592, "t": 231.61676080059988, "r": 102.67294038071637, "b": 244.57672084539684, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": " :\u062e\u0627\u0633\u0639\u0631 \u0649\u0627\u064a", "bbox": {"l": 375.9800113941526, "t": 253.45672087609114, "r": 437.31921162160137, "b": 266.4166809208882, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "\u0648\u064a\u0648\u0644\u0648\u0644\u0623\u0627 \u0629\u0648\u0645\u0626\u062e\u0642 \u0633\u0639\u0631 \u0649\u0627", "bbox": {"l": 89.13600233052074, "t": 253.45672087609114, "r": 199.6070607401529, "b": 266.4166809208882, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "\u064a", "bbox": {"l": 199.56818074000876, "t": 253.45672087609114, "r": 206.72209076653579, "b": 266.4166809208882, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "\u064a\u0631\u0635\u0645\u0644\u0627 \u0646\u062e\u0633\u0646\u0644\u0625\u0627 \u0621\u062e\u0647\u0628 ", "bbox": {"l": 222.04082082333838, "t": 253.45672087609114, "r": 321.0293311903927, "b": 266.4166809208882, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "\u0641\u0627\u0645", "bbox": {"l": 321.1459711908252, "t": 253.45672087609114, "r": 342.4485212698161, "b": 266.4166809208882, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "\u0639\u0636\u0648", "bbox": {"l": 348.3749412917916, "t": 253.45672087609114, "r": 375.73349139323847, "b": 266.4166809208882, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "\u060c", "bbox": {"l": 72.94919627049924, "t": 253.45672087609114, "r": 73.94063627417555, "b": 266.4166809208882, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "\u062a\u062e", "bbox": {"l": 73.97951527431972, "t": 253.45672087609114, "r": 89.02607733011313, "b": 266.4166809208882, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": " \u0648\u0648\u0648\u0645\u0646 \u062a\u062d\u062f\u0648\u0648\u0639\u0645 \u0642\u0648\u0648\u064a \u062d\u062a", "bbox": {"l": 67.9919972521177, "t": 275.2967509515828, "r": 179.1887806644409, "b": 288.25671099637975, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "\u0649\u0648\u0648", "bbox": {"l": 190.77632070740808, "t": 275.2967509515828, "r": 192.97821071557277, "b": 288.25671099637975, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "\u0627\u064a", "bbox": {"l": 193.01709071571696, "t": 275.2967509515828, "r": 203.23216075359494, "b": 288.25671099637975, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "\u0644\u0648", "bbox": {"l": 207.64893076997257, "t": 275.2967509515828, "r": 218.53532081033984, "b": 288.25671099637975, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "\u0648\u0645", "bbox": {"l": 217.84845080779291, "t": 275.2967509515828, "r": 227.72397084441184, "b": 288.25671099637975, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "\u0639\u0644\u0627", "bbox": {"l": 227.6721308442196, "t": 275.2967509515828, "r": 241.0490108938217, "b": 288.25671099637975, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "\u060c\u0644\u064a\u0648\u0648\u0627\u0639\u0644\u0644\u0627\u0648 \u0629\u062d\u0648\u0648\u0635\u0644\u0627 \u062a\u062d\u062e\u0648\u0648\u062c\u0645 \u0627\u0648\u0648\u0641 \u0629\u0648\u0648\u0635\u062e\u0644", "bbox": {"l": 233.752530866766, "t": 275.2967509515828, "r": 437.0279516205213, "b": 288.25671099637975, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": " \u0649\u0648\u0648\u0648\u0648\u0627\u064a", "bbox": {"l": 67.9919972521177, "t": 297.16675102717795, "r": 96.06932135622982, "b": 310.126711071975, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "\u062e\u0648\u0648\u0648\u0648 \u062d\u0644\u0627 \u0627 \u0648\u0648\u0648\u0648", "bbox": {"l": 103.08865038225784, "t": 297.16675102717795, "r": 159.24330059048208, "b": 310.126711071975, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "\u0648 \u060c\u062a\u062e\u0648\u0648\u0648\u0648", "bbox": {"l": 187.1299706938872, "t": 297.16675102717795, "r": 197.68263073301702, "b": 310.126711071975, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "\u064a", "bbox": {"l": 197.72151073316118, "t": 297.16675102717795, "r": 204.87543075968827, "b": 310.126711071975, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "\u062e\u0644", "bbox": {"l": 204.91431075983246, "t": 297.16675102717795, "r": 214.81445079654264, "b": 310.126711071975, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "\u0644\u0627", "bbox": {"l": 239.12222088667707, "t": 297.16675102717795, "r": 244.1863409054551, "b": 310.126711071975, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "\u0641\u0648\u0648\u0648\u0648\u0627\u0630\u0639 \u0627\u0648\u0648\u0648\u0648\u0641 \u0629\u0627\u0645\u062e\u0648\u0648\u0648\u0648 \u0648 \u0629\u0645\u0627\u062f\u0644\u0648\u0648\u0648\u0648\u0633\u0645\u0648 \u0629\u0648\u0648\u0648\u0648\u064a\u0648\u0642", "bbox": {"l": 242.73946090009002, "t": 297.16675102717795, "r": 436.91122162008855, "b": 310.126711071975, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "\u0648\u0648", "bbox": {"l": 80.7360002993731, "t": 319.0067111026693, "r": 82.4855963058607, "b": 331.9666711474664, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "\u064a\u0644\u0648\u062f\u0644\u0627\u0648 \u0629\u0648\u0648\u064a\u0645\u064a\u0627\u0642\u0644\u0625\u0627 \u062a\u062e\u064a\u062f\u0648\u0648", "bbox": {"l": 82.52447530600485, "t": 319.0067111026693, "r": 198.30913073534012, "b": 331.9666711474664, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "\u062d\u0644\u0644", "bbox": {"l": 198.34801073548428, "t": 319.0067111026693, "r": 214.84608079665995, "b": 331.9666711474664, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "\u0627 \u0621\u0648\u0648\u0648\u0636 \u0627\u0648\u0648\u0641 \u064a\u0631\u0648\u0648\u0635\u0645\u0644\u0627", "bbox": {"l": 214.79425079646776, "t": 319.0067111026693, "r": 317.88953117875013, "b": 331.9666711474664, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "\u0627\u0645\u0648\u0648\u0648", "bbox": {"l": 330.88440122693584, "t": 319.0067111026693, "r": 342.81308127116796, "b": 331.9666711474664, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": " \u0644\u0627 \u0646\u0648\u0648\u0645\u0644\u0623\u0627 \u062a\u0627\u062f\u062f\u0648\u0648\u062d\u0645", "bbox": {"l": 342.8519612713121, "t": 319.0067111026693, "r": 437.0582616206338, "b": 331.9666711474664, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "\u060c\u0629", "bbox": {"l": 72.94919627049924, "t": 319.0067111026693, "r": 80.6927952992129, "b": 331.9666711474664, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "\u0648\u0648", "bbox": {"l": 86.25599731984153, "t": 340.84671117816094, "r": 88.48510732810718, "b": 353.806701222958, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "\u0627\u0645 \u0629\u0648\u0648\u0639\u0628\u062e\u0644\u0645 \u0631\u0627\u0631\u0645\u0644\u0648\u0648\u0633\u0627\u0648 \u060c\u0629\u064a\u0648\u0648\u0633\u062e\u064a\u0633\u0644\u0627 \u0629 \u0631\u062e\u0648\u0648\u0627\u0645\u0644\u0627 \u0631", "bbox": {"l": 117.17401043448704, "t": 340.84671117816094, "r": 322.67236119648516, "b": 353.806701222958, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "\u064a", "bbox": {"l": 322.7371511967254, "t": 340.84671117816094, "r": 326.5214812107579, "b": 353.806701222958, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "\u0648\u0648", "bbox": {"l": 326.56036121090204, "t": 340.84671117816094, "r": 334.78998124141793, "b": 353.806701222958, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "\u0648", "bbox": {"l": 333.88278123805395, "t": 340.84671117816094, "r": 335.38614124362846, "b": 353.806701222958, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "\u0644\u062a", "bbox": {"l": 335.4250212437726, "t": 340.84671117816094, "r": 348.4161112919443, "b": 353.806701222958, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "\u062f", "bbox": {"l": 354.00964131268535, "t": 340.84671117816094, "r": 359.8286713342626, "b": 353.806701222958, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "\u0648\u0648\u0648\u0627\u0648 \u0629\u0627\u0648\u0648\u0635\u0627\u0648\u0645\u0648", "bbox": {"l": 359.7638913340224, "t": 340.84671117816094, "r": 436.99252162039, "b": 353.806701222958, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "\u062a\u062e", "bbox": {"l": 84.35918431280804, "t": 340.84671117816094, "r": 86.1777573195514, "b": 353.806701222958, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "\u0627\u064a\u0648\u0648\u0648\u0648", "bbox": {"l": 93.20639834561395, "t": 362.68670125365236, "r": 97.68335736221475, "b": 375.6467012984495, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "\u0644\u0627\u0648", "bbox": {"l": 97.72223736235891, "t": 362.68670125365236, "r": 110.05368040808452, "b": 375.6467012984495, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "\u0629\u0648\u0648\u0648\u0641\u062e \u0644\u0627 \u062a\u062e\u0648\u0648\u0648 \u0627\u0645 \u0631\u064a\u0648\u0648\u0648\u0648\u0644\u062a \u060c \u062e\u0648\u0648\u0648\u0647\u0631\u0644\u0625\u0627 \u0629\u0648\u0648\u0648\u062d\u0641\u062e", "bbox": {"l": 107.81160039977077, "t": 362.68670125365236, "r": 319.73993118561157, "b": 375.6467012984495, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "\u0643\u0645\u0648", "bbox": {"l": 319.7788111857557, "t": 362.68670125365236, "r": 336.7513712486908, "b": 375.6467012984495, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "\u0631", "bbox": {"l": 327.4936212143627, "t": 362.68670125365236, "r": 347.5520912887404, "b": 375.6467012984495, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "\u0627\u0631", "bbox": {"l": 347.6039412889327, "t": 362.68670125365236, "r": 355.45767131805474, "b": 375.6467012984495, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "\u0644\u0648\u0648\u0648\u0633\u062d\u0627\u0648 \u0646\u0648\u0648\u0648\u0645\u0644\u0623\u0627", "bbox": {"l": 365.14093135396075, "t": 362.68670125365236, "r": 436.85941161989643, "b": 375.6467012984495, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "\u0644\u064a", "bbox": {"l": 77.3555982868384, "t": 384.52670132914386, "r": 83.62175831007363, "b": 397.486691373941, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "\u0647\u062e\u0648\u0648\u0648 \u0645 \u0648\u0648\u0648\u0633\u0631\u064a \u064a \u0648\u0648\u0648\u0644\u0627 \u0648\u0648\u0648\u0648", "bbox": {"l": 83.56991630988142, "t": 384.52670132914386, "r": 197.09950073085474, "b": 397.486691373941, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "\u062d\u0647\u0644", "bbox": {"l": 197.13838073099893, "t": 384.52670132914386, "r": 213.63646079217463, "b": 397.486691373941, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "\u0627 \u0649\u0648\u0648\u0648\u0627\u064a \u0644\u062f\u0648\u0648\u0648\u0644\u0639\u0645\u0644\u0627 \u0627\u0647\u064a\u062f\u0648\u0648\u0648", "bbox": {"l": 213.58463079198242, "t": 384.52670132914386, "r": 326.4273712104089, "b": 397.486691373941, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "\u0644\u0627", "bbox": {"l": 326.4662512105531, "t": 384.52670132914386, "r": 341.38971126589, "b": 397.486691373941, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "\u062e\u0648\u0648\u0648\u0644\u0628\u0644\u0627\u0648 \u060c\u0627\u0647\u060c\u0648\u0648\u0648\u0648\u0644\u0627", "bbox": {"l": 347.81137128970187, "t": 384.52670132914386, "r": 436.88547161999304, "b": 397.486691373941, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": ".\u0627\u0639\u0645\u0644\u062c\u0645\u0644\u0627 \u0645\u0627\u0633\u0644\u0627\u0648 \u0629\u0647\u060c\u0627\u0648\u0645\u0644\u0627", "bbox": {"l": 284.1600010536794, "t": 406.3667014046354, "r": 437.30203162153765, "b": 419.32669144943253, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u060c\u0647\u064a\u0644\u0639\u0648 \u0645\u0644\u0627 \u0629\u0648\u0627 \u0631\u0645\u0644\u0627 \u0644\u0627\u0648\u0644 \u062e\u0648\u0627\u0647\u064a\u064a\u0639 \u0648\u0648\u0635 \u0639\u0636\u062a \u0629\u064a\u0631\u0635 \u0645 \u0644\u0627 \u0629\u0645\u0648\u0643\u062d \u0644\u0627 \u0646\u0625\u0641 \u0629\u0648 \u0627\u0628 \u0644\u0623\u0627 \u0646\u0645 \u062f\u062f\u064a \u0642\u064a \u062d\u062a \u0649\u0627\u064a \u0644\u0645\u0639\u0644\u062e\u0628 \u062e\u0627\u0644 \u0629\u064a\u0631 \u0648\u0627\u0645 \u062c\u0644\u0627 \u0633\u064a \u0626\u0631 \u062f \u064a\u0633\u0644\u0627 \u0641\u064a\u0627\u0643\u062a \u0627 \u062f\u0648 \u0647 :\u062e\u0627\u0633\u0639\u0631 \u0649\u0627\u064a \u0648\u064a\u0648\u0644\u0648\u0644\u0623\u0627 \u0629\u0648\u0645\u0626\u062e\u0642 \u0633\u0639\u0631 \u0649\u0627 \u064a \u064a\u0631\u0635\u0645\u0644\u0627 \u0646\u062e\u0633\u0646\u0644\u0625\u0627 \u0621\u062e\u0647\u0628 \u0641\u0627\u0645 \u0639\u0636\u0648 \u060c \u062a\u062e \u0648\u0648\u0648\u0645\u0646 \u062a\u062d\u062f\u0648\u0648\u0639\u0645 \u0642\u0648\u0648\u064a \u062d\u062a \u0649\u0648\u0648 \u0627\u064a \u0644\u0648 \u0648\u0645 \u0639\u0644\u0627 \u060c\u0644\u064a\u0648\u0648\u0627\u0639\u0644\u0644\u0627\u0648 \u0629\u062d\u0648\u0648\u0635\u0644\u0627 \u062a\u062d\u062e\u0648\u0648\u062c\u0645 \u0627\u0648\u0648\u0641 \u0629\u0648\u0648\u0635\u062e\u0644 \u0649\u0648\u0648\u0648\u0648\u0627\u064a \u062e\u0648\u0648\u0648\u0648 \u062d\u0644\u0627 \u0627 \u0648\u0648\u0648\u0648 \u0648 \u060c\u062a\u062e\u0648\u0648\u0648\u0648 \u064a \u062e\u0644 \u0644\u0627 \u0641\u0648\u0648\u0648\u0648\u0627\u0630\u0639 \u0627\u0648\u0648\u0648\u0648\u0641 \u0629\u0627\u0645\u062e\u0648\u0648\u0648\u0648 \u0648 \u0629\u0645\u0627\u062f\u0644\u0648\u0648\u0648\u0648\u0633\u0645\u0648 \u0629\u0648\u0648\u0648\u0648\u064a\u0648\u0642 \u0648\u0648 \u064a\u0644\u0648\u062f\u0644\u0627\u0648 \u0629\u0648\u0648\u064a\u0645\u064a\u0627\u0642\u0644\u0625\u0627 \u062a\u062e\u064a\u062f\u0648\u0648 \u062d\u0644\u0644 \u0627 \u0621\u0648\u0648\u0648\u0636 \u0627\u0648\u0648\u0641 \u064a\u0631\u0648\u0648\u0635\u0645\u0644\u0627 \u0627\u0645\u0648\u0648\u0648 \u0644\u0627 \u0646\u0648\u0648\u0645\u0644\u0623\u0627 \u062a\u0627\u062f\u062f\u0648\u0648\u062d\u0645 \u060c\u0629 \u0648\u0648 \u0627\u0645 \u0629\u0648\u0648\u0639\u0628\u062e\u0644\u0645 \u0631\u0627\u0631\u0645\u0644\u0648\u0648\u0633\u0627\u0648 \u060c\u0629\u064a\u0648\u0648\u0633\u062e\u064a\u0633\u0644\u0627 \u0629 \u0631\u062e\u0648\u0648\u0627\u0645\u0644\u0627 \u0631 \u064a \u0648\u0648 \u0648 \u0644\u062a \u062f \u0648\u0648\u0648\u0627\u0648 \u0629\u0627\u0648\u0648\u0635\u0627\u0648\u0645\u0648 \u062a\u062e \u0627\u064a\u0648\u0648\u0648\u0648 \u0644\u0627\u0648 \u0629\u0648\u0648\u0648\u0641\u062e \u0644\u0627 \u062a\u062e\u0648\u0648\u0648 \u0627\u0645 \u0631\u064a\u0648\u0648\u0648\u0648\u0644\u062a \u060c \u062e\u0648\u0648\u0648\u0647\u0631\u0644\u0625\u0627 \u0629\u0648\u0648\u0648\u062d\u0641\u062e \u0643\u0645\u0648 \u0631 \u0627\u0631 \u0644\u0648\u0648\u0648\u0633\u062d\u0627\u0648 \u0646\u0648\u0648\u0648\u0645\u0644\u0623\u0627 \u0644\u064a \u0647\u062e\u0648\u0648\u0648 \u0645 \u0648\u0648\u0648\u0633\u0631\u064a \u064a \u0648\u0648\u0648\u0644\u0627 \u0648\u0648\u0648\u0648 \u062d\u0647\u0644 \u0627 \u0649\u0648\u0648\u0648\u0627\u064a \u0644\u062f\u0648\u0648\u0648\u0644\u0639\u0645\u0644\u0627 \u0627\u0647\u064a\u062f\u0648\u0648\u0648 \u0644\u0627 \u062e\u0648\u0648\u0648\u0644\u0628\u0644\u0627\u0648 \u060c\u0627\u0647\u060c\u0648\u0648\u0648\u0648\u0644\u0627 .\u0627\u0639\u0645\u0644\u062c\u0645\u0644\u0627 \u0645\u0627\u0633\u0644\u0627\u0648 \u0629\u0647\u060c\u0627\u0648\u0645\u0644\u0627"}, {"label": "text", "id": 2, "page_no": 0, "cluster": {"id": 2, "label": "text", "bbox": {"l": 74.51999727632386, "t": 433.9166814998638, "r": 440.883241634817, "b": 465.596681609368, "coord_origin": "TOPLEFT"}, "confidence": 0.9393879771232605, "cells": [{"id": 77, "text": " \u0631\u0648\u0644 \u0644\u0627 \u0644\u0627\u0648\u0644 \u0629\u064a\u0631\u0648", "bbox": {"l": 107.16000039735461, "t": 433.9166814998638, "r": 187.44720069506354, "b": 446.876681544661, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "\u0635", "bbox": {"l": 187.4860806952077, "t": 433.9166814998638, "r": 200.6404907439849, "b": 446.876681544661, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "\u0645", "bbox": {"l": 200.67937074412907, "t": 433.9166814998638, "r": 209.0126507750293, "b": 446.876681544661, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "\u0644\u0627", "bbox": {"l": 208.96082077483712, "t": 433.9166814998638, "r": 216.06721080118794, "b": 446.876681544661, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "\u0629\u0648", "bbox": {"l": 218.09763080871687, "t": 433.9166814998638, "r": 227.2344208425965, "b": 446.876681544661, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "\u0645\u0648\u0643\u062d\u0644\u0627 \u0627\u0645\u062e\u0648\u0646\u0631\u0628", "bbox": {"l": 227.3121808428849, "t": 433.9166814998638, "r": 310.7486611522715, "b": 446.876681544661, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "\u062f\u0627\u0644\u0648\u0633\u064a \u060c\u0642\u0628\u0633 \u062e\u0645\u0644 \u062e\u064b \u0641\u0648\u0648", "bbox": {"l": 321.5573111923505, "t": 433.9166814998638, "r": 440.45236163321925, "b": 446.876681544661, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "2024(", "bbox": {"l": 81.36000130168694, "t": 433.9166814998638, "r": 104.00928038567159, "b": 446.876681544661, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "-", "bbox": {"l": 74.51999727632386, "t": 433.9166814998638, "r": 78.09695428958737, "b": 446.876681544661, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": " )2026", "bbox": {"l": 414.79001153806195, "t": 452.63669156457087, "r": 440.883241634817, "b": 465.596681609368, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "\u0627\u062a\u0644\u0622\u0627 \u0648\u062d\u0647\u0644\u0627 \u0649\u0627\u064a \u0627\u0647\u0648 \u060c\u0629\u0633\u064a\u0626\u0631 \u0629\u064a\u062c\u064a\u062a\u0627\u0631\u0644\u0633\u0627 \u0627\u062f", "bbox": {"l": 113.40000042049283, "t": 452.63669156457087, "r": 336.75259124869535, "b": 465.596681609368, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "\u0647\u0639", "bbox": {"l": 336.7914712488395, "t": 452.63669156457087, "r": 347.26965128769314, "b": 465.596681609368, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "\u0629\u0639\u0628\u0631\u0639 \u0642\u064a \u062d\u062a", "bbox": {"l": 344.2758812765921, "t": 452.63669156457087, "r": 414.4348115367449, "b": 465.596681609368, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": ":", "bbox": {"l": 110.52000040981365, "t": 452.63669156457087, "r": 113.42303042057824, "b": 465.596681609368, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u0631\u0648\u0644 \u0644\u0627 \u0644\u0627\u0648\u0644 \u0629\u064a\u0631\u0648 \u0635 \u0645 \u0644\u0627 \u0629\u0648 \u0645\u0648\u0643\u062d\u0644\u0627 \u0627\u0645\u062e\u0648\u0646\u0631\u0628 \u062f\u0627\u0644\u0648\u0633\u064a \u060c\u0642\u0628\u0633 \u062e\u0645\u0644 \u062e\u064b \u0641\u0648\u0648 2024( -)2026 \u0627\u062a\u0644\u0622\u0627 \u0648\u062d\u0647\u0644\u0627 \u0649\u0627\u064a \u0627\u0647\u0648 \u060c\u0629\u0633\u064a\u0626\u0631 \u0629\u064a\u062c\u064a\u062a\u0627\u0631\u0644\u0633\u0627 \u0627\u062f \u0647\u0639 \u0629\u0639\u0628\u0631\u0639 \u0642\u064a \u062d\u062a :"}, {"label": "text", "id": 1, "page_no": 0, "cluster": {"id": 1, "label": "text", "bbox": {"l": 72.94919627049924, "t": 578.8267220007557, "r": 437.29059162149525, "b": 647.966702239743, "coord_origin": "TOPLEFT"}, "confidence": 0.9558618068695068, "cells": [{"id": 91, "text": "\u062e\u0647\u0644\u0648\u0633\u062d\u062e\u0628 \u0627\u0645\u062e\u0648\u0646\u0631\u0628", "bbox": {"l": 115.18000042709316, "t": 578.8267220007557, "r": 194.85806072254337, "b": 591.7867120455528, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "\u0644\u0627", "bbox": {"l": 194.8062307223512, "t": 578.8267220007557, "r": 205.46582076187747, "b": 591.7867120455528, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "\u062a", "bbox": {"l": 202.42023075058427, "t": 578.8267220007557, "r": 216.12543080140384, "b": 591.7867120455528, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "\u062e\u0641\u062f\u0627\u0644\u0648\u0633\u0645 \u062f\u064a\u062f\u062d\u062a \u0644\u062a \u062f\u0642", "bbox": {"l": 216.15135080149997, "t": 578.8267220007557, "r": 331.91013123073924, "b": 591.7867120455528, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "\u0647\u0646", "bbox": {"l": 337.0552412498176, "t": 578.8267220007557, "r": 347.5528312887431, "b": 591.7867120455528, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "\u0639 \u0649\u0644\u0625", "bbox": {"l": 347.6046812889354, "t": 578.8267220007557, "r": 372.38708138082984, "b": 591.7867120455528, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "\u0631\u062e \u0644\u0625\u0627 \u0631\u062f\u062c\u062a", "bbox": {"l": 382.3000514175876, "t": 578.8267220007557, "r": 436.8213216197552, "b": 591.7867120455528, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "\u0644\u0643\u0648\u0627\u0628 \u062f", "bbox": {"l": 87.43940032422965, "t": 578.8267220007557, "r": 115.1923104271388, "b": 591.7867120455528, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": " \u0631\u0648\u0648\u0648\u0635\u0645 \u0629\u0648", "bbox": {"l": 241.0800008939366, "t": 597.5312820654094, "r": 285.1217710572457, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "\u0648\u0648\u064a \u0631", "bbox": {"l": 285.18668105748645, "t": 597.5312820654094, "r": 302.2865911208937, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "\u062a\u062e", "bbox": {"l": 318.6840811816964, "t": 597.5312820654094, "r": 320.50314118844153, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "\u0641\u062f\u0627\u0644", "bbox": {"l": 320.54208118858594, "t": 597.5312820654094, "r": 347.354031288006, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "\u0648\u0648\u0648", "bbox": {"l": 347.3020912878134, "t": 597.5312820654094, "r": 351.67767130403826, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "\u0633", "bbox": {"l": 351.71661130418266, "t": 597.5312820654094, "r": 365.2199713542538, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "\u0645 \u0649\u0648\u0648\u0648", "bbox": {"l": 365.1550613540131, "t": 597.5312820654094, "r": 388.13672143923026, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "\u0627\u064a \u0633\u064a\u0648\u0648\u0648\u0626\u0631", "bbox": {"l": 388.1756614393746, "t": 597.5312820654094, "r": 437.1642516210267, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "2023", "bbox": {"l": 215.03999079737898, "t": 597.5312820654094, "r": 241.13783089415108, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "\u0631", "bbox": {"l": 73.95381227422442, "t": 597.5312820654094, "r": 75.14617927864577, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "\u0627\u0648\u0648", "bbox": {"l": 75.18513527879021, "t": 597.5312820654094, "r": 86.63702432125439, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "\u0648\u0648", "bbox": {"l": 86.68895732144696, "t": 597.5312820654094, "r": 89.51946333194262, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "\u062d\u0644\u0627", "bbox": {"l": 89.55841833208707, "t": 597.5312820654094, "r": 106.3337403942908, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "\u062a\u062e\u0648\u0648\u0648", "bbox": {"l": 103.28368038298102, "t": 597.5312820654094, "r": 127.52363047286396, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "\u0633\u0627\u0648 \u062a\u062e\u064a\u0648\u0648\u0648\u0635\u0648\u062a\u0648 \u060c", "bbox": {"l": 127.56258047300838, "t": 597.5312820654094, "r": 214.76315079635242, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "\u0643\u064a\u0627\u0644", "bbox": {"l": 91.17600333808515, "t": 616.2866921302387, "r": 114.98352042636462, "b": 629.2467021750359, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "\u0627 \u062a\u062e \u0627\u0648\u0648\u0635\u064a\u0644 \u0627\u0647\u060c\u0648\u0648\u0648\u0644\u0627 \u0627\u0645\u062e\u0648\u0648\u0646\u0631\u0628\u0644\u0627\u0648 \u060c\u062a\u0627\u0631\u0627 ", "bbox": {"l": 114.93168042617239, "t": 616.2866921302387, "r": 303.07190112380573, "b": 629.2467021750359, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "\u0648\u0648\u0648", "bbox": {"l": 303.1107811239498, "t": 616.2866921302387, "r": 311.57367115533066, "b": 629.2467021750359, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "\u0644\u0627", "bbox": {"l": 311.6125511554748, "t": 616.2866921302387, "r": 322.27216119500116, "b": 629.2467021750359, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "\u062a", "bbox": {"l": 319.22656118370793, "t": 616.2866921302387, "r": 332.9317612345275, "b": 629.2467021750359, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "\u062e", "bbox": {"l": 332.9576712346236, "t": 616.2866921302387, "r": 336.7420012486561, "b": 629.2467021750359, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "\u0641\u062f\u0627", "bbox": {"l": 336.78088124880026, "t": 616.2866921302387, "r": 359.1757513318415, "b": 629.2467021750359, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "\u0644\u0648\u0648", "bbox": {"l": 359.2016613319376, "t": 616.2866921302387, "r": 365.26694135442796, "b": 629.2467021750359, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "\u0633\u0645\u0648", "bbox": {"l": 365.3058213545721, "t": 616.2866921302387, "r": 392.46997145529815, "b": 629.2467021750359, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": " \u060c\u0627\u0647\u060c\u0648\u0648\u0648\u0644\u0627", "bbox": {"l": 392.431091455154, "t": 616.2866921302387, "r": 437.0264616205159, "b": 629.2467021750359, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "\u060c\u0629\u0648\u0648", "bbox": {"l": 72.94919627049924, "t": 616.2866921302387, "r": 82.44239030570048, "b": 629.2467021750359, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "\u064a", "bbox": {"l": 82.48127030584465, "t": 616.2866921302387, "r": 86.84879332203964, "b": 629.2467021750359, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "\u0627", "bbox": {"l": 86.79695132184742, "t": 616.2866921302387, "r": 91.12559533789825, "b": 629.2467021750359, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "\u0629\u064a\u0647\u060c", "bbox": {"l": 276.1200010238667, "t": 635.0067021949458, "r": 302.3251311210366, "b": 647.966702239743, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "\u0648\u0644\u0627", "bbox": {"l": 302.27328112084433, "t": 635.0067021949458, "r": 318.1881711798576, "b": 647.966702239743, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "\u062a\u062e", "bbox": {"l": 315.29456116912786, "t": 635.0067021949458, "r": 334.1030612388708, "b": 647.966702239743, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "\u064a", "bbox": {"l": 334.18082123915906, "t": 635.0067021949458, "r": 338.5483412553541, "b": 647.966702239743, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "\u062c\u064a\u062a\u0627", "bbox": {"l": 338.4964912551618, "t": 635.0067021949458, "r": 358.23456132835156, "b": 647.966702239743, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "\u0631\u0644\u0633\u062d\u0627 \u0641\u0627\u0644\u0628\u0645\u0648", "bbox": {"l": 358.2864113285438, "t": 635.0067021949458, "r": 437.29059162149525, "b": 647.966702239743, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": ".", "bbox": {"l": 272.6400110109627, "t": 635.0067021949458, "r": 276.0614610236496, "b": 647.966702239743, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u062e\u0647\u0644\u0648\u0633\u062d\u062e\u0628 \u0627\u0645\u062e\u0648\u0646\u0631\u0628 \u0644\u0627 \u062a \u062e\u0641\u062f\u0627\u0644\u0648\u0633\u0645 \u062f\u064a\u062f\u062d\u062a \u0644\u062a \u062f\u0642 \u0647\u0646 \u0639 \u0649\u0644\u0625 \u0631\u062e \u0644\u0625\u0627 \u0631\u062f\u062c\u062a \u0644\u0643\u0648\u0627\u0628 \u062f \u0631\u0648\u0648\u0648\u0635\u0645 \u0629\u0648 \u0648\u0648\u064a \u0631 \u062a\u062e \u0641\u062f\u0627\u0644 \u0648\u0648\u0648 \u0633 \u0645 \u0649\u0648\u0648\u0648 \u0627\u064a \u0633\u064a\u0648\u0648\u0648\u0626\u0631 2023 \u0631 \u0627\u0648\u0648 \u0648\u0648 \u062d\u0644\u0627 \u062a\u062e\u0648\u0648\u0648 \u0633\u0627\u0648 \u062a\u062e\u064a\u0648\u0648\u0648\u0635\u0648\u062a\u0648 \u060c \u0643\u064a\u0627\u0644 \u0627 \u062a\u062e \u0627\u0648\u0648\u0635\u064a\u0644 \u0627\u0647\u060c\u0648\u0648\u0648\u0644\u0627 \u0627\u0645\u062e\u0648\u0648\u0646\u0631\u0628\u0644\u0627\u0648 \u060c\u062a\u0627\u0631\u0627 \u0648\u0648\u0648 \u0644\u0627 \u062a \u062e \u0641\u062f\u0627 \u0644\u0648\u0648 \u0633\u0645\u0648 \u060c\u0627\u0647\u060c\u0648\u0648\u0648\u0644\u0627 \u060c\u0629\u0648\u0648 \u064a \u0627 \u0629\u064a\u0647\u060c \u0648\u0644\u0627 \u062a\u062e \u064a \u062c\u064a\u062a\u0627 \u0631\u0644\u0633\u062d\u0627 \u0641\u0627\u0644\u0628\u0645\u0648 ."}, {"label": "text", "id": 4, "page_no": 0, "cluster": {"id": 4, "label": "text", "bbox": {"l": 69.09600125621141, "t": 507.4266917539564, "r": 437.3132016215791, "b": 534.1167018462124, "coord_origin": "TOPLEFT"}, "confidence": 0.5769620537757874, "cells": [{"id": 134, "text": " \u0646\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0645", "bbox": {"l": 167.78000062213658, "t": 507.4266917539564, "r": 199.8948707412201, "b": 520.3866917987535, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "\u0645\u0627", "bbox": {"l": 199.92079074131624, "t": 507.4266917539564, "r": 211.63663078475915, "b": 520.3866917987535, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "\u0629\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u064a\u0627", "bbox": {"l": 221.8685508226996, "t": 507.4266917539564, "r": 241.72971089634578, "b": 520.3866917987535, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "\u0645 ", "bbox": {"l": 241.67787089615356, "t": 507.4266917539564, "r": 257.411320954494, "b": 520.3866917987535, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "\u0631\u0640", "bbox": {"l": 179.26880066473763, "t": 519.9067017970945, "r": 187.75760069621452, "b": 532.8667018418917, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "\u0635\u0645", "bbox": {"l": 187.79648069635869, "t": 519.9067017970945, "r": 209.58224077714138, "b": 532.8667018418917, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "\u0644\u0627", "bbox": {"l": 209.51744077690105, "t": 519.9067017970945, "r": 216.90465080429323, "b": 532.8667018418917, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": " \u064a\u0645", "bbox": {"l": 216.94353080443742, "t": 519.9067017970945, "r": 235.95586087493606, "b": 532.8667018418917, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "\u0648\u0642\u0644", "bbox": {"l": 235.99474087508025, "t": 519.9067017970945, "r": 254.0609709420707, "b": 532.8667018418917, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "\u0627", "bbox": {"l": 254.09985094221489, "t": 519.9067017970945, "r": 257.54721095499787, "b": 532.8667018418917, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": " \u0627\u0640\u0640\u0640\u0640\u0633\u0646 \u0627 \u0621\u0627\u0640\u0640\u0640\u0640", "bbox": {"l": 362.20999134309267, "t": 508.6766917582771, "r": 428.6688815895255, "b": 521.6366918030742, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "\u0646\u0628", "bbox": {"l": 428.7077615896697, "t": 508.6766917582771, "r": 437.3132016215791, "b": 521.6366918030742, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "\u0631\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0635\u0645", "bbox": {"l": 367.6023913630879, "t": 521.1567018014152, "r": 429.6149015930334, "b": 534.1167018462124, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "\u0644\u0627", "bbox": {"l": 429.5501115927932, "t": 521.1567018014152, "r": 436.93732162018534, "b": 534.1167018462124, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": " \u0639\u0627\u0640\u0640\u0640\u0640\u0640\u0635\u062a", "bbox": {"l": 270.07001100143304, "t": 507.4266917539564, "r": 308.6001011443045, "b": 520.3866917987535, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "\u0627 \u0621\u0627\u0640\u0640\u0640\u0640\u0640", "bbox": {"l": 331.3538212286764, "t": 507.4266917539564, "r": 340.23544126160994, "b": 520.3866917987535, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "\u0646\u0628", "bbox": {"l": 340.2743212617541, "t": 507.4266917539564, "r": 348.8797612936635, "b": 520.3866917987535, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "\u064a\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0633\u0628\u0627", "bbox": {"l": 273.0700110125572, "t": 519.9067017970945, "r": 340.08609126105614, "b": 532.8667018418917, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "\u0646\u062a", "bbox": {"l": 340.0213012608159, "t": 519.9067017970945, "r": 348.6267412927253, "b": 532.8667018418917, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "\u0642\u062a\u0633\u0638\u0627", "bbox": {"l": 85.41600031672677, "t": 508.33670175710193, "r": 117.0141004338941, "b": 521.296691801899, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "\u0642", "bbox": {"l": 129.65334048076102, "t": 508.33670175710193, "r": 135.9729605041945, "b": 521.296691801899, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "\u064a\u0642\u062d\u062a", "bbox": {"l": 136.02480050438672, "t": 508.33670175710193, "r": 160.44144059492484, "b": 521.296691801899, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": " \u0631\u0627 \u0631", "bbox": {"l": 69.09600125621141, "t": 508.33670175710193, "r": 85.41264331671432, "b": 521.296691801899, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "\u064a\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0633\u0627\u064a", "bbox": {"l": 72.09600126733555, "t": 520.81671180024, "r": 138.94359051520973, "b": 533.7767018450371, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "\u0633\u0644\u0627", "bbox": {"l": 138.8787805149694, "t": 520.81671180024, "r": 159.95175059310904, "b": 533.7767018450371, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u0646\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0645 \u0645\u0627 \u0629\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u064a\u0627 \u0645 \u0631\u0640 \u0635\u0645 \u0644\u0627 \u064a\u0645 \u0648\u0642\u0644 \u0627 \u0627\u0640\u0640\u0640\u0640\u0633\u0646 \u0627 \u0621\u0627\u0640\u0640\u0640\u0640 \u0646\u0628 \u0631\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0635\u0645 \u0644\u0627 \u0639\u0627\u0640\u0640\u0640\u0640\u0640\u0635\u062a \u0627 \u0621\u0627\u0640\u0640\u0640\u0640\u0640 \u0646\u0628 \u064a\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0633\u0628\u0627 \u0646\u062a \u0642\u062a\u0633\u0638\u0627 \u0642 \u064a\u0642\u062d\u062a \u0631\u0627 \u0631 \u064a\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0633\u0627\u064a \u0633\u0644\u0627"}, {"label": "picture", "id": 3, "page_no": 0, "cluster": {"id": 3, "label": "picture", "bbox": {"l": 446.4657287597656, "t": 200.7112274169922, "r": 595.0, "b": 650.6431884765625, "coord_origin": "TOPLEFT"}, "confidence": 0.6444889903068542, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "headers": []}}]
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v1/right_to_left_03.doctags.txt b/tests/data/groundtruth/docling_v1/right_to_left_03.doctags.txt
new file mode 100644
index 00000000..f54f02b5
--- /dev/null
+++ b/tests/data/groundtruth/docling_v1/right_to_left_03.doctags.txt
@@ -0,0 +1,32 @@
+<document>
+<subtitle-level-1><location><page_1><loc_12><loc_90><loc_45><loc_93></location>یلخاد یلااک - یلصا رازاب رد شريذپ همانديما</subtitle-level-1>
+<figure>
+<location><page_1><loc_65><loc_88><loc_81><loc_96></location>
+</figure>
+<subtitle-level-1><location><page_1><loc_63><loc_81><loc_81><loc_84></location>لااک درادناتسا -2-5</subtitle-level-1>
+<paragraph><location><page_1><loc_77><loc_79><loc_87><loc_81></location>درادناتسا مان</paragraph>
+<paragraph><location><page_1><loc_11><loc_75><loc_44><loc_81></location>یرگ هتخير شور هب هدش ديلوت لاشمش و هشمش فرصم دروم هتسويپ یا هزاس یاهدلاوف رد - قباطم تسويپ زيلانآ</paragraph>
+<paragraph><location><page_1><loc_71><loc_72><loc_87><loc_74></location>یلم درادناتسا هرامش</paragraph>
+<paragraph><location><page_1><loc_40><loc_73><loc_45><loc_74></location>20300</paragraph>
+<paragraph><location><page_1><loc_68><loc_70><loc_87><loc_72></location>؟تسا یرابجا درادناتسا</paragraph>
+<paragraph><location><page_1><loc_65><loc_67><loc_87><loc_69></location>درادناتسا هدننکرداص عجرم</paragraph>
+<paragraph><location><page_1><loc_28><loc_67><loc_44><loc_69></location>ناريا درادناتسا یلم نامزاس</paragraph>
+<paragraph><location><page_1><loc_49><loc_62><loc_87><loc_66></location>ذخا ار روکذم درادناتسا ،لوصحم هدننکديلوت ايآ ؟تسا هدومن</paragraph>
+<subtitle-level-1><location><page_1><loc_69><loc_56><loc_85><loc_58></location>سروب رد شريذپ -3</subtitle-level-1>
+<paragraph><location><page_1><loc_68><loc_54><loc_83><loc_56></location>کرادم هئارا خيرات</paragraph>
+<paragraph><location><page_1><loc_23><loc_54><loc_32><loc_56></location>1403/09/19</paragraph>
+<paragraph><location><page_1><loc_72><loc_51><loc_83><loc_53></location>شريذپ خيرات</paragraph>
+<paragraph><location><page_1><loc_23><loc_51><loc_32><loc_53></location>1403/10/04</paragraph>
+<paragraph><location><page_1><loc_62><loc_48><loc_83><loc_50></location>هضرع هتيمک هسلج هرامش</paragraph>
+<paragraph><location><page_1><loc_26><loc_49><loc_29><loc_50></location>436</paragraph>
+<paragraph><location><page_1><loc_67><loc_45><loc_83><loc_47></location>همانديما جرد خيرات</paragraph>
+<paragraph><location><page_1><loc_23><loc_46><loc_32><loc_48></location>1403/10/05</paragraph>
+<paragraph><location><page_1><loc_71><loc_43><loc_83><loc_45></location>شريذپ رواشم</paragraph>
+<paragraph><location><page_1><loc_21><loc_43><loc_34><loc_45></location>سروب نومرآ یرازگراک</paragraph>
+<paragraph><location><page_1><loc_47><loc_37><loc_83><loc_42></location>رد لااک شريذپ زا سپ هياپ تميق نييعت ةوحن سروب</paragraph>
+<paragraph><location><page_1><loc_18><loc_40><loc_36><loc_42></location>یناهج  یاه تميق ساسا رب</paragraph>
+<paragraph><location><page_1><loc_45><loc_32><loc_83><loc_37></location>شورف /شورف لک /ديلوت زا هضرع دصرد لقادح یلخاد</paragraph>
+<paragraph><location><page_1><loc_14><loc_35><loc_40><loc_37></location>نت 47.500 اي هنايلاس ديلوت زا %50 لقادح</paragraph>
+<paragraph><location><page_1><loc_68><loc_29><loc_83><loc_31></location>ليوحت زاجم یاطخ</paragraph>
+<paragraph><location><page_1><loc_18><loc_30><loc_37><loc_31></location>ليوحت لباق هلومحم نيرخآ 5%</paragraph>
+</document>
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v1/right_to_left_03.json b/tests/data/groundtruth/docling_v1/right_to_left_03.json
new file mode 100644
index 00000000..b78963fe
--- /dev/null
+++ b/tests/data/groundtruth/docling_v1/right_to_left_03.json
@@ -0,0 +1 @@
+{"_name": "", "type": "pdf-document", "description": {"title": null, "abstract": null, "authors": null, "affiliations": null, "subjects": null, "keywords": null, "publication_date": null, "languages": null, "license": null, "publishers": null, "url_refs": null, "references": null, "publication": null, "reference_count": null, "citation_count": null, "citation_date": null, "advanced": null, "analytics": null, "logs": [], "collection": null, "acquisition": null}, "file-info": {"filename": "right_to_left_03.pdf", "filename-prov": null, "document-hash": "367cb9ca8606ce5676164d44f08ba7e28b794379a2124402672712e12a160bee", "#-pages": 1, "collection-name": null, "description": null, "page-hashes": [{"hash": "c13f4c78e4268264071589d2e5620246a5c3b3bf286522a5fed5edb9b6fdc1bc", "model": "default", "page": 1}]}, "main-text": [{"prov": [{"bbox": [68.78399669083697, 761.0098882171737, 267.65960879695194, 779.3882381741187], "page": 1, "span": [0, 42], "__ref_s3_data": null}], "text": "\u06cc\u0644\u062e\u0627\u062f \u06cc\u0644\u0627\u0627\u06a9 - \u06cc\u0644\u0635\u0627 \u0631\u0627\u0632\u0627\u0628 \u0631\u062f \u0634\u0631\u064a\u0630\u067e \u0647\u0645\u0627\u0646\u062f\u064a\u0645\u0627", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"name": "Picture", "type": "figure", "$ref": "#/figures/0"}, {"prov": [{"bbox": [373.9899883190294, 685.3749983943645, 479.52999784465936, 703.4050283521253], "page": 1, "span": [0, 19], "__ref_s3_data": null}], "text": "\u0644\u0627\u0627\u06a9 \u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627 -2-5", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [458.7399879381041, 662.7401084473915, 519.2383976661823, 679.6162084078558], "page": 1, "span": [0, 13], "__ref_s3_data": null}], "text": "\u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627 \u0645\u0627\u0646", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [66.26399970216359, 631.5399785204845, 264.81795880972436, 681.171998404211], "page": 1, "span": [0, 97], "__ref_s3_data": null}], "text": "\u06cc\u0631\u06af \u0647\u062a\u062e\u064a\u0631 \u0634\u0648\u0631 \u0647\u0628 \u0647\u062f\u0634 \u062f\u064a\u0644\u0648\u062a \u0644\u0627\u0634\u0645\u0634 \u0648 \u0647\u0634\u0645\u0634 \u0641\u0631\u0635\u0645 \u062f\u0631\u0648\u0645 \u0647\u062a\u0633\u0648\u064a\u067e \u06cc\u0627 \u0647\u0632\u0627\u0633 \u06cc\u0627\u0647\u062f\u0644\u0627\u0648\u0641 \u0631\u062f - \u0642\u0628\u0627\u0637\u0645 \u062a\u0633\u0648\u064a\u067e \u0632\u064a\u0644\u0627\u0646\u0622", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [420.9099981081384, 608.8601085736167, 519.1619876665258, 625.7362085340809], "page": 1, "span": [0, 19], "__ref_s3_data": null}], "text": "\u06cc\u0644\u0645 \u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627 \u0647\u0631\u0627\u0645\u0634", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [236.80999893561153, 613.2999885632154, 265.01000880886113, 627.2919885304362], "page": 1, "span": [0, 5], "__ref_s3_data": null}], "text": "20300", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [406.9899881707045, 586.1501486268197, 519.1415376666176, 603.0262485872838], "page": 1, "span": [0, 21], "__ref_s3_data": null}], "text": "\u061f\u062a\u0633\u0627 \u06cc\u0631\u0627\u0628\u062c\u0627 \u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [197.32999911306206, 590.5900286164182, 264.91399880929265, 604.5820285836392], "page": 1, "span": [0, 13], "__ref_s3_data": null}], "text": "\u0631\u064a\u062e       \u06cc\u0644\u0628", "type": "checkbox-unselected", "payload": null, "name": "Checkbox-Unselected", "font": null}, {"prov": [{"bbox": [389.4699982494516, 563.4701486799523, 519.2136776662934, 580.3462486404165], "page": 1, "span": [0, 24], "__ref_s3_data": null}], "text": "\u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627 \u0647\u062f\u0646\u0646\u06a9\u0631\u062f\u0627\u0635 \u0639\u062c\u0631\u0645", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [166.5799992512739, 567.9100286695509, 264.77599880991295, 581.9020386367717], "page": 1, "span": [0, 26], "__ref_s3_data": null}], "text": "\u0646\u0627\u0631\u064a\u0627 \u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627 \u06cc\u0644\u0645 \u0646\u0627\u0645\u0632\u0627\u0633", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [292.129998686965, 518.5901487850932, 519.2351676661968, 557.6661986935493], "page": 1, "span": [0, 55], "__ref_s3_data": null}], "text": "\u0630\u062e\u0627 \u0627\u0631 \u0631\u0648\u06a9\u0630\u0645 \u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627 \u060c\u0644\u0648\u0635\u062d\u0645 \u0647\u062f\u0646\u0646\u06a9\u062f\u064a\u0644\u0648\u062a \u0627\u064a\u0622 \u061f\u062a\u0633\u0627 \u0647\u062f\u0648\u0645\u0646", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [197.32999911306206, 545.2299787226838, 208.04769906488926, 559.2219786899045], "page": 1, "span": [0, 3], "__ref_s3_data": null}], "text": "\u0631\u064a\u062e", "type": "checkbox-selected", "payload": null, "name": "Checkbox-Selected", "font": null}, {"prov": [{"bbox": [236.62821893642857, 545.2299787226838, 247.34591888825577, 559.2219786899045], "page": 1, "span": [0, 3], "__ref_s3_data": null}], "text": "\u06cc\u0644\u0628", "type": "checkbox-unselected", "payload": null, "name": "Checkbox-Unselected", "font": null}, {"prov": [{"bbox": [409.0299981615353, 473.71013889023413, 505.7644977267433, 490.58620885069837], "page": 1, "span": [0, 16], "__ref_s3_data": null}], "text": "\u0633\u0631\u0648\u0628 \u0631\u062f \u0634\u0631\u064a\u0630\u067e -3", "type": "subtitle-level-1", "payload": null, "name": "Section-header", "font": null}, {"prov": [{"bbox": [405.30999817825557, 451.01012894341363, 492.6107177858655, 467.88619890387787], "page": 1, "span": [0, 17], "__ref_s3_data": null}], "text": "\u06a9\u0631\u0627\u062f\u0645 \u0647\u0626\u0627\u0631\u0627 \u062e\u064a\u0631\u0627\u062a", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [137.89998938018175, 455.4699989329655, 187.8199891558066, 469.4620089001862], "page": 1, "span": [0, 10], "__ref_s3_data": null}], "text": "1403/09/19", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [426.309998083867, 428.3301389965463, 492.59463778593783, 445.2062089570106], "page": 1, "span": [0, 11], "__ref_s3_data": null}], "text": "\u0634\u0631\u064a\u0630\u067e \u062e\u064a\u0631\u0627\u062a", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [137.89998938018175, 432.7700189861449, 187.8199891558066, 446.7620189533657], "page": 1, "span": [0, 10], "__ref_s3_data": null}], "text": "1403/10/04", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [367.14998834977314, 405.65011904967906, 492.68526778553047, 422.5261790101433], "page": 1, "span": [0, 21], "__ref_s3_data": null}], "text": "\u0647\u0636\u0631\u0639 \u0647\u062a\u064a\u0645\u06a9 \u0647\u0633\u0644\u062c \u0647\u0631\u0627\u0645\u0634", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [154.69999930467083, 409.96999903955884, 171.19999923050838, 423.96200900677957], "page": 1, "span": [0, 3], "__ref_s3_data": null}], "text": "436", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [399.42998820468443, 382.8501291030928, 492.62752778578994, 399.72619906355703], "page": 1, "span": [0, 18], "__ref_s3_data": null}], "text": "\u0647\u0645\u0627\u0646\u062f\u064a\u0645\u0627 \u062c\u0631\u062f \u062e\u064a\u0631\u0627\u062a", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [137.89998938018175, 387.29000909269143, 187.8199891558066, 401.2820090599123], "page": 1, "span": [0, 10], "__ref_s3_data": null}], "text": "1403/10/05", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [422.82998809950857, 360.17013915622545, 492.6789577855588, 377.04619911668976], "page": 1, "span": [0, 11], "__ref_s3_data": null}], "text": "\u0634\u0631\u064a\u0630\u067e \u0631\u0648\u0627\u0634\u0645", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [122.05999945137766, 364.6100191458242, 203.6480090846645, 378.6020191130449], "page": 1, "span": [0, 19], "__ref_s3_data": null}], "text": "\u0633\u0631\u0648\u0628 \u0646\u0648\u0645\u0631\u0622 \u06cc\u0631\u0627\u0632\u06af\u0631\u0627\u06a9", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [281.3299887355078, 313.730129265021, 492.70525778544066, 352.6861891737582], "page": 1, "span": [0, 45], "__ref_s3_data": null}], "text": "\u0631\u062f \u0644\u0627\u0627\u06a9 \u0634\u0631\u064a\u0630\u067e \u0632\u0627 \u0633\u067e \u0647\u064a\u0627\u067e \u062a\u0645\u064a\u0642 \u0646\u064a\u064a\u0639\u062a \u0629\u0648\u062d\u0646 \u0633\u0631\u0648\u0628", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [109.21999950908952, 340.2499992028926, 213.67396903960088, 354.24199917011344], "page": 1, "span": [0, 23], "__ref_s3_data": null}], "text": "\u06cc\u0646\u0627\u0647\u062c  \u06cc\u0627\u0647 \u062a\u0645\u064a\u0642 \u0633\u0627\u0633\u0627 \u0631\u0628", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [266.5700088018494, 268.82012937023217, 492.7008677854604, 307.7761792789694], "page": 1, "span": [0, 45], "__ref_s3_data": null}], "text": "\u0634\u0648\u0631\u0641 /\u0634\u0648\u0631\u0641 \u0644\u06a9 /\u062f\u064a\u0644\u0648\u062a \u0632\u0627 \u0647\u0636\u0631\u0639 \u062f\u0635\u0631\u062f \u0644\u0642\u0627\u062f\u062d \u06cc\u0644\u062e\u0627\u062f", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [85.4639966158655, 295.33999930810376, 240.36199891964634, 309.3319992753245], "page": 1, "span": [0, 39], "__ref_s3_data": null}], "text": "\u0646\u062a 47.500 \u0627\u064a \u0647\u0646\u0627\u064a\u0644\u0627\u0633 \u062f\u064a\u0644\u0648\u062a \u0632\u0627 %50 \u0644\u0642\u0627\u062f\u062d", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [404.2300081831098, 246.02010942364598, 492.6399177857343, 262.8962093841102], "page": 1, "span": [0, 15], "__ref_s3_data": null}], "text": "\u0644\u064a\u0648\u062d\u062a \u0632\u0627\u062c\u0645 \u06cc\u0627\u0637\u062e", "type": "paragraph", "payload": null, "name": "Text", "font": null}, {"prov": [{"bbox": [106.93999951933742, 250.45998941324467, 218.89399901613845, 264.4519993804654], "page": 1, "span": [0, 26], "__ref_s3_data": null}], "text": "\u0644\u064a\u0648\u062d\u062a \u0644\u0628\u0627\u0642 \u0647\u0644\u0648\u0645\u062d\u0645 \u0646\u064a\u0631\u062e\u0622 5%", "type": "paragraph", "payload": null, "name": "Text", "font": null}], "figures": [{"prov": [{"bbox": [388.5767822265625, 739.034423828125, 482.4759216308594, 806.0041046142578], "page": 1, "span": [0, 0], "__ref_s3_data": null}], "text": "", "type": "figure", "payload": null, "bounding-box": null}], "tables": [], "bitmaps": null, "equations": [], "footnotes": [], "page-dimensions": [{"height": 842.0399780273438, "page": 1, "width": 595.3200073242188}], "page-footers": [], "page-headers": [], "_s3_data": null, "identifiers": null}
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v1/right_to_left_03.md b/tests/data/groundtruth/docling_v1/right_to_left_03.md
new file mode 100644
index 00000000..54902f36
--- /dev/null
+++ b/tests/data/groundtruth/docling_v1/right_to_left_03.md
@@ -0,0 +1,55 @@
+## یلخاد یلااک - یلصا رازاب رد شريذپ همانديما
+
+<!-- image -->
+
+## لااک درادناتسا -2-5
+
+درادناتسا مان
+
+یرگ هتخير شور هب هدش ديلوت لاشمش و هشمش فرصم دروم هتسويپ یا هزاس یاهدلاوف رد - قباطم تسويپ زيلانآ
+
+یلم درادناتسا هرامش
+
+20300
+
+؟تسا یرابجا درادناتسا
+
+درادناتسا هدننکرداص عجرم
+
+ناريا درادناتسا یلم نامزاس
+
+ذخا ار روکذم درادناتسا ،لوصحم هدننکديلوت ايآ ؟تسا هدومن
+
+## سروب رد شريذپ -3
+
+کرادم هئارا خيرات
+
+1403/09/19
+
+شريذپ خيرات
+
+1403/10/04
+
+هضرع هتيمک هسلج هرامش
+
+436
+
+همانديما جرد خيرات
+
+1403/10/05
+
+شريذپ رواشم
+
+سروب نومرآ یرازگراک
+
+رد لااک شريذپ زا سپ هياپ تميق نييعت ةوحن سروب
+
+یناهج  یاه تميق ساسا رب
+
+شورف /شورف لک /ديلوت زا هضرع دصرد لقادح یلخاد
+
+نت 47.500 اي هنايلاس ديلوت زا %50 لقادح
+
+ليوحت زاجم یاطخ
+
+ليوحت لباق هلومحم نيرخآ 5%
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v1/right_to_left_03.pages.json b/tests/data/groundtruth/docling_v1/right_to_left_03.pages.json
new file mode 100644
index 00000000..3a32bdc7
--- /dev/null
+++ b/tests/data/groundtruth/docling_v1/right_to_left_03.pages.json
@@ -0,0 +1 @@
+[{"page_no": 0, "size": {"width": 595.3200073242188, "height": 842.0399780273438}, "cells": [{"id": 0, "text": "  ", "bbox": {"l": 424.7499980908787, "t": 16.547979961232954, "r": 472.65999787553795, "b": 29.831969930112336, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "\u0646\u0627\u0631\u064a\u0627 \u06cc\u0644\u0627\u0627\u06a9 \u0633\u0631\u0648\u0628 \u062a\u06a9\u0631\u0634", "bbox": {"l": 388.989988251609, "t": 91.78875978496546, "r": 481.6045778353348, "b": 105.05883975387746, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "\u06cc\u0644\u062e\u0627\u062f \u06cc\u0644\u0627\u0627\u06a9 - \u06cc\u0644\u0635\u0627 \u0631\u0627\u0632\u0627\u0628 \u0631\u062f \u0634\u0631\u064a\u0630\u067e \u0647\u0645\u0627\u0646\u062f\u064a\u0645\u0627", "bbox": {"l": 68.78399669083697, "t": 62.65173985322508, "r": 267.65960879695194, "b": 81.03008981017001, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Page 7 ", "bbox": {"l": 267.2900087986132, "t": 779.4899791738803, "r": 294.5899986759081, "b": 790.0379791491694, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": " \u0644\u0627\u0627\u06a9 \u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627 -2-5", "bbox": {"l": 373.9899883190294, "t": 138.63494967521842, "r": 479.52999784465936, "b": 156.66497963297923, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "\u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627 \u0645\u0627\u0646", "bbox": {"l": 458.7399879381041, "t": 162.42376961948798, "r": 519.2383976661823, "b": 179.2998695799522, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": " \u06cc\u0631\u06af", "bbox": {"l": 66.38400270162423, "t": 160.86797962313278, "r": 82.90500562736736, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "\u0647\u062a\u062e\u064a\u0631", "bbox": {"l": 91.16550359023896, "t": 160.86797962313278, "r": 111.81675949741789, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "\u0634\u0648\u0631", "bbox": {"l": 120.07725946028945, "t": 160.86797962313278, "r": 132.46799940459687, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "\u0647\u0628", "bbox": {"l": 140.72851936746835, "t": 160.86797962313278, "r": 148.98900933034, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "\u0647\u062f\u0634", "bbox": {"l": 157.24950929321156, "t": 160.86797962313278, "r": 169.64025923751896, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "\u062f\u064a\u0644\u0648\u062a", "bbox": {"l": 177.90075920039052, "t": 160.86797962313278, "r": 198.55201910756944, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "\u0644\u0627\u0634\u0645\u0634", "bbox": {"l": 206.812519070441, "t": 160.86797962313278, "r": 227.46375897762002, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "\u0648", "bbox": {"l": 235.72425894049158, "t": 160.86797962313278, "r": 239.85451892192734, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "\u0647\u0634\u0645\u0634", "bbox": {"l": 248.1150188847989, "t": 160.86797962313278, "r": 264.63601881054205, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "\u0641\u0631\u0635\u0645", "bbox": {"l": 193.57520912993866, "t": 178.74798958124518, "r": 209.40560905878587, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "\u062f\u0631\u0648\u0645", "bbox": {"l": 217.3208190232094, "t": 178.74798958124518, "r": 233.15122895205658, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "\u0647\u062a\u0633\u0648\u064a\u067e", "bbox": {"l": 241.06643891648014, "t": 178.74798958124518, "r": 264.81203880975096, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "\u06cc\u0627", "bbox": {"l": 105.01999952796723, "t": 178.74798958124518, "r": 112.34326949505137, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "\u0647\u0632\u0627\u0633", "bbox": {"l": 119.66654946213548, "t": 178.74798958124518, "r": 134.3130993963037, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "\u06cc\u0627\u0647\u062f\u0644\u0627\u0648\u0641", "bbox": {"l": 141.63636936338784, "t": 178.74798958124518, "r": 170.92946923172434, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "\u0631\u062f", "bbox": {"l": 178.25274919880843, "t": 178.74798958124518, "r": 185.57601916589257, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "- ", "bbox": {"l": 96.02400156840149, "t": 178.74798958124518, "r": 103.62799953422386, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": " \u0642\u0628\u0627\u0637\u0645 ", "bbox": {"l": 66.26399970216359, "t": 178.74798958124518, "r": 94.75199857411876, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "\u062a\u0633\u0648\u064a\u067e \u0632\u064a\u0644\u0627\u0646\u0622", "bbox": {"l": 218.2100090192128, "t": 196.50799953963872, "r": 264.81795880972436, "b": 210.49999950685924, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "\u06cc\u0644\u0645 \u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627 \u0647\u0631\u0627\u0645\u0634", "bbox": {"l": 420.9099981081384, "t": 216.30376949326285, "r": 519.1619876665258, "b": 233.17986945372706, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "20300", "bbox": {"l": 236.80999893561153, "t": 214.7479894969075, "r": 265.01000880886113, "b": 228.73998946412837, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "\u061f\u062a\u0633\u0627 \u06cc\u0631\u0627\u0628\u062c\u0627 \u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627", "bbox": {"l": 406.9899881707045, "t": 239.01372944005993, "r": 519.1415376666176, "b": 255.88982940052404, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "\u0631\u064a\u062e       \u06cc\u0644\u0628      ", "bbox": {"l": 197.32999911306206, "t": 237.4579494437046, "r": 264.91399880929265, "b": 251.44994941092557, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "\u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627 \u0647\u062f\u0646\u0646\u06a9\u0631\u062f\u0627\u0635 \u0639\u062c\u0631\u0645", "bbox": {"l": 389.4699982494516, "t": 261.6937293869272, "r": 519.2136776662934, "b": 278.5698293473914, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "\u0646\u0627\u0631\u064a\u0627 \u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627 \u06cc\u0644\u0645 \u0646\u0627\u0645\u0632\u0627\u0633", "bbox": {"l": 166.5799992512739, "t": 260.137939390572, "r": 264.77599880991295, "b": 274.12994935779284, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": " \u0630\u062e\u0627 \u0627\u0631 \u0631\u0648\u06a9\u0630\u0645 \u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627 \u060c\u0644\u0648\u0635\u062d\u0645 \u0647\u062f\u0646\u0646\u06a9\u062f\u064a\u0644\u0648\u062a \u0627\u064a\u0622", "bbox": {"l": 292.129998686965, "t": 284.37377933379446, "r": 519.114747666738, "b": 301.24987929425856, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "\u061f\u062a\u0633\u0627 \u0647\u062f\u0648\u0645\u0646", "bbox": {"l": 461.98000792354117, "t": 306.5737292817864, "r": 519.2351676661968, "b": 323.44982924225053, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "      ", "bbox": {"l": 247.36999888814756, "t": 282.81799933743923, "r": 264.91399880929265, "b": 296.80999930466, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "\u0631\u064a\u062e", "bbox": {"l": 197.32999911306206, "t": 282.81799933743923, "r": 208.04769906488926, "b": 296.80999930466, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "\u06cc\u0644\u0628", "bbox": {"l": 236.62821893642857, "t": 282.81799933743923, "r": 247.34591888825577, "b": 296.80999930466, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "\u0633\u0631\u0648\u0628 \u0631\u062f \u0634\u0631\u064a\u0630\u067e -3", "bbox": {"l": 409.0299981615353, "t": 351.4537691766454, "r": 505.7644977267433, "b": 368.3298391371096, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": " \u06a9\u0631\u0627\u062f\u0645 \u0647\u0626\u0627\u0631\u0627 \u062e\u064a\u0631\u0627\u062a", "bbox": {"l": 405.30999817825557, "t": 374.1537791234659, "r": 492.6107177858655, "b": 391.0298490839301, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "1403/09/19", "bbox": {"l": 137.89998938018175, "t": 372.57796912715753, "r": 187.8199891558066, "b": 386.56997909437825, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": " \u0634\u0631\u064a\u0630\u067e \u062e\u064a\u0631\u0627\u062a", "bbox": {"l": 426.309998083867, "t": 396.8337690703332, "r": 492.59463778593783, "b": 413.70983903079747, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "1403/10/04", "bbox": {"l": 137.89998938018175, "t": 395.277959073978, "r": 187.8199891558066, "b": 409.26995904119883, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": " \u0647\u0636\u0631\u0639 \u0647\u062a\u064a\u0645\u06a9 \u0647\u0633\u0644\u062c \u0647\u0631\u0627\u0645\u0634", "bbox": {"l": 367.14998834977314, "t": 419.5137990172004, "r": 492.68526778553047, "b": 436.3898589776647, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "436", "bbox": {"l": 154.69999930467083, "t": 418.0779690205642, "r": 171.19999923050838, "b": 432.0699789877849, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": " \u0647\u0645\u0627\u0646\u062f\u064a\u0645\u0627 \u062c\u0631\u062f \u062e\u064a\u0631\u0627\u062a", "bbox": {"l": 399.42998820468443, "t": 442.3137789637867, "r": 492.62752778578994, "b": 459.18984892425095, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "1403/10/05", "bbox": {"l": 137.89998938018175, "t": 440.75796896743145, "r": 187.8199891558066, "b": 454.7499689346523, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": " \u0634\u0631\u064a\u0630\u067e \u0631\u0648\u0627\u0634\u0645", "bbox": {"l": 422.82998809950857, "t": 464.993778910654, "r": 492.6789577855588, "b": 481.8698388711183, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "\u0633\u0631\u0648\u0628 \u0646\u0648\u0645\u0631\u0622 \u06cc\u0631\u0627\u0632\u06af\u0631\u0627\u06a9", "bbox": {"l": 122.05999945137766, "t": 463.43795891429886, "r": 203.6480090846645, "b": 477.42995888151955, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": " \u0631\u062f \u0644\u0627\u0627\u06a9 \u0634\u0631\u064a\u0630\u067e \u0632\u0627 \u0633\u067e \u0647\u064a\u0627\u067e \u062a\u0645\u064a\u0642 \u0646\u064a\u064a\u0639\u062a \u0629\u0648\u062d\u0646", "bbox": {"l": 281.3299887355078, "t": 489.35378885358557, "r": 492.5758377860224, "b": 506.2298588140498, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "\u0633\u0631\u0648\u0628", "bbox": {"l": 465.57998790736036, "t": 511.4337788018585, "r": 492.70525778544066, "b": 528.3098487623228, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": " \u06cc\u0646\u0627\u0647\u062c  \u06cc\u0627\u0647 \u062a\u0645\u064a\u0642 \u0633\u0627\u0633\u0627 \u0631\u0628", "bbox": {"l": 109.21999950908952, "t": 487.7979788572303, "r": 213.67396903960088, "b": 501.78997882445117, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": " \u0634\u0648\u0631\u0641 /\u0634\u0648\u0631\u0641 \u0644\u06a9 /\u062f\u064a\u0644\u0648\u062a \u0632\u0627 \u0647\u0636\u0631\u0639 \u062f\u0635\u0631\u062f \u0644\u0642\u0627\u062f\u062d", "bbox": {"l": 266.5700088018494, "t": 534.2637987483744, "r": 492.6496877856904, "b": 551.1398587088386, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "\u06cc\u0644\u062e\u0627\u062f", "bbox": {"l": 462.2199979224626, "t": 556.3437786966474, "r": 492.7008677854604, "b": 573.2198486571116, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "\u0646\u062a 47.500 \u0627\u064a \u0647\u0646\u0627\u064a\u0644\u0627\u0633 \u062f\u064a\u0644\u0648\u062a \u0632\u0627 %50 \u0644\u0642\u0627\u062f\u062d", "bbox": {"l": 85.4639966158655, "t": 532.7079787520192, "r": 240.36199891964634, "b": 546.69997871924, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "\u0644\u064a\u0648\u062d\u062a \u0632\u0627\u062c\u0645 \u06cc\u0627\u0637\u062e", "bbox": {"l": 404.2300081831098, "t": 579.1437686432336, "r": 492.6399177857343, "b": 596.0198686036978, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "\u0644\u064a\u0648\u062d\u062a \u0644\u0628\u0627\u0642 \u0647\u0644\u0648\u0645\u062d\u0645 \u0646\u064a\u0631\u062e\u0622 5%", "bbox": {"l": 106.93999951933742, "t": 577.5879786468784, "r": 218.89399901613845, "b": 591.5799886140991, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 0, "label": "picture", "bbox": {"l": 388.5767822265625, "t": 36.03587341308594, "r": 482.4759216308594, "b": 103.00555419921875, "coord_origin": "TOPLEFT"}, "confidence": 0.9453065991401672, "cells": [{"id": 1, "text": "\u0646\u0627\u0631\u064a\u0627 \u06cc\u0644\u0627\u0627\u06a9 \u0633\u0631\u0648\u0628 \u062a\u06a9\u0631\u0634", "bbox": {"l": 388.989988251609, "t": 91.78875978496546, "r": 481.6045778353348, "b": 105.05883975387746, "coord_origin": "TOPLEFT"}}], "children": [{"id": 43, "label": "text", "bbox": {"l": 388.989988251609, "t": 91.78875978496546, "r": 481.6045778353348, "b": 105.05883975387746, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 1, "text": "\u0646\u0627\u0631\u064a\u0627 \u06cc\u0644\u0627\u0627\u06a9 \u0633\u0631\u0648\u0628 \u062a\u06a9\u0631\u0634", "bbox": {"l": 388.989988251609, "t": 91.78875978496546, "r": 481.6045778353348, "b": 105.05883975387746, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 28, "label": "section_header", "bbox": {"l": 68.78399669083697, "t": 62.65173985322508, "r": 267.65960879695194, "b": 81.03008981017001, "coord_origin": "TOPLEFT"}, "confidence": 0.6917961239814758, "cells": [{"id": 2, "text": "\u06cc\u0644\u062e\u0627\u062f \u06cc\u0644\u0627\u0627\u06a9 - \u06cc\u0644\u0635\u0627 \u0631\u0627\u0632\u0627\u0628 \u0631\u062f \u0634\u0631\u064a\u0630\u067e \u0647\u0645\u0627\u0646\u062f\u064a\u0645\u0627", "bbox": {"l": 68.78399669083697, "t": 62.65173985322508, "r": 267.65960879695194, "b": 81.03008981017001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "page_footer", "bbox": {"l": 267.2900087986132, "t": 779.4899791738803, "r": 294.5899986759081, "b": 790.0379791491694, "coord_origin": "TOPLEFT"}, "confidence": 0.899228036403656, "cells": [{"id": 3, "text": "Page 7 ", "bbox": {"l": 267.2900087986132, "t": 779.4899791738803, "r": 294.5899986759081, "b": 790.0379791491694, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "section_header", "bbox": {"l": 373.9899883190294, "t": 138.63494967521842, "r": 479.52999784465936, "b": 156.66497963297923, "coord_origin": "TOPLEFT"}, "confidence": 0.7994307279586792, "cells": [{"id": 4, "text": " \u0644\u0627\u0627\u06a9 \u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627 -2-5", "bbox": {"l": 373.9899883190294, "t": 138.63494967521842, "r": 479.52999784465936, "b": 156.66497963297923, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "key_value_region", "bbox": {"l": 66.26399970216359, "t": 160.86797962313278, "r": 519.2383976661823, "b": 323.44982924225053, "coord_origin": "TOPLEFT"}, "confidence": 0.6362584233283997, "cells": [{"id": 5, "text": "\u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627 \u0645\u0627\u0646", "bbox": {"l": 458.7399879381041, "t": 162.42376961948798, "r": 519.2383976661823, "b": 179.2998695799522, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": " \u06cc\u0631\u06af", "bbox": {"l": 66.38400270162423, "t": 160.86797962313278, "r": 82.90500562736736, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "\u0647\u062a\u062e\u064a\u0631", "bbox": {"l": 91.16550359023896, "t": 160.86797962313278, "r": 111.81675949741789, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "\u0634\u0648\u0631", "bbox": {"l": 120.07725946028945, "t": 160.86797962313278, "r": 132.46799940459687, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "\u0647\u0628", "bbox": {"l": 140.72851936746835, "t": 160.86797962313278, "r": 148.98900933034, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "\u0647\u062f\u0634", "bbox": {"l": 157.24950929321156, "t": 160.86797962313278, "r": 169.64025923751896, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "\u062f\u064a\u0644\u0648\u062a", "bbox": {"l": 177.90075920039052, "t": 160.86797962313278, "r": 198.55201910756944, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "\u0644\u0627\u0634\u0645\u0634", "bbox": {"l": 206.812519070441, "t": 160.86797962313278, "r": 227.46375897762002, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "\u0648", "bbox": {"l": 235.72425894049158, "t": 160.86797962313278, "r": 239.85451892192734, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "\u0647\u0634\u0645\u0634", "bbox": {"l": 248.1150188847989, "t": 160.86797962313278, "r": 264.63601881054205, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "\u0641\u0631\u0635\u0645", "bbox": {"l": 193.57520912993866, "t": 178.74798958124518, "r": 209.40560905878587, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "\u062f\u0631\u0648\u0645", "bbox": {"l": 217.3208190232094, "t": 178.74798958124518, "r": 233.15122895205658, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "\u0647\u062a\u0633\u0648\u064a\u067e", "bbox": {"l": 241.06643891648014, "t": 178.74798958124518, "r": 264.81203880975096, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "\u06cc\u0627", "bbox": {"l": 105.01999952796723, "t": 178.74798958124518, "r": 112.34326949505137, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "\u0647\u0632\u0627\u0633", "bbox": {"l": 119.66654946213548, "t": 178.74798958124518, "r": 134.3130993963037, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "\u06cc\u0627\u0647\u062f\u0644\u0627\u0648\u0641", "bbox": {"l": 141.63636936338784, "t": 178.74798958124518, "r": 170.92946923172434, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "\u0631\u062f", "bbox": {"l": 178.25274919880843, "t": 178.74798958124518, "r": 185.57601916589257, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "- ", "bbox": {"l": 96.02400156840149, "t": 178.74798958124518, "r": 103.62799953422386, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": " \u0642\u0628\u0627\u0637\u0645 ", "bbox": {"l": 66.26399970216359, "t": 178.74798958124518, "r": 94.75199857411876, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "\u062a\u0633\u0648\u064a\u067e \u0632\u064a\u0644\u0627\u0646\u0622", "bbox": {"l": 218.2100090192128, "t": 196.50799953963872, "r": 264.81795880972436, "b": 210.49999950685924, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "\u06cc\u0644\u0645 \u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627 \u0647\u0631\u0627\u0645\u0634", "bbox": {"l": 420.9099981081384, "t": 216.30376949326285, "r": 519.1619876665258, "b": 233.17986945372706, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "20300", "bbox": {"l": 236.80999893561153, "t": 214.7479894969075, "r": 265.01000880886113, "b": 228.73998946412837, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "\u061f\u062a\u0633\u0627 \u06cc\u0631\u0627\u0628\u062c\u0627 \u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627", "bbox": {"l": 406.9899881707045, "t": 239.01372944005993, "r": 519.1415376666176, "b": 255.88982940052404, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "\u0631\u064a\u062e       \u06cc\u0644\u0628      ", "bbox": {"l": 197.32999911306206, "t": 237.4579494437046, "r": 264.91399880929265, "b": 251.44994941092557, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "\u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627 \u0647\u062f\u0646\u0646\u06a9\u0631\u062f\u0627\u0635 \u0639\u062c\u0631\u0645", "bbox": {"l": 389.4699982494516, "t": 261.6937293869272, "r": 519.2136776662934, "b": 278.5698293473914, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "\u0646\u0627\u0631\u064a\u0627 \u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627 \u06cc\u0644\u0645 \u0646\u0627\u0645\u0632\u0627\u0633", "bbox": {"l": 166.5799992512739, "t": 260.137939390572, "r": 264.77599880991295, "b": 274.12994935779284, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": " \u0630\u062e\u0627 \u0627\u0631 \u0631\u0648\u06a9\u0630\u0645 \u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627 \u060c\u0644\u0648\u0635\u062d\u0645 \u0647\u062f\u0646\u0646\u06a9\u062f\u064a\u0644\u0648\u062a \u0627\u064a\u0622", "bbox": {"l": 292.129998686965, "t": 284.37377933379446, "r": 519.114747666738, "b": 301.24987929425856, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "\u061f\u062a\u0633\u0627 \u0647\u062f\u0648\u0645\u0646", "bbox": {"l": 461.98000792354117, "t": 306.5737292817864, "r": 519.2351676661968, "b": 323.44982924225053, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "\u0631\u064a\u062e", "bbox": {"l": 197.32999911306206, "t": 282.81799933743923, "r": 208.04769906488926, "b": 296.80999930466, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "\u06cc\u0644\u0628", "bbox": {"l": 236.62821893642857, "t": 282.81799933743923, "r": 247.34591888825577, "b": 296.80999930466, "coord_origin": "TOPLEFT"}}], "children": [{"id": 25, "label": "text", "bbox": {"l": 458.7399879381041, "t": 162.42376961948798, "r": 519.2383976661823, "b": 179.2998695799522, "coord_origin": "TOPLEFT"}, "confidence": 0.7258325815200806, "cells": [{"id": 5, "text": "\u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627 \u0645\u0627\u0646", "bbox": {"l": 458.7399879381041, "t": 162.42376961948798, "r": 519.2383976661823, "b": 179.2998695799522, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 66.26399970216359, "t": 160.86797962313278, "r": 264.81795880972436, "b": 210.49999950685924, "coord_origin": "TOPLEFT"}, "confidence": 0.8694157004356384, "cells": [{"id": 6, "text": " \u06cc\u0631\u06af", "bbox": {"l": 66.38400270162423, "t": 160.86797962313278, "r": 82.90500562736736, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "\u0647\u062a\u062e\u064a\u0631", "bbox": {"l": 91.16550359023896, "t": 160.86797962313278, "r": 111.81675949741789, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "\u0634\u0648\u0631", "bbox": {"l": 120.07725946028945, "t": 160.86797962313278, "r": 132.46799940459687, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "\u0647\u0628", "bbox": {"l": 140.72851936746835, "t": 160.86797962313278, "r": 148.98900933034, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "\u0647\u062f\u0634", "bbox": {"l": 157.24950929321156, "t": 160.86797962313278, "r": 169.64025923751896, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "\u062f\u064a\u0644\u0648\u062a", "bbox": {"l": 177.90075920039052, "t": 160.86797962313278, "r": 198.55201910756944, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "\u0644\u0627\u0634\u0645\u0634", "bbox": {"l": 206.812519070441, "t": 160.86797962313278, "r": 227.46375897762002, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "\u0648", "bbox": {"l": 235.72425894049158, "t": 160.86797962313278, "r": 239.85451892192734, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "\u0647\u0634\u0645\u0634", "bbox": {"l": 248.1150188847989, "t": 160.86797962313278, "r": 264.63601881054205, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "\u0641\u0631\u0635\u0645", "bbox": {"l": 193.57520912993866, "t": 178.74798958124518, "r": 209.40560905878587, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "\u062f\u0631\u0648\u0645", "bbox": {"l": 217.3208190232094, "t": 178.74798958124518, "r": 233.15122895205658, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "\u0647\u062a\u0633\u0648\u064a\u067e", "bbox": {"l": 241.06643891648014, "t": 178.74798958124518, "r": 264.81203880975096, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "\u06cc\u0627", "bbox": {"l": 105.01999952796723, "t": 178.74798958124518, "r": 112.34326949505137, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "\u0647\u0632\u0627\u0633", "bbox": {"l": 119.66654946213548, "t": 178.74798958124518, "r": 134.3130993963037, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "\u06cc\u0627\u0647\u062f\u0644\u0627\u0648\u0641", "bbox": {"l": 141.63636936338784, "t": 178.74798958124518, "r": 170.92946923172434, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "\u0631\u062f", "bbox": {"l": 178.25274919880843, "t": 178.74798958124518, "r": 185.57601916589257, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "- ", "bbox": {"l": 96.02400156840149, "t": 178.74798958124518, "r": 103.62799953422386, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": " \u0642\u0628\u0627\u0637\u0645 ", "bbox": {"l": 66.26399970216359, "t": 178.74798958124518, "r": 94.75199857411876, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "\u062a\u0633\u0648\u064a\u067e \u0632\u064a\u0644\u0627\u0646\u0622", "bbox": {"l": 218.2100090192128, "t": 196.50799953963872, "r": 264.81795880972436, "b": 210.49999950685924, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 420.9099981081384, "t": 216.30376949326285, "r": 519.1619876665258, "b": 233.17986945372706, "coord_origin": "TOPLEFT"}, "confidence": 0.8121814727783203, "cells": [{"id": 25, "text": "\u06cc\u0644\u0645 \u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627 \u0647\u0631\u0627\u0645\u0634", "bbox": {"l": 420.9099981081384, "t": 216.30376949326285, "r": 519.1619876665258, "b": 233.17986945372706, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 236.80999893561153, "t": 214.7479894969075, "r": 265.01000880886113, "b": 228.73998946412837, "coord_origin": "TOPLEFT"}, "confidence": 0.7672220468521118, "cells": [{"id": 26, "text": "20300", "bbox": {"l": 236.80999893561153, "t": 214.7479894969075, "r": 265.01000880886113, "b": 228.73998946412837, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "text", "bbox": {"l": 406.9899881707045, "t": 239.01372944005993, "r": 519.1415376666176, "b": 255.88982940052404, "coord_origin": "TOPLEFT"}, "confidence": 0.8320456743240356, "cells": [{"id": 27, "text": "\u061f\u062a\u0633\u0627 \u06cc\u0631\u0627\u0628\u062c\u0627 \u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627", "bbox": {"l": 406.9899881707045, "t": 239.01372944005993, "r": 519.1415376666176, "b": 255.88982940052404, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "checkbox_unselected", "bbox": {"l": 197.32999911306206, "t": 237.4579494437046, "r": 264.91399880929265, "b": 251.44994941092557, "coord_origin": "TOPLEFT"}, "confidence": 0.5538824796676636, "cells": [{"id": 28, "text": "\u0631\u064a\u062e       \u06cc\u0644\u0628      ", "bbox": {"l": 197.32999911306206, "t": 237.4579494437046, "r": 264.91399880929265, "b": 251.44994941092557, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 389.4699982494516, "t": 261.6937293869272, "r": 519.2136776662934, "b": 278.5698293473914, "coord_origin": "TOPLEFT"}, "confidence": 0.7909000515937805, "cells": [{"id": 29, "text": "\u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627 \u0647\u062f\u0646\u0646\u06a9\u0631\u062f\u0627\u0635 \u0639\u062c\u0631\u0645", "bbox": {"l": 389.4699982494516, "t": 261.6937293869272, "r": 519.2136776662934, "b": 278.5698293473914, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 166.5799992512739, "t": 260.137939390572, "r": 264.77599880991295, "b": 274.12994935779284, "coord_origin": "TOPLEFT"}, "confidence": 0.7620571851730347, "cells": [{"id": 30, "text": "\u0646\u0627\u0631\u064a\u0627 \u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627 \u06cc\u0644\u0645 \u0646\u0627\u0645\u0632\u0627\u0633", "bbox": {"l": 166.5799992512739, "t": 260.137939390572, "r": 264.77599880991295, "b": 274.12994935779284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 292.129998686965, "t": 284.37377933379446, "r": 519.2351676661968, "b": 323.44982924225053, "coord_origin": "TOPLEFT"}, "confidence": 0.6534578204154968, "cells": [{"id": 31, "text": " \u0630\u062e\u0627 \u0627\u0631 \u0631\u0648\u06a9\u0630\u0645 \u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627 \u060c\u0644\u0648\u0635\u062d\u0645 \u0647\u062f\u0646\u0646\u06a9\u062f\u064a\u0644\u0648\u062a \u0627\u064a\u0622", "bbox": {"l": 292.129998686965, "t": 284.37377933379446, "r": 519.114747666738, "b": 301.24987929425856, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "\u061f\u062a\u0633\u0627 \u0647\u062f\u0648\u0645\u0646", "bbox": {"l": 461.98000792354117, "t": 306.5737292817864, "r": 519.2351676661968, "b": 323.44982924225053, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "checkbox_selected", "bbox": {"l": 197.32999911306206, "t": 282.81799933743923, "r": 208.04769906488926, "b": 296.80999930466, "coord_origin": "TOPLEFT"}, "confidence": 0.49446165561676025, "cells": [{"id": 34, "text": "\u0631\u064a\u062e", "bbox": {"l": 197.32999911306206, "t": 282.81799933743923, "r": 208.04769906488926, "b": 296.80999930466, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "checkbox_unselected", "bbox": {"l": 236.62821893642857, "t": 282.81799933743923, "r": 247.34591888825577, "b": 296.80999930466, "coord_origin": "TOPLEFT"}, "confidence": 0.5417144298553467, "cells": [{"id": 35, "text": "\u06cc\u0644\u0628", "bbox": {"l": 236.62821893642857, "t": 282.81799933743923, "r": 247.34591888825577, "b": 296.80999930466, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 31, "label": "section_header", "bbox": {"l": 409.0299981615353, "t": 351.4537691766454, "r": 505.7644977267433, "b": 368.3298391371096, "coord_origin": "TOPLEFT"}, "confidence": 0.6514244079589844, "cells": [{"id": 36, "text": "\u0633\u0631\u0648\u0628 \u0631\u062f \u0634\u0631\u064a\u0630\u067e -3", "bbox": {"l": 409.0299981615353, "t": 351.4537691766454, "r": 505.7644977267433, "b": 368.3298391371096, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "key_value_region", "bbox": {"l": 85.4639966158655, "t": 372.57796912715753, "r": 492.70525778544066, "b": 596.0198686036978, "coord_origin": "TOPLEFT"}, "confidence": 0.719137966632843, "cells": [{"id": 37, "text": " \u06a9\u0631\u0627\u062f\u0645 \u0647\u0626\u0627\u0631\u0627 \u062e\u064a\u0631\u0627\u062a", "bbox": {"l": 405.30999817825557, "t": 374.1537791234659, "r": 492.6107177858655, "b": 391.0298490839301, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "1403/09/19", "bbox": {"l": 137.89998938018175, "t": 372.57796912715753, "r": 187.8199891558066, "b": 386.56997909437825, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": " \u0634\u0631\u064a\u0630\u067e \u062e\u064a\u0631\u0627\u062a", "bbox": {"l": 426.309998083867, "t": 396.8337690703332, "r": 492.59463778593783, "b": 413.70983903079747, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "1403/10/04", "bbox": {"l": 137.89998938018175, "t": 395.277959073978, "r": 187.8199891558066, "b": 409.26995904119883, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": " \u0647\u0636\u0631\u0639 \u0647\u062a\u064a\u0645\u06a9 \u0647\u0633\u0644\u062c \u0647\u0631\u0627\u0645\u0634", "bbox": {"l": 367.14998834977314, "t": 419.5137990172004, "r": 492.68526778553047, "b": 436.3898589776647, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "436", "bbox": {"l": 154.69999930467083, "t": 418.0779690205642, "r": 171.19999923050838, "b": 432.0699789877849, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": " \u0647\u0645\u0627\u0646\u062f\u064a\u0645\u0627 \u062c\u0631\u062f \u062e\u064a\u0631\u0627\u062a", "bbox": {"l": 399.42998820468443, "t": 442.3137789637867, "r": 492.62752778578994, "b": 459.18984892425095, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "1403/10/05", "bbox": {"l": 137.89998938018175, "t": 440.75796896743145, "r": 187.8199891558066, "b": 454.7499689346523, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": " \u0634\u0631\u064a\u0630\u067e \u0631\u0648\u0627\u0634\u0645", "bbox": {"l": 422.82998809950857, "t": 464.993778910654, "r": 492.6789577855588, "b": 481.8698388711183, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "\u0633\u0631\u0648\u0628 \u0646\u0648\u0645\u0631\u0622 \u06cc\u0631\u0627\u0632\u06af\u0631\u0627\u06a9", "bbox": {"l": 122.05999945137766, "t": 463.43795891429886, "r": 203.6480090846645, "b": 477.42995888151955, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": " \u0631\u062f \u0644\u0627\u0627\u06a9 \u0634\u0631\u064a\u0630\u067e \u0632\u0627 \u0633\u067e \u0647\u064a\u0627\u067e \u062a\u0645\u064a\u0642 \u0646\u064a\u064a\u0639\u062a \u0629\u0648\u062d\u0646", "bbox": {"l": 281.3299887355078, "t": 489.35378885358557, "r": 492.5758377860224, "b": 506.2298588140498, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "\u0633\u0631\u0648\u0628", "bbox": {"l": 465.57998790736036, "t": 511.4337788018585, "r": 492.70525778544066, "b": 528.3098487623228, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": " \u06cc\u0646\u0627\u0647\u062c  \u06cc\u0627\u0647 \u062a\u0645\u064a\u0642 \u0633\u0627\u0633\u0627 \u0631\u0628", "bbox": {"l": 109.21999950908952, "t": 487.7979788572303, "r": 213.67396903960088, "b": 501.78997882445117, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": " \u0634\u0648\u0631\u0641 /\u0634\u0648\u0631\u0641 \u0644\u06a9 /\u062f\u064a\u0644\u0648\u062a \u0632\u0627 \u0647\u0636\u0631\u0639 \u062f\u0635\u0631\u062f \u0644\u0642\u0627\u062f\u062d", "bbox": {"l": 266.5700088018494, "t": 534.2637987483744, "r": 492.6496877856904, "b": 551.1398587088386, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "\u06cc\u0644\u062e\u0627\u062f", "bbox": {"l": 462.2199979224626, "t": 556.3437786966474, "r": 492.7008677854604, "b": 573.2198486571116, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "\u0646\u062a 47.500 \u0627\u064a \u0647\u0646\u0627\u064a\u0644\u0627\u0633 \u062f\u064a\u0644\u0648\u062a \u0632\u0627 %50 \u0644\u0642\u0627\u062f\u062d", "bbox": {"l": 85.4639966158655, "t": 532.7079787520192, "r": 240.36199891964634, "b": 546.69997871924, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "\u0644\u064a\u0648\u062d\u062a \u0632\u0627\u062c\u0645 \u06cc\u0627\u0637\u062e", "bbox": {"l": 404.2300081831098, "t": 579.1437686432336, "r": 492.6399177857343, "b": 596.0198686036978, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "\u0644\u064a\u0648\u062d\u062a \u0644\u0628\u0627\u0642 \u0647\u0644\u0648\u0645\u062d\u0645 \u0646\u064a\u0631\u062e\u0622 5%", "bbox": {"l": 106.93999951933742, "t": 577.5879786468784, "r": 218.89399901613845, "b": 591.5799886140991, "coord_origin": "TOPLEFT"}}], "children": [{"id": 15, "label": "text", "bbox": {"l": 405.30999817825557, "t": 374.1537791234659, "r": 492.6107177858655, "b": 391.0298490839301, "coord_origin": "TOPLEFT"}, "confidence": 0.7834645509719849, "cells": [{"id": 37, "text": " \u06a9\u0631\u0627\u062f\u0645 \u0647\u0626\u0627\u0631\u0627 \u062e\u064a\u0631\u0627\u062a", "bbox": {"l": 405.30999817825557, "t": 374.1537791234659, "r": 492.6107177858655, "b": 391.0298490839301, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "text", "bbox": {"l": 137.89998938018175, "t": 372.57796912715753, "r": 187.8199891558066, "b": 386.56997909437825, "coord_origin": "TOPLEFT"}, "confidence": 0.8262879252433777, "cells": [{"id": 38, "text": "1403/09/19", "bbox": {"l": 137.89998938018175, "t": 372.57796912715753, "r": 187.8199891558066, "b": 386.56997909437825, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 426.309998083867, "t": 396.8337690703332, "r": 492.59463778593783, "b": 413.70983903079747, "coord_origin": "TOPLEFT"}, "confidence": 0.7766718864440918, "cells": [{"id": 39, "text": " \u0634\u0631\u064a\u0630\u067e \u062e\u064a\u0631\u0627\u062a", "bbox": {"l": 426.309998083867, "t": 396.8337690703332, "r": 492.59463778593783, "b": 413.70983903079747, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "text", "bbox": {"l": 137.89998938018175, "t": 395.277959073978, "r": 187.8199891558066, "b": 409.26995904119883, "coord_origin": "TOPLEFT"}, "confidence": 0.8204737901687622, "cells": [{"id": 40, "text": "1403/10/04", "bbox": {"l": 137.89998938018175, "t": 395.277959073978, "r": 187.8199891558066, "b": 409.26995904119883, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 367.14998834977314, "t": 419.5137990172004, "r": 492.68526778553047, "b": 436.3898589776647, "coord_origin": "TOPLEFT"}, "confidence": 0.7670677900314331, "cells": [{"id": 41, "text": " \u0647\u0636\u0631\u0639 \u0647\u062a\u064a\u0645\u06a9 \u0647\u0633\u0644\u062c \u0647\u0631\u0627\u0645\u0634", "bbox": {"l": 367.14998834977314, "t": 419.5137990172004, "r": 492.68526778553047, "b": 436.3898589776647, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "text", "bbox": {"l": 154.69999930467083, "t": 418.0779690205642, "r": 171.19999923050838, "b": 432.0699789877849, "coord_origin": "TOPLEFT"}, "confidence": 0.8048340082168579, "cells": [{"id": 42, "text": "436", "bbox": {"l": 154.69999930467083, "t": 418.0779690205642, "r": 171.19999923050838, "b": 432.0699789877849, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 399.42998820468443, "t": 442.3137789637867, "r": 492.62752778578994, "b": 459.18984892425095, "coord_origin": "TOPLEFT"}, "confidence": 0.775697648525238, "cells": [{"id": 43, "text": " \u0647\u0645\u0627\u0646\u062f\u064a\u0645\u0627 \u062c\u0631\u062f \u062e\u064a\u0631\u0627\u062a", "bbox": {"l": 399.42998820468443, "t": 442.3137789637867, "r": 492.62752778578994, "b": 459.18984892425095, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "text", "bbox": {"l": 137.89998938018175, "t": 440.75796896743145, "r": 187.8199891558066, "b": 454.7499689346523, "coord_origin": "TOPLEFT"}, "confidence": 0.827337384223938, "cells": [{"id": 44, "text": "1403/10/05", "bbox": {"l": 137.89998938018175, "t": 440.75796896743145, "r": 187.8199891558066, "b": 454.7499689346523, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 422.82998809950857, "t": 464.993778910654, "r": 492.6789577855588, "b": 481.8698388711183, "coord_origin": "TOPLEFT"}, "confidence": 0.7342236638069153, "cells": [{"id": 45, "text": " \u0634\u0631\u064a\u0630\u067e \u0631\u0648\u0627\u0634\u0645", "bbox": {"l": 422.82998809950857, "t": 464.993778910654, "r": 492.6789577855588, "b": 481.8698388711183, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 122.05999945137766, "t": 463.43795891429886, "r": 203.6480090846645, "b": 477.42995888151955, "coord_origin": "TOPLEFT"}, "confidence": 0.8411222696304321, "cells": [{"id": 46, "text": "\u0633\u0631\u0648\u0628 \u0646\u0648\u0645\u0631\u0622 \u06cc\u0631\u0627\u0632\u06af\u0631\u0627\u06a9", "bbox": {"l": 122.05999945137766, "t": 463.43795891429886, "r": 203.6480090846645, "b": 477.42995888151955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 281.3299887355078, "t": 489.35378885358557, "r": 492.70525778544066, "b": 528.3098487623228, "coord_origin": "TOPLEFT"}, "confidence": 0.7251589894294739, "cells": [{"id": 47, "text": " \u0631\u062f \u0644\u0627\u0627\u06a9 \u0634\u0631\u064a\u0630\u067e \u0632\u0627 \u0633\u067e \u0647\u064a\u0627\u067e \u062a\u0645\u064a\u0642 \u0646\u064a\u064a\u0639\u062a \u0629\u0648\u062d\u0646", "bbox": {"l": 281.3299887355078, "t": 489.35378885358557, "r": 492.5758377860224, "b": 506.2298588140498, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "\u0633\u0631\u0648\u0628", "bbox": {"l": 465.57998790736036, "t": 511.4337788018585, "r": 492.70525778544066, "b": 528.3098487623228, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 109.21999950908952, "t": 487.7979788572303, "r": 213.67396903960088, "b": 501.78997882445117, "coord_origin": "TOPLEFT"}, "confidence": 0.7848678827285767, "cells": [{"id": 49, "text": " \u06cc\u0646\u0627\u0647\u062c  \u06cc\u0627\u0647 \u062a\u0645\u064a\u0642 \u0633\u0627\u0633\u0627 \u0631\u0628", "bbox": {"l": 109.21999950908952, "t": 487.7979788572303, "r": 213.67396903960088, "b": 501.78997882445117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 266.5700088018494, "t": 534.2637987483744, "r": 492.7008677854604, "b": 573.2198486571116, "coord_origin": "TOPLEFT"}, "confidence": 0.7586438059806824, "cells": [{"id": 50, "text": " \u0634\u0648\u0631\u0641 /\u0634\u0648\u0631\u0641 \u0644\u06a9 /\u062f\u064a\u0644\u0648\u062a \u0632\u0627 \u0647\u0636\u0631\u0639 \u062f\u0635\u0631\u062f \u0644\u0642\u0627\u062f\u062d", "bbox": {"l": 266.5700088018494, "t": 534.2637987483744, "r": 492.6496877856904, "b": 551.1398587088386, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "\u06cc\u0644\u062e\u0627\u062f", "bbox": {"l": 462.2199979224626, "t": 556.3437786966474, "r": 492.7008677854604, "b": 573.2198486571116, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 85.4639966158655, "t": 532.7079787520192, "r": 240.36199891964634, "b": 546.69997871924, "coord_origin": "TOPLEFT"}, "confidence": 0.7897851467132568, "cells": [{"id": 52, "text": "\u0646\u062a 47.500 \u0627\u064a \u0647\u0646\u0627\u064a\u0644\u0627\u0633 \u062f\u064a\u0644\u0648\u062a \u0632\u0627 %50 \u0644\u0642\u0627\u062f\u062d", "bbox": {"l": 85.4639966158655, "t": 532.7079787520192, "r": 240.36199891964634, "b": 546.69997871924, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 404.2300081831098, "t": 579.1437686432336, "r": 492.6399177857343, "b": 596.0198686036978, "coord_origin": "TOPLEFT"}, "confidence": 0.7759335041046143, "cells": [{"id": 53, "text": "\u0644\u064a\u0648\u062d\u062a \u0632\u0627\u062c\u0645 \u06cc\u0627\u0637\u062e", "bbox": {"l": 404.2300081831098, "t": 579.1437686432336, "r": 492.6399177857343, "b": 596.0198686036978, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "text", "bbox": {"l": 106.93999951933742, "t": 577.5879786468784, "r": 218.89399901613845, "b": 591.5799886140991, "coord_origin": "TOPLEFT"}, "confidence": 0.8144810795783997, "cells": [{"id": 54, "text": "\u0644\u064a\u0648\u062d\u062a \u0644\u0628\u0627\u0642 \u0647\u0644\u0648\u0645\u062d\u0645 \u0646\u064a\u0631\u062e\u0622 5%", "bbox": {"l": 106.93999951933742, "t": 577.5879786468784, "r": 218.89399901613845, "b": 591.5799886140991, "coord_origin": "TOPLEFT"}}], "children": []}]}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "picture", "id": 0, "page_no": 0, "cluster": {"id": 0, "label": "picture", "bbox": {"l": 388.5767822265625, "t": 36.03587341308594, "r": 482.4759216308594, "b": 103.00555419921875, "coord_origin": "TOPLEFT"}, "confidence": 0.9453065991401672, "cells": [{"id": 1, "text": "\u0646\u0627\u0631\u064a\u0627 \u06cc\u0644\u0627\u0627\u06a9 \u0633\u0631\u0648\u0628 \u062a\u06a9\u0631\u0634", "bbox": {"l": 388.989988251609, "t": 91.78875978496546, "r": 481.6045778353348, "b": 105.05883975387746, "coord_origin": "TOPLEFT"}}], "children": [{"id": 43, "label": "text", "bbox": {"l": 388.989988251609, "t": 91.78875978496546, "r": 481.6045778353348, "b": 105.05883975387746, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 1, "text": "\u0646\u0627\u0631\u064a\u0627 \u06cc\u0644\u0627\u0627\u06a9 \u0633\u0631\u0648\u0628 \u062a\u06a9\u0631\u0634", "bbox": {"l": 388.989988251609, "t": 91.78875978496546, "r": 481.6045778353348, "b": 105.05883975387746, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "section_header", "id": 28, "page_no": 0, "cluster": {"id": 28, "label": "section_header", "bbox": {"l": 68.78399669083697, "t": 62.65173985322508, "r": 267.65960879695194, "b": 81.03008981017001, "coord_origin": "TOPLEFT"}, "confidence": 0.6917961239814758, "cells": [{"id": 2, "text": "\u06cc\u0644\u062e\u0627\u062f \u06cc\u0644\u0627\u0627\u06a9 - \u06cc\u0644\u0635\u0627 \u0631\u0627\u0632\u0627\u0628 \u0631\u062f \u0634\u0631\u064a\u0630\u067e \u0647\u0645\u0627\u0646\u062f\u064a\u0645\u0627", "bbox": {"l": 68.78399669083697, "t": 62.65173985322508, "r": 267.65960879695194, "b": 81.03008981017001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u06cc\u0644\u062e\u0627\u062f \u06cc\u0644\u0627\u0627\u06a9 - \u06cc\u0644\u0635\u0627 \u0631\u0627\u0632\u0627\u0628 \u0631\u062f \u0634\u0631\u064a\u0630\u067e \u0647\u0645\u0627\u0646\u062f\u064a\u0645\u0627"}, {"label": "page_footer", "id": 1, "page_no": 0, "cluster": {"id": 1, "label": "page_footer", "bbox": {"l": 267.2900087986132, "t": 779.4899791738803, "r": 294.5899986759081, "b": 790.0379791491694, "coord_origin": "TOPLEFT"}, "confidence": 0.899228036403656, "cells": [{"id": 3, "text": "Page 7 ", "bbox": {"l": 267.2900087986132, "t": 779.4899791738803, "r": 294.5899986759081, "b": 790.0379791491694, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Page 7"}, {"label": "section_header", "id": 11, "page_no": 0, "cluster": {"id": 11, "label": "section_header", "bbox": {"l": 373.9899883190294, "t": 138.63494967521842, "r": 479.52999784465936, "b": 156.66497963297923, "coord_origin": "TOPLEFT"}, "confidence": 0.7994307279586792, "cells": [{"id": 4, "text": " \u0644\u0627\u0627\u06a9 \u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627 -2-5", "bbox": {"l": 373.9899883190294, "t": 138.63494967521842, "r": 479.52999784465936, "b": 156.66497963297923, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u0644\u0627\u0627\u06a9 \u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627 -2-5"}, {"label": "key_value_region", "id": 33, "page_no": 0, "cluster": {"id": 33, "label": "key_value_region", "bbox": {"l": 66.26399970216359, "t": 160.86797962313278, "r": 519.2383976661823, "b": 323.44982924225053, "coord_origin": "TOPLEFT"}, "confidence": 0.6362584233283997, "cells": [{"id": 5, "text": "\u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627 \u0645\u0627\u0646", "bbox": {"l": 458.7399879381041, "t": 162.42376961948798, "r": 519.2383976661823, "b": 179.2998695799522, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": " \u06cc\u0631\u06af", "bbox": {"l": 66.38400270162423, "t": 160.86797962313278, "r": 82.90500562736736, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "\u0647\u062a\u062e\u064a\u0631", "bbox": {"l": 91.16550359023896, "t": 160.86797962313278, "r": 111.81675949741789, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "\u0634\u0648\u0631", "bbox": {"l": 120.07725946028945, "t": 160.86797962313278, "r": 132.46799940459687, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "\u0647\u0628", "bbox": {"l": 140.72851936746835, "t": 160.86797962313278, "r": 148.98900933034, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "\u0647\u062f\u0634", "bbox": {"l": 157.24950929321156, "t": 160.86797962313278, "r": 169.64025923751896, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "\u062f\u064a\u0644\u0648\u062a", "bbox": {"l": 177.90075920039052, "t": 160.86797962313278, "r": 198.55201910756944, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "\u0644\u0627\u0634\u0645\u0634", "bbox": {"l": 206.812519070441, "t": 160.86797962313278, "r": 227.46375897762002, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "\u0648", "bbox": {"l": 235.72425894049158, "t": 160.86797962313278, "r": 239.85451892192734, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "\u0647\u0634\u0645\u0634", "bbox": {"l": 248.1150188847989, "t": 160.86797962313278, "r": 264.63601881054205, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "\u0641\u0631\u0635\u0645", "bbox": {"l": 193.57520912993866, "t": 178.74798958124518, "r": 209.40560905878587, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "\u062f\u0631\u0648\u0645", "bbox": {"l": 217.3208190232094, "t": 178.74798958124518, "r": 233.15122895205658, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "\u0647\u062a\u0633\u0648\u064a\u067e", "bbox": {"l": 241.06643891648014, "t": 178.74798958124518, "r": 264.81203880975096, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "\u06cc\u0627", "bbox": {"l": 105.01999952796723, "t": 178.74798958124518, "r": 112.34326949505137, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "\u0647\u0632\u0627\u0633", "bbox": {"l": 119.66654946213548, "t": 178.74798958124518, "r": 134.3130993963037, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "\u06cc\u0627\u0647\u062f\u0644\u0627\u0648\u0641", "bbox": {"l": 141.63636936338784, "t": 178.74798958124518, "r": 170.92946923172434, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "\u0631\u062f", "bbox": {"l": 178.25274919880843, "t": 178.74798958124518, "r": 185.57601916589257, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "- ", "bbox": {"l": 96.02400156840149, "t": 178.74798958124518, "r": 103.62799953422386, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": " \u0642\u0628\u0627\u0637\u0645 ", "bbox": {"l": 66.26399970216359, "t": 178.74798958124518, "r": 94.75199857411876, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "\u062a\u0633\u0648\u064a\u067e \u0632\u064a\u0644\u0627\u0646\u0622", "bbox": {"l": 218.2100090192128, "t": 196.50799953963872, "r": 264.81795880972436, "b": 210.49999950685924, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "\u06cc\u0644\u0645 \u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627 \u0647\u0631\u0627\u0645\u0634", "bbox": {"l": 420.9099981081384, "t": 216.30376949326285, "r": 519.1619876665258, "b": 233.17986945372706, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "20300", "bbox": {"l": 236.80999893561153, "t": 214.7479894969075, "r": 265.01000880886113, "b": 228.73998946412837, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "\u061f\u062a\u0633\u0627 \u06cc\u0631\u0627\u0628\u062c\u0627 \u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627", "bbox": {"l": 406.9899881707045, "t": 239.01372944005993, "r": 519.1415376666176, "b": 255.88982940052404, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "\u0631\u064a\u062e       \u06cc\u0644\u0628      ", "bbox": {"l": 197.32999911306206, "t": 237.4579494437046, "r": 264.91399880929265, "b": 251.44994941092557, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "\u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627 \u0647\u062f\u0646\u0646\u06a9\u0631\u062f\u0627\u0635 \u0639\u062c\u0631\u0645", "bbox": {"l": 389.4699982494516, "t": 261.6937293869272, "r": 519.2136776662934, "b": 278.5698293473914, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "\u0646\u0627\u0631\u064a\u0627 \u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627 \u06cc\u0644\u0645 \u0646\u0627\u0645\u0632\u0627\u0633", "bbox": {"l": 166.5799992512739, "t": 260.137939390572, "r": 264.77599880991295, "b": 274.12994935779284, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": " \u0630\u062e\u0627 \u0627\u0631 \u0631\u0648\u06a9\u0630\u0645 \u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627 \u060c\u0644\u0648\u0635\u062d\u0645 \u0647\u062f\u0646\u0646\u06a9\u062f\u064a\u0644\u0648\u062a \u0627\u064a\u0622", "bbox": {"l": 292.129998686965, "t": 284.37377933379446, "r": 519.114747666738, "b": 301.24987929425856, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "\u061f\u062a\u0633\u0627 \u0647\u062f\u0648\u0645\u0646", "bbox": {"l": 461.98000792354117, "t": 306.5737292817864, "r": 519.2351676661968, "b": 323.44982924225053, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "\u0631\u064a\u062e", "bbox": {"l": 197.32999911306206, "t": 282.81799933743923, "r": 208.04769906488926, "b": 296.80999930466, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "\u06cc\u0644\u0628", "bbox": {"l": 236.62821893642857, "t": 282.81799933743923, "r": 247.34591888825577, "b": 296.80999930466, "coord_origin": "TOPLEFT"}}], "children": [{"id": 25, "label": "text", "bbox": {"l": 458.7399879381041, "t": 162.42376961948798, "r": 519.2383976661823, "b": 179.2998695799522, "coord_origin": "TOPLEFT"}, "confidence": 0.7258325815200806, "cells": [{"id": 5, "text": "\u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627 \u0645\u0627\u0646", "bbox": {"l": 458.7399879381041, "t": 162.42376961948798, "r": 519.2383976661823, "b": 179.2998695799522, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 66.26399970216359, "t": 160.86797962313278, "r": 264.81795880972436, "b": 210.49999950685924, "coord_origin": "TOPLEFT"}, "confidence": 0.8694157004356384, "cells": [{"id": 6, "text": " \u06cc\u0631\u06af", "bbox": {"l": 66.38400270162423, "t": 160.86797962313278, "r": 82.90500562736736, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "\u0647\u062a\u062e\u064a\u0631", "bbox": {"l": 91.16550359023896, "t": 160.86797962313278, "r": 111.81675949741789, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "\u0634\u0648\u0631", "bbox": {"l": 120.07725946028945, "t": 160.86797962313278, "r": 132.46799940459687, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "\u0647\u0628", "bbox": {"l": 140.72851936746835, "t": 160.86797962313278, "r": 148.98900933034, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "\u0647\u062f\u0634", "bbox": {"l": 157.24950929321156, "t": 160.86797962313278, "r": 169.64025923751896, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "\u062f\u064a\u0644\u0648\u062a", "bbox": {"l": 177.90075920039052, "t": 160.86797962313278, "r": 198.55201910756944, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "\u0644\u0627\u0634\u0645\u0634", "bbox": {"l": 206.812519070441, "t": 160.86797962313278, "r": 227.46375897762002, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "\u0648", "bbox": {"l": 235.72425894049158, "t": 160.86797962313278, "r": 239.85451892192734, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "\u0647\u0634\u0645\u0634", "bbox": {"l": 248.1150188847989, "t": 160.86797962313278, "r": 264.63601881054205, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "\u0641\u0631\u0635\u0645", "bbox": {"l": 193.57520912993866, "t": 178.74798958124518, "r": 209.40560905878587, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "\u062f\u0631\u0648\u0645", "bbox": {"l": 217.3208190232094, "t": 178.74798958124518, "r": 233.15122895205658, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "\u0647\u062a\u0633\u0648\u064a\u067e", "bbox": {"l": 241.06643891648014, "t": 178.74798958124518, "r": 264.81203880975096, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "\u06cc\u0627", "bbox": {"l": 105.01999952796723, "t": 178.74798958124518, "r": 112.34326949505137, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "\u0647\u0632\u0627\u0633", "bbox": {"l": 119.66654946213548, "t": 178.74798958124518, "r": 134.3130993963037, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "\u06cc\u0627\u0647\u062f\u0644\u0627\u0648\u0641", "bbox": {"l": 141.63636936338784, "t": 178.74798958124518, "r": 170.92946923172434, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "\u0631\u062f", "bbox": {"l": 178.25274919880843, "t": 178.74798958124518, "r": 185.57601916589257, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "- ", "bbox": {"l": 96.02400156840149, "t": 178.74798958124518, "r": 103.62799953422386, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": " \u0642\u0628\u0627\u0637\u0645 ", "bbox": {"l": 66.26399970216359, "t": 178.74798958124518, "r": 94.75199857411876, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "\u062a\u0633\u0648\u064a\u067e \u0632\u064a\u0644\u0627\u0646\u0622", "bbox": {"l": 218.2100090192128, "t": 196.50799953963872, "r": 264.81795880972436, "b": 210.49999950685924, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 420.9099981081384, "t": 216.30376949326285, "r": 519.1619876665258, "b": 233.17986945372706, "coord_origin": "TOPLEFT"}, "confidence": 0.8121814727783203, "cells": [{"id": 25, "text": "\u06cc\u0644\u0645 \u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627 \u0647\u0631\u0627\u0645\u0634", "bbox": {"l": 420.9099981081384, "t": 216.30376949326285, "r": 519.1619876665258, "b": 233.17986945372706, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 236.80999893561153, "t": 214.7479894969075, "r": 265.01000880886113, "b": 228.73998946412837, "coord_origin": "TOPLEFT"}, "confidence": 0.7672220468521118, "cells": [{"id": 26, "text": "20300", "bbox": {"l": 236.80999893561153, "t": 214.7479894969075, "r": 265.01000880886113, "b": 228.73998946412837, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "text", "bbox": {"l": 406.9899881707045, "t": 239.01372944005993, "r": 519.1415376666176, "b": 255.88982940052404, "coord_origin": "TOPLEFT"}, "confidence": 0.8320456743240356, "cells": [{"id": 27, "text": "\u061f\u062a\u0633\u0627 \u06cc\u0631\u0627\u0628\u062c\u0627 \u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627", "bbox": {"l": 406.9899881707045, "t": 239.01372944005993, "r": 519.1415376666176, "b": 255.88982940052404, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "checkbox_unselected", "bbox": {"l": 197.32999911306206, "t": 237.4579494437046, "r": 264.91399880929265, "b": 251.44994941092557, "coord_origin": "TOPLEFT"}, "confidence": 0.5538824796676636, "cells": [{"id": 28, "text": "\u0631\u064a\u062e       \u06cc\u0644\u0628      ", "bbox": {"l": 197.32999911306206, "t": 237.4579494437046, "r": 264.91399880929265, "b": 251.44994941092557, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 389.4699982494516, "t": 261.6937293869272, "r": 519.2136776662934, "b": 278.5698293473914, "coord_origin": "TOPLEFT"}, "confidence": 0.7909000515937805, "cells": [{"id": 29, "text": "\u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627 \u0647\u062f\u0646\u0646\u06a9\u0631\u062f\u0627\u0635 \u0639\u062c\u0631\u0645", "bbox": {"l": 389.4699982494516, "t": 261.6937293869272, "r": 519.2136776662934, "b": 278.5698293473914, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 166.5799992512739, "t": 260.137939390572, "r": 264.77599880991295, "b": 274.12994935779284, "coord_origin": "TOPLEFT"}, "confidence": 0.7620571851730347, "cells": [{"id": 30, "text": "\u0646\u0627\u0631\u064a\u0627 \u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627 \u06cc\u0644\u0645 \u0646\u0627\u0645\u0632\u0627\u0633", "bbox": {"l": 166.5799992512739, "t": 260.137939390572, "r": 264.77599880991295, "b": 274.12994935779284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 292.129998686965, "t": 284.37377933379446, "r": 519.2351676661968, "b": 323.44982924225053, "coord_origin": "TOPLEFT"}, "confidence": 0.6534578204154968, "cells": [{"id": 31, "text": " \u0630\u062e\u0627 \u0627\u0631 \u0631\u0648\u06a9\u0630\u0645 \u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627 \u060c\u0644\u0648\u0635\u062d\u0645 \u0647\u062f\u0646\u0646\u06a9\u062f\u064a\u0644\u0648\u062a \u0627\u064a\u0622", "bbox": {"l": 292.129998686965, "t": 284.37377933379446, "r": 519.114747666738, "b": 301.24987929425856, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "\u061f\u062a\u0633\u0627 \u0647\u062f\u0648\u0645\u0646", "bbox": {"l": 461.98000792354117, "t": 306.5737292817864, "r": 519.2351676661968, "b": 323.44982924225053, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "checkbox_selected", "bbox": {"l": 197.32999911306206, "t": 282.81799933743923, "r": 208.04769906488926, "b": 296.80999930466, "coord_origin": "TOPLEFT"}, "confidence": 0.49446165561676025, "cells": [{"id": 34, "text": "\u0631\u064a\u062e", "bbox": {"l": 197.32999911306206, "t": 282.81799933743923, "r": 208.04769906488926, "b": 296.80999930466, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "checkbox_unselected", "bbox": {"l": 236.62821893642857, "t": 282.81799933743923, "r": 247.34591888825577, "b": 296.80999930466, "coord_origin": "TOPLEFT"}, "confidence": 0.5417144298553467, "cells": [{"id": 35, "text": "\u06cc\u0644\u0628", "bbox": {"l": 236.62821893642857, "t": 282.81799933743923, "r": 247.34591888825577, "b": 296.80999930466, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null}, {"label": "section_header", "id": 31, "page_no": 0, "cluster": {"id": 31, "label": "section_header", "bbox": {"l": 409.0299981615353, "t": 351.4537691766454, "r": 505.7644977267433, "b": 368.3298391371096, "coord_origin": "TOPLEFT"}, "confidence": 0.6514244079589844, "cells": [{"id": 36, "text": "\u0633\u0631\u0648\u0628 \u0631\u062f \u0634\u0631\u064a\u0630\u067e -3", "bbox": {"l": 409.0299981615353, "t": 351.4537691766454, "r": 505.7644977267433, "b": 368.3298391371096, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u0633\u0631\u0648\u0628 \u0631\u062f \u0634\u0631\u064a\u0630\u067e -3"}, {"label": "key_value_region", "id": 27, "page_no": 0, "cluster": {"id": 27, "label": "key_value_region", "bbox": {"l": 85.4639966158655, "t": 372.57796912715753, "r": 492.70525778544066, "b": 596.0198686036978, "coord_origin": "TOPLEFT"}, "confidence": 0.719137966632843, "cells": [{"id": 37, "text": " \u06a9\u0631\u0627\u062f\u0645 \u0647\u0626\u0627\u0631\u0627 \u062e\u064a\u0631\u0627\u062a", "bbox": {"l": 405.30999817825557, "t": 374.1537791234659, "r": 492.6107177858655, "b": 391.0298490839301, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "1403/09/19", "bbox": {"l": 137.89998938018175, "t": 372.57796912715753, "r": 187.8199891558066, "b": 386.56997909437825, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": " \u0634\u0631\u064a\u0630\u067e \u062e\u064a\u0631\u0627\u062a", "bbox": {"l": 426.309998083867, "t": 396.8337690703332, "r": 492.59463778593783, "b": 413.70983903079747, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "1403/10/04", "bbox": {"l": 137.89998938018175, "t": 395.277959073978, "r": 187.8199891558066, "b": 409.26995904119883, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": " \u0647\u0636\u0631\u0639 \u0647\u062a\u064a\u0645\u06a9 \u0647\u0633\u0644\u062c \u0647\u0631\u0627\u0645\u0634", "bbox": {"l": 367.14998834977314, "t": 419.5137990172004, "r": 492.68526778553047, "b": 436.3898589776647, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "436", "bbox": {"l": 154.69999930467083, "t": 418.0779690205642, "r": 171.19999923050838, "b": 432.0699789877849, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": " \u0647\u0645\u0627\u0646\u062f\u064a\u0645\u0627 \u062c\u0631\u062f \u062e\u064a\u0631\u0627\u062a", "bbox": {"l": 399.42998820468443, "t": 442.3137789637867, "r": 492.62752778578994, "b": 459.18984892425095, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "1403/10/05", "bbox": {"l": 137.89998938018175, "t": 440.75796896743145, "r": 187.8199891558066, "b": 454.7499689346523, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": " \u0634\u0631\u064a\u0630\u067e \u0631\u0648\u0627\u0634\u0645", "bbox": {"l": 422.82998809950857, "t": 464.993778910654, "r": 492.6789577855588, "b": 481.8698388711183, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "\u0633\u0631\u0648\u0628 \u0646\u0648\u0645\u0631\u0622 \u06cc\u0631\u0627\u0632\u06af\u0631\u0627\u06a9", "bbox": {"l": 122.05999945137766, "t": 463.43795891429886, "r": 203.6480090846645, "b": 477.42995888151955, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": " \u0631\u062f \u0644\u0627\u0627\u06a9 \u0634\u0631\u064a\u0630\u067e \u0632\u0627 \u0633\u067e \u0647\u064a\u0627\u067e \u062a\u0645\u064a\u0642 \u0646\u064a\u064a\u0639\u062a \u0629\u0648\u062d\u0646", "bbox": {"l": 281.3299887355078, "t": 489.35378885358557, "r": 492.5758377860224, "b": 506.2298588140498, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "\u0633\u0631\u0648\u0628", "bbox": {"l": 465.57998790736036, "t": 511.4337788018585, "r": 492.70525778544066, "b": 528.3098487623228, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": " \u06cc\u0646\u0627\u0647\u062c  \u06cc\u0627\u0647 \u062a\u0645\u064a\u0642 \u0633\u0627\u0633\u0627 \u0631\u0628", "bbox": {"l": 109.21999950908952, "t": 487.7979788572303, "r": 213.67396903960088, "b": 501.78997882445117, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": " \u0634\u0648\u0631\u0641 /\u0634\u0648\u0631\u0641 \u0644\u06a9 /\u062f\u064a\u0644\u0648\u062a \u0632\u0627 \u0647\u0636\u0631\u0639 \u062f\u0635\u0631\u062f \u0644\u0642\u0627\u062f\u062d", "bbox": {"l": 266.5700088018494, "t": 534.2637987483744, "r": 492.6496877856904, "b": 551.1398587088386, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "\u06cc\u0644\u062e\u0627\u062f", "bbox": {"l": 462.2199979224626, "t": 556.3437786966474, "r": 492.7008677854604, "b": 573.2198486571116, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "\u0646\u062a 47.500 \u0627\u064a \u0647\u0646\u0627\u064a\u0644\u0627\u0633 \u062f\u064a\u0644\u0648\u062a \u0632\u0627 %50 \u0644\u0642\u0627\u062f\u062d", "bbox": {"l": 85.4639966158655, "t": 532.7079787520192, "r": 240.36199891964634, "b": 546.69997871924, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "\u0644\u064a\u0648\u062d\u062a \u0632\u0627\u062c\u0645 \u06cc\u0627\u0637\u062e", "bbox": {"l": 404.2300081831098, "t": 579.1437686432336, "r": 492.6399177857343, "b": 596.0198686036978, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "\u0644\u064a\u0648\u062d\u062a \u0644\u0628\u0627\u0642 \u0647\u0644\u0648\u0645\u062d\u0645 \u0646\u064a\u0631\u062e\u0622 5%", "bbox": {"l": 106.93999951933742, "t": 577.5879786468784, "r": 218.89399901613845, "b": 591.5799886140991, "coord_origin": "TOPLEFT"}}], "children": [{"id": 15, "label": "text", "bbox": {"l": 405.30999817825557, "t": 374.1537791234659, "r": 492.6107177858655, "b": 391.0298490839301, "coord_origin": "TOPLEFT"}, "confidence": 0.7834645509719849, "cells": [{"id": 37, "text": " \u06a9\u0631\u0627\u062f\u0645 \u0647\u0626\u0627\u0631\u0627 \u062e\u064a\u0631\u0627\u062a", "bbox": {"l": 405.30999817825557, "t": 374.1537791234659, "r": 492.6107177858655, "b": 391.0298490839301, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "text", "bbox": {"l": 137.89998938018175, "t": 372.57796912715753, "r": 187.8199891558066, "b": 386.56997909437825, "coord_origin": "TOPLEFT"}, "confidence": 0.8262879252433777, "cells": [{"id": 38, "text": "1403/09/19", "bbox": {"l": 137.89998938018175, "t": 372.57796912715753, "r": 187.8199891558066, "b": 386.56997909437825, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 426.309998083867, "t": 396.8337690703332, "r": 492.59463778593783, "b": 413.70983903079747, "coord_origin": "TOPLEFT"}, "confidence": 0.7766718864440918, "cells": [{"id": 39, "text": " \u0634\u0631\u064a\u0630\u067e \u062e\u064a\u0631\u0627\u062a", "bbox": {"l": 426.309998083867, "t": 396.8337690703332, "r": 492.59463778593783, "b": 413.70983903079747, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "text", "bbox": {"l": 137.89998938018175, "t": 395.277959073978, "r": 187.8199891558066, "b": 409.26995904119883, "coord_origin": "TOPLEFT"}, "confidence": 0.8204737901687622, "cells": [{"id": 40, "text": "1403/10/04", "bbox": {"l": 137.89998938018175, "t": 395.277959073978, "r": 187.8199891558066, "b": 409.26995904119883, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 367.14998834977314, "t": 419.5137990172004, "r": 492.68526778553047, "b": 436.3898589776647, "coord_origin": "TOPLEFT"}, "confidence": 0.7670677900314331, "cells": [{"id": 41, "text": " \u0647\u0636\u0631\u0639 \u0647\u062a\u064a\u0645\u06a9 \u0647\u0633\u0644\u062c \u0647\u0631\u0627\u0645\u0634", "bbox": {"l": 367.14998834977314, "t": 419.5137990172004, "r": 492.68526778553047, "b": 436.3898589776647, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "text", "bbox": {"l": 154.69999930467083, "t": 418.0779690205642, "r": 171.19999923050838, "b": 432.0699789877849, "coord_origin": "TOPLEFT"}, "confidence": 0.8048340082168579, "cells": [{"id": 42, "text": "436", "bbox": {"l": 154.69999930467083, "t": 418.0779690205642, "r": 171.19999923050838, "b": 432.0699789877849, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 399.42998820468443, "t": 442.3137789637867, "r": 492.62752778578994, "b": 459.18984892425095, "coord_origin": "TOPLEFT"}, "confidence": 0.775697648525238, "cells": [{"id": 43, "text": " \u0647\u0645\u0627\u0646\u062f\u064a\u0645\u0627 \u062c\u0631\u062f \u062e\u064a\u0631\u0627\u062a", "bbox": {"l": 399.42998820468443, "t": 442.3137789637867, "r": 492.62752778578994, "b": 459.18984892425095, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "text", "bbox": {"l": 137.89998938018175, "t": 440.75796896743145, "r": 187.8199891558066, "b": 454.7499689346523, "coord_origin": "TOPLEFT"}, "confidence": 0.827337384223938, "cells": [{"id": 44, "text": "1403/10/05", "bbox": {"l": 137.89998938018175, "t": 440.75796896743145, "r": 187.8199891558066, "b": 454.7499689346523, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 422.82998809950857, "t": 464.993778910654, "r": 492.6789577855588, "b": 481.8698388711183, "coord_origin": "TOPLEFT"}, "confidence": 0.7342236638069153, "cells": [{"id": 45, "text": " \u0634\u0631\u064a\u0630\u067e \u0631\u0648\u0627\u0634\u0645", "bbox": {"l": 422.82998809950857, "t": 464.993778910654, "r": 492.6789577855588, "b": 481.8698388711183, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 122.05999945137766, "t": 463.43795891429886, "r": 203.6480090846645, "b": 477.42995888151955, "coord_origin": "TOPLEFT"}, "confidence": 0.8411222696304321, "cells": [{"id": 46, "text": "\u0633\u0631\u0648\u0628 \u0646\u0648\u0645\u0631\u0622 \u06cc\u0631\u0627\u0632\u06af\u0631\u0627\u06a9", "bbox": {"l": 122.05999945137766, "t": 463.43795891429886, "r": 203.6480090846645, "b": 477.42995888151955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 281.3299887355078, "t": 489.35378885358557, "r": 492.70525778544066, "b": 528.3098487623228, "coord_origin": "TOPLEFT"}, "confidence": 0.7251589894294739, "cells": [{"id": 47, "text": " \u0631\u062f \u0644\u0627\u0627\u06a9 \u0634\u0631\u064a\u0630\u067e \u0632\u0627 \u0633\u067e \u0647\u064a\u0627\u067e \u062a\u0645\u064a\u0642 \u0646\u064a\u064a\u0639\u062a \u0629\u0648\u062d\u0646", "bbox": {"l": 281.3299887355078, "t": 489.35378885358557, "r": 492.5758377860224, "b": 506.2298588140498, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "\u0633\u0631\u0648\u0628", "bbox": {"l": 465.57998790736036, "t": 511.4337788018585, "r": 492.70525778544066, "b": 528.3098487623228, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 109.21999950908952, "t": 487.7979788572303, "r": 213.67396903960088, "b": 501.78997882445117, "coord_origin": "TOPLEFT"}, "confidence": 0.7848678827285767, "cells": [{"id": 49, "text": " \u06cc\u0646\u0627\u0647\u062c  \u06cc\u0627\u0647 \u062a\u0645\u064a\u0642 \u0633\u0627\u0633\u0627 \u0631\u0628", "bbox": {"l": 109.21999950908952, "t": 487.7979788572303, "r": 213.67396903960088, "b": 501.78997882445117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 266.5700088018494, "t": 534.2637987483744, "r": 492.7008677854604, "b": 573.2198486571116, "coord_origin": "TOPLEFT"}, "confidence": 0.7586438059806824, "cells": [{"id": 50, "text": " \u0634\u0648\u0631\u0641 /\u0634\u0648\u0631\u0641 \u0644\u06a9 /\u062f\u064a\u0644\u0648\u062a \u0632\u0627 \u0647\u0636\u0631\u0639 \u062f\u0635\u0631\u062f \u0644\u0642\u0627\u062f\u062d", "bbox": {"l": 266.5700088018494, "t": 534.2637987483744, "r": 492.6496877856904, "b": 551.1398587088386, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "\u06cc\u0644\u062e\u0627\u062f", "bbox": {"l": 462.2199979224626, "t": 556.3437786966474, "r": 492.7008677854604, "b": 573.2198486571116, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 85.4639966158655, "t": 532.7079787520192, "r": 240.36199891964634, "b": 546.69997871924, "coord_origin": "TOPLEFT"}, "confidence": 0.7897851467132568, "cells": [{"id": 52, "text": "\u0646\u062a 47.500 \u0627\u064a \u0647\u0646\u0627\u064a\u0644\u0627\u0633 \u062f\u064a\u0644\u0648\u062a \u0632\u0627 %50 \u0644\u0642\u0627\u062f\u062d", "bbox": {"l": 85.4639966158655, "t": 532.7079787520192, "r": 240.36199891964634, "b": 546.69997871924, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 404.2300081831098, "t": 579.1437686432336, "r": 492.6399177857343, "b": 596.0198686036978, "coord_origin": "TOPLEFT"}, "confidence": 0.7759335041046143, "cells": [{"id": 53, "text": "\u0644\u064a\u0648\u062d\u062a \u0632\u0627\u062c\u0645 \u06cc\u0627\u0637\u062e", "bbox": {"l": 404.2300081831098, "t": 579.1437686432336, "r": 492.6399177857343, "b": 596.0198686036978, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "text", "bbox": {"l": 106.93999951933742, "t": 577.5879786468784, "r": 218.89399901613845, "b": 591.5799886140991, "coord_origin": "TOPLEFT"}, "confidence": 0.8144810795783997, "cells": [{"id": 54, "text": "\u0644\u064a\u0648\u062d\u062a \u0644\u0628\u0627\u0642 \u0647\u0644\u0648\u0645\u062d\u0645 \u0646\u064a\u0631\u062e\u0622 5%", "bbox": {"l": 106.93999951933742, "t": 577.5879786468784, "r": 218.89399901613845, "b": 591.5799886140991, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null}], "body": [{"label": "picture", "id": 0, "page_no": 0, "cluster": {"id": 0, "label": "picture", "bbox": {"l": 388.5767822265625, "t": 36.03587341308594, "r": 482.4759216308594, "b": 103.00555419921875, "coord_origin": "TOPLEFT"}, "confidence": 0.9453065991401672, "cells": [{"id": 1, "text": "\u0646\u0627\u0631\u064a\u0627 \u06cc\u0644\u0627\u0627\u06a9 \u0633\u0631\u0648\u0628 \u062a\u06a9\u0631\u0634", "bbox": {"l": 388.989988251609, "t": 91.78875978496546, "r": 481.6045778353348, "b": 105.05883975387746, "coord_origin": "TOPLEFT"}}], "children": [{"id": 43, "label": "text", "bbox": {"l": 388.989988251609, "t": 91.78875978496546, "r": 481.6045778353348, "b": 105.05883975387746, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 1, "text": "\u0646\u0627\u0631\u064a\u0627 \u06cc\u0644\u0627\u0627\u06a9 \u0633\u0631\u0648\u0628 \u062a\u06a9\u0631\u0634", "bbox": {"l": 388.989988251609, "t": 91.78875978496546, "r": 481.6045778353348, "b": 105.05883975387746, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "section_header", "id": 28, "page_no": 0, "cluster": {"id": 28, "label": "section_header", "bbox": {"l": 68.78399669083697, "t": 62.65173985322508, "r": 267.65960879695194, "b": 81.03008981017001, "coord_origin": "TOPLEFT"}, "confidence": 0.6917961239814758, "cells": [{"id": 2, "text": "\u06cc\u0644\u062e\u0627\u062f \u06cc\u0644\u0627\u0627\u06a9 - \u06cc\u0644\u0635\u0627 \u0631\u0627\u0632\u0627\u0628 \u0631\u062f \u0634\u0631\u064a\u0630\u067e \u0647\u0645\u0627\u0646\u062f\u064a\u0645\u0627", "bbox": {"l": 68.78399669083697, "t": 62.65173985322508, "r": 267.65960879695194, "b": 81.03008981017001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u06cc\u0644\u062e\u0627\u062f \u06cc\u0644\u0627\u0627\u06a9 - \u06cc\u0644\u0635\u0627 \u0631\u0627\u0632\u0627\u0628 \u0631\u062f \u0634\u0631\u064a\u0630\u067e \u0647\u0645\u0627\u0646\u062f\u064a\u0645\u0627"}, {"label": "section_header", "id": 11, "page_no": 0, "cluster": {"id": 11, "label": "section_header", "bbox": {"l": 373.9899883190294, "t": 138.63494967521842, "r": 479.52999784465936, "b": 156.66497963297923, "coord_origin": "TOPLEFT"}, "confidence": 0.7994307279586792, "cells": [{"id": 4, "text": " \u0644\u0627\u0627\u06a9 \u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627 -2-5", "bbox": {"l": 373.9899883190294, "t": 138.63494967521842, "r": 479.52999784465936, "b": 156.66497963297923, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u0644\u0627\u0627\u06a9 \u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627 -2-5"}, {"label": "key_value_region", "id": 33, "page_no": 0, "cluster": {"id": 33, "label": "key_value_region", "bbox": {"l": 66.26399970216359, "t": 160.86797962313278, "r": 519.2383976661823, "b": 323.44982924225053, "coord_origin": "TOPLEFT"}, "confidence": 0.6362584233283997, "cells": [{"id": 5, "text": "\u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627 \u0645\u0627\u0646", "bbox": {"l": 458.7399879381041, "t": 162.42376961948798, "r": 519.2383976661823, "b": 179.2998695799522, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": " \u06cc\u0631\u06af", "bbox": {"l": 66.38400270162423, "t": 160.86797962313278, "r": 82.90500562736736, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "\u0647\u062a\u062e\u064a\u0631", "bbox": {"l": 91.16550359023896, "t": 160.86797962313278, "r": 111.81675949741789, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "\u0634\u0648\u0631", "bbox": {"l": 120.07725946028945, "t": 160.86797962313278, "r": 132.46799940459687, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "\u0647\u0628", "bbox": {"l": 140.72851936746835, "t": 160.86797962313278, "r": 148.98900933034, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "\u0647\u062f\u0634", "bbox": {"l": 157.24950929321156, "t": 160.86797962313278, "r": 169.64025923751896, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "\u062f\u064a\u0644\u0648\u062a", "bbox": {"l": 177.90075920039052, "t": 160.86797962313278, "r": 198.55201910756944, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "\u0644\u0627\u0634\u0645\u0634", "bbox": {"l": 206.812519070441, "t": 160.86797962313278, "r": 227.46375897762002, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "\u0648", "bbox": {"l": 235.72425894049158, "t": 160.86797962313278, "r": 239.85451892192734, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "\u0647\u0634\u0645\u0634", "bbox": {"l": 248.1150188847989, "t": 160.86797962313278, "r": 264.63601881054205, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "\u0641\u0631\u0635\u0645", "bbox": {"l": 193.57520912993866, "t": 178.74798958124518, "r": 209.40560905878587, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "\u062f\u0631\u0648\u0645", "bbox": {"l": 217.3208190232094, "t": 178.74798958124518, "r": 233.15122895205658, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "\u0647\u062a\u0633\u0648\u064a\u067e", "bbox": {"l": 241.06643891648014, "t": 178.74798958124518, "r": 264.81203880975096, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "\u06cc\u0627", "bbox": {"l": 105.01999952796723, "t": 178.74798958124518, "r": 112.34326949505137, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "\u0647\u0632\u0627\u0633", "bbox": {"l": 119.66654946213548, "t": 178.74798958124518, "r": 134.3130993963037, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "\u06cc\u0627\u0647\u062f\u0644\u0627\u0648\u0641", "bbox": {"l": 141.63636936338784, "t": 178.74798958124518, "r": 170.92946923172434, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "\u0631\u062f", "bbox": {"l": 178.25274919880843, "t": 178.74798958124518, "r": 185.57601916589257, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "- ", "bbox": {"l": 96.02400156840149, "t": 178.74798958124518, "r": 103.62799953422386, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": " \u0642\u0628\u0627\u0637\u0645 ", "bbox": {"l": 66.26399970216359, "t": 178.74798958124518, "r": 94.75199857411876, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "\u062a\u0633\u0648\u064a\u067e \u0632\u064a\u0644\u0627\u0646\u0622", "bbox": {"l": 218.2100090192128, "t": 196.50799953963872, "r": 264.81795880972436, "b": 210.49999950685924, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "\u06cc\u0644\u0645 \u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627 \u0647\u0631\u0627\u0645\u0634", "bbox": {"l": 420.9099981081384, "t": 216.30376949326285, "r": 519.1619876665258, "b": 233.17986945372706, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "20300", "bbox": {"l": 236.80999893561153, "t": 214.7479894969075, "r": 265.01000880886113, "b": 228.73998946412837, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "\u061f\u062a\u0633\u0627 \u06cc\u0631\u0627\u0628\u062c\u0627 \u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627", "bbox": {"l": 406.9899881707045, "t": 239.01372944005993, "r": 519.1415376666176, "b": 255.88982940052404, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "\u0631\u064a\u062e       \u06cc\u0644\u0628      ", "bbox": {"l": 197.32999911306206, "t": 237.4579494437046, "r": 264.91399880929265, "b": 251.44994941092557, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "\u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627 \u0647\u062f\u0646\u0646\u06a9\u0631\u062f\u0627\u0635 \u0639\u062c\u0631\u0645", "bbox": {"l": 389.4699982494516, "t": 261.6937293869272, "r": 519.2136776662934, "b": 278.5698293473914, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "\u0646\u0627\u0631\u064a\u0627 \u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627 \u06cc\u0644\u0645 \u0646\u0627\u0645\u0632\u0627\u0633", "bbox": {"l": 166.5799992512739, "t": 260.137939390572, "r": 264.77599880991295, "b": 274.12994935779284, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": " \u0630\u062e\u0627 \u0627\u0631 \u0631\u0648\u06a9\u0630\u0645 \u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627 \u060c\u0644\u0648\u0635\u062d\u0645 \u0647\u062f\u0646\u0646\u06a9\u062f\u064a\u0644\u0648\u062a \u0627\u064a\u0622", "bbox": {"l": 292.129998686965, "t": 284.37377933379446, "r": 519.114747666738, "b": 301.24987929425856, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "\u061f\u062a\u0633\u0627 \u0647\u062f\u0648\u0645\u0646", "bbox": {"l": 461.98000792354117, "t": 306.5737292817864, "r": 519.2351676661968, "b": 323.44982924225053, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "\u0631\u064a\u062e", "bbox": {"l": 197.32999911306206, "t": 282.81799933743923, "r": 208.04769906488926, "b": 296.80999930466, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "\u06cc\u0644\u0628", "bbox": {"l": 236.62821893642857, "t": 282.81799933743923, "r": 247.34591888825577, "b": 296.80999930466, "coord_origin": "TOPLEFT"}}], "children": [{"id": 25, "label": "text", "bbox": {"l": 458.7399879381041, "t": 162.42376961948798, "r": 519.2383976661823, "b": 179.2998695799522, "coord_origin": "TOPLEFT"}, "confidence": 0.7258325815200806, "cells": [{"id": 5, "text": "\u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627 \u0645\u0627\u0646", "bbox": {"l": 458.7399879381041, "t": 162.42376961948798, "r": 519.2383976661823, "b": 179.2998695799522, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 66.26399970216359, "t": 160.86797962313278, "r": 264.81795880972436, "b": 210.49999950685924, "coord_origin": "TOPLEFT"}, "confidence": 0.8694157004356384, "cells": [{"id": 6, "text": " \u06cc\u0631\u06af", "bbox": {"l": 66.38400270162423, "t": 160.86797962313278, "r": 82.90500562736736, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "\u0647\u062a\u062e\u064a\u0631", "bbox": {"l": 91.16550359023896, "t": 160.86797962313278, "r": 111.81675949741789, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "\u0634\u0648\u0631", "bbox": {"l": 120.07725946028945, "t": 160.86797962313278, "r": 132.46799940459687, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "\u0647\u0628", "bbox": {"l": 140.72851936746835, "t": 160.86797962313278, "r": 148.98900933034, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "\u0647\u062f\u0634", "bbox": {"l": 157.24950929321156, "t": 160.86797962313278, "r": 169.64025923751896, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "\u062f\u064a\u0644\u0648\u062a", "bbox": {"l": 177.90075920039052, "t": 160.86797962313278, "r": 198.55201910756944, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "\u0644\u0627\u0634\u0645\u0634", "bbox": {"l": 206.812519070441, "t": 160.86797962313278, "r": 227.46375897762002, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "\u0648", "bbox": {"l": 235.72425894049158, "t": 160.86797962313278, "r": 239.85451892192734, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "\u0647\u0634\u0645\u0634", "bbox": {"l": 248.1150188847989, "t": 160.86797962313278, "r": 264.63601881054205, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "\u0641\u0631\u0635\u0645", "bbox": {"l": 193.57520912993866, "t": 178.74798958124518, "r": 209.40560905878587, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "\u062f\u0631\u0648\u0645", "bbox": {"l": 217.3208190232094, "t": 178.74798958124518, "r": 233.15122895205658, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "\u0647\u062a\u0633\u0648\u064a\u067e", "bbox": {"l": 241.06643891648014, "t": 178.74798958124518, "r": 264.81203880975096, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "\u06cc\u0627", "bbox": {"l": 105.01999952796723, "t": 178.74798958124518, "r": 112.34326949505137, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "\u0647\u0632\u0627\u0633", "bbox": {"l": 119.66654946213548, "t": 178.74798958124518, "r": 134.3130993963037, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "\u06cc\u0627\u0647\u062f\u0644\u0627\u0648\u0641", "bbox": {"l": 141.63636936338784, "t": 178.74798958124518, "r": 170.92946923172434, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "\u0631\u062f", "bbox": {"l": 178.25274919880843, "t": 178.74798958124518, "r": 185.57601916589257, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "- ", "bbox": {"l": 96.02400156840149, "t": 178.74798958124518, "r": 103.62799953422386, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": " \u0642\u0628\u0627\u0637\u0645 ", "bbox": {"l": 66.26399970216359, "t": 178.74798958124518, "r": 94.75199857411876, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "\u062a\u0633\u0648\u064a\u067e \u0632\u064a\u0644\u0627\u0646\u0622", "bbox": {"l": 218.2100090192128, "t": 196.50799953963872, "r": 264.81795880972436, "b": 210.49999950685924, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 420.9099981081384, "t": 216.30376949326285, "r": 519.1619876665258, "b": 233.17986945372706, "coord_origin": "TOPLEFT"}, "confidence": 0.8121814727783203, "cells": [{"id": 25, "text": "\u06cc\u0644\u0645 \u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627 \u0647\u0631\u0627\u0645\u0634", "bbox": {"l": 420.9099981081384, "t": 216.30376949326285, "r": 519.1619876665258, "b": 233.17986945372706, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 236.80999893561153, "t": 214.7479894969075, "r": 265.01000880886113, "b": 228.73998946412837, "coord_origin": "TOPLEFT"}, "confidence": 0.7672220468521118, "cells": [{"id": 26, "text": "20300", "bbox": {"l": 236.80999893561153, "t": 214.7479894969075, "r": 265.01000880886113, "b": 228.73998946412837, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "text", "bbox": {"l": 406.9899881707045, "t": 239.01372944005993, "r": 519.1415376666176, "b": 255.88982940052404, "coord_origin": "TOPLEFT"}, "confidence": 0.8320456743240356, "cells": [{"id": 27, "text": "\u061f\u062a\u0633\u0627 \u06cc\u0631\u0627\u0628\u062c\u0627 \u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627", "bbox": {"l": 406.9899881707045, "t": 239.01372944005993, "r": 519.1415376666176, "b": 255.88982940052404, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "checkbox_unselected", "bbox": {"l": 197.32999911306206, "t": 237.4579494437046, "r": 264.91399880929265, "b": 251.44994941092557, "coord_origin": "TOPLEFT"}, "confidence": 0.5538824796676636, "cells": [{"id": 28, "text": "\u0631\u064a\u062e       \u06cc\u0644\u0628      ", "bbox": {"l": 197.32999911306206, "t": 237.4579494437046, "r": 264.91399880929265, "b": 251.44994941092557, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 389.4699982494516, "t": 261.6937293869272, "r": 519.2136776662934, "b": 278.5698293473914, "coord_origin": "TOPLEFT"}, "confidence": 0.7909000515937805, "cells": [{"id": 29, "text": "\u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627 \u0647\u062f\u0646\u0646\u06a9\u0631\u062f\u0627\u0635 \u0639\u062c\u0631\u0645", "bbox": {"l": 389.4699982494516, "t": 261.6937293869272, "r": 519.2136776662934, "b": 278.5698293473914, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 166.5799992512739, "t": 260.137939390572, "r": 264.77599880991295, "b": 274.12994935779284, "coord_origin": "TOPLEFT"}, "confidence": 0.7620571851730347, "cells": [{"id": 30, "text": "\u0646\u0627\u0631\u064a\u0627 \u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627 \u06cc\u0644\u0645 \u0646\u0627\u0645\u0632\u0627\u0633", "bbox": {"l": 166.5799992512739, "t": 260.137939390572, "r": 264.77599880991295, "b": 274.12994935779284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 292.129998686965, "t": 284.37377933379446, "r": 519.2351676661968, "b": 323.44982924225053, "coord_origin": "TOPLEFT"}, "confidence": 0.6534578204154968, "cells": [{"id": 31, "text": " \u0630\u062e\u0627 \u0627\u0631 \u0631\u0648\u06a9\u0630\u0645 \u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627 \u060c\u0644\u0648\u0635\u062d\u0645 \u0647\u062f\u0646\u0646\u06a9\u062f\u064a\u0644\u0648\u062a \u0627\u064a\u0622", "bbox": {"l": 292.129998686965, "t": 284.37377933379446, "r": 519.114747666738, "b": 301.24987929425856, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "\u061f\u062a\u0633\u0627 \u0647\u062f\u0648\u0645\u0646", "bbox": {"l": 461.98000792354117, "t": 306.5737292817864, "r": 519.2351676661968, "b": 323.44982924225053, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "checkbox_selected", "bbox": {"l": 197.32999911306206, "t": 282.81799933743923, "r": 208.04769906488926, "b": 296.80999930466, "coord_origin": "TOPLEFT"}, "confidence": 0.49446165561676025, "cells": [{"id": 34, "text": "\u0631\u064a\u062e", "bbox": {"l": 197.32999911306206, "t": 282.81799933743923, "r": 208.04769906488926, "b": 296.80999930466, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "checkbox_unselected", "bbox": {"l": 236.62821893642857, "t": 282.81799933743923, "r": 247.34591888825577, "b": 296.80999930466, "coord_origin": "TOPLEFT"}, "confidence": 0.5417144298553467, "cells": [{"id": 35, "text": "\u06cc\u0644\u0628", "bbox": {"l": 236.62821893642857, "t": 282.81799933743923, "r": 247.34591888825577, "b": 296.80999930466, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null}, {"label": "section_header", "id": 31, "page_no": 0, "cluster": {"id": 31, "label": "section_header", "bbox": {"l": 409.0299981615353, "t": 351.4537691766454, "r": 505.7644977267433, "b": 368.3298391371096, "coord_origin": "TOPLEFT"}, "confidence": 0.6514244079589844, "cells": [{"id": 36, "text": "\u0633\u0631\u0648\u0628 \u0631\u062f \u0634\u0631\u064a\u0630\u067e -3", "bbox": {"l": 409.0299981615353, "t": 351.4537691766454, "r": 505.7644977267433, "b": 368.3298391371096, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u0633\u0631\u0648\u0628 \u0631\u062f \u0634\u0631\u064a\u0630\u067e -3"}, {"label": "key_value_region", "id": 27, "page_no": 0, "cluster": {"id": 27, "label": "key_value_region", "bbox": {"l": 85.4639966158655, "t": 372.57796912715753, "r": 492.70525778544066, "b": 596.0198686036978, "coord_origin": "TOPLEFT"}, "confidence": 0.719137966632843, "cells": [{"id": 37, "text": " \u06a9\u0631\u0627\u062f\u0645 \u0647\u0626\u0627\u0631\u0627 \u062e\u064a\u0631\u0627\u062a", "bbox": {"l": 405.30999817825557, "t": 374.1537791234659, "r": 492.6107177858655, "b": 391.0298490839301, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "1403/09/19", "bbox": {"l": 137.89998938018175, "t": 372.57796912715753, "r": 187.8199891558066, "b": 386.56997909437825, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": " \u0634\u0631\u064a\u0630\u067e \u062e\u064a\u0631\u0627\u062a", "bbox": {"l": 426.309998083867, "t": 396.8337690703332, "r": 492.59463778593783, "b": 413.70983903079747, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "1403/10/04", "bbox": {"l": 137.89998938018175, "t": 395.277959073978, "r": 187.8199891558066, "b": 409.26995904119883, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": " \u0647\u0636\u0631\u0639 \u0647\u062a\u064a\u0645\u06a9 \u0647\u0633\u0644\u062c \u0647\u0631\u0627\u0645\u0634", "bbox": {"l": 367.14998834977314, "t": 419.5137990172004, "r": 492.68526778553047, "b": 436.3898589776647, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "436", "bbox": {"l": 154.69999930467083, "t": 418.0779690205642, "r": 171.19999923050838, "b": 432.0699789877849, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": " \u0647\u0645\u0627\u0646\u062f\u064a\u0645\u0627 \u062c\u0631\u062f \u062e\u064a\u0631\u0627\u062a", "bbox": {"l": 399.42998820468443, "t": 442.3137789637867, "r": 492.62752778578994, "b": 459.18984892425095, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "1403/10/05", "bbox": {"l": 137.89998938018175, "t": 440.75796896743145, "r": 187.8199891558066, "b": 454.7499689346523, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": " \u0634\u0631\u064a\u0630\u067e \u0631\u0648\u0627\u0634\u0645", "bbox": {"l": 422.82998809950857, "t": 464.993778910654, "r": 492.6789577855588, "b": 481.8698388711183, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "\u0633\u0631\u0648\u0628 \u0646\u0648\u0645\u0631\u0622 \u06cc\u0631\u0627\u0632\u06af\u0631\u0627\u06a9", "bbox": {"l": 122.05999945137766, "t": 463.43795891429886, "r": 203.6480090846645, "b": 477.42995888151955, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": " \u0631\u062f \u0644\u0627\u0627\u06a9 \u0634\u0631\u064a\u0630\u067e \u0632\u0627 \u0633\u067e \u0647\u064a\u0627\u067e \u062a\u0645\u064a\u0642 \u0646\u064a\u064a\u0639\u062a \u0629\u0648\u062d\u0646", "bbox": {"l": 281.3299887355078, "t": 489.35378885358557, "r": 492.5758377860224, "b": 506.2298588140498, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "\u0633\u0631\u0648\u0628", "bbox": {"l": 465.57998790736036, "t": 511.4337788018585, "r": 492.70525778544066, "b": 528.3098487623228, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": " \u06cc\u0646\u0627\u0647\u062c  \u06cc\u0627\u0647 \u062a\u0645\u064a\u0642 \u0633\u0627\u0633\u0627 \u0631\u0628", "bbox": {"l": 109.21999950908952, "t": 487.7979788572303, "r": 213.67396903960088, "b": 501.78997882445117, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": " \u0634\u0648\u0631\u0641 /\u0634\u0648\u0631\u0641 \u0644\u06a9 /\u062f\u064a\u0644\u0648\u062a \u0632\u0627 \u0647\u0636\u0631\u0639 \u062f\u0635\u0631\u062f \u0644\u0642\u0627\u062f\u062d", "bbox": {"l": 266.5700088018494, "t": 534.2637987483744, "r": 492.6496877856904, "b": 551.1398587088386, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "\u06cc\u0644\u062e\u0627\u062f", "bbox": {"l": 462.2199979224626, "t": 556.3437786966474, "r": 492.7008677854604, "b": 573.2198486571116, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "\u0646\u062a 47.500 \u0627\u064a \u0647\u0646\u0627\u064a\u0644\u0627\u0633 \u062f\u064a\u0644\u0648\u062a \u0632\u0627 %50 \u0644\u0642\u0627\u062f\u062d", "bbox": {"l": 85.4639966158655, "t": 532.7079787520192, "r": 240.36199891964634, "b": 546.69997871924, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "\u0644\u064a\u0648\u062d\u062a \u0632\u0627\u062c\u0645 \u06cc\u0627\u0637\u062e", "bbox": {"l": 404.2300081831098, "t": 579.1437686432336, "r": 492.6399177857343, "b": 596.0198686036978, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "\u0644\u064a\u0648\u062d\u062a \u0644\u0628\u0627\u0642 \u0647\u0644\u0648\u0645\u062d\u0645 \u0646\u064a\u0631\u062e\u0622 5%", "bbox": {"l": 106.93999951933742, "t": 577.5879786468784, "r": 218.89399901613845, "b": 591.5799886140991, "coord_origin": "TOPLEFT"}}], "children": [{"id": 15, "label": "text", "bbox": {"l": 405.30999817825557, "t": 374.1537791234659, "r": 492.6107177858655, "b": 391.0298490839301, "coord_origin": "TOPLEFT"}, "confidence": 0.7834645509719849, "cells": [{"id": 37, "text": " \u06a9\u0631\u0627\u062f\u0645 \u0647\u0626\u0627\u0631\u0627 \u062e\u064a\u0631\u0627\u062a", "bbox": {"l": 405.30999817825557, "t": 374.1537791234659, "r": 492.6107177858655, "b": 391.0298490839301, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "text", "bbox": {"l": 137.89998938018175, "t": 372.57796912715753, "r": 187.8199891558066, "b": 386.56997909437825, "coord_origin": "TOPLEFT"}, "confidence": 0.8262879252433777, "cells": [{"id": 38, "text": "1403/09/19", "bbox": {"l": 137.89998938018175, "t": 372.57796912715753, "r": 187.8199891558066, "b": 386.56997909437825, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 426.309998083867, "t": 396.8337690703332, "r": 492.59463778593783, "b": 413.70983903079747, "coord_origin": "TOPLEFT"}, "confidence": 0.7766718864440918, "cells": [{"id": 39, "text": " \u0634\u0631\u064a\u0630\u067e \u062e\u064a\u0631\u0627\u062a", "bbox": {"l": 426.309998083867, "t": 396.8337690703332, "r": 492.59463778593783, "b": 413.70983903079747, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "text", "bbox": {"l": 137.89998938018175, "t": 395.277959073978, "r": 187.8199891558066, "b": 409.26995904119883, "coord_origin": "TOPLEFT"}, "confidence": 0.8204737901687622, "cells": [{"id": 40, "text": "1403/10/04", "bbox": {"l": 137.89998938018175, "t": 395.277959073978, "r": 187.8199891558066, "b": 409.26995904119883, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 367.14998834977314, "t": 419.5137990172004, "r": 492.68526778553047, "b": 436.3898589776647, "coord_origin": "TOPLEFT"}, "confidence": 0.7670677900314331, "cells": [{"id": 41, "text": " \u0647\u0636\u0631\u0639 \u0647\u062a\u064a\u0645\u06a9 \u0647\u0633\u0644\u062c \u0647\u0631\u0627\u0645\u0634", "bbox": {"l": 367.14998834977314, "t": 419.5137990172004, "r": 492.68526778553047, "b": 436.3898589776647, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "text", "bbox": {"l": 154.69999930467083, "t": 418.0779690205642, "r": 171.19999923050838, "b": 432.0699789877849, "coord_origin": "TOPLEFT"}, "confidence": 0.8048340082168579, "cells": [{"id": 42, "text": "436", "bbox": {"l": 154.69999930467083, "t": 418.0779690205642, "r": 171.19999923050838, "b": 432.0699789877849, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 399.42998820468443, "t": 442.3137789637867, "r": 492.62752778578994, "b": 459.18984892425095, "coord_origin": "TOPLEFT"}, "confidence": 0.775697648525238, "cells": [{"id": 43, "text": " \u0647\u0645\u0627\u0646\u062f\u064a\u0645\u0627 \u062c\u0631\u062f \u062e\u064a\u0631\u0627\u062a", "bbox": {"l": 399.42998820468443, "t": 442.3137789637867, "r": 492.62752778578994, "b": 459.18984892425095, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "text", "bbox": {"l": 137.89998938018175, "t": 440.75796896743145, "r": 187.8199891558066, "b": 454.7499689346523, "coord_origin": "TOPLEFT"}, "confidence": 0.827337384223938, "cells": [{"id": 44, "text": "1403/10/05", "bbox": {"l": 137.89998938018175, "t": 440.75796896743145, "r": 187.8199891558066, "b": 454.7499689346523, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 422.82998809950857, "t": 464.993778910654, "r": 492.6789577855588, "b": 481.8698388711183, "coord_origin": "TOPLEFT"}, "confidence": 0.7342236638069153, "cells": [{"id": 45, "text": " \u0634\u0631\u064a\u0630\u067e \u0631\u0648\u0627\u0634\u0645", "bbox": {"l": 422.82998809950857, "t": 464.993778910654, "r": 492.6789577855588, "b": 481.8698388711183, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 122.05999945137766, "t": 463.43795891429886, "r": 203.6480090846645, "b": 477.42995888151955, "coord_origin": "TOPLEFT"}, "confidence": 0.8411222696304321, "cells": [{"id": 46, "text": "\u0633\u0631\u0648\u0628 \u0646\u0648\u0645\u0631\u0622 \u06cc\u0631\u0627\u0632\u06af\u0631\u0627\u06a9", "bbox": {"l": 122.05999945137766, "t": 463.43795891429886, "r": 203.6480090846645, "b": 477.42995888151955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 281.3299887355078, "t": 489.35378885358557, "r": 492.70525778544066, "b": 528.3098487623228, "coord_origin": "TOPLEFT"}, "confidence": 0.7251589894294739, "cells": [{"id": 47, "text": " \u0631\u062f \u0644\u0627\u0627\u06a9 \u0634\u0631\u064a\u0630\u067e \u0632\u0627 \u0633\u067e \u0647\u064a\u0627\u067e \u062a\u0645\u064a\u0642 \u0646\u064a\u064a\u0639\u062a \u0629\u0648\u062d\u0646", "bbox": {"l": 281.3299887355078, "t": 489.35378885358557, "r": 492.5758377860224, "b": 506.2298588140498, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "\u0633\u0631\u0648\u0628", "bbox": {"l": 465.57998790736036, "t": 511.4337788018585, "r": 492.70525778544066, "b": 528.3098487623228, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 109.21999950908952, "t": 487.7979788572303, "r": 213.67396903960088, "b": 501.78997882445117, "coord_origin": "TOPLEFT"}, "confidence": 0.7848678827285767, "cells": [{"id": 49, "text": " \u06cc\u0646\u0627\u0647\u062c  \u06cc\u0627\u0647 \u062a\u0645\u064a\u0642 \u0633\u0627\u0633\u0627 \u0631\u0628", "bbox": {"l": 109.21999950908952, "t": 487.7979788572303, "r": 213.67396903960088, "b": 501.78997882445117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 266.5700088018494, "t": 534.2637987483744, "r": 492.7008677854604, "b": 573.2198486571116, "coord_origin": "TOPLEFT"}, "confidence": 0.7586438059806824, "cells": [{"id": 50, "text": " \u0634\u0648\u0631\u0641 /\u0634\u0648\u0631\u0641 \u0644\u06a9 /\u062f\u064a\u0644\u0648\u062a \u0632\u0627 \u0647\u0636\u0631\u0639 \u062f\u0635\u0631\u062f \u0644\u0642\u0627\u062f\u062d", "bbox": {"l": 266.5700088018494, "t": 534.2637987483744, "r": 492.6496877856904, "b": 551.1398587088386, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "\u06cc\u0644\u062e\u0627\u062f", "bbox": {"l": 462.2199979224626, "t": 556.3437786966474, "r": 492.7008677854604, "b": 573.2198486571116, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 85.4639966158655, "t": 532.7079787520192, "r": 240.36199891964634, "b": 546.69997871924, "coord_origin": "TOPLEFT"}, "confidence": 0.7897851467132568, "cells": [{"id": 52, "text": "\u0646\u062a 47.500 \u0627\u064a \u0647\u0646\u0627\u064a\u0644\u0627\u0633 \u062f\u064a\u0644\u0648\u062a \u0632\u0627 %50 \u0644\u0642\u0627\u062f\u062d", "bbox": {"l": 85.4639966158655, "t": 532.7079787520192, "r": 240.36199891964634, "b": 546.69997871924, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 404.2300081831098, "t": 579.1437686432336, "r": 492.6399177857343, "b": 596.0198686036978, "coord_origin": "TOPLEFT"}, "confidence": 0.7759335041046143, "cells": [{"id": 53, "text": "\u0644\u064a\u0648\u062d\u062a \u0632\u0627\u062c\u0645 \u06cc\u0627\u0637\u062e", "bbox": {"l": 404.2300081831098, "t": 579.1437686432336, "r": 492.6399177857343, "b": 596.0198686036978, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "text", "bbox": {"l": 106.93999951933742, "t": 577.5879786468784, "r": 218.89399901613845, "b": 591.5799886140991, "coord_origin": "TOPLEFT"}, "confidence": 0.8144810795783997, "cells": [{"id": 54, "text": "\u0644\u064a\u0648\u062d\u062a \u0644\u0628\u0627\u0642 \u0647\u0644\u0648\u0645\u062d\u0645 \u0646\u064a\u0631\u062e\u0622 5%", "bbox": {"l": 106.93999951933742, "t": 577.5879786468784, "r": 218.89399901613845, "b": 591.5799886140991, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null}], "headers": [{"label": "page_footer", "id": 1, "page_no": 0, "cluster": {"id": 1, "label": "page_footer", "bbox": {"l": 267.2900087986132, "t": 779.4899791738803, "r": 294.5899986759081, "b": 790.0379791491694, "coord_origin": "TOPLEFT"}, "confidence": 0.899228036403656, "cells": [{"id": 3, "text": "Page 7 ", "bbox": {"l": 267.2900087986132, "t": 779.4899791738803, "r": 294.5899986759081, "b": 790.0379791491694, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Page 7"}]}}]
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v2/2203.01017v2.doctags.txt b/tests/data/groundtruth/docling_v2/2203.01017v2.doctags.txt
index edc5c84b..3d5f0ea4 100644
--- a/tests/data/groundtruth/docling_v2/2203.01017v2.doctags.txt
+++ b/tests/data/groundtruth/docling_v2/2203.01017v2.doctags.txt
@@ -1,465 +1,281 @@
-<document>
-<section_header_level_1><location><page_1><loc_16><loc_85><loc_82><loc_86></location>TableFormer: Table Structure Understanding with Transformers.</section_header_level_1>
-<section_header_level_1><location><page_1><loc_23><loc_78><loc_74><loc_81></location>Ahmed Nassar, Nikolaos Livathinos, Maksym Lysak, Peter Staar IBM Research</section_header_level_1>
-<text><location><page_1><loc_34><loc_77><loc_62><loc_78></location>{ ahn,nli,mly,taa } @zurich.ibm.com</text>
-<section_header_level_1><location><page_1><loc_24><loc_71><loc_31><loc_73></location>Abstract</section_header_level_1>
-<section_header_level_1><location><page_1><loc_52><loc_71><loc_67><loc_72></location>a. Picture of a table:</section_header_level_1>
-<section_header_level_1><location><page_1><loc_8><loc_30><loc_21><loc_32></location>1. Introduction</section_header_level_1>
-<text><location><page_1><loc_8><loc_10><loc_47><loc_29></location>The occurrence of tables in documents is ubiquitous. They often summarise quantitative or factual data, which is cumbersome to describe in verbose text but nevertheless extremely valuable. Unfortunately, this compact representation is often not easy to parse by machines. There are many implicit conventions used to obtain a compact table representation. For example, tables often have complex columnand row-headers in order to reduce duplicated cell content. Lines of different shapes and sizes are leveraged to separate content or indicate a tree structure. Additionally, tables can also have empty/missing table-entries or multi-row textual table-entries. Fig. 1 shows a table which presents all these issues.</text>
-<figure>
-<location><page_1><loc_52><loc_62><loc_88><loc_71></location>
-</figure>
-<table>
-<location><page_1><loc_52><loc_62><loc_88><loc_71></location>
-<caption>Tables organize valuable content in a concise and compact representation. This content is extremely valuable for systems such as search engines, Knowledge Graph's, etc, since they enhance their predictive capabilities. Unfortunately, tables come in a large variety of shapes and sizes. Furthermore, they can have complex column/row-header configurations, multiline rows, different variety of separation lines, missing entries, etc. As such, the correct identification of the table-structure from an image is a nontrivial task. In this paper, we present a new table-structure identification model. The latter improves the latest end-toend deep learning model (i.e. encoder-dual-decoder from PubTabNet) in two significant ways. First, we introduce a new object detection decoder for table-cells. In this way, we can obtain the content of the table-cells from programmatic PDF's directly from the PDF source and avoid the training of the custom OCR decoders. This architectural change leads to more accurate table-content extraction and allows us to tackle non-english tables. Second, we replace the LSTM decoders with transformer based decoders. This upgrade improves significantly the previous state-of-the-art tree-editing-distance-score (TEDS) from 91% to 98.5% on simple tables and from 88.7% to 95% on complex tables.</caption>
-<row_0><col_0><col_header>3</col_0><col_1><col_header>1</col_1></row_0>
-</table>
-<unordered_list>
-<list_item><location><page_1><loc_52><loc_58><loc_79><loc_60></location>b. Red-annotation of bounding boxes, Blue-predictions by TableFormer</list_item>
+<doctag><page_header><loc_15><loc_131><loc_30><loc_354>arXiv:2203.01017v2 [cs.CV] 11 Mar 2022</page_header>
+<section_header_level_1><loc_79><loc_68><loc_408><loc_76>TableFormer: Table Structure Understanding with Transformers.</section_header_level_1>
+<section_header_level_1><loc_116><loc_93><loc_370><loc_108>Ahmed Nassar, Nikolaos Livathinos, Maksym Lysak, Peter Staar IBM Research</section_header_level_1>
+<text><loc_170><loc_111><loc_309><loc_116>{ ahn,nli,mly,taa } @zurich.ibm.com</text>
+<section_header_level_1><loc_119><loc_136><loc_156><loc_143>Abstract</section_header_level_1>
+<section_header_level_1><loc_258><loc_138><loc_334><loc_143>a. Picture of a table:</section_header_level_1>
+<text><loc_41><loc_152><loc_234><loc_324>Tables organize valuable content in a concise and compact representation. This content is extremely valuable for systems such as search engines, Knowledge Graph's, etc, since they enhance their predictive capabilities. Unfortunately, tables come in a large variety of shapes and sizes. Furthermore, they can have complex column/row-header configurations, multiline rows, different variety of separation lines, missing entries, etc. As such, the correct identification of the table-structure from an image is a nontrivial task. In this paper, we present a new table-structure identification model. The latter improves the latest end-toend deep learning model (i.e. encoder-dual-decoder from PubTabNet) in two significant ways. First, we introduce a new object detection decoder for table-cells. In this way, we can obtain the content of the table-cells from programmatic PDF's directly from the PDF source and avoid the training of the custom OCR decoders. This architectural change leads to more accurate table-content extraction and allows us to tackle non-english tables. Second, we replace the LSTM decoders with transformer based decoders. This upgrade improves significantly the previous state-of-the-art tree-editing-distance-score (TEDS) from 91% to 98.5% on simple tables and from 88.7% to 95% on complex tables.</text>
+<section_header_level_1><loc_41><loc_341><loc_104><loc_348>1. Introduction</section_header_level_1>
+<text><loc_41><loc_354><loc_234><loc_450>The occurrence of tables in documents is ubiquitous. They often summarise quantitative or factual data, which is cumbersome to describe in verbose text but nevertheless extremely valuable. Unfortunately, this compact representation is often not easy to parse by machines. There are many implicit conventions used to obtain a compact table representation. For example, tables often have complex columnand row-headers in order to reduce duplicated cell content. Lines of different shapes and sizes are leveraged to separate content or indicate a tree structure. Additionally, tables can also have empty/missing table-entries or multi-row textual table-entries. Fig. 1 shows a table which presents all these issues.</text>
+<picture><loc_258><loc_144><loc_439><loc_191></picture>
+<otsl><loc_258><loc_144><loc_439><loc_191><ched>3<ched>1<nl></otsl>
+<unordered_list><list_item><loc_258><loc_198><loc_397><loc_210>b. Red-annotation of bounding boxes, Blue-predictions by TableFormer</list_item>
+<list_item><loc_258><loc_265><loc_401><loc_271>c. Structure predicted by TableFormer:</list_item>
 </unordered_list>
-<figure>
-<location><page_1><loc_51><loc_48><loc_88><loc_57></location>
-</figure>
-<unordered_list>
-<list_item><location><page_1><loc_52><loc_46><loc_80><loc_47></location>c. Structure predicted by TableFormer:</list_item>
+<picture><loc_257><loc_213><loc_441><loc_259></picture>
+<picture><loc_258><loc_274><loc_439><loc_313><caption><loc_252><loc_325><loc_445><loc_353>Figure 1: Picture of a table with subtle, complex features such as (1) multi-column headers, (2) cell with multi-row text and (3) cells with no content. Image from PubTabNet evaluation set, filename: 'PMC2944238 004 02'.</caption></picture>
+<otsl><loc_258><loc_274><loc_439><loc_313><ched>0<ched>1<lcel><ched>2 1<lcel><ecel><nl><fcel>3<fcel>4<fcel>5 3<fcel>6<fcel>7<ecel><nl><fcel>8<fcel>9<fcel>10<fcel>11<fcel>12<fcel>2<nl><ecel><fcel>13<fcel>14<fcel>15<fcel>16<ucel><nl><ecel><fcel>17<fcel>18<fcel>19<fcel>20<ucel><nl></otsl>
+<text><loc_252><loc_369><loc_445><loc_420>Recently, significant progress has been made with vision based approaches to extract tables in documents. For the sake of completeness, the issue of table extraction from documents is typically decomposed into two separate challenges, i.e. (1) finding the location of the table(s) on a document-page and (2) finding the structure of a given table in the document.</text>
+<text><loc_252><loc_422><loc_445><loc_450>The first problem is called table-location and has been previously addressed [30, 38, 19, 21, 23, 26, 8] with stateof-the-art object-detection networks (e.g. YOLO and later on Mask-RCNN [9]). For all practical purposes, it can be</text>
+<page_footer><loc_241><loc_463><loc_245><loc_469>1</page_footer>
+<page_break>
+<text><loc_41><loc_47><loc_234><loc_61>considered as a solved problem, given enough ground-truth data to train on.</text>
+<text><loc_41><loc_63><loc_234><loc_144>The second problem is called table-structure decomposition. The latter is a long standing problem in the community of document understanding [6, 4, 14]. Contrary to the table-location problem, there are no commonly used approaches that can easily be re-purposed to solve this problem. Lately, a set of new model-architectures has been proposed by the community to address table-structure decomposition [37, 36, 18, 20]. All these models have some weaknesses (see Sec. 2). The common denominator here is the reliance on textual features and/or the inability to provide the bounding box of each table-cell in the original image.</text>
+<text><loc_41><loc_146><loc_234><loc_235>In this paper, we want to address these weaknesses and present a robust table-structure decomposition algorithm. The design criteria for our model are the following. First, we want our algorithm to be language agnostic. In this way, we can obtain the structure of any table, irregardless of the language. Second, we want our algorithm to leverage as much data as possible from the original PDF document. For programmatic PDF documents, the text-cells can often be extracted much faster and with higher accuracy compared to OCR methods. Last but not least, we want to have a direct link between the table-cell and its bounding box in the image.</text>
+<text><loc_41><loc_237><loc_234><loc_273>To meet the design criteria listed above, we developed a new model called TableFormer and a synthetically generated table structure dataset called SynthTabNet $^{1}$. In particular, our contributions in this work can be summarised as follows:</text>
+<unordered_list><list_item><loc_50><loc_281><loc_234><loc_309>· We propose TableFormer , a transformer based model that predicts tables structure and bounding boxes for the table content simultaneously in an end-to-end approach.</list_item>
+<list_item><loc_50><loc_317><loc_234><loc_345>· Across all benchmark datasets TableFormer significantly outperforms existing state-of-the-art metrics, while being much more efficient in training and inference to existing works.</list_item>
+<list_item><loc_50><loc_353><loc_234><loc_374>· We present SynthTabNet a synthetically generated dataset, with various appearance styles and complexity.</list_item>
+<list_item><loc_50><loc_382><loc_234><loc_403>· An augmented dataset based on PubTabNet [37], FinTabNet [36], and TableBank [17] with generated ground-truth for reproducibility.</list_item>
 </unordered_list>
-<figure>
-<location><page_1><loc_52><loc_37><loc_88><loc_45></location>
-</figure>
-<table>
-<location><page_1><loc_52><loc_37><loc_88><loc_45></location>
-<caption>Figure 1: Picture of a table with subtle, complex features such as (1) multi-column headers, (2) cell with multi-row text and (3) cells with no content. Image from PubTabNet evaluation set, filename: 'PMC2944238 004 02'.</caption>
-<row_0><col_0><col_header>0</col_0><col_1><col_header>1</col_1><col_2><col_header>1</col_2><col_3><col_header>2 1</col_3><col_4><col_header>2 1</col_4><col_5><body></col_5></row_0>
-<row_1><col_0><body>3</col_0><col_1><body>4</col_1><col_2><body>5 3</col_2><col_3><body>6</col_3><col_4><body>7</col_4><col_5><body></col_5></row_1>
-<row_2><col_0><body>8</col_0><col_1><body>9</col_1><col_2><body>10</col_2><col_3><body>11</col_3><col_4><body>12</col_4><col_5><body>2</col_5></row_2>
-<row_3><col_0><body></col_0><col_1><body>13</col_1><col_2><body>14</col_2><col_3><body>15</col_3><col_4><body>16</col_4><col_5><body>2</col_5></row_3>
-<row_4><col_0><body></col_0><col_1><body>17</col_1><col_2><body>18</col_2><col_3><body>19</col_3><col_4><body>20</col_4><col_5><body>2</col_5></row_4>
-</table>
-<text><location><page_1><loc_50><loc_16><loc_89><loc_26></location>Recently, significant progress has been made with vision based approaches to extract tables in documents. For the sake of completeness, the issue of table extraction from documents is typically decomposed into two separate challenges, i.e. (1) finding the location of the table(s) on a document-page and (2) finding the structure of a given table in the document.</text>
-<text><location><page_1><loc_50><loc_10><loc_89><loc_16></location>The first problem is called table-location and has been previously addressed [30, 38, 19, 21, 23, 26, 8] with stateof-the-art object-detection networks (e.g. YOLO and later on Mask-RCNN [9]). For all practical purposes, it can be</text>
-<text><location><page_2><loc_8><loc_88><loc_47><loc_91></location>considered as a solved problem, given enough ground-truth data to train on.</text>
-<text><location><page_2><loc_8><loc_71><loc_47><loc_87></location>The second problem is called table-structure decomposition. The latter is a long standing problem in the community of document understanding [6, 4, 14]. Contrary to the table-location problem, there are no commonly used approaches that can easily be re-purposed to solve this problem. Lately, a set of new model-architectures has been proposed by the community to address table-structure decomposition [37, 36, 18, 20]. All these models have some weaknesses (see Sec. 2). The common denominator here is the reliance on textual features and/or the inability to provide the bounding box of each table-cell in the original image.</text>
-<text><location><page_2><loc_8><loc_53><loc_47><loc_71></location>In this paper, we want to address these weaknesses and present a robust table-structure decomposition algorithm. The design criteria for our model are the following. First, we want our algorithm to be language agnostic. In this way, we can obtain the structure of any table, irregardless of the language. Second, we want our algorithm to leverage as much data as possible from the original PDF document. For programmatic PDF documents, the text-cells can often be extracted much faster and with higher accuracy compared to OCR methods. Last but not least, we want to have a direct link between the table-cell and its bounding box in the image.</text>
-<text><location><page_2><loc_8><loc_45><loc_47><loc_53></location>To meet the design criteria listed above, we developed a new model called TableFormer and a synthetically generated table structure dataset called SynthTabNet $^{1}$. In particular, our contributions in this work can be summarised as follows:</text>
-<unordered_list>
-<list_item><location><page_2><loc_10><loc_38><loc_47><loc_44></location>· We propose TableFormer , a transformer based model that predicts tables structure and bounding boxes for the table content simultaneously in an end-to-end approach.</list_item>
-<list_item><location><page_2><loc_10><loc_31><loc_47><loc_37></location>· Across all benchmark datasets TableFormer significantly outperforms existing state-of-the-art metrics, while being much more efficient in training and inference to existing works.</list_item>
-<list_item><location><page_2><loc_10><loc_25><loc_47><loc_29></location>· We present SynthTabNet a synthetically generated dataset, with various appearance styles and complexity.</list_item>
-<list_item><location><page_2><loc_10><loc_19><loc_47><loc_24></location>· An augmented dataset based on PubTabNet [37], FinTabNet [36], and TableBank [17] with generated ground-truth for reproducibility.</list_item>
+<text><loc_41><loc_411><loc_234><loc_439>The paper is structured as follows. In Sec. 2, we give a brief overview of the current state-of-the-art. In Sec. 3, we describe the datasets on which we train. In Sec. 4, we introduce the TableFormer model-architecture and describe</text>
+<footnote><loc_50><loc_445><loc_150><loc_450>$^{1}$https://github.com/IBM/SynthTabNet</footnote>
+<text><loc_252><loc_47><loc_445><loc_68>its results & performance in Sec. 5. As a conclusion, we describe how this new model-architecture can be re-purposed for other tasks in the computer-vision community.</text>
+<section_header_level_1><loc_252><loc_77><loc_407><loc_84>2. Previous work and State of the Art</section_header_level_1>
+<text><loc_252><loc_90><loc_445><loc_209>Identifying the structure of a table has been an outstanding problem in the document-parsing community, that motivates many organised public challenges [6, 4, 14]. The difficulty of the problem can be attributed to a number of factors. First, there is a large variety in the shapes and sizes of tables. Such large variety requires a flexible method. This is especially true for complex column- and row headers, which can be extremely intricate and demanding. A second factor of complexity is the lack of data with regard to table-structure. Until the publication of PubTabNet [37], there were no large datasets (i.e. > 100 K tables) that provided structure information. This happens primarily due to the fact that tables are notoriously time-consuming to annotate by hand. However, this has definitely changed in recent years with the deliverance of PubTabNet [37], FinTabNet [36], TableBank [17] etc.</text>
+<text><loc_252><loc_211><loc_445><loc_284>Before the rising popularity of deep neural networks, the community relied heavily on heuristic and/or statistical methods to do table structure identification [3, 7, 11, 5, 13, 28]. Although such methods work well on constrained tables [12], a more data-driven approach can be applied due to the advent of convolutional neural networks (CNNs) and the availability of large datasets. To the best-of-our knowledge, there are currently two different types of network architecture that are being pursued for state-of-the-art tablestructure identification.</text>
+<text><loc_252><loc_286><loc_445><loc_450>Image-to-Text networks : In this type of network, one predicts a sequence of tokens starting from an encoded image. Such sequences of tokens can be HTML table tags [37, 17] or LaTeX symbols[10]. The choice of symbols is ultimately not very important, since one can be transformed into the other. There are however subtle variations in the Image-to-Text networks. The easiest network architectures are "image-encoder → text-decoder" (IETD), similar to network architectures that try to provide captions to images [32]. In these IETD networks, one expects as output the LaTeX/HTML string of the entire table, i.e. the symbols necessary for creating the table with the content of the table. Another approach is the "image-encoder → dual decoder" (IEDD) networks. In these type of networks, one has two consecutive decoders with different purposes. The first decoder is the tag-decoder , i.e. it only produces the HTML/LaTeX tags which construct an empty table. The second content-decoder uses the encoding of the image in combination with the output encoding of each cell-tag (from the tag-decoder ) to generate the textual content of each table cell. The network architecture of IEDD is certainly more elaborate, but it has the advantage that one can pre-train the</text>
+<page_footer><loc_241><loc_463><loc_245><loc_469>2</page_footer>
+<page_break>
+<text><loc_41><loc_47><loc_204><loc_53>tag-decoder which is constrained to the table-tags.</text>
+<text><loc_41><loc_55><loc_234><loc_174>In practice, both network architectures (IETD and IEDD) require an implicit, custom trained object-characterrecognition (OCR) to obtain the content of the table-cells. In the case of IETD, this OCR engine is implicit in the decoder similar to [24]. For the IEDD, the OCR is solely embedded in the content-decoder. This reliance on a custom, implicit OCR decoder is of course problematic. OCR is a well known and extremely tough problem, that often needs custom training for each individual language. However, the limited availability for non-english content in the current datasets, makes it impractical to apply the IETD and IEDD methods on tables with other languages. Additionally, OCR can be completely omitted if the tables originate from programmatic PDF documents with known positions of each cell. The latter was the inspiration for the work of this paper.</text>
+<text><loc_41><loc_176><loc_234><loc_310>Graph Neural networks : Graph Neural networks (GNN's) take a radically different approach to tablestructure extraction. Note that one table cell can constitute out of multiple text-cells. To obtain the table-structure, one creates an initial graph, where each of the text-cells becomes a node in the graph similar to [33, 34, 2]. Each node is then associated with en embedding vector coming from the encoded image, its coordinates and the encoded text. Furthermore, nodes that represent adjacent text-cells are linked. Graph Convolutional Networks (GCN's) based methods take the image as an input, but also the position of the text-cells and their content [18]. The purpose of a GCN is to transform the input graph into a new graph, which replaces the old links with new ones. The new links then represent the table-structure. With this approach, one can avoid the need to build custom OCR decoders. However, the quality of the reconstructed structure is not comparable to the current state-of-the-art [18].</text>
+<text><loc_41><loc_312><loc_234><loc_393>Hybrid Deep Learning-Rule-Based approach : A popular current model for table-structure identification is the use of a hybrid Deep Learning-Rule-Based approach similar to [27, 29]. In this approach, one first detects the position of the table-cells with object detection (e.g. YoloVx or MaskRCNN), then classifies the table into different types (from its images) and finally uses different rule-sets to obtain its table-structure. Currently, this approach achieves stateof-the-art results, but is not an end-to-end deep-learning method. As such, new rules need to be written if different types of tables are encountered.</text>
+<section_header_level_1><loc_41><loc_401><loc_86><loc_408>3. Datasets</section_header_level_1>
+<text><loc_41><loc_414><loc_234><loc_450>We rely on large-scale datasets such as PubTabNet [37], FinTabNet [36], and TableBank [17] datasets to train and evaluate our models. These datasets span over various appearance styles and content. We also introduce our own synthetically generated SynthTabNet dataset to fix an im-</text>
+<picture><loc_255><loc_50><loc_450><loc_158><caption><loc_252><loc_169><loc_445><loc_182>Figure 2: Distribution of the tables across different table dimensions in PubTabNet + FinTabNet datasets</caption></picture>
+<text><loc_252><loc_200><loc_357><loc_206>balance in the previous datasets.</text>
+<text><loc_252><loc_209><loc_445><loc_396>The PubTabNet dataset contains 509k tables delivered as annotated PNG images. The annotations consist of the table structure represented in HTML format, the tokenized text and its bounding boxes per table cell. Fig. 1 shows the appearance style of PubTabNet. Depending on its complexity, a table is characterized as "simple" when it does not contain row spans or column spans, otherwise it is "complex". The dataset is divided into Train and Val splits (roughly 98% and 2%). The Train split consists of 54% simple and 46% complex tables and the Val split of 51% and 49% respectively. The FinTabNet dataset contains 112k tables delivered as single-page PDF documents with mixed table structures and text content. Similarly to the PubTabNet, the annotations of FinTabNet include the table structure in HTML, the tokenized text and the bounding boxes on a table cell basis. The dataset is divided into Train, Test and Val splits (81%, 9.5%, 9.5%), and each one is almost equally divided into simple and complex tables (Train: 48% simple, 52% complex, Test: 48% simple, 52% complex, Test: 53% simple, 47% complex). Finally the TableBank dataset consists of 145k tables provided as JPEG images. The latter has annotations for the table structure, but only few with bounding boxes of the table cells. The entire dataset consists of simple tables and it is divided into 90% Train, 3% Test and 7% Val splits.</text>
+<text><loc_252><loc_399><loc_445><loc_450>Due to the heterogeneity across the dataset formats, it was necessary to combine all available data into one homogenized dataset before we could train our models for practical purposes. Given the size of PubTabNet, we adopted its annotation format and we extracted and converted all tables as PNG images with a resolution of 72 dpi. Additionally, we have filtered out tables with extreme sizes due to small</text>
+<page_footer><loc_241><loc_463><loc_245><loc_469>3</page_footer>
+<page_break>
+<text><loc_41><loc_47><loc_234><loc_61>amount of such tables, and kept only those ones ranging between 1*1 and 20*10 (rows/columns).</text>
+<text><loc_41><loc_64><loc_234><loc_198>The availability of the bounding boxes for all table cells is essential to train our models. In order to distinguish between empty and non-empty bounding boxes, we have introduced a binary class in the annotation. Unfortunately, the original datasets either omit the bounding boxes for whole tables (e.g. TableBank) or they narrow their scope only to non-empty cells. Therefore, it was imperative to introduce a data pre-processing procedure that generates the missing bounding boxes out of the annotation information. This procedure first parses the provided table structure and calculates the dimensions of the most fine-grained grid that covers the table structure. Notice that each table cell may occupy multiple grid squares due to row or column spans. In case of PubTabNet we had to compute missing bounding boxes for 48% of the simple and 69% of the complex tables. Regarding FinTabNet, 68% of the simple and 98% of the complex tables require the generation of bounding boxes.</text>
+<text><loc_41><loc_201><loc_234><loc_274>As it is illustrated in Fig. 2, the table distributions from all datasets are skewed towards simpler structures with fewer number of rows/columns. Additionally, there is very limited variance in the table styles, which in case of PubTabNet and FinTabNet means one styling format for the majority of the tables. Similar limitations appear also in the type of table content, which in some cases (e.g. FinTabNet) is restricted to a certain domain. Ultimately, the lack of diversity in the training dataset damages the ability of the models to generalize well on unseen data.</text>
+<text><loc_41><loc_277><loc_234><loc_396>Motivated by those observations we aimed at generating a synthetic table dataset named SynthTabNet . This approach offers control over: 1) the size of the dataset, 2) the table structure, 3) the table style and 4) the type of content. The complexity of the table structure is described by the size of the table header and the table body, as well as the percentage of the table cells covered by row spans and column spans. A set of carefully designed styling templates provides the basis to build a wide range of table appearances. Lastly, the table content is generated out of a curated collection of text corpora. By controlling the size and scope of the synthetic datasets we are able to train and evaluate our models in a variety of different conditions. For example, we can first generate a highly diverse dataset to train our models and then evaluate their performance on other synthetic datasets which are focused on a specific domain.</text>
+<text><loc_41><loc_399><loc_234><loc_450>In this regard, we have prepared four synthetic datasets, each one containing 150k examples. The corpora to generate the table text consists of the most frequent terms appearing in PubTabNet and FinTabNet together with randomly generated text. The first two synthetic datasets have been fine-tuned to mimic the appearance of the original datasets but encompass more complicated table structures. The third</text>
+<otsl><loc_254><loc_46><loc_444><loc_98><ecel><ched>Tags<ched>Bbox<ched>Size<ched>Format<nl><rhed>PubTabNet<fcel>3<fcel>3<fcel>509k<fcel>PNG<nl><rhed>FinTabNet<fcel>3<fcel>3<fcel>112k<fcel>PDF<nl><rhed>TableBank<fcel>3<fcel>7<fcel>145k<fcel>JPEG<nl><rhed>Combined-Tabnet(*)<fcel>3<fcel>3<fcel>400k<fcel>PNG<nl><rhed>Combined(**)<fcel>3<fcel>3<fcel>500k<fcel>PNG<nl><rhed>SynthTabNet<fcel>3<fcel>3<fcel>600k<fcel>PNG<nl><caption><loc_252><loc_106><loc_445><loc_142>Table 1: Both "Combined-Tabnet" and "CombinedTabnet" are variations of the following: (*) The CombinedTabnet dataset is the processed combination of PubTabNet and Fintabnet. (**) The combined dataset is the processed combination of PubTabNet, Fintabnet and TableBank.</caption></otsl>
+<text><loc_252><loc_158><loc_445><loc_186>one adopts a colorful appearance with high contrast and the last one contains tables with sparse content. Lastly, we have combined all synthetic datasets into one big unified synthetic dataset of 600k examples.</text>
+<text><loc_262><loc_188><loc_443><loc_194>Tab. 1 summarizes the various attributes of the datasets.</text>
+<section_header_level_1><loc_252><loc_203><loc_364><loc_210>4. The TableFormer model</section_header_level_1>
+<text><loc_252><loc_216><loc_445><loc_282>Given the image of a table, TableFormer is able to predict: 1) a sequence of tokens that represent the structure of a table, and 2) a bounding box coupled to a subset of those tokens. The conversion of an image into a sequence of tokens is a well-known task [35, 16]. While attention is often used as an implicit method to associate each token of the sequence with a position in the original image, an explicit association between the individual table-cells and the image bounding boxes is also required.</text>
+<section_header_level_1><loc_252><loc_289><loc_343><loc_295>4.1. Model architecture.</section_header_level_1>
+<text><loc_252><loc_301><loc_445><loc_420>We now describe in detail the proposed method, which is composed of three main components, see Fig. 4. Our CNN Backbone Network encodes the input as a feature vector of predefined length. The input feature vector of the encoded image is passed to the Structure Decoder to produce a sequence of HTML tags that represent the structure of the table. With each prediction of an HTML standard data cell (' < td > ') the hidden state of that cell is passed to the Cell BBox Decoder. As for spanning cells, such as row or column span, the tag is broken down to ' < ', 'rowspan=' or 'colspan=', with the number of spanning cells (attribute), and ' > '. The hidden state attached to ' < ' is passed to the Cell BBox Decoder. A shared feed forward network (FFN) receives the hidden states from the Structure Decoder, to provide the final detection predictions of the bounding box coordinates and their classification.</text>
+<text><loc_252><loc_422><loc_445><loc_450>CNN Backbone Network. A ResNet-18 CNN is the backbone that receives the table image and encodes it as a vector of predefined length. The network has been modified by removing the linear and pooling layer, as we are not per-</text>
+<page_footer><loc_241><loc_463><loc_245><loc_469>4</page_footer>
+<page_break>
+<picture><loc_61><loc_49><loc_425><loc_116><caption><loc_41><loc_129><loc_445><loc_142>Figure 3: TableFormer takes in an image of the PDF and creates bounding box and HTML structure predictions that are synchronized. The bounding boxes grabs the content from the PDF and inserts it in the structure.</caption></picture>
+<picture><loc_43><loc_163><loc_233><loc_320><caption><loc_41><loc_333><loc_234><loc_429>Figure 4: Given an input image of a table, the Encoder produces fixed-length features that represent the input image. The features are then passed to both the Structure Decoder and Cell BBox Decoder . During training, the Structure Decoder receives 'tokenized tags' of the HTML code that represent the table structure. Afterwards, a transformer encoder and decoder architecture is employed to produce features that are received by a linear layer, and the Cell BBox Decoder. The linear layer is applied to the features to predict the tags. Simultaneously, the Cell BBox Decoder selects features referring to the data cells (' < td > ', ' < ') and passes them through an attention network, an MLP, and a linear layer to predict the bounding boxes.</caption></picture>
+<text><loc_252><loc_158><loc_445><loc_186>forming classification, and adding an adaptive pooling layer of size 28*28. ResNet by default downsamples the image resolution by 32 and then the encoded image is provided to both the Structure Decoder , and Cell BBox Decoder .</text>
+<text><loc_252><loc_188><loc_445><loc_261>Structure Decoder. The transformer architecture of this component is based on the work proposed in [31]. After extensive experimentation, the Structure Decoder is modeled as a transformer encoder with two encoder layers and a transformer decoder made from a stack of 4 decoder layers that comprise mainly of multi-head attention and feed forward layers. This configuration uses fewer layers and heads in comparison to networks applied to other problems (e.g. "Scene Understanding", "Image Captioning"), something which we relate to the simplicity of table images.</text>
+<text><loc_252><loc_263><loc_445><loc_344>The transformer encoder receives an encoded image from the CNN Backbone Network and refines it through a multi-head dot-product attention layer, followed by a Feed Forward Network. During training, the transformer decoder receives as input the output feature produced by the transformer encoder, and the tokenized input of the HTML ground-truth tags. Using a stack of multi-head attention layers, different aspects of the tag sequence could be inferred. This is achieved by each attention head on a layer operating in a different subspace, and then combining altogether their attention score.</text>
+<text><loc_252><loc_346><loc_445><loc_412>Cell BBox Decoder. Our architecture allows to simultaneously predict HTML tags and bounding boxes for each table cell without the need of a separate object detector end to end. This approach is inspired by DETR [1] which employs a Transformer Encoder, and Decoder that looks for a specific number of object queries (potential object detections). As our model utilizes a transformer architecture, the hidden state of the < td > ' and ' < ' HTML structure tags become the object query.</text>
+<text><loc_252><loc_414><loc_445><loc_450>The encoding generated by the CNN Backbone Network along with the features acquired for every data cell from the Transformer Decoder are then passed to the attention network. The attention network takes both inputs and learns to provide an attention weighted encoding. This weighted at-</text>
+<page_footer><loc_241><loc_463><loc_245><loc_469>5</page_footer>
+<page_break>
+<text><loc_41><loc_47><loc_234><loc_98>tention encoding is then multiplied to the encoded image to produce a feature for each table cell. Notice that this is different than the typical object detection problem where imbalances between the number of detections and the amount of objects may exist. In our case, we know up front that the produced detections always match with the table cells in number and correspondence.</text>
+<text><loc_41><loc_101><loc_234><loc_152>The output features for each table cell are then fed into the feed-forward network (FFN). The FFN consists of a Multi-Layer Perceptron (3 layers with ReLU activation function) that predicts the normalized coordinates for the bounding box of each table cell. Finally, the predicted bounding boxes are classified based on whether they are empty or not using a linear layer.</text>
+<text><loc_41><loc_154><loc_234><loc_280>Loss Functions. We formulate a multi-task loss Eq. 2 to train our network. The Cross-Entropy loss (denoted as l$_{s}$ ) is used to train the Structure Decoder which predicts the structure tokens. As for the Cell BBox Decoder it is trained with a combination of losses denoted as l$_{box}$ . l$_{box}$ consists of the generally used l$_{1}$ loss for object detection and the IoU loss ( l$_{iou}$ ) to be scale invariant as explained in [25]. In comparison to DETR, we do not use the Hungarian algorithm [15] to match the predicted bounding boxes with the ground-truth boxes, as we have already achieved a one-toone match through two steps: 1) Our token input sequence is naturally ordered, therefore the hidden states of the table data cells are also in order when they are provided as input to the Cell BBox Decoder , and 2) Our bounding boxes generation mechanism (see Sec. 3) ensures a one-to-one mapping between the cell content and its bounding box for all post-processed datasets.</text>
+<text><loc_41><loc_283><loc_234><loc_296>The loss used to train the TableFormer can be defined as following:</text>
+<formula><loc_102><loc_311><loc_234><loc_326></formula>
+<text><loc_41><loc_335><loc_230><loc_341>where λ ∈ [0, 1], and λ$_{iou}$, λ$_{l}$$_{1}$ ∈$_{R}$ are hyper-parameters.</text>
+<section_header_level_1><loc_41><loc_351><loc_141><loc_358>5. Experimental Results</section_header_level_1>
+<section_header_level_1><loc_41><loc_364><loc_146><loc_370>5.1. Implementation Details</section_header_level_1>
+<text><loc_41><loc_376><loc_234><loc_404>TableFormer uses ResNet-18 as the CNN Backbone Network . The input images are resized to 448*448 pixels and the feature map has a dimension of 28*28. Additionally, we enforce the following input constraints:</text>
+<formula><loc_75><loc_413><loc_234><loc_428></formula>
+<text><loc_41><loc_437><loc_234><loc_450><loc_41><loc_437><loc_234><loc_450>Although input constraints are used also by other methods, such as EDD, ours are less restrictive due to the improved runtime performance and lower memory footprint of TableFormer. This allows to utilize input samples with longer sequences and images with larger dimensions.</text>
+<text><loc_252><loc_73><loc_445><loc_207>The Transformer Encoder consists of two "Transformer Encoder Layers", with an input feature size of 512, feed forward network of 1024, and 4 attention heads. As for the Transformer Decoder it is composed of four "Transformer Decoder Layers" with similar input and output dimensions as the "Transformer Encoder Layers". Even though our model uses fewer layers and heads than the default implementation parameters, our extensive experimentation has proved this setup to be more suitable for table images. We attribute this finding to the inherent design of table images, which contain mostly lines and text, unlike the more elaborate content present in other scopes (e.g. the COCO dataset). Moreover, we have added ResNet blocks to the inputs of the Structure Decoder and Cell BBox Decoder. This prevents a decoder having a stronger influence over the learned weights which would damage the other prediction task (structure vs bounding boxes), but learn task specific weights instead. Lastly our dropout layers are set to 0.5.</text>
+<text><loc_252><loc_212><loc_445><loc_271>For training, TableFormer is trained with 3 Adam optimizers, each one for the CNN Backbone Network , Structure Decoder , and Cell BBox Decoder . Taking the PubTabNet as an example for our parameter set up, the initializing learning rate is 0.001 for 12 epochs with a batch size of 24, and λ set to 0.5. Afterwards, we reduce the learning rate to 0.0001, the batch size to 18 and train for 12 more epochs or convergence.</text>
+<text><loc_252><loc_276><loc_445><loc_350>TableFormer is implemented with PyTorch and Torchvision libraries [22]. To speed up the inference, the image undergoes a single forward pass through the CNN Backbone Network and transformer encoder. This eliminates the overhead of generating the same features for each decoding step. Similarly, we employ a 'caching' technique to preform faster autoregressive decoding. This is achieved by storing the features of decoded tokens so we can reuse them for each time step. Therefore, we only compute the attention for each new tag.</text>
+<section_header_level_1><loc_252><loc_366><loc_325><loc_372>5.2. Generalization</section_header_level_1>
+<text><loc_252><loc_381><loc_445><loc_424>TableFormer is evaluated on three major publicly available datasets of different nature to prove the generalization and effectiveness of our model. The datasets used for evaluation are the PubTabNet, FinTabNet and TableBank which stem from the scientific, financial and general domains respectively.</text>
+<text><loc_252><loc_430><loc_445><loc_450>We also share our baseline results on the challenging SynthTabNet dataset. Throughout our experiments, the same parameters stated in Sec. 5.1 are utilized.</text>
+<page_footer><loc_241><loc_463><loc_245><loc_469>6</page_footer>
+<page_break>
+<section_header_level_1><loc_41><loc_47><loc_137><loc_53>5.3. Datasets and Metrics</section_header_level_1>
+<text><loc_41><loc_59><loc_234><loc_87>The Tree-Edit-Distance-Based Similarity (TEDS) metric was introduced in [37]. It represents the prediction, and ground-truth as a tree structure of HTML tags. This similarity is calculated as:</text>
+<formula><loc_70><loc_95><loc_234><loc_109></formula>
+<text><loc_41><loc_114><loc_234><loc_135>where T$_{a}$ and T$_{b}$ represent tables in tree structure HTML format. EditDist denotes the tree-edit distance, and | T | represents the number of nodes in T .</text>
+<section_header_level_1><loc_41><loc_142><loc_139><loc_148>5.4. Quantitative Analysis</section_header_level_1>
+<text><loc_41><loc_154><loc_234><loc_250>Structure. As shown in Tab. 2, TableFormer outperforms all SOTA methods across different datasets by a large margin for predicting the table structure from an image. All the more, our model outperforms pre-trained methods. During the evaluation we do not apply any table filtering. We also provide our baseline results on the SynthTabNet dataset. It has been observed that large tables (e.g. tables that occupy half of the page or more) yield poor predictions. We attribute this issue to the image resizing during the preprocessing step, that produces downsampled images with indistinguishable features. This problem can be addressed by treating such big tables with a separate model which accepts a large input image size.</text>
+<otsl><loc_44><loc_258><loc_231><loc_368><ched>Model<ched>Dataset<ched>Simple<ched>TEDS Complex<ched>All<nl><rhed>EDD<fcel>PTN<fcel>91.1<fcel>88.7<fcel>89.9<nl><rhed>GTE<fcel>PTN<fcel>-<fcel>-<fcel>93.01<nl><rhed>TableFormer<fcel>PTN<fcel>98.5<fcel>95.0<fcel>96.75<nl><rhed>EDD<fcel>FTN<fcel>88.4<fcel>92.08<fcel>90.6<nl><rhed>GTE<fcel>FTN<fcel>-<fcel>-<fcel>87.14<nl><rhed>GTE (FT)<fcel>FTN<fcel>-<fcel>-<fcel>91.02<nl><rhed>TableFormer<fcel>FTN<fcel>97.5<fcel>96.0<fcel>96.8<nl><rhed>EDD<fcel>TB<fcel>86.0<fcel>-<fcel>86.0<nl><rhed>TableFormer<fcel>TB<fcel>89.6<fcel>-<fcel>89.6<nl><rhed>TableFormer<fcel>STN<fcel>96.9<fcel>95.7<fcel>96.7<nl></otsl>
+<text><loc_41><loc_374><loc_234><loc_387>Table 2: Structure results on PubTabNet (PTN), FinTabNet (FTN), TableBank (TB) and SynthTabNet (STN).</text>
+<text><loc_41><loc_389><loc_214><loc_395>FT: Model was trained on PubTabNet then finetuned.</text>
+<text><loc_41><loc_407><loc_234><loc_450><loc_41><loc_407><loc_234><loc_450>Cell Detection. Like any object detector, our Cell BBox Detector provides bounding boxes that can be improved with post-processing during inference. We make use of the grid-like structure of tables to refine the predictions. A detailed explanation on the post-processing is available in the supplementary material. As shown in Tab. 3, we evaluate our Cell BBox Decoder accuracy for cells with a class label of 'content' only using the PASCAL VOC mAP metric for pre-processing and post-processing. Note that we do not have post-processing results for SynthTabNet as images are only provided. To compare the performance of our proposed approach, we've integrated TableFormer's Cell BBox Decoder into EDD architecture. As mentioned previously, the Structure Decoder provides the Cell BBox Decoder with the features needed to predict the bounding box predictions. Therefore, the accuracy of the Structure Decoder directly influences the accuracy of the Cell BBox Decoder . If the Structure Decoder predicts an extra column, this will result in an extra column of predicted bounding boxes.</text>
+<otsl><loc_252><loc_156><loc_436><loc_192><ched>Model<ched>Dataset<ched>mAP<ched>mAP (PP)<nl><fcel>EDD+BBox<fcel>PubTabNet<fcel>79.2<fcel>82.7<nl><fcel>TableFormer<fcel>PubTabNet<fcel>82.1<fcel>86.8<nl><fcel>TableFormer<fcel>SynthTabNet<fcel>87.7<fcel>-<nl><caption><loc_252><loc_200><loc_445><loc_213>Table 3: Cell Bounding Box detection results on PubTabNet, and FinTabNet. PP: Post-processing.</caption></otsl>
+<text><loc_252><loc_232><loc_445><loc_328>Cell Content. In this section, we evaluate the entire pipeline of recovering a table with content. Here we put our approach to test by capitalizing on extracting content from the PDF cells rather than decoding from images. Tab. 4 shows the TEDs score of HTML code representing the structure of the table along with the content inserted in the data cell and compared with the ground-truth. Our method achieved a 5.3% increase over the state-of-the-art, and commercial solutions. We believe our scores would be higher if the HTML ground-truth matched the extracted PDF cell content. Unfortunately, there are small discrepancies such as spacings around words or special characters with various unicode representations.</text>
+<otsl><loc_272><loc_341><loc_426><loc_406><fcel>Model<ched>Simple<ched>TEDS Complex<ched>All<nl><rhed>Tabula<fcel>78.0<fcel>57.8<fcel>67.9<nl><rhed>Traprange<fcel>60.8<fcel>49.9<fcel>55.4<nl><rhed>Camelot<fcel>80.0<fcel>66.0<fcel>73.0<nl><rhed>Acrobat Pro<fcel>68.9<fcel>61.8<fcel>65.3<nl><rhed>EDD<fcel>91.2<fcel>85.4<fcel>88.3<nl><rhed>TableFormer<fcel>95.4<fcel>90.1<fcel>93.6<nl><caption><loc_252><loc_415><loc_445><loc_435>Table 4: Results of structure with content retrieved using cell detection on PubTabNet. In all cases the input is PDF documents with cropped tables.</caption></otsl>
+<page_footer><loc_241><loc_463><loc_245><loc_469>7</page_footer>
+<unordered_list><page_break>
+<list_item><loc_44><loc_50><loc_50><loc_55>a.</list_item>
+<list_item><loc_54><loc_50><loc_408><loc_55>Red - PDF cells, Green - predicted bounding boxes, Blue - post-processed predictions matched to PDF cells</list_item>
 </unordered_list>
-<text><location><page_2><loc_8><loc_12><loc_47><loc_18></location>The paper is structured as follows. In Sec. 2, we give a brief overview of the current state-of-the-art. In Sec. 3, we describe the datasets on which we train. In Sec. 4, we introduce the TableFormer model-architecture and describe</text>
-<text><location><page_2><loc_50><loc_86><loc_89><loc_91></location>its results & performance in Sec. 5. As a conclusion, we describe how this new model-architecture can be re-purposed for other tasks in the computer-vision community.</text>
-<section_header_level_1><location><page_2><loc_50><loc_83><loc_81><loc_85></location>2. Previous work and State of the Art</section_header_level_1>
-<text><location><page_2><loc_50><loc_58><loc_89><loc_82></location>Identifying the structure of a table has been an outstanding problem in the document-parsing community, that motivates many organised public challenges [6, 4, 14]. The difficulty of the problem can be attributed to a number of factors. First, there is a large variety in the shapes and sizes of tables. Such large variety requires a flexible method. This is especially true for complex column- and row headers, which can be extremely intricate and demanding. A second factor of complexity is the lack of data with regard to table-structure. Until the publication of PubTabNet [37], there were no large datasets (i.e. > 100 K tables) that provided structure information. This happens primarily due to the fact that tables are notoriously time-consuming to annotate by hand. However, this has definitely changed in recent years with the deliverance of PubTabNet [37], FinTabNet [36], TableBank [17] etc.</text>
-<text><location><page_2><loc_50><loc_43><loc_89><loc_58></location>Before the rising popularity of deep neural networks, the community relied heavily on heuristic and/or statistical methods to do table structure identification [3, 7, 11, 5, 13, 28]. Although such methods work well on constrained tables [12], a more data-driven approach can be applied due to the advent of convolutional neural networks (CNNs) and the availability of large datasets. To the best-of-our knowledge, there are currently two different types of network architecture that are being pursued for state-of-the-art tablestructure identification.</text>
-<text><location><page_2><loc_50><loc_10><loc_89><loc_43></location>Image-to-Text networks : In this type of network, one predicts a sequence of tokens starting from an encoded image. Such sequences of tokens can be HTML table tags [37, 17] or LaTeX symbols[10]. The choice of symbols is ultimately not very important, since one can be transformed into the other. There are however subtle variations in the Image-to-Text networks. The easiest network architectures are "image-encoder → text-decoder" (IETD), similar to network architectures that try to provide captions to images [32]. In these IETD networks, one expects as output the LaTeX/HTML string of the entire table, i.e. the symbols necessary for creating the table with the content of the table. Another approach is the "image-encoder → dual decoder" (IEDD) networks. In these type of networks, one has two consecutive decoders with different purposes. The first decoder is the tag-decoder , i.e. it only produces the HTML/LaTeX tags which construct an empty table. The second content-decoder uses the encoding of the image in combination with the output encoding of each cell-tag (from the tag-decoder ) to generate the textual content of each table cell. The network architecture of IEDD is certainly more elaborate, but it has the advantage that one can pre-train the</text>
-<text><location><page_3><loc_8><loc_89><loc_41><loc_91></location>tag-decoder which is constrained to the table-tags.</text>
-<text><location><page_3><loc_8><loc_65><loc_47><loc_89></location>In practice, both network architectures (IETD and IEDD) require an implicit, custom trained object-characterrecognition (OCR) to obtain the content of the table-cells. In the case of IETD, this OCR engine is implicit in the decoder similar to [24]. For the IEDD, the OCR is solely embedded in the content-decoder. This reliance on a custom, implicit OCR decoder is of course problematic. OCR is a well known and extremely tough problem, that often needs custom training for each individual language. However, the limited availability for non-english content in the current datasets, makes it impractical to apply the IETD and IEDD methods on tables with other languages. Additionally, OCR can be completely omitted if the tables originate from programmatic PDF documents with known positions of each cell. The latter was the inspiration for the work of this paper.</text>
-<text><location><page_3><loc_8><loc_38><loc_47><loc_65></location>Graph Neural networks : Graph Neural networks (GNN's) take a radically different approach to tablestructure extraction. Note that one table cell can constitute out of multiple text-cells. To obtain the table-structure, one creates an initial graph, where each of the text-cells becomes a node in the graph similar to [33, 34, 2]. Each node is then associated with en embedding vector coming from the encoded image, its coordinates and the encoded text. Furthermore, nodes that represent adjacent text-cells are linked. Graph Convolutional Networks (GCN's) based methods take the image as an input, but also the position of the text-cells and their content [18]. The purpose of a GCN is to transform the input graph into a new graph, which replaces the old links with new ones. The new links then represent the table-structure. With this approach, one can avoid the need to build custom OCR decoders. However, the quality of the reconstructed structure is not comparable to the current state-of-the-art [18].</text>
-<text><location><page_3><loc_8><loc_21><loc_47><loc_38></location>Hybrid Deep Learning-Rule-Based approach : A popular current model for table-structure identification is the use of a hybrid Deep Learning-Rule-Based approach similar to [27, 29]. In this approach, one first detects the position of the table-cells with object detection (e.g. YoloVx or MaskRCNN), then classifies the table into different types (from its images) and finally uses different rule-sets to obtain its table-structure. Currently, this approach achieves stateof-the-art results, but is not an end-to-end deep-learning method. As such, new rules need to be written if different types of tables are encountered.</text>
-<section_header_level_1><location><page_3><loc_8><loc_18><loc_17><loc_20></location>3. Datasets</section_header_level_1>
-<text><location><page_3><loc_8><loc_10><loc_47><loc_17></location>We rely on large-scale datasets such as PubTabNet [37], FinTabNet [36], and TableBank [17] datasets to train and evaluate our models. These datasets span over various appearance styles and content. We also introduce our own synthetically generated SynthTabNet dataset to fix an im-</text>
-<figure>
-<location><page_3><loc_51><loc_68><loc_90><loc_90></location>
-<caption>Figure 2: Distribution of the tables across different table dimensions in PubTabNet + FinTabNet datasets</caption>
-</figure>
-<text><location><page_3><loc_50><loc_59><loc_71><loc_60></location>balance in the previous datasets.</text>
-<text><location><page_3><loc_50><loc_21><loc_89><loc_58></location>The PubTabNet dataset contains 509k tables delivered as annotated PNG images. The annotations consist of the table structure represented in HTML format, the tokenized text and its bounding boxes per table cell. Fig. 1 shows the appearance style of PubTabNet. Depending on its complexity, a table is characterized as "simple" when it does not contain row spans or column spans, otherwise it is "complex". The dataset is divided into Train and Val splits (roughly 98% and 2%). The Train split consists of 54% simple and 46% complex tables and the Val split of 51% and 49% respectively. The FinTabNet dataset contains 112k tables delivered as single-page PDF documents with mixed table structures and text content. Similarly to the PubTabNet, the annotations of FinTabNet include the table structure in HTML, the tokenized text and the bounding boxes on a table cell basis. The dataset is divided into Train, Test and Val splits (81%, 9.5%, 9.5%), and each one is almost equally divided into simple and complex tables (Train: 48% simple, 52% complex, Test: 48% simple, 52% complex, Test: 53% simple, 47% complex). Finally the TableBank dataset consists of 145k tables provided as JPEG images. The latter has annotations for the table structure, but only few with bounding boxes of the table cells. The entire dataset consists of simple tables and it is divided into 90% Train, 3% Test and 7% Val splits.</text>
-<text><location><page_3><loc_50><loc_10><loc_89><loc_20></location>Due to the heterogeneity across the dataset formats, it was necessary to combine all available data into one homogenized dataset before we could train our models for practical purposes. Given the size of PubTabNet, we adopted its annotation format and we extracted and converted all tables as PNG images with a resolution of 72 dpi. Additionally, we have filtered out tables with extreme sizes due to small</text>
-<text><location><page_4><loc_8><loc_88><loc_47><loc_91></location>amount of such tables, and kept only those ones ranging between 1*1 and 20*10 (rows/columns).</text>
-<text><location><page_4><loc_8><loc_60><loc_47><loc_87></location>The availability of the bounding boxes for all table cells is essential to train our models. In order to distinguish between empty and non-empty bounding boxes, we have introduced a binary class in the annotation. Unfortunately, the original datasets either omit the bounding boxes for whole tables (e.g. TableBank) or they narrow their scope only to non-empty cells. Therefore, it was imperative to introduce a data pre-processing procedure that generates the missing bounding boxes out of the annotation information. This procedure first parses the provided table structure and calculates the dimensions of the most fine-grained grid that covers the table structure. Notice that each table cell may occupy multiple grid squares due to row or column spans. In case of PubTabNet we had to compute missing bounding boxes for 48% of the simple and 69% of the complex tables. Regarding FinTabNet, 68% of the simple and 98% of the complex tables require the generation of bounding boxes.</text>
-<text><location><page_4><loc_8><loc_45><loc_47><loc_60></location>As it is illustrated in Fig. 2, the table distributions from all datasets are skewed towards simpler structures with fewer number of rows/columns. Additionally, there is very limited variance in the table styles, which in case of PubTabNet and FinTabNet means one styling format for the majority of the tables. Similar limitations appear also in the type of table content, which in some cases (e.g. FinTabNet) is restricted to a certain domain. Ultimately, the lack of diversity in the training dataset damages the ability of the models to generalize well on unseen data.</text>
-<text><location><page_4><loc_8><loc_21><loc_47><loc_45></location>Motivated by those observations we aimed at generating a synthetic table dataset named SynthTabNet . This approach offers control over: 1) the size of the dataset, 2) the table structure, 3) the table style and 4) the type of content. The complexity of the table structure is described by the size of the table header and the table body, as well as the percentage of the table cells covered by row spans and column spans. A set of carefully designed styling templates provides the basis to build a wide range of table appearances. Lastly, the table content is generated out of a curated collection of text corpora. By controlling the size and scope of the synthetic datasets we are able to train and evaluate our models in a variety of different conditions. For example, we can first generate a highly diverse dataset to train our models and then evaluate their performance on other synthetic datasets which are focused on a specific domain.</text>
-<text><location><page_4><loc_8><loc_10><loc_47><loc_20></location>In this regard, we have prepared four synthetic datasets, each one containing 150k examples. The corpora to generate the table text consists of the most frequent terms appearing in PubTabNet and FinTabNet together with randomly generated text. The first two synthetic datasets have been fine-tuned to mimic the appearance of the original datasets but encompass more complicated table structures. The third</text>
-<table>
-<location><page_4><loc_51><loc_80><loc_89><loc_91></location>
-<caption>Table 1: Both "Combined-Tabnet" and "CombinedTabnet" are variations of the following: (*) The CombinedTabnet dataset is the processed combination of PubTabNet and Fintabnet. (**) The combined dataset is the processed combination of PubTabNet, Fintabnet and TableBank.</caption>
-<row_0><col_0><body></col_0><col_1><col_header>Tags</col_1><col_2><col_header>Bbox</col_2><col_3><col_header>Size</col_3><col_4><col_header>Format</col_4></row_0>
-<row_1><col_0><row_header>PubTabNet</col_0><col_1><body>3</col_1><col_2><body>3</col_2><col_3><body>509k</col_3><col_4><body>PNG</col_4></row_1>
-<row_2><col_0><row_header>FinTabNet</col_0><col_1><body>3</col_1><col_2><body>3</col_2><col_3><body>112k</col_3><col_4><body>PDF</col_4></row_2>
-<row_3><col_0><row_header>TableBank</col_0><col_1><body>3</col_1><col_2><body>7</col_2><col_3><body>145k</col_3><col_4><body>JPEG</col_4></row_3>
-<row_4><col_0><row_header>Combined-Tabnet(*)</col_0><col_1><body>3</col_1><col_2><body>3</col_2><col_3><body>400k</col_3><col_4><body>PNG</col_4></row_4>
-<row_5><col_0><row_header>Combined(**)</col_0><col_1><body>3</col_1><col_2><body>3</col_2><col_3><body>500k</col_3><col_4><body>PNG</col_4></row_5>
-<row_6><col_0><row_header>SynthTabNet</col_0><col_1><body>3</col_1><col_2><body>3</col_2><col_3><body>600k</col_3><col_4><body>PNG</col_4></row_6>
-</table>
-<text><location><page_4><loc_50><loc_63><loc_89><loc_68></location>one adopts a colorful appearance with high contrast and the last one contains tables with sparse content. Lastly, we have combined all synthetic datasets into one big unified synthetic dataset of 600k examples.</text>
-<text><location><page_4><loc_52><loc_61><loc_89><loc_62></location>Tab. 1 summarizes the various attributes of the datasets.</text>
-<section_header_level_1><location><page_4><loc_50><loc_58><loc_73><loc_59></location>4. The TableFormer model</section_header_level_1>
-<text><location><page_4><loc_50><loc_44><loc_89><loc_57></location>Given the image of a table, TableFormer is able to predict: 1) a sequence of tokens that represent the structure of a table, and 2) a bounding box coupled to a subset of those tokens. The conversion of an image into a sequence of tokens is a well-known task [35, 16]. While attention is often used as an implicit method to associate each token of the sequence with a position in the original image, an explicit association between the individual table-cells and the image bounding boxes is also required.</text>
-<section_header_level_1><location><page_4><loc_50><loc_41><loc_69><loc_42></location>4.1. Model architecture.</section_header_level_1>
-<text><location><page_4><loc_50><loc_16><loc_89><loc_40></location>We now describe in detail the proposed method, which is composed of three main components, see Fig. 4. Our CNN Backbone Network encodes the input as a feature vector of predefined length. The input feature vector of the encoded image is passed to the Structure Decoder to produce a sequence of HTML tags that represent the structure of the table. With each prediction of an HTML standard data cell (' < td > ') the hidden state of that cell is passed to the Cell BBox Decoder. As for spanning cells, such as row or column span, the tag is broken down to ' < ', 'rowspan=' or 'colspan=', with the number of spanning cells (attribute), and ' > '. The hidden state attached to ' < ' is passed to the Cell BBox Decoder. A shared feed forward network (FFN) receives the hidden states from the Structure Decoder, to provide the final detection predictions of the bounding box coordinates and their classification.</text>
-<text><location><page_4><loc_50><loc_10><loc_89><loc_16></location>CNN Backbone Network. A ResNet-18 CNN is the backbone that receives the table image and encodes it as a vector of predefined length. The network has been modified by removing the linear and pooling layer, as we are not per-</text>
-<figure>
-<location><page_5><loc_12><loc_77><loc_85><loc_90></location>
-<caption>Figure 3: TableFormer takes in an image of the PDF and creates bounding box and HTML structure predictions that are synchronized. The bounding boxes grabs the content from the PDF and inserts it in the structure.</caption>
-</figure>
-<figure>
-<location><page_5><loc_9><loc_36><loc_47><loc_67></location>
-<caption>Figure 4: Given an input image of a table, the Encoder produces fixed-length features that represent the input image. The features are then passed to both the Structure Decoder and Cell BBox Decoder . During training, the Structure Decoder receives 'tokenized tags' of the HTML code that represent the table structure. Afterwards, a transformer encoder and decoder architecture is employed to produce features that are received by a linear layer, and the Cell BBox Decoder. The linear layer is applied to the features to predict the tags. Simultaneously, the Cell BBox Decoder selects features referring to the data cells (' < td > ', ' < ') and passes them through an attention network, an MLP, and a linear layer to predict the bounding boxes.</caption>
-</figure>
-<text><location><page_5><loc_50><loc_63><loc_89><loc_68></location>forming classification, and adding an adaptive pooling layer of size 28*28. ResNet by default downsamples the image resolution by 32 and then the encoded image is provided to both the Structure Decoder , and Cell BBox Decoder .</text>
-<text><location><page_5><loc_50><loc_48><loc_89><loc_62></location>Structure Decoder. The transformer architecture of this component is based on the work proposed in [31]. After extensive experimentation, the Structure Decoder is modeled as a transformer encoder with two encoder layers and a transformer decoder made from a stack of 4 decoder layers that comprise mainly of multi-head attention and feed forward layers. This configuration uses fewer layers and heads in comparison to networks applied to other problems (e.g. "Scene Understanding", "Image Captioning"), something which we relate to the simplicity of table images.</text>
-<text><location><page_5><loc_50><loc_31><loc_89><loc_47></location>The transformer encoder receives an encoded image from the CNN Backbone Network and refines it through a multi-head dot-product attention layer, followed by a Feed Forward Network. During training, the transformer decoder receives as input the output feature produced by the transformer encoder, and the tokenized input of the HTML ground-truth tags. Using a stack of multi-head attention layers, different aspects of the tag sequence could be inferred. This is achieved by each attention head on a layer operating in a different subspace, and then combining altogether their attention score.</text>
-<text><location><page_5><loc_50><loc_18><loc_89><loc_31></location>Cell BBox Decoder. Our architecture allows to simultaneously predict HTML tags and bounding boxes for each table cell without the need of a separate object detector end to end. This approach is inspired by DETR [1] which employs a Transformer Encoder, and Decoder that looks for a specific number of object queries (potential object detections). As our model utilizes a transformer architecture, the hidden state of the < td > ' and ' < ' HTML structure tags become the object query.</text>
-<text><location><page_5><loc_50><loc_10><loc_89><loc_17></location>The encoding generated by the CNN Backbone Network along with the features acquired for every data cell from the Transformer Decoder are then passed to the attention network. The attention network takes both inputs and learns to provide an attention weighted encoding. This weighted at-</text>
-<text><location><page_6><loc_8><loc_80><loc_47><loc_91></location>tention encoding is then multiplied to the encoded image to produce a feature for each table cell. Notice that this is different than the typical object detection problem where imbalances between the number of detections and the amount of objects may exist. In our case, we know up front that the produced detections always match with the table cells in number and correspondence.</text>
-<text><location><page_6><loc_8><loc_70><loc_47><loc_80></location>The output features for each table cell are then fed into the feed-forward network (FFN). The FFN consists of a Multi-Layer Perceptron (3 layers with ReLU activation function) that predicts the normalized coordinates for the bounding box of each table cell. Finally, the predicted bounding boxes are classified based on whether they are empty or not using a linear layer.</text>
-<text><location><page_6><loc_8><loc_44><loc_47><loc_69></location>Loss Functions. We formulate a multi-task loss Eq. 2 to train our network. The Cross-Entropy loss (denoted as l$_{s}$ ) is used to train the Structure Decoder which predicts the structure tokens. As for the Cell BBox Decoder it is trained with a combination of losses denoted as l$_{box}$ . l$_{box}$ consists of the generally used l$_{1}$ loss for object detection and the IoU loss ( l$_{iou}$ ) to be scale invariant as explained in [25]. In comparison to DETR, we do not use the Hungarian algorithm [15] to match the predicted bounding boxes with the ground-truth boxes, as we have already achieved a one-toone match through two steps: 1) Our token input sequence is naturally ordered, therefore the hidden states of the table data cells are also in order when they are provided as input to the Cell BBox Decoder , and 2) Our bounding boxes generation mechanism (see Sec. 3) ensures a one-to-one mapping between the cell content and its bounding box for all post-processed datasets.</text>
-<text><location><page_6><loc_8><loc_41><loc_47><loc_43></location>The loss used to train the TableFormer can be defined as following:</text>
-<formula><location><page_6><loc_20><loc_35><loc_47><loc_38></location>l$_{box}$ = λ$_{iou}$l$_{iou}$ + λ$_{l}$$_{1}$ l = λl$_{s}$ + (1 - λ ) l$_{box}$ (1)</formula>
-<text><location><page_6><loc_8><loc_32><loc_46><loc_33></location>where λ ∈ [0, 1], and λ$_{iou}$, λ$_{l}$$_{1}$ ∈$_{R}$ are hyper-parameters.</text>
-<section_header_level_1><location><page_6><loc_8><loc_28><loc_28><loc_30></location>5. Experimental Results</section_header_level_1>
-<section_header_level_1><location><page_6><loc_8><loc_26><loc_29><loc_27></location>5.1. Implementation Details</section_header_level_1>
-<text><location><page_6><loc_8><loc_19><loc_47><loc_25></location>TableFormer uses ResNet-18 as the CNN Backbone Network . The input images are resized to 448*448 pixels and the feature map has a dimension of 28*28. Additionally, we enforce the following input constraints:</text>
-<formula><location><page_6><loc_15><loc_14><loc_47><loc_17></location>Image width and height ≤ 1024 pixels Structural tags length ≤ 512 tokens. (2)</formula>
-<text><location><page_6><loc_8><loc_10><loc_47><loc_13></location>Although input constraints are used also by other methods, such as EDD, ours are less restrictive due to the improved</text>
-<text><location><page_6><loc_50><loc_86><loc_89><loc_91></location>runtime performance and lower memory footprint of TableFormer. This allows to utilize input samples with longer sequences and images with larger dimensions.</text>
-<text><location><page_6><loc_50><loc_59><loc_89><loc_85></location>The Transformer Encoder consists of two "Transformer Encoder Layers", with an input feature size of 512, feed forward network of 1024, and 4 attention heads. As for the Transformer Decoder it is composed of four "Transformer Decoder Layers" with similar input and output dimensions as the "Transformer Encoder Layers". Even though our model uses fewer layers and heads than the default implementation parameters, our extensive experimentation has proved this setup to be more suitable for table images. We attribute this finding to the inherent design of table images, which contain mostly lines and text, unlike the more elaborate content present in other scopes (e.g. the COCO dataset). Moreover, we have added ResNet blocks to the inputs of the Structure Decoder and Cell BBox Decoder. This prevents a decoder having a stronger influence over the learned weights which would damage the other prediction task (structure vs bounding boxes), but learn task specific weights instead. Lastly our dropout layers are set to 0.5.</text>
-<text><location><page_6><loc_50><loc_46><loc_89><loc_58></location>For training, TableFormer is trained with 3 Adam optimizers, each one for the CNN Backbone Network , Structure Decoder , and Cell BBox Decoder . Taking the PubTabNet as an example for our parameter set up, the initializing learning rate is 0.001 for 12 epochs with a batch size of 24, and λ set to 0.5. Afterwards, we reduce the learning rate to 0.0001, the batch size to 18 and train for 12 more epochs or convergence.</text>
-<text><location><page_6><loc_50><loc_30><loc_89><loc_45></location>TableFormer is implemented with PyTorch and Torchvision libraries [22]. To speed up the inference, the image undergoes a single forward pass through the CNN Backbone Network and transformer encoder. This eliminates the overhead of generating the same features for each decoding step. Similarly, we employ a 'caching' technique to preform faster autoregressive decoding. This is achieved by storing the features of decoded tokens so we can reuse them for each time step. Therefore, we only compute the attention for each new tag.</text>
-<section_header_level_1><location><page_6><loc_50><loc_26><loc_65><loc_27></location>5.2. Generalization</section_header_level_1>
-<text><location><page_6><loc_50><loc_15><loc_89><loc_24></location>TableFormer is evaluated on three major publicly available datasets of different nature to prove the generalization and effectiveness of our model. The datasets used for evaluation are the PubTabNet, FinTabNet and TableBank which stem from the scientific, financial and general domains respectively.</text>
-<text><location><page_6><loc_50><loc_10><loc_89><loc_14></location>We also share our baseline results on the challenging SynthTabNet dataset. Throughout our experiments, the same parameters stated in Sec. 5.1 are utilized.</text>
-<section_header_level_1><location><page_7><loc_8><loc_89><loc_27><loc_91></location>5.3. Datasets and Metrics</section_header_level_1>
-<text><location><page_7><loc_8><loc_83><loc_47><loc_88></location>The Tree-Edit-Distance-Based Similarity (TEDS) metric was introduced in [37]. It represents the prediction, and ground-truth as a tree structure of HTML tags. This similarity is calculated as:</text>
-<formula><location><page_7><loc_14><loc_78><loc_47><loc_81></location>TEDS ( T$_{a}$, T$_{b}$ ) = 1 - EditDist ( T$_{a}$, T$_{b}$ ) max ( | T$_{a}$ | , | T$_{b}$ | ) (3)</formula>
-<text><location><page_7><loc_8><loc_73><loc_47><loc_77></location>where T$_{a}$ and T$_{b}$ represent tables in tree structure HTML format. EditDist denotes the tree-edit distance, and | T | represents the number of nodes in T .</text>
-<section_header_level_1><location><page_7><loc_8><loc_70><loc_28><loc_72></location>5.4. Quantitative Analysis</section_header_level_1>
-<text><location><page_7><loc_8><loc_50><loc_47><loc_69></location>Structure. As shown in Tab. 2, TableFormer outperforms all SOTA methods across different datasets by a large margin for predicting the table structure from an image. All the more, our model outperforms pre-trained methods. During the evaluation we do not apply any table filtering. We also provide our baseline results on the SynthTabNet dataset. It has been observed that large tables (e.g. tables that occupy half of the page or more) yield poor predictions. We attribute this issue to the image resizing during the preprocessing step, that produces downsampled images with indistinguishable features. This problem can be addressed by treating such big tables with a separate model which accepts a large input image size.</text>
-<table>
-<location><page_7><loc_9><loc_26><loc_46><loc_48></location>
-<caption>Table 2: Structure results on PubTabNet (PTN), FinTabNet (FTN), TableBank (TB) and SynthTabNet (STN).</caption>
-<row_0><col_0><col_header>Model</col_0><col_1><col_header>Dataset</col_1><col_2><col_header>Simple</col_2><col_3><col_header>TEDS Complex</col_3><col_4><col_header>All</col_4></row_0>
-<row_1><col_0><row_header>EDD</col_0><col_1><body>PTN</col_1><col_2><body>91.1</col_2><col_3><body>88.7</col_3><col_4><body>89.9</col_4></row_1>
-<row_2><col_0><row_header>GTE</col_0><col_1><body>PTN</col_1><col_2><body>-</col_2><col_3><body>-</col_3><col_4><body>93.01</col_4></row_2>
-<row_3><col_0><row_header>TableFormer</col_0><col_1><body>PTN</col_1><col_2><body>98.5</col_2><col_3><body>95.0</col_3><col_4><body>96.75</col_4></row_3>
-<row_4><col_0><row_header>EDD</col_0><col_1><body>FTN</col_1><col_2><body>88.4</col_2><col_3><body>92.08</col_3><col_4><body>90.6</col_4></row_4>
-<row_5><col_0><row_header>GTE</col_0><col_1><body>FTN</col_1><col_2><body>-</col_2><col_3><body>-</col_3><col_4><body>87.14</col_4></row_5>
-<row_6><col_0><row_header>GTE (FT)</col_0><col_1><body>FTN</col_1><col_2><body>-</col_2><col_3><body>-</col_3><col_4><body>91.02</col_4></row_6>
-<row_7><col_0><row_header>TableFormer</col_0><col_1><body>FTN</col_1><col_2><body>97.5</col_2><col_3><body>96.0</col_3><col_4><body>96.8</col_4></row_7>
-<row_8><col_0><row_header>EDD</col_0><col_1><body>TB</col_1><col_2><body>86.0</col_2><col_3><body>-</col_3><col_4><body>86.0</col_4></row_8>
-<row_9><col_0><row_header>TableFormer</col_0><col_1><body>TB</col_1><col_2><body>89.6</col_2><col_3><body>-</col_3><col_4><body>89.6</col_4></row_9>
-<row_10><col_0><row_header>TableFormer</col_0><col_1><body>STN</col_1><col_2><body>96.9</col_2><col_3><body>95.7</col_3><col_4><body>96.7</col_4></row_10>
-</table>
-<text><location><page_7><loc_8><loc_21><loc_43><loc_22></location>FT: Model was trained on PubTabNet then finetuned.</text>
-<text><location><page_7><loc_8><loc_10><loc_47><loc_19></location>Cell Detection. Like any object detector, our Cell BBox Detector provides bounding boxes that can be improved with post-processing during inference. We make use of the grid-like structure of tables to refine the predictions. A detailed explanation on the post-processing is available in the supplementary material. As shown in Tab. 3, we evaluate</text>
-<text><location><page_7><loc_50><loc_71><loc_89><loc_91></location>our Cell BBox Decoder accuracy for cells with a class label of 'content' only using the PASCAL VOC mAP metric for pre-processing and post-processing. Note that we do not have post-processing results for SynthTabNet as images are only provided. To compare the performance of our proposed approach, we've integrated TableFormer's Cell BBox Decoder into EDD architecture. As mentioned previously, the Structure Decoder provides the Cell BBox Decoder with the features needed to predict the bounding box predictions. Therefore, the accuracy of the Structure Decoder directly influences the accuracy of the Cell BBox Decoder . If the Structure Decoder predicts an extra column, this will result in an extra column of predicted bounding boxes.</text>
-<table>
-<location><page_7><loc_50><loc_62><loc_87><loc_69></location>
-<caption>Table 3: Cell Bounding Box detection results on PubTabNet, and FinTabNet. PP: Post-processing.</caption>
-<row_0><col_0><col_header>Model</col_0><col_1><col_header>Dataset</col_1><col_2><col_header>mAP</col_2><col_3><col_header>mAP (PP)</col_3></row_0>
-<row_1><col_0><body>EDD+BBox</col_0><col_1><body>PubTabNet</col_1><col_2><body>79.2</col_2><col_3><body>82.7</col_3></row_1>
-<row_2><col_0><body>TableFormer</col_0><col_1><body>PubTabNet</col_1><col_2><body>82.1</col_2><col_3><body>86.8</col_3></row_2>
-<row_3><col_0><body>TableFormer</col_0><col_1><body>SynthTabNet</col_1><col_2><body>87.7</col_2><col_3><body>-</col_3></row_3>
-</table>
-<text><location><page_7><loc_50><loc_34><loc_89><loc_54></location>Cell Content. In this section, we evaluate the entire pipeline of recovering a table with content. Here we put our approach to test by capitalizing on extracting content from the PDF cells rather than decoding from images. Tab. 4 shows the TEDs score of HTML code representing the structure of the table along with the content inserted in the data cell and compared with the ground-truth. Our method achieved a 5.3% increase over the state-of-the-art, and commercial solutions. We believe our scores would be higher if the HTML ground-truth matched the extracted PDF cell content. Unfortunately, there are small discrepancies such as spacings around words or special characters with various unicode representations.</text>
-<table>
-<location><page_7><loc_54><loc_19><loc_85><loc_32></location>
-<caption>Table 4: Results of structure with content retrieved using cell detection on PubTabNet. In all cases the input is PDF documents with cropped tables.</caption>
-<row_0><col_0><body>Model</col_0><col_1><col_header>Simple</col_1><col_2><col_header>TEDS Complex</col_2><col_3><col_header>All</col_3></row_0>
-<row_1><col_0><row_header>Tabula</col_0><col_1><body>78.0</col_1><col_2><body>57.8</col_2><col_3><body>67.9</col_3></row_1>
-<row_2><col_0><row_header>Traprange</col_0><col_1><body>60.8</col_1><col_2><body>49.9</col_2><col_3><body>55.4</col_3></row_2>
-<row_3><col_0><row_header>Camelot</col_0><col_1><body>80.0</col_1><col_2><body>66.0</col_2><col_3><body>73.0</col_3></row_3>
-<row_4><col_0><row_header>Acrobat Pro</col_0><col_1><body>68.9</col_1><col_2><body>61.8</col_2><col_3><body>65.3</col_3></row_4>
-<row_5><col_0><row_header>EDD</col_0><col_1><body>91.2</col_1><col_2><body>85.4</col_2><col_3><body>88.3</col_3></row_5>
-<row_6><col_0><row_header>TableFormer</col_0><col_1><body>95.4</col_1><col_2><body>90.1</col_2><col_3><body>93.6</col_3></row_6>
-</table>
-<unordered_list>
-<list_item><location><page_8><loc_9><loc_89><loc_10><loc_90></location>a.</list_item>
-<list_item><location><page_8><loc_11><loc_89><loc_82><loc_90></location>Red - PDF cells, Green - predicted bounding boxes, Blue - post-processed predictions matched to PDF cells</list_item>
+<section_header_level_1><loc_44><loc_60><loc_232><loc_64>Japanese language (previously unseen by TableFormer):</section_header_level_1>
+<section_header_level_1><loc_249><loc_60><loc_352><loc_64>Example table from FinTabNet:</section_header_level_1>
+<picture><loc_41><loc_65><loc_246><loc_118></picture>
+<picture><loc_250><loc_62><loc_453><loc_114><caption><loc_44><loc_131><loc_315><loc_136>b. Structure predicted by TableFormer, with superimposed matched PDF cell text:</caption></picture>
+<otsl><loc_44><loc_138><loc_244><loc_185><ecel><ecel><ched>論文ファイル<lcel><ched>参考文献<lcel><nl><ched>出典<ched>ファイル 数<ched>英語<ched>日本語<ched>英語<ched>日本語<nl><rhed>Association for Computational Linguistics(ACL2003)<fcel>65<fcel>65<fcel>0<fcel>150<fcel>0<nl><rhed>Computational Linguistics(COLING2002)<fcel>140<fcel>140<fcel>0<fcel>150<fcel>0<nl><rhed>電気情報通信学会 2003 年総合大会<fcel>150<fcel>8<fcel>142<fcel>223<fcel>147<nl><rhed>情報処理学会第 65 回全国大会 (2003)<fcel>177<fcel>1<fcel>176<fcel>150<fcel>236<nl><rhed>第 17 回人工知能学会全国大会 (2003)<fcel>208<fcel>5<fcel>203<fcel>152<fcel>244<nl><rhed>自然言語処理研究会第 146 〜 155 回<fcel>98<fcel>2<fcel>96<fcel>150<fcel>232<nl><rhed>WWW から収集した論文<fcel>107<fcel>73<fcel>34<fcel>147<fcel>96<nl><ecel><fcel>945<fcel>294<fcel>651<fcel>1122<fcel>955<nl><caption><loc_311><loc_185><loc_449><loc_189>Text is aligned to match original for ease of viewing</caption></otsl>
+<otsl><loc_249><loc_138><loc_450><loc_182><ecel><ched>Shares (in millions)<lcel><ched>Weighted Average Grant Date Fair Value<lcel><nl><ecel><ched>RS U s<ched>PSUs<ched>RSUs<ched>PSUs<nl><rhed>Nonvested on Janua ry 1<fcel>1. 1<fcel>0.3<fcel>90.10 $<fcel>$ 91.19<nl><rhed>Granted<fcel>0. 5<fcel>0.1<fcel>117.44<fcel>122.41<nl><rhed>Vested<fcel>(0. 5 )<fcel>(0.1)<fcel>87.08<fcel>81.14<nl><rhed>Canceled or forfeited<fcel>(0. 1 )<fcel>-<fcel>102.01<fcel>92.18<nl><rhed>Nonvested on December 31<fcel>1.0<fcel>0.3<fcel>104.85 $<fcel>$ 104.51<nl></otsl>
+<picture><loc_42><loc_240><loc_173><loc_280><caption><loc_51><loc_290><loc_435><loc_295>Figure 6: An example of TableFormer predictions (bounding boxes and structure) from generated SynthTabNet table.</caption></picture>
+<picture><loc_177><loc_240><loc_307><loc_280><caption><loc_41><loc_203><loc_445><loc_231>Figure 5: One of the benefits of TableFormer is that it is language agnostic, as an example, the left part of the illustration demonstrates TableFormer predictions on previously unseen language (Japanese). Additionally, we see that TableFormer is robust to variability in style and content, right side of the illustration shows the example of the TableFormer prediction from the FinTabNet dataset.</caption></picture>
+<picture><loc_313><loc_241><loc_443><loc_280></picture>
+<section_header_level_1><loc_41><loc_310><loc_134><loc_316>5.5. Qualitative Analysis</section_header_level_1>
+<section_header_level_1><loc_252><loc_310><loc_377><loc_317>6. Future Work & Conclusion</section_header_level_1>
+<text><loc_41><loc_339><loc_234><loc_450>We showcase several visualizations for the different components of our network on various "complex" tables within datasets presented in this work in Fig. 5 and Fig. 6 As it is shown, our model is able to predict bounding boxes for all table cells, even for the empty ones. Additionally, our post-processing techniques can extract the cell content by matching the predicted bounding boxes to the PDF cells based on their overlap and spatial proximity. The left part of Fig. 5 demonstrates also the adaptability of our method to any language, as it can successfully extract Japanese text, although the training set contains only English content. We provide more visualizations including the intermediate steps in the supplementary material. Overall these illustrations justify the versatility of our method across a diverse range of table appearances and content type.</text>
+<text><loc_252><loc_324><loc_445><loc_412>In this paper, we presented TableFormer an end-to-end transformer based approach to predict table structures and bounding boxes of cells from an image. This approach enables us to recreate the table structure, and extract the cell content from PDF or OCR by using bounding boxes. Additionally, it provides the versatility required in real-world scenarios when dealing with various types of PDF documents, and languages. Furthermore, our method outperforms all state-of-the-arts with a wide margin. Finally, we introduce "SynthTabNet" a challenging synthetically generated dataset that reinforces missing characteristics from other datasets.</text>
+<section_header_level_1><loc_252><loc_424><loc_298><loc_431>References</section_header_level_1>
+<unordered_list><list_item><loc_256><loc_438><loc_445><loc_450>[1] Nicolas Carion, Francisco Massa, Gabriel Synnaeve, Nicolas Usunier, Alexander Kirillov, and Sergey Zagoruyko. End-to-</list_item>
 </unordered_list>
-<section_header_level_1><location><page_8><loc_9><loc_87><loc_46><loc_88></location>Japanese language (previously unseen by TableFormer):</section_header_level_1>
-<section_header_level_1><location><page_8><loc_50><loc_87><loc_70><loc_88></location>Example table from FinTabNet:</section_header_level_1>
-<figure>
-<location><page_8><loc_8><loc_76><loc_49><loc_87></location>
-</figure>
-<figure>
-<location><page_8><loc_50><loc_77><loc_91><loc_88></location>
-<caption>b. Structure predicted by TableFormer, with superimposed matched PDF cell text:</caption>
-</figure>
-<table>
-<location><page_8><loc_9><loc_63><loc_49><loc_72></location>
-<row_0><col_0><body></col_0><col_1><body></col_1><col_2><col_header>論文ファイル</col_2><col_3><col_header>論文ファイル</col_3><col_4><col_header>参考文献</col_4><col_5><col_header>参考文献</col_5></row_0>
-<row_1><col_0><col_header>出典</col_0><col_1><col_header>ファイル 数</col_1><col_2><col_header>英語</col_2><col_3><col_header>日本語</col_3><col_4><col_header>英語</col_4><col_5><col_header>日本語</col_5></row_1>
-<row_2><col_0><row_header>Association for Computational Linguistics(ACL2003)</col_0><col_1><body>65</col_1><col_2><body>65</col_2><col_3><body>0</col_3><col_4><body>150</col_4><col_5><body>0</col_5></row_2>
-<row_3><col_0><row_header>Computational Linguistics(COLING2002)</col_0><col_1><body>140</col_1><col_2><body>140</col_2><col_3><body>0</col_3><col_4><body>150</col_4><col_5><body>0</col_5></row_3>
-<row_4><col_0><row_header>電気情報通信学会 2003 年総合大会</col_0><col_1><body>150</col_1><col_2><body>8</col_2><col_3><body>142</col_3><col_4><body>223</col_4><col_5><body>147</col_5></row_4>
-<row_5><col_0><row_header>情報処理学会第 65 回全国大会 (2003)</col_0><col_1><body>177</col_1><col_2><body>1</col_2><col_3><body>176</col_3><col_4><body>150</col_4><col_5><body>236</col_5></row_5>
-<row_6><col_0><row_header>第 17 回人工知能学会全国大会 (2003)</col_0><col_1><body>208</col_1><col_2><body>5</col_2><col_3><body>203</col_3><col_4><body>152</col_4><col_5><body>244</col_5></row_6>
-<row_7><col_0><row_header>自然言語処理研究会第 146 〜 155 回</col_0><col_1><body>98</col_1><col_2><body>2</col_2><col_3><body>96</col_3><col_4><body>150</col_4><col_5><body>232</col_5></row_7>
-<row_8><col_0><row_header>WWW から収集した論文</col_0><col_1><body>107</col_1><col_2><body>73</col_2><col_3><body>34</col_3><col_4><body>147</col_4><col_5><body>96</col_5></row_8>
-<row_9><col_0><body></col_0><col_1><body>945</col_1><col_2><body>294</col_2><col_3><body>651</col_3><col_4><body>1122</col_4><col_5><body>955</col_5></row_9>
-</table>
-<table>
-<location><page_8><loc_50><loc_64><loc_90><loc_72></location>
-<caption>Text is aligned to match original for ease of viewing</caption>
-<row_0><col_0><body></col_0><col_1><col_header>Shares (in millions)</col_1><col_2><col_header>Shares (in millions)</col_2><col_3><col_header>Weighted Average Grant Date Fair Value</col_3><col_4><col_header>Weighted Average Grant Date Fair Value</col_4></row_0>
-<row_1><col_0><body></col_0><col_1><col_header>RS U s</col_1><col_2><col_header>PSUs</col_2><col_3><col_header>RSUs</col_3><col_4><col_header>PSUs</col_4></row_1>
-<row_2><col_0><row_header>Nonvested on Janua ry 1</col_0><col_1><body>1. 1</col_1><col_2><body>0.3</col_2><col_3><body>90.10 $</col_3><col_4><body>$ 91.19</col_4></row_2>
-<row_3><col_0><row_header>Granted</col_0><col_1><body>0. 5</col_1><col_2><body>0.1</col_2><col_3><body>117.44</col_3><col_4><body>122.41</col_4></row_3>
-<row_4><col_0><row_header>Vested</col_0><col_1><body>(0. 5 )</col_1><col_2><body>(0.1)</col_2><col_3><body>87.08</col_3><col_4><body>81.14</col_4></row_4>
-<row_5><col_0><row_header>Canceled or forfeited</col_0><col_1><body>(0. 1 )</col_1><col_2><body>-</col_2><col_3><body>102.01</col_3><col_4><body>92.18</col_4></row_5>
-<row_6><col_0><row_header>Nonvested on December 31</col_0><col_1><body>1.0</col_1><col_2><body>0.3</col_2><col_3><body>104.85 $</col_3><col_4><body>$ 104.51</col_4></row_6>
-</table>
-<figure>
-<location><page_8><loc_8><loc_44><loc_35><loc_52></location>
-<caption>Figure 5: One of the benefits of TableFormer is that it is language agnostic, as an example, the left part of the illustration demonstrates TableFormer predictions on previously unseen language (Japanese). Additionally, we see that TableFormer is robust to variability in style and content, right side of the illustration shows the example of the TableFormer prediction from the FinTabNet dataset.</caption>
-</figure>
-<figure>
-<location><page_8><loc_63><loc_44><loc_89><loc_52></location>
-</figure>
-<figure>
-<location><page_8><loc_35><loc_44><loc_61><loc_52></location>
-<caption>Figure 6: An example of TableFormer predictions (bounding boxes and structure) from generated SynthTabNet table.</caption>
-</figure>
-<section_header_level_1><location><page_8><loc_8><loc_37><loc_27><loc_38></location>5.5. Qualitative Analysis</section_header_level_1>
-<text><location><page_8><loc_8><loc_10><loc_47><loc_32></location>We showcase several visualizations for the different components of our network on various "complex" tables within datasets presented in this work in Fig. 5 and Fig. 6 As it is shown, our model is able to predict bounding boxes for all table cells, even for the empty ones. Additionally, our post-processing techniques can extract the cell content by matching the predicted bounding boxes to the PDF cells based on their overlap and spatial proximity. The left part of Fig. 5 demonstrates also the adaptability of our method to any language, as it can successfully extract Japanese text, although the training set contains only English content. We provide more visualizations including the intermediate steps in the supplementary material. Overall these illustrations justify the versatility of our method across a diverse range of table appearances and content type.</text>
-<section_header_level_1><location><page_8><loc_50><loc_37><loc_75><loc_38></location>6. Future Work & Conclusion</section_header_level_1>
-<text><location><page_8><loc_50><loc_18><loc_89><loc_35></location>In this paper, we presented TableFormer an end-to-end transformer based approach to predict table structures and bounding boxes of cells from an image. This approach enables us to recreate the table structure, and extract the cell content from PDF or OCR by using bounding boxes. Additionally, it provides the versatility required in real-world scenarios when dealing with various types of PDF documents, and languages. Furthermore, our method outperforms all state-of-the-arts with a wide margin. Finally, we introduce "SynthTabNet" a challenging synthetically generated dataset that reinforces missing characteristics from other datasets.</text>
-<section_header_level_1><location><page_8><loc_50><loc_14><loc_60><loc_15></location>References</section_header_level_1>
-<unordered_list>
-<list_item><location><page_8><loc_51><loc_10><loc_89><loc_12></location>[1] Nicolas Carion, Francisco Massa, Gabriel Synnaeve, Nicolas Usunier, Alexander Kirillov, and Sergey Zagoruyko. End-to-</list_item>
+<page_footer><loc_241><loc_463><loc_245><loc_469>8</page_footer>
+<unordered_list><page_break>
+<list_item><loc_57><loc_48><loc_234><loc_74>end object detection with transformers. In Andrea Vedaldi, Horst Bischof, Thomas Brox, and Jan-Michael Frahm, editors, Computer Vision - ECCV 2020 , pages 213-229, Cham, 2020. Springer International Publishing. 5</list_item>
+<list_item><loc_45><loc_76><loc_234><loc_95>[2] Zewen Chi, Heyan Huang, Heng-Da Xu, Houjin Yu, Wanxuan Yin, and Xian-Ling Mao. Complicated table structure recognition. arXiv preprint arXiv:1908.04729 , 2019. 3</list_item>
+<list_item><loc_45><loc_97><loc_234><loc_116>[3] Bertrand Couasnon and Aurelie Lemaitre. Recognition of Tables and Forms , pages 647-677. Springer London, London, 2014. 2</list_item>
+<list_item><loc_45><loc_118><loc_234><loc_143>[4] Herv´e D´ejean, Jean-Luc Meunier, Liangcai Gao, Yilun Huang, Yu Fang, Florian Kleber, and Eva-Maria Lang. ICDAR 2019 Competition on Table Detection and Recognition (cTDaR), Apr. 2019. http://sac.founderit.com/. 2</list_item>
+<list_item><loc_45><loc_146><loc_234><loc_171>[5] Basilios Gatos, Dimitrios Danatsas, Ioannis Pratikakis, and Stavros J Perantonis. Automatic table detection in document images. In International Conference on Pattern Recognition and Image Analysis , pages 609-618. Springer, 2005. 2</list_item>
+<list_item><loc_45><loc_173><loc_234><loc_199>[6] Max G¨obel, Tamir Hassan, Ermelinda Oro, and Giorgio Orsi. Icdar 2013 table competition. In 2013 12th International Conference on Document Analysis and Recognition , pages 1449-1453, 2013. 2</list_item>
+<list_item><loc_45><loc_201><loc_234><loc_220>[7] EA Green and M Krishnamoorthy. Recognition of tables using table grammars. procs. In Symposium on Document Analysis and Recognition (SDAIR'95) , pages 261-277. 2</list_item>
+<list_item><loc_45><loc_222><loc_234><loc_255>[8] Khurram Azeem Hashmi, Alain Pagani, Marcus Liwicki, Didier Stricker, and Muhammad Zeshan Afzal. Castabdetectors: Cascade network for table detection in document images with recursive feature pyramid and switchable atrous convolution. Journal of Imaging , 7(10), 2021. 1</list_item>
+<list_item><loc_45><loc_257><loc_234><loc_276>[9] Kaiming He, Georgia Gkioxari, Piotr Dollar, and Ross Girshick. Mask r-cnn. In Proceedings of the IEEE International Conference on Computer Vision (ICCV) , Oct 2017. 1</list_item>
+<list_item><loc_41><loc_278><loc_234><loc_304>[10] Yelin He, X. Qi, Jiaquan Ye, Peng Gao, Yihao Chen, Bingcong Li, Xin Tang, and Rong Xiao. Pingan-vcgroup's solution for icdar 2021 competition on scientific table image recognition to latex. ArXiv , abs/2105.01846, 2021. 2</list_item>
+<list_item><loc_41><loc_306><loc_234><loc_339>[11] Jianying Hu, Ramanujan S Kashi, Daniel P Lopresti, and Gordon Wilfong. Medium-independent table detection. In Document Recognition and Retrieval VII , volume 3967, pages 291-302. International Society for Optics and Photonics, 1999. 2</list_item>
+<list_item><loc_41><loc_341><loc_234><loc_373>[12] Matthew Hurst. A constraint-based approach to table structure derivation. In Proceedings of the Seventh International Conference on Document Analysis and Recognition - Volume 2 , ICDAR '03, page 911, USA, 2003. IEEE Computer Society. 2</list_item>
+<list_item><loc_41><loc_375><loc_234><loc_408>[13] Thotreingam Kasar, Philippine Barlas, Sebastien Adam, Cl´ement Chatelain, and Thierry Paquet. Learning to detect tables in scanned document images using line information. In 2013 12th International Conference on Document Analysis and Recognition , pages 1185-1189. IEEE, 2013. 2</list_item>
+<list_item><loc_41><loc_410><loc_234><loc_429>[14] Pratik Kayal, Mrinal Anand, Harsh Desai, and Mayank Singh. Icdar 2021 competition on scientific table image recognition to latex, 2021. 2</list_item>
+<list_item><loc_41><loc_431><loc_234><loc_450>[15] Harold W Kuhn. The hungarian method for the assignment problem. Naval research logistics quarterly , 2(1-2):83-97, 1955. 6</list_item>
+<list_item><loc_252><loc_48><loc_445><loc_88>[16] Girish Kulkarni, Visruth Premraj, Vicente Ordonez, Sagnik Dhar, Siming Li, Yejin Choi, Alexander C. Berg, and Tamara L. Berg. Babytalk: Understanding and generating simple image descriptions. IEEE Transactions on Pattern Analysis and Machine Intelligence , 35(12):2891-2903, 2013. 4</list_item>
+<list_item><loc_252><loc_90><loc_445><loc_109>[17] Minghao Li, Lei Cui, Shaohan Huang, Furu Wei, Ming Zhou, and Zhoujun Li. Tablebank: A benchmark dataset for table detection and recognition, 2019. 2, 3</list_item>
+<list_item><loc_252><loc_111><loc_445><loc_164>[18] Yiren Li, Zheng Huang, Junchi Yan, Yi Zhou, Fan Ye, and Xianhui Liu. Gfte: Graph-based financial table extraction. In Alberto Del Bimbo, Rita Cucchiara, Stan Sclaroff, Giovanni Maria Farinella, Tao Mei, Marco Bertini, Hugo Jair Escalante, and Roberto Vezzani, editors, Pattern Recognition. ICPR International Workshops and Challenges , pages 644-658, Cham, 2021. Springer International Publishing. 2, 3</list_item>
+<list_item><loc_252><loc_166><loc_445><loc_206>[19] Nikolaos Livathinos, Cesar Berrospi, Maksym Lysak, Viktor Kuropiatnyk, Ahmed Nassar, Andre Carvalho, Michele Dolfi, Christoph Auer, Kasper Dinkla, and Peter Staar. Robust pdf document conversion using recurrent neural networks. Proceedings of the AAAI Conference on Artificial Intelligence , 35(17):15137-15145, May 2021. 1</list_item>
+<list_item><loc_252><loc_208><loc_445><loc_234>[20] Rujiao Long, Wen Wang, Nan Xue, Feiyu Gao, Zhibo Yang, Yongpan Wang, and Gui-Song Xia. Parsing table structures in the wild. In Proceedings of the IEEE/CVF International Conference on Computer Vision , pages 944-952, 2021. 2</list_item>
+<list_item><loc_252><loc_236><loc_445><loc_276>[21] Shubham Singh Paliwal, D Vishwanath, Rohit Rahul, Monika Sharma, and Lovekesh Vig. Tablenet: Deep learning model for end-to-end table detection and tabular data extraction from scanned document images. In 2019 International Conference on Document Analysis and Recognition (ICDAR) , pages 128-133. IEEE, 2019. 1</list_item>
+<list_item><loc_252><loc_278><loc_445><loc_352>[22] Adam Paszke, Sam Gross, Francisco Massa, Adam Lerer, James Bradbury, Gregory Chanan, Trevor Killeen, Zeming Lin, Natalia Gimelshein, Luca Antiga, Alban Desmaison, Andreas Kopf, Edward Yang, Zachary DeVito, Martin Raison, Alykhan Tejani, Sasank Chilamkurthy, Benoit Steiner, Lu Fang, Junjie Bai, and Soumith Chintala. Pytorch: An imperative style, high-performance deep learning library. In H. Wallach, H. Larochelle, A. Beygelzimer, F. d'Alch´e-Buc, E. Fox, and R. Garnett, editors, Advances in Neural Information Processing Systems 32 , pages 8024-8035. Curran Associates, Inc., 2019. 6</list_item>
+<list_item><loc_252><loc_354><loc_445><loc_394>[23] Devashish Prasad, Ayan Gadpal, Kshitij Kapadni, Manish Visave, and Kavita Sultanpure. Cascadetabnet: An approach for end to end table detection and structure recognition from image-based documents. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition Workshops , pages 572-573, 2020. 1</list_item>
+<list_item><loc_252><loc_396><loc_445><loc_422>[24] Shah Rukh Qasim, Hassan Mahmood, and Faisal Shafait. Rethinking table recognition using graph neural networks. In 2019 International Conference on Document Analysis and Recognition (ICDAR) , pages 142-147. IEEE, 2019. 3</list_item>
+<list_item><loc_252><loc_424><loc_445><loc_450>[25] Hamid Rezatofighi, Nathan Tsoi, JunYoung Gwak, Amir Sadeghian, Ian Reid, and Silvio Savarese. Generalized intersection over union: A metric and a loss for bounding box regression. In Proceedings of the IEEE/CVF Conference on</list_item>
 </unordered_list>
-<unordered_list>
-<list_item><location><page_9><loc_11><loc_85><loc_47><loc_90></location>end object detection with transformers. In Andrea Vedaldi, Horst Bischof, Thomas Brox, and Jan-Michael Frahm, editors, Computer Vision - ECCV 2020 , pages 213-229, Cham, 2020. Springer International Publishing. 5</list_item>
-<list_item><location><page_9><loc_9><loc_81><loc_47><loc_85></location>[2] Zewen Chi, Heyan Huang, Heng-Da Xu, Houjin Yu, Wanxuan Yin, and Xian-Ling Mao. Complicated table structure recognition. arXiv preprint arXiv:1908.04729 , 2019. 3</list_item>
-<list_item><location><page_9><loc_9><loc_77><loc_47><loc_81></location>[3] Bertrand Couasnon and Aurelie Lemaitre. Recognition of Tables and Forms , pages 647-677. Springer London, London, 2014. 2</list_item>
-<list_item><location><page_9><loc_9><loc_71><loc_47><loc_76></location>[4] Herv'e D'ejean, Jean-Luc Meunier, Liangcai Gao, Yilun Huang, Yu Fang, Florian Kleber, and Eva-Maria Lang. ICDAR 2019 Competition on Table Detection and Recognition (cTDaR), Apr. 2019. http://sac.founderit.com/. 2</list_item>
-<list_item><location><page_9><loc_9><loc_66><loc_47><loc_71></location>[5] Basilios Gatos, Dimitrios Danatsas, Ioannis Pratikakis, and Stavros J Perantonis. Automatic table detection in document images. In International Conference on Pattern Recognition and Image Analysis , pages 609-618. Springer, 2005. 2</list_item>
-<list_item><location><page_9><loc_9><loc_60><loc_47><loc_65></location>[6] Max Gobel, Tamir Hassan, Ermelinda Oro, and Giorgio Orsi. Icdar 2013 table competition. In 2013 12th International Conference on Document Analysis and Recognition , pages 1449-1453, 2013. 2</list_item>
-<list_item><location><page_9><loc_9><loc_56><loc_47><loc_60></location>[7] EA Green and M Krishnamoorthy. Recognition of tables using table grammars. procs. In Symposium on Document Analysis and Recognition (SDAIR'95) , pages 261-277. 2</list_item>
-<list_item><location><page_9><loc_9><loc_49><loc_47><loc_56></location>[8] Khurram Azeem Hashmi, Alain Pagani, Marcus Liwicki, Didier Stricker, and Muhammad Zeshan Afzal. Castabdetectors: Cascade network for table detection in document images with recursive feature pyramid and switchable atrous convolution. Journal of Imaging , 7(10), 2021. 1</list_item>
-<list_item><location><page_9><loc_9><loc_45><loc_47><loc_49></location>[9] Kaiming He, Georgia Gkioxari, Piotr Dollar, and Ross Girshick. Mask r-cnn. In Proceedings of the IEEE International Conference on Computer Vision (ICCV) , Oct 2017. 1</list_item>
-<list_item><location><page_9><loc_8><loc_39><loc_47><loc_44></location>[10] Yelin He, X. Qi, Jiaquan Ye, Peng Gao, Yihao Chen, Bingcong Li, Xin Tang, and Rong Xiao. Pingan-vcgroup's solution for icdar 2021 competition on scientific table image recognition to latex. ArXiv , abs/2105.01846, 2021. 2</list_item>
-<list_item><location><page_9><loc_8><loc_32><loc_47><loc_39></location>[11] Jianying Hu, Ramanujan S Kashi, Daniel P Lopresti, and Gordon Wilfong. Medium-independent table detection. In Document Recognition and Retrieval VII , volume 3967, pages 291-302. International Society for Optics and Photonics, 1999. 2</list_item>
-<list_item><location><page_9><loc_8><loc_25><loc_47><loc_32></location>[12] Matthew Hurst. A constraint-based approach to table structure derivation. In Proceedings of the Seventh International Conference on Document Analysis and Recognition - Volume 2 , ICDAR '03, page 911, USA, 2003. IEEE Computer Society. 2</list_item>
-<list_item><location><page_9><loc_8><loc_18><loc_47><loc_25></location>[13] Thotreingam Kasar, Philippine Barlas, Sebastien Adam, Cl'ement Chatelain, and Thierry Paquet. Learning to detect tables in scanned document images using line information. In 2013 12th International Conference on Document Analysis and Recognition , pages 1185-1189. IEEE, 2013. 2</list_item>
-<list_item><location><page_9><loc_8><loc_14><loc_47><loc_18></location>[14] Pratik Kayal, Mrinal Anand, Harsh Desai, and Mayank Singh. Icdar 2021 competition on scientific table image recognition to latex, 2021. 2</list_item>
-<list_item><location><page_9><loc_8><loc_10><loc_47><loc_14></location>[15] Harold W Kuhn. The hungarian method for the assignment problem. Naval research logistics quarterly , 2(1-2):83-97, 1955. 6</list_item>
+<page_footer><loc_241><loc_463><loc_245><loc_469>9</page_footer>
+<page_break>
+<text><loc_57><loc_48><loc_234><loc_60>Computer Vision and Pattern Recognition , pages 658-666, 2019. 6</text>
+<unordered_list><list_item><loc_41><loc_62><loc_234><loc_102>[26] Sebastian Schreiber, Stefan Agne, Ivo Wolf, Andreas Dengel, and Sheraz Ahmed. Deepdesrt: Deep learning for detection and structure recognition of tables in document images. In 2017 14th IAPR International Conference on Document Analysis and Recognition (ICDAR) , volume 01, pages 11621167, 2017. 1</list_item>
+<list_item><loc_41><loc_104><loc_234><loc_143>[27] Sebastian Schreiber, Stefan Agne, Ivo Wolf, Andreas Dengel, and Sheraz Ahmed. Deepdesrt: Deep learning for detection and structure recognition of tables in document images. In 2017 14th IAPR international conference on document analysis and recognition (ICDAR) , volume 1, pages 1162-1167. IEEE, 2017. 3</list_item>
+<list_item><loc_41><loc_145><loc_234><loc_171>[28] Faisal Shafait and Ray Smith. Table detection in heterogeneous documents. In Proceedings of the 9th IAPR International Workshop on Document Analysis Systems , pages 6572, 2010. 2</list_item>
+<list_item><loc_41><loc_173><loc_234><loc_206>[29] Shoaib Ahmed Siddiqui, Imran Ali Fateh, Syed Tahseen Raza Rizvi, Andreas Dengel, and Sheraz Ahmed. Deeptabstr: Deep learning based table structure recognition. In 2019 International Conference on Document Analysis and Recognition (ICDAR) , pages 1403-1409. IEEE, 2019. 3</list_item>
+<list_item><loc_41><loc_208><loc_234><loc_241>[30] Peter W J Staar, Michele Dolfi, Christoph Auer, and Costas Bekas. Corpus conversion service: A machine learning platform to ingest documents at scale. In Proceedings of the 24th ACM SIGKDD , KDD '18, pages 774-782, New York, NY, USA, 2018. ACM. 1</list_item>
+<list_item><loc_41><loc_243><loc_234><loc_290>[31] Ashish Vaswani, Noam Shazeer, Niki Parmar, Jakob Uszkoreit, Llion Jones, Aidan N Gomez, Ł ukasz Kaiser, and Illia Polosukhin. Attention is all you need. In I. Guyon, U. V. Luxburg, S. Bengio, H. Wallach, R. Fergus, S. Vishwanathan, and R. Garnett, editors, Advances in Neural Information Processing Systems 30 , pages 5998-6008. Curran Associates, Inc., 2017. 5</list_item>
+<list_item><loc_41><loc_292><loc_234><loc_317>[32] Oriol Vinyals, Alexander Toshev, Samy Bengio, and Dumitru Erhan. Show and tell: A neural image caption generator. In Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR) , June 2015. 2</list_item>
+<list_item><loc_41><loc_320><loc_234><loc_345>[33] Wenyuan Xue, Qingyong Li, and Dacheng Tao. Res2tim: reconstruct syntactic structures from table images. In 2019 International Conference on Document Analysis and Recognition (ICDAR) , pages 749-755. IEEE, 2019. 3</list_item>
+<list_item><loc_41><loc_347><loc_234><loc_373>[34] Wenyuan Xue, Baosheng Yu, Wen Wang, Dacheng Tao, and Qingyong Li. Tgrnet: A table graph reconstruction network for table structure recognition. arXiv preprint arXiv:2106.10598 , 2021. 3</list_item>
+<list_item><loc_41><loc_375><loc_234><loc_401>[35] Quanzeng You, Hailin Jin, Zhaowen Wang, Chen Fang, and Jiebo Luo. Image captioning with semantic attention. In Proceedings of the IEEE conference on computer vision and pattern recognition , pages 4651-4659, 2016. 4</list_item>
+<list_item><loc_41><loc_403><loc_234><loc_436>[36] Xinyi Zheng, Doug Burdick, Lucian Popa, Peter Zhong, and Nancy Xin Ru Wang. Global table extractor (gte): A framework for joint table identification and cell structure recognition using visual context. Winter Conference for Applications in Computer Vision (WACV) , 2021. 2, 3</list_item>
+<list_item><loc_41><loc_438><loc_234><loc_450>[37] Xu Zhong, Elaheh ShafieiBavani, and Antonio Jimeno Yepes. Image-based table recognition: Data, model,</list_item>
+<list_item><loc_269><loc_48><loc_445><loc_74>and evaluation. In Andrea Vedaldi, Horst Bischof, Thomas Brox, and Jan-Michael Frahm, editors, Computer Vision ECCV 2020 , pages 564-580, Cham, 2020. Springer International Publishing. 2, 3, 7</list_item>
+<list_item><loc_252><loc_76><loc_445><loc_102>[38] Xu Zhong, Jianbin Tang, and Antonio Jimeno Yepes. Publaynet: Largest dataset ever for document layout analysis. In 2019 International Conference on Document Analysis and Recognition (ICDAR) , pages 1015-1022, 2019. 1</list_item>
 </unordered_list>
-<unordered_list>
-<list_item><location><page_9><loc_50><loc_82><loc_89><loc_90></location>[16] Girish Kulkarni, Visruth Premraj, Vicente Ordonez, Sagnik Dhar, Siming Li, Yejin Choi, Alexander C. Berg, and Tamara L. Berg. Babytalk: Understanding and generating simple image descriptions. IEEE Transactions on Pattern Analysis and Machine Intelligence , 35(12):2891-2903, 2013. 4</list_item>
-<list_item><location><page_9><loc_50><loc_78><loc_89><loc_82></location>[17] Minghao Li, Lei Cui, Shaohan Huang, Furu Wei, Ming Zhou, and Zhoujun Li. Tablebank: A benchmark dataset for table detection and recognition, 2019. 2, 3</list_item>
-<list_item><location><page_9><loc_50><loc_67><loc_89><loc_78></location>[18] Yiren Li, Zheng Huang, Junchi Yan, Yi Zhou, Fan Ye, and Xianhui Liu. Gfte: Graph-based financial table extraction. In Alberto Del Bimbo, Rita Cucchiara, Stan Sclaroff, Giovanni Maria Farinella, Tao Mei, Marco Bertini, Hugo Jair Escalante, and Roberto Vezzani, editors, Pattern Recognition. ICPR International Workshops and Challenges , pages 644-658, Cham, 2021. Springer International Publishing. 2, 3</list_item>
-<list_item><location><page_9><loc_50><loc_59><loc_89><loc_67></location>[19] Nikolaos Livathinos, Cesar Berrospi, Maksym Lysak, Viktor Kuropiatnyk, Ahmed Nassar, Andre Carvalho, Michele Dolfi, Christoph Auer, Kasper Dinkla, and Peter Staar. Robust pdf document conversion using recurrent neural networks. Proceedings of the AAAI Conference on Artificial Intelligence , 35(17):15137-15145, May 2021. 1</list_item>
-<list_item><location><page_9><loc_50><loc_53><loc_89><loc_58></location>[20] Rujiao Long, Wen Wang, Nan Xue, Feiyu Gao, Zhibo Yang, Yongpan Wang, and Gui-Song Xia. Parsing table structures in the wild. In Proceedings of the IEEE/CVF International Conference on Computer Vision , pages 944-952, 2021. 2</list_item>
-<list_item><location><page_9><loc_50><loc_45><loc_89><loc_53></location>[21] Shubham Singh Paliwal, D Vishwanath, Rohit Rahul, Monika Sharma, and Lovekesh Vig. Tablenet: Deep learning model for end-to-end table detection and tabular data extraction from scanned document images. In 2019 International Conference on Document Analysis and Recognition (ICDAR) , pages 128-133. IEEE, 2019. 1</list_item>
-<list_item><location><page_9><loc_50><loc_30><loc_89><loc_44></location>[22] Adam Paszke, Sam Gross, Francisco Massa, Adam Lerer, James Bradbury, Gregory Chanan, Trevor Killeen, Zeming Lin, Natalia Gimelshein, Luca Antiga, Alban Desmaison, Andreas Kopf, Edward Yang, Zachary DeVito, Martin Raison, Alykhan Tejani, Sasank Chilamkurthy, Benoit Steiner, Lu Fang, Junjie Bai, and Soumith Chintala. Pytorch: An imperative style, high-performance deep learning library. In H. Wallach, H. Larochelle, A. Beygelzimer, F. d'Alch'e-Buc, E. Fox, and R. Garnett, editors, Advances in Neural Information Processing Systems 32 , pages 8024-8035. Curran Associates, Inc., 2019. 6</list_item>
-<list_item><location><page_9><loc_50><loc_21><loc_89><loc_29></location>[23] Devashish Prasad, Ayan Gadpal, Kshitij Kapadni, Manish Visave, and Kavita Sultanpure. Cascadetabnet: An approach for end to end table detection and structure recognition from image-based documents. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition Workshops , pages 572-573, 2020. 1</list_item>
-<list_item><location><page_9><loc_50><loc_16><loc_89><loc_21></location>[24] Shah Rukh Qasim, Hassan Mahmood, and Faisal Shafait. Rethinking table recognition using graph neural networks. In 2019 International Conference on Document Analysis and Recognition (ICDAR) , pages 142-147. IEEE, 2019. 3</list_item>
-<list_item><location><page_9><loc_50><loc_10><loc_89><loc_15></location>[25] Hamid Rezatofighi, Nathan Tsoi, JunYoung Gwak, Amir Sadeghian, Ian Reid, and Silvio Savarese. Generalized intersection over union: A metric and a loss for bounding box regression. In Proceedings of the IEEE/CVF Conference on</list_item>
+<page_footer><loc_239><loc_463><loc_247><loc_469>10</page_footer>
+<page_break>
+<section_header_level_1><loc_109><loc_70><loc_380><loc_86>TableFormer: Table Structure Understanding with Transformers Supplementary Material</section_header_level_1>
+<section_header_level_1><loc_41><loc_102><loc_144><loc_109>1. Details on the datasets</section_header_level_1>
+<section_header_level_1><loc_41><loc_114><loc_123><loc_120>1.1. Data preparation</section_header_level_1>
+<text><loc_41><loc_126><loc_234><loc_245>As a first step of our data preparation process, we have calculated statistics over the datasets across the following dimensions: (1) table size measured in the number of rows and columns, (2) complexity of the table, (3) strictness of the provided HTML structure and (4) completeness (i.e. no omitted bounding boxes). A table is considered to be simple if it does not contain row spans or column spans. Additionally, a table has a strict HTML structure if every row has the same number of columns after taking into account any row or column spans. Therefore a strict HTML structure looks always rectangular. However, HTML is a lenient encoding format, i.e. tables with rows of different sizes might still be regarded as correct due to implicit display rules. These implicit rules leave room for ambiguity, which we want to avoid. As such, we prefer to have "strict" tables, i.e. tables where every row has exactly the same length.</text>
+<text><loc_41><loc_247><loc_234><loc_396>We have developed a technique that tries to derive a missing bounding box out of its neighbors. As a first step, we use the annotation data to generate the most fine-grained grid that covers the table structure. In case of strict HTML tables, all grid squares are associated with some table cell and in the presence of table spans a cell extends across multiple grid squares. When enough bounding boxes are known for a rectangular table, it is possible to compute the geometrical border lines between the grid rows and columns. Eventually this information is used to generate the missing bounding boxes. Additionally, the existence of unused grid squares indicates that the table rows have unequal number of columns and the overall structure is non-strict. The generation of missing bounding boxes for non-strict HTML tables is ambiguous and therefore quite challenging. Thus, we have decided to simply discard those tables. In case of PubTabNet we have computed missing bounding boxes for 48% of the simple and 69% of the complex tables. Regarding FinTabNet, 68% of the simple and 98% of the complex tables require the generation of bounding boxes.</text>
+<text><loc_41><loc_398><loc_234><loc_411>Figure 7 illustrates the distribution of the tables across different dimensions per dataset.</text>
+<section_header_level_1><loc_41><loc_418><loc_125><loc_424>1.2. Synthetic datasets</section_header_level_1>
+<text><loc_41><loc_430><loc_234><loc_451><loc_41><loc_430><loc_234><loc_451>Aiming to train and evaluate our models in a broader spectrum of table data we have synthesized four types of datasets. Each one contains tables with different appear- ances in regard to their size, structure, style and content. Every synthetic dataset contains 150k examples, summing up to 600k synthetic examples. All datasets are divided into Train, Test and Val splits (80%, 10%, 10%).</text>
+<text><loc_252><loc_133><loc_445><loc_147>The process of generating a synthetic dataset can be decomposed into the following steps:</text>
+<unordered_list><list_item><loc_252><loc_149><loc_445><loc_200>1. Prepare styling and content templates: The styling templates have been manually designed and organized into groups of scope specific appearances (e.g. financial data, marketing data, etc.) Additionally, we have prepared curated collections of content templates by extracting the most frequently used terms out of non-synthetic datasets (e.g. PubTabNet, FinTabNet, etc.).</list_item>
+<list_item><loc_252><loc_202><loc_445><loc_283>2. Generate table structures: The structure of each synthetic dataset assumes a horizontal table header which potentially spans over multiple rows and a table body that may contain a combination of row spans and column spans. However, spans are not allowed to cross the header - body boundary. The table structure is described by the parameters: Total number of table rows and columns, number of header rows, type of spans (header only spans, row only spans, column only spans, both row and column spans), maximum span size and the ratio of the table area covered by spans.</list_item>
+<list_item><loc_252><loc_286><loc_445><loc_314>3. Generate content: Based on the dataset theme , a set of suitable content templates is chosen first. Then, this content can be combined with purely random text to produce the synthetic content.</list_item>
+<list_item><loc_252><loc_316><loc_445><loc_345>4. Apply styling templates: Depending on the domain of the synthetic dataset, a set of styling templates is first manually selected. Then, a style is randomly selected to format the appearance of the synthesized table.</list_item>
+<list_item><loc_252><loc_347><loc_445><loc_383>5. Render the complete tables: The synthetic table is finally rendered by a web browser engine to generate the bounding boxes for each table cell. A batching technique is utilized to optimize the runtime overhead of the rendering process.</list_item>
 </unordered_list>
-<text><location><page_10><loc_11><loc_88><loc_47><loc_90></location>Computer Vision and Pattern Recognition , pages 658-666, 2019. 6</text>
-<unordered_list>
-<list_item><location><page_10><loc_8><loc_80><loc_47><loc_88></location>[26] Sebastian Schreiber, Stefan Agne, Ivo Wolf, Andreas Dengel, and Sheraz Ahmed. Deepdesrt: Deep learning for detection and structure recognition of tables in document images. In 2017 14th IAPR International Conference on Document Analysis and Recognition (ICDAR) , volume 01, pages 11621167, 2017. 1</list_item>
-<list_item><location><page_10><loc_8><loc_71><loc_47><loc_79></location>[27] Sebastian Schreiber, Stefan Agne, Ivo Wolf, Andreas Dengel, and Sheraz Ahmed. Deepdesrt: Deep learning for detection and structure recognition of tables in document images. In 2017 14th IAPR international conference on document analysis and recognition (ICDAR) , volume 1, pages 1162-1167. IEEE, 2017. 3</list_item>
-<list_item><location><page_10><loc_8><loc_66><loc_47><loc_71></location>[28] Faisal Shafait and Ray Smith. Table detection in heterogeneous documents. In Proceedings of the 9th IAPR International Workshop on Document Analysis Systems , pages 6572, 2010. 2</list_item>
-<list_item><location><page_10><loc_8><loc_59><loc_47><loc_65></location>[29] Shoaib Ahmed Siddiqui, Imran Ali Fateh, Syed Tahseen Raza Rizvi, Andreas Dengel, and Sheraz Ahmed. Deeptabstr: Deep learning based table structure recognition. In 2019 International Conference on Document Analysis and Recognition (ICDAR) , pages 1403-1409. IEEE, 2019. 3</list_item>
-<list_item><location><page_10><loc_8><loc_52><loc_47><loc_58></location>[30] Peter W J Staar, Michele Dolfi, Christoph Auer, and Costas Bekas. Corpus conversion service: A machine learning platform to ingest documents at scale. In Proceedings of the 24th ACM SIGKDD , KDD '18, pages 774-782, New York, NY, USA, 2018. ACM. 1</list_item>
-<list_item><location><page_10><loc_8><loc_42><loc_47><loc_51></location>[31] Ashish Vaswani, Noam Shazeer, Niki Parmar, Jakob Uszkoreit, Llion Jones, Aidan N Gomez, Ł ukasz Kaiser, and Illia Polosukhin. Attention is all you need. In I. Guyon, U. V. Luxburg, S. Bengio, H. Wallach, R. Fergus, S. Vishwanathan, and R. Garnett, editors, Advances in Neural Information Processing Systems 30 , pages 5998-6008. Curran Associates, Inc., 2017. 5</list_item>
-<list_item><location><page_10><loc_8><loc_37><loc_47><loc_42></location>[32] Oriol Vinyals, Alexander Toshev, Samy Bengio, and Dumitru Erhan. Show and tell: A neural image caption generator. In Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR) , June 2015. 2</list_item>
-<list_item><location><page_10><loc_8><loc_31><loc_47><loc_36></location>[33] Wenyuan Xue, Qingyong Li, and Dacheng Tao. Res2tim: reconstruct syntactic structures from table images. In 2019 International Conference on Document Analysis and Recognition (ICDAR) , pages 749-755. IEEE, 2019. 3</list_item>
-<list_item><location><page_10><loc_8><loc_25><loc_47><loc_31></location>[34] Wenyuan Xue, Baosheng Yu, Wen Wang, Dacheng Tao, and Qingyong Li. Tgrnet: A table graph reconstruction network for table structure recognition. arXiv preprint arXiv:2106.10598 , 2021. 3</list_item>
-<list_item><location><page_10><loc_8><loc_20><loc_47><loc_25></location>[35] Quanzeng You, Hailin Jin, Zhaowen Wang, Chen Fang, and Jiebo Luo. Image captioning with semantic attention. In Proceedings of the IEEE conference on computer vision and pattern recognition , pages 4651-4659, 2016. 4</list_item>
-<list_item><location><page_10><loc_8><loc_13><loc_47><loc_19></location>[36] Xinyi Zheng, Doug Burdick, Lucian Popa, Peter Zhong, and Nancy Xin Ru Wang. Global table extractor (gte): A framework for joint table identification and cell structure recognition using visual context. Winter Conference for Applications in Computer Vision (WACV) , 2021. 2, 3</list_item>
-<list_item><location><page_10><loc_8><loc_10><loc_47><loc_12></location>[37] Xu Zhong, Elaheh ShafieiBavani, and Antonio Jimeno Yepes. Image-based table recognition: Data, model,</list_item>
+<section_header_level_1><loc_252><loc_393><loc_445><loc_408>2. Prediction post-processing for PDF documents</section_header_level_1>
+<text><loc_252><loc_415><loc_445><loc_451>Although TableFormer can predict the table structure and the bounding boxes for tables recognized inside PDF documents, this is not enough when a full reconstruction of the original table is required. This happens mainly due the following reasons:</text>
+<page_footer><loc_239><loc_463><loc_247><loc_469>11</page_footer>
+<page_break>
+<picture><loc_44><loc_47><loc_445><loc_93><caption><loc_41><loc_104><loc_445><loc_118>Figure 7: Distribution of the tables across different dimensions per dataset. Simple vs complex tables per dataset and split, strict vs non strict html structures per dataset and table complexity, missing bboxes per dataset and table complexity.</caption></picture>
+<unordered_list><list_item><loc_50><loc_133><loc_234><loc_146>· TableFormer output does not include the table cell content.</list_item>
+<list_item><loc_50><loc_154><loc_234><loc_167>· There are occasional inaccuracies in the predictions of the bounding boxes.</list_item>
 </unordered_list>
-<unordered_list>
-<list_item><location><page_10><loc_54><loc_85><loc_89><loc_90></location>and evaluation. In Andrea Vedaldi, Horst Bischof, Thomas Brox, and Jan-Michael Frahm, editors, Computer Vision ECCV 2020 , pages 564-580, Cham, 2020. Springer International Publishing. 2, 3, 7</list_item>
-<list_item><location><page_10><loc_50><loc_80><loc_89><loc_85></location>[38] Xu Zhong, Jianbin Tang, and Antonio Jimeno Yepes. Publaynet: Largest dataset ever for document layout analysis. In 2019 International Conference on Document Analysis and Recognition (ICDAR) , pages 1015-1022, 2019. 1</list_item>
+<text><loc_252><loc_133><loc_445><loc_161>dian cell size for all table cells. The usage of median during the computations, helps to eliminate outliers caused by occasional column spans which are usually wider than the normal.</text>
+<text><loc_41><loc_176><loc_234><loc_250>However, it is possible to mitigate those limitations by combining the TableFormer predictions with the information already present inside a programmatic PDF document. More specifically, PDF documents can be seen as a sequence of PDF cells where each cell is described by its content and bounding box. If we are able to associate the PDF cells with the predicted table cells, we can directly link the PDF cell content to the table cell structure and use the PDF bounding boxes to correct misalignments in the predicted table cell bounding boxes.</text>
+<text><loc_41><loc_252><loc_234><loc_265>Here is a step-by-step description of the prediction postprocessing:</text>
+<unordered_list><list_item><loc_41><loc_267><loc_234><loc_288>1. Get the minimal grid dimensions - number of rows and columns for the predicted table structure. This represents the most granular grid for the underlying table structure.</list_item>
+<list_item><loc_41><loc_290><loc_234><loc_318>2. Generate pair-wise matches between the bounding boxes of the PDF cells and the predicted cells. The Intersection Over Union (IOU) metric is used to evaluate the quality of the matches.</list_item>
+<list_item><loc_41><loc_320><loc_234><loc_334>3. Use a carefully selected IOU threshold to designate the matches as "good" ones and "bad" ones.</list_item>
+<list_item><loc_41><loc_336><loc_234><loc_356>3.a. If all IOU scores in a column are below the threshold, discard all predictions (structure and bounding boxes) for that column.</list_item>
+<list_item><loc_41><loc_359><loc_234><loc_379>4. Find the best-fitting content alignment for the predicted cells with good IOU per each column. The alignment of the column can be identified by the following formula:</list_item>
 </unordered_list>
-<section_header_level_1><location><page_11><loc_22><loc_83><loc_76><loc_86></location>TableFormer: Table Structure Understanding with Transformers Supplementary Material</section_header_level_1>
-<section_header_level_1><location><page_11><loc_8><loc_78><loc_29><loc_80></location>1. Details on the datasets</section_header_level_1>
-<section_header_level_1><location><page_11><loc_8><loc_76><loc_25><loc_77></location>1.1. Data preparation</section_header_level_1>
-<text><location><page_11><loc_8><loc_51><loc_47><loc_75></location>As a first step of our data preparation process, we have calculated statistics over the datasets across the following dimensions: (1) table size measured in the number of rows and columns, (2) complexity of the table, (3) strictness of the provided HTML structure and (4) completeness (i.e. no omitted bounding boxes). A table is considered to be simple if it does not contain row spans or column spans. Additionally, a table has a strict HTML structure if every row has the same number of columns after taking into account any row or column spans. Therefore a strict HTML structure looks always rectangular. However, HTML is a lenient encoding format, i.e. tables with rows of different sizes might still be regarded as correct due to implicit display rules. These implicit rules leave room for ambiguity, which we want to avoid. As such, we prefer to have "strict" tables, i.e. tables where every row has exactly the same length.</text>
-<text><location><page_11><loc_8><loc_21><loc_47><loc_51></location>We have developed a technique that tries to derive a missing bounding box out of its neighbors. As a first step, we use the annotation data to generate the most fine-grained grid that covers the table structure. In case of strict HTML tables, all grid squares are associated with some table cell and in the presence of table spans a cell extends across multiple grid squares. When enough bounding boxes are known for a rectangular table, it is possible to compute the geometrical border lines between the grid rows and columns. Eventually this information is used to generate the missing bounding boxes. Additionally, the existence of unused grid squares indicates that the table rows have unequal number of columns and the overall structure is non-strict. The generation of missing bounding boxes for non-strict HTML tables is ambiguous and therefore quite challenging. Thus, we have decided to simply discard those tables. In case of PubTabNet we have computed missing bounding boxes for 48% of the simple and 69% of the complex tables. Regarding FinTabNet, 68% of the simple and 98% of the complex tables require the generation of bounding boxes.</text>
-<text><location><page_11><loc_8><loc_18><loc_47><loc_20></location>Figure 7 illustrates the distribution of the tables across different dimensions per dataset.</text>
-<section_header_level_1><location><page_11><loc_8><loc_15><loc_25><loc_16></location>1.2. Synthetic datasets</section_header_level_1>
-<text><location><page_11><loc_8><loc_10><loc_47><loc_14></location>Aiming to train and evaluate our models in a broader spectrum of table data we have synthesized four types of datasets. Each one contains tables with different appear-</text>
-<text><location><page_11><loc_50><loc_74><loc_89><loc_79></location>ances in regard to their size, structure, style and content. Every synthetic dataset contains 150k examples, summing up to 600k synthetic examples. All datasets are divided into Train, Test and Val splits (80%, 10%, 10%).</text>
-<text><location><page_11><loc_50><loc_71><loc_89><loc_73></location>The process of generating a synthetic dataset can be decomposed into the following steps:</text>
-<unordered_list>
-<list_item><location><page_11><loc_50><loc_60><loc_89><loc_70></location>1. Prepare styling and content templates: The styling templates have been manually designed and organized into groups of scope specific appearances (e.g. financial data, marketing data, etc.) Additionally, we have prepared curated collections of content templates by extracting the most frequently used terms out of non-synthetic datasets (e.g. PubTabNet, FinTabNet, etc.).</list_item>
-<list_item><location><page_11><loc_50><loc_43><loc_89><loc_60></location>2. Generate table structures: The structure of each synthetic dataset assumes a horizontal table header which potentially spans over multiple rows and a table body that may contain a combination of row spans and column spans. However, spans are not allowed to cross the header - body boundary. The table structure is described by the parameters: Total number of table rows and columns, number of header rows, type of spans (header only spans, row only spans, column only spans, both row and column spans), maximum span size and the ratio of the table area covered by spans.</list_item>
-<list_item><location><page_11><loc_50><loc_37><loc_89><loc_43></location>3. Generate content: Based on the dataset theme , a set of suitable content templates is chosen first. Then, this content can be combined with purely random text to produce the synthetic content.</list_item>
-<list_item><location><page_11><loc_50><loc_31><loc_89><loc_37></location>4. Apply styling templates: Depending on the domain of the synthetic dataset, a set of styling templates is first manually selected. Then, a style is randomly selected to format the appearance of the synthesized table.</list_item>
-<list_item><location><page_11><loc_50><loc_23><loc_89><loc_31></location>5. Render the complete tables: The synthetic table is finally rendered by a web browser engine to generate the bounding boxes for each table cell. A batching technique is utilized to optimize the runtime overhead of the rendering process.</list_item>
+<formula><loc_90><loc_394><loc_234><loc_413></formula>
+<text><loc_41><loc_421><loc_234><loc_435>where c is one of { left, centroid, right } and x$_{c}$ is the xcoordinate for the corresponding point.</text>
+<unordered_list><list_item><loc_41><loc_437><loc_234><loc_450>5. Use the alignment computed in step 4, to compute the median x -coordinate for all table columns and the me-</list_item>
+<list_item><loc_252><loc_164><loc_445><loc_177>6. Snap all cells with bad IOU to their corresponding median x -coordinates and cell sizes.</list_item>
+<list_item><loc_252><loc_179><loc_445><loc_245>7. Generate a new set of pair-wise matches between the corrected bounding boxes and PDF cells. This time use a modified version of the IOU metric, where the area of the intersection between the predicted and PDF cells is divided by the PDF cell area. In case there are multiple matches for the same PDF cell, the prediction with the higher score is preferred. This covers the cases where the PDF cells are smaller than the area of predicted or corrected prediction cells.</list_item>
+<list_item><loc_252><loc_247><loc_445><loc_290>8. In some rare occasions, we have noticed that TableFormer can confuse a single column as two. When the postprocessing steps are applied, this results with two predicted columns pointing to the same PDF column. In such case we must de-duplicate the columns according to highest total column intersection score.</list_item>
+<list_item><loc_252><loc_293><loc_445><loc_359>9. Pick up the remaining orphan cells. There could be cases, when after applying all the previous post-processing steps, some PDF cells could still remain without any match to predicted cells. However, it is still possible to deduce the correct matching for an orphan PDF cell by mapping its bounding box on the geometry of the grid. This mapping decides if the content of the orphan cell will be appended to an already matched table cell, or a new table cell should be created to match with the orphan.</list_item>
 </unordered_list>
-<section_header_level_1><location><page_11><loc_50><loc_18><loc_89><loc_21></location>2. Prediction post-processing for PDF documents</section_header_level_1>
-<text><location><page_11><loc_50><loc_10><loc_89><loc_17></location>Although TableFormer can predict the table structure and the bounding boxes for tables recognized inside PDF documents, this is not enough when a full reconstruction of the original table is required. This happens mainly due the following reasons:</text>
-<figure>
-<location><page_12><loc_9><loc_81><loc_89><loc_91></location>
-<caption>Figure 7: Distribution of the tables across different dimensions per dataset. Simple vs complex tables per dataset and split, strict vs non strict html structures per dataset and table complexity, missing bboxes per dataset and table complexity.</caption>
-</figure>
-<unordered_list>
-<list_item><location><page_12><loc_10><loc_71><loc_47><loc_73></location>· TableFormer output does not include the table cell content.</list_item>
-<list_item><location><page_12><loc_10><loc_67><loc_47><loc_69></location>· There are occasional inaccuracies in the predictions of the bounding boxes.</list_item>
+<text><loc_252><loc_361><loc_445><loc_381>9a. Compute the top and bottom boundary of the horizontal band for each grid row (min/max y coordinates per row).</text>
+<unordered_list><list_item><loc_252><loc_384><loc_445><loc_397>9b. Intersect the orphan's bounding box with the row bands, and map the cell to the closest grid row.</list_item>
+<list_item><loc_252><loc_399><loc_445><loc_420>9c. Compute the left and right boundary of the vertical band for each grid column (min/max x coordinates per column).</list_item>
+<list_item><loc_252><loc_422><loc_445><loc_435>9d. Intersect the orphan's bounding box with the column bands, and map the cell to the closest grid column.</list_item>
+<list_item><loc_252><loc_437><loc_445><loc_450>9e. If the table cell under the identified row and column is not empty, extend its content with the content of the or-</list_item>
 </unordered_list>
-<text><location><page_12><loc_8><loc_50><loc_47><loc_65></location>However, it is possible to mitigate those limitations by combining the TableFormer predictions with the information already present inside a programmatic PDF document. More specifically, PDF documents can be seen as a sequence of PDF cells where each cell is described by its content and bounding box. If we are able to associate the PDF cells with the predicted table cells, we can directly link the PDF cell content to the table cell structure and use the PDF bounding boxes to correct misalignments in the predicted table cell bounding boxes.</text>
-<text><location><page_12><loc_8><loc_47><loc_47><loc_50></location>Here is a step-by-step description of the prediction postprocessing:</text>
-<unordered_list>
-<list_item><location><page_12><loc_8><loc_42><loc_47><loc_47></location>1. Get the minimal grid dimensions - number of rows and columns for the predicted table structure. This represents the most granular grid for the underlying table structure.</list_item>
-<list_item><location><page_12><loc_8><loc_36><loc_47><loc_42></location>2. Generate pair-wise matches between the bounding boxes of the PDF cells and the predicted cells. The Intersection Over Union (IOU) metric is used to evaluate the quality of the matches.</list_item>
-<list_item><location><page_12><loc_8><loc_33><loc_47><loc_36></location>3. Use a carefully selected IOU threshold to designate the matches as "good" ones and "bad" ones.</list_item>
-<list_item><location><page_12><loc_8><loc_29><loc_47><loc_33></location>3.a. If all IOU scores in a column are below the threshold, discard all predictions (structure and bounding boxes) for that column.</list_item>
-<list_item><location><page_12><loc_8><loc_24><loc_47><loc_28></location>4. Find the best-fitting content alignment for the predicted cells with good IOU per each column. The alignment of the column can be identified by the following formula:</list_item>
-</unordered_list>
-<formula><location><page_12><loc_18><loc_17><loc_47><loc_21></location>alignment = arg min c { D$_{c}$ } D$_{c}$ = max { x$_{c}$ } - min { x$_{c}$ } (4)</formula>
-<text><location><page_12><loc_8><loc_13><loc_47><loc_16></location>where c is one of { left, centroid, right } and x$_{c}$ is the xcoordinate for the corresponding point.</text>
-<unordered_list>
-<list_item><location><page_12><loc_8><loc_10><loc_47><loc_13></location>5. Use the alignment computed in step 4, to compute the median x -coordinate for all table columns and the me-</list_item>
-</unordered_list>
-<text><location><page_12><loc_50><loc_68><loc_89><loc_73></location>dian cell size for all table cells. The usage of median during the computations, helps to eliminate outliers caused by occasional column spans which are usually wider than the normal.</text>
-<unordered_list>
-<list_item><location><page_12><loc_50><loc_65><loc_89><loc_67></location>6. Snap all cells with bad IOU to their corresponding median x -coordinates and cell sizes.</list_item>
-<list_item><location><page_12><loc_50><loc_51><loc_89><loc_64></location>7. Generate a new set of pair-wise matches between the corrected bounding boxes and PDF cells. This time use a modified version of the IOU metric, where the area of the intersection between the predicted and PDF cells is divided by the PDF cell area. In case there are multiple matches for the same PDF cell, the prediction with the higher score is preferred. This covers the cases where the PDF cells are smaller than the area of predicted or corrected prediction cells.</list_item>
-<list_item><location><page_12><loc_50><loc_42><loc_89><loc_51></location>8. In some rare occasions, we have noticed that TableFormer can confuse a single column as two. When the postprocessing steps are applied, this results with two predicted columns pointing to the same PDF column. In such case we must de-duplicate the columns according to highest total column intersection score.</list_item>
-<list_item><location><page_12><loc_50><loc_28><loc_89><loc_41></location>9. Pick up the remaining orphan cells. There could be cases, when after applying all the previous post-processing steps, some PDF cells could still remain without any match to predicted cells. However, it is still possible to deduce the correct matching for an orphan PDF cell by mapping its bounding box on the geometry of the grid. This mapping decides if the content of the orphan cell will be appended to an already matched table cell, or a new table cell should be created to match with the orphan.</list_item>
-</unordered_list>
-<text><location><page_12><loc_50><loc_24><loc_89><loc_28></location>9a. Compute the top and bottom boundary of the horizontal band for each grid row (min/max y coordinates per row).</text>
-<unordered_list>
-<list_item><location><page_12><loc_50><loc_21><loc_89><loc_23></location>9b. Intersect the orphan's bounding box with the row bands, and map the cell to the closest grid row.</list_item>
-<list_item><location><page_12><loc_50><loc_16><loc_89><loc_20></location>9c. Compute the left and right boundary of the vertical band for each grid column (min/max x coordinates per column).</list_item>
-<list_item><location><page_12><loc_50><loc_13><loc_89><loc_16></location>9d. Intersect the orphan's bounding box with the column bands, and map the cell to the closest grid column.</list_item>
-<list_item><location><page_12><loc_50><loc_10><loc_89><loc_13></location>9e. If the table cell under the identified row and column is not empty, extend its content with the content of the or-</list_item>
-</unordered_list>
-<text><location><page_13><loc_8><loc_89><loc_15><loc_91></location>phan cell.</text>
-<text><location><page_13><loc_8><loc_86><loc_47><loc_89></location>9f. Otherwise create a new structural cell and match it wit the orphan cell.</text>
-<text><location><page_13><loc_8><loc_83><loc_47><loc_86></location>Aditional images with examples of TableFormer predictions and post-processing can be found below.</text>
-<table>
-<location><page_13><loc_14><loc_73><loc_39><loc_80></location>
-</table>
-<table>
-<location><page_13><loc_14><loc_63><loc_39><loc_70></location>
-</table>
-<table>
-<location><page_13><loc_14><loc_54><loc_39><loc_61></location>
-</table>
-<table>
-<location><page_13><loc_14><loc_38><loc_41><loc_50></location>
-<caption>Figure 8: Example of a table with multi-line header.</caption>
-</table>
-<table>
-<location><page_13><loc_51><loc_83><loc_91><loc_87></location>
-</table>
-<table>
-<location><page_13><loc_51><loc_77><loc_91><loc_80></location>
-</table>
-<table>
-<location><page_13><loc_51><loc_71><loc_91><loc_75></location>
-</table>
-<figure>
-<location><page_13><loc_51><loc_63><loc_70><loc_68></location>
-</figure>
-<table>
-<location><page_13><loc_51><loc_63><loc_70><loc_68></location>
-<caption>Figure 9: Example of a table with big empty distance between cells.</caption>
-</table>
-<table>
-<location><page_13><loc_55><loc_45><loc_80><loc_51></location>
-</table>
-<table>
-<location><page_13><loc_55><loc_37><loc_80><loc_43></location>
-</table>
-<table>
-<location><page_13><loc_55><loc_28><loc_80><loc_34></location>
-</table>
-<figure>
-<location><page_13><loc_55><loc_16><loc_85><loc_25></location>
-</figure>
-<table>
-<location><page_13><loc_55><loc_16><loc_85><loc_25></location>
-<caption>Figure 10: Example of a complex table with empty cells.</caption>
-</table>
-<table>
-<location><page_14><loc_8><loc_57><loc_46><loc_65></location>
-</table>
-<figure>
-<location><page_14><loc_8><loc_56><loc_46><loc_87></location>
-<caption>Figure 11: Simple table with different style and empty cells.</caption>
-</figure>
-<table>
-<location><page_14><loc_8><loc_38><loc_51><loc_43></location>
-</table>
-<table>
-<location><page_14><loc_8><loc_32><loc_51><loc_36></location>
-</table>
-<table>
-<location><page_14><loc_8><loc_25><loc_51><loc_30></location>
-</table>
-<figure>
-<location><page_14><loc_8><loc_17><loc_29><loc_23></location>
-<caption>Figure 12: Simple table predictions and post processing.</caption>
-</figure>
-<table>
-<location><page_14><loc_52><loc_73><loc_87><loc_80></location>
-</table>
-<table>
-<location><page_14><loc_52><loc_65><loc_87><loc_71></location>
-</table>
-<table>
-<location><page_14><loc_54><loc_55><loc_86><loc_64></location>
-</table>
-<figure>
-<location><page_14><loc_52><loc_55><loc_87><loc_89></location>
-<caption>Figure 13: Table predictions example on colorful table.</caption>
-</figure>
-<table>
-<location><page_14><loc_52><loc_40><loc_85><loc_46></location>
-</table>
-<table>
-<location><page_14><loc_52><loc_32><loc_85><loc_38></location>
-</table>
-<table>
-<location><page_14><loc_52><loc_25><loc_85><loc_31></location>
-</table>
-<table>
-<location><page_14><loc_52><loc_16><loc_87><loc_23></location>
-<caption>Figure 14: Example with multi-line text.</caption>
-</table>
-<figure>
-<location><page_15><loc_9><loc_69><loc_46><loc_83></location>
-</figure>
-<table>
-<location><page_15><loc_9><loc_69><loc_46><loc_83></location>
-</table>
-<figure>
-<location><page_15><loc_9><loc_53><loc_46><loc_67></location>
-</figure>
-<table>
-<location><page_15><loc_9><loc_53><loc_46><loc_67></location>
-</table>
-<figure>
-<location><page_15><loc_9><loc_37><loc_46><loc_51></location>
-</figure>
-<figure>
-<location><page_15><loc_8><loc_20><loc_52><loc_36></location>
-</figure>
-<table>
-<location><page_15><loc_8><loc_20><loc_52><loc_36></location>
-<caption>Figure 15: Example with triangular table.</caption>
-</table>
-<table>
-<location><page_15><loc_53><loc_72><loc_86><loc_85></location>
-</table>
-<table>
-<location><page_15><loc_53><loc_57><loc_86><loc_69></location>
-</table>
-<figure>
-<location><page_15><loc_53><loc_41><loc_86><loc_54></location>
-</figure>
-<table>
-<location><page_15><loc_53><loc_41><loc_86><loc_54></location>
-</table>
-<figure>
-<location><page_15><loc_58><loc_20><loc_81><loc_38></location>
-</figure>
-<table>
-<location><page_15><loc_58><loc_20><loc_81><loc_38></location>
-<caption>Figure 16: Example of how post-processing helps to restore mis-aligned bounding boxes prediction artifact.</caption>
-</table>
-<figure>
-<location><page_16><loc_11><loc_37><loc_86><loc_68></location>
-<caption>Figure 17: Example of long table. End-to-end example from initial PDF cells to prediction of bounding boxes, post processing and prediction of structure.</caption>
-</figure>
-</document>
\ No newline at end of file
+<page_footer><loc_239><loc_463><loc_247><loc_469>12</page_footer>
+<page_break>
+<text><loc_41><loc_47><loc_73><loc_53>phan cell.</text>
+<text><loc_41><loc_55><loc_234><loc_68>9f. Otherwise create a new structural cell and match it wit the orphan cell.</text>
+<text><loc_41><loc_70><loc_234><loc_83>Aditional images with examples of TableFormer predictions and post-processing can be found below.</text>
+<otsl><loc_69><loc_99><loc_195><loc_135></otsl>
+<otsl><loc_68><loc_148><loc_195><loc_184></otsl>
+<otsl><loc_69><loc_195><loc_195><loc_232></otsl>
+<otsl><loc_68><loc_250><loc_203><loc_308></otsl>
+<caption><loc_52><loc_317><loc_223><loc_323>Figure 8: Example of a table with multi-line header.</caption>
+<otsl><loc_254><loc_64><loc_454><loc_86><caption><loc_252><loc_194><loc_445><loc_207>Figure 9: Example of a table with big empty distance between cells.</caption></otsl>
+<otsl><loc_253><loc_98><loc_454><loc_117></otsl>
+<otsl><loc_253><loc_124><loc_454><loc_147></otsl>
+<picture><loc_253><loc_160><loc_348><loc_185></picture>
+<otsl><loc_253><loc_160><loc_348><loc_185></otsl>
+<otsl><loc_274><loc_245><loc_400><loc_276><caption><loc_255><loc_430><loc_443><loc_435>Figure 10: Example of a complex table with empty cells.</caption></otsl>
+<otsl><loc_274><loc_287><loc_400><loc_317></otsl>
+<otsl><loc_274><loc_328><loc_401><loc_358></otsl>
+<picture><loc_273><loc_374><loc_424><loc_420></picture>
+<otsl><loc_273><loc_374><loc_424><loc_420></otsl>
+<page_footer><loc_239><loc_463><loc_247><loc_469>13</page_footer>
+<page_break>
+<otsl><loc_42><loc_173><loc_231><loc_217></otsl>
+<picture><loc_42><loc_66><loc_231><loc_218></picture>
+<caption><loc_41><loc_225><loc_234><loc_238>Figure 11: Simple table with different style and empty cells.</caption>
+<otsl><loc_42><loc_286><loc_254><loc_310></otsl>
+<otsl><loc_42><loc_318><loc_254><loc_342></otsl>
+<otsl><loc_42><loc_350><loc_254><loc_374></otsl>
+<picture><loc_41><loc_386><loc_145><loc_414></picture>
+<caption><loc_45><loc_424><loc_230><loc_430>Figure 12: Simple table predictions and post processing.</caption>
+<otsl><loc_261><loc_102><loc_437><loc_135></otsl>
+<otsl><loc_261><loc_143><loc_437><loc_177></otsl>
+<otsl><loc_268><loc_182><loc_428><loc_226></otsl>
+<picture><loc_260><loc_57><loc_437><loc_227><caption><loc_258><loc_235><loc_440><loc_240>Figure 13: Table predictions example on colorful table.</caption></picture>
+<otsl><loc_261><loc_272><loc_424><loc_302><caption><loc_282><loc_432><loc_416><loc_437>Figure 14: Example with multi-line text.</caption></otsl>
+<otsl><loc_261><loc_309><loc_424><loc_338></otsl>
+<otsl><loc_261><loc_345><loc_425><loc_374></otsl>
+<otsl><loc_261><loc_385><loc_436><loc_422></otsl>
+<page_footer><loc_239><loc_463><loc_247><loc_469>14</page_footer>
+<page_break>
+<picture><loc_45><loc_86><loc_228><loc_157></picture>
+<otsl><loc_45><loc_86><loc_228><loc_157></otsl>
+<picture><loc_44><loc_164><loc_228><loc_236></picture>
+<otsl><loc_44><loc_164><loc_228><loc_236></otsl>
+<picture><loc_45><loc_243><loc_229><loc_314></picture>
+<picture><loc_41><loc_319><loc_261><loc_399></picture>
+<otsl><loc_264><loc_77><loc_430><loc_141><caption><loc_69><loc_407><loc_206><loc_412>Figure 15: Example with triangular table.</caption></otsl>
+<otsl><loc_264><loc_153><loc_430><loc_217></otsl>
+<picture><loc_264><loc_229><loc_430><loc_293></picture>
+<otsl><loc_264><loc_229><loc_430><loc_293></otsl>
+<picture><loc_289><loc_308><loc_405><loc_401></picture>
+<otsl><loc_289><loc_308><loc_405><loc_401></otsl>
+<otsl><loc_41><loc_319><loc_261><loc_399></otsl>
+<caption><loc_252><loc_412><loc_445><loc_425>Figure 16: Example of how post-processing helps to restore mis-aligned bounding boxes prediction artifact.</caption>
+<page_footer><loc_239><loc_463><loc_247><loc_469>15</page_footer>
+<page_break>
+<picture><loc_55><loc_160><loc_432><loc_314><caption><loc_41><loc_321><loc_445><loc_334>Figure 17: Example of long table. End-to-end example from initial PDF cells to prediction of bounding boxes, post processing and prediction of structure.</caption></picture>
+<page_footer><loc_239><loc_463><loc_247><loc_469>16</page_footer>
+</doctag>
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v2/2203.01017v2.json b/tests/data/groundtruth/docling_v2/2203.01017v2.json
index 5e4cac03..ddeff11c 100644
--- a/tests/data/groundtruth/docling_v2/2203.01017v2.json
+++ b/tests/data/groundtruth/docling_v2/2203.01017v2.json
@@ -1 +1 @@
-{"schema_name": "DoclingDocument", "version": "1.0.0", "name": "2203.01017v2", "origin": {"mimetype": "application/pdf", "binary_hash": 10763566541725197878, "filename": "2203.01017v2.pdf", "uri": null}, "furniture": {"self_ref": "#/furniture", "parent": null, "children": [], "name": "_root_", "label": "unspecified"}, "body": {"self_ref": "#/body", "parent": null, "children": [{"cref": "#/texts/0"}, {"cref": "#/texts/1"}, {"cref": "#/texts/2"}, {"cref": "#/groups/0"}, {"cref": "#/texts/4"}, {"cref": "#/texts/5"}, {"cref": "#/texts/6"}, {"cref": "#/texts/7"}, {"cref": "#/pictures/0"}, {"cref": "#/texts/11"}, {"cref": "#/tables/0"}, {"cref": "#/groups/1"}, {"cref": "#/pictures/1"}, {"cref": "#/groups/2"}, {"cref": "#/pictures/2"}, {"cref": "#/texts/63"}, {"cref": "#/tables/1"}, {"cref": "#/texts/64"}, {"cref": "#/texts/65"}, {"cref": "#/texts/66"}, {"cref": "#/texts/67"}, {"cref": "#/texts/68"}, {"cref": "#/texts/69"}, {"cref": "#/texts/70"}, {"cref": "#/groups/3"}, {"cref": "#/texts/75"}, {"cref": "#/texts/76"}, {"cref": "#/texts/77"}, {"cref": "#/texts/78"}, {"cref": "#/texts/79"}, {"cref": "#/texts/80"}, {"cref": "#/texts/81"}, {"cref": "#/texts/82"}, {"cref": "#/texts/83"}, {"cref": "#/texts/84"}, {"cref": "#/texts/85"}, {"cref": "#/texts/86"}, {"cref": "#/texts/87"}, {"cref": "#/texts/88"}, {"cref": "#/texts/89"}, {"cref": "#/texts/90"}, {"cref": "#/pictures/3"}, {"cref": "#/texts/124"}, {"cref": "#/texts/125"}, {"cref": "#/texts/126"}, {"cref": "#/texts/127"}, {"cref": "#/texts/128"}, {"cref": "#/texts/129"}, {"cref": "#/texts/130"}, {"cref": "#/texts/131"}, {"cref": "#/texts/132"}, {"cref": "#/texts/133"}, {"cref": "#/tables/2"}, {"cref": "#/texts/134"}, {"cref": "#/texts/135"}, {"cref": "#/texts/136"}, {"cref": "#/texts/137"}, {"cref": "#/texts/138"}, {"cref": "#/texts/139"}, {"cref": "#/texts/140"}, {"cref": "#/texts/141"}, {"cref": "#/pictures/4"}, {"cref": "#/texts/201"}, {"cref": "#/pictures/5"}, {"cref": "#/texts/246"}, {"cref": "#/texts/247"}, {"cref": "#/texts/248"}, {"cref": "#/texts/249"}, {"cref": "#/texts/250"}, {"cref": "#/texts/251"}, {"cref": "#/texts/252"}, {"cref": "#/texts/253"}, {"cref": "#/texts/254"}, {"cref": "#/texts/255"}, {"cref": "#/texts/256"}, {"cref": "#/texts/257"}, {"cref": "#/texts/258"}, {"cref": "#/texts/259"}, {"cref": "#/texts/260"}, {"cref": "#/texts/261"}, {"cref": "#/texts/262"}, {"cref": "#/texts/263"}, {"cref": "#/texts/264"}, {"cref": "#/texts/265"}, {"cref": "#/texts/266"}, {"cref": "#/texts/267"}, {"cref": "#/texts/268"}, {"cref": "#/texts/269"}, {"cref": "#/texts/270"}, {"cref": "#/texts/271"}, {"cref": "#/texts/272"}, {"cref": "#/texts/273"}, {"cref": "#/texts/274"}, {"cref": "#/texts/275"}, {"cref": "#/texts/276"}, {"cref": "#/texts/277"}, {"cref": "#/tables/3"}, {"cref": "#/texts/278"}, {"cref": "#/texts/279"}, {"cref": "#/texts/280"}, {"cref": "#/texts/281"}, {"cref": "#/texts/282"}, {"cref": "#/tables/4"}, {"cref": "#/texts/283"}, {"cref": "#/texts/284"}, {"cref": "#/tables/5"}, {"cref": "#/groups/4"}, {"cref": "#/texts/287"}, {"cref": "#/texts/288"}, {"cref": "#/pictures/6"}, {"cref": "#/texts/289"}, {"cref": "#/pictures/7"}, {"cref": "#/tables/6"}, {"cref": "#/texts/290"}, {"cref": "#/tables/7"}, {"cref": "#/texts/291"}, {"cref": "#/pictures/8"}, {"cref": "#/pictures/9"}, {"cref": "#/texts/348"}, {"cref": "#/pictures/10"}, {"cref": "#/texts/350"}, {"cref": "#/texts/351"}, {"cref": "#/texts/352"}, {"cref": "#/texts/353"}, {"cref": "#/texts/354"}, {"cref": "#/groups/5"}, {"cref": "#/texts/356"}, {"cref": "#/groups/6"}, {"cref": "#/texts/372"}, {"cref": "#/groups/7"}, {"cref": "#/texts/383"}, {"cref": "#/groups/8"}, {"cref": "#/texts/396"}, {"cref": "#/groups/9"}, {"cref": "#/texts/399"}, {"cref": "#/texts/400"}, {"cref": "#/texts/401"}, {"cref": "#/texts/402"}, {"cref": "#/texts/403"}, {"cref": "#/texts/404"}, {"cref": "#/texts/405"}, {"cref": "#/texts/406"}, {"cref": "#/texts/407"}, {"cref": "#/texts/408"}, {"cref": "#/groups/10"}, {"cref": "#/texts/414"}, {"cref": "#/texts/415"}, {"cref": "#/texts/416"}, {"cref": "#/texts/417"}, {"cref": "#/pictures/11"}, {"cref": "#/groups/11"}, {"cref": "#/texts/479"}, {"cref": "#/texts/480"}, {"cref": "#/groups/12"}, {"cref": "#/texts/486"}, {"cref": "#/texts/487"}, {"cref": "#/groups/13"}, {"cref": "#/texts/489"}, {"cref": "#/groups/14"}, {"cref": "#/texts/494"}, {"cref": "#/groups/15"}, {"cref": "#/texts/499"}, {"cref": "#/texts/500"}, {"cref": "#/texts/501"}, {"cref": "#/texts/502"}, {"cref": "#/tables/8"}, {"cref": "#/tables/9"}, {"cref": "#/tables/10"}, {"cref": "#/texts/503"}, {"cref": "#/tables/11"}, {"cref": "#/texts/504"}, {"cref": "#/tables/12"}, {"cref": "#/tables/13"}, {"cref": "#/tables/14"}, {"cref": "#/pictures/12"}, {"cref": "#/texts/505"}, {"cref": "#/tables/15"}, {"cref": "#/tables/16"}, {"cref": "#/tables/17"}, {"cref": "#/tables/18"}, {"cref": "#/pictures/13"}, {"cref": "#/texts/506"}, {"cref": "#/tables/19"}, {"cref": "#/tables/20"}, {"cref": "#/texts/507"}, {"cref": "#/pictures/14"}, {"cref": "#/tables/21"}, {"cref": "#/tables/22"}, {"cref": "#/tables/23"}, {"cref": "#/texts/508"}, {"cref": "#/pictures/15"}, {"cref": "#/texts/509"}, {"cref": "#/tables/24"}, {"cref": "#/tables/25"}, {"cref": "#/tables/26"}, {"cref": "#/texts/510"}, {"cref": "#/pictures/16"}, {"cref": "#/tables/27"}, {"cref": "#/tables/28"}, {"cref": "#/tables/29"}, {"cref": "#/texts/511"}, {"cref": "#/tables/30"}, {"cref": "#/pictures/17"}, {"cref": "#/tables/31"}, {"cref": "#/pictures/18"}, {"cref": "#/tables/32"}, {"cref": "#/pictures/19"}, {"cref": "#/pictures/20"}, {"cref": "#/texts/512"}, {"cref": "#/tables/33"}, {"cref": "#/texts/513"}, {"cref": "#/tables/34"}, {"cref": "#/tables/35"}, {"cref": "#/pictures/21"}, {"cref": "#/tables/36"}, {"cref": "#/pictures/22"}, {"cref": "#/texts/514"}, {"cref": "#/tables/37"}, {"cref": "#/texts/515"}, {"cref": "#/pictures/23"}, {"cref": "#/texts/516"}], "name": "_root_", "label": "unspecified"}, "groups": [{"self_ref": "#/groups/0", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/3"}], "name": "group", "label": "key_value_area"}, {"self_ref": "#/groups/1", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/12"}], "name": "list", "label": "list"}, {"self_ref": "#/groups/2", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/38"}], "name": "list", "label": "list"}, {"self_ref": "#/groups/3", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/71"}, {"cref": "#/texts/72"}, {"cref": "#/texts/73"}, {"cref": "#/texts/74"}], "name": "list", "label": "list"}, {"self_ref": "#/groups/4", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/285"}, {"cref": "#/texts/286"}], "name": "list", "label": "list"}, {"self_ref": "#/groups/5", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/355"}], "name": "list", "label": "list"}, {"self_ref": "#/groups/6", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/357"}, {"cref": "#/texts/358"}, {"cref": "#/texts/359"}, {"cref": "#/texts/360"}, {"cref": "#/texts/361"}, {"cref": "#/texts/362"}, {"cref": "#/texts/363"}, {"cref": "#/texts/364"}, {"cref": "#/texts/365"}, {"cref": "#/texts/366"}, {"cref": "#/texts/367"}, {"cref": "#/texts/368"}, {"cref": "#/texts/369"}, {"cref": "#/texts/370"}, {"cref": "#/texts/371"}], "name": "list", "label": "list"}, {"self_ref": "#/groups/7", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/373"}, {"cref": "#/texts/374"}, {"cref": "#/texts/375"}, {"cref": "#/texts/376"}, {"cref": "#/texts/377"}, {"cref": "#/texts/378"}, {"cref": "#/texts/379"}, {"cref": "#/texts/380"}, {"cref": "#/texts/381"}, {"cref": "#/texts/382"}], "name": "list", "label": "list"}, {"self_ref": "#/groups/8", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/384"}, {"cref": "#/texts/385"}, {"cref": "#/texts/386"}, {"cref": "#/texts/387"}, {"cref": "#/texts/388"}, {"cref": "#/texts/389"}, {"cref": "#/texts/390"}, {"cref": "#/texts/391"}, {"cref": "#/texts/392"}, {"cref": "#/texts/393"}, {"cref": "#/texts/394"}, {"cref": "#/texts/395"}], "name": "list", "label": "list"}, {"self_ref": "#/groups/9", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/397"}, {"cref": "#/texts/398"}], "name": "list", "label": "list"}, {"self_ref": "#/groups/10", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/409"}, {"cref": "#/texts/410"}, {"cref": "#/texts/411"}, {"cref": "#/texts/412"}, {"cref": "#/texts/413"}], "name": "list", "label": "list"}, {"self_ref": "#/groups/11", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/477"}, {"cref": "#/texts/478"}], "name": "list", "label": "list"}, {"self_ref": "#/groups/12", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/481"}, {"cref": "#/texts/482"}, {"cref": "#/texts/483"}, {"cref": "#/texts/484"}, {"cref": "#/texts/485"}], "name": "list", "label": "list"}, {"self_ref": "#/groups/13", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/488"}], "name": "list", "label": "list"}, {"self_ref": "#/groups/14", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/490"}, {"cref": "#/texts/491"}, {"cref": "#/texts/492"}, {"cref": "#/texts/493"}], "name": "list", "label": "list"}, {"self_ref": "#/groups/15", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/495"}, {"cref": "#/texts/496"}, {"cref": "#/texts/497"}, {"cref": "#/texts/498"}], "name": "list", "label": "list"}], "texts": [{"self_ref": "#/texts/0", "parent": {"cref": "#/body"}, "children": [], "label": "page_header", "prov": [{"page_no": 1, "bbox": {"l": 18.340221405029297, "t": 584.1799926757812, "r": 36.339778900146484, "b": 231.99996948242188, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 38]}], "orig": "arXiv:2203.01017v2 [cs.CV] 11 Mar 2022", "text": "arXiv:2203.01017v2 [cs.CV] 11 Mar 2022"}, {"self_ref": "#/texts/1", "parent": {"cref": "#/body"}, "children": [], "label": "section_header", "prov": [{"page_no": 1, "bbox": {"l": 96.3010025024414, "t": 684.9658813476562, "r": 498.9270935058594, "b": 672.0686645507812, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 61]}], "orig": "TableFormer: Table Structure Understanding with Transformers.", "text": "TableFormer: Table Structure Understanding with Transformers.", "level": 1}, {"self_ref": "#/texts/2", "parent": {"cref": "#/body"}, "children": [], "label": "section_header", "prov": [{"page_no": 1, "bbox": {"l": 142.4770050048828, "t": 645.3146362304688, "r": 452.7502746582031, "b": 620.6796264648438, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 73]}], "orig": "Ahmed Nassar, Nikolaos Livathinos, Maksym Lysak, Peter Staar IBM Research", "text": "Ahmed Nassar, Nikolaos Livathinos, Maksym Lysak, Peter Staar IBM Research", "level": 1}, {"self_ref": "#/texts/3", "parent": {"cref": "#/groups/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 208.123, "t": 616.03876, "r": 378.73257, "b": 607.57446, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 35]}], "orig": "{ ahn,nli,mly,taa } @zurich.ibm.com", "text": "{ ahn,nli,mly,taa } @zurich.ibm.com"}, {"self_ref": "#/texts/4", "parent": {"cref": "#/body"}, "children": [], "label": "section_header", "prov": [{"page_no": 1, "bbox": {"l": 145.99497985839844, "t": 576.5170288085938, "r": 190.48028564453125, "b": 565.769287109375, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 8]}], "orig": "Abstract", "text": "Abstract", "level": 1}, {"self_ref": "#/texts/5", "parent": {"cref": "#/body"}, "children": [], "label": "section_header", "prov": [{"page_no": 1, "bbox": {"l": 315.5670166015625, "t": 573.9931640625, "r": 408.4407043457031, "b": 565.2451782226562, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 22]}], "orig": "a. Picture of a table:", "text": "a. Picture of a table:", "level": 1}, {"self_ref": "#/texts/6", "parent": {"cref": "#/body"}, "children": [], "label": "section_header", "prov": [{"page_no": 1, "bbox": {"l": 50.111976623535156, "t": 252.05723571777344, "r": 126.94803619384766, "b": 241.30950927734375, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 15]}], "orig": "1. Introduction", "text": "1. Introduction", "level": 1}, {"self_ref": "#/texts/7", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 50.111976623535156, "t": 231.216796875, "r": 286.3650817871094, "b": 78.84822082519531, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 712]}], "orig": "The occurrence of tables in documents is ubiquitous. They often summarise quantitative or factual data, which is cumbersome to describe in verbose text but nevertheless extremely valuable. Unfortunately, this compact representation is often not easy to parse by machines. There are many implicit conventions used to obtain a compact table representation. For example, tables often have complex columnand row-headers in order to reduce duplicated cell content. Lines of different shapes and sizes are leveraged to separate content or indicate a tree structure. Additionally, tables can also have empty/missing table-entries or multi-row textual table-entries. Fig. 1 shows a table which presents all these issues.", "text": "The occurrence of tables in documents is ubiquitous. They often summarise quantitative or factual data, which is cumbersome to describe in verbose text but nevertheless extremely valuable. Unfortunately, this compact representation is often not easy to parse by machines. There are many implicit conventions used to obtain a compact table representation. For example, tables often have complex columnand row-headers in order to reduce duplicated cell content. Lines of different shapes and sizes are leveraged to separate content or indicate a tree structure. Additionally, tables can also have empty/missing table-entries or multi-row textual table-entries. Fig. 1 shows a table which presents all these issues."}, {"self_ref": "#/texts/8", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 451.9457100000001, "t": 556.65295, "r": 457.95050000000003, "b": 546.52252, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "1", "text": "1"}, {"self_ref": "#/texts/9", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 331.19681, "t": 522.64734, "r": 337.2016, "b": 512.51691, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "2", "text": "2"}, {"self_ref": "#/texts/10", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 384.0329, "t": 539.32104, "r": 390.03769, "b": 529.19061, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "3", "text": "3"}, {"self_ref": "#/texts/11", "parent": {"cref": "#/body"}, "children": [], "label": "caption", "prov": [{"page_no": 1, "bbox": {"l": 50.111976623535156, "t": 550.6049194335938, "r": 286.3651123046875, "b": 279.00335693359375, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1320]}], "orig": "Tables organize valuable content in a concise and compact representation. This content is extremely valuable for systems such as search engines, Knowledge Graph's, etc, since they enhance their predictive capabilities. Unfortunately, tables come in a large variety of shapes and sizes. Furthermore, they can have complex column/row-header configurations, multiline rows, different variety of separation lines, missing entries, etc. As such, the correct identification of the table-structure from an image is a nontrivial task. In this paper, we present a new table-structure identification model. The latter improves the latest end-toend deep learning model (i.e. encoder-dual-decoder from PubTabNet) in two significant ways. First, we introduce a new object detection decoder for table-cells. In this way, we can obtain the content of the table-cells from programmatic PDF's directly from the PDF source and avoid the training of the custom OCR decoders. This architectural change leads to more accurate table-content extraction and allows us to tackle non-english tables. Second, we replace the LSTM decoders with transformer based decoders. This upgrade improves significantly the previous state-of-the-art tree-editing-distance-score (TEDS) from 91% to 98.5% on simple tables and from 88.7% to 95% on complex tables.", "text": "Tables organize valuable content in a concise and compact representation. This content is extremely valuable for systems such as search engines, Knowledge Graph's, etc, since they enhance their predictive capabilities. Unfortunately, tables come in a large variety of shapes and sizes. Furthermore, they can have complex column/row-header configurations, multiline rows, different variety of separation lines, missing entries, etc. As such, the correct identification of the table-structure from an image is a nontrivial task. In this paper, we present a new table-structure identification model. The latter improves the latest end-toend deep learning model (i.e. encoder-dual-decoder from PubTabNet) in two significant ways. First, we introduce a new object detection decoder for table-cells. In this way, we can obtain the content of the table-cells from programmatic PDF's directly from the PDF source and avoid the training of the custom OCR decoders. This architectural change leads to more accurate table-content extraction and allows us to tackle non-english tables. Second, we replace the LSTM decoders with transformer based decoders. This upgrade improves significantly the previous state-of-the-art tree-editing-distance-score (TEDS) from 91% to 98.5% on simple tables and from 88.7% to 95% on complex tables."}, {"self_ref": "#/texts/12", "parent": {"cref": "#/groups/1"}, "children": [], "label": "list_item", "prov": [{"page_no": 1, "bbox": {"l": 315.5670166015625, "t": 478.3052062988281, "r": 486.4019470214844, "b": 458.7572021484375, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 68]}], "orig": "b. Red-annotation of bounding boxes, Blue-predictions by TableFormer", "text": "b. Red-annotation of bounding boxes, Blue-predictions by TableFormer", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/13", "parent": {"cref": "#/pictures/1"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 408.14752, "t": 449.17172, "r": 412.54001, "b": 440.38678, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "1", "text": "1"}, {"self_ref": "#/texts/14", "parent": {"cref": "#/pictures/1"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 356.11011, "t": 450.42783, "r": 360.50259, "b": 441.64288, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "0", "text": "0"}, {"self_ref": "#/texts/15", "parent": {"cref": "#/pictures/1"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 500.6777, "t": 451.06232, "r": 505.0701900000001, "b": 442.2773700000001, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "2", "text": "2"}, {"self_ref": "#/texts/16", "parent": {"cref": "#/pictures/1"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 356.13382, "t": 440.25211, "r": 360.52631, "b": 431.46716, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "3", "text": "3"}, {"self_ref": "#/texts/17", "parent": {"cref": "#/pictures/1"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 402.53992, "t": 436.1235, "r": 406.9324, "b": 427.33856, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "4", "text": "4"}, {"self_ref": "#/texts/18", "parent": {"cref": "#/pictures/1"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 448.58178999999996, "t": 439.15982, "r": 452.97427, "b": 430.37488, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "5", "text": "5"}, {"self_ref": "#/texts/19", "parent": {"cref": "#/pictures/1"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 491.65161000000006, "t": 438.29343, "r": 496.0441, "b": 429.50848, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "6", "text": "6"}, {"self_ref": "#/texts/20", "parent": {"cref": "#/pictures/1"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 535.13843, "t": 438.66031, "r": 539.53088, "b": 429.87537, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "7", "text": "7"}, {"self_ref": "#/texts/21", "parent": {"cref": "#/pictures/1"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 348.82822, "t": 404.90219, "r": 353.2207, "b": 396.11725, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "8", "text": "8"}, {"self_ref": "#/texts/22", "parent": {"cref": "#/pictures/1"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 389.27151, "t": 416.62772, "r": 393.664, "b": 407.84277, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "9", "text": "9"}, {"self_ref": "#/texts/23", "parent": {"cref": "#/pictures/1"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 442.67479999999995, "t": 416.35379, "r": 451.45889000000005, "b": 407.56885, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "10", "text": "10"}, {"self_ref": "#/texts/24", "parent": {"cref": "#/pictures/1"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 477.4382299999999, "t": 416.466, "r": 485.90167, "b": 407.68105999999995, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "11", "text": "11"}, {"self_ref": "#/texts/25", "parent": {"cref": "#/pictures/1"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 522.57263, "t": 416.35379, "r": 531.35669, "b": 407.56885, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "12", "text": "12"}, {"self_ref": "#/texts/26", "parent": {"cref": "#/pictures/1"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 400.22992, "t": 404.88571, "r": 409.01401, "b": 396.10077, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "13", "text": "13"}, {"self_ref": "#/texts/27", "parent": {"cref": "#/pictures/1"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 442.30792, "t": 405.01018999999997, "r": 451.0920100000001, "b": 396.22524999999996, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "14", "text": "14"}, {"self_ref": "#/texts/28", "parent": {"cref": "#/pictures/1"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 478.21941999999996, "t": 404.62531, "r": 487.00351000000006, "b": 395.84036, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "15", "text": "15"}, {"self_ref": "#/texts/29", "parent": {"cref": "#/pictures/1"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 523.2287, "t": 405.01018999999997, "r": 532.01276, "b": 396.22524999999996, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "16", "text": "16"}, {"self_ref": "#/texts/30", "parent": {"cref": "#/pictures/1"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 411.57233, "t": 392.57523, "r": 415.96481, "b": 383.79028, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "1", "text": "1"}, {"self_ref": "#/texts/31", "parent": {"cref": "#/pictures/1"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 415.96393, "t": 392.57523, "r": 420.35641, "b": 383.79028, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "7", "text": "7"}, {"self_ref": "#/texts/32", "parent": {"cref": "#/pictures/1"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 442.30521, "t": 392.9628000000001, "r": 451.08929, "b": 384.17786000000007, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "18", "text": "18"}, {"self_ref": "#/texts/33", "parent": {"cref": "#/pictures/1"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 478.77893, "t": 393.00360000000006, "r": 487.56302, "b": 384.21866000000006, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "19", "text": "19"}, {"self_ref": "#/texts/34", "parent": {"cref": "#/pictures/1"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 523.97241, "t": 393.3885200000001, "r": 532.75647, "b": 384.60358, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "20", "text": "20"}, {"self_ref": "#/texts/35", "parent": {"cref": "#/pictures/1"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 385.09399, "t": 434.23969000000005, "r": 391.09879, "b": 424.10928, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "3", "text": "3"}, {"self_ref": "#/texts/36", "parent": {"cref": "#/pictures/1"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 333.43451, "t": 411.2735, "r": 339.4393, "b": 401.14310000000006, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "2", "text": "2"}, {"self_ref": "#/texts/37", "parent": {"cref": "#/pictures/1"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 478.07210999999995, "t": 450.9631999999999, "r": 484.0769, "b": 440.83279000000005, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "1", "text": "1"}, {"self_ref": "#/texts/38", "parent": {"cref": "#/groups/2"}, "children": [], "label": "list_item", "prov": [{"page_no": 1, "bbox": {"l": 315.5670166015625, "t": 371.81719970703125, "r": 491.1912536621094, "b": 363.0691833496094, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 38]}], "orig": "c. Structure predicted by TableFormer:", "text": "c. Structure predicted by TableFormer:", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/39", "parent": {"cref": "#/pictures/2"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 347.24872, "t": 354.31412, "r": 351.6412, "b": 345.52917, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "1", "text": "1"}, {"self_ref": "#/texts/40", "parent": {"cref": "#/pictures/2"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 318.88071, "t": 354.31412, "r": 323.27319, "b": 345.52917, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "0", "text": "0"}, {"self_ref": "#/texts/41", "parent": {"cref": "#/pictures/2"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 394.10422, "t": 354.31412, "r": 398.4967, "b": 345.52917, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "2", "text": "2"}, {"self_ref": "#/texts/42", "parent": {"cref": "#/pictures/2"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 318.77316, "t": 342.4545, "r": 323.16565, "b": 333.66956, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "3", "text": "3"}, {"self_ref": "#/texts/43", "parent": {"cref": "#/pictures/2"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 347.24872, "t": 342.4545, "r": 351.6412, "b": 333.66956, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "4", "text": "4"}, {"self_ref": "#/texts/44", "parent": {"cref": "#/pictures/2"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 394.10422, "t": 342.4545, "r": 398.4967, "b": 333.66956, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "5", "text": "5"}, {"self_ref": "#/texts/45", "parent": {"cref": "#/pictures/2"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 440.95941000000005, "t": 342.4545, "r": 445.3519, "b": 333.66956, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "6", "text": "6"}, {"self_ref": "#/texts/46", "parent": {"cref": "#/pictures/2"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 487.81491, "t": 342.4545, "r": 492.2074, "b": 333.66956, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "7", "text": "7"}, {"self_ref": "#/texts/47", "parent": {"cref": "#/pictures/2"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 318.77316, "t": 318.29575, "r": 323.16565, "b": 309.5108, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "8", "text": "8"}, {"self_ref": "#/texts/48", "parent": {"cref": "#/pictures/2"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 347.24872, "t": 330.1554, "r": 351.6412, "b": 321.37045, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "9", "text": "9"}, {"self_ref": "#/texts/49", "parent": {"cref": "#/pictures/2"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 394.10422, "t": 330.1554, "r": 402.88831, "b": 321.37045, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "10", "text": "10"}, {"self_ref": "#/texts/50", "parent": {"cref": "#/pictures/2"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 440.95941000000005, "t": 330.1554, "r": 449.42285, "b": 321.37045, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "11", "text": "11"}, {"self_ref": "#/texts/51", "parent": {"cref": "#/pictures/2"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 487.81491, "t": 330.1554, "r": 496.599, "b": 321.37045, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "12", "text": "12"}, {"self_ref": "#/texts/52", "parent": {"cref": "#/pictures/2"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 347.24872, "t": 318.29575, "r": 356.03281, "b": 309.5108, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "13", "text": "13"}, {"self_ref": "#/texts/53", "parent": {"cref": "#/pictures/2"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 394.10422, "t": 318.29575, "r": 402.88831, "b": 309.5108, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "14", "text": "14"}, {"self_ref": "#/texts/54", "parent": {"cref": "#/pictures/2"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 440.95941000000005, "t": 318.29575, "r": 449.7435, "b": 309.5108, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "15", "text": "15"}, {"self_ref": "#/texts/55", "parent": {"cref": "#/pictures/2"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 487.81491, "t": 318.29575, "r": 496.599, "b": 309.5108, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "16", "text": "16"}, {"self_ref": "#/texts/56", "parent": {"cref": "#/pictures/2"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 347.24872, "t": 306.87531, "r": 356.03281, "b": 298.09036, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "17", "text": "17"}, {"self_ref": "#/texts/57", "parent": {"cref": "#/pictures/2"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 394.10422, "t": 306.87531, "r": 402.88831, "b": 298.09036, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "18", "text": "18"}, {"self_ref": "#/texts/58", "parent": {"cref": "#/pictures/2"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 440.95941000000005, "t": 306.87531, "r": 449.7435, "b": 298.09036, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "19", "text": "19"}, {"self_ref": "#/texts/59", "parent": {"cref": "#/pictures/2"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 487.81491, "t": 306.87531, "r": 496.599, "b": 298.09036, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "20", "text": "20"}, {"self_ref": "#/texts/60", "parent": {"cref": "#/pictures/2"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 366.70102, "t": 342.87918, "r": 372.70581, "b": 332.74878, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "3", "text": "3"}, {"self_ref": "#/texts/61", "parent": {"cref": "#/pictures/2"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 331.90424, "t": 318.67709, "r": 337.90903, "b": 308.54669, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "2", "text": "2"}, {"self_ref": "#/texts/62", "parent": {"cref": "#/pictures/2"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 459.87621999999993, "t": 354.4064, "r": 465.88101, "b": 344.276, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "1", "text": "1"}, {"self_ref": "#/texts/63", "parent": {"cref": "#/body"}, "children": [], "label": "caption", "prov": [{"page_no": 1, "bbox": {"l": 308.86199951171875, "t": 277.4996337890625, "r": 545.1151733398438, "b": 232.7270965576172, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 220]}], "orig": "Figure 1: Picture of a table with subtle, complex features such as (1) multi-column headers, (2) cell with multi-row text and (3) cells with no content. Image from PubTabNet evaluation set, filename: 'PMC2944238 004 02'.", "text": "Figure 1: Picture of a table with subtle, complex features such as (1) multi-column headers, (2) cell with multi-row text and (3) cells with no content. Image from PubTabNet evaluation set, filename: 'PMC2944238 004 02'."}, {"self_ref": "#/texts/64", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 308.86199951171875, "t": 207.59063720703125, "r": 545.1151733398438, "b": 126.95307159423828, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 363]}], "orig": "Recently, significant progress has been made with vision based approaches to extract tables in documents. For the sake of completeness, the issue of table extraction from documents is typically decomposed into two separate challenges, i.e. (1) finding the location of the table(s) on a document-page and (2) finding the structure of a given table in the document.", "text": "Recently, significant progress has been made with vision based approaches to extract tables in documents. For the sake of completeness, the issue of table extraction from documents is typically decomposed into two separate challenges, i.e. (1) finding the location of the table(s) on a document-page and (2) finding the structure of a given table in the document."}, {"self_ref": "#/texts/65", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 308.86199951171875, "t": 123.61963653564453, "r": 545.1151123046875, "b": 78.84806823730469, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 229]}], "orig": "The first problem is called table-location and has been previously addressed [30, 38, 19, 21, 23, 26, 8] with stateof-the-art object-detection networks (e.g. YOLO and later on Mask-RCNN [9]). For all practical purposes, it can be", "text": "The first problem is called table-location and has been previously addressed [30, 38, 19, 21, 23, 26, 8] with stateof-the-art object-detection networks (e.g. YOLO and later on Mask-RCNN [9]). For all practical purposes, it can be"}, {"self_ref": "#/texts/66", "parent": {"cref": "#/body"}, "children": [], "label": "page_footer", "prov": [{"page_no": 1, "bbox": {"l": 295.1210021972656, "t": 57.866634368896484, "r": 300.102294921875, "b": 48.9600715637207, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "1", "text": "1"}, {"self_ref": "#/texts/67", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 50.11199951171875, "t": 716.7916259765625, "r": 286.36505126953125, "b": 695.9300537109375, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 75]}], "orig": "considered as a solved problem, given enough ground-truth data to train on.", "text": "considered as a solved problem, given enough ground-truth data to train on."}, {"self_ref": "#/texts/68", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 50.11199951171875, "t": 692.4285888671875, "r": 286.3651428222656, "b": 563.9699096679688, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 626]}], "orig": "The second problem is called table-structure decomposition. The latter is a long standing problem in the community of document understanding [6, 4, 14]. Contrary to the table-location problem, there are no commonly used approaches that can easily be re-purposed to solve this problem. Lately, a set of new model-architectures has been proposed by the community to address table-structure decomposition [37, 36, 18, 20]. All these models have some weaknesses (see Sec. 2). The common denominator here is the reliance on textual features and/or the inability to provide the bounding box of each table-cell in the original image.", "text": "The second problem is called table-structure decomposition. The latter is a long standing problem in the community of document understanding [6, 4, 14]. Contrary to the table-location problem, there are no commonly used approaches that can easily be re-purposed to solve this problem. Lately, a set of new model-architectures has been proposed by the community to address table-structure decomposition [37, 36, 18, 20]. All these models have some weaknesses (see Sec. 2). The common denominator here is the reliance on textual features and/or the inability to provide the bounding box of each table-cell in the original image."}, {"self_ref": "#/texts/69", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 50.11199951171875, "t": 560.4684448242188, "r": 286.3651123046875, "b": 420.054931640625, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 643]}], "orig": "In this paper, we want to address these weaknesses and present a robust table-structure decomposition algorithm. The design criteria for our model are the following. First, we want our algorithm to be language agnostic. In this way, we can obtain the structure of any table, irregardless of the language. Second, we want our algorithm to leverage as much data as possible from the original PDF document. For programmatic PDF documents, the text-cells can often be extracted much faster and with higher accuracy compared to OCR methods. Last but not least, we want to have a direct link between the table-cell and its bounding box in the image.", "text": "In this paper, we want to address these weaknesses and present a robust table-structure decomposition algorithm. The design criteria for our model are the following. First, we want our algorithm to be language agnostic. In this way, we can obtain the structure of any table, irregardless of the language. Second, we want our algorithm to leverage as much data as possible from the original PDF document. For programmatic PDF documents, the text-cells can often be extracted much faster and with higher accuracy compared to OCR methods. Last but not least, we want to have a direct link between the table-cell and its bounding box in the image."}, {"self_ref": "#/texts/70", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 50.11199951171875, "t": 416.5534973144531, "r": 286.3665771484375, "b": 359.8269958496094, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 242]}], "orig": "To meet the design criteria listed above, we developed a new model called TableFormer and a synthetically generated table structure dataset called SynthTabNet $^{1}$. In particular, our contributions in this work can be summarised as follows:", "text": "To meet the design criteria listed above, we developed a new model called TableFormer and a synthetically generated table structure dataset called SynthTabNet $^{1}$. In particular, our contributions in this work can be summarised as follows:"}, {"self_ref": "#/texts/71", "parent": {"cref": "#/groups/3"}, "children": [], "label": "list_item", "prov": [{"page_no": 2, "bbox": {"l": 61.56901550292969, "t": 347.568115234375, "r": 286.3648986816406, "b": 302.6770324707031, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 166]}], "orig": "\u00b7 We propose TableFormer , a transformer based model that predicts tables structure and bounding boxes for the table content simultaneously in an end-to-end approach.", "text": "\u00b7 We propose TableFormer , a transformer based model that predicts tables structure and bounding boxes for the table content simultaneously in an end-to-end approach.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/72", "parent": {"cref": "#/groups/3"}, "children": [], "label": "list_item", "prov": [{"page_no": 2, "bbox": {"l": 61.56901550292969, "t": 289.9661560058594, "r": 286.3648986816406, "b": 245.0740509033203, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 181]}], "orig": "\u00b7 Across all benchmark datasets TableFormer significantly outperforms existing state-of-the-art metrics, while being much more efficient in training and inference to existing works.", "text": "\u00b7 Across all benchmark datasets TableFormer significantly outperforms existing state-of-the-art metrics, while being much more efficient in training and inference to existing works.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/73", "parent": {"cref": "#/groups/3"}, "children": [], "label": "list_item", "prov": [{"page_no": 2, "bbox": {"l": 61.569000244140625, "t": 232.3631591796875, "r": 286.36492919921875, "b": 199.4270477294922, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 106]}], "orig": "\u00b7 We present SynthTabNet a synthetically generated dataset, with various appearance styles and complexity.", "text": "\u00b7 We present SynthTabNet a synthetically generated dataset, with various appearance styles and complexity.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/74", "parent": {"cref": "#/groups/3"}, "children": [], "label": "list_item", "prov": [{"page_no": 2, "bbox": {"l": 61.569007873535156, "t": 186.5966033935547, "r": 286.3650817871094, "b": 153.779052734375, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 131]}], "orig": "\u00b7 An augmented dataset based on PubTabNet [37], FinTabNet [36], and TableBank [17] with generated ground-truth for reproducibility.", "text": "\u00b7 An augmented dataset based on PubTabNet [37], FinTabNet [36], and TableBank [17] with generated ground-truth for reproducibility.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/75", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 50.11200714111328, "t": 141.401611328125, "r": 286.3651123046875, "b": 96.63004302978516, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 231]}], "orig": "The paper is structured as follows. In Sec. 2, we give a brief overview of the current state-of-the-art. In Sec. 3, we describe the datasets on which we train. In Sec. 4, we introduce the TableFormer model-architecture and describe", "text": "The paper is structured as follows. In Sec. 2, we give a brief overview of the current state-of-the-art. In Sec. 3, we describe the datasets on which we train. In Sec. 4, we introduce the TableFormer model-architecture and describe"}, {"self_ref": "#/texts/76", "parent": {"cref": "#/body"}, "children": [], "label": "footnote", "prov": [{"page_no": 2, "bbox": {"l": 60.97100067138672, "t": 86.40372467041016, "r": 183.7305450439453, "b": 79.27845764160156, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 40]}], "orig": "$^{1}$https://github.com/IBM/SynthTabNet", "text": "$^{1}$https://github.com/IBM/SynthTabNet"}, {"self_ref": "#/texts/77", "parent": {"cref": "#/body"}, "children": [], "label": "page_footer", "prov": [{"page_no": 2, "bbox": {"l": 295.1210021972656, "t": 57.86671829223633, "r": 300.102294921875, "b": 48.96015548706055, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "2", "text": "2"}, {"self_ref": "#/texts/78", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 308.86199951171875, "t": 716.7916259765625, "r": 545.1151123046875, "b": 683.9750366210938, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 166]}], "orig": "its results & performance in Sec. 5. As a conclusion, we describe how this new model-architecture can be re-purposed for other tasks in the computer-vision community.", "text": "its results & performance in Sec. 5. As a conclusion, we describe how this new model-architecture can be re-purposed for other tasks in the computer-vision community."}, {"self_ref": "#/texts/79", "parent": {"cref": "#/body"}, "children": [], "label": "section_header", "prov": [{"page_no": 2, "bbox": {"l": 308.86199951171875, "t": 670.26806640625, "r": 498.28021240234375, "b": 659.5203247070312, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 37]}], "orig": "2. Previous work and State of the Art", "text": "2. Previous work and State of the Art", "level": 1}, {"self_ref": "#/texts/80", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 308.86199951171875, "t": 649.7786254882812, "r": 545.1151733398438, "b": 461.54498291015625, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 901]}], "orig": "Identifying the structure of a table has been an outstanding problem in the document-parsing community, that motivates many organised public challenges [6, 4, 14]. The difficulty of the problem can be attributed to a number of factors. First, there is a large variety in the shapes and sizes of tables. Such large variety requires a flexible method. This is especially true for complex column- and row headers, which can be extremely intricate and demanding. A second factor of complexity is the lack of data with regard to table-structure. Until the publication of PubTabNet [37], there were no large datasets (i.e. > 100 K tables) that provided structure information. This happens primarily due to the fact that tables are notoriously time-consuming to annotate by hand. However, this has definitely changed in recent years with the deliverance of PubTabNet [37], FinTabNet [36], TableBank [17] etc.", "text": "Identifying the structure of a table has been an outstanding problem in the document-parsing community, that motivates many organised public challenges [6, 4, 14]. The difficulty of the problem can be attributed to a number of factors. First, there is a large variety in the shapes and sizes of tables. Such large variety requires a flexible method. This is especially true for complex column- and row headers, which can be extremely intricate and demanding. A second factor of complexity is the lack of data with regard to table-structure. Until the publication of PubTabNet [37], there were no large datasets (i.e. > 100 K tables) that provided structure information. This happens primarily due to the fact that tables are notoriously time-consuming to annotate by hand. However, this has definitely changed in recent years with the deliverance of PubTabNet [37], FinTabNet [36], TableBank [17] etc."}, {"self_ref": "#/texts/81", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 308.86199951171875, "t": 458.4305419921875, "r": 545.115234375, "b": 341.9270935058594, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 552]}], "orig": "Before the rising popularity of deep neural networks, the community relied heavily on heuristic and/or statistical methods to do table structure identification [3, 7, 11, 5, 13, 28]. Although such methods work well on constrained tables [12], a more data-driven approach can be applied due to the advent of convolutional neural networks (CNNs) and the availability of large datasets. To the best-of-our knowledge, there are currently two different types of network architecture that are being pursued for state-of-the-art tablestructure identification.", "text": "Before the rising popularity of deep neural networks, the community relied heavily on heuristic and/or statistical methods to do table structure identification [3, 7, 11, 5, 13, 28]. Although such methods work well on constrained tables [12], a more data-driven approach can be applied due to the advent of convolutional neural networks (CNNs) and the availability of large datasets. To the best-of-our knowledge, there are currently two different types of network architecture that are being pursued for state-of-the-art tablestructure identification."}, {"self_ref": "#/texts/82", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 308.8619689941406, "t": 338.9322204589844, "r": 545.1168823242188, "b": 78.84815216064453, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1262]}], "orig": "Image-to-Text networks : In this type of network, one predicts a sequence of tokens starting from an encoded image. Such sequences of tokens can be HTML table tags [37, 17] or LaTeX symbols[10]. The choice of symbols is ultimately not very important, since one can be transformed into the other. There are however subtle variations in the Image-to-Text networks. The easiest network architectures are \"image-encoder \u2192 text-decoder\" (IETD), similar to network architectures that try to provide captions to images [32]. In these IETD networks, one expects as output the LaTeX/HTML string of the entire table, i.e. the symbols necessary for creating the table with the content of the table. Another approach is the \"image-encoder \u2192 dual decoder\" (IEDD) networks. In these type of networks, one has two consecutive decoders with different purposes. The first decoder is the tag-decoder , i.e. it only produces the HTML/LaTeX tags which construct an empty table. The second content-decoder uses the encoding of the image in combination with the output encoding of each cell-tag (from the tag-decoder ) to generate the textual content of each table cell. The network architecture of IEDD is certainly more elaborate, but it has the advantage that one can pre-train the", "text": "Image-to-Text networks : In this type of network, one predicts a sequence of tokens starting from an encoded image. Such sequences of tokens can be HTML table tags [37, 17] or LaTeX symbols[10]. The choice of symbols is ultimately not very important, since one can be transformed into the other. There are however subtle variations in the Image-to-Text networks. The easiest network architectures are \"image-encoder \u2192 text-decoder\" (IETD), similar to network architectures that try to provide captions to images [32]. In these IETD networks, one expects as output the LaTeX/HTML string of the entire table, i.e. the symbols necessary for creating the table with the content of the table. Another approach is the \"image-encoder \u2192 dual decoder\" (IEDD) networks. In these type of networks, one has two consecutive decoders with different purposes. The first decoder is the tag-decoder , i.e. it only produces the HTML/LaTeX tags which construct an empty table. The second content-decoder uses the encoding of the image in combination with the output encoding of each cell-tag (from the tag-decoder ) to generate the textual content of each table cell. The network architecture of IEDD is certainly more elaborate, but it has the advantage that one can pre-train the"}, {"self_ref": "#/texts/83", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 50.11199951171875, "t": 716.7916259765625, "r": 250.15101623535156, "b": 707.8850708007812, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 51]}], "orig": "tag-decoder which is constrained to the table-tags.", "text": "tag-decoder which is constrained to the table-tags."}, {"self_ref": "#/texts/84", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 50.11199951171875, "t": 704.7806396484375, "r": 286.3651428222656, "b": 516.5458984375, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 864]}], "orig": "In practice, both network architectures (IETD and IEDD) require an implicit, custom trained object-characterrecognition (OCR) to obtain the content of the table-cells. In the case of IETD, this OCR engine is implicit in the decoder similar to [24]. For the IEDD, the OCR is solely embedded in the content-decoder. This reliance on a custom, implicit OCR decoder is of course problematic. OCR is a well known and extremely tough problem, that often needs custom training for each individual language. However, the limited availability for non-english content in the current datasets, makes it impractical to apply the IETD and IEDD methods on tables with other languages. Additionally, OCR can be completely omitted if the tables originate from programmatic PDF documents with known positions of each cell. The latter was the inspiration for the work of this paper.", "text": "In practice, both network architectures (IETD and IEDD) require an implicit, custom trained object-characterrecognition (OCR) to obtain the content of the table-cells. In the case of IETD, this OCR engine is implicit in the decoder similar to [24]. For the IEDD, the OCR is solely embedded in the content-decoder. This reliance on a custom, implicit OCR decoder is of course problematic. OCR is a well known and extremely tough problem, that often needs custom training for each individual language. However, the limited availability for non-english content in the current datasets, makes it impractical to apply the IETD and IEDD methods on tables with other languages. Additionally, OCR can be completely omitted if the tables originate from programmatic PDF documents with known positions of each cell. The latter was the inspiration for the work of this paper."}, {"self_ref": "#/texts/85", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 50.11199188232422, "t": 513.56103515625, "r": 286.3651123046875, "b": 301.297119140625, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1007]}], "orig": "Graph Neural networks : Graph Neural networks (GNN's) take a radically different approach to tablestructure extraction. Note that one table cell can constitute out of multiple text-cells. To obtain the table-structure, one creates an initial graph, where each of the text-cells becomes a node in the graph similar to [33, 34, 2]. Each node is then associated with en embedding vector coming from the encoded image, its coordinates and the encoded text. Furthermore, nodes that represent adjacent text-cells are linked. Graph Convolutional Networks (GCN's) based methods take the image as an input, but also the position of the text-cells and their content [18]. The purpose of a GCN is to transform the input graph into a new graph, which replaces the old links with new ones. The new links then represent the table-structure. With this approach, one can avoid the need to build custom OCR decoders. However, the quality of the reconstructed structure is not comparable to the current state-of-the-art [18].", "text": "Graph Neural networks : Graph Neural networks (GNN's) take a radically different approach to tablestructure extraction. Note that one table cell can constitute out of multiple text-cells. To obtain the table-structure, one creates an initial graph, where each of the text-cells becomes a node in the graph similar to [33, 34, 2]. Each node is then associated with en embedding vector coming from the encoded image, its coordinates and the encoded text. Furthermore, nodes that represent adjacent text-cells are linked. Graph Convolutional Networks (GCN's) based methods take the image as an input, but also the position of the text-cells and their content [18]. The purpose of a GCN is to transform the input graph into a new graph, which replaces the old links with new ones. The new links then represent the table-structure. With this approach, one can avoid the need to build custom OCR decoders. However, the quality of the reconstructed structure is not comparable to the current state-of-the-art [18]."}, {"self_ref": "#/texts/86", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 50.11198425292969, "t": 298.3112487792969, "r": 286.36627197265625, "b": 169.733154296875, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 619]}], "orig": "Hybrid Deep Learning-Rule-Based approach : A popular current model for table-structure identification is the use of a hybrid Deep Learning-Rule-Based approach similar to [27, 29]. In this approach, one first detects the position of the table-cells with object detection (e.g. YoloVx or MaskRCNN), then classifies the table into different types (from its images) and finally uses different rule-sets to obtain its table-structure. Currently, this approach achieves stateof-the-art results, but is not an end-to-end deep-learning method. As such, new rules need to be written if different types of tables are encountered.", "text": "Hybrid Deep Learning-Rule-Based approach : A popular current model for table-structure identification is the use of a hybrid Deep Learning-Rule-Based approach similar to [27, 29]. In this approach, one first detects the position of the table-cells with object detection (e.g. YoloVx or MaskRCNN), then classifies the table into different types (from its images) and finally uses different rule-sets to obtain its table-structure. Currently, this approach achieves stateof-the-art results, but is not an end-to-end deep-learning method. As such, new rules need to be written if different types of tables are encountered."}, {"self_ref": "#/texts/87", "parent": {"cref": "#/body"}, "children": [], "label": "section_header", "prov": [{"page_no": 3, "bbox": {"l": 50.11198425292969, "t": 156.05516052246094, "r": 105.22545623779297, "b": 145.30743408203125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 11]}], "orig": "3. Datasets", "text": "3. Datasets", "level": 1}, {"self_ref": "#/texts/88", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 50.11198425292969, "t": 135.57470703125, "r": 286.3650817871094, "b": 78.84813690185547, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 281]}], "orig": "We rely on large-scale datasets such as PubTabNet [37], FinTabNet [36], and TableBank [17] datasets to train and evaluate our models. These datasets span over various appearance styles and content. We also introduce our own synthetically generated SynthTabNet dataset to fix an im-", "text": "We rely on large-scale datasets such as PubTabNet [37], FinTabNet [36], and TableBank [17] datasets to train and evaluate our models. These datasets span over various appearance styles and content. We also introduce our own synthetically generated SynthTabNet dataset to fix an im-"}, {"self_ref": "#/texts/89", "parent": {"cref": "#/body"}, "children": [], "label": "page_footer", "prov": [{"page_no": 3, "bbox": {"l": 295.1210021972656, "t": 57.86680221557617, "r": 300.102294921875, "b": 48.96023941040039, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "3", "text": "3"}, {"self_ref": "#/texts/90", "parent": {"cref": "#/body"}, "children": [], "label": "caption", "prov": [{"page_no": 3, "bbox": {"l": 308.86199951171875, "t": 524.1636352539062, "r": 545.1151123046875, "b": 503.3020935058594, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 104]}], "orig": "Figure 2: Distribution of the tables across different table dimensions in PubTabNet + FinTabNet datasets", "text": "Figure 2: Distribution of the tables across different table dimensions in PubTabNet + FinTabNet datasets"}, {"self_ref": "#/texts/91", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "section_header", "prov": [{"page_no": 3, "bbox": {"l": 380.79849, "t": 712.1882300000001, "r": 486.84909, "b": 703.44025, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 21]}], "orig": "PubTabNet + FinTabNet", "text": "PubTabNet + FinTabNet", "level": 1}, {"self_ref": "#/texts/92", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 396.76776, "t": 549.97302, "r": 469.78748, "b": 541.22504, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 14]}], "orig": "Rows / Columns", "text": "Rows / Columns"}, {"self_ref": "#/texts/93", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 320.97653, "t": 558.57703, "r": 324.79254, "b": 552.745, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "0", "text": "0"}, {"self_ref": "#/texts/94", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 410.483, "t": 558.57703, "r": 418.11319, "b": 552.745, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "20", "text": "20"}, {"self_ref": "#/texts/95", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 500.84949, "t": 558.57703, "r": 508.47968000000003, "b": 552.745, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "40", "text": "40"}, {"self_ref": "#/texts/96", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 365.29999, "t": 558.57703, "r": 372.93018, "b": 552.745, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "10", "text": "10"}, {"self_ref": "#/texts/97", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 455.66626, "t": 558.57703, "r": 463.29645, "b": 552.745, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "30", "text": "30"}, {"self_ref": "#/texts/98", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 542.03528, "t": 558.57703, "r": 549.66547, "b": 552.745, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "50", "text": "50"}, {"self_ref": "#/texts/99", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 316.04474, "t": 561.55383, "r": 319.86075, "b": 555.7218, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "0", "text": "0"}, {"self_ref": "#/texts/100", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 312.62521, "t": 593.30927, "r": 316.44122, "b": 587.47723, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "2", "text": "2"}, {"self_ref": "#/texts/101", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 316.43942, "t": 593.30927, "r": 320.2554, "b": 587.47723, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "0", "text": "0"}, {"self_ref": "#/texts/102", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 313.14951, "t": 623.90204, "r": 316.96552, "b": 618.07001, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "4", "text": "4"}, {"self_ref": "#/texts/103", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 316.96371, "t": 623.90204, "r": 320.77969, "b": 618.07001, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "0", "text": "0"}, {"self_ref": "#/texts/104", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 312.92972, "t": 655.41229, "r": 316.74573, "b": 649.58026, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "6", "text": "6"}, {"self_ref": "#/texts/105", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 316.74393, "t": 655.41229, "r": 320.55991, "b": 649.58026, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "0", "text": "0"}, {"self_ref": "#/texts/106", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 312.48227, "t": 686.39825, "r": 316.29828, "b": 680.56622, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "8", "text": "8"}, {"self_ref": "#/texts/107", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 316.29648, "t": 686.39825, "r": 320.11246, "b": 680.56622, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "0", "text": "0"}, {"self_ref": "#/texts/108", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 312.48227, "t": 579.74078, "r": 316.29828, "b": 573.90875, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "1", "text": "1"}, {"self_ref": "#/texts/109", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 316.29648, "t": 579.74078, "r": 320.11246, "b": 573.90875, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "0", "text": "0"}, {"self_ref": "#/texts/110", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 313.07639, "t": 608.27802, "r": 316.8924, "b": 602.44598, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "3", "text": "3"}, {"self_ref": "#/texts/111", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 316.89059, "t": 608.27802, "r": 320.70657, "b": 602.44598, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "0", "text": "0"}, {"self_ref": "#/texts/112", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 312.76321, "t": 639.526, "r": 316.57922, "b": 633.69397, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "5", "text": "5"}, {"self_ref": "#/texts/113", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 316.57742, "t": 639.526, "r": 320.3934, "b": 633.69397, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "0", "text": "0"}, {"self_ref": "#/texts/114", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 312.19775, "t": 671.4295, "r": 316.01376, "b": 665.59747, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "7", "text": "7"}, {"self_ref": "#/texts/115", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 316.01196, "t": 671.4295, "r": 319.82794, "b": 665.59747, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "0", "text": "0"}, {"self_ref": "#/texts/116", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 312.8165, "t": 701.8913, "r": 316.63251, "b": 696.05927, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "9", "text": "9"}, {"self_ref": "#/texts/117", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 316.63071, "t": 701.8913, "r": 320.44669, "b": 696.05927, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "0", "text": "0"}, {"self_ref": "#/texts/118", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 532.17426, "t": 569.27271, "r": 536.94427, "b": 561.98273, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "0", "text": "0"}, {"self_ref": "#/texts/119", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 532.87952, "t": 683.7329700000001, "r": 547.61249, "b": 676.44299, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 3]}], "orig": "10K", "text": "10K"}, {"self_ref": "#/texts/120", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 532.7735, "t": 661.21899, "r": 542.73877, "b": 653.92902, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "8K", "text": "8K"}, {"self_ref": "#/texts/121", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 532.79901, "t": 638.07648, "r": 542.76428, "b": 630.7865, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "6K", "text": "6K"}, {"self_ref": "#/texts/122", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 532.5705, "t": 615.242, "r": 542.53577, "b": 607.95203, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "4K", "text": "4K"}, {"self_ref": "#/texts/123", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 532.14551, "t": 592.3537, "r": 542.11078, "b": 585.06372, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "2K", "text": "2K"}, {"self_ref": "#/texts/124", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 308.86199951171875, "t": 474.5266418457031, "r": 437.27001953125, "b": 465.6200866699219, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 33]}], "orig": "balance in the previous datasets.", "text": "balance in the previous datasets."}, {"self_ref": "#/texts/125", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 308.86199951171875, "t": 460.4686279296875, "r": 545.1151733398438, "b": 164.6382598876953, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1400]}], "orig": "The PubTabNet dataset contains 509k tables delivered as annotated PNG images. The annotations consist of the table structure represented in HTML format, the tokenized text and its bounding boxes per table cell. Fig. 1 shows the appearance style of PubTabNet. Depending on its complexity, a table is characterized as \"simple\" when it does not contain row spans or column spans, otherwise it is \"complex\". The dataset is divided into Train and Val splits (roughly 98% and 2%). The Train split consists of 54% simple and 46% complex tables and the Val split of 51% and 49% respectively. The FinTabNet dataset contains 112k tables delivered as single-page PDF documents with mixed table structures and text content. Similarly to the PubTabNet, the annotations of FinTabNet include the table structure in HTML, the tokenized text and the bounding boxes on a table cell basis. The dataset is divided into Train, Test and Val splits (81%, 9.5%, 9.5%), and each one is almost equally divided into simple and complex tables (Train: 48% simple, 52% complex, Test: 48% simple, 52% complex, Test: 53% simple, 47% complex). Finally the TableBank dataset consists of 145k tables provided as JPEG images. The latter has annotations for the table structure, but only few with bounding boxes of the table cells. The entire dataset consists of simple tables and it is divided into 90% Train, 3% Test and 7% Val splits.", "text": "The PubTabNet dataset contains 509k tables delivered as annotated PNG images. The annotations consist of the table structure represented in HTML format, the tokenized text and its bounding boxes per table cell. Fig. 1 shows the appearance style of PubTabNet. Depending on its complexity, a table is characterized as \"simple\" when it does not contain row spans or column spans, otherwise it is \"complex\". The dataset is divided into Train and Val splits (roughly 98% and 2%). The Train split consists of 54% simple and 46% complex tables and the Val split of 51% and 49% respectively. The FinTabNet dataset contains 112k tables delivered as single-page PDF documents with mixed table structures and text content. Similarly to the PubTabNet, the annotations of FinTabNet include the table structure in HTML, the tokenized text and the bounding boxes on a table cell basis. The dataset is divided into Train, Test and Val splits (81%, 9.5%, 9.5%), and each one is almost equally divided into simple and complex tables (Train: 48% simple, 52% complex, Test: 48% simple, 52% complex, Test: 53% simple, 47% complex). Finally the TableBank dataset consists of 145k tables provided as JPEG images. The latter has annotations for the table structure, but only few with bounding boxes of the table cells. The entire dataset consists of simple tables and it is divided into 90% Train, 3% Test and 7% Val splits."}, {"self_ref": "#/texts/126", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 308.86199951171875, "t": 159.48580932617188, "r": 545.1151123046875, "b": 78.84823608398438, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 406]}], "orig": "Due to the heterogeneity across the dataset formats, it was necessary to combine all available data into one homogenized dataset before we could train our models for practical purposes. Given the size of PubTabNet, we adopted its annotation format and we extracted and converted all tables as PNG images with a resolution of 72 dpi. Additionally, we have filtered out tables with extreme sizes due to small", "text": "Due to the heterogeneity across the dataset formats, it was necessary to combine all available data into one homogenized dataset before we could train our models for practical purposes. Given the size of PubTabNet, we adopted its annotation format and we extracted and converted all tables as PNG images with a resolution of 72 dpi. Additionally, we have filtered out tables with extreme sizes due to small"}, {"self_ref": "#/texts/127", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 4, "bbox": {"l": 50.11199951171875, "t": 716.7916259765625, "r": 286.3651123046875, "b": 695.9300537109375, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 93]}], "orig": "amount of such tables, and kept only those ones ranging between 1*1 and 20*10 (rows/columns).", "text": "amount of such tables, and kept only those ones ranging between 1*1 and 20*10 (rows/columns)."}, {"self_ref": "#/texts/128", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 4, "bbox": {"l": 50.11199951171875, "t": 691.0396118164062, "r": 286.3651428222656, "b": 478.8949279785156, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 983]}], "orig": "The availability of the bounding boxes for all table cells is essential to train our models. In order to distinguish between empty and non-empty bounding boxes, we have introduced a binary class in the annotation. Unfortunately, the original datasets either omit the bounding boxes for whole tables (e.g. TableBank) or they narrow their scope only to non-empty cells. Therefore, it was imperative to introduce a data pre-processing procedure that generates the missing bounding boxes out of the annotation information. This procedure first parses the provided table structure and calculates the dimensions of the most fine-grained grid that covers the table structure. Notice that each table cell may occupy multiple grid squares due to row or column spans. In case of PubTabNet we had to compute missing bounding boxes for 48% of the simple and 69% of the complex tables. Regarding FinTabNet, 68% of the simple and 98% of the complex tables require the generation of bounding boxes.", "text": "The availability of the bounding boxes for all table cells is essential to train our models. In order to distinguish between empty and non-empty bounding boxes, we have introduced a binary class in the annotation. Unfortunately, the original datasets either omit the bounding boxes for whole tables (e.g. TableBank) or they narrow their scope only to non-empty cells. Therefore, it was imperative to introduce a data pre-processing procedure that generates the missing bounding boxes out of the annotation information. This procedure first parses the provided table structure and calculates the dimensions of the most fine-grained grid that covers the table structure. Notice that each table cell may occupy multiple grid squares due to row or column spans. In case of PubTabNet we had to compute missing bounding boxes for 48% of the simple and 69% of the complex tables. Regarding FinTabNet, 68% of the simple and 98% of the complex tables require the generation of bounding boxes."}, {"self_ref": "#/texts/129", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 4, "bbox": {"l": 50.11199951171875, "t": 474.0044860839844, "r": 286.3651123046875, "b": 357.50103759765625, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 571]}], "orig": "As it is illustrated in Fig. 2, the table distributions from all datasets are skewed towards simpler structures with fewer number of rows/columns. Additionally, there is very limited variance in the table styles, which in case of PubTabNet and FinTabNet means one styling format for the majority of the tables. Similar limitations appear also in the type of table content, which in some cases (e.g. FinTabNet) is restricted to a certain domain. Ultimately, the lack of diversity in the training dataset damages the ability of the models to generalize well on unseen data.", "text": "As it is illustrated in Fig. 2, the table distributions from all datasets are skewed towards simpler structures with fewer number of rows/columns. Additionally, there is very limited variance in the table styles, which in case of PubTabNet and FinTabNet means one styling format for the majority of the tables. Similar limitations appear also in the type of table content, which in some cases (e.g. FinTabNet) is restricted to a certain domain. Ultimately, the lack of diversity in the training dataset damages the ability of the models to generalize well on unseen data."}, {"self_ref": "#/texts/130", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 4, "bbox": {"l": 50.11199951171875, "t": 352.610595703125, "r": 286.3665466308594, "b": 164.37611389160156, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 941]}], "orig": "Motivated by those observations we aimed at generating a synthetic table dataset named SynthTabNet . This approach offers control over: 1) the size of the dataset, 2) the table structure, 3) the table style and 4) the type of content. The complexity of the table structure is described by the size of the table header and the table body, as well as the percentage of the table cells covered by row spans and column spans. A set of carefully designed styling templates provides the basis to build a wide range of table appearances. Lastly, the table content is generated out of a curated collection of text corpora. By controlling the size and scope of the synthetic datasets we are able to train and evaluate our models in a variety of different conditions. For example, we can first generate a highly diverse dataset to train our models and then evaluate their performance on other synthetic datasets which are focused on a specific domain.", "text": "Motivated by those observations we aimed at generating a synthetic table dataset named SynthTabNet . This approach offers control over: 1) the size of the dataset, 2) the table structure, 3) the table style and 4) the type of content. The complexity of the table structure is described by the size of the table header and the table body, as well as the percentage of the table cells covered by row spans and column spans. A set of carefully designed styling templates provides the basis to build a wide range of table appearances. Lastly, the table content is generated out of a curated collection of text corpora. By controlling the size and scope of the synthetic datasets we are able to train and evaluate our models in a variety of different conditions. For example, we can first generate a highly diverse dataset to train our models and then evaluate their performance on other synthetic datasets which are focused on a specific domain."}, {"self_ref": "#/texts/131", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 4, "bbox": {"l": 50.11201477050781, "t": 159.4856719970703, "r": 286.3651123046875, "b": 78.84810638427734, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 405]}], "orig": "In this regard, we have prepared four synthetic datasets, each one containing 150k examples. The corpora to generate the table text consists of the most frequent terms appearing in PubTabNet and FinTabNet together with randomly generated text. The first two synthetic datasets have been fine-tuned to mimic the appearance of the original datasets but encompass more complicated table structures. The third", "text": "In this regard, we have prepared four synthetic datasets, each one containing 150k examples. The corpora to generate the table text consists of the most frequent terms appearing in PubTabNet and FinTabNet together with randomly generated text. The first two synthetic datasets have been fine-tuned to mimic the appearance of the original datasets but encompass more complicated table structures. The third"}, {"self_ref": "#/texts/132", "parent": {"cref": "#/body"}, "children": [], "label": "page_footer", "prov": [{"page_no": 4, "bbox": {"l": 295.1209716796875, "t": 57.86674880981445, "r": 300.1022644042969, "b": 48.96018600463867, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "4", "text": "4"}, {"self_ref": "#/texts/133", "parent": {"cref": "#/body"}, "children": [], "label": "caption", "prov": [{"page_no": 4, "bbox": {"l": 308.86199951171875, "t": 624.338623046875, "r": 545.1150512695312, "b": 567.6110229492188, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 267]}], "orig": "Table 1: Both \"Combined-Tabnet\" and \"CombinedTabnet\" are variations of the following: (*) The CombinedTabnet dataset is the processed combination of PubTabNet and Fintabnet. (**) The combined dataset is the processed combination of PubTabNet, Fintabnet and TableBank.", "text": "Table 1: Both \"Combined-Tabnet\" and \"CombinedTabnet\" are variations of the following: (*) The CombinedTabnet dataset is the processed combination of PubTabNet and Fintabnet. (**) The combined dataset is the processed combination of PubTabNet, Fintabnet and TableBank."}, {"self_ref": "#/texts/134", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 4, "bbox": {"l": 308.86199951171875, "t": 542.3795776367188, "r": 545.1151733398438, "b": 497.6080322265625, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 210]}], "orig": "one adopts a colorful appearance with high contrast and the last one contains tables with sparse content. Lastly, we have combined all synthetic datasets into one big unified synthetic dataset of 600k examples.", "text": "one adopts a colorful appearance with high contrast and the last one contains tables with sparse content. Lastly, we have combined all synthetic datasets into one big unified synthetic dataset of 600k examples."}, {"self_ref": "#/texts/135", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 4, "bbox": {"l": 320.8169860839844, "t": 494.22760009765625, "r": 542.7439575195312, "b": 485.321044921875, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 57]}], "orig": "Tab. 1 summarizes the various attributes of the datasets.", "text": "Tab. 1 summarizes the various attributes of the datasets."}, {"self_ref": "#/texts/136", "parent": {"cref": "#/body"}, "children": [], "label": "section_header", "prov": [{"page_no": 4, "bbox": {"l": 308.86199951171875, "t": 470.8160400390625, "r": 444.9360656738281, "b": 460.0683288574219, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 24]}], "orig": "4. The TableFormer model", "text": "4. The TableFormer model", "level": 1}, {"self_ref": "#/texts/137", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 4, "bbox": {"l": 308.86199951171875, "t": 450.06060791015625, "r": 545.115234375, "b": 345.5131530761719, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 504]}], "orig": "Given the image of a table, TableFormer is able to predict: 1) a sequence of tokens that represent the structure of a table, and 2) a bounding box coupled to a subset of those tokens. The conversion of an image into a sequence of tokens is a well-known task [35, 16]. While attention is often used as an implicit method to associate each token of the sequence with a position in the original image, an explicit association between the individual table-cells and the image bounding boxes is also required.", "text": "Given the image of a table, TableFormer is able to predict: 1) a sequence of tokens that represent the structure of a table, and 2) a bounding box coupled to a subset of those tokens. The conversion of an image into a sequence of tokens is a well-known task [35, 16]. While attention is often used as an implicit method to associate each token of the sequence with a position in the original image, an explicit association between the individual table-cells and the image bounding boxes is also required."}, {"self_ref": "#/texts/138", "parent": {"cref": "#/body"}, "children": [], "label": "section_header", "prov": [{"page_no": 4, "bbox": {"l": 308.86199951171875, "t": 334.30572509765625, "r": 420.16058349609375, "b": 324.45367431640625, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 24]}], "orig": "4.1. Model architecture.", "text": "4.1. Model architecture.", "level": 1}, {"self_ref": "#/texts/139", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 4, "bbox": {"l": 308.8619689941406, "t": 315.2347106933594, "r": 545.11572265625, "b": 127.00019073486328, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 907]}], "orig": "We now describe in detail the proposed method, which is composed of three main components, see Fig. 4. Our CNN Backbone Network encodes the input as a feature vector of predefined length. The input feature vector of the encoded image is passed to the Structure Decoder to produce a sequence of HTML tags that represent the structure of the table. With each prediction of an HTML standard data cell (' < td > ') the hidden state of that cell is passed to the Cell BBox Decoder. As for spanning cells, such as row or column span, the tag is broken down to ' < ', 'rowspan=' or 'colspan=', with the number of spanning cells (attribute), and ' > '. The hidden state attached to ' < ' is passed to the Cell BBox Decoder. A shared feed forward network (FFN) receives the hidden states from the Structure Decoder, to provide the final detection predictions of the bounding box coordinates and their classification.", "text": "We now describe in detail the proposed method, which is composed of three main components, see Fig. 4. Our CNN Backbone Network encodes the input as a feature vector of predefined length. The input feature vector of the encoded image is passed to the Structure Decoder to produce a sequence of HTML tags that represent the structure of the table. With each prediction of an HTML standard data cell (' < td > ') the hidden state of that cell is passed to the Cell BBox Decoder. As for spanning cells, such as row or column span, the tag is broken down to ' < ', 'rowspan=' or 'colspan=', with the number of spanning cells (attribute), and ' > '. The hidden state attached to ' < ' is passed to the Cell BBox Decoder. A shared feed forward network (FFN) receives the hidden states from the Structure Decoder, to provide the final detection predictions of the bounding box coordinates and their classification."}, {"self_ref": "#/texts/140", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 4, "bbox": {"l": 308.8619689941406, "t": 123.73930358886719, "r": 545.1151123046875, "b": 78.84818267822266, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 223]}], "orig": "CNN Backbone Network. A ResNet-18 CNN is the backbone that receives the table image and encodes it as a vector of predefined length. The network has been modified by removing the linear and pooling layer, as we are not per-", "text": "CNN Backbone Network. A ResNet-18 CNN is the backbone that receives the table image and encodes it as a vector of predefined length. The network has been modified by removing the linear and pooling layer, as we are not per-"}, {"self_ref": "#/texts/141", "parent": {"cref": "#/body"}, "children": [], "label": "caption", "prov": [{"page_no": 5, "bbox": {"l": 50.11199188232422, "t": 588.0142211914062, "r": 545.1084594726562, "b": 567.0330810546875, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 212]}], "orig": "Figure 3: TableFormer takes in an image of the PDF and creates bounding box and HTML structure predictions that are synchronized. The bounding boxes grabs the content from the PDF and inserts it in the structure.", "text": "Figure 3: TableFormer takes in an image of the PDF and creates bounding box and HTML structure predictions that are synchronized. The bounding boxes grabs the content from the PDF and inserts it in the structure."}, {"self_ref": "#/texts/142", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 81.688072, "t": 669.5603, "r": 84.927567, "b": 666.37109, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "1.", "text": "1."}, {"self_ref": "#/texts/143", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 86.54731, "t": 669.5603, "r": 93.026291, "b": 666.37109, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "Item", "text": "Item"}, {"self_ref": "#/texts/144", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 102.50498, "t": 676.74786, "r": 115.3461, "b": 673.55865, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 6]}], "orig": "Amount", "text": "Amount"}, {"self_ref": "#/texts/145", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 82.140205, "t": 676.7851, "r": 93.291527, "b": 673.59589, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 5]}], "orig": "Names", "text": "Names"}, {"self_ref": "#/texts/146", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 96.748268, "t": 669.5603, "r": 104.3119, "b": 666.37109, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "1000", "text": "1000"}, {"self_ref": "#/texts/147", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 96.748268, "t": 664.2562900000001, "r": 102.42083, "b": 661.06708, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 3]}], "orig": "500", "text": "500"}, {"self_ref": "#/texts/148", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 96.748268, "t": 658.54431, "r": 104.3119, "b": 655.3551, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "3500", "text": "3500"}, {"self_ref": "#/texts/149", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 96.748268, "t": 652.83228, "r": 102.42083, "b": 649.64307, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 3]}], "orig": "150", "text": "150"}, {"self_ref": "#/texts/150", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 110.66107, "t": 669.5603, "r": 116.14391, "b": 666.37109, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "unit", "text": "unit"}, {"self_ref": "#/texts/151", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 110.66107, "t": 664.2562900000001, "r": 116.14391, "b": 661.06708, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "unit", "text": "unit"}, {"self_ref": "#/texts/152", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 110.66107, "t": 658.54431, "r": 116.14391, "b": 655.3551, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "unit", "text": "unit"}, {"self_ref": "#/texts/153", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 110.66107, "t": 652.83228, "r": 116.14391, "b": 649.64307, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "unit", "text": "unit"}, {"self_ref": "#/texts/154", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 81.688072, "t": 664.2562900000001, "r": 84.927567, "b": 661.06708, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "2.", "text": "2."}, {"self_ref": "#/texts/155", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 86.54731, "t": 664.2562900000001, "r": 93.026291, "b": 661.06708, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "Item", "text": "Item"}, {"self_ref": "#/texts/156", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 81.688072, "t": 658.54431, "r": 84.927567, "b": 655.3551, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "3.", "text": "3."}, {"self_ref": "#/texts/157", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 86.54731, "t": 658.54431, "r": 93.026291, "b": 655.3551, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "Item", "text": "Item"}, {"self_ref": "#/texts/158", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 81.688072, "t": 652.83228, "r": 84.927567, "b": 649.64307, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "4.", "text": "4."}, {"self_ref": "#/texts/159", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 86.54731, "t": 652.83228, "r": 93.026291, "b": 649.64307, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "Item", "text": "Item"}, {"self_ref": "#/texts/160", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 88.084389, "t": 701.50262, "r": 113.93649, "b": 695.76202, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 9]}], "orig": "Extracted", "text": "Extracted"}, {"self_ref": "#/texts/161", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 82.81002, "t": 694.36261, "r": 119.21240000000002, "b": 688.62201, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 12]}], "orig": "Table Images", "text": "Table Images"}, {"self_ref": "#/texts/162", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 143.94247, "t": 691.39764, "r": 180.01131, "b": 685.65704, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 12]}], "orig": "Standardized", "text": "Standardized"}, {"self_ref": "#/texts/163", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 151.94064, "t": 684.25763, "r": 172.0118, "b": 678.5170299999999, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 6]}], "orig": "Images", "text": "Images"}, {"self_ref": "#/texts/164", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 251.76939000000002, "t": 711.0690300000001, "r": 266.39557, "b": 705.32843, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "BBox", "text": "BBox"}, {"self_ref": "#/texts/165", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 247.51601, "t": 705.96899, "r": 270.65021, "b": 700.22839, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 7]}], "orig": "Decoder", "text": "Decoder"}, {"self_ref": "#/texts/166", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 331.03699, "t": 713.44019, "r": 352.12589, "b": 707.69958, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 6]}], "orig": "BBoxes", "text": "BBoxes"}, {"self_ref": "#/texts/167", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 390.56421, "t": 695.96777, "r": 431.7261, "b": 690.2271700000001, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 13]}], "orig": "BBoxes can be", "text": "BBoxes can be"}, {"self_ref": "#/texts/168", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 386.82422, "t": 689.8477199999999, "r": 435.46966999999995, "b": 684.10712, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 18]}], "orig": "traced back to the", "text": "traced back to the"}, {"self_ref": "#/texts/169", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 388.69589, "t": 683.72772, "r": 433.6032400000001, "b": 677.9871199999999, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 17]}], "orig": "original image to", "text": "original image to"}, {"self_ref": "#/texts/170", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 391.07761, "t": 677.60773, "r": 431.22542999999996, "b": 671.8671300000001, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 15]}], "orig": "extract content", "text": "extract content"}, {"self_ref": "#/texts/171", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 431.22650000000004, "t": 640.31488, "r": 498.82068, "b": 634.57428, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 23]}], "orig": "Structure Tags sequence", "text": "Structure Tags sequence"}, {"self_ref": "#/texts/172", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 431.1738, "t": 634.19482, "r": 498.87753000000004, "b": 628.45422, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 27]}], "orig": "provide full description of", "text": "provide full description of"}, {"self_ref": "#/texts/173", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 440.5289, "t": 628.07483, "r": 489.51827999999995, "b": 622.33423, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 19]}], "orig": "the table structure", "text": "the table structure"}, {"self_ref": "#/texts/174", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 328.37479, "t": 613.74615, "r": 367.72333, "b": 608.00555, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 14]}], "orig": "Structure Tags", "text": "Structure Tags"}, {"self_ref": "#/texts/175", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 331.84451, "t": 668.09113, "r": 373.67963, "b": 662.3505199999998, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 14]}], "orig": "BBoxes in sync", "text": "BBoxes in sync"}, {"self_ref": "#/texts/176", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 331.84451, "t": 662.9911499999998, "r": 381.17786, "b": 657.25055, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 17]}], "orig": "with tag sequence", "text": "with tag sequence"}, {"self_ref": "#/texts/177", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 196.62633, "t": 703.88379, "r": 219.42332, "b": 698.14319, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 7]}], "orig": "Encoder", "text": "Encoder"}, {"self_ref": "#/texts/178", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 246.66771, "t": 662.5053099999999, "r": 271.49899, "b": 656.76471, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 9]}], "orig": "Structure", "text": "Structure"}, {"self_ref": "#/texts/179", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 247.51601, "t": 657.40527, "r": 270.65021, "b": 651.66467, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 7]}], "orig": "Decoder", "text": "Decoder"}, {"self_ref": "#/texts/180", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 330.63071, "t": 702.98077, "r": 365.55347, "b": 697.24017, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 16]}], "orig": "[x1, y2, x2, y2]", "text": "[x1, y2, x2, y2]"}, {"self_ref": "#/texts/181", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 330.63071, "t": 694.82074, "r": 370.22717, "b": 689.08014, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 20]}], "orig": "[x1', y2', x2', y2']", "text": "[x1', y2', x2', y2']"}, {"self_ref": "#/texts/182", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 330.63071, "t": 686.6607700000001, "r": 374.51157, "b": 680.92017, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 24]}], "orig": "[x1'', y2'', x2'', y2'']", "text": "[x1'', y2'', x2'', y2'']"}, {"self_ref": "#/texts/183", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 330.63071, "t": 678.5007300000001, "r": 335.73233, "b": 672.76013, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 3]}], "orig": "...", "text": "..."}, {"self_ref": "#/texts/184", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 322.30579, "t": 650.20764, "r": 335.05988, "b": 645.42383, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "<TR>", "text": "<TR>"}, {"self_ref": "#/texts/185", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 322.30579, "t": 643.06769, "r": 335.05988, "b": 638.28387, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "<TD>", "text": "<TD>"}, {"self_ref": "#/texts/186", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 337.54971, "t": 643.44421, "r": 340.95242, "b": 637.70361, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "1", "text": "1"}, {"self_ref": "#/texts/187", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 343.56262, "t": 643.06769, "r": 398.91446, "b": 638.28387, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 21]}], "orig": "</TD><TD colspan=\"2\">", "text": "</TD><TD colspan=\"2\">"}, {"self_ref": "#/texts/188", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 407.41718, "t": 643.06769, "r": 421.58801, "b": 638.28387, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 5]}], "orig": "</TD>", "text": "</TD>"}, {"self_ref": "#/texts/189", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 322.30579, "t": 635.92767, "r": 349.23022, "b": 631.14386, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 9]}], "orig": "</TR><TR>", "text": "</TR><TR>"}, {"self_ref": "#/texts/190", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 322.30579, "t": 628.78766, "r": 335.05988, "b": 624.00385, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "<TD>", "text": "<TD>"}, {"self_ref": "#/texts/191", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 343.56155, "t": 628.78766, "r": 374.73685, "b": 624.00385, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 12]}], "orig": "</TD><TD>...", "text": "</TD><TD>..."}, {"self_ref": "#/texts/192", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 322.30579, "t": 621.64764, "r": 326.55716, "b": 616.86383, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 3]}], "orig": "...", "text": "..."}, {"self_ref": "#/texts/193", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 323.51111, "t": 702.33032, "r": 326.91382, "b": 696.58972, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "1", "text": "1"}, {"self_ref": "#/texts/194", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 323.71509, "t": 694.21112, "r": 327.1178, "b": 688.47052, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "2", "text": "2"}, {"self_ref": "#/texts/195", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 323.71509, "t": 686.01031, "r": 327.1178, "b": 680.2697099999999, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "3", "text": "3"}, {"self_ref": "#/texts/196", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 401.4816, "t": 643.45374, "r": 404.88431, "b": 637.71313, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "2", "text": "2"}, {"self_ref": "#/texts/197", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 337.6976, "t": 629.31549, "r": 341.10031, "b": 623.57489, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "3", "text": "3"}, {"self_ref": "#/texts/198", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 454.46378, "t": 687.45416, "r": 457.86648999999994, "b": 681.7135599999999, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "3", "text": "3"}, {"self_ref": "#/texts/199", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 493.32580999999993, "t": 700.90454, "r": 496.72852, "b": 695.16394, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "2", "text": "2"}, {"self_ref": "#/texts/200", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 454.08298, "t": 701.4312099999999, "r": 457.48569000000003, "b": 695.69061, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "1", "text": "1"}, {"self_ref": "#/texts/201", "parent": {"cref": "#/body"}, "children": [], "label": "caption", "prov": [{"page_no": 5, "bbox": {"l": 50.11199951171875, "t": 264.2171936035156, "r": 286.365966796875, "b": 111.72905731201172, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 745]}], "orig": "Figure 4: Given an input image of a table, the Encoder produces fixed-length features that represent the input image. The features are then passed to both the Structure Decoder and Cell BBox Decoder . During training, the Structure Decoder receives 'tokenized tags' of the HTML code that represent the table structure. Afterwards, a transformer encoder and decoder architecture is employed to produce features that are received by a linear layer, and the Cell BBox Decoder. The linear layer is applied to the features to predict the tags. Simultaneously, the Cell BBox Decoder selects features referring to the data cells (' < td > ', ' < ') and passes them through an attention network, an MLP, and a linear layer to predict the bounding boxes.", "text": "Figure 4: Given an input image of a table, the Encoder produces fixed-length features that represent the input image. The features are then passed to both the Structure Decoder and Cell BBox Decoder . During training, the Structure Decoder receives 'tokenized tags' of the HTML code that represent the table structure. Afterwards, a transformer encoder and decoder architecture is employed to produce features that are received by a linear layer, and the Cell BBox Decoder. The linear layer is applied to the features to predict the tags. Simultaneously, the Cell BBox Decoder selects features referring to the data cells (' < td > ', ' < ') and passes them through an attention network, an MLP, and a linear layer to predict the bounding boxes."}, {"self_ref": "#/texts/202", "parent": {"cref": "#/pictures/5"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 74.253464, "t": 533.78528, "r": 101.75846, "b": 527.82526, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 11]}], "orig": "Input Image", "text": "Input Image"}, {"self_ref": "#/texts/203", "parent": {"cref": "#/pictures/5"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 122.29972, "t": 533.65479, "r": 157.83972, "b": 527.69476, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 14]}], "orig": "Tokenised Tags", "text": "Tokenised Tags"}, {"self_ref": "#/texts/204", "parent": {"cref": "#/pictures/5"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 78.549347, "t": 420.61420000000004, "r": 125.68359000000001, "b": 414.95218, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 20]}], "orig": "Multi-Head Attention", "text": "Multi-Head Attention"}, {"self_ref": "#/texts/205", "parent": {"cref": "#/pictures/5"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 78.513298, "t": 400.68143, "r": 84.644547, "b": 395.01941, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 3]}], "orig": "Add", "text": "Add"}, {"self_ref": "#/texts/206", "parent": {"cref": "#/pictures/5"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 116.52705, "t": 400.68143, "r": 125.11079999999998, "b": 395.01941, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 15]}], "orig": "& Normalisation", "text": "& Normalisation"}, {"self_ref": "#/texts/207", "parent": {"cref": "#/pictures/5"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 76.024773, "t": 367.54691, "r": 127.92327000000002, "b": 361.88489, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 20]}], "orig": "Feed Forward Network", "text": "Feed Forward Network"}, {"self_ref": "#/texts/208", "parent": {"cref": "#/pictures/5"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 78.382828, "t": 347.11044, "r": 84.514076, "b": 341.44843, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 3]}], "orig": "Add", "text": "Add"}, {"self_ref": "#/texts/209", "parent": {"cref": "#/pictures/5"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 116.39658, "t": 347.11044, "r": 124.98033, "b": 341.44843, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 15]}], "orig": "& Normalisation", "text": "& Normalisation"}, {"self_ref": "#/texts/210", "parent": {"cref": "#/pictures/5"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 167.46945, "t": 329.55676, "r": 181.6292, "b": 323.89474, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 6]}], "orig": "Linear", "text": "Linear"}, {"self_ref": "#/texts/211", "parent": {"cref": "#/pictures/5"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 165.61292, "t": 313.52893, "r": 184.43242, "b": 307.86691, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 7]}], "orig": "Softmax", "text": "Softmax"}, {"self_ref": "#/texts/212", "parent": {"cref": "#/pictures/5"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 65.319511, "t": 467.73764000000006, "r": 132.9245, "b": 461.77764999999994, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 20]}], "orig": "CNN BACKBONE ENCODER", "text": "CNN BACKBONE ENCODER"}, {"self_ref": "#/texts/213", "parent": {"cref": "#/pictures/5"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 119.51457, "t": 522.33606, "r": 162.98782, "b": 517.27008, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 21]}], "orig": "[30, 1, 2, 3, 4, \u2026 3,", "text": "[30, 1, 2, 3, 4, \u2026 3,"}, {"self_ref": "#/texts/214", "parent": {"cref": "#/pictures/5"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 128.72858, "t": 517.08606, "r": 151.41083, "b": 512.02008, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 12]}], "orig": "4, 5, 8, 31]", "text": "4, 5, 8, 31]"}, {"self_ref": "#/texts/215", "parent": {"cref": "#/pictures/5"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 60.434211999999995, "t": 453.04007, "r": 80.27021, "b": 447.73007, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 10]}], "orig": "Positional", "text": "Positional"}, {"self_ref": "#/texts/216", "parent": {"cref": "#/pictures/5"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 60.598457, "t": 448.61395, "r": 78.854958, "b": 443.30396, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 8]}], "orig": "Encoding", "text": "Encoding"}, {"self_ref": "#/texts/217", "parent": {"cref": "#/pictures/5"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 134.82877, "t": 498.62238, "r": 154.66476, "b": 493.31238, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 10]}], "orig": "Positional", "text": "Positional"}, {"self_ref": "#/texts/218", "parent": {"cref": "#/pictures/5"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 134.99303, "t": 494.19629000000003, "r": 153.24953, "b": 488.88629, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 8]}], "orig": "Encoding", "text": "Encoding"}, {"self_ref": "#/texts/219", "parent": {"cref": "#/pictures/5"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 150.55193, "t": 446.64139, "r": 197.14943, "b": 440.97937, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 19]}], "orig": "Add & Normalisation", "text": "Add & Normalisation"}, {"self_ref": "#/texts/220", "parent": {"cref": "#/pictures/5"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 150.55193, "t": 397.5766, "r": 156.68318, "b": 391.91458, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 3]}], "orig": "Add", "text": "Add"}, {"self_ref": "#/texts/221", "parent": {"cref": "#/pictures/5"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 188.56567, "t": 397.5766, "r": 197.14943, "b": 391.91458, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 15]}], "orig": "& Normalisation", "text": "& Normalisation"}, {"self_ref": "#/texts/222", "parent": {"cref": "#/pictures/5"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 150.18539, "t": 416.33157, "r": 197.31964, "b": 410.66956, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 20]}], "orig": "Multi-Head Attention", "text": "Multi-Head Attention"}, {"self_ref": "#/texts/223", "parent": {"cref": "#/pictures/5"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 150.55193, "t": 351.75152999999995, "r": 156.68318, "b": 346.08951, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 3]}], "orig": "Add", "text": "Add"}, {"self_ref": "#/texts/224", "parent": {"cref": "#/pictures/5"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 188.56567, "t": 351.75152999999995, "r": 197.14943, "b": 346.08951, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 15]}], "orig": "& Normalisation", "text": "& Normalisation"}, {"self_ref": "#/texts/225", "parent": {"cref": "#/pictures/5"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 147.86377, "t": 369.90665, "r": 199.76227, "b": 364.24463, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 20]}], "orig": "Feed Forward Network", "text": "Feed Forward Network"}, {"self_ref": "#/texts/226", "parent": {"cref": "#/pictures/5"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 241.56567000000004, "t": 477.73714999999993, "r": 255.72542, "b": 472.07513, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 6]}], "orig": "Linear", "text": "Linear"}, {"self_ref": "#/texts/227", "parent": {"cref": "#/pictures/5"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 241.91730000000004, "t": 430.63507, "r": 256.07706, "b": 424.97305, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 6]}], "orig": "Linear", "text": "Linear"}, {"self_ref": "#/texts/228", "parent": {"cref": "#/pictures/5"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 228.054, "t": 455.38070999999997, "r": 248.72363000000004, "b": 449.71869, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 9]}], "orig": "Attention", "text": "Attention"}, {"self_ref": "#/texts/229", "parent": {"cref": "#/pictures/5"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 246.2919, "t": 455.38070999999997, "r": 269.39325, "b": 449.71869, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 7]}], "orig": "Network", "text": "Network"}, {"self_ref": "#/texts/230", "parent": {"cref": "#/pictures/5"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 228.44568000000004, "t": 386.85318, "r": 238.73892, "b": 381.19116, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 3]}], "orig": "MLP", "text": "MLP"}, {"self_ref": "#/texts/231", "parent": {"cref": "#/pictures/5"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 256.29767, "t": 386.7967499999999, "r": 271.77792, "b": 381.13474, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 6]}], "orig": "Linear", "text": "Linear"}, {"self_ref": "#/texts/232", "parent": {"cref": "#/pictures/5"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 239.54543, "t": 409.78656, "r": 258.08942, "b": 404.12454, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 7]}], "orig": "Sigmoid", "text": "Sigmoid"}, {"self_ref": "#/texts/233", "parent": {"cref": "#/pictures/5"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 54.14704100000001, "t": 407.12817, "r": 59.51152, "b": 342.21674, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 27]}], "orig": "Transformer Encoder Network", "text": "Transformer Encoder Network"}, {"self_ref": "#/texts/234", "parent": {"cref": "#/pictures/5"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 54.235424, "t": 418.18768, "r": 59.30449699999999, "b": 413.54578000000004, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "x2", "text": "x2"}, {"self_ref": "#/texts/235", "parent": {"cref": "#/pictures/5"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 85.295891, "t": 307.46811, "r": 122.16431, "b": 301.63312, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 14]}], "orig": "Encoded Output", "text": "Encoded Output"}, {"self_ref": "#/texts/236", "parent": {"cref": "#/pictures/5"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 229.66599, "t": 512.45392, "r": 265.3194, "b": 506.54427999999996, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 14]}], "orig": "Encoded Output", "text": "Encoded Output"}, {"self_ref": "#/texts/237", "parent": {"cref": "#/pictures/5"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 157.17369, "t": 291.6969, "r": 190.41711, "b": 285.87057, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 14]}], "orig": "Predicted Tags", "text": "Predicted Tags"}, {"self_ref": "#/texts/238", "parent": {"cref": "#/pictures/5"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 227.81598999999997, "t": 353.94458, "r": 270.78442, "b": 348.10794, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 16]}], "orig": "Bounding Boxes &", "text": "Bounding Boxes &"}, {"self_ref": "#/texts/239", "parent": {"cref": "#/pictures/5"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 233.70262, "t": 347.93817, "r": 263.51105, "b": 342.1095000000001, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 14]}], "orig": "Classification", "text": "Classification"}, {"self_ref": "#/texts/240", "parent": {"cref": "#/pictures/5"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 184.74655, "t": 498.60498, "r": 212.16055, "b": 493.24097, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 11]}], "orig": "Transformer", "text": "Transformer"}, {"self_ref": "#/texts/241", "parent": {"cref": "#/pictures/5"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 178.91229, "t": 492.85498, "r": 216.74378999999996, "b": 487.49097, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 15]}], "orig": "Decoder Network", "text": "Decoder Network"}, {"self_ref": "#/texts/242", "parent": {"cref": "#/pictures/5"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 194.24574, "t": 509.2178, "r": 198.89099, "b": 504.15182000000004, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "x4", "text": "x4"}, {"self_ref": "#/texts/243", "parent": {"cref": "#/pictures/5"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 221.45587, "t": 520.13086, "r": 276.47089, "b": 514.17084, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 17]}], "orig": "CELL BBOX DECODER", "text": "CELL BBOX DECODER"}, {"self_ref": "#/texts/244", "parent": {"cref": "#/pictures/5"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 151.65219, "t": 468.55759, "r": 197.29019, "b": 462.89557, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 17]}], "orig": "Masked Multi-Head", "text": "Masked Multi-Head"}, {"self_ref": "#/texts/245", "parent": {"cref": "#/pictures/5"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 163.43277, "t": 462.55759, "r": 184.19028, "b": 456.89557, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 9]}], "orig": "Attention", "text": "Attention"}, {"self_ref": "#/texts/246", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 308.86199951171875, "t": 542.465576171875, "r": 545.1150512695312, "b": 497.69305419921875, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 227]}], "orig": "forming classification, and adding an adaptive pooling layer of size 28*28. ResNet by default downsamples the image resolution by 32 and then the encoded image is provided to both the Structure Decoder , and Cell BBox Decoder .", "text": "forming classification, and adding an adaptive pooling layer of size 28*28. ResNet by default downsamples the image resolution by 32 and then the encoded image is provided to both the Structure Decoder , and Cell BBox Decoder ."}, {"self_ref": "#/texts/247", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 308.8619384765625, "t": 494.6601867675781, "r": 545.1151123046875, "b": 378.0381774902344, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 563]}], "orig": "Structure Decoder. The transformer architecture of this component is based on the work proposed in [31]. After extensive experimentation, the Structure Decoder is modeled as a transformer encoder with two encoder layers and a transformer decoder made from a stack of 4 decoder layers that comprise mainly of multi-head attention and feed forward layers. This configuration uses fewer layers and heads in comparison to networks applied to other problems (e.g. \"Scene Understanding\", \"Image Captioning\"), something which we relate to the simplicity of table images.", "text": "Structure Decoder. The transformer architecture of this component is based on the work proposed in [31]. After extensive experimentation, the Structure Decoder is modeled as a transformer encoder with two encoder layers and a transformer decoder made from a stack of 4 decoder layers that comprise mainly of multi-head attention and feed forward layers. This configuration uses fewer layers and heads in comparison to networks applied to other problems (e.g. \"Scene Understanding\", \"Image Captioning\"), something which we relate to the simplicity of table images."}, {"self_ref": "#/texts/248", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 308.8619689941406, "t": 374.8857421875, "r": 545.1151123046875, "b": 246.4272918701172, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 592]}], "orig": "The transformer encoder receives an encoded image from the CNN Backbone Network and refines it through a multi-head dot-product attention layer, followed by a Feed Forward Network. During training, the transformer decoder receives as input the output feature produced by the transformer encoder, and the tokenized input of the HTML ground-truth tags. Using a stack of multi-head attention layers, different aspects of the tag sequence could be inferred. This is achieved by each attention head on a layer operating in a different subspace, and then combining altogether their attention score.", "text": "The transformer encoder receives an encoded image from the CNN Backbone Network and refines it through a multi-head dot-product attention layer, followed by a Feed Forward Network. During training, the transformer decoder receives as input the output feature produced by the transformer encoder, and the tokenized input of the HTML ground-truth tags. Using a stack of multi-head attention layers, different aspects of the tag sequence could be inferred. This is achieved by each attention head on a layer operating in a different subspace, and then combining altogether their attention score."}, {"self_ref": "#/texts/249", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 308.8619384765625, "t": 243.39540100097656, "r": 545.1151123046875, "b": 138.727294921875, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 483]}], "orig": "Cell BBox Decoder. Our architecture allows to simultaneously predict HTML tags and bounding boxes for each table cell without the need of a separate object detector end to end. This approach is inspired by DETR [1] which employs a Transformer Encoder, and Decoder that looks for a specific number of object queries (potential object detections). As our model utilizes a transformer architecture, the hidden state of the < td > ' and ' < ' HTML structure tags become the object query.", "text": "Cell BBox Decoder. Our architecture allows to simultaneously predict HTML tags and bounding boxes for each table cell without the need of a separate object detector end to end. This approach is inspired by DETR [1] which employs a Transformer Encoder, and Decoder that looks for a specific number of object queries (potential object detections). As our model utilizes a transformer architecture, the hidden state of the < td > ' and ' < ' HTML structure tags become the object query."}, {"self_ref": "#/texts/250", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 308.8619384765625, "t": 135.57484436035156, "r": 545.1150512695312, "b": 78.84827423095703, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 286]}], "orig": "The encoding generated by the CNN Backbone Network along with the features acquired for every data cell from the Transformer Decoder are then passed to the attention network. The attention network takes both inputs and learns to provide an attention weighted encoding. This weighted at-", "text": "The encoding generated by the CNN Backbone Network along with the features acquired for every data cell from the Transformer Decoder are then passed to the attention network. The attention network takes both inputs and learns to provide an attention weighted encoding. This weighted at-"}, {"self_ref": "#/texts/251", "parent": {"cref": "#/body"}, "children": [], "label": "page_footer", "prov": [{"page_no": 5, "bbox": {"l": 295.1209411621094, "t": 57.86684036254883, "r": 300.10223388671875, "b": 48.96027755737305, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "5", "text": "5"}, {"self_ref": "#/texts/252", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 6, "bbox": {"l": 50.11199951171875, "t": 716.7916259765625, "r": 286.3651428222656, "b": 636.1539916992188, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 380]}], "orig": "tention encoding is then multiplied to the encoded image to produce a feature for each table cell. Notice that this is different than the typical object detection problem where imbalances between the number of detections and the amount of objects may exist. In our case, we know up front that the produced detections always match with the table cells in number and correspondence.", "text": "tention encoding is then multiplied to the encoded image to produce a feature for each table cell. Notice that this is different than the typical object detection problem where imbalances between the number of detections and the amount of objects may exist. In our case, we know up front that the produced detections always match with the table cells in number and correspondence."}, {"self_ref": "#/texts/253", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 6, "bbox": {"l": 50.11199951171875, "t": 632.3755493164062, "r": 286.3651123046875, "b": 551.7369384765625, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 371]}], "orig": "The output features for each table cell are then fed into the feed-forward network (FFN). The FFN consists of a Multi-Layer Perceptron (3 layers with ReLU activation function) that predicts the normalized coordinates for the bounding box of each table cell. Finally, the predicted bounding boxes are classified based on whether they are empty or not using a linear layer.", "text": "The output features for each table cell are then fed into the feed-forward network (FFN). The FFN consists of a Multi-Layer Perceptron (3 layers with ReLU activation function) that predicts the normalized coordinates for the bounding box of each table cell. Finally, the predicted bounding boxes are classified based on whether they are empty or not using a linear layer."}, {"self_ref": "#/texts/254", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 6, "bbox": {"l": 50.11199951171875, "t": 548.0780639648438, "r": 286.36572265625, "b": 347.76910400390625, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 985]}], "orig": "Loss Functions. We formulate a multi-task loss Eq. 2 to train our network. The Cross-Entropy loss (denoted as l$_{s}$ ) is used to train the Structure Decoder which predicts the structure tokens. As for the Cell BBox Decoder it is trained with a combination of losses denoted as l$_{box}$ . l$_{box}$ consists of the generally used l$_{1}$ loss for object detection and the IoU loss ( l$_{iou}$ ) to be scale invariant as explained in [25]. In comparison to DETR, we do not use the Hungarian algorithm [15] to match the predicted bounding boxes with the ground-truth boxes, as we have already achieved a one-toone match through two steps: 1) Our token input sequence is naturally ordered, therefore the hidden states of the table data cells are also in order when they are provided as input to the Cell BBox Decoder , and 2) Our bounding boxes generation mechanism (see Sec. 3) ensures a one-to-one mapping between the cell content and its bounding box for all post-processed datasets.", "text": "Loss Functions. We formulate a multi-task loss Eq. 2 to train our network. The Cross-Entropy loss (denoted as l$_{s}$ ) is used to train the Structure Decoder which predicts the structure tokens. As for the Cell BBox Decoder it is trained with a combination of losses denoted as l$_{box}$ . l$_{box}$ consists of the generally used l$_{1}$ loss for object detection and the IoU loss ( l$_{iou}$ ) to be scale invariant as explained in [25]. In comparison to DETR, we do not use the Hungarian algorithm [15] to match the predicted bounding boxes with the ground-truth boxes, as we have already achieved a one-toone match through two steps: 1) Our token input sequence is naturally ordered, therefore the hidden states of the table data cells are also in order when they are provided as input to the Cell BBox Decoder , and 2) Our bounding boxes generation mechanism (see Sec. 3) ensures a one-to-one mapping between the cell content and its bounding box for all post-processed datasets."}, {"self_ref": "#/texts/255", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 6, "bbox": {"l": 50.112022399902344, "t": 343.9896545410156, "r": 286.364990234375, "b": 323.12811279296875, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 67]}], "orig": "The loss used to train the TableFormer can be defined as following:", "text": "The loss used to train the TableFormer can be defined as following:"}, {"self_ref": "#/texts/256", "parent": {"cref": "#/body"}, "children": [], "label": "formula", "prov": [{"page_no": 6, "bbox": {"l": 124.33001708984375, "t": 298.71905517578125, "r": 286.3624267578125, "b": 274.92828369140625, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 84]}], "orig": "l$_{box}$ = \u03bb$_{iou}$l$_{iou}$ + \u03bb$_{l}$$_{1}$ l = \u03bbl$_{s}$ + (1 - \u03bb ) l$_{box}$ (1)", "text": "l$_{box}$ = \u03bb$_{iou}$l$_{iou}$ + \u03bb$_{l}$$_{1}$ l = \u03bbl$_{s}$ + (1 - \u03bb ) l$_{box}$ (1)"}, {"self_ref": "#/texts/257", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 6, "bbox": {"l": 50.112030029296875, "t": 261.4079895019531, "r": 281.596923828125, "b": 251.78411865234375, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 76]}], "orig": "where \u03bb \u2208 [0, 1], and \u03bb$_{iou}$, \u03bb$_{l}$$_{1}$ \u2208$_{R}$ are hyper-parameters.", "text": "where \u03bb \u2208 [0, 1], and \u03bb$_{iou}$, \u03bb$_{l}$$_{1}$ \u2208$_{R}$ are hyper-parameters."}, {"self_ref": "#/texts/258", "parent": {"cref": "#/body"}, "children": [], "label": "section_header", "prov": [{"page_no": 6, "bbox": {"l": 50.11204528808594, "t": 236.08311462402344, "r": 171.9833526611328, "b": 225.33538818359375, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 23]}], "orig": "5. Experimental Results", "text": "5. Experimental Results", "level": 1}, {"self_ref": "#/texts/259", "parent": {"cref": "#/body"}, "children": [], "label": "section_header", "prov": [{"page_no": 6, "bbox": {"l": 50.11204528808594, "t": 215.7356719970703, "r": 179.17501831054688, "b": 205.8836212158203, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 27]}], "orig": "5.1. Implementation Details", "text": "5.1. Implementation Details", "level": 1}, {"self_ref": "#/texts/260", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 6, "bbox": {"l": 50.11204528808594, "t": 196.2656707763672, "r": 286.36517333984375, "b": 151.4931182861328, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 207]}], "orig": "TableFormer uses ResNet-18 as the CNN Backbone Network . The input images are resized to 448*448 pixels and the feature map has a dimension of 28*28. Additionally, we enforce the following input constraints:", "text": "TableFormer uses ResNet-18 as the CNN Backbone Network . The input images are resized to 448*448 pixels and the feature map has a dimension of 28*28. Additionally, we enforce the following input constraints:"}, {"self_ref": "#/texts/261", "parent": {"cref": "#/body"}, "children": [], "label": "formula", "prov": [{"page_no": 6, "bbox": {"l": 91.66104888916016, "t": 138.1719970703125, "r": 286.3624572753906, "b": 113.60411834716797, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 77]}], "orig": "Image width and height \u2264 1024 pixels Structural tags length \u2264 512 tokens. (2)", "text": "Image width and height \u2264 1024 pixels Structural tags length \u2264 512 tokens. (2)"}, {"self_ref": "#/texts/262", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 6, "bbox": {"l": 50.112060546875, "t": 99.70968627929688, "r": 286.3651428222656, "b": 78.8481216430664, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 117]}], "orig": "Although input constraints are used also by other methods, such as EDD, ours are less restrictive due to the improved", "text": "Although input constraints are used also by other methods, such as EDD, ours are less restrictive due to the improved"}, {"self_ref": "#/texts/263", "parent": {"cref": "#/body"}, "children": [], "label": "page_footer", "prov": [{"page_no": 6, "bbox": {"l": 295.12103271484375, "t": 57.86667251586914, "r": 300.1023254394531, "b": 48.96010971069336, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "6", "text": "6"}, {"self_ref": "#/texts/264", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 6, "bbox": {"l": 308.862060546875, "t": 716.7916870117188, "r": 545.115234375, "b": 683.97509765625, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 156]}], "orig": "runtime performance and lower memory footprint of TableFormer. This allows to utilize input samples with longer sequences and images with larger dimensions.", "text": "runtime performance and lower memory footprint of TableFormer. This allows to utilize input samples with longer sequences and images with larger dimensions."}, {"self_ref": "#/texts/265", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 6, "bbox": {"l": 308.862060546875, "t": 675.7706298828125, "r": 545.1152954101562, "b": 463.6259460449219, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1024]}], "orig": "The Transformer Encoder consists of two \"Transformer Encoder Layers\", with an input feature size of 512, feed forward network of 1024, and 4 attention heads. As for the Transformer Decoder it is composed of four \"Transformer Decoder Layers\" with similar input and output dimensions as the \"Transformer Encoder Layers\". Even though our model uses fewer layers and heads than the default implementation parameters, our extensive experimentation has proved this setup to be more suitable for table images. We attribute this finding to the inherent design of table images, which contain mostly lines and text, unlike the more elaborate content present in other scopes (e.g. the COCO dataset). Moreover, we have added ResNet blocks to the inputs of the Structure Decoder and Cell BBox Decoder. This prevents a decoder having a stronger influence over the learned weights which would damage the other prediction task (structure vs bounding boxes), but learn task specific weights instead. Lastly our dropout layers are set to 0.5.", "text": "The Transformer Encoder consists of two \"Transformer Encoder Layers\", with an input feature size of 512, feed forward network of 1024, and 4 attention heads. As for the Transformer Decoder it is composed of four \"Transformer Decoder Layers\" with similar input and output dimensions as the \"Transformer Encoder Layers\". Even though our model uses fewer layers and heads than the default implementation parameters, our extensive experimentation has proved this setup to be more suitable for table images. We attribute this finding to the inherent design of table images, which contain mostly lines and text, unlike the more elaborate content present in other scopes (e.g. the COCO dataset). Moreover, we have added ResNet blocks to the inputs of the Structure Decoder and Cell BBox Decoder. This prevents a decoder having a stronger influence over the learned weights which would damage the other prediction task (structure vs bounding boxes), but learn task specific weights instead. Lastly our dropout layers are set to 0.5."}, {"self_ref": "#/texts/266", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 6, "bbox": {"l": 308.8620300292969, "t": 455.4224853515625, "r": 545.1151733398438, "b": 362.83001708984375, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 419]}], "orig": "For training, TableFormer is trained with 3 Adam optimizers, each one for the CNN Backbone Network , Structure Decoder , and Cell BBox Decoder . Taking the PubTabNet as an example for our parameter set up, the initializing learning rate is 0.001 for 12 epochs with a batch size of 24, and \u03bb set to 0.5. Afterwards, we reduce the learning rate to 0.0001, the batch size to 18 and train for 12 more epochs or convergence.", "text": "For training, TableFormer is trained with 3 Adam optimizers, each one for the CNN Backbone Network , Structure Decoder , and Cell BBox Decoder . Taking the PubTabNet as an example for our parameter set up, the initializing learning rate is 0.001 for 12 epochs with a batch size of 24, and \u03bb set to 0.5. Afterwards, we reduce the learning rate to 0.0001, the batch size to 18 and train for 12 more epochs or convergence."}, {"self_ref": "#/texts/267", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 6, "bbox": {"l": 308.8620300292969, "t": 354.6255798339844, "r": 545.115234375, "b": 238.12310791015625, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 528]}], "orig": "TableFormer is implemented with PyTorch and Torchvision libraries [22]. To speed up the inference, the image undergoes a single forward pass through the CNN Backbone Network and transformer encoder. This eliminates the overhead of generating the same features for each decoding step. Similarly, we employ a 'caching' technique to preform faster autoregressive decoding. This is achieved by storing the features of decoded tokens so we can reuse them for each time step. Therefore, we only compute the attention for each new tag.", "text": "TableFormer is implemented with PyTorch and Torchvision libraries [22]. To speed up the inference, the image undergoes a single forward pass through the CNN Backbone Network and transformer encoder. This eliminates the overhead of generating the same features for each decoding step. Similarly, we employ a 'caching' technique to preform faster autoregressive decoding. This is achieved by storing the features of decoded tokens so we can reuse them for each time step. Therefore, we only compute the attention for each new tag."}, {"self_ref": "#/texts/268", "parent": {"cref": "#/body"}, "children": [], "label": "section_header", "prov": [{"page_no": 6, "bbox": {"l": 308.8620300292969, "t": 212.4456787109375, "r": 397.44281005859375, "b": 202.5936279296875, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 19]}], "orig": "5.2. Generalization", "text": "5.2. Generalization", "level": 1}, {"self_ref": "#/texts/269", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 6, "bbox": {"l": 308.8620300292969, "t": 188.55067443847656, "r": 545.1151733398438, "b": 119.86811065673828, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 299]}], "orig": "TableFormer is evaluated on three major publicly available datasets of different nature to prove the generalization and effectiveness of our model. The datasets used for evaluation are the PubTabNet, FinTabNet and TableBank which stem from the scientific, financial and general domains respectively.", "text": "TableFormer is evaluated on three major publicly available datasets of different nature to prove the generalization and effectiveness of our model. The datasets used for evaluation are the PubTabNet, FinTabNet and TableBank which stem from the scientific, financial and general domains respectively."}, {"self_ref": "#/texts/270", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 6, "bbox": {"l": 308.8620300292969, "t": 111.6646728515625, "r": 545.115234375, "b": 78.84710693359375, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 155]}], "orig": "We also share our baseline results on the challenging SynthTabNet dataset. Throughout our experiments, the same parameters stated in Sec. 5.1 are utilized.", "text": "We also share our baseline results on the challenging SynthTabNet dataset. Throughout our experiments, the same parameters stated in Sec. 5.1 are utilized."}, {"self_ref": "#/texts/271", "parent": {"cref": "#/body"}, "children": [], "label": "section_header", "prov": [{"page_no": 7, "bbox": {"l": 50.11199951171875, "t": 717.5986328125, "r": 167.89825439453125, "b": 707.74658203125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 25]}], "orig": "5.3. Datasets and Metrics", "text": "5.3. Datasets and Metrics", "level": 1}, {"self_ref": "#/texts/272", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 50.11199951171875, "t": 698.6495971679688, "r": 286.3651123046875, "b": 653.8770141601562, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 192]}], "orig": "The Tree-Edit-Distance-Based Similarity (TEDS) metric was introduced in [37]. It represents the prediction, and ground-truth as a tree structure of HTML tags. This similarity is calculated as:", "text": "The Tree-Edit-Distance-Based Similarity (TEDS) metric was introduced in [37]. It represents the prediction, and ground-truth as a tree structure of HTML tags. This similarity is calculated as:"}, {"self_ref": "#/texts/273", "parent": {"cref": "#/body"}, "children": [], "label": "formula", "prov": [{"page_no": 7, "bbox": {"l": 86.218994140625, "t": 641.6820068359375, "r": 286.3623962402344, "b": 619.26123046875, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 99]}], "orig": "TEDS ( T$_{a}$, T$_{b}$ ) = 1 - EditDist ( T$_{a}$, T$_{b}$ ) max ( | T$_{a}$ | , | T$_{b}$ | ) (3)", "text": "TEDS ( T$_{a}$, T$_{b}$ ) = 1 - EditDist ( T$_{a}$, T$_{b}$ ) max ( | T$_{a}$ | , | T$_{b}$ | ) (3)"}, {"self_ref": "#/texts/274", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 50.11198425292969, "t": 610.9970092773438, "r": 286.36285400390625, "b": 578.02099609375, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 162]}], "orig": "where T$_{a}$ and T$_{b}$ represent tables in tree structure HTML format. EditDist denotes the tree-edit distance, and | T | represents the number of nodes in T .", "text": "where T$_{a}$ and T$_{b}$ represent tables in tree structure HTML format. EditDist denotes the tree-edit distance, and | T | represents the number of nodes in T ."}, {"self_ref": "#/texts/275", "parent": {"cref": "#/body"}, "children": [], "label": "section_header", "prov": [{"page_no": 7, "bbox": {"l": 50.11199951171875, "t": 567.1805419921875, "r": 170.45169067382812, "b": 557.3284912109375, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 26]}], "orig": "5.4. Quantitative Analysis", "text": "5.4. Quantitative Analysis", "level": 1}, {"self_ref": "#/texts/276", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 50.11199951171875, "t": 548.35009765625, "r": 286.3651428222656, "b": 395.862060546875, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 723]}], "orig": "Structure. As shown in Tab. 2, TableFormer outperforms all SOTA methods across different datasets by a large margin for predicting the table structure from an image. All the more, our model outperforms pre-trained methods. During the evaluation we do not apply any table filtering. We also provide our baseline results on the SynthTabNet dataset. It has been observed that large tables (e.g. tables that occupy half of the page or more) yield poor predictions. We attribute this issue to the image resizing during the preprocessing step, that produces downsampled images with indistinguishable features. This problem can be addressed by treating such big tables with a separate model which accepts a large input image size.", "text": "Structure. As shown in Tab. 2, TableFormer outperforms all SOTA methods across different datasets by a large margin for predicting the table structure from an image. All the more, our model outperforms pre-trained methods. During the evaluation we do not apply any table filtering. We also provide our baseline results on the SynthTabNet dataset. It has been observed that large tables (e.g. tables that occupy half of the page or more) yield poor predictions. We attribute this issue to the image resizing during the preprocessing step, that produces downsampled images with indistinguishable features. This problem can be addressed by treating such big tables with a separate model which accepts a large input image size."}, {"self_ref": "#/texts/277", "parent": {"cref": "#/body"}, "children": [], "label": "caption", "prov": [{"page_no": 7, "bbox": {"l": 50.11199951171875, "t": 199.56663513183594, "r": 286.3651123046875, "b": 178.705078125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 101]}], "orig": "Table 2: Structure results on PubTabNet (PTN), FinTabNet (FTN), TableBank (TB) and SynthTabNet (STN).", "text": "Table 2: Structure results on PubTabNet (PTN), FinTabNet (FTN), TableBank (TB) and SynthTabNet (STN)."}, {"self_ref": "#/texts/278", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 50.11199951171875, "t": 175.65663146972656, "r": 261.7873229980469, "b": 166.7500762939453, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 50]}], "orig": "FT: Model was trained on PubTabNet then finetuned.", "text": "FT: Model was trained on PubTabNet then finetuned."}, {"self_ref": "#/texts/279", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 50.11201477050781, "t": 147.6501922607422, "r": 286.3659973144531, "b": 78.84806823730469, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 346]}], "orig": "Cell Detection. Like any object detector, our Cell BBox Detector provides bounding boxes that can be improved with post-processing during inference. We make use of the grid-like structure of tables to refine the predictions. A detailed explanation on the post-processing is available in the supplementary material. As shown in Tab. 3, we evaluate", "text": "Cell Detection. Like any object detector, our Cell BBox Detector provides bounding boxes that can be improved with post-processing during inference. We make use of the grid-like structure of tables to refine the predictions. A detailed explanation on the post-processing is available in the supplementary material. As shown in Tab. 3, we evaluate"}, {"self_ref": "#/texts/280", "parent": {"cref": "#/body"}, "children": [], "label": "page_footer", "prov": [{"page_no": 7, "bbox": {"l": 295.1210021972656, "t": 57.866641998291016, "r": 300.102294921875, "b": 48.960079193115234, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "7", "text": "7"}, {"self_ref": "#/texts/281", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 308.86199951171875, "t": 716.7916259765625, "r": 545.1151733398438, "b": 564.4229125976562, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 737]}], "orig": "our Cell BBox Decoder accuracy for cells with a class label of 'content' only using the PASCAL VOC mAP metric for pre-processing and post-processing. Note that we do not have post-processing results for SynthTabNet as images are only provided. To compare the performance of our proposed approach, we've integrated TableFormer's Cell BBox Decoder into EDD architecture. As mentioned previously, the Structure Decoder provides the Cell BBox Decoder with the features needed to predict the bounding box predictions. Therefore, the accuracy of the Structure Decoder directly influences the accuracy of the Cell BBox Decoder . If the Structure Decoder predicts an extra column, this will result in an extra column of predicted bounding boxes.", "text": "our Cell BBox Decoder accuracy for cells with a class label of 'content' only using the PASCAL VOC mAP metric for pre-processing and post-processing. Note that we do not have post-processing results for SynthTabNet as images are only provided. To compare the performance of our proposed approach, we've integrated TableFormer's Cell BBox Decoder into EDD architecture. As mentioned previously, the Structure Decoder provides the Cell BBox Decoder with the features needed to predict the bounding box predictions. Therefore, the accuracy of the Structure Decoder directly influences the accuracy of the Cell BBox Decoder . If the Structure Decoder predicts an extra column, this will result in an extra column of predicted bounding boxes."}, {"self_ref": "#/texts/282", "parent": {"cref": "#/body"}, "children": [], "label": "caption", "prov": [{"page_no": 7, "bbox": {"l": 308.86199951171875, "t": 475.5506896972656, "r": 545.1151733398438, "b": 454.68914794921875, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 94]}], "orig": "Table 3: Cell Bounding Box detection results on PubTabNet, and FinTabNet. PP: Post-processing.", "text": "Table 3: Cell Bounding Box detection results on PubTabNet, and FinTabNet. PP: Post-processing."}, {"self_ref": "#/texts/283", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 308.8619689941406, "t": 424.3202819824219, "r": 545.1156616210938, "b": 271.8323059082031, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 715]}], "orig": "Cell Content. In this section, we evaluate the entire pipeline of recovering a table with content. Here we put our approach to test by capitalizing on extracting content from the PDF cells rather than decoding from images. Tab. 4 shows the TEDs score of HTML code representing the structure of the table along with the content inserted in the data cell and compared with the ground-truth. Our method achieved a 5.3% increase over the state-of-the-art, and commercial solutions. We believe our scores would be higher if the HTML ground-truth matched the extracted PDF cell content. Unfortunately, there are small discrepancies such as spacings around words or special characters with various unicode representations.", "text": "Cell Content. In this section, we evaluate the entire pipeline of recovering a table with content. Here we put our approach to test by capitalizing on extracting content from the PDF cells rather than decoding from images. Tab. 4 shows the TEDs score of HTML code representing the structure of the table along with the content inserted in the data cell and compared with the ground-truth. Our method achieved a 5.3% increase over the state-of-the-art, and commercial solutions. We believe our scores would be higher if the HTML ground-truth matched the extracted PDF cell content. Unfortunately, there are small discrepancies such as spacings around words or special characters with various unicode representations."}, {"self_ref": "#/texts/284", "parent": {"cref": "#/body"}, "children": [], "label": "caption", "prov": [{"page_no": 7, "bbox": {"l": 308.86199951171875, "t": 135.13864135742188, "r": 545.1151733398438, "b": 102.32206726074219, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 148]}], "orig": "Table 4: Results of structure with content retrieved using cell detection on PubTabNet. In all cases the input is PDF documents with cropped tables.", "text": "Table 4: Results of structure with content retrieved using cell detection on PubTabNet. In all cases the input is PDF documents with cropped tables."}, {"self_ref": "#/texts/285", "parent": {"cref": "#/groups/4"}, "children": [], "label": "list_item", "prov": [{"page_no": 8, "bbox": {"l": 53.28603744506836, "t": 713.3124389648438, "r": 61.550289154052734, "b": 705.4392700195312, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "a.", "text": "a.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/286", "parent": {"cref": "#/groups/4"}, "children": [], "label": "list_item", "prov": [{"page_no": 8, "bbox": {"l": 65.68241882324219, "t": 713.3124389648438, "r": 499.5556335449219, "b": 705.4392700195312, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 105]}], "orig": "Red - PDF cells, Green - predicted bounding boxes, Blue - post-processed predictions matched to PDF cells", "text": "Red - PDF cells, Green - predicted bounding boxes, Blue - post-processed predictions matched to PDF cells", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/287", "parent": {"cref": "#/body"}, "children": [], "label": "section_header", "prov": [{"page_no": 8, "bbox": {"l": 53.81178283691406, "t": 697.7188720703125, "r": 284.3459167480469, "b": 689.845703125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 53]}], "orig": "Japanese language (previously unseen by TableFormer):", "text": "Japanese language (previously unseen by TableFormer):", "level": 1}, {"self_ref": "#/texts/288", "parent": {"cref": "#/body"}, "children": [], "label": "section_header", "prov": [{"page_no": 8, "bbox": {"l": 304.830810546875, "t": 697.7188720703125, "r": 431.0911865234375, "b": 689.845703125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 29]}], "orig": "Example table from FinTabNet:", "text": "Example table from FinTabNet:", "level": 1}, {"self_ref": "#/texts/289", "parent": {"cref": "#/body"}, "children": [], "label": "caption", "prov": [{"page_no": 8, "bbox": {"l": 53.81178283691406, "t": 583.7667236328125, "r": 385.93450927734375, "b": 575.8935546875, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 79]}], "orig": "b. Structure predicted by TableFormer, with superimposed matched PDF cell text:", "text": "b. Structure predicted by TableFormer, with superimposed matched PDF cell text:"}, {"self_ref": "#/texts/290", "parent": {"cref": "#/body"}, "children": [], "label": "caption", "prov": [{"page_no": 8, "bbox": {"l": 380.42730712890625, "t": 499.69573974609375, "r": 549.4217529296875, "b": 493.39715576171875, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 53]}], "orig": "Text is aligned to match original for ease of viewing", "text": "Text is aligned to match original for ease of viewing"}, {"self_ref": "#/texts/291", "parent": {"cref": "#/body"}, "children": [], "label": "caption", "prov": [{"page_no": 8, "bbox": {"l": 50.11199951171875, "t": 471.1226501464844, "r": 545.11376953125, "b": 426.3501281738281, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 397]}], "orig": "Figure 5: One of the benefits of TableFormer is that it is language agnostic, as an example, the left part of the illustration demonstrates TableFormer predictions on previously unseen language (Japanese). Additionally, we see that TableFormer is robust to variability in style and content, right side of the illustration shows the example of the TableFormer prediction from the FinTabNet dataset.", "text": "Figure 5: One of the benefits of TableFormer is that it is language agnostic, as an example, the left part of the illustration demonstrates TableFormer predictions on previously unseen language (Japanese). Additionally, we see that TableFormer is robust to variability in style and content, right side of the illustration shows the example of the TableFormer prediction from the FinTabNet dataset."}, {"self_ref": "#/texts/292", "parent": {"cref": "#/pictures/8"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 53.715248, "t": 410.22278, "r": 85.657333, "b": 405.55719, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 12]}], "orig": "Ground Truth", "text": "Ground Truth"}, {"self_ref": "#/texts/293", "parent": {"cref": "#/pictures/9"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 437.37939, "t": 391.44705, "r": 443.69870000000003, "b": 385.12842, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "16", "text": "16"}, {"self_ref": "#/texts/294", "parent": {"cref": "#/pictures/9"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 450.33203, "t": 391.44705, "r": 456.6513100000001, "b": 385.12842, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "17", "text": "17"}, {"self_ref": "#/texts/295", "parent": {"cref": "#/pictures/9"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 463.28464, "t": 391.44705, "r": 469.60394, "b": 385.12842, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "18", "text": "18"}, {"self_ref": "#/texts/296", "parent": {"cref": "#/pictures/9"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 476.23724000000004, "t": 391.44705, "r": 482.5565500000001, "b": 385.12842, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "19", "text": "19"}, {"self_ref": "#/texts/297", "parent": {"cref": "#/pictures/9"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 489.18988, "t": 391.44705, "r": 495.50916, "b": 385.12842, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "20", "text": "20"}, {"self_ref": "#/texts/298", "parent": {"cref": "#/pictures/9"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 502.14251999999993, "t": 391.44705, "r": 508.46178999999995, "b": 385.12842, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "21", "text": "21"}, {"self_ref": "#/texts/299", "parent": {"cref": "#/pictures/9"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 515.09509, "t": 391.44705, "r": 521.41443, "b": 385.12842, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "22", "text": "22"}, {"self_ref": "#/texts/300", "parent": {"cref": "#/pictures/9"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 385.2814, "t": 380.96163999999993, "r": 391.60071, "b": 374.64301, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "23", "text": "23"}, {"self_ref": "#/texts/301", "parent": {"cref": "#/pictures/9"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 398.52341, "t": 380.96163999999993, "r": 404.84271, "b": 374.64301, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "24", "text": "24"}, {"self_ref": "#/texts/302", "parent": {"cref": "#/pictures/9"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 411.47604, "t": 380.96163999999993, "r": 417.79535, "b": 374.64301, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "25", "text": "25"}, {"self_ref": "#/texts/303", "parent": {"cref": "#/pictures/9"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 437.37939, "t": 380.96163999999993, "r": 443.69870000000003, "b": 374.64301, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "26", "text": "26"}, {"self_ref": "#/texts/304", "parent": {"cref": "#/pictures/9"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 450.33203, "t": 380.96163999999993, "r": 456.6513100000001, "b": 374.64301, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "27", "text": "27"}, {"self_ref": "#/texts/305", "parent": {"cref": "#/pictures/9"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 463.28464, "t": 380.96163999999993, "r": 469.60394, "b": 374.64301, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "28", "text": "28"}, {"self_ref": "#/texts/306", "parent": {"cref": "#/pictures/9"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 385.2814, "t": 370.9303, "r": 391.60071, "b": 364.61166, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "30", "text": "30"}, {"self_ref": "#/texts/307", "parent": {"cref": "#/pictures/9"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 398.52341, "t": 370.9303, "r": 404.84271, "b": 364.61166, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "31", "text": "31"}, {"self_ref": "#/texts/308", "parent": {"cref": "#/pictures/9"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 411.47604, "t": 370.9303, "r": 417.79532, "b": 364.61166, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "32", "text": "32"}, {"self_ref": "#/texts/309", "parent": {"cref": "#/pictures/9"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 424.42865, "t": 370.9303, "r": 430.74796, "b": 364.61166, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "33", "text": "33"}, {"self_ref": "#/texts/310", "parent": {"cref": "#/pictures/9"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 437.38129, "t": 370.9303, "r": 443.70056, "b": 364.61166, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "34", "text": "34"}, {"self_ref": "#/texts/311", "parent": {"cref": "#/pictures/9"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 450.33389000000005, "t": 370.9303, "r": 456.65319999999997, "b": 364.61166, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "35", "text": "35"}, {"self_ref": "#/texts/312", "parent": {"cref": "#/pictures/9"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 463.2865, "t": 370.9303, "r": 469.6058, "b": 364.61166, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "36", "text": "36"}, {"self_ref": "#/texts/313", "parent": {"cref": "#/pictures/9"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 476.23914, "t": 370.9303, "r": 482.55841, "b": 364.61166, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "37", "text": "37"}, {"self_ref": "#/texts/314", "parent": {"cref": "#/pictures/9"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 489.1917700000001, "t": 370.9303, "r": 495.51105, "b": 364.61166, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "38", "text": "38"}, {"self_ref": "#/texts/315", "parent": {"cref": "#/pictures/9"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 502.14438, "t": 370.9303, "r": 508.46368, "b": 364.61166, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "39", "text": "39"}, {"self_ref": "#/texts/316", "parent": {"cref": "#/pictures/9"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 515.09705, "t": 370.9303, "r": 521.41632, "b": 364.61166, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "40", "text": "40"}, {"self_ref": "#/texts/317", "parent": {"cref": "#/pictures/9"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 528.04962, "t": 370.9303, "r": 534.3689, "b": 364.61166, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "41", "text": "41"}, {"self_ref": "#/texts/318", "parent": {"cref": "#/pictures/9"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 385.2814, "t": 359.95569, "r": 391.60071, "b": 353.63705, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "42", "text": "42"}, {"self_ref": "#/texts/319", "parent": {"cref": "#/pictures/9"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 398.52341, "t": 359.95569, "r": 404.84271, "b": 353.63705, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "43", "text": "43"}, {"self_ref": "#/texts/320", "parent": {"cref": "#/pictures/9"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 411.47604, "t": 359.95569, "r": 417.79532, "b": 353.63705, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "44", "text": "44"}, {"self_ref": "#/texts/321", "parent": {"cref": "#/pictures/9"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 424.42865, "t": 359.95569, "r": 430.74796, "b": 353.63705, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "45", "text": "45"}, {"self_ref": "#/texts/322", "parent": {"cref": "#/pictures/9"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 437.38129, "t": 359.95569, "r": 443.70056, "b": 353.63705, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "46", "text": "46"}, {"self_ref": "#/texts/323", "parent": {"cref": "#/pictures/9"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 450.33389000000005, "t": 359.95569, "r": 456.65319999999997, "b": 353.63705, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "47", "text": "47"}, {"self_ref": "#/texts/324", "parent": {"cref": "#/pictures/9"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 463.2865, "t": 359.95569, "r": 469.6058, "b": 353.63705, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "48", "text": "48"}, {"self_ref": "#/texts/325", "parent": {"cref": "#/pictures/9"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 476.23914, "t": 359.95569, "r": 482.55841, "b": 353.63705, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "49", "text": "49"}, {"self_ref": "#/texts/326", "parent": {"cref": "#/pictures/9"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 489.1917700000001, "t": 359.95569, "r": 495.51105, "b": 353.63705, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "50", "text": "50"}, {"self_ref": "#/texts/327", "parent": {"cref": "#/pictures/9"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 502.14438, "t": 359.95569, "r": 508.46368, "b": 353.63705, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "51", "text": "51"}, {"self_ref": "#/texts/328", "parent": {"cref": "#/pictures/9"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 515.09705, "t": 359.95569, "r": 521.41632, "b": 353.63705, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "52", "text": "52"}, {"self_ref": "#/texts/329", "parent": {"cref": "#/pictures/9"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 528.04962, "t": 359.95569, "r": 534.3689, "b": 353.63705, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "53", "text": "53"}, {"self_ref": "#/texts/330", "parent": {"cref": "#/pictures/9"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 385.2814, "t": 402.79996, "r": 388.44073, "b": 396.48132, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "0", "text": "0"}, {"self_ref": "#/texts/331", "parent": {"cref": "#/pictures/9"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 398.52341, "t": 402.79996, "r": 401.68274, "b": 396.48132, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "1", "text": "1"}, {"self_ref": "#/texts/332", "parent": {"cref": "#/pictures/9"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 411.4754, "t": 402.79996, "r": 414.63474, "b": 396.48132, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "2", "text": "2"}, {"self_ref": "#/texts/333", "parent": {"cref": "#/pictures/9"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 424.4274, "t": 402.79996, "r": 427.58673, "b": 396.48132, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "3", "text": "3"}, {"self_ref": "#/texts/334", "parent": {"cref": "#/pictures/9"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 437.37939, "t": 402.79996, "r": 440.53870000000006, "b": 396.48132, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "4", "text": "4"}, {"self_ref": "#/texts/335", "parent": {"cref": "#/pictures/9"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 450.33136, "t": 402.79996, "r": 453.49069000000003, "b": 396.48132, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "5", "text": "5"}, {"self_ref": "#/texts/336", "parent": {"cref": "#/pictures/9"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 463.28336, "t": 402.79996, "r": 466.44269, "b": 396.48132, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "6", "text": "6"}, {"self_ref": "#/texts/337", "parent": {"cref": "#/pictures/9"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 476.23535, "t": 402.79996, "r": 479.39468, "b": 396.48132, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "7", "text": "7"}, {"self_ref": "#/texts/338", "parent": {"cref": "#/pictures/9"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 489.18735, "t": 402.79996, "r": 492.34668, "b": 396.48132, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "8", "text": "8"}, {"self_ref": "#/texts/339", "parent": {"cref": "#/pictures/9"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 502.13933999999995, "t": 402.79996, "r": 505.29868000000005, "b": 396.48132, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "9", "text": "9"}, {"self_ref": "#/texts/340", "parent": {"cref": "#/pictures/9"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 515.09131, "t": 402.79996, "r": 521.41064, "b": 396.48132, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "10", "text": "10"}, {"self_ref": "#/texts/341", "parent": {"cref": "#/pictures/9"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 528.04364, "t": 402.79996, "r": 534.13104, "b": 396.48132, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "11", "text": "11"}, {"self_ref": "#/texts/342", "parent": {"cref": "#/pictures/9"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 385.2814, "t": 393.02536, "r": 391.60071, "b": 386.70673, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "12", "text": "12"}, {"self_ref": "#/texts/343", "parent": {"cref": "#/pictures/9"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 398.52341, "t": 393.02536, "r": 404.84271, "b": 386.70673, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "13", "text": "13"}, {"self_ref": "#/texts/344", "parent": {"cref": "#/pictures/9"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 411.47604, "t": 393.02536, "r": 417.79535, "b": 386.70673, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "14", "text": "14"}, {"self_ref": "#/texts/345", "parent": {"cref": "#/pictures/9"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 424.42719, "t": 385.22536999999994, "r": 430.74648999999994, "b": 378.90674, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "15", "text": "15"}, {"self_ref": "#/texts/346", "parent": {"cref": "#/pictures/9"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 502.86941999999993, "t": 381.00562, "r": 509.18871999999993, "b": 374.68698, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "29", "text": "29"}, {"self_ref": "#/texts/347", "parent": {"cref": "#/pictures/9"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 384.35437, "t": 410.22278, "r": 430.99261, "b": 405.55719, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 19]}], "orig": "Predicted Structure", "text": "Predicted Structure"}, {"self_ref": "#/texts/348", "parent": {"cref": "#/body"}, "children": [], "label": "caption", "prov": [{"page_no": 8, "bbox": {"l": 62.595001220703125, "t": 333.2716369628906, "r": 532.6304931640625, "b": 324.3650817871094, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 112]}], "orig": "Figure 6: An example of TableFormer predictions (bounding boxes and structure) from generated SynthTabNet table.", "text": "Figure 6: An example of TableFormer predictions (bounding boxes and structure) from generated SynthTabNet table."}, {"self_ref": "#/texts/349", "parent": {"cref": "#/pictures/10"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 220.26282, "t": 410.22278, "r": 342.07819, "b": 405.55719, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 49]}], "orig": "Red - PDF cells, Green - predicted bounding boxes", "text": "Red - PDF cells, Green - predicted bounding boxes"}, {"self_ref": "#/texts/350", "parent": {"cref": "#/body"}, "children": [], "label": "section_header", "prov": [{"page_no": 8, "bbox": {"l": 50.11199951171875, "t": 300.6046447753906, "r": 163.75579833984375, "b": 290.7525939941406, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 25]}], "orig": "5.5. Qualitative Analysis", "text": "5.5. Qualitative Analysis", "level": 1}, {"self_ref": "#/texts/351", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 50.11199951171875, "t": 255.1266326904297, "r": 286.3651123046875, "b": 78.84805297851562, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 866]}], "orig": "We showcase several visualizations for the different components of our network on various \"complex\" tables within datasets presented in this work in Fig. 5 and Fig. 6 As it is shown, our model is able to predict bounding boxes for all table cells, even for the empty ones. Additionally, our post-processing techniques can extract the cell content by matching the predicted bounding boxes to the PDF cells based on their overlap and spatial proximity. The left part of Fig. 5 demonstrates also the adaptability of our method to any language, as it can successfully extract Japanese text, although the training set contains only English content. We provide more visualizations including the intermediate steps in the supplementary material. Overall these illustrations justify the versatility of our method across a diverse range of table appearances and content type.", "text": "We showcase several visualizations for the different components of our network on various \"complex\" tables within datasets presented in this work in Fig. 5 and Fig. 6 As it is shown, our model is able to predict bounding boxes for all table cells, even for the empty ones. Additionally, our post-processing techniques can extract the cell content by matching the predicted bounding boxes to the PDF cells based on their overlap and spatial proximity. The left part of Fig. 5 demonstrates also the adaptability of our method to any language, as it can successfully extract Japanese text, although the training set contains only English content. We provide more visualizations including the intermediate steps in the supplementary material. Overall these illustrations justify the versatility of our method across a diverse range of table appearances and content type."}, {"self_ref": "#/texts/352", "parent": {"cref": "#/body"}, "children": [], "label": "section_header", "prov": [{"page_no": 8, "bbox": {"l": 308.86199951171875, "t": 301.29107666015625, "r": 460.8484802246094, "b": 290.5433654785156, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 27]}], "orig": "6. Future Work & Conclusion", "text": "6. Future Work & Conclusion", "level": 1}, {"self_ref": "#/texts/353", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 308.86199951171875, "t": 279.10662841796875, "r": 545.1151733398438, "b": 138.69407653808594, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 640]}], "orig": "In this paper, we presented TableFormer an end-to-end transformer based approach to predict table structures and bounding boxes of cells from an image. This approach enables us to recreate the table structure, and extract the cell content from PDF or OCR by using bounding boxes. Additionally, it provides the versatility required in real-world scenarios when dealing with various types of PDF documents, and languages. Furthermore, our method outperforms all state-of-the-arts with a wide margin. Finally, we introduce \"SynthTabNet\" a challenging synthetically generated dataset that reinforces missing characteristics from other datasets.", "text": "In this paper, we presented TableFormer an end-to-end transformer based approach to predict table structures and bounding boxes of cells from an image. This approach enables us to recreate the table structure, and extract the cell content from PDF or OCR by using bounding boxes. Additionally, it provides the versatility required in real-world scenarios when dealing with various types of PDF documents, and languages. Furthermore, our method outperforms all state-of-the-arts with a wide margin. Finally, we introduce \"SynthTabNet\" a challenging synthetically generated dataset that reinforces missing characteristics from other datasets."}, {"self_ref": "#/texts/354", "parent": {"cref": "#/body"}, "children": [], "label": "section_header", "prov": [{"page_no": 8, "bbox": {"l": 308.86199951171875, "t": 119.90107727050781, "r": 364.4058532714844, "b": 109.15335845947266, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 10]}], "orig": "References", "text": "References", "level": 1}, {"self_ref": "#/texts/355", "parent": {"cref": "#/groups/5"}, "children": [], "label": "list_item", "prov": [{"page_no": 8, "bbox": {"l": 313.3450012207031, "t": 98.0382080078125, "r": 545.1134033203125, "b": 79.06324768066406, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 121]}], "orig": "[1] Nicolas Carion, Francisco Massa, Gabriel Synnaeve, Nicolas Usunier, Alexander Kirillov, and Sergey Zagoruyko. End-to-", "text": "[1] Nicolas Carion, Francisco Massa, Gabriel Synnaeve, Nicolas Usunier, Alexander Kirillov, and Sergey Zagoruyko. End-to-", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/356", "parent": {"cref": "#/body"}, "children": [], "label": "page_footer", "prov": [{"page_no": 8, "bbox": {"l": 295.1210021972656, "t": 57.866634368896484, "r": 300.102294921875, "b": 48.9600715637207, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "8", "text": "8"}, {"self_ref": "#/texts/357", "parent": {"cref": "#/groups/6"}, "children": [], "label": "list_item", "prov": [{"page_no": 9, "bbox": {"l": 70.03099822998047, "t": 716.1162109375, "r": 286.36334228515625, "b": 675.2242431640625, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 212]}], "orig": "end object detection with transformers. In Andrea Vedaldi, Horst Bischof, Thomas Brox, and Jan-Michael Frahm, editors, Computer Vision - ECCV 2020 , pages 213-229, Cham, 2020. Springer International Publishing. 5", "text": "end object detection with transformers. In Andrea Vedaldi, Horst Bischof, Thomas Brox, and Jan-Michael Frahm, editors, Computer Vision - ECCV 2020 , pages 213-229, Cham, 2020. Springer International Publishing. 5", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/358", "parent": {"cref": "#/groups/6"}, "children": [], "label": "list_item", "prov": [{"page_no": 9, "bbox": {"l": 54.59500503540039, "t": 671.96826171875, "r": 286.36334228515625, "b": 642.0343017578125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 165]}], "orig": "[2] Zewen Chi, Heyan Huang, Heng-Da Xu, Houjin Yu, Wanxuan Yin, and Xian-Ling Mao. Complicated table structure recognition. arXiv preprint arXiv:1908.04729 , 2019. 3", "text": "[2] Zewen Chi, Heyan Huang, Heng-Da Xu, Houjin Yu, Wanxuan Yin, and Xian-Ling Mao. Complicated table structure recognition. arXiv preprint arXiv:1908.04729 , 2019. 3", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/359", "parent": {"cref": "#/groups/6"}, "children": [], "label": "list_item", "prov": [{"page_no": 9, "bbox": {"l": 54.595001220703125, "t": 638.7783203125, "r": 286.3630065917969, "b": 608.8453369140625, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 125]}], "orig": "[3] Bertrand Couasnon and Aurelie Lemaitre. Recognition of Tables and Forms , pages 647-677. Springer London, London, 2014. 2", "text": "[3] Bertrand Couasnon and Aurelie Lemaitre. Recognition of Tables and Forms , pages 647-677. Springer London, London, 2014. 2", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/360", "parent": {"cref": "#/groups/6"}, "children": [], "label": "list_item", "prov": [{"page_no": 9, "bbox": {"l": 54.59498977661133, "t": 605.58935546875, "r": 286.364013671875, "b": 564.6964111328125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 216]}], "orig": "[4] Herv'e D'ejean, Jean-Luc Meunier, Liangcai Gao, Yilun Huang, Yu Fang, Florian Kleber, and Eva-Maria Lang. ICDAR 2019 Competition on Table Detection and Recognition (cTDaR), Apr. 2019. http://sac.founderit.com/. 2", "text": "[4] Herv'e D'ejean, Jean-Luc Meunier, Liangcai Gao, Yilun Huang, Yu Fang, Florian Kleber, and Eva-Maria Lang. ICDAR 2019 Competition on Table Detection and Recognition (cTDaR), Apr. 2019. http://sac.founderit.com/. 2", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/361", "parent": {"cref": "#/groups/6"}, "children": [], "label": "list_item", "prov": [{"page_no": 9, "bbox": {"l": 54.5949821472168, "t": 561.4404296875, "r": 286.36334228515625, "b": 520.5484619140625, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 236]}], "orig": "[5] Basilios Gatos, Dimitrios Danatsas, Ioannis Pratikakis, and Stavros J Perantonis. Automatic table detection in document images. In International Conference on Pattern Recognition and Image Analysis , pages 609-618. Springer, 2005. 2", "text": "[5] Basilios Gatos, Dimitrios Danatsas, Ioannis Pratikakis, and Stavros J Perantonis. Automatic table detection in document images. In International Conference on Pattern Recognition and Image Analysis , pages 609-618. Springer, 2005. 2", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/362", "parent": {"cref": "#/groups/6"}, "children": [], "label": "list_item", "prov": [{"page_no": 9, "bbox": {"l": 54.594970703125, "t": 517.2924194335938, "r": 286.36676025390625, "b": 476.3995056152344, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 193]}], "orig": "[6] Max Gobel, Tamir Hassan, Ermelinda Oro, and Giorgio Orsi. Icdar 2013 table competition. In 2013 12th International Conference on Document Analysis and Recognition , pages 1449-1453, 2013. 2", "text": "[6] Max Gobel, Tamir Hassan, Ermelinda Oro, and Giorgio Orsi. Icdar 2013 table competition. In 2013 12th International Conference on Document Analysis and Recognition , pages 1449-1453, 2013. 2", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/363", "parent": {"cref": "#/groups/6"}, "children": [], "label": "list_item", "prov": [{"page_no": 9, "bbox": {"l": 54.59498977661133, "t": 473.1434631347656, "r": 286.3631896972656, "b": 443.2104797363281, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 165]}], "orig": "[7] EA Green and M Krishnamoorthy. Recognition of tables using table grammars. procs. In Symposium on Document Analysis and Recognition (SDAIR'95) , pages 261-277. 2", "text": "[7] EA Green and M Krishnamoorthy. Recognition of tables using table grammars. procs. In Symposium on Document Analysis and Recognition (SDAIR'95) , pages 261-277. 2", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/364", "parent": {"cref": "#/groups/6"}, "children": [], "label": "list_item", "prov": [{"page_no": 9, "bbox": {"l": 54.59498596191406, "t": 439.9544372558594, "r": 286.3633117675781, "b": 388.1025085449219, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 273]}], "orig": "[8] Khurram Azeem Hashmi, Alain Pagani, Marcus Liwicki, Didier Stricker, and Muhammad Zeshan Afzal. Castabdetectors: Cascade network for table detection in document images with recursive feature pyramid and switchable atrous convolution. Journal of Imaging , 7(10), 2021. 1", "text": "[8] Khurram Azeem Hashmi, Alain Pagani, Marcus Liwicki, Didier Stricker, and Muhammad Zeshan Afzal. Castabdetectors: Cascade network for table detection in document images with recursive feature pyramid and switchable atrous convolution. Journal of Imaging , 7(10), 2021. 1", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/365", "parent": {"cref": "#/groups/6"}, "children": [], "label": "list_item", "prov": [{"page_no": 9, "bbox": {"l": 54.595001220703125, "t": 384.84747314453125, "r": 286.3598937988281, "b": 354.9135437011719, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 170]}], "orig": "[9] Kaiming He, Georgia Gkioxari, Piotr Dollar, and Ross Girshick. Mask r-cnn. In Proceedings of the IEEE International Conference on Computer Vision (ICCV) , Oct 2017. 1", "text": "[9] Kaiming He, Georgia Gkioxari, Piotr Dollar, and Ross Girshick. Mask r-cnn. In Proceedings of the IEEE International Conference on Computer Vision (ICCV) , Oct 2017. 1", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/366", "parent": {"cref": "#/groups/6"}, "children": [], "label": "list_item", "prov": [{"page_no": 9, "bbox": {"l": 50.11199951171875, "t": 351.6575012207031, "r": 286.36334228515625, "b": 310.7645568847656, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 226]}], "orig": "[10] Yelin He, X. Qi, Jiaquan Ye, Peng Gao, Yihao Chen, Bingcong Li, Xin Tang, and Rong Xiao. Pingan-vcgroup's solution for icdar 2021 competition on scientific table image recognition to latex. ArXiv , abs/2105.01846, 2021. 2", "text": "[10] Yelin He, X. Qi, Jiaquan Ye, Peng Gao, Yihao Chen, Bingcong Li, Xin Tang, and Rong Xiao. Pingan-vcgroup's solution for icdar 2021 competition on scientific table image recognition to latex. ArXiv , abs/2105.01846, 2021. 2", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/367", "parent": {"cref": "#/groups/6"}, "children": [], "label": "list_item", "prov": [{"page_no": 9, "bbox": {"l": 50.11199951171875, "t": 307.509521484375, "r": 286.3633117675781, "b": 255.65762329101562, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 239]}], "orig": "[11] Jianying Hu, Ramanujan S Kashi, Daniel P Lopresti, and Gordon Wilfong. Medium-independent table detection. In Document Recognition and Retrieval VII , volume 3967, pages 291-302. International Society for Optics and Photonics, 1999. 2", "text": "[11] Jianying Hu, Ramanujan S Kashi, Daniel P Lopresti, and Gordon Wilfong. Medium-independent table detection. In Document Recognition and Retrieval VII , volume 3967, pages 291-302. International Society for Optics and Photonics, 1999. 2", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/368", "parent": {"cref": "#/groups/6"}, "children": [], "label": "list_item", "prov": [{"page_no": 9, "bbox": {"l": 50.11200714111328, "t": 252.40158081054688, "r": 286.36334228515625, "b": 200.55062866210938, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 240]}], "orig": "[12] Matthew Hurst. A constraint-based approach to table structure derivation. In Proceedings of the Seventh International Conference on Document Analysis and Recognition - Volume 2 , ICDAR '03, page 911, USA, 2003. IEEE Computer Society. 2", "text": "[12] Matthew Hurst. A constraint-based approach to table structure derivation. In Proceedings of the Seventh International Conference on Document Analysis and Recognition - Volume 2 , ICDAR '03, page 911, USA, 2003. IEEE Computer Society. 2", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/369", "parent": {"cref": "#/groups/6"}, "children": [], "label": "list_item", "prov": [{"page_no": 9, "bbox": {"l": 50.11200714111328, "t": 197.29458618164062, "r": 286.3633117675781, "b": 145.442626953125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 283]}], "orig": "[13] Thotreingam Kasar, Philippine Barlas, Sebastien Adam, Cl'ement Chatelain, and Thierry Paquet. Learning to detect tables in scanned document images using line information. In 2013 12th International Conference on Document Analysis and Recognition , pages 1185-1189. IEEE, 2013. 2", "text": "[13] Thotreingam Kasar, Philippine Barlas, Sebastien Adam, Cl'ement Chatelain, and Thierry Paquet. Learning to detect tables in scanned document images using line information. In 2013 12th International Conference on Document Analysis and Recognition , pages 1185-1189. IEEE, 2013. 2", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/370", "parent": {"cref": "#/groups/6"}, "children": [], "label": "list_item", "prov": [{"page_no": 9, "bbox": {"l": 50.11199188232422, "t": 142.18658447265625, "r": 286.36334228515625, "b": 112.25361633300781, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 142]}], "orig": "[14] Pratik Kayal, Mrinal Anand, Harsh Desai, and Mayank Singh. Icdar 2021 competition on scientific table image recognition to latex, 2021. 2", "text": "[14] Pratik Kayal, Mrinal Anand, Harsh Desai, and Mayank Singh. Icdar 2021 competition on scientific table image recognition to latex, 2021. 2", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/371", "parent": {"cref": "#/groups/6"}, "children": [], "label": "list_item", "prov": [{"page_no": 9, "bbox": {"l": 50.11199188232422, "t": 108.99756622314453, "r": 286.35931396484375, "b": 79.06361389160156, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 127]}], "orig": "[15] Harold W Kuhn. The hungarian method for the assignment problem. Naval research logistics quarterly , 2(1-2):83-97, 1955. 6", "text": "[15] Harold W Kuhn. The hungarian method for the assignment problem. Naval research logistics quarterly , 2(1-2):83-97, 1955. 6", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/372", "parent": {"cref": "#/body"}, "children": [], "label": "page_footer", "prov": [{"page_no": 9, "bbox": {"l": 295.12103271484375, "t": 57.86741256713867, "r": 300.1023254394531, "b": 48.96084976196289, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "9", "text": "9"}, {"self_ref": "#/texts/373", "parent": {"cref": "#/groups/7"}, "children": [], "label": "list_item", "prov": [{"page_no": 9, "bbox": {"l": 308.8619689941406, "t": 716.1165771484375, "r": 545.11474609375, "b": 653.306640625, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 287]}], "orig": "[16] Girish Kulkarni, Visruth Premraj, Vicente Ordonez, Sagnik Dhar, Siming Li, Yejin Choi, Alexander C. Berg, and Tamara L. Berg. Babytalk: Understanding and generating simple image descriptions. IEEE Transactions on Pattern Analysis and Machine Intelligence , 35(12):2891-2903, 2013. 4", "text": "[16] Girish Kulkarni, Visruth Premraj, Vicente Ordonez, Sagnik Dhar, Siming Li, Yejin Choi, Alexander C. Berg, and Tamara L. Berg. Babytalk: Understanding and generating simple image descriptions. IEEE Transactions on Pattern Analysis and Machine Intelligence , 35(12):2891-2903, 2013. 4", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/374", "parent": {"cref": "#/groups/7"}, "children": [], "label": "list_item", "prov": [{"page_no": 9, "bbox": {"l": 308.86199951171875, "t": 649.8766479492188, "r": 545.1134033203125, "b": 619.9436645507812, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 156]}], "orig": "[17] Minghao Li, Lei Cui, Shaohan Huang, Furu Wei, Ming Zhou, and Zhoujun Li. Tablebank: A benchmark dataset for table detection and recognition, 2019. 2, 3", "text": "[17] Minghao Li, Lei Cui, Shaohan Huang, Furu Wei, Ming Zhou, and Zhoujun Li. Tablebank: A benchmark dataset for table detection and recognition, 2019. 2, 3", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/375", "parent": {"cref": "#/groups/7"}, "children": [], "label": "list_item", "prov": [{"page_no": 9, "bbox": {"l": 308.86199951171875, "t": 616.513671875, "r": 545.113525390625, "b": 531.7857666015625, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 407]}], "orig": "[18] Yiren Li, Zheng Huang, Junchi Yan, Yi Zhou, Fan Ye, and Xianhui Liu. Gfte: Graph-based financial table extraction. In Alberto Del Bimbo, Rita Cucchiara, Stan Sclaroff, Giovanni Maria Farinella, Tao Mei, Marco Bertini, Hugo Jair Escalante, and Roberto Vezzani, editors, Pattern Recognition. ICPR International Workshops and Challenges , pages 644-658, Cham, 2021. Springer International Publishing. 2, 3", "text": "[18] Yiren Li, Zheng Huang, Junchi Yan, Yi Zhou, Fan Ye, and Xianhui Liu. Gfte: Graph-based financial table extraction. In Alberto Del Bimbo, Rita Cucchiara, Stan Sclaroff, Giovanni Maria Farinella, Tao Mei, Marco Bertini, Hugo Jair Escalante, and Roberto Vezzani, editors, Pattern Recognition. ICPR International Workshops and Challenges , pages 644-658, Cham, 2021. Springer International Publishing. 2, 3", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/376", "parent": {"cref": "#/groups/7"}, "children": [], "label": "list_item", "prov": [{"page_no": 9, "bbox": {"l": 308.86199951171875, "t": 528.3557739257812, "r": 545.1141967773438, "b": 465.5458679199219, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 328]}], "orig": "[19] Nikolaos Livathinos, Cesar Berrospi, Maksym Lysak, Viktor Kuropiatnyk, Ahmed Nassar, Andre Carvalho, Michele Dolfi, Christoph Auer, Kasper Dinkla, and Peter Staar. Robust pdf document conversion using recurrent neural networks. Proceedings of the AAAI Conference on Artificial Intelligence , 35(17):15137-15145, May 2021. 1", "text": "[19] Nikolaos Livathinos, Cesar Berrospi, Maksym Lysak, Viktor Kuropiatnyk, Ahmed Nassar, Andre Carvalho, Michele Dolfi, Christoph Auer, Kasper Dinkla, and Peter Staar. Robust pdf document conversion using recurrent neural networks. Proceedings of the AAAI Conference on Artificial Intelligence , 35(17):15137-15145, May 2021. 1", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/377", "parent": {"cref": "#/groups/7"}, "children": [], "label": "list_item", "prov": [{"page_no": 9, "bbox": {"l": 308.86199951171875, "t": 462.1158142089844, "r": 545.1160888671875, "b": 421.2228698730469, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 229]}], "orig": "[20] Rujiao Long, Wen Wang, Nan Xue, Feiyu Gao, Zhibo Yang, Yongpan Wang, and Gui-Song Xia. Parsing table structures in the wild. In Proceedings of the IEEE/CVF International Conference on Computer Vision , pages 944-952, 2021. 2", "text": "[20] Rujiao Long, Wen Wang, Nan Xue, Feiyu Gao, Zhibo Yang, Yongpan Wang, and Gui-Song Xia. Parsing table structures in the wild. In Proceedings of the IEEE/CVF International Conference on Computer Vision , pages 944-952, 2021. 2", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/378", "parent": {"cref": "#/groups/7"}, "children": [], "label": "list_item", "prov": [{"page_no": 9, "bbox": {"l": 308.86199951171875, "t": 417.7938232421875, "r": 545.1134643554688, "b": 354.9829406738281, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 315]}], "orig": "[21] Shubham Singh Paliwal, D Vishwanath, Rohit Rahul, Monika Sharma, and Lovekesh Vig. Tablenet: Deep learning model for end-to-end table detection and tabular data extraction from scanned document images. In 2019 International Conference on Document Analysis and Recognition (ICDAR) , pages 128-133. IEEE, 2019. 1", "text": "[21] Shubham Singh Paliwal, D Vishwanath, Rohit Rahul, Monika Sharma, and Lovekesh Vig. Tablenet: Deep learning model for end-to-end table detection and tabular data extraction from scanned document images. In 2019 International Conference on Document Analysis and Recognition (ICDAR) , pages 128-133. IEEE, 2019. 1", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/379", "parent": {"cref": "#/groups/7"}, "children": [], "label": "list_item", "prov": [{"page_no": 9, "bbox": {"l": 308.86199951171875, "t": 351.55389404296875, "r": 545.11474609375, "b": 233.94903564453125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 592]}], "orig": "[22] Adam Paszke, Sam Gross, Francisco Massa, Adam Lerer, James Bradbury, Gregory Chanan, Trevor Killeen, Zeming Lin, Natalia Gimelshein, Luca Antiga, Alban Desmaison, Andreas Kopf, Edward Yang, Zachary DeVito, Martin Raison, Alykhan Tejani, Sasank Chilamkurthy, Benoit Steiner, Lu Fang, Junjie Bai, and Soumith Chintala. Pytorch: An imperative style, high-performance deep learning library. In H. Wallach, H. Larochelle, A. Beygelzimer, F. d'Alch'e-Buc, E. Fox, and R. Garnett, editors, Advances in Neural Information Processing Systems 32 , pages 8024-8035. Curran Associates, Inc., 2019. 6", "text": "[22] Adam Paszke, Sam Gross, Francisco Massa, Adam Lerer, James Bradbury, Gregory Chanan, Trevor Killeen, Zeming Lin, Natalia Gimelshein, Luca Antiga, Alban Desmaison, Andreas Kopf, Edward Yang, Zachary DeVito, Martin Raison, Alykhan Tejani, Sasank Chilamkurthy, Benoit Steiner, Lu Fang, Junjie Bai, and Soumith Chintala. Pytorch: An imperative style, high-performance deep learning library. In H. Wallach, H. Larochelle, A. Beygelzimer, F. d'Alch'e-Buc, E. Fox, and R. Garnett, editors, Advances in Neural Information Processing Systems 32 , pages 8024-8035. Curran Associates, Inc., 2019. 6", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/380", "parent": {"cref": "#/groups/7"}, "children": [], "label": "list_item", "prov": [{"page_no": 9, "bbox": {"l": 308.86199951171875, "t": 230.5189971923828, "r": 545.1134033203125, "b": 167.7090301513672, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 322]}], "orig": "[23] Devashish Prasad, Ayan Gadpal, Kshitij Kapadni, Manish Visave, and Kavita Sultanpure. Cascadetabnet: An approach for end to end table detection and structure recognition from image-based documents. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition Workshops , pages 572-573, 2020. 1", "text": "[23] Devashish Prasad, Ayan Gadpal, Kshitij Kapadni, Manish Visave, and Kavita Sultanpure. Cascadetabnet: An approach for end to end table detection and structure recognition from image-based documents. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition Workshops , pages 572-573, 2020. 1", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/381", "parent": {"cref": "#/groups/7"}, "children": [], "label": "list_item", "prov": [{"page_no": 9, "bbox": {"l": 308.86199951171875, "t": 164.27899169921875, "r": 545.1162109375, "b": 123.38601684570312, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 224]}], "orig": "[24] Shah Rukh Qasim, Hassan Mahmood, and Faisal Shafait. Rethinking table recognition using graph neural networks. In 2019 International Conference on Document Analysis and Recognition (ICDAR) , pages 142-147. IEEE, 2019. 3", "text": "[24] Shah Rukh Qasim, Hassan Mahmood, and Faisal Shafait. Rethinking table recognition using graph neural networks. In 2019 International Conference on Document Analysis and Recognition (ICDAR) , pages 142-147. IEEE, 2019. 3", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/382", "parent": {"cref": "#/groups/7"}, "children": [], "label": "list_item", "prov": [{"page_no": 9, "bbox": {"l": 308.8620300292969, "t": 119.95699310302734, "r": 545.1134033203125, "b": 79.06402587890625, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 229]}], "orig": "[25] Hamid Rezatofighi, Nathan Tsoi, JunYoung Gwak, Amir Sadeghian, Ian Reid, and Silvio Savarese. Generalized intersection over union: A metric and a loss for bounding box regression. In Proceedings of the IEEE/CVF Conference on", "text": "[25] Hamid Rezatofighi, Nathan Tsoi, JunYoung Gwak, Amir Sadeghian, Ian Reid, and Silvio Savarese. Generalized intersection over union: A metric and a loss for bounding box regression. In Proceedings of the IEEE/CVF Conference on", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/383", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 70.03099822998047, "t": 716.1162109375, "r": 286.36175537109375, "b": 697.1412353515625, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 64]}], "orig": "Computer Vision and Pattern Recognition , pages 658-666, 2019. 6", "text": "Computer Vision and Pattern Recognition , pages 658-666, 2019. 6"}, {"self_ref": "#/texts/384", "parent": {"cref": "#/groups/8"}, "children": [], "label": "list_item", "prov": [{"page_no": 10, "bbox": {"l": 50.11200714111328, "t": 693.834228515625, "r": 286.36578369140625, "b": 631.0233154296875, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 302]}], "orig": "[26] Sebastian Schreiber, Stefan Agne, Ivo Wolf, Andreas Dengel, and Sheraz Ahmed. Deepdesrt: Deep learning for detection and structure recognition of tables in document images. In 2017 14th IAPR International Conference on Document Analysis and Recognition (ICDAR) , volume 01, pages 11621167, 2017. 1", "text": "[26] Sebastian Schreiber, Stefan Agne, Ivo Wolf, Andreas Dengel, and Sheraz Ahmed. Deepdesrt: Deep learning for detection and structure recognition of tables in document images. In 2017 14th IAPR International Conference on Document Analysis and Recognition (ICDAR) , volume 01, pages 11621167, 2017. 1", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/385", "parent": {"cref": "#/groups/8"}, "children": [], "label": "list_item", "prov": [{"page_no": 10, "bbox": {"l": 50.11200714111328, "t": 627.71533203125, "r": 286.3633728027344, "b": 564.9053955078125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 308]}], "orig": "[27] Sebastian Schreiber, Stefan Agne, Ivo Wolf, Andreas Dengel, and Sheraz Ahmed. Deepdesrt: Deep learning for detection and structure recognition of tables in document images. In 2017 14th IAPR international conference on document analysis and recognition (ICDAR) , volume 1, pages 1162-1167. IEEE, 2017. 3", "text": "[27] Sebastian Schreiber, Stefan Agne, Ivo Wolf, Andreas Dengel, and Sheraz Ahmed. Deepdesrt: Deep learning for detection and structure recognition of tables in document images. In 2017 14th IAPR international conference on document analysis and recognition (ICDAR) , volume 1, pages 1162-1167. IEEE, 2017. 3", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/386", "parent": {"cref": "#/groups/8"}, "children": [], "label": "list_item", "prov": [{"page_no": 10, "bbox": {"l": 50.11200714111328, "t": 561.597412109375, "r": 286.36578369140625, "b": 520.7044677734375, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 183]}], "orig": "[28] Faisal Shafait and Ray Smith. Table detection in heterogeneous documents. In Proceedings of the 9th IAPR International Workshop on Document Analysis Systems , pages 6572, 2010. 2", "text": "[28] Faisal Shafait and Ray Smith. Table detection in heterogeneous documents. In Proceedings of the 9th IAPR International Workshop on Document Analysis Systems , pages 6572, 2010. 2", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/387", "parent": {"cref": "#/groups/8"}, "children": [], "label": "list_item", "prov": [{"page_no": 10, "bbox": {"l": 50.11200714111328, "t": 517.3964233398438, "r": 286.36627197265625, "b": 465.5455017089844, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 275]}], "orig": "[29] Shoaib Ahmed Siddiqui, Imran Ali Fateh, Syed Tahseen Raza Rizvi, Andreas Dengel, and Sheraz Ahmed. Deeptabstr: Deep learning based table structure recognition. In 2019 International Conference on Document Analysis and Recognition (ICDAR) , pages 1403-1409. IEEE, 2019. 3", "text": "[29] Shoaib Ahmed Siddiqui, Imran Ali Fateh, Syed Tahseen Raza Rizvi, Andreas Dengel, and Sheraz Ahmed. Deeptabstr: Deep learning based table structure recognition. In 2019 International Conference on Document Analysis and Recognition (ICDAR) , pages 1403-1409. IEEE, 2019. 3", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/388", "parent": {"cref": "#/groups/8"}, "children": [], "label": "list_item", "prov": [{"page_no": 10, "bbox": {"l": 50.11200714111328, "t": 462.2374572753906, "r": 286.36334228515625, "b": 410.3855285644531, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 251]}], "orig": "[30] Peter W J Staar, Michele Dolfi, Christoph Auer, and Costas Bekas. Corpus conversion service: A machine learning platform to ingest documents at scale. In Proceedings of the 24th ACM SIGKDD , KDD '18, pages 774-782, New York, NY, USA, 2018. ACM. 1", "text": "[30] Peter W J Staar, Michele Dolfi, Christoph Auer, and Costas Bekas. Corpus conversion service: A machine learning platform to ingest documents at scale. In Proceedings of the 24th ACM SIGKDD , KDD '18, pages 774-782, New York, NY, USA, 2018. ACM. 1", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/389", "parent": {"cref": "#/groups/8"}, "children": [], "label": "list_item", "prov": [{"page_no": 10, "bbox": {"l": 50.11200714111328, "t": 407.0774841308594, "r": 286.3638916015625, "b": 333.3085632324219, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 366]}], "orig": "[31] Ashish Vaswani, Noam Shazeer, Niki Parmar, Jakob Uszkoreit, Llion Jones, Aidan N Gomez, \u0141 ukasz Kaiser, and Illia Polosukhin. Attention is all you need. In I. Guyon, U. V. Luxburg, S. Bengio, H. Wallach, R. Fergus, S. Vishwanathan, and R. Garnett, editors, Advances in Neural Information Processing Systems 30 , pages 5998-6008. Curran Associates, Inc., 2017. 5", "text": "[31] Ashish Vaswani, Noam Shazeer, Niki Parmar, Jakob Uszkoreit, Llion Jones, Aidan N Gomez, \u0141 ukasz Kaiser, and Illia Polosukhin. Attention is all you need. In I. Guyon, U. V. Luxburg, S. Bengio, H. Wallach, R. Fergus, S. Vishwanathan, and R. Garnett, editors, Advances in Neural Information Processing Systems 30 , pages 5998-6008. Curran Associates, Inc., 2017. 5", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/390", "parent": {"cref": "#/groups/8"}, "children": [], "label": "list_item", "prov": [{"page_no": 10, "bbox": {"l": 50.11200714111328, "t": 330.0005187988281, "r": 286.36334228515625, "b": 289.1075744628906, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 221]}], "orig": "[32] Oriol Vinyals, Alexander Toshev, Samy Bengio, and Dumitru Erhan. Show and tell: A neural image caption generator. In Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR) , June 2015. 2", "text": "[32] Oriol Vinyals, Alexander Toshev, Samy Bengio, and Dumitru Erhan. Show and tell: A neural image caption generator. In Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR) , June 2015. 2", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/391", "parent": {"cref": "#/groups/8"}, "children": [], "label": "list_item", "prov": [{"page_no": 10, "bbox": {"l": 50.11201477050781, "t": 285.7995300292969, "r": 286.3633728027344, "b": 244.90756225585938, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 217]}], "orig": "[33] Wenyuan Xue, Qingyong Li, and Dacheng Tao. Res2tim: reconstruct syntactic structures from table images. In 2019 International Conference on Document Analysis and Recognition (ICDAR) , pages 749-755. IEEE, 2019. 3", "text": "[33] Wenyuan Xue, Qingyong Li, and Dacheng Tao. Res2tim: reconstruct syntactic structures from table images. In 2019 International Conference on Document Analysis and Recognition (ICDAR) , pages 749-755. IEEE, 2019. 3", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/392", "parent": {"cref": "#/groups/8"}, "children": [], "label": "list_item", "prov": [{"page_no": 10, "bbox": {"l": 50.112022399902344, "t": 241.59951782226562, "r": 286.3633728027344, "b": 200.70655822753906, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 190]}], "orig": "[34] Wenyuan Xue, Baosheng Yu, Wen Wang, Dacheng Tao, and Qingyong Li. Tgrnet: A table graph reconstruction network for table structure recognition. arXiv preprint arXiv:2106.10598 , 2021. 3", "text": "[34] Wenyuan Xue, Baosheng Yu, Wen Wang, Dacheng Tao, and Qingyong Li. Tgrnet: A table graph reconstruction network for table structure recognition. arXiv preprint arXiv:2106.10598 , 2021. 3", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/393", "parent": {"cref": "#/groups/8"}, "children": [], "label": "list_item", "prov": [{"page_no": 10, "bbox": {"l": 50.112030029296875, "t": 197.3985137939453, "r": 286.3634033203125, "b": 156.50555419921875, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 220]}], "orig": "[35] Quanzeng You, Hailin Jin, Zhaowen Wang, Chen Fang, and Jiebo Luo. Image captioning with semantic attention. In Proceedings of the IEEE conference on computer vision and pattern recognition , pages 4651-4659, 2016. 4", "text": "[35] Quanzeng You, Hailin Jin, Zhaowen Wang, Chen Fang, and Jiebo Luo. Image captioning with semantic attention. In Proceedings of the IEEE conference on computer vision and pattern recognition , pages 4651-4659, 2016. 4", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/394", "parent": {"cref": "#/groups/8"}, "children": [], "label": "list_item", "prov": [{"page_no": 10, "bbox": {"l": 50.112022399902344, "t": 153.197509765625, "r": 286.3633728027344, "b": 101.34652709960938, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 280]}], "orig": "[36] Xinyi Zheng, Doug Burdick, Lucian Popa, Peter Zhong, and Nancy Xin Ru Wang. Global table extractor (gte): A framework for joint table identification and cell structure recognition using visual context. Winter Conference for Applications in Computer Vision (WACV) , 2021. 2, 3", "text": "[36] Xinyi Zheng, Doug Burdick, Lucian Popa, Peter Zhong, and Nancy Xin Ru Wang. Global table extractor (gte): A framework for joint table identification and cell structure recognition using visual context. Winter Conference for Applications in Computer Vision (WACV) , 2021. 2, 3", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/395", "parent": {"cref": "#/groups/8"}, "children": [], "label": "list_item", "prov": [{"page_no": 10, "bbox": {"l": 50.11201477050781, "t": 98.03849792480469, "r": 286.36334228515625, "b": 79.06353759765625, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 106]}], "orig": "[37] Xu Zhong, Elaheh ShafieiBavani, and Antonio Jimeno Yepes. Image-based table recognition: Data, model,", "text": "[37] Xu Zhong, Elaheh ShafieiBavani, and Antonio Jimeno Yepes. Image-based table recognition: Data, model,", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/396", "parent": {"cref": "#/body"}, "children": [], "label": "page_footer", "prov": [{"page_no": 10, "bbox": {"l": 292.6300048828125, "t": 57.867008209228516, "r": 302.59259033203125, "b": 48.960445404052734, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "10", "text": "10"}, {"self_ref": "#/texts/397", "parent": {"cref": "#/groups/9"}, "children": [], "label": "list_item", "prov": [{"page_no": 10, "bbox": {"l": 328.781005859375, "t": 716.1165161132812, "r": 545.1145629882812, "b": 675.2245483398438, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 192]}], "orig": "and evaluation. In Andrea Vedaldi, Horst Bischof, Thomas Brox, and Jan-Michael Frahm, editors, Computer Vision ECCV 2020 , pages 564-580, Cham, 2020. Springer International Publishing. 2, 3, 7", "text": "and evaluation. In Andrea Vedaldi, Horst Bischof, Thomas Brox, and Jan-Michael Frahm, editors, Computer Vision ECCV 2020 , pages 564-580, Cham, 2020. Springer International Publishing. 2, 3, 7", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/398", "parent": {"cref": "#/groups/9"}, "children": [], "label": "list_item", "prov": [{"page_no": 10, "bbox": {"l": 308.86199951171875, "t": 671.2855224609375, "r": 545.1133422851562, "b": 630.392578125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 221]}], "orig": "[38] Xu Zhong, Jianbin Tang, and Antonio Jimeno Yepes. Publaynet: Largest dataset ever for document layout analysis. In 2019 International Conference on Document Analysis and Recognition (ICDAR) , pages 1015-1022, 2019. 1", "text": "[38] Xu Zhong, Jianbin Tang, and Antonio Jimeno Yepes. Publaynet: Largest dataset ever for document layout analysis. In 2019 International Conference on Document Analysis and Recognition (ICDAR) , pages 1015-1022, 2019. 1", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/399", "parent": {"cref": "#/body"}, "children": [], "label": "section_header", "prov": [{"page_no": 11, "bbox": {"l": 132.8419952392578, "t": 681.4251098632812, "r": 465.37591552734375, "b": 656.4699096679688, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 83]}], "orig": "TableFormer: Table Structure Understanding with Transformers Supplementary Material", "text": "TableFormer: Table Structure Understanding with Transformers Supplementary Material", "level": 1}, {"self_ref": "#/texts/400", "parent": {"cref": "#/body"}, "children": [], "label": "section_header", "prov": [{"page_no": 11, "bbox": {"l": 50.11198425292969, "t": 630.839111328125, "r": 175.96437072753906, "b": 620.0913696289062, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 26]}], "orig": "1. Details on the datasets", "text": "1. Details on the datasets", "level": 1}, {"self_ref": "#/texts/401", "parent": {"cref": "#/body"}, "children": [], "label": "section_header", "prov": [{"page_no": 11, "bbox": {"l": 50.11198425292969, "t": 611.0206909179688, "r": 150.364013671875, "b": 601.1686401367188, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 21]}], "orig": "1.1. Data preparation", "text": "1.1. Data preparation", "level": 1}, {"self_ref": "#/texts/402", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 11, "bbox": {"l": 50.11198425292969, "t": 592.0797119140625, "r": 286.3651428222656, "b": 403.8451843261719, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 931]}], "orig": "As a first step of our data preparation process, we have calculated statistics over the datasets across the following dimensions: (1) table size measured in the number of rows and columns, (2) complexity of the table, (3) strictness of the provided HTML structure and (4) completeness (i.e. no omitted bounding boxes). A table is considered to be simple if it does not contain row spans or column spans. Additionally, a table has a strict HTML structure if every row has the same number of columns after taking into account any row or column spans. Therefore a strict HTML structure looks always rectangular. However, HTML is a lenient encoding format, i.e. tables with rows of different sizes might still be regarded as correct due to implicit display rules. These implicit rules leave room for ambiguity, which we want to avoid. As such, we prefer to have \"strict\" tables, i.e. tables where every row has exactly the same length.", "text": "As a first step of our data preparation process, we have calculated statistics over the datasets across the following dimensions: (1) table size measured in the number of rows and columns, (2) complexity of the table, (3) strictness of the provided HTML structure and (4) completeness (i.e. no omitted bounding boxes). A table is considered to be simple if it does not contain row spans or column spans. Additionally, a table has a strict HTML structure if every row has the same number of columns after taking into account any row or column spans. Therefore a strict HTML structure looks always rectangular. However, HTML is a lenient encoding format, i.e. tables with rows of different sizes might still be regarded as correct due to implicit display rules. These implicit rules leave room for ambiguity, which we want to avoid. As such, we prefer to have \"strict\" tables, i.e. tables where every row has exactly the same length."}, {"self_ref": "#/texts/403", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 11, "bbox": {"l": 50.11198425292969, "t": 400.5947265625, "r": 286.3651123046875, "b": 164.54029846191406, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1149]}], "orig": "We have developed a technique that tries to derive a missing bounding box out of its neighbors. As a first step, we use the annotation data to generate the most fine-grained grid that covers the table structure. In case of strict HTML tables, all grid squares are associated with some table cell and in the presence of table spans a cell extends across multiple grid squares. When enough bounding boxes are known for a rectangular table, it is possible to compute the geometrical border lines between the grid rows and columns. Eventually this information is used to generate the missing bounding boxes. Additionally, the existence of unused grid squares indicates that the table rows have unequal number of columns and the overall structure is non-strict. The generation of missing bounding boxes for non-strict HTML tables is ambiguous and therefore quite challenging. Thus, we have decided to simply discard those tables. In case of PubTabNet we have computed missing bounding boxes for 48% of the simple and 69% of the complex tables. Regarding FinTabNet, 68% of the simple and 98% of the complex tables require the generation of bounding boxes.", "text": "We have developed a technique that tries to derive a missing bounding box out of its neighbors. As a first step, we use the annotation data to generate the most fine-grained grid that covers the table structure. In case of strict HTML tables, all grid squares are associated with some table cell and in the presence of table spans a cell extends across multiple grid squares. When enough bounding boxes are known for a rectangular table, it is possible to compute the geometrical border lines between the grid rows and columns. Eventually this information is used to generate the missing bounding boxes. Additionally, the existence of unused grid squares indicates that the table rows have unequal number of columns and the overall structure is non-strict. The generation of missing bounding boxes for non-strict HTML tables is ambiguous and therefore quite challenging. Thus, we have decided to simply discard those tables. In case of PubTabNet we have computed missing bounding boxes for 48% of the simple and 69% of the complex tables. Regarding FinTabNet, 68% of the simple and 98% of the complex tables require the generation of bounding boxes."}, {"self_ref": "#/texts/404", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 11, "bbox": {"l": 50.11198425292969, "t": 161.28985595703125, "r": 286.3649597167969, "b": 140.42730712890625, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 92]}], "orig": "Figure 7 illustrates the distribution of the tables across different dimensions per dataset.", "text": "Figure 7 illustrates the distribution of the tables across different dimensions per dataset."}, {"self_ref": "#/texts/405", "parent": {"cref": "#/body"}, "children": [], "label": "section_header", "prov": [{"page_no": 11, "bbox": {"l": 50.11198425292969, "t": 129.60986328125, "r": 153.60784912109375, "b": 119.7578125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 23]}], "orig": "1.2. Synthetic datasets", "text": "1.2. Synthetic datasets", "level": 1}, {"self_ref": "#/texts/406", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 11, "bbox": {"l": 50.11198425292969, "t": 110.66886901855469, "r": 286.36505126953125, "b": 77.852294921875, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 167]}], "orig": "Aiming to train and evaluate our models in a broader spectrum of table data we have synthesized four types of datasets. Each one contains tables with different appear-", "text": "Aiming to train and evaluate our models in a broader spectrum of table data we have synthesized four types of datasets. Each one contains tables with different appear-"}, {"self_ref": "#/texts/407", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 11, "bbox": {"l": 308.86199951171875, "t": 629.3448486328125, "r": 545.1151123046875, "b": 584.572265625, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 221]}], "orig": "ances in regard to their size, structure, style and content. Every synthetic dataset contains 150k examples, summing up to 600k synthetic examples. All datasets are divided into Train, Test and Val splits (80%, 10%, 10%).", "text": "ances in regard to their size, structure, style and content. Every synthetic dataset contains 150k examples, summing up to 600k synthetic examples. All datasets are divided into Train, Test and Val splits (80%, 10%, 10%)."}, {"self_ref": "#/texts/408", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 11, "bbox": {"l": 308.86199951171875, "t": 580.7648315429688, "r": 545.1150512695312, "b": 559.9032592773438, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 89]}], "orig": "The process of generating a synthetic dataset can be decomposed into the following steps:", "text": "The process of generating a synthetic dataset can be decomposed into the following steps:"}, {"self_ref": "#/texts/409", "parent": {"cref": "#/groups/10"}, "children": [], "label": "list_item", "prov": [{"page_no": 11, "bbox": {"l": 308.86199951171875, "t": 556.0947875976562, "r": 545.1151123046875, "b": 475.45721435546875, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 373]}], "orig": "1. Prepare styling and content templates: The styling templates have been manually designed and organized into groups of scope specific appearances (e.g. financial data, marketing data, etc.) Additionally, we have prepared curated collections of content templates by extracting the most frequently used terms out of non-synthetic datasets (e.g. PubTabNet, FinTabNet, etc.).", "text": "1. Prepare styling and content templates: The styling templates have been manually designed and organized into groups of scope specific appearances (e.g. financial data, marketing data, etc.) Additionally, we have prepared curated collections of content templates by extracting the most frequently used terms out of non-synthetic datasets (e.g. PubTabNet, FinTabNet, etc.).", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/410", "parent": {"cref": "#/groups/10"}, "children": [], "label": "list_item", "prov": [{"page_no": 11, "bbox": {"l": 308.86199951171875, "t": 471.6497802734375, "r": 545.1151733398438, "b": 343.19134521484375, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 573]}], "orig": "2. Generate table structures: The structure of each synthetic dataset assumes a horizontal table header which potentially spans over multiple rows and a table body that may contain a combination of row spans and column spans. However, spans are not allowed to cross the header - body boundary. The table structure is described by the parameters: Total number of table rows and columns, number of header rows, type of spans (header only spans, row only spans, column only spans, both row and column spans), maximum span size and the ratio of the table area covered by spans.", "text": "2. Generate table structures: The structure of each synthetic dataset assumes a horizontal table header which potentially spans over multiple rows and a table body that may contain a combination of row spans and column spans. However, spans are not allowed to cross the header - body boundary. The table structure is described by the parameters: Total number of table rows and columns, number of header rows, type of spans (header only spans, row only spans, column only spans, both row and column spans), maximum span size and the ratio of the table area covered by spans.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/411", "parent": {"cref": "#/groups/10"}, "children": [], "label": "list_item", "prov": [{"page_no": 11, "bbox": {"l": 308.86199951171875, "t": 339.3839111328125, "r": 545.1151733398438, "b": 294.61138916015625, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 195]}], "orig": "3. Generate content: Based on the dataset theme , a set of suitable content templates is chosen first. Then, this content can be combined with purely random text to produce the synthetic content.", "text": "3. Generate content: Based on the dataset theme , a set of suitable content templates is chosen first. Then, this content can be combined with purely random text to produce the synthetic content.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/412", "parent": {"cref": "#/groups/10"}, "children": [], "label": "list_item", "prov": [{"page_no": 11, "bbox": {"l": 308.86199951171875, "t": 290.803955078125, "r": 545.1152954101562, "b": 246.0314178466797, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 218]}], "orig": "4. Apply styling templates: Depending on the domain of the synthetic dataset, a set of styling templates is first manually selected. Then, a style is randomly selected to format the appearance of the synthesized table.", "text": "4. Apply styling templates: Depending on the domain of the synthetic dataset, a set of styling templates is first manually selected. Then, a style is randomly selected to format the appearance of the synthesized table.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/413", "parent": {"cref": "#/groups/10"}, "children": [], "label": "list_item", "prov": [{"page_no": 11, "bbox": {"l": 308.86199951171875, "t": 242.22396850585938, "r": 545.1151733398438, "b": 185.4964141845703, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 238]}], "orig": "5. Render the complete tables: The synthetic table is finally rendered by a web browser engine to generate the bounding boxes for each table cell. A batching technique is utilized to optimize the runtime overhead of the rendering process.", "text": "5. Render the complete tables: The synthetic table is finally rendered by a web browser engine to generate the bounding boxes for each table cell. A batching technique is utilized to optimize the runtime overhead of the rendering process.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/414", "parent": {"cref": "#/body"}, "children": [], "label": "section_header", "prov": [{"page_no": 11, "bbox": {"l": 308.86199951171875, "t": 169.70941162109375, "r": 545.1087646484375, "b": 145.01368713378906, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 47]}], "orig": "2. Prediction post-processing for PDF documents", "text": "2. Prediction post-processing for PDF documents", "level": 1}, {"self_ref": "#/texts/415", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 11, "bbox": {"l": 308.8620300292969, "t": 134.57896423339844, "r": 545.1151733398438, "b": 77.85139465332031, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 247]}], "orig": "Although TableFormer can predict the table structure and the bounding boxes for tables recognized inside PDF documents, this is not enough when a full reconstruction of the original table is required. This happens mainly due the following reasons:", "text": "Although TableFormer can predict the table structure and the bounding boxes for tables recognized inside PDF documents, this is not enough when a full reconstruction of the original table is required. This happens mainly due the following reasons:"}, {"self_ref": "#/texts/416", "parent": {"cref": "#/body"}, "children": [], "label": "page_footer", "prov": [{"page_no": 11, "bbox": {"l": 292.63104248046875, "t": 57.86696243286133, "r": 302.5936279296875, "b": 48.96039962768555, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "11", "text": "11"}, {"self_ref": "#/texts/417", "parent": {"cref": "#/body"}, "children": [], "label": "caption", "prov": [{"page_no": 12, "bbox": {"l": 50.11199951171875, "t": 626.4976196289062, "r": 545.1137084960938, "b": 605.6360473632812, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 245]}], "orig": "Figure 7: Distribution of the tables across different dimensions per dataset. Simple vs complex tables per dataset and split, strict vs non strict html structures per dataset and table complexity, missing bboxes per dataset and table complexity.", "text": "Figure 7: Distribution of the tables across different dimensions per dataset. Simple vs complex tables per dataset and split, strict vs non strict html structures per dataset and table complexity, missing bboxes per dataset and table complexity."}, {"self_ref": "#/texts/418", "parent": {"cref": "#/pictures/11"}, "children": [], "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 119.39108, "t": 714.68945, "r": 151.94641, "b": 708.74078, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 9]}], "orig": "PubTabNet", "text": "PubTabNet"}, {"self_ref": "#/texts/419", "parent": {"cref": "#/pictures/11"}, "children": [], "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 53.345978, "t": 716.80847, "r": 59.327053, "b": 710.8598, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "b.", "text": "b."}, {"self_ref": "#/texts/420", "parent": {"cref": "#/pictures/11"}, "children": [], "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 289.5791, "t": 714.54169, "r": 319.8266, "b": 708.5930199999999, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 9]}], "orig": "FinTabNet", "text": "FinTabNet"}, {"self_ref": "#/texts/421", "parent": {"cref": "#/pictures/11"}, "children": [], "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 448.37271, "t": 714.7460300000001, "r": 481.75916, "b": 708.79736, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 10]}], "orig": "Table Bank", "text": "Table Bank"}, {"self_ref": "#/texts/422", "parent": {"cref": "#/pictures/11"}, "children": [], "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 82.553436, "t": 650.72382, "r": 94.976013, "b": 645.7666, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 5]}], "orig": "Train", "text": "Train"}, {"self_ref": "#/texts/423", "parent": {"cref": "#/pictures/11"}, "children": [], "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 63.03878399999999, "t": 690.89587, "r": 85.290085, "b": 685.9386600000001, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 7]}], "orig": "Complex", "text": "Complex"}, {"self_ref": "#/texts/424", "parent": {"cref": "#/pictures/11"}, "children": [], "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 67.76786, "t": 667.60468, "r": 85.231277, "b": 662.64746, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 6]}], "orig": "Simple", "text": "Simple"}, {"self_ref": "#/texts/425", "parent": {"cref": "#/pictures/11"}, "children": [], "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 227.55121, "t": 689.46008, "r": 249.80251, "b": 684.50287, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 7]}], "orig": "Complex", "text": "Complex"}, {"self_ref": "#/texts/426", "parent": {"cref": "#/pictures/11"}, "children": [], "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 232.19898999999998, "t": 665.0142200000001, "r": 249.66241, "b": 660.05701, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 6]}], "orig": "Simple", "text": "Simple"}, {"self_ref": "#/texts/427", "parent": {"cref": "#/pictures/11"}, "children": [], "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 396.2337, "t": 677.95477, "r": 413.69711, "b": 672.99756, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 6]}], "orig": "Simple", "text": "Simple"}, {"self_ref": "#/texts/428", "parent": {"cref": "#/pictures/11"}, "children": [], "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 97.382202, "t": 650.72382, "r": 105.08014, "b": 645.7666, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 3]}], "orig": "Val", "text": "Val"}, {"self_ref": "#/texts/429", "parent": {"cref": "#/pictures/11"}, "children": [], "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 60.93763400000001, "t": 706.26678, "r": 76.151443, "b": 701.30957, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "100%", "text": "100%"}, {"self_ref": "#/texts/430", "parent": {"cref": "#/pictures/11"}, "children": [], "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 82.304901, "t": 705.77649, "r": 106.99162, "b": 700.8192699999998, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 8]}], "orig": "500K 10K", "text": "500K 10K"}, {"self_ref": "#/texts/431", "parent": {"cref": "#/pictures/11"}, "children": [], "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 246.20530999999997, "t": 650.39392, "r": 281.88013, "b": 645.43671, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 14]}], "orig": "Train Test Val", "text": "Train Test Val"}, {"self_ref": "#/texts/432", "parent": {"cref": "#/pictures/11"}, "children": [], "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 226.69780000000003, "t": 706.26678, "r": 241.91161, "b": 701.30957, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "100%", "text": "100%"}, {"self_ref": "#/texts/433", "parent": {"cref": "#/pictures/11"}, "children": [], "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 249.93848999999997, "t": 705.91199, "r": 282.49384, "b": 700.95477, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 11]}], "orig": "91K 10K 10K", "text": "91K 10K 10K"}, {"self_ref": "#/texts/434", "parent": {"cref": "#/pictures/11"}, "children": [], "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 410.19409, "t": 650.72382, "r": 444.68915, "b": 645.7666, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 14]}], "orig": "Train Test Val", "text": "Train Test Val"}, {"self_ref": "#/texts/435", "parent": {"cref": "#/pictures/11"}, "children": [], "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 391.37341, "t": 706.26678, "r": 432.6716599999999, "b": 701.30957, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 12]}], "orig": "100% 130K 5K", "text": "100% 130K 5K"}, {"self_ref": "#/texts/436", "parent": {"cref": "#/pictures/11"}, "children": [], "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 435.60571000000004, "t": 705.73859, "r": 445.62414999999993, "b": 700.78137, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 3]}], "orig": "10K", "text": "10K"}, {"self_ref": "#/texts/437", "parent": {"cref": "#/pictures/11"}, "children": [], "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 113.94921, "t": 650.71155, "r": 136.20052, "b": 645.75433, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 7]}], "orig": "Complex", "text": "Complex"}, {"self_ref": "#/texts/438", "parent": {"cref": "#/pictures/11"}, "children": [], "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 116.91554000000001, "t": 697.18146, "r": 127.05433999999998, "b": 692.22424, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 3]}], "orig": "Non", "text": "Non"}, {"self_ref": "#/texts/439", "parent": {"cref": "#/pictures/11"}, "children": [], "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 113.3146, "t": 691.06146, "r": 127.05298, "b": 686.10425, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 6]}], "orig": "Strict", "text": "Strict"}, {"self_ref": "#/texts/440", "parent": {"cref": "#/pictures/11"}, "children": [], "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 112.94112, "t": 684.9414699999999, "r": 127.05537, "b": 679.98425, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "HTML", "text": "HTML"}, {"self_ref": "#/texts/441", "parent": {"cref": "#/pictures/11"}, "children": [], "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 113.22738999999999, "t": 669.38477, "r": 126.96577, "b": 664.42755, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 6]}], "orig": "Strict", "text": "Strict"}, {"self_ref": "#/texts/442", "parent": {"cref": "#/pictures/11"}, "children": [], "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 112.85390000000001, "t": 663.26477, "r": 126.96814999999998, "b": 658.30756, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "HTML", "text": "HTML"}, {"self_ref": "#/texts/443", "parent": {"cref": "#/pictures/11"}, "children": [], "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 138.57864, "t": 650.5636, "r": 156.04207, "b": 645.60638, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 6]}], "orig": "Simple", "text": "Simple"}, {"self_ref": "#/texts/444", "parent": {"cref": "#/pictures/11"}, "children": [], "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 122.03101, "t": 705.7287, "r": 151.04185, "b": 700.77148, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 9]}], "orig": "230K 280K", "text": "230K 280K"}, {"self_ref": "#/texts/445", "parent": {"cref": "#/pictures/11"}, "children": [], "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 311.65359, "t": 705.44501, "r": 321.67203, "b": 700.4877899999999, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 3]}], "orig": "65K", "text": "65K"}, {"self_ref": "#/texts/446", "parent": {"cref": "#/pictures/11"}, "children": [], "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 287.89441, "t": 650.28937, "r": 310.14572, "b": 645.33215, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 7]}], "orig": "Complex", "text": "Complex"}, {"self_ref": "#/texts/447", "parent": {"cref": "#/pictures/11"}, "children": [], "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 289.23572, "t": 698.92023, "r": 299.37451, "b": 693.96301, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 3]}], "orig": "Non", "text": "Non"}, {"self_ref": "#/texts/448", "parent": {"cref": "#/pictures/11"}, "children": [], "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 285.63513, "t": 692.80023, "r": 299.3735, "b": 687.8430199999999, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 6]}], "orig": "Strict", "text": "Strict"}, {"self_ref": "#/texts/449", "parent": {"cref": "#/pictures/11"}, "children": [], "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 285.26111, "t": 686.68024, "r": 299.37537, "b": 681.72302, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "HTML", "text": "HTML"}, {"self_ref": "#/texts/450", "parent": {"cref": "#/pictures/11"}, "children": [], "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 285.43109, "t": 671.61005, "r": 299.16946, "b": 666.65283, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 6]}], "orig": "Strict", "text": "Strict"}, {"self_ref": "#/texts/451", "parent": {"cref": "#/pictures/11"}, "children": [], "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 285.05713, "t": 665.49005, "r": 299.17139, "b": 660.53284, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "HTML", "text": "HTML"}, {"self_ref": "#/texts/452", "parent": {"cref": "#/pictures/11"}, "children": [], "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 311.34592, "t": 650.28937, "r": 328.80933, "b": 645.33215, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 6]}], "orig": "Simple", "text": "Simple"}, {"self_ref": "#/texts/453", "parent": {"cref": "#/pictures/11"}, "children": [], "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 299.58362, "t": 705.30646, "r": 309.60205, "b": 700.34924, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 3]}], "orig": "47K", "text": "47K"}, {"self_ref": "#/texts/454", "parent": {"cref": "#/pictures/11"}, "children": [], "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 466.04077000000007, "t": 650.32831, "r": 483.50418, "b": 645.37109, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 6]}], "orig": "Simple", "text": "Simple"}, {"self_ref": "#/texts/455", "parent": {"cref": "#/pictures/11"}, "children": [], "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 459.02151, "t": 698.23883, "r": 469.16031000000004, "b": 693.28162, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 3]}], "orig": "Non", "text": "Non"}, {"self_ref": "#/texts/456", "parent": {"cref": "#/pictures/11"}, "children": [], "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 455.4209, "t": 692.11884, "r": 469.15927000000005, "b": 687.16162, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 6]}], "orig": "Strict", "text": "Strict"}, {"self_ref": "#/texts/457", "parent": {"cref": "#/pictures/11"}, "children": [], "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 455.04691, "t": 685.9988399999999, "r": 469.16115999999994, "b": 681.04163, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "HTML", "text": "HTML"}, {"self_ref": "#/texts/458", "parent": {"cref": "#/pictures/11"}, "children": [], "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 467.39401, "t": 706.42761, "r": 480.6545100000001, "b": 701.4704, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "145K", "text": "145K"}, {"self_ref": "#/texts/459", "parent": {"cref": "#/pictures/11"}, "children": [], "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 160.37672, "t": 650.41614, "r": 182.62802, "b": 645.45892, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 7]}], "orig": "Complex", "text": "Complex"}, {"self_ref": "#/texts/460", "parent": {"cref": "#/pictures/11"}, "children": [], "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 153.74265, "t": 697.13519, "r": 173.32664, "b": 692.17798, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 7]}], "orig": "Contain", "text": "Contain"}, {"self_ref": "#/texts/461", "parent": {"cref": "#/pictures/11"}, "children": [], "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 154.50967, "t": 691.0152, "r": 173.3246, "b": 686.0579799999999, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 7]}], "orig": "Missing", "text": "Missing"}, {"self_ref": "#/texts/462", "parent": {"cref": "#/pictures/11"}, "children": [], "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 155.27162, "t": 684.8952, "r": 173.32664, "b": 679.9379900000001, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 6]}], "orig": "bboxes", "text": "bboxes"}, {"self_ref": "#/texts/463", "parent": {"cref": "#/pictures/11"}, "children": [], "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 326.41302, "t": 684.76752, "r": 345.99701, "b": 679.8103, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 7]}], "orig": "Contain", "text": "Contain"}, {"self_ref": "#/texts/464", "parent": {"cref": "#/pictures/11"}, "children": [], "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 327.17972, "t": 678.64752, "r": 345.99463, "b": 673.69031, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 7]}], "orig": "Missing", "text": "Missing"}, {"self_ref": "#/texts/465", "parent": {"cref": "#/pictures/11"}, "children": [], "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 327.94131, "t": 672.52753, "r": 345.99634, "b": 667.57031, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 6]}], "orig": "bboxes", "text": "bboxes"}, {"self_ref": "#/texts/466", "parent": {"cref": "#/pictures/11"}, "children": [], "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 488.9942, "t": 687.8462500000002, "r": 508.76384999999993, "b": 682.88904, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 7]}], "orig": "Dataset", "text": "Dataset"}, {"self_ref": "#/texts/467", "parent": {"cref": "#/pictures/11"}, "children": [], "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 490.1893, "t": 681.72626, "r": 508.76349000000005, "b": 676.7690399999999, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 7]}], "orig": "doesn't", "text": "doesn't"}, {"self_ref": "#/texts/468", "parent": {"cref": "#/pictures/11"}, "children": [], "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 489.72009, "t": 675.60626, "r": 508.76758, "b": 670.6490499999999, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 7]}], "orig": "provide", "text": "provide"}, {"self_ref": "#/texts/469", "parent": {"cref": "#/pictures/11"}, "children": [], "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 490.71121, "t": 669.48627, "r": 508.76624, "b": 664.52905, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 6]}], "orig": "bboxes", "text": "bboxes"}, {"self_ref": "#/texts/470", "parent": {"cref": "#/pictures/11"}, "children": [], "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 185.37759, "t": 650.28882, "r": 202.84102, "b": 645.3316, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 6]}], "orig": "Simple", "text": "Simple"}, {"self_ref": "#/texts/471", "parent": {"cref": "#/pictures/11"}, "children": [], "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 168.50357, "t": 705.86389, "r": 197.52699, "b": 700.90668, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 9]}], "orig": "230K 280K", "text": "230K 280K"}, {"self_ref": "#/texts/472", "parent": {"cref": "#/pictures/11"}, "children": [], "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 357.3768, "t": 706.00293, "r": 367.39523, "b": 701.04572, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 3]}], "orig": "65K", "text": "65K"}, {"self_ref": "#/texts/473", "parent": {"cref": "#/pictures/11"}, "children": [], "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 333.73151, "t": 650.37677, "r": 374.92862, "b": 645.41956, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 14]}], "orig": "Complex Simple", "text": "Complex Simple"}, {"self_ref": "#/texts/474", "parent": {"cref": "#/pictures/11"}, "children": [], "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 345.69101, "t": 705.94409, "r": 355.70944, "b": 700.9868799999999, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 3]}], "orig": "47K", "text": "47K"}, {"self_ref": "#/texts/475", "parent": {"cref": "#/pictures/11"}, "children": [], "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 508.54248, "t": 650.62317, "r": 526.00592, "b": 645.66595, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 6]}], "orig": "Simple", "text": "Simple"}, {"self_ref": "#/texts/476", "parent": {"cref": "#/pictures/11"}, "children": [], "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 510.44653000000005, "t": 705.9074100000001, "r": 523.70703, "b": 700.9502, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "145K", "text": "145K"}, {"self_ref": "#/texts/477", "parent": {"cref": "#/groups/11"}, "children": [], "label": "list_item", "prov": [{"page_no": 12, "bbox": {"l": 61.569000244140625, "t": 581.068603515625, "r": 286.3651123046875, "b": 560.20703125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 61]}], "orig": "\u00b7 TableFormer output does not include the table cell content.", "text": "\u00b7 TableFormer output does not include the table cell content.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/478", "parent": {"cref": "#/groups/11"}, "children": [], "label": "list_item", "prov": [{"page_no": 12, "bbox": {"l": 61.569000244140625, "t": 547.9285888671875, "r": 286.3651428222656, "b": 527.0670166015625, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 77]}], "orig": "\u00b7 There are occasional inaccuracies in the predictions of the bounding boxes.", "text": "\u00b7 There are occasional inaccuracies in the predictions of the bounding boxes.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/479", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 50.11199951171875, "t": 512.7965698242188, "r": 286.3651123046875, "b": 396.2931213378906, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 545]}], "orig": "However, it is possible to mitigate those limitations by combining the TableFormer predictions with the information already present inside a programmatic PDF document. More specifically, PDF documents can be seen as a sequence of PDF cells where each cell is described by its content and bounding box. If we are able to associate the PDF cells with the predicted table cells, we can directly link the PDF cell content to the table cell structure and use the PDF bounding boxes to correct misalignments in the predicted table cell bounding boxes.", "text": "However, it is possible to mitigate those limitations by combining the TableFormer predictions with the information already present inside a programmatic PDF document. More specifically, PDF documents can be seen as a sequence of PDF cells where each cell is described by its content and bounding box. If we are able to associate the PDF cells with the predicted table cells, we can directly link the PDF cell content to the table cell structure and use the PDF bounding boxes to correct misalignments in the predicted table cell bounding boxes."}, {"self_ref": "#/texts/480", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 50.11199951171875, "t": 392.9306640625, "r": 286.3649597167969, "b": 372.068115234375, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 68]}], "orig": "Here is a step-by-step description of the prediction postprocessing:", "text": "Here is a step-by-step description of the prediction postprocessing:"}, {"self_ref": "#/texts/481", "parent": {"cref": "#/groups/12"}, "children": [], "label": "list_item", "prov": [{"page_no": 12, "bbox": {"l": 50.11199951171875, "t": 368.7046813964844, "r": 286.3650817871094, "b": 335.8881530761719, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 173]}], "orig": "1. Get the minimal grid dimensions - number of rows and columns for the predicted table structure. This represents the most granular grid for the underlying table structure.", "text": "1. Get the minimal grid dimensions - number of rows and columns for the predicted table structure. This represents the most granular grid for the underlying table structure.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/482", "parent": {"cref": "#/groups/12"}, "children": [], "label": "list_item", "prov": [{"page_no": 12, "bbox": {"l": 50.11199951171875, "t": 332.52471923828125, "r": 286.36505126953125, "b": 287.7532043457031, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 187]}], "orig": "2. Generate pair-wise matches between the bounding boxes of the PDF cells and the predicted cells. The Intersection Over Union (IOU) metric is used to evaluate the quality of the matches.", "text": "2. Generate pair-wise matches between the bounding boxes of the PDF cells and the predicted cells. The Intersection Over Union (IOU) metric is used to evaluate the quality of the matches.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/483", "parent": {"cref": "#/groups/12"}, "children": [], "label": "list_item", "prov": [{"page_no": 12, "bbox": {"l": 50.11199951171875, "t": 284.3897705078125, "r": 286.36492919921875, "b": 263.5272216796875, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 97]}], "orig": "3. Use a carefully selected IOU threshold to designate the matches as \"good\" ones and \"bad\" ones.", "text": "3. Use a carefully selected IOU threshold to designate the matches as \"good\" ones and \"bad\" ones.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/484", "parent": {"cref": "#/groups/12"}, "children": [], "label": "list_item", "prov": [{"page_no": 12, "bbox": {"l": 50.11199951171875, "t": 260.164794921875, "r": 286.3651123046875, "b": 227.34722900390625, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 131]}], "orig": "3.a. If all IOU scores in a column are below the threshold, discard all predictions (structure and bounding boxes) for that column.", "text": "3.a. If all IOU scores in a column are below the threshold, discard all predictions (structure and bounding boxes) for that column.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/485", "parent": {"cref": "#/groups/12"}, "children": [], "label": "list_item", "prov": [{"page_no": 12, "bbox": {"l": 50.11199951171875, "t": 223.98377990722656, "r": 286.3650817871094, "b": 191.16722106933594, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 169]}], "orig": "4. Find the best-fitting content alignment for the predicted cells with good IOU per each column. The alignment of the column can be identified by the following formula:", "text": "4. Find the best-fitting content alignment for the predicted cells with good IOU per each column. The alignment of the column can be identified by the following formula:", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/486", "parent": {"cref": "#/body"}, "children": [], "label": "formula", "prov": [{"page_no": 12, "bbox": {"l": 110.70498657226562, "t": 168.5640869140625, "r": 286.3623962402344, "b": 137.89439392089844, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 81]}], "orig": "alignment = arg min c { D$_{c}$ } D$_{c}$ = max { x$_{c}$ } - min { x$_{c}$ } (4)", "text": "alignment = arg min c { D$_{c}$ } D$_{c}$ = max { x$_{c}$ } - min { x$_{c}$ } (4)"}, {"self_ref": "#/texts/487", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 50.11199951171875, "t": 124.6520767211914, "r": 286.36199951171875, "b": 103.07321166992188, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 103]}], "orig": "where c is one of { left, centroid, right } and x$_{c}$ is the xcoordinate for the corresponding point.", "text": "where c is one of { left, centroid, right } and x$_{c}$ is the xcoordinate for the corresponding point."}, {"self_ref": "#/texts/488", "parent": {"cref": "#/groups/13"}, "children": [], "label": "list_item", "prov": [{"page_no": 12, "bbox": {"l": 50.11199951171875, "t": 99.70977783203125, "r": 286.3649597167969, "b": 78.84821319580078, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 110]}], "orig": "5. Use the alignment computed in step 4, to compute the median x -coordinate for all table columns and the me-", "text": "5. Use the alignment computed in step 4, to compute the median x -coordinate for all table columns and the me-", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/489", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 308.86199951171875, "t": 581.0687866210938, "r": 545.1151733398438, "b": 536.2962036132812, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 183]}], "orig": "dian cell size for all table cells. The usage of median during the computations, helps to eliminate outliers caused by occasional column spans which are usually wider than the normal.", "text": "dian cell size for all table cells. The usage of median during the computations, helps to eliminate outliers caused by occasional column spans which are usually wider than the normal."}, {"self_ref": "#/texts/490", "parent": {"cref": "#/groups/14"}, "children": [], "label": "list_item", "prov": [{"page_no": 12, "bbox": {"l": 308.86199951171875, "t": 532.8977661132812, "r": 545.114990234375, "b": 512.0361938476562, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 91]}], "orig": "6. Snap all cells with bad IOU to their corresponding median x -coordinates and cell sizes.", "text": "6. Snap all cells with bad IOU to their corresponding median x -coordinates and cell sizes.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/491", "parent": {"cref": "#/groups/14"}, "children": [], "label": "list_item", "prov": [{"page_no": 12, "bbox": {"l": 308.8620300292969, "t": 508.6367492675781, "r": 545.1151123046875, "b": 404.08929443359375, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 471]}], "orig": "7. Generate a new set of pair-wise matches between the corrected bounding boxes and PDF cells. This time use a modified version of the IOU metric, where the area of the intersection between the predicted and PDF cells is divided by the PDF cell area. In case there are multiple matches for the same PDF cell, the prediction with the higher score is preferred. This covers the cases where the PDF cells are smaller than the area of predicted or corrected prediction cells.", "text": "7. Generate a new set of pair-wise matches between the corrected bounding boxes and PDF cells. This time use a modified version of the IOU metric, where the area of the intersection between the predicted and PDF cells is divided by the PDF cell area. In case there are multiple matches for the same PDF cell, the prediction with the higher score is preferred. This covers the cases where the PDF cells are smaller than the area of predicted or corrected prediction cells.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/492", "parent": {"cref": "#/groups/14"}, "children": [], "label": "list_item", "prov": [{"page_no": 12, "bbox": {"l": 308.8620300292969, "t": 400.6898498535156, "r": 545.1151733398438, "b": 332.00836181640625, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 311]}], "orig": "8. In some rare occasions, we have noticed that TableFormer can confuse a single column as two. When the postprocessing steps are applied, this results with two predicted columns pointing to the same PDF column. In such case we must de-duplicate the columns according to highest total column intersection score.", "text": "8. In some rare occasions, we have noticed that TableFormer can confuse a single column as two. When the postprocessing steps are applied, this results with two predicted columns pointing to the same PDF column. In such case we must de-duplicate the columns according to highest total column intersection score.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/493", "parent": {"cref": "#/groups/14"}, "children": [], "label": "list_item", "prov": [{"page_no": 12, "bbox": {"l": 308.8620300292969, "t": 328.6089172363281, "r": 545.1151733398438, "b": 224.06141662597656, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 503]}], "orig": "9. Pick up the remaining orphan cells. There could be cases, when after applying all the previous post-processing steps, some PDF cells could still remain without any match to predicted cells. However, it is still possible to deduce the correct matching for an orphan PDF cell by mapping its bounding box on the geometry of the grid. This mapping decides if the content of the orphan cell will be appended to an already matched table cell, or a new table cell should be created to match with the orphan.", "text": "9. Pick up the remaining orphan cells. There could be cases, when after applying all the previous post-processing steps, some PDF cells could still remain without any match to predicted cells. However, it is still possible to deduce the correct matching for an orphan PDF cell by mapping its bounding box on the geometry of the grid. This mapping decides if the content of the orphan cell will be appended to an already matched table cell, or a new table cell should be created to match with the orphan.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/494", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 308.8620300292969, "t": 220.66197204589844, "r": 545.1168823242188, "b": 187.8454132080078, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 113]}], "orig": "9a. Compute the top and bottom boundary of the horizontal band for each grid row (min/max y coordinates per row).", "text": "9a. Compute the top and bottom boundary of the horizontal band for each grid row (min/max y coordinates per row)."}, {"self_ref": "#/texts/495", "parent": {"cref": "#/groups/15"}, "children": [], "label": "list_item", "prov": [{"page_no": 12, "bbox": {"l": 308.862060546875, "t": 184.44696044921875, "r": 545.1150512695312, "b": 163.58441162109375, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 101]}], "orig": "9b. Intersect the orphan's bounding box with the row bands, and map the cell to the closest grid row.", "text": "9b. Intersect the orphan's bounding box with the row bands, and map the cell to the closest grid row.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/496", "parent": {"cref": "#/groups/15"}, "children": [], "label": "list_item", "prov": [{"page_no": 12, "bbox": {"l": 308.862060546875, "t": 160.18597412109375, "r": 545.1150512695312, "b": 127.3694076538086, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 117]}], "orig": "9c. Compute the left and right boundary of the vertical band for each grid column (min/max x coordinates per column).", "text": "9c. Compute the left and right boundary of the vertical band for each grid column (min/max x coordinates per column).", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/497", "parent": {"cref": "#/groups/15"}, "children": [], "label": "list_item", "prov": [{"page_no": 12, "bbox": {"l": 308.862060546875, "t": 123.969970703125, "r": 545.114990234375, "b": 103.10841369628906, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 107]}], "orig": "9d. Intersect the orphan's bounding box with the column bands, and map the cell to the closest grid column.", "text": "9d. Intersect the orphan's bounding box with the column bands, and map the cell to the closest grid column.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/498", "parent": {"cref": "#/groups/15"}, "children": [], "label": "list_item", "prov": [{"page_no": 12, "bbox": {"l": 308.862060546875, "t": 99.70997619628906, "r": 545.1151733398438, "b": 78.84840393066406, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 118]}], "orig": "9e. If the table cell under the identified row and column is not empty, extend its content with the content of the or-", "text": "9e. If the table cell under the identified row and column is not empty, extend its content with the content of the or-", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/499", "parent": {"cref": "#/body"}, "children": [], "label": "page_footer", "prov": [{"page_no": 12, "bbox": {"l": 292.6310729980469, "t": 57.86697006225586, "r": 302.5936584472656, "b": 48.96040725708008, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "12", "text": "12"}, {"self_ref": "#/texts/500", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 13, "bbox": {"l": 50.11199951171875, "t": 716.7916259765625, "r": 88.84658813476562, "b": 707.8850708007812, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 10]}], "orig": "phan cell.", "text": "phan cell."}, {"self_ref": "#/texts/501", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 13, "bbox": {"l": 50.11199951171875, "t": 704.8366088867188, "r": 286.3649597167969, "b": 683.9750366210938, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 76]}], "orig": "9f. Otherwise create a new structural cell and match it wit the orphan cell.", "text": "9f. Otherwise create a new structural cell and match it wit the orphan cell."}, {"self_ref": "#/texts/502", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 13, "bbox": {"l": 50.11199951171875, "t": 680.8369140625, "r": 286.364990234375, "b": 660.2941284179688, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 97]}], "orig": "Aditional images with examples of TableFormer predictions and post-processing can be found below.", "text": "Aditional images with examples of TableFormer predictions and post-processing can be found below."}, {"self_ref": "#/texts/503", "parent": {"cref": "#/body"}, "children": [], "label": "caption", "prov": [{"page_no": 13, "bbox": {"l": 63.340999603271484, "t": 289.9436340332031, "r": 273.1334228515625, "b": 281.0370788574219, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 52]}], "orig": "Figure 8: Example of a table with multi-line header.", "text": "Figure 8: Example of a table with multi-line header."}, {"self_ref": "#/texts/504", "parent": {"cref": "#/body"}, "children": [], "label": "page_footer", "prov": [{"page_no": 13, "bbox": {"l": 292.6309814453125, "t": 57.866641998291016, "r": 302.59356689453125, "b": 48.960079193115234, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "13", "text": "13"}, {"self_ref": "#/texts/505", "parent": {"cref": "#/body"}, "children": [], "label": "caption", "prov": [{"page_no": 13, "bbox": {"l": 308.86199951171875, "t": 485.4016418457031, "r": 545.1151123046875, "b": 464.54010009765625, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 67]}], "orig": "Figure 9: Example of a table with big empty distance between cells.", "text": "Figure 9: Example of a table with big empty distance between cells."}, {"self_ref": "#/texts/506", "parent": {"cref": "#/body"}, "children": [], "label": "caption", "prov": [{"page_no": 13, "bbox": {"l": 312.3429870605469, "t": 111.50663757324219, "r": 541.63232421875, "b": 102.60006713867188, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 55]}], "orig": "Figure 10: Example of a complex table with empty cells.", "text": "Figure 10: Example of a complex table with empty cells."}, {"self_ref": "#/texts/507", "parent": {"cref": "#/body"}, "children": [], "label": "caption", "prov": [{"page_no": 14, "bbox": {"l": 50.11199951171875, "t": 435.2296447753906, "r": 286.3650817871094, "b": 414.36810302734375, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 61]}], "orig": "Figure 11: Simple table with different style and empty cells.", "text": "Figure 11: Simple table with different style and empty cells."}, {"self_ref": "#/texts/508", "parent": {"cref": "#/body"}, "children": [], "label": "caption", "prov": [{"page_no": 14, "bbox": {"l": 54.61899948120117, "t": 120.181640625, "r": 281.85589599609375, "b": 111.27507781982422, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 56]}], "orig": "Figure 12: Simple table predictions and post processing.", "text": "Figure 12: Simple table predictions and post processing."}, {"self_ref": "#/texts/509", "parent": {"cref": "#/body"}, "children": [], "label": "page_footer", "prov": [{"page_no": 14, "bbox": {"l": 292.6309814453125, "t": 57.86663818359375, "r": 302.59356689453125, "b": 48.96007537841797, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "14", "text": "14"}, {"self_ref": "#/texts/510", "parent": {"cref": "#/body"}, "children": [], "label": "caption", "prov": [{"page_no": 14, "bbox": {"l": 315.7900085449219, "t": 420.3156433105469, "r": 538.1852416992188, "b": 411.4090881347656, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 55]}], "orig": "Figure 13: Table predictions example on colorful table.", "text": "Figure 13: Table predictions example on colorful table."}, {"self_ref": "#/texts/511", "parent": {"cref": "#/body"}, "children": [], "label": "caption", "prov": [{"page_no": 14, "bbox": {"l": 344.9849853515625, "t": 108.45364379882812, "r": 508.9893493652344, "b": 99.54707336425781, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 40]}], "orig": "Figure 14: Example with multi-line text.", "text": "Figure 14: Example with multi-line text."}, {"self_ref": "#/texts/512", "parent": {"cref": "#/body"}, "children": [], "label": "caption", "prov": [{"page_no": 15, "bbox": {"l": 84.23300170898438, "t": 147.64862060546875, "r": 252.24224853515625, "b": 138.7420654296875, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 41]}], "orig": "Figure 15: Example with triangular table.", "text": "Figure 15: Example with triangular table."}, {"self_ref": "#/texts/513", "parent": {"cref": "#/body"}, "children": [], "label": "page_footer", "prov": [{"page_no": 15, "bbox": {"l": 292.6309814453125, "t": 57.86665725708008, "r": 302.59356689453125, "b": 48.9600944519043, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "15", "text": "15"}, {"self_ref": "#/texts/514", "parent": {"cref": "#/body"}, "children": [], "label": "caption", "prov": [{"page_no": 15, "bbox": {"l": 308.8619689941406, "t": 139.0646514892578, "r": 545.1151123046875, "b": 118.20308685302734, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 106]}], "orig": "Figure 16: Example of how post-processing helps to restore mis-aligned bounding boxes prediction artifact.", "text": "Figure 16: Example of how post-processing helps to restore mis-aligned bounding boxes prediction artifact."}, {"self_ref": "#/texts/515", "parent": {"cref": "#/body"}, "children": [], "label": "caption", "prov": [{"page_no": 16, "bbox": {"l": 50.11199951171875, "t": 283.6626281738281, "r": 545.1138305664062, "b": 262.80108642578125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 153]}], "orig": "Figure 17: Example of long table. End-to-end example from initial PDF cells to prediction of bounding boxes, post processing and prediction of structure.", "text": "Figure 17: Example of long table. End-to-end example from initial PDF cells to prediction of bounding boxes, post processing and prediction of structure."}, {"self_ref": "#/texts/516", "parent": {"cref": "#/body"}, "children": [], "label": "page_footer", "prov": [{"page_no": 16, "bbox": {"l": 292.6309814453125, "t": 57.866641998291016, "r": 302.59356689453125, "b": 48.960079193115234, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "16", "text": "16"}], "pictures": [{"self_ref": "#/pictures/0", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/8"}, {"cref": "#/texts/9"}, {"cref": "#/texts/10"}], "label": "picture", "prov": [{"page_no": 1, "bbox": {"l": 315.65362548828125, "t": 563.276611328125, "r": 537.1475219726562, "b": 489.1985778808594, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "annotations": []}, {"self_ref": "#/pictures/1", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/13"}, {"cref": "#/texts/14"}, {"cref": "#/texts/15"}, {"cref": "#/texts/16"}, {"cref": "#/texts/17"}, {"cref": "#/texts/18"}, {"cref": "#/texts/19"}, {"cref": "#/texts/20"}, {"cref": "#/texts/21"}, {"cref": "#/texts/22"}, {"cref": "#/texts/23"}, {"cref": "#/texts/24"}, {"cref": "#/texts/25"}, {"cref": "#/texts/26"}, {"cref": "#/texts/27"}, {"cref": "#/texts/28"}, {"cref": "#/texts/29"}, {"cref": "#/texts/30"}, {"cref": "#/texts/31"}, {"cref": "#/texts/32"}, {"cref": "#/texts/33"}, {"cref": "#/texts/34"}, {"cref": "#/texts/35"}, {"cref": "#/texts/36"}, {"cref": "#/texts/37"}], "label": "picture", "prov": [{"page_no": 1, "bbox": {"l": 314.78173828125, "t": 453.9347229003906, "r": 539.1802978515625, "b": 381.9505615234375, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "annotations": []}, {"self_ref": "#/pictures/2", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/39"}, {"cref": "#/texts/40"}, {"cref": "#/texts/41"}, {"cref": "#/texts/42"}, {"cref": "#/texts/43"}, {"cref": "#/texts/44"}, {"cref": "#/texts/45"}, {"cref": "#/texts/46"}, {"cref": "#/texts/47"}, {"cref": "#/texts/48"}, {"cref": "#/texts/49"}, {"cref": "#/texts/50"}, {"cref": "#/texts/51"}, {"cref": "#/texts/52"}, {"cref": "#/texts/53"}, {"cref": "#/texts/54"}, {"cref": "#/texts/55"}, {"cref": "#/texts/56"}, {"cref": "#/texts/57"}, {"cref": "#/texts/58"}, {"cref": "#/texts/59"}, {"cref": "#/texts/60"}, {"cref": "#/texts/61"}, {"cref": "#/texts/62"}], "label": "picture", "prov": [{"page_no": 1, "bbox": {"l": 315.7172546386719, "t": 358.176513671875, "r": 536.835693359375, "b": 295.9709777832031, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "annotations": []}, {"self_ref": "#/pictures/3", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/91"}, {"cref": "#/texts/92"}, {"cref": "#/texts/93"}, {"cref": "#/texts/94"}, {"cref": "#/texts/95"}, {"cref": "#/texts/96"}, {"cref": "#/texts/97"}, {"cref": "#/texts/98"}, {"cref": "#/texts/99"}, {"cref": "#/texts/100"}, {"cref": "#/texts/101"}, {"cref": "#/texts/102"}, {"cref": "#/texts/103"}, {"cref": "#/texts/104"}, {"cref": "#/texts/105"}, {"cref": "#/texts/106"}, {"cref": "#/texts/107"}, {"cref": "#/texts/108"}, {"cref": "#/texts/109"}, {"cref": "#/texts/110"}, {"cref": "#/texts/111"}, {"cref": "#/texts/112"}, {"cref": "#/texts/113"}, {"cref": "#/texts/114"}, {"cref": "#/texts/115"}, {"cref": "#/texts/116"}, {"cref": "#/texts/117"}, {"cref": "#/texts/118"}, {"cref": "#/texts/119"}, {"cref": "#/texts/120"}, {"cref": "#/texts/121"}, {"cref": "#/texts/122"}, {"cref": "#/texts/123"}], "label": "picture", "prov": [{"page_no": 3, "bbox": {"l": 312.10369873046875, "t": 713.5591430664062, "r": 550.38916015625, "b": 541.39013671875, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 104]}], "captions": [{"cref": "#/texts/90"}], "references": [], "footnotes": [], "image": null, "annotations": []}, {"self_ref": "#/pictures/4", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/142"}, {"cref": "#/texts/143"}, {"cref": "#/texts/144"}, {"cref": "#/texts/145"}, {"cref": "#/texts/146"}, {"cref": "#/texts/147"}, {"cref": "#/texts/148"}, {"cref": "#/texts/149"}, {"cref": "#/texts/150"}, {"cref": "#/texts/151"}, {"cref": "#/texts/152"}, {"cref": "#/texts/153"}, {"cref": "#/texts/154"}, {"cref": "#/texts/155"}, {"cref": "#/texts/156"}, {"cref": "#/texts/157"}, {"cref": "#/texts/158"}, {"cref": "#/texts/159"}, {"cref": "#/texts/160"}, {"cref": "#/texts/161"}, {"cref": "#/texts/162"}, {"cref": "#/texts/163"}, {"cref": "#/texts/164"}, {"cref": "#/texts/165"}, {"cref": "#/texts/166"}, {"cref": "#/texts/167"}, {"cref": "#/texts/168"}, {"cref": "#/texts/169"}, {"cref": "#/texts/170"}, {"cref": "#/texts/171"}, {"cref": "#/texts/172"}, {"cref": "#/texts/173"}, {"cref": "#/texts/174"}, {"cref": "#/texts/175"}, {"cref": "#/texts/176"}, {"cref": "#/texts/177"}, {"cref": "#/texts/178"}, {"cref": "#/texts/179"}, {"cref": "#/texts/180"}, {"cref": "#/texts/181"}, {"cref": "#/texts/182"}, {"cref": "#/texts/183"}, {"cref": "#/texts/184"}, {"cref": "#/texts/185"}, {"cref": "#/texts/186"}, {"cref": "#/texts/187"}, {"cref": "#/texts/188"}, {"cref": "#/texts/189"}, {"cref": "#/texts/190"}, {"cref": "#/texts/191"}, {"cref": "#/texts/192"}, {"cref": "#/texts/193"}, {"cref": "#/texts/194"}, {"cref": "#/texts/195"}, {"cref": "#/texts/196"}, {"cref": "#/texts/197"}, {"cref": "#/texts/198"}, {"cref": "#/texts/199"}, {"cref": "#/texts/200"}], "label": "picture", "prov": [{"page_no": 5, "bbox": {"l": 74.30525970458984, "t": 714.0888061523438, "r": 519.9801025390625, "b": 608.2984619140625, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 212]}], "captions": [{"cref": "#/texts/141"}], "references": [], "footnotes": [], "image": null, "annotations": []}, {"self_ref": "#/pictures/5", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/202"}, {"cref": "#/texts/203"}, {"cref": "#/texts/204"}, {"cref": "#/texts/205"}, {"cref": "#/texts/206"}, {"cref": "#/texts/207"}, {"cref": "#/texts/208"}, {"cref": "#/texts/209"}, {"cref": "#/texts/210"}, {"cref": "#/texts/211"}, {"cref": "#/texts/212"}, {"cref": "#/texts/213"}, {"cref": "#/texts/214"}, {"cref": "#/texts/215"}, {"cref": "#/texts/216"}, {"cref": "#/texts/217"}, {"cref": "#/texts/218"}, {"cref": "#/texts/219"}, {"cref": "#/texts/220"}, {"cref": "#/texts/221"}, {"cref": "#/texts/222"}, {"cref": "#/texts/223"}, {"cref": "#/texts/224"}, {"cref": "#/texts/225"}, {"cref": "#/texts/226"}, {"cref": "#/texts/227"}, {"cref": "#/texts/228"}, {"cref": "#/texts/229"}, {"cref": "#/texts/230"}, {"cref": "#/texts/231"}, {"cref": "#/texts/232"}, {"cref": "#/texts/233"}, {"cref": "#/texts/234"}, {"cref": "#/texts/235"}, {"cref": "#/texts/236"}, {"cref": "#/texts/237"}, {"cref": "#/texts/238"}, {"cref": "#/texts/239"}, {"cref": "#/texts/240"}, {"cref": "#/texts/241"}, {"cref": "#/texts/242"}, {"cref": "#/texts/243"}, {"cref": "#/texts/244"}, {"cref": "#/texts/245"}], "label": "picture", "prov": [{"page_no": 5, "bbox": {"l": 53.03328323364258, "t": 534.3346557617188, "r": 285.3731689453125, "b": 284.3311462402344, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 745]}], "captions": [{"cref": "#/texts/201"}], "references": [], "footnotes": [], "image": null, "annotations": []}, {"self_ref": "#/pictures/6", "parent": {"cref": "#/body"}, "children": [], "label": "picture", "prov": [{"page_no": 8, "bbox": {"l": 49.97503662109375, "t": 688.287353515625, "r": 301.6335754394531, "b": 604.4210815429688, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "annotations": []}, {"self_ref": "#/pictures/7", "parent": {"cref": "#/body"}, "children": [], "label": "picture", "prov": [{"page_no": 8, "bbox": {"l": 305.5836486816406, "t": 693.3458251953125, "r": 554.8258666992188, "b": 611.3732299804688, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 79]}], "captions": [{"cref": "#/texts/289"}], "references": [], "footnotes": [], "image": null, "annotations": []}, {"self_ref": "#/pictures/8", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/292"}], "label": "picture", "prov": [{"page_no": 8, "bbox": {"l": 51.736167907714844, "t": 411.51934814453125, "r": 211.83778381347656, "b": 348.3419189453125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 397]}], "captions": [{"cref": "#/texts/291"}], "references": [], "footnotes": [], "image": null, "annotations": []}, {"self_ref": "#/pictures/9", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/293"}, {"cref": "#/texts/294"}, {"cref": "#/texts/295"}, {"cref": "#/texts/296"}, {"cref": "#/texts/297"}, {"cref": "#/texts/298"}, {"cref": "#/texts/299"}, {"cref": "#/texts/300"}, {"cref": "#/texts/301"}, {"cref": "#/texts/302"}, {"cref": "#/texts/303"}, {"cref": "#/texts/304"}, {"cref": "#/texts/305"}, {"cref": "#/texts/306"}, {"cref": "#/texts/307"}, {"cref": "#/texts/308"}, {"cref": "#/texts/309"}, {"cref": "#/texts/310"}, {"cref": "#/texts/311"}, {"cref": "#/texts/312"}, {"cref": "#/texts/313"}, {"cref": "#/texts/314"}, {"cref": "#/texts/315"}, {"cref": "#/texts/316"}, {"cref": "#/texts/317"}, {"cref": "#/texts/318"}, {"cref": "#/texts/319"}, {"cref": "#/texts/320"}, {"cref": "#/texts/321"}, {"cref": "#/texts/322"}, {"cref": "#/texts/323"}, {"cref": "#/texts/324"}, {"cref": "#/texts/325"}, {"cref": "#/texts/326"}, {"cref": "#/texts/327"}, {"cref": "#/texts/328"}, {"cref": "#/texts/329"}, {"cref": "#/texts/330"}, {"cref": "#/texts/331"}, {"cref": "#/texts/332"}, {"cref": "#/texts/333"}, {"cref": "#/texts/334"}, {"cref": "#/texts/335"}, {"cref": "#/texts/336"}, {"cref": "#/texts/337"}, {"cref": "#/texts/338"}, {"cref": "#/texts/339"}, {"cref": "#/texts/340"}, {"cref": "#/texts/341"}, {"cref": "#/texts/342"}, {"cref": "#/texts/343"}, {"cref": "#/texts/344"}, {"cref": "#/texts/345"}, {"cref": "#/texts/346"}, {"cref": "#/texts/347"}], "label": "picture", "prov": [{"page_no": 8, "bbox": {"l": 383.1364440917969, "t": 410.7686767578125, "r": 542.1132202148438, "b": 349.2250671386719, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "annotations": []}, {"self_ref": "#/pictures/10", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/349"}], "label": "picture", "prov": [{"page_no": 8, "bbox": {"l": 216.76925659179688, "t": 411.5093688964844, "r": 375.7829284667969, "b": 348.65301513671875, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 112]}], "captions": [{"cref": "#/texts/348"}], "references": [], "footnotes": [], "image": null, "annotations": []}, {"self_ref": "#/pictures/11", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/418"}, {"cref": "#/texts/419"}, {"cref": "#/texts/420"}, {"cref": "#/texts/421"}, {"cref": "#/texts/422"}, {"cref": "#/texts/423"}, {"cref": "#/texts/424"}, {"cref": "#/texts/425"}, {"cref": "#/texts/426"}, {"cref": "#/texts/427"}, {"cref": "#/texts/428"}, {"cref": "#/texts/429"}, {"cref": "#/texts/430"}, {"cref": "#/texts/431"}, {"cref": "#/texts/432"}, {"cref": "#/texts/433"}, {"cref": "#/texts/434"}, {"cref": "#/texts/435"}, {"cref": "#/texts/436"}, {"cref": "#/texts/437"}, {"cref": "#/texts/438"}, {"cref": "#/texts/439"}, {"cref": "#/texts/440"}, {"cref": "#/texts/441"}, {"cref": "#/texts/442"}, {"cref": "#/texts/443"}, {"cref": "#/texts/444"}, {"cref": "#/texts/445"}, {"cref": "#/texts/446"}, {"cref": "#/texts/447"}, {"cref": "#/texts/448"}, {"cref": "#/texts/449"}, {"cref": "#/texts/450"}, {"cref": "#/texts/451"}, {"cref": "#/texts/452"}, {"cref": "#/texts/453"}, {"cref": "#/texts/454"}, {"cref": "#/texts/455"}, {"cref": "#/texts/456"}, {"cref": "#/texts/457"}, {"cref": "#/texts/458"}, {"cref": "#/texts/459"}, {"cref": "#/texts/460"}, {"cref": "#/texts/461"}, {"cref": "#/texts/462"}, {"cref": "#/texts/463"}, {"cref": "#/texts/464"}, {"cref": "#/texts/465"}, {"cref": "#/texts/466"}, {"cref": "#/texts/467"}, {"cref": "#/texts/468"}, {"cref": "#/texts/469"}, {"cref": "#/texts/470"}, {"cref": "#/texts/471"}, {"cref": "#/texts/472"}, {"cref": "#/texts/473"}, {"cref": "#/texts/474"}, {"cref": "#/texts/475"}, {"cref": "#/texts/476"}], "label": "picture", "prov": [{"page_no": 12, "bbox": {"l": 53.54227066040039, "t": 717.25146484375, "r": 544.938232421875, "b": 644.4090576171875, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 245]}], "captions": [{"cref": "#/texts/417"}], "references": [], "footnotes": [], "image": null, "annotations": []}, {"self_ref": "#/pictures/12", "parent": {"cref": "#/body"}, "children": [], "label": "picture", "prov": [{"page_no": 13, "bbox": {"l": 309.79150390625, "t": 538.0946044921875, "r": 425.9603271484375, "b": 499.60601806640625, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "annotations": []}, {"self_ref": "#/pictures/13", "parent": {"cref": "#/body"}, "children": [], "label": "picture", "prov": [{"page_no": 13, "bbox": {"l": 333.9573669433594, "t": 198.8865966796875, "r": 518.4768676757812, "b": 126.5096435546875, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "annotations": []}, {"self_ref": "#/pictures/14", "parent": {"cref": "#/body"}, "children": [], "label": "picture", "prov": [{"page_no": 14, "bbox": {"l": 51.15378952026367, "t": 687.6914672851562, "r": 282.8598937988281, "b": 447.09332275390625, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 61]}], "captions": [{"cref": "#/texts/507"}], "references": [], "footnotes": [], "image": null, "annotations": []}, {"self_ref": "#/pictures/15", "parent": {"cref": "#/body"}, "children": [], "label": "picture", "prov": [{"page_no": 14, "bbox": {"l": 50.40477752685547, "t": 180.99615478515625, "r": 177.0564422607422, "b": 135.83905029296875, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 56]}], "captions": [{"cref": "#/texts/508"}], "references": [], "footnotes": [], "image": null, "annotations": []}, {"self_ref": "#/pictures/16", "parent": {"cref": "#/body"}, "children": [], "label": "picture", "prov": [{"page_no": 14, "bbox": {"l": 318.6332092285156, "t": 701.1157836914062, "r": 534.73583984375, "b": 432.9424133300781, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 55]}], "captions": [{"cref": "#/texts/510"}], "references": [], "footnotes": [], "image": null, "annotations": []}, {"self_ref": "#/pictures/17", "parent": {"cref": "#/body"}, "children": [], "label": "picture", "prov": [{"page_no": 15, "bbox": {"l": 55.116363525390625, "t": 655.7449951171875, "r": 279.370849609375, "b": 542.6654663085938, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "annotations": []}, {"self_ref": "#/pictures/18", "parent": {"cref": "#/body"}, "children": [], "label": "picture", "prov": [{"page_no": 15, "bbox": {"l": 54.28135299682617, "t": 531.7384033203125, "r": 279.2568359375, "b": 418.4729309082031, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "annotations": []}, {"self_ref": "#/pictures/19", "parent": {"cref": "#/body"}, "children": [], "label": "picture", "prov": [{"page_no": 15, "bbox": {"l": 55.423954010009766, "t": 407.4449462890625, "r": 280.2310791015625, "b": 294.436279296875, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "annotations": []}, {"self_ref": "#/pictures/20", "parent": {"cref": "#/body"}, "children": [], "label": "picture", "prov": [{"page_no": 15, "bbox": {"l": 50.64818572998047, "t": 286.01953125, "r": 319.9103088378906, "b": 160.736328125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "annotations": []}, {"self_ref": "#/pictures/21", "parent": {"cref": "#/body"}, "children": [], "label": "picture", "prov": [{"page_no": 15, "bbox": {"l": 323.46868896484375, "t": 429.5491638183594, "r": 525.9569091796875, "b": 327.739501953125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "annotations": []}, {"self_ref": "#/pictures/22", "parent": {"cref": "#/body"}, "children": [], "label": "picture", "prov": [{"page_no": 15, "bbox": {"l": 353.6920471191406, "t": 304.594970703125, "r": 495.4288024902344, "b": 156.22674560546875, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "annotations": []}, {"self_ref": "#/pictures/23", "parent": {"cref": "#/body"}, "children": [], "label": "picture", "prov": [{"page_no": 16, "bbox": {"l": 66.79948425292969, "t": 538.3836669921875, "r": 528.5565795898438, "b": 293.8616027832031, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 153]}], "captions": [{"cref": "#/texts/515"}], "references": [], "footnotes": [], "image": null, "annotations": []}], "tables": [{"self_ref": "#/tables/0", "parent": {"cref": "#/body"}, "children": [], "label": "table", "prov": [{"page_no": 1, "bbox": {"l": 315.65362548828125, "t": 563.276611328125, "r": 537.1475219726562, "b": 489.1985778808594, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [{"cref": "#/texts/11"}], "references": [], "footnotes": [], "image": null, "data": {"table_cells": [{"bbox": {"l": 384.03289794921875, "t": 539.321044921875, "r": 390.0376892089844, "b": 529.1906127929688, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 451.9457092285156, "t": 556.6529541015625, "r": 457.95050048828125, "b": 546.5225219726562, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "1", "column_header": true, "row_header": false, "row_section": false}], "num_rows": 1, "num_cols": 2, "grid": [[{"bbox": {"l": 384.03289794921875, "t": 539.321044921875, "r": 390.0376892089844, "b": 529.1906127929688, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 451.9457092285156, "t": 556.6529541015625, "r": 457.95050048828125, "b": 546.5225219726562, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "1", "column_header": true, "row_header": false, "row_section": false}]]}}, {"self_ref": "#/tables/1", "parent": {"cref": "#/body"}, "children": [], "label": "table", "prov": [{"page_no": 1, "bbox": {"l": 315.7172546386719, "t": 358.176513671875, "r": 536.835693359375, "b": 295.9709777832031, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [{"cref": "#/texts/63"}], "references": [], "footnotes": [], "image": null, "data": {"table_cells": [{"bbox": {"l": 318.8807067871094, "t": 354.3141174316406, "r": 323.273193359375, "b": 345.5291748046875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "0", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 347.24871826171875, "t": 354.3141174316406, "r": 351.6412048339844, "b": 345.5291748046875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 3, "text": "1", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 394.1042175292969, "t": 354.4064025878906, "r": 465.8810119628906, "b": 344.2760009765625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 5, "text": "2 1", "column_header": true, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 318.7731628417969, "t": 342.4544982910156, "r": 323.1656494140625, "b": 333.6695556640625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 347.24871826171875, "t": 342.4544982910156, "r": 351.6412048339844, "b": 333.6695556640625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 366.7010192871094, "t": 342.8791809082031, "r": 398.4967041015625, "b": 332.748779296875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "5 3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.95941162109375, "t": 342.4544982910156, "r": 445.3518981933594, "b": 333.6695556640625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.8149108886719, "t": 342.4544982910156, "r": 492.2073974609375, "b": 333.6695556640625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 318.7731628417969, "t": 318.2957458496094, "r": 323.1656494140625, "b": 309.51080322265625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 347.24871826171875, "t": 330.1553955078125, "r": 351.6412048339844, "b": 321.3704528808594, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.1042175292969, "t": 330.1553955078125, "r": 402.8883056640625, "b": 321.3704528808594, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "10", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.95941162109375, "t": 330.1553955078125, "r": 449.4228515625, "b": 321.3704528808594, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "11", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.8149108886719, "t": 330.1553955078125, "r": 496.5989990234375, "b": 321.3704528808594, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "12", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 331.90423583984375, "t": 318.6770935058594, "r": 337.9090270996094, "b": 308.54669189453125, "coord_origin": "BOTTOMLEFT"}, "row_span": 3, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 347.24871826171875, "t": 318.2957458496094, "r": 356.0328063964844, "b": 309.51080322265625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "13", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.1042175292969, "t": 318.2957458496094, "r": 402.8883056640625, "b": 309.51080322265625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "14", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.95941162109375, "t": 318.2957458496094, "r": 449.7434997558594, "b": 309.51080322265625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "15", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.8149108886719, "t": 318.2957458496094, "r": 496.5989990234375, "b": 309.51080322265625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "16", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 347.24871826171875, "t": 306.87530517578125, "r": 356.0328063964844, "b": 298.0903625488281, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "17", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.1042175292969, "t": 306.87530517578125, "r": 402.8883056640625, "b": 298.0903625488281, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "18", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.95941162109375, "t": 306.87530517578125, "r": 449.7434997558594, "b": 298.0903625488281, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "19", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.8149108886719, "t": 306.87530517578125, "r": 496.5989990234375, "b": 298.0903625488281, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "20", "column_header": false, "row_header": false, "row_section": false}], "num_rows": 5, "num_cols": 6, "grid": [[{"bbox": {"l": 318.8807067871094, "t": 354.3141174316406, "r": 323.273193359375, "b": 345.5291748046875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "0", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 347.24871826171875, "t": 354.3141174316406, "r": 351.6412048339844, "b": 345.5291748046875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 3, "text": "1", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 347.24871826171875, "t": 354.3141174316406, "r": 351.6412048339844, "b": 345.5291748046875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 3, "text": "1", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 394.1042175292969, "t": 354.4064025878906, "r": 465.8810119628906, "b": 344.2760009765625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 5, "text": "2 1", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 394.1042175292969, "t": 354.4064025878906, "r": 465.8810119628906, "b": 344.2760009765625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 5, "text": "2 1", "column_header": true, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 318.7731628417969, "t": 342.4544982910156, "r": 323.1656494140625, "b": 333.6695556640625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 347.24871826171875, "t": 342.4544982910156, "r": 351.6412048339844, "b": 333.6695556640625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 366.7010192871094, "t": 342.8791809082031, "r": 398.4967041015625, "b": 332.748779296875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "5 3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.95941162109375, "t": 342.4544982910156, "r": 445.3518981933594, "b": 333.6695556640625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.8149108886719, "t": 342.4544982910156, "r": 492.2073974609375, "b": 333.6695556640625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 318.7731628417969, "t": 318.2957458496094, "r": 323.1656494140625, "b": 309.51080322265625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 347.24871826171875, "t": 330.1553955078125, "r": 351.6412048339844, "b": 321.3704528808594, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.1042175292969, "t": 330.1553955078125, "r": 402.8883056640625, "b": 321.3704528808594, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "10", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.95941162109375, "t": 330.1553955078125, "r": 449.4228515625, "b": 321.3704528808594, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "11", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.8149108886719, "t": 330.1553955078125, "r": 496.5989990234375, "b": 321.3704528808594, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "12", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 331.90423583984375, "t": 318.6770935058594, "r": 337.9090270996094, "b": 308.54669189453125, "coord_origin": "BOTTOMLEFT"}, "row_span": 3, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "2", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 347.24871826171875, "t": 318.2957458496094, "r": 356.0328063964844, "b": 309.51080322265625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "13", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.1042175292969, "t": 318.2957458496094, "r": 402.8883056640625, "b": 309.51080322265625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "14", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.95941162109375, "t": 318.2957458496094, "r": 449.7434997558594, "b": 309.51080322265625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "15", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.8149108886719, "t": 318.2957458496094, "r": 496.5989990234375, "b": 309.51080322265625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "16", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 331.90423583984375, "t": 318.6770935058594, "r": 337.9090270996094, "b": 308.54669189453125, "coord_origin": "BOTTOMLEFT"}, "row_span": 3, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "2", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 347.24871826171875, "t": 306.87530517578125, "r": 356.0328063964844, "b": 298.0903625488281, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "17", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.1042175292969, "t": 306.87530517578125, "r": 402.8883056640625, "b": 298.0903625488281, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "18", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.95941162109375, "t": 306.87530517578125, "r": 449.7434997558594, "b": 298.0903625488281, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "19", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.8149108886719, "t": 306.87530517578125, "r": 496.5989990234375, "b": 298.0903625488281, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "20", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 331.90423583984375, "t": 318.6770935058594, "r": 337.9090270996094, "b": 308.54669189453125, "coord_origin": "BOTTOMLEFT"}, "row_span": 3, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "2", "column_header": false, "row_header": false, "row_section": false}]]}}, {"self_ref": "#/tables/2", "parent": {"cref": "#/body"}, "children": [], "label": "table", "prov": [{"page_no": 4, "bbox": {"l": 310.67584228515625, "t": 718.8060913085938, "r": 542.9547119140625, "b": 636.7794799804688, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [{"cref": "#/texts/133"}], "references": [], "footnotes": [], "image": null, "data": {"table_cells": [{"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 412.3320007324219, "t": 718.3856201171875, "r": 430.9023132324219, "b": 709.4790649414062, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Tags", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 442.857421875, "t": 718.3856201171875, "r": 464.4463806152344, "b": 709.4790649414062, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Bbox", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 477.78631591796875, "t": 718.3856201171875, "r": 494.9419250488281, "b": 709.4790649414062, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Size", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 508.2818603515625, "t": 718.3856201171875, "r": 536.9143676757812, "b": 709.4790649414062, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Format", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 317.05999755859375, "t": 706.0326538085938, "r": 361.64263916015625, "b": 697.1260986328125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PubTabNet", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 417.8559875488281, "t": 706.33154296875, "r": 425.37774658203125, "b": 697.1161499023438, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 449.89569091796875, "t": 706.33154296875, "r": 457.4174499511719, "b": 697.1161499023438, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 476.4010009765625, "t": 706.0326538085938, "r": 496.3262023925781, "b": 697.1260986328125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "509k", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 512.6349487304688, "t": 706.0326538085938, "r": 532.5601196289062, "b": 697.1260986328125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "PNG", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 317.05999755859375, "t": 694.07763671875, "r": 359.4309387207031, "b": 685.1710815429688, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "FinTabNet", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 417.8559875488281, "t": 694.3765258789062, "r": 425.37774658203125, "b": 685.1611328125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 449.89569091796875, "t": 694.3765258789062, "r": 457.4174499511719, "b": 685.1611328125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 476.4010009765625, "t": 694.07763671875, "r": 496.3262023925781, "b": 685.1710815429688, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "112k", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 513.4618530273438, "t": 694.07763671875, "r": 531.7332763671875, "b": 685.1710815429688, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "PDF", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 317.05999755859375, "t": 682.1216430664062, "r": 359.9788818359375, "b": 673.215087890625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableBank", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 417.8559875488281, "t": 682.4205322265625, "r": 425.37774658203125, "b": 673.2051391601562, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 450.812255859375, "t": 682.4205322265625, "r": 456.50091552734375, "b": 673.2051391601562, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 476.4010009765625, "t": 682.1216430664062, "r": 496.3262023925781, "b": 673.215087890625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "145k", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 511.25018310546875, "t": 682.1216430664062, "r": 533.9450073242188, "b": 673.215087890625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "JPEG", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 317.05999755859375, "t": 670.1666259765625, "r": 400.3772277832031, "b": 661.2600708007812, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Combined-Tabnet(*)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 417.8559875488281, "t": 670.4655151367188, "r": 425.37774658203125, "b": 661.2501220703125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 449.89569091796875, "t": 670.4655151367188, "r": 457.4174499511719, "b": 661.2501220703125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 476.4010009765625, "t": 670.1666259765625, "r": 496.3262023925781, "b": 661.2600708007812, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "400k", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 512.6349487304688, "t": 670.1666259765625, "r": 532.5601196289062, "b": 661.2600708007812, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "PNG", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 317.05999755859375, "t": 658.2116088867188, "r": 375.1718444824219, "b": 649.3050537109375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Combined(**)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 417.8559875488281, "t": 658.510498046875, "r": 425.37774658203125, "b": 649.2951049804688, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 449.89569091796875, "t": 658.510498046875, "r": 457.4174499511719, "b": 649.2951049804688, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 476.4010009765625, "t": 658.2116088867188, "r": 496.3262023925781, "b": 649.3050537109375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "500k", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 512.6349487304688, "t": 658.2116088867188, "r": 532.5601196289062, "b": 649.3050537109375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "PNG", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 317.05999755859375, "t": 646.256591796875, "r": 369.3935241699219, "b": 637.3500366210938, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "SynthTabNet", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 417.8559875488281, "t": 646.5555419921875, "r": 425.37774658203125, "b": 637.3401489257812, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 449.89569091796875, "t": 646.5555419921875, "r": 457.4174499511719, "b": 637.3401489257812, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 476.4010009765625, "t": 646.2566528320312, "r": 496.3262023925781, "b": 637.35009765625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "600k", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 512.6349487304688, "t": 646.2566528320312, "r": 532.5601196289062, "b": 637.35009765625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "PNG", "column_header": false, "row_header": false, "row_section": false}], "num_rows": 7, "num_cols": 5, "grid": [[{"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 412.3320007324219, "t": 718.3856201171875, "r": 430.9023132324219, "b": 709.4790649414062, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Tags", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 442.857421875, "t": 718.3856201171875, "r": 464.4463806152344, "b": 709.4790649414062, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Bbox", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 477.78631591796875, "t": 718.3856201171875, "r": 494.9419250488281, "b": 709.4790649414062, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Size", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 508.2818603515625, "t": 718.3856201171875, "r": 536.9143676757812, "b": 709.4790649414062, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Format", "column_header": true, "row_header": false, "row_section": false}], [{"bbox": {"l": 317.05999755859375, "t": 706.0326538085938, "r": 361.64263916015625, "b": 697.1260986328125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PubTabNet", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 417.8559875488281, "t": 706.33154296875, "r": 425.37774658203125, "b": 697.1161499023438, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 449.89569091796875, "t": 706.33154296875, "r": 457.4174499511719, "b": 697.1161499023438, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 476.4010009765625, "t": 706.0326538085938, "r": 496.3262023925781, "b": 697.1260986328125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "509k", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 512.6349487304688, "t": 706.0326538085938, "r": 532.5601196289062, "b": 697.1260986328125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "PNG", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 317.05999755859375, "t": 694.07763671875, "r": 359.4309387207031, "b": 685.1710815429688, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "FinTabNet", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 417.8559875488281, "t": 694.3765258789062, "r": 425.37774658203125, "b": 685.1611328125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 449.89569091796875, "t": 694.3765258789062, "r": 457.4174499511719, "b": 685.1611328125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 476.4010009765625, "t": 694.07763671875, "r": 496.3262023925781, "b": 685.1710815429688, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "112k", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 513.4618530273438, "t": 694.07763671875, "r": 531.7332763671875, "b": 685.1710815429688, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "PDF", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 317.05999755859375, "t": 682.1216430664062, "r": 359.9788818359375, "b": 673.215087890625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableBank", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 417.8559875488281, "t": 682.4205322265625, "r": 425.37774658203125, "b": 673.2051391601562, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 450.812255859375, "t": 682.4205322265625, "r": 456.50091552734375, "b": 673.2051391601562, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 476.4010009765625, "t": 682.1216430664062, "r": 496.3262023925781, "b": 673.215087890625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "145k", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 511.25018310546875, "t": 682.1216430664062, "r": 533.9450073242188, "b": 673.215087890625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "JPEG", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 317.05999755859375, "t": 670.1666259765625, "r": 400.3772277832031, "b": 661.2600708007812, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Combined-Tabnet(*)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 417.8559875488281, "t": 670.4655151367188, "r": 425.37774658203125, "b": 661.2501220703125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 449.89569091796875, "t": 670.4655151367188, "r": 457.4174499511719, "b": 661.2501220703125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 476.4010009765625, "t": 670.1666259765625, "r": 496.3262023925781, "b": 661.2600708007812, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "400k", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 512.6349487304688, "t": 670.1666259765625, "r": 532.5601196289062, "b": 661.2600708007812, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "PNG", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 317.05999755859375, "t": 658.2116088867188, "r": 375.1718444824219, "b": 649.3050537109375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Combined(**)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 417.8559875488281, "t": 658.510498046875, "r": 425.37774658203125, "b": 649.2951049804688, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 449.89569091796875, "t": 658.510498046875, "r": 457.4174499511719, "b": 649.2951049804688, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 476.4010009765625, "t": 658.2116088867188, "r": 496.3262023925781, "b": 649.3050537109375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "500k", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 512.6349487304688, "t": 658.2116088867188, "r": 532.5601196289062, "b": 649.3050537109375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "PNG", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 317.05999755859375, "t": 646.256591796875, "r": 369.3935241699219, "b": 637.3500366210938, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "SynthTabNet", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 417.8559875488281, "t": 646.5555419921875, "r": 425.37774658203125, "b": 637.3401489257812, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 449.89569091796875, "t": 646.5555419921875, "r": 457.4174499511719, "b": 637.3401489257812, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 476.4010009765625, "t": 646.2566528320312, "r": 496.3262023925781, "b": 637.35009765625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "600k", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 512.6349487304688, "t": 646.2566528320312, "r": 532.5601196289062, "b": 637.35009765625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "PNG", "column_header": false, "row_header": false, "row_section": false}]]}}, {"self_ref": "#/tables/3", "parent": {"cref": "#/body"}, "children": [], "label": "table", "prov": [{"page_no": 7, "bbox": {"l": 53.368526458740234, "t": 382.8642272949219, "r": 283.0443420410156, "b": 209.60223388671875, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [{"cref": "#/texts/277"}], "references": [], "footnotes": [], "image": null, "data": {"table_cells": [{"bbox": {"l": 78.84300231933594, "t": 371.30963134765625, "r": 104.8553466796875, "b": 362.403076171875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Model", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 129.33799743652344, "t": 365.3326416015625, "r": 159.21583557128906, "b": 356.42608642578125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Dataset", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 171.17095947265625, "t": 365.3326416015625, "r": 199.40496826171875, "b": 356.42608642578125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Simple", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 211.1999969482422, "t": 377.2876281738281, "r": 247.74349975585938, "b": 356.42608642578125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "TEDS Complex", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 264.5404357910156, "t": 365.3326416015625, "r": 277.27264404296875, "b": 356.42608642578125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "All", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 81.61199951171875, "t": 348.3756408691406, "r": 102.08513641357422, "b": 339.4690856933594, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "EDD", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.87205505371094, "t": 348.3756408691406, "r": 153.69140625, "b": 339.4690856933594, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "PTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.56553649902344, "t": 348.3756408691406, "r": 194.00009155273438, "b": 339.4690856933594, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "91.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 220.82937622070312, "t": 348.3756408691406, "r": 238.26393127441406, "b": 339.4690856933594, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "88.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 262.18414306640625, "t": 348.3756408691406, "r": 279.6186828613281, "b": 339.4690856933594, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "89.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 82.16500091552734, "t": 336.4196472167969, "r": 101.53230285644531, "b": 327.5130920410156, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "GTE", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.86715698242188, "t": 336.4196472167969, "r": 153.68650817871094, "b": 327.5130920410156, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "PTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 183.62411499023438, "t": 336.4196472167969, "r": 186.94166564941406, "b": 327.5130920410156, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 227.88795471191406, "t": 336.4196472167969, "r": 231.20550537109375, "b": 327.5130920410156, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 259.69854736328125, "t": 336.4196472167969, "r": 282.1144104003906, "b": 327.5130920410156, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "93.01", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 66.31500244140625, "t": 323.86663818359375, "r": 117.38329315185547, "b": 314.9600830078125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.86766052246094, "t": 323.86663818359375, "r": 153.68701171875, "b": 314.9600830078125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "PTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.57110595703125, "t": 323.86663818359375, "r": 194.0056610107422, "b": 314.9600830078125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "98.5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 220.83494567871094, "t": 323.86663818359375, "r": 238.26950073242188, "b": 314.9600830078125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "95.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 259.697998046875, "t": 323.9862060546875, "r": 282.1138610839844, "b": 315.0298156738281, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "96.75", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 81.61199951171875, "t": 308.67364501953125, "r": 102.08513641357422, "b": 299.76708984375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "EDD", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.87205505371094, "t": 308.67364501953125, "r": 153.69140625, "b": 299.76708984375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "FTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.56553649902344, "t": 308.67364501953125, "r": 194.00009155273438, "b": 299.76708984375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "88.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 218.33871459960938, "t": 308.67364501953125, "r": 240.7545623779297, "b": 299.76708984375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "92.08", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 262.1841125488281, "t": 308.67364501953125, "r": 279.61865234375, "b": 299.76708984375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "90.6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 82.16500091552734, "t": 296.7186584472656, "r": 101.53230285644531, "b": 287.8121032714844, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "GTE", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.86715698242188, "t": 296.7186584472656, "r": 153.68650817871094, "b": 287.8121032714844, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "FTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 183.62411499023438, "t": 296.7186584472656, "r": 186.94166564941406, "b": 287.8121032714844, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 227.88795471191406, "t": 296.7186584472656, "r": 231.20550537109375, "b": 287.8121032714844, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 259.69854736328125, "t": 296.7186584472656, "r": 282.1144104003906, "b": 287.8121032714844, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "87.14", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 71.78900146484375, "t": 284.763671875, "r": 111.90838623046875, "b": 275.85711669921875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "GTE (FT)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.86221313476562, "t": 284.763671875, "r": 153.6815643310547, "b": 275.85711669921875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "FTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 183.62913513183594, "t": 284.763671875, "r": 186.94668579101562, "b": 275.85711669921875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 227.89297485351562, "t": 284.763671875, "r": 231.2105255126953, "b": 275.85711669921875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 259.693603515625, "t": 284.763671875, "r": 282.1094665527344, "b": 275.85711669921875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "91.02", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 66.31500244140625, "t": 272.8086853027344, "r": 117.38329315185547, "b": 263.9021301269531, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.86766052246094, "t": 272.8086853027344, "r": 153.68701171875, "b": 263.9021301269531, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "FTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.57110595703125, "t": 272.8086853027344, "r": 194.0056610107422, "b": 263.9021301269531, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "97.5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 220.83494567871094, "t": 272.8086853027344, "r": 238.26950073242188, "b": 263.9021301269531, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "96.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 262.1889953613281, "t": 272.9282531738281, "r": 279.62353515625, "b": 263.97186279296875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "96.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 81.61199951171875, "t": 255.5016326904297, "r": 102.08513641357422, "b": 246.59507751464844, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "EDD", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 137.91064453125, "t": 255.5016326904297, "r": 150.64285278320312, "b": 246.59507751464844, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "TB", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.56553649902344, "t": 255.5016326904297, "r": 194.00009155273438, "b": 246.59507751464844, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "86.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 227.89285278320312, "t": 255.5016326904297, "r": 231.2104034423828, "b": 246.59507751464844, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 262.1841125488281, "t": 255.5016326904297, "r": 279.61865234375, "b": 246.59507751464844, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "86.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 66.31500244140625, "t": 243.54563903808594, "r": 117.38329315185547, "b": 234.6390838623047, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 137.90625, "t": 243.54563903808594, "r": 150.63845825195312, "b": 234.6390838623047, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "TB", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.57110595703125, "t": 243.54563903808594, "r": 194.0056610107422, "b": 234.6390838623047, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "89.6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 227.88845825195312, "t": 243.54563903808594, "r": 231.2060089111328, "b": 234.6390838623047, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 262.1889953613281, "t": 243.66519165039062, "r": 279.62353515625, "b": 234.7088165283203, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "89.6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 66.31500244140625, "t": 223.9976348876953, "r": 117.38329315185547, "b": 215.09107971191406, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.86766052246094, "t": 223.9976348876953, "r": 153.68701171875, "b": 215.09107971191406, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "STN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.57110595703125, "t": 223.9976348876953, "r": 194.0056610107422, "b": 215.09107971191406, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "96.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 220.83494567871094, "t": 223.9976348876953, "r": 238.26950073242188, "b": 215.09107971191406, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "95.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 262.189697265625, "t": 223.9976348876953, "r": 279.6242370605469, "b": 215.09107971191406, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "96.7", "column_header": false, "row_header": false, "row_section": false}], "num_rows": 11, "num_cols": 5, "grid": [[{"bbox": {"l": 78.84300231933594, "t": 371.30963134765625, "r": 104.8553466796875, "b": 362.403076171875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Model", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 129.33799743652344, "t": 365.3326416015625, "r": 159.21583557128906, "b": 356.42608642578125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Dataset", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 171.17095947265625, "t": 365.3326416015625, "r": 199.40496826171875, "b": 356.42608642578125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Simple", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 211.1999969482422, "t": 377.2876281738281, "r": 247.74349975585938, "b": 356.42608642578125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "TEDS Complex", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 264.5404357910156, "t": 365.3326416015625, "r": 277.27264404296875, "b": 356.42608642578125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "All", "column_header": true, "row_header": false, "row_section": false}], [{"bbox": {"l": 81.61199951171875, "t": 348.3756408691406, "r": 102.08513641357422, "b": 339.4690856933594, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "EDD", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.87205505371094, "t": 348.3756408691406, "r": 153.69140625, "b": 339.4690856933594, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "PTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.56553649902344, "t": 348.3756408691406, "r": 194.00009155273438, "b": 339.4690856933594, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "91.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 220.82937622070312, "t": 348.3756408691406, "r": 238.26393127441406, "b": 339.4690856933594, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "88.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 262.18414306640625, "t": 348.3756408691406, "r": 279.6186828613281, "b": 339.4690856933594, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "89.9", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 82.16500091552734, "t": 336.4196472167969, "r": 101.53230285644531, "b": 327.5130920410156, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "GTE", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.86715698242188, "t": 336.4196472167969, "r": 153.68650817871094, "b": 327.5130920410156, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "PTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 183.62411499023438, "t": 336.4196472167969, "r": 186.94166564941406, "b": 327.5130920410156, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 227.88795471191406, "t": 336.4196472167969, "r": 231.20550537109375, "b": 327.5130920410156, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 259.69854736328125, "t": 336.4196472167969, "r": 282.1144104003906, "b": 327.5130920410156, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "93.01", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 66.31500244140625, "t": 323.86663818359375, "r": 117.38329315185547, "b": 314.9600830078125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.86766052246094, "t": 323.86663818359375, "r": 153.68701171875, "b": 314.9600830078125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "PTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.57110595703125, "t": 323.86663818359375, "r": 194.0056610107422, "b": 314.9600830078125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "98.5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 220.83494567871094, "t": 323.86663818359375, "r": 238.26950073242188, "b": 314.9600830078125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "95.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 259.697998046875, "t": 323.9862060546875, "r": 282.1138610839844, "b": 315.0298156738281, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "96.75", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 81.61199951171875, "t": 308.67364501953125, "r": 102.08513641357422, "b": 299.76708984375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "EDD", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.87205505371094, "t": 308.67364501953125, "r": 153.69140625, "b": 299.76708984375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "FTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.56553649902344, "t": 308.67364501953125, "r": 194.00009155273438, "b": 299.76708984375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "88.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 218.33871459960938, "t": 308.67364501953125, "r": 240.7545623779297, "b": 299.76708984375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "92.08", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 262.1841125488281, "t": 308.67364501953125, "r": 279.61865234375, "b": 299.76708984375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "90.6", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 82.16500091552734, "t": 296.7186584472656, "r": 101.53230285644531, "b": 287.8121032714844, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "GTE", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.86715698242188, "t": 296.7186584472656, "r": 153.68650817871094, "b": 287.8121032714844, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "FTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 183.62411499023438, "t": 296.7186584472656, "r": 186.94166564941406, "b": 287.8121032714844, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 227.88795471191406, "t": 296.7186584472656, "r": 231.20550537109375, "b": 287.8121032714844, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 259.69854736328125, "t": 296.7186584472656, "r": 282.1144104003906, "b": 287.8121032714844, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "87.14", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 71.78900146484375, "t": 284.763671875, "r": 111.90838623046875, "b": 275.85711669921875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "GTE (FT)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.86221313476562, "t": 284.763671875, "r": 153.6815643310547, "b": 275.85711669921875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "FTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 183.62913513183594, "t": 284.763671875, "r": 186.94668579101562, "b": 275.85711669921875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 227.89297485351562, "t": 284.763671875, "r": 231.2105255126953, "b": 275.85711669921875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 259.693603515625, "t": 284.763671875, "r": 282.1094665527344, "b": 275.85711669921875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "91.02", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 66.31500244140625, "t": 272.8086853027344, "r": 117.38329315185547, "b": 263.9021301269531, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.86766052246094, "t": 272.8086853027344, "r": 153.68701171875, "b": 263.9021301269531, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "FTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.57110595703125, "t": 272.8086853027344, "r": 194.0056610107422, "b": 263.9021301269531, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "97.5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 220.83494567871094, "t": 272.8086853027344, "r": 238.26950073242188, "b": 263.9021301269531, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "96.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 262.1889953613281, "t": 272.9282531738281, "r": 279.62353515625, "b": 263.97186279296875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "96.8", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 81.61199951171875, "t": 255.5016326904297, "r": 102.08513641357422, "b": 246.59507751464844, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "EDD", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 137.91064453125, "t": 255.5016326904297, "r": 150.64285278320312, "b": 246.59507751464844, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "TB", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.56553649902344, "t": 255.5016326904297, "r": 194.00009155273438, "b": 246.59507751464844, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "86.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 227.89285278320312, "t": 255.5016326904297, "r": 231.2104034423828, "b": 246.59507751464844, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 262.1841125488281, "t": 255.5016326904297, "r": 279.61865234375, "b": 246.59507751464844, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "86.0", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 66.31500244140625, "t": 243.54563903808594, "r": 117.38329315185547, "b": 234.6390838623047, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 137.90625, "t": 243.54563903808594, "r": 150.63845825195312, "b": 234.6390838623047, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "TB", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.57110595703125, "t": 243.54563903808594, "r": 194.0056610107422, "b": 234.6390838623047, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "89.6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 227.88845825195312, "t": 243.54563903808594, "r": 231.2060089111328, "b": 234.6390838623047, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 262.1889953613281, "t": 243.66519165039062, "r": 279.62353515625, "b": 234.7088165283203, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "89.6", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 66.31500244140625, "t": 223.9976348876953, "r": 117.38329315185547, "b": 215.09107971191406, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.86766052246094, "t": 223.9976348876953, "r": 153.68701171875, "b": 215.09107971191406, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "STN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.57110595703125, "t": 223.9976348876953, "r": 194.0056610107422, "b": 215.09107971191406, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "96.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 220.83494567871094, "t": 223.9976348876953, "r": 238.26950073242188, "b": 215.09107971191406, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "95.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 262.189697265625, "t": 223.9976348876953, "r": 279.6242370605469, "b": 215.09107971191406, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "96.7", "column_header": false, "row_header": false, "row_section": false}]]}}, {"self_ref": "#/tables/4", "parent": {"cref": "#/body"}, "children": [], "label": "table", "prov": [{"page_no": 7, "bbox": {"l": 308.4068603515625, "t": 544.1236572265625, "r": 533.6419677734375, "b": 488.1943359375, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [{"cref": "#/texts/282"}], "references": [], "footnotes": [], "image": null, "data": {"table_cells": [{"bbox": {"l": 339.322998046875, "t": 538.3356323242188, "r": 365.3353576660156, "b": 529.4290771484375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Model", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 401.04132080078125, "t": 538.3356323242188, "r": 430.9191589355469, "b": 529.4290771484375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Dataset", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 454.1021423339844, "t": 538.3356323242188, "r": 474.5852355957031, "b": 529.4290771484375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "mAP", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 486.54034423828125, "t": 538.3356323242188, "r": 527.2276000976562, "b": 529.4290771484375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "mAP (PP)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 327.656005859375, "t": 521.378662109375, "r": 377.0007629394531, "b": 512.4721069335938, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "EDD+BBox", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 393.6980895996094, "t": 521.378662109375, "r": 438.2807312011719, "b": 512.4721069335938, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "PubTabNet", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 455.6355895996094, "t": 521.378662109375, "r": 473.07012939453125, "b": 512.4721069335938, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "79.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 498.1659240722656, "t": 521.378662109375, "r": 515.6004638671875, "b": 512.4721069335938, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "82.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.7950134277344, "t": 509.4236755371094, "r": 377.8633117675781, "b": 500.5171203613281, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 393.6938781738281, "t": 509.4236755371094, "r": 438.2765197753906, "b": 500.5171203613281, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "PubTabNet", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 455.6310119628906, "t": 509.5432434082031, "r": 473.0655517578125, "b": 500.58685302734375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "82.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 498.1712951660156, "t": 509.5432434082031, "r": 515.6058349609375, "b": 500.58685302734375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "86.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.7950134277344, "t": 497.46868896484375, "r": 377.8633117675781, "b": 488.5621337890625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 389.81842041015625, "t": 497.46868896484375, "r": 442.1519470214844, "b": 488.5621337890625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "SynthTabNet", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 455.63134765625, "t": 497.46868896484375, "r": 473.0658874511719, "b": 488.5621337890625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "87.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 505.22515869140625, "t": 497.46868896484375, "r": 508.5426940917969, "b": 488.5621337890625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}], "num_rows": 4, "num_cols": 4, "grid": [[{"bbox": {"l": 339.322998046875, "t": 538.3356323242188, "r": 365.3353576660156, "b": 529.4290771484375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Model", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 401.04132080078125, "t": 538.3356323242188, "r": 430.9191589355469, "b": 529.4290771484375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Dataset", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 454.1021423339844, "t": 538.3356323242188, "r": 474.5852355957031, "b": 529.4290771484375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "mAP", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 486.54034423828125, "t": 538.3356323242188, "r": 527.2276000976562, "b": 529.4290771484375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "mAP (PP)", "column_header": true, "row_header": false, "row_section": false}], [{"bbox": {"l": 327.656005859375, "t": 521.378662109375, "r": 377.0007629394531, "b": 512.4721069335938, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "EDD+BBox", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 393.6980895996094, "t": 521.378662109375, "r": 438.2807312011719, "b": 512.4721069335938, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "PubTabNet", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 455.6355895996094, "t": 521.378662109375, "r": 473.07012939453125, "b": 512.4721069335938, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "79.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 498.1659240722656, "t": 521.378662109375, "r": 515.6004638671875, "b": 512.4721069335938, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "82.7", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 326.7950134277344, "t": 509.4236755371094, "r": 377.8633117675781, "b": 500.5171203613281, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 393.6938781738281, "t": 509.4236755371094, "r": 438.2765197753906, "b": 500.5171203613281, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "PubTabNet", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 455.6310119628906, "t": 509.5432434082031, "r": 473.0655517578125, "b": 500.58685302734375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "82.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 498.1712951660156, "t": 509.5432434082031, "r": 515.6058349609375, "b": 500.58685302734375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "86.8", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 326.7950134277344, "t": 497.46868896484375, "r": 377.8633117675781, "b": 488.5621337890625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 389.81842041015625, "t": 497.46868896484375, "r": 442.1519470214844, "b": 488.5621337890625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "SynthTabNet", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 455.63134765625, "t": 497.46868896484375, "r": 473.0658874511719, "b": 488.5621337890625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "87.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 505.22515869140625, "t": 497.46868896484375, "r": 508.5426940917969, "b": 488.5621337890625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}]]}}, {"self_ref": "#/tables/5", "parent": {"cref": "#/body"}, "children": [], "label": "table", "prov": [{"page_no": 7, "bbox": {"l": 332.9688720703125, "t": 251.7164306640625, "r": 520.942138671875, "b": 148.73028564453125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [{"cref": "#/texts/284"}], "references": [], "footnotes": [], "image": null, "data": {"table_cells": [{"bbox": {"l": 358.010986328125, "t": 239.76663208007812, "r": 384.0233459472656, "b": 230.86007690429688, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Model", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 408.5059814453125, "t": 233.7896270751953, "r": 436.739990234375, "b": 224.88307189941406, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Simple", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 448.6950988769531, "t": 245.74462890625, "r": 485.0784912109375, "b": 224.88307189941406, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "TEDS Complex", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 499.3847961425781, "t": 233.7896270751953, "r": 512.1170043945312, "b": 224.88307189941406, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "All", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 357.6820068359375, "t": 216.8326416015625, "r": 384.3518981933594, "b": 207.92608642578125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Tabula", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 413.9009704589844, "t": 216.8326416015625, "r": 431.33551025390625, "b": 207.92608642578125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "78.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 458.164794921875, "t": 216.8326416015625, "r": 475.5993347167969, "b": 207.92608642578125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "57.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 497.0289001464844, "t": 216.8326416015625, "r": 514.4634399414062, "b": 207.92608642578125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "67.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 350.7229919433594, "t": 204.8776397705078, "r": 391.3106384277344, "b": 195.97108459472656, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Traprange", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 413.90582275390625, "t": 204.8776397705078, "r": 431.3403625488281, "b": 195.97108459472656, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "60.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 458.1696472167969, "t": 204.8776397705078, "r": 475.60418701171875, "b": 195.97108459472656, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "49.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 497.03375244140625, "t": 204.8776397705078, "r": 514.4683227539062, "b": 195.97108459472656, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "55.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 354.135986328125, "t": 192.92164611816406, "r": 387.89923095703125, "b": 184.0150909423828, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Camelot", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 413.901611328125, "t": 192.92164611816406, "r": 431.3361511230469, "b": 184.0150909423828, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "80.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 458.1654357910156, "t": 192.92164611816406, "r": 475.5999755859375, "b": 184.0150909423828, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "66.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 497.029541015625, "t": 192.92164611816406, "r": 514.464111328125, "b": 184.0150909423828, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "73.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 346.5589904785156, "t": 180.96664428710938, "r": 395.475341796875, "b": 172.06008911132812, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Acrobat Pro", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 413.9061584472656, "t": 180.96664428710938, "r": 431.3406982421875, "b": 172.06008911132812, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "68.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 458.16998291015625, "t": 180.96664428710938, "r": 475.6045227050781, "b": 172.06008911132812, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "61.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 497.0340881347656, "t": 180.96664428710938, "r": 514.4686279296875, "b": 172.06008911132812, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "65.3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 360.781005859375, "t": 169.0116424560547, "r": 381.254150390625, "b": 160.10508728027344, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "EDD", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 413.9015808105469, "t": 169.0116424560547, "r": 431.33612060546875, "b": 160.10508728027344, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "91.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 458.1654052734375, "t": 169.0116424560547, "r": 475.5999450683594, "b": 160.10508728027344, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "85.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 497.0295104980469, "t": 169.0116424560547, "r": 514.4640502929688, "b": 160.10508728027344, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "88.3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 345.4830017089844, "t": 157.056640625, "r": 396.5513000488281, "b": 148.15008544921875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 413.9061584472656, "t": 157.056640625, "r": 431.3406982421875, "b": 148.15008544921875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "95.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 458.16998291015625, "t": 157.056640625, "r": 475.6045227050781, "b": 148.15008544921875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "90.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 497.03399658203125, "t": 157.1761932373047, "r": 514.4685668945312, "b": 148.21981811523438, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "93.6", "column_header": false, "row_header": false, "row_section": false}], "num_rows": 7, "num_cols": 4, "grid": [[{"bbox": {"l": 358.010986328125, "t": 239.76663208007812, "r": 384.0233459472656, "b": 230.86007690429688, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Model", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 408.5059814453125, "t": 233.7896270751953, "r": 436.739990234375, "b": 224.88307189941406, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Simple", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 448.6950988769531, "t": 245.74462890625, "r": 485.0784912109375, "b": 224.88307189941406, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "TEDS Complex", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 499.3847961425781, "t": 233.7896270751953, "r": 512.1170043945312, "b": 224.88307189941406, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "All", "column_header": true, "row_header": false, "row_section": false}], [{"bbox": {"l": 357.6820068359375, "t": 216.8326416015625, "r": 384.3518981933594, "b": 207.92608642578125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Tabula", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 413.9009704589844, "t": 216.8326416015625, "r": 431.33551025390625, "b": 207.92608642578125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "78.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 458.164794921875, "t": 216.8326416015625, "r": 475.5993347167969, "b": 207.92608642578125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "57.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 497.0289001464844, "t": 216.8326416015625, "r": 514.4634399414062, "b": 207.92608642578125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "67.9", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 350.7229919433594, "t": 204.8776397705078, "r": 391.3106384277344, "b": 195.97108459472656, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Traprange", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 413.90582275390625, "t": 204.8776397705078, "r": 431.3403625488281, "b": 195.97108459472656, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "60.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 458.1696472167969, "t": 204.8776397705078, "r": 475.60418701171875, "b": 195.97108459472656, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "49.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 497.03375244140625, "t": 204.8776397705078, "r": 514.4683227539062, "b": 195.97108459472656, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "55.4", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 354.135986328125, "t": 192.92164611816406, "r": 387.89923095703125, "b": 184.0150909423828, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Camelot", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 413.901611328125, "t": 192.92164611816406, "r": 431.3361511230469, "b": 184.0150909423828, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "80.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 458.1654357910156, "t": 192.92164611816406, "r": 475.5999755859375, "b": 184.0150909423828, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "66.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 497.029541015625, "t": 192.92164611816406, "r": 514.464111328125, "b": 184.0150909423828, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "73.0", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 346.5589904785156, "t": 180.96664428710938, "r": 395.475341796875, "b": 172.06008911132812, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Acrobat Pro", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 413.9061584472656, "t": 180.96664428710938, "r": 431.3406982421875, "b": 172.06008911132812, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "68.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 458.16998291015625, "t": 180.96664428710938, "r": 475.6045227050781, "b": 172.06008911132812, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "61.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 497.0340881347656, "t": 180.96664428710938, "r": 514.4686279296875, "b": 172.06008911132812, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "65.3", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 360.781005859375, "t": 169.0116424560547, "r": 381.254150390625, "b": 160.10508728027344, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "EDD", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 413.9015808105469, "t": 169.0116424560547, "r": 431.33612060546875, "b": 160.10508728027344, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "91.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 458.1654052734375, "t": 169.0116424560547, "r": 475.5999450683594, "b": 160.10508728027344, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "85.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 497.0295104980469, "t": 169.0116424560547, "r": 514.4640502929688, "b": 160.10508728027344, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "88.3", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 345.4830017089844, "t": 157.056640625, "r": 396.5513000488281, "b": 148.15008544921875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 413.9061584472656, "t": 157.056640625, "r": 431.3406982421875, "b": 148.15008544921875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "95.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 458.16998291015625, "t": 157.056640625, "r": 475.6045227050781, "b": 148.15008544921875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "90.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 497.03399658203125, "t": 157.1761932373047, "r": 514.4685668945312, "b": 148.21981811523438, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "93.6", "column_header": false, "row_header": false, "row_section": false}]]}}, {"self_ref": "#/tables/6", "parent": {"cref": "#/body"}, "children": [], "label": "table", "prov": [{"page_no": 8, "bbox": {"l": 53.62853240966797, "t": 573.0513916015625, "r": 298.5574951171875, "b": 499.60003662109375, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "data": {"table_cells": [{"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.93284606933594, "t": 569.8192749023438, "r": 241.04458618164062, "b": 565.6378784179688, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 4, "text": "\u8ad6\u6587\u30d5\u30a1\u30a4\u30eb", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 263.764892578125, "t": 569.8192749023438, "r": 284.5058898925781, "b": 565.6378784179688, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 4, "end_col_offset_idx": 6, "text": "\u53c2\u8003\u6587\u732e", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 110.24990844726562, "t": 562.3340454101562, "r": 120.62017822265625, "b": 558.1526489257812, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "\u51fa\u5178", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 175.3660888671875, "t": 562.3340454101562, "r": 201.29246520996094, "b": 558.1526489257812, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "\u30d5\u30a1\u30a4\u30eb \u6570", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 209.62408447265625, "t": 562.3340454101562, "r": 219.99435424804688, "b": 558.1526489257812, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "\u82f1\u8a9e", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 229.19813537597656, "t": 562.3340454101562, "r": 244.75376892089844, "b": 558.1526489257812, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "\u65e5\u672c\u8a9e", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 256.11419677734375, "t": 562.3340454101562, "r": 266.4844665527344, "b": 558.1526489257812, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "\u82f1\u8a9e", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 278.38433837890625, "t": 562.3340454101562, "r": 293.9399719238281, "b": 558.1526489257812, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "\u65e5\u672c\u8a9e", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 55.530521392822266, "t": 555.5741577148438, "r": 162.71310424804688, "b": 551.2162475585938, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Association for Computational Linguistics(ACL2003)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 184.39730834960938, "t": 555.5741577148438, "r": 189.56455993652344, "b": 551.2162475585938, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "65", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 208.99026489257812, "t": 555.5741577148438, "r": 214.1575164794922, "b": 551.2162475585938, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "65", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 234.8751678466797, "t": 555.5741577148438, "r": 237.4583282470703, "b": 551.2162475585938, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446044921875, "t": 555.5741577148438, "r": 264.63580322265625, "b": 551.2162475585938, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "150", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 284.06134033203125, "t": 555.5741577148438, "r": 286.6445007324219, "b": 551.2162475585938, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 55.530521392822266, "t": 549.3795166015625, "r": 139.7225341796875, "b": 545.0216064453125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Computational Linguistics(COLING2002)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 183.10536193847656, "t": 549.3795166015625, "r": 190.85670471191406, "b": 545.0216064453125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "140", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 207.6983184814453, "t": 549.3795166015625, "r": 215.4496612548828, "b": 545.0216064453125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "140", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 234.8751678466797, "t": 549.3795166015625, "r": 237.4583282470703, "b": 545.0216064453125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446044921875, "t": 549.3795166015625, "r": 264.63580322265625, "b": 545.0216064453125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "150", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 284.06134033203125, "t": 549.3795166015625, "r": 286.6445007324219, "b": 545.0216064453125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 55.530521392822266, "t": 542.4105834960938, "r": 128.96026611328125, "b": 538.0201416015625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "\u96fb\u6c17\u60c5\u5831\u901a\u4fe1\u5b66\u4f1a 2003 \u5e74\u7dcf\u5408\u5927\u4f1a", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 183.10536193847656, "t": 543.1849365234375, "r": 190.85670471191406, "b": 538.8270263671875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "150", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 210.2822265625, "t": 543.1849365234375, "r": 212.86538696289062, "b": 538.8270263671875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.29153442382812, "t": 543.1849365234375, "r": 240.04287719726562, "b": 538.8270263671875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "142", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446044921875, "t": 543.1849365234375, "r": 264.63580322265625, "b": 538.8270263671875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "223", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.4774169921875, "t": 543.1849365234375, "r": 289.228759765625, "b": 538.8270263671875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "147", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 55.530521392822266, "t": 534.9253540039062, "r": 129.88177490234375, "b": 530.534912109375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "\u60c5\u5831\u51e6\u7406\u5b66\u4f1a\u7b2c 65 \u56de\u5168\u56fd\u5927\u4f1a (2003)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 183.10536193847656, "t": 535.69970703125, "r": 190.85670471191406, "b": 531.341796875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "177", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 210.2822265625, "t": 535.69970703125, "r": 212.86538696289062, "b": 531.341796875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.29153442382812, "t": 535.69970703125, "r": 240.04287719726562, "b": 531.341796875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "176", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446044921875, "t": 535.69970703125, "r": 264.63580322265625, "b": 531.341796875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "150", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.4774169921875, "t": 535.69970703125, "r": 289.228759765625, "b": 531.341796875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "236", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 55.530521392822266, "t": 527.6982421875, "r": 129.88177490234375, "b": 523.3078002929688, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "\u7b2c 17 \u56de\u4eba\u5de5\u77e5\u80fd\u5b66\u4f1a\u5168\u56fd\u5927\u4f1a (2003)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 183.10536193847656, "t": 528.4725952148438, "r": 190.85670471191406, "b": 524.1146850585938, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "208", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 210.2822265625, "t": 528.4725952148438, "r": 212.86538696289062, "b": 524.1146850585938, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.29153442382812, "t": 528.4725952148438, "r": 240.04287719726562, "b": 524.1146850585938, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "203", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446044921875, "t": 528.4725952148438, "r": 264.63580322265625, "b": 524.1146850585938, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "152", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.4774169921875, "t": 528.4725952148438, "r": 289.228759765625, "b": 524.1146850585938, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "244", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 55.530521392822266, "t": 520.47119140625, "r": 127.32453918457031, "b": 516.0807495117188, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "\u81ea\u7136\u8a00\u8a9e\u51e6\u7406\u7814\u7a76\u4f1a\u7b2c 146 \u301c 155 \u56de", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 184.39730834960938, "t": 521.2455444335938, "r": 189.56455993652344, "b": 516.8876342773438, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "98", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 210.2822265625, "t": 521.2455444335938, "r": 212.86538696289062, "b": 516.8876342773438, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 233.58348083496094, "t": 521.2455444335938, "r": 238.750732421875, "b": 516.8876342773438, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446044921875, "t": 521.2455444335938, "r": 264.63580322265625, "b": 516.8876342773438, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "150", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.4774169921875, "t": 521.2455444335938, "r": 289.228759765625, "b": 516.8876342773438, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "232", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 55.530521392822266, "t": 512.986083984375, "r": 110.16829681396484, "b": 508.59564208984375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "WWW \u304b\u3089\u53ce\u96c6\u3057\u305f\u8ad6\u6587", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 183.10536193847656, "t": 514.0184326171875, "r": 190.85670471191406, "b": 509.6605224609375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "107", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 208.99026489257812, "t": 514.0184326171875, "r": 214.1575164794922, "b": 509.6605224609375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "73", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 233.58348083496094, "t": 514.0184326171875, "r": 238.750732421875, "b": 509.6605224609375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "34", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446044921875, "t": 514.0184326171875, "r": 264.63580322265625, "b": 509.6605224609375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "147", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 282.7693786621094, "t": 514.0184326171875, "r": 287.9366149902344, "b": 509.6605224609375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 183.10536193847656, "t": 506.5333251953125, "r": 190.85670471191406, "b": 502.1754150390625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "945", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 207.6983184814453, "t": 506.5333251953125, "r": 215.4496612548828, "b": 502.1754150390625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "294", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.29153442382812, "t": 506.5333251953125, "r": 240.04287719726562, "b": 502.1754150390625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "651", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 255.7650604248047, "t": 506.5333251953125, "r": 265.7520446777344, "b": 502.1754150390625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "1122", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.4774169921875, "t": 506.5333251953125, "r": 289.228759765625, "b": 502.1754150390625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "955", "column_header": false, "row_header": false, "row_section": false}], "num_rows": 10, "num_cols": 6, "grid": [[{"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.93284606933594, "t": 569.8192749023438, "r": 241.04458618164062, "b": 565.6378784179688, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 4, "text": "\u8ad6\u6587\u30d5\u30a1\u30a4\u30eb", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 209.93284606933594, "t": 569.8192749023438, "r": 241.04458618164062, "b": 565.6378784179688, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 4, "text": "\u8ad6\u6587\u30d5\u30a1\u30a4\u30eb", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 263.764892578125, "t": 569.8192749023438, "r": 284.5058898925781, "b": 565.6378784179688, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 4, "end_col_offset_idx": 6, "text": "\u53c2\u8003\u6587\u732e", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 263.764892578125, "t": 569.8192749023438, "r": 284.5058898925781, "b": 565.6378784179688, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 4, "end_col_offset_idx": 6, "text": "\u53c2\u8003\u6587\u732e", "column_header": true, "row_header": false, "row_section": false}], [{"bbox": {"l": 110.24990844726562, "t": 562.3340454101562, "r": 120.62017822265625, "b": 558.1526489257812, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "\u51fa\u5178", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 175.3660888671875, "t": 562.3340454101562, "r": 201.29246520996094, "b": 558.1526489257812, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "\u30d5\u30a1\u30a4\u30eb \u6570", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 209.62408447265625, "t": 562.3340454101562, "r": 219.99435424804688, "b": 558.1526489257812, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "\u82f1\u8a9e", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 229.19813537597656, "t": 562.3340454101562, "r": 244.75376892089844, "b": 558.1526489257812, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "\u65e5\u672c\u8a9e", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 256.11419677734375, "t": 562.3340454101562, "r": 266.4844665527344, "b": 558.1526489257812, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "\u82f1\u8a9e", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 278.38433837890625, "t": 562.3340454101562, "r": 293.9399719238281, "b": 558.1526489257812, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "\u65e5\u672c\u8a9e", "column_header": true, "row_header": false, "row_section": false}], [{"bbox": {"l": 55.530521392822266, "t": 555.5741577148438, "r": 162.71310424804688, "b": 551.2162475585938, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Association for Computational Linguistics(ACL2003)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 184.39730834960938, "t": 555.5741577148438, "r": 189.56455993652344, "b": 551.2162475585938, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "65", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 208.99026489257812, "t": 555.5741577148438, "r": 214.1575164794922, "b": 551.2162475585938, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "65", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 234.8751678466797, "t": 555.5741577148438, "r": 237.4583282470703, "b": 551.2162475585938, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446044921875, "t": 555.5741577148438, "r": 264.63580322265625, "b": 551.2162475585938, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "150", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 284.06134033203125, "t": 555.5741577148438, "r": 286.6445007324219, "b": 551.2162475585938, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 55.530521392822266, "t": 549.3795166015625, "r": 139.7225341796875, "b": 545.0216064453125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Computational Linguistics(COLING2002)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 183.10536193847656, "t": 549.3795166015625, "r": 190.85670471191406, "b": 545.0216064453125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "140", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 207.6983184814453, "t": 549.3795166015625, "r": 215.4496612548828, "b": 545.0216064453125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "140", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 234.8751678466797, "t": 549.3795166015625, "r": 237.4583282470703, "b": 545.0216064453125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446044921875, "t": 549.3795166015625, "r": 264.63580322265625, "b": 545.0216064453125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "150", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 284.06134033203125, "t": 549.3795166015625, "r": 286.6445007324219, "b": 545.0216064453125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 55.530521392822266, "t": 542.4105834960938, "r": 128.96026611328125, "b": 538.0201416015625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "\u96fb\u6c17\u60c5\u5831\u901a\u4fe1\u5b66\u4f1a 2003 \u5e74\u7dcf\u5408\u5927\u4f1a", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 183.10536193847656, "t": 543.1849365234375, "r": 190.85670471191406, "b": 538.8270263671875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "150", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 210.2822265625, "t": 543.1849365234375, "r": 212.86538696289062, "b": 538.8270263671875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.29153442382812, "t": 543.1849365234375, "r": 240.04287719726562, "b": 538.8270263671875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "142", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446044921875, "t": 543.1849365234375, "r": 264.63580322265625, "b": 538.8270263671875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "223", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.4774169921875, "t": 543.1849365234375, "r": 289.228759765625, "b": 538.8270263671875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "147", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 55.530521392822266, "t": 534.9253540039062, "r": 129.88177490234375, "b": 530.534912109375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "\u60c5\u5831\u51e6\u7406\u5b66\u4f1a\u7b2c 65 \u56de\u5168\u56fd\u5927\u4f1a (2003)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 183.10536193847656, "t": 535.69970703125, "r": 190.85670471191406, "b": 531.341796875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "177", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 210.2822265625, "t": 535.69970703125, "r": 212.86538696289062, "b": 531.341796875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.29153442382812, "t": 535.69970703125, "r": 240.04287719726562, "b": 531.341796875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "176", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446044921875, "t": 535.69970703125, "r": 264.63580322265625, "b": 531.341796875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "150", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.4774169921875, "t": 535.69970703125, "r": 289.228759765625, "b": 531.341796875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "236", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 55.530521392822266, "t": 527.6982421875, "r": 129.88177490234375, "b": 523.3078002929688, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "\u7b2c 17 \u56de\u4eba\u5de5\u77e5\u80fd\u5b66\u4f1a\u5168\u56fd\u5927\u4f1a (2003)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 183.10536193847656, "t": 528.4725952148438, "r": 190.85670471191406, "b": 524.1146850585938, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "208", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 210.2822265625, "t": 528.4725952148438, "r": 212.86538696289062, "b": 524.1146850585938, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.29153442382812, "t": 528.4725952148438, "r": 240.04287719726562, "b": 524.1146850585938, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "203", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446044921875, "t": 528.4725952148438, "r": 264.63580322265625, "b": 524.1146850585938, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "152", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.4774169921875, "t": 528.4725952148438, "r": 289.228759765625, "b": 524.1146850585938, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "244", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 55.530521392822266, "t": 520.47119140625, "r": 127.32453918457031, "b": 516.0807495117188, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "\u81ea\u7136\u8a00\u8a9e\u51e6\u7406\u7814\u7a76\u4f1a\u7b2c 146 \u301c 155 \u56de", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 184.39730834960938, "t": 521.2455444335938, "r": 189.56455993652344, "b": 516.8876342773438, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "98", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 210.2822265625, "t": 521.2455444335938, "r": 212.86538696289062, "b": 516.8876342773438, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 233.58348083496094, "t": 521.2455444335938, "r": 238.750732421875, "b": 516.8876342773438, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446044921875, "t": 521.2455444335938, "r": 264.63580322265625, "b": 516.8876342773438, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "150", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.4774169921875, "t": 521.2455444335938, "r": 289.228759765625, "b": 516.8876342773438, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "232", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 55.530521392822266, "t": 512.986083984375, "r": 110.16829681396484, "b": 508.59564208984375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "WWW \u304b\u3089\u53ce\u96c6\u3057\u305f\u8ad6\u6587", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 183.10536193847656, "t": 514.0184326171875, "r": 190.85670471191406, "b": 509.6605224609375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "107", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 208.99026489257812, "t": 514.0184326171875, "r": 214.1575164794922, "b": 509.6605224609375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "73", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 233.58348083496094, "t": 514.0184326171875, "r": 238.750732421875, "b": 509.6605224609375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "34", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446044921875, "t": 514.0184326171875, "r": 264.63580322265625, "b": 509.6605224609375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "147", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 282.7693786621094, "t": 514.0184326171875, "r": 287.9366149902344, "b": 509.6605224609375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "96", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 183.10536193847656, "t": 506.5333251953125, "r": 190.85670471191406, "b": 502.1754150390625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "945", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 207.6983184814453, "t": 506.5333251953125, "r": 215.4496612548828, "b": 502.1754150390625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "294", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.29153442382812, "t": 506.5333251953125, "r": 240.04287719726562, "b": 502.1754150390625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "651", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 255.7650604248047, "t": 506.5333251953125, "r": 265.7520446777344, "b": 502.1754150390625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "1122", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.4774169921875, "t": 506.5333251953125, "r": 289.228759765625, "b": 502.1754150390625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "955", "column_header": false, "row_header": false, "row_section": false}]]}}, {"self_ref": "#/tables/7", "parent": {"cref": "#/body"}, "children": [], "label": "table", "prov": [{"page_no": 8, "bbox": {"l": 304.9219970703125, "t": 573.485107421875, "r": 550.2321166992188, "b": 504.09930419921875, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [{"cref": "#/texts/290"}], "references": [], "footnotes": [], "image": null, "data": {"table_cells": [{"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 392.0967102050781, "t": 570.425537109375, "r": 438.0144958496094, "b": 565.3603515625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 3, "text": "Shares (in millions)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 459.0486145019531, "t": 570.3758544921875, "r": 542.0001831054688, "b": 559.1006469726562, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 5, "text": "Weighted Average Grant Date Fair Value", "column_header": true, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 393.24420166015625, "t": 555.2528686523438, "r": 407.3463134765625, "b": 550.1876831054688, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "RS U s", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 427.1832275390625, "t": 555.2528686523438, "r": 440.98779296875, "b": 550.1876831054688, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "PSUs", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 468.3825378417969, "t": 555.2528686523438, "r": 482.4846496582031, "b": 550.1876831054688, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "RSUs", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 516.92578125, "t": 555.2528686523438, "r": 530.7303466796875, "b": 550.1876831054688, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "PSUs", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 306.11492919921875, "t": 547.38916015625, "r": 364.65606689453125, "b": 542.323974609375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Nonvested on Janua ry 1", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 396.2466125488281, "t": 547.0867309570312, "r": 403.75531005859375, "b": 542.0215454101562, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "1. 1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 429.8183898925781, "t": 547.0867309570312, "r": 437.32708740234375, "b": 542.0215454101562, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 465.5285949707031, "t": 547.0867309570312, "r": 483.5500183105469, "b": 542.0215454101562, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "90.10 $", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 513.4482421875, "t": 547.0867309570312, "r": 531.4696655273438, "b": 542.0215454101562, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "$ 91.19", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 306.11492919921875, "t": 538.3154907226562, "r": 325.6267395019531, "b": 533.2503051757812, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Granted", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 396.2466125488281, "t": 538.3154907226562, "r": 403.75531005859375, "b": 533.2503051757812, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "0. 5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 429.8183898925781, "t": 538.3154907226562, "r": 437.32708740234375, "b": 533.2503051757812, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 466.435791015625, "t": 538.3154907226562, "r": 482.5483093261719, "b": 533.2503051757812, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "117.44", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 514.2906494140625, "t": 538.3154907226562, "r": 530.809814453125, "b": 533.2503051757812, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "122.41", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 306.11492919921875, "t": 530.4517822265625, "r": 322.628662109375, "b": 525.3865966796875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Vested", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 394.4322204589844, "t": 530.4517822265625, "r": 405.5362548828125, "b": 525.3865966796875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "(0. 5 )", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 427.70159912109375, "t": 530.4517822265625, "r": 438.8056335449219, "b": 525.3865966796875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "(0.1)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 468.5553283691406, "t": 530.4517822265625, "r": 482.0704345703125, "b": 525.3865966796875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "87.08", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 516.0186157226562, "t": 530.4517822265625, "r": 529.5337524414062, "b": 525.3865966796875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "81.14", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 306.11492919921875, "t": 522.3585205078125, "r": 356.2477111816406, "b": 517.2933349609375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Canceled or forfeited", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 394.4322204589844, "t": 521.6805419921875, "r": 405.5362548828125, "b": 516.6153564453125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "(0. 1 )", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 431.02801513671875, "t": 521.6805419921875, "r": 436.4280090332031, "b": 516.6153564453125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 465.83099365234375, "t": 521.6805419921875, "r": 482.3501281738281, "b": 516.6153564453125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "102.01", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 516.0186157226562, "t": 521.6805419921875, "r": 529.5337524414062, "b": 516.6153564453125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "92.18", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 306.11492919921875, "t": 513.5142822265625, "r": 373.3576354980469, "b": 508.4490661621094, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Nonvested on December 31", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 396.2466125488281, "t": 513.5142822265625, "r": 403.75531005859375, "b": 508.4490661621094, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "1.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 429.5159912109375, "t": 513.5142822265625, "r": 437.0246887207031, "b": 508.4490661621094, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 463.7142028808594, "t": 513.5142822265625, "r": 484.7396545410156, "b": 508.4490661621094, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "104.85 $", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 512.99462890625, "t": 513.5142822265625, "r": 534.0200805664062, "b": 508.4490661621094, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "$ 104.51", "column_header": false, "row_header": false, "row_section": false}], "num_rows": 7, "num_cols": 5, "grid": [[{"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 392.0967102050781, "t": 570.425537109375, "r": 438.0144958496094, "b": 565.3603515625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 3, "text": "Shares (in millions)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 392.0967102050781, "t": 570.425537109375, "r": 438.0144958496094, "b": 565.3603515625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 3, "text": "Shares (in millions)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 459.0486145019531, "t": 570.3758544921875, "r": 542.0001831054688, "b": 559.1006469726562, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 5, "text": "Weighted Average Grant Date Fair Value", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 459.0486145019531, "t": 570.3758544921875, "r": 542.0001831054688, "b": 559.1006469726562, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 5, "text": "Weighted Average Grant Date Fair Value", "column_header": true, "row_header": false, "row_section": false}], [{"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 393.24420166015625, "t": 555.2528686523438, "r": 407.3463134765625, "b": 550.1876831054688, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "RS U s", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 427.1832275390625, "t": 555.2528686523438, "r": 440.98779296875, "b": 550.1876831054688, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "PSUs", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 468.3825378417969, "t": 555.2528686523438, "r": 482.4846496582031, "b": 550.1876831054688, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "RSUs", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 516.92578125, "t": 555.2528686523438, "r": 530.7303466796875, "b": 550.1876831054688, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "PSUs", "column_header": true, "row_header": false, "row_section": false}], [{"bbox": {"l": 306.11492919921875, "t": 547.38916015625, "r": 364.65606689453125, "b": 542.323974609375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Nonvested on Janua ry 1", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 396.2466125488281, "t": 547.0867309570312, "r": 403.75531005859375, "b": 542.0215454101562, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "1. 1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 429.8183898925781, "t": 547.0867309570312, "r": 437.32708740234375, "b": 542.0215454101562, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 465.5285949707031, "t": 547.0867309570312, "r": 483.5500183105469, "b": 542.0215454101562, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "90.10 $", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 513.4482421875, "t": 547.0867309570312, "r": 531.4696655273438, "b": 542.0215454101562, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "$ 91.19", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 306.11492919921875, "t": 538.3154907226562, "r": 325.6267395019531, "b": 533.2503051757812, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Granted", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 396.2466125488281, "t": 538.3154907226562, "r": 403.75531005859375, "b": 533.2503051757812, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "0. 5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 429.8183898925781, "t": 538.3154907226562, "r": 437.32708740234375, "b": 533.2503051757812, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 466.435791015625, "t": 538.3154907226562, "r": 482.5483093261719, "b": 533.2503051757812, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "117.44", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 514.2906494140625, "t": 538.3154907226562, "r": 530.809814453125, "b": 533.2503051757812, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "122.41", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 306.11492919921875, "t": 530.4517822265625, "r": 322.628662109375, "b": 525.3865966796875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Vested", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 394.4322204589844, "t": 530.4517822265625, "r": 405.5362548828125, "b": 525.3865966796875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "(0. 5 )", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 427.70159912109375, "t": 530.4517822265625, "r": 438.8056335449219, "b": 525.3865966796875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "(0.1)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 468.5553283691406, "t": 530.4517822265625, "r": 482.0704345703125, "b": 525.3865966796875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "87.08", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 516.0186157226562, "t": 530.4517822265625, "r": 529.5337524414062, "b": 525.3865966796875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "81.14", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 306.11492919921875, "t": 522.3585205078125, "r": 356.2477111816406, "b": 517.2933349609375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Canceled or forfeited", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 394.4322204589844, "t": 521.6805419921875, "r": 405.5362548828125, "b": 516.6153564453125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "(0. 1 )", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 431.02801513671875, "t": 521.6805419921875, "r": 436.4280090332031, "b": 516.6153564453125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 465.83099365234375, "t": 521.6805419921875, "r": 482.3501281738281, "b": 516.6153564453125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "102.01", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 516.0186157226562, "t": 521.6805419921875, "r": 529.5337524414062, "b": 516.6153564453125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "92.18", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 306.11492919921875, "t": 513.5142822265625, "r": 373.3576354980469, "b": 508.4490661621094, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Nonvested on December 31", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 396.2466125488281, "t": 513.5142822265625, "r": 403.75531005859375, "b": 508.4490661621094, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "1.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 429.5159912109375, "t": 513.5142822265625, "r": 437.0246887207031, "b": 508.4490661621094, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 463.7142028808594, "t": 513.5142822265625, "r": 484.7396545410156, "b": 508.4490661621094, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "104.85 $", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 512.99462890625, "t": 513.5142822265625, "r": 534.0200805664062, "b": 508.4490661621094, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "$ 104.51", "column_header": false, "row_header": false, "row_section": false}]]}}, {"self_ref": "#/tables/8", "parent": {"cref": "#/body"}, "children": [], "label": "table", "prov": [{"page_no": 13, "bbox": {"l": 84.0283203125, "t": 635.6664428710938, "r": 239.1690673828125, "b": 577.606689453125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "data": {"table_cells": [], "num_rows": 0, "num_cols": 0, "grid": []}}, {"self_ref": "#/tables/9", "parent": {"cref": "#/body"}, "children": [], "label": "table", "prov": [{"page_no": 13, "bbox": {"l": 82.92001342773438, "t": 558.2236938476562, "r": 239.1903533935547, "b": 500.716064453125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "data": {"table_cells": [], "num_rows": 0, "num_cols": 0, "grid": []}}, {"self_ref": "#/tables/10", "parent": {"cref": "#/body"}, "children": [], "label": "table", "prov": [{"page_no": 13, "bbox": {"l": 83.94786071777344, "t": 482.9522705078125, "r": 239.17135620117188, "b": 424.0904235839844, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "data": {"table_cells": [], "num_rows": 0, "num_cols": 0, "grid": []}}, {"self_ref": "#/tables/11", "parent": {"cref": "#/body"}, "children": [], "label": "table", "prov": [{"page_no": 13, "bbox": {"l": 83.31756591796875, "t": 395.9864501953125, "r": 248.873046875, "b": 304.7430114746094, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [{"cref": "#/texts/503"}], "references": [], "footnotes": [], "image": null, "data": {"table_cells": [], "num_rows": 0, "num_cols": 0, "grid": []}}, {"self_ref": "#/tables/12", "parent": {"cref": "#/body"}, "children": [], "label": "table", "prov": [{"page_no": 13, "bbox": {"l": 310.3294372558594, "t": 690.8223266601562, "r": 555.8338623046875, "b": 655.8524780273438, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "data": {"table_cells": [], "num_rows": 0, "num_cols": 0, "grid": []}}, {"self_ref": "#/tables/13", "parent": {"cref": "#/body"}, "children": [], "label": "table", "prov": [{"page_no": 13, "bbox": {"l": 309.9566345214844, "t": 637.385498046875, "r": 555.7466430664062, "b": 607.2774658203125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "data": {"table_cells": [], "num_rows": 0, "num_cols": 0, "grid": []}}, {"self_ref": "#/tables/14", "parent": {"cref": "#/body"}, "children": [], "label": "table", "prov": [{"page_no": 13, "bbox": {"l": 309.9635314941406, "t": 596.2945556640625, "r": 555.7054443359375, "b": 558.4485473632812, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "data": {"table_cells": [], "num_rows": 0, "num_cols": 0, "grid": []}}, {"self_ref": "#/tables/15", "parent": {"cref": "#/body"}, "children": [], "label": "table", "prov": [{"page_no": 13, "bbox": {"l": 309.79150390625, "t": 538.0946044921875, "r": 425.9603271484375, "b": 499.60601806640625, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [{"cref": "#/texts/505"}], "references": [], "footnotes": [], "image": null, "data": {"table_cells": [], "num_rows": 0, "num_cols": 0, "grid": []}}, {"self_ref": "#/tables/16", "parent": {"cref": "#/body"}, "children": [], "label": "table", "prov": [{"page_no": 13, "bbox": {"l": 335.2694091796875, "t": 403.53253173828125, "r": 490.081787109375, "b": 354.97760009765625, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "data": {"table_cells": [], "num_rows": 0, "num_cols": 0, "grid": []}}, {"self_ref": "#/tables/17", "parent": {"cref": "#/body"}, "children": [], "label": "table", "prov": [{"page_no": 13, "bbox": {"l": 334.9334716796875, "t": 338.0523681640625, "r": 490.0914306640625, "b": 289.2789001464844, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "data": {"table_cells": [], "num_rows": 0, "num_cols": 0, "grid": []}}, {"self_ref": "#/tables/18", "parent": {"cref": "#/body"}, "children": [], "label": "table", "prov": [{"page_no": 13, "bbox": {"l": 335.2545471191406, "t": 272.92431640625, "r": 490.22369384765625, "b": 224.31207275390625, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "data": {"table_cells": [], "num_rows": 0, "num_cols": 0, "grid": []}}, {"self_ref": "#/tables/19", "parent": {"cref": "#/body"}, "children": [], "label": "table", "prov": [{"page_no": 13, "bbox": {"l": 333.9573669433594, "t": 198.8865966796875, "r": 518.4768676757812, "b": 126.5096435546875, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [{"cref": "#/texts/506"}], "references": [], "footnotes": [], "image": null, "data": {"table_cells": [], "num_rows": 0, "num_cols": 0, "grid": []}}, {"self_ref": "#/tables/20", "parent": {"cref": "#/body"}, "children": [], "label": "table", "prov": [{"page_no": 14, "bbox": {"l": 51.72642135620117, "t": 518.3907470703125, "r": 283.114013671875, "b": 447.7554931640625, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "data": {"table_cells": [], "num_rows": 0, "num_cols": 0, "grid": []}}, {"self_ref": "#/tables/21", "parent": {"cref": "#/body"}, "children": [], "label": "table", "prov": [{"page_no": 14, "bbox": {"l": 51.434879302978516, "t": 338.51251220703125, "r": 310.7267150878906, "b": 300.17974853515625, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "data": {"table_cells": [], "num_rows": 0, "num_cols": 0, "grid": []}}, {"self_ref": "#/tables/22", "parent": {"cref": "#/body"}, "children": [], "label": "table", "prov": [{"page_no": 14, "bbox": {"l": 50.86823654174805, "t": 287.90374755859375, "r": 310.6080017089844, "b": 249.55401611328125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "data": {"table_cells": [], "num_rows": 0, "num_cols": 0, "grid": []}}, {"self_ref": "#/tables/23", "parent": {"cref": "#/body"}, "children": [], "label": "table", "prov": [{"page_no": 14, "bbox": {"l": 51.27280807495117, "t": 238.271484375, "r": 311.0897216796875, "b": 200.086669921875, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "data": {"table_cells": [], "num_rows": 0, "num_cols": 0, "grid": []}}, {"self_ref": "#/tables/24", "parent": {"cref": "#/body"}, "children": [], "label": "table", "prov": [{"page_no": 14, "bbox": {"l": 318.9809265136719, "t": 630.765380859375, "r": 534.6229248046875, "b": 577.3739624023438, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "data": {"table_cells": [], "num_rows": 0, "num_cols": 0, "grid": []}}, {"self_ref": "#/tables/25", "parent": {"cref": "#/body"}, "children": [], "label": "table", "prov": [{"page_no": 14, "bbox": {"l": 319.0057678222656, "t": 565.8936767578125, "r": 534.408935546875, "b": 512.142333984375, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "data": {"table_cells": [], "num_rows": 0, "num_cols": 0, "grid": []}}, {"self_ref": "#/tables/26", "parent": {"cref": "#/body"}, "children": [], "label": "table", "prov": [{"page_no": 14, "bbox": {"l": 328.1381530761719, "t": 503.3182067871094, "r": 523.8916015625, "b": 433.7275695800781, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "data": {"table_cells": [], "num_rows": 0, "num_cols": 0, "grid": []}}, {"self_ref": "#/tables/27", "parent": {"cref": "#/body"}, "children": [], "label": "table", "prov": [{"page_no": 14, "bbox": {"l": 319.4707946777344, "t": 361.09698486328125, "r": 518.5693359375, "b": 314.05645751953125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "data": {"table_cells": [], "num_rows": 0, "num_cols": 0, "grid": []}}, {"self_ref": "#/tables/28", "parent": {"cref": "#/body"}, "children": [], "label": "table", "prov": [{"page_no": 14, "bbox": {"l": 319.982666015625, "t": 302.7562561035156, "r": 519.0963745117188, "b": 256.30419921875, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "data": {"table_cells": [], "num_rows": 0, "num_cols": 0, "grid": []}}, {"self_ref": "#/tables/29", "parent": {"cref": "#/body"}, "children": [], "label": "table", "prov": [{"page_no": 14, "bbox": {"l": 319.8287658691406, "t": 245.5906982421875, "r": 519.6065673828125, "b": 198.8935546875, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "data": {"table_cells": [], "num_rows": 0, "num_cols": 0, "grid": []}}, {"self_ref": "#/tables/30", "parent": {"cref": "#/body"}, "children": [], "label": "table", "prov": [{"page_no": 14, "bbox": {"l": 319.06494140625, "t": 182.1591796875, "r": 533.77392578125, "b": 122.80792236328125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [{"cref": "#/texts/511"}], "references": [], "footnotes": [], "image": null, "data": {"table_cells": [], "num_rows": 0, "num_cols": 0, "grid": []}}, {"self_ref": "#/tables/31", "parent": {"cref": "#/body"}, "children": [], "label": "table", "prov": [{"page_no": 15, "bbox": {"l": 55.116363525390625, "t": 655.7449951171875, "r": 279.370849609375, "b": 542.6654663085938, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "data": {"table_cells": [], "num_rows": 0, "num_cols": 0, "grid": []}}, {"self_ref": "#/tables/32", "parent": {"cref": "#/body"}, "children": [], "label": "table", "prov": [{"page_no": 15, "bbox": {"l": 54.28135299682617, "t": 531.7384033203125, "r": 279.2568359375, "b": 418.4729309082031, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "data": {"table_cells": [], "num_rows": 0, "num_cols": 0, "grid": []}}, {"self_ref": "#/tables/33", "parent": {"cref": "#/body"}, "children": [], "label": "table", "prov": [{"page_no": 15, "bbox": {"l": 50.64818572998047, "t": 286.01953125, "r": 319.9103088378906, "b": 160.736328125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [{"cref": "#/texts/512"}], "references": [], "footnotes": [], "image": null, "data": {"table_cells": [], "num_rows": 0, "num_cols": 0, "grid": []}}, {"self_ref": "#/tables/34", "parent": {"cref": "#/body"}, "children": [], "label": "table", "prov": [{"page_no": 15, "bbox": {"l": 323.0059509277344, "t": 670.452880859375, "r": 525.95166015625, "b": 569.088623046875, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "data": {"table_cells": [], "num_rows": 0, "num_cols": 0, "grid": []}}, {"self_ref": "#/tables/35", "parent": {"cref": "#/body"}, "children": [], "label": "table", "prov": [{"page_no": 15, "bbox": {"l": 323.384765625, "t": 550.0270385742188, "r": 526.1268920898438, "b": 447.90789794921875, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "data": {"table_cells": [], "num_rows": 0, "num_cols": 0, "grid": []}}, {"self_ref": "#/tables/36", "parent": {"cref": "#/body"}, "children": [], "label": "table", "prov": [{"page_no": 15, "bbox": {"l": 323.46868896484375, "t": 429.5491638183594, "r": 525.9569091796875, "b": 327.739501953125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "data": {"table_cells": [], "num_rows": 0, "num_cols": 0, "grid": []}}, {"self_ref": "#/tables/37", "parent": {"cref": "#/body"}, "children": [], "label": "table", "prov": [{"page_no": 15, "bbox": {"l": 353.6920471191406, "t": 304.594970703125, "r": 495.4288024902344, "b": 156.22674560546875, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [{"cref": "#/texts/514"}], "references": [], "footnotes": [], "image": null, "data": {"table_cells": [], "num_rows": 0, "num_cols": 0, "grid": []}}], "key_value_items": [], "pages": {"1": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 1}, "2": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 2}, "3": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 3}, "4": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 4}, "5": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 5}, "6": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 6}, "7": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 7}, "8": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 8}, "9": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 9}, "10": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 10}, "11": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 11}, "12": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 12}, "13": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 13}, "14": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 14}, "15": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 15}, "16": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 16}}}
\ No newline at end of file
+{"schema_name": "DoclingDocument", "version": "1.1.0", "name": "2203.01017v2", "origin": {"mimetype": "application/pdf", "binary_hash": 10763566541725197878, "filename": "2203.01017v2.pdf", "uri": null}, "furniture": {"self_ref": "#/furniture", "parent": null, "children": [], "content_layer": "furniture", "name": "_root_", "label": "unspecified"}, "body": {"self_ref": "#/body", "parent": null, "children": [{"cref": "#/texts/0"}, {"cref": "#/texts/1"}, {"cref": "#/texts/2"}, {"cref": "#/groups/0"}, {"cref": "#/texts/4"}, {"cref": "#/texts/5"}, {"cref": "#/texts/6"}, {"cref": "#/texts/7"}, {"cref": "#/texts/8"}, {"cref": "#/pictures/0"}, {"cref": "#/tables/0"}, {"cref": "#/groups/1"}, {"cref": "#/pictures/1"}, {"cref": "#/pictures/2"}, {"cref": "#/tables/1"}, {"cref": "#/texts/64"}, {"cref": "#/texts/65"}, {"cref": "#/texts/66"}, {"cref": "#/texts/67"}, {"cref": "#/texts/68"}, {"cref": "#/texts/69"}, {"cref": "#/texts/70"}, {"cref": "#/groups/2"}, {"cref": "#/texts/75"}, {"cref": "#/texts/76"}, {"cref": "#/texts/77"}, {"cref": "#/texts/78"}, {"cref": "#/texts/79"}, {"cref": "#/texts/80"}, {"cref": "#/texts/81"}, {"cref": "#/texts/82"}, {"cref": "#/texts/83"}, {"cref": "#/texts/84"}, {"cref": "#/texts/85"}, {"cref": "#/texts/86"}, {"cref": "#/texts/87"}, {"cref": "#/texts/88"}, {"cref": "#/pictures/3"}, {"cref": "#/texts/123"}, {"cref": "#/texts/124"}, {"cref": "#/texts/125"}, {"cref": "#/texts/126"}, {"cref": "#/texts/127"}, {"cref": "#/texts/128"}, {"cref": "#/texts/129"}, {"cref": "#/texts/130"}, {"cref": "#/texts/131"}, {"cref": "#/tables/2"}, {"cref": "#/texts/133"}, {"cref": "#/texts/134"}, {"cref": "#/texts/135"}, {"cref": "#/texts/136"}, {"cref": "#/texts/137"}, {"cref": "#/texts/138"}, {"cref": "#/texts/139"}, {"cref": "#/texts/140"}, {"cref": "#/pictures/4"}, {"cref": "#/pictures/5"}, {"cref": "#/texts/246"}, {"cref": "#/texts/247"}, {"cref": "#/texts/248"}, {"cref": "#/texts/249"}, {"cref": "#/texts/250"}, {"cref": "#/texts/251"}, {"cref": "#/texts/252"}, {"cref": "#/texts/253"}, {"cref": "#/texts/254"}, {"cref": "#/texts/255"}, {"cref": "#/texts/256"}, {"cref": "#/texts/257"}, {"cref": "#/texts/258"}, {"cref": "#/texts/259"}, {"cref": "#/texts/260"}, {"cref": "#/texts/261"}, {"cref": "#/texts/262"}, {"cref": "#/texts/263"}, {"cref": "#/texts/264"}, {"cref": "#/texts/265"}, {"cref": "#/texts/266"}, {"cref": "#/texts/267"}, {"cref": "#/texts/268"}, {"cref": "#/texts/269"}, {"cref": "#/texts/270"}, {"cref": "#/texts/271"}, {"cref": "#/texts/272"}, {"cref": "#/texts/273"}, {"cref": "#/texts/274"}, {"cref": "#/texts/275"}, {"cref": "#/tables/3"}, {"cref": "#/texts/276"}, {"cref": "#/texts/277"}, {"cref": "#/texts/278"}, {"cref": "#/tables/4"}, {"cref": "#/texts/280"}, {"cref": "#/tables/5"}, {"cref": "#/texts/282"}, {"cref": "#/groups/3"}, {"cref": "#/texts/285"}, {"cref": "#/texts/286"}, {"cref": "#/pictures/6"}, {"cref": "#/pictures/7"}, {"cref": "#/tables/6"}, {"cref": "#/tables/7"}, {"cref": "#/pictures/8"}, {"cref": "#/pictures/9"}, {"cref": "#/pictures/10"}, {"cref": "#/texts/348"}, {"cref": "#/texts/349"}, {"cref": "#/texts/350"}, {"cref": "#/texts/351"}, {"cref": "#/texts/352"}, {"cref": "#/groups/4"}, {"cref": "#/texts/354"}, {"cref": "#/groups/5"}, {"cref": "#/texts/380"}, {"cref": "#/texts/381"}, {"cref": "#/groups/6"}, {"cref": "#/texts/396"}, {"cref": "#/texts/397"}, {"cref": "#/texts/398"}, {"cref": "#/texts/399"}, {"cref": "#/texts/400"}, {"cref": "#/texts/401"}, {"cref": "#/texts/402"}, {"cref": "#/texts/403"}, {"cref": "#/texts/404"}, {"cref": "#/texts/405"}, {"cref": "#/groups/7"}, {"cref": "#/texts/411"}, {"cref": "#/texts/412"}, {"cref": "#/texts/413"}, {"cref": "#/pictures/11"}, {"cref": "#/groups/8"}, {"cref": "#/texts/476"}, {"cref": "#/texts/477"}, {"cref": "#/texts/478"}, {"cref": "#/groups/9"}, {"cref": "#/texts/484"}, {"cref": "#/texts/485"}, {"cref": "#/groups/10"}, {"cref": "#/texts/491"}, {"cref": "#/groups/11"}, {"cref": "#/texts/496"}, {"cref": "#/texts/497"}, {"cref": "#/texts/498"}, {"cref": "#/texts/499"}, {"cref": "#/tables/8"}, {"cref": "#/tables/9"}, {"cref": "#/tables/10"}, {"cref": "#/tables/11"}, {"cref": "#/texts/500"}, {"cref": "#/tables/12"}, {"cref": "#/tables/13"}, {"cref": "#/tables/14"}, {"cref": "#/pictures/12"}, {"cref": "#/tables/15"}, {"cref": "#/tables/16"}, {"cref": "#/tables/17"}, {"cref": "#/tables/18"}, {"cref": "#/pictures/13"}, {"cref": "#/tables/19"}, {"cref": "#/texts/503"}, {"cref": "#/tables/20"}, {"cref": "#/pictures/14"}, {"cref": "#/texts/504"}, {"cref": "#/tables/21"}, {"cref": "#/tables/22"}, {"cref": "#/tables/23"}, {"cref": "#/pictures/15"}, {"cref": "#/texts/505"}, {"cref": "#/tables/24"}, {"cref": "#/tables/25"}, {"cref": "#/tables/26"}, {"cref": "#/pictures/16"}, {"cref": "#/tables/27"}, {"cref": "#/tables/28"}, {"cref": "#/tables/29"}, {"cref": "#/tables/30"}, {"cref": "#/texts/508"}, {"cref": "#/pictures/17"}, {"cref": "#/tables/31"}, {"cref": "#/pictures/18"}, {"cref": "#/tables/32"}, {"cref": "#/pictures/19"}, {"cref": "#/pictures/20"}, {"cref": "#/tables/33"}, {"cref": "#/tables/34"}, {"cref": "#/pictures/21"}, {"cref": "#/tables/35"}, {"cref": "#/pictures/22"}, {"cref": "#/tables/36"}, {"cref": "#/tables/37"}, {"cref": "#/texts/510"}, {"cref": "#/texts/511"}, {"cref": "#/pictures/23"}, {"cref": "#/texts/513"}], "content_layer": "body", "name": "_root_", "label": "unspecified"}, "groups": [{"self_ref": "#/groups/0", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/3"}], "content_layer": "body", "name": "group", "label": "key_value_area"}, {"self_ref": "#/groups/1", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/12"}, {"cref": "#/texts/38"}], "content_layer": "body", "name": "list", "label": "list"}, {"self_ref": "#/groups/2", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/71"}, {"cref": "#/texts/72"}, {"cref": "#/texts/73"}, {"cref": "#/texts/74"}], "content_layer": "body", "name": "list", "label": "list"}, {"self_ref": "#/groups/3", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/283"}, {"cref": "#/texts/284"}], "content_layer": "body", "name": "list", "label": "list"}, {"self_ref": "#/groups/4", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/353"}], "content_layer": "body", "name": "list", "label": "list"}, {"self_ref": "#/groups/5", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/355"}, {"cref": "#/texts/356"}, {"cref": "#/texts/357"}, {"cref": "#/texts/358"}, {"cref": "#/texts/359"}, {"cref": "#/texts/360"}, {"cref": "#/texts/361"}, {"cref": "#/texts/362"}, {"cref": "#/texts/363"}, {"cref": "#/texts/364"}, {"cref": "#/texts/365"}, {"cref": "#/texts/366"}, {"cref": "#/texts/367"}, {"cref": "#/texts/368"}, {"cref": "#/texts/369"}, {"cref": "#/texts/370"}, {"cref": "#/texts/371"}, {"cref": "#/texts/372"}, {"cref": "#/texts/373"}, {"cref": "#/texts/374"}, {"cref": "#/texts/375"}, {"cref": "#/texts/376"}, {"cref": "#/texts/377"}, {"cref": "#/texts/378"}, {"cref": "#/texts/379"}], "content_layer": "body", "name": "list", "label": "list"}, {"self_ref": "#/groups/6", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/382"}, {"cref": "#/texts/383"}, {"cref": "#/texts/384"}, {"cref": "#/texts/385"}, {"cref": "#/texts/386"}, {"cref": "#/texts/387"}, {"cref": "#/texts/388"}, {"cref": "#/texts/389"}, {"cref": "#/texts/390"}, {"cref": "#/texts/391"}, {"cref": "#/texts/392"}, {"cref": "#/texts/393"}, {"cref": "#/texts/394"}, {"cref": "#/texts/395"}], "content_layer": "body", "name": "list", "label": "list"}, {"self_ref": "#/groups/7", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/406"}, {"cref": "#/texts/407"}, {"cref": "#/texts/408"}, {"cref": "#/texts/409"}, {"cref": "#/texts/410"}], "content_layer": "body", "name": "list", "label": "list"}, {"self_ref": "#/groups/8", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/474"}, {"cref": "#/texts/475"}], "content_layer": "body", "name": "list", "label": "list"}, {"self_ref": "#/groups/9", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/479"}, {"cref": "#/texts/480"}, {"cref": "#/texts/481"}, {"cref": "#/texts/482"}, {"cref": "#/texts/483"}], "content_layer": "body", "name": "list", "label": "list"}, {"self_ref": "#/groups/10", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/486"}, {"cref": "#/texts/487"}, {"cref": "#/texts/488"}, {"cref": "#/texts/489"}, {"cref": "#/texts/490"}], "content_layer": "body", "name": "list", "label": "list"}, {"self_ref": "#/groups/11", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/492"}, {"cref": "#/texts/493"}, {"cref": "#/texts/494"}, {"cref": "#/texts/495"}], "content_layer": "body", "name": "list", "label": "list"}], "texts": [{"self_ref": "#/texts/0", "parent": {"cref": "#/body"}, "children": [], "content_layer": "furniture", "label": "page_header", "prov": [{"page_no": 1, "bbox": {"l": 18.340221, "t": 584.17999, "r": 36.339779, "b": 231.99996999999996, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 38]}], "orig": "arXiv:2203.01017v2 [cs.CV] 11 Mar 2022", "text": "arXiv:2203.01017v2 [cs.CV] 11 Mar 2022"}, {"self_ref": "#/texts/1", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "section_header", "prov": [{"page_no": 1, "bbox": {"l": 96.301003, "t": 684.96588, "r": 498.92708999999996, "b": 672.06866, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 61]}], "orig": "TableFormer: Table Structure Understanding with Transformers.", "text": "TableFormer: Table Structure Understanding with Transformers.", "level": 1}, {"self_ref": "#/texts/2", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "section_header", "prov": [{"page_no": 1, "bbox": {"l": 142.47701, "t": 645.31464, "r": 452.75027, "b": 620.67963, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 73]}], "orig": "Ahmed Nassar, Nikolaos Livathinos, Maksym Lysak, Peter Staar IBM Research", "text": "Ahmed Nassar, Nikolaos Livathinos, Maksym Lysak, Peter Staar IBM Research", "level": 1}, {"self_ref": "#/texts/3", "parent": {"cref": "#/groups/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 208.123, "t": 616.03876, "r": 378.73257, "b": 607.57446, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 35]}], "orig": "{ ahn,nli,mly,taa } @zurich.ibm.com", "text": "{ ahn,nli,mly,taa } @zurich.ibm.com"}, {"self_ref": "#/texts/4", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "section_header", "prov": [{"page_no": 1, "bbox": {"l": 145.99498, "t": 576.51703, "r": 190.48029, "b": 565.76929, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 8]}], "orig": "Abstract", "text": "Abstract", "level": 1}, {"self_ref": "#/texts/5", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "section_header", "prov": [{"page_no": 1, "bbox": {"l": 315.56702, "t": 573.99316, "r": 408.4407, "b": 565.24518, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 22]}], "orig": "a. Picture of a table:", "text": "a. Picture of a table:", "level": 1}, {"self_ref": "#/texts/6", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 50.111977, "t": 550.60492, "r": 286.36511, "b": 279.00335999999993, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1320]}], "orig": "Tables organize valuable content in a concise and compact representation. This content is extremely valuable for systems such as search engines, Knowledge Graph's, etc, since they enhance their predictive capabilities. Unfortunately, tables come in a large variety of shapes and sizes. Furthermore, they can have complex column/row-header configurations, multiline rows, different variety of separation lines, missing entries, etc. As such, the correct identification of the table-structure from an image is a nontrivial task. In this paper, we present a new table-structure identification model. The latter improves the latest end-toend deep learning model (i.e. encoder-dual-decoder from PubTabNet) in two significant ways. First, we introduce a new object detection decoder for table-cells. In this way, we can obtain the content of the table-cells from programmatic PDF's directly from the PDF source and avoid the training of the custom OCR decoders. This architectural change leads to more accurate table-content extraction and allows us to tackle non-english tables. Second, we replace the LSTM decoders with transformer based decoders. This upgrade improves significantly the previous state-of-the-art tree-editing-distance-score (TEDS) from 91% to 98.5% on simple tables and from 88.7% to 95% on complex tables.", "text": "Tables organize valuable content in a concise and compact representation. This content is extremely valuable for systems such as search engines, Knowledge Graph's, etc, since they enhance their predictive capabilities. Unfortunately, tables come in a large variety of shapes and sizes. Furthermore, they can have complex column/row-header configurations, multiline rows, different variety of separation lines, missing entries, etc. As such, the correct identification of the table-structure from an image is a nontrivial task. In this paper, we present a new table-structure identification model. The latter improves the latest end-toend deep learning model (i.e. encoder-dual-decoder from PubTabNet) in two significant ways. First, we introduce a new object detection decoder for table-cells. In this way, we can obtain the content of the table-cells from programmatic PDF's directly from the PDF source and avoid the training of the custom OCR decoders. This architectural change leads to more accurate table-content extraction and allows us to tackle non-english tables. Second, we replace the LSTM decoders with transformer based decoders. This upgrade improves significantly the previous state-of-the-art tree-editing-distance-score (TEDS) from 91% to 98.5% on simple tables and from 88.7% to 95% on complex tables."}, {"self_ref": "#/texts/7", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "section_header", "prov": [{"page_no": 1, "bbox": {"l": 50.111977, "t": 252.05723999999998, "r": 126.94804, "b": 241.30951000000005, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 15]}], "orig": "1. Introduction", "text": "1. Introduction", "level": 1}, {"self_ref": "#/texts/8", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 50.111977, "t": 231.21680000000003, "r": 286.36508, "b": 78.84822099999997, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 712]}], "orig": "The occurrence of tables in documents is ubiquitous. They often summarise quantitative or factual data, which is cumbersome to describe in verbose text but nevertheless extremely valuable. Unfortunately, this compact representation is often not easy to parse by machines. There are many implicit conventions used to obtain a compact table representation. For example, tables often have complex columnand row-headers in order to reduce duplicated cell content. Lines of different shapes and sizes are leveraged to separate content or indicate a tree structure. Additionally, tables can also have empty/missing table-entries or multi-row textual table-entries. Fig. 1 shows a table which presents all these issues.", "text": "The occurrence of tables in documents is ubiquitous. They often summarise quantitative or factual data, which is cumbersome to describe in verbose text but nevertheless extremely valuable. Unfortunately, this compact representation is often not easy to parse by machines. There are many implicit conventions used to obtain a compact table representation. For example, tables often have complex columnand row-headers in order to reduce duplicated cell content. Lines of different shapes and sizes are leveraged to separate content or indicate a tree structure. Additionally, tables can also have empty/missing table-entries or multi-row textual table-entries. Fig. 1 shows a table which presents all these issues."}, {"self_ref": "#/texts/9", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 451.9457100000001, "t": 556.65295, "r": 457.95050000000003, "b": 546.52252, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "1", "text": "1"}, {"self_ref": "#/texts/10", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 331.19681, "t": 522.64734, "r": 337.2016, "b": 512.51691, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "2", "text": "2"}, {"self_ref": "#/texts/11", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 384.0329, "t": 539.32104, "r": 390.03769, "b": 529.19061, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "3", "text": "3"}, {"self_ref": "#/texts/12", "parent": {"cref": "#/groups/1"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 1, "bbox": {"l": 315.56702, "t": 478.30521000000005, "r": 486.40194999999994, "b": 458.7572, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 68]}], "orig": "b. Red-annotation of bounding boxes, Blue-predictions by TableFormer", "text": "b. Red-annotation of bounding boxes, Blue-predictions by TableFormer", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/13", "parent": {"cref": "#/pictures/1"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 408.14752, "t": 449.17172, "r": 412.54001, "b": 440.38678, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "1", "text": "1"}, {"self_ref": "#/texts/14", "parent": {"cref": "#/pictures/1"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 356.11011, "t": 450.42783, "r": 360.50259, "b": 441.64288, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "0", "text": "0"}, {"self_ref": "#/texts/15", "parent": {"cref": "#/pictures/1"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 500.6777, "t": 451.06232, "r": 505.0701900000001, "b": 442.2773700000001, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "2", "text": "2"}, {"self_ref": "#/texts/16", "parent": {"cref": "#/pictures/1"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 356.13382, "t": 440.25211, "r": 360.52631, "b": 431.46716, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "3", "text": "3"}, {"self_ref": "#/texts/17", "parent": {"cref": "#/pictures/1"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 402.53992, "t": 436.1235, "r": 406.9324, "b": 427.33856, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "4", "text": "4"}, {"self_ref": "#/texts/18", "parent": {"cref": "#/pictures/1"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 448.58178999999996, "t": 439.15982, "r": 452.97427, "b": 430.37488, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "5", "text": "5"}, {"self_ref": "#/texts/19", "parent": {"cref": "#/pictures/1"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 491.65161000000006, "t": 438.29343, "r": 496.0441, "b": 429.50848, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "6", "text": "6"}, {"self_ref": "#/texts/20", "parent": {"cref": "#/pictures/1"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 535.13843, "t": 438.66031, "r": 539.53088, "b": 429.87537, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "7", "text": "7"}, {"self_ref": "#/texts/21", "parent": {"cref": "#/pictures/1"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 348.82822, "t": 404.90219, "r": 353.2207, "b": 396.11725, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "8", "text": "8"}, {"self_ref": "#/texts/22", "parent": {"cref": "#/pictures/1"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 389.27151, "t": 416.62772, "r": 393.664, "b": 407.84277, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "9", "text": "9"}, {"self_ref": "#/texts/23", "parent": {"cref": "#/pictures/1"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 442.67479999999995, "t": 416.35379, "r": 451.45889000000005, "b": 407.56885, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "10", "text": "10"}, {"self_ref": "#/texts/24", "parent": {"cref": "#/pictures/1"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 477.4382299999999, "t": 416.466, "r": 485.90167, "b": 407.68105999999995, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "11", "text": "11"}, {"self_ref": "#/texts/25", "parent": {"cref": "#/pictures/1"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 522.57263, "t": 416.35379, "r": 531.35669, "b": 407.56885, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "12", "text": "12"}, {"self_ref": "#/texts/26", "parent": {"cref": "#/pictures/1"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 400.22992, "t": 404.88571, "r": 409.01401, "b": 396.10077, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "13", "text": "13"}, {"self_ref": "#/texts/27", "parent": {"cref": "#/pictures/1"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 442.30792, "t": 405.01018999999997, "r": 451.0920100000001, "b": 396.22524999999996, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "14", "text": "14"}, {"self_ref": "#/texts/28", "parent": {"cref": "#/pictures/1"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 478.21941999999996, "t": 404.62531, "r": 487.00351000000006, "b": 395.84036, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "15", "text": "15"}, {"self_ref": "#/texts/29", "parent": {"cref": "#/pictures/1"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 523.2287, "t": 405.01018999999997, "r": 532.01276, "b": 396.22524999999996, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "16", "text": "16"}, {"self_ref": "#/texts/30", "parent": {"cref": "#/pictures/1"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 411.57233, "t": 392.57523, "r": 415.96481, "b": 383.79028, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "1", "text": "1"}, {"self_ref": "#/texts/31", "parent": {"cref": "#/pictures/1"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 415.96393, "t": 392.57523, "r": 420.35641, "b": 383.79028, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "7", "text": "7"}, {"self_ref": "#/texts/32", "parent": {"cref": "#/pictures/1"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 442.30521, "t": 392.9628000000001, "r": 451.08929, "b": 384.17786000000007, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "18", "text": "18"}, {"self_ref": "#/texts/33", "parent": {"cref": "#/pictures/1"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 478.77893, "t": 393.00360000000006, "r": 487.56302, "b": 384.21866000000006, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "19", "text": "19"}, {"self_ref": "#/texts/34", "parent": {"cref": "#/pictures/1"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 523.97241, "t": 393.3885200000001, "r": 532.75647, "b": 384.60358, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "20", "text": "20"}, {"self_ref": "#/texts/35", "parent": {"cref": "#/pictures/1"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 385.09399, "t": 434.23969000000005, "r": 391.09879, "b": 424.10928, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "3", "text": "3"}, {"self_ref": "#/texts/36", "parent": {"cref": "#/pictures/1"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 333.43451, "t": 411.2735, "r": 339.4393, "b": 401.14310000000006, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "2", "text": "2"}, {"self_ref": "#/texts/37", "parent": {"cref": "#/pictures/1"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 478.07210999999995, "t": 450.9631999999999, "r": 484.0769, "b": 440.83279000000005, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "1", "text": "1"}, {"self_ref": "#/texts/38", "parent": {"cref": "#/groups/1"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 1, "bbox": {"l": 315.56702, "t": 371.8172, "r": 491.1912500000001, "b": 363.06918, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 38]}], "orig": "c. Structure predicted by TableFormer:", "text": "c. Structure predicted by TableFormer:", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/39", "parent": {"cref": "#/pictures/2"}, "children": [], "content_layer": "body", "label": "caption", "prov": [{"page_no": 1, "bbox": {"l": 308.862, "t": 277.49963, "r": 545.11517, "b": 232.72709999999995, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 220]}], "orig": "Figure 1: Picture of a table with subtle, complex features such as (1) multi-column headers, (2) cell with multi-row text and (3) cells with no content. Image from PubTabNet evaluation set, filename: 'PMC2944238 004 02'.", "text": "Figure 1: Picture of a table with subtle, complex features such as (1) multi-column headers, (2) cell with multi-row text and (3) cells with no content. Image from PubTabNet evaluation set, filename: 'PMC2944238 004 02'."}, {"self_ref": "#/texts/40", "parent": {"cref": "#/pictures/2"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 347.24872, "t": 354.31412, "r": 351.6412, "b": 345.52917, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "1", "text": "1"}, {"self_ref": "#/texts/41", "parent": {"cref": "#/pictures/2"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 318.88071, "t": 354.31412, "r": 323.27319, "b": 345.52917, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "0", "text": "0"}, {"self_ref": "#/texts/42", "parent": {"cref": "#/pictures/2"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 394.10422, "t": 354.31412, "r": 398.4967, "b": 345.52917, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "2", "text": "2"}, {"self_ref": "#/texts/43", "parent": {"cref": "#/pictures/2"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 318.77316, "t": 342.4545, "r": 323.16565, "b": 333.66956, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "3", "text": "3"}, {"self_ref": "#/texts/44", "parent": {"cref": "#/pictures/2"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 347.24872, "t": 342.4545, "r": 351.6412, "b": 333.66956, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "4", "text": "4"}, {"self_ref": "#/texts/45", "parent": {"cref": "#/pictures/2"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 394.10422, "t": 342.4545, "r": 398.4967, "b": 333.66956, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "5", "text": "5"}, {"self_ref": "#/texts/46", "parent": {"cref": "#/pictures/2"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 440.95941000000005, "t": 342.4545, "r": 445.3519, "b": 333.66956, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "6", "text": "6"}, {"self_ref": "#/texts/47", "parent": {"cref": "#/pictures/2"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 487.81491, "t": 342.4545, "r": 492.2074, "b": 333.66956, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "7", "text": "7"}, {"self_ref": "#/texts/48", "parent": {"cref": "#/pictures/2"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 318.77316, "t": 318.29575, "r": 323.16565, "b": 309.5108, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "8", "text": "8"}, {"self_ref": "#/texts/49", "parent": {"cref": "#/pictures/2"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 347.24872, "t": 330.1554, "r": 351.6412, "b": 321.37045, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "9", "text": "9"}, {"self_ref": "#/texts/50", "parent": {"cref": "#/pictures/2"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 394.10422, "t": 330.1554, "r": 402.88831, "b": 321.37045, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "10", "text": "10"}, {"self_ref": "#/texts/51", "parent": {"cref": "#/pictures/2"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 440.95941000000005, "t": 330.1554, "r": 449.42285, "b": 321.37045, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "11", "text": "11"}, {"self_ref": "#/texts/52", "parent": {"cref": "#/pictures/2"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 487.81491, "t": 330.1554, "r": 496.599, "b": 321.37045, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "12", "text": "12"}, {"self_ref": "#/texts/53", "parent": {"cref": "#/pictures/2"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 347.24872, "t": 318.29575, "r": 356.03281, "b": 309.5108, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "13", "text": "13"}, {"self_ref": "#/texts/54", "parent": {"cref": "#/pictures/2"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 394.10422, "t": 318.29575, "r": 402.88831, "b": 309.5108, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "14", "text": "14"}, {"self_ref": "#/texts/55", "parent": {"cref": "#/pictures/2"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 440.95941000000005, "t": 318.29575, "r": 449.7435, "b": 309.5108, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "15", "text": "15"}, {"self_ref": "#/texts/56", "parent": {"cref": "#/pictures/2"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 487.81491, "t": 318.29575, "r": 496.599, "b": 309.5108, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "16", "text": "16"}, {"self_ref": "#/texts/57", "parent": {"cref": "#/pictures/2"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 347.24872, "t": 306.87531, "r": 356.03281, "b": 298.09036, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "17", "text": "17"}, {"self_ref": "#/texts/58", "parent": {"cref": "#/pictures/2"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 394.10422, "t": 306.87531, "r": 402.88831, "b": 298.09036, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "18", "text": "18"}, {"self_ref": "#/texts/59", "parent": {"cref": "#/pictures/2"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 440.95941000000005, "t": 306.87531, "r": 449.7435, "b": 298.09036, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "19", "text": "19"}, {"self_ref": "#/texts/60", "parent": {"cref": "#/pictures/2"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 487.81491, "t": 306.87531, "r": 496.599, "b": 298.09036, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "20", "text": "20"}, {"self_ref": "#/texts/61", "parent": {"cref": "#/pictures/2"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 366.70102, "t": 342.87918, "r": 372.70581, "b": 332.74878, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "3", "text": "3"}, {"self_ref": "#/texts/62", "parent": {"cref": "#/pictures/2"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 331.90424, "t": 318.67709, "r": 337.90903, "b": 308.54669, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "2", "text": "2"}, {"self_ref": "#/texts/63", "parent": {"cref": "#/pictures/2"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 459.87621999999993, "t": 354.4064, "r": 465.88101, "b": 344.276, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "1", "text": "1"}, {"self_ref": "#/texts/64", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 308.862, "t": 207.59064, "r": 545.11517, "b": 126.95307000000003, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 363]}], "orig": "Recently, significant progress has been made with vision based approaches to extract tables in documents. For the sake of completeness, the issue of table extraction from documents is typically decomposed into two separate challenges, i.e. (1) finding the location of the table(s) on a document-page and (2) finding the structure of a given table in the document.", "text": "Recently, significant progress has been made with vision based approaches to extract tables in documents. For the sake of completeness, the issue of table extraction from documents is typically decomposed into two separate challenges, i.e. (1) finding the location of the table(s) on a document-page and (2) finding the structure of a given table in the document."}, {"self_ref": "#/texts/65", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 308.862, "t": 123.61964, "r": 545.11511, "b": 78.84806800000001, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 229]}], "orig": "The first problem is called table-location and has been previously addressed [30, 38, 19, 21, 23, 26, 8] with stateof-the-art object-detection networks (e.g. YOLO and later on Mask-RCNN [9]). For all practical purposes, it can be", "text": "The first problem is called table-location and has been previously addressed [30, 38, 19, 21, 23, 26, 8] with stateof-the-art object-detection networks (e.g. YOLO and later on Mask-RCNN [9]). For all practical purposes, it can be"}, {"self_ref": "#/texts/66", "parent": {"cref": "#/body"}, "children": [], "content_layer": "furniture", "label": "page_footer", "prov": [{"page_no": 1, "bbox": {"l": 295.121, "t": 57.866633999999976, "r": 300.10229, "b": 48.96007199999997, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "1", "text": "1"}, {"self_ref": "#/texts/67", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 50.112, "t": 716.79163, "r": 286.36505, "b": 695.93005, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 75]}], "orig": "considered as a solved problem, given enough ground-truth data to train on.", "text": "considered as a solved problem, given enough ground-truth data to train on."}, {"self_ref": "#/texts/68", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 50.112, "t": 692.42859, "r": 286.36514, "b": 563.96991, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 626]}], "orig": "The second problem is called table-structure decomposition. The latter is a long standing problem in the community of document understanding [6, 4, 14]. Contrary to the table-location problem, there are no commonly used approaches that can easily be re-purposed to solve this problem. Lately, a set of new model-architectures has been proposed by the community to address table-structure decomposition [37, 36, 18, 20]. All these models have some weaknesses (see Sec. 2). The common denominator here is the reliance on textual features and/or the inability to provide the bounding box of each table-cell in the original image.", "text": "The second problem is called table-structure decomposition. The latter is a long standing problem in the community of document understanding [6, 4, 14]. Contrary to the table-location problem, there are no commonly used approaches that can easily be re-purposed to solve this problem. Lately, a set of new model-architectures has been proposed by the community to address table-structure decomposition [37, 36, 18, 20]. All these models have some weaknesses (see Sec. 2). The common denominator here is the reliance on textual features and/or the inability to provide the bounding box of each table-cell in the original image."}, {"self_ref": "#/texts/69", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 50.112, "t": 560.46844, "r": 286.36511, "b": 420.05493, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 643]}], "orig": "In this paper, we want to address these weaknesses and present a robust table-structure decomposition algorithm. The design criteria for our model are the following. First, we want our algorithm to be language agnostic. In this way, we can obtain the structure of any table, irregardless of the language. Second, we want our algorithm to leverage as much data as possible from the original PDF document. For programmatic PDF documents, the text-cells can often be extracted much faster and with higher accuracy compared to OCR methods. Last but not least, we want to have a direct link between the table-cell and its bounding box in the image.", "text": "In this paper, we want to address these weaknesses and present a robust table-structure decomposition algorithm. The design criteria for our model are the following. First, we want our algorithm to be language agnostic. In this way, we can obtain the structure of any table, irregardless of the language. Second, we want our algorithm to leverage as much data as possible from the original PDF document. For programmatic PDF documents, the text-cells can often be extracted much faster and with higher accuracy compared to OCR methods. Last but not least, we want to have a direct link between the table-cell and its bounding box in the image."}, {"self_ref": "#/texts/70", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 50.112, "t": 416.5535, "r": 286.36658, "b": 359.827, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 242]}], "orig": "To meet the design criteria listed above, we developed a new model called TableFormer and a synthetically generated table structure dataset called SynthTabNet $^{1}$. In particular, our contributions in this work can be summarised as follows:", "text": "To meet the design criteria listed above, we developed a new model called TableFormer and a synthetically generated table structure dataset called SynthTabNet $^{1}$. In particular, our contributions in this work can be summarised as follows:"}, {"self_ref": "#/texts/71", "parent": {"cref": "#/groups/2"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 2, "bbox": {"l": 61.569016, "t": 347.56812, "r": 286.3649, "b": 302.67703, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 166]}], "orig": "\u00b7 We propose TableFormer , a transformer based model that predicts tables structure and bounding boxes for the table content simultaneously in an end-to-end approach.", "text": "\u00b7 We propose TableFormer , a transformer based model that predicts tables structure and bounding boxes for the table content simultaneously in an end-to-end approach.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/72", "parent": {"cref": "#/groups/2"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 2, "bbox": {"l": 61.569016, "t": 289.96616, "r": 286.3649, "b": 245.07404999999994, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 181]}], "orig": "\u00b7 Across all benchmark datasets TableFormer significantly outperforms existing state-of-the-art metrics, while being much more efficient in training and inference to existing works.", "text": "\u00b7 Across all benchmark datasets TableFormer significantly outperforms existing state-of-the-art metrics, while being much more efficient in training and inference to existing works.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/73", "parent": {"cref": "#/groups/2"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 2, "bbox": {"l": 61.569, "t": 232.36316, "r": 286.36493, "b": 199.42705, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 106]}], "orig": "\u00b7 We present SynthTabNet a synthetically generated dataset, with various appearance styles and complexity.", "text": "\u00b7 We present SynthTabNet a synthetically generated dataset, with various appearance styles and complexity.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/74", "parent": {"cref": "#/groups/2"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 2, "bbox": {"l": 61.569008000000004, "t": 186.59659999999997, "r": 286.36508, "b": 153.77904999999998, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 131]}], "orig": "\u00b7 An augmented dataset based on PubTabNet [37], FinTabNet [36], and TableBank [17] with generated ground-truth for reproducibility.", "text": "\u00b7 An augmented dataset based on PubTabNet [37], FinTabNet [36], and TableBank [17] with generated ground-truth for reproducibility.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/75", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 50.112007, "t": 141.40161, "r": 286.36511, "b": 96.630043, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 231]}], "orig": "The paper is structured as follows. In Sec. 2, we give a brief overview of the current state-of-the-art. In Sec. 3, we describe the datasets on which we train. In Sec. 4, we introduce the TableFormer model-architecture and describe", "text": "The paper is structured as follows. In Sec. 2, we give a brief overview of the current state-of-the-art. In Sec. 3, we describe the datasets on which we train. In Sec. 4, we introduce the TableFormer model-architecture and describe"}, {"self_ref": "#/texts/76", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "footnote", "prov": [{"page_no": 2, "bbox": {"l": 60.97100100000001, "t": 86.40372500000001, "r": 183.73055, "b": 79.278458, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 40]}], "orig": "$^{1}$https://github.com/IBM/SynthTabNet", "text": "$^{1}$https://github.com/IBM/SynthTabNet"}, {"self_ref": "#/texts/77", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 308.862, "t": 716.79163, "r": 545.11511, "b": 683.9750400000001, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 166]}], "orig": "its results & performance in Sec. 5. As a conclusion, we describe how this new model-architecture can be re-purposed for other tasks in the computer-vision community.", "text": "its results & performance in Sec. 5. As a conclusion, we describe how this new model-architecture can be re-purposed for other tasks in the computer-vision community."}, {"self_ref": "#/texts/78", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "section_header", "prov": [{"page_no": 2, "bbox": {"l": 308.862, "t": 670.26807, "r": 498.28021, "b": 659.52032, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 37]}], "orig": "2. Previous work and State of the Art", "text": "2. Previous work and State of the Art", "level": 1}, {"self_ref": "#/texts/79", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 308.862, "t": 649.77863, "r": 545.11517, "b": 461.54498, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 901]}], "orig": "Identifying the structure of a table has been an outstanding problem in the document-parsing community, that motivates many organised public challenges [6, 4, 14]. The difficulty of the problem can be attributed to a number of factors. First, there is a large variety in the shapes and sizes of tables. Such large variety requires a flexible method. This is especially true for complex column- and row headers, which can be extremely intricate and demanding. A second factor of complexity is the lack of data with regard to table-structure. Until the publication of PubTabNet [37], there were no large datasets (i.e. > 100 K tables) that provided structure information. This happens primarily due to the fact that tables are notoriously time-consuming to annotate by hand. However, this has definitely changed in recent years with the deliverance of PubTabNet [37], FinTabNet [36], TableBank [17] etc.", "text": "Identifying the structure of a table has been an outstanding problem in the document-parsing community, that motivates many organised public challenges [6, 4, 14]. The difficulty of the problem can be attributed to a number of factors. First, there is a large variety in the shapes and sizes of tables. Such large variety requires a flexible method. This is especially true for complex column- and row headers, which can be extremely intricate and demanding. A second factor of complexity is the lack of data with regard to table-structure. Until the publication of PubTabNet [37], there were no large datasets (i.e. > 100 K tables) that provided structure information. This happens primarily due to the fact that tables are notoriously time-consuming to annotate by hand. However, this has definitely changed in recent years with the deliverance of PubTabNet [37], FinTabNet [36], TableBank [17] etc."}, {"self_ref": "#/texts/80", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 308.862, "t": 458.43054, "r": 545.11523, "b": 341.9270900000001, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 552]}], "orig": "Before the rising popularity of deep neural networks, the community relied heavily on heuristic and/or statistical methods to do table structure identification [3, 7, 11, 5, 13, 28]. Although such methods work well on constrained tables [12], a more data-driven approach can be applied due to the advent of convolutional neural networks (CNNs) and the availability of large datasets. To the best-of-our knowledge, there are currently two different types of network architecture that are being pursued for state-of-the-art tablestructure identification.", "text": "Before the rising popularity of deep neural networks, the community relied heavily on heuristic and/or statistical methods to do table structure identification [3, 7, 11, 5, 13, 28]. Although such methods work well on constrained tables [12], a more data-driven approach can be applied due to the advent of convolutional neural networks (CNNs) and the availability of large datasets. To the best-of-our knowledge, there are currently two different types of network architecture that are being pursued for state-of-the-art tablestructure identification."}, {"self_ref": "#/texts/81", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 308.86197, "t": 338.93222, "r": 545.11688, "b": 78.84815200000003, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1262]}], "orig": "Image-to-Text networks : In this type of network, one predicts a sequence of tokens starting from an encoded image. Such sequences of tokens can be HTML table tags [37, 17] or LaTeX symbols[10]. The choice of symbols is ultimately not very important, since one can be transformed into the other. There are however subtle variations in the Image-to-Text networks. The easiest network architectures are \"image-encoder \u2192 text-decoder\" (IETD), similar to network architectures that try to provide captions to images [32]. In these IETD networks, one expects as output the LaTeX/HTML string of the entire table, i.e. the symbols necessary for creating the table with the content of the table. Another approach is the \"image-encoder \u2192 dual decoder\" (IEDD) networks. In these type of networks, one has two consecutive decoders with different purposes. The first decoder is the tag-decoder , i.e. it only produces the HTML/LaTeX tags which construct an empty table. The second content-decoder uses the encoding of the image in combination with the output encoding of each cell-tag (from the tag-decoder ) to generate the textual content of each table cell. The network architecture of IEDD is certainly more elaborate, but it has the advantage that one can pre-train the", "text": "Image-to-Text networks : In this type of network, one predicts a sequence of tokens starting from an encoded image. Such sequences of tokens can be HTML table tags [37, 17] or LaTeX symbols[10]. The choice of symbols is ultimately not very important, since one can be transformed into the other. There are however subtle variations in the Image-to-Text networks. The easiest network architectures are \"image-encoder \u2192 text-decoder\" (IETD), similar to network architectures that try to provide captions to images [32]. In these IETD networks, one expects as output the LaTeX/HTML string of the entire table, i.e. the symbols necessary for creating the table with the content of the table. Another approach is the \"image-encoder \u2192 dual decoder\" (IEDD) networks. In these type of networks, one has two consecutive decoders with different purposes. The first decoder is the tag-decoder , i.e. it only produces the HTML/LaTeX tags which construct an empty table. The second content-decoder uses the encoding of the image in combination with the output encoding of each cell-tag (from the tag-decoder ) to generate the textual content of each table cell. The network architecture of IEDD is certainly more elaborate, but it has the advantage that one can pre-train the"}, {"self_ref": "#/texts/82", "parent": {"cref": "#/body"}, "children": [], "content_layer": "furniture", "label": "page_footer", "prov": [{"page_no": 2, "bbox": {"l": 295.121, "t": 57.86671799999999, "r": 300.10229, "b": 48.960154999999986, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "2", "text": "2"}, {"self_ref": "#/texts/83", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 50.112, "t": 716.79163, "r": 250.15102, "b": 707.88507, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 51]}], "orig": "tag-decoder which is constrained to the table-tags.", "text": "tag-decoder which is constrained to the table-tags."}, {"self_ref": "#/texts/84", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 50.112, "t": 704.7806400000001, "r": 286.36514, "b": 516.5459, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 864]}], "orig": "In practice, both network architectures (IETD and IEDD) require an implicit, custom trained object-characterrecognition (OCR) to obtain the content of the table-cells. In the case of IETD, this OCR engine is implicit in the decoder similar to [24]. For the IEDD, the OCR is solely embedded in the content-decoder. This reliance on a custom, implicit OCR decoder is of course problematic. OCR is a well known and extremely tough problem, that often needs custom training for each individual language. However, the limited availability for non-english content in the current datasets, makes it impractical to apply the IETD and IEDD methods on tables with other languages. Additionally, OCR can be completely omitted if the tables originate from programmatic PDF documents with known positions of each cell. The latter was the inspiration for the work of this paper.", "text": "In practice, both network architectures (IETD and IEDD) require an implicit, custom trained object-characterrecognition (OCR) to obtain the content of the table-cells. In the case of IETD, this OCR engine is implicit in the decoder similar to [24]. For the IEDD, the OCR is solely embedded in the content-decoder. This reliance on a custom, implicit OCR decoder is of course problematic. OCR is a well known and extremely tough problem, that often needs custom training for each individual language. However, the limited availability for non-english content in the current datasets, makes it impractical to apply the IETD and IEDD methods on tables with other languages. Additionally, OCR can be completely omitted if the tables originate from programmatic PDF documents with known positions of each cell. The latter was the inspiration for the work of this paper."}, {"self_ref": "#/texts/85", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 50.111992, "t": 513.56104, "r": 286.36511, "b": 301.29712, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1007]}], "orig": "Graph Neural networks : Graph Neural networks (GNN's) take a radically different approach to tablestructure extraction. Note that one table cell can constitute out of multiple text-cells. To obtain the table-structure, one creates an initial graph, where each of the text-cells becomes a node in the graph similar to [33, 34, 2]. Each node is then associated with en embedding vector coming from the encoded image, its coordinates and the encoded text. Furthermore, nodes that represent adjacent text-cells are linked. Graph Convolutional Networks (GCN's) based methods take the image as an input, but also the position of the text-cells and their content [18]. The purpose of a GCN is to transform the input graph into a new graph, which replaces the old links with new ones. The new links then represent the table-structure. With this approach, one can avoid the need to build custom OCR decoders. However, the quality of the reconstructed structure is not comparable to the current state-of-the-art [18].", "text": "Graph Neural networks : Graph Neural networks (GNN's) take a radically different approach to tablestructure extraction. Note that one table cell can constitute out of multiple text-cells. To obtain the table-structure, one creates an initial graph, where each of the text-cells becomes a node in the graph similar to [33, 34, 2]. Each node is then associated with en embedding vector coming from the encoded image, its coordinates and the encoded text. Furthermore, nodes that represent adjacent text-cells are linked. Graph Convolutional Networks (GCN's) based methods take the image as an input, but also the position of the text-cells and their content [18]. The purpose of a GCN is to transform the input graph into a new graph, which replaces the old links with new ones. The new links then represent the table-structure. With this approach, one can avoid the need to build custom OCR decoders. However, the quality of the reconstructed structure is not comparable to the current state-of-the-art [18]."}, {"self_ref": "#/texts/86", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 50.111984, "t": 298.31125, "r": 286.36627, "b": 169.73315000000002, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 619]}], "orig": "Hybrid Deep Learning-Rule-Based approach : A popular current model for table-structure identification is the use of a hybrid Deep Learning-Rule-Based approach similar to [27, 29]. In this approach, one first detects the position of the table-cells with object detection (e.g. YoloVx or MaskRCNN), then classifies the table into different types (from its images) and finally uses different rule-sets to obtain its table-structure. Currently, this approach achieves stateof-the-art results, but is not an end-to-end deep-learning method. As such, new rules need to be written if different types of tables are encountered.", "text": "Hybrid Deep Learning-Rule-Based approach : A popular current model for table-structure identification is the use of a hybrid Deep Learning-Rule-Based approach similar to [27, 29]. In this approach, one first detects the position of the table-cells with object detection (e.g. YoloVx or MaskRCNN), then classifies the table into different types (from its images) and finally uses different rule-sets to obtain its table-structure. Currently, this approach achieves stateof-the-art results, but is not an end-to-end deep-learning method. As such, new rules need to be written if different types of tables are encountered."}, {"self_ref": "#/texts/87", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "section_header", "prov": [{"page_no": 3, "bbox": {"l": 50.111984, "t": 156.05516, "r": 105.22546, "b": 145.30743000000007, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 11]}], "orig": "3. Datasets", "text": "3. Datasets", "level": 1}, {"self_ref": "#/texts/88", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 50.111984, "t": 135.57470999999998, "r": 286.36508, "b": 78.84813699999995, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 281]}], "orig": "We rely on large-scale datasets such as PubTabNet [37], FinTabNet [36], and TableBank [17] datasets to train and evaluate our models. These datasets span over various appearance styles and content. We also introduce our own synthetically generated SynthTabNet dataset to fix an im-", "text": "We rely on large-scale datasets such as PubTabNet [37], FinTabNet [36], and TableBank [17] datasets to train and evaluate our models. These datasets span over various appearance styles and content. We also introduce our own synthetically generated SynthTabNet dataset to fix an im-"}, {"self_ref": "#/texts/89", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "caption", "prov": [{"page_no": 3, "bbox": {"l": 308.862, "t": 524.16364, "r": 545.11511, "b": 503.3020900000001, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 104]}], "orig": "Figure 2: Distribution of the tables across different table dimensions in PubTabNet + FinTabNet datasets", "text": "Figure 2: Distribution of the tables across different table dimensions in PubTabNet + FinTabNet datasets"}, {"self_ref": "#/texts/90", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "section_header", "prov": [{"page_no": 3, "bbox": {"l": 380.79849, "t": 712.1882300000001, "r": 486.84909, "b": 703.44025, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 21]}], "orig": "PubTabNet + FinTabNet", "text": "PubTabNet + FinTabNet", "level": 1}, {"self_ref": "#/texts/91", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 396.76776, "t": 549.97302, "r": 469.78748, "b": 541.22504, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 14]}], "orig": "Rows / Columns", "text": "Rows / Columns"}, {"self_ref": "#/texts/92", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 320.97653, "t": 558.57703, "r": 324.79254, "b": 552.745, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "0", "text": "0"}, {"self_ref": "#/texts/93", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 410.483, "t": 558.57703, "r": 418.11319, "b": 552.745, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "20", "text": "20"}, {"self_ref": "#/texts/94", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 500.84949, "t": 558.57703, "r": 508.47968000000003, "b": 552.745, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "40", "text": "40"}, {"self_ref": "#/texts/95", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 365.29999, "t": 558.57703, "r": 372.93018, "b": 552.745, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "10", "text": "10"}, {"self_ref": "#/texts/96", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 455.66626, "t": 558.57703, "r": 463.29645, "b": 552.745, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "30", "text": "30"}, {"self_ref": "#/texts/97", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 542.03528, "t": 558.57703, "r": 549.66547, "b": 552.745, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "50", "text": "50"}, {"self_ref": "#/texts/98", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 316.04474, "t": 561.55383, "r": 319.86075, "b": 555.7218, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "0", "text": "0"}, {"self_ref": "#/texts/99", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 312.62521, "t": 593.30927, "r": 316.44122, "b": 587.47723, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "2", "text": "2"}, {"self_ref": "#/texts/100", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 316.43942, "t": 593.30927, "r": 320.2554, "b": 587.47723, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "0", "text": "0"}, {"self_ref": "#/texts/101", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 313.14951, "t": 623.90204, "r": 316.96552, "b": 618.07001, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "4", "text": "4"}, {"self_ref": "#/texts/102", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 316.96371, "t": 623.90204, "r": 320.77969, "b": 618.07001, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "0", "text": "0"}, {"self_ref": "#/texts/103", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 312.92972, "t": 655.41229, "r": 316.74573, "b": 649.58026, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "6", "text": "6"}, {"self_ref": "#/texts/104", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 316.74393, "t": 655.41229, "r": 320.55991, "b": 649.58026, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "0", "text": "0"}, {"self_ref": "#/texts/105", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 312.48227, "t": 686.39825, "r": 316.29828, "b": 680.56622, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "8", "text": "8"}, {"self_ref": "#/texts/106", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 316.29648, "t": 686.39825, "r": 320.11246, "b": 680.56622, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "0", "text": "0"}, {"self_ref": "#/texts/107", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 312.48227, "t": 579.74078, "r": 316.29828, "b": 573.90875, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "1", "text": "1"}, {"self_ref": "#/texts/108", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 316.29648, "t": 579.74078, "r": 320.11246, "b": 573.90875, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "0", "text": "0"}, {"self_ref": "#/texts/109", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 313.07639, "t": 608.27802, "r": 316.8924, "b": 602.44598, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "3", "text": "3"}, {"self_ref": "#/texts/110", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 316.89059, "t": 608.27802, "r": 320.70657, "b": 602.44598, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "0", "text": "0"}, {"self_ref": "#/texts/111", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 312.76321, "t": 639.526, "r": 316.57922, "b": 633.69397, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "5", "text": "5"}, {"self_ref": "#/texts/112", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 316.57742, "t": 639.526, "r": 320.3934, "b": 633.69397, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "0", "text": "0"}, {"self_ref": "#/texts/113", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 312.19775, "t": 671.4295, "r": 316.01376, "b": 665.59747, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "7", "text": "7"}, {"self_ref": "#/texts/114", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 316.01196, "t": 671.4295, "r": 319.82794, "b": 665.59747, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "0", "text": "0"}, {"self_ref": "#/texts/115", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 312.8165, "t": 701.8913, "r": 316.63251, "b": 696.05927, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "9", "text": "9"}, {"self_ref": "#/texts/116", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 316.63071, "t": 701.8913, "r": 320.44669, "b": 696.05927, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "0", "text": "0"}, {"self_ref": "#/texts/117", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 532.17426, "t": 569.27271, "r": 536.94427, "b": 561.98273, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "0", "text": "0"}, {"self_ref": "#/texts/118", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 532.87952, "t": 683.7329700000001, "r": 547.61249, "b": 676.44299, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 3]}], "orig": "10K", "text": "10K"}, {"self_ref": "#/texts/119", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 532.7735, "t": 661.21899, "r": 542.73877, "b": 653.92902, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "8K", "text": "8K"}, {"self_ref": "#/texts/120", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 532.79901, "t": 638.07648, "r": 542.76428, "b": 630.7865, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "6K", "text": "6K"}, {"self_ref": "#/texts/121", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 532.5705, "t": 615.242, "r": 542.53577, "b": 607.95203, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "4K", "text": "4K"}, {"self_ref": "#/texts/122", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 532.14551, "t": 592.3537, "r": 542.11078, "b": 585.06372, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "2K", "text": "2K"}, {"self_ref": "#/texts/123", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 308.862, "t": 474.52664, "r": 437.27002, "b": 465.62009, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 33]}], "orig": "balance in the previous datasets.", "text": "balance in the previous datasets."}, {"self_ref": "#/texts/124", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 308.862, "t": 460.46863, "r": 545.11517, "b": 164.63825999999995, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1400]}], "orig": "The PubTabNet dataset contains 509k tables delivered as annotated PNG images. The annotations consist of the table structure represented in HTML format, the tokenized text and its bounding boxes per table cell. Fig. 1 shows the appearance style of PubTabNet. Depending on its complexity, a table is characterized as \"simple\" when it does not contain row spans or column spans, otherwise it is \"complex\". The dataset is divided into Train and Val splits (roughly 98% and 2%). The Train split consists of 54% simple and 46% complex tables and the Val split of 51% and 49% respectively. The FinTabNet dataset contains 112k tables delivered as single-page PDF documents with mixed table structures and text content. Similarly to the PubTabNet, the annotations of FinTabNet include the table structure in HTML, the tokenized text and the bounding boxes on a table cell basis. The dataset is divided into Train, Test and Val splits (81%, 9.5%, 9.5%), and each one is almost equally divided into simple and complex tables (Train: 48% simple, 52% complex, Test: 48% simple, 52% complex, Test: 53% simple, 47% complex). Finally the TableBank dataset consists of 145k tables provided as JPEG images. The latter has annotations for the table structure, but only few with bounding boxes of the table cells. The entire dataset consists of simple tables and it is divided into 90% Train, 3% Test and 7% Val splits.", "text": "The PubTabNet dataset contains 509k tables delivered as annotated PNG images. The annotations consist of the table structure represented in HTML format, the tokenized text and its bounding boxes per table cell. Fig. 1 shows the appearance style of PubTabNet. Depending on its complexity, a table is characterized as \"simple\" when it does not contain row spans or column spans, otherwise it is \"complex\". The dataset is divided into Train and Val splits (roughly 98% and 2%). The Train split consists of 54% simple and 46% complex tables and the Val split of 51% and 49% respectively. The FinTabNet dataset contains 112k tables delivered as single-page PDF documents with mixed table structures and text content. Similarly to the PubTabNet, the annotations of FinTabNet include the table structure in HTML, the tokenized text and the bounding boxes on a table cell basis. The dataset is divided into Train, Test and Val splits (81%, 9.5%, 9.5%), and each one is almost equally divided into simple and complex tables (Train: 48% simple, 52% complex, Test: 48% simple, 52% complex, Test: 53% simple, 47% complex). Finally the TableBank dataset consists of 145k tables provided as JPEG images. The latter has annotations for the table structure, but only few with bounding boxes of the table cells. The entire dataset consists of simple tables and it is divided into 90% Train, 3% Test and 7% Val splits."}, {"self_ref": "#/texts/125", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 308.862, "t": 159.48581000000001, "r": 545.11511, "b": 78.84823600000004, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 406]}], "orig": "Due to the heterogeneity across the dataset formats, it was necessary to combine all available data into one homogenized dataset before we could train our models for practical purposes. Given the size of PubTabNet, we adopted its annotation format and we extracted and converted all tables as PNG images with a resolution of 72 dpi. Additionally, we have filtered out tables with extreme sizes due to small", "text": "Due to the heterogeneity across the dataset formats, it was necessary to combine all available data into one homogenized dataset before we could train our models for practical purposes. Given the size of PubTabNet, we adopted its annotation format and we extracted and converted all tables as PNG images with a resolution of 72 dpi. Additionally, we have filtered out tables with extreme sizes due to small"}, {"self_ref": "#/texts/126", "parent": {"cref": "#/body"}, "children": [], "content_layer": "furniture", "label": "page_footer", "prov": [{"page_no": 3, "bbox": {"l": 295.121, "t": 57.86680200000001, "r": 300.10229, "b": 48.960239, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "3", "text": "3"}, {"self_ref": "#/texts/127", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 4, "bbox": {"l": 50.112, "t": 716.79163, "r": 286.36511, "b": 695.93005, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 93]}], "orig": "amount of such tables, and kept only those ones ranging between 1*1 and 20*10 (rows/columns).", "text": "amount of such tables, and kept only those ones ranging between 1*1 and 20*10 (rows/columns)."}, {"self_ref": "#/texts/128", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 4, "bbox": {"l": 50.112, "t": 691.03961, "r": 286.36514, "b": 478.89493, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 983]}], "orig": "The availability of the bounding boxes for all table cells is essential to train our models. In order to distinguish between empty and non-empty bounding boxes, we have introduced a binary class in the annotation. Unfortunately, the original datasets either omit the bounding boxes for whole tables (e.g. TableBank) or they narrow their scope only to non-empty cells. Therefore, it was imperative to introduce a data pre-processing procedure that generates the missing bounding boxes out of the annotation information. This procedure first parses the provided table structure and calculates the dimensions of the most fine-grained grid that covers the table structure. Notice that each table cell may occupy multiple grid squares due to row or column spans. In case of PubTabNet we had to compute missing bounding boxes for 48% of the simple and 69% of the complex tables. Regarding FinTabNet, 68% of the simple and 98% of the complex tables require the generation of bounding boxes.", "text": "The availability of the bounding boxes for all table cells is essential to train our models. In order to distinguish between empty and non-empty bounding boxes, we have introduced a binary class in the annotation. Unfortunately, the original datasets either omit the bounding boxes for whole tables (e.g. TableBank) or they narrow their scope only to non-empty cells. Therefore, it was imperative to introduce a data pre-processing procedure that generates the missing bounding boxes out of the annotation information. This procedure first parses the provided table structure and calculates the dimensions of the most fine-grained grid that covers the table structure. Notice that each table cell may occupy multiple grid squares due to row or column spans. In case of PubTabNet we had to compute missing bounding boxes for 48% of the simple and 69% of the complex tables. Regarding FinTabNet, 68% of the simple and 98% of the complex tables require the generation of bounding boxes."}, {"self_ref": "#/texts/129", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 4, "bbox": {"l": 50.112, "t": 474.00449000000003, "r": 286.36511, "b": 357.50104, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 571]}], "orig": "As it is illustrated in Fig. 2, the table distributions from all datasets are skewed towards simpler structures with fewer number of rows/columns. Additionally, there is very limited variance in the table styles, which in case of PubTabNet and FinTabNet means one styling format for the majority of the tables. Similar limitations appear also in the type of table content, which in some cases (e.g. FinTabNet) is restricted to a certain domain. Ultimately, the lack of diversity in the training dataset damages the ability of the models to generalize well on unseen data.", "text": "As it is illustrated in Fig. 2, the table distributions from all datasets are skewed towards simpler structures with fewer number of rows/columns. Additionally, there is very limited variance in the table styles, which in case of PubTabNet and FinTabNet means one styling format for the majority of the tables. Similar limitations appear also in the type of table content, which in some cases (e.g. FinTabNet) is restricted to a certain domain. Ultimately, the lack of diversity in the training dataset damages the ability of the models to generalize well on unseen data."}, {"self_ref": "#/texts/130", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 4, "bbox": {"l": 50.112, "t": 352.6106, "r": 286.36655, "b": 164.37611000000004, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 941]}], "orig": "Motivated by those observations we aimed at generating a synthetic table dataset named SynthTabNet . This approach offers control over: 1) the size of the dataset, 2) the table structure, 3) the table style and 4) the type of content. The complexity of the table structure is described by the size of the table header and the table body, as well as the percentage of the table cells covered by row spans and column spans. A set of carefully designed styling templates provides the basis to build a wide range of table appearances. Lastly, the table content is generated out of a curated collection of text corpora. By controlling the size and scope of the synthetic datasets we are able to train and evaluate our models in a variety of different conditions. For example, we can first generate a highly diverse dataset to train our models and then evaluate their performance on other synthetic datasets which are focused on a specific domain.", "text": "Motivated by those observations we aimed at generating a synthetic table dataset named SynthTabNet . This approach offers control over: 1) the size of the dataset, 2) the table structure, 3) the table style and 4) the type of content. The complexity of the table structure is described by the size of the table header and the table body, as well as the percentage of the table cells covered by row spans and column spans. A set of carefully designed styling templates provides the basis to build a wide range of table appearances. Lastly, the table content is generated out of a curated collection of text corpora. By controlling the size and scope of the synthetic datasets we are able to train and evaluate our models in a variety of different conditions. For example, we can first generate a highly diverse dataset to train our models and then evaluate their performance on other synthetic datasets which are focused on a specific domain."}, {"self_ref": "#/texts/131", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 4, "bbox": {"l": 50.112015, "t": 159.48567000000003, "r": 286.36511, "b": 78.84810600000003, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 405]}], "orig": "In this regard, we have prepared four synthetic datasets, each one containing 150k examples. The corpora to generate the table text consists of the most frequent terms appearing in PubTabNet and FinTabNet together with randomly generated text. The first two synthetic datasets have been fine-tuned to mimic the appearance of the original datasets but encompass more complicated table structures. The third", "text": "In this regard, we have prepared four synthetic datasets, each one containing 150k examples. The corpora to generate the table text consists of the most frequent terms appearing in PubTabNet and FinTabNet together with randomly generated text. The first two synthetic datasets have been fine-tuned to mimic the appearance of the original datasets but encompass more complicated table structures. The third"}, {"self_ref": "#/texts/132", "parent": {"cref": "#/tables/2"}, "children": [], "content_layer": "body", "label": "caption", "prov": [{"page_no": 4, "bbox": {"l": 308.862, "t": 624.33862, "r": 545.11505, "b": 567.61102, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 267]}], "orig": "Table 1: Both \"Combined-Tabnet\" and \"CombinedTabnet\" are variations of the following: (*) The CombinedTabnet dataset is the processed combination of PubTabNet and Fintabnet. (**) The combined dataset is the processed combination of PubTabNet, Fintabnet and TableBank.", "text": "Table 1: Both \"Combined-Tabnet\" and \"CombinedTabnet\" are variations of the following: (*) The CombinedTabnet dataset is the processed combination of PubTabNet and Fintabnet. (**) The combined dataset is the processed combination of PubTabNet, Fintabnet and TableBank."}, {"self_ref": "#/texts/133", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 4, "bbox": {"l": 308.862, "t": 542.37958, "r": 545.11517, "b": 497.60803, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 210]}], "orig": "one adopts a colorful appearance with high contrast and the last one contains tables with sparse content. Lastly, we have combined all synthetic datasets into one big unified synthetic dataset of 600k examples.", "text": "one adopts a colorful appearance with high contrast and the last one contains tables with sparse content. Lastly, we have combined all synthetic datasets into one big unified synthetic dataset of 600k examples."}, {"self_ref": "#/texts/134", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 4, "bbox": {"l": 320.81699, "t": 494.22759999999994, "r": 542.74396, "b": 485.32104, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 57]}], "orig": "Tab. 1 summarizes the various attributes of the datasets.", "text": "Tab. 1 summarizes the various attributes of the datasets."}, {"self_ref": "#/texts/135", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "section_header", "prov": [{"page_no": 4, "bbox": {"l": 308.862, "t": 470.81604, "r": 444.93607000000003, "b": 460.06832999999995, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 24]}], "orig": "4. The TableFormer model", "text": "4. The TableFormer model", "level": 1}, {"self_ref": "#/texts/136", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 4, "bbox": {"l": 308.862, "t": 450.06061, "r": 545.11523, "b": 345.51314999999994, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 504]}], "orig": "Given the image of a table, TableFormer is able to predict: 1) a sequence of tokens that represent the structure of a table, and 2) a bounding box coupled to a subset of those tokens. The conversion of an image into a sequence of tokens is a well-known task [35, 16]. While attention is often used as an implicit method to associate each token of the sequence with a position in the original image, an explicit association between the individual table-cells and the image bounding boxes is also required.", "text": "Given the image of a table, TableFormer is able to predict: 1) a sequence of tokens that represent the structure of a table, and 2) a bounding box coupled to a subset of those tokens. The conversion of an image into a sequence of tokens is a well-known task [35, 16]. While attention is often used as an implicit method to associate each token of the sequence with a position in the original image, an explicit association between the individual table-cells and the image bounding boxes is also required."}, {"self_ref": "#/texts/137", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "section_header", "prov": [{"page_no": 4, "bbox": {"l": 308.862, "t": 334.30573, "r": 420.16058, "b": 324.45367, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 24]}], "orig": "4.1. Model architecture.", "text": "4.1. Model architecture.", "level": 1}, {"self_ref": "#/texts/138", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 4, "bbox": {"l": 308.86197, "t": 315.23471, "r": 545.11572, "b": 127.00018999999998, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 907]}], "orig": "We now describe in detail the proposed method, which is composed of three main components, see Fig. 4. Our CNN Backbone Network encodes the input as a feature vector of predefined length. The input feature vector of the encoded image is passed to the Structure Decoder to produce a sequence of HTML tags that represent the structure of the table. With each prediction of an HTML standard data cell (' < td > ') the hidden state of that cell is passed to the Cell BBox Decoder. As for spanning cells, such as row or column span, the tag is broken down to ' < ', 'rowspan=' or 'colspan=', with the number of spanning cells (attribute), and ' > '. The hidden state attached to ' < ' is passed to the Cell BBox Decoder. A shared feed forward network (FFN) receives the hidden states from the Structure Decoder, to provide the final detection predictions of the bounding box coordinates and their classification.", "text": "We now describe in detail the proposed method, which is composed of three main components, see Fig. 4. Our CNN Backbone Network encodes the input as a feature vector of predefined length. The input feature vector of the encoded image is passed to the Structure Decoder to produce a sequence of HTML tags that represent the structure of the table. With each prediction of an HTML standard data cell (' < td > ') the hidden state of that cell is passed to the Cell BBox Decoder. As for spanning cells, such as row or column span, the tag is broken down to ' < ', 'rowspan=' or 'colspan=', with the number of spanning cells (attribute), and ' > '. The hidden state attached to ' < ' is passed to the Cell BBox Decoder. A shared feed forward network (FFN) receives the hidden states from the Structure Decoder, to provide the final detection predictions of the bounding box coordinates and their classification."}, {"self_ref": "#/texts/139", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 4, "bbox": {"l": 308.86197, "t": 123.73929999999996, "r": 545.11511, "b": 78.84818300000006, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 223]}], "orig": "CNN Backbone Network. A ResNet-18 CNN is the backbone that receives the table image and encodes it as a vector of predefined length. The network has been modified by removing the linear and pooling layer, as we are not per-", "text": "CNN Backbone Network. A ResNet-18 CNN is the backbone that receives the table image and encodes it as a vector of predefined length. The network has been modified by removing the linear and pooling layer, as we are not per-"}, {"self_ref": "#/texts/140", "parent": {"cref": "#/body"}, "children": [], "content_layer": "furniture", "label": "page_footer", "prov": [{"page_no": 4, "bbox": {"l": 295.12097, "t": 57.86674900000003, "r": 300.10226, "b": 48.96018600000002, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "4", "text": "4"}, {"self_ref": "#/texts/141", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "caption", "prov": [{"page_no": 5, "bbox": {"l": 50.111992, "t": 588.01422, "r": 545.10846, "b": 567.03308, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 212]}], "orig": "Figure 3: TableFormer takes in an image of the PDF and creates bounding box and HTML structure predictions that are synchronized. The bounding boxes grabs the content from the PDF and inserts it in the structure.", "text": "Figure 3: TableFormer takes in an image of the PDF and creates bounding box and HTML structure predictions that are synchronized. The bounding boxes grabs the content from the PDF and inserts it in the structure."}, {"self_ref": "#/texts/142", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 81.688072, "t": 669.5603, "r": 84.927567, "b": 666.37109, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "1.", "text": "1."}, {"self_ref": "#/texts/143", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 86.54731, "t": 669.5603, "r": 93.026291, "b": 666.37109, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "Item", "text": "Item"}, {"self_ref": "#/texts/144", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 102.50498, "t": 676.74786, "r": 115.3461, "b": 673.55865, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 6]}], "orig": "Amount", "text": "Amount"}, {"self_ref": "#/texts/145", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 82.140205, "t": 676.7851, "r": 93.291527, "b": 673.59589, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 5]}], "orig": "Names", "text": "Names"}, {"self_ref": "#/texts/146", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 96.748268, "t": 669.5603, "r": 104.3119, "b": 666.37109, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "1000", "text": "1000"}, {"self_ref": "#/texts/147", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 96.748268, "t": 664.2562900000001, "r": 102.42083, "b": 661.06708, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 3]}], "orig": "500", "text": "500"}, {"self_ref": "#/texts/148", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 96.748268, "t": 658.54431, "r": 104.3119, "b": 655.3551, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "3500", "text": "3500"}, {"self_ref": "#/texts/149", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 96.748268, "t": 652.83228, "r": 102.42083, "b": 649.64307, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 3]}], "orig": "150", "text": "150"}, {"self_ref": "#/texts/150", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 110.66107, "t": 669.5603, "r": 116.14391, "b": 666.37109, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "unit", "text": "unit"}, {"self_ref": "#/texts/151", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 110.66107, "t": 664.2562900000001, "r": 116.14391, "b": 661.06708, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "unit", "text": "unit"}, {"self_ref": "#/texts/152", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 110.66107, "t": 658.54431, "r": 116.14391, "b": 655.3551, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "unit", "text": "unit"}, {"self_ref": "#/texts/153", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 110.66107, "t": 652.83228, "r": 116.14391, "b": 649.64307, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "unit", "text": "unit"}, {"self_ref": "#/texts/154", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 81.688072, "t": 664.2562900000001, "r": 84.927567, "b": 661.06708, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "2.", "text": "2."}, {"self_ref": "#/texts/155", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 86.54731, "t": 664.2562900000001, "r": 93.026291, "b": 661.06708, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "Item", "text": "Item"}, {"self_ref": "#/texts/156", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 81.688072, "t": 658.54431, "r": 84.927567, "b": 655.3551, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "3.", "text": "3."}, {"self_ref": "#/texts/157", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 86.54731, "t": 658.54431, "r": 93.026291, "b": 655.3551, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "Item", "text": "Item"}, {"self_ref": "#/texts/158", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 81.688072, "t": 652.83228, "r": 84.927567, "b": 649.64307, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "4.", "text": "4."}, {"self_ref": "#/texts/159", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 86.54731, "t": 652.83228, "r": 93.026291, "b": 649.64307, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "Item", "text": "Item"}, {"self_ref": "#/texts/160", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 88.084389, "t": 701.50262, "r": 113.93649, "b": 695.76202, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 9]}], "orig": "Extracted", "text": "Extracted"}, {"self_ref": "#/texts/161", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 82.81002, "t": 694.36261, "r": 119.21240000000002, "b": 688.62201, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 12]}], "orig": "Table Images", "text": "Table Images"}, {"self_ref": "#/texts/162", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 143.94247, "t": 691.39764, "r": 180.01131, "b": 685.65704, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 12]}], "orig": "Standardized", "text": "Standardized"}, {"self_ref": "#/texts/163", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 151.94064, "t": 684.25763, "r": 172.0118, "b": 678.5170299999999, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 6]}], "orig": "Images", "text": "Images"}, {"self_ref": "#/texts/164", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 251.76939000000002, "t": 711.0690300000001, "r": 266.39557, "b": 705.32843, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "BBox", "text": "BBox"}, {"self_ref": "#/texts/165", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 247.51601, "t": 705.96899, "r": 270.65021, "b": 700.22839, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 7]}], "orig": "Decoder", "text": "Decoder"}, {"self_ref": "#/texts/166", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 331.03699, "t": 713.44019, "r": 352.12589, "b": 707.69958, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 6]}], "orig": "BBoxes", "text": "BBoxes"}, {"self_ref": "#/texts/167", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 390.56421, "t": 695.96777, "r": 431.7261, "b": 690.2271700000001, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 13]}], "orig": "BBoxes can be", "text": "BBoxes can be"}, {"self_ref": "#/texts/168", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 386.82422, "t": 689.8477199999999, "r": 435.46966999999995, "b": 684.10712, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 18]}], "orig": "traced back to the", "text": "traced back to the"}, {"self_ref": "#/texts/169", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 388.69589, "t": 683.72772, "r": 433.6032400000001, "b": 677.9871199999999, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 17]}], "orig": "original image to", "text": "original image to"}, {"self_ref": "#/texts/170", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 391.07761, "t": 677.60773, "r": 431.22542999999996, "b": 671.8671300000001, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 15]}], "orig": "extract content", "text": "extract content"}, {"self_ref": "#/texts/171", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 431.22650000000004, "t": 640.31488, "r": 498.82068, "b": 634.57428, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 23]}], "orig": "Structure Tags sequence", "text": "Structure Tags sequence"}, {"self_ref": "#/texts/172", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 431.1738, "t": 634.19482, "r": 498.87753000000004, "b": 628.45422, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 27]}], "orig": "provide full description of", "text": "provide full description of"}, {"self_ref": "#/texts/173", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 440.5289, "t": 628.07483, "r": 489.51827999999995, "b": 622.33423, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 19]}], "orig": "the table structure", "text": "the table structure"}, {"self_ref": "#/texts/174", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 328.37479, "t": 613.74615, "r": 367.72333, "b": 608.00555, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 14]}], "orig": "Structure Tags", "text": "Structure Tags"}, {"self_ref": "#/texts/175", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 331.84451, "t": 668.09113, "r": 373.67963, "b": 662.3505199999998, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 14]}], "orig": "BBoxes in sync", "text": "BBoxes in sync"}, {"self_ref": "#/texts/176", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 331.84451, "t": 662.9911499999998, "r": 381.17786, "b": 657.25055, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 17]}], "orig": "with tag sequence", "text": "with tag sequence"}, {"self_ref": "#/texts/177", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 196.62633, "t": 703.88379, "r": 219.42332, "b": 698.14319, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 7]}], "orig": "Encoder", "text": "Encoder"}, {"self_ref": "#/texts/178", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 246.66771, "t": 662.5053099999999, "r": 271.49899, "b": 656.76471, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 9]}], "orig": "Structure", "text": "Structure"}, {"self_ref": "#/texts/179", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 247.51601, "t": 657.40527, "r": 270.65021, "b": 651.66467, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 7]}], "orig": "Decoder", "text": "Decoder"}, {"self_ref": "#/texts/180", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 330.63071, "t": 702.98077, "r": 365.55347, "b": 697.24017, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 16]}], "orig": "[x1, y2, x2, y2]", "text": "[x1, y2, x2, y2]"}, {"self_ref": "#/texts/181", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 330.63071, "t": 694.82074, "r": 370.22717, "b": 689.08014, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 20]}], "orig": "[x1', y2', x2', y2']", "text": "[x1', y2', x2', y2']"}, {"self_ref": "#/texts/182", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 330.63071, "t": 686.6607700000001, "r": 374.51157, "b": 680.92017, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 24]}], "orig": "[x1'', y2'', x2'', y2'']", "text": "[x1'', y2'', x2'', y2'']"}, {"self_ref": "#/texts/183", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 330.63071, "t": 678.5007300000001, "r": 335.73233, "b": 672.76013, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 3]}], "orig": "...", "text": "..."}, {"self_ref": "#/texts/184", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 322.30579, "t": 650.20764, "r": 335.05988, "b": 645.42383, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "<TR>", "text": "<TR>"}, {"self_ref": "#/texts/185", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 322.30579, "t": 643.06769, "r": 335.05988, "b": 638.28387, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "<TD>", "text": "<TD>"}, {"self_ref": "#/texts/186", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 337.54971, "t": 643.44421, "r": 340.95242, "b": 637.70361, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "1", "text": "1"}, {"self_ref": "#/texts/187", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 343.56262, "t": 643.06769, "r": 398.91446, "b": 638.28387, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 21]}], "orig": "</TD><TD colspan=\"2\">", "text": "</TD><TD colspan=\"2\">"}, {"self_ref": "#/texts/188", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 407.41718, "t": 643.06769, "r": 421.58801, "b": 638.28387, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 5]}], "orig": "</TD>", "text": "</TD>"}, {"self_ref": "#/texts/189", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 322.30579, "t": 635.92767, "r": 349.23022, "b": 631.14386, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 9]}], "orig": "</TR><TR>", "text": "</TR><TR>"}, {"self_ref": "#/texts/190", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 322.30579, "t": 628.78766, "r": 335.05988, "b": 624.00385, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "<TD>", "text": "<TD>"}, {"self_ref": "#/texts/191", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 343.56155, "t": 628.78766, "r": 374.73685, "b": 624.00385, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 12]}], "orig": "</TD><TD>...", "text": "</TD><TD>..."}, {"self_ref": "#/texts/192", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 322.30579, "t": 621.64764, "r": 326.55716, "b": 616.86383, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 3]}], "orig": "...", "text": "..."}, {"self_ref": "#/texts/193", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 323.51111, "t": 702.33032, "r": 326.91382, "b": 696.58972, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "1", "text": "1"}, {"self_ref": "#/texts/194", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 323.71509, "t": 694.21112, "r": 327.1178, "b": 688.47052, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "2", "text": "2"}, {"self_ref": "#/texts/195", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 323.71509, "t": 686.01031, "r": 327.1178, "b": 680.2697099999999, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "3", "text": "3"}, {"self_ref": "#/texts/196", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 401.4816, "t": 643.45374, "r": 404.88431, "b": 637.71313, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "2", "text": "2"}, {"self_ref": "#/texts/197", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 337.6976, "t": 629.31549, "r": 341.10031, "b": 623.57489, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "3", "text": "3"}, {"self_ref": "#/texts/198", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 454.46378, "t": 687.45416, "r": 457.86648999999994, "b": 681.7135599999999, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "3", "text": "3"}, {"self_ref": "#/texts/199", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 493.32580999999993, "t": 700.90454, "r": 496.72852, "b": 695.16394, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "2", "text": "2"}, {"self_ref": "#/texts/200", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 454.08298, "t": 701.4312099999999, "r": 457.48569000000003, "b": 695.69061, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "1", "text": "1"}, {"self_ref": "#/texts/201", "parent": {"cref": "#/pictures/5"}, "children": [], "content_layer": "body", "label": "caption", "prov": [{"page_no": 5, "bbox": {"l": 50.112, "t": 264.2171900000001, "r": 286.36597, "b": 111.72906, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 745]}], "orig": "Figure 4: Given an input image of a table, the Encoder produces fixed-length features that represent the input image. The features are then passed to both the Structure Decoder and Cell BBox Decoder . During training, the Structure Decoder receives 'tokenized tags' of the HTML code that represent the table structure. Afterwards, a transformer encoder and decoder architecture is employed to produce features that are received by a linear layer, and the Cell BBox Decoder. The linear layer is applied to the features to predict the tags. Simultaneously, the Cell BBox Decoder selects features referring to the data cells (' < td > ', ' < ') and passes them through an attention network, an MLP, and a linear layer to predict the bounding boxes.", "text": "Figure 4: Given an input image of a table, the Encoder produces fixed-length features that represent the input image. The features are then passed to both the Structure Decoder and Cell BBox Decoder . During training, the Structure Decoder receives 'tokenized tags' of the HTML code that represent the table structure. Afterwards, a transformer encoder and decoder architecture is employed to produce features that are received by a linear layer, and the Cell BBox Decoder. The linear layer is applied to the features to predict the tags. Simultaneously, the Cell BBox Decoder selects features referring to the data cells (' < td > ', ' < ') and passes them through an attention network, an MLP, and a linear layer to predict the bounding boxes."}, {"self_ref": "#/texts/202", "parent": {"cref": "#/pictures/5"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 74.253464, "t": 533.78528, "r": 101.75846, "b": 527.82526, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 11]}], "orig": "Input Image", "text": "Input Image"}, {"self_ref": "#/texts/203", "parent": {"cref": "#/pictures/5"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 122.29972, "t": 533.65479, "r": 157.83972, "b": 527.69476, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 14]}], "orig": "Tokenised Tags", "text": "Tokenised Tags"}, {"self_ref": "#/texts/204", "parent": {"cref": "#/pictures/5"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 78.549347, "t": 420.61420000000004, "r": 125.68359000000001, "b": 414.95218, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 20]}], "orig": "Multi-Head Attention", "text": "Multi-Head Attention"}, {"self_ref": "#/texts/205", "parent": {"cref": "#/pictures/5"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 78.513298, "t": 400.68143, "r": 84.644547, "b": 395.01941, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 3]}], "orig": "Add", "text": "Add"}, {"self_ref": "#/texts/206", "parent": {"cref": "#/pictures/5"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 116.52705, "t": 400.68143, "r": 125.11079999999998, "b": 395.01941, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 15]}], "orig": "& Normalisation", "text": "& Normalisation"}, {"self_ref": "#/texts/207", "parent": {"cref": "#/pictures/5"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 76.024773, "t": 367.54691, "r": 127.92327000000002, "b": 361.88489, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 20]}], "orig": "Feed Forward Network", "text": "Feed Forward Network"}, {"self_ref": "#/texts/208", "parent": {"cref": "#/pictures/5"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 78.382828, "t": 347.11044, "r": 84.514076, "b": 341.44843, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 3]}], "orig": "Add", "text": "Add"}, {"self_ref": "#/texts/209", "parent": {"cref": "#/pictures/5"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 116.39658, "t": 347.11044, "r": 124.98033, "b": 341.44843, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 15]}], "orig": "& Normalisation", "text": "& Normalisation"}, {"self_ref": "#/texts/210", "parent": {"cref": "#/pictures/5"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 167.46945, "t": 329.55676, "r": 181.6292, "b": 323.89474, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 6]}], "orig": "Linear", "text": "Linear"}, {"self_ref": "#/texts/211", "parent": {"cref": "#/pictures/5"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 165.61292, "t": 313.52893, "r": 184.43242, "b": 307.86691, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 7]}], "orig": "Softmax", "text": "Softmax"}, {"self_ref": "#/texts/212", "parent": {"cref": "#/pictures/5"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 65.319511, "t": 467.73764000000006, "r": 132.9245, "b": 461.77764999999994, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 20]}], "orig": "CNN BACKBONE ENCODER", "text": "CNN BACKBONE ENCODER"}, {"self_ref": "#/texts/213", "parent": {"cref": "#/pictures/5"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 119.51457, "t": 522.33606, "r": 162.98782, "b": 517.27008, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 21]}], "orig": "[30, 1, 2, 3, 4, \u2026 3,", "text": "[30, 1, 2, 3, 4, \u2026 3,"}, {"self_ref": "#/texts/214", "parent": {"cref": "#/pictures/5"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 128.72858, "t": 517.08606, "r": 151.41083, "b": 512.02008, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 12]}], "orig": "4, 5, 8, 31]", "text": "4, 5, 8, 31]"}, {"self_ref": "#/texts/215", "parent": {"cref": "#/pictures/5"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 60.434211999999995, "t": 453.04007, "r": 80.27021, "b": 447.73007, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 10]}], "orig": "Positional", "text": "Positional"}, {"self_ref": "#/texts/216", "parent": {"cref": "#/pictures/5"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 60.598457, "t": 448.61395, "r": 78.854958, "b": 443.30396, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 8]}], "orig": "Encoding", "text": "Encoding"}, {"self_ref": "#/texts/217", "parent": {"cref": "#/pictures/5"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 134.82877, "t": 498.62238, "r": 154.66476, "b": 493.31238, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 10]}], "orig": "Positional", "text": "Positional"}, {"self_ref": "#/texts/218", "parent": {"cref": "#/pictures/5"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 134.99303, "t": 494.19629000000003, "r": 153.24953, "b": 488.88629, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 8]}], "orig": "Encoding", "text": "Encoding"}, {"self_ref": "#/texts/219", "parent": {"cref": "#/pictures/5"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 150.55193, "t": 446.64139, "r": 197.14943, "b": 440.97937, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 19]}], "orig": "Add & Normalisation", "text": "Add & Normalisation"}, {"self_ref": "#/texts/220", "parent": {"cref": "#/pictures/5"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 150.55193, "t": 397.5766, "r": 156.68318, "b": 391.91458, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 3]}], "orig": "Add", "text": "Add"}, {"self_ref": "#/texts/221", "parent": {"cref": "#/pictures/5"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 188.56567, "t": 397.5766, "r": 197.14943, "b": 391.91458, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 15]}], "orig": "& Normalisation", "text": "& Normalisation"}, {"self_ref": "#/texts/222", "parent": {"cref": "#/pictures/5"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 150.18539, "t": 416.33157, "r": 197.31964, "b": 410.66956, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 20]}], "orig": "Multi-Head Attention", "text": "Multi-Head Attention"}, {"self_ref": "#/texts/223", "parent": {"cref": "#/pictures/5"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 150.55193, "t": 351.75152999999995, "r": 156.68318, "b": 346.08951, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 3]}], "orig": "Add", "text": "Add"}, {"self_ref": "#/texts/224", "parent": {"cref": "#/pictures/5"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 188.56567, "t": 351.75152999999995, "r": 197.14943, "b": 346.08951, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 15]}], "orig": "& Normalisation", "text": "& Normalisation"}, {"self_ref": "#/texts/225", "parent": {"cref": "#/pictures/5"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 147.86377, "t": 369.90665, "r": 199.76227, "b": 364.24463, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 20]}], "orig": "Feed Forward Network", "text": "Feed Forward Network"}, {"self_ref": "#/texts/226", "parent": {"cref": "#/pictures/5"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 241.56567000000004, "t": 477.73714999999993, "r": 255.72542, "b": 472.07513, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 6]}], "orig": "Linear", "text": "Linear"}, {"self_ref": "#/texts/227", "parent": {"cref": "#/pictures/5"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 241.91730000000004, "t": 430.63507, "r": 256.07706, "b": 424.97305, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 6]}], "orig": "Linear", "text": "Linear"}, {"self_ref": "#/texts/228", "parent": {"cref": "#/pictures/5"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 228.054, "t": 455.38070999999997, "r": 248.72363000000004, "b": 449.71869, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 9]}], "orig": "Attention", "text": "Attention"}, {"self_ref": "#/texts/229", "parent": {"cref": "#/pictures/5"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 246.2919, "t": 455.38070999999997, "r": 269.39325, "b": 449.71869, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 7]}], "orig": "Network", "text": "Network"}, {"self_ref": "#/texts/230", "parent": {"cref": "#/pictures/5"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 228.44568000000004, "t": 386.85318, "r": 238.73892, "b": 381.19116, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 3]}], "orig": "MLP", "text": "MLP"}, {"self_ref": "#/texts/231", "parent": {"cref": "#/pictures/5"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 256.29767, "t": 386.7967499999999, "r": 271.77792, "b": 381.13474, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 6]}], "orig": "Linear", "text": "Linear"}, {"self_ref": "#/texts/232", "parent": {"cref": "#/pictures/5"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 239.54543, "t": 409.78656, "r": 258.08942, "b": 404.12454, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 7]}], "orig": "Sigmoid", "text": "Sigmoid"}, {"self_ref": "#/texts/233", "parent": {"cref": "#/pictures/5"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 54.14704100000001, "t": 407.12817, "r": 59.51152, "b": 342.21674, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 27]}], "orig": "Transformer Encoder Network", "text": "Transformer Encoder Network"}, {"self_ref": "#/texts/234", "parent": {"cref": "#/pictures/5"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 54.235424, "t": 418.18768, "r": 59.30449699999999, "b": 413.54578000000004, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "x2", "text": "x2"}, {"self_ref": "#/texts/235", "parent": {"cref": "#/pictures/5"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 85.295891, "t": 307.46811, "r": 122.16431, "b": 301.63312, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 14]}], "orig": "Encoded Output", "text": "Encoded Output"}, {"self_ref": "#/texts/236", "parent": {"cref": "#/pictures/5"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 229.66599, "t": 512.45392, "r": 265.3194, "b": 506.54427999999996, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 14]}], "orig": "Encoded Output", "text": "Encoded Output"}, {"self_ref": "#/texts/237", "parent": {"cref": "#/pictures/5"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 157.17369, "t": 291.6969, "r": 190.41711, "b": 285.87057, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 14]}], "orig": "Predicted Tags", "text": "Predicted Tags"}, {"self_ref": "#/texts/238", "parent": {"cref": "#/pictures/5"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 227.81598999999997, "t": 353.94458, "r": 270.78442, "b": 348.10794, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 16]}], "orig": "Bounding Boxes &", "text": "Bounding Boxes &"}, {"self_ref": "#/texts/239", "parent": {"cref": "#/pictures/5"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 233.70262, "t": 347.93817, "r": 263.51105, "b": 342.1095000000001, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 14]}], "orig": "Classification", "text": "Classification"}, {"self_ref": "#/texts/240", "parent": {"cref": "#/pictures/5"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 184.74655, "t": 498.60498, "r": 212.16055, "b": 493.24097, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 11]}], "orig": "Transformer", "text": "Transformer"}, {"self_ref": "#/texts/241", "parent": {"cref": "#/pictures/5"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 178.91229, "t": 492.85498, "r": 216.74378999999996, "b": 487.49097, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 15]}], "orig": "Decoder Network", "text": "Decoder Network"}, {"self_ref": "#/texts/242", "parent": {"cref": "#/pictures/5"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 194.24574, "t": 509.2178, "r": 198.89099, "b": 504.15182000000004, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "x4", "text": "x4"}, {"self_ref": "#/texts/243", "parent": {"cref": "#/pictures/5"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 221.45587, "t": 520.13086, "r": 276.47089, "b": 514.17084, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 17]}], "orig": "CELL BBOX DECODER", "text": "CELL BBOX DECODER"}, {"self_ref": "#/texts/244", "parent": {"cref": "#/pictures/5"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 151.65219, "t": 468.55759, "r": 197.29019, "b": 462.89557, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 17]}], "orig": "Masked Multi-Head", "text": "Masked Multi-Head"}, {"self_ref": "#/texts/245", "parent": {"cref": "#/pictures/5"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 163.43277, "t": 462.55759, "r": 184.19028, "b": 456.89557, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 9]}], "orig": "Attention", "text": "Attention"}, {"self_ref": "#/texts/246", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 308.862, "t": 542.46558, "r": 545.11505, "b": 497.6930500000001, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 227]}], "orig": "forming classification, and adding an adaptive pooling layer of size 28*28. ResNet by default downsamples the image resolution by 32 and then the encoded image is provided to both the Structure Decoder , and Cell BBox Decoder .", "text": "forming classification, and adding an adaptive pooling layer of size 28*28. ResNet by default downsamples the image resolution by 32 and then the encoded image is provided to both the Structure Decoder , and Cell BBox Decoder ."}, {"self_ref": "#/texts/247", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 308.86194, "t": 494.66019, "r": 545.11511, "b": 378.03818, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 563]}], "orig": "Structure Decoder. The transformer architecture of this component is based on the work proposed in [31]. After extensive experimentation, the Structure Decoder is modeled as a transformer encoder with two encoder layers and a transformer decoder made from a stack of 4 decoder layers that comprise mainly of multi-head attention and feed forward layers. This configuration uses fewer layers and heads in comparison to networks applied to other problems (e.g. \"Scene Understanding\", \"Image Captioning\"), something which we relate to the simplicity of table images.", "text": "Structure Decoder. The transformer architecture of this component is based on the work proposed in [31]. After extensive experimentation, the Structure Decoder is modeled as a transformer encoder with two encoder layers and a transformer decoder made from a stack of 4 decoder layers that comprise mainly of multi-head attention and feed forward layers. This configuration uses fewer layers and heads in comparison to networks applied to other problems (e.g. \"Scene Understanding\", \"Image Captioning\"), something which we relate to the simplicity of table images."}, {"self_ref": "#/texts/248", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 308.86197, "t": 374.88574, "r": 545.11511, "b": 246.42728999999997, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 592]}], "orig": "The transformer encoder receives an encoded image from the CNN Backbone Network and refines it through a multi-head dot-product attention layer, followed by a Feed Forward Network. During training, the transformer decoder receives as input the output feature produced by the transformer encoder, and the tokenized input of the HTML ground-truth tags. Using a stack of multi-head attention layers, different aspects of the tag sequence could be inferred. This is achieved by each attention head on a layer operating in a different subspace, and then combining altogether their attention score.", "text": "The transformer encoder receives an encoded image from the CNN Backbone Network and refines it through a multi-head dot-product attention layer, followed by a Feed Forward Network. During training, the transformer decoder receives as input the output feature produced by the transformer encoder, and the tokenized input of the HTML ground-truth tags. Using a stack of multi-head attention layers, different aspects of the tag sequence could be inferred. This is achieved by each attention head on a layer operating in a different subspace, and then combining altogether their attention score."}, {"self_ref": "#/texts/249", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 308.86194, "t": 243.3954, "r": 545.11511, "b": 138.72729000000004, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 483]}], "orig": "Cell BBox Decoder. Our architecture allows to simultaneously predict HTML tags and bounding boxes for each table cell without the need of a separate object detector end to end. This approach is inspired by DETR [1] which employs a Transformer Encoder, and Decoder that looks for a specific number of object queries (potential object detections). As our model utilizes a transformer architecture, the hidden state of the < td > ' and ' < ' HTML structure tags become the object query.", "text": "Cell BBox Decoder. Our architecture allows to simultaneously predict HTML tags and bounding boxes for each table cell without the need of a separate object detector end to end. This approach is inspired by DETR [1] which employs a Transformer Encoder, and Decoder that looks for a specific number of object queries (potential object detections). As our model utilizes a transformer architecture, the hidden state of the < td > ' and ' < ' HTML structure tags become the object query."}, {"self_ref": "#/texts/250", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 308.86194, "t": 135.57484, "r": 545.11505, "b": 78.84827399999995, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 286]}], "orig": "The encoding generated by the CNN Backbone Network along with the features acquired for every data cell from the Transformer Decoder are then passed to the attention network. The attention network takes both inputs and learns to provide an attention weighted encoding. This weighted at-", "text": "The encoding generated by the CNN Backbone Network along with the features acquired for every data cell from the Transformer Decoder are then passed to the attention network. The attention network takes both inputs and learns to provide an attention weighted encoding. This weighted at-"}, {"self_ref": "#/texts/251", "parent": {"cref": "#/body"}, "children": [], "content_layer": "furniture", "label": "page_footer", "prov": [{"page_no": 5, "bbox": {"l": 295.12094, "t": 57.866840000000025, "r": 300.10223, "b": 48.96027800000002, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "5", "text": "5"}, {"self_ref": "#/texts/252", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 6, "bbox": {"l": 50.112, "t": 716.79163, "r": 286.36514, "b": 636.15399, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 380]}], "orig": "tention encoding is then multiplied to the encoded image to produce a feature for each table cell. Notice that this is different than the typical object detection problem where imbalances between the number of detections and the amount of objects may exist. In our case, we know up front that the produced detections always match with the table cells in number and correspondence.", "text": "tention encoding is then multiplied to the encoded image to produce a feature for each table cell. Notice that this is different than the typical object detection problem where imbalances between the number of detections and the amount of objects may exist. In our case, we know up front that the produced detections always match with the table cells in number and correspondence."}, {"self_ref": "#/texts/253", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 6, "bbox": {"l": 50.112, "t": 632.37555, "r": 286.36511, "b": 551.73694, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 371]}], "orig": "The output features for each table cell are then fed into the feed-forward network (FFN). The FFN consists of a Multi-Layer Perceptron (3 layers with ReLU activation function) that predicts the normalized coordinates for the bounding box of each table cell. Finally, the predicted bounding boxes are classified based on whether they are empty or not using a linear layer.", "text": "The output features for each table cell are then fed into the feed-forward network (FFN). The FFN consists of a Multi-Layer Perceptron (3 layers with ReLU activation function) that predicts the normalized coordinates for the bounding box of each table cell. Finally, the predicted bounding boxes are classified based on whether they are empty or not using a linear layer."}, {"self_ref": "#/texts/254", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 6, "bbox": {"l": 50.112, "t": 548.07806, "r": 286.36572, "b": 347.7691, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 985]}], "orig": "Loss Functions. We formulate a multi-task loss Eq. 2 to train our network. The Cross-Entropy loss (denoted as l$_{s}$ ) is used to train the Structure Decoder which predicts the structure tokens. As for the Cell BBox Decoder it is trained with a combination of losses denoted as l$_{box}$ . l$_{box}$ consists of the generally used l$_{1}$ loss for object detection and the IoU loss ( l$_{iou}$ ) to be scale invariant as explained in [25]. In comparison to DETR, we do not use the Hungarian algorithm [15] to match the predicted bounding boxes with the ground-truth boxes, as we have already achieved a one-toone match through two steps: 1) Our token input sequence is naturally ordered, therefore the hidden states of the table data cells are also in order when they are provided as input to the Cell BBox Decoder , and 2) Our bounding boxes generation mechanism (see Sec. 3) ensures a one-to-one mapping between the cell content and its bounding box for all post-processed datasets.", "text": "Loss Functions. We formulate a multi-task loss Eq. 2 to train our network. The Cross-Entropy loss (denoted as l$_{s}$ ) is used to train the Structure Decoder which predicts the structure tokens. As for the Cell BBox Decoder it is trained with a combination of losses denoted as l$_{box}$ . l$_{box}$ consists of the generally used l$_{1}$ loss for object detection and the IoU loss ( l$_{iou}$ ) to be scale invariant as explained in [25]. In comparison to DETR, we do not use the Hungarian algorithm [15] to match the predicted bounding boxes with the ground-truth boxes, as we have already achieved a one-toone match through two steps: 1) Our token input sequence is naturally ordered, therefore the hidden states of the table data cells are also in order when they are provided as input to the Cell BBox Decoder , and 2) Our bounding boxes generation mechanism (see Sec. 3) ensures a one-to-one mapping between the cell content and its bounding box for all post-processed datasets."}, {"self_ref": "#/texts/255", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 6, "bbox": {"l": 50.112022, "t": 343.98965, "r": 286.36499, "b": 323.12811, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 67]}], "orig": "The loss used to train the TableFormer can be defined as following:", "text": "The loss used to train the TableFormer can be defined as following:"}, {"self_ref": "#/texts/256", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "formula", "prov": [{"page_no": 6, "bbox": {"l": 124.33002, "t": 298.71906, "r": 286.36243, "b": 274.92828, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 84]}], "orig": "l$_{box}$ = \u03bb$_{iou}$l$_{iou}$ + \u03bb$_{l}$$_{1}$ l = \u03bbl$_{s}$ + (1 \u2212 \u03bb ) l$_{box}$ (1)", "text": ""}, {"self_ref": "#/texts/257", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 6, "bbox": {"l": 50.11203, "t": 261.4079899999999, "r": 281.59692, "b": 251.78412000000003, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 76]}], "orig": "where \u03bb \u2208 [0, 1], and \u03bb$_{iou}$, \u03bb$_{l}$$_{1}$ \u2208$_{R}$ are hyper-parameters.", "text": "where \u03bb \u2208 [0, 1], and \u03bb$_{iou}$, \u03bb$_{l}$$_{1}$ \u2208$_{R}$ are hyper-parameters."}, {"self_ref": "#/texts/258", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "section_header", "prov": [{"page_no": 6, "bbox": {"l": 50.112045, "t": 236.08311000000003, "r": 171.98335, "b": 225.33538999999996, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 23]}], "orig": "5. Experimental Results", "text": "5. Experimental Results", "level": 1}, {"self_ref": "#/texts/259", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "section_header", "prov": [{"page_no": 6, "bbox": {"l": 50.112045, "t": 215.73567000000003, "r": 179.17502, "b": 205.88362000000006, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 27]}], "orig": "5.1. Implementation Details", "text": "5.1. Implementation Details", "level": 1}, {"self_ref": "#/texts/260", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 6, "bbox": {"l": 50.112045, "t": 196.26567, "r": 286.36517, "b": 151.49311999999998, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 207]}], "orig": "TableFormer uses ResNet-18 as the CNN Backbone Network . The input images are resized to 448*448 pixels and the feature map has a dimension of 28*28. Additionally, we enforce the following input constraints:", "text": "TableFormer uses ResNet-18 as the CNN Backbone Network . The input images are resized to 448*448 pixels and the feature map has a dimension of 28*28. Additionally, we enforce the following input constraints:"}, {"self_ref": "#/texts/261", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "formula", "prov": [{"page_no": 6, "bbox": {"l": 91.661049, "t": 138.17200000000003, "r": 286.36246, "b": 113.60411999999997, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 77]}], "orig": "Image width and height \u2264 1024 pixels Structural tags length \u2264 512 tokens. (2)", "text": ""}, {"self_ref": "#/texts/262", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 6, "bbox": {"l": 50.112061, "t": 99.70968600000003, "r": 286.36514, "b": 78.84812199999999, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 117]}, {"page_no": 6, "bbox": {"l": 50.112061, "t": 99.70968600000003, "r": 286.36514, "b": 78.84812199999999, "coord_origin": "BOTTOMLEFT"}, "charspan": [118, 274]}], "orig": "Although input constraints are used also by other methods, such as EDD, ours are less restrictive due to the improved runtime performance and lower memory footprint of TableFormer. This allows to utilize input samples with longer sequences and images with larger dimensions.", "text": "Although input constraints are used also by other methods, such as EDD, ours are less restrictive due to the improved runtime performance and lower memory footprint of TableFormer. This allows to utilize input samples with longer sequences and images with larger dimensions."}, {"self_ref": "#/texts/263", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 6, "bbox": {"l": 308.86206, "t": 675.77063, "r": 545.1153, "b": 463.62595, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1024]}], "orig": "The Transformer Encoder consists of two \"Transformer Encoder Layers\", with an input feature size of 512, feed forward network of 1024, and 4 attention heads. As for the Transformer Decoder it is composed of four \"Transformer Decoder Layers\" with similar input and output dimensions as the \"Transformer Encoder Layers\". Even though our model uses fewer layers and heads than the default implementation parameters, our extensive experimentation has proved this setup to be more suitable for table images. We attribute this finding to the inherent design of table images, which contain mostly lines and text, unlike the more elaborate content present in other scopes (e.g. the COCO dataset). Moreover, we have added ResNet blocks to the inputs of the Structure Decoder and Cell BBox Decoder. This prevents a decoder having a stronger influence over the learned weights which would damage the other prediction task (structure vs bounding boxes), but learn task specific weights instead. Lastly our dropout layers are set to 0.5.", "text": "The Transformer Encoder consists of two \"Transformer Encoder Layers\", with an input feature size of 512, feed forward network of 1024, and 4 attention heads. As for the Transformer Decoder it is composed of four \"Transformer Decoder Layers\" with similar input and output dimensions as the \"Transformer Encoder Layers\". Even though our model uses fewer layers and heads than the default implementation parameters, our extensive experimentation has proved this setup to be more suitable for table images. We attribute this finding to the inherent design of table images, which contain mostly lines and text, unlike the more elaborate content present in other scopes (e.g. the COCO dataset). Moreover, we have added ResNet blocks to the inputs of the Structure Decoder and Cell BBox Decoder. This prevents a decoder having a stronger influence over the learned weights which would damage the other prediction task (structure vs bounding boxes), but learn task specific weights instead. Lastly our dropout layers are set to 0.5."}, {"self_ref": "#/texts/264", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 6, "bbox": {"l": 308.86203, "t": 455.42249, "r": 545.11517, "b": 362.83002, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 419]}], "orig": "For training, TableFormer is trained with 3 Adam optimizers, each one for the CNN Backbone Network , Structure Decoder , and Cell BBox Decoder . Taking the PubTabNet as an example for our parameter set up, the initializing learning rate is 0.001 for 12 epochs with a batch size of 24, and \u03bb set to 0.5. Afterwards, we reduce the learning rate to 0.0001, the batch size to 18 and train for 12 more epochs or convergence.", "text": "For training, TableFormer is trained with 3 Adam optimizers, each one for the CNN Backbone Network , Structure Decoder , and Cell BBox Decoder . Taking the PubTabNet as an example for our parameter set up, the initializing learning rate is 0.001 for 12 epochs with a batch size of 24, and \u03bb set to 0.5. Afterwards, we reduce the learning rate to 0.0001, the batch size to 18 and train for 12 more epochs or convergence."}, {"self_ref": "#/texts/265", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 6, "bbox": {"l": 308.86203, "t": 354.62558000000007, "r": 545.11523, "b": 238.12311, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 528]}], "orig": "TableFormer is implemented with PyTorch and Torchvision libraries [22]. To speed up the inference, the image undergoes a single forward pass through the CNN Backbone Network and transformer encoder. This eliminates the overhead of generating the same features for each decoding step. Similarly, we employ a 'caching' technique to preform faster autoregressive decoding. This is achieved by storing the features of decoded tokens so we can reuse them for each time step. Therefore, we only compute the attention for each new tag.", "text": "TableFormer is implemented with PyTorch and Torchvision libraries [22]. To speed up the inference, the image undergoes a single forward pass through the CNN Backbone Network and transformer encoder. This eliminates the overhead of generating the same features for each decoding step. Similarly, we employ a 'caching' technique to preform faster autoregressive decoding. This is achieved by storing the features of decoded tokens so we can reuse them for each time step. Therefore, we only compute the attention for each new tag."}, {"self_ref": "#/texts/266", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "section_header", "prov": [{"page_no": 6, "bbox": {"l": 308.86203, "t": 212.44568000000004, "r": 397.44281, "b": 202.59362999999996, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 19]}], "orig": "5.2. Generalization", "text": "5.2. Generalization", "level": 1}, {"self_ref": "#/texts/267", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 6, "bbox": {"l": 308.86203, "t": 188.55066999999997, "r": 545.11517, "b": 119.86811, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 299]}], "orig": "TableFormer is evaluated on three major publicly available datasets of different nature to prove the generalization and effectiveness of our model. The datasets used for evaluation are the PubTabNet, FinTabNet and TableBank which stem from the scientific, financial and general domains respectively.", "text": "TableFormer is evaluated on three major publicly available datasets of different nature to prove the generalization and effectiveness of our model. The datasets used for evaluation are the PubTabNet, FinTabNet and TableBank which stem from the scientific, financial and general domains respectively."}, {"self_ref": "#/texts/268", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 6, "bbox": {"l": 308.86203, "t": 111.66467, "r": 545.11523, "b": 78.84710700000005, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 155]}], "orig": "We also share our baseline results on the challenging SynthTabNet dataset. Throughout our experiments, the same parameters stated in Sec. 5.1 are utilized.", "text": "We also share our baseline results on the challenging SynthTabNet dataset. Throughout our experiments, the same parameters stated in Sec. 5.1 are utilized."}, {"self_ref": "#/texts/269", "parent": {"cref": "#/body"}, "children": [], "content_layer": "furniture", "label": "page_footer", "prov": [{"page_no": 6, "bbox": {"l": 295.12103, "t": 57.86667299999999, "r": 300.10233, "b": 48.960109999999986, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "6", "text": "6"}, {"self_ref": "#/texts/270", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "section_header", "prov": [{"page_no": 7, "bbox": {"l": 50.112, "t": 717.5986299999998, "r": 167.89825, "b": 707.74658, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 25]}], "orig": "5.3. Datasets and Metrics", "text": "5.3. Datasets and Metrics", "level": 1}, {"self_ref": "#/texts/271", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 50.112, "t": 698.6496000000001, "r": 286.36511, "b": 653.87701, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 192]}], "orig": "The Tree-Edit-Distance-Based Similarity (TEDS) metric was introduced in [37]. It represents the prediction, and ground-truth as a tree structure of HTML tags. This similarity is calculated as:", "text": "The Tree-Edit-Distance-Based Similarity (TEDS) metric was introduced in [37]. It represents the prediction, and ground-truth as a tree structure of HTML tags. This similarity is calculated as:"}, {"self_ref": "#/texts/272", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "formula", "prov": [{"page_no": 7, "bbox": {"l": 86.218994, "t": 641.68201, "r": 286.3624, "b": 619.26123, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 99]}], "orig": "TEDS ( T$_{a}$, T$_{b}$ ) = 1 \u2212 EditDist ( T$_{a}$, T$_{b}$ ) max ( | T$_{a}$ | , | T$_{b}$ | ) (3)", "text": ""}, {"self_ref": "#/texts/273", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 50.111984, "t": 610.99701, "r": 286.36285, "b": 578.021, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 162]}], "orig": "where T$_{a}$ and T$_{b}$ represent tables in tree structure HTML format. EditDist denotes the tree-edit distance, and | T | represents the number of nodes in T .", "text": "where T$_{a}$ and T$_{b}$ represent tables in tree structure HTML format. EditDist denotes the tree-edit distance, and | T | represents the number of nodes in T ."}, {"self_ref": "#/texts/274", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "section_header", "prov": [{"page_no": 7, "bbox": {"l": 50.112, "t": 567.18054, "r": 170.45169, "b": 557.32849, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 26]}], "orig": "5.4. Quantitative Analysis", "text": "5.4. Quantitative Analysis", "level": 1}, {"self_ref": "#/texts/275", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 50.112, "t": 548.3501, "r": 286.36514, "b": 395.86206, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 723]}], "orig": "Structure. As shown in Tab. 2, TableFormer outperforms all SOTA methods across different datasets by a large margin for predicting the table structure from an image. All the more, our model outperforms pre-trained methods. During the evaluation we do not apply any table filtering. We also provide our baseline results on the SynthTabNet dataset. It has been observed that large tables (e.g. tables that occupy half of the page or more) yield poor predictions. We attribute this issue to the image resizing during the preprocessing step, that produces downsampled images with indistinguishable features. This problem can be addressed by treating such big tables with a separate model which accepts a large input image size.", "text": "Structure. As shown in Tab. 2, TableFormer outperforms all SOTA methods across different datasets by a large margin for predicting the table structure from an image. All the more, our model outperforms pre-trained methods. During the evaluation we do not apply any table filtering. We also provide our baseline results on the SynthTabNet dataset. It has been observed that large tables (e.g. tables that occupy half of the page or more) yield poor predictions. We attribute this issue to the image resizing during the preprocessing step, that produces downsampled images with indistinguishable features. This problem can be addressed by treating such big tables with a separate model which accepts a large input image size."}, {"self_ref": "#/texts/276", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 50.112, "t": 199.56664, "r": 286.36511, "b": 178.70507999999995, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 101]}], "orig": "Table 2: Structure results on PubTabNet (PTN), FinTabNet (FTN), TableBank (TB) and SynthTabNet (STN).", "text": "Table 2: Structure results on PubTabNet (PTN), FinTabNet (FTN), TableBank (TB) and SynthTabNet (STN)."}, {"self_ref": "#/texts/277", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 50.112, "t": 175.65662999999995, "r": 261.78732, "b": 166.75008000000003, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 50]}], "orig": "FT: Model was trained on PubTabNet then finetuned.", "text": "FT: Model was trained on PubTabNet then finetuned."}, {"self_ref": "#/texts/278", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 50.112015, "t": 147.65019000000007, "r": 286.366, "b": 78.84806800000001, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 346]}, {"page_no": 7, "bbox": {"l": 50.112015, "t": 147.65019000000007, "r": 286.366, "b": 78.84806800000001, "coord_origin": "BOTTOMLEFT"}, "charspan": [347, 1084]}], "orig": "Cell Detection. Like any object detector, our Cell BBox Detector provides bounding boxes that can be improved with post-processing during inference. We make use of the grid-like structure of tables to refine the predictions. A detailed explanation on the post-processing is available in the supplementary material. As shown in Tab. 3, we evaluate our Cell BBox Decoder accuracy for cells with a class label of 'content' only using the PASCAL VOC mAP metric for pre-processing and post-processing. Note that we do not have post-processing results for SynthTabNet as images are only provided. To compare the performance of our proposed approach, we've integrated TableFormer's Cell BBox Decoder into EDD architecture. As mentioned previously, the Structure Decoder provides the Cell BBox Decoder with the features needed to predict the bounding box predictions. Therefore, the accuracy of the Structure Decoder directly influences the accuracy of the Cell BBox Decoder . If the Structure Decoder predicts an extra column, this will result in an extra column of predicted bounding boxes.", "text": "Cell Detection. Like any object detector, our Cell BBox Detector provides bounding boxes that can be improved with post-processing during inference. We make use of the grid-like structure of tables to refine the predictions. A detailed explanation on the post-processing is available in the supplementary material. As shown in Tab. 3, we evaluate our Cell BBox Decoder accuracy for cells with a class label of 'content' only using the PASCAL VOC mAP metric for pre-processing and post-processing. Note that we do not have post-processing results for SynthTabNet as images are only provided. To compare the performance of our proposed approach, we've integrated TableFormer's Cell BBox Decoder into EDD architecture. As mentioned previously, the Structure Decoder provides the Cell BBox Decoder with the features needed to predict the bounding box predictions. Therefore, the accuracy of the Structure Decoder directly influences the accuracy of the Cell BBox Decoder . If the Structure Decoder predicts an extra column, this will result in an extra column of predicted bounding boxes."}, {"self_ref": "#/texts/279", "parent": {"cref": "#/tables/4"}, "children": [], "content_layer": "body", "label": "caption", "prov": [{"page_no": 7, "bbox": {"l": 308.862, "t": 475.55069, "r": 545.11517, "b": 454.6891499999999, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 94]}], "orig": "Table 3: Cell Bounding Box detection results on PubTabNet, and FinTabNet. PP: Post-processing.", "text": "Table 3: Cell Bounding Box detection results on PubTabNet, and FinTabNet. PP: Post-processing."}, {"self_ref": "#/texts/280", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 308.86197, "t": 424.3202800000001, "r": 545.11566, "b": 271.83231, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 715]}], "orig": "Cell Content. In this section, we evaluate the entire pipeline of recovering a table with content. Here we put our approach to test by capitalizing on extracting content from the PDF cells rather than decoding from images. Tab. 4 shows the TEDs score of HTML code representing the structure of the table along with the content inserted in the data cell and compared with the ground-truth. Our method achieved a 5.3% increase over the state-of-the-art, and commercial solutions. We believe our scores would be higher if the HTML ground-truth matched the extracted PDF cell content. Unfortunately, there are small discrepancies such as spacings around words or special characters with various unicode representations.", "text": "Cell Content. In this section, we evaluate the entire pipeline of recovering a table with content. Here we put our approach to test by capitalizing on extracting content from the PDF cells rather than decoding from images. Tab. 4 shows the TEDs score of HTML code representing the structure of the table along with the content inserted in the data cell and compared with the ground-truth. Our method achieved a 5.3% increase over the state-of-the-art, and commercial solutions. We believe our scores would be higher if the HTML ground-truth matched the extracted PDF cell content. Unfortunately, there are small discrepancies such as spacings around words or special characters with various unicode representations."}, {"self_ref": "#/texts/281", "parent": {"cref": "#/tables/5"}, "children": [], "content_layer": "body", "label": "caption", "prov": [{"page_no": 7, "bbox": {"l": 308.862, "t": 135.13864, "r": 545.11517, "b": 102.32206999999994, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 148]}], "orig": "Table 4: Results of structure with content retrieved using cell detection on PubTabNet. In all cases the input is PDF documents with cropped tables.", "text": "Table 4: Results of structure with content retrieved using cell detection on PubTabNet. In all cases the input is PDF documents with cropped tables."}, {"self_ref": "#/texts/282", "parent": {"cref": "#/body"}, "children": [], "content_layer": "furniture", "label": "page_footer", "prov": [{"page_no": 7, "bbox": {"l": 295.121, "t": 57.866641999999956, "r": 300.10229, "b": 48.96007899999995, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "7", "text": "7"}, {"self_ref": "#/texts/283", "parent": {"cref": "#/groups/3"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 8, "bbox": {"l": 53.286037, "t": 713.3124399999999, "r": 61.550289, "b": 705.43927, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "a.", "text": "a.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/284", "parent": {"cref": "#/groups/3"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 8, "bbox": {"l": 65.682419, "t": 713.3124399999999, "r": 499.55563, "b": 705.43927, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 105]}], "orig": "Red - PDF cells, Green - predicted bounding boxes, Blue - post-processed predictions matched to PDF cells", "text": "Red - PDF cells, Green - predicted bounding boxes, Blue - post-processed predictions matched to PDF cells", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/285", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "section_header", "prov": [{"page_no": 8, "bbox": {"l": 53.811783000000005, "t": 697.71887, "r": 284.34592, "b": 689.8457, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 53]}], "orig": "Japanese language (previously unseen by TableFormer):", "text": "Japanese language (previously unseen by TableFormer):", "level": 1}, {"self_ref": "#/texts/286", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "section_header", "prov": [{"page_no": 8, "bbox": {"l": 304.83081, "t": 697.71887, "r": 431.09119, "b": 689.8457, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 29]}], "orig": "Example table from FinTabNet:", "text": "Example table from FinTabNet:", "level": 1}, {"self_ref": "#/texts/287", "parent": {"cref": "#/pictures/7"}, "children": [], "content_layer": "body", "label": "caption", "prov": [{"page_no": 8, "bbox": {"l": 53.811783000000005, "t": 583.76672, "r": 385.93451, "b": 575.89355, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 79]}], "orig": "b. Structure predicted by TableFormer, with superimposed matched PDF cell text:", "text": "b. Structure predicted by TableFormer, with superimposed matched PDF cell text:"}, {"self_ref": "#/texts/288", "parent": {"cref": "#/tables/6"}, "children": [], "content_layer": "body", "label": "caption", "prov": [{"page_no": 8, "bbox": {"l": 380.42731, "t": 499.69574, "r": 549.42175, "b": 493.39716, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 53]}], "orig": "Text is aligned to match original for ease of viewing", "text": "Text is aligned to match original for ease of viewing"}, {"self_ref": "#/texts/289", "parent": {"cref": "#/pictures/8"}, "children": [], "content_layer": "body", "label": "caption", "prov": [{"page_no": 8, "bbox": {"l": 62.595001, "t": 333.27164, "r": 532.63049, "b": 324.36508, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 112]}], "orig": "Figure 6: An example of TableFormer predictions (bounding boxes and structure) from generated SynthTabNet table.", "text": "Figure 6: An example of TableFormer predictions (bounding boxes and structure) from generated SynthTabNet table."}, {"self_ref": "#/texts/290", "parent": {"cref": "#/pictures/8"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 53.715248, "t": 410.22278, "r": 85.657333, "b": 405.55719, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 12]}], "orig": "Ground Truth", "text": "Ground Truth"}, {"self_ref": "#/texts/291", "parent": {"cref": "#/pictures/9"}, "children": [], "content_layer": "body", "label": "caption", "prov": [{"page_no": 8, "bbox": {"l": 50.112, "t": 471.12265, "r": 545.11377, "b": 426.35013, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 397]}], "orig": "Figure 5: One of the benefits of TableFormer is that it is language agnostic, as an example, the left part of the illustration demonstrates TableFormer predictions on previously unseen language (Japanese). Additionally, we see that TableFormer is robust to variability in style and content, right side of the illustration shows the example of the TableFormer prediction from the FinTabNet dataset.", "text": "Figure 5: One of the benefits of TableFormer is that it is language agnostic, as an example, the left part of the illustration demonstrates TableFormer predictions on previously unseen language (Japanese). Additionally, we see that TableFormer is robust to variability in style and content, right side of the illustration shows the example of the TableFormer prediction from the FinTabNet dataset."}, {"self_ref": "#/texts/292", "parent": {"cref": "#/pictures/9"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 220.26282, "t": 410.22278, "r": 342.07819, "b": 405.55719, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 49]}], "orig": "Red - PDF cells, Green - predicted bounding boxes", "text": "Red - PDF cells, Green - predicted bounding boxes"}, {"self_ref": "#/texts/293", "parent": {"cref": "#/pictures/10"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 437.37939, "t": 391.44705, "r": 443.69870000000003, "b": 385.12842, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "16", "text": "16"}, {"self_ref": "#/texts/294", "parent": {"cref": "#/pictures/10"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 450.33203, "t": 391.44705, "r": 456.6513100000001, "b": 385.12842, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "17", "text": "17"}, {"self_ref": "#/texts/295", "parent": {"cref": "#/pictures/10"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 463.28464, "t": 391.44705, "r": 469.60394, "b": 385.12842, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "18", "text": "18"}, {"self_ref": "#/texts/296", "parent": {"cref": "#/pictures/10"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 476.23724000000004, "t": 391.44705, "r": 482.5565500000001, "b": 385.12842, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "19", "text": "19"}, {"self_ref": "#/texts/297", "parent": {"cref": "#/pictures/10"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 489.18988, "t": 391.44705, "r": 495.50916, "b": 385.12842, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "20", "text": "20"}, {"self_ref": "#/texts/298", "parent": {"cref": "#/pictures/10"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 502.14251999999993, "t": 391.44705, "r": 508.46178999999995, "b": 385.12842, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "21", "text": "21"}, {"self_ref": "#/texts/299", "parent": {"cref": "#/pictures/10"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 515.09509, "t": 391.44705, "r": 521.41443, "b": 385.12842, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "22", "text": "22"}, {"self_ref": "#/texts/300", "parent": {"cref": "#/pictures/10"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 385.2814, "t": 380.96163999999993, "r": 391.60071, "b": 374.64301, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "23", "text": "23"}, {"self_ref": "#/texts/301", "parent": {"cref": "#/pictures/10"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 398.52341, "t": 380.96163999999993, "r": 404.84271, "b": 374.64301, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "24", "text": "24"}, {"self_ref": "#/texts/302", "parent": {"cref": "#/pictures/10"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 411.47604, "t": 380.96163999999993, "r": 417.79535, "b": 374.64301, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "25", "text": "25"}, {"self_ref": "#/texts/303", "parent": {"cref": "#/pictures/10"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 437.37939, "t": 380.96163999999993, "r": 443.69870000000003, "b": 374.64301, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "26", "text": "26"}, {"self_ref": "#/texts/304", "parent": {"cref": "#/pictures/10"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 450.33203, "t": 380.96163999999993, "r": 456.6513100000001, "b": 374.64301, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "27", "text": "27"}, {"self_ref": "#/texts/305", "parent": {"cref": "#/pictures/10"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 463.28464, "t": 380.96163999999993, "r": 469.60394, "b": 374.64301, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "28", "text": "28"}, {"self_ref": "#/texts/306", "parent": {"cref": "#/pictures/10"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 385.2814, "t": 370.9303, "r": 391.60071, "b": 364.61166, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "30", "text": "30"}, {"self_ref": "#/texts/307", "parent": {"cref": "#/pictures/10"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 398.52341, "t": 370.9303, "r": 404.84271, "b": 364.61166, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "31", "text": "31"}, {"self_ref": "#/texts/308", "parent": {"cref": "#/pictures/10"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 411.47604, "t": 370.9303, "r": 417.79532, "b": 364.61166, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "32", "text": "32"}, {"self_ref": "#/texts/309", "parent": {"cref": "#/pictures/10"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 424.42865, "t": 370.9303, "r": 430.74796, "b": 364.61166, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "33", "text": "33"}, {"self_ref": "#/texts/310", "parent": {"cref": "#/pictures/10"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 437.38129, "t": 370.9303, "r": 443.70056, "b": 364.61166, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "34", "text": "34"}, {"self_ref": "#/texts/311", "parent": {"cref": "#/pictures/10"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 450.33389000000005, "t": 370.9303, "r": 456.65319999999997, "b": 364.61166, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "35", "text": "35"}, {"self_ref": "#/texts/312", "parent": {"cref": "#/pictures/10"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 463.2865, "t": 370.9303, "r": 469.6058, "b": 364.61166, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "36", "text": "36"}, {"self_ref": "#/texts/313", "parent": {"cref": "#/pictures/10"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 476.23914, "t": 370.9303, "r": 482.55841, "b": 364.61166, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "37", "text": "37"}, {"self_ref": "#/texts/314", "parent": {"cref": "#/pictures/10"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 489.1917700000001, "t": 370.9303, "r": 495.51105, "b": 364.61166, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "38", "text": "38"}, {"self_ref": "#/texts/315", "parent": {"cref": "#/pictures/10"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 502.14438, "t": 370.9303, "r": 508.46368, "b": 364.61166, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "39", "text": "39"}, {"self_ref": "#/texts/316", "parent": {"cref": "#/pictures/10"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 515.09705, "t": 370.9303, "r": 521.41632, "b": 364.61166, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "40", "text": "40"}, {"self_ref": "#/texts/317", "parent": {"cref": "#/pictures/10"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 528.04962, "t": 370.9303, "r": 534.3689, "b": 364.61166, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "41", "text": "41"}, {"self_ref": "#/texts/318", "parent": {"cref": "#/pictures/10"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 385.2814, "t": 359.95569, "r": 391.60071, "b": 353.63705, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "42", "text": "42"}, {"self_ref": "#/texts/319", "parent": {"cref": "#/pictures/10"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 398.52341, "t": 359.95569, "r": 404.84271, "b": 353.63705, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "43", "text": "43"}, {"self_ref": "#/texts/320", "parent": {"cref": "#/pictures/10"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 411.47604, "t": 359.95569, "r": 417.79532, "b": 353.63705, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "44", "text": "44"}, {"self_ref": "#/texts/321", "parent": {"cref": "#/pictures/10"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 424.42865, "t": 359.95569, "r": 430.74796, "b": 353.63705, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "45", "text": "45"}, {"self_ref": "#/texts/322", "parent": {"cref": "#/pictures/10"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 437.38129, "t": 359.95569, "r": 443.70056, "b": 353.63705, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "46", "text": "46"}, {"self_ref": "#/texts/323", "parent": {"cref": "#/pictures/10"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 450.33389000000005, "t": 359.95569, "r": 456.65319999999997, "b": 353.63705, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "47", "text": "47"}, {"self_ref": "#/texts/324", "parent": {"cref": "#/pictures/10"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 463.2865, "t": 359.95569, "r": 469.6058, "b": 353.63705, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "48", "text": "48"}, {"self_ref": "#/texts/325", "parent": {"cref": "#/pictures/10"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 476.23914, "t": 359.95569, "r": 482.55841, "b": 353.63705, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "49", "text": "49"}, {"self_ref": "#/texts/326", "parent": {"cref": "#/pictures/10"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 489.1917700000001, "t": 359.95569, "r": 495.51105, "b": 353.63705, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "50", "text": "50"}, {"self_ref": "#/texts/327", "parent": {"cref": "#/pictures/10"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 502.14438, "t": 359.95569, "r": 508.46368, "b": 353.63705, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "51", "text": "51"}, {"self_ref": "#/texts/328", "parent": {"cref": "#/pictures/10"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 515.09705, "t": 359.95569, "r": 521.41632, "b": 353.63705, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "52", "text": "52"}, {"self_ref": "#/texts/329", "parent": {"cref": "#/pictures/10"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 528.04962, "t": 359.95569, "r": 534.3689, "b": 353.63705, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "53", "text": "53"}, {"self_ref": "#/texts/330", "parent": {"cref": "#/pictures/10"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 385.2814, "t": 402.79996, "r": 388.44073, "b": 396.48132, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "0", "text": "0"}, {"self_ref": "#/texts/331", "parent": {"cref": "#/pictures/10"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 398.52341, "t": 402.79996, "r": 401.68274, "b": 396.48132, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "1", "text": "1"}, {"self_ref": "#/texts/332", "parent": {"cref": "#/pictures/10"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 411.4754, "t": 402.79996, "r": 414.63474, "b": 396.48132, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "2", "text": "2"}, {"self_ref": "#/texts/333", "parent": {"cref": "#/pictures/10"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 424.4274, "t": 402.79996, "r": 427.58673, "b": 396.48132, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "3", "text": "3"}, {"self_ref": "#/texts/334", "parent": {"cref": "#/pictures/10"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 437.37939, "t": 402.79996, "r": 440.53870000000006, "b": 396.48132, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "4", "text": "4"}, {"self_ref": "#/texts/335", "parent": {"cref": "#/pictures/10"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 450.33136, "t": 402.79996, "r": 453.49069000000003, "b": 396.48132, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "5", "text": "5"}, {"self_ref": "#/texts/336", "parent": {"cref": "#/pictures/10"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 463.28336, "t": 402.79996, "r": 466.44269, "b": 396.48132, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "6", "text": "6"}, {"self_ref": "#/texts/337", "parent": {"cref": "#/pictures/10"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 476.23535, "t": 402.79996, "r": 479.39468, "b": 396.48132, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "7", "text": "7"}, {"self_ref": "#/texts/338", "parent": {"cref": "#/pictures/10"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 489.18735, "t": 402.79996, "r": 492.34668, "b": 396.48132, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "8", "text": "8"}, {"self_ref": "#/texts/339", "parent": {"cref": "#/pictures/10"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 502.13933999999995, "t": 402.79996, "r": 505.29868000000005, "b": 396.48132, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "9", "text": "9"}, {"self_ref": "#/texts/340", "parent": {"cref": "#/pictures/10"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 515.09131, "t": 402.79996, "r": 521.41064, "b": 396.48132, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "10", "text": "10"}, {"self_ref": "#/texts/341", "parent": {"cref": "#/pictures/10"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 528.04364, "t": 402.79996, "r": 534.13104, "b": 396.48132, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "11", "text": "11"}, {"self_ref": "#/texts/342", "parent": {"cref": "#/pictures/10"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 385.2814, "t": 393.02536, "r": 391.60071, "b": 386.70673, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "12", "text": "12"}, {"self_ref": "#/texts/343", "parent": {"cref": "#/pictures/10"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 398.52341, "t": 393.02536, "r": 404.84271, "b": 386.70673, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "13", "text": "13"}, {"self_ref": "#/texts/344", "parent": {"cref": "#/pictures/10"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 411.47604, "t": 393.02536, "r": 417.79535, "b": 386.70673, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "14", "text": "14"}, {"self_ref": "#/texts/345", "parent": {"cref": "#/pictures/10"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 424.42719, "t": 385.22536999999994, "r": 430.74648999999994, "b": 378.90674, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "15", "text": "15"}, {"self_ref": "#/texts/346", "parent": {"cref": "#/pictures/10"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 502.86941999999993, "t": 381.00562, "r": 509.18871999999993, "b": 374.68698, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "29", "text": "29"}, {"self_ref": "#/texts/347", "parent": {"cref": "#/pictures/10"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 384.35437, "t": 410.22278, "r": 430.99261, "b": 405.55719, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 19]}], "orig": "Predicted Structure", "text": "Predicted Structure"}, {"self_ref": "#/texts/348", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "section_header", "prov": [{"page_no": 8, "bbox": {"l": 50.112, "t": 300.60464, "r": 163.7558, "b": 290.75259, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 25]}], "orig": "5.5. Qualitative Analysis", "text": "5.5. Qualitative Analysis", "level": 1}, {"self_ref": "#/texts/349", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "section_header", "prov": [{"page_no": 8, "bbox": {"l": 308.862, "t": 301.29108, "r": 460.84848, "b": 290.54337, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 27]}], "orig": "6. Future Work & Conclusion", "text": "6. Future Work & Conclusion", "level": 1}, {"self_ref": "#/texts/350", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 50.112, "t": 255.12662999999998, "r": 286.36511, "b": 78.84805299999994, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 866]}], "orig": "We showcase several visualizations for the different components of our network on various \"complex\" tables within datasets presented in this work in Fig. 5 and Fig. 6 As it is shown, our model is able to predict bounding boxes for all table cells, even for the empty ones. Additionally, our post-processing techniques can extract the cell content by matching the predicted bounding boxes to the PDF cells based on their overlap and spatial proximity. The left part of Fig. 5 demonstrates also the adaptability of our method to any language, as it can successfully extract Japanese text, although the training set contains only English content. We provide more visualizations including the intermediate steps in the supplementary material. Overall these illustrations justify the versatility of our method across a diverse range of table appearances and content type.", "text": "We showcase several visualizations for the different components of our network on various \"complex\" tables within datasets presented in this work in Fig. 5 and Fig. 6 As it is shown, our model is able to predict bounding boxes for all table cells, even for the empty ones. Additionally, our post-processing techniques can extract the cell content by matching the predicted bounding boxes to the PDF cells based on their overlap and spatial proximity. The left part of Fig. 5 demonstrates also the adaptability of our method to any language, as it can successfully extract Japanese text, although the training set contains only English content. We provide more visualizations including the intermediate steps in the supplementary material. Overall these illustrations justify the versatility of our method across a diverse range of table appearances and content type."}, {"self_ref": "#/texts/351", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 308.862, "t": 279.10663, "r": 545.11517, "b": 138.69407999999999, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 640]}], "orig": "In this paper, we presented TableFormer an end-to-end transformer based approach to predict table structures and bounding boxes of cells from an image. This approach enables us to recreate the table structure, and extract the cell content from PDF or OCR by using bounding boxes. Additionally, it provides the versatility required in real-world scenarios when dealing with various types of PDF documents, and languages. Furthermore, our method outperforms all state-of-the-arts with a wide margin. Finally, we introduce \"SynthTabNet\" a challenging synthetically generated dataset that reinforces missing characteristics from other datasets.", "text": "In this paper, we presented TableFormer an end-to-end transformer based approach to predict table structures and bounding boxes of cells from an image. This approach enables us to recreate the table structure, and extract the cell content from PDF or OCR by using bounding boxes. Additionally, it provides the versatility required in real-world scenarios when dealing with various types of PDF documents, and languages. Furthermore, our method outperforms all state-of-the-arts with a wide margin. Finally, we introduce \"SynthTabNet\" a challenging synthetically generated dataset that reinforces missing characteristics from other datasets."}, {"self_ref": "#/texts/352", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "section_header", "prov": [{"page_no": 8, "bbox": {"l": 308.862, "t": 119.90107999999998, "r": 364.40585, "b": 109.15336000000002, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 10]}], "orig": "References", "text": "References", "level": 1}, {"self_ref": "#/texts/353", "parent": {"cref": "#/groups/4"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 8, "bbox": {"l": 313.345, "t": 98.03820799999994, "r": 545.1134, "b": 79.06324800000004, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 121]}], "orig": "[1] Nicolas Carion, Francisco Massa, Gabriel Synnaeve, Nicolas Usunier, Alexander Kirillov, and Sergey Zagoruyko. End-to-", "text": "[1] Nicolas Carion, Francisco Massa, Gabriel Synnaeve, Nicolas Usunier, Alexander Kirillov, and Sergey Zagoruyko. End-to-", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/354", "parent": {"cref": "#/body"}, "children": [], "content_layer": "furniture", "label": "page_footer", "prov": [{"page_no": 8, "bbox": {"l": 295.121, "t": 57.866633999999976, "r": 300.10229, "b": 48.96007199999997, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "8", "text": "8"}, {"self_ref": "#/texts/355", "parent": {"cref": "#/groups/5"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 9, "bbox": {"l": 70.030998, "t": 716.11621, "r": 286.36334, "b": 675.22424, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 212]}], "orig": "end object detection with transformers. In Andrea Vedaldi, Horst Bischof, Thomas Brox, and Jan-Michael Frahm, editors, Computer Vision - ECCV 2020 , pages 213-229, Cham, 2020. Springer International Publishing. 5", "text": "end object detection with transformers. In Andrea Vedaldi, Horst Bischof, Thomas Brox, and Jan-Michael Frahm, editors, Computer Vision - ECCV 2020 , pages 213-229, Cham, 2020. Springer International Publishing. 5", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/356", "parent": {"cref": "#/groups/5"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 9, "bbox": {"l": 54.595005, "t": 671.9682599999999, "r": 286.36334, "b": 642.0343, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 165]}], "orig": "[2] Zewen Chi, Heyan Huang, Heng-Da Xu, Houjin Yu, Wanxuan Yin, and Xian-Ling Mao. Complicated table structure recognition. arXiv preprint arXiv:1908.04729 , 2019. 3", "text": "[2] Zewen Chi, Heyan Huang, Heng-Da Xu, Houjin Yu, Wanxuan Yin, and Xian-Ling Mao. Complicated table structure recognition. arXiv preprint arXiv:1908.04729 , 2019. 3", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/357", "parent": {"cref": "#/groups/5"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 9, "bbox": {"l": 54.595001, "t": 638.77832, "r": 286.36301, "b": 608.84534, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 125]}], "orig": "[3] Bertrand Couasnon and Aurelie Lemaitre. Recognition of Tables and Forms , pages 647-677. Springer London, London, 2014. 2", "text": "[3] Bertrand Couasnon and Aurelie Lemaitre. Recognition of Tables and Forms , pages 647-677. Springer London, London, 2014. 2", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/358", "parent": {"cref": "#/groups/5"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 9, "bbox": {"l": 54.59499, "t": 605.58936, "r": 286.36401, "b": 564.69641, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 216]}], "orig": "[4] Herv\u00b4e D\u00b4ejean, Jean-Luc Meunier, Liangcai Gao, Yilun Huang, Yu Fang, Florian Kleber, and Eva-Maria Lang. ICDAR 2019 Competition on Table Detection and Recognition (cTDaR), Apr. 2019. http://sac.founderit.com/. 2", "text": "[4] Herv\u00b4e D\u00b4ejean, Jean-Luc Meunier, Liangcai Gao, Yilun Huang, Yu Fang, Florian Kleber, and Eva-Maria Lang. ICDAR 2019 Competition on Table Detection and Recognition (cTDaR), Apr. 2019. http://sac.founderit.com/. 2", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/359", "parent": {"cref": "#/groups/5"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 9, "bbox": {"l": 54.594982, "t": 561.44043, "r": 286.36334, "b": 520.54846, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 236]}], "orig": "[5] Basilios Gatos, Dimitrios Danatsas, Ioannis Pratikakis, and Stavros J Perantonis. Automatic table detection in document images. In International Conference on Pattern Recognition and Image Analysis , pages 609-618. Springer, 2005. 2", "text": "[5] Basilios Gatos, Dimitrios Danatsas, Ioannis Pratikakis, and Stavros J Perantonis. Automatic table detection in document images. In International Conference on Pattern Recognition and Image Analysis , pages 609-618. Springer, 2005. 2", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/360", "parent": {"cref": "#/groups/5"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 9, "bbox": {"l": 54.594971, "t": 517.29242, "r": 286.36676, "b": 476.3995100000001, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 194]}], "orig": "[6] Max G\u00a8obel, Tamir Hassan, Ermelinda Oro, and Giorgio Orsi. Icdar 2013 table competition. In 2013 12th International Conference on Document Analysis and Recognition , pages 1449-1453, 2013. 2", "text": "[6] Max G\u00a8obel, Tamir Hassan, Ermelinda Oro, and Giorgio Orsi. Icdar 2013 table competition. In 2013 12th International Conference on Document Analysis and Recognition , pages 1449-1453, 2013. 2", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/361", "parent": {"cref": "#/groups/5"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 9, "bbox": {"l": 54.59499, "t": 473.14346, "r": 286.36319, "b": 443.21048, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 165]}], "orig": "[7] EA Green and M Krishnamoorthy. Recognition of tables using table grammars. procs. In Symposium on Document Analysis and Recognition (SDAIR'95) , pages 261-277. 2", "text": "[7] EA Green and M Krishnamoorthy. Recognition of tables using table grammars. procs. In Symposium on Document Analysis and Recognition (SDAIR'95) , pages 261-277. 2", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/362", "parent": {"cref": "#/groups/5"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 9, "bbox": {"l": 54.594986000000006, "t": 439.9544399999999, "r": 286.36331, "b": 388.10251, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 273]}], "orig": "[8] Khurram Azeem Hashmi, Alain Pagani, Marcus Liwicki, Didier Stricker, and Muhammad Zeshan Afzal. Castabdetectors: Cascade network for table detection in document images with recursive feature pyramid and switchable atrous convolution. Journal of Imaging , 7(10), 2021. 1", "text": "[8] Khurram Azeem Hashmi, Alain Pagani, Marcus Liwicki, Didier Stricker, and Muhammad Zeshan Afzal. Castabdetectors: Cascade network for table detection in document images with recursive feature pyramid and switchable atrous convolution. Journal of Imaging , 7(10), 2021. 1", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/363", "parent": {"cref": "#/groups/5"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 9, "bbox": {"l": 54.595001, "t": 384.84746999999993, "r": 286.35989, "b": 354.91353999999995, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 170]}], "orig": "[9] Kaiming He, Georgia Gkioxari, Piotr Dollar, and Ross Girshick. Mask r-cnn. In Proceedings of the IEEE International Conference on Computer Vision (ICCV) , Oct 2017. 1", "text": "[9] Kaiming He, Georgia Gkioxari, Piotr Dollar, and Ross Girshick. Mask r-cnn. In Proceedings of the IEEE International Conference on Computer Vision (ICCV) , Oct 2017. 1", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/364", "parent": {"cref": "#/groups/5"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 9, "bbox": {"l": 50.112, "t": 351.6575000000001, "r": 286.36334, "b": 310.76456, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 226]}], "orig": "[10] Yelin He, X. Qi, Jiaquan Ye, Peng Gao, Yihao Chen, Bingcong Li, Xin Tang, and Rong Xiao. Pingan-vcgroup's solution for icdar 2021 competition on scientific table image recognition to latex. ArXiv , abs/2105.01846, 2021. 2", "text": "[10] Yelin He, X. Qi, Jiaquan Ye, Peng Gao, Yihao Chen, Bingcong Li, Xin Tang, and Rong Xiao. Pingan-vcgroup's solution for icdar 2021 competition on scientific table image recognition to latex. ArXiv , abs/2105.01846, 2021. 2", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/365", "parent": {"cref": "#/groups/5"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 9, "bbox": {"l": 50.112, "t": 307.50952, "r": 286.36331, "b": 255.65761999999995, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 239]}], "orig": "[11] Jianying Hu, Ramanujan S Kashi, Daniel P Lopresti, and Gordon Wilfong. Medium-independent table detection. In Document Recognition and Retrieval VII , volume 3967, pages 291-302. International Society for Optics and Photonics, 1999. 2", "text": "[11] Jianying Hu, Ramanujan S Kashi, Daniel P Lopresti, and Gordon Wilfong. Medium-independent table detection. In Document Recognition and Retrieval VII , volume 3967, pages 291-302. International Society for Optics and Photonics, 1999. 2", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/366", "parent": {"cref": "#/groups/5"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 9, "bbox": {"l": 50.112007, "t": 252.40157999999997, "r": 286.36334, "b": 200.55062999999996, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 240]}], "orig": "[12] Matthew Hurst. A constraint-based approach to table structure derivation. In Proceedings of the Seventh International Conference on Document Analysis and Recognition - Volume 2 , ICDAR '03, page 911, USA, 2003. IEEE Computer Society. 2", "text": "[12] Matthew Hurst. A constraint-based approach to table structure derivation. In Proceedings of the Seventh International Conference on Document Analysis and Recognition - Volume 2 , ICDAR '03, page 911, USA, 2003. IEEE Computer Society. 2", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/367", "parent": {"cref": "#/groups/5"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 9, "bbox": {"l": 50.112007, "t": 197.29458999999997, "r": 286.36331, "b": 145.44263, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 283]}], "orig": "[13] Thotreingam Kasar, Philippine Barlas, Sebastien Adam, Cl\u00b4ement Chatelain, and Thierry Paquet. Learning to detect tables in scanned document images using line information. In 2013 12th International Conference on Document Analysis and Recognition , pages 1185-1189. IEEE, 2013. 2", "text": "[13] Thotreingam Kasar, Philippine Barlas, Sebastien Adam, Cl\u00b4ement Chatelain, and Thierry Paquet. Learning to detect tables in scanned document images using line information. In 2013 12th International Conference on Document Analysis and Recognition , pages 1185-1189. IEEE, 2013. 2", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/368", "parent": {"cref": "#/groups/5"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 9, "bbox": {"l": 50.111992, "t": 142.18658000000005, "r": 286.36334, "b": 112.25361999999996, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 142]}], "orig": "[14] Pratik Kayal, Mrinal Anand, Harsh Desai, and Mayank Singh. Icdar 2021 competition on scientific table image recognition to latex, 2021. 2", "text": "[14] Pratik Kayal, Mrinal Anand, Harsh Desai, and Mayank Singh. Icdar 2021 competition on scientific table image recognition to latex, 2021. 2", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/369", "parent": {"cref": "#/groups/5"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 9, "bbox": {"l": 50.111992, "t": 108.99757, "r": 286.35931, "b": 79.06361400000003, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 127]}], "orig": "[15] Harold W Kuhn. The hungarian method for the assignment problem. Naval research logistics quarterly , 2(1-2):83-97, 1955. 6", "text": "[15] Harold W Kuhn. The hungarian method for the assignment problem. Naval research logistics quarterly , 2(1-2):83-97, 1955. 6", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/370", "parent": {"cref": "#/groups/5"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 9, "bbox": {"l": 308.86197, "t": 716.1165799999999, "r": 545.11475, "b": 653.30664, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 287]}], "orig": "[16] Girish Kulkarni, Visruth Premraj, Vicente Ordonez, Sagnik Dhar, Siming Li, Yejin Choi, Alexander C. Berg, and Tamara L. Berg. Babytalk: Understanding and generating simple image descriptions. IEEE Transactions on Pattern Analysis and Machine Intelligence , 35(12):2891-2903, 2013. 4", "text": "[16] Girish Kulkarni, Visruth Premraj, Vicente Ordonez, Sagnik Dhar, Siming Li, Yejin Choi, Alexander C. Berg, and Tamara L. Berg. Babytalk: Understanding and generating simple image descriptions. IEEE Transactions on Pattern Analysis and Machine Intelligence , 35(12):2891-2903, 2013. 4", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/371", "parent": {"cref": "#/groups/5"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 9, "bbox": {"l": 308.862, "t": 649.87665, "r": 545.1134, "b": 619.94366, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 156]}], "orig": "[17] Minghao Li, Lei Cui, Shaohan Huang, Furu Wei, Ming Zhou, and Zhoujun Li. Tablebank: A benchmark dataset for table detection and recognition, 2019. 2, 3", "text": "[17] Minghao Li, Lei Cui, Shaohan Huang, Furu Wei, Ming Zhou, and Zhoujun Li. Tablebank: A benchmark dataset for table detection and recognition, 2019. 2, 3", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/372", "parent": {"cref": "#/groups/5"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 9, "bbox": {"l": 308.862, "t": 616.51367, "r": 545.11353, "b": 531.78577, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 407]}], "orig": "[18] Yiren Li, Zheng Huang, Junchi Yan, Yi Zhou, Fan Ye, and Xianhui Liu. Gfte: Graph-based financial table extraction. In Alberto Del Bimbo, Rita Cucchiara, Stan Sclaroff, Giovanni Maria Farinella, Tao Mei, Marco Bertini, Hugo Jair Escalante, and Roberto Vezzani, editors, Pattern Recognition. ICPR International Workshops and Challenges , pages 644-658, Cham, 2021. Springer International Publishing. 2, 3", "text": "[18] Yiren Li, Zheng Huang, Junchi Yan, Yi Zhou, Fan Ye, and Xianhui Liu. Gfte: Graph-based financial table extraction. In Alberto Del Bimbo, Rita Cucchiara, Stan Sclaroff, Giovanni Maria Farinella, Tao Mei, Marco Bertini, Hugo Jair Escalante, and Roberto Vezzani, editors, Pattern Recognition. ICPR International Workshops and Challenges , pages 644-658, Cham, 2021. Springer International Publishing. 2, 3", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/373", "parent": {"cref": "#/groups/5"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 9, "bbox": {"l": 308.862, "t": 528.35577, "r": 545.1142, "b": 465.54587, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 328]}], "orig": "[19] Nikolaos Livathinos, Cesar Berrospi, Maksym Lysak, Viktor Kuropiatnyk, Ahmed Nassar, Andre Carvalho, Michele Dolfi, Christoph Auer, Kasper Dinkla, and Peter Staar. Robust pdf document conversion using recurrent neural networks. Proceedings of the AAAI Conference on Artificial Intelligence , 35(17):15137-15145, May 2021. 1", "text": "[19] Nikolaos Livathinos, Cesar Berrospi, Maksym Lysak, Viktor Kuropiatnyk, Ahmed Nassar, Andre Carvalho, Michele Dolfi, Christoph Auer, Kasper Dinkla, and Peter Staar. Robust pdf document conversion using recurrent neural networks. Proceedings of the AAAI Conference on Artificial Intelligence , 35(17):15137-15145, May 2021. 1", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/374", "parent": {"cref": "#/groups/5"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 9, "bbox": {"l": 308.862, "t": 462.11581, "r": 545.11609, "b": 421.22287, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 229]}], "orig": "[20] Rujiao Long, Wen Wang, Nan Xue, Feiyu Gao, Zhibo Yang, Yongpan Wang, and Gui-Song Xia. Parsing table structures in the wild. In Proceedings of the IEEE/CVF International Conference on Computer Vision , pages 944-952, 2021. 2", "text": "[20] Rujiao Long, Wen Wang, Nan Xue, Feiyu Gao, Zhibo Yang, Yongpan Wang, and Gui-Song Xia. Parsing table structures in the wild. In Proceedings of the IEEE/CVF International Conference on Computer Vision , pages 944-952, 2021. 2", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/375", "parent": {"cref": "#/groups/5"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 9, "bbox": {"l": 308.862, "t": 417.79382, "r": 545.11346, "b": 354.98294, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 315]}], "orig": "[21] Shubham Singh Paliwal, D Vishwanath, Rohit Rahul, Monika Sharma, and Lovekesh Vig. Tablenet: Deep learning model for end-to-end table detection and tabular data extraction from scanned document images. In 2019 International Conference on Document Analysis and Recognition (ICDAR) , pages 128-133. IEEE, 2019. 1", "text": "[21] Shubham Singh Paliwal, D Vishwanath, Rohit Rahul, Monika Sharma, and Lovekesh Vig. Tablenet: Deep learning model for end-to-end table detection and tabular data extraction from scanned document images. In 2019 International Conference on Document Analysis and Recognition (ICDAR) , pages 128-133. IEEE, 2019. 1", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/376", "parent": {"cref": "#/groups/5"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 9, "bbox": {"l": 308.862, "t": 351.55389, "r": 545.11475, "b": 233.94903999999997, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 592]}], "orig": "[22] Adam Paszke, Sam Gross, Francisco Massa, Adam Lerer, James Bradbury, Gregory Chanan, Trevor Killeen, Zeming Lin, Natalia Gimelshein, Luca Antiga, Alban Desmaison, Andreas Kopf, Edward Yang, Zachary DeVito, Martin Raison, Alykhan Tejani, Sasank Chilamkurthy, Benoit Steiner, Lu Fang, Junjie Bai, and Soumith Chintala. Pytorch: An imperative style, high-performance deep learning library. In H. Wallach, H. Larochelle, A. Beygelzimer, F. d'Alch\u00b4e-Buc, E. Fox, and R. Garnett, editors, Advances in Neural Information Processing Systems 32 , pages 8024-8035. Curran Associates, Inc., 2019. 6", "text": "[22] Adam Paszke, Sam Gross, Francisco Massa, Adam Lerer, James Bradbury, Gregory Chanan, Trevor Killeen, Zeming Lin, Natalia Gimelshein, Luca Antiga, Alban Desmaison, Andreas Kopf, Edward Yang, Zachary DeVito, Martin Raison, Alykhan Tejani, Sasank Chilamkurthy, Benoit Steiner, Lu Fang, Junjie Bai, and Soumith Chintala. Pytorch: An imperative style, high-performance deep learning library. In H. Wallach, H. Larochelle, A. Beygelzimer, F. d'Alch\u00b4e-Buc, E. Fox, and R. Garnett, editors, Advances in Neural Information Processing Systems 32 , pages 8024-8035. Curran Associates, Inc., 2019. 6", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/377", "parent": {"cref": "#/groups/5"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 9, "bbox": {"l": 308.862, "t": 230.519, "r": 545.1134, "b": 167.70902999999998, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 322]}], "orig": "[23] Devashish Prasad, Ayan Gadpal, Kshitij Kapadni, Manish Visave, and Kavita Sultanpure. Cascadetabnet: An approach for end to end table detection and structure recognition from image-based documents. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition Workshops , pages 572-573, 2020. 1", "text": "[23] Devashish Prasad, Ayan Gadpal, Kshitij Kapadni, Manish Visave, and Kavita Sultanpure. Cascadetabnet: An approach for end to end table detection and structure recognition from image-based documents. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition Workshops , pages 572-573, 2020. 1", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/378", "parent": {"cref": "#/groups/5"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 9, "bbox": {"l": 308.862, "t": 164.27899000000002, "r": 545.11621, "b": 123.38602000000003, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 224]}], "orig": "[24] Shah Rukh Qasim, Hassan Mahmood, and Faisal Shafait. Rethinking table recognition using graph neural networks. In 2019 International Conference on Document Analysis and Recognition (ICDAR) , pages 142-147. IEEE, 2019. 3", "text": "[24] Shah Rukh Qasim, Hassan Mahmood, and Faisal Shafait. Rethinking table recognition using graph neural networks. In 2019 International Conference on Document Analysis and Recognition (ICDAR) , pages 142-147. IEEE, 2019. 3", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/379", "parent": {"cref": "#/groups/5"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 9, "bbox": {"l": 308.86203, "t": 119.95699000000002, "r": 545.1134, "b": 79.06402600000001, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 229]}], "orig": "[25] Hamid Rezatofighi, Nathan Tsoi, JunYoung Gwak, Amir Sadeghian, Ian Reid, and Silvio Savarese. Generalized intersection over union: A metric and a loss for bounding box regression. In Proceedings of the IEEE/CVF Conference on", "text": "[25] Hamid Rezatofighi, Nathan Tsoi, JunYoung Gwak, Amir Sadeghian, Ian Reid, and Silvio Savarese. Generalized intersection over union: A metric and a loss for bounding box regression. In Proceedings of the IEEE/CVF Conference on", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/380", "parent": {"cref": "#/body"}, "children": [], "content_layer": "furniture", "label": "page_footer", "prov": [{"page_no": 9, "bbox": {"l": 295.12103, "t": 57.86741299999994, "r": 300.10233, "b": 48.96084999999994, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "9", "text": "9"}, {"self_ref": "#/texts/381", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 70.030998, "t": 716.11621, "r": 286.36176, "b": 697.14124, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 64]}], "orig": "Computer Vision and Pattern Recognition , pages 658-666, 2019. 6", "text": "Computer Vision and Pattern Recognition , pages 658-666, 2019. 6"}, {"self_ref": "#/texts/382", "parent": {"cref": "#/groups/6"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 10, "bbox": {"l": 50.112007, "t": 693.83423, "r": 286.36578, "b": 631.02332, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 302]}], "orig": "[26] Sebastian Schreiber, Stefan Agne, Ivo Wolf, Andreas Dengel, and Sheraz Ahmed. Deepdesrt: Deep learning for detection and structure recognition of tables in document images. In 2017 14th IAPR International Conference on Document Analysis and Recognition (ICDAR) , volume 01, pages 11621167, 2017. 1", "text": "[26] Sebastian Schreiber, Stefan Agne, Ivo Wolf, Andreas Dengel, and Sheraz Ahmed. Deepdesrt: Deep learning for detection and structure recognition of tables in document images. In 2017 14th IAPR International Conference on Document Analysis and Recognition (ICDAR) , volume 01, pages 11621167, 2017. 1", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/383", "parent": {"cref": "#/groups/6"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 10, "bbox": {"l": 50.112007, "t": 627.71533, "r": 286.36337, "b": 564.9054, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 308]}], "orig": "[27] Sebastian Schreiber, Stefan Agne, Ivo Wolf, Andreas Dengel, and Sheraz Ahmed. Deepdesrt: Deep learning for detection and structure recognition of tables in document images. In 2017 14th IAPR international conference on document analysis and recognition (ICDAR) , volume 1, pages 1162-1167. IEEE, 2017. 3", "text": "[27] Sebastian Schreiber, Stefan Agne, Ivo Wolf, Andreas Dengel, and Sheraz Ahmed. Deepdesrt: Deep learning for detection and structure recognition of tables in document images. In 2017 14th IAPR international conference on document analysis and recognition (ICDAR) , volume 1, pages 1162-1167. IEEE, 2017. 3", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/384", "parent": {"cref": "#/groups/6"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 10, "bbox": {"l": 50.112007, "t": 561.59741, "r": 286.36578, "b": 520.70447, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 183]}], "orig": "[28] Faisal Shafait and Ray Smith. Table detection in heterogeneous documents. In Proceedings of the 9th IAPR International Workshop on Document Analysis Systems , pages 6572, 2010. 2", "text": "[28] Faisal Shafait and Ray Smith. Table detection in heterogeneous documents. In Proceedings of the 9th IAPR International Workshop on Document Analysis Systems , pages 6572, 2010. 2", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/385", "parent": {"cref": "#/groups/6"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 10, "bbox": {"l": 50.112007, "t": 517.39642, "r": 286.36627, "b": 465.5455, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 275]}], "orig": "[29] Shoaib Ahmed Siddiqui, Imran Ali Fateh, Syed Tahseen Raza Rizvi, Andreas Dengel, and Sheraz Ahmed. Deeptabstr: Deep learning based table structure recognition. In 2019 International Conference on Document Analysis and Recognition (ICDAR) , pages 1403-1409. IEEE, 2019. 3", "text": "[29] Shoaib Ahmed Siddiqui, Imran Ali Fateh, Syed Tahseen Raza Rizvi, Andreas Dengel, and Sheraz Ahmed. Deeptabstr: Deep learning based table structure recognition. In 2019 International Conference on Document Analysis and Recognition (ICDAR) , pages 1403-1409. IEEE, 2019. 3", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/386", "parent": {"cref": "#/groups/6"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 10, "bbox": {"l": 50.112007, "t": 462.23746, "r": 286.36334, "b": 410.38553, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 251]}], "orig": "[30] Peter W J Staar, Michele Dolfi, Christoph Auer, and Costas Bekas. Corpus conversion service: A machine learning platform to ingest documents at scale. In Proceedings of the 24th ACM SIGKDD , KDD '18, pages 774-782, New York, NY, USA, 2018. ACM. 1", "text": "[30] Peter W J Staar, Michele Dolfi, Christoph Auer, and Costas Bekas. Corpus conversion service: A machine learning platform to ingest documents at scale. In Proceedings of the 24th ACM SIGKDD , KDD '18, pages 774-782, New York, NY, USA, 2018. ACM. 1", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/387", "parent": {"cref": "#/groups/6"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 10, "bbox": {"l": 50.112007, "t": 407.07748, "r": 286.36389, "b": 333.30856, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 366]}], "orig": "[31] Ashish Vaswani, Noam Shazeer, Niki Parmar, Jakob Uszkoreit, Llion Jones, Aidan N Gomez, \u0141 ukasz Kaiser, and Illia Polosukhin. Attention is all you need. In I. Guyon, U. V. Luxburg, S. Bengio, H. Wallach, R. Fergus, S. Vishwanathan, and R. Garnett, editors, Advances in Neural Information Processing Systems 30 , pages 5998-6008. Curran Associates, Inc., 2017. 5", "text": "[31] Ashish Vaswani, Noam Shazeer, Niki Parmar, Jakob Uszkoreit, Llion Jones, Aidan N Gomez, \u0141 ukasz Kaiser, and Illia Polosukhin. Attention is all you need. In I. Guyon, U. V. Luxburg, S. Bengio, H. Wallach, R. Fergus, S. Vishwanathan, and R. Garnett, editors, Advances in Neural Information Processing Systems 30 , pages 5998-6008. Curran Associates, Inc., 2017. 5", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/388", "parent": {"cref": "#/groups/6"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 10, "bbox": {"l": 50.112007, "t": 330.00052, "r": 286.36334, "b": 289.10757, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 221]}], "orig": "[32] Oriol Vinyals, Alexander Toshev, Samy Bengio, and Dumitru Erhan. Show and tell: A neural image caption generator. In Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR) , June 2015. 2", "text": "[32] Oriol Vinyals, Alexander Toshev, Samy Bengio, and Dumitru Erhan. Show and tell: A neural image caption generator. In Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR) , June 2015. 2", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/389", "parent": {"cref": "#/groups/6"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 10, "bbox": {"l": 50.112015, "t": 285.79953, "r": 286.36337, "b": 244.90756, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 217]}], "orig": "[33] Wenyuan Xue, Qingyong Li, and Dacheng Tao. Res2tim: reconstruct syntactic structures from table images. In 2019 International Conference on Document Analysis and Recognition (ICDAR) , pages 749-755. IEEE, 2019. 3", "text": "[33] Wenyuan Xue, Qingyong Li, and Dacheng Tao. Res2tim: reconstruct syntactic structures from table images. In 2019 International Conference on Document Analysis and Recognition (ICDAR) , pages 749-755. IEEE, 2019. 3", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/390", "parent": {"cref": "#/groups/6"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 10, "bbox": {"l": 50.112022, "t": 241.59951999999998, "r": 286.36337, "b": 200.70655999999997, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 190]}], "orig": "[34] Wenyuan Xue, Baosheng Yu, Wen Wang, Dacheng Tao, and Qingyong Li. Tgrnet: A table graph reconstruction network for table structure recognition. arXiv preprint arXiv:2106.10598 , 2021. 3", "text": "[34] Wenyuan Xue, Baosheng Yu, Wen Wang, Dacheng Tao, and Qingyong Li. Tgrnet: A table graph reconstruction network for table structure recognition. arXiv preprint arXiv:2106.10598 , 2021. 3", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/391", "parent": {"cref": "#/groups/6"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 10, "bbox": {"l": 50.11203, "t": 197.39851, "r": 286.3634, "b": 156.50554999999997, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 220]}], "orig": "[35] Quanzeng You, Hailin Jin, Zhaowen Wang, Chen Fang, and Jiebo Luo. Image captioning with semantic attention. In Proceedings of the IEEE conference on computer vision and pattern recognition , pages 4651-4659, 2016. 4", "text": "[35] Quanzeng You, Hailin Jin, Zhaowen Wang, Chen Fang, and Jiebo Luo. Image captioning with semantic attention. In Proceedings of the IEEE conference on computer vision and pattern recognition , pages 4651-4659, 2016. 4", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/392", "parent": {"cref": "#/groups/6"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 10, "bbox": {"l": 50.112022, "t": 153.19750999999997, "r": 286.36337, "b": 101.34653000000003, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 280]}], "orig": "[36] Xinyi Zheng, Doug Burdick, Lucian Popa, Peter Zhong, and Nancy Xin Ru Wang. Global table extractor (gte): A framework for joint table identification and cell structure recognition using visual context. Winter Conference for Applications in Computer Vision (WACV) , 2021. 2, 3", "text": "[36] Xinyi Zheng, Doug Burdick, Lucian Popa, Peter Zhong, and Nancy Xin Ru Wang. Global table extractor (gte): A framework for joint table identification and cell structure recognition using visual context. Winter Conference for Applications in Computer Vision (WACV) , 2021. 2, 3", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/393", "parent": {"cref": "#/groups/6"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 10, "bbox": {"l": 50.112015, "t": 98.038498, "r": 286.36334, "b": 79.063538, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 106]}], "orig": "[37] Xu Zhong, Elaheh ShafieiBavani, and Antonio Jimeno Yepes. Image-based table recognition: Data, model,", "text": "[37] Xu Zhong, Elaheh ShafieiBavani, and Antonio Jimeno Yepes. Image-based table recognition: Data, model,", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/394", "parent": {"cref": "#/groups/6"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 10, "bbox": {"l": 328.78101, "t": 716.11652, "r": 545.11456, "b": 675.22455, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 192]}], "orig": "and evaluation. In Andrea Vedaldi, Horst Bischof, Thomas Brox, and Jan-Michael Frahm, editors, Computer Vision ECCV 2020 , pages 564-580, Cham, 2020. Springer International Publishing. 2, 3, 7", "text": "and evaluation. In Andrea Vedaldi, Horst Bischof, Thomas Brox, and Jan-Michael Frahm, editors, Computer Vision ECCV 2020 , pages 564-580, Cham, 2020. Springer International Publishing. 2, 3, 7", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/395", "parent": {"cref": "#/groups/6"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 10, "bbox": {"l": 308.862, "t": 671.28552, "r": 545.11334, "b": 630.39258, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 221]}], "orig": "[38] Xu Zhong, Jianbin Tang, and Antonio Jimeno Yepes. Publaynet: Largest dataset ever for document layout analysis. In 2019 International Conference on Document Analysis and Recognition (ICDAR) , pages 1015-1022, 2019. 1", "text": "[38] Xu Zhong, Jianbin Tang, and Antonio Jimeno Yepes. Publaynet: Largest dataset ever for document layout analysis. In 2019 International Conference on Document Analysis and Recognition (ICDAR) , pages 1015-1022, 2019. 1", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/396", "parent": {"cref": "#/body"}, "children": [], "content_layer": "furniture", "label": "page_footer", "prov": [{"page_no": 10, "bbox": {"l": 292.63, "t": 57.86700799999994, "r": 302.59259, "b": 48.96044500000005, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "10", "text": "10"}, {"self_ref": "#/texts/397", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "section_header", "prov": [{"page_no": 11, "bbox": {"l": 132.842, "t": 681.42511, "r": 465.37591999999995, "b": 656.46991, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 83]}], "orig": "TableFormer: Table Structure Understanding with Transformers Supplementary Material", "text": "TableFormer: Table Structure Understanding with Transformers Supplementary Material", "level": 1}, {"self_ref": "#/texts/398", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "section_header", "prov": [{"page_no": 11, "bbox": {"l": 50.111984, "t": 630.83911, "r": 175.96437, "b": 620.09137, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 26]}], "orig": "1. Details on the datasets", "text": "1. Details on the datasets", "level": 1}, {"self_ref": "#/texts/399", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "section_header", "prov": [{"page_no": 11, "bbox": {"l": 50.111984, "t": 611.02069, "r": 150.36401, "b": 601.16864, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 21]}], "orig": "1.1. Data preparation", "text": "1.1. Data preparation", "level": 1}, {"self_ref": "#/texts/400", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 11, "bbox": {"l": 50.111984, "t": 592.07971, "r": 286.36514, "b": 403.84517999999997, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 931]}], "orig": "As a first step of our data preparation process, we have calculated statistics over the datasets across the following dimensions: (1) table size measured in the number of rows and columns, (2) complexity of the table, (3) strictness of the provided HTML structure and (4) completeness (i.e. no omitted bounding boxes). A table is considered to be simple if it does not contain row spans or column spans. Additionally, a table has a strict HTML structure if every row has the same number of columns after taking into account any row or column spans. Therefore a strict HTML structure looks always rectangular. However, HTML is a lenient encoding format, i.e. tables with rows of different sizes might still be regarded as correct due to implicit display rules. These implicit rules leave room for ambiguity, which we want to avoid. As such, we prefer to have \"strict\" tables, i.e. tables where every row has exactly the same length.", "text": "As a first step of our data preparation process, we have calculated statistics over the datasets across the following dimensions: (1) table size measured in the number of rows and columns, (2) complexity of the table, (3) strictness of the provided HTML structure and (4) completeness (i.e. no omitted bounding boxes). A table is considered to be simple if it does not contain row spans or column spans. Additionally, a table has a strict HTML structure if every row has the same number of columns after taking into account any row or column spans. Therefore a strict HTML structure looks always rectangular. However, HTML is a lenient encoding format, i.e. tables with rows of different sizes might still be regarded as correct due to implicit display rules. These implicit rules leave room for ambiguity, which we want to avoid. As such, we prefer to have \"strict\" tables, i.e. tables where every row has exactly the same length."}, {"self_ref": "#/texts/401", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 11, "bbox": {"l": 50.111984, "t": 400.59473, "r": 286.36511, "b": 164.5403, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1149]}], "orig": "We have developed a technique that tries to derive a missing bounding box out of its neighbors. As a first step, we use the annotation data to generate the most fine-grained grid that covers the table structure. In case of strict HTML tables, all grid squares are associated with some table cell and in the presence of table spans a cell extends across multiple grid squares. When enough bounding boxes are known for a rectangular table, it is possible to compute the geometrical border lines between the grid rows and columns. Eventually this information is used to generate the missing bounding boxes. Additionally, the existence of unused grid squares indicates that the table rows have unequal number of columns and the overall structure is non-strict. The generation of missing bounding boxes for non-strict HTML tables is ambiguous and therefore quite challenging. Thus, we have decided to simply discard those tables. In case of PubTabNet we have computed missing bounding boxes for 48% of the simple and 69% of the complex tables. Regarding FinTabNet, 68% of the simple and 98% of the complex tables require the generation of bounding boxes.", "text": "We have developed a technique that tries to derive a missing bounding box out of its neighbors. As a first step, we use the annotation data to generate the most fine-grained grid that covers the table structure. In case of strict HTML tables, all grid squares are associated with some table cell and in the presence of table spans a cell extends across multiple grid squares. When enough bounding boxes are known for a rectangular table, it is possible to compute the geometrical border lines between the grid rows and columns. Eventually this information is used to generate the missing bounding boxes. Additionally, the existence of unused grid squares indicates that the table rows have unequal number of columns and the overall structure is non-strict. The generation of missing bounding boxes for non-strict HTML tables is ambiguous and therefore quite challenging. Thus, we have decided to simply discard those tables. In case of PubTabNet we have computed missing bounding boxes for 48% of the simple and 69% of the complex tables. Regarding FinTabNet, 68% of the simple and 98% of the complex tables require the generation of bounding boxes."}, {"self_ref": "#/texts/402", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 11, "bbox": {"l": 50.111984, "t": 161.28985999999998, "r": 286.36496, "b": 140.42731000000003, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 92]}], "orig": "Figure 7 illustrates the distribution of the tables across different dimensions per dataset.", "text": "Figure 7 illustrates the distribution of the tables across different dimensions per dataset."}, {"self_ref": "#/texts/403", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "section_header", "prov": [{"page_no": 11, "bbox": {"l": 50.111984, "t": 129.60986000000003, "r": 153.60785, "b": 119.75780999999995, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 23]}], "orig": "1.2. Synthetic datasets", "text": "1.2. Synthetic datasets", "level": 1}, {"self_ref": "#/texts/404", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 11, "bbox": {"l": 50.111984, "t": 110.66886999999997, "r": 286.36505, "b": 77.85229500000003, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 167]}, {"page_no": 11, "bbox": {"l": 50.111984, "t": 110.66886999999997, "r": 286.36505, "b": 77.85229500000003, "coord_origin": "BOTTOMLEFT"}, "charspan": [168, 389]}], "orig": "Aiming to train and evaluate our models in a broader spectrum of table data we have synthesized four types of datasets. Each one contains tables with different appear- ances in regard to their size, structure, style and content. Every synthetic dataset contains 150k examples, summing up to 600k synthetic examples. All datasets are divided into Train, Test and Val splits (80%, 10%, 10%).", "text": "Aiming to train and evaluate our models in a broader spectrum of table data we have synthesized four types of datasets. Each one contains tables with different appear- ances in regard to their size, structure, style and content. Every synthetic dataset contains 150k examples, summing up to 600k synthetic examples. All datasets are divided into Train, Test and Val splits (80%, 10%, 10%)."}, {"self_ref": "#/texts/405", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 11, "bbox": {"l": 308.862, "t": 580.76483, "r": 545.11505, "b": 559.90326, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 89]}], "orig": "The process of generating a synthetic dataset can be decomposed into the following steps:", "text": "The process of generating a synthetic dataset can be decomposed into the following steps:"}, {"self_ref": "#/texts/406", "parent": {"cref": "#/groups/7"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 11, "bbox": {"l": 308.862, "t": 556.09479, "r": 545.11511, "b": 475.45721, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 373]}], "orig": "1. Prepare styling and content templates: The styling templates have been manually designed and organized into groups of scope specific appearances (e.g. financial data, marketing data, etc.) Additionally, we have prepared curated collections of content templates by extracting the most frequently used terms out of non-synthetic datasets (e.g. PubTabNet, FinTabNet, etc.).", "text": "1. Prepare styling and content templates: The styling templates have been manually designed and organized into groups of scope specific appearances (e.g. financial data, marketing data, etc.) Additionally, we have prepared curated collections of content templates by extracting the most frequently used terms out of non-synthetic datasets (e.g. PubTabNet, FinTabNet, etc.).", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/407", "parent": {"cref": "#/groups/7"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 11, "bbox": {"l": 308.862, "t": 471.64978, "r": 545.11517, "b": 343.19135, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 573]}], "orig": "2. Generate table structures: The structure of each synthetic dataset assumes a horizontal table header which potentially spans over multiple rows and a table body that may contain a combination of row spans and column spans. However, spans are not allowed to cross the header - body boundary. The table structure is described by the parameters: Total number of table rows and columns, number of header rows, type of spans (header only spans, row only spans, column only spans, both row and column spans), maximum span size and the ratio of the table area covered by spans.", "text": "2. Generate table structures: The structure of each synthetic dataset assumes a horizontal table header which potentially spans over multiple rows and a table body that may contain a combination of row spans and column spans. However, spans are not allowed to cross the header - body boundary. The table structure is described by the parameters: Total number of table rows and columns, number of header rows, type of spans (header only spans, row only spans, column only spans, both row and column spans), maximum span size and the ratio of the table area covered by spans.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/408", "parent": {"cref": "#/groups/7"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 11, "bbox": {"l": 308.862, "t": 339.38391, "r": 545.11517, "b": 294.61139, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 195]}], "orig": "3. Generate content: Based on the dataset theme , a set of suitable content templates is chosen first. Then, this content can be combined with purely random text to produce the synthetic content.", "text": "3. Generate content: Based on the dataset theme , a set of suitable content templates is chosen first. Then, this content can be combined with purely random text to produce the synthetic content.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/409", "parent": {"cref": "#/groups/7"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 11, "bbox": {"l": 308.862, "t": 290.80396, "r": 545.1153, "b": 246.03142000000003, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 218]}], "orig": "4. Apply styling templates: Depending on the domain of the synthetic dataset, a set of styling templates is first manually selected. Then, a style is randomly selected to format the appearance of the synthesized table.", "text": "4. Apply styling templates: Depending on the domain of the synthetic dataset, a set of styling templates is first manually selected. Then, a style is randomly selected to format the appearance of the synthesized table.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/410", "parent": {"cref": "#/groups/7"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 11, "bbox": {"l": 308.862, "t": 242.22397, "r": 545.11517, "b": 185.49640999999997, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 238]}], "orig": "5. Render the complete tables: The synthetic table is finally rendered by a web browser engine to generate the bounding boxes for each table cell. A batching technique is utilized to optimize the runtime overhead of the rendering process.", "text": "5. Render the complete tables: The synthetic table is finally rendered by a web browser engine to generate the bounding boxes for each table cell. A batching technique is utilized to optimize the runtime overhead of the rendering process.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/411", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "section_header", "prov": [{"page_no": 11, "bbox": {"l": 308.862, "t": 169.70940999999993, "r": 545.10876, "b": 145.01369, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 47]}], "orig": "2. Prediction post-processing for PDF documents", "text": "2. Prediction post-processing for PDF documents", "level": 1}, {"self_ref": "#/texts/412", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 11, "bbox": {"l": 308.86203, "t": 134.57896000000005, "r": 545.11517, "b": 77.85139500000002, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 247]}], "orig": "Although TableFormer can predict the table structure and the bounding boxes for tables recognized inside PDF documents, this is not enough when a full reconstruction of the original table is required. This happens mainly due the following reasons:", "text": "Although TableFormer can predict the table structure and the bounding boxes for tables recognized inside PDF documents, this is not enough when a full reconstruction of the original table is required. This happens mainly due the following reasons:"}, {"self_ref": "#/texts/413", "parent": {"cref": "#/body"}, "children": [], "content_layer": "furniture", "label": "page_footer", "prov": [{"page_no": 11, "bbox": {"l": 292.63104, "t": 57.86696200000006, "r": 302.59363, "b": 48.96040000000005, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "11", "text": "11"}, {"self_ref": "#/texts/414", "parent": {"cref": "#/pictures/11"}, "children": [], "content_layer": "body", "label": "caption", "prov": [{"page_no": 12, "bbox": {"l": 50.112, "t": 626.49762, "r": 545.11371, "b": 605.63605, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 245]}], "orig": "Figure 7: Distribution of the tables across different dimensions per dataset. Simple vs complex tables per dataset and split, strict vs non strict html structures per dataset and table complexity, missing bboxes per dataset and table complexity.", "text": "Figure 7: Distribution of the tables across different dimensions per dataset. Simple vs complex tables per dataset and split, strict vs non strict html structures per dataset and table complexity, missing bboxes per dataset and table complexity."}, {"self_ref": "#/texts/415", "parent": {"cref": "#/pictures/11"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 119.39108, "t": 714.68945, "r": 151.94641, "b": 708.74078, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 9]}], "orig": "PubTabNet", "text": "PubTabNet"}, {"self_ref": "#/texts/416", "parent": {"cref": "#/pictures/11"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 53.345978, "t": 716.80847, "r": 59.327053, "b": 710.8598, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "b.", "text": "b."}, {"self_ref": "#/texts/417", "parent": {"cref": "#/pictures/11"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 289.5791, "t": 714.54169, "r": 319.8266, "b": 708.5930199999999, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 9]}], "orig": "FinTabNet", "text": "FinTabNet"}, {"self_ref": "#/texts/418", "parent": {"cref": "#/pictures/11"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 448.37271, "t": 714.7460300000001, "r": 481.75916, "b": 708.79736, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 10]}], "orig": "Table Bank", "text": "Table Bank"}, {"self_ref": "#/texts/419", "parent": {"cref": "#/pictures/11"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 82.553436, "t": 650.72382, "r": 94.976013, "b": 645.7666, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 5]}], "orig": "Train", "text": "Train"}, {"self_ref": "#/texts/420", "parent": {"cref": "#/pictures/11"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 63.03878399999999, "t": 690.89587, "r": 85.290085, "b": 685.9386600000001, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 7]}], "orig": "Complex", "text": "Complex"}, {"self_ref": "#/texts/421", "parent": {"cref": "#/pictures/11"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 67.76786, "t": 667.60468, "r": 85.231277, "b": 662.64746, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 6]}], "orig": "Simple", "text": "Simple"}, {"self_ref": "#/texts/422", "parent": {"cref": "#/pictures/11"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 227.55121, "t": 689.46008, "r": 249.80251, "b": 684.50287, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 7]}], "orig": "Complex", "text": "Complex"}, {"self_ref": "#/texts/423", "parent": {"cref": "#/pictures/11"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 232.19898999999998, "t": 665.0142200000001, "r": 249.66241, "b": 660.05701, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 6]}], "orig": "Simple", "text": "Simple"}, {"self_ref": "#/texts/424", "parent": {"cref": "#/pictures/11"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 396.2337, "t": 677.95477, "r": 413.69711, "b": 672.99756, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 6]}], "orig": "Simple", "text": "Simple"}, {"self_ref": "#/texts/425", "parent": {"cref": "#/pictures/11"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 97.382202, "t": 650.72382, "r": 105.08014, "b": 645.7666, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 3]}], "orig": "Val", "text": "Val"}, {"self_ref": "#/texts/426", "parent": {"cref": "#/pictures/11"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 60.93763400000001, "t": 706.26678, "r": 76.151443, "b": 701.30957, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "100%", "text": "100%"}, {"self_ref": "#/texts/427", "parent": {"cref": "#/pictures/11"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 82.304901, "t": 705.77649, "r": 106.99162, "b": 700.8192699999998, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 8]}], "orig": "500K 10K", "text": "500K 10K"}, {"self_ref": "#/texts/428", "parent": {"cref": "#/pictures/11"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 246.20530999999997, "t": 650.39392, "r": 281.88013, "b": 645.43671, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 14]}], "orig": "Train Test Val", "text": "Train Test Val"}, {"self_ref": "#/texts/429", "parent": {"cref": "#/pictures/11"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 226.69780000000003, "t": 706.26678, "r": 241.91161, "b": 701.30957, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "100%", "text": "100%"}, {"self_ref": "#/texts/430", "parent": {"cref": "#/pictures/11"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 249.93848999999997, "t": 705.91199, "r": 282.49384, "b": 700.95477, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 11]}], "orig": "91K 10K 10K", "text": "91K 10K 10K"}, {"self_ref": "#/texts/431", "parent": {"cref": "#/pictures/11"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 410.19409, "t": 650.72382, "r": 444.68915, "b": 645.7666, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 14]}], "orig": "Train Test Val", "text": "Train Test Val"}, {"self_ref": "#/texts/432", "parent": {"cref": "#/pictures/11"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 391.37341, "t": 706.26678, "r": 432.6716599999999, "b": 701.30957, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 12]}], "orig": "100% 130K 5K", "text": "100% 130K 5K"}, {"self_ref": "#/texts/433", "parent": {"cref": "#/pictures/11"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 435.60571000000004, "t": 705.73859, "r": 445.62414999999993, "b": 700.78137, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 3]}], "orig": "10K", "text": "10K"}, {"self_ref": "#/texts/434", "parent": {"cref": "#/pictures/11"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 113.94921, "t": 650.71155, "r": 136.20052, "b": 645.75433, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 7]}], "orig": "Complex", "text": "Complex"}, {"self_ref": "#/texts/435", "parent": {"cref": "#/pictures/11"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 116.91554000000001, "t": 697.18146, "r": 127.05433999999998, "b": 692.22424, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 3]}], "orig": "Non", "text": "Non"}, {"self_ref": "#/texts/436", "parent": {"cref": "#/pictures/11"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 113.3146, "t": 691.06146, "r": 127.05298, "b": 686.10425, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 6]}], "orig": "Strict", "text": "Strict"}, {"self_ref": "#/texts/437", "parent": {"cref": "#/pictures/11"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 112.94112, "t": 684.9414699999999, "r": 127.05537, "b": 679.98425, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "HTML", "text": "HTML"}, {"self_ref": "#/texts/438", "parent": {"cref": "#/pictures/11"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 113.22738999999999, "t": 669.38477, "r": 126.96577, "b": 664.42755, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 6]}], "orig": "Strict", "text": "Strict"}, {"self_ref": "#/texts/439", "parent": {"cref": "#/pictures/11"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 112.85390000000001, "t": 663.26477, "r": 126.96814999999998, "b": 658.30756, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "HTML", "text": "HTML"}, {"self_ref": "#/texts/440", "parent": {"cref": "#/pictures/11"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 138.57864, "t": 650.5636, "r": 156.04207, "b": 645.60638, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 6]}], "orig": "Simple", "text": "Simple"}, {"self_ref": "#/texts/441", "parent": {"cref": "#/pictures/11"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 122.03101, "t": 705.7287, "r": 151.04185, "b": 700.77148, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 9]}], "orig": "230K 280K", "text": "230K 280K"}, {"self_ref": "#/texts/442", "parent": {"cref": "#/pictures/11"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 311.65359, "t": 705.44501, "r": 321.67203, "b": 700.4877899999999, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 3]}], "orig": "65K", "text": "65K"}, {"self_ref": "#/texts/443", "parent": {"cref": "#/pictures/11"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 287.89441, "t": 650.28937, "r": 310.14572, "b": 645.33215, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 7]}], "orig": "Complex", "text": "Complex"}, {"self_ref": "#/texts/444", "parent": {"cref": "#/pictures/11"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 289.23572, "t": 698.92023, "r": 299.37451, "b": 693.96301, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 3]}], "orig": "Non", "text": "Non"}, {"self_ref": "#/texts/445", "parent": {"cref": "#/pictures/11"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 285.63513, "t": 692.80023, "r": 299.3735, "b": 687.8430199999999, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 6]}], "orig": "Strict", "text": "Strict"}, {"self_ref": "#/texts/446", "parent": {"cref": "#/pictures/11"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 285.26111, "t": 686.68024, "r": 299.37537, "b": 681.72302, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "HTML", "text": "HTML"}, {"self_ref": "#/texts/447", "parent": {"cref": "#/pictures/11"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 285.43109, "t": 671.61005, "r": 299.16946, "b": 666.65283, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 6]}], "orig": "Strict", "text": "Strict"}, {"self_ref": "#/texts/448", "parent": {"cref": "#/pictures/11"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 285.05713, "t": 665.49005, "r": 299.17139, "b": 660.53284, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "HTML", "text": "HTML"}, {"self_ref": "#/texts/449", "parent": {"cref": "#/pictures/11"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 311.34592, "t": 650.28937, "r": 328.80933, "b": 645.33215, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 6]}], "orig": "Simple", "text": "Simple"}, {"self_ref": "#/texts/450", "parent": {"cref": "#/pictures/11"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 299.58362, "t": 705.30646, "r": 309.60205, "b": 700.34924, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 3]}], "orig": "47K", "text": "47K"}, {"self_ref": "#/texts/451", "parent": {"cref": "#/pictures/11"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 466.04077000000007, "t": 650.32831, "r": 483.50418, "b": 645.37109, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 6]}], "orig": "Simple", "text": "Simple"}, {"self_ref": "#/texts/452", "parent": {"cref": "#/pictures/11"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 459.02151, "t": 698.23883, "r": 469.16031000000004, "b": 693.28162, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 3]}], "orig": "Non", "text": "Non"}, {"self_ref": "#/texts/453", "parent": {"cref": "#/pictures/11"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 455.4209, "t": 692.11884, "r": 469.15927000000005, "b": 687.16162, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 6]}], "orig": "Strict", "text": "Strict"}, {"self_ref": "#/texts/454", "parent": {"cref": "#/pictures/11"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 455.04691, "t": 685.9988399999999, "r": 469.16115999999994, "b": 681.04163, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "HTML", "text": "HTML"}, {"self_ref": "#/texts/455", "parent": {"cref": "#/pictures/11"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 467.39401, "t": 706.42761, "r": 480.6545100000001, "b": 701.4704, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "145K", "text": "145K"}, {"self_ref": "#/texts/456", "parent": {"cref": "#/pictures/11"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 160.37672, "t": 650.41614, "r": 182.62802, "b": 645.45892, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 7]}], "orig": "Complex", "text": "Complex"}, {"self_ref": "#/texts/457", "parent": {"cref": "#/pictures/11"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 153.74265, "t": 697.13519, "r": 173.32664, "b": 692.17798, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 7]}], "orig": "Contain", "text": "Contain"}, {"self_ref": "#/texts/458", "parent": {"cref": "#/pictures/11"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 154.50967, "t": 691.0152, "r": 173.3246, "b": 686.0579799999999, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 7]}], "orig": "Missing", "text": "Missing"}, {"self_ref": "#/texts/459", "parent": {"cref": "#/pictures/11"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 155.27162, "t": 684.8952, "r": 173.32664, "b": 679.9379900000001, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 6]}], "orig": "bboxes", "text": "bboxes"}, {"self_ref": "#/texts/460", "parent": {"cref": "#/pictures/11"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 326.41302, "t": 684.76752, "r": 345.99701, "b": 679.8103, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 7]}], "orig": "Contain", "text": "Contain"}, {"self_ref": "#/texts/461", "parent": {"cref": "#/pictures/11"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 327.17972, "t": 678.64752, "r": 345.99463, "b": 673.69031, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 7]}], "orig": "Missing", "text": "Missing"}, {"self_ref": "#/texts/462", "parent": {"cref": "#/pictures/11"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 327.94131, "t": 672.52753, "r": 345.99634, "b": 667.57031, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 6]}], "orig": "bboxes", "text": "bboxes"}, {"self_ref": "#/texts/463", "parent": {"cref": "#/pictures/11"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 488.9942, "t": 687.8462500000002, "r": 508.76384999999993, "b": 682.88904, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 7]}], "orig": "Dataset", "text": "Dataset"}, {"self_ref": "#/texts/464", "parent": {"cref": "#/pictures/11"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 490.1893, "t": 681.72626, "r": 508.76349000000005, "b": 676.7690399999999, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 7]}], "orig": "doesn't", "text": "doesn't"}, {"self_ref": "#/texts/465", "parent": {"cref": "#/pictures/11"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 489.72009, "t": 675.60626, "r": 508.76758, "b": 670.6490499999999, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 7]}], "orig": "provide", "text": "provide"}, {"self_ref": "#/texts/466", "parent": {"cref": "#/pictures/11"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 490.71121, "t": 669.48627, "r": 508.76624, "b": 664.52905, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 6]}], "orig": "bboxes", "text": "bboxes"}, {"self_ref": "#/texts/467", "parent": {"cref": "#/pictures/11"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 185.37759, "t": 650.28882, "r": 202.84102, "b": 645.3316, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 6]}], "orig": "Simple", "text": "Simple"}, {"self_ref": "#/texts/468", "parent": {"cref": "#/pictures/11"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 168.50357, "t": 705.86389, "r": 197.52699, "b": 700.90668, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 9]}], "orig": "230K 280K", "text": "230K 280K"}, {"self_ref": "#/texts/469", "parent": {"cref": "#/pictures/11"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 357.3768, "t": 706.00293, "r": 367.39523, "b": 701.04572, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 3]}], "orig": "65K", "text": "65K"}, {"self_ref": "#/texts/470", "parent": {"cref": "#/pictures/11"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 333.73151, "t": 650.37677, "r": 374.92862, "b": 645.41956, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 14]}], "orig": "Complex Simple", "text": "Complex Simple"}, {"self_ref": "#/texts/471", "parent": {"cref": "#/pictures/11"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 345.69101, "t": 705.94409, "r": 355.70944, "b": 700.9868799999999, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 3]}], "orig": "47K", "text": "47K"}, {"self_ref": "#/texts/472", "parent": {"cref": "#/pictures/11"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 508.54248, "t": 650.62317, "r": 526.00592, "b": 645.66595, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 6]}], "orig": "Simple", "text": "Simple"}, {"self_ref": "#/texts/473", "parent": {"cref": "#/pictures/11"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 510.44653000000005, "t": 705.9074100000001, "r": 523.70703, "b": 700.9502, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "145K", "text": "145K"}, {"self_ref": "#/texts/474", "parent": {"cref": "#/groups/8"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 12, "bbox": {"l": 61.569, "t": 581.0686, "r": 286.36511, "b": 560.20703, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 61]}], "orig": "\u00b7 TableFormer output does not include the table cell content.", "text": "\u00b7 TableFormer output does not include the table cell content.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/475", "parent": {"cref": "#/groups/8"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 12, "bbox": {"l": 61.569, "t": 547.92859, "r": 286.36514, "b": 527.06702, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 77]}], "orig": "\u00b7 There are occasional inaccuracies in the predictions of the bounding boxes.", "text": "\u00b7 There are occasional inaccuracies in the predictions of the bounding boxes.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/476", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 308.862, "t": 581.06879, "r": 545.11517, "b": 536.2962, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 183]}], "orig": "dian cell size for all table cells. The usage of median during the computations, helps to eliminate outliers caused by occasional column spans which are usually wider than the normal.", "text": "dian cell size for all table cells. The usage of median during the computations, helps to eliminate outliers caused by occasional column spans which are usually wider than the normal."}, {"self_ref": "#/texts/477", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 50.112, "t": 512.79657, "r": 286.36511, "b": 396.29312, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 545]}], "orig": "However, it is possible to mitigate those limitations by combining the TableFormer predictions with the information already present inside a programmatic PDF document. More specifically, PDF documents can be seen as a sequence of PDF cells where each cell is described by its content and bounding box. If we are able to associate the PDF cells with the predicted table cells, we can directly link the PDF cell content to the table cell structure and use the PDF bounding boxes to correct misalignments in the predicted table cell bounding boxes.", "text": "However, it is possible to mitigate those limitations by combining the TableFormer predictions with the information already present inside a programmatic PDF document. More specifically, PDF documents can be seen as a sequence of PDF cells where each cell is described by its content and bounding box. If we are able to associate the PDF cells with the predicted table cells, we can directly link the PDF cell content to the table cell structure and use the PDF bounding boxes to correct misalignments in the predicted table cell bounding boxes."}, {"self_ref": "#/texts/478", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 50.112, "t": 392.93066, "r": 286.36496, "b": 372.06812, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 68]}], "orig": "Here is a step-by-step description of the prediction postprocessing:", "text": "Here is a step-by-step description of the prediction postprocessing:"}, {"self_ref": "#/texts/479", "parent": {"cref": "#/groups/9"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 12, "bbox": {"l": 50.112, "t": 368.70468, "r": 286.36508, "b": 335.88814999999994, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 173]}], "orig": "1. Get the minimal grid dimensions - number of rows and columns for the predicted table structure. This represents the most granular grid for the underlying table structure.", "text": "1. Get the minimal grid dimensions - number of rows and columns for the predicted table structure. This represents the most granular grid for the underlying table structure.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/480", "parent": {"cref": "#/groups/9"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 12, "bbox": {"l": 50.112, "t": 332.52472, "r": 286.36505, "b": 287.7532, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 187]}], "orig": "2. Generate pair-wise matches between the bounding boxes of the PDF cells and the predicted cells. The Intersection Over Union (IOU) metric is used to evaluate the quality of the matches.", "text": "2. Generate pair-wise matches between the bounding boxes of the PDF cells and the predicted cells. The Intersection Over Union (IOU) metric is used to evaluate the quality of the matches.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/481", "parent": {"cref": "#/groups/9"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 12, "bbox": {"l": 50.112, "t": 284.38977, "r": 286.36493, "b": 263.52721999999994, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 97]}], "orig": "3. Use a carefully selected IOU threshold to designate the matches as \"good\" ones and \"bad\" ones.", "text": "3. Use a carefully selected IOU threshold to designate the matches as \"good\" ones and \"bad\" ones.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/482", "parent": {"cref": "#/groups/9"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 12, "bbox": {"l": 50.112, "t": 260.16479000000004, "r": 286.36511, "b": 227.34722999999997, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 131]}], "orig": "3.a. If all IOU scores in a column are below the threshold, discard all predictions (structure and bounding boxes) for that column.", "text": "3.a. If all IOU scores in a column are below the threshold, discard all predictions (structure and bounding boxes) for that column.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/483", "parent": {"cref": "#/groups/9"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 12, "bbox": {"l": 50.112, "t": 223.98378000000002, "r": 286.36508, "b": 191.16722000000004, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 169]}], "orig": "4. Find the best-fitting content alignment for the predicted cells with good IOU per each column. The alignment of the column can be identified by the following formula:", "text": "4. Find the best-fitting content alignment for the predicted cells with good IOU per each column. The alignment of the column can be identified by the following formula:", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/484", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "formula", "prov": [{"page_no": 12, "bbox": {"l": 110.70499, "t": 168.56408999999996, "r": 286.3624, "b": 137.89438999999993, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 81]}], "orig": "alignment = arg min c { D$_{c}$ } D$_{c}$ = max { x$_{c}$ } \u2212 min { x$_{c}$ } (4)", "text": ""}, {"self_ref": "#/texts/485", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 50.112, "t": 124.65208000000007, "r": 286.362, "b": 103.07321000000002, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 103]}], "orig": "where c is one of { left, centroid, right } and x$_{c}$ is the xcoordinate for the corresponding point.", "text": "where c is one of { left, centroid, right } and x$_{c}$ is the xcoordinate for the corresponding point."}, {"self_ref": "#/texts/486", "parent": {"cref": "#/groups/10"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 12, "bbox": {"l": 50.112, "t": 99.70977800000003, "r": 286.36496, "b": 78.84821299999999, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 110]}], "orig": "5. Use the alignment computed in step 4, to compute the median x -coordinate for all table columns and the me-", "text": "5. Use the alignment computed in step 4, to compute the median x -coordinate for all table columns and the me-", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/487", "parent": {"cref": "#/groups/10"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 12, "bbox": {"l": 308.862, "t": 532.89777, "r": 545.11499, "b": 512.03619, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 91]}], "orig": "6. Snap all cells with bad IOU to their corresponding median x -coordinates and cell sizes.", "text": "6. Snap all cells with bad IOU to their corresponding median x -coordinates and cell sizes.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/488", "parent": {"cref": "#/groups/10"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 12, "bbox": {"l": 308.86203, "t": 508.63674999999995, "r": 545.11511, "b": 404.08929, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 471]}], "orig": "7. Generate a new set of pair-wise matches between the corrected bounding boxes and PDF cells. This time use a modified version of the IOU metric, where the area of the intersection between the predicted and PDF cells is divided by the PDF cell area. In case there are multiple matches for the same PDF cell, the prediction with the higher score is preferred. This covers the cases where the PDF cells are smaller than the area of predicted or corrected prediction cells.", "text": "7. Generate a new set of pair-wise matches between the corrected bounding boxes and PDF cells. This time use a modified version of the IOU metric, where the area of the intersection between the predicted and PDF cells is divided by the PDF cell area. In case there are multiple matches for the same PDF cell, the prediction with the higher score is preferred. This covers the cases where the PDF cells are smaller than the area of predicted or corrected prediction cells.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/489", "parent": {"cref": "#/groups/10"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 12, "bbox": {"l": 308.86203, "t": 400.68985, "r": 545.11517, "b": 332.00836, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 311]}], "orig": "8. In some rare occasions, we have noticed that TableFormer can confuse a single column as two. When the postprocessing steps are applied, this results with two predicted columns pointing to the same PDF column. In such case we must de-duplicate the columns according to highest total column intersection score.", "text": "8. In some rare occasions, we have noticed that TableFormer can confuse a single column as two. When the postprocessing steps are applied, this results with two predicted columns pointing to the same PDF column. In such case we must de-duplicate the columns according to highest total column intersection score.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/490", "parent": {"cref": "#/groups/10"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 12, "bbox": {"l": 308.86203, "t": 328.60892, "r": 545.11517, "b": 224.06142, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 503]}], "orig": "9. Pick up the remaining orphan cells. There could be cases, when after applying all the previous post-processing steps, some PDF cells could still remain without any match to predicted cells. However, it is still possible to deduce the correct matching for an orphan PDF cell by mapping its bounding box on the geometry of the grid. This mapping decides if the content of the orphan cell will be appended to an already matched table cell, or a new table cell should be created to match with the orphan.", "text": "9. Pick up the remaining orphan cells. There could be cases, when after applying all the previous post-processing steps, some PDF cells could still remain without any match to predicted cells. However, it is still possible to deduce the correct matching for an orphan PDF cell by mapping its bounding box on the geometry of the grid. This mapping decides if the content of the orphan cell will be appended to an already matched table cell, or a new table cell should be created to match with the orphan.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/491", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 308.86203, "t": 220.66197, "r": 545.11688, "b": 187.84541000000002, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 113]}], "orig": "9a. Compute the top and bottom boundary of the horizontal band for each grid row (min/max y coordinates per row).", "text": "9a. Compute the top and bottom boundary of the horizontal band for each grid row (min/max y coordinates per row)."}, {"self_ref": "#/texts/492", "parent": {"cref": "#/groups/11"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 12, "bbox": {"l": 308.86206, "t": 184.44696, "r": 545.11505, "b": 163.58440999999993, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 101]}], "orig": "9b. Intersect the orphan's bounding box with the row bands, and map the cell to the closest grid row.", "text": "9b. Intersect the orphan's bounding box with the row bands, and map the cell to the closest grid row.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/493", "parent": {"cref": "#/groups/11"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 12, "bbox": {"l": 308.86206, "t": 160.18597, "r": 545.11505, "b": 127.36941000000002, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 117]}], "orig": "9c. Compute the left and right boundary of the vertical band for each grid column (min/max x coordinates per column).", "text": "9c. Compute the left and right boundary of the vertical band for each grid column (min/max x coordinates per column).", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/494", "parent": {"cref": "#/groups/11"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 12, "bbox": {"l": 308.86206, "t": 123.96996999999999, "r": 545.11499, "b": 103.10841000000005, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 107]}], "orig": "9d. Intersect the orphan's bounding box with the column bands, and map the cell to the closest grid column.", "text": "9d. Intersect the orphan's bounding box with the column bands, and map the cell to the closest grid column.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/495", "parent": {"cref": "#/groups/11"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 12, "bbox": {"l": 308.86206, "t": 99.70997599999998, "r": 545.11517, "b": 78.84840399999996, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 118]}], "orig": "9e. If the table cell under the identified row and column is not empty, extend its content with the content of the or-", "text": "9e. If the table cell under the identified row and column is not empty, extend its content with the content of the or-", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/496", "parent": {"cref": "#/body"}, "children": [], "content_layer": "furniture", "label": "page_footer", "prov": [{"page_no": 12, "bbox": {"l": 292.63107, "t": 57.86697000000004, "r": 302.59366, "b": 48.96040700000003, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "12", "text": "12"}, {"self_ref": "#/texts/497", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 13, "bbox": {"l": 50.112, "t": 716.79163, "r": 88.846588, "b": 707.88507, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 10]}], "orig": "phan cell.", "text": "phan cell."}, {"self_ref": "#/texts/498", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 13, "bbox": {"l": 50.112, "t": 704.83661, "r": 286.36496, "b": 683.9750400000001, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 76]}], "orig": "9f. Otherwise create a new structural cell and match it wit the orphan cell.", "text": "9f. Otherwise create a new structural cell and match it wit the orphan cell."}, {"self_ref": "#/texts/499", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 13, "bbox": {"l": 50.112, "t": 680.83691, "r": 286.36499, "b": 660.29413, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 97]}], "orig": "Aditional images with examples of TableFormer predictions and post-processing can be found below.", "text": "Aditional images with examples of TableFormer predictions and post-processing can be found below."}, {"self_ref": "#/texts/500", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "caption", "prov": [{"page_no": 13, "bbox": {"l": 63.341, "t": 289.94363, "r": 273.13342, "b": 281.03708, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 52]}], "orig": "Figure 8: Example of a table with multi-line header.", "text": "Figure 8: Example of a table with multi-line header."}, {"self_ref": "#/texts/501", "parent": {"cref": "#/tables/12"}, "children": [], "content_layer": "body", "label": "caption", "prov": [{"page_no": 13, "bbox": {"l": 308.862, "t": 485.40164, "r": 545.11511, "b": 464.54009999999994, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 67]}], "orig": "Figure 9: Example of a table with big empty distance between cells.", "text": "Figure 9: Example of a table with big empty distance between cells."}, {"self_ref": "#/texts/502", "parent": {"cref": "#/tables/16"}, "children": [], "content_layer": "body", "label": "caption", "prov": [{"page_no": 13, "bbox": {"l": 312.34299, "t": 111.50664000000006, "r": 541.63232, "b": 102.60006999999996, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 55]}], "orig": "Figure 10: Example of a complex table with empty cells.", "text": "Figure 10: Example of a complex table with empty cells."}, {"self_ref": "#/texts/503", "parent": {"cref": "#/body"}, "children": [], "content_layer": "furniture", "label": "page_footer", "prov": [{"page_no": 13, "bbox": {"l": 292.63098, "t": 57.866641999999956, "r": 302.59357, "b": 48.96007899999995, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "13", "text": "13"}, {"self_ref": "#/texts/504", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "caption", "prov": [{"page_no": 14, "bbox": {"l": 50.112, "t": 435.22964, "r": 286.36508, "b": 414.3681, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 61]}], "orig": "Figure 11: Simple table with different style and empty cells.", "text": "Figure 11: Simple table with different style and empty cells."}, {"self_ref": "#/texts/505", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "caption", "prov": [{"page_no": 14, "bbox": {"l": 54.618998999999995, "t": 120.18164000000002, "r": 281.8559, "b": 111.27508, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 56]}], "orig": "Figure 12: Simple table predictions and post processing.", "text": "Figure 12: Simple table predictions and post processing."}, {"self_ref": "#/texts/506", "parent": {"cref": "#/pictures/16"}, "children": [], "content_layer": "body", "label": "caption", "prov": [{"page_no": 14, "bbox": {"l": 315.79001, "t": 420.31564, "r": 538.18524, "b": 411.40909, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 55]}], "orig": "Figure 13: Table predictions example on colorful table.", "text": "Figure 13: Table predictions example on colorful table."}, {"self_ref": "#/texts/507", "parent": {"cref": "#/tables/27"}, "children": [], "content_layer": "body", "label": "caption", "prov": [{"page_no": 14, "bbox": {"l": 344.98499, "t": 108.45363999999995, "r": 508.98935000000006, "b": 99.54707299999995, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 40]}], "orig": "Figure 14: Example with multi-line text.", "text": "Figure 14: Example with multi-line text."}, {"self_ref": "#/texts/508", "parent": {"cref": "#/body"}, "children": [], "content_layer": "furniture", "label": "page_footer", "prov": [{"page_no": 14, "bbox": {"l": 292.63098, "t": 57.866637999999966, "r": 302.59357, "b": 48.96007499999996, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "14", "text": "14"}, {"self_ref": "#/texts/509", "parent": {"cref": "#/tables/33"}, "children": [], "content_layer": "body", "label": "caption", "prov": [{"page_no": 15, "bbox": {"l": 84.233002, "t": 147.64861999999994, "r": 252.24225, "b": 138.74207, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 41]}], "orig": "Figure 15: Example with triangular table.", "text": "Figure 15: Example with triangular table."}, {"self_ref": "#/texts/510", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "caption", "prov": [{"page_no": 15, "bbox": {"l": 308.86197, "t": 139.06465000000003, "r": 545.11511, "b": 118.20308999999997, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 106]}], "orig": "Figure 16: Example of how post-processing helps to restore mis-aligned bounding boxes prediction artifact.", "text": "Figure 16: Example of how post-processing helps to restore mis-aligned bounding boxes prediction artifact."}, {"self_ref": "#/texts/511", "parent": {"cref": "#/body"}, "children": [], "content_layer": "furniture", "label": "page_footer", "prov": [{"page_no": 15, "bbox": {"l": 292.63098, "t": 57.86665700000003, "r": 302.59357, "b": 48.960094000000026, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "15", "text": "15"}, {"self_ref": "#/texts/512", "parent": {"cref": "#/pictures/23"}, "children": [], "content_layer": "body", "label": "caption", "prov": [{"page_no": 16, "bbox": {"l": 50.112, "t": 283.66263, "r": 545.11383, "b": 262.80108999999993, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 153]}], "orig": "Figure 17: Example of long table. End-to-end example from initial PDF cells to prediction of bounding boxes, post processing and prediction of structure.", "text": "Figure 17: Example of long table. End-to-end example from initial PDF cells to prediction of bounding boxes, post processing and prediction of structure."}, {"self_ref": "#/texts/513", "parent": {"cref": "#/body"}, "children": [], "content_layer": "furniture", "label": "page_footer", "prov": [{"page_no": 16, "bbox": {"l": 292.63098, "t": 57.866641999999956, "r": 302.59357, "b": 48.96007899999995, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "16", "text": "16"}], "pictures": [{"self_ref": "#/pictures/0", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/9"}, {"cref": "#/texts/10"}, {"cref": "#/texts/11"}], "content_layer": "body", "label": "picture", "prov": [{"page_no": 1, "bbox": {"l": 315.65362548828125, "t": 563.276611328125, "r": 537.1475219726562, "b": 489.1985778808594, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "annotations": []}, {"self_ref": "#/pictures/1", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/13"}, {"cref": "#/texts/14"}, {"cref": "#/texts/15"}, {"cref": "#/texts/16"}, {"cref": "#/texts/17"}, {"cref": "#/texts/18"}, {"cref": "#/texts/19"}, {"cref": "#/texts/20"}, {"cref": "#/texts/21"}, {"cref": "#/texts/22"}, {"cref": "#/texts/23"}, {"cref": "#/texts/24"}, {"cref": "#/texts/25"}, {"cref": "#/texts/26"}, {"cref": "#/texts/27"}, {"cref": "#/texts/28"}, {"cref": "#/texts/29"}, {"cref": "#/texts/30"}, {"cref": "#/texts/31"}, {"cref": "#/texts/32"}, {"cref": "#/texts/33"}, {"cref": "#/texts/34"}, {"cref": "#/texts/35"}, {"cref": "#/texts/36"}, {"cref": "#/texts/37"}], "content_layer": "body", "label": "picture", "prov": [{"page_no": 1, "bbox": {"l": 314.78173828125, "t": 453.9347229003906, "r": 539.1802978515625, "b": 381.9505615234375, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "annotations": []}, {"self_ref": "#/pictures/2", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/39"}, {"cref": "#/texts/40"}, {"cref": "#/texts/41"}, {"cref": "#/texts/42"}, {"cref": "#/texts/43"}, {"cref": "#/texts/44"}, {"cref": "#/texts/45"}, {"cref": "#/texts/46"}, {"cref": "#/texts/47"}, {"cref": "#/texts/48"}, {"cref": "#/texts/49"}, {"cref": "#/texts/50"}, {"cref": "#/texts/51"}, {"cref": "#/texts/52"}, {"cref": "#/texts/53"}, {"cref": "#/texts/54"}, {"cref": "#/texts/55"}, {"cref": "#/texts/56"}, {"cref": "#/texts/57"}, {"cref": "#/texts/58"}, {"cref": "#/texts/59"}, {"cref": "#/texts/60"}, {"cref": "#/texts/61"}, {"cref": "#/texts/62"}, {"cref": "#/texts/63"}], "content_layer": "body", "label": "picture", "prov": [{"page_no": 1, "bbox": {"l": 315.7172546386719, "t": 358.176513671875, "r": 536.835693359375, "b": 295.9709777832031, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [{"cref": "#/texts/39"}], "references": [], "footnotes": [], "image": null, "annotations": []}, {"self_ref": "#/pictures/3", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/89"}, {"cref": "#/texts/90"}, {"cref": "#/texts/91"}, {"cref": "#/texts/92"}, {"cref": "#/texts/93"}, {"cref": "#/texts/94"}, {"cref": "#/texts/95"}, {"cref": "#/texts/96"}, {"cref": "#/texts/97"}, {"cref": "#/texts/98"}, {"cref": "#/texts/99"}, {"cref": "#/texts/100"}, {"cref": "#/texts/101"}, {"cref": "#/texts/102"}, {"cref": "#/texts/103"}, {"cref": "#/texts/104"}, {"cref": "#/texts/105"}, {"cref": "#/texts/106"}, {"cref": "#/texts/107"}, {"cref": "#/texts/108"}, {"cref": "#/texts/109"}, {"cref": "#/texts/110"}, {"cref": "#/texts/111"}, {"cref": "#/texts/112"}, {"cref": "#/texts/113"}, {"cref": "#/texts/114"}, {"cref": "#/texts/115"}, {"cref": "#/texts/116"}, {"cref": "#/texts/117"}, {"cref": "#/texts/118"}, {"cref": "#/texts/119"}, {"cref": "#/texts/120"}, {"cref": "#/texts/121"}, {"cref": "#/texts/122"}], "content_layer": "body", "label": "picture", "prov": [{"page_no": 3, "bbox": {"l": 312.10369873046875, "t": 713.5591354370117, "r": 550.38916015625, "b": 541.3901519775391, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [{"cref": "#/texts/89"}], "references": [], "footnotes": [], "image": null, "annotations": []}, {"self_ref": "#/pictures/4", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/141"}, {"cref": "#/texts/142"}, {"cref": "#/texts/143"}, {"cref": "#/texts/144"}, {"cref": "#/texts/145"}, {"cref": "#/texts/146"}, {"cref": "#/texts/147"}, {"cref": "#/texts/148"}, {"cref": "#/texts/149"}, {"cref": "#/texts/150"}, {"cref": "#/texts/151"}, {"cref": "#/texts/152"}, {"cref": "#/texts/153"}, {"cref": "#/texts/154"}, {"cref": "#/texts/155"}, {"cref": "#/texts/156"}, {"cref": "#/texts/157"}, {"cref": "#/texts/158"}, {"cref": "#/texts/159"}, {"cref": "#/texts/160"}, {"cref": "#/texts/161"}, {"cref": "#/texts/162"}, {"cref": "#/texts/163"}, {"cref": "#/texts/164"}, {"cref": "#/texts/165"}, {"cref": "#/texts/166"}, {"cref": "#/texts/167"}, {"cref": "#/texts/168"}, {"cref": "#/texts/169"}, {"cref": "#/texts/170"}, {"cref": "#/texts/171"}, {"cref": "#/texts/172"}, {"cref": "#/texts/173"}, {"cref": "#/texts/174"}, {"cref": "#/texts/175"}, {"cref": "#/texts/176"}, {"cref": "#/texts/177"}, {"cref": "#/texts/178"}, {"cref": "#/texts/179"}, {"cref": "#/texts/180"}, {"cref": "#/texts/181"}, {"cref": "#/texts/182"}, {"cref": "#/texts/183"}, {"cref": "#/texts/184"}, {"cref": "#/texts/185"}, {"cref": "#/texts/186"}, {"cref": "#/texts/187"}, {"cref": "#/texts/188"}, {"cref": "#/texts/189"}, {"cref": "#/texts/190"}, {"cref": "#/texts/191"}, {"cref": "#/texts/192"}, {"cref": "#/texts/193"}, {"cref": "#/texts/194"}, {"cref": "#/texts/195"}, {"cref": "#/texts/196"}, {"cref": "#/texts/197"}, {"cref": "#/texts/198"}, {"cref": "#/texts/199"}, {"cref": "#/texts/200"}], "content_layer": "body", "label": "picture", "prov": [{"page_no": 5, "bbox": {"l": 74.30525970458984, "t": 714.0887985229492, "r": 519.9801025390625, "b": 608.2984924316406, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [{"cref": "#/texts/141"}], "references": [], "footnotes": [], "image": null, "annotations": []}, {"self_ref": "#/pictures/5", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/201"}, {"cref": "#/texts/202"}, {"cref": "#/texts/203"}, {"cref": "#/texts/204"}, {"cref": "#/texts/205"}, {"cref": "#/texts/206"}, {"cref": "#/texts/207"}, {"cref": "#/texts/208"}, {"cref": "#/texts/209"}, {"cref": "#/texts/210"}, {"cref": "#/texts/211"}, {"cref": "#/texts/212"}, {"cref": "#/texts/213"}, {"cref": "#/texts/214"}, {"cref": "#/texts/215"}, {"cref": "#/texts/216"}, {"cref": "#/texts/217"}, {"cref": "#/texts/218"}, {"cref": "#/texts/219"}, {"cref": "#/texts/220"}, {"cref": "#/texts/221"}, {"cref": "#/texts/222"}, {"cref": "#/texts/223"}, {"cref": "#/texts/224"}, {"cref": "#/texts/225"}, {"cref": "#/texts/226"}, {"cref": "#/texts/227"}, {"cref": "#/texts/228"}, {"cref": "#/texts/229"}, {"cref": "#/texts/230"}, {"cref": "#/texts/231"}, {"cref": "#/texts/232"}, {"cref": "#/texts/233"}, {"cref": "#/texts/234"}, {"cref": "#/texts/235"}, {"cref": "#/texts/236"}, {"cref": "#/texts/237"}, {"cref": "#/texts/238"}, {"cref": "#/texts/239"}, {"cref": "#/texts/240"}, {"cref": "#/texts/241"}, {"cref": "#/texts/242"}, {"cref": "#/texts/243"}, {"cref": "#/texts/244"}, {"cref": "#/texts/245"}], "content_layer": "body", "label": "picture", "prov": [{"page_no": 5, "bbox": {"l": 53.03328323364258, "t": 534.3346557617188, "r": 285.3731689453125, "b": 284.3311462402344, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [{"cref": "#/texts/201"}], "references": [], "footnotes": [], "image": null, "annotations": []}, {"self_ref": "#/pictures/6", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "picture", "prov": [{"page_no": 8, "bbox": {"l": 49.97503662109375, "t": 688.2873382568359, "r": 301.6335754394531, "b": 604.4210662841797, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "annotations": []}, {"self_ref": "#/pictures/7", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/287"}], "content_layer": "body", "label": "picture", "prov": [{"page_no": 8, "bbox": {"l": 305.5836486816406, "t": 693.3458404541016, "r": 554.8258666992188, "b": 611.3732452392578, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [{"cref": "#/texts/287"}], "references": [], "footnotes": [], "image": null, "annotations": []}, {"self_ref": "#/pictures/8", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/289"}, {"cref": "#/texts/290"}], "content_layer": "body", "label": "picture", "prov": [{"page_no": 8, "bbox": {"l": 51.736167907714844, "t": 411.51934814453125, "r": 211.83778381347656, "b": 348.3419189453125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [{"cref": "#/texts/289"}], "references": [], "footnotes": [], "image": null, "annotations": []}, {"self_ref": "#/pictures/9", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/291"}, {"cref": "#/texts/292"}], "content_layer": "body", "label": "picture", "prov": [{"page_no": 8, "bbox": {"l": 216.76925659179688, "t": 411.5093688964844, "r": 375.7829284667969, "b": 348.65301513671875, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [{"cref": "#/texts/291"}], "references": [], "footnotes": [], "image": null, "annotations": []}, {"self_ref": "#/pictures/10", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/293"}, {"cref": "#/texts/294"}, {"cref": "#/texts/295"}, {"cref": "#/texts/296"}, {"cref": "#/texts/297"}, {"cref": "#/texts/298"}, {"cref": "#/texts/299"}, {"cref": "#/texts/300"}, {"cref": "#/texts/301"}, {"cref": "#/texts/302"}, {"cref": "#/texts/303"}, {"cref": "#/texts/304"}, {"cref": "#/texts/305"}, {"cref": "#/texts/306"}, {"cref": "#/texts/307"}, {"cref": "#/texts/308"}, {"cref": "#/texts/309"}, {"cref": "#/texts/310"}, {"cref": "#/texts/311"}, {"cref": "#/texts/312"}, {"cref": "#/texts/313"}, {"cref": "#/texts/314"}, {"cref": "#/texts/315"}, {"cref": "#/texts/316"}, {"cref": "#/texts/317"}, {"cref": "#/texts/318"}, {"cref": "#/texts/319"}, {"cref": "#/texts/320"}, {"cref": "#/texts/321"}, {"cref": "#/texts/322"}, {"cref": "#/texts/323"}, {"cref": "#/texts/324"}, {"cref": "#/texts/325"}, {"cref": "#/texts/326"}, {"cref": "#/texts/327"}, {"cref": "#/texts/328"}, {"cref": "#/texts/329"}, {"cref": "#/texts/330"}, {"cref": "#/texts/331"}, {"cref": "#/texts/332"}, {"cref": "#/texts/333"}, {"cref": "#/texts/334"}, {"cref": "#/texts/335"}, {"cref": "#/texts/336"}, {"cref": "#/texts/337"}, {"cref": "#/texts/338"}, {"cref": "#/texts/339"}, {"cref": "#/texts/340"}, {"cref": "#/texts/341"}, {"cref": "#/texts/342"}, {"cref": "#/texts/343"}, {"cref": "#/texts/344"}, {"cref": "#/texts/345"}, {"cref": "#/texts/346"}, {"cref": "#/texts/347"}], "content_layer": "body", "label": "picture", "prov": [{"page_no": 8, "bbox": {"l": 383.1364440917969, "t": 410.7686767578125, "r": 542.1132202148438, "b": 349.2250671386719, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "annotations": []}, {"self_ref": "#/pictures/11", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/414"}, {"cref": "#/texts/415"}, {"cref": "#/texts/416"}, {"cref": "#/texts/417"}, {"cref": "#/texts/418"}, {"cref": "#/texts/419"}, {"cref": "#/texts/420"}, {"cref": "#/texts/421"}, {"cref": "#/texts/422"}, {"cref": "#/texts/423"}, {"cref": "#/texts/424"}, {"cref": "#/texts/425"}, {"cref": "#/texts/426"}, {"cref": "#/texts/427"}, {"cref": "#/texts/428"}, {"cref": "#/texts/429"}, {"cref": "#/texts/430"}, {"cref": "#/texts/431"}, {"cref": "#/texts/432"}, {"cref": "#/texts/433"}, {"cref": "#/texts/434"}, {"cref": "#/texts/435"}, {"cref": "#/texts/436"}, {"cref": "#/texts/437"}, {"cref": "#/texts/438"}, {"cref": "#/texts/439"}, {"cref": "#/texts/440"}, {"cref": "#/texts/441"}, {"cref": "#/texts/442"}, {"cref": "#/texts/443"}, {"cref": "#/texts/444"}, {"cref": "#/texts/445"}, {"cref": "#/texts/446"}, {"cref": "#/texts/447"}, {"cref": "#/texts/448"}, {"cref": "#/texts/449"}, {"cref": "#/texts/450"}, {"cref": "#/texts/451"}, {"cref": "#/texts/452"}, {"cref": "#/texts/453"}, {"cref": "#/texts/454"}, {"cref": "#/texts/455"}, {"cref": "#/texts/456"}, {"cref": "#/texts/457"}, {"cref": "#/texts/458"}, {"cref": "#/texts/459"}, {"cref": "#/texts/460"}, {"cref": "#/texts/461"}, {"cref": "#/texts/462"}, {"cref": "#/texts/463"}, {"cref": "#/texts/464"}, {"cref": "#/texts/465"}, {"cref": "#/texts/466"}, {"cref": "#/texts/467"}, {"cref": "#/texts/468"}, {"cref": "#/texts/469"}, {"cref": "#/texts/470"}, {"cref": "#/texts/471"}, {"cref": "#/texts/472"}, {"cref": "#/texts/473"}], "content_layer": "body", "label": "picture", "prov": [{"page_no": 12, "bbox": {"l": 53.54227066040039, "t": 717.2514572143555, "r": 544.938232421875, "b": 644.4090881347656, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [{"cref": "#/texts/414"}], "references": [], "footnotes": [], "image": null, "annotations": []}, {"self_ref": "#/pictures/12", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "picture", "prov": [{"page_no": 13, "bbox": {"l": 309.79150390625, "t": 538.0946350097656, "r": 425.9603271484375, "b": 499.60601806640625, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "annotations": []}, {"self_ref": "#/pictures/13", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "picture", "prov": [{"page_no": 13, "bbox": {"l": 333.9573669433594, "t": 198.8865966796875, "r": 518.4768676757812, "b": 126.5096435546875, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "annotations": []}, {"self_ref": "#/pictures/14", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "picture", "prov": [{"page_no": 14, "bbox": {"l": 51.15378952026367, "t": 687.6914825439453, "r": 282.8598937988281, "b": 447.09332275390625, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "annotations": []}, {"self_ref": "#/pictures/15", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "picture", "prov": [{"page_no": 14, "bbox": {"l": 50.40477752685547, "t": 180.99615478515625, "r": 177.0564422607422, "b": 135.83905029296875, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "annotations": []}, {"self_ref": "#/pictures/16", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/506"}], "content_layer": "body", "label": "picture", "prov": [{"page_no": 14, "bbox": {"l": 318.6332092285156, "t": 701.1157684326172, "r": 534.73583984375, "b": 432.9424133300781, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [{"cref": "#/texts/506"}], "references": [], "footnotes": [], "image": null, "annotations": []}, {"self_ref": "#/pictures/17", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "picture", "prov": [{"page_no": 15, "bbox": {"l": 55.116363525390625, "t": 655.7449951171875, "r": 279.370849609375, "b": 542.6654510498047, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "annotations": []}, {"self_ref": "#/pictures/18", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "picture", "prov": [{"page_no": 15, "bbox": {"l": 54.28135299682617, "t": 531.7384338378906, "r": 279.2568359375, "b": 418.4729309082031, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "annotations": []}, {"self_ref": "#/pictures/19", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "picture", "prov": [{"page_no": 15, "bbox": {"l": 55.423954010009766, "t": 407.4449462890625, "r": 280.2310791015625, "b": 294.436279296875, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "annotations": []}, {"self_ref": "#/pictures/20", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "picture", "prov": [{"page_no": 15, "bbox": {"l": 50.64818572998047, "t": 286.01953125, "r": 319.9103088378906, "b": 160.736328125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "annotations": []}, {"self_ref": "#/pictures/21", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "picture", "prov": [{"page_no": 15, "bbox": {"l": 323.46868896484375, "t": 429.5491638183594, "r": 525.9569091796875, "b": 327.739501953125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "annotations": []}, {"self_ref": "#/pictures/22", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "picture", "prov": [{"page_no": 15, "bbox": {"l": 353.6920471191406, "t": 304.594970703125, "r": 495.4288024902344, "b": 156.22674560546875, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "annotations": []}, {"self_ref": "#/pictures/23", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/512"}], "content_layer": "body", "label": "picture", "prov": [{"page_no": 16, "bbox": {"l": 66.79948425292969, "t": 538.3836822509766, "r": 528.5565795898438, "b": 293.8616027832031, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [{"cref": "#/texts/512"}], "references": [], "footnotes": [], "image": null, "annotations": []}], "tables": [{"self_ref": "#/tables/0", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "table", "prov": [{"page_no": 1, "bbox": {"l": 315.65362548828125, "t": 563.276611328125, "r": 537.1475219726562, "b": 489.1985778808594, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "data": {"table_cells": [{"bbox": {"l": 451.9457100000001, "t": 235.34704999999997, "r": 457.95050000000003, "b": 245.47748, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "1", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 384.0329, "t": 252.67895999999996, "r": 390.03769, "b": 262.80939, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3", "column_header": true, "row_header": false, "row_section": false}], "num_rows": 1, "num_cols": 2, "grid": [[{"bbox": {"l": 384.0329, "t": 252.67895999999996, "r": 390.03769, "b": 262.80939, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 451.9457100000001, "t": 235.34704999999997, "r": 457.95050000000003, "b": 245.47748, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "1", "column_header": true, "row_header": false, "row_section": false}]]}}, {"self_ref": "#/tables/1", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "table", "prov": [{"page_no": 1, "bbox": {"l": 315.7172546386719, "t": 358.176513671875, "r": 536.835693359375, "b": 295.9709777832031, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "data": {"table_cells": [{"bbox": {"l": 347.24872, "t": 437.68588, "r": 351.6412, "b": 446.47083, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 3, "text": "1", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 318.88071, "t": 437.68588, "r": 323.27319, "b": 446.47083, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "0", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 394.10422, "t": 437.5936, "r": 465.88101, "b": 447.724, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 5, "text": "2 1", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 318.77316, "t": 449.5455, "r": 323.16565, "b": 458.33044, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 347.24872, "t": 449.5455, "r": 351.6412, "b": 458.33044, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 366.70102, "t": 449.12082, "r": 398.4967, "b": 459.25122, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "5 3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.95941000000005, "t": 449.5455, "r": 445.3519, "b": 458.33044, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.81491, "t": 449.5455, "r": 492.2074, "b": 458.33044, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 318.77316, "t": 473.70425, "r": 323.16565, "b": 482.4892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 347.24872, "t": 461.8446, "r": 351.6412, "b": 470.62955, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.10422, "t": 461.8446, "r": 402.88831, "b": 470.62955, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "10", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.95941000000005, "t": 461.8446, "r": 449.42285, "b": 470.62955, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "11", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.81491, "t": 461.8446, "r": 496.599, "b": 470.62955, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "12", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 347.24872, "t": 473.70425, "r": 356.03281, "b": 482.4892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "13", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.10422, "t": 473.70425, "r": 402.88831, "b": 482.4892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "14", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.95941000000005, "t": 473.70425, "r": 449.7435, "b": 482.4892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "15", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.81491, "t": 473.70425, "r": 496.599, "b": 482.4892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "16", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 347.24872, "t": 485.12469, "r": 356.03281, "b": 493.90964, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "17", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.10422, "t": 485.12469, "r": 402.88831, "b": 493.90964, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "18", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.95941000000005, "t": 485.12469, "r": 449.7435, "b": 493.90964, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "19", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.81491, "t": 485.12469, "r": 496.599, "b": 493.90964, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "20", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 331.90424, "t": 473.32291, "r": 337.90903, "b": 483.45331, "coord_origin": "TOPLEFT"}, "row_span": 3, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "2", "column_header": false, "row_header": false, "row_section": false}], "num_rows": 5, "num_cols": 6, "grid": [[{"bbox": {"l": 318.88071, "t": 437.68588, "r": 323.27319, "b": 446.47083, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "0", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 347.24872, "t": 437.68588, "r": 351.6412, "b": 446.47083, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 3, "text": "1", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 347.24872, "t": 437.68588, "r": 351.6412, "b": 446.47083, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 3, "text": "1", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 394.10422, "t": 437.5936, "r": 465.88101, "b": 447.724, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 5, "text": "2 1", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 394.10422, "t": 437.5936, "r": 465.88101, "b": 447.724, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 5, "text": "2 1", "column_header": true, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 318.77316, "t": 449.5455, "r": 323.16565, "b": 458.33044, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 347.24872, "t": 449.5455, "r": 351.6412, "b": 458.33044, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 366.70102, "t": 449.12082, "r": 398.4967, "b": 459.25122, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "5 3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.95941000000005, "t": 449.5455, "r": 445.3519, "b": 458.33044, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.81491, "t": 449.5455, "r": 492.2074, "b": 458.33044, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 318.77316, "t": 473.70425, "r": 323.16565, "b": 482.4892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 347.24872, "t": 461.8446, "r": 351.6412, "b": 470.62955, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.10422, "t": 461.8446, "r": 402.88831, "b": 470.62955, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "10", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.95941000000005, "t": 461.8446, "r": 449.42285, "b": 470.62955, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "11", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.81491, "t": 461.8446, "r": 496.599, "b": 470.62955, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "12", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 331.90424, "t": 473.32291, "r": 337.90903, "b": 483.45331, "coord_origin": "TOPLEFT"}, "row_span": 3, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "2", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 347.24872, "t": 473.70425, "r": 356.03281, "b": 482.4892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "13", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.10422, "t": 473.70425, "r": 402.88831, "b": 482.4892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "14", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.95941000000005, "t": 473.70425, "r": 449.7435, "b": 482.4892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "15", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.81491, "t": 473.70425, "r": 496.599, "b": 482.4892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "16", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 331.90424, "t": 473.32291, "r": 337.90903, "b": 483.45331, "coord_origin": "TOPLEFT"}, "row_span": 3, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "2", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 347.24872, "t": 485.12469, "r": 356.03281, "b": 493.90964, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "17", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.10422, "t": 485.12469, "r": 402.88831, "b": 493.90964, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "18", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.95941000000005, "t": 485.12469, "r": 449.7435, "b": 493.90964, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "19", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.81491, "t": 485.12469, "r": 496.599, "b": 493.90964, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "20", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 331.90424, "t": 473.32291, "r": 337.90903, "b": 483.45331, "coord_origin": "TOPLEFT"}, "row_span": 3, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "2", "column_header": false, "row_header": false, "row_section": false}]]}}, {"self_ref": "#/tables/2", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/132"}], "content_layer": "body", "label": "table", "prov": [{"page_no": 4, "bbox": {"l": 310.67584228515625, "t": 718.8061141967773, "r": 542.9547119140625, "b": 636.7794799804688, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [{"cref": "#/texts/132"}], "references": [], "footnotes": [], "image": null, "data": {"table_cells": [{"bbox": {"l": 412.332, "t": 73.61437999999998, "r": 430.90231, "b": 82.52094, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Tags", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 442.85742, "t": 73.61437999999998, "r": 464.4463799999999, "b": 82.52094, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Bbox", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 477.78632, "t": 73.61437999999998, "r": 494.94193, "b": 82.52094, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Size", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 508.28186, "t": 73.61437999999998, "r": 536.91437, "b": 82.52094, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Format", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 317.06, "t": 85.9673499999999, "r": 361.64264, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PubTabNet", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 417.85599, "t": 85.6684600000001, "r": 425.37775, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 449.89569, "t": 85.6684600000001, "r": 457.41745000000003, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 476.401, "t": 85.9673499999999, "r": 496.3262, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "509k", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 512.63495, "t": 85.9673499999999, "r": 532.56012, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "PNG", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 317.06, "t": 97.92236000000003, "r": 359.43094, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "FinTabNet", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 417.85599, "t": 97.62347, "r": 425.37775, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 449.89569, "t": 97.62347, "r": 457.41745000000003, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 476.401, "t": 97.92236000000003, "r": 496.3262, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "112k", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 513.46185, "t": 97.92236000000003, "r": 531.73328, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "PDF", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 317.06, "t": 109.87836000000004, "r": 359.97888, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableBank", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 417.85599, "t": 109.57947000000001, "r": 425.37775, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 450.81226, "t": 109.57947000000001, "r": 456.50091999999995, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 476.401, "t": 109.87836000000004, "r": 496.3262, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "145k", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 511.25017999999994, "t": 109.87836000000004, "r": 533.94501, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "JPEG", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 317.06, "t": 121.83336999999995, "r": 400.37723, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Combined-Tabnet(*)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 417.85599, "t": 121.53448000000003, "r": 425.37775, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 449.89569, "t": 121.53448000000003, "r": 457.41745000000003, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 476.401, "t": 121.83336999999995, "r": 496.3262, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "400k", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 512.63495, "t": 121.83336999999995, "r": 532.56012, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "PNG", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 317.06, "t": 133.78839000000005, "r": 375.17184, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Combined(**)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 417.85599, "t": 133.48950000000002, "r": 425.37775, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 449.89569, "t": 133.48950000000002, "r": 457.41745000000003, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 476.401, "t": 133.78839000000005, "r": 496.3262, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "500k", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 512.63495, "t": 133.78839000000005, "r": 532.56012, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "PNG", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 317.06, "t": 145.74341000000004, "r": 369.39352, "b": 154.64995999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "SynthTabNet", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 417.85599, "t": 145.44446000000005, "r": 425.37775, "b": 154.65985, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 449.89569, "t": 145.44446000000005, "r": 457.41745000000003, "b": 154.65985, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 476.401, "t": 145.74334999999996, "r": 496.3262, "b": 154.6499, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "600k", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 512.63495, "t": 145.74334999999996, "r": 532.56012, "b": 154.6499, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "PNG", "column_header": false, "row_header": false, "row_section": false}], "num_rows": 7, "num_cols": 5, "grid": [[{"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 412.332, "t": 73.61437999999998, "r": 430.90231, "b": 82.52094, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Tags", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 442.85742, "t": 73.61437999999998, "r": 464.4463799999999, "b": 82.52094, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Bbox", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 477.78632, "t": 73.61437999999998, "r": 494.94193, "b": 82.52094, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Size", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 508.28186, "t": 73.61437999999998, "r": 536.91437, "b": 82.52094, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Format", "column_header": true, "row_header": false, "row_section": false}], [{"bbox": {"l": 317.06, "t": 85.9673499999999, "r": 361.64264, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PubTabNet", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 417.85599, "t": 85.6684600000001, "r": 425.37775, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 449.89569, "t": 85.6684600000001, "r": 457.41745000000003, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 476.401, "t": 85.9673499999999, "r": 496.3262, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "509k", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 512.63495, "t": 85.9673499999999, "r": 532.56012, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "PNG", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 317.06, "t": 97.92236000000003, "r": 359.43094, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "FinTabNet", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 417.85599, "t": 97.62347, "r": 425.37775, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 449.89569, "t": 97.62347, "r": 457.41745000000003, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 476.401, "t": 97.92236000000003, "r": 496.3262, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "112k", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 513.46185, "t": 97.92236000000003, "r": 531.73328, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "PDF", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 317.06, "t": 109.87836000000004, "r": 359.97888, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableBank", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 417.85599, "t": 109.57947000000001, "r": 425.37775, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 450.81226, "t": 109.57947000000001, "r": 456.50091999999995, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 476.401, "t": 109.87836000000004, "r": 496.3262, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "145k", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 511.25017999999994, "t": 109.87836000000004, "r": 533.94501, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "JPEG", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 317.06, "t": 121.83336999999995, "r": 400.37723, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Combined-Tabnet(*)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 417.85599, "t": 121.53448000000003, "r": 425.37775, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 449.89569, "t": 121.53448000000003, "r": 457.41745000000003, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 476.401, "t": 121.83336999999995, "r": 496.3262, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "400k", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 512.63495, "t": 121.83336999999995, "r": 532.56012, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "PNG", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 317.06, "t": 133.78839000000005, "r": 375.17184, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Combined(**)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 417.85599, "t": 133.48950000000002, "r": 425.37775, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 449.89569, "t": 133.48950000000002, "r": 457.41745000000003, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 476.401, "t": 133.78839000000005, "r": 496.3262, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "500k", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 512.63495, "t": 133.78839000000005, "r": 532.56012, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "PNG", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 317.06, "t": 145.74341000000004, "r": 369.39352, "b": 154.64995999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "SynthTabNet", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 417.85599, "t": 145.44446000000005, "r": 425.37775, "b": 154.65985, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 449.89569, "t": 145.44446000000005, "r": 457.41745000000003, "b": 154.65985, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 476.401, "t": 145.74334999999996, "r": 496.3262, "b": 154.6499, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "600k", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 512.63495, "t": 145.74334999999996, "r": 532.56012, "b": 154.6499, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "PNG", "column_header": false, "row_header": false, "row_section": false}]]}}, {"self_ref": "#/tables/3", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "table", "prov": [{"page_no": 7, "bbox": {"l": 53.368526458740234, "t": 382.8642272949219, "r": 283.0443420410156, "b": 209.60223388671875, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "data": {"table_cells": [{"bbox": {"l": 78.843002, "t": 420.69037, "r": 104.85535, "b": 429.59692, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Model", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 211.2, "t": 414.71237, "r": 247.74349999999998, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "TEDS Complex", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 129.338, "t": 426.66736, "r": 159.21584, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Dataset", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 171.17096, "t": 426.66736, "r": 199.40497, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Simple", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 264.54044, "t": 426.66736, "r": 277.27264, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "All", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 81.612, "t": 443.62436, "r": 102.08514, "b": 452.53091, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "EDD", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.87206, "t": 443.62436, "r": 153.69141, "b": 452.53091, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "PTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.56554, "t": 443.62436, "r": 194.00009, "b": 452.53091, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "91.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 220.82938000000001, "t": 443.62436, "r": 238.26393, "b": 452.53091, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "88.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 262.18414, "t": 443.62436, "r": 279.61868, "b": 452.53091, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "89.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 82.165001, "t": 455.58035, "r": 101.5323, "b": 464.48691, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "GTE", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.86716, "t": 455.58035, "r": 153.68651, "b": 464.48691, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "PTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 183.62411, "t": 455.58035, "r": 186.94167, "b": 464.48691, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 227.88795000000002, "t": 455.58035, "r": 231.20551, "b": 464.48691, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 259.69855, "t": 455.58035, "r": 282.11441, "b": 464.48691, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "93.01", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 66.315002, "t": 468.13336, "r": 117.38329000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.86766, "t": 468.13336, "r": 153.68701, "b": 477.03992, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "PTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.57111, "t": 468.13336, "r": 194.00566, "b": 477.03992, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "98.5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 220.83495, "t": 468.13336, "r": 238.26950000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "95.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 259.698, "t": 468.01379, "r": 282.11386, "b": 476.97018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "96.75", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 81.612, "t": 483.32635, "r": 102.08514, "b": 492.23291, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "EDD", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.87206, "t": 483.32635, "r": 153.69141, "b": 492.23291, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "FTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.56554, "t": 483.32635, "r": 194.00009, "b": 492.23291, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "88.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 218.33870999999996, "t": 483.32635, "r": 240.75455999999997, "b": 492.23291, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "92.08", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 262.18411, "t": 483.32635, "r": 279.61865, "b": 492.23291, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "90.6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 82.165001, "t": 495.28134, "r": 101.5323, "b": 504.1879, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "GTE", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.86716, "t": 495.28134, "r": 153.68651, "b": 504.1879, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "FTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 183.62411, "t": 495.28134, "r": 186.94167, "b": 504.1879, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 227.88795000000002, "t": 495.28134, "r": 231.20551, "b": 504.1879, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 259.69855, "t": 495.28134, "r": 282.11441, "b": 504.1879, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "87.14", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 71.789001, "t": 507.23633, "r": 111.90838999999998, "b": 516.14288, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "GTE (FT)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.86221, "t": 507.23633, "r": 153.68156, "b": 516.14288, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "FTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 183.62914, "t": 507.23633, "r": 186.94669, "b": 516.14288, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 227.89297, "t": 507.23633, "r": 231.21053000000003, "b": 516.14288, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 259.6936, "t": 507.23633, "r": 282.10947, "b": 516.14288, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "91.02", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 66.315002, "t": 519.1913099999999, "r": 117.38329000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.86766, "t": 519.1913099999999, "r": 153.68701, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "FTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.57111, "t": 519.1913099999999, "r": 194.00566, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "97.5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 220.83495, "t": 519.1913099999999, "r": 238.26950000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "96.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 262.189, "t": 519.0717500000001, "r": 279.62354, "b": 528.02814, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "96.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 81.612, "t": 536.49837, "r": 102.08514, "b": 545.40492, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "EDD", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 137.91064, "t": 536.49837, "r": 150.64285, "b": 545.40492, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "TB", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.56554, "t": 536.49837, "r": 194.00009, "b": 545.40492, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "86.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 227.89285, "t": 536.49837, "r": 231.21040000000002, "b": 545.40492, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 262.18411, "t": 536.49837, "r": 279.61865, "b": 545.40492, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "86.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 66.315002, "t": 548.45436, "r": 117.38329000000002, "b": 557.36092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 137.90625, "t": 548.45436, "r": 150.63846, "b": 557.36092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "TB", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.57111, "t": 548.45436, "r": 194.00566, "b": 557.36092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "89.6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 227.88845999999998, "t": 548.45436, "r": 231.20601, "b": 557.36092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 262.189, "t": 548.3348100000001, "r": 279.62354, "b": 557.2911799999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "89.6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 66.315002, "t": 568.00237, "r": 117.38329000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.86766, "t": 568.00237, "r": 153.68701, "b": 576.90892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "STN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.57111, "t": 568.00237, "r": 194.00566, "b": 576.90892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "96.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 220.83495, "t": 568.00237, "r": 238.26950000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "95.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 262.1897, "t": 568.00237, "r": 279.62424, "b": 576.90892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "96.7", "column_header": false, "row_header": false, "row_section": false}], "num_rows": 11, "num_cols": 5, "grid": [[{"bbox": {"l": 78.843002, "t": 420.69037, "r": 104.85535, "b": 429.59692, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Model", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 129.338, "t": 426.66736, "r": 159.21584, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Dataset", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 171.17096, "t": 426.66736, "r": 199.40497, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Simple", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 211.2, "t": 414.71237, "r": 247.74349999999998, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "TEDS Complex", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 264.54044, "t": 426.66736, "r": 277.27264, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "All", "column_header": true, "row_header": false, "row_section": false}], [{"bbox": {"l": 81.612, "t": 443.62436, "r": 102.08514, "b": 452.53091, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "EDD", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.87206, "t": 443.62436, "r": 153.69141, "b": 452.53091, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "PTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.56554, "t": 443.62436, "r": 194.00009, "b": 452.53091, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "91.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 220.82938000000001, "t": 443.62436, "r": 238.26393, "b": 452.53091, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "88.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 262.18414, "t": 443.62436, "r": 279.61868, "b": 452.53091, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "89.9", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 82.165001, "t": 455.58035, "r": 101.5323, "b": 464.48691, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "GTE", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.86716, "t": 455.58035, "r": 153.68651, "b": 464.48691, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "PTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 183.62411, "t": 455.58035, "r": 186.94167, "b": 464.48691, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 227.88795000000002, "t": 455.58035, "r": 231.20551, "b": 464.48691, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 259.69855, "t": 455.58035, "r": 282.11441, "b": 464.48691, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "93.01", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 66.315002, "t": 468.13336, "r": 117.38329000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.86766, "t": 468.13336, "r": 153.68701, "b": 477.03992, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "PTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.57111, "t": 468.13336, "r": 194.00566, "b": 477.03992, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "98.5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 220.83495, "t": 468.13336, "r": 238.26950000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "95.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 259.698, "t": 468.01379, "r": 282.11386, "b": 476.97018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "96.75", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 81.612, "t": 483.32635, "r": 102.08514, "b": 492.23291, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "EDD", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.87206, "t": 483.32635, "r": 153.69141, "b": 492.23291, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "FTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.56554, "t": 483.32635, "r": 194.00009, "b": 492.23291, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "88.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 218.33870999999996, "t": 483.32635, "r": 240.75455999999997, "b": 492.23291, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "92.08", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 262.18411, "t": 483.32635, "r": 279.61865, "b": 492.23291, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "90.6", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 82.165001, "t": 495.28134, "r": 101.5323, "b": 504.1879, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "GTE", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.86716, "t": 495.28134, "r": 153.68651, "b": 504.1879, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "FTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 183.62411, "t": 495.28134, "r": 186.94167, "b": 504.1879, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 227.88795000000002, "t": 495.28134, "r": 231.20551, "b": 504.1879, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 259.69855, "t": 495.28134, "r": 282.11441, "b": 504.1879, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "87.14", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 71.789001, "t": 507.23633, "r": 111.90838999999998, "b": 516.14288, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "GTE (FT)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.86221, "t": 507.23633, "r": 153.68156, "b": 516.14288, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "FTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 183.62914, "t": 507.23633, "r": 186.94669, "b": 516.14288, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 227.89297, "t": 507.23633, "r": 231.21053000000003, "b": 516.14288, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 259.6936, "t": 507.23633, "r": 282.10947, "b": 516.14288, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "91.02", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 66.315002, "t": 519.1913099999999, "r": 117.38329000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.86766, "t": 519.1913099999999, "r": 153.68701, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "FTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.57111, "t": 519.1913099999999, "r": 194.00566, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "97.5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 220.83495, "t": 519.1913099999999, "r": 238.26950000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "96.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 262.189, "t": 519.0717500000001, "r": 279.62354, "b": 528.02814, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "96.8", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 81.612, "t": 536.49837, "r": 102.08514, "b": 545.40492, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "EDD", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 137.91064, "t": 536.49837, "r": 150.64285, "b": 545.40492, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "TB", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.56554, "t": 536.49837, "r": 194.00009, "b": 545.40492, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "86.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 227.89285, "t": 536.49837, "r": 231.21040000000002, "b": 545.40492, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 262.18411, "t": 536.49837, "r": 279.61865, "b": 545.40492, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "86.0", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 66.315002, "t": 548.45436, "r": 117.38329000000002, "b": 557.36092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 137.90625, "t": 548.45436, "r": 150.63846, "b": 557.36092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "TB", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.57111, "t": 548.45436, "r": 194.00566, "b": 557.36092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "89.6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 227.88845999999998, "t": 548.45436, "r": 231.20601, "b": 557.36092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 262.189, "t": 548.3348100000001, "r": 279.62354, "b": 557.2911799999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "89.6", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 66.315002, "t": 568.00237, "r": 117.38329000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.86766, "t": 568.00237, "r": 153.68701, "b": 576.90892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "STN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.57111, "t": 568.00237, "r": 194.00566, "b": 576.90892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "96.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 220.83495, "t": 568.00237, "r": 238.26950000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "95.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 262.1897, "t": 568.00237, "r": 279.62424, "b": 576.90892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "96.7", "column_header": false, "row_header": false, "row_section": false}]]}}, {"self_ref": "#/tables/4", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/279"}], "content_layer": "body", "label": "table", "prov": [{"page_no": 7, "bbox": {"l": 308.4068603515625, "t": 544.1236877441406, "r": 533.6419677734375, "b": 488.1943359375, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [{"cref": "#/texts/279"}], "references": [], "footnotes": [], "image": null, "data": {"table_cells": [{"bbox": {"l": 339.323, "t": 253.66436999999996, "r": 365.33536, "b": 262.57092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Model", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 401.04132, "t": 253.66436999999996, "r": 430.91916, "b": 262.57092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Dataset", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 454.10214, "t": 253.66436999999996, "r": 474.58523999999994, "b": 262.57092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "mAP", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 486.54034, "t": 253.66436999999996, "r": 527.2276, "b": 262.57092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "mAP (PP)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 327.65601, "t": 270.62134000000003, "r": 377.00076, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "EDD+BBox", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 393.69809, "t": 270.62134000000003, "r": 438.28073, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "PubTabNet", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 455.63559, "t": 270.62134000000003, "r": 473.07013, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "79.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 498.16592, "t": 270.62134000000003, "r": 515.60046, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "82.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.79501, "t": 282.57631999999995, "r": 377.86331, "b": 291.48288, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 393.69388, "t": 282.57631999999995, "r": 438.27652, "b": 291.48288, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "PubTabNet", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 455.63101, "t": 282.45676, "r": 473.06555000000003, "b": 291.41315, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "82.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 498.1713, "t": 282.45676, "r": 515.60583, "b": 291.41315, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "86.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.79501, "t": 294.53131, "r": 377.86331, "b": 303.43787, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 389.81842, "t": 294.53131, "r": 442.15194999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "SynthTabNet", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 455.63135, "t": 294.53131, "r": 473.06589, "b": 303.43787, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "87.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 505.22515999999996, "t": 294.53131, "r": 508.54268999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}], "num_rows": 4, "num_cols": 4, "grid": [[{"bbox": {"l": 339.323, "t": 253.66436999999996, "r": 365.33536, "b": 262.57092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Model", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 401.04132, "t": 253.66436999999996, "r": 430.91916, "b": 262.57092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Dataset", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 454.10214, "t": 253.66436999999996, "r": 474.58523999999994, "b": 262.57092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "mAP", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 486.54034, "t": 253.66436999999996, "r": 527.2276, "b": 262.57092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "mAP (PP)", "column_header": true, "row_header": false, "row_section": false}], [{"bbox": {"l": 327.65601, "t": 270.62134000000003, "r": 377.00076, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "EDD+BBox", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 393.69809, "t": 270.62134000000003, "r": 438.28073, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "PubTabNet", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 455.63559, "t": 270.62134000000003, "r": 473.07013, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "79.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 498.16592, "t": 270.62134000000003, "r": 515.60046, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "82.7", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 326.79501, "t": 282.57631999999995, "r": 377.86331, "b": 291.48288, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 393.69388, "t": 282.57631999999995, "r": 438.27652, "b": 291.48288, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "PubTabNet", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 455.63101, "t": 282.45676, "r": 473.06555000000003, "b": 291.41315, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "82.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 498.1713, "t": 282.45676, "r": 515.60583, "b": 291.41315, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "86.8", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 326.79501, "t": 294.53131, "r": 377.86331, "b": 303.43787, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 389.81842, "t": 294.53131, "r": 442.15194999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "SynthTabNet", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 455.63135, "t": 294.53131, "r": 473.06589, "b": 303.43787, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "87.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 505.22515999999996, "t": 294.53131, "r": 508.54268999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}]]}}, {"self_ref": "#/tables/5", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/281"}], "content_layer": "body", "label": "table", "prov": [{"page_no": 7, "bbox": {"l": 332.9688720703125, "t": 251.7164306640625, "r": 520.942138671875, "b": 148.73028564453125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [{"cref": "#/texts/281"}], "references": [], "footnotes": [], "image": null, "data": {"table_cells": [{"bbox": {"l": 358.01099, "t": 552.23337, "r": 384.02335, "b": 561.1399200000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Model", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 448.6951, "t": 546.25537, "r": 485.07849, "b": 567.11693, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "TEDS Complex", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 408.50598, "t": 558.21037, "r": 436.73999, "b": 567.11693, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Simple", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 499.3848, "t": 558.21037, "r": 512.117, "b": 567.11693, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "All", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 357.68201, "t": 575.16736, "r": 384.3519, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Tabula", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 413.90097, "t": 575.16736, "r": 431.33550999999994, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "78.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 458.16479000000004, "t": 575.16736, "r": 475.59933000000007, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "57.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 497.0289, "t": 575.16736, "r": 514.46344, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "67.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 350.72299, "t": 587.12236, "r": 391.31064, "b": 596.02892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Traprange", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 413.90582, "t": 587.12236, "r": 431.34036, "b": 596.02892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "60.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 458.16965, "t": 587.12236, "r": 475.60419, "b": 596.02892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "49.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 497.03374999999994, "t": 587.12236, "r": 514.46832, "b": 596.02892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "55.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 354.13599, "t": 599.07835, "r": 387.89923, "b": 607.98491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Camelot", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 413.90161, "t": 599.07835, "r": 431.33615, "b": 607.98491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "80.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 458.16544, "t": 599.07835, "r": 475.59998, "b": 607.98491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "66.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 497.02954000000005, "t": 599.07835, "r": 514.46411, "b": 607.98491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "73.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 346.55899, "t": 611.03336, "r": 395.47534, "b": 619.93991, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Acrobat Pro", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 413.90616, "t": 611.03336, "r": 431.34069999999997, "b": 619.93991, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "68.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 458.16998000000007, "t": 611.03336, "r": 475.60452, "b": 619.93991, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "61.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 497.03409, "t": 611.03336, "r": 514.46863, "b": 619.93991, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "65.3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 360.78101, "t": 622.9883600000001, "r": 381.25415, "b": 631.89491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "EDD", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 413.90158, "t": 622.9883600000001, "r": 431.33612, "b": 631.89491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "91.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 458.16541, "t": 622.9883600000001, "r": 475.59995000000004, "b": 631.89491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "85.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 497.0295100000001, "t": 622.9883600000001, "r": 514.46405, "b": 631.89491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "88.3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 345.483, "t": 634.94336, "r": 396.5513, "b": 643.84991, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 413.90616, "t": 634.94336, "r": 431.34069999999997, "b": 643.84991, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "95.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 458.16998000000007, "t": 634.94336, "r": 475.60452, "b": 643.84991, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "90.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 497.03400000000005, "t": 634.82381, "r": 514.46857, "b": 643.78018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "93.6", "column_header": false, "row_header": false, "row_section": false}], "num_rows": 7, "num_cols": 4, "grid": [[{"bbox": {"l": 358.01099, "t": 552.23337, "r": 384.02335, "b": 561.1399200000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Model", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 408.50598, "t": 558.21037, "r": 436.73999, "b": 567.11693, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Simple", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 448.6951, "t": 546.25537, "r": 485.07849, "b": 567.11693, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "TEDS Complex", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 499.3848, "t": 558.21037, "r": 512.117, "b": 567.11693, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "All", "column_header": true, "row_header": false, "row_section": false}], [{"bbox": {"l": 357.68201, "t": 575.16736, "r": 384.3519, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Tabula", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 413.90097, "t": 575.16736, "r": 431.33550999999994, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "78.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 458.16479000000004, "t": 575.16736, "r": 475.59933000000007, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "57.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 497.0289, "t": 575.16736, "r": 514.46344, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "67.9", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 350.72299, "t": 587.12236, "r": 391.31064, "b": 596.02892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Traprange", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 413.90582, "t": 587.12236, "r": 431.34036, "b": 596.02892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "60.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 458.16965, "t": 587.12236, "r": 475.60419, "b": 596.02892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "49.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 497.03374999999994, "t": 587.12236, "r": 514.46832, "b": 596.02892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "55.4", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 354.13599, "t": 599.07835, "r": 387.89923, "b": 607.98491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Camelot", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 413.90161, "t": 599.07835, "r": 431.33615, "b": 607.98491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "80.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 458.16544, "t": 599.07835, "r": 475.59998, "b": 607.98491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "66.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 497.02954000000005, "t": 599.07835, "r": 514.46411, "b": 607.98491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "73.0", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 346.55899, "t": 611.03336, "r": 395.47534, "b": 619.93991, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Acrobat Pro", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 413.90616, "t": 611.03336, "r": 431.34069999999997, "b": 619.93991, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "68.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 458.16998000000007, "t": 611.03336, "r": 475.60452, "b": 619.93991, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "61.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 497.03409, "t": 611.03336, "r": 514.46863, "b": 619.93991, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "65.3", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 360.78101, "t": 622.9883600000001, "r": 381.25415, "b": 631.89491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "EDD", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 413.90158, "t": 622.9883600000001, "r": 431.33612, "b": 631.89491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "91.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 458.16541, "t": 622.9883600000001, "r": 475.59995000000004, "b": 631.89491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "85.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 497.0295100000001, "t": 622.9883600000001, "r": 514.46405, "b": 631.89491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "88.3", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 345.483, "t": 634.94336, "r": 396.5513, "b": 643.84991, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 413.90616, "t": 634.94336, "r": 431.34069999999997, "b": 643.84991, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "95.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 458.16998000000007, "t": 634.94336, "r": 475.60452, "b": 643.84991, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "90.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 497.03400000000005, "t": 634.82381, "r": 514.46857, "b": 643.78018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "93.6", "column_header": false, "row_header": false, "row_section": false}]]}}, {"self_ref": "#/tables/6", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/288"}], "content_layer": "body", "label": "table", "prov": [{"page_no": 8, "bbox": {"l": 53.62853240966797, "t": 573.0514221191406, "r": 298.5574951171875, "b": 499.60003662109375, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [{"cref": "#/texts/288"}], "references": [], "footnotes": [], "image": null, "data": {"table_cells": [{"bbox": {"l": 209.93285, "t": 222.18073000000004, "r": 241.04458999999997, "b": 226.36212, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 4, "text": "\u8ad6\u6587\u30d5\u30a1\u30a4\u30eb", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 263.76489, "t": 222.18073000000004, "r": 284.50589, "b": 226.36212, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 4, "end_col_offset_idx": 6, "text": "\u53c2\u8003\u6587\u732e", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 110.24990999999999, "t": 229.66594999999995, "r": 120.62018, "b": 233.84735, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "\u51fa\u5178", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 175.36609, "t": 229.66594999999995, "r": 201.29247, "b": 233.84735, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "\u30d5\u30a1\u30a4\u30eb \u6570", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 209.62408, "t": 229.66594999999995, "r": 219.99435, "b": 233.84735, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "\u82f1\u8a9e", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 229.19814, "t": 229.66594999999995, "r": 244.75377, "b": 233.84735, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "\u65e5\u672c\u8a9e", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 256.1142, "t": 229.66594999999995, "r": 266.48447, "b": 233.84735, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "\u82f1\u8a9e", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 278.38434, "t": 229.66594999999995, "r": 293.93997, "b": 233.84735, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "\u65e5\u672c\u8a9e", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 55.53052099999999, "t": 236.42584, "r": 162.7131, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Association for Computational Linguistics(ACL2003)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 184.39731, "t": 236.42584, "r": 189.56456, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "65", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 208.99026, "t": 236.42584, "r": 214.15752, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "65", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 234.87517, "t": 236.42584, "r": 237.45833000000002, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446, "t": 236.42584, "r": 264.6358, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "150", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 284.06134, "t": 236.42584, "r": 286.6445, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 55.53052099999999, "t": 242.62048000000004, "r": 139.72253, "b": 246.97839, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Computational Linguistics(COLING2002)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 183.10536, "t": 242.62048000000004, "r": 190.8567, "b": 246.97839, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "140", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 207.69832, "t": 242.62048000000004, "r": 215.44965999999997, "b": 246.97839, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "140", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 234.87517, "t": 242.62048000000004, "r": 237.45833000000002, "b": 246.97839, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446, "t": 242.62048000000004, "r": 264.6358, "b": 246.97839, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "150", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 284.06134, "t": 242.62048000000004, "r": 286.6445, "b": 246.97839, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 55.53052099999999, "t": 249.58942000000002, "r": 128.96027, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "\u96fb\u6c17\u60c5\u5831\u901a\u4fe1\u5b66\u4f1a 2003 \u5e74\u7dcf\u5408\u5927\u4f1a", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 183.10536, "t": 248.81506000000002, "r": 190.8567, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "150", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 210.28223, "t": 248.81506000000002, "r": 212.86539, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.29153, "t": 248.81506000000002, "r": 240.04287999999997, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "142", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446, "t": 248.81506000000002, "r": 264.6358, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "223", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.47742, "t": 248.81506000000002, "r": 289.22876, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "147", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 55.53052099999999, "t": 257.07465, "r": 129.88177, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "\u60c5\u5831\u51e6\u7406\u5b66\u4f1a\u7b2c 65 \u56de\u5168\u56fd\u5927\u4f1a (2003)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 183.10536, "t": 256.30029, "r": 190.8567, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "177", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 210.28223, "t": 256.30029, "r": 212.86539, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.29153, "t": 256.30029, "r": 240.04287999999997, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "176", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446, "t": 256.30029, "r": 264.6358, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "150", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.47742, "t": 256.30029, "r": 289.22876, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "236", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 55.53052099999999, "t": 264.30175999999994, "r": 129.88177, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "\u7b2c 17 \u56de\u4eba\u5de5\u77e5\u80fd\u5b66\u4f1a\u5168\u56fd\u5927\u4f1a (2003)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 183.10536, "t": 263.52739999999994, "r": 190.8567, "b": 267.88531, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "208", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 210.28223, "t": 263.52739999999994, "r": 212.86539, "b": 267.88531, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.29153, "t": 263.52739999999994, "r": 240.04287999999997, "b": 267.88531, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "203", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446, "t": 263.52739999999994, "r": 264.6358, "b": 267.88531, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "152", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.47742, "t": 263.52739999999994, "r": 289.22876, "b": 267.88531, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "244", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 55.53052099999999, "t": 271.52881, "r": 127.32454000000001, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "\u81ea\u7136\u8a00\u8a9e\u51e6\u7406\u7814\u7a76\u4f1a\u7b2c 146 \u301c 155 \u56de", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 184.39731, "t": 270.75446, "r": 189.56456, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "98", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 210.28223, "t": 270.75446, "r": 212.86539, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 233.58348, "t": 270.75446, "r": 238.75072999999998, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446, "t": 270.75446, "r": 264.6358, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "150", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.47742, "t": 270.75446, "r": 289.22876, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "232", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 55.53052099999999, "t": 279.01392, "r": 110.16829999999999, "b": 283.40436, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "WWW \u304b\u3089\u53ce\u96c6\u3057\u305f\u8ad6\u6587", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 183.10536, "t": 277.98157000000003, "r": 190.8567, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "107", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 208.99026, "t": 277.98157000000003, "r": 214.15752, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "73", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 233.58348, "t": 277.98157000000003, "r": 238.75072999999998, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "34", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446, "t": 277.98157000000003, "r": 264.6358, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "147", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 282.76938, "t": 277.98157000000003, "r": 287.93661, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 183.10536, "t": 285.46667, "r": 190.8567, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "945", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 207.69832, "t": 285.46667, "r": 215.44965999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "294", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.29153, "t": 285.46667, "r": 240.04287999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "651", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 255.76506, "t": 285.46667, "r": 265.75204, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "1122", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.47742, "t": 285.46667, "r": 289.22876, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "955", "column_header": false, "row_header": false, "row_section": false}], "num_rows": 10, "num_cols": 6, "grid": [[{"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.93285, "t": 222.18073000000004, "r": 241.04458999999997, "b": 226.36212, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 4, "text": "\u8ad6\u6587\u30d5\u30a1\u30a4\u30eb", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 209.93285, "t": 222.18073000000004, "r": 241.04458999999997, "b": 226.36212, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 4, "text": "\u8ad6\u6587\u30d5\u30a1\u30a4\u30eb", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 263.76489, "t": 222.18073000000004, "r": 284.50589, "b": 226.36212, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 4, "end_col_offset_idx": 6, "text": "\u53c2\u8003\u6587\u732e", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 263.76489, "t": 222.18073000000004, "r": 284.50589, "b": 226.36212, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 4, "end_col_offset_idx": 6, "text": "\u53c2\u8003\u6587\u732e", "column_header": true, "row_header": false, "row_section": false}], [{"bbox": {"l": 110.24990999999999, "t": 229.66594999999995, "r": 120.62018, "b": 233.84735, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "\u51fa\u5178", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 175.36609, "t": 229.66594999999995, "r": 201.29247, "b": 233.84735, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "\u30d5\u30a1\u30a4\u30eb \u6570", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 209.62408, "t": 229.66594999999995, "r": 219.99435, "b": 233.84735, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "\u82f1\u8a9e", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 229.19814, "t": 229.66594999999995, "r": 244.75377, "b": 233.84735, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "\u65e5\u672c\u8a9e", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 256.1142, "t": 229.66594999999995, "r": 266.48447, "b": 233.84735, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "\u82f1\u8a9e", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 278.38434, "t": 229.66594999999995, "r": 293.93997, "b": 233.84735, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "\u65e5\u672c\u8a9e", "column_header": true, "row_header": false, "row_section": false}], [{"bbox": {"l": 55.53052099999999, "t": 236.42584, "r": 162.7131, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Association for Computational Linguistics(ACL2003)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 184.39731, "t": 236.42584, "r": 189.56456, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "65", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 208.99026, "t": 236.42584, "r": 214.15752, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "65", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 234.87517, "t": 236.42584, "r": 237.45833000000002, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446, "t": 236.42584, "r": 264.6358, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "150", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 284.06134, "t": 236.42584, "r": 286.6445, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 55.53052099999999, "t": 242.62048000000004, "r": 139.72253, "b": 246.97839, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Computational Linguistics(COLING2002)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 183.10536, "t": 242.62048000000004, "r": 190.8567, "b": 246.97839, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "140", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 207.69832, "t": 242.62048000000004, "r": 215.44965999999997, "b": 246.97839, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "140", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 234.87517, "t": 242.62048000000004, "r": 237.45833000000002, "b": 246.97839, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446, "t": 242.62048000000004, "r": 264.6358, "b": 246.97839, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "150", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 284.06134, "t": 242.62048000000004, "r": 286.6445, "b": 246.97839, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 55.53052099999999, "t": 249.58942000000002, "r": 128.96027, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "\u96fb\u6c17\u60c5\u5831\u901a\u4fe1\u5b66\u4f1a 2003 \u5e74\u7dcf\u5408\u5927\u4f1a", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 183.10536, "t": 248.81506000000002, "r": 190.8567, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "150", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 210.28223, "t": 248.81506000000002, "r": 212.86539, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.29153, "t": 248.81506000000002, "r": 240.04287999999997, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "142", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446, "t": 248.81506000000002, "r": 264.6358, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "223", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.47742, "t": 248.81506000000002, "r": 289.22876, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "147", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 55.53052099999999, "t": 257.07465, "r": 129.88177, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "\u60c5\u5831\u51e6\u7406\u5b66\u4f1a\u7b2c 65 \u56de\u5168\u56fd\u5927\u4f1a (2003)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 183.10536, "t": 256.30029, "r": 190.8567, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "177", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 210.28223, "t": 256.30029, "r": 212.86539, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.29153, "t": 256.30029, "r": 240.04287999999997, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "176", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446, "t": 256.30029, "r": 264.6358, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "150", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.47742, "t": 256.30029, "r": 289.22876, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "236", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 55.53052099999999, "t": 264.30175999999994, "r": 129.88177, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "\u7b2c 17 \u56de\u4eba\u5de5\u77e5\u80fd\u5b66\u4f1a\u5168\u56fd\u5927\u4f1a (2003)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 183.10536, "t": 263.52739999999994, "r": 190.8567, "b": 267.88531, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "208", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 210.28223, "t": 263.52739999999994, "r": 212.86539, "b": 267.88531, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.29153, "t": 263.52739999999994, "r": 240.04287999999997, "b": 267.88531, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "203", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446, "t": 263.52739999999994, "r": 264.6358, "b": 267.88531, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "152", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.47742, "t": 263.52739999999994, "r": 289.22876, "b": 267.88531, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "244", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 55.53052099999999, "t": 271.52881, "r": 127.32454000000001, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "\u81ea\u7136\u8a00\u8a9e\u51e6\u7406\u7814\u7a76\u4f1a\u7b2c 146 \u301c 155 \u56de", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 184.39731, "t": 270.75446, "r": 189.56456, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "98", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 210.28223, "t": 270.75446, "r": 212.86539, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 233.58348, "t": 270.75446, "r": 238.75072999999998, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446, "t": 270.75446, "r": 264.6358, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "150", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.47742, "t": 270.75446, "r": 289.22876, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "232", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 55.53052099999999, "t": 279.01392, "r": 110.16829999999999, "b": 283.40436, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "WWW \u304b\u3089\u53ce\u96c6\u3057\u305f\u8ad6\u6587", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 183.10536, "t": 277.98157000000003, "r": 190.8567, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "107", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 208.99026, "t": 277.98157000000003, "r": 214.15752, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "73", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 233.58348, "t": 277.98157000000003, "r": 238.75072999999998, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "34", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446, "t": 277.98157000000003, "r": 264.6358, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "147", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 282.76938, "t": 277.98157000000003, "r": 287.93661, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "96", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 183.10536, "t": 285.46667, "r": 190.8567, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "945", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 207.69832, "t": 285.46667, "r": 215.44965999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "294", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.29153, "t": 285.46667, "r": 240.04287999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "651", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 255.76506, "t": 285.46667, "r": 265.75204, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "1122", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.47742, "t": 285.46667, "r": 289.22876, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "955", "column_header": false, "row_header": false, "row_section": false}]]}}, {"self_ref": "#/tables/7", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "table", "prov": [{"page_no": 8, "bbox": {"l": 304.9219970703125, "t": 573.4851379394531, "r": 550.2321166992188, "b": 504.09930419921875, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "data": {"table_cells": [{"bbox": {"l": 459.04861, "t": 221.62415, "r": 542.00018, "b": 232.89935000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 5, "text": "Weighted Average Grant Date Fair Value", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 393.2442, "t": 236.74712999999997, "r": 407.34631, "b": 241.81232, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "RS U s", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 392.09671, "t": 221.57446000000004, "r": 438.0145, "b": 226.63964999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 3, "text": "Shares (in millions)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 427.18323, "t": 236.74712999999997, "r": 440.98778999999996, "b": 241.81232, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "PSUs", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 468.38254, "t": 236.74712999999997, "r": 482.48465000000004, "b": 241.81232, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "RSUs", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 516.92578, "t": 236.74712999999997, "r": 530.73035, "b": 241.81232, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "PSUs", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 306.11493, "t": 244.61084000000005, "r": 364.65607, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Nonvested on Janua ry 1", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 396.24661, "t": 244.91327, "r": 403.75531, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "1. 1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 429.81838999999997, "t": 244.91327, "r": 437.32708999999994, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 465.52859, "t": 244.91327, "r": 483.55001999999996, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "90.10 $", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 513.44824, "t": 244.91327, "r": 531.46967, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "$ 91.19", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 306.11493, "t": 253.68451000000005, "r": 325.62674, "b": 258.74969, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Granted", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 396.24661, "t": 253.68451000000005, "r": 403.75531, "b": 258.74969, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "0. 5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 429.81838999999997, "t": 253.68451000000005, "r": 437.32708999999994, "b": 258.74969, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 466.43579000000005, "t": 253.68451000000005, "r": 482.54831, "b": 258.74969, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "117.44", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 514.29065, "t": 253.68451000000005, "r": 530.80981, "b": 258.74969, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "122.41", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 306.11493, "t": 261.54822, "r": 322.62866, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Vested", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 394.43222, "t": 261.54822, "r": 405.53625, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "(0. 5 )", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 427.7016, "t": 261.54822, "r": 438.80563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "(0.1)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 468.55533, "t": 261.54822, "r": 482.07043, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "87.08", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 516.01862, "t": 261.54822, "r": 529.53375, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "81.14", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 306.11493, "t": 269.64148, "r": 356.24771, "b": 274.70667000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Canceled or forfeited", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 394.43222, "t": 270.31946000000005, "r": 405.53625, "b": 275.38464, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "(0. 1 )", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 431.02802, "t": 270.31946000000005, "r": 436.4280099999999, "b": 275.38464, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 465.83099000000004, "t": 270.31946000000005, "r": 482.35013, "b": 275.38464, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "102.01", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 516.01862, "t": 270.31946000000005, "r": 529.53375, "b": 275.38464, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "92.18", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 306.11493, "t": 278.48572, "r": 373.35764, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Nonvested on December 31", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 396.24661, "t": 278.48572, "r": 403.75531, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "1.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 429.51599, "t": 278.48572, "r": 437.02469, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 463.7142, "t": 278.48572, "r": 484.73965000000004, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "104.85 $", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 512.99463, "t": 278.48572, "r": 534.02008, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "$ 104.51", "column_header": false, "row_header": false, "row_section": false}], "num_rows": 7, "num_cols": 5, "grid": [[{"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 392.09671, "t": 221.57446000000004, "r": 438.0145, "b": 226.63964999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 3, "text": "Shares (in millions)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 392.09671, "t": 221.57446000000004, "r": 438.0145, "b": 226.63964999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 3, "text": "Shares (in millions)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 459.04861, "t": 221.62415, "r": 542.00018, "b": 232.89935000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 5, "text": "Weighted Average Grant Date Fair Value", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 459.04861, "t": 221.62415, "r": 542.00018, "b": 232.89935000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 5, "text": "Weighted Average Grant Date Fair Value", "column_header": true, "row_header": false, "row_section": false}], [{"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 393.2442, "t": 236.74712999999997, "r": 407.34631, "b": 241.81232, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "RS U s", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 427.18323, "t": 236.74712999999997, "r": 440.98778999999996, "b": 241.81232, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "PSUs", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 468.38254, "t": 236.74712999999997, "r": 482.48465000000004, "b": 241.81232, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "RSUs", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 516.92578, "t": 236.74712999999997, "r": 530.73035, "b": 241.81232, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "PSUs", "column_header": true, "row_header": false, "row_section": false}], [{"bbox": {"l": 306.11493, "t": 244.61084000000005, "r": 364.65607, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Nonvested on Janua ry 1", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 396.24661, "t": 244.91327, "r": 403.75531, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "1. 1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 429.81838999999997, "t": 244.91327, "r": 437.32708999999994, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 465.52859, "t": 244.91327, "r": 483.55001999999996, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "90.10 $", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 513.44824, "t": 244.91327, "r": 531.46967, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "$ 91.19", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 306.11493, "t": 253.68451000000005, "r": 325.62674, "b": 258.74969, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Granted", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 396.24661, "t": 253.68451000000005, "r": 403.75531, "b": 258.74969, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "0. 5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 429.81838999999997, "t": 253.68451000000005, "r": 437.32708999999994, "b": 258.74969, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 466.43579000000005, "t": 253.68451000000005, "r": 482.54831, "b": 258.74969, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "117.44", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 514.29065, "t": 253.68451000000005, "r": 530.80981, "b": 258.74969, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "122.41", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 306.11493, "t": 261.54822, "r": 322.62866, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Vested", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 394.43222, "t": 261.54822, "r": 405.53625, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "(0. 5 )", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 427.7016, "t": 261.54822, "r": 438.80563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "(0.1)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 468.55533, "t": 261.54822, "r": 482.07043, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "87.08", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 516.01862, "t": 261.54822, "r": 529.53375, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "81.14", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 306.11493, "t": 269.64148, "r": 356.24771, "b": 274.70667000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Canceled or forfeited", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 394.43222, "t": 270.31946000000005, "r": 405.53625, "b": 275.38464, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "(0. 1 )", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 431.02802, "t": 270.31946000000005, "r": 436.4280099999999, "b": 275.38464, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 465.83099000000004, "t": 270.31946000000005, "r": 482.35013, "b": 275.38464, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "102.01", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 516.01862, "t": 270.31946000000005, "r": 529.53375, "b": 275.38464, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "92.18", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 306.11493, "t": 278.48572, "r": 373.35764, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Nonvested on December 31", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 396.24661, "t": 278.48572, "r": 403.75531, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "1.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 429.51599, "t": 278.48572, "r": 437.02469, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 463.7142, "t": 278.48572, "r": 484.73965000000004, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "104.85 $", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 512.99463, "t": 278.48572, "r": 534.02008, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "$ 104.51", "column_header": false, "row_header": false, "row_section": false}]]}}, {"self_ref": "#/tables/8", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "table", "prov": [{"page_no": 13, "bbox": {"l": 84.0283203125, "t": 635.6664581298828, "r": 239.1690673828125, "b": 577.6066589355469, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "data": {"table_cells": [], "num_rows": 0, "num_cols": 0, "grid": []}}, {"self_ref": "#/tables/9", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "table", "prov": [{"page_no": 13, "bbox": {"l": 82.92001342773438, "t": 558.2236785888672, "r": 239.1903533935547, "b": 500.716064453125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "data": {"table_cells": [], "num_rows": 0, "num_cols": 0, "grid": []}}, {"self_ref": "#/tables/10", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "table", "prov": [{"page_no": 13, "bbox": {"l": 83.94786071777344, "t": 482.9522705078125, "r": 239.17135620117188, "b": 424.0904235839844, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "data": {"table_cells": [], "num_rows": 0, "num_cols": 0, "grid": []}}, {"self_ref": "#/tables/11", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "table", "prov": [{"page_no": 13, "bbox": {"l": 83.31756591796875, "t": 395.9864501953125, "r": 248.873046875, "b": 304.7430114746094, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "data": {"table_cells": [], "num_rows": 0, "num_cols": 0, "grid": []}}, {"self_ref": "#/tables/12", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/501"}], "content_layer": "body", "label": "table", "prov": [{"page_no": 13, "bbox": {"l": 310.3294372558594, "t": 690.8223266601562, "r": 555.8338623046875, "b": 655.8524780273438, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [{"cref": "#/texts/501"}], "references": [], "footnotes": [], "image": null, "data": {"table_cells": [], "num_rows": 0, "num_cols": 0, "grid": []}}, {"self_ref": "#/tables/13", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "table", "prov": [{"page_no": 13, "bbox": {"l": 309.9566345214844, "t": 637.3855133056641, "r": 555.7466430664062, "b": 607.2774658203125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "data": {"table_cells": [], "num_rows": 0, "num_cols": 0, "grid": []}}, {"self_ref": "#/tables/14", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "table", "prov": [{"page_no": 13, "bbox": {"l": 309.9635314941406, "t": 596.2945861816406, "r": 555.7054443359375, "b": 558.4485473632812, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "data": {"table_cells": [], "num_rows": 0, "num_cols": 0, "grid": []}}, {"self_ref": "#/tables/15", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "table", "prov": [{"page_no": 13, "bbox": {"l": 309.79150390625, "t": 538.0946350097656, "r": 425.9603271484375, "b": 499.60601806640625, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "data": {"table_cells": [], "num_rows": 0, "num_cols": 0, "grid": []}}, {"self_ref": "#/tables/16", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/502"}], "content_layer": "body", "label": "table", "prov": [{"page_no": 13, "bbox": {"l": 335.2694091796875, "t": 403.53253173828125, "r": 490.081787109375, "b": 354.97760009765625, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [{"cref": "#/texts/502"}], "references": [], "footnotes": [], "image": null, "data": {"table_cells": [], "num_rows": 0, "num_cols": 0, "grid": []}}, {"self_ref": "#/tables/17", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "table", "prov": [{"page_no": 13, "bbox": {"l": 334.9334716796875, "t": 338.0523681640625, "r": 490.0914306640625, "b": 289.2789001464844, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "data": {"table_cells": [], "num_rows": 0, "num_cols": 0, "grid": []}}, {"self_ref": "#/tables/18", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "table", "prov": [{"page_no": 13, "bbox": {"l": 335.2545471191406, "t": 272.92431640625, "r": 490.22369384765625, "b": 224.31207275390625, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "data": {"table_cells": [], "num_rows": 0, "num_cols": 0, "grid": []}}, {"self_ref": "#/tables/19", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "table", "prov": [{"page_no": 13, "bbox": {"l": 333.9573669433594, "t": 198.8865966796875, "r": 518.4768676757812, "b": 126.5096435546875, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "data": {"table_cells": [], "num_rows": 0, "num_cols": 0, "grid": []}}, {"self_ref": "#/tables/20", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "table", "prov": [{"page_no": 14, "bbox": {"l": 51.72642135620117, "t": 518.3907165527344, "r": 283.114013671875, "b": 447.7554931640625, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "data": {"table_cells": [], "num_rows": 0, "num_cols": 0, "grid": []}}, {"self_ref": "#/tables/21", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "table", "prov": [{"page_no": 14, "bbox": {"l": 51.434879302978516, "t": 338.51251220703125, "r": 310.7267150878906, "b": 300.17974853515625, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "data": {"table_cells": [], "num_rows": 0, "num_cols": 0, "grid": []}}, {"self_ref": "#/tables/22", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "table", "prov": [{"page_no": 14, "bbox": {"l": 50.86823654174805, "t": 287.90374755859375, "r": 310.6080017089844, "b": 249.55401611328125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "data": {"table_cells": [], "num_rows": 0, "num_cols": 0, "grid": []}}, {"self_ref": "#/tables/23", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "table", "prov": [{"page_no": 14, "bbox": {"l": 51.27280807495117, "t": 238.271484375, "r": 311.0897216796875, "b": 200.086669921875, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "data": {"table_cells": [], "num_rows": 0, "num_cols": 0, "grid": []}}, {"self_ref": "#/tables/24", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "table", "prov": [{"page_no": 14, "bbox": {"l": 318.9809265136719, "t": 630.7653961181641, "r": 534.6229248046875, "b": 577.3739471435547, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "data": {"table_cells": [], "num_rows": 0, "num_cols": 0, "grid": []}}, {"self_ref": "#/tables/25", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "table", "prov": [{"page_no": 14, "bbox": {"l": 319.0057678222656, "t": 565.8936614990234, "r": 534.408935546875, "b": 512.1423034667969, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "data": {"table_cells": [], "num_rows": 0, "num_cols": 0, "grid": []}}, {"self_ref": "#/tables/26", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "table", "prov": [{"page_no": 14, "bbox": {"l": 328.1381530761719, "t": 503.3182067871094, "r": 523.8916015625, "b": 433.7275695800781, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "data": {"table_cells": [], "num_rows": 0, "num_cols": 0, "grid": []}}, {"self_ref": "#/tables/27", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/507"}], "content_layer": "body", "label": "table", "prov": [{"page_no": 14, "bbox": {"l": 319.4707946777344, "t": 361.09698486328125, "r": 518.5693359375, "b": 314.05645751953125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [{"cref": "#/texts/507"}], "references": [], "footnotes": [], "image": null, "data": {"table_cells": [], "num_rows": 0, "num_cols": 0, "grid": []}}, {"self_ref": "#/tables/28", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "table", "prov": [{"page_no": 14, "bbox": {"l": 319.982666015625, "t": 302.7562561035156, "r": 519.0963745117188, "b": 256.30419921875, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "data": {"table_cells": [], "num_rows": 0, "num_cols": 0, "grid": []}}, {"self_ref": "#/tables/29", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "table", "prov": [{"page_no": 14, "bbox": {"l": 319.8287658691406, "t": 245.5906982421875, "r": 519.6065673828125, "b": 198.8935546875, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "data": {"table_cells": [], "num_rows": 0, "num_cols": 0, "grid": []}}, {"self_ref": "#/tables/30", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "table", "prov": [{"page_no": 14, "bbox": {"l": 319.06494140625, "t": 182.1591796875, "r": 533.77392578125, "b": 122.80792236328125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "data": {"table_cells": [], "num_rows": 0, "num_cols": 0, "grid": []}}, {"self_ref": "#/tables/31", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "table", "prov": [{"page_no": 15, "bbox": {"l": 55.116363525390625, "t": 655.7449951171875, "r": 279.370849609375, "b": 542.6654510498047, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "data": {"table_cells": [], "num_rows": 0, "num_cols": 0, "grid": []}}, {"self_ref": "#/tables/32", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "table", "prov": [{"page_no": 15, "bbox": {"l": 54.28135299682617, "t": 531.7384338378906, "r": 279.2568359375, "b": 418.4729309082031, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "data": {"table_cells": [], "num_rows": 0, "num_cols": 0, "grid": []}}, {"self_ref": "#/tables/33", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/509"}], "content_layer": "body", "label": "table", "prov": [{"page_no": 15, "bbox": {"l": 323.0059509277344, "t": 670.4528503417969, "r": 525.95166015625, "b": 569.0885925292969, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [{"cref": "#/texts/509"}], "references": [], "footnotes": [], "image": null, "data": {"table_cells": [], "num_rows": 0, "num_cols": 0, "grid": []}}, {"self_ref": "#/tables/34", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "table", "prov": [{"page_no": 15, "bbox": {"l": 323.384765625, "t": 550.0270538330078, "r": 526.1268920898438, "b": 447.90789794921875, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "data": {"table_cells": [], "num_rows": 0, "num_cols": 0, "grid": []}}, {"self_ref": "#/tables/35", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "table", "prov": [{"page_no": 15, "bbox": {"l": 323.46868896484375, "t": 429.5491638183594, "r": 525.9569091796875, "b": 327.739501953125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "data": {"table_cells": [], "num_rows": 0, "num_cols": 0, "grid": []}}, {"self_ref": "#/tables/36", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "table", "prov": [{"page_no": 15, "bbox": {"l": 353.6920471191406, "t": 304.594970703125, "r": 495.4288024902344, "b": 156.22674560546875, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "data": {"table_cells": [], "num_rows": 0, "num_cols": 0, "grid": []}}, {"self_ref": "#/tables/37", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "table", "prov": [{"page_no": 15, "bbox": {"l": 50.64818572998047, "t": 286.01953125, "r": 319.9103088378906, "b": 160.736328125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "data": {"table_cells": [], "num_rows": 0, "num_cols": 0, "grid": []}}], "key_value_items": [], "form_items": [], "pages": {"1": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 1}, "2": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 2}, "3": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 3}, "4": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 4}, "5": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 5}, "6": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 6}, "7": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 7}, "8": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 8}, "9": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 9}, "10": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 10}, "11": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 11}, "12": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 12}, "13": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 13}, "14": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 14}, "15": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 15}, "16": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 16}}}
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v2/2203.01017v2.md b/tests/data/groundtruth/docling_v2/2203.01017v2.md
index 93559a9e..427423e2 100644
--- a/tests/data/groundtruth/docling_v2/2203.01017v2.md
+++ b/tests/data/groundtruth/docling_v2/2203.01017v2.md
@@ -8,24 +8,23 @@
 
 ## a. Picture of a table:
 
+Tables organize valuable content in a concise and compact representation. This content is extremely valuable for systems such as search engines, Knowledge Graph's, etc, since they enhance their predictive capabilities. Unfortunately, tables come in a large variety of shapes and sizes. Furthermore, they can have complex column/row-header configurations, multiline rows, different variety of separation lines, missing entries, etc. As such, the correct identification of the table-structure from an image is a nontrivial task. In this paper, we present a new table-structure identification model. The latter improves the latest end-toend deep learning model (i.e. encoder-dual-decoder from PubTabNet) in two significant ways. First, we introduce a new object detection decoder for table-cells. In this way, we can obtain the content of the table-cells from programmatic PDF's directly from the PDF source and avoid the training of the custom OCR decoders. This architectural change leads to more accurate table-content extraction and allows us to tackle non-english tables. Second, we replace the LSTM decoders with transformer based decoders. This upgrade improves significantly the previous state-of-the-art tree-editing-distance-score (TEDS) from 91% to 98.5% on simple tables and from 88.7% to 95% on complex tables.
+
 ## 1. Introduction
 
 The occurrence of tables in documents is ubiquitous. They often summarise quantitative or factual data, which is cumbersome to describe in verbose text but nevertheless extremely valuable. Unfortunately, this compact representation is often not easy to parse by machines. There are many implicit conventions used to obtain a compact table representation. For example, tables often have complex columnand row-headers in order to reduce duplicated cell content. Lines of different shapes and sizes are leveraged to separate content or indicate a tree structure. Additionally, tables can also have empty/missing table-entries or multi-row textual table-entries. Fig. 1 shows a table which presents all these issues.
 
 <!-- image -->
 
-Tables organize valuable content in a concise and compact representation. This content is extremely valuable for systems such as search engines, Knowledge Graph's, etc, since they enhance their predictive capabilities. Unfortunately, tables come in a large variety of shapes and sizes. Furthermore, they can have complex column/row-header configurations, multiline rows, different variety of separation lines, missing entries, etc. As such, the correct identification of the table-structure from an image is a nontrivial task. In this paper, we present a new table-structure identification model. The latter improves the latest end-toend deep learning model (i.e. encoder-dual-decoder from PubTabNet) in two significant ways. First, we introduce a new object detection decoder for table-cells. In this way, we can obtain the content of the table-cells from programmatic PDF's directly from the PDF source and avoid the training of the custom OCR decoders. This architectural change leads to more accurate table-content extraction and allows us to tackle non-english tables. Second, we replace the LSTM decoders with transformer based decoders. This upgrade improves significantly the previous state-of-the-art tree-editing-distance-score (TEDS) from 91% to 98.5% on simple tables and from 88.7% to 95% on complex tables.
-
 - b. Red-annotation of bounding boxes, Blue-predictions by TableFormer
-
-<!-- image -->
-
 - c. Structure predicted by TableFormer:
 
 <!-- image -->
 
 Figure 1: Picture of a table with subtle, complex features such as (1) multi-column headers, (2) cell with multi-row text and (3) cells with no content. Image from PubTabNet evaluation set, filename: 'PMC2944238 004 02'.
 
+<!-- image -->
+
 | 0   |   1 | 1   |   2 1 |   2 1 |    |
 |-----|-----|-----|-------|-------|----|
 | 3   |   4 | 5 3 |     6 |     7 |    |
@@ -52,11 +51,11 @@ To meet the design criteria listed above, we developed a new model called TableF
 
 The paper is structured as follows. In Sec. 2, we give a brief overview of the current state-of-the-art. In Sec. 3, we describe the datasets on which we train. In Sec. 4, we introduce the TableFormer model-architecture and describe
 
-its results & performance in Sec. 5. As a conclusion, we describe how this new model-architecture can be re-purposed for other tasks in the computer-vision community.
+its results &amp; performance in Sec. 5. As a conclusion, we describe how this new model-architecture can be re-purposed for other tasks in the computer-vision community.
 
 ## 2. Previous work and State of the Art
 
-Identifying the structure of a table has been an outstanding problem in the document-parsing community, that motivates many organised public challenges [6, 4, 14]. The difficulty of the problem can be attributed to a number of factors. First, there is a large variety in the shapes and sizes of tables. Such large variety requires a flexible method. This is especially true for complex column- and row headers, which can be extremely intricate and demanding. A second factor of complexity is the lack of data with regard to table-structure. Until the publication of PubTabNet [37], there were no large datasets (i.e. > 100 K tables) that provided structure information. This happens primarily due to the fact that tables are notoriously time-consuming to annotate by hand. However, this has definitely changed in recent years with the deliverance of PubTabNet [37], FinTabNet [36], TableBank [17] etc.
+Identifying the structure of a table has been an outstanding problem in the document-parsing community, that motivates many organised public challenges [6, 4, 14]. The difficulty of the problem can be attributed to a number of factors. First, there is a large variety in the shapes and sizes of tables. Such large variety requires a flexible method. This is especially true for complex column- and row headers, which can be extremely intricate and demanding. A second factor of complexity is the lack of data with regard to table-structure. Until the publication of PubTabNet [37], there were no large datasets (i.e. &gt; 100 K tables) that provided structure information. This happens primarily due to the fact that tables are notoriously time-consuming to annotate by hand. However, this has definitely changed in recent years with the deliverance of PubTabNet [37], FinTabNet [36], TableBank [17] etc.
 
 Before the rising popularity of deep neural networks, the community relied heavily on heuristic and/or statistical methods to do table structure identification [3, 7, 11, 5, 13, 28]. Although such methods work well on constrained tables [12], a more data-driven approach can be applied due to the advent of convolutional neural networks (CNNs) and the availability of large datasets. To the best-of-our knowledge, there are currently two different types of network architecture that are being pursued for state-of-the-art tablestructure identification.
 
@@ -115,7 +114,7 @@ Given the image of a table, TableFormer is able to predict: 1) a sequence of tok
 
 ## 4.1. Model architecture.
 
-We now describe in detail the proposed method, which is composed of three main components, see Fig. 4. Our CNN Backbone Network encodes the input as a feature vector of predefined length. The input feature vector of the encoded image is passed to the Structure Decoder to produce a sequence of HTML tags that represent the structure of the table. With each prediction of an HTML standard data cell (' < td > ') the hidden state of that cell is passed to the Cell BBox Decoder. As for spanning cells, such as row or column span, the tag is broken down to ' < ', 'rowspan=' or 'colspan=', with the number of spanning cells (attribute), and ' > '. The hidden state attached to ' < ' is passed to the Cell BBox Decoder. A shared feed forward network (FFN) receives the hidden states from the Structure Decoder, to provide the final detection predictions of the bounding box coordinates and their classification.
+We now describe in detail the proposed method, which is composed of three main components, see Fig. 4. Our CNN Backbone Network encodes the input as a feature vector of predefined length. The input feature vector of the encoded image is passed to the Structure Decoder to produce a sequence of HTML tags that represent the structure of the table. With each prediction of an HTML standard data cell (' &lt; td &gt; ') the hidden state of that cell is passed to the Cell BBox Decoder. As for spanning cells, such as row or column span, the tag is broken down to ' &lt; ', 'rowspan=' or 'colspan=', with the number of spanning cells (attribute), and ' &gt; '. The hidden state attached to ' &lt; ' is passed to the Cell BBox Decoder. A shared feed forward network (FFN) receives the hidden states from the Structure Decoder, to provide the final detection predictions of the bounding box coordinates and their classification.
 
 CNN Backbone Network. A ResNet-18 CNN is the backbone that receives the table image and encodes it as a vector of predefined length. The network has been modified by removing the linear and pooling layer, as we are not per-
 
@@ -123,7 +122,7 @@ Figure 3: TableFormer takes in an image of the PDF and creates bounding box and
 
 <!-- image -->
 
-Figure 4: Given an input image of a table, the Encoder produces fixed-length features that represent the input image. The features are then passed to both the Structure Decoder and Cell BBox Decoder . During training, the Structure Decoder receives 'tokenized tags' of the HTML code that represent the table structure. Afterwards, a transformer encoder and decoder architecture is employed to produce features that are received by a linear layer, and the Cell BBox Decoder. The linear layer is applied to the features to predict the tags. Simultaneously, the Cell BBox Decoder selects features referring to the data cells (' < td > ', ' < ') and passes them through an attention network, an MLP, and a linear layer to predict the bounding boxes.
+Figure 4: Given an input image of a table, the Encoder produces fixed-length features that represent the input image. The features are then passed to both the Structure Decoder and Cell BBox Decoder . During training, the Structure Decoder receives 'tokenized tags' of the HTML code that represent the table structure. Afterwards, a transformer encoder and decoder architecture is employed to produce features that are received by a linear layer, and the Cell BBox Decoder. The linear layer is applied to the features to predict the tags. Simultaneously, the Cell BBox Decoder selects features referring to the data cells (' &lt; td &gt; ', ' &lt; ') and passes them through an attention network, an MLP, and a linear layer to predict the bounding boxes.
 
 <!-- image -->
 
@@ -133,7 +132,7 @@ Structure Decoder. The transformer architecture of this component is based on th
 
 The transformer encoder receives an encoded image from the CNN Backbone Network and refines it through a multi-head dot-product attention layer, followed by a Feed Forward Network. During training, the transformer decoder receives as input the output feature produced by the transformer encoder, and the tokenized input of the HTML ground-truth tags. Using a stack of multi-head attention layers, different aspects of the tag sequence could be inferred. This is achieved by each attention head on a layer operating in a different subspace, and then combining altogether their attention score.
 
-Cell BBox Decoder. Our architecture allows to simultaneously predict HTML tags and bounding boxes for each table cell without the need of a separate object detector end to end. This approach is inspired by DETR [1] which employs a Transformer Encoder, and Decoder that looks for a specific number of object queries (potential object detections). As our model utilizes a transformer architecture, the hidden state of the < td > ' and ' < ' HTML structure tags become the object query.
+Cell BBox Decoder. Our architecture allows to simultaneously predict HTML tags and bounding boxes for each table cell without the need of a separate object detector end to end. This approach is inspired by DETR [1] which employs a Transformer Encoder, and Decoder that looks for a specific number of object queries (potential object detections). As our model utilizes a transformer architecture, the hidden state of the &lt; td &gt; ' and ' &lt; ' HTML structure tags become the object query.
 
 The encoding generated by the CNN Backbone Network along with the features acquired for every data cell from the Transformer Decoder are then passed to the attention network. The attention network takes both inputs and learns to provide an attention weighted encoding. This weighted at-
 
@@ -145,9 +144,9 @@ Loss Functions. We formulate a multi-task loss Eq. 2 to train our network. The C
 
 The loss used to train the TableFormer can be defined as following:
 
-$$l$\_{box}$ = λ$\_{iou}$l$\_{iou}$ + λ$\_{l}$$_{1}$ l = λl$_{s}$ + (1 - λ ) l$_{box}$ (1)$$
+<!-- formula-not-decoded -->
 
-where λ ∈ [0, 1], and λ$\_{iou}$, λ$\_{l}$$_{1}$ ∈$_{R}$ are hyper-parameters.
+where λ ∈ [0, 1], and λ$_{iou}$, λ$_{l}$$\_{1}$ ∈$\_{R}$ are hyper-parameters.
 
 ## 5. Experimental Results
 
@@ -155,11 +154,9 @@ where λ ∈ [0, 1], and λ$\_{iou}$, λ$\_{l}$$_{1}$ ∈$_{R}$ are hyper-parame
 
 TableFormer uses ResNet-18 as the CNN Backbone Network . The input images are resized to 448*448 pixels and the feature map has a dimension of 28*28. Additionally, we enforce the following input constraints:
 
-$$Image width and height ≤ 1024 pixels Structural tags length ≤ 512 tokens. (2)$$
+<!-- formula-not-decoded -->
 
-Although input constraints are used also by other methods, such as EDD, ours are less restrictive due to the improved
-
-runtime performance and lower memory footprint of TableFormer. This allows to utilize input samples with longer sequences and images with larger dimensions.
+Although input constraints are used also by other methods, such as EDD, ours are less restrictive due to the improved runtime performance and lower memory footprint of TableFormer. This allows to utilize input samples with longer sequences and images with larger dimensions.
 
 The Transformer Encoder consists of two "Transformer Encoder Layers", with an input feature size of 512, feed forward network of 1024, and 4 attention heads. As for the Transformer Decoder it is composed of four "Transformer Decoder Layers" with similar input and output dimensions as the "Transformer Encoder Layers". Even though our model uses fewer layers and heads than the default implementation parameters, our extensive experimentation has proved this setup to be more suitable for table images. We attribute this finding to the inherent design of table images, which contain mostly lines and text, unlike the more elaborate content present in other scopes (e.g. the COCO dataset). Moreover, we have added ResNet blocks to the inputs of the Structure Decoder and Cell BBox Decoder. This prevents a decoder having a stronger influence over the learned weights which would damage the other prediction task (structure vs bounding boxes), but learn task specific weights instead. Lastly our dropout layers are set to 0.5.
 
@@ -177,7 +174,7 @@ We also share our baseline results on the challenging SynthTabNet dataset. Throu
 
 The Tree-Edit-Distance-Based Similarity (TEDS) metric was introduced in [37]. It represents the prediction, and ground-truth as a tree structure of HTML tags. This similarity is calculated as:
 
-$$TEDS ( T$\_{a}$, T$\_{b}$ ) = 1 - EditDist ( T$\_{a}$, T$\_{b}$ ) max ( | T$\_{a}$ | , | T$\_{b}$ | ) (3)$$
+<!-- formula-not-decoded -->
 
 where T$_{a}$ and T$_{b}$ represent tables in tree structure HTML format. EditDist denotes the tree-edit distance, and | T | represents the number of nodes in T .
 
@@ -185,8 +182,6 @@ where T$_{a}$ and T$_{b}$ represent tables in tree structure HTML format. EditDi
 
 Structure. As shown in Tab. 2, TableFormer outperforms all SOTA methods across different datasets by a large margin for predicting the table structure from an image. All the more, our model outperforms pre-trained methods. During the evaluation we do not apply any table filtering. We also provide our baseline results on the SynthTabNet dataset. It has been observed that large tables (e.g. tables that occupy half of the page or more) yield poor predictions. We attribute this issue to the image resizing during the preprocessing step, that produces downsampled images with indistinguishable features. This problem can be addressed by treating such big tables with a separate model which accepts a large input image size.
 
-Table 2: Structure results on PubTabNet (PTN), FinTabNet (FTN), TableBank (TB) and SynthTabNet (STN).
-
 | Model       | Dataset   | Simple   | TEDS Complex   |   All |
 |-------------|-----------|----------|----------------|-------|
 | EDD         | PTN       | 91.1     | 88.7           | 89.9  |
@@ -200,11 +195,11 @@ Table 2: Structure results on PubTabNet (PTN), FinTabNet (FTN), TableBank (TB) a
 | TableFormer | TB        | 89.6     | -              | 89.6  |
 | TableFormer | STN       | 96.9     | 95.7           | 96.7  |
 
+Table 2: Structure results on PubTabNet (PTN), FinTabNet (FTN), TableBank (TB) and SynthTabNet (STN).
+
 FT: Model was trained on PubTabNet then finetuned.
 
-Cell Detection. Like any object detector, our Cell BBox Detector provides bounding boxes that can be improved with post-processing during inference. We make use of the grid-like structure of tables to refine the predictions. A detailed explanation on the post-processing is available in the supplementary material. As shown in Tab. 3, we evaluate
-
-our Cell BBox Decoder accuracy for cells with a class label of 'content' only using the PASCAL VOC mAP metric for pre-processing and post-processing. Note that we do not have post-processing results for SynthTabNet as images are only provided. To compare the performance of our proposed approach, we've integrated TableFormer's Cell BBox Decoder into EDD architecture. As mentioned previously, the Structure Decoder provides the Cell BBox Decoder with the features needed to predict the bounding box predictions. Therefore, the accuracy of the Structure Decoder directly influences the accuracy of the Cell BBox Decoder . If the Structure Decoder predicts an extra column, this will result in an extra column of predicted bounding boxes.
+Cell Detection. Like any object detector, our Cell BBox Detector provides bounding boxes that can be improved with post-processing during inference. We make use of the grid-like structure of tables to refine the predictions. A detailed explanation on the post-processing is available in the supplementary material. As shown in Tab. 3, we evaluate our Cell BBox Decoder accuracy for cells with a class label of 'content' only using the PASCAL VOC mAP metric for pre-processing and post-processing. Note that we do not have post-processing results for SynthTabNet as images are only provided. To compare the performance of our proposed approach, we've integrated TableFormer's Cell BBox Decoder into EDD architecture. As mentioned previously, the Structure Decoder provides the Cell BBox Decoder with the features needed to predict the bounding box predictions. Therefore, the accuracy of the Structure Decoder directly influences the accuracy of the Cell BBox Decoder . If the Structure Decoder predicts an extra column, this will result in an extra column of predicted bounding boxes.
 
 Table 3: Cell Bounding Box detection results on PubTabNet, and FinTabNet. PP: Post-processing.
 
@@ -240,6 +235,8 @@ b. Structure predicted by TableFormer, with superimposed matched PDF cell text:
 
 <!-- image -->
 
+Text is aligned to match original for ease of viewing
+
 |                                                    |             | 論文ファイル   | 論文ファイル   | 参考文献   | 参考文献   |
 |----------------------------------------------------|-------------|----------------|----------------|------------|------------|
 | 出典                                               | ファイル 数 | 英語           | 日本語         | 英語       | 日本語     |
@@ -252,8 +249,6 @@ b. Structure predicted by TableFormer, with superimposed matched PDF cell text:
 | WWW から収集した論文                               | 107         | 73             | 34             | 147        | 96         |
 |                                                    | 945         | 294            | 651            | 1122       | 955        |
 
-Text is aligned to match original for ease of viewing
-
 |                          | Shares (in millions)   | Shares (in millions)   | Weighted Average Grant Date Fair Value   | Weighted Average Grant Date Fair Value   |
 |--------------------------|------------------------|------------------------|------------------------------------------|------------------------------------------|
 |                          | RS U s                 | PSUs                   | RSUs                                     | PSUs                                     |
@@ -263,21 +258,21 @@ Text is aligned to match original for ease of viewing
 | Canceled or forfeited    | (0. 1 )                | -                      | 102.01                                   | 92.18                                    |
 | Nonvested on December 31 | 1.0                    | 0.3                    | 104.85 $                                 | $ 104.51                                 |
 
+Figure 6: An example of TableFormer predictions (bounding boxes and structure) from generated SynthTabNet table.
+
+<!-- image -->
+
 Figure 5: One of the benefits of TableFormer is that it is language agnostic, as an example, the left part of the illustration demonstrates TableFormer predictions on previously unseen language (Japanese). Additionally, we see that TableFormer is robust to variability in style and content, right side of the illustration shows the example of the TableFormer prediction from the FinTabNet dataset.
 
 <!-- image -->
 
 <!-- image -->
 
-Figure 6: An example of TableFormer predictions (bounding boxes and structure) from generated SynthTabNet table.
-
-<!-- image -->
-
 ## 5.5. Qualitative Analysis
 
-We showcase several visualizations for the different components of our network on various "complex" tables within datasets presented in this work in Fig. 5 and Fig. 6 As it is shown, our model is able to predict bounding boxes for all table cells, even for the empty ones. Additionally, our post-processing techniques can extract the cell content by matching the predicted bounding boxes to the PDF cells based on their overlap and spatial proximity. The left part of Fig. 5 demonstrates also the adaptability of our method to any language, as it can successfully extract Japanese text, although the training set contains only English content. We provide more visualizations including the intermediate steps in the supplementary material. Overall these illustrations justify the versatility of our method across a diverse range of table appearances and content type.
+## 6. Future Work &amp; Conclusion
 
-## 6. Future Work & Conclusion
+We showcase several visualizations for the different components of our network on various "complex" tables within datasets presented in this work in Fig. 5 and Fig. 6 As it is shown, our model is able to predict bounding boxes for all table cells, even for the empty ones. Additionally, our post-processing techniques can extract the cell content by matching the predicted bounding boxes to the PDF cells based on their overlap and spatial proximity. The left part of Fig. 5 demonstrates also the adaptability of our method to any language, as it can successfully extract Japanese text, although the training set contains only English content. We provide more visualizations including the intermediate steps in the supplementary material. Overall these illustrations justify the versatility of our method across a diverse range of table appearances and content type.
 
 In this paper, we presented TableFormer an end-to-end transformer based approach to predict table structures and bounding boxes of cells from an image. This approach enables us to recreate the table structure, and extract the cell content from PDF or OCR by using bounding boxes. Additionally, it provides the versatility required in real-world scenarios when dealing with various types of PDF documents, and languages. Furthermore, our method outperforms all state-of-the-arts with a wide margin. Finally, we introduce "SynthTabNet" a challenging synthetically generated dataset that reinforces missing characteristics from other datasets.
 
@@ -288,26 +283,25 @@ In this paper, we presented TableFormer an end-to-end transformer based approach
 - end object detection with transformers. In Andrea Vedaldi, Horst Bischof, Thomas Brox, and Jan-Michael Frahm, editors, Computer Vision - ECCV 2020 , pages 213-229, Cham, 2020. Springer International Publishing. 5
 - [2] Zewen Chi, Heyan Huang, Heng-Da Xu, Houjin Yu, Wanxuan Yin, and Xian-Ling Mao. Complicated table structure recognition. arXiv preprint arXiv:1908.04729 , 2019. 3
 - [3] Bertrand Couasnon and Aurelie Lemaitre. Recognition of Tables and Forms , pages 647-677. Springer London, London, 2014. 2
-- [4] Herv'e D'ejean, Jean-Luc Meunier, Liangcai Gao, Yilun Huang, Yu Fang, Florian Kleber, and Eva-Maria Lang. ICDAR 2019 Competition on Table Detection and Recognition (cTDaR), Apr. 2019. http://sac.founderit.com/. 2
+- [4] Herv´e D´ejean, Jean-Luc Meunier, Liangcai Gao, Yilun Huang, Yu Fang, Florian Kleber, and Eva-Maria Lang. ICDAR 2019 Competition on Table Detection and Recognition (cTDaR), Apr. 2019. http://sac.founderit.com/. 2
 - [5] Basilios Gatos, Dimitrios Danatsas, Ioannis Pratikakis, and Stavros J Perantonis. Automatic table detection in document images. In International Conference on Pattern Recognition and Image Analysis , pages 609-618. Springer, 2005. 2
-- [6] Max Gobel, Tamir Hassan, Ermelinda Oro, and Giorgio Orsi. Icdar 2013 table competition. In 2013 12th International Conference on Document Analysis and Recognition , pages 1449-1453, 2013. 2
+- [6] Max G¨obel, Tamir Hassan, Ermelinda Oro, and Giorgio Orsi. Icdar 2013 table competition. In 2013 12th International Conference on Document Analysis and Recognition , pages 1449-1453, 2013. 2
 - [7] EA Green and M Krishnamoorthy. Recognition of tables using table grammars. procs. In Symposium on Document Analysis and Recognition (SDAIR'95) , pages 261-277. 2
 - [8] Khurram Azeem Hashmi, Alain Pagani, Marcus Liwicki, Didier Stricker, and Muhammad Zeshan Afzal. Castabdetectors: Cascade network for table detection in document images with recursive feature pyramid and switchable atrous convolution. Journal of Imaging , 7(10), 2021. 1
 - [9] Kaiming He, Georgia Gkioxari, Piotr Dollar, and Ross Girshick. Mask r-cnn. In Proceedings of the IEEE International Conference on Computer Vision (ICCV) , Oct 2017. 1
 - [10] Yelin He, X. Qi, Jiaquan Ye, Peng Gao, Yihao Chen, Bingcong Li, Xin Tang, and Rong Xiao. Pingan-vcgroup's solution for icdar 2021 competition on scientific table image recognition to latex. ArXiv , abs/2105.01846, 2021. 2
 - [11] Jianying Hu, Ramanujan S Kashi, Daniel P Lopresti, and Gordon Wilfong. Medium-independent table detection. In Document Recognition and Retrieval VII , volume 3967, pages 291-302. International Society for Optics and Photonics, 1999. 2
 - [12] Matthew Hurst. A constraint-based approach to table structure derivation. In Proceedings of the Seventh International Conference on Document Analysis and Recognition - Volume 2 , ICDAR '03, page 911, USA, 2003. IEEE Computer Society. 2
-- [13] Thotreingam Kasar, Philippine Barlas, Sebastien Adam, Cl'ement Chatelain, and Thierry Paquet. Learning to detect tables in scanned document images using line information. In 2013 12th International Conference on Document Analysis and Recognition , pages 1185-1189. IEEE, 2013. 2
+- [13] Thotreingam Kasar, Philippine Barlas, Sebastien Adam, Cl´ement Chatelain, and Thierry Paquet. Learning to detect tables in scanned document images using line information. In 2013 12th International Conference on Document Analysis and Recognition , pages 1185-1189. IEEE, 2013. 2
 - [14] Pratik Kayal, Mrinal Anand, Harsh Desai, and Mayank Singh. Icdar 2021 competition on scientific table image recognition to latex, 2021. 2
 - [15] Harold W Kuhn. The hungarian method for the assignment problem. Naval research logistics quarterly , 2(1-2):83-97, 1955. 6
-
 - [16] Girish Kulkarni, Visruth Premraj, Vicente Ordonez, Sagnik Dhar, Siming Li, Yejin Choi, Alexander C. Berg, and Tamara L. Berg. Babytalk: Understanding and generating simple image descriptions. IEEE Transactions on Pattern Analysis and Machine Intelligence , 35(12):2891-2903, 2013. 4
 - [17] Minghao Li, Lei Cui, Shaohan Huang, Furu Wei, Ming Zhou, and Zhoujun Li. Tablebank: A benchmark dataset for table detection and recognition, 2019. 2, 3
 - [18] Yiren Li, Zheng Huang, Junchi Yan, Yi Zhou, Fan Ye, and Xianhui Liu. Gfte: Graph-based financial table extraction. In Alberto Del Bimbo, Rita Cucchiara, Stan Sclaroff, Giovanni Maria Farinella, Tao Mei, Marco Bertini, Hugo Jair Escalante, and Roberto Vezzani, editors, Pattern Recognition. ICPR International Workshops and Challenges , pages 644-658, Cham, 2021. Springer International Publishing. 2, 3
 - [19] Nikolaos Livathinos, Cesar Berrospi, Maksym Lysak, Viktor Kuropiatnyk, Ahmed Nassar, Andre Carvalho, Michele Dolfi, Christoph Auer, Kasper Dinkla, and Peter Staar. Robust pdf document conversion using recurrent neural networks. Proceedings of the AAAI Conference on Artificial Intelligence , 35(17):15137-15145, May 2021. 1
 - [20] Rujiao Long, Wen Wang, Nan Xue, Feiyu Gao, Zhibo Yang, Yongpan Wang, and Gui-Song Xia. Parsing table structures in the wild. In Proceedings of the IEEE/CVF International Conference on Computer Vision , pages 944-952, 2021. 2
 - [21] Shubham Singh Paliwal, D Vishwanath, Rohit Rahul, Monika Sharma, and Lovekesh Vig. Tablenet: Deep learning model for end-to-end table detection and tabular data extraction from scanned document images. In 2019 International Conference on Document Analysis and Recognition (ICDAR) , pages 128-133. IEEE, 2019. 1
-- [22] Adam Paszke, Sam Gross, Francisco Massa, Adam Lerer, James Bradbury, Gregory Chanan, Trevor Killeen, Zeming Lin, Natalia Gimelshein, Luca Antiga, Alban Desmaison, Andreas Kopf, Edward Yang, Zachary DeVito, Martin Raison, Alykhan Tejani, Sasank Chilamkurthy, Benoit Steiner, Lu Fang, Junjie Bai, and Soumith Chintala. Pytorch: An imperative style, high-performance deep learning library. In H. Wallach, H. Larochelle, A. Beygelzimer, F. d'Alch'e-Buc, E. Fox, and R. Garnett, editors, Advances in Neural Information Processing Systems 32 , pages 8024-8035. Curran Associates, Inc., 2019. 6
+- [22] Adam Paszke, Sam Gross, Francisco Massa, Adam Lerer, James Bradbury, Gregory Chanan, Trevor Killeen, Zeming Lin, Natalia Gimelshein, Luca Antiga, Alban Desmaison, Andreas Kopf, Edward Yang, Zachary DeVito, Martin Raison, Alykhan Tejani, Sasank Chilamkurthy, Benoit Steiner, Lu Fang, Junjie Bai, and Soumith Chintala. Pytorch: An imperative style, high-performance deep learning library. In H. Wallach, H. Larochelle, A. Beygelzimer, F. d'Alch´e-Buc, E. Fox, and R. Garnett, editors, Advances in Neural Information Processing Systems 32 , pages 8024-8035. Curran Associates, Inc., 2019. 6
 - [23] Devashish Prasad, Ayan Gadpal, Kshitij Kapadni, Manish Visave, and Kavita Sultanpure. Cascadetabnet: An approach for end to end table detection and structure recognition from image-based documents. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition Workshops , pages 572-573, 2020. 1
 - [24] Shah Rukh Qasim, Hassan Mahmood, and Faisal Shafait. Rethinking table recognition using graph neural networks. In 2019 International Conference on Document Analysis and Recognition (ICDAR) , pages 142-147. IEEE, 2019. 3
 - [25] Hamid Rezatofighi, Nathan Tsoi, JunYoung Gwak, Amir Sadeghian, Ian Reid, and Silvio Savarese. Generalized intersection over union: A metric and a loss for bounding box regression. In Proceedings of the IEEE/CVF Conference on
@@ -326,7 +320,6 @@ Computer Vision and Pattern Recognition , pages 658-666, 2019. 6
 - [35] Quanzeng You, Hailin Jin, Zhaowen Wang, Chen Fang, and Jiebo Luo. Image captioning with semantic attention. In Proceedings of the IEEE conference on computer vision and pattern recognition , pages 4651-4659, 2016. 4
 - [36] Xinyi Zheng, Doug Burdick, Lucian Popa, Peter Zhong, and Nancy Xin Ru Wang. Global table extractor (gte): A framework for joint table identification and cell structure recognition using visual context. Winter Conference for Applications in Computer Vision (WACV) , 2021. 2, 3
 - [37] Xu Zhong, Elaheh ShafieiBavani, and Antonio Jimeno Yepes. Image-based table recognition: Data, model,
-
 - and evaluation. In Andrea Vedaldi, Horst Bischof, Thomas Brox, and Jan-Michael Frahm, editors, Computer Vision ECCV 2020 , pages 564-580, Cham, 2020. Springer International Publishing. 2, 3, 7
 - [38] Xu Zhong, Jianbin Tang, and Antonio Jimeno Yepes. Publaynet: Largest dataset ever for document layout analysis. In 2019 International Conference on Document Analysis and Recognition (ICDAR) , pages 1015-1022, 2019. 1
 
@@ -344,9 +337,7 @@ Figure 7 illustrates the distribution of the tables across different dimensions
 
 ## 1.2. Synthetic datasets
 
-Aiming to train and evaluate our models in a broader spectrum of table data we have synthesized four types of datasets. Each one contains tables with different appear-
-
-ances in regard to their size, structure, style and content. Every synthetic dataset contains 150k examples, summing up to 600k synthetic examples. All datasets are divided into Train, Test and Val splits (80%, 10%, 10%).
+Aiming to train and evaluate our models in a broader spectrum of table data we have synthesized four types of datasets. Each one contains tables with different appear- ances in regard to their size, structure, style and content. Every synthetic dataset contains 150k examples, summing up to 600k synthetic examples. All datasets are divided into Train, Test and Val splits (80%, 10%, 10%).
 
 The process of generating a synthetic dataset can be decomposed into the following steps:
 
@@ -367,6 +358,8 @@ Figure 7: Distribution of the tables across different dimensions per dataset. Si
 - · TableFormer output does not include the table cell content.
 - · There are occasional inaccuracies in the predictions of the bounding boxes.
 
+dian cell size for all table cells. The usage of median during the computations, helps to eliminate outliers caused by occasional column spans which are usually wider than the normal.
+
 However, it is possible to mitigate those limitations by combining the TableFormer predictions with the information already present inside a programmatic PDF document. More specifically, PDF documents can be seen as a sequence of PDF cells where each cell is described by its content and bounding box. If we are able to associate the PDF cells with the predicted table cells, we can directly link the PDF cell content to the table cell structure and use the PDF bounding boxes to correct misalignments in the predicted table cell bounding boxes.
 
 Here is a step-by-step description of the prediction postprocessing:
@@ -377,14 +370,11 @@ Here is a step-by-step description of the prediction postprocessing:
 - 3.a. If all IOU scores in a column are below the threshold, discard all predictions (structure and bounding boxes) for that column.
 - 4. Find the best-fitting content alignment for the predicted cells with good IOU per each column. The alignment of the column can be identified by the following formula:
 
-$$alignment = arg min c { D$\_{c}$ } D$\_{c}$ = max { x$\_{c}$ } - min { x$\_{c}$ } (4)$$
+<!-- formula-not-decoded -->
 
 where c is one of { left, centroid, right } and x$_{c}$ is the xcoordinate for the corresponding point.
 
 - 5. Use the alignment computed in step 4, to compute the median x -coordinate for all table columns and the me-
-
-dian cell size for all table cells. The usage of median during the computations, helps to eliminate outliers caused by occasional column spans which are usually wider than the normal.
-
 - 6. Snap all cells with bad IOU to their corresponding median x -coordinates and cell sizes.
 - 7. Generate a new set of pair-wise matches between the corrected bounding boxes and PDF cells. This time use a modified version of the IOU metric, where the area of the intersection between the predicted and PDF cells is divided by the PDF cell area. In case there are multiple matches for the same PDF cell, the prediction with the higher score is preferred. This covers the cases where the PDF cells are smaller than the area of predicted or corrected prediction cells.
 - 8. In some rare occasions, we have noticed that TableFormer can confuse a single column as two. When the postprocessing steps are applied, this results with two predicted columns pointing to the same PDF column. In such case we must de-duplicate the columns according to highest total column intersection score.
@@ -403,21 +393,15 @@ phan cell.
 
 Aditional images with examples of TableFormer predictions and post-processing can be found below.
 
-Figure 8: Example of a table with multi-line header.
-
-<!-- image -->
-
 Figure 9: Example of a table with big empty distance between cells.
 
 <!-- image -->
 
 Figure 10: Example of a complex table with empty cells.
 
-Figure 11: Simple table with different style and empty cells.
-
 <!-- image -->
 
-Figure 12: Simple table predictions and post processing.
+<!-- image -->
 
 <!-- image -->
 
@@ -441,8 +425,6 @@ Figure 15: Example with triangular table.
 
 <!-- image -->
 
-Figure 16: Example of how post-processing helps to restore mis-aligned bounding boxes prediction artifact.
-
 Figure 17: Example of long table. End-to-end example from initial PDF cells to prediction of bounding boxes, post processing and prediction of structure.
 
 <!-- image -->
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v2/2203.01017v2.pages.json b/tests/data/groundtruth/docling_v2/2203.01017v2.pages.json
index fa6caa34..21d69253 100644
--- a/tests/data/groundtruth/docling_v2/2203.01017v2.pages.json
+++ b/tests/data/groundtruth/docling_v2/2203.01017v2.pages.json
@@ -1 +1 @@
-[{"page_no": 0, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "TableFormer: Table Structure Understanding with Transformers.", "bbox": {"l": 96.301003, "t": 107.03412000000003, "r": 498.92708999999996, "b": 119.93133999999998, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Ahmed Nassar, Nikolaos Livathinos, Maksym Lysak, Peter Staar", "bbox": {"l": 142.47701, "t": 146.68535999999995, "r": 452.75027, "b": 157.37334999999996, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "IBM Research", "bbox": {"l": 262.918, "t": 160.63239, "r": 332.30597, "b": 171.32037000000003, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "{", "bbox": {"l": 208.123, "t": 175.96123999999998, "r": 212.73083, "b": 184.42553999999996, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "ahn,nli,mly,taa", "bbox": {"l": 212.73, "t": 177.08203000000003, "r": 293.42761, "b": 184.00409000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "}", "bbox": {"l": 293.42798, "t": 175.96123999999998, "r": 298.0358, "b": 184.42553999999996, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "@zurich.ibm.com", "bbox": {"l": 298.03497, "t": 177.08203000000003, "r": 378.73257, "b": 184.00409000000002, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Abstract", "bbox": {"l": 145.99498, "t": 215.48297000000002, "r": 190.48029, "b": 226.23071000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Tables organize valuable content in a concise and com-", "bbox": {"l": 62.066978, "t": 241.39508, "r": 286.36493, "b": 249.98284999999998, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "pact representation. This content is extremely valuable for", "bbox": {"l": 50.111977, "t": 253.3501, "r": 286.36508, "b": 261.93787, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "systems such as search engines, Knowledge Graph\u2019s, etc,", "bbox": {"l": 50.111977, "t": 265.30511, "r": 286.36508, "b": 273.89288, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "since they enhance their predictive capabilities. Unfortu-", "bbox": {"l": 50.111977, "t": 277.26111000000003, "r": 286.36505, "b": 285.84888, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "nately, tables come in a large variety of shapes and sizes.", "bbox": {"l": 50.111977, "t": 289.21609, "r": 286.36505, "b": 297.80386, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Furthermore, they can have complex column/row-header", "bbox": {"l": 50.111977, "t": 301.17108, "r": 286.36505, "b": 309.75884999999994, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "configurations, multiline rows, different variety of separa-", "bbox": {"l": 50.111977, "t": 313.12607, "r": 286.36508, "b": 321.71384, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "tion lines, missing entries, etc. As such, the correct iden-", "bbox": {"l": 50.111977, "t": 325.08105, "r": 286.36508, "b": 333.66882, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "tification of the table-structure from an image is a non-", "bbox": {"l": 50.111977, "t": 337.03604, "r": 286.36505, "b": 345.62381, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "trivial task. In this paper, we present a new table-structure", "bbox": {"l": 50.111977, "t": 348.99203, "r": 286.36508, "b": 357.5798, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "identification model. The latter improves the latest end-to-", "bbox": {"l": 50.111977, "t": 360.94701999999995, "r": 286.36505, "b": 369.53479, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "end deep learning model (i.e. encoder-dual-decoder from", "bbox": {"l": 50.111977, "t": 372.90201, "r": 286.36508, "b": 381.48978, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "PubTabNet) in two significant ways. First, we introduce a", "bbox": {"l": 50.111977, "t": 384.85699, "r": 286.36505, "b": 393.44476, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "new object detection decoder for table-cells. In this way,", "bbox": {"l": 50.111977, "t": 396.81198, "r": 286.36511, "b": 405.39975000000004, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "we can obtain the content of the table-cells from program-", "bbox": {"l": 50.111977, "t": 408.76697, "r": 286.36508, "b": 417.35474, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "matic PDF\u2019s directly from the PDF source and avoid the", "bbox": {"l": 50.111977, "t": 420.72296000000006, "r": 286.36505, "b": 429.31073, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "training of the custom OCR decoders.", "bbox": {"l": 50.111977, "t": 432.67795, "r": 207.23216, "b": 441.26572, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "This architectural", "bbox": {"l": 214.09639, "t": 432.67795, "r": 286.36508, "b": 441.26572, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "change leads to more accurate table-content extraction and", "bbox": {"l": 50.111977, "t": 444.63293, "r": 286.36508, "b": 453.2207, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "allows us to tackle non-english tables. Second, we replace", "bbox": {"l": 50.111977, "t": 456.58792000000005, "r": 286.36505, "b": 465.17569, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "the LSTM decoders with transformer based decoders. This", "bbox": {"l": 50.111977, "t": 468.54291, "r": 286.36505, "b": 477.13068, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "upgrade improves significantly the previous state-of-the-art", "bbox": {"l": 50.111977, "t": 480.4989, "r": 286.36508, "b": 489.08667, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "tree-editing-distance-score (TEDS) from 91% to 98.5% on", "bbox": {"l": 50.111977, "t": 492.45389, "r": 286.36505, "b": 501.04166, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "simple tables and from 88.7% to 95% on complex tables.", "bbox": {"l": 50.111977, "t": 504.40887, "r": 276.65152, "b": 512.9966400000001, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "1.", "bbox": {"l": 50.111977, "t": 539.94276, "r": 58.121296, "b": 550.69049, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "Introduction", "bbox": {"l": 68.800385, "t": 539.94276, "r": 126.94804, "b": 550.69049, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "The occurrence of tables in documents is ubiquitous.", "bbox": {"l": 62.066978, "t": 560.7832, "r": 286.36496, "b": 569.68976, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "They often summarise quantitative or factual data, which is", "bbox": {"l": 50.111977, "t": 572.7382, "r": 286.36508, "b": 581.64476, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "cumbersome to describe in verbose text but nevertheless ex-", "bbox": {"l": 50.111977, "t": 584.69321, "r": 286.36505, "b": 593.5997600000001, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "tremely valuable. Unfortunately, this compact representa-", "bbox": {"l": 50.111977, "t": 596.6492000000001, "r": 286.36505, "b": 605.55576, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "tion is often not easy to parse by machines. There are many", "bbox": {"l": 50.111977, "t": 608.6042, "r": 286.36505, "b": 617.51076, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "implicit conventions used to obtain a compact table repre-", "bbox": {"l": 50.111977, "t": 620.5592, "r": 286.36505, "b": 629.46576, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "sentation. For example, tables often have complex column-", "bbox": {"l": 50.111977, "t": 632.51421, "r": 286.36508, "b": 641.42076, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "and row-headers in order to reduce duplicated cell content.", "bbox": {"l": 50.111977, "t": 644.46921, "r": 286.36508, "b": 653.37576, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "Lines of different shapes and sizes are leveraged to separate", "bbox": {"l": 50.111977, "t": 656.42421, "r": 286.36502, "b": 665.33077, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "content or indicate a tree structure. Additionally, tables can", "bbox": {"l": 50.111977, "t": 668.3802000000001, "r": 286.36505, "b": 677.28677, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "also have empty/missing table-entries or multi-row textual", "bbox": {"l": 50.111977, "t": 680.33521, "r": 286.36505, "b": 689.2417800000001, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "table-entries. Fig. 1 shows a table which presents all these", "bbox": {"l": 50.111977, "t": 692.290207, "r": 286.36505, "b": 701.196777, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "issues.", "bbox": {"l": 50.111977, "t": 704.245209, "r": 76.403275, "b": 713.151779, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "a.", "bbox": {"l": 315.56702, "t": 218.00684, "r": 324.01007, "b": 226.75482, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Picture of a table:", "bbox": {"l": 328.2316, "t": 218.00684, "r": 408.4407, "b": 226.75482, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "b.", "bbox": {"l": 315.56702, "t": 313.69478999999995, "r": 325.05786, "b": 322.44281, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Red-annotation of bounding boxes,", "bbox": {"l": 329.80325, "t": 313.69478999999995, "r": 486.40194999999994, "b": 322.44281, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Blue-predictions by TableFormer", "bbox": {"l": 326.46252, "t": 324.49478, "r": 472.47411999999997, "b": 333.2428, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "c.", "bbox": {"l": 315.56702, "t": 420.1828, "r": 324.81039, "b": 428.93082, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Structure predicted by TableFormer:", "bbox": {"l": 329.4321, "t": 420.1828, "r": 491.1912500000001, "b": 428.93082, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "1", "bbox": {"l": 408.14752, "t": 342.82828, "r": 412.54001, "b": 351.61322, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "0", "bbox": {"l": 356.11011, "t": 341.57217, "r": 360.50259, "b": 350.35712, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "2", "bbox": {"l": 500.6777, "t": 340.93768, "r": 505.0701900000001, "b": 349.7226299999999, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "3", "bbox": {"l": 356.13382, "t": 351.74789, "r": 360.52631, "b": 360.53284, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "4", "bbox": {"l": 402.53992, "t": 355.8765, "r": 406.9324, "b": 364.66144, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "5", "bbox": {"l": 448.58178999999996, "t": 352.84018, "r": 452.97427, "b": 361.62512, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "6", "bbox": {"l": 491.65161000000006, "t": 353.70657, "r": 496.0441, "b": 362.49152, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "7", "bbox": {"l": 535.13843, "t": 353.33969, "r": 539.53088, "b": 362.12463, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "8", "bbox": {"l": 348.82822, "t": 387.09781, "r": 353.2207, "b": 395.88275, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "9", "bbox": {"l": 389.27151, "t": 375.37228, "r": 393.664, "b": 384.15723, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "10", "bbox": {"l": 442.67479999999995, "t": 375.64621, "r": 451.45889000000005, "b": 384.43115, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "11", "bbox": {"l": 477.4382299999999, "t": 375.534, "r": 485.90167, "b": 384.31894000000005, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "12", "bbox": {"l": 522.57263, "t": 375.64621, "r": 531.35669, "b": 384.43115, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "13", "bbox": {"l": 400.22992, "t": 387.11429, "r": 409.01401, "b": 395.89923, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "14", "bbox": {"l": 442.30792, "t": 386.98981000000003, "r": 451.0920100000001, "b": 395.77475000000004, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "15", "bbox": {"l": 478.21941999999996, "t": 387.37469, "r": 487.00351000000006, "b": 396.15964, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "16", "bbox": {"l": 523.2287, "t": 386.98981000000003, "r": 532.01276, "b": 395.77475000000004, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "1", "bbox": {"l": 411.57233, "t": 399.42477, "r": 415.96481, "b": 408.20972, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "7", "bbox": {"l": 415.96393, "t": 399.42477, "r": 420.35641, "b": 408.20972, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "18", "bbox": {"l": 442.30521, "t": 399.0371999999999, "r": 451.08929, "b": 407.82213999999993, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "19", "bbox": {"l": 478.77893, "t": 398.99639999999994, "r": 487.56302, "b": 407.78133999999994, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "20", "bbox": {"l": 523.97241, "t": 398.6114799999999, "r": 532.75647, "b": 407.39642, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "1", "bbox": {"l": 347.24872, "t": 437.68588, "r": 351.6412, "b": 446.47083, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "0", "bbox": {"l": 318.88071, "t": 437.68588, "r": 323.27319, "b": 446.47083, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "2", "bbox": {"l": 394.10422, "t": 437.68588, "r": 398.4967, "b": 446.47083, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "3", "bbox": {"l": 318.77316, "t": 449.5455, "r": 323.16565, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "4", "bbox": {"l": 347.24872, "t": 449.5455, "r": 351.6412, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "5", "bbox": {"l": 394.10422, "t": 449.5455, "r": 398.4967, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "6", "bbox": {"l": 440.95941000000005, "t": 449.5455, "r": 445.3519, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "7", "bbox": {"l": 487.81491, "t": 449.5455, "r": 492.2074, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "8", "bbox": {"l": 318.77316, "t": 473.70425, "r": 323.16565, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "9", "bbox": {"l": 347.24872, "t": 461.8446, "r": 351.6412, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "10", "bbox": {"l": 394.10422, "t": 461.8446, "r": 402.88831, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "11", "bbox": {"l": 440.95941000000005, "t": 461.8446, "r": 449.42285, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "12", "bbox": {"l": 487.81491, "t": 461.8446, "r": 496.599, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "13", "bbox": {"l": 347.24872, "t": 473.70425, "r": 356.03281, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "14", "bbox": {"l": 394.10422, "t": 473.70425, "r": 402.88831, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "15", "bbox": {"l": 440.95941000000005, "t": 473.70425, "r": 449.7435, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "16", "bbox": {"l": 487.81491, "t": 473.70425, "r": 496.599, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "17", "bbox": {"l": 347.24872, "t": 485.12469, "r": 356.03281, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "18", "bbox": {"l": 394.10422, "t": 485.12469, "r": 402.88831, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "19", "bbox": {"l": 440.95941000000005, "t": 485.12469, "r": 449.7435, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "20", "bbox": {"l": 487.81491, "t": 485.12469, "r": 496.599, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "1", "bbox": {"l": 451.9457100000001, "t": 235.34704999999997, "r": 457.95050000000003, "b": 245.47748, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "3", "bbox": {"l": 385.09399, "t": 357.76030999999995, "r": 391.09879, "b": 367.89072, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "3", "bbox": {"l": 366.70102, "t": 449.12082, "r": 372.70581, "b": 459.25122, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "2", "bbox": {"l": 331.19681, "t": 269.35266, "r": 337.2016, "b": 279.48308999999995, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "2", "bbox": {"l": 333.43451, "t": 380.7265, "r": 339.4393, "b": 390.85689999999994, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "2", "bbox": {"l": 331.90424, "t": 473.32291, "r": 337.90903, "b": 483.45331, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "1", "bbox": {"l": 478.07210999999995, "t": 341.0368000000001, "r": 484.0769, "b": 351.16720999999995, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "1", "bbox": {"l": 459.87621999999993, "t": 437.5936, "r": 465.88101, "b": 447.724, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "3", "bbox": {"l": 384.0329, "t": 252.67895999999996, "r": 390.03769, "b": 262.80939, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "Figure 1:", "bbox": {"l": 308.862, "t": 514.50037, "r": 345.73361, "b": 523.40692, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "Picture of a table with subtle, complex features", "bbox": {"l": 353.17566, "t": 514.50037, "r": 545.11511, "b": 523.40692, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "such as (1) multi-column headers, (2) cell with multi-row", "bbox": {"l": 308.862, "t": 526.45535, "r": 545.11511, "b": 535.3619100000001, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "text and (3) cells with no content. Image from PubTabNet", "bbox": {"l": 308.862, "t": 538.41035, "r": 545.11517, "b": 547.31691, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "evaluation set, filename: \u2018PMC2944238 004 02\u2019.", "bbox": {"l": 308.862, "t": 550.36635, "r": 505.6917700000001, "b": 559.2729, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "Recently, significant progress has been made with vi-", "bbox": {"l": 320.81699, "t": 584.40936, "r": 545.11493, "b": 593.31592, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "sion based approaches to extract tables in documents. For", "bbox": {"l": 308.862, "t": 596.36436, "r": 545.11517, "b": 605.2709199999999, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "the sake of completeness, the issue of table extraction from", "bbox": {"l": 308.862, "t": 608.31937, "r": 545.11511, "b": 617.22592, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "documents is typically decomposed into two separate chal-", "bbox": {"l": 308.862, "t": 620.27437, "r": 545.11505, "b": 629.18092, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "lenges, i.e.", "bbox": {"l": 308.862, "t": 632.23036, "r": 353.6937, "b": 641.13692, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "(1)", "bbox": {"l": 362.11209, "t": 632.23036, "r": 374.66617, "b": 641.13692, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "finding the location of the table(s) on a", "bbox": {"l": 377.35785, "t": 632.23036, "r": 545.11505, "b": 641.13692, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "document-page and (2) finding the structure of a given table", "bbox": {"l": 308.862, "t": 644.18536, "r": 545.11517, "b": 653.09192, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "in the document.", "bbox": {"l": 308.862, "t": 656.14037, "r": 375.55167, "b": 665.04693, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "The first problem is called table-location and has been", "bbox": {"l": 320.81699, "t": 668.38036, "r": 545.11493, "b": 677.28693, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "previously addressed [30, 38, 19, 21, 23, 26, 8] with state-", "bbox": {"l": 308.862, "t": 680.33536, "r": 545.11511, "b": 689.24193, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "of-the-art object-detection networks (e.g. YOLO and later", "bbox": {"l": 308.862, "t": 692.290359, "r": 545.11511, "b": 701.19693, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "on Mask-RCNN [9]). For all practical purposes, it can be", "bbox": {"l": 308.862, "t": 704.245361, "r": 545.11499, "b": 713.151932, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "1", "bbox": {"l": 295.121, "t": 734.133366, "r": 300.10229, "b": 743.039928, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "arXiv:2203.01017v2 [cs.CV] 11 Mar 2022", "bbox": {"l": 18.340221, "t": 207.82001000000002, "r": 36.339779, "b": 560.00003, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 8, "label": "section_header", "bbox": {"l": 96.301003, "t": 107.03412000000003, "r": 498.92708999999996, "b": 119.93133999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.8868067860603333, "cells": [{"id": 0, "text": "TableFormer: Table Structure Understanding with Transformers.", "bbox": {"l": 96.301003, "t": 107.03412000000003, "r": 498.92708999999996, "b": 119.93133999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "section_header", "bbox": {"l": 142.47701, "t": 146.68535999999995, "r": 452.75027, "b": 171.32037000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.7586215734481812, "cells": [{"id": 1, "text": "Ahmed Nassar, Nikolaos Livathinos, Maksym Lysak, Peter Staar", "bbox": {"l": 142.47701, "t": 146.68535999999995, "r": 452.75027, "b": 157.37334999999996, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "IBM Research", "bbox": {"l": 262.918, "t": 160.63239, "r": 332.30597, "b": 171.32037000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "key_value_region", "bbox": {"l": 208.123, "t": 175.96123999999998, "r": 378.73257, "b": 184.42553999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.4854728579521179, "cells": [{"id": 3, "text": "{", "bbox": {"l": 208.123, "t": 175.96123999999998, "r": 212.73083, "b": 184.42553999999996, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "ahn,nli,mly,taa", "bbox": {"l": 212.73, "t": 177.08203000000003, "r": 293.42761, "b": 184.00409000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "}", "bbox": {"l": 293.42798, "t": 175.96123999999998, "r": 298.0358, "b": 184.42553999999996, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "@zurich.ibm.com", "bbox": {"l": 298.03497, "t": 177.08203000000003, "r": 378.73257, "b": 184.00409000000002, "coord_origin": "TOPLEFT"}}], "children": [{"id": 7, "label": "text", "bbox": {"l": 208.123, "t": 175.96123999999998, "r": 378.73257, "b": 184.42553999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9096331596374512, "cells": [{"id": 3, "text": "{", "bbox": {"l": 208.123, "t": 175.96123999999998, "r": 212.73083, "b": 184.42553999999996, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "ahn,nli,mly,taa", "bbox": {"l": 212.73, "t": 177.08203000000003, "r": 293.42761, "b": 184.00409000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "}", "bbox": {"l": 293.42798, "t": 175.96123999999998, "r": 298.0358, "b": 184.42553999999996, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "@zurich.ibm.com", "bbox": {"l": 298.03497, "t": 177.08203000000003, "r": 378.73257, "b": 184.00409000000002, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 5, "label": "section_header", "bbox": {"l": 145.99498, "t": 215.48297000000002, "r": 190.48029, "b": 226.23071000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9258671402931213, "cells": [{"id": 7, "text": "Abstract", "bbox": {"l": 145.99498, "t": 215.48297000000002, "r": 190.48029, "b": 226.23071000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 50.111977, "t": 241.39508, "r": 286.36511, "b": 512.9966400000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9838882088661194, "cells": [{"id": 8, "text": "Tables organize valuable content in a concise and com-", "bbox": {"l": 62.066978, "t": 241.39508, "r": 286.36493, "b": 249.98284999999998, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "pact representation. This content is extremely valuable for", "bbox": {"l": 50.111977, "t": 253.3501, "r": 286.36508, "b": 261.93787, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "systems such as search engines, Knowledge Graph\u2019s, etc,", "bbox": {"l": 50.111977, "t": 265.30511, "r": 286.36508, "b": 273.89288, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "since they enhance their predictive capabilities. Unfortu-", "bbox": {"l": 50.111977, "t": 277.26111000000003, "r": 286.36505, "b": 285.84888, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "nately, tables come in a large variety of shapes and sizes.", "bbox": {"l": 50.111977, "t": 289.21609, "r": 286.36505, "b": 297.80386, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Furthermore, they can have complex column/row-header", "bbox": {"l": 50.111977, "t": 301.17108, "r": 286.36505, "b": 309.75884999999994, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "configurations, multiline rows, different variety of separa-", "bbox": {"l": 50.111977, "t": 313.12607, "r": 286.36508, "b": 321.71384, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "tion lines, missing entries, etc. As such, the correct iden-", "bbox": {"l": 50.111977, "t": 325.08105, "r": 286.36508, "b": 333.66882, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "tification of the table-structure from an image is a non-", "bbox": {"l": 50.111977, "t": 337.03604, "r": 286.36505, "b": 345.62381, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "trivial task. In this paper, we present a new table-structure", "bbox": {"l": 50.111977, "t": 348.99203, "r": 286.36508, "b": 357.5798, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "identification model. The latter improves the latest end-to-", "bbox": {"l": 50.111977, "t": 360.94701999999995, "r": 286.36505, "b": 369.53479, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "end deep learning model (i.e. encoder-dual-decoder from", "bbox": {"l": 50.111977, "t": 372.90201, "r": 286.36508, "b": 381.48978, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "PubTabNet) in two significant ways. First, we introduce a", "bbox": {"l": 50.111977, "t": 384.85699, "r": 286.36505, "b": 393.44476, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "new object detection decoder for table-cells. In this way,", "bbox": {"l": 50.111977, "t": 396.81198, "r": 286.36511, "b": 405.39975000000004, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "we can obtain the content of the table-cells from program-", "bbox": {"l": 50.111977, "t": 408.76697, "r": 286.36508, "b": 417.35474, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "matic PDF\u2019s directly from the PDF source and avoid the", "bbox": {"l": 50.111977, "t": 420.72296000000006, "r": 286.36505, "b": 429.31073, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "training of the custom OCR decoders.", "bbox": {"l": 50.111977, "t": 432.67795, "r": 207.23216, "b": 441.26572, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "This architectural", "bbox": {"l": 214.09639, "t": 432.67795, "r": 286.36508, "b": 441.26572, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "change leads to more accurate table-content extraction and", "bbox": {"l": 50.111977, "t": 444.63293, "r": 286.36508, "b": 453.2207, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "allows us to tackle non-english tables. Second, we replace", "bbox": {"l": 50.111977, "t": 456.58792000000005, "r": 286.36505, "b": 465.17569, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "the LSTM decoders with transformer based decoders. This", "bbox": {"l": 50.111977, "t": 468.54291, "r": 286.36505, "b": 477.13068, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "upgrade improves significantly the previous state-of-the-art", "bbox": {"l": 50.111977, "t": 480.4989, "r": 286.36508, "b": 489.08667, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "tree-editing-distance-score (TEDS) from 91% to 98.5% on", "bbox": {"l": 50.111977, "t": 492.45389, "r": 286.36505, "b": 501.04166, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "simple tables and from 88.7% to 95% on complex tables.", "bbox": {"l": 50.111977, "t": 504.40887, "r": 276.65152, "b": 512.9966400000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "section_header", "bbox": {"l": 50.111977, "t": 539.94276, "r": 126.94804, "b": 550.69049, "coord_origin": "TOPLEFT"}, "confidence": 0.9317677617073059, "cells": [{"id": 32, "text": "1.", "bbox": {"l": 50.111977, "t": 539.94276, "r": 58.121296, "b": 550.69049, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "Introduction", "bbox": {"l": 68.800385, "t": 539.94276, "r": 126.94804, "b": 550.69049, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 50.111977, "t": 560.7832, "r": 286.36508, "b": 713.151779, "coord_origin": "TOPLEFT"}, "confidence": 0.9841895699501038, "cells": [{"id": 34, "text": "The occurrence of tables in documents is ubiquitous.", "bbox": {"l": 62.066978, "t": 560.7832, "r": 286.36496, "b": 569.68976, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "They often summarise quantitative or factual data, which is", "bbox": {"l": 50.111977, "t": 572.7382, "r": 286.36508, "b": 581.64476, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "cumbersome to describe in verbose text but nevertheless ex-", "bbox": {"l": 50.111977, "t": 584.69321, "r": 286.36505, "b": 593.5997600000001, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "tremely valuable. Unfortunately, this compact representa-", "bbox": {"l": 50.111977, "t": 596.6492000000001, "r": 286.36505, "b": 605.55576, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "tion is often not easy to parse by machines. There are many", "bbox": {"l": 50.111977, "t": 608.6042, "r": 286.36505, "b": 617.51076, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "implicit conventions used to obtain a compact table repre-", "bbox": {"l": 50.111977, "t": 620.5592, "r": 286.36505, "b": 629.46576, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "sentation. For example, tables often have complex column-", "bbox": {"l": 50.111977, "t": 632.51421, "r": 286.36508, "b": 641.42076, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "and row-headers in order to reduce duplicated cell content.", "bbox": {"l": 50.111977, "t": 644.46921, "r": 286.36508, "b": 653.37576, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "Lines of different shapes and sizes are leveraged to separate", "bbox": {"l": 50.111977, "t": 656.42421, "r": 286.36502, "b": 665.33077, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "content or indicate a tree structure. Additionally, tables can", "bbox": {"l": 50.111977, "t": 668.3802000000001, "r": 286.36505, "b": 677.28677, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "also have empty/missing table-entries or multi-row textual", "bbox": {"l": 50.111977, "t": 680.33521, "r": 286.36505, "b": 689.2417800000001, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "table-entries. Fig. 1 shows a table which presents all these", "bbox": {"l": 50.111977, "t": 692.290207, "r": 286.36505, "b": 701.196777, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "issues.", "bbox": {"l": 50.111977, "t": 704.245209, "r": 76.403275, "b": 713.151779, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "section_header", "bbox": {"l": 315.56702, "t": 218.00684, "r": 408.4407, "b": 226.75482, "coord_origin": "TOPLEFT"}, "confidence": 0.6724023818969727, "cells": [{"id": 47, "text": "a.", "bbox": {"l": 315.56702, "t": 218.00684, "r": 324.01007, "b": 226.75482, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Picture of a table:", "bbox": {"l": 328.2316, "t": 218.00684, "r": 408.4407, "b": 226.75482, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "list_item", "bbox": {"l": 315.56702, "t": 313.69478999999995, "r": 486.40194999999994, "b": 333.2428, "coord_origin": "TOPLEFT"}, "confidence": 0.5549328923225403, "cells": [{"id": 49, "text": "b.", "bbox": {"l": 315.56702, "t": 313.69478999999995, "r": 325.05786, "b": 322.44281, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Red-annotation of bounding boxes,", "bbox": {"l": 329.80325, "t": 313.69478999999995, "r": 486.40194999999994, "b": 322.44281, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Blue-predictions by TableFormer", "bbox": {"l": 326.46252, "t": 324.49478, "r": 472.47411999999997, "b": 333.2428, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "list_item", "bbox": {"l": 315.56702, "t": 420.1828, "r": 491.1912500000001, "b": 428.93082, "coord_origin": "TOPLEFT"}, "confidence": 0.5501358509063721, "cells": [{"id": 52, "text": "c.", "bbox": {"l": 315.56702, "t": 420.1828, "r": 324.81039, "b": 428.93082, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Structure predicted by TableFormer:", "bbox": {"l": 329.4321, "t": 420.1828, "r": 491.1912500000001, "b": 428.93082, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "picture", "bbox": {"l": 314.78173828125, "t": 338.0652770996094, "r": 539.1802978515625, "b": 410.0494384765625, "coord_origin": "TOPLEFT"}, "confidence": 0.8742761611938477, "cells": [{"id": 54, "text": "1", "bbox": {"l": 408.14752, "t": 342.82828, "r": 412.54001, "b": 351.61322, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "0", "bbox": {"l": 356.11011, "t": 341.57217, "r": 360.50259, "b": 350.35712, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "2", "bbox": {"l": 500.6777, "t": 340.93768, "r": 505.0701900000001, "b": 349.7226299999999, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "3", "bbox": {"l": 356.13382, "t": 351.74789, "r": 360.52631, "b": 360.53284, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "4", "bbox": {"l": 402.53992, "t": 355.8765, "r": 406.9324, "b": 364.66144, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "5", "bbox": {"l": 448.58178999999996, "t": 352.84018, "r": 452.97427, "b": 361.62512, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "6", "bbox": {"l": 491.65161000000006, "t": 353.70657, "r": 496.0441, "b": 362.49152, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "7", "bbox": {"l": 535.13843, "t": 353.33969, "r": 539.53088, "b": 362.12463, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "8", "bbox": {"l": 348.82822, "t": 387.09781, "r": 353.2207, "b": 395.88275, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "9", "bbox": {"l": 389.27151, "t": 375.37228, "r": 393.664, "b": 384.15723, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "10", "bbox": {"l": 442.67479999999995, "t": 375.64621, "r": 451.45889000000005, "b": 384.43115, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "11", "bbox": {"l": 477.4382299999999, "t": 375.534, "r": 485.90167, "b": 384.31894000000005, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "12", "bbox": {"l": 522.57263, "t": 375.64621, "r": 531.35669, "b": 384.43115, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "13", "bbox": {"l": 400.22992, "t": 387.11429, "r": 409.01401, "b": 395.89923, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "14", "bbox": {"l": 442.30792, "t": 386.98981000000003, "r": 451.0920100000001, "b": 395.77475000000004, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "15", "bbox": {"l": 478.21941999999996, "t": 387.37469, "r": 487.00351000000006, "b": 396.15964, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "16", "bbox": {"l": 523.2287, "t": 386.98981000000003, "r": 532.01276, "b": 395.77475000000004, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "1", "bbox": {"l": 411.57233, "t": 399.42477, "r": 415.96481, "b": 408.20972, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "7", "bbox": {"l": 415.96393, "t": 399.42477, "r": 420.35641, "b": 408.20972, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "18", "bbox": {"l": 442.30521, "t": 399.0371999999999, "r": 451.08929, "b": 407.82213999999993, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "19", "bbox": {"l": 478.77893, "t": 398.99639999999994, "r": 487.56302, "b": 407.78133999999994, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "20", "bbox": {"l": 523.97241, "t": 398.6114799999999, "r": 532.75647, "b": 407.39642, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "3", "bbox": {"l": 385.09399, "t": 357.76030999999995, "r": 391.09879, "b": 367.89072, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "2", "bbox": {"l": 333.43451, "t": 380.7265, "r": 339.4393, "b": 390.85689999999994, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "1", "bbox": {"l": 478.07210999999995, "t": 341.0368000000001, "r": 484.0769, "b": 351.16720999999995, "coord_origin": "TOPLEFT"}}], "children": [{"id": 19, "label": "text", "bbox": {"l": 408.14752, "t": 342.82828, "r": 412.54001, "b": 351.61322, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "1", "bbox": {"l": 408.14752, "t": 342.82828, "r": 412.54001, "b": 351.61322, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 356.11011, "t": 341.57217, "r": 360.50259, "b": 350.35712, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "0", "bbox": {"l": 356.11011, "t": 341.57217, "r": 360.50259, "b": 350.35712, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 500.6777, "t": 340.93768, "r": 505.0701900000001, "b": 349.7226299999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "2", "bbox": {"l": 500.6777, "t": 340.93768, "r": 505.0701900000001, "b": 349.7226299999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 356.13382, "t": 351.74789, "r": 360.52631, "b": 360.53284, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "3", "bbox": {"l": 356.13382, "t": 351.74789, "r": 360.52631, "b": 360.53284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 402.53992, "t": 355.8765, "r": 406.9324, "b": 364.66144, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "4", "bbox": {"l": 402.53992, "t": 355.8765, "r": 406.9324, "b": 364.66144, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 448.58178999999996, "t": 352.84018, "r": 452.97427, "b": 361.62512, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "5", "bbox": {"l": 448.58178999999996, "t": 352.84018, "r": 452.97427, "b": 361.62512, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 491.65161000000006, "t": 353.70657, "r": 496.0441, "b": 362.49152, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "6", "bbox": {"l": 491.65161000000006, "t": 353.70657, "r": 496.0441, "b": 362.49152, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 535.13843, "t": 353.33969, "r": 539.53088, "b": 362.12463, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "7", "bbox": {"l": 535.13843, "t": 353.33969, "r": 539.53088, "b": 362.12463, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 348.82822, "t": 387.09781, "r": 353.2207, "b": 395.88275, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "8", "bbox": {"l": 348.82822, "t": 387.09781, "r": 353.2207, "b": 395.88275, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 389.27151, "t": 375.37228, "r": 393.664, "b": 384.15723, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "9", "bbox": {"l": 389.27151, "t": 375.37228, "r": 393.664, "b": 384.15723, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 442.67479999999995, "t": 375.64621, "r": 451.45889000000005, "b": 384.43115, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "10", "bbox": {"l": 442.67479999999995, "t": 375.64621, "r": 451.45889000000005, "b": 384.43115, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 477.4382299999999, "t": 375.534, "r": 485.90167, "b": 384.31894000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "11", "bbox": {"l": 477.4382299999999, "t": 375.534, "r": 485.90167, "b": 384.31894000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 522.57263, "t": 375.64621, "r": 531.35669, "b": 384.43115, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "12", "bbox": {"l": 522.57263, "t": 375.64621, "r": 531.35669, "b": 384.43115, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 400.22992, "t": 387.11429, "r": 409.01401, "b": 395.89923, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "13", "bbox": {"l": 400.22992, "t": 387.11429, "r": 409.01401, "b": 395.89923, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 442.30792, "t": 386.98981000000003, "r": 451.0920100000001, "b": 395.77475000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "14", "bbox": {"l": 442.30792, "t": 386.98981000000003, "r": 451.0920100000001, "b": 395.77475000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 478.21941999999996, "t": 387.37469, "r": 487.00351000000006, "b": 396.15964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "15", "bbox": {"l": 478.21941999999996, "t": 387.37469, "r": 487.00351000000006, "b": 396.15964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 523.2287, "t": 386.98981000000003, "r": 532.01276, "b": 395.77475000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "16", "bbox": {"l": 523.2287, "t": 386.98981000000003, "r": 532.01276, "b": 395.77475000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 411.57233, "t": 399.42477, "r": 415.96481, "b": 408.20972, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "1", "bbox": {"l": 411.57233, "t": 399.42477, "r": 415.96481, "b": 408.20972, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 415.96393, "t": 399.42477, "r": 420.35641, "b": 408.20972, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "7", "bbox": {"l": 415.96393, "t": 399.42477, "r": 420.35641, "b": 408.20972, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 442.30521, "t": 399.0371999999999, "r": 451.08929, "b": 407.82213999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "18", "bbox": {"l": 442.30521, "t": 399.0371999999999, "r": 451.08929, "b": 407.82213999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 478.77893, "t": 398.99639999999994, "r": 487.56302, "b": 407.78133999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "19", "bbox": {"l": 478.77893, "t": 398.99639999999994, "r": 487.56302, "b": 407.78133999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 523.97241, "t": 398.6114799999999, "r": 532.75647, "b": 407.39642, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "20", "bbox": {"l": 523.97241, "t": 398.6114799999999, "r": 532.75647, "b": 407.39642, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 385.09399, "t": 357.76030999999995, "r": 391.09879, "b": 367.89072, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "3", "bbox": {"l": 385.09399, "t": 357.76030999999995, "r": 391.09879, "b": 367.89072, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 333.43451, "t": 380.7265, "r": 339.4393, "b": 390.85689999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "2", "bbox": {"l": 333.43451, "t": 380.7265, "r": 339.4393, "b": 390.85689999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 478.07210999999995, "t": 341.0368000000001, "r": 484.0769, "b": 351.16720999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": "1", "bbox": {"l": 478.07210999999995, "t": 341.0368000000001, "r": 484.0769, "b": 351.16720999999995, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 23, "label": "picture", "bbox": {"l": 315.7172546386719, "t": 433.823486328125, "r": 536.835693359375, "b": 496.0290222167969, "coord_origin": "TOPLEFT"}, "confidence": 0.5088632702827454, "cells": [{"id": 76, "text": "1", "bbox": {"l": 347.24872, "t": 437.68588, "r": 351.6412, "b": 446.47083, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "0", "bbox": {"l": 318.88071, "t": 437.68588, "r": 323.27319, "b": 446.47083, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "2", "bbox": {"l": 394.10422, "t": 437.68588, "r": 398.4967, "b": 446.47083, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "3", "bbox": {"l": 318.77316, "t": 449.5455, "r": 323.16565, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "4", "bbox": {"l": 347.24872, "t": 449.5455, "r": 351.6412, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "5", "bbox": {"l": 394.10422, "t": 449.5455, "r": 398.4967, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "6", "bbox": {"l": 440.95941000000005, "t": 449.5455, "r": 445.3519, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "7", "bbox": {"l": 487.81491, "t": 449.5455, "r": 492.2074, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "8", "bbox": {"l": 318.77316, "t": 473.70425, "r": 323.16565, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "9", "bbox": {"l": 347.24872, "t": 461.8446, "r": 351.6412, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "10", "bbox": {"l": 394.10422, "t": 461.8446, "r": 402.88831, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "11", "bbox": {"l": 440.95941000000005, "t": 461.8446, "r": 449.42285, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "12", "bbox": {"l": 487.81491, "t": 461.8446, "r": 496.599, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "13", "bbox": {"l": 347.24872, "t": 473.70425, "r": 356.03281, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "14", "bbox": {"l": 394.10422, "t": 473.70425, "r": 402.88831, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "15", "bbox": {"l": 440.95941000000005, "t": 473.70425, "r": 449.7435, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "16", "bbox": {"l": 487.81491, "t": 473.70425, "r": 496.599, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "17", "bbox": {"l": 347.24872, "t": 485.12469, "r": 356.03281, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "18", "bbox": {"l": 394.10422, "t": 485.12469, "r": 402.88831, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "19", "bbox": {"l": 440.95941000000005, "t": 485.12469, "r": 449.7435, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "20", "bbox": {"l": 487.81491, "t": 485.12469, "r": 496.599, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "3", "bbox": {"l": 366.70102, "t": 449.12082, "r": 372.70581, "b": 459.25122, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "2", "bbox": {"l": 331.90424, "t": 473.32291, "r": 337.90903, "b": 483.45331, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "1", "bbox": {"l": 459.87621999999993, "t": 437.5936, "r": 465.88101, "b": 447.724, "coord_origin": "TOPLEFT"}}], "children": [{"id": 41, "label": "text", "bbox": {"l": 347.24872, "t": 437.68588, "r": 351.6412, "b": 446.47083, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "1", "bbox": {"l": 347.24872, "t": 437.68588, "r": 351.6412, "b": 446.47083, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 318.88071, "t": 437.68588, "r": 323.27319, "b": 446.47083, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "0", "bbox": {"l": 318.88071, "t": 437.68588, "r": 323.27319, "b": 446.47083, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 394.10422, "t": 437.68588, "r": 398.4967, "b": 446.47083, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "2", "bbox": {"l": 394.10422, "t": 437.68588, "r": 398.4967, "b": 446.47083, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 318.77316, "t": 449.5455, "r": 323.16565, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "3", "bbox": {"l": 318.77316, "t": 449.5455, "r": 323.16565, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 347.24872, "t": 449.5455, "r": 351.6412, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "4", "bbox": {"l": 347.24872, "t": 449.5455, "r": 351.6412, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 394.10422, "t": 449.5455, "r": 398.4967, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "5", "bbox": {"l": 394.10422, "t": 449.5455, "r": 398.4967, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 440.95941000000005, "t": 449.5455, "r": 445.3519, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "6", "bbox": {"l": 440.95941000000005, "t": 449.5455, "r": 445.3519, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 487.81491, "t": 449.5455, "r": 492.2074, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "7", "bbox": {"l": 487.81491, "t": 449.5455, "r": 492.2074, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 318.77316, "t": 473.70425, "r": 323.16565, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "8", "bbox": {"l": 318.77316, "t": 473.70425, "r": 323.16565, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 347.24872, "t": 461.8446, "r": 351.6412, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "9", "bbox": {"l": 347.24872, "t": 461.8446, "r": 351.6412, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 394.10422, "t": 461.8446, "r": 402.88831, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "10", "bbox": {"l": 394.10422, "t": 461.8446, "r": 402.88831, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 440.95941000000005, "t": 461.8446, "r": 449.42285, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "11", "bbox": {"l": 440.95941000000005, "t": 461.8446, "r": 449.42285, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 487.81491, "t": 461.8446, "r": 496.599, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "12", "bbox": {"l": 487.81491, "t": 461.8446, "r": 496.599, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 347.24872, "t": 473.70425, "r": 356.03281, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "13", "bbox": {"l": 347.24872, "t": 473.70425, "r": 356.03281, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 394.10422, "t": 473.70425, "r": 402.88831, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "14", "bbox": {"l": 394.10422, "t": 473.70425, "r": 402.88831, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 440.95941000000005, "t": 473.70425, "r": 449.7435, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "15", "bbox": {"l": 440.95941000000005, "t": 473.70425, "r": 449.7435, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 487.81491, "t": 473.70425, "r": 496.599, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "16", "bbox": {"l": 487.81491, "t": 473.70425, "r": 496.599, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 347.24872, "t": 485.12469, "r": 356.03281, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "17", "bbox": {"l": 347.24872, "t": 485.12469, "r": 356.03281, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 394.10422, "t": 485.12469, "r": 402.88831, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "18", "bbox": {"l": 394.10422, "t": 485.12469, "r": 402.88831, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 440.95941000000005, "t": 485.12469, "r": 449.7435, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "19", "bbox": {"l": 440.95941000000005, "t": 485.12469, "r": 449.7435, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 487.81491, "t": 485.12469, "r": 496.599, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "20", "bbox": {"l": 487.81491, "t": 485.12469, "r": 496.599, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 366.70102, "t": 449.12082, "r": 372.70581, "b": 459.25122, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "3", "bbox": {"l": 366.70102, "t": 449.12082, "r": 372.70581, "b": 459.25122, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 331.90424, "t": 473.32291, "r": 337.90903, "b": 483.45331, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "2", "bbox": {"l": 331.90424, "t": 473.32291, "r": 337.90903, "b": 483.45331, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 459.87621999999993, "t": 437.5936, "r": 465.88101, "b": 447.724, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "1", "bbox": {"l": 459.87621999999993, "t": 437.5936, "r": 465.88101, "b": 447.724, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 11, "label": "table", "bbox": {"l": 315.7172546386719, "t": 433.823486328125, "r": 536.835693359375, "b": 496.0290222167969, "coord_origin": "TOPLEFT"}, "confidence": 0.8056110739707947, "cells": [{"id": 76, "text": "1", "bbox": {"l": 347.24872, "t": 437.68588, "r": 351.6412, "b": 446.47083, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "0", "bbox": {"l": 318.88071, "t": 437.68588, "r": 323.27319, "b": 446.47083, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "2", "bbox": {"l": 394.10422, "t": 437.68588, "r": 398.4967, "b": 446.47083, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "3", "bbox": {"l": 318.77316, "t": 449.5455, "r": 323.16565, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "4", "bbox": {"l": 347.24872, "t": 449.5455, "r": 351.6412, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "5", "bbox": {"l": 394.10422, "t": 449.5455, "r": 398.4967, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "6", "bbox": {"l": 440.95941000000005, "t": 449.5455, "r": 445.3519, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "7", "bbox": {"l": 487.81491, "t": 449.5455, "r": 492.2074, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "8", "bbox": {"l": 318.77316, "t": 473.70425, "r": 323.16565, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "9", "bbox": {"l": 347.24872, "t": 461.8446, "r": 351.6412, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "10", "bbox": {"l": 394.10422, "t": 461.8446, "r": 402.88831, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "11", "bbox": {"l": 440.95941000000005, "t": 461.8446, "r": 449.42285, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "12", "bbox": {"l": 487.81491, "t": 461.8446, "r": 496.599, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "13", "bbox": {"l": 347.24872, "t": 473.70425, "r": 356.03281, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "14", "bbox": {"l": 394.10422, "t": 473.70425, "r": 402.88831, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "15", "bbox": {"l": 440.95941000000005, "t": 473.70425, "r": 449.7435, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "16", "bbox": {"l": 487.81491, "t": 473.70425, "r": 496.599, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "17", "bbox": {"l": 347.24872, "t": 485.12469, "r": 356.03281, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "18", "bbox": {"l": 394.10422, "t": 485.12469, "r": 402.88831, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "19", "bbox": {"l": 440.95941000000005, "t": 485.12469, "r": 449.7435, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "20", "bbox": {"l": 487.81491, "t": 485.12469, "r": 496.599, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "3", "bbox": {"l": 366.70102, "t": 449.12082, "r": 372.70581, "b": 459.25122, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "2", "bbox": {"l": 331.90424, "t": 473.32291, "r": 337.90903, "b": 483.45331, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "1", "bbox": {"l": 459.87621999999993, "t": 437.5936, "r": 465.88101, "b": 447.724, "coord_origin": "TOPLEFT"}}], "children": [{"id": 41, "label": "text", "bbox": {"l": 347.24872, "t": 437.68588, "r": 351.6412, "b": 446.47083, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "1", "bbox": {"l": 347.24872, "t": 437.68588, "r": 351.6412, "b": 446.47083, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 318.88071, "t": 437.68588, "r": 323.27319, "b": 446.47083, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "0", "bbox": {"l": 318.88071, "t": 437.68588, "r": 323.27319, "b": 446.47083, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 394.10422, "t": 437.68588, "r": 398.4967, "b": 446.47083, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "2", "bbox": {"l": 394.10422, "t": 437.68588, "r": 398.4967, "b": 446.47083, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 318.77316, "t": 449.5455, "r": 323.16565, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "3", "bbox": {"l": 318.77316, "t": 449.5455, "r": 323.16565, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 347.24872, "t": 449.5455, "r": 351.6412, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "4", "bbox": {"l": 347.24872, "t": 449.5455, "r": 351.6412, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 394.10422, "t": 449.5455, "r": 398.4967, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "5", "bbox": {"l": 394.10422, "t": 449.5455, "r": 398.4967, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 440.95941000000005, "t": 449.5455, "r": 445.3519, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "6", "bbox": {"l": 440.95941000000005, "t": 449.5455, "r": 445.3519, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 487.81491, "t": 449.5455, "r": 492.2074, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "7", "bbox": {"l": 487.81491, "t": 449.5455, "r": 492.2074, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 318.77316, "t": 473.70425, "r": 323.16565, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "8", "bbox": {"l": 318.77316, "t": 473.70425, "r": 323.16565, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 347.24872, "t": 461.8446, "r": 351.6412, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "9", "bbox": {"l": 347.24872, "t": 461.8446, "r": 351.6412, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 394.10422, "t": 461.8446, "r": 402.88831, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "10", "bbox": {"l": 394.10422, "t": 461.8446, "r": 402.88831, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 440.95941000000005, "t": 461.8446, "r": 449.42285, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "11", "bbox": {"l": 440.95941000000005, "t": 461.8446, "r": 449.42285, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 487.81491, "t": 461.8446, "r": 496.599, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "12", "bbox": {"l": 487.81491, "t": 461.8446, "r": 496.599, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 347.24872, "t": 473.70425, "r": 356.03281, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "13", "bbox": {"l": 347.24872, "t": 473.70425, "r": 356.03281, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 394.10422, "t": 473.70425, "r": 402.88831, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "14", "bbox": {"l": 394.10422, "t": 473.70425, "r": 402.88831, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 440.95941000000005, "t": 473.70425, "r": 449.7435, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "15", "bbox": {"l": 440.95941000000005, "t": 473.70425, "r": 449.7435, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 487.81491, "t": 473.70425, "r": 496.599, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "16", "bbox": {"l": 487.81491, "t": 473.70425, "r": 496.599, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 347.24872, "t": 485.12469, "r": 356.03281, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "17", "bbox": {"l": 347.24872, "t": 485.12469, "r": 356.03281, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 394.10422, "t": 485.12469, "r": 402.88831, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "18", "bbox": {"l": 394.10422, "t": 485.12469, "r": 402.88831, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 440.95941000000005, "t": 485.12469, "r": 449.7435, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "19", "bbox": {"l": 440.95941000000005, "t": 485.12469, "r": 449.7435, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 487.81491, "t": 485.12469, "r": 496.599, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "20", "bbox": {"l": 487.81491, "t": 485.12469, "r": 496.599, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 366.70102, "t": 449.12082, "r": 372.70581, "b": 459.25122, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "3", "bbox": {"l": 366.70102, "t": 449.12082, "r": 372.70581, "b": 459.25122, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 331.90424, "t": 473.32291, "r": 337.90903, "b": 483.45331, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "2", "bbox": {"l": 331.90424, "t": 473.32291, "r": 337.90903, "b": 483.45331, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 459.87621999999993, "t": 437.5936, "r": 465.88101, "b": 447.724, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "1", "bbox": {"l": 459.87621999999993, "t": 437.5936, "r": 465.88101, "b": 447.724, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 16, "label": "picture", "bbox": {"l": 315.65362548828125, "t": 228.723388671875, "r": 537.1475219726562, "b": 302.8014221191406, "coord_origin": "TOPLEFT"}, "confidence": 0.608779788017273, "cells": [{"id": 97, "text": "1", "bbox": {"l": 451.9457100000001, "t": 235.34704999999997, "r": 457.95050000000003, "b": 245.47748, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "2", "bbox": {"l": 331.19681, "t": 269.35266, "r": 337.2016, "b": 279.48308999999995, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "3", "bbox": {"l": 384.0329, "t": 252.67895999999996, "r": 390.03769, "b": 262.80939, "coord_origin": "TOPLEFT"}}], "children": [{"id": 62, "label": "text", "bbox": {"l": 451.9457100000001, "t": 235.34704999999997, "r": 457.95050000000003, "b": 245.47748, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "1", "bbox": {"l": 451.9457100000001, "t": 235.34704999999997, "r": 457.95050000000003, "b": 245.47748, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 331.19681, "t": 269.35266, "r": 337.2016, "b": 279.48308999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "2", "bbox": {"l": 331.19681, "t": 269.35266, "r": 337.2016, "b": 279.48308999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 384.0329, "t": 252.67895999999996, "r": 390.03769, "b": 262.80939, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "3", "bbox": {"l": 384.0329, "t": 252.67895999999996, "r": 390.03769, "b": 262.80939, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 15, "label": "table", "bbox": {"l": 315.65362548828125, "t": 228.723388671875, "r": 537.1475219726562, "b": 302.8014221191406, "coord_origin": "TOPLEFT"}, "confidence": 0.6515864729881287, "cells": [{"id": 97, "text": "1", "bbox": {"l": 451.9457100000001, "t": 235.34704999999997, "r": 457.95050000000003, "b": 245.47748, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "2", "bbox": {"l": 331.19681, "t": 269.35266, "r": 337.2016, "b": 279.48308999999995, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "3", "bbox": {"l": 384.0329, "t": 252.67895999999996, "r": 390.03769, "b": 262.80939, "coord_origin": "TOPLEFT"}}], "children": [{"id": 62, "label": "text", "bbox": {"l": 451.9457100000001, "t": 235.34704999999997, "r": 457.95050000000003, "b": 245.47748, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "1", "bbox": {"l": 451.9457100000001, "t": 235.34704999999997, "r": 457.95050000000003, "b": 245.47748, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 331.19681, "t": 269.35266, "r": 337.2016, "b": 279.48308999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "2", "bbox": {"l": 331.19681, "t": 269.35266, "r": 337.2016, "b": 279.48308999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 384.0329, "t": 252.67895999999996, "r": 390.03769, "b": 262.80939, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "3", "bbox": {"l": 384.0329, "t": 252.67895999999996, "r": 390.03769, "b": 262.80939, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 6, "label": "caption", "bbox": {"l": 308.862, "t": 514.50037, "r": 545.11517, "b": 559.2729, "coord_origin": "TOPLEFT"}, "confidence": 0.9214619398117065, "cells": [{"id": 106, "text": "Figure 1:", "bbox": {"l": 308.862, "t": 514.50037, "r": 345.73361, "b": 523.40692, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "Picture of a table with subtle, complex features", "bbox": {"l": 353.17566, "t": 514.50037, "r": 545.11511, "b": 523.40692, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "such as (1) multi-column headers, (2) cell with multi-row", "bbox": {"l": 308.862, "t": 526.45535, "r": 545.11511, "b": 535.3619100000001, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "text and (3) cells with no content. Image from PubTabNet", "bbox": {"l": 308.862, "t": 538.41035, "r": 545.11517, "b": 547.31691, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "evaluation set, filename: \u2018PMC2944238 004 02\u2019.", "bbox": {"l": 308.862, "t": 550.36635, "r": 505.6917700000001, "b": 559.2729, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 308.862, "t": 584.40936, "r": 545.11517, "b": 665.04693, "coord_origin": "TOPLEFT"}, "confidence": 0.9848759770393372, "cells": [{"id": 111, "text": "Recently, significant progress has been made with vi-", "bbox": {"l": 320.81699, "t": 584.40936, "r": 545.11493, "b": 593.31592, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "sion based approaches to extract tables in documents. For", "bbox": {"l": 308.862, "t": 596.36436, "r": 545.11517, "b": 605.2709199999999, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "the sake of completeness, the issue of table extraction from", "bbox": {"l": 308.862, "t": 608.31937, "r": 545.11511, "b": 617.22592, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "documents is typically decomposed into two separate chal-", "bbox": {"l": 308.862, "t": 620.27437, "r": 545.11505, "b": 629.18092, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "lenges, i.e.", "bbox": {"l": 308.862, "t": 632.23036, "r": 353.6937, "b": 641.13692, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "(1)", "bbox": {"l": 362.11209, "t": 632.23036, "r": 374.66617, "b": 641.13692, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "finding the location of the table(s) on a", "bbox": {"l": 377.35785, "t": 632.23036, "r": 545.11505, "b": 641.13692, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "document-page and (2) finding the structure of a given table", "bbox": {"l": 308.862, "t": 644.18536, "r": 545.11517, "b": 653.09192, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "in the document.", "bbox": {"l": 308.862, "t": 656.14037, "r": 375.55167, "b": 665.04693, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 308.862, "t": 668.38036, "r": 545.11511, "b": 713.151932, "coord_origin": "TOPLEFT"}, "confidence": 0.979152262210846, "cells": [{"id": 120, "text": "The first problem is called table-location and has been", "bbox": {"l": 320.81699, "t": 668.38036, "r": 545.11493, "b": 677.28693, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "previously addressed [30, 38, 19, 21, 23, 26, 8] with state-", "bbox": {"l": 308.862, "t": 680.33536, "r": 545.11511, "b": 689.24193, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "of-the-art object-detection networks (e.g. YOLO and later", "bbox": {"l": 308.862, "t": 692.290359, "r": 545.11511, "b": 701.19693, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "on Mask-RCNN [9]). For all practical purposes, it can be", "bbox": {"l": 308.862, "t": 704.245361, "r": 545.11499, "b": 713.151932, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "page_footer", "bbox": {"l": 295.121, "t": 734.133366, "r": 300.10229, "b": 743.039928, "coord_origin": "TOPLEFT"}, "confidence": 0.8045893311500549, "cells": [{"id": 124, "text": "1", "bbox": {"l": 295.121, "t": 734.133366, "r": 300.10229, "b": 743.039928, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "page_header", "bbox": {"l": 18.340221, "t": 207.82001000000002, "r": 36.339779, "b": 560.00003, "coord_origin": "TOPLEFT"}, "confidence": 0.8773143887519836, "cells": [{"id": 125, "text": "arXiv:2203.01017v2 [cs.CV] 11 Mar 2022", "bbox": {"l": 18.340221, "t": 207.82001000000002, "r": 36.339779, "b": 560.00003, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {"11": {"label": "table", "id": 11, "page_no": 0, "cluster": {"id": 11, "label": "table", "bbox": {"l": 315.7172546386719, "t": 433.823486328125, "r": 536.835693359375, "b": 496.0290222167969, "coord_origin": "TOPLEFT"}, "confidence": 0.8056110739707947, "cells": [{"id": 76, "text": "1", "bbox": {"l": 347.24872, "t": 437.68588, "r": 351.6412, "b": 446.47083, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "0", "bbox": {"l": 318.88071, "t": 437.68588, "r": 323.27319, "b": 446.47083, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "2", "bbox": {"l": 394.10422, "t": 437.68588, "r": 398.4967, "b": 446.47083, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "3", "bbox": {"l": 318.77316, "t": 449.5455, "r": 323.16565, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "4", "bbox": {"l": 347.24872, "t": 449.5455, "r": 351.6412, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "5", "bbox": {"l": 394.10422, "t": 449.5455, "r": 398.4967, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "6", "bbox": {"l": 440.95941000000005, "t": 449.5455, "r": 445.3519, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "7", "bbox": {"l": 487.81491, "t": 449.5455, "r": 492.2074, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "8", "bbox": {"l": 318.77316, "t": 473.70425, "r": 323.16565, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "9", "bbox": {"l": 347.24872, "t": 461.8446, "r": 351.6412, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "10", "bbox": {"l": 394.10422, "t": 461.8446, "r": 402.88831, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "11", "bbox": {"l": 440.95941000000005, "t": 461.8446, "r": 449.42285, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "12", "bbox": {"l": 487.81491, "t": 461.8446, "r": 496.599, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "13", "bbox": {"l": 347.24872, "t": 473.70425, "r": 356.03281, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "14", "bbox": {"l": 394.10422, "t": 473.70425, "r": 402.88831, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "15", "bbox": {"l": 440.95941000000005, "t": 473.70425, "r": 449.7435, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "16", "bbox": {"l": 487.81491, "t": 473.70425, "r": 496.599, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "17", "bbox": {"l": 347.24872, "t": 485.12469, "r": 356.03281, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "18", "bbox": {"l": 394.10422, "t": 485.12469, "r": 402.88831, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "19", "bbox": {"l": 440.95941000000005, "t": 485.12469, "r": 449.7435, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "20", "bbox": {"l": 487.81491, "t": 485.12469, "r": 496.599, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "3", "bbox": {"l": 366.70102, "t": 449.12082, "r": 372.70581, "b": 459.25122, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "2", "bbox": {"l": 331.90424, "t": 473.32291, "r": 337.90903, "b": 483.45331, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "1", "bbox": {"l": 459.87621999999993, "t": 437.5936, "r": 465.88101, "b": 447.724, "coord_origin": "TOPLEFT"}}], "children": [{"id": 41, "label": "text", "bbox": {"l": 347.24872, "t": 437.68588, "r": 351.6412, "b": 446.47083, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "1", "bbox": {"l": 347.24872, "t": 437.68588, "r": 351.6412, "b": 446.47083, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 318.88071, "t": 437.68588, "r": 323.27319, "b": 446.47083, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "0", "bbox": {"l": 318.88071, "t": 437.68588, "r": 323.27319, "b": 446.47083, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 394.10422, "t": 437.68588, "r": 398.4967, "b": 446.47083, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "2", "bbox": {"l": 394.10422, "t": 437.68588, "r": 398.4967, "b": 446.47083, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 318.77316, "t": 449.5455, "r": 323.16565, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "3", "bbox": {"l": 318.77316, "t": 449.5455, "r": 323.16565, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 347.24872, "t": 449.5455, "r": 351.6412, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "4", "bbox": {"l": 347.24872, "t": 449.5455, "r": 351.6412, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 394.10422, "t": 449.5455, "r": 398.4967, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "5", "bbox": {"l": 394.10422, "t": 449.5455, "r": 398.4967, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 440.95941000000005, "t": 449.5455, "r": 445.3519, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "6", "bbox": {"l": 440.95941000000005, "t": 449.5455, "r": 445.3519, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 487.81491, "t": 449.5455, "r": 492.2074, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "7", "bbox": {"l": 487.81491, "t": 449.5455, "r": 492.2074, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 318.77316, "t": 473.70425, "r": 323.16565, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "8", "bbox": {"l": 318.77316, "t": 473.70425, "r": 323.16565, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 347.24872, "t": 461.8446, "r": 351.6412, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "9", "bbox": {"l": 347.24872, "t": 461.8446, "r": 351.6412, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 394.10422, "t": 461.8446, "r": 402.88831, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "10", "bbox": {"l": 394.10422, "t": 461.8446, "r": 402.88831, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 440.95941000000005, "t": 461.8446, "r": 449.42285, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "11", "bbox": {"l": 440.95941000000005, "t": 461.8446, "r": 449.42285, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 487.81491, "t": 461.8446, "r": 496.599, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "12", "bbox": {"l": 487.81491, "t": 461.8446, "r": 496.599, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 347.24872, "t": 473.70425, "r": 356.03281, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "13", "bbox": {"l": 347.24872, "t": 473.70425, "r": 356.03281, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 394.10422, "t": 473.70425, "r": 402.88831, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "14", "bbox": {"l": 394.10422, "t": 473.70425, "r": 402.88831, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 440.95941000000005, "t": 473.70425, "r": 449.7435, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "15", "bbox": {"l": 440.95941000000005, "t": 473.70425, "r": 449.7435, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 487.81491, "t": 473.70425, "r": 496.599, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "16", "bbox": {"l": 487.81491, "t": 473.70425, "r": 496.599, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 347.24872, "t": 485.12469, "r": 356.03281, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "17", "bbox": {"l": 347.24872, "t": 485.12469, "r": 356.03281, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 394.10422, "t": 485.12469, "r": 402.88831, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "18", "bbox": {"l": 394.10422, "t": 485.12469, "r": 402.88831, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 440.95941000000005, "t": 485.12469, "r": 449.7435, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "19", "bbox": {"l": 440.95941000000005, "t": 485.12469, "r": 449.7435, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 487.81491, "t": 485.12469, "r": 496.599, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "20", "bbox": {"l": 487.81491, "t": 485.12469, "r": 496.599, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 366.70102, "t": 449.12082, "r": 372.70581, "b": 459.25122, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "3", "bbox": {"l": 366.70102, "t": 449.12082, "r": 372.70581, "b": 459.25122, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 331.90424, "t": 473.32291, "r": 337.90903, "b": 483.45331, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "2", "bbox": {"l": 331.90424, "t": 473.32291, "r": 337.90903, "b": 483.45331, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 459.87621999999993, "t": 437.5936, "r": 465.88101, "b": 447.724, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "1", "bbox": {"l": 459.87621999999993, "t": 437.5936, "r": 465.88101, "b": 447.724, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "lcel", "ched", "lcel", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "ucel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "ucel", "nl"], "num_rows": 5, "num_cols": 6, "table_cells": [{"bbox": {"l": 347.24872, "t": 437.68588, "r": 351.6412, "b": 446.47083, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 3, "text": "1", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 318.88071, "t": 437.68588, "r": 323.27319, "b": 446.47083, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "0", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 394.10422, "t": 437.5936, "r": 465.88101, "b": 447.724, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 5, "text": "2 1", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 318.77316, "t": 449.5455, "r": 323.16565, "b": 458.33044, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 347.24872, "t": 449.5455, "r": 351.6412, "b": 458.33044, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 366.70102, "t": 449.12082, "r": 398.4967, "b": 459.25122, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "5 3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.95941000000005, "t": 449.5455, "r": 445.3519, "b": 458.33044, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.81491, "t": 449.5455, "r": 492.2074, "b": 458.33044, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 318.77316, "t": 473.70425, "r": 323.16565, "b": 482.4892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 347.24872, "t": 461.8446, "r": 351.6412, "b": 470.62955, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.10422, "t": 461.8446, "r": 402.88831, "b": 470.62955, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "10", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.95941000000005, "t": 461.8446, "r": 449.42285, "b": 470.62955, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "11", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.81491, "t": 461.8446, "r": 496.599, "b": 470.62955, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "12", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 347.24872, "t": 473.70425, "r": 356.03281, "b": 482.4892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "13", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.10422, "t": 473.70425, "r": 402.88831, "b": 482.4892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "14", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.95941000000005, "t": 473.70425, "r": 449.7435, "b": 482.4892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "15", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.81491, "t": 473.70425, "r": 496.599, "b": 482.4892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "16", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 347.24872, "t": 485.12469, "r": 356.03281, "b": 493.90964, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "17", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.10422, "t": 485.12469, "r": 402.88831, "b": 493.90964, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "18", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.95941000000005, "t": 485.12469, "r": 449.7435, "b": 493.90964, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "19", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.81491, "t": 485.12469, "r": 496.599, "b": 493.90964, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "20", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 331.90424, "t": 473.32291, "r": 337.90903, "b": 483.45331, "coord_origin": "TOPLEFT"}, "row_span": 3, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "2", "column_header": false, "row_header": false, "row_section": false}]}, "15": {"label": "table", "id": 15, "page_no": 0, "cluster": {"id": 15, "label": "table", "bbox": {"l": 315.65362548828125, "t": 228.723388671875, "r": 537.1475219726562, "b": 302.8014221191406, "coord_origin": "TOPLEFT"}, "confidence": 0.6515864729881287, "cells": [{"id": 97, "text": "1", "bbox": {"l": 451.9457100000001, "t": 235.34704999999997, "r": 457.95050000000003, "b": 245.47748, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "2", "bbox": {"l": 331.19681, "t": 269.35266, "r": 337.2016, "b": 279.48308999999995, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "3", "bbox": {"l": 384.0329, "t": 252.67895999999996, "r": 390.03769, "b": 262.80939, "coord_origin": "TOPLEFT"}}], "children": [{"id": 62, "label": "text", "bbox": {"l": 451.9457100000001, "t": 235.34704999999997, "r": 457.95050000000003, "b": 245.47748, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "1", "bbox": {"l": 451.9457100000001, "t": 235.34704999999997, "r": 457.95050000000003, "b": 245.47748, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 331.19681, "t": 269.35266, "r": 337.2016, "b": 279.48308999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "2", "bbox": {"l": 331.19681, "t": 269.35266, "r": 337.2016, "b": 279.48308999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 384.0329, "t": 252.67895999999996, "r": 390.03769, "b": 262.80939, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "3", "bbox": {"l": 384.0329, "t": 252.67895999999996, "r": 390.03769, "b": 262.80939, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ecel", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "ucel", "fcel", "fcel", "fcel", "fcel", "nl", "ucel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 1, "num_cols": 2, "table_cells": [{"bbox": {"l": 451.9457100000001, "t": 235.34704999999997, "r": 457.95050000000003, "b": 245.47748, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "1", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 384.0329, "t": 252.67895999999996, "r": 390.03769, "b": 262.80939, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3", "column_header": true, "row_header": false, "row_section": false}]}}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "section_header", "id": 8, "page_no": 0, "cluster": {"id": 8, "label": "section_header", "bbox": {"l": 96.301003, "t": 107.03412000000003, "r": 498.92708999999996, "b": 119.93133999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.8868067860603333, "cells": [{"id": 0, "text": "TableFormer: Table Structure Understanding with Transformers.", "bbox": {"l": 96.301003, "t": 107.03412000000003, "r": 498.92708999999996, "b": 119.93133999999998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "TableFormer: Table Structure Understanding with Transformers."}, {"label": "section_header", "id": 13, "page_no": 0, "cluster": {"id": 13, "label": "section_header", "bbox": {"l": 142.47701, "t": 146.68535999999995, "r": 452.75027, "b": 171.32037000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.7586215734481812, "cells": [{"id": 1, "text": "Ahmed Nassar, Nikolaos Livathinos, Maksym Lysak, Peter Staar", "bbox": {"l": 142.47701, "t": 146.68535999999995, "r": 452.75027, "b": 157.37334999999996, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "IBM Research", "bbox": {"l": 262.918, "t": 160.63239, "r": 332.30597, "b": 171.32037000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Ahmed Nassar, Nikolaos Livathinos, Maksym Lysak, Peter Staar IBM Research"}, {"label": "key_value_region", "id": 25, "page_no": 0, "cluster": {"id": 25, "label": "key_value_region", "bbox": {"l": 208.123, "t": 175.96123999999998, "r": 378.73257, "b": 184.42553999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.4854728579521179, "cells": [{"id": 3, "text": "{", "bbox": {"l": 208.123, "t": 175.96123999999998, "r": 212.73083, "b": 184.42553999999996, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "ahn,nli,mly,taa", "bbox": {"l": 212.73, "t": 177.08203000000003, "r": 293.42761, "b": 184.00409000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "}", "bbox": {"l": 293.42798, "t": 175.96123999999998, "r": 298.0358, "b": 184.42553999999996, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "@zurich.ibm.com", "bbox": {"l": 298.03497, "t": 177.08203000000003, "r": 378.73257, "b": 184.00409000000002, "coord_origin": "TOPLEFT"}}], "children": [{"id": 7, "label": "text", "bbox": {"l": 208.123, "t": 175.96123999999998, "r": 378.73257, "b": 184.42553999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9096331596374512, "cells": [{"id": 3, "text": "{", "bbox": {"l": 208.123, "t": 175.96123999999998, "r": 212.73083, "b": 184.42553999999996, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "ahn,nli,mly,taa", "bbox": {"l": 212.73, "t": 177.08203000000003, "r": 293.42761, "b": 184.00409000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "}", "bbox": {"l": 293.42798, "t": 175.96123999999998, "r": 298.0358, "b": 184.42553999999996, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "@zurich.ibm.com", "bbox": {"l": 298.03497, "t": 177.08203000000003, "r": 378.73257, "b": 184.00409000000002, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null}, {"label": "section_header", "id": 5, "page_no": 0, "cluster": {"id": 5, "label": "section_header", "bbox": {"l": 145.99498, "t": 215.48297000000002, "r": 190.48029, "b": 226.23071000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9258671402931213, "cells": [{"id": 7, "text": "Abstract", "bbox": {"l": 145.99498, "t": 215.48297000000002, "r": 190.48029, "b": 226.23071000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Abstract"}, {"label": "text", "id": 2, "page_no": 0, "cluster": {"id": 2, "label": "text", "bbox": {"l": 50.111977, "t": 241.39508, "r": 286.36511, "b": 512.9966400000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9838882088661194, "cells": [{"id": 8, "text": "Tables organize valuable content in a concise and com-", "bbox": {"l": 62.066978, "t": 241.39508, "r": 286.36493, "b": 249.98284999999998, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "pact representation. This content is extremely valuable for", "bbox": {"l": 50.111977, "t": 253.3501, "r": 286.36508, "b": 261.93787, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "systems such as search engines, Knowledge Graph\u2019s, etc,", "bbox": {"l": 50.111977, "t": 265.30511, "r": 286.36508, "b": 273.89288, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "since they enhance their predictive capabilities. Unfortu-", "bbox": {"l": 50.111977, "t": 277.26111000000003, "r": 286.36505, "b": 285.84888, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "nately, tables come in a large variety of shapes and sizes.", "bbox": {"l": 50.111977, "t": 289.21609, "r": 286.36505, "b": 297.80386, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Furthermore, they can have complex column/row-header", "bbox": {"l": 50.111977, "t": 301.17108, "r": 286.36505, "b": 309.75884999999994, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "configurations, multiline rows, different variety of separa-", "bbox": {"l": 50.111977, "t": 313.12607, "r": 286.36508, "b": 321.71384, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "tion lines, missing entries, etc. As such, the correct iden-", "bbox": {"l": 50.111977, "t": 325.08105, "r": 286.36508, "b": 333.66882, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "tification of the table-structure from an image is a non-", "bbox": {"l": 50.111977, "t": 337.03604, "r": 286.36505, "b": 345.62381, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "trivial task. In this paper, we present a new table-structure", "bbox": {"l": 50.111977, "t": 348.99203, "r": 286.36508, "b": 357.5798, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "identification model. The latter improves the latest end-to-", "bbox": {"l": 50.111977, "t": 360.94701999999995, "r": 286.36505, "b": 369.53479, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "end deep learning model (i.e. encoder-dual-decoder from", "bbox": {"l": 50.111977, "t": 372.90201, "r": 286.36508, "b": 381.48978, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "PubTabNet) in two significant ways. First, we introduce a", "bbox": {"l": 50.111977, "t": 384.85699, "r": 286.36505, "b": 393.44476, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "new object detection decoder for table-cells. In this way,", "bbox": {"l": 50.111977, "t": 396.81198, "r": 286.36511, "b": 405.39975000000004, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "we can obtain the content of the table-cells from program-", "bbox": {"l": 50.111977, "t": 408.76697, "r": 286.36508, "b": 417.35474, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "matic PDF\u2019s directly from the PDF source and avoid the", "bbox": {"l": 50.111977, "t": 420.72296000000006, "r": 286.36505, "b": 429.31073, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "training of the custom OCR decoders.", "bbox": {"l": 50.111977, "t": 432.67795, "r": 207.23216, "b": 441.26572, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "This architectural", "bbox": {"l": 214.09639, "t": 432.67795, "r": 286.36508, "b": 441.26572, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "change leads to more accurate table-content extraction and", "bbox": {"l": 50.111977, "t": 444.63293, "r": 286.36508, "b": 453.2207, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "allows us to tackle non-english tables. Second, we replace", "bbox": {"l": 50.111977, "t": 456.58792000000005, "r": 286.36505, "b": 465.17569, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "the LSTM decoders with transformer based decoders. This", "bbox": {"l": 50.111977, "t": 468.54291, "r": 286.36505, "b": 477.13068, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "upgrade improves significantly the previous state-of-the-art", "bbox": {"l": 50.111977, "t": 480.4989, "r": 286.36508, "b": 489.08667, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "tree-editing-distance-score (TEDS) from 91% to 98.5% on", "bbox": {"l": 50.111977, "t": 492.45389, "r": 286.36505, "b": 501.04166, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "simple tables and from 88.7% to 95% on complex tables.", "bbox": {"l": 50.111977, "t": 504.40887, "r": 276.65152, "b": 512.9966400000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Tables organize valuable content in a concise and compact representation. This content is extremely valuable for systems such as search engines, Knowledge Graph\u2019s, etc, since they enhance their predictive capabilities. Unfortunately, tables come in a large variety of shapes and sizes. Furthermore, they can have complex column/row-header configurations, multiline rows, different variety of separation lines, missing entries, etc. As such, the correct identification of the table-structure from an image is a nontrivial task. In this paper, we present a new table-structure identification model. The latter improves the latest end-toend deep learning model (i.e. encoder-dual-decoder from PubTabNet) in two significant ways. First, we introduce a new object detection decoder for table-cells. In this way, we can obtain the content of the table-cells from programmatic PDF\u2019s directly from the PDF source and avoid the training of the custom OCR decoders. This architectural change leads to more accurate table-content extraction and allows us to tackle non-english tables. Second, we replace the LSTM decoders with transformer based decoders. This upgrade improves significantly the previous state-of-the-art tree-editing-distance-score (TEDS) from 91% to 98.5% on simple tables and from 88.7% to 95% on complex tables."}, {"label": "section_header", "id": 4, "page_no": 0, "cluster": {"id": 4, "label": "section_header", "bbox": {"l": 50.111977, "t": 539.94276, "r": 126.94804, "b": 550.69049, "coord_origin": "TOPLEFT"}, "confidence": 0.9317677617073059, "cells": [{"id": 32, "text": "1.", "bbox": {"l": 50.111977, "t": 539.94276, "r": 58.121296, "b": 550.69049, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "Introduction", "bbox": {"l": 68.800385, "t": 539.94276, "r": 126.94804, "b": 550.69049, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1. Introduction"}, {"label": "text", "id": 1, "page_no": 0, "cluster": {"id": 1, "label": "text", "bbox": {"l": 50.111977, "t": 560.7832, "r": 286.36508, "b": 713.151779, "coord_origin": "TOPLEFT"}, "confidence": 0.9841895699501038, "cells": [{"id": 34, "text": "The occurrence of tables in documents is ubiquitous.", "bbox": {"l": 62.066978, "t": 560.7832, "r": 286.36496, "b": 569.68976, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "They often summarise quantitative or factual data, which is", "bbox": {"l": 50.111977, "t": 572.7382, "r": 286.36508, "b": 581.64476, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "cumbersome to describe in verbose text but nevertheless ex-", "bbox": {"l": 50.111977, "t": 584.69321, "r": 286.36505, "b": 593.5997600000001, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "tremely valuable. Unfortunately, this compact representa-", "bbox": {"l": 50.111977, "t": 596.6492000000001, "r": 286.36505, "b": 605.55576, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "tion is often not easy to parse by machines. There are many", "bbox": {"l": 50.111977, "t": 608.6042, "r": 286.36505, "b": 617.51076, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "implicit conventions used to obtain a compact table repre-", "bbox": {"l": 50.111977, "t": 620.5592, "r": 286.36505, "b": 629.46576, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "sentation. For example, tables often have complex column-", "bbox": {"l": 50.111977, "t": 632.51421, "r": 286.36508, "b": 641.42076, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "and row-headers in order to reduce duplicated cell content.", "bbox": {"l": 50.111977, "t": 644.46921, "r": 286.36508, "b": 653.37576, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "Lines of different shapes and sizes are leveraged to separate", "bbox": {"l": 50.111977, "t": 656.42421, "r": 286.36502, "b": 665.33077, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "content or indicate a tree structure. Additionally, tables can", "bbox": {"l": 50.111977, "t": 668.3802000000001, "r": 286.36505, "b": 677.28677, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "also have empty/missing table-entries or multi-row textual", "bbox": {"l": 50.111977, "t": 680.33521, "r": 286.36505, "b": 689.2417800000001, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "table-entries. Fig. 1 shows a table which presents all these", "bbox": {"l": 50.111977, "t": 692.290207, "r": 286.36505, "b": 701.196777, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "issues.", "bbox": {"l": 50.111977, "t": 704.245209, "r": 76.403275, "b": 713.151779, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The occurrence of tables in documents is ubiquitous. They often summarise quantitative or factual data, which is cumbersome to describe in verbose text but nevertheless extremely valuable. Unfortunately, this compact representation is often not easy to parse by machines. There are many implicit conventions used to obtain a compact table representation. For example, tables often have complex columnand row-headers in order to reduce duplicated cell content. Lines of different shapes and sizes are leveraged to separate content or indicate a tree structure. Additionally, tables can also have empty/missing table-entries or multi-row textual table-entries. Fig. 1 shows a table which presents all these issues."}, {"label": "section_header", "id": 14, "page_no": 0, "cluster": {"id": 14, "label": "section_header", "bbox": {"l": 315.56702, "t": 218.00684, "r": 408.4407, "b": 226.75482, "coord_origin": "TOPLEFT"}, "confidence": 0.6724023818969727, "cells": [{"id": 47, "text": "a.", "bbox": {"l": 315.56702, "t": 218.00684, "r": 324.01007, "b": 226.75482, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Picture of a table:", "bbox": {"l": 328.2316, "t": 218.00684, "r": 408.4407, "b": 226.75482, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "a. Picture of a table:"}, {"label": "list_item", "id": 17, "page_no": 0, "cluster": {"id": 17, "label": "list_item", "bbox": {"l": 315.56702, "t": 313.69478999999995, "r": 486.40194999999994, "b": 333.2428, "coord_origin": "TOPLEFT"}, "confidence": 0.5549328923225403, "cells": [{"id": 49, "text": "b.", "bbox": {"l": 315.56702, "t": 313.69478999999995, "r": 325.05786, "b": 322.44281, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Red-annotation of bounding boxes,", "bbox": {"l": 329.80325, "t": 313.69478999999995, "r": 486.40194999999994, "b": 322.44281, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Blue-predictions by TableFormer", "bbox": {"l": 326.46252, "t": 324.49478, "r": 472.47411999999997, "b": 333.2428, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "b. Red-annotation of bounding boxes, Blue-predictions by TableFormer"}, {"label": "list_item", "id": 18, "page_no": 0, "cluster": {"id": 18, "label": "list_item", "bbox": {"l": 315.56702, "t": 420.1828, "r": 491.1912500000001, "b": 428.93082, "coord_origin": "TOPLEFT"}, "confidence": 0.5501358509063721, "cells": [{"id": 52, "text": "c.", "bbox": {"l": 315.56702, "t": 420.1828, "r": 324.81039, "b": 428.93082, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Structure predicted by TableFormer:", "bbox": {"l": 329.4321, "t": 420.1828, "r": 491.1912500000001, "b": 428.93082, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "c. Structure predicted by TableFormer:"}, {"label": "picture", "id": 10, "page_no": 0, "cluster": {"id": 10, "label": "picture", "bbox": {"l": 314.78173828125, "t": 338.0652770996094, "r": 539.1802978515625, "b": 410.0494384765625, "coord_origin": "TOPLEFT"}, "confidence": 0.8742761611938477, "cells": [{"id": 54, "text": "1", "bbox": {"l": 408.14752, "t": 342.82828, "r": 412.54001, "b": 351.61322, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "0", "bbox": {"l": 356.11011, "t": 341.57217, "r": 360.50259, "b": 350.35712, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "2", "bbox": {"l": 500.6777, "t": 340.93768, "r": 505.0701900000001, "b": 349.7226299999999, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "3", "bbox": {"l": 356.13382, "t": 351.74789, "r": 360.52631, "b": 360.53284, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "4", "bbox": {"l": 402.53992, "t": 355.8765, "r": 406.9324, "b": 364.66144, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "5", "bbox": {"l": 448.58178999999996, "t": 352.84018, "r": 452.97427, "b": 361.62512, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "6", "bbox": {"l": 491.65161000000006, "t": 353.70657, "r": 496.0441, "b": 362.49152, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "7", "bbox": {"l": 535.13843, "t": 353.33969, "r": 539.53088, "b": 362.12463, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "8", "bbox": {"l": 348.82822, "t": 387.09781, "r": 353.2207, "b": 395.88275, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "9", "bbox": {"l": 389.27151, "t": 375.37228, "r": 393.664, "b": 384.15723, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "10", "bbox": {"l": 442.67479999999995, "t": 375.64621, "r": 451.45889000000005, "b": 384.43115, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "11", "bbox": {"l": 477.4382299999999, "t": 375.534, "r": 485.90167, "b": 384.31894000000005, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "12", "bbox": {"l": 522.57263, "t": 375.64621, "r": 531.35669, "b": 384.43115, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "13", "bbox": {"l": 400.22992, "t": 387.11429, "r": 409.01401, "b": 395.89923, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "14", "bbox": {"l": 442.30792, "t": 386.98981000000003, "r": 451.0920100000001, "b": 395.77475000000004, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "15", "bbox": {"l": 478.21941999999996, "t": 387.37469, "r": 487.00351000000006, "b": 396.15964, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "16", "bbox": {"l": 523.2287, "t": 386.98981000000003, "r": 532.01276, "b": 395.77475000000004, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "1", "bbox": {"l": 411.57233, "t": 399.42477, "r": 415.96481, "b": 408.20972, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "7", "bbox": {"l": 415.96393, "t": 399.42477, "r": 420.35641, "b": 408.20972, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "18", "bbox": {"l": 442.30521, "t": 399.0371999999999, "r": 451.08929, "b": 407.82213999999993, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "19", "bbox": {"l": 478.77893, "t": 398.99639999999994, "r": 487.56302, "b": 407.78133999999994, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "20", "bbox": {"l": 523.97241, "t": 398.6114799999999, "r": 532.75647, "b": 407.39642, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "3", "bbox": {"l": 385.09399, "t": 357.76030999999995, "r": 391.09879, "b": 367.89072, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "2", "bbox": {"l": 333.43451, "t": 380.7265, "r": 339.4393, "b": 390.85689999999994, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "1", "bbox": {"l": 478.07210999999995, "t": 341.0368000000001, "r": 484.0769, "b": 351.16720999999995, "coord_origin": "TOPLEFT"}}], "children": [{"id": 19, "label": "text", "bbox": {"l": 408.14752, "t": 342.82828, "r": 412.54001, "b": 351.61322, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "1", "bbox": {"l": 408.14752, "t": 342.82828, "r": 412.54001, "b": 351.61322, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 356.11011, "t": 341.57217, "r": 360.50259, "b": 350.35712, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "0", "bbox": {"l": 356.11011, "t": 341.57217, "r": 360.50259, "b": 350.35712, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 500.6777, "t": 340.93768, "r": 505.0701900000001, "b": 349.7226299999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "2", "bbox": {"l": 500.6777, "t": 340.93768, "r": 505.0701900000001, "b": 349.7226299999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 356.13382, "t": 351.74789, "r": 360.52631, "b": 360.53284, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "3", "bbox": {"l": 356.13382, "t": 351.74789, "r": 360.52631, "b": 360.53284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 402.53992, "t": 355.8765, "r": 406.9324, "b": 364.66144, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "4", "bbox": {"l": 402.53992, "t": 355.8765, "r": 406.9324, "b": 364.66144, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 448.58178999999996, "t": 352.84018, "r": 452.97427, "b": 361.62512, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "5", "bbox": {"l": 448.58178999999996, "t": 352.84018, "r": 452.97427, "b": 361.62512, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 491.65161000000006, "t": 353.70657, "r": 496.0441, "b": 362.49152, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "6", "bbox": {"l": 491.65161000000006, "t": 353.70657, "r": 496.0441, "b": 362.49152, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 535.13843, "t": 353.33969, "r": 539.53088, "b": 362.12463, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "7", "bbox": {"l": 535.13843, "t": 353.33969, "r": 539.53088, "b": 362.12463, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 348.82822, "t": 387.09781, "r": 353.2207, "b": 395.88275, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "8", "bbox": {"l": 348.82822, "t": 387.09781, "r": 353.2207, "b": 395.88275, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 389.27151, "t": 375.37228, "r": 393.664, "b": 384.15723, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "9", "bbox": {"l": 389.27151, "t": 375.37228, "r": 393.664, "b": 384.15723, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 442.67479999999995, "t": 375.64621, "r": 451.45889000000005, "b": 384.43115, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "10", "bbox": {"l": 442.67479999999995, "t": 375.64621, "r": 451.45889000000005, "b": 384.43115, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 477.4382299999999, "t": 375.534, "r": 485.90167, "b": 384.31894000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "11", "bbox": {"l": 477.4382299999999, "t": 375.534, "r": 485.90167, "b": 384.31894000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 522.57263, "t": 375.64621, "r": 531.35669, "b": 384.43115, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "12", "bbox": {"l": 522.57263, "t": 375.64621, "r": 531.35669, "b": 384.43115, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 400.22992, "t": 387.11429, "r": 409.01401, "b": 395.89923, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "13", "bbox": {"l": 400.22992, "t": 387.11429, "r": 409.01401, "b": 395.89923, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 442.30792, "t": 386.98981000000003, "r": 451.0920100000001, "b": 395.77475000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "14", "bbox": {"l": 442.30792, "t": 386.98981000000003, "r": 451.0920100000001, "b": 395.77475000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 478.21941999999996, "t": 387.37469, "r": 487.00351000000006, "b": 396.15964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "15", "bbox": {"l": 478.21941999999996, "t": 387.37469, "r": 487.00351000000006, "b": 396.15964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 523.2287, "t": 386.98981000000003, "r": 532.01276, "b": 395.77475000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "16", "bbox": {"l": 523.2287, "t": 386.98981000000003, "r": 532.01276, "b": 395.77475000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 411.57233, "t": 399.42477, "r": 415.96481, "b": 408.20972, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "1", "bbox": {"l": 411.57233, "t": 399.42477, "r": 415.96481, "b": 408.20972, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 415.96393, "t": 399.42477, "r": 420.35641, "b": 408.20972, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "7", "bbox": {"l": 415.96393, "t": 399.42477, "r": 420.35641, "b": 408.20972, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 442.30521, "t": 399.0371999999999, "r": 451.08929, "b": 407.82213999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "18", "bbox": {"l": 442.30521, "t": 399.0371999999999, "r": 451.08929, "b": 407.82213999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 478.77893, "t": 398.99639999999994, "r": 487.56302, "b": 407.78133999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "19", "bbox": {"l": 478.77893, "t": 398.99639999999994, "r": 487.56302, "b": 407.78133999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 523.97241, "t": 398.6114799999999, "r": 532.75647, "b": 407.39642, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "20", "bbox": {"l": 523.97241, "t": 398.6114799999999, "r": 532.75647, "b": 407.39642, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 385.09399, "t": 357.76030999999995, "r": 391.09879, "b": 367.89072, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "3", "bbox": {"l": 385.09399, "t": 357.76030999999995, "r": 391.09879, "b": 367.89072, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 333.43451, "t": 380.7265, "r": 339.4393, "b": 390.85689999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "2", "bbox": {"l": 333.43451, "t": 380.7265, "r": 339.4393, "b": 390.85689999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 478.07210999999995, "t": 341.0368000000001, "r": 484.0769, "b": 351.16720999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": "1", "bbox": {"l": 478.07210999999995, "t": 341.0368000000001, "r": 484.0769, "b": 351.16720999999995, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "picture", "id": 23, "page_no": 0, "cluster": {"id": 23, "label": "picture", "bbox": {"l": 315.7172546386719, "t": 433.823486328125, "r": 536.835693359375, "b": 496.0290222167969, "coord_origin": "TOPLEFT"}, "confidence": 0.5088632702827454, "cells": [{"id": 76, "text": "1", "bbox": {"l": 347.24872, "t": 437.68588, "r": 351.6412, "b": 446.47083, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "0", "bbox": {"l": 318.88071, "t": 437.68588, "r": 323.27319, "b": 446.47083, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "2", "bbox": {"l": 394.10422, "t": 437.68588, "r": 398.4967, "b": 446.47083, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "3", "bbox": {"l": 318.77316, "t": 449.5455, "r": 323.16565, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "4", "bbox": {"l": 347.24872, "t": 449.5455, "r": 351.6412, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "5", "bbox": {"l": 394.10422, "t": 449.5455, "r": 398.4967, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "6", "bbox": {"l": 440.95941000000005, "t": 449.5455, "r": 445.3519, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "7", "bbox": {"l": 487.81491, "t": 449.5455, "r": 492.2074, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "8", "bbox": {"l": 318.77316, "t": 473.70425, "r": 323.16565, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "9", "bbox": {"l": 347.24872, "t": 461.8446, "r": 351.6412, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "10", "bbox": {"l": 394.10422, "t": 461.8446, "r": 402.88831, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "11", "bbox": {"l": 440.95941000000005, "t": 461.8446, "r": 449.42285, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "12", "bbox": {"l": 487.81491, "t": 461.8446, "r": 496.599, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "13", "bbox": {"l": 347.24872, "t": 473.70425, "r": 356.03281, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "14", "bbox": {"l": 394.10422, "t": 473.70425, "r": 402.88831, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "15", "bbox": {"l": 440.95941000000005, "t": 473.70425, "r": 449.7435, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "16", "bbox": {"l": 487.81491, "t": 473.70425, "r": 496.599, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "17", "bbox": {"l": 347.24872, "t": 485.12469, "r": 356.03281, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "18", "bbox": {"l": 394.10422, "t": 485.12469, "r": 402.88831, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "19", "bbox": {"l": 440.95941000000005, "t": 485.12469, "r": 449.7435, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "20", "bbox": {"l": 487.81491, "t": 485.12469, "r": 496.599, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "3", "bbox": {"l": 366.70102, "t": 449.12082, "r": 372.70581, "b": 459.25122, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "2", "bbox": {"l": 331.90424, "t": 473.32291, "r": 337.90903, "b": 483.45331, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "1", "bbox": {"l": 459.87621999999993, "t": 437.5936, "r": 465.88101, "b": 447.724, "coord_origin": "TOPLEFT"}}], "children": [{"id": 41, "label": "text", "bbox": {"l": 347.24872, "t": 437.68588, "r": 351.6412, "b": 446.47083, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "1", "bbox": {"l": 347.24872, "t": 437.68588, "r": 351.6412, "b": 446.47083, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 318.88071, "t": 437.68588, "r": 323.27319, "b": 446.47083, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "0", "bbox": {"l": 318.88071, "t": 437.68588, "r": 323.27319, "b": 446.47083, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 394.10422, "t": 437.68588, "r": 398.4967, "b": 446.47083, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "2", "bbox": {"l": 394.10422, "t": 437.68588, "r": 398.4967, "b": 446.47083, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 318.77316, "t": 449.5455, "r": 323.16565, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "3", "bbox": {"l": 318.77316, "t": 449.5455, "r": 323.16565, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 347.24872, "t": 449.5455, "r": 351.6412, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "4", "bbox": {"l": 347.24872, "t": 449.5455, "r": 351.6412, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 394.10422, "t": 449.5455, "r": 398.4967, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "5", "bbox": {"l": 394.10422, "t": 449.5455, "r": 398.4967, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 440.95941000000005, "t": 449.5455, "r": 445.3519, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "6", "bbox": {"l": 440.95941000000005, "t": 449.5455, "r": 445.3519, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 487.81491, "t": 449.5455, "r": 492.2074, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "7", "bbox": {"l": 487.81491, "t": 449.5455, "r": 492.2074, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 318.77316, "t": 473.70425, "r": 323.16565, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "8", "bbox": {"l": 318.77316, "t": 473.70425, "r": 323.16565, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 347.24872, "t": 461.8446, "r": 351.6412, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "9", "bbox": {"l": 347.24872, "t": 461.8446, "r": 351.6412, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 394.10422, "t": 461.8446, "r": 402.88831, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "10", "bbox": {"l": 394.10422, "t": 461.8446, "r": 402.88831, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 440.95941000000005, "t": 461.8446, "r": 449.42285, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "11", "bbox": {"l": 440.95941000000005, "t": 461.8446, "r": 449.42285, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 487.81491, "t": 461.8446, "r": 496.599, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "12", "bbox": {"l": 487.81491, "t": 461.8446, "r": 496.599, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 347.24872, "t": 473.70425, "r": 356.03281, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "13", "bbox": {"l": 347.24872, "t": 473.70425, "r": 356.03281, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 394.10422, "t": 473.70425, "r": 402.88831, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "14", "bbox": {"l": 394.10422, "t": 473.70425, "r": 402.88831, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 440.95941000000005, "t": 473.70425, "r": 449.7435, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "15", "bbox": {"l": 440.95941000000005, "t": 473.70425, "r": 449.7435, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 487.81491, "t": 473.70425, "r": 496.599, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "16", "bbox": {"l": 487.81491, "t": 473.70425, "r": 496.599, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 347.24872, "t": 485.12469, "r": 356.03281, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "17", "bbox": {"l": 347.24872, "t": 485.12469, "r": 356.03281, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 394.10422, "t": 485.12469, "r": 402.88831, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "18", "bbox": {"l": 394.10422, "t": 485.12469, "r": 402.88831, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 440.95941000000005, "t": 485.12469, "r": 449.7435, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "19", "bbox": {"l": 440.95941000000005, "t": 485.12469, "r": 449.7435, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 487.81491, "t": 485.12469, "r": 496.599, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "20", "bbox": {"l": 487.81491, "t": 485.12469, "r": 496.599, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 366.70102, "t": 449.12082, "r": 372.70581, "b": 459.25122, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "3", "bbox": {"l": 366.70102, "t": 449.12082, "r": 372.70581, "b": 459.25122, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 331.90424, "t": 473.32291, "r": 337.90903, "b": 483.45331, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "2", "bbox": {"l": 331.90424, "t": 473.32291, "r": 337.90903, "b": 483.45331, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 459.87621999999993, "t": 437.5936, "r": 465.88101, "b": 447.724, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "1", "bbox": {"l": 459.87621999999993, "t": 437.5936, "r": 465.88101, "b": 447.724, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "table", "id": 11, "page_no": 0, "cluster": {"id": 11, "label": "table", "bbox": {"l": 315.7172546386719, "t": 433.823486328125, "r": 536.835693359375, "b": 496.0290222167969, "coord_origin": "TOPLEFT"}, "confidence": 0.8056110739707947, "cells": [{"id": 76, "text": "1", "bbox": {"l": 347.24872, "t": 437.68588, "r": 351.6412, "b": 446.47083, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "0", "bbox": {"l": 318.88071, "t": 437.68588, "r": 323.27319, "b": 446.47083, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "2", "bbox": {"l": 394.10422, "t": 437.68588, "r": 398.4967, "b": 446.47083, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "3", "bbox": {"l": 318.77316, "t": 449.5455, "r": 323.16565, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "4", "bbox": {"l": 347.24872, "t": 449.5455, "r": 351.6412, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "5", "bbox": {"l": 394.10422, "t": 449.5455, "r": 398.4967, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "6", "bbox": {"l": 440.95941000000005, "t": 449.5455, "r": 445.3519, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "7", "bbox": {"l": 487.81491, "t": 449.5455, "r": 492.2074, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "8", "bbox": {"l": 318.77316, "t": 473.70425, "r": 323.16565, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "9", "bbox": {"l": 347.24872, "t": 461.8446, "r": 351.6412, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "10", "bbox": {"l": 394.10422, "t": 461.8446, "r": 402.88831, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "11", "bbox": {"l": 440.95941000000005, "t": 461.8446, "r": 449.42285, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "12", "bbox": {"l": 487.81491, "t": 461.8446, "r": 496.599, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "13", "bbox": {"l": 347.24872, "t": 473.70425, "r": 356.03281, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "14", "bbox": {"l": 394.10422, "t": 473.70425, "r": 402.88831, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "15", "bbox": {"l": 440.95941000000005, "t": 473.70425, "r": 449.7435, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "16", "bbox": {"l": 487.81491, "t": 473.70425, "r": 496.599, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "17", "bbox": {"l": 347.24872, "t": 485.12469, "r": 356.03281, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "18", "bbox": {"l": 394.10422, "t": 485.12469, "r": 402.88831, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "19", "bbox": {"l": 440.95941000000005, "t": 485.12469, "r": 449.7435, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "20", "bbox": {"l": 487.81491, "t": 485.12469, "r": 496.599, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "3", "bbox": {"l": 366.70102, "t": 449.12082, "r": 372.70581, "b": 459.25122, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "2", "bbox": {"l": 331.90424, "t": 473.32291, "r": 337.90903, "b": 483.45331, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "1", "bbox": {"l": 459.87621999999993, "t": 437.5936, "r": 465.88101, "b": 447.724, "coord_origin": "TOPLEFT"}}], "children": [{"id": 41, "label": "text", "bbox": {"l": 347.24872, "t": 437.68588, "r": 351.6412, "b": 446.47083, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "1", "bbox": {"l": 347.24872, "t": 437.68588, "r": 351.6412, "b": 446.47083, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 318.88071, "t": 437.68588, "r": 323.27319, "b": 446.47083, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "0", "bbox": {"l": 318.88071, "t": 437.68588, "r": 323.27319, "b": 446.47083, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 394.10422, "t": 437.68588, "r": 398.4967, "b": 446.47083, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "2", "bbox": {"l": 394.10422, "t": 437.68588, "r": 398.4967, "b": 446.47083, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 318.77316, "t": 449.5455, "r": 323.16565, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "3", "bbox": {"l": 318.77316, "t": 449.5455, "r": 323.16565, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 347.24872, "t": 449.5455, "r": 351.6412, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "4", "bbox": {"l": 347.24872, "t": 449.5455, "r": 351.6412, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 394.10422, "t": 449.5455, "r": 398.4967, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "5", "bbox": {"l": 394.10422, "t": 449.5455, "r": 398.4967, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 440.95941000000005, "t": 449.5455, "r": 445.3519, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "6", "bbox": {"l": 440.95941000000005, "t": 449.5455, "r": 445.3519, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 487.81491, "t": 449.5455, "r": 492.2074, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "7", "bbox": {"l": 487.81491, "t": 449.5455, "r": 492.2074, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 318.77316, "t": 473.70425, "r": 323.16565, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "8", "bbox": {"l": 318.77316, "t": 473.70425, "r": 323.16565, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 347.24872, "t": 461.8446, "r": 351.6412, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "9", "bbox": {"l": 347.24872, "t": 461.8446, "r": 351.6412, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 394.10422, "t": 461.8446, "r": 402.88831, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "10", "bbox": {"l": 394.10422, "t": 461.8446, "r": 402.88831, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 440.95941000000005, "t": 461.8446, "r": 449.42285, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "11", "bbox": {"l": 440.95941000000005, "t": 461.8446, "r": 449.42285, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 487.81491, "t": 461.8446, "r": 496.599, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "12", "bbox": {"l": 487.81491, "t": 461.8446, "r": 496.599, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 347.24872, "t": 473.70425, "r": 356.03281, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "13", "bbox": {"l": 347.24872, "t": 473.70425, "r": 356.03281, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 394.10422, "t": 473.70425, "r": 402.88831, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "14", "bbox": {"l": 394.10422, "t": 473.70425, "r": 402.88831, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 440.95941000000005, "t": 473.70425, "r": 449.7435, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "15", "bbox": {"l": 440.95941000000005, "t": 473.70425, "r": 449.7435, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 487.81491, "t": 473.70425, "r": 496.599, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "16", "bbox": {"l": 487.81491, "t": 473.70425, "r": 496.599, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 347.24872, "t": 485.12469, "r": 356.03281, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "17", "bbox": {"l": 347.24872, "t": 485.12469, "r": 356.03281, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 394.10422, "t": 485.12469, "r": 402.88831, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "18", "bbox": {"l": 394.10422, "t": 485.12469, "r": 402.88831, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 440.95941000000005, "t": 485.12469, "r": 449.7435, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "19", "bbox": {"l": 440.95941000000005, "t": 485.12469, "r": 449.7435, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 487.81491, "t": 485.12469, "r": 496.599, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "20", "bbox": {"l": 487.81491, "t": 485.12469, "r": 496.599, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 366.70102, "t": 449.12082, "r": 372.70581, "b": 459.25122, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "3", "bbox": {"l": 366.70102, "t": 449.12082, "r": 372.70581, "b": 459.25122, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 331.90424, "t": 473.32291, "r": 337.90903, "b": 483.45331, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "2", "bbox": {"l": 331.90424, "t": 473.32291, "r": 337.90903, "b": 483.45331, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 459.87621999999993, "t": 437.5936, "r": 465.88101, "b": 447.724, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "1", "bbox": {"l": 459.87621999999993, "t": 437.5936, "r": 465.88101, "b": 447.724, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "lcel", "ched", "lcel", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "ucel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "ucel", "nl"], "num_rows": 5, "num_cols": 6, "table_cells": [{"bbox": {"l": 347.24872, "t": 437.68588, "r": 351.6412, "b": 446.47083, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 3, "text": "1", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 318.88071, "t": 437.68588, "r": 323.27319, "b": 446.47083, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "0", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 394.10422, "t": 437.5936, "r": 465.88101, "b": 447.724, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 5, "text": "2 1", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 318.77316, "t": 449.5455, "r": 323.16565, "b": 458.33044, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 347.24872, "t": 449.5455, "r": 351.6412, "b": 458.33044, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 366.70102, "t": 449.12082, "r": 398.4967, "b": 459.25122, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "5 3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.95941000000005, "t": 449.5455, "r": 445.3519, "b": 458.33044, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.81491, "t": 449.5455, "r": 492.2074, "b": 458.33044, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 318.77316, "t": 473.70425, "r": 323.16565, "b": 482.4892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 347.24872, "t": 461.8446, "r": 351.6412, "b": 470.62955, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.10422, "t": 461.8446, "r": 402.88831, "b": 470.62955, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "10", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.95941000000005, "t": 461.8446, "r": 449.42285, "b": 470.62955, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "11", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.81491, "t": 461.8446, "r": 496.599, "b": 470.62955, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "12", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 347.24872, "t": 473.70425, "r": 356.03281, "b": 482.4892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "13", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.10422, "t": 473.70425, "r": 402.88831, "b": 482.4892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "14", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.95941000000005, "t": 473.70425, "r": 449.7435, "b": 482.4892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "15", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.81491, "t": 473.70425, "r": 496.599, "b": 482.4892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "16", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 347.24872, "t": 485.12469, "r": 356.03281, "b": 493.90964, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "17", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.10422, "t": 485.12469, "r": 402.88831, "b": 493.90964, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "18", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.95941000000005, "t": 485.12469, "r": 449.7435, "b": 493.90964, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "19", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.81491, "t": 485.12469, "r": 496.599, "b": 493.90964, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "20", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 331.90424, "t": 473.32291, "r": 337.90903, "b": 483.45331, "coord_origin": "TOPLEFT"}, "row_span": 3, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "2", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "picture", "id": 16, "page_no": 0, "cluster": {"id": 16, "label": "picture", "bbox": {"l": 315.65362548828125, "t": 228.723388671875, "r": 537.1475219726562, "b": 302.8014221191406, "coord_origin": "TOPLEFT"}, "confidence": 0.608779788017273, "cells": [{"id": 97, "text": "1", "bbox": {"l": 451.9457100000001, "t": 235.34704999999997, "r": 457.95050000000003, "b": 245.47748, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "2", "bbox": {"l": 331.19681, "t": 269.35266, "r": 337.2016, "b": 279.48308999999995, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "3", "bbox": {"l": 384.0329, "t": 252.67895999999996, "r": 390.03769, "b": 262.80939, "coord_origin": "TOPLEFT"}}], "children": [{"id": 62, "label": "text", "bbox": {"l": 451.9457100000001, "t": 235.34704999999997, "r": 457.95050000000003, "b": 245.47748, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "1", "bbox": {"l": 451.9457100000001, "t": 235.34704999999997, "r": 457.95050000000003, "b": 245.47748, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 331.19681, "t": 269.35266, "r": 337.2016, "b": 279.48308999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "2", "bbox": {"l": 331.19681, "t": 269.35266, "r": 337.2016, "b": 279.48308999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 384.0329, "t": 252.67895999999996, "r": 390.03769, "b": 262.80939, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "3", "bbox": {"l": 384.0329, "t": 252.67895999999996, "r": 390.03769, "b": 262.80939, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "table", "id": 15, "page_no": 0, "cluster": {"id": 15, "label": "table", "bbox": {"l": 315.65362548828125, "t": 228.723388671875, "r": 537.1475219726562, "b": 302.8014221191406, "coord_origin": "TOPLEFT"}, "confidence": 0.6515864729881287, "cells": [{"id": 97, "text": "1", "bbox": {"l": 451.9457100000001, "t": 235.34704999999997, "r": 457.95050000000003, "b": 245.47748, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "2", "bbox": {"l": 331.19681, "t": 269.35266, "r": 337.2016, "b": 279.48308999999995, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "3", "bbox": {"l": 384.0329, "t": 252.67895999999996, "r": 390.03769, "b": 262.80939, "coord_origin": "TOPLEFT"}}], "children": [{"id": 62, "label": "text", "bbox": {"l": 451.9457100000001, "t": 235.34704999999997, "r": 457.95050000000003, "b": 245.47748, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "1", "bbox": {"l": 451.9457100000001, "t": 235.34704999999997, "r": 457.95050000000003, "b": 245.47748, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 331.19681, "t": 269.35266, "r": 337.2016, "b": 279.48308999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "2", "bbox": {"l": 331.19681, "t": 269.35266, "r": 337.2016, "b": 279.48308999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 384.0329, "t": 252.67895999999996, "r": 390.03769, "b": 262.80939, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "3", "bbox": {"l": 384.0329, "t": 252.67895999999996, "r": 390.03769, "b": 262.80939, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ecel", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "ucel", "fcel", "fcel", "fcel", "fcel", "nl", "ucel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 1, "num_cols": 2, "table_cells": [{"bbox": {"l": 451.9457100000001, "t": 235.34704999999997, "r": 457.95050000000003, "b": 245.47748, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "1", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 384.0329, "t": 252.67895999999996, "r": 390.03769, "b": 262.80939, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3", "column_header": true, "row_header": false, "row_section": false}]}, {"label": "caption", "id": 6, "page_no": 0, "cluster": {"id": 6, "label": "caption", "bbox": {"l": 308.862, "t": 514.50037, "r": 545.11517, "b": 559.2729, "coord_origin": "TOPLEFT"}, "confidence": 0.9214619398117065, "cells": [{"id": 106, "text": "Figure 1:", "bbox": {"l": 308.862, "t": 514.50037, "r": 345.73361, "b": 523.40692, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "Picture of a table with subtle, complex features", "bbox": {"l": 353.17566, "t": 514.50037, "r": 545.11511, "b": 523.40692, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "such as (1) multi-column headers, (2) cell with multi-row", "bbox": {"l": 308.862, "t": 526.45535, "r": 545.11511, "b": 535.3619100000001, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "text and (3) cells with no content. Image from PubTabNet", "bbox": {"l": 308.862, "t": 538.41035, "r": 545.11517, "b": 547.31691, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "evaluation set, filename: \u2018PMC2944238 004 02\u2019.", "bbox": {"l": 308.862, "t": 550.36635, "r": 505.6917700000001, "b": 559.2729, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 1: Picture of a table with subtle, complex features such as (1) multi-column headers, (2) cell with multi-row text and (3) cells with no content. Image from PubTabNet evaluation set, filename: \u2018PMC2944238 004 02\u2019."}, {"label": "text", "id": 0, "page_no": 0, "cluster": {"id": 0, "label": "text", "bbox": {"l": 308.862, "t": 584.40936, "r": 545.11517, "b": 665.04693, "coord_origin": "TOPLEFT"}, "confidence": 0.9848759770393372, "cells": [{"id": 111, "text": "Recently, significant progress has been made with vi-", "bbox": {"l": 320.81699, "t": 584.40936, "r": 545.11493, "b": 593.31592, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "sion based approaches to extract tables in documents. For", "bbox": {"l": 308.862, "t": 596.36436, "r": 545.11517, "b": 605.2709199999999, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "the sake of completeness, the issue of table extraction from", "bbox": {"l": 308.862, "t": 608.31937, "r": 545.11511, "b": 617.22592, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "documents is typically decomposed into two separate chal-", "bbox": {"l": 308.862, "t": 620.27437, "r": 545.11505, "b": 629.18092, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "lenges, i.e.", "bbox": {"l": 308.862, "t": 632.23036, "r": 353.6937, "b": 641.13692, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "(1)", "bbox": {"l": 362.11209, "t": 632.23036, "r": 374.66617, "b": 641.13692, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "finding the location of the table(s) on a", "bbox": {"l": 377.35785, "t": 632.23036, "r": 545.11505, "b": 641.13692, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "document-page and (2) finding the structure of a given table", "bbox": {"l": 308.862, "t": 644.18536, "r": 545.11517, "b": 653.09192, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "in the document.", "bbox": {"l": 308.862, "t": 656.14037, "r": 375.55167, "b": 665.04693, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Recently, significant progress has been made with vision based approaches to extract tables in documents. For the sake of completeness, the issue of table extraction from documents is typically decomposed into two separate challenges, i.e. (1) finding the location of the table(s) on a document-page and (2) finding the structure of a given table in the document."}, {"label": "text", "id": 3, "page_no": 0, "cluster": {"id": 3, "label": "text", "bbox": {"l": 308.862, "t": 668.38036, "r": 545.11511, "b": 713.151932, "coord_origin": "TOPLEFT"}, "confidence": 0.979152262210846, "cells": [{"id": 120, "text": "The first problem is called table-location and has been", "bbox": {"l": 320.81699, "t": 668.38036, "r": 545.11493, "b": 677.28693, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "previously addressed [30, 38, 19, 21, 23, 26, 8] with state-", "bbox": {"l": 308.862, "t": 680.33536, "r": 545.11511, "b": 689.24193, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "of-the-art object-detection networks (e.g. YOLO and later", "bbox": {"l": 308.862, "t": 692.290359, "r": 545.11511, "b": 701.19693, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "on Mask-RCNN [9]). For all practical purposes, it can be", "bbox": {"l": 308.862, "t": 704.245361, "r": 545.11499, "b": 713.151932, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The first problem is called table-location and has been previously addressed [30, 38, 19, 21, 23, 26, 8] with stateof-the-art object-detection networks (e.g. YOLO and later on Mask-RCNN [9]). For all practical purposes, it can be"}, {"label": "page_footer", "id": 12, "page_no": 0, "cluster": {"id": 12, "label": "page_footer", "bbox": {"l": 295.121, "t": 734.133366, "r": 300.10229, "b": 743.039928, "coord_origin": "TOPLEFT"}, "confidence": 0.8045893311500549, "cells": [{"id": 124, "text": "1", "bbox": {"l": 295.121, "t": 734.133366, "r": 300.10229, "b": 743.039928, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1"}, {"label": "page_header", "id": 9, "page_no": 0, "cluster": {"id": 9, "label": "page_header", "bbox": {"l": 18.340221, "t": 207.82001000000002, "r": 36.339779, "b": 560.00003, "coord_origin": "TOPLEFT"}, "confidence": 0.8773143887519836, "cells": [{"id": 125, "text": "arXiv:2203.01017v2 [cs.CV] 11 Mar 2022", "bbox": {"l": 18.340221, "t": 207.82001000000002, "r": 36.339779, "b": 560.00003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "arXiv:2203.01017v2 [cs.CV] 11 Mar 2022"}], "body": [{"label": "section_header", "id": 8, "page_no": 0, "cluster": {"id": 8, "label": "section_header", "bbox": {"l": 96.301003, "t": 107.03412000000003, "r": 498.92708999999996, "b": 119.93133999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.8868067860603333, "cells": [{"id": 0, "text": "TableFormer: Table Structure Understanding with Transformers.", "bbox": {"l": 96.301003, "t": 107.03412000000003, "r": 498.92708999999996, "b": 119.93133999999998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "TableFormer: Table Structure Understanding with Transformers."}, {"label": "section_header", "id": 13, "page_no": 0, "cluster": {"id": 13, "label": "section_header", "bbox": {"l": 142.47701, "t": 146.68535999999995, "r": 452.75027, "b": 171.32037000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.7586215734481812, "cells": [{"id": 1, "text": "Ahmed Nassar, Nikolaos Livathinos, Maksym Lysak, Peter Staar", "bbox": {"l": 142.47701, "t": 146.68535999999995, "r": 452.75027, "b": 157.37334999999996, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "IBM Research", "bbox": {"l": 262.918, "t": 160.63239, "r": 332.30597, "b": 171.32037000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Ahmed Nassar, Nikolaos Livathinos, Maksym Lysak, Peter Staar IBM Research"}, {"label": "key_value_region", "id": 25, "page_no": 0, "cluster": {"id": 25, "label": "key_value_region", "bbox": {"l": 208.123, "t": 175.96123999999998, "r": 378.73257, "b": 184.42553999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.4854728579521179, "cells": [{"id": 3, "text": "{", "bbox": {"l": 208.123, "t": 175.96123999999998, "r": 212.73083, "b": 184.42553999999996, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "ahn,nli,mly,taa", "bbox": {"l": 212.73, "t": 177.08203000000003, "r": 293.42761, "b": 184.00409000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "}", "bbox": {"l": 293.42798, "t": 175.96123999999998, "r": 298.0358, "b": 184.42553999999996, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "@zurich.ibm.com", "bbox": {"l": 298.03497, "t": 177.08203000000003, "r": 378.73257, "b": 184.00409000000002, "coord_origin": "TOPLEFT"}}], "children": [{"id": 7, "label": "text", "bbox": {"l": 208.123, "t": 175.96123999999998, "r": 378.73257, "b": 184.42553999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9096331596374512, "cells": [{"id": 3, "text": "{", "bbox": {"l": 208.123, "t": 175.96123999999998, "r": 212.73083, "b": 184.42553999999996, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "ahn,nli,mly,taa", "bbox": {"l": 212.73, "t": 177.08203000000003, "r": 293.42761, "b": 184.00409000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "}", "bbox": {"l": 293.42798, "t": 175.96123999999998, "r": 298.0358, "b": 184.42553999999996, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "@zurich.ibm.com", "bbox": {"l": 298.03497, "t": 177.08203000000003, "r": 378.73257, "b": 184.00409000000002, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null}, {"label": "section_header", "id": 5, "page_no": 0, "cluster": {"id": 5, "label": "section_header", "bbox": {"l": 145.99498, "t": 215.48297000000002, "r": 190.48029, "b": 226.23071000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9258671402931213, "cells": [{"id": 7, "text": "Abstract", "bbox": {"l": 145.99498, "t": 215.48297000000002, "r": 190.48029, "b": 226.23071000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Abstract"}, {"label": "text", "id": 2, "page_no": 0, "cluster": {"id": 2, "label": "text", "bbox": {"l": 50.111977, "t": 241.39508, "r": 286.36511, "b": 512.9966400000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9838882088661194, "cells": [{"id": 8, "text": "Tables organize valuable content in a concise and com-", "bbox": {"l": 62.066978, "t": 241.39508, "r": 286.36493, "b": 249.98284999999998, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "pact representation. This content is extremely valuable for", "bbox": {"l": 50.111977, "t": 253.3501, "r": 286.36508, "b": 261.93787, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "systems such as search engines, Knowledge Graph\u2019s, etc,", "bbox": {"l": 50.111977, "t": 265.30511, "r": 286.36508, "b": 273.89288, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "since they enhance their predictive capabilities. Unfortu-", "bbox": {"l": 50.111977, "t": 277.26111000000003, "r": 286.36505, "b": 285.84888, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "nately, tables come in a large variety of shapes and sizes.", "bbox": {"l": 50.111977, "t": 289.21609, "r": 286.36505, "b": 297.80386, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Furthermore, they can have complex column/row-header", "bbox": {"l": 50.111977, "t": 301.17108, "r": 286.36505, "b": 309.75884999999994, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "configurations, multiline rows, different variety of separa-", "bbox": {"l": 50.111977, "t": 313.12607, "r": 286.36508, "b": 321.71384, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "tion lines, missing entries, etc. As such, the correct iden-", "bbox": {"l": 50.111977, "t": 325.08105, "r": 286.36508, "b": 333.66882, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "tification of the table-structure from an image is a non-", "bbox": {"l": 50.111977, "t": 337.03604, "r": 286.36505, "b": 345.62381, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "trivial task. In this paper, we present a new table-structure", "bbox": {"l": 50.111977, "t": 348.99203, "r": 286.36508, "b": 357.5798, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "identification model. The latter improves the latest end-to-", "bbox": {"l": 50.111977, "t": 360.94701999999995, "r": 286.36505, "b": 369.53479, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "end deep learning model (i.e. encoder-dual-decoder from", "bbox": {"l": 50.111977, "t": 372.90201, "r": 286.36508, "b": 381.48978, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "PubTabNet) in two significant ways. First, we introduce a", "bbox": {"l": 50.111977, "t": 384.85699, "r": 286.36505, "b": 393.44476, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "new object detection decoder for table-cells. In this way,", "bbox": {"l": 50.111977, "t": 396.81198, "r": 286.36511, "b": 405.39975000000004, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "we can obtain the content of the table-cells from program-", "bbox": {"l": 50.111977, "t": 408.76697, "r": 286.36508, "b": 417.35474, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "matic PDF\u2019s directly from the PDF source and avoid the", "bbox": {"l": 50.111977, "t": 420.72296000000006, "r": 286.36505, "b": 429.31073, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "training of the custom OCR decoders.", "bbox": {"l": 50.111977, "t": 432.67795, "r": 207.23216, "b": 441.26572, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "This architectural", "bbox": {"l": 214.09639, "t": 432.67795, "r": 286.36508, "b": 441.26572, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "change leads to more accurate table-content extraction and", "bbox": {"l": 50.111977, "t": 444.63293, "r": 286.36508, "b": 453.2207, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "allows us to tackle non-english tables. Second, we replace", "bbox": {"l": 50.111977, "t": 456.58792000000005, "r": 286.36505, "b": 465.17569, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "the LSTM decoders with transformer based decoders. This", "bbox": {"l": 50.111977, "t": 468.54291, "r": 286.36505, "b": 477.13068, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "upgrade improves significantly the previous state-of-the-art", "bbox": {"l": 50.111977, "t": 480.4989, "r": 286.36508, "b": 489.08667, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "tree-editing-distance-score (TEDS) from 91% to 98.5% on", "bbox": {"l": 50.111977, "t": 492.45389, "r": 286.36505, "b": 501.04166, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "simple tables and from 88.7% to 95% on complex tables.", "bbox": {"l": 50.111977, "t": 504.40887, "r": 276.65152, "b": 512.9966400000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Tables organize valuable content in a concise and compact representation. This content is extremely valuable for systems such as search engines, Knowledge Graph\u2019s, etc, since they enhance their predictive capabilities. Unfortunately, tables come in a large variety of shapes and sizes. Furthermore, they can have complex column/row-header configurations, multiline rows, different variety of separation lines, missing entries, etc. As such, the correct identification of the table-structure from an image is a nontrivial task. In this paper, we present a new table-structure identification model. The latter improves the latest end-toend deep learning model (i.e. encoder-dual-decoder from PubTabNet) in two significant ways. First, we introduce a new object detection decoder for table-cells. In this way, we can obtain the content of the table-cells from programmatic PDF\u2019s directly from the PDF source and avoid the training of the custom OCR decoders. This architectural change leads to more accurate table-content extraction and allows us to tackle non-english tables. Second, we replace the LSTM decoders with transformer based decoders. This upgrade improves significantly the previous state-of-the-art tree-editing-distance-score (TEDS) from 91% to 98.5% on simple tables and from 88.7% to 95% on complex tables."}, {"label": "section_header", "id": 4, "page_no": 0, "cluster": {"id": 4, "label": "section_header", "bbox": {"l": 50.111977, "t": 539.94276, "r": 126.94804, "b": 550.69049, "coord_origin": "TOPLEFT"}, "confidence": 0.9317677617073059, "cells": [{"id": 32, "text": "1.", "bbox": {"l": 50.111977, "t": 539.94276, "r": 58.121296, "b": 550.69049, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "Introduction", "bbox": {"l": 68.800385, "t": 539.94276, "r": 126.94804, "b": 550.69049, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1. Introduction"}, {"label": "text", "id": 1, "page_no": 0, "cluster": {"id": 1, "label": "text", "bbox": {"l": 50.111977, "t": 560.7832, "r": 286.36508, "b": 713.151779, "coord_origin": "TOPLEFT"}, "confidence": 0.9841895699501038, "cells": [{"id": 34, "text": "The occurrence of tables in documents is ubiquitous.", "bbox": {"l": 62.066978, "t": 560.7832, "r": 286.36496, "b": 569.68976, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "They often summarise quantitative or factual data, which is", "bbox": {"l": 50.111977, "t": 572.7382, "r": 286.36508, "b": 581.64476, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "cumbersome to describe in verbose text but nevertheless ex-", "bbox": {"l": 50.111977, "t": 584.69321, "r": 286.36505, "b": 593.5997600000001, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "tremely valuable. Unfortunately, this compact representa-", "bbox": {"l": 50.111977, "t": 596.6492000000001, "r": 286.36505, "b": 605.55576, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "tion is often not easy to parse by machines. There are many", "bbox": {"l": 50.111977, "t": 608.6042, "r": 286.36505, "b": 617.51076, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "implicit conventions used to obtain a compact table repre-", "bbox": {"l": 50.111977, "t": 620.5592, "r": 286.36505, "b": 629.46576, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "sentation. For example, tables often have complex column-", "bbox": {"l": 50.111977, "t": 632.51421, "r": 286.36508, "b": 641.42076, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "and row-headers in order to reduce duplicated cell content.", "bbox": {"l": 50.111977, "t": 644.46921, "r": 286.36508, "b": 653.37576, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "Lines of different shapes and sizes are leveraged to separate", "bbox": {"l": 50.111977, "t": 656.42421, "r": 286.36502, "b": 665.33077, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "content or indicate a tree structure. Additionally, tables can", "bbox": {"l": 50.111977, "t": 668.3802000000001, "r": 286.36505, "b": 677.28677, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "also have empty/missing table-entries or multi-row textual", "bbox": {"l": 50.111977, "t": 680.33521, "r": 286.36505, "b": 689.2417800000001, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "table-entries. Fig. 1 shows a table which presents all these", "bbox": {"l": 50.111977, "t": 692.290207, "r": 286.36505, "b": 701.196777, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "issues.", "bbox": {"l": 50.111977, "t": 704.245209, "r": 76.403275, "b": 713.151779, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The occurrence of tables in documents is ubiquitous. They often summarise quantitative or factual data, which is cumbersome to describe in verbose text but nevertheless extremely valuable. Unfortunately, this compact representation is often not easy to parse by machines. There are many implicit conventions used to obtain a compact table representation. For example, tables often have complex columnand row-headers in order to reduce duplicated cell content. Lines of different shapes and sizes are leveraged to separate content or indicate a tree structure. Additionally, tables can also have empty/missing table-entries or multi-row textual table-entries. Fig. 1 shows a table which presents all these issues."}, {"label": "section_header", "id": 14, "page_no": 0, "cluster": {"id": 14, "label": "section_header", "bbox": {"l": 315.56702, "t": 218.00684, "r": 408.4407, "b": 226.75482, "coord_origin": "TOPLEFT"}, "confidence": 0.6724023818969727, "cells": [{"id": 47, "text": "a.", "bbox": {"l": 315.56702, "t": 218.00684, "r": 324.01007, "b": 226.75482, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Picture of a table:", "bbox": {"l": 328.2316, "t": 218.00684, "r": 408.4407, "b": 226.75482, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "a. Picture of a table:"}, {"label": "list_item", "id": 17, "page_no": 0, "cluster": {"id": 17, "label": "list_item", "bbox": {"l": 315.56702, "t": 313.69478999999995, "r": 486.40194999999994, "b": 333.2428, "coord_origin": "TOPLEFT"}, "confidence": 0.5549328923225403, "cells": [{"id": 49, "text": "b.", "bbox": {"l": 315.56702, "t": 313.69478999999995, "r": 325.05786, "b": 322.44281, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Red-annotation of bounding boxes,", "bbox": {"l": 329.80325, "t": 313.69478999999995, "r": 486.40194999999994, "b": 322.44281, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Blue-predictions by TableFormer", "bbox": {"l": 326.46252, "t": 324.49478, "r": 472.47411999999997, "b": 333.2428, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "b. Red-annotation of bounding boxes, Blue-predictions by TableFormer"}, {"label": "list_item", "id": 18, "page_no": 0, "cluster": {"id": 18, "label": "list_item", "bbox": {"l": 315.56702, "t": 420.1828, "r": 491.1912500000001, "b": 428.93082, "coord_origin": "TOPLEFT"}, "confidence": 0.5501358509063721, "cells": [{"id": 52, "text": "c.", "bbox": {"l": 315.56702, "t": 420.1828, "r": 324.81039, "b": 428.93082, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Structure predicted by TableFormer:", "bbox": {"l": 329.4321, "t": 420.1828, "r": 491.1912500000001, "b": 428.93082, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "c. Structure predicted by TableFormer:"}, {"label": "picture", "id": 10, "page_no": 0, "cluster": {"id": 10, "label": "picture", "bbox": {"l": 314.78173828125, "t": 338.0652770996094, "r": 539.1802978515625, "b": 410.0494384765625, "coord_origin": "TOPLEFT"}, "confidence": 0.8742761611938477, "cells": [{"id": 54, "text": "1", "bbox": {"l": 408.14752, "t": 342.82828, "r": 412.54001, "b": 351.61322, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "0", "bbox": {"l": 356.11011, "t": 341.57217, "r": 360.50259, "b": 350.35712, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "2", "bbox": {"l": 500.6777, "t": 340.93768, "r": 505.0701900000001, "b": 349.7226299999999, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "3", "bbox": {"l": 356.13382, "t": 351.74789, "r": 360.52631, "b": 360.53284, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "4", "bbox": {"l": 402.53992, "t": 355.8765, "r": 406.9324, "b": 364.66144, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "5", "bbox": {"l": 448.58178999999996, "t": 352.84018, "r": 452.97427, "b": 361.62512, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "6", "bbox": {"l": 491.65161000000006, "t": 353.70657, "r": 496.0441, "b": 362.49152, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "7", "bbox": {"l": 535.13843, "t": 353.33969, "r": 539.53088, "b": 362.12463, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "8", "bbox": {"l": 348.82822, "t": 387.09781, "r": 353.2207, "b": 395.88275, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "9", "bbox": {"l": 389.27151, "t": 375.37228, "r": 393.664, "b": 384.15723, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "10", "bbox": {"l": 442.67479999999995, "t": 375.64621, "r": 451.45889000000005, "b": 384.43115, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "11", "bbox": {"l": 477.4382299999999, "t": 375.534, "r": 485.90167, "b": 384.31894000000005, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "12", "bbox": {"l": 522.57263, "t": 375.64621, "r": 531.35669, "b": 384.43115, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "13", "bbox": {"l": 400.22992, "t": 387.11429, "r": 409.01401, "b": 395.89923, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "14", "bbox": {"l": 442.30792, "t": 386.98981000000003, "r": 451.0920100000001, "b": 395.77475000000004, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "15", "bbox": {"l": 478.21941999999996, "t": 387.37469, "r": 487.00351000000006, "b": 396.15964, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "16", "bbox": {"l": 523.2287, "t": 386.98981000000003, "r": 532.01276, "b": 395.77475000000004, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "1", "bbox": {"l": 411.57233, "t": 399.42477, "r": 415.96481, "b": 408.20972, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "7", "bbox": {"l": 415.96393, "t": 399.42477, "r": 420.35641, "b": 408.20972, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "18", "bbox": {"l": 442.30521, "t": 399.0371999999999, "r": 451.08929, "b": 407.82213999999993, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "19", "bbox": {"l": 478.77893, "t": 398.99639999999994, "r": 487.56302, "b": 407.78133999999994, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "20", "bbox": {"l": 523.97241, "t": 398.6114799999999, "r": 532.75647, "b": 407.39642, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "3", "bbox": {"l": 385.09399, "t": 357.76030999999995, "r": 391.09879, "b": 367.89072, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "2", "bbox": {"l": 333.43451, "t": 380.7265, "r": 339.4393, "b": 390.85689999999994, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "1", "bbox": {"l": 478.07210999999995, "t": 341.0368000000001, "r": 484.0769, "b": 351.16720999999995, "coord_origin": "TOPLEFT"}}], "children": [{"id": 19, "label": "text", "bbox": {"l": 408.14752, "t": 342.82828, "r": 412.54001, "b": 351.61322, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "1", "bbox": {"l": 408.14752, "t": 342.82828, "r": 412.54001, "b": 351.61322, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 356.11011, "t": 341.57217, "r": 360.50259, "b": 350.35712, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "0", "bbox": {"l": 356.11011, "t": 341.57217, "r": 360.50259, "b": 350.35712, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 500.6777, "t": 340.93768, "r": 505.0701900000001, "b": 349.7226299999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "2", "bbox": {"l": 500.6777, "t": 340.93768, "r": 505.0701900000001, "b": 349.7226299999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 356.13382, "t": 351.74789, "r": 360.52631, "b": 360.53284, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "3", "bbox": {"l": 356.13382, "t": 351.74789, "r": 360.52631, "b": 360.53284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 402.53992, "t": 355.8765, "r": 406.9324, "b": 364.66144, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "4", "bbox": {"l": 402.53992, "t": 355.8765, "r": 406.9324, "b": 364.66144, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 448.58178999999996, "t": 352.84018, "r": 452.97427, "b": 361.62512, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "5", "bbox": {"l": 448.58178999999996, "t": 352.84018, "r": 452.97427, "b": 361.62512, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 491.65161000000006, "t": 353.70657, "r": 496.0441, "b": 362.49152, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "6", "bbox": {"l": 491.65161000000006, "t": 353.70657, "r": 496.0441, "b": 362.49152, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 535.13843, "t": 353.33969, "r": 539.53088, "b": 362.12463, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "7", "bbox": {"l": 535.13843, "t": 353.33969, "r": 539.53088, "b": 362.12463, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 348.82822, "t": 387.09781, "r": 353.2207, "b": 395.88275, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "8", "bbox": {"l": 348.82822, "t": 387.09781, "r": 353.2207, "b": 395.88275, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 389.27151, "t": 375.37228, "r": 393.664, "b": 384.15723, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "9", "bbox": {"l": 389.27151, "t": 375.37228, "r": 393.664, "b": 384.15723, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 442.67479999999995, "t": 375.64621, "r": 451.45889000000005, "b": 384.43115, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "10", "bbox": {"l": 442.67479999999995, "t": 375.64621, "r": 451.45889000000005, "b": 384.43115, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 477.4382299999999, "t": 375.534, "r": 485.90167, "b": 384.31894000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "11", "bbox": {"l": 477.4382299999999, "t": 375.534, "r": 485.90167, "b": 384.31894000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 522.57263, "t": 375.64621, "r": 531.35669, "b": 384.43115, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "12", "bbox": {"l": 522.57263, "t": 375.64621, "r": 531.35669, "b": 384.43115, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 400.22992, "t": 387.11429, "r": 409.01401, "b": 395.89923, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "13", "bbox": {"l": 400.22992, "t": 387.11429, "r": 409.01401, "b": 395.89923, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 442.30792, "t": 386.98981000000003, "r": 451.0920100000001, "b": 395.77475000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "14", "bbox": {"l": 442.30792, "t": 386.98981000000003, "r": 451.0920100000001, "b": 395.77475000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 478.21941999999996, "t": 387.37469, "r": 487.00351000000006, "b": 396.15964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "15", "bbox": {"l": 478.21941999999996, "t": 387.37469, "r": 487.00351000000006, "b": 396.15964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 523.2287, "t": 386.98981000000003, "r": 532.01276, "b": 395.77475000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "16", "bbox": {"l": 523.2287, "t": 386.98981000000003, "r": 532.01276, "b": 395.77475000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 411.57233, "t": 399.42477, "r": 415.96481, "b": 408.20972, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "1", "bbox": {"l": 411.57233, "t": 399.42477, "r": 415.96481, "b": 408.20972, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 415.96393, "t": 399.42477, "r": 420.35641, "b": 408.20972, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "7", "bbox": {"l": 415.96393, "t": 399.42477, "r": 420.35641, "b": 408.20972, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 442.30521, "t": 399.0371999999999, "r": 451.08929, "b": 407.82213999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "18", "bbox": {"l": 442.30521, "t": 399.0371999999999, "r": 451.08929, "b": 407.82213999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 478.77893, "t": 398.99639999999994, "r": 487.56302, "b": 407.78133999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "19", "bbox": {"l": 478.77893, "t": 398.99639999999994, "r": 487.56302, "b": 407.78133999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 523.97241, "t": 398.6114799999999, "r": 532.75647, "b": 407.39642, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "20", "bbox": {"l": 523.97241, "t": 398.6114799999999, "r": 532.75647, "b": 407.39642, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 385.09399, "t": 357.76030999999995, "r": 391.09879, "b": 367.89072, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "3", "bbox": {"l": 385.09399, "t": 357.76030999999995, "r": 391.09879, "b": 367.89072, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 333.43451, "t": 380.7265, "r": 339.4393, "b": 390.85689999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "2", "bbox": {"l": 333.43451, "t": 380.7265, "r": 339.4393, "b": 390.85689999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 478.07210999999995, "t": 341.0368000000001, "r": 484.0769, "b": 351.16720999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": "1", "bbox": {"l": 478.07210999999995, "t": 341.0368000000001, "r": 484.0769, "b": 351.16720999999995, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "picture", "id": 23, "page_no": 0, "cluster": {"id": 23, "label": "picture", "bbox": {"l": 315.7172546386719, "t": 433.823486328125, "r": 536.835693359375, "b": 496.0290222167969, "coord_origin": "TOPLEFT"}, "confidence": 0.5088632702827454, "cells": [{"id": 76, "text": "1", "bbox": {"l": 347.24872, "t": 437.68588, "r": 351.6412, "b": 446.47083, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "0", "bbox": {"l": 318.88071, "t": 437.68588, "r": 323.27319, "b": 446.47083, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "2", "bbox": {"l": 394.10422, "t": 437.68588, "r": 398.4967, "b": 446.47083, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "3", "bbox": {"l": 318.77316, "t": 449.5455, "r": 323.16565, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "4", "bbox": {"l": 347.24872, "t": 449.5455, "r": 351.6412, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "5", "bbox": {"l": 394.10422, "t": 449.5455, "r": 398.4967, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "6", "bbox": {"l": 440.95941000000005, "t": 449.5455, "r": 445.3519, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "7", "bbox": {"l": 487.81491, "t": 449.5455, "r": 492.2074, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "8", "bbox": {"l": 318.77316, "t": 473.70425, "r": 323.16565, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "9", "bbox": {"l": 347.24872, "t": 461.8446, "r": 351.6412, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "10", "bbox": {"l": 394.10422, "t": 461.8446, "r": 402.88831, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "11", "bbox": {"l": 440.95941000000005, "t": 461.8446, "r": 449.42285, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "12", "bbox": {"l": 487.81491, "t": 461.8446, "r": 496.599, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "13", "bbox": {"l": 347.24872, "t": 473.70425, "r": 356.03281, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "14", "bbox": {"l": 394.10422, "t": 473.70425, "r": 402.88831, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "15", "bbox": {"l": 440.95941000000005, "t": 473.70425, "r": 449.7435, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "16", "bbox": {"l": 487.81491, "t": 473.70425, "r": 496.599, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "17", "bbox": {"l": 347.24872, "t": 485.12469, "r": 356.03281, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "18", "bbox": {"l": 394.10422, "t": 485.12469, "r": 402.88831, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "19", "bbox": {"l": 440.95941000000005, "t": 485.12469, "r": 449.7435, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "20", "bbox": {"l": 487.81491, "t": 485.12469, "r": 496.599, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "3", "bbox": {"l": 366.70102, "t": 449.12082, "r": 372.70581, "b": 459.25122, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "2", "bbox": {"l": 331.90424, "t": 473.32291, "r": 337.90903, "b": 483.45331, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "1", "bbox": {"l": 459.87621999999993, "t": 437.5936, "r": 465.88101, "b": 447.724, "coord_origin": "TOPLEFT"}}], "children": [{"id": 41, "label": "text", "bbox": {"l": 347.24872, "t": 437.68588, "r": 351.6412, "b": 446.47083, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "1", "bbox": {"l": 347.24872, "t": 437.68588, "r": 351.6412, "b": 446.47083, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 318.88071, "t": 437.68588, "r": 323.27319, "b": 446.47083, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "0", "bbox": {"l": 318.88071, "t": 437.68588, "r": 323.27319, "b": 446.47083, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 394.10422, "t": 437.68588, "r": 398.4967, "b": 446.47083, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "2", "bbox": {"l": 394.10422, "t": 437.68588, "r": 398.4967, "b": 446.47083, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 318.77316, "t": 449.5455, "r": 323.16565, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "3", "bbox": {"l": 318.77316, "t": 449.5455, "r": 323.16565, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 347.24872, "t": 449.5455, "r": 351.6412, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "4", "bbox": {"l": 347.24872, "t": 449.5455, "r": 351.6412, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 394.10422, "t": 449.5455, "r": 398.4967, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "5", "bbox": {"l": 394.10422, "t": 449.5455, "r": 398.4967, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 440.95941000000005, "t": 449.5455, "r": 445.3519, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "6", "bbox": {"l": 440.95941000000005, "t": 449.5455, "r": 445.3519, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 487.81491, "t": 449.5455, "r": 492.2074, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "7", "bbox": {"l": 487.81491, "t": 449.5455, "r": 492.2074, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 318.77316, "t": 473.70425, "r": 323.16565, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "8", "bbox": {"l": 318.77316, "t": 473.70425, "r": 323.16565, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 347.24872, "t": 461.8446, "r": 351.6412, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "9", "bbox": {"l": 347.24872, "t": 461.8446, "r": 351.6412, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 394.10422, "t": 461.8446, "r": 402.88831, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "10", "bbox": {"l": 394.10422, "t": 461.8446, "r": 402.88831, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 440.95941000000005, "t": 461.8446, "r": 449.42285, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "11", "bbox": {"l": 440.95941000000005, "t": 461.8446, "r": 449.42285, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 487.81491, "t": 461.8446, "r": 496.599, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "12", "bbox": {"l": 487.81491, "t": 461.8446, "r": 496.599, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 347.24872, "t": 473.70425, "r": 356.03281, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "13", "bbox": {"l": 347.24872, "t": 473.70425, "r": 356.03281, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 394.10422, "t": 473.70425, "r": 402.88831, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "14", "bbox": {"l": 394.10422, "t": 473.70425, "r": 402.88831, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 440.95941000000005, "t": 473.70425, "r": 449.7435, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "15", "bbox": {"l": 440.95941000000005, "t": 473.70425, "r": 449.7435, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 487.81491, "t": 473.70425, "r": 496.599, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "16", "bbox": {"l": 487.81491, "t": 473.70425, "r": 496.599, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 347.24872, "t": 485.12469, "r": 356.03281, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "17", "bbox": {"l": 347.24872, "t": 485.12469, "r": 356.03281, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 394.10422, "t": 485.12469, "r": 402.88831, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "18", "bbox": {"l": 394.10422, "t": 485.12469, "r": 402.88831, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 440.95941000000005, "t": 485.12469, "r": 449.7435, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "19", "bbox": {"l": 440.95941000000005, "t": 485.12469, "r": 449.7435, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 487.81491, "t": 485.12469, "r": 496.599, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "20", "bbox": {"l": 487.81491, "t": 485.12469, "r": 496.599, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 366.70102, "t": 449.12082, "r": 372.70581, "b": 459.25122, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "3", "bbox": {"l": 366.70102, "t": 449.12082, "r": 372.70581, "b": 459.25122, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 331.90424, "t": 473.32291, "r": 337.90903, "b": 483.45331, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "2", "bbox": {"l": 331.90424, "t": 473.32291, "r": 337.90903, "b": 483.45331, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 459.87621999999993, "t": 437.5936, "r": 465.88101, "b": 447.724, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "1", "bbox": {"l": 459.87621999999993, "t": 437.5936, "r": 465.88101, "b": 447.724, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "table", "id": 11, "page_no": 0, "cluster": {"id": 11, "label": "table", "bbox": {"l": 315.7172546386719, "t": 433.823486328125, "r": 536.835693359375, "b": 496.0290222167969, "coord_origin": "TOPLEFT"}, "confidence": 0.8056110739707947, "cells": [{"id": 76, "text": "1", "bbox": {"l": 347.24872, "t": 437.68588, "r": 351.6412, "b": 446.47083, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "0", "bbox": {"l": 318.88071, "t": 437.68588, "r": 323.27319, "b": 446.47083, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "2", "bbox": {"l": 394.10422, "t": 437.68588, "r": 398.4967, "b": 446.47083, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "3", "bbox": {"l": 318.77316, "t": 449.5455, "r": 323.16565, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "4", "bbox": {"l": 347.24872, "t": 449.5455, "r": 351.6412, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "5", "bbox": {"l": 394.10422, "t": 449.5455, "r": 398.4967, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "6", "bbox": {"l": 440.95941000000005, "t": 449.5455, "r": 445.3519, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "7", "bbox": {"l": 487.81491, "t": 449.5455, "r": 492.2074, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "8", "bbox": {"l": 318.77316, "t": 473.70425, "r": 323.16565, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "9", "bbox": {"l": 347.24872, "t": 461.8446, "r": 351.6412, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "10", "bbox": {"l": 394.10422, "t": 461.8446, "r": 402.88831, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "11", "bbox": {"l": 440.95941000000005, "t": 461.8446, "r": 449.42285, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "12", "bbox": {"l": 487.81491, "t": 461.8446, "r": 496.599, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "13", "bbox": {"l": 347.24872, "t": 473.70425, "r": 356.03281, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "14", "bbox": {"l": 394.10422, "t": 473.70425, "r": 402.88831, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "15", "bbox": {"l": 440.95941000000005, "t": 473.70425, "r": 449.7435, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "16", "bbox": {"l": 487.81491, "t": 473.70425, "r": 496.599, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "17", "bbox": {"l": 347.24872, "t": 485.12469, "r": 356.03281, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "18", "bbox": {"l": 394.10422, "t": 485.12469, "r": 402.88831, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "19", "bbox": {"l": 440.95941000000005, "t": 485.12469, "r": 449.7435, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "20", "bbox": {"l": 487.81491, "t": 485.12469, "r": 496.599, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "3", "bbox": {"l": 366.70102, "t": 449.12082, "r": 372.70581, "b": 459.25122, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "2", "bbox": {"l": 331.90424, "t": 473.32291, "r": 337.90903, "b": 483.45331, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "1", "bbox": {"l": 459.87621999999993, "t": 437.5936, "r": 465.88101, "b": 447.724, "coord_origin": "TOPLEFT"}}], "children": [{"id": 41, "label": "text", "bbox": {"l": 347.24872, "t": 437.68588, "r": 351.6412, "b": 446.47083, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "1", "bbox": {"l": 347.24872, "t": 437.68588, "r": 351.6412, "b": 446.47083, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 318.88071, "t": 437.68588, "r": 323.27319, "b": 446.47083, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "0", "bbox": {"l": 318.88071, "t": 437.68588, "r": 323.27319, "b": 446.47083, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 394.10422, "t": 437.68588, "r": 398.4967, "b": 446.47083, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "2", "bbox": {"l": 394.10422, "t": 437.68588, "r": 398.4967, "b": 446.47083, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 318.77316, "t": 449.5455, "r": 323.16565, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "3", "bbox": {"l": 318.77316, "t": 449.5455, "r": 323.16565, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 347.24872, "t": 449.5455, "r": 351.6412, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "4", "bbox": {"l": 347.24872, "t": 449.5455, "r": 351.6412, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 394.10422, "t": 449.5455, "r": 398.4967, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "5", "bbox": {"l": 394.10422, "t": 449.5455, "r": 398.4967, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 440.95941000000005, "t": 449.5455, "r": 445.3519, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "6", "bbox": {"l": 440.95941000000005, "t": 449.5455, "r": 445.3519, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 487.81491, "t": 449.5455, "r": 492.2074, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "7", "bbox": {"l": 487.81491, "t": 449.5455, "r": 492.2074, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 318.77316, "t": 473.70425, "r": 323.16565, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "8", "bbox": {"l": 318.77316, "t": 473.70425, "r": 323.16565, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 347.24872, "t": 461.8446, "r": 351.6412, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "9", "bbox": {"l": 347.24872, "t": 461.8446, "r": 351.6412, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 394.10422, "t": 461.8446, "r": 402.88831, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "10", "bbox": {"l": 394.10422, "t": 461.8446, "r": 402.88831, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 440.95941000000005, "t": 461.8446, "r": 449.42285, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "11", "bbox": {"l": 440.95941000000005, "t": 461.8446, "r": 449.42285, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 487.81491, "t": 461.8446, "r": 496.599, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "12", "bbox": {"l": 487.81491, "t": 461.8446, "r": 496.599, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 347.24872, "t": 473.70425, "r": 356.03281, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "13", "bbox": {"l": 347.24872, "t": 473.70425, "r": 356.03281, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 394.10422, "t": 473.70425, "r": 402.88831, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "14", "bbox": {"l": 394.10422, "t": 473.70425, "r": 402.88831, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 440.95941000000005, "t": 473.70425, "r": 449.7435, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "15", "bbox": {"l": 440.95941000000005, "t": 473.70425, "r": 449.7435, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 487.81491, "t": 473.70425, "r": 496.599, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "16", "bbox": {"l": 487.81491, "t": 473.70425, "r": 496.599, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 347.24872, "t": 485.12469, "r": 356.03281, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "17", "bbox": {"l": 347.24872, "t": 485.12469, "r": 356.03281, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 394.10422, "t": 485.12469, "r": 402.88831, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "18", "bbox": {"l": 394.10422, "t": 485.12469, "r": 402.88831, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 440.95941000000005, "t": 485.12469, "r": 449.7435, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "19", "bbox": {"l": 440.95941000000005, "t": 485.12469, "r": 449.7435, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 487.81491, "t": 485.12469, "r": 496.599, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "20", "bbox": {"l": 487.81491, "t": 485.12469, "r": 496.599, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 366.70102, "t": 449.12082, "r": 372.70581, "b": 459.25122, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "3", "bbox": {"l": 366.70102, "t": 449.12082, "r": 372.70581, "b": 459.25122, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 331.90424, "t": 473.32291, "r": 337.90903, "b": 483.45331, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "2", "bbox": {"l": 331.90424, "t": 473.32291, "r": 337.90903, "b": 483.45331, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 459.87621999999993, "t": 437.5936, "r": 465.88101, "b": 447.724, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "1", "bbox": {"l": 459.87621999999993, "t": 437.5936, "r": 465.88101, "b": 447.724, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "lcel", "ched", "lcel", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "ucel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "ucel", "nl"], "num_rows": 5, "num_cols": 6, "table_cells": [{"bbox": {"l": 347.24872, "t": 437.68588, "r": 351.6412, "b": 446.47083, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 3, "text": "1", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 318.88071, "t": 437.68588, "r": 323.27319, "b": 446.47083, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "0", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 394.10422, "t": 437.5936, "r": 465.88101, "b": 447.724, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 5, "text": "2 1", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 318.77316, "t": 449.5455, "r": 323.16565, "b": 458.33044, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 347.24872, "t": 449.5455, "r": 351.6412, "b": 458.33044, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 366.70102, "t": 449.12082, "r": 398.4967, "b": 459.25122, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "5 3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.95941000000005, "t": 449.5455, "r": 445.3519, "b": 458.33044, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.81491, "t": 449.5455, "r": 492.2074, "b": 458.33044, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 318.77316, "t": 473.70425, "r": 323.16565, "b": 482.4892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 347.24872, "t": 461.8446, "r": 351.6412, "b": 470.62955, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.10422, "t": 461.8446, "r": 402.88831, "b": 470.62955, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "10", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.95941000000005, "t": 461.8446, "r": 449.42285, "b": 470.62955, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "11", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.81491, "t": 461.8446, "r": 496.599, "b": 470.62955, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "12", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 347.24872, "t": 473.70425, "r": 356.03281, "b": 482.4892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "13", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.10422, "t": 473.70425, "r": 402.88831, "b": 482.4892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "14", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.95941000000005, "t": 473.70425, "r": 449.7435, "b": 482.4892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "15", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.81491, "t": 473.70425, "r": 496.599, "b": 482.4892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "16", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 347.24872, "t": 485.12469, "r": 356.03281, "b": 493.90964, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "17", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.10422, "t": 485.12469, "r": 402.88831, "b": 493.90964, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "18", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.95941000000005, "t": 485.12469, "r": 449.7435, "b": 493.90964, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "19", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.81491, "t": 485.12469, "r": 496.599, "b": 493.90964, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "20", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 331.90424, "t": 473.32291, "r": 337.90903, "b": 483.45331, "coord_origin": "TOPLEFT"}, "row_span": 3, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "2", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "picture", "id": 16, "page_no": 0, "cluster": {"id": 16, "label": "picture", "bbox": {"l": 315.65362548828125, "t": 228.723388671875, "r": 537.1475219726562, "b": 302.8014221191406, "coord_origin": "TOPLEFT"}, "confidence": 0.608779788017273, "cells": [{"id": 97, "text": "1", "bbox": {"l": 451.9457100000001, "t": 235.34704999999997, "r": 457.95050000000003, "b": 245.47748, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "2", "bbox": {"l": 331.19681, "t": 269.35266, "r": 337.2016, "b": 279.48308999999995, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "3", "bbox": {"l": 384.0329, "t": 252.67895999999996, "r": 390.03769, "b": 262.80939, "coord_origin": "TOPLEFT"}}], "children": [{"id": 62, "label": "text", "bbox": {"l": 451.9457100000001, "t": 235.34704999999997, "r": 457.95050000000003, "b": 245.47748, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "1", "bbox": {"l": 451.9457100000001, "t": 235.34704999999997, "r": 457.95050000000003, "b": 245.47748, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 331.19681, "t": 269.35266, "r": 337.2016, "b": 279.48308999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "2", "bbox": {"l": 331.19681, "t": 269.35266, "r": 337.2016, "b": 279.48308999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 384.0329, "t": 252.67895999999996, "r": 390.03769, "b": 262.80939, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "3", "bbox": {"l": 384.0329, "t": 252.67895999999996, "r": 390.03769, "b": 262.80939, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "table", "id": 15, "page_no": 0, "cluster": {"id": 15, "label": "table", "bbox": {"l": 315.65362548828125, "t": 228.723388671875, "r": 537.1475219726562, "b": 302.8014221191406, "coord_origin": "TOPLEFT"}, "confidence": 0.6515864729881287, "cells": [{"id": 97, "text": "1", "bbox": {"l": 451.9457100000001, "t": 235.34704999999997, "r": 457.95050000000003, "b": 245.47748, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "2", "bbox": {"l": 331.19681, "t": 269.35266, "r": 337.2016, "b": 279.48308999999995, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "3", "bbox": {"l": 384.0329, "t": 252.67895999999996, "r": 390.03769, "b": 262.80939, "coord_origin": "TOPLEFT"}}], "children": [{"id": 62, "label": "text", "bbox": {"l": 451.9457100000001, "t": 235.34704999999997, "r": 457.95050000000003, "b": 245.47748, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "1", "bbox": {"l": 451.9457100000001, "t": 235.34704999999997, "r": 457.95050000000003, "b": 245.47748, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 331.19681, "t": 269.35266, "r": 337.2016, "b": 279.48308999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "2", "bbox": {"l": 331.19681, "t": 269.35266, "r": 337.2016, "b": 279.48308999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 384.0329, "t": 252.67895999999996, "r": 390.03769, "b": 262.80939, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "3", "bbox": {"l": 384.0329, "t": 252.67895999999996, "r": 390.03769, "b": 262.80939, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ecel", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "ucel", "fcel", "fcel", "fcel", "fcel", "nl", "ucel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 1, "num_cols": 2, "table_cells": [{"bbox": {"l": 451.9457100000001, "t": 235.34704999999997, "r": 457.95050000000003, "b": 245.47748, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "1", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 384.0329, "t": 252.67895999999996, "r": 390.03769, "b": 262.80939, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3", "column_header": true, "row_header": false, "row_section": false}]}, {"label": "caption", "id": 6, "page_no": 0, "cluster": {"id": 6, "label": "caption", "bbox": {"l": 308.862, "t": 514.50037, "r": 545.11517, "b": 559.2729, "coord_origin": "TOPLEFT"}, "confidence": 0.9214619398117065, "cells": [{"id": 106, "text": "Figure 1:", "bbox": {"l": 308.862, "t": 514.50037, "r": 345.73361, "b": 523.40692, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "Picture of a table with subtle, complex features", "bbox": {"l": 353.17566, "t": 514.50037, "r": 545.11511, "b": 523.40692, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "such as (1) multi-column headers, (2) cell with multi-row", "bbox": {"l": 308.862, "t": 526.45535, "r": 545.11511, "b": 535.3619100000001, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "text and (3) cells with no content. Image from PubTabNet", "bbox": {"l": 308.862, "t": 538.41035, "r": 545.11517, "b": 547.31691, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "evaluation set, filename: \u2018PMC2944238 004 02\u2019.", "bbox": {"l": 308.862, "t": 550.36635, "r": 505.6917700000001, "b": 559.2729, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 1: Picture of a table with subtle, complex features such as (1) multi-column headers, (2) cell with multi-row text and (3) cells with no content. Image from PubTabNet evaluation set, filename: \u2018PMC2944238 004 02\u2019."}, {"label": "text", "id": 0, "page_no": 0, "cluster": {"id": 0, "label": "text", "bbox": {"l": 308.862, "t": 584.40936, "r": 545.11517, "b": 665.04693, "coord_origin": "TOPLEFT"}, "confidence": 0.9848759770393372, "cells": [{"id": 111, "text": "Recently, significant progress has been made with vi-", "bbox": {"l": 320.81699, "t": 584.40936, "r": 545.11493, "b": 593.31592, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "sion based approaches to extract tables in documents. For", "bbox": {"l": 308.862, "t": 596.36436, "r": 545.11517, "b": 605.2709199999999, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "the sake of completeness, the issue of table extraction from", "bbox": {"l": 308.862, "t": 608.31937, "r": 545.11511, "b": 617.22592, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "documents is typically decomposed into two separate chal-", "bbox": {"l": 308.862, "t": 620.27437, "r": 545.11505, "b": 629.18092, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "lenges, i.e.", "bbox": {"l": 308.862, "t": 632.23036, "r": 353.6937, "b": 641.13692, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "(1)", "bbox": {"l": 362.11209, "t": 632.23036, "r": 374.66617, "b": 641.13692, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "finding the location of the table(s) on a", "bbox": {"l": 377.35785, "t": 632.23036, "r": 545.11505, "b": 641.13692, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "document-page and (2) finding the structure of a given table", "bbox": {"l": 308.862, "t": 644.18536, "r": 545.11517, "b": 653.09192, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "in the document.", "bbox": {"l": 308.862, "t": 656.14037, "r": 375.55167, "b": 665.04693, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Recently, significant progress has been made with vision based approaches to extract tables in documents. For the sake of completeness, the issue of table extraction from documents is typically decomposed into two separate challenges, i.e. (1) finding the location of the table(s) on a document-page and (2) finding the structure of a given table in the document."}, {"label": "text", "id": 3, "page_no": 0, "cluster": {"id": 3, "label": "text", "bbox": {"l": 308.862, "t": 668.38036, "r": 545.11511, "b": 713.151932, "coord_origin": "TOPLEFT"}, "confidence": 0.979152262210846, "cells": [{"id": 120, "text": "The first problem is called table-location and has been", "bbox": {"l": 320.81699, "t": 668.38036, "r": 545.11493, "b": 677.28693, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "previously addressed [30, 38, 19, 21, 23, 26, 8] with state-", "bbox": {"l": 308.862, "t": 680.33536, "r": 545.11511, "b": 689.24193, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "of-the-art object-detection networks (e.g. YOLO and later", "bbox": {"l": 308.862, "t": 692.290359, "r": 545.11511, "b": 701.19693, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "on Mask-RCNN [9]). For all practical purposes, it can be", "bbox": {"l": 308.862, "t": 704.245361, "r": 545.11499, "b": 713.151932, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The first problem is called table-location and has been previously addressed [30, 38, 19, 21, 23, 26, 8] with stateof-the-art object-detection networks (e.g. YOLO and later on Mask-RCNN [9]). For all practical purposes, it can be"}], "headers": [{"label": "page_footer", "id": 12, "page_no": 0, "cluster": {"id": 12, "label": "page_footer", "bbox": {"l": 295.121, "t": 734.133366, "r": 300.10229, "b": 743.039928, "coord_origin": "TOPLEFT"}, "confidence": 0.8045893311500549, "cells": [{"id": 124, "text": "1", "bbox": {"l": 295.121, "t": 734.133366, "r": 300.10229, "b": 743.039928, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1"}, {"label": "page_header", "id": 9, "page_no": 0, "cluster": {"id": 9, "label": "page_header", "bbox": {"l": 18.340221, "t": 207.82001000000002, "r": 36.339779, "b": 560.00003, "coord_origin": "TOPLEFT"}, "confidence": 0.8773143887519836, "cells": [{"id": 125, "text": "arXiv:2203.01017v2 [cs.CV] 11 Mar 2022", "bbox": {"l": 18.340221, "t": 207.82001000000002, "r": 36.339779, "b": 560.00003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "arXiv:2203.01017v2 [cs.CV] 11 Mar 2022"}]}}, {"page_no": 1, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "considered as a solved problem, given enough ground-truth", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 286.36505, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "data to train on.", "bbox": {"l": 50.112, "t": 87.16339000000005, "r": 112.64721999999999, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "The second problem is called table-structure decompo-", "bbox": {"l": 62.067001, "t": 99.57141000000001, "r": 286.36496, "b": 108.47797000000003, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "sition.", "bbox": {"l": 50.112, "t": 111.52643, "r": 74.749512, "b": 120.43297999999993, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "The latter is a long standing problem in the com-", "bbox": {"l": 81.334793, "t": 111.52643, "r": 286.36514, "b": 120.43297999999993, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "munity of document understanding [6, 4, 14]. Contrary to", "bbox": {"l": 50.112, "t": 123.48145, "r": 286.36511, "b": 132.38800000000003, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "the table-location problem, there are no commonly used ap-", "bbox": {"l": 50.112, "t": 135.43646, "r": 286.36511, "b": 144.34302000000002, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "proaches that can easily be re-purposed to solve this prob-", "bbox": {"l": 50.112, "t": 147.39246000000003, "r": 286.36505, "b": 156.29900999999995, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "lem. Lately, a set of new model-architectures has been pro-", "bbox": {"l": 50.112, "t": 159.34747000000004, "r": 286.36511, "b": 168.25402999999994, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "posed by the community to address table-structure decom-", "bbox": {"l": 50.112, "t": 171.30249000000003, "r": 286.36508, "b": 180.20905000000005, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "position [37, 36, 18, 20]. All these models have some weak-", "bbox": {"l": 50.112, "t": 183.25751000000002, "r": 286.36511, "b": 192.16405999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "nesses (see Sec. 2). The common denominator here is the", "bbox": {"l": 50.112, "t": 195.21252000000004, "r": 286.36508, "b": 204.11908000000005, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "reliance on textual features and/or the inability to provide", "bbox": {"l": 50.112, "t": 207.16754000000003, "r": 286.36514, "b": 216.07410000000004, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "the bounding box of each table-cell in the original image.", "bbox": {"l": 50.112, "t": 219.12354000000005, "r": 278.66397, "b": 228.03008999999997, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "In this paper, we want to address these weaknesses and", "bbox": {"l": 62.067001, "t": 231.53156, "r": 286.36493, "b": 240.43811000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "present a robust table-structure decomposition algorithm.", "bbox": {"l": 50.112, "t": 243.48657000000003, "r": 286.36511, "b": 252.39313000000004, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "The design criteria for our model are the following. First,", "bbox": {"l": 50.112, "t": 255.44159000000002, "r": 286.36511, "b": 264.34813999999994, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "we want our algorithm to be language agnostic. In this way,", "bbox": {"l": 50.112, "t": 267.39661, "r": 286.36502, "b": 276.30316000000005, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "we can obtain the structure of any table, irregardless of the", "bbox": {"l": 50.112, "t": 279.35155999999995, "r": 286.36508, "b": 288.25815, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "language.", "bbox": {"l": 50.112, "t": 291.30759, "r": 88.567635, "b": 300.21414, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Second, we want our algorithm to leverage as", "bbox": {"l": 95.501602, "t": 291.30759, "r": 286.36505, "b": 300.21414, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "much data as possible from the original PDF document. For", "bbox": {"l": 50.112, "t": 303.26257, "r": 286.36508, "b": 312.16913, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "programmatic PDF documents, the text-cells can often be", "bbox": {"l": 50.112, "t": 315.21756, "r": 286.36511, "b": 324.12411, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "extracted much faster and with higher accuracy compared", "bbox": {"l": 50.112, "t": 327.17255, "r": 286.36505, "b": 336.0791, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "to OCR methods. Last but not least, we want to have a di-", "bbox": {"l": 50.112, "t": 339.12753, "r": 286.36511, "b": 348.03409, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "rect link between the table-cell and its bounding box in the", "bbox": {"l": 50.112, "t": 351.08353, "r": 286.36508, "b": 359.99008, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "image.", "bbox": {"l": 50.112, "t": 363.03851, "r": 76.951241, "b": 371.94507, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "To meet the design criteria listed above, we developed a", "bbox": {"l": 62.067001, "t": 375.4465, "r": 286.36499, "b": 384.35306, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "new model called", "bbox": {"l": 50.112, "t": 387.40149, "r": 120.98594, "b": 396.30804, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "TableFormer", "bbox": {"l": 123.901, "t": 387.28192, "r": 179.7314, "b": 396.23830999999996, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "and a synthetically gener-", "bbox": {"l": 182.646, "t": 387.40149, "r": 286.36658, "b": 396.30804, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "ated table structure dataset called", "bbox": {"l": 50.112, "t": 399.35648, "r": 181.75778, "b": 408.26302999999996, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "SynthTabNet", "bbox": {"l": 184.104, "t": 399.23690999999997, "r": 240.2034, "b": 408.1933, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "$^{1}$. In partic-", "bbox": {"l": 240.20401, "t": 399.35648, "r": 286.36069, "b": 408.26302999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "ular, our contributions in this work can be summarised as", "bbox": {"l": 50.112015, "t": 411.31146, "r": 286.36511, "b": 420.21802, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "follows:", "bbox": {"l": 50.112015, "t": 423.26645, "r": 82.520355, "b": 432.173, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "\u2022", "bbox": {"l": 61.569016, "t": 444.55145, "r": 70.741714, "b": 453.45801, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "We propose", "bbox": {"l": 73.034889, "t": 444.55145, "r": 117.10054, "b": 453.45801, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "TableFormer", "bbox": {"l": 119.59001, "t": 444.43188, "r": 175.42041, "b": 453.38828, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": ", a transformer based model", "bbox": {"l": 175.42102, "t": 444.55145, "r": 286.36453, "b": 453.45801, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "that predicts tables structure and bounding boxes for", "bbox": {"l": 70.037018, "t": 456.50644000000005, "r": 286.3649, "b": 465.41299, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "the table content simultaneously in an end-to-end ap-", "bbox": {"l": 70.037018, "t": 468.46143, "r": 286.3649, "b": 477.36798, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "proach.", "bbox": {"l": 70.037018, "t": 480.41641, "r": 99.635902, "b": 489.32297, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "\u2022", "bbox": {"l": 61.569016, "t": 502.15341, "r": 71.619438, "b": 511.05997, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "Across all benchmark datasets", "bbox": {"l": 74.132042, "t": 502.15341, "r": 196.10396, "b": 511.05997, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "TableFormer", "bbox": {"l": 200.31001, "t": 502.03384, "r": 256.14041, "b": 510.99023, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "signif-", "bbox": {"l": 260.35001, "t": 502.15341, "r": 286.36237, "b": 511.05997, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "icantly outperforms existing state-of-the-art metrics,", "bbox": {"l": 70.037003, "t": 514.1084000000001, "r": 286.3649, "b": 523.01495, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "while being much more efficient in training and infer-", "bbox": {"l": 70.037003, "t": 526.06439, "r": 286.36487, "b": 534.97095, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "ence to existing works.", "bbox": {"l": 70.037003, "t": 538.0193899999999, "r": 161.65305, "b": 546.9259500000001, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "\u2022", "bbox": {"l": 61.569, "t": 559.75639, "r": 71.115913, "b": 568.66295, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "We present", "bbox": {"l": 73.502647, "t": 559.75639, "r": 116.71199, "b": 568.66295, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "SynthTabNet", "bbox": {"l": 121.583, "t": 559.63684, "r": 177.68239, "b": 568.59322, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "a synthetically generated", "bbox": {"l": 182.55301, "t": 559.75639, "r": 286.36328, "b": 568.66295, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "dataset, with various appearance styles and complex-", "bbox": {"l": 70.03701, "t": 571.7114, "r": 286.36493, "b": 580.6179500000001, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "ity.", "bbox": {"l": 70.03701, "t": 583.6664000000001, "r": 82.400597, "b": 592.57295, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "\u2022", "bbox": {"l": 61.569008000000004, "t": 605.4034, "r": 72.332527, "b": 614.30995, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "An augmented dataset based on PubTabNet [37],", "bbox": {"l": 75.023399, "t": 605.4034, "r": 286.36508, "b": 614.30995, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "FinTabNet [36], and TableBank [17] with generated", "bbox": {"l": 70.03701, "t": 617.3584, "r": 286.36487, "b": 626.26495, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "ground-truth for reproducibility.", "bbox": {"l": 70.03701, "t": 629.31439, "r": 198.05641, "b": 638.22095, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "The paper is structured as follows. In Sec. 2, we give", "bbox": {"l": 62.067009000000006, "t": 650.59839, "r": 286.36496, "b": 659.50494, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "a brief overview of the current state-of-the-art. In Sec. 3,", "bbox": {"l": 50.112007, "t": 662.55339, "r": 286.36511, "b": 671.45995, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "we describe the datasets on which we train. In Sec. 4, we", "bbox": {"l": 50.112007, "t": 674.50839, "r": 286.36511, "b": 683.41496, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "introduce the TableFormer model-architecture and describe", "bbox": {"l": 50.112007, "t": 686.46339, "r": 286.36511, "b": 695.369957, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "$^{1}$https://github.com/IBM/SynthTabNet", "bbox": {"l": 60.97100100000001, "t": 705.596275, "r": 183.73055, "b": 712.721542, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "its results & performance in Sec. 5. As a conclusion, we de-", "bbox": {"l": 308.862, "t": 75.20836999999995, "r": 545.11511, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "scribe how this new model-architecture can be re-purposed", "bbox": {"l": 308.862, "t": 87.16339000000005, "r": 545.11505, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "for other tasks in the computer-vision community.", "bbox": {"l": 308.862, "t": 99.11841000000004, "r": 508.08417000000003, "b": 108.02495999999985, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "2.", "bbox": {"l": 308.862, "t": 121.73193000000003, "r": 315.5831, "b": 132.47968000000003, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "Previous work and State of the Art", "bbox": {"l": 324.54456, "t": 121.73193000000003, "r": 498.28021, "b": 132.47968000000003, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "Identifying the structure of a table has been an outstand-", "bbox": {"l": 320.81699, "t": 142.22136999999998, "r": 545.11493, "b": 151.12793, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "ing problem in the document-parsing community, that mo-", "bbox": {"l": 308.862, "t": 154.17638999999997, "r": 545.11505, "b": 163.08294999999998, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "tivates many organised public challenges [6, 4, 14].", "bbox": {"l": 308.862, "t": 166.13140999999996, "r": 522.55975, "b": 175.03796, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "The", "bbox": {"l": 529.62323, "t": 166.13140999999996, "r": 545.11505, "b": 175.03796, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "difficulty of the problem can be attributed to a number of", "bbox": {"l": 308.862, "t": 178.08642999999995, "r": 545.11517, "b": 186.99298, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "factors. First, there is a large variety in the shapes and sizes", "bbox": {"l": 308.862, "t": 190.04143999999997, "r": 545.11511, "b": 198.94799999999998, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "of tables.", "bbox": {"l": 308.862, "t": 201.99645999999996, "r": 346.97891, "b": 210.90301999999997, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "Such large variety requires a flexible method.", "bbox": {"l": 354.86929, "t": 201.99645999999996, "r": 545.11511, "b": 210.90301999999997, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "This is especially true for complex column- and row head-", "bbox": {"l": 308.862, "t": 213.95245, "r": 545.11505, "b": 222.85901, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "ers, which can be extremely intricate and demanding.", "bbox": {"l": 308.862, "t": 225.90747, "r": 530.9184, "b": 234.81403, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "A", "bbox": {"l": 537.92212, "t": 225.90747, "r": 545.11511, "b": 234.81403, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "second factor of complexity is the lack of data with regard", "bbox": {"l": 308.862, "t": 237.86248999999998, "r": 545.11517, "b": 246.76904000000002, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "to table-structure. Until the publication of PubTabNet [37],", "bbox": {"l": 308.862, "t": 249.8175, "r": 545.11511, "b": 258.72406, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "there were no large datasets (i.e.", "bbox": {"l": 308.862, "t": 261.77252, "r": 439.8402699999999, "b": 270.67908, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": ">", "bbox": {"l": 444.43999999999994, "t": 261.61310000000003, "r": 452.1889, "b": 270.45989999999995, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "100", "bbox": {"l": 455.89001, "t": 261.61310000000003, "r": 470.83392000000003, "b": 270.45989999999995, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "K tables) that pro-", "bbox": {"l": 470.83401, "t": 261.77252, "r": 545.11517, "b": 270.67908, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "vided structure information. This happens primarily due to", "bbox": {"l": 308.862, "t": 273.72748, "r": 545.11511, "b": 282.63406, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "the fact that tables are notoriously time-consuming to an-", "bbox": {"l": 308.862, "t": 285.6835, "r": 545.11511, "b": 294.59006, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "notate by hand. However, this has definitely changed in re-", "bbox": {"l": 308.862, "t": 297.63849, "r": 545.11511, "b": 306.54504, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "cent years with the deliverance of PubTabNet [37], FinTab-", "bbox": {"l": 308.862, "t": 309.59348, "r": 545.11517, "b": 318.50003000000004, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "Net [36], TableBank [17] etc.", "bbox": {"l": 308.862, "t": 321.54846, "r": 425.92255, "b": 330.45502, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Before the rising popularity of deep neural networks,", "bbox": {"l": 320.81699, "t": 333.56946, "r": 545.11499, "b": 342.47601, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "the community relied heavily on heuristic and/or statistical", "bbox": {"l": 308.862, "t": 345.52444, "r": 545.11499, "b": 354.43100000000004, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "methods to do table structure identification [3, 7, 11, 5, 13,", "bbox": {"l": 308.862, "t": 357.47943, "r": 545.11517, "b": 366.38599, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "28]. Although such methods work well on constrained ta-", "bbox": {"l": 308.862, "t": 369.43542, "r": 545.11511, "b": 378.34198, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "bles [12], a more data-driven approach can be applied due", "bbox": {"l": 308.862, "t": 381.39041, "r": 545.11505, "b": 390.29697, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "to the advent of convolutional neural networks (CNNs) and", "bbox": {"l": 308.862, "t": 393.3453999999999, "r": 545.11505, "b": 402.25195, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "the availability of large datasets. To the best-of-our knowl-", "bbox": {"l": 308.862, "t": 405.30038, "r": 545.11517, "b": 414.20694, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "edge, there are currently two different types of network ar-", "bbox": {"l": 308.862, "t": 417.25537, "r": 545.11523, "b": 426.16193, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "chitecture that are being pursued for state-of-the-art table-", "bbox": {"l": 308.862, "t": 429.21136000000007, "r": 545.11511, "b": 438.11792, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "structure identification.", "bbox": {"l": 308.862, "t": 441.16635, "r": 401.28503, "b": 450.0729099999999, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "Image-to-Text networks", "bbox": {"l": 320.81699, "t": 453.06778, "r": 423.26236, "b": 462.02417, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": ": In this type of network, one", "bbox": {"l": 423.26697, "t": 453.18735, "r": 545.10956, "b": 462.0939, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "predicts a sequence of tokens starting from an encoded", "bbox": {"l": 308.86197, "t": 465.14233, "r": 545.11511, "b": 474.04889, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "image.", "bbox": {"l": 308.86197, "t": 477.09732, "r": 335.7012, "b": 486.00388, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "Such sequences of tokens can be HTML table", "bbox": {"l": 345.85309, "t": 477.09732, "r": 545.11505, "b": 486.00388, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "tags [37, 17] or LaTeX symbols[10]. The choice of sym-", "bbox": {"l": 308.86197, "t": 489.05231, "r": 545.11493, "b": 497.95886, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "bols is ultimately not very important, since one can be trans-", "bbox": {"l": 308.86197, "t": 501.00729, "r": 545.11499, "b": 509.91385, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "formed into the other. There are however subtle variations", "bbox": {"l": 308.86197, "t": 512.9632899999999, "r": 545.11505, "b": 521.8698400000001, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "in the Image-to-Text networks. The easiest network archi-", "bbox": {"l": 308.86197, "t": 524.91827, "r": 545.11505, "b": 533.82483, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "tectures are \u201cimage-encoder", "bbox": {"l": 308.86197, "t": 536.87328, "r": 420.94119, "b": 545.77983, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "\u2192", "bbox": {"l": 423.59497, "t": 536.1559599999999, "r": 433.5575600000001, "b": 545.56065, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "text-decoder\u201d (IETD), sim-", "bbox": {"l": 436.21198, "t": 536.87328, "r": 545.11316, "b": 545.77983, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "ilar to network architectures that try to provide captions to", "bbox": {"l": 308.86197, "t": 548.82828, "r": 545.11511, "b": 557.73483, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "images [32]. In these IETD networks, one expects as output", "bbox": {"l": 308.86197, "t": 560.78328, "r": 545.11493, "b": 569.68983, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "the LaTeX/HTML string of the entire table, i.e. the sym-", "bbox": {"l": 308.86197, "t": 572.73828, "r": 545.11499, "b": 581.6448399999999, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "bols necessary for creating the table with the content of the", "bbox": {"l": 308.86197, "t": 584.69427, "r": 545.11505, "b": 593.60083, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "table. Another approach is the \u201cimage-encoder", "bbox": {"l": 308.86197, "t": 596.6492800000001, "r": 497.07541, "b": 605.55583, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "\u2192", "bbox": {"l": 499.80496, "t": 595.93196, "r": 509.76755, "b": 605.33665, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "dual de-", "bbox": {"l": 512.50098, "t": 596.6492800000001, "r": 545.10852, "b": 605.55583, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "coder\u201d (IEDD) networks. In these type of networks, one has", "bbox": {"l": 308.86197, "t": 608.60428, "r": 545.11511, "b": 617.5108299999999, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "two consecutive decoders with different purposes. The first", "bbox": {"l": 308.86197, "t": 620.55928, "r": 545.11505, "b": 629.46584, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "decoder is the", "bbox": {"l": 308.86197, "t": 632.51428, "r": 364.78201, "b": 641.42084, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "tag-decoder", "bbox": {"l": 367.57397, "t": 632.60394, "r": 415.61362, "b": 641.1917, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": ", i.e. it only produces the HTM-", "bbox": {"l": 415.61298, "t": 632.51428, "r": 545.11688, "b": 641.42084, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "L/LaTeX tags which construct an empty table. The second", "bbox": {"l": 308.86197, "t": 644.46928, "r": 545.11511, "b": 653.37584, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "content-decoder", "bbox": {"l": 308.86197, "t": 656.51494, "r": 373.59894, "b": 665.1027, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "uses the encoding of the image in combi-", "bbox": {"l": 376.90698, "t": 656.4252799999999, "r": 545.11548, "b": 665.33184, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "nation with the output encoding of each cell-tag (from the", "bbox": {"l": 308.862, "t": 668.38028, "r": 545.11517, "b": 677.28684, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "tag-decoder", "bbox": {"l": 308.862, "t": 680.42494, "r": 356.90164, "b": 689.0127, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": ") to generate the textual content of each table", "bbox": {"l": 357.13101, "t": 680.33528, "r": 545.1153, "b": 689.24184, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "cell. The network architecture of IEDD is certainly more", "bbox": {"l": 308.862, "t": 692.290283, "r": 545.11511, "b": 701.196846, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "elaborate, but it has the advantage that one can pre-train the", "bbox": {"l": 308.862, "t": 704.245285, "r": 545.11517, "b": 713.151848, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "2", "bbox": {"l": 295.121, "t": 734.133282, "r": 300.10229, "b": 743.039845, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 12, "label": "text", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 286.36505, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9656890034675598, "cells": [{"id": 0, "text": "considered as a solved problem, given enough ground-truth", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 286.36505, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "data to train on.", "bbox": {"l": 50.112, "t": 87.16339000000005, "r": 112.64721999999999, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "text", "bbox": {"l": 50.112, "t": 99.57141000000001, "r": 286.36514, "b": 228.03008999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9838606119155884, "cells": [{"id": 2, "text": "The second problem is called table-structure decompo-", "bbox": {"l": 62.067001, "t": 99.57141000000001, "r": 286.36496, "b": 108.47797000000003, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "sition.", "bbox": {"l": 50.112, "t": 111.52643, "r": 74.749512, "b": 120.43297999999993, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "The latter is a long standing problem in the com-", "bbox": {"l": 81.334793, "t": 111.52643, "r": 286.36514, "b": 120.43297999999993, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "munity of document understanding [6, 4, 14]. Contrary to", "bbox": {"l": 50.112, "t": 123.48145, "r": 286.36511, "b": 132.38800000000003, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "the table-location problem, there are no commonly used ap-", "bbox": {"l": 50.112, "t": 135.43646, "r": 286.36511, "b": 144.34302000000002, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "proaches that can easily be re-purposed to solve this prob-", "bbox": {"l": 50.112, "t": 147.39246000000003, "r": 286.36505, "b": 156.29900999999995, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "lem. Lately, a set of new model-architectures has been pro-", "bbox": {"l": 50.112, "t": 159.34747000000004, "r": 286.36511, "b": 168.25402999999994, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "posed by the community to address table-structure decom-", "bbox": {"l": 50.112, "t": 171.30249000000003, "r": 286.36508, "b": 180.20905000000005, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "position [37, 36, 18, 20]. All these models have some weak-", "bbox": {"l": 50.112, "t": 183.25751000000002, "r": 286.36511, "b": 192.16405999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "nesses (see Sec. 2). The common denominator here is the", "bbox": {"l": 50.112, "t": 195.21252000000004, "r": 286.36508, "b": 204.11908000000005, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "reliance on textual features and/or the inability to provide", "bbox": {"l": 50.112, "t": 207.16754000000003, "r": 286.36514, "b": 216.07410000000004, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "the bounding box of each table-cell in the original image.", "bbox": {"l": 50.112, "t": 219.12354000000005, "r": 278.66397, "b": 228.03008999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 50.112, "t": 231.53156, "r": 286.36511, "b": 371.94507, "coord_origin": "TOPLEFT"}, "confidence": 0.9855920076370239, "cells": [{"id": 14, "text": "In this paper, we want to address these weaknesses and", "bbox": {"l": 62.067001, "t": 231.53156, "r": 286.36493, "b": 240.43811000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "present a robust table-structure decomposition algorithm.", "bbox": {"l": 50.112, "t": 243.48657000000003, "r": 286.36511, "b": 252.39313000000004, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "The design criteria for our model are the following. First,", "bbox": {"l": 50.112, "t": 255.44159000000002, "r": 286.36511, "b": 264.34813999999994, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "we want our algorithm to be language agnostic. In this way,", "bbox": {"l": 50.112, "t": 267.39661, "r": 286.36502, "b": 276.30316000000005, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "we can obtain the structure of any table, irregardless of the", "bbox": {"l": 50.112, "t": 279.35155999999995, "r": 286.36508, "b": 288.25815, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "language.", "bbox": {"l": 50.112, "t": 291.30759, "r": 88.567635, "b": 300.21414, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Second, we want our algorithm to leverage as", "bbox": {"l": 95.501602, "t": 291.30759, "r": 286.36505, "b": 300.21414, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "much data as possible from the original PDF document. For", "bbox": {"l": 50.112, "t": 303.26257, "r": 286.36508, "b": 312.16913, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "programmatic PDF documents, the text-cells can often be", "bbox": {"l": 50.112, "t": 315.21756, "r": 286.36511, "b": 324.12411, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "extracted much faster and with higher accuracy compared", "bbox": {"l": 50.112, "t": 327.17255, "r": 286.36505, "b": 336.0791, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "to OCR methods. Last but not least, we want to have a di-", "bbox": {"l": 50.112, "t": 339.12753, "r": 286.36511, "b": 348.03409, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "rect link between the table-cell and its bounding box in the", "bbox": {"l": 50.112, "t": 351.08353, "r": 286.36508, "b": 359.99008, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "image.", "bbox": {"l": 50.112, "t": 363.03851, "r": 76.951241, "b": 371.94507, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "text", "bbox": {"l": 50.112, "t": 375.4465, "r": 286.36658, "b": 432.173, "coord_origin": "TOPLEFT"}, "confidence": 0.9820111393928528, "cells": [{"id": 27, "text": "To meet the design criteria listed above, we developed a", "bbox": {"l": 62.067001, "t": 375.4465, "r": 286.36499, "b": 384.35306, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "new model called", "bbox": {"l": 50.112, "t": 387.40149, "r": 120.98594, "b": 396.30804, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "TableFormer", "bbox": {"l": 123.901, "t": 387.28192, "r": 179.7314, "b": 396.23830999999996, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "and a synthetically gener-", "bbox": {"l": 182.646, "t": 387.40149, "r": 286.36658, "b": 396.30804, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "ated table structure dataset called", "bbox": {"l": 50.112, "t": 399.35648, "r": 181.75778, "b": 408.26302999999996, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "SynthTabNet", "bbox": {"l": 184.104, "t": 399.23690999999997, "r": 240.2034, "b": 408.1933, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "$^{1}$. In partic-", "bbox": {"l": 240.20401, "t": 399.35648, "r": 286.36069, "b": 408.26302999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "ular, our contributions in this work can be summarised as", "bbox": {"l": 50.112015, "t": 411.31146, "r": 286.36511, "b": 420.21802, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "follows:", "bbox": {"l": 50.112015, "t": 423.26645, "r": 82.520355, "b": 432.173, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "list_item", "bbox": {"l": 61.569016, "t": 444.43188, "r": 286.3649, "b": 489.32297, "coord_origin": "TOPLEFT"}, "confidence": 0.9822162389755249, "cells": [{"id": 36, "text": "\u2022", "bbox": {"l": 61.569016, "t": 444.55145, "r": 70.741714, "b": 453.45801, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "We propose", "bbox": {"l": 73.034889, "t": 444.55145, "r": 117.10054, "b": 453.45801, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "TableFormer", "bbox": {"l": 119.59001, "t": 444.43188, "r": 175.42041, "b": 453.38828, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": ", a transformer based model", "bbox": {"l": 175.42102, "t": 444.55145, "r": 286.36453, "b": 453.45801, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "that predicts tables structure and bounding boxes for", "bbox": {"l": 70.037018, "t": 456.50644000000005, "r": 286.3649, "b": 465.41299, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "the table content simultaneously in an end-to-end ap-", "bbox": {"l": 70.037018, "t": 468.46143, "r": 286.3649, "b": 477.36798, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "proach.", "bbox": {"l": 70.037018, "t": 480.41641, "r": 99.635902, "b": 489.32297, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "list_item", "bbox": {"l": 61.569016, "t": 502.03384, "r": 286.3649, "b": 546.9259500000001, "coord_origin": "TOPLEFT"}, "confidence": 0.982271671295166, "cells": [{"id": 43, "text": "\u2022", "bbox": {"l": 61.569016, "t": 502.15341, "r": 71.619438, "b": 511.05997, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "Across all benchmark datasets", "bbox": {"l": 74.132042, "t": 502.15341, "r": 196.10396, "b": 511.05997, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "TableFormer", "bbox": {"l": 200.31001, "t": 502.03384, "r": 256.14041, "b": 510.99023, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "signif-", "bbox": {"l": 260.35001, "t": 502.15341, "r": 286.36237, "b": 511.05997, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "icantly outperforms existing state-of-the-art metrics,", "bbox": {"l": 70.037003, "t": 514.1084000000001, "r": 286.3649, "b": 523.01495, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "while being much more efficient in training and infer-", "bbox": {"l": 70.037003, "t": 526.06439, "r": 286.36487, "b": 534.97095, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "ence to existing works.", "bbox": {"l": 70.037003, "t": 538.0193899999999, "r": 161.65305, "b": 546.9259500000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "list_item", "bbox": {"l": 61.569, "t": 559.63684, "r": 286.36493, "b": 592.57295, "coord_origin": "TOPLEFT"}, "confidence": 0.9802963733673096, "cells": [{"id": 50, "text": "\u2022", "bbox": {"l": 61.569, "t": 559.75639, "r": 71.115913, "b": 568.66295, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "We present", "bbox": {"l": 73.502647, "t": 559.75639, "r": 116.71199, "b": 568.66295, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "SynthTabNet", "bbox": {"l": 121.583, "t": 559.63684, "r": 177.68239, "b": 568.59322, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "a synthetically generated", "bbox": {"l": 182.55301, "t": 559.75639, "r": 286.36328, "b": 568.66295, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "dataset, with various appearance styles and complex-", "bbox": {"l": 70.03701, "t": 571.7114, "r": 286.36493, "b": 580.6179500000001, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "ity.", "bbox": {"l": 70.03701, "t": 583.6664000000001, "r": 82.400597, "b": 592.57295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "list_item", "bbox": {"l": 61.569008000000004, "t": 605.4034, "r": 286.36508, "b": 638.22095, "coord_origin": "TOPLEFT"}, "confidence": 0.9806395173072815, "cells": [{"id": 56, "text": "\u2022", "bbox": {"l": 61.569008000000004, "t": 605.4034, "r": 72.332527, "b": 614.30995, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "An augmented dataset based on PubTabNet [37],", "bbox": {"l": 75.023399, "t": 605.4034, "r": 286.36508, "b": 614.30995, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "FinTabNet [36], and TableBank [17] with generated", "bbox": {"l": 70.03701, "t": 617.3584, "r": 286.36487, "b": 626.26495, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "ground-truth for reproducibility.", "bbox": {"l": 70.03701, "t": 629.31439, "r": 198.05641, "b": 638.22095, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 50.112007, "t": 650.59839, "r": 286.36511, "b": 695.369957, "coord_origin": "TOPLEFT"}, "confidence": 0.9742533564567566, "cells": [{"id": 60, "text": "The paper is structured as follows. In Sec. 2, we give", "bbox": {"l": 62.067009000000006, "t": 650.59839, "r": 286.36496, "b": 659.50494, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "a brief overview of the current state-of-the-art. In Sec. 3,", "bbox": {"l": 50.112007, "t": 662.55339, "r": 286.36511, "b": 671.45995, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "we describe the datasets on which we train. In Sec. 4, we", "bbox": {"l": 50.112007, "t": 674.50839, "r": 286.36511, "b": 683.41496, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "introduce the TableFormer model-architecture and describe", "bbox": {"l": 50.112007, "t": 686.46339, "r": 286.36511, "b": 695.369957, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "footnote", "bbox": {"l": 60.97100100000001, "t": 705.596275, "r": 183.73055, "b": 712.721542, "coord_origin": "TOPLEFT"}, "confidence": 0.895367443561554, "cells": [{"id": 64, "text": "$^{1}$https://github.com/IBM/SynthTabNet", "bbox": {"l": 60.97100100000001, "t": 705.596275, "r": 183.73055, "b": 712.721542, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "text", "bbox": {"l": 308.862, "t": 75.20836999999995, "r": 545.11511, "b": 108.02495999999985, "coord_origin": "TOPLEFT"}, "confidence": 0.9774322509765625, "cells": [{"id": 65, "text": "its results & performance in Sec. 5. As a conclusion, we de-", "bbox": {"l": 308.862, "t": 75.20836999999995, "r": 545.11511, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "scribe how this new model-architecture can be re-purposed", "bbox": {"l": 308.862, "t": 87.16339000000005, "r": 545.11505, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "for other tasks in the computer-vision community.", "bbox": {"l": 308.862, "t": 99.11841000000004, "r": 508.08417000000003, "b": 108.02495999999985, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "section_header", "bbox": {"l": 308.862, "t": 121.73193000000003, "r": 498.28021, "b": 132.47968000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9428724646568298, "cells": [{"id": 68, "text": "2.", "bbox": {"l": 308.862, "t": 121.73193000000003, "r": 315.5831, "b": 132.47968000000003, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "Previous work and State of the Art", "bbox": {"l": 324.54456, "t": 121.73193000000003, "r": 498.28021, "b": 132.47968000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 308.862, "t": 142.22136999999998, "r": 545.11517, "b": 330.45502, "coord_origin": "TOPLEFT"}, "confidence": 0.987194836139679, "cells": [{"id": 70, "text": "Identifying the structure of a table has been an outstand-", "bbox": {"l": 320.81699, "t": 142.22136999999998, "r": 545.11493, "b": 151.12793, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "ing problem in the document-parsing community, that mo-", "bbox": {"l": 308.862, "t": 154.17638999999997, "r": 545.11505, "b": 163.08294999999998, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "tivates many organised public challenges [6, 4, 14].", "bbox": {"l": 308.862, "t": 166.13140999999996, "r": 522.55975, "b": 175.03796, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "The", "bbox": {"l": 529.62323, "t": 166.13140999999996, "r": 545.11505, "b": 175.03796, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "difficulty of the problem can be attributed to a number of", "bbox": {"l": 308.862, "t": 178.08642999999995, "r": 545.11517, "b": 186.99298, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "factors. First, there is a large variety in the shapes and sizes", "bbox": {"l": 308.862, "t": 190.04143999999997, "r": 545.11511, "b": 198.94799999999998, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "of tables.", "bbox": {"l": 308.862, "t": 201.99645999999996, "r": 346.97891, "b": 210.90301999999997, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "Such large variety requires a flexible method.", "bbox": {"l": 354.86929, "t": 201.99645999999996, "r": 545.11511, "b": 210.90301999999997, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "This is especially true for complex column- and row head-", "bbox": {"l": 308.862, "t": 213.95245, "r": 545.11505, "b": 222.85901, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "ers, which can be extremely intricate and demanding.", "bbox": {"l": 308.862, "t": 225.90747, "r": 530.9184, "b": 234.81403, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "A", "bbox": {"l": 537.92212, "t": 225.90747, "r": 545.11511, "b": 234.81403, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "second factor of complexity is the lack of data with regard", "bbox": {"l": 308.862, "t": 237.86248999999998, "r": 545.11517, "b": 246.76904000000002, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "to table-structure. Until the publication of PubTabNet [37],", "bbox": {"l": 308.862, "t": 249.8175, "r": 545.11511, "b": 258.72406, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "there were no large datasets (i.e.", "bbox": {"l": 308.862, "t": 261.77252, "r": 439.8402699999999, "b": 270.67908, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": ">", "bbox": {"l": 444.43999999999994, "t": 261.61310000000003, "r": 452.1889, "b": 270.45989999999995, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "100", "bbox": {"l": 455.89001, "t": 261.61310000000003, "r": 470.83392000000003, "b": 270.45989999999995, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "K tables) that pro-", "bbox": {"l": 470.83401, "t": 261.77252, "r": 545.11517, "b": 270.67908, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "vided structure information. This happens primarily due to", "bbox": {"l": 308.862, "t": 273.72748, "r": 545.11511, "b": 282.63406, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "the fact that tables are notoriously time-consuming to an-", "bbox": {"l": 308.862, "t": 285.6835, "r": 545.11511, "b": 294.59006, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "notate by hand. However, this has definitely changed in re-", "bbox": {"l": 308.862, "t": 297.63849, "r": 545.11511, "b": 306.54504, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "cent years with the deliverance of PubTabNet [37], FinTab-", "bbox": {"l": 308.862, "t": 309.59348, "r": 545.11517, "b": 318.50003000000004, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "Net [36], TableBank [17] etc.", "bbox": {"l": 308.862, "t": 321.54846, "r": 425.92255, "b": 330.45502, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 308.862, "t": 333.56946, "r": 545.11523, "b": 450.0729099999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9869040250778198, "cells": [{"id": 92, "text": "Before the rising popularity of deep neural networks,", "bbox": {"l": 320.81699, "t": 333.56946, "r": 545.11499, "b": 342.47601, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "the community relied heavily on heuristic and/or statistical", "bbox": {"l": 308.862, "t": 345.52444, "r": 545.11499, "b": 354.43100000000004, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "methods to do table structure identification [3, 7, 11, 5, 13,", "bbox": {"l": 308.862, "t": 357.47943, "r": 545.11517, "b": 366.38599, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "28]. Although such methods work well on constrained ta-", "bbox": {"l": 308.862, "t": 369.43542, "r": 545.11511, "b": 378.34198, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "bles [12], a more data-driven approach can be applied due", "bbox": {"l": 308.862, "t": 381.39041, "r": 545.11505, "b": 390.29697, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "to the advent of convolutional neural networks (CNNs) and", "bbox": {"l": 308.862, "t": 393.3453999999999, "r": 545.11505, "b": 402.25195, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "the availability of large datasets. To the best-of-our knowl-", "bbox": {"l": 308.862, "t": 405.30038, "r": 545.11517, "b": 414.20694, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "edge, there are currently two different types of network ar-", "bbox": {"l": 308.862, "t": 417.25537, "r": 545.11523, "b": 426.16193, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "chitecture that are being pursued for state-of-the-art table-", "bbox": {"l": 308.862, "t": 429.21136000000007, "r": 545.11511, "b": 438.11792, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "structure identification.", "bbox": {"l": 308.862, "t": 441.16635, "r": 401.28503, "b": 450.0729099999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 308.86197, "t": 453.06778, "r": 545.11688, "b": 713.151848, "coord_origin": "TOPLEFT"}, "confidence": 0.9843218326568604, "cells": [{"id": 102, "text": "Image-to-Text networks", "bbox": {"l": 320.81699, "t": 453.06778, "r": 423.26236, "b": 462.02417, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": ": In this type of network, one", "bbox": {"l": 423.26697, "t": 453.18735, "r": 545.10956, "b": 462.0939, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "predicts a sequence of tokens starting from an encoded", "bbox": {"l": 308.86197, "t": 465.14233, "r": 545.11511, "b": 474.04889, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "image.", "bbox": {"l": 308.86197, "t": 477.09732, "r": 335.7012, "b": 486.00388, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "Such sequences of tokens can be HTML table", "bbox": {"l": 345.85309, "t": 477.09732, "r": 545.11505, "b": 486.00388, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "tags [37, 17] or LaTeX symbols[10]. The choice of sym-", "bbox": {"l": 308.86197, "t": 489.05231, "r": 545.11493, "b": 497.95886, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "bols is ultimately not very important, since one can be trans-", "bbox": {"l": 308.86197, "t": 501.00729, "r": 545.11499, "b": 509.91385, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "formed into the other. There are however subtle variations", "bbox": {"l": 308.86197, "t": 512.9632899999999, "r": 545.11505, "b": 521.8698400000001, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "in the Image-to-Text networks. The easiest network archi-", "bbox": {"l": 308.86197, "t": 524.91827, "r": 545.11505, "b": 533.82483, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "tectures are \u201cimage-encoder", "bbox": {"l": 308.86197, "t": 536.87328, "r": 420.94119, "b": 545.77983, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "\u2192", "bbox": {"l": 423.59497, "t": 536.1559599999999, "r": 433.5575600000001, "b": 545.56065, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "text-decoder\u201d (IETD), sim-", "bbox": {"l": 436.21198, "t": 536.87328, "r": 545.11316, "b": 545.77983, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "ilar to network architectures that try to provide captions to", "bbox": {"l": 308.86197, "t": 548.82828, "r": 545.11511, "b": 557.73483, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "images [32]. In these IETD networks, one expects as output", "bbox": {"l": 308.86197, "t": 560.78328, "r": 545.11493, "b": 569.68983, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "the LaTeX/HTML string of the entire table, i.e. the sym-", "bbox": {"l": 308.86197, "t": 572.73828, "r": 545.11499, "b": 581.6448399999999, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "bols necessary for creating the table with the content of the", "bbox": {"l": 308.86197, "t": 584.69427, "r": 545.11505, "b": 593.60083, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "table. Another approach is the \u201cimage-encoder", "bbox": {"l": 308.86197, "t": 596.6492800000001, "r": 497.07541, "b": 605.55583, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "\u2192", "bbox": {"l": 499.80496, "t": 595.93196, "r": 509.76755, "b": 605.33665, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "dual de-", "bbox": {"l": 512.50098, "t": 596.6492800000001, "r": 545.10852, "b": 605.55583, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "coder\u201d (IEDD) networks. In these type of networks, one has", "bbox": {"l": 308.86197, "t": 608.60428, "r": 545.11511, "b": 617.5108299999999, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "two consecutive decoders with different purposes. The first", "bbox": {"l": 308.86197, "t": 620.55928, "r": 545.11505, "b": 629.46584, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "decoder is the", "bbox": {"l": 308.86197, "t": 632.51428, "r": 364.78201, "b": 641.42084, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "tag-decoder", "bbox": {"l": 367.57397, "t": 632.60394, "r": 415.61362, "b": 641.1917, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": ", i.e. it only produces the HTM-", "bbox": {"l": 415.61298, "t": 632.51428, "r": 545.11688, "b": 641.42084, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "L/LaTeX tags which construct an empty table. The second", "bbox": {"l": 308.86197, "t": 644.46928, "r": 545.11511, "b": 653.37584, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "content-decoder", "bbox": {"l": 308.86197, "t": 656.51494, "r": 373.59894, "b": 665.1027, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "uses the encoding of the image in combi-", "bbox": {"l": 376.90698, "t": 656.4252799999999, "r": 545.11548, "b": 665.33184, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "nation with the output encoding of each cell-tag (from the", "bbox": {"l": 308.862, "t": 668.38028, "r": 545.11517, "b": 677.28684, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "tag-decoder", "bbox": {"l": 308.862, "t": 680.42494, "r": 356.90164, "b": 689.0127, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": ") to generate the textual content of each table", "bbox": {"l": 357.13101, "t": 680.33528, "r": 545.1153, "b": 689.24184, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "cell. The network architecture of IEDD is certainly more", "bbox": {"l": 308.862, "t": 692.290283, "r": 545.11511, "b": 701.196846, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "elaborate, but it has the advantage that one can pre-train the", "bbox": {"l": 308.862, "t": 704.245285, "r": 545.11517, "b": 713.151848, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "page_footer", "bbox": {"l": 295.121, "t": 734.133282, "r": 300.10229, "b": 743.039845, "coord_origin": "TOPLEFT"}, "confidence": 0.8778094053268433, "cells": [{"id": 134, "text": "2", "bbox": {"l": 295.121, "t": 734.133282, "r": 300.10229, "b": 743.039845, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "text", "id": 12, "page_no": 1, "cluster": {"id": 12, "label": "text", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 286.36505, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9656890034675598, "cells": [{"id": 0, "text": "considered as a solved problem, given enough ground-truth", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 286.36505, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "data to train on.", "bbox": {"l": 50.112, "t": 87.16339000000005, "r": 112.64721999999999, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "considered as a solved problem, given enough ground-truth data to train on."}, {"label": "text", "id": 4, "page_no": 1, "cluster": {"id": 4, "label": "text", "bbox": {"l": 50.112, "t": 99.57141000000001, "r": 286.36514, "b": 228.03008999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9838606119155884, "cells": [{"id": 2, "text": "The second problem is called table-structure decompo-", "bbox": {"l": 62.067001, "t": 99.57141000000001, "r": 286.36496, "b": 108.47797000000003, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "sition.", "bbox": {"l": 50.112, "t": 111.52643, "r": 74.749512, "b": 120.43297999999993, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "The latter is a long standing problem in the com-", "bbox": {"l": 81.334793, "t": 111.52643, "r": 286.36514, "b": 120.43297999999993, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "munity of document understanding [6, 4, 14]. Contrary to", "bbox": {"l": 50.112, "t": 123.48145, "r": 286.36511, "b": 132.38800000000003, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "the table-location problem, there are no commonly used ap-", "bbox": {"l": 50.112, "t": 135.43646, "r": 286.36511, "b": 144.34302000000002, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "proaches that can easily be re-purposed to solve this prob-", "bbox": {"l": 50.112, "t": 147.39246000000003, "r": 286.36505, "b": 156.29900999999995, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "lem. Lately, a set of new model-architectures has been pro-", "bbox": {"l": 50.112, "t": 159.34747000000004, "r": 286.36511, "b": 168.25402999999994, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "posed by the community to address table-structure decom-", "bbox": {"l": 50.112, "t": 171.30249000000003, "r": 286.36508, "b": 180.20905000000005, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "position [37, 36, 18, 20]. All these models have some weak-", "bbox": {"l": 50.112, "t": 183.25751000000002, "r": 286.36511, "b": 192.16405999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "nesses (see Sec. 2). The common denominator here is the", "bbox": {"l": 50.112, "t": 195.21252000000004, "r": 286.36508, "b": 204.11908000000005, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "reliance on textual features and/or the inability to provide", "bbox": {"l": 50.112, "t": 207.16754000000003, "r": 286.36514, "b": 216.07410000000004, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "the bounding box of each table-cell in the original image.", "bbox": {"l": 50.112, "t": 219.12354000000005, "r": 278.66397, "b": 228.03008999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The second problem is called table-structure decomposition. The latter is a long standing problem in the community of document understanding [6, 4, 14]. Contrary to the table-location problem, there are no commonly used approaches that can easily be re-purposed to solve this problem. Lately, a set of new model-architectures has been proposed by the community to address table-structure decomposition [37, 36, 18, 20]. All these models have some weaknesses (see Sec. 2). The common denominator here is the reliance on textual features and/or the inability to provide the bounding box of each table-cell in the original image."}, {"label": "text", "id": 2, "page_no": 1, "cluster": {"id": 2, "label": "text", "bbox": {"l": 50.112, "t": 231.53156, "r": 286.36511, "b": 371.94507, "coord_origin": "TOPLEFT"}, "confidence": 0.9855920076370239, "cells": [{"id": 14, "text": "In this paper, we want to address these weaknesses and", "bbox": {"l": 62.067001, "t": 231.53156, "r": 286.36493, "b": 240.43811000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "present a robust table-structure decomposition algorithm.", "bbox": {"l": 50.112, "t": 243.48657000000003, "r": 286.36511, "b": 252.39313000000004, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "The design criteria for our model are the following. First,", "bbox": {"l": 50.112, "t": 255.44159000000002, "r": 286.36511, "b": 264.34813999999994, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "we want our algorithm to be language agnostic. In this way,", "bbox": {"l": 50.112, "t": 267.39661, "r": 286.36502, "b": 276.30316000000005, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "we can obtain the structure of any table, irregardless of the", "bbox": {"l": 50.112, "t": 279.35155999999995, "r": 286.36508, "b": 288.25815, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "language.", "bbox": {"l": 50.112, "t": 291.30759, "r": 88.567635, "b": 300.21414, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Second, we want our algorithm to leverage as", "bbox": {"l": 95.501602, "t": 291.30759, "r": 286.36505, "b": 300.21414, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "much data as possible from the original PDF document. For", "bbox": {"l": 50.112, "t": 303.26257, "r": 286.36508, "b": 312.16913, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "programmatic PDF documents, the text-cells can often be", "bbox": {"l": 50.112, "t": 315.21756, "r": 286.36511, "b": 324.12411, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "extracted much faster and with higher accuracy compared", "bbox": {"l": 50.112, "t": 327.17255, "r": 286.36505, "b": 336.0791, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "to OCR methods. Last but not least, we want to have a di-", "bbox": {"l": 50.112, "t": 339.12753, "r": 286.36511, "b": 348.03409, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "rect link between the table-cell and its bounding box in the", "bbox": {"l": 50.112, "t": 351.08353, "r": 286.36508, "b": 359.99008, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "image.", "bbox": {"l": 50.112, "t": 363.03851, "r": 76.951241, "b": 371.94507, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In this paper, we want to address these weaknesses and present a robust table-structure decomposition algorithm. The design criteria for our model are the following. First, we want our algorithm to be language agnostic. In this way, we can obtain the structure of any table, irregardless of the language. Second, we want our algorithm to leverage as much data as possible from the original PDF document. For programmatic PDF documents, the text-cells can often be extracted much faster and with higher accuracy compared to OCR methods. Last but not least, we want to have a direct link between the table-cell and its bounding box in the image."}, {"label": "text", "id": 7, "page_no": 1, "cluster": {"id": 7, "label": "text", "bbox": {"l": 50.112, "t": 375.4465, "r": 286.36658, "b": 432.173, "coord_origin": "TOPLEFT"}, "confidence": 0.9820111393928528, "cells": [{"id": 27, "text": "To meet the design criteria listed above, we developed a", "bbox": {"l": 62.067001, "t": 375.4465, "r": 286.36499, "b": 384.35306, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "new model called", "bbox": {"l": 50.112, "t": 387.40149, "r": 120.98594, "b": 396.30804, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "TableFormer", "bbox": {"l": 123.901, "t": 387.28192, "r": 179.7314, "b": 396.23830999999996, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "and a synthetically gener-", "bbox": {"l": 182.646, "t": 387.40149, "r": 286.36658, "b": 396.30804, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "ated table structure dataset called", "bbox": {"l": 50.112, "t": 399.35648, "r": 181.75778, "b": 408.26302999999996, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "SynthTabNet", "bbox": {"l": 184.104, "t": 399.23690999999997, "r": 240.2034, "b": 408.1933, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "$^{1}$. In partic-", "bbox": {"l": 240.20401, "t": 399.35648, "r": 286.36069, "b": 408.26302999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "ular, our contributions in this work can be summarised as", "bbox": {"l": 50.112015, "t": 411.31146, "r": 286.36511, "b": 420.21802, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "follows:", "bbox": {"l": 50.112015, "t": 423.26645, "r": 82.520355, "b": 432.173, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "To meet the design criteria listed above, we developed a new model called TableFormer and a synthetically generated table structure dataset called SynthTabNet $^{1}$. In particular, our contributions in this work can be summarised as follows:"}, {"label": "list_item", "id": 6, "page_no": 1, "cluster": {"id": 6, "label": "list_item", "bbox": {"l": 61.569016, "t": 444.43188, "r": 286.3649, "b": 489.32297, "coord_origin": "TOPLEFT"}, "confidence": 0.9822162389755249, "cells": [{"id": 36, "text": "\u2022", "bbox": {"l": 61.569016, "t": 444.55145, "r": 70.741714, "b": 453.45801, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "We propose", "bbox": {"l": 73.034889, "t": 444.55145, "r": 117.10054, "b": 453.45801, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "TableFormer", "bbox": {"l": 119.59001, "t": 444.43188, "r": 175.42041, "b": 453.38828, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": ", a transformer based model", "bbox": {"l": 175.42102, "t": 444.55145, "r": 286.36453, "b": 453.45801, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "that predicts tables structure and bounding boxes for", "bbox": {"l": 70.037018, "t": 456.50644000000005, "r": 286.3649, "b": 465.41299, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "the table content simultaneously in an end-to-end ap-", "bbox": {"l": 70.037018, "t": 468.46143, "r": 286.3649, "b": 477.36798, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "proach.", "bbox": {"l": 70.037018, "t": 480.41641, "r": 99.635902, "b": 489.32297, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u2022 We propose TableFormer , a transformer based model that predicts tables structure and bounding boxes for the table content simultaneously in an end-to-end approach."}, {"label": "list_item", "id": 5, "page_no": 1, "cluster": {"id": 5, "label": "list_item", "bbox": {"l": 61.569016, "t": 502.03384, "r": 286.3649, "b": 546.9259500000001, "coord_origin": "TOPLEFT"}, "confidence": 0.982271671295166, "cells": [{"id": 43, "text": "\u2022", "bbox": {"l": 61.569016, "t": 502.15341, "r": 71.619438, "b": 511.05997, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "Across all benchmark datasets", "bbox": {"l": 74.132042, "t": 502.15341, "r": 196.10396, "b": 511.05997, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "TableFormer", "bbox": {"l": 200.31001, "t": 502.03384, "r": 256.14041, "b": 510.99023, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "signif-", "bbox": {"l": 260.35001, "t": 502.15341, "r": 286.36237, "b": 511.05997, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "icantly outperforms existing state-of-the-art metrics,", "bbox": {"l": 70.037003, "t": 514.1084000000001, "r": 286.3649, "b": 523.01495, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "while being much more efficient in training and infer-", "bbox": {"l": 70.037003, "t": 526.06439, "r": 286.36487, "b": 534.97095, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "ence to existing works.", "bbox": {"l": 70.037003, "t": 538.0193899999999, "r": 161.65305, "b": 546.9259500000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u2022 Across all benchmark datasets TableFormer significantly outperforms existing state-of-the-art metrics, while being much more efficient in training and inference to existing works."}, {"label": "list_item", "id": 9, "page_no": 1, "cluster": {"id": 9, "label": "list_item", "bbox": {"l": 61.569, "t": 559.63684, "r": 286.36493, "b": 592.57295, "coord_origin": "TOPLEFT"}, "confidence": 0.9802963733673096, "cells": [{"id": 50, "text": "\u2022", "bbox": {"l": 61.569, "t": 559.75639, "r": 71.115913, "b": 568.66295, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "We present", "bbox": {"l": 73.502647, "t": 559.75639, "r": 116.71199, "b": 568.66295, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "SynthTabNet", "bbox": {"l": 121.583, "t": 559.63684, "r": 177.68239, "b": 568.59322, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "a synthetically generated", "bbox": {"l": 182.55301, "t": 559.75639, "r": 286.36328, "b": 568.66295, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "dataset, with various appearance styles and complex-", "bbox": {"l": 70.03701, "t": 571.7114, "r": 286.36493, "b": 580.6179500000001, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "ity.", "bbox": {"l": 70.03701, "t": 583.6664000000001, "r": 82.400597, "b": 592.57295, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u2022 We present SynthTabNet a synthetically generated dataset, with various appearance styles and complexity."}, {"label": "list_item", "id": 8, "page_no": 1, "cluster": {"id": 8, "label": "list_item", "bbox": {"l": 61.569008000000004, "t": 605.4034, "r": 286.36508, "b": 638.22095, "coord_origin": "TOPLEFT"}, "confidence": 0.9806395173072815, "cells": [{"id": 56, "text": "\u2022", "bbox": {"l": 61.569008000000004, "t": 605.4034, "r": 72.332527, "b": 614.30995, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "An augmented dataset based on PubTabNet [37],", "bbox": {"l": 75.023399, "t": 605.4034, "r": 286.36508, "b": 614.30995, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "FinTabNet [36], and TableBank [17] with generated", "bbox": {"l": 70.03701, "t": 617.3584, "r": 286.36487, "b": 626.26495, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "ground-truth for reproducibility.", "bbox": {"l": 70.03701, "t": 629.31439, "r": 198.05641, "b": 638.22095, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u2022 An augmented dataset based on PubTabNet [37], FinTabNet [36], and TableBank [17] with generated ground-truth for reproducibility."}, {"label": "text", "id": 11, "page_no": 1, "cluster": {"id": 11, "label": "text", "bbox": {"l": 50.112007, "t": 650.59839, "r": 286.36511, "b": 695.369957, "coord_origin": "TOPLEFT"}, "confidence": 0.9742533564567566, "cells": [{"id": 60, "text": "The paper is structured as follows. In Sec. 2, we give", "bbox": {"l": 62.067009000000006, "t": 650.59839, "r": 286.36496, "b": 659.50494, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "a brief overview of the current state-of-the-art. In Sec. 3,", "bbox": {"l": 50.112007, "t": 662.55339, "r": 286.36511, "b": 671.45995, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "we describe the datasets on which we train. In Sec. 4, we", "bbox": {"l": 50.112007, "t": 674.50839, "r": 286.36511, "b": 683.41496, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "introduce the TableFormer model-architecture and describe", "bbox": {"l": 50.112007, "t": 686.46339, "r": 286.36511, "b": 695.369957, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The paper is structured as follows. In Sec. 2, we give a brief overview of the current state-of-the-art. In Sec. 3, we describe the datasets on which we train. In Sec. 4, we introduce the TableFormer model-architecture and describe"}, {"label": "footnote", "id": 14, "page_no": 1, "cluster": {"id": 14, "label": "footnote", "bbox": {"l": 60.97100100000001, "t": 705.596275, "r": 183.73055, "b": 712.721542, "coord_origin": "TOPLEFT"}, "confidence": 0.895367443561554, "cells": [{"id": 64, "text": "$^{1}$https://github.com/IBM/SynthTabNet", "bbox": {"l": 60.97100100000001, "t": 705.596275, "r": 183.73055, "b": 712.721542, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "$^{1}$https://github.com/IBM/SynthTabNet"}, {"label": "text", "id": 10, "page_no": 1, "cluster": {"id": 10, "label": "text", "bbox": {"l": 308.862, "t": 75.20836999999995, "r": 545.11511, "b": 108.02495999999985, "coord_origin": "TOPLEFT"}, "confidence": 0.9774322509765625, "cells": [{"id": 65, "text": "its results & performance in Sec. 5. As a conclusion, we de-", "bbox": {"l": 308.862, "t": 75.20836999999995, "r": 545.11511, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "scribe how this new model-architecture can be re-purposed", "bbox": {"l": 308.862, "t": 87.16339000000005, "r": 545.11505, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "for other tasks in the computer-vision community.", "bbox": {"l": 308.862, "t": 99.11841000000004, "r": 508.08417000000003, "b": 108.02495999999985, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "its results & performance in Sec. 5. As a conclusion, we describe how this new model-architecture can be re-purposed for other tasks in the computer-vision community."}, {"label": "section_header", "id": 13, "page_no": 1, "cluster": {"id": 13, "label": "section_header", "bbox": {"l": 308.862, "t": 121.73193000000003, "r": 498.28021, "b": 132.47968000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9428724646568298, "cells": [{"id": 68, "text": "2.", "bbox": {"l": 308.862, "t": 121.73193000000003, "r": 315.5831, "b": 132.47968000000003, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "Previous work and State of the Art", "bbox": {"l": 324.54456, "t": 121.73193000000003, "r": 498.28021, "b": 132.47968000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2. Previous work and State of the Art"}, {"label": "text", "id": 0, "page_no": 1, "cluster": {"id": 0, "label": "text", "bbox": {"l": 308.862, "t": 142.22136999999998, "r": 545.11517, "b": 330.45502, "coord_origin": "TOPLEFT"}, "confidence": 0.987194836139679, "cells": [{"id": 70, "text": "Identifying the structure of a table has been an outstand-", "bbox": {"l": 320.81699, "t": 142.22136999999998, "r": 545.11493, "b": 151.12793, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "ing problem in the document-parsing community, that mo-", "bbox": {"l": 308.862, "t": 154.17638999999997, "r": 545.11505, "b": 163.08294999999998, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "tivates many organised public challenges [6, 4, 14].", "bbox": {"l": 308.862, "t": 166.13140999999996, "r": 522.55975, "b": 175.03796, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "The", "bbox": {"l": 529.62323, "t": 166.13140999999996, "r": 545.11505, "b": 175.03796, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "difficulty of the problem can be attributed to a number of", "bbox": {"l": 308.862, "t": 178.08642999999995, "r": 545.11517, "b": 186.99298, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "factors. First, there is a large variety in the shapes and sizes", "bbox": {"l": 308.862, "t": 190.04143999999997, "r": 545.11511, "b": 198.94799999999998, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "of tables.", "bbox": {"l": 308.862, "t": 201.99645999999996, "r": 346.97891, "b": 210.90301999999997, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "Such large variety requires a flexible method.", "bbox": {"l": 354.86929, "t": 201.99645999999996, "r": 545.11511, "b": 210.90301999999997, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "This is especially true for complex column- and row head-", "bbox": {"l": 308.862, "t": 213.95245, "r": 545.11505, "b": 222.85901, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "ers, which can be extremely intricate and demanding.", "bbox": {"l": 308.862, "t": 225.90747, "r": 530.9184, "b": 234.81403, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "A", "bbox": {"l": 537.92212, "t": 225.90747, "r": 545.11511, "b": 234.81403, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "second factor of complexity is the lack of data with regard", "bbox": {"l": 308.862, "t": 237.86248999999998, "r": 545.11517, "b": 246.76904000000002, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "to table-structure. Until the publication of PubTabNet [37],", "bbox": {"l": 308.862, "t": 249.8175, "r": 545.11511, "b": 258.72406, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "there were no large datasets (i.e.", "bbox": {"l": 308.862, "t": 261.77252, "r": 439.8402699999999, "b": 270.67908, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": ">", "bbox": {"l": 444.43999999999994, "t": 261.61310000000003, "r": 452.1889, "b": 270.45989999999995, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "100", "bbox": {"l": 455.89001, "t": 261.61310000000003, "r": 470.83392000000003, "b": 270.45989999999995, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "K tables) that pro-", "bbox": {"l": 470.83401, "t": 261.77252, "r": 545.11517, "b": 270.67908, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "vided structure information. This happens primarily due to", "bbox": {"l": 308.862, "t": 273.72748, "r": 545.11511, "b": 282.63406, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "the fact that tables are notoriously time-consuming to an-", "bbox": {"l": 308.862, "t": 285.6835, "r": 545.11511, "b": 294.59006, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "notate by hand. However, this has definitely changed in re-", "bbox": {"l": 308.862, "t": 297.63849, "r": 545.11511, "b": 306.54504, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "cent years with the deliverance of PubTabNet [37], FinTab-", "bbox": {"l": 308.862, "t": 309.59348, "r": 545.11517, "b": 318.50003000000004, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "Net [36], TableBank [17] etc.", "bbox": {"l": 308.862, "t": 321.54846, "r": 425.92255, "b": 330.45502, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Identifying the structure of a table has been an outstanding problem in the document-parsing community, that motivates many organised public challenges [6, 4, 14]. The difficulty of the problem can be attributed to a number of factors. First, there is a large variety in the shapes and sizes of tables. Such large variety requires a flexible method. This is especially true for complex column- and row headers, which can be extremely intricate and demanding. A second factor of complexity is the lack of data with regard to table-structure. Until the publication of PubTabNet [37], there were no large datasets (i.e. > 100 K tables) that provided structure information. This happens primarily due to the fact that tables are notoriously time-consuming to annotate by hand. However, this has definitely changed in recent years with the deliverance of PubTabNet [37], FinTabNet [36], TableBank [17] etc."}, {"label": "text", "id": 1, "page_no": 1, "cluster": {"id": 1, "label": "text", "bbox": {"l": 308.862, "t": 333.56946, "r": 545.11523, "b": 450.0729099999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9869040250778198, "cells": [{"id": 92, "text": "Before the rising popularity of deep neural networks,", "bbox": {"l": 320.81699, "t": 333.56946, "r": 545.11499, "b": 342.47601, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "the community relied heavily on heuristic and/or statistical", "bbox": {"l": 308.862, "t": 345.52444, "r": 545.11499, "b": 354.43100000000004, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "methods to do table structure identification [3, 7, 11, 5, 13,", "bbox": {"l": 308.862, "t": 357.47943, "r": 545.11517, "b": 366.38599, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "28]. Although such methods work well on constrained ta-", "bbox": {"l": 308.862, "t": 369.43542, "r": 545.11511, "b": 378.34198, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "bles [12], a more data-driven approach can be applied due", "bbox": {"l": 308.862, "t": 381.39041, "r": 545.11505, "b": 390.29697, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "to the advent of convolutional neural networks (CNNs) and", "bbox": {"l": 308.862, "t": 393.3453999999999, "r": 545.11505, "b": 402.25195, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "the availability of large datasets. To the best-of-our knowl-", "bbox": {"l": 308.862, "t": 405.30038, "r": 545.11517, "b": 414.20694, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "edge, there are currently two different types of network ar-", "bbox": {"l": 308.862, "t": 417.25537, "r": 545.11523, "b": 426.16193, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "chitecture that are being pursued for state-of-the-art table-", "bbox": {"l": 308.862, "t": 429.21136000000007, "r": 545.11511, "b": 438.11792, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "structure identification.", "bbox": {"l": 308.862, "t": 441.16635, "r": 401.28503, "b": 450.0729099999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Before the rising popularity of deep neural networks, the community relied heavily on heuristic and/or statistical methods to do table structure identification [3, 7, 11, 5, 13, 28]. Although such methods work well on constrained tables [12], a more data-driven approach can be applied due to the advent of convolutional neural networks (CNNs) and the availability of large datasets. To the best-of-our knowledge, there are currently two different types of network architecture that are being pursued for state-of-the-art tablestructure identification."}, {"label": "text", "id": 3, "page_no": 1, "cluster": {"id": 3, "label": "text", "bbox": {"l": 308.86197, "t": 453.06778, "r": 545.11688, "b": 713.151848, "coord_origin": "TOPLEFT"}, "confidence": 0.9843218326568604, "cells": [{"id": 102, "text": "Image-to-Text networks", "bbox": {"l": 320.81699, "t": 453.06778, "r": 423.26236, "b": 462.02417, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": ": In this type of network, one", "bbox": {"l": 423.26697, "t": 453.18735, "r": 545.10956, "b": 462.0939, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "predicts a sequence of tokens starting from an encoded", "bbox": {"l": 308.86197, "t": 465.14233, "r": 545.11511, "b": 474.04889, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "image.", "bbox": {"l": 308.86197, "t": 477.09732, "r": 335.7012, "b": 486.00388, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "Such sequences of tokens can be HTML table", "bbox": {"l": 345.85309, "t": 477.09732, "r": 545.11505, "b": 486.00388, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "tags [37, 17] or LaTeX symbols[10]. The choice of sym-", "bbox": {"l": 308.86197, "t": 489.05231, "r": 545.11493, "b": 497.95886, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "bols is ultimately not very important, since one can be trans-", "bbox": {"l": 308.86197, "t": 501.00729, "r": 545.11499, "b": 509.91385, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "formed into the other. There are however subtle variations", "bbox": {"l": 308.86197, "t": 512.9632899999999, "r": 545.11505, "b": 521.8698400000001, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "in the Image-to-Text networks. The easiest network archi-", "bbox": {"l": 308.86197, "t": 524.91827, "r": 545.11505, "b": 533.82483, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "tectures are \u201cimage-encoder", "bbox": {"l": 308.86197, "t": 536.87328, "r": 420.94119, "b": 545.77983, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "\u2192", "bbox": {"l": 423.59497, "t": 536.1559599999999, "r": 433.5575600000001, "b": 545.56065, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "text-decoder\u201d (IETD), sim-", "bbox": {"l": 436.21198, "t": 536.87328, "r": 545.11316, "b": 545.77983, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "ilar to network architectures that try to provide captions to", "bbox": {"l": 308.86197, "t": 548.82828, "r": 545.11511, "b": 557.73483, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "images [32]. In these IETD networks, one expects as output", "bbox": {"l": 308.86197, "t": 560.78328, "r": 545.11493, "b": 569.68983, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "the LaTeX/HTML string of the entire table, i.e. the sym-", "bbox": {"l": 308.86197, "t": 572.73828, "r": 545.11499, "b": 581.6448399999999, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "bols necessary for creating the table with the content of the", "bbox": {"l": 308.86197, "t": 584.69427, "r": 545.11505, "b": 593.60083, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "table. Another approach is the \u201cimage-encoder", "bbox": {"l": 308.86197, "t": 596.6492800000001, "r": 497.07541, "b": 605.55583, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "\u2192", "bbox": {"l": 499.80496, "t": 595.93196, "r": 509.76755, "b": 605.33665, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "dual de-", "bbox": {"l": 512.50098, "t": 596.6492800000001, "r": 545.10852, "b": 605.55583, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "coder\u201d (IEDD) networks. In these type of networks, one has", "bbox": {"l": 308.86197, "t": 608.60428, "r": 545.11511, "b": 617.5108299999999, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "two consecutive decoders with different purposes. The first", "bbox": {"l": 308.86197, "t": 620.55928, "r": 545.11505, "b": 629.46584, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "decoder is the", "bbox": {"l": 308.86197, "t": 632.51428, "r": 364.78201, "b": 641.42084, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "tag-decoder", "bbox": {"l": 367.57397, "t": 632.60394, "r": 415.61362, "b": 641.1917, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": ", i.e. it only produces the HTM-", "bbox": {"l": 415.61298, "t": 632.51428, "r": 545.11688, "b": 641.42084, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "L/LaTeX tags which construct an empty table. The second", "bbox": {"l": 308.86197, "t": 644.46928, "r": 545.11511, "b": 653.37584, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "content-decoder", "bbox": {"l": 308.86197, "t": 656.51494, "r": 373.59894, "b": 665.1027, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "uses the encoding of the image in combi-", "bbox": {"l": 376.90698, "t": 656.4252799999999, "r": 545.11548, "b": 665.33184, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "nation with the output encoding of each cell-tag (from the", "bbox": {"l": 308.862, "t": 668.38028, "r": 545.11517, "b": 677.28684, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "tag-decoder", "bbox": {"l": 308.862, "t": 680.42494, "r": 356.90164, "b": 689.0127, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": ") to generate the textual content of each table", "bbox": {"l": 357.13101, "t": 680.33528, "r": 545.1153, "b": 689.24184, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "cell. The network architecture of IEDD is certainly more", "bbox": {"l": 308.862, "t": 692.290283, "r": 545.11511, "b": 701.196846, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "elaborate, but it has the advantage that one can pre-train the", "bbox": {"l": 308.862, "t": 704.245285, "r": 545.11517, "b": 713.151848, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Image-to-Text networks : In this type of network, one predicts a sequence of tokens starting from an encoded image. Such sequences of tokens can be HTML table tags [37, 17] or LaTeX symbols[10]. The choice of symbols is ultimately not very important, since one can be transformed into the other. There are however subtle variations in the Image-to-Text networks. The easiest network architectures are \u201cimage-encoder \u2192 text-decoder\u201d (IETD), similar to network architectures that try to provide captions to images [32]. In these IETD networks, one expects as output the LaTeX/HTML string of the entire table, i.e. the symbols necessary for creating the table with the content of the table. Another approach is the \u201cimage-encoder \u2192 dual decoder\u201d (IEDD) networks. In these type of networks, one has two consecutive decoders with different purposes. The first decoder is the tag-decoder , i.e. it only produces the HTML/LaTeX tags which construct an empty table. The second content-decoder uses the encoding of the image in combination with the output encoding of each cell-tag (from the tag-decoder ) to generate the textual content of each table cell. The network architecture of IEDD is certainly more elaborate, but it has the advantage that one can pre-train the"}, {"label": "page_footer", "id": 15, "page_no": 1, "cluster": {"id": 15, "label": "page_footer", "bbox": {"l": 295.121, "t": 734.133282, "r": 300.10229, "b": 743.039845, "coord_origin": "TOPLEFT"}, "confidence": 0.8778094053268433, "cells": [{"id": 134, "text": "2", "bbox": {"l": 295.121, "t": 734.133282, "r": 300.10229, "b": 743.039845, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2"}], "body": [{"label": "text", "id": 12, "page_no": 1, "cluster": {"id": 12, "label": "text", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 286.36505, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9656890034675598, "cells": [{"id": 0, "text": "considered as a solved problem, given enough ground-truth", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 286.36505, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "data to train on.", "bbox": {"l": 50.112, "t": 87.16339000000005, "r": 112.64721999999999, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "considered as a solved problem, given enough ground-truth data to train on."}, {"label": "text", "id": 4, "page_no": 1, "cluster": {"id": 4, "label": "text", "bbox": {"l": 50.112, "t": 99.57141000000001, "r": 286.36514, "b": 228.03008999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9838606119155884, "cells": [{"id": 2, "text": "The second problem is called table-structure decompo-", "bbox": {"l": 62.067001, "t": 99.57141000000001, "r": 286.36496, "b": 108.47797000000003, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "sition.", "bbox": {"l": 50.112, "t": 111.52643, "r": 74.749512, "b": 120.43297999999993, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "The latter is a long standing problem in the com-", "bbox": {"l": 81.334793, "t": 111.52643, "r": 286.36514, "b": 120.43297999999993, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "munity of document understanding [6, 4, 14]. Contrary to", "bbox": {"l": 50.112, "t": 123.48145, "r": 286.36511, "b": 132.38800000000003, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "the table-location problem, there are no commonly used ap-", "bbox": {"l": 50.112, "t": 135.43646, "r": 286.36511, "b": 144.34302000000002, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "proaches that can easily be re-purposed to solve this prob-", "bbox": {"l": 50.112, "t": 147.39246000000003, "r": 286.36505, "b": 156.29900999999995, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "lem. Lately, a set of new model-architectures has been pro-", "bbox": {"l": 50.112, "t": 159.34747000000004, "r": 286.36511, "b": 168.25402999999994, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "posed by the community to address table-structure decom-", "bbox": {"l": 50.112, "t": 171.30249000000003, "r": 286.36508, "b": 180.20905000000005, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "position [37, 36, 18, 20]. All these models have some weak-", "bbox": {"l": 50.112, "t": 183.25751000000002, "r": 286.36511, "b": 192.16405999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "nesses (see Sec. 2). The common denominator here is the", "bbox": {"l": 50.112, "t": 195.21252000000004, "r": 286.36508, "b": 204.11908000000005, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "reliance on textual features and/or the inability to provide", "bbox": {"l": 50.112, "t": 207.16754000000003, "r": 286.36514, "b": 216.07410000000004, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "the bounding box of each table-cell in the original image.", "bbox": {"l": 50.112, "t": 219.12354000000005, "r": 278.66397, "b": 228.03008999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The second problem is called table-structure decomposition. The latter is a long standing problem in the community of document understanding [6, 4, 14]. Contrary to the table-location problem, there are no commonly used approaches that can easily be re-purposed to solve this problem. Lately, a set of new model-architectures has been proposed by the community to address table-structure decomposition [37, 36, 18, 20]. All these models have some weaknesses (see Sec. 2). The common denominator here is the reliance on textual features and/or the inability to provide the bounding box of each table-cell in the original image."}, {"label": "text", "id": 2, "page_no": 1, "cluster": {"id": 2, "label": "text", "bbox": {"l": 50.112, "t": 231.53156, "r": 286.36511, "b": 371.94507, "coord_origin": "TOPLEFT"}, "confidence": 0.9855920076370239, "cells": [{"id": 14, "text": "In this paper, we want to address these weaknesses and", "bbox": {"l": 62.067001, "t": 231.53156, "r": 286.36493, "b": 240.43811000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "present a robust table-structure decomposition algorithm.", "bbox": {"l": 50.112, "t": 243.48657000000003, "r": 286.36511, "b": 252.39313000000004, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "The design criteria for our model are the following. First,", "bbox": {"l": 50.112, "t": 255.44159000000002, "r": 286.36511, "b": 264.34813999999994, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "we want our algorithm to be language agnostic. In this way,", "bbox": {"l": 50.112, "t": 267.39661, "r": 286.36502, "b": 276.30316000000005, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "we can obtain the structure of any table, irregardless of the", "bbox": {"l": 50.112, "t": 279.35155999999995, "r": 286.36508, "b": 288.25815, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "language.", "bbox": {"l": 50.112, "t": 291.30759, "r": 88.567635, "b": 300.21414, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Second, we want our algorithm to leverage as", "bbox": {"l": 95.501602, "t": 291.30759, "r": 286.36505, "b": 300.21414, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "much data as possible from the original PDF document. For", "bbox": {"l": 50.112, "t": 303.26257, "r": 286.36508, "b": 312.16913, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "programmatic PDF documents, the text-cells can often be", "bbox": {"l": 50.112, "t": 315.21756, "r": 286.36511, "b": 324.12411, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "extracted much faster and with higher accuracy compared", "bbox": {"l": 50.112, "t": 327.17255, "r": 286.36505, "b": 336.0791, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "to OCR methods. Last but not least, we want to have a di-", "bbox": {"l": 50.112, "t": 339.12753, "r": 286.36511, "b": 348.03409, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "rect link between the table-cell and its bounding box in the", "bbox": {"l": 50.112, "t": 351.08353, "r": 286.36508, "b": 359.99008, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "image.", "bbox": {"l": 50.112, "t": 363.03851, "r": 76.951241, "b": 371.94507, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In this paper, we want to address these weaknesses and present a robust table-structure decomposition algorithm. The design criteria for our model are the following. First, we want our algorithm to be language agnostic. In this way, we can obtain the structure of any table, irregardless of the language. Second, we want our algorithm to leverage as much data as possible from the original PDF document. For programmatic PDF documents, the text-cells can often be extracted much faster and with higher accuracy compared to OCR methods. Last but not least, we want to have a direct link between the table-cell and its bounding box in the image."}, {"label": "text", "id": 7, "page_no": 1, "cluster": {"id": 7, "label": "text", "bbox": {"l": 50.112, "t": 375.4465, "r": 286.36658, "b": 432.173, "coord_origin": "TOPLEFT"}, "confidence": 0.9820111393928528, "cells": [{"id": 27, "text": "To meet the design criteria listed above, we developed a", "bbox": {"l": 62.067001, "t": 375.4465, "r": 286.36499, "b": 384.35306, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "new model called", "bbox": {"l": 50.112, "t": 387.40149, "r": 120.98594, "b": 396.30804, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "TableFormer", "bbox": {"l": 123.901, "t": 387.28192, "r": 179.7314, "b": 396.23830999999996, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "and a synthetically gener-", "bbox": {"l": 182.646, "t": 387.40149, "r": 286.36658, "b": 396.30804, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "ated table structure dataset called", "bbox": {"l": 50.112, "t": 399.35648, "r": 181.75778, "b": 408.26302999999996, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "SynthTabNet", "bbox": {"l": 184.104, "t": 399.23690999999997, "r": 240.2034, "b": 408.1933, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "$^{1}$. In partic-", "bbox": {"l": 240.20401, "t": 399.35648, "r": 286.36069, "b": 408.26302999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "ular, our contributions in this work can be summarised as", "bbox": {"l": 50.112015, "t": 411.31146, "r": 286.36511, "b": 420.21802, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "follows:", "bbox": {"l": 50.112015, "t": 423.26645, "r": 82.520355, "b": 432.173, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "To meet the design criteria listed above, we developed a new model called TableFormer and a synthetically generated table structure dataset called SynthTabNet $^{1}$. In particular, our contributions in this work can be summarised as follows:"}, {"label": "list_item", "id": 6, "page_no": 1, "cluster": {"id": 6, "label": "list_item", "bbox": {"l": 61.569016, "t": 444.43188, "r": 286.3649, "b": 489.32297, "coord_origin": "TOPLEFT"}, "confidence": 0.9822162389755249, "cells": [{"id": 36, "text": "\u2022", "bbox": {"l": 61.569016, "t": 444.55145, "r": 70.741714, "b": 453.45801, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "We propose", "bbox": {"l": 73.034889, "t": 444.55145, "r": 117.10054, "b": 453.45801, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "TableFormer", "bbox": {"l": 119.59001, "t": 444.43188, "r": 175.42041, "b": 453.38828, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": ", a transformer based model", "bbox": {"l": 175.42102, "t": 444.55145, "r": 286.36453, "b": 453.45801, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "that predicts tables structure and bounding boxes for", "bbox": {"l": 70.037018, "t": 456.50644000000005, "r": 286.3649, "b": 465.41299, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "the table content simultaneously in an end-to-end ap-", "bbox": {"l": 70.037018, "t": 468.46143, "r": 286.3649, "b": 477.36798, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "proach.", "bbox": {"l": 70.037018, "t": 480.41641, "r": 99.635902, "b": 489.32297, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u2022 We propose TableFormer , a transformer based model that predicts tables structure and bounding boxes for the table content simultaneously in an end-to-end approach."}, {"label": "list_item", "id": 5, "page_no": 1, "cluster": {"id": 5, "label": "list_item", "bbox": {"l": 61.569016, "t": 502.03384, "r": 286.3649, "b": 546.9259500000001, "coord_origin": "TOPLEFT"}, "confidence": 0.982271671295166, "cells": [{"id": 43, "text": "\u2022", "bbox": {"l": 61.569016, "t": 502.15341, "r": 71.619438, "b": 511.05997, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "Across all benchmark datasets", "bbox": {"l": 74.132042, "t": 502.15341, "r": 196.10396, "b": 511.05997, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "TableFormer", "bbox": {"l": 200.31001, "t": 502.03384, "r": 256.14041, "b": 510.99023, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "signif-", "bbox": {"l": 260.35001, "t": 502.15341, "r": 286.36237, "b": 511.05997, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "icantly outperforms existing state-of-the-art metrics,", "bbox": {"l": 70.037003, "t": 514.1084000000001, "r": 286.3649, "b": 523.01495, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "while being much more efficient in training and infer-", "bbox": {"l": 70.037003, "t": 526.06439, "r": 286.36487, "b": 534.97095, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "ence to existing works.", "bbox": {"l": 70.037003, "t": 538.0193899999999, "r": 161.65305, "b": 546.9259500000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u2022 Across all benchmark datasets TableFormer significantly outperforms existing state-of-the-art metrics, while being much more efficient in training and inference to existing works."}, {"label": "list_item", "id": 9, "page_no": 1, "cluster": {"id": 9, "label": "list_item", "bbox": {"l": 61.569, "t": 559.63684, "r": 286.36493, "b": 592.57295, "coord_origin": "TOPLEFT"}, "confidence": 0.9802963733673096, "cells": [{"id": 50, "text": "\u2022", "bbox": {"l": 61.569, "t": 559.75639, "r": 71.115913, "b": 568.66295, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "We present", "bbox": {"l": 73.502647, "t": 559.75639, "r": 116.71199, "b": 568.66295, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "SynthTabNet", "bbox": {"l": 121.583, "t": 559.63684, "r": 177.68239, "b": 568.59322, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "a synthetically generated", "bbox": {"l": 182.55301, "t": 559.75639, "r": 286.36328, "b": 568.66295, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "dataset, with various appearance styles and complex-", "bbox": {"l": 70.03701, "t": 571.7114, "r": 286.36493, "b": 580.6179500000001, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "ity.", "bbox": {"l": 70.03701, "t": 583.6664000000001, "r": 82.400597, "b": 592.57295, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u2022 We present SynthTabNet a synthetically generated dataset, with various appearance styles and complexity."}, {"label": "list_item", "id": 8, "page_no": 1, "cluster": {"id": 8, "label": "list_item", "bbox": {"l": 61.569008000000004, "t": 605.4034, "r": 286.36508, "b": 638.22095, "coord_origin": "TOPLEFT"}, "confidence": 0.9806395173072815, "cells": [{"id": 56, "text": "\u2022", "bbox": {"l": 61.569008000000004, "t": 605.4034, "r": 72.332527, "b": 614.30995, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "An augmented dataset based on PubTabNet [37],", "bbox": {"l": 75.023399, "t": 605.4034, "r": 286.36508, "b": 614.30995, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "FinTabNet [36], and TableBank [17] with generated", "bbox": {"l": 70.03701, "t": 617.3584, "r": 286.36487, "b": 626.26495, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "ground-truth for reproducibility.", "bbox": {"l": 70.03701, "t": 629.31439, "r": 198.05641, "b": 638.22095, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u2022 An augmented dataset based on PubTabNet [37], FinTabNet [36], and TableBank [17] with generated ground-truth for reproducibility."}, {"label": "text", "id": 11, "page_no": 1, "cluster": {"id": 11, "label": "text", "bbox": {"l": 50.112007, "t": 650.59839, "r": 286.36511, "b": 695.369957, "coord_origin": "TOPLEFT"}, "confidence": 0.9742533564567566, "cells": [{"id": 60, "text": "The paper is structured as follows. In Sec. 2, we give", "bbox": {"l": 62.067009000000006, "t": 650.59839, "r": 286.36496, "b": 659.50494, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "a brief overview of the current state-of-the-art. In Sec. 3,", "bbox": {"l": 50.112007, "t": 662.55339, "r": 286.36511, "b": 671.45995, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "we describe the datasets on which we train. In Sec. 4, we", "bbox": {"l": 50.112007, "t": 674.50839, "r": 286.36511, "b": 683.41496, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "introduce the TableFormer model-architecture and describe", "bbox": {"l": 50.112007, "t": 686.46339, "r": 286.36511, "b": 695.369957, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The paper is structured as follows. In Sec. 2, we give a brief overview of the current state-of-the-art. In Sec. 3, we describe the datasets on which we train. In Sec. 4, we introduce the TableFormer model-architecture and describe"}, {"label": "footnote", "id": 14, "page_no": 1, "cluster": {"id": 14, "label": "footnote", "bbox": {"l": 60.97100100000001, "t": 705.596275, "r": 183.73055, "b": 712.721542, "coord_origin": "TOPLEFT"}, "confidence": 0.895367443561554, "cells": [{"id": 64, "text": "$^{1}$https://github.com/IBM/SynthTabNet", "bbox": {"l": 60.97100100000001, "t": 705.596275, "r": 183.73055, "b": 712.721542, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "$^{1}$https://github.com/IBM/SynthTabNet"}, {"label": "text", "id": 10, "page_no": 1, "cluster": {"id": 10, "label": "text", "bbox": {"l": 308.862, "t": 75.20836999999995, "r": 545.11511, "b": 108.02495999999985, "coord_origin": "TOPLEFT"}, "confidence": 0.9774322509765625, "cells": [{"id": 65, "text": "its results & performance in Sec. 5. As a conclusion, we de-", "bbox": {"l": 308.862, "t": 75.20836999999995, "r": 545.11511, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "scribe how this new model-architecture can be re-purposed", "bbox": {"l": 308.862, "t": 87.16339000000005, "r": 545.11505, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "for other tasks in the computer-vision community.", "bbox": {"l": 308.862, "t": 99.11841000000004, "r": 508.08417000000003, "b": 108.02495999999985, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "its results & performance in Sec. 5. As a conclusion, we describe how this new model-architecture can be re-purposed for other tasks in the computer-vision community."}, {"label": "section_header", "id": 13, "page_no": 1, "cluster": {"id": 13, "label": "section_header", "bbox": {"l": 308.862, "t": 121.73193000000003, "r": 498.28021, "b": 132.47968000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9428724646568298, "cells": [{"id": 68, "text": "2.", "bbox": {"l": 308.862, "t": 121.73193000000003, "r": 315.5831, "b": 132.47968000000003, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "Previous work and State of the Art", "bbox": {"l": 324.54456, "t": 121.73193000000003, "r": 498.28021, "b": 132.47968000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2. Previous work and State of the Art"}, {"label": "text", "id": 0, "page_no": 1, "cluster": {"id": 0, "label": "text", "bbox": {"l": 308.862, "t": 142.22136999999998, "r": 545.11517, "b": 330.45502, "coord_origin": "TOPLEFT"}, "confidence": 0.987194836139679, "cells": [{"id": 70, "text": "Identifying the structure of a table has been an outstand-", "bbox": {"l": 320.81699, "t": 142.22136999999998, "r": 545.11493, "b": 151.12793, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "ing problem in the document-parsing community, that mo-", "bbox": {"l": 308.862, "t": 154.17638999999997, "r": 545.11505, "b": 163.08294999999998, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "tivates many organised public challenges [6, 4, 14].", "bbox": {"l": 308.862, "t": 166.13140999999996, "r": 522.55975, "b": 175.03796, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "The", "bbox": {"l": 529.62323, "t": 166.13140999999996, "r": 545.11505, "b": 175.03796, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "difficulty of the problem can be attributed to a number of", "bbox": {"l": 308.862, "t": 178.08642999999995, "r": 545.11517, "b": 186.99298, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "factors. First, there is a large variety in the shapes and sizes", "bbox": {"l": 308.862, "t": 190.04143999999997, "r": 545.11511, "b": 198.94799999999998, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "of tables.", "bbox": {"l": 308.862, "t": 201.99645999999996, "r": 346.97891, "b": 210.90301999999997, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "Such large variety requires a flexible method.", "bbox": {"l": 354.86929, "t": 201.99645999999996, "r": 545.11511, "b": 210.90301999999997, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "This is especially true for complex column- and row head-", "bbox": {"l": 308.862, "t": 213.95245, "r": 545.11505, "b": 222.85901, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "ers, which can be extremely intricate and demanding.", "bbox": {"l": 308.862, "t": 225.90747, "r": 530.9184, "b": 234.81403, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "A", "bbox": {"l": 537.92212, "t": 225.90747, "r": 545.11511, "b": 234.81403, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "second factor of complexity is the lack of data with regard", "bbox": {"l": 308.862, "t": 237.86248999999998, "r": 545.11517, "b": 246.76904000000002, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "to table-structure. Until the publication of PubTabNet [37],", "bbox": {"l": 308.862, "t": 249.8175, "r": 545.11511, "b": 258.72406, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "there were no large datasets (i.e.", "bbox": {"l": 308.862, "t": 261.77252, "r": 439.8402699999999, "b": 270.67908, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": ">", "bbox": {"l": 444.43999999999994, "t": 261.61310000000003, "r": 452.1889, "b": 270.45989999999995, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "100", "bbox": {"l": 455.89001, "t": 261.61310000000003, "r": 470.83392000000003, "b": 270.45989999999995, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "K tables) that pro-", "bbox": {"l": 470.83401, "t": 261.77252, "r": 545.11517, "b": 270.67908, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "vided structure information. This happens primarily due to", "bbox": {"l": 308.862, "t": 273.72748, "r": 545.11511, "b": 282.63406, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "the fact that tables are notoriously time-consuming to an-", "bbox": {"l": 308.862, "t": 285.6835, "r": 545.11511, "b": 294.59006, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "notate by hand. However, this has definitely changed in re-", "bbox": {"l": 308.862, "t": 297.63849, "r": 545.11511, "b": 306.54504, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "cent years with the deliverance of PubTabNet [37], FinTab-", "bbox": {"l": 308.862, "t": 309.59348, "r": 545.11517, "b": 318.50003000000004, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "Net [36], TableBank [17] etc.", "bbox": {"l": 308.862, "t": 321.54846, "r": 425.92255, "b": 330.45502, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Identifying the structure of a table has been an outstanding problem in the document-parsing community, that motivates many organised public challenges [6, 4, 14]. The difficulty of the problem can be attributed to a number of factors. First, there is a large variety in the shapes and sizes of tables. Such large variety requires a flexible method. This is especially true for complex column- and row headers, which can be extremely intricate and demanding. A second factor of complexity is the lack of data with regard to table-structure. Until the publication of PubTabNet [37], there were no large datasets (i.e. > 100 K tables) that provided structure information. This happens primarily due to the fact that tables are notoriously time-consuming to annotate by hand. However, this has definitely changed in recent years with the deliverance of PubTabNet [37], FinTabNet [36], TableBank [17] etc."}, {"label": "text", "id": 1, "page_no": 1, "cluster": {"id": 1, "label": "text", "bbox": {"l": 308.862, "t": 333.56946, "r": 545.11523, "b": 450.0729099999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9869040250778198, "cells": [{"id": 92, "text": "Before the rising popularity of deep neural networks,", "bbox": {"l": 320.81699, "t": 333.56946, "r": 545.11499, "b": 342.47601, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "the community relied heavily on heuristic and/or statistical", "bbox": {"l": 308.862, "t": 345.52444, "r": 545.11499, "b": 354.43100000000004, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "methods to do table structure identification [3, 7, 11, 5, 13,", "bbox": {"l": 308.862, "t": 357.47943, "r": 545.11517, "b": 366.38599, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "28]. Although such methods work well on constrained ta-", "bbox": {"l": 308.862, "t": 369.43542, "r": 545.11511, "b": 378.34198, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "bles [12], a more data-driven approach can be applied due", "bbox": {"l": 308.862, "t": 381.39041, "r": 545.11505, "b": 390.29697, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "to the advent of convolutional neural networks (CNNs) and", "bbox": {"l": 308.862, "t": 393.3453999999999, "r": 545.11505, "b": 402.25195, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "the availability of large datasets. To the best-of-our knowl-", "bbox": {"l": 308.862, "t": 405.30038, "r": 545.11517, "b": 414.20694, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "edge, there are currently two different types of network ar-", "bbox": {"l": 308.862, "t": 417.25537, "r": 545.11523, "b": 426.16193, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "chitecture that are being pursued for state-of-the-art table-", "bbox": {"l": 308.862, "t": 429.21136000000007, "r": 545.11511, "b": 438.11792, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "structure identification.", "bbox": {"l": 308.862, "t": 441.16635, "r": 401.28503, "b": 450.0729099999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Before the rising popularity of deep neural networks, the community relied heavily on heuristic and/or statistical methods to do table structure identification [3, 7, 11, 5, 13, 28]. Although such methods work well on constrained tables [12], a more data-driven approach can be applied due to the advent of convolutional neural networks (CNNs) and the availability of large datasets. To the best-of-our knowledge, there are currently two different types of network architecture that are being pursued for state-of-the-art tablestructure identification."}, {"label": "text", "id": 3, "page_no": 1, "cluster": {"id": 3, "label": "text", "bbox": {"l": 308.86197, "t": 453.06778, "r": 545.11688, "b": 713.151848, "coord_origin": "TOPLEFT"}, "confidence": 0.9843218326568604, "cells": [{"id": 102, "text": "Image-to-Text networks", "bbox": {"l": 320.81699, "t": 453.06778, "r": 423.26236, "b": 462.02417, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": ": In this type of network, one", "bbox": {"l": 423.26697, "t": 453.18735, "r": 545.10956, "b": 462.0939, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "predicts a sequence of tokens starting from an encoded", "bbox": {"l": 308.86197, "t": 465.14233, "r": 545.11511, "b": 474.04889, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "image.", "bbox": {"l": 308.86197, "t": 477.09732, "r": 335.7012, "b": 486.00388, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "Such sequences of tokens can be HTML table", "bbox": {"l": 345.85309, "t": 477.09732, "r": 545.11505, "b": 486.00388, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "tags [37, 17] or LaTeX symbols[10]. The choice of sym-", "bbox": {"l": 308.86197, "t": 489.05231, "r": 545.11493, "b": 497.95886, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "bols is ultimately not very important, since one can be trans-", "bbox": {"l": 308.86197, "t": 501.00729, "r": 545.11499, "b": 509.91385, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "formed into the other. There are however subtle variations", "bbox": {"l": 308.86197, "t": 512.9632899999999, "r": 545.11505, "b": 521.8698400000001, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "in the Image-to-Text networks. The easiest network archi-", "bbox": {"l": 308.86197, "t": 524.91827, "r": 545.11505, "b": 533.82483, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "tectures are \u201cimage-encoder", "bbox": {"l": 308.86197, "t": 536.87328, "r": 420.94119, "b": 545.77983, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "\u2192", "bbox": {"l": 423.59497, "t": 536.1559599999999, "r": 433.5575600000001, "b": 545.56065, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "text-decoder\u201d (IETD), sim-", "bbox": {"l": 436.21198, "t": 536.87328, "r": 545.11316, "b": 545.77983, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "ilar to network architectures that try to provide captions to", "bbox": {"l": 308.86197, "t": 548.82828, "r": 545.11511, "b": 557.73483, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "images [32]. In these IETD networks, one expects as output", "bbox": {"l": 308.86197, "t": 560.78328, "r": 545.11493, "b": 569.68983, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "the LaTeX/HTML string of the entire table, i.e. the sym-", "bbox": {"l": 308.86197, "t": 572.73828, "r": 545.11499, "b": 581.6448399999999, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "bols necessary for creating the table with the content of the", "bbox": {"l": 308.86197, "t": 584.69427, "r": 545.11505, "b": 593.60083, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "table. Another approach is the \u201cimage-encoder", "bbox": {"l": 308.86197, "t": 596.6492800000001, "r": 497.07541, "b": 605.55583, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "\u2192", "bbox": {"l": 499.80496, "t": 595.93196, "r": 509.76755, "b": 605.33665, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "dual de-", "bbox": {"l": 512.50098, "t": 596.6492800000001, "r": 545.10852, "b": 605.55583, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "coder\u201d (IEDD) networks. In these type of networks, one has", "bbox": {"l": 308.86197, "t": 608.60428, "r": 545.11511, "b": 617.5108299999999, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "two consecutive decoders with different purposes. The first", "bbox": {"l": 308.86197, "t": 620.55928, "r": 545.11505, "b": 629.46584, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "decoder is the", "bbox": {"l": 308.86197, "t": 632.51428, "r": 364.78201, "b": 641.42084, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "tag-decoder", "bbox": {"l": 367.57397, "t": 632.60394, "r": 415.61362, "b": 641.1917, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": ", i.e. it only produces the HTM-", "bbox": {"l": 415.61298, "t": 632.51428, "r": 545.11688, "b": 641.42084, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "L/LaTeX tags which construct an empty table. The second", "bbox": {"l": 308.86197, "t": 644.46928, "r": 545.11511, "b": 653.37584, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "content-decoder", "bbox": {"l": 308.86197, "t": 656.51494, "r": 373.59894, "b": 665.1027, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "uses the encoding of the image in combi-", "bbox": {"l": 376.90698, "t": 656.4252799999999, "r": 545.11548, "b": 665.33184, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "nation with the output encoding of each cell-tag (from the", "bbox": {"l": 308.862, "t": 668.38028, "r": 545.11517, "b": 677.28684, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "tag-decoder", "bbox": {"l": 308.862, "t": 680.42494, "r": 356.90164, "b": 689.0127, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": ") to generate the textual content of each table", "bbox": {"l": 357.13101, "t": 680.33528, "r": 545.1153, "b": 689.24184, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "cell. The network architecture of IEDD is certainly more", "bbox": {"l": 308.862, "t": 692.290283, "r": 545.11511, "b": 701.196846, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "elaborate, but it has the advantage that one can pre-train the", "bbox": {"l": 308.862, "t": 704.245285, "r": 545.11517, "b": 713.151848, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Image-to-Text networks : In this type of network, one predicts a sequence of tokens starting from an encoded image. Such sequences of tokens can be HTML table tags [37, 17] or LaTeX symbols[10]. The choice of symbols is ultimately not very important, since one can be transformed into the other. There are however subtle variations in the Image-to-Text networks. The easiest network architectures are \u201cimage-encoder \u2192 text-decoder\u201d (IETD), similar to network architectures that try to provide captions to images [32]. In these IETD networks, one expects as output the LaTeX/HTML string of the entire table, i.e. the symbols necessary for creating the table with the content of the table. Another approach is the \u201cimage-encoder \u2192 dual decoder\u201d (IEDD) networks. In these type of networks, one has two consecutive decoders with different purposes. The first decoder is the tag-decoder , i.e. it only produces the HTML/LaTeX tags which construct an empty table. The second content-decoder uses the encoding of the image in combination with the output encoding of each cell-tag (from the tag-decoder ) to generate the textual content of each table cell. The network architecture of IEDD is certainly more elaborate, but it has the advantage that one can pre-train the"}], "headers": [{"label": "page_footer", "id": 15, "page_no": 1, "cluster": {"id": 15, "label": "page_footer", "bbox": {"l": 295.121, "t": 734.133282, "r": 300.10229, "b": 743.039845, "coord_origin": "TOPLEFT"}, "confidence": 0.8778094053268433, "cells": [{"id": 134, "text": "2", "bbox": {"l": 295.121, "t": 734.133282, "r": 300.10229, "b": 743.039845, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2"}]}}, {"page_no": 2, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "tag-decoder which is constrained to the table-tags.", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 250.15102, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "In", "bbox": {"l": 62.067001, "t": 87.21935999999994, "r": 70.365845, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "practice,", "bbox": {"l": 76.931198, "t": 87.21935999999994, "r": 110.95348000000001, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "both", "bbox": {"l": 118.54498, "t": 87.21935999999994, "r": 136.25848, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "network", "bbox": {"l": 142.82384, "t": 87.21935999999994, "r": 175.37166, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "architectures", "bbox": {"l": 181.94698, "t": 87.21935999999994, "r": 232.83594000000002, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "(IETD", "bbox": {"l": 239.41125, "t": 87.21935999999994, "r": 265.41364, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "and", "bbox": {"l": 271.979, "t": 87.21935999999994, "r": 286.36499, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "IEDD) require an implicit, custom trained object-character-", "bbox": {"l": 50.112, "t": 99.17437999999993, "r": 286.36505, "b": 108.08092999999997, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "recognition (OCR) to obtain the content of the table-cells.", "bbox": {"l": 50.112, "t": 111.13036999999997, "r": 286.36511, "b": 120.03692999999998, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "In the case of IETD, this OCR engine is implicit in the de-", "bbox": {"l": 50.112, "t": 123.08538999999996, "r": 286.36505, "b": 131.99194, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "coder similar to [24]. For the IEDD, the OCR is solely em-", "bbox": {"l": 50.112, "t": 135.04040999999995, "r": 286.36514, "b": 143.94696, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "bedded in the content-decoder. This reliance on a custom,", "bbox": {"l": 50.112, "t": 146.99541999999997, "r": 286.36511, "b": 155.90197999999998, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "implicit OCR decoder is of course problematic. OCR is a", "bbox": {"l": 50.112, "t": 158.95043999999996, "r": 286.36505, "b": 167.85699, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "well known and extremely tough problem, that often needs", "bbox": {"l": 50.112, "t": 170.90545999999995, "r": 286.36508, "b": 179.81201, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "custom training for each individual language. However, the", "bbox": {"l": 50.112, "t": 182.86145, "r": 286.36508, "b": 191.76801, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "limited availability for non-english content in the current", "bbox": {"l": 50.112, "t": 194.81646999999998, "r": 286.36511, "b": 203.72302000000002, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "datasets, makes it impractical to apply the IETD and IEDD", "bbox": {"l": 50.112, "t": 206.77148, "r": 286.36511, "b": 215.67804, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "methods on tables with other languages. Additionally, OCR", "bbox": {"l": 50.112, "t": 218.7265, "r": 286.36505, "b": 227.63306, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "can be completely omitted if the tables originate from pro-", "bbox": {"l": 50.112, "t": 230.68151999999998, "r": 286.36505, "b": 239.58807000000002, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "grammatic PDF documents with known positions of each", "bbox": {"l": 50.112, "t": 242.63653999999997, "r": 286.36511, "b": 251.54309, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "cell. The latter was the inspiration for the work of this pa-", "bbox": {"l": 50.112, "t": 254.59253, "r": 286.36508, "b": 263.49908000000005, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "per.", "bbox": {"l": 50.112, "t": 266.54755, "r": 64.776947, "b": 275.45410000000004, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Graph Neural networks", "bbox": {"l": 62.067001, "t": 278.43895999999995, "r": 171.56593, "b": 287.39536, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": ":", "bbox": {"l": 171.56799, "t": 278.55853, "r": 174.3376, "b": 287.46509, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "Graph Neural networks", "bbox": {"l": 185.18687, "t": 278.55853, "r": 286.35709, "b": 287.46509, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "(GNN\u2019s) take a radically different approach to table-", "bbox": {"l": 50.111992, "t": 290.51453000000004, "r": 286.36511, "b": 299.42108, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "structure extraction.", "bbox": {"l": 50.111992, "t": 302.46950999999996, "r": 131.16771, "b": 311.37607, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Note that one table cell can consti-", "bbox": {"l": 138.84888, "t": 302.46950999999996, "r": 286.36508, "b": 311.37607, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "tute out of multiple text-cells. To obtain the table-structure,", "bbox": {"l": 50.111992, "t": 314.4245, "r": 286.36505, "b": 323.33105, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "one creates an initial graph, where each of the text-cells", "bbox": {"l": 50.111992, "t": 326.37949000000003, "r": 286.36508, "b": 335.28604, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "becomes a node in the graph similar to [33, 34, 2]. Each", "bbox": {"l": 50.111992, "t": 338.33447, "r": 286.36505, "b": 347.2410300000001, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "node is then associated with en embedding vector coming", "bbox": {"l": 50.111992, "t": 350.28946, "r": 286.36505, "b": 359.19601, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "from the encoded image, its coordinates and the encoded", "bbox": {"l": 50.111992, "t": 362.24545000000006, "r": 286.36508, "b": 371.15201, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "text. Furthermore, nodes that represent adjacent text-cells", "bbox": {"l": 50.111992, "t": 374.20044, "r": 286.36508, "b": 383.10699, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "are linked. Graph Convolutional Networks (GCN\u2019s) based", "bbox": {"l": 50.111992, "t": 386.15542999999997, "r": 286.36508, "b": 395.06198, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "methods take the image as an input, but also the position of", "bbox": {"l": 50.111992, "t": 398.11041000000006, "r": 286.36508, "b": 407.01697, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "the text-cells and their content [18]. The purpose of a GCN", "bbox": {"l": 50.111992, "t": 410.0654, "r": 286.36508, "b": 418.97195, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "is to transform the input graph into a new graph, which re-", "bbox": {"l": 50.111992, "t": 422.02038999999996, "r": 286.36505, "b": 430.92694, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "places the old links with new ones.", "bbox": {"l": 50.111992, "t": 433.97638, "r": 198.2359, "b": 442.88293, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "The new links then", "bbox": {"l": 205.92703, "t": 433.97638, "r": 286.36505, "b": 442.88293, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "represent the table-structure. With this approach, one can", "bbox": {"l": 50.111992, "t": 445.93137, "r": 286.36508, "b": 454.83792000000005, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "avoid the need to build custom OCR decoders. However,", "bbox": {"l": 50.111992, "t": 457.88635, "r": 286.36505, "b": 466.79291, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "the quality of the reconstructed structure is not comparable", "bbox": {"l": 50.111992, "t": 469.84134, "r": 286.36505, "b": 478.74789, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "to the current state-of-the-art [18].", "bbox": {"l": 50.111992, "t": 481.79633, "r": 186.49998, "b": 490.70288, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Hybrid Deep Learning-Rule-Based approach", "bbox": {"l": 62.066994, "t": 493.68875, "r": 252.88068000000004, "b": 502.64514, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": ": A pop-", "bbox": {"l": 252.88199, "t": 493.80832, "r": 286.36627, "b": 502.71487, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "ular current model for table-structure identification is the", "bbox": {"l": 50.111984, "t": 505.76331, "r": 286.36505, "b": 514.66986, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "use of a hybrid Deep Learning-Rule-Based approach similar", "bbox": {"l": 50.111984, "t": 517.71829, "r": 286.36505, "b": 526.6248499999999, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "to [27, 29]. In this approach, one first detects the position of", "bbox": {"l": 50.111984, "t": 529.67328, "r": 286.36508, "b": 538.57985, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "the table-cells with object detection (e.g. YoloVx or Mask-", "bbox": {"l": 50.111984, "t": 541.62929, "r": 286.36508, "b": 550.53584, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "RCNN), then classifies the table into different types (from", "bbox": {"l": 50.111984, "t": 553.58429, "r": 286.36511, "b": 562.4908399999999, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "its images) and finally uses different rule-sets to obtain", "bbox": {"l": 50.111984, "t": 565.5392899999999, "r": 286.36511, "b": 574.44585, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "its table-structure. Currently, this approach achieves state-", "bbox": {"l": 50.111984, "t": 577.49429, "r": 286.36502, "b": 586.40085, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "of-the-art results, but is not an end-to-end deep-learning", "bbox": {"l": 50.111984, "t": 589.4493, "r": 286.36505, "b": 598.35585, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "method. As such, new rules need to be written if different", "bbox": {"l": 50.111984, "t": 601.4043, "r": 286.36502, "b": 610.31085, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "types of tables are encountered.", "bbox": {"l": 50.111984, "t": 613.36029, "r": 175.98943, "b": 622.26685, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "3.", "bbox": {"l": 50.111984, "t": 635.94484, "r": 57.82375699999999, "b": 646.6925699999999, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Datasets", "bbox": {"l": 68.106125, "t": 635.94484, "r": 105.22546, "b": 646.6925699999999, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "We rely on large-scale datasets such as PubTabNet [37],", "bbox": {"l": 62.06698600000001, "t": 656.42529, "r": 286.36493, "b": 665.33186, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "FinTabNet [36], and TableBank [17] datasets to train and", "bbox": {"l": 50.111984, "t": 668.38029, "r": 286.36508, "b": 677.2868599999999, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "evaluate our models. These datasets span over various ap-", "bbox": {"l": 50.111984, "t": 680.3353, "r": 286.36502, "b": 689.24186, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "pearance styles and content.", "bbox": {"l": 50.111984, "t": 692.290298, "r": 166.24602, "b": 701.196861, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "We also introduce our own", "bbox": {"l": 173.68808, "t": 692.290298, "r": 286.36508, "b": 701.196861, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "synthetically generated SynthTabNet dataset to fix an im-", "bbox": {"l": 50.111984, "t": 704.2453, "r": 286.36505, "b": 713.151863, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "PubTabNet + FinTabNet", "bbox": {"l": 380.79849, "t": 79.81176999999991, "r": 486.84909, "b": 88.55975000000001, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "Rows / Columns", "bbox": {"l": 396.76776, "t": 242.02697999999998, "r": 469.78748, "b": 250.77495999999996, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "0", "bbox": {"l": 320.97653, "t": 233.42296999999996, "r": 324.79254, "b": 239.255, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "20", "bbox": {"l": 410.483, "t": 233.42296999999996, "r": 418.11319, "b": 239.255, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "40", "bbox": {"l": 500.84949, "t": 233.42296999999996, "r": 508.47968000000003, "b": 239.255, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "10", "bbox": {"l": 365.29999, "t": 233.42296999999996, "r": 372.93018, "b": 239.255, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "30", "bbox": {"l": 455.66626, "t": 233.42296999999996, "r": 463.29645, "b": 239.255, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "50", "bbox": {"l": 542.03528, "t": 233.42296999999996, "r": 549.66547, "b": 239.255, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "0", "bbox": {"l": 316.04474, "t": 230.44617000000005, "r": 319.86075, "b": 236.27819999999997, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "2", "bbox": {"l": 312.62521, "t": 198.69073000000003, "r": 316.44122, "b": 204.52277000000004, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "0", "bbox": {"l": 316.43942, "t": 198.69073000000003, "r": 320.2554, "b": 204.52277000000004, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "4", "bbox": {"l": 313.14951, "t": 168.09795999999994, "r": 316.96552, "b": 173.92998999999998, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "0", "bbox": {"l": 316.96371, "t": 168.09795999999994, "r": 320.77969, "b": 173.92998999999998, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "6", "bbox": {"l": 312.92972, "t": 136.58771000000002, "r": 316.74573, "b": 142.41974000000005, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "0", "bbox": {"l": 316.74393, "t": 136.58771000000002, "r": 320.55991, "b": 142.41974000000005, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "8", "bbox": {"l": 312.48227, "t": 105.60175000000004, "r": 316.29828, "b": 111.43377999999996, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "0", "bbox": {"l": 316.29648, "t": 105.60175000000004, "r": 320.11246, "b": 111.43377999999996, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "1", "bbox": {"l": 312.48227, "t": 212.25922000000003, "r": 316.29828, "b": 218.09124999999995, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "0", "bbox": {"l": 316.29648, "t": 212.25922000000003, "r": 320.11246, "b": 218.09124999999995, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "3", "bbox": {"l": 313.07639, "t": 183.72198000000003, "r": 316.8924, "b": 189.55402000000004, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "0", "bbox": {"l": 316.89059, "t": 183.72198000000003, "r": 320.70657, "b": 189.55402000000004, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "5", "bbox": {"l": 312.76321, "t": 152.47400000000005, "r": 316.57922, "b": 158.30602999999996, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "0", "bbox": {"l": 316.57742, "t": 152.47400000000005, "r": 320.3934, "b": 158.30602999999996, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "7", "bbox": {"l": 312.19775, "t": 120.57050000000004, "r": 316.01376, "b": 126.40252999999996, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "0", "bbox": {"l": 316.01196, "t": 120.57050000000004, "r": 319.82794, "b": 126.40252999999996, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "9", "bbox": {"l": 312.8165, "t": 90.1087, "r": 316.63251, "b": 95.94073000000003, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "0", "bbox": {"l": 316.63071, "t": 90.1087, "r": 320.44669, "b": 95.94073000000003, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "0", "bbox": {"l": 532.17426, "t": 222.72729000000004, "r": 536.94427, "b": 230.01727000000005, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "10K", "bbox": {"l": 532.87952, "t": 108.26702999999986, "r": 547.61249, "b": 115.55700999999999, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "8K", "bbox": {"l": 532.7735, "t": 130.78101000000004, "r": 542.73877, "b": 138.07097999999996, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "6K", "bbox": {"l": 532.79901, "t": 153.92352000000005, "r": 542.76428, "b": 161.21349999999995, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "4K", "bbox": {"l": 532.5705, "t": 176.75800000000004, "r": 542.53577, "b": 184.04796999999996, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "2K", "bbox": {"l": 532.14551, "t": 199.6463, "r": 542.11078, "b": 206.93628, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "Figure 2:", "bbox": {"l": 308.862, "t": 267.83636, "r": 346.06238, "b": 276.74292, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "Distribution of the tables across different table", "bbox": {"l": 354.49072, "t": 267.83636, "r": 545.11511, "b": 276.74292, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "dimensions in PubTabNet + FinTabNet datasets", "bbox": {"l": 308.862, "t": 279.79132000000004, "r": 498.56989, "b": 288.6979099999999, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "balance in the previous datasets.", "bbox": {"l": 308.862, "t": 317.47336, "r": 437.27002, "b": 326.37991, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "The PubTabNet dataset contains 509k tables delivered as", "bbox": {"l": 320.81699, "t": 331.53137, "r": 545.11505, "b": 340.43793, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "annotated PNG images. The annotations consist of the table", "bbox": {"l": 308.862, "t": 343.48635999999993, "r": 545.11517, "b": 352.39291, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "structure represented in HTML format, the tokenized text", "bbox": {"l": 308.862, "t": 355.44235, "r": 545.11505, "b": 364.34890999999993, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "and its bounding boxes per table cell. Fig. 1 shows the ap-", "bbox": {"l": 308.862, "t": 367.39734, "r": 545.11505, "b": 376.30389, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "pearance style of PubTabNet. Depending on its complexity,", "bbox": {"l": 308.862, "t": 379.35233, "r": 545.11511, "b": 388.25888, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "a table is characterized as \u201csimple\u201d when it does not contain", "bbox": {"l": 308.862, "t": 391.30731, "r": 545.11511, "b": 400.21386999999993, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "row spans or column spans, otherwise it is \u201ccomplex\u201d. The", "bbox": {"l": 308.862, "t": 403.26230000000004, "r": 545.11505, "b": 412.16885, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "dataset is divided into Train and Val splits (roughly 98% and", "bbox": {"l": 308.862, "t": 415.21729, "r": 545.11511, "b": 424.12384, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "2%). The Train split consists of 54% simple and 46% com-", "bbox": {"l": 308.862, "t": 427.17328, "r": 545.11517, "b": 436.0798300000001, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "plex tables and the Val split of 51% and 49% respectively.", "bbox": {"l": 308.862, "t": 439.12827, "r": 545.11517, "b": 448.03482, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "The FinTabNet dataset contains 112k tables delivered as", "bbox": {"l": 308.862, "t": 451.08325, "r": 545.11511, "b": 459.98981000000003, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "single-page PDF documents with mixed table structures and", "bbox": {"l": 308.862, "t": 463.03824, "r": 545.11505, "b": 471.94479, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "text content. Similarly to the PubTabNet, the annotations", "bbox": {"l": 308.862, "t": 474.99323, "r": 545.11511, "b": 483.89978, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "of FinTabNet include the table structure in HTML, the to-", "bbox": {"l": 308.862, "t": 486.94922, "r": 545.11511, "b": 495.85577, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "kenized text and the bounding boxes on a table cell basis.", "bbox": {"l": 308.862, "t": 498.90421, "r": 545.11511, "b": 507.81076, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "The dataset is divided into Train, Test and Val splits (81%,", "bbox": {"l": 308.862, "t": 510.85919, "r": 545.11517, "b": 519.76575, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "9.5%, 9.5%), and each one is almost equally divided into", "bbox": {"l": 308.862, "t": 522.8141800000001, "r": 545.11517, "b": 531.72073, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "simple and complex tables (Train: 48% simple, 52% com-", "bbox": {"l": 308.862, "t": 534.76917, "r": 545.11505, "b": 543.67574, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "plex, Test: 48% simple, 52% complex, Test: 53% simple,", "bbox": {"l": 308.862, "t": 546.72418, "r": 545.11511, "b": 555.6307400000001, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "47% complex). Finally the TableBank dataset consists of", "bbox": {"l": 308.862, "t": 558.6801800000001, "r": 545.11511, "b": 567.58673, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "145k tables provided as JPEG images. The latter has anno-", "bbox": {"l": 308.862, "t": 570.63518, "r": 545.11505, "b": 579.54173, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "tations for the table structure, but only few with bounding", "bbox": {"l": 308.862, "t": 582.59018, "r": 545.11499, "b": 591.49673, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "boxes of the table cells. The entire dataset consists of sim-", "bbox": {"l": 308.862, "t": 594.54518, "r": 545.11517, "b": 603.45174, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "ple tables and it is divided into 90% Train, 3% Test and 7%", "bbox": {"l": 308.862, "t": 606.50018, "r": 545.11511, "b": 615.40674, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "Val splits.", "bbox": {"l": 308.862, "t": 618.45518, "r": 348.16446, "b": 627.36174, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "Due to the heterogeneity across the dataset formats, it", "bbox": {"l": 320.81699, "t": 632.51419, "r": 545.11487, "b": 641.42075, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "was necessary to combine all available data into one homog-", "bbox": {"l": 308.862, "t": 644.46919, "r": 545.11511, "b": 653.37575, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "enized dataset before we could train our models for practi-", "bbox": {"l": 308.862, "t": 656.42419, "r": 545.11511, "b": 665.33076, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "cal purposes. Given the size of PubTabNet, we adopted its", "bbox": {"l": 308.862, "t": 668.38019, "r": 545.11499, "b": 677.28676, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "annotation format and we extracted and converted all tables", "bbox": {"l": 308.862, "t": 680.33519, "r": 545.11505, "b": 689.24176, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "as PNG images with a resolution of 72 dpi. Additionally,", "bbox": {"l": 308.862, "t": 692.290192, "r": 545.11505, "b": 701.196762, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "we have filtered out tables with extreme sizes due to small", "bbox": {"l": 308.862, "t": 704.245193, "r": 545.11511, "b": 713.151764, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "3", "bbox": {"l": 295.121, "t": 734.133198, "r": 300.10229, "b": 743.039761, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 10, "label": "text", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 250.15102, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.8767216801643372, "cells": [{"id": 0, "text": "tag-decoder which is constrained to the table-tags.", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 250.15102, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "text", "bbox": {"l": 50.112, "t": 87.21935999999994, "r": 286.36514, "b": 275.45410000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9822593927383423, "cells": [{"id": 1, "text": "In", "bbox": {"l": 62.067001, "t": 87.21935999999994, "r": 70.365845, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "practice,", "bbox": {"l": 76.931198, "t": 87.21935999999994, "r": 110.95348000000001, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "both", "bbox": {"l": 118.54498, "t": 87.21935999999994, "r": 136.25848, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "network", "bbox": {"l": 142.82384, "t": 87.21935999999994, "r": 175.37166, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "architectures", "bbox": {"l": 181.94698, "t": 87.21935999999994, "r": 232.83594000000002, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "(IETD", "bbox": {"l": 239.41125, "t": 87.21935999999994, "r": 265.41364, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "and", "bbox": {"l": 271.979, "t": 87.21935999999994, "r": 286.36499, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "IEDD) require an implicit, custom trained object-character-", "bbox": {"l": 50.112, "t": 99.17437999999993, "r": 286.36505, "b": 108.08092999999997, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "recognition (OCR) to obtain the content of the table-cells.", "bbox": {"l": 50.112, "t": 111.13036999999997, "r": 286.36511, "b": 120.03692999999998, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "In the case of IETD, this OCR engine is implicit in the de-", "bbox": {"l": 50.112, "t": 123.08538999999996, "r": 286.36505, "b": 131.99194, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "coder similar to [24]. For the IEDD, the OCR is solely em-", "bbox": {"l": 50.112, "t": 135.04040999999995, "r": 286.36514, "b": 143.94696, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "bedded in the content-decoder. This reliance on a custom,", "bbox": {"l": 50.112, "t": 146.99541999999997, "r": 286.36511, "b": 155.90197999999998, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "implicit OCR decoder is of course problematic. OCR is a", "bbox": {"l": 50.112, "t": 158.95043999999996, "r": 286.36505, "b": 167.85699, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "well known and extremely tough problem, that often needs", "bbox": {"l": 50.112, "t": 170.90545999999995, "r": 286.36508, "b": 179.81201, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "custom training for each individual language. However, the", "bbox": {"l": 50.112, "t": 182.86145, "r": 286.36508, "b": 191.76801, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "limited availability for non-english content in the current", "bbox": {"l": 50.112, "t": 194.81646999999998, "r": 286.36511, "b": 203.72302000000002, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "datasets, makes it impractical to apply the IETD and IEDD", "bbox": {"l": 50.112, "t": 206.77148, "r": 286.36511, "b": 215.67804, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "methods on tables with other languages. Additionally, OCR", "bbox": {"l": 50.112, "t": 218.7265, "r": 286.36505, "b": 227.63306, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "can be completely omitted if the tables originate from pro-", "bbox": {"l": 50.112, "t": 230.68151999999998, "r": 286.36505, "b": 239.58807000000002, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "grammatic PDF documents with known positions of each", "bbox": {"l": 50.112, "t": 242.63653999999997, "r": 286.36511, "b": 251.54309, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "cell. The latter was the inspiration for the work of this pa-", "bbox": {"l": 50.112, "t": 254.59253, "r": 286.36508, "b": 263.49908000000005, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "per.", "bbox": {"l": 50.112, "t": 266.54755, "r": 64.776947, "b": 275.45410000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 50.111992, "t": 278.43895999999995, "r": 286.36511, "b": 490.70288, "coord_origin": "TOPLEFT"}, "confidence": 0.9878450036048889, "cells": [{"id": 23, "text": "Graph Neural networks", "bbox": {"l": 62.067001, "t": 278.43895999999995, "r": 171.56593, "b": 287.39536, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": ":", "bbox": {"l": 171.56799, "t": 278.55853, "r": 174.3376, "b": 287.46509, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "Graph Neural networks", "bbox": {"l": 185.18687, "t": 278.55853, "r": 286.35709, "b": 287.46509, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "(GNN\u2019s) take a radically different approach to table-", "bbox": {"l": 50.111992, "t": 290.51453000000004, "r": 286.36511, "b": 299.42108, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "structure extraction.", "bbox": {"l": 50.111992, "t": 302.46950999999996, "r": 131.16771, "b": 311.37607, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Note that one table cell can consti-", "bbox": {"l": 138.84888, "t": 302.46950999999996, "r": 286.36508, "b": 311.37607, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "tute out of multiple text-cells. To obtain the table-structure,", "bbox": {"l": 50.111992, "t": 314.4245, "r": 286.36505, "b": 323.33105, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "one creates an initial graph, where each of the text-cells", "bbox": {"l": 50.111992, "t": 326.37949000000003, "r": 286.36508, "b": 335.28604, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "becomes a node in the graph similar to [33, 34, 2]. Each", "bbox": {"l": 50.111992, "t": 338.33447, "r": 286.36505, "b": 347.2410300000001, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "node is then associated with en embedding vector coming", "bbox": {"l": 50.111992, "t": 350.28946, "r": 286.36505, "b": 359.19601, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "from the encoded image, its coordinates and the encoded", "bbox": {"l": 50.111992, "t": 362.24545000000006, "r": 286.36508, "b": 371.15201, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "text. Furthermore, nodes that represent adjacent text-cells", "bbox": {"l": 50.111992, "t": 374.20044, "r": 286.36508, "b": 383.10699, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "are linked. Graph Convolutional Networks (GCN\u2019s) based", "bbox": {"l": 50.111992, "t": 386.15542999999997, "r": 286.36508, "b": 395.06198, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "methods take the image as an input, but also the position of", "bbox": {"l": 50.111992, "t": 398.11041000000006, "r": 286.36508, "b": 407.01697, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "the text-cells and their content [18]. The purpose of a GCN", "bbox": {"l": 50.111992, "t": 410.0654, "r": 286.36508, "b": 418.97195, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "is to transform the input graph into a new graph, which re-", "bbox": {"l": 50.111992, "t": 422.02038999999996, "r": 286.36505, "b": 430.92694, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "places the old links with new ones.", "bbox": {"l": 50.111992, "t": 433.97638, "r": 198.2359, "b": 442.88293, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "The new links then", "bbox": {"l": 205.92703, "t": 433.97638, "r": 286.36505, "b": 442.88293, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "represent the table-structure. With this approach, one can", "bbox": {"l": 50.111992, "t": 445.93137, "r": 286.36508, "b": 454.83792000000005, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "avoid the need to build custom OCR decoders. However,", "bbox": {"l": 50.111992, "t": 457.88635, "r": 286.36505, "b": 466.79291, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "the quality of the reconstructed structure is not comparable", "bbox": {"l": 50.111992, "t": 469.84134, "r": 286.36505, "b": 478.74789, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "to the current state-of-the-art [18].", "bbox": {"l": 50.111992, "t": 481.79633, "r": 186.49998, "b": 490.70288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 50.111984, "t": 493.68875, "r": 286.36627, "b": 622.26685, "coord_origin": "TOPLEFT"}, "confidence": 0.9875094294548035, "cells": [{"id": 45, "text": "Hybrid Deep Learning-Rule-Based approach", "bbox": {"l": 62.066994, "t": 493.68875, "r": 252.88068000000004, "b": 502.64514, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": ": A pop-", "bbox": {"l": 252.88199, "t": 493.80832, "r": 286.36627, "b": 502.71487, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "ular current model for table-structure identification is the", "bbox": {"l": 50.111984, "t": 505.76331, "r": 286.36505, "b": 514.66986, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "use of a hybrid Deep Learning-Rule-Based approach similar", "bbox": {"l": 50.111984, "t": 517.71829, "r": 286.36505, "b": 526.6248499999999, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "to [27, 29]. In this approach, one first detects the position of", "bbox": {"l": 50.111984, "t": 529.67328, "r": 286.36508, "b": 538.57985, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "the table-cells with object detection (e.g. YoloVx or Mask-", "bbox": {"l": 50.111984, "t": 541.62929, "r": 286.36508, "b": 550.53584, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "RCNN), then classifies the table into different types (from", "bbox": {"l": 50.111984, "t": 553.58429, "r": 286.36511, "b": 562.4908399999999, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "its images) and finally uses different rule-sets to obtain", "bbox": {"l": 50.111984, "t": 565.5392899999999, "r": 286.36511, "b": 574.44585, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "its table-structure. Currently, this approach achieves state-", "bbox": {"l": 50.111984, "t": 577.49429, "r": 286.36502, "b": 586.40085, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "of-the-art results, but is not an end-to-end deep-learning", "bbox": {"l": 50.111984, "t": 589.4493, "r": 286.36505, "b": 598.35585, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "method. As such, new rules need to be written if different", "bbox": {"l": 50.111984, "t": 601.4043, "r": 286.36502, "b": 610.31085, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "types of tables are encountered.", "bbox": {"l": 50.111984, "t": 613.36029, "r": 175.98943, "b": 622.26685, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "section_header", "bbox": {"l": 50.111984, "t": 635.94484, "r": 105.22546, "b": 646.6925699999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9423062205314636, "cells": [{"id": 57, "text": "3.", "bbox": {"l": 50.111984, "t": 635.94484, "r": 57.82375699999999, "b": 646.6925699999999, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Datasets", "bbox": {"l": 68.106125, "t": 635.94484, "r": 105.22546, "b": 646.6925699999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 50.111984, "t": 656.42529, "r": 286.36508, "b": 713.151863, "coord_origin": "TOPLEFT"}, "confidence": 0.9862047433853149, "cells": [{"id": 59, "text": "We rely on large-scale datasets such as PubTabNet [37],", "bbox": {"l": 62.06698600000001, "t": 656.42529, "r": 286.36493, "b": 665.33186, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "FinTabNet [36], and TableBank [17] datasets to train and", "bbox": {"l": 50.111984, "t": 668.38029, "r": 286.36508, "b": 677.2868599999999, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "evaluate our models. These datasets span over various ap-", "bbox": {"l": 50.111984, "t": 680.3353, "r": 286.36502, "b": 689.24186, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "pearance styles and content.", "bbox": {"l": 50.111984, "t": 692.290298, "r": 166.24602, "b": 701.196861, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "We also introduce our own", "bbox": {"l": 173.68808, "t": 692.290298, "r": 286.36508, "b": 701.196861, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "synthetically generated SynthTabNet dataset to fix an im-", "bbox": {"l": 50.111984, "t": 704.2453, "r": 286.36505, "b": 713.151863, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "picture", "bbox": {"l": 312.10369873046875, "t": 78.44086456298828, "r": 550.38916015625, "b": 250.60984802246094, "coord_origin": "TOPLEFT"}, "confidence": 0.9746918082237244, "cells": [{"id": 65, "text": "PubTabNet + FinTabNet", "bbox": {"l": 380.79849, "t": 79.81176999999991, "r": 486.84909, "b": 88.55975000000001, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "Rows / Columns", "bbox": {"l": 396.76776, "t": 242.02697999999998, "r": 469.78748, "b": 250.77495999999996, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "0", "bbox": {"l": 320.97653, "t": 233.42296999999996, "r": 324.79254, "b": 239.255, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "20", "bbox": {"l": 410.483, "t": 233.42296999999996, "r": 418.11319, "b": 239.255, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "40", "bbox": {"l": 500.84949, "t": 233.42296999999996, "r": 508.47968000000003, "b": 239.255, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "10", "bbox": {"l": 365.29999, "t": 233.42296999999996, "r": 372.93018, "b": 239.255, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "30", "bbox": {"l": 455.66626, "t": 233.42296999999996, "r": 463.29645, "b": 239.255, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "50", "bbox": {"l": 542.03528, "t": 233.42296999999996, "r": 549.66547, "b": 239.255, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "0", "bbox": {"l": 316.04474, "t": 230.44617000000005, "r": 319.86075, "b": 236.27819999999997, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "2", "bbox": {"l": 312.62521, "t": 198.69073000000003, "r": 316.44122, "b": 204.52277000000004, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "0", "bbox": {"l": 316.43942, "t": 198.69073000000003, "r": 320.2554, "b": 204.52277000000004, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "4", "bbox": {"l": 313.14951, "t": 168.09795999999994, "r": 316.96552, "b": 173.92998999999998, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "0", "bbox": {"l": 316.96371, "t": 168.09795999999994, "r": 320.77969, "b": 173.92998999999998, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "6", "bbox": {"l": 312.92972, "t": 136.58771000000002, "r": 316.74573, "b": 142.41974000000005, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "0", "bbox": {"l": 316.74393, "t": 136.58771000000002, "r": 320.55991, "b": 142.41974000000005, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "8", "bbox": {"l": 312.48227, "t": 105.60175000000004, "r": 316.29828, "b": 111.43377999999996, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "0", "bbox": {"l": 316.29648, "t": 105.60175000000004, "r": 320.11246, "b": 111.43377999999996, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "1", "bbox": {"l": 312.48227, "t": 212.25922000000003, "r": 316.29828, "b": 218.09124999999995, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "0", "bbox": {"l": 316.29648, "t": 212.25922000000003, "r": 320.11246, "b": 218.09124999999995, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "3", "bbox": {"l": 313.07639, "t": 183.72198000000003, "r": 316.8924, "b": 189.55402000000004, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "0", "bbox": {"l": 316.89059, "t": 183.72198000000003, "r": 320.70657, "b": 189.55402000000004, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "5", "bbox": {"l": 312.76321, "t": 152.47400000000005, "r": 316.57922, "b": 158.30602999999996, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "0", "bbox": {"l": 316.57742, "t": 152.47400000000005, "r": 320.3934, "b": 158.30602999999996, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "7", "bbox": {"l": 312.19775, "t": 120.57050000000004, "r": 316.01376, "b": 126.40252999999996, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "0", "bbox": {"l": 316.01196, "t": 120.57050000000004, "r": 319.82794, "b": 126.40252999999996, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "9", "bbox": {"l": 312.8165, "t": 90.1087, "r": 316.63251, "b": 95.94073000000003, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "0", "bbox": {"l": 316.63071, "t": 90.1087, "r": 320.44669, "b": 95.94073000000003, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "0", "bbox": {"l": 532.17426, "t": 222.72729000000004, "r": 536.94427, "b": 230.01727000000005, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "10K", "bbox": {"l": 532.87952, "t": 108.26702999999986, "r": 547.61249, "b": 115.55700999999999, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "8K", "bbox": {"l": 532.7735, "t": 130.78101000000004, "r": 542.73877, "b": 138.07097999999996, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "6K", "bbox": {"l": 532.79901, "t": 153.92352000000005, "r": 542.76428, "b": 161.21349999999995, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "4K", "bbox": {"l": 532.5705, "t": 176.75800000000004, "r": 542.53577, "b": 184.04796999999996, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "2K", "bbox": {"l": 532.14551, "t": 199.6463, "r": 542.11078, "b": 206.93628, "coord_origin": "TOPLEFT"}}], "children": [{"id": 12, "label": "section_header", "bbox": {"l": 380.79849, "t": 79.81176999999991, "r": 486.84909, "b": 88.55975000000001, "coord_origin": "TOPLEFT"}, "confidence": 0.5687217116355896, "cells": [{"id": 65, "text": "PubTabNet + FinTabNet", "bbox": {"l": 380.79849, "t": 79.81176999999991, "r": 486.84909, "b": 88.55975000000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 396.76776, "t": 242.02697999999998, "r": 469.78748, "b": 250.77495999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "Rows / Columns", "bbox": {"l": 396.76776, "t": 242.02697999999998, "r": 469.78748, "b": 250.77495999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 320.97653, "t": 233.42296999999996, "r": 324.79254, "b": 239.255, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "0", "bbox": {"l": 320.97653, "t": 233.42296999999996, "r": 324.79254, "b": 239.255, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 410.483, "t": 233.42296999999996, "r": 418.11319, "b": 239.255, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "20", "bbox": {"l": 410.483, "t": 233.42296999999996, "r": 418.11319, "b": 239.255, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 500.84949, "t": 233.42296999999996, "r": 508.47968000000003, "b": 239.255, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "40", "bbox": {"l": 500.84949, "t": 233.42296999999996, "r": 508.47968000000003, "b": 239.255, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 365.29999, "t": 233.42296999999996, "r": 372.93018, "b": 239.255, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "10", "bbox": {"l": 365.29999, "t": 233.42296999999996, "r": 372.93018, "b": 239.255, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 455.66626, "t": 233.42296999999996, "r": 463.29645, "b": 239.255, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "30", "bbox": {"l": 455.66626, "t": 233.42296999999996, "r": 463.29645, "b": 239.255, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 542.03528, "t": 233.42296999999996, "r": 549.66547, "b": 239.255, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "50", "bbox": {"l": 542.03528, "t": 233.42296999999996, "r": 549.66547, "b": 239.255, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 316.04474, "t": 230.44617000000005, "r": 319.86075, "b": 236.27819999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "0", "bbox": {"l": 316.04474, "t": 230.44617000000005, "r": 319.86075, "b": 236.27819999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 312.62521, "t": 198.69073000000003, "r": 316.44122, "b": 204.52277000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "2", "bbox": {"l": 312.62521, "t": 198.69073000000003, "r": 316.44122, "b": 204.52277000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 316.43942, "t": 198.69073000000003, "r": 320.2554, "b": 204.52277000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "0", "bbox": {"l": 316.43942, "t": 198.69073000000003, "r": 320.2554, "b": 204.52277000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 313.14951, "t": 168.09795999999994, "r": 316.96552, "b": 173.92998999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "4", "bbox": {"l": 313.14951, "t": 168.09795999999994, "r": 316.96552, "b": 173.92998999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 316.96371, "t": 168.09795999999994, "r": 320.77969, "b": 173.92998999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "0", "bbox": {"l": 316.96371, "t": 168.09795999999994, "r": 320.77969, "b": 173.92998999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 312.92972, "t": 136.58771000000002, "r": 316.74573, "b": 142.41974000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "6", "bbox": {"l": 312.92972, "t": 136.58771000000002, "r": 316.74573, "b": 142.41974000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 316.74393, "t": 136.58771000000002, "r": 320.55991, "b": 142.41974000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "0", "bbox": {"l": 316.74393, "t": 136.58771000000002, "r": 320.55991, "b": 142.41974000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 312.48227, "t": 105.60175000000004, "r": 316.29828, "b": 111.43377999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "8", "bbox": {"l": 312.48227, "t": 105.60175000000004, "r": 316.29828, "b": 111.43377999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 316.29648, "t": 105.60175000000004, "r": 320.11246, "b": 111.43377999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "0", "bbox": {"l": 316.29648, "t": 105.60175000000004, "r": 320.11246, "b": 111.43377999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 312.48227, "t": 212.25922000000003, "r": 316.29828, "b": 218.09124999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "1", "bbox": {"l": 312.48227, "t": 212.25922000000003, "r": 316.29828, "b": 218.09124999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 316.29648, "t": 212.25922000000003, "r": 320.11246, "b": 218.09124999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "0", "bbox": {"l": 316.29648, "t": 212.25922000000003, "r": 320.11246, "b": 218.09124999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 313.07639, "t": 183.72198000000003, "r": 316.8924, "b": 189.55402000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "3", "bbox": {"l": 313.07639, "t": 183.72198000000003, "r": 316.8924, "b": 189.55402000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 316.89059, "t": 183.72198000000003, "r": 320.70657, "b": 189.55402000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "0", "bbox": {"l": 316.89059, "t": 183.72198000000003, "r": 320.70657, "b": 189.55402000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 312.76321, "t": 152.47400000000005, "r": 316.57922, "b": 158.30602999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "5", "bbox": {"l": 312.76321, "t": 152.47400000000005, "r": 316.57922, "b": 158.30602999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 316.57742, "t": 152.47400000000005, "r": 320.3934, "b": 158.30602999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "0", "bbox": {"l": 316.57742, "t": 152.47400000000005, "r": 320.3934, "b": 158.30602999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 312.19775, "t": 120.57050000000004, "r": 316.01376, "b": 126.40252999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "7", "bbox": {"l": 312.19775, "t": 120.57050000000004, "r": 316.01376, "b": 126.40252999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 316.01196, "t": 120.57050000000004, "r": 319.82794, "b": 126.40252999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "0", "bbox": {"l": 316.01196, "t": 120.57050000000004, "r": 319.82794, "b": 126.40252999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 312.8165, "t": 90.1087, "r": 316.63251, "b": 95.94073000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "9", "bbox": {"l": 312.8165, "t": 90.1087, "r": 316.63251, "b": 95.94073000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 316.63071, "t": 90.1087, "r": 320.44669, "b": 95.94073000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "0", "bbox": {"l": 316.63071, "t": 90.1087, "r": 320.44669, "b": 95.94073000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 532.17426, "t": 222.72729000000004, "r": 536.94427, "b": 230.01727000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "0", "bbox": {"l": 532.17426, "t": 222.72729000000004, "r": 536.94427, "b": 230.01727000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 532.87952, "t": 108.26702999999986, "r": 547.61249, "b": 115.55700999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "10K", "bbox": {"l": 532.87952, "t": 108.26702999999986, "r": 547.61249, "b": 115.55700999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 532.7735, "t": 130.78101000000004, "r": 542.73877, "b": 138.07097999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "8K", "bbox": {"l": 532.7735, "t": 130.78101000000004, "r": 542.73877, "b": 138.07097999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 532.79901, "t": 153.92352000000005, "r": 542.76428, "b": 161.21349999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "6K", "bbox": {"l": 532.79901, "t": 153.92352000000005, "r": 542.76428, "b": 161.21349999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 532.5705, "t": 176.75800000000004, "r": 542.53577, "b": 184.04796999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "4K", "bbox": {"l": 532.5705, "t": 176.75800000000004, "r": 542.53577, "b": 184.04796999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 532.14551, "t": 199.6463, "r": 542.11078, "b": 206.93628, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "2K", "bbox": {"l": 532.14551, "t": 199.6463, "r": 542.11078, "b": 206.93628, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 7, "label": "caption", "bbox": {"l": 308.862, "t": 267.83636, "r": 545.11511, "b": 288.6979099999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9667505025863647, "cells": [{"id": 98, "text": "Figure 2:", "bbox": {"l": 308.862, "t": 267.83636, "r": 346.06238, "b": 276.74292, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "Distribution of the tables across different table", "bbox": {"l": 354.49072, "t": 267.83636, "r": 545.11511, "b": 276.74292, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "dimensions in PubTabNet + FinTabNet datasets", "bbox": {"l": 308.862, "t": 279.79132000000004, "r": 498.56989, "b": 288.6979099999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 308.862, "t": 317.47336, "r": 437.27002, "b": 326.37991, "coord_origin": "TOPLEFT"}, "confidence": 0.8879811763763428, "cells": [{"id": 101, "text": "balance in the previous datasets.", "bbox": {"l": 308.862, "t": 317.47336, "r": 437.27002, "b": 326.37991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 308.862, "t": 331.53137, "r": 545.11517, "b": 627.36174, "coord_origin": "TOPLEFT"}, "confidence": 0.9870319366455078, "cells": [{"id": 102, "text": "The PubTabNet dataset contains 509k tables delivered as", "bbox": {"l": 320.81699, "t": 331.53137, "r": 545.11505, "b": 340.43793, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "annotated PNG images. The annotations consist of the table", "bbox": {"l": 308.862, "t": 343.48635999999993, "r": 545.11517, "b": 352.39291, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "structure represented in HTML format, the tokenized text", "bbox": {"l": 308.862, "t": 355.44235, "r": 545.11505, "b": 364.34890999999993, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "and its bounding boxes per table cell. Fig. 1 shows the ap-", "bbox": {"l": 308.862, "t": 367.39734, "r": 545.11505, "b": 376.30389, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "pearance style of PubTabNet. Depending on its complexity,", "bbox": {"l": 308.862, "t": 379.35233, "r": 545.11511, "b": 388.25888, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "a table is characterized as \u201csimple\u201d when it does not contain", "bbox": {"l": 308.862, "t": 391.30731, "r": 545.11511, "b": 400.21386999999993, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "row spans or column spans, otherwise it is \u201ccomplex\u201d. The", "bbox": {"l": 308.862, "t": 403.26230000000004, "r": 545.11505, "b": 412.16885, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "dataset is divided into Train and Val splits (roughly 98% and", "bbox": {"l": 308.862, "t": 415.21729, "r": 545.11511, "b": 424.12384, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "2%). The Train split consists of 54% simple and 46% com-", "bbox": {"l": 308.862, "t": 427.17328, "r": 545.11517, "b": 436.0798300000001, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "plex tables and the Val split of 51% and 49% respectively.", "bbox": {"l": 308.862, "t": 439.12827, "r": 545.11517, "b": 448.03482, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "The FinTabNet dataset contains 112k tables delivered as", "bbox": {"l": 308.862, "t": 451.08325, "r": 545.11511, "b": 459.98981000000003, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "single-page PDF documents with mixed table structures and", "bbox": {"l": 308.862, "t": 463.03824, "r": 545.11505, "b": 471.94479, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "text content. Similarly to the PubTabNet, the annotations", "bbox": {"l": 308.862, "t": 474.99323, "r": 545.11511, "b": 483.89978, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "of FinTabNet include the table structure in HTML, the to-", "bbox": {"l": 308.862, "t": 486.94922, "r": 545.11511, "b": 495.85577, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "kenized text and the bounding boxes on a table cell basis.", "bbox": {"l": 308.862, "t": 498.90421, "r": 545.11511, "b": 507.81076, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "The dataset is divided into Train, Test and Val splits (81%,", "bbox": {"l": 308.862, "t": 510.85919, "r": 545.11517, "b": 519.76575, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "9.5%, 9.5%), and each one is almost equally divided into", "bbox": {"l": 308.862, "t": 522.8141800000001, "r": 545.11517, "b": 531.72073, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "simple and complex tables (Train: 48% simple, 52% com-", "bbox": {"l": 308.862, "t": 534.76917, "r": 545.11505, "b": 543.67574, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "plex, Test: 48% simple, 52% complex, Test: 53% simple,", "bbox": {"l": 308.862, "t": 546.72418, "r": 545.11511, "b": 555.6307400000001, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "47% complex). Finally the TableBank dataset consists of", "bbox": {"l": 308.862, "t": 558.6801800000001, "r": 545.11511, "b": 567.58673, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "145k tables provided as JPEG images. The latter has anno-", "bbox": {"l": 308.862, "t": 570.63518, "r": 545.11505, "b": 579.54173, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "tations for the table structure, but only few with bounding", "bbox": {"l": 308.862, "t": 582.59018, "r": 545.11499, "b": 591.49673, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "boxes of the table cells. The entire dataset consists of sim-", "bbox": {"l": 308.862, "t": 594.54518, "r": 545.11517, "b": 603.45174, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "ple tables and it is divided into 90% Train, 3% Test and 7%", "bbox": {"l": 308.862, "t": 606.50018, "r": 545.11511, "b": 615.40674, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "Val splits.", "bbox": {"l": 308.862, "t": 618.45518, "r": 348.16446, "b": 627.36174, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "text", "bbox": {"l": 308.862, "t": 632.51419, "r": 545.11511, "b": 713.151764, "coord_origin": "TOPLEFT"}, "confidence": 0.9840091466903687, "cells": [{"id": 127, "text": "Due to the heterogeneity across the dataset formats, it", "bbox": {"l": 320.81699, "t": 632.51419, "r": 545.11487, "b": 641.42075, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "was necessary to combine all available data into one homog-", "bbox": {"l": 308.862, "t": 644.46919, "r": 545.11511, "b": 653.37575, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "enized dataset before we could train our models for practi-", "bbox": {"l": 308.862, "t": 656.42419, "r": 545.11511, "b": 665.33076, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "cal purposes. Given the size of PubTabNet, we adopted its", "bbox": {"l": 308.862, "t": 668.38019, "r": 545.11499, "b": 677.28676, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "annotation format and we extracted and converted all tables", "bbox": {"l": 308.862, "t": 680.33519, "r": 545.11505, "b": 689.24176, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "as PNG images with a resolution of 72 dpi. Additionally,", "bbox": {"l": 308.862, "t": 692.290192, "r": 545.11505, "b": 701.196762, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "we have filtered out tables with extreme sizes due to small", "bbox": {"l": 308.862, "t": 704.245193, "r": 545.11511, "b": 713.151764, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "page_footer", "bbox": {"l": 295.121, "t": 734.133198, "r": 300.10229, "b": 743.039761, "coord_origin": "TOPLEFT"}, "confidence": 0.8715606927871704, "cells": [{"id": 134, "text": "3", "bbox": {"l": 295.121, "t": 734.133198, "r": 300.10229, "b": 743.039761, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "text", "id": 10, "page_no": 2, "cluster": {"id": 10, "label": "text", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 250.15102, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.8767216801643372, "cells": [{"id": 0, "text": "tag-decoder which is constrained to the table-tags.", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 250.15102, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "tag-decoder which is constrained to the table-tags."}, {"label": "text", "id": 5, "page_no": 2, "cluster": {"id": 5, "label": "text", "bbox": {"l": 50.112, "t": 87.21935999999994, "r": 286.36514, "b": 275.45410000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9822593927383423, "cells": [{"id": 1, "text": "In", "bbox": {"l": 62.067001, "t": 87.21935999999994, "r": 70.365845, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "practice,", "bbox": {"l": 76.931198, "t": 87.21935999999994, "r": 110.95348000000001, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "both", "bbox": {"l": 118.54498, "t": 87.21935999999994, "r": 136.25848, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "network", "bbox": {"l": 142.82384, "t": 87.21935999999994, "r": 175.37166, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "architectures", "bbox": {"l": 181.94698, "t": 87.21935999999994, "r": 232.83594000000002, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "(IETD", "bbox": {"l": 239.41125, "t": 87.21935999999994, "r": 265.41364, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "and", "bbox": {"l": 271.979, "t": 87.21935999999994, "r": 286.36499, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "IEDD) require an implicit, custom trained object-character-", "bbox": {"l": 50.112, "t": 99.17437999999993, "r": 286.36505, "b": 108.08092999999997, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "recognition (OCR) to obtain the content of the table-cells.", "bbox": {"l": 50.112, "t": 111.13036999999997, "r": 286.36511, "b": 120.03692999999998, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "In the case of IETD, this OCR engine is implicit in the de-", "bbox": {"l": 50.112, "t": 123.08538999999996, "r": 286.36505, "b": 131.99194, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "coder similar to [24]. For the IEDD, the OCR is solely em-", "bbox": {"l": 50.112, "t": 135.04040999999995, "r": 286.36514, "b": 143.94696, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "bedded in the content-decoder. This reliance on a custom,", "bbox": {"l": 50.112, "t": 146.99541999999997, "r": 286.36511, "b": 155.90197999999998, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "implicit OCR decoder is of course problematic. OCR is a", "bbox": {"l": 50.112, "t": 158.95043999999996, "r": 286.36505, "b": 167.85699, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "well known and extremely tough problem, that often needs", "bbox": {"l": 50.112, "t": 170.90545999999995, "r": 286.36508, "b": 179.81201, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "custom training for each individual language. However, the", "bbox": {"l": 50.112, "t": 182.86145, "r": 286.36508, "b": 191.76801, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "limited availability for non-english content in the current", "bbox": {"l": 50.112, "t": 194.81646999999998, "r": 286.36511, "b": 203.72302000000002, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "datasets, makes it impractical to apply the IETD and IEDD", "bbox": {"l": 50.112, "t": 206.77148, "r": 286.36511, "b": 215.67804, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "methods on tables with other languages. Additionally, OCR", "bbox": {"l": 50.112, "t": 218.7265, "r": 286.36505, "b": 227.63306, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "can be completely omitted if the tables originate from pro-", "bbox": {"l": 50.112, "t": 230.68151999999998, "r": 286.36505, "b": 239.58807000000002, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "grammatic PDF documents with known positions of each", "bbox": {"l": 50.112, "t": 242.63653999999997, "r": 286.36511, "b": 251.54309, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "cell. The latter was the inspiration for the work of this pa-", "bbox": {"l": 50.112, "t": 254.59253, "r": 286.36508, "b": 263.49908000000005, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "per.", "bbox": {"l": 50.112, "t": 266.54755, "r": 64.776947, "b": 275.45410000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In practice, both network architectures (IETD and IEDD) require an implicit, custom trained object-characterrecognition (OCR) to obtain the content of the table-cells. In the case of IETD, this OCR engine is implicit in the decoder similar to [24]. For the IEDD, the OCR is solely embedded in the content-decoder. This reliance on a custom, implicit OCR decoder is of course problematic. OCR is a well known and extremely tough problem, that often needs custom training for each individual language. However, the limited availability for non-english content in the current datasets, makes it impractical to apply the IETD and IEDD methods on tables with other languages. Additionally, OCR can be completely omitted if the tables originate from programmatic PDF documents with known positions of each cell. The latter was the inspiration for the work of this paper."}, {"label": "text", "id": 0, "page_no": 2, "cluster": {"id": 0, "label": "text", "bbox": {"l": 50.111992, "t": 278.43895999999995, "r": 286.36511, "b": 490.70288, "coord_origin": "TOPLEFT"}, "confidence": 0.9878450036048889, "cells": [{"id": 23, "text": "Graph Neural networks", "bbox": {"l": 62.067001, "t": 278.43895999999995, "r": 171.56593, "b": 287.39536, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": ":", "bbox": {"l": 171.56799, "t": 278.55853, "r": 174.3376, "b": 287.46509, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "Graph Neural networks", "bbox": {"l": 185.18687, "t": 278.55853, "r": 286.35709, "b": 287.46509, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "(GNN\u2019s) take a radically different approach to table-", "bbox": {"l": 50.111992, "t": 290.51453000000004, "r": 286.36511, "b": 299.42108, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "structure extraction.", "bbox": {"l": 50.111992, "t": 302.46950999999996, "r": 131.16771, "b": 311.37607, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Note that one table cell can consti-", "bbox": {"l": 138.84888, "t": 302.46950999999996, "r": 286.36508, "b": 311.37607, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "tute out of multiple text-cells. To obtain the table-structure,", "bbox": {"l": 50.111992, "t": 314.4245, "r": 286.36505, "b": 323.33105, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "one creates an initial graph, where each of the text-cells", "bbox": {"l": 50.111992, "t": 326.37949000000003, "r": 286.36508, "b": 335.28604, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "becomes a node in the graph similar to [33, 34, 2]. Each", "bbox": {"l": 50.111992, "t": 338.33447, "r": 286.36505, "b": 347.2410300000001, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "node is then associated with en embedding vector coming", "bbox": {"l": 50.111992, "t": 350.28946, "r": 286.36505, "b": 359.19601, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "from the encoded image, its coordinates and the encoded", "bbox": {"l": 50.111992, "t": 362.24545000000006, "r": 286.36508, "b": 371.15201, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "text. Furthermore, nodes that represent adjacent text-cells", "bbox": {"l": 50.111992, "t": 374.20044, "r": 286.36508, "b": 383.10699, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "are linked. Graph Convolutional Networks (GCN\u2019s) based", "bbox": {"l": 50.111992, "t": 386.15542999999997, "r": 286.36508, "b": 395.06198, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "methods take the image as an input, but also the position of", "bbox": {"l": 50.111992, "t": 398.11041000000006, "r": 286.36508, "b": 407.01697, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "the text-cells and their content [18]. The purpose of a GCN", "bbox": {"l": 50.111992, "t": 410.0654, "r": 286.36508, "b": 418.97195, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "is to transform the input graph into a new graph, which re-", "bbox": {"l": 50.111992, "t": 422.02038999999996, "r": 286.36505, "b": 430.92694, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "places the old links with new ones.", "bbox": {"l": 50.111992, "t": 433.97638, "r": 198.2359, "b": 442.88293, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "The new links then", "bbox": {"l": 205.92703, "t": 433.97638, "r": 286.36505, "b": 442.88293, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "represent the table-structure. With this approach, one can", "bbox": {"l": 50.111992, "t": 445.93137, "r": 286.36508, "b": 454.83792000000005, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "avoid the need to build custom OCR decoders. However,", "bbox": {"l": 50.111992, "t": 457.88635, "r": 286.36505, "b": 466.79291, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "the quality of the reconstructed structure is not comparable", "bbox": {"l": 50.111992, "t": 469.84134, "r": 286.36505, "b": 478.74789, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "to the current state-of-the-art [18].", "bbox": {"l": 50.111992, "t": 481.79633, "r": 186.49998, "b": 490.70288, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Graph Neural networks : Graph Neural networks (GNN\u2019s) take a radically different approach to tablestructure extraction. Note that one table cell can constitute out of multiple text-cells. To obtain the table-structure, one creates an initial graph, where each of the text-cells becomes a node in the graph similar to [33, 34, 2]. Each node is then associated with en embedding vector coming from the encoded image, its coordinates and the encoded text. Furthermore, nodes that represent adjacent text-cells are linked. Graph Convolutional Networks (GCN\u2019s) based methods take the image as an input, but also the position of the text-cells and their content [18]. The purpose of a GCN is to transform the input graph into a new graph, which replaces the old links with new ones. The new links then represent the table-structure. With this approach, one can avoid the need to build custom OCR decoders. However, the quality of the reconstructed structure is not comparable to the current state-of-the-art [18]."}, {"label": "text", "id": 1, "page_no": 2, "cluster": {"id": 1, "label": "text", "bbox": {"l": 50.111984, "t": 493.68875, "r": 286.36627, "b": 622.26685, "coord_origin": "TOPLEFT"}, "confidence": 0.9875094294548035, "cells": [{"id": 45, "text": "Hybrid Deep Learning-Rule-Based approach", "bbox": {"l": 62.066994, "t": 493.68875, "r": 252.88068000000004, "b": 502.64514, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": ": A pop-", "bbox": {"l": 252.88199, "t": 493.80832, "r": 286.36627, "b": 502.71487, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "ular current model for table-structure identification is the", "bbox": {"l": 50.111984, "t": 505.76331, "r": 286.36505, "b": 514.66986, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "use of a hybrid Deep Learning-Rule-Based approach similar", "bbox": {"l": 50.111984, "t": 517.71829, "r": 286.36505, "b": 526.6248499999999, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "to [27, 29]. In this approach, one first detects the position of", "bbox": {"l": 50.111984, "t": 529.67328, "r": 286.36508, "b": 538.57985, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "the table-cells with object detection (e.g. YoloVx or Mask-", "bbox": {"l": 50.111984, "t": 541.62929, "r": 286.36508, "b": 550.53584, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "RCNN), then classifies the table into different types (from", "bbox": {"l": 50.111984, "t": 553.58429, "r": 286.36511, "b": 562.4908399999999, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "its images) and finally uses different rule-sets to obtain", "bbox": {"l": 50.111984, "t": 565.5392899999999, "r": 286.36511, "b": 574.44585, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "its table-structure. Currently, this approach achieves state-", "bbox": {"l": 50.111984, "t": 577.49429, "r": 286.36502, "b": 586.40085, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "of-the-art results, but is not an end-to-end deep-learning", "bbox": {"l": 50.111984, "t": 589.4493, "r": 286.36505, "b": 598.35585, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "method. As such, new rules need to be written if different", "bbox": {"l": 50.111984, "t": 601.4043, "r": 286.36502, "b": 610.31085, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "types of tables are encountered.", "bbox": {"l": 50.111984, "t": 613.36029, "r": 175.98943, "b": 622.26685, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Hybrid Deep Learning-Rule-Based approach : A popular current model for table-structure identification is the use of a hybrid Deep Learning-Rule-Based approach similar to [27, 29]. In this approach, one first detects the position of the table-cells with object detection (e.g. YoloVx or MaskRCNN), then classifies the table into different types (from its images) and finally uses different rule-sets to obtain its table-structure. Currently, this approach achieves stateof-the-art results, but is not an end-to-end deep-learning method. As such, new rules need to be written if different types of tables are encountered."}, {"label": "section_header", "id": 8, "page_no": 2, "cluster": {"id": 8, "label": "section_header", "bbox": {"l": 50.111984, "t": 635.94484, "r": 105.22546, "b": 646.6925699999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9423062205314636, "cells": [{"id": 57, "text": "3.", "bbox": {"l": 50.111984, "t": 635.94484, "r": 57.82375699999999, "b": 646.6925699999999, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Datasets", "bbox": {"l": 68.106125, "t": 635.94484, "r": 105.22546, "b": 646.6925699999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3. Datasets"}, {"label": "text", "id": 3, "page_no": 2, "cluster": {"id": 3, "label": "text", "bbox": {"l": 50.111984, "t": 656.42529, "r": 286.36508, "b": 713.151863, "coord_origin": "TOPLEFT"}, "confidence": 0.9862047433853149, "cells": [{"id": 59, "text": "We rely on large-scale datasets such as PubTabNet [37],", "bbox": {"l": 62.06698600000001, "t": 656.42529, "r": 286.36493, "b": 665.33186, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "FinTabNet [36], and TableBank [17] datasets to train and", "bbox": {"l": 50.111984, "t": 668.38029, "r": 286.36508, "b": 677.2868599999999, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "evaluate our models. These datasets span over various ap-", "bbox": {"l": 50.111984, "t": 680.3353, "r": 286.36502, "b": 689.24186, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "pearance styles and content.", "bbox": {"l": 50.111984, "t": 692.290298, "r": 166.24602, "b": 701.196861, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "We also introduce our own", "bbox": {"l": 173.68808, "t": 692.290298, "r": 286.36508, "b": 701.196861, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "synthetically generated SynthTabNet dataset to fix an im-", "bbox": {"l": 50.111984, "t": 704.2453, "r": 286.36505, "b": 713.151863, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "We rely on large-scale datasets such as PubTabNet [37], FinTabNet [36], and TableBank [17] datasets to train and evaluate our models. These datasets span over various appearance styles and content. We also introduce our own synthetically generated SynthTabNet dataset to fix an im-"}, {"label": "picture", "id": 6, "page_no": 2, "cluster": {"id": 6, "label": "picture", "bbox": {"l": 312.10369873046875, "t": 78.44086456298828, "r": 550.38916015625, "b": 250.60984802246094, "coord_origin": "TOPLEFT"}, "confidence": 0.9746918082237244, "cells": [{"id": 65, "text": "PubTabNet + FinTabNet", "bbox": {"l": 380.79849, "t": 79.81176999999991, "r": 486.84909, "b": 88.55975000000001, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "Rows / Columns", "bbox": {"l": 396.76776, "t": 242.02697999999998, "r": 469.78748, "b": 250.77495999999996, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "0", "bbox": {"l": 320.97653, "t": 233.42296999999996, "r": 324.79254, "b": 239.255, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "20", "bbox": {"l": 410.483, "t": 233.42296999999996, "r": 418.11319, "b": 239.255, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "40", "bbox": {"l": 500.84949, "t": 233.42296999999996, "r": 508.47968000000003, "b": 239.255, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "10", "bbox": {"l": 365.29999, "t": 233.42296999999996, "r": 372.93018, "b": 239.255, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "30", "bbox": {"l": 455.66626, "t": 233.42296999999996, "r": 463.29645, "b": 239.255, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "50", "bbox": {"l": 542.03528, "t": 233.42296999999996, "r": 549.66547, "b": 239.255, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "0", "bbox": {"l": 316.04474, "t": 230.44617000000005, "r": 319.86075, "b": 236.27819999999997, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "2", "bbox": {"l": 312.62521, "t": 198.69073000000003, "r": 316.44122, "b": 204.52277000000004, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "0", "bbox": {"l": 316.43942, "t": 198.69073000000003, "r": 320.2554, "b": 204.52277000000004, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "4", "bbox": {"l": 313.14951, "t": 168.09795999999994, "r": 316.96552, "b": 173.92998999999998, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "0", "bbox": {"l": 316.96371, "t": 168.09795999999994, "r": 320.77969, "b": 173.92998999999998, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "6", "bbox": {"l": 312.92972, "t": 136.58771000000002, "r": 316.74573, "b": 142.41974000000005, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "0", "bbox": {"l": 316.74393, "t": 136.58771000000002, "r": 320.55991, "b": 142.41974000000005, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "8", "bbox": {"l": 312.48227, "t": 105.60175000000004, "r": 316.29828, "b": 111.43377999999996, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "0", "bbox": {"l": 316.29648, "t": 105.60175000000004, "r": 320.11246, "b": 111.43377999999996, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "1", "bbox": {"l": 312.48227, "t": 212.25922000000003, "r": 316.29828, "b": 218.09124999999995, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "0", "bbox": {"l": 316.29648, "t": 212.25922000000003, "r": 320.11246, "b": 218.09124999999995, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "3", "bbox": {"l": 313.07639, "t": 183.72198000000003, "r": 316.8924, "b": 189.55402000000004, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "0", "bbox": {"l": 316.89059, "t": 183.72198000000003, "r": 320.70657, "b": 189.55402000000004, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "5", "bbox": {"l": 312.76321, "t": 152.47400000000005, "r": 316.57922, "b": 158.30602999999996, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "0", "bbox": {"l": 316.57742, "t": 152.47400000000005, "r": 320.3934, "b": 158.30602999999996, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "7", "bbox": {"l": 312.19775, "t": 120.57050000000004, "r": 316.01376, "b": 126.40252999999996, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "0", "bbox": {"l": 316.01196, "t": 120.57050000000004, "r": 319.82794, "b": 126.40252999999996, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "9", "bbox": {"l": 312.8165, "t": 90.1087, "r": 316.63251, "b": 95.94073000000003, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "0", "bbox": {"l": 316.63071, "t": 90.1087, "r": 320.44669, "b": 95.94073000000003, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "0", "bbox": {"l": 532.17426, "t": 222.72729000000004, "r": 536.94427, "b": 230.01727000000005, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "10K", "bbox": {"l": 532.87952, "t": 108.26702999999986, "r": 547.61249, "b": 115.55700999999999, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "8K", "bbox": {"l": 532.7735, "t": 130.78101000000004, "r": 542.73877, "b": 138.07097999999996, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "6K", "bbox": {"l": 532.79901, "t": 153.92352000000005, "r": 542.76428, "b": 161.21349999999995, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "4K", "bbox": {"l": 532.5705, "t": 176.75800000000004, "r": 542.53577, "b": 184.04796999999996, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "2K", "bbox": {"l": 532.14551, "t": 199.6463, "r": 542.11078, "b": 206.93628, "coord_origin": "TOPLEFT"}}], "children": [{"id": 12, "label": "section_header", "bbox": {"l": 380.79849, "t": 79.81176999999991, "r": 486.84909, "b": 88.55975000000001, "coord_origin": "TOPLEFT"}, "confidence": 0.5687217116355896, "cells": [{"id": 65, "text": "PubTabNet + FinTabNet", "bbox": {"l": 380.79849, "t": 79.81176999999991, "r": 486.84909, "b": 88.55975000000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 396.76776, "t": 242.02697999999998, "r": 469.78748, "b": 250.77495999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "Rows / Columns", "bbox": {"l": 396.76776, "t": 242.02697999999998, "r": 469.78748, "b": 250.77495999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 320.97653, "t": 233.42296999999996, "r": 324.79254, "b": 239.255, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "0", "bbox": {"l": 320.97653, "t": 233.42296999999996, "r": 324.79254, "b": 239.255, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 410.483, "t": 233.42296999999996, "r": 418.11319, "b": 239.255, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "20", "bbox": {"l": 410.483, "t": 233.42296999999996, "r": 418.11319, "b": 239.255, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 500.84949, "t": 233.42296999999996, "r": 508.47968000000003, "b": 239.255, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "40", "bbox": {"l": 500.84949, "t": 233.42296999999996, "r": 508.47968000000003, "b": 239.255, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 365.29999, "t": 233.42296999999996, "r": 372.93018, "b": 239.255, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "10", "bbox": {"l": 365.29999, "t": 233.42296999999996, "r": 372.93018, "b": 239.255, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 455.66626, "t": 233.42296999999996, "r": 463.29645, "b": 239.255, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "30", "bbox": {"l": 455.66626, "t": 233.42296999999996, "r": 463.29645, "b": 239.255, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 542.03528, "t": 233.42296999999996, "r": 549.66547, "b": 239.255, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "50", "bbox": {"l": 542.03528, "t": 233.42296999999996, "r": 549.66547, "b": 239.255, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 316.04474, "t": 230.44617000000005, "r": 319.86075, "b": 236.27819999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "0", "bbox": {"l": 316.04474, "t": 230.44617000000005, "r": 319.86075, "b": 236.27819999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 312.62521, "t": 198.69073000000003, "r": 316.44122, "b": 204.52277000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "2", "bbox": {"l": 312.62521, "t": 198.69073000000003, "r": 316.44122, "b": 204.52277000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 316.43942, "t": 198.69073000000003, "r": 320.2554, "b": 204.52277000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "0", "bbox": {"l": 316.43942, "t": 198.69073000000003, "r": 320.2554, "b": 204.52277000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 313.14951, "t": 168.09795999999994, "r": 316.96552, "b": 173.92998999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "4", "bbox": {"l": 313.14951, "t": 168.09795999999994, "r": 316.96552, "b": 173.92998999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 316.96371, "t": 168.09795999999994, "r": 320.77969, "b": 173.92998999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "0", "bbox": {"l": 316.96371, "t": 168.09795999999994, "r": 320.77969, "b": 173.92998999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 312.92972, "t": 136.58771000000002, "r": 316.74573, "b": 142.41974000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "6", "bbox": {"l": 312.92972, "t": 136.58771000000002, "r": 316.74573, "b": 142.41974000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 316.74393, "t": 136.58771000000002, "r": 320.55991, "b": 142.41974000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "0", "bbox": {"l": 316.74393, "t": 136.58771000000002, "r": 320.55991, "b": 142.41974000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 312.48227, "t": 105.60175000000004, "r": 316.29828, "b": 111.43377999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "8", "bbox": {"l": 312.48227, "t": 105.60175000000004, "r": 316.29828, "b": 111.43377999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 316.29648, "t": 105.60175000000004, "r": 320.11246, "b": 111.43377999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "0", "bbox": {"l": 316.29648, "t": 105.60175000000004, "r": 320.11246, "b": 111.43377999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 312.48227, "t": 212.25922000000003, "r": 316.29828, "b": 218.09124999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "1", "bbox": {"l": 312.48227, "t": 212.25922000000003, "r": 316.29828, "b": 218.09124999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 316.29648, "t": 212.25922000000003, "r": 320.11246, "b": 218.09124999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "0", "bbox": {"l": 316.29648, "t": 212.25922000000003, "r": 320.11246, "b": 218.09124999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 313.07639, "t": 183.72198000000003, "r": 316.8924, "b": 189.55402000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "3", "bbox": {"l": 313.07639, "t": 183.72198000000003, "r": 316.8924, "b": 189.55402000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 316.89059, "t": 183.72198000000003, "r": 320.70657, "b": 189.55402000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "0", "bbox": {"l": 316.89059, "t": 183.72198000000003, "r": 320.70657, "b": 189.55402000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 312.76321, "t": 152.47400000000005, "r": 316.57922, "b": 158.30602999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "5", "bbox": {"l": 312.76321, "t": 152.47400000000005, "r": 316.57922, "b": 158.30602999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 316.57742, "t": 152.47400000000005, "r": 320.3934, "b": 158.30602999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "0", "bbox": {"l": 316.57742, "t": 152.47400000000005, "r": 320.3934, "b": 158.30602999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 312.19775, "t": 120.57050000000004, "r": 316.01376, "b": 126.40252999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "7", "bbox": {"l": 312.19775, "t": 120.57050000000004, "r": 316.01376, "b": 126.40252999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 316.01196, "t": 120.57050000000004, "r": 319.82794, "b": 126.40252999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "0", "bbox": {"l": 316.01196, "t": 120.57050000000004, "r": 319.82794, "b": 126.40252999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 312.8165, "t": 90.1087, "r": 316.63251, "b": 95.94073000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "9", "bbox": {"l": 312.8165, "t": 90.1087, "r": 316.63251, "b": 95.94073000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 316.63071, "t": 90.1087, "r": 320.44669, "b": 95.94073000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "0", "bbox": {"l": 316.63071, "t": 90.1087, "r": 320.44669, "b": 95.94073000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 532.17426, "t": 222.72729000000004, "r": 536.94427, "b": 230.01727000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "0", "bbox": {"l": 532.17426, "t": 222.72729000000004, "r": 536.94427, "b": 230.01727000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 532.87952, "t": 108.26702999999986, "r": 547.61249, "b": 115.55700999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "10K", "bbox": {"l": 532.87952, "t": 108.26702999999986, "r": 547.61249, "b": 115.55700999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 532.7735, "t": 130.78101000000004, "r": 542.73877, "b": 138.07097999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "8K", "bbox": {"l": 532.7735, "t": 130.78101000000004, "r": 542.73877, "b": 138.07097999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 532.79901, "t": 153.92352000000005, "r": 542.76428, "b": 161.21349999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "6K", "bbox": {"l": 532.79901, "t": 153.92352000000005, "r": 542.76428, "b": 161.21349999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 532.5705, "t": 176.75800000000004, "r": 542.53577, "b": 184.04796999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "4K", "bbox": {"l": 532.5705, "t": 176.75800000000004, "r": 542.53577, "b": 184.04796999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 532.14551, "t": 199.6463, "r": 542.11078, "b": 206.93628, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "2K", "bbox": {"l": 532.14551, "t": 199.6463, "r": 542.11078, "b": 206.93628, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "caption", "id": 7, "page_no": 2, "cluster": {"id": 7, "label": "caption", "bbox": {"l": 308.862, "t": 267.83636, "r": 545.11511, "b": 288.6979099999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9667505025863647, "cells": [{"id": 98, "text": "Figure 2:", "bbox": {"l": 308.862, "t": 267.83636, "r": 346.06238, "b": 276.74292, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "Distribution of the tables across different table", "bbox": {"l": 354.49072, "t": 267.83636, "r": 545.11511, "b": 276.74292, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "dimensions in PubTabNet + FinTabNet datasets", "bbox": {"l": 308.862, "t": 279.79132000000004, "r": 498.56989, "b": 288.6979099999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 2: Distribution of the tables across different table dimensions in PubTabNet + FinTabNet datasets"}, {"label": "text", "id": 9, "page_no": 2, "cluster": {"id": 9, "label": "text", "bbox": {"l": 308.862, "t": 317.47336, "r": 437.27002, "b": 326.37991, "coord_origin": "TOPLEFT"}, "confidence": 0.8879811763763428, "cells": [{"id": 101, "text": "balance in the previous datasets.", "bbox": {"l": 308.862, "t": 317.47336, "r": 437.27002, "b": 326.37991, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "balance in the previous datasets."}, {"label": "text", "id": 2, "page_no": 2, "cluster": {"id": 2, "label": "text", "bbox": {"l": 308.862, "t": 331.53137, "r": 545.11517, "b": 627.36174, "coord_origin": "TOPLEFT"}, "confidence": 0.9870319366455078, "cells": [{"id": 102, "text": "The PubTabNet dataset contains 509k tables delivered as", "bbox": {"l": 320.81699, "t": 331.53137, "r": 545.11505, "b": 340.43793, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "annotated PNG images. The annotations consist of the table", "bbox": {"l": 308.862, "t": 343.48635999999993, "r": 545.11517, "b": 352.39291, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "structure represented in HTML format, the tokenized text", "bbox": {"l": 308.862, "t": 355.44235, "r": 545.11505, "b": 364.34890999999993, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "and its bounding boxes per table cell. Fig. 1 shows the ap-", "bbox": {"l": 308.862, "t": 367.39734, "r": 545.11505, "b": 376.30389, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "pearance style of PubTabNet. Depending on its complexity,", "bbox": {"l": 308.862, "t": 379.35233, "r": 545.11511, "b": 388.25888, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "a table is characterized as \u201csimple\u201d when it does not contain", "bbox": {"l": 308.862, "t": 391.30731, "r": 545.11511, "b": 400.21386999999993, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "row spans or column spans, otherwise it is \u201ccomplex\u201d. The", "bbox": {"l": 308.862, "t": 403.26230000000004, "r": 545.11505, "b": 412.16885, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "dataset is divided into Train and Val splits (roughly 98% and", "bbox": {"l": 308.862, "t": 415.21729, "r": 545.11511, "b": 424.12384, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "2%). The Train split consists of 54% simple and 46% com-", "bbox": {"l": 308.862, "t": 427.17328, "r": 545.11517, "b": 436.0798300000001, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "plex tables and the Val split of 51% and 49% respectively.", "bbox": {"l": 308.862, "t": 439.12827, "r": 545.11517, "b": 448.03482, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "The FinTabNet dataset contains 112k tables delivered as", "bbox": {"l": 308.862, "t": 451.08325, "r": 545.11511, "b": 459.98981000000003, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "single-page PDF documents with mixed table structures and", "bbox": {"l": 308.862, "t": 463.03824, "r": 545.11505, "b": 471.94479, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "text content. Similarly to the PubTabNet, the annotations", "bbox": {"l": 308.862, "t": 474.99323, "r": 545.11511, "b": 483.89978, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "of FinTabNet include the table structure in HTML, the to-", "bbox": {"l": 308.862, "t": 486.94922, "r": 545.11511, "b": 495.85577, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "kenized text and the bounding boxes on a table cell basis.", "bbox": {"l": 308.862, "t": 498.90421, "r": 545.11511, "b": 507.81076, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "The dataset is divided into Train, Test and Val splits (81%,", "bbox": {"l": 308.862, "t": 510.85919, "r": 545.11517, "b": 519.76575, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "9.5%, 9.5%), and each one is almost equally divided into", "bbox": {"l": 308.862, "t": 522.8141800000001, "r": 545.11517, "b": 531.72073, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "simple and complex tables (Train: 48% simple, 52% com-", "bbox": {"l": 308.862, "t": 534.76917, "r": 545.11505, "b": 543.67574, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "plex, Test: 48% simple, 52% complex, Test: 53% simple,", "bbox": {"l": 308.862, "t": 546.72418, "r": 545.11511, "b": 555.6307400000001, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "47% complex). Finally the TableBank dataset consists of", "bbox": {"l": 308.862, "t": 558.6801800000001, "r": 545.11511, "b": 567.58673, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "145k tables provided as JPEG images. The latter has anno-", "bbox": {"l": 308.862, "t": 570.63518, "r": 545.11505, "b": 579.54173, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "tations for the table structure, but only few with bounding", "bbox": {"l": 308.862, "t": 582.59018, "r": 545.11499, "b": 591.49673, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "boxes of the table cells. The entire dataset consists of sim-", "bbox": {"l": 308.862, "t": 594.54518, "r": 545.11517, "b": 603.45174, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "ple tables and it is divided into 90% Train, 3% Test and 7%", "bbox": {"l": 308.862, "t": 606.50018, "r": 545.11511, "b": 615.40674, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "Val splits.", "bbox": {"l": 308.862, "t": 618.45518, "r": 348.16446, "b": 627.36174, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The PubTabNet dataset contains 509k tables delivered as annotated PNG images. The annotations consist of the table structure represented in HTML format, the tokenized text and its bounding boxes per table cell. Fig. 1 shows the appearance style of PubTabNet. Depending on its complexity, a table is characterized as \u201csimple\u201d when it does not contain row spans or column spans, otherwise it is \u201ccomplex\u201d. The dataset is divided into Train and Val splits (roughly 98% and 2%). The Train split consists of 54% simple and 46% complex tables and the Val split of 51% and 49% respectively. The FinTabNet dataset contains 112k tables delivered as single-page PDF documents with mixed table structures and text content. Similarly to the PubTabNet, the annotations of FinTabNet include the table structure in HTML, the tokenized text and the bounding boxes on a table cell basis. The dataset is divided into Train, Test and Val splits (81%, 9.5%, 9.5%), and each one is almost equally divided into simple and complex tables (Train: 48% simple, 52% complex, Test: 48% simple, 52% complex, Test: 53% simple, 47% complex). Finally the TableBank dataset consists of 145k tables provided as JPEG images. The latter has annotations for the table structure, but only few with bounding boxes of the table cells. The entire dataset consists of simple tables and it is divided into 90% Train, 3% Test and 7% Val splits."}, {"label": "text", "id": 4, "page_no": 2, "cluster": {"id": 4, "label": "text", "bbox": {"l": 308.862, "t": 632.51419, "r": 545.11511, "b": 713.151764, "coord_origin": "TOPLEFT"}, "confidence": 0.9840091466903687, "cells": [{"id": 127, "text": "Due to the heterogeneity across the dataset formats, it", "bbox": {"l": 320.81699, "t": 632.51419, "r": 545.11487, "b": 641.42075, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "was necessary to combine all available data into one homog-", "bbox": {"l": 308.862, "t": 644.46919, "r": 545.11511, "b": 653.37575, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "enized dataset before we could train our models for practi-", "bbox": {"l": 308.862, "t": 656.42419, "r": 545.11511, "b": 665.33076, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "cal purposes. Given the size of PubTabNet, we adopted its", "bbox": {"l": 308.862, "t": 668.38019, "r": 545.11499, "b": 677.28676, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "annotation format and we extracted and converted all tables", "bbox": {"l": 308.862, "t": 680.33519, "r": 545.11505, "b": 689.24176, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "as PNG images with a resolution of 72 dpi. Additionally,", "bbox": {"l": 308.862, "t": 692.290192, "r": 545.11505, "b": 701.196762, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "we have filtered out tables with extreme sizes due to small", "bbox": {"l": 308.862, "t": 704.245193, "r": 545.11511, "b": 713.151764, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Due to the heterogeneity across the dataset formats, it was necessary to combine all available data into one homogenized dataset before we could train our models for practical purposes. Given the size of PubTabNet, we adopted its annotation format and we extracted and converted all tables as PNG images with a resolution of 72 dpi. Additionally, we have filtered out tables with extreme sizes due to small"}, {"label": "page_footer", "id": 11, "page_no": 2, "cluster": {"id": 11, "label": "page_footer", "bbox": {"l": 295.121, "t": 734.133198, "r": 300.10229, "b": 743.039761, "coord_origin": "TOPLEFT"}, "confidence": 0.8715606927871704, "cells": [{"id": 134, "text": "3", "bbox": {"l": 295.121, "t": 734.133198, "r": 300.10229, "b": 743.039761, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3"}], "body": [{"label": "text", "id": 10, "page_no": 2, "cluster": {"id": 10, "label": "text", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 250.15102, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.8767216801643372, "cells": [{"id": 0, "text": "tag-decoder which is constrained to the table-tags.", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 250.15102, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "tag-decoder which is constrained to the table-tags."}, {"label": "text", "id": 5, "page_no": 2, "cluster": {"id": 5, "label": "text", "bbox": {"l": 50.112, "t": 87.21935999999994, "r": 286.36514, "b": 275.45410000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9822593927383423, "cells": [{"id": 1, "text": "In", "bbox": {"l": 62.067001, "t": 87.21935999999994, "r": 70.365845, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "practice,", "bbox": {"l": 76.931198, "t": 87.21935999999994, "r": 110.95348000000001, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "both", "bbox": {"l": 118.54498, "t": 87.21935999999994, "r": 136.25848, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "network", "bbox": {"l": 142.82384, "t": 87.21935999999994, "r": 175.37166, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "architectures", "bbox": {"l": 181.94698, "t": 87.21935999999994, "r": 232.83594000000002, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "(IETD", "bbox": {"l": 239.41125, "t": 87.21935999999994, "r": 265.41364, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "and", "bbox": {"l": 271.979, "t": 87.21935999999994, "r": 286.36499, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "IEDD) require an implicit, custom trained object-character-", "bbox": {"l": 50.112, "t": 99.17437999999993, "r": 286.36505, "b": 108.08092999999997, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "recognition (OCR) to obtain the content of the table-cells.", "bbox": {"l": 50.112, "t": 111.13036999999997, "r": 286.36511, "b": 120.03692999999998, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "In the case of IETD, this OCR engine is implicit in the de-", "bbox": {"l": 50.112, "t": 123.08538999999996, "r": 286.36505, "b": 131.99194, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "coder similar to [24]. For the IEDD, the OCR is solely em-", "bbox": {"l": 50.112, "t": 135.04040999999995, "r": 286.36514, "b": 143.94696, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "bedded in the content-decoder. This reliance on a custom,", "bbox": {"l": 50.112, "t": 146.99541999999997, "r": 286.36511, "b": 155.90197999999998, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "implicit OCR decoder is of course problematic. OCR is a", "bbox": {"l": 50.112, "t": 158.95043999999996, "r": 286.36505, "b": 167.85699, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "well known and extremely tough problem, that often needs", "bbox": {"l": 50.112, "t": 170.90545999999995, "r": 286.36508, "b": 179.81201, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "custom training for each individual language. However, the", "bbox": {"l": 50.112, "t": 182.86145, "r": 286.36508, "b": 191.76801, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "limited availability for non-english content in the current", "bbox": {"l": 50.112, "t": 194.81646999999998, "r": 286.36511, "b": 203.72302000000002, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "datasets, makes it impractical to apply the IETD and IEDD", "bbox": {"l": 50.112, "t": 206.77148, "r": 286.36511, "b": 215.67804, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "methods on tables with other languages. Additionally, OCR", "bbox": {"l": 50.112, "t": 218.7265, "r": 286.36505, "b": 227.63306, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "can be completely omitted if the tables originate from pro-", "bbox": {"l": 50.112, "t": 230.68151999999998, "r": 286.36505, "b": 239.58807000000002, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "grammatic PDF documents with known positions of each", "bbox": {"l": 50.112, "t": 242.63653999999997, "r": 286.36511, "b": 251.54309, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "cell. The latter was the inspiration for the work of this pa-", "bbox": {"l": 50.112, "t": 254.59253, "r": 286.36508, "b": 263.49908000000005, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "per.", "bbox": {"l": 50.112, "t": 266.54755, "r": 64.776947, "b": 275.45410000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In practice, both network architectures (IETD and IEDD) require an implicit, custom trained object-characterrecognition (OCR) to obtain the content of the table-cells. In the case of IETD, this OCR engine is implicit in the decoder similar to [24]. For the IEDD, the OCR is solely embedded in the content-decoder. This reliance on a custom, implicit OCR decoder is of course problematic. OCR is a well known and extremely tough problem, that often needs custom training for each individual language. However, the limited availability for non-english content in the current datasets, makes it impractical to apply the IETD and IEDD methods on tables with other languages. Additionally, OCR can be completely omitted if the tables originate from programmatic PDF documents with known positions of each cell. The latter was the inspiration for the work of this paper."}, {"label": "text", "id": 0, "page_no": 2, "cluster": {"id": 0, "label": "text", "bbox": {"l": 50.111992, "t": 278.43895999999995, "r": 286.36511, "b": 490.70288, "coord_origin": "TOPLEFT"}, "confidence": 0.9878450036048889, "cells": [{"id": 23, "text": "Graph Neural networks", "bbox": {"l": 62.067001, "t": 278.43895999999995, "r": 171.56593, "b": 287.39536, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": ":", "bbox": {"l": 171.56799, "t": 278.55853, "r": 174.3376, "b": 287.46509, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "Graph Neural networks", "bbox": {"l": 185.18687, "t": 278.55853, "r": 286.35709, "b": 287.46509, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "(GNN\u2019s) take a radically different approach to table-", "bbox": {"l": 50.111992, "t": 290.51453000000004, "r": 286.36511, "b": 299.42108, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "structure extraction.", "bbox": {"l": 50.111992, "t": 302.46950999999996, "r": 131.16771, "b": 311.37607, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Note that one table cell can consti-", "bbox": {"l": 138.84888, "t": 302.46950999999996, "r": 286.36508, "b": 311.37607, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "tute out of multiple text-cells. To obtain the table-structure,", "bbox": {"l": 50.111992, "t": 314.4245, "r": 286.36505, "b": 323.33105, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "one creates an initial graph, where each of the text-cells", "bbox": {"l": 50.111992, "t": 326.37949000000003, "r": 286.36508, "b": 335.28604, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "becomes a node in the graph similar to [33, 34, 2]. Each", "bbox": {"l": 50.111992, "t": 338.33447, "r": 286.36505, "b": 347.2410300000001, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "node is then associated with en embedding vector coming", "bbox": {"l": 50.111992, "t": 350.28946, "r": 286.36505, "b": 359.19601, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "from the encoded image, its coordinates and the encoded", "bbox": {"l": 50.111992, "t": 362.24545000000006, "r": 286.36508, "b": 371.15201, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "text. Furthermore, nodes that represent adjacent text-cells", "bbox": {"l": 50.111992, "t": 374.20044, "r": 286.36508, "b": 383.10699, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "are linked. Graph Convolutional Networks (GCN\u2019s) based", "bbox": {"l": 50.111992, "t": 386.15542999999997, "r": 286.36508, "b": 395.06198, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "methods take the image as an input, but also the position of", "bbox": {"l": 50.111992, "t": 398.11041000000006, "r": 286.36508, "b": 407.01697, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "the text-cells and their content [18]. The purpose of a GCN", "bbox": {"l": 50.111992, "t": 410.0654, "r": 286.36508, "b": 418.97195, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "is to transform the input graph into a new graph, which re-", "bbox": {"l": 50.111992, "t": 422.02038999999996, "r": 286.36505, "b": 430.92694, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "places the old links with new ones.", "bbox": {"l": 50.111992, "t": 433.97638, "r": 198.2359, "b": 442.88293, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "The new links then", "bbox": {"l": 205.92703, "t": 433.97638, "r": 286.36505, "b": 442.88293, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "represent the table-structure. With this approach, one can", "bbox": {"l": 50.111992, "t": 445.93137, "r": 286.36508, "b": 454.83792000000005, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "avoid the need to build custom OCR decoders. However,", "bbox": {"l": 50.111992, "t": 457.88635, "r": 286.36505, "b": 466.79291, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "the quality of the reconstructed structure is not comparable", "bbox": {"l": 50.111992, "t": 469.84134, "r": 286.36505, "b": 478.74789, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "to the current state-of-the-art [18].", "bbox": {"l": 50.111992, "t": 481.79633, "r": 186.49998, "b": 490.70288, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Graph Neural networks : Graph Neural networks (GNN\u2019s) take a radically different approach to tablestructure extraction. Note that one table cell can constitute out of multiple text-cells. To obtain the table-structure, one creates an initial graph, where each of the text-cells becomes a node in the graph similar to [33, 34, 2]. Each node is then associated with en embedding vector coming from the encoded image, its coordinates and the encoded text. Furthermore, nodes that represent adjacent text-cells are linked. Graph Convolutional Networks (GCN\u2019s) based methods take the image as an input, but also the position of the text-cells and their content [18]. The purpose of a GCN is to transform the input graph into a new graph, which replaces the old links with new ones. The new links then represent the table-structure. With this approach, one can avoid the need to build custom OCR decoders. However, the quality of the reconstructed structure is not comparable to the current state-of-the-art [18]."}, {"label": "text", "id": 1, "page_no": 2, "cluster": {"id": 1, "label": "text", "bbox": {"l": 50.111984, "t": 493.68875, "r": 286.36627, "b": 622.26685, "coord_origin": "TOPLEFT"}, "confidence": 0.9875094294548035, "cells": [{"id": 45, "text": "Hybrid Deep Learning-Rule-Based approach", "bbox": {"l": 62.066994, "t": 493.68875, "r": 252.88068000000004, "b": 502.64514, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": ": A pop-", "bbox": {"l": 252.88199, "t": 493.80832, "r": 286.36627, "b": 502.71487, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "ular current model for table-structure identification is the", "bbox": {"l": 50.111984, "t": 505.76331, "r": 286.36505, "b": 514.66986, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "use of a hybrid Deep Learning-Rule-Based approach similar", "bbox": {"l": 50.111984, "t": 517.71829, "r": 286.36505, "b": 526.6248499999999, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "to [27, 29]. In this approach, one first detects the position of", "bbox": {"l": 50.111984, "t": 529.67328, "r": 286.36508, "b": 538.57985, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "the table-cells with object detection (e.g. YoloVx or Mask-", "bbox": {"l": 50.111984, "t": 541.62929, "r": 286.36508, "b": 550.53584, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "RCNN), then classifies the table into different types (from", "bbox": {"l": 50.111984, "t": 553.58429, "r": 286.36511, "b": 562.4908399999999, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "its images) and finally uses different rule-sets to obtain", "bbox": {"l": 50.111984, "t": 565.5392899999999, "r": 286.36511, "b": 574.44585, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "its table-structure. Currently, this approach achieves state-", "bbox": {"l": 50.111984, "t": 577.49429, "r": 286.36502, "b": 586.40085, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "of-the-art results, but is not an end-to-end deep-learning", "bbox": {"l": 50.111984, "t": 589.4493, "r": 286.36505, "b": 598.35585, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "method. As such, new rules need to be written if different", "bbox": {"l": 50.111984, "t": 601.4043, "r": 286.36502, "b": 610.31085, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "types of tables are encountered.", "bbox": {"l": 50.111984, "t": 613.36029, "r": 175.98943, "b": 622.26685, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Hybrid Deep Learning-Rule-Based approach : A popular current model for table-structure identification is the use of a hybrid Deep Learning-Rule-Based approach similar to [27, 29]. In this approach, one first detects the position of the table-cells with object detection (e.g. YoloVx or MaskRCNN), then classifies the table into different types (from its images) and finally uses different rule-sets to obtain its table-structure. Currently, this approach achieves stateof-the-art results, but is not an end-to-end deep-learning method. As such, new rules need to be written if different types of tables are encountered."}, {"label": "section_header", "id": 8, "page_no": 2, "cluster": {"id": 8, "label": "section_header", "bbox": {"l": 50.111984, "t": 635.94484, "r": 105.22546, "b": 646.6925699999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9423062205314636, "cells": [{"id": 57, "text": "3.", "bbox": {"l": 50.111984, "t": 635.94484, "r": 57.82375699999999, "b": 646.6925699999999, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Datasets", "bbox": {"l": 68.106125, "t": 635.94484, "r": 105.22546, "b": 646.6925699999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3. Datasets"}, {"label": "text", "id": 3, "page_no": 2, "cluster": {"id": 3, "label": "text", "bbox": {"l": 50.111984, "t": 656.42529, "r": 286.36508, "b": 713.151863, "coord_origin": "TOPLEFT"}, "confidence": 0.9862047433853149, "cells": [{"id": 59, "text": "We rely on large-scale datasets such as PubTabNet [37],", "bbox": {"l": 62.06698600000001, "t": 656.42529, "r": 286.36493, "b": 665.33186, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "FinTabNet [36], and TableBank [17] datasets to train and", "bbox": {"l": 50.111984, "t": 668.38029, "r": 286.36508, "b": 677.2868599999999, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "evaluate our models. These datasets span over various ap-", "bbox": {"l": 50.111984, "t": 680.3353, "r": 286.36502, "b": 689.24186, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "pearance styles and content.", "bbox": {"l": 50.111984, "t": 692.290298, "r": 166.24602, "b": 701.196861, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "We also introduce our own", "bbox": {"l": 173.68808, "t": 692.290298, "r": 286.36508, "b": 701.196861, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "synthetically generated SynthTabNet dataset to fix an im-", "bbox": {"l": 50.111984, "t": 704.2453, "r": 286.36505, "b": 713.151863, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "We rely on large-scale datasets such as PubTabNet [37], FinTabNet [36], and TableBank [17] datasets to train and evaluate our models. These datasets span over various appearance styles and content. We also introduce our own synthetically generated SynthTabNet dataset to fix an im-"}, {"label": "picture", "id": 6, "page_no": 2, "cluster": {"id": 6, "label": "picture", "bbox": {"l": 312.10369873046875, "t": 78.44086456298828, "r": 550.38916015625, "b": 250.60984802246094, "coord_origin": "TOPLEFT"}, "confidence": 0.9746918082237244, "cells": [{"id": 65, "text": "PubTabNet + FinTabNet", "bbox": {"l": 380.79849, "t": 79.81176999999991, "r": 486.84909, "b": 88.55975000000001, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "Rows / Columns", "bbox": {"l": 396.76776, "t": 242.02697999999998, "r": 469.78748, "b": 250.77495999999996, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "0", "bbox": {"l": 320.97653, "t": 233.42296999999996, "r": 324.79254, "b": 239.255, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "20", "bbox": {"l": 410.483, "t": 233.42296999999996, "r": 418.11319, "b": 239.255, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "40", "bbox": {"l": 500.84949, "t": 233.42296999999996, "r": 508.47968000000003, "b": 239.255, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "10", "bbox": {"l": 365.29999, "t": 233.42296999999996, "r": 372.93018, "b": 239.255, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "30", "bbox": {"l": 455.66626, "t": 233.42296999999996, "r": 463.29645, "b": 239.255, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "50", "bbox": {"l": 542.03528, "t": 233.42296999999996, "r": 549.66547, "b": 239.255, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "0", "bbox": {"l": 316.04474, "t": 230.44617000000005, "r": 319.86075, "b": 236.27819999999997, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "2", "bbox": {"l": 312.62521, "t": 198.69073000000003, "r": 316.44122, "b": 204.52277000000004, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "0", "bbox": {"l": 316.43942, "t": 198.69073000000003, "r": 320.2554, "b": 204.52277000000004, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "4", "bbox": {"l": 313.14951, "t": 168.09795999999994, "r": 316.96552, "b": 173.92998999999998, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "0", "bbox": {"l": 316.96371, "t": 168.09795999999994, "r": 320.77969, "b": 173.92998999999998, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "6", "bbox": {"l": 312.92972, "t": 136.58771000000002, "r": 316.74573, "b": 142.41974000000005, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "0", "bbox": {"l": 316.74393, "t": 136.58771000000002, "r": 320.55991, "b": 142.41974000000005, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "8", "bbox": {"l": 312.48227, "t": 105.60175000000004, "r": 316.29828, "b": 111.43377999999996, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "0", "bbox": {"l": 316.29648, "t": 105.60175000000004, "r": 320.11246, "b": 111.43377999999996, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "1", "bbox": {"l": 312.48227, "t": 212.25922000000003, "r": 316.29828, "b": 218.09124999999995, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "0", "bbox": {"l": 316.29648, "t": 212.25922000000003, "r": 320.11246, "b": 218.09124999999995, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "3", "bbox": {"l": 313.07639, "t": 183.72198000000003, "r": 316.8924, "b": 189.55402000000004, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "0", "bbox": {"l": 316.89059, "t": 183.72198000000003, "r": 320.70657, "b": 189.55402000000004, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "5", "bbox": {"l": 312.76321, "t": 152.47400000000005, "r": 316.57922, "b": 158.30602999999996, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "0", "bbox": {"l": 316.57742, "t": 152.47400000000005, "r": 320.3934, "b": 158.30602999999996, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "7", "bbox": {"l": 312.19775, "t": 120.57050000000004, "r": 316.01376, "b": 126.40252999999996, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "0", "bbox": {"l": 316.01196, "t": 120.57050000000004, "r": 319.82794, "b": 126.40252999999996, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "9", "bbox": {"l": 312.8165, "t": 90.1087, "r": 316.63251, "b": 95.94073000000003, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "0", "bbox": {"l": 316.63071, "t": 90.1087, "r": 320.44669, "b": 95.94073000000003, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "0", "bbox": {"l": 532.17426, "t": 222.72729000000004, "r": 536.94427, "b": 230.01727000000005, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "10K", "bbox": {"l": 532.87952, "t": 108.26702999999986, "r": 547.61249, "b": 115.55700999999999, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "8K", "bbox": {"l": 532.7735, "t": 130.78101000000004, "r": 542.73877, "b": 138.07097999999996, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "6K", "bbox": {"l": 532.79901, "t": 153.92352000000005, "r": 542.76428, "b": 161.21349999999995, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "4K", "bbox": {"l": 532.5705, "t": 176.75800000000004, "r": 542.53577, "b": 184.04796999999996, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "2K", "bbox": {"l": 532.14551, "t": 199.6463, "r": 542.11078, "b": 206.93628, "coord_origin": "TOPLEFT"}}], "children": [{"id": 12, "label": "section_header", "bbox": {"l": 380.79849, "t": 79.81176999999991, "r": 486.84909, "b": 88.55975000000001, "coord_origin": "TOPLEFT"}, "confidence": 0.5687217116355896, "cells": [{"id": 65, "text": "PubTabNet + FinTabNet", "bbox": {"l": 380.79849, "t": 79.81176999999991, "r": 486.84909, "b": 88.55975000000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 396.76776, "t": 242.02697999999998, "r": 469.78748, "b": 250.77495999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "Rows / Columns", "bbox": {"l": 396.76776, "t": 242.02697999999998, "r": 469.78748, "b": 250.77495999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 320.97653, "t": 233.42296999999996, "r": 324.79254, "b": 239.255, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "0", "bbox": {"l": 320.97653, "t": 233.42296999999996, "r": 324.79254, "b": 239.255, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 410.483, "t": 233.42296999999996, "r": 418.11319, "b": 239.255, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "20", "bbox": {"l": 410.483, "t": 233.42296999999996, "r": 418.11319, "b": 239.255, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 500.84949, "t": 233.42296999999996, "r": 508.47968000000003, "b": 239.255, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "40", "bbox": {"l": 500.84949, "t": 233.42296999999996, "r": 508.47968000000003, "b": 239.255, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 365.29999, "t": 233.42296999999996, "r": 372.93018, "b": 239.255, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "10", "bbox": {"l": 365.29999, "t": 233.42296999999996, "r": 372.93018, "b": 239.255, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 455.66626, "t": 233.42296999999996, "r": 463.29645, "b": 239.255, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "30", "bbox": {"l": 455.66626, "t": 233.42296999999996, "r": 463.29645, "b": 239.255, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 542.03528, "t": 233.42296999999996, "r": 549.66547, "b": 239.255, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "50", "bbox": {"l": 542.03528, "t": 233.42296999999996, "r": 549.66547, "b": 239.255, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 316.04474, "t": 230.44617000000005, "r": 319.86075, "b": 236.27819999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "0", "bbox": {"l": 316.04474, "t": 230.44617000000005, "r": 319.86075, "b": 236.27819999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 312.62521, "t": 198.69073000000003, "r": 316.44122, "b": 204.52277000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "2", "bbox": {"l": 312.62521, "t": 198.69073000000003, "r": 316.44122, "b": 204.52277000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 316.43942, "t": 198.69073000000003, "r": 320.2554, "b": 204.52277000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "0", "bbox": {"l": 316.43942, "t": 198.69073000000003, "r": 320.2554, "b": 204.52277000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 313.14951, "t": 168.09795999999994, "r": 316.96552, "b": 173.92998999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "4", "bbox": {"l": 313.14951, "t": 168.09795999999994, "r": 316.96552, "b": 173.92998999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 316.96371, "t": 168.09795999999994, "r": 320.77969, "b": 173.92998999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "0", "bbox": {"l": 316.96371, "t": 168.09795999999994, "r": 320.77969, "b": 173.92998999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 312.92972, "t": 136.58771000000002, "r": 316.74573, "b": 142.41974000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "6", "bbox": {"l": 312.92972, "t": 136.58771000000002, "r": 316.74573, "b": 142.41974000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 316.74393, "t": 136.58771000000002, "r": 320.55991, "b": 142.41974000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "0", "bbox": {"l": 316.74393, "t": 136.58771000000002, "r": 320.55991, "b": 142.41974000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 312.48227, "t": 105.60175000000004, "r": 316.29828, "b": 111.43377999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "8", "bbox": {"l": 312.48227, "t": 105.60175000000004, "r": 316.29828, "b": 111.43377999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 316.29648, "t": 105.60175000000004, "r": 320.11246, "b": 111.43377999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "0", "bbox": {"l": 316.29648, "t": 105.60175000000004, "r": 320.11246, "b": 111.43377999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 312.48227, "t": 212.25922000000003, "r": 316.29828, "b": 218.09124999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "1", "bbox": {"l": 312.48227, "t": 212.25922000000003, "r": 316.29828, "b": 218.09124999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 316.29648, "t": 212.25922000000003, "r": 320.11246, "b": 218.09124999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "0", "bbox": {"l": 316.29648, "t": 212.25922000000003, "r": 320.11246, "b": 218.09124999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 313.07639, "t": 183.72198000000003, "r": 316.8924, "b": 189.55402000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "3", "bbox": {"l": 313.07639, "t": 183.72198000000003, "r": 316.8924, "b": 189.55402000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 316.89059, "t": 183.72198000000003, "r": 320.70657, "b": 189.55402000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "0", "bbox": {"l": 316.89059, "t": 183.72198000000003, "r": 320.70657, "b": 189.55402000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 312.76321, "t": 152.47400000000005, "r": 316.57922, "b": 158.30602999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "5", "bbox": {"l": 312.76321, "t": 152.47400000000005, "r": 316.57922, "b": 158.30602999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 316.57742, "t": 152.47400000000005, "r": 320.3934, "b": 158.30602999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "0", "bbox": {"l": 316.57742, "t": 152.47400000000005, "r": 320.3934, "b": 158.30602999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 312.19775, "t": 120.57050000000004, "r": 316.01376, "b": 126.40252999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "7", "bbox": {"l": 312.19775, "t": 120.57050000000004, "r": 316.01376, "b": 126.40252999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 316.01196, "t": 120.57050000000004, "r": 319.82794, "b": 126.40252999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "0", "bbox": {"l": 316.01196, "t": 120.57050000000004, "r": 319.82794, "b": 126.40252999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 312.8165, "t": 90.1087, "r": 316.63251, "b": 95.94073000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "9", "bbox": {"l": 312.8165, "t": 90.1087, "r": 316.63251, "b": 95.94073000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 316.63071, "t": 90.1087, "r": 320.44669, "b": 95.94073000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "0", "bbox": {"l": 316.63071, "t": 90.1087, "r": 320.44669, "b": 95.94073000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 532.17426, "t": 222.72729000000004, "r": 536.94427, "b": 230.01727000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "0", "bbox": {"l": 532.17426, "t": 222.72729000000004, "r": 536.94427, "b": 230.01727000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 532.87952, "t": 108.26702999999986, "r": 547.61249, "b": 115.55700999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "10K", "bbox": {"l": 532.87952, "t": 108.26702999999986, "r": 547.61249, "b": 115.55700999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 532.7735, "t": 130.78101000000004, "r": 542.73877, "b": 138.07097999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "8K", "bbox": {"l": 532.7735, "t": 130.78101000000004, "r": 542.73877, "b": 138.07097999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 532.79901, "t": 153.92352000000005, "r": 542.76428, "b": 161.21349999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "6K", "bbox": {"l": 532.79901, "t": 153.92352000000005, "r": 542.76428, "b": 161.21349999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 532.5705, "t": 176.75800000000004, "r": 542.53577, "b": 184.04796999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "4K", "bbox": {"l": 532.5705, "t": 176.75800000000004, "r": 542.53577, "b": 184.04796999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 532.14551, "t": 199.6463, "r": 542.11078, "b": 206.93628, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "2K", "bbox": {"l": 532.14551, "t": 199.6463, "r": 542.11078, "b": 206.93628, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "caption", "id": 7, "page_no": 2, "cluster": {"id": 7, "label": "caption", "bbox": {"l": 308.862, "t": 267.83636, "r": 545.11511, "b": 288.6979099999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9667505025863647, "cells": [{"id": 98, "text": "Figure 2:", "bbox": {"l": 308.862, "t": 267.83636, "r": 346.06238, "b": 276.74292, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "Distribution of the tables across different table", "bbox": {"l": 354.49072, "t": 267.83636, "r": 545.11511, "b": 276.74292, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "dimensions in PubTabNet + FinTabNet datasets", "bbox": {"l": 308.862, "t": 279.79132000000004, "r": 498.56989, "b": 288.6979099999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 2: Distribution of the tables across different table dimensions in PubTabNet + FinTabNet datasets"}, {"label": "text", "id": 9, "page_no": 2, "cluster": {"id": 9, "label": "text", "bbox": {"l": 308.862, "t": 317.47336, "r": 437.27002, "b": 326.37991, "coord_origin": "TOPLEFT"}, "confidence": 0.8879811763763428, "cells": [{"id": 101, "text": "balance in the previous datasets.", "bbox": {"l": 308.862, "t": 317.47336, "r": 437.27002, "b": 326.37991, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "balance in the previous datasets."}, {"label": "text", "id": 2, "page_no": 2, "cluster": {"id": 2, "label": "text", "bbox": {"l": 308.862, "t": 331.53137, "r": 545.11517, "b": 627.36174, "coord_origin": "TOPLEFT"}, "confidence": 0.9870319366455078, "cells": [{"id": 102, "text": "The PubTabNet dataset contains 509k tables delivered as", "bbox": {"l": 320.81699, "t": 331.53137, "r": 545.11505, "b": 340.43793, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "annotated PNG images. The annotations consist of the table", "bbox": {"l": 308.862, "t": 343.48635999999993, "r": 545.11517, "b": 352.39291, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "structure represented in HTML format, the tokenized text", "bbox": {"l": 308.862, "t": 355.44235, "r": 545.11505, "b": 364.34890999999993, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "and its bounding boxes per table cell. Fig. 1 shows the ap-", "bbox": {"l": 308.862, "t": 367.39734, "r": 545.11505, "b": 376.30389, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "pearance style of PubTabNet. Depending on its complexity,", "bbox": {"l": 308.862, "t": 379.35233, "r": 545.11511, "b": 388.25888, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "a table is characterized as \u201csimple\u201d when it does not contain", "bbox": {"l": 308.862, "t": 391.30731, "r": 545.11511, "b": 400.21386999999993, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "row spans or column spans, otherwise it is \u201ccomplex\u201d. The", "bbox": {"l": 308.862, "t": 403.26230000000004, "r": 545.11505, "b": 412.16885, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "dataset is divided into Train and Val splits (roughly 98% and", "bbox": {"l": 308.862, "t": 415.21729, "r": 545.11511, "b": 424.12384, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "2%). The Train split consists of 54% simple and 46% com-", "bbox": {"l": 308.862, "t": 427.17328, "r": 545.11517, "b": 436.0798300000001, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "plex tables and the Val split of 51% and 49% respectively.", "bbox": {"l": 308.862, "t": 439.12827, "r": 545.11517, "b": 448.03482, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "The FinTabNet dataset contains 112k tables delivered as", "bbox": {"l": 308.862, "t": 451.08325, "r": 545.11511, "b": 459.98981000000003, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "single-page PDF documents with mixed table structures and", "bbox": {"l": 308.862, "t": 463.03824, "r": 545.11505, "b": 471.94479, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "text content. Similarly to the PubTabNet, the annotations", "bbox": {"l": 308.862, "t": 474.99323, "r": 545.11511, "b": 483.89978, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "of FinTabNet include the table structure in HTML, the to-", "bbox": {"l": 308.862, "t": 486.94922, "r": 545.11511, "b": 495.85577, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "kenized text and the bounding boxes on a table cell basis.", "bbox": {"l": 308.862, "t": 498.90421, "r": 545.11511, "b": 507.81076, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "The dataset is divided into Train, Test and Val splits (81%,", "bbox": {"l": 308.862, "t": 510.85919, "r": 545.11517, "b": 519.76575, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "9.5%, 9.5%), and each one is almost equally divided into", "bbox": {"l": 308.862, "t": 522.8141800000001, "r": 545.11517, "b": 531.72073, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "simple and complex tables (Train: 48% simple, 52% com-", "bbox": {"l": 308.862, "t": 534.76917, "r": 545.11505, "b": 543.67574, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "plex, Test: 48% simple, 52% complex, Test: 53% simple,", "bbox": {"l": 308.862, "t": 546.72418, "r": 545.11511, "b": 555.6307400000001, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "47% complex). Finally the TableBank dataset consists of", "bbox": {"l": 308.862, "t": 558.6801800000001, "r": 545.11511, "b": 567.58673, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "145k tables provided as JPEG images. The latter has anno-", "bbox": {"l": 308.862, "t": 570.63518, "r": 545.11505, "b": 579.54173, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "tations for the table structure, but only few with bounding", "bbox": {"l": 308.862, "t": 582.59018, "r": 545.11499, "b": 591.49673, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "boxes of the table cells. The entire dataset consists of sim-", "bbox": {"l": 308.862, "t": 594.54518, "r": 545.11517, "b": 603.45174, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "ple tables and it is divided into 90% Train, 3% Test and 7%", "bbox": {"l": 308.862, "t": 606.50018, "r": 545.11511, "b": 615.40674, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "Val splits.", "bbox": {"l": 308.862, "t": 618.45518, "r": 348.16446, "b": 627.36174, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The PubTabNet dataset contains 509k tables delivered as annotated PNG images. The annotations consist of the table structure represented in HTML format, the tokenized text and its bounding boxes per table cell. Fig. 1 shows the appearance style of PubTabNet. Depending on its complexity, a table is characterized as \u201csimple\u201d when it does not contain row spans or column spans, otherwise it is \u201ccomplex\u201d. The dataset is divided into Train and Val splits (roughly 98% and 2%). The Train split consists of 54% simple and 46% complex tables and the Val split of 51% and 49% respectively. The FinTabNet dataset contains 112k tables delivered as single-page PDF documents with mixed table structures and text content. Similarly to the PubTabNet, the annotations of FinTabNet include the table structure in HTML, the tokenized text and the bounding boxes on a table cell basis. The dataset is divided into Train, Test and Val splits (81%, 9.5%, 9.5%), and each one is almost equally divided into simple and complex tables (Train: 48% simple, 52% complex, Test: 48% simple, 52% complex, Test: 53% simple, 47% complex). Finally the TableBank dataset consists of 145k tables provided as JPEG images. The latter has annotations for the table structure, but only few with bounding boxes of the table cells. The entire dataset consists of simple tables and it is divided into 90% Train, 3% Test and 7% Val splits."}, {"label": "text", "id": 4, "page_no": 2, "cluster": {"id": 4, "label": "text", "bbox": {"l": 308.862, "t": 632.51419, "r": 545.11511, "b": 713.151764, "coord_origin": "TOPLEFT"}, "confidence": 0.9840091466903687, "cells": [{"id": 127, "text": "Due to the heterogeneity across the dataset formats, it", "bbox": {"l": 320.81699, "t": 632.51419, "r": 545.11487, "b": 641.42075, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "was necessary to combine all available data into one homog-", "bbox": {"l": 308.862, "t": 644.46919, "r": 545.11511, "b": 653.37575, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "enized dataset before we could train our models for practi-", "bbox": {"l": 308.862, "t": 656.42419, "r": 545.11511, "b": 665.33076, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "cal purposes. Given the size of PubTabNet, we adopted its", "bbox": {"l": 308.862, "t": 668.38019, "r": 545.11499, "b": 677.28676, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "annotation format and we extracted and converted all tables", "bbox": {"l": 308.862, "t": 680.33519, "r": 545.11505, "b": 689.24176, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "as PNG images with a resolution of 72 dpi. Additionally,", "bbox": {"l": 308.862, "t": 692.290192, "r": 545.11505, "b": 701.196762, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "we have filtered out tables with extreme sizes due to small", "bbox": {"l": 308.862, "t": 704.245193, "r": 545.11511, "b": 713.151764, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Due to the heterogeneity across the dataset formats, it was necessary to combine all available data into one homogenized dataset before we could train our models for practical purposes. Given the size of PubTabNet, we adopted its annotation format and we extracted and converted all tables as PNG images with a resolution of 72 dpi. Additionally, we have filtered out tables with extreme sizes due to small"}], "headers": [{"label": "page_footer", "id": 11, "page_no": 2, "cluster": {"id": 11, "label": "page_footer", "bbox": {"l": 295.121, "t": 734.133198, "r": 300.10229, "b": 743.039761, "coord_origin": "TOPLEFT"}, "confidence": 0.8715606927871704, "cells": [{"id": 134, "text": "3", "bbox": {"l": 295.121, "t": 734.133198, "r": 300.10229, "b": 743.039761, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3"}]}}, {"page_no": 3, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "amount of such tables, and kept only those ones ranging", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 286.36511, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "between 1*1 and 20*10 (rows/columns).", "bbox": {"l": 50.112, "t": 87.16339000000005, "r": 212.28319, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "The availability of the bounding boxes for all table cells", "bbox": {"l": 62.067001, "t": 100.96038999999996, "r": 286.36502, "b": 109.86694, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "is essential to train our models. In order to distinguish be-", "bbox": {"l": 50.112, "t": 112.91540999999995, "r": 286.36508, "b": 121.82195999999999, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "tween empty and non-empty bounding boxes, we have in-", "bbox": {"l": 50.112, "t": 124.87041999999997, "r": 286.36508, "b": 133.77697999999998, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "troduced a binary class in the annotation. Unfortunately, the", "bbox": {"l": 50.112, "t": 136.82641999999998, "r": 286.36511, "b": 145.73297000000002, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "original datasets either omit the bounding boxes for whole", "bbox": {"l": 50.112, "t": 148.78143, "r": 286.36511, "b": 157.68799, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "tables (e.g. TableBank) or they narrow their scope only to", "bbox": {"l": 50.112, "t": 160.73645, "r": 286.36508, "b": 169.64301, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "non-empty cells. Therefore, it was imperative to introduce", "bbox": {"l": 50.112, "t": 172.69146999999998, "r": 286.36505, "b": 181.59802000000002, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "a data pre-processing procedure that generates the missing", "bbox": {"l": 50.112, "t": 184.64648, "r": 286.36508, "b": 193.55304, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "bounding boxes out of the annotation information. This pro-", "bbox": {"l": 50.112, "t": 196.60248, "r": 286.36508, "b": 205.50903000000005, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "cedure first parses the provided table structure and calcu-", "bbox": {"l": 50.112, "t": 208.5575, "r": 286.36508, "b": 217.46405000000004, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "lates the dimensions of the most fine-grained grid that cov-", "bbox": {"l": 50.112, "t": 220.51251000000002, "r": 286.36511, "b": 229.41907000000003, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "ers the table structure. Notice that each table cell may oc-", "bbox": {"l": 50.112, "t": 232.46753, "r": 286.36508, "b": 241.37408000000005, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "cupy multiple grid squares due to row or column spans. In", "bbox": {"l": 50.112, "t": 244.42255, "r": 286.36508, "b": 253.32910000000004, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "case of PubTabNet we had to compute missing bounding", "bbox": {"l": 50.112, "t": 256.37756, "r": 286.36505, "b": 265.28412000000003, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "boxes for 48% of the simple and 69% of the complex ta-", "bbox": {"l": 50.112, "t": 268.33356000000003, "r": 286.36505, "b": 277.24010999999996, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "bles.", "bbox": {"l": 50.112, "t": 280.28853999999995, "r": 68.652397, "b": 289.1951, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Regarding FinTabNet, 68% of the simple and 98%", "bbox": {"l": 75.566444, "t": 280.28853999999995, "r": 286.36514, "b": 289.1951, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "of the complex tables require the generation of bounding", "bbox": {"l": 50.112, "t": 292.24353, "r": 286.36511, "b": 301.15009, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "boxes.", "bbox": {"l": 50.112, "t": 304.19852000000003, "r": 75.695961, "b": 313.10507, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "As it is illustrated in Fig. 2, the table distributions from", "bbox": {"l": 62.067001, "t": 317.99550999999997, "r": 286.36499, "b": 326.90207, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "all datasets are skewed towards simpler structures with", "bbox": {"l": 50.112, "t": 329.95151, "r": 286.36511, "b": 338.8580600000001, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "fewer number of rows/columns. Additionally, there is very", "bbox": {"l": 50.112, "t": 341.90649, "r": 286.36502, "b": 350.81305, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "limited variance in the table styles, which in case of Pub-", "bbox": {"l": 50.112, "t": 353.8614799999999, "r": 286.36505, "b": 362.76804, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "TabNet and FinTabNet means one styling format for the", "bbox": {"l": 50.112, "t": 365.81647, "r": 286.36508, "b": 374.72301999999996, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "majority of the tables.", "bbox": {"l": 50.112, "t": 377.77145, "r": 141.58859, "b": 386.67801, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Similar limitations appear also in", "bbox": {"l": 148.70189, "t": 377.77145, "r": 286.36508, "b": 386.67801, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "the type of table content, which in some cases (e.g. FinTab-", "bbox": {"l": 50.112, "t": 389.72644, "r": 286.36508, "b": 398.63300000000004, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Net) is restricted to a certain domain. Ultimately, the lack", "bbox": {"l": 50.112, "t": 401.68243, "r": 286.36511, "b": 410.58899, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "of diversity in the training dataset damages the ability of the", "bbox": {"l": 50.112, "t": 413.63742, "r": 286.36511, "b": 422.54398, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "models to generalize well on unseen data.", "bbox": {"l": 50.112, "t": 425.59241, "r": 216.39774, "b": 434.49896, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Motivated by those observations we aimed at generating", "bbox": {"l": 62.067001, "t": 439.3894, "r": 286.36499, "b": 448.2959599999999, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "a synthetic table dataset named", "bbox": {"l": 50.112, "t": 451.34439, "r": 172.14388, "b": 460.25095, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "SynthTabNet", "bbox": {"l": 174.14801, "t": 451.43405, "r": 224.70818999999997, "b": 460.02182, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": ". This approach", "bbox": {"l": 224.70801, "t": 451.34439, "r": 286.36655, "b": 460.25095, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "offers control over: 1) the size of the dataset, 2) the table", "bbox": {"l": 50.112015, "t": 463.30038, "r": 286.36505, "b": 472.20694, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "structure, 3) the table style and 4) the type of content. The", "bbox": {"l": 50.112015, "t": 475.25537, "r": 286.36511, "b": 484.16193, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "complexity of the table structure is described by the size of", "bbox": {"l": 50.112015, "t": 487.21036, "r": 286.36511, "b": 496.11691, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "the table header and the table body, as well as the percentage", "bbox": {"l": 50.112015, "t": 499.16534, "r": 286.36508, "b": 508.0719, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "of the table cells covered by row spans and column spans.", "bbox": {"l": 50.112015, "t": 511.12033, "r": 286.36505, "b": 520.02689, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "A set of carefully designed styling templates provides the", "bbox": {"l": 50.112015, "t": 523.07632, "r": 286.36508, "b": 531.98288, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "basis to build a wide range of table appearances. Lastly, the", "bbox": {"l": 50.112015, "t": 535.0313100000001, "r": 286.36508, "b": 543.93788, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "table content is generated out of a curated collection of text", "bbox": {"l": 50.112015, "t": 546.98633, "r": 286.36511, "b": 555.89288, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "corpora. By controlling the size and scope of the synthetic", "bbox": {"l": 50.112015, "t": 558.94133, "r": 286.36508, "b": 567.84789, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "datasets we are able to train and evaluate our models in a", "bbox": {"l": 50.112015, "t": 570.89633, "r": 286.36511, "b": 579.8028899999999, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "variety of different conditions. For example, we can first", "bbox": {"l": 50.112015, "t": 582.85133, "r": 286.36511, "b": 591.75789, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "generate a highly diverse dataset to train our models and", "bbox": {"l": 50.112015, "t": 594.80733, "r": 286.36505, "b": 603.71388, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "then evaluate their performance on other synthetic datasets", "bbox": {"l": 50.112015, "t": 606.76233, "r": 286.36508, "b": 615.6688800000001, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "which are focused on a specific domain.", "bbox": {"l": 50.112015, "t": 618.71733, "r": 209.7527, "b": 627.62389, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "In this regard, we have prepared four synthetic datasets,", "bbox": {"l": 62.067017, "t": 632.51433, "r": 286.36499, "b": 641.42088, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "each one containing 150k examples. The corpora to gener-", "bbox": {"l": 50.112015, "t": 644.46933, "r": 286.36508, "b": 653.37589, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "ate the table text consists of the most frequent terms appear-", "bbox": {"l": 50.112015, "t": 656.42532, "r": 286.36511, "b": 665.33189, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "ing in PubTabNet and FinTabNet together with randomly", "bbox": {"l": 50.112015, "t": 668.38033, "r": 286.36505, "b": 677.28689, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "generated text. The first two synthetic datasets have been", "bbox": {"l": 50.112015, "t": 680.33533, "r": 286.36508, "b": 689.24189, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "fine-tuned to mimic the appearance of the original datasets", "bbox": {"l": 50.112015, "t": 692.290329, "r": 286.36508, "b": 701.196892, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "but encompass more complicated table structures. The third", "bbox": {"l": 50.112015, "t": 704.245331, "r": 286.36511, "b": 713.151894, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Tags", "bbox": {"l": 412.332, "t": 73.61437999999998, "r": 430.90231, "b": 82.52094, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Bbox", "bbox": {"l": 442.85742, "t": 73.61437999999998, "r": 464.4463799999999, "b": 82.52094, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Size", "bbox": {"l": 477.78632, "t": 73.61437999999998, "r": 494.94193, "b": 82.52094, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Format", "bbox": {"l": 508.28186, "t": 73.61437999999998, "r": 536.91437, "b": 82.52094, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "PubTabNet", "bbox": {"l": 317.06, "t": 85.9673499999999, "r": 361.64264, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "3", "bbox": {"l": 417.85599, "t": 85.6684600000001, "r": 425.37775, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "3", "bbox": {"l": 449.89569, "t": 85.6684600000001, "r": 457.41745000000003, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "509k", "bbox": {"l": 476.401, "t": 85.9673499999999, "r": 496.3262, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "PNG", "bbox": {"l": 512.63495, "t": 85.9673499999999, "r": 532.56012, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "FinTabNet", "bbox": {"l": 317.06, "t": 97.92236000000003, "r": 359.43094, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "3", "bbox": {"l": 417.85599, "t": 97.62347, "r": 425.37775, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "3", "bbox": {"l": 449.89569, "t": 97.62347, "r": 457.41745000000003, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "112k", "bbox": {"l": 476.401, "t": 97.92236000000003, "r": 496.3262, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "PDF", "bbox": {"l": 513.46185, "t": 97.92236000000003, "r": 531.73328, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "TableBank", "bbox": {"l": 317.06, "t": 109.87836000000004, "r": 359.97888, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "3", "bbox": {"l": 417.85599, "t": 109.57947000000001, "r": 425.37775, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "7", "bbox": {"l": 450.81226, "t": 109.57947000000001, "r": 456.50091999999995, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "145k", "bbox": {"l": 476.401, "t": 109.87836000000004, "r": 496.3262, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "JPEG", "bbox": {"l": 511.25017999999994, "t": 109.87836000000004, "r": 533.94501, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "Combined-Tabnet(*)", "bbox": {"l": 317.06, "t": 121.83336999999995, "r": 400.37723, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "3", "bbox": {"l": 417.85599, "t": 121.53448000000003, "r": 425.37775, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "3", "bbox": {"l": 449.89569, "t": 121.53448000000003, "r": 457.41745000000003, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "400k", "bbox": {"l": 476.401, "t": 121.83336999999995, "r": 496.3262, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "PNG", "bbox": {"l": 512.63495, "t": 121.83336999999995, "r": 532.56012, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Combined(**)", "bbox": {"l": 317.06, "t": 133.78839000000005, "r": 375.17184, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "3", "bbox": {"l": 417.85599, "t": 133.48950000000002, "r": 425.37775, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "3", "bbox": {"l": 449.89569, "t": 133.48950000000002, "r": 457.41745000000003, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "500k", "bbox": {"l": 476.401, "t": 133.78839000000005, "r": 496.3262, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "PNG", "bbox": {"l": 512.63495, "t": 133.78839000000005, "r": 532.56012, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "SynthTabNet", "bbox": {"l": 317.06, "t": 145.74341000000004, "r": 369.39352, "b": 154.64995999999996, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "3", "bbox": {"l": 417.85599, "t": 145.44446000000005, "r": 425.37775, "b": 154.65985, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "3", "bbox": {"l": 449.89569, "t": 145.44446000000005, "r": 457.41745000000003, "b": 154.65985, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "600k", "bbox": {"l": 476.401, "t": 145.74334999999996, "r": 496.3262, "b": 154.6499, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "PNG", "bbox": {"l": 512.63495, "t": 145.74334999999996, "r": 532.56012, "b": 154.6499, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "Table 1:", "bbox": {"l": 308.862, "t": 167.66138, "r": 344.6178, "b": 176.56793000000005, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Both", "bbox": {"l": 361.07602, "t": 167.66138, "r": 380.45328, "b": 176.56793000000005, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "\u201cCombined-Tabnet\u201d", "bbox": {"l": 386.56799, "t": 167.75104, "r": 468.67974999999996, "b": 176.33880999999997, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "and", "bbox": {"l": 474.79599, "t": 167.66138, "r": 489.18198, "b": 176.56793000000005, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "\u201dCombined-", "bbox": {"l": 495.29898000000003, "t": 167.75104, "r": 545.112, "b": 176.33880999999997, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "Tabnet\u201d", "bbox": {"l": 308.862, "t": 179.70605, "r": 341.16077, "b": 188.29381999999998, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "are variations of the following: (*) The Combined-", "bbox": {"l": 343.457, "t": 179.61639000000002, "r": 545.11005, "b": 188.52295000000004, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "Tabnet dataset is the processed combination of PubTabNet", "bbox": {"l": 308.862, "t": 191.57141000000001, "r": 545.11505, "b": 200.47797000000003, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "and Fintabnet. (**) The combined dataset is the processed", "bbox": {"l": 308.862, "t": 203.52643, "r": 545.11499, "b": 212.43298000000004, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "combination of PubTabNet, Fintabnet and TableBank.", "bbox": {"l": 308.862, "t": 215.48242000000005, "r": 523.93469, "b": 224.38897999999995, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "one adopts a colorful appearance with high contrast and the", "bbox": {"l": 308.862, "t": 249.62041999999997, "r": 545.11517, "b": 258.52698, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "last one contains tables with sparse content. Lastly, we have", "bbox": {"l": 308.862, "t": 261.57543999999996, "r": 545.11517, "b": 270.48199, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "combined all synthetic datasets into one big unified syn-", "bbox": {"l": 308.862, "t": 273.5304, "r": 545.11505, "b": 282.43698, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "thetic dataset of 600k examples.", "bbox": {"l": 308.862, "t": 285.48541000000006, "r": 436.82169, "b": 294.39197, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "Tab. 1 summarizes the various attributes of the datasets.", "bbox": {"l": 320.81699, "t": 297.77240000000006, "r": 542.74396, "b": 306.67896, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "4.", "bbox": {"l": 308.862, "t": 321.18396, "r": 316.28476, "b": 331.93167000000005, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "The TableFormer model", "bbox": {"l": 326.18176, "t": 321.18396, "r": 444.93607000000003, "b": 331.93167000000005, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "Given the image of a table, TableFormer is able to pre-", "bbox": {"l": 320.81699, "t": 341.93939, "r": 545.11499, "b": 350.84594999999996, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "dict: 1) a sequence of tokens that represent the structure of", "bbox": {"l": 308.862, "t": 353.89438, "r": 545.11511, "b": 362.80092999999994, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "a table, and 2) a bounding box coupled to a subset of those", "bbox": {"l": 308.862, "t": 365.84937, "r": 545.11517, "b": 374.75592, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "tokens. The conversion of an image into a sequence of to-", "bbox": {"l": 308.862, "t": 377.80435, "r": 545.11505, "b": 386.71091, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "kens is a well-known task [35, 16]. While attention is often", "bbox": {"l": 308.862, "t": 389.75934000000007, "r": 545.11517, "b": 398.66588999999993, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "used as an implicit method to associate each token of the", "bbox": {"l": 308.862, "t": 401.71432000000004, "r": 545.11523, "b": 410.62088, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "sequence with a position in the original image, an explicit", "bbox": {"l": 308.862, "t": 413.67032, "r": 545.11517, "b": 422.57687, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "association between the individual table-cells and the image", "bbox": {"l": 308.862, "t": 425.62531, "r": 545.11505, "b": 434.53186, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "bounding boxes is also required.", "bbox": {"l": 308.862, "t": 437.58029, "r": 437.9375, "b": 446.48685000000006, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "4.1.", "bbox": {"l": 308.862, "t": 457.69427, "r": 323.14081, "b": 467.54633, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "Model architecture.", "bbox": {"l": 332.66003, "t": 457.69427, "r": 420.16058, "b": 467.54633, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "We now describe in detail the proposed method, which", "bbox": {"l": 320.81699, "t": 476.76529, "r": 545.11487, "b": 485.67184, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "is composed of three main components, see Fig.", "bbox": {"l": 308.862, "t": 488.72028, "r": 509.02054, "b": 497.62683, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "4.", "bbox": {"l": 515.58588, "t": 488.72028, "r": 523.05786, "b": 497.62683, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Our", "bbox": {"l": 529.62323, "t": 488.72028, "r": 545.11505, "b": 497.62683, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "CNN Backbone Network", "bbox": {"l": 308.862, "t": 500.76492, "r": 406.34601, "b": 509.35269, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "encodes the input as a feature vec-", "bbox": {"l": 408.87201, "t": 500.67526, "r": 545.1106, "b": 509.58182, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "tor of predefined length.", "bbox": {"l": 308.862, "t": 512.63126, "r": 409.39459, "b": 521.53781, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "The input feature vector of the", "bbox": {"l": 416.72705, "t": 512.63126, "r": 545.11505, "b": 521.53781, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "encoded image is passed to the", "bbox": {"l": 308.862, "t": 524.58624, "r": 436.194, "b": 533.4928, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "Structure Decoder", "bbox": {"l": 439.526, "t": 524.6759, "r": 513.86694, "b": 533.26367, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "to pro-", "bbox": {"l": 517.43201, "t": 524.58624, "r": 545.10815, "b": 533.4928, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "duce a sequence of HTML tags that represent the structure", "bbox": {"l": 308.862, "t": 536.54124, "r": 545.11511, "b": 545.4478, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "of the table.", "bbox": {"l": 308.862, "t": 548.49625, "r": 358.5455, "b": 557.4028000000001, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "With each prediction of an HTML standard", "bbox": {"l": 365.19055, "t": 548.49625, "r": 545.11517, "b": 557.4028000000001, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "data cell (\u2018", "bbox": {"l": 308.862, "t": 560.45125, "r": 352.40851, "b": 569.3578, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "<", "bbox": {"l": 352.409, "t": 560.29184, "r": 360.1579, "b": 569.13863, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "td", "bbox": {"l": 360.15799, "t": 560.45125, "r": 367.90891, "b": 569.3578, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": ">", "bbox": {"l": 367.909, "t": 560.29184, "r": 375.6579, "b": 569.13863, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "\u2019) the hidden state of that cell is passed to", "bbox": {"l": 375.65799, "t": 560.45125, "r": 545.11182, "b": 569.3578, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "the Cell BBox Decoder. As for spanning cells, such as row", "bbox": {"l": 308.862, "t": 572.40724, "r": 545.11499, "b": 581.3138, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "or column span, the tag is broken down to \u2018", "bbox": {"l": 308.862, "t": 584.3622399999999, "r": 483.11768, "b": 593.2688, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "<", "bbox": {"l": 483.11902, "t": 584.20284, "r": 490.86792, "b": 593.04962, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "\u2019, \u2018rowspan=\u2019", "bbox": {"l": 490.86800999999997, "t": 584.3622399999999, "r": 545.11438, "b": 593.2688, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "or \u2018colspan=\u2019, with the number of spanning cells (attribute),", "bbox": {"l": 308.862, "t": 596.31725, "r": 545.11493, "b": 605.2238, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "and \u2018", "bbox": {"l": 308.862, "t": 608.27225, "r": 329.64395, "b": 617.1788, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": ">", "bbox": {"l": 329.646, "t": 608.11284, "r": 337.3949, "b": 616.9596300000001, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "\u2019. The hidden state attached to \u2018", "bbox": {"l": 337.39398, "t": 608.27225, "r": 468.5914, "b": 617.1788, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "<", "bbox": {"l": 468.59496999999993, "t": 608.11284, "r": 476.34387000000004, "b": 616.9596300000001, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "\u2019 is passed to the", "bbox": {"l": 476.3439599999999, "t": 608.27225, "r": 545.11572, "b": 617.1788, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "Cell BBox Decoder. A shared feed forward network (FFN)", "bbox": {"l": 308.86197, "t": 620.22725, "r": 545.11499, "b": 629.1338000000001, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "receives the hidden states from the Structure Decoder, to", "bbox": {"l": 308.86197, "t": 632.1822500000001, "r": 545.11517, "b": 641.08881, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "provide the final detection predictions of the bounding box", "bbox": {"l": 308.86197, "t": 644.13824, "r": 545.11511, "b": 653.0448, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "coordinates and their classification.", "bbox": {"l": 308.86197, "t": 656.09325, "r": 449.42432, "b": 664.99981, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "CNN Backbone Network.", "bbox": {"l": 320.81696, "t": 668.2607, "r": 431.90985, "b": 677.21707, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "A ResNet-18 CNN is the", "bbox": {"l": 439.49896, "t": 668.3802499999999, "r": 545.11255, "b": 677.2868100000001, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "backbone that receives the table image and encodes it as a", "bbox": {"l": 308.86197, "t": 680.33525, "r": 545.11499, "b": 689.24181, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "vector of predefined length. The network has been modified", "bbox": {"l": 308.86197, "t": 692.290253, "r": 545.11511, "b": 701.196815, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "by removing the linear and pooling layer, as we are not per-", "bbox": {"l": 308.86197, "t": 704.245255, "r": 545.11505, "b": 713.1518169999999, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "4", "bbox": {"l": 295.12097, "t": 734.133251, "r": 300.10226, "b": 743.039814, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 10, "label": "text", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 286.36511, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9611433148384094, "cells": [{"id": 0, "text": "amount of such tables, and kept only those ones ranging", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 286.36511, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "between 1*1 and 20*10 (rows/columns).", "bbox": {"l": 50.112, "t": 87.16339000000005, "r": 212.28319, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 50.112, "t": 100.96038999999996, "r": 286.36514, "b": 313.10507, "coord_origin": "TOPLEFT"}, "confidence": 0.988013744354248, "cells": [{"id": 2, "text": "The availability of the bounding boxes for all table cells", "bbox": {"l": 62.067001, "t": 100.96038999999996, "r": 286.36502, "b": 109.86694, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "is essential to train our models. In order to distinguish be-", "bbox": {"l": 50.112, "t": 112.91540999999995, "r": 286.36508, "b": 121.82195999999999, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "tween empty and non-empty bounding boxes, we have in-", "bbox": {"l": 50.112, "t": 124.87041999999997, "r": 286.36508, "b": 133.77697999999998, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "troduced a binary class in the annotation. Unfortunately, the", "bbox": {"l": 50.112, "t": 136.82641999999998, "r": 286.36511, "b": 145.73297000000002, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "original datasets either omit the bounding boxes for whole", "bbox": {"l": 50.112, "t": 148.78143, "r": 286.36511, "b": 157.68799, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "tables (e.g. TableBank) or they narrow their scope only to", "bbox": {"l": 50.112, "t": 160.73645, "r": 286.36508, "b": 169.64301, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "non-empty cells. Therefore, it was imperative to introduce", "bbox": {"l": 50.112, "t": 172.69146999999998, "r": 286.36505, "b": 181.59802000000002, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "a data pre-processing procedure that generates the missing", "bbox": {"l": 50.112, "t": 184.64648, "r": 286.36508, "b": 193.55304, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "bounding boxes out of the annotation information. This pro-", "bbox": {"l": 50.112, "t": 196.60248, "r": 286.36508, "b": 205.50903000000005, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "cedure first parses the provided table structure and calcu-", "bbox": {"l": 50.112, "t": 208.5575, "r": 286.36508, "b": 217.46405000000004, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "lates the dimensions of the most fine-grained grid that cov-", "bbox": {"l": 50.112, "t": 220.51251000000002, "r": 286.36511, "b": 229.41907000000003, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "ers the table structure. Notice that each table cell may oc-", "bbox": {"l": 50.112, "t": 232.46753, "r": 286.36508, "b": 241.37408000000005, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "cupy multiple grid squares due to row or column spans. In", "bbox": {"l": 50.112, "t": 244.42255, "r": 286.36508, "b": 253.32910000000004, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "case of PubTabNet we had to compute missing bounding", "bbox": {"l": 50.112, "t": 256.37756, "r": 286.36505, "b": 265.28412000000003, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "boxes for 48% of the simple and 69% of the complex ta-", "bbox": {"l": 50.112, "t": 268.33356000000003, "r": 286.36505, "b": 277.24010999999996, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "bles.", "bbox": {"l": 50.112, "t": 280.28853999999995, "r": 68.652397, "b": 289.1951, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Regarding FinTabNet, 68% of the simple and 98%", "bbox": {"l": 75.566444, "t": 280.28853999999995, "r": 286.36514, "b": 289.1951, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "of the complex tables require the generation of bounding", "bbox": {"l": 50.112, "t": 292.24353, "r": 286.36511, "b": 301.15009, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "boxes.", "bbox": {"l": 50.112, "t": 304.19852000000003, "r": 75.695961, "b": 313.10507, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "text", "bbox": {"l": 50.112, "t": 317.99550999999997, "r": 286.36511, "b": 434.49896, "coord_origin": "TOPLEFT"}, "confidence": 0.9873981475830078, "cells": [{"id": 21, "text": "As it is illustrated in Fig. 2, the table distributions from", "bbox": {"l": 62.067001, "t": 317.99550999999997, "r": 286.36499, "b": 326.90207, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "all datasets are skewed towards simpler structures with", "bbox": {"l": 50.112, "t": 329.95151, "r": 286.36511, "b": 338.8580600000001, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "fewer number of rows/columns. Additionally, there is very", "bbox": {"l": 50.112, "t": 341.90649, "r": 286.36502, "b": 350.81305, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "limited variance in the table styles, which in case of Pub-", "bbox": {"l": 50.112, "t": 353.8614799999999, "r": 286.36505, "b": 362.76804, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "TabNet and FinTabNet means one styling format for the", "bbox": {"l": 50.112, "t": 365.81647, "r": 286.36508, "b": 374.72301999999996, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "majority of the tables.", "bbox": {"l": 50.112, "t": 377.77145, "r": 141.58859, "b": 386.67801, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Similar limitations appear also in", "bbox": {"l": 148.70189, "t": 377.77145, "r": 286.36508, "b": 386.67801, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "the type of table content, which in some cases (e.g. FinTab-", "bbox": {"l": 50.112, "t": 389.72644, "r": 286.36508, "b": 398.63300000000004, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Net) is restricted to a certain domain. Ultimately, the lack", "bbox": {"l": 50.112, "t": 401.68243, "r": 286.36511, "b": 410.58899, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "of diversity in the training dataset damages the ability of the", "bbox": {"l": 50.112, "t": 413.63742, "r": 286.36511, "b": 422.54398, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "models to generalize well on unseen data.", "bbox": {"l": 50.112, "t": 425.59241, "r": 216.39774, "b": 434.49896, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 50.112, "t": 439.3894, "r": 286.36655, "b": 627.62389, "coord_origin": "TOPLEFT"}, "confidence": 0.9876030087471008, "cells": [{"id": 32, "text": "Motivated by those observations we aimed at generating", "bbox": {"l": 62.067001, "t": 439.3894, "r": 286.36499, "b": 448.2959599999999, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "a synthetic table dataset named", "bbox": {"l": 50.112, "t": 451.34439, "r": 172.14388, "b": 460.25095, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "SynthTabNet", "bbox": {"l": 174.14801, "t": 451.43405, "r": 224.70818999999997, "b": 460.02182, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": ". This approach", "bbox": {"l": 224.70801, "t": 451.34439, "r": 286.36655, "b": 460.25095, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "offers control over: 1) the size of the dataset, 2) the table", "bbox": {"l": 50.112015, "t": 463.30038, "r": 286.36505, "b": 472.20694, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "structure, 3) the table style and 4) the type of content. The", "bbox": {"l": 50.112015, "t": 475.25537, "r": 286.36511, "b": 484.16193, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "complexity of the table structure is described by the size of", "bbox": {"l": 50.112015, "t": 487.21036, "r": 286.36511, "b": 496.11691, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "the table header and the table body, as well as the percentage", "bbox": {"l": 50.112015, "t": 499.16534, "r": 286.36508, "b": 508.0719, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "of the table cells covered by row spans and column spans.", "bbox": {"l": 50.112015, "t": 511.12033, "r": 286.36505, "b": 520.02689, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "A set of carefully designed styling templates provides the", "bbox": {"l": 50.112015, "t": 523.07632, "r": 286.36508, "b": 531.98288, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "basis to build a wide range of table appearances. Lastly, the", "bbox": {"l": 50.112015, "t": 535.0313100000001, "r": 286.36508, "b": 543.93788, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "table content is generated out of a curated collection of text", "bbox": {"l": 50.112015, "t": 546.98633, "r": 286.36511, "b": 555.89288, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "corpora. By controlling the size and scope of the synthetic", "bbox": {"l": 50.112015, "t": 558.94133, "r": 286.36508, "b": 567.84789, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "datasets we are able to train and evaluate our models in a", "bbox": {"l": 50.112015, "t": 570.89633, "r": 286.36511, "b": 579.8028899999999, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "variety of different conditions. For example, we can first", "bbox": {"l": 50.112015, "t": 582.85133, "r": 286.36511, "b": 591.75789, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "generate a highly diverse dataset to train our models and", "bbox": {"l": 50.112015, "t": 594.80733, "r": 286.36505, "b": 603.71388, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "then evaluate their performance on other synthetic datasets", "bbox": {"l": 50.112015, "t": 606.76233, "r": 286.36508, "b": 615.6688800000001, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "which are focused on a specific domain.", "bbox": {"l": 50.112015, "t": 618.71733, "r": 209.7527, "b": 627.62389, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "text", "bbox": {"l": 50.112015, "t": 632.51433, "r": 286.36511, "b": 713.151894, "coord_origin": "TOPLEFT"}, "confidence": 0.9871614575386047, "cells": [{"id": 50, "text": "In this regard, we have prepared four synthetic datasets,", "bbox": {"l": 62.067017, "t": 632.51433, "r": 286.36499, "b": 641.42088, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "each one containing 150k examples. The corpora to gener-", "bbox": {"l": 50.112015, "t": 644.46933, "r": 286.36508, "b": 653.37589, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "ate the table text consists of the most frequent terms appear-", "bbox": {"l": 50.112015, "t": 656.42532, "r": 286.36511, "b": 665.33189, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "ing in PubTabNet and FinTabNet together with randomly", "bbox": {"l": 50.112015, "t": 668.38033, "r": 286.36505, "b": 677.28689, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "generated text. The first two synthetic datasets have been", "bbox": {"l": 50.112015, "t": 680.33533, "r": 286.36508, "b": 689.24189, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "fine-tuned to mimic the appearance of the original datasets", "bbox": {"l": 50.112015, "t": 692.290329, "r": 286.36508, "b": 701.196892, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "but encompass more complicated table structures. The third", "bbox": {"l": 50.112015, "t": 704.245331, "r": 286.36511, "b": 713.151894, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "table", "bbox": {"l": 310.67584228515625, "t": 73.19388580322266, "r": 542.9547119140625, "b": 155.22052001953125, "coord_origin": "TOPLEFT"}, "confidence": 0.9777463674545288, "cells": [{"id": 57, "text": "Tags", "bbox": {"l": 412.332, "t": 73.61437999999998, "r": 430.90231, "b": 82.52094, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Bbox", "bbox": {"l": 442.85742, "t": 73.61437999999998, "r": 464.4463799999999, "b": 82.52094, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Size", "bbox": {"l": 477.78632, "t": 73.61437999999998, "r": 494.94193, "b": 82.52094, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Format", "bbox": {"l": 508.28186, "t": 73.61437999999998, "r": 536.91437, "b": 82.52094, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "PubTabNet", "bbox": {"l": 317.06, "t": 85.9673499999999, "r": 361.64264, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "3", "bbox": {"l": 417.85599, "t": 85.6684600000001, "r": 425.37775, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "3", "bbox": {"l": 449.89569, "t": 85.6684600000001, "r": 457.41745000000003, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "509k", "bbox": {"l": 476.401, "t": 85.9673499999999, "r": 496.3262, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "PNG", "bbox": {"l": 512.63495, "t": 85.9673499999999, "r": 532.56012, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "FinTabNet", "bbox": {"l": 317.06, "t": 97.92236000000003, "r": 359.43094, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "3", "bbox": {"l": 417.85599, "t": 97.62347, "r": 425.37775, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "3", "bbox": {"l": 449.89569, "t": 97.62347, "r": 457.41745000000003, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "112k", "bbox": {"l": 476.401, "t": 97.92236000000003, "r": 496.3262, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "PDF", "bbox": {"l": 513.46185, "t": 97.92236000000003, "r": 531.73328, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "TableBank", "bbox": {"l": 317.06, "t": 109.87836000000004, "r": 359.97888, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "3", "bbox": {"l": 417.85599, "t": 109.57947000000001, "r": 425.37775, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "7", "bbox": {"l": 450.81226, "t": 109.57947000000001, "r": 456.50091999999995, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "145k", "bbox": {"l": 476.401, "t": 109.87836000000004, "r": 496.3262, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "JPEG", "bbox": {"l": 511.25017999999994, "t": 109.87836000000004, "r": 533.94501, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "Combined-Tabnet(*)", "bbox": {"l": 317.06, "t": 121.83336999999995, "r": 400.37723, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "3", "bbox": {"l": 417.85599, "t": 121.53448000000003, "r": 425.37775, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "3", "bbox": {"l": 449.89569, "t": 121.53448000000003, "r": 457.41745000000003, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "400k", "bbox": {"l": 476.401, "t": 121.83336999999995, "r": 496.3262, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "PNG", "bbox": {"l": 512.63495, "t": 121.83336999999995, "r": 532.56012, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Combined(**)", "bbox": {"l": 317.06, "t": 133.78839000000005, "r": 375.17184, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "3", "bbox": {"l": 417.85599, "t": 133.48950000000002, "r": 425.37775, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "3", "bbox": {"l": 449.89569, "t": 133.48950000000002, "r": 457.41745000000003, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "500k", "bbox": {"l": 476.401, "t": 133.78839000000005, "r": 496.3262, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "PNG", "bbox": {"l": 512.63495, "t": 133.78839000000005, "r": 532.56012, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "SynthTabNet", "bbox": {"l": 317.06, "t": 145.74341000000004, "r": 369.39352, "b": 154.64995999999996, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "3", "bbox": {"l": 417.85599, "t": 145.44446000000005, "r": 425.37775, "b": 154.65985, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "3", "bbox": {"l": 449.89569, "t": 145.44446000000005, "r": 457.41745000000003, "b": 154.65985, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "600k", "bbox": {"l": 476.401, "t": 145.74334999999996, "r": 496.3262, "b": 154.6499, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "PNG", "bbox": {"l": 512.63495, "t": 145.74334999999996, "r": 532.56012, "b": 154.6499, "coord_origin": "TOPLEFT"}}], "children": [{"id": 15, "label": "text", "bbox": {"l": 412.332, "t": 73.61437999999998, "r": 430.90231, "b": 82.52094, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "Tags", "bbox": {"l": 412.332, "t": 73.61437999999998, "r": 430.90231, "b": 82.52094, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 442.85742, "t": 73.61437999999998, "r": 464.4463799999999, "b": 82.52094, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "Bbox", "bbox": {"l": 442.85742, "t": 73.61437999999998, "r": 464.4463799999999, "b": 82.52094, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 477.78632, "t": 73.61437999999998, "r": 494.94193, "b": 82.52094, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "Size", "bbox": {"l": 477.78632, "t": 73.61437999999998, "r": 494.94193, "b": 82.52094, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 508.28186, "t": 73.61437999999998, "r": 536.91437, "b": 82.52094, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "Format", "bbox": {"l": 508.28186, "t": 73.61437999999998, "r": 536.91437, "b": 82.52094, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 317.06, "t": 85.9673499999999, "r": 361.64264, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "PubTabNet", "bbox": {"l": 317.06, "t": 85.9673499999999, "r": 361.64264, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 417.85599, "t": 85.6684600000001, "r": 425.37775, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "3", "bbox": {"l": 417.85599, "t": 85.6684600000001, "r": 425.37775, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 449.89569, "t": 85.6684600000001, "r": 457.41745000000003, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "3", "bbox": {"l": 449.89569, "t": 85.6684600000001, "r": 457.41745000000003, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 476.401, "t": 85.9673499999999, "r": 496.3262, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "509k", "bbox": {"l": 476.401, "t": 85.9673499999999, "r": 496.3262, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 512.63495, "t": 85.9673499999999, "r": 532.56012, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "PNG", "bbox": {"l": 512.63495, "t": 85.9673499999999, "r": 532.56012, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 317.06, "t": 97.92236000000003, "r": 359.43094, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "FinTabNet", "bbox": {"l": 317.06, "t": 97.92236000000003, "r": 359.43094, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 417.85599, "t": 97.62347, "r": 425.37775, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "3", "bbox": {"l": 417.85599, "t": 97.62347, "r": 425.37775, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 449.89569, "t": 97.62347, "r": 457.41745000000003, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "3", "bbox": {"l": 449.89569, "t": 97.62347, "r": 457.41745000000003, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 476.401, "t": 97.92236000000003, "r": 496.3262, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "112k", "bbox": {"l": 476.401, "t": 97.92236000000003, "r": 496.3262, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 513.46185, "t": 97.92236000000003, "r": 531.73328, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "PDF", "bbox": {"l": 513.46185, "t": 97.92236000000003, "r": 531.73328, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 317.06, "t": 109.87836000000004, "r": 359.97888, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "TableBank", "bbox": {"l": 317.06, "t": 109.87836000000004, "r": 359.97888, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 417.85599, "t": 109.57947000000001, "r": 425.37775, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "3", "bbox": {"l": 417.85599, "t": 109.57947000000001, "r": 425.37775, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 450.81226, "t": 109.57947000000001, "r": 456.50091999999995, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "7", "bbox": {"l": 450.81226, "t": 109.57947000000001, "r": 456.50091999999995, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 476.401, "t": 109.87836000000004, "r": 496.3262, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "145k", "bbox": {"l": 476.401, "t": 109.87836000000004, "r": 496.3262, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 511.25017999999994, "t": 109.87836000000004, "r": 533.94501, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "JPEG", "bbox": {"l": 511.25017999999994, "t": 109.87836000000004, "r": 533.94501, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 317.06, "t": 121.83336999999995, "r": 400.37723, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "Combined-Tabnet(*)", "bbox": {"l": 317.06, "t": 121.83336999999995, "r": 400.37723, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 417.85599, "t": 121.53448000000003, "r": 425.37775, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "3", "bbox": {"l": 417.85599, "t": 121.53448000000003, "r": 425.37775, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 449.89569, "t": 121.53448000000003, "r": 457.41745000000003, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "3", "bbox": {"l": 449.89569, "t": 121.53448000000003, "r": 457.41745000000003, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 476.401, "t": 121.83336999999995, "r": 496.3262, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "400k", "bbox": {"l": 476.401, "t": 121.83336999999995, "r": 496.3262, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 512.63495, "t": 121.83336999999995, "r": 532.56012, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "PNG", "bbox": {"l": 512.63495, "t": 121.83336999999995, "r": 532.56012, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 317.06, "t": 133.78839000000005, "r": 375.17184, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "Combined(**)", "bbox": {"l": 317.06, "t": 133.78839000000005, "r": 375.17184, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 417.85599, "t": 133.48950000000002, "r": 425.37775, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "3", "bbox": {"l": 417.85599, "t": 133.48950000000002, "r": 425.37775, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 449.89569, "t": 133.48950000000002, "r": 457.41745000000003, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "3", "bbox": {"l": 449.89569, "t": 133.48950000000002, "r": 457.41745000000003, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 476.401, "t": 133.78839000000005, "r": 496.3262, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "500k", "bbox": {"l": 476.401, "t": 133.78839000000005, "r": 496.3262, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 512.63495, "t": 133.78839000000005, "r": 532.56012, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "PNG", "bbox": {"l": 512.63495, "t": 133.78839000000005, "r": 532.56012, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 317.06, "t": 145.74341000000004, "r": 369.39352, "b": 154.64995999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "SynthTabNet", "bbox": {"l": 317.06, "t": 145.74341000000004, "r": 369.39352, "b": 154.64995999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 417.85599, "t": 145.44446000000005, "r": 425.37775, "b": 154.65985, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "3", "bbox": {"l": 417.85599, "t": 145.44446000000005, "r": 425.37775, "b": 154.65985, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 449.89569, "t": 145.44446000000005, "r": 457.41745000000003, "b": 154.65985, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "3", "bbox": {"l": 449.89569, "t": 145.44446000000005, "r": 457.41745000000003, "b": 154.65985, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 476.401, "t": 145.74334999999996, "r": 496.3262, "b": 154.6499, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "600k", "bbox": {"l": 476.401, "t": 145.74334999999996, "r": 496.3262, "b": 154.6499, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 512.63495, "t": 145.74334999999996, "r": 532.56012, "b": 154.6499, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "PNG", "bbox": {"l": 512.63495, "t": 145.74334999999996, "r": 532.56012, "b": 154.6499, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 9, "label": "caption", "bbox": {"l": 308.862, "t": 167.66138, "r": 545.11505, "b": 224.38897999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9667726755142212, "cells": [{"id": 91, "text": "Table 1:", "bbox": {"l": 308.862, "t": 167.66138, "r": 344.6178, "b": 176.56793000000005, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Both", "bbox": {"l": 361.07602, "t": 167.66138, "r": 380.45328, "b": 176.56793000000005, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "\u201cCombined-Tabnet\u201d", "bbox": {"l": 386.56799, "t": 167.75104, "r": 468.67974999999996, "b": 176.33880999999997, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "and", "bbox": {"l": 474.79599, "t": 167.66138, "r": 489.18198, "b": 176.56793000000005, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "\u201dCombined-", "bbox": {"l": 495.29898000000003, "t": 167.75104, "r": 545.112, "b": 176.33880999999997, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "Tabnet\u201d", "bbox": {"l": 308.862, "t": 179.70605, "r": 341.16077, "b": 188.29381999999998, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "are variations of the following: (*) The Combined-", "bbox": {"l": 343.457, "t": 179.61639000000002, "r": 545.11005, "b": 188.52295000000004, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "Tabnet dataset is the processed combination of PubTabNet", "bbox": {"l": 308.862, "t": 191.57141000000001, "r": 545.11505, "b": 200.47797000000003, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "and Fintabnet. (**) The combined dataset is the processed", "bbox": {"l": 308.862, "t": 203.52643, "r": 545.11499, "b": 212.43298000000004, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "combination of PubTabNet, Fintabnet and TableBank.", "bbox": {"l": 308.862, "t": 215.48242000000005, "r": 523.93469, "b": 224.38897999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "text", "bbox": {"l": 308.862, "t": 249.62041999999997, "r": 545.11517, "b": 294.39197, "coord_origin": "TOPLEFT"}, "confidence": 0.978954017162323, "cells": [{"id": 101, "text": "one adopts a colorful appearance with high contrast and the", "bbox": {"l": 308.862, "t": 249.62041999999997, "r": 545.11517, "b": 258.52698, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "last one contains tables with sparse content. Lastly, we have", "bbox": {"l": 308.862, "t": 261.57543999999996, "r": 545.11517, "b": 270.48199, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "combined all synthetic datasets into one big unified syn-", "bbox": {"l": 308.862, "t": 273.5304, "r": 545.11505, "b": 282.43698, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "thetic dataset of 600k examples.", "bbox": {"l": 308.862, "t": 285.48541000000006, "r": 436.82169, "b": 294.39197, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 320.81699, "t": 297.77240000000006, "r": 542.74396, "b": 306.67896, "coord_origin": "TOPLEFT"}, "confidence": 0.9043695330619812, "cells": [{"id": 105, "text": "Tab. 1 summarizes the various attributes of the datasets.", "bbox": {"l": 320.81699, "t": 297.77240000000006, "r": 542.74396, "b": 306.67896, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "section_header", "bbox": {"l": 308.862, "t": 321.18396, "r": 444.93607000000003, "b": 331.93167000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9466595649719238, "cells": [{"id": 106, "text": "4.", "bbox": {"l": 308.862, "t": 321.18396, "r": 316.28476, "b": 331.93167000000005, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "The TableFormer model", "bbox": {"l": 326.18176, "t": 321.18396, "r": 444.93607000000003, "b": 331.93167000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 308.862, "t": 341.93939, "r": 545.11523, "b": 446.48685000000006, "coord_origin": "TOPLEFT"}, "confidence": 0.9884450435638428, "cells": [{"id": 108, "text": "Given the image of a table, TableFormer is able to pre-", "bbox": {"l": 320.81699, "t": 341.93939, "r": 545.11499, "b": 350.84594999999996, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "dict: 1) a sequence of tokens that represent the structure of", "bbox": {"l": 308.862, "t": 353.89438, "r": 545.11511, "b": 362.80092999999994, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "a table, and 2) a bounding box coupled to a subset of those", "bbox": {"l": 308.862, "t": 365.84937, "r": 545.11517, "b": 374.75592, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "tokens. The conversion of an image into a sequence of to-", "bbox": {"l": 308.862, "t": 377.80435, "r": 545.11505, "b": 386.71091, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "kens is a well-known task [35, 16]. While attention is often", "bbox": {"l": 308.862, "t": 389.75934000000007, "r": 545.11517, "b": 398.66588999999993, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "used as an implicit method to associate each token of the", "bbox": {"l": 308.862, "t": 401.71432000000004, "r": 545.11523, "b": 410.62088, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "sequence with a position in the original image, an explicit", "bbox": {"l": 308.862, "t": 413.67032, "r": 545.11517, "b": 422.57687, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "association between the individual table-cells and the image", "bbox": {"l": 308.862, "t": 425.62531, "r": 545.11505, "b": 434.53186, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "bounding boxes is also required.", "bbox": {"l": 308.862, "t": 437.58029, "r": 437.9375, "b": 446.48685000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "section_header", "bbox": {"l": 308.862, "t": 457.69427, "r": 420.16058, "b": 467.54633, "coord_origin": "TOPLEFT"}, "confidence": 0.937696099281311, "cells": [{"id": 117, "text": "4.1.", "bbox": {"l": 308.862, "t": 457.69427, "r": 323.14081, "b": 467.54633, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "Model architecture.", "bbox": {"l": 332.66003, "t": 457.69427, "r": 420.16058, "b": 467.54633, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 308.86197, "t": 476.76529, "r": 545.11572, "b": 664.99981, "coord_origin": "TOPLEFT"}, "confidence": 0.9878323078155518, "cells": [{"id": 119, "text": "We now describe in detail the proposed method, which", "bbox": {"l": 320.81699, "t": 476.76529, "r": 545.11487, "b": 485.67184, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "is composed of three main components, see Fig.", "bbox": {"l": 308.862, "t": 488.72028, "r": 509.02054, "b": 497.62683, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "4.", "bbox": {"l": 515.58588, "t": 488.72028, "r": 523.05786, "b": 497.62683, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Our", "bbox": {"l": 529.62323, "t": 488.72028, "r": 545.11505, "b": 497.62683, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "CNN Backbone Network", "bbox": {"l": 308.862, "t": 500.76492, "r": 406.34601, "b": 509.35269, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "encodes the input as a feature vec-", "bbox": {"l": 408.87201, "t": 500.67526, "r": 545.1106, "b": 509.58182, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "tor of predefined length.", "bbox": {"l": 308.862, "t": 512.63126, "r": 409.39459, "b": 521.53781, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "The input feature vector of the", "bbox": {"l": 416.72705, "t": 512.63126, "r": 545.11505, "b": 521.53781, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "encoded image is passed to the", "bbox": {"l": 308.862, "t": 524.58624, "r": 436.194, "b": 533.4928, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "Structure Decoder", "bbox": {"l": 439.526, "t": 524.6759, "r": 513.86694, "b": 533.26367, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "to pro-", "bbox": {"l": 517.43201, "t": 524.58624, "r": 545.10815, "b": 533.4928, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "duce a sequence of HTML tags that represent the structure", "bbox": {"l": 308.862, "t": 536.54124, "r": 545.11511, "b": 545.4478, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "of the table.", "bbox": {"l": 308.862, "t": 548.49625, "r": 358.5455, "b": 557.4028000000001, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "With each prediction of an HTML standard", "bbox": {"l": 365.19055, "t": 548.49625, "r": 545.11517, "b": 557.4028000000001, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "data cell (\u2018", "bbox": {"l": 308.862, "t": 560.45125, "r": 352.40851, "b": 569.3578, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "<", "bbox": {"l": 352.409, "t": 560.29184, "r": 360.1579, "b": 569.13863, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "td", "bbox": {"l": 360.15799, "t": 560.45125, "r": 367.90891, "b": 569.3578, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": ">", "bbox": {"l": 367.909, "t": 560.29184, "r": 375.6579, "b": 569.13863, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "\u2019) the hidden state of that cell is passed to", "bbox": {"l": 375.65799, "t": 560.45125, "r": 545.11182, "b": 569.3578, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "the Cell BBox Decoder. As for spanning cells, such as row", "bbox": {"l": 308.862, "t": 572.40724, "r": 545.11499, "b": 581.3138, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "or column span, the tag is broken down to \u2018", "bbox": {"l": 308.862, "t": 584.3622399999999, "r": 483.11768, "b": 593.2688, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "<", "bbox": {"l": 483.11902, "t": 584.20284, "r": 490.86792, "b": 593.04962, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "\u2019, \u2018rowspan=\u2019", "bbox": {"l": 490.86800999999997, "t": 584.3622399999999, "r": 545.11438, "b": 593.2688, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "or \u2018colspan=\u2019, with the number of spanning cells (attribute),", "bbox": {"l": 308.862, "t": 596.31725, "r": 545.11493, "b": 605.2238, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "and \u2018", "bbox": {"l": 308.862, "t": 608.27225, "r": 329.64395, "b": 617.1788, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": ">", "bbox": {"l": 329.646, "t": 608.11284, "r": 337.3949, "b": 616.9596300000001, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "\u2019. The hidden state attached to \u2018", "bbox": {"l": 337.39398, "t": 608.27225, "r": 468.5914, "b": 617.1788, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "<", "bbox": {"l": 468.59496999999993, "t": 608.11284, "r": 476.34387000000004, "b": 616.9596300000001, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "\u2019 is passed to the", "bbox": {"l": 476.3439599999999, "t": 608.27225, "r": 545.11572, "b": 617.1788, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "Cell BBox Decoder. A shared feed forward network (FFN)", "bbox": {"l": 308.86197, "t": 620.22725, "r": 545.11499, "b": 629.1338000000001, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "receives the hidden states from the Structure Decoder, to", "bbox": {"l": 308.86197, "t": 632.1822500000001, "r": 545.11517, "b": 641.08881, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "provide the final detection predictions of the bounding box", "bbox": {"l": 308.86197, "t": 644.13824, "r": 545.11511, "b": 653.0448, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "coordinates and their classification.", "bbox": {"l": 308.86197, "t": 656.09325, "r": 449.42432, "b": 664.99981, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "text", "bbox": {"l": 308.86197, "t": 668.2607, "r": 545.11511, "b": 713.1518169999999, "coord_origin": "TOPLEFT"}, "confidence": 0.978580117225647, "cells": [{"id": 152, "text": "CNN Backbone Network.", "bbox": {"l": 320.81696, "t": 668.2607, "r": 431.90985, "b": 677.21707, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "A ResNet-18 CNN is the", "bbox": {"l": 439.49896, "t": 668.3802499999999, "r": 545.11255, "b": 677.2868100000001, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "backbone that receives the table image and encodes it as a", "bbox": {"l": 308.86197, "t": 680.33525, "r": 545.11499, "b": 689.24181, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "vector of predefined length. The network has been modified", "bbox": {"l": 308.86197, "t": 692.290253, "r": 545.11511, "b": 701.196815, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "by removing the linear and pooling layer, as we are not per-", "bbox": {"l": 308.86197, "t": 704.245255, "r": 545.11505, "b": 713.1518169999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "page_footer", "bbox": {"l": 295.12097, "t": 734.133251, "r": 300.10226, "b": 743.039814, "coord_origin": "TOPLEFT"}, "confidence": 0.8565718531608582, "cells": [{"id": 157, "text": "4", "bbox": {"l": 295.12097, "t": 734.133251, "r": 300.10226, "b": 743.039814, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {"8": {"label": "table", "id": 8, "page_no": 3, "cluster": {"id": 8, "label": "table", "bbox": {"l": 310.67584228515625, "t": 73.19388580322266, "r": 542.9547119140625, "b": 155.22052001953125, "coord_origin": "TOPLEFT"}, "confidence": 0.9777463674545288, "cells": [{"id": 57, "text": "Tags", "bbox": {"l": 412.332, "t": 73.61437999999998, "r": 430.90231, "b": 82.52094, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Bbox", "bbox": {"l": 442.85742, "t": 73.61437999999998, "r": 464.4463799999999, "b": 82.52094, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Size", "bbox": {"l": 477.78632, "t": 73.61437999999998, "r": 494.94193, "b": 82.52094, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Format", "bbox": {"l": 508.28186, "t": 73.61437999999998, "r": 536.91437, "b": 82.52094, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "PubTabNet", "bbox": {"l": 317.06, "t": 85.9673499999999, "r": 361.64264, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "3", "bbox": {"l": 417.85599, "t": 85.6684600000001, "r": 425.37775, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "3", "bbox": {"l": 449.89569, "t": 85.6684600000001, "r": 457.41745000000003, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "509k", "bbox": {"l": 476.401, "t": 85.9673499999999, "r": 496.3262, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "PNG", "bbox": {"l": 512.63495, "t": 85.9673499999999, "r": 532.56012, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "FinTabNet", "bbox": {"l": 317.06, "t": 97.92236000000003, "r": 359.43094, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "3", "bbox": {"l": 417.85599, "t": 97.62347, "r": 425.37775, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "3", "bbox": {"l": 449.89569, "t": 97.62347, "r": 457.41745000000003, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "112k", "bbox": {"l": 476.401, "t": 97.92236000000003, "r": 496.3262, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "PDF", "bbox": {"l": 513.46185, "t": 97.92236000000003, "r": 531.73328, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "TableBank", "bbox": {"l": 317.06, "t": 109.87836000000004, "r": 359.97888, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "3", "bbox": {"l": 417.85599, "t": 109.57947000000001, "r": 425.37775, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "7", "bbox": {"l": 450.81226, "t": 109.57947000000001, "r": 456.50091999999995, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "145k", "bbox": {"l": 476.401, "t": 109.87836000000004, "r": 496.3262, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "JPEG", "bbox": {"l": 511.25017999999994, "t": 109.87836000000004, "r": 533.94501, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "Combined-Tabnet(*)", "bbox": {"l": 317.06, "t": 121.83336999999995, "r": 400.37723, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "3", "bbox": {"l": 417.85599, "t": 121.53448000000003, "r": 425.37775, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "3", "bbox": {"l": 449.89569, "t": 121.53448000000003, "r": 457.41745000000003, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "400k", "bbox": {"l": 476.401, "t": 121.83336999999995, "r": 496.3262, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "PNG", "bbox": {"l": 512.63495, "t": 121.83336999999995, "r": 532.56012, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Combined(**)", "bbox": {"l": 317.06, "t": 133.78839000000005, "r": 375.17184, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "3", "bbox": {"l": 417.85599, "t": 133.48950000000002, "r": 425.37775, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "3", "bbox": {"l": 449.89569, "t": 133.48950000000002, "r": 457.41745000000003, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "500k", "bbox": {"l": 476.401, "t": 133.78839000000005, "r": 496.3262, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "PNG", "bbox": {"l": 512.63495, "t": 133.78839000000005, "r": 532.56012, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "SynthTabNet", "bbox": {"l": 317.06, "t": 145.74341000000004, "r": 369.39352, "b": 154.64995999999996, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "3", "bbox": {"l": 417.85599, "t": 145.44446000000005, "r": 425.37775, "b": 154.65985, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "3", "bbox": {"l": 449.89569, "t": 145.44446000000005, "r": 457.41745000000003, "b": 154.65985, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "600k", "bbox": {"l": 476.401, "t": 145.74334999999996, "r": 496.3262, "b": 154.6499, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "PNG", "bbox": {"l": 512.63495, "t": 145.74334999999996, "r": 532.56012, "b": 154.6499, "coord_origin": "TOPLEFT"}}], "children": [{"id": 15, "label": "text", "bbox": {"l": 412.332, "t": 73.61437999999998, "r": 430.90231, "b": 82.52094, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "Tags", "bbox": {"l": 412.332, "t": 73.61437999999998, "r": 430.90231, "b": 82.52094, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 442.85742, "t": 73.61437999999998, "r": 464.4463799999999, "b": 82.52094, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "Bbox", "bbox": {"l": 442.85742, "t": 73.61437999999998, "r": 464.4463799999999, "b": 82.52094, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 477.78632, "t": 73.61437999999998, "r": 494.94193, "b": 82.52094, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "Size", "bbox": {"l": 477.78632, "t": 73.61437999999998, "r": 494.94193, "b": 82.52094, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 508.28186, "t": 73.61437999999998, "r": 536.91437, "b": 82.52094, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "Format", "bbox": {"l": 508.28186, "t": 73.61437999999998, "r": 536.91437, "b": 82.52094, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 317.06, "t": 85.9673499999999, "r": 361.64264, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "PubTabNet", "bbox": {"l": 317.06, "t": 85.9673499999999, "r": 361.64264, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 417.85599, "t": 85.6684600000001, "r": 425.37775, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "3", "bbox": {"l": 417.85599, "t": 85.6684600000001, "r": 425.37775, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 449.89569, "t": 85.6684600000001, "r": 457.41745000000003, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "3", "bbox": {"l": 449.89569, "t": 85.6684600000001, "r": 457.41745000000003, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 476.401, "t": 85.9673499999999, "r": 496.3262, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "509k", "bbox": {"l": 476.401, "t": 85.9673499999999, "r": 496.3262, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 512.63495, "t": 85.9673499999999, "r": 532.56012, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "PNG", "bbox": {"l": 512.63495, "t": 85.9673499999999, "r": 532.56012, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 317.06, "t": 97.92236000000003, "r": 359.43094, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "FinTabNet", "bbox": {"l": 317.06, "t": 97.92236000000003, "r": 359.43094, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 417.85599, "t": 97.62347, "r": 425.37775, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "3", "bbox": {"l": 417.85599, "t": 97.62347, "r": 425.37775, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 449.89569, "t": 97.62347, "r": 457.41745000000003, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "3", "bbox": {"l": 449.89569, "t": 97.62347, "r": 457.41745000000003, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 476.401, "t": 97.92236000000003, "r": 496.3262, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "112k", "bbox": {"l": 476.401, "t": 97.92236000000003, "r": 496.3262, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 513.46185, "t": 97.92236000000003, "r": 531.73328, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "PDF", "bbox": {"l": 513.46185, "t": 97.92236000000003, "r": 531.73328, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 317.06, "t": 109.87836000000004, "r": 359.97888, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "TableBank", "bbox": {"l": 317.06, "t": 109.87836000000004, "r": 359.97888, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 417.85599, "t": 109.57947000000001, "r": 425.37775, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "3", "bbox": {"l": 417.85599, "t": 109.57947000000001, "r": 425.37775, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 450.81226, "t": 109.57947000000001, "r": 456.50091999999995, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "7", "bbox": {"l": 450.81226, "t": 109.57947000000001, "r": 456.50091999999995, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 476.401, "t": 109.87836000000004, "r": 496.3262, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "145k", "bbox": {"l": 476.401, "t": 109.87836000000004, "r": 496.3262, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 511.25017999999994, "t": 109.87836000000004, "r": 533.94501, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "JPEG", "bbox": {"l": 511.25017999999994, "t": 109.87836000000004, "r": 533.94501, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 317.06, "t": 121.83336999999995, "r": 400.37723, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "Combined-Tabnet(*)", "bbox": {"l": 317.06, "t": 121.83336999999995, "r": 400.37723, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 417.85599, "t": 121.53448000000003, "r": 425.37775, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "3", "bbox": {"l": 417.85599, "t": 121.53448000000003, "r": 425.37775, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 449.89569, "t": 121.53448000000003, "r": 457.41745000000003, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "3", "bbox": {"l": 449.89569, "t": 121.53448000000003, "r": 457.41745000000003, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 476.401, "t": 121.83336999999995, "r": 496.3262, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "400k", "bbox": {"l": 476.401, "t": 121.83336999999995, "r": 496.3262, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 512.63495, "t": 121.83336999999995, "r": 532.56012, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "PNG", "bbox": {"l": 512.63495, "t": 121.83336999999995, "r": 532.56012, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 317.06, "t": 133.78839000000005, "r": 375.17184, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "Combined(**)", "bbox": {"l": 317.06, "t": 133.78839000000005, "r": 375.17184, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 417.85599, "t": 133.48950000000002, "r": 425.37775, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "3", "bbox": {"l": 417.85599, "t": 133.48950000000002, "r": 425.37775, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 449.89569, "t": 133.48950000000002, "r": 457.41745000000003, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "3", "bbox": {"l": 449.89569, "t": 133.48950000000002, "r": 457.41745000000003, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 476.401, "t": 133.78839000000005, "r": 496.3262, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "500k", "bbox": {"l": 476.401, "t": 133.78839000000005, "r": 496.3262, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 512.63495, "t": 133.78839000000005, "r": 532.56012, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "PNG", "bbox": {"l": 512.63495, "t": 133.78839000000005, "r": 532.56012, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 317.06, "t": 145.74341000000004, "r": 369.39352, "b": 154.64995999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "SynthTabNet", "bbox": {"l": 317.06, "t": 145.74341000000004, "r": 369.39352, "b": 154.64995999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 417.85599, "t": 145.44446000000005, "r": 425.37775, "b": 154.65985, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "3", "bbox": {"l": 417.85599, "t": 145.44446000000005, "r": 425.37775, "b": 154.65985, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 449.89569, "t": 145.44446000000005, "r": 457.41745000000003, "b": 154.65985, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "3", "bbox": {"l": 449.89569, "t": 145.44446000000005, "r": 457.41745000000003, "b": 154.65985, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 476.401, "t": 145.74334999999996, "r": 496.3262, "b": 154.6499, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "600k", "bbox": {"l": 476.401, "t": 145.74334999999996, "r": 496.3262, "b": 154.6499, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 512.63495, "t": 145.74334999999996, "r": 532.56012, "b": 154.6499, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "PNG", "bbox": {"l": 512.63495, "t": 145.74334999999996, "r": 532.56012, "b": 154.6499, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ecel", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 7, "num_cols": 5, "table_cells": [{"bbox": {"l": 412.332, "t": 73.61437999999998, "r": 430.90231, "b": 82.52094, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Tags", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 442.85742, "t": 73.61437999999998, "r": 464.4463799999999, "b": 82.52094, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Bbox", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 477.78632, "t": 73.61437999999998, "r": 494.94193, "b": 82.52094, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Size", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 508.28186, "t": 73.61437999999998, "r": 536.91437, "b": 82.52094, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Format", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 317.06, "t": 85.9673499999999, "r": 361.64264, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PubTabNet", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 417.85599, "t": 85.6684600000001, "r": 425.37775, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 449.89569, "t": 85.6684600000001, "r": 457.41745000000003, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 476.401, "t": 85.9673499999999, "r": 496.3262, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "509k", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 512.63495, "t": 85.9673499999999, "r": 532.56012, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "PNG", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 317.06, "t": 97.92236000000003, "r": 359.43094, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "FinTabNet", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 417.85599, "t": 97.62347, "r": 425.37775, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 449.89569, "t": 97.62347, "r": 457.41745000000003, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 476.401, "t": 97.92236000000003, "r": 496.3262, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "112k", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 513.46185, "t": 97.92236000000003, "r": 531.73328, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "PDF", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 317.06, "t": 109.87836000000004, "r": 359.97888, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableBank", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 417.85599, "t": 109.57947000000001, "r": 425.37775, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 450.81226, "t": 109.57947000000001, "r": 456.50091999999995, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 476.401, "t": 109.87836000000004, "r": 496.3262, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "145k", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 511.25017999999994, "t": 109.87836000000004, "r": 533.94501, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "JPEG", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 317.06, "t": 121.83336999999995, "r": 400.37723, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Combined-Tabnet(*)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 417.85599, "t": 121.53448000000003, "r": 425.37775, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 449.89569, "t": 121.53448000000003, "r": 457.41745000000003, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 476.401, "t": 121.83336999999995, "r": 496.3262, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "400k", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 512.63495, "t": 121.83336999999995, "r": 532.56012, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "PNG", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 317.06, "t": 133.78839000000005, "r": 375.17184, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Combined(**)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 417.85599, "t": 133.48950000000002, "r": 425.37775, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 449.89569, "t": 133.48950000000002, "r": 457.41745000000003, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 476.401, "t": 133.78839000000005, "r": 496.3262, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "500k", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 512.63495, "t": 133.78839000000005, "r": 532.56012, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "PNG", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 317.06, "t": 145.74341000000004, "r": 369.39352, "b": 154.64995999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "SynthTabNet", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 417.85599, "t": 145.44446000000005, "r": 425.37775, "b": 154.65985, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 449.89569, "t": 145.44446000000005, "r": 457.41745000000003, "b": 154.65985, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 476.401, "t": 145.74334999999996, "r": 496.3262, "b": 154.6499, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "600k", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 512.63495, "t": 145.74334999999996, "r": 532.56012, "b": 154.6499, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "PNG", "column_header": false, "row_header": false, "row_section": false}]}}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "text", "id": 10, "page_no": 3, "cluster": {"id": 10, "label": "text", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 286.36511, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9611433148384094, "cells": [{"id": 0, "text": "amount of such tables, and kept only those ones ranging", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 286.36511, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "between 1*1 and 20*10 (rows/columns).", "bbox": {"l": 50.112, "t": 87.16339000000005, "r": 212.28319, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "amount of such tables, and kept only those ones ranging between 1*1 and 20*10 (rows/columns)."}, {"label": "text", "id": 1, "page_no": 3, "cluster": {"id": 1, "label": "text", "bbox": {"l": 50.112, "t": 100.96038999999996, "r": 286.36514, "b": 313.10507, "coord_origin": "TOPLEFT"}, "confidence": 0.988013744354248, "cells": [{"id": 2, "text": "The availability of the bounding boxes for all table cells", "bbox": {"l": 62.067001, "t": 100.96038999999996, "r": 286.36502, "b": 109.86694, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "is essential to train our models. In order to distinguish be-", "bbox": {"l": 50.112, "t": 112.91540999999995, "r": 286.36508, "b": 121.82195999999999, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "tween empty and non-empty bounding boxes, we have in-", "bbox": {"l": 50.112, "t": 124.87041999999997, "r": 286.36508, "b": 133.77697999999998, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "troduced a binary class in the annotation. Unfortunately, the", "bbox": {"l": 50.112, "t": 136.82641999999998, "r": 286.36511, "b": 145.73297000000002, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "original datasets either omit the bounding boxes for whole", "bbox": {"l": 50.112, "t": 148.78143, "r": 286.36511, "b": 157.68799, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "tables (e.g. TableBank) or they narrow their scope only to", "bbox": {"l": 50.112, "t": 160.73645, "r": 286.36508, "b": 169.64301, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "non-empty cells. Therefore, it was imperative to introduce", "bbox": {"l": 50.112, "t": 172.69146999999998, "r": 286.36505, "b": 181.59802000000002, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "a data pre-processing procedure that generates the missing", "bbox": {"l": 50.112, "t": 184.64648, "r": 286.36508, "b": 193.55304, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "bounding boxes out of the annotation information. This pro-", "bbox": {"l": 50.112, "t": 196.60248, "r": 286.36508, "b": 205.50903000000005, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "cedure first parses the provided table structure and calcu-", "bbox": {"l": 50.112, "t": 208.5575, "r": 286.36508, "b": 217.46405000000004, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "lates the dimensions of the most fine-grained grid that cov-", "bbox": {"l": 50.112, "t": 220.51251000000002, "r": 286.36511, "b": 229.41907000000003, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "ers the table structure. Notice that each table cell may oc-", "bbox": {"l": 50.112, "t": 232.46753, "r": 286.36508, "b": 241.37408000000005, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "cupy multiple grid squares due to row or column spans. In", "bbox": {"l": 50.112, "t": 244.42255, "r": 286.36508, "b": 253.32910000000004, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "case of PubTabNet we had to compute missing bounding", "bbox": {"l": 50.112, "t": 256.37756, "r": 286.36505, "b": 265.28412000000003, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "boxes for 48% of the simple and 69% of the complex ta-", "bbox": {"l": 50.112, "t": 268.33356000000003, "r": 286.36505, "b": 277.24010999999996, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "bles.", "bbox": {"l": 50.112, "t": 280.28853999999995, "r": 68.652397, "b": 289.1951, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Regarding FinTabNet, 68% of the simple and 98%", "bbox": {"l": 75.566444, "t": 280.28853999999995, "r": 286.36514, "b": 289.1951, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "of the complex tables require the generation of bounding", "bbox": {"l": 50.112, "t": 292.24353, "r": 286.36511, "b": 301.15009, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "boxes.", "bbox": {"l": 50.112, "t": 304.19852000000003, "r": 75.695961, "b": 313.10507, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The availability of the bounding boxes for all table cells is essential to train our models. In order to distinguish between empty and non-empty bounding boxes, we have introduced a binary class in the annotation. Unfortunately, the original datasets either omit the bounding boxes for whole tables (e.g. TableBank) or they narrow their scope only to non-empty cells. Therefore, it was imperative to introduce a data pre-processing procedure that generates the missing bounding boxes out of the annotation information. This procedure first parses the provided table structure and calculates the dimensions of the most fine-grained grid that covers the table structure. Notice that each table cell may occupy multiple grid squares due to row or column spans. In case of PubTabNet we had to compute missing bounding boxes for 48% of the simple and 69% of the complex tables. Regarding FinTabNet, 68% of the simple and 98% of the complex tables require the generation of bounding boxes."}, {"label": "text", "id": 4, "page_no": 3, "cluster": {"id": 4, "label": "text", "bbox": {"l": 50.112, "t": 317.99550999999997, "r": 286.36511, "b": 434.49896, "coord_origin": "TOPLEFT"}, "confidence": 0.9873981475830078, "cells": [{"id": 21, "text": "As it is illustrated in Fig. 2, the table distributions from", "bbox": {"l": 62.067001, "t": 317.99550999999997, "r": 286.36499, "b": 326.90207, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "all datasets are skewed towards simpler structures with", "bbox": {"l": 50.112, "t": 329.95151, "r": 286.36511, "b": 338.8580600000001, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "fewer number of rows/columns. Additionally, there is very", "bbox": {"l": 50.112, "t": 341.90649, "r": 286.36502, "b": 350.81305, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "limited variance in the table styles, which in case of Pub-", "bbox": {"l": 50.112, "t": 353.8614799999999, "r": 286.36505, "b": 362.76804, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "TabNet and FinTabNet means one styling format for the", "bbox": {"l": 50.112, "t": 365.81647, "r": 286.36508, "b": 374.72301999999996, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "majority of the tables.", "bbox": {"l": 50.112, "t": 377.77145, "r": 141.58859, "b": 386.67801, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Similar limitations appear also in", "bbox": {"l": 148.70189, "t": 377.77145, "r": 286.36508, "b": 386.67801, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "the type of table content, which in some cases (e.g. FinTab-", "bbox": {"l": 50.112, "t": 389.72644, "r": 286.36508, "b": 398.63300000000004, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Net) is restricted to a certain domain. Ultimately, the lack", "bbox": {"l": 50.112, "t": 401.68243, "r": 286.36511, "b": 410.58899, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "of diversity in the training dataset damages the ability of the", "bbox": {"l": 50.112, "t": 413.63742, "r": 286.36511, "b": 422.54398, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "models to generalize well on unseen data.", "bbox": {"l": 50.112, "t": 425.59241, "r": 216.39774, "b": 434.49896, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "As it is illustrated in Fig. 2, the table distributions from all datasets are skewed towards simpler structures with fewer number of rows/columns. Additionally, there is very limited variance in the table styles, which in case of PubTabNet and FinTabNet means one styling format for the majority of the tables. Similar limitations appear also in the type of table content, which in some cases (e.g. FinTabNet) is restricted to a certain domain. Ultimately, the lack of diversity in the training dataset damages the ability of the models to generalize well on unseen data."}, {"label": "text", "id": 3, "page_no": 3, "cluster": {"id": 3, "label": "text", "bbox": {"l": 50.112, "t": 439.3894, "r": 286.36655, "b": 627.62389, "coord_origin": "TOPLEFT"}, "confidence": 0.9876030087471008, "cells": [{"id": 32, "text": "Motivated by those observations we aimed at generating", "bbox": {"l": 62.067001, "t": 439.3894, "r": 286.36499, "b": 448.2959599999999, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "a synthetic table dataset named", "bbox": {"l": 50.112, "t": 451.34439, "r": 172.14388, "b": 460.25095, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "SynthTabNet", "bbox": {"l": 174.14801, "t": 451.43405, "r": 224.70818999999997, "b": 460.02182, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": ". This approach", "bbox": {"l": 224.70801, "t": 451.34439, "r": 286.36655, "b": 460.25095, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "offers control over: 1) the size of the dataset, 2) the table", "bbox": {"l": 50.112015, "t": 463.30038, "r": 286.36505, "b": 472.20694, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "structure, 3) the table style and 4) the type of content. The", "bbox": {"l": 50.112015, "t": 475.25537, "r": 286.36511, "b": 484.16193, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "complexity of the table structure is described by the size of", "bbox": {"l": 50.112015, "t": 487.21036, "r": 286.36511, "b": 496.11691, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "the table header and the table body, as well as the percentage", "bbox": {"l": 50.112015, "t": 499.16534, "r": 286.36508, "b": 508.0719, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "of the table cells covered by row spans and column spans.", "bbox": {"l": 50.112015, "t": 511.12033, "r": 286.36505, "b": 520.02689, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "A set of carefully designed styling templates provides the", "bbox": {"l": 50.112015, "t": 523.07632, "r": 286.36508, "b": 531.98288, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "basis to build a wide range of table appearances. Lastly, the", "bbox": {"l": 50.112015, "t": 535.0313100000001, "r": 286.36508, "b": 543.93788, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "table content is generated out of a curated collection of text", "bbox": {"l": 50.112015, "t": 546.98633, "r": 286.36511, "b": 555.89288, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "corpora. By controlling the size and scope of the synthetic", "bbox": {"l": 50.112015, "t": 558.94133, "r": 286.36508, "b": 567.84789, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "datasets we are able to train and evaluate our models in a", "bbox": {"l": 50.112015, "t": 570.89633, "r": 286.36511, "b": 579.8028899999999, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "variety of different conditions. For example, we can first", "bbox": {"l": 50.112015, "t": 582.85133, "r": 286.36511, "b": 591.75789, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "generate a highly diverse dataset to train our models and", "bbox": {"l": 50.112015, "t": 594.80733, "r": 286.36505, "b": 603.71388, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "then evaluate their performance on other synthetic datasets", "bbox": {"l": 50.112015, "t": 606.76233, "r": 286.36508, "b": 615.6688800000001, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "which are focused on a specific domain.", "bbox": {"l": 50.112015, "t": 618.71733, "r": 209.7527, "b": 627.62389, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Motivated by those observations we aimed at generating a synthetic table dataset named SynthTabNet . This approach offers control over: 1) the size of the dataset, 2) the table structure, 3) the table style and 4) the type of content. The complexity of the table structure is described by the size of the table header and the table body, as well as the percentage of the table cells covered by row spans and column spans. A set of carefully designed styling templates provides the basis to build a wide range of table appearances. Lastly, the table content is generated out of a curated collection of text corpora. By controlling the size and scope of the synthetic datasets we are able to train and evaluate our models in a variety of different conditions. For example, we can first generate a highly diverse dataset to train our models and then evaluate their performance on other synthetic datasets which are focused on a specific domain."}, {"label": "text", "id": 5, "page_no": 3, "cluster": {"id": 5, "label": "text", "bbox": {"l": 50.112015, "t": 632.51433, "r": 286.36511, "b": 713.151894, "coord_origin": "TOPLEFT"}, "confidence": 0.9871614575386047, "cells": [{"id": 50, "text": "In this regard, we have prepared four synthetic datasets,", "bbox": {"l": 62.067017, "t": 632.51433, "r": 286.36499, "b": 641.42088, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "each one containing 150k examples. The corpora to gener-", "bbox": {"l": 50.112015, "t": 644.46933, "r": 286.36508, "b": 653.37589, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "ate the table text consists of the most frequent terms appear-", "bbox": {"l": 50.112015, "t": 656.42532, "r": 286.36511, "b": 665.33189, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "ing in PubTabNet and FinTabNet together with randomly", "bbox": {"l": 50.112015, "t": 668.38033, "r": 286.36505, "b": 677.28689, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "generated text. The first two synthetic datasets have been", "bbox": {"l": 50.112015, "t": 680.33533, "r": 286.36508, "b": 689.24189, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "fine-tuned to mimic the appearance of the original datasets", "bbox": {"l": 50.112015, "t": 692.290329, "r": 286.36508, "b": 701.196892, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "but encompass more complicated table structures. The third", "bbox": {"l": 50.112015, "t": 704.245331, "r": 286.36511, "b": 713.151894, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In this regard, we have prepared four synthetic datasets, each one containing 150k examples. The corpora to generate the table text consists of the most frequent terms appearing in PubTabNet and FinTabNet together with randomly generated text. The first two synthetic datasets have been fine-tuned to mimic the appearance of the original datasets but encompass more complicated table structures. The third"}, {"label": "table", "id": 8, "page_no": 3, "cluster": {"id": 8, "label": "table", "bbox": {"l": 310.67584228515625, "t": 73.19388580322266, "r": 542.9547119140625, "b": 155.22052001953125, "coord_origin": "TOPLEFT"}, "confidence": 0.9777463674545288, "cells": [{"id": 57, "text": "Tags", "bbox": {"l": 412.332, "t": 73.61437999999998, "r": 430.90231, "b": 82.52094, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Bbox", "bbox": {"l": 442.85742, "t": 73.61437999999998, "r": 464.4463799999999, "b": 82.52094, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Size", "bbox": {"l": 477.78632, "t": 73.61437999999998, "r": 494.94193, "b": 82.52094, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Format", "bbox": {"l": 508.28186, "t": 73.61437999999998, "r": 536.91437, "b": 82.52094, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "PubTabNet", "bbox": {"l": 317.06, "t": 85.9673499999999, "r": 361.64264, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "3", "bbox": {"l": 417.85599, "t": 85.6684600000001, "r": 425.37775, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "3", "bbox": {"l": 449.89569, "t": 85.6684600000001, "r": 457.41745000000003, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "509k", "bbox": {"l": 476.401, "t": 85.9673499999999, "r": 496.3262, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "PNG", "bbox": {"l": 512.63495, "t": 85.9673499999999, "r": 532.56012, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "FinTabNet", "bbox": {"l": 317.06, "t": 97.92236000000003, "r": 359.43094, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "3", "bbox": {"l": 417.85599, "t": 97.62347, "r": 425.37775, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "3", "bbox": {"l": 449.89569, "t": 97.62347, "r": 457.41745000000003, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "112k", "bbox": {"l": 476.401, "t": 97.92236000000003, "r": 496.3262, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "PDF", "bbox": {"l": 513.46185, "t": 97.92236000000003, "r": 531.73328, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "TableBank", "bbox": {"l": 317.06, "t": 109.87836000000004, "r": 359.97888, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "3", "bbox": {"l": 417.85599, "t": 109.57947000000001, "r": 425.37775, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "7", "bbox": {"l": 450.81226, "t": 109.57947000000001, "r": 456.50091999999995, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "145k", "bbox": {"l": 476.401, "t": 109.87836000000004, "r": 496.3262, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "JPEG", "bbox": {"l": 511.25017999999994, "t": 109.87836000000004, "r": 533.94501, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "Combined-Tabnet(*)", "bbox": {"l": 317.06, "t": 121.83336999999995, "r": 400.37723, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "3", "bbox": {"l": 417.85599, "t": 121.53448000000003, "r": 425.37775, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "3", "bbox": {"l": 449.89569, "t": 121.53448000000003, "r": 457.41745000000003, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "400k", "bbox": {"l": 476.401, "t": 121.83336999999995, "r": 496.3262, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "PNG", "bbox": {"l": 512.63495, "t": 121.83336999999995, "r": 532.56012, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Combined(**)", "bbox": {"l": 317.06, "t": 133.78839000000005, "r": 375.17184, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "3", "bbox": {"l": 417.85599, "t": 133.48950000000002, "r": 425.37775, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "3", "bbox": {"l": 449.89569, "t": 133.48950000000002, "r": 457.41745000000003, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "500k", "bbox": {"l": 476.401, "t": 133.78839000000005, "r": 496.3262, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "PNG", "bbox": {"l": 512.63495, "t": 133.78839000000005, "r": 532.56012, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "SynthTabNet", "bbox": {"l": 317.06, "t": 145.74341000000004, "r": 369.39352, "b": 154.64995999999996, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "3", "bbox": {"l": 417.85599, "t": 145.44446000000005, "r": 425.37775, "b": 154.65985, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "3", "bbox": {"l": 449.89569, "t": 145.44446000000005, "r": 457.41745000000003, "b": 154.65985, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "600k", "bbox": {"l": 476.401, "t": 145.74334999999996, "r": 496.3262, "b": 154.6499, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "PNG", "bbox": {"l": 512.63495, "t": 145.74334999999996, "r": 532.56012, "b": 154.6499, "coord_origin": "TOPLEFT"}}], "children": [{"id": 15, "label": "text", "bbox": {"l": 412.332, "t": 73.61437999999998, "r": 430.90231, "b": 82.52094, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "Tags", "bbox": {"l": 412.332, "t": 73.61437999999998, "r": 430.90231, "b": 82.52094, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 442.85742, "t": 73.61437999999998, "r": 464.4463799999999, "b": 82.52094, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "Bbox", "bbox": {"l": 442.85742, "t": 73.61437999999998, "r": 464.4463799999999, "b": 82.52094, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 477.78632, "t": 73.61437999999998, "r": 494.94193, "b": 82.52094, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "Size", "bbox": {"l": 477.78632, "t": 73.61437999999998, "r": 494.94193, "b": 82.52094, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 508.28186, "t": 73.61437999999998, "r": 536.91437, "b": 82.52094, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "Format", "bbox": {"l": 508.28186, "t": 73.61437999999998, "r": 536.91437, "b": 82.52094, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 317.06, "t": 85.9673499999999, "r": 361.64264, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "PubTabNet", "bbox": {"l": 317.06, "t": 85.9673499999999, "r": 361.64264, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 417.85599, "t": 85.6684600000001, "r": 425.37775, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "3", "bbox": {"l": 417.85599, "t": 85.6684600000001, "r": 425.37775, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 449.89569, "t": 85.6684600000001, "r": 457.41745000000003, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "3", "bbox": {"l": 449.89569, "t": 85.6684600000001, "r": 457.41745000000003, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 476.401, "t": 85.9673499999999, "r": 496.3262, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "509k", "bbox": {"l": 476.401, "t": 85.9673499999999, "r": 496.3262, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 512.63495, "t": 85.9673499999999, "r": 532.56012, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "PNG", "bbox": {"l": 512.63495, "t": 85.9673499999999, "r": 532.56012, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 317.06, "t": 97.92236000000003, "r": 359.43094, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "FinTabNet", "bbox": {"l": 317.06, "t": 97.92236000000003, "r": 359.43094, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 417.85599, "t": 97.62347, "r": 425.37775, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "3", "bbox": {"l": 417.85599, "t": 97.62347, "r": 425.37775, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 449.89569, "t": 97.62347, "r": 457.41745000000003, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "3", "bbox": {"l": 449.89569, "t": 97.62347, "r": 457.41745000000003, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 476.401, "t": 97.92236000000003, "r": 496.3262, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "112k", "bbox": {"l": 476.401, "t": 97.92236000000003, "r": 496.3262, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 513.46185, "t": 97.92236000000003, "r": 531.73328, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "PDF", "bbox": {"l": 513.46185, "t": 97.92236000000003, "r": 531.73328, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 317.06, "t": 109.87836000000004, "r": 359.97888, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "TableBank", "bbox": {"l": 317.06, "t": 109.87836000000004, "r": 359.97888, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 417.85599, "t": 109.57947000000001, "r": 425.37775, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "3", "bbox": {"l": 417.85599, "t": 109.57947000000001, "r": 425.37775, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 450.81226, "t": 109.57947000000001, "r": 456.50091999999995, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "7", "bbox": {"l": 450.81226, "t": 109.57947000000001, "r": 456.50091999999995, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 476.401, "t": 109.87836000000004, "r": 496.3262, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "145k", "bbox": {"l": 476.401, "t": 109.87836000000004, "r": 496.3262, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 511.25017999999994, "t": 109.87836000000004, "r": 533.94501, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "JPEG", "bbox": {"l": 511.25017999999994, "t": 109.87836000000004, "r": 533.94501, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 317.06, "t": 121.83336999999995, "r": 400.37723, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "Combined-Tabnet(*)", "bbox": {"l": 317.06, "t": 121.83336999999995, "r": 400.37723, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 417.85599, "t": 121.53448000000003, "r": 425.37775, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "3", "bbox": {"l": 417.85599, "t": 121.53448000000003, "r": 425.37775, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 449.89569, "t": 121.53448000000003, "r": 457.41745000000003, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "3", "bbox": {"l": 449.89569, "t": 121.53448000000003, "r": 457.41745000000003, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 476.401, "t": 121.83336999999995, "r": 496.3262, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "400k", "bbox": {"l": 476.401, "t": 121.83336999999995, "r": 496.3262, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 512.63495, "t": 121.83336999999995, "r": 532.56012, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "PNG", "bbox": {"l": 512.63495, "t": 121.83336999999995, "r": 532.56012, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 317.06, "t": 133.78839000000005, "r": 375.17184, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "Combined(**)", "bbox": {"l": 317.06, "t": 133.78839000000005, "r": 375.17184, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 417.85599, "t": 133.48950000000002, "r": 425.37775, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "3", "bbox": {"l": 417.85599, "t": 133.48950000000002, "r": 425.37775, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 449.89569, "t": 133.48950000000002, "r": 457.41745000000003, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "3", "bbox": {"l": 449.89569, "t": 133.48950000000002, "r": 457.41745000000003, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 476.401, "t": 133.78839000000005, "r": 496.3262, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "500k", "bbox": {"l": 476.401, "t": 133.78839000000005, "r": 496.3262, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 512.63495, "t": 133.78839000000005, "r": 532.56012, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "PNG", "bbox": {"l": 512.63495, "t": 133.78839000000005, "r": 532.56012, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 317.06, "t": 145.74341000000004, "r": 369.39352, "b": 154.64995999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "SynthTabNet", "bbox": {"l": 317.06, "t": 145.74341000000004, "r": 369.39352, "b": 154.64995999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 417.85599, "t": 145.44446000000005, "r": 425.37775, "b": 154.65985, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "3", "bbox": {"l": 417.85599, "t": 145.44446000000005, "r": 425.37775, "b": 154.65985, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 449.89569, "t": 145.44446000000005, "r": 457.41745000000003, "b": 154.65985, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "3", "bbox": {"l": 449.89569, "t": 145.44446000000005, "r": 457.41745000000003, "b": 154.65985, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 476.401, "t": 145.74334999999996, "r": 496.3262, "b": 154.6499, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "600k", "bbox": {"l": 476.401, "t": 145.74334999999996, "r": 496.3262, "b": 154.6499, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 512.63495, "t": 145.74334999999996, "r": 532.56012, "b": 154.6499, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "PNG", "bbox": {"l": 512.63495, "t": 145.74334999999996, "r": 532.56012, "b": 154.6499, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ecel", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 7, "num_cols": 5, "table_cells": [{"bbox": {"l": 412.332, "t": 73.61437999999998, "r": 430.90231, "b": 82.52094, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Tags", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 442.85742, "t": 73.61437999999998, "r": 464.4463799999999, "b": 82.52094, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Bbox", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 477.78632, "t": 73.61437999999998, "r": 494.94193, "b": 82.52094, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Size", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 508.28186, "t": 73.61437999999998, "r": 536.91437, "b": 82.52094, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Format", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 317.06, "t": 85.9673499999999, "r": 361.64264, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PubTabNet", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 417.85599, "t": 85.6684600000001, "r": 425.37775, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 449.89569, "t": 85.6684600000001, "r": 457.41745000000003, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 476.401, "t": 85.9673499999999, "r": 496.3262, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "509k", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 512.63495, "t": 85.9673499999999, "r": 532.56012, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "PNG", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 317.06, "t": 97.92236000000003, "r": 359.43094, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "FinTabNet", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 417.85599, "t": 97.62347, "r": 425.37775, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 449.89569, "t": 97.62347, "r": 457.41745000000003, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 476.401, "t": 97.92236000000003, "r": 496.3262, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "112k", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 513.46185, "t": 97.92236000000003, "r": 531.73328, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "PDF", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 317.06, "t": 109.87836000000004, "r": 359.97888, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableBank", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 417.85599, "t": 109.57947000000001, "r": 425.37775, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 450.81226, "t": 109.57947000000001, "r": 456.50091999999995, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 476.401, "t": 109.87836000000004, "r": 496.3262, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "145k", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 511.25017999999994, "t": 109.87836000000004, "r": 533.94501, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "JPEG", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 317.06, "t": 121.83336999999995, "r": 400.37723, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Combined-Tabnet(*)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 417.85599, "t": 121.53448000000003, "r": 425.37775, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 449.89569, "t": 121.53448000000003, "r": 457.41745000000003, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 476.401, "t": 121.83336999999995, "r": 496.3262, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "400k", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 512.63495, "t": 121.83336999999995, "r": 532.56012, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "PNG", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 317.06, "t": 133.78839000000005, "r": 375.17184, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Combined(**)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 417.85599, "t": 133.48950000000002, "r": 425.37775, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 449.89569, "t": 133.48950000000002, "r": 457.41745000000003, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 476.401, "t": 133.78839000000005, "r": 496.3262, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "500k", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 512.63495, "t": 133.78839000000005, "r": 532.56012, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "PNG", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 317.06, "t": 145.74341000000004, "r": 369.39352, "b": 154.64995999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "SynthTabNet", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 417.85599, "t": 145.44446000000005, "r": 425.37775, "b": 154.65985, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 449.89569, "t": 145.44446000000005, "r": 457.41745000000003, "b": 154.65985, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 476.401, "t": 145.74334999999996, "r": 496.3262, "b": 154.6499, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "600k", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 512.63495, "t": 145.74334999999996, "r": 532.56012, "b": 154.6499, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "PNG", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "caption", "id": 9, "page_no": 3, "cluster": {"id": 9, "label": "caption", "bbox": {"l": 308.862, "t": 167.66138, "r": 545.11505, "b": 224.38897999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9667726755142212, "cells": [{"id": 91, "text": "Table 1:", "bbox": {"l": 308.862, "t": 167.66138, "r": 344.6178, "b": 176.56793000000005, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Both", "bbox": {"l": 361.07602, "t": 167.66138, "r": 380.45328, "b": 176.56793000000005, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "\u201cCombined-Tabnet\u201d", "bbox": {"l": 386.56799, "t": 167.75104, "r": 468.67974999999996, "b": 176.33880999999997, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "and", "bbox": {"l": 474.79599, "t": 167.66138, "r": 489.18198, "b": 176.56793000000005, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "\u201dCombined-", "bbox": {"l": 495.29898000000003, "t": 167.75104, "r": 545.112, "b": 176.33880999999997, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "Tabnet\u201d", "bbox": {"l": 308.862, "t": 179.70605, "r": 341.16077, "b": 188.29381999999998, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "are variations of the following: (*) The Combined-", "bbox": {"l": 343.457, "t": 179.61639000000002, "r": 545.11005, "b": 188.52295000000004, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "Tabnet dataset is the processed combination of PubTabNet", "bbox": {"l": 308.862, "t": 191.57141000000001, "r": 545.11505, "b": 200.47797000000003, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "and Fintabnet. (**) The combined dataset is the processed", "bbox": {"l": 308.862, "t": 203.52643, "r": 545.11499, "b": 212.43298000000004, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "combination of PubTabNet, Fintabnet and TableBank.", "bbox": {"l": 308.862, "t": 215.48242000000005, "r": 523.93469, "b": 224.38897999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 1: Both \u201cCombined-Tabnet\u201d and \u201dCombinedTabnet\u201d are variations of the following: (*) The CombinedTabnet dataset is the processed combination of PubTabNet and Fintabnet. (**) The combined dataset is the processed combination of PubTabNet, Fintabnet and TableBank."}, {"label": "text", "id": 6, "page_no": 3, "cluster": {"id": 6, "label": "text", "bbox": {"l": 308.862, "t": 249.62041999999997, "r": 545.11517, "b": 294.39197, "coord_origin": "TOPLEFT"}, "confidence": 0.978954017162323, "cells": [{"id": 101, "text": "one adopts a colorful appearance with high contrast and the", "bbox": {"l": 308.862, "t": 249.62041999999997, "r": 545.11517, "b": 258.52698, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "last one contains tables with sparse content. Lastly, we have", "bbox": {"l": 308.862, "t": 261.57543999999996, "r": 545.11517, "b": 270.48199, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "combined all synthetic datasets into one big unified syn-", "bbox": {"l": 308.862, "t": 273.5304, "r": 545.11505, "b": 282.43698, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "thetic dataset of 600k examples.", "bbox": {"l": 308.862, "t": 285.48541000000006, "r": 436.82169, "b": 294.39197, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "one adopts a colorful appearance with high contrast and the last one contains tables with sparse content. Lastly, we have combined all synthetic datasets into one big unified synthetic dataset of 600k examples."}, {"label": "text", "id": 13, "page_no": 3, "cluster": {"id": 13, "label": "text", "bbox": {"l": 320.81699, "t": 297.77240000000006, "r": 542.74396, "b": 306.67896, "coord_origin": "TOPLEFT"}, "confidence": 0.9043695330619812, "cells": [{"id": 105, "text": "Tab. 1 summarizes the various attributes of the datasets.", "bbox": {"l": 320.81699, "t": 297.77240000000006, "r": 542.74396, "b": 306.67896, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Tab. 1 summarizes the various attributes of the datasets."}, {"label": "section_header", "id": 11, "page_no": 3, "cluster": {"id": 11, "label": "section_header", "bbox": {"l": 308.862, "t": 321.18396, "r": 444.93607000000003, "b": 331.93167000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9466595649719238, "cells": [{"id": 106, "text": "4.", "bbox": {"l": 308.862, "t": 321.18396, "r": 316.28476, "b": 331.93167000000005, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "The TableFormer model", "bbox": {"l": 326.18176, "t": 321.18396, "r": 444.93607000000003, "b": 331.93167000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4. The TableFormer model"}, {"label": "text", "id": 0, "page_no": 3, "cluster": {"id": 0, "label": "text", "bbox": {"l": 308.862, "t": 341.93939, "r": 545.11523, "b": 446.48685000000006, "coord_origin": "TOPLEFT"}, "confidence": 0.9884450435638428, "cells": [{"id": 108, "text": "Given the image of a table, TableFormer is able to pre-", "bbox": {"l": 320.81699, "t": 341.93939, "r": 545.11499, "b": 350.84594999999996, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "dict: 1) a sequence of tokens that represent the structure of", "bbox": {"l": 308.862, "t": 353.89438, "r": 545.11511, "b": 362.80092999999994, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "a table, and 2) a bounding box coupled to a subset of those", "bbox": {"l": 308.862, "t": 365.84937, "r": 545.11517, "b": 374.75592, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "tokens. The conversion of an image into a sequence of to-", "bbox": {"l": 308.862, "t": 377.80435, "r": 545.11505, "b": 386.71091, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "kens is a well-known task [35, 16]. While attention is often", "bbox": {"l": 308.862, "t": 389.75934000000007, "r": 545.11517, "b": 398.66588999999993, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "used as an implicit method to associate each token of the", "bbox": {"l": 308.862, "t": 401.71432000000004, "r": 545.11523, "b": 410.62088, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "sequence with a position in the original image, an explicit", "bbox": {"l": 308.862, "t": 413.67032, "r": 545.11517, "b": 422.57687, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "association between the individual table-cells and the image", "bbox": {"l": 308.862, "t": 425.62531, "r": 545.11505, "b": 434.53186, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "bounding boxes is also required.", "bbox": {"l": 308.862, "t": 437.58029, "r": 437.9375, "b": 446.48685000000006, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Given the image of a table, TableFormer is able to predict: 1) a sequence of tokens that represent the structure of a table, and 2) a bounding box coupled to a subset of those tokens. The conversion of an image into a sequence of tokens is a well-known task [35, 16]. While attention is often used as an implicit method to associate each token of the sequence with a position in the original image, an explicit association between the individual table-cells and the image bounding boxes is also required."}, {"label": "section_header", "id": 12, "page_no": 3, "cluster": {"id": 12, "label": "section_header", "bbox": {"l": 308.862, "t": 457.69427, "r": 420.16058, "b": 467.54633, "coord_origin": "TOPLEFT"}, "confidence": 0.937696099281311, "cells": [{"id": 117, "text": "4.1.", "bbox": {"l": 308.862, "t": 457.69427, "r": 323.14081, "b": 467.54633, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "Model architecture.", "bbox": {"l": 332.66003, "t": 457.69427, "r": 420.16058, "b": 467.54633, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4.1. Model architecture."}, {"label": "text", "id": 2, "page_no": 3, "cluster": {"id": 2, "label": "text", "bbox": {"l": 308.86197, "t": 476.76529, "r": 545.11572, "b": 664.99981, "coord_origin": "TOPLEFT"}, "confidence": 0.9878323078155518, "cells": [{"id": 119, "text": "We now describe in detail the proposed method, which", "bbox": {"l": 320.81699, "t": 476.76529, "r": 545.11487, "b": 485.67184, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "is composed of three main components, see Fig.", "bbox": {"l": 308.862, "t": 488.72028, "r": 509.02054, "b": 497.62683, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "4.", "bbox": {"l": 515.58588, "t": 488.72028, "r": 523.05786, "b": 497.62683, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Our", "bbox": {"l": 529.62323, "t": 488.72028, "r": 545.11505, "b": 497.62683, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "CNN Backbone Network", "bbox": {"l": 308.862, "t": 500.76492, "r": 406.34601, "b": 509.35269, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "encodes the input as a feature vec-", "bbox": {"l": 408.87201, "t": 500.67526, "r": 545.1106, "b": 509.58182, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "tor of predefined length.", "bbox": {"l": 308.862, "t": 512.63126, "r": 409.39459, "b": 521.53781, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "The input feature vector of the", "bbox": {"l": 416.72705, "t": 512.63126, "r": 545.11505, "b": 521.53781, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "encoded image is passed to the", "bbox": {"l": 308.862, "t": 524.58624, "r": 436.194, "b": 533.4928, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "Structure Decoder", "bbox": {"l": 439.526, "t": 524.6759, "r": 513.86694, "b": 533.26367, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "to pro-", "bbox": {"l": 517.43201, "t": 524.58624, "r": 545.10815, "b": 533.4928, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "duce a sequence of HTML tags that represent the structure", "bbox": {"l": 308.862, "t": 536.54124, "r": 545.11511, "b": 545.4478, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "of the table.", "bbox": {"l": 308.862, "t": 548.49625, "r": 358.5455, "b": 557.4028000000001, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "With each prediction of an HTML standard", "bbox": {"l": 365.19055, "t": 548.49625, "r": 545.11517, "b": 557.4028000000001, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "data cell (\u2018", "bbox": {"l": 308.862, "t": 560.45125, "r": 352.40851, "b": 569.3578, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "<", "bbox": {"l": 352.409, "t": 560.29184, "r": 360.1579, "b": 569.13863, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "td", "bbox": {"l": 360.15799, "t": 560.45125, "r": 367.90891, "b": 569.3578, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": ">", "bbox": {"l": 367.909, "t": 560.29184, "r": 375.6579, "b": 569.13863, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "\u2019) the hidden state of that cell is passed to", "bbox": {"l": 375.65799, "t": 560.45125, "r": 545.11182, "b": 569.3578, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "the Cell BBox Decoder. As for spanning cells, such as row", "bbox": {"l": 308.862, "t": 572.40724, "r": 545.11499, "b": 581.3138, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "or column span, the tag is broken down to \u2018", "bbox": {"l": 308.862, "t": 584.3622399999999, "r": 483.11768, "b": 593.2688, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "<", "bbox": {"l": 483.11902, "t": 584.20284, "r": 490.86792, "b": 593.04962, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "\u2019, \u2018rowspan=\u2019", "bbox": {"l": 490.86800999999997, "t": 584.3622399999999, "r": 545.11438, "b": 593.2688, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "or \u2018colspan=\u2019, with the number of spanning cells (attribute),", "bbox": {"l": 308.862, "t": 596.31725, "r": 545.11493, "b": 605.2238, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "and \u2018", "bbox": {"l": 308.862, "t": 608.27225, "r": 329.64395, "b": 617.1788, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": ">", "bbox": {"l": 329.646, "t": 608.11284, "r": 337.3949, "b": 616.9596300000001, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "\u2019. The hidden state attached to \u2018", "bbox": {"l": 337.39398, "t": 608.27225, "r": 468.5914, "b": 617.1788, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "<", "bbox": {"l": 468.59496999999993, "t": 608.11284, "r": 476.34387000000004, "b": 616.9596300000001, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "\u2019 is passed to the", "bbox": {"l": 476.3439599999999, "t": 608.27225, "r": 545.11572, "b": 617.1788, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "Cell BBox Decoder. A shared feed forward network (FFN)", "bbox": {"l": 308.86197, "t": 620.22725, "r": 545.11499, "b": 629.1338000000001, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "receives the hidden states from the Structure Decoder, to", "bbox": {"l": 308.86197, "t": 632.1822500000001, "r": 545.11517, "b": 641.08881, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "provide the final detection predictions of the bounding box", "bbox": {"l": 308.86197, "t": 644.13824, "r": 545.11511, "b": 653.0448, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "coordinates and their classification.", "bbox": {"l": 308.86197, "t": 656.09325, "r": 449.42432, "b": 664.99981, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "We now describe in detail the proposed method, which is composed of three main components, see Fig. 4. Our CNN Backbone Network encodes the input as a feature vector of predefined length. The input feature vector of the encoded image is passed to the Structure Decoder to produce a sequence of HTML tags that represent the structure of the table. With each prediction of an HTML standard data cell (\u2018 < td > \u2019) the hidden state of that cell is passed to the Cell BBox Decoder. As for spanning cells, such as row or column span, the tag is broken down to \u2018 < \u2019, \u2018rowspan=\u2019 or \u2018colspan=\u2019, with the number of spanning cells (attribute), and \u2018 > \u2019. The hidden state attached to \u2018 < \u2019 is passed to the Cell BBox Decoder. A shared feed forward network (FFN) receives the hidden states from the Structure Decoder, to provide the final detection predictions of the bounding box coordinates and their classification."}, {"label": "text", "id": 7, "page_no": 3, "cluster": {"id": 7, "label": "text", "bbox": {"l": 308.86197, "t": 668.2607, "r": 545.11511, "b": 713.1518169999999, "coord_origin": "TOPLEFT"}, "confidence": 0.978580117225647, "cells": [{"id": 152, "text": "CNN Backbone Network.", "bbox": {"l": 320.81696, "t": 668.2607, "r": 431.90985, "b": 677.21707, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "A ResNet-18 CNN is the", "bbox": {"l": 439.49896, "t": 668.3802499999999, "r": 545.11255, "b": 677.2868100000001, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "backbone that receives the table image and encodes it as a", "bbox": {"l": 308.86197, "t": 680.33525, "r": 545.11499, "b": 689.24181, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "vector of predefined length. The network has been modified", "bbox": {"l": 308.86197, "t": 692.290253, "r": 545.11511, "b": 701.196815, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "by removing the linear and pooling layer, as we are not per-", "bbox": {"l": 308.86197, "t": 704.245255, "r": 545.11505, "b": 713.1518169999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "CNN Backbone Network. A ResNet-18 CNN is the backbone that receives the table image and encodes it as a vector of predefined length. The network has been modified by removing the linear and pooling layer, as we are not per-"}, {"label": "page_footer", "id": 14, "page_no": 3, "cluster": {"id": 14, "label": "page_footer", "bbox": {"l": 295.12097, "t": 734.133251, "r": 300.10226, "b": 743.039814, "coord_origin": "TOPLEFT"}, "confidence": 0.8565718531608582, "cells": [{"id": 157, "text": "4", "bbox": {"l": 295.12097, "t": 734.133251, "r": 300.10226, "b": 743.039814, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4"}], "body": [{"label": "text", "id": 10, "page_no": 3, "cluster": {"id": 10, "label": "text", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 286.36511, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9611433148384094, "cells": [{"id": 0, "text": "amount of such tables, and kept only those ones ranging", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 286.36511, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "between 1*1 and 20*10 (rows/columns).", "bbox": {"l": 50.112, "t": 87.16339000000005, "r": 212.28319, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "amount of such tables, and kept only those ones ranging between 1*1 and 20*10 (rows/columns)."}, {"label": "text", "id": 1, "page_no": 3, "cluster": {"id": 1, "label": "text", "bbox": {"l": 50.112, "t": 100.96038999999996, "r": 286.36514, "b": 313.10507, "coord_origin": "TOPLEFT"}, "confidence": 0.988013744354248, "cells": [{"id": 2, "text": "The availability of the bounding boxes for all table cells", "bbox": {"l": 62.067001, "t": 100.96038999999996, "r": 286.36502, "b": 109.86694, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "is essential to train our models. In order to distinguish be-", "bbox": {"l": 50.112, "t": 112.91540999999995, "r": 286.36508, "b": 121.82195999999999, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "tween empty and non-empty bounding boxes, we have in-", "bbox": {"l": 50.112, "t": 124.87041999999997, "r": 286.36508, "b": 133.77697999999998, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "troduced a binary class in the annotation. Unfortunately, the", "bbox": {"l": 50.112, "t": 136.82641999999998, "r": 286.36511, "b": 145.73297000000002, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "original datasets either omit the bounding boxes for whole", "bbox": {"l": 50.112, "t": 148.78143, "r": 286.36511, "b": 157.68799, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "tables (e.g. TableBank) or they narrow their scope only to", "bbox": {"l": 50.112, "t": 160.73645, "r": 286.36508, "b": 169.64301, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "non-empty cells. Therefore, it was imperative to introduce", "bbox": {"l": 50.112, "t": 172.69146999999998, "r": 286.36505, "b": 181.59802000000002, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "a data pre-processing procedure that generates the missing", "bbox": {"l": 50.112, "t": 184.64648, "r": 286.36508, "b": 193.55304, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "bounding boxes out of the annotation information. This pro-", "bbox": {"l": 50.112, "t": 196.60248, "r": 286.36508, "b": 205.50903000000005, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "cedure first parses the provided table structure and calcu-", "bbox": {"l": 50.112, "t": 208.5575, "r": 286.36508, "b": 217.46405000000004, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "lates the dimensions of the most fine-grained grid that cov-", "bbox": {"l": 50.112, "t": 220.51251000000002, "r": 286.36511, "b": 229.41907000000003, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "ers the table structure. Notice that each table cell may oc-", "bbox": {"l": 50.112, "t": 232.46753, "r": 286.36508, "b": 241.37408000000005, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "cupy multiple grid squares due to row or column spans. In", "bbox": {"l": 50.112, "t": 244.42255, "r": 286.36508, "b": 253.32910000000004, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "case of PubTabNet we had to compute missing bounding", "bbox": {"l": 50.112, "t": 256.37756, "r": 286.36505, "b": 265.28412000000003, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "boxes for 48% of the simple and 69% of the complex ta-", "bbox": {"l": 50.112, "t": 268.33356000000003, "r": 286.36505, "b": 277.24010999999996, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "bles.", "bbox": {"l": 50.112, "t": 280.28853999999995, "r": 68.652397, "b": 289.1951, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Regarding FinTabNet, 68% of the simple and 98%", "bbox": {"l": 75.566444, "t": 280.28853999999995, "r": 286.36514, "b": 289.1951, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "of the complex tables require the generation of bounding", "bbox": {"l": 50.112, "t": 292.24353, "r": 286.36511, "b": 301.15009, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "boxes.", "bbox": {"l": 50.112, "t": 304.19852000000003, "r": 75.695961, "b": 313.10507, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The availability of the bounding boxes for all table cells is essential to train our models. In order to distinguish between empty and non-empty bounding boxes, we have introduced a binary class in the annotation. Unfortunately, the original datasets either omit the bounding boxes for whole tables (e.g. TableBank) or they narrow their scope only to non-empty cells. Therefore, it was imperative to introduce a data pre-processing procedure that generates the missing bounding boxes out of the annotation information. This procedure first parses the provided table structure and calculates the dimensions of the most fine-grained grid that covers the table structure. Notice that each table cell may occupy multiple grid squares due to row or column spans. In case of PubTabNet we had to compute missing bounding boxes for 48% of the simple and 69% of the complex tables. Regarding FinTabNet, 68% of the simple and 98% of the complex tables require the generation of bounding boxes."}, {"label": "text", "id": 4, "page_no": 3, "cluster": {"id": 4, "label": "text", "bbox": {"l": 50.112, "t": 317.99550999999997, "r": 286.36511, "b": 434.49896, "coord_origin": "TOPLEFT"}, "confidence": 0.9873981475830078, "cells": [{"id": 21, "text": "As it is illustrated in Fig. 2, the table distributions from", "bbox": {"l": 62.067001, "t": 317.99550999999997, "r": 286.36499, "b": 326.90207, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "all datasets are skewed towards simpler structures with", "bbox": {"l": 50.112, "t": 329.95151, "r": 286.36511, "b": 338.8580600000001, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "fewer number of rows/columns. Additionally, there is very", "bbox": {"l": 50.112, "t": 341.90649, "r": 286.36502, "b": 350.81305, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "limited variance in the table styles, which in case of Pub-", "bbox": {"l": 50.112, "t": 353.8614799999999, "r": 286.36505, "b": 362.76804, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "TabNet and FinTabNet means one styling format for the", "bbox": {"l": 50.112, "t": 365.81647, "r": 286.36508, "b": 374.72301999999996, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "majority of the tables.", "bbox": {"l": 50.112, "t": 377.77145, "r": 141.58859, "b": 386.67801, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Similar limitations appear also in", "bbox": {"l": 148.70189, "t": 377.77145, "r": 286.36508, "b": 386.67801, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "the type of table content, which in some cases (e.g. FinTab-", "bbox": {"l": 50.112, "t": 389.72644, "r": 286.36508, "b": 398.63300000000004, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Net) is restricted to a certain domain. Ultimately, the lack", "bbox": {"l": 50.112, "t": 401.68243, "r": 286.36511, "b": 410.58899, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "of diversity in the training dataset damages the ability of the", "bbox": {"l": 50.112, "t": 413.63742, "r": 286.36511, "b": 422.54398, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "models to generalize well on unseen data.", "bbox": {"l": 50.112, "t": 425.59241, "r": 216.39774, "b": 434.49896, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "As it is illustrated in Fig. 2, the table distributions from all datasets are skewed towards simpler structures with fewer number of rows/columns. Additionally, there is very limited variance in the table styles, which in case of PubTabNet and FinTabNet means one styling format for the majority of the tables. Similar limitations appear also in the type of table content, which in some cases (e.g. FinTabNet) is restricted to a certain domain. Ultimately, the lack of diversity in the training dataset damages the ability of the models to generalize well on unseen data."}, {"label": "text", "id": 3, "page_no": 3, "cluster": {"id": 3, "label": "text", "bbox": {"l": 50.112, "t": 439.3894, "r": 286.36655, "b": 627.62389, "coord_origin": "TOPLEFT"}, "confidence": 0.9876030087471008, "cells": [{"id": 32, "text": "Motivated by those observations we aimed at generating", "bbox": {"l": 62.067001, "t": 439.3894, "r": 286.36499, "b": 448.2959599999999, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "a synthetic table dataset named", "bbox": {"l": 50.112, "t": 451.34439, "r": 172.14388, "b": 460.25095, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "SynthTabNet", "bbox": {"l": 174.14801, "t": 451.43405, "r": 224.70818999999997, "b": 460.02182, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": ". This approach", "bbox": {"l": 224.70801, "t": 451.34439, "r": 286.36655, "b": 460.25095, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "offers control over: 1) the size of the dataset, 2) the table", "bbox": {"l": 50.112015, "t": 463.30038, "r": 286.36505, "b": 472.20694, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "structure, 3) the table style and 4) the type of content. The", "bbox": {"l": 50.112015, "t": 475.25537, "r": 286.36511, "b": 484.16193, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "complexity of the table structure is described by the size of", "bbox": {"l": 50.112015, "t": 487.21036, "r": 286.36511, "b": 496.11691, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "the table header and the table body, as well as the percentage", "bbox": {"l": 50.112015, "t": 499.16534, "r": 286.36508, "b": 508.0719, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "of the table cells covered by row spans and column spans.", "bbox": {"l": 50.112015, "t": 511.12033, "r": 286.36505, "b": 520.02689, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "A set of carefully designed styling templates provides the", "bbox": {"l": 50.112015, "t": 523.07632, "r": 286.36508, "b": 531.98288, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "basis to build a wide range of table appearances. Lastly, the", "bbox": {"l": 50.112015, "t": 535.0313100000001, "r": 286.36508, "b": 543.93788, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "table content is generated out of a curated collection of text", "bbox": {"l": 50.112015, "t": 546.98633, "r": 286.36511, "b": 555.89288, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "corpora. By controlling the size and scope of the synthetic", "bbox": {"l": 50.112015, "t": 558.94133, "r": 286.36508, "b": 567.84789, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "datasets we are able to train and evaluate our models in a", "bbox": {"l": 50.112015, "t": 570.89633, "r": 286.36511, "b": 579.8028899999999, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "variety of different conditions. For example, we can first", "bbox": {"l": 50.112015, "t": 582.85133, "r": 286.36511, "b": 591.75789, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "generate a highly diverse dataset to train our models and", "bbox": {"l": 50.112015, "t": 594.80733, "r": 286.36505, "b": 603.71388, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "then evaluate their performance on other synthetic datasets", "bbox": {"l": 50.112015, "t": 606.76233, "r": 286.36508, "b": 615.6688800000001, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "which are focused on a specific domain.", "bbox": {"l": 50.112015, "t": 618.71733, "r": 209.7527, "b": 627.62389, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Motivated by those observations we aimed at generating a synthetic table dataset named SynthTabNet . This approach offers control over: 1) the size of the dataset, 2) the table structure, 3) the table style and 4) the type of content. The complexity of the table structure is described by the size of the table header and the table body, as well as the percentage of the table cells covered by row spans and column spans. A set of carefully designed styling templates provides the basis to build a wide range of table appearances. Lastly, the table content is generated out of a curated collection of text corpora. By controlling the size and scope of the synthetic datasets we are able to train and evaluate our models in a variety of different conditions. For example, we can first generate a highly diverse dataset to train our models and then evaluate their performance on other synthetic datasets which are focused on a specific domain."}, {"label": "text", "id": 5, "page_no": 3, "cluster": {"id": 5, "label": "text", "bbox": {"l": 50.112015, "t": 632.51433, "r": 286.36511, "b": 713.151894, "coord_origin": "TOPLEFT"}, "confidence": 0.9871614575386047, "cells": [{"id": 50, "text": "In this regard, we have prepared four synthetic datasets,", "bbox": {"l": 62.067017, "t": 632.51433, "r": 286.36499, "b": 641.42088, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "each one containing 150k examples. The corpora to gener-", "bbox": {"l": 50.112015, "t": 644.46933, "r": 286.36508, "b": 653.37589, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "ate the table text consists of the most frequent terms appear-", "bbox": {"l": 50.112015, "t": 656.42532, "r": 286.36511, "b": 665.33189, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "ing in PubTabNet and FinTabNet together with randomly", "bbox": {"l": 50.112015, "t": 668.38033, "r": 286.36505, "b": 677.28689, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "generated text. The first two synthetic datasets have been", "bbox": {"l": 50.112015, "t": 680.33533, "r": 286.36508, "b": 689.24189, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "fine-tuned to mimic the appearance of the original datasets", "bbox": {"l": 50.112015, "t": 692.290329, "r": 286.36508, "b": 701.196892, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "but encompass more complicated table structures. The third", "bbox": {"l": 50.112015, "t": 704.245331, "r": 286.36511, "b": 713.151894, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In this regard, we have prepared four synthetic datasets, each one containing 150k examples. The corpora to generate the table text consists of the most frequent terms appearing in PubTabNet and FinTabNet together with randomly generated text. The first two synthetic datasets have been fine-tuned to mimic the appearance of the original datasets but encompass more complicated table structures. The third"}, {"label": "table", "id": 8, "page_no": 3, "cluster": {"id": 8, "label": "table", "bbox": {"l": 310.67584228515625, "t": 73.19388580322266, "r": 542.9547119140625, "b": 155.22052001953125, "coord_origin": "TOPLEFT"}, "confidence": 0.9777463674545288, "cells": [{"id": 57, "text": "Tags", "bbox": {"l": 412.332, "t": 73.61437999999998, "r": 430.90231, "b": 82.52094, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Bbox", "bbox": {"l": 442.85742, "t": 73.61437999999998, "r": 464.4463799999999, "b": 82.52094, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Size", "bbox": {"l": 477.78632, "t": 73.61437999999998, "r": 494.94193, "b": 82.52094, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Format", "bbox": {"l": 508.28186, "t": 73.61437999999998, "r": 536.91437, "b": 82.52094, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "PubTabNet", "bbox": {"l": 317.06, "t": 85.9673499999999, "r": 361.64264, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "3", "bbox": {"l": 417.85599, "t": 85.6684600000001, "r": 425.37775, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "3", "bbox": {"l": 449.89569, "t": 85.6684600000001, "r": 457.41745000000003, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "509k", "bbox": {"l": 476.401, "t": 85.9673499999999, "r": 496.3262, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "PNG", "bbox": {"l": 512.63495, "t": 85.9673499999999, "r": 532.56012, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "FinTabNet", "bbox": {"l": 317.06, "t": 97.92236000000003, "r": 359.43094, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "3", "bbox": {"l": 417.85599, "t": 97.62347, "r": 425.37775, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "3", "bbox": {"l": 449.89569, "t": 97.62347, "r": 457.41745000000003, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "112k", "bbox": {"l": 476.401, "t": 97.92236000000003, "r": 496.3262, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "PDF", "bbox": {"l": 513.46185, "t": 97.92236000000003, "r": 531.73328, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "TableBank", "bbox": {"l": 317.06, "t": 109.87836000000004, "r": 359.97888, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "3", "bbox": {"l": 417.85599, "t": 109.57947000000001, "r": 425.37775, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "7", "bbox": {"l": 450.81226, "t": 109.57947000000001, "r": 456.50091999999995, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "145k", "bbox": {"l": 476.401, "t": 109.87836000000004, "r": 496.3262, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "JPEG", "bbox": {"l": 511.25017999999994, "t": 109.87836000000004, "r": 533.94501, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "Combined-Tabnet(*)", "bbox": {"l": 317.06, "t": 121.83336999999995, "r": 400.37723, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "3", "bbox": {"l": 417.85599, "t": 121.53448000000003, "r": 425.37775, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "3", "bbox": {"l": 449.89569, "t": 121.53448000000003, "r": 457.41745000000003, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "400k", "bbox": {"l": 476.401, "t": 121.83336999999995, "r": 496.3262, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "PNG", "bbox": {"l": 512.63495, "t": 121.83336999999995, "r": 532.56012, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Combined(**)", "bbox": {"l": 317.06, "t": 133.78839000000005, "r": 375.17184, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "3", "bbox": {"l": 417.85599, "t": 133.48950000000002, "r": 425.37775, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "3", "bbox": {"l": 449.89569, "t": 133.48950000000002, "r": 457.41745000000003, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "500k", "bbox": {"l": 476.401, "t": 133.78839000000005, "r": 496.3262, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "PNG", "bbox": {"l": 512.63495, "t": 133.78839000000005, "r": 532.56012, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "SynthTabNet", "bbox": {"l": 317.06, "t": 145.74341000000004, "r": 369.39352, "b": 154.64995999999996, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "3", "bbox": {"l": 417.85599, "t": 145.44446000000005, "r": 425.37775, "b": 154.65985, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "3", "bbox": {"l": 449.89569, "t": 145.44446000000005, "r": 457.41745000000003, "b": 154.65985, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "600k", "bbox": {"l": 476.401, "t": 145.74334999999996, "r": 496.3262, "b": 154.6499, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "PNG", "bbox": {"l": 512.63495, "t": 145.74334999999996, "r": 532.56012, "b": 154.6499, "coord_origin": "TOPLEFT"}}], "children": [{"id": 15, "label": "text", "bbox": {"l": 412.332, "t": 73.61437999999998, "r": 430.90231, "b": 82.52094, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "Tags", "bbox": {"l": 412.332, "t": 73.61437999999998, "r": 430.90231, "b": 82.52094, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 442.85742, "t": 73.61437999999998, "r": 464.4463799999999, "b": 82.52094, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "Bbox", "bbox": {"l": 442.85742, "t": 73.61437999999998, "r": 464.4463799999999, "b": 82.52094, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 477.78632, "t": 73.61437999999998, "r": 494.94193, "b": 82.52094, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "Size", "bbox": {"l": 477.78632, "t": 73.61437999999998, "r": 494.94193, "b": 82.52094, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 508.28186, "t": 73.61437999999998, "r": 536.91437, "b": 82.52094, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "Format", "bbox": {"l": 508.28186, "t": 73.61437999999998, "r": 536.91437, "b": 82.52094, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 317.06, "t": 85.9673499999999, "r": 361.64264, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "PubTabNet", "bbox": {"l": 317.06, "t": 85.9673499999999, "r": 361.64264, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 417.85599, "t": 85.6684600000001, "r": 425.37775, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "3", "bbox": {"l": 417.85599, "t": 85.6684600000001, "r": 425.37775, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 449.89569, "t": 85.6684600000001, "r": 457.41745000000003, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "3", "bbox": {"l": 449.89569, "t": 85.6684600000001, "r": 457.41745000000003, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 476.401, "t": 85.9673499999999, "r": 496.3262, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "509k", "bbox": {"l": 476.401, "t": 85.9673499999999, "r": 496.3262, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 512.63495, "t": 85.9673499999999, "r": 532.56012, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "PNG", "bbox": {"l": 512.63495, "t": 85.9673499999999, "r": 532.56012, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 317.06, "t": 97.92236000000003, "r": 359.43094, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "FinTabNet", "bbox": {"l": 317.06, "t": 97.92236000000003, "r": 359.43094, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 417.85599, "t": 97.62347, "r": 425.37775, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "3", "bbox": {"l": 417.85599, "t": 97.62347, "r": 425.37775, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 449.89569, "t": 97.62347, "r": 457.41745000000003, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "3", "bbox": {"l": 449.89569, "t": 97.62347, "r": 457.41745000000003, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 476.401, "t": 97.92236000000003, "r": 496.3262, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "112k", "bbox": {"l": 476.401, "t": 97.92236000000003, "r": 496.3262, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 513.46185, "t": 97.92236000000003, "r": 531.73328, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "PDF", "bbox": {"l": 513.46185, "t": 97.92236000000003, "r": 531.73328, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 317.06, "t": 109.87836000000004, "r": 359.97888, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "TableBank", "bbox": {"l": 317.06, "t": 109.87836000000004, "r": 359.97888, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 417.85599, "t": 109.57947000000001, "r": 425.37775, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "3", "bbox": {"l": 417.85599, "t": 109.57947000000001, "r": 425.37775, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 450.81226, "t": 109.57947000000001, "r": 456.50091999999995, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "7", "bbox": {"l": 450.81226, "t": 109.57947000000001, "r": 456.50091999999995, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 476.401, "t": 109.87836000000004, "r": 496.3262, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "145k", "bbox": {"l": 476.401, "t": 109.87836000000004, "r": 496.3262, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 511.25017999999994, "t": 109.87836000000004, "r": 533.94501, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "JPEG", "bbox": {"l": 511.25017999999994, "t": 109.87836000000004, "r": 533.94501, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 317.06, "t": 121.83336999999995, "r": 400.37723, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "Combined-Tabnet(*)", "bbox": {"l": 317.06, "t": 121.83336999999995, "r": 400.37723, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 417.85599, "t": 121.53448000000003, "r": 425.37775, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "3", "bbox": {"l": 417.85599, "t": 121.53448000000003, "r": 425.37775, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 449.89569, "t": 121.53448000000003, "r": 457.41745000000003, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "3", "bbox": {"l": 449.89569, "t": 121.53448000000003, "r": 457.41745000000003, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 476.401, "t": 121.83336999999995, "r": 496.3262, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "400k", "bbox": {"l": 476.401, "t": 121.83336999999995, "r": 496.3262, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 512.63495, "t": 121.83336999999995, "r": 532.56012, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "PNG", "bbox": {"l": 512.63495, "t": 121.83336999999995, "r": 532.56012, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 317.06, "t": 133.78839000000005, "r": 375.17184, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "Combined(**)", "bbox": {"l": 317.06, "t": 133.78839000000005, "r": 375.17184, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 417.85599, "t": 133.48950000000002, "r": 425.37775, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "3", "bbox": {"l": 417.85599, "t": 133.48950000000002, "r": 425.37775, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 449.89569, "t": 133.48950000000002, "r": 457.41745000000003, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "3", "bbox": {"l": 449.89569, "t": 133.48950000000002, "r": 457.41745000000003, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 476.401, "t": 133.78839000000005, "r": 496.3262, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "500k", "bbox": {"l": 476.401, "t": 133.78839000000005, "r": 496.3262, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 512.63495, "t": 133.78839000000005, "r": 532.56012, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "PNG", "bbox": {"l": 512.63495, "t": 133.78839000000005, "r": 532.56012, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 317.06, "t": 145.74341000000004, "r": 369.39352, "b": 154.64995999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "SynthTabNet", "bbox": {"l": 317.06, "t": 145.74341000000004, "r": 369.39352, "b": 154.64995999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 417.85599, "t": 145.44446000000005, "r": 425.37775, "b": 154.65985, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "3", "bbox": {"l": 417.85599, "t": 145.44446000000005, "r": 425.37775, "b": 154.65985, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 449.89569, "t": 145.44446000000005, "r": 457.41745000000003, "b": 154.65985, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "3", "bbox": {"l": 449.89569, "t": 145.44446000000005, "r": 457.41745000000003, "b": 154.65985, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 476.401, "t": 145.74334999999996, "r": 496.3262, "b": 154.6499, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "600k", "bbox": {"l": 476.401, "t": 145.74334999999996, "r": 496.3262, "b": 154.6499, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 512.63495, "t": 145.74334999999996, "r": 532.56012, "b": 154.6499, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "PNG", "bbox": {"l": 512.63495, "t": 145.74334999999996, "r": 532.56012, "b": 154.6499, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ecel", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 7, "num_cols": 5, "table_cells": [{"bbox": {"l": 412.332, "t": 73.61437999999998, "r": 430.90231, "b": 82.52094, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Tags", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 442.85742, "t": 73.61437999999998, "r": 464.4463799999999, "b": 82.52094, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Bbox", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 477.78632, "t": 73.61437999999998, "r": 494.94193, "b": 82.52094, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Size", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 508.28186, "t": 73.61437999999998, "r": 536.91437, "b": 82.52094, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Format", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 317.06, "t": 85.9673499999999, "r": 361.64264, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PubTabNet", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 417.85599, "t": 85.6684600000001, "r": 425.37775, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 449.89569, "t": 85.6684600000001, "r": 457.41745000000003, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 476.401, "t": 85.9673499999999, "r": 496.3262, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "509k", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 512.63495, "t": 85.9673499999999, "r": 532.56012, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "PNG", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 317.06, "t": 97.92236000000003, "r": 359.43094, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "FinTabNet", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 417.85599, "t": 97.62347, "r": 425.37775, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 449.89569, "t": 97.62347, "r": 457.41745000000003, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 476.401, "t": 97.92236000000003, "r": 496.3262, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "112k", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 513.46185, "t": 97.92236000000003, "r": 531.73328, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "PDF", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 317.06, "t": 109.87836000000004, "r": 359.97888, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableBank", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 417.85599, "t": 109.57947000000001, "r": 425.37775, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 450.81226, "t": 109.57947000000001, "r": 456.50091999999995, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 476.401, "t": 109.87836000000004, "r": 496.3262, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "145k", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 511.25017999999994, "t": 109.87836000000004, "r": 533.94501, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "JPEG", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 317.06, "t": 121.83336999999995, "r": 400.37723, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Combined-Tabnet(*)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 417.85599, "t": 121.53448000000003, "r": 425.37775, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 449.89569, "t": 121.53448000000003, "r": 457.41745000000003, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 476.401, "t": 121.83336999999995, "r": 496.3262, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "400k", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 512.63495, "t": 121.83336999999995, "r": 532.56012, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "PNG", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 317.06, "t": 133.78839000000005, "r": 375.17184, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Combined(**)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 417.85599, "t": 133.48950000000002, "r": 425.37775, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 449.89569, "t": 133.48950000000002, "r": 457.41745000000003, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 476.401, "t": 133.78839000000005, "r": 496.3262, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "500k", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 512.63495, "t": 133.78839000000005, "r": 532.56012, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "PNG", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 317.06, "t": 145.74341000000004, "r": 369.39352, "b": 154.64995999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "SynthTabNet", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 417.85599, "t": 145.44446000000005, "r": 425.37775, "b": 154.65985, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 449.89569, "t": 145.44446000000005, "r": 457.41745000000003, "b": 154.65985, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 476.401, "t": 145.74334999999996, "r": 496.3262, "b": 154.6499, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "600k", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 512.63495, "t": 145.74334999999996, "r": 532.56012, "b": 154.6499, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "PNG", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "caption", "id": 9, "page_no": 3, "cluster": {"id": 9, "label": "caption", "bbox": {"l": 308.862, "t": 167.66138, "r": 545.11505, "b": 224.38897999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9667726755142212, "cells": [{"id": 91, "text": "Table 1:", "bbox": {"l": 308.862, "t": 167.66138, "r": 344.6178, "b": 176.56793000000005, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Both", "bbox": {"l": 361.07602, "t": 167.66138, "r": 380.45328, "b": 176.56793000000005, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "\u201cCombined-Tabnet\u201d", "bbox": {"l": 386.56799, "t": 167.75104, "r": 468.67974999999996, "b": 176.33880999999997, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "and", "bbox": {"l": 474.79599, "t": 167.66138, "r": 489.18198, "b": 176.56793000000005, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "\u201dCombined-", "bbox": {"l": 495.29898000000003, "t": 167.75104, "r": 545.112, "b": 176.33880999999997, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "Tabnet\u201d", "bbox": {"l": 308.862, "t": 179.70605, "r": 341.16077, "b": 188.29381999999998, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "are variations of the following: (*) The Combined-", "bbox": {"l": 343.457, "t": 179.61639000000002, "r": 545.11005, "b": 188.52295000000004, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "Tabnet dataset is the processed combination of PubTabNet", "bbox": {"l": 308.862, "t": 191.57141000000001, "r": 545.11505, "b": 200.47797000000003, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "and Fintabnet. (**) The combined dataset is the processed", "bbox": {"l": 308.862, "t": 203.52643, "r": 545.11499, "b": 212.43298000000004, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "combination of PubTabNet, Fintabnet and TableBank.", "bbox": {"l": 308.862, "t": 215.48242000000005, "r": 523.93469, "b": 224.38897999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 1: Both \u201cCombined-Tabnet\u201d and \u201dCombinedTabnet\u201d are variations of the following: (*) The CombinedTabnet dataset is the processed combination of PubTabNet and Fintabnet. (**) The combined dataset is the processed combination of PubTabNet, Fintabnet and TableBank."}, {"label": "text", "id": 6, "page_no": 3, "cluster": {"id": 6, "label": "text", "bbox": {"l": 308.862, "t": 249.62041999999997, "r": 545.11517, "b": 294.39197, "coord_origin": "TOPLEFT"}, "confidence": 0.978954017162323, "cells": [{"id": 101, "text": "one adopts a colorful appearance with high contrast and the", "bbox": {"l": 308.862, "t": 249.62041999999997, "r": 545.11517, "b": 258.52698, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "last one contains tables with sparse content. Lastly, we have", "bbox": {"l": 308.862, "t": 261.57543999999996, "r": 545.11517, "b": 270.48199, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "combined all synthetic datasets into one big unified syn-", "bbox": {"l": 308.862, "t": 273.5304, "r": 545.11505, "b": 282.43698, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "thetic dataset of 600k examples.", "bbox": {"l": 308.862, "t": 285.48541000000006, "r": 436.82169, "b": 294.39197, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "one adopts a colorful appearance with high contrast and the last one contains tables with sparse content. Lastly, we have combined all synthetic datasets into one big unified synthetic dataset of 600k examples."}, {"label": "text", "id": 13, "page_no": 3, "cluster": {"id": 13, "label": "text", "bbox": {"l": 320.81699, "t": 297.77240000000006, "r": 542.74396, "b": 306.67896, "coord_origin": "TOPLEFT"}, "confidence": 0.9043695330619812, "cells": [{"id": 105, "text": "Tab. 1 summarizes the various attributes of the datasets.", "bbox": {"l": 320.81699, "t": 297.77240000000006, "r": 542.74396, "b": 306.67896, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Tab. 1 summarizes the various attributes of the datasets."}, {"label": "section_header", "id": 11, "page_no": 3, "cluster": {"id": 11, "label": "section_header", "bbox": {"l": 308.862, "t": 321.18396, "r": 444.93607000000003, "b": 331.93167000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9466595649719238, "cells": [{"id": 106, "text": "4.", "bbox": {"l": 308.862, "t": 321.18396, "r": 316.28476, "b": 331.93167000000005, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "The TableFormer model", "bbox": {"l": 326.18176, "t": 321.18396, "r": 444.93607000000003, "b": 331.93167000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4. The TableFormer model"}, {"label": "text", "id": 0, "page_no": 3, "cluster": {"id": 0, "label": "text", "bbox": {"l": 308.862, "t": 341.93939, "r": 545.11523, "b": 446.48685000000006, "coord_origin": "TOPLEFT"}, "confidence": 0.9884450435638428, "cells": [{"id": 108, "text": "Given the image of a table, TableFormer is able to pre-", "bbox": {"l": 320.81699, "t": 341.93939, "r": 545.11499, "b": 350.84594999999996, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "dict: 1) a sequence of tokens that represent the structure of", "bbox": {"l": 308.862, "t": 353.89438, "r": 545.11511, "b": 362.80092999999994, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "a table, and 2) a bounding box coupled to a subset of those", "bbox": {"l": 308.862, "t": 365.84937, "r": 545.11517, "b": 374.75592, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "tokens. The conversion of an image into a sequence of to-", "bbox": {"l": 308.862, "t": 377.80435, "r": 545.11505, "b": 386.71091, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "kens is a well-known task [35, 16]. While attention is often", "bbox": {"l": 308.862, "t": 389.75934000000007, "r": 545.11517, "b": 398.66588999999993, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "used as an implicit method to associate each token of the", "bbox": {"l": 308.862, "t": 401.71432000000004, "r": 545.11523, "b": 410.62088, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "sequence with a position in the original image, an explicit", "bbox": {"l": 308.862, "t": 413.67032, "r": 545.11517, "b": 422.57687, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "association between the individual table-cells and the image", "bbox": {"l": 308.862, "t": 425.62531, "r": 545.11505, "b": 434.53186, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "bounding boxes is also required.", "bbox": {"l": 308.862, "t": 437.58029, "r": 437.9375, "b": 446.48685000000006, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Given the image of a table, TableFormer is able to predict: 1) a sequence of tokens that represent the structure of a table, and 2) a bounding box coupled to a subset of those tokens. The conversion of an image into a sequence of tokens is a well-known task [35, 16]. While attention is often used as an implicit method to associate each token of the sequence with a position in the original image, an explicit association between the individual table-cells and the image bounding boxes is also required."}, {"label": "section_header", "id": 12, "page_no": 3, "cluster": {"id": 12, "label": "section_header", "bbox": {"l": 308.862, "t": 457.69427, "r": 420.16058, "b": 467.54633, "coord_origin": "TOPLEFT"}, "confidence": 0.937696099281311, "cells": [{"id": 117, "text": "4.1.", "bbox": {"l": 308.862, "t": 457.69427, "r": 323.14081, "b": 467.54633, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "Model architecture.", "bbox": {"l": 332.66003, "t": 457.69427, "r": 420.16058, "b": 467.54633, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4.1. Model architecture."}, {"label": "text", "id": 2, "page_no": 3, "cluster": {"id": 2, "label": "text", "bbox": {"l": 308.86197, "t": 476.76529, "r": 545.11572, "b": 664.99981, "coord_origin": "TOPLEFT"}, "confidence": 0.9878323078155518, "cells": [{"id": 119, "text": "We now describe in detail the proposed method, which", "bbox": {"l": 320.81699, "t": 476.76529, "r": 545.11487, "b": 485.67184, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "is composed of three main components, see Fig.", "bbox": {"l": 308.862, "t": 488.72028, "r": 509.02054, "b": 497.62683, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "4.", "bbox": {"l": 515.58588, "t": 488.72028, "r": 523.05786, "b": 497.62683, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Our", "bbox": {"l": 529.62323, "t": 488.72028, "r": 545.11505, "b": 497.62683, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "CNN Backbone Network", "bbox": {"l": 308.862, "t": 500.76492, "r": 406.34601, "b": 509.35269, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "encodes the input as a feature vec-", "bbox": {"l": 408.87201, "t": 500.67526, "r": 545.1106, "b": 509.58182, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "tor of predefined length.", "bbox": {"l": 308.862, "t": 512.63126, "r": 409.39459, "b": 521.53781, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "The input feature vector of the", "bbox": {"l": 416.72705, "t": 512.63126, "r": 545.11505, "b": 521.53781, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "encoded image is passed to the", "bbox": {"l": 308.862, "t": 524.58624, "r": 436.194, "b": 533.4928, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "Structure Decoder", "bbox": {"l": 439.526, "t": 524.6759, "r": 513.86694, "b": 533.26367, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "to pro-", "bbox": {"l": 517.43201, "t": 524.58624, "r": 545.10815, "b": 533.4928, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "duce a sequence of HTML tags that represent the structure", "bbox": {"l": 308.862, "t": 536.54124, "r": 545.11511, "b": 545.4478, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "of the table.", "bbox": {"l": 308.862, "t": 548.49625, "r": 358.5455, "b": 557.4028000000001, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "With each prediction of an HTML standard", "bbox": {"l": 365.19055, "t": 548.49625, "r": 545.11517, "b": 557.4028000000001, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "data cell (\u2018", "bbox": {"l": 308.862, "t": 560.45125, "r": 352.40851, "b": 569.3578, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "<", "bbox": {"l": 352.409, "t": 560.29184, "r": 360.1579, "b": 569.13863, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "td", "bbox": {"l": 360.15799, "t": 560.45125, "r": 367.90891, "b": 569.3578, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": ">", "bbox": {"l": 367.909, "t": 560.29184, "r": 375.6579, "b": 569.13863, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "\u2019) the hidden state of that cell is passed to", "bbox": {"l": 375.65799, "t": 560.45125, "r": 545.11182, "b": 569.3578, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "the Cell BBox Decoder. As for spanning cells, such as row", "bbox": {"l": 308.862, "t": 572.40724, "r": 545.11499, "b": 581.3138, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "or column span, the tag is broken down to \u2018", "bbox": {"l": 308.862, "t": 584.3622399999999, "r": 483.11768, "b": 593.2688, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "<", "bbox": {"l": 483.11902, "t": 584.20284, "r": 490.86792, "b": 593.04962, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "\u2019, \u2018rowspan=\u2019", "bbox": {"l": 490.86800999999997, "t": 584.3622399999999, "r": 545.11438, "b": 593.2688, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "or \u2018colspan=\u2019, with the number of spanning cells (attribute),", "bbox": {"l": 308.862, "t": 596.31725, "r": 545.11493, "b": 605.2238, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "and \u2018", "bbox": {"l": 308.862, "t": 608.27225, "r": 329.64395, "b": 617.1788, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": ">", "bbox": {"l": 329.646, "t": 608.11284, "r": 337.3949, "b": 616.9596300000001, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "\u2019. The hidden state attached to \u2018", "bbox": {"l": 337.39398, "t": 608.27225, "r": 468.5914, "b": 617.1788, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "<", "bbox": {"l": 468.59496999999993, "t": 608.11284, "r": 476.34387000000004, "b": 616.9596300000001, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "\u2019 is passed to the", "bbox": {"l": 476.3439599999999, "t": 608.27225, "r": 545.11572, "b": 617.1788, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "Cell BBox Decoder. A shared feed forward network (FFN)", "bbox": {"l": 308.86197, "t": 620.22725, "r": 545.11499, "b": 629.1338000000001, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "receives the hidden states from the Structure Decoder, to", "bbox": {"l": 308.86197, "t": 632.1822500000001, "r": 545.11517, "b": 641.08881, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "provide the final detection predictions of the bounding box", "bbox": {"l": 308.86197, "t": 644.13824, "r": 545.11511, "b": 653.0448, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "coordinates and their classification.", "bbox": {"l": 308.86197, "t": 656.09325, "r": 449.42432, "b": 664.99981, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "We now describe in detail the proposed method, which is composed of three main components, see Fig. 4. Our CNN Backbone Network encodes the input as a feature vector of predefined length. The input feature vector of the encoded image is passed to the Structure Decoder to produce a sequence of HTML tags that represent the structure of the table. With each prediction of an HTML standard data cell (\u2018 < td > \u2019) the hidden state of that cell is passed to the Cell BBox Decoder. As for spanning cells, such as row or column span, the tag is broken down to \u2018 < \u2019, \u2018rowspan=\u2019 or \u2018colspan=\u2019, with the number of spanning cells (attribute), and \u2018 > \u2019. The hidden state attached to \u2018 < \u2019 is passed to the Cell BBox Decoder. A shared feed forward network (FFN) receives the hidden states from the Structure Decoder, to provide the final detection predictions of the bounding box coordinates and their classification."}, {"label": "text", "id": 7, "page_no": 3, "cluster": {"id": 7, "label": "text", "bbox": {"l": 308.86197, "t": 668.2607, "r": 545.11511, "b": 713.1518169999999, "coord_origin": "TOPLEFT"}, "confidence": 0.978580117225647, "cells": [{"id": 152, "text": "CNN Backbone Network.", "bbox": {"l": 320.81696, "t": 668.2607, "r": 431.90985, "b": 677.21707, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "A ResNet-18 CNN is the", "bbox": {"l": 439.49896, "t": 668.3802499999999, "r": 545.11255, "b": 677.2868100000001, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "backbone that receives the table image and encodes it as a", "bbox": {"l": 308.86197, "t": 680.33525, "r": 545.11499, "b": 689.24181, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "vector of predefined length. The network has been modified", "bbox": {"l": 308.86197, "t": 692.290253, "r": 545.11511, "b": 701.196815, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "by removing the linear and pooling layer, as we are not per-", "bbox": {"l": 308.86197, "t": 704.245255, "r": 545.11505, "b": 713.1518169999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "CNN Backbone Network. A ResNet-18 CNN is the backbone that receives the table image and encodes it as a vector of predefined length. The network has been modified by removing the linear and pooling layer, as we are not per-"}], "headers": [{"label": "page_footer", "id": 14, "page_no": 3, "cluster": {"id": 14, "label": "page_footer", "bbox": {"l": 295.12097, "t": 734.133251, "r": 300.10226, "b": 743.039814, "coord_origin": "TOPLEFT"}, "confidence": 0.8565718531608582, "cells": [{"id": 157, "text": "4", "bbox": {"l": 295.12097, "t": 734.133251, "r": 300.10226, "b": 743.039814, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4"}]}}, {"page_no": 4, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "1.", "bbox": {"l": 81.688072, "t": 122.43970000000002, "r": 84.927567, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Item", "bbox": {"l": 86.54731, "t": 122.43970000000002, "r": 93.026291, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Amount", "bbox": {"l": 102.50498, "t": 115.25214000000005, "r": 115.3461, "b": 118.44135000000006, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Names", "bbox": {"l": 82.140205, "t": 115.21489999999994, "r": 93.291527, "b": 118.40410999999995, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "1000", "bbox": {"l": 96.748268, "t": 122.43970000000002, "r": 104.3119, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "500", "bbox": {"l": 96.748268, "t": 127.74370999999985, "r": 102.42083, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "3500", "bbox": {"l": 96.748268, "t": 133.45569, "r": 104.3119, "b": 136.6449, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "150", "bbox": {"l": 96.748268, "t": 139.16772000000003, "r": 102.42083, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "unit", "bbox": {"l": 110.66107, "t": 122.43970000000002, "r": 116.14391, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "unit", "bbox": {"l": 110.66107, "t": 127.74370999999985, "r": 116.14391, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "unit", "bbox": {"l": 110.66107, "t": 133.45569, "r": 116.14391, "b": 136.6449, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "unit", "bbox": {"l": 110.66107, "t": 139.16772000000003, "r": 116.14391, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "2.", "bbox": {"l": 81.688072, "t": 127.74370999999985, "r": 84.927567, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Item", "bbox": {"l": 86.54731, "t": 127.74370999999985, "r": 93.026291, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "3.", "bbox": {"l": 81.688072, "t": 133.45569, "r": 84.927567, "b": 136.6449, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Item", "bbox": {"l": 86.54731, "t": 133.45569, "r": 93.026291, "b": 136.6449, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "4.", "bbox": {"l": 81.688072, "t": 139.16772000000003, "r": 84.927567, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "Item", "bbox": {"l": 86.54731, "t": 139.16772000000003, "r": 93.026291, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Extracted", "bbox": {"l": 88.084389, "t": 90.49738000000002, "r": 113.93649, "b": 96.23798, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Table Images", "bbox": {"l": 82.81002, "t": 97.63738999999998, "r": 119.21240000000002, "b": 103.37798999999995, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Standardized", "bbox": {"l": 143.94247, "t": 100.60235999999998, "r": 180.01131, "b": 106.34295999999995, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Images", "bbox": {"l": 151.94064, "t": 107.74237000000005, "r": 172.0118, "b": 113.48297000000014, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "BBox", "bbox": {"l": 251.76939000000002, "t": 80.93096999999989, "r": 266.39557, "b": 86.67156999999997, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Decoder", "bbox": {"l": 247.51601, "t": 86.03101000000004, "r": 270.65021, "b": 91.77161000000001, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "BBoxes", "bbox": {"l": 331.03699, "t": 78.55980999999997, "r": 352.12589, "b": 84.30042000000003, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "BBoxes can be", "bbox": {"l": 390.56421, "t": 96.03223000000003, "r": 431.7261, "b": 101.77282999999989, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "traced back to the", "bbox": {"l": 386.82422, "t": 102.15228000000013, "r": 435.46966999999995, "b": 107.89287999999999, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "original image to", "bbox": {"l": 388.69589, "t": 108.27228000000002, "r": 433.6032400000001, "b": 114.01288000000011, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "extract content", "bbox": {"l": 391.07761, "t": 114.39227000000005, "r": 431.22542999999996, "b": 120.13286999999991, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Structure Tags sequence", "bbox": {"l": 431.22650000000004, "t": 151.68511999999998, "r": 498.82068, "b": 157.42571999999996, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "provide full description of", "bbox": {"l": 431.1738, "t": 157.80517999999995, "r": 498.87753000000004, "b": 163.54578000000004, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "the table structure", "bbox": {"l": 440.5289, "t": 163.92516999999998, "r": 489.51827999999995, "b": 169.66576999999995, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Structure Tags", "bbox": {"l": 328.37479, "t": 178.25385000000006, "r": 367.72333, "b": 183.99445000000003, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "BBoxes in sync", "bbox": {"l": 331.84451, "t": 123.90886999999998, "r": 373.67963, "b": 129.64948000000015, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "with tag sequence", "bbox": {"l": 331.84451, "t": 129.00885000000017, "r": 381.17786, "b": 134.74945000000002, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "Encoder", "bbox": {"l": 196.62633, "t": 88.11621000000002, "r": 219.42332, "b": 93.85681, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Structure", "bbox": {"l": 246.66771, "t": 129.4946900000001, "r": 271.49899, "b": 135.23528999999996, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "Decoder", "bbox": {"l": 247.51601, "t": 134.59473000000003, "r": 270.65021, "b": 140.33533, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "[x1, y2, x2, y2]", "bbox": {"l": 330.63071, "t": 89.01923, "r": 365.55347, "b": 94.75982999999997, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "[x1', y2', x2', y2']", "bbox": {"l": 330.63071, "t": 97.17926, "r": 370.22717, "b": 102.91985999999997, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "[x1'', y2'', x2'', y2'']", "bbox": {"l": 330.63071, "t": 105.33922999999993, "r": 374.51157, "b": 111.07983000000002, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "...", "bbox": {"l": 330.63071, "t": 113.49926999999991, "r": 335.73233, "b": 119.23987, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "<TR>", "bbox": {"l": 322.30579, "t": 141.79236000000003, "r": 335.05988, "b": 146.57617000000005, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "<TD>", "bbox": {"l": 322.30579, "t": 148.93231000000003, "r": 335.05988, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "1", "bbox": {"l": 337.54971, "t": 148.55579, "r": 340.95242, "b": 154.29638999999997, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "</TD><TD colspan=\"2\">", "bbox": {"l": 343.56262, "t": 148.93231000000003, "r": 398.91446, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "</TD>", "bbox": {"l": 407.41718, "t": 148.93231000000003, "r": 421.58801, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "</TR><TR>", "bbox": {"l": 322.30579, "t": 156.07232999999997, "r": 349.23022, "b": 160.85613999999998, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "<TD>", "bbox": {"l": 322.30579, "t": 163.21234000000004, "r": 335.05988, "b": 167.99614999999994, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "</TD><TD>...", "bbox": {"l": 343.56155, "t": 163.21234000000004, "r": 374.73685, "b": 167.99614999999994, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "...", "bbox": {"l": 322.30579, "t": 170.35235999999998, "r": 326.55716, "b": 175.13617, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "1", "bbox": {"l": 323.51111, "t": 89.66967999999997, "r": 326.91382, "b": 95.41027999999994, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "2", "bbox": {"l": 323.71509, "t": 97.78887999999995, "r": 327.1178, "b": 103.52948000000004, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "3", "bbox": {"l": 323.71509, "t": 105.98969, "r": 327.1178, "b": 111.73029000000008, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "2", "bbox": {"l": 401.4816, "t": 148.54625999999996, "r": 404.88431, "b": 154.28687000000002, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "3", "bbox": {"l": 337.6976, "t": 162.68451000000005, "r": 341.10031, "b": 168.42511000000002, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "3", "bbox": {"l": 454.46378, "t": 104.54584, "r": 457.86648999999994, "b": 110.28644000000008, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "2", "bbox": {"l": 493.32580999999993, "t": 91.09546, "r": 496.72852, "b": 96.83605999999997, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "1", "bbox": {"l": 454.08298, "t": 90.56879000000015, "r": 457.48569000000003, "b": 96.30939000000001, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Figure 3:", "bbox": {"l": 50.112, "t": 204.10535000000004, "r": 86.883949, "b": 213.01189999999997, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "TableFormer", "bbox": {"l": 94.020996, "t": 203.98577999999998, "r": 149.85141, "b": 212.94214, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "takes in an image of the PDF and creates bounding box and HTML structure predictions that are", "bbox": {"l": 152.86099, "t": 204.10535000000004, "r": 545.10846, "b": 213.01189999999997, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "synchronized. The bounding boxes grabs the content from the PDF and inserts it in the structure.", "bbox": {"l": 50.111992, "t": 216.06035999999995, "r": 436.0134, "b": 224.96691999999996, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "Input Image", "bbox": {"l": 74.253464, "t": 258.21472000000006, "r": 101.75846, "b": 264.17474000000004, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "Tokenised Tags", "bbox": {"l": 122.29972, "t": 258.34520999999995, "r": 157.83972, "b": 264.30524, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "Multi-Head Attention", "bbox": {"l": 78.549347, "t": 371.38579999999996, "r": 125.68359000000001, "b": 377.04782, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "Add", "bbox": {"l": 78.513298, "t": 391.31857, "r": 84.644547, "b": 396.98059, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "& Normalisation", "bbox": {"l": 116.52705, "t": 391.31857, "r": 125.11079999999998, "b": 396.98059, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "Feed Forward Network", "bbox": {"l": 76.024773, "t": 424.45309, "r": 127.92327000000002, "b": 430.11511, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "Add", "bbox": {"l": 78.382828, "t": 444.88956, "r": 84.514076, "b": 450.55157, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "& Normalisation", "bbox": {"l": 116.39658, "t": 444.88956, "r": 124.98033, "b": 450.55157, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Linear", "bbox": {"l": 167.46945, "t": 462.44324, "r": 181.6292, "b": 468.10526, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "Softmax", "bbox": {"l": 165.61292, "t": 478.47107, "r": 184.43242, "b": 484.13309, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "CNN BACKBONE ENCODER", "bbox": {"l": 65.319511, "t": 324.26235999999994, "r": 132.9245, "b": 330.22235000000006, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "[30, 1, 2, 3, 4, \u2026 3, ", "bbox": {"l": 119.51457, "t": 269.66394, "r": 162.98782, "b": 274.72992, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "4, 5, 8, 31]", "bbox": {"l": 128.72858, "t": 274.91394, "r": 151.41083, "b": 279.97992, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "Positional ", "bbox": {"l": 60.434211999999995, "t": 338.95993, "r": 80.27021, "b": 344.26993, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "Encoding", "bbox": {"l": 60.598457, "t": 343.38605, "r": 78.854958, "b": 348.69604, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "Positional ", "bbox": {"l": 134.82877, "t": 293.37762, "r": 154.66476, "b": 298.68762, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "Encoding", "bbox": {"l": 134.99303, "t": 297.80370999999997, "r": 153.24953, "b": 303.11371, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "Add & Normalisation", "bbox": {"l": 150.55193, "t": 345.35861, "r": 197.14943, "b": 351.02063, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Add", "bbox": {"l": 150.55193, "t": 394.4234, "r": 156.68318, "b": 400.08542, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "& Normalisation", "bbox": {"l": 188.56567, "t": 394.4234, "r": 197.14943, "b": 400.08542, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "Multi-Head Attention", "bbox": {"l": 150.18539, "t": 375.66843, "r": 197.31964, "b": 381.33044, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "Add", "bbox": {"l": 150.55193, "t": 440.24847000000005, "r": 156.68318, "b": 445.91049, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "& Normalisation", "bbox": {"l": 188.56567, "t": 440.24847000000005, "r": 197.14943, "b": 445.91049, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Feed Forward Network", "bbox": {"l": 147.86377, "t": 422.09335, "r": 199.76227, "b": 427.75537, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Linear", "bbox": {"l": 241.56567000000004, "t": 314.26285000000007, "r": 255.72542, "b": 319.92487, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "Linear", "bbox": {"l": 241.91730000000004, "t": 361.36493, "r": 256.07706, "b": 367.02695, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "Attention", "bbox": {"l": 228.054, "t": 336.61929000000003, "r": 248.72363000000004, "b": 342.28131, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "Network", "bbox": {"l": 246.2919, "t": 336.61929000000003, "r": 269.39325, "b": 342.28131, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "MLP", "bbox": {"l": 228.44568000000004, "t": 405.14682, "r": 238.73892, "b": 410.80884, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Linear ", "bbox": {"l": 256.29767, "t": 405.2032500000001, "r": 271.77792, "b": 410.86526, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "Sigmoid", "bbox": {"l": 239.54543, "t": 382.21344, "r": 258.08942, "b": 387.87546, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "Transformer Encoder Network", "bbox": {"l": 54.14704100000001, "t": 384.87183, "r": 59.51152, "b": 449.78326, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "x2", "bbox": {"l": 54.235424, "t": 373.81232, "r": 59.30449699999999, "b": 378.45421999999996, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "Encoded Output", "bbox": {"l": 85.295891, "t": 484.53189, "r": 122.16431, "b": 490.36688, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "Encoded Output", "bbox": {"l": 229.66599, "t": 279.54607999999996, "r": 265.3194, "b": 285.45572000000004, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "Predicted Tags", "bbox": {"l": 157.17369, "t": 500.3031, "r": 190.41711, "b": 506.12943, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "Bounding Boxes & ", "bbox": {"l": 227.81598999999997, "t": 438.05542, "r": 270.78442, "b": 443.89206, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "Classification", "bbox": {"l": 233.70262, "t": 444.06183, "r": 263.51105, "b": 449.8904999999999, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "Transformer ", "bbox": {"l": 184.74655, "t": 293.39502, "r": 212.16055, "b": 298.75903, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "Decoder Network", "bbox": {"l": 178.91229, "t": 299.14502, "r": 216.74378999999996, "b": 304.50903, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "x4", "bbox": {"l": 194.24574, "t": 282.7822, "r": 198.89099, "b": 287.84817999999996, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "CELL BBOX DECODER", "bbox": {"l": 221.45587, "t": 271.86914, "r": 276.47089, "b": 277.82916, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "Masked Multi-Head ", "bbox": {"l": 151.65219, "t": 323.44241, "r": 197.29019, "b": 329.10443, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "Attention", "bbox": {"l": 163.43277, "t": 329.44241, "r": 184.19028, "b": 335.10443, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "Figure 4: Given an input image of a table, the", "bbox": {"l": 50.112, "t": 527.90237, "r": 229.78752, "b": 536.80893, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "Encoder", "bbox": {"l": 231.787, "t": 527.7828099999999, "r": 267.76196, "b": 536.7392, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "pro-", "bbox": {"l": 269.76401, "t": 527.90237, "r": 286.36169, "b": 536.80893, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "duces fixed-length features that represent the input image.", "bbox": {"l": 50.112015, "t": 539.85738, "r": 286.36508, "b": 548.76393, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "The features are then passed to both the", "bbox": {"l": 50.112015, "t": 551.81337, "r": 205.84735, "b": 560.71992, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "Structure Decoder", "bbox": {"l": 208.01802, "t": 551.69382, "r": 286.36392, "b": 560.6501900000001, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "and", "bbox": {"l": 50.112015, "t": 563.76837, "r": 64.498009, "b": 572.67493, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "Cell BBox Decoder", "bbox": {"l": 68.165016, "t": 563.64882, "r": 151.31288, "b": 572.60519, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": ".", "bbox": {"l": 151.31302, "t": 563.76837, "r": 153.80367, "b": 572.67493, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "During training, the", "bbox": {"l": 160.41884, "t": 563.76837, "r": 241.93283000000002, "b": 572.67493, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "Structure", "bbox": {"l": 245.59502, "t": 563.64882, "r": 286.362, "b": 572.60519, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "Decoder", "bbox": {"l": 50.112015, "t": 575.60382, "r": 85.519089, "b": 584.5602, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "receives \u2018tokenized tags\u2019 of the HTML code that", "bbox": {"l": 88.623016, "t": 575.7233699999999, "r": 286.36072, "b": 584.6299300000001, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "represent the table structure. Afterwards, a transformer en-", "bbox": {"l": 50.112015, "t": 587.6783800000001, "r": 286.36511, "b": 596.58493, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "coder and decoder architecture is employed to produce fea-", "bbox": {"l": 50.112015, "t": 599.63338, "r": 286.36508, "b": 608.53993, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "tures that are received by a linear layer, and the", "bbox": {"l": 50.112015, "t": 611.58838, "r": 240.43756000000002, "b": 620.4949300000001, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "Cell BBox", "bbox": {"l": 243.19801, "t": 611.46883, "r": 286.36597, "b": 620.4252, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "Decoder. The linear layer is applied to the features to", "bbox": {"l": 50.112015, "t": 623.42482, "r": 286.36511, "b": 632.3812, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "predict the tags. Simultaneously, the Cell BBox Decoder", "bbox": {"l": 50.112015, "t": 635.37982, "r": 286.36508, "b": 644.3362, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "selects features referring to the data cells (\u2018", "bbox": {"l": 50.112015, "t": 647.45438, "r": 220.58205, "b": 656.36093, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "<", "bbox": {"l": 220.57802000000004, "t": 647.29497, "r": 228.32693, "b": 656.14175, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "td", "bbox": {"l": 228.32700999999997, "t": 647.45438, "r": 236.07791000000003, "b": 656.36093, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": ">", "bbox": {"l": 236.07802000000004, "t": 647.29497, "r": 243.82693, "b": 656.14175, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "\u2019, \u2018", "bbox": {"l": 243.82602, "t": 647.45438, "r": 255.29298000000003, "b": 656.36093, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "<", "bbox": {"l": 255.29102000000003, "t": 647.29497, "r": 263.03992, "b": 656.14175, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "\u2019) and", "bbox": {"l": 263.04001, "t": 647.45438, "r": 286.36246, "b": 656.36093, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "passes them through an attention network, an MLP, and a", "bbox": {"l": 50.112015, "t": 659.40938, "r": 286.36511, "b": 668.31594, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "linear layer to predict the bounding boxes.", "bbox": {"l": 50.112015, "t": 671.36438, "r": 218.46996, "b": 680.27094, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "forming classification, and adding an adaptive pooling", "bbox": {"l": 308.862, "t": 249.53441999999995, "r": 523.05786, "b": 258.44097999999997, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "layer", "bbox": {"l": 525.19983, "t": 249.53441999999995, "r": 545.11505, "b": 258.44097999999997, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "of size 28*28. ResNet by default downsamples the", "bbox": {"l": 308.862, "t": 261.49042, "r": 517.55847, "b": 270.39697, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "image", "bbox": {"l": 520.76642, "t": 261.49042, "r": 545.11499, "b": 270.39697, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "resolution by 32 and then the encoded image is provided", "bbox": {"l": 308.862, "t": 273.44537, "r": 534.80377, "b": 282.35196, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "to", "bbox": {"l": 537.36414, "t": 273.44537, "r": 545.11505, "b": 282.35196, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "both the", "bbox": {"l": 308.862, "t": 285.40039, "r": 341.24045, "b": 294.3069499999999, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "Structure Decoder", "bbox": {"l": 343.73099, "t": 285.49005, "r": 417.23508, "b": 294.07782000000003, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": ", and", "bbox": {"l": 417.23398, "t": 285.40039, "r": 436.60129, "b": 294.3069499999999, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "Cell BBox Decoder", "bbox": {"l": 439.09198, "t": 285.49005, "r": 516.56116, "b": 294.07782000000003, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": ".", "bbox": {"l": 516.56097, "t": 285.40039, "r": 519.05164, "b": 294.3069499999999, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "Structure Decoder.", "bbox": {"l": 320.81696, "t": 297.33981, "r": 400.86649, "b": 306.2962, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "The transformer architecture of", "bbox": {"l": 403.91394, "t": 297.45938, "r": 528.33685, "b": 306.36594, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "this", "bbox": {"l": 530.7179, "t": 297.45938, "r": 545.11383, "b": 306.36594, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "component is based on the work proposed in [31].", "bbox": {"l": 308.86194, "t": 309.41437, "r": 517.5285, "b": 318.32092, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "After", "bbox": {"l": 524.09387, "t": 309.41437, "r": 545.11493, "b": 318.32092, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "extensive experimentation, the", "bbox": {"l": 308.86194, "t": 321.36934999999994, "r": 432.35833999999994, "b": 330.27591, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "Structure Decoder", "bbox": {"l": 435.81995000000006, "t": 321.45901, "r": 510.29041, "b": 330.04678, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "is", "bbox": {"l": 513.97797, "t": 321.36934999999994, "r": 520.62305, "b": 330.27591, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "mod-", "bbox": {"l": 524.08008, "t": 321.36934999999994, "r": 545.11115, "b": 330.27591, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "eled as a transformer encoder with two encoder layers", "bbox": {"l": 308.86197, "t": 333.32434, "r": 527.76013, "b": 342.2309, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "and", "bbox": {"l": 530.729, "t": 333.32434, "r": 545.11499, "b": 342.2309, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "a transformer decoder made from a stack of 4 decoder", "bbox": {"l": 308.86197, "t": 345.27933, "r": 526.85352, "b": 354.18588, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "lay-", "bbox": {"l": 529.62311, "t": 345.27933, "r": 545.11493, "b": 354.18588, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "ers that comprise mainly of multi-head attention and", "bbox": {"l": 308.86197, "t": 357.23532, "r": 524.51245, "b": 366.14188, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "feed", "bbox": {"l": 527.96948, "t": 357.23532, "r": 545.11511, "b": 366.14188, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "forward layers.", "bbox": {"l": 308.86197, "t": 369.19031000000007, "r": 370.39096, "b": 378.09685999999994, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "This configuration uses fewer layers", "bbox": {"l": 377.44449, "t": 369.19031000000007, "r": 526.91339, "b": 378.09685999999994, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "and", "bbox": {"l": 530.72906, "t": 369.19031000000007, "r": 545.11505, "b": 378.09685999999994, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "heads in comparison to networks applied to other", "bbox": {"l": 308.86197, "t": 381.14529000000005, "r": 505.46395999999993, "b": 390.05185, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "problems", "bbox": {"l": 508.03430000000003, "t": 381.14529000000005, "r": 545.11511, "b": 390.05185, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "(e.g. \u201cScene Understanding\u201d, \u201cImage Captioning\u201d),", "bbox": {"l": 308.86197, "t": 393.10028, "r": 517.68799, "b": 402.00684, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "some-", "bbox": {"l": 520.76642, "t": 393.10028, "r": 545.11499, "b": 402.00684, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "thing which we relate to the simplicity of table images.", "bbox": {"l": 308.86197, "t": 405.05526999999995, "r": 528.01935, "b": 413.96182, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "The transformer encoder receives an encoded", "bbox": {"l": 320.81696, "t": 417.11426, "r": 515.49609, "b": 426.02081, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "image", "bbox": {"l": 520.7663, "t": 417.11426, "r": 545.11487, "b": 426.02081, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "from the", "bbox": {"l": 308.86197, "t": 429.0692399999999, "r": 343.72107, "b": 437.9758, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "CNN Backbone Network", "bbox": {"l": 347.03796, "t": 429.15891, "r": 446.45471000000003, "b": 437.74667, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "and refines it", "bbox": {"l": 449.93996999999996, "t": 429.0692399999999, "r": 503.06055000000003, "b": 437.9758, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "through", "bbox": {"l": 506.37808, "t": 429.0692399999999, "r": 537.3717, "b": 437.9758, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "a", "bbox": {"l": 540.68927, "t": 429.0692399999999, "r": 545.11267, "b": 437.9758, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "multi-head dot-product attention layer, followed by a", "bbox": {"l": 308.86197, "t": 441.02423, "r": 522.78894, "b": 449.93079, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "Feed", "bbox": {"l": 525.7478, "t": 441.02423, "r": 545.11511, "b": 449.93079, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "Forward Network.", "bbox": {"l": 308.86197, "t": 452.97922, "r": 384.14929, "b": 461.88577, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "During training, the transformer", "bbox": {"l": 393.37466, "t": 452.97922, "r": 527.84985, "b": 461.88577, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "de-", "bbox": {"l": 532.39282, "t": 452.97922, "r": 545.11505, "b": 461.88577, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "coder receives as input the output feature produced by", "bbox": {"l": 308.86197, "t": 464.93521, "r": 529.7627, "b": 473.84177, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "the", "bbox": {"l": 532.94073, "t": 464.93521, "r": 545.11505, "b": 473.84177, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "transformer encoder, and the tokenized input of the", "bbox": {"l": 308.86197, "t": 476.8902, "r": 514.17126, "b": 485.79675, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "HTML", "bbox": {"l": 516.89105, "t": 476.8902, "r": 545.11511, "b": 485.79675, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": "ground-truth tags. Using a stack of multi-head attention", "bbox": {"l": 308.86197, "t": 488.84518, "r": 527.63068, "b": 497.75174, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "lay-", "bbox": {"l": 529.62317, "t": 488.84518, "r": 545.11499, "b": 497.75174, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "ers, different aspects of the tag sequence could be", "bbox": {"l": 308.86197, "t": 500.80017, "r": 508.3630999999999, "b": 509.70673, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": "inferred.", "bbox": {"l": 511.09286000000003, "t": 500.80017, "r": 545.11511, "b": 509.70673, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "This is achieved by each attention head on a layer operating", "bbox": {"l": 308.86197, "t": 512.7551599999999, "r": 545.11499, "b": 521.6617100000001, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "in a different subspace, and then combining altogether their", "bbox": {"l": 308.86197, "t": 524.71115, "r": 545.11511, "b": 533.61771, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "attention score.", "bbox": {"l": 308.86197, "t": 536.66615, "r": 369.73349, "b": 545.57271, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": "Cell BBox Decoder.", "bbox": {"l": 320.81696, "t": 548.6046, "r": 404.76184, "b": 557.56097, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "Our architecture allows to simul-", "bbox": {"l": 410.34094, "t": 548.72415, "r": 545.11505, "b": 557.63071, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "taneously predict HTML tags and bounding boxes for each", "bbox": {"l": 308.86194, "t": 560.68015, "r": 545.11493, "b": 569.5867000000001, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "table cell without the need of a separate object detector end", "bbox": {"l": 308.86194, "t": 572.6351500000001, "r": 545.11511, "b": 581.5417, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "to end. This approach is inspired by DETR [1] which em-", "bbox": {"l": 308.86194, "t": 584.59015, "r": 545.11493, "b": 593.4967, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "ploys a Transformer Encoder, and Decoder that looks for", "bbox": {"l": 308.86194, "t": 596.54515, "r": 545.11499, "b": 605.45171, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "a specific number of object queries (potential object detec-", "bbox": {"l": 308.86194, "t": 608.50015, "r": 545.11505, "b": 617.40671, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "tions). As our model utilizes a transformer architecture, the", "bbox": {"l": 308.86194, "t": 620.45515, "r": 545.11505, "b": 629.36171, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "hidden state of the", "bbox": {"l": 308.86194, "t": 632.41115, "r": 381.67859, "b": 641.3177000000001, "coord_origin": "TOPLEFT"}}, {"id": 201, "text": "<", "bbox": {"l": 383.99695, "t": 632.25174, "r": 391.74585, "b": 641.09853, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": "td", "bbox": {"l": 391.74594, "t": 632.41115, "r": 399.49686, "b": 641.3177000000001, "coord_origin": "TOPLEFT"}}, {"id": 203, "text": ">", "bbox": {"l": 399.49695, "t": 632.25174, "r": 407.24585, "b": 641.09853, "coord_origin": "TOPLEFT"}}, {"id": 204, "text": "\u2019 and \u2018", "bbox": {"l": 407.24594, "t": 632.41115, "r": 432.90958, "b": 641.3177000000001, "coord_origin": "TOPLEFT"}}, {"id": 205, "text": "<", "bbox": {"l": 432.90792999999996, "t": 632.25174, "r": 440.65683000000007, "b": 641.09853, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": "\u2019 HTML structure tags be-", "bbox": {"l": 440.65691999999996, "t": 632.41115, "r": 545.11475, "b": 641.3177000000001, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": "come the object query.", "bbox": {"l": 308.86194, "t": 644.3661500000001, "r": 398.96371, "b": 653.27271, "coord_origin": "TOPLEFT"}}, {"id": 208, "text": "The encoding generated by the", "bbox": {"l": 320.81693, "t": 656.42516, "r": 444.34316999999993, "b": 665.33172, "coord_origin": "TOPLEFT"}}, {"id": 209, "text": "CNN Backbone Network", "bbox": {"l": 447.00591999999995, "t": 656.51482, "r": 545.1076, "b": 665.10258, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": "along with the features acquired for every data cell from the", "bbox": {"l": 308.86194, "t": 668.38016, "r": 545.11505, "b": 677.2867200000001, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "Transformer Decoder are then passed to the attention net-", "bbox": {"l": 308.86194, "t": 680.33516, "r": 545.11505, "b": 689.24172, "coord_origin": "TOPLEFT"}}, {"id": 212, "text": "work. The attention network takes both inputs and learns to", "bbox": {"l": 308.86194, "t": 692.290161, "r": 545.11505, "b": 701.196724, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "provide an attention weighted encoding. This weighted at-", "bbox": {"l": 308.86194, "t": 704.245163, "r": 545.11505, "b": 713.151726, "coord_origin": "TOPLEFT"}}, {"id": 214, "text": "5", "bbox": {"l": 295.12094, "t": 734.13316, "r": 300.10223, "b": 743.039722, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 7, "label": "picture", "bbox": {"l": 74.30525970458984, "t": 77.91120147705078, "r": 519.9801025390625, "b": 183.70150756835938, "coord_origin": "TOPLEFT"}, "confidence": 0.9296807646751404, "cells": [{"id": 0, "text": "1.", "bbox": {"l": 81.688072, "t": 122.43970000000002, "r": 84.927567, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Item", "bbox": {"l": 86.54731, "t": 122.43970000000002, "r": 93.026291, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Amount", "bbox": {"l": 102.50498, "t": 115.25214000000005, "r": 115.3461, "b": 118.44135000000006, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Names", "bbox": {"l": 82.140205, "t": 115.21489999999994, "r": 93.291527, "b": 118.40410999999995, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "1000", "bbox": {"l": 96.748268, "t": 122.43970000000002, "r": 104.3119, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "500", "bbox": {"l": 96.748268, "t": 127.74370999999985, "r": 102.42083, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "3500", "bbox": {"l": 96.748268, "t": 133.45569, "r": 104.3119, "b": 136.6449, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "150", "bbox": {"l": 96.748268, "t": 139.16772000000003, "r": 102.42083, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "unit", "bbox": {"l": 110.66107, "t": 122.43970000000002, "r": 116.14391, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "unit", "bbox": {"l": 110.66107, "t": 127.74370999999985, "r": 116.14391, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "unit", "bbox": {"l": 110.66107, "t": 133.45569, "r": 116.14391, "b": 136.6449, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "unit", "bbox": {"l": 110.66107, "t": 139.16772000000003, "r": 116.14391, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "2.", "bbox": {"l": 81.688072, "t": 127.74370999999985, "r": 84.927567, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Item", "bbox": {"l": 86.54731, "t": 127.74370999999985, "r": 93.026291, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "3.", "bbox": {"l": 81.688072, "t": 133.45569, "r": 84.927567, "b": 136.6449, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Item", "bbox": {"l": 86.54731, "t": 133.45569, "r": 93.026291, "b": 136.6449, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "4.", "bbox": {"l": 81.688072, "t": 139.16772000000003, "r": 84.927567, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "Item", "bbox": {"l": 86.54731, "t": 139.16772000000003, "r": 93.026291, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Extracted", "bbox": {"l": 88.084389, "t": 90.49738000000002, "r": 113.93649, "b": 96.23798, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Table Images", "bbox": {"l": 82.81002, "t": 97.63738999999998, "r": 119.21240000000002, "b": 103.37798999999995, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Standardized", "bbox": {"l": 143.94247, "t": 100.60235999999998, "r": 180.01131, "b": 106.34295999999995, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Images", "bbox": {"l": 151.94064, "t": 107.74237000000005, "r": 172.0118, "b": 113.48297000000014, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "BBox", "bbox": {"l": 251.76939000000002, "t": 80.93096999999989, "r": 266.39557, "b": 86.67156999999997, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Decoder", "bbox": {"l": 247.51601, "t": 86.03101000000004, "r": 270.65021, "b": 91.77161000000001, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "BBoxes", "bbox": {"l": 331.03699, "t": 78.55980999999997, "r": 352.12589, "b": 84.30042000000003, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "BBoxes can be", "bbox": {"l": 390.56421, "t": 96.03223000000003, "r": 431.7261, "b": 101.77282999999989, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "traced back to the", "bbox": {"l": 386.82422, "t": 102.15228000000013, "r": 435.46966999999995, "b": 107.89287999999999, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "original image to", "bbox": {"l": 388.69589, "t": 108.27228000000002, "r": 433.6032400000001, "b": 114.01288000000011, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "extract content", "bbox": {"l": 391.07761, "t": 114.39227000000005, "r": 431.22542999999996, "b": 120.13286999999991, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Structure Tags sequence", "bbox": {"l": 431.22650000000004, "t": 151.68511999999998, "r": 498.82068, "b": 157.42571999999996, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "provide full description of", "bbox": {"l": 431.1738, "t": 157.80517999999995, "r": 498.87753000000004, "b": 163.54578000000004, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "the table structure", "bbox": {"l": 440.5289, "t": 163.92516999999998, "r": 489.51827999999995, "b": 169.66576999999995, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Structure Tags", "bbox": {"l": 328.37479, "t": 178.25385000000006, "r": 367.72333, "b": 183.99445000000003, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "BBoxes in sync", "bbox": {"l": 331.84451, "t": 123.90886999999998, "r": 373.67963, "b": 129.64948000000015, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "with tag sequence", "bbox": {"l": 331.84451, "t": 129.00885000000017, "r": 381.17786, "b": 134.74945000000002, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "Encoder", "bbox": {"l": 196.62633, "t": 88.11621000000002, "r": 219.42332, "b": 93.85681, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Structure", "bbox": {"l": 246.66771, "t": 129.4946900000001, "r": 271.49899, "b": 135.23528999999996, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "Decoder", "bbox": {"l": 247.51601, "t": 134.59473000000003, "r": 270.65021, "b": 140.33533, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "[x1, y2, x2, y2]", "bbox": {"l": 330.63071, "t": 89.01923, "r": 365.55347, "b": 94.75982999999997, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "[x1', y2', x2', y2']", "bbox": {"l": 330.63071, "t": 97.17926, "r": 370.22717, "b": 102.91985999999997, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "[x1'', y2'', x2'', y2'']", "bbox": {"l": 330.63071, "t": 105.33922999999993, "r": 374.51157, "b": 111.07983000000002, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "...", "bbox": {"l": 330.63071, "t": 113.49926999999991, "r": 335.73233, "b": 119.23987, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "<TR>", "bbox": {"l": 322.30579, "t": 141.79236000000003, "r": 335.05988, "b": 146.57617000000005, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "<TD>", "bbox": {"l": 322.30579, "t": 148.93231000000003, "r": 335.05988, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "1", "bbox": {"l": 337.54971, "t": 148.55579, "r": 340.95242, "b": 154.29638999999997, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "</TD><TD colspan=\"2\">", "bbox": {"l": 343.56262, "t": 148.93231000000003, "r": 398.91446, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "</TD>", "bbox": {"l": 407.41718, "t": 148.93231000000003, "r": 421.58801, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "</TR><TR>", "bbox": {"l": 322.30579, "t": 156.07232999999997, "r": 349.23022, "b": 160.85613999999998, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "<TD>", "bbox": {"l": 322.30579, "t": 163.21234000000004, "r": 335.05988, "b": 167.99614999999994, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "</TD><TD>...", "bbox": {"l": 343.56155, "t": 163.21234000000004, "r": 374.73685, "b": 167.99614999999994, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "...", "bbox": {"l": 322.30579, "t": 170.35235999999998, "r": 326.55716, "b": 175.13617, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "1", "bbox": {"l": 323.51111, "t": 89.66967999999997, "r": 326.91382, "b": 95.41027999999994, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "2", "bbox": {"l": 323.71509, "t": 97.78887999999995, "r": 327.1178, "b": 103.52948000000004, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "3", "bbox": {"l": 323.71509, "t": 105.98969, "r": 327.1178, "b": 111.73029000000008, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "2", "bbox": {"l": 401.4816, "t": 148.54625999999996, "r": 404.88431, "b": 154.28687000000002, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "3", "bbox": {"l": 337.6976, "t": 162.68451000000005, "r": 341.10031, "b": 168.42511000000002, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "3", "bbox": {"l": 454.46378, "t": 104.54584, "r": 457.86648999999994, "b": 110.28644000000008, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "2", "bbox": {"l": 493.32580999999993, "t": 91.09546, "r": 496.72852, "b": 96.83605999999997, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "1", "bbox": {"l": 454.08298, "t": 90.56879000000015, "r": 457.48569000000003, "b": 96.30939000000001, "coord_origin": "TOPLEFT"}}], "children": [{"id": 10, "label": "text", "bbox": {"l": 81.688072, "t": 122.43970000000002, "r": 84.927567, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 0, "text": "1.", "bbox": {"l": 81.688072, "t": 122.43970000000002, "r": 84.927567, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 86.54731, "t": 122.43970000000002, "r": 93.026291, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 1, "text": "Item", "bbox": {"l": 86.54731, "t": 122.43970000000002, "r": 93.026291, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 102.50498, "t": 115.25214000000005, "r": 115.3461, "b": 118.44135000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 2, "text": "Amount", "bbox": {"l": 102.50498, "t": 115.25214000000005, "r": 115.3461, "b": 118.44135000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 82.140205, "t": 115.21489999999994, "r": 93.291527, "b": 118.40410999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 3, "text": "Names", "bbox": {"l": 82.140205, "t": 115.21489999999994, "r": 93.291527, "b": 118.40410999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 96.748268, "t": 122.43970000000002, "r": 104.3119, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 4, "text": "1000", "bbox": {"l": 96.748268, "t": 122.43970000000002, "r": 104.3119, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 96.748268, "t": 127.74370999999985, "r": 102.42083, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 5, "text": "500", "bbox": {"l": 96.748268, "t": 127.74370999999985, "r": 102.42083, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 96.748268, "t": 133.45569, "r": 104.3119, "b": 136.6449, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": "3500", "bbox": {"l": 96.748268, "t": 133.45569, "r": 104.3119, "b": 136.6449, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 96.748268, "t": 139.16772000000003, "r": 102.42083, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "150", "bbox": {"l": 96.748268, "t": 139.16772000000003, "r": 102.42083, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 110.66107, "t": 122.43970000000002, "r": 116.14391, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "unit", "bbox": {"l": 110.66107, "t": 122.43970000000002, "r": 116.14391, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 110.66107, "t": 127.74370999999985, "r": 116.14391, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "unit", "bbox": {"l": 110.66107, "t": 127.74370999999985, "r": 116.14391, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 110.66107, "t": 133.45569, "r": 116.14391, "b": 136.6449, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "unit", "bbox": {"l": 110.66107, "t": 133.45569, "r": 116.14391, "b": 136.6449, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 110.66107, "t": 139.16772000000003, "r": 116.14391, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "unit", "bbox": {"l": 110.66107, "t": 139.16772000000003, "r": 116.14391, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 81.688072, "t": 127.74370999999985, "r": 84.927567, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "2.", "bbox": {"l": 81.688072, "t": 127.74370999999985, "r": 84.927567, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 86.54731, "t": 127.74370999999985, "r": 93.026291, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "Item", "bbox": {"l": 86.54731, "t": 127.74370999999985, "r": 93.026291, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 81.688072, "t": 133.45569, "r": 84.927567, "b": 136.6449, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "3.", "bbox": {"l": 81.688072, "t": 133.45569, "r": 84.927567, "b": 136.6449, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 86.54731, "t": 133.45569, "r": 93.026291, "b": 136.6449, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "Item", "bbox": {"l": 86.54731, "t": 133.45569, "r": 93.026291, "b": 136.6449, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 81.688072, "t": 139.16772000000003, "r": 84.927567, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "4.", "bbox": {"l": 81.688072, "t": 139.16772000000003, "r": 84.927567, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 86.54731, "t": 139.16772000000003, "r": 93.026291, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "Item", "bbox": {"l": 86.54731, "t": 139.16772000000003, "r": 93.026291, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 88.084389, "t": 90.49738000000002, "r": 113.93649, "b": 96.23798, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "Extracted", "bbox": {"l": 88.084389, "t": 90.49738000000002, "r": 113.93649, "b": 96.23798, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 82.81002, "t": 97.63738999999998, "r": 119.21240000000002, "b": 103.37798999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "Table Images", "bbox": {"l": 82.81002, "t": 97.63738999999998, "r": 119.21240000000002, "b": 103.37798999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 143.94247, "t": 100.60235999999998, "r": 180.01131, "b": 106.34295999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "Standardized", "bbox": {"l": 143.94247, "t": 100.60235999999998, "r": 180.01131, "b": 106.34295999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 151.94064, "t": 107.74237000000005, "r": 172.0118, "b": 113.48297000000014, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "Images", "bbox": {"l": 151.94064, "t": 107.74237000000005, "r": 172.0118, "b": 113.48297000000014, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 251.76939000000002, "t": 80.93096999999989, "r": 266.39557, "b": 86.67156999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "BBox", "bbox": {"l": 251.76939000000002, "t": 80.93096999999989, "r": 266.39557, "b": 86.67156999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 247.51601, "t": 86.03101000000004, "r": 270.65021, "b": 91.77161000000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "Decoder", "bbox": {"l": 247.51601, "t": 86.03101000000004, "r": 270.65021, "b": 91.77161000000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 331.03699, "t": 78.55980999999997, "r": 352.12589, "b": 84.30042000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "BBoxes", "bbox": {"l": 331.03699, "t": 78.55980999999997, "r": 352.12589, "b": 84.30042000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 390.56421, "t": 96.03223000000003, "r": 431.7261, "b": 101.77282999999989, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "BBoxes can be", "bbox": {"l": 390.56421, "t": 96.03223000000003, "r": 431.7261, "b": 101.77282999999989, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 386.82422, "t": 102.15228000000013, "r": 435.46966999999995, "b": 107.89287999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "traced back to the", "bbox": {"l": 386.82422, "t": 102.15228000000013, "r": 435.46966999999995, "b": 107.89287999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 388.69589, "t": 108.27228000000002, "r": 433.6032400000001, "b": 114.01288000000011, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "original image to", "bbox": {"l": 388.69589, "t": 108.27228000000002, "r": 433.6032400000001, "b": 114.01288000000011, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 391.07761, "t": 114.39227000000005, "r": 431.22542999999996, "b": 120.13286999999991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "extract content", "bbox": {"l": 391.07761, "t": 114.39227000000005, "r": 431.22542999999996, "b": 120.13286999999991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 431.22650000000004, "t": 151.68511999999998, "r": 498.82068, "b": 157.42571999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "Structure Tags sequence", "bbox": {"l": 431.22650000000004, "t": 151.68511999999998, "r": 498.82068, "b": 157.42571999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 431.1738, "t": 157.80517999999995, "r": 498.87753000000004, "b": 163.54578000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "provide full description of", "bbox": {"l": 431.1738, "t": 157.80517999999995, "r": 498.87753000000004, "b": 163.54578000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 440.5289, "t": 163.92516999999998, "r": 489.51827999999995, "b": 169.66576999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "the table structure", "bbox": {"l": 440.5289, "t": 163.92516999999998, "r": 489.51827999999995, "b": 169.66576999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 328.37479, "t": 178.25385000000006, "r": 367.72333, "b": 183.99445000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "Structure Tags", "bbox": {"l": 328.37479, "t": 178.25385000000006, "r": 367.72333, "b": 183.99445000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 331.84451, "t": 123.90886999999998, "r": 373.67963, "b": 129.64948000000015, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "BBoxes in sync", "bbox": {"l": 331.84451, "t": 123.90886999999998, "r": 373.67963, "b": 129.64948000000015, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 331.84451, "t": 129.00885000000017, "r": 381.17786, "b": 134.74945000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "with tag sequence", "bbox": {"l": 331.84451, "t": 129.00885000000017, "r": 381.17786, "b": 134.74945000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 196.62633, "t": 88.11621000000002, "r": 219.42332, "b": 93.85681, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "Encoder", "bbox": {"l": 196.62633, "t": 88.11621000000002, "r": 219.42332, "b": 93.85681, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 246.66771, "t": 129.4946900000001, "r": 271.49899, "b": 135.23528999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "Structure", "bbox": {"l": 246.66771, "t": 129.4946900000001, "r": 271.49899, "b": 135.23528999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 247.51601, "t": 134.59473000000003, "r": 270.65021, "b": 140.33533, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "Decoder", "bbox": {"l": 247.51601, "t": 134.59473000000003, "r": 270.65021, "b": 140.33533, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 330.63071, "t": 89.01923, "r": 365.55347, "b": 94.75982999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "[x1, y2, x2, y2]", "bbox": {"l": 330.63071, "t": 89.01923, "r": 365.55347, "b": 94.75982999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 330.63071, "t": 97.17926, "r": 370.22717, "b": 102.91985999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "[x1', y2', x2', y2']", "bbox": {"l": 330.63071, "t": 97.17926, "r": 370.22717, "b": 102.91985999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 330.63071, "t": 105.33922999999993, "r": 374.51157, "b": 111.07983000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "[x1'', y2'', x2'', y2'']", "bbox": {"l": 330.63071, "t": 105.33922999999993, "r": 374.51157, "b": 111.07983000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 330.63071, "t": 113.49926999999991, "r": 335.73233, "b": 119.23987, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "...", "bbox": {"l": 330.63071, "t": 113.49926999999991, "r": 335.73233, "b": 119.23987, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 322.30579, "t": 141.79236000000003, "r": 335.05988, "b": 146.57617000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "<TR>", "bbox": {"l": 322.30579, "t": 141.79236000000003, "r": 335.05988, "b": 146.57617000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 322.30579, "t": 148.93231000000003, "r": 335.05988, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "<TD>", "bbox": {"l": 322.30579, "t": 148.93231000000003, "r": 335.05988, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 337.54971, "t": 148.55579, "r": 340.95242, "b": 154.29638999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "1", "bbox": {"l": 337.54971, "t": 148.55579, "r": 340.95242, "b": 154.29638999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 343.56262, "t": 148.93231000000003, "r": 398.91446, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "</TD><TD colspan=\"2\">", "bbox": {"l": 343.56262, "t": 148.93231000000003, "r": 398.91446, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 407.41718, "t": 148.93231000000003, "r": 421.58801, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "</TD>", "bbox": {"l": 407.41718, "t": 148.93231000000003, "r": 421.58801, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 322.30579, "t": 156.07232999999997, "r": 349.23022, "b": 160.85613999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "</TR><TR>", "bbox": {"l": 322.30579, "t": 156.07232999999997, "r": 349.23022, "b": 160.85613999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 322.30579, "t": 163.21234000000004, "r": 335.05988, "b": 167.99614999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "<TD>", "bbox": {"l": 322.30579, "t": 163.21234000000004, "r": 335.05988, "b": 167.99614999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 343.56155, "t": 163.21234000000004, "r": 374.73685, "b": 167.99614999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "</TD><TD>...", "bbox": {"l": 343.56155, "t": 163.21234000000004, "r": 374.73685, "b": 167.99614999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 322.30579, "t": 170.35235999999998, "r": 326.55716, "b": 175.13617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "...", "bbox": {"l": 322.30579, "t": 170.35235999999998, "r": 326.55716, "b": 175.13617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 323.51111, "t": 89.66967999999997, "r": 326.91382, "b": 95.41027999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "1", "bbox": {"l": 323.51111, "t": 89.66967999999997, "r": 326.91382, "b": 95.41027999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 323.71509, "t": 97.78887999999995, "r": 327.1178, "b": 103.52948000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "2", "bbox": {"l": 323.71509, "t": 97.78887999999995, "r": 327.1178, "b": 103.52948000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 323.71509, "t": 105.98969, "r": 327.1178, "b": 111.73029000000008, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "3", "bbox": {"l": 323.71509, "t": 105.98969, "r": 327.1178, "b": 111.73029000000008, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 401.4816, "t": 148.54625999999996, "r": 404.88431, "b": 154.28687000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "2", "bbox": {"l": 401.4816, "t": 148.54625999999996, "r": 404.88431, "b": 154.28687000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 337.6976, "t": 162.68451000000005, "r": 341.10031, "b": 168.42511000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "3", "bbox": {"l": 337.6976, "t": 162.68451000000005, "r": 341.10031, "b": 168.42511000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 454.46378, "t": 104.54584, "r": 457.86648999999994, "b": 110.28644000000008, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "3", "bbox": {"l": 454.46378, "t": 104.54584, "r": 457.86648999999994, "b": 110.28644000000008, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 493.32580999999993, "t": 91.09546, "r": 496.72852, "b": 96.83605999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "2", "bbox": {"l": 493.32580999999993, "t": 91.09546, "r": 496.72852, "b": 96.83605999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 454.08298, "t": 90.56879000000015, "r": 457.48569000000003, "b": 96.30939000000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "1", "bbox": {"l": 454.08298, "t": 90.56879000000015, "r": 457.48569000000003, "b": 96.30939000000001, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 6, "label": "caption", "bbox": {"l": 50.111992, "t": 203.98577999999998, "r": 545.10846, "b": 224.96691999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9677652716636658, "cells": [{"id": 59, "text": "Figure 3:", "bbox": {"l": 50.112, "t": 204.10535000000004, "r": 86.883949, "b": 213.01189999999997, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "TableFormer", "bbox": {"l": 94.020996, "t": 203.98577999999998, "r": 149.85141, "b": 212.94214, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "takes in an image of the PDF and creates bounding box and HTML structure predictions that are", "bbox": {"l": 152.86099, "t": 204.10535000000004, "r": 545.10846, "b": 213.01189999999997, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "synchronized. The bounding boxes grabs the content from the PDF and inserts it in the structure.", "bbox": {"l": 50.111992, "t": 216.06035999999995, "r": 436.0134, "b": 224.96691999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "picture", "bbox": {"l": 53.03328323364258, "t": 257.66534423828125, "r": 285.3731689453125, "b": 507.6688537597656, "coord_origin": "TOPLEFT"}, "confidence": 0.9724942445755005, "cells": [{"id": 63, "text": "Input Image", "bbox": {"l": 74.253464, "t": 258.21472000000006, "r": 101.75846, "b": 264.17474000000004, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "Tokenised Tags", "bbox": {"l": 122.29972, "t": 258.34520999999995, "r": 157.83972, "b": 264.30524, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "Multi-Head Attention", "bbox": {"l": 78.549347, "t": 371.38579999999996, "r": 125.68359000000001, "b": 377.04782, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "Add", "bbox": {"l": 78.513298, "t": 391.31857, "r": 84.644547, "b": 396.98059, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "& Normalisation", "bbox": {"l": 116.52705, "t": 391.31857, "r": 125.11079999999998, "b": 396.98059, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "Feed Forward Network", "bbox": {"l": 76.024773, "t": 424.45309, "r": 127.92327000000002, "b": 430.11511, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "Add", "bbox": {"l": 78.382828, "t": 444.88956, "r": 84.514076, "b": 450.55157, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "& Normalisation", "bbox": {"l": 116.39658, "t": 444.88956, "r": 124.98033, "b": 450.55157, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Linear", "bbox": {"l": 167.46945, "t": 462.44324, "r": 181.6292, "b": 468.10526, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "Softmax", "bbox": {"l": 165.61292, "t": 478.47107, "r": 184.43242, "b": 484.13309, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "CNN BACKBONE ENCODER", "bbox": {"l": 65.319511, "t": 324.26235999999994, "r": 132.9245, "b": 330.22235000000006, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "[30, 1, 2, 3, 4, \u2026 3, ", "bbox": {"l": 119.51457, "t": 269.66394, "r": 162.98782, "b": 274.72992, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "4, 5, 8, 31]", "bbox": {"l": 128.72858, "t": 274.91394, "r": 151.41083, "b": 279.97992, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "Positional ", "bbox": {"l": 60.434211999999995, "t": 338.95993, "r": 80.27021, "b": 344.26993, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "Encoding", "bbox": {"l": 60.598457, "t": 343.38605, "r": 78.854958, "b": 348.69604, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "Positional ", "bbox": {"l": 134.82877, "t": 293.37762, "r": 154.66476, "b": 298.68762, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "Encoding", "bbox": {"l": 134.99303, "t": 297.80370999999997, "r": 153.24953, "b": 303.11371, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "Add & Normalisation", "bbox": {"l": 150.55193, "t": 345.35861, "r": 197.14943, "b": 351.02063, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Add", "bbox": {"l": 150.55193, "t": 394.4234, "r": 156.68318, "b": 400.08542, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "& Normalisation", "bbox": {"l": 188.56567, "t": 394.4234, "r": 197.14943, "b": 400.08542, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "Multi-Head Attention", "bbox": {"l": 150.18539, "t": 375.66843, "r": 197.31964, "b": 381.33044, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "Add", "bbox": {"l": 150.55193, "t": 440.24847000000005, "r": 156.68318, "b": 445.91049, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "& Normalisation", "bbox": {"l": 188.56567, "t": 440.24847000000005, "r": 197.14943, "b": 445.91049, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Feed Forward Network", "bbox": {"l": 147.86377, "t": 422.09335, "r": 199.76227, "b": 427.75537, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Linear", "bbox": {"l": 241.56567000000004, "t": 314.26285000000007, "r": 255.72542, "b": 319.92487, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "Linear", "bbox": {"l": 241.91730000000004, "t": 361.36493, "r": 256.07706, "b": 367.02695, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "Attention", "bbox": {"l": 228.054, "t": 336.61929000000003, "r": 248.72363000000004, "b": 342.28131, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "Network", "bbox": {"l": 246.2919, "t": 336.61929000000003, "r": 269.39325, "b": 342.28131, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "MLP", "bbox": {"l": 228.44568000000004, "t": 405.14682, "r": 238.73892, "b": 410.80884, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Linear ", "bbox": {"l": 256.29767, "t": 405.2032500000001, "r": 271.77792, "b": 410.86526, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "Sigmoid", "bbox": {"l": 239.54543, "t": 382.21344, "r": 258.08942, "b": 387.87546, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "Transformer Encoder Network", "bbox": {"l": 54.14704100000001, "t": 384.87183, "r": 59.51152, "b": 449.78326, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "x2", "bbox": {"l": 54.235424, "t": 373.81232, "r": 59.30449699999999, "b": 378.45421999999996, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "Encoded Output", "bbox": {"l": 85.295891, "t": 484.53189, "r": 122.16431, "b": 490.36688, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "Encoded Output", "bbox": {"l": 229.66599, "t": 279.54607999999996, "r": 265.3194, "b": 285.45572000000004, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "Predicted Tags", "bbox": {"l": 157.17369, "t": 500.3031, "r": 190.41711, "b": 506.12943, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "Bounding Boxes & ", "bbox": {"l": 227.81598999999997, "t": 438.05542, "r": 270.78442, "b": 443.89206, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "Classification", "bbox": {"l": 233.70262, "t": 444.06183, "r": 263.51105, "b": 449.8904999999999, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "Transformer ", "bbox": {"l": 184.74655, "t": 293.39502, "r": 212.16055, "b": 298.75903, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "Decoder Network", "bbox": {"l": 178.91229, "t": 299.14502, "r": 216.74378999999996, "b": 304.50903, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "x4", "bbox": {"l": 194.24574, "t": 282.7822, "r": 198.89099, "b": 287.84817999999996, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "CELL BBOX DECODER", "bbox": {"l": 221.45587, "t": 271.86914, "r": 276.47089, "b": 277.82916, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "Masked Multi-Head ", "bbox": {"l": 151.65219, "t": 323.44241, "r": 197.29019, "b": 329.10443, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "Attention", "bbox": {"l": 163.43277, "t": 329.44241, "r": 184.19028, "b": 335.10443, "coord_origin": "TOPLEFT"}}], "children": [{"id": 69, "label": "text", "bbox": {"l": 74.253464, "t": 258.21472000000006, "r": 101.75846, "b": 264.17474000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "Input Image", "bbox": {"l": 74.253464, "t": 258.21472000000006, "r": 101.75846, "b": 264.17474000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 122.29972, "t": 258.34520999999995, "r": 157.83972, "b": 264.30524, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "Tokenised Tags", "bbox": {"l": 122.29972, "t": 258.34520999999995, "r": 157.83972, "b": 264.30524, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 78.549347, "t": 371.38579999999996, "r": 125.68359000000001, "b": 377.04782, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "Multi-Head Attention", "bbox": {"l": 78.549347, "t": 371.38579999999996, "r": 125.68359000000001, "b": 377.04782, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 78.513298, "t": 391.31857, "r": 84.644547, "b": 396.98059, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "Add", "bbox": {"l": 78.513298, "t": 391.31857, "r": 84.644547, "b": 396.98059, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 116.52705, "t": 391.31857, "r": 125.11079999999998, "b": 396.98059, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "& Normalisation", "bbox": {"l": 116.52705, "t": 391.31857, "r": 125.11079999999998, "b": 396.98059, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 76.024773, "t": 424.45309, "r": 127.92327000000002, "b": 430.11511, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "Feed Forward Network", "bbox": {"l": 76.024773, "t": 424.45309, "r": 127.92327000000002, "b": 430.11511, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 78.382828, "t": 444.88956, "r": 84.514076, "b": 450.55157, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "Add", "bbox": {"l": 78.382828, "t": 444.88956, "r": 84.514076, "b": 450.55157, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 116.39658, "t": 444.88956, "r": 124.98033, "b": 450.55157, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "& Normalisation", "bbox": {"l": 116.39658, "t": 444.88956, "r": 124.98033, "b": 450.55157, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 167.46945, "t": 462.44324, "r": 181.6292, "b": 468.10526, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "Linear", "bbox": {"l": 167.46945, "t": 462.44324, "r": 181.6292, "b": 468.10526, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 165.61292, "t": 478.47107, "r": 184.43242, "b": 484.13309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "Softmax", "bbox": {"l": 165.61292, "t": 478.47107, "r": 184.43242, "b": 484.13309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 65.319511, "t": 324.26235999999994, "r": 132.9245, "b": 330.22235000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "CNN BACKBONE ENCODER", "bbox": {"l": 65.319511, "t": 324.26235999999994, "r": 132.9245, "b": 330.22235000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 119.51457, "t": 269.66394, "r": 162.98782, "b": 274.72992, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "[30, 1, 2, 3, 4, \u2026 3, ", "bbox": {"l": 119.51457, "t": 269.66394, "r": 162.98782, "b": 274.72992, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 128.72858, "t": 274.91394, "r": 151.41083, "b": 279.97992, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "4, 5, 8, 31]", "bbox": {"l": 128.72858, "t": 274.91394, "r": 151.41083, "b": 279.97992, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 60.434211999999995, "t": 338.95993, "r": 80.27021, "b": 344.26993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "Positional ", "bbox": {"l": 60.434211999999995, "t": 338.95993, "r": 80.27021, "b": 344.26993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 60.598457, "t": 343.38605, "r": 78.854958, "b": 348.69604, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "Encoding", "bbox": {"l": 60.598457, "t": 343.38605, "r": 78.854958, "b": 348.69604, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 134.82877, "t": 293.37762, "r": 154.66476, "b": 298.68762, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "Positional ", "bbox": {"l": 134.82877, "t": 293.37762, "r": 154.66476, "b": 298.68762, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 134.99303, "t": 297.80370999999997, "r": 153.24953, "b": 303.11371, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "Encoding", "bbox": {"l": 134.99303, "t": 297.80370999999997, "r": 153.24953, "b": 303.11371, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 150.55193, "t": 345.35861, "r": 197.14943, "b": 351.02063, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "Add & Normalisation", "bbox": {"l": 150.55193, "t": 345.35861, "r": 197.14943, "b": 351.02063, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 150.55193, "t": 394.4234, "r": 156.68318, "b": 400.08542, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "Add", "bbox": {"l": 150.55193, "t": 394.4234, "r": 156.68318, "b": 400.08542, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 188.56567, "t": 394.4234, "r": 197.14943, "b": 400.08542, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "& Normalisation", "bbox": {"l": 188.56567, "t": 394.4234, "r": 197.14943, "b": 400.08542, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 150.18539, "t": 375.66843, "r": 197.31964, "b": 381.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "Multi-Head Attention", "bbox": {"l": 150.18539, "t": 375.66843, "r": 197.31964, "b": 381.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 150.55193, "t": 440.24847000000005, "r": 156.68318, "b": 445.91049, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "Add", "bbox": {"l": 150.55193, "t": 440.24847000000005, "r": 156.68318, "b": 445.91049, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 188.56567, "t": 440.24847000000005, "r": 197.14943, "b": 445.91049, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "& Normalisation", "bbox": {"l": 188.56567, "t": 440.24847000000005, "r": 197.14943, "b": 445.91049, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 147.86377, "t": 422.09335, "r": 199.76227, "b": 427.75537, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "Feed Forward Network", "bbox": {"l": 147.86377, "t": 422.09335, "r": 199.76227, "b": 427.75537, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 241.56567000000004, "t": 314.26285000000007, "r": 255.72542, "b": 319.92487, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "Linear", "bbox": {"l": 241.56567000000004, "t": 314.26285000000007, "r": 255.72542, "b": 319.92487, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 241.91730000000004, "t": 361.36493, "r": 256.07706, "b": 367.02695, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "Linear", "bbox": {"l": 241.91730000000004, "t": 361.36493, "r": 256.07706, "b": 367.02695, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 228.054, "t": 336.61929000000003, "r": 248.72363000000004, "b": 342.28131, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "Attention", "bbox": {"l": 228.054, "t": 336.61929000000003, "r": 248.72363000000004, "b": 342.28131, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 246.2919, "t": 336.61929000000003, "r": 269.39325, "b": 342.28131, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "Network", "bbox": {"l": 246.2919, "t": 336.61929000000003, "r": 269.39325, "b": 342.28131, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 228.44568000000004, "t": 405.14682, "r": 238.73892, "b": 410.80884, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "MLP", "bbox": {"l": 228.44568000000004, "t": 405.14682, "r": 238.73892, "b": 410.80884, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 256.29767, "t": 405.2032500000001, "r": 271.77792, "b": 410.86526, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "Linear ", "bbox": {"l": 256.29767, "t": 405.2032500000001, "r": 271.77792, "b": 410.86526, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 239.54543, "t": 382.21344, "r": 258.08942, "b": 387.87546, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "Sigmoid", "bbox": {"l": 239.54543, "t": 382.21344, "r": 258.08942, "b": 387.87546, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 54.14704100000001, "t": 384.87183, "r": 59.51152, "b": 449.78326, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "Transformer Encoder Network", "bbox": {"l": 54.14704100000001, "t": 384.87183, "r": 59.51152, "b": 449.78326, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 54.235424, "t": 373.81232, "r": 59.30449699999999, "b": 378.45421999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "x2", "bbox": {"l": 54.235424, "t": 373.81232, "r": 59.30449699999999, "b": 378.45421999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 85.295891, "t": 484.53189, "r": 122.16431, "b": 490.36688, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "Encoded Output", "bbox": {"l": 85.295891, "t": 484.53189, "r": 122.16431, "b": 490.36688, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 229.66599, "t": 279.54607999999996, "r": 265.3194, "b": 285.45572000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "Encoded Output", "bbox": {"l": 229.66599, "t": 279.54607999999996, "r": 265.3194, "b": 285.45572000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 157.17369, "t": 500.3031, "r": 190.41711, "b": 506.12943, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "Predicted Tags", "bbox": {"l": 157.17369, "t": 500.3031, "r": 190.41711, "b": 506.12943, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 227.81598999999997, "t": 438.05542, "r": 270.78442, "b": 443.89206, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "Bounding Boxes & ", "bbox": {"l": 227.81598999999997, "t": 438.05542, "r": 270.78442, "b": 443.89206, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 233.70262, "t": 444.06183, "r": 263.51105, "b": 449.8904999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "Classification", "bbox": {"l": 233.70262, "t": 444.06183, "r": 263.51105, "b": 449.8904999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 184.74655, "t": 293.39502, "r": 212.16055, "b": 298.75903, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "Transformer ", "bbox": {"l": 184.74655, "t": 293.39502, "r": 212.16055, "b": 298.75903, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 178.91229, "t": 299.14502, "r": 216.74378999999996, "b": 304.50903, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "Decoder Network", "bbox": {"l": 178.91229, "t": 299.14502, "r": 216.74378999999996, "b": 304.50903, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 194.24574, "t": 282.7822, "r": 198.89099, "b": 287.84817999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": "x4", "bbox": {"l": 194.24574, "t": 282.7822, "r": 198.89099, "b": 287.84817999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 221.45587, "t": 271.86914, "r": 276.47089, "b": 277.82916, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "CELL BBOX DECODER", "bbox": {"l": 221.45587, "t": 271.86914, "r": 276.47089, "b": 277.82916, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 151.65219, "t": 323.44241, "r": 197.29019, "b": 329.10443, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "Masked Multi-Head ", "bbox": {"l": 151.65219, "t": 323.44241, "r": 197.29019, "b": 329.10443, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 163.43277, "t": 329.44241, "r": 184.19028, "b": 335.10443, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": "Attention", "bbox": {"l": 163.43277, "t": 329.44241, "r": 184.19028, "b": 335.10443, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 8, "label": "caption", "bbox": {"l": 50.112, "t": 527.7828099999999, "r": 286.36597, "b": 680.27094, "coord_origin": "TOPLEFT"}, "confidence": 0.8913407325744629, "cells": [{"id": 107, "text": "Figure 4: Given an input image of a table, the", "bbox": {"l": 50.112, "t": 527.90237, "r": 229.78752, "b": 536.80893, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "Encoder", "bbox": {"l": 231.787, "t": 527.7828099999999, "r": 267.76196, "b": 536.7392, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "pro-", "bbox": {"l": 269.76401, "t": 527.90237, "r": 286.36169, "b": 536.80893, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "duces fixed-length features that represent the input image.", "bbox": {"l": 50.112015, "t": 539.85738, "r": 286.36508, "b": 548.76393, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "The features are then passed to both the", "bbox": {"l": 50.112015, "t": 551.81337, "r": 205.84735, "b": 560.71992, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "Structure Decoder", "bbox": {"l": 208.01802, "t": 551.69382, "r": 286.36392, "b": 560.6501900000001, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "and", "bbox": {"l": 50.112015, "t": 563.76837, "r": 64.498009, "b": 572.67493, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "Cell BBox Decoder", "bbox": {"l": 68.165016, "t": 563.64882, "r": 151.31288, "b": 572.60519, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": ".", "bbox": {"l": 151.31302, "t": 563.76837, "r": 153.80367, "b": 572.67493, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "During training, the", "bbox": {"l": 160.41884, "t": 563.76837, "r": 241.93283000000002, "b": 572.67493, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "Structure", "bbox": {"l": 245.59502, "t": 563.64882, "r": 286.362, "b": 572.60519, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "Decoder", "bbox": {"l": 50.112015, "t": 575.60382, "r": 85.519089, "b": 584.5602, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "receives \u2018tokenized tags\u2019 of the HTML code that", "bbox": {"l": 88.623016, "t": 575.7233699999999, "r": 286.36072, "b": 584.6299300000001, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "represent the table structure. Afterwards, a transformer en-", "bbox": {"l": 50.112015, "t": 587.6783800000001, "r": 286.36511, "b": 596.58493, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "coder and decoder architecture is employed to produce fea-", "bbox": {"l": 50.112015, "t": 599.63338, "r": 286.36508, "b": 608.53993, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "tures that are received by a linear layer, and the", "bbox": {"l": 50.112015, "t": 611.58838, "r": 240.43756000000002, "b": 620.4949300000001, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "Cell BBox", "bbox": {"l": 243.19801, "t": 611.46883, "r": 286.36597, "b": 620.4252, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "Decoder. The linear layer is applied to the features to", "bbox": {"l": 50.112015, "t": 623.42482, "r": 286.36511, "b": 632.3812, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "predict the tags. Simultaneously, the Cell BBox Decoder", "bbox": {"l": 50.112015, "t": 635.37982, "r": 286.36508, "b": 644.3362, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "selects features referring to the data cells (\u2018", "bbox": {"l": 50.112015, "t": 647.45438, "r": 220.58205, "b": 656.36093, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "<", "bbox": {"l": 220.57802000000004, "t": 647.29497, "r": 228.32693, "b": 656.14175, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "td", "bbox": {"l": 228.32700999999997, "t": 647.45438, "r": 236.07791000000003, "b": 656.36093, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": ">", "bbox": {"l": 236.07802000000004, "t": 647.29497, "r": 243.82693, "b": 656.14175, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "\u2019, \u2018", "bbox": {"l": 243.82602, "t": 647.45438, "r": 255.29298000000003, "b": 656.36093, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "<", "bbox": {"l": 255.29102000000003, "t": 647.29497, "r": 263.03992, "b": 656.14175, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "\u2019) and", "bbox": {"l": 263.04001, "t": 647.45438, "r": 286.36246, "b": 656.36093, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "passes them through an attention network, an MLP, and a", "bbox": {"l": 50.112015, "t": 659.40938, "r": 286.36511, "b": 668.31594, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "linear layer to predict the bounding boxes.", "bbox": {"l": 50.112015, "t": 671.36438, "r": 218.46996, "b": 680.27094, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "text", "bbox": {"l": 308.862, "t": 249.53441999999995, "r": 545.11505, "b": 294.3069499999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9831458330154419, "cells": [{"id": 135, "text": "forming classification, and adding an adaptive pooling", "bbox": {"l": 308.862, "t": 249.53441999999995, "r": 523.05786, "b": 258.44097999999997, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "layer", "bbox": {"l": 525.19983, "t": 249.53441999999995, "r": 545.11505, "b": 258.44097999999997, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "of size 28*28. ResNet by default downsamples the", "bbox": {"l": 308.862, "t": 261.49042, "r": 517.55847, "b": 270.39697, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "image", "bbox": {"l": 520.76642, "t": 261.49042, "r": 545.11499, "b": 270.39697, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "resolution by 32 and then the encoded image is provided", "bbox": {"l": 308.862, "t": 273.44537, "r": 534.80377, "b": 282.35196, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "to", "bbox": {"l": 537.36414, "t": 273.44537, "r": 545.11505, "b": 282.35196, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "both the", "bbox": {"l": 308.862, "t": 285.40039, "r": 341.24045, "b": 294.3069499999999, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "Structure Decoder", "bbox": {"l": 343.73099, "t": 285.49005, "r": 417.23508, "b": 294.07782000000003, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": ", and", "bbox": {"l": 417.23398, "t": 285.40039, "r": 436.60129, "b": 294.3069499999999, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "Cell BBox Decoder", "bbox": {"l": 439.09198, "t": 285.49005, "r": 516.56116, "b": 294.07782000000003, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": ".", "bbox": {"l": 516.56097, "t": 285.40039, "r": 519.05164, "b": 294.3069499999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 308.86194, "t": 297.33981, "r": 545.11511, "b": 413.96182, "coord_origin": "TOPLEFT"}, "confidence": 0.9862009882926941, "cells": [{"id": 146, "text": "Structure Decoder.", "bbox": {"l": 320.81696, "t": 297.33981, "r": 400.86649, "b": 306.2962, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "The transformer architecture of", "bbox": {"l": 403.91394, "t": 297.45938, "r": 528.33685, "b": 306.36594, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "this", "bbox": {"l": 530.7179, "t": 297.45938, "r": 545.11383, "b": 306.36594, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "component is based on the work proposed in [31].", "bbox": {"l": 308.86194, "t": 309.41437, "r": 517.5285, "b": 318.32092, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "After", "bbox": {"l": 524.09387, "t": 309.41437, "r": 545.11493, "b": 318.32092, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "extensive experimentation, the", "bbox": {"l": 308.86194, "t": 321.36934999999994, "r": 432.35833999999994, "b": 330.27591, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "Structure Decoder", "bbox": {"l": 435.81995000000006, "t": 321.45901, "r": 510.29041, "b": 330.04678, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "is", "bbox": {"l": 513.97797, "t": 321.36934999999994, "r": 520.62305, "b": 330.27591, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "mod-", "bbox": {"l": 524.08008, "t": 321.36934999999994, "r": 545.11115, "b": 330.27591, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "eled as a transformer encoder with two encoder layers", "bbox": {"l": 308.86197, "t": 333.32434, "r": 527.76013, "b": 342.2309, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "and", "bbox": {"l": 530.729, "t": 333.32434, "r": 545.11499, "b": 342.2309, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "a transformer decoder made from a stack of 4 decoder", "bbox": {"l": 308.86197, "t": 345.27933, "r": 526.85352, "b": 354.18588, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "lay-", "bbox": {"l": 529.62311, "t": 345.27933, "r": 545.11493, "b": 354.18588, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "ers that comprise mainly of multi-head attention and", "bbox": {"l": 308.86197, "t": 357.23532, "r": 524.51245, "b": 366.14188, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "feed", "bbox": {"l": 527.96948, "t": 357.23532, "r": 545.11511, "b": 366.14188, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "forward layers.", "bbox": {"l": 308.86197, "t": 369.19031000000007, "r": 370.39096, "b": 378.09685999999994, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "This configuration uses fewer layers", "bbox": {"l": 377.44449, "t": 369.19031000000007, "r": 526.91339, "b": 378.09685999999994, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "and", "bbox": {"l": 530.72906, "t": 369.19031000000007, "r": 545.11505, "b": 378.09685999999994, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "heads in comparison to networks applied to other", "bbox": {"l": 308.86197, "t": 381.14529000000005, "r": 505.46395999999993, "b": 390.05185, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "problems", "bbox": {"l": 508.03430000000003, "t": 381.14529000000005, "r": 545.11511, "b": 390.05185, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "(e.g. \u201cScene Understanding\u201d, \u201cImage Captioning\u201d),", "bbox": {"l": 308.86197, "t": 393.10028, "r": 517.68799, "b": 402.00684, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "some-", "bbox": {"l": 520.76642, "t": 393.10028, "r": 545.11499, "b": 402.00684, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "thing which we relate to the simplicity of table images.", "bbox": {"l": 308.86197, "t": 405.05526999999995, "r": 528.01935, "b": 413.96182, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 308.86197, "t": 417.11426, "r": 545.11511, "b": 545.57271, "coord_origin": "TOPLEFT"}, "confidence": 0.9851906895637512, "cells": [{"id": 169, "text": "The transformer encoder receives an encoded", "bbox": {"l": 320.81696, "t": 417.11426, "r": 515.49609, "b": 426.02081, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "image", "bbox": {"l": 520.7663, "t": 417.11426, "r": 545.11487, "b": 426.02081, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "from the", "bbox": {"l": 308.86197, "t": 429.0692399999999, "r": 343.72107, "b": 437.9758, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "CNN Backbone Network", "bbox": {"l": 347.03796, "t": 429.15891, "r": 446.45471000000003, "b": 437.74667, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "and refines it", "bbox": {"l": 449.93996999999996, "t": 429.0692399999999, "r": 503.06055000000003, "b": 437.9758, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "through", "bbox": {"l": 506.37808, "t": 429.0692399999999, "r": 537.3717, "b": 437.9758, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "a", "bbox": {"l": 540.68927, "t": 429.0692399999999, "r": 545.11267, "b": 437.9758, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "multi-head dot-product attention layer, followed by a", "bbox": {"l": 308.86197, "t": 441.02423, "r": 522.78894, "b": 449.93079, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "Feed", "bbox": {"l": 525.7478, "t": 441.02423, "r": 545.11511, "b": 449.93079, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "Forward Network.", "bbox": {"l": 308.86197, "t": 452.97922, "r": 384.14929, "b": 461.88577, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "During training, the transformer", "bbox": {"l": 393.37466, "t": 452.97922, "r": 527.84985, "b": 461.88577, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "de-", "bbox": {"l": 532.39282, "t": 452.97922, "r": 545.11505, "b": 461.88577, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "coder receives as input the output feature produced by", "bbox": {"l": 308.86197, "t": 464.93521, "r": 529.7627, "b": 473.84177, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "the", "bbox": {"l": 532.94073, "t": 464.93521, "r": 545.11505, "b": 473.84177, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "transformer encoder, and the tokenized input of the", "bbox": {"l": 308.86197, "t": 476.8902, "r": 514.17126, "b": 485.79675, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "HTML", "bbox": {"l": 516.89105, "t": 476.8902, "r": 545.11511, "b": 485.79675, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": "ground-truth tags. Using a stack of multi-head attention", "bbox": {"l": 308.86197, "t": 488.84518, "r": 527.63068, "b": 497.75174, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "lay-", "bbox": {"l": 529.62317, "t": 488.84518, "r": 545.11499, "b": 497.75174, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "ers, different aspects of the tag sequence could be", "bbox": {"l": 308.86197, "t": 500.80017, "r": 508.3630999999999, "b": 509.70673, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": "inferred.", "bbox": {"l": 511.09286000000003, "t": 500.80017, "r": 545.11511, "b": 509.70673, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "This is achieved by each attention head on a layer operating", "bbox": {"l": 308.86197, "t": 512.7551599999999, "r": 545.11499, "b": 521.6617100000001, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "in a different subspace, and then combining altogether their", "bbox": {"l": 308.86197, "t": 524.71115, "r": 545.11511, "b": 533.61771, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "attention score.", "bbox": {"l": 308.86197, "t": 536.66615, "r": 369.73349, "b": 545.57271, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 308.86194, "t": 548.6046, "r": 545.11511, "b": 653.27271, "coord_origin": "TOPLEFT"}, "confidence": 0.9869195818901062, "cells": [{"id": 192, "text": "Cell BBox Decoder.", "bbox": {"l": 320.81696, "t": 548.6046, "r": 404.76184, "b": 557.56097, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "Our architecture allows to simul-", "bbox": {"l": 410.34094, "t": 548.72415, "r": 545.11505, "b": 557.63071, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "taneously predict HTML tags and bounding boxes for each", "bbox": {"l": 308.86194, "t": 560.68015, "r": 545.11493, "b": 569.5867000000001, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "table cell without the need of a separate object detector end", "bbox": {"l": 308.86194, "t": 572.6351500000001, "r": 545.11511, "b": 581.5417, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "to end. This approach is inspired by DETR [1] which em-", "bbox": {"l": 308.86194, "t": 584.59015, "r": 545.11493, "b": 593.4967, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "ploys a Transformer Encoder, and Decoder that looks for", "bbox": {"l": 308.86194, "t": 596.54515, "r": 545.11499, "b": 605.45171, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "a specific number of object queries (potential object detec-", "bbox": {"l": 308.86194, "t": 608.50015, "r": 545.11505, "b": 617.40671, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "tions). As our model utilizes a transformer architecture, the", "bbox": {"l": 308.86194, "t": 620.45515, "r": 545.11505, "b": 629.36171, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "hidden state of the", "bbox": {"l": 308.86194, "t": 632.41115, "r": 381.67859, "b": 641.3177000000001, "coord_origin": "TOPLEFT"}}, {"id": 201, "text": "<", "bbox": {"l": 383.99695, "t": 632.25174, "r": 391.74585, "b": 641.09853, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": "td", "bbox": {"l": 391.74594, "t": 632.41115, "r": 399.49686, "b": 641.3177000000001, "coord_origin": "TOPLEFT"}}, {"id": 203, "text": ">", "bbox": {"l": 399.49695, "t": 632.25174, "r": 407.24585, "b": 641.09853, "coord_origin": "TOPLEFT"}}, {"id": 204, "text": "\u2019 and \u2018", "bbox": {"l": 407.24594, "t": 632.41115, "r": 432.90958, "b": 641.3177000000001, "coord_origin": "TOPLEFT"}}, {"id": 205, "text": "<", "bbox": {"l": 432.90792999999996, "t": 632.25174, "r": 440.65683000000007, "b": 641.09853, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": "\u2019 HTML structure tags be-", "bbox": {"l": 440.65691999999996, "t": 632.41115, "r": 545.11475, "b": 641.3177000000001, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": "come the object query.", "bbox": {"l": 308.86194, "t": 644.3661500000001, "r": 398.96371, "b": 653.27271, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 308.86194, "t": 656.42516, "r": 545.11505, "b": 713.151726, "coord_origin": "TOPLEFT"}, "confidence": 0.9852352142333984, "cells": [{"id": 208, "text": "The encoding generated by the", "bbox": {"l": 320.81693, "t": 656.42516, "r": 444.34316999999993, "b": 665.33172, "coord_origin": "TOPLEFT"}}, {"id": 209, "text": "CNN Backbone Network", "bbox": {"l": 447.00591999999995, "t": 656.51482, "r": 545.1076, "b": 665.10258, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": "along with the features acquired for every data cell from the", "bbox": {"l": 308.86194, "t": 668.38016, "r": 545.11505, "b": 677.2867200000001, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "Transformer Decoder are then passed to the attention net-", "bbox": {"l": 308.86194, "t": 680.33516, "r": 545.11505, "b": 689.24172, "coord_origin": "TOPLEFT"}}, {"id": 212, "text": "work. The attention network takes both inputs and learns to", "bbox": {"l": 308.86194, "t": 692.290161, "r": 545.11505, "b": 701.196724, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "provide an attention weighted encoding. This weighted at-", "bbox": {"l": 308.86194, "t": 704.245163, "r": 545.11505, "b": 713.151726, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "page_footer", "bbox": {"l": 295.12094, "t": 734.13316, "r": 300.10223, "b": 743.039722, "coord_origin": "TOPLEFT"}, "confidence": 0.8719564080238342, "cells": [{"id": 214, "text": "5", "bbox": {"l": 295.12094, "t": 734.13316, "r": 300.10223, "b": 743.039722, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "picture", "id": 7, "page_no": 4, "cluster": {"id": 7, "label": "picture", "bbox": {"l": 74.30525970458984, "t": 77.91120147705078, "r": 519.9801025390625, "b": 183.70150756835938, "coord_origin": "TOPLEFT"}, "confidence": 0.9296807646751404, "cells": [{"id": 0, "text": "1.", "bbox": {"l": 81.688072, "t": 122.43970000000002, "r": 84.927567, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Item", "bbox": {"l": 86.54731, "t": 122.43970000000002, "r": 93.026291, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Amount", "bbox": {"l": 102.50498, "t": 115.25214000000005, "r": 115.3461, "b": 118.44135000000006, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Names", "bbox": {"l": 82.140205, "t": 115.21489999999994, "r": 93.291527, "b": 118.40410999999995, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "1000", "bbox": {"l": 96.748268, "t": 122.43970000000002, "r": 104.3119, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "500", "bbox": {"l": 96.748268, "t": 127.74370999999985, "r": 102.42083, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "3500", "bbox": {"l": 96.748268, "t": 133.45569, "r": 104.3119, "b": 136.6449, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "150", "bbox": {"l": 96.748268, "t": 139.16772000000003, "r": 102.42083, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "unit", "bbox": {"l": 110.66107, "t": 122.43970000000002, "r": 116.14391, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "unit", "bbox": {"l": 110.66107, "t": 127.74370999999985, "r": 116.14391, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "unit", "bbox": {"l": 110.66107, "t": 133.45569, "r": 116.14391, "b": 136.6449, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "unit", "bbox": {"l": 110.66107, "t": 139.16772000000003, "r": 116.14391, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "2.", "bbox": {"l": 81.688072, "t": 127.74370999999985, "r": 84.927567, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Item", "bbox": {"l": 86.54731, "t": 127.74370999999985, "r": 93.026291, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "3.", "bbox": {"l": 81.688072, "t": 133.45569, "r": 84.927567, "b": 136.6449, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Item", "bbox": {"l": 86.54731, "t": 133.45569, "r": 93.026291, "b": 136.6449, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "4.", "bbox": {"l": 81.688072, "t": 139.16772000000003, "r": 84.927567, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "Item", "bbox": {"l": 86.54731, "t": 139.16772000000003, "r": 93.026291, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Extracted", "bbox": {"l": 88.084389, "t": 90.49738000000002, "r": 113.93649, "b": 96.23798, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Table Images", "bbox": {"l": 82.81002, "t": 97.63738999999998, "r": 119.21240000000002, "b": 103.37798999999995, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Standardized", "bbox": {"l": 143.94247, "t": 100.60235999999998, "r": 180.01131, "b": 106.34295999999995, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Images", "bbox": {"l": 151.94064, "t": 107.74237000000005, "r": 172.0118, "b": 113.48297000000014, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "BBox", "bbox": {"l": 251.76939000000002, "t": 80.93096999999989, "r": 266.39557, "b": 86.67156999999997, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Decoder", "bbox": {"l": 247.51601, "t": 86.03101000000004, "r": 270.65021, "b": 91.77161000000001, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "BBoxes", "bbox": {"l": 331.03699, "t": 78.55980999999997, "r": 352.12589, "b": 84.30042000000003, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "BBoxes can be", "bbox": {"l": 390.56421, "t": 96.03223000000003, "r": 431.7261, "b": 101.77282999999989, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "traced back to the", "bbox": {"l": 386.82422, "t": 102.15228000000013, "r": 435.46966999999995, "b": 107.89287999999999, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "original image to", "bbox": {"l": 388.69589, "t": 108.27228000000002, "r": 433.6032400000001, "b": 114.01288000000011, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "extract content", "bbox": {"l": 391.07761, "t": 114.39227000000005, "r": 431.22542999999996, "b": 120.13286999999991, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Structure Tags sequence", "bbox": {"l": 431.22650000000004, "t": 151.68511999999998, "r": 498.82068, "b": 157.42571999999996, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "provide full description of", "bbox": {"l": 431.1738, "t": 157.80517999999995, "r": 498.87753000000004, "b": 163.54578000000004, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "the table structure", "bbox": {"l": 440.5289, "t": 163.92516999999998, "r": 489.51827999999995, "b": 169.66576999999995, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Structure Tags", "bbox": {"l": 328.37479, "t": 178.25385000000006, "r": 367.72333, "b": 183.99445000000003, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "BBoxes in sync", "bbox": {"l": 331.84451, "t": 123.90886999999998, "r": 373.67963, "b": 129.64948000000015, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "with tag sequence", "bbox": {"l": 331.84451, "t": 129.00885000000017, "r": 381.17786, "b": 134.74945000000002, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "Encoder", "bbox": {"l": 196.62633, "t": 88.11621000000002, "r": 219.42332, "b": 93.85681, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Structure", "bbox": {"l": 246.66771, "t": 129.4946900000001, "r": 271.49899, "b": 135.23528999999996, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "Decoder", "bbox": {"l": 247.51601, "t": 134.59473000000003, "r": 270.65021, "b": 140.33533, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "[x1, y2, x2, y2]", "bbox": {"l": 330.63071, "t": 89.01923, "r": 365.55347, "b": 94.75982999999997, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "[x1', y2', x2', y2']", "bbox": {"l": 330.63071, "t": 97.17926, "r": 370.22717, "b": 102.91985999999997, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "[x1'', y2'', x2'', y2'']", "bbox": {"l": 330.63071, "t": 105.33922999999993, "r": 374.51157, "b": 111.07983000000002, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "...", "bbox": {"l": 330.63071, "t": 113.49926999999991, "r": 335.73233, "b": 119.23987, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "<TR>", "bbox": {"l": 322.30579, "t": 141.79236000000003, "r": 335.05988, "b": 146.57617000000005, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "<TD>", "bbox": {"l": 322.30579, "t": 148.93231000000003, "r": 335.05988, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "1", "bbox": {"l": 337.54971, "t": 148.55579, "r": 340.95242, "b": 154.29638999999997, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "</TD><TD colspan=\"2\">", "bbox": {"l": 343.56262, "t": 148.93231000000003, "r": 398.91446, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "</TD>", "bbox": {"l": 407.41718, "t": 148.93231000000003, "r": 421.58801, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "</TR><TR>", "bbox": {"l": 322.30579, "t": 156.07232999999997, "r": 349.23022, "b": 160.85613999999998, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "<TD>", "bbox": {"l": 322.30579, "t": 163.21234000000004, "r": 335.05988, "b": 167.99614999999994, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "</TD><TD>...", "bbox": {"l": 343.56155, "t": 163.21234000000004, "r": 374.73685, "b": 167.99614999999994, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "...", "bbox": {"l": 322.30579, "t": 170.35235999999998, "r": 326.55716, "b": 175.13617, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "1", "bbox": {"l": 323.51111, "t": 89.66967999999997, "r": 326.91382, "b": 95.41027999999994, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "2", "bbox": {"l": 323.71509, "t": 97.78887999999995, "r": 327.1178, "b": 103.52948000000004, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "3", "bbox": {"l": 323.71509, "t": 105.98969, "r": 327.1178, "b": 111.73029000000008, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "2", "bbox": {"l": 401.4816, "t": 148.54625999999996, "r": 404.88431, "b": 154.28687000000002, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "3", "bbox": {"l": 337.6976, "t": 162.68451000000005, "r": 341.10031, "b": 168.42511000000002, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "3", "bbox": {"l": 454.46378, "t": 104.54584, "r": 457.86648999999994, "b": 110.28644000000008, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "2", "bbox": {"l": 493.32580999999993, "t": 91.09546, "r": 496.72852, "b": 96.83605999999997, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "1", "bbox": {"l": 454.08298, "t": 90.56879000000015, "r": 457.48569000000003, "b": 96.30939000000001, "coord_origin": "TOPLEFT"}}], "children": [{"id": 10, "label": "text", "bbox": {"l": 81.688072, "t": 122.43970000000002, "r": 84.927567, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 0, "text": "1.", "bbox": {"l": 81.688072, "t": 122.43970000000002, "r": 84.927567, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 86.54731, "t": 122.43970000000002, "r": 93.026291, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 1, "text": "Item", "bbox": {"l": 86.54731, "t": 122.43970000000002, "r": 93.026291, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 102.50498, "t": 115.25214000000005, "r": 115.3461, "b": 118.44135000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 2, "text": "Amount", "bbox": {"l": 102.50498, "t": 115.25214000000005, "r": 115.3461, "b": 118.44135000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 82.140205, "t": 115.21489999999994, "r": 93.291527, "b": 118.40410999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 3, "text": "Names", "bbox": {"l": 82.140205, "t": 115.21489999999994, "r": 93.291527, "b": 118.40410999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 96.748268, "t": 122.43970000000002, "r": 104.3119, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 4, "text": "1000", "bbox": {"l": 96.748268, "t": 122.43970000000002, "r": 104.3119, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 96.748268, "t": 127.74370999999985, "r": 102.42083, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 5, "text": "500", "bbox": {"l": 96.748268, "t": 127.74370999999985, "r": 102.42083, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 96.748268, "t": 133.45569, "r": 104.3119, "b": 136.6449, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": "3500", "bbox": {"l": 96.748268, "t": 133.45569, "r": 104.3119, "b": 136.6449, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 96.748268, "t": 139.16772000000003, "r": 102.42083, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "150", "bbox": {"l": 96.748268, "t": 139.16772000000003, "r": 102.42083, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 110.66107, "t": 122.43970000000002, "r": 116.14391, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "unit", "bbox": {"l": 110.66107, "t": 122.43970000000002, "r": 116.14391, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 110.66107, "t": 127.74370999999985, "r": 116.14391, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "unit", "bbox": {"l": 110.66107, "t": 127.74370999999985, "r": 116.14391, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 110.66107, "t": 133.45569, "r": 116.14391, "b": 136.6449, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "unit", "bbox": {"l": 110.66107, "t": 133.45569, "r": 116.14391, "b": 136.6449, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 110.66107, "t": 139.16772000000003, "r": 116.14391, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "unit", "bbox": {"l": 110.66107, "t": 139.16772000000003, "r": 116.14391, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 81.688072, "t": 127.74370999999985, "r": 84.927567, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "2.", "bbox": {"l": 81.688072, "t": 127.74370999999985, "r": 84.927567, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 86.54731, "t": 127.74370999999985, "r": 93.026291, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "Item", "bbox": {"l": 86.54731, "t": 127.74370999999985, "r": 93.026291, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 81.688072, "t": 133.45569, "r": 84.927567, "b": 136.6449, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "3.", "bbox": {"l": 81.688072, "t": 133.45569, "r": 84.927567, "b": 136.6449, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 86.54731, "t": 133.45569, "r": 93.026291, "b": 136.6449, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "Item", "bbox": {"l": 86.54731, "t": 133.45569, "r": 93.026291, "b": 136.6449, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 81.688072, "t": 139.16772000000003, "r": 84.927567, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "4.", "bbox": {"l": 81.688072, "t": 139.16772000000003, "r": 84.927567, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 86.54731, "t": 139.16772000000003, "r": 93.026291, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "Item", "bbox": {"l": 86.54731, "t": 139.16772000000003, "r": 93.026291, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 88.084389, "t": 90.49738000000002, "r": 113.93649, "b": 96.23798, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "Extracted", "bbox": {"l": 88.084389, "t": 90.49738000000002, "r": 113.93649, "b": 96.23798, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 82.81002, "t": 97.63738999999998, "r": 119.21240000000002, "b": 103.37798999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "Table Images", "bbox": {"l": 82.81002, "t": 97.63738999999998, "r": 119.21240000000002, "b": 103.37798999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 143.94247, "t": 100.60235999999998, "r": 180.01131, "b": 106.34295999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "Standardized", "bbox": {"l": 143.94247, "t": 100.60235999999998, "r": 180.01131, "b": 106.34295999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 151.94064, "t": 107.74237000000005, "r": 172.0118, "b": 113.48297000000014, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "Images", "bbox": {"l": 151.94064, "t": 107.74237000000005, "r": 172.0118, "b": 113.48297000000014, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 251.76939000000002, "t": 80.93096999999989, "r": 266.39557, "b": 86.67156999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "BBox", "bbox": {"l": 251.76939000000002, "t": 80.93096999999989, "r": 266.39557, "b": 86.67156999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 247.51601, "t": 86.03101000000004, "r": 270.65021, "b": 91.77161000000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "Decoder", "bbox": {"l": 247.51601, "t": 86.03101000000004, "r": 270.65021, "b": 91.77161000000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 331.03699, "t": 78.55980999999997, "r": 352.12589, "b": 84.30042000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "BBoxes", "bbox": {"l": 331.03699, "t": 78.55980999999997, "r": 352.12589, "b": 84.30042000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 390.56421, "t": 96.03223000000003, "r": 431.7261, "b": 101.77282999999989, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "BBoxes can be", "bbox": {"l": 390.56421, "t": 96.03223000000003, "r": 431.7261, "b": 101.77282999999989, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 386.82422, "t": 102.15228000000013, "r": 435.46966999999995, "b": 107.89287999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "traced back to the", "bbox": {"l": 386.82422, "t": 102.15228000000013, "r": 435.46966999999995, "b": 107.89287999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 388.69589, "t": 108.27228000000002, "r": 433.6032400000001, "b": 114.01288000000011, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "original image to", "bbox": {"l": 388.69589, "t": 108.27228000000002, "r": 433.6032400000001, "b": 114.01288000000011, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 391.07761, "t": 114.39227000000005, "r": 431.22542999999996, "b": 120.13286999999991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "extract content", "bbox": {"l": 391.07761, "t": 114.39227000000005, "r": 431.22542999999996, "b": 120.13286999999991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 431.22650000000004, "t": 151.68511999999998, "r": 498.82068, "b": 157.42571999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "Structure Tags sequence", "bbox": {"l": 431.22650000000004, "t": 151.68511999999998, "r": 498.82068, "b": 157.42571999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 431.1738, "t": 157.80517999999995, "r": 498.87753000000004, "b": 163.54578000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "provide full description of", "bbox": {"l": 431.1738, "t": 157.80517999999995, "r": 498.87753000000004, "b": 163.54578000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 440.5289, "t": 163.92516999999998, "r": 489.51827999999995, "b": 169.66576999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "the table structure", "bbox": {"l": 440.5289, "t": 163.92516999999998, "r": 489.51827999999995, "b": 169.66576999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 328.37479, "t": 178.25385000000006, "r": 367.72333, "b": 183.99445000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "Structure Tags", "bbox": {"l": 328.37479, "t": 178.25385000000006, "r": 367.72333, "b": 183.99445000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 331.84451, "t": 123.90886999999998, "r": 373.67963, "b": 129.64948000000015, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "BBoxes in sync", "bbox": {"l": 331.84451, "t": 123.90886999999998, "r": 373.67963, "b": 129.64948000000015, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 331.84451, "t": 129.00885000000017, "r": 381.17786, "b": 134.74945000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "with tag sequence", "bbox": {"l": 331.84451, "t": 129.00885000000017, "r": 381.17786, "b": 134.74945000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 196.62633, "t": 88.11621000000002, "r": 219.42332, "b": 93.85681, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "Encoder", "bbox": {"l": 196.62633, "t": 88.11621000000002, "r": 219.42332, "b": 93.85681, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 246.66771, "t": 129.4946900000001, "r": 271.49899, "b": 135.23528999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "Structure", "bbox": {"l": 246.66771, "t": 129.4946900000001, "r": 271.49899, "b": 135.23528999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 247.51601, "t": 134.59473000000003, "r": 270.65021, "b": 140.33533, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "Decoder", "bbox": {"l": 247.51601, "t": 134.59473000000003, "r": 270.65021, "b": 140.33533, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 330.63071, "t": 89.01923, "r": 365.55347, "b": 94.75982999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "[x1, y2, x2, y2]", "bbox": {"l": 330.63071, "t": 89.01923, "r": 365.55347, "b": 94.75982999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 330.63071, "t": 97.17926, "r": 370.22717, "b": 102.91985999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "[x1', y2', x2', y2']", "bbox": {"l": 330.63071, "t": 97.17926, "r": 370.22717, "b": 102.91985999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 330.63071, "t": 105.33922999999993, "r": 374.51157, "b": 111.07983000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "[x1'', y2'', x2'', y2'']", "bbox": {"l": 330.63071, "t": 105.33922999999993, "r": 374.51157, "b": 111.07983000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 330.63071, "t": 113.49926999999991, "r": 335.73233, "b": 119.23987, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "...", "bbox": {"l": 330.63071, "t": 113.49926999999991, "r": 335.73233, "b": 119.23987, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 322.30579, "t": 141.79236000000003, "r": 335.05988, "b": 146.57617000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "<TR>", "bbox": {"l": 322.30579, "t": 141.79236000000003, "r": 335.05988, "b": 146.57617000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 322.30579, "t": 148.93231000000003, "r": 335.05988, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "<TD>", "bbox": {"l": 322.30579, "t": 148.93231000000003, "r": 335.05988, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 337.54971, "t": 148.55579, "r": 340.95242, "b": 154.29638999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "1", "bbox": {"l": 337.54971, "t": 148.55579, "r": 340.95242, "b": 154.29638999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 343.56262, "t": 148.93231000000003, "r": 398.91446, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "</TD><TD colspan=\"2\">", "bbox": {"l": 343.56262, "t": 148.93231000000003, "r": 398.91446, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 407.41718, "t": 148.93231000000003, "r": 421.58801, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "</TD>", "bbox": {"l": 407.41718, "t": 148.93231000000003, "r": 421.58801, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 322.30579, "t": 156.07232999999997, "r": 349.23022, "b": 160.85613999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "</TR><TR>", "bbox": {"l": 322.30579, "t": 156.07232999999997, "r": 349.23022, "b": 160.85613999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 322.30579, "t": 163.21234000000004, "r": 335.05988, "b": 167.99614999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "<TD>", "bbox": {"l": 322.30579, "t": 163.21234000000004, "r": 335.05988, "b": 167.99614999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 343.56155, "t": 163.21234000000004, "r": 374.73685, "b": 167.99614999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "</TD><TD>...", "bbox": {"l": 343.56155, "t": 163.21234000000004, "r": 374.73685, "b": 167.99614999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 322.30579, "t": 170.35235999999998, "r": 326.55716, "b": 175.13617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "...", "bbox": {"l": 322.30579, "t": 170.35235999999998, "r": 326.55716, "b": 175.13617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 323.51111, "t": 89.66967999999997, "r": 326.91382, "b": 95.41027999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "1", "bbox": {"l": 323.51111, "t": 89.66967999999997, "r": 326.91382, "b": 95.41027999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 323.71509, "t": 97.78887999999995, "r": 327.1178, "b": 103.52948000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "2", "bbox": {"l": 323.71509, "t": 97.78887999999995, "r": 327.1178, "b": 103.52948000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 323.71509, "t": 105.98969, "r": 327.1178, "b": 111.73029000000008, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "3", "bbox": {"l": 323.71509, "t": 105.98969, "r": 327.1178, "b": 111.73029000000008, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 401.4816, "t": 148.54625999999996, "r": 404.88431, "b": 154.28687000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "2", "bbox": {"l": 401.4816, "t": 148.54625999999996, "r": 404.88431, "b": 154.28687000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 337.6976, "t": 162.68451000000005, "r": 341.10031, "b": 168.42511000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "3", "bbox": {"l": 337.6976, "t": 162.68451000000005, "r": 341.10031, "b": 168.42511000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 454.46378, "t": 104.54584, "r": 457.86648999999994, "b": 110.28644000000008, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "3", "bbox": {"l": 454.46378, "t": 104.54584, "r": 457.86648999999994, "b": 110.28644000000008, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 493.32580999999993, "t": 91.09546, "r": 496.72852, "b": 96.83605999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "2", "bbox": {"l": 493.32580999999993, "t": 91.09546, "r": 496.72852, "b": 96.83605999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 454.08298, "t": 90.56879000000015, "r": 457.48569000000003, "b": 96.30939000000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "1", "bbox": {"l": 454.08298, "t": 90.56879000000015, "r": 457.48569000000003, "b": 96.30939000000001, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "caption", "id": 6, "page_no": 4, "cluster": {"id": 6, "label": "caption", "bbox": {"l": 50.111992, "t": 203.98577999999998, "r": 545.10846, "b": 224.96691999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9677652716636658, "cells": [{"id": 59, "text": "Figure 3:", "bbox": {"l": 50.112, "t": 204.10535000000004, "r": 86.883949, "b": 213.01189999999997, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "TableFormer", "bbox": {"l": 94.020996, "t": 203.98577999999998, "r": 149.85141, "b": 212.94214, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "takes in an image of the PDF and creates bounding box and HTML structure predictions that are", "bbox": {"l": 152.86099, "t": 204.10535000000004, "r": 545.10846, "b": 213.01189999999997, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "synchronized. The bounding boxes grabs the content from the PDF and inserts it in the structure.", "bbox": {"l": 50.111992, "t": 216.06035999999995, "r": 436.0134, "b": 224.96691999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 3: TableFormer takes in an image of the PDF and creates bounding box and HTML structure predictions that are synchronized. The bounding boxes grabs the content from the PDF and inserts it in the structure."}, {"label": "picture", "id": 5, "page_no": 4, "cluster": {"id": 5, "label": "picture", "bbox": {"l": 53.03328323364258, "t": 257.66534423828125, "r": 285.3731689453125, "b": 507.6688537597656, "coord_origin": "TOPLEFT"}, "confidence": 0.9724942445755005, "cells": [{"id": 63, "text": "Input Image", "bbox": {"l": 74.253464, "t": 258.21472000000006, "r": 101.75846, "b": 264.17474000000004, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "Tokenised Tags", "bbox": {"l": 122.29972, "t": 258.34520999999995, "r": 157.83972, "b": 264.30524, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "Multi-Head Attention", "bbox": {"l": 78.549347, "t": 371.38579999999996, "r": 125.68359000000001, "b": 377.04782, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "Add", "bbox": {"l": 78.513298, "t": 391.31857, "r": 84.644547, "b": 396.98059, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "& Normalisation", "bbox": {"l": 116.52705, "t": 391.31857, "r": 125.11079999999998, "b": 396.98059, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "Feed Forward Network", "bbox": {"l": 76.024773, "t": 424.45309, "r": 127.92327000000002, "b": 430.11511, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "Add", "bbox": {"l": 78.382828, "t": 444.88956, "r": 84.514076, "b": 450.55157, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "& Normalisation", "bbox": {"l": 116.39658, "t": 444.88956, "r": 124.98033, "b": 450.55157, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Linear", "bbox": {"l": 167.46945, "t": 462.44324, "r": 181.6292, "b": 468.10526, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "Softmax", "bbox": {"l": 165.61292, "t": 478.47107, "r": 184.43242, "b": 484.13309, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "CNN BACKBONE ENCODER", "bbox": {"l": 65.319511, "t": 324.26235999999994, "r": 132.9245, "b": 330.22235000000006, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "[30, 1, 2, 3, 4, \u2026 3, ", "bbox": {"l": 119.51457, "t": 269.66394, "r": 162.98782, "b": 274.72992, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "4, 5, 8, 31]", "bbox": {"l": 128.72858, "t": 274.91394, "r": 151.41083, "b": 279.97992, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "Positional ", "bbox": {"l": 60.434211999999995, "t": 338.95993, "r": 80.27021, "b": 344.26993, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "Encoding", "bbox": {"l": 60.598457, "t": 343.38605, "r": 78.854958, "b": 348.69604, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "Positional ", "bbox": {"l": 134.82877, "t": 293.37762, "r": 154.66476, "b": 298.68762, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "Encoding", "bbox": {"l": 134.99303, "t": 297.80370999999997, "r": 153.24953, "b": 303.11371, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "Add & Normalisation", "bbox": {"l": 150.55193, "t": 345.35861, "r": 197.14943, "b": 351.02063, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Add", "bbox": {"l": 150.55193, "t": 394.4234, "r": 156.68318, "b": 400.08542, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "& Normalisation", "bbox": {"l": 188.56567, "t": 394.4234, "r": 197.14943, "b": 400.08542, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "Multi-Head Attention", "bbox": {"l": 150.18539, "t": 375.66843, "r": 197.31964, "b": 381.33044, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "Add", "bbox": {"l": 150.55193, "t": 440.24847000000005, "r": 156.68318, "b": 445.91049, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "& Normalisation", "bbox": {"l": 188.56567, "t": 440.24847000000005, "r": 197.14943, "b": 445.91049, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Feed Forward Network", "bbox": {"l": 147.86377, "t": 422.09335, "r": 199.76227, "b": 427.75537, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Linear", "bbox": {"l": 241.56567000000004, "t": 314.26285000000007, "r": 255.72542, "b": 319.92487, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "Linear", "bbox": {"l": 241.91730000000004, "t": 361.36493, "r": 256.07706, "b": 367.02695, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "Attention", "bbox": {"l": 228.054, "t": 336.61929000000003, "r": 248.72363000000004, "b": 342.28131, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "Network", "bbox": {"l": 246.2919, "t": 336.61929000000003, "r": 269.39325, "b": 342.28131, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "MLP", "bbox": {"l": 228.44568000000004, "t": 405.14682, "r": 238.73892, "b": 410.80884, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Linear ", "bbox": {"l": 256.29767, "t": 405.2032500000001, "r": 271.77792, "b": 410.86526, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "Sigmoid", "bbox": {"l": 239.54543, "t": 382.21344, "r": 258.08942, "b": 387.87546, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "Transformer Encoder Network", "bbox": {"l": 54.14704100000001, "t": 384.87183, "r": 59.51152, "b": 449.78326, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "x2", "bbox": {"l": 54.235424, "t": 373.81232, "r": 59.30449699999999, "b": 378.45421999999996, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "Encoded Output", "bbox": {"l": 85.295891, "t": 484.53189, "r": 122.16431, "b": 490.36688, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "Encoded Output", "bbox": {"l": 229.66599, "t": 279.54607999999996, "r": 265.3194, "b": 285.45572000000004, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "Predicted Tags", "bbox": {"l": 157.17369, "t": 500.3031, "r": 190.41711, "b": 506.12943, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "Bounding Boxes & ", "bbox": {"l": 227.81598999999997, "t": 438.05542, "r": 270.78442, "b": 443.89206, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "Classification", "bbox": {"l": 233.70262, "t": 444.06183, "r": 263.51105, "b": 449.8904999999999, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "Transformer ", "bbox": {"l": 184.74655, "t": 293.39502, "r": 212.16055, "b": 298.75903, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "Decoder Network", "bbox": {"l": 178.91229, "t": 299.14502, "r": 216.74378999999996, "b": 304.50903, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "x4", "bbox": {"l": 194.24574, "t": 282.7822, "r": 198.89099, "b": 287.84817999999996, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "CELL BBOX DECODER", "bbox": {"l": 221.45587, "t": 271.86914, "r": 276.47089, "b": 277.82916, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "Masked Multi-Head ", "bbox": {"l": 151.65219, "t": 323.44241, "r": 197.29019, "b": 329.10443, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "Attention", "bbox": {"l": 163.43277, "t": 329.44241, "r": 184.19028, "b": 335.10443, "coord_origin": "TOPLEFT"}}], "children": [{"id": 69, "label": "text", "bbox": {"l": 74.253464, "t": 258.21472000000006, "r": 101.75846, "b": 264.17474000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "Input Image", "bbox": {"l": 74.253464, "t": 258.21472000000006, "r": 101.75846, "b": 264.17474000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 122.29972, "t": 258.34520999999995, "r": 157.83972, "b": 264.30524, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "Tokenised Tags", "bbox": {"l": 122.29972, "t": 258.34520999999995, "r": 157.83972, "b": 264.30524, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 78.549347, "t": 371.38579999999996, "r": 125.68359000000001, "b": 377.04782, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "Multi-Head Attention", "bbox": {"l": 78.549347, "t": 371.38579999999996, "r": 125.68359000000001, "b": 377.04782, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 78.513298, "t": 391.31857, "r": 84.644547, "b": 396.98059, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "Add", "bbox": {"l": 78.513298, "t": 391.31857, "r": 84.644547, "b": 396.98059, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 116.52705, "t": 391.31857, "r": 125.11079999999998, "b": 396.98059, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "& Normalisation", "bbox": {"l": 116.52705, "t": 391.31857, "r": 125.11079999999998, "b": 396.98059, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 76.024773, "t": 424.45309, "r": 127.92327000000002, "b": 430.11511, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "Feed Forward Network", "bbox": {"l": 76.024773, "t": 424.45309, "r": 127.92327000000002, "b": 430.11511, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 78.382828, "t": 444.88956, "r": 84.514076, "b": 450.55157, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "Add", "bbox": {"l": 78.382828, "t": 444.88956, "r": 84.514076, "b": 450.55157, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 116.39658, "t": 444.88956, "r": 124.98033, "b": 450.55157, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "& Normalisation", "bbox": {"l": 116.39658, "t": 444.88956, "r": 124.98033, "b": 450.55157, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 167.46945, "t": 462.44324, "r": 181.6292, "b": 468.10526, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "Linear", "bbox": {"l": 167.46945, "t": 462.44324, "r": 181.6292, "b": 468.10526, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 165.61292, "t": 478.47107, "r": 184.43242, "b": 484.13309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "Softmax", "bbox": {"l": 165.61292, "t": 478.47107, "r": 184.43242, "b": 484.13309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 65.319511, "t": 324.26235999999994, "r": 132.9245, "b": 330.22235000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "CNN BACKBONE ENCODER", "bbox": {"l": 65.319511, "t": 324.26235999999994, "r": 132.9245, "b": 330.22235000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 119.51457, "t": 269.66394, "r": 162.98782, "b": 274.72992, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "[30, 1, 2, 3, 4, \u2026 3, ", "bbox": {"l": 119.51457, "t": 269.66394, "r": 162.98782, "b": 274.72992, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 128.72858, "t": 274.91394, "r": 151.41083, "b": 279.97992, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "4, 5, 8, 31]", "bbox": {"l": 128.72858, "t": 274.91394, "r": 151.41083, "b": 279.97992, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 60.434211999999995, "t": 338.95993, "r": 80.27021, "b": 344.26993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "Positional ", "bbox": {"l": 60.434211999999995, "t": 338.95993, "r": 80.27021, "b": 344.26993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 60.598457, "t": 343.38605, "r": 78.854958, "b": 348.69604, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "Encoding", "bbox": {"l": 60.598457, "t": 343.38605, "r": 78.854958, "b": 348.69604, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 134.82877, "t": 293.37762, "r": 154.66476, "b": 298.68762, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "Positional ", "bbox": {"l": 134.82877, "t": 293.37762, "r": 154.66476, "b": 298.68762, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 134.99303, "t": 297.80370999999997, "r": 153.24953, "b": 303.11371, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "Encoding", "bbox": {"l": 134.99303, "t": 297.80370999999997, "r": 153.24953, "b": 303.11371, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 150.55193, "t": 345.35861, "r": 197.14943, "b": 351.02063, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "Add & Normalisation", "bbox": {"l": 150.55193, "t": 345.35861, "r": 197.14943, "b": 351.02063, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 150.55193, "t": 394.4234, "r": 156.68318, "b": 400.08542, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "Add", "bbox": {"l": 150.55193, "t": 394.4234, "r": 156.68318, "b": 400.08542, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 188.56567, "t": 394.4234, "r": 197.14943, "b": 400.08542, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "& Normalisation", "bbox": {"l": 188.56567, "t": 394.4234, "r": 197.14943, "b": 400.08542, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 150.18539, "t": 375.66843, "r": 197.31964, "b": 381.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "Multi-Head Attention", "bbox": {"l": 150.18539, "t": 375.66843, "r": 197.31964, "b": 381.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 150.55193, "t": 440.24847000000005, "r": 156.68318, "b": 445.91049, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "Add", "bbox": {"l": 150.55193, "t": 440.24847000000005, "r": 156.68318, "b": 445.91049, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 188.56567, "t": 440.24847000000005, "r": 197.14943, "b": 445.91049, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "& Normalisation", "bbox": {"l": 188.56567, "t": 440.24847000000005, "r": 197.14943, "b": 445.91049, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 147.86377, "t": 422.09335, "r": 199.76227, "b": 427.75537, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "Feed Forward Network", "bbox": {"l": 147.86377, "t": 422.09335, "r": 199.76227, "b": 427.75537, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 241.56567000000004, "t": 314.26285000000007, "r": 255.72542, "b": 319.92487, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "Linear", "bbox": {"l": 241.56567000000004, "t": 314.26285000000007, "r": 255.72542, "b": 319.92487, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 241.91730000000004, "t": 361.36493, "r": 256.07706, "b": 367.02695, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "Linear", "bbox": {"l": 241.91730000000004, "t": 361.36493, "r": 256.07706, "b": 367.02695, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 228.054, "t": 336.61929000000003, "r": 248.72363000000004, "b": 342.28131, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "Attention", "bbox": {"l": 228.054, "t": 336.61929000000003, "r": 248.72363000000004, "b": 342.28131, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 246.2919, "t": 336.61929000000003, "r": 269.39325, "b": 342.28131, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "Network", "bbox": {"l": 246.2919, "t": 336.61929000000003, "r": 269.39325, "b": 342.28131, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 228.44568000000004, "t": 405.14682, "r": 238.73892, "b": 410.80884, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "MLP", "bbox": {"l": 228.44568000000004, "t": 405.14682, "r": 238.73892, "b": 410.80884, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 256.29767, "t": 405.2032500000001, "r": 271.77792, "b": 410.86526, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "Linear ", "bbox": {"l": 256.29767, "t": 405.2032500000001, "r": 271.77792, "b": 410.86526, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 239.54543, "t": 382.21344, "r": 258.08942, "b": 387.87546, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "Sigmoid", "bbox": {"l": 239.54543, "t": 382.21344, "r": 258.08942, "b": 387.87546, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 54.14704100000001, "t": 384.87183, "r": 59.51152, "b": 449.78326, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "Transformer Encoder Network", "bbox": {"l": 54.14704100000001, "t": 384.87183, "r": 59.51152, "b": 449.78326, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 54.235424, "t": 373.81232, "r": 59.30449699999999, "b": 378.45421999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "x2", "bbox": {"l": 54.235424, "t": 373.81232, "r": 59.30449699999999, "b": 378.45421999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 85.295891, "t": 484.53189, "r": 122.16431, "b": 490.36688, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "Encoded Output", "bbox": {"l": 85.295891, "t": 484.53189, "r": 122.16431, "b": 490.36688, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 229.66599, "t": 279.54607999999996, "r": 265.3194, "b": 285.45572000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "Encoded Output", "bbox": {"l": 229.66599, "t": 279.54607999999996, "r": 265.3194, "b": 285.45572000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 157.17369, "t": 500.3031, "r": 190.41711, "b": 506.12943, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "Predicted Tags", "bbox": {"l": 157.17369, "t": 500.3031, "r": 190.41711, "b": 506.12943, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 227.81598999999997, "t": 438.05542, "r": 270.78442, "b": 443.89206, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "Bounding Boxes & ", "bbox": {"l": 227.81598999999997, "t": 438.05542, "r": 270.78442, "b": 443.89206, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 233.70262, "t": 444.06183, "r": 263.51105, "b": 449.8904999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "Classification", "bbox": {"l": 233.70262, "t": 444.06183, "r": 263.51105, "b": 449.8904999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 184.74655, "t": 293.39502, "r": 212.16055, "b": 298.75903, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "Transformer ", "bbox": {"l": 184.74655, "t": 293.39502, "r": 212.16055, "b": 298.75903, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 178.91229, "t": 299.14502, "r": 216.74378999999996, "b": 304.50903, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "Decoder Network", "bbox": {"l": 178.91229, "t": 299.14502, "r": 216.74378999999996, "b": 304.50903, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 194.24574, "t": 282.7822, "r": 198.89099, "b": 287.84817999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": "x4", "bbox": {"l": 194.24574, "t": 282.7822, "r": 198.89099, "b": 287.84817999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 221.45587, "t": 271.86914, "r": 276.47089, "b": 277.82916, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "CELL BBOX DECODER", "bbox": {"l": 221.45587, "t": 271.86914, "r": 276.47089, "b": 277.82916, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 151.65219, "t": 323.44241, "r": 197.29019, "b": 329.10443, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "Masked Multi-Head ", "bbox": {"l": 151.65219, "t": 323.44241, "r": 197.29019, "b": 329.10443, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 163.43277, "t": 329.44241, "r": 184.19028, "b": 335.10443, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": "Attention", "bbox": {"l": 163.43277, "t": 329.44241, "r": 184.19028, "b": 335.10443, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "caption", "id": 8, "page_no": 4, "cluster": {"id": 8, "label": "caption", "bbox": {"l": 50.112, "t": 527.7828099999999, "r": 286.36597, "b": 680.27094, "coord_origin": "TOPLEFT"}, "confidence": 0.8913407325744629, "cells": [{"id": 107, "text": "Figure 4: Given an input image of a table, the", "bbox": {"l": 50.112, "t": 527.90237, "r": 229.78752, "b": 536.80893, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "Encoder", "bbox": {"l": 231.787, "t": 527.7828099999999, "r": 267.76196, "b": 536.7392, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "pro-", "bbox": {"l": 269.76401, "t": 527.90237, "r": 286.36169, "b": 536.80893, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "duces fixed-length features that represent the input image.", "bbox": {"l": 50.112015, "t": 539.85738, "r": 286.36508, "b": 548.76393, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "The features are then passed to both the", "bbox": {"l": 50.112015, "t": 551.81337, "r": 205.84735, "b": 560.71992, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "Structure Decoder", "bbox": {"l": 208.01802, "t": 551.69382, "r": 286.36392, "b": 560.6501900000001, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "and", "bbox": {"l": 50.112015, "t": 563.76837, "r": 64.498009, "b": 572.67493, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "Cell BBox Decoder", "bbox": {"l": 68.165016, "t": 563.64882, "r": 151.31288, "b": 572.60519, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": ".", "bbox": {"l": 151.31302, "t": 563.76837, "r": 153.80367, "b": 572.67493, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "During training, the", "bbox": {"l": 160.41884, "t": 563.76837, "r": 241.93283000000002, "b": 572.67493, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "Structure", "bbox": {"l": 245.59502, "t": 563.64882, "r": 286.362, "b": 572.60519, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "Decoder", "bbox": {"l": 50.112015, "t": 575.60382, "r": 85.519089, "b": 584.5602, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "receives \u2018tokenized tags\u2019 of the HTML code that", "bbox": {"l": 88.623016, "t": 575.7233699999999, "r": 286.36072, "b": 584.6299300000001, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "represent the table structure. Afterwards, a transformer en-", "bbox": {"l": 50.112015, "t": 587.6783800000001, "r": 286.36511, "b": 596.58493, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "coder and decoder architecture is employed to produce fea-", "bbox": {"l": 50.112015, "t": 599.63338, "r": 286.36508, "b": 608.53993, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "tures that are received by a linear layer, and the", "bbox": {"l": 50.112015, "t": 611.58838, "r": 240.43756000000002, "b": 620.4949300000001, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "Cell BBox", "bbox": {"l": 243.19801, "t": 611.46883, "r": 286.36597, "b": 620.4252, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "Decoder. The linear layer is applied to the features to", "bbox": {"l": 50.112015, "t": 623.42482, "r": 286.36511, "b": 632.3812, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "predict the tags. Simultaneously, the Cell BBox Decoder", "bbox": {"l": 50.112015, "t": 635.37982, "r": 286.36508, "b": 644.3362, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "selects features referring to the data cells (\u2018", "bbox": {"l": 50.112015, "t": 647.45438, "r": 220.58205, "b": 656.36093, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "<", "bbox": {"l": 220.57802000000004, "t": 647.29497, "r": 228.32693, "b": 656.14175, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "td", "bbox": {"l": 228.32700999999997, "t": 647.45438, "r": 236.07791000000003, "b": 656.36093, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": ">", "bbox": {"l": 236.07802000000004, "t": 647.29497, "r": 243.82693, "b": 656.14175, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "\u2019, \u2018", "bbox": {"l": 243.82602, "t": 647.45438, "r": 255.29298000000003, "b": 656.36093, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "<", "bbox": {"l": 255.29102000000003, "t": 647.29497, "r": 263.03992, "b": 656.14175, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "\u2019) and", "bbox": {"l": 263.04001, "t": 647.45438, "r": 286.36246, "b": 656.36093, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "passes them through an attention network, an MLP, and a", "bbox": {"l": 50.112015, "t": 659.40938, "r": 286.36511, "b": 668.31594, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "linear layer to predict the bounding boxes.", "bbox": {"l": 50.112015, "t": 671.36438, "r": 218.46996, "b": 680.27094, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 4: Given an input image of a table, the Encoder produces fixed-length features that represent the input image. The features are then passed to both the Structure Decoder and Cell BBox Decoder . During training, the Structure Decoder receives \u2018tokenized tags\u2019 of the HTML code that represent the table structure. Afterwards, a transformer encoder and decoder architecture is employed to produce features that are received by a linear layer, and the Cell BBox Decoder. The linear layer is applied to the features to predict the tags. Simultaneously, the Cell BBox Decoder selects features referring to the data cells (\u2018 < td > \u2019, \u2018 < \u2019) and passes them through an attention network, an MLP, and a linear layer to predict the bounding boxes."}, {"label": "text", "id": 4, "page_no": 4, "cluster": {"id": 4, "label": "text", "bbox": {"l": 308.862, "t": 249.53441999999995, "r": 545.11505, "b": 294.3069499999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9831458330154419, "cells": [{"id": 135, "text": "forming classification, and adding an adaptive pooling", "bbox": {"l": 308.862, "t": 249.53441999999995, "r": 523.05786, "b": 258.44097999999997, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "layer", "bbox": {"l": 525.19983, "t": 249.53441999999995, "r": 545.11505, "b": 258.44097999999997, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "of size 28*28. ResNet by default downsamples the", "bbox": {"l": 308.862, "t": 261.49042, "r": 517.55847, "b": 270.39697, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "image", "bbox": {"l": 520.76642, "t": 261.49042, "r": 545.11499, "b": 270.39697, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "resolution by 32 and then the encoded image is provided", "bbox": {"l": 308.862, "t": 273.44537, "r": 534.80377, "b": 282.35196, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "to", "bbox": {"l": 537.36414, "t": 273.44537, "r": 545.11505, "b": 282.35196, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "both the", "bbox": {"l": 308.862, "t": 285.40039, "r": 341.24045, "b": 294.3069499999999, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "Structure Decoder", "bbox": {"l": 343.73099, "t": 285.49005, "r": 417.23508, "b": 294.07782000000003, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": ", and", "bbox": {"l": 417.23398, "t": 285.40039, "r": 436.60129, "b": 294.3069499999999, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "Cell BBox Decoder", "bbox": {"l": 439.09198, "t": 285.49005, "r": 516.56116, "b": 294.07782000000003, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": ".", "bbox": {"l": 516.56097, "t": 285.40039, "r": 519.05164, "b": 294.3069499999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "forming classification, and adding an adaptive pooling layer of size 28*28. ResNet by default downsamples the image resolution by 32 and then the encoded image is provided to both the Structure Decoder , and Cell BBox Decoder ."}, {"label": "text", "id": 1, "page_no": 4, "cluster": {"id": 1, "label": "text", "bbox": {"l": 308.86194, "t": 297.33981, "r": 545.11511, "b": 413.96182, "coord_origin": "TOPLEFT"}, "confidence": 0.9862009882926941, "cells": [{"id": 146, "text": "Structure Decoder.", "bbox": {"l": 320.81696, "t": 297.33981, "r": 400.86649, "b": 306.2962, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "The transformer architecture of", "bbox": {"l": 403.91394, "t": 297.45938, "r": 528.33685, "b": 306.36594, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "this", "bbox": {"l": 530.7179, "t": 297.45938, "r": 545.11383, "b": 306.36594, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "component is based on the work proposed in [31].", "bbox": {"l": 308.86194, "t": 309.41437, "r": 517.5285, "b": 318.32092, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "After", "bbox": {"l": 524.09387, "t": 309.41437, "r": 545.11493, "b": 318.32092, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "extensive experimentation, the", "bbox": {"l": 308.86194, "t": 321.36934999999994, "r": 432.35833999999994, "b": 330.27591, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "Structure Decoder", "bbox": {"l": 435.81995000000006, "t": 321.45901, "r": 510.29041, "b": 330.04678, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "is", "bbox": {"l": 513.97797, "t": 321.36934999999994, "r": 520.62305, "b": 330.27591, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "mod-", "bbox": {"l": 524.08008, "t": 321.36934999999994, "r": 545.11115, "b": 330.27591, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "eled as a transformer encoder with two encoder layers", "bbox": {"l": 308.86197, "t": 333.32434, "r": 527.76013, "b": 342.2309, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "and", "bbox": {"l": 530.729, "t": 333.32434, "r": 545.11499, "b": 342.2309, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "a transformer decoder made from a stack of 4 decoder", "bbox": {"l": 308.86197, "t": 345.27933, "r": 526.85352, "b": 354.18588, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "lay-", "bbox": {"l": 529.62311, "t": 345.27933, "r": 545.11493, "b": 354.18588, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "ers that comprise mainly of multi-head attention and", "bbox": {"l": 308.86197, "t": 357.23532, "r": 524.51245, "b": 366.14188, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "feed", "bbox": {"l": 527.96948, "t": 357.23532, "r": 545.11511, "b": 366.14188, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "forward layers.", "bbox": {"l": 308.86197, "t": 369.19031000000007, "r": 370.39096, "b": 378.09685999999994, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "This configuration uses fewer layers", "bbox": {"l": 377.44449, "t": 369.19031000000007, "r": 526.91339, "b": 378.09685999999994, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "and", "bbox": {"l": 530.72906, "t": 369.19031000000007, "r": 545.11505, "b": 378.09685999999994, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "heads in comparison to networks applied to other", "bbox": {"l": 308.86197, "t": 381.14529000000005, "r": 505.46395999999993, "b": 390.05185, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "problems", "bbox": {"l": 508.03430000000003, "t": 381.14529000000005, "r": 545.11511, "b": 390.05185, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "(e.g. \u201cScene Understanding\u201d, \u201cImage Captioning\u201d),", "bbox": {"l": 308.86197, "t": 393.10028, "r": 517.68799, "b": 402.00684, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "some-", "bbox": {"l": 520.76642, "t": 393.10028, "r": 545.11499, "b": 402.00684, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "thing which we relate to the simplicity of table images.", "bbox": {"l": 308.86197, "t": 405.05526999999995, "r": 528.01935, "b": 413.96182, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Structure Decoder. The transformer architecture of this component is based on the work proposed in [31]. After extensive experimentation, the Structure Decoder is modeled as a transformer encoder with two encoder layers and a transformer decoder made from a stack of 4 decoder layers that comprise mainly of multi-head attention and feed forward layers. This configuration uses fewer layers and heads in comparison to networks applied to other problems (e.g. \u201cScene Understanding\u201d, \u201cImage Captioning\u201d), something which we relate to the simplicity of table images."}, {"label": "text", "id": 3, "page_no": 4, "cluster": {"id": 3, "label": "text", "bbox": {"l": 308.86197, "t": 417.11426, "r": 545.11511, "b": 545.57271, "coord_origin": "TOPLEFT"}, "confidence": 0.9851906895637512, "cells": [{"id": 169, "text": "The transformer encoder receives an encoded", "bbox": {"l": 320.81696, "t": 417.11426, "r": 515.49609, "b": 426.02081, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "image", "bbox": {"l": 520.7663, "t": 417.11426, "r": 545.11487, "b": 426.02081, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "from the", "bbox": {"l": 308.86197, "t": 429.0692399999999, "r": 343.72107, "b": 437.9758, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "CNN Backbone Network", "bbox": {"l": 347.03796, "t": 429.15891, "r": 446.45471000000003, "b": 437.74667, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "and refines it", "bbox": {"l": 449.93996999999996, "t": 429.0692399999999, "r": 503.06055000000003, "b": 437.9758, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "through", "bbox": {"l": 506.37808, "t": 429.0692399999999, "r": 537.3717, "b": 437.9758, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "a", "bbox": {"l": 540.68927, "t": 429.0692399999999, "r": 545.11267, "b": 437.9758, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "multi-head dot-product attention layer, followed by a", "bbox": {"l": 308.86197, "t": 441.02423, "r": 522.78894, "b": 449.93079, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "Feed", "bbox": {"l": 525.7478, "t": 441.02423, "r": 545.11511, "b": 449.93079, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "Forward Network.", "bbox": {"l": 308.86197, "t": 452.97922, "r": 384.14929, "b": 461.88577, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "During training, the transformer", "bbox": {"l": 393.37466, "t": 452.97922, "r": 527.84985, "b": 461.88577, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "de-", "bbox": {"l": 532.39282, "t": 452.97922, "r": 545.11505, "b": 461.88577, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "coder receives as input the output feature produced by", "bbox": {"l": 308.86197, "t": 464.93521, "r": 529.7627, "b": 473.84177, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "the", "bbox": {"l": 532.94073, "t": 464.93521, "r": 545.11505, "b": 473.84177, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "transformer encoder, and the tokenized input of the", "bbox": {"l": 308.86197, "t": 476.8902, "r": 514.17126, "b": 485.79675, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "HTML", "bbox": {"l": 516.89105, "t": 476.8902, "r": 545.11511, "b": 485.79675, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": "ground-truth tags. Using a stack of multi-head attention", "bbox": {"l": 308.86197, "t": 488.84518, "r": 527.63068, "b": 497.75174, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "lay-", "bbox": {"l": 529.62317, "t": 488.84518, "r": 545.11499, "b": 497.75174, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "ers, different aspects of the tag sequence could be", "bbox": {"l": 308.86197, "t": 500.80017, "r": 508.3630999999999, "b": 509.70673, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": "inferred.", "bbox": {"l": 511.09286000000003, "t": 500.80017, "r": 545.11511, "b": 509.70673, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "This is achieved by each attention head on a layer operating", "bbox": {"l": 308.86197, "t": 512.7551599999999, "r": 545.11499, "b": 521.6617100000001, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "in a different subspace, and then combining altogether their", "bbox": {"l": 308.86197, "t": 524.71115, "r": 545.11511, "b": 533.61771, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "attention score.", "bbox": {"l": 308.86197, "t": 536.66615, "r": 369.73349, "b": 545.57271, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The transformer encoder receives an encoded image from the CNN Backbone Network and refines it through a multi-head dot-product attention layer, followed by a Feed Forward Network. During training, the transformer decoder receives as input the output feature produced by the transformer encoder, and the tokenized input of the HTML ground-truth tags. Using a stack of multi-head attention layers, different aspects of the tag sequence could be inferred. This is achieved by each attention head on a layer operating in a different subspace, and then combining altogether their attention score."}, {"label": "text", "id": 0, "page_no": 4, "cluster": {"id": 0, "label": "text", "bbox": {"l": 308.86194, "t": 548.6046, "r": 545.11511, "b": 653.27271, "coord_origin": "TOPLEFT"}, "confidence": 0.9869195818901062, "cells": [{"id": 192, "text": "Cell BBox Decoder.", "bbox": {"l": 320.81696, "t": 548.6046, "r": 404.76184, "b": 557.56097, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "Our architecture allows to simul-", "bbox": {"l": 410.34094, "t": 548.72415, "r": 545.11505, "b": 557.63071, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "taneously predict HTML tags and bounding boxes for each", "bbox": {"l": 308.86194, "t": 560.68015, "r": 545.11493, "b": 569.5867000000001, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "table cell without the need of a separate object detector end", "bbox": {"l": 308.86194, "t": 572.6351500000001, "r": 545.11511, "b": 581.5417, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "to end. This approach is inspired by DETR [1] which em-", "bbox": {"l": 308.86194, "t": 584.59015, "r": 545.11493, "b": 593.4967, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "ploys a Transformer Encoder, and Decoder that looks for", "bbox": {"l": 308.86194, "t": 596.54515, "r": 545.11499, "b": 605.45171, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "a specific number of object queries (potential object detec-", "bbox": {"l": 308.86194, "t": 608.50015, "r": 545.11505, "b": 617.40671, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "tions). As our model utilizes a transformer architecture, the", "bbox": {"l": 308.86194, "t": 620.45515, "r": 545.11505, "b": 629.36171, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "hidden state of the", "bbox": {"l": 308.86194, "t": 632.41115, "r": 381.67859, "b": 641.3177000000001, "coord_origin": "TOPLEFT"}}, {"id": 201, "text": "<", "bbox": {"l": 383.99695, "t": 632.25174, "r": 391.74585, "b": 641.09853, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": "td", "bbox": {"l": 391.74594, "t": 632.41115, "r": 399.49686, "b": 641.3177000000001, "coord_origin": "TOPLEFT"}}, {"id": 203, "text": ">", "bbox": {"l": 399.49695, "t": 632.25174, "r": 407.24585, "b": 641.09853, "coord_origin": "TOPLEFT"}}, {"id": 204, "text": "\u2019 and \u2018", "bbox": {"l": 407.24594, "t": 632.41115, "r": 432.90958, "b": 641.3177000000001, "coord_origin": "TOPLEFT"}}, {"id": 205, "text": "<", "bbox": {"l": 432.90792999999996, "t": 632.25174, "r": 440.65683000000007, "b": 641.09853, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": "\u2019 HTML structure tags be-", "bbox": {"l": 440.65691999999996, "t": 632.41115, "r": 545.11475, "b": 641.3177000000001, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": "come the object query.", "bbox": {"l": 308.86194, "t": 644.3661500000001, "r": 398.96371, "b": 653.27271, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Cell BBox Decoder. Our architecture allows to simultaneously predict HTML tags and bounding boxes for each table cell without the need of a separate object detector end to end. This approach is inspired by DETR [1] which employs a Transformer Encoder, and Decoder that looks for a specific number of object queries (potential object detections). As our model utilizes a transformer architecture, the hidden state of the < td > \u2019 and \u2018 < \u2019 HTML structure tags become the object query."}, {"label": "text", "id": 2, "page_no": 4, "cluster": {"id": 2, "label": "text", "bbox": {"l": 308.86194, "t": 656.42516, "r": 545.11505, "b": 713.151726, "coord_origin": "TOPLEFT"}, "confidence": 0.9852352142333984, "cells": [{"id": 208, "text": "The encoding generated by the", "bbox": {"l": 320.81693, "t": 656.42516, "r": 444.34316999999993, "b": 665.33172, "coord_origin": "TOPLEFT"}}, {"id": 209, "text": "CNN Backbone Network", "bbox": {"l": 447.00591999999995, "t": 656.51482, "r": 545.1076, "b": 665.10258, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": "along with the features acquired for every data cell from the", "bbox": {"l": 308.86194, "t": 668.38016, "r": 545.11505, "b": 677.2867200000001, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "Transformer Decoder are then passed to the attention net-", "bbox": {"l": 308.86194, "t": 680.33516, "r": 545.11505, "b": 689.24172, "coord_origin": "TOPLEFT"}}, {"id": 212, "text": "work. The attention network takes both inputs and learns to", "bbox": {"l": 308.86194, "t": 692.290161, "r": 545.11505, "b": 701.196724, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "provide an attention weighted encoding. This weighted at-", "bbox": {"l": 308.86194, "t": 704.245163, "r": 545.11505, "b": 713.151726, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The encoding generated by the CNN Backbone Network along with the features acquired for every data cell from the Transformer Decoder are then passed to the attention network. The attention network takes both inputs and learns to provide an attention weighted encoding. This weighted at-"}, {"label": "page_footer", "id": 9, "page_no": 4, "cluster": {"id": 9, "label": "page_footer", "bbox": {"l": 295.12094, "t": 734.13316, "r": 300.10223, "b": 743.039722, "coord_origin": "TOPLEFT"}, "confidence": 0.8719564080238342, "cells": [{"id": 214, "text": "5", "bbox": {"l": 295.12094, "t": 734.13316, "r": 300.10223, "b": 743.039722, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5"}], "body": [{"label": "picture", "id": 7, "page_no": 4, "cluster": {"id": 7, "label": "picture", "bbox": {"l": 74.30525970458984, "t": 77.91120147705078, "r": 519.9801025390625, "b": 183.70150756835938, "coord_origin": "TOPLEFT"}, "confidence": 0.9296807646751404, "cells": [{"id": 0, "text": "1.", "bbox": {"l": 81.688072, "t": 122.43970000000002, "r": 84.927567, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Item", "bbox": {"l": 86.54731, "t": 122.43970000000002, "r": 93.026291, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Amount", "bbox": {"l": 102.50498, "t": 115.25214000000005, "r": 115.3461, "b": 118.44135000000006, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Names", "bbox": {"l": 82.140205, "t": 115.21489999999994, "r": 93.291527, "b": 118.40410999999995, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "1000", "bbox": {"l": 96.748268, "t": 122.43970000000002, "r": 104.3119, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "500", "bbox": {"l": 96.748268, "t": 127.74370999999985, "r": 102.42083, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "3500", "bbox": {"l": 96.748268, "t": 133.45569, "r": 104.3119, "b": 136.6449, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "150", "bbox": {"l": 96.748268, "t": 139.16772000000003, "r": 102.42083, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "unit", "bbox": {"l": 110.66107, "t": 122.43970000000002, "r": 116.14391, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "unit", "bbox": {"l": 110.66107, "t": 127.74370999999985, "r": 116.14391, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "unit", "bbox": {"l": 110.66107, "t": 133.45569, "r": 116.14391, "b": 136.6449, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "unit", "bbox": {"l": 110.66107, "t": 139.16772000000003, "r": 116.14391, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "2.", "bbox": {"l": 81.688072, "t": 127.74370999999985, "r": 84.927567, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Item", "bbox": {"l": 86.54731, "t": 127.74370999999985, "r": 93.026291, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "3.", "bbox": {"l": 81.688072, "t": 133.45569, "r": 84.927567, "b": 136.6449, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Item", "bbox": {"l": 86.54731, "t": 133.45569, "r": 93.026291, "b": 136.6449, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "4.", "bbox": {"l": 81.688072, "t": 139.16772000000003, "r": 84.927567, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "Item", "bbox": {"l": 86.54731, "t": 139.16772000000003, "r": 93.026291, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Extracted", "bbox": {"l": 88.084389, "t": 90.49738000000002, "r": 113.93649, "b": 96.23798, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Table Images", "bbox": {"l": 82.81002, "t": 97.63738999999998, "r": 119.21240000000002, "b": 103.37798999999995, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Standardized", "bbox": {"l": 143.94247, "t": 100.60235999999998, "r": 180.01131, "b": 106.34295999999995, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Images", "bbox": {"l": 151.94064, "t": 107.74237000000005, "r": 172.0118, "b": 113.48297000000014, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "BBox", "bbox": {"l": 251.76939000000002, "t": 80.93096999999989, "r": 266.39557, "b": 86.67156999999997, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Decoder", "bbox": {"l": 247.51601, "t": 86.03101000000004, "r": 270.65021, "b": 91.77161000000001, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "BBoxes", "bbox": {"l": 331.03699, "t": 78.55980999999997, "r": 352.12589, "b": 84.30042000000003, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "BBoxes can be", "bbox": {"l": 390.56421, "t": 96.03223000000003, "r": 431.7261, "b": 101.77282999999989, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "traced back to the", "bbox": {"l": 386.82422, "t": 102.15228000000013, "r": 435.46966999999995, "b": 107.89287999999999, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "original image to", "bbox": {"l": 388.69589, "t": 108.27228000000002, "r": 433.6032400000001, "b": 114.01288000000011, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "extract content", "bbox": {"l": 391.07761, "t": 114.39227000000005, "r": 431.22542999999996, "b": 120.13286999999991, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Structure Tags sequence", "bbox": {"l": 431.22650000000004, "t": 151.68511999999998, "r": 498.82068, "b": 157.42571999999996, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "provide full description of", "bbox": {"l": 431.1738, "t": 157.80517999999995, "r": 498.87753000000004, "b": 163.54578000000004, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "the table structure", "bbox": {"l": 440.5289, "t": 163.92516999999998, "r": 489.51827999999995, "b": 169.66576999999995, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Structure Tags", "bbox": {"l": 328.37479, "t": 178.25385000000006, "r": 367.72333, "b": 183.99445000000003, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "BBoxes in sync", "bbox": {"l": 331.84451, "t": 123.90886999999998, "r": 373.67963, "b": 129.64948000000015, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "with tag sequence", "bbox": {"l": 331.84451, "t": 129.00885000000017, "r": 381.17786, "b": 134.74945000000002, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "Encoder", "bbox": {"l": 196.62633, "t": 88.11621000000002, "r": 219.42332, "b": 93.85681, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Structure", "bbox": {"l": 246.66771, "t": 129.4946900000001, "r": 271.49899, "b": 135.23528999999996, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "Decoder", "bbox": {"l": 247.51601, "t": 134.59473000000003, "r": 270.65021, "b": 140.33533, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "[x1, y2, x2, y2]", "bbox": {"l": 330.63071, "t": 89.01923, "r": 365.55347, "b": 94.75982999999997, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "[x1', y2', x2', y2']", "bbox": {"l": 330.63071, "t": 97.17926, "r": 370.22717, "b": 102.91985999999997, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "[x1'', y2'', x2'', y2'']", "bbox": {"l": 330.63071, "t": 105.33922999999993, "r": 374.51157, "b": 111.07983000000002, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "...", "bbox": {"l": 330.63071, "t": 113.49926999999991, "r": 335.73233, "b": 119.23987, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "<TR>", "bbox": {"l": 322.30579, "t": 141.79236000000003, "r": 335.05988, "b": 146.57617000000005, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "<TD>", "bbox": {"l": 322.30579, "t": 148.93231000000003, "r": 335.05988, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "1", "bbox": {"l": 337.54971, "t": 148.55579, "r": 340.95242, "b": 154.29638999999997, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "</TD><TD colspan=\"2\">", "bbox": {"l": 343.56262, "t": 148.93231000000003, "r": 398.91446, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "</TD>", "bbox": {"l": 407.41718, "t": 148.93231000000003, "r": 421.58801, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "</TR><TR>", "bbox": {"l": 322.30579, "t": 156.07232999999997, "r": 349.23022, "b": 160.85613999999998, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "<TD>", "bbox": {"l": 322.30579, "t": 163.21234000000004, "r": 335.05988, "b": 167.99614999999994, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "</TD><TD>...", "bbox": {"l": 343.56155, "t": 163.21234000000004, "r": 374.73685, "b": 167.99614999999994, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "...", "bbox": {"l": 322.30579, "t": 170.35235999999998, "r": 326.55716, "b": 175.13617, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "1", "bbox": {"l": 323.51111, "t": 89.66967999999997, "r": 326.91382, "b": 95.41027999999994, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "2", "bbox": {"l": 323.71509, "t": 97.78887999999995, "r": 327.1178, "b": 103.52948000000004, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "3", "bbox": {"l": 323.71509, "t": 105.98969, "r": 327.1178, "b": 111.73029000000008, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "2", "bbox": {"l": 401.4816, "t": 148.54625999999996, "r": 404.88431, "b": 154.28687000000002, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "3", "bbox": {"l": 337.6976, "t": 162.68451000000005, "r": 341.10031, "b": 168.42511000000002, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "3", "bbox": {"l": 454.46378, "t": 104.54584, "r": 457.86648999999994, "b": 110.28644000000008, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "2", "bbox": {"l": 493.32580999999993, "t": 91.09546, "r": 496.72852, "b": 96.83605999999997, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "1", "bbox": {"l": 454.08298, "t": 90.56879000000015, "r": 457.48569000000003, "b": 96.30939000000001, "coord_origin": "TOPLEFT"}}], "children": [{"id": 10, "label": "text", "bbox": {"l": 81.688072, "t": 122.43970000000002, "r": 84.927567, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 0, "text": "1.", "bbox": {"l": 81.688072, "t": 122.43970000000002, "r": 84.927567, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 86.54731, "t": 122.43970000000002, "r": 93.026291, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 1, "text": "Item", "bbox": {"l": 86.54731, "t": 122.43970000000002, "r": 93.026291, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 102.50498, "t": 115.25214000000005, "r": 115.3461, "b": 118.44135000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 2, "text": "Amount", "bbox": {"l": 102.50498, "t": 115.25214000000005, "r": 115.3461, "b": 118.44135000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 82.140205, "t": 115.21489999999994, "r": 93.291527, "b": 118.40410999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 3, "text": "Names", "bbox": {"l": 82.140205, "t": 115.21489999999994, "r": 93.291527, "b": 118.40410999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 96.748268, "t": 122.43970000000002, "r": 104.3119, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 4, "text": "1000", "bbox": {"l": 96.748268, "t": 122.43970000000002, "r": 104.3119, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 96.748268, "t": 127.74370999999985, "r": 102.42083, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 5, "text": "500", "bbox": {"l": 96.748268, "t": 127.74370999999985, "r": 102.42083, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 96.748268, "t": 133.45569, "r": 104.3119, "b": 136.6449, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": "3500", "bbox": {"l": 96.748268, "t": 133.45569, "r": 104.3119, "b": 136.6449, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 96.748268, "t": 139.16772000000003, "r": 102.42083, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "150", "bbox": {"l": 96.748268, "t": 139.16772000000003, "r": 102.42083, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 110.66107, "t": 122.43970000000002, "r": 116.14391, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "unit", "bbox": {"l": 110.66107, "t": 122.43970000000002, "r": 116.14391, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 110.66107, "t": 127.74370999999985, "r": 116.14391, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "unit", "bbox": {"l": 110.66107, "t": 127.74370999999985, "r": 116.14391, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 110.66107, "t": 133.45569, "r": 116.14391, "b": 136.6449, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "unit", "bbox": {"l": 110.66107, "t": 133.45569, "r": 116.14391, "b": 136.6449, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 110.66107, "t": 139.16772000000003, "r": 116.14391, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "unit", "bbox": {"l": 110.66107, "t": 139.16772000000003, "r": 116.14391, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 81.688072, "t": 127.74370999999985, "r": 84.927567, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "2.", "bbox": {"l": 81.688072, "t": 127.74370999999985, "r": 84.927567, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 86.54731, "t": 127.74370999999985, "r": 93.026291, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "Item", "bbox": {"l": 86.54731, "t": 127.74370999999985, "r": 93.026291, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 81.688072, "t": 133.45569, "r": 84.927567, "b": 136.6449, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "3.", "bbox": {"l": 81.688072, "t": 133.45569, "r": 84.927567, "b": 136.6449, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 86.54731, "t": 133.45569, "r": 93.026291, "b": 136.6449, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "Item", "bbox": {"l": 86.54731, "t": 133.45569, "r": 93.026291, "b": 136.6449, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 81.688072, "t": 139.16772000000003, "r": 84.927567, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "4.", "bbox": {"l": 81.688072, "t": 139.16772000000003, "r": 84.927567, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 86.54731, "t": 139.16772000000003, "r": 93.026291, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "Item", "bbox": {"l": 86.54731, "t": 139.16772000000003, "r": 93.026291, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 88.084389, "t": 90.49738000000002, "r": 113.93649, "b": 96.23798, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "Extracted", "bbox": {"l": 88.084389, "t": 90.49738000000002, "r": 113.93649, "b": 96.23798, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 82.81002, "t": 97.63738999999998, "r": 119.21240000000002, "b": 103.37798999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "Table Images", "bbox": {"l": 82.81002, "t": 97.63738999999998, "r": 119.21240000000002, "b": 103.37798999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 143.94247, "t": 100.60235999999998, "r": 180.01131, "b": 106.34295999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "Standardized", "bbox": {"l": 143.94247, "t": 100.60235999999998, "r": 180.01131, "b": 106.34295999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 151.94064, "t": 107.74237000000005, "r": 172.0118, "b": 113.48297000000014, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "Images", "bbox": {"l": 151.94064, "t": 107.74237000000005, "r": 172.0118, "b": 113.48297000000014, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 251.76939000000002, "t": 80.93096999999989, "r": 266.39557, "b": 86.67156999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "BBox", "bbox": {"l": 251.76939000000002, "t": 80.93096999999989, "r": 266.39557, "b": 86.67156999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 247.51601, "t": 86.03101000000004, "r": 270.65021, "b": 91.77161000000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "Decoder", "bbox": {"l": 247.51601, "t": 86.03101000000004, "r": 270.65021, "b": 91.77161000000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 331.03699, "t": 78.55980999999997, "r": 352.12589, "b": 84.30042000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "BBoxes", "bbox": {"l": 331.03699, "t": 78.55980999999997, "r": 352.12589, "b": 84.30042000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 390.56421, "t": 96.03223000000003, "r": 431.7261, "b": 101.77282999999989, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "BBoxes can be", "bbox": {"l": 390.56421, "t": 96.03223000000003, "r": 431.7261, "b": 101.77282999999989, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 386.82422, "t": 102.15228000000013, "r": 435.46966999999995, "b": 107.89287999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "traced back to the", "bbox": {"l": 386.82422, "t": 102.15228000000013, "r": 435.46966999999995, "b": 107.89287999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 388.69589, "t": 108.27228000000002, "r": 433.6032400000001, "b": 114.01288000000011, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "original image to", "bbox": {"l": 388.69589, "t": 108.27228000000002, "r": 433.6032400000001, "b": 114.01288000000011, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 391.07761, "t": 114.39227000000005, "r": 431.22542999999996, "b": 120.13286999999991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "extract content", "bbox": {"l": 391.07761, "t": 114.39227000000005, "r": 431.22542999999996, "b": 120.13286999999991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 431.22650000000004, "t": 151.68511999999998, "r": 498.82068, "b": 157.42571999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "Structure Tags sequence", "bbox": {"l": 431.22650000000004, "t": 151.68511999999998, "r": 498.82068, "b": 157.42571999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 431.1738, "t": 157.80517999999995, "r": 498.87753000000004, "b": 163.54578000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "provide full description of", "bbox": {"l": 431.1738, "t": 157.80517999999995, "r": 498.87753000000004, "b": 163.54578000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 440.5289, "t": 163.92516999999998, "r": 489.51827999999995, "b": 169.66576999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "the table structure", "bbox": {"l": 440.5289, "t": 163.92516999999998, "r": 489.51827999999995, "b": 169.66576999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 328.37479, "t": 178.25385000000006, "r": 367.72333, "b": 183.99445000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "Structure Tags", "bbox": {"l": 328.37479, "t": 178.25385000000006, "r": 367.72333, "b": 183.99445000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 331.84451, "t": 123.90886999999998, "r": 373.67963, "b": 129.64948000000015, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "BBoxes in sync", "bbox": {"l": 331.84451, "t": 123.90886999999998, "r": 373.67963, "b": 129.64948000000015, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 331.84451, "t": 129.00885000000017, "r": 381.17786, "b": 134.74945000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "with tag sequence", "bbox": {"l": 331.84451, "t": 129.00885000000017, "r": 381.17786, "b": 134.74945000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 196.62633, "t": 88.11621000000002, "r": 219.42332, "b": 93.85681, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "Encoder", "bbox": {"l": 196.62633, "t": 88.11621000000002, "r": 219.42332, "b": 93.85681, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 246.66771, "t": 129.4946900000001, "r": 271.49899, "b": 135.23528999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "Structure", "bbox": {"l": 246.66771, "t": 129.4946900000001, "r": 271.49899, "b": 135.23528999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 247.51601, "t": 134.59473000000003, "r": 270.65021, "b": 140.33533, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "Decoder", "bbox": {"l": 247.51601, "t": 134.59473000000003, "r": 270.65021, "b": 140.33533, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 330.63071, "t": 89.01923, "r": 365.55347, "b": 94.75982999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "[x1, y2, x2, y2]", "bbox": {"l": 330.63071, "t": 89.01923, "r": 365.55347, "b": 94.75982999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 330.63071, "t": 97.17926, "r": 370.22717, "b": 102.91985999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "[x1', y2', x2', y2']", "bbox": {"l": 330.63071, "t": 97.17926, "r": 370.22717, "b": 102.91985999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 330.63071, "t": 105.33922999999993, "r": 374.51157, "b": 111.07983000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "[x1'', y2'', x2'', y2'']", "bbox": {"l": 330.63071, "t": 105.33922999999993, "r": 374.51157, "b": 111.07983000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 330.63071, "t": 113.49926999999991, "r": 335.73233, "b": 119.23987, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "...", "bbox": {"l": 330.63071, "t": 113.49926999999991, "r": 335.73233, "b": 119.23987, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 322.30579, "t": 141.79236000000003, "r": 335.05988, "b": 146.57617000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "<TR>", "bbox": {"l": 322.30579, "t": 141.79236000000003, "r": 335.05988, "b": 146.57617000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 322.30579, "t": 148.93231000000003, "r": 335.05988, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "<TD>", "bbox": {"l": 322.30579, "t": 148.93231000000003, "r": 335.05988, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 337.54971, "t": 148.55579, "r": 340.95242, "b": 154.29638999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "1", "bbox": {"l": 337.54971, "t": 148.55579, "r": 340.95242, "b": 154.29638999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 343.56262, "t": 148.93231000000003, "r": 398.91446, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "</TD><TD colspan=\"2\">", "bbox": {"l": 343.56262, "t": 148.93231000000003, "r": 398.91446, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 407.41718, "t": 148.93231000000003, "r": 421.58801, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "</TD>", "bbox": {"l": 407.41718, "t": 148.93231000000003, "r": 421.58801, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 322.30579, "t": 156.07232999999997, "r": 349.23022, "b": 160.85613999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "</TR><TR>", "bbox": {"l": 322.30579, "t": 156.07232999999997, "r": 349.23022, "b": 160.85613999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 322.30579, "t": 163.21234000000004, "r": 335.05988, "b": 167.99614999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "<TD>", "bbox": {"l": 322.30579, "t": 163.21234000000004, "r": 335.05988, "b": 167.99614999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 343.56155, "t": 163.21234000000004, "r": 374.73685, "b": 167.99614999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "</TD><TD>...", "bbox": {"l": 343.56155, "t": 163.21234000000004, "r": 374.73685, "b": 167.99614999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 322.30579, "t": 170.35235999999998, "r": 326.55716, "b": 175.13617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "...", "bbox": {"l": 322.30579, "t": 170.35235999999998, "r": 326.55716, "b": 175.13617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 323.51111, "t": 89.66967999999997, "r": 326.91382, "b": 95.41027999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "1", "bbox": {"l": 323.51111, "t": 89.66967999999997, "r": 326.91382, "b": 95.41027999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 323.71509, "t": 97.78887999999995, "r": 327.1178, "b": 103.52948000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "2", "bbox": {"l": 323.71509, "t": 97.78887999999995, "r": 327.1178, "b": 103.52948000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 323.71509, "t": 105.98969, "r": 327.1178, "b": 111.73029000000008, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "3", "bbox": {"l": 323.71509, "t": 105.98969, "r": 327.1178, "b": 111.73029000000008, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 401.4816, "t": 148.54625999999996, "r": 404.88431, "b": 154.28687000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "2", "bbox": {"l": 401.4816, "t": 148.54625999999996, "r": 404.88431, "b": 154.28687000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 337.6976, "t": 162.68451000000005, "r": 341.10031, "b": 168.42511000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "3", "bbox": {"l": 337.6976, "t": 162.68451000000005, "r": 341.10031, "b": 168.42511000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 454.46378, "t": 104.54584, "r": 457.86648999999994, "b": 110.28644000000008, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "3", "bbox": {"l": 454.46378, "t": 104.54584, "r": 457.86648999999994, "b": 110.28644000000008, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 493.32580999999993, "t": 91.09546, "r": 496.72852, "b": 96.83605999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "2", "bbox": {"l": 493.32580999999993, "t": 91.09546, "r": 496.72852, "b": 96.83605999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 454.08298, "t": 90.56879000000015, "r": 457.48569000000003, "b": 96.30939000000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "1", "bbox": {"l": 454.08298, "t": 90.56879000000015, "r": 457.48569000000003, "b": 96.30939000000001, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "caption", "id": 6, "page_no": 4, "cluster": {"id": 6, "label": "caption", "bbox": {"l": 50.111992, "t": 203.98577999999998, "r": 545.10846, "b": 224.96691999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9677652716636658, "cells": [{"id": 59, "text": "Figure 3:", "bbox": {"l": 50.112, "t": 204.10535000000004, "r": 86.883949, "b": 213.01189999999997, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "TableFormer", "bbox": {"l": 94.020996, "t": 203.98577999999998, "r": 149.85141, "b": 212.94214, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "takes in an image of the PDF and creates bounding box and HTML structure predictions that are", "bbox": {"l": 152.86099, "t": 204.10535000000004, "r": 545.10846, "b": 213.01189999999997, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "synchronized. The bounding boxes grabs the content from the PDF and inserts it in the structure.", "bbox": {"l": 50.111992, "t": 216.06035999999995, "r": 436.0134, "b": 224.96691999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 3: TableFormer takes in an image of the PDF and creates bounding box and HTML structure predictions that are synchronized. The bounding boxes grabs the content from the PDF and inserts it in the structure."}, {"label": "picture", "id": 5, "page_no": 4, "cluster": {"id": 5, "label": "picture", "bbox": {"l": 53.03328323364258, "t": 257.66534423828125, "r": 285.3731689453125, "b": 507.6688537597656, "coord_origin": "TOPLEFT"}, "confidence": 0.9724942445755005, "cells": [{"id": 63, "text": "Input Image", "bbox": {"l": 74.253464, "t": 258.21472000000006, "r": 101.75846, "b": 264.17474000000004, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "Tokenised Tags", "bbox": {"l": 122.29972, "t": 258.34520999999995, "r": 157.83972, "b": 264.30524, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "Multi-Head Attention", "bbox": {"l": 78.549347, "t": 371.38579999999996, "r": 125.68359000000001, "b": 377.04782, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "Add", "bbox": {"l": 78.513298, "t": 391.31857, "r": 84.644547, "b": 396.98059, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "& Normalisation", "bbox": {"l": 116.52705, "t": 391.31857, "r": 125.11079999999998, "b": 396.98059, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "Feed Forward Network", "bbox": {"l": 76.024773, "t": 424.45309, "r": 127.92327000000002, "b": 430.11511, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "Add", "bbox": {"l": 78.382828, "t": 444.88956, "r": 84.514076, "b": 450.55157, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "& Normalisation", "bbox": {"l": 116.39658, "t": 444.88956, "r": 124.98033, "b": 450.55157, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Linear", "bbox": {"l": 167.46945, "t": 462.44324, "r": 181.6292, "b": 468.10526, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "Softmax", "bbox": {"l": 165.61292, "t": 478.47107, "r": 184.43242, "b": 484.13309, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "CNN BACKBONE ENCODER", "bbox": {"l": 65.319511, "t": 324.26235999999994, "r": 132.9245, "b": 330.22235000000006, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "[30, 1, 2, 3, 4, \u2026 3, ", "bbox": {"l": 119.51457, "t": 269.66394, "r": 162.98782, "b": 274.72992, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "4, 5, 8, 31]", "bbox": {"l": 128.72858, "t": 274.91394, "r": 151.41083, "b": 279.97992, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "Positional ", "bbox": {"l": 60.434211999999995, "t": 338.95993, "r": 80.27021, "b": 344.26993, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "Encoding", "bbox": {"l": 60.598457, "t": 343.38605, "r": 78.854958, "b": 348.69604, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "Positional ", "bbox": {"l": 134.82877, "t": 293.37762, "r": 154.66476, "b": 298.68762, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "Encoding", "bbox": {"l": 134.99303, "t": 297.80370999999997, "r": 153.24953, "b": 303.11371, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "Add & Normalisation", "bbox": {"l": 150.55193, "t": 345.35861, "r": 197.14943, "b": 351.02063, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Add", "bbox": {"l": 150.55193, "t": 394.4234, "r": 156.68318, "b": 400.08542, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "& Normalisation", "bbox": {"l": 188.56567, "t": 394.4234, "r": 197.14943, "b": 400.08542, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "Multi-Head Attention", "bbox": {"l": 150.18539, "t": 375.66843, "r": 197.31964, "b": 381.33044, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "Add", "bbox": {"l": 150.55193, "t": 440.24847000000005, "r": 156.68318, "b": 445.91049, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "& Normalisation", "bbox": {"l": 188.56567, "t": 440.24847000000005, "r": 197.14943, "b": 445.91049, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Feed Forward Network", "bbox": {"l": 147.86377, "t": 422.09335, "r": 199.76227, "b": 427.75537, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Linear", "bbox": {"l": 241.56567000000004, "t": 314.26285000000007, "r": 255.72542, "b": 319.92487, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "Linear", "bbox": {"l": 241.91730000000004, "t": 361.36493, "r": 256.07706, "b": 367.02695, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "Attention", "bbox": {"l": 228.054, "t": 336.61929000000003, "r": 248.72363000000004, "b": 342.28131, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "Network", "bbox": {"l": 246.2919, "t": 336.61929000000003, "r": 269.39325, "b": 342.28131, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "MLP", "bbox": {"l": 228.44568000000004, "t": 405.14682, "r": 238.73892, "b": 410.80884, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Linear ", "bbox": {"l": 256.29767, "t": 405.2032500000001, "r": 271.77792, "b": 410.86526, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "Sigmoid", "bbox": {"l": 239.54543, "t": 382.21344, "r": 258.08942, "b": 387.87546, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "Transformer Encoder Network", "bbox": {"l": 54.14704100000001, "t": 384.87183, "r": 59.51152, "b": 449.78326, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "x2", "bbox": {"l": 54.235424, "t": 373.81232, "r": 59.30449699999999, "b": 378.45421999999996, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "Encoded Output", "bbox": {"l": 85.295891, "t": 484.53189, "r": 122.16431, "b": 490.36688, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "Encoded Output", "bbox": {"l": 229.66599, "t": 279.54607999999996, "r": 265.3194, "b": 285.45572000000004, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "Predicted Tags", "bbox": {"l": 157.17369, "t": 500.3031, "r": 190.41711, "b": 506.12943, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "Bounding Boxes & ", "bbox": {"l": 227.81598999999997, "t": 438.05542, "r": 270.78442, "b": 443.89206, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "Classification", "bbox": {"l": 233.70262, "t": 444.06183, "r": 263.51105, "b": 449.8904999999999, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "Transformer ", "bbox": {"l": 184.74655, "t": 293.39502, "r": 212.16055, "b": 298.75903, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "Decoder Network", "bbox": {"l": 178.91229, "t": 299.14502, "r": 216.74378999999996, "b": 304.50903, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "x4", "bbox": {"l": 194.24574, "t": 282.7822, "r": 198.89099, "b": 287.84817999999996, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "CELL BBOX DECODER", "bbox": {"l": 221.45587, "t": 271.86914, "r": 276.47089, "b": 277.82916, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "Masked Multi-Head ", "bbox": {"l": 151.65219, "t": 323.44241, "r": 197.29019, "b": 329.10443, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "Attention", "bbox": {"l": 163.43277, "t": 329.44241, "r": 184.19028, "b": 335.10443, "coord_origin": "TOPLEFT"}}], "children": [{"id": 69, "label": "text", "bbox": {"l": 74.253464, "t": 258.21472000000006, "r": 101.75846, "b": 264.17474000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "Input Image", "bbox": {"l": 74.253464, "t": 258.21472000000006, "r": 101.75846, "b": 264.17474000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 122.29972, "t": 258.34520999999995, "r": 157.83972, "b": 264.30524, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "Tokenised Tags", "bbox": {"l": 122.29972, "t": 258.34520999999995, "r": 157.83972, "b": 264.30524, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 78.549347, "t": 371.38579999999996, "r": 125.68359000000001, "b": 377.04782, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "Multi-Head Attention", "bbox": {"l": 78.549347, "t": 371.38579999999996, "r": 125.68359000000001, "b": 377.04782, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 78.513298, "t": 391.31857, "r": 84.644547, "b": 396.98059, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "Add", "bbox": {"l": 78.513298, "t": 391.31857, "r": 84.644547, "b": 396.98059, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 116.52705, "t": 391.31857, "r": 125.11079999999998, "b": 396.98059, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "& Normalisation", "bbox": {"l": 116.52705, "t": 391.31857, "r": 125.11079999999998, "b": 396.98059, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 76.024773, "t": 424.45309, "r": 127.92327000000002, "b": 430.11511, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "Feed Forward Network", "bbox": {"l": 76.024773, "t": 424.45309, "r": 127.92327000000002, "b": 430.11511, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 78.382828, "t": 444.88956, "r": 84.514076, "b": 450.55157, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "Add", "bbox": {"l": 78.382828, "t": 444.88956, "r": 84.514076, "b": 450.55157, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 116.39658, "t": 444.88956, "r": 124.98033, "b": 450.55157, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "& Normalisation", "bbox": {"l": 116.39658, "t": 444.88956, "r": 124.98033, "b": 450.55157, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 167.46945, "t": 462.44324, "r": 181.6292, "b": 468.10526, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "Linear", "bbox": {"l": 167.46945, "t": 462.44324, "r": 181.6292, "b": 468.10526, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 165.61292, "t": 478.47107, "r": 184.43242, "b": 484.13309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "Softmax", "bbox": {"l": 165.61292, "t": 478.47107, "r": 184.43242, "b": 484.13309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 65.319511, "t": 324.26235999999994, "r": 132.9245, "b": 330.22235000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "CNN BACKBONE ENCODER", "bbox": {"l": 65.319511, "t": 324.26235999999994, "r": 132.9245, "b": 330.22235000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 119.51457, "t": 269.66394, "r": 162.98782, "b": 274.72992, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "[30, 1, 2, 3, 4, \u2026 3, ", "bbox": {"l": 119.51457, "t": 269.66394, "r": 162.98782, "b": 274.72992, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 128.72858, "t": 274.91394, "r": 151.41083, "b": 279.97992, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "4, 5, 8, 31]", "bbox": {"l": 128.72858, "t": 274.91394, "r": 151.41083, "b": 279.97992, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 60.434211999999995, "t": 338.95993, "r": 80.27021, "b": 344.26993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "Positional ", "bbox": {"l": 60.434211999999995, "t": 338.95993, "r": 80.27021, "b": 344.26993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 60.598457, "t": 343.38605, "r": 78.854958, "b": 348.69604, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "Encoding", "bbox": {"l": 60.598457, "t": 343.38605, "r": 78.854958, "b": 348.69604, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 134.82877, "t": 293.37762, "r": 154.66476, "b": 298.68762, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "Positional ", "bbox": {"l": 134.82877, "t": 293.37762, "r": 154.66476, "b": 298.68762, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 134.99303, "t": 297.80370999999997, "r": 153.24953, "b": 303.11371, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "Encoding", "bbox": {"l": 134.99303, "t": 297.80370999999997, "r": 153.24953, "b": 303.11371, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 150.55193, "t": 345.35861, "r": 197.14943, "b": 351.02063, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "Add & Normalisation", "bbox": {"l": 150.55193, "t": 345.35861, "r": 197.14943, "b": 351.02063, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 150.55193, "t": 394.4234, "r": 156.68318, "b": 400.08542, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "Add", "bbox": {"l": 150.55193, "t": 394.4234, "r": 156.68318, "b": 400.08542, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 188.56567, "t": 394.4234, "r": 197.14943, "b": 400.08542, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "& Normalisation", "bbox": {"l": 188.56567, "t": 394.4234, "r": 197.14943, "b": 400.08542, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 150.18539, "t": 375.66843, "r": 197.31964, "b": 381.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "Multi-Head Attention", "bbox": {"l": 150.18539, "t": 375.66843, "r": 197.31964, "b": 381.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 150.55193, "t": 440.24847000000005, "r": 156.68318, "b": 445.91049, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "Add", "bbox": {"l": 150.55193, "t": 440.24847000000005, "r": 156.68318, "b": 445.91049, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 188.56567, "t": 440.24847000000005, "r": 197.14943, "b": 445.91049, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "& Normalisation", "bbox": {"l": 188.56567, "t": 440.24847000000005, "r": 197.14943, "b": 445.91049, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 147.86377, "t": 422.09335, "r": 199.76227, "b": 427.75537, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "Feed Forward Network", "bbox": {"l": 147.86377, "t": 422.09335, "r": 199.76227, "b": 427.75537, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 241.56567000000004, "t": 314.26285000000007, "r": 255.72542, "b": 319.92487, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "Linear", "bbox": {"l": 241.56567000000004, "t": 314.26285000000007, "r": 255.72542, "b": 319.92487, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 241.91730000000004, "t": 361.36493, "r": 256.07706, "b": 367.02695, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "Linear", "bbox": {"l": 241.91730000000004, "t": 361.36493, "r": 256.07706, "b": 367.02695, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 228.054, "t": 336.61929000000003, "r": 248.72363000000004, "b": 342.28131, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "Attention", "bbox": {"l": 228.054, "t": 336.61929000000003, "r": 248.72363000000004, "b": 342.28131, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 246.2919, "t": 336.61929000000003, "r": 269.39325, "b": 342.28131, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "Network", "bbox": {"l": 246.2919, "t": 336.61929000000003, "r": 269.39325, "b": 342.28131, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 228.44568000000004, "t": 405.14682, "r": 238.73892, "b": 410.80884, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "MLP", "bbox": {"l": 228.44568000000004, "t": 405.14682, "r": 238.73892, "b": 410.80884, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 256.29767, "t": 405.2032500000001, "r": 271.77792, "b": 410.86526, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "Linear ", "bbox": {"l": 256.29767, "t": 405.2032500000001, "r": 271.77792, "b": 410.86526, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 239.54543, "t": 382.21344, "r": 258.08942, "b": 387.87546, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "Sigmoid", "bbox": {"l": 239.54543, "t": 382.21344, "r": 258.08942, "b": 387.87546, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 54.14704100000001, "t": 384.87183, "r": 59.51152, "b": 449.78326, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "Transformer Encoder Network", "bbox": {"l": 54.14704100000001, "t": 384.87183, "r": 59.51152, "b": 449.78326, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 54.235424, "t": 373.81232, "r": 59.30449699999999, "b": 378.45421999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "x2", "bbox": {"l": 54.235424, "t": 373.81232, "r": 59.30449699999999, "b": 378.45421999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 85.295891, "t": 484.53189, "r": 122.16431, "b": 490.36688, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "Encoded Output", "bbox": {"l": 85.295891, "t": 484.53189, "r": 122.16431, "b": 490.36688, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 229.66599, "t": 279.54607999999996, "r": 265.3194, "b": 285.45572000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "Encoded Output", "bbox": {"l": 229.66599, "t": 279.54607999999996, "r": 265.3194, "b": 285.45572000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 157.17369, "t": 500.3031, "r": 190.41711, "b": 506.12943, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "Predicted Tags", "bbox": {"l": 157.17369, "t": 500.3031, "r": 190.41711, "b": 506.12943, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 227.81598999999997, "t": 438.05542, "r": 270.78442, "b": 443.89206, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "Bounding Boxes & ", "bbox": {"l": 227.81598999999997, "t": 438.05542, "r": 270.78442, "b": 443.89206, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 233.70262, "t": 444.06183, "r": 263.51105, "b": 449.8904999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "Classification", "bbox": {"l": 233.70262, "t": 444.06183, "r": 263.51105, "b": 449.8904999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 184.74655, "t": 293.39502, "r": 212.16055, "b": 298.75903, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "Transformer ", "bbox": {"l": 184.74655, "t": 293.39502, "r": 212.16055, "b": 298.75903, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 178.91229, "t": 299.14502, "r": 216.74378999999996, "b": 304.50903, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "Decoder Network", "bbox": {"l": 178.91229, "t": 299.14502, "r": 216.74378999999996, "b": 304.50903, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 194.24574, "t": 282.7822, "r": 198.89099, "b": 287.84817999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": "x4", "bbox": {"l": 194.24574, "t": 282.7822, "r": 198.89099, "b": 287.84817999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 221.45587, "t": 271.86914, "r": 276.47089, "b": 277.82916, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "CELL BBOX DECODER", "bbox": {"l": 221.45587, "t": 271.86914, "r": 276.47089, "b": 277.82916, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 151.65219, "t": 323.44241, "r": 197.29019, "b": 329.10443, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "Masked Multi-Head ", "bbox": {"l": 151.65219, "t": 323.44241, "r": 197.29019, "b": 329.10443, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 163.43277, "t": 329.44241, "r": 184.19028, "b": 335.10443, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": "Attention", "bbox": {"l": 163.43277, "t": 329.44241, "r": 184.19028, "b": 335.10443, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "caption", "id": 8, "page_no": 4, "cluster": {"id": 8, "label": "caption", "bbox": {"l": 50.112, "t": 527.7828099999999, "r": 286.36597, "b": 680.27094, "coord_origin": "TOPLEFT"}, "confidence": 0.8913407325744629, "cells": [{"id": 107, "text": "Figure 4: Given an input image of a table, the", "bbox": {"l": 50.112, "t": 527.90237, "r": 229.78752, "b": 536.80893, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "Encoder", "bbox": {"l": 231.787, "t": 527.7828099999999, "r": 267.76196, "b": 536.7392, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "pro-", "bbox": {"l": 269.76401, "t": 527.90237, "r": 286.36169, "b": 536.80893, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "duces fixed-length features that represent the input image.", "bbox": {"l": 50.112015, "t": 539.85738, "r": 286.36508, "b": 548.76393, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "The features are then passed to both the", "bbox": {"l": 50.112015, "t": 551.81337, "r": 205.84735, "b": 560.71992, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "Structure Decoder", "bbox": {"l": 208.01802, "t": 551.69382, "r": 286.36392, "b": 560.6501900000001, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "and", "bbox": {"l": 50.112015, "t": 563.76837, "r": 64.498009, "b": 572.67493, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "Cell BBox Decoder", "bbox": {"l": 68.165016, "t": 563.64882, "r": 151.31288, "b": 572.60519, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": ".", "bbox": {"l": 151.31302, "t": 563.76837, "r": 153.80367, "b": 572.67493, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "During training, the", "bbox": {"l": 160.41884, "t": 563.76837, "r": 241.93283000000002, "b": 572.67493, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "Structure", "bbox": {"l": 245.59502, "t": 563.64882, "r": 286.362, "b": 572.60519, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "Decoder", "bbox": {"l": 50.112015, "t": 575.60382, "r": 85.519089, "b": 584.5602, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "receives \u2018tokenized tags\u2019 of the HTML code that", "bbox": {"l": 88.623016, "t": 575.7233699999999, "r": 286.36072, "b": 584.6299300000001, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "represent the table structure. Afterwards, a transformer en-", "bbox": {"l": 50.112015, "t": 587.6783800000001, "r": 286.36511, "b": 596.58493, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "coder and decoder architecture is employed to produce fea-", "bbox": {"l": 50.112015, "t": 599.63338, "r": 286.36508, "b": 608.53993, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "tures that are received by a linear layer, and the", "bbox": {"l": 50.112015, "t": 611.58838, "r": 240.43756000000002, "b": 620.4949300000001, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "Cell BBox", "bbox": {"l": 243.19801, "t": 611.46883, "r": 286.36597, "b": 620.4252, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "Decoder. The linear layer is applied to the features to", "bbox": {"l": 50.112015, "t": 623.42482, "r": 286.36511, "b": 632.3812, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "predict the tags. Simultaneously, the Cell BBox Decoder", "bbox": {"l": 50.112015, "t": 635.37982, "r": 286.36508, "b": 644.3362, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "selects features referring to the data cells (\u2018", "bbox": {"l": 50.112015, "t": 647.45438, "r": 220.58205, "b": 656.36093, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "<", "bbox": {"l": 220.57802000000004, "t": 647.29497, "r": 228.32693, "b": 656.14175, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "td", "bbox": {"l": 228.32700999999997, "t": 647.45438, "r": 236.07791000000003, "b": 656.36093, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": ">", "bbox": {"l": 236.07802000000004, "t": 647.29497, "r": 243.82693, "b": 656.14175, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "\u2019, \u2018", "bbox": {"l": 243.82602, "t": 647.45438, "r": 255.29298000000003, "b": 656.36093, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "<", "bbox": {"l": 255.29102000000003, "t": 647.29497, "r": 263.03992, "b": 656.14175, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "\u2019) and", "bbox": {"l": 263.04001, "t": 647.45438, "r": 286.36246, "b": 656.36093, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "passes them through an attention network, an MLP, and a", "bbox": {"l": 50.112015, "t": 659.40938, "r": 286.36511, "b": 668.31594, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "linear layer to predict the bounding boxes.", "bbox": {"l": 50.112015, "t": 671.36438, "r": 218.46996, "b": 680.27094, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 4: Given an input image of a table, the Encoder produces fixed-length features that represent the input image. The features are then passed to both the Structure Decoder and Cell BBox Decoder . During training, the Structure Decoder receives \u2018tokenized tags\u2019 of the HTML code that represent the table structure. Afterwards, a transformer encoder and decoder architecture is employed to produce features that are received by a linear layer, and the Cell BBox Decoder. The linear layer is applied to the features to predict the tags. Simultaneously, the Cell BBox Decoder selects features referring to the data cells (\u2018 < td > \u2019, \u2018 < \u2019) and passes them through an attention network, an MLP, and a linear layer to predict the bounding boxes."}, {"label": "text", "id": 4, "page_no": 4, "cluster": {"id": 4, "label": "text", "bbox": {"l": 308.862, "t": 249.53441999999995, "r": 545.11505, "b": 294.3069499999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9831458330154419, "cells": [{"id": 135, "text": "forming classification, and adding an adaptive pooling", "bbox": {"l": 308.862, "t": 249.53441999999995, "r": 523.05786, "b": 258.44097999999997, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "layer", "bbox": {"l": 525.19983, "t": 249.53441999999995, "r": 545.11505, "b": 258.44097999999997, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "of size 28*28. ResNet by default downsamples the", "bbox": {"l": 308.862, "t": 261.49042, "r": 517.55847, "b": 270.39697, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "image", "bbox": {"l": 520.76642, "t": 261.49042, "r": 545.11499, "b": 270.39697, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "resolution by 32 and then the encoded image is provided", "bbox": {"l": 308.862, "t": 273.44537, "r": 534.80377, "b": 282.35196, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "to", "bbox": {"l": 537.36414, "t": 273.44537, "r": 545.11505, "b": 282.35196, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "both the", "bbox": {"l": 308.862, "t": 285.40039, "r": 341.24045, "b": 294.3069499999999, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "Structure Decoder", "bbox": {"l": 343.73099, "t": 285.49005, "r": 417.23508, "b": 294.07782000000003, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": ", and", "bbox": {"l": 417.23398, "t": 285.40039, "r": 436.60129, "b": 294.3069499999999, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "Cell BBox Decoder", "bbox": {"l": 439.09198, "t": 285.49005, "r": 516.56116, "b": 294.07782000000003, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": ".", "bbox": {"l": 516.56097, "t": 285.40039, "r": 519.05164, "b": 294.3069499999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "forming classification, and adding an adaptive pooling layer of size 28*28. ResNet by default downsamples the image resolution by 32 and then the encoded image is provided to both the Structure Decoder , and Cell BBox Decoder ."}, {"label": "text", "id": 1, "page_no": 4, "cluster": {"id": 1, "label": "text", "bbox": {"l": 308.86194, "t": 297.33981, "r": 545.11511, "b": 413.96182, "coord_origin": "TOPLEFT"}, "confidence": 0.9862009882926941, "cells": [{"id": 146, "text": "Structure Decoder.", "bbox": {"l": 320.81696, "t": 297.33981, "r": 400.86649, "b": 306.2962, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "The transformer architecture of", "bbox": {"l": 403.91394, "t": 297.45938, "r": 528.33685, "b": 306.36594, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "this", "bbox": {"l": 530.7179, "t": 297.45938, "r": 545.11383, "b": 306.36594, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "component is based on the work proposed in [31].", "bbox": {"l": 308.86194, "t": 309.41437, "r": 517.5285, "b": 318.32092, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "After", "bbox": {"l": 524.09387, "t": 309.41437, "r": 545.11493, "b": 318.32092, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "extensive experimentation, the", "bbox": {"l": 308.86194, "t": 321.36934999999994, "r": 432.35833999999994, "b": 330.27591, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "Structure Decoder", "bbox": {"l": 435.81995000000006, "t": 321.45901, "r": 510.29041, "b": 330.04678, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "is", "bbox": {"l": 513.97797, "t": 321.36934999999994, "r": 520.62305, "b": 330.27591, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "mod-", "bbox": {"l": 524.08008, "t": 321.36934999999994, "r": 545.11115, "b": 330.27591, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "eled as a transformer encoder with two encoder layers", "bbox": {"l": 308.86197, "t": 333.32434, "r": 527.76013, "b": 342.2309, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "and", "bbox": {"l": 530.729, "t": 333.32434, "r": 545.11499, "b": 342.2309, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "a transformer decoder made from a stack of 4 decoder", "bbox": {"l": 308.86197, "t": 345.27933, "r": 526.85352, "b": 354.18588, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "lay-", "bbox": {"l": 529.62311, "t": 345.27933, "r": 545.11493, "b": 354.18588, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "ers that comprise mainly of multi-head attention and", "bbox": {"l": 308.86197, "t": 357.23532, "r": 524.51245, "b": 366.14188, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "feed", "bbox": {"l": 527.96948, "t": 357.23532, "r": 545.11511, "b": 366.14188, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "forward layers.", "bbox": {"l": 308.86197, "t": 369.19031000000007, "r": 370.39096, "b": 378.09685999999994, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "This configuration uses fewer layers", "bbox": {"l": 377.44449, "t": 369.19031000000007, "r": 526.91339, "b": 378.09685999999994, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "and", "bbox": {"l": 530.72906, "t": 369.19031000000007, "r": 545.11505, "b": 378.09685999999994, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "heads in comparison to networks applied to other", "bbox": {"l": 308.86197, "t": 381.14529000000005, "r": 505.46395999999993, "b": 390.05185, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "problems", "bbox": {"l": 508.03430000000003, "t": 381.14529000000005, "r": 545.11511, "b": 390.05185, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "(e.g. \u201cScene Understanding\u201d, \u201cImage Captioning\u201d),", "bbox": {"l": 308.86197, "t": 393.10028, "r": 517.68799, "b": 402.00684, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "some-", "bbox": {"l": 520.76642, "t": 393.10028, "r": 545.11499, "b": 402.00684, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "thing which we relate to the simplicity of table images.", "bbox": {"l": 308.86197, "t": 405.05526999999995, "r": 528.01935, "b": 413.96182, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Structure Decoder. The transformer architecture of this component is based on the work proposed in [31]. After extensive experimentation, the Structure Decoder is modeled as a transformer encoder with two encoder layers and a transformer decoder made from a stack of 4 decoder layers that comprise mainly of multi-head attention and feed forward layers. This configuration uses fewer layers and heads in comparison to networks applied to other problems (e.g. \u201cScene Understanding\u201d, \u201cImage Captioning\u201d), something which we relate to the simplicity of table images."}, {"label": "text", "id": 3, "page_no": 4, "cluster": {"id": 3, "label": "text", "bbox": {"l": 308.86197, "t": 417.11426, "r": 545.11511, "b": 545.57271, "coord_origin": "TOPLEFT"}, "confidence": 0.9851906895637512, "cells": [{"id": 169, "text": "The transformer encoder receives an encoded", "bbox": {"l": 320.81696, "t": 417.11426, "r": 515.49609, "b": 426.02081, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "image", "bbox": {"l": 520.7663, "t": 417.11426, "r": 545.11487, "b": 426.02081, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "from the", "bbox": {"l": 308.86197, "t": 429.0692399999999, "r": 343.72107, "b": 437.9758, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "CNN Backbone Network", "bbox": {"l": 347.03796, "t": 429.15891, "r": 446.45471000000003, "b": 437.74667, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "and refines it", "bbox": {"l": 449.93996999999996, "t": 429.0692399999999, "r": 503.06055000000003, "b": 437.9758, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "through", "bbox": {"l": 506.37808, "t": 429.0692399999999, "r": 537.3717, "b": 437.9758, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "a", "bbox": {"l": 540.68927, "t": 429.0692399999999, "r": 545.11267, "b": 437.9758, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "multi-head dot-product attention layer, followed by a", "bbox": {"l": 308.86197, "t": 441.02423, "r": 522.78894, "b": 449.93079, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "Feed", "bbox": {"l": 525.7478, "t": 441.02423, "r": 545.11511, "b": 449.93079, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "Forward Network.", "bbox": {"l": 308.86197, "t": 452.97922, "r": 384.14929, "b": 461.88577, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "During training, the transformer", "bbox": {"l": 393.37466, "t": 452.97922, "r": 527.84985, "b": 461.88577, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "de-", "bbox": {"l": 532.39282, "t": 452.97922, "r": 545.11505, "b": 461.88577, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "coder receives as input the output feature produced by", "bbox": {"l": 308.86197, "t": 464.93521, "r": 529.7627, "b": 473.84177, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "the", "bbox": {"l": 532.94073, "t": 464.93521, "r": 545.11505, "b": 473.84177, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "transformer encoder, and the tokenized input of the", "bbox": {"l": 308.86197, "t": 476.8902, "r": 514.17126, "b": 485.79675, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "HTML", "bbox": {"l": 516.89105, "t": 476.8902, "r": 545.11511, "b": 485.79675, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": "ground-truth tags. Using a stack of multi-head attention", "bbox": {"l": 308.86197, "t": 488.84518, "r": 527.63068, "b": 497.75174, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "lay-", "bbox": {"l": 529.62317, "t": 488.84518, "r": 545.11499, "b": 497.75174, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "ers, different aspects of the tag sequence could be", "bbox": {"l": 308.86197, "t": 500.80017, "r": 508.3630999999999, "b": 509.70673, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": "inferred.", "bbox": {"l": 511.09286000000003, "t": 500.80017, "r": 545.11511, "b": 509.70673, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "This is achieved by each attention head on a layer operating", "bbox": {"l": 308.86197, "t": 512.7551599999999, "r": 545.11499, "b": 521.6617100000001, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "in a different subspace, and then combining altogether their", "bbox": {"l": 308.86197, "t": 524.71115, "r": 545.11511, "b": 533.61771, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "attention score.", "bbox": {"l": 308.86197, "t": 536.66615, "r": 369.73349, "b": 545.57271, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The transformer encoder receives an encoded image from the CNN Backbone Network and refines it through a multi-head dot-product attention layer, followed by a Feed Forward Network. During training, the transformer decoder receives as input the output feature produced by the transformer encoder, and the tokenized input of the HTML ground-truth tags. Using a stack of multi-head attention layers, different aspects of the tag sequence could be inferred. This is achieved by each attention head on a layer operating in a different subspace, and then combining altogether their attention score."}, {"label": "text", "id": 0, "page_no": 4, "cluster": {"id": 0, "label": "text", "bbox": {"l": 308.86194, "t": 548.6046, "r": 545.11511, "b": 653.27271, "coord_origin": "TOPLEFT"}, "confidence": 0.9869195818901062, "cells": [{"id": 192, "text": "Cell BBox Decoder.", "bbox": {"l": 320.81696, "t": 548.6046, "r": 404.76184, "b": 557.56097, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "Our architecture allows to simul-", "bbox": {"l": 410.34094, "t": 548.72415, "r": 545.11505, "b": 557.63071, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "taneously predict HTML tags and bounding boxes for each", "bbox": {"l": 308.86194, "t": 560.68015, "r": 545.11493, "b": 569.5867000000001, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "table cell without the need of a separate object detector end", "bbox": {"l": 308.86194, "t": 572.6351500000001, "r": 545.11511, "b": 581.5417, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "to end. This approach is inspired by DETR [1] which em-", "bbox": {"l": 308.86194, "t": 584.59015, "r": 545.11493, "b": 593.4967, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "ploys a Transformer Encoder, and Decoder that looks for", "bbox": {"l": 308.86194, "t": 596.54515, "r": 545.11499, "b": 605.45171, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "a specific number of object queries (potential object detec-", "bbox": {"l": 308.86194, "t": 608.50015, "r": 545.11505, "b": 617.40671, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "tions). As our model utilizes a transformer architecture, the", "bbox": {"l": 308.86194, "t": 620.45515, "r": 545.11505, "b": 629.36171, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "hidden state of the", "bbox": {"l": 308.86194, "t": 632.41115, "r": 381.67859, "b": 641.3177000000001, "coord_origin": "TOPLEFT"}}, {"id": 201, "text": "<", "bbox": {"l": 383.99695, "t": 632.25174, "r": 391.74585, "b": 641.09853, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": "td", "bbox": {"l": 391.74594, "t": 632.41115, "r": 399.49686, "b": 641.3177000000001, "coord_origin": "TOPLEFT"}}, {"id": 203, "text": ">", "bbox": {"l": 399.49695, "t": 632.25174, "r": 407.24585, "b": 641.09853, "coord_origin": "TOPLEFT"}}, {"id": 204, "text": "\u2019 and \u2018", "bbox": {"l": 407.24594, "t": 632.41115, "r": 432.90958, "b": 641.3177000000001, "coord_origin": "TOPLEFT"}}, {"id": 205, "text": "<", "bbox": {"l": 432.90792999999996, "t": 632.25174, "r": 440.65683000000007, "b": 641.09853, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": "\u2019 HTML structure tags be-", "bbox": {"l": 440.65691999999996, "t": 632.41115, "r": 545.11475, "b": 641.3177000000001, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": "come the object query.", "bbox": {"l": 308.86194, "t": 644.3661500000001, "r": 398.96371, "b": 653.27271, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Cell BBox Decoder. Our architecture allows to simultaneously predict HTML tags and bounding boxes for each table cell without the need of a separate object detector end to end. This approach is inspired by DETR [1] which employs a Transformer Encoder, and Decoder that looks for a specific number of object queries (potential object detections). As our model utilizes a transformer architecture, the hidden state of the < td > \u2019 and \u2018 < \u2019 HTML structure tags become the object query."}, {"label": "text", "id": 2, "page_no": 4, "cluster": {"id": 2, "label": "text", "bbox": {"l": 308.86194, "t": 656.42516, "r": 545.11505, "b": 713.151726, "coord_origin": "TOPLEFT"}, "confidence": 0.9852352142333984, "cells": [{"id": 208, "text": "The encoding generated by the", "bbox": {"l": 320.81693, "t": 656.42516, "r": 444.34316999999993, "b": 665.33172, "coord_origin": "TOPLEFT"}}, {"id": 209, "text": "CNN Backbone Network", "bbox": {"l": 447.00591999999995, "t": 656.51482, "r": 545.1076, "b": 665.10258, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": "along with the features acquired for every data cell from the", "bbox": {"l": 308.86194, "t": 668.38016, "r": 545.11505, "b": 677.2867200000001, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "Transformer Decoder are then passed to the attention net-", "bbox": {"l": 308.86194, "t": 680.33516, "r": 545.11505, "b": 689.24172, "coord_origin": "TOPLEFT"}}, {"id": 212, "text": "work. The attention network takes both inputs and learns to", "bbox": {"l": 308.86194, "t": 692.290161, "r": 545.11505, "b": 701.196724, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "provide an attention weighted encoding. This weighted at-", "bbox": {"l": 308.86194, "t": 704.245163, "r": 545.11505, "b": 713.151726, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The encoding generated by the CNN Backbone Network along with the features acquired for every data cell from the Transformer Decoder are then passed to the attention network. The attention network takes both inputs and learns to provide an attention weighted encoding. This weighted at-"}], "headers": [{"label": "page_footer", "id": 9, "page_no": 4, "cluster": {"id": 9, "label": "page_footer", "bbox": {"l": 295.12094, "t": 734.13316, "r": 300.10223, "b": 743.039722, "coord_origin": "TOPLEFT"}, "confidence": 0.8719564080238342, "cells": [{"id": 214, "text": "5", "bbox": {"l": 295.12094, "t": 734.13316, "r": 300.10223, "b": 743.039722, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5"}]}}, {"page_no": 5, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "tention encoding is then multiplied to the encoded image to", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 286.36514, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "produce a feature for each table cell. Notice that this is dif-", "bbox": {"l": 50.112, "t": 87.16339000000005, "r": 286.36508, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "ferent than the typical object detection problem where im-", "bbox": {"l": 50.112, "t": 99.11841000000004, "r": 286.36508, "b": 108.02495999999985, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "balances between the number of detections and the amount", "bbox": {"l": 50.112, "t": 111.07343000000003, "r": 286.36508, "b": 119.97997999999984, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "of objects may exist. In our case, we know up front that", "bbox": {"l": 50.112, "t": 123.02844000000005, "r": 286.36508, "b": 131.93499999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "the produced detections always match with the table cells", "bbox": {"l": 50.112, "t": 134.98443999999995, "r": 286.36514, "b": 143.89099, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "in number and correspondence.", "bbox": {"l": 50.112, "t": 146.93944999999997, "r": 175.16254, "b": 155.84600999999998, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "The output features for each table cell are then fed", "bbox": {"l": 62.067001, "t": 159.62445000000002, "r": 286.36496, "b": 168.53101000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "into the feed-forward network (FFN). The FFN consists", "bbox": {"l": 50.112, "t": 171.58043999999995, "r": 286.36511, "b": 180.48699999999997, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "of a Multi-Layer Perceptron (3 layers with ReLU activa-", "bbox": {"l": 50.112, "t": 183.53545999999994, "r": 286.36511, "b": 192.44201999999996, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "tion function) that predicts the normalized coordinates for", "bbox": {"l": 50.112, "t": 195.49048000000005, "r": 286.36511, "b": 204.39702999999997, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "the bounding box of each table cell. Finally, the predicted", "bbox": {"l": 50.112, "t": 207.44550000000004, "r": 286.36511, "b": 216.35204999999996, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "bounding boxes are classified based on whether they are", "bbox": {"l": 50.112, "t": 219.40051000000005, "r": 286.36511, "b": 228.30706999999995, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "empty or not using a linear layer.", "bbox": {"l": 50.112, "t": 231.35650999999996, "r": 181.54855, "b": 240.26306, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Loss Functions.", "bbox": {"l": 62.067001, "t": 243.92193999999995, "r": 129.21492, "b": 252.87829999999997, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "We formulate a multi-task loss Eq. 2", "bbox": {"l": 134.451, "t": 244.04150000000004, "r": 286.36078, "b": 252.94806000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "to train our network. The Cross-Entropy loss (denoted as", "bbox": {"l": 50.112007, "t": 255.99652000000003, "r": 286.36511, "b": 264.90308000000005, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "l$_{s}$", "bbox": {"l": 50.112007, "t": 267.79309, "r": 56.84528, "b": 276.63989000000004, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": ") is used to train the", "bbox": {"l": 57.343006, "t": 267.95250999999996, "r": 135.39996, "b": 276.85907, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Structure Decoder", "bbox": {"l": 137.735, "t": 268.04218000000003, "r": 211.07965, "b": 276.62994000000003, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "which predicts the", "bbox": {"l": 213.63699, "t": 267.95250999999996, "r": 286.36395, "b": 276.85907, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "structure tokens. As for the", "bbox": {"l": 50.112, "t": 279.90747, "r": 158.82388, "b": 288.81406, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "Cell BBox Decoder", "bbox": {"l": 161.31799, "t": 279.99712999999997, "r": 238.79712, "b": 288.58493, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "it is trained", "bbox": {"l": 241.521, "t": 279.90747, "r": 286.36264, "b": 288.81406, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "with a combination of losses denoted as", "bbox": {"l": 50.112, "t": 291.86249, "r": 211.3766, "b": 300.76904, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "l$_{box}$", "bbox": {"l": 214.271, "t": 291.70309, "r": 229.19780000000003, "b": 300.54987, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": ".", "bbox": {"l": 229.696, "t": 291.86249, "r": 232.18665000000001, "b": 300.76904, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "l$_{box}$", "bbox": {"l": 236.49001, "t": 291.70309, "r": 251.41681000000003, "b": 300.54987, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "consists", "bbox": {"l": 254.81099999999998, "t": 291.86249, "r": 286.36255, "b": 300.76904, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "of the generally used", "bbox": {"l": 50.112, "t": 303.81747, "r": 137.45412, "b": 312.72403, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "l$_{1}$", "bbox": {"l": 141.298, "t": 303.65808, "r": 148.24258, "b": 312.50485, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "loss for object detection and the", "bbox": {"l": 152.58601, "t": 303.81747, "r": 286.36377, "b": 312.72403, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "IoU loss (", "bbox": {"l": 50.112015, "t": 315.77245999999997, "r": 89.683464, "b": 324.67902, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "l$_{iou}$", "bbox": {"l": 89.68602, "t": 315.61307, "r": 104.12046, "b": 324.45984, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": ") to be scale invariant as explained in [25]. In", "bbox": {"l": 104.61802, "t": 315.77245999999997, "r": 286.36572, "b": 324.67902, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "comparison to DETR, we do not use the Hungarian algo-", "bbox": {"l": 50.112019, "t": 327.72845, "r": 286.36511, "b": 336.6350100000001, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "rithm [15] to match the predicted bounding boxes with the", "bbox": {"l": 50.112019, "t": 339.68344, "r": 286.36508, "b": 348.59, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "ground-truth boxes, as we have already achieved a one-to-", "bbox": {"l": 50.112019, "t": 351.63843, "r": 286.36511, "b": 360.54498, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "one match through two steps: 1) Our token input sequence", "bbox": {"l": 50.112019, "t": 363.59341, "r": 286.36508, "b": 372.49996999999996, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "is naturally ordered, therefore the hidden states of the table", "bbox": {"l": 50.112019, "t": 375.5484, "r": 286.36511, "b": 384.45496, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "data cells are also in order when they are provided as in-", "bbox": {"l": 50.112019, "t": 387.50339, "r": 286.36514, "b": 396.40994, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "put to the", "bbox": {"l": 50.112019, "t": 399.45938, "r": 88.68721, "b": 408.36594, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "Cell BBox Decoder", "bbox": {"l": 91.646019, "t": 399.54904, "r": 170.0517, "b": 408.13681, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": ", and 2) Our bounding boxes", "bbox": {"l": 170.05103, "t": 399.45938, "r": 286.36438, "b": 408.36594, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "generation mechanism (see Sec.", "bbox": {"l": 50.112022, "t": 411.41437, "r": 181.96703, "b": 420.32092, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "3)", "bbox": {"l": 189.09029, "t": 411.41437, "r": 197.74918, "b": 420.32092, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "ensures a one-to-one", "bbox": {"l": 200.34789, "t": 411.41437, "r": 286.36511, "b": 420.32092, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "mapping between the cell content and its bounding box for", "bbox": {"l": 50.112022, "t": 423.36934999999994, "r": 286.36511, "b": 432.27591, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "all post-processed datasets.", "bbox": {"l": 50.112022, "t": 435.32434, "r": 158.2959, "b": 444.2309, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "The loss used to train the TableFormer can be defined as", "bbox": {"l": 62.067024, "t": 448.01035, "r": 286.36499, "b": 456.9169, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "following:", "bbox": {"l": 50.112022, "t": 459.96533, "r": 91.377113, "b": 468.87189, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "l$_{box}$", "bbox": {"l": 125.71502, "t": 493.28094, "r": 140.64182, "b": 502.12772, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "=", "bbox": {"l": 143.90701, "t": 493.28094, "r": 151.65593, "b": 502.12772, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "\u03bb$_{iou}$l$_{iou}$", "bbox": {"l": 154.42302, "t": 493.28094, "r": 186.62846, "b": 502.12772, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "+", "bbox": {"l": 189.34003, "t": 493.28094, "r": 197.08894, "b": 502.12772, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "\u03bb$_{l}$$_{1}$", "bbox": {"l": 199.30302, "t": 493.28094, "r": 211.64659, "b": 502.12772, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "l", "bbox": {"l": 124.33002, "t": 508.22495, "r": 127.30286, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "=", "bbox": {"l": 130.26602, "t": 508.22495, "r": 138.01494, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "\u03bbl$_{s}$", "bbox": {"l": 140.78203, "t": 508.22495, "r": 153.32629, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "+ (1", "bbox": {"l": 156.03903, "t": 508.22495, "r": 174.85541, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "\u2212", "bbox": {"l": 177.07103, "t": 507.66702, "r": 184.81995, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "\u03bb", "bbox": {"l": 187.03304, "t": 508.22495, "r": 192.84422, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": ")", "bbox": {"l": 192.84503, "t": 508.22495, "r": 196.71948, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "l$_{box}$", "bbox": {"l": 196.71902, "t": 508.22495, "r": 211.64583, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "(1)", "bbox": {"l": 274.74603, "t": 501.01132, "r": 286.36243, "b": 509.91788, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "where", "bbox": {"l": 50.11203, "t": 531.30933, "r": 74.450661, "b": 540.21588, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "\u03bb", "bbox": {"l": 76.941032, "t": 531.14993, "r": 82.75222, "b": 539.9967, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "\u2208", "bbox": {"l": 85.520035, "t": 530.5920100000001, "r": 92.162102, "b": 539.9967, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "[0, 1], and", "bbox": {"l": 94.653038, "t": 531.30933, "r": 135.59932, "b": 540.21588, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "\u03bb$_{iou}$, \u03bb$_{l}$$_{1}$", "bbox": {"l": 138.09004, "t": 531.14993, "r": 172.63162, "b": 539.9967, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "\u2208$_{R}$", "bbox": {"l": 175.89705, "t": 530.5920100000001, "r": 192.50104, "b": 539.9967, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "are hyper-parameters.", "bbox": {"l": 194.99205, "t": 531.30933, "r": 281.59692, "b": 540.21588, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "5.", "bbox": {"l": 50.112045, "t": 555.91689, "r": 57.92831799999999, "b": 566.66461, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "Experimental Results", "bbox": {"l": 68.350014, "t": 555.91689, "r": 171.98335, "b": 566.66461, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "5.1.", "bbox": {"l": 50.112045, "t": 576.26433, "r": 64.693237, "b": 586.1163799999999, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "Implementation Details", "bbox": {"l": 74.414032, "t": 576.26433, "r": 179.17502, "b": 586.1163799999999, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "TableFormer uses ResNet-18 as the", "bbox": {"l": 62.067047, "t": 595.73433, "r": 202.97806, "b": 604.64088, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "CNN Backbone Net-", "bbox": {"l": 205.38405, "t": 595.82399, "r": 286.36008, "b": 604.41174, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "work", "bbox": {"l": 50.112045, "t": 607.77899, "r": 70.037247, "b": 616.3667399999999, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": ". The input images are resized to 448*448 pixels and", "bbox": {"l": 70.037048, "t": 607.68933, "r": 286.36496, "b": 616.59589, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "the feature map has a dimension of 28*28. Additionally, we", "bbox": {"l": 50.112049, "t": 619.64433, "r": 286.36517, "b": 628.55089, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "enforce the following input constraints:", "bbox": {"l": 50.112049, "t": 631.60033, "r": 207.03294, "b": 640.50688, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "Image width and height", "bbox": {"l": 91.661049, "t": 654.54532, "r": 186.01683, "b": 663.45187, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "\u2264", "bbox": {"l": 188.50705, "t": 653.828, "r": 196.25597, "b": 663.2327, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "1024 pixels", "bbox": {"l": 198.74605, "t": 654.54532, "r": 244.81310999999997, "b": 663.45187, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "Structural tags length", "bbox": {"l": 101.01604, "t": 669.48932, "r": 186.24606, "b": 678.39588, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "\u2264", "bbox": {"l": 188.73605, "t": 668.77201, "r": 196.48497, "b": 678.1767, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "512 tokens.", "bbox": {"l": 198.97505, "t": 669.48932, "r": 244.81296999999998, "b": 678.39588, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "(2)", "bbox": {"l": 274.74606, "t": 662.11731, "r": 286.36246, "b": 671.02388, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "Although input constraints are used also by other methods,", "bbox": {"l": 50.112061, "t": 692.290314, "r": 286.36514, "b": 701.196877, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "such as EDD, ours are less restrictive due to the improved", "bbox": {"l": 50.112061, "t": 704.245316, "r": 286.36514, "b": 713.151878, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "runtime performance and lower memory footprint of Table-", "bbox": {"l": 308.86206, "t": 75.20830999999998, "r": 545.11523, "b": 84.11487, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Former.", "bbox": {"l": 308.86206, "t": 87.16332999999997, "r": 339.98523, "b": 96.06988999999999, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "This allows to utilize input samples with longer", "bbox": {"l": 346.88931, "t": 87.16332999999997, "r": 545.11523, "b": 96.06988999999999, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "sequences and images with larger dimensions.", "bbox": {"l": 308.86206, "t": 99.11835000000008, "r": 492.96097, "b": 108.0249, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "The Transformer Encoder consists of two \u201cTransformer", "bbox": {"l": 320.81705, "t": 116.22937000000002, "r": 545.11499, "b": 125.13593000000003, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "Encoder Layers\u201d, with an input feature size of 512, feed", "bbox": {"l": 308.86206, "t": 128.18439, "r": 545.11517, "b": 137.09094000000005, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "forward network of 1024, and 4 attention heads. As for the", "bbox": {"l": 308.86206, "t": 140.13940000000002, "r": 545.11505, "b": 149.04596000000004, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "Transformer Decoder it is composed of four \u201cTransformer", "bbox": {"l": 308.86206, "t": 152.09442, "r": 545.11511, "b": 161.00098000000003, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "Decoder Layers\u201d with similar input and output dimensions", "bbox": {"l": 308.86206, "t": 164.04944, "r": 545.11517, "b": 172.95599000000004, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "as the \u201cTransformer Encoder Layers\u201d.", "bbox": {"l": 308.86206, "t": 176.00543000000005, "r": 467.21756000000005, "b": 184.91198999999995, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "Even though our", "bbox": {"l": 475.43671, "t": 176.00543000000005, "r": 545.11511, "b": 184.91198999999995, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "model uses fewer layers and heads than the default imple-", "bbox": {"l": 308.86206, "t": 187.96045000000004, "r": 545.11511, "b": 196.86699999999996, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "mentation parameters, our extensive experimentation has", "bbox": {"l": 308.86206, "t": 199.91547000000003, "r": 545.11511, "b": 208.82201999999995, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "proved this setup to be more suitable for table images. We", "bbox": {"l": 308.86206, "t": 211.87048000000004, "r": 545.11517, "b": 220.77704000000006, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "attribute this finding to the inherent design of table im-", "bbox": {"l": 308.86206, "t": 223.82550000000003, "r": 545.11511, "b": 232.73206000000005, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "ages, which contain mostly lines and text, unlike the more", "bbox": {"l": 308.86206, "t": 235.78052000000002, "r": 545.11511, "b": 244.68706999999995, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "elaborate content present in other scopes (e.g. the COCO", "bbox": {"l": 308.86206, "t": 247.73650999999995, "r": 545.11523, "b": 256.64306999999997, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "dataset).", "bbox": {"l": 308.86206, "t": 259.69152999999994, "r": 342.3364, "b": 268.59808, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "Moreover, we have added ResNet blocks to the", "bbox": {"l": 348.95157, "t": 259.69152999999994, "r": 545.11517, "b": 268.59808, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "inputs of the Structure Decoder and Cell BBox Decoder.", "bbox": {"l": 308.86206, "t": 271.64655000000005, "r": 545.11517, "b": 280.55310000000003, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "This prevents a decoder having a stronger influence over the", "bbox": {"l": 308.86206, "t": 283.6015300000001, "r": 545.1153, "b": 292.50809, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "learned weights which would damage the other prediction", "bbox": {"l": 308.86206, "t": 295.55652, "r": 545.11511, "b": 304.46307, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "task (structure vs bounding boxes), but learn task specific", "bbox": {"l": 308.86206, "t": 307.51151, "r": 545.11511, "b": 316.41806, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "weights instead. Lastly our dropout layers are set to 0.5.", "bbox": {"l": 308.86206, "t": 319.4674999999999, "r": 532.48267, "b": 328.37405, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "For training, TableFormer is trained with 3 Adam opti-", "bbox": {"l": 320.81705, "t": 336.57751, "r": 545.11499, "b": 345.48407000000003, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "mizers, each one for the", "bbox": {"l": 308.86206, "t": 348.5325000000001, "r": 403.7359, "b": 357.43906, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "CNN Backbone Network", "bbox": {"l": 406.07605, "t": 348.62216, "r": 503.54016, "b": 357.20993, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": ",", "bbox": {"l": 503.53906, "t": 348.5325000000001, "r": 506.02972, "b": 357.43906, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "Structure", "bbox": {"l": 508.40004999999996, "t": 348.62216, "r": 545.11224, "b": 357.20993, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "Decoder", "bbox": {"l": 308.86206, "t": 360.57715, "r": 343.1633, "b": 369.16492000000005, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": ", and", "bbox": {"l": 343.16306, "t": 360.48749, "r": 362.2016, "b": 369.39404, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Cell BBox Decoder", "bbox": {"l": 364.28604, "t": 360.57715, "r": 440.93829, "b": 369.16492000000005, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": ". Taking the PubTabNet as", "bbox": {"l": 440.93903, "t": 360.48749, "r": 545.10797, "b": 369.39404, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "an example for our parameter set up, the initializing learn-", "bbox": {"l": 308.86203, "t": 372.44247, "r": 545.11511, "b": 381.34903, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "ing rate is 0.001 for 12 epochs with a batch size of 24, and", "bbox": {"l": 308.86203, "t": 384.3984699999999, "r": 545.11517, "b": 393.30502, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "\u03bb", "bbox": {"l": 308.86203, "t": 396.19406000000004, "r": 314.67322, "b": 405.04083, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "set to 0.5.", "bbox": {"l": 318.65802, "t": 396.35345, "r": 360.39139, "b": 405.2600100000001, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "Afterwards, we reduce the learning rate to", "bbox": {"l": 367.96295, "t": 396.35345, "r": 545.10803, "b": 405.2600100000001, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "0.0001, the batch size to 18 and train for 12 more epochs or", "bbox": {"l": 308.86203, "t": 408.30844, "r": 545.11511, "b": 417.215, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "convergence.", "bbox": {"l": 308.86203, "t": 420.26343, "r": 360.9664, "b": 429.16998, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "TableFormer is implemented with PyTorch and Torchvi-", "bbox": {"l": 320.81702, "t": 437.37441999999993, "r": 545.11499, "b": 446.28098, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "sion libraries [22].", "bbox": {"l": 308.86203, "t": 449.32941, "r": 384.62759, "b": 458.23596, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "To speed up the inference, the image", "bbox": {"l": 391.37228, "t": 449.32941, "r": 545.11511, "b": 458.23596, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "undergoes a single forward pass through the", "bbox": {"l": 308.86203, "t": 461.28439, "r": 494.00693000000007, "b": 470.19095, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "CNN Back-", "bbox": {"l": 498.07803, "t": 461.37405, "r": 545.11145, "b": 469.96182, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "bone Network", "bbox": {"l": 308.86203, "t": 473.32904, "r": 364.44336, "b": 481.91681, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "and transformer encoder. This eliminates the", "bbox": {"l": 367.06104, "t": 473.23938, "r": 545.11267, "b": 482.14594, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "overhead of generating the same features for each decoding", "bbox": {"l": 308.86203, "t": 485.19437, "r": 545.11511, "b": 494.10092, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "step. Similarly, we employ a \u2019caching\u2019 technique to preform", "bbox": {"l": 308.86203, "t": 497.14935, "r": 545.11523, "b": 506.05591, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "faster autoregressive decoding. This is achieved by storing", "bbox": {"l": 308.86203, "t": 509.10535, "r": 545.11511, "b": 518.0119, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "the features of decoded tokens so we can reuse them for", "bbox": {"l": 308.86203, "t": 521.06033, "r": 545.11517, "b": 529.9668899999999, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "each time step. Therefore, we only compute the attention", "bbox": {"l": 308.86203, "t": 533.01532, "r": 545.11517, "b": 541.9218900000001, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "for each new tag.", "bbox": {"l": 308.86203, "t": 544.97034, "r": 377.21548, "b": 553.87689, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "5.2.", "bbox": {"l": 308.86203, "t": 579.55432, "r": 323.9046, "b": 589.40637, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "Generalization", "bbox": {"l": 333.93301, "t": 579.55432, "r": 397.44281, "b": 589.40637, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "TableFormer is evaluated on three major publicly avail-", "bbox": {"l": 320.81702, "t": 603.44933, "r": 545.11493, "b": 612.3558800000001, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "able datasets of different nature to prove the generalization", "bbox": {"l": 308.86203, "t": 615.40433, "r": 545.11511, "b": 624.31088, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "and effectiveness of our model. The datasets used for eval-", "bbox": {"l": 308.86203, "t": 627.35933, "r": 545.11517, "b": 636.26588, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "uation are the PubTabNet, FinTabNet and TableBank which", "bbox": {"l": 308.86203, "t": 639.31433, "r": 545.11511, "b": 648.22089, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "stem from the scientific, financial and general domains re-", "bbox": {"l": 308.86203, "t": 651.27032, "r": 545.11517, "b": 660.17688, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "spectively.", "bbox": {"l": 308.86203, "t": 663.22533, "r": 350.70493, "b": 672.13189, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "We also share our baseline results on the challenging", "bbox": {"l": 320.81702, "t": 680.33533, "r": 545.11505, "b": 689.24189, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "SynthTabNet dataset.", "bbox": {"l": 308.86203, "t": 692.290329, "r": 396.21411, "b": 701.196892, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "Throughout our experiments, the", "bbox": {"l": 406.40585, "t": 692.290329, "r": 545.11523, "b": 701.196892, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "same parameters stated in Sec. 5.1 are utilized.", "bbox": {"l": 308.86203, "t": 704.246323, "r": 495.93982, "b": 713.152893, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "6", "bbox": {"l": 295.12103, "t": 734.133327, "r": 300.10233, "b": 743.03989, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 5, "label": "text", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 286.36514, "b": 155.84600999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.9868090152740479, "cells": [{"id": 0, "text": "tention encoding is then multiplied to the encoded image to", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 286.36514, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "produce a feature for each table cell. Notice that this is dif-", "bbox": {"l": 50.112, "t": 87.16339000000005, "r": 286.36508, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "ferent than the typical object detection problem where im-", "bbox": {"l": 50.112, "t": 99.11841000000004, "r": 286.36508, "b": 108.02495999999985, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "balances between the number of detections and the amount", "bbox": {"l": 50.112, "t": 111.07343000000003, "r": 286.36508, "b": 119.97997999999984, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "of objects may exist. In our case, we know up front that", "bbox": {"l": 50.112, "t": 123.02844000000005, "r": 286.36508, "b": 131.93499999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "the produced detections always match with the table cells", "bbox": {"l": 50.112, "t": 134.98443999999995, "r": 286.36514, "b": 143.89099, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "in number and correspondence.", "bbox": {"l": 50.112, "t": 146.93944999999997, "r": 175.16254, "b": 155.84600999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "text", "bbox": {"l": 50.112, "t": 159.62445000000002, "r": 286.36511, "b": 240.26306, "coord_origin": "TOPLEFT"}, "confidence": 0.9860327839851379, "cells": [{"id": 7, "text": "The output features for each table cell are then fed", "bbox": {"l": 62.067001, "t": 159.62445000000002, "r": 286.36496, "b": 168.53101000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "into the feed-forward network (FFN). The FFN consists", "bbox": {"l": 50.112, "t": 171.58043999999995, "r": 286.36511, "b": 180.48699999999997, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "of a Multi-Layer Perceptron (3 layers with ReLU activa-", "bbox": {"l": 50.112, "t": 183.53545999999994, "r": 286.36511, "b": 192.44201999999996, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "tion function) that predicts the normalized coordinates for", "bbox": {"l": 50.112, "t": 195.49048000000005, "r": 286.36511, "b": 204.39702999999997, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "the bounding box of each table cell. Finally, the predicted", "bbox": {"l": 50.112, "t": 207.44550000000004, "r": 286.36511, "b": 216.35204999999996, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "bounding boxes are classified based on whether they are", "bbox": {"l": 50.112, "t": 219.40051000000005, "r": 286.36511, "b": 228.30706999999995, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "empty or not using a linear layer.", "bbox": {"l": 50.112, "t": 231.35650999999996, "r": 181.54855, "b": 240.26306, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "text", "bbox": {"l": 50.112, "t": 243.92193999999995, "r": 286.36572, "b": 444.2309, "coord_origin": "TOPLEFT"}, "confidence": 0.9873637557029724, "cells": [{"id": 14, "text": "Loss Functions.", "bbox": {"l": 62.067001, "t": 243.92193999999995, "r": 129.21492, "b": 252.87829999999997, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "We formulate a multi-task loss Eq. 2", "bbox": {"l": 134.451, "t": 244.04150000000004, "r": 286.36078, "b": 252.94806000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "to train our network. The Cross-Entropy loss (denoted as", "bbox": {"l": 50.112007, "t": 255.99652000000003, "r": 286.36511, "b": 264.90308000000005, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "l$_{s}$", "bbox": {"l": 50.112007, "t": 267.79309, "r": 56.84528, "b": 276.63989000000004, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": ") is used to train the", "bbox": {"l": 57.343006, "t": 267.95250999999996, "r": 135.39996, "b": 276.85907, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Structure Decoder", "bbox": {"l": 137.735, "t": 268.04218000000003, "r": 211.07965, "b": 276.62994000000003, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "which predicts the", "bbox": {"l": 213.63699, "t": 267.95250999999996, "r": 286.36395, "b": 276.85907, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "structure tokens. As for the", "bbox": {"l": 50.112, "t": 279.90747, "r": 158.82388, "b": 288.81406, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "Cell BBox Decoder", "bbox": {"l": 161.31799, "t": 279.99712999999997, "r": 238.79712, "b": 288.58493, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "it is trained", "bbox": {"l": 241.521, "t": 279.90747, "r": 286.36264, "b": 288.81406, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "with a combination of losses denoted as", "bbox": {"l": 50.112, "t": 291.86249, "r": 211.3766, "b": 300.76904, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "l$_{box}$", "bbox": {"l": 214.271, "t": 291.70309, "r": 229.19780000000003, "b": 300.54987, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": ".", "bbox": {"l": 229.696, "t": 291.86249, "r": 232.18665000000001, "b": 300.76904, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "l$_{box}$", "bbox": {"l": 236.49001, "t": 291.70309, "r": 251.41681000000003, "b": 300.54987, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "consists", "bbox": {"l": 254.81099999999998, "t": 291.86249, "r": 286.36255, "b": 300.76904, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "of the generally used", "bbox": {"l": 50.112, "t": 303.81747, "r": 137.45412, "b": 312.72403, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "l$_{1}$", "bbox": {"l": 141.298, "t": 303.65808, "r": 148.24258, "b": 312.50485, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "loss for object detection and the", "bbox": {"l": 152.58601, "t": 303.81747, "r": 286.36377, "b": 312.72403, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "IoU loss (", "bbox": {"l": 50.112015, "t": 315.77245999999997, "r": 89.683464, "b": 324.67902, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "l$_{iou}$", "bbox": {"l": 89.68602, "t": 315.61307, "r": 104.12046, "b": 324.45984, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": ") to be scale invariant as explained in [25]. In", "bbox": {"l": 104.61802, "t": 315.77245999999997, "r": 286.36572, "b": 324.67902, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "comparison to DETR, we do not use the Hungarian algo-", "bbox": {"l": 50.112019, "t": 327.72845, "r": 286.36511, "b": 336.6350100000001, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "rithm [15] to match the predicted bounding boxes with the", "bbox": {"l": 50.112019, "t": 339.68344, "r": 286.36508, "b": 348.59, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "ground-truth boxes, as we have already achieved a one-to-", "bbox": {"l": 50.112019, "t": 351.63843, "r": 286.36511, "b": 360.54498, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "one match through two steps: 1) Our token input sequence", "bbox": {"l": 50.112019, "t": 363.59341, "r": 286.36508, "b": 372.49996999999996, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "is naturally ordered, therefore the hidden states of the table", "bbox": {"l": 50.112019, "t": 375.5484, "r": 286.36511, "b": 384.45496, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "data cells are also in order when they are provided as in-", "bbox": {"l": 50.112019, "t": 387.50339, "r": 286.36514, "b": 396.40994, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "put to the", "bbox": {"l": 50.112019, "t": 399.45938, "r": 88.68721, "b": 408.36594, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "Cell BBox Decoder", "bbox": {"l": 91.646019, "t": 399.54904, "r": 170.0517, "b": 408.13681, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": ", and 2) Our bounding boxes", "bbox": {"l": 170.05103, "t": 399.45938, "r": 286.36438, "b": 408.36594, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "generation mechanism (see Sec.", "bbox": {"l": 50.112022, "t": 411.41437, "r": 181.96703, "b": 420.32092, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "3)", "bbox": {"l": 189.09029, "t": 411.41437, "r": 197.74918, "b": 420.32092, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "ensures a one-to-one", "bbox": {"l": 200.34789, "t": 411.41437, "r": 286.36511, "b": 420.32092, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "mapping between the cell content and its bounding box for", "bbox": {"l": 50.112022, "t": 423.36934999999994, "r": 286.36511, "b": 432.27591, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "all post-processed datasets.", "bbox": {"l": 50.112022, "t": 435.32434, "r": 158.2959, "b": 444.2309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 50.112022, "t": 448.01035, "r": 286.36499, "b": 468.87189, "coord_origin": "TOPLEFT"}, "confidence": 0.9724196195602417, "cells": [{"id": 49, "text": "The loss used to train the TableFormer can be defined as", "bbox": {"l": 62.067024, "t": 448.01035, "r": 286.36499, "b": 456.9169, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "following:", "bbox": {"l": 50.112022, "t": 459.96533, "r": 91.377113, "b": 468.87189, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "formula", "bbox": {"l": 124.33002, "t": 493.28094, "r": 286.36243, "b": 517.07172, "coord_origin": "TOPLEFT"}, "confidence": 0.9423348307609558, "cells": [{"id": 51, "text": "l$_{box}$", "bbox": {"l": 125.71502, "t": 493.28094, "r": 140.64182, "b": 502.12772, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "=", "bbox": {"l": 143.90701, "t": 493.28094, "r": 151.65593, "b": 502.12772, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "\u03bb$_{iou}$l$_{iou}$", "bbox": {"l": 154.42302, "t": 493.28094, "r": 186.62846, "b": 502.12772, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "+", "bbox": {"l": 189.34003, "t": 493.28094, "r": 197.08894, "b": 502.12772, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "\u03bb$_{l}$$_{1}$", "bbox": {"l": 199.30302, "t": 493.28094, "r": 211.64659, "b": 502.12772, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "l", "bbox": {"l": 124.33002, "t": 508.22495, "r": 127.30286, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "=", "bbox": {"l": 130.26602, "t": 508.22495, "r": 138.01494, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "\u03bbl$_{s}$", "bbox": {"l": 140.78203, "t": 508.22495, "r": 153.32629, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "+ (1", "bbox": {"l": 156.03903, "t": 508.22495, "r": 174.85541, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "\u2212", "bbox": {"l": 177.07103, "t": 507.66702, "r": 184.81995, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "\u03bb", "bbox": {"l": 187.03304, "t": 508.22495, "r": 192.84422, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": ")", "bbox": {"l": 192.84503, "t": 508.22495, "r": 196.71948, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "l$_{box}$", "bbox": {"l": 196.71902, "t": 508.22495, "r": 211.64583, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "(1)", "bbox": {"l": 274.74603, "t": 501.01132, "r": 286.36243, "b": 509.91788, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 50.11203, "t": 530.5920100000001, "r": 281.59692, "b": 540.21588, "coord_origin": "TOPLEFT"}, "confidence": 0.9363929629325867, "cells": [{"id": 65, "text": "where", "bbox": {"l": 50.11203, "t": 531.30933, "r": 74.450661, "b": 540.21588, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "\u03bb", "bbox": {"l": 76.941032, "t": 531.14993, "r": 82.75222, "b": 539.9967, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "\u2208", "bbox": {"l": 85.520035, "t": 530.5920100000001, "r": 92.162102, "b": 539.9967, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "[0, 1], and", "bbox": {"l": 94.653038, "t": 531.30933, "r": 135.59932, "b": 540.21588, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "\u03bb$_{iou}$, \u03bb$_{l}$$_{1}$", "bbox": {"l": 138.09004, "t": 531.14993, "r": 172.63162, "b": 539.9967, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "\u2208$_{R}$", "bbox": {"l": 175.89705, "t": 530.5920100000001, "r": 192.50104, "b": 539.9967, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "are hyper-parameters.", "bbox": {"l": 194.99205, "t": 531.30933, "r": 281.59692, "b": 540.21588, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "section_header", "bbox": {"l": 50.112045, "t": 555.91689, "r": 171.98335, "b": 566.66461, "coord_origin": "TOPLEFT"}, "confidence": 0.9554555416107178, "cells": [{"id": 72, "text": "5.", "bbox": {"l": 50.112045, "t": 555.91689, "r": 57.92831799999999, "b": 566.66461, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "Experimental Results", "bbox": {"l": 68.350014, "t": 555.91689, "r": 171.98335, "b": 566.66461, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "section_header", "bbox": {"l": 50.112045, "t": 576.26433, "r": 179.17502, "b": 586.1163799999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9538503289222717, "cells": [{"id": 74, "text": "5.1.", "bbox": {"l": 50.112045, "t": 576.26433, "r": 64.693237, "b": 586.1163799999999, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "Implementation Details", "bbox": {"l": 74.414032, "t": 576.26433, "r": 179.17502, "b": 586.1163799999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "text", "bbox": {"l": 50.112045, "t": 595.73433, "r": 286.36517, "b": 640.50688, "coord_origin": "TOPLEFT"}, "confidence": 0.9856163263320923, "cells": [{"id": 76, "text": "TableFormer uses ResNet-18 as the", "bbox": {"l": 62.067047, "t": 595.73433, "r": 202.97806, "b": 604.64088, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "CNN Backbone Net-", "bbox": {"l": 205.38405, "t": 595.82399, "r": 286.36008, "b": 604.41174, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "work", "bbox": {"l": 50.112045, "t": 607.77899, "r": 70.037247, "b": 616.3667399999999, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": ". The input images are resized to 448*448 pixels and", "bbox": {"l": 70.037048, "t": 607.68933, "r": 286.36496, "b": 616.59589, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "the feature map has a dimension of 28*28. Additionally, we", "bbox": {"l": 50.112049, "t": 619.64433, "r": 286.36517, "b": 628.55089, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "enforce the following input constraints:", "bbox": {"l": 50.112049, "t": 631.60033, "r": 207.03294, "b": 640.50688, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "formula", "bbox": {"l": 91.661049, "t": 653.828, "r": 286.36246, "b": 678.39588, "coord_origin": "TOPLEFT"}, "confidence": 0.844183623790741, "cells": [{"id": 82, "text": "Image width and height", "bbox": {"l": 91.661049, "t": 654.54532, "r": 186.01683, "b": 663.45187, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "\u2264", "bbox": {"l": 188.50705, "t": 653.828, "r": 196.25597, "b": 663.2327, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "1024 pixels", "bbox": {"l": 198.74605, "t": 654.54532, "r": 244.81310999999997, "b": 663.45187, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "Structural tags length", "bbox": {"l": 101.01604, "t": 669.48932, "r": 186.24606, "b": 678.39588, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "\u2264", "bbox": {"l": 188.73605, "t": 668.77201, "r": 196.48497, "b": 678.1767, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "512 tokens.", "bbox": {"l": 198.97505, "t": 669.48932, "r": 244.81296999999998, "b": 678.39588, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "(2)", "bbox": {"l": 274.74606, "t": 662.11731, "r": 286.36246, "b": 671.02388, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "text", "bbox": {"l": 50.112061, "t": 692.290314, "r": 286.36514, "b": 713.151878, "coord_origin": "TOPLEFT"}, "confidence": 0.9724979996681213, "cells": [{"id": 89, "text": "Although input constraints are used also by other methods,", "bbox": {"l": 50.112061, "t": 692.290314, "r": 286.36514, "b": 701.196877, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "such as EDD, ours are less restrictive due to the improved", "bbox": {"l": 50.112061, "t": 704.245316, "r": 286.36514, "b": 713.151878, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 308.86206, "t": 75.20830999999998, "r": 545.11523, "b": 108.0249, "coord_origin": "TOPLEFT"}, "confidence": 0.9799237847328186, "cells": [{"id": 91, "text": "runtime performance and lower memory footprint of Table-", "bbox": {"l": 308.86206, "t": 75.20830999999998, "r": 545.11523, "b": 84.11487, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Former.", "bbox": {"l": 308.86206, "t": 87.16332999999997, "r": 339.98523, "b": 96.06988999999999, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "This allows to utilize input samples with longer", "bbox": {"l": 346.88931, "t": 87.16332999999997, "r": 545.11523, "b": 96.06988999999999, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "sequences and images with larger dimensions.", "bbox": {"l": 308.86206, "t": 99.11835000000008, "r": 492.96097, "b": 108.0249, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 308.86206, "t": 116.22937000000002, "r": 545.1153, "b": 328.37405, "coord_origin": "TOPLEFT"}, "confidence": 0.9880930781364441, "cells": [{"id": 95, "text": "The Transformer Encoder consists of two \u201cTransformer", "bbox": {"l": 320.81705, "t": 116.22937000000002, "r": 545.11499, "b": 125.13593000000003, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "Encoder Layers\u201d, with an input feature size of 512, feed", "bbox": {"l": 308.86206, "t": 128.18439, "r": 545.11517, "b": 137.09094000000005, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "forward network of 1024, and 4 attention heads. As for the", "bbox": {"l": 308.86206, "t": 140.13940000000002, "r": 545.11505, "b": 149.04596000000004, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "Transformer Decoder it is composed of four \u201cTransformer", "bbox": {"l": 308.86206, "t": 152.09442, "r": 545.11511, "b": 161.00098000000003, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "Decoder Layers\u201d with similar input and output dimensions", "bbox": {"l": 308.86206, "t": 164.04944, "r": 545.11517, "b": 172.95599000000004, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "as the \u201cTransformer Encoder Layers\u201d.", "bbox": {"l": 308.86206, "t": 176.00543000000005, "r": 467.21756000000005, "b": 184.91198999999995, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "Even though our", "bbox": {"l": 475.43671, "t": 176.00543000000005, "r": 545.11511, "b": 184.91198999999995, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "model uses fewer layers and heads than the default imple-", "bbox": {"l": 308.86206, "t": 187.96045000000004, "r": 545.11511, "b": 196.86699999999996, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "mentation parameters, our extensive experimentation has", "bbox": {"l": 308.86206, "t": 199.91547000000003, "r": 545.11511, "b": 208.82201999999995, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "proved this setup to be more suitable for table images. We", "bbox": {"l": 308.86206, "t": 211.87048000000004, "r": 545.11517, "b": 220.77704000000006, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "attribute this finding to the inherent design of table im-", "bbox": {"l": 308.86206, "t": 223.82550000000003, "r": 545.11511, "b": 232.73206000000005, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "ages, which contain mostly lines and text, unlike the more", "bbox": {"l": 308.86206, "t": 235.78052000000002, "r": 545.11511, "b": 244.68706999999995, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "elaborate content present in other scopes (e.g. the COCO", "bbox": {"l": 308.86206, "t": 247.73650999999995, "r": 545.11523, "b": 256.64306999999997, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "dataset).", "bbox": {"l": 308.86206, "t": 259.69152999999994, "r": 342.3364, "b": 268.59808, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "Moreover, we have added ResNet blocks to the", "bbox": {"l": 348.95157, "t": 259.69152999999994, "r": 545.11517, "b": 268.59808, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "inputs of the Structure Decoder and Cell BBox Decoder.", "bbox": {"l": 308.86206, "t": 271.64655000000005, "r": 545.11517, "b": 280.55310000000003, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "This prevents a decoder having a stronger influence over the", "bbox": {"l": 308.86206, "t": 283.6015300000001, "r": 545.1153, "b": 292.50809, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "learned weights which would damage the other prediction", "bbox": {"l": 308.86206, "t": 295.55652, "r": 545.11511, "b": 304.46307, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "task (structure vs bounding boxes), but learn task specific", "bbox": {"l": 308.86206, "t": 307.51151, "r": 545.11511, "b": 316.41806, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "weights instead. Lastly our dropout layers are set to 0.5.", "bbox": {"l": 308.86206, "t": 319.4674999999999, "r": 532.48267, "b": 328.37405, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 308.86203, "t": 336.57751, "r": 545.11517, "b": 429.16998, "coord_origin": "TOPLEFT"}, "confidence": 0.9877589344978333, "cells": [{"id": 115, "text": "For training, TableFormer is trained with 3 Adam opti-", "bbox": {"l": 320.81705, "t": 336.57751, "r": 545.11499, "b": 345.48407000000003, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "mizers, each one for the", "bbox": {"l": 308.86206, "t": 348.5325000000001, "r": 403.7359, "b": 357.43906, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "CNN Backbone Network", "bbox": {"l": 406.07605, "t": 348.62216, "r": 503.54016, "b": 357.20993, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": ",", "bbox": {"l": 503.53906, "t": 348.5325000000001, "r": 506.02972, "b": 357.43906, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "Structure", "bbox": {"l": 508.40004999999996, "t": 348.62216, "r": 545.11224, "b": 357.20993, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "Decoder", "bbox": {"l": 308.86206, "t": 360.57715, "r": 343.1633, "b": 369.16492000000005, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": ", and", "bbox": {"l": 343.16306, "t": 360.48749, "r": 362.2016, "b": 369.39404, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Cell BBox Decoder", "bbox": {"l": 364.28604, "t": 360.57715, "r": 440.93829, "b": 369.16492000000005, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": ". Taking the PubTabNet as", "bbox": {"l": 440.93903, "t": 360.48749, "r": 545.10797, "b": 369.39404, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "an example for our parameter set up, the initializing learn-", "bbox": {"l": 308.86203, "t": 372.44247, "r": 545.11511, "b": 381.34903, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "ing rate is 0.001 for 12 epochs with a batch size of 24, and", "bbox": {"l": 308.86203, "t": 384.3984699999999, "r": 545.11517, "b": 393.30502, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "\u03bb", "bbox": {"l": 308.86203, "t": 396.19406000000004, "r": 314.67322, "b": 405.04083, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "set to 0.5.", "bbox": {"l": 318.65802, "t": 396.35345, "r": 360.39139, "b": 405.2600100000001, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "Afterwards, we reduce the learning rate to", "bbox": {"l": 367.96295, "t": 396.35345, "r": 545.10803, "b": 405.2600100000001, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "0.0001, the batch size to 18 and train for 12 more epochs or", "bbox": {"l": 308.86203, "t": 408.30844, "r": 545.11511, "b": 417.215, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "convergence.", "bbox": {"l": 308.86203, "t": 420.26343, "r": 360.9664, "b": 429.16998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 308.86203, "t": 437.37441999999993, "r": 545.11523, "b": 553.87689, "coord_origin": "TOPLEFT"}, "confidence": 0.9884491562843323, "cells": [{"id": 131, "text": "TableFormer is implemented with PyTorch and Torchvi-", "bbox": {"l": 320.81702, "t": 437.37441999999993, "r": 545.11499, "b": 446.28098, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "sion libraries [22].", "bbox": {"l": 308.86203, "t": 449.32941, "r": 384.62759, "b": 458.23596, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "To speed up the inference, the image", "bbox": {"l": 391.37228, "t": 449.32941, "r": 545.11511, "b": 458.23596, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "undergoes a single forward pass through the", "bbox": {"l": 308.86203, "t": 461.28439, "r": 494.00693000000007, "b": 470.19095, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "CNN Back-", "bbox": {"l": 498.07803, "t": 461.37405, "r": 545.11145, "b": 469.96182, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "bone Network", "bbox": {"l": 308.86203, "t": 473.32904, "r": 364.44336, "b": 481.91681, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "and transformer encoder. This eliminates the", "bbox": {"l": 367.06104, "t": 473.23938, "r": 545.11267, "b": 482.14594, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "overhead of generating the same features for each decoding", "bbox": {"l": 308.86203, "t": 485.19437, "r": 545.11511, "b": 494.10092, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "step. Similarly, we employ a \u2019caching\u2019 technique to preform", "bbox": {"l": 308.86203, "t": 497.14935, "r": 545.11523, "b": 506.05591, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "faster autoregressive decoding. This is achieved by storing", "bbox": {"l": 308.86203, "t": 509.10535, "r": 545.11511, "b": 518.0119, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "the features of decoded tokens so we can reuse them for", "bbox": {"l": 308.86203, "t": 521.06033, "r": 545.11517, "b": 529.9668899999999, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "each time step. Therefore, we only compute the attention", "bbox": {"l": 308.86203, "t": 533.01532, "r": 545.11517, "b": 541.9218900000001, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "for each new tag.", "bbox": {"l": 308.86203, "t": 544.97034, "r": 377.21548, "b": 553.87689, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "section_header", "bbox": {"l": 308.86203, "t": 579.55432, "r": 397.44281, "b": 589.40637, "coord_origin": "TOPLEFT"}, "confidence": 0.9450808763504028, "cells": [{"id": 144, "text": "5.2.", "bbox": {"l": 308.86203, "t": 579.55432, "r": 323.9046, "b": 589.40637, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "Generalization", "bbox": {"l": 333.93301, "t": 579.55432, "r": 397.44281, "b": 589.40637, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 308.86203, "t": 603.44933, "r": 545.11517, "b": 672.13189, "coord_origin": "TOPLEFT"}, "confidence": 0.9880595803260803, "cells": [{"id": 146, "text": "TableFormer is evaluated on three major publicly avail-", "bbox": {"l": 320.81702, "t": 603.44933, "r": 545.11493, "b": 612.3558800000001, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "able datasets of different nature to prove the generalization", "bbox": {"l": 308.86203, "t": 615.40433, "r": 545.11511, "b": 624.31088, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "and effectiveness of our model. The datasets used for eval-", "bbox": {"l": 308.86203, "t": 627.35933, "r": 545.11517, "b": 636.26588, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "uation are the PubTabNet, FinTabNet and TableBank which", "bbox": {"l": 308.86203, "t": 639.31433, "r": 545.11511, "b": 648.22089, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "stem from the scientific, financial and general domains re-", "bbox": {"l": 308.86203, "t": 651.27032, "r": 545.11517, "b": 660.17688, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "spectively.", "bbox": {"l": 308.86203, "t": 663.22533, "r": 350.70493, "b": 672.13189, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "text", "bbox": {"l": 308.86203, "t": 680.33533, "r": 545.11523, "b": 713.152893, "coord_origin": "TOPLEFT"}, "confidence": 0.9830910563468933, "cells": [{"id": 152, "text": "We also share our baseline results on the challenging", "bbox": {"l": 320.81702, "t": 680.33533, "r": 545.11505, "b": 689.24189, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "SynthTabNet dataset.", "bbox": {"l": 308.86203, "t": 692.290329, "r": 396.21411, "b": 701.196892, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "Throughout our experiments, the", "bbox": {"l": 406.40585, "t": 692.290329, "r": 545.11523, "b": 701.196892, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "same parameters stated in Sec. 5.1 are utilized.", "bbox": {"l": 308.86203, "t": 704.246323, "r": 495.93982, "b": 713.152893, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "page_footer", "bbox": {"l": 295.12103, "t": 734.133327, "r": 300.10233, "b": 743.03989, "coord_origin": "TOPLEFT"}, "confidence": 0.8820409178733826, "cells": [{"id": 156, "text": "6", "bbox": {"l": 295.12103, "t": 734.133327, "r": 300.10233, "b": 743.03989, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "text", "id": 5, "page_no": 5, "cluster": {"id": 5, "label": "text", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 286.36514, "b": 155.84600999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.9868090152740479, "cells": [{"id": 0, "text": "tention encoding is then multiplied to the encoded image to", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 286.36514, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "produce a feature for each table cell. Notice that this is dif-", "bbox": {"l": 50.112, "t": 87.16339000000005, "r": 286.36508, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "ferent than the typical object detection problem where im-", "bbox": {"l": 50.112, "t": 99.11841000000004, "r": 286.36508, "b": 108.02495999999985, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "balances between the number of detections and the amount", "bbox": {"l": 50.112, "t": 111.07343000000003, "r": 286.36508, "b": 119.97997999999984, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "of objects may exist. In our case, we know up front that", "bbox": {"l": 50.112, "t": 123.02844000000005, "r": 286.36508, "b": 131.93499999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "the produced detections always match with the table cells", "bbox": {"l": 50.112, "t": 134.98443999999995, "r": 286.36514, "b": 143.89099, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "in number and correspondence.", "bbox": {"l": 50.112, "t": 146.93944999999997, "r": 175.16254, "b": 155.84600999999998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "tention encoding is then multiplied to the encoded image to produce a feature for each table cell. Notice that this is different than the typical object detection problem where imbalances between the number of detections and the amount of objects may exist. In our case, we know up front that the produced detections always match with the table cells in number and correspondence."}, {"label": "text", "id": 6, "page_no": 5, "cluster": {"id": 6, "label": "text", "bbox": {"l": 50.112, "t": 159.62445000000002, "r": 286.36511, "b": 240.26306, "coord_origin": "TOPLEFT"}, "confidence": 0.9860327839851379, "cells": [{"id": 7, "text": "The output features for each table cell are then fed", "bbox": {"l": 62.067001, "t": 159.62445000000002, "r": 286.36496, "b": 168.53101000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "into the feed-forward network (FFN). The FFN consists", "bbox": {"l": 50.112, "t": 171.58043999999995, "r": 286.36511, "b": 180.48699999999997, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "of a Multi-Layer Perceptron (3 layers with ReLU activa-", "bbox": {"l": 50.112, "t": 183.53545999999994, "r": 286.36511, "b": 192.44201999999996, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "tion function) that predicts the normalized coordinates for", "bbox": {"l": 50.112, "t": 195.49048000000005, "r": 286.36511, "b": 204.39702999999997, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "the bounding box of each table cell. Finally, the predicted", "bbox": {"l": 50.112, "t": 207.44550000000004, "r": 286.36511, "b": 216.35204999999996, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "bounding boxes are classified based on whether they are", "bbox": {"l": 50.112, "t": 219.40051000000005, "r": 286.36511, "b": 228.30706999999995, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "empty or not using a linear layer.", "bbox": {"l": 50.112, "t": 231.35650999999996, "r": 181.54855, "b": 240.26306, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The output features for each table cell are then fed into the feed-forward network (FFN). The FFN consists of a Multi-Layer Perceptron (3 layers with ReLU activation function) that predicts the normalized coordinates for the bounding box of each table cell. Finally, the predicted bounding boxes are classified based on whether they are empty or not using a linear layer."}, {"label": "text", "id": 4, "page_no": 5, "cluster": {"id": 4, "label": "text", "bbox": {"l": 50.112, "t": 243.92193999999995, "r": 286.36572, "b": 444.2309, "coord_origin": "TOPLEFT"}, "confidence": 0.9873637557029724, "cells": [{"id": 14, "text": "Loss Functions.", "bbox": {"l": 62.067001, "t": 243.92193999999995, "r": 129.21492, "b": 252.87829999999997, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "We formulate a multi-task loss Eq. 2", "bbox": {"l": 134.451, "t": 244.04150000000004, "r": 286.36078, "b": 252.94806000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "to train our network. The Cross-Entropy loss (denoted as", "bbox": {"l": 50.112007, "t": 255.99652000000003, "r": 286.36511, "b": 264.90308000000005, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "l$_{s}$", "bbox": {"l": 50.112007, "t": 267.79309, "r": 56.84528, "b": 276.63989000000004, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": ") is used to train the", "bbox": {"l": 57.343006, "t": 267.95250999999996, "r": 135.39996, "b": 276.85907, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Structure Decoder", "bbox": {"l": 137.735, "t": 268.04218000000003, "r": 211.07965, "b": 276.62994000000003, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "which predicts the", "bbox": {"l": 213.63699, "t": 267.95250999999996, "r": 286.36395, "b": 276.85907, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "structure tokens. As for the", "bbox": {"l": 50.112, "t": 279.90747, "r": 158.82388, "b": 288.81406, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "Cell BBox Decoder", "bbox": {"l": 161.31799, "t": 279.99712999999997, "r": 238.79712, "b": 288.58493, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "it is trained", "bbox": {"l": 241.521, "t": 279.90747, "r": 286.36264, "b": 288.81406, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "with a combination of losses denoted as", "bbox": {"l": 50.112, "t": 291.86249, "r": 211.3766, "b": 300.76904, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "l$_{box}$", "bbox": {"l": 214.271, "t": 291.70309, "r": 229.19780000000003, "b": 300.54987, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": ".", "bbox": {"l": 229.696, "t": 291.86249, "r": 232.18665000000001, "b": 300.76904, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "l$_{box}$", "bbox": {"l": 236.49001, "t": 291.70309, "r": 251.41681000000003, "b": 300.54987, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "consists", "bbox": {"l": 254.81099999999998, "t": 291.86249, "r": 286.36255, "b": 300.76904, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "of the generally used", "bbox": {"l": 50.112, "t": 303.81747, "r": 137.45412, "b": 312.72403, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "l$_{1}$", "bbox": {"l": 141.298, "t": 303.65808, "r": 148.24258, "b": 312.50485, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "loss for object detection and the", "bbox": {"l": 152.58601, "t": 303.81747, "r": 286.36377, "b": 312.72403, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "IoU loss (", "bbox": {"l": 50.112015, "t": 315.77245999999997, "r": 89.683464, "b": 324.67902, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "l$_{iou}$", "bbox": {"l": 89.68602, "t": 315.61307, "r": 104.12046, "b": 324.45984, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": ") to be scale invariant as explained in [25]. In", "bbox": {"l": 104.61802, "t": 315.77245999999997, "r": 286.36572, "b": 324.67902, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "comparison to DETR, we do not use the Hungarian algo-", "bbox": {"l": 50.112019, "t": 327.72845, "r": 286.36511, "b": 336.6350100000001, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "rithm [15] to match the predicted bounding boxes with the", "bbox": {"l": 50.112019, "t": 339.68344, "r": 286.36508, "b": 348.59, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "ground-truth boxes, as we have already achieved a one-to-", "bbox": {"l": 50.112019, "t": 351.63843, "r": 286.36511, "b": 360.54498, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "one match through two steps: 1) Our token input sequence", "bbox": {"l": 50.112019, "t": 363.59341, "r": 286.36508, "b": 372.49996999999996, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "is naturally ordered, therefore the hidden states of the table", "bbox": {"l": 50.112019, "t": 375.5484, "r": 286.36511, "b": 384.45496, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "data cells are also in order when they are provided as in-", "bbox": {"l": 50.112019, "t": 387.50339, "r": 286.36514, "b": 396.40994, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "put to the", "bbox": {"l": 50.112019, "t": 399.45938, "r": 88.68721, "b": 408.36594, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "Cell BBox Decoder", "bbox": {"l": 91.646019, "t": 399.54904, "r": 170.0517, "b": 408.13681, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": ", and 2) Our bounding boxes", "bbox": {"l": 170.05103, "t": 399.45938, "r": 286.36438, "b": 408.36594, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "generation mechanism (see Sec.", "bbox": {"l": 50.112022, "t": 411.41437, "r": 181.96703, "b": 420.32092, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "3)", "bbox": {"l": 189.09029, "t": 411.41437, "r": 197.74918, "b": 420.32092, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "ensures a one-to-one", "bbox": {"l": 200.34789, "t": 411.41437, "r": 286.36511, "b": 420.32092, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "mapping between the cell content and its bounding box for", "bbox": {"l": 50.112022, "t": 423.36934999999994, "r": 286.36511, "b": 432.27591, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "all post-processed datasets.", "bbox": {"l": 50.112022, "t": 435.32434, "r": 158.2959, "b": 444.2309, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Loss Functions. We formulate a multi-task loss Eq. 2 to train our network. The Cross-Entropy loss (denoted as l$_{s}$ ) is used to train the Structure Decoder which predicts the structure tokens. As for the Cell BBox Decoder it is trained with a combination of losses denoted as l$_{box}$ . l$_{box}$ consists of the generally used l$_{1}$ loss for object detection and the IoU loss ( l$_{iou}$ ) to be scale invariant as explained in [25]. In comparison to DETR, we do not use the Hungarian algorithm [15] to match the predicted bounding boxes with the ground-truth boxes, as we have already achieved a one-toone match through two steps: 1) Our token input sequence is naturally ordered, therefore the hidden states of the table data cells are also in order when they are provided as input to the Cell BBox Decoder , and 2) Our bounding boxes generation mechanism (see Sec. 3) ensures a one-to-one mapping between the cell content and its bounding box for all post-processed datasets."}, {"label": "text", "id": 11, "page_no": 5, "cluster": {"id": 11, "label": "text", "bbox": {"l": 50.112022, "t": 448.01035, "r": 286.36499, "b": 468.87189, "coord_origin": "TOPLEFT"}, "confidence": 0.9724196195602417, "cells": [{"id": 49, "text": "The loss used to train the TableFormer can be defined as", "bbox": {"l": 62.067024, "t": 448.01035, "r": 286.36499, "b": 456.9169, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "following:", "bbox": {"l": 50.112022, "t": 459.96533, "r": 91.377113, "b": 468.87189, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The loss used to train the TableFormer can be defined as following:"}, {"label": "formula", "id": 15, "page_no": 5, "cluster": {"id": 15, "label": "formula", "bbox": {"l": 124.33002, "t": 493.28094, "r": 286.36243, "b": 517.07172, "coord_origin": "TOPLEFT"}, "confidence": 0.9423348307609558, "cells": [{"id": 51, "text": "l$_{box}$", "bbox": {"l": 125.71502, "t": 493.28094, "r": 140.64182, "b": 502.12772, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "=", "bbox": {"l": 143.90701, "t": 493.28094, "r": 151.65593, "b": 502.12772, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "\u03bb$_{iou}$l$_{iou}$", "bbox": {"l": 154.42302, "t": 493.28094, "r": 186.62846, "b": 502.12772, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "+", "bbox": {"l": 189.34003, "t": 493.28094, "r": 197.08894, "b": 502.12772, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "\u03bb$_{l}$$_{1}$", "bbox": {"l": 199.30302, "t": 493.28094, "r": 211.64659, "b": 502.12772, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "l", "bbox": {"l": 124.33002, "t": 508.22495, "r": 127.30286, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "=", "bbox": {"l": 130.26602, "t": 508.22495, "r": 138.01494, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "\u03bbl$_{s}$", "bbox": {"l": 140.78203, "t": 508.22495, "r": 153.32629, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "+ (1", "bbox": {"l": 156.03903, "t": 508.22495, "r": 174.85541, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "\u2212", "bbox": {"l": 177.07103, "t": 507.66702, "r": 184.81995, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "\u03bb", "bbox": {"l": 187.03304, "t": 508.22495, "r": 192.84422, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": ")", "bbox": {"l": 192.84503, "t": 508.22495, "r": 196.71948, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "l$_{box}$", "bbox": {"l": 196.71902, "t": 508.22495, "r": 211.64583, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "(1)", "bbox": {"l": 274.74603, "t": 501.01132, "r": 286.36243, "b": 509.91788, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "l$_{box}$ = \u03bb$_{iou}$l$_{iou}$ + \u03bb$_{l}$$_{1}$ l = \u03bbl$_{s}$ + (1 \u2212 \u03bb ) l$_{box}$ (1)"}, {"label": "text", "id": 16, "page_no": 5, "cluster": {"id": 16, "label": "text", "bbox": {"l": 50.11203, "t": 530.5920100000001, "r": 281.59692, "b": 540.21588, "coord_origin": "TOPLEFT"}, "confidence": 0.9363929629325867, "cells": [{"id": 65, "text": "where", "bbox": {"l": 50.11203, "t": 531.30933, "r": 74.450661, "b": 540.21588, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "\u03bb", "bbox": {"l": 76.941032, "t": 531.14993, "r": 82.75222, "b": 539.9967, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "\u2208", "bbox": {"l": 85.520035, "t": 530.5920100000001, "r": 92.162102, "b": 539.9967, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "[0, 1], and", "bbox": {"l": 94.653038, "t": 531.30933, "r": 135.59932, "b": 540.21588, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "\u03bb$_{iou}$, \u03bb$_{l}$$_{1}$", "bbox": {"l": 138.09004, "t": 531.14993, "r": 172.63162, "b": 539.9967, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "\u2208$_{R}$", "bbox": {"l": 175.89705, "t": 530.5920100000001, "r": 192.50104, "b": 539.9967, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "are hyper-parameters.", "bbox": {"l": 194.99205, "t": 531.30933, "r": 281.59692, "b": 540.21588, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "where \u03bb \u2208 [0, 1], and \u03bb$_{iou}$, \u03bb$_{l}$$_{1}$ \u2208$_{R}$ are hyper-parameters."}, {"label": "section_header", "id": 12, "page_no": 5, "cluster": {"id": 12, "label": "section_header", "bbox": {"l": 50.112045, "t": 555.91689, "r": 171.98335, "b": 566.66461, "coord_origin": "TOPLEFT"}, "confidence": 0.9554555416107178, "cells": [{"id": 72, "text": "5.", "bbox": {"l": 50.112045, "t": 555.91689, "r": 57.92831799999999, "b": 566.66461, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "Experimental Results", "bbox": {"l": 68.350014, "t": 555.91689, "r": 171.98335, "b": 566.66461, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5. Experimental Results"}, {"label": "section_header", "id": 13, "page_no": 5, "cluster": {"id": 13, "label": "section_header", "bbox": {"l": 50.112045, "t": 576.26433, "r": 179.17502, "b": 586.1163799999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9538503289222717, "cells": [{"id": 74, "text": "5.1.", "bbox": {"l": 50.112045, "t": 576.26433, "r": 64.693237, "b": 586.1163799999999, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "Implementation Details", "bbox": {"l": 74.414032, "t": 576.26433, "r": 179.17502, "b": 586.1163799999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5.1. Implementation Details"}, {"label": "text", "id": 7, "page_no": 5, "cluster": {"id": 7, "label": "text", "bbox": {"l": 50.112045, "t": 595.73433, "r": 286.36517, "b": 640.50688, "coord_origin": "TOPLEFT"}, "confidence": 0.9856163263320923, "cells": [{"id": 76, "text": "TableFormer uses ResNet-18 as the", "bbox": {"l": 62.067047, "t": 595.73433, "r": 202.97806, "b": 604.64088, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "CNN Backbone Net-", "bbox": {"l": 205.38405, "t": 595.82399, "r": 286.36008, "b": 604.41174, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "work", "bbox": {"l": 50.112045, "t": 607.77899, "r": 70.037247, "b": 616.3667399999999, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": ". The input images are resized to 448*448 pixels and", "bbox": {"l": 70.037048, "t": 607.68933, "r": 286.36496, "b": 616.59589, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "the feature map has a dimension of 28*28. Additionally, we", "bbox": {"l": 50.112049, "t": 619.64433, "r": 286.36517, "b": 628.55089, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "enforce the following input constraints:", "bbox": {"l": 50.112049, "t": 631.60033, "r": 207.03294, "b": 640.50688, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "TableFormer uses ResNet-18 as the CNN Backbone Network . The input images are resized to 448*448 pixels and the feature map has a dimension of 28*28. Additionally, we enforce the following input constraints:"}, {"label": "formula", "id": 18, "page_no": 5, "cluster": {"id": 18, "label": "formula", "bbox": {"l": 91.661049, "t": 653.828, "r": 286.36246, "b": 678.39588, "coord_origin": "TOPLEFT"}, "confidence": 0.844183623790741, "cells": [{"id": 82, "text": "Image width and height", "bbox": {"l": 91.661049, "t": 654.54532, "r": 186.01683, "b": 663.45187, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "\u2264", "bbox": {"l": 188.50705, "t": 653.828, "r": 196.25597, "b": 663.2327, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "1024 pixels", "bbox": {"l": 198.74605, "t": 654.54532, "r": 244.81310999999997, "b": 663.45187, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "Structural tags length", "bbox": {"l": 101.01604, "t": 669.48932, "r": 186.24606, "b": 678.39588, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "\u2264", "bbox": {"l": 188.73605, "t": 668.77201, "r": 196.48497, "b": 678.1767, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "512 tokens.", "bbox": {"l": 198.97505, "t": 669.48932, "r": 244.81296999999998, "b": 678.39588, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "(2)", "bbox": {"l": 274.74606, "t": 662.11731, "r": 286.36246, "b": 671.02388, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Image width and height \u2264 1024 pixels Structural tags length \u2264 512 tokens. (2)"}, {"label": "text", "id": 10, "page_no": 5, "cluster": {"id": 10, "label": "text", "bbox": {"l": 50.112061, "t": 692.290314, "r": 286.36514, "b": 713.151878, "coord_origin": "TOPLEFT"}, "confidence": 0.9724979996681213, "cells": [{"id": 89, "text": "Although input constraints are used also by other methods,", "bbox": {"l": 50.112061, "t": 692.290314, "r": 286.36514, "b": 701.196877, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "such as EDD, ours are less restrictive due to the improved", "bbox": {"l": 50.112061, "t": 704.245316, "r": 286.36514, "b": 713.151878, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Although input constraints are used also by other methods, such as EDD, ours are less restrictive due to the improved"}, {"label": "text", "id": 9, "page_no": 5, "cluster": {"id": 9, "label": "text", "bbox": {"l": 308.86206, "t": 75.20830999999998, "r": 545.11523, "b": 108.0249, "coord_origin": "TOPLEFT"}, "confidence": 0.9799237847328186, "cells": [{"id": 91, "text": "runtime performance and lower memory footprint of Table-", "bbox": {"l": 308.86206, "t": 75.20830999999998, "r": 545.11523, "b": 84.11487, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Former.", "bbox": {"l": 308.86206, "t": 87.16332999999997, "r": 339.98523, "b": 96.06988999999999, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "This allows to utilize input samples with longer", "bbox": {"l": 346.88931, "t": 87.16332999999997, "r": 545.11523, "b": 96.06988999999999, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "sequences and images with larger dimensions.", "bbox": {"l": 308.86206, "t": 99.11835000000008, "r": 492.96097, "b": 108.0249, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "runtime performance and lower memory footprint of TableFormer. This allows to utilize input samples with longer sequences and images with larger dimensions."}, {"label": "text", "id": 1, "page_no": 5, "cluster": {"id": 1, "label": "text", "bbox": {"l": 308.86206, "t": 116.22937000000002, "r": 545.1153, "b": 328.37405, "coord_origin": "TOPLEFT"}, "confidence": 0.9880930781364441, "cells": [{"id": 95, "text": "The Transformer Encoder consists of two \u201cTransformer", "bbox": {"l": 320.81705, "t": 116.22937000000002, "r": 545.11499, "b": 125.13593000000003, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "Encoder Layers\u201d, with an input feature size of 512, feed", "bbox": {"l": 308.86206, "t": 128.18439, "r": 545.11517, "b": 137.09094000000005, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "forward network of 1024, and 4 attention heads. As for the", "bbox": {"l": 308.86206, "t": 140.13940000000002, "r": 545.11505, "b": 149.04596000000004, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "Transformer Decoder it is composed of four \u201cTransformer", "bbox": {"l": 308.86206, "t": 152.09442, "r": 545.11511, "b": 161.00098000000003, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "Decoder Layers\u201d with similar input and output dimensions", "bbox": {"l": 308.86206, "t": 164.04944, "r": 545.11517, "b": 172.95599000000004, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "as the \u201cTransformer Encoder Layers\u201d.", "bbox": {"l": 308.86206, "t": 176.00543000000005, "r": 467.21756000000005, "b": 184.91198999999995, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "Even though our", "bbox": {"l": 475.43671, "t": 176.00543000000005, "r": 545.11511, "b": 184.91198999999995, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "model uses fewer layers and heads than the default imple-", "bbox": {"l": 308.86206, "t": 187.96045000000004, "r": 545.11511, "b": 196.86699999999996, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "mentation parameters, our extensive experimentation has", "bbox": {"l": 308.86206, "t": 199.91547000000003, "r": 545.11511, "b": 208.82201999999995, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "proved this setup to be more suitable for table images. We", "bbox": {"l": 308.86206, "t": 211.87048000000004, "r": 545.11517, "b": 220.77704000000006, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "attribute this finding to the inherent design of table im-", "bbox": {"l": 308.86206, "t": 223.82550000000003, "r": 545.11511, "b": 232.73206000000005, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "ages, which contain mostly lines and text, unlike the more", "bbox": {"l": 308.86206, "t": 235.78052000000002, "r": 545.11511, "b": 244.68706999999995, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "elaborate content present in other scopes (e.g. the COCO", "bbox": {"l": 308.86206, "t": 247.73650999999995, "r": 545.11523, "b": 256.64306999999997, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "dataset).", "bbox": {"l": 308.86206, "t": 259.69152999999994, "r": 342.3364, "b": 268.59808, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "Moreover, we have added ResNet blocks to the", "bbox": {"l": 348.95157, "t": 259.69152999999994, "r": 545.11517, "b": 268.59808, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "inputs of the Structure Decoder and Cell BBox Decoder.", "bbox": {"l": 308.86206, "t": 271.64655000000005, "r": 545.11517, "b": 280.55310000000003, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "This prevents a decoder having a stronger influence over the", "bbox": {"l": 308.86206, "t": 283.6015300000001, "r": 545.1153, "b": 292.50809, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "learned weights which would damage the other prediction", "bbox": {"l": 308.86206, "t": 295.55652, "r": 545.11511, "b": 304.46307, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "task (structure vs bounding boxes), but learn task specific", "bbox": {"l": 308.86206, "t": 307.51151, "r": 545.11511, "b": 316.41806, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "weights instead. Lastly our dropout layers are set to 0.5.", "bbox": {"l": 308.86206, "t": 319.4674999999999, "r": 532.48267, "b": 328.37405, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The Transformer Encoder consists of two \u201cTransformer Encoder Layers\u201d, with an input feature size of 512, feed forward network of 1024, and 4 attention heads. As for the Transformer Decoder it is composed of four \u201cTransformer Decoder Layers\u201d with similar input and output dimensions as the \u201cTransformer Encoder Layers\u201d. Even though our model uses fewer layers and heads than the default implementation parameters, our extensive experimentation has proved this setup to be more suitable for table images. We attribute this finding to the inherent design of table images, which contain mostly lines and text, unlike the more elaborate content present in other scopes (e.g. the COCO dataset). Moreover, we have added ResNet blocks to the inputs of the Structure Decoder and Cell BBox Decoder. This prevents a decoder having a stronger influence over the learned weights which would damage the other prediction task (structure vs bounding boxes), but learn task specific weights instead. Lastly our dropout layers are set to 0.5."}, {"label": "text", "id": 3, "page_no": 5, "cluster": {"id": 3, "label": "text", "bbox": {"l": 308.86203, "t": 336.57751, "r": 545.11517, "b": 429.16998, "coord_origin": "TOPLEFT"}, "confidence": 0.9877589344978333, "cells": [{"id": 115, "text": "For training, TableFormer is trained with 3 Adam opti-", "bbox": {"l": 320.81705, "t": 336.57751, "r": 545.11499, "b": 345.48407000000003, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "mizers, each one for the", "bbox": {"l": 308.86206, "t": 348.5325000000001, "r": 403.7359, "b": 357.43906, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "CNN Backbone Network", "bbox": {"l": 406.07605, "t": 348.62216, "r": 503.54016, "b": 357.20993, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": ",", "bbox": {"l": 503.53906, "t": 348.5325000000001, "r": 506.02972, "b": 357.43906, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "Structure", "bbox": {"l": 508.40004999999996, "t": 348.62216, "r": 545.11224, "b": 357.20993, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "Decoder", "bbox": {"l": 308.86206, "t": 360.57715, "r": 343.1633, "b": 369.16492000000005, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": ", and", "bbox": {"l": 343.16306, "t": 360.48749, "r": 362.2016, "b": 369.39404, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Cell BBox Decoder", "bbox": {"l": 364.28604, "t": 360.57715, "r": 440.93829, "b": 369.16492000000005, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": ". Taking the PubTabNet as", "bbox": {"l": 440.93903, "t": 360.48749, "r": 545.10797, "b": 369.39404, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "an example for our parameter set up, the initializing learn-", "bbox": {"l": 308.86203, "t": 372.44247, "r": 545.11511, "b": 381.34903, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "ing rate is 0.001 for 12 epochs with a batch size of 24, and", "bbox": {"l": 308.86203, "t": 384.3984699999999, "r": 545.11517, "b": 393.30502, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "\u03bb", "bbox": {"l": 308.86203, "t": 396.19406000000004, "r": 314.67322, "b": 405.04083, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "set to 0.5.", "bbox": {"l": 318.65802, "t": 396.35345, "r": 360.39139, "b": 405.2600100000001, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "Afterwards, we reduce the learning rate to", "bbox": {"l": 367.96295, "t": 396.35345, "r": 545.10803, "b": 405.2600100000001, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "0.0001, the batch size to 18 and train for 12 more epochs or", "bbox": {"l": 308.86203, "t": 408.30844, "r": 545.11511, "b": 417.215, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "convergence.", "bbox": {"l": 308.86203, "t": 420.26343, "r": 360.9664, "b": 429.16998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "For training, TableFormer is trained with 3 Adam optimizers, each one for the CNN Backbone Network , Structure Decoder , and Cell BBox Decoder . Taking the PubTabNet as an example for our parameter set up, the initializing learning rate is 0.001 for 12 epochs with a batch size of 24, and \u03bb set to 0.5. Afterwards, we reduce the learning rate to 0.0001, the batch size to 18 and train for 12 more epochs or convergence."}, {"label": "text", "id": 0, "page_no": 5, "cluster": {"id": 0, "label": "text", "bbox": {"l": 308.86203, "t": 437.37441999999993, "r": 545.11523, "b": 553.87689, "coord_origin": "TOPLEFT"}, "confidence": 0.9884491562843323, "cells": [{"id": 131, "text": "TableFormer is implemented with PyTorch and Torchvi-", "bbox": {"l": 320.81702, "t": 437.37441999999993, "r": 545.11499, "b": 446.28098, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "sion libraries [22].", "bbox": {"l": 308.86203, "t": 449.32941, "r": 384.62759, "b": 458.23596, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "To speed up the inference, the image", "bbox": {"l": 391.37228, "t": 449.32941, "r": 545.11511, "b": 458.23596, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "undergoes a single forward pass through the", "bbox": {"l": 308.86203, "t": 461.28439, "r": 494.00693000000007, "b": 470.19095, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "CNN Back-", "bbox": {"l": 498.07803, "t": 461.37405, "r": 545.11145, "b": 469.96182, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "bone Network", "bbox": {"l": 308.86203, "t": 473.32904, "r": 364.44336, "b": 481.91681, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "and transformer encoder. This eliminates the", "bbox": {"l": 367.06104, "t": 473.23938, "r": 545.11267, "b": 482.14594, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "overhead of generating the same features for each decoding", "bbox": {"l": 308.86203, "t": 485.19437, "r": 545.11511, "b": 494.10092, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "step. Similarly, we employ a \u2019caching\u2019 technique to preform", "bbox": {"l": 308.86203, "t": 497.14935, "r": 545.11523, "b": 506.05591, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "faster autoregressive decoding. This is achieved by storing", "bbox": {"l": 308.86203, "t": 509.10535, "r": 545.11511, "b": 518.0119, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "the features of decoded tokens so we can reuse them for", "bbox": {"l": 308.86203, "t": 521.06033, "r": 545.11517, "b": 529.9668899999999, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "each time step. Therefore, we only compute the attention", "bbox": {"l": 308.86203, "t": 533.01532, "r": 545.11517, "b": 541.9218900000001, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "for each new tag.", "bbox": {"l": 308.86203, "t": 544.97034, "r": 377.21548, "b": 553.87689, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "TableFormer is implemented with PyTorch and Torchvision libraries [22]. To speed up the inference, the image undergoes a single forward pass through the CNN Backbone Network and transformer encoder. This eliminates the overhead of generating the same features for each decoding step. Similarly, we employ a \u2019caching\u2019 technique to preform faster autoregressive decoding. This is achieved by storing the features of decoded tokens so we can reuse them for each time step. Therefore, we only compute the attention for each new tag."}, {"label": "section_header", "id": 14, "page_no": 5, "cluster": {"id": 14, "label": "section_header", "bbox": {"l": 308.86203, "t": 579.55432, "r": 397.44281, "b": 589.40637, "coord_origin": "TOPLEFT"}, "confidence": 0.9450808763504028, "cells": [{"id": 144, "text": "5.2.", "bbox": {"l": 308.86203, "t": 579.55432, "r": 323.9046, "b": 589.40637, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "Generalization", "bbox": {"l": 333.93301, "t": 579.55432, "r": 397.44281, "b": 589.40637, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5.2. Generalization"}, {"label": "text", "id": 2, "page_no": 5, "cluster": {"id": 2, "label": "text", "bbox": {"l": 308.86203, "t": 603.44933, "r": 545.11517, "b": 672.13189, "coord_origin": "TOPLEFT"}, "confidence": 0.9880595803260803, "cells": [{"id": 146, "text": "TableFormer is evaluated on three major publicly avail-", "bbox": {"l": 320.81702, "t": 603.44933, "r": 545.11493, "b": 612.3558800000001, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "able datasets of different nature to prove the generalization", "bbox": {"l": 308.86203, "t": 615.40433, "r": 545.11511, "b": 624.31088, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "and effectiveness of our model. The datasets used for eval-", "bbox": {"l": 308.86203, "t": 627.35933, "r": 545.11517, "b": 636.26588, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "uation are the PubTabNet, FinTabNet and TableBank which", "bbox": {"l": 308.86203, "t": 639.31433, "r": 545.11511, "b": 648.22089, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "stem from the scientific, financial and general domains re-", "bbox": {"l": 308.86203, "t": 651.27032, "r": 545.11517, "b": 660.17688, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "spectively.", "bbox": {"l": 308.86203, "t": 663.22533, "r": 350.70493, "b": 672.13189, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "TableFormer is evaluated on three major publicly available datasets of different nature to prove the generalization and effectiveness of our model. The datasets used for evaluation are the PubTabNet, FinTabNet and TableBank which stem from the scientific, financial and general domains respectively."}, {"label": "text", "id": 8, "page_no": 5, "cluster": {"id": 8, "label": "text", "bbox": {"l": 308.86203, "t": 680.33533, "r": 545.11523, "b": 713.152893, "coord_origin": "TOPLEFT"}, "confidence": 0.9830910563468933, "cells": [{"id": 152, "text": "We also share our baseline results on the challenging", "bbox": {"l": 320.81702, "t": 680.33533, "r": 545.11505, "b": 689.24189, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "SynthTabNet dataset.", "bbox": {"l": 308.86203, "t": 692.290329, "r": 396.21411, "b": 701.196892, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "Throughout our experiments, the", "bbox": {"l": 406.40585, "t": 692.290329, "r": 545.11523, "b": 701.196892, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "same parameters stated in Sec. 5.1 are utilized.", "bbox": {"l": 308.86203, "t": 704.246323, "r": 495.93982, "b": 713.152893, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "We also share our baseline results on the challenging SynthTabNet dataset. Throughout our experiments, the same parameters stated in Sec. 5.1 are utilized."}, {"label": "page_footer", "id": 17, "page_no": 5, "cluster": {"id": 17, "label": "page_footer", "bbox": {"l": 295.12103, "t": 734.133327, "r": 300.10233, "b": 743.03989, "coord_origin": "TOPLEFT"}, "confidence": 0.8820409178733826, "cells": [{"id": 156, "text": "6", "bbox": {"l": 295.12103, "t": 734.133327, "r": 300.10233, "b": 743.03989, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "6"}], "body": [{"label": "text", "id": 5, "page_no": 5, "cluster": {"id": 5, "label": "text", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 286.36514, "b": 155.84600999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.9868090152740479, "cells": [{"id": 0, "text": "tention encoding is then multiplied to the encoded image to", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 286.36514, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "produce a feature for each table cell. Notice that this is dif-", "bbox": {"l": 50.112, "t": 87.16339000000005, "r": 286.36508, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "ferent than the typical object detection problem where im-", "bbox": {"l": 50.112, "t": 99.11841000000004, "r": 286.36508, "b": 108.02495999999985, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "balances between the number of detections and the amount", "bbox": {"l": 50.112, "t": 111.07343000000003, "r": 286.36508, "b": 119.97997999999984, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "of objects may exist. In our case, we know up front that", "bbox": {"l": 50.112, "t": 123.02844000000005, "r": 286.36508, "b": 131.93499999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "the produced detections always match with the table cells", "bbox": {"l": 50.112, "t": 134.98443999999995, "r": 286.36514, "b": 143.89099, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "in number and correspondence.", "bbox": {"l": 50.112, "t": 146.93944999999997, "r": 175.16254, "b": 155.84600999999998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "tention encoding is then multiplied to the encoded image to produce a feature for each table cell. Notice that this is different than the typical object detection problem where imbalances between the number of detections and the amount of objects may exist. In our case, we know up front that the produced detections always match with the table cells in number and correspondence."}, {"label": "text", "id": 6, "page_no": 5, "cluster": {"id": 6, "label": "text", "bbox": {"l": 50.112, "t": 159.62445000000002, "r": 286.36511, "b": 240.26306, "coord_origin": "TOPLEFT"}, "confidence": 0.9860327839851379, "cells": [{"id": 7, "text": "The output features for each table cell are then fed", "bbox": {"l": 62.067001, "t": 159.62445000000002, "r": 286.36496, "b": 168.53101000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "into the feed-forward network (FFN). The FFN consists", "bbox": {"l": 50.112, "t": 171.58043999999995, "r": 286.36511, "b": 180.48699999999997, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "of a Multi-Layer Perceptron (3 layers with ReLU activa-", "bbox": {"l": 50.112, "t": 183.53545999999994, "r": 286.36511, "b": 192.44201999999996, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "tion function) that predicts the normalized coordinates for", "bbox": {"l": 50.112, "t": 195.49048000000005, "r": 286.36511, "b": 204.39702999999997, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "the bounding box of each table cell. Finally, the predicted", "bbox": {"l": 50.112, "t": 207.44550000000004, "r": 286.36511, "b": 216.35204999999996, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "bounding boxes are classified based on whether they are", "bbox": {"l": 50.112, "t": 219.40051000000005, "r": 286.36511, "b": 228.30706999999995, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "empty or not using a linear layer.", "bbox": {"l": 50.112, "t": 231.35650999999996, "r": 181.54855, "b": 240.26306, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The output features for each table cell are then fed into the feed-forward network (FFN). The FFN consists of a Multi-Layer Perceptron (3 layers with ReLU activation function) that predicts the normalized coordinates for the bounding box of each table cell. Finally, the predicted bounding boxes are classified based on whether they are empty or not using a linear layer."}, {"label": "text", "id": 4, "page_no": 5, "cluster": {"id": 4, "label": "text", "bbox": {"l": 50.112, "t": 243.92193999999995, "r": 286.36572, "b": 444.2309, "coord_origin": "TOPLEFT"}, "confidence": 0.9873637557029724, "cells": [{"id": 14, "text": "Loss Functions.", "bbox": {"l": 62.067001, "t": 243.92193999999995, "r": 129.21492, "b": 252.87829999999997, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "We formulate a multi-task loss Eq. 2", "bbox": {"l": 134.451, "t": 244.04150000000004, "r": 286.36078, "b": 252.94806000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "to train our network. The Cross-Entropy loss (denoted as", "bbox": {"l": 50.112007, "t": 255.99652000000003, "r": 286.36511, "b": 264.90308000000005, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "l$_{s}$", "bbox": {"l": 50.112007, "t": 267.79309, "r": 56.84528, "b": 276.63989000000004, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": ") is used to train the", "bbox": {"l": 57.343006, "t": 267.95250999999996, "r": 135.39996, "b": 276.85907, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Structure Decoder", "bbox": {"l": 137.735, "t": 268.04218000000003, "r": 211.07965, "b": 276.62994000000003, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "which predicts the", "bbox": {"l": 213.63699, "t": 267.95250999999996, "r": 286.36395, "b": 276.85907, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "structure tokens. As for the", "bbox": {"l": 50.112, "t": 279.90747, "r": 158.82388, "b": 288.81406, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "Cell BBox Decoder", "bbox": {"l": 161.31799, "t": 279.99712999999997, "r": 238.79712, "b": 288.58493, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "it is trained", "bbox": {"l": 241.521, "t": 279.90747, "r": 286.36264, "b": 288.81406, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "with a combination of losses denoted as", "bbox": {"l": 50.112, "t": 291.86249, "r": 211.3766, "b": 300.76904, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "l$_{box}$", "bbox": {"l": 214.271, "t": 291.70309, "r": 229.19780000000003, "b": 300.54987, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": ".", "bbox": {"l": 229.696, "t": 291.86249, "r": 232.18665000000001, "b": 300.76904, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "l$_{box}$", "bbox": {"l": 236.49001, "t": 291.70309, "r": 251.41681000000003, "b": 300.54987, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "consists", "bbox": {"l": 254.81099999999998, "t": 291.86249, "r": 286.36255, "b": 300.76904, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "of the generally used", "bbox": {"l": 50.112, "t": 303.81747, "r": 137.45412, "b": 312.72403, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "l$_{1}$", "bbox": {"l": 141.298, "t": 303.65808, "r": 148.24258, "b": 312.50485, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "loss for object detection and the", "bbox": {"l": 152.58601, "t": 303.81747, "r": 286.36377, "b": 312.72403, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "IoU loss (", "bbox": {"l": 50.112015, "t": 315.77245999999997, "r": 89.683464, "b": 324.67902, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "l$_{iou}$", "bbox": {"l": 89.68602, "t": 315.61307, "r": 104.12046, "b": 324.45984, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": ") to be scale invariant as explained in [25]. In", "bbox": {"l": 104.61802, "t": 315.77245999999997, "r": 286.36572, "b": 324.67902, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "comparison to DETR, we do not use the Hungarian algo-", "bbox": {"l": 50.112019, "t": 327.72845, "r": 286.36511, "b": 336.6350100000001, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "rithm [15] to match the predicted bounding boxes with the", "bbox": {"l": 50.112019, "t": 339.68344, "r": 286.36508, "b": 348.59, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "ground-truth boxes, as we have already achieved a one-to-", "bbox": {"l": 50.112019, "t": 351.63843, "r": 286.36511, "b": 360.54498, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "one match through two steps: 1) Our token input sequence", "bbox": {"l": 50.112019, "t": 363.59341, "r": 286.36508, "b": 372.49996999999996, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "is naturally ordered, therefore the hidden states of the table", "bbox": {"l": 50.112019, "t": 375.5484, "r": 286.36511, "b": 384.45496, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "data cells are also in order when they are provided as in-", "bbox": {"l": 50.112019, "t": 387.50339, "r": 286.36514, "b": 396.40994, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "put to the", "bbox": {"l": 50.112019, "t": 399.45938, "r": 88.68721, "b": 408.36594, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "Cell BBox Decoder", "bbox": {"l": 91.646019, "t": 399.54904, "r": 170.0517, "b": 408.13681, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": ", and 2) Our bounding boxes", "bbox": {"l": 170.05103, "t": 399.45938, "r": 286.36438, "b": 408.36594, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "generation mechanism (see Sec.", "bbox": {"l": 50.112022, "t": 411.41437, "r": 181.96703, "b": 420.32092, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "3)", "bbox": {"l": 189.09029, "t": 411.41437, "r": 197.74918, "b": 420.32092, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "ensures a one-to-one", "bbox": {"l": 200.34789, "t": 411.41437, "r": 286.36511, "b": 420.32092, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "mapping between the cell content and its bounding box for", "bbox": {"l": 50.112022, "t": 423.36934999999994, "r": 286.36511, "b": 432.27591, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "all post-processed datasets.", "bbox": {"l": 50.112022, "t": 435.32434, "r": 158.2959, "b": 444.2309, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Loss Functions. We formulate a multi-task loss Eq. 2 to train our network. The Cross-Entropy loss (denoted as l$_{s}$ ) is used to train the Structure Decoder which predicts the structure tokens. As for the Cell BBox Decoder it is trained with a combination of losses denoted as l$_{box}$ . l$_{box}$ consists of the generally used l$_{1}$ loss for object detection and the IoU loss ( l$_{iou}$ ) to be scale invariant as explained in [25]. In comparison to DETR, we do not use the Hungarian algorithm [15] to match the predicted bounding boxes with the ground-truth boxes, as we have already achieved a one-toone match through two steps: 1) Our token input sequence is naturally ordered, therefore the hidden states of the table data cells are also in order when they are provided as input to the Cell BBox Decoder , and 2) Our bounding boxes generation mechanism (see Sec. 3) ensures a one-to-one mapping between the cell content and its bounding box for all post-processed datasets."}, {"label": "text", "id": 11, "page_no": 5, "cluster": {"id": 11, "label": "text", "bbox": {"l": 50.112022, "t": 448.01035, "r": 286.36499, "b": 468.87189, "coord_origin": "TOPLEFT"}, "confidence": 0.9724196195602417, "cells": [{"id": 49, "text": "The loss used to train the TableFormer can be defined as", "bbox": {"l": 62.067024, "t": 448.01035, "r": 286.36499, "b": 456.9169, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "following:", "bbox": {"l": 50.112022, "t": 459.96533, "r": 91.377113, "b": 468.87189, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The loss used to train the TableFormer can be defined as following:"}, {"label": "formula", "id": 15, "page_no": 5, "cluster": {"id": 15, "label": "formula", "bbox": {"l": 124.33002, "t": 493.28094, "r": 286.36243, "b": 517.07172, "coord_origin": "TOPLEFT"}, "confidence": 0.9423348307609558, "cells": [{"id": 51, "text": "l$_{box}$", "bbox": {"l": 125.71502, "t": 493.28094, "r": 140.64182, "b": 502.12772, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "=", "bbox": {"l": 143.90701, "t": 493.28094, "r": 151.65593, "b": 502.12772, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "\u03bb$_{iou}$l$_{iou}$", "bbox": {"l": 154.42302, "t": 493.28094, "r": 186.62846, "b": 502.12772, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "+", "bbox": {"l": 189.34003, "t": 493.28094, "r": 197.08894, "b": 502.12772, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "\u03bb$_{l}$$_{1}$", "bbox": {"l": 199.30302, "t": 493.28094, "r": 211.64659, "b": 502.12772, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "l", "bbox": {"l": 124.33002, "t": 508.22495, "r": 127.30286, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "=", "bbox": {"l": 130.26602, "t": 508.22495, "r": 138.01494, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "\u03bbl$_{s}$", "bbox": {"l": 140.78203, "t": 508.22495, "r": 153.32629, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "+ (1", "bbox": {"l": 156.03903, "t": 508.22495, "r": 174.85541, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "\u2212", "bbox": {"l": 177.07103, "t": 507.66702, "r": 184.81995, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "\u03bb", "bbox": {"l": 187.03304, "t": 508.22495, "r": 192.84422, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": ")", "bbox": {"l": 192.84503, "t": 508.22495, "r": 196.71948, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "l$_{box}$", "bbox": {"l": 196.71902, "t": 508.22495, "r": 211.64583, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "(1)", "bbox": {"l": 274.74603, "t": 501.01132, "r": 286.36243, "b": 509.91788, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "l$_{box}$ = \u03bb$_{iou}$l$_{iou}$ + \u03bb$_{l}$$_{1}$ l = \u03bbl$_{s}$ + (1 \u2212 \u03bb ) l$_{box}$ (1)"}, {"label": "text", "id": 16, "page_no": 5, "cluster": {"id": 16, "label": "text", "bbox": {"l": 50.11203, "t": 530.5920100000001, "r": 281.59692, "b": 540.21588, "coord_origin": "TOPLEFT"}, "confidence": 0.9363929629325867, "cells": [{"id": 65, "text": "where", "bbox": {"l": 50.11203, "t": 531.30933, "r": 74.450661, "b": 540.21588, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "\u03bb", "bbox": {"l": 76.941032, "t": 531.14993, "r": 82.75222, "b": 539.9967, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "\u2208", "bbox": {"l": 85.520035, "t": 530.5920100000001, "r": 92.162102, "b": 539.9967, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "[0, 1], and", "bbox": {"l": 94.653038, "t": 531.30933, "r": 135.59932, "b": 540.21588, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "\u03bb$_{iou}$, \u03bb$_{l}$$_{1}$", "bbox": {"l": 138.09004, "t": 531.14993, "r": 172.63162, "b": 539.9967, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "\u2208$_{R}$", "bbox": {"l": 175.89705, "t": 530.5920100000001, "r": 192.50104, "b": 539.9967, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "are hyper-parameters.", "bbox": {"l": 194.99205, "t": 531.30933, "r": 281.59692, "b": 540.21588, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "where \u03bb \u2208 [0, 1], and \u03bb$_{iou}$, \u03bb$_{l}$$_{1}$ \u2208$_{R}$ are hyper-parameters."}, {"label": "section_header", "id": 12, "page_no": 5, "cluster": {"id": 12, "label": "section_header", "bbox": {"l": 50.112045, "t": 555.91689, "r": 171.98335, "b": 566.66461, "coord_origin": "TOPLEFT"}, "confidence": 0.9554555416107178, "cells": [{"id": 72, "text": "5.", "bbox": {"l": 50.112045, "t": 555.91689, "r": 57.92831799999999, "b": 566.66461, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "Experimental Results", "bbox": {"l": 68.350014, "t": 555.91689, "r": 171.98335, "b": 566.66461, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5. Experimental Results"}, {"label": "section_header", "id": 13, "page_no": 5, "cluster": {"id": 13, "label": "section_header", "bbox": {"l": 50.112045, "t": 576.26433, "r": 179.17502, "b": 586.1163799999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9538503289222717, "cells": [{"id": 74, "text": "5.1.", "bbox": {"l": 50.112045, "t": 576.26433, "r": 64.693237, "b": 586.1163799999999, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "Implementation Details", "bbox": {"l": 74.414032, "t": 576.26433, "r": 179.17502, "b": 586.1163799999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5.1. Implementation Details"}, {"label": "text", "id": 7, "page_no": 5, "cluster": {"id": 7, "label": "text", "bbox": {"l": 50.112045, "t": 595.73433, "r": 286.36517, "b": 640.50688, "coord_origin": "TOPLEFT"}, "confidence": 0.9856163263320923, "cells": [{"id": 76, "text": "TableFormer uses ResNet-18 as the", "bbox": {"l": 62.067047, "t": 595.73433, "r": 202.97806, "b": 604.64088, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "CNN Backbone Net-", "bbox": {"l": 205.38405, "t": 595.82399, "r": 286.36008, "b": 604.41174, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "work", "bbox": {"l": 50.112045, "t": 607.77899, "r": 70.037247, "b": 616.3667399999999, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": ". The input images are resized to 448*448 pixels and", "bbox": {"l": 70.037048, "t": 607.68933, "r": 286.36496, "b": 616.59589, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "the feature map has a dimension of 28*28. Additionally, we", "bbox": {"l": 50.112049, "t": 619.64433, "r": 286.36517, "b": 628.55089, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "enforce the following input constraints:", "bbox": {"l": 50.112049, "t": 631.60033, "r": 207.03294, "b": 640.50688, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "TableFormer uses ResNet-18 as the CNN Backbone Network . The input images are resized to 448*448 pixels and the feature map has a dimension of 28*28. Additionally, we enforce the following input constraints:"}, {"label": "formula", "id": 18, "page_no": 5, "cluster": {"id": 18, "label": "formula", "bbox": {"l": 91.661049, "t": 653.828, "r": 286.36246, "b": 678.39588, "coord_origin": "TOPLEFT"}, "confidence": 0.844183623790741, "cells": [{"id": 82, "text": "Image width and height", "bbox": {"l": 91.661049, "t": 654.54532, "r": 186.01683, "b": 663.45187, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "\u2264", "bbox": {"l": 188.50705, "t": 653.828, "r": 196.25597, "b": 663.2327, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "1024 pixels", "bbox": {"l": 198.74605, "t": 654.54532, "r": 244.81310999999997, "b": 663.45187, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "Structural tags length", "bbox": {"l": 101.01604, "t": 669.48932, "r": 186.24606, "b": 678.39588, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "\u2264", "bbox": {"l": 188.73605, "t": 668.77201, "r": 196.48497, "b": 678.1767, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "512 tokens.", "bbox": {"l": 198.97505, "t": 669.48932, "r": 244.81296999999998, "b": 678.39588, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "(2)", "bbox": {"l": 274.74606, "t": 662.11731, "r": 286.36246, "b": 671.02388, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Image width and height \u2264 1024 pixels Structural tags length \u2264 512 tokens. (2)"}, {"label": "text", "id": 10, "page_no": 5, "cluster": {"id": 10, "label": "text", "bbox": {"l": 50.112061, "t": 692.290314, "r": 286.36514, "b": 713.151878, "coord_origin": "TOPLEFT"}, "confidence": 0.9724979996681213, "cells": [{"id": 89, "text": "Although input constraints are used also by other methods,", "bbox": {"l": 50.112061, "t": 692.290314, "r": 286.36514, "b": 701.196877, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "such as EDD, ours are less restrictive due to the improved", "bbox": {"l": 50.112061, "t": 704.245316, "r": 286.36514, "b": 713.151878, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Although input constraints are used also by other methods, such as EDD, ours are less restrictive due to the improved"}, {"label": "text", "id": 9, "page_no": 5, "cluster": {"id": 9, "label": "text", "bbox": {"l": 308.86206, "t": 75.20830999999998, "r": 545.11523, "b": 108.0249, "coord_origin": "TOPLEFT"}, "confidence": 0.9799237847328186, "cells": [{"id": 91, "text": "runtime performance and lower memory footprint of Table-", "bbox": {"l": 308.86206, "t": 75.20830999999998, "r": 545.11523, "b": 84.11487, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Former.", "bbox": {"l": 308.86206, "t": 87.16332999999997, "r": 339.98523, "b": 96.06988999999999, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "This allows to utilize input samples with longer", "bbox": {"l": 346.88931, "t": 87.16332999999997, "r": 545.11523, "b": 96.06988999999999, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "sequences and images with larger dimensions.", "bbox": {"l": 308.86206, "t": 99.11835000000008, "r": 492.96097, "b": 108.0249, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "runtime performance and lower memory footprint of TableFormer. This allows to utilize input samples with longer sequences and images with larger dimensions."}, {"label": "text", "id": 1, "page_no": 5, "cluster": {"id": 1, "label": "text", "bbox": {"l": 308.86206, "t": 116.22937000000002, "r": 545.1153, "b": 328.37405, "coord_origin": "TOPLEFT"}, "confidence": 0.9880930781364441, "cells": [{"id": 95, "text": "The Transformer Encoder consists of two \u201cTransformer", "bbox": {"l": 320.81705, "t": 116.22937000000002, "r": 545.11499, "b": 125.13593000000003, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "Encoder Layers\u201d, with an input feature size of 512, feed", "bbox": {"l": 308.86206, "t": 128.18439, "r": 545.11517, "b": 137.09094000000005, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "forward network of 1024, and 4 attention heads. As for the", "bbox": {"l": 308.86206, "t": 140.13940000000002, "r": 545.11505, "b": 149.04596000000004, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "Transformer Decoder it is composed of four \u201cTransformer", "bbox": {"l": 308.86206, "t": 152.09442, "r": 545.11511, "b": 161.00098000000003, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "Decoder Layers\u201d with similar input and output dimensions", "bbox": {"l": 308.86206, "t": 164.04944, "r": 545.11517, "b": 172.95599000000004, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "as the \u201cTransformer Encoder Layers\u201d.", "bbox": {"l": 308.86206, "t": 176.00543000000005, "r": 467.21756000000005, "b": 184.91198999999995, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "Even though our", "bbox": {"l": 475.43671, "t": 176.00543000000005, "r": 545.11511, "b": 184.91198999999995, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "model uses fewer layers and heads than the default imple-", "bbox": {"l": 308.86206, "t": 187.96045000000004, "r": 545.11511, "b": 196.86699999999996, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "mentation parameters, our extensive experimentation has", "bbox": {"l": 308.86206, "t": 199.91547000000003, "r": 545.11511, "b": 208.82201999999995, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "proved this setup to be more suitable for table images. We", "bbox": {"l": 308.86206, "t": 211.87048000000004, "r": 545.11517, "b": 220.77704000000006, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "attribute this finding to the inherent design of table im-", "bbox": {"l": 308.86206, "t": 223.82550000000003, "r": 545.11511, "b": 232.73206000000005, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "ages, which contain mostly lines and text, unlike the more", "bbox": {"l": 308.86206, "t": 235.78052000000002, "r": 545.11511, "b": 244.68706999999995, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "elaborate content present in other scopes (e.g. the COCO", "bbox": {"l": 308.86206, "t": 247.73650999999995, "r": 545.11523, "b": 256.64306999999997, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "dataset).", "bbox": {"l": 308.86206, "t": 259.69152999999994, "r": 342.3364, "b": 268.59808, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "Moreover, we have added ResNet blocks to the", "bbox": {"l": 348.95157, "t": 259.69152999999994, "r": 545.11517, "b": 268.59808, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "inputs of the Structure Decoder and Cell BBox Decoder.", "bbox": {"l": 308.86206, "t": 271.64655000000005, "r": 545.11517, "b": 280.55310000000003, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "This prevents a decoder having a stronger influence over the", "bbox": {"l": 308.86206, "t": 283.6015300000001, "r": 545.1153, "b": 292.50809, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "learned weights which would damage the other prediction", "bbox": {"l": 308.86206, "t": 295.55652, "r": 545.11511, "b": 304.46307, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "task (structure vs bounding boxes), but learn task specific", "bbox": {"l": 308.86206, "t": 307.51151, "r": 545.11511, "b": 316.41806, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "weights instead. Lastly our dropout layers are set to 0.5.", "bbox": {"l": 308.86206, "t": 319.4674999999999, "r": 532.48267, "b": 328.37405, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The Transformer Encoder consists of two \u201cTransformer Encoder Layers\u201d, with an input feature size of 512, feed forward network of 1024, and 4 attention heads. As for the Transformer Decoder it is composed of four \u201cTransformer Decoder Layers\u201d with similar input and output dimensions as the \u201cTransformer Encoder Layers\u201d. Even though our model uses fewer layers and heads than the default implementation parameters, our extensive experimentation has proved this setup to be more suitable for table images. We attribute this finding to the inherent design of table images, which contain mostly lines and text, unlike the more elaborate content present in other scopes (e.g. the COCO dataset). Moreover, we have added ResNet blocks to the inputs of the Structure Decoder and Cell BBox Decoder. This prevents a decoder having a stronger influence over the learned weights which would damage the other prediction task (structure vs bounding boxes), but learn task specific weights instead. Lastly our dropout layers are set to 0.5."}, {"label": "text", "id": 3, "page_no": 5, "cluster": {"id": 3, "label": "text", "bbox": {"l": 308.86203, "t": 336.57751, "r": 545.11517, "b": 429.16998, "coord_origin": "TOPLEFT"}, "confidence": 0.9877589344978333, "cells": [{"id": 115, "text": "For training, TableFormer is trained with 3 Adam opti-", "bbox": {"l": 320.81705, "t": 336.57751, "r": 545.11499, "b": 345.48407000000003, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "mizers, each one for the", "bbox": {"l": 308.86206, "t": 348.5325000000001, "r": 403.7359, "b": 357.43906, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "CNN Backbone Network", "bbox": {"l": 406.07605, "t": 348.62216, "r": 503.54016, "b": 357.20993, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": ",", "bbox": {"l": 503.53906, "t": 348.5325000000001, "r": 506.02972, "b": 357.43906, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "Structure", "bbox": {"l": 508.40004999999996, "t": 348.62216, "r": 545.11224, "b": 357.20993, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "Decoder", "bbox": {"l": 308.86206, "t": 360.57715, "r": 343.1633, "b": 369.16492000000005, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": ", and", "bbox": {"l": 343.16306, "t": 360.48749, "r": 362.2016, "b": 369.39404, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Cell BBox Decoder", "bbox": {"l": 364.28604, "t": 360.57715, "r": 440.93829, "b": 369.16492000000005, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": ". Taking the PubTabNet as", "bbox": {"l": 440.93903, "t": 360.48749, "r": 545.10797, "b": 369.39404, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "an example for our parameter set up, the initializing learn-", "bbox": {"l": 308.86203, "t": 372.44247, "r": 545.11511, "b": 381.34903, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "ing rate is 0.001 for 12 epochs with a batch size of 24, and", "bbox": {"l": 308.86203, "t": 384.3984699999999, "r": 545.11517, "b": 393.30502, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "\u03bb", "bbox": {"l": 308.86203, "t": 396.19406000000004, "r": 314.67322, "b": 405.04083, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "set to 0.5.", "bbox": {"l": 318.65802, "t": 396.35345, "r": 360.39139, "b": 405.2600100000001, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "Afterwards, we reduce the learning rate to", "bbox": {"l": 367.96295, "t": 396.35345, "r": 545.10803, "b": 405.2600100000001, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "0.0001, the batch size to 18 and train for 12 more epochs or", "bbox": {"l": 308.86203, "t": 408.30844, "r": 545.11511, "b": 417.215, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "convergence.", "bbox": {"l": 308.86203, "t": 420.26343, "r": 360.9664, "b": 429.16998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "For training, TableFormer is trained with 3 Adam optimizers, each one for the CNN Backbone Network , Structure Decoder , and Cell BBox Decoder . Taking the PubTabNet as an example for our parameter set up, the initializing learning rate is 0.001 for 12 epochs with a batch size of 24, and \u03bb set to 0.5. Afterwards, we reduce the learning rate to 0.0001, the batch size to 18 and train for 12 more epochs or convergence."}, {"label": "text", "id": 0, "page_no": 5, "cluster": {"id": 0, "label": "text", "bbox": {"l": 308.86203, "t": 437.37441999999993, "r": 545.11523, "b": 553.87689, "coord_origin": "TOPLEFT"}, "confidence": 0.9884491562843323, "cells": [{"id": 131, "text": "TableFormer is implemented with PyTorch and Torchvi-", "bbox": {"l": 320.81702, "t": 437.37441999999993, "r": 545.11499, "b": 446.28098, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "sion libraries [22].", "bbox": {"l": 308.86203, "t": 449.32941, "r": 384.62759, "b": 458.23596, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "To speed up the inference, the image", "bbox": {"l": 391.37228, "t": 449.32941, "r": 545.11511, "b": 458.23596, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "undergoes a single forward pass through the", "bbox": {"l": 308.86203, "t": 461.28439, "r": 494.00693000000007, "b": 470.19095, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "CNN Back-", "bbox": {"l": 498.07803, "t": 461.37405, "r": 545.11145, "b": 469.96182, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "bone Network", "bbox": {"l": 308.86203, "t": 473.32904, "r": 364.44336, "b": 481.91681, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "and transformer encoder. This eliminates the", "bbox": {"l": 367.06104, "t": 473.23938, "r": 545.11267, "b": 482.14594, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "overhead of generating the same features for each decoding", "bbox": {"l": 308.86203, "t": 485.19437, "r": 545.11511, "b": 494.10092, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "step. Similarly, we employ a \u2019caching\u2019 technique to preform", "bbox": {"l": 308.86203, "t": 497.14935, "r": 545.11523, "b": 506.05591, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "faster autoregressive decoding. This is achieved by storing", "bbox": {"l": 308.86203, "t": 509.10535, "r": 545.11511, "b": 518.0119, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "the features of decoded tokens so we can reuse them for", "bbox": {"l": 308.86203, "t": 521.06033, "r": 545.11517, "b": 529.9668899999999, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "each time step. Therefore, we only compute the attention", "bbox": {"l": 308.86203, "t": 533.01532, "r": 545.11517, "b": 541.9218900000001, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "for each new tag.", "bbox": {"l": 308.86203, "t": 544.97034, "r": 377.21548, "b": 553.87689, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "TableFormer is implemented with PyTorch and Torchvision libraries [22]. To speed up the inference, the image undergoes a single forward pass through the CNN Backbone Network and transformer encoder. This eliminates the overhead of generating the same features for each decoding step. Similarly, we employ a \u2019caching\u2019 technique to preform faster autoregressive decoding. This is achieved by storing the features of decoded tokens so we can reuse them for each time step. Therefore, we only compute the attention for each new tag."}, {"label": "section_header", "id": 14, "page_no": 5, "cluster": {"id": 14, "label": "section_header", "bbox": {"l": 308.86203, "t": 579.55432, "r": 397.44281, "b": 589.40637, "coord_origin": "TOPLEFT"}, "confidence": 0.9450808763504028, "cells": [{"id": 144, "text": "5.2.", "bbox": {"l": 308.86203, "t": 579.55432, "r": 323.9046, "b": 589.40637, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "Generalization", "bbox": {"l": 333.93301, "t": 579.55432, "r": 397.44281, "b": 589.40637, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5.2. Generalization"}, {"label": "text", "id": 2, "page_no": 5, "cluster": {"id": 2, "label": "text", "bbox": {"l": 308.86203, "t": 603.44933, "r": 545.11517, "b": 672.13189, "coord_origin": "TOPLEFT"}, "confidence": 0.9880595803260803, "cells": [{"id": 146, "text": "TableFormer is evaluated on three major publicly avail-", "bbox": {"l": 320.81702, "t": 603.44933, "r": 545.11493, "b": 612.3558800000001, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "able datasets of different nature to prove the generalization", "bbox": {"l": 308.86203, "t": 615.40433, "r": 545.11511, "b": 624.31088, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "and effectiveness of our model. The datasets used for eval-", "bbox": {"l": 308.86203, "t": 627.35933, "r": 545.11517, "b": 636.26588, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "uation are the PubTabNet, FinTabNet and TableBank which", "bbox": {"l": 308.86203, "t": 639.31433, "r": 545.11511, "b": 648.22089, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "stem from the scientific, financial and general domains re-", "bbox": {"l": 308.86203, "t": 651.27032, "r": 545.11517, "b": 660.17688, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "spectively.", "bbox": {"l": 308.86203, "t": 663.22533, "r": 350.70493, "b": 672.13189, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "TableFormer is evaluated on three major publicly available datasets of different nature to prove the generalization and effectiveness of our model. The datasets used for evaluation are the PubTabNet, FinTabNet and TableBank which stem from the scientific, financial and general domains respectively."}, {"label": "text", "id": 8, "page_no": 5, "cluster": {"id": 8, "label": "text", "bbox": {"l": 308.86203, "t": 680.33533, "r": 545.11523, "b": 713.152893, "coord_origin": "TOPLEFT"}, "confidence": 0.9830910563468933, "cells": [{"id": 152, "text": "We also share our baseline results on the challenging", "bbox": {"l": 320.81702, "t": 680.33533, "r": 545.11505, "b": 689.24189, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "SynthTabNet dataset.", "bbox": {"l": 308.86203, "t": 692.290329, "r": 396.21411, "b": 701.196892, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "Throughout our experiments, the", "bbox": {"l": 406.40585, "t": 692.290329, "r": 545.11523, "b": 701.196892, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "same parameters stated in Sec. 5.1 are utilized.", "bbox": {"l": 308.86203, "t": 704.246323, "r": 495.93982, "b": 713.152893, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "We also share our baseline results on the challenging SynthTabNet dataset. Throughout our experiments, the same parameters stated in Sec. 5.1 are utilized."}], "headers": [{"label": "page_footer", "id": 17, "page_no": 5, "cluster": {"id": 17, "label": "page_footer", "bbox": {"l": 295.12103, "t": 734.133327, "r": 300.10233, "b": 743.03989, "coord_origin": "TOPLEFT"}, "confidence": 0.8820409178733826, "cells": [{"id": 156, "text": "6", "bbox": {"l": 295.12103, "t": 734.133327, "r": 300.10233, "b": 743.03989, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "6"}]}}, {"page_no": 6, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "5.3.", "bbox": {"l": 50.112, "t": 74.40137000000016, "r": 63.704811, "b": 84.25342, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Datasets and Metrics", "bbox": {"l": 72.766685, "t": 74.40137000000016, "r": 167.89825, "b": 84.25342, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "The Tree-Edit-Distance-Based Similarity (TEDS) met-", "bbox": {"l": 62.067001, "t": 93.35039999999992, "r": 286.36499, "b": 102.25696000000016, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "ric was introduced in [37]. It represents the prediction, and", "bbox": {"l": 50.112, "t": 105.30542000000003, "r": 286.36511, "b": 114.21198000000015, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "ground-truth as a tree structure of HTML tags. This simi-", "bbox": {"l": 50.112, "t": 117.26044000000002, "r": 286.36505, "b": 126.16699000000006, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "larity is calculated as:", "bbox": {"l": 50.112, "t": 129.21642999999995, "r": 136.71687, "b": 138.12298999999996, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "TEDS (", "bbox": {"l": 86.218994, "t": 157.05798000000004, "r": 118.8784, "b": 165.90479000000005, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "T$_{a}$, T$_{b}$", "bbox": {"l": 118.87499, "t": 157.05798000000004, "r": 143.26962, "b": 165.90479000000005, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": ") = 1", "bbox": {"l": 143.76799, "t": 157.05798000000004, "r": 165.9019, "b": 165.90479000000005, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "\u2212", "bbox": {"l": 168.12099, "t": 156.50012000000004, "r": 175.8699, "b": 165.90479000000005, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "EditDist (", "bbox": {"l": 179.27899, "t": 150.31799, "r": 221.95677, "b": 159.16479000000004, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "T$_{a}$, T$_{b}$", "bbox": {"l": 221.95200000000003, "t": 150.31799, "r": 246.34663, "b": 159.16479000000004, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": ")", "bbox": {"l": 246.84499999999997, "t": 150.31799, "r": 250.71945, "b": 159.16479000000004, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "max (", "bbox": {"l": 182.21201, "t": 163.89197000000001, "r": 206.29161, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "|", "bbox": {"l": 206.289, "t": 163.33411, "r": 209.05661, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "T$_{a}$", "bbox": {"l": 209.056, "t": 163.89197000000001, "r": 219.19968, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "|", "bbox": {"l": 219.69700999999998, "t": 163.33411, "r": 222.46461000000002, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": ",", "bbox": {"l": 224.125, "t": 163.89197000000001, "r": 226.89261, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "|", "bbox": {"l": 228.55299000000002, "t": 163.33411, "r": 231.3206, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "T$_{b}$", "bbox": {"l": 231.31999, "t": 163.89197000000001, "r": 240.64563, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "|", "bbox": {"l": 241.144, "t": 163.33411, "r": 243.91161, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": ")", "bbox": {"l": 243.911, "t": 163.89197000000001, "r": 247.78545, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "(3)", "bbox": {"l": 274.746, "t": 157.21740999999997, "r": 286.3624, "b": 166.12396, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "where", "bbox": {"l": 62.067001, "t": 181.16241000000002, "r": 86.405632, "b": 190.06897000000004, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "T$_{a}$", "bbox": {"l": 88.581001, "t": 181.00298999999995, "r": 98.724663, "b": 189.84978999999998, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "and", "bbox": {"l": 101.399, "t": 181.16241000000002, "r": 115.785, "b": 190.06897000000004, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "T$_{b}$", "bbox": {"l": 117.961, "t": 181.00298999999995, "r": 127.28664, "b": 189.84978999999998, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "represent tables in tree structure HTML", "bbox": {"l": 129.95999, "t": 181.16241000000002, "r": 286.36285, "b": 190.06897000000004, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "format. EditDist denotes the tree-edit distance, and", "bbox": {"l": 50.111992, "t": 193.11743, "r": 252.78116000000003, "b": 202.02399000000003, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "|", "bbox": {"l": 255.18201, "t": 192.40015000000005, "r": 257.94962, "b": 201.80480999999997, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "T", "bbox": {"l": 257.94901, "t": 192.95800999999994, "r": 263.77115, "b": 201.80480999999997, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "|", "bbox": {"l": 265.155, "t": 192.40015000000005, "r": 267.92261, "b": 201.80480999999997, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "rep-", "bbox": {"l": 270.32199, "t": 193.11743, "r": 286.36179, "b": 202.02399000000003, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "resents the number of nodes in", "bbox": {"l": 50.111984, "t": 205.07245, "r": 172.13388, "b": 213.97900000000004, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "T", "bbox": {"l": 174.62399, "t": 204.91301999999996, "r": 180.44614, "b": 213.75982999999997, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": ".", "bbox": {"l": 181.82899, "t": 205.07245, "r": 184.31964, "b": 213.97900000000004, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "5.4.", "bbox": {"l": 50.112, "t": 224.81946000000005, "r": 64.551605, "b": 234.67151, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "Quantitative Analysis", "bbox": {"l": 74.178009, "t": 224.81946000000005, "r": 170.45169, "b": 234.67151, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "Structure.", "bbox": {"l": 62.067001, "t": 243.6499, "r": 105.32461, "b": 252.60626000000002, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "As shown in Tab.", "bbox": {"l": 112.12600000000002, "t": 243.76946999999996, "r": 184.68361, "b": 252.67602999999997, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "2, TableFormer outper-", "bbox": {"l": 191.4781, "t": 243.76946999999996, "r": 286.36188, "b": 252.67602999999997, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "forms all SOTA methods across different datasets by a large", "bbox": {"l": 50.112, "t": 255.72448999999995, "r": 286.36508, "b": 264.63104, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "margin for predicting the table structure from an image.", "bbox": {"l": 50.112, "t": 267.67949999999996, "r": 286.36508, "b": 276.58606, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "All the more, our model outperforms pre-trained methods.", "bbox": {"l": 50.112, "t": 279.63446, "r": 286.36508, "b": 288.54105, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "During the evaluation we do not apply any table filtering.", "bbox": {"l": 50.112, "t": 291.59048, "r": 286.36514, "b": 300.49704, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "We also provide our baseline results on the SynthTabNet", "bbox": {"l": 50.112, "t": 303.54547, "r": 286.36508, "b": 312.45203000000004, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "dataset. It has been observed that large tables (e.g. tables", "bbox": {"l": 50.112, "t": 315.50046, "r": 286.36505, "b": 324.40700999999996, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "that occupy half of the page or more) yield poor predictions.", "bbox": {"l": 50.112, "t": 327.45544, "r": 286.36508, "b": 336.362, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "We attribute this issue to the image resizing during the pre-", "bbox": {"l": 50.112, "t": 339.41043, "r": 286.36508, "b": 348.31699000000003, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "processing step, that produces downsampled images with", "bbox": {"l": 50.112, "t": 351.36542, "r": 286.36505, "b": 360.27197, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "indistinguishable features. This problem can be addressed", "bbox": {"l": 50.112, "t": 363.32141, "r": 286.36508, "b": 372.2279700000001, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "by treating such big tables with a separate model which ac-", "bbox": {"l": 50.112, "t": 375.2764, "r": 286.36511, "b": 384.18295000000006, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "cepts a large input image size.", "bbox": {"l": 50.112, "t": 387.23138, "r": 170.01187, "b": 396.13794, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Model", "bbox": {"l": 78.843002, "t": 420.69037, "r": 104.85535, "b": 429.59692, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "TEDS", "bbox": {"l": 211.2, "t": 414.71237, "r": 236.10649, "b": 423.61893, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "Dataset", "bbox": {"l": 129.338, "t": 426.66736, "r": 159.21584, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Simple", "bbox": {"l": 171.17096, "t": 426.66736, "r": 199.40497, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Complex", "bbox": {"l": 211.36009, "t": 426.66736, "r": 247.74349999999998, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "All", "bbox": {"l": 264.54044, "t": 426.66736, "r": 277.27264, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "EDD", "bbox": {"l": 81.612, "t": 443.62436, "r": 102.08514, "b": 452.53091, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "PTN", "bbox": {"l": 134.87206, "t": 443.62436, "r": 153.69141, "b": 452.53091, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "91.1", "bbox": {"l": 176.56554, "t": 443.62436, "r": 194.00009, "b": 452.53091, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "88.7", "bbox": {"l": 220.82938000000001, "t": 443.62436, "r": 238.26393, "b": 452.53091, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "89.9", "bbox": {"l": 262.18414, "t": 443.62436, "r": 279.61868, "b": 452.53091, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "GTE", "bbox": {"l": 82.165001, "t": 455.58035, "r": 101.5323, "b": 464.48691, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "PTN", "bbox": {"l": 134.86716, "t": 455.58035, "r": 153.68651, "b": 464.48691, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "-", "bbox": {"l": 183.62411, "t": 455.58035, "r": 186.94167, "b": 464.48691, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "-", "bbox": {"l": 227.88795000000002, "t": 455.58035, "r": 231.20551, "b": 464.48691, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "93.01", "bbox": {"l": 259.69855, "t": 455.58035, "r": 282.11441, "b": 464.48691, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 468.13336, "r": 117.38329000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "PTN", "bbox": {"l": 134.86766, "t": 468.13336, "r": 153.68701, "b": 477.03992, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "98.5", "bbox": {"l": 176.57111, "t": 468.13336, "r": 194.00566, "b": 477.03992, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "95.0", "bbox": {"l": 220.83495, "t": 468.13336, "r": 238.26950000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "96.75", "bbox": {"l": 259.698, "t": 468.01379, "r": 282.11386, "b": 476.97018, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "EDD", "bbox": {"l": 81.612, "t": 483.32635, "r": 102.08514, "b": 492.23291, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "FTN", "bbox": {"l": 134.87206, "t": 483.32635, "r": 153.69141, "b": 492.23291, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "88.4", "bbox": {"l": 176.56554, "t": 483.32635, "r": 194.00009, "b": 492.23291, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "92.08", "bbox": {"l": 218.33870999999996, "t": 483.32635, "r": 240.75455999999997, "b": 492.23291, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "90.6", "bbox": {"l": 262.18411, "t": 483.32635, "r": 279.61865, "b": 492.23291, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "GTE", "bbox": {"l": 82.165001, "t": 495.28134, "r": 101.5323, "b": 504.1879, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "FTN", "bbox": {"l": 134.86716, "t": 495.28134, "r": 153.68651, "b": 504.1879, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "-", "bbox": {"l": 183.62411, "t": 495.28134, "r": 186.94167, "b": 504.1879, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "-", "bbox": {"l": 227.88795000000002, "t": 495.28134, "r": 231.20551, "b": 504.1879, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "87.14", "bbox": {"l": 259.69855, "t": 495.28134, "r": 282.11441, "b": 504.1879, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "GTE (FT)", "bbox": {"l": 71.789001, "t": 507.23633, "r": 111.90838999999998, "b": 516.14288, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "FTN", "bbox": {"l": 134.86221, "t": 507.23633, "r": 153.68156, "b": 516.14288, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "-", "bbox": {"l": 183.62914, "t": 507.23633, "r": 186.94669, "b": 516.14288, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "-", "bbox": {"l": 227.89297, "t": 507.23633, "r": 231.21053000000003, "b": 516.14288, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "91.02", "bbox": {"l": 259.6936, "t": 507.23633, "r": 282.10947, "b": 516.14288, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 519.1913099999999, "r": 117.38329000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "FTN", "bbox": {"l": 134.86766, "t": 519.1913099999999, "r": 153.68701, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "97.5", "bbox": {"l": 176.57111, "t": 519.1913099999999, "r": 194.00566, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "96.0", "bbox": {"l": 220.83495, "t": 519.1913099999999, "r": 238.26950000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "96.8", "bbox": {"l": 262.189, "t": 519.0717500000001, "r": 279.62354, "b": 528.02814, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "EDD", "bbox": {"l": 81.612, "t": 536.49837, "r": 102.08514, "b": 545.40492, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "TB", "bbox": {"l": 137.91064, "t": 536.49837, "r": 150.64285, "b": 545.40492, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "86.0", "bbox": {"l": 176.56554, "t": 536.49837, "r": 194.00009, "b": 545.40492, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "-", "bbox": {"l": 227.89285, "t": 536.49837, "r": 231.21040000000002, "b": 545.40492, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "86.0", "bbox": {"l": 262.18411, "t": 536.49837, "r": 279.61865, "b": 545.40492, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 548.45436, "r": 117.38329000000002, "b": 557.36092, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "TB", "bbox": {"l": 137.90625, "t": 548.45436, "r": 150.63846, "b": 557.36092, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "89.6", "bbox": {"l": 176.57111, "t": 548.45436, "r": 194.00566, "b": 557.36092, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "-", "bbox": {"l": 227.88845999999998, "t": 548.45436, "r": 231.20601, "b": 557.36092, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "89.6", "bbox": {"l": 262.189, "t": 548.3348100000001, "r": 279.62354, "b": 557.2911799999999, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 568.00237, "r": 117.38329000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "STN", "bbox": {"l": 134.86766, "t": 568.00237, "r": 153.68701, "b": 576.90892, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "96.9", "bbox": {"l": 176.57111, "t": 568.00237, "r": 194.00566, "b": 576.90892, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "95.7", "bbox": {"l": 220.83495, "t": 568.00237, "r": 238.26950000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "96.7", "bbox": {"l": 262.1897, "t": 568.00237, "r": 279.62424, "b": 576.90892, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "Table 2: Structure results on PubTabNet (PTN), FinTabNet", "bbox": {"l": 50.112, "t": 592.43336, "r": 286.36511, "b": 601.33992, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "(FTN), TableBank (TB) and SynthTabNet (STN).", "bbox": {"l": 50.112, "t": 604.38837, "r": 247.46114, "b": 613.29492, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "FT: Model was trained on PubTabNet then finetuned.", "bbox": {"l": 50.112, "t": 616.34337, "r": 261.78732, "b": 625.24992, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "Cell Detection.", "bbox": {"l": 62.067001, "t": 644.3498099999999, "r": 124.72179, "b": 653.30618, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "Like any object detector, our", "bbox": {"l": 128.20401, "t": 644.46936, "r": 242.9333, "b": 653.37592, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "Cell BBox", "bbox": {"l": 245.55401999999998, "t": 644.55902, "r": 286.36084, "b": 653.1467700000001, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "Detector", "bbox": {"l": 50.112015, "t": 656.51402, "r": 84.971146, "b": 665.10178, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "provides bounding boxes that can be improved", "bbox": {"l": 89.515015, "t": 656.42436, "r": 286.366, "b": 665.33092, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "with post-processing during inference. We make use of the", "bbox": {"l": 50.112015, "t": 668.37936, "r": 286.36511, "b": 677.28593, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "grid-like structure of tables to refine the predictions. A de-", "bbox": {"l": 50.112015, "t": 680.33536, "r": 286.36505, "b": 689.24193, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "tailed explanation on the post-processing is available in the", "bbox": {"l": 50.112015, "t": 692.290359, "r": 286.36511, "b": 701.19693, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "supplementary material. As shown in Tab. 3, we evaluate", "bbox": {"l": 50.112015, "t": 704.245361, "r": 286.36508, "b": 713.151932, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "our", "bbox": {"l": 308.862, "t": 75.20836999999995, "r": 322.14215, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Cell BBox Decoder", "bbox": {"l": 325.45401, "t": 75.29803000000004, "r": 404.56702, "b": 83.88580000000002, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "accuracy for cells with a class la-", "bbox": {"l": 408.104, "t": 75.20836999999995, "r": 545.10968, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "bel of \u2018content\u2019 only using the PASCAL VOC mAP metric", "bbox": {"l": 308.862, "t": 87.16339000000005, "r": 545.11511, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "for pre-processing and post-processing.", "bbox": {"l": 308.862, "t": 99.11841000000004, "r": 470.22626, "b": 108.02495999999985, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "Note that we do", "bbox": {"l": 477.52884, "t": 99.11841000000004, "r": 545.11511, "b": 108.02495999999985, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "not have post-processing results for SynthTabNet as images", "bbox": {"l": 308.862, "t": 111.07343000000003, "r": 545.11517, "b": 119.97997999999984, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "are only provided. To compare the performance of our pro-", "bbox": {"l": 308.862, "t": 123.02844000000005, "r": 545.11511, "b": 131.93499999999995, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "posed approach, we\u2019ve integrated TableFormer\u2019s", "bbox": {"l": 308.862, "t": 134.98443999999995, "r": 502.01691000000005, "b": 143.89099, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "Cell BBox", "bbox": {"l": 504.47299, "t": 135.07410000000004, "r": 545.11041, "b": 143.66187000000002, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "Decoder", "bbox": {"l": 308.862, "t": 147.02910999999995, "r": 343.16324, "b": 155.61688000000004, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "into EDD architecture. As mentioned previously,", "bbox": {"l": 346.371, "t": 146.93944999999997, "r": 545.11493, "b": 155.84600999999998, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "the Structure Decoder provides the", "bbox": {"l": 308.862, "t": 158.89446999999996, "r": 446.15652, "b": 167.80102999999997, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "Cell BBox Decoder", "bbox": {"l": 448.28998000000007, "t": 158.98413000000005, "r": 525.04181, "b": 167.57190000000003, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "with", "bbox": {"l": 527.39899, "t": 158.89446999999996, "r": 545.11249, "b": 167.80102999999997, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "the features needed to predict the bounding box predictions.", "bbox": {"l": 308.862, "t": 170.84948999999995, "r": 545.11511, "b": 179.75603999999998, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "Therefore, the accuracy of the", "bbox": {"l": 308.862, "t": 182.80449999999996, "r": 432.86642000000006, "b": 191.71105999999997, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "Structure Decoder", "bbox": {"l": 436.39001, "t": 182.89417000000003, "r": 510.93021, "b": 191.48193000000003, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "directly", "bbox": {"l": 514.677, "t": 182.80449999999996, "r": 545.11273, "b": 191.71105999999997, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "influences the accuracy of the", "bbox": {"l": 308.862, "t": 194.75951999999995, "r": 431.17285, "b": 203.66607999999997, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "Cell BBox Decoder", "bbox": {"l": 434.6790199999999, "t": 194.84918000000005, "r": 514.18054, "b": 203.43695000000002, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": ". If the", "bbox": {"l": 514.17603, "t": 194.75951999999995, "r": 545.10992, "b": 203.66607999999997, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "Structure Decoder", "bbox": {"l": 308.86203, "t": 206.80517999999995, "r": 382.35614, "b": 215.39293999999995, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "predicts an extra column, this will result", "bbox": {"l": 385.07501, "t": 206.71551999999997, "r": 545.11426, "b": 215.62207, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "in an extra column of predicted bounding boxes.", "bbox": {"l": 308.862, "t": 218.67052999999999, "r": 501.6981799999999, "b": 227.57709, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "Model", "bbox": {"l": 339.323, "t": 253.66436999999996, "r": 365.33536, "b": 262.57092, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "Dataset", "bbox": {"l": 401.04132, "t": 253.66436999999996, "r": 430.91916, "b": 262.57092, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "mAP", "bbox": {"l": 454.10214, "t": 253.66436999999996, "r": 474.58523999999994, "b": 262.57092, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "mAP (PP)", "bbox": {"l": 486.54034, "t": 253.66436999999996, "r": 527.2276, "b": 262.57092, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "EDD+BBox", "bbox": {"l": 327.65601, "t": 270.62134000000003, "r": 377.00076, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "PubTabNet", "bbox": {"l": 393.69809, "t": 270.62134000000003, "r": 438.28073, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "79.2", "bbox": {"l": 455.63559, "t": 270.62134000000003, "r": 473.07013, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "82.7", "bbox": {"l": 498.16592, "t": 270.62134000000003, "r": 515.60046, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "TableFormer", "bbox": {"l": 326.79501, "t": 282.57631999999995, "r": 377.86331, "b": 291.48288, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "PubTabNet", "bbox": {"l": 393.69388, "t": 282.57631999999995, "r": 438.27652, "b": 291.48288, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "82.1", "bbox": {"l": 455.63101, "t": 282.45676, "r": 473.06555000000003, "b": 291.41315, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "86.8", "bbox": {"l": 498.1713, "t": 282.45676, "r": 515.60583, "b": 291.41315, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "TableFormer", "bbox": {"l": 326.79501, "t": 294.53131, "r": 377.86331, "b": 303.43787, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "SynthTabNet", "bbox": {"l": 389.81842, "t": 294.53131, "r": 442.15194999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "87.7", "bbox": {"l": 455.63135, "t": 294.53131, "r": 473.06589, "b": 303.43787, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "-", "bbox": {"l": 505.22515999999996, "t": 294.53131, "r": 508.54268999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "Table 3:", "bbox": {"l": 308.862, "t": 316.44931, "r": 341.49951, "b": 325.35587, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "Cell Bounding Box detection results on PubTab-", "bbox": {"l": 348.60284, "t": 316.44931, "r": 545.11517, "b": 325.35587, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "Net, and FinTabNet. PP: Post-processing.", "bbox": {"l": 308.862, "t": 328.4043, "r": 474.97845, "b": 337.3108500000001, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "Cell Content.", "bbox": {"l": 320.81699, "t": 367.6797199999999, "r": 378.94876, "b": 376.63611, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "In this section, we evaluate the entire", "bbox": {"l": 387.07898, "t": 367.79929, "r": 545.11566, "b": 376.70584, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "pipeline of recovering a table with content.", "bbox": {"l": 308.86197, "t": 379.75426999999996, "r": 487.19257, "b": 388.66083, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "Here we put", "bbox": {"l": 493.96713, "t": 379.75426999999996, "r": 545.11511, "b": 388.66083, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "our approach to test by capitalizing on extracting content", "bbox": {"l": 308.86197, "t": 391.70926, "r": 545.11505, "b": 400.61581, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "from the PDF cells rather than decoding from images. Tab.", "bbox": {"l": 308.86197, "t": 403.66525, "r": 545.11523, "b": 412.57181, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "4", "bbox": {"l": 308.86197, "t": 415.62024, "r": 314.08096, "b": 424.52679, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "shows the TEDs score of HTML code representing the", "bbox": {"l": 316.69046, "t": 415.62024, "r": 545.11517, "b": 424.52679, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "structure of the table along with the content inserted in the", "bbox": {"l": 308.86197, "t": 427.57523, "r": 545.11505, "b": 436.48177999999996, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "data cell and compared with the ground-truth. Our method", "bbox": {"l": 308.86197, "t": 439.53021, "r": 545.11505, "b": 448.43677, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "achieved a", "bbox": {"l": 308.86197, "t": 451.4852, "r": 350.23666, "b": 460.39175, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "5.3%", "bbox": {"l": 352.17596, "t": 451.36563, "r": 374.59183, "b": 460.32201999999995, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "increase over the state-of-the-art, and com-", "bbox": {"l": 376.53296, "t": 451.4852, "r": 545.11011, "b": 460.39175, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "mercial solutions. We believe our scores would be higher", "bbox": {"l": 308.86197, "t": 463.44019, "r": 545.11511, "b": 472.34674, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "if the HTML ground-truth matched the extracted PDF cell", "bbox": {"l": 308.86197, "t": 475.39618, "r": 545.11517, "b": 484.30273, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "content. Unfortunately, there are small discrepancies such", "bbox": {"l": 308.86197, "t": 487.35117, "r": 545.11511, "b": 496.25772, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "as spacings around words or special characters with various", "bbox": {"l": 308.86197, "t": 499.30615, "r": 545.11505, "b": 508.21271, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "unicode representations.", "bbox": {"l": 308.86197, "t": 511.26114, "r": 405.69846, "b": 520.16769, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "Model", "bbox": {"l": 358.01099, "t": 552.23337, "r": 384.02335, "b": 561.1399200000001, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "TEDS", "bbox": {"l": 449.03400000000005, "t": 546.25537, "r": 473.94049000000007, "b": 555.16193, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": "Simple", "bbox": {"l": 408.50598, "t": 558.21037, "r": 436.73999, "b": 567.11693, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "Complex", "bbox": {"l": 448.6951, "t": 558.21037, "r": 485.07849, "b": 567.11693, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "All", "bbox": {"l": 499.3848, "t": 558.21037, "r": 512.117, "b": 567.11693, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": "Tabula", "bbox": {"l": 357.68201, "t": 575.16736, "r": 384.3519, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "78.0", "bbox": {"l": 413.90097, "t": 575.16736, "r": 431.33550999999994, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "57.8", "bbox": {"l": 458.16479000000004, "t": 575.16736, "r": 475.59933000000007, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "67.9", "bbox": {"l": 497.0289, "t": 575.16736, "r": 514.46344, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": "Traprange", "bbox": {"l": 350.72299, "t": 587.12236, "r": 391.31064, "b": 596.02892, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "60.8", "bbox": {"l": 413.90582, "t": 587.12236, "r": 431.34036, "b": 596.02892, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "49.9", "bbox": {"l": 458.16965, "t": 587.12236, "r": 475.60419, "b": 596.02892, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "55.4", "bbox": {"l": 497.03374999999994, "t": 587.12236, "r": 514.46832, "b": 596.02892, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "Camelot", "bbox": {"l": 354.13599, "t": 599.07835, "r": 387.89923, "b": 607.98491, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "80.0", "bbox": {"l": 413.90161, "t": 599.07835, "r": 431.33615, "b": 607.98491, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "66.0", "bbox": {"l": 458.16544, "t": 599.07835, "r": 475.59998, "b": 607.98491, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "73.0", "bbox": {"l": 497.02954000000005, "t": 599.07835, "r": 514.46411, "b": 607.98491, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "Acrobat Pro", "bbox": {"l": 346.55899, "t": 611.03336, "r": 395.47534, "b": 619.93991, "coord_origin": "TOPLEFT"}}, {"id": 201, "text": "68.9", "bbox": {"l": 413.90616, "t": 611.03336, "r": 431.34069999999997, "b": 619.93991, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": "61.8", "bbox": {"l": 458.16998000000007, "t": 611.03336, "r": 475.60452, "b": 619.93991, "coord_origin": "TOPLEFT"}}, {"id": 203, "text": "65.3", "bbox": {"l": 497.03409, "t": 611.03336, "r": 514.46863, "b": 619.93991, "coord_origin": "TOPLEFT"}}, {"id": 204, "text": "EDD", "bbox": {"l": 360.78101, "t": 622.9883600000001, "r": 381.25415, "b": 631.89491, "coord_origin": "TOPLEFT"}}, {"id": 205, "text": "91.2", "bbox": {"l": 413.90158, "t": 622.9883600000001, "r": 431.33612, "b": 631.89491, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": "85.4", "bbox": {"l": 458.16541, "t": 622.9883600000001, "r": 475.59995000000004, "b": 631.89491, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": "88.3", "bbox": {"l": 497.0295100000001, "t": 622.9883600000001, "r": 514.46405, "b": 631.89491, "coord_origin": "TOPLEFT"}}, {"id": 208, "text": "TableFormer", "bbox": {"l": 345.483, "t": 634.94336, "r": 396.5513, "b": 643.84991, "coord_origin": "TOPLEFT"}}, {"id": 209, "text": "95.4", "bbox": {"l": 413.90616, "t": 634.94336, "r": 431.34069999999997, "b": 643.84991, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": "90.1", "bbox": {"l": 458.16998000000007, "t": 634.94336, "r": 475.60452, "b": 643.84991, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "93.6", "bbox": {"l": 497.03400000000005, "t": 634.82381, "r": 514.46857, "b": 643.78018, "coord_origin": "TOPLEFT"}}, {"id": 212, "text": "Table 4:", "bbox": {"l": 308.862, "t": 656.86136, "r": 341.73862, "b": 665.76792, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "Results of structure with content retrieved using", "bbox": {"l": 349.55927, "t": 656.86136, "r": 545.11517, "b": 665.76792, "coord_origin": "TOPLEFT"}}, {"id": 214, "text": "cell detection on PubTabNet. In all cases the input is PDF", "bbox": {"l": 308.862, "t": 668.81636, "r": 545.11505, "b": 677.7229199999999, "coord_origin": "TOPLEFT"}}, {"id": 215, "text": "documents with cropped tables.", "bbox": {"l": 308.862, "t": 680.77136, "r": 435.03836, "b": 689.6779300000001, "coord_origin": "TOPLEFT"}}, {"id": 216, "text": "7", "bbox": {"l": 295.121, "t": 734.133358, "r": 300.10229, "b": 743.039921, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 10, "label": "section_header", "bbox": {"l": 50.112, "t": 74.40137000000016, "r": 167.89825, "b": 84.25342, "coord_origin": "TOPLEFT"}, "confidence": 0.9554274082183838, "cells": [{"id": 0, "text": "5.3.", "bbox": {"l": 50.112, "t": 74.40137000000016, "r": 63.704811, "b": 84.25342, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Datasets and Metrics", "bbox": {"l": 72.766685, "t": 74.40137000000016, "r": 167.89825, "b": 84.25342, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 50.112, "t": 93.35039999999992, "r": 286.36511, "b": 138.12298999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9862998127937317, "cells": [{"id": 2, "text": "The Tree-Edit-Distance-Based Similarity (TEDS) met-", "bbox": {"l": 62.067001, "t": 93.35039999999992, "r": 286.36499, "b": 102.25696000000016, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "ric was introduced in [37]. It represents the prediction, and", "bbox": {"l": 50.112, "t": 105.30542000000003, "r": 286.36511, "b": 114.21198000000015, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "ground-truth as a tree structure of HTML tags. This simi-", "bbox": {"l": 50.112, "t": 117.26044000000002, "r": 286.36505, "b": 126.16699000000006, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "larity is calculated as:", "bbox": {"l": 50.112, "t": 129.21642999999995, "r": 136.71687, "b": 138.12298999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "formula", "bbox": {"l": 86.218994, "t": 150.31799, "r": 286.3624, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9500409364700317, "cells": [{"id": 6, "text": "TEDS (", "bbox": {"l": 86.218994, "t": 157.05798000000004, "r": 118.8784, "b": 165.90479000000005, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "T$_{a}$, T$_{b}$", "bbox": {"l": 118.87499, "t": 157.05798000000004, "r": 143.26962, "b": 165.90479000000005, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": ") = 1", "bbox": {"l": 143.76799, "t": 157.05798000000004, "r": 165.9019, "b": 165.90479000000005, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "\u2212", "bbox": {"l": 168.12099, "t": 156.50012000000004, "r": 175.8699, "b": 165.90479000000005, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "EditDist (", "bbox": {"l": 179.27899, "t": 150.31799, "r": 221.95677, "b": 159.16479000000004, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "T$_{a}$, T$_{b}$", "bbox": {"l": 221.95200000000003, "t": 150.31799, "r": 246.34663, "b": 159.16479000000004, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": ")", "bbox": {"l": 246.84499999999997, "t": 150.31799, "r": 250.71945, "b": 159.16479000000004, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "max (", "bbox": {"l": 182.21201, "t": 163.89197000000001, "r": 206.29161, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "|", "bbox": {"l": 206.289, "t": 163.33411, "r": 209.05661, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "T$_{a}$", "bbox": {"l": 209.056, "t": 163.89197000000001, "r": 219.19968, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "|", "bbox": {"l": 219.69700999999998, "t": 163.33411, "r": 222.46461000000002, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": ",", "bbox": {"l": 224.125, "t": 163.89197000000001, "r": 226.89261, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "|", "bbox": {"l": 228.55299000000002, "t": 163.33411, "r": 231.3206, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "T$_{b}$", "bbox": {"l": 231.31999, "t": 163.89197000000001, "r": 240.64563, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "|", "bbox": {"l": 241.144, "t": 163.33411, "r": 243.91161, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": ")", "bbox": {"l": 243.911, "t": 163.89197000000001, "r": 247.78545, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "(3)", "bbox": {"l": 274.746, "t": 157.21740999999997, "r": 286.3624, "b": 166.12396, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "text", "bbox": {"l": 50.111984, "t": 181.00298999999995, "r": 286.36285, "b": 213.97900000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9735319018363953, "cells": [{"id": 23, "text": "where", "bbox": {"l": 62.067001, "t": 181.16241000000002, "r": 86.405632, "b": 190.06897000000004, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "T$_{a}$", "bbox": {"l": 88.581001, "t": 181.00298999999995, "r": 98.724663, "b": 189.84978999999998, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "and", "bbox": {"l": 101.399, "t": 181.16241000000002, "r": 115.785, "b": 190.06897000000004, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "T$_{b}$", "bbox": {"l": 117.961, "t": 181.00298999999995, "r": 127.28664, "b": 189.84978999999998, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "represent tables in tree structure HTML", "bbox": {"l": 129.95999, "t": 181.16241000000002, "r": 286.36285, "b": 190.06897000000004, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "format. EditDist denotes the tree-edit distance, and", "bbox": {"l": 50.111992, "t": 193.11743, "r": 252.78116000000003, "b": 202.02399000000003, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "|", "bbox": {"l": 255.18201, "t": 192.40015000000005, "r": 257.94962, "b": 201.80480999999997, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "T", "bbox": {"l": 257.94901, "t": 192.95800999999994, "r": 263.77115, "b": 201.80480999999997, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "|", "bbox": {"l": 265.155, "t": 192.40015000000005, "r": 267.92261, "b": 201.80480999999997, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "rep-", "bbox": {"l": 270.32199, "t": 193.11743, "r": 286.36179, "b": 202.02399000000003, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "resents the number of nodes in", "bbox": {"l": 50.111984, "t": 205.07245, "r": 172.13388, "b": 213.97900000000004, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "T", "bbox": {"l": 174.62399, "t": 204.91301999999996, "r": 180.44614, "b": 213.75982999999997, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": ".", "bbox": {"l": 181.82899, "t": 205.07245, "r": 184.31964, "b": 213.97900000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "section_header", "bbox": {"l": 50.112, "t": 224.81946000000005, "r": 170.45169, "b": 234.67151, "coord_origin": "TOPLEFT"}, "confidence": 0.9588837027549744, "cells": [{"id": 36, "text": "5.4.", "bbox": {"l": 50.112, "t": 224.81946000000005, "r": 64.551605, "b": 234.67151, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "Quantitative Analysis", "bbox": {"l": 74.178009, "t": 224.81946000000005, "r": 170.45169, "b": 234.67151, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 50.112, "t": 243.6499, "r": 286.36514, "b": 396.13794, "coord_origin": "TOPLEFT"}, "confidence": 0.9855090975761414, "cells": [{"id": 38, "text": "Structure.", "bbox": {"l": 62.067001, "t": 243.6499, "r": 105.32461, "b": 252.60626000000002, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "As shown in Tab.", "bbox": {"l": 112.12600000000002, "t": 243.76946999999996, "r": 184.68361, "b": 252.67602999999997, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "2, TableFormer outper-", "bbox": {"l": 191.4781, "t": 243.76946999999996, "r": 286.36188, "b": 252.67602999999997, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "forms all SOTA methods across different datasets by a large", "bbox": {"l": 50.112, "t": 255.72448999999995, "r": 286.36508, "b": 264.63104, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "margin for predicting the table structure from an image.", "bbox": {"l": 50.112, "t": 267.67949999999996, "r": 286.36508, "b": 276.58606, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "All the more, our model outperforms pre-trained methods.", "bbox": {"l": 50.112, "t": 279.63446, "r": 286.36508, "b": 288.54105, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "During the evaluation we do not apply any table filtering.", "bbox": {"l": 50.112, "t": 291.59048, "r": 286.36514, "b": 300.49704, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "We also provide our baseline results on the SynthTabNet", "bbox": {"l": 50.112, "t": 303.54547, "r": 286.36508, "b": 312.45203000000004, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "dataset. It has been observed that large tables (e.g. tables", "bbox": {"l": 50.112, "t": 315.50046, "r": 286.36505, "b": 324.40700999999996, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "that occupy half of the page or more) yield poor predictions.", "bbox": {"l": 50.112, "t": 327.45544, "r": 286.36508, "b": 336.362, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "We attribute this issue to the image resizing during the pre-", "bbox": {"l": 50.112, "t": 339.41043, "r": 286.36508, "b": 348.31699000000003, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "processing step, that produces downsampled images with", "bbox": {"l": 50.112, "t": 351.36542, "r": 286.36505, "b": 360.27197, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "indistinguishable features. This problem can be addressed", "bbox": {"l": 50.112, "t": 363.32141, "r": 286.36508, "b": 372.2279700000001, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "by treating such big tables with a separate model which ac-", "bbox": {"l": 50.112, "t": 375.2764, "r": 286.36511, "b": 384.18295000000006, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "cepts a large input image size.", "bbox": {"l": 50.112, "t": 387.23138, "r": 170.01187, "b": 396.13794, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "table", "bbox": {"l": 53.368526458740234, "t": 409.1357727050781, "r": 283.0443420410156, "b": 582.3977661132812, "coord_origin": "TOPLEFT"}, "confidence": 0.9892510175704956, "cells": [{"id": 53, "text": "Model", "bbox": {"l": 78.843002, "t": 420.69037, "r": 104.85535, "b": 429.59692, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "TEDS", "bbox": {"l": 211.2, "t": 414.71237, "r": 236.10649, "b": 423.61893, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "Dataset", "bbox": {"l": 129.338, "t": 426.66736, "r": 159.21584, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Simple", "bbox": {"l": 171.17096, "t": 426.66736, "r": 199.40497, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Complex", "bbox": {"l": 211.36009, "t": 426.66736, "r": 247.74349999999998, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "All", "bbox": {"l": 264.54044, "t": 426.66736, "r": 277.27264, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "EDD", "bbox": {"l": 81.612, "t": 443.62436, "r": 102.08514, "b": 452.53091, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "PTN", "bbox": {"l": 134.87206, "t": 443.62436, "r": 153.69141, "b": 452.53091, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "91.1", "bbox": {"l": 176.56554, "t": 443.62436, "r": 194.00009, "b": 452.53091, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "88.7", "bbox": {"l": 220.82938000000001, "t": 443.62436, "r": 238.26393, "b": 452.53091, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "89.9", "bbox": {"l": 262.18414, "t": 443.62436, "r": 279.61868, "b": 452.53091, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "GTE", "bbox": {"l": 82.165001, "t": 455.58035, "r": 101.5323, "b": 464.48691, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "PTN", "bbox": {"l": 134.86716, "t": 455.58035, "r": 153.68651, "b": 464.48691, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "-", "bbox": {"l": 183.62411, "t": 455.58035, "r": 186.94167, "b": 464.48691, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "-", "bbox": {"l": 227.88795000000002, "t": 455.58035, "r": 231.20551, "b": 464.48691, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "93.01", "bbox": {"l": 259.69855, "t": 455.58035, "r": 282.11441, "b": 464.48691, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 468.13336, "r": 117.38329000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "PTN", "bbox": {"l": 134.86766, "t": 468.13336, "r": 153.68701, "b": 477.03992, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "98.5", "bbox": {"l": 176.57111, "t": 468.13336, "r": 194.00566, "b": 477.03992, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "95.0", "bbox": {"l": 220.83495, "t": 468.13336, "r": 238.26950000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "96.75", "bbox": {"l": 259.698, "t": 468.01379, "r": 282.11386, "b": 476.97018, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "EDD", "bbox": {"l": 81.612, "t": 483.32635, "r": 102.08514, "b": 492.23291, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "FTN", "bbox": {"l": 134.87206, "t": 483.32635, "r": 153.69141, "b": 492.23291, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "88.4", "bbox": {"l": 176.56554, "t": 483.32635, "r": 194.00009, "b": 492.23291, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "92.08", "bbox": {"l": 218.33870999999996, "t": 483.32635, "r": 240.75455999999997, "b": 492.23291, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "90.6", "bbox": {"l": 262.18411, "t": 483.32635, "r": 279.61865, "b": 492.23291, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "GTE", "bbox": {"l": 82.165001, "t": 495.28134, "r": 101.5323, "b": 504.1879, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "FTN", "bbox": {"l": 134.86716, "t": 495.28134, "r": 153.68651, "b": 504.1879, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "-", "bbox": {"l": 183.62411, "t": 495.28134, "r": 186.94167, "b": 504.1879, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "-", "bbox": {"l": 227.88795000000002, "t": 495.28134, "r": 231.20551, "b": 504.1879, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "87.14", "bbox": {"l": 259.69855, "t": 495.28134, "r": 282.11441, "b": 504.1879, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "GTE (FT)", "bbox": {"l": 71.789001, "t": 507.23633, "r": 111.90838999999998, "b": 516.14288, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "FTN", "bbox": {"l": 134.86221, "t": 507.23633, "r": 153.68156, "b": 516.14288, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "-", "bbox": {"l": 183.62914, "t": 507.23633, "r": 186.94669, "b": 516.14288, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "-", "bbox": {"l": 227.89297, "t": 507.23633, "r": 231.21053000000003, "b": 516.14288, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "91.02", "bbox": {"l": 259.6936, "t": 507.23633, "r": 282.10947, "b": 516.14288, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 519.1913099999999, "r": 117.38329000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "FTN", "bbox": {"l": 134.86766, "t": 519.1913099999999, "r": 153.68701, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "97.5", "bbox": {"l": 176.57111, "t": 519.1913099999999, "r": 194.00566, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "96.0", "bbox": {"l": 220.83495, "t": 519.1913099999999, "r": 238.26950000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "96.8", "bbox": {"l": 262.189, "t": 519.0717500000001, "r": 279.62354, "b": 528.02814, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "EDD", "bbox": {"l": 81.612, "t": 536.49837, "r": 102.08514, "b": 545.40492, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "TB", "bbox": {"l": 137.91064, "t": 536.49837, "r": 150.64285, "b": 545.40492, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "86.0", "bbox": {"l": 176.56554, "t": 536.49837, "r": 194.00009, "b": 545.40492, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "-", "bbox": {"l": 227.89285, "t": 536.49837, "r": 231.21040000000002, "b": 545.40492, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "86.0", "bbox": {"l": 262.18411, "t": 536.49837, "r": 279.61865, "b": 545.40492, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 548.45436, "r": 117.38329000000002, "b": 557.36092, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "TB", "bbox": {"l": 137.90625, "t": 548.45436, "r": 150.63846, "b": 557.36092, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "89.6", "bbox": {"l": 176.57111, "t": 548.45436, "r": 194.00566, "b": 557.36092, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "-", "bbox": {"l": 227.88845999999998, "t": 548.45436, "r": 231.20601, "b": 557.36092, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "89.6", "bbox": {"l": 262.189, "t": 548.3348100000001, "r": 279.62354, "b": 557.2911799999999, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 568.00237, "r": 117.38329000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "STN", "bbox": {"l": 134.86766, "t": 568.00237, "r": 153.68701, "b": 576.90892, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "96.9", "bbox": {"l": 176.57111, "t": 568.00237, "r": 194.00566, "b": 576.90892, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "95.7", "bbox": {"l": 220.83495, "t": 568.00237, "r": 238.26950000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "96.7", "bbox": {"l": 262.1897, "t": 568.00237, "r": 279.62424, "b": 576.90892, "coord_origin": "TOPLEFT"}}], "children": [{"id": 17, "label": "text", "bbox": {"l": 78.843002, "t": 420.69037, "r": 104.85535, "b": 429.59692, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "Model", "bbox": {"l": 78.843002, "t": 420.69037, "r": 104.85535, "b": 429.59692, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 211.2, "t": 414.71237, "r": 236.10649, "b": 423.61893, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "TEDS", "bbox": {"l": 211.2, "t": 414.71237, "r": 236.10649, "b": 423.61893, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 129.338, "t": 426.66736, "r": 159.21584, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "Dataset", "bbox": {"l": 129.338, "t": 426.66736, "r": 159.21584, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 171.17096, "t": 426.66736, "r": 199.40497, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "Simple", "bbox": {"l": 171.17096, "t": 426.66736, "r": 199.40497, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 211.36009, "t": 426.66736, "r": 247.74349999999998, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "Complex", "bbox": {"l": 211.36009, "t": 426.66736, "r": 247.74349999999998, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 264.54044, "t": 426.66736, "r": 277.27264, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "All", "bbox": {"l": 264.54044, "t": 426.66736, "r": 277.27264, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 81.612, "t": 443.62436, "r": 102.08514, "b": 452.53091, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "EDD", "bbox": {"l": 81.612, "t": 443.62436, "r": 102.08514, "b": 452.53091, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 134.87206, "t": 443.62436, "r": 153.69141, "b": 452.53091, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "PTN", "bbox": {"l": 134.87206, "t": 443.62436, "r": 153.69141, "b": 452.53091, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 176.56554, "t": 443.62436, "r": 194.00009, "b": 452.53091, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "91.1", "bbox": {"l": 176.56554, "t": 443.62436, "r": 194.00009, "b": 452.53091, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 220.82938000000001, "t": 443.62436, "r": 238.26393, "b": 452.53091, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "88.7", "bbox": {"l": 220.82938000000001, "t": 443.62436, "r": 238.26393, "b": 452.53091, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 262.18414, "t": 443.62436, "r": 279.61868, "b": 452.53091, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "89.9", "bbox": {"l": 262.18414, "t": 443.62436, "r": 279.61868, "b": 452.53091, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 82.165001, "t": 455.58035, "r": 101.5323, "b": 464.48691, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "GTE", "bbox": {"l": 82.165001, "t": 455.58035, "r": 101.5323, "b": 464.48691, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 134.86716, "t": 455.58035, "r": 153.68651, "b": 464.48691, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "PTN", "bbox": {"l": 134.86716, "t": 455.58035, "r": 153.68651, "b": 464.48691, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 183.62411, "t": 455.58035, "r": 186.94167, "b": 464.48691, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "-", "bbox": {"l": 183.62411, "t": 455.58035, "r": 186.94167, "b": 464.48691, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 227.88795000000002, "t": 455.58035, "r": 231.20551, "b": 464.48691, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "-", "bbox": {"l": 227.88795000000002, "t": 455.58035, "r": 231.20551, "b": 464.48691, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 259.69855, "t": 455.58035, "r": 282.11441, "b": 464.48691, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "93.01", "bbox": {"l": 259.69855, "t": 455.58035, "r": 282.11441, "b": 464.48691, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 66.315002, "t": 468.13336, "r": 117.38329000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 468.13336, "r": 117.38329000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 134.86766, "t": 468.13336, "r": 153.68701, "b": 477.03992, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "PTN", "bbox": {"l": 134.86766, "t": 468.13336, "r": 153.68701, "b": 477.03992, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 176.57111, "t": 468.13336, "r": 194.00566, "b": 477.03992, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "98.5", "bbox": {"l": 176.57111, "t": 468.13336, "r": 194.00566, "b": 477.03992, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 220.83495, "t": 468.13336, "r": 238.26950000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "95.0", "bbox": {"l": 220.83495, "t": 468.13336, "r": 238.26950000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 259.698, "t": 468.01379, "r": 282.11386, "b": 476.97018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "96.75", "bbox": {"l": 259.698, "t": 468.01379, "r": 282.11386, "b": 476.97018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 81.612, "t": 483.32635, "r": 102.08514, "b": 492.23291, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "EDD", "bbox": {"l": 81.612, "t": 483.32635, "r": 102.08514, "b": 492.23291, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 134.87206, "t": 483.32635, "r": 153.69141, "b": 492.23291, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "FTN", "bbox": {"l": 134.87206, "t": 483.32635, "r": 153.69141, "b": 492.23291, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 176.56554, "t": 483.32635, "r": 194.00009, "b": 492.23291, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "88.4", "bbox": {"l": 176.56554, "t": 483.32635, "r": 194.00009, "b": 492.23291, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 218.33870999999996, "t": 483.32635, "r": 240.75455999999997, "b": 492.23291, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "92.08", "bbox": {"l": 218.33870999999996, "t": 483.32635, "r": 240.75455999999997, "b": 492.23291, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 262.18411, "t": 483.32635, "r": 279.61865, "b": 492.23291, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "90.6", "bbox": {"l": 262.18411, "t": 483.32635, "r": 279.61865, "b": 492.23291, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 82.165001, "t": 495.28134, "r": 101.5323, "b": 504.1879, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "GTE", "bbox": {"l": 82.165001, "t": 495.28134, "r": 101.5323, "b": 504.1879, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 134.86716, "t": 495.28134, "r": 153.68651, "b": 504.1879, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "FTN", "bbox": {"l": 134.86716, "t": 495.28134, "r": 153.68651, "b": 504.1879, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 183.62411, "t": 495.28134, "r": 186.94167, "b": 504.1879, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "-", "bbox": {"l": 183.62411, "t": 495.28134, "r": 186.94167, "b": 504.1879, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 227.88795000000002, "t": 495.28134, "r": 231.20551, "b": 504.1879, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "-", "bbox": {"l": 227.88795000000002, "t": 495.28134, "r": 231.20551, "b": 504.1879, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 259.69855, "t": 495.28134, "r": 282.11441, "b": 504.1879, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "87.14", "bbox": {"l": 259.69855, "t": 495.28134, "r": 282.11441, "b": 504.1879, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 71.789001, "t": 507.23633, "r": 111.90838999999998, "b": 516.14288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "GTE (FT)", "bbox": {"l": 71.789001, "t": 507.23633, "r": 111.90838999999998, "b": 516.14288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 134.86221, "t": 507.23633, "r": 153.68156, "b": 516.14288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "FTN", "bbox": {"l": 134.86221, "t": 507.23633, "r": 153.68156, "b": 516.14288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 183.62914, "t": 507.23633, "r": 186.94669, "b": 516.14288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "-", "bbox": {"l": 183.62914, "t": 507.23633, "r": 186.94669, "b": 516.14288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 227.89297, "t": 507.23633, "r": 231.21053000000003, "b": 516.14288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "-", "bbox": {"l": 227.89297, "t": 507.23633, "r": 231.21053000000003, "b": 516.14288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 259.6936, "t": 507.23633, "r": 282.10947, "b": 516.14288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "91.02", "bbox": {"l": 259.6936, "t": 507.23633, "r": 282.10947, "b": 516.14288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 66.315002, "t": 519.1913099999999, "r": 117.38329000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 519.1913099999999, "r": 117.38329000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 134.86766, "t": 519.1913099999999, "r": 153.68701, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "FTN", "bbox": {"l": 134.86766, "t": 519.1913099999999, "r": 153.68701, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 176.57111, "t": 519.1913099999999, "r": 194.00566, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "97.5", "bbox": {"l": 176.57111, "t": 519.1913099999999, "r": 194.00566, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 220.83495, "t": 519.1913099999999, "r": 238.26950000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "96.0", "bbox": {"l": 220.83495, "t": 519.1913099999999, "r": 238.26950000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 262.189, "t": 519.0717500000001, "r": 279.62354, "b": 528.02814, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "96.8", "bbox": {"l": 262.189, "t": 519.0717500000001, "r": 279.62354, "b": 528.02814, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 81.612, "t": 536.49837, "r": 102.08514, "b": 545.40492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "EDD", "bbox": {"l": 81.612, "t": 536.49837, "r": 102.08514, "b": 545.40492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 137.91064, "t": 536.49837, "r": 150.64285, "b": 545.40492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "TB", "bbox": {"l": 137.91064, "t": 536.49837, "r": 150.64285, "b": 545.40492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 176.56554, "t": 536.49837, "r": 194.00009, "b": 545.40492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "86.0", "bbox": {"l": 176.56554, "t": 536.49837, "r": 194.00009, "b": 545.40492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 227.89285, "t": 536.49837, "r": 231.21040000000002, "b": 545.40492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "-", "bbox": {"l": 227.89285, "t": 536.49837, "r": 231.21040000000002, "b": 545.40492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 262.18411, "t": 536.49837, "r": 279.61865, "b": 545.40492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "86.0", "bbox": {"l": 262.18411, "t": 536.49837, "r": 279.61865, "b": 545.40492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 66.315002, "t": 548.45436, "r": 117.38329000000002, "b": 557.36092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 548.45436, "r": 117.38329000000002, "b": 557.36092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 137.90625, "t": 548.45436, "r": 150.63846, "b": 557.36092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "TB", "bbox": {"l": 137.90625, "t": 548.45436, "r": 150.63846, "b": 557.36092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 176.57111, "t": 548.45436, "r": 194.00566, "b": 557.36092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "89.6", "bbox": {"l": 176.57111, "t": 548.45436, "r": 194.00566, "b": 557.36092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 227.88845999999998, "t": 548.45436, "r": 231.20601, "b": 557.36092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "-", "bbox": {"l": 227.88845999999998, "t": 548.45436, "r": 231.20601, "b": 557.36092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 262.189, "t": 548.3348100000001, "r": 279.62354, "b": 557.2911799999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": "89.6", "bbox": {"l": 262.189, "t": 548.3348100000001, "r": 279.62354, "b": 557.2911799999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 66.315002, "t": 568.00237, "r": 117.38329000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 568.00237, "r": 117.38329000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 134.86766, "t": 568.00237, "r": 153.68701, "b": 576.90892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "STN", "bbox": {"l": 134.86766, "t": 568.00237, "r": 153.68701, "b": 576.90892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 176.57111, "t": 568.00237, "r": 194.00566, "b": 576.90892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": "96.9", "bbox": {"l": 176.57111, "t": 568.00237, "r": 194.00566, "b": 576.90892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 220.83495, "t": 568.00237, "r": 238.26950000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 107, "text": "95.7", "bbox": {"l": 220.83495, "t": 568.00237, "r": 238.26950000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 262.1897, "t": 568.00237, "r": 279.62424, "b": 576.90892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 108, "text": "96.7", "bbox": {"l": 262.1897, "t": 568.00237, "r": 279.62424, "b": 576.90892, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 15, "label": "text", "bbox": {"l": 50.112, "t": 592.43336, "r": 286.36511, "b": 613.29492, "coord_origin": "TOPLEFT"}, "confidence": 0.7209173440933228, "cells": [{"id": 109, "text": "Table 2: Structure results on PubTabNet (PTN), FinTabNet", "bbox": {"l": 50.112, "t": 592.43336, "r": 286.36511, "b": 601.33992, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "(FTN), TableBank (TB) and SynthTabNet (STN).", "bbox": {"l": 50.112, "t": 604.38837, "r": 247.46114, "b": 613.29492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 50.112, "t": 616.34337, "r": 261.78732, "b": 625.24992, "coord_origin": "TOPLEFT"}, "confidence": 0.6433312892913818, "cells": [{"id": 111, "text": "FT: Model was trained on PubTabNet then finetuned.", "bbox": {"l": 50.112, "t": 616.34337, "r": 261.78732, "b": 625.24992, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 50.112015, "t": 644.3498099999999, "r": 286.366, "b": 713.151932, "coord_origin": "TOPLEFT"}, "confidence": 0.9854635000228882, "cells": [{"id": 112, "text": "Cell Detection.", "bbox": {"l": 62.067001, "t": 644.3498099999999, "r": 124.72179, "b": 653.30618, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "Like any object detector, our", "bbox": {"l": 128.20401, "t": 644.46936, "r": 242.9333, "b": 653.37592, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "Cell BBox", "bbox": {"l": 245.55401999999998, "t": 644.55902, "r": 286.36084, "b": 653.1467700000001, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "Detector", "bbox": {"l": 50.112015, "t": 656.51402, "r": 84.971146, "b": 665.10178, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "provides bounding boxes that can be improved", "bbox": {"l": 89.515015, "t": 656.42436, "r": 286.366, "b": 665.33092, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "with post-processing during inference. We make use of the", "bbox": {"l": 50.112015, "t": 668.37936, "r": 286.36511, "b": 677.28593, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "grid-like structure of tables to refine the predictions. A de-", "bbox": {"l": 50.112015, "t": 680.33536, "r": 286.36505, "b": 689.24193, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "tailed explanation on the post-processing is available in the", "bbox": {"l": 50.112015, "t": 692.290359, "r": 286.36511, "b": 701.19693, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "supplementary material. As shown in Tab. 3, we evaluate", "bbox": {"l": 50.112015, "t": 704.245361, "r": 286.36508, "b": 713.151932, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "text", "bbox": {"l": 308.862, "t": 75.20836999999995, "r": 545.11517, "b": 227.57709, "coord_origin": "TOPLEFT"}, "confidence": 0.9713197946548462, "cells": [{"id": 121, "text": "our", "bbox": {"l": 308.862, "t": 75.20836999999995, "r": 322.14215, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Cell BBox Decoder", "bbox": {"l": 325.45401, "t": 75.29803000000004, "r": 404.56702, "b": 83.88580000000002, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "accuracy for cells with a class la-", "bbox": {"l": 408.104, "t": 75.20836999999995, "r": 545.10968, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "bel of \u2018content\u2019 only using the PASCAL VOC mAP metric", "bbox": {"l": 308.862, "t": 87.16339000000005, "r": 545.11511, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "for pre-processing and post-processing.", "bbox": {"l": 308.862, "t": 99.11841000000004, "r": 470.22626, "b": 108.02495999999985, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "Note that we do", "bbox": {"l": 477.52884, "t": 99.11841000000004, "r": 545.11511, "b": 108.02495999999985, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "not have post-processing results for SynthTabNet as images", "bbox": {"l": 308.862, "t": 111.07343000000003, "r": 545.11517, "b": 119.97997999999984, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "are only provided. To compare the performance of our pro-", "bbox": {"l": 308.862, "t": 123.02844000000005, "r": 545.11511, "b": 131.93499999999995, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "posed approach, we\u2019ve integrated TableFormer\u2019s", "bbox": {"l": 308.862, "t": 134.98443999999995, "r": 502.01691000000005, "b": 143.89099, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "Cell BBox", "bbox": {"l": 504.47299, "t": 135.07410000000004, "r": 545.11041, "b": 143.66187000000002, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "Decoder", "bbox": {"l": 308.862, "t": 147.02910999999995, "r": 343.16324, "b": 155.61688000000004, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "into EDD architecture. As mentioned previously,", "bbox": {"l": 346.371, "t": 146.93944999999997, "r": 545.11493, "b": 155.84600999999998, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "the Structure Decoder provides the", "bbox": {"l": 308.862, "t": 158.89446999999996, "r": 446.15652, "b": 167.80102999999997, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "Cell BBox Decoder", "bbox": {"l": 448.28998000000007, "t": 158.98413000000005, "r": 525.04181, "b": 167.57190000000003, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "with", "bbox": {"l": 527.39899, "t": 158.89446999999996, "r": 545.11249, "b": 167.80102999999997, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "the features needed to predict the bounding box predictions.", "bbox": {"l": 308.862, "t": 170.84948999999995, "r": 545.11511, "b": 179.75603999999998, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "Therefore, the accuracy of the", "bbox": {"l": 308.862, "t": 182.80449999999996, "r": 432.86642000000006, "b": 191.71105999999997, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "Structure Decoder", "bbox": {"l": 436.39001, "t": 182.89417000000003, "r": 510.93021, "b": 191.48193000000003, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "directly", "bbox": {"l": 514.677, "t": 182.80449999999996, "r": 545.11273, "b": 191.71105999999997, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "influences the accuracy of the", "bbox": {"l": 308.862, "t": 194.75951999999995, "r": 431.17285, "b": 203.66607999999997, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "Cell BBox Decoder", "bbox": {"l": 434.6790199999999, "t": 194.84918000000005, "r": 514.18054, "b": 203.43695000000002, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": ". If the", "bbox": {"l": 514.17603, "t": 194.75951999999995, "r": 545.10992, "b": 203.66607999999997, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "Structure Decoder", "bbox": {"l": 308.86203, "t": 206.80517999999995, "r": 382.35614, "b": 215.39293999999995, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "predicts an extra column, this will result", "bbox": {"l": 385.07501, "t": 206.71551999999997, "r": 545.11426, "b": 215.62207, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "in an extra column of predicted bounding boxes.", "bbox": {"l": 308.862, "t": 218.67052999999999, "r": 501.6981799999999, "b": 227.57709, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "table", "bbox": {"l": 308.4068603515625, "t": 247.87631225585938, "r": 533.6419677734375, "b": 303.8056640625, "coord_origin": "TOPLEFT"}, "confidence": 0.9691730737686157, "cells": [{"id": 146, "text": "Model", "bbox": {"l": 339.323, "t": 253.66436999999996, "r": 365.33536, "b": 262.57092, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "Dataset", "bbox": {"l": 401.04132, "t": 253.66436999999996, "r": 430.91916, "b": 262.57092, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "mAP", "bbox": {"l": 454.10214, "t": 253.66436999999996, "r": 474.58523999999994, "b": 262.57092, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "mAP (PP)", "bbox": {"l": 486.54034, "t": 253.66436999999996, "r": 527.2276, "b": 262.57092, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "EDD+BBox", "bbox": {"l": 327.65601, "t": 270.62134000000003, "r": 377.00076, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "PubTabNet", "bbox": {"l": 393.69809, "t": 270.62134000000003, "r": 438.28073, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "79.2", "bbox": {"l": 455.63559, "t": 270.62134000000003, "r": 473.07013, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "82.7", "bbox": {"l": 498.16592, "t": 270.62134000000003, "r": 515.60046, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "TableFormer", "bbox": {"l": 326.79501, "t": 282.57631999999995, "r": 377.86331, "b": 291.48288, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "PubTabNet", "bbox": {"l": 393.69388, "t": 282.57631999999995, "r": 438.27652, "b": 291.48288, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "82.1", "bbox": {"l": 455.63101, "t": 282.45676, "r": 473.06555000000003, "b": 291.41315, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "86.8", "bbox": {"l": 498.1713, "t": 282.45676, "r": 515.60583, "b": 291.41315, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "TableFormer", "bbox": {"l": 326.79501, "t": 294.53131, "r": 377.86331, "b": 303.43787, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "SynthTabNet", "bbox": {"l": 389.81842, "t": 294.53131, "r": 442.15194999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "87.7", "bbox": {"l": 455.63135, "t": 294.53131, "r": 473.06589, "b": 303.43787, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "-", "bbox": {"l": 505.22515999999996, "t": 294.53131, "r": 508.54268999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}}], "children": [{"id": 73, "label": "text", "bbox": {"l": 339.323, "t": 253.66436999999996, "r": 365.33536, "b": 262.57092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 146, "text": "Model", "bbox": {"l": 339.323, "t": 253.66436999999996, "r": 365.33536, "b": 262.57092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 401.04132, "t": 253.66436999999996, "r": 430.91916, "b": 262.57092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 147, "text": "Dataset", "bbox": {"l": 401.04132, "t": 253.66436999999996, "r": 430.91916, "b": 262.57092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 454.10214, "t": 253.66436999999996, "r": 474.58523999999994, "b": 262.57092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 148, "text": "mAP", "bbox": {"l": 454.10214, "t": 253.66436999999996, "r": 474.58523999999994, "b": 262.57092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 486.54034, "t": 253.66436999999996, "r": 527.2276, "b": 262.57092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 149, "text": "mAP (PP)", "bbox": {"l": 486.54034, "t": 253.66436999999996, "r": 527.2276, "b": 262.57092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 327.65601, "t": 270.62134000000003, "r": 377.00076, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 150, "text": "EDD+BBox", "bbox": {"l": 327.65601, "t": 270.62134000000003, "r": 377.00076, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 393.69809, "t": 270.62134000000003, "r": 438.28073, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 151, "text": "PubTabNet", "bbox": {"l": 393.69809, "t": 270.62134000000003, "r": 438.28073, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 455.63559, "t": 270.62134000000003, "r": 473.07013, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 152, "text": "79.2", "bbox": {"l": 455.63559, "t": 270.62134000000003, "r": 473.07013, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 498.16592, "t": 270.62134000000003, "r": 515.60046, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 153, "text": "82.7", "bbox": {"l": 498.16592, "t": 270.62134000000003, "r": 515.60046, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 326.79501, "t": 282.57631999999995, "r": 377.86331, "b": 291.48288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 154, "text": "TableFormer", "bbox": {"l": 326.79501, "t": 282.57631999999995, "r": 377.86331, "b": 291.48288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 393.69388, "t": 282.57631999999995, "r": 438.27652, "b": 291.48288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 155, "text": "PubTabNet", "bbox": {"l": 393.69388, "t": 282.57631999999995, "r": 438.27652, "b": 291.48288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 455.63101, "t": 282.45676, "r": 473.06555000000003, "b": 291.41315, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 156, "text": "82.1", "bbox": {"l": 455.63101, "t": 282.45676, "r": 473.06555000000003, "b": 291.41315, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 498.1713, "t": 282.45676, "r": 515.60583, "b": 291.41315, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 157, "text": "86.8", "bbox": {"l": 498.1713, "t": 282.45676, "r": 515.60583, "b": 291.41315, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 326.79501, "t": 294.53131, "r": 377.86331, "b": 303.43787, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 158, "text": "TableFormer", "bbox": {"l": 326.79501, "t": 294.53131, "r": 377.86331, "b": 303.43787, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 389.81842, "t": 294.53131, "r": 442.15194999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 159, "text": "SynthTabNet", "bbox": {"l": 389.81842, "t": 294.53131, "r": 442.15194999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 455.63135, "t": 294.53131, "r": 473.06589, "b": 303.43787, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 160, "text": "87.7", "bbox": {"l": 455.63135, "t": 294.53131, "r": 473.06589, "b": 303.43787, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 505.22515999999996, "t": 294.53131, "r": 508.54268999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 161, "text": "-", "bbox": {"l": 505.22515999999996, "t": 294.53131, "r": 508.54268999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 12, "label": "caption", "bbox": {"l": 308.862, "t": 316.44931, "r": 545.11517, "b": 337.3108500000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9519917964935303, "cells": [{"id": 162, "text": "Table 3:", "bbox": {"l": 308.862, "t": 316.44931, "r": 341.49951, "b": 325.35587, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "Cell Bounding Box detection results on PubTab-", "bbox": {"l": 348.60284, "t": 316.44931, "r": 545.11517, "b": 325.35587, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "Net, and FinTabNet. PP: Post-processing.", "bbox": {"l": 308.862, "t": 328.4043, "r": 474.97845, "b": 337.3108500000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "text", "bbox": {"l": 308.86197, "t": 367.6797199999999, "r": 545.11566, "b": 520.16769, "coord_origin": "TOPLEFT"}, "confidence": 0.9835010766983032, "cells": [{"id": 165, "text": "Cell Content.", "bbox": {"l": 320.81699, "t": 367.6797199999999, "r": 378.94876, "b": 376.63611, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "In this section, we evaluate the entire", "bbox": {"l": 387.07898, "t": 367.79929, "r": 545.11566, "b": 376.70584, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "pipeline of recovering a table with content.", "bbox": {"l": 308.86197, "t": 379.75426999999996, "r": 487.19257, "b": 388.66083, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "Here we put", "bbox": {"l": 493.96713, "t": 379.75426999999996, "r": 545.11511, "b": 388.66083, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "our approach to test by capitalizing on extracting content", "bbox": {"l": 308.86197, "t": 391.70926, "r": 545.11505, "b": 400.61581, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "from the PDF cells rather than decoding from images. Tab.", "bbox": {"l": 308.86197, "t": 403.66525, "r": 545.11523, "b": 412.57181, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "4", "bbox": {"l": 308.86197, "t": 415.62024, "r": 314.08096, "b": 424.52679, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "shows the TEDs score of HTML code representing the", "bbox": {"l": 316.69046, "t": 415.62024, "r": 545.11517, "b": 424.52679, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "structure of the table along with the content inserted in the", "bbox": {"l": 308.86197, "t": 427.57523, "r": 545.11505, "b": 436.48177999999996, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "data cell and compared with the ground-truth. Our method", "bbox": {"l": 308.86197, "t": 439.53021, "r": 545.11505, "b": 448.43677, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "achieved a", "bbox": {"l": 308.86197, "t": 451.4852, "r": 350.23666, "b": 460.39175, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "5.3%", "bbox": {"l": 352.17596, "t": 451.36563, "r": 374.59183, "b": 460.32201999999995, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "increase over the state-of-the-art, and com-", "bbox": {"l": 376.53296, "t": 451.4852, "r": 545.11011, "b": 460.39175, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "mercial solutions. We believe our scores would be higher", "bbox": {"l": 308.86197, "t": 463.44019, "r": 545.11511, "b": 472.34674, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "if the HTML ground-truth matched the extracted PDF cell", "bbox": {"l": 308.86197, "t": 475.39618, "r": 545.11517, "b": 484.30273, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "content. Unfortunately, there are small discrepancies such", "bbox": {"l": 308.86197, "t": 487.35117, "r": 545.11511, "b": 496.25772, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "as spacings around words or special characters with various", "bbox": {"l": 308.86197, "t": 499.30615, "r": 545.11505, "b": 508.21271, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "unicode representations.", "bbox": {"l": 308.86197, "t": 511.26114, "r": 405.69846, "b": 520.16769, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "table", "bbox": {"l": 332.9688720703125, "t": 540.2835693359375, "r": 520.942138671875, "b": 643.2697143554688, "coord_origin": "TOPLEFT"}, "confidence": 0.9775567650794983, "cells": [{"id": 183, "text": "Model", "bbox": {"l": 358.01099, "t": 552.23337, "r": 384.02335, "b": 561.1399200000001, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "TEDS", "bbox": {"l": 449.03400000000005, "t": 546.25537, "r": 473.94049000000007, "b": 555.16193, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": "Simple", "bbox": {"l": 408.50598, "t": 558.21037, "r": 436.73999, "b": 567.11693, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "Complex", "bbox": {"l": 448.6951, "t": 558.21037, "r": 485.07849, "b": 567.11693, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "All", "bbox": {"l": 499.3848, "t": 558.21037, "r": 512.117, "b": 567.11693, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": "Tabula", "bbox": {"l": 357.68201, "t": 575.16736, "r": 384.3519, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "78.0", "bbox": {"l": 413.90097, "t": 575.16736, "r": 431.33550999999994, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "57.8", "bbox": {"l": 458.16479000000004, "t": 575.16736, "r": 475.59933000000007, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "67.9", "bbox": {"l": 497.0289, "t": 575.16736, "r": 514.46344, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": "Traprange", "bbox": {"l": 350.72299, "t": 587.12236, "r": 391.31064, "b": 596.02892, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "60.8", "bbox": {"l": 413.90582, "t": 587.12236, "r": 431.34036, "b": 596.02892, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "49.9", "bbox": {"l": 458.16965, "t": 587.12236, "r": 475.60419, "b": 596.02892, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "55.4", "bbox": {"l": 497.03374999999994, "t": 587.12236, "r": 514.46832, "b": 596.02892, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "Camelot", "bbox": {"l": 354.13599, "t": 599.07835, "r": 387.89923, "b": 607.98491, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "80.0", "bbox": {"l": 413.90161, "t": 599.07835, "r": 431.33615, "b": 607.98491, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "66.0", "bbox": {"l": 458.16544, "t": 599.07835, "r": 475.59998, "b": 607.98491, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "73.0", "bbox": {"l": 497.02954000000005, "t": 599.07835, "r": 514.46411, "b": 607.98491, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "Acrobat Pro", "bbox": {"l": 346.55899, "t": 611.03336, "r": 395.47534, "b": 619.93991, "coord_origin": "TOPLEFT"}}, {"id": 201, "text": "68.9", "bbox": {"l": 413.90616, "t": 611.03336, "r": 431.34069999999997, "b": 619.93991, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": "61.8", "bbox": {"l": 458.16998000000007, "t": 611.03336, "r": 475.60452, "b": 619.93991, "coord_origin": "TOPLEFT"}}, {"id": 203, "text": "65.3", "bbox": {"l": 497.03409, "t": 611.03336, "r": 514.46863, "b": 619.93991, "coord_origin": "TOPLEFT"}}, {"id": 204, "text": "EDD", "bbox": {"l": 360.78101, "t": 622.9883600000001, "r": 381.25415, "b": 631.89491, "coord_origin": "TOPLEFT"}}, {"id": 205, "text": "91.2", "bbox": {"l": 413.90158, "t": 622.9883600000001, "r": 431.33612, "b": 631.89491, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": "85.4", "bbox": {"l": 458.16541, "t": 622.9883600000001, "r": 475.59995000000004, "b": 631.89491, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": "88.3", "bbox": {"l": 497.0295100000001, "t": 622.9883600000001, "r": 514.46405, "b": 631.89491, "coord_origin": "TOPLEFT"}}, {"id": 208, "text": "TableFormer", "bbox": {"l": 345.483, "t": 634.94336, "r": 396.5513, "b": 643.84991, "coord_origin": "TOPLEFT"}}, {"id": 209, "text": "95.4", "bbox": {"l": 413.90616, "t": 634.94336, "r": 431.34069999999997, "b": 643.84991, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": "90.1", "bbox": {"l": 458.16998000000007, "t": 634.94336, "r": 475.60452, "b": 643.84991, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "93.6", "bbox": {"l": 497.03400000000005, "t": 634.82381, "r": 514.46857, "b": 643.78018, "coord_origin": "TOPLEFT"}}], "children": [{"id": 89, "label": "text", "bbox": {"l": 358.01099, "t": 552.23337, "r": 384.02335, "b": 561.1399200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 183, "text": "Model", "bbox": {"l": 358.01099, "t": 552.23337, "r": 384.02335, "b": 561.1399200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 449.03400000000005, "t": 546.25537, "r": 473.94049000000007, "b": 555.16193, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 184, "text": "TEDS", "bbox": {"l": 449.03400000000005, "t": 546.25537, "r": 473.94049000000007, "b": 555.16193, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 408.50598, "t": 558.21037, "r": 436.73999, "b": 567.11693, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 185, "text": "Simple", "bbox": {"l": 408.50598, "t": 558.21037, "r": 436.73999, "b": 567.11693, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 448.6951, "t": 558.21037, "r": 485.07849, "b": 567.11693, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 186, "text": "Complex", "bbox": {"l": 448.6951, "t": 558.21037, "r": 485.07849, "b": 567.11693, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 499.3848, "t": 558.21037, "r": 512.117, "b": 567.11693, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 187, "text": "All", "bbox": {"l": 499.3848, "t": 558.21037, "r": 512.117, "b": 567.11693, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 357.68201, "t": 575.16736, "r": 384.3519, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 188, "text": "Tabula", "bbox": {"l": 357.68201, "t": 575.16736, "r": 384.3519, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 413.90097, "t": 575.16736, "r": 431.33550999999994, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 189, "text": "78.0", "bbox": {"l": 413.90097, "t": 575.16736, "r": 431.33550999999994, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 458.16479000000004, "t": 575.16736, "r": 475.59933000000007, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 190, "text": "57.8", "bbox": {"l": 458.16479000000004, "t": 575.16736, "r": 475.59933000000007, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 497.0289, "t": 575.16736, "r": 514.46344, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 191, "text": "67.9", "bbox": {"l": 497.0289, "t": 575.16736, "r": 514.46344, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 350.72299, "t": 587.12236, "r": 391.31064, "b": 596.02892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 192, "text": "Traprange", "bbox": {"l": 350.72299, "t": 587.12236, "r": 391.31064, "b": 596.02892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 413.90582, "t": 587.12236, "r": 431.34036, "b": 596.02892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 193, "text": "60.8", "bbox": {"l": 413.90582, "t": 587.12236, "r": 431.34036, "b": 596.02892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 458.16965, "t": 587.12236, "r": 475.60419, "b": 596.02892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 194, "text": "49.9", "bbox": {"l": 458.16965, "t": 587.12236, "r": 475.60419, "b": 596.02892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 497.03374999999994, "t": 587.12236, "r": 514.46832, "b": 596.02892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 195, "text": "55.4", "bbox": {"l": 497.03374999999994, "t": 587.12236, "r": 514.46832, "b": 596.02892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 354.13599, "t": 599.07835, "r": 387.89923, "b": 607.98491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 196, "text": "Camelot", "bbox": {"l": 354.13599, "t": 599.07835, "r": 387.89923, "b": 607.98491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 413.90161, "t": 599.07835, "r": 431.33615, "b": 607.98491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 197, "text": "80.0", "bbox": {"l": 413.90161, "t": 599.07835, "r": 431.33615, "b": 607.98491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 458.16544, "t": 599.07835, "r": 475.59998, "b": 607.98491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 198, "text": "66.0", "bbox": {"l": 458.16544, "t": 599.07835, "r": 475.59998, "b": 607.98491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 497.02954000000005, "t": 599.07835, "r": 514.46411, "b": 607.98491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 199, "text": "73.0", "bbox": {"l": 497.02954000000005, "t": 599.07835, "r": 514.46411, "b": 607.98491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 346.55899, "t": 611.03336, "r": 395.47534, "b": 619.93991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 200, "text": "Acrobat Pro", "bbox": {"l": 346.55899, "t": 611.03336, "r": 395.47534, "b": 619.93991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 413.90616, "t": 611.03336, "r": 431.34069999999997, "b": 619.93991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 201, "text": "68.9", "bbox": {"l": 413.90616, "t": 611.03336, "r": 431.34069999999997, "b": 619.93991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 458.16998000000007, "t": 611.03336, "r": 475.60452, "b": 619.93991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 202, "text": "61.8", "bbox": {"l": 458.16998000000007, "t": 611.03336, "r": 475.60452, "b": 619.93991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 497.03409, "t": 611.03336, "r": 514.46863, "b": 619.93991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 203, "text": "65.3", "bbox": {"l": 497.03409, "t": 611.03336, "r": 514.46863, "b": 619.93991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 360.78101, "t": 622.9883600000001, "r": 381.25415, "b": 631.89491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 204, "text": "EDD", "bbox": {"l": 360.78101, "t": 622.9883600000001, "r": 381.25415, "b": 631.89491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 413.90158, "t": 622.9883600000001, "r": 431.33612, "b": 631.89491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 205, "text": "91.2", "bbox": {"l": 413.90158, "t": 622.9883600000001, "r": 431.33612, "b": 631.89491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 458.16541, "t": 622.9883600000001, "r": 475.59995000000004, "b": 631.89491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 206, "text": "85.4", "bbox": {"l": 458.16541, "t": 622.9883600000001, "r": 475.59995000000004, "b": 631.89491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 497.0295100000001, "t": 622.9883600000001, "r": 514.46405, "b": 631.89491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 207, "text": "88.3", "bbox": {"l": 497.0295100000001, "t": 622.9883600000001, "r": 514.46405, "b": 631.89491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 114, "label": "text", "bbox": {"l": 345.483, "t": 634.94336, "r": 396.5513, "b": 643.84991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 208, "text": "TableFormer", "bbox": {"l": 345.483, "t": 634.94336, "r": 396.5513, "b": 643.84991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 115, "label": "text", "bbox": {"l": 413.90616, "t": 634.94336, "r": 431.34069999999997, "b": 643.84991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 209, "text": "95.4", "bbox": {"l": 413.90616, "t": 634.94336, "r": 431.34069999999997, "b": 643.84991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 116, "label": "text", "bbox": {"l": 458.16998000000007, "t": 634.94336, "r": 475.60452, "b": 643.84991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 210, "text": "90.1", "bbox": {"l": 458.16998000000007, "t": 634.94336, "r": 475.60452, "b": 643.84991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 117, "label": "text", "bbox": {"l": 497.03400000000005, "t": 634.82381, "r": 514.46857, "b": 643.78018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 211, "text": "93.6", "bbox": {"l": 497.03400000000005, "t": 634.82381, "r": 514.46857, "b": 643.78018, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 11, "label": "caption", "bbox": {"l": 308.862, "t": 656.86136, "r": 545.11517, "b": 689.6779300000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9541404247283936, "cells": [{"id": 212, "text": "Table 4:", "bbox": {"l": 308.862, "t": 656.86136, "r": 341.73862, "b": 665.76792, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "Results of structure with content retrieved using", "bbox": {"l": 349.55927, "t": 656.86136, "r": 545.11517, "b": 665.76792, "coord_origin": "TOPLEFT"}}, {"id": 214, "text": "cell detection on PubTabNet. In all cases the input is PDF", "bbox": {"l": 308.862, "t": 668.81636, "r": 545.11505, "b": 677.7229199999999, "coord_origin": "TOPLEFT"}}, {"id": 215, "text": "documents with cropped tables.", "bbox": {"l": 308.862, "t": 680.77136, "r": 435.03836, "b": 689.6779300000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "page_footer", "bbox": {"l": 295.121, "t": 734.133358, "r": 300.10229, "b": 743.039921, "coord_origin": "TOPLEFT"}, "confidence": 0.8787972331047058, "cells": [{"id": 216, "text": "7", "bbox": {"l": 295.121, "t": 734.133358, "r": 300.10229, "b": 743.039921, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {"0": {"label": "table", "id": 0, "page_no": 6, "cluster": {"id": 0, "label": "table", "bbox": {"l": 53.368526458740234, "t": 409.1357727050781, "r": 283.0443420410156, "b": 582.3977661132812, "coord_origin": "TOPLEFT"}, "confidence": 0.9892510175704956, "cells": [{"id": 53, "text": "Model", "bbox": {"l": 78.843002, "t": 420.69037, "r": 104.85535, "b": 429.59692, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "TEDS", "bbox": {"l": 211.2, "t": 414.71237, "r": 236.10649, "b": 423.61893, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "Dataset", "bbox": {"l": 129.338, "t": 426.66736, "r": 159.21584, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Simple", "bbox": {"l": 171.17096, "t": 426.66736, "r": 199.40497, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Complex", "bbox": {"l": 211.36009, "t": 426.66736, "r": 247.74349999999998, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "All", "bbox": {"l": 264.54044, "t": 426.66736, "r": 277.27264, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "EDD", "bbox": {"l": 81.612, "t": 443.62436, "r": 102.08514, "b": 452.53091, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "PTN", "bbox": {"l": 134.87206, "t": 443.62436, "r": 153.69141, "b": 452.53091, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "91.1", "bbox": {"l": 176.56554, "t": 443.62436, "r": 194.00009, "b": 452.53091, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "88.7", "bbox": {"l": 220.82938000000001, "t": 443.62436, "r": 238.26393, "b": 452.53091, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "89.9", "bbox": {"l": 262.18414, "t": 443.62436, "r": 279.61868, "b": 452.53091, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "GTE", "bbox": {"l": 82.165001, "t": 455.58035, "r": 101.5323, "b": 464.48691, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "PTN", "bbox": {"l": 134.86716, "t": 455.58035, "r": 153.68651, "b": 464.48691, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "-", "bbox": {"l": 183.62411, "t": 455.58035, "r": 186.94167, "b": 464.48691, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "-", "bbox": {"l": 227.88795000000002, "t": 455.58035, "r": 231.20551, "b": 464.48691, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "93.01", "bbox": {"l": 259.69855, "t": 455.58035, "r": 282.11441, "b": 464.48691, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 468.13336, "r": 117.38329000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "PTN", "bbox": {"l": 134.86766, "t": 468.13336, "r": 153.68701, "b": 477.03992, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "98.5", "bbox": {"l": 176.57111, "t": 468.13336, "r": 194.00566, "b": 477.03992, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "95.0", "bbox": {"l": 220.83495, "t": 468.13336, "r": 238.26950000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "96.75", "bbox": {"l": 259.698, "t": 468.01379, "r": 282.11386, "b": 476.97018, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "EDD", "bbox": {"l": 81.612, "t": 483.32635, "r": 102.08514, "b": 492.23291, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "FTN", "bbox": {"l": 134.87206, "t": 483.32635, "r": 153.69141, "b": 492.23291, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "88.4", "bbox": {"l": 176.56554, "t": 483.32635, "r": 194.00009, "b": 492.23291, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "92.08", "bbox": {"l": 218.33870999999996, "t": 483.32635, "r": 240.75455999999997, "b": 492.23291, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "90.6", "bbox": {"l": 262.18411, "t": 483.32635, "r": 279.61865, "b": 492.23291, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "GTE", "bbox": {"l": 82.165001, "t": 495.28134, "r": 101.5323, "b": 504.1879, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "FTN", "bbox": {"l": 134.86716, "t": 495.28134, "r": 153.68651, "b": 504.1879, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "-", "bbox": {"l": 183.62411, "t": 495.28134, "r": 186.94167, "b": 504.1879, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "-", "bbox": {"l": 227.88795000000002, "t": 495.28134, "r": 231.20551, "b": 504.1879, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "87.14", "bbox": {"l": 259.69855, "t": 495.28134, "r": 282.11441, "b": 504.1879, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "GTE (FT)", "bbox": {"l": 71.789001, "t": 507.23633, "r": 111.90838999999998, "b": 516.14288, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "FTN", "bbox": {"l": 134.86221, "t": 507.23633, "r": 153.68156, "b": 516.14288, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "-", "bbox": {"l": 183.62914, "t": 507.23633, "r": 186.94669, "b": 516.14288, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "-", "bbox": {"l": 227.89297, "t": 507.23633, "r": 231.21053000000003, "b": 516.14288, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "91.02", "bbox": {"l": 259.6936, "t": 507.23633, "r": 282.10947, "b": 516.14288, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 519.1913099999999, "r": 117.38329000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "FTN", "bbox": {"l": 134.86766, "t": 519.1913099999999, "r": 153.68701, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "97.5", "bbox": {"l": 176.57111, "t": 519.1913099999999, "r": 194.00566, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "96.0", "bbox": {"l": 220.83495, "t": 519.1913099999999, "r": 238.26950000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "96.8", "bbox": {"l": 262.189, "t": 519.0717500000001, "r": 279.62354, "b": 528.02814, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "EDD", "bbox": {"l": 81.612, "t": 536.49837, "r": 102.08514, "b": 545.40492, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "TB", "bbox": {"l": 137.91064, "t": 536.49837, "r": 150.64285, "b": 545.40492, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "86.0", "bbox": {"l": 176.56554, "t": 536.49837, "r": 194.00009, "b": 545.40492, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "-", "bbox": {"l": 227.89285, "t": 536.49837, "r": 231.21040000000002, "b": 545.40492, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "86.0", "bbox": {"l": 262.18411, "t": 536.49837, "r": 279.61865, "b": 545.40492, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 548.45436, "r": 117.38329000000002, "b": 557.36092, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "TB", "bbox": {"l": 137.90625, "t": 548.45436, "r": 150.63846, "b": 557.36092, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "89.6", "bbox": {"l": 176.57111, "t": 548.45436, "r": 194.00566, "b": 557.36092, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "-", "bbox": {"l": 227.88845999999998, "t": 548.45436, "r": 231.20601, "b": 557.36092, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "89.6", "bbox": {"l": 262.189, "t": 548.3348100000001, "r": 279.62354, "b": 557.2911799999999, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 568.00237, "r": 117.38329000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "STN", "bbox": {"l": 134.86766, "t": 568.00237, "r": 153.68701, "b": 576.90892, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "96.9", "bbox": {"l": 176.57111, "t": 568.00237, "r": 194.00566, "b": 576.90892, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "95.7", "bbox": {"l": 220.83495, "t": 568.00237, "r": 238.26950000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "96.7", "bbox": {"l": 262.1897, "t": 568.00237, "r": 279.62424, "b": 576.90892, "coord_origin": "TOPLEFT"}}], "children": [{"id": 17, "label": "text", "bbox": {"l": 78.843002, "t": 420.69037, "r": 104.85535, "b": 429.59692, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "Model", "bbox": {"l": 78.843002, "t": 420.69037, "r": 104.85535, "b": 429.59692, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 211.2, "t": 414.71237, "r": 236.10649, "b": 423.61893, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "TEDS", "bbox": {"l": 211.2, "t": 414.71237, "r": 236.10649, "b": 423.61893, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 129.338, "t": 426.66736, "r": 159.21584, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "Dataset", "bbox": {"l": 129.338, "t": 426.66736, "r": 159.21584, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 171.17096, "t": 426.66736, "r": 199.40497, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "Simple", "bbox": {"l": 171.17096, "t": 426.66736, "r": 199.40497, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 211.36009, "t": 426.66736, "r": 247.74349999999998, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "Complex", "bbox": {"l": 211.36009, "t": 426.66736, "r": 247.74349999999998, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 264.54044, "t": 426.66736, "r": 277.27264, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "All", "bbox": {"l": 264.54044, "t": 426.66736, "r": 277.27264, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 81.612, "t": 443.62436, "r": 102.08514, "b": 452.53091, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "EDD", "bbox": {"l": 81.612, "t": 443.62436, "r": 102.08514, "b": 452.53091, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 134.87206, "t": 443.62436, "r": 153.69141, "b": 452.53091, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "PTN", "bbox": {"l": 134.87206, "t": 443.62436, "r": 153.69141, "b": 452.53091, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 176.56554, "t": 443.62436, "r": 194.00009, "b": 452.53091, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "91.1", "bbox": {"l": 176.56554, "t": 443.62436, "r": 194.00009, "b": 452.53091, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 220.82938000000001, "t": 443.62436, "r": 238.26393, "b": 452.53091, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "88.7", "bbox": {"l": 220.82938000000001, "t": 443.62436, "r": 238.26393, "b": 452.53091, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 262.18414, "t": 443.62436, "r": 279.61868, "b": 452.53091, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "89.9", "bbox": {"l": 262.18414, "t": 443.62436, "r": 279.61868, "b": 452.53091, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 82.165001, "t": 455.58035, "r": 101.5323, "b": 464.48691, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "GTE", "bbox": {"l": 82.165001, "t": 455.58035, "r": 101.5323, "b": 464.48691, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 134.86716, "t": 455.58035, "r": 153.68651, "b": 464.48691, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "PTN", "bbox": {"l": 134.86716, "t": 455.58035, "r": 153.68651, "b": 464.48691, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 183.62411, "t": 455.58035, "r": 186.94167, "b": 464.48691, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "-", "bbox": {"l": 183.62411, "t": 455.58035, "r": 186.94167, "b": 464.48691, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 227.88795000000002, "t": 455.58035, "r": 231.20551, "b": 464.48691, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "-", "bbox": {"l": 227.88795000000002, "t": 455.58035, "r": 231.20551, "b": 464.48691, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 259.69855, "t": 455.58035, "r": 282.11441, "b": 464.48691, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "93.01", "bbox": {"l": 259.69855, "t": 455.58035, "r": 282.11441, "b": 464.48691, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 66.315002, "t": 468.13336, "r": 117.38329000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 468.13336, "r": 117.38329000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 134.86766, "t": 468.13336, "r": 153.68701, "b": 477.03992, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "PTN", "bbox": {"l": 134.86766, "t": 468.13336, "r": 153.68701, "b": 477.03992, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 176.57111, "t": 468.13336, "r": 194.00566, "b": 477.03992, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "98.5", "bbox": {"l": 176.57111, "t": 468.13336, "r": 194.00566, "b": 477.03992, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 220.83495, "t": 468.13336, "r": 238.26950000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "95.0", "bbox": {"l": 220.83495, "t": 468.13336, "r": 238.26950000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 259.698, "t": 468.01379, "r": 282.11386, "b": 476.97018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "96.75", "bbox": {"l": 259.698, "t": 468.01379, "r": 282.11386, "b": 476.97018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 81.612, "t": 483.32635, "r": 102.08514, "b": 492.23291, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "EDD", "bbox": {"l": 81.612, "t": 483.32635, "r": 102.08514, "b": 492.23291, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 134.87206, "t": 483.32635, "r": 153.69141, "b": 492.23291, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "FTN", "bbox": {"l": 134.87206, "t": 483.32635, "r": 153.69141, "b": 492.23291, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 176.56554, "t": 483.32635, "r": 194.00009, "b": 492.23291, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "88.4", "bbox": {"l": 176.56554, "t": 483.32635, "r": 194.00009, "b": 492.23291, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 218.33870999999996, "t": 483.32635, "r": 240.75455999999997, "b": 492.23291, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "92.08", "bbox": {"l": 218.33870999999996, "t": 483.32635, "r": 240.75455999999997, "b": 492.23291, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 262.18411, "t": 483.32635, "r": 279.61865, "b": 492.23291, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "90.6", "bbox": {"l": 262.18411, "t": 483.32635, "r": 279.61865, "b": 492.23291, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 82.165001, "t": 495.28134, "r": 101.5323, "b": 504.1879, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "GTE", "bbox": {"l": 82.165001, "t": 495.28134, "r": 101.5323, "b": 504.1879, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 134.86716, "t": 495.28134, "r": 153.68651, "b": 504.1879, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "FTN", "bbox": {"l": 134.86716, "t": 495.28134, "r": 153.68651, "b": 504.1879, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 183.62411, "t": 495.28134, "r": 186.94167, "b": 504.1879, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "-", "bbox": {"l": 183.62411, "t": 495.28134, "r": 186.94167, "b": 504.1879, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 227.88795000000002, "t": 495.28134, "r": 231.20551, "b": 504.1879, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "-", "bbox": {"l": 227.88795000000002, "t": 495.28134, "r": 231.20551, "b": 504.1879, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 259.69855, "t": 495.28134, "r": 282.11441, "b": 504.1879, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "87.14", "bbox": {"l": 259.69855, "t": 495.28134, "r": 282.11441, "b": 504.1879, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 71.789001, "t": 507.23633, "r": 111.90838999999998, "b": 516.14288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "GTE (FT)", "bbox": {"l": 71.789001, "t": 507.23633, "r": 111.90838999999998, "b": 516.14288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 134.86221, "t": 507.23633, "r": 153.68156, "b": 516.14288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "FTN", "bbox": {"l": 134.86221, "t": 507.23633, "r": 153.68156, "b": 516.14288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 183.62914, "t": 507.23633, "r": 186.94669, "b": 516.14288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "-", "bbox": {"l": 183.62914, "t": 507.23633, "r": 186.94669, "b": 516.14288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 227.89297, "t": 507.23633, "r": 231.21053000000003, "b": 516.14288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "-", "bbox": {"l": 227.89297, "t": 507.23633, "r": 231.21053000000003, "b": 516.14288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 259.6936, "t": 507.23633, "r": 282.10947, "b": 516.14288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "91.02", "bbox": {"l": 259.6936, "t": 507.23633, "r": 282.10947, "b": 516.14288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 66.315002, "t": 519.1913099999999, "r": 117.38329000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 519.1913099999999, "r": 117.38329000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 134.86766, "t": 519.1913099999999, "r": 153.68701, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "FTN", "bbox": {"l": 134.86766, "t": 519.1913099999999, "r": 153.68701, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 176.57111, "t": 519.1913099999999, "r": 194.00566, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "97.5", "bbox": {"l": 176.57111, "t": 519.1913099999999, "r": 194.00566, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 220.83495, "t": 519.1913099999999, "r": 238.26950000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "96.0", "bbox": {"l": 220.83495, "t": 519.1913099999999, "r": 238.26950000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 262.189, "t": 519.0717500000001, "r": 279.62354, "b": 528.02814, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "96.8", "bbox": {"l": 262.189, "t": 519.0717500000001, "r": 279.62354, "b": 528.02814, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 81.612, "t": 536.49837, "r": 102.08514, "b": 545.40492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "EDD", "bbox": {"l": 81.612, "t": 536.49837, "r": 102.08514, "b": 545.40492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 137.91064, "t": 536.49837, "r": 150.64285, "b": 545.40492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "TB", "bbox": {"l": 137.91064, "t": 536.49837, "r": 150.64285, "b": 545.40492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 176.56554, "t": 536.49837, "r": 194.00009, "b": 545.40492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "86.0", "bbox": {"l": 176.56554, "t": 536.49837, "r": 194.00009, "b": 545.40492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 227.89285, "t": 536.49837, "r": 231.21040000000002, "b": 545.40492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "-", "bbox": {"l": 227.89285, "t": 536.49837, "r": 231.21040000000002, "b": 545.40492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 262.18411, "t": 536.49837, "r": 279.61865, "b": 545.40492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "86.0", "bbox": {"l": 262.18411, "t": 536.49837, "r": 279.61865, "b": 545.40492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 66.315002, "t": 548.45436, "r": 117.38329000000002, "b": 557.36092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 548.45436, "r": 117.38329000000002, "b": 557.36092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 137.90625, "t": 548.45436, "r": 150.63846, "b": 557.36092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "TB", "bbox": {"l": 137.90625, "t": 548.45436, "r": 150.63846, "b": 557.36092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 176.57111, "t": 548.45436, "r": 194.00566, "b": 557.36092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "89.6", "bbox": {"l": 176.57111, "t": 548.45436, "r": 194.00566, "b": 557.36092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 227.88845999999998, "t": 548.45436, "r": 231.20601, "b": 557.36092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "-", "bbox": {"l": 227.88845999999998, "t": 548.45436, "r": 231.20601, "b": 557.36092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 262.189, "t": 548.3348100000001, "r": 279.62354, "b": 557.2911799999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": "89.6", "bbox": {"l": 262.189, "t": 548.3348100000001, "r": 279.62354, "b": 557.2911799999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 66.315002, "t": 568.00237, "r": 117.38329000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 568.00237, "r": 117.38329000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 134.86766, "t": 568.00237, "r": 153.68701, "b": 576.90892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "STN", "bbox": {"l": 134.86766, "t": 568.00237, "r": 153.68701, "b": 576.90892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 176.57111, "t": 568.00237, "r": 194.00566, "b": 576.90892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": "96.9", "bbox": {"l": 176.57111, "t": 568.00237, "r": 194.00566, "b": 576.90892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 220.83495, "t": 568.00237, "r": 238.26950000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 107, "text": "95.7", "bbox": {"l": 220.83495, "t": 568.00237, "r": 238.26950000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 262.1897, "t": 568.00237, "r": 279.62424, "b": 576.90892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 108, "text": "96.7", "bbox": {"l": 262.1897, "t": 568.00237, "r": 279.62424, "b": 576.90892, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 11, "num_cols": 5, "table_cells": [{"bbox": {"l": 78.843002, "t": 420.69037, "r": 104.85535, "b": 429.59692, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Model", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 211.2, "t": 414.71237, "r": 247.74349999999998, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "TEDS Complex", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 129.338, "t": 426.66736, "r": 159.21584, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Dataset", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 171.17096, "t": 426.66736, "r": 199.40497, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Simple", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 264.54044, "t": 426.66736, "r": 277.27264, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "All", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 81.612, "t": 443.62436, "r": 102.08514, "b": 452.53091, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "EDD", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.87206, "t": 443.62436, "r": 153.69141, "b": 452.53091, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "PTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.56554, "t": 443.62436, "r": 194.00009, "b": 452.53091, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "91.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 220.82938000000001, "t": 443.62436, "r": 238.26393, "b": 452.53091, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "88.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 262.18414, "t": 443.62436, "r": 279.61868, "b": 452.53091, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "89.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 82.165001, "t": 455.58035, "r": 101.5323, "b": 464.48691, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "GTE", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.86716, "t": 455.58035, "r": 153.68651, "b": 464.48691, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "PTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 183.62411, "t": 455.58035, "r": 186.94167, "b": 464.48691, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 227.88795000000002, "t": 455.58035, "r": 231.20551, "b": 464.48691, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 259.69855, "t": 455.58035, "r": 282.11441, "b": 464.48691, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "93.01", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 66.315002, "t": 468.13336, "r": 117.38329000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.86766, "t": 468.13336, "r": 153.68701, "b": 477.03992, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "PTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.57111, "t": 468.13336, "r": 194.00566, "b": 477.03992, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "98.5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 220.83495, "t": 468.13336, "r": 238.26950000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "95.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 259.698, "t": 468.01379, "r": 282.11386, "b": 476.97018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "96.75", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 81.612, "t": 483.32635, "r": 102.08514, "b": 492.23291, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "EDD", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.87206, "t": 483.32635, "r": 153.69141, "b": 492.23291, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "FTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.56554, "t": 483.32635, "r": 194.00009, "b": 492.23291, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "88.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 218.33870999999996, "t": 483.32635, "r": 240.75455999999997, "b": 492.23291, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "92.08", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 262.18411, "t": 483.32635, "r": 279.61865, "b": 492.23291, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "90.6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 82.165001, "t": 495.28134, "r": 101.5323, "b": 504.1879, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "GTE", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.86716, "t": 495.28134, "r": 153.68651, "b": 504.1879, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "FTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 183.62411, "t": 495.28134, "r": 186.94167, "b": 504.1879, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 227.88795000000002, "t": 495.28134, "r": 231.20551, "b": 504.1879, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 259.69855, "t": 495.28134, "r": 282.11441, "b": 504.1879, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "87.14", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 71.789001, "t": 507.23633, "r": 111.90838999999998, "b": 516.14288, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "GTE (FT)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.86221, "t": 507.23633, "r": 153.68156, "b": 516.14288, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "FTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 183.62914, "t": 507.23633, "r": 186.94669, "b": 516.14288, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 227.89297, "t": 507.23633, "r": 231.21053000000003, "b": 516.14288, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 259.6936, "t": 507.23633, "r": 282.10947, "b": 516.14288, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "91.02", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 66.315002, "t": 519.1913099999999, "r": 117.38329000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.86766, "t": 519.1913099999999, "r": 153.68701, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "FTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.57111, "t": 519.1913099999999, "r": 194.00566, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "97.5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 220.83495, "t": 519.1913099999999, "r": 238.26950000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "96.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 262.189, "t": 519.0717500000001, "r": 279.62354, "b": 528.02814, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "96.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 81.612, "t": 536.49837, "r": 102.08514, "b": 545.40492, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "EDD", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 137.91064, "t": 536.49837, "r": 150.64285, "b": 545.40492, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "TB", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.56554, "t": 536.49837, "r": 194.00009, "b": 545.40492, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "86.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 227.89285, "t": 536.49837, "r": 231.21040000000002, "b": 545.40492, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 262.18411, "t": 536.49837, "r": 279.61865, "b": 545.40492, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "86.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 66.315002, "t": 548.45436, "r": 117.38329000000002, "b": 557.36092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 137.90625, "t": 548.45436, "r": 150.63846, "b": 557.36092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "TB", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.57111, "t": 548.45436, "r": 194.00566, "b": 557.36092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "89.6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 227.88845999999998, "t": 548.45436, "r": 231.20601, "b": 557.36092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 262.189, "t": 548.3348100000001, "r": 279.62354, "b": 557.2911799999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "89.6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 66.315002, "t": 568.00237, "r": 117.38329000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.86766, "t": 568.00237, "r": 153.68701, "b": 576.90892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "STN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.57111, "t": 568.00237, "r": 194.00566, "b": 576.90892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "96.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 220.83495, "t": 568.00237, "r": 238.26950000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "95.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 262.1897, "t": 568.00237, "r": 279.62424, "b": 576.90892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "96.7", "column_header": false, "row_header": false, "row_section": false}]}, "8": {"label": "table", "id": 8, "page_no": 6, "cluster": {"id": 8, "label": "table", "bbox": {"l": 308.4068603515625, "t": 247.87631225585938, "r": 533.6419677734375, "b": 303.8056640625, "coord_origin": "TOPLEFT"}, "confidence": 0.9691730737686157, "cells": [{"id": 146, "text": "Model", "bbox": {"l": 339.323, "t": 253.66436999999996, "r": 365.33536, "b": 262.57092, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "Dataset", "bbox": {"l": 401.04132, "t": 253.66436999999996, "r": 430.91916, "b": 262.57092, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "mAP", "bbox": {"l": 454.10214, "t": 253.66436999999996, "r": 474.58523999999994, "b": 262.57092, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "mAP (PP)", "bbox": {"l": 486.54034, "t": 253.66436999999996, "r": 527.2276, "b": 262.57092, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "EDD+BBox", "bbox": {"l": 327.65601, "t": 270.62134000000003, "r": 377.00076, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "PubTabNet", "bbox": {"l": 393.69809, "t": 270.62134000000003, "r": 438.28073, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "79.2", "bbox": {"l": 455.63559, "t": 270.62134000000003, "r": 473.07013, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "82.7", "bbox": {"l": 498.16592, "t": 270.62134000000003, "r": 515.60046, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "TableFormer", "bbox": {"l": 326.79501, "t": 282.57631999999995, "r": 377.86331, "b": 291.48288, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "PubTabNet", "bbox": {"l": 393.69388, "t": 282.57631999999995, "r": 438.27652, "b": 291.48288, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "82.1", "bbox": {"l": 455.63101, "t": 282.45676, "r": 473.06555000000003, "b": 291.41315, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "86.8", "bbox": {"l": 498.1713, "t": 282.45676, "r": 515.60583, "b": 291.41315, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "TableFormer", "bbox": {"l": 326.79501, "t": 294.53131, "r": 377.86331, "b": 303.43787, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "SynthTabNet", "bbox": {"l": 389.81842, "t": 294.53131, "r": 442.15194999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "87.7", "bbox": {"l": 455.63135, "t": 294.53131, "r": 473.06589, "b": 303.43787, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "-", "bbox": {"l": 505.22515999999996, "t": 294.53131, "r": 508.54268999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}}], "children": [{"id": 73, "label": "text", "bbox": {"l": 339.323, "t": 253.66436999999996, "r": 365.33536, "b": 262.57092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 146, "text": "Model", "bbox": {"l": 339.323, "t": 253.66436999999996, "r": 365.33536, "b": 262.57092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 401.04132, "t": 253.66436999999996, "r": 430.91916, "b": 262.57092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 147, "text": "Dataset", "bbox": {"l": 401.04132, "t": 253.66436999999996, "r": 430.91916, "b": 262.57092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 454.10214, "t": 253.66436999999996, "r": 474.58523999999994, "b": 262.57092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 148, "text": "mAP", "bbox": {"l": 454.10214, "t": 253.66436999999996, "r": 474.58523999999994, "b": 262.57092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 486.54034, "t": 253.66436999999996, "r": 527.2276, "b": 262.57092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 149, "text": "mAP (PP)", "bbox": {"l": 486.54034, "t": 253.66436999999996, "r": 527.2276, "b": 262.57092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 327.65601, "t": 270.62134000000003, "r": 377.00076, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 150, "text": "EDD+BBox", "bbox": {"l": 327.65601, "t": 270.62134000000003, "r": 377.00076, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 393.69809, "t": 270.62134000000003, "r": 438.28073, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 151, "text": "PubTabNet", "bbox": {"l": 393.69809, "t": 270.62134000000003, "r": 438.28073, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 455.63559, "t": 270.62134000000003, "r": 473.07013, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 152, "text": "79.2", "bbox": {"l": 455.63559, "t": 270.62134000000003, "r": 473.07013, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 498.16592, "t": 270.62134000000003, "r": 515.60046, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 153, "text": "82.7", "bbox": {"l": 498.16592, "t": 270.62134000000003, "r": 515.60046, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 326.79501, "t": 282.57631999999995, "r": 377.86331, "b": 291.48288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 154, "text": "TableFormer", "bbox": {"l": 326.79501, "t": 282.57631999999995, "r": 377.86331, "b": 291.48288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 393.69388, "t": 282.57631999999995, "r": 438.27652, "b": 291.48288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 155, "text": "PubTabNet", "bbox": {"l": 393.69388, "t": 282.57631999999995, "r": 438.27652, "b": 291.48288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 455.63101, "t": 282.45676, "r": 473.06555000000003, "b": 291.41315, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 156, "text": "82.1", "bbox": {"l": 455.63101, "t": 282.45676, "r": 473.06555000000003, "b": 291.41315, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 498.1713, "t": 282.45676, "r": 515.60583, "b": 291.41315, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 157, "text": "86.8", "bbox": {"l": 498.1713, "t": 282.45676, "r": 515.60583, "b": 291.41315, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 326.79501, "t": 294.53131, "r": 377.86331, "b": 303.43787, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 158, "text": "TableFormer", "bbox": {"l": 326.79501, "t": 294.53131, "r": 377.86331, "b": 303.43787, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 389.81842, "t": 294.53131, "r": 442.15194999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 159, "text": "SynthTabNet", "bbox": {"l": 389.81842, "t": 294.53131, "r": 442.15194999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 455.63135, "t": 294.53131, "r": 473.06589, "b": 303.43787, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 160, "text": "87.7", "bbox": {"l": 455.63135, "t": 294.53131, "r": 473.06589, "b": 303.43787, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 505.22515999999996, "t": 294.53131, "r": 508.54268999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 161, "text": "-", "bbox": {"l": 505.22515999999996, "t": 294.53131, "r": 508.54268999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 4, "num_cols": 4, "table_cells": [{"bbox": {"l": 339.323, "t": 253.66436999999996, "r": 365.33536, "b": 262.57092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Model", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 401.04132, "t": 253.66436999999996, "r": 430.91916, "b": 262.57092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Dataset", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 454.10214, "t": 253.66436999999996, "r": 474.58523999999994, "b": 262.57092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "mAP", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 486.54034, "t": 253.66436999999996, "r": 527.2276, "b": 262.57092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "mAP (PP)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 327.65601, "t": 270.62134000000003, "r": 377.00076, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "EDD+BBox", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 393.69809, "t": 270.62134000000003, "r": 438.28073, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "PubTabNet", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 455.63559, "t": 270.62134000000003, "r": 473.07013, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "79.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 498.16592, "t": 270.62134000000003, "r": 515.60046, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "82.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.79501, "t": 282.57631999999995, "r": 377.86331, "b": 291.48288, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 393.69388, "t": 282.57631999999995, "r": 438.27652, "b": 291.48288, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "PubTabNet", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 455.63101, "t": 282.45676, "r": 473.06555000000003, "b": 291.41315, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "82.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 498.1713, "t": 282.45676, "r": 515.60583, "b": 291.41315, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "86.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.79501, "t": 294.53131, "r": 377.86331, "b": 303.43787, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 389.81842, "t": 294.53131, "r": 442.15194999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "SynthTabNet", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 455.63135, "t": 294.53131, "r": 473.06589, "b": 303.43787, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "87.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 505.22515999999996, "t": 294.53131, "r": 508.54268999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}]}, "5": {"label": "table", "id": 5, "page_no": 6, "cluster": {"id": 5, "label": "table", "bbox": {"l": 332.9688720703125, "t": 540.2835693359375, "r": 520.942138671875, "b": 643.2697143554688, "coord_origin": "TOPLEFT"}, "confidence": 0.9775567650794983, "cells": [{"id": 183, "text": "Model", "bbox": {"l": 358.01099, "t": 552.23337, "r": 384.02335, "b": 561.1399200000001, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "TEDS", "bbox": {"l": 449.03400000000005, "t": 546.25537, "r": 473.94049000000007, "b": 555.16193, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": "Simple", "bbox": {"l": 408.50598, "t": 558.21037, "r": 436.73999, "b": 567.11693, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "Complex", "bbox": {"l": 448.6951, "t": 558.21037, "r": 485.07849, "b": 567.11693, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "All", "bbox": {"l": 499.3848, "t": 558.21037, "r": 512.117, "b": 567.11693, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": "Tabula", "bbox": {"l": 357.68201, "t": 575.16736, "r": 384.3519, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "78.0", "bbox": {"l": 413.90097, "t": 575.16736, "r": 431.33550999999994, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "57.8", "bbox": {"l": 458.16479000000004, "t": 575.16736, "r": 475.59933000000007, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "67.9", "bbox": {"l": 497.0289, "t": 575.16736, "r": 514.46344, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": "Traprange", "bbox": {"l": 350.72299, "t": 587.12236, "r": 391.31064, "b": 596.02892, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "60.8", "bbox": {"l": 413.90582, "t": 587.12236, "r": 431.34036, "b": 596.02892, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "49.9", "bbox": {"l": 458.16965, "t": 587.12236, "r": 475.60419, "b": 596.02892, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "55.4", "bbox": {"l": 497.03374999999994, "t": 587.12236, "r": 514.46832, "b": 596.02892, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "Camelot", "bbox": {"l": 354.13599, "t": 599.07835, "r": 387.89923, "b": 607.98491, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "80.0", "bbox": {"l": 413.90161, "t": 599.07835, "r": 431.33615, "b": 607.98491, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "66.0", "bbox": {"l": 458.16544, "t": 599.07835, "r": 475.59998, "b": 607.98491, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "73.0", "bbox": {"l": 497.02954000000005, "t": 599.07835, "r": 514.46411, "b": 607.98491, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "Acrobat Pro", "bbox": {"l": 346.55899, "t": 611.03336, "r": 395.47534, "b": 619.93991, "coord_origin": "TOPLEFT"}}, {"id": 201, "text": "68.9", "bbox": {"l": 413.90616, "t": 611.03336, "r": 431.34069999999997, "b": 619.93991, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": "61.8", "bbox": {"l": 458.16998000000007, "t": 611.03336, "r": 475.60452, "b": 619.93991, "coord_origin": "TOPLEFT"}}, {"id": 203, "text": "65.3", "bbox": {"l": 497.03409, "t": 611.03336, "r": 514.46863, "b": 619.93991, "coord_origin": "TOPLEFT"}}, {"id": 204, "text": "EDD", "bbox": {"l": 360.78101, "t": 622.9883600000001, "r": 381.25415, "b": 631.89491, "coord_origin": "TOPLEFT"}}, {"id": 205, "text": "91.2", "bbox": {"l": 413.90158, "t": 622.9883600000001, "r": 431.33612, "b": 631.89491, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": "85.4", "bbox": {"l": 458.16541, "t": 622.9883600000001, "r": 475.59995000000004, "b": 631.89491, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": "88.3", "bbox": {"l": 497.0295100000001, "t": 622.9883600000001, "r": 514.46405, "b": 631.89491, "coord_origin": "TOPLEFT"}}, {"id": 208, "text": "TableFormer", "bbox": {"l": 345.483, "t": 634.94336, "r": 396.5513, "b": 643.84991, "coord_origin": "TOPLEFT"}}, {"id": 209, "text": "95.4", "bbox": {"l": 413.90616, "t": 634.94336, "r": 431.34069999999997, "b": 643.84991, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": "90.1", "bbox": {"l": 458.16998000000007, "t": 634.94336, "r": 475.60452, "b": 643.84991, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "93.6", "bbox": {"l": 497.03400000000005, "t": 634.82381, "r": 514.46857, "b": 643.78018, "coord_origin": "TOPLEFT"}}], "children": [{"id": 89, "label": "text", "bbox": {"l": 358.01099, "t": 552.23337, "r": 384.02335, "b": 561.1399200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 183, "text": "Model", "bbox": {"l": 358.01099, "t": 552.23337, "r": 384.02335, "b": 561.1399200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 449.03400000000005, "t": 546.25537, "r": 473.94049000000007, "b": 555.16193, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 184, "text": "TEDS", "bbox": {"l": 449.03400000000005, "t": 546.25537, "r": 473.94049000000007, "b": 555.16193, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 408.50598, "t": 558.21037, "r": 436.73999, "b": 567.11693, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 185, "text": "Simple", "bbox": {"l": 408.50598, "t": 558.21037, "r": 436.73999, "b": 567.11693, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 448.6951, "t": 558.21037, "r": 485.07849, "b": 567.11693, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 186, "text": "Complex", "bbox": {"l": 448.6951, "t": 558.21037, "r": 485.07849, "b": 567.11693, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 499.3848, "t": 558.21037, "r": 512.117, "b": 567.11693, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 187, "text": "All", "bbox": {"l": 499.3848, "t": 558.21037, "r": 512.117, "b": 567.11693, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 357.68201, "t": 575.16736, "r": 384.3519, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 188, "text": "Tabula", "bbox": {"l": 357.68201, "t": 575.16736, "r": 384.3519, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 413.90097, "t": 575.16736, "r": 431.33550999999994, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 189, "text": "78.0", "bbox": {"l": 413.90097, "t": 575.16736, "r": 431.33550999999994, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 458.16479000000004, "t": 575.16736, "r": 475.59933000000007, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 190, "text": "57.8", "bbox": {"l": 458.16479000000004, "t": 575.16736, "r": 475.59933000000007, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 497.0289, "t": 575.16736, "r": 514.46344, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 191, "text": "67.9", "bbox": {"l": 497.0289, "t": 575.16736, "r": 514.46344, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 350.72299, "t": 587.12236, "r": 391.31064, "b": 596.02892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 192, "text": "Traprange", "bbox": {"l": 350.72299, "t": 587.12236, "r": 391.31064, "b": 596.02892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 413.90582, "t": 587.12236, "r": 431.34036, "b": 596.02892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 193, "text": "60.8", "bbox": {"l": 413.90582, "t": 587.12236, "r": 431.34036, "b": 596.02892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 458.16965, "t": 587.12236, "r": 475.60419, "b": 596.02892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 194, "text": "49.9", "bbox": {"l": 458.16965, "t": 587.12236, "r": 475.60419, "b": 596.02892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 497.03374999999994, "t": 587.12236, "r": 514.46832, "b": 596.02892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 195, "text": "55.4", "bbox": {"l": 497.03374999999994, "t": 587.12236, "r": 514.46832, "b": 596.02892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 354.13599, "t": 599.07835, "r": 387.89923, "b": 607.98491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 196, "text": "Camelot", "bbox": {"l": 354.13599, "t": 599.07835, "r": 387.89923, "b": 607.98491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 413.90161, "t": 599.07835, "r": 431.33615, "b": 607.98491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 197, "text": "80.0", "bbox": {"l": 413.90161, "t": 599.07835, "r": 431.33615, "b": 607.98491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 458.16544, "t": 599.07835, "r": 475.59998, "b": 607.98491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 198, "text": "66.0", "bbox": {"l": 458.16544, "t": 599.07835, "r": 475.59998, "b": 607.98491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 497.02954000000005, "t": 599.07835, "r": 514.46411, "b": 607.98491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 199, "text": "73.0", "bbox": {"l": 497.02954000000005, "t": 599.07835, "r": 514.46411, "b": 607.98491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 346.55899, "t": 611.03336, "r": 395.47534, "b": 619.93991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 200, "text": "Acrobat Pro", "bbox": {"l": 346.55899, "t": 611.03336, "r": 395.47534, "b": 619.93991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 413.90616, "t": 611.03336, "r": 431.34069999999997, "b": 619.93991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 201, "text": "68.9", "bbox": {"l": 413.90616, "t": 611.03336, "r": 431.34069999999997, "b": 619.93991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 458.16998000000007, "t": 611.03336, "r": 475.60452, "b": 619.93991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 202, "text": "61.8", "bbox": {"l": 458.16998000000007, "t": 611.03336, "r": 475.60452, "b": 619.93991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 497.03409, "t": 611.03336, "r": 514.46863, "b": 619.93991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 203, "text": "65.3", "bbox": {"l": 497.03409, "t": 611.03336, "r": 514.46863, "b": 619.93991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 360.78101, "t": 622.9883600000001, "r": 381.25415, "b": 631.89491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 204, "text": "EDD", "bbox": {"l": 360.78101, "t": 622.9883600000001, "r": 381.25415, "b": 631.89491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 413.90158, "t": 622.9883600000001, "r": 431.33612, "b": 631.89491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 205, "text": "91.2", "bbox": {"l": 413.90158, "t": 622.9883600000001, "r": 431.33612, "b": 631.89491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 458.16541, "t": 622.9883600000001, "r": 475.59995000000004, "b": 631.89491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 206, "text": "85.4", "bbox": {"l": 458.16541, "t": 622.9883600000001, "r": 475.59995000000004, "b": 631.89491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 497.0295100000001, "t": 622.9883600000001, "r": 514.46405, "b": 631.89491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 207, "text": "88.3", "bbox": {"l": 497.0295100000001, "t": 622.9883600000001, "r": 514.46405, "b": 631.89491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 114, "label": "text", "bbox": {"l": 345.483, "t": 634.94336, "r": 396.5513, "b": 643.84991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 208, "text": "TableFormer", "bbox": {"l": 345.483, "t": 634.94336, "r": 396.5513, "b": 643.84991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 115, "label": "text", "bbox": {"l": 413.90616, "t": 634.94336, "r": 431.34069999999997, "b": 643.84991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 209, "text": "95.4", "bbox": {"l": 413.90616, "t": 634.94336, "r": 431.34069999999997, "b": 643.84991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 116, "label": "text", "bbox": {"l": 458.16998000000007, "t": 634.94336, "r": 475.60452, "b": 643.84991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 210, "text": "90.1", "bbox": {"l": 458.16998000000007, "t": 634.94336, "r": 475.60452, "b": 643.84991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 117, "label": "text", "bbox": {"l": 497.03400000000005, "t": 634.82381, "r": 514.46857, "b": 643.78018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 211, "text": "93.6", "bbox": {"l": 497.03400000000005, "t": 634.82381, "r": 514.46857, "b": 643.78018, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["fcel", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "nl"], "num_rows": 7, "num_cols": 4, "table_cells": [{"bbox": {"l": 358.01099, "t": 552.23337, "r": 384.02335, "b": 561.1399200000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Model", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 448.6951, "t": 546.25537, "r": 485.07849, "b": 567.11693, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "TEDS Complex", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 408.50598, "t": 558.21037, "r": 436.73999, "b": 567.11693, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Simple", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 499.3848, "t": 558.21037, "r": 512.117, "b": 567.11693, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "All", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 357.68201, "t": 575.16736, "r": 384.3519, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Tabula", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 413.90097, "t": 575.16736, "r": 431.33550999999994, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "78.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 458.16479000000004, "t": 575.16736, "r": 475.59933000000007, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "57.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 497.0289, "t": 575.16736, "r": 514.46344, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "67.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 350.72299, "t": 587.12236, "r": 391.31064, "b": 596.02892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Traprange", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 413.90582, "t": 587.12236, "r": 431.34036, "b": 596.02892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "60.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 458.16965, "t": 587.12236, "r": 475.60419, "b": 596.02892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "49.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 497.03374999999994, "t": 587.12236, "r": 514.46832, "b": 596.02892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "55.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 354.13599, "t": 599.07835, "r": 387.89923, "b": 607.98491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Camelot", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 413.90161, "t": 599.07835, "r": 431.33615, "b": 607.98491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "80.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 458.16544, "t": 599.07835, "r": 475.59998, "b": 607.98491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "66.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 497.02954000000005, "t": 599.07835, "r": 514.46411, "b": 607.98491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "73.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 346.55899, "t": 611.03336, "r": 395.47534, "b": 619.93991, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Acrobat Pro", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 413.90616, "t": 611.03336, "r": 431.34069999999997, "b": 619.93991, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "68.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 458.16998000000007, "t": 611.03336, "r": 475.60452, "b": 619.93991, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "61.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 497.03409, "t": 611.03336, "r": 514.46863, "b": 619.93991, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "65.3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 360.78101, "t": 622.9883600000001, "r": 381.25415, "b": 631.89491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "EDD", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 413.90158, "t": 622.9883600000001, "r": 431.33612, "b": 631.89491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "91.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 458.16541, "t": 622.9883600000001, "r": 475.59995000000004, "b": 631.89491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "85.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 497.0295100000001, "t": 622.9883600000001, "r": 514.46405, "b": 631.89491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "88.3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 345.483, "t": 634.94336, "r": 396.5513, "b": 643.84991, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 413.90616, "t": 634.94336, "r": 431.34069999999997, "b": 643.84991, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "95.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 458.16998000000007, "t": 634.94336, "r": 475.60452, "b": 643.84991, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "90.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 497.03400000000005, "t": 634.82381, "r": 514.46857, "b": 643.78018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "93.6", "column_header": false, "row_header": false, "row_section": false}]}}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "section_header", "id": 10, "page_no": 6, "cluster": {"id": 10, "label": "section_header", "bbox": {"l": 50.112, "t": 74.40137000000016, "r": 167.89825, "b": 84.25342, "coord_origin": "TOPLEFT"}, "confidence": 0.9554274082183838, "cells": [{"id": 0, "text": "5.3.", "bbox": {"l": 50.112, "t": 74.40137000000016, "r": 63.704811, "b": 84.25342, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Datasets and Metrics", "bbox": {"l": 72.766685, "t": 74.40137000000016, "r": 167.89825, "b": 84.25342, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5.3. Datasets and Metrics"}, {"label": "text", "id": 1, "page_no": 6, "cluster": {"id": 1, "label": "text", "bbox": {"l": 50.112, "t": 93.35039999999992, "r": 286.36511, "b": 138.12298999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9862998127937317, "cells": [{"id": 2, "text": "The Tree-Edit-Distance-Based Similarity (TEDS) met-", "bbox": {"l": 62.067001, "t": 93.35039999999992, "r": 286.36499, "b": 102.25696000000016, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "ric was introduced in [37]. It represents the prediction, and", "bbox": {"l": 50.112, "t": 105.30542000000003, "r": 286.36511, "b": 114.21198000000015, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "ground-truth as a tree structure of HTML tags. This simi-", "bbox": {"l": 50.112, "t": 117.26044000000002, "r": 286.36505, "b": 126.16699000000006, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "larity is calculated as:", "bbox": {"l": 50.112, "t": 129.21642999999995, "r": 136.71687, "b": 138.12298999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The Tree-Edit-Distance-Based Similarity (TEDS) metric was introduced in [37]. It represents the prediction, and ground-truth as a tree structure of HTML tags. This similarity is calculated as:"}, {"label": "formula", "id": 13, "page_no": 6, "cluster": {"id": 13, "label": "formula", "bbox": {"l": 86.218994, "t": 150.31799, "r": 286.3624, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9500409364700317, "cells": [{"id": 6, "text": "TEDS (", "bbox": {"l": 86.218994, "t": 157.05798000000004, "r": 118.8784, "b": 165.90479000000005, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "T$_{a}$, T$_{b}$", "bbox": {"l": 118.87499, "t": 157.05798000000004, "r": 143.26962, "b": 165.90479000000005, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": ") = 1", "bbox": {"l": 143.76799, "t": 157.05798000000004, "r": 165.9019, "b": 165.90479000000005, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "\u2212", "bbox": {"l": 168.12099, "t": 156.50012000000004, "r": 175.8699, "b": 165.90479000000005, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "EditDist (", "bbox": {"l": 179.27899, "t": 150.31799, "r": 221.95677, "b": 159.16479000000004, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "T$_{a}$, T$_{b}$", "bbox": {"l": 221.95200000000003, "t": 150.31799, "r": 246.34663, "b": 159.16479000000004, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": ")", "bbox": {"l": 246.84499999999997, "t": 150.31799, "r": 250.71945, "b": 159.16479000000004, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "max (", "bbox": {"l": 182.21201, "t": 163.89197000000001, "r": 206.29161, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "|", "bbox": {"l": 206.289, "t": 163.33411, "r": 209.05661, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "T$_{a}$", "bbox": {"l": 209.056, "t": 163.89197000000001, "r": 219.19968, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "|", "bbox": {"l": 219.69700999999998, "t": 163.33411, "r": 222.46461000000002, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": ",", "bbox": {"l": 224.125, "t": 163.89197000000001, "r": 226.89261, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "|", "bbox": {"l": 228.55299000000002, "t": 163.33411, "r": 231.3206, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "T$_{b}$", "bbox": {"l": 231.31999, "t": 163.89197000000001, "r": 240.64563, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "|", "bbox": {"l": 241.144, "t": 163.33411, "r": 243.91161, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": ")", "bbox": {"l": 243.911, "t": 163.89197000000001, "r": 247.78545, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "(3)", "bbox": {"l": 274.746, "t": 157.21740999999997, "r": 286.3624, "b": 166.12396, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "TEDS ( T$_{a}$, T$_{b}$ ) = 1 \u2212 EditDist ( T$_{a}$, T$_{b}$ ) max ( | T$_{a}$ | , | T$_{b}$ | ) (3)"}, {"label": "text", "id": 6, "page_no": 6, "cluster": {"id": 6, "label": "text", "bbox": {"l": 50.111984, "t": 181.00298999999995, "r": 286.36285, "b": 213.97900000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9735319018363953, "cells": [{"id": 23, "text": "where", "bbox": {"l": 62.067001, "t": 181.16241000000002, "r": 86.405632, "b": 190.06897000000004, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "T$_{a}$", "bbox": {"l": 88.581001, "t": 181.00298999999995, "r": 98.724663, "b": 189.84978999999998, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "and", "bbox": {"l": 101.399, "t": 181.16241000000002, "r": 115.785, "b": 190.06897000000004, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "T$_{b}$", "bbox": {"l": 117.961, "t": 181.00298999999995, "r": 127.28664, "b": 189.84978999999998, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "represent tables in tree structure HTML", "bbox": {"l": 129.95999, "t": 181.16241000000002, "r": 286.36285, "b": 190.06897000000004, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "format. EditDist denotes the tree-edit distance, and", "bbox": {"l": 50.111992, "t": 193.11743, "r": 252.78116000000003, "b": 202.02399000000003, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "|", "bbox": {"l": 255.18201, "t": 192.40015000000005, "r": 257.94962, "b": 201.80480999999997, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "T", "bbox": {"l": 257.94901, "t": 192.95800999999994, "r": 263.77115, "b": 201.80480999999997, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "|", "bbox": {"l": 265.155, "t": 192.40015000000005, "r": 267.92261, "b": 201.80480999999997, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "rep-", "bbox": {"l": 270.32199, "t": 193.11743, "r": 286.36179, "b": 202.02399000000003, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "resents the number of nodes in", "bbox": {"l": 50.111984, "t": 205.07245, "r": 172.13388, "b": 213.97900000000004, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "T", "bbox": {"l": 174.62399, "t": 204.91301999999996, "r": 180.44614, "b": 213.75982999999997, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": ".", "bbox": {"l": 181.82899, "t": 205.07245, "r": 184.31964, "b": 213.97900000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "where T$_{a}$ and T$_{b}$ represent tables in tree structure HTML format. EditDist denotes the tree-edit distance, and | T | represents the number of nodes in T ."}, {"label": "section_header", "id": 9, "page_no": 6, "cluster": {"id": 9, "label": "section_header", "bbox": {"l": 50.112, "t": 224.81946000000005, "r": 170.45169, "b": 234.67151, "coord_origin": "TOPLEFT"}, "confidence": 0.9588837027549744, "cells": [{"id": 36, "text": "5.4.", "bbox": {"l": 50.112, "t": 224.81946000000005, "r": 64.551605, "b": 234.67151, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "Quantitative Analysis", "bbox": {"l": 74.178009, "t": 224.81946000000005, "r": 170.45169, "b": 234.67151, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5.4. Quantitative Analysis"}, {"label": "text", "id": 2, "page_no": 6, "cluster": {"id": 2, "label": "text", "bbox": {"l": 50.112, "t": 243.6499, "r": 286.36514, "b": 396.13794, "coord_origin": "TOPLEFT"}, "confidence": 0.9855090975761414, "cells": [{"id": 38, "text": "Structure.", "bbox": {"l": 62.067001, "t": 243.6499, "r": 105.32461, "b": 252.60626000000002, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "As shown in Tab.", "bbox": {"l": 112.12600000000002, "t": 243.76946999999996, "r": 184.68361, "b": 252.67602999999997, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "2, TableFormer outper-", "bbox": {"l": 191.4781, "t": 243.76946999999996, "r": 286.36188, "b": 252.67602999999997, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "forms all SOTA methods across different datasets by a large", "bbox": {"l": 50.112, "t": 255.72448999999995, "r": 286.36508, "b": 264.63104, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "margin for predicting the table structure from an image.", "bbox": {"l": 50.112, "t": 267.67949999999996, "r": 286.36508, "b": 276.58606, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "All the more, our model outperforms pre-trained methods.", "bbox": {"l": 50.112, "t": 279.63446, "r": 286.36508, "b": 288.54105, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "During the evaluation we do not apply any table filtering.", "bbox": {"l": 50.112, "t": 291.59048, "r": 286.36514, "b": 300.49704, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "We also provide our baseline results on the SynthTabNet", "bbox": {"l": 50.112, "t": 303.54547, "r": 286.36508, "b": 312.45203000000004, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "dataset. It has been observed that large tables (e.g. tables", "bbox": {"l": 50.112, "t": 315.50046, "r": 286.36505, "b": 324.40700999999996, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "that occupy half of the page or more) yield poor predictions.", "bbox": {"l": 50.112, "t": 327.45544, "r": 286.36508, "b": 336.362, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "We attribute this issue to the image resizing during the pre-", "bbox": {"l": 50.112, "t": 339.41043, "r": 286.36508, "b": 348.31699000000003, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "processing step, that produces downsampled images with", "bbox": {"l": 50.112, "t": 351.36542, "r": 286.36505, "b": 360.27197, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "indistinguishable features. This problem can be addressed", "bbox": {"l": 50.112, "t": 363.32141, "r": 286.36508, "b": 372.2279700000001, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "by treating such big tables with a separate model which ac-", "bbox": {"l": 50.112, "t": 375.2764, "r": 286.36511, "b": 384.18295000000006, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "cepts a large input image size.", "bbox": {"l": 50.112, "t": 387.23138, "r": 170.01187, "b": 396.13794, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Structure. As shown in Tab. 2, TableFormer outperforms all SOTA methods across different datasets by a large margin for predicting the table structure from an image. All the more, our model outperforms pre-trained methods. During the evaluation we do not apply any table filtering. We also provide our baseline results on the SynthTabNet dataset. It has been observed that large tables (e.g. tables that occupy half of the page or more) yield poor predictions. We attribute this issue to the image resizing during the preprocessing step, that produces downsampled images with indistinguishable features. This problem can be addressed by treating such big tables with a separate model which accepts a large input image size."}, {"label": "table", "id": 0, "page_no": 6, "cluster": {"id": 0, "label": "table", "bbox": {"l": 53.368526458740234, "t": 409.1357727050781, "r": 283.0443420410156, "b": 582.3977661132812, "coord_origin": "TOPLEFT"}, "confidence": 0.9892510175704956, "cells": [{"id": 53, "text": "Model", "bbox": {"l": 78.843002, "t": 420.69037, "r": 104.85535, "b": 429.59692, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "TEDS", "bbox": {"l": 211.2, "t": 414.71237, "r": 236.10649, "b": 423.61893, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "Dataset", "bbox": {"l": 129.338, "t": 426.66736, "r": 159.21584, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Simple", "bbox": {"l": 171.17096, "t": 426.66736, "r": 199.40497, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Complex", "bbox": {"l": 211.36009, "t": 426.66736, "r": 247.74349999999998, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "All", "bbox": {"l": 264.54044, "t": 426.66736, "r": 277.27264, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "EDD", "bbox": {"l": 81.612, "t": 443.62436, "r": 102.08514, "b": 452.53091, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "PTN", "bbox": {"l": 134.87206, "t": 443.62436, "r": 153.69141, "b": 452.53091, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "91.1", "bbox": {"l": 176.56554, "t": 443.62436, "r": 194.00009, "b": 452.53091, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "88.7", "bbox": {"l": 220.82938000000001, "t": 443.62436, "r": 238.26393, "b": 452.53091, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "89.9", "bbox": {"l": 262.18414, "t": 443.62436, "r": 279.61868, "b": 452.53091, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "GTE", "bbox": {"l": 82.165001, "t": 455.58035, "r": 101.5323, "b": 464.48691, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "PTN", "bbox": {"l": 134.86716, "t": 455.58035, "r": 153.68651, "b": 464.48691, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "-", "bbox": {"l": 183.62411, "t": 455.58035, "r": 186.94167, "b": 464.48691, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "-", "bbox": {"l": 227.88795000000002, "t": 455.58035, "r": 231.20551, "b": 464.48691, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "93.01", "bbox": {"l": 259.69855, "t": 455.58035, "r": 282.11441, "b": 464.48691, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 468.13336, "r": 117.38329000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "PTN", "bbox": {"l": 134.86766, "t": 468.13336, "r": 153.68701, "b": 477.03992, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "98.5", "bbox": {"l": 176.57111, "t": 468.13336, "r": 194.00566, "b": 477.03992, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "95.0", "bbox": {"l": 220.83495, "t": 468.13336, "r": 238.26950000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "96.75", "bbox": {"l": 259.698, "t": 468.01379, "r": 282.11386, "b": 476.97018, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "EDD", "bbox": {"l": 81.612, "t": 483.32635, "r": 102.08514, "b": 492.23291, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "FTN", "bbox": {"l": 134.87206, "t": 483.32635, "r": 153.69141, "b": 492.23291, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "88.4", "bbox": {"l": 176.56554, "t": 483.32635, "r": 194.00009, "b": 492.23291, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "92.08", "bbox": {"l": 218.33870999999996, "t": 483.32635, "r": 240.75455999999997, "b": 492.23291, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "90.6", "bbox": {"l": 262.18411, "t": 483.32635, "r": 279.61865, "b": 492.23291, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "GTE", "bbox": {"l": 82.165001, "t": 495.28134, "r": 101.5323, "b": 504.1879, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "FTN", "bbox": {"l": 134.86716, "t": 495.28134, "r": 153.68651, "b": 504.1879, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "-", "bbox": {"l": 183.62411, "t": 495.28134, "r": 186.94167, "b": 504.1879, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "-", "bbox": {"l": 227.88795000000002, "t": 495.28134, "r": 231.20551, "b": 504.1879, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "87.14", "bbox": {"l": 259.69855, "t": 495.28134, "r": 282.11441, "b": 504.1879, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "GTE (FT)", "bbox": {"l": 71.789001, "t": 507.23633, "r": 111.90838999999998, "b": 516.14288, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "FTN", "bbox": {"l": 134.86221, "t": 507.23633, "r": 153.68156, "b": 516.14288, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "-", "bbox": {"l": 183.62914, "t": 507.23633, "r": 186.94669, "b": 516.14288, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "-", "bbox": {"l": 227.89297, "t": 507.23633, "r": 231.21053000000003, "b": 516.14288, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "91.02", "bbox": {"l": 259.6936, "t": 507.23633, "r": 282.10947, "b": 516.14288, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 519.1913099999999, "r": 117.38329000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "FTN", "bbox": {"l": 134.86766, "t": 519.1913099999999, "r": 153.68701, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "97.5", "bbox": {"l": 176.57111, "t": 519.1913099999999, "r": 194.00566, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "96.0", "bbox": {"l": 220.83495, "t": 519.1913099999999, "r": 238.26950000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "96.8", "bbox": {"l": 262.189, "t": 519.0717500000001, "r": 279.62354, "b": 528.02814, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "EDD", "bbox": {"l": 81.612, "t": 536.49837, "r": 102.08514, "b": 545.40492, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "TB", "bbox": {"l": 137.91064, "t": 536.49837, "r": 150.64285, "b": 545.40492, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "86.0", "bbox": {"l": 176.56554, "t": 536.49837, "r": 194.00009, "b": 545.40492, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "-", "bbox": {"l": 227.89285, "t": 536.49837, "r": 231.21040000000002, "b": 545.40492, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "86.0", "bbox": {"l": 262.18411, "t": 536.49837, "r": 279.61865, "b": 545.40492, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 548.45436, "r": 117.38329000000002, "b": 557.36092, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "TB", "bbox": {"l": 137.90625, "t": 548.45436, "r": 150.63846, "b": 557.36092, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "89.6", "bbox": {"l": 176.57111, "t": 548.45436, "r": 194.00566, "b": 557.36092, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "-", "bbox": {"l": 227.88845999999998, "t": 548.45436, "r": 231.20601, "b": 557.36092, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "89.6", "bbox": {"l": 262.189, "t": 548.3348100000001, "r": 279.62354, "b": 557.2911799999999, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 568.00237, "r": 117.38329000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "STN", "bbox": {"l": 134.86766, "t": 568.00237, "r": 153.68701, "b": 576.90892, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "96.9", "bbox": {"l": 176.57111, "t": 568.00237, "r": 194.00566, "b": 576.90892, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "95.7", "bbox": {"l": 220.83495, "t": 568.00237, "r": 238.26950000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "96.7", "bbox": {"l": 262.1897, "t": 568.00237, "r": 279.62424, "b": 576.90892, "coord_origin": "TOPLEFT"}}], "children": [{"id": 17, "label": "text", "bbox": {"l": 78.843002, "t": 420.69037, "r": 104.85535, "b": 429.59692, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "Model", "bbox": {"l": 78.843002, "t": 420.69037, "r": 104.85535, "b": 429.59692, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 211.2, "t": 414.71237, "r": 236.10649, "b": 423.61893, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "TEDS", "bbox": {"l": 211.2, "t": 414.71237, "r": 236.10649, "b": 423.61893, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 129.338, "t": 426.66736, "r": 159.21584, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "Dataset", "bbox": {"l": 129.338, "t": 426.66736, "r": 159.21584, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 171.17096, "t": 426.66736, "r": 199.40497, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "Simple", "bbox": {"l": 171.17096, "t": 426.66736, "r": 199.40497, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 211.36009, "t": 426.66736, "r": 247.74349999999998, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "Complex", "bbox": {"l": 211.36009, "t": 426.66736, "r": 247.74349999999998, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 264.54044, "t": 426.66736, "r": 277.27264, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "All", "bbox": {"l": 264.54044, "t": 426.66736, "r": 277.27264, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 81.612, "t": 443.62436, "r": 102.08514, "b": 452.53091, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "EDD", "bbox": {"l": 81.612, "t": 443.62436, "r": 102.08514, "b": 452.53091, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 134.87206, "t": 443.62436, "r": 153.69141, "b": 452.53091, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "PTN", "bbox": {"l": 134.87206, "t": 443.62436, "r": 153.69141, "b": 452.53091, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 176.56554, "t": 443.62436, "r": 194.00009, "b": 452.53091, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "91.1", "bbox": {"l": 176.56554, "t": 443.62436, "r": 194.00009, "b": 452.53091, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 220.82938000000001, "t": 443.62436, "r": 238.26393, "b": 452.53091, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "88.7", "bbox": {"l": 220.82938000000001, "t": 443.62436, "r": 238.26393, "b": 452.53091, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 262.18414, "t": 443.62436, "r": 279.61868, "b": 452.53091, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "89.9", "bbox": {"l": 262.18414, "t": 443.62436, "r": 279.61868, "b": 452.53091, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 82.165001, "t": 455.58035, "r": 101.5323, "b": 464.48691, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "GTE", "bbox": {"l": 82.165001, "t": 455.58035, "r": 101.5323, "b": 464.48691, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 134.86716, "t": 455.58035, "r": 153.68651, "b": 464.48691, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "PTN", "bbox": {"l": 134.86716, "t": 455.58035, "r": 153.68651, "b": 464.48691, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 183.62411, "t": 455.58035, "r": 186.94167, "b": 464.48691, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "-", "bbox": {"l": 183.62411, "t": 455.58035, "r": 186.94167, "b": 464.48691, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 227.88795000000002, "t": 455.58035, "r": 231.20551, "b": 464.48691, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "-", "bbox": {"l": 227.88795000000002, "t": 455.58035, "r": 231.20551, "b": 464.48691, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 259.69855, "t": 455.58035, "r": 282.11441, "b": 464.48691, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "93.01", "bbox": {"l": 259.69855, "t": 455.58035, "r": 282.11441, "b": 464.48691, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 66.315002, "t": 468.13336, "r": 117.38329000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 468.13336, "r": 117.38329000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 134.86766, "t": 468.13336, "r": 153.68701, "b": 477.03992, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "PTN", "bbox": {"l": 134.86766, "t": 468.13336, "r": 153.68701, "b": 477.03992, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 176.57111, "t": 468.13336, "r": 194.00566, "b": 477.03992, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "98.5", "bbox": {"l": 176.57111, "t": 468.13336, "r": 194.00566, "b": 477.03992, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 220.83495, "t": 468.13336, "r": 238.26950000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "95.0", "bbox": {"l": 220.83495, "t": 468.13336, "r": 238.26950000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 259.698, "t": 468.01379, "r": 282.11386, "b": 476.97018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "96.75", "bbox": {"l": 259.698, "t": 468.01379, "r": 282.11386, "b": 476.97018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 81.612, "t": 483.32635, "r": 102.08514, "b": 492.23291, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "EDD", "bbox": {"l": 81.612, "t": 483.32635, "r": 102.08514, "b": 492.23291, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 134.87206, "t": 483.32635, "r": 153.69141, "b": 492.23291, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "FTN", "bbox": {"l": 134.87206, "t": 483.32635, "r": 153.69141, "b": 492.23291, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 176.56554, "t": 483.32635, "r": 194.00009, "b": 492.23291, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "88.4", "bbox": {"l": 176.56554, "t": 483.32635, "r": 194.00009, "b": 492.23291, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 218.33870999999996, "t": 483.32635, "r": 240.75455999999997, "b": 492.23291, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "92.08", "bbox": {"l": 218.33870999999996, "t": 483.32635, "r": 240.75455999999997, "b": 492.23291, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 262.18411, "t": 483.32635, "r": 279.61865, "b": 492.23291, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "90.6", "bbox": {"l": 262.18411, "t": 483.32635, "r": 279.61865, "b": 492.23291, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 82.165001, "t": 495.28134, "r": 101.5323, "b": 504.1879, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "GTE", "bbox": {"l": 82.165001, "t": 495.28134, "r": 101.5323, "b": 504.1879, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 134.86716, "t": 495.28134, "r": 153.68651, "b": 504.1879, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "FTN", "bbox": {"l": 134.86716, "t": 495.28134, "r": 153.68651, "b": 504.1879, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 183.62411, "t": 495.28134, "r": 186.94167, "b": 504.1879, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "-", "bbox": {"l": 183.62411, "t": 495.28134, "r": 186.94167, "b": 504.1879, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 227.88795000000002, "t": 495.28134, "r": 231.20551, "b": 504.1879, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "-", "bbox": {"l": 227.88795000000002, "t": 495.28134, "r": 231.20551, "b": 504.1879, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 259.69855, "t": 495.28134, "r": 282.11441, "b": 504.1879, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "87.14", "bbox": {"l": 259.69855, "t": 495.28134, "r": 282.11441, "b": 504.1879, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 71.789001, "t": 507.23633, "r": 111.90838999999998, "b": 516.14288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "GTE (FT)", "bbox": {"l": 71.789001, "t": 507.23633, "r": 111.90838999999998, "b": 516.14288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 134.86221, "t": 507.23633, "r": 153.68156, "b": 516.14288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "FTN", "bbox": {"l": 134.86221, "t": 507.23633, "r": 153.68156, "b": 516.14288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 183.62914, "t": 507.23633, "r": 186.94669, "b": 516.14288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "-", "bbox": {"l": 183.62914, "t": 507.23633, "r": 186.94669, "b": 516.14288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 227.89297, "t": 507.23633, "r": 231.21053000000003, "b": 516.14288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "-", "bbox": {"l": 227.89297, "t": 507.23633, "r": 231.21053000000003, "b": 516.14288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 259.6936, "t": 507.23633, "r": 282.10947, "b": 516.14288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "91.02", "bbox": {"l": 259.6936, "t": 507.23633, "r": 282.10947, "b": 516.14288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 66.315002, "t": 519.1913099999999, "r": 117.38329000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 519.1913099999999, "r": 117.38329000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 134.86766, "t": 519.1913099999999, "r": 153.68701, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "FTN", "bbox": {"l": 134.86766, "t": 519.1913099999999, "r": 153.68701, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 176.57111, "t": 519.1913099999999, "r": 194.00566, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "97.5", "bbox": {"l": 176.57111, "t": 519.1913099999999, "r": 194.00566, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 220.83495, "t": 519.1913099999999, "r": 238.26950000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "96.0", "bbox": {"l": 220.83495, "t": 519.1913099999999, "r": 238.26950000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 262.189, "t": 519.0717500000001, "r": 279.62354, "b": 528.02814, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "96.8", "bbox": {"l": 262.189, "t": 519.0717500000001, "r": 279.62354, "b": 528.02814, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 81.612, "t": 536.49837, "r": 102.08514, "b": 545.40492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "EDD", "bbox": {"l": 81.612, "t": 536.49837, "r": 102.08514, "b": 545.40492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 137.91064, "t": 536.49837, "r": 150.64285, "b": 545.40492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "TB", "bbox": {"l": 137.91064, "t": 536.49837, "r": 150.64285, "b": 545.40492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 176.56554, "t": 536.49837, "r": 194.00009, "b": 545.40492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "86.0", "bbox": {"l": 176.56554, "t": 536.49837, "r": 194.00009, "b": 545.40492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 227.89285, "t": 536.49837, "r": 231.21040000000002, "b": 545.40492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "-", "bbox": {"l": 227.89285, "t": 536.49837, "r": 231.21040000000002, "b": 545.40492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 262.18411, "t": 536.49837, "r": 279.61865, "b": 545.40492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "86.0", "bbox": {"l": 262.18411, "t": 536.49837, "r": 279.61865, "b": 545.40492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 66.315002, "t": 548.45436, "r": 117.38329000000002, "b": 557.36092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 548.45436, "r": 117.38329000000002, "b": 557.36092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 137.90625, "t": 548.45436, "r": 150.63846, "b": 557.36092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "TB", "bbox": {"l": 137.90625, "t": 548.45436, "r": 150.63846, "b": 557.36092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 176.57111, "t": 548.45436, "r": 194.00566, "b": 557.36092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "89.6", "bbox": {"l": 176.57111, "t": 548.45436, "r": 194.00566, "b": 557.36092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 227.88845999999998, "t": 548.45436, "r": 231.20601, "b": 557.36092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "-", "bbox": {"l": 227.88845999999998, "t": 548.45436, "r": 231.20601, "b": 557.36092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 262.189, "t": 548.3348100000001, "r": 279.62354, "b": 557.2911799999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": "89.6", "bbox": {"l": 262.189, "t": 548.3348100000001, "r": 279.62354, "b": 557.2911799999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 66.315002, "t": 568.00237, "r": 117.38329000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 568.00237, "r": 117.38329000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 134.86766, "t": 568.00237, "r": 153.68701, "b": 576.90892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "STN", "bbox": {"l": 134.86766, "t": 568.00237, "r": 153.68701, "b": 576.90892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 176.57111, "t": 568.00237, "r": 194.00566, "b": 576.90892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": "96.9", "bbox": {"l": 176.57111, "t": 568.00237, "r": 194.00566, "b": 576.90892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 220.83495, "t": 568.00237, "r": 238.26950000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 107, "text": "95.7", "bbox": {"l": 220.83495, "t": 568.00237, "r": 238.26950000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 262.1897, "t": 568.00237, "r": 279.62424, "b": 576.90892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 108, "text": "96.7", "bbox": {"l": 262.1897, "t": 568.00237, "r": 279.62424, "b": 576.90892, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 11, "num_cols": 5, "table_cells": [{"bbox": {"l": 78.843002, "t": 420.69037, "r": 104.85535, "b": 429.59692, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Model", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 211.2, "t": 414.71237, "r": 247.74349999999998, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "TEDS Complex", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 129.338, "t": 426.66736, "r": 159.21584, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Dataset", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 171.17096, "t": 426.66736, "r": 199.40497, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Simple", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 264.54044, "t": 426.66736, "r": 277.27264, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "All", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 81.612, "t": 443.62436, "r": 102.08514, "b": 452.53091, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "EDD", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.87206, "t": 443.62436, "r": 153.69141, "b": 452.53091, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "PTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.56554, "t": 443.62436, "r": 194.00009, "b": 452.53091, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "91.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 220.82938000000001, "t": 443.62436, "r": 238.26393, "b": 452.53091, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "88.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 262.18414, "t": 443.62436, "r": 279.61868, "b": 452.53091, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "89.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 82.165001, "t": 455.58035, "r": 101.5323, "b": 464.48691, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "GTE", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.86716, "t": 455.58035, "r": 153.68651, "b": 464.48691, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "PTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 183.62411, "t": 455.58035, "r": 186.94167, "b": 464.48691, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 227.88795000000002, "t": 455.58035, "r": 231.20551, "b": 464.48691, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 259.69855, "t": 455.58035, "r": 282.11441, "b": 464.48691, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "93.01", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 66.315002, "t": 468.13336, "r": 117.38329000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.86766, "t": 468.13336, "r": 153.68701, "b": 477.03992, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "PTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.57111, "t": 468.13336, "r": 194.00566, "b": 477.03992, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "98.5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 220.83495, "t": 468.13336, "r": 238.26950000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "95.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 259.698, "t": 468.01379, "r": 282.11386, "b": 476.97018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "96.75", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 81.612, "t": 483.32635, "r": 102.08514, "b": 492.23291, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "EDD", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.87206, "t": 483.32635, "r": 153.69141, "b": 492.23291, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "FTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.56554, "t": 483.32635, "r": 194.00009, "b": 492.23291, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "88.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 218.33870999999996, "t": 483.32635, "r": 240.75455999999997, "b": 492.23291, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "92.08", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 262.18411, "t": 483.32635, "r": 279.61865, "b": 492.23291, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "90.6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 82.165001, "t": 495.28134, "r": 101.5323, "b": 504.1879, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "GTE", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.86716, "t": 495.28134, "r": 153.68651, "b": 504.1879, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "FTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 183.62411, "t": 495.28134, "r": 186.94167, "b": 504.1879, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 227.88795000000002, "t": 495.28134, "r": 231.20551, "b": 504.1879, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 259.69855, "t": 495.28134, "r": 282.11441, "b": 504.1879, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "87.14", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 71.789001, "t": 507.23633, "r": 111.90838999999998, "b": 516.14288, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "GTE (FT)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.86221, "t": 507.23633, "r": 153.68156, "b": 516.14288, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "FTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 183.62914, "t": 507.23633, "r": 186.94669, "b": 516.14288, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 227.89297, "t": 507.23633, "r": 231.21053000000003, "b": 516.14288, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 259.6936, "t": 507.23633, "r": 282.10947, "b": 516.14288, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "91.02", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 66.315002, "t": 519.1913099999999, "r": 117.38329000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.86766, "t": 519.1913099999999, "r": 153.68701, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "FTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.57111, "t": 519.1913099999999, "r": 194.00566, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "97.5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 220.83495, "t": 519.1913099999999, "r": 238.26950000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "96.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 262.189, "t": 519.0717500000001, "r": 279.62354, "b": 528.02814, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "96.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 81.612, "t": 536.49837, "r": 102.08514, "b": 545.40492, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "EDD", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 137.91064, "t": 536.49837, "r": 150.64285, "b": 545.40492, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "TB", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.56554, "t": 536.49837, "r": 194.00009, "b": 545.40492, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "86.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 227.89285, "t": 536.49837, "r": 231.21040000000002, "b": 545.40492, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 262.18411, "t": 536.49837, "r": 279.61865, "b": 545.40492, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "86.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 66.315002, "t": 548.45436, "r": 117.38329000000002, "b": 557.36092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 137.90625, "t": 548.45436, "r": 150.63846, "b": 557.36092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "TB", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.57111, "t": 548.45436, "r": 194.00566, "b": 557.36092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "89.6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 227.88845999999998, "t": 548.45436, "r": 231.20601, "b": 557.36092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 262.189, "t": 548.3348100000001, "r": 279.62354, "b": 557.2911799999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "89.6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 66.315002, "t": 568.00237, "r": 117.38329000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.86766, "t": 568.00237, "r": 153.68701, "b": 576.90892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "STN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.57111, "t": 568.00237, "r": 194.00566, "b": 576.90892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "96.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 220.83495, "t": 568.00237, "r": 238.26950000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "95.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 262.1897, "t": 568.00237, "r": 279.62424, "b": 576.90892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "96.7", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "text", "id": 15, "page_no": 6, "cluster": {"id": 15, "label": "text", "bbox": {"l": 50.112, "t": 592.43336, "r": 286.36511, "b": 613.29492, "coord_origin": "TOPLEFT"}, "confidence": 0.7209173440933228, "cells": [{"id": 109, "text": "Table 2: Structure results on PubTabNet (PTN), FinTabNet", "bbox": {"l": 50.112, "t": 592.43336, "r": 286.36511, "b": 601.33992, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "(FTN), TableBank (TB) and SynthTabNet (STN).", "bbox": {"l": 50.112, "t": 604.38837, "r": 247.46114, "b": 613.29492, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 2: Structure results on PubTabNet (PTN), FinTabNet (FTN), TableBank (TB) and SynthTabNet (STN)."}, {"label": "text", "id": 16, "page_no": 6, "cluster": {"id": 16, "label": "text", "bbox": {"l": 50.112, "t": 616.34337, "r": 261.78732, "b": 625.24992, "coord_origin": "TOPLEFT"}, "confidence": 0.6433312892913818, "cells": [{"id": 111, "text": "FT: Model was trained on PubTabNet then finetuned.", "bbox": {"l": 50.112, "t": 616.34337, "r": 261.78732, "b": 625.24992, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "FT: Model was trained on PubTabNet then finetuned."}, {"label": "text", "id": 3, "page_no": 6, "cluster": {"id": 3, "label": "text", "bbox": {"l": 50.112015, "t": 644.3498099999999, "r": 286.366, "b": 713.151932, "coord_origin": "TOPLEFT"}, "confidence": 0.9854635000228882, "cells": [{"id": 112, "text": "Cell Detection.", "bbox": {"l": 62.067001, "t": 644.3498099999999, "r": 124.72179, "b": 653.30618, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "Like any object detector, our", "bbox": {"l": 128.20401, "t": 644.46936, "r": 242.9333, "b": 653.37592, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "Cell BBox", "bbox": {"l": 245.55401999999998, "t": 644.55902, "r": 286.36084, "b": 653.1467700000001, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "Detector", "bbox": {"l": 50.112015, "t": 656.51402, "r": 84.971146, "b": 665.10178, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "provides bounding boxes that can be improved", "bbox": {"l": 89.515015, "t": 656.42436, "r": 286.366, "b": 665.33092, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "with post-processing during inference. We make use of the", "bbox": {"l": 50.112015, "t": 668.37936, "r": 286.36511, "b": 677.28593, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "grid-like structure of tables to refine the predictions. A de-", "bbox": {"l": 50.112015, "t": 680.33536, "r": 286.36505, "b": 689.24193, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "tailed explanation on the post-processing is available in the", "bbox": {"l": 50.112015, "t": 692.290359, "r": 286.36511, "b": 701.19693, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "supplementary material. As shown in Tab. 3, we evaluate", "bbox": {"l": 50.112015, "t": 704.245361, "r": 286.36508, "b": 713.151932, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Cell Detection. Like any object detector, our Cell BBox Detector provides bounding boxes that can be improved with post-processing during inference. We make use of the grid-like structure of tables to refine the predictions. A detailed explanation on the post-processing is available in the supplementary material. As shown in Tab. 3, we evaluate"}, {"label": "text", "id": 7, "page_no": 6, "cluster": {"id": 7, "label": "text", "bbox": {"l": 308.862, "t": 75.20836999999995, "r": 545.11517, "b": 227.57709, "coord_origin": "TOPLEFT"}, "confidence": 0.9713197946548462, "cells": [{"id": 121, "text": "our", "bbox": {"l": 308.862, "t": 75.20836999999995, "r": 322.14215, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Cell BBox Decoder", "bbox": {"l": 325.45401, "t": 75.29803000000004, "r": 404.56702, "b": 83.88580000000002, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "accuracy for cells with a class la-", "bbox": {"l": 408.104, "t": 75.20836999999995, "r": 545.10968, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "bel of \u2018content\u2019 only using the PASCAL VOC mAP metric", "bbox": {"l": 308.862, "t": 87.16339000000005, "r": 545.11511, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "for pre-processing and post-processing.", "bbox": {"l": 308.862, "t": 99.11841000000004, "r": 470.22626, "b": 108.02495999999985, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "Note that we do", "bbox": {"l": 477.52884, "t": 99.11841000000004, "r": 545.11511, "b": 108.02495999999985, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "not have post-processing results for SynthTabNet as images", "bbox": {"l": 308.862, "t": 111.07343000000003, "r": 545.11517, "b": 119.97997999999984, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "are only provided. To compare the performance of our pro-", "bbox": {"l": 308.862, "t": 123.02844000000005, "r": 545.11511, "b": 131.93499999999995, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "posed approach, we\u2019ve integrated TableFormer\u2019s", "bbox": {"l": 308.862, "t": 134.98443999999995, "r": 502.01691000000005, "b": 143.89099, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "Cell BBox", "bbox": {"l": 504.47299, "t": 135.07410000000004, "r": 545.11041, "b": 143.66187000000002, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "Decoder", "bbox": {"l": 308.862, "t": 147.02910999999995, "r": 343.16324, "b": 155.61688000000004, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "into EDD architecture. As mentioned previously,", "bbox": {"l": 346.371, "t": 146.93944999999997, "r": 545.11493, "b": 155.84600999999998, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "the Structure Decoder provides the", "bbox": {"l": 308.862, "t": 158.89446999999996, "r": 446.15652, "b": 167.80102999999997, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "Cell BBox Decoder", "bbox": {"l": 448.28998000000007, "t": 158.98413000000005, "r": 525.04181, "b": 167.57190000000003, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "with", "bbox": {"l": 527.39899, "t": 158.89446999999996, "r": 545.11249, "b": 167.80102999999997, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "the features needed to predict the bounding box predictions.", "bbox": {"l": 308.862, "t": 170.84948999999995, "r": 545.11511, "b": 179.75603999999998, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "Therefore, the accuracy of the", "bbox": {"l": 308.862, "t": 182.80449999999996, "r": 432.86642000000006, "b": 191.71105999999997, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "Structure Decoder", "bbox": {"l": 436.39001, "t": 182.89417000000003, "r": 510.93021, "b": 191.48193000000003, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "directly", "bbox": {"l": 514.677, "t": 182.80449999999996, "r": 545.11273, "b": 191.71105999999997, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "influences the accuracy of the", "bbox": {"l": 308.862, "t": 194.75951999999995, "r": 431.17285, "b": 203.66607999999997, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "Cell BBox Decoder", "bbox": {"l": 434.6790199999999, "t": 194.84918000000005, "r": 514.18054, "b": 203.43695000000002, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": ". If the", "bbox": {"l": 514.17603, "t": 194.75951999999995, "r": 545.10992, "b": 203.66607999999997, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "Structure Decoder", "bbox": {"l": 308.86203, "t": 206.80517999999995, "r": 382.35614, "b": 215.39293999999995, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "predicts an extra column, this will result", "bbox": {"l": 385.07501, "t": 206.71551999999997, "r": 545.11426, "b": 215.62207, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "in an extra column of predicted bounding boxes.", "bbox": {"l": 308.862, "t": 218.67052999999999, "r": 501.6981799999999, "b": 227.57709, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "our Cell BBox Decoder accuracy for cells with a class label of \u2018content\u2019 only using the PASCAL VOC mAP metric for pre-processing and post-processing. Note that we do not have post-processing results for SynthTabNet as images are only provided. To compare the performance of our proposed approach, we\u2019ve integrated TableFormer\u2019s Cell BBox Decoder into EDD architecture. As mentioned previously, the Structure Decoder provides the Cell BBox Decoder with the features needed to predict the bounding box predictions. Therefore, the accuracy of the Structure Decoder directly influences the accuracy of the Cell BBox Decoder . If the Structure Decoder predicts an extra column, this will result in an extra column of predicted bounding boxes."}, {"label": "table", "id": 8, "page_no": 6, "cluster": {"id": 8, "label": "table", "bbox": {"l": 308.4068603515625, "t": 247.87631225585938, "r": 533.6419677734375, "b": 303.8056640625, "coord_origin": "TOPLEFT"}, "confidence": 0.9691730737686157, "cells": [{"id": 146, "text": "Model", "bbox": {"l": 339.323, "t": 253.66436999999996, "r": 365.33536, "b": 262.57092, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "Dataset", "bbox": {"l": 401.04132, "t": 253.66436999999996, "r": 430.91916, "b": 262.57092, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "mAP", "bbox": {"l": 454.10214, "t": 253.66436999999996, "r": 474.58523999999994, "b": 262.57092, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "mAP (PP)", "bbox": {"l": 486.54034, "t": 253.66436999999996, "r": 527.2276, "b": 262.57092, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "EDD+BBox", "bbox": {"l": 327.65601, "t": 270.62134000000003, "r": 377.00076, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "PubTabNet", "bbox": {"l": 393.69809, "t": 270.62134000000003, "r": 438.28073, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "79.2", "bbox": {"l": 455.63559, "t": 270.62134000000003, "r": 473.07013, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "82.7", "bbox": {"l": 498.16592, "t": 270.62134000000003, "r": 515.60046, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "TableFormer", "bbox": {"l": 326.79501, "t": 282.57631999999995, "r": 377.86331, "b": 291.48288, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "PubTabNet", "bbox": {"l": 393.69388, "t": 282.57631999999995, "r": 438.27652, "b": 291.48288, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "82.1", "bbox": {"l": 455.63101, "t": 282.45676, "r": 473.06555000000003, "b": 291.41315, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "86.8", "bbox": {"l": 498.1713, "t": 282.45676, "r": 515.60583, "b": 291.41315, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "TableFormer", "bbox": {"l": 326.79501, "t": 294.53131, "r": 377.86331, "b": 303.43787, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "SynthTabNet", "bbox": {"l": 389.81842, "t": 294.53131, "r": 442.15194999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "87.7", "bbox": {"l": 455.63135, "t": 294.53131, "r": 473.06589, "b": 303.43787, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "-", "bbox": {"l": 505.22515999999996, "t": 294.53131, "r": 508.54268999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}}], "children": [{"id": 73, "label": "text", "bbox": {"l": 339.323, "t": 253.66436999999996, "r": 365.33536, "b": 262.57092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 146, "text": "Model", "bbox": {"l": 339.323, "t": 253.66436999999996, "r": 365.33536, "b": 262.57092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 401.04132, "t": 253.66436999999996, "r": 430.91916, "b": 262.57092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 147, "text": "Dataset", "bbox": {"l": 401.04132, "t": 253.66436999999996, "r": 430.91916, "b": 262.57092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 454.10214, "t": 253.66436999999996, "r": 474.58523999999994, "b": 262.57092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 148, "text": "mAP", "bbox": {"l": 454.10214, "t": 253.66436999999996, "r": 474.58523999999994, "b": 262.57092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 486.54034, "t": 253.66436999999996, "r": 527.2276, "b": 262.57092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 149, "text": "mAP (PP)", "bbox": {"l": 486.54034, "t": 253.66436999999996, "r": 527.2276, "b": 262.57092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 327.65601, "t": 270.62134000000003, "r": 377.00076, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 150, "text": "EDD+BBox", "bbox": {"l": 327.65601, "t": 270.62134000000003, "r": 377.00076, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 393.69809, "t": 270.62134000000003, "r": 438.28073, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 151, "text": "PubTabNet", "bbox": {"l": 393.69809, "t": 270.62134000000003, "r": 438.28073, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 455.63559, "t": 270.62134000000003, "r": 473.07013, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 152, "text": "79.2", "bbox": {"l": 455.63559, "t": 270.62134000000003, "r": 473.07013, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 498.16592, "t": 270.62134000000003, "r": 515.60046, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 153, "text": "82.7", "bbox": {"l": 498.16592, "t": 270.62134000000003, "r": 515.60046, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 326.79501, "t": 282.57631999999995, "r": 377.86331, "b": 291.48288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 154, "text": "TableFormer", "bbox": {"l": 326.79501, "t": 282.57631999999995, "r": 377.86331, "b": 291.48288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 393.69388, "t": 282.57631999999995, "r": 438.27652, "b": 291.48288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 155, "text": "PubTabNet", "bbox": {"l": 393.69388, "t": 282.57631999999995, "r": 438.27652, "b": 291.48288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 455.63101, "t": 282.45676, "r": 473.06555000000003, "b": 291.41315, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 156, "text": "82.1", "bbox": {"l": 455.63101, "t": 282.45676, "r": 473.06555000000003, "b": 291.41315, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 498.1713, "t": 282.45676, "r": 515.60583, "b": 291.41315, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 157, "text": "86.8", "bbox": {"l": 498.1713, "t": 282.45676, "r": 515.60583, "b": 291.41315, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 326.79501, "t": 294.53131, "r": 377.86331, "b": 303.43787, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 158, "text": "TableFormer", "bbox": {"l": 326.79501, "t": 294.53131, "r": 377.86331, "b": 303.43787, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 389.81842, "t": 294.53131, "r": 442.15194999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 159, "text": "SynthTabNet", "bbox": {"l": 389.81842, "t": 294.53131, "r": 442.15194999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 455.63135, "t": 294.53131, "r": 473.06589, "b": 303.43787, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 160, "text": "87.7", "bbox": {"l": 455.63135, "t": 294.53131, "r": 473.06589, "b": 303.43787, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 505.22515999999996, "t": 294.53131, "r": 508.54268999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 161, "text": "-", "bbox": {"l": 505.22515999999996, "t": 294.53131, "r": 508.54268999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 4, "num_cols": 4, "table_cells": [{"bbox": {"l": 339.323, "t": 253.66436999999996, "r": 365.33536, "b": 262.57092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Model", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 401.04132, "t": 253.66436999999996, "r": 430.91916, "b": 262.57092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Dataset", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 454.10214, "t": 253.66436999999996, "r": 474.58523999999994, "b": 262.57092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "mAP", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 486.54034, "t": 253.66436999999996, "r": 527.2276, "b": 262.57092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "mAP (PP)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 327.65601, "t": 270.62134000000003, "r": 377.00076, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "EDD+BBox", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 393.69809, "t": 270.62134000000003, "r": 438.28073, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "PubTabNet", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 455.63559, "t": 270.62134000000003, "r": 473.07013, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "79.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 498.16592, "t": 270.62134000000003, "r": 515.60046, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "82.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.79501, "t": 282.57631999999995, "r": 377.86331, "b": 291.48288, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 393.69388, "t": 282.57631999999995, "r": 438.27652, "b": 291.48288, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "PubTabNet", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 455.63101, "t": 282.45676, "r": 473.06555000000003, "b": 291.41315, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "82.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 498.1713, "t": 282.45676, "r": 515.60583, "b": 291.41315, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "86.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.79501, "t": 294.53131, "r": 377.86331, "b": 303.43787, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 389.81842, "t": 294.53131, "r": 442.15194999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "SynthTabNet", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 455.63135, "t": 294.53131, "r": 473.06589, "b": 303.43787, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "87.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 505.22515999999996, "t": 294.53131, "r": 508.54268999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "caption", "id": 12, "page_no": 6, "cluster": {"id": 12, "label": "caption", "bbox": {"l": 308.862, "t": 316.44931, "r": 545.11517, "b": 337.3108500000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9519917964935303, "cells": [{"id": 162, "text": "Table 3:", "bbox": {"l": 308.862, "t": 316.44931, "r": 341.49951, "b": 325.35587, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "Cell Bounding Box detection results on PubTab-", "bbox": {"l": 348.60284, "t": 316.44931, "r": 545.11517, "b": 325.35587, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "Net, and FinTabNet. PP: Post-processing.", "bbox": {"l": 308.862, "t": 328.4043, "r": 474.97845, "b": 337.3108500000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 3: Cell Bounding Box detection results on PubTabNet, and FinTabNet. PP: Post-processing."}, {"label": "text", "id": 4, "page_no": 6, "cluster": {"id": 4, "label": "text", "bbox": {"l": 308.86197, "t": 367.6797199999999, "r": 545.11566, "b": 520.16769, "coord_origin": "TOPLEFT"}, "confidence": 0.9835010766983032, "cells": [{"id": 165, "text": "Cell Content.", "bbox": {"l": 320.81699, "t": 367.6797199999999, "r": 378.94876, "b": 376.63611, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "In this section, we evaluate the entire", "bbox": {"l": 387.07898, "t": 367.79929, "r": 545.11566, "b": 376.70584, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "pipeline of recovering a table with content.", "bbox": {"l": 308.86197, "t": 379.75426999999996, "r": 487.19257, "b": 388.66083, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "Here we put", "bbox": {"l": 493.96713, "t": 379.75426999999996, "r": 545.11511, "b": 388.66083, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "our approach to test by capitalizing on extracting content", "bbox": {"l": 308.86197, "t": 391.70926, "r": 545.11505, "b": 400.61581, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "from the PDF cells rather than decoding from images. Tab.", "bbox": {"l": 308.86197, "t": 403.66525, "r": 545.11523, "b": 412.57181, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "4", "bbox": {"l": 308.86197, "t": 415.62024, "r": 314.08096, "b": 424.52679, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "shows the TEDs score of HTML code representing the", "bbox": {"l": 316.69046, "t": 415.62024, "r": 545.11517, "b": 424.52679, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "structure of the table along with the content inserted in the", "bbox": {"l": 308.86197, "t": 427.57523, "r": 545.11505, "b": 436.48177999999996, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "data cell and compared with the ground-truth. Our method", "bbox": {"l": 308.86197, "t": 439.53021, "r": 545.11505, "b": 448.43677, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "achieved a", "bbox": {"l": 308.86197, "t": 451.4852, "r": 350.23666, "b": 460.39175, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "5.3%", "bbox": {"l": 352.17596, "t": 451.36563, "r": 374.59183, "b": 460.32201999999995, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "increase over the state-of-the-art, and com-", "bbox": {"l": 376.53296, "t": 451.4852, "r": 545.11011, "b": 460.39175, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "mercial solutions. We believe our scores would be higher", "bbox": {"l": 308.86197, "t": 463.44019, "r": 545.11511, "b": 472.34674, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "if the HTML ground-truth matched the extracted PDF cell", "bbox": {"l": 308.86197, "t": 475.39618, "r": 545.11517, "b": 484.30273, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "content. Unfortunately, there are small discrepancies such", "bbox": {"l": 308.86197, "t": 487.35117, "r": 545.11511, "b": 496.25772, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "as spacings around words or special characters with various", "bbox": {"l": 308.86197, "t": 499.30615, "r": 545.11505, "b": 508.21271, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "unicode representations.", "bbox": {"l": 308.86197, "t": 511.26114, "r": 405.69846, "b": 520.16769, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Cell Content. In this section, we evaluate the entire pipeline of recovering a table with content. Here we put our approach to test by capitalizing on extracting content from the PDF cells rather than decoding from images. Tab. 4 shows the TEDs score of HTML code representing the structure of the table along with the content inserted in the data cell and compared with the ground-truth. Our method achieved a 5.3% increase over the state-of-the-art, and commercial solutions. We believe our scores would be higher if the HTML ground-truth matched the extracted PDF cell content. Unfortunately, there are small discrepancies such as spacings around words or special characters with various unicode representations."}, {"label": "table", "id": 5, "page_no": 6, "cluster": {"id": 5, "label": "table", "bbox": {"l": 332.9688720703125, "t": 540.2835693359375, "r": 520.942138671875, "b": 643.2697143554688, "coord_origin": "TOPLEFT"}, "confidence": 0.9775567650794983, "cells": [{"id": 183, "text": "Model", "bbox": {"l": 358.01099, "t": 552.23337, "r": 384.02335, "b": 561.1399200000001, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "TEDS", "bbox": {"l": 449.03400000000005, "t": 546.25537, "r": 473.94049000000007, "b": 555.16193, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": "Simple", "bbox": {"l": 408.50598, "t": 558.21037, "r": 436.73999, "b": 567.11693, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "Complex", "bbox": {"l": 448.6951, "t": 558.21037, "r": 485.07849, "b": 567.11693, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "All", "bbox": {"l": 499.3848, "t": 558.21037, "r": 512.117, "b": 567.11693, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": "Tabula", "bbox": {"l": 357.68201, "t": 575.16736, "r": 384.3519, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "78.0", "bbox": {"l": 413.90097, "t": 575.16736, "r": 431.33550999999994, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "57.8", "bbox": {"l": 458.16479000000004, "t": 575.16736, "r": 475.59933000000007, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "67.9", "bbox": {"l": 497.0289, "t": 575.16736, "r": 514.46344, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": "Traprange", "bbox": {"l": 350.72299, "t": 587.12236, "r": 391.31064, "b": 596.02892, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "60.8", "bbox": {"l": 413.90582, "t": 587.12236, "r": 431.34036, "b": 596.02892, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "49.9", "bbox": {"l": 458.16965, "t": 587.12236, "r": 475.60419, "b": 596.02892, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "55.4", "bbox": {"l": 497.03374999999994, "t": 587.12236, "r": 514.46832, "b": 596.02892, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "Camelot", "bbox": {"l": 354.13599, "t": 599.07835, "r": 387.89923, "b": 607.98491, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "80.0", "bbox": {"l": 413.90161, "t": 599.07835, "r": 431.33615, "b": 607.98491, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "66.0", "bbox": {"l": 458.16544, "t": 599.07835, "r": 475.59998, "b": 607.98491, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "73.0", "bbox": {"l": 497.02954000000005, "t": 599.07835, "r": 514.46411, "b": 607.98491, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "Acrobat Pro", "bbox": {"l": 346.55899, "t": 611.03336, "r": 395.47534, "b": 619.93991, "coord_origin": "TOPLEFT"}}, {"id": 201, "text": "68.9", "bbox": {"l": 413.90616, "t": 611.03336, "r": 431.34069999999997, "b": 619.93991, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": "61.8", "bbox": {"l": 458.16998000000007, "t": 611.03336, "r": 475.60452, "b": 619.93991, "coord_origin": "TOPLEFT"}}, {"id": 203, "text": "65.3", "bbox": {"l": 497.03409, "t": 611.03336, "r": 514.46863, "b": 619.93991, "coord_origin": "TOPLEFT"}}, {"id": 204, "text": "EDD", "bbox": {"l": 360.78101, "t": 622.9883600000001, "r": 381.25415, "b": 631.89491, "coord_origin": "TOPLEFT"}}, {"id": 205, "text": "91.2", "bbox": {"l": 413.90158, "t": 622.9883600000001, "r": 431.33612, "b": 631.89491, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": "85.4", "bbox": {"l": 458.16541, "t": 622.9883600000001, "r": 475.59995000000004, "b": 631.89491, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": "88.3", "bbox": {"l": 497.0295100000001, "t": 622.9883600000001, "r": 514.46405, "b": 631.89491, "coord_origin": "TOPLEFT"}}, {"id": 208, "text": "TableFormer", "bbox": {"l": 345.483, "t": 634.94336, "r": 396.5513, "b": 643.84991, "coord_origin": "TOPLEFT"}}, {"id": 209, "text": "95.4", "bbox": {"l": 413.90616, "t": 634.94336, "r": 431.34069999999997, "b": 643.84991, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": "90.1", "bbox": {"l": 458.16998000000007, "t": 634.94336, "r": 475.60452, "b": 643.84991, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "93.6", "bbox": {"l": 497.03400000000005, "t": 634.82381, "r": 514.46857, "b": 643.78018, "coord_origin": "TOPLEFT"}}], "children": [{"id": 89, "label": "text", "bbox": {"l": 358.01099, "t": 552.23337, "r": 384.02335, "b": 561.1399200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 183, "text": "Model", "bbox": {"l": 358.01099, "t": 552.23337, "r": 384.02335, "b": 561.1399200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 449.03400000000005, "t": 546.25537, "r": 473.94049000000007, "b": 555.16193, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 184, "text": "TEDS", "bbox": {"l": 449.03400000000005, "t": 546.25537, "r": 473.94049000000007, "b": 555.16193, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 408.50598, "t": 558.21037, "r": 436.73999, "b": 567.11693, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 185, "text": "Simple", "bbox": {"l": 408.50598, "t": 558.21037, "r": 436.73999, "b": 567.11693, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 448.6951, "t": 558.21037, "r": 485.07849, "b": 567.11693, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 186, "text": "Complex", "bbox": {"l": 448.6951, "t": 558.21037, "r": 485.07849, "b": 567.11693, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 499.3848, "t": 558.21037, "r": 512.117, "b": 567.11693, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 187, "text": "All", "bbox": {"l": 499.3848, "t": 558.21037, "r": 512.117, "b": 567.11693, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 357.68201, "t": 575.16736, "r": 384.3519, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 188, "text": "Tabula", "bbox": {"l": 357.68201, "t": 575.16736, "r": 384.3519, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 413.90097, "t": 575.16736, "r": 431.33550999999994, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 189, "text": "78.0", "bbox": {"l": 413.90097, "t": 575.16736, "r": 431.33550999999994, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 458.16479000000004, "t": 575.16736, "r": 475.59933000000007, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 190, "text": "57.8", "bbox": {"l": 458.16479000000004, "t": 575.16736, "r": 475.59933000000007, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 497.0289, "t": 575.16736, "r": 514.46344, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 191, "text": "67.9", "bbox": {"l": 497.0289, "t": 575.16736, "r": 514.46344, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 350.72299, "t": 587.12236, "r": 391.31064, "b": 596.02892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 192, "text": "Traprange", "bbox": {"l": 350.72299, "t": 587.12236, "r": 391.31064, "b": 596.02892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 413.90582, "t": 587.12236, "r": 431.34036, "b": 596.02892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 193, "text": "60.8", "bbox": {"l": 413.90582, "t": 587.12236, "r": 431.34036, "b": 596.02892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 458.16965, "t": 587.12236, "r": 475.60419, "b": 596.02892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 194, "text": "49.9", "bbox": {"l": 458.16965, "t": 587.12236, "r": 475.60419, "b": 596.02892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 497.03374999999994, "t": 587.12236, "r": 514.46832, "b": 596.02892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 195, "text": "55.4", "bbox": {"l": 497.03374999999994, "t": 587.12236, "r": 514.46832, "b": 596.02892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 354.13599, "t": 599.07835, "r": 387.89923, "b": 607.98491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 196, "text": "Camelot", "bbox": {"l": 354.13599, "t": 599.07835, "r": 387.89923, "b": 607.98491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 413.90161, "t": 599.07835, "r": 431.33615, "b": 607.98491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 197, "text": "80.0", "bbox": {"l": 413.90161, "t": 599.07835, "r": 431.33615, "b": 607.98491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 458.16544, "t": 599.07835, "r": 475.59998, "b": 607.98491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 198, "text": "66.0", "bbox": {"l": 458.16544, "t": 599.07835, "r": 475.59998, "b": 607.98491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 497.02954000000005, "t": 599.07835, "r": 514.46411, "b": 607.98491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 199, "text": "73.0", "bbox": {"l": 497.02954000000005, "t": 599.07835, "r": 514.46411, "b": 607.98491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 346.55899, "t": 611.03336, "r": 395.47534, "b": 619.93991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 200, "text": "Acrobat Pro", "bbox": {"l": 346.55899, "t": 611.03336, "r": 395.47534, "b": 619.93991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 413.90616, "t": 611.03336, "r": 431.34069999999997, "b": 619.93991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 201, "text": "68.9", "bbox": {"l": 413.90616, "t": 611.03336, "r": 431.34069999999997, "b": 619.93991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 458.16998000000007, "t": 611.03336, "r": 475.60452, "b": 619.93991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 202, "text": "61.8", "bbox": {"l": 458.16998000000007, "t": 611.03336, "r": 475.60452, "b": 619.93991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 497.03409, "t": 611.03336, "r": 514.46863, "b": 619.93991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 203, "text": "65.3", "bbox": {"l": 497.03409, "t": 611.03336, "r": 514.46863, "b": 619.93991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 360.78101, "t": 622.9883600000001, "r": 381.25415, "b": 631.89491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 204, "text": "EDD", "bbox": {"l": 360.78101, "t": 622.9883600000001, "r": 381.25415, "b": 631.89491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 413.90158, "t": 622.9883600000001, "r": 431.33612, "b": 631.89491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 205, "text": "91.2", "bbox": {"l": 413.90158, "t": 622.9883600000001, "r": 431.33612, "b": 631.89491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 458.16541, "t": 622.9883600000001, "r": 475.59995000000004, "b": 631.89491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 206, "text": "85.4", "bbox": {"l": 458.16541, "t": 622.9883600000001, "r": 475.59995000000004, "b": 631.89491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 497.0295100000001, "t": 622.9883600000001, "r": 514.46405, "b": 631.89491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 207, "text": "88.3", "bbox": {"l": 497.0295100000001, "t": 622.9883600000001, "r": 514.46405, "b": 631.89491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 114, "label": "text", "bbox": {"l": 345.483, "t": 634.94336, "r": 396.5513, "b": 643.84991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 208, "text": "TableFormer", "bbox": {"l": 345.483, "t": 634.94336, "r": 396.5513, "b": 643.84991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 115, "label": "text", "bbox": {"l": 413.90616, "t": 634.94336, "r": 431.34069999999997, "b": 643.84991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 209, "text": "95.4", "bbox": {"l": 413.90616, "t": 634.94336, "r": 431.34069999999997, "b": 643.84991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 116, "label": "text", "bbox": {"l": 458.16998000000007, "t": 634.94336, "r": 475.60452, "b": 643.84991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 210, "text": "90.1", "bbox": {"l": 458.16998000000007, "t": 634.94336, "r": 475.60452, "b": 643.84991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 117, "label": "text", "bbox": {"l": 497.03400000000005, "t": 634.82381, "r": 514.46857, "b": 643.78018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 211, "text": "93.6", "bbox": {"l": 497.03400000000005, "t": 634.82381, "r": 514.46857, "b": 643.78018, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["fcel", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "nl"], "num_rows": 7, "num_cols": 4, "table_cells": [{"bbox": {"l": 358.01099, "t": 552.23337, "r": 384.02335, "b": 561.1399200000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Model", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 448.6951, "t": 546.25537, "r": 485.07849, "b": 567.11693, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "TEDS Complex", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 408.50598, "t": 558.21037, "r": 436.73999, "b": 567.11693, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Simple", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 499.3848, "t": 558.21037, "r": 512.117, "b": 567.11693, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "All", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 357.68201, "t": 575.16736, "r": 384.3519, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Tabula", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 413.90097, "t": 575.16736, "r": 431.33550999999994, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "78.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 458.16479000000004, "t": 575.16736, "r": 475.59933000000007, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "57.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 497.0289, "t": 575.16736, "r": 514.46344, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "67.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 350.72299, "t": 587.12236, "r": 391.31064, "b": 596.02892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Traprange", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 413.90582, "t": 587.12236, "r": 431.34036, "b": 596.02892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "60.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 458.16965, "t": 587.12236, "r": 475.60419, "b": 596.02892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "49.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 497.03374999999994, "t": 587.12236, "r": 514.46832, "b": 596.02892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "55.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 354.13599, "t": 599.07835, "r": 387.89923, "b": 607.98491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Camelot", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 413.90161, "t": 599.07835, "r": 431.33615, "b": 607.98491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "80.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 458.16544, "t": 599.07835, "r": 475.59998, "b": 607.98491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "66.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 497.02954000000005, "t": 599.07835, "r": 514.46411, "b": 607.98491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "73.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 346.55899, "t": 611.03336, "r": 395.47534, "b": 619.93991, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Acrobat Pro", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 413.90616, "t": 611.03336, "r": 431.34069999999997, "b": 619.93991, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "68.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 458.16998000000007, "t": 611.03336, "r": 475.60452, "b": 619.93991, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "61.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 497.03409, "t": 611.03336, "r": 514.46863, "b": 619.93991, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "65.3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 360.78101, "t": 622.9883600000001, "r": 381.25415, "b": 631.89491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "EDD", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 413.90158, "t": 622.9883600000001, "r": 431.33612, "b": 631.89491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "91.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 458.16541, "t": 622.9883600000001, "r": 475.59995000000004, "b": 631.89491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "85.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 497.0295100000001, "t": 622.9883600000001, "r": 514.46405, "b": 631.89491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "88.3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 345.483, "t": 634.94336, "r": 396.5513, "b": 643.84991, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 413.90616, "t": 634.94336, "r": 431.34069999999997, "b": 643.84991, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "95.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 458.16998000000007, "t": 634.94336, "r": 475.60452, "b": 643.84991, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "90.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 497.03400000000005, "t": 634.82381, "r": 514.46857, "b": 643.78018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "93.6", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "caption", "id": 11, "page_no": 6, "cluster": {"id": 11, "label": "caption", "bbox": {"l": 308.862, "t": 656.86136, "r": 545.11517, "b": 689.6779300000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9541404247283936, "cells": [{"id": 212, "text": "Table 4:", "bbox": {"l": 308.862, "t": 656.86136, "r": 341.73862, "b": 665.76792, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "Results of structure with content retrieved using", "bbox": {"l": 349.55927, "t": 656.86136, "r": 545.11517, "b": 665.76792, "coord_origin": "TOPLEFT"}}, {"id": 214, "text": "cell detection on PubTabNet. In all cases the input is PDF", "bbox": {"l": 308.862, "t": 668.81636, "r": 545.11505, "b": 677.7229199999999, "coord_origin": "TOPLEFT"}}, {"id": 215, "text": "documents with cropped tables.", "bbox": {"l": 308.862, "t": 680.77136, "r": 435.03836, "b": 689.6779300000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 4: Results of structure with content retrieved using cell detection on PubTabNet. In all cases the input is PDF documents with cropped tables."}, {"label": "page_footer", "id": 14, "page_no": 6, "cluster": {"id": 14, "label": "page_footer", "bbox": {"l": 295.121, "t": 734.133358, "r": 300.10229, "b": 743.039921, "coord_origin": "TOPLEFT"}, "confidence": 0.8787972331047058, "cells": [{"id": 216, "text": "7", "bbox": {"l": 295.121, "t": 734.133358, "r": 300.10229, "b": 743.039921, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "7"}], "body": [{"label": "section_header", "id": 10, "page_no": 6, "cluster": {"id": 10, "label": "section_header", "bbox": {"l": 50.112, "t": 74.40137000000016, "r": 167.89825, "b": 84.25342, "coord_origin": "TOPLEFT"}, "confidence": 0.9554274082183838, "cells": [{"id": 0, "text": "5.3.", "bbox": {"l": 50.112, "t": 74.40137000000016, "r": 63.704811, "b": 84.25342, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Datasets and Metrics", "bbox": {"l": 72.766685, "t": 74.40137000000016, "r": 167.89825, "b": 84.25342, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5.3. Datasets and Metrics"}, {"label": "text", "id": 1, "page_no": 6, "cluster": {"id": 1, "label": "text", "bbox": {"l": 50.112, "t": 93.35039999999992, "r": 286.36511, "b": 138.12298999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9862998127937317, "cells": [{"id": 2, "text": "The Tree-Edit-Distance-Based Similarity (TEDS) met-", "bbox": {"l": 62.067001, "t": 93.35039999999992, "r": 286.36499, "b": 102.25696000000016, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "ric was introduced in [37]. It represents the prediction, and", "bbox": {"l": 50.112, "t": 105.30542000000003, "r": 286.36511, "b": 114.21198000000015, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "ground-truth as a tree structure of HTML tags. This simi-", "bbox": {"l": 50.112, "t": 117.26044000000002, "r": 286.36505, "b": 126.16699000000006, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "larity is calculated as:", "bbox": {"l": 50.112, "t": 129.21642999999995, "r": 136.71687, "b": 138.12298999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The Tree-Edit-Distance-Based Similarity (TEDS) metric was introduced in [37]. It represents the prediction, and ground-truth as a tree structure of HTML tags. This similarity is calculated as:"}, {"label": "formula", "id": 13, "page_no": 6, "cluster": {"id": 13, "label": "formula", "bbox": {"l": 86.218994, "t": 150.31799, "r": 286.3624, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9500409364700317, "cells": [{"id": 6, "text": "TEDS (", "bbox": {"l": 86.218994, "t": 157.05798000000004, "r": 118.8784, "b": 165.90479000000005, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "T$_{a}$, T$_{b}$", "bbox": {"l": 118.87499, "t": 157.05798000000004, "r": 143.26962, "b": 165.90479000000005, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": ") = 1", "bbox": {"l": 143.76799, "t": 157.05798000000004, "r": 165.9019, "b": 165.90479000000005, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "\u2212", "bbox": {"l": 168.12099, "t": 156.50012000000004, "r": 175.8699, "b": 165.90479000000005, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "EditDist (", "bbox": {"l": 179.27899, "t": 150.31799, "r": 221.95677, "b": 159.16479000000004, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "T$_{a}$, T$_{b}$", "bbox": {"l": 221.95200000000003, "t": 150.31799, "r": 246.34663, "b": 159.16479000000004, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": ")", "bbox": {"l": 246.84499999999997, "t": 150.31799, "r": 250.71945, "b": 159.16479000000004, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "max (", "bbox": {"l": 182.21201, "t": 163.89197000000001, "r": 206.29161, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "|", "bbox": {"l": 206.289, "t": 163.33411, "r": 209.05661, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "T$_{a}$", "bbox": {"l": 209.056, "t": 163.89197000000001, "r": 219.19968, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "|", "bbox": {"l": 219.69700999999998, "t": 163.33411, "r": 222.46461000000002, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": ",", "bbox": {"l": 224.125, "t": 163.89197000000001, "r": 226.89261, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "|", "bbox": {"l": 228.55299000000002, "t": 163.33411, "r": 231.3206, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "T$_{b}$", "bbox": {"l": 231.31999, "t": 163.89197000000001, "r": 240.64563, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "|", "bbox": {"l": 241.144, "t": 163.33411, "r": 243.91161, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": ")", "bbox": {"l": 243.911, "t": 163.89197000000001, "r": 247.78545, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "(3)", "bbox": {"l": 274.746, "t": 157.21740999999997, "r": 286.3624, "b": 166.12396, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "TEDS ( T$_{a}$, T$_{b}$ ) = 1 \u2212 EditDist ( T$_{a}$, T$_{b}$ ) max ( | T$_{a}$ | , | T$_{b}$ | ) (3)"}, {"label": "text", "id": 6, "page_no": 6, "cluster": {"id": 6, "label": "text", "bbox": {"l": 50.111984, "t": 181.00298999999995, "r": 286.36285, "b": 213.97900000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9735319018363953, "cells": [{"id": 23, "text": "where", "bbox": {"l": 62.067001, "t": 181.16241000000002, "r": 86.405632, "b": 190.06897000000004, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "T$_{a}$", "bbox": {"l": 88.581001, "t": 181.00298999999995, "r": 98.724663, "b": 189.84978999999998, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "and", "bbox": {"l": 101.399, "t": 181.16241000000002, "r": 115.785, "b": 190.06897000000004, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "T$_{b}$", "bbox": {"l": 117.961, "t": 181.00298999999995, "r": 127.28664, "b": 189.84978999999998, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "represent tables in tree structure HTML", "bbox": {"l": 129.95999, "t": 181.16241000000002, "r": 286.36285, "b": 190.06897000000004, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "format. EditDist denotes the tree-edit distance, and", "bbox": {"l": 50.111992, "t": 193.11743, "r": 252.78116000000003, "b": 202.02399000000003, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "|", "bbox": {"l": 255.18201, "t": 192.40015000000005, "r": 257.94962, "b": 201.80480999999997, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "T", "bbox": {"l": 257.94901, "t": 192.95800999999994, "r": 263.77115, "b": 201.80480999999997, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "|", "bbox": {"l": 265.155, "t": 192.40015000000005, "r": 267.92261, "b": 201.80480999999997, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "rep-", "bbox": {"l": 270.32199, "t": 193.11743, "r": 286.36179, "b": 202.02399000000003, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "resents the number of nodes in", "bbox": {"l": 50.111984, "t": 205.07245, "r": 172.13388, "b": 213.97900000000004, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "T", "bbox": {"l": 174.62399, "t": 204.91301999999996, "r": 180.44614, "b": 213.75982999999997, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": ".", "bbox": {"l": 181.82899, "t": 205.07245, "r": 184.31964, "b": 213.97900000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "where T$_{a}$ and T$_{b}$ represent tables in tree structure HTML format. EditDist denotes the tree-edit distance, and | T | represents the number of nodes in T ."}, {"label": "section_header", "id": 9, "page_no": 6, "cluster": {"id": 9, "label": "section_header", "bbox": {"l": 50.112, "t": 224.81946000000005, "r": 170.45169, "b": 234.67151, "coord_origin": "TOPLEFT"}, "confidence": 0.9588837027549744, "cells": [{"id": 36, "text": "5.4.", "bbox": {"l": 50.112, "t": 224.81946000000005, "r": 64.551605, "b": 234.67151, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "Quantitative Analysis", "bbox": {"l": 74.178009, "t": 224.81946000000005, "r": 170.45169, "b": 234.67151, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5.4. Quantitative Analysis"}, {"label": "text", "id": 2, "page_no": 6, "cluster": {"id": 2, "label": "text", "bbox": {"l": 50.112, "t": 243.6499, "r": 286.36514, "b": 396.13794, "coord_origin": "TOPLEFT"}, "confidence": 0.9855090975761414, "cells": [{"id": 38, "text": "Structure.", "bbox": {"l": 62.067001, "t": 243.6499, "r": 105.32461, "b": 252.60626000000002, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "As shown in Tab.", "bbox": {"l": 112.12600000000002, "t": 243.76946999999996, "r": 184.68361, "b": 252.67602999999997, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "2, TableFormer outper-", "bbox": {"l": 191.4781, "t": 243.76946999999996, "r": 286.36188, "b": 252.67602999999997, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "forms all SOTA methods across different datasets by a large", "bbox": {"l": 50.112, "t": 255.72448999999995, "r": 286.36508, "b": 264.63104, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "margin for predicting the table structure from an image.", "bbox": {"l": 50.112, "t": 267.67949999999996, "r": 286.36508, "b": 276.58606, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "All the more, our model outperforms pre-trained methods.", "bbox": {"l": 50.112, "t": 279.63446, "r": 286.36508, "b": 288.54105, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "During the evaluation we do not apply any table filtering.", "bbox": {"l": 50.112, "t": 291.59048, "r": 286.36514, "b": 300.49704, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "We also provide our baseline results on the SynthTabNet", "bbox": {"l": 50.112, "t": 303.54547, "r": 286.36508, "b": 312.45203000000004, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "dataset. It has been observed that large tables (e.g. tables", "bbox": {"l": 50.112, "t": 315.50046, "r": 286.36505, "b": 324.40700999999996, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "that occupy half of the page or more) yield poor predictions.", "bbox": {"l": 50.112, "t": 327.45544, "r": 286.36508, "b": 336.362, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "We attribute this issue to the image resizing during the pre-", "bbox": {"l": 50.112, "t": 339.41043, "r": 286.36508, "b": 348.31699000000003, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "processing step, that produces downsampled images with", "bbox": {"l": 50.112, "t": 351.36542, "r": 286.36505, "b": 360.27197, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "indistinguishable features. This problem can be addressed", "bbox": {"l": 50.112, "t": 363.32141, "r": 286.36508, "b": 372.2279700000001, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "by treating such big tables with a separate model which ac-", "bbox": {"l": 50.112, "t": 375.2764, "r": 286.36511, "b": 384.18295000000006, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "cepts a large input image size.", "bbox": {"l": 50.112, "t": 387.23138, "r": 170.01187, "b": 396.13794, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Structure. As shown in Tab. 2, TableFormer outperforms all SOTA methods across different datasets by a large margin for predicting the table structure from an image. All the more, our model outperforms pre-trained methods. During the evaluation we do not apply any table filtering. We also provide our baseline results on the SynthTabNet dataset. It has been observed that large tables (e.g. tables that occupy half of the page or more) yield poor predictions. We attribute this issue to the image resizing during the preprocessing step, that produces downsampled images with indistinguishable features. This problem can be addressed by treating such big tables with a separate model which accepts a large input image size."}, {"label": "table", "id": 0, "page_no": 6, "cluster": {"id": 0, "label": "table", "bbox": {"l": 53.368526458740234, "t": 409.1357727050781, "r": 283.0443420410156, "b": 582.3977661132812, "coord_origin": "TOPLEFT"}, "confidence": 0.9892510175704956, "cells": [{"id": 53, "text": "Model", "bbox": {"l": 78.843002, "t": 420.69037, "r": 104.85535, "b": 429.59692, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "TEDS", "bbox": {"l": 211.2, "t": 414.71237, "r": 236.10649, "b": 423.61893, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "Dataset", "bbox": {"l": 129.338, "t": 426.66736, "r": 159.21584, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Simple", "bbox": {"l": 171.17096, "t": 426.66736, "r": 199.40497, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Complex", "bbox": {"l": 211.36009, "t": 426.66736, "r": 247.74349999999998, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "All", "bbox": {"l": 264.54044, "t": 426.66736, "r": 277.27264, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "EDD", "bbox": {"l": 81.612, "t": 443.62436, "r": 102.08514, "b": 452.53091, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "PTN", "bbox": {"l": 134.87206, "t": 443.62436, "r": 153.69141, "b": 452.53091, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "91.1", "bbox": {"l": 176.56554, "t": 443.62436, "r": 194.00009, "b": 452.53091, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "88.7", "bbox": {"l": 220.82938000000001, "t": 443.62436, "r": 238.26393, "b": 452.53091, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "89.9", "bbox": {"l": 262.18414, "t": 443.62436, "r": 279.61868, "b": 452.53091, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "GTE", "bbox": {"l": 82.165001, "t": 455.58035, "r": 101.5323, "b": 464.48691, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "PTN", "bbox": {"l": 134.86716, "t": 455.58035, "r": 153.68651, "b": 464.48691, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "-", "bbox": {"l": 183.62411, "t": 455.58035, "r": 186.94167, "b": 464.48691, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "-", "bbox": {"l": 227.88795000000002, "t": 455.58035, "r": 231.20551, "b": 464.48691, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "93.01", "bbox": {"l": 259.69855, "t": 455.58035, "r": 282.11441, "b": 464.48691, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 468.13336, "r": 117.38329000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "PTN", "bbox": {"l": 134.86766, "t": 468.13336, "r": 153.68701, "b": 477.03992, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "98.5", "bbox": {"l": 176.57111, "t": 468.13336, "r": 194.00566, "b": 477.03992, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "95.0", "bbox": {"l": 220.83495, "t": 468.13336, "r": 238.26950000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "96.75", "bbox": {"l": 259.698, "t": 468.01379, "r": 282.11386, "b": 476.97018, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "EDD", "bbox": {"l": 81.612, "t": 483.32635, "r": 102.08514, "b": 492.23291, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "FTN", "bbox": {"l": 134.87206, "t": 483.32635, "r": 153.69141, "b": 492.23291, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "88.4", "bbox": {"l": 176.56554, "t": 483.32635, "r": 194.00009, "b": 492.23291, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "92.08", "bbox": {"l": 218.33870999999996, "t": 483.32635, "r": 240.75455999999997, "b": 492.23291, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "90.6", "bbox": {"l": 262.18411, "t": 483.32635, "r": 279.61865, "b": 492.23291, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "GTE", "bbox": {"l": 82.165001, "t": 495.28134, "r": 101.5323, "b": 504.1879, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "FTN", "bbox": {"l": 134.86716, "t": 495.28134, "r": 153.68651, "b": 504.1879, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "-", "bbox": {"l": 183.62411, "t": 495.28134, "r": 186.94167, "b": 504.1879, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "-", "bbox": {"l": 227.88795000000002, "t": 495.28134, "r": 231.20551, "b": 504.1879, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "87.14", "bbox": {"l": 259.69855, "t": 495.28134, "r": 282.11441, "b": 504.1879, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "GTE (FT)", "bbox": {"l": 71.789001, "t": 507.23633, "r": 111.90838999999998, "b": 516.14288, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "FTN", "bbox": {"l": 134.86221, "t": 507.23633, "r": 153.68156, "b": 516.14288, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "-", "bbox": {"l": 183.62914, "t": 507.23633, "r": 186.94669, "b": 516.14288, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "-", "bbox": {"l": 227.89297, "t": 507.23633, "r": 231.21053000000003, "b": 516.14288, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "91.02", "bbox": {"l": 259.6936, "t": 507.23633, "r": 282.10947, "b": 516.14288, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 519.1913099999999, "r": 117.38329000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "FTN", "bbox": {"l": 134.86766, "t": 519.1913099999999, "r": 153.68701, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "97.5", "bbox": {"l": 176.57111, "t": 519.1913099999999, "r": 194.00566, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "96.0", "bbox": {"l": 220.83495, "t": 519.1913099999999, "r": 238.26950000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "96.8", "bbox": {"l": 262.189, "t": 519.0717500000001, "r": 279.62354, "b": 528.02814, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "EDD", "bbox": {"l": 81.612, "t": 536.49837, "r": 102.08514, "b": 545.40492, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "TB", "bbox": {"l": 137.91064, "t": 536.49837, "r": 150.64285, "b": 545.40492, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "86.0", "bbox": {"l": 176.56554, "t": 536.49837, "r": 194.00009, "b": 545.40492, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "-", "bbox": {"l": 227.89285, "t": 536.49837, "r": 231.21040000000002, "b": 545.40492, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "86.0", "bbox": {"l": 262.18411, "t": 536.49837, "r": 279.61865, "b": 545.40492, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 548.45436, "r": 117.38329000000002, "b": 557.36092, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "TB", "bbox": {"l": 137.90625, "t": 548.45436, "r": 150.63846, "b": 557.36092, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "89.6", "bbox": {"l": 176.57111, "t": 548.45436, "r": 194.00566, "b": 557.36092, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "-", "bbox": {"l": 227.88845999999998, "t": 548.45436, "r": 231.20601, "b": 557.36092, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "89.6", "bbox": {"l": 262.189, "t": 548.3348100000001, "r": 279.62354, "b": 557.2911799999999, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 568.00237, "r": 117.38329000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "STN", "bbox": {"l": 134.86766, "t": 568.00237, "r": 153.68701, "b": 576.90892, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "96.9", "bbox": {"l": 176.57111, "t": 568.00237, "r": 194.00566, "b": 576.90892, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "95.7", "bbox": {"l": 220.83495, "t": 568.00237, "r": 238.26950000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "96.7", "bbox": {"l": 262.1897, "t": 568.00237, "r": 279.62424, "b": 576.90892, "coord_origin": "TOPLEFT"}}], "children": [{"id": 17, "label": "text", "bbox": {"l": 78.843002, "t": 420.69037, "r": 104.85535, "b": 429.59692, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "Model", "bbox": {"l": 78.843002, "t": 420.69037, "r": 104.85535, "b": 429.59692, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 211.2, "t": 414.71237, "r": 236.10649, "b": 423.61893, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "TEDS", "bbox": {"l": 211.2, "t": 414.71237, "r": 236.10649, "b": 423.61893, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 129.338, "t": 426.66736, "r": 159.21584, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "Dataset", "bbox": {"l": 129.338, "t": 426.66736, "r": 159.21584, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 171.17096, "t": 426.66736, "r": 199.40497, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "Simple", "bbox": {"l": 171.17096, "t": 426.66736, "r": 199.40497, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 211.36009, "t": 426.66736, "r": 247.74349999999998, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "Complex", "bbox": {"l": 211.36009, "t": 426.66736, "r": 247.74349999999998, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 264.54044, "t": 426.66736, "r": 277.27264, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "All", "bbox": {"l": 264.54044, "t": 426.66736, "r": 277.27264, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 81.612, "t": 443.62436, "r": 102.08514, "b": 452.53091, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "EDD", "bbox": {"l": 81.612, "t": 443.62436, "r": 102.08514, "b": 452.53091, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 134.87206, "t": 443.62436, "r": 153.69141, "b": 452.53091, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "PTN", "bbox": {"l": 134.87206, "t": 443.62436, "r": 153.69141, "b": 452.53091, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 176.56554, "t": 443.62436, "r": 194.00009, "b": 452.53091, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "91.1", "bbox": {"l": 176.56554, "t": 443.62436, "r": 194.00009, "b": 452.53091, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 220.82938000000001, "t": 443.62436, "r": 238.26393, "b": 452.53091, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "88.7", "bbox": {"l": 220.82938000000001, "t": 443.62436, "r": 238.26393, "b": 452.53091, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 262.18414, "t": 443.62436, "r": 279.61868, "b": 452.53091, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "89.9", "bbox": {"l": 262.18414, "t": 443.62436, "r": 279.61868, "b": 452.53091, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 82.165001, "t": 455.58035, "r": 101.5323, "b": 464.48691, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "GTE", "bbox": {"l": 82.165001, "t": 455.58035, "r": 101.5323, "b": 464.48691, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 134.86716, "t": 455.58035, "r": 153.68651, "b": 464.48691, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "PTN", "bbox": {"l": 134.86716, "t": 455.58035, "r": 153.68651, "b": 464.48691, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 183.62411, "t": 455.58035, "r": 186.94167, "b": 464.48691, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "-", "bbox": {"l": 183.62411, "t": 455.58035, "r": 186.94167, "b": 464.48691, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 227.88795000000002, "t": 455.58035, "r": 231.20551, "b": 464.48691, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "-", "bbox": {"l": 227.88795000000002, "t": 455.58035, "r": 231.20551, "b": 464.48691, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 259.69855, "t": 455.58035, "r": 282.11441, "b": 464.48691, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "93.01", "bbox": {"l": 259.69855, "t": 455.58035, "r": 282.11441, "b": 464.48691, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 66.315002, "t": 468.13336, "r": 117.38329000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 468.13336, "r": 117.38329000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 134.86766, "t": 468.13336, "r": 153.68701, "b": 477.03992, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "PTN", "bbox": {"l": 134.86766, "t": 468.13336, "r": 153.68701, "b": 477.03992, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 176.57111, "t": 468.13336, "r": 194.00566, "b": 477.03992, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "98.5", "bbox": {"l": 176.57111, "t": 468.13336, "r": 194.00566, "b": 477.03992, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 220.83495, "t": 468.13336, "r": 238.26950000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "95.0", "bbox": {"l": 220.83495, "t": 468.13336, "r": 238.26950000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 259.698, "t": 468.01379, "r": 282.11386, "b": 476.97018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "96.75", "bbox": {"l": 259.698, "t": 468.01379, "r": 282.11386, "b": 476.97018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 81.612, "t": 483.32635, "r": 102.08514, "b": 492.23291, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "EDD", "bbox": {"l": 81.612, "t": 483.32635, "r": 102.08514, "b": 492.23291, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 134.87206, "t": 483.32635, "r": 153.69141, "b": 492.23291, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "FTN", "bbox": {"l": 134.87206, "t": 483.32635, "r": 153.69141, "b": 492.23291, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 176.56554, "t": 483.32635, "r": 194.00009, "b": 492.23291, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "88.4", "bbox": {"l": 176.56554, "t": 483.32635, "r": 194.00009, "b": 492.23291, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 218.33870999999996, "t": 483.32635, "r": 240.75455999999997, "b": 492.23291, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "92.08", "bbox": {"l": 218.33870999999996, "t": 483.32635, "r": 240.75455999999997, "b": 492.23291, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 262.18411, "t": 483.32635, "r": 279.61865, "b": 492.23291, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "90.6", "bbox": {"l": 262.18411, "t": 483.32635, "r": 279.61865, "b": 492.23291, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 82.165001, "t": 495.28134, "r": 101.5323, "b": 504.1879, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "GTE", "bbox": {"l": 82.165001, "t": 495.28134, "r": 101.5323, "b": 504.1879, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 134.86716, "t": 495.28134, "r": 153.68651, "b": 504.1879, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "FTN", "bbox": {"l": 134.86716, "t": 495.28134, "r": 153.68651, "b": 504.1879, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 183.62411, "t": 495.28134, "r": 186.94167, "b": 504.1879, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "-", "bbox": {"l": 183.62411, "t": 495.28134, "r": 186.94167, "b": 504.1879, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 227.88795000000002, "t": 495.28134, "r": 231.20551, "b": 504.1879, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "-", "bbox": {"l": 227.88795000000002, "t": 495.28134, "r": 231.20551, "b": 504.1879, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 259.69855, "t": 495.28134, "r": 282.11441, "b": 504.1879, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "87.14", "bbox": {"l": 259.69855, "t": 495.28134, "r": 282.11441, "b": 504.1879, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 71.789001, "t": 507.23633, "r": 111.90838999999998, "b": 516.14288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "GTE (FT)", "bbox": {"l": 71.789001, "t": 507.23633, "r": 111.90838999999998, "b": 516.14288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 134.86221, "t": 507.23633, "r": 153.68156, "b": 516.14288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "FTN", "bbox": {"l": 134.86221, "t": 507.23633, "r": 153.68156, "b": 516.14288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 183.62914, "t": 507.23633, "r": 186.94669, "b": 516.14288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "-", "bbox": {"l": 183.62914, "t": 507.23633, "r": 186.94669, "b": 516.14288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 227.89297, "t": 507.23633, "r": 231.21053000000003, "b": 516.14288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "-", "bbox": {"l": 227.89297, "t": 507.23633, "r": 231.21053000000003, "b": 516.14288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 259.6936, "t": 507.23633, "r": 282.10947, "b": 516.14288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "91.02", "bbox": {"l": 259.6936, "t": 507.23633, "r": 282.10947, "b": 516.14288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 66.315002, "t": 519.1913099999999, "r": 117.38329000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 519.1913099999999, "r": 117.38329000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 134.86766, "t": 519.1913099999999, "r": 153.68701, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "FTN", "bbox": {"l": 134.86766, "t": 519.1913099999999, "r": 153.68701, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 176.57111, "t": 519.1913099999999, "r": 194.00566, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "97.5", "bbox": {"l": 176.57111, "t": 519.1913099999999, "r": 194.00566, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 220.83495, "t": 519.1913099999999, "r": 238.26950000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "96.0", "bbox": {"l": 220.83495, "t": 519.1913099999999, "r": 238.26950000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 262.189, "t": 519.0717500000001, "r": 279.62354, "b": 528.02814, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "96.8", "bbox": {"l": 262.189, "t": 519.0717500000001, "r": 279.62354, "b": 528.02814, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 81.612, "t": 536.49837, "r": 102.08514, "b": 545.40492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "EDD", "bbox": {"l": 81.612, "t": 536.49837, "r": 102.08514, "b": 545.40492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 137.91064, "t": 536.49837, "r": 150.64285, "b": 545.40492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "TB", "bbox": {"l": 137.91064, "t": 536.49837, "r": 150.64285, "b": 545.40492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 176.56554, "t": 536.49837, "r": 194.00009, "b": 545.40492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "86.0", "bbox": {"l": 176.56554, "t": 536.49837, "r": 194.00009, "b": 545.40492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 227.89285, "t": 536.49837, "r": 231.21040000000002, "b": 545.40492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "-", "bbox": {"l": 227.89285, "t": 536.49837, "r": 231.21040000000002, "b": 545.40492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 262.18411, "t": 536.49837, "r": 279.61865, "b": 545.40492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "86.0", "bbox": {"l": 262.18411, "t": 536.49837, "r": 279.61865, "b": 545.40492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 66.315002, "t": 548.45436, "r": 117.38329000000002, "b": 557.36092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 548.45436, "r": 117.38329000000002, "b": 557.36092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 137.90625, "t": 548.45436, "r": 150.63846, "b": 557.36092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "TB", "bbox": {"l": 137.90625, "t": 548.45436, "r": 150.63846, "b": 557.36092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 176.57111, "t": 548.45436, "r": 194.00566, "b": 557.36092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "89.6", "bbox": {"l": 176.57111, "t": 548.45436, "r": 194.00566, "b": 557.36092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 227.88845999999998, "t": 548.45436, "r": 231.20601, "b": 557.36092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "-", "bbox": {"l": 227.88845999999998, "t": 548.45436, "r": 231.20601, "b": 557.36092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 262.189, "t": 548.3348100000001, "r": 279.62354, "b": 557.2911799999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": "89.6", "bbox": {"l": 262.189, "t": 548.3348100000001, "r": 279.62354, "b": 557.2911799999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 66.315002, "t": 568.00237, "r": 117.38329000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 568.00237, "r": 117.38329000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 134.86766, "t": 568.00237, "r": 153.68701, "b": 576.90892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "STN", "bbox": {"l": 134.86766, "t": 568.00237, "r": 153.68701, "b": 576.90892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 176.57111, "t": 568.00237, "r": 194.00566, "b": 576.90892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": "96.9", "bbox": {"l": 176.57111, "t": 568.00237, "r": 194.00566, "b": 576.90892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 220.83495, "t": 568.00237, "r": 238.26950000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 107, "text": "95.7", "bbox": {"l": 220.83495, "t": 568.00237, "r": 238.26950000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 262.1897, "t": 568.00237, "r": 279.62424, "b": 576.90892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 108, "text": "96.7", "bbox": {"l": 262.1897, "t": 568.00237, "r": 279.62424, "b": 576.90892, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 11, "num_cols": 5, "table_cells": [{"bbox": {"l": 78.843002, "t": 420.69037, "r": 104.85535, "b": 429.59692, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Model", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 211.2, "t": 414.71237, "r": 247.74349999999998, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "TEDS Complex", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 129.338, "t": 426.66736, "r": 159.21584, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Dataset", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 171.17096, "t": 426.66736, "r": 199.40497, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Simple", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 264.54044, "t": 426.66736, "r": 277.27264, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "All", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 81.612, "t": 443.62436, "r": 102.08514, "b": 452.53091, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "EDD", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.87206, "t": 443.62436, "r": 153.69141, "b": 452.53091, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "PTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.56554, "t": 443.62436, "r": 194.00009, "b": 452.53091, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "91.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 220.82938000000001, "t": 443.62436, "r": 238.26393, "b": 452.53091, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "88.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 262.18414, "t": 443.62436, "r": 279.61868, "b": 452.53091, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "89.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 82.165001, "t": 455.58035, "r": 101.5323, "b": 464.48691, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "GTE", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.86716, "t": 455.58035, "r": 153.68651, "b": 464.48691, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "PTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 183.62411, "t": 455.58035, "r": 186.94167, "b": 464.48691, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 227.88795000000002, "t": 455.58035, "r": 231.20551, "b": 464.48691, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 259.69855, "t": 455.58035, "r": 282.11441, "b": 464.48691, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "93.01", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 66.315002, "t": 468.13336, "r": 117.38329000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.86766, "t": 468.13336, "r": 153.68701, "b": 477.03992, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "PTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.57111, "t": 468.13336, "r": 194.00566, "b": 477.03992, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "98.5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 220.83495, "t": 468.13336, "r": 238.26950000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "95.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 259.698, "t": 468.01379, "r": 282.11386, "b": 476.97018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "96.75", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 81.612, "t": 483.32635, "r": 102.08514, "b": 492.23291, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "EDD", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.87206, "t": 483.32635, "r": 153.69141, "b": 492.23291, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "FTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.56554, "t": 483.32635, "r": 194.00009, "b": 492.23291, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "88.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 218.33870999999996, "t": 483.32635, "r": 240.75455999999997, "b": 492.23291, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "92.08", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 262.18411, "t": 483.32635, "r": 279.61865, "b": 492.23291, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "90.6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 82.165001, "t": 495.28134, "r": 101.5323, "b": 504.1879, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "GTE", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.86716, "t": 495.28134, "r": 153.68651, "b": 504.1879, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "FTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 183.62411, "t": 495.28134, "r": 186.94167, "b": 504.1879, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 227.88795000000002, "t": 495.28134, "r": 231.20551, "b": 504.1879, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 259.69855, "t": 495.28134, "r": 282.11441, "b": 504.1879, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "87.14", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 71.789001, "t": 507.23633, "r": 111.90838999999998, "b": 516.14288, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "GTE (FT)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.86221, "t": 507.23633, "r": 153.68156, "b": 516.14288, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "FTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 183.62914, "t": 507.23633, "r": 186.94669, "b": 516.14288, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 227.89297, "t": 507.23633, "r": 231.21053000000003, "b": 516.14288, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 259.6936, "t": 507.23633, "r": 282.10947, "b": 516.14288, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "91.02", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 66.315002, "t": 519.1913099999999, "r": 117.38329000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.86766, "t": 519.1913099999999, "r": 153.68701, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "FTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.57111, "t": 519.1913099999999, "r": 194.00566, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "97.5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 220.83495, "t": 519.1913099999999, "r": 238.26950000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "96.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 262.189, "t": 519.0717500000001, "r": 279.62354, "b": 528.02814, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "96.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 81.612, "t": 536.49837, "r": 102.08514, "b": 545.40492, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "EDD", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 137.91064, "t": 536.49837, "r": 150.64285, "b": 545.40492, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "TB", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.56554, "t": 536.49837, "r": 194.00009, "b": 545.40492, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "86.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 227.89285, "t": 536.49837, "r": 231.21040000000002, "b": 545.40492, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 262.18411, "t": 536.49837, "r": 279.61865, "b": 545.40492, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "86.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 66.315002, "t": 548.45436, "r": 117.38329000000002, "b": 557.36092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 137.90625, "t": 548.45436, "r": 150.63846, "b": 557.36092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "TB", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.57111, "t": 548.45436, "r": 194.00566, "b": 557.36092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "89.6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 227.88845999999998, "t": 548.45436, "r": 231.20601, "b": 557.36092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 262.189, "t": 548.3348100000001, "r": 279.62354, "b": 557.2911799999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "89.6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 66.315002, "t": 568.00237, "r": 117.38329000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.86766, "t": 568.00237, "r": 153.68701, "b": 576.90892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "STN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.57111, "t": 568.00237, "r": 194.00566, "b": 576.90892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "96.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 220.83495, "t": 568.00237, "r": 238.26950000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "95.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 262.1897, "t": 568.00237, "r": 279.62424, "b": 576.90892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "96.7", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "text", "id": 15, "page_no": 6, "cluster": {"id": 15, "label": "text", "bbox": {"l": 50.112, "t": 592.43336, "r": 286.36511, "b": 613.29492, "coord_origin": "TOPLEFT"}, "confidence": 0.7209173440933228, "cells": [{"id": 109, "text": "Table 2: Structure results on PubTabNet (PTN), FinTabNet", "bbox": {"l": 50.112, "t": 592.43336, "r": 286.36511, "b": 601.33992, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "(FTN), TableBank (TB) and SynthTabNet (STN).", "bbox": {"l": 50.112, "t": 604.38837, "r": 247.46114, "b": 613.29492, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 2: Structure results on PubTabNet (PTN), FinTabNet (FTN), TableBank (TB) and SynthTabNet (STN)."}, {"label": "text", "id": 16, "page_no": 6, "cluster": {"id": 16, "label": "text", "bbox": {"l": 50.112, "t": 616.34337, "r": 261.78732, "b": 625.24992, "coord_origin": "TOPLEFT"}, "confidence": 0.6433312892913818, "cells": [{"id": 111, "text": "FT: Model was trained on PubTabNet then finetuned.", "bbox": {"l": 50.112, "t": 616.34337, "r": 261.78732, "b": 625.24992, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "FT: Model was trained on PubTabNet then finetuned."}, {"label": "text", "id": 3, "page_no": 6, "cluster": {"id": 3, "label": "text", "bbox": {"l": 50.112015, "t": 644.3498099999999, "r": 286.366, "b": 713.151932, "coord_origin": "TOPLEFT"}, "confidence": 0.9854635000228882, "cells": [{"id": 112, "text": "Cell Detection.", "bbox": {"l": 62.067001, "t": 644.3498099999999, "r": 124.72179, "b": 653.30618, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "Like any object detector, our", "bbox": {"l": 128.20401, "t": 644.46936, "r": 242.9333, "b": 653.37592, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "Cell BBox", "bbox": {"l": 245.55401999999998, "t": 644.55902, "r": 286.36084, "b": 653.1467700000001, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "Detector", "bbox": {"l": 50.112015, "t": 656.51402, "r": 84.971146, "b": 665.10178, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "provides bounding boxes that can be improved", "bbox": {"l": 89.515015, "t": 656.42436, "r": 286.366, "b": 665.33092, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "with post-processing during inference. We make use of the", "bbox": {"l": 50.112015, "t": 668.37936, "r": 286.36511, "b": 677.28593, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "grid-like structure of tables to refine the predictions. A de-", "bbox": {"l": 50.112015, "t": 680.33536, "r": 286.36505, "b": 689.24193, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "tailed explanation on the post-processing is available in the", "bbox": {"l": 50.112015, "t": 692.290359, "r": 286.36511, "b": 701.19693, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "supplementary material. As shown in Tab. 3, we evaluate", "bbox": {"l": 50.112015, "t": 704.245361, "r": 286.36508, "b": 713.151932, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Cell Detection. Like any object detector, our Cell BBox Detector provides bounding boxes that can be improved with post-processing during inference. We make use of the grid-like structure of tables to refine the predictions. A detailed explanation on the post-processing is available in the supplementary material. As shown in Tab. 3, we evaluate"}, {"label": "text", "id": 7, "page_no": 6, "cluster": {"id": 7, "label": "text", "bbox": {"l": 308.862, "t": 75.20836999999995, "r": 545.11517, "b": 227.57709, "coord_origin": "TOPLEFT"}, "confidence": 0.9713197946548462, "cells": [{"id": 121, "text": "our", "bbox": {"l": 308.862, "t": 75.20836999999995, "r": 322.14215, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Cell BBox Decoder", "bbox": {"l": 325.45401, "t": 75.29803000000004, "r": 404.56702, "b": 83.88580000000002, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "accuracy for cells with a class la-", "bbox": {"l": 408.104, "t": 75.20836999999995, "r": 545.10968, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "bel of \u2018content\u2019 only using the PASCAL VOC mAP metric", "bbox": {"l": 308.862, "t": 87.16339000000005, "r": 545.11511, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "for pre-processing and post-processing.", "bbox": {"l": 308.862, "t": 99.11841000000004, "r": 470.22626, "b": 108.02495999999985, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "Note that we do", "bbox": {"l": 477.52884, "t": 99.11841000000004, "r": 545.11511, "b": 108.02495999999985, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "not have post-processing results for SynthTabNet as images", "bbox": {"l": 308.862, "t": 111.07343000000003, "r": 545.11517, "b": 119.97997999999984, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "are only provided. To compare the performance of our pro-", "bbox": {"l": 308.862, "t": 123.02844000000005, "r": 545.11511, "b": 131.93499999999995, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "posed approach, we\u2019ve integrated TableFormer\u2019s", "bbox": {"l": 308.862, "t": 134.98443999999995, "r": 502.01691000000005, "b": 143.89099, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "Cell BBox", "bbox": {"l": 504.47299, "t": 135.07410000000004, "r": 545.11041, "b": 143.66187000000002, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "Decoder", "bbox": {"l": 308.862, "t": 147.02910999999995, "r": 343.16324, "b": 155.61688000000004, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "into EDD architecture. As mentioned previously,", "bbox": {"l": 346.371, "t": 146.93944999999997, "r": 545.11493, "b": 155.84600999999998, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "the Structure Decoder provides the", "bbox": {"l": 308.862, "t": 158.89446999999996, "r": 446.15652, "b": 167.80102999999997, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "Cell BBox Decoder", "bbox": {"l": 448.28998000000007, "t": 158.98413000000005, "r": 525.04181, "b": 167.57190000000003, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "with", "bbox": {"l": 527.39899, "t": 158.89446999999996, "r": 545.11249, "b": 167.80102999999997, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "the features needed to predict the bounding box predictions.", "bbox": {"l": 308.862, "t": 170.84948999999995, "r": 545.11511, "b": 179.75603999999998, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "Therefore, the accuracy of the", "bbox": {"l": 308.862, "t": 182.80449999999996, "r": 432.86642000000006, "b": 191.71105999999997, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "Structure Decoder", "bbox": {"l": 436.39001, "t": 182.89417000000003, "r": 510.93021, "b": 191.48193000000003, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "directly", "bbox": {"l": 514.677, "t": 182.80449999999996, "r": 545.11273, "b": 191.71105999999997, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "influences the accuracy of the", "bbox": {"l": 308.862, "t": 194.75951999999995, "r": 431.17285, "b": 203.66607999999997, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "Cell BBox Decoder", "bbox": {"l": 434.6790199999999, "t": 194.84918000000005, "r": 514.18054, "b": 203.43695000000002, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": ". If the", "bbox": {"l": 514.17603, "t": 194.75951999999995, "r": 545.10992, "b": 203.66607999999997, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "Structure Decoder", "bbox": {"l": 308.86203, "t": 206.80517999999995, "r": 382.35614, "b": 215.39293999999995, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "predicts an extra column, this will result", "bbox": {"l": 385.07501, "t": 206.71551999999997, "r": 545.11426, "b": 215.62207, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "in an extra column of predicted bounding boxes.", "bbox": {"l": 308.862, "t": 218.67052999999999, "r": 501.6981799999999, "b": 227.57709, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "our Cell BBox Decoder accuracy for cells with a class label of \u2018content\u2019 only using the PASCAL VOC mAP metric for pre-processing and post-processing. Note that we do not have post-processing results for SynthTabNet as images are only provided. To compare the performance of our proposed approach, we\u2019ve integrated TableFormer\u2019s Cell BBox Decoder into EDD architecture. As mentioned previously, the Structure Decoder provides the Cell BBox Decoder with the features needed to predict the bounding box predictions. Therefore, the accuracy of the Structure Decoder directly influences the accuracy of the Cell BBox Decoder . If the Structure Decoder predicts an extra column, this will result in an extra column of predicted bounding boxes."}, {"label": "table", "id": 8, "page_no": 6, "cluster": {"id": 8, "label": "table", "bbox": {"l": 308.4068603515625, "t": 247.87631225585938, "r": 533.6419677734375, "b": 303.8056640625, "coord_origin": "TOPLEFT"}, "confidence": 0.9691730737686157, "cells": [{"id": 146, "text": "Model", "bbox": {"l": 339.323, "t": 253.66436999999996, "r": 365.33536, "b": 262.57092, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "Dataset", "bbox": {"l": 401.04132, "t": 253.66436999999996, "r": 430.91916, "b": 262.57092, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "mAP", "bbox": {"l": 454.10214, "t": 253.66436999999996, "r": 474.58523999999994, "b": 262.57092, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "mAP (PP)", "bbox": {"l": 486.54034, "t": 253.66436999999996, "r": 527.2276, "b": 262.57092, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "EDD+BBox", "bbox": {"l": 327.65601, "t": 270.62134000000003, "r": 377.00076, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "PubTabNet", "bbox": {"l": 393.69809, "t": 270.62134000000003, "r": 438.28073, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "79.2", "bbox": {"l": 455.63559, "t": 270.62134000000003, "r": 473.07013, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "82.7", "bbox": {"l": 498.16592, "t": 270.62134000000003, "r": 515.60046, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "TableFormer", "bbox": {"l": 326.79501, "t": 282.57631999999995, "r": 377.86331, "b": 291.48288, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "PubTabNet", "bbox": {"l": 393.69388, "t": 282.57631999999995, "r": 438.27652, "b": 291.48288, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "82.1", "bbox": {"l": 455.63101, "t": 282.45676, "r": 473.06555000000003, "b": 291.41315, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "86.8", "bbox": {"l": 498.1713, "t": 282.45676, "r": 515.60583, "b": 291.41315, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "TableFormer", "bbox": {"l": 326.79501, "t": 294.53131, "r": 377.86331, "b": 303.43787, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "SynthTabNet", "bbox": {"l": 389.81842, "t": 294.53131, "r": 442.15194999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "87.7", "bbox": {"l": 455.63135, "t": 294.53131, "r": 473.06589, "b": 303.43787, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "-", "bbox": {"l": 505.22515999999996, "t": 294.53131, "r": 508.54268999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}}], "children": [{"id": 73, "label": "text", "bbox": {"l": 339.323, "t": 253.66436999999996, "r": 365.33536, "b": 262.57092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 146, "text": "Model", "bbox": {"l": 339.323, "t": 253.66436999999996, "r": 365.33536, "b": 262.57092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 401.04132, "t": 253.66436999999996, "r": 430.91916, "b": 262.57092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 147, "text": "Dataset", "bbox": {"l": 401.04132, "t": 253.66436999999996, "r": 430.91916, "b": 262.57092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 454.10214, "t": 253.66436999999996, "r": 474.58523999999994, "b": 262.57092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 148, "text": "mAP", "bbox": {"l": 454.10214, "t": 253.66436999999996, "r": 474.58523999999994, "b": 262.57092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 486.54034, "t": 253.66436999999996, "r": 527.2276, "b": 262.57092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 149, "text": "mAP (PP)", "bbox": {"l": 486.54034, "t": 253.66436999999996, "r": 527.2276, "b": 262.57092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 327.65601, "t": 270.62134000000003, "r": 377.00076, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 150, "text": "EDD+BBox", "bbox": {"l": 327.65601, "t": 270.62134000000003, "r": 377.00076, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 393.69809, "t": 270.62134000000003, "r": 438.28073, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 151, "text": "PubTabNet", "bbox": {"l": 393.69809, "t": 270.62134000000003, "r": 438.28073, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 455.63559, "t": 270.62134000000003, "r": 473.07013, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 152, "text": "79.2", "bbox": {"l": 455.63559, "t": 270.62134000000003, "r": 473.07013, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 498.16592, "t": 270.62134000000003, "r": 515.60046, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 153, "text": "82.7", "bbox": {"l": 498.16592, "t": 270.62134000000003, "r": 515.60046, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 326.79501, "t": 282.57631999999995, "r": 377.86331, "b": 291.48288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 154, "text": "TableFormer", "bbox": {"l": 326.79501, "t": 282.57631999999995, "r": 377.86331, "b": 291.48288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 393.69388, "t": 282.57631999999995, "r": 438.27652, "b": 291.48288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 155, "text": "PubTabNet", "bbox": {"l": 393.69388, "t": 282.57631999999995, "r": 438.27652, "b": 291.48288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 455.63101, "t": 282.45676, "r": 473.06555000000003, "b": 291.41315, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 156, "text": "82.1", "bbox": {"l": 455.63101, "t": 282.45676, "r": 473.06555000000003, "b": 291.41315, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 498.1713, "t": 282.45676, "r": 515.60583, "b": 291.41315, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 157, "text": "86.8", "bbox": {"l": 498.1713, "t": 282.45676, "r": 515.60583, "b": 291.41315, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 326.79501, "t": 294.53131, "r": 377.86331, "b": 303.43787, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 158, "text": "TableFormer", "bbox": {"l": 326.79501, "t": 294.53131, "r": 377.86331, "b": 303.43787, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 389.81842, "t": 294.53131, "r": 442.15194999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 159, "text": "SynthTabNet", "bbox": {"l": 389.81842, "t": 294.53131, "r": 442.15194999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 455.63135, "t": 294.53131, "r": 473.06589, "b": 303.43787, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 160, "text": "87.7", "bbox": {"l": 455.63135, "t": 294.53131, "r": 473.06589, "b": 303.43787, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 505.22515999999996, "t": 294.53131, "r": 508.54268999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 161, "text": "-", "bbox": {"l": 505.22515999999996, "t": 294.53131, "r": 508.54268999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 4, "num_cols": 4, "table_cells": [{"bbox": {"l": 339.323, "t": 253.66436999999996, "r": 365.33536, "b": 262.57092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Model", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 401.04132, "t": 253.66436999999996, "r": 430.91916, "b": 262.57092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Dataset", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 454.10214, "t": 253.66436999999996, "r": 474.58523999999994, "b": 262.57092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "mAP", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 486.54034, "t": 253.66436999999996, "r": 527.2276, "b": 262.57092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "mAP (PP)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 327.65601, "t": 270.62134000000003, "r": 377.00076, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "EDD+BBox", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 393.69809, "t": 270.62134000000003, "r": 438.28073, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "PubTabNet", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 455.63559, "t": 270.62134000000003, "r": 473.07013, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "79.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 498.16592, "t": 270.62134000000003, "r": 515.60046, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "82.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.79501, "t": 282.57631999999995, "r": 377.86331, "b": 291.48288, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 393.69388, "t": 282.57631999999995, "r": 438.27652, "b": 291.48288, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "PubTabNet", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 455.63101, "t": 282.45676, "r": 473.06555000000003, "b": 291.41315, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "82.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 498.1713, "t": 282.45676, "r": 515.60583, "b": 291.41315, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "86.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.79501, "t": 294.53131, "r": 377.86331, "b": 303.43787, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 389.81842, "t": 294.53131, "r": 442.15194999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "SynthTabNet", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 455.63135, "t": 294.53131, "r": 473.06589, "b": 303.43787, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "87.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 505.22515999999996, "t": 294.53131, "r": 508.54268999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "caption", "id": 12, "page_no": 6, "cluster": {"id": 12, "label": "caption", "bbox": {"l": 308.862, "t": 316.44931, "r": 545.11517, "b": 337.3108500000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9519917964935303, "cells": [{"id": 162, "text": "Table 3:", "bbox": {"l": 308.862, "t": 316.44931, "r": 341.49951, "b": 325.35587, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "Cell Bounding Box detection results on PubTab-", "bbox": {"l": 348.60284, "t": 316.44931, "r": 545.11517, "b": 325.35587, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "Net, and FinTabNet. PP: Post-processing.", "bbox": {"l": 308.862, "t": 328.4043, "r": 474.97845, "b": 337.3108500000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 3: Cell Bounding Box detection results on PubTabNet, and FinTabNet. PP: Post-processing."}, {"label": "text", "id": 4, "page_no": 6, "cluster": {"id": 4, "label": "text", "bbox": {"l": 308.86197, "t": 367.6797199999999, "r": 545.11566, "b": 520.16769, "coord_origin": "TOPLEFT"}, "confidence": 0.9835010766983032, "cells": [{"id": 165, "text": "Cell Content.", "bbox": {"l": 320.81699, "t": 367.6797199999999, "r": 378.94876, "b": 376.63611, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "In this section, we evaluate the entire", "bbox": {"l": 387.07898, "t": 367.79929, "r": 545.11566, "b": 376.70584, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "pipeline of recovering a table with content.", "bbox": {"l": 308.86197, "t": 379.75426999999996, "r": 487.19257, "b": 388.66083, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "Here we put", "bbox": {"l": 493.96713, "t": 379.75426999999996, "r": 545.11511, "b": 388.66083, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "our approach to test by capitalizing on extracting content", "bbox": {"l": 308.86197, "t": 391.70926, "r": 545.11505, "b": 400.61581, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "from the PDF cells rather than decoding from images. Tab.", "bbox": {"l": 308.86197, "t": 403.66525, "r": 545.11523, "b": 412.57181, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "4", "bbox": {"l": 308.86197, "t": 415.62024, "r": 314.08096, "b": 424.52679, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "shows the TEDs score of HTML code representing the", "bbox": {"l": 316.69046, "t": 415.62024, "r": 545.11517, "b": 424.52679, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "structure of the table along with the content inserted in the", "bbox": {"l": 308.86197, "t": 427.57523, "r": 545.11505, "b": 436.48177999999996, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "data cell and compared with the ground-truth. Our method", "bbox": {"l": 308.86197, "t": 439.53021, "r": 545.11505, "b": 448.43677, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "achieved a", "bbox": {"l": 308.86197, "t": 451.4852, "r": 350.23666, "b": 460.39175, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "5.3%", "bbox": {"l": 352.17596, "t": 451.36563, "r": 374.59183, "b": 460.32201999999995, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "increase over the state-of-the-art, and com-", "bbox": {"l": 376.53296, "t": 451.4852, "r": 545.11011, "b": 460.39175, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "mercial solutions. We believe our scores would be higher", "bbox": {"l": 308.86197, "t": 463.44019, "r": 545.11511, "b": 472.34674, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "if the HTML ground-truth matched the extracted PDF cell", "bbox": {"l": 308.86197, "t": 475.39618, "r": 545.11517, "b": 484.30273, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "content. Unfortunately, there are small discrepancies such", "bbox": {"l": 308.86197, "t": 487.35117, "r": 545.11511, "b": 496.25772, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "as spacings around words or special characters with various", "bbox": {"l": 308.86197, "t": 499.30615, "r": 545.11505, "b": 508.21271, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "unicode representations.", "bbox": {"l": 308.86197, "t": 511.26114, "r": 405.69846, "b": 520.16769, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Cell Content. In this section, we evaluate the entire pipeline of recovering a table with content. Here we put our approach to test by capitalizing on extracting content from the PDF cells rather than decoding from images. Tab. 4 shows the TEDs score of HTML code representing the structure of the table along with the content inserted in the data cell and compared with the ground-truth. Our method achieved a 5.3% increase over the state-of-the-art, and commercial solutions. We believe our scores would be higher if the HTML ground-truth matched the extracted PDF cell content. Unfortunately, there are small discrepancies such as spacings around words or special characters with various unicode representations."}, {"label": "table", "id": 5, "page_no": 6, "cluster": {"id": 5, "label": "table", "bbox": {"l": 332.9688720703125, "t": 540.2835693359375, "r": 520.942138671875, "b": 643.2697143554688, "coord_origin": "TOPLEFT"}, "confidence": 0.9775567650794983, "cells": [{"id": 183, "text": "Model", "bbox": {"l": 358.01099, "t": 552.23337, "r": 384.02335, "b": 561.1399200000001, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "TEDS", "bbox": {"l": 449.03400000000005, "t": 546.25537, "r": 473.94049000000007, "b": 555.16193, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": "Simple", "bbox": {"l": 408.50598, "t": 558.21037, "r": 436.73999, "b": 567.11693, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "Complex", "bbox": {"l": 448.6951, "t": 558.21037, "r": 485.07849, "b": 567.11693, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "All", "bbox": {"l": 499.3848, "t": 558.21037, "r": 512.117, "b": 567.11693, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": "Tabula", "bbox": {"l": 357.68201, "t": 575.16736, "r": 384.3519, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "78.0", "bbox": {"l": 413.90097, "t": 575.16736, "r": 431.33550999999994, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "57.8", "bbox": {"l": 458.16479000000004, "t": 575.16736, "r": 475.59933000000007, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "67.9", "bbox": {"l": 497.0289, "t": 575.16736, "r": 514.46344, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": "Traprange", "bbox": {"l": 350.72299, "t": 587.12236, "r": 391.31064, "b": 596.02892, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "60.8", "bbox": {"l": 413.90582, "t": 587.12236, "r": 431.34036, "b": 596.02892, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "49.9", "bbox": {"l": 458.16965, "t": 587.12236, "r": 475.60419, "b": 596.02892, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "55.4", "bbox": {"l": 497.03374999999994, "t": 587.12236, "r": 514.46832, "b": 596.02892, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "Camelot", "bbox": {"l": 354.13599, "t": 599.07835, "r": 387.89923, "b": 607.98491, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "80.0", "bbox": {"l": 413.90161, "t": 599.07835, "r": 431.33615, "b": 607.98491, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "66.0", "bbox": {"l": 458.16544, "t": 599.07835, "r": 475.59998, "b": 607.98491, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "73.0", "bbox": {"l": 497.02954000000005, "t": 599.07835, "r": 514.46411, "b": 607.98491, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "Acrobat Pro", "bbox": {"l": 346.55899, "t": 611.03336, "r": 395.47534, "b": 619.93991, "coord_origin": "TOPLEFT"}}, {"id": 201, "text": "68.9", "bbox": {"l": 413.90616, "t": 611.03336, "r": 431.34069999999997, "b": 619.93991, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": "61.8", "bbox": {"l": 458.16998000000007, "t": 611.03336, "r": 475.60452, "b": 619.93991, "coord_origin": "TOPLEFT"}}, {"id": 203, "text": "65.3", "bbox": {"l": 497.03409, "t": 611.03336, "r": 514.46863, "b": 619.93991, "coord_origin": "TOPLEFT"}}, {"id": 204, "text": "EDD", "bbox": {"l": 360.78101, "t": 622.9883600000001, "r": 381.25415, "b": 631.89491, "coord_origin": "TOPLEFT"}}, {"id": 205, "text": "91.2", "bbox": {"l": 413.90158, "t": 622.9883600000001, "r": 431.33612, "b": 631.89491, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": "85.4", "bbox": {"l": 458.16541, "t": 622.9883600000001, "r": 475.59995000000004, "b": 631.89491, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": "88.3", "bbox": {"l": 497.0295100000001, "t": 622.9883600000001, "r": 514.46405, "b": 631.89491, "coord_origin": "TOPLEFT"}}, {"id": 208, "text": "TableFormer", "bbox": {"l": 345.483, "t": 634.94336, "r": 396.5513, "b": 643.84991, "coord_origin": "TOPLEFT"}}, {"id": 209, "text": "95.4", "bbox": {"l": 413.90616, "t": 634.94336, "r": 431.34069999999997, "b": 643.84991, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": "90.1", "bbox": {"l": 458.16998000000007, "t": 634.94336, "r": 475.60452, "b": 643.84991, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "93.6", "bbox": {"l": 497.03400000000005, "t": 634.82381, "r": 514.46857, "b": 643.78018, "coord_origin": "TOPLEFT"}}], "children": [{"id": 89, "label": "text", "bbox": {"l": 358.01099, "t": 552.23337, "r": 384.02335, "b": 561.1399200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 183, "text": "Model", "bbox": {"l": 358.01099, "t": 552.23337, "r": 384.02335, "b": 561.1399200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 449.03400000000005, "t": 546.25537, "r": 473.94049000000007, "b": 555.16193, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 184, "text": "TEDS", "bbox": {"l": 449.03400000000005, "t": 546.25537, "r": 473.94049000000007, "b": 555.16193, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 408.50598, "t": 558.21037, "r": 436.73999, "b": 567.11693, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 185, "text": "Simple", "bbox": {"l": 408.50598, "t": 558.21037, "r": 436.73999, "b": 567.11693, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 448.6951, "t": 558.21037, "r": 485.07849, "b": 567.11693, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 186, "text": "Complex", "bbox": {"l": 448.6951, "t": 558.21037, "r": 485.07849, "b": 567.11693, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 499.3848, "t": 558.21037, "r": 512.117, "b": 567.11693, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 187, "text": "All", "bbox": {"l": 499.3848, "t": 558.21037, "r": 512.117, "b": 567.11693, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 357.68201, "t": 575.16736, "r": 384.3519, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 188, "text": "Tabula", "bbox": {"l": 357.68201, "t": 575.16736, "r": 384.3519, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 413.90097, "t": 575.16736, "r": 431.33550999999994, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 189, "text": "78.0", "bbox": {"l": 413.90097, "t": 575.16736, "r": 431.33550999999994, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 458.16479000000004, "t": 575.16736, "r": 475.59933000000007, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 190, "text": "57.8", "bbox": {"l": 458.16479000000004, "t": 575.16736, "r": 475.59933000000007, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 497.0289, "t": 575.16736, "r": 514.46344, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 191, "text": "67.9", "bbox": {"l": 497.0289, "t": 575.16736, "r": 514.46344, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 350.72299, "t": 587.12236, "r": 391.31064, "b": 596.02892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 192, "text": "Traprange", "bbox": {"l": 350.72299, "t": 587.12236, "r": 391.31064, "b": 596.02892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 413.90582, "t": 587.12236, "r": 431.34036, "b": 596.02892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 193, "text": "60.8", "bbox": {"l": 413.90582, "t": 587.12236, "r": 431.34036, "b": 596.02892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 458.16965, "t": 587.12236, "r": 475.60419, "b": 596.02892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 194, "text": "49.9", "bbox": {"l": 458.16965, "t": 587.12236, "r": 475.60419, "b": 596.02892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 497.03374999999994, "t": 587.12236, "r": 514.46832, "b": 596.02892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 195, "text": "55.4", "bbox": {"l": 497.03374999999994, "t": 587.12236, "r": 514.46832, "b": 596.02892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 354.13599, "t": 599.07835, "r": 387.89923, "b": 607.98491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 196, "text": "Camelot", "bbox": {"l": 354.13599, "t": 599.07835, "r": 387.89923, "b": 607.98491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 413.90161, "t": 599.07835, "r": 431.33615, "b": 607.98491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 197, "text": "80.0", "bbox": {"l": 413.90161, "t": 599.07835, "r": 431.33615, "b": 607.98491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 458.16544, "t": 599.07835, "r": 475.59998, "b": 607.98491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 198, "text": "66.0", "bbox": {"l": 458.16544, "t": 599.07835, "r": 475.59998, "b": 607.98491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 497.02954000000005, "t": 599.07835, "r": 514.46411, "b": 607.98491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 199, "text": "73.0", "bbox": {"l": 497.02954000000005, "t": 599.07835, "r": 514.46411, "b": 607.98491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 346.55899, "t": 611.03336, "r": 395.47534, "b": 619.93991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 200, "text": "Acrobat Pro", "bbox": {"l": 346.55899, "t": 611.03336, "r": 395.47534, "b": 619.93991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 413.90616, "t": 611.03336, "r": 431.34069999999997, "b": 619.93991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 201, "text": "68.9", "bbox": {"l": 413.90616, "t": 611.03336, "r": 431.34069999999997, "b": 619.93991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 458.16998000000007, "t": 611.03336, "r": 475.60452, "b": 619.93991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 202, "text": "61.8", "bbox": {"l": 458.16998000000007, "t": 611.03336, "r": 475.60452, "b": 619.93991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 497.03409, "t": 611.03336, "r": 514.46863, "b": 619.93991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 203, "text": "65.3", "bbox": {"l": 497.03409, "t": 611.03336, "r": 514.46863, "b": 619.93991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 360.78101, "t": 622.9883600000001, "r": 381.25415, "b": 631.89491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 204, "text": "EDD", "bbox": {"l": 360.78101, "t": 622.9883600000001, "r": 381.25415, "b": 631.89491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 413.90158, "t": 622.9883600000001, "r": 431.33612, "b": 631.89491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 205, "text": "91.2", "bbox": {"l": 413.90158, "t": 622.9883600000001, "r": 431.33612, "b": 631.89491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 458.16541, "t": 622.9883600000001, "r": 475.59995000000004, "b": 631.89491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 206, "text": "85.4", "bbox": {"l": 458.16541, "t": 622.9883600000001, "r": 475.59995000000004, "b": 631.89491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 497.0295100000001, "t": 622.9883600000001, "r": 514.46405, "b": 631.89491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 207, "text": "88.3", "bbox": {"l": 497.0295100000001, "t": 622.9883600000001, "r": 514.46405, "b": 631.89491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 114, "label": "text", "bbox": {"l": 345.483, "t": 634.94336, "r": 396.5513, "b": 643.84991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 208, "text": "TableFormer", "bbox": {"l": 345.483, "t": 634.94336, "r": 396.5513, "b": 643.84991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 115, "label": "text", "bbox": {"l": 413.90616, "t": 634.94336, "r": 431.34069999999997, "b": 643.84991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 209, "text": "95.4", "bbox": {"l": 413.90616, "t": 634.94336, "r": 431.34069999999997, "b": 643.84991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 116, "label": "text", "bbox": {"l": 458.16998000000007, "t": 634.94336, "r": 475.60452, "b": 643.84991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 210, "text": "90.1", "bbox": {"l": 458.16998000000007, "t": 634.94336, "r": 475.60452, "b": 643.84991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 117, "label": "text", "bbox": {"l": 497.03400000000005, "t": 634.82381, "r": 514.46857, "b": 643.78018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 211, "text": "93.6", "bbox": {"l": 497.03400000000005, "t": 634.82381, "r": 514.46857, "b": 643.78018, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["fcel", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "nl"], "num_rows": 7, "num_cols": 4, "table_cells": [{"bbox": {"l": 358.01099, "t": 552.23337, "r": 384.02335, "b": 561.1399200000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Model", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 448.6951, "t": 546.25537, "r": 485.07849, "b": 567.11693, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "TEDS Complex", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 408.50598, "t": 558.21037, "r": 436.73999, "b": 567.11693, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Simple", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 499.3848, "t": 558.21037, "r": 512.117, "b": 567.11693, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "All", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 357.68201, "t": 575.16736, "r": 384.3519, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Tabula", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 413.90097, "t": 575.16736, "r": 431.33550999999994, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "78.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 458.16479000000004, "t": 575.16736, "r": 475.59933000000007, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "57.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 497.0289, "t": 575.16736, "r": 514.46344, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "67.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 350.72299, "t": 587.12236, "r": 391.31064, "b": 596.02892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Traprange", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 413.90582, "t": 587.12236, "r": 431.34036, "b": 596.02892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "60.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 458.16965, "t": 587.12236, "r": 475.60419, "b": 596.02892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "49.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 497.03374999999994, "t": 587.12236, "r": 514.46832, "b": 596.02892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "55.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 354.13599, "t": 599.07835, "r": 387.89923, "b": 607.98491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Camelot", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 413.90161, "t": 599.07835, "r": 431.33615, "b": 607.98491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "80.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 458.16544, "t": 599.07835, "r": 475.59998, "b": 607.98491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "66.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 497.02954000000005, "t": 599.07835, "r": 514.46411, "b": 607.98491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "73.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 346.55899, "t": 611.03336, "r": 395.47534, "b": 619.93991, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Acrobat Pro", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 413.90616, "t": 611.03336, "r": 431.34069999999997, "b": 619.93991, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "68.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 458.16998000000007, "t": 611.03336, "r": 475.60452, "b": 619.93991, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "61.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 497.03409, "t": 611.03336, "r": 514.46863, "b": 619.93991, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "65.3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 360.78101, "t": 622.9883600000001, "r": 381.25415, "b": 631.89491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "EDD", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 413.90158, "t": 622.9883600000001, "r": 431.33612, "b": 631.89491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "91.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 458.16541, "t": 622.9883600000001, "r": 475.59995000000004, "b": 631.89491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "85.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 497.0295100000001, "t": 622.9883600000001, "r": 514.46405, "b": 631.89491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "88.3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 345.483, "t": 634.94336, "r": 396.5513, "b": 643.84991, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 413.90616, "t": 634.94336, "r": 431.34069999999997, "b": 643.84991, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "95.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 458.16998000000007, "t": 634.94336, "r": 475.60452, "b": 643.84991, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "90.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 497.03400000000005, "t": 634.82381, "r": 514.46857, "b": 643.78018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "93.6", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "caption", "id": 11, "page_no": 6, "cluster": {"id": 11, "label": "caption", "bbox": {"l": 308.862, "t": 656.86136, "r": 545.11517, "b": 689.6779300000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9541404247283936, "cells": [{"id": 212, "text": "Table 4:", "bbox": {"l": 308.862, "t": 656.86136, "r": 341.73862, "b": 665.76792, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "Results of structure with content retrieved using", "bbox": {"l": 349.55927, "t": 656.86136, "r": 545.11517, "b": 665.76792, "coord_origin": "TOPLEFT"}}, {"id": 214, "text": "cell detection on PubTabNet. In all cases the input is PDF", "bbox": {"l": 308.862, "t": 668.81636, "r": 545.11505, "b": 677.7229199999999, "coord_origin": "TOPLEFT"}}, {"id": 215, "text": "documents with cropped tables.", "bbox": {"l": 308.862, "t": 680.77136, "r": 435.03836, "b": 689.6779300000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 4: Results of structure with content retrieved using cell detection on PubTabNet. In all cases the input is PDF documents with cropped tables."}], "headers": [{"label": "page_footer", "id": 14, "page_no": 6, "cluster": {"id": 14, "label": "page_footer", "bbox": {"l": 295.121, "t": 734.133358, "r": 300.10229, "b": 743.039921, "coord_origin": "TOPLEFT"}, "confidence": 0.8787972331047058, "cells": [{"id": 216, "text": "7", "bbox": {"l": 295.121, "t": 734.133358, "r": 300.10229, "b": 743.039921, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "7"}]}}, {"page_no": 7, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "b.", "bbox": {"l": 53.811783000000005, "t": 208.23328000000004, "r": 62.219952, "b": 216.10645, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Structure predicted by TableFormer, with superimposed matched PDF cell text:", "bbox": {"l": 66.424026, "t": 208.23328000000004, "r": 385.93451, "b": 216.10645, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Japanese language (previously unseen by TableFormer):", "bbox": {"l": 53.811783000000005, "t": 94.28112999999996, "r": 284.34592, "b": 102.15430000000003, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Example table from FinTabNet:", "bbox": {"l": 304.83081, "t": 94.28112999999996, "r": 431.09119, "b": 102.15430000000003, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "a.", "bbox": {"l": 53.286037, "t": 78.68756000000008, "r": 61.550289, "b": 86.56073000000004, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Red - PDF cells, Green - predicted bounding boxes, Blue - post-processed predictions matched to PDF cells", "bbox": {"l": 65.682419, "t": 78.68756000000008, "r": 499.55563, "b": 86.56073000000004, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "\u8ad6\u6587\u30d5\u30a1\u30a4\u30eb", "bbox": {"l": 209.93285, "t": 222.18073000000004, "r": 241.04458999999997, "b": 226.36212, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "\u53c2\u8003\u6587\u732e", "bbox": {"l": 263.76489, "t": 222.18073000000004, "r": 284.50589, "b": 226.36212, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "\u51fa\u5178", "bbox": {"l": 110.24990999999999, "t": 229.66594999999995, "r": 120.62018, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "\u30d5\u30a1\u30a4\u30eb", "bbox": {"l": 175.36609, "t": 229.66594999999995, "r": 196.1071, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "\u6570", "bbox": {"l": 196.10756, "t": 229.66594999999995, "r": 201.29247, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "\u82f1\u8a9e", "bbox": {"l": 209.62408, "t": 229.66594999999995, "r": 219.99435, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "\u65e5\u672c\u8a9e", "bbox": {"l": 229.19814, "t": 229.66594999999995, "r": 244.75377, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "\u82f1\u8a9e", "bbox": {"l": 256.1142, "t": 229.66594999999995, "r": 266.48447, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "\u65e5\u672c\u8a9e", "bbox": {"l": 278.38434, "t": 229.66594999999995, "r": 293.93997, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Association for Computational Linguistics(ACL2003)", "bbox": {"l": 55.53052099999999, "t": 236.42584, "r": 162.7131, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "65", "bbox": {"l": 184.39731, "t": 236.42584, "r": 189.56456, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "65", "bbox": {"l": 208.99026, "t": 236.42584, "r": 214.15752, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "0", "bbox": {"l": 234.87517, "t": 236.42584, "r": 237.45833000000002, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "150", "bbox": {"l": 256.88446, "t": 236.42584, "r": 264.6358, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "0", "bbox": {"l": 284.06134, "t": 236.42584, "r": 286.6445, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Computational Linguistics(COLING2002)", "bbox": {"l": 55.53052099999999, "t": 242.62048000000004, "r": 139.72253, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "140", "bbox": {"l": 183.10536, "t": 242.62048000000004, "r": 190.8567, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "140", "bbox": {"l": 207.69832, "t": 242.62048000000004, "r": 215.44965999999997, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "0", "bbox": {"l": 234.87517, "t": 242.62048000000004, "r": 237.45833000000002, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "150", "bbox": {"l": 256.88446, "t": 242.62048000000004, "r": 264.6358, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "0", "bbox": {"l": 284.06134, "t": 242.62048000000004, "r": 286.6445, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "\u96fb\u6c17\u60c5\u5831\u901a\u4fe1\u5b66\u4f1a", "bbox": {"l": 55.53052099999999, "t": 249.79845999999998, "r": 97.013, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "2003", "bbox": {"l": 92.698288, "t": 249.58942000000002, "r": 103.03371, "b": 253.94732999999997, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "\u5e74\u7dcf\u5408\u5927\u4f1a", "bbox": {"l": 103.03389, "t": 249.79845999999998, "r": 128.96027, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "150", "bbox": {"l": 183.10536, "t": 248.81506000000002, "r": 190.8567, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "8", "bbox": {"l": 210.28223, "t": 248.81506000000002, "r": 212.86539, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "142", "bbox": {"l": 232.29153, "t": 248.81506000000002, "r": 240.04287999999997, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "223", "bbox": {"l": 256.88446, "t": 248.81506000000002, "r": 264.6358, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "147", "bbox": {"l": 281.47742, "t": 248.81506000000002, "r": 289.22876, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "\u60c5\u5831\u51e6\u7406\u5b66\u4f1a\u7b2c", "bbox": {"l": 55.53052099999999, "t": 257.28369, "r": 91.827637, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "65", "bbox": {"l": 88.052673, "t": 257.07465, "r": 93.219925, "b": 261.43255999999997, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "\u56de\u5168\u56fd\u5927\u4f1a", "bbox": {"l": 93.220474, "t": 257.28369, "r": 119.14685, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "(2003)", "bbox": {"l": 116.45073999999998, "t": 257.07465, "r": 129.88177, "b": 261.43255999999997, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "177", "bbox": {"l": 183.10536, "t": 256.30029, "r": 190.8567, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "1", "bbox": {"l": 210.28223, "t": 256.30029, "r": 212.86539, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "176", "bbox": {"l": 232.29153, "t": 256.30029, "r": 240.04287999999997, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "150", "bbox": {"l": 256.88446, "t": 256.30029, "r": 264.6358, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "236", "bbox": {"l": 281.47742, "t": 256.30029, "r": 289.22876, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "\u7b2c", "bbox": {"l": 55.53052099999999, "t": 264.5108, "r": 60.715424, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "17", "bbox": {"l": 60.17654799999999, "t": 264.30175999999994, "r": 65.343796, "b": 268.65967, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "\u56de\u4eba\u5de5\u77e5\u80fd\u5b66\u4f1a\u5168\u56fd\u5927\u4f1a", "bbox": {"l": 65.344376, "t": 264.5108, "r": 122.38297000000001, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "(2003)", "bbox": {"l": 116.45073999999998, "t": 264.30175999999994, "r": 129.88177, "b": 268.65967, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "208", "bbox": {"l": 183.10536, "t": 263.52739999999994, "r": 190.8567, "b": 267.88531, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "5", "bbox": {"l": 210.28223, "t": 263.52739999999994, "r": 212.86539, "b": 267.88531, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "203", "bbox": {"l": 232.29153, "t": 263.52739999999994, "r": 240.04287999999997, "b": 267.88531, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "152", "bbox": {"l": 256.88446, "t": 263.52739999999994, "r": 264.6358, "b": 267.88531, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "244", "bbox": {"l": 281.47742, "t": 263.52739999999994, "r": 289.22876, "b": 267.88531, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "\u81ea\u7136\u8a00\u8a9e\u51e6\u7406\u7814\u7a76\u4f1a\u7b2c", "bbox": {"l": 55.53052099999999, "t": 271.73785, "r": 107.38374, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "146", "bbox": {"l": 101.99034, "t": 271.52881, "r": 109.74168000000002, "b": 275.88671999999997, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "\u301c", "bbox": {"l": 109.74204, "t": 271.73785, "r": 114.92695000000002, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "155", "bbox": {"l": 114.38793, "t": 271.52881, "r": 122.13927, "b": 275.88671999999997, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "\u56de", "bbox": {"l": 122.13963, "t": 271.73785, "r": 127.32454000000001, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "98", "bbox": {"l": 184.39731, "t": 270.75446, "r": 189.56456, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "2", "bbox": {"l": 210.28223, "t": 270.75446, "r": 212.86539, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "96", "bbox": {"l": 233.58348, "t": 270.75446, "r": 238.75072999999998, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "150", "bbox": {"l": 256.88446, "t": 270.75446, "r": 264.6358, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "232", "bbox": {"l": 281.47742, "t": 270.75446, "r": 289.22876, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "WWW", "bbox": {"l": 55.53052099999999, "t": 279.01392, "r": 68.68605, "b": 283.37183, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "\u304b\u3089\u53ce\u96c6\u3057\u305f\u8ad6\u6587", "bbox": {"l": 68.685814, "t": 279.22295999999994, "r": 110.16829999999999, "b": 283.40436, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "107", "bbox": {"l": 183.10536, "t": 277.98157000000003, "r": 190.8567, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "73", "bbox": {"l": 208.99026, "t": 277.98157000000003, "r": 214.15752, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "34", "bbox": {"l": 233.58348, "t": 277.98157000000003, "r": 238.75072999999998, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "147", "bbox": {"l": 256.88446, "t": 277.98157000000003, "r": 264.6358, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "96", "bbox": {"l": 282.76938, "t": 277.98157000000003, "r": 287.93661, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "\u8a08", "bbox": {"l": 169.61508, "t": 286.45004, "r": 174.79999, "b": 290.63141, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "945", "bbox": {"l": 183.10536, "t": 285.46667, "r": 190.8567, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "294", "bbox": {"l": 207.69832, "t": 285.46667, "r": 215.44965999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "651", "bbox": {"l": 232.29153, "t": 285.46667, "r": 240.04287999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "1122", "bbox": {"l": 255.76506, "t": 285.46667, "r": 265.75204, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "955", "bbox": {"l": 281.47742, "t": 285.46667, "r": 289.22876, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "Text is aligned to match original for ease of viewing", "bbox": {"l": 380.42731, "t": 292.30426, "r": 549.42175, "b": 298.60284, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "Weighted Average Grant Date Fair", "bbox": {"l": 459.04861, "t": 221.62415, "r": 542.00018, "b": 226.68933000000004, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "Value", "bbox": {"l": 493.82193, "t": 227.83416999999997, "r": 507.2258, "b": 232.89935000000003, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "RS", "bbox": {"l": 393.2442, "t": 236.74712999999997, "r": 400.74588, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "U", "bbox": {"l": 400.74643, "t": 236.74712999999997, "r": 404.64523, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "s", "bbox": {"l": 404.6463, "t": 236.74712999999997, "r": 407.34631, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "Shares (in millions)", "bbox": {"l": 392.09671, "t": 221.57446000000004, "r": 438.0145, "b": 226.63964999999996, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "PSUs", "bbox": {"l": 427.18323, "t": 236.74712999999997, "r": 440.98778999999996, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "RSUs", "bbox": {"l": 468.38254, "t": 236.74712999999997, "r": 482.48465000000004, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "PSUs", "bbox": {"l": 516.92578, "t": 236.74712999999997, "r": 530.73035, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Nonvested on Janua", "bbox": {"l": 306.11493, "t": 244.61084000000005, "r": 355.6532, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "ry 1", "bbox": {"l": 355.65427, "t": 244.61084000000005, "r": 364.65607, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "1.", "bbox": {"l": 396.24661, "t": 244.91327, "r": 400.75238, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "1", "bbox": {"l": 400.7529, "t": 244.91327, "r": 403.75531, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "0.3", "bbox": {"l": 429.81838999999997, "t": 244.91327, "r": 437.32708999999994, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "90.10", "bbox": {"l": 465.52859, "t": 244.91327, "r": 478.40103, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "$", "bbox": {"l": 480.97552, "t": 244.91327, "r": 483.55001999999996, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "$ 91.19", "bbox": {"l": 513.44824, "t": 244.91327, "r": 531.46967, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "Granted", "bbox": {"l": 306.11493, "t": 253.68451000000005, "r": 325.62674, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "0.", "bbox": {"l": 396.24661, "t": 253.68451000000005, "r": 400.75238, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "5", "bbox": {"l": 400.7529, "t": 253.68451000000005, "r": 403.75531, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "0.1", "bbox": {"l": 429.81838999999997, "t": 253.68451000000005, "r": 437.32708999999994, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "117.44", "bbox": {"l": 466.43579000000005, "t": 253.68451000000005, "r": 482.54831, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "122.41", "bbox": {"l": 514.29065, "t": 253.68451000000005, "r": 530.80981, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "Vested", "bbox": {"l": 306.11493, "t": 261.54822, "r": 322.62866, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "(0.", "bbox": {"l": 394.43222, "t": 261.54822, "r": 400.73563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "5", "bbox": {"l": 400.73456, "t": 261.54822, "r": 403.73697, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": ")", "bbox": {"l": 403.73804, "t": 261.54822, "r": 405.53625, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "(0.1)", "bbox": {"l": 427.7016, "t": 261.54822, "r": 438.80563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "87.08", "bbox": {"l": 468.55533, "t": 261.54822, "r": 482.07043, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "81.14", "bbox": {"l": 516.01862, "t": 261.54822, "r": 529.53375, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "Canceled or forfeited", "bbox": {"l": 306.11493, "t": 269.64148, "r": 356.24771, "b": 274.70667000000003, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "(0.", "bbox": {"l": 394.43222, "t": 270.31946000000005, "r": 400.73563, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "1", "bbox": {"l": 400.73456, "t": 270.31946000000005, "r": 403.73697, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": ")", "bbox": {"l": 403.73804, "t": 270.31946000000005, "r": 405.53625, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "-", "bbox": {"l": 431.02802, "t": 270.31946000000005, "r": 436.4280099999999, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "102.01", "bbox": {"l": 465.83099000000004, "t": 270.31946000000005, "r": 482.35013, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "92.18", "bbox": {"l": 516.01862, "t": 270.31946000000005, "r": 529.53375, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "Nonvested on December 31", "bbox": {"l": 306.11493, "t": 278.48572, "r": 373.35764, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "1.0", "bbox": {"l": 396.24661, "t": 278.48572, "r": 403.75531, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "0.3", "bbox": {"l": 429.51599, "t": 278.48572, "r": 437.02469, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "104.85 $", "bbox": {"l": 463.7142, "t": 278.48572, "r": 484.73965000000004, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "$ 104.51", "bbox": {"l": 512.99463, "t": 278.48572, "r": 534.02008, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "Figure 5:", "bbox": {"l": 50.112, "t": 320.87735, "r": 86.864021, "b": 329.78391, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "One of the benefits of TableFormer is that it is language agnostic, as an example, the left part of the illustration", "bbox": {"l": 93.917542, "t": 320.87735, "r": 545.11371, "b": 329.78391, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "demonstrates TableFormer predictions on previously unseen language (Japanese). Additionally, we see that TableFormer is", "bbox": {"l": 50.112, "t": 332.83233999999993, "r": 545.11371, "b": 341.73889, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "robust to variability in style and content, right side of the illustration shows the example of the TableFormer prediction from", "bbox": {"l": 50.112, "t": 344.78732, "r": 545.11377, "b": 353.69388, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "the FinTabNet dataset.", "bbox": {"l": 50.112, "t": 356.74332, "r": 139.79532, "b": 365.64987, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "Red - PDF cells, Green - predicted bounding boxes", "bbox": {"l": 220.26282, "t": 381.77722, "r": 342.07819, "b": 386.44281, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "Ground Truth", "bbox": {"l": 53.715248, "t": 381.77722, "r": 85.657333, "b": 386.44281, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "16", "bbox": {"l": 437.37939, "t": 400.55295, "r": 443.69870000000003, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "17", "bbox": {"l": 450.33203, "t": 400.55295, "r": 456.6513100000001, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "18", "bbox": {"l": 463.28464, "t": 400.55295, "r": 469.60394, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "19", "bbox": {"l": 476.23724000000004, "t": 400.55295, "r": 482.5565500000001, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "20", "bbox": {"l": 489.18988, "t": 400.55295, "r": 495.50916, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "21", "bbox": {"l": 502.14251999999993, "t": 400.55295, "r": 508.46178999999995, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "22", "bbox": {"l": 515.09509, "t": 400.55295, "r": 521.41443, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "23", "bbox": {"l": 385.2814, "t": 411.03836000000007, "r": 391.60071, "b": 417.35699, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "24", "bbox": {"l": 398.52341, "t": 411.03836000000007, "r": 404.84271, "b": 417.35699, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "25", "bbox": {"l": 411.47604, "t": 411.03836000000007, "r": 417.79535, "b": 417.35699, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "26", "bbox": {"l": 437.37939, "t": 411.03836000000007, "r": 443.69870000000003, "b": 417.35699, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "27", "bbox": {"l": 450.33203, "t": 411.03836000000007, "r": 456.6513100000001, "b": 417.35699, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "28", "bbox": {"l": 463.28464, "t": 411.03836000000007, "r": 469.60394, "b": 417.35699, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "30", "bbox": {"l": 385.2814, "t": 421.0697, "r": 391.60071, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "31", "bbox": {"l": 398.52341, "t": 421.0697, "r": 404.84271, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "32", "bbox": {"l": 411.47604, "t": 421.0697, "r": 417.79532, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "33", "bbox": {"l": 424.42865, "t": 421.0697, "r": 430.74796, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "34", "bbox": {"l": 437.38129, "t": 421.0697, "r": 443.70056, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "35", "bbox": {"l": 450.33389000000005, "t": 421.0697, "r": 456.65319999999997, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "36", "bbox": {"l": 463.2865, "t": 421.0697, "r": 469.6058, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "37", "bbox": {"l": 476.23914, "t": 421.0697, "r": 482.55841, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "38", "bbox": {"l": 489.1917700000001, "t": 421.0697, "r": 495.51105, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "39", "bbox": {"l": 502.14438, "t": 421.0697, "r": 508.46368, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "40", "bbox": {"l": 515.09705, "t": 421.0697, "r": 521.41632, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "41", "bbox": {"l": 528.04962, "t": 421.0697, "r": 534.3689, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "42", "bbox": {"l": 385.2814, "t": 432.04431, "r": 391.60071, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "43", "bbox": {"l": 398.52341, "t": 432.04431, "r": 404.84271, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "44", "bbox": {"l": 411.47604, "t": 432.04431, "r": 417.79532, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "45", "bbox": {"l": 424.42865, "t": 432.04431, "r": 430.74796, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "46", "bbox": {"l": 437.38129, "t": 432.04431, "r": 443.70056, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "47", "bbox": {"l": 450.33389000000005, "t": 432.04431, "r": 456.65319999999997, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "48", "bbox": {"l": 463.2865, "t": 432.04431, "r": 469.6058, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "49", "bbox": {"l": 476.23914, "t": 432.04431, "r": 482.55841, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "50", "bbox": {"l": 489.1917700000001, "t": 432.04431, "r": 495.51105, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "51", "bbox": {"l": 502.14438, "t": 432.04431, "r": 508.46368, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "52", "bbox": {"l": 515.09705, "t": 432.04431, "r": 521.41632, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "53", "bbox": {"l": 528.04962, "t": 432.04431, "r": 534.3689, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "0", "bbox": {"l": 385.2814, "t": 389.20004, "r": 388.44073, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "1", "bbox": {"l": 398.52341, "t": 389.20004, "r": 401.68274, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "2", "bbox": {"l": 411.4754, "t": 389.20004, "r": 414.63474, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "3", "bbox": {"l": 424.4274, "t": 389.20004, "r": 427.58673, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "4", "bbox": {"l": 437.37939, "t": 389.20004, "r": 440.53870000000006, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "5", "bbox": {"l": 450.33136, "t": 389.20004, "r": 453.49069000000003, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "6", "bbox": {"l": 463.28336, "t": 389.20004, "r": 466.44269, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "7", "bbox": {"l": 476.23535, "t": 389.20004, "r": 479.39468, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "8", "bbox": {"l": 489.18735, "t": 389.20004, "r": 492.34668, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "9", "bbox": {"l": 502.13933999999995, "t": 389.20004, "r": 505.29868000000005, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "10", "bbox": {"l": 515.09131, "t": 389.20004, "r": 521.41064, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "11", "bbox": {"l": 528.04364, "t": 389.20004, "r": 534.13104, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "12", "bbox": {"l": 385.2814, "t": 398.97464, "r": 391.60071, "b": 405.29327, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "13", "bbox": {"l": 398.52341, "t": 398.97464, "r": 404.84271, "b": 405.29327, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "14", "bbox": {"l": 411.47604, "t": 398.97464, "r": 417.79535, "b": 405.29327, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "15", "bbox": {"l": 424.42719, "t": 406.77463000000006, "r": 430.74648999999994, "b": 413.09326, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "29", "bbox": {"l": 502.86941999999993, "t": 410.99438, "r": 509.18871999999993, "b": 417.31302, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "Predicted Structure", "bbox": {"l": 384.35437, "t": 381.77722, "r": 430.99261, "b": 386.44281, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "Figure 6: An example of TableFormer predictions (bounding boxes and structure) from generated SynthTabNet table.", "bbox": {"l": 62.595001, "t": 458.72836, "r": 532.63049, "b": 467.63492, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "5.5.", "bbox": {"l": 50.112, "t": 491.39536, "r": 64.448898, "b": 501.24741, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "Qualitative Analysis", "bbox": {"l": 74.006828, "t": 491.39536, "r": 163.7558, "b": 501.24741, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "We showcase several visualizations for the different", "bbox": {"l": 62.067001, "t": 536.87337, "r": 286.36499, "b": 545.77992, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": "components of our network on various", "bbox": {"l": 50.112, "t": 548.82837, "r": 211.15741, "b": 557.73492, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "\u201ccomplex\u201d", "bbox": {"l": 215.10000999999997, "t": 548.91803, "r": 259.17453, "b": 557.50578, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "tables", "bbox": {"l": 263.12, "t": 548.82837, "r": 286.36273, "b": 557.73492, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": "within datasets presented in this work in Fig. 5 and Fig. 6", "bbox": {"l": 50.112, "t": 560.78337, "r": 286.36505, "b": 569.68993, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "As it is shown, our model is able to predict bounding boxes", "bbox": {"l": 50.112, "t": 572.73837, "r": 286.36508, "b": 581.6449299999999, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "for all table cells, even for the empty ones. Additionally,", "bbox": {"l": 50.112, "t": 584.69337, "r": 286.36508, "b": 593.59993, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "our post-processing techniques can extract the cell content", "bbox": {"l": 50.112, "t": 596.64937, "r": 286.36505, "b": 605.55592, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": "by matching the predicted bounding boxes to the PDF cells", "bbox": {"l": 50.112, "t": 608.60437, "r": 286.36508, "b": 617.51093, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "based on their overlap and spatial proximity. The left part", "bbox": {"l": 50.112, "t": 620.55937, "r": 286.36508, "b": 629.46593, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "of Fig. 5 demonstrates also the adaptability of our method", "bbox": {"l": 50.112, "t": 632.51437, "r": 286.36508, "b": 641.42093, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "to any language, as it can successfully extract Japanese", "bbox": {"l": 50.112, "t": 644.46938, "r": 286.36508, "b": 653.37593, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "text, although the training set contains only English content.", "bbox": {"l": 50.112, "t": 656.42438, "r": 286.36511, "b": 665.33094, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "We provide more visualizations including the intermediate", "bbox": {"l": 50.112, "t": 668.38037, "r": 286.36508, "b": 677.28694, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "steps in the supplementary material. Overall these illustra-", "bbox": {"l": 50.112, "t": 680.33537, "r": 286.36511, "b": 689.24194, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "tions justify the versatility of our method across a diverse", "bbox": {"l": 50.112, "t": 692.290375, "r": 286.36511, "b": 701.196945, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "range of table appearances and content type.", "bbox": {"l": 50.112, "t": 704.245377, "r": 226.88833999999997, "b": 713.1519470000001, "coord_origin": "TOPLEFT"}}, {"id": 201, "text": "6.", "bbox": {"l": 308.862, "t": 490.70892, "r": 316.07382, "b": 501.45663, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": "Future Work & Conclusion", "bbox": {"l": 325.68954, "t": 490.70892, "r": 460.84848, "b": 501.45663, "coord_origin": "TOPLEFT"}}, {"id": 203, "text": "In this paper, we presented TableFormer an end-to-end", "bbox": {"l": 320.81699, "t": 512.89337, "r": 545.11505, "b": 521.79993, "coord_origin": "TOPLEFT"}}, {"id": 204, "text": "transformer based approach to predict table structures and", "bbox": {"l": 308.862, "t": 524.84836, "r": 545.11517, "b": 533.75491, "coord_origin": "TOPLEFT"}}, {"id": 205, "text": "bounding boxes of cells from an image. This approach en-", "bbox": {"l": 308.862, "t": 536.80336, "r": 545.11511, "b": 545.70992, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": "ables us to recreate the table structure, and extract the cell", "bbox": {"l": 308.862, "t": 548.75836, "r": 545.11505, "b": 557.6649199999999, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": "content from PDF or OCR by using bounding boxes. Ad-", "bbox": {"l": 308.862, "t": 560.71336, "r": 545.11517, "b": 569.61992, "coord_origin": "TOPLEFT"}}, {"id": 208, "text": "ditionally, it provides the versatility required in real-world", "bbox": {"l": 308.862, "t": 572.66837, "r": 545.11511, "b": 581.57492, "coord_origin": "TOPLEFT"}}, {"id": 209, "text": "scenarios when dealing with various types of PDF docu-", "bbox": {"l": 308.862, "t": 584.62436, "r": 545.11511, "b": 593.53091, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": "ments, and languages.", "bbox": {"l": 308.862, "t": 596.57936, "r": 400.46808, "b": 605.48592, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "Furthermore, our method outper-", "bbox": {"l": 408.37839, "t": 596.57936, "r": 545.11511, "b": 605.48592, "coord_origin": "TOPLEFT"}}, {"id": 212, "text": "forms all state-of-the-arts with a wide margin. Finally, we", "bbox": {"l": 308.862, "t": 608.53436, "r": 545.11505, "b": 617.44092, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "introduce \u201cSynthTabNet\u201d a challenging synthetically gen-", "bbox": {"l": 308.862, "t": 620.48936, "r": 545.11511, "b": 629.3959199999999, "coord_origin": "TOPLEFT"}}, {"id": 214, "text": "erated dataset that reinforces missing characteristics from", "bbox": {"l": 308.862, "t": 632.4443699999999, "r": 545.11505, "b": 641.35092, "coord_origin": "TOPLEFT"}}, {"id": 215, "text": "other datasets.", "bbox": {"l": 308.862, "t": 644.39937, "r": 365.85803, "b": 653.30592, "coord_origin": "TOPLEFT"}}, {"id": 216, "text": "References", "bbox": {"l": 308.862, "t": 672.09892, "r": 364.40585, "b": 682.84664, "coord_origin": "TOPLEFT"}}, {"id": 217, "text": "[1]", "bbox": {"l": 313.345, "t": 693.9617920000001, "r": 323.80792, "b": 701.977753, "coord_origin": "TOPLEFT"}}, {"id": 218, "text": "Nicolas Carion, Francisco Massa, Gabriel Synnaeve, Nicolas", "bbox": {"l": 326.05127, "t": 693.9617920000001, "r": 545.10852, "b": 701.977753, "coord_origin": "TOPLEFT"}}, {"id": 219, "text": "Usunier, Alexander Kirillov, and Sergey Zagoruyko. End-to-", "bbox": {"l": 328.78101, "t": 704.920792, "r": 545.1134, "b": 712.936752, "coord_origin": "TOPLEFT"}}, {"id": 220, "text": "8", "bbox": {"l": 295.121, "t": 734.133366, "r": 300.10229, "b": 743.039928, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 18, "label": "caption", "bbox": {"l": 53.811783000000005, "t": 208.23328000000004, "r": 385.93451, "b": 216.10645, "coord_origin": "TOPLEFT"}, "confidence": 0.5986505746841431, "cells": [{"id": 0, "text": "b.", "bbox": {"l": 53.811783000000005, "t": 208.23328000000004, "r": 62.219952, "b": 216.10645, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Structure predicted by TableFormer, with superimposed matched PDF cell text:", "bbox": {"l": 66.424026, "t": 208.23328000000004, "r": 385.93451, "b": 216.10645, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "section_header", "bbox": {"l": 53.811783000000005, "t": 94.28112999999996, "r": 284.34592, "b": 102.15430000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.46452972292900085, "cells": [{"id": 2, "text": "Japanese language (previously unseen by TableFormer):", "bbox": {"l": 53.811783000000005, "t": 94.28112999999996, "r": 284.34592, "b": 102.15430000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "section_header", "bbox": {"l": 304.83081, "t": 94.28112999999996, "r": 431.09119, "b": 102.15430000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.4629225730895996, "cells": [{"id": 3, "text": "Example table from FinTabNet:", "bbox": {"l": 304.83081, "t": 94.28112999999996, "r": 431.09119, "b": 102.15430000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "list_item", "bbox": {"l": 53.286037, "t": 78.68756000000008, "r": 61.550289, "b": 86.56073000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.5820134282112122, "cells": [{"id": 4, "text": "a.", "bbox": {"l": 53.286037, "t": 78.68756000000008, "r": 61.550289, "b": 86.56073000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "list_item", "bbox": {"l": 65.682419, "t": 78.68756000000008, "r": 499.55563, "b": 86.56073000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.541211724281311, "cells": [{"id": 5, "text": "Red - PDF cells, Green - predicted bounding boxes, Blue - post-processed predictions matched to PDF cells", "bbox": {"l": 65.682419, "t": 78.68756000000008, "r": 499.55563, "b": 86.56073000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "table", "bbox": {"l": 53.62853240966797, "t": 218.94857788085938, "r": 298.5574951171875, "b": 292.39996337890625, "coord_origin": "TOPLEFT"}, "confidence": 0.8824009299278259, "cells": [{"id": 6, "text": "\u8ad6\u6587\u30d5\u30a1\u30a4\u30eb", "bbox": {"l": 209.93285, "t": 222.18073000000004, "r": 241.04458999999997, "b": 226.36212, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "\u53c2\u8003\u6587\u732e", "bbox": {"l": 263.76489, "t": 222.18073000000004, "r": 284.50589, "b": 226.36212, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "\u51fa\u5178", "bbox": {"l": 110.24990999999999, "t": 229.66594999999995, "r": 120.62018, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "\u30d5\u30a1\u30a4\u30eb", "bbox": {"l": 175.36609, "t": 229.66594999999995, "r": 196.1071, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "\u6570", "bbox": {"l": 196.10756, "t": 229.66594999999995, "r": 201.29247, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "\u82f1\u8a9e", "bbox": {"l": 209.62408, "t": 229.66594999999995, "r": 219.99435, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "\u65e5\u672c\u8a9e", "bbox": {"l": 229.19814, "t": 229.66594999999995, "r": 244.75377, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "\u82f1\u8a9e", "bbox": {"l": 256.1142, "t": 229.66594999999995, "r": 266.48447, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "\u65e5\u672c\u8a9e", "bbox": {"l": 278.38434, "t": 229.66594999999995, "r": 293.93997, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Association for Computational Linguistics(ACL2003)", "bbox": {"l": 55.53052099999999, "t": 236.42584, "r": 162.7131, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "65", "bbox": {"l": 184.39731, "t": 236.42584, "r": 189.56456, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "65", "bbox": {"l": 208.99026, "t": 236.42584, "r": 214.15752, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "0", "bbox": {"l": 234.87517, "t": 236.42584, "r": 237.45833000000002, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "150", "bbox": {"l": 256.88446, "t": 236.42584, "r": 264.6358, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "0", "bbox": {"l": 284.06134, "t": 236.42584, "r": 286.6445, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Computational Linguistics(COLING2002)", "bbox": {"l": 55.53052099999999, "t": 242.62048000000004, "r": 139.72253, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "140", "bbox": {"l": 183.10536, "t": 242.62048000000004, "r": 190.8567, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "140", "bbox": {"l": 207.69832, "t": 242.62048000000004, "r": 215.44965999999997, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "0", "bbox": {"l": 234.87517, "t": 242.62048000000004, "r": 237.45833000000002, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "150", "bbox": {"l": 256.88446, "t": 242.62048000000004, "r": 264.6358, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "0", "bbox": {"l": 284.06134, "t": 242.62048000000004, "r": 286.6445, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "\u96fb\u6c17\u60c5\u5831\u901a\u4fe1\u5b66\u4f1a", "bbox": {"l": 55.53052099999999, "t": 249.79845999999998, "r": 97.013, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "2003", "bbox": {"l": 92.698288, "t": 249.58942000000002, "r": 103.03371, "b": 253.94732999999997, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "\u5e74\u7dcf\u5408\u5927\u4f1a", "bbox": {"l": 103.03389, "t": 249.79845999999998, "r": 128.96027, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "150", "bbox": {"l": 183.10536, "t": 248.81506000000002, "r": 190.8567, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "8", "bbox": {"l": 210.28223, "t": 248.81506000000002, "r": 212.86539, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "142", "bbox": {"l": 232.29153, "t": 248.81506000000002, "r": 240.04287999999997, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "223", "bbox": {"l": 256.88446, "t": 248.81506000000002, "r": 264.6358, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "147", "bbox": {"l": 281.47742, "t": 248.81506000000002, "r": 289.22876, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "\u60c5\u5831\u51e6\u7406\u5b66\u4f1a\u7b2c", "bbox": {"l": 55.53052099999999, "t": 257.28369, "r": 91.827637, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "65", "bbox": {"l": 88.052673, "t": 257.07465, "r": 93.219925, "b": 261.43255999999997, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "\u56de\u5168\u56fd\u5927\u4f1a", "bbox": {"l": 93.220474, "t": 257.28369, "r": 119.14685, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "(2003)", "bbox": {"l": 116.45073999999998, "t": 257.07465, "r": 129.88177, "b": 261.43255999999997, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "177", "bbox": {"l": 183.10536, "t": 256.30029, "r": 190.8567, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "1", "bbox": {"l": 210.28223, "t": 256.30029, "r": 212.86539, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "176", "bbox": {"l": 232.29153, "t": 256.30029, "r": 240.04287999999997, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "150", "bbox": {"l": 256.88446, "t": 256.30029, "r": 264.6358, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "236", "bbox": {"l": 281.47742, "t": 256.30029, "r": 289.22876, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "\u7b2c", "bbox": {"l": 55.53052099999999, "t": 264.5108, "r": 60.715424, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "17", "bbox": {"l": 60.17654799999999, "t": 264.30175999999994, "r": 65.343796, "b": 268.65967, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "\u56de\u4eba\u5de5\u77e5\u80fd\u5b66\u4f1a\u5168\u56fd\u5927\u4f1a", "bbox": {"l": 65.344376, "t": 264.5108, "r": 122.38297000000001, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "(2003)", "bbox": {"l": 116.45073999999998, "t": 264.30175999999994, "r": 129.88177, "b": 268.65967, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "208", "bbox": {"l": 183.10536, "t": 263.52739999999994, "r": 190.8567, "b": 267.88531, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "5", "bbox": {"l": 210.28223, "t": 263.52739999999994, "r": 212.86539, "b": 267.88531, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "203", "bbox": {"l": 232.29153, "t": 263.52739999999994, "r": 240.04287999999997, "b": 267.88531, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "152", "bbox": {"l": 256.88446, "t": 263.52739999999994, "r": 264.6358, "b": 267.88531, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "244", "bbox": {"l": 281.47742, "t": 263.52739999999994, "r": 289.22876, "b": 267.88531, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "\u81ea\u7136\u8a00\u8a9e\u51e6\u7406\u7814\u7a76\u4f1a\u7b2c", "bbox": {"l": 55.53052099999999, "t": 271.73785, "r": 107.38374, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "146", "bbox": {"l": 101.99034, "t": 271.52881, "r": 109.74168000000002, "b": 275.88671999999997, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "\u301c", "bbox": {"l": 109.74204, "t": 271.73785, "r": 114.92695000000002, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "155", "bbox": {"l": 114.38793, "t": 271.52881, "r": 122.13927, "b": 275.88671999999997, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "\u56de", "bbox": {"l": 122.13963, "t": 271.73785, "r": 127.32454000000001, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "98", "bbox": {"l": 184.39731, "t": 270.75446, "r": 189.56456, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "2", "bbox": {"l": 210.28223, "t": 270.75446, "r": 212.86539, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "96", "bbox": {"l": 233.58348, "t": 270.75446, "r": 238.75072999999998, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "150", "bbox": {"l": 256.88446, "t": 270.75446, "r": 264.6358, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "232", "bbox": {"l": 281.47742, "t": 270.75446, "r": 289.22876, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "WWW", "bbox": {"l": 55.53052099999999, "t": 279.01392, "r": 68.68605, "b": 283.37183, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "\u304b\u3089\u53ce\u96c6\u3057\u305f\u8ad6\u6587", "bbox": {"l": 68.685814, "t": 279.22295999999994, "r": 110.16829999999999, "b": 283.40436, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "107", "bbox": {"l": 183.10536, "t": 277.98157000000003, "r": 190.8567, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "73", "bbox": {"l": 208.99026, "t": 277.98157000000003, "r": 214.15752, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "34", "bbox": {"l": 233.58348, "t": 277.98157000000003, "r": 238.75072999999998, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "147", "bbox": {"l": 256.88446, "t": 277.98157000000003, "r": 264.6358, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "96", "bbox": {"l": 282.76938, "t": 277.98157000000003, "r": 287.93661, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "\u8a08", "bbox": {"l": 169.61508, "t": 286.45004, "r": 174.79999, "b": 290.63141, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "945", "bbox": {"l": 183.10536, "t": 285.46667, "r": 190.8567, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "294", "bbox": {"l": 207.69832, "t": 285.46667, "r": 215.44965999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "651", "bbox": {"l": 232.29153, "t": 285.46667, "r": 240.04287999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "1122", "bbox": {"l": 255.76506, "t": 285.46667, "r": 265.75204, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "955", "bbox": {"l": 281.47742, "t": 285.46667, "r": 289.22876, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}], "children": [{"id": 32, "label": "text", "bbox": {"l": 209.93285, "t": 222.18073000000004, "r": 241.04458999999997, "b": 226.36212, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": "\u8ad6\u6587\u30d5\u30a1\u30a4\u30eb", "bbox": {"l": 209.93285, "t": 222.18073000000004, "r": 241.04458999999997, "b": 226.36212, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 263.76489, "t": 222.18073000000004, "r": 284.50589, "b": 226.36212, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "\u53c2\u8003\u6587\u732e", "bbox": {"l": 263.76489, "t": 222.18073000000004, "r": 284.50589, "b": 226.36212, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 110.24990999999999, "t": 229.66594999999995, "r": 120.62018, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "\u51fa\u5178", "bbox": {"l": 110.24990999999999, "t": 229.66594999999995, "r": 120.62018, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 175.36609, "t": 229.66594999999995, "r": 196.1071, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "\u30d5\u30a1\u30a4\u30eb", "bbox": {"l": 175.36609, "t": 229.66594999999995, "r": 196.1071, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 196.10756, "t": 229.66594999999995, "r": 201.29247, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "\u6570", "bbox": {"l": 196.10756, "t": 229.66594999999995, "r": 201.29247, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 209.62408, "t": 229.66594999999995, "r": 219.99435, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "\u82f1\u8a9e", "bbox": {"l": 209.62408, "t": 229.66594999999995, "r": 219.99435, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 229.19814, "t": 229.66594999999995, "r": 244.75377, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "\u65e5\u672c\u8a9e", "bbox": {"l": 229.19814, "t": 229.66594999999995, "r": 244.75377, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 256.1142, "t": 229.66594999999995, "r": 266.48447, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "\u82f1\u8a9e", "bbox": {"l": 256.1142, "t": 229.66594999999995, "r": 266.48447, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 278.38434, "t": 229.66594999999995, "r": 293.93997, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "\u65e5\u672c\u8a9e", "bbox": {"l": 278.38434, "t": 229.66594999999995, "r": 293.93997, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 55.53052099999999, "t": 236.42584, "r": 162.7131, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "Association for Computational Linguistics(ACL2003)", "bbox": {"l": 55.53052099999999, "t": 236.42584, "r": 162.7131, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 184.39731, "t": 236.42584, "r": 189.56456, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "65", "bbox": {"l": 184.39731, "t": 236.42584, "r": 189.56456, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 208.99026, "t": 236.42584, "r": 214.15752, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "65", "bbox": {"l": 208.99026, "t": 236.42584, "r": 214.15752, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 234.87517, "t": 236.42584, "r": 237.45833000000002, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "0", "bbox": {"l": 234.87517, "t": 236.42584, "r": 237.45833000000002, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 256.88446, "t": 236.42584, "r": 264.6358, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "150", "bbox": {"l": 256.88446, "t": 236.42584, "r": 264.6358, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 284.06134, "t": 236.42584, "r": 286.6445, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "0", "bbox": {"l": 284.06134, "t": 236.42584, "r": 286.6445, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 55.53052099999999, "t": 242.62048000000004, "r": 139.72253, "b": 246.97839, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "Computational Linguistics(COLING2002)", "bbox": {"l": 55.53052099999999, "t": 242.62048000000004, "r": 139.72253, "b": 246.97839, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 183.10536, "t": 242.62048000000004, "r": 190.8567, "b": 246.97839, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "140", "bbox": {"l": 183.10536, "t": 242.62048000000004, "r": 190.8567, "b": 246.97839, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 207.69832, "t": 242.62048000000004, "r": 215.44965999999997, "b": 246.97839, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "140", "bbox": {"l": 207.69832, "t": 242.62048000000004, "r": 215.44965999999997, "b": 246.97839, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 234.87517, "t": 242.62048000000004, "r": 237.45833000000002, "b": 246.97839, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "0", "bbox": {"l": 234.87517, "t": 242.62048000000004, "r": 237.45833000000002, "b": 246.97839, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 256.88446, "t": 242.62048000000004, "r": 264.6358, "b": 246.97839, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "150", "bbox": {"l": 256.88446, "t": 242.62048000000004, "r": 264.6358, "b": 246.97839, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 284.06134, "t": 242.62048000000004, "r": 286.6445, "b": 246.97839, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "0", "bbox": {"l": 284.06134, "t": 242.62048000000004, "r": 286.6445, "b": 246.97839, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 55.53052099999999, "t": 249.79845999999998, "r": 97.013, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "\u96fb\u6c17\u60c5\u5831\u901a\u4fe1\u5b66\u4f1a", "bbox": {"l": 55.53052099999999, "t": 249.79845999999998, "r": 97.013, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 92.698288, "t": 249.58942000000002, "r": 103.03371, "b": 253.94732999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "2003", "bbox": {"l": 92.698288, "t": 249.58942000000002, "r": 103.03371, "b": 253.94732999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 103.03389, "t": 249.79845999999998, "r": 128.96027, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "\u5e74\u7dcf\u5408\u5927\u4f1a", "bbox": {"l": 103.03389, "t": 249.79845999999998, "r": 128.96027, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 183.10536, "t": 248.81506000000002, "r": 190.8567, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "150", "bbox": {"l": 183.10536, "t": 248.81506000000002, "r": 190.8567, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 210.28223, "t": 248.81506000000002, "r": 212.86539, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "8", "bbox": {"l": 210.28223, "t": 248.81506000000002, "r": 212.86539, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 232.29153, "t": 248.81506000000002, "r": 240.04287999999997, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "142", "bbox": {"l": 232.29153, "t": 248.81506000000002, "r": 240.04287999999997, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 256.88446, "t": 248.81506000000002, "r": 264.6358, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "223", "bbox": {"l": 256.88446, "t": 248.81506000000002, "r": 264.6358, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 281.47742, "t": 248.81506000000002, "r": 289.22876, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "147", "bbox": {"l": 281.47742, "t": 248.81506000000002, "r": 289.22876, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 55.53052099999999, "t": 257.28369, "r": 91.827637, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "\u60c5\u5831\u51e6\u7406\u5b66\u4f1a\u7b2c", "bbox": {"l": 55.53052099999999, "t": 257.28369, "r": 91.827637, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 88.052673, "t": 257.07465, "r": 93.219925, "b": 261.43255999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "65", "bbox": {"l": 88.052673, "t": 257.07465, "r": 93.219925, "b": 261.43255999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 93.220474, "t": 257.28369, "r": 119.14685, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "\u56de\u5168\u56fd\u5927\u4f1a", "bbox": {"l": 93.220474, "t": 257.28369, "r": 119.14685, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 116.45073999999998, "t": 257.07465, "r": 129.88177, "b": 261.43255999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "(2003)", "bbox": {"l": 116.45073999999998, "t": 257.07465, "r": 129.88177, "b": 261.43255999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 183.10536, "t": 256.30029, "r": 190.8567, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "177", "bbox": {"l": 183.10536, "t": 256.30029, "r": 190.8567, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 210.28223, "t": 256.30029, "r": 212.86539, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "1", "bbox": {"l": 210.28223, "t": 256.30029, "r": 212.86539, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 232.29153, "t": 256.30029, "r": 240.04287999999997, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "176", "bbox": {"l": 232.29153, "t": 256.30029, "r": 240.04287999999997, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 256.88446, "t": 256.30029, "r": 264.6358, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "150", "bbox": {"l": 256.88446, "t": 256.30029, "r": 264.6358, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 281.47742, "t": 256.30029, "r": 289.22876, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "236", "bbox": {"l": 281.47742, "t": 256.30029, "r": 289.22876, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 55.53052099999999, "t": 264.5108, "r": 60.715424, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "\u7b2c", "bbox": {"l": 55.53052099999999, "t": 264.5108, "r": 60.715424, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 60.17654799999999, "t": 264.30175999999994, "r": 65.343796, "b": 268.65967, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "17", "bbox": {"l": 60.17654799999999, "t": 264.30175999999994, "r": 65.343796, "b": 268.65967, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 65.344376, "t": 264.5108, "r": 122.38297000000001, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "\u56de\u4eba\u5de5\u77e5\u80fd\u5b66\u4f1a\u5168\u56fd\u5927\u4f1a", "bbox": {"l": 65.344376, "t": 264.5108, "r": 122.38297000000001, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 116.45073999999998, "t": 264.30175999999994, "r": 129.88177, "b": 268.65967, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "(2003)", "bbox": {"l": 116.45073999999998, "t": 264.30175999999994, "r": 129.88177, "b": 268.65967, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 183.10536, "t": 263.52739999999994, "r": 190.8567, "b": 267.88531, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "208", "bbox": {"l": 183.10536, "t": 263.52739999999994, "r": 190.8567, "b": 267.88531, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 210.28223, "t": 263.52739999999994, "r": 212.86539, "b": 267.88531, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "5", "bbox": {"l": 210.28223, "t": 263.52739999999994, "r": 212.86539, "b": 267.88531, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 232.29153, "t": 263.52739999999994, "r": 240.04287999999997, "b": 267.88531, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "203", "bbox": {"l": 232.29153, "t": 263.52739999999994, "r": 240.04287999999997, "b": 267.88531, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 256.88446, "t": 263.52739999999994, "r": 264.6358, "b": 267.88531, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "152", "bbox": {"l": 256.88446, "t": 263.52739999999994, "r": 264.6358, "b": 267.88531, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 281.47742, "t": 263.52739999999994, "r": 289.22876, "b": 267.88531, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "244", "bbox": {"l": 281.47742, "t": 263.52739999999994, "r": 289.22876, "b": 267.88531, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 55.53052099999999, "t": 271.73785, "r": 107.38374, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "\u81ea\u7136\u8a00\u8a9e\u51e6\u7406\u7814\u7a76\u4f1a\u7b2c", "bbox": {"l": 55.53052099999999, "t": 271.73785, "r": 107.38374, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 101.99034, "t": 271.52881, "r": 109.74168000000002, "b": 275.88671999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "146", "bbox": {"l": 101.99034, "t": 271.52881, "r": 109.74168000000002, "b": 275.88671999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 109.74204, "t": 271.73785, "r": 114.92695000000002, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "\u301c", "bbox": {"l": 109.74204, "t": 271.73785, "r": 114.92695000000002, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 114.38793, "t": 271.52881, "r": 122.13927, "b": 275.88671999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "155", "bbox": {"l": 114.38793, "t": 271.52881, "r": 122.13927, "b": 275.88671999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 122.13963, "t": 271.73785, "r": 127.32454000000001, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "\u56de", "bbox": {"l": 122.13963, "t": 271.73785, "r": 127.32454000000001, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 184.39731, "t": 270.75446, "r": 189.56456, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "98", "bbox": {"l": 184.39731, "t": 270.75446, "r": 189.56456, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 210.28223, "t": 270.75446, "r": 212.86539, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "2", "bbox": {"l": 210.28223, "t": 270.75446, "r": 212.86539, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 233.58348, "t": 270.75446, "r": 238.75072999999998, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "96", "bbox": {"l": 233.58348, "t": 270.75446, "r": 238.75072999999998, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 256.88446, "t": 270.75446, "r": 264.6358, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "150", "bbox": {"l": 256.88446, "t": 270.75446, "r": 264.6358, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 281.47742, "t": 270.75446, "r": 289.22876, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "232", "bbox": {"l": 281.47742, "t": 270.75446, "r": 289.22876, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 55.53052099999999, "t": 279.01392, "r": 68.68605, "b": 283.37183, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "WWW", "bbox": {"l": 55.53052099999999, "t": 279.01392, "r": 68.68605, "b": 283.37183, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 68.685814, "t": 279.22295999999994, "r": 110.16829999999999, "b": 283.40436, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "\u304b\u3089\u53ce\u96c6\u3057\u305f\u8ad6\u6587", "bbox": {"l": 68.685814, "t": 279.22295999999994, "r": 110.16829999999999, "b": 283.40436, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 183.10536, "t": 277.98157000000003, "r": 190.8567, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "107", "bbox": {"l": 183.10536, "t": 277.98157000000003, "r": 190.8567, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 208.99026, "t": 277.98157000000003, "r": 214.15752, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "73", "bbox": {"l": 208.99026, "t": 277.98157000000003, "r": 214.15752, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 233.58348, "t": 277.98157000000003, "r": 238.75072999999998, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "34", "bbox": {"l": 233.58348, "t": 277.98157000000003, "r": 238.75072999999998, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 256.88446, "t": 277.98157000000003, "r": 264.6358, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "147", "bbox": {"l": 256.88446, "t": 277.98157000000003, "r": 264.6358, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 282.76938, "t": 277.98157000000003, "r": 287.93661, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "96", "bbox": {"l": 282.76938, "t": 277.98157000000003, "r": 287.93661, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 169.61508, "t": 286.45004, "r": 174.79999, "b": 290.63141, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "\u8a08", "bbox": {"l": 169.61508, "t": 286.45004, "r": 174.79999, "b": 290.63141, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 183.10536, "t": 285.46667, "r": 190.8567, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "945", "bbox": {"l": 183.10536, "t": 285.46667, "r": 190.8567, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 207.69832, "t": 285.46667, "r": 215.44965999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "294", "bbox": {"l": 207.69832, "t": 285.46667, "r": 215.44965999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 232.29153, "t": 285.46667, "r": 240.04287999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "651", "bbox": {"l": 232.29153, "t": 285.46667, "r": 240.04287999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 255.76506, "t": 285.46667, "r": 265.75204, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "1122", "bbox": {"l": 255.76506, "t": 285.46667, "r": 265.75204, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 281.47742, "t": 285.46667, "r": 289.22876, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "955", "bbox": {"l": 281.47742, "t": 285.46667, "r": 289.22876, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 16, "label": "caption", "bbox": {"l": 380.42731, "t": 292.30426, "r": 549.42175, "b": 298.60284, "coord_origin": "TOPLEFT"}, "confidence": 0.7499915957450867, "cells": [{"id": 76, "text": "Text is aligned to match original for ease of viewing", "bbox": {"l": 380.42731, "t": 292.30426, "r": 549.42175, "b": 298.60284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "table", "bbox": {"l": 304.9219970703125, "t": 218.51486206054688, "r": 550.2321166992188, "b": 287.90069580078125, "coord_origin": "TOPLEFT"}, "confidence": 0.8899767994880676, "cells": [{"id": 77, "text": "Weighted Average Grant Date Fair", "bbox": {"l": 459.04861, "t": 221.62415, "r": 542.00018, "b": 226.68933000000004, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "Value", "bbox": {"l": 493.82193, "t": 227.83416999999997, "r": 507.2258, "b": 232.89935000000003, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "RS", "bbox": {"l": 393.2442, "t": 236.74712999999997, "r": 400.74588, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "U", "bbox": {"l": 400.74643, "t": 236.74712999999997, "r": 404.64523, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "s", "bbox": {"l": 404.6463, "t": 236.74712999999997, "r": 407.34631, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "Shares (in millions)", "bbox": {"l": 392.09671, "t": 221.57446000000004, "r": 438.0145, "b": 226.63964999999996, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "PSUs", "bbox": {"l": 427.18323, "t": 236.74712999999997, "r": 440.98778999999996, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "RSUs", "bbox": {"l": 468.38254, "t": 236.74712999999997, "r": 482.48465000000004, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "PSUs", "bbox": {"l": 516.92578, "t": 236.74712999999997, "r": 530.73035, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Nonvested on Janua", "bbox": {"l": 306.11493, "t": 244.61084000000005, "r": 355.6532, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "ry 1", "bbox": {"l": 355.65427, "t": 244.61084000000005, "r": 364.65607, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "1.", "bbox": {"l": 396.24661, "t": 244.91327, "r": 400.75238, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "1", "bbox": {"l": 400.7529, "t": 244.91327, "r": 403.75531, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "0.3", "bbox": {"l": 429.81838999999997, "t": 244.91327, "r": 437.32708999999994, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "90.10", "bbox": {"l": 465.52859, "t": 244.91327, "r": 478.40103, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "$", "bbox": {"l": 480.97552, "t": 244.91327, "r": 483.55001999999996, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "$ 91.19", "bbox": {"l": 513.44824, "t": 244.91327, "r": 531.46967, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "Granted", "bbox": {"l": 306.11493, "t": 253.68451000000005, "r": 325.62674, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "0.", "bbox": {"l": 396.24661, "t": 253.68451000000005, "r": 400.75238, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "5", "bbox": {"l": 400.7529, "t": 253.68451000000005, "r": 403.75531, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "0.1", "bbox": {"l": 429.81838999999997, "t": 253.68451000000005, "r": 437.32708999999994, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "117.44", "bbox": {"l": 466.43579000000005, "t": 253.68451000000005, "r": 482.54831, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "122.41", "bbox": {"l": 514.29065, "t": 253.68451000000005, "r": 530.80981, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "Vested", "bbox": {"l": 306.11493, "t": 261.54822, "r": 322.62866, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "(0.", "bbox": {"l": 394.43222, "t": 261.54822, "r": 400.73563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "5", "bbox": {"l": 400.73456, "t": 261.54822, "r": 403.73697, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": ")", "bbox": {"l": 403.73804, "t": 261.54822, "r": 405.53625, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "(0.1)", "bbox": {"l": 427.7016, "t": 261.54822, "r": 438.80563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "87.08", "bbox": {"l": 468.55533, "t": 261.54822, "r": 482.07043, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "81.14", "bbox": {"l": 516.01862, "t": 261.54822, "r": 529.53375, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "Canceled or forfeited", "bbox": {"l": 306.11493, "t": 269.64148, "r": 356.24771, "b": 274.70667000000003, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "(0.", "bbox": {"l": 394.43222, "t": 270.31946000000005, "r": 400.73563, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "1", "bbox": {"l": 400.73456, "t": 270.31946000000005, "r": 403.73697, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": ")", "bbox": {"l": 403.73804, "t": 270.31946000000005, "r": 405.53625, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "-", "bbox": {"l": 431.02802, "t": 270.31946000000005, "r": 436.4280099999999, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "102.01", "bbox": {"l": 465.83099000000004, "t": 270.31946000000005, "r": 482.35013, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "92.18", "bbox": {"l": 516.01862, "t": 270.31946000000005, "r": 529.53375, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "Nonvested on December 31", "bbox": {"l": 306.11493, "t": 278.48572, "r": 373.35764, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "1.0", "bbox": {"l": 396.24661, "t": 278.48572, "r": 403.75531, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "0.3", "bbox": {"l": 429.51599, "t": 278.48572, "r": 437.02469, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "104.85 $", "bbox": {"l": 463.7142, "t": 278.48572, "r": 484.73965000000004, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "$ 104.51", "bbox": {"l": 512.99463, "t": 278.48572, "r": 534.02008, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}], "children": [{"id": 102, "label": "text", "bbox": {"l": 459.04861, "t": 221.62415, "r": 542.00018, "b": 226.68933000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "Weighted Average Grant Date Fair", "bbox": {"l": 459.04861, "t": 221.62415, "r": 542.00018, "b": 226.68933000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 493.82193, "t": 227.83416999999997, "r": 507.2258, "b": 232.89935000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "Value", "bbox": {"l": 493.82193, "t": 227.83416999999997, "r": 507.2258, "b": 232.89935000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 393.2442, "t": 236.74712999999997, "r": 400.74588, "b": 241.81232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "RS", "bbox": {"l": 393.2442, "t": 236.74712999999997, "r": 400.74588, "b": 241.81232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 400.74643, "t": 236.74712999999997, "r": 404.64523, "b": 241.81232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "U", "bbox": {"l": 400.74643, "t": 236.74712999999997, "r": 404.64523, "b": 241.81232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 404.6463, "t": 236.74712999999997, "r": 407.34631, "b": 241.81232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "s", "bbox": {"l": 404.6463, "t": 236.74712999999997, "r": 407.34631, "b": 241.81232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 392.09671, "t": 221.57446000000004, "r": 438.0145, "b": 226.63964999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "Shares (in millions)", "bbox": {"l": 392.09671, "t": 221.57446000000004, "r": 438.0145, "b": 226.63964999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 427.18323, "t": 236.74712999999997, "r": 440.98778999999996, "b": 241.81232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "PSUs", "bbox": {"l": 427.18323, "t": 236.74712999999997, "r": 440.98778999999996, "b": 241.81232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 468.38254, "t": 236.74712999999997, "r": 482.48465000000004, "b": 241.81232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "RSUs", "bbox": {"l": 468.38254, "t": 236.74712999999997, "r": 482.48465000000004, "b": 241.81232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 516.92578, "t": 236.74712999999997, "r": 530.73035, "b": 241.81232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "PSUs", "bbox": {"l": 516.92578, "t": 236.74712999999997, "r": 530.73035, "b": 241.81232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 306.11493, "t": 244.61084000000005, "r": 355.6532, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "Nonvested on Janua", "bbox": {"l": 306.11493, "t": 244.61084000000005, "r": 355.6532, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 355.65427, "t": 244.61084000000005, "r": 364.65607, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "ry 1", "bbox": {"l": 355.65427, "t": 244.61084000000005, "r": 364.65607, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 396.24661, "t": 244.91327, "r": 400.75238, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "1.", "bbox": {"l": 396.24661, "t": 244.91327, "r": 400.75238, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 114, "label": "text", "bbox": {"l": 400.7529, "t": 244.91327, "r": 403.75531, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "1", "bbox": {"l": 400.7529, "t": 244.91327, "r": 403.75531, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 115, "label": "text", "bbox": {"l": 429.81838999999997, "t": 244.91327, "r": 437.32708999999994, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "0.3", "bbox": {"l": 429.81838999999997, "t": 244.91327, "r": 437.32708999999994, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 116, "label": "text", "bbox": {"l": 465.52859, "t": 244.91327, "r": 478.40103, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "90.10", "bbox": {"l": 465.52859, "t": 244.91327, "r": 478.40103, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 117, "label": "text", "bbox": {"l": 480.97552, "t": 244.91327, "r": 483.55001999999996, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "$", "bbox": {"l": 480.97552, "t": 244.91327, "r": 483.55001999999996, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 118, "label": "text", "bbox": {"l": 513.44824, "t": 244.91327, "r": 531.46967, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "$ 91.19", "bbox": {"l": 513.44824, "t": 244.91327, "r": 531.46967, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 119, "label": "text", "bbox": {"l": 306.11493, "t": 253.68451000000005, "r": 325.62674, "b": 258.74969, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "Granted", "bbox": {"l": 306.11493, "t": 253.68451000000005, "r": 325.62674, "b": 258.74969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 120, "label": "text", "bbox": {"l": 396.24661, "t": 253.68451000000005, "r": 400.75238, "b": 258.74969, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "0.", "bbox": {"l": 396.24661, "t": 253.68451000000005, "r": 400.75238, "b": 258.74969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 121, "label": "text", "bbox": {"l": 400.7529, "t": 253.68451000000005, "r": 403.75531, "b": 258.74969, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "5", "bbox": {"l": 400.7529, "t": 253.68451000000005, "r": 403.75531, "b": 258.74969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 122, "label": "text", "bbox": {"l": 429.81838999999997, "t": 253.68451000000005, "r": 437.32708999999994, "b": 258.74969, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "0.1", "bbox": {"l": 429.81838999999997, "t": 253.68451000000005, "r": 437.32708999999994, "b": 258.74969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 123, "label": "text", "bbox": {"l": 466.43579000000005, "t": 253.68451000000005, "r": 482.54831, "b": 258.74969, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "117.44", "bbox": {"l": 466.43579000000005, "t": 253.68451000000005, "r": 482.54831, "b": 258.74969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 124, "label": "text", "bbox": {"l": 514.29065, "t": 253.68451000000005, "r": 530.80981, "b": 258.74969, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "122.41", "bbox": {"l": 514.29065, "t": 253.68451000000005, "r": 530.80981, "b": 258.74969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 125, "label": "text", "bbox": {"l": 306.11493, "t": 261.54822, "r": 322.62866, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "Vested", "bbox": {"l": 306.11493, "t": 261.54822, "r": 322.62866, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 126, "label": "text", "bbox": {"l": 394.43222, "t": 261.54822, "r": 400.73563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "(0.", "bbox": {"l": 394.43222, "t": 261.54822, "r": 400.73563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 127, "label": "text", "bbox": {"l": 400.73456, "t": 261.54822, "r": 403.73697, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "5", "bbox": {"l": 400.73456, "t": 261.54822, "r": 403.73697, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 128, "label": "text", "bbox": {"l": 403.73804, "t": 261.54822, "r": 405.53625, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": ")", "bbox": {"l": 403.73804, "t": 261.54822, "r": 405.53625, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 129, "label": "text", "bbox": {"l": 427.7016, "t": 261.54822, "r": 438.80563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "(0.1)", "bbox": {"l": 427.7016, "t": 261.54822, "r": 438.80563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 130, "label": "text", "bbox": {"l": 468.55533, "t": 261.54822, "r": 482.07043, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "87.08", "bbox": {"l": 468.55533, "t": 261.54822, "r": 482.07043, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 131, "label": "text", "bbox": {"l": 516.01862, "t": 261.54822, "r": 529.53375, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": "81.14", "bbox": {"l": 516.01862, "t": 261.54822, "r": 529.53375, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 132, "label": "text", "bbox": {"l": 306.11493, "t": 269.64148, "r": 356.24771, "b": 274.70667000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 107, "text": "Canceled or forfeited", "bbox": {"l": 306.11493, "t": 269.64148, "r": 356.24771, "b": 274.70667000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 133, "label": "text", "bbox": {"l": 394.43222, "t": 270.31946000000005, "r": 400.73563, "b": 275.38464, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 108, "text": "(0.", "bbox": {"l": 394.43222, "t": 270.31946000000005, "r": 400.73563, "b": 275.38464, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 134, "label": "text", "bbox": {"l": 400.73456, "t": 270.31946000000005, "r": 403.73697, "b": 275.38464, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 109, "text": "1", "bbox": {"l": 400.73456, "t": 270.31946000000005, "r": 403.73697, "b": 275.38464, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 135, "label": "text", "bbox": {"l": 403.73804, "t": 270.31946000000005, "r": 405.53625, "b": 275.38464, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 110, "text": ")", "bbox": {"l": 403.73804, "t": 270.31946000000005, "r": 405.53625, "b": 275.38464, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 136, "label": "text", "bbox": {"l": 431.02802, "t": 270.31946000000005, "r": 436.4280099999999, "b": 275.38464, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 111, "text": "-", "bbox": {"l": 431.02802, "t": 270.31946000000005, "r": 436.4280099999999, "b": 275.38464, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 137, "label": "text", "bbox": {"l": 465.83099000000004, "t": 270.31946000000005, "r": 482.35013, "b": 275.38464, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 112, "text": "102.01", "bbox": {"l": 465.83099000000004, "t": 270.31946000000005, "r": 482.35013, "b": 275.38464, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 138, "label": "text", "bbox": {"l": 516.01862, "t": 270.31946000000005, "r": 529.53375, "b": 275.38464, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 113, "text": "92.18", "bbox": {"l": 516.01862, "t": 270.31946000000005, "r": 529.53375, "b": 275.38464, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 139, "label": "text", "bbox": {"l": 306.11493, "t": 278.48572, "r": 373.35764, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 114, "text": "Nonvested on December 31", "bbox": {"l": 306.11493, "t": 278.48572, "r": 373.35764, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 140, "label": "text", "bbox": {"l": 396.24661, "t": 278.48572, "r": 403.75531, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 115, "text": "1.0", "bbox": {"l": 396.24661, "t": 278.48572, "r": 403.75531, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 141, "label": "text", "bbox": {"l": 429.51599, "t": 278.48572, "r": 437.02469, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 116, "text": "0.3", "bbox": {"l": 429.51599, "t": 278.48572, "r": 437.02469, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 142, "label": "text", "bbox": {"l": 463.7142, "t": 278.48572, "r": 484.73965000000004, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 117, "text": "104.85 $", "bbox": {"l": 463.7142, "t": 278.48572, "r": 484.73965000000004, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 143, "label": "text", "bbox": {"l": 512.99463, "t": 278.48572, "r": 534.02008, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 118, "text": "$ 104.51", "bbox": {"l": 512.99463, "t": 278.48572, "r": 534.02008, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 6, "label": "caption", "bbox": {"l": 50.112, "t": 320.87735, "r": 545.11377, "b": 365.64987, "coord_origin": "TOPLEFT"}, "confidence": 0.9140303134918213, "cells": [{"id": 119, "text": "Figure 5:", "bbox": {"l": 50.112, "t": 320.87735, "r": 86.864021, "b": 329.78391, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "One of the benefits of TableFormer is that it is language agnostic, as an example, the left part of the illustration", "bbox": {"l": 93.917542, "t": 320.87735, "r": 545.11371, "b": 329.78391, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "demonstrates TableFormer predictions on previously unseen language (Japanese). Additionally, we see that TableFormer is", "bbox": {"l": 50.112, "t": 332.83233999999993, "r": 545.11371, "b": 341.73889, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "robust to variability in style and content, right side of the illustration shows the example of the TableFormer prediction from", "bbox": {"l": 50.112, "t": 344.78732, "r": 545.11377, "b": 353.69388, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "the FinTabNet dataset.", "bbox": {"l": 50.112, "t": 356.74332, "r": 139.79532, "b": 365.64987, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "picture", "bbox": {"l": 216.76925659179688, "t": 380.4906311035156, "r": 375.7829284667969, "b": 443.34698486328125, "coord_origin": "TOPLEFT"}, "confidence": 0.805853009223938, "cells": [{"id": 124, "text": "Red - PDF cells, Green - predicted bounding boxes", "bbox": {"l": 220.26282, "t": 381.77722, "r": 342.07819, "b": 386.44281, "coord_origin": "TOPLEFT"}}], "children": [{"id": 144, "label": "text", "bbox": {"l": 220.26282, "t": 381.77722, "r": 342.07819, "b": 386.44281, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 124, "text": "Red - PDF cells, Green - predicted bounding boxes", "bbox": {"l": 220.26282, "t": 381.77722, "r": 342.07819, "b": 386.44281, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 11, "label": "picture", "bbox": {"l": 51.736167907714844, "t": 380.48065185546875, "r": 211.83778381347656, "b": 443.6580810546875, "coord_origin": "TOPLEFT"}, "confidence": 0.8308426737785339, "cells": [{"id": 125, "text": "Ground Truth", "bbox": {"l": 53.715248, "t": 381.77722, "r": 85.657333, "b": 386.44281, "coord_origin": "TOPLEFT"}}], "children": [{"id": 145, "label": "text", "bbox": {"l": 53.715248, "t": 381.77722, "r": 85.657333, "b": 386.44281, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 125, "text": "Ground Truth", "bbox": {"l": 53.715248, "t": 381.77722, "r": 85.657333, "b": 386.44281, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 13, "label": "picture", "bbox": {"l": 383.1364440917969, "t": 381.2313232421875, "r": 542.1132202148438, "b": 442.7749328613281, "coord_origin": "TOPLEFT"}, "confidence": 0.7881615161895752, "cells": [{"id": 126, "text": "16", "bbox": {"l": 437.37939, "t": 400.55295, "r": 443.69870000000003, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "17", "bbox": {"l": 450.33203, "t": 400.55295, "r": 456.6513100000001, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "18", "bbox": {"l": 463.28464, "t": 400.55295, "r": 469.60394, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "19", "bbox": {"l": 476.23724000000004, "t": 400.55295, "r": 482.5565500000001, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "20", "bbox": {"l": 489.18988, "t": 400.55295, "r": 495.50916, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "21", "bbox": {"l": 502.14251999999993, "t": 400.55295, "r": 508.46178999999995, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "22", "bbox": {"l": 515.09509, "t": 400.55295, "r": 521.41443, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "23", "bbox": {"l": 385.2814, "t": 411.03836000000007, "r": 391.60071, "b": 417.35699, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "24", "bbox": {"l": 398.52341, "t": 411.03836000000007, "r": 404.84271, "b": 417.35699, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "25", "bbox": {"l": 411.47604, "t": 411.03836000000007, "r": 417.79535, "b": 417.35699, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "26", "bbox": {"l": 437.37939, "t": 411.03836000000007, "r": 443.69870000000003, "b": 417.35699, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "27", "bbox": {"l": 450.33203, "t": 411.03836000000007, "r": 456.6513100000001, "b": 417.35699, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "28", "bbox": {"l": 463.28464, "t": 411.03836000000007, "r": 469.60394, "b": 417.35699, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "30", "bbox": {"l": 385.2814, "t": 421.0697, "r": 391.60071, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "31", "bbox": {"l": 398.52341, "t": 421.0697, "r": 404.84271, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "32", "bbox": {"l": 411.47604, "t": 421.0697, "r": 417.79532, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "33", "bbox": {"l": 424.42865, "t": 421.0697, "r": 430.74796, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "34", "bbox": {"l": 437.38129, "t": 421.0697, "r": 443.70056, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "35", "bbox": {"l": 450.33389000000005, "t": 421.0697, "r": 456.65319999999997, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "36", "bbox": {"l": 463.2865, "t": 421.0697, "r": 469.6058, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "37", "bbox": {"l": 476.23914, "t": 421.0697, "r": 482.55841, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "38", "bbox": {"l": 489.1917700000001, "t": 421.0697, "r": 495.51105, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "39", "bbox": {"l": 502.14438, "t": 421.0697, "r": 508.46368, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "40", "bbox": {"l": 515.09705, "t": 421.0697, "r": 521.41632, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "41", "bbox": {"l": 528.04962, "t": 421.0697, "r": 534.3689, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "42", "bbox": {"l": 385.2814, "t": 432.04431, "r": 391.60071, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "43", "bbox": {"l": 398.52341, "t": 432.04431, "r": 404.84271, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "44", "bbox": {"l": 411.47604, "t": 432.04431, "r": 417.79532, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "45", "bbox": {"l": 424.42865, "t": 432.04431, "r": 430.74796, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "46", "bbox": {"l": 437.38129, "t": 432.04431, "r": 443.70056, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "47", "bbox": {"l": 450.33389000000005, "t": 432.04431, "r": 456.65319999999997, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "48", "bbox": {"l": 463.2865, "t": 432.04431, "r": 469.6058, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "49", "bbox": {"l": 476.23914, "t": 432.04431, "r": 482.55841, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "50", "bbox": {"l": 489.1917700000001, "t": 432.04431, "r": 495.51105, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "51", "bbox": {"l": 502.14438, "t": 432.04431, "r": 508.46368, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "52", "bbox": {"l": 515.09705, "t": 432.04431, "r": 521.41632, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "53", "bbox": {"l": 528.04962, "t": 432.04431, "r": 534.3689, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "0", "bbox": {"l": 385.2814, "t": 389.20004, "r": 388.44073, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "1", "bbox": {"l": 398.52341, "t": 389.20004, "r": 401.68274, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "2", "bbox": {"l": 411.4754, "t": 389.20004, "r": 414.63474, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "3", "bbox": {"l": 424.4274, "t": 389.20004, "r": 427.58673, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "4", "bbox": {"l": 437.37939, "t": 389.20004, "r": 440.53870000000006, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "5", "bbox": {"l": 450.33136, "t": 389.20004, "r": 453.49069000000003, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "6", "bbox": {"l": 463.28336, "t": 389.20004, "r": 466.44269, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "7", "bbox": {"l": 476.23535, "t": 389.20004, "r": 479.39468, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "8", "bbox": {"l": 489.18735, "t": 389.20004, "r": 492.34668, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "9", "bbox": {"l": 502.13933999999995, "t": 389.20004, "r": 505.29868000000005, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "10", "bbox": {"l": 515.09131, "t": 389.20004, "r": 521.41064, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "11", "bbox": {"l": 528.04364, "t": 389.20004, "r": 534.13104, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "12", "bbox": {"l": 385.2814, "t": 398.97464, "r": 391.60071, "b": 405.29327, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "13", "bbox": {"l": 398.52341, "t": 398.97464, "r": 404.84271, "b": 405.29327, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "14", "bbox": {"l": 411.47604, "t": 398.97464, "r": 417.79535, "b": 405.29327, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "15", "bbox": {"l": 424.42719, "t": 406.77463000000006, "r": 430.74648999999994, "b": 413.09326, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "29", "bbox": {"l": 502.86941999999993, "t": 410.99438, "r": 509.18871999999993, "b": 417.31302, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "Predicted Structure", "bbox": {"l": 384.35437, "t": 381.77722, "r": 430.99261, "b": 386.44281, "coord_origin": "TOPLEFT"}}], "children": [{"id": 146, "label": "text", "bbox": {"l": 437.37939, "t": 400.55295, "r": 443.69870000000003, "b": 406.87158, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 126, "text": "16", "bbox": {"l": 437.37939, "t": 400.55295, "r": 443.69870000000003, "b": 406.87158, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 147, "label": "text", "bbox": {"l": 450.33203, "t": 400.55295, "r": 456.6513100000001, "b": 406.87158, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 127, "text": "17", "bbox": {"l": 450.33203, "t": 400.55295, "r": 456.6513100000001, "b": 406.87158, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 148, "label": "text", "bbox": {"l": 463.28464, "t": 400.55295, "r": 469.60394, "b": 406.87158, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 128, "text": "18", "bbox": {"l": 463.28464, "t": 400.55295, "r": 469.60394, "b": 406.87158, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 149, "label": "text", "bbox": {"l": 476.23724000000004, "t": 400.55295, "r": 482.5565500000001, "b": 406.87158, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 129, "text": "19", "bbox": {"l": 476.23724000000004, "t": 400.55295, "r": 482.5565500000001, "b": 406.87158, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 150, "label": "text", "bbox": {"l": 489.18988, "t": 400.55295, "r": 495.50916, "b": 406.87158, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 130, "text": "20", "bbox": {"l": 489.18988, "t": 400.55295, "r": 495.50916, "b": 406.87158, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 151, "label": "text", "bbox": {"l": 502.14251999999993, "t": 400.55295, "r": 508.46178999999995, "b": 406.87158, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 131, "text": "21", "bbox": {"l": 502.14251999999993, "t": 400.55295, "r": 508.46178999999995, "b": 406.87158, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 152, "label": "text", "bbox": {"l": 515.09509, "t": 400.55295, "r": 521.41443, "b": 406.87158, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 132, "text": "22", "bbox": {"l": 515.09509, "t": 400.55295, "r": 521.41443, "b": 406.87158, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 153, "label": "text", "bbox": {"l": 385.2814, "t": 411.03836000000007, "r": 391.60071, "b": 417.35699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 133, "text": "23", "bbox": {"l": 385.2814, "t": 411.03836000000007, "r": 391.60071, "b": 417.35699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 154, "label": "text", "bbox": {"l": 398.52341, "t": 411.03836000000007, "r": 404.84271, "b": 417.35699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 134, "text": "24", "bbox": {"l": 398.52341, "t": 411.03836000000007, "r": 404.84271, "b": 417.35699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 155, "label": "text", "bbox": {"l": 411.47604, "t": 411.03836000000007, "r": 417.79535, "b": 417.35699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 135, "text": "25", "bbox": {"l": 411.47604, "t": 411.03836000000007, "r": 417.79535, "b": 417.35699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 156, "label": "text", "bbox": {"l": 437.37939, "t": 411.03836000000007, "r": 443.69870000000003, "b": 417.35699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 136, "text": "26", "bbox": {"l": 437.37939, "t": 411.03836000000007, "r": 443.69870000000003, "b": 417.35699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 157, "label": "text", "bbox": {"l": 450.33203, "t": 411.03836000000007, "r": 456.6513100000001, "b": 417.35699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 137, "text": "27", "bbox": {"l": 450.33203, "t": 411.03836000000007, "r": 456.6513100000001, "b": 417.35699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 158, "label": "text", "bbox": {"l": 463.28464, "t": 411.03836000000007, "r": 469.60394, "b": 417.35699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 138, "text": "28", "bbox": {"l": 463.28464, "t": 411.03836000000007, "r": 469.60394, "b": 417.35699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 159, "label": "text", "bbox": {"l": 385.2814, "t": 421.0697, "r": 391.60071, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 139, "text": "30", "bbox": {"l": 385.2814, "t": 421.0697, "r": 391.60071, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 160, "label": "text", "bbox": {"l": 398.52341, "t": 421.0697, "r": 404.84271, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 140, "text": "31", "bbox": {"l": 398.52341, "t": 421.0697, "r": 404.84271, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 161, "label": "text", "bbox": {"l": 411.47604, "t": 421.0697, "r": 417.79532, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 141, "text": "32", "bbox": {"l": 411.47604, "t": 421.0697, "r": 417.79532, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 162, "label": "text", "bbox": {"l": 424.42865, "t": 421.0697, "r": 430.74796, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 142, "text": "33", "bbox": {"l": 424.42865, "t": 421.0697, "r": 430.74796, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 163, "label": "text", "bbox": {"l": 437.38129, "t": 421.0697, "r": 443.70056, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 143, "text": "34", "bbox": {"l": 437.38129, "t": 421.0697, "r": 443.70056, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 164, "label": "text", "bbox": {"l": 450.33389000000005, "t": 421.0697, "r": 456.65319999999997, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 144, "text": "35", "bbox": {"l": 450.33389000000005, "t": 421.0697, "r": 456.65319999999997, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 165, "label": "text", "bbox": {"l": 463.2865, "t": 421.0697, "r": 469.6058, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 145, "text": "36", "bbox": {"l": 463.2865, "t": 421.0697, "r": 469.6058, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 166, "label": "text", "bbox": {"l": 476.23914, "t": 421.0697, "r": 482.55841, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 146, "text": "37", "bbox": {"l": 476.23914, "t": 421.0697, "r": 482.55841, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 167, "label": "text", "bbox": {"l": 489.1917700000001, "t": 421.0697, "r": 495.51105, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 147, "text": "38", "bbox": {"l": 489.1917700000001, "t": 421.0697, "r": 495.51105, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 168, "label": "text", "bbox": {"l": 502.14438, "t": 421.0697, "r": 508.46368, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 148, "text": "39", "bbox": {"l": 502.14438, "t": 421.0697, "r": 508.46368, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 169, "label": "text", "bbox": {"l": 515.09705, "t": 421.0697, "r": 521.41632, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 149, "text": "40", "bbox": {"l": 515.09705, "t": 421.0697, "r": 521.41632, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 170, "label": "text", "bbox": {"l": 528.04962, "t": 421.0697, "r": 534.3689, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 150, "text": "41", "bbox": {"l": 528.04962, "t": 421.0697, "r": 534.3689, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 171, "label": "text", "bbox": {"l": 385.2814, "t": 432.04431, "r": 391.60071, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 151, "text": "42", "bbox": {"l": 385.2814, "t": 432.04431, "r": 391.60071, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 172, "label": "text", "bbox": {"l": 398.52341, "t": 432.04431, "r": 404.84271, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 152, "text": "43", "bbox": {"l": 398.52341, "t": 432.04431, "r": 404.84271, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 173, "label": "text", "bbox": {"l": 411.47604, "t": 432.04431, "r": 417.79532, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 153, "text": "44", "bbox": {"l": 411.47604, "t": 432.04431, "r": 417.79532, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 174, "label": "text", "bbox": {"l": 424.42865, "t": 432.04431, "r": 430.74796, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 154, "text": "45", "bbox": {"l": 424.42865, "t": 432.04431, "r": 430.74796, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 175, "label": "text", "bbox": {"l": 437.38129, "t": 432.04431, "r": 443.70056, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 155, "text": "46", "bbox": {"l": 437.38129, "t": 432.04431, "r": 443.70056, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 176, "label": "text", "bbox": {"l": 450.33389000000005, "t": 432.04431, "r": 456.65319999999997, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 156, "text": "47", "bbox": {"l": 450.33389000000005, "t": 432.04431, "r": 456.65319999999997, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 177, "label": "text", "bbox": {"l": 463.2865, "t": 432.04431, "r": 469.6058, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 157, "text": "48", "bbox": {"l": 463.2865, "t": 432.04431, "r": 469.6058, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 178, "label": "text", "bbox": {"l": 476.23914, "t": 432.04431, "r": 482.55841, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 158, "text": "49", "bbox": {"l": 476.23914, "t": 432.04431, "r": 482.55841, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 179, "label": "text", "bbox": {"l": 489.1917700000001, "t": 432.04431, "r": 495.51105, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 159, "text": "50", "bbox": {"l": 489.1917700000001, "t": 432.04431, "r": 495.51105, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 180, "label": "text", "bbox": {"l": 502.14438, "t": 432.04431, "r": 508.46368, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 160, "text": "51", "bbox": {"l": 502.14438, "t": 432.04431, "r": 508.46368, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 181, "label": "text", "bbox": {"l": 515.09705, "t": 432.04431, "r": 521.41632, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 161, "text": "52", "bbox": {"l": 515.09705, "t": 432.04431, "r": 521.41632, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 182, "label": "text", "bbox": {"l": 528.04962, "t": 432.04431, "r": 534.3689, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 162, "text": "53", "bbox": {"l": 528.04962, "t": 432.04431, "r": 534.3689, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 183, "label": "text", "bbox": {"l": 385.2814, "t": 389.20004, "r": 388.44073, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 163, "text": "0", "bbox": {"l": 385.2814, "t": 389.20004, "r": 388.44073, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 184, "label": "text", "bbox": {"l": 398.52341, "t": 389.20004, "r": 401.68274, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 164, "text": "1", "bbox": {"l": 398.52341, "t": 389.20004, "r": 401.68274, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 185, "label": "text", "bbox": {"l": 411.4754, "t": 389.20004, "r": 414.63474, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 165, "text": "2", "bbox": {"l": 411.4754, "t": 389.20004, "r": 414.63474, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 186, "label": "text", "bbox": {"l": 424.4274, "t": 389.20004, "r": 427.58673, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 166, "text": "3", "bbox": {"l": 424.4274, "t": 389.20004, "r": 427.58673, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 187, "label": "text", "bbox": {"l": 437.37939, "t": 389.20004, "r": 440.53870000000006, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 167, "text": "4", "bbox": {"l": 437.37939, "t": 389.20004, "r": 440.53870000000006, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 188, "label": "text", "bbox": {"l": 450.33136, "t": 389.20004, "r": 453.49069000000003, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 168, "text": "5", "bbox": {"l": 450.33136, "t": 389.20004, "r": 453.49069000000003, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 189, "label": "text", "bbox": {"l": 463.28336, "t": 389.20004, "r": 466.44269, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 169, "text": "6", "bbox": {"l": 463.28336, "t": 389.20004, "r": 466.44269, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 190, "label": "text", "bbox": {"l": 476.23535, "t": 389.20004, "r": 479.39468, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 170, "text": "7", "bbox": {"l": 476.23535, "t": 389.20004, "r": 479.39468, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 191, "label": "text", "bbox": {"l": 489.18735, "t": 389.20004, "r": 492.34668, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 171, "text": "8", "bbox": {"l": 489.18735, "t": 389.20004, "r": 492.34668, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 192, "label": "text", "bbox": {"l": 502.13933999999995, "t": 389.20004, "r": 505.29868000000005, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 172, "text": "9", "bbox": {"l": 502.13933999999995, "t": 389.20004, "r": 505.29868000000005, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 193, "label": "text", "bbox": {"l": 515.09131, "t": 389.20004, "r": 521.41064, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 173, "text": "10", "bbox": {"l": 515.09131, "t": 389.20004, "r": 521.41064, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 194, "label": "text", "bbox": {"l": 528.04364, "t": 389.20004, "r": 534.13104, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 174, "text": "11", "bbox": {"l": 528.04364, "t": 389.20004, "r": 534.13104, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 195, "label": "text", "bbox": {"l": 385.2814, "t": 398.97464, "r": 391.60071, "b": 405.29327, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 175, "text": "12", "bbox": {"l": 385.2814, "t": 398.97464, "r": 391.60071, "b": 405.29327, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 196, "label": "text", "bbox": {"l": 398.52341, "t": 398.97464, "r": 404.84271, "b": 405.29327, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 176, "text": "13", "bbox": {"l": 398.52341, "t": 398.97464, "r": 404.84271, "b": 405.29327, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 197, "label": "text", "bbox": {"l": 411.47604, "t": 398.97464, "r": 417.79535, "b": 405.29327, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 177, "text": "14", "bbox": {"l": 411.47604, "t": 398.97464, "r": 417.79535, "b": 405.29327, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 198, "label": "text", "bbox": {"l": 424.42719, "t": 406.77463000000006, "r": 430.74648999999994, "b": 413.09326, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 178, "text": "15", "bbox": {"l": 424.42719, "t": 406.77463000000006, "r": 430.74648999999994, "b": 413.09326, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 199, "label": "text", "bbox": {"l": 502.86941999999993, "t": 410.99438, "r": 509.18871999999993, "b": 417.31302, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 179, "text": "29", "bbox": {"l": 502.86941999999993, "t": 410.99438, "r": 509.18871999999993, "b": 417.31302, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 200, "label": "text", "bbox": {"l": 384.35437, "t": 381.77722, "r": 430.99261, "b": 386.44281, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 180, "text": "Predicted Structure", "bbox": {"l": 384.35437, "t": 381.77722, "r": 430.99261, "b": 386.44281, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 5, "label": "caption", "bbox": {"l": 62.595001, "t": 458.72836, "r": 532.63049, "b": 467.63492, "coord_origin": "TOPLEFT"}, "confidence": 0.9153602719306946, "cells": [{"id": 181, "text": "Figure 6: An example of TableFormer predictions (bounding boxes and structure) from generated SynthTabNet table.", "bbox": {"l": 62.595001, "t": 458.72836, "r": 532.63049, "b": 467.63492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "section_header", "bbox": {"l": 50.112, "t": 491.39536, "r": 163.7558, "b": 501.24741, "coord_origin": "TOPLEFT"}, "confidence": 0.9561247229576111, "cells": [{"id": 182, "text": "5.5.", "bbox": {"l": 50.112, "t": 491.39536, "r": 64.448898, "b": 501.24741, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "Qualitative Analysis", "bbox": {"l": 74.006828, "t": 491.39536, "r": 163.7558, "b": 501.24741, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 50.112, "t": 536.87337, "r": 286.36511, "b": 713.1519470000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9852361679077148, "cells": [{"id": 184, "text": "We showcase several visualizations for the different", "bbox": {"l": 62.067001, "t": 536.87337, "r": 286.36499, "b": 545.77992, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": "components of our network on various", "bbox": {"l": 50.112, "t": 548.82837, "r": 211.15741, "b": 557.73492, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "\u201ccomplex\u201d", "bbox": {"l": 215.10000999999997, "t": 548.91803, "r": 259.17453, "b": 557.50578, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "tables", "bbox": {"l": 263.12, "t": 548.82837, "r": 286.36273, "b": 557.73492, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": "within datasets presented in this work in Fig. 5 and Fig. 6", "bbox": {"l": 50.112, "t": 560.78337, "r": 286.36505, "b": 569.68993, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "As it is shown, our model is able to predict bounding boxes", "bbox": {"l": 50.112, "t": 572.73837, "r": 286.36508, "b": 581.6449299999999, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "for all table cells, even for the empty ones. Additionally,", "bbox": {"l": 50.112, "t": 584.69337, "r": 286.36508, "b": 593.59993, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "our post-processing techniques can extract the cell content", "bbox": {"l": 50.112, "t": 596.64937, "r": 286.36505, "b": 605.55592, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": "by matching the predicted bounding boxes to the PDF cells", "bbox": {"l": 50.112, "t": 608.60437, "r": 286.36508, "b": 617.51093, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "based on their overlap and spatial proximity. The left part", "bbox": {"l": 50.112, "t": 620.55937, "r": 286.36508, "b": 629.46593, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "of Fig. 5 demonstrates also the adaptability of our method", "bbox": {"l": 50.112, "t": 632.51437, "r": 286.36508, "b": 641.42093, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "to any language, as it can successfully extract Japanese", "bbox": {"l": 50.112, "t": 644.46938, "r": 286.36508, "b": 653.37593, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "text, although the training set contains only English content.", "bbox": {"l": 50.112, "t": 656.42438, "r": 286.36511, "b": 665.33094, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "We provide more visualizations including the intermediate", "bbox": {"l": 50.112, "t": 668.38037, "r": 286.36508, "b": 677.28694, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "steps in the supplementary material. Overall these illustra-", "bbox": {"l": 50.112, "t": 680.33537, "r": 286.36511, "b": 689.24194, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "tions justify the versatility of our method across a diverse", "bbox": {"l": 50.112, "t": 692.290375, "r": 286.36511, "b": 701.196945, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "range of table appearances and content type.", "bbox": {"l": 50.112, "t": 704.245377, "r": 226.88833999999997, "b": 713.1519470000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "section_header", "bbox": {"l": 308.862, "t": 490.70892, "r": 460.84848, "b": 501.45663, "coord_origin": "TOPLEFT"}, "confidence": 0.9436525702476501, "cells": [{"id": 201, "text": "6.", "bbox": {"l": 308.862, "t": 490.70892, "r": 316.07382, "b": 501.45663, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": "Future Work & Conclusion", "bbox": {"l": 325.68954, "t": 490.70892, "r": 460.84848, "b": 501.45663, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 308.862, "t": 512.89337, "r": 545.11517, "b": 653.30592, "coord_origin": "TOPLEFT"}, "confidence": 0.9875594973564148, "cells": [{"id": 203, "text": "In this paper, we presented TableFormer an end-to-end", "bbox": {"l": 320.81699, "t": 512.89337, "r": 545.11505, "b": 521.79993, "coord_origin": "TOPLEFT"}}, {"id": 204, "text": "transformer based approach to predict table structures and", "bbox": {"l": 308.862, "t": 524.84836, "r": 545.11517, "b": 533.75491, "coord_origin": "TOPLEFT"}}, {"id": 205, "text": "bounding boxes of cells from an image. This approach en-", "bbox": {"l": 308.862, "t": 536.80336, "r": 545.11511, "b": 545.70992, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": "ables us to recreate the table structure, and extract the cell", "bbox": {"l": 308.862, "t": 548.75836, "r": 545.11505, "b": 557.6649199999999, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": "content from PDF or OCR by using bounding boxes. Ad-", "bbox": {"l": 308.862, "t": 560.71336, "r": 545.11517, "b": 569.61992, "coord_origin": "TOPLEFT"}}, {"id": 208, "text": "ditionally, it provides the versatility required in real-world", "bbox": {"l": 308.862, "t": 572.66837, "r": 545.11511, "b": 581.57492, "coord_origin": "TOPLEFT"}}, {"id": 209, "text": "scenarios when dealing with various types of PDF docu-", "bbox": {"l": 308.862, "t": 584.62436, "r": 545.11511, "b": 593.53091, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": "ments, and languages.", "bbox": {"l": 308.862, "t": 596.57936, "r": 400.46808, "b": 605.48592, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "Furthermore, our method outper-", "bbox": {"l": 408.37839, "t": 596.57936, "r": 545.11511, "b": 605.48592, "coord_origin": "TOPLEFT"}}, {"id": 212, "text": "forms all state-of-the-arts with a wide margin. Finally, we", "bbox": {"l": 308.862, "t": 608.53436, "r": 545.11505, "b": 617.44092, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "introduce \u201cSynthTabNet\u201d a challenging synthetically gen-", "bbox": {"l": 308.862, "t": 620.48936, "r": 545.11511, "b": 629.3959199999999, "coord_origin": "TOPLEFT"}}, {"id": 214, "text": "erated dataset that reinforces missing characteristics from", "bbox": {"l": 308.862, "t": 632.4443699999999, "r": 545.11505, "b": 641.35092, "coord_origin": "TOPLEFT"}}, {"id": 215, "text": "other datasets.", "bbox": {"l": 308.862, "t": 644.39937, "r": 365.85803, "b": 653.30592, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "section_header", "bbox": {"l": 308.862, "t": 672.09892, "r": 364.40585, "b": 682.84664, "coord_origin": "TOPLEFT"}, "confidence": 0.9442470073699951, "cells": [{"id": 216, "text": "References", "bbox": {"l": 308.862, "t": 672.09892, "r": 364.40585, "b": 682.84664, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "list_item", "bbox": {"l": 313.345, "t": 693.9617920000001, "r": 545.1134, "b": 712.936752, "coord_origin": "TOPLEFT"}, "confidence": 0.8318753838539124, "cells": [{"id": 217, "text": "[1]", "bbox": {"l": 313.345, "t": 693.9617920000001, "r": 323.80792, "b": 701.977753, "coord_origin": "TOPLEFT"}}, {"id": 218, "text": "Nicolas Carion, Francisco Massa, Gabriel Synnaeve, Nicolas", "bbox": {"l": 326.05127, "t": 693.9617920000001, "r": 545.10852, "b": 701.977753, "coord_origin": "TOPLEFT"}}, {"id": 219, "text": "Usunier, Alexander Kirillov, and Sergey Zagoruyko. End-to-", "bbox": {"l": 328.78101, "t": 704.920792, "r": 545.1134, "b": 712.936752, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "page_footer", "bbox": {"l": 295.121, "t": 734.133366, "r": 300.10229, "b": 743.039928, "coord_origin": "TOPLEFT"}, "confidence": 0.8709858059883118, "cells": [{"id": 220, "text": "8", "bbox": {"l": 295.121, "t": 734.133366, "r": 300.10229, "b": 743.039928, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "picture", "bbox": {"l": 305.5836486816406, "t": 98.65415954589844, "r": 554.8258666992188, "b": 180.6267547607422, "coord_origin": "TOPLEFT"}, "confidence": 0.7699173092842102, "cells": [], "children": []}, {"id": 14, "label": "picture", "bbox": {"l": 49.97503662109375, "t": 103.71266174316406, "r": 301.6335754394531, "b": 187.5789337158203, "coord_origin": "TOPLEFT"}, "confidence": 0.7873926162719727, "cells": [], "children": []}]}, "tablestructure": {"table_map": {"8": {"label": "table", "id": 8, "page_no": 7, "cluster": {"id": 8, "label": "table", "bbox": {"l": 53.62853240966797, "t": 218.94857788085938, "r": 298.5574951171875, "b": 292.39996337890625, "coord_origin": "TOPLEFT"}, "confidence": 0.8824009299278259, "cells": [{"id": 6, "text": "\u8ad6\u6587\u30d5\u30a1\u30a4\u30eb", "bbox": {"l": 209.93285, "t": 222.18073000000004, "r": 241.04458999999997, "b": 226.36212, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "\u53c2\u8003\u6587\u732e", "bbox": {"l": 263.76489, "t": 222.18073000000004, "r": 284.50589, "b": 226.36212, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "\u51fa\u5178", "bbox": {"l": 110.24990999999999, "t": 229.66594999999995, "r": 120.62018, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "\u30d5\u30a1\u30a4\u30eb", "bbox": {"l": 175.36609, "t": 229.66594999999995, "r": 196.1071, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "\u6570", "bbox": {"l": 196.10756, "t": 229.66594999999995, "r": 201.29247, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "\u82f1\u8a9e", "bbox": {"l": 209.62408, "t": 229.66594999999995, "r": 219.99435, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "\u65e5\u672c\u8a9e", "bbox": {"l": 229.19814, "t": 229.66594999999995, "r": 244.75377, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "\u82f1\u8a9e", "bbox": {"l": 256.1142, "t": 229.66594999999995, "r": 266.48447, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "\u65e5\u672c\u8a9e", "bbox": {"l": 278.38434, "t": 229.66594999999995, "r": 293.93997, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Association for Computational Linguistics(ACL2003)", "bbox": {"l": 55.53052099999999, "t": 236.42584, "r": 162.7131, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "65", "bbox": {"l": 184.39731, "t": 236.42584, "r": 189.56456, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "65", "bbox": {"l": 208.99026, "t": 236.42584, "r": 214.15752, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "0", "bbox": {"l": 234.87517, "t": 236.42584, "r": 237.45833000000002, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "150", "bbox": {"l": 256.88446, "t": 236.42584, "r": 264.6358, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "0", "bbox": {"l": 284.06134, "t": 236.42584, "r": 286.6445, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Computational Linguistics(COLING2002)", "bbox": {"l": 55.53052099999999, "t": 242.62048000000004, "r": 139.72253, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "140", "bbox": {"l": 183.10536, "t": 242.62048000000004, "r": 190.8567, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "140", "bbox": {"l": 207.69832, "t": 242.62048000000004, "r": 215.44965999999997, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "0", "bbox": {"l": 234.87517, "t": 242.62048000000004, "r": 237.45833000000002, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "150", "bbox": {"l": 256.88446, "t": 242.62048000000004, "r": 264.6358, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "0", "bbox": {"l": 284.06134, "t": 242.62048000000004, "r": 286.6445, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "\u96fb\u6c17\u60c5\u5831\u901a\u4fe1\u5b66\u4f1a", "bbox": {"l": 55.53052099999999, "t": 249.79845999999998, "r": 97.013, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "2003", "bbox": {"l": 92.698288, "t": 249.58942000000002, "r": 103.03371, "b": 253.94732999999997, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "\u5e74\u7dcf\u5408\u5927\u4f1a", "bbox": {"l": 103.03389, "t": 249.79845999999998, "r": 128.96027, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "150", "bbox": {"l": 183.10536, "t": 248.81506000000002, "r": 190.8567, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "8", "bbox": {"l": 210.28223, "t": 248.81506000000002, "r": 212.86539, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "142", "bbox": {"l": 232.29153, "t": 248.81506000000002, "r": 240.04287999999997, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "223", "bbox": {"l": 256.88446, "t": 248.81506000000002, "r": 264.6358, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "147", "bbox": {"l": 281.47742, "t": 248.81506000000002, "r": 289.22876, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "\u60c5\u5831\u51e6\u7406\u5b66\u4f1a\u7b2c", "bbox": {"l": 55.53052099999999, "t": 257.28369, "r": 91.827637, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "65", "bbox": {"l": 88.052673, "t": 257.07465, "r": 93.219925, "b": 261.43255999999997, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "\u56de\u5168\u56fd\u5927\u4f1a", "bbox": {"l": 93.220474, "t": 257.28369, "r": 119.14685, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "(2003)", "bbox": {"l": 116.45073999999998, "t": 257.07465, "r": 129.88177, "b": 261.43255999999997, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "177", "bbox": {"l": 183.10536, "t": 256.30029, "r": 190.8567, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "1", "bbox": {"l": 210.28223, "t": 256.30029, "r": 212.86539, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "176", "bbox": {"l": 232.29153, "t": 256.30029, "r": 240.04287999999997, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "150", "bbox": {"l": 256.88446, "t": 256.30029, "r": 264.6358, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "236", "bbox": {"l": 281.47742, "t": 256.30029, "r": 289.22876, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "\u7b2c", "bbox": {"l": 55.53052099999999, "t": 264.5108, "r": 60.715424, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "17", "bbox": {"l": 60.17654799999999, "t": 264.30175999999994, "r": 65.343796, "b": 268.65967, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "\u56de\u4eba\u5de5\u77e5\u80fd\u5b66\u4f1a\u5168\u56fd\u5927\u4f1a", "bbox": {"l": 65.344376, "t": 264.5108, "r": 122.38297000000001, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "(2003)", "bbox": {"l": 116.45073999999998, "t": 264.30175999999994, "r": 129.88177, "b": 268.65967, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "208", "bbox": {"l": 183.10536, "t": 263.52739999999994, "r": 190.8567, "b": 267.88531, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "5", "bbox": {"l": 210.28223, "t": 263.52739999999994, "r": 212.86539, "b": 267.88531, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "203", "bbox": {"l": 232.29153, "t": 263.52739999999994, "r": 240.04287999999997, "b": 267.88531, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "152", "bbox": {"l": 256.88446, "t": 263.52739999999994, "r": 264.6358, "b": 267.88531, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "244", "bbox": {"l": 281.47742, "t": 263.52739999999994, "r": 289.22876, "b": 267.88531, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "\u81ea\u7136\u8a00\u8a9e\u51e6\u7406\u7814\u7a76\u4f1a\u7b2c", "bbox": {"l": 55.53052099999999, "t": 271.73785, "r": 107.38374, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "146", "bbox": {"l": 101.99034, "t": 271.52881, "r": 109.74168000000002, "b": 275.88671999999997, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "\u301c", "bbox": {"l": 109.74204, "t": 271.73785, "r": 114.92695000000002, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "155", "bbox": {"l": 114.38793, "t": 271.52881, "r": 122.13927, "b": 275.88671999999997, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "\u56de", "bbox": {"l": 122.13963, "t": 271.73785, "r": 127.32454000000001, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "98", "bbox": {"l": 184.39731, "t": 270.75446, "r": 189.56456, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "2", "bbox": {"l": 210.28223, "t": 270.75446, "r": 212.86539, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "96", "bbox": {"l": 233.58348, "t": 270.75446, "r": 238.75072999999998, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "150", "bbox": {"l": 256.88446, "t": 270.75446, "r": 264.6358, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "232", "bbox": {"l": 281.47742, "t": 270.75446, "r": 289.22876, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "WWW", "bbox": {"l": 55.53052099999999, "t": 279.01392, "r": 68.68605, "b": 283.37183, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "\u304b\u3089\u53ce\u96c6\u3057\u305f\u8ad6\u6587", "bbox": {"l": 68.685814, "t": 279.22295999999994, "r": 110.16829999999999, "b": 283.40436, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "107", "bbox": {"l": 183.10536, "t": 277.98157000000003, "r": 190.8567, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "73", "bbox": {"l": 208.99026, "t": 277.98157000000003, "r": 214.15752, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "34", "bbox": {"l": 233.58348, "t": 277.98157000000003, "r": 238.75072999999998, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "147", "bbox": {"l": 256.88446, "t": 277.98157000000003, "r": 264.6358, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "96", "bbox": {"l": 282.76938, "t": 277.98157000000003, "r": 287.93661, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "\u8a08", "bbox": {"l": 169.61508, "t": 286.45004, "r": 174.79999, "b": 290.63141, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "945", "bbox": {"l": 183.10536, "t": 285.46667, "r": 190.8567, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "294", "bbox": {"l": 207.69832, "t": 285.46667, "r": 215.44965999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "651", "bbox": {"l": 232.29153, "t": 285.46667, "r": 240.04287999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "1122", "bbox": {"l": 255.76506, "t": 285.46667, "r": 265.75204, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "955", "bbox": {"l": 281.47742, "t": 285.46667, "r": 289.22876, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}], "children": [{"id": 32, "label": "text", "bbox": {"l": 209.93285, "t": 222.18073000000004, "r": 241.04458999999997, "b": 226.36212, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": "\u8ad6\u6587\u30d5\u30a1\u30a4\u30eb", "bbox": {"l": 209.93285, "t": 222.18073000000004, "r": 241.04458999999997, "b": 226.36212, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 263.76489, "t": 222.18073000000004, "r": 284.50589, "b": 226.36212, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "\u53c2\u8003\u6587\u732e", "bbox": {"l": 263.76489, "t": 222.18073000000004, "r": 284.50589, "b": 226.36212, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 110.24990999999999, "t": 229.66594999999995, "r": 120.62018, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "\u51fa\u5178", "bbox": {"l": 110.24990999999999, "t": 229.66594999999995, "r": 120.62018, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 175.36609, "t": 229.66594999999995, "r": 196.1071, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "\u30d5\u30a1\u30a4\u30eb", "bbox": {"l": 175.36609, "t": 229.66594999999995, "r": 196.1071, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 196.10756, "t": 229.66594999999995, "r": 201.29247, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "\u6570", "bbox": {"l": 196.10756, "t": 229.66594999999995, "r": 201.29247, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 209.62408, "t": 229.66594999999995, "r": 219.99435, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "\u82f1\u8a9e", "bbox": {"l": 209.62408, "t": 229.66594999999995, "r": 219.99435, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 229.19814, "t": 229.66594999999995, "r": 244.75377, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "\u65e5\u672c\u8a9e", "bbox": {"l": 229.19814, "t": 229.66594999999995, "r": 244.75377, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 256.1142, "t": 229.66594999999995, "r": 266.48447, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "\u82f1\u8a9e", "bbox": {"l": 256.1142, "t": 229.66594999999995, "r": 266.48447, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 278.38434, "t": 229.66594999999995, "r": 293.93997, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "\u65e5\u672c\u8a9e", "bbox": {"l": 278.38434, "t": 229.66594999999995, "r": 293.93997, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 55.53052099999999, "t": 236.42584, "r": 162.7131, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "Association for Computational Linguistics(ACL2003)", "bbox": {"l": 55.53052099999999, "t": 236.42584, "r": 162.7131, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 184.39731, "t": 236.42584, "r": 189.56456, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "65", "bbox": {"l": 184.39731, "t": 236.42584, "r": 189.56456, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 208.99026, "t": 236.42584, "r": 214.15752, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "65", "bbox": {"l": 208.99026, "t": 236.42584, "r": 214.15752, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 234.87517, "t": 236.42584, "r": 237.45833000000002, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "0", "bbox": {"l": 234.87517, "t": 236.42584, "r": 237.45833000000002, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 256.88446, "t": 236.42584, "r": 264.6358, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "150", "bbox": {"l": 256.88446, "t": 236.42584, "r": 264.6358, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 284.06134, "t": 236.42584, "r": 286.6445, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "0", "bbox": {"l": 284.06134, "t": 236.42584, "r": 286.6445, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 55.53052099999999, "t": 242.62048000000004, "r": 139.72253, "b": 246.97839, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "Computational Linguistics(COLING2002)", "bbox": {"l": 55.53052099999999, "t": 242.62048000000004, "r": 139.72253, "b": 246.97839, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 183.10536, "t": 242.62048000000004, "r": 190.8567, "b": 246.97839, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "140", "bbox": {"l": 183.10536, "t": 242.62048000000004, "r": 190.8567, "b": 246.97839, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 207.69832, "t": 242.62048000000004, "r": 215.44965999999997, "b": 246.97839, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "140", "bbox": {"l": 207.69832, "t": 242.62048000000004, "r": 215.44965999999997, "b": 246.97839, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 234.87517, "t": 242.62048000000004, "r": 237.45833000000002, "b": 246.97839, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "0", "bbox": {"l": 234.87517, "t": 242.62048000000004, "r": 237.45833000000002, "b": 246.97839, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 256.88446, "t": 242.62048000000004, "r": 264.6358, "b": 246.97839, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "150", "bbox": {"l": 256.88446, "t": 242.62048000000004, "r": 264.6358, "b": 246.97839, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 284.06134, "t": 242.62048000000004, "r": 286.6445, "b": 246.97839, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "0", "bbox": {"l": 284.06134, "t": 242.62048000000004, "r": 286.6445, "b": 246.97839, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 55.53052099999999, "t": 249.79845999999998, "r": 97.013, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "\u96fb\u6c17\u60c5\u5831\u901a\u4fe1\u5b66\u4f1a", "bbox": {"l": 55.53052099999999, "t": 249.79845999999998, "r": 97.013, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 92.698288, "t": 249.58942000000002, "r": 103.03371, "b": 253.94732999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "2003", "bbox": {"l": 92.698288, "t": 249.58942000000002, "r": 103.03371, "b": 253.94732999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 103.03389, "t": 249.79845999999998, "r": 128.96027, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "\u5e74\u7dcf\u5408\u5927\u4f1a", "bbox": {"l": 103.03389, "t": 249.79845999999998, "r": 128.96027, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 183.10536, "t": 248.81506000000002, "r": 190.8567, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "150", "bbox": {"l": 183.10536, "t": 248.81506000000002, "r": 190.8567, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 210.28223, "t": 248.81506000000002, "r": 212.86539, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "8", "bbox": {"l": 210.28223, "t": 248.81506000000002, "r": 212.86539, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 232.29153, "t": 248.81506000000002, "r": 240.04287999999997, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "142", "bbox": {"l": 232.29153, "t": 248.81506000000002, "r": 240.04287999999997, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 256.88446, "t": 248.81506000000002, "r": 264.6358, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "223", "bbox": {"l": 256.88446, "t": 248.81506000000002, "r": 264.6358, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 281.47742, "t": 248.81506000000002, "r": 289.22876, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "147", "bbox": {"l": 281.47742, "t": 248.81506000000002, "r": 289.22876, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 55.53052099999999, "t": 257.28369, "r": 91.827637, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "\u60c5\u5831\u51e6\u7406\u5b66\u4f1a\u7b2c", "bbox": {"l": 55.53052099999999, "t": 257.28369, "r": 91.827637, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 88.052673, "t": 257.07465, "r": 93.219925, "b": 261.43255999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "65", "bbox": {"l": 88.052673, "t": 257.07465, "r": 93.219925, "b": 261.43255999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 93.220474, "t": 257.28369, "r": 119.14685, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "\u56de\u5168\u56fd\u5927\u4f1a", "bbox": {"l": 93.220474, "t": 257.28369, "r": 119.14685, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 116.45073999999998, "t": 257.07465, "r": 129.88177, "b": 261.43255999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "(2003)", "bbox": {"l": 116.45073999999998, "t": 257.07465, "r": 129.88177, "b": 261.43255999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 183.10536, "t": 256.30029, "r": 190.8567, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "177", "bbox": {"l": 183.10536, "t": 256.30029, "r": 190.8567, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 210.28223, "t": 256.30029, "r": 212.86539, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "1", "bbox": {"l": 210.28223, "t": 256.30029, "r": 212.86539, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 232.29153, "t": 256.30029, "r": 240.04287999999997, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "176", "bbox": {"l": 232.29153, "t": 256.30029, "r": 240.04287999999997, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 256.88446, "t": 256.30029, "r": 264.6358, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "150", "bbox": {"l": 256.88446, "t": 256.30029, "r": 264.6358, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 281.47742, "t": 256.30029, "r": 289.22876, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "236", "bbox": {"l": 281.47742, "t": 256.30029, "r": 289.22876, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 55.53052099999999, "t": 264.5108, "r": 60.715424, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "\u7b2c", "bbox": {"l": 55.53052099999999, "t": 264.5108, "r": 60.715424, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 60.17654799999999, "t": 264.30175999999994, "r": 65.343796, "b": 268.65967, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "17", "bbox": {"l": 60.17654799999999, "t": 264.30175999999994, "r": 65.343796, "b": 268.65967, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 65.344376, "t": 264.5108, "r": 122.38297000000001, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "\u56de\u4eba\u5de5\u77e5\u80fd\u5b66\u4f1a\u5168\u56fd\u5927\u4f1a", "bbox": {"l": 65.344376, "t": 264.5108, "r": 122.38297000000001, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 116.45073999999998, "t": 264.30175999999994, "r": 129.88177, "b": 268.65967, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "(2003)", "bbox": {"l": 116.45073999999998, "t": 264.30175999999994, "r": 129.88177, "b": 268.65967, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 183.10536, "t": 263.52739999999994, "r": 190.8567, "b": 267.88531, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "208", "bbox": {"l": 183.10536, "t": 263.52739999999994, "r": 190.8567, "b": 267.88531, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 210.28223, "t": 263.52739999999994, "r": 212.86539, "b": 267.88531, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "5", "bbox": {"l": 210.28223, "t": 263.52739999999994, "r": 212.86539, "b": 267.88531, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 232.29153, "t": 263.52739999999994, "r": 240.04287999999997, "b": 267.88531, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "203", "bbox": {"l": 232.29153, "t": 263.52739999999994, "r": 240.04287999999997, "b": 267.88531, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 256.88446, "t": 263.52739999999994, "r": 264.6358, "b": 267.88531, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "152", "bbox": {"l": 256.88446, "t": 263.52739999999994, "r": 264.6358, "b": 267.88531, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 281.47742, "t": 263.52739999999994, "r": 289.22876, "b": 267.88531, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "244", "bbox": {"l": 281.47742, "t": 263.52739999999994, "r": 289.22876, "b": 267.88531, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 55.53052099999999, "t": 271.73785, "r": 107.38374, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "\u81ea\u7136\u8a00\u8a9e\u51e6\u7406\u7814\u7a76\u4f1a\u7b2c", "bbox": {"l": 55.53052099999999, "t": 271.73785, "r": 107.38374, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 101.99034, "t": 271.52881, "r": 109.74168000000002, "b": 275.88671999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "146", "bbox": {"l": 101.99034, "t": 271.52881, "r": 109.74168000000002, "b": 275.88671999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 109.74204, "t": 271.73785, "r": 114.92695000000002, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "\u301c", "bbox": {"l": 109.74204, "t": 271.73785, "r": 114.92695000000002, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 114.38793, "t": 271.52881, "r": 122.13927, "b": 275.88671999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "155", "bbox": {"l": 114.38793, "t": 271.52881, "r": 122.13927, "b": 275.88671999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 122.13963, "t": 271.73785, "r": 127.32454000000001, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "\u56de", "bbox": {"l": 122.13963, "t": 271.73785, "r": 127.32454000000001, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 184.39731, "t": 270.75446, "r": 189.56456, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "98", "bbox": {"l": 184.39731, "t": 270.75446, "r": 189.56456, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 210.28223, "t": 270.75446, "r": 212.86539, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "2", "bbox": {"l": 210.28223, "t": 270.75446, "r": 212.86539, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 233.58348, "t": 270.75446, "r": 238.75072999999998, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "96", "bbox": {"l": 233.58348, "t": 270.75446, "r": 238.75072999999998, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 256.88446, "t": 270.75446, "r": 264.6358, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "150", "bbox": {"l": 256.88446, "t": 270.75446, "r": 264.6358, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 281.47742, "t": 270.75446, "r": 289.22876, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "232", "bbox": {"l": 281.47742, "t": 270.75446, "r": 289.22876, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 55.53052099999999, "t": 279.01392, "r": 68.68605, "b": 283.37183, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "WWW", "bbox": {"l": 55.53052099999999, "t": 279.01392, "r": 68.68605, "b": 283.37183, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 68.685814, "t": 279.22295999999994, "r": 110.16829999999999, "b": 283.40436, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "\u304b\u3089\u53ce\u96c6\u3057\u305f\u8ad6\u6587", "bbox": {"l": 68.685814, "t": 279.22295999999994, "r": 110.16829999999999, "b": 283.40436, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 183.10536, "t": 277.98157000000003, "r": 190.8567, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "107", "bbox": {"l": 183.10536, "t": 277.98157000000003, "r": 190.8567, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 208.99026, "t": 277.98157000000003, "r": 214.15752, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "73", "bbox": {"l": 208.99026, "t": 277.98157000000003, "r": 214.15752, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 233.58348, "t": 277.98157000000003, "r": 238.75072999999998, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "34", "bbox": {"l": 233.58348, "t": 277.98157000000003, "r": 238.75072999999998, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 256.88446, "t": 277.98157000000003, "r": 264.6358, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "147", "bbox": {"l": 256.88446, "t": 277.98157000000003, "r": 264.6358, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 282.76938, "t": 277.98157000000003, "r": 287.93661, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "96", "bbox": {"l": 282.76938, "t": 277.98157000000003, "r": 287.93661, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 169.61508, "t": 286.45004, "r": 174.79999, "b": 290.63141, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "\u8a08", "bbox": {"l": 169.61508, "t": 286.45004, "r": 174.79999, "b": 290.63141, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 183.10536, "t": 285.46667, "r": 190.8567, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "945", "bbox": {"l": 183.10536, "t": 285.46667, "r": 190.8567, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 207.69832, "t": 285.46667, "r": 215.44965999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "294", "bbox": {"l": 207.69832, "t": 285.46667, "r": 215.44965999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 232.29153, "t": 285.46667, "r": 240.04287999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "651", "bbox": {"l": 232.29153, "t": 285.46667, "r": 240.04287999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 255.76506, "t": 285.46667, "r": 265.75204, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "1122", "bbox": {"l": 255.76506, "t": 285.46667, "r": 265.75204, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 281.47742, "t": 285.46667, "r": 289.22876, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "955", "bbox": {"l": 281.47742, "t": 285.46667, "r": 289.22876, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "lcel", "ched", "lcel", "nl", "ched", "ched", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 10, "num_cols": 6, "table_cells": [{"bbox": {"l": 209.93285, "t": 222.18073000000004, "r": 241.04458999999997, "b": 226.36212, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 4, "text": "\u8ad6\u6587\u30d5\u30a1\u30a4\u30eb", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 263.76489, "t": 222.18073000000004, "r": 284.50589, "b": 226.36212, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 4, "end_col_offset_idx": 6, "text": "\u53c2\u8003\u6587\u732e", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 110.24990999999999, "t": 229.66594999999995, "r": 120.62018, "b": 233.84735, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "\u51fa\u5178", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 175.36609, "t": 229.66594999999995, "r": 201.29247, "b": 233.84735, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "\u30d5\u30a1\u30a4\u30eb \u6570", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 209.62408, "t": 229.66594999999995, "r": 219.99435, "b": 233.84735, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "\u82f1\u8a9e", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 229.19814, "t": 229.66594999999995, "r": 244.75377, "b": 233.84735, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "\u65e5\u672c\u8a9e", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 256.1142, "t": 229.66594999999995, "r": 266.48447, "b": 233.84735, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "\u82f1\u8a9e", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 278.38434, "t": 229.66594999999995, "r": 293.93997, "b": 233.84735, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "\u65e5\u672c\u8a9e", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 55.53052099999999, "t": 236.42584, "r": 162.7131, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Association for Computational Linguistics(ACL2003)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 184.39731, "t": 236.42584, "r": 189.56456, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "65", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 208.99026, "t": 236.42584, "r": 214.15752, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "65", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 234.87517, "t": 236.42584, "r": 237.45833000000002, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446, "t": 236.42584, "r": 264.6358, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "150", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 284.06134, "t": 236.42584, "r": 286.6445, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 55.53052099999999, "t": 242.62048000000004, "r": 139.72253, "b": 246.97839, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Computational Linguistics(COLING2002)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 183.10536, "t": 242.62048000000004, "r": 190.8567, "b": 246.97839, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "140", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 207.69832, "t": 242.62048000000004, "r": 215.44965999999997, "b": 246.97839, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "140", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 234.87517, "t": 242.62048000000004, "r": 237.45833000000002, "b": 246.97839, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446, "t": 242.62048000000004, "r": 264.6358, "b": 246.97839, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "150", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 284.06134, "t": 242.62048000000004, "r": 286.6445, "b": 246.97839, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 55.53052099999999, "t": 249.58942000000002, "r": 128.96027, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "\u96fb\u6c17\u60c5\u5831\u901a\u4fe1\u5b66\u4f1a 2003 \u5e74\u7dcf\u5408\u5927\u4f1a", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 183.10536, "t": 248.81506000000002, "r": 190.8567, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "150", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 210.28223, "t": 248.81506000000002, "r": 212.86539, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.29153, "t": 248.81506000000002, "r": 240.04287999999997, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "142", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446, "t": 248.81506000000002, "r": 264.6358, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "223", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.47742, "t": 248.81506000000002, "r": 289.22876, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "147", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 55.53052099999999, "t": 257.07465, "r": 129.88177, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "\u60c5\u5831\u51e6\u7406\u5b66\u4f1a\u7b2c 65 \u56de\u5168\u56fd\u5927\u4f1a (2003)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 183.10536, "t": 256.30029, "r": 190.8567, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "177", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 210.28223, "t": 256.30029, "r": 212.86539, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.29153, "t": 256.30029, "r": 240.04287999999997, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "176", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446, "t": 256.30029, "r": 264.6358, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "150", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.47742, "t": 256.30029, "r": 289.22876, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "236", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 55.53052099999999, "t": 264.30175999999994, "r": 129.88177, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "\u7b2c 17 \u56de\u4eba\u5de5\u77e5\u80fd\u5b66\u4f1a\u5168\u56fd\u5927\u4f1a (2003)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 183.10536, "t": 263.52739999999994, "r": 190.8567, "b": 267.88531, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "208", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 210.28223, "t": 263.52739999999994, "r": 212.86539, "b": 267.88531, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.29153, "t": 263.52739999999994, "r": 240.04287999999997, "b": 267.88531, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "203", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446, "t": 263.52739999999994, "r": 264.6358, "b": 267.88531, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "152", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.47742, "t": 263.52739999999994, "r": 289.22876, "b": 267.88531, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "244", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 55.53052099999999, "t": 271.52881, "r": 127.32454000000001, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "\u81ea\u7136\u8a00\u8a9e\u51e6\u7406\u7814\u7a76\u4f1a\u7b2c 146 \u301c 155 \u56de", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 184.39731, "t": 270.75446, "r": 189.56456, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "98", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 210.28223, "t": 270.75446, "r": 212.86539, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 233.58348, "t": 270.75446, "r": 238.75072999999998, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446, "t": 270.75446, "r": 264.6358, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "150", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.47742, "t": 270.75446, "r": 289.22876, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "232", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 55.53052099999999, "t": 279.01392, "r": 110.16829999999999, "b": 283.40436, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "WWW \u304b\u3089\u53ce\u96c6\u3057\u305f\u8ad6\u6587", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 183.10536, "t": 277.98157000000003, "r": 190.8567, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "107", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 208.99026, "t": 277.98157000000003, "r": 214.15752, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "73", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 233.58348, "t": 277.98157000000003, "r": 238.75072999999998, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "34", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446, "t": 277.98157000000003, "r": 264.6358, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "147", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 282.76938, "t": 277.98157000000003, "r": 287.93661, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 183.10536, "t": 285.46667, "r": 190.8567, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "945", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 207.69832, "t": 285.46667, "r": 215.44965999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "294", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.29153, "t": 285.46667, "r": 240.04287999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "651", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 255.76506, "t": 285.46667, "r": 265.75204, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "1122", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.47742, "t": 285.46667, "r": 289.22876, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "955", "column_header": false, "row_header": false, "row_section": false}]}, "7": {"label": "table", "id": 7, "page_no": 7, "cluster": {"id": 7, "label": "table", "bbox": {"l": 304.9219970703125, "t": 218.51486206054688, "r": 550.2321166992188, "b": 287.90069580078125, "coord_origin": "TOPLEFT"}, "confidence": 0.8899767994880676, "cells": [{"id": 77, "text": "Weighted Average Grant Date Fair", "bbox": {"l": 459.04861, "t": 221.62415, "r": 542.00018, "b": 226.68933000000004, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "Value", "bbox": {"l": 493.82193, "t": 227.83416999999997, "r": 507.2258, "b": 232.89935000000003, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "RS", "bbox": {"l": 393.2442, "t": 236.74712999999997, "r": 400.74588, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "U", "bbox": {"l": 400.74643, "t": 236.74712999999997, "r": 404.64523, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "s", "bbox": {"l": 404.6463, "t": 236.74712999999997, "r": 407.34631, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "Shares (in millions)", "bbox": {"l": 392.09671, "t": 221.57446000000004, "r": 438.0145, "b": 226.63964999999996, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "PSUs", "bbox": {"l": 427.18323, "t": 236.74712999999997, "r": 440.98778999999996, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "RSUs", "bbox": {"l": 468.38254, "t": 236.74712999999997, "r": 482.48465000000004, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "PSUs", "bbox": {"l": 516.92578, "t": 236.74712999999997, "r": 530.73035, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Nonvested on Janua", "bbox": {"l": 306.11493, "t": 244.61084000000005, "r": 355.6532, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "ry 1", "bbox": {"l": 355.65427, "t": 244.61084000000005, "r": 364.65607, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "1.", "bbox": {"l": 396.24661, "t": 244.91327, "r": 400.75238, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "1", "bbox": {"l": 400.7529, "t": 244.91327, "r": 403.75531, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "0.3", "bbox": {"l": 429.81838999999997, "t": 244.91327, "r": 437.32708999999994, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "90.10", "bbox": {"l": 465.52859, "t": 244.91327, "r": 478.40103, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "$", "bbox": {"l": 480.97552, "t": 244.91327, "r": 483.55001999999996, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "$ 91.19", "bbox": {"l": 513.44824, "t": 244.91327, "r": 531.46967, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "Granted", "bbox": {"l": 306.11493, "t": 253.68451000000005, "r": 325.62674, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "0.", "bbox": {"l": 396.24661, "t": 253.68451000000005, "r": 400.75238, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "5", "bbox": {"l": 400.7529, "t": 253.68451000000005, "r": 403.75531, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "0.1", "bbox": {"l": 429.81838999999997, "t": 253.68451000000005, "r": 437.32708999999994, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "117.44", "bbox": {"l": 466.43579000000005, "t": 253.68451000000005, "r": 482.54831, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "122.41", "bbox": {"l": 514.29065, "t": 253.68451000000005, "r": 530.80981, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "Vested", "bbox": {"l": 306.11493, "t": 261.54822, "r": 322.62866, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "(0.", "bbox": {"l": 394.43222, "t": 261.54822, "r": 400.73563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "5", "bbox": {"l": 400.73456, "t": 261.54822, "r": 403.73697, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": ")", "bbox": {"l": 403.73804, "t": 261.54822, "r": 405.53625, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "(0.1)", "bbox": {"l": 427.7016, "t": 261.54822, "r": 438.80563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "87.08", "bbox": {"l": 468.55533, "t": 261.54822, "r": 482.07043, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "81.14", "bbox": {"l": 516.01862, "t": 261.54822, "r": 529.53375, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "Canceled or forfeited", "bbox": {"l": 306.11493, "t": 269.64148, "r": 356.24771, "b": 274.70667000000003, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "(0.", "bbox": {"l": 394.43222, "t": 270.31946000000005, "r": 400.73563, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "1", "bbox": {"l": 400.73456, "t": 270.31946000000005, "r": 403.73697, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": ")", "bbox": {"l": 403.73804, "t": 270.31946000000005, "r": 405.53625, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "-", "bbox": {"l": 431.02802, "t": 270.31946000000005, "r": 436.4280099999999, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "102.01", "bbox": {"l": 465.83099000000004, "t": 270.31946000000005, "r": 482.35013, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "92.18", "bbox": {"l": 516.01862, "t": 270.31946000000005, "r": 529.53375, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "Nonvested on December 31", "bbox": {"l": 306.11493, "t": 278.48572, "r": 373.35764, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "1.0", "bbox": {"l": 396.24661, "t": 278.48572, "r": 403.75531, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "0.3", "bbox": {"l": 429.51599, "t": 278.48572, "r": 437.02469, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "104.85 $", "bbox": {"l": 463.7142, "t": 278.48572, "r": 484.73965000000004, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "$ 104.51", "bbox": {"l": 512.99463, "t": 278.48572, "r": 534.02008, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}], "children": [{"id": 102, "label": "text", "bbox": {"l": 459.04861, "t": 221.62415, "r": 542.00018, "b": 226.68933000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "Weighted Average Grant Date Fair", "bbox": {"l": 459.04861, "t": 221.62415, "r": 542.00018, "b": 226.68933000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 493.82193, "t": 227.83416999999997, "r": 507.2258, "b": 232.89935000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "Value", "bbox": {"l": 493.82193, "t": 227.83416999999997, "r": 507.2258, "b": 232.89935000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 393.2442, "t": 236.74712999999997, "r": 400.74588, "b": 241.81232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "RS", "bbox": {"l": 393.2442, "t": 236.74712999999997, "r": 400.74588, "b": 241.81232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 400.74643, "t": 236.74712999999997, "r": 404.64523, "b": 241.81232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "U", "bbox": {"l": 400.74643, "t": 236.74712999999997, "r": 404.64523, "b": 241.81232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 404.6463, "t": 236.74712999999997, "r": 407.34631, "b": 241.81232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "s", "bbox": {"l": 404.6463, "t": 236.74712999999997, "r": 407.34631, "b": 241.81232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 392.09671, "t": 221.57446000000004, "r": 438.0145, "b": 226.63964999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "Shares (in millions)", "bbox": {"l": 392.09671, "t": 221.57446000000004, "r": 438.0145, "b": 226.63964999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 427.18323, "t": 236.74712999999997, "r": 440.98778999999996, "b": 241.81232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "PSUs", "bbox": {"l": 427.18323, "t": 236.74712999999997, "r": 440.98778999999996, "b": 241.81232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 468.38254, "t": 236.74712999999997, "r": 482.48465000000004, "b": 241.81232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "RSUs", "bbox": {"l": 468.38254, "t": 236.74712999999997, "r": 482.48465000000004, "b": 241.81232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 516.92578, "t": 236.74712999999997, "r": 530.73035, "b": 241.81232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "PSUs", "bbox": {"l": 516.92578, "t": 236.74712999999997, "r": 530.73035, "b": 241.81232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 306.11493, "t": 244.61084000000005, "r": 355.6532, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "Nonvested on Janua", "bbox": {"l": 306.11493, "t": 244.61084000000005, "r": 355.6532, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 355.65427, "t": 244.61084000000005, "r": 364.65607, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "ry 1", "bbox": {"l": 355.65427, "t": 244.61084000000005, "r": 364.65607, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 396.24661, "t": 244.91327, "r": 400.75238, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "1.", "bbox": {"l": 396.24661, "t": 244.91327, "r": 400.75238, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 114, "label": "text", "bbox": {"l": 400.7529, "t": 244.91327, "r": 403.75531, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "1", "bbox": {"l": 400.7529, "t": 244.91327, "r": 403.75531, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 115, "label": "text", "bbox": {"l": 429.81838999999997, "t": 244.91327, "r": 437.32708999999994, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "0.3", "bbox": {"l": 429.81838999999997, "t": 244.91327, "r": 437.32708999999994, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 116, "label": "text", "bbox": {"l": 465.52859, "t": 244.91327, "r": 478.40103, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "90.10", "bbox": {"l": 465.52859, "t": 244.91327, "r": 478.40103, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 117, "label": "text", "bbox": {"l": 480.97552, "t": 244.91327, "r": 483.55001999999996, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "$", "bbox": {"l": 480.97552, "t": 244.91327, "r": 483.55001999999996, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 118, "label": "text", "bbox": {"l": 513.44824, "t": 244.91327, "r": 531.46967, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "$ 91.19", "bbox": {"l": 513.44824, "t": 244.91327, "r": 531.46967, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 119, "label": "text", "bbox": {"l": 306.11493, "t": 253.68451000000005, "r": 325.62674, "b": 258.74969, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "Granted", "bbox": {"l": 306.11493, "t": 253.68451000000005, "r": 325.62674, "b": 258.74969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 120, "label": "text", "bbox": {"l": 396.24661, "t": 253.68451000000005, "r": 400.75238, "b": 258.74969, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "0.", "bbox": {"l": 396.24661, "t": 253.68451000000005, "r": 400.75238, "b": 258.74969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 121, "label": "text", "bbox": {"l": 400.7529, "t": 253.68451000000005, "r": 403.75531, "b": 258.74969, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "5", "bbox": {"l": 400.7529, "t": 253.68451000000005, "r": 403.75531, "b": 258.74969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 122, "label": "text", "bbox": {"l": 429.81838999999997, "t": 253.68451000000005, "r": 437.32708999999994, "b": 258.74969, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "0.1", "bbox": {"l": 429.81838999999997, "t": 253.68451000000005, "r": 437.32708999999994, "b": 258.74969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 123, "label": "text", "bbox": {"l": 466.43579000000005, "t": 253.68451000000005, "r": 482.54831, "b": 258.74969, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "117.44", "bbox": {"l": 466.43579000000005, "t": 253.68451000000005, "r": 482.54831, "b": 258.74969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 124, "label": "text", "bbox": {"l": 514.29065, "t": 253.68451000000005, "r": 530.80981, "b": 258.74969, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "122.41", "bbox": {"l": 514.29065, "t": 253.68451000000005, "r": 530.80981, "b": 258.74969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 125, "label": "text", "bbox": {"l": 306.11493, "t": 261.54822, "r": 322.62866, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "Vested", "bbox": {"l": 306.11493, "t": 261.54822, "r": 322.62866, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 126, "label": "text", "bbox": {"l": 394.43222, "t": 261.54822, "r": 400.73563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "(0.", "bbox": {"l": 394.43222, "t": 261.54822, "r": 400.73563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 127, "label": "text", "bbox": {"l": 400.73456, "t": 261.54822, "r": 403.73697, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "5", "bbox": {"l": 400.73456, "t": 261.54822, "r": 403.73697, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 128, "label": "text", "bbox": {"l": 403.73804, "t": 261.54822, "r": 405.53625, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": ")", "bbox": {"l": 403.73804, "t": 261.54822, "r": 405.53625, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 129, "label": "text", "bbox": {"l": 427.7016, "t": 261.54822, "r": 438.80563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "(0.1)", "bbox": {"l": 427.7016, "t": 261.54822, "r": 438.80563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 130, "label": "text", "bbox": {"l": 468.55533, "t": 261.54822, "r": 482.07043, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "87.08", "bbox": {"l": 468.55533, "t": 261.54822, "r": 482.07043, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 131, "label": "text", "bbox": {"l": 516.01862, "t": 261.54822, "r": 529.53375, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": "81.14", "bbox": {"l": 516.01862, "t": 261.54822, "r": 529.53375, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 132, "label": "text", "bbox": {"l": 306.11493, "t": 269.64148, "r": 356.24771, "b": 274.70667000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 107, "text": "Canceled or forfeited", "bbox": {"l": 306.11493, "t": 269.64148, "r": 356.24771, "b": 274.70667000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 133, "label": "text", "bbox": {"l": 394.43222, "t": 270.31946000000005, "r": 400.73563, "b": 275.38464, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 108, "text": "(0.", "bbox": {"l": 394.43222, "t": 270.31946000000005, "r": 400.73563, "b": 275.38464, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 134, "label": "text", "bbox": {"l": 400.73456, "t": 270.31946000000005, "r": 403.73697, "b": 275.38464, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 109, "text": "1", "bbox": {"l": 400.73456, "t": 270.31946000000005, "r": 403.73697, "b": 275.38464, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 135, "label": "text", "bbox": {"l": 403.73804, "t": 270.31946000000005, "r": 405.53625, "b": 275.38464, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 110, "text": ")", "bbox": {"l": 403.73804, "t": 270.31946000000005, "r": 405.53625, "b": 275.38464, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 136, "label": "text", "bbox": {"l": 431.02802, "t": 270.31946000000005, "r": 436.4280099999999, "b": 275.38464, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 111, "text": "-", "bbox": {"l": 431.02802, "t": 270.31946000000005, "r": 436.4280099999999, "b": 275.38464, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 137, "label": "text", "bbox": {"l": 465.83099000000004, "t": 270.31946000000005, "r": 482.35013, "b": 275.38464, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 112, "text": "102.01", "bbox": {"l": 465.83099000000004, "t": 270.31946000000005, "r": 482.35013, "b": 275.38464, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 138, "label": "text", "bbox": {"l": 516.01862, "t": 270.31946000000005, "r": 529.53375, "b": 275.38464, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 113, "text": "92.18", "bbox": {"l": 516.01862, "t": 270.31946000000005, "r": 529.53375, "b": 275.38464, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 139, "label": "text", "bbox": {"l": 306.11493, "t": 278.48572, "r": 373.35764, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 114, "text": "Nonvested on December 31", "bbox": {"l": 306.11493, "t": 278.48572, "r": 373.35764, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 140, "label": "text", "bbox": {"l": 396.24661, "t": 278.48572, "r": 403.75531, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 115, "text": "1.0", "bbox": {"l": 396.24661, "t": 278.48572, "r": 403.75531, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 141, "label": "text", "bbox": {"l": 429.51599, "t": 278.48572, "r": 437.02469, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 116, "text": "0.3", "bbox": {"l": 429.51599, "t": 278.48572, "r": 437.02469, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 142, "label": "text", "bbox": {"l": 463.7142, "t": 278.48572, "r": 484.73965000000004, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 117, "text": "104.85 $", "bbox": {"l": 463.7142, "t": 278.48572, "r": 484.73965000000004, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 143, "label": "text", "bbox": {"l": 512.99463, "t": 278.48572, "r": 534.02008, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 118, "text": "$ 104.51", "bbox": {"l": 512.99463, "t": 278.48572, "r": 534.02008, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ecel", "ched", "lcel", "ched", "lcel", "nl", "ecel", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 7, "num_cols": 5, "table_cells": [{"bbox": {"l": 459.04861, "t": 221.62415, "r": 542.00018, "b": 232.89935000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 5, "text": "Weighted Average Grant Date Fair Value", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 393.2442, "t": 236.74712999999997, "r": 407.34631, "b": 241.81232, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "RS U s", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 392.09671, "t": 221.57446000000004, "r": 438.0145, "b": 226.63964999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 3, "text": "Shares (in millions)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 427.18323, "t": 236.74712999999997, "r": 440.98778999999996, "b": 241.81232, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "PSUs", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 468.38254, "t": 236.74712999999997, "r": 482.48465000000004, "b": 241.81232, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "RSUs", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 516.92578, "t": 236.74712999999997, "r": 530.73035, "b": 241.81232, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "PSUs", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 306.11493, "t": 244.61084000000005, "r": 364.65607, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Nonvested on Janua ry 1", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 396.24661, "t": 244.91327, "r": 403.75531, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "1. 1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 429.81838999999997, "t": 244.91327, "r": 437.32708999999994, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 465.52859, "t": 244.91327, "r": 483.55001999999996, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "90.10 $", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 513.44824, "t": 244.91327, "r": 531.46967, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "$ 91.19", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 306.11493, "t": 253.68451000000005, "r": 325.62674, "b": 258.74969, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Granted", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 396.24661, "t": 253.68451000000005, "r": 403.75531, "b": 258.74969, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "0. 5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 429.81838999999997, "t": 253.68451000000005, "r": 437.32708999999994, "b": 258.74969, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 466.43579000000005, "t": 253.68451000000005, "r": 482.54831, "b": 258.74969, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "117.44", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 514.29065, "t": 253.68451000000005, "r": 530.80981, "b": 258.74969, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "122.41", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 306.11493, "t": 261.54822, "r": 322.62866, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Vested", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 394.43222, "t": 261.54822, "r": 405.53625, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "(0. 5 )", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 427.7016, "t": 261.54822, "r": 438.80563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "(0.1)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 468.55533, "t": 261.54822, "r": 482.07043, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "87.08", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 516.01862, "t": 261.54822, "r": 529.53375, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "81.14", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 306.11493, "t": 269.64148, "r": 356.24771, "b": 274.70667000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Canceled or forfeited", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 394.43222, "t": 270.31946000000005, "r": 405.53625, "b": 275.38464, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "(0. 1 )", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 431.02802, "t": 270.31946000000005, "r": 436.4280099999999, "b": 275.38464, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 465.83099000000004, "t": 270.31946000000005, "r": 482.35013, "b": 275.38464, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "102.01", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 516.01862, "t": 270.31946000000005, "r": 529.53375, "b": 275.38464, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "92.18", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 306.11493, "t": 278.48572, "r": 373.35764, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Nonvested on December 31", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 396.24661, "t": 278.48572, "r": 403.75531, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "1.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 429.51599, "t": 278.48572, "r": 437.02469, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 463.7142, "t": 278.48572, "r": 484.73965000000004, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "104.85 $", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 512.99463, "t": 278.48572, "r": 534.02008, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "$ 104.51", "column_header": false, "row_header": false, "row_section": false}]}}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "caption", "id": 18, "page_no": 7, "cluster": {"id": 18, "label": "caption", "bbox": {"l": 53.811783000000005, "t": 208.23328000000004, "r": 385.93451, "b": 216.10645, "coord_origin": "TOPLEFT"}, "confidence": 0.5986505746841431, "cells": [{"id": 0, "text": "b.", "bbox": {"l": 53.811783000000005, "t": 208.23328000000004, "r": 62.219952, "b": 216.10645, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Structure predicted by TableFormer, with superimposed matched PDF cell text:", "bbox": {"l": 66.424026, "t": 208.23328000000004, "r": 385.93451, "b": 216.10645, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "b. Structure predicted by TableFormer, with superimposed matched PDF cell text:"}, {"label": "section_header", "id": 29, "page_no": 7, "cluster": {"id": 29, "label": "section_header", "bbox": {"l": 53.811783000000005, "t": 94.28112999999996, "r": 284.34592, "b": 102.15430000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.46452972292900085, "cells": [{"id": 2, "text": "Japanese language (previously unseen by TableFormer):", "bbox": {"l": 53.811783000000005, "t": 94.28112999999996, "r": 284.34592, "b": 102.15430000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Japanese language (previously unseen by TableFormer):"}, {"label": "section_header", "id": 31, "page_no": 7, "cluster": {"id": 31, "label": "section_header", "bbox": {"l": 304.83081, "t": 94.28112999999996, "r": 431.09119, "b": 102.15430000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.4629225730895996, "cells": [{"id": 3, "text": "Example table from FinTabNet:", "bbox": {"l": 304.83081, "t": 94.28112999999996, "r": 431.09119, "b": 102.15430000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Example table from FinTabNet:"}, {"label": "list_item", "id": 20, "page_no": 7, "cluster": {"id": 20, "label": "list_item", "bbox": {"l": 53.286037, "t": 78.68756000000008, "r": 61.550289, "b": 86.56073000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.5820134282112122, "cells": [{"id": 4, "text": "a.", "bbox": {"l": 53.286037, "t": 78.68756000000008, "r": 61.550289, "b": 86.56073000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "a."}, {"label": "list_item", "id": 21, "page_no": 7, "cluster": {"id": 21, "label": "list_item", "bbox": {"l": 65.682419, "t": 78.68756000000008, "r": 499.55563, "b": 86.56073000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.541211724281311, "cells": [{"id": 5, "text": "Red - PDF cells, Green - predicted bounding boxes, Blue - post-processed predictions matched to PDF cells", "bbox": {"l": 65.682419, "t": 78.68756000000008, "r": 499.55563, "b": 86.56073000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Red - PDF cells, Green - predicted bounding boxes, Blue - post-processed predictions matched to PDF cells"}, {"label": "table", "id": 8, "page_no": 7, "cluster": {"id": 8, "label": "table", "bbox": {"l": 53.62853240966797, "t": 218.94857788085938, "r": 298.5574951171875, "b": 292.39996337890625, "coord_origin": "TOPLEFT"}, "confidence": 0.8824009299278259, "cells": [{"id": 6, "text": "\u8ad6\u6587\u30d5\u30a1\u30a4\u30eb", "bbox": {"l": 209.93285, "t": 222.18073000000004, "r": 241.04458999999997, "b": 226.36212, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "\u53c2\u8003\u6587\u732e", "bbox": {"l": 263.76489, "t": 222.18073000000004, "r": 284.50589, "b": 226.36212, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "\u51fa\u5178", "bbox": {"l": 110.24990999999999, "t": 229.66594999999995, "r": 120.62018, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "\u30d5\u30a1\u30a4\u30eb", "bbox": {"l": 175.36609, "t": 229.66594999999995, "r": 196.1071, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "\u6570", "bbox": {"l": 196.10756, "t": 229.66594999999995, "r": 201.29247, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "\u82f1\u8a9e", "bbox": {"l": 209.62408, "t": 229.66594999999995, "r": 219.99435, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "\u65e5\u672c\u8a9e", "bbox": {"l": 229.19814, "t": 229.66594999999995, "r": 244.75377, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "\u82f1\u8a9e", "bbox": {"l": 256.1142, "t": 229.66594999999995, "r": 266.48447, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "\u65e5\u672c\u8a9e", "bbox": {"l": 278.38434, "t": 229.66594999999995, "r": 293.93997, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Association for Computational Linguistics(ACL2003)", "bbox": {"l": 55.53052099999999, "t": 236.42584, "r": 162.7131, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "65", "bbox": {"l": 184.39731, "t": 236.42584, "r": 189.56456, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "65", "bbox": {"l": 208.99026, "t": 236.42584, "r": 214.15752, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "0", "bbox": {"l": 234.87517, "t": 236.42584, "r": 237.45833000000002, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "150", "bbox": {"l": 256.88446, "t": 236.42584, "r": 264.6358, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "0", "bbox": {"l": 284.06134, "t": 236.42584, "r": 286.6445, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Computational Linguistics(COLING2002)", "bbox": {"l": 55.53052099999999, "t": 242.62048000000004, "r": 139.72253, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "140", "bbox": {"l": 183.10536, "t": 242.62048000000004, "r": 190.8567, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "140", "bbox": {"l": 207.69832, "t": 242.62048000000004, "r": 215.44965999999997, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "0", "bbox": {"l": 234.87517, "t": 242.62048000000004, "r": 237.45833000000002, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "150", "bbox": {"l": 256.88446, "t": 242.62048000000004, "r": 264.6358, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "0", "bbox": {"l": 284.06134, "t": 242.62048000000004, "r": 286.6445, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "\u96fb\u6c17\u60c5\u5831\u901a\u4fe1\u5b66\u4f1a", "bbox": {"l": 55.53052099999999, "t": 249.79845999999998, "r": 97.013, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "2003", "bbox": {"l": 92.698288, "t": 249.58942000000002, "r": 103.03371, "b": 253.94732999999997, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "\u5e74\u7dcf\u5408\u5927\u4f1a", "bbox": {"l": 103.03389, "t": 249.79845999999998, "r": 128.96027, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "150", "bbox": {"l": 183.10536, "t": 248.81506000000002, "r": 190.8567, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "8", "bbox": {"l": 210.28223, "t": 248.81506000000002, "r": 212.86539, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "142", "bbox": {"l": 232.29153, "t": 248.81506000000002, "r": 240.04287999999997, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "223", "bbox": {"l": 256.88446, "t": 248.81506000000002, "r": 264.6358, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "147", "bbox": {"l": 281.47742, "t": 248.81506000000002, "r": 289.22876, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "\u60c5\u5831\u51e6\u7406\u5b66\u4f1a\u7b2c", "bbox": {"l": 55.53052099999999, "t": 257.28369, "r": 91.827637, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "65", "bbox": {"l": 88.052673, "t": 257.07465, "r": 93.219925, "b": 261.43255999999997, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "\u56de\u5168\u56fd\u5927\u4f1a", "bbox": {"l": 93.220474, "t": 257.28369, "r": 119.14685, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "(2003)", "bbox": {"l": 116.45073999999998, "t": 257.07465, "r": 129.88177, "b": 261.43255999999997, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "177", "bbox": {"l": 183.10536, "t": 256.30029, "r": 190.8567, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "1", "bbox": {"l": 210.28223, "t": 256.30029, "r": 212.86539, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "176", "bbox": {"l": 232.29153, "t": 256.30029, "r": 240.04287999999997, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "150", "bbox": {"l": 256.88446, "t": 256.30029, "r": 264.6358, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "236", "bbox": {"l": 281.47742, "t": 256.30029, "r": 289.22876, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "\u7b2c", "bbox": {"l": 55.53052099999999, "t": 264.5108, "r": 60.715424, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "17", "bbox": {"l": 60.17654799999999, "t": 264.30175999999994, "r": 65.343796, "b": 268.65967, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "\u56de\u4eba\u5de5\u77e5\u80fd\u5b66\u4f1a\u5168\u56fd\u5927\u4f1a", "bbox": {"l": 65.344376, "t": 264.5108, "r": 122.38297000000001, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "(2003)", "bbox": {"l": 116.45073999999998, "t": 264.30175999999994, "r": 129.88177, "b": 268.65967, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "208", "bbox": {"l": 183.10536, "t": 263.52739999999994, "r": 190.8567, "b": 267.88531, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "5", "bbox": {"l": 210.28223, "t": 263.52739999999994, "r": 212.86539, "b": 267.88531, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "203", "bbox": {"l": 232.29153, "t": 263.52739999999994, "r": 240.04287999999997, "b": 267.88531, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "152", "bbox": {"l": 256.88446, "t": 263.52739999999994, "r": 264.6358, "b": 267.88531, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "244", "bbox": {"l": 281.47742, "t": 263.52739999999994, "r": 289.22876, "b": 267.88531, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "\u81ea\u7136\u8a00\u8a9e\u51e6\u7406\u7814\u7a76\u4f1a\u7b2c", "bbox": {"l": 55.53052099999999, "t": 271.73785, "r": 107.38374, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "146", "bbox": {"l": 101.99034, "t": 271.52881, "r": 109.74168000000002, "b": 275.88671999999997, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "\u301c", "bbox": {"l": 109.74204, "t": 271.73785, "r": 114.92695000000002, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "155", "bbox": {"l": 114.38793, "t": 271.52881, "r": 122.13927, "b": 275.88671999999997, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "\u56de", "bbox": {"l": 122.13963, "t": 271.73785, "r": 127.32454000000001, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "98", "bbox": {"l": 184.39731, "t": 270.75446, "r": 189.56456, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "2", "bbox": {"l": 210.28223, "t": 270.75446, "r": 212.86539, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "96", "bbox": {"l": 233.58348, "t": 270.75446, "r": 238.75072999999998, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "150", "bbox": {"l": 256.88446, "t": 270.75446, "r": 264.6358, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "232", "bbox": {"l": 281.47742, "t": 270.75446, "r": 289.22876, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "WWW", "bbox": {"l": 55.53052099999999, "t": 279.01392, "r": 68.68605, "b": 283.37183, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "\u304b\u3089\u53ce\u96c6\u3057\u305f\u8ad6\u6587", "bbox": {"l": 68.685814, "t": 279.22295999999994, "r": 110.16829999999999, "b": 283.40436, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "107", "bbox": {"l": 183.10536, "t": 277.98157000000003, "r": 190.8567, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "73", "bbox": {"l": 208.99026, "t": 277.98157000000003, "r": 214.15752, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "34", "bbox": {"l": 233.58348, "t": 277.98157000000003, "r": 238.75072999999998, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "147", "bbox": {"l": 256.88446, "t": 277.98157000000003, "r": 264.6358, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "96", "bbox": {"l": 282.76938, "t": 277.98157000000003, "r": 287.93661, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "\u8a08", "bbox": {"l": 169.61508, "t": 286.45004, "r": 174.79999, "b": 290.63141, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "945", "bbox": {"l": 183.10536, "t": 285.46667, "r": 190.8567, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "294", "bbox": {"l": 207.69832, "t": 285.46667, "r": 215.44965999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "651", "bbox": {"l": 232.29153, "t": 285.46667, "r": 240.04287999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "1122", "bbox": {"l": 255.76506, "t": 285.46667, "r": 265.75204, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "955", "bbox": {"l": 281.47742, "t": 285.46667, "r": 289.22876, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}], "children": [{"id": 32, "label": "text", "bbox": {"l": 209.93285, "t": 222.18073000000004, "r": 241.04458999999997, "b": 226.36212, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": "\u8ad6\u6587\u30d5\u30a1\u30a4\u30eb", "bbox": {"l": 209.93285, "t": 222.18073000000004, "r": 241.04458999999997, "b": 226.36212, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 263.76489, "t": 222.18073000000004, "r": 284.50589, "b": 226.36212, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "\u53c2\u8003\u6587\u732e", "bbox": {"l": 263.76489, "t": 222.18073000000004, "r": 284.50589, "b": 226.36212, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 110.24990999999999, "t": 229.66594999999995, "r": 120.62018, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "\u51fa\u5178", "bbox": {"l": 110.24990999999999, "t": 229.66594999999995, "r": 120.62018, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 175.36609, "t": 229.66594999999995, "r": 196.1071, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "\u30d5\u30a1\u30a4\u30eb", "bbox": {"l": 175.36609, "t": 229.66594999999995, "r": 196.1071, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 196.10756, "t": 229.66594999999995, "r": 201.29247, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "\u6570", "bbox": {"l": 196.10756, "t": 229.66594999999995, "r": 201.29247, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 209.62408, "t": 229.66594999999995, "r": 219.99435, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "\u82f1\u8a9e", "bbox": {"l": 209.62408, "t": 229.66594999999995, "r": 219.99435, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 229.19814, "t": 229.66594999999995, "r": 244.75377, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "\u65e5\u672c\u8a9e", "bbox": {"l": 229.19814, "t": 229.66594999999995, "r": 244.75377, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 256.1142, "t": 229.66594999999995, "r": 266.48447, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "\u82f1\u8a9e", "bbox": {"l": 256.1142, "t": 229.66594999999995, "r": 266.48447, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 278.38434, "t": 229.66594999999995, "r": 293.93997, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "\u65e5\u672c\u8a9e", "bbox": {"l": 278.38434, "t": 229.66594999999995, "r": 293.93997, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 55.53052099999999, "t": 236.42584, "r": 162.7131, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "Association for Computational Linguistics(ACL2003)", "bbox": {"l": 55.53052099999999, "t": 236.42584, "r": 162.7131, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 184.39731, "t": 236.42584, "r": 189.56456, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "65", "bbox": {"l": 184.39731, "t": 236.42584, "r": 189.56456, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 208.99026, "t": 236.42584, "r": 214.15752, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "65", "bbox": {"l": 208.99026, "t": 236.42584, "r": 214.15752, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 234.87517, "t": 236.42584, "r": 237.45833000000002, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "0", "bbox": {"l": 234.87517, "t": 236.42584, "r": 237.45833000000002, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 256.88446, "t": 236.42584, "r": 264.6358, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "150", "bbox": {"l": 256.88446, "t": 236.42584, "r": 264.6358, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 284.06134, "t": 236.42584, "r": 286.6445, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "0", "bbox": {"l": 284.06134, "t": 236.42584, "r": 286.6445, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 55.53052099999999, "t": 242.62048000000004, "r": 139.72253, "b": 246.97839, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "Computational Linguistics(COLING2002)", "bbox": {"l": 55.53052099999999, "t": 242.62048000000004, "r": 139.72253, "b": 246.97839, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 183.10536, "t": 242.62048000000004, "r": 190.8567, "b": 246.97839, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "140", "bbox": {"l": 183.10536, "t": 242.62048000000004, "r": 190.8567, "b": 246.97839, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 207.69832, "t": 242.62048000000004, "r": 215.44965999999997, "b": 246.97839, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "140", "bbox": {"l": 207.69832, "t": 242.62048000000004, "r": 215.44965999999997, "b": 246.97839, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 234.87517, "t": 242.62048000000004, "r": 237.45833000000002, "b": 246.97839, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "0", "bbox": {"l": 234.87517, "t": 242.62048000000004, "r": 237.45833000000002, "b": 246.97839, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 256.88446, "t": 242.62048000000004, "r": 264.6358, "b": 246.97839, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "150", "bbox": {"l": 256.88446, "t": 242.62048000000004, "r": 264.6358, "b": 246.97839, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 284.06134, "t": 242.62048000000004, "r": 286.6445, "b": 246.97839, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "0", "bbox": {"l": 284.06134, "t": 242.62048000000004, "r": 286.6445, "b": 246.97839, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 55.53052099999999, "t": 249.79845999999998, "r": 97.013, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "\u96fb\u6c17\u60c5\u5831\u901a\u4fe1\u5b66\u4f1a", "bbox": {"l": 55.53052099999999, "t": 249.79845999999998, "r": 97.013, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 92.698288, "t": 249.58942000000002, "r": 103.03371, "b": 253.94732999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "2003", "bbox": {"l": 92.698288, "t": 249.58942000000002, "r": 103.03371, "b": 253.94732999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 103.03389, "t": 249.79845999999998, "r": 128.96027, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "\u5e74\u7dcf\u5408\u5927\u4f1a", "bbox": {"l": 103.03389, "t": 249.79845999999998, "r": 128.96027, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 183.10536, "t": 248.81506000000002, "r": 190.8567, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "150", "bbox": {"l": 183.10536, "t": 248.81506000000002, "r": 190.8567, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 210.28223, "t": 248.81506000000002, "r": 212.86539, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "8", "bbox": {"l": 210.28223, "t": 248.81506000000002, "r": 212.86539, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 232.29153, "t": 248.81506000000002, "r": 240.04287999999997, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "142", "bbox": {"l": 232.29153, "t": 248.81506000000002, "r": 240.04287999999997, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 256.88446, "t": 248.81506000000002, "r": 264.6358, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "223", "bbox": {"l": 256.88446, "t": 248.81506000000002, "r": 264.6358, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 281.47742, "t": 248.81506000000002, "r": 289.22876, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "147", "bbox": {"l": 281.47742, "t": 248.81506000000002, "r": 289.22876, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 55.53052099999999, "t": 257.28369, "r": 91.827637, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "\u60c5\u5831\u51e6\u7406\u5b66\u4f1a\u7b2c", "bbox": {"l": 55.53052099999999, "t": 257.28369, "r": 91.827637, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 88.052673, "t": 257.07465, "r": 93.219925, "b": 261.43255999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "65", "bbox": {"l": 88.052673, "t": 257.07465, "r": 93.219925, "b": 261.43255999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 93.220474, "t": 257.28369, "r": 119.14685, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "\u56de\u5168\u56fd\u5927\u4f1a", "bbox": {"l": 93.220474, "t": 257.28369, "r": 119.14685, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 116.45073999999998, "t": 257.07465, "r": 129.88177, "b": 261.43255999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "(2003)", "bbox": {"l": 116.45073999999998, "t": 257.07465, "r": 129.88177, "b": 261.43255999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 183.10536, "t": 256.30029, "r": 190.8567, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "177", "bbox": {"l": 183.10536, "t": 256.30029, "r": 190.8567, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 210.28223, "t": 256.30029, "r": 212.86539, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "1", "bbox": {"l": 210.28223, "t": 256.30029, "r": 212.86539, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 232.29153, "t": 256.30029, "r": 240.04287999999997, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "176", "bbox": {"l": 232.29153, "t": 256.30029, "r": 240.04287999999997, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 256.88446, "t": 256.30029, "r": 264.6358, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "150", "bbox": {"l": 256.88446, "t": 256.30029, "r": 264.6358, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 281.47742, "t": 256.30029, "r": 289.22876, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "236", "bbox": {"l": 281.47742, "t": 256.30029, "r": 289.22876, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 55.53052099999999, "t": 264.5108, "r": 60.715424, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "\u7b2c", "bbox": {"l": 55.53052099999999, "t": 264.5108, "r": 60.715424, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 60.17654799999999, "t": 264.30175999999994, "r": 65.343796, "b": 268.65967, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "17", "bbox": {"l": 60.17654799999999, "t": 264.30175999999994, "r": 65.343796, "b": 268.65967, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 65.344376, "t": 264.5108, "r": 122.38297000000001, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "\u56de\u4eba\u5de5\u77e5\u80fd\u5b66\u4f1a\u5168\u56fd\u5927\u4f1a", "bbox": {"l": 65.344376, "t": 264.5108, "r": 122.38297000000001, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 116.45073999999998, "t": 264.30175999999994, "r": 129.88177, "b": 268.65967, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "(2003)", "bbox": {"l": 116.45073999999998, "t": 264.30175999999994, "r": 129.88177, "b": 268.65967, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 183.10536, "t": 263.52739999999994, "r": 190.8567, "b": 267.88531, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "208", "bbox": {"l": 183.10536, "t": 263.52739999999994, "r": 190.8567, "b": 267.88531, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 210.28223, "t": 263.52739999999994, "r": 212.86539, "b": 267.88531, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "5", "bbox": {"l": 210.28223, "t": 263.52739999999994, "r": 212.86539, "b": 267.88531, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 232.29153, "t": 263.52739999999994, "r": 240.04287999999997, "b": 267.88531, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "203", "bbox": {"l": 232.29153, "t": 263.52739999999994, "r": 240.04287999999997, "b": 267.88531, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 256.88446, "t": 263.52739999999994, "r": 264.6358, "b": 267.88531, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "152", "bbox": {"l": 256.88446, "t": 263.52739999999994, "r": 264.6358, "b": 267.88531, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 281.47742, "t": 263.52739999999994, "r": 289.22876, "b": 267.88531, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "244", "bbox": {"l": 281.47742, "t": 263.52739999999994, "r": 289.22876, "b": 267.88531, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 55.53052099999999, "t": 271.73785, "r": 107.38374, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "\u81ea\u7136\u8a00\u8a9e\u51e6\u7406\u7814\u7a76\u4f1a\u7b2c", "bbox": {"l": 55.53052099999999, "t": 271.73785, "r": 107.38374, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 101.99034, "t": 271.52881, "r": 109.74168000000002, "b": 275.88671999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "146", "bbox": {"l": 101.99034, "t": 271.52881, "r": 109.74168000000002, "b": 275.88671999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 109.74204, "t": 271.73785, "r": 114.92695000000002, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "\u301c", "bbox": {"l": 109.74204, "t": 271.73785, "r": 114.92695000000002, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 114.38793, "t": 271.52881, "r": 122.13927, "b": 275.88671999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "155", "bbox": {"l": 114.38793, "t": 271.52881, "r": 122.13927, "b": 275.88671999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 122.13963, "t": 271.73785, "r": 127.32454000000001, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "\u56de", "bbox": {"l": 122.13963, "t": 271.73785, "r": 127.32454000000001, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 184.39731, "t": 270.75446, "r": 189.56456, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "98", "bbox": {"l": 184.39731, "t": 270.75446, "r": 189.56456, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 210.28223, "t": 270.75446, "r": 212.86539, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "2", "bbox": {"l": 210.28223, "t": 270.75446, "r": 212.86539, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 233.58348, "t": 270.75446, "r": 238.75072999999998, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "96", "bbox": {"l": 233.58348, "t": 270.75446, "r": 238.75072999999998, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 256.88446, "t": 270.75446, "r": 264.6358, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "150", "bbox": {"l": 256.88446, "t": 270.75446, "r": 264.6358, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 281.47742, "t": 270.75446, "r": 289.22876, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "232", "bbox": {"l": 281.47742, "t": 270.75446, "r": 289.22876, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 55.53052099999999, "t": 279.01392, "r": 68.68605, "b": 283.37183, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "WWW", "bbox": {"l": 55.53052099999999, "t": 279.01392, "r": 68.68605, "b": 283.37183, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 68.685814, "t": 279.22295999999994, "r": 110.16829999999999, "b": 283.40436, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "\u304b\u3089\u53ce\u96c6\u3057\u305f\u8ad6\u6587", "bbox": {"l": 68.685814, "t": 279.22295999999994, "r": 110.16829999999999, "b": 283.40436, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 183.10536, "t": 277.98157000000003, "r": 190.8567, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "107", "bbox": {"l": 183.10536, "t": 277.98157000000003, "r": 190.8567, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 208.99026, "t": 277.98157000000003, "r": 214.15752, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "73", "bbox": {"l": 208.99026, "t": 277.98157000000003, "r": 214.15752, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 233.58348, "t": 277.98157000000003, "r": 238.75072999999998, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "34", "bbox": {"l": 233.58348, "t": 277.98157000000003, "r": 238.75072999999998, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 256.88446, "t": 277.98157000000003, "r": 264.6358, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "147", "bbox": {"l": 256.88446, "t": 277.98157000000003, "r": 264.6358, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 282.76938, "t": 277.98157000000003, "r": 287.93661, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "96", "bbox": {"l": 282.76938, "t": 277.98157000000003, "r": 287.93661, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 169.61508, "t": 286.45004, "r": 174.79999, "b": 290.63141, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "\u8a08", "bbox": {"l": 169.61508, "t": 286.45004, "r": 174.79999, "b": 290.63141, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 183.10536, "t": 285.46667, "r": 190.8567, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "945", "bbox": {"l": 183.10536, "t": 285.46667, "r": 190.8567, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 207.69832, "t": 285.46667, "r": 215.44965999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "294", "bbox": {"l": 207.69832, "t": 285.46667, "r": 215.44965999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 232.29153, "t": 285.46667, "r": 240.04287999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "651", "bbox": {"l": 232.29153, "t": 285.46667, "r": 240.04287999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 255.76506, "t": 285.46667, "r": 265.75204, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "1122", "bbox": {"l": 255.76506, "t": 285.46667, "r": 265.75204, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 281.47742, "t": 285.46667, "r": 289.22876, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "955", "bbox": {"l": 281.47742, "t": 285.46667, "r": 289.22876, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "lcel", "ched", "lcel", "nl", "ched", "ched", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 10, "num_cols": 6, "table_cells": [{"bbox": {"l": 209.93285, "t": 222.18073000000004, "r": 241.04458999999997, "b": 226.36212, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 4, "text": "\u8ad6\u6587\u30d5\u30a1\u30a4\u30eb", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 263.76489, "t": 222.18073000000004, "r": 284.50589, "b": 226.36212, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 4, "end_col_offset_idx": 6, "text": "\u53c2\u8003\u6587\u732e", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 110.24990999999999, "t": 229.66594999999995, "r": 120.62018, "b": 233.84735, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "\u51fa\u5178", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 175.36609, "t": 229.66594999999995, "r": 201.29247, "b": 233.84735, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "\u30d5\u30a1\u30a4\u30eb \u6570", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 209.62408, "t": 229.66594999999995, "r": 219.99435, "b": 233.84735, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "\u82f1\u8a9e", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 229.19814, "t": 229.66594999999995, "r": 244.75377, "b": 233.84735, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "\u65e5\u672c\u8a9e", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 256.1142, "t": 229.66594999999995, "r": 266.48447, "b": 233.84735, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "\u82f1\u8a9e", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 278.38434, "t": 229.66594999999995, "r": 293.93997, "b": 233.84735, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "\u65e5\u672c\u8a9e", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 55.53052099999999, "t": 236.42584, "r": 162.7131, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Association for Computational Linguistics(ACL2003)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 184.39731, "t": 236.42584, "r": 189.56456, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "65", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 208.99026, "t": 236.42584, "r": 214.15752, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "65", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 234.87517, "t": 236.42584, "r": 237.45833000000002, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446, "t": 236.42584, "r": 264.6358, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "150", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 284.06134, "t": 236.42584, "r": 286.6445, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 55.53052099999999, "t": 242.62048000000004, "r": 139.72253, "b": 246.97839, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Computational Linguistics(COLING2002)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 183.10536, "t": 242.62048000000004, "r": 190.8567, "b": 246.97839, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "140", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 207.69832, "t": 242.62048000000004, "r": 215.44965999999997, "b": 246.97839, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "140", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 234.87517, "t": 242.62048000000004, "r": 237.45833000000002, "b": 246.97839, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446, "t": 242.62048000000004, "r": 264.6358, "b": 246.97839, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "150", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 284.06134, "t": 242.62048000000004, "r": 286.6445, "b": 246.97839, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 55.53052099999999, "t": 249.58942000000002, "r": 128.96027, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "\u96fb\u6c17\u60c5\u5831\u901a\u4fe1\u5b66\u4f1a 2003 \u5e74\u7dcf\u5408\u5927\u4f1a", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 183.10536, "t": 248.81506000000002, "r": 190.8567, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "150", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 210.28223, "t": 248.81506000000002, "r": 212.86539, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.29153, "t": 248.81506000000002, "r": 240.04287999999997, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "142", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446, "t": 248.81506000000002, "r": 264.6358, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "223", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.47742, "t": 248.81506000000002, "r": 289.22876, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "147", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 55.53052099999999, "t": 257.07465, "r": 129.88177, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "\u60c5\u5831\u51e6\u7406\u5b66\u4f1a\u7b2c 65 \u56de\u5168\u56fd\u5927\u4f1a (2003)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 183.10536, "t": 256.30029, "r": 190.8567, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "177", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 210.28223, "t": 256.30029, "r": 212.86539, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.29153, "t": 256.30029, "r": 240.04287999999997, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "176", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446, "t": 256.30029, "r": 264.6358, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "150", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.47742, "t": 256.30029, "r": 289.22876, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "236", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 55.53052099999999, "t": 264.30175999999994, "r": 129.88177, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "\u7b2c 17 \u56de\u4eba\u5de5\u77e5\u80fd\u5b66\u4f1a\u5168\u56fd\u5927\u4f1a (2003)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 183.10536, "t": 263.52739999999994, "r": 190.8567, "b": 267.88531, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "208", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 210.28223, "t": 263.52739999999994, "r": 212.86539, "b": 267.88531, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.29153, "t": 263.52739999999994, "r": 240.04287999999997, "b": 267.88531, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "203", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446, "t": 263.52739999999994, "r": 264.6358, "b": 267.88531, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "152", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.47742, "t": 263.52739999999994, "r": 289.22876, "b": 267.88531, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "244", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 55.53052099999999, "t": 271.52881, "r": 127.32454000000001, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "\u81ea\u7136\u8a00\u8a9e\u51e6\u7406\u7814\u7a76\u4f1a\u7b2c 146 \u301c 155 \u56de", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 184.39731, "t": 270.75446, "r": 189.56456, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "98", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 210.28223, "t": 270.75446, "r": 212.86539, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 233.58348, "t": 270.75446, "r": 238.75072999999998, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446, "t": 270.75446, "r": 264.6358, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "150", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.47742, "t": 270.75446, "r": 289.22876, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "232", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 55.53052099999999, "t": 279.01392, "r": 110.16829999999999, "b": 283.40436, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "WWW \u304b\u3089\u53ce\u96c6\u3057\u305f\u8ad6\u6587", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 183.10536, "t": 277.98157000000003, "r": 190.8567, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "107", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 208.99026, "t": 277.98157000000003, "r": 214.15752, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "73", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 233.58348, "t": 277.98157000000003, "r": 238.75072999999998, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "34", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446, "t": 277.98157000000003, "r": 264.6358, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "147", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 282.76938, "t": 277.98157000000003, "r": 287.93661, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 183.10536, "t": 285.46667, "r": 190.8567, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "945", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 207.69832, "t": 285.46667, "r": 215.44965999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "294", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.29153, "t": 285.46667, "r": 240.04287999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "651", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 255.76506, "t": 285.46667, "r": 265.75204, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "1122", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.47742, "t": 285.46667, "r": 289.22876, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "955", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "caption", "id": 16, "page_no": 7, "cluster": {"id": 16, "label": "caption", "bbox": {"l": 380.42731, "t": 292.30426, "r": 549.42175, "b": 298.60284, "coord_origin": "TOPLEFT"}, "confidence": 0.7499915957450867, "cells": [{"id": 76, "text": "Text is aligned to match original for ease of viewing", "bbox": {"l": 380.42731, "t": 292.30426, "r": 549.42175, "b": 298.60284, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Text is aligned to match original for ease of viewing"}, {"label": "table", "id": 7, "page_no": 7, "cluster": {"id": 7, "label": "table", "bbox": {"l": 304.9219970703125, "t": 218.51486206054688, "r": 550.2321166992188, "b": 287.90069580078125, "coord_origin": "TOPLEFT"}, "confidence": 0.8899767994880676, "cells": [{"id": 77, "text": "Weighted Average Grant Date Fair", "bbox": {"l": 459.04861, "t": 221.62415, "r": 542.00018, "b": 226.68933000000004, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "Value", "bbox": {"l": 493.82193, "t": 227.83416999999997, "r": 507.2258, "b": 232.89935000000003, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "RS", "bbox": {"l": 393.2442, "t": 236.74712999999997, "r": 400.74588, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "U", "bbox": {"l": 400.74643, "t": 236.74712999999997, "r": 404.64523, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "s", "bbox": {"l": 404.6463, "t": 236.74712999999997, "r": 407.34631, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "Shares (in millions)", "bbox": {"l": 392.09671, "t": 221.57446000000004, "r": 438.0145, "b": 226.63964999999996, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "PSUs", "bbox": {"l": 427.18323, "t": 236.74712999999997, "r": 440.98778999999996, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "RSUs", "bbox": {"l": 468.38254, "t": 236.74712999999997, "r": 482.48465000000004, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "PSUs", "bbox": {"l": 516.92578, "t": 236.74712999999997, "r": 530.73035, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Nonvested on Janua", "bbox": {"l": 306.11493, "t": 244.61084000000005, "r": 355.6532, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "ry 1", "bbox": {"l": 355.65427, "t": 244.61084000000005, "r": 364.65607, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "1.", "bbox": {"l": 396.24661, "t": 244.91327, "r": 400.75238, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "1", "bbox": {"l": 400.7529, "t": 244.91327, "r": 403.75531, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "0.3", "bbox": {"l": 429.81838999999997, "t": 244.91327, "r": 437.32708999999994, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "90.10", "bbox": {"l": 465.52859, "t": 244.91327, "r": 478.40103, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "$", "bbox": {"l": 480.97552, "t": 244.91327, "r": 483.55001999999996, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "$ 91.19", "bbox": {"l": 513.44824, "t": 244.91327, "r": 531.46967, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "Granted", "bbox": {"l": 306.11493, "t": 253.68451000000005, "r": 325.62674, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "0.", "bbox": {"l": 396.24661, "t": 253.68451000000005, "r": 400.75238, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "5", "bbox": {"l": 400.7529, "t": 253.68451000000005, "r": 403.75531, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "0.1", "bbox": {"l": 429.81838999999997, "t": 253.68451000000005, "r": 437.32708999999994, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "117.44", "bbox": {"l": 466.43579000000005, "t": 253.68451000000005, "r": 482.54831, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "122.41", "bbox": {"l": 514.29065, "t": 253.68451000000005, "r": 530.80981, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "Vested", "bbox": {"l": 306.11493, "t": 261.54822, "r": 322.62866, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "(0.", "bbox": {"l": 394.43222, "t": 261.54822, "r": 400.73563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "5", "bbox": {"l": 400.73456, "t": 261.54822, "r": 403.73697, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": ")", "bbox": {"l": 403.73804, "t": 261.54822, "r": 405.53625, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "(0.1)", "bbox": {"l": 427.7016, "t": 261.54822, "r": 438.80563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "87.08", "bbox": {"l": 468.55533, "t": 261.54822, "r": 482.07043, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "81.14", "bbox": {"l": 516.01862, "t": 261.54822, "r": 529.53375, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "Canceled or forfeited", "bbox": {"l": 306.11493, "t": 269.64148, "r": 356.24771, "b": 274.70667000000003, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "(0.", "bbox": {"l": 394.43222, "t": 270.31946000000005, "r": 400.73563, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "1", "bbox": {"l": 400.73456, "t": 270.31946000000005, "r": 403.73697, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": ")", "bbox": {"l": 403.73804, "t": 270.31946000000005, "r": 405.53625, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "-", "bbox": {"l": 431.02802, "t": 270.31946000000005, "r": 436.4280099999999, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "102.01", "bbox": {"l": 465.83099000000004, "t": 270.31946000000005, "r": 482.35013, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "92.18", "bbox": {"l": 516.01862, "t": 270.31946000000005, "r": 529.53375, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "Nonvested on December 31", "bbox": {"l": 306.11493, "t": 278.48572, "r": 373.35764, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "1.0", "bbox": {"l": 396.24661, "t": 278.48572, "r": 403.75531, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "0.3", "bbox": {"l": 429.51599, "t": 278.48572, "r": 437.02469, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "104.85 $", "bbox": {"l": 463.7142, "t": 278.48572, "r": 484.73965000000004, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "$ 104.51", "bbox": {"l": 512.99463, "t": 278.48572, "r": 534.02008, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}], "children": [{"id": 102, "label": "text", "bbox": {"l": 459.04861, "t": 221.62415, "r": 542.00018, "b": 226.68933000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "Weighted Average Grant Date Fair", "bbox": {"l": 459.04861, "t": 221.62415, "r": 542.00018, "b": 226.68933000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 493.82193, "t": 227.83416999999997, "r": 507.2258, "b": 232.89935000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "Value", "bbox": {"l": 493.82193, "t": 227.83416999999997, "r": 507.2258, "b": 232.89935000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 393.2442, "t": 236.74712999999997, "r": 400.74588, "b": 241.81232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "RS", "bbox": {"l": 393.2442, "t": 236.74712999999997, "r": 400.74588, "b": 241.81232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 400.74643, "t": 236.74712999999997, "r": 404.64523, "b": 241.81232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "U", "bbox": {"l": 400.74643, "t": 236.74712999999997, "r": 404.64523, "b": 241.81232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 404.6463, "t": 236.74712999999997, "r": 407.34631, "b": 241.81232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "s", "bbox": {"l": 404.6463, "t": 236.74712999999997, "r": 407.34631, "b": 241.81232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 392.09671, "t": 221.57446000000004, "r": 438.0145, "b": 226.63964999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "Shares (in millions)", "bbox": {"l": 392.09671, "t": 221.57446000000004, "r": 438.0145, "b": 226.63964999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 427.18323, "t": 236.74712999999997, "r": 440.98778999999996, "b": 241.81232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "PSUs", "bbox": {"l": 427.18323, "t": 236.74712999999997, "r": 440.98778999999996, "b": 241.81232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 468.38254, "t": 236.74712999999997, "r": 482.48465000000004, "b": 241.81232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "RSUs", "bbox": {"l": 468.38254, "t": 236.74712999999997, "r": 482.48465000000004, "b": 241.81232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 516.92578, "t": 236.74712999999997, "r": 530.73035, "b": 241.81232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "PSUs", "bbox": {"l": 516.92578, "t": 236.74712999999997, "r": 530.73035, "b": 241.81232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 306.11493, "t": 244.61084000000005, "r": 355.6532, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "Nonvested on Janua", "bbox": {"l": 306.11493, "t": 244.61084000000005, "r": 355.6532, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 355.65427, "t": 244.61084000000005, "r": 364.65607, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "ry 1", "bbox": {"l": 355.65427, "t": 244.61084000000005, "r": 364.65607, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 396.24661, "t": 244.91327, "r": 400.75238, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "1.", "bbox": {"l": 396.24661, "t": 244.91327, "r": 400.75238, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 114, "label": "text", "bbox": {"l": 400.7529, "t": 244.91327, "r": 403.75531, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "1", "bbox": {"l": 400.7529, "t": 244.91327, "r": 403.75531, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 115, "label": "text", "bbox": {"l": 429.81838999999997, "t": 244.91327, "r": 437.32708999999994, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "0.3", "bbox": {"l": 429.81838999999997, "t": 244.91327, "r": 437.32708999999994, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 116, "label": "text", "bbox": {"l": 465.52859, "t": 244.91327, "r": 478.40103, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "90.10", "bbox": {"l": 465.52859, "t": 244.91327, "r": 478.40103, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 117, "label": "text", "bbox": {"l": 480.97552, "t": 244.91327, "r": 483.55001999999996, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "$", "bbox": {"l": 480.97552, "t": 244.91327, "r": 483.55001999999996, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 118, "label": "text", "bbox": {"l": 513.44824, "t": 244.91327, "r": 531.46967, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "$ 91.19", "bbox": {"l": 513.44824, "t": 244.91327, "r": 531.46967, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 119, "label": "text", "bbox": {"l": 306.11493, "t": 253.68451000000005, "r": 325.62674, "b": 258.74969, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "Granted", "bbox": {"l": 306.11493, "t": 253.68451000000005, "r": 325.62674, "b": 258.74969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 120, "label": "text", "bbox": {"l": 396.24661, "t": 253.68451000000005, "r": 400.75238, "b": 258.74969, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "0.", "bbox": {"l": 396.24661, "t": 253.68451000000005, "r": 400.75238, "b": 258.74969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 121, "label": "text", "bbox": {"l": 400.7529, "t": 253.68451000000005, "r": 403.75531, "b": 258.74969, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "5", "bbox": {"l": 400.7529, "t": 253.68451000000005, "r": 403.75531, "b": 258.74969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 122, "label": "text", "bbox": {"l": 429.81838999999997, "t": 253.68451000000005, "r": 437.32708999999994, "b": 258.74969, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "0.1", "bbox": {"l": 429.81838999999997, "t": 253.68451000000005, "r": 437.32708999999994, "b": 258.74969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 123, "label": "text", "bbox": {"l": 466.43579000000005, "t": 253.68451000000005, "r": 482.54831, "b": 258.74969, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "117.44", "bbox": {"l": 466.43579000000005, "t": 253.68451000000005, "r": 482.54831, "b": 258.74969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 124, "label": "text", "bbox": {"l": 514.29065, "t": 253.68451000000005, "r": 530.80981, "b": 258.74969, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "122.41", "bbox": {"l": 514.29065, "t": 253.68451000000005, "r": 530.80981, "b": 258.74969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 125, "label": "text", "bbox": {"l": 306.11493, "t": 261.54822, "r": 322.62866, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "Vested", "bbox": {"l": 306.11493, "t": 261.54822, "r": 322.62866, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 126, "label": "text", "bbox": {"l": 394.43222, "t": 261.54822, "r": 400.73563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "(0.", "bbox": {"l": 394.43222, "t": 261.54822, "r": 400.73563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 127, "label": "text", "bbox": {"l": 400.73456, "t": 261.54822, "r": 403.73697, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "5", "bbox": {"l": 400.73456, "t": 261.54822, "r": 403.73697, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 128, "label": "text", "bbox": {"l": 403.73804, "t": 261.54822, "r": 405.53625, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": ")", "bbox": {"l": 403.73804, "t": 261.54822, "r": 405.53625, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 129, "label": "text", "bbox": {"l": 427.7016, "t": 261.54822, "r": 438.80563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "(0.1)", "bbox": {"l": 427.7016, "t": 261.54822, "r": 438.80563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 130, "label": "text", "bbox": {"l": 468.55533, "t": 261.54822, "r": 482.07043, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "87.08", "bbox": {"l": 468.55533, "t": 261.54822, "r": 482.07043, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 131, "label": "text", "bbox": {"l": 516.01862, "t": 261.54822, "r": 529.53375, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": "81.14", "bbox": {"l": 516.01862, "t": 261.54822, "r": 529.53375, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 132, "label": "text", "bbox": {"l": 306.11493, "t": 269.64148, "r": 356.24771, "b": 274.70667000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 107, "text": "Canceled or forfeited", "bbox": {"l": 306.11493, "t": 269.64148, "r": 356.24771, "b": 274.70667000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 133, "label": "text", "bbox": {"l": 394.43222, "t": 270.31946000000005, "r": 400.73563, "b": 275.38464, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 108, "text": "(0.", "bbox": {"l": 394.43222, "t": 270.31946000000005, "r": 400.73563, "b": 275.38464, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 134, "label": "text", "bbox": {"l": 400.73456, "t": 270.31946000000005, "r": 403.73697, "b": 275.38464, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 109, "text": "1", "bbox": {"l": 400.73456, "t": 270.31946000000005, "r": 403.73697, "b": 275.38464, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 135, "label": "text", "bbox": {"l": 403.73804, "t": 270.31946000000005, "r": 405.53625, "b": 275.38464, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 110, "text": ")", "bbox": {"l": 403.73804, "t": 270.31946000000005, "r": 405.53625, "b": 275.38464, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 136, "label": "text", "bbox": {"l": 431.02802, "t": 270.31946000000005, "r": 436.4280099999999, "b": 275.38464, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 111, "text": "-", "bbox": {"l": 431.02802, "t": 270.31946000000005, "r": 436.4280099999999, "b": 275.38464, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 137, "label": "text", "bbox": {"l": 465.83099000000004, "t": 270.31946000000005, "r": 482.35013, "b": 275.38464, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 112, "text": "102.01", "bbox": {"l": 465.83099000000004, "t": 270.31946000000005, "r": 482.35013, "b": 275.38464, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 138, "label": "text", "bbox": {"l": 516.01862, "t": 270.31946000000005, "r": 529.53375, "b": 275.38464, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 113, "text": "92.18", "bbox": {"l": 516.01862, "t": 270.31946000000005, "r": 529.53375, "b": 275.38464, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 139, "label": "text", "bbox": {"l": 306.11493, "t": 278.48572, "r": 373.35764, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 114, "text": "Nonvested on December 31", "bbox": {"l": 306.11493, "t": 278.48572, "r": 373.35764, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 140, "label": "text", "bbox": {"l": 396.24661, "t": 278.48572, "r": 403.75531, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 115, "text": "1.0", "bbox": {"l": 396.24661, "t": 278.48572, "r": 403.75531, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 141, "label": "text", "bbox": {"l": 429.51599, "t": 278.48572, "r": 437.02469, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 116, "text": "0.3", "bbox": {"l": 429.51599, "t": 278.48572, "r": 437.02469, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 142, "label": "text", "bbox": {"l": 463.7142, "t": 278.48572, "r": 484.73965000000004, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 117, "text": "104.85 $", "bbox": {"l": 463.7142, "t": 278.48572, "r": 484.73965000000004, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 143, "label": "text", "bbox": {"l": 512.99463, "t": 278.48572, "r": 534.02008, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 118, "text": "$ 104.51", "bbox": {"l": 512.99463, "t": 278.48572, "r": 534.02008, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ecel", "ched", "lcel", "ched", "lcel", "nl", "ecel", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 7, "num_cols": 5, "table_cells": [{"bbox": {"l": 459.04861, "t": 221.62415, "r": 542.00018, "b": 232.89935000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 5, "text": "Weighted Average Grant Date Fair Value", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 393.2442, "t": 236.74712999999997, "r": 407.34631, "b": 241.81232, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "RS U s", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 392.09671, "t": 221.57446000000004, "r": 438.0145, "b": 226.63964999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 3, "text": "Shares (in millions)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 427.18323, "t": 236.74712999999997, "r": 440.98778999999996, "b": 241.81232, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "PSUs", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 468.38254, "t": 236.74712999999997, "r": 482.48465000000004, "b": 241.81232, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "RSUs", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 516.92578, "t": 236.74712999999997, "r": 530.73035, "b": 241.81232, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "PSUs", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 306.11493, "t": 244.61084000000005, "r": 364.65607, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Nonvested on Janua ry 1", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 396.24661, "t": 244.91327, "r": 403.75531, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "1. 1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 429.81838999999997, "t": 244.91327, "r": 437.32708999999994, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 465.52859, "t": 244.91327, "r": 483.55001999999996, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "90.10 $", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 513.44824, "t": 244.91327, "r": 531.46967, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "$ 91.19", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 306.11493, "t": 253.68451000000005, "r": 325.62674, "b": 258.74969, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Granted", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 396.24661, "t": 253.68451000000005, "r": 403.75531, "b": 258.74969, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "0. 5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 429.81838999999997, "t": 253.68451000000005, "r": 437.32708999999994, "b": 258.74969, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 466.43579000000005, "t": 253.68451000000005, "r": 482.54831, "b": 258.74969, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "117.44", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 514.29065, "t": 253.68451000000005, "r": 530.80981, "b": 258.74969, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "122.41", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 306.11493, "t": 261.54822, "r": 322.62866, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Vested", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 394.43222, "t": 261.54822, "r": 405.53625, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "(0. 5 )", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 427.7016, "t": 261.54822, "r": 438.80563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "(0.1)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 468.55533, "t": 261.54822, "r": 482.07043, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "87.08", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 516.01862, "t": 261.54822, "r": 529.53375, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "81.14", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 306.11493, "t": 269.64148, "r": 356.24771, "b": 274.70667000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Canceled or forfeited", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 394.43222, "t": 270.31946000000005, "r": 405.53625, "b": 275.38464, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "(0. 1 )", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 431.02802, "t": 270.31946000000005, "r": 436.4280099999999, "b": 275.38464, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 465.83099000000004, "t": 270.31946000000005, "r": 482.35013, "b": 275.38464, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "102.01", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 516.01862, "t": 270.31946000000005, "r": 529.53375, "b": 275.38464, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "92.18", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 306.11493, "t": 278.48572, "r": 373.35764, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Nonvested on December 31", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 396.24661, "t": 278.48572, "r": 403.75531, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "1.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 429.51599, "t": 278.48572, "r": 437.02469, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 463.7142, "t": 278.48572, "r": 484.73965000000004, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "104.85 $", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 512.99463, "t": 278.48572, "r": 534.02008, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "$ 104.51", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "caption", "id": 6, "page_no": 7, "cluster": {"id": 6, "label": "caption", "bbox": {"l": 50.112, "t": 320.87735, "r": 545.11377, "b": 365.64987, "coord_origin": "TOPLEFT"}, "confidence": 0.9140303134918213, "cells": [{"id": 119, "text": "Figure 5:", "bbox": {"l": 50.112, "t": 320.87735, "r": 86.864021, "b": 329.78391, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "One of the benefits of TableFormer is that it is language agnostic, as an example, the left part of the illustration", "bbox": {"l": 93.917542, "t": 320.87735, "r": 545.11371, "b": 329.78391, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "demonstrates TableFormer predictions on previously unseen language (Japanese). Additionally, we see that TableFormer is", "bbox": {"l": 50.112, "t": 332.83233999999993, "r": 545.11371, "b": 341.73889, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "robust to variability in style and content, right side of the illustration shows the example of the TableFormer prediction from", "bbox": {"l": 50.112, "t": 344.78732, "r": 545.11377, "b": 353.69388, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "the FinTabNet dataset.", "bbox": {"l": 50.112, "t": 356.74332, "r": 139.79532, "b": 365.64987, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 5: One of the benefits of TableFormer is that it is language agnostic, as an example, the left part of the illustration demonstrates TableFormer predictions on previously unseen language (Japanese). Additionally, we see that TableFormer is robust to variability in style and content, right side of the illustration shows the example of the TableFormer prediction from the FinTabNet dataset."}, {"label": "picture", "id": 12, "page_no": 7, "cluster": {"id": 12, "label": "picture", "bbox": {"l": 216.76925659179688, "t": 380.4906311035156, "r": 375.7829284667969, "b": 443.34698486328125, "coord_origin": "TOPLEFT"}, "confidence": 0.805853009223938, "cells": [{"id": 124, "text": "Red - PDF cells, Green - predicted bounding boxes", "bbox": {"l": 220.26282, "t": 381.77722, "r": 342.07819, "b": 386.44281, "coord_origin": "TOPLEFT"}}], "children": [{"id": 144, "label": "text", "bbox": {"l": 220.26282, "t": 381.77722, "r": 342.07819, "b": 386.44281, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 124, "text": "Red - PDF cells, Green - predicted bounding boxes", "bbox": {"l": 220.26282, "t": 381.77722, "r": 342.07819, "b": 386.44281, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "picture", "id": 11, "page_no": 7, "cluster": {"id": 11, "label": "picture", "bbox": {"l": 51.736167907714844, "t": 380.48065185546875, "r": 211.83778381347656, "b": 443.6580810546875, "coord_origin": "TOPLEFT"}, "confidence": 0.8308426737785339, "cells": [{"id": 125, "text": "Ground Truth", "bbox": {"l": 53.715248, "t": 381.77722, "r": 85.657333, "b": 386.44281, "coord_origin": "TOPLEFT"}}], "children": [{"id": 145, "label": "text", "bbox": {"l": 53.715248, "t": 381.77722, "r": 85.657333, "b": 386.44281, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 125, "text": "Ground Truth", "bbox": {"l": 53.715248, "t": 381.77722, "r": 85.657333, "b": 386.44281, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "picture", "id": 13, "page_no": 7, "cluster": {"id": 13, "label": "picture", "bbox": {"l": 383.1364440917969, "t": 381.2313232421875, "r": 542.1132202148438, "b": 442.7749328613281, "coord_origin": "TOPLEFT"}, "confidence": 0.7881615161895752, "cells": [{"id": 126, "text": "16", "bbox": {"l": 437.37939, "t": 400.55295, "r": 443.69870000000003, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "17", "bbox": {"l": 450.33203, "t": 400.55295, "r": 456.6513100000001, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "18", "bbox": {"l": 463.28464, "t": 400.55295, "r": 469.60394, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "19", "bbox": {"l": 476.23724000000004, "t": 400.55295, "r": 482.5565500000001, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "20", "bbox": {"l": 489.18988, "t": 400.55295, "r": 495.50916, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "21", "bbox": {"l": 502.14251999999993, "t": 400.55295, "r": 508.46178999999995, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "22", "bbox": {"l": 515.09509, "t": 400.55295, "r": 521.41443, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "23", "bbox": {"l": 385.2814, "t": 411.03836000000007, "r": 391.60071, "b": 417.35699, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "24", "bbox": {"l": 398.52341, "t": 411.03836000000007, "r": 404.84271, "b": 417.35699, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "25", "bbox": {"l": 411.47604, "t": 411.03836000000007, "r": 417.79535, "b": 417.35699, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "26", "bbox": {"l": 437.37939, "t": 411.03836000000007, "r": 443.69870000000003, "b": 417.35699, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "27", "bbox": {"l": 450.33203, "t": 411.03836000000007, "r": 456.6513100000001, "b": 417.35699, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "28", "bbox": {"l": 463.28464, "t": 411.03836000000007, "r": 469.60394, "b": 417.35699, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "30", "bbox": {"l": 385.2814, "t": 421.0697, "r": 391.60071, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "31", "bbox": {"l": 398.52341, "t": 421.0697, "r": 404.84271, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "32", "bbox": {"l": 411.47604, "t": 421.0697, "r": 417.79532, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "33", "bbox": {"l": 424.42865, "t": 421.0697, "r": 430.74796, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "34", "bbox": {"l": 437.38129, "t": 421.0697, "r": 443.70056, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "35", "bbox": {"l": 450.33389000000005, "t": 421.0697, "r": 456.65319999999997, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "36", "bbox": {"l": 463.2865, "t": 421.0697, "r": 469.6058, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "37", "bbox": {"l": 476.23914, "t": 421.0697, "r": 482.55841, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "38", "bbox": {"l": 489.1917700000001, "t": 421.0697, "r": 495.51105, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "39", "bbox": {"l": 502.14438, "t": 421.0697, "r": 508.46368, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "40", "bbox": {"l": 515.09705, "t": 421.0697, "r": 521.41632, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "41", "bbox": {"l": 528.04962, "t": 421.0697, "r": 534.3689, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "42", "bbox": {"l": 385.2814, "t": 432.04431, "r": 391.60071, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "43", "bbox": {"l": 398.52341, "t": 432.04431, "r": 404.84271, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "44", "bbox": {"l": 411.47604, "t": 432.04431, "r": 417.79532, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "45", "bbox": {"l": 424.42865, "t": 432.04431, "r": 430.74796, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "46", "bbox": {"l": 437.38129, "t": 432.04431, "r": 443.70056, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "47", "bbox": {"l": 450.33389000000005, "t": 432.04431, "r": 456.65319999999997, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "48", "bbox": {"l": 463.2865, "t": 432.04431, "r": 469.6058, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "49", "bbox": {"l": 476.23914, "t": 432.04431, "r": 482.55841, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "50", "bbox": {"l": 489.1917700000001, "t": 432.04431, "r": 495.51105, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "51", "bbox": {"l": 502.14438, "t": 432.04431, "r": 508.46368, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "52", "bbox": {"l": 515.09705, "t": 432.04431, "r": 521.41632, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "53", "bbox": {"l": 528.04962, "t": 432.04431, "r": 534.3689, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "0", "bbox": {"l": 385.2814, "t": 389.20004, "r": 388.44073, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "1", "bbox": {"l": 398.52341, "t": 389.20004, "r": 401.68274, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "2", "bbox": {"l": 411.4754, "t": 389.20004, "r": 414.63474, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "3", "bbox": {"l": 424.4274, "t": 389.20004, "r": 427.58673, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "4", "bbox": {"l": 437.37939, "t": 389.20004, "r": 440.53870000000006, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "5", "bbox": {"l": 450.33136, "t": 389.20004, "r": 453.49069000000003, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "6", "bbox": {"l": 463.28336, "t": 389.20004, "r": 466.44269, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "7", "bbox": {"l": 476.23535, "t": 389.20004, "r": 479.39468, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "8", "bbox": {"l": 489.18735, "t": 389.20004, "r": 492.34668, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "9", "bbox": {"l": 502.13933999999995, "t": 389.20004, "r": 505.29868000000005, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "10", "bbox": {"l": 515.09131, "t": 389.20004, "r": 521.41064, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "11", "bbox": {"l": 528.04364, "t": 389.20004, "r": 534.13104, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "12", "bbox": {"l": 385.2814, "t": 398.97464, "r": 391.60071, "b": 405.29327, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "13", "bbox": {"l": 398.52341, "t": 398.97464, "r": 404.84271, "b": 405.29327, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "14", "bbox": {"l": 411.47604, "t": 398.97464, "r": 417.79535, "b": 405.29327, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "15", "bbox": {"l": 424.42719, "t": 406.77463000000006, "r": 430.74648999999994, "b": 413.09326, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "29", "bbox": {"l": 502.86941999999993, "t": 410.99438, "r": 509.18871999999993, "b": 417.31302, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "Predicted Structure", "bbox": {"l": 384.35437, "t": 381.77722, "r": 430.99261, "b": 386.44281, "coord_origin": "TOPLEFT"}}], "children": [{"id": 146, "label": "text", "bbox": {"l": 437.37939, "t": 400.55295, "r": 443.69870000000003, "b": 406.87158, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 126, "text": "16", "bbox": {"l": 437.37939, "t": 400.55295, "r": 443.69870000000003, "b": 406.87158, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 147, "label": "text", "bbox": {"l": 450.33203, "t": 400.55295, "r": 456.6513100000001, "b": 406.87158, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 127, "text": "17", "bbox": {"l": 450.33203, "t": 400.55295, "r": 456.6513100000001, "b": 406.87158, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 148, "label": "text", "bbox": {"l": 463.28464, "t": 400.55295, "r": 469.60394, "b": 406.87158, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 128, "text": "18", "bbox": {"l": 463.28464, "t": 400.55295, "r": 469.60394, "b": 406.87158, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 149, "label": "text", "bbox": {"l": 476.23724000000004, "t": 400.55295, "r": 482.5565500000001, "b": 406.87158, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 129, "text": "19", "bbox": {"l": 476.23724000000004, "t": 400.55295, "r": 482.5565500000001, "b": 406.87158, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 150, "label": "text", "bbox": {"l": 489.18988, "t": 400.55295, "r": 495.50916, "b": 406.87158, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 130, "text": "20", "bbox": {"l": 489.18988, "t": 400.55295, "r": 495.50916, "b": 406.87158, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 151, "label": "text", "bbox": {"l": 502.14251999999993, "t": 400.55295, "r": 508.46178999999995, "b": 406.87158, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 131, "text": "21", "bbox": {"l": 502.14251999999993, "t": 400.55295, "r": 508.46178999999995, "b": 406.87158, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 152, "label": "text", "bbox": {"l": 515.09509, "t": 400.55295, "r": 521.41443, "b": 406.87158, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 132, "text": "22", "bbox": {"l": 515.09509, "t": 400.55295, "r": 521.41443, "b": 406.87158, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 153, "label": "text", "bbox": {"l": 385.2814, "t": 411.03836000000007, "r": 391.60071, "b": 417.35699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 133, "text": "23", "bbox": {"l": 385.2814, "t": 411.03836000000007, "r": 391.60071, "b": 417.35699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 154, "label": "text", "bbox": {"l": 398.52341, "t": 411.03836000000007, "r": 404.84271, "b": 417.35699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 134, "text": "24", "bbox": {"l": 398.52341, "t": 411.03836000000007, "r": 404.84271, "b": 417.35699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 155, "label": "text", "bbox": {"l": 411.47604, "t": 411.03836000000007, "r": 417.79535, "b": 417.35699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 135, "text": "25", "bbox": {"l": 411.47604, "t": 411.03836000000007, "r": 417.79535, "b": 417.35699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 156, "label": "text", "bbox": {"l": 437.37939, "t": 411.03836000000007, "r": 443.69870000000003, "b": 417.35699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 136, "text": "26", "bbox": {"l": 437.37939, "t": 411.03836000000007, "r": 443.69870000000003, "b": 417.35699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 157, "label": "text", "bbox": {"l": 450.33203, "t": 411.03836000000007, "r": 456.6513100000001, "b": 417.35699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 137, "text": "27", "bbox": {"l": 450.33203, "t": 411.03836000000007, "r": 456.6513100000001, "b": 417.35699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 158, "label": "text", "bbox": {"l": 463.28464, "t": 411.03836000000007, "r": 469.60394, "b": 417.35699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 138, "text": "28", "bbox": {"l": 463.28464, "t": 411.03836000000007, "r": 469.60394, "b": 417.35699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 159, "label": "text", "bbox": {"l": 385.2814, "t": 421.0697, "r": 391.60071, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 139, "text": "30", "bbox": {"l": 385.2814, "t": 421.0697, "r": 391.60071, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 160, "label": "text", "bbox": {"l": 398.52341, "t": 421.0697, "r": 404.84271, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 140, "text": "31", "bbox": {"l": 398.52341, "t": 421.0697, "r": 404.84271, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 161, "label": "text", "bbox": {"l": 411.47604, "t": 421.0697, "r": 417.79532, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 141, "text": "32", "bbox": {"l": 411.47604, "t": 421.0697, "r": 417.79532, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 162, "label": "text", "bbox": {"l": 424.42865, "t": 421.0697, "r": 430.74796, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 142, "text": "33", "bbox": {"l": 424.42865, "t": 421.0697, "r": 430.74796, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 163, "label": "text", "bbox": {"l": 437.38129, "t": 421.0697, "r": 443.70056, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 143, "text": "34", "bbox": {"l": 437.38129, "t": 421.0697, "r": 443.70056, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 164, "label": "text", "bbox": {"l": 450.33389000000005, "t": 421.0697, "r": 456.65319999999997, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 144, "text": "35", "bbox": {"l": 450.33389000000005, "t": 421.0697, "r": 456.65319999999997, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 165, "label": "text", "bbox": {"l": 463.2865, "t": 421.0697, "r": 469.6058, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 145, "text": "36", "bbox": {"l": 463.2865, "t": 421.0697, "r": 469.6058, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 166, "label": "text", "bbox": {"l": 476.23914, "t": 421.0697, "r": 482.55841, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 146, "text": "37", "bbox": {"l": 476.23914, "t": 421.0697, "r": 482.55841, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 167, "label": "text", "bbox": {"l": 489.1917700000001, "t": 421.0697, "r": 495.51105, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 147, "text": "38", "bbox": {"l": 489.1917700000001, "t": 421.0697, "r": 495.51105, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 168, "label": "text", "bbox": {"l": 502.14438, "t": 421.0697, "r": 508.46368, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 148, "text": "39", "bbox": {"l": 502.14438, "t": 421.0697, "r": 508.46368, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 169, "label": "text", "bbox": {"l": 515.09705, "t": 421.0697, "r": 521.41632, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 149, "text": "40", "bbox": {"l": 515.09705, "t": 421.0697, "r": 521.41632, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 170, "label": "text", "bbox": {"l": 528.04962, "t": 421.0697, "r": 534.3689, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 150, "text": "41", "bbox": {"l": 528.04962, "t": 421.0697, "r": 534.3689, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 171, "label": "text", "bbox": {"l": 385.2814, "t": 432.04431, "r": 391.60071, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 151, "text": "42", "bbox": {"l": 385.2814, "t": 432.04431, "r": 391.60071, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 172, "label": "text", "bbox": {"l": 398.52341, "t": 432.04431, "r": 404.84271, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 152, "text": "43", "bbox": {"l": 398.52341, "t": 432.04431, "r": 404.84271, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 173, "label": "text", "bbox": {"l": 411.47604, "t": 432.04431, "r": 417.79532, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 153, "text": "44", "bbox": {"l": 411.47604, "t": 432.04431, "r": 417.79532, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 174, "label": "text", "bbox": {"l": 424.42865, "t": 432.04431, "r": 430.74796, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 154, "text": "45", "bbox": {"l": 424.42865, "t": 432.04431, "r": 430.74796, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 175, "label": "text", "bbox": {"l": 437.38129, "t": 432.04431, "r": 443.70056, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 155, "text": "46", "bbox": {"l": 437.38129, "t": 432.04431, "r": 443.70056, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 176, "label": "text", "bbox": {"l": 450.33389000000005, "t": 432.04431, "r": 456.65319999999997, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 156, "text": "47", "bbox": {"l": 450.33389000000005, "t": 432.04431, "r": 456.65319999999997, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 177, "label": "text", "bbox": {"l": 463.2865, "t": 432.04431, "r": 469.6058, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 157, "text": "48", "bbox": {"l": 463.2865, "t": 432.04431, "r": 469.6058, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 178, "label": "text", "bbox": {"l": 476.23914, "t": 432.04431, "r": 482.55841, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 158, "text": "49", "bbox": {"l": 476.23914, "t": 432.04431, "r": 482.55841, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 179, "label": "text", "bbox": {"l": 489.1917700000001, "t": 432.04431, "r": 495.51105, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 159, "text": "50", "bbox": {"l": 489.1917700000001, "t": 432.04431, "r": 495.51105, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 180, "label": "text", "bbox": {"l": 502.14438, "t": 432.04431, "r": 508.46368, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 160, "text": "51", "bbox": {"l": 502.14438, "t": 432.04431, "r": 508.46368, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 181, "label": "text", "bbox": {"l": 515.09705, "t": 432.04431, "r": 521.41632, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 161, "text": "52", "bbox": {"l": 515.09705, "t": 432.04431, "r": 521.41632, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 182, "label": "text", "bbox": {"l": 528.04962, "t": 432.04431, "r": 534.3689, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 162, "text": "53", "bbox": {"l": 528.04962, "t": 432.04431, "r": 534.3689, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 183, "label": "text", "bbox": {"l": 385.2814, "t": 389.20004, "r": 388.44073, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 163, "text": "0", "bbox": {"l": 385.2814, "t": 389.20004, "r": 388.44073, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 184, "label": "text", "bbox": {"l": 398.52341, "t": 389.20004, "r": 401.68274, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 164, "text": "1", "bbox": {"l": 398.52341, "t": 389.20004, "r": 401.68274, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 185, "label": "text", "bbox": {"l": 411.4754, "t": 389.20004, "r": 414.63474, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 165, "text": "2", "bbox": {"l": 411.4754, "t": 389.20004, "r": 414.63474, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 186, "label": "text", "bbox": {"l": 424.4274, "t": 389.20004, "r": 427.58673, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 166, "text": "3", "bbox": {"l": 424.4274, "t": 389.20004, "r": 427.58673, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 187, "label": "text", "bbox": {"l": 437.37939, "t": 389.20004, "r": 440.53870000000006, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 167, "text": "4", "bbox": {"l": 437.37939, "t": 389.20004, "r": 440.53870000000006, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 188, "label": "text", "bbox": {"l": 450.33136, "t": 389.20004, "r": 453.49069000000003, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 168, "text": "5", "bbox": {"l": 450.33136, "t": 389.20004, "r": 453.49069000000003, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 189, "label": "text", "bbox": {"l": 463.28336, "t": 389.20004, "r": 466.44269, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 169, "text": "6", "bbox": {"l": 463.28336, "t": 389.20004, "r": 466.44269, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 190, "label": "text", "bbox": {"l": 476.23535, "t": 389.20004, "r": 479.39468, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 170, "text": "7", "bbox": {"l": 476.23535, "t": 389.20004, "r": 479.39468, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 191, "label": "text", "bbox": {"l": 489.18735, "t": 389.20004, "r": 492.34668, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 171, "text": "8", "bbox": {"l": 489.18735, "t": 389.20004, "r": 492.34668, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 192, "label": "text", "bbox": {"l": 502.13933999999995, "t": 389.20004, "r": 505.29868000000005, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 172, "text": "9", "bbox": {"l": 502.13933999999995, "t": 389.20004, "r": 505.29868000000005, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 193, "label": "text", "bbox": {"l": 515.09131, "t": 389.20004, "r": 521.41064, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 173, "text": "10", "bbox": {"l": 515.09131, "t": 389.20004, "r": 521.41064, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 194, "label": "text", "bbox": {"l": 528.04364, "t": 389.20004, "r": 534.13104, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 174, "text": "11", "bbox": {"l": 528.04364, "t": 389.20004, "r": 534.13104, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 195, "label": "text", "bbox": {"l": 385.2814, "t": 398.97464, "r": 391.60071, "b": 405.29327, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 175, "text": "12", "bbox": {"l": 385.2814, "t": 398.97464, "r": 391.60071, "b": 405.29327, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 196, "label": "text", "bbox": {"l": 398.52341, "t": 398.97464, "r": 404.84271, "b": 405.29327, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 176, "text": "13", "bbox": {"l": 398.52341, "t": 398.97464, "r": 404.84271, "b": 405.29327, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 197, "label": "text", "bbox": {"l": 411.47604, "t": 398.97464, "r": 417.79535, "b": 405.29327, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 177, "text": "14", "bbox": {"l": 411.47604, "t": 398.97464, "r": 417.79535, "b": 405.29327, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 198, "label": "text", "bbox": {"l": 424.42719, "t": 406.77463000000006, "r": 430.74648999999994, "b": 413.09326, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 178, "text": "15", "bbox": {"l": 424.42719, "t": 406.77463000000006, "r": 430.74648999999994, "b": 413.09326, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 199, "label": "text", "bbox": {"l": 502.86941999999993, "t": 410.99438, "r": 509.18871999999993, "b": 417.31302, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 179, "text": "29", "bbox": {"l": 502.86941999999993, "t": 410.99438, "r": 509.18871999999993, "b": 417.31302, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 200, "label": "text", "bbox": {"l": 384.35437, "t": 381.77722, "r": 430.99261, "b": 386.44281, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 180, "text": "Predicted Structure", "bbox": {"l": 384.35437, "t": 381.77722, "r": 430.99261, "b": 386.44281, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "caption", "id": 5, "page_no": 7, "cluster": {"id": 5, "label": "caption", "bbox": {"l": 62.595001, "t": 458.72836, "r": 532.63049, "b": 467.63492, "coord_origin": "TOPLEFT"}, "confidence": 0.9153602719306946, "cells": [{"id": 181, "text": "Figure 6: An example of TableFormer predictions (bounding boxes and structure) from generated SynthTabNet table.", "bbox": {"l": 62.595001, "t": 458.72836, "r": 532.63049, "b": 467.63492, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 6: An example of TableFormer predictions (bounding boxes and structure) from generated SynthTabNet table."}, {"label": "section_header", "id": 2, "page_no": 7, "cluster": {"id": 2, "label": "section_header", "bbox": {"l": 50.112, "t": 491.39536, "r": 163.7558, "b": 501.24741, "coord_origin": "TOPLEFT"}, "confidence": 0.9561247229576111, "cells": [{"id": 182, "text": "5.5.", "bbox": {"l": 50.112, "t": 491.39536, "r": 64.448898, "b": 501.24741, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "Qualitative Analysis", "bbox": {"l": 74.006828, "t": 491.39536, "r": 163.7558, "b": 501.24741, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5.5. Qualitative Analysis"}, {"label": "text", "id": 1, "page_no": 7, "cluster": {"id": 1, "label": "text", "bbox": {"l": 50.112, "t": 536.87337, "r": 286.36511, "b": 713.1519470000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9852361679077148, "cells": [{"id": 184, "text": "We showcase several visualizations for the different", "bbox": {"l": 62.067001, "t": 536.87337, "r": 286.36499, "b": 545.77992, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": "components of our network on various", "bbox": {"l": 50.112, "t": 548.82837, "r": 211.15741, "b": 557.73492, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "\u201ccomplex\u201d", "bbox": {"l": 215.10000999999997, "t": 548.91803, "r": 259.17453, "b": 557.50578, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "tables", "bbox": {"l": 263.12, "t": 548.82837, "r": 286.36273, "b": 557.73492, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": "within datasets presented in this work in Fig. 5 and Fig. 6", "bbox": {"l": 50.112, "t": 560.78337, "r": 286.36505, "b": 569.68993, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "As it is shown, our model is able to predict bounding boxes", "bbox": {"l": 50.112, "t": 572.73837, "r": 286.36508, "b": 581.6449299999999, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "for all table cells, even for the empty ones. Additionally,", "bbox": {"l": 50.112, "t": 584.69337, "r": 286.36508, "b": 593.59993, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "our post-processing techniques can extract the cell content", "bbox": {"l": 50.112, "t": 596.64937, "r": 286.36505, "b": 605.55592, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": "by matching the predicted bounding boxes to the PDF cells", "bbox": {"l": 50.112, "t": 608.60437, "r": 286.36508, "b": 617.51093, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "based on their overlap and spatial proximity. The left part", "bbox": {"l": 50.112, "t": 620.55937, "r": 286.36508, "b": 629.46593, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "of Fig. 5 demonstrates also the adaptability of our method", "bbox": {"l": 50.112, "t": 632.51437, "r": 286.36508, "b": 641.42093, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "to any language, as it can successfully extract Japanese", "bbox": {"l": 50.112, "t": 644.46938, "r": 286.36508, "b": 653.37593, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "text, although the training set contains only English content.", "bbox": {"l": 50.112, "t": 656.42438, "r": 286.36511, "b": 665.33094, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "We provide more visualizations including the intermediate", "bbox": {"l": 50.112, "t": 668.38037, "r": 286.36508, "b": 677.28694, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "steps in the supplementary material. Overall these illustra-", "bbox": {"l": 50.112, "t": 680.33537, "r": 286.36511, "b": 689.24194, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "tions justify the versatility of our method across a diverse", "bbox": {"l": 50.112, "t": 692.290375, "r": 286.36511, "b": 701.196945, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "range of table appearances and content type.", "bbox": {"l": 50.112, "t": 704.245377, "r": 226.88833999999997, "b": 713.1519470000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "We showcase several visualizations for the different components of our network on various \u201ccomplex\u201d tables within datasets presented in this work in Fig. 5 and Fig. 6 As it is shown, our model is able to predict bounding boxes for all table cells, even for the empty ones. Additionally, our post-processing techniques can extract the cell content by matching the predicted bounding boxes to the PDF cells based on their overlap and spatial proximity. The left part of Fig. 5 demonstrates also the adaptability of our method to any language, as it can successfully extract Japanese text, although the training set contains only English content. We provide more visualizations including the intermediate steps in the supplementary material. Overall these illustrations justify the versatility of our method across a diverse range of table appearances and content type."}, {"label": "section_header", "id": 4, "page_no": 7, "cluster": {"id": 4, "label": "section_header", "bbox": {"l": 308.862, "t": 490.70892, "r": 460.84848, "b": 501.45663, "coord_origin": "TOPLEFT"}, "confidence": 0.9436525702476501, "cells": [{"id": 201, "text": "6.", "bbox": {"l": 308.862, "t": 490.70892, "r": 316.07382, "b": 501.45663, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": "Future Work & Conclusion", "bbox": {"l": 325.68954, "t": 490.70892, "r": 460.84848, "b": 501.45663, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "6. Future Work & Conclusion"}, {"label": "text", "id": 0, "page_no": 7, "cluster": {"id": 0, "label": "text", "bbox": {"l": 308.862, "t": 512.89337, "r": 545.11517, "b": 653.30592, "coord_origin": "TOPLEFT"}, "confidence": 0.9875594973564148, "cells": [{"id": 203, "text": "In this paper, we presented TableFormer an end-to-end", "bbox": {"l": 320.81699, "t": 512.89337, "r": 545.11505, "b": 521.79993, "coord_origin": "TOPLEFT"}}, {"id": 204, "text": "transformer based approach to predict table structures and", "bbox": {"l": 308.862, "t": 524.84836, "r": 545.11517, "b": 533.75491, "coord_origin": "TOPLEFT"}}, {"id": 205, "text": "bounding boxes of cells from an image. This approach en-", "bbox": {"l": 308.862, "t": 536.80336, "r": 545.11511, "b": 545.70992, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": "ables us to recreate the table structure, and extract the cell", "bbox": {"l": 308.862, "t": 548.75836, "r": 545.11505, "b": 557.6649199999999, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": "content from PDF or OCR by using bounding boxes. Ad-", "bbox": {"l": 308.862, "t": 560.71336, "r": 545.11517, "b": 569.61992, "coord_origin": "TOPLEFT"}}, {"id": 208, "text": "ditionally, it provides the versatility required in real-world", "bbox": {"l": 308.862, "t": 572.66837, "r": 545.11511, "b": 581.57492, "coord_origin": "TOPLEFT"}}, {"id": 209, "text": "scenarios when dealing with various types of PDF docu-", "bbox": {"l": 308.862, "t": 584.62436, "r": 545.11511, "b": 593.53091, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": "ments, and languages.", "bbox": {"l": 308.862, "t": 596.57936, "r": 400.46808, "b": 605.48592, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "Furthermore, our method outper-", "bbox": {"l": 408.37839, "t": 596.57936, "r": 545.11511, "b": 605.48592, "coord_origin": "TOPLEFT"}}, {"id": 212, "text": "forms all state-of-the-arts with a wide margin. Finally, we", "bbox": {"l": 308.862, "t": 608.53436, "r": 545.11505, "b": 617.44092, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "introduce \u201cSynthTabNet\u201d a challenging synthetically gen-", "bbox": {"l": 308.862, "t": 620.48936, "r": 545.11511, "b": 629.3959199999999, "coord_origin": "TOPLEFT"}}, {"id": 214, "text": "erated dataset that reinforces missing characteristics from", "bbox": {"l": 308.862, "t": 632.4443699999999, "r": 545.11505, "b": 641.35092, "coord_origin": "TOPLEFT"}}, {"id": 215, "text": "other datasets.", "bbox": {"l": 308.862, "t": 644.39937, "r": 365.85803, "b": 653.30592, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In this paper, we presented TableFormer an end-to-end transformer based approach to predict table structures and bounding boxes of cells from an image. This approach enables us to recreate the table structure, and extract the cell content from PDF or OCR by using bounding boxes. Additionally, it provides the versatility required in real-world scenarios when dealing with various types of PDF documents, and languages. Furthermore, our method outperforms all state-of-the-arts with a wide margin. Finally, we introduce \u201cSynthTabNet\u201d a challenging synthetically generated dataset that reinforces missing characteristics from other datasets."}, {"label": "section_header", "id": 3, "page_no": 7, "cluster": {"id": 3, "label": "section_header", "bbox": {"l": 308.862, "t": 672.09892, "r": 364.40585, "b": 682.84664, "coord_origin": "TOPLEFT"}, "confidence": 0.9442470073699951, "cells": [{"id": 216, "text": "References", "bbox": {"l": 308.862, "t": 672.09892, "r": 364.40585, "b": 682.84664, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "References"}, {"label": "list_item", "id": 10, "page_no": 7, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 313.345, "t": 693.9617920000001, "r": 545.1134, "b": 712.936752, "coord_origin": "TOPLEFT"}, "confidence": 0.8318753838539124, "cells": [{"id": 217, "text": "[1]", "bbox": {"l": 313.345, "t": 693.9617920000001, "r": 323.80792, "b": 701.977753, "coord_origin": "TOPLEFT"}}, {"id": 218, "text": "Nicolas Carion, Francisco Massa, Gabriel Synnaeve, Nicolas", "bbox": {"l": 326.05127, "t": 693.9617920000001, "r": 545.10852, "b": 701.977753, "coord_origin": "TOPLEFT"}}, {"id": 219, "text": "Usunier, Alexander Kirillov, and Sergey Zagoruyko. End-to-", "bbox": {"l": 328.78101, "t": 704.920792, "r": 545.1134, "b": 712.936752, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[1] Nicolas Carion, Francisco Massa, Gabriel Synnaeve, Nicolas Usunier, Alexander Kirillov, and Sergey Zagoruyko. End-to-"}, {"label": "page_footer", "id": 9, "page_no": 7, "cluster": {"id": 9, "label": "page_footer", "bbox": {"l": 295.121, "t": 734.133366, "r": 300.10229, "b": 743.039928, "coord_origin": "TOPLEFT"}, "confidence": 0.8709858059883118, "cells": [{"id": 220, "text": "8", "bbox": {"l": 295.121, "t": 734.133366, "r": 300.10229, "b": 743.039928, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "8"}, {"label": "picture", "id": 15, "page_no": 7, "cluster": {"id": 15, "label": "picture", "bbox": {"l": 305.5836486816406, "t": 98.65415954589844, "r": 554.8258666992188, "b": 180.6267547607422, "coord_origin": "TOPLEFT"}, "confidence": 0.7699173092842102, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "picture", "id": 14, "page_no": 7, "cluster": {"id": 14, "label": "picture", "bbox": {"l": 49.97503662109375, "t": 103.71266174316406, "r": 301.6335754394531, "b": 187.5789337158203, "coord_origin": "TOPLEFT"}, "confidence": 0.7873926162719727, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "body": [{"label": "caption", "id": 18, "page_no": 7, "cluster": {"id": 18, "label": "caption", "bbox": {"l": 53.811783000000005, "t": 208.23328000000004, "r": 385.93451, "b": 216.10645, "coord_origin": "TOPLEFT"}, "confidence": 0.5986505746841431, "cells": [{"id": 0, "text": "b.", "bbox": {"l": 53.811783000000005, "t": 208.23328000000004, "r": 62.219952, "b": 216.10645, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Structure predicted by TableFormer, with superimposed matched PDF cell text:", "bbox": {"l": 66.424026, "t": 208.23328000000004, "r": 385.93451, "b": 216.10645, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "b. Structure predicted by TableFormer, with superimposed matched PDF cell text:"}, {"label": "section_header", "id": 29, "page_no": 7, "cluster": {"id": 29, "label": "section_header", "bbox": {"l": 53.811783000000005, "t": 94.28112999999996, "r": 284.34592, "b": 102.15430000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.46452972292900085, "cells": [{"id": 2, "text": "Japanese language (previously unseen by TableFormer):", "bbox": {"l": 53.811783000000005, "t": 94.28112999999996, "r": 284.34592, "b": 102.15430000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Japanese language (previously unseen by TableFormer):"}, {"label": "section_header", "id": 31, "page_no": 7, "cluster": {"id": 31, "label": "section_header", "bbox": {"l": 304.83081, "t": 94.28112999999996, "r": 431.09119, "b": 102.15430000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.4629225730895996, "cells": [{"id": 3, "text": "Example table from FinTabNet:", "bbox": {"l": 304.83081, "t": 94.28112999999996, "r": 431.09119, "b": 102.15430000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Example table from FinTabNet:"}, {"label": "list_item", "id": 20, "page_no": 7, "cluster": {"id": 20, "label": "list_item", "bbox": {"l": 53.286037, "t": 78.68756000000008, "r": 61.550289, "b": 86.56073000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.5820134282112122, "cells": [{"id": 4, "text": "a.", "bbox": {"l": 53.286037, "t": 78.68756000000008, "r": 61.550289, "b": 86.56073000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "a."}, {"label": "list_item", "id": 21, "page_no": 7, "cluster": {"id": 21, "label": "list_item", "bbox": {"l": 65.682419, "t": 78.68756000000008, "r": 499.55563, "b": 86.56073000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.541211724281311, "cells": [{"id": 5, "text": "Red - PDF cells, Green - predicted bounding boxes, Blue - post-processed predictions matched to PDF cells", "bbox": {"l": 65.682419, "t": 78.68756000000008, "r": 499.55563, "b": 86.56073000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Red - PDF cells, Green - predicted bounding boxes, Blue - post-processed predictions matched to PDF cells"}, {"label": "table", "id": 8, "page_no": 7, "cluster": {"id": 8, "label": "table", "bbox": {"l": 53.62853240966797, "t": 218.94857788085938, "r": 298.5574951171875, "b": 292.39996337890625, "coord_origin": "TOPLEFT"}, "confidence": 0.8824009299278259, "cells": [{"id": 6, "text": "\u8ad6\u6587\u30d5\u30a1\u30a4\u30eb", "bbox": {"l": 209.93285, "t": 222.18073000000004, "r": 241.04458999999997, "b": 226.36212, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "\u53c2\u8003\u6587\u732e", "bbox": {"l": 263.76489, "t": 222.18073000000004, "r": 284.50589, "b": 226.36212, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "\u51fa\u5178", "bbox": {"l": 110.24990999999999, "t": 229.66594999999995, "r": 120.62018, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "\u30d5\u30a1\u30a4\u30eb", "bbox": {"l": 175.36609, "t": 229.66594999999995, "r": 196.1071, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "\u6570", "bbox": {"l": 196.10756, "t": 229.66594999999995, "r": 201.29247, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "\u82f1\u8a9e", "bbox": {"l": 209.62408, "t": 229.66594999999995, "r": 219.99435, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "\u65e5\u672c\u8a9e", "bbox": {"l": 229.19814, "t": 229.66594999999995, "r": 244.75377, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "\u82f1\u8a9e", "bbox": {"l": 256.1142, "t": 229.66594999999995, "r": 266.48447, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "\u65e5\u672c\u8a9e", "bbox": {"l": 278.38434, "t": 229.66594999999995, "r": 293.93997, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Association for Computational Linguistics(ACL2003)", "bbox": {"l": 55.53052099999999, "t": 236.42584, "r": 162.7131, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "65", "bbox": {"l": 184.39731, "t": 236.42584, "r": 189.56456, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "65", "bbox": {"l": 208.99026, "t": 236.42584, "r": 214.15752, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "0", "bbox": {"l": 234.87517, "t": 236.42584, "r": 237.45833000000002, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "150", "bbox": {"l": 256.88446, "t": 236.42584, "r": 264.6358, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "0", "bbox": {"l": 284.06134, "t": 236.42584, "r": 286.6445, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Computational Linguistics(COLING2002)", "bbox": {"l": 55.53052099999999, "t": 242.62048000000004, "r": 139.72253, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "140", "bbox": {"l": 183.10536, "t": 242.62048000000004, "r": 190.8567, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "140", "bbox": {"l": 207.69832, "t": 242.62048000000004, "r": 215.44965999999997, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "0", "bbox": {"l": 234.87517, "t": 242.62048000000004, "r": 237.45833000000002, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "150", "bbox": {"l": 256.88446, "t": 242.62048000000004, "r": 264.6358, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "0", "bbox": {"l": 284.06134, "t": 242.62048000000004, "r": 286.6445, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "\u96fb\u6c17\u60c5\u5831\u901a\u4fe1\u5b66\u4f1a", "bbox": {"l": 55.53052099999999, "t": 249.79845999999998, "r": 97.013, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "2003", "bbox": {"l": 92.698288, "t": 249.58942000000002, "r": 103.03371, "b": 253.94732999999997, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "\u5e74\u7dcf\u5408\u5927\u4f1a", "bbox": {"l": 103.03389, "t": 249.79845999999998, "r": 128.96027, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "150", "bbox": {"l": 183.10536, "t": 248.81506000000002, "r": 190.8567, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "8", "bbox": {"l": 210.28223, "t": 248.81506000000002, "r": 212.86539, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "142", "bbox": {"l": 232.29153, "t": 248.81506000000002, "r": 240.04287999999997, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "223", "bbox": {"l": 256.88446, "t": 248.81506000000002, "r": 264.6358, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "147", "bbox": {"l": 281.47742, "t": 248.81506000000002, "r": 289.22876, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "\u60c5\u5831\u51e6\u7406\u5b66\u4f1a\u7b2c", "bbox": {"l": 55.53052099999999, "t": 257.28369, "r": 91.827637, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "65", "bbox": {"l": 88.052673, "t": 257.07465, "r": 93.219925, "b": 261.43255999999997, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "\u56de\u5168\u56fd\u5927\u4f1a", "bbox": {"l": 93.220474, "t": 257.28369, "r": 119.14685, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "(2003)", "bbox": {"l": 116.45073999999998, "t": 257.07465, "r": 129.88177, "b": 261.43255999999997, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "177", "bbox": {"l": 183.10536, "t": 256.30029, "r": 190.8567, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "1", "bbox": {"l": 210.28223, "t": 256.30029, "r": 212.86539, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "176", "bbox": {"l": 232.29153, "t": 256.30029, "r": 240.04287999999997, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "150", "bbox": {"l": 256.88446, "t": 256.30029, "r": 264.6358, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "236", "bbox": {"l": 281.47742, "t": 256.30029, "r": 289.22876, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "\u7b2c", "bbox": {"l": 55.53052099999999, "t": 264.5108, "r": 60.715424, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "17", "bbox": {"l": 60.17654799999999, "t": 264.30175999999994, "r": 65.343796, "b": 268.65967, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "\u56de\u4eba\u5de5\u77e5\u80fd\u5b66\u4f1a\u5168\u56fd\u5927\u4f1a", "bbox": {"l": 65.344376, "t": 264.5108, "r": 122.38297000000001, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "(2003)", "bbox": {"l": 116.45073999999998, "t": 264.30175999999994, "r": 129.88177, "b": 268.65967, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "208", "bbox": {"l": 183.10536, "t": 263.52739999999994, "r": 190.8567, "b": 267.88531, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "5", "bbox": {"l": 210.28223, "t": 263.52739999999994, "r": 212.86539, "b": 267.88531, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "203", "bbox": {"l": 232.29153, "t": 263.52739999999994, "r": 240.04287999999997, "b": 267.88531, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "152", "bbox": {"l": 256.88446, "t": 263.52739999999994, "r": 264.6358, "b": 267.88531, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "244", "bbox": {"l": 281.47742, "t": 263.52739999999994, "r": 289.22876, "b": 267.88531, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "\u81ea\u7136\u8a00\u8a9e\u51e6\u7406\u7814\u7a76\u4f1a\u7b2c", "bbox": {"l": 55.53052099999999, "t": 271.73785, "r": 107.38374, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "146", "bbox": {"l": 101.99034, "t": 271.52881, "r": 109.74168000000002, "b": 275.88671999999997, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "\u301c", "bbox": {"l": 109.74204, "t": 271.73785, "r": 114.92695000000002, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "155", "bbox": {"l": 114.38793, "t": 271.52881, "r": 122.13927, "b": 275.88671999999997, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "\u56de", "bbox": {"l": 122.13963, "t": 271.73785, "r": 127.32454000000001, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "98", "bbox": {"l": 184.39731, "t": 270.75446, "r": 189.56456, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "2", "bbox": {"l": 210.28223, "t": 270.75446, "r": 212.86539, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "96", "bbox": {"l": 233.58348, "t": 270.75446, "r": 238.75072999999998, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "150", "bbox": {"l": 256.88446, "t": 270.75446, "r": 264.6358, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "232", "bbox": {"l": 281.47742, "t": 270.75446, "r": 289.22876, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "WWW", "bbox": {"l": 55.53052099999999, "t": 279.01392, "r": 68.68605, "b": 283.37183, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "\u304b\u3089\u53ce\u96c6\u3057\u305f\u8ad6\u6587", "bbox": {"l": 68.685814, "t": 279.22295999999994, "r": 110.16829999999999, "b": 283.40436, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "107", "bbox": {"l": 183.10536, "t": 277.98157000000003, "r": 190.8567, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "73", "bbox": {"l": 208.99026, "t": 277.98157000000003, "r": 214.15752, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "34", "bbox": {"l": 233.58348, "t": 277.98157000000003, "r": 238.75072999999998, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "147", "bbox": {"l": 256.88446, "t": 277.98157000000003, "r": 264.6358, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "96", "bbox": {"l": 282.76938, "t": 277.98157000000003, "r": 287.93661, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "\u8a08", "bbox": {"l": 169.61508, "t": 286.45004, "r": 174.79999, "b": 290.63141, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "945", "bbox": {"l": 183.10536, "t": 285.46667, "r": 190.8567, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "294", "bbox": {"l": 207.69832, "t": 285.46667, "r": 215.44965999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "651", "bbox": {"l": 232.29153, "t": 285.46667, "r": 240.04287999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "1122", "bbox": {"l": 255.76506, "t": 285.46667, "r": 265.75204, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "955", "bbox": {"l": 281.47742, "t": 285.46667, "r": 289.22876, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}], "children": [{"id": 32, "label": "text", "bbox": {"l": 209.93285, "t": 222.18073000000004, "r": 241.04458999999997, "b": 226.36212, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": "\u8ad6\u6587\u30d5\u30a1\u30a4\u30eb", "bbox": {"l": 209.93285, "t": 222.18073000000004, "r": 241.04458999999997, "b": 226.36212, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 263.76489, "t": 222.18073000000004, "r": 284.50589, "b": 226.36212, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "\u53c2\u8003\u6587\u732e", "bbox": {"l": 263.76489, "t": 222.18073000000004, "r": 284.50589, "b": 226.36212, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 110.24990999999999, "t": 229.66594999999995, "r": 120.62018, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "\u51fa\u5178", "bbox": {"l": 110.24990999999999, "t": 229.66594999999995, "r": 120.62018, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 175.36609, "t": 229.66594999999995, "r": 196.1071, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "\u30d5\u30a1\u30a4\u30eb", "bbox": {"l": 175.36609, "t": 229.66594999999995, "r": 196.1071, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 196.10756, "t": 229.66594999999995, "r": 201.29247, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "\u6570", "bbox": {"l": 196.10756, "t": 229.66594999999995, "r": 201.29247, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 209.62408, "t": 229.66594999999995, "r": 219.99435, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "\u82f1\u8a9e", "bbox": {"l": 209.62408, "t": 229.66594999999995, "r": 219.99435, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 229.19814, "t": 229.66594999999995, "r": 244.75377, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "\u65e5\u672c\u8a9e", "bbox": {"l": 229.19814, "t": 229.66594999999995, "r": 244.75377, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 256.1142, "t": 229.66594999999995, "r": 266.48447, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "\u82f1\u8a9e", "bbox": {"l": 256.1142, "t": 229.66594999999995, "r": 266.48447, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 278.38434, "t": 229.66594999999995, "r": 293.93997, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "\u65e5\u672c\u8a9e", "bbox": {"l": 278.38434, "t": 229.66594999999995, "r": 293.93997, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 55.53052099999999, "t": 236.42584, "r": 162.7131, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "Association for Computational Linguistics(ACL2003)", "bbox": {"l": 55.53052099999999, "t": 236.42584, "r": 162.7131, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 184.39731, "t": 236.42584, "r": 189.56456, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "65", "bbox": {"l": 184.39731, "t": 236.42584, "r": 189.56456, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 208.99026, "t": 236.42584, "r": 214.15752, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "65", "bbox": {"l": 208.99026, "t": 236.42584, "r": 214.15752, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 234.87517, "t": 236.42584, "r": 237.45833000000002, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "0", "bbox": {"l": 234.87517, "t": 236.42584, "r": 237.45833000000002, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 256.88446, "t": 236.42584, "r": 264.6358, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "150", "bbox": {"l": 256.88446, "t": 236.42584, "r": 264.6358, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 284.06134, "t": 236.42584, "r": 286.6445, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "0", "bbox": {"l": 284.06134, "t": 236.42584, "r": 286.6445, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 55.53052099999999, "t": 242.62048000000004, "r": 139.72253, "b": 246.97839, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "Computational Linguistics(COLING2002)", "bbox": {"l": 55.53052099999999, "t": 242.62048000000004, "r": 139.72253, "b": 246.97839, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 183.10536, "t": 242.62048000000004, "r": 190.8567, "b": 246.97839, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "140", "bbox": {"l": 183.10536, "t": 242.62048000000004, "r": 190.8567, "b": 246.97839, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 207.69832, "t": 242.62048000000004, "r": 215.44965999999997, "b": 246.97839, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "140", "bbox": {"l": 207.69832, "t": 242.62048000000004, "r": 215.44965999999997, "b": 246.97839, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 234.87517, "t": 242.62048000000004, "r": 237.45833000000002, "b": 246.97839, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "0", "bbox": {"l": 234.87517, "t": 242.62048000000004, "r": 237.45833000000002, "b": 246.97839, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 256.88446, "t": 242.62048000000004, "r": 264.6358, "b": 246.97839, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "150", "bbox": {"l": 256.88446, "t": 242.62048000000004, "r": 264.6358, "b": 246.97839, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 284.06134, "t": 242.62048000000004, "r": 286.6445, "b": 246.97839, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "0", "bbox": {"l": 284.06134, "t": 242.62048000000004, "r": 286.6445, "b": 246.97839, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 55.53052099999999, "t": 249.79845999999998, "r": 97.013, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "\u96fb\u6c17\u60c5\u5831\u901a\u4fe1\u5b66\u4f1a", "bbox": {"l": 55.53052099999999, "t": 249.79845999999998, "r": 97.013, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 92.698288, "t": 249.58942000000002, "r": 103.03371, "b": 253.94732999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "2003", "bbox": {"l": 92.698288, "t": 249.58942000000002, "r": 103.03371, "b": 253.94732999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 103.03389, "t": 249.79845999999998, "r": 128.96027, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "\u5e74\u7dcf\u5408\u5927\u4f1a", "bbox": {"l": 103.03389, "t": 249.79845999999998, "r": 128.96027, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 183.10536, "t": 248.81506000000002, "r": 190.8567, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "150", "bbox": {"l": 183.10536, "t": 248.81506000000002, "r": 190.8567, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 210.28223, "t": 248.81506000000002, "r": 212.86539, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "8", "bbox": {"l": 210.28223, "t": 248.81506000000002, "r": 212.86539, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 232.29153, "t": 248.81506000000002, "r": 240.04287999999997, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "142", "bbox": {"l": 232.29153, "t": 248.81506000000002, "r": 240.04287999999997, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 256.88446, "t": 248.81506000000002, "r": 264.6358, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "223", "bbox": {"l": 256.88446, "t": 248.81506000000002, "r": 264.6358, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 281.47742, "t": 248.81506000000002, "r": 289.22876, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "147", "bbox": {"l": 281.47742, "t": 248.81506000000002, "r": 289.22876, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 55.53052099999999, "t": 257.28369, "r": 91.827637, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "\u60c5\u5831\u51e6\u7406\u5b66\u4f1a\u7b2c", "bbox": {"l": 55.53052099999999, "t": 257.28369, "r": 91.827637, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 88.052673, "t": 257.07465, "r": 93.219925, "b": 261.43255999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "65", "bbox": {"l": 88.052673, "t": 257.07465, "r": 93.219925, "b": 261.43255999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 93.220474, "t": 257.28369, "r": 119.14685, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "\u56de\u5168\u56fd\u5927\u4f1a", "bbox": {"l": 93.220474, "t": 257.28369, "r": 119.14685, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 116.45073999999998, "t": 257.07465, "r": 129.88177, "b": 261.43255999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "(2003)", "bbox": {"l": 116.45073999999998, "t": 257.07465, "r": 129.88177, "b": 261.43255999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 183.10536, "t": 256.30029, "r": 190.8567, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "177", "bbox": {"l": 183.10536, "t": 256.30029, "r": 190.8567, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 210.28223, "t": 256.30029, "r": 212.86539, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "1", "bbox": {"l": 210.28223, "t": 256.30029, "r": 212.86539, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 232.29153, "t": 256.30029, "r": 240.04287999999997, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "176", "bbox": {"l": 232.29153, "t": 256.30029, "r": 240.04287999999997, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 256.88446, "t": 256.30029, "r": 264.6358, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "150", "bbox": {"l": 256.88446, "t": 256.30029, "r": 264.6358, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 281.47742, "t": 256.30029, "r": 289.22876, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "236", "bbox": {"l": 281.47742, "t": 256.30029, "r": 289.22876, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 55.53052099999999, "t": 264.5108, "r": 60.715424, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "\u7b2c", "bbox": {"l": 55.53052099999999, "t": 264.5108, "r": 60.715424, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 60.17654799999999, "t": 264.30175999999994, "r": 65.343796, "b": 268.65967, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "17", "bbox": {"l": 60.17654799999999, "t": 264.30175999999994, "r": 65.343796, "b": 268.65967, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 65.344376, "t": 264.5108, "r": 122.38297000000001, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "\u56de\u4eba\u5de5\u77e5\u80fd\u5b66\u4f1a\u5168\u56fd\u5927\u4f1a", "bbox": {"l": 65.344376, "t": 264.5108, "r": 122.38297000000001, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 116.45073999999998, "t": 264.30175999999994, "r": 129.88177, "b": 268.65967, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "(2003)", "bbox": {"l": 116.45073999999998, "t": 264.30175999999994, "r": 129.88177, "b": 268.65967, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 183.10536, "t": 263.52739999999994, "r": 190.8567, "b": 267.88531, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "208", "bbox": {"l": 183.10536, "t": 263.52739999999994, "r": 190.8567, "b": 267.88531, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 210.28223, "t": 263.52739999999994, "r": 212.86539, "b": 267.88531, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "5", "bbox": {"l": 210.28223, "t": 263.52739999999994, "r": 212.86539, "b": 267.88531, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 232.29153, "t": 263.52739999999994, "r": 240.04287999999997, "b": 267.88531, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "203", "bbox": {"l": 232.29153, "t": 263.52739999999994, "r": 240.04287999999997, "b": 267.88531, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 256.88446, "t": 263.52739999999994, "r": 264.6358, "b": 267.88531, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "152", "bbox": {"l": 256.88446, "t": 263.52739999999994, "r": 264.6358, "b": 267.88531, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 281.47742, "t": 263.52739999999994, "r": 289.22876, "b": 267.88531, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "244", "bbox": {"l": 281.47742, "t": 263.52739999999994, "r": 289.22876, "b": 267.88531, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 55.53052099999999, "t": 271.73785, "r": 107.38374, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "\u81ea\u7136\u8a00\u8a9e\u51e6\u7406\u7814\u7a76\u4f1a\u7b2c", "bbox": {"l": 55.53052099999999, "t": 271.73785, "r": 107.38374, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 101.99034, "t": 271.52881, "r": 109.74168000000002, "b": 275.88671999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "146", "bbox": {"l": 101.99034, "t": 271.52881, "r": 109.74168000000002, "b": 275.88671999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 109.74204, "t": 271.73785, "r": 114.92695000000002, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "\u301c", "bbox": {"l": 109.74204, "t": 271.73785, "r": 114.92695000000002, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 114.38793, "t": 271.52881, "r": 122.13927, "b": 275.88671999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "155", "bbox": {"l": 114.38793, "t": 271.52881, "r": 122.13927, "b": 275.88671999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 122.13963, "t": 271.73785, "r": 127.32454000000001, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "\u56de", "bbox": {"l": 122.13963, "t": 271.73785, "r": 127.32454000000001, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 184.39731, "t": 270.75446, "r": 189.56456, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "98", "bbox": {"l": 184.39731, "t": 270.75446, "r": 189.56456, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 210.28223, "t": 270.75446, "r": 212.86539, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "2", "bbox": {"l": 210.28223, "t": 270.75446, "r": 212.86539, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 233.58348, "t": 270.75446, "r": 238.75072999999998, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "96", "bbox": {"l": 233.58348, "t": 270.75446, "r": 238.75072999999998, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 256.88446, "t": 270.75446, "r": 264.6358, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "150", "bbox": {"l": 256.88446, "t": 270.75446, "r": 264.6358, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 281.47742, "t": 270.75446, "r": 289.22876, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "232", "bbox": {"l": 281.47742, "t": 270.75446, "r": 289.22876, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 55.53052099999999, "t": 279.01392, "r": 68.68605, "b": 283.37183, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "WWW", "bbox": {"l": 55.53052099999999, "t": 279.01392, "r": 68.68605, "b": 283.37183, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 68.685814, "t": 279.22295999999994, "r": 110.16829999999999, "b": 283.40436, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "\u304b\u3089\u53ce\u96c6\u3057\u305f\u8ad6\u6587", "bbox": {"l": 68.685814, "t": 279.22295999999994, "r": 110.16829999999999, "b": 283.40436, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 183.10536, "t": 277.98157000000003, "r": 190.8567, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "107", "bbox": {"l": 183.10536, "t": 277.98157000000003, "r": 190.8567, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 208.99026, "t": 277.98157000000003, "r": 214.15752, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "73", "bbox": {"l": 208.99026, "t": 277.98157000000003, "r": 214.15752, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 233.58348, "t": 277.98157000000003, "r": 238.75072999999998, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "34", "bbox": {"l": 233.58348, "t": 277.98157000000003, "r": 238.75072999999998, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 256.88446, "t": 277.98157000000003, "r": 264.6358, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "147", "bbox": {"l": 256.88446, "t": 277.98157000000003, "r": 264.6358, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 282.76938, "t": 277.98157000000003, "r": 287.93661, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "96", "bbox": {"l": 282.76938, "t": 277.98157000000003, "r": 287.93661, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 169.61508, "t": 286.45004, "r": 174.79999, "b": 290.63141, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "\u8a08", "bbox": {"l": 169.61508, "t": 286.45004, "r": 174.79999, "b": 290.63141, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 183.10536, "t": 285.46667, "r": 190.8567, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "945", "bbox": {"l": 183.10536, "t": 285.46667, "r": 190.8567, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 207.69832, "t": 285.46667, "r": 215.44965999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "294", "bbox": {"l": 207.69832, "t": 285.46667, "r": 215.44965999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 232.29153, "t": 285.46667, "r": 240.04287999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "651", "bbox": {"l": 232.29153, "t": 285.46667, "r": 240.04287999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 255.76506, "t": 285.46667, "r": 265.75204, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "1122", "bbox": {"l": 255.76506, "t": 285.46667, "r": 265.75204, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 281.47742, "t": 285.46667, "r": 289.22876, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "955", "bbox": {"l": 281.47742, "t": 285.46667, "r": 289.22876, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "lcel", "ched", "lcel", "nl", "ched", "ched", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 10, "num_cols": 6, "table_cells": [{"bbox": {"l": 209.93285, "t": 222.18073000000004, "r": 241.04458999999997, "b": 226.36212, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 4, "text": "\u8ad6\u6587\u30d5\u30a1\u30a4\u30eb", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 263.76489, "t": 222.18073000000004, "r": 284.50589, "b": 226.36212, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 4, "end_col_offset_idx": 6, "text": "\u53c2\u8003\u6587\u732e", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 110.24990999999999, "t": 229.66594999999995, "r": 120.62018, "b": 233.84735, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "\u51fa\u5178", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 175.36609, "t": 229.66594999999995, "r": 201.29247, "b": 233.84735, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "\u30d5\u30a1\u30a4\u30eb \u6570", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 209.62408, "t": 229.66594999999995, "r": 219.99435, "b": 233.84735, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "\u82f1\u8a9e", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 229.19814, "t": 229.66594999999995, "r": 244.75377, "b": 233.84735, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "\u65e5\u672c\u8a9e", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 256.1142, "t": 229.66594999999995, "r": 266.48447, "b": 233.84735, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "\u82f1\u8a9e", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 278.38434, "t": 229.66594999999995, "r": 293.93997, "b": 233.84735, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "\u65e5\u672c\u8a9e", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 55.53052099999999, "t": 236.42584, "r": 162.7131, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Association for Computational Linguistics(ACL2003)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 184.39731, "t": 236.42584, "r": 189.56456, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "65", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 208.99026, "t": 236.42584, "r": 214.15752, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "65", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 234.87517, "t": 236.42584, "r": 237.45833000000002, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446, "t": 236.42584, "r": 264.6358, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "150", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 284.06134, "t": 236.42584, "r": 286.6445, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 55.53052099999999, "t": 242.62048000000004, "r": 139.72253, "b": 246.97839, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Computational Linguistics(COLING2002)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 183.10536, "t": 242.62048000000004, "r": 190.8567, "b": 246.97839, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "140", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 207.69832, "t": 242.62048000000004, "r": 215.44965999999997, "b": 246.97839, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "140", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 234.87517, "t": 242.62048000000004, "r": 237.45833000000002, "b": 246.97839, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446, "t": 242.62048000000004, "r": 264.6358, "b": 246.97839, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "150", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 284.06134, "t": 242.62048000000004, "r": 286.6445, "b": 246.97839, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 55.53052099999999, "t": 249.58942000000002, "r": 128.96027, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "\u96fb\u6c17\u60c5\u5831\u901a\u4fe1\u5b66\u4f1a 2003 \u5e74\u7dcf\u5408\u5927\u4f1a", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 183.10536, "t": 248.81506000000002, "r": 190.8567, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "150", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 210.28223, "t": 248.81506000000002, "r": 212.86539, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.29153, "t": 248.81506000000002, "r": 240.04287999999997, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "142", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446, "t": 248.81506000000002, "r": 264.6358, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "223", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.47742, "t": 248.81506000000002, "r": 289.22876, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "147", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 55.53052099999999, "t": 257.07465, "r": 129.88177, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "\u60c5\u5831\u51e6\u7406\u5b66\u4f1a\u7b2c 65 \u56de\u5168\u56fd\u5927\u4f1a (2003)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 183.10536, "t": 256.30029, "r": 190.8567, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "177", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 210.28223, "t": 256.30029, "r": 212.86539, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.29153, "t": 256.30029, "r": 240.04287999999997, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "176", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446, "t": 256.30029, "r": 264.6358, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "150", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.47742, "t": 256.30029, "r": 289.22876, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "236", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 55.53052099999999, "t": 264.30175999999994, "r": 129.88177, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "\u7b2c 17 \u56de\u4eba\u5de5\u77e5\u80fd\u5b66\u4f1a\u5168\u56fd\u5927\u4f1a (2003)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 183.10536, "t": 263.52739999999994, "r": 190.8567, "b": 267.88531, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "208", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 210.28223, "t": 263.52739999999994, "r": 212.86539, "b": 267.88531, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.29153, "t": 263.52739999999994, "r": 240.04287999999997, "b": 267.88531, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "203", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446, "t": 263.52739999999994, "r": 264.6358, "b": 267.88531, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "152", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.47742, "t": 263.52739999999994, "r": 289.22876, "b": 267.88531, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "244", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 55.53052099999999, "t": 271.52881, "r": 127.32454000000001, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "\u81ea\u7136\u8a00\u8a9e\u51e6\u7406\u7814\u7a76\u4f1a\u7b2c 146 \u301c 155 \u56de", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 184.39731, "t": 270.75446, "r": 189.56456, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "98", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 210.28223, "t": 270.75446, "r": 212.86539, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 233.58348, "t": 270.75446, "r": 238.75072999999998, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446, "t": 270.75446, "r": 264.6358, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "150", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.47742, "t": 270.75446, "r": 289.22876, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "232", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 55.53052099999999, "t": 279.01392, "r": 110.16829999999999, "b": 283.40436, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "WWW \u304b\u3089\u53ce\u96c6\u3057\u305f\u8ad6\u6587", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 183.10536, "t": 277.98157000000003, "r": 190.8567, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "107", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 208.99026, "t": 277.98157000000003, "r": 214.15752, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "73", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 233.58348, "t": 277.98157000000003, "r": 238.75072999999998, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "34", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446, "t": 277.98157000000003, "r": 264.6358, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "147", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 282.76938, "t": 277.98157000000003, "r": 287.93661, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 183.10536, "t": 285.46667, "r": 190.8567, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "945", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 207.69832, "t": 285.46667, "r": 215.44965999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "294", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.29153, "t": 285.46667, "r": 240.04287999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "651", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 255.76506, "t": 285.46667, "r": 265.75204, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "1122", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.47742, "t": 285.46667, "r": 289.22876, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "955", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "caption", "id": 16, "page_no": 7, "cluster": {"id": 16, "label": "caption", "bbox": {"l": 380.42731, "t": 292.30426, "r": 549.42175, "b": 298.60284, "coord_origin": "TOPLEFT"}, "confidence": 0.7499915957450867, "cells": [{"id": 76, "text": "Text is aligned to match original for ease of viewing", "bbox": {"l": 380.42731, "t": 292.30426, "r": 549.42175, "b": 298.60284, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Text is aligned to match original for ease of viewing"}, {"label": "table", "id": 7, "page_no": 7, "cluster": {"id": 7, "label": "table", "bbox": {"l": 304.9219970703125, "t": 218.51486206054688, "r": 550.2321166992188, "b": 287.90069580078125, "coord_origin": "TOPLEFT"}, "confidence": 0.8899767994880676, "cells": [{"id": 77, "text": "Weighted Average Grant Date Fair", "bbox": {"l": 459.04861, "t": 221.62415, "r": 542.00018, "b": 226.68933000000004, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "Value", "bbox": {"l": 493.82193, "t": 227.83416999999997, "r": 507.2258, "b": 232.89935000000003, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "RS", "bbox": {"l": 393.2442, "t": 236.74712999999997, "r": 400.74588, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "U", "bbox": {"l": 400.74643, "t": 236.74712999999997, "r": 404.64523, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "s", "bbox": {"l": 404.6463, "t": 236.74712999999997, "r": 407.34631, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "Shares (in millions)", "bbox": {"l": 392.09671, "t": 221.57446000000004, "r": 438.0145, "b": 226.63964999999996, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "PSUs", "bbox": {"l": 427.18323, "t": 236.74712999999997, "r": 440.98778999999996, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "RSUs", "bbox": {"l": 468.38254, "t": 236.74712999999997, "r": 482.48465000000004, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "PSUs", "bbox": {"l": 516.92578, "t": 236.74712999999997, "r": 530.73035, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Nonvested on Janua", "bbox": {"l": 306.11493, "t": 244.61084000000005, "r": 355.6532, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "ry 1", "bbox": {"l": 355.65427, "t": 244.61084000000005, "r": 364.65607, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "1.", "bbox": {"l": 396.24661, "t": 244.91327, "r": 400.75238, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "1", "bbox": {"l": 400.7529, "t": 244.91327, "r": 403.75531, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "0.3", "bbox": {"l": 429.81838999999997, "t": 244.91327, "r": 437.32708999999994, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "90.10", "bbox": {"l": 465.52859, "t": 244.91327, "r": 478.40103, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "$", "bbox": {"l": 480.97552, "t": 244.91327, "r": 483.55001999999996, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "$ 91.19", "bbox": {"l": 513.44824, "t": 244.91327, "r": 531.46967, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "Granted", "bbox": {"l": 306.11493, "t": 253.68451000000005, "r": 325.62674, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "0.", "bbox": {"l": 396.24661, "t": 253.68451000000005, "r": 400.75238, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "5", "bbox": {"l": 400.7529, "t": 253.68451000000005, "r": 403.75531, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "0.1", "bbox": {"l": 429.81838999999997, "t": 253.68451000000005, "r": 437.32708999999994, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "117.44", "bbox": {"l": 466.43579000000005, "t": 253.68451000000005, "r": 482.54831, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "122.41", "bbox": {"l": 514.29065, "t": 253.68451000000005, "r": 530.80981, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "Vested", "bbox": {"l": 306.11493, "t": 261.54822, "r": 322.62866, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "(0.", "bbox": {"l": 394.43222, "t": 261.54822, "r": 400.73563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "5", "bbox": {"l": 400.73456, "t": 261.54822, "r": 403.73697, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": ")", "bbox": {"l": 403.73804, "t": 261.54822, "r": 405.53625, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "(0.1)", "bbox": {"l": 427.7016, "t": 261.54822, "r": 438.80563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "87.08", "bbox": {"l": 468.55533, "t": 261.54822, "r": 482.07043, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "81.14", "bbox": {"l": 516.01862, "t": 261.54822, "r": 529.53375, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "Canceled or forfeited", "bbox": {"l": 306.11493, "t": 269.64148, "r": 356.24771, "b": 274.70667000000003, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "(0.", "bbox": {"l": 394.43222, "t": 270.31946000000005, "r": 400.73563, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "1", "bbox": {"l": 400.73456, "t": 270.31946000000005, "r": 403.73697, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": ")", "bbox": {"l": 403.73804, "t": 270.31946000000005, "r": 405.53625, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "-", "bbox": {"l": 431.02802, "t": 270.31946000000005, "r": 436.4280099999999, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "102.01", "bbox": {"l": 465.83099000000004, "t": 270.31946000000005, "r": 482.35013, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "92.18", "bbox": {"l": 516.01862, "t": 270.31946000000005, "r": 529.53375, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "Nonvested on December 31", "bbox": {"l": 306.11493, "t": 278.48572, "r": 373.35764, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "1.0", "bbox": {"l": 396.24661, "t": 278.48572, "r": 403.75531, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "0.3", "bbox": {"l": 429.51599, "t": 278.48572, "r": 437.02469, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "104.85 $", "bbox": {"l": 463.7142, "t": 278.48572, "r": 484.73965000000004, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "$ 104.51", "bbox": {"l": 512.99463, "t": 278.48572, "r": 534.02008, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}], "children": [{"id": 102, "label": "text", "bbox": {"l": 459.04861, "t": 221.62415, "r": 542.00018, "b": 226.68933000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "Weighted Average Grant Date Fair", "bbox": {"l": 459.04861, "t": 221.62415, "r": 542.00018, "b": 226.68933000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 493.82193, "t": 227.83416999999997, "r": 507.2258, "b": 232.89935000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "Value", "bbox": {"l": 493.82193, "t": 227.83416999999997, "r": 507.2258, "b": 232.89935000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 393.2442, "t": 236.74712999999997, "r": 400.74588, "b": 241.81232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "RS", "bbox": {"l": 393.2442, "t": 236.74712999999997, "r": 400.74588, "b": 241.81232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 400.74643, "t": 236.74712999999997, "r": 404.64523, "b": 241.81232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "U", "bbox": {"l": 400.74643, "t": 236.74712999999997, "r": 404.64523, "b": 241.81232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 404.6463, "t": 236.74712999999997, "r": 407.34631, "b": 241.81232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "s", "bbox": {"l": 404.6463, "t": 236.74712999999997, "r": 407.34631, "b": 241.81232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 392.09671, "t": 221.57446000000004, "r": 438.0145, "b": 226.63964999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "Shares (in millions)", "bbox": {"l": 392.09671, "t": 221.57446000000004, "r": 438.0145, "b": 226.63964999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 427.18323, "t": 236.74712999999997, "r": 440.98778999999996, "b": 241.81232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "PSUs", "bbox": {"l": 427.18323, "t": 236.74712999999997, "r": 440.98778999999996, "b": 241.81232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 468.38254, "t": 236.74712999999997, "r": 482.48465000000004, "b": 241.81232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "RSUs", "bbox": {"l": 468.38254, "t": 236.74712999999997, "r": 482.48465000000004, "b": 241.81232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 516.92578, "t": 236.74712999999997, "r": 530.73035, "b": 241.81232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "PSUs", "bbox": {"l": 516.92578, "t": 236.74712999999997, "r": 530.73035, "b": 241.81232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 306.11493, "t": 244.61084000000005, "r": 355.6532, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "Nonvested on Janua", "bbox": {"l": 306.11493, "t": 244.61084000000005, "r": 355.6532, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 355.65427, "t": 244.61084000000005, "r": 364.65607, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "ry 1", "bbox": {"l": 355.65427, "t": 244.61084000000005, "r": 364.65607, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 396.24661, "t": 244.91327, "r": 400.75238, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "1.", "bbox": {"l": 396.24661, "t": 244.91327, "r": 400.75238, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 114, "label": "text", "bbox": {"l": 400.7529, "t": 244.91327, "r": 403.75531, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "1", "bbox": {"l": 400.7529, "t": 244.91327, "r": 403.75531, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 115, "label": "text", "bbox": {"l": 429.81838999999997, "t": 244.91327, "r": 437.32708999999994, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "0.3", "bbox": {"l": 429.81838999999997, "t": 244.91327, "r": 437.32708999999994, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 116, "label": "text", "bbox": {"l": 465.52859, "t": 244.91327, "r": 478.40103, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "90.10", "bbox": {"l": 465.52859, "t": 244.91327, "r": 478.40103, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 117, "label": "text", "bbox": {"l": 480.97552, "t": 244.91327, "r": 483.55001999999996, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "$", "bbox": {"l": 480.97552, "t": 244.91327, "r": 483.55001999999996, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 118, "label": "text", "bbox": {"l": 513.44824, "t": 244.91327, "r": 531.46967, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "$ 91.19", "bbox": {"l": 513.44824, "t": 244.91327, "r": 531.46967, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 119, "label": "text", "bbox": {"l": 306.11493, "t": 253.68451000000005, "r": 325.62674, "b": 258.74969, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "Granted", "bbox": {"l": 306.11493, "t": 253.68451000000005, "r": 325.62674, "b": 258.74969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 120, "label": "text", "bbox": {"l": 396.24661, "t": 253.68451000000005, "r": 400.75238, "b": 258.74969, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "0.", "bbox": {"l": 396.24661, "t": 253.68451000000005, "r": 400.75238, "b": 258.74969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 121, "label": "text", "bbox": {"l": 400.7529, "t": 253.68451000000005, "r": 403.75531, "b": 258.74969, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "5", "bbox": {"l": 400.7529, "t": 253.68451000000005, "r": 403.75531, "b": 258.74969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 122, "label": "text", "bbox": {"l": 429.81838999999997, "t": 253.68451000000005, "r": 437.32708999999994, "b": 258.74969, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "0.1", "bbox": {"l": 429.81838999999997, "t": 253.68451000000005, "r": 437.32708999999994, "b": 258.74969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 123, "label": "text", "bbox": {"l": 466.43579000000005, "t": 253.68451000000005, "r": 482.54831, "b": 258.74969, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "117.44", "bbox": {"l": 466.43579000000005, "t": 253.68451000000005, "r": 482.54831, "b": 258.74969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 124, "label": "text", "bbox": {"l": 514.29065, "t": 253.68451000000005, "r": 530.80981, "b": 258.74969, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "122.41", "bbox": {"l": 514.29065, "t": 253.68451000000005, "r": 530.80981, "b": 258.74969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 125, "label": "text", "bbox": {"l": 306.11493, "t": 261.54822, "r": 322.62866, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "Vested", "bbox": {"l": 306.11493, "t": 261.54822, "r": 322.62866, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 126, "label": "text", "bbox": {"l": 394.43222, "t": 261.54822, "r": 400.73563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "(0.", "bbox": {"l": 394.43222, "t": 261.54822, "r": 400.73563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 127, "label": "text", "bbox": {"l": 400.73456, "t": 261.54822, "r": 403.73697, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "5", "bbox": {"l": 400.73456, "t": 261.54822, "r": 403.73697, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 128, "label": "text", "bbox": {"l": 403.73804, "t": 261.54822, "r": 405.53625, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": ")", "bbox": {"l": 403.73804, "t": 261.54822, "r": 405.53625, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 129, "label": "text", "bbox": {"l": 427.7016, "t": 261.54822, "r": 438.80563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "(0.1)", "bbox": {"l": 427.7016, "t": 261.54822, "r": 438.80563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 130, "label": "text", "bbox": {"l": 468.55533, "t": 261.54822, "r": 482.07043, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "87.08", "bbox": {"l": 468.55533, "t": 261.54822, "r": 482.07043, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 131, "label": "text", "bbox": {"l": 516.01862, "t": 261.54822, "r": 529.53375, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": "81.14", "bbox": {"l": 516.01862, "t": 261.54822, "r": 529.53375, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 132, "label": "text", "bbox": {"l": 306.11493, "t": 269.64148, "r": 356.24771, "b": 274.70667000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 107, "text": "Canceled or forfeited", "bbox": {"l": 306.11493, "t": 269.64148, "r": 356.24771, "b": 274.70667000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 133, "label": "text", "bbox": {"l": 394.43222, "t": 270.31946000000005, "r": 400.73563, "b": 275.38464, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 108, "text": "(0.", "bbox": {"l": 394.43222, "t": 270.31946000000005, "r": 400.73563, "b": 275.38464, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 134, "label": "text", "bbox": {"l": 400.73456, "t": 270.31946000000005, "r": 403.73697, "b": 275.38464, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 109, "text": "1", "bbox": {"l": 400.73456, "t": 270.31946000000005, "r": 403.73697, "b": 275.38464, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 135, "label": "text", "bbox": {"l": 403.73804, "t": 270.31946000000005, "r": 405.53625, "b": 275.38464, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 110, "text": ")", "bbox": {"l": 403.73804, "t": 270.31946000000005, "r": 405.53625, "b": 275.38464, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 136, "label": "text", "bbox": {"l": 431.02802, "t": 270.31946000000005, "r": 436.4280099999999, "b": 275.38464, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 111, "text": "-", "bbox": {"l": 431.02802, "t": 270.31946000000005, "r": 436.4280099999999, "b": 275.38464, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 137, "label": "text", "bbox": {"l": 465.83099000000004, "t": 270.31946000000005, "r": 482.35013, "b": 275.38464, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 112, "text": "102.01", "bbox": {"l": 465.83099000000004, "t": 270.31946000000005, "r": 482.35013, "b": 275.38464, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 138, "label": "text", "bbox": {"l": 516.01862, "t": 270.31946000000005, "r": 529.53375, "b": 275.38464, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 113, "text": "92.18", "bbox": {"l": 516.01862, "t": 270.31946000000005, "r": 529.53375, "b": 275.38464, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 139, "label": "text", "bbox": {"l": 306.11493, "t": 278.48572, "r": 373.35764, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 114, "text": "Nonvested on December 31", "bbox": {"l": 306.11493, "t": 278.48572, "r": 373.35764, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 140, "label": "text", "bbox": {"l": 396.24661, "t": 278.48572, "r": 403.75531, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 115, "text": "1.0", "bbox": {"l": 396.24661, "t": 278.48572, "r": 403.75531, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 141, "label": "text", "bbox": {"l": 429.51599, "t": 278.48572, "r": 437.02469, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 116, "text": "0.3", "bbox": {"l": 429.51599, "t": 278.48572, "r": 437.02469, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 142, "label": "text", "bbox": {"l": 463.7142, "t": 278.48572, "r": 484.73965000000004, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 117, "text": "104.85 $", "bbox": {"l": 463.7142, "t": 278.48572, "r": 484.73965000000004, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 143, "label": "text", "bbox": {"l": 512.99463, "t": 278.48572, "r": 534.02008, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 118, "text": "$ 104.51", "bbox": {"l": 512.99463, "t": 278.48572, "r": 534.02008, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ecel", "ched", "lcel", "ched", "lcel", "nl", "ecel", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 7, "num_cols": 5, "table_cells": [{"bbox": {"l": 459.04861, "t": 221.62415, "r": 542.00018, "b": 232.89935000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 5, "text": "Weighted Average Grant Date Fair Value", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 393.2442, "t": 236.74712999999997, "r": 407.34631, "b": 241.81232, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "RS U s", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 392.09671, "t": 221.57446000000004, "r": 438.0145, "b": 226.63964999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 3, "text": "Shares (in millions)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 427.18323, "t": 236.74712999999997, "r": 440.98778999999996, "b": 241.81232, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "PSUs", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 468.38254, "t": 236.74712999999997, "r": 482.48465000000004, "b": 241.81232, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "RSUs", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 516.92578, "t": 236.74712999999997, "r": 530.73035, "b": 241.81232, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "PSUs", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 306.11493, "t": 244.61084000000005, "r": 364.65607, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Nonvested on Janua ry 1", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 396.24661, "t": 244.91327, "r": 403.75531, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "1. 1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 429.81838999999997, "t": 244.91327, "r": 437.32708999999994, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 465.52859, "t": 244.91327, "r": 483.55001999999996, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "90.10 $", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 513.44824, "t": 244.91327, "r": 531.46967, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "$ 91.19", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 306.11493, "t": 253.68451000000005, "r": 325.62674, "b": 258.74969, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Granted", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 396.24661, "t": 253.68451000000005, "r": 403.75531, "b": 258.74969, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "0. 5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 429.81838999999997, "t": 253.68451000000005, "r": 437.32708999999994, "b": 258.74969, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 466.43579000000005, "t": 253.68451000000005, "r": 482.54831, "b": 258.74969, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "117.44", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 514.29065, "t": 253.68451000000005, "r": 530.80981, "b": 258.74969, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "122.41", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 306.11493, "t": 261.54822, "r": 322.62866, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Vested", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 394.43222, "t": 261.54822, "r": 405.53625, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "(0. 5 )", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 427.7016, "t": 261.54822, "r": 438.80563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "(0.1)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 468.55533, "t": 261.54822, "r": 482.07043, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "87.08", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 516.01862, "t": 261.54822, "r": 529.53375, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "81.14", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 306.11493, "t": 269.64148, "r": 356.24771, "b": 274.70667000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Canceled or forfeited", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 394.43222, "t": 270.31946000000005, "r": 405.53625, "b": 275.38464, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "(0. 1 )", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 431.02802, "t": 270.31946000000005, "r": 436.4280099999999, "b": 275.38464, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 465.83099000000004, "t": 270.31946000000005, "r": 482.35013, "b": 275.38464, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "102.01", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 516.01862, "t": 270.31946000000005, "r": 529.53375, "b": 275.38464, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "92.18", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 306.11493, "t": 278.48572, "r": 373.35764, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Nonvested on December 31", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 396.24661, "t": 278.48572, "r": 403.75531, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "1.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 429.51599, "t": 278.48572, "r": 437.02469, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 463.7142, "t": 278.48572, "r": 484.73965000000004, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "104.85 $", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 512.99463, "t": 278.48572, "r": 534.02008, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "$ 104.51", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "caption", "id": 6, "page_no": 7, "cluster": {"id": 6, "label": "caption", "bbox": {"l": 50.112, "t": 320.87735, "r": 545.11377, "b": 365.64987, "coord_origin": "TOPLEFT"}, "confidence": 0.9140303134918213, "cells": [{"id": 119, "text": "Figure 5:", "bbox": {"l": 50.112, "t": 320.87735, "r": 86.864021, "b": 329.78391, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "One of the benefits of TableFormer is that it is language agnostic, as an example, the left part of the illustration", "bbox": {"l": 93.917542, "t": 320.87735, "r": 545.11371, "b": 329.78391, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "demonstrates TableFormer predictions on previously unseen language (Japanese). Additionally, we see that TableFormer is", "bbox": {"l": 50.112, "t": 332.83233999999993, "r": 545.11371, "b": 341.73889, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "robust to variability in style and content, right side of the illustration shows the example of the TableFormer prediction from", "bbox": {"l": 50.112, "t": 344.78732, "r": 545.11377, "b": 353.69388, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "the FinTabNet dataset.", "bbox": {"l": 50.112, "t": 356.74332, "r": 139.79532, "b": 365.64987, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 5: One of the benefits of TableFormer is that it is language agnostic, as an example, the left part of the illustration demonstrates TableFormer predictions on previously unseen language (Japanese). Additionally, we see that TableFormer is robust to variability in style and content, right side of the illustration shows the example of the TableFormer prediction from the FinTabNet dataset."}, {"label": "picture", "id": 12, "page_no": 7, "cluster": {"id": 12, "label": "picture", "bbox": {"l": 216.76925659179688, "t": 380.4906311035156, "r": 375.7829284667969, "b": 443.34698486328125, "coord_origin": "TOPLEFT"}, "confidence": 0.805853009223938, "cells": [{"id": 124, "text": "Red - PDF cells, Green - predicted bounding boxes", "bbox": {"l": 220.26282, "t": 381.77722, "r": 342.07819, "b": 386.44281, "coord_origin": "TOPLEFT"}}], "children": [{"id": 144, "label": "text", "bbox": {"l": 220.26282, "t": 381.77722, "r": 342.07819, "b": 386.44281, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 124, "text": "Red - PDF cells, Green - predicted bounding boxes", "bbox": {"l": 220.26282, "t": 381.77722, "r": 342.07819, "b": 386.44281, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "picture", "id": 11, "page_no": 7, "cluster": {"id": 11, "label": "picture", "bbox": {"l": 51.736167907714844, "t": 380.48065185546875, "r": 211.83778381347656, "b": 443.6580810546875, "coord_origin": "TOPLEFT"}, "confidence": 0.8308426737785339, "cells": [{"id": 125, "text": "Ground Truth", "bbox": {"l": 53.715248, "t": 381.77722, "r": 85.657333, "b": 386.44281, "coord_origin": "TOPLEFT"}}], "children": [{"id": 145, "label": "text", "bbox": {"l": 53.715248, "t": 381.77722, "r": 85.657333, "b": 386.44281, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 125, "text": "Ground Truth", "bbox": {"l": 53.715248, "t": 381.77722, "r": 85.657333, "b": 386.44281, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "picture", "id": 13, "page_no": 7, "cluster": {"id": 13, "label": "picture", "bbox": {"l": 383.1364440917969, "t": 381.2313232421875, "r": 542.1132202148438, "b": 442.7749328613281, "coord_origin": "TOPLEFT"}, "confidence": 0.7881615161895752, "cells": [{"id": 126, "text": "16", "bbox": {"l": 437.37939, "t": 400.55295, "r": 443.69870000000003, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "17", "bbox": {"l": 450.33203, "t": 400.55295, "r": 456.6513100000001, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "18", "bbox": {"l": 463.28464, "t": 400.55295, "r": 469.60394, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "19", "bbox": {"l": 476.23724000000004, "t": 400.55295, "r": 482.5565500000001, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "20", "bbox": {"l": 489.18988, "t": 400.55295, "r": 495.50916, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "21", "bbox": {"l": 502.14251999999993, "t": 400.55295, "r": 508.46178999999995, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "22", "bbox": {"l": 515.09509, "t": 400.55295, "r": 521.41443, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "23", "bbox": {"l": 385.2814, "t": 411.03836000000007, "r": 391.60071, "b": 417.35699, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "24", "bbox": {"l": 398.52341, "t": 411.03836000000007, "r": 404.84271, "b": 417.35699, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "25", "bbox": {"l": 411.47604, "t": 411.03836000000007, "r": 417.79535, "b": 417.35699, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "26", "bbox": {"l": 437.37939, "t": 411.03836000000007, "r": 443.69870000000003, "b": 417.35699, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "27", "bbox": {"l": 450.33203, "t": 411.03836000000007, "r": 456.6513100000001, "b": 417.35699, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "28", "bbox": {"l": 463.28464, "t": 411.03836000000007, "r": 469.60394, "b": 417.35699, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "30", "bbox": {"l": 385.2814, "t": 421.0697, "r": 391.60071, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "31", "bbox": {"l": 398.52341, "t": 421.0697, "r": 404.84271, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "32", "bbox": {"l": 411.47604, "t": 421.0697, "r": 417.79532, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "33", "bbox": {"l": 424.42865, "t": 421.0697, "r": 430.74796, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "34", "bbox": {"l": 437.38129, "t": 421.0697, "r": 443.70056, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "35", "bbox": {"l": 450.33389000000005, "t": 421.0697, "r": 456.65319999999997, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "36", "bbox": {"l": 463.2865, "t": 421.0697, "r": 469.6058, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "37", "bbox": {"l": 476.23914, "t": 421.0697, "r": 482.55841, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "38", "bbox": {"l": 489.1917700000001, "t": 421.0697, "r": 495.51105, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "39", "bbox": {"l": 502.14438, "t": 421.0697, "r": 508.46368, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "40", "bbox": {"l": 515.09705, "t": 421.0697, "r": 521.41632, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "41", "bbox": {"l": 528.04962, "t": 421.0697, "r": 534.3689, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "42", "bbox": {"l": 385.2814, "t": 432.04431, "r": 391.60071, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "43", "bbox": {"l": 398.52341, "t": 432.04431, "r": 404.84271, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "44", "bbox": {"l": 411.47604, "t": 432.04431, "r": 417.79532, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "45", "bbox": {"l": 424.42865, "t": 432.04431, "r": 430.74796, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "46", "bbox": {"l": 437.38129, "t": 432.04431, "r": 443.70056, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "47", "bbox": {"l": 450.33389000000005, "t": 432.04431, "r": 456.65319999999997, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "48", "bbox": {"l": 463.2865, "t": 432.04431, "r": 469.6058, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "49", "bbox": {"l": 476.23914, "t": 432.04431, "r": 482.55841, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "50", "bbox": {"l": 489.1917700000001, "t": 432.04431, "r": 495.51105, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "51", "bbox": {"l": 502.14438, "t": 432.04431, "r": 508.46368, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "52", "bbox": {"l": 515.09705, "t": 432.04431, "r": 521.41632, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "53", "bbox": {"l": 528.04962, "t": 432.04431, "r": 534.3689, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "0", "bbox": {"l": 385.2814, "t": 389.20004, "r": 388.44073, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "1", "bbox": {"l": 398.52341, "t": 389.20004, "r": 401.68274, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "2", "bbox": {"l": 411.4754, "t": 389.20004, "r": 414.63474, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "3", "bbox": {"l": 424.4274, "t": 389.20004, "r": 427.58673, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "4", "bbox": {"l": 437.37939, "t": 389.20004, "r": 440.53870000000006, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "5", "bbox": {"l": 450.33136, "t": 389.20004, "r": 453.49069000000003, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "6", "bbox": {"l": 463.28336, "t": 389.20004, "r": 466.44269, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "7", "bbox": {"l": 476.23535, "t": 389.20004, "r": 479.39468, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "8", "bbox": {"l": 489.18735, "t": 389.20004, "r": 492.34668, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "9", "bbox": {"l": 502.13933999999995, "t": 389.20004, "r": 505.29868000000005, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "10", "bbox": {"l": 515.09131, "t": 389.20004, "r": 521.41064, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "11", "bbox": {"l": 528.04364, "t": 389.20004, "r": 534.13104, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "12", "bbox": {"l": 385.2814, "t": 398.97464, "r": 391.60071, "b": 405.29327, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "13", "bbox": {"l": 398.52341, "t": 398.97464, "r": 404.84271, "b": 405.29327, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "14", "bbox": {"l": 411.47604, "t": 398.97464, "r": 417.79535, "b": 405.29327, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "15", "bbox": {"l": 424.42719, "t": 406.77463000000006, "r": 430.74648999999994, "b": 413.09326, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "29", "bbox": {"l": 502.86941999999993, "t": 410.99438, "r": 509.18871999999993, "b": 417.31302, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "Predicted Structure", "bbox": {"l": 384.35437, "t": 381.77722, "r": 430.99261, "b": 386.44281, "coord_origin": "TOPLEFT"}}], "children": [{"id": 146, "label": "text", "bbox": {"l": 437.37939, "t": 400.55295, "r": 443.69870000000003, "b": 406.87158, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 126, "text": "16", "bbox": {"l": 437.37939, "t": 400.55295, "r": 443.69870000000003, "b": 406.87158, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 147, "label": "text", "bbox": {"l": 450.33203, "t": 400.55295, "r": 456.6513100000001, "b": 406.87158, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 127, "text": "17", "bbox": {"l": 450.33203, "t": 400.55295, "r": 456.6513100000001, "b": 406.87158, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 148, "label": "text", "bbox": {"l": 463.28464, "t": 400.55295, "r": 469.60394, "b": 406.87158, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 128, "text": "18", "bbox": {"l": 463.28464, "t": 400.55295, "r": 469.60394, "b": 406.87158, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 149, "label": "text", "bbox": {"l": 476.23724000000004, "t": 400.55295, "r": 482.5565500000001, "b": 406.87158, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 129, "text": "19", "bbox": {"l": 476.23724000000004, "t": 400.55295, "r": 482.5565500000001, "b": 406.87158, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 150, "label": "text", "bbox": {"l": 489.18988, "t": 400.55295, "r": 495.50916, "b": 406.87158, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 130, "text": "20", "bbox": {"l": 489.18988, "t": 400.55295, "r": 495.50916, "b": 406.87158, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 151, "label": "text", "bbox": {"l": 502.14251999999993, "t": 400.55295, "r": 508.46178999999995, "b": 406.87158, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 131, "text": "21", "bbox": {"l": 502.14251999999993, "t": 400.55295, "r": 508.46178999999995, "b": 406.87158, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 152, "label": "text", "bbox": {"l": 515.09509, "t": 400.55295, "r": 521.41443, "b": 406.87158, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 132, "text": "22", "bbox": {"l": 515.09509, "t": 400.55295, "r": 521.41443, "b": 406.87158, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 153, "label": "text", "bbox": {"l": 385.2814, "t": 411.03836000000007, "r": 391.60071, "b": 417.35699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 133, "text": "23", "bbox": {"l": 385.2814, "t": 411.03836000000007, "r": 391.60071, "b": 417.35699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 154, "label": "text", "bbox": {"l": 398.52341, "t": 411.03836000000007, "r": 404.84271, "b": 417.35699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 134, "text": "24", "bbox": {"l": 398.52341, "t": 411.03836000000007, "r": 404.84271, "b": 417.35699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 155, "label": "text", "bbox": {"l": 411.47604, "t": 411.03836000000007, "r": 417.79535, "b": 417.35699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 135, "text": "25", "bbox": {"l": 411.47604, "t": 411.03836000000007, "r": 417.79535, "b": 417.35699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 156, "label": "text", "bbox": {"l": 437.37939, "t": 411.03836000000007, "r": 443.69870000000003, "b": 417.35699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 136, "text": "26", "bbox": {"l": 437.37939, "t": 411.03836000000007, "r": 443.69870000000003, "b": 417.35699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 157, "label": "text", "bbox": {"l": 450.33203, "t": 411.03836000000007, "r": 456.6513100000001, "b": 417.35699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 137, "text": "27", "bbox": {"l": 450.33203, "t": 411.03836000000007, "r": 456.6513100000001, "b": 417.35699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 158, "label": "text", "bbox": {"l": 463.28464, "t": 411.03836000000007, "r": 469.60394, "b": 417.35699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 138, "text": "28", "bbox": {"l": 463.28464, "t": 411.03836000000007, "r": 469.60394, "b": 417.35699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 159, "label": "text", "bbox": {"l": 385.2814, "t": 421.0697, "r": 391.60071, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 139, "text": "30", "bbox": {"l": 385.2814, "t": 421.0697, "r": 391.60071, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 160, "label": "text", "bbox": {"l": 398.52341, "t": 421.0697, "r": 404.84271, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 140, "text": "31", "bbox": {"l": 398.52341, "t": 421.0697, "r": 404.84271, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 161, "label": "text", "bbox": {"l": 411.47604, "t": 421.0697, "r": 417.79532, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 141, "text": "32", "bbox": {"l": 411.47604, "t": 421.0697, "r": 417.79532, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 162, "label": "text", "bbox": {"l": 424.42865, "t": 421.0697, "r": 430.74796, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 142, "text": "33", "bbox": {"l": 424.42865, "t": 421.0697, "r": 430.74796, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 163, "label": "text", "bbox": {"l": 437.38129, "t": 421.0697, "r": 443.70056, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 143, "text": "34", "bbox": {"l": 437.38129, "t": 421.0697, "r": 443.70056, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 164, "label": "text", "bbox": {"l": 450.33389000000005, "t": 421.0697, "r": 456.65319999999997, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 144, "text": "35", "bbox": {"l": 450.33389000000005, "t": 421.0697, "r": 456.65319999999997, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 165, "label": "text", "bbox": {"l": 463.2865, "t": 421.0697, "r": 469.6058, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 145, "text": "36", "bbox": {"l": 463.2865, "t": 421.0697, "r": 469.6058, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 166, "label": "text", "bbox": {"l": 476.23914, "t": 421.0697, "r": 482.55841, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 146, "text": "37", "bbox": {"l": 476.23914, "t": 421.0697, "r": 482.55841, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 167, "label": "text", "bbox": {"l": 489.1917700000001, "t": 421.0697, "r": 495.51105, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 147, "text": "38", "bbox": {"l": 489.1917700000001, "t": 421.0697, "r": 495.51105, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 168, "label": "text", "bbox": {"l": 502.14438, "t": 421.0697, "r": 508.46368, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 148, "text": "39", "bbox": {"l": 502.14438, "t": 421.0697, "r": 508.46368, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 169, "label": "text", "bbox": {"l": 515.09705, "t": 421.0697, "r": 521.41632, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 149, "text": "40", "bbox": {"l": 515.09705, "t": 421.0697, "r": 521.41632, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 170, "label": "text", "bbox": {"l": 528.04962, "t": 421.0697, "r": 534.3689, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 150, "text": "41", "bbox": {"l": 528.04962, "t": 421.0697, "r": 534.3689, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 171, "label": "text", "bbox": {"l": 385.2814, "t": 432.04431, "r": 391.60071, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 151, "text": "42", "bbox": {"l": 385.2814, "t": 432.04431, "r": 391.60071, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 172, "label": "text", "bbox": {"l": 398.52341, "t": 432.04431, "r": 404.84271, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 152, "text": "43", "bbox": {"l": 398.52341, "t": 432.04431, "r": 404.84271, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 173, "label": "text", "bbox": {"l": 411.47604, "t": 432.04431, "r": 417.79532, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 153, "text": "44", "bbox": {"l": 411.47604, "t": 432.04431, "r": 417.79532, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 174, "label": "text", "bbox": {"l": 424.42865, "t": 432.04431, "r": 430.74796, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 154, "text": "45", "bbox": {"l": 424.42865, "t": 432.04431, "r": 430.74796, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 175, "label": "text", "bbox": {"l": 437.38129, "t": 432.04431, "r": 443.70056, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 155, "text": "46", "bbox": {"l": 437.38129, "t": 432.04431, "r": 443.70056, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 176, "label": "text", "bbox": {"l": 450.33389000000005, "t": 432.04431, "r": 456.65319999999997, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 156, "text": "47", "bbox": {"l": 450.33389000000005, "t": 432.04431, "r": 456.65319999999997, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 177, "label": "text", "bbox": {"l": 463.2865, "t": 432.04431, "r": 469.6058, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 157, "text": "48", "bbox": {"l": 463.2865, "t": 432.04431, "r": 469.6058, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 178, "label": "text", "bbox": {"l": 476.23914, "t": 432.04431, "r": 482.55841, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 158, "text": "49", "bbox": {"l": 476.23914, "t": 432.04431, "r": 482.55841, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 179, "label": "text", "bbox": {"l": 489.1917700000001, "t": 432.04431, "r": 495.51105, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 159, "text": "50", "bbox": {"l": 489.1917700000001, "t": 432.04431, "r": 495.51105, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 180, "label": "text", "bbox": {"l": 502.14438, "t": 432.04431, "r": 508.46368, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 160, "text": "51", "bbox": {"l": 502.14438, "t": 432.04431, "r": 508.46368, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 181, "label": "text", "bbox": {"l": 515.09705, "t": 432.04431, "r": 521.41632, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 161, "text": "52", "bbox": {"l": 515.09705, "t": 432.04431, "r": 521.41632, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 182, "label": "text", "bbox": {"l": 528.04962, "t": 432.04431, "r": 534.3689, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 162, "text": "53", "bbox": {"l": 528.04962, "t": 432.04431, "r": 534.3689, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 183, "label": "text", "bbox": {"l": 385.2814, "t": 389.20004, "r": 388.44073, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 163, "text": "0", "bbox": {"l": 385.2814, "t": 389.20004, "r": 388.44073, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 184, "label": "text", "bbox": {"l": 398.52341, "t": 389.20004, "r": 401.68274, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 164, "text": "1", "bbox": {"l": 398.52341, "t": 389.20004, "r": 401.68274, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 185, "label": "text", "bbox": {"l": 411.4754, "t": 389.20004, "r": 414.63474, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 165, "text": "2", "bbox": {"l": 411.4754, "t": 389.20004, "r": 414.63474, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 186, "label": "text", "bbox": {"l": 424.4274, "t": 389.20004, "r": 427.58673, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 166, "text": "3", "bbox": {"l": 424.4274, "t": 389.20004, "r": 427.58673, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 187, "label": "text", "bbox": {"l": 437.37939, "t": 389.20004, "r": 440.53870000000006, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 167, "text": "4", "bbox": {"l": 437.37939, "t": 389.20004, "r": 440.53870000000006, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 188, "label": "text", "bbox": {"l": 450.33136, "t": 389.20004, "r": 453.49069000000003, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 168, "text": "5", "bbox": {"l": 450.33136, "t": 389.20004, "r": 453.49069000000003, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 189, "label": "text", "bbox": {"l": 463.28336, "t": 389.20004, "r": 466.44269, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 169, "text": "6", "bbox": {"l": 463.28336, "t": 389.20004, "r": 466.44269, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 190, "label": "text", "bbox": {"l": 476.23535, "t": 389.20004, "r": 479.39468, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 170, "text": "7", "bbox": {"l": 476.23535, "t": 389.20004, "r": 479.39468, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 191, "label": "text", "bbox": {"l": 489.18735, "t": 389.20004, "r": 492.34668, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 171, "text": "8", "bbox": {"l": 489.18735, "t": 389.20004, "r": 492.34668, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 192, "label": "text", "bbox": {"l": 502.13933999999995, "t": 389.20004, "r": 505.29868000000005, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 172, "text": "9", "bbox": {"l": 502.13933999999995, "t": 389.20004, "r": 505.29868000000005, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 193, "label": "text", "bbox": {"l": 515.09131, "t": 389.20004, "r": 521.41064, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 173, "text": "10", "bbox": {"l": 515.09131, "t": 389.20004, "r": 521.41064, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 194, "label": "text", "bbox": {"l": 528.04364, "t": 389.20004, "r": 534.13104, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 174, "text": "11", "bbox": {"l": 528.04364, "t": 389.20004, "r": 534.13104, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 195, "label": "text", "bbox": {"l": 385.2814, "t": 398.97464, "r": 391.60071, "b": 405.29327, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 175, "text": "12", "bbox": {"l": 385.2814, "t": 398.97464, "r": 391.60071, "b": 405.29327, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 196, "label": "text", "bbox": {"l": 398.52341, "t": 398.97464, "r": 404.84271, "b": 405.29327, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 176, "text": "13", "bbox": {"l": 398.52341, "t": 398.97464, "r": 404.84271, "b": 405.29327, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 197, "label": "text", "bbox": {"l": 411.47604, "t": 398.97464, "r": 417.79535, "b": 405.29327, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 177, "text": "14", "bbox": {"l": 411.47604, "t": 398.97464, "r": 417.79535, "b": 405.29327, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 198, "label": "text", "bbox": {"l": 424.42719, "t": 406.77463000000006, "r": 430.74648999999994, "b": 413.09326, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 178, "text": "15", "bbox": {"l": 424.42719, "t": 406.77463000000006, "r": 430.74648999999994, "b": 413.09326, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 199, "label": "text", "bbox": {"l": 502.86941999999993, "t": 410.99438, "r": 509.18871999999993, "b": 417.31302, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 179, "text": "29", "bbox": {"l": 502.86941999999993, "t": 410.99438, "r": 509.18871999999993, "b": 417.31302, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 200, "label": "text", "bbox": {"l": 384.35437, "t": 381.77722, "r": 430.99261, "b": 386.44281, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 180, "text": "Predicted Structure", "bbox": {"l": 384.35437, "t": 381.77722, "r": 430.99261, "b": 386.44281, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "caption", "id": 5, "page_no": 7, "cluster": {"id": 5, "label": "caption", "bbox": {"l": 62.595001, "t": 458.72836, "r": 532.63049, "b": 467.63492, "coord_origin": "TOPLEFT"}, "confidence": 0.9153602719306946, "cells": [{"id": 181, "text": "Figure 6: An example of TableFormer predictions (bounding boxes and structure) from generated SynthTabNet table.", "bbox": {"l": 62.595001, "t": 458.72836, "r": 532.63049, "b": 467.63492, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 6: An example of TableFormer predictions (bounding boxes and structure) from generated SynthTabNet table."}, {"label": "section_header", "id": 2, "page_no": 7, "cluster": {"id": 2, "label": "section_header", "bbox": {"l": 50.112, "t": 491.39536, "r": 163.7558, "b": 501.24741, "coord_origin": "TOPLEFT"}, "confidence": 0.9561247229576111, "cells": [{"id": 182, "text": "5.5.", "bbox": {"l": 50.112, "t": 491.39536, "r": 64.448898, "b": 501.24741, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "Qualitative Analysis", "bbox": {"l": 74.006828, "t": 491.39536, "r": 163.7558, "b": 501.24741, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5.5. Qualitative Analysis"}, {"label": "text", "id": 1, "page_no": 7, "cluster": {"id": 1, "label": "text", "bbox": {"l": 50.112, "t": 536.87337, "r": 286.36511, "b": 713.1519470000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9852361679077148, "cells": [{"id": 184, "text": "We showcase several visualizations for the different", "bbox": {"l": 62.067001, "t": 536.87337, "r": 286.36499, "b": 545.77992, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": "components of our network on various", "bbox": {"l": 50.112, "t": 548.82837, "r": 211.15741, "b": 557.73492, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "\u201ccomplex\u201d", "bbox": {"l": 215.10000999999997, "t": 548.91803, "r": 259.17453, "b": 557.50578, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "tables", "bbox": {"l": 263.12, "t": 548.82837, "r": 286.36273, "b": 557.73492, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": "within datasets presented in this work in Fig. 5 and Fig. 6", "bbox": {"l": 50.112, "t": 560.78337, "r": 286.36505, "b": 569.68993, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "As it is shown, our model is able to predict bounding boxes", "bbox": {"l": 50.112, "t": 572.73837, "r": 286.36508, "b": 581.6449299999999, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "for all table cells, even for the empty ones. Additionally,", "bbox": {"l": 50.112, "t": 584.69337, "r": 286.36508, "b": 593.59993, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "our post-processing techniques can extract the cell content", "bbox": {"l": 50.112, "t": 596.64937, "r": 286.36505, "b": 605.55592, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": "by matching the predicted bounding boxes to the PDF cells", "bbox": {"l": 50.112, "t": 608.60437, "r": 286.36508, "b": 617.51093, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "based on their overlap and spatial proximity. The left part", "bbox": {"l": 50.112, "t": 620.55937, "r": 286.36508, "b": 629.46593, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "of Fig. 5 demonstrates also the adaptability of our method", "bbox": {"l": 50.112, "t": 632.51437, "r": 286.36508, "b": 641.42093, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "to any language, as it can successfully extract Japanese", "bbox": {"l": 50.112, "t": 644.46938, "r": 286.36508, "b": 653.37593, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "text, although the training set contains only English content.", "bbox": {"l": 50.112, "t": 656.42438, "r": 286.36511, "b": 665.33094, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "We provide more visualizations including the intermediate", "bbox": {"l": 50.112, "t": 668.38037, "r": 286.36508, "b": 677.28694, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "steps in the supplementary material. Overall these illustra-", "bbox": {"l": 50.112, "t": 680.33537, "r": 286.36511, "b": 689.24194, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "tions justify the versatility of our method across a diverse", "bbox": {"l": 50.112, "t": 692.290375, "r": 286.36511, "b": 701.196945, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "range of table appearances and content type.", "bbox": {"l": 50.112, "t": 704.245377, "r": 226.88833999999997, "b": 713.1519470000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "We showcase several visualizations for the different components of our network on various \u201ccomplex\u201d tables within datasets presented in this work in Fig. 5 and Fig. 6 As it is shown, our model is able to predict bounding boxes for all table cells, even for the empty ones. Additionally, our post-processing techniques can extract the cell content by matching the predicted bounding boxes to the PDF cells based on their overlap and spatial proximity. The left part of Fig. 5 demonstrates also the adaptability of our method to any language, as it can successfully extract Japanese text, although the training set contains only English content. We provide more visualizations including the intermediate steps in the supplementary material. Overall these illustrations justify the versatility of our method across a diverse range of table appearances and content type."}, {"label": "section_header", "id": 4, "page_no": 7, "cluster": {"id": 4, "label": "section_header", "bbox": {"l": 308.862, "t": 490.70892, "r": 460.84848, "b": 501.45663, "coord_origin": "TOPLEFT"}, "confidence": 0.9436525702476501, "cells": [{"id": 201, "text": "6.", "bbox": {"l": 308.862, "t": 490.70892, "r": 316.07382, "b": 501.45663, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": "Future Work & Conclusion", "bbox": {"l": 325.68954, "t": 490.70892, "r": 460.84848, "b": 501.45663, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "6. Future Work & Conclusion"}, {"label": "text", "id": 0, "page_no": 7, "cluster": {"id": 0, "label": "text", "bbox": {"l": 308.862, "t": 512.89337, "r": 545.11517, "b": 653.30592, "coord_origin": "TOPLEFT"}, "confidence": 0.9875594973564148, "cells": [{"id": 203, "text": "In this paper, we presented TableFormer an end-to-end", "bbox": {"l": 320.81699, "t": 512.89337, "r": 545.11505, "b": 521.79993, "coord_origin": "TOPLEFT"}}, {"id": 204, "text": "transformer based approach to predict table structures and", "bbox": {"l": 308.862, "t": 524.84836, "r": 545.11517, "b": 533.75491, "coord_origin": "TOPLEFT"}}, {"id": 205, "text": "bounding boxes of cells from an image. This approach en-", "bbox": {"l": 308.862, "t": 536.80336, "r": 545.11511, "b": 545.70992, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": "ables us to recreate the table structure, and extract the cell", "bbox": {"l": 308.862, "t": 548.75836, "r": 545.11505, "b": 557.6649199999999, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": "content from PDF or OCR by using bounding boxes. Ad-", "bbox": {"l": 308.862, "t": 560.71336, "r": 545.11517, "b": 569.61992, "coord_origin": "TOPLEFT"}}, {"id": 208, "text": "ditionally, it provides the versatility required in real-world", "bbox": {"l": 308.862, "t": 572.66837, "r": 545.11511, "b": 581.57492, "coord_origin": "TOPLEFT"}}, {"id": 209, "text": "scenarios when dealing with various types of PDF docu-", "bbox": {"l": 308.862, "t": 584.62436, "r": 545.11511, "b": 593.53091, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": "ments, and languages.", "bbox": {"l": 308.862, "t": 596.57936, "r": 400.46808, "b": 605.48592, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "Furthermore, our method outper-", "bbox": {"l": 408.37839, "t": 596.57936, "r": 545.11511, "b": 605.48592, "coord_origin": "TOPLEFT"}}, {"id": 212, "text": "forms all state-of-the-arts with a wide margin. Finally, we", "bbox": {"l": 308.862, "t": 608.53436, "r": 545.11505, "b": 617.44092, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "introduce \u201cSynthTabNet\u201d a challenging synthetically gen-", "bbox": {"l": 308.862, "t": 620.48936, "r": 545.11511, "b": 629.3959199999999, "coord_origin": "TOPLEFT"}}, {"id": 214, "text": "erated dataset that reinforces missing characteristics from", "bbox": {"l": 308.862, "t": 632.4443699999999, "r": 545.11505, "b": 641.35092, "coord_origin": "TOPLEFT"}}, {"id": 215, "text": "other datasets.", "bbox": {"l": 308.862, "t": 644.39937, "r": 365.85803, "b": 653.30592, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In this paper, we presented TableFormer an end-to-end transformer based approach to predict table structures and bounding boxes of cells from an image. This approach enables us to recreate the table structure, and extract the cell content from PDF or OCR by using bounding boxes. Additionally, it provides the versatility required in real-world scenarios when dealing with various types of PDF documents, and languages. Furthermore, our method outperforms all state-of-the-arts with a wide margin. Finally, we introduce \u201cSynthTabNet\u201d a challenging synthetically generated dataset that reinforces missing characteristics from other datasets."}, {"label": "section_header", "id": 3, "page_no": 7, "cluster": {"id": 3, "label": "section_header", "bbox": {"l": 308.862, "t": 672.09892, "r": 364.40585, "b": 682.84664, "coord_origin": "TOPLEFT"}, "confidence": 0.9442470073699951, "cells": [{"id": 216, "text": "References", "bbox": {"l": 308.862, "t": 672.09892, "r": 364.40585, "b": 682.84664, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "References"}, {"label": "list_item", "id": 10, "page_no": 7, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 313.345, "t": 693.9617920000001, "r": 545.1134, "b": 712.936752, "coord_origin": "TOPLEFT"}, "confidence": 0.8318753838539124, "cells": [{"id": 217, "text": "[1]", "bbox": {"l": 313.345, "t": 693.9617920000001, "r": 323.80792, "b": 701.977753, "coord_origin": "TOPLEFT"}}, {"id": 218, "text": "Nicolas Carion, Francisco Massa, Gabriel Synnaeve, Nicolas", "bbox": {"l": 326.05127, "t": 693.9617920000001, "r": 545.10852, "b": 701.977753, "coord_origin": "TOPLEFT"}}, {"id": 219, "text": "Usunier, Alexander Kirillov, and Sergey Zagoruyko. End-to-", "bbox": {"l": 328.78101, "t": 704.920792, "r": 545.1134, "b": 712.936752, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[1] Nicolas Carion, Francisco Massa, Gabriel Synnaeve, Nicolas Usunier, Alexander Kirillov, and Sergey Zagoruyko. End-to-"}, {"label": "picture", "id": 15, "page_no": 7, "cluster": {"id": 15, "label": "picture", "bbox": {"l": 305.5836486816406, "t": 98.65415954589844, "r": 554.8258666992188, "b": 180.6267547607422, "coord_origin": "TOPLEFT"}, "confidence": 0.7699173092842102, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "picture", "id": 14, "page_no": 7, "cluster": {"id": 14, "label": "picture", "bbox": {"l": 49.97503662109375, "t": 103.71266174316406, "r": 301.6335754394531, "b": 187.5789337158203, "coord_origin": "TOPLEFT"}, "confidence": 0.7873926162719727, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "headers": [{"label": "page_footer", "id": 9, "page_no": 7, "cluster": {"id": 9, "label": "page_footer", "bbox": {"l": 295.121, "t": 734.133366, "r": 300.10229, "b": 743.039928, "coord_origin": "TOPLEFT"}, "confidence": 0.8709858059883118, "cells": [{"id": 220, "text": "8", "bbox": {"l": 295.121, "t": 734.133366, "r": 300.10229, "b": 743.039928, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "8"}]}}, {"page_no": 8, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "end object detection with transformers. In Andrea Vedaldi,", "bbox": {"l": 70.030998, "t": 75.88378999999998, "r": 286.36334, "b": 83.89977999999996, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Horst Bischof, Thomas Brox, and Jan-Michael Frahm, edi-", "bbox": {"l": 70.030998, "t": 86.84276999999997, "r": 286.36331, "b": 94.85875999999996, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "tors,", "bbox": {"l": 70.030998, "t": 97.80078000000003, "r": 85.722198, "b": 105.81677000000002, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Computer Vision - ECCV 2020", "bbox": {"l": 87.889, "t": 97.88147000000004, "r": 199.93315, "b": 105.61053000000004, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": ", pages 213-229, Cham,", "bbox": {"l": 199.936, "t": 97.80078000000003, "r": 286.36313, "b": 105.81677000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "2020. Springer International Publishing. 5", "bbox": {"l": 70.031006, "t": 108.75977, "r": 221.94871999999998, "b": 116.77575999999999, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "[2]", "bbox": {"l": 54.595005, "t": 120.03174000000013, "r": 65.206657, "b": 128.04773, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Zewen Chi, Heyan Huang, Heng-Da Xu, Houjin Yu, Wanx-", "bbox": {"l": 67.481873, "t": 120.03174000000013, "r": 286.35852, "b": 128.04773, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "uan Yin, and Xian-Ling Mao.", "bbox": {"l": 70.031006, "t": 130.99072, "r": 179.67215, "b": 139.00671, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Complicated table structure", "bbox": {"l": 185.58101, "t": 130.99072, "r": 286.36334, "b": 139.00671, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "recognition.", "bbox": {"l": 70.031006, "t": 141.94970999999998, "r": 113.11456, "b": 149.96569999999997, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "arXiv preprint arXiv:1908.04729", "bbox": {"l": 116.34200999999999, "t": 142.0304, "r": 235.3082, "b": 149.75946, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": ", 2019. 3", "bbox": {"l": 235.30701, "t": 141.94970999999998, "r": 267.67572, "b": 149.96569999999997, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "[3]", "bbox": {"l": 54.595001, "t": 153.22168, "r": 65.103195, "b": 161.23766999999998, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Bertrand Couasnon and Aurelie Lemaitre.", "bbox": {"l": 67.356239, "t": 153.22168, "r": 218.77876, "b": 161.23766999999998, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Recognition of Ta-", "bbox": {"l": 220.97999999999996, "t": 153.30237, "r": 286.36301, "b": 161.03143, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "bles and Forms", "bbox": {"l": 70.030991, "t": 164.26135, "r": 125.26401000000001, "b": 171.99041999999997, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": ", pages 647-677. Springer London, London,", "bbox": {"l": 125.26098999999999, "t": 164.18066, "r": 286.36029, "b": 172.19665999999995, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "2014. 2", "bbox": {"l": 70.030991, "t": 175.13867000000005, "r": 97.916496, "b": 183.15466000000004, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "[4]", "bbox": {"l": 54.59499, "t": 186.41063999999994, "r": 65.806984, "b": 194.42664000000002, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Herv\u00b4e D\u00b4ejean, Jean-Luc Meunier, Liangcai Gao, Yilun", "bbox": {"l": 68.210922, "t": 186.41063999999994, "r": 286.36401, "b": 194.42664000000002, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Huang, Yu Fang, Florian Kleber, and Eva-Maria Lang. IC-", "bbox": {"l": 70.030983, "t": 197.36963000000003, "r": 286.36331, "b": 205.38562000000002, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "DAR 2019 Competition on Table Detection and Recognition", "bbox": {"l": 70.030983, "t": 208.32861000000003, "r": 286.36334, "b": 216.3446, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "(cTDaR), Apr. 2019. http://sac.founderit.com/. 2", "bbox": {"l": 70.030983, "t": 219.2876, "r": 245.83519, "b": 227.30358999999999, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "[5]", "bbox": {"l": 54.594982, "t": 230.55957, "r": 65.381134, "b": 238.57556, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "Basilios Gatos, Dimitrios Danatsas, Ioannis Pratikakis, and", "bbox": {"l": 67.693779, "t": 230.55957, "r": 286.35849, "b": 238.57556, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "Stavros J Perantonis. Automatic table detection in document", "bbox": {"l": 70.030983, "t": 241.51855, "r": 286.36334, "b": 249.53454999999997, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "images. In", "bbox": {"l": 70.030983, "t": 252.47655999999995, "r": 108.39821, "b": 260.49255000000005, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "International Conference on Pattern Recognition", "bbox": {"l": 110.64498000000002, "t": 252.55724999999995, "r": 286.3595, "b": 260.28632000000005, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "and Image Analysis", "bbox": {"l": 70.030983, "t": 263.51624000000004, "r": 140.57861, "b": 271.24530000000004, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": ", pages 609-618. Springer, 2005. 2", "bbox": {"l": 140.57797, "t": 263.43555000000003, "r": 266.47522, "b": 271.45154, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "[6]", "bbox": {"l": 54.594971, "t": 274.70758, "r": 64.848648, "b": 282.72351, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Max G\u00a8obel, Tamir Hassan, Ermelinda Oro, and Giorgio Orsi.", "bbox": {"l": 67.047119, "t": 274.70758, "r": 286.36676, "b": 282.72351, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "Icdar 2013 table competition.", "bbox": {"l": 70.030975, "t": 285.66655999999995, "r": 179.57349, "b": 293.68253, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "In", "bbox": {"l": 187.01559, "t": 285.66655999999995, "r": 194.4846, "b": 293.68253, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "2013 12th International", "bbox": {"l": 198.04398, "t": 285.74725, "r": 286.36304, "b": 293.47632, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Conference on Document Analysis and Recognition", "bbox": {"l": 70.030975, "t": 296.70624, "r": 260.19937, "b": 304.43530000000004, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": ", pages", "bbox": {"l": 260.198, "t": 296.62555, "r": 286.36197, "b": 304.64151, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "1449-1453, 2013. 2", "bbox": {"l": 70.030991, "t": 307.5845299999999, "r": 142.74849, "b": 315.6004899999999, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "[7]", "bbox": {"l": 54.59499, "t": 318.85654, "r": 65.61586, "b": 326.8725, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "EA Green and M Krishnamoorthy.", "bbox": {"l": 67.978821, "t": 318.85654, "r": 199.492, "b": 326.8725, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Recognition of tables", "bbox": {"l": 206.98792, "t": 318.85654, "r": 286.35849, "b": 326.8725, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "using table grammars. procs.", "bbox": {"l": 70.030991, "t": 329.8145400000001, "r": 176.28284, "b": 337.83051, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "In", "bbox": {"l": 182.60416, "t": 329.8145400000001, "r": 190.07317, "b": 337.83051, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "Symposium on Document", "bbox": {"l": 193.28299, "t": 329.89522999999997, "r": 286.36319, "b": 337.62429999999995, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Analysis and Recognition (SDAIR\u201995)", "bbox": {"l": 70.030991, "t": 340.85425, "r": 206.34717, "b": 348.58331, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": ", pages 261-277. 2", "bbox": {"l": 206.34599, "t": 340.77356, "r": 274.82239, "b": 348.78952, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "[8]", "bbox": {"l": 54.594986000000006, "t": 352.0455600000001, "r": 65.04657, "b": 360.06152, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Khurram Azeem Hashmi, Alain Pagani, Marcus Liwicki, Di-", "bbox": {"l": 67.287483, "t": 352.0455600000001, "r": 286.35849, "b": 360.06152, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "dier Stricker, and Muhammad Zeshan Afzal.", "bbox": {"l": 70.030983, "t": 363.00458, "r": 234.12507999999997, "b": 371.02054, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Castabdetec-", "bbox": {"l": 240.05186, "t": 363.00458, "r": 286.36331, "b": 371.02054, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "tors: Cascade network for table detection in document im-", "bbox": {"l": 70.030983, "t": 373.96356, "r": 286.36331, "b": 381.97952, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "ages with recursive feature pyramid and switchable atrous", "bbox": {"l": 70.030983, "t": 384.92255, "r": 286.36331, "b": 392.93851, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "convolution.", "bbox": {"l": 70.030983, "t": 395.88153, "r": 114.57605, "b": 403.89749, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "Journal of Imaging", "bbox": {"l": 117.80399000000001, "t": 395.96222, "r": 186.7287, "b": 403.69128, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": ", 7(10), 2021. 1", "bbox": {"l": 186.728, "t": 395.88153, "r": 243.00113999999996, "b": 403.89749, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "[9]", "bbox": {"l": 54.595001, "t": 407.15253000000007, "r": 65.334427, "b": 415.1684900000001, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Kaiming He, Georgia Gkioxari, Piotr Dollar, and Ross Gir-", "bbox": {"l": 67.637054, "t": 407.15253000000007, "r": 286.35852, "b": 415.1684900000001, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "shick. Mask r-cnn. In", "bbox": {"l": 70.030998, "t": 418.11151, "r": 147.13306, "b": 426.12747, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Proceedings of the IEEE International", "bbox": {"l": 149.15601, "t": 418.1922, "r": 286.35989, "b": 425.92126, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Conference on Computer Vision (ICCV)", "bbox": {"l": 70.031006, "t": 429.15118, "r": 213.48445, "b": 436.88025, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": ", Oct 2017. 1", "bbox": {"l": 213.483, "t": 429.07050000000004, "r": 261.04083, "b": 437.08646000000005, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "[10]", "bbox": {"l": 50.112, "t": 440.3424999999999, "r": 65.399307, "b": 448.3584599999999, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "Yelin He, X. Qi, Jiaquan Ye, Peng Gao, Yihao Chen, Bing-", "bbox": {"l": 67.693321, "t": 440.3424999999999, "r": 286.3587, "b": 448.3584599999999, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "cong Li, Xin Tang, and Rong Xiao.", "bbox": {"l": 70.030998, "t": 451.30151, "r": 202.74268, "b": 459.31747, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "Pingan-vcgroup\u2019s so-", "bbox": {"l": 209.00122, "t": 451.30151, "r": 286.36331, "b": 459.31747, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "lution for icdar 2021 competition on scientific table image", "bbox": {"l": 70.030998, "t": 462.2605, "r": 286.36334, "b": 470.27646, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "recognition to latex.", "bbox": {"l": 70.030998, "t": 473.21948, "r": 141.86981, "b": 481.23544, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "ArXiv", "bbox": {"l": 145.097, "t": 473.30017, "r": 166.01561, "b": 481.02924, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": ", abs/2105.01846, 2021. 2", "bbox": {"l": 166.015, "t": 473.21948, "r": 259.90216, "b": 481.23544, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "[11]", "bbox": {"l": 50.112, "t": 484.49048, "r": 66.033806, "b": 492.50644, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Jianying Hu, Ramanujan S Kashi, Daniel P Lopresti, and", "bbox": {"l": 68.423035, "t": 484.49048, "r": 286.35873, "b": 492.50644, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "Gordon Wilfong. Medium-independent table detection. In", "bbox": {"l": 70.030998, "t": 495.44946, "r": 286.36331, "b": 503.46542, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "Document Recognition and Retrieval VII", "bbox": {"l": 70.030998, "t": 506.48914, "r": 227.40926, "b": 514.2182, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": ", volume 3967,", "bbox": {"l": 227.40500000000003, "t": 506.40845, "r": 286.35913, "b": 514.4244100000001, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "pages 291-302. International Society for Optics and Photon-", "bbox": {"l": 70.031006, "t": 517.36743, "r": 286.36328, "b": 525.38339, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "ics, 1999. 2", "bbox": {"l": 70.031006, "t": 528.32642, "r": 112.36138000000001, "b": 536.34238, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "[12]", "bbox": {"l": 50.112007, "t": 539.59842, "r": 65.466705, "b": 547.61438, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "Matthew Hurst. A constraint-based approach to table struc-", "bbox": {"l": 67.770828, "t": 539.59842, "r": 286.35873, "b": 547.61438, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "ture derivation. In", "bbox": {"l": 70.031006, "t": 550.55742, "r": 136.28374, "b": 558.57338, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "Proceedings of the Seventh International", "bbox": {"l": 138.811, "t": 550.63812, "r": 286.36206, "b": 558.36716, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Conference on Document Analysis and Recognition - Volume", "bbox": {"l": 70.031006, "t": 561.5971199999999, "r": 286.36334, "b": 569.32616, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "2", "bbox": {"l": 70.031006, "t": 572.55612, "r": 74.514206, "b": 580.28516, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": ", ICDAR \u201903, page 911, USA, 2003. IEEE Computer Soci-", "bbox": {"l": 74.514008, "t": 572.47542, "r": 286.36313, "b": 580.4913799999999, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "ety. 2", "bbox": {"l": 70.031006, "t": 583.4334100000001, "r": 90.357834, "b": 591.44937, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "[13]", "bbox": {"l": 50.112007, "t": 594.70541, "r": 66.270439, "b": 602.72137, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Thotreingam Kasar, Philippine Barlas, Sebastien Adam,", "bbox": {"l": 68.695168, "t": 594.70541, "r": 286.35873, "b": 602.72137, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Cl\u00b4ement Chatelain, and Thierry Paquet. Learning to detect", "bbox": {"l": 70.031006, "t": 605.66441, "r": 286.3631, "b": 613.68037, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "tables in scanned document images using line information.", "bbox": {"l": 70.031006, "t": 616.62341, "r": 286.36331, "b": 624.63937, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "In", "bbox": {"l": 70.031006, "t": 627.58241, "r": 77.500015, "b": 635.5983699999999, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "2013 12th International Conference on Document Analy-", "bbox": {"l": 79.920006, "t": 627.6631199999999, "r": 286.3624, "b": 635.39215, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "sis and Recognition", "bbox": {"l": 70.031006, "t": 638.62212, "r": 140.67728, "b": 646.35115, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": ", pages 1185-1189. IEEE, 2013. 2", "bbox": {"l": 140.67599, "t": 638.54141, "r": 264.43921, "b": 646.55737, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "[14]", "bbox": {"l": 50.111992, "t": 649.81342, "r": 66.534035, "b": 657.82938, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "Pratik Kayal, Mrinal Anand, Harsh Desai, and Mayank", "bbox": {"l": 68.998329, "t": 649.81342, "r": 286.35873, "b": 657.82938, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "Singh.", "bbox": {"l": 70.030991, "t": 660.77142, "r": 93.200165, "b": 668.78738, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "Icdar 2021 competition on scientific table image", "bbox": {"l": 102.20243, "t": 660.77142, "r": 286.36334, "b": 668.78738, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "recognition to latex, 2021. 2", "bbox": {"l": 70.030991, "t": 671.73042, "r": 171.9969, "b": 679.74638, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "[15]", "bbox": {"l": 50.111992, "t": 683.00243, "r": 65.515968, "b": 691.01839, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "Harold W Kuhn. The hungarian method for the assignment", "bbox": {"l": 67.827499, "t": 683.00243, "r": 286.3587, "b": 691.01839, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "problem.", "bbox": {"l": 70.030991, "t": 693.9614260000001, "r": 102.15761, "b": 701.977386, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "Naval research logistics quarterly", "bbox": {"l": 107.54999, "t": 694.0421220000001, "r": 231.47461, "b": 701.771156, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": ", 2(1-2):83-97,", "bbox": {"l": 231.47598, "t": 693.9614260000001, "r": 286.35931, "b": 701.977386, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "1955. 6", "bbox": {"l": 70.030975, "t": 704.920425, "r": 97.916481, "b": 712.936386, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "[16]", "bbox": {"l": 308.86197, "t": 75.88342000000011, "r": 324.74973, "b": 83.89940999999999, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "Girish Kulkarni, Visruth Premraj, Vicente Ordonez, Sag-", "bbox": {"l": 327.13382, "t": 75.88342000000011, "r": 545.1087, "b": 83.89940999999999, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "nik Dhar, Siming Li, Yejin Choi, Alexander C. Berg, and", "bbox": {"l": 328.78098, "t": 86.84142999999995, "r": 545.1134, "b": 94.85741999999993, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "Tamara L. Berg.", "bbox": {"l": 328.78098, "t": 97.80042000000003, "r": 390.96295, "b": 105.81641000000002, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "Babytalk:", "bbox": {"l": 400.27008, "t": 97.80042000000003, "r": 435.1404099999999, "b": 105.81641000000002, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "Understanding and generat-", "bbox": {"l": 441.71277, "t": 97.80042000000003, "r": 545.11328, "b": 105.81641000000002, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "ing simple image descriptions.", "bbox": {"l": 328.78098, "t": 108.75940000000003, "r": 440.80719, "b": 116.7753899999999, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "IEEE Transactions on Pat-", "bbox": {"l": 446.63498, "t": 108.84009000000003, "r": 545.11304, "b": 116.56914999999992, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "tern Analysis and Machine Intelligence", "bbox": {"l": 328.78098, "t": 119.79907000000003, "r": 471.13153, "b": 127.52814000000001, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": ", 35(12):2891-2903,", "bbox": {"l": 471.13300000000004, "t": 119.71838000000002, "r": 545.11475, "b": 127.73437999999999, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "2013. 4", "bbox": {"l": 328.78101, "t": 130.67737, "r": 356.6665, "b": 138.69335999999998, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "[17]", "bbox": {"l": 308.862, "t": 142.12334999999996, "r": 325.24371, "b": 150.13933999999995, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "Minghao Li, Lei Cui, Shaohan Huang, Furu Wei, Ming", "bbox": {"l": 327.70197, "t": 142.12334999999996, "r": 545.10883, "b": 150.13933999999995, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "Zhou, and Zhoujun Li.", "bbox": {"l": 328.78101, "t": 153.08136000000002, "r": 414.44598, "b": 161.09735, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "Tablebank: A benchmark dataset", "bbox": {"l": 421.82532, "t": 153.08136000000002, "r": 545.1134, "b": 161.09735, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "for table detection and recognition, 2019. 2, 3", "bbox": {"l": 328.78101, "t": 164.04034000000001, "r": 493.62835999999993, "b": 172.05633999999998, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "[18]", "bbox": {"l": 308.862, "t": 175.48632999999995, "r": 324.26599, "b": 183.50232000000005, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "Yiren Li, Zheng Huang, Junchi Yan, Yi Zhou, Fan Ye, and", "bbox": {"l": 326.57751, "t": 175.48632999999995, "r": 545.10876, "b": 183.50232000000005, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Xianhui Liu. Gfte: Graph-based financial table extraction.", "bbox": {"l": 328.78101, "t": 186.44530999999995, "r": 545.11334, "b": 194.46130000000005, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "In Alberto Del Bimbo, Rita Cucchiara, Stan Sclaroff, Gio-", "bbox": {"l": 328.78101, "t": 197.40430000000003, "r": 545.11346, "b": 205.42029000000002, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "vanni Maria Farinella, Tao Mei, Marco Bertini, Hugo Jair", "bbox": {"l": 328.78101, "t": 208.36328000000003, "r": 545.11353, "b": 216.37927000000002, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "Escalante, and Roberto Vezzani, editors,", "bbox": {"l": 328.78101, "t": 219.32227, "r": 479.26413, "b": 227.33826, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "Pattern Recogni-", "bbox": {"l": 483.11902, "t": 219.40295000000003, "r": 545.11273, "b": 227.13202, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "tion. ICPR International Workshops and Challenges", "bbox": {"l": 328.78101, "t": 230.36095999999998, "r": 519.39771, "b": 238.09002999999996, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": ", pages", "bbox": {"l": 519.401, "t": 230.28026999999997, "r": 545.10767, "b": 238.29625999999996, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "644-658, Cham, 2021. Springer International Publishing. 2,", "bbox": {"l": 328.78101, "t": 241.23925999999994, "r": 545.11328, "b": 249.25525000000005, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "3", "bbox": {"l": 328.78101, "t": 252.19824000000006, "r": 333.26422, "b": 260.21423000000004, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "[19]", "bbox": {"l": 308.862, "t": 263.64423, "r": 324.26477, "b": 271.66022, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "Nikolaos Livathinos, Cesar Berrospi, Maksym Lysak, Vik-", "bbox": {"l": 326.57611, "t": 263.64423, "r": 545.10883, "b": 271.66022, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "tor Kuropiatnyk, Ahmed Nassar, Andre Carvalho, Michele", "bbox": {"l": 328.78101, "t": 274.60321, "r": 545.1134, "b": 282.61917000000005, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "Dolfi, Christoph Auer, Kasper Dinkla, and Peter Staar. Ro-", "bbox": {"l": 328.78101, "t": 285.56219, "r": 545.11328, "b": 293.57816, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "bust pdf document conversion using recurrent neural net-", "bbox": {"l": 328.78101, "t": 296.52118, "r": 545.11334, "b": 304.53714, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "works.", "bbox": {"l": 328.78101, "t": 307.47919, "r": 352.84683, "b": 315.49515, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "Proceedings of the AAAI Conference on Artificial", "bbox": {"l": 360.23599, "t": 307.55988, "r": 545.1142, "b": 315.28894, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "Intelligence", "bbox": {"l": 328.78101, "t": 318.51886, "r": 371.02173, "b": 326.24792, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": ", 35(17):15137-15145, May 2021. 1", "bbox": {"l": 371.021, "t": 318.43817, "r": 502.26227, "b": 326.45413, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "[20]", "bbox": {"l": 308.862, "t": 329.88419, "r": 323.82672, "b": 337.90015, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "Rujiao Long, Wen Wang, Nan Xue, Feiyu Gao, Zhibo Yang,", "bbox": {"l": 326.07233, "t": 329.88419, "r": 545.10876, "b": 337.90015, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "Yongpan Wang, and Gui-Song Xia. Parsing table structures", "bbox": {"l": 328.78101, "t": 340.8432, "r": 545.11346, "b": 348.85916, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "in the wild. In", "bbox": {"l": 328.78101, "t": 351.80219000000005, "r": 382.7767, "b": 359.81815000000006, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "Proceedings of the IEEE/CVF International", "bbox": {"l": 385.54102, "t": 351.88287, "r": 545.11609, "b": 359.61194, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "Conference on Computer Vision", "bbox": {"l": 328.78101, "t": 362.84186, "r": 443.59579, "b": 370.57092, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": ", pages 944-952, 2021. 2", "bbox": {"l": 443.59399, "t": 362.76117, "r": 534.48645, "b": 370.77713, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "[21]", "bbox": {"l": 308.862, "t": 374.20618, "r": 324.60281, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "Shubham", "bbox": {"l": 326.96487, "t": 374.20618, "r": 362.6604, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "Singh", "bbox": {"l": 368.69479, "t": 374.20618, "r": 389.6134, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "Paliwal,", "bbox": {"l": 395.6478, "t": 374.20618, "r": 424.56445, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "D", "bbox": {"l": 431.5492899999999, "t": 374.20618, "r": 438.0230399999999, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "Vishwanath,", "bbox": {"l": 444.05743, "t": 374.20618, "r": 488.5038799999999, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "Rohit", "bbox": {"l": 495.47974, "t": 374.20618, "r": 515.41205, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "Rahul,", "bbox": {"l": 521.44641, "t": 374.20618, "r": 545.10876, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "Monika Sharma, and Lovekesh Vig. Tablenet: Deep learn-", "bbox": {"l": 328.78101, "t": 385.16516, "r": 545.1134, "b": 393.18112, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "ing model for end-to-end table detection and tabular data ex-", "bbox": {"l": 328.78101, "t": 396.12415, "r": 545.11346, "b": 404.14011, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "traction from scanned document images.", "bbox": {"l": 328.78101, "t": 407.08313, "r": 478.00881999999996, "b": 415.09909, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "In", "bbox": {"l": 484.0701, "t": 407.08313, "r": 491.53912, "b": 415.09909, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "2019 Interna-", "bbox": {"l": 494.668, "t": 407.16382, "r": 545.11298, "b": 414.89288, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "tional Conference on Document Analysis and Recognition", "bbox": {"l": 328.78101, "t": 418.12280000000004, "r": 545.11334, "b": 425.85187, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "(ICDAR)", "bbox": {"l": 328.78101, "t": 429.08179, "r": 360.83591, "b": 436.8108500000001, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": ", pages 128-133. IEEE, 2019. 1", "bbox": {"l": 360.836, "t": 429.0011, "r": 475.63287, "b": 437.01706, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "[22]", "bbox": {"l": 308.862, "t": 440.44611, "r": 324.57407, "b": 448.46207, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "Adam Paszke, Sam Gross, Francisco Massa, Adam Lerer,", "bbox": {"l": 326.93179, "t": 440.44611, "r": 545.1087, "b": 448.46207, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "James Bradbury, Gregory Chanan, Trevor Killeen, Zeming", "bbox": {"l": 328.78101, "t": 451.40509, "r": 545.11346, "b": 459.42105, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "Lin, Natalia Gimelshein, Luca Antiga, Alban Desmaison,", "bbox": {"l": 328.78101, "t": 462.36407, "r": 545.11328, "b": 470.38004, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "Andreas Kopf, Edward Yang, Zachary DeVito, Martin Rai-", "bbox": {"l": 328.78101, "t": 473.32306, "r": 545.11328, "b": 481.33902, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "son, Alykhan Tejani, Sasank Chilamkurthy, Benoit Steiner,", "bbox": {"l": 328.78101, "t": 484.28204, "r": 545.11328, "b": 492.298, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "Lu Fang, Junjie Bai, and Soumith Chintala. Pytorch: An im-", "bbox": {"l": 328.78101, "t": 495.24103, "r": 545.1134, "b": 503.25699, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "perative style, high-performance deep learning library. In H.", "bbox": {"l": 328.78101, "t": 506.20001, "r": 545.1134, "b": 514.21597, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "Wallach, H. Larochelle, A. Beygelzimer, F. d'Alch\u00b4e-Buc, E.", "bbox": {"l": 328.78101, "t": 517.159, "r": 545.1098, "b": 525.17496, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "Fox, and R. Garnett, editors,", "bbox": {"l": 328.78101, "t": 528.117, "r": 434.56659, "b": 536.13297, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "Advances in Neural Informa-", "bbox": {"l": 437.86401, "t": 528.19769, "r": 545.11115, "b": 535.9267600000001, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "tion Processing Systems 32", "bbox": {"l": 328.78101, "t": 539.15671, "r": 425.73471, "b": 546.8857399999999, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": ", pages 8024-8035. Curran Asso-", "bbox": {"l": 425.73602, "t": 539.076, "r": 545.11475, "b": 547.09196, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "ciates, Inc., 2019. 6", "bbox": {"l": 328.78101, "t": 550.035, "r": 399.74109, "b": 558.05096, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "[23]", "bbox": {"l": 308.862, "t": 561.481, "r": 324.50351, "b": 569.49696, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "Devashish Prasad, Ayan Gadpal, Kshitij Kapadni, Manish", "bbox": {"l": 326.85068, "t": 561.481, "r": 545.10876, "b": 569.49696, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "Visave, and Kavita Sultanpure. Cascadetabnet: An approach", "bbox": {"l": 328.78101, "t": 572.44, "r": 545.1134, "b": 580.45596, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "for end to end table detection and structure recognition from", "bbox": {"l": 328.78101, "t": 583.399, "r": 545.11334, "b": 591.4149600000001, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "image-based documents. In", "bbox": {"l": 328.78101, "t": 594.358, "r": 431.61667, "b": 602.37396, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "Proceedings of the IEEE/CVF", "bbox": {"l": 434.69101000000006, "t": 594.4387099999999, "r": 545.11224, "b": 602.16774, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "Conference on Computer Vision and Pattern Recognition", "bbox": {"l": 328.78101, "t": 605.39671, "r": 545.1134, "b": 613.12575, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "Workshops", "bbox": {"l": 328.78101, "t": 616.35571, "r": 367.8028, "b": 624.08475, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": ", pages 572-573, 2020. 1", "bbox": {"l": 367.802, "t": 616.2750100000001, "r": 458.69446000000005, "b": 624.29097, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "[24]", "bbox": {"l": 308.862, "t": 627.72101, "r": 324.69476, "b": 635.73697, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "Shah Rukh Qasim, Hassan Mahmood, and Faisal Shafait.", "bbox": {"l": 327.07065, "t": 627.72101, "r": 545.1087, "b": 635.73697, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": "Rethinking table recognition using graph neural networks.", "bbox": {"l": 328.78101, "t": 638.68001, "r": 545.11328, "b": 646.69597, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "In", "bbox": {"l": 328.78101, "t": 649.63901, "r": 336.25003, "b": 657.65497, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "2019 International Conference on Document Analysis and", "bbox": {"l": 338.10001, "t": 649.71971, "r": 545.11621, "b": 657.44875, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "Recognition (ICDAR)", "bbox": {"l": 328.78101, "t": 660.67871, "r": 406.32245, "b": 668.40775, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": ", pages 142-147. IEEE, 2019. 3", "bbox": {"l": 406.32202, "t": 660.5980099999999, "r": 521.1189, "b": 668.61398, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "[25]", "bbox": {"l": 308.86203, "t": 672.04301, "r": 324.71329, "b": 680.05898, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "Hamid Rezatofighi, Nathan Tsoi, JunYoung Gwak, Amir", "bbox": {"l": 327.09195, "t": 672.04301, "r": 545.10876, "b": 680.05898, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "Sadeghian, Ian Reid, and Silvio Savarese.", "bbox": {"l": 328.78104, "t": 683.0020099999999, "r": 482.81488, "b": 691.01797, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "Generalized in-", "bbox": {"l": 488.75064, "t": 683.0020099999999, "r": 545.1134, "b": 691.01797, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "tersection over union: A metric and a loss for bounding box", "bbox": {"l": 328.78104, "t": 693.961014, "r": 545.11334, "b": 701.976974, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "regression. In", "bbox": {"l": 328.78104, "t": 704.920013, "r": 379.1543, "b": 712.935974, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "Proceedings of the IEEE/CVF Conference on", "bbox": {"l": 381.61603, "t": 705.00071, "r": 545.10938, "b": 712.729744, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "9", "bbox": {"l": 295.12103, "t": 734.1325870000001, "r": 300.10233, "b": 743.0391500000001, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 25, "label": "list_item", "bbox": {"l": 70.030998, "t": 75.88378999999998, "r": 286.36334, "b": 116.77575999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.7310384511947632, "cells": [{"id": 0, "text": "end object detection with transformers. In Andrea Vedaldi,", "bbox": {"l": 70.030998, "t": 75.88378999999998, "r": 286.36334, "b": 83.89977999999996, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Horst Bischof, Thomas Brox, and Jan-Michael Frahm, edi-", "bbox": {"l": 70.030998, "t": 86.84276999999997, "r": 286.36331, "b": 94.85875999999996, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "tors,", "bbox": {"l": 70.030998, "t": 97.80078000000003, "r": 85.722198, "b": 105.81677000000002, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Computer Vision - ECCV 2020", "bbox": {"l": 87.889, "t": 97.88147000000004, "r": 199.93315, "b": 105.61053000000004, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": ", pages 213-229, Cham,", "bbox": {"l": 199.936, "t": 97.80078000000003, "r": 286.36313, "b": 105.81677000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "2020. Springer International Publishing. 5", "bbox": {"l": 70.031006, "t": 108.75977, "r": 221.94871999999998, "b": 116.77575999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "list_item", "bbox": {"l": 54.595005, "t": 120.03174000000013, "r": 286.36334, "b": 149.96569999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9372755885124207, "cells": [{"id": 6, "text": "[2]", "bbox": {"l": 54.595005, "t": 120.03174000000013, "r": 65.206657, "b": 128.04773, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Zewen Chi, Heyan Huang, Heng-Da Xu, Houjin Yu, Wanx-", "bbox": {"l": 67.481873, "t": 120.03174000000013, "r": 286.35852, "b": 128.04773, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "uan Yin, and Xian-Ling Mao.", "bbox": {"l": 70.031006, "t": 130.99072, "r": 179.67215, "b": 139.00671, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Complicated table structure", "bbox": {"l": 185.58101, "t": 130.99072, "r": 286.36334, "b": 139.00671, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "recognition.", "bbox": {"l": 70.031006, "t": 141.94970999999998, "r": 113.11456, "b": 149.96569999999997, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "arXiv preprint arXiv:1908.04729", "bbox": {"l": 116.34200999999999, "t": 142.0304, "r": 235.3082, "b": 149.75946, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": ", 2019. 3", "bbox": {"l": 235.30701, "t": 141.94970999999998, "r": 267.67572, "b": 149.96569999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "list_item", "bbox": {"l": 54.595001, "t": 153.22168, "r": 286.36301, "b": 183.15466000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9378374218940735, "cells": [{"id": 13, "text": "[3]", "bbox": {"l": 54.595001, "t": 153.22168, "r": 65.103195, "b": 161.23766999999998, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Bertrand Couasnon and Aurelie Lemaitre.", "bbox": {"l": 67.356239, "t": 153.22168, "r": 218.77876, "b": 161.23766999999998, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Recognition of Ta-", "bbox": {"l": 220.97999999999996, "t": 153.30237, "r": 286.36301, "b": 161.03143, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "bles and Forms", "bbox": {"l": 70.030991, "t": 164.26135, "r": 125.26401000000001, "b": 171.99041999999997, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": ", pages 647-677. Springer London, London,", "bbox": {"l": 125.26098999999999, "t": 164.18066, "r": 286.36029, "b": 172.19665999999995, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "2014. 2", "bbox": {"l": 70.030991, "t": 175.13867000000005, "r": 97.916496, "b": 183.15466000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "list_item", "bbox": {"l": 54.59499, "t": 186.41063999999994, "r": 286.36401, "b": 227.30358999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9648825526237488, "cells": [{"id": 19, "text": "[4]", "bbox": {"l": 54.59499, "t": 186.41063999999994, "r": 65.806984, "b": 194.42664000000002, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Herv\u00b4e D\u00b4ejean, Jean-Luc Meunier, Liangcai Gao, Yilun", "bbox": {"l": 68.210922, "t": 186.41063999999994, "r": 286.36401, "b": 194.42664000000002, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Huang, Yu Fang, Florian Kleber, and Eva-Maria Lang. IC-", "bbox": {"l": 70.030983, "t": 197.36963000000003, "r": 286.36331, "b": 205.38562000000002, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "DAR 2019 Competition on Table Detection and Recognition", "bbox": {"l": 70.030983, "t": 208.32861000000003, "r": 286.36334, "b": 216.3446, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "(cTDaR), Apr. 2019. http://sac.founderit.com/. 2", "bbox": {"l": 70.030983, "t": 219.2876, "r": 245.83519, "b": 227.30358999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "list_item", "bbox": {"l": 54.594982, "t": 230.55957, "r": 286.36334, "b": 271.45154, "coord_origin": "TOPLEFT"}, "confidence": 0.9620943069458008, "cells": [{"id": 24, "text": "[5]", "bbox": {"l": 54.594982, "t": 230.55957, "r": 65.381134, "b": 238.57556, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "Basilios Gatos, Dimitrios Danatsas, Ioannis Pratikakis, and", "bbox": {"l": 67.693779, "t": 230.55957, "r": 286.35849, "b": 238.57556, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "Stavros J Perantonis. Automatic table detection in document", "bbox": {"l": 70.030983, "t": 241.51855, "r": 286.36334, "b": 249.53454999999997, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "images. In", "bbox": {"l": 70.030983, "t": 252.47655999999995, "r": 108.39821, "b": 260.49255000000005, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "International Conference on Pattern Recognition", "bbox": {"l": 110.64498000000002, "t": 252.55724999999995, "r": 286.3595, "b": 260.28632000000005, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "and Image Analysis", "bbox": {"l": 70.030983, "t": 263.51624000000004, "r": 140.57861, "b": 271.24530000000004, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": ", pages 609-618. Springer, 2005. 2", "bbox": {"l": 140.57797, "t": 263.43555000000003, "r": 266.47522, "b": 271.45154, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "list_item", "bbox": {"l": 54.594971, "t": 274.70758, "r": 286.36676, "b": 315.6004899999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9555517435073853, "cells": [{"id": 31, "text": "[6]", "bbox": {"l": 54.594971, "t": 274.70758, "r": 64.848648, "b": 282.72351, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Max G\u00a8obel, Tamir Hassan, Ermelinda Oro, and Giorgio Orsi.", "bbox": {"l": 67.047119, "t": 274.70758, "r": 286.36676, "b": 282.72351, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "Icdar 2013 table competition.", "bbox": {"l": 70.030975, "t": 285.66655999999995, "r": 179.57349, "b": 293.68253, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "In", "bbox": {"l": 187.01559, "t": 285.66655999999995, "r": 194.4846, "b": 293.68253, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "2013 12th International", "bbox": {"l": 198.04398, "t": 285.74725, "r": 286.36304, "b": 293.47632, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Conference on Document Analysis and Recognition", "bbox": {"l": 70.030975, "t": 296.70624, "r": 260.19937, "b": 304.43530000000004, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": ", pages", "bbox": {"l": 260.198, "t": 296.62555, "r": 286.36197, "b": 304.64151, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "1449-1453, 2013. 2", "bbox": {"l": 70.030991, "t": 307.5845299999999, "r": 142.74849, "b": 315.6004899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "list_item", "bbox": {"l": 54.59499, "t": 318.85654, "r": 286.36319, "b": 348.78952, "coord_origin": "TOPLEFT"}, "confidence": 0.9479843378067017, "cells": [{"id": 39, "text": "[7]", "bbox": {"l": 54.59499, "t": 318.85654, "r": 65.61586, "b": 326.8725, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "EA Green and M Krishnamoorthy.", "bbox": {"l": 67.978821, "t": 318.85654, "r": 199.492, "b": 326.8725, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Recognition of tables", "bbox": {"l": 206.98792, "t": 318.85654, "r": 286.35849, "b": 326.8725, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "using table grammars. procs.", "bbox": {"l": 70.030991, "t": 329.8145400000001, "r": 176.28284, "b": 337.83051, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "In", "bbox": {"l": 182.60416, "t": 329.8145400000001, "r": 190.07317, "b": 337.83051, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "Symposium on Document", "bbox": {"l": 193.28299, "t": 329.89522999999997, "r": 286.36319, "b": 337.62429999999995, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Analysis and Recognition (SDAIR\u201995)", "bbox": {"l": 70.030991, "t": 340.85425, "r": 206.34717, "b": 348.58331, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": ", pages 261-277. 2", "bbox": {"l": 206.34599, "t": 340.77356, "r": 274.82239, "b": 348.78952, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "list_item", "bbox": {"l": 54.594986000000006, "t": 352.0455600000001, "r": 286.36331, "b": 403.89749, "coord_origin": "TOPLEFT"}, "confidence": 0.9484425187110901, "cells": [{"id": 47, "text": "[8]", "bbox": {"l": 54.594986000000006, "t": 352.0455600000001, "r": 65.04657, "b": 360.06152, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Khurram Azeem Hashmi, Alain Pagani, Marcus Liwicki, Di-", "bbox": {"l": 67.287483, "t": 352.0455600000001, "r": 286.35849, "b": 360.06152, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "dier Stricker, and Muhammad Zeshan Afzal.", "bbox": {"l": 70.030983, "t": 363.00458, "r": 234.12507999999997, "b": 371.02054, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Castabdetec-", "bbox": {"l": 240.05186, "t": 363.00458, "r": 286.36331, "b": 371.02054, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "tors: Cascade network for table detection in document im-", "bbox": {"l": 70.030983, "t": 373.96356, "r": 286.36331, "b": 381.97952, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "ages with recursive feature pyramid and switchable atrous", "bbox": {"l": 70.030983, "t": 384.92255, "r": 286.36331, "b": 392.93851, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "convolution.", "bbox": {"l": 70.030983, "t": 395.88153, "r": 114.57605, "b": 403.89749, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "Journal of Imaging", "bbox": {"l": 117.80399000000001, "t": 395.96222, "r": 186.7287, "b": 403.69128, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": ", 7(10), 2021. 1", "bbox": {"l": 186.728, "t": 395.88153, "r": 243.00113999999996, "b": 403.89749, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "list_item", "bbox": {"l": 54.595001, "t": 407.15253000000007, "r": 286.35989, "b": 437.08646000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9330756664276123, "cells": [{"id": 56, "text": "[9]", "bbox": {"l": 54.595001, "t": 407.15253000000007, "r": 65.334427, "b": 415.1684900000001, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Kaiming He, Georgia Gkioxari, Piotr Dollar, and Ross Gir-", "bbox": {"l": 67.637054, "t": 407.15253000000007, "r": 286.35852, "b": 415.1684900000001, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "shick. Mask r-cnn. In", "bbox": {"l": 70.030998, "t": 418.11151, "r": 147.13306, "b": 426.12747, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Proceedings of the IEEE International", "bbox": {"l": 149.15601, "t": 418.1922, "r": 286.35989, "b": 425.92126, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Conference on Computer Vision (ICCV)", "bbox": {"l": 70.031006, "t": 429.15118, "r": 213.48445, "b": 436.88025, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": ", Oct 2017. 1", "bbox": {"l": 213.483, "t": 429.07050000000004, "r": 261.04083, "b": 437.08646000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "list_item", "bbox": {"l": 50.112, "t": 440.3424999999999, "r": 286.36334, "b": 481.23544, "coord_origin": "TOPLEFT"}, "confidence": 0.9274735450744629, "cells": [{"id": 62, "text": "[10]", "bbox": {"l": 50.112, "t": 440.3424999999999, "r": 65.399307, "b": 448.3584599999999, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "Yelin He, X. Qi, Jiaquan Ye, Peng Gao, Yihao Chen, Bing-", "bbox": {"l": 67.693321, "t": 440.3424999999999, "r": 286.3587, "b": 448.3584599999999, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "cong Li, Xin Tang, and Rong Xiao.", "bbox": {"l": 70.030998, "t": 451.30151, "r": 202.74268, "b": 459.31747, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "Pingan-vcgroup\u2019s so-", "bbox": {"l": 209.00122, "t": 451.30151, "r": 286.36331, "b": 459.31747, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "lution for icdar 2021 competition on scientific table image", "bbox": {"l": 70.030998, "t": 462.2605, "r": 286.36334, "b": 470.27646, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "recognition to latex.", "bbox": {"l": 70.030998, "t": 473.21948, "r": 141.86981, "b": 481.23544, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "ArXiv", "bbox": {"l": 145.097, "t": 473.30017, "r": 166.01561, "b": 481.02924, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": ", abs/2105.01846, 2021. 2", "bbox": {"l": 166.015, "t": 473.21948, "r": 259.90216, "b": 481.23544, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "list_item", "bbox": {"l": 50.112, "t": 484.49048, "r": 286.36331, "b": 536.34238, "coord_origin": "TOPLEFT"}, "confidence": 0.9299950003623962, "cells": [{"id": 70, "text": "[11]", "bbox": {"l": 50.112, "t": 484.49048, "r": 66.033806, "b": 492.50644, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Jianying Hu, Ramanujan S Kashi, Daniel P Lopresti, and", "bbox": {"l": 68.423035, "t": 484.49048, "r": 286.35873, "b": 492.50644, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "Gordon Wilfong. Medium-independent table detection. In", "bbox": {"l": 70.030998, "t": 495.44946, "r": 286.36331, "b": 503.46542, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "Document Recognition and Retrieval VII", "bbox": {"l": 70.030998, "t": 506.48914, "r": 227.40926, "b": 514.2182, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": ", volume 3967,", "bbox": {"l": 227.40500000000003, "t": 506.40845, "r": 286.35913, "b": 514.4244100000001, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "pages 291-302. International Society for Optics and Photon-", "bbox": {"l": 70.031006, "t": 517.36743, "r": 286.36328, "b": 525.38339, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "ics, 1999. 2", "bbox": {"l": 70.031006, "t": 528.32642, "r": 112.36138000000001, "b": 536.34238, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "list_item", "bbox": {"l": 50.112007, "t": 539.59842, "r": 286.36334, "b": 591.44937, "coord_origin": "TOPLEFT"}, "confidence": 0.9394103288650513, "cells": [{"id": 77, "text": "[12]", "bbox": {"l": 50.112007, "t": 539.59842, "r": 65.466705, "b": 547.61438, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "Matthew Hurst. A constraint-based approach to table struc-", "bbox": {"l": 67.770828, "t": 539.59842, "r": 286.35873, "b": 547.61438, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "ture derivation. In", "bbox": {"l": 70.031006, "t": 550.55742, "r": 136.28374, "b": 558.57338, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "Proceedings of the Seventh International", "bbox": {"l": 138.811, "t": 550.63812, "r": 286.36206, "b": 558.36716, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Conference on Document Analysis and Recognition - Volume", "bbox": {"l": 70.031006, "t": 561.5971199999999, "r": 286.36334, "b": 569.32616, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "2", "bbox": {"l": 70.031006, "t": 572.55612, "r": 74.514206, "b": 580.28516, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": ", ICDAR \u201903, page 911, USA, 2003. IEEE Computer Soci-", "bbox": {"l": 74.514008, "t": 572.47542, "r": 286.36313, "b": 580.4913799999999, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "ety. 2", "bbox": {"l": 70.031006, "t": 583.4334100000001, "r": 90.357834, "b": 591.44937, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "list_item", "bbox": {"l": 50.112007, "t": 594.70541, "r": 286.36331, "b": 646.55737, "coord_origin": "TOPLEFT"}, "confidence": 0.9298838973045349, "cells": [{"id": 85, "text": "[13]", "bbox": {"l": 50.112007, "t": 594.70541, "r": 66.270439, "b": 602.72137, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Thotreingam Kasar, Philippine Barlas, Sebastien Adam,", "bbox": {"l": 68.695168, "t": 594.70541, "r": 286.35873, "b": 602.72137, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Cl\u00b4ement Chatelain, and Thierry Paquet. Learning to detect", "bbox": {"l": 70.031006, "t": 605.66441, "r": 286.3631, "b": 613.68037, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "tables in scanned document images using line information.", "bbox": {"l": 70.031006, "t": 616.62341, "r": 286.36331, "b": 624.63937, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "In", "bbox": {"l": 70.031006, "t": 627.58241, "r": 77.500015, "b": 635.5983699999999, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "2013 12th International Conference on Document Analy-", "bbox": {"l": 79.920006, "t": 627.6631199999999, "r": 286.3624, "b": 635.39215, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "sis and Recognition", "bbox": {"l": 70.031006, "t": 638.62212, "r": 140.67728, "b": 646.35115, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": ", pages 1185-1189. IEEE, 2013. 2", "bbox": {"l": 140.67599, "t": 638.54141, "r": 264.43921, "b": 646.55737, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "list_item", "bbox": {"l": 50.111992, "t": 649.81342, "r": 286.36334, "b": 679.74638, "coord_origin": "TOPLEFT"}, "confidence": 0.9115257263183594, "cells": [{"id": 93, "text": "[14]", "bbox": {"l": 50.111992, "t": 649.81342, "r": 66.534035, "b": 657.82938, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "Pratik Kayal, Mrinal Anand, Harsh Desai, and Mayank", "bbox": {"l": 68.998329, "t": 649.81342, "r": 286.35873, "b": 657.82938, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "Singh.", "bbox": {"l": 70.030991, "t": 660.77142, "r": 93.200165, "b": 668.78738, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "Icdar 2021 competition on scientific table image", "bbox": {"l": 102.20243, "t": 660.77142, "r": 286.36334, "b": 668.78738, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "recognition to latex, 2021. 2", "bbox": {"l": 70.030991, "t": 671.73042, "r": 171.9969, "b": 679.74638, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "list_item", "bbox": {"l": 50.111992, "t": 683.00243, "r": 286.35931, "b": 712.936386, "coord_origin": "TOPLEFT"}, "confidence": 0.912230372428894, "cells": [{"id": 98, "text": "[15]", "bbox": {"l": 50.111992, "t": 683.00243, "r": 65.515968, "b": 691.01839, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "Harold W Kuhn. The hungarian method for the assignment", "bbox": {"l": 67.827499, "t": 683.00243, "r": 286.3587, "b": 691.01839, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "problem.", "bbox": {"l": 70.030991, "t": 693.9614260000001, "r": 102.15761, "b": 701.977386, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "Naval research logistics quarterly", "bbox": {"l": 107.54999, "t": 694.0421220000001, "r": 231.47461, "b": 701.771156, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": ", 2(1-2):83-97,", "bbox": {"l": 231.47598, "t": 693.9614260000001, "r": 286.35931, "b": 701.977386, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "1955. 6", "bbox": {"l": 70.030975, "t": 704.920425, "r": 97.916481, "b": 712.936386, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "list_item", "bbox": {"l": 308.86197, "t": 75.88342000000011, "r": 545.11475, "b": 138.69335999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.9389600157737732, "cells": [{"id": 104, "text": "[16]", "bbox": {"l": 308.86197, "t": 75.88342000000011, "r": 324.74973, "b": 83.89940999999999, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "Girish Kulkarni, Visruth Premraj, Vicente Ordonez, Sag-", "bbox": {"l": 327.13382, "t": 75.88342000000011, "r": 545.1087, "b": 83.89940999999999, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "nik Dhar, Siming Li, Yejin Choi, Alexander C. Berg, and", "bbox": {"l": 328.78098, "t": 86.84142999999995, "r": 545.1134, "b": 94.85741999999993, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "Tamara L. Berg.", "bbox": {"l": 328.78098, "t": 97.80042000000003, "r": 390.96295, "b": 105.81641000000002, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "Babytalk:", "bbox": {"l": 400.27008, "t": 97.80042000000003, "r": 435.1404099999999, "b": 105.81641000000002, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "Understanding and generat-", "bbox": {"l": 441.71277, "t": 97.80042000000003, "r": 545.11328, "b": 105.81641000000002, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "ing simple image descriptions.", "bbox": {"l": 328.78098, "t": 108.75940000000003, "r": 440.80719, "b": 116.7753899999999, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "IEEE Transactions on Pat-", "bbox": {"l": 446.63498, "t": 108.84009000000003, "r": 545.11304, "b": 116.56914999999992, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "tern Analysis and Machine Intelligence", "bbox": {"l": 328.78098, "t": 119.79907000000003, "r": 471.13153, "b": 127.52814000000001, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": ", 35(12):2891-2903,", "bbox": {"l": 471.13300000000004, "t": 119.71838000000002, "r": 545.11475, "b": 127.73437999999999, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "2013. 4", "bbox": {"l": 328.78101, "t": 130.67737, "r": 356.6665, "b": 138.69335999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "list_item", "bbox": {"l": 308.862, "t": 142.12334999999996, "r": 545.1134, "b": 172.05633999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.9253129959106445, "cells": [{"id": 115, "text": "[17]", "bbox": {"l": 308.862, "t": 142.12334999999996, "r": 325.24371, "b": 150.13933999999995, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "Minghao Li, Lei Cui, Shaohan Huang, Furu Wei, Ming", "bbox": {"l": 327.70197, "t": 142.12334999999996, "r": 545.10883, "b": 150.13933999999995, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "Zhou, and Zhoujun Li.", "bbox": {"l": 328.78101, "t": 153.08136000000002, "r": 414.44598, "b": 161.09735, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "Tablebank: A benchmark dataset", "bbox": {"l": 421.82532, "t": 153.08136000000002, "r": 545.1134, "b": 161.09735, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "for table detection and recognition, 2019. 2, 3", "bbox": {"l": 328.78101, "t": 164.04034000000001, "r": 493.62835999999993, "b": 172.05633999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "list_item", "bbox": {"l": 308.862, "t": 175.48632999999995, "r": 545.11353, "b": 260.21423000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9299732446670532, "cells": [{"id": 120, "text": "[18]", "bbox": {"l": 308.862, "t": 175.48632999999995, "r": 324.26599, "b": 183.50232000000005, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "Yiren Li, Zheng Huang, Junchi Yan, Yi Zhou, Fan Ye, and", "bbox": {"l": 326.57751, "t": 175.48632999999995, "r": 545.10876, "b": 183.50232000000005, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Xianhui Liu. Gfte: Graph-based financial table extraction.", "bbox": {"l": 328.78101, "t": 186.44530999999995, "r": 545.11334, "b": 194.46130000000005, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "In Alberto Del Bimbo, Rita Cucchiara, Stan Sclaroff, Gio-", "bbox": {"l": 328.78101, "t": 197.40430000000003, "r": 545.11346, "b": 205.42029000000002, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "vanni Maria Farinella, Tao Mei, Marco Bertini, Hugo Jair", "bbox": {"l": 328.78101, "t": 208.36328000000003, "r": 545.11353, "b": 216.37927000000002, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "Escalante, and Roberto Vezzani, editors,", "bbox": {"l": 328.78101, "t": 219.32227, "r": 479.26413, "b": 227.33826, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "Pattern Recogni-", "bbox": {"l": 483.11902, "t": 219.40295000000003, "r": 545.11273, "b": 227.13202, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "tion. ICPR International Workshops and Challenges", "bbox": {"l": 328.78101, "t": 230.36095999999998, "r": 519.39771, "b": 238.09002999999996, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": ", pages", "bbox": {"l": 519.401, "t": 230.28026999999997, "r": 545.10767, "b": 238.29625999999996, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "644-658, Cham, 2021. Springer International Publishing. 2,", "bbox": {"l": 328.78101, "t": 241.23925999999994, "r": 545.11328, "b": 249.25525000000005, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "3", "bbox": {"l": 328.78101, "t": 252.19824000000006, "r": 333.26422, "b": 260.21423000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "list_item", "bbox": {"l": 308.862, "t": 263.64423, "r": 545.1142, "b": 326.45413, "coord_origin": "TOPLEFT"}, "confidence": 0.937321662902832, "cells": [{"id": 131, "text": "[19]", "bbox": {"l": 308.862, "t": 263.64423, "r": 324.26477, "b": 271.66022, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "Nikolaos Livathinos, Cesar Berrospi, Maksym Lysak, Vik-", "bbox": {"l": 326.57611, "t": 263.64423, "r": 545.10883, "b": 271.66022, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "tor Kuropiatnyk, Ahmed Nassar, Andre Carvalho, Michele", "bbox": {"l": 328.78101, "t": 274.60321, "r": 545.1134, "b": 282.61917000000005, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "Dolfi, Christoph Auer, Kasper Dinkla, and Peter Staar. Ro-", "bbox": {"l": 328.78101, "t": 285.56219, "r": 545.11328, "b": 293.57816, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "bust pdf document conversion using recurrent neural net-", "bbox": {"l": 328.78101, "t": 296.52118, "r": 545.11334, "b": 304.53714, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "works.", "bbox": {"l": 328.78101, "t": 307.47919, "r": 352.84683, "b": 315.49515, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "Proceedings of the AAAI Conference on Artificial", "bbox": {"l": 360.23599, "t": 307.55988, "r": 545.1142, "b": 315.28894, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "Intelligence", "bbox": {"l": 328.78101, "t": 318.51886, "r": 371.02173, "b": 326.24792, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": ", 35(17):15137-15145, May 2021. 1", "bbox": {"l": 371.021, "t": 318.43817, "r": 502.26227, "b": 326.45413, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "list_item", "bbox": {"l": 308.862, "t": 329.88419, "r": 545.11609, "b": 370.77713, "coord_origin": "TOPLEFT"}, "confidence": 0.9027292728424072, "cells": [{"id": 140, "text": "[20]", "bbox": {"l": 308.862, "t": 329.88419, "r": 323.82672, "b": 337.90015, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "Rujiao Long, Wen Wang, Nan Xue, Feiyu Gao, Zhibo Yang,", "bbox": {"l": 326.07233, "t": 329.88419, "r": 545.10876, "b": 337.90015, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "Yongpan Wang, and Gui-Song Xia. Parsing table structures", "bbox": {"l": 328.78101, "t": 340.8432, "r": 545.11346, "b": 348.85916, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "in the wild. In", "bbox": {"l": 328.78101, "t": 351.80219000000005, "r": 382.7767, "b": 359.81815000000006, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "Proceedings of the IEEE/CVF International", "bbox": {"l": 385.54102, "t": 351.88287, "r": 545.11609, "b": 359.61194, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "Conference on Computer Vision", "bbox": {"l": 328.78101, "t": 362.84186, "r": 443.59579, "b": 370.57092, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": ", pages 944-952, 2021. 2", "bbox": {"l": 443.59399, "t": 362.76117, "r": 534.48645, "b": 370.77713, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "list_item", "bbox": {"l": 308.862, "t": 374.20618, "r": 545.11346, "b": 437.01706, "coord_origin": "TOPLEFT"}, "confidence": 0.882714569568634, "cells": [{"id": 147, "text": "[21]", "bbox": {"l": 308.862, "t": 374.20618, "r": 324.60281, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "Shubham", "bbox": {"l": 326.96487, "t": 374.20618, "r": 362.6604, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "Singh", "bbox": {"l": 368.69479, "t": 374.20618, "r": 389.6134, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "Paliwal,", "bbox": {"l": 395.6478, "t": 374.20618, "r": 424.56445, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "D", "bbox": {"l": 431.5492899999999, "t": 374.20618, "r": 438.0230399999999, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "Vishwanath,", "bbox": {"l": 444.05743, "t": 374.20618, "r": 488.5038799999999, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "Rohit", "bbox": {"l": 495.47974, "t": 374.20618, "r": 515.41205, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "Rahul,", "bbox": {"l": 521.44641, "t": 374.20618, "r": 545.10876, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "Monika Sharma, and Lovekesh Vig. Tablenet: Deep learn-", "bbox": {"l": 328.78101, "t": 385.16516, "r": 545.1134, "b": 393.18112, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "ing model for end-to-end table detection and tabular data ex-", "bbox": {"l": 328.78101, "t": 396.12415, "r": 545.11346, "b": 404.14011, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "traction from scanned document images.", "bbox": {"l": 328.78101, "t": 407.08313, "r": 478.00881999999996, "b": 415.09909, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "In", "bbox": {"l": 484.0701, "t": 407.08313, "r": 491.53912, "b": 415.09909, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "2019 Interna-", "bbox": {"l": 494.668, "t": 407.16382, "r": 545.11298, "b": 414.89288, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "tional Conference on Document Analysis and Recognition", "bbox": {"l": 328.78101, "t": 418.12280000000004, "r": 545.11334, "b": 425.85187, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "(ICDAR)", "bbox": {"l": 328.78101, "t": 429.08179, "r": 360.83591, "b": 436.8108500000001, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": ", pages 128-133. IEEE, 2019. 1", "bbox": {"l": 360.836, "t": 429.0011, "r": 475.63287, "b": 437.01706, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "list_item", "bbox": {"l": 308.862, "t": 440.44611, "r": 545.11475, "b": 558.05096, "coord_origin": "TOPLEFT"}, "confidence": 0.8896440863609314, "cells": [{"id": 163, "text": "[22]", "bbox": {"l": 308.862, "t": 440.44611, "r": 324.57407, "b": 448.46207, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "Adam Paszke, Sam Gross, Francisco Massa, Adam Lerer,", "bbox": {"l": 326.93179, "t": 440.44611, "r": 545.1087, "b": 448.46207, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "James Bradbury, Gregory Chanan, Trevor Killeen, Zeming", "bbox": {"l": 328.78101, "t": 451.40509, "r": 545.11346, "b": 459.42105, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "Lin, Natalia Gimelshein, Luca Antiga, Alban Desmaison,", "bbox": {"l": 328.78101, "t": 462.36407, "r": 545.11328, "b": 470.38004, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "Andreas Kopf, Edward Yang, Zachary DeVito, Martin Rai-", "bbox": {"l": 328.78101, "t": 473.32306, "r": 545.11328, "b": 481.33902, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "son, Alykhan Tejani, Sasank Chilamkurthy, Benoit Steiner,", "bbox": {"l": 328.78101, "t": 484.28204, "r": 545.11328, "b": 492.298, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "Lu Fang, Junjie Bai, and Soumith Chintala. Pytorch: An im-", "bbox": {"l": 328.78101, "t": 495.24103, "r": 545.1134, "b": 503.25699, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "perative style, high-performance deep learning library. In H.", "bbox": {"l": 328.78101, "t": 506.20001, "r": 545.1134, "b": 514.21597, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "Wallach, H. Larochelle, A. Beygelzimer, F. d'Alch\u00b4e-Buc, E.", "bbox": {"l": 328.78101, "t": 517.159, "r": 545.1098, "b": 525.17496, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "Fox, and R. Garnett, editors,", "bbox": {"l": 328.78101, "t": 528.117, "r": 434.56659, "b": 536.13297, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "Advances in Neural Informa-", "bbox": {"l": 437.86401, "t": 528.19769, "r": 545.11115, "b": 535.9267600000001, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "tion Processing Systems 32", "bbox": {"l": 328.78101, "t": 539.15671, "r": 425.73471, "b": 546.8857399999999, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": ", pages 8024-8035. Curran Asso-", "bbox": {"l": 425.73602, "t": 539.076, "r": 545.11475, "b": 547.09196, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "ciates, Inc., 2019. 6", "bbox": {"l": 328.78101, "t": 550.035, "r": 399.74109, "b": 558.05096, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "list_item", "bbox": {"l": 308.862, "t": 561.481, "r": 545.1134, "b": 624.29097, "coord_origin": "TOPLEFT"}, "confidence": 0.9025435447692871, "cells": [{"id": 177, "text": "[23]", "bbox": {"l": 308.862, "t": 561.481, "r": 324.50351, "b": 569.49696, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "Devashish Prasad, Ayan Gadpal, Kshitij Kapadni, Manish", "bbox": {"l": 326.85068, "t": 561.481, "r": 545.10876, "b": 569.49696, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "Visave, and Kavita Sultanpure. Cascadetabnet: An approach", "bbox": {"l": 328.78101, "t": 572.44, "r": 545.1134, "b": 580.45596, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "for end to end table detection and structure recognition from", "bbox": {"l": 328.78101, "t": 583.399, "r": 545.11334, "b": 591.4149600000001, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "image-based documents. In", "bbox": {"l": 328.78101, "t": 594.358, "r": 431.61667, "b": 602.37396, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "Proceedings of the IEEE/CVF", "bbox": {"l": 434.69101000000006, "t": 594.4387099999999, "r": 545.11224, "b": 602.16774, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "Conference on Computer Vision and Pattern Recognition", "bbox": {"l": 328.78101, "t": 605.39671, "r": 545.1134, "b": 613.12575, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "Workshops", "bbox": {"l": 328.78101, "t": 616.35571, "r": 367.8028, "b": 624.08475, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": ", pages 572-573, 2020. 1", "bbox": {"l": 367.802, "t": 616.2750100000001, "r": 458.69446000000005, "b": 624.29097, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "list_item", "bbox": {"l": 308.862, "t": 627.72101, "r": 545.11621, "b": 668.61398, "coord_origin": "TOPLEFT"}, "confidence": 0.8777532577514648, "cells": [{"id": 186, "text": "[24]", "bbox": {"l": 308.862, "t": 627.72101, "r": 324.69476, "b": 635.73697, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "Shah Rukh Qasim, Hassan Mahmood, and Faisal Shafait.", "bbox": {"l": 327.07065, "t": 627.72101, "r": 545.1087, "b": 635.73697, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": "Rethinking table recognition using graph neural networks.", "bbox": {"l": 328.78101, "t": 638.68001, "r": 545.11328, "b": 646.69597, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "In", "bbox": {"l": 328.78101, "t": 649.63901, "r": 336.25003, "b": 657.65497, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "2019 International Conference on Document Analysis and", "bbox": {"l": 338.10001, "t": 649.71971, "r": 545.11621, "b": 657.44875, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "Recognition (ICDAR)", "bbox": {"l": 328.78101, "t": 660.67871, "r": 406.32245, "b": 668.40775, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": ", pages 142-147. IEEE, 2019. 3", "bbox": {"l": 406.32202, "t": 660.5980099999999, "r": 521.1189, "b": 668.61398, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "list_item", "bbox": {"l": 308.86203, "t": 672.04301, "r": 545.1134, "b": 712.935974, "coord_origin": "TOPLEFT"}, "confidence": 0.8654531240463257, "cells": [{"id": 193, "text": "[25]", "bbox": {"l": 308.86203, "t": 672.04301, "r": 324.71329, "b": 680.05898, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "Hamid Rezatofighi, Nathan Tsoi, JunYoung Gwak, Amir", "bbox": {"l": 327.09195, "t": 672.04301, "r": 545.10876, "b": 680.05898, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "Sadeghian, Ian Reid, and Silvio Savarese.", "bbox": {"l": 328.78104, "t": 683.0020099999999, "r": 482.81488, "b": 691.01797, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "Generalized in-", "bbox": {"l": 488.75064, "t": 683.0020099999999, "r": 545.1134, "b": 691.01797, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "tersection over union: A metric and a loss for bounding box", "bbox": {"l": 328.78104, "t": 693.961014, "r": 545.11334, "b": 701.976974, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "regression. In", "bbox": {"l": 328.78104, "t": 704.920013, "r": 379.1543, "b": 712.935974, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "Proceedings of the IEEE/CVF Conference on", "bbox": {"l": 381.61603, "t": 705.00071, "r": 545.10938, "b": 712.729744, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "page_footer", "bbox": {"l": 295.12103, "t": 734.1325870000001, "r": 300.10233, "b": 743.0391500000001, "coord_origin": "TOPLEFT"}, "confidence": 0.8797808885574341, "cells": [{"id": 200, "text": "9", "bbox": {"l": 295.12103, "t": 734.1325870000001, "r": 300.10233, "b": 743.0391500000001, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "list_item", "id": 25, "page_no": 8, "cluster": {"id": 25, "label": "list_item", "bbox": {"l": 70.030998, "t": 75.88378999999998, "r": 286.36334, "b": 116.77575999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.7310384511947632, "cells": [{"id": 0, "text": "end object detection with transformers. In Andrea Vedaldi,", "bbox": {"l": 70.030998, "t": 75.88378999999998, "r": 286.36334, "b": 83.89977999999996, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Horst Bischof, Thomas Brox, and Jan-Michael Frahm, edi-", "bbox": {"l": 70.030998, "t": 86.84276999999997, "r": 286.36331, "b": 94.85875999999996, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "tors,", "bbox": {"l": 70.030998, "t": 97.80078000000003, "r": 85.722198, "b": 105.81677000000002, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Computer Vision - ECCV 2020", "bbox": {"l": 87.889, "t": 97.88147000000004, "r": 199.93315, "b": 105.61053000000004, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": ", pages 213-229, Cham,", "bbox": {"l": 199.936, "t": 97.80078000000003, "r": 286.36313, "b": 105.81677000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "2020. Springer International Publishing. 5", "bbox": {"l": 70.031006, "t": 108.75977, "r": 221.94871999999998, "b": 116.77575999999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "end object detection with transformers. In Andrea Vedaldi, Horst Bischof, Thomas Brox, and Jan-Michael Frahm, editors, Computer Vision - ECCV 2020 , pages 213-229, Cham, 2020. Springer International Publishing. 5"}, {"label": "list_item", "id": 9, "page_no": 8, "cluster": {"id": 9, "label": "list_item", "bbox": {"l": 54.595005, "t": 120.03174000000013, "r": 286.36334, "b": 149.96569999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9372755885124207, "cells": [{"id": 6, "text": "[2]", "bbox": {"l": 54.595005, "t": 120.03174000000013, "r": 65.206657, "b": 128.04773, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Zewen Chi, Heyan Huang, Heng-Da Xu, Houjin Yu, Wanx-", "bbox": {"l": 67.481873, "t": 120.03174000000013, "r": 286.35852, "b": 128.04773, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "uan Yin, and Xian-Ling Mao.", "bbox": {"l": 70.031006, "t": 130.99072, "r": 179.67215, "b": 139.00671, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Complicated table structure", "bbox": {"l": 185.58101, "t": 130.99072, "r": 286.36334, "b": 139.00671, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "recognition.", "bbox": {"l": 70.031006, "t": 141.94970999999998, "r": 113.11456, "b": 149.96569999999997, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "arXiv preprint arXiv:1908.04729", "bbox": {"l": 116.34200999999999, "t": 142.0304, "r": 235.3082, "b": 149.75946, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": ", 2019. 3", "bbox": {"l": 235.30701, "t": 141.94970999999998, "r": 267.67572, "b": 149.96569999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[2] Zewen Chi, Heyan Huang, Heng-Da Xu, Houjin Yu, Wanxuan Yin, and Xian-Ling Mao. Complicated table structure recognition. arXiv preprint arXiv:1908.04729 , 2019. 3"}, {"label": "list_item", "id": 7, "page_no": 8, "cluster": {"id": 7, "label": "list_item", "bbox": {"l": 54.595001, "t": 153.22168, "r": 286.36301, "b": 183.15466000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9378374218940735, "cells": [{"id": 13, "text": "[3]", "bbox": {"l": 54.595001, "t": 153.22168, "r": 65.103195, "b": 161.23766999999998, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Bertrand Couasnon and Aurelie Lemaitre.", "bbox": {"l": 67.356239, "t": 153.22168, "r": 218.77876, "b": 161.23766999999998, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Recognition of Ta-", "bbox": {"l": 220.97999999999996, "t": 153.30237, "r": 286.36301, "b": 161.03143, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "bles and Forms", "bbox": {"l": 70.030991, "t": 164.26135, "r": 125.26401000000001, "b": 171.99041999999997, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": ", pages 647-677. Springer London, London,", "bbox": {"l": 125.26098999999999, "t": 164.18066, "r": 286.36029, "b": 172.19665999999995, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "2014. 2", "bbox": {"l": 70.030991, "t": 175.13867000000005, "r": 97.916496, "b": 183.15466000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[3] Bertrand Couasnon and Aurelie Lemaitre. Recognition of Tables and Forms , pages 647-677. Springer London, London, 2014. 2"}, {"label": "list_item", "id": 0, "page_no": 8, "cluster": {"id": 0, "label": "list_item", "bbox": {"l": 54.59499, "t": 186.41063999999994, "r": 286.36401, "b": 227.30358999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9648825526237488, "cells": [{"id": 19, "text": "[4]", "bbox": {"l": 54.59499, "t": 186.41063999999994, "r": 65.806984, "b": 194.42664000000002, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Herv\u00b4e D\u00b4ejean, Jean-Luc Meunier, Liangcai Gao, Yilun", "bbox": {"l": 68.210922, "t": 186.41063999999994, "r": 286.36401, "b": 194.42664000000002, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Huang, Yu Fang, Florian Kleber, and Eva-Maria Lang. IC-", "bbox": {"l": 70.030983, "t": 197.36963000000003, "r": 286.36331, "b": 205.38562000000002, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "DAR 2019 Competition on Table Detection and Recognition", "bbox": {"l": 70.030983, "t": 208.32861000000003, "r": 286.36334, "b": 216.3446, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "(cTDaR), Apr. 2019. http://sac.founderit.com/. 2", "bbox": {"l": 70.030983, "t": 219.2876, "r": 245.83519, "b": 227.30358999999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[4] Herv\u00b4e D\u00b4ejean, Jean-Luc Meunier, Liangcai Gao, Yilun Huang, Yu Fang, Florian Kleber, and Eva-Maria Lang. ICDAR 2019 Competition on Table Detection and Recognition (cTDaR), Apr. 2019. http://sac.founderit.com/. 2"}, {"label": "list_item", "id": 1, "page_no": 8, "cluster": {"id": 1, "label": "list_item", "bbox": {"l": 54.594982, "t": 230.55957, "r": 286.36334, "b": 271.45154, "coord_origin": "TOPLEFT"}, "confidence": 0.9620943069458008, "cells": [{"id": 24, "text": "[5]", "bbox": {"l": 54.594982, "t": 230.55957, "r": 65.381134, "b": 238.57556, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "Basilios Gatos, Dimitrios Danatsas, Ioannis Pratikakis, and", "bbox": {"l": 67.693779, "t": 230.55957, "r": 286.35849, "b": 238.57556, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "Stavros J Perantonis. Automatic table detection in document", "bbox": {"l": 70.030983, "t": 241.51855, "r": 286.36334, "b": 249.53454999999997, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "images. In", "bbox": {"l": 70.030983, "t": 252.47655999999995, "r": 108.39821, "b": 260.49255000000005, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "International Conference on Pattern Recognition", "bbox": {"l": 110.64498000000002, "t": 252.55724999999995, "r": 286.3595, "b": 260.28632000000005, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "and Image Analysis", "bbox": {"l": 70.030983, "t": 263.51624000000004, "r": 140.57861, "b": 271.24530000000004, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": ", pages 609-618. Springer, 2005. 2", "bbox": {"l": 140.57797, "t": 263.43555000000003, "r": 266.47522, "b": 271.45154, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[5] Basilios Gatos, Dimitrios Danatsas, Ioannis Pratikakis, and Stavros J Perantonis. Automatic table detection in document images. In International Conference on Pattern Recognition and Image Analysis , pages 609-618. Springer, 2005. 2"}, {"label": "list_item", "id": 2, "page_no": 8, "cluster": {"id": 2, "label": "list_item", "bbox": {"l": 54.594971, "t": 274.70758, "r": 286.36676, "b": 315.6004899999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9555517435073853, "cells": [{"id": 31, "text": "[6]", "bbox": {"l": 54.594971, "t": 274.70758, "r": 64.848648, "b": 282.72351, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Max G\u00a8obel, Tamir Hassan, Ermelinda Oro, and Giorgio Orsi.", "bbox": {"l": 67.047119, "t": 274.70758, "r": 286.36676, "b": 282.72351, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "Icdar 2013 table competition.", "bbox": {"l": 70.030975, "t": 285.66655999999995, "r": 179.57349, "b": 293.68253, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "In", "bbox": {"l": 187.01559, "t": 285.66655999999995, "r": 194.4846, "b": 293.68253, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "2013 12th International", "bbox": {"l": 198.04398, "t": 285.74725, "r": 286.36304, "b": 293.47632, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Conference on Document Analysis and Recognition", "bbox": {"l": 70.030975, "t": 296.70624, "r": 260.19937, "b": 304.43530000000004, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": ", pages", "bbox": {"l": 260.198, "t": 296.62555, "r": 286.36197, "b": 304.64151, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "1449-1453, 2013. 2", "bbox": {"l": 70.030991, "t": 307.5845299999999, "r": 142.74849, "b": 315.6004899999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[6] Max G\u00a8obel, Tamir Hassan, Ermelinda Oro, and Giorgio Orsi. Icdar 2013 table competition. In 2013 12th International Conference on Document Analysis and Recognition , pages 1449-1453, 2013. 2"}, {"label": "list_item", "id": 4, "page_no": 8, "cluster": {"id": 4, "label": "list_item", "bbox": {"l": 54.59499, "t": 318.85654, "r": 286.36319, "b": 348.78952, "coord_origin": "TOPLEFT"}, "confidence": 0.9479843378067017, "cells": [{"id": 39, "text": "[7]", "bbox": {"l": 54.59499, "t": 318.85654, "r": 65.61586, "b": 326.8725, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "EA Green and M Krishnamoorthy.", "bbox": {"l": 67.978821, "t": 318.85654, "r": 199.492, "b": 326.8725, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Recognition of tables", "bbox": {"l": 206.98792, "t": 318.85654, "r": 286.35849, "b": 326.8725, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "using table grammars. procs.", "bbox": {"l": 70.030991, "t": 329.8145400000001, "r": 176.28284, "b": 337.83051, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "In", "bbox": {"l": 182.60416, "t": 329.8145400000001, "r": 190.07317, "b": 337.83051, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "Symposium on Document", "bbox": {"l": 193.28299, "t": 329.89522999999997, "r": 286.36319, "b": 337.62429999999995, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Analysis and Recognition (SDAIR\u201995)", "bbox": {"l": 70.030991, "t": 340.85425, "r": 206.34717, "b": 348.58331, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": ", pages 261-277. 2", "bbox": {"l": 206.34599, "t": 340.77356, "r": 274.82239, "b": 348.78952, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[7] EA Green and M Krishnamoorthy. Recognition of tables using table grammars. procs. In Symposium on Document Analysis and Recognition (SDAIR\u201995) , pages 261-277. 2"}, {"label": "list_item", "id": 3, "page_no": 8, "cluster": {"id": 3, "label": "list_item", "bbox": {"l": 54.594986000000006, "t": 352.0455600000001, "r": 286.36331, "b": 403.89749, "coord_origin": "TOPLEFT"}, "confidence": 0.9484425187110901, "cells": [{"id": 47, "text": "[8]", "bbox": {"l": 54.594986000000006, "t": 352.0455600000001, "r": 65.04657, "b": 360.06152, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Khurram Azeem Hashmi, Alain Pagani, Marcus Liwicki, Di-", "bbox": {"l": 67.287483, "t": 352.0455600000001, "r": 286.35849, "b": 360.06152, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "dier Stricker, and Muhammad Zeshan Afzal.", "bbox": {"l": 70.030983, "t": 363.00458, "r": 234.12507999999997, "b": 371.02054, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Castabdetec-", "bbox": {"l": 240.05186, "t": 363.00458, "r": 286.36331, "b": 371.02054, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "tors: Cascade network for table detection in document im-", "bbox": {"l": 70.030983, "t": 373.96356, "r": 286.36331, "b": 381.97952, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "ages with recursive feature pyramid and switchable atrous", "bbox": {"l": 70.030983, "t": 384.92255, "r": 286.36331, "b": 392.93851, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "convolution.", "bbox": {"l": 70.030983, "t": 395.88153, "r": 114.57605, "b": 403.89749, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "Journal of Imaging", "bbox": {"l": 117.80399000000001, "t": 395.96222, "r": 186.7287, "b": 403.69128, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": ", 7(10), 2021. 1", "bbox": {"l": 186.728, "t": 395.88153, "r": 243.00113999999996, "b": 403.89749, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[8] Khurram Azeem Hashmi, Alain Pagani, Marcus Liwicki, Didier Stricker, and Muhammad Zeshan Afzal. Castabdetectors: Cascade network for table detection in document images with recursive feature pyramid and switchable atrous convolution. Journal of Imaging , 7(10), 2021. 1"}, {"label": "list_item", "id": 10, "page_no": 8, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 54.595001, "t": 407.15253000000007, "r": 286.35989, "b": 437.08646000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9330756664276123, "cells": [{"id": 56, "text": "[9]", "bbox": {"l": 54.595001, "t": 407.15253000000007, "r": 65.334427, "b": 415.1684900000001, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Kaiming He, Georgia Gkioxari, Piotr Dollar, and Ross Gir-", "bbox": {"l": 67.637054, "t": 407.15253000000007, "r": 286.35852, "b": 415.1684900000001, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "shick. Mask r-cnn. In", "bbox": {"l": 70.030998, "t": 418.11151, "r": 147.13306, "b": 426.12747, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Proceedings of the IEEE International", "bbox": {"l": 149.15601, "t": 418.1922, "r": 286.35989, "b": 425.92126, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Conference on Computer Vision (ICCV)", "bbox": {"l": 70.031006, "t": 429.15118, "r": 213.48445, "b": 436.88025, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": ", Oct 2017. 1", "bbox": {"l": 213.483, "t": 429.07050000000004, "r": 261.04083, "b": 437.08646000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[9] Kaiming He, Georgia Gkioxari, Piotr Dollar, and Ross Girshick. Mask r-cnn. In Proceedings of the IEEE International Conference on Computer Vision (ICCV) , Oct 2017. 1"}, {"label": "list_item", "id": 14, "page_no": 8, "cluster": {"id": 14, "label": "list_item", "bbox": {"l": 50.112, "t": 440.3424999999999, "r": 286.36334, "b": 481.23544, "coord_origin": "TOPLEFT"}, "confidence": 0.9274735450744629, "cells": [{"id": 62, "text": "[10]", "bbox": {"l": 50.112, "t": 440.3424999999999, "r": 65.399307, "b": 448.3584599999999, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "Yelin He, X. Qi, Jiaquan Ye, Peng Gao, Yihao Chen, Bing-", "bbox": {"l": 67.693321, "t": 440.3424999999999, "r": 286.3587, "b": 448.3584599999999, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "cong Li, Xin Tang, and Rong Xiao.", "bbox": {"l": 70.030998, "t": 451.30151, "r": 202.74268, "b": 459.31747, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "Pingan-vcgroup\u2019s so-", "bbox": {"l": 209.00122, "t": 451.30151, "r": 286.36331, "b": 459.31747, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "lution for icdar 2021 competition on scientific table image", "bbox": {"l": 70.030998, "t": 462.2605, "r": 286.36334, "b": 470.27646, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "recognition to latex.", "bbox": {"l": 70.030998, "t": 473.21948, "r": 141.86981, "b": 481.23544, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "ArXiv", "bbox": {"l": 145.097, "t": 473.30017, "r": 166.01561, "b": 481.02924, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": ", abs/2105.01846, 2021. 2", "bbox": {"l": 166.015, "t": 473.21948, "r": 259.90216, "b": 481.23544, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[10] Yelin He, X. Qi, Jiaquan Ye, Peng Gao, Yihao Chen, Bingcong Li, Xin Tang, and Rong Xiao. Pingan-vcgroup\u2019s solution for icdar 2021 competition on scientific table image recognition to latex. ArXiv , abs/2105.01846, 2021. 2"}, {"label": "list_item", "id": 11, "page_no": 8, "cluster": {"id": 11, "label": "list_item", "bbox": {"l": 50.112, "t": 484.49048, "r": 286.36331, "b": 536.34238, "coord_origin": "TOPLEFT"}, "confidence": 0.9299950003623962, "cells": [{"id": 70, "text": "[11]", "bbox": {"l": 50.112, "t": 484.49048, "r": 66.033806, "b": 492.50644, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Jianying Hu, Ramanujan S Kashi, Daniel P Lopresti, and", "bbox": {"l": 68.423035, "t": 484.49048, "r": 286.35873, "b": 492.50644, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "Gordon Wilfong. Medium-independent table detection. In", "bbox": {"l": 70.030998, "t": 495.44946, "r": 286.36331, "b": 503.46542, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "Document Recognition and Retrieval VII", "bbox": {"l": 70.030998, "t": 506.48914, "r": 227.40926, "b": 514.2182, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": ", volume 3967,", "bbox": {"l": 227.40500000000003, "t": 506.40845, "r": 286.35913, "b": 514.4244100000001, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "pages 291-302. International Society for Optics and Photon-", "bbox": {"l": 70.031006, "t": 517.36743, "r": 286.36328, "b": 525.38339, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "ics, 1999. 2", "bbox": {"l": 70.031006, "t": 528.32642, "r": 112.36138000000001, "b": 536.34238, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[11] Jianying Hu, Ramanujan S Kashi, Daniel P Lopresti, and Gordon Wilfong. Medium-independent table detection. In Document Recognition and Retrieval VII , volume 3967, pages 291-302. International Society for Optics and Photonics, 1999. 2"}, {"label": "list_item", "id": 5, "page_no": 8, "cluster": {"id": 5, "label": "list_item", "bbox": {"l": 50.112007, "t": 539.59842, "r": 286.36334, "b": 591.44937, "coord_origin": "TOPLEFT"}, "confidence": 0.9394103288650513, "cells": [{"id": 77, "text": "[12]", "bbox": {"l": 50.112007, "t": 539.59842, "r": 65.466705, "b": 547.61438, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "Matthew Hurst. A constraint-based approach to table struc-", "bbox": {"l": 67.770828, "t": 539.59842, "r": 286.35873, "b": 547.61438, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "ture derivation. In", "bbox": {"l": 70.031006, "t": 550.55742, "r": 136.28374, "b": 558.57338, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "Proceedings of the Seventh International", "bbox": {"l": 138.811, "t": 550.63812, "r": 286.36206, "b": 558.36716, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Conference on Document Analysis and Recognition - Volume", "bbox": {"l": 70.031006, "t": 561.5971199999999, "r": 286.36334, "b": 569.32616, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "2", "bbox": {"l": 70.031006, "t": 572.55612, "r": 74.514206, "b": 580.28516, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": ", ICDAR \u201903, page 911, USA, 2003. IEEE Computer Soci-", "bbox": {"l": 74.514008, "t": 572.47542, "r": 286.36313, "b": 580.4913799999999, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "ety. 2", "bbox": {"l": 70.031006, "t": 583.4334100000001, "r": 90.357834, "b": 591.44937, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[12] Matthew Hurst. A constraint-based approach to table structure derivation. In Proceedings of the Seventh International Conference on Document Analysis and Recognition - Volume 2 , ICDAR \u201903, page 911, USA, 2003. IEEE Computer Society. 2"}, {"label": "list_item", "id": 13, "page_no": 8, "cluster": {"id": 13, "label": "list_item", "bbox": {"l": 50.112007, "t": 594.70541, "r": 286.36331, "b": 646.55737, "coord_origin": "TOPLEFT"}, "confidence": 0.9298838973045349, "cells": [{"id": 85, "text": "[13]", "bbox": {"l": 50.112007, "t": 594.70541, "r": 66.270439, "b": 602.72137, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Thotreingam Kasar, Philippine Barlas, Sebastien Adam,", "bbox": {"l": 68.695168, "t": 594.70541, "r": 286.35873, "b": 602.72137, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Cl\u00b4ement Chatelain, and Thierry Paquet. Learning to detect", "bbox": {"l": 70.031006, "t": 605.66441, "r": 286.3631, "b": 613.68037, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "tables in scanned document images using line information.", "bbox": {"l": 70.031006, "t": 616.62341, "r": 286.36331, "b": 624.63937, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "In", "bbox": {"l": 70.031006, "t": 627.58241, "r": 77.500015, "b": 635.5983699999999, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "2013 12th International Conference on Document Analy-", "bbox": {"l": 79.920006, "t": 627.6631199999999, "r": 286.3624, "b": 635.39215, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "sis and Recognition", "bbox": {"l": 70.031006, "t": 638.62212, "r": 140.67728, "b": 646.35115, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": ", pages 1185-1189. IEEE, 2013. 2", "bbox": {"l": 140.67599, "t": 638.54141, "r": 264.43921, "b": 646.55737, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[13] Thotreingam Kasar, Philippine Barlas, Sebastien Adam, Cl\u00b4ement Chatelain, and Thierry Paquet. Learning to detect tables in scanned document images using line information. In 2013 12th International Conference on Document Analysis and Recognition , pages 1185-1189. IEEE, 2013. 2"}, {"label": "list_item", "id": 17, "page_no": 8, "cluster": {"id": 17, "label": "list_item", "bbox": {"l": 50.111992, "t": 649.81342, "r": 286.36334, "b": 679.74638, "coord_origin": "TOPLEFT"}, "confidence": 0.9115257263183594, "cells": [{"id": 93, "text": "[14]", "bbox": {"l": 50.111992, "t": 649.81342, "r": 66.534035, "b": 657.82938, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "Pratik Kayal, Mrinal Anand, Harsh Desai, and Mayank", "bbox": {"l": 68.998329, "t": 649.81342, "r": 286.35873, "b": 657.82938, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "Singh.", "bbox": {"l": 70.030991, "t": 660.77142, "r": 93.200165, "b": 668.78738, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "Icdar 2021 competition on scientific table image", "bbox": {"l": 102.20243, "t": 660.77142, "r": 286.36334, "b": 668.78738, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "recognition to latex, 2021. 2", "bbox": {"l": 70.030991, "t": 671.73042, "r": 171.9969, "b": 679.74638, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[14] Pratik Kayal, Mrinal Anand, Harsh Desai, and Mayank Singh. Icdar 2021 competition on scientific table image recognition to latex, 2021. 2"}, {"label": "list_item", "id": 16, "page_no": 8, "cluster": {"id": 16, "label": "list_item", "bbox": {"l": 50.111992, "t": 683.00243, "r": 286.35931, "b": 712.936386, "coord_origin": "TOPLEFT"}, "confidence": 0.912230372428894, "cells": [{"id": 98, "text": "[15]", "bbox": {"l": 50.111992, "t": 683.00243, "r": 65.515968, "b": 691.01839, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "Harold W Kuhn. The hungarian method for the assignment", "bbox": {"l": 67.827499, "t": 683.00243, "r": 286.3587, "b": 691.01839, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "problem.", "bbox": {"l": 70.030991, "t": 693.9614260000001, "r": 102.15761, "b": 701.977386, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "Naval research logistics quarterly", "bbox": {"l": 107.54999, "t": 694.0421220000001, "r": 231.47461, "b": 701.771156, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": ", 2(1-2):83-97,", "bbox": {"l": 231.47598, "t": 693.9614260000001, "r": 286.35931, "b": 701.977386, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "1955. 6", "bbox": {"l": 70.030975, "t": 704.920425, "r": 97.916481, "b": 712.936386, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[15] Harold W Kuhn. The hungarian method for the assignment problem. Naval research logistics quarterly , 2(1-2):83-97, 1955. 6"}, {"label": "list_item", "id": 6, "page_no": 8, "cluster": {"id": 6, "label": "list_item", "bbox": {"l": 308.86197, "t": 75.88342000000011, "r": 545.11475, "b": 138.69335999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.9389600157737732, "cells": [{"id": 104, "text": "[16]", "bbox": {"l": 308.86197, "t": 75.88342000000011, "r": 324.74973, "b": 83.89940999999999, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "Girish Kulkarni, Visruth Premraj, Vicente Ordonez, Sag-", "bbox": {"l": 327.13382, "t": 75.88342000000011, "r": 545.1087, "b": 83.89940999999999, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "nik Dhar, Siming Li, Yejin Choi, Alexander C. Berg, and", "bbox": {"l": 328.78098, "t": 86.84142999999995, "r": 545.1134, "b": 94.85741999999993, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "Tamara L. Berg.", "bbox": {"l": 328.78098, "t": 97.80042000000003, "r": 390.96295, "b": 105.81641000000002, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "Babytalk:", "bbox": {"l": 400.27008, "t": 97.80042000000003, "r": 435.1404099999999, "b": 105.81641000000002, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "Understanding and generat-", "bbox": {"l": 441.71277, "t": 97.80042000000003, "r": 545.11328, "b": 105.81641000000002, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "ing simple image descriptions.", "bbox": {"l": 328.78098, "t": 108.75940000000003, "r": 440.80719, "b": 116.7753899999999, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "IEEE Transactions on Pat-", "bbox": {"l": 446.63498, "t": 108.84009000000003, "r": 545.11304, "b": 116.56914999999992, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "tern Analysis and Machine Intelligence", "bbox": {"l": 328.78098, "t": 119.79907000000003, "r": 471.13153, "b": 127.52814000000001, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": ", 35(12):2891-2903,", "bbox": {"l": 471.13300000000004, "t": 119.71838000000002, "r": 545.11475, "b": 127.73437999999999, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "2013. 4", "bbox": {"l": 328.78101, "t": 130.67737, "r": 356.6665, "b": 138.69335999999998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[16] Girish Kulkarni, Visruth Premraj, Vicente Ordonez, Sagnik Dhar, Siming Li, Yejin Choi, Alexander C. Berg, and Tamara L. Berg. Babytalk: Understanding and generating simple image descriptions. IEEE Transactions on Pattern Analysis and Machine Intelligence , 35(12):2891-2903, 2013. 4"}, {"label": "list_item", "id": 15, "page_no": 8, "cluster": {"id": 15, "label": "list_item", "bbox": {"l": 308.862, "t": 142.12334999999996, "r": 545.1134, "b": 172.05633999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.9253129959106445, "cells": [{"id": 115, "text": "[17]", "bbox": {"l": 308.862, "t": 142.12334999999996, "r": 325.24371, "b": 150.13933999999995, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "Minghao Li, Lei Cui, Shaohan Huang, Furu Wei, Ming", "bbox": {"l": 327.70197, "t": 142.12334999999996, "r": 545.10883, "b": 150.13933999999995, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "Zhou, and Zhoujun Li.", "bbox": {"l": 328.78101, "t": 153.08136000000002, "r": 414.44598, "b": 161.09735, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "Tablebank: A benchmark dataset", "bbox": {"l": 421.82532, "t": 153.08136000000002, "r": 545.1134, "b": 161.09735, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "for table detection and recognition, 2019. 2, 3", "bbox": {"l": 328.78101, "t": 164.04034000000001, "r": 493.62835999999993, "b": 172.05633999999998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[17] Minghao Li, Lei Cui, Shaohan Huang, Furu Wei, Ming Zhou, and Zhoujun Li. Tablebank: A benchmark dataset for table detection and recognition, 2019. 2, 3"}, {"label": "list_item", "id": 12, "page_no": 8, "cluster": {"id": 12, "label": "list_item", "bbox": {"l": 308.862, "t": 175.48632999999995, "r": 545.11353, "b": 260.21423000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9299732446670532, "cells": [{"id": 120, "text": "[18]", "bbox": {"l": 308.862, "t": 175.48632999999995, "r": 324.26599, "b": 183.50232000000005, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "Yiren Li, Zheng Huang, Junchi Yan, Yi Zhou, Fan Ye, and", "bbox": {"l": 326.57751, "t": 175.48632999999995, "r": 545.10876, "b": 183.50232000000005, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Xianhui Liu. Gfte: Graph-based financial table extraction.", "bbox": {"l": 328.78101, "t": 186.44530999999995, "r": 545.11334, "b": 194.46130000000005, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "In Alberto Del Bimbo, Rita Cucchiara, Stan Sclaroff, Gio-", "bbox": {"l": 328.78101, "t": 197.40430000000003, "r": 545.11346, "b": 205.42029000000002, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "vanni Maria Farinella, Tao Mei, Marco Bertini, Hugo Jair", "bbox": {"l": 328.78101, "t": 208.36328000000003, "r": 545.11353, "b": 216.37927000000002, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "Escalante, and Roberto Vezzani, editors,", "bbox": {"l": 328.78101, "t": 219.32227, "r": 479.26413, "b": 227.33826, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "Pattern Recogni-", "bbox": {"l": 483.11902, "t": 219.40295000000003, "r": 545.11273, "b": 227.13202, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "tion. ICPR International Workshops and Challenges", "bbox": {"l": 328.78101, "t": 230.36095999999998, "r": 519.39771, "b": 238.09002999999996, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": ", pages", "bbox": {"l": 519.401, "t": 230.28026999999997, "r": 545.10767, "b": 238.29625999999996, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "644-658, Cham, 2021. Springer International Publishing. 2,", "bbox": {"l": 328.78101, "t": 241.23925999999994, "r": 545.11328, "b": 249.25525000000005, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "3", "bbox": {"l": 328.78101, "t": 252.19824000000006, "r": 333.26422, "b": 260.21423000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[18] Yiren Li, Zheng Huang, Junchi Yan, Yi Zhou, Fan Ye, and Xianhui Liu. Gfte: Graph-based financial table extraction. In Alberto Del Bimbo, Rita Cucchiara, Stan Sclaroff, Giovanni Maria Farinella, Tao Mei, Marco Bertini, Hugo Jair Escalante, and Roberto Vezzani, editors, Pattern Recognition. ICPR International Workshops and Challenges , pages 644-658, Cham, 2021. Springer International Publishing. 2, 3"}, {"label": "list_item", "id": 8, "page_no": 8, "cluster": {"id": 8, "label": "list_item", "bbox": {"l": 308.862, "t": 263.64423, "r": 545.1142, "b": 326.45413, "coord_origin": "TOPLEFT"}, "confidence": 0.937321662902832, "cells": [{"id": 131, "text": "[19]", "bbox": {"l": 308.862, "t": 263.64423, "r": 324.26477, "b": 271.66022, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "Nikolaos Livathinos, Cesar Berrospi, Maksym Lysak, Vik-", "bbox": {"l": 326.57611, "t": 263.64423, "r": 545.10883, "b": 271.66022, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "tor Kuropiatnyk, Ahmed Nassar, Andre Carvalho, Michele", "bbox": {"l": 328.78101, "t": 274.60321, "r": 545.1134, "b": 282.61917000000005, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "Dolfi, Christoph Auer, Kasper Dinkla, and Peter Staar. Ro-", "bbox": {"l": 328.78101, "t": 285.56219, "r": 545.11328, "b": 293.57816, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "bust pdf document conversion using recurrent neural net-", "bbox": {"l": 328.78101, "t": 296.52118, "r": 545.11334, "b": 304.53714, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "works.", "bbox": {"l": 328.78101, "t": 307.47919, "r": 352.84683, "b": 315.49515, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "Proceedings of the AAAI Conference on Artificial", "bbox": {"l": 360.23599, "t": 307.55988, "r": 545.1142, "b": 315.28894, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "Intelligence", "bbox": {"l": 328.78101, "t": 318.51886, "r": 371.02173, "b": 326.24792, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": ", 35(17):15137-15145, May 2021. 1", "bbox": {"l": 371.021, "t": 318.43817, "r": 502.26227, "b": 326.45413, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[19] Nikolaos Livathinos, Cesar Berrospi, Maksym Lysak, Viktor Kuropiatnyk, Ahmed Nassar, Andre Carvalho, Michele Dolfi, Christoph Auer, Kasper Dinkla, and Peter Staar. Robust pdf document conversion using recurrent neural networks. Proceedings of the AAAI Conference on Artificial Intelligence , 35(17):15137-15145, May 2021. 1"}, {"label": "list_item", "id": 18, "page_no": 8, "cluster": {"id": 18, "label": "list_item", "bbox": {"l": 308.862, "t": 329.88419, "r": 545.11609, "b": 370.77713, "coord_origin": "TOPLEFT"}, "confidence": 0.9027292728424072, "cells": [{"id": 140, "text": "[20]", "bbox": {"l": 308.862, "t": 329.88419, "r": 323.82672, "b": 337.90015, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "Rujiao Long, Wen Wang, Nan Xue, Feiyu Gao, Zhibo Yang,", "bbox": {"l": 326.07233, "t": 329.88419, "r": 545.10876, "b": 337.90015, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "Yongpan Wang, and Gui-Song Xia. Parsing table structures", "bbox": {"l": 328.78101, "t": 340.8432, "r": 545.11346, "b": 348.85916, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "in the wild. In", "bbox": {"l": 328.78101, "t": 351.80219000000005, "r": 382.7767, "b": 359.81815000000006, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "Proceedings of the IEEE/CVF International", "bbox": {"l": 385.54102, "t": 351.88287, "r": 545.11609, "b": 359.61194, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "Conference on Computer Vision", "bbox": {"l": 328.78101, "t": 362.84186, "r": 443.59579, "b": 370.57092, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": ", pages 944-952, 2021. 2", "bbox": {"l": 443.59399, "t": 362.76117, "r": 534.48645, "b": 370.77713, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[20] Rujiao Long, Wen Wang, Nan Xue, Feiyu Gao, Zhibo Yang, Yongpan Wang, and Gui-Song Xia. Parsing table structures in the wild. In Proceedings of the IEEE/CVF International Conference on Computer Vision , pages 944-952, 2021. 2"}, {"label": "list_item", "id": 21, "page_no": 8, "cluster": {"id": 21, "label": "list_item", "bbox": {"l": 308.862, "t": 374.20618, "r": 545.11346, "b": 437.01706, "coord_origin": "TOPLEFT"}, "confidence": 0.882714569568634, "cells": [{"id": 147, "text": "[21]", "bbox": {"l": 308.862, "t": 374.20618, "r": 324.60281, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "Shubham", "bbox": {"l": 326.96487, "t": 374.20618, "r": 362.6604, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "Singh", "bbox": {"l": 368.69479, "t": 374.20618, "r": 389.6134, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "Paliwal,", "bbox": {"l": 395.6478, "t": 374.20618, "r": 424.56445, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "D", "bbox": {"l": 431.5492899999999, "t": 374.20618, "r": 438.0230399999999, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "Vishwanath,", "bbox": {"l": 444.05743, "t": 374.20618, "r": 488.5038799999999, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "Rohit", "bbox": {"l": 495.47974, "t": 374.20618, "r": 515.41205, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "Rahul,", "bbox": {"l": 521.44641, "t": 374.20618, "r": 545.10876, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "Monika Sharma, and Lovekesh Vig. Tablenet: Deep learn-", "bbox": {"l": 328.78101, "t": 385.16516, "r": 545.1134, "b": 393.18112, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "ing model for end-to-end table detection and tabular data ex-", "bbox": {"l": 328.78101, "t": 396.12415, "r": 545.11346, "b": 404.14011, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "traction from scanned document images.", "bbox": {"l": 328.78101, "t": 407.08313, "r": 478.00881999999996, "b": 415.09909, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "In", "bbox": {"l": 484.0701, "t": 407.08313, "r": 491.53912, "b": 415.09909, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "2019 Interna-", "bbox": {"l": 494.668, "t": 407.16382, "r": 545.11298, "b": 414.89288, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "tional Conference on Document Analysis and Recognition", "bbox": {"l": 328.78101, "t": 418.12280000000004, "r": 545.11334, "b": 425.85187, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "(ICDAR)", "bbox": {"l": 328.78101, "t": 429.08179, "r": 360.83591, "b": 436.8108500000001, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": ", pages 128-133. IEEE, 2019. 1", "bbox": {"l": 360.836, "t": 429.0011, "r": 475.63287, "b": 437.01706, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[21] Shubham Singh Paliwal, D Vishwanath, Rohit Rahul, Monika Sharma, and Lovekesh Vig. Tablenet: Deep learning model for end-to-end table detection and tabular data extraction from scanned document images. In 2019 International Conference on Document Analysis and Recognition (ICDAR) , pages 128-133. IEEE, 2019. 1"}, {"label": "list_item", "id": 20, "page_no": 8, "cluster": {"id": 20, "label": "list_item", "bbox": {"l": 308.862, "t": 440.44611, "r": 545.11475, "b": 558.05096, "coord_origin": "TOPLEFT"}, "confidence": 0.8896440863609314, "cells": [{"id": 163, "text": "[22]", "bbox": {"l": 308.862, "t": 440.44611, "r": 324.57407, "b": 448.46207, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "Adam Paszke, Sam Gross, Francisco Massa, Adam Lerer,", "bbox": {"l": 326.93179, "t": 440.44611, "r": 545.1087, "b": 448.46207, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "James Bradbury, Gregory Chanan, Trevor Killeen, Zeming", "bbox": {"l": 328.78101, "t": 451.40509, "r": 545.11346, "b": 459.42105, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "Lin, Natalia Gimelshein, Luca Antiga, Alban Desmaison,", "bbox": {"l": 328.78101, "t": 462.36407, "r": 545.11328, "b": 470.38004, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "Andreas Kopf, Edward Yang, Zachary DeVito, Martin Rai-", "bbox": {"l": 328.78101, "t": 473.32306, "r": 545.11328, "b": 481.33902, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "son, Alykhan Tejani, Sasank Chilamkurthy, Benoit Steiner,", "bbox": {"l": 328.78101, "t": 484.28204, "r": 545.11328, "b": 492.298, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "Lu Fang, Junjie Bai, and Soumith Chintala. Pytorch: An im-", "bbox": {"l": 328.78101, "t": 495.24103, "r": 545.1134, "b": 503.25699, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "perative style, high-performance deep learning library. In H.", "bbox": {"l": 328.78101, "t": 506.20001, "r": 545.1134, "b": 514.21597, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "Wallach, H. Larochelle, A. Beygelzimer, F. d'Alch\u00b4e-Buc, E.", "bbox": {"l": 328.78101, "t": 517.159, "r": 545.1098, "b": 525.17496, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "Fox, and R. Garnett, editors,", "bbox": {"l": 328.78101, "t": 528.117, "r": 434.56659, "b": 536.13297, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "Advances in Neural Informa-", "bbox": {"l": 437.86401, "t": 528.19769, "r": 545.11115, "b": 535.9267600000001, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "tion Processing Systems 32", "bbox": {"l": 328.78101, "t": 539.15671, "r": 425.73471, "b": 546.8857399999999, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": ", pages 8024-8035. Curran Asso-", "bbox": {"l": 425.73602, "t": 539.076, "r": 545.11475, "b": 547.09196, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "ciates, Inc., 2019. 6", "bbox": {"l": 328.78101, "t": 550.035, "r": 399.74109, "b": 558.05096, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[22] Adam Paszke, Sam Gross, Francisco Massa, Adam Lerer, James Bradbury, Gregory Chanan, Trevor Killeen, Zeming Lin, Natalia Gimelshein, Luca Antiga, Alban Desmaison, Andreas Kopf, Edward Yang, Zachary DeVito, Martin Raison, Alykhan Tejani, Sasank Chilamkurthy, Benoit Steiner, Lu Fang, Junjie Bai, and Soumith Chintala. Pytorch: An imperative style, high-performance deep learning library. In H. Wallach, H. Larochelle, A. Beygelzimer, F. d'Alch\u00b4e-Buc, E. Fox, and R. Garnett, editors, Advances in Neural Information Processing Systems 32 , pages 8024-8035. Curran Associates, Inc., 2019. 6"}, {"label": "list_item", "id": 19, "page_no": 8, "cluster": {"id": 19, "label": "list_item", "bbox": {"l": 308.862, "t": 561.481, "r": 545.1134, "b": 624.29097, "coord_origin": "TOPLEFT"}, "confidence": 0.9025435447692871, "cells": [{"id": 177, "text": "[23]", "bbox": {"l": 308.862, "t": 561.481, "r": 324.50351, "b": 569.49696, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "Devashish Prasad, Ayan Gadpal, Kshitij Kapadni, Manish", "bbox": {"l": 326.85068, "t": 561.481, "r": 545.10876, "b": 569.49696, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "Visave, and Kavita Sultanpure. Cascadetabnet: An approach", "bbox": {"l": 328.78101, "t": 572.44, "r": 545.1134, "b": 580.45596, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "for end to end table detection and structure recognition from", "bbox": {"l": 328.78101, "t": 583.399, "r": 545.11334, "b": 591.4149600000001, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "image-based documents. In", "bbox": {"l": 328.78101, "t": 594.358, "r": 431.61667, "b": 602.37396, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "Proceedings of the IEEE/CVF", "bbox": {"l": 434.69101000000006, "t": 594.4387099999999, "r": 545.11224, "b": 602.16774, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "Conference on Computer Vision and Pattern Recognition", "bbox": {"l": 328.78101, "t": 605.39671, "r": 545.1134, "b": 613.12575, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "Workshops", "bbox": {"l": 328.78101, "t": 616.35571, "r": 367.8028, "b": 624.08475, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": ", pages 572-573, 2020. 1", "bbox": {"l": 367.802, "t": 616.2750100000001, "r": 458.69446000000005, "b": 624.29097, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[23] Devashish Prasad, Ayan Gadpal, Kshitij Kapadni, Manish Visave, and Kavita Sultanpure. Cascadetabnet: An approach for end to end table detection and structure recognition from image-based documents. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition Workshops , pages 572-573, 2020. 1"}, {"label": "list_item", "id": 23, "page_no": 8, "cluster": {"id": 23, "label": "list_item", "bbox": {"l": 308.862, "t": 627.72101, "r": 545.11621, "b": 668.61398, "coord_origin": "TOPLEFT"}, "confidence": 0.8777532577514648, "cells": [{"id": 186, "text": "[24]", "bbox": {"l": 308.862, "t": 627.72101, "r": 324.69476, "b": 635.73697, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "Shah Rukh Qasim, Hassan Mahmood, and Faisal Shafait.", "bbox": {"l": 327.07065, "t": 627.72101, "r": 545.1087, "b": 635.73697, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": "Rethinking table recognition using graph neural networks.", "bbox": {"l": 328.78101, "t": 638.68001, "r": 545.11328, "b": 646.69597, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "In", "bbox": {"l": 328.78101, "t": 649.63901, "r": 336.25003, "b": 657.65497, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "2019 International Conference on Document Analysis and", "bbox": {"l": 338.10001, "t": 649.71971, "r": 545.11621, "b": 657.44875, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "Recognition (ICDAR)", "bbox": {"l": 328.78101, "t": 660.67871, "r": 406.32245, "b": 668.40775, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": ", pages 142-147. IEEE, 2019. 3", "bbox": {"l": 406.32202, "t": 660.5980099999999, "r": 521.1189, "b": 668.61398, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[24] Shah Rukh Qasim, Hassan Mahmood, and Faisal Shafait. Rethinking table recognition using graph neural networks. In 2019 International Conference on Document Analysis and Recognition (ICDAR) , pages 142-147. IEEE, 2019. 3"}, {"label": "list_item", "id": 24, "page_no": 8, "cluster": {"id": 24, "label": "list_item", "bbox": {"l": 308.86203, "t": 672.04301, "r": 545.1134, "b": 712.935974, "coord_origin": "TOPLEFT"}, "confidence": 0.8654531240463257, "cells": [{"id": 193, "text": "[25]", "bbox": {"l": 308.86203, "t": 672.04301, "r": 324.71329, "b": 680.05898, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "Hamid Rezatofighi, Nathan Tsoi, JunYoung Gwak, Amir", "bbox": {"l": 327.09195, "t": 672.04301, "r": 545.10876, "b": 680.05898, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "Sadeghian, Ian Reid, and Silvio Savarese.", "bbox": {"l": 328.78104, "t": 683.0020099999999, "r": 482.81488, "b": 691.01797, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "Generalized in-", "bbox": {"l": 488.75064, "t": 683.0020099999999, "r": 545.1134, "b": 691.01797, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "tersection over union: A metric and a loss for bounding box", "bbox": {"l": 328.78104, "t": 693.961014, "r": 545.11334, "b": 701.976974, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "regression. In", "bbox": {"l": 328.78104, "t": 704.920013, "r": 379.1543, "b": 712.935974, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "Proceedings of the IEEE/CVF Conference on", "bbox": {"l": 381.61603, "t": 705.00071, "r": 545.10938, "b": 712.729744, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[25] Hamid Rezatofighi, Nathan Tsoi, JunYoung Gwak, Amir Sadeghian, Ian Reid, and Silvio Savarese. Generalized intersection over union: A metric and a loss for bounding box regression. In Proceedings of the IEEE/CVF Conference on"}, {"label": "page_footer", "id": 22, "page_no": 8, "cluster": {"id": 22, "label": "page_footer", "bbox": {"l": 295.12103, "t": 734.1325870000001, "r": 300.10233, "b": 743.0391500000001, "coord_origin": "TOPLEFT"}, "confidence": 0.8797808885574341, "cells": [{"id": 200, "text": "9", "bbox": {"l": 295.12103, "t": 734.1325870000001, "r": 300.10233, "b": 743.0391500000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "9"}], "body": [{"label": "list_item", "id": 25, "page_no": 8, "cluster": {"id": 25, "label": "list_item", "bbox": {"l": 70.030998, "t": 75.88378999999998, "r": 286.36334, "b": 116.77575999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.7310384511947632, "cells": [{"id": 0, "text": "end object detection with transformers. In Andrea Vedaldi,", "bbox": {"l": 70.030998, "t": 75.88378999999998, "r": 286.36334, "b": 83.89977999999996, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Horst Bischof, Thomas Brox, and Jan-Michael Frahm, edi-", "bbox": {"l": 70.030998, "t": 86.84276999999997, "r": 286.36331, "b": 94.85875999999996, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "tors,", "bbox": {"l": 70.030998, "t": 97.80078000000003, "r": 85.722198, "b": 105.81677000000002, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Computer Vision - ECCV 2020", "bbox": {"l": 87.889, "t": 97.88147000000004, "r": 199.93315, "b": 105.61053000000004, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": ", pages 213-229, Cham,", "bbox": {"l": 199.936, "t": 97.80078000000003, "r": 286.36313, "b": 105.81677000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "2020. Springer International Publishing. 5", "bbox": {"l": 70.031006, "t": 108.75977, "r": 221.94871999999998, "b": 116.77575999999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "end object detection with transformers. In Andrea Vedaldi, Horst Bischof, Thomas Brox, and Jan-Michael Frahm, editors, Computer Vision - ECCV 2020 , pages 213-229, Cham, 2020. Springer International Publishing. 5"}, {"label": "list_item", "id": 9, "page_no": 8, "cluster": {"id": 9, "label": "list_item", "bbox": {"l": 54.595005, "t": 120.03174000000013, "r": 286.36334, "b": 149.96569999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9372755885124207, "cells": [{"id": 6, "text": "[2]", "bbox": {"l": 54.595005, "t": 120.03174000000013, "r": 65.206657, "b": 128.04773, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Zewen Chi, Heyan Huang, Heng-Da Xu, Houjin Yu, Wanx-", "bbox": {"l": 67.481873, "t": 120.03174000000013, "r": 286.35852, "b": 128.04773, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "uan Yin, and Xian-Ling Mao.", "bbox": {"l": 70.031006, "t": 130.99072, "r": 179.67215, "b": 139.00671, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Complicated table structure", "bbox": {"l": 185.58101, "t": 130.99072, "r": 286.36334, "b": 139.00671, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "recognition.", "bbox": {"l": 70.031006, "t": 141.94970999999998, "r": 113.11456, "b": 149.96569999999997, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "arXiv preprint arXiv:1908.04729", "bbox": {"l": 116.34200999999999, "t": 142.0304, "r": 235.3082, "b": 149.75946, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": ", 2019. 3", "bbox": {"l": 235.30701, "t": 141.94970999999998, "r": 267.67572, "b": 149.96569999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[2] Zewen Chi, Heyan Huang, Heng-Da Xu, Houjin Yu, Wanxuan Yin, and Xian-Ling Mao. Complicated table structure recognition. arXiv preprint arXiv:1908.04729 , 2019. 3"}, {"label": "list_item", "id": 7, "page_no": 8, "cluster": {"id": 7, "label": "list_item", "bbox": {"l": 54.595001, "t": 153.22168, "r": 286.36301, "b": 183.15466000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9378374218940735, "cells": [{"id": 13, "text": "[3]", "bbox": {"l": 54.595001, "t": 153.22168, "r": 65.103195, "b": 161.23766999999998, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Bertrand Couasnon and Aurelie Lemaitre.", "bbox": {"l": 67.356239, "t": 153.22168, "r": 218.77876, "b": 161.23766999999998, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Recognition of Ta-", "bbox": {"l": 220.97999999999996, "t": 153.30237, "r": 286.36301, "b": 161.03143, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "bles and Forms", "bbox": {"l": 70.030991, "t": 164.26135, "r": 125.26401000000001, "b": 171.99041999999997, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": ", pages 647-677. Springer London, London,", "bbox": {"l": 125.26098999999999, "t": 164.18066, "r": 286.36029, "b": 172.19665999999995, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "2014. 2", "bbox": {"l": 70.030991, "t": 175.13867000000005, "r": 97.916496, "b": 183.15466000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[3] Bertrand Couasnon and Aurelie Lemaitre. Recognition of Tables and Forms , pages 647-677. Springer London, London, 2014. 2"}, {"label": "list_item", "id": 0, "page_no": 8, "cluster": {"id": 0, "label": "list_item", "bbox": {"l": 54.59499, "t": 186.41063999999994, "r": 286.36401, "b": 227.30358999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9648825526237488, "cells": [{"id": 19, "text": "[4]", "bbox": {"l": 54.59499, "t": 186.41063999999994, "r": 65.806984, "b": 194.42664000000002, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Herv\u00b4e D\u00b4ejean, Jean-Luc Meunier, Liangcai Gao, Yilun", "bbox": {"l": 68.210922, "t": 186.41063999999994, "r": 286.36401, "b": 194.42664000000002, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Huang, Yu Fang, Florian Kleber, and Eva-Maria Lang. IC-", "bbox": {"l": 70.030983, "t": 197.36963000000003, "r": 286.36331, "b": 205.38562000000002, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "DAR 2019 Competition on Table Detection and Recognition", "bbox": {"l": 70.030983, "t": 208.32861000000003, "r": 286.36334, "b": 216.3446, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "(cTDaR), Apr. 2019. http://sac.founderit.com/. 2", "bbox": {"l": 70.030983, "t": 219.2876, "r": 245.83519, "b": 227.30358999999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[4] Herv\u00b4e D\u00b4ejean, Jean-Luc Meunier, Liangcai Gao, Yilun Huang, Yu Fang, Florian Kleber, and Eva-Maria Lang. ICDAR 2019 Competition on Table Detection and Recognition (cTDaR), Apr. 2019. http://sac.founderit.com/. 2"}, {"label": "list_item", "id": 1, "page_no": 8, "cluster": {"id": 1, "label": "list_item", "bbox": {"l": 54.594982, "t": 230.55957, "r": 286.36334, "b": 271.45154, "coord_origin": "TOPLEFT"}, "confidence": 0.9620943069458008, "cells": [{"id": 24, "text": "[5]", "bbox": {"l": 54.594982, "t": 230.55957, "r": 65.381134, "b": 238.57556, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "Basilios Gatos, Dimitrios Danatsas, Ioannis Pratikakis, and", "bbox": {"l": 67.693779, "t": 230.55957, "r": 286.35849, "b": 238.57556, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "Stavros J Perantonis. Automatic table detection in document", "bbox": {"l": 70.030983, "t": 241.51855, "r": 286.36334, "b": 249.53454999999997, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "images. In", "bbox": {"l": 70.030983, "t": 252.47655999999995, "r": 108.39821, "b": 260.49255000000005, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "International Conference on Pattern Recognition", "bbox": {"l": 110.64498000000002, "t": 252.55724999999995, "r": 286.3595, "b": 260.28632000000005, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "and Image Analysis", "bbox": {"l": 70.030983, "t": 263.51624000000004, "r": 140.57861, "b": 271.24530000000004, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": ", pages 609-618. Springer, 2005. 2", "bbox": {"l": 140.57797, "t": 263.43555000000003, "r": 266.47522, "b": 271.45154, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[5] Basilios Gatos, Dimitrios Danatsas, Ioannis Pratikakis, and Stavros J Perantonis. Automatic table detection in document images. In International Conference on Pattern Recognition and Image Analysis , pages 609-618. Springer, 2005. 2"}, {"label": "list_item", "id": 2, "page_no": 8, "cluster": {"id": 2, "label": "list_item", "bbox": {"l": 54.594971, "t": 274.70758, "r": 286.36676, "b": 315.6004899999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9555517435073853, "cells": [{"id": 31, "text": "[6]", "bbox": {"l": 54.594971, "t": 274.70758, "r": 64.848648, "b": 282.72351, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Max G\u00a8obel, Tamir Hassan, Ermelinda Oro, and Giorgio Orsi.", "bbox": {"l": 67.047119, "t": 274.70758, "r": 286.36676, "b": 282.72351, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "Icdar 2013 table competition.", "bbox": {"l": 70.030975, "t": 285.66655999999995, "r": 179.57349, "b": 293.68253, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "In", "bbox": {"l": 187.01559, "t": 285.66655999999995, "r": 194.4846, "b": 293.68253, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "2013 12th International", "bbox": {"l": 198.04398, "t": 285.74725, "r": 286.36304, "b": 293.47632, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Conference on Document Analysis and Recognition", "bbox": {"l": 70.030975, "t": 296.70624, "r": 260.19937, "b": 304.43530000000004, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": ", pages", "bbox": {"l": 260.198, "t": 296.62555, "r": 286.36197, "b": 304.64151, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "1449-1453, 2013. 2", "bbox": {"l": 70.030991, "t": 307.5845299999999, "r": 142.74849, "b": 315.6004899999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[6] Max G\u00a8obel, Tamir Hassan, Ermelinda Oro, and Giorgio Orsi. Icdar 2013 table competition. In 2013 12th International Conference on Document Analysis and Recognition , pages 1449-1453, 2013. 2"}, {"label": "list_item", "id": 4, "page_no": 8, "cluster": {"id": 4, "label": "list_item", "bbox": {"l": 54.59499, "t": 318.85654, "r": 286.36319, "b": 348.78952, "coord_origin": "TOPLEFT"}, "confidence": 0.9479843378067017, "cells": [{"id": 39, "text": "[7]", "bbox": {"l": 54.59499, "t": 318.85654, "r": 65.61586, "b": 326.8725, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "EA Green and M Krishnamoorthy.", "bbox": {"l": 67.978821, "t": 318.85654, "r": 199.492, "b": 326.8725, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Recognition of tables", "bbox": {"l": 206.98792, "t": 318.85654, "r": 286.35849, "b": 326.8725, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "using table grammars. procs.", "bbox": {"l": 70.030991, "t": 329.8145400000001, "r": 176.28284, "b": 337.83051, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "In", "bbox": {"l": 182.60416, "t": 329.8145400000001, "r": 190.07317, "b": 337.83051, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "Symposium on Document", "bbox": {"l": 193.28299, "t": 329.89522999999997, "r": 286.36319, "b": 337.62429999999995, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Analysis and Recognition (SDAIR\u201995)", "bbox": {"l": 70.030991, "t": 340.85425, "r": 206.34717, "b": 348.58331, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": ", pages 261-277. 2", "bbox": {"l": 206.34599, "t": 340.77356, "r": 274.82239, "b": 348.78952, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[7] EA Green and M Krishnamoorthy. Recognition of tables using table grammars. procs. In Symposium on Document Analysis and Recognition (SDAIR\u201995) , pages 261-277. 2"}, {"label": "list_item", "id": 3, "page_no": 8, "cluster": {"id": 3, "label": "list_item", "bbox": {"l": 54.594986000000006, "t": 352.0455600000001, "r": 286.36331, "b": 403.89749, "coord_origin": "TOPLEFT"}, "confidence": 0.9484425187110901, "cells": [{"id": 47, "text": "[8]", "bbox": {"l": 54.594986000000006, "t": 352.0455600000001, "r": 65.04657, "b": 360.06152, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Khurram Azeem Hashmi, Alain Pagani, Marcus Liwicki, Di-", "bbox": {"l": 67.287483, "t": 352.0455600000001, "r": 286.35849, "b": 360.06152, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "dier Stricker, and Muhammad Zeshan Afzal.", "bbox": {"l": 70.030983, "t": 363.00458, "r": 234.12507999999997, "b": 371.02054, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Castabdetec-", "bbox": {"l": 240.05186, "t": 363.00458, "r": 286.36331, "b": 371.02054, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "tors: Cascade network for table detection in document im-", "bbox": {"l": 70.030983, "t": 373.96356, "r": 286.36331, "b": 381.97952, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "ages with recursive feature pyramid and switchable atrous", "bbox": {"l": 70.030983, "t": 384.92255, "r": 286.36331, "b": 392.93851, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "convolution.", "bbox": {"l": 70.030983, "t": 395.88153, "r": 114.57605, "b": 403.89749, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "Journal of Imaging", "bbox": {"l": 117.80399000000001, "t": 395.96222, "r": 186.7287, "b": 403.69128, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": ", 7(10), 2021. 1", "bbox": {"l": 186.728, "t": 395.88153, "r": 243.00113999999996, "b": 403.89749, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[8] Khurram Azeem Hashmi, Alain Pagani, Marcus Liwicki, Didier Stricker, and Muhammad Zeshan Afzal. Castabdetectors: Cascade network for table detection in document images with recursive feature pyramid and switchable atrous convolution. Journal of Imaging , 7(10), 2021. 1"}, {"label": "list_item", "id": 10, "page_no": 8, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 54.595001, "t": 407.15253000000007, "r": 286.35989, "b": 437.08646000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9330756664276123, "cells": [{"id": 56, "text": "[9]", "bbox": {"l": 54.595001, "t": 407.15253000000007, "r": 65.334427, "b": 415.1684900000001, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Kaiming He, Georgia Gkioxari, Piotr Dollar, and Ross Gir-", "bbox": {"l": 67.637054, "t": 407.15253000000007, "r": 286.35852, "b": 415.1684900000001, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "shick. Mask r-cnn. In", "bbox": {"l": 70.030998, "t": 418.11151, "r": 147.13306, "b": 426.12747, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Proceedings of the IEEE International", "bbox": {"l": 149.15601, "t": 418.1922, "r": 286.35989, "b": 425.92126, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Conference on Computer Vision (ICCV)", "bbox": {"l": 70.031006, "t": 429.15118, "r": 213.48445, "b": 436.88025, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": ", Oct 2017. 1", "bbox": {"l": 213.483, "t": 429.07050000000004, "r": 261.04083, "b": 437.08646000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[9] Kaiming He, Georgia Gkioxari, Piotr Dollar, and Ross Girshick. Mask r-cnn. In Proceedings of the IEEE International Conference on Computer Vision (ICCV) , Oct 2017. 1"}, {"label": "list_item", "id": 14, "page_no": 8, "cluster": {"id": 14, "label": "list_item", "bbox": {"l": 50.112, "t": 440.3424999999999, "r": 286.36334, "b": 481.23544, "coord_origin": "TOPLEFT"}, "confidence": 0.9274735450744629, "cells": [{"id": 62, "text": "[10]", "bbox": {"l": 50.112, "t": 440.3424999999999, "r": 65.399307, "b": 448.3584599999999, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "Yelin He, X. Qi, Jiaquan Ye, Peng Gao, Yihao Chen, Bing-", "bbox": {"l": 67.693321, "t": 440.3424999999999, "r": 286.3587, "b": 448.3584599999999, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "cong Li, Xin Tang, and Rong Xiao.", "bbox": {"l": 70.030998, "t": 451.30151, "r": 202.74268, "b": 459.31747, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "Pingan-vcgroup\u2019s so-", "bbox": {"l": 209.00122, "t": 451.30151, "r": 286.36331, "b": 459.31747, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "lution for icdar 2021 competition on scientific table image", "bbox": {"l": 70.030998, "t": 462.2605, "r": 286.36334, "b": 470.27646, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "recognition to latex.", "bbox": {"l": 70.030998, "t": 473.21948, "r": 141.86981, "b": 481.23544, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "ArXiv", "bbox": {"l": 145.097, "t": 473.30017, "r": 166.01561, "b": 481.02924, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": ", abs/2105.01846, 2021. 2", "bbox": {"l": 166.015, "t": 473.21948, "r": 259.90216, "b": 481.23544, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[10] Yelin He, X. Qi, Jiaquan Ye, Peng Gao, Yihao Chen, Bingcong Li, Xin Tang, and Rong Xiao. Pingan-vcgroup\u2019s solution for icdar 2021 competition on scientific table image recognition to latex. ArXiv , abs/2105.01846, 2021. 2"}, {"label": "list_item", "id": 11, "page_no": 8, "cluster": {"id": 11, "label": "list_item", "bbox": {"l": 50.112, "t": 484.49048, "r": 286.36331, "b": 536.34238, "coord_origin": "TOPLEFT"}, "confidence": 0.9299950003623962, "cells": [{"id": 70, "text": "[11]", "bbox": {"l": 50.112, "t": 484.49048, "r": 66.033806, "b": 492.50644, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Jianying Hu, Ramanujan S Kashi, Daniel P Lopresti, and", "bbox": {"l": 68.423035, "t": 484.49048, "r": 286.35873, "b": 492.50644, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "Gordon Wilfong. Medium-independent table detection. In", "bbox": {"l": 70.030998, "t": 495.44946, "r": 286.36331, "b": 503.46542, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "Document Recognition and Retrieval VII", "bbox": {"l": 70.030998, "t": 506.48914, "r": 227.40926, "b": 514.2182, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": ", volume 3967,", "bbox": {"l": 227.40500000000003, "t": 506.40845, "r": 286.35913, "b": 514.4244100000001, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "pages 291-302. International Society for Optics and Photon-", "bbox": {"l": 70.031006, "t": 517.36743, "r": 286.36328, "b": 525.38339, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "ics, 1999. 2", "bbox": {"l": 70.031006, "t": 528.32642, "r": 112.36138000000001, "b": 536.34238, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[11] Jianying Hu, Ramanujan S Kashi, Daniel P Lopresti, and Gordon Wilfong. Medium-independent table detection. In Document Recognition and Retrieval VII , volume 3967, pages 291-302. International Society for Optics and Photonics, 1999. 2"}, {"label": "list_item", "id": 5, "page_no": 8, "cluster": {"id": 5, "label": "list_item", "bbox": {"l": 50.112007, "t": 539.59842, "r": 286.36334, "b": 591.44937, "coord_origin": "TOPLEFT"}, "confidence": 0.9394103288650513, "cells": [{"id": 77, "text": "[12]", "bbox": {"l": 50.112007, "t": 539.59842, "r": 65.466705, "b": 547.61438, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "Matthew Hurst. A constraint-based approach to table struc-", "bbox": {"l": 67.770828, "t": 539.59842, "r": 286.35873, "b": 547.61438, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "ture derivation. In", "bbox": {"l": 70.031006, "t": 550.55742, "r": 136.28374, "b": 558.57338, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "Proceedings of the Seventh International", "bbox": {"l": 138.811, "t": 550.63812, "r": 286.36206, "b": 558.36716, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Conference on Document Analysis and Recognition - Volume", "bbox": {"l": 70.031006, "t": 561.5971199999999, "r": 286.36334, "b": 569.32616, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "2", "bbox": {"l": 70.031006, "t": 572.55612, "r": 74.514206, "b": 580.28516, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": ", ICDAR \u201903, page 911, USA, 2003. IEEE Computer Soci-", "bbox": {"l": 74.514008, "t": 572.47542, "r": 286.36313, "b": 580.4913799999999, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "ety. 2", "bbox": {"l": 70.031006, "t": 583.4334100000001, "r": 90.357834, "b": 591.44937, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[12] Matthew Hurst. A constraint-based approach to table structure derivation. In Proceedings of the Seventh International Conference on Document Analysis and Recognition - Volume 2 , ICDAR \u201903, page 911, USA, 2003. IEEE Computer Society. 2"}, {"label": "list_item", "id": 13, "page_no": 8, "cluster": {"id": 13, "label": "list_item", "bbox": {"l": 50.112007, "t": 594.70541, "r": 286.36331, "b": 646.55737, "coord_origin": "TOPLEFT"}, "confidence": 0.9298838973045349, "cells": [{"id": 85, "text": "[13]", "bbox": {"l": 50.112007, "t": 594.70541, "r": 66.270439, "b": 602.72137, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Thotreingam Kasar, Philippine Barlas, Sebastien Adam,", "bbox": {"l": 68.695168, "t": 594.70541, "r": 286.35873, "b": 602.72137, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Cl\u00b4ement Chatelain, and Thierry Paquet. Learning to detect", "bbox": {"l": 70.031006, "t": 605.66441, "r": 286.3631, "b": 613.68037, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "tables in scanned document images using line information.", "bbox": {"l": 70.031006, "t": 616.62341, "r": 286.36331, "b": 624.63937, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "In", "bbox": {"l": 70.031006, "t": 627.58241, "r": 77.500015, "b": 635.5983699999999, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "2013 12th International Conference on Document Analy-", "bbox": {"l": 79.920006, "t": 627.6631199999999, "r": 286.3624, "b": 635.39215, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "sis and Recognition", "bbox": {"l": 70.031006, "t": 638.62212, "r": 140.67728, "b": 646.35115, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": ", pages 1185-1189. IEEE, 2013. 2", "bbox": {"l": 140.67599, "t": 638.54141, "r": 264.43921, "b": 646.55737, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[13] Thotreingam Kasar, Philippine Barlas, Sebastien Adam, Cl\u00b4ement Chatelain, and Thierry Paquet. Learning to detect tables in scanned document images using line information. In 2013 12th International Conference on Document Analysis and Recognition , pages 1185-1189. IEEE, 2013. 2"}, {"label": "list_item", "id": 17, "page_no": 8, "cluster": {"id": 17, "label": "list_item", "bbox": {"l": 50.111992, "t": 649.81342, "r": 286.36334, "b": 679.74638, "coord_origin": "TOPLEFT"}, "confidence": 0.9115257263183594, "cells": [{"id": 93, "text": "[14]", "bbox": {"l": 50.111992, "t": 649.81342, "r": 66.534035, "b": 657.82938, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "Pratik Kayal, Mrinal Anand, Harsh Desai, and Mayank", "bbox": {"l": 68.998329, "t": 649.81342, "r": 286.35873, "b": 657.82938, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "Singh.", "bbox": {"l": 70.030991, "t": 660.77142, "r": 93.200165, "b": 668.78738, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "Icdar 2021 competition on scientific table image", "bbox": {"l": 102.20243, "t": 660.77142, "r": 286.36334, "b": 668.78738, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "recognition to latex, 2021. 2", "bbox": {"l": 70.030991, "t": 671.73042, "r": 171.9969, "b": 679.74638, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[14] Pratik Kayal, Mrinal Anand, Harsh Desai, and Mayank Singh. Icdar 2021 competition on scientific table image recognition to latex, 2021. 2"}, {"label": "list_item", "id": 16, "page_no": 8, "cluster": {"id": 16, "label": "list_item", "bbox": {"l": 50.111992, "t": 683.00243, "r": 286.35931, "b": 712.936386, "coord_origin": "TOPLEFT"}, "confidence": 0.912230372428894, "cells": [{"id": 98, "text": "[15]", "bbox": {"l": 50.111992, "t": 683.00243, "r": 65.515968, "b": 691.01839, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "Harold W Kuhn. The hungarian method for the assignment", "bbox": {"l": 67.827499, "t": 683.00243, "r": 286.3587, "b": 691.01839, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "problem.", "bbox": {"l": 70.030991, "t": 693.9614260000001, "r": 102.15761, "b": 701.977386, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "Naval research logistics quarterly", "bbox": {"l": 107.54999, "t": 694.0421220000001, "r": 231.47461, "b": 701.771156, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": ", 2(1-2):83-97,", "bbox": {"l": 231.47598, "t": 693.9614260000001, "r": 286.35931, "b": 701.977386, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "1955. 6", "bbox": {"l": 70.030975, "t": 704.920425, "r": 97.916481, "b": 712.936386, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[15] Harold W Kuhn. The hungarian method for the assignment problem. Naval research logistics quarterly , 2(1-2):83-97, 1955. 6"}, {"label": "list_item", "id": 6, "page_no": 8, "cluster": {"id": 6, "label": "list_item", "bbox": {"l": 308.86197, "t": 75.88342000000011, "r": 545.11475, "b": 138.69335999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.9389600157737732, "cells": [{"id": 104, "text": "[16]", "bbox": {"l": 308.86197, "t": 75.88342000000011, "r": 324.74973, "b": 83.89940999999999, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "Girish Kulkarni, Visruth Premraj, Vicente Ordonez, Sag-", "bbox": {"l": 327.13382, "t": 75.88342000000011, "r": 545.1087, "b": 83.89940999999999, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "nik Dhar, Siming Li, Yejin Choi, Alexander C. Berg, and", "bbox": {"l": 328.78098, "t": 86.84142999999995, "r": 545.1134, "b": 94.85741999999993, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "Tamara L. Berg.", "bbox": {"l": 328.78098, "t": 97.80042000000003, "r": 390.96295, "b": 105.81641000000002, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "Babytalk:", "bbox": {"l": 400.27008, "t": 97.80042000000003, "r": 435.1404099999999, "b": 105.81641000000002, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "Understanding and generat-", "bbox": {"l": 441.71277, "t": 97.80042000000003, "r": 545.11328, "b": 105.81641000000002, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "ing simple image descriptions.", "bbox": {"l": 328.78098, "t": 108.75940000000003, "r": 440.80719, "b": 116.7753899999999, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "IEEE Transactions on Pat-", "bbox": {"l": 446.63498, "t": 108.84009000000003, "r": 545.11304, "b": 116.56914999999992, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "tern Analysis and Machine Intelligence", "bbox": {"l": 328.78098, "t": 119.79907000000003, "r": 471.13153, "b": 127.52814000000001, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": ", 35(12):2891-2903,", "bbox": {"l": 471.13300000000004, "t": 119.71838000000002, "r": 545.11475, "b": 127.73437999999999, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "2013. 4", "bbox": {"l": 328.78101, "t": 130.67737, "r": 356.6665, "b": 138.69335999999998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[16] Girish Kulkarni, Visruth Premraj, Vicente Ordonez, Sagnik Dhar, Siming Li, Yejin Choi, Alexander C. Berg, and Tamara L. Berg. Babytalk: Understanding and generating simple image descriptions. IEEE Transactions on Pattern Analysis and Machine Intelligence , 35(12):2891-2903, 2013. 4"}, {"label": "list_item", "id": 15, "page_no": 8, "cluster": {"id": 15, "label": "list_item", "bbox": {"l": 308.862, "t": 142.12334999999996, "r": 545.1134, "b": 172.05633999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.9253129959106445, "cells": [{"id": 115, "text": "[17]", "bbox": {"l": 308.862, "t": 142.12334999999996, "r": 325.24371, "b": 150.13933999999995, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "Minghao Li, Lei Cui, Shaohan Huang, Furu Wei, Ming", "bbox": {"l": 327.70197, "t": 142.12334999999996, "r": 545.10883, "b": 150.13933999999995, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "Zhou, and Zhoujun Li.", "bbox": {"l": 328.78101, "t": 153.08136000000002, "r": 414.44598, "b": 161.09735, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "Tablebank: A benchmark dataset", "bbox": {"l": 421.82532, "t": 153.08136000000002, "r": 545.1134, "b": 161.09735, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "for table detection and recognition, 2019. 2, 3", "bbox": {"l": 328.78101, "t": 164.04034000000001, "r": 493.62835999999993, "b": 172.05633999999998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[17] Minghao Li, Lei Cui, Shaohan Huang, Furu Wei, Ming Zhou, and Zhoujun Li. Tablebank: A benchmark dataset for table detection and recognition, 2019. 2, 3"}, {"label": "list_item", "id": 12, "page_no": 8, "cluster": {"id": 12, "label": "list_item", "bbox": {"l": 308.862, "t": 175.48632999999995, "r": 545.11353, "b": 260.21423000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9299732446670532, "cells": [{"id": 120, "text": "[18]", "bbox": {"l": 308.862, "t": 175.48632999999995, "r": 324.26599, "b": 183.50232000000005, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "Yiren Li, Zheng Huang, Junchi Yan, Yi Zhou, Fan Ye, and", "bbox": {"l": 326.57751, "t": 175.48632999999995, "r": 545.10876, "b": 183.50232000000005, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Xianhui Liu. Gfte: Graph-based financial table extraction.", "bbox": {"l": 328.78101, "t": 186.44530999999995, "r": 545.11334, "b": 194.46130000000005, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "In Alberto Del Bimbo, Rita Cucchiara, Stan Sclaroff, Gio-", "bbox": {"l": 328.78101, "t": 197.40430000000003, "r": 545.11346, "b": 205.42029000000002, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "vanni Maria Farinella, Tao Mei, Marco Bertini, Hugo Jair", "bbox": {"l": 328.78101, "t": 208.36328000000003, "r": 545.11353, "b": 216.37927000000002, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "Escalante, and Roberto Vezzani, editors,", "bbox": {"l": 328.78101, "t": 219.32227, "r": 479.26413, "b": 227.33826, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "Pattern Recogni-", "bbox": {"l": 483.11902, "t": 219.40295000000003, "r": 545.11273, "b": 227.13202, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "tion. ICPR International Workshops and Challenges", "bbox": {"l": 328.78101, "t": 230.36095999999998, "r": 519.39771, "b": 238.09002999999996, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": ", pages", "bbox": {"l": 519.401, "t": 230.28026999999997, "r": 545.10767, "b": 238.29625999999996, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "644-658, Cham, 2021. Springer International Publishing. 2,", "bbox": {"l": 328.78101, "t": 241.23925999999994, "r": 545.11328, "b": 249.25525000000005, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "3", "bbox": {"l": 328.78101, "t": 252.19824000000006, "r": 333.26422, "b": 260.21423000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[18] Yiren Li, Zheng Huang, Junchi Yan, Yi Zhou, Fan Ye, and Xianhui Liu. Gfte: Graph-based financial table extraction. In Alberto Del Bimbo, Rita Cucchiara, Stan Sclaroff, Giovanni Maria Farinella, Tao Mei, Marco Bertini, Hugo Jair Escalante, and Roberto Vezzani, editors, Pattern Recognition. ICPR International Workshops and Challenges , pages 644-658, Cham, 2021. Springer International Publishing. 2, 3"}, {"label": "list_item", "id": 8, "page_no": 8, "cluster": {"id": 8, "label": "list_item", "bbox": {"l": 308.862, "t": 263.64423, "r": 545.1142, "b": 326.45413, "coord_origin": "TOPLEFT"}, "confidence": 0.937321662902832, "cells": [{"id": 131, "text": "[19]", "bbox": {"l": 308.862, "t": 263.64423, "r": 324.26477, "b": 271.66022, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "Nikolaos Livathinos, Cesar Berrospi, Maksym Lysak, Vik-", "bbox": {"l": 326.57611, "t": 263.64423, "r": 545.10883, "b": 271.66022, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "tor Kuropiatnyk, Ahmed Nassar, Andre Carvalho, Michele", "bbox": {"l": 328.78101, "t": 274.60321, "r": 545.1134, "b": 282.61917000000005, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "Dolfi, Christoph Auer, Kasper Dinkla, and Peter Staar. Ro-", "bbox": {"l": 328.78101, "t": 285.56219, "r": 545.11328, "b": 293.57816, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "bust pdf document conversion using recurrent neural net-", "bbox": {"l": 328.78101, "t": 296.52118, "r": 545.11334, "b": 304.53714, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "works.", "bbox": {"l": 328.78101, "t": 307.47919, "r": 352.84683, "b": 315.49515, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "Proceedings of the AAAI Conference on Artificial", "bbox": {"l": 360.23599, "t": 307.55988, "r": 545.1142, "b": 315.28894, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "Intelligence", "bbox": {"l": 328.78101, "t": 318.51886, "r": 371.02173, "b": 326.24792, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": ", 35(17):15137-15145, May 2021. 1", "bbox": {"l": 371.021, "t": 318.43817, "r": 502.26227, "b": 326.45413, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[19] Nikolaos Livathinos, Cesar Berrospi, Maksym Lysak, Viktor Kuropiatnyk, Ahmed Nassar, Andre Carvalho, Michele Dolfi, Christoph Auer, Kasper Dinkla, and Peter Staar. Robust pdf document conversion using recurrent neural networks. Proceedings of the AAAI Conference on Artificial Intelligence , 35(17):15137-15145, May 2021. 1"}, {"label": "list_item", "id": 18, "page_no": 8, "cluster": {"id": 18, "label": "list_item", "bbox": {"l": 308.862, "t": 329.88419, "r": 545.11609, "b": 370.77713, "coord_origin": "TOPLEFT"}, "confidence": 0.9027292728424072, "cells": [{"id": 140, "text": "[20]", "bbox": {"l": 308.862, "t": 329.88419, "r": 323.82672, "b": 337.90015, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "Rujiao Long, Wen Wang, Nan Xue, Feiyu Gao, Zhibo Yang,", "bbox": {"l": 326.07233, "t": 329.88419, "r": 545.10876, "b": 337.90015, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "Yongpan Wang, and Gui-Song Xia. Parsing table structures", "bbox": {"l": 328.78101, "t": 340.8432, "r": 545.11346, "b": 348.85916, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "in the wild. In", "bbox": {"l": 328.78101, "t": 351.80219000000005, "r": 382.7767, "b": 359.81815000000006, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "Proceedings of the IEEE/CVF International", "bbox": {"l": 385.54102, "t": 351.88287, "r": 545.11609, "b": 359.61194, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "Conference on Computer Vision", "bbox": {"l": 328.78101, "t": 362.84186, "r": 443.59579, "b": 370.57092, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": ", pages 944-952, 2021. 2", "bbox": {"l": 443.59399, "t": 362.76117, "r": 534.48645, "b": 370.77713, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[20] Rujiao Long, Wen Wang, Nan Xue, Feiyu Gao, Zhibo Yang, Yongpan Wang, and Gui-Song Xia. Parsing table structures in the wild. In Proceedings of the IEEE/CVF International Conference on Computer Vision , pages 944-952, 2021. 2"}, {"label": "list_item", "id": 21, "page_no": 8, "cluster": {"id": 21, "label": "list_item", "bbox": {"l": 308.862, "t": 374.20618, "r": 545.11346, "b": 437.01706, "coord_origin": "TOPLEFT"}, "confidence": 0.882714569568634, "cells": [{"id": 147, "text": "[21]", "bbox": {"l": 308.862, "t": 374.20618, "r": 324.60281, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "Shubham", "bbox": {"l": 326.96487, "t": 374.20618, "r": 362.6604, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "Singh", "bbox": {"l": 368.69479, "t": 374.20618, "r": 389.6134, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "Paliwal,", "bbox": {"l": 395.6478, "t": 374.20618, "r": 424.56445, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "D", "bbox": {"l": 431.5492899999999, "t": 374.20618, "r": 438.0230399999999, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "Vishwanath,", "bbox": {"l": 444.05743, "t": 374.20618, "r": 488.5038799999999, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "Rohit", "bbox": {"l": 495.47974, "t": 374.20618, "r": 515.41205, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "Rahul,", "bbox": {"l": 521.44641, "t": 374.20618, "r": 545.10876, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "Monika Sharma, and Lovekesh Vig. Tablenet: Deep learn-", "bbox": {"l": 328.78101, "t": 385.16516, "r": 545.1134, "b": 393.18112, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "ing model for end-to-end table detection and tabular data ex-", "bbox": {"l": 328.78101, "t": 396.12415, "r": 545.11346, "b": 404.14011, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "traction from scanned document images.", "bbox": {"l": 328.78101, "t": 407.08313, "r": 478.00881999999996, "b": 415.09909, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "In", "bbox": {"l": 484.0701, "t": 407.08313, "r": 491.53912, "b": 415.09909, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "2019 Interna-", "bbox": {"l": 494.668, "t": 407.16382, "r": 545.11298, "b": 414.89288, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "tional Conference on Document Analysis and Recognition", "bbox": {"l": 328.78101, "t": 418.12280000000004, "r": 545.11334, "b": 425.85187, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "(ICDAR)", "bbox": {"l": 328.78101, "t": 429.08179, "r": 360.83591, "b": 436.8108500000001, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": ", pages 128-133. IEEE, 2019. 1", "bbox": {"l": 360.836, "t": 429.0011, "r": 475.63287, "b": 437.01706, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[21] Shubham Singh Paliwal, D Vishwanath, Rohit Rahul, Monika Sharma, and Lovekesh Vig. Tablenet: Deep learning model for end-to-end table detection and tabular data extraction from scanned document images. In 2019 International Conference on Document Analysis and Recognition (ICDAR) , pages 128-133. IEEE, 2019. 1"}, {"label": "list_item", "id": 20, "page_no": 8, "cluster": {"id": 20, "label": "list_item", "bbox": {"l": 308.862, "t": 440.44611, "r": 545.11475, "b": 558.05096, "coord_origin": "TOPLEFT"}, "confidence": 0.8896440863609314, "cells": [{"id": 163, "text": "[22]", "bbox": {"l": 308.862, "t": 440.44611, "r": 324.57407, "b": 448.46207, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "Adam Paszke, Sam Gross, Francisco Massa, Adam Lerer,", "bbox": {"l": 326.93179, "t": 440.44611, "r": 545.1087, "b": 448.46207, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "James Bradbury, Gregory Chanan, Trevor Killeen, Zeming", "bbox": {"l": 328.78101, "t": 451.40509, "r": 545.11346, "b": 459.42105, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "Lin, Natalia Gimelshein, Luca Antiga, Alban Desmaison,", "bbox": {"l": 328.78101, "t": 462.36407, "r": 545.11328, "b": 470.38004, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "Andreas Kopf, Edward Yang, Zachary DeVito, Martin Rai-", "bbox": {"l": 328.78101, "t": 473.32306, "r": 545.11328, "b": 481.33902, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "son, Alykhan Tejani, Sasank Chilamkurthy, Benoit Steiner,", "bbox": {"l": 328.78101, "t": 484.28204, "r": 545.11328, "b": 492.298, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "Lu Fang, Junjie Bai, and Soumith Chintala. Pytorch: An im-", "bbox": {"l": 328.78101, "t": 495.24103, "r": 545.1134, "b": 503.25699, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "perative style, high-performance deep learning library. In H.", "bbox": {"l": 328.78101, "t": 506.20001, "r": 545.1134, "b": 514.21597, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "Wallach, H. Larochelle, A. Beygelzimer, F. d'Alch\u00b4e-Buc, E.", "bbox": {"l": 328.78101, "t": 517.159, "r": 545.1098, "b": 525.17496, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "Fox, and R. Garnett, editors,", "bbox": {"l": 328.78101, "t": 528.117, "r": 434.56659, "b": 536.13297, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "Advances in Neural Informa-", "bbox": {"l": 437.86401, "t": 528.19769, "r": 545.11115, "b": 535.9267600000001, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "tion Processing Systems 32", "bbox": {"l": 328.78101, "t": 539.15671, "r": 425.73471, "b": 546.8857399999999, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": ", pages 8024-8035. Curran Asso-", "bbox": {"l": 425.73602, "t": 539.076, "r": 545.11475, "b": 547.09196, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "ciates, Inc., 2019. 6", "bbox": {"l": 328.78101, "t": 550.035, "r": 399.74109, "b": 558.05096, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[22] Adam Paszke, Sam Gross, Francisco Massa, Adam Lerer, James Bradbury, Gregory Chanan, Trevor Killeen, Zeming Lin, Natalia Gimelshein, Luca Antiga, Alban Desmaison, Andreas Kopf, Edward Yang, Zachary DeVito, Martin Raison, Alykhan Tejani, Sasank Chilamkurthy, Benoit Steiner, Lu Fang, Junjie Bai, and Soumith Chintala. Pytorch: An imperative style, high-performance deep learning library. In H. Wallach, H. Larochelle, A. Beygelzimer, F. d'Alch\u00b4e-Buc, E. Fox, and R. Garnett, editors, Advances in Neural Information Processing Systems 32 , pages 8024-8035. Curran Associates, Inc., 2019. 6"}, {"label": "list_item", "id": 19, "page_no": 8, "cluster": {"id": 19, "label": "list_item", "bbox": {"l": 308.862, "t": 561.481, "r": 545.1134, "b": 624.29097, "coord_origin": "TOPLEFT"}, "confidence": 0.9025435447692871, "cells": [{"id": 177, "text": "[23]", "bbox": {"l": 308.862, "t": 561.481, "r": 324.50351, "b": 569.49696, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "Devashish Prasad, Ayan Gadpal, Kshitij Kapadni, Manish", "bbox": {"l": 326.85068, "t": 561.481, "r": 545.10876, "b": 569.49696, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "Visave, and Kavita Sultanpure. Cascadetabnet: An approach", "bbox": {"l": 328.78101, "t": 572.44, "r": 545.1134, "b": 580.45596, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "for end to end table detection and structure recognition from", "bbox": {"l": 328.78101, "t": 583.399, "r": 545.11334, "b": 591.4149600000001, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "image-based documents. In", "bbox": {"l": 328.78101, "t": 594.358, "r": 431.61667, "b": 602.37396, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "Proceedings of the IEEE/CVF", "bbox": {"l": 434.69101000000006, "t": 594.4387099999999, "r": 545.11224, "b": 602.16774, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "Conference on Computer Vision and Pattern Recognition", "bbox": {"l": 328.78101, "t": 605.39671, "r": 545.1134, "b": 613.12575, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "Workshops", "bbox": {"l": 328.78101, "t": 616.35571, "r": 367.8028, "b": 624.08475, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": ", pages 572-573, 2020. 1", "bbox": {"l": 367.802, "t": 616.2750100000001, "r": 458.69446000000005, "b": 624.29097, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[23] Devashish Prasad, Ayan Gadpal, Kshitij Kapadni, Manish Visave, and Kavita Sultanpure. Cascadetabnet: An approach for end to end table detection and structure recognition from image-based documents. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition Workshops , pages 572-573, 2020. 1"}, {"label": "list_item", "id": 23, "page_no": 8, "cluster": {"id": 23, "label": "list_item", "bbox": {"l": 308.862, "t": 627.72101, "r": 545.11621, "b": 668.61398, "coord_origin": "TOPLEFT"}, "confidence": 0.8777532577514648, "cells": [{"id": 186, "text": "[24]", "bbox": {"l": 308.862, "t": 627.72101, "r": 324.69476, "b": 635.73697, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "Shah Rukh Qasim, Hassan Mahmood, and Faisal Shafait.", "bbox": {"l": 327.07065, "t": 627.72101, "r": 545.1087, "b": 635.73697, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": "Rethinking table recognition using graph neural networks.", "bbox": {"l": 328.78101, "t": 638.68001, "r": 545.11328, "b": 646.69597, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "In", "bbox": {"l": 328.78101, "t": 649.63901, "r": 336.25003, "b": 657.65497, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "2019 International Conference on Document Analysis and", "bbox": {"l": 338.10001, "t": 649.71971, "r": 545.11621, "b": 657.44875, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "Recognition (ICDAR)", "bbox": {"l": 328.78101, "t": 660.67871, "r": 406.32245, "b": 668.40775, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": ", pages 142-147. IEEE, 2019. 3", "bbox": {"l": 406.32202, "t": 660.5980099999999, "r": 521.1189, "b": 668.61398, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[24] Shah Rukh Qasim, Hassan Mahmood, and Faisal Shafait. Rethinking table recognition using graph neural networks. In 2019 International Conference on Document Analysis and Recognition (ICDAR) , pages 142-147. IEEE, 2019. 3"}, {"label": "list_item", "id": 24, "page_no": 8, "cluster": {"id": 24, "label": "list_item", "bbox": {"l": 308.86203, "t": 672.04301, "r": 545.1134, "b": 712.935974, "coord_origin": "TOPLEFT"}, "confidence": 0.8654531240463257, "cells": [{"id": 193, "text": "[25]", "bbox": {"l": 308.86203, "t": 672.04301, "r": 324.71329, "b": 680.05898, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "Hamid Rezatofighi, Nathan Tsoi, JunYoung Gwak, Amir", "bbox": {"l": 327.09195, "t": 672.04301, "r": 545.10876, "b": 680.05898, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "Sadeghian, Ian Reid, and Silvio Savarese.", "bbox": {"l": 328.78104, "t": 683.0020099999999, "r": 482.81488, "b": 691.01797, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "Generalized in-", "bbox": {"l": 488.75064, "t": 683.0020099999999, "r": 545.1134, "b": 691.01797, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "tersection over union: A metric and a loss for bounding box", "bbox": {"l": 328.78104, "t": 693.961014, "r": 545.11334, "b": 701.976974, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "regression. In", "bbox": {"l": 328.78104, "t": 704.920013, "r": 379.1543, "b": 712.935974, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "Proceedings of the IEEE/CVF Conference on", "bbox": {"l": 381.61603, "t": 705.00071, "r": 545.10938, "b": 712.729744, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[25] Hamid Rezatofighi, Nathan Tsoi, JunYoung Gwak, Amir Sadeghian, Ian Reid, and Silvio Savarese. Generalized intersection over union: A metric and a loss for bounding box regression. In Proceedings of the IEEE/CVF Conference on"}], "headers": [{"label": "page_footer", "id": 22, "page_no": 8, "cluster": {"id": 22, "label": "page_footer", "bbox": {"l": 295.12103, "t": 734.1325870000001, "r": 300.10233, "b": 743.0391500000001, "coord_origin": "TOPLEFT"}, "confidence": 0.8797808885574341, "cells": [{"id": 200, "text": "9", "bbox": {"l": 295.12103, "t": 734.1325870000001, "r": 300.10233, "b": 743.0391500000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "9"}]}}, {"page_no": 9, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "Computer Vision and Pattern Recognition", "bbox": {"l": 70.030998, "t": 75.96447999999998, "r": 223.58061, "b": 83.69353999999998, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": ", pages 658-666,", "bbox": {"l": 223.57901, "t": 75.88378999999998, "r": 286.36176, "b": 83.89977999999996, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "2019. 6", "bbox": {"l": 70.031006, "t": 86.84276999999997, "r": 97.916512, "b": 94.85875999999996, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "[26]", "bbox": {"l": 50.112007, "t": 98.16576999999995, "r": 65.534088, "b": 106.18176000000005, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Sebastian Schreiber, Stefan Agne, Ivo Wolf, Andreas Den-", "bbox": {"l": 67.84832, "t": 98.16576999999995, "r": 286.35867, "b": 106.18176000000005, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "gel, and Sheraz Ahmed. Deepdesrt: Deep learning for detec-", "bbox": {"l": 70.031006, "t": 109.12476000000004, "r": 286.36331, "b": 117.14075000000003, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "tion and structure recognition of tables in document images.", "bbox": {"l": 70.031006, "t": 120.08374000000003, "r": 286.36334, "b": 128.0997299999999, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "In", "bbox": {"l": 70.031006, "t": 131.04272000000003, "r": 77.500015, "b": 139.05872, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "2017 14th IAPR International Conference on Document", "bbox": {"l": 80.560005, "t": 131.12341000000004, "r": 286.36578, "b": 138.85248, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Analysis and Recognition (ICDAR)", "bbox": {"l": 70.031006, "t": 142.0824, "r": 195.22885, "b": 149.81146, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": ", volume 01, pages 1162-", "bbox": {"l": 195.231, "t": 142.00171, "r": 286.36548, "b": 150.0177, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "1167, 2017. 1", "bbox": {"l": 70.031006, "t": 152.96069, "r": 120.33251, "b": 160.97668, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "[27]", "bbox": {"l": 50.112007, "t": 164.28467, "r": 65.534088, "b": 172.30066, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Sebastian Schreiber, Stefan Agne, Ivo Wolf, Andreas Den-", "bbox": {"l": 67.84832, "t": 164.28467, "r": 286.35867, "b": 172.30066, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "gel, and Sheraz Ahmed. Deepdesrt: Deep learning for de-", "bbox": {"l": 70.031006, "t": 175.24365, "r": 286.36337, "b": 183.25964, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "tection and structure recognition of tables in document im-", "bbox": {"l": 70.031006, "t": 186.20263999999997, "r": 286.36334, "b": 194.21862999999996, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "ages. In", "bbox": {"l": 70.031006, "t": 197.16161999999997, "r": 101.33271, "b": 205.17760999999996, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "2017 14th IAPR international conference on doc-", "bbox": {"l": 104.33101, "t": 197.24230999999997, "r": 286.35791, "b": 204.97136999999998, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "ument analysis and recognition (ICDAR)", "bbox": {"l": 70.031006, "t": 208.20032000000003, "r": 220.48719999999997, "b": 215.92938000000004, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": ", volume 1, pages", "bbox": {"l": 220.48401000000004, "t": 208.11963000000003, "r": 286.36017, "b": 216.13562000000002, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "1162-1167. IEEE, 2017. 3", "bbox": {"l": 70.031006, "t": 219.07861000000003, "r": 166.65294, "b": 227.0946, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "[28]", "bbox": {"l": 50.112007, "t": 230.40259000000003, "r": 65.650383, "b": 238.41858000000002, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "Faisal Shafait and Ray Smith. Table detection in heteroge-", "bbox": {"l": 67.982063, "t": 230.40259000000003, "r": 286.3587, "b": 238.41858000000002, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "neous documents. In", "bbox": {"l": 70.031006, "t": 241.36157000000003, "r": 147.16895, "b": 249.37756000000002, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "Proceedings of the 9th IAPR Interna-", "bbox": {"l": 149.93301, "t": 241.44226000000003, "r": 286.36578, "b": 249.17133, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "tional Workshop on Document Analysis Systems", "bbox": {"l": 70.031013, "t": 252.40125, "r": 244.6875, "b": 260.13031, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": ", pages 65-", "bbox": {"l": 244.69101, "t": 252.32056, "r": 286.35791, "b": 260.33655, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "72, 2010. 2", "bbox": {"l": 70.031006, "t": 263.27954, "r": 111.36611, "b": 271.29553, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "[29]", "bbox": {"l": 50.112007, "t": 274.60357999999997, "r": 66.023834, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Shoaib", "bbox": {"l": 68.411568, "t": 274.60357999999997, "r": 94.944016, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Ahmed", "bbox": {"l": 100.8708, "t": 274.60357999999997, "r": 127.26788000000002, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Siddiqui,", "bbox": {"l": 133.19467, "t": 274.60357999999997, "r": 165.83237, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Imran", "bbox": {"l": 172.68269, "t": 274.60357999999997, "r": 194.09445, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "Ali", "bbox": {"l": 200.02124, "t": 274.60357999999997, "r": 211.4803, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Fateh,", "bbox": {"l": 217.40708999999998, "t": 274.60357999999997, "r": 239.43755, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "Syed", "bbox": {"l": 246.28787000000003, "t": 274.60357999999997, "r": 264.22067, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Tah-", "bbox": {"l": 270.14746, "t": 274.60357999999997, "r": 286.35873, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "seen Raza Rizvi, Andreas Dengel, and Sheraz Ahmed.", "bbox": {"l": 70.031006, "t": 285.56256, "r": 286.36331, "b": 293.57852, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "Deeptabstr: Deep learning based table structure recognition.", "bbox": {"l": 70.031006, "t": 296.52155, "r": 286.36331, "b": 304.53751, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "In", "bbox": {"l": 70.031006, "t": 307.48053, "r": 77.500015, "b": 315.49649, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "2019 International Conference on Document Analysis and", "bbox": {"l": 79.350006, "t": 307.56122, "r": 286.36627, "b": 315.29028, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Recognition (ICDAR)", "bbox": {"l": 70.031006, "t": 318.51923, "r": 147.57243, "b": 326.24829, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": ", pages 1403-1409. IEEE, 2019. 3", "bbox": {"l": 147.57201, "t": 318.43854, "r": 271.33521, "b": 326.4545, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "[30]", "bbox": {"l": 50.112007, "t": 329.76254, "r": 65.366135, "b": 337.7785, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "Peter W J Staar, Michele Dolfi, Christoph Auer, and Costas", "bbox": {"l": 67.655159, "t": 329.76254, "r": 286.3587, "b": 337.7785, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Bekas. Corpus conversion service: A machine learning plat-", "bbox": {"l": 70.031006, "t": 340.72156000000007, "r": 286.36334, "b": 348.7375200000001, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "form to ingest documents at scale.", "bbox": {"l": 70.031006, "t": 351.68054, "r": 198.82439, "b": 359.6965, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "In", "bbox": {"l": 206.06027, "t": 351.68054, "r": 213.52928, "b": 359.6965, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Proceedings of the", "bbox": {"l": 217.02101, "t": 351.76123, "r": 286.35815, "b": 359.4903, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "24th ACM SIGKDD", "bbox": {"l": 70.031006, "t": 362.72021, "r": 143.08028, "b": 370.44928, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": ", KDD \u201918, pages 774-782, New York,", "bbox": {"l": 143.078, "t": 362.63953000000004, "r": 286.36111, "b": 370.65549000000004, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "NY, USA, 2018. ACM. 1", "bbox": {"l": 70.031006, "t": 373.59851, "r": 161.15652, "b": 381.61447, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "[31]", "bbox": {"l": 50.112007, "t": 384.92252, "r": 65.140724, "b": 392.93848, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Ashish Vaswani, Noam Shazeer, Niki Parmar, Jakob Uszko-", "bbox": {"l": 67.395927, "t": 384.92252, "r": 286.35876, "b": 392.93848, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "reit, Llion Jones, Aidan N Gomez, \u0141 ukasz Kaiser, and Il-", "bbox": {"l": 70.031006, "t": 395.88153, "r": 286.36337, "b": 403.89749, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "lia Polosukhin.", "bbox": {"l": 70.031006, "t": 406.84052, "r": 125.47024999999998, "b": 414.85648, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Attention is all you need.", "bbox": {"l": 133.90764, "t": 406.84052, "r": 230.83444, "b": 414.85648, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "In I. Guyon,", "bbox": {"l": 239.27182, "t": 406.84052, "r": 286.36334, "b": 414.85648, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "U.", "bbox": {"l": 70.031006, "t": 417.7995, "r": 78.958366, "b": 425.81546, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "V. Luxburg, S. Bengio, H. Wallach, R. Fergus, S. Vish-", "bbox": {"l": 81.254494, "t": 417.7995, "r": 286.36334, "b": 425.81546, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "wanathan, and R. Garnett, editors,", "bbox": {"l": 70.031006, "t": 428.75751, "r": 196.7621, "b": 436.7734699999999, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "Advances in Neural In-", "bbox": {"l": 200.20201, "t": 428.8381999999999, "r": 286.36017, "b": 436.56726, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "formation Processing Systems 30", "bbox": {"l": 70.031006, "t": 439.79717999999997, "r": 189.19447, "b": 447.52624999999995, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": ", pages 5998-6008. Curran", "bbox": {"l": 189.19501, "t": 439.71648999999996, "r": 286.36389, "b": 447.73245, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "Associates, Inc., 2017. 5", "bbox": {"l": 70.031006, "t": 450.67548, "r": 158.9239, "b": 458.69144, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "[32]", "bbox": {"l": 50.112007, "t": 461.99948, "r": 65.910469, "b": 470.01544, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "Oriol Vinyals, Alexander Toshev, Samy Bengio, and Du-", "bbox": {"l": 68.281181, "t": 461.99948, "r": 286.35873, "b": 470.01544, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "mitru Erhan.", "bbox": {"l": 70.031006, "t": 472.9585, "r": 116.27969999999999, "b": 480.97446, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "Show and tell: A neural image caption gen-", "bbox": {"l": 122.48445, "t": 472.9585, "r": 286.36334, "b": 480.97446, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "erator. In", "bbox": {"l": 70.031006, "t": 483.91748, "r": 103.30532, "b": 491.93344, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "Proceedings of the IEEE Conference on Computer", "bbox": {"l": 105.51601, "t": 483.99817, "r": 286.35931, "b": 491.72723, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Vision and Pattern Recognition (CVPR)", "bbox": {"l": 70.031006, "t": 494.95715, "r": 212.51607, "b": 502.68622, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": ", June 2015. 2", "bbox": {"l": 212.51401, "t": 494.87646, "r": 263.55975, "b": 502.89243, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "[33]", "bbox": {"l": 50.112015, "t": 506.20047, "r": 65.682777, "b": 514.21643, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "Wenyuan Xue, Qingyong Li, and Dacheng Tao.", "bbox": {"l": 68.019325, "t": 506.20047, "r": 247.37280000000004, "b": 514.21643, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "Res2tim:", "bbox": {"l": 253.97208000000003, "t": 506.20047, "r": 286.3587, "b": 514.21643, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "reconstruct syntactic structures from table images. In", "bbox": {"l": 70.031013, "t": 517.15948, "r": 265.62408, "b": 525.17545, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "2019", "bbox": {"l": 268.42902, "t": 517.24017, "r": 286.36182, "b": 524.96924, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "International Conference on Document Analysis and Recog-", "bbox": {"l": 70.031021, "t": 528.19916, "r": 286.36337, "b": 535.92822, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "nition (ICDAR)", "bbox": {"l": 70.031021, "t": 539.15718, "r": 125.25507999999999, "b": 546.88622, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": ", pages 749-755. IEEE, 2019. 3", "bbox": {"l": 125.25402, "t": 539.07648, "r": 240.05083, "b": 547.09244, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "[34]", "bbox": {"l": 50.112022, "t": 550.40048, "r": 66.037048, "b": 558.41644, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "Wenyuan Xue, Baosheng Yu, Wen Wang, Dacheng Tao,", "bbox": {"l": 68.426765, "t": 550.40048, "r": 286.3587, "b": 558.41644, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "and Qingyong Li.", "bbox": {"l": 70.031021, "t": 561.35948, "r": 137.08176, "b": 569.37544, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "Tgrnet:", "bbox": {"l": 145.9854, "t": 561.35948, "r": 172.38248, "b": 569.37544, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "A table graph reconstruction", "bbox": {"l": 178.7038, "t": 561.35948, "r": 286.36337, "b": 569.37544, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "network for table structure recognition.", "bbox": {"l": 70.031021, "t": 572.31848, "r": 221.00723, "b": 580.33444, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "arXiv preprint", "bbox": {"l": 232.54300999999998, "t": 572.39919, "r": 286.35938, "b": 580.12822, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "arXiv:2106.10598", "bbox": {"l": 70.031021, "t": 583.35818, "r": 135.53058, "b": 591.08722, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": ", 2021. 3", "bbox": {"l": 135.53003, "t": 583.27748, "r": 167.89876, "b": 591.29344, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "[35]", "bbox": {"l": 50.11203, "t": 594.60149, "r": 65.23661, "b": 602.61745, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "Quanzeng You, Hailin Jin, Zhaowen Wang, Chen Fang, and", "bbox": {"l": 67.506203, "t": 594.60149, "r": 286.3587, "b": 602.61745, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Jiebo Luo.", "bbox": {"l": 70.031029, "t": 605.56049, "r": 109.1066, "b": 613.57645, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "Image captioning with semantic attention.", "bbox": {"l": 116.22592, "t": 605.56049, "r": 271.76605, "b": 613.57645, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "In", "bbox": {"l": 278.89435, "t": 605.56049, "r": 286.36337, "b": 613.57645, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "Proceedings of the IEEE conference on computer vision and", "bbox": {"l": 70.031029, "t": 616.60019, "r": 286.3634, "b": 624.32922, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "pattern recognition", "bbox": {"l": 70.031029, "t": 627.55919, "r": 139.09921, "b": 635.28822, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": ", pages 4651-4659, 2016. 4", "bbox": {"l": 139.09802, "t": 627.47849, "r": 238.95683, "b": 635.49445, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "[36]", "bbox": {"l": 50.112022, "t": 638.80249, "r": 65.203552, "b": 646.81845, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "Xinyi Zheng, Doug Burdick, Lucian Popa, Peter Zhong, and", "bbox": {"l": 67.468193, "t": 638.80249, "r": 286.35873, "b": 646.81845, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "Nancy Xin Ru Wang. Global table extractor (gte): A frame-", "bbox": {"l": 70.031021, "t": 649.7605, "r": 286.36337, "b": 657.77646, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "work for joint table identification and cell structure recogni-", "bbox": {"l": 70.031021, "t": 660.7195, "r": 286.36334, "b": 668.73547, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "tion using visual context.", "bbox": {"l": 70.031021, "t": 671.6785, "r": 158.45766, "b": 679.69447, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "Winter Conference for Applications", "bbox": {"l": 160.52802, "t": 671.7592, "r": 286.36249, "b": 679.48824, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "in Computer Vision (WACV)", "bbox": {"l": 70.031013, "t": 682.7182, "r": 171.42305, "b": 690.44724, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": ", 2021. 2, 3", "bbox": {"l": 171.42201, "t": 682.6375, "r": 212.75713, "b": 690.65347, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "[37]", "bbox": {"l": 50.112015, "t": 693.961502, "r": 66.506706, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "Xu", "bbox": {"l": 68.966896, "t": 693.961502, "r": 80.992294, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "Zhong,", "bbox": {"l": 89.062057, "t": 693.961502, "r": 114.71492999999998, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "Elaheh", "bbox": {"l": 124.24621000000002, "t": 693.961502, "r": 149.1459, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "ShafieiBavani,", "bbox": {"l": 157.22462, "t": 693.961502, "r": 209.37321, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "and", "bbox": {"l": 218.9045, "t": 693.961502, "r": 231.85196999999997, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "Antonio", "bbox": {"l": 239.93069, "t": 693.961502, "r": 269.32254, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "Ji-", "bbox": {"l": 277.3923, "t": 693.961502, "r": 286.3587, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "meno Yepes. Image-based table recognition: Data, model,", "bbox": {"l": 70.031013, "t": 704.920502, "r": 286.36334, "b": 712.936462, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "and evaluation. In Andrea Vedaldi, Horst Bischof, Thomas", "bbox": {"l": 328.78101, "t": 75.88347999999996, "r": 545.11346, "b": 83.89948000000015, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "Brox, and Jan-Michael Frahm, editors,", "bbox": {"l": 328.78101, "t": 86.84149000000002, "r": 472.30618, "b": 94.85748000000001, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "Computer Vision -", "bbox": {"l": 475.88501, "t": 86.92218000000003, "r": 545.11456, "b": 94.65125, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "ECCV 2020", "bbox": {"l": 328.78101, "t": 97.88116000000002, "r": 371.92734, "b": 105.61023, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": ", pages 564-580, Cham, 2020. Springer Interna-", "bbox": {"l": 371.92599, "t": 97.80048, "r": 545.11206, "b": 105.81646999999987, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "tional Publishing. 2, 3, 7", "bbox": {"l": 328.78101, "t": 108.75945999999999, "r": 417.70087, "b": 116.77544999999998, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "[38]", "bbox": {"l": 308.862, "t": 120.71447999999998, "r": 324.33197, "b": 128.73046999999997, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Xu Zhong, Jianbin Tang, and Antonio Jimeno Yepes. Pub-", "bbox": {"l": 326.65341, "t": 120.71447999999998, "r": 545.10876, "b": 128.73046999999997, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "laynet: Largest dataset ever for document layout analysis. In", "bbox": {"l": 328.78101, "t": 131.67345999999998, "r": 545.11334, "b": 139.68944999999997, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "2019 International Conference on Document Analysis and", "bbox": {"l": 328.78101, "t": 142.71312999999998, "r": 545.11328, "b": 150.44219999999996, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "Recognition (ICDAR)", "bbox": {"l": 328.78101, "t": 153.67211999999995, "r": 406.32245, "b": 161.40117999999995, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": ", pages 1015-1022, 2019. 1", "bbox": {"l": 406.32202, "t": 153.59142999999995, "r": 506.18085, "b": 161.60742000000005, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "10", "bbox": {"l": 292.63, "t": 734.1329920000001, "r": 302.59259, "b": 743.039555, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 15, "label": "text", "bbox": {"l": 70.030998, "t": 75.88378999999998, "r": 286.36176, "b": 94.85875999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.6886764168739319, "cells": [{"id": 0, "text": "Computer Vision and Pattern Recognition", "bbox": {"l": 70.030998, "t": 75.96447999999998, "r": 223.58061, "b": 83.69353999999998, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": ", pages 658-666,", "bbox": {"l": 223.57901, "t": 75.88378999999998, "r": 286.36176, "b": 83.89977999999996, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "2019. 6", "bbox": {"l": 70.031006, "t": 86.84276999999997, "r": 97.916512, "b": 94.85875999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "list_item", "bbox": {"l": 50.112007, "t": 98.16576999999995, "r": 286.36578, "b": 160.97668, "coord_origin": "TOPLEFT"}, "confidence": 0.7723011374473572, "cells": [{"id": 3, "text": "[26]", "bbox": {"l": 50.112007, "t": 98.16576999999995, "r": 65.534088, "b": 106.18176000000005, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Sebastian Schreiber, Stefan Agne, Ivo Wolf, Andreas Den-", "bbox": {"l": 67.84832, "t": 98.16576999999995, "r": 286.35867, "b": 106.18176000000005, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "gel, and Sheraz Ahmed. Deepdesrt: Deep learning for detec-", "bbox": {"l": 70.031006, "t": 109.12476000000004, "r": 286.36331, "b": 117.14075000000003, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "tion and structure recognition of tables in document images.", "bbox": {"l": 70.031006, "t": 120.08374000000003, "r": 286.36334, "b": 128.0997299999999, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "In", "bbox": {"l": 70.031006, "t": 131.04272000000003, "r": 77.500015, "b": 139.05872, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "2017 14th IAPR International Conference on Document", "bbox": {"l": 80.560005, "t": 131.12341000000004, "r": 286.36578, "b": 138.85248, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Analysis and Recognition (ICDAR)", "bbox": {"l": 70.031006, "t": 142.0824, "r": 195.22885, "b": 149.81146, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": ", volume 01, pages 1162-", "bbox": {"l": 195.231, "t": 142.00171, "r": 286.36548, "b": 150.0177, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "1167, 2017. 1", "bbox": {"l": 70.031006, "t": 152.96069, "r": 120.33251, "b": 160.97668, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "list_item", "bbox": {"l": 50.112007, "t": 164.28467, "r": 286.36337, "b": 227.0946, "coord_origin": "TOPLEFT"}, "confidence": 0.8580600619316101, "cells": [{"id": 12, "text": "[27]", "bbox": {"l": 50.112007, "t": 164.28467, "r": 65.534088, "b": 172.30066, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Sebastian Schreiber, Stefan Agne, Ivo Wolf, Andreas Den-", "bbox": {"l": 67.84832, "t": 164.28467, "r": 286.35867, "b": 172.30066, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "gel, and Sheraz Ahmed. Deepdesrt: Deep learning for de-", "bbox": {"l": 70.031006, "t": 175.24365, "r": 286.36337, "b": 183.25964, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "tection and structure recognition of tables in document im-", "bbox": {"l": 70.031006, "t": 186.20263999999997, "r": 286.36334, "b": 194.21862999999996, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "ages. In", "bbox": {"l": 70.031006, "t": 197.16161999999997, "r": 101.33271, "b": 205.17760999999996, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "2017 14th IAPR international conference on doc-", "bbox": {"l": 104.33101, "t": 197.24230999999997, "r": 286.35791, "b": 204.97136999999998, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "ument analysis and recognition (ICDAR)", "bbox": {"l": 70.031006, "t": 208.20032000000003, "r": 220.48719999999997, "b": 215.92938000000004, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": ", volume 1, pages", "bbox": {"l": 220.48401000000004, "t": 208.11963000000003, "r": 286.36017, "b": 216.13562000000002, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "1162-1167. IEEE, 2017. 3", "bbox": {"l": 70.031006, "t": 219.07861000000003, "r": 166.65294, "b": 227.0946, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "list_item", "bbox": {"l": 50.112007, "t": 230.40259000000003, "r": 286.36578, "b": 271.29553, "coord_origin": "TOPLEFT"}, "confidence": 0.8512731194496155, "cells": [{"id": 21, "text": "[28]", "bbox": {"l": 50.112007, "t": 230.40259000000003, "r": 65.650383, "b": 238.41858000000002, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "Faisal Shafait and Ray Smith. Table detection in heteroge-", "bbox": {"l": 67.982063, "t": 230.40259000000003, "r": 286.3587, "b": 238.41858000000002, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "neous documents. In", "bbox": {"l": 70.031006, "t": 241.36157000000003, "r": 147.16895, "b": 249.37756000000002, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "Proceedings of the 9th IAPR Interna-", "bbox": {"l": 149.93301, "t": 241.44226000000003, "r": 286.36578, "b": 249.17133, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "tional Workshop on Document Analysis Systems", "bbox": {"l": 70.031013, "t": 252.40125, "r": 244.6875, "b": 260.13031, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": ", pages 65-", "bbox": {"l": 244.69101, "t": 252.32056, "r": 286.35791, "b": 260.33655, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "72, 2010. 2", "bbox": {"l": 70.031006, "t": 263.27954, "r": 111.36611, "b": 271.29553, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "list_item", "bbox": {"l": 50.112007, "t": 274.60357999999997, "r": 286.36627, "b": 326.4545, "coord_origin": "TOPLEFT"}, "confidence": 0.8494512438774109, "cells": [{"id": 28, "text": "[29]", "bbox": {"l": 50.112007, "t": 274.60357999999997, "r": 66.023834, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Shoaib", "bbox": {"l": 68.411568, "t": 274.60357999999997, "r": 94.944016, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Ahmed", "bbox": {"l": 100.8708, "t": 274.60357999999997, "r": 127.26788000000002, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Siddiqui,", "bbox": {"l": 133.19467, "t": 274.60357999999997, "r": 165.83237, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Imran", "bbox": {"l": 172.68269, "t": 274.60357999999997, "r": 194.09445, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "Ali", "bbox": {"l": 200.02124, "t": 274.60357999999997, "r": 211.4803, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Fateh,", "bbox": {"l": 217.40708999999998, "t": 274.60357999999997, "r": 239.43755, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "Syed", "bbox": {"l": 246.28787000000003, "t": 274.60357999999997, "r": 264.22067, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Tah-", "bbox": {"l": 270.14746, "t": 274.60357999999997, "r": 286.35873, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "seen Raza Rizvi, Andreas Dengel, and Sheraz Ahmed.", "bbox": {"l": 70.031006, "t": 285.56256, "r": 286.36331, "b": 293.57852, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "Deeptabstr: Deep learning based table structure recognition.", "bbox": {"l": 70.031006, "t": 296.52155, "r": 286.36331, "b": 304.53751, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "In", "bbox": {"l": 70.031006, "t": 307.48053, "r": 77.500015, "b": 315.49649, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "2019 International Conference on Document Analysis and", "bbox": {"l": 79.350006, "t": 307.56122, "r": 286.36627, "b": 315.29028, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Recognition (ICDAR)", "bbox": {"l": 70.031006, "t": 318.51923, "r": 147.57243, "b": 326.24829, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": ", pages 1403-1409. IEEE, 2019. 3", "bbox": {"l": 147.57201, "t": 318.43854, "r": 271.33521, "b": 326.4545, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "list_item", "bbox": {"l": 50.112007, "t": 329.76254, "r": 286.36334, "b": 381.61447, "coord_origin": "TOPLEFT"}, "confidence": 0.8567671179771423, "cells": [{"id": 43, "text": "[30]", "bbox": {"l": 50.112007, "t": 329.76254, "r": 65.366135, "b": 337.7785, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "Peter W J Staar, Michele Dolfi, Christoph Auer, and Costas", "bbox": {"l": 67.655159, "t": 329.76254, "r": 286.3587, "b": 337.7785, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Bekas. Corpus conversion service: A machine learning plat-", "bbox": {"l": 70.031006, "t": 340.72156000000007, "r": 286.36334, "b": 348.7375200000001, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "form to ingest documents at scale.", "bbox": {"l": 70.031006, "t": 351.68054, "r": 198.82439, "b": 359.6965, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "In", "bbox": {"l": 206.06027, "t": 351.68054, "r": 213.52928, "b": 359.6965, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Proceedings of the", "bbox": {"l": 217.02101, "t": 351.76123, "r": 286.35815, "b": 359.4903, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "24th ACM SIGKDD", "bbox": {"l": 70.031006, "t": 362.72021, "r": 143.08028, "b": 370.44928, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": ", KDD \u201918, pages 774-782, New York,", "bbox": {"l": 143.078, "t": 362.63953000000004, "r": 286.36111, "b": 370.65549000000004, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "NY, USA, 2018. ACM. 1", "bbox": {"l": 70.031006, "t": 373.59851, "r": 161.15652, "b": 381.61447, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "list_item", "bbox": {"l": 50.112007, "t": 384.92252, "r": 286.36389, "b": 458.69144, "coord_origin": "TOPLEFT"}, "confidence": 0.8832162618637085, "cells": [{"id": 52, "text": "[31]", "bbox": {"l": 50.112007, "t": 384.92252, "r": 65.140724, "b": 392.93848, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Ashish Vaswani, Noam Shazeer, Niki Parmar, Jakob Uszko-", "bbox": {"l": 67.395927, "t": 384.92252, "r": 286.35876, "b": 392.93848, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "reit, Llion Jones, Aidan N Gomez, \u0141 ukasz Kaiser, and Il-", "bbox": {"l": 70.031006, "t": 395.88153, "r": 286.36337, "b": 403.89749, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "lia Polosukhin.", "bbox": {"l": 70.031006, "t": 406.84052, "r": 125.47024999999998, "b": 414.85648, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Attention is all you need.", "bbox": {"l": 133.90764, "t": 406.84052, "r": 230.83444, "b": 414.85648, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "In I. Guyon,", "bbox": {"l": 239.27182, "t": 406.84052, "r": 286.36334, "b": 414.85648, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "U.", "bbox": {"l": 70.031006, "t": 417.7995, "r": 78.958366, "b": 425.81546, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "V. Luxburg, S. Bengio, H. Wallach, R. Fergus, S. Vish-", "bbox": {"l": 81.254494, "t": 417.7995, "r": 286.36334, "b": 425.81546, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "wanathan, and R. Garnett, editors,", "bbox": {"l": 70.031006, "t": 428.75751, "r": 196.7621, "b": 436.7734699999999, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "Advances in Neural In-", "bbox": {"l": 200.20201, "t": 428.8381999999999, "r": 286.36017, "b": 436.56726, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "formation Processing Systems 30", "bbox": {"l": 70.031006, "t": 439.79717999999997, "r": 189.19447, "b": 447.52624999999995, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": ", pages 5998-6008. Curran", "bbox": {"l": 189.19501, "t": 439.71648999999996, "r": 286.36389, "b": 447.73245, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "Associates, Inc., 2017. 5", "bbox": {"l": 70.031006, "t": 450.67548, "r": 158.9239, "b": 458.69144, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "list_item", "bbox": {"l": 50.112007, "t": 461.99948, "r": 286.36334, "b": 502.89243, "coord_origin": "TOPLEFT"}, "confidence": 0.8431925177574158, "cells": [{"id": 65, "text": "[32]", "bbox": {"l": 50.112007, "t": 461.99948, "r": 65.910469, "b": 470.01544, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "Oriol Vinyals, Alexander Toshev, Samy Bengio, and Du-", "bbox": {"l": 68.281181, "t": 461.99948, "r": 286.35873, "b": 470.01544, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "mitru Erhan.", "bbox": {"l": 70.031006, "t": 472.9585, "r": 116.27969999999999, "b": 480.97446, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "Show and tell: A neural image caption gen-", "bbox": {"l": 122.48445, "t": 472.9585, "r": 286.36334, "b": 480.97446, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "erator. In", "bbox": {"l": 70.031006, "t": 483.91748, "r": 103.30532, "b": 491.93344, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "Proceedings of the IEEE Conference on Computer", "bbox": {"l": 105.51601, "t": 483.99817, "r": 286.35931, "b": 491.72723, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Vision and Pattern Recognition (CVPR)", "bbox": {"l": 70.031006, "t": 494.95715, "r": 212.51607, "b": 502.68622, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": ", June 2015. 2", "bbox": {"l": 212.51401, "t": 494.87646, "r": 263.55975, "b": 502.89243, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "list_item", "bbox": {"l": 50.112015, "t": 506.20047, "r": 286.36337, "b": 547.09244, "coord_origin": "TOPLEFT"}, "confidence": 0.8405635952949524, "cells": [{"id": 73, "text": "[33]", "bbox": {"l": 50.112015, "t": 506.20047, "r": 65.682777, "b": 514.21643, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "Wenyuan Xue, Qingyong Li, and Dacheng Tao.", "bbox": {"l": 68.019325, "t": 506.20047, "r": 247.37280000000004, "b": 514.21643, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "Res2tim:", "bbox": {"l": 253.97208000000003, "t": 506.20047, "r": 286.3587, "b": 514.21643, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "reconstruct syntactic structures from table images. In", "bbox": {"l": 70.031013, "t": 517.15948, "r": 265.62408, "b": 525.17545, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "2019", "bbox": {"l": 268.42902, "t": 517.24017, "r": 286.36182, "b": 524.96924, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "International Conference on Document Analysis and Recog-", "bbox": {"l": 70.031021, "t": 528.19916, "r": 286.36337, "b": 535.92822, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "nition (ICDAR)", "bbox": {"l": 70.031021, "t": 539.15718, "r": 125.25507999999999, "b": 546.88622, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": ", pages 749-755. IEEE, 2019. 3", "bbox": {"l": 125.25402, "t": 539.07648, "r": 240.05083, "b": 547.09244, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "list_item", "bbox": {"l": 50.112022, "t": 550.40048, "r": 286.36337, "b": 591.29344, "coord_origin": "TOPLEFT"}, "confidence": 0.8241521716117859, "cells": [{"id": 81, "text": "[34]", "bbox": {"l": 50.112022, "t": 550.40048, "r": 66.037048, "b": 558.41644, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "Wenyuan Xue, Baosheng Yu, Wen Wang, Dacheng Tao,", "bbox": {"l": 68.426765, "t": 550.40048, "r": 286.3587, "b": 558.41644, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "and Qingyong Li.", "bbox": {"l": 70.031021, "t": 561.35948, "r": 137.08176, "b": 569.37544, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "Tgrnet:", "bbox": {"l": 145.9854, "t": 561.35948, "r": 172.38248, "b": 569.37544, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "A table graph reconstruction", "bbox": {"l": 178.7038, "t": 561.35948, "r": 286.36337, "b": 569.37544, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "network for table structure recognition.", "bbox": {"l": 70.031021, "t": 572.31848, "r": 221.00723, "b": 580.33444, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "arXiv preprint", "bbox": {"l": 232.54300999999998, "t": 572.39919, "r": 286.35938, "b": 580.12822, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "arXiv:2106.10598", "bbox": {"l": 70.031021, "t": 583.35818, "r": 135.53058, "b": 591.08722, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": ", 2021. 3", "bbox": {"l": 135.53003, "t": 583.27748, "r": 167.89876, "b": 591.29344, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "list_item", "bbox": {"l": 50.11203, "t": 594.60149, "r": 286.3634, "b": 635.49445, "coord_origin": "TOPLEFT"}, "confidence": 0.8360886573791504, "cells": [{"id": 90, "text": "[35]", "bbox": {"l": 50.11203, "t": 594.60149, "r": 65.23661, "b": 602.61745, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "Quanzeng You, Hailin Jin, Zhaowen Wang, Chen Fang, and", "bbox": {"l": 67.506203, "t": 594.60149, "r": 286.3587, "b": 602.61745, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Jiebo Luo.", "bbox": {"l": 70.031029, "t": 605.56049, "r": 109.1066, "b": 613.57645, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "Image captioning with semantic attention.", "bbox": {"l": 116.22592, "t": 605.56049, "r": 271.76605, "b": 613.57645, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "In", "bbox": {"l": 278.89435, "t": 605.56049, "r": 286.36337, "b": 613.57645, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "Proceedings of the IEEE conference on computer vision and", "bbox": {"l": 70.031029, "t": 616.60019, "r": 286.3634, "b": 624.32922, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "pattern recognition", "bbox": {"l": 70.031029, "t": 627.55919, "r": 139.09921, "b": 635.28822, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": ", pages 4651-4659, 2016. 4", "bbox": {"l": 139.09802, "t": 627.47849, "r": 238.95683, "b": 635.49445, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "list_item", "bbox": {"l": 50.112022, "t": 638.80249, "r": 286.36337, "b": 690.65347, "coord_origin": "TOPLEFT"}, "confidence": 0.8079474568367004, "cells": [{"id": 98, "text": "[36]", "bbox": {"l": 50.112022, "t": 638.80249, "r": 65.203552, "b": 646.81845, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "Xinyi Zheng, Doug Burdick, Lucian Popa, Peter Zhong, and", "bbox": {"l": 67.468193, "t": 638.80249, "r": 286.35873, "b": 646.81845, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "Nancy Xin Ru Wang. Global table extractor (gte): A frame-", "bbox": {"l": 70.031021, "t": 649.7605, "r": 286.36337, "b": 657.77646, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "work for joint table identification and cell structure recogni-", "bbox": {"l": 70.031021, "t": 660.7195, "r": 286.36334, "b": 668.73547, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "tion using visual context.", "bbox": {"l": 70.031021, "t": 671.6785, "r": 158.45766, "b": 679.69447, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "Winter Conference for Applications", "bbox": {"l": 160.52802, "t": 671.7592, "r": 286.36249, "b": 679.48824, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "in Computer Vision (WACV)", "bbox": {"l": 70.031013, "t": 682.7182, "r": 171.42305, "b": 690.44724, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": ", 2021. 2, 3", "bbox": {"l": 171.42201, "t": 682.6375, "r": 212.75713, "b": 690.65347, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "list_item", "bbox": {"l": 50.112015, "t": 693.961502, "r": 286.36334, "b": 712.936462, "coord_origin": "TOPLEFT"}, "confidence": 0.8385783433914185, "cells": [{"id": 106, "text": "[37]", "bbox": {"l": 50.112015, "t": 693.961502, "r": 66.506706, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "Xu", "bbox": {"l": 68.966896, "t": 693.961502, "r": 80.992294, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "Zhong,", "bbox": {"l": 89.062057, "t": 693.961502, "r": 114.71492999999998, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "Elaheh", "bbox": {"l": 124.24621000000002, "t": 693.961502, "r": 149.1459, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "ShafieiBavani,", "bbox": {"l": 157.22462, "t": 693.961502, "r": 209.37321, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "and", "bbox": {"l": 218.9045, "t": 693.961502, "r": 231.85196999999997, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "Antonio", "bbox": {"l": 239.93069, "t": 693.961502, "r": 269.32254, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "Ji-", "bbox": {"l": 277.3923, "t": 693.961502, "r": 286.3587, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "meno Yepes. Image-based table recognition: Data, model,", "bbox": {"l": 70.031013, "t": 704.920502, "r": 286.36334, "b": 712.936462, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "list_item", "bbox": {"l": 328.78101, "t": 75.88347999999996, "r": 545.11456, "b": 116.77544999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.7556979060173035, "cells": [{"id": 115, "text": "and evaluation. In Andrea Vedaldi, Horst Bischof, Thomas", "bbox": {"l": 328.78101, "t": 75.88347999999996, "r": 545.11346, "b": 83.89948000000015, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "Brox, and Jan-Michael Frahm, editors,", "bbox": {"l": 328.78101, "t": 86.84149000000002, "r": 472.30618, "b": 94.85748000000001, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "Computer Vision -", "bbox": {"l": 475.88501, "t": 86.92218000000003, "r": 545.11456, "b": 94.65125, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "ECCV 2020", "bbox": {"l": 328.78101, "t": 97.88116000000002, "r": 371.92734, "b": 105.61023, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": ", pages 564-580, Cham, 2020. Springer Interna-", "bbox": {"l": 371.92599, "t": 97.80048, "r": 545.11206, "b": 105.81646999999987, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "tional Publishing. 2, 3, 7", "bbox": {"l": 328.78101, "t": 108.75945999999999, "r": 417.70087, "b": 116.77544999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "list_item", "bbox": {"l": 308.862, "t": 120.71447999999998, "r": 545.11334, "b": 161.60742000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.8375797271728516, "cells": [{"id": 121, "text": "[38]", "bbox": {"l": 308.862, "t": 120.71447999999998, "r": 324.33197, "b": 128.73046999999997, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Xu Zhong, Jianbin Tang, and Antonio Jimeno Yepes. Pub-", "bbox": {"l": 326.65341, "t": 120.71447999999998, "r": 545.10876, "b": 128.73046999999997, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "laynet: Largest dataset ever for document layout analysis. In", "bbox": {"l": 328.78101, "t": 131.67345999999998, "r": 545.11334, "b": 139.68944999999997, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "2019 International Conference on Document Analysis and", "bbox": {"l": 328.78101, "t": 142.71312999999998, "r": 545.11328, "b": 150.44219999999996, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "Recognition (ICDAR)", "bbox": {"l": 328.78101, "t": 153.67211999999995, "r": 406.32245, "b": 161.40117999999995, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": ", pages 1015-1022, 2019. 1", "bbox": {"l": 406.32202, "t": 153.59142999999995, "r": 506.18085, "b": 161.60742000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "page_footer", "bbox": {"l": 292.63, "t": 734.1329920000001, "r": 302.59259, "b": 743.039555, "coord_origin": "TOPLEFT"}, "confidence": 0.9069584012031555, "cells": [{"id": 127, "text": "10", "bbox": {"l": 292.63, "t": 734.1329920000001, "r": 302.59259, "b": 743.039555, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "text", "id": 15, "page_no": 9, "cluster": {"id": 15, "label": "text", "bbox": {"l": 70.030998, "t": 75.88378999999998, "r": 286.36176, "b": 94.85875999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.6886764168739319, "cells": [{"id": 0, "text": "Computer Vision and Pattern Recognition", "bbox": {"l": 70.030998, "t": 75.96447999999998, "r": 223.58061, "b": 83.69353999999998, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": ", pages 658-666,", "bbox": {"l": 223.57901, "t": 75.88378999999998, "r": 286.36176, "b": 83.89977999999996, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "2019. 6", "bbox": {"l": 70.031006, "t": 86.84276999999997, "r": 97.916512, "b": 94.85875999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Computer Vision and Pattern Recognition , pages 658-666, 2019. 6"}, {"label": "list_item", "id": 13, "page_no": 9, "cluster": {"id": 13, "label": "list_item", "bbox": {"l": 50.112007, "t": 98.16576999999995, "r": 286.36578, "b": 160.97668, "coord_origin": "TOPLEFT"}, "confidence": 0.7723011374473572, "cells": [{"id": 3, "text": "[26]", "bbox": {"l": 50.112007, "t": 98.16576999999995, "r": 65.534088, "b": 106.18176000000005, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Sebastian Schreiber, Stefan Agne, Ivo Wolf, Andreas Den-", "bbox": {"l": 67.84832, "t": 98.16576999999995, "r": 286.35867, "b": 106.18176000000005, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "gel, and Sheraz Ahmed. Deepdesrt: Deep learning for detec-", "bbox": {"l": 70.031006, "t": 109.12476000000004, "r": 286.36331, "b": 117.14075000000003, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "tion and structure recognition of tables in document images.", "bbox": {"l": 70.031006, "t": 120.08374000000003, "r": 286.36334, "b": 128.0997299999999, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "In", "bbox": {"l": 70.031006, "t": 131.04272000000003, "r": 77.500015, "b": 139.05872, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "2017 14th IAPR International Conference on Document", "bbox": {"l": 80.560005, "t": 131.12341000000004, "r": 286.36578, "b": 138.85248, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Analysis and Recognition (ICDAR)", "bbox": {"l": 70.031006, "t": 142.0824, "r": 195.22885, "b": 149.81146, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": ", volume 01, pages 1162-", "bbox": {"l": 195.231, "t": 142.00171, "r": 286.36548, "b": 150.0177, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "1167, 2017. 1", "bbox": {"l": 70.031006, "t": 152.96069, "r": 120.33251, "b": 160.97668, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[26] Sebastian Schreiber, Stefan Agne, Ivo Wolf, Andreas Dengel, and Sheraz Ahmed. Deepdesrt: Deep learning for detection and structure recognition of tables in document images. In 2017 14th IAPR International Conference on Document Analysis and Recognition (ICDAR) , volume 01, pages 11621167, 2017. 1"}, {"label": "list_item", "id": 2, "page_no": 9, "cluster": {"id": 2, "label": "list_item", "bbox": {"l": 50.112007, "t": 164.28467, "r": 286.36337, "b": 227.0946, "coord_origin": "TOPLEFT"}, "confidence": 0.8580600619316101, "cells": [{"id": 12, "text": "[27]", "bbox": {"l": 50.112007, "t": 164.28467, "r": 65.534088, "b": 172.30066, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Sebastian Schreiber, Stefan Agne, Ivo Wolf, Andreas Den-", "bbox": {"l": 67.84832, "t": 164.28467, "r": 286.35867, "b": 172.30066, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "gel, and Sheraz Ahmed. Deepdesrt: Deep learning for de-", "bbox": {"l": 70.031006, "t": 175.24365, "r": 286.36337, "b": 183.25964, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "tection and structure recognition of tables in document im-", "bbox": {"l": 70.031006, "t": 186.20263999999997, "r": 286.36334, "b": 194.21862999999996, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "ages. In", "bbox": {"l": 70.031006, "t": 197.16161999999997, "r": 101.33271, "b": 205.17760999999996, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "2017 14th IAPR international conference on doc-", "bbox": {"l": 104.33101, "t": 197.24230999999997, "r": 286.35791, "b": 204.97136999999998, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "ument analysis and recognition (ICDAR)", "bbox": {"l": 70.031006, "t": 208.20032000000003, "r": 220.48719999999997, "b": 215.92938000000004, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": ", volume 1, pages", "bbox": {"l": 220.48401000000004, "t": 208.11963000000003, "r": 286.36017, "b": 216.13562000000002, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "1162-1167. IEEE, 2017. 3", "bbox": {"l": 70.031006, "t": 219.07861000000003, "r": 166.65294, "b": 227.0946, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[27] Sebastian Schreiber, Stefan Agne, Ivo Wolf, Andreas Dengel, and Sheraz Ahmed. Deepdesrt: Deep learning for detection and structure recognition of tables in document images. In 2017 14th IAPR international conference on document analysis and recognition (ICDAR) , volume 1, pages 1162-1167. IEEE, 2017. 3"}, {"label": "list_item", "id": 4, "page_no": 9, "cluster": {"id": 4, "label": "list_item", "bbox": {"l": 50.112007, "t": 230.40259000000003, "r": 286.36578, "b": 271.29553, "coord_origin": "TOPLEFT"}, "confidence": 0.8512731194496155, "cells": [{"id": 21, "text": "[28]", "bbox": {"l": 50.112007, "t": 230.40259000000003, "r": 65.650383, "b": 238.41858000000002, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "Faisal Shafait and Ray Smith. Table detection in heteroge-", "bbox": {"l": 67.982063, "t": 230.40259000000003, "r": 286.3587, "b": 238.41858000000002, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "neous documents. In", "bbox": {"l": 70.031006, "t": 241.36157000000003, "r": 147.16895, "b": 249.37756000000002, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "Proceedings of the 9th IAPR Interna-", "bbox": {"l": 149.93301, "t": 241.44226000000003, "r": 286.36578, "b": 249.17133, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "tional Workshop on Document Analysis Systems", "bbox": {"l": 70.031013, "t": 252.40125, "r": 244.6875, "b": 260.13031, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": ", pages 65-", "bbox": {"l": 244.69101, "t": 252.32056, "r": 286.35791, "b": 260.33655, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "72, 2010. 2", "bbox": {"l": 70.031006, "t": 263.27954, "r": 111.36611, "b": 271.29553, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[28] Faisal Shafait and Ray Smith. Table detection in heterogeneous documents. In Proceedings of the 9th IAPR International Workshop on Document Analysis Systems , pages 6572, 2010. 2"}, {"label": "list_item", "id": 5, "page_no": 9, "cluster": {"id": 5, "label": "list_item", "bbox": {"l": 50.112007, "t": 274.60357999999997, "r": 286.36627, "b": 326.4545, "coord_origin": "TOPLEFT"}, "confidence": 0.8494512438774109, "cells": [{"id": 28, "text": "[29]", "bbox": {"l": 50.112007, "t": 274.60357999999997, "r": 66.023834, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Shoaib", "bbox": {"l": 68.411568, "t": 274.60357999999997, "r": 94.944016, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Ahmed", "bbox": {"l": 100.8708, "t": 274.60357999999997, "r": 127.26788000000002, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Siddiqui,", "bbox": {"l": 133.19467, "t": 274.60357999999997, "r": 165.83237, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Imran", "bbox": {"l": 172.68269, "t": 274.60357999999997, "r": 194.09445, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "Ali", "bbox": {"l": 200.02124, "t": 274.60357999999997, "r": 211.4803, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Fateh,", "bbox": {"l": 217.40708999999998, "t": 274.60357999999997, "r": 239.43755, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "Syed", "bbox": {"l": 246.28787000000003, "t": 274.60357999999997, "r": 264.22067, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Tah-", "bbox": {"l": 270.14746, "t": 274.60357999999997, "r": 286.35873, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "seen Raza Rizvi, Andreas Dengel, and Sheraz Ahmed.", "bbox": {"l": 70.031006, "t": 285.56256, "r": 286.36331, "b": 293.57852, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "Deeptabstr: Deep learning based table structure recognition.", "bbox": {"l": 70.031006, "t": 296.52155, "r": 286.36331, "b": 304.53751, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "In", "bbox": {"l": 70.031006, "t": 307.48053, "r": 77.500015, "b": 315.49649, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "2019 International Conference on Document Analysis and", "bbox": {"l": 79.350006, "t": 307.56122, "r": 286.36627, "b": 315.29028, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Recognition (ICDAR)", "bbox": {"l": 70.031006, "t": 318.51923, "r": 147.57243, "b": 326.24829, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": ", pages 1403-1409. IEEE, 2019. 3", "bbox": {"l": 147.57201, "t": 318.43854, "r": 271.33521, "b": 326.4545, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[29] Shoaib Ahmed Siddiqui, Imran Ali Fateh, Syed Tahseen Raza Rizvi, Andreas Dengel, and Sheraz Ahmed. Deeptabstr: Deep learning based table structure recognition. In 2019 International Conference on Document Analysis and Recognition (ICDAR) , pages 1403-1409. IEEE, 2019. 3"}, {"label": "list_item", "id": 3, "page_no": 9, "cluster": {"id": 3, "label": "list_item", "bbox": {"l": 50.112007, "t": 329.76254, "r": 286.36334, "b": 381.61447, "coord_origin": "TOPLEFT"}, "confidence": 0.8567671179771423, "cells": [{"id": 43, "text": "[30]", "bbox": {"l": 50.112007, "t": 329.76254, "r": 65.366135, "b": 337.7785, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "Peter W J Staar, Michele Dolfi, Christoph Auer, and Costas", "bbox": {"l": 67.655159, "t": 329.76254, "r": 286.3587, "b": 337.7785, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Bekas. Corpus conversion service: A machine learning plat-", "bbox": {"l": 70.031006, "t": 340.72156000000007, "r": 286.36334, "b": 348.7375200000001, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "form to ingest documents at scale.", "bbox": {"l": 70.031006, "t": 351.68054, "r": 198.82439, "b": 359.6965, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "In", "bbox": {"l": 206.06027, "t": 351.68054, "r": 213.52928, "b": 359.6965, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Proceedings of the", "bbox": {"l": 217.02101, "t": 351.76123, "r": 286.35815, "b": 359.4903, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "24th ACM SIGKDD", "bbox": {"l": 70.031006, "t": 362.72021, "r": 143.08028, "b": 370.44928, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": ", KDD \u201918, pages 774-782, New York,", "bbox": {"l": 143.078, "t": 362.63953000000004, "r": 286.36111, "b": 370.65549000000004, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "NY, USA, 2018. ACM. 1", "bbox": {"l": 70.031006, "t": 373.59851, "r": 161.15652, "b": 381.61447, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[30] Peter W J Staar, Michele Dolfi, Christoph Auer, and Costas Bekas. Corpus conversion service: A machine learning platform to ingest documents at scale. In Proceedings of the 24th ACM SIGKDD , KDD \u201918, pages 774-782, New York, NY, USA, 2018. ACM. 1"}, {"label": "list_item", "id": 1, "page_no": 9, "cluster": {"id": 1, "label": "list_item", "bbox": {"l": 50.112007, "t": 384.92252, "r": 286.36389, "b": 458.69144, "coord_origin": "TOPLEFT"}, "confidence": 0.8832162618637085, "cells": [{"id": 52, "text": "[31]", "bbox": {"l": 50.112007, "t": 384.92252, "r": 65.140724, "b": 392.93848, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Ashish Vaswani, Noam Shazeer, Niki Parmar, Jakob Uszko-", "bbox": {"l": 67.395927, "t": 384.92252, "r": 286.35876, "b": 392.93848, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "reit, Llion Jones, Aidan N Gomez, \u0141 ukasz Kaiser, and Il-", "bbox": {"l": 70.031006, "t": 395.88153, "r": 286.36337, "b": 403.89749, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "lia Polosukhin.", "bbox": {"l": 70.031006, "t": 406.84052, "r": 125.47024999999998, "b": 414.85648, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Attention is all you need.", "bbox": {"l": 133.90764, "t": 406.84052, "r": 230.83444, "b": 414.85648, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "In I. Guyon,", "bbox": {"l": 239.27182, "t": 406.84052, "r": 286.36334, "b": 414.85648, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "U.", "bbox": {"l": 70.031006, "t": 417.7995, "r": 78.958366, "b": 425.81546, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "V. Luxburg, S. Bengio, H. Wallach, R. Fergus, S. Vish-", "bbox": {"l": 81.254494, "t": 417.7995, "r": 286.36334, "b": 425.81546, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "wanathan, and R. Garnett, editors,", "bbox": {"l": 70.031006, "t": 428.75751, "r": 196.7621, "b": 436.7734699999999, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "Advances in Neural In-", "bbox": {"l": 200.20201, "t": 428.8381999999999, "r": 286.36017, "b": 436.56726, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "formation Processing Systems 30", "bbox": {"l": 70.031006, "t": 439.79717999999997, "r": 189.19447, "b": 447.52624999999995, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": ", pages 5998-6008. Curran", "bbox": {"l": 189.19501, "t": 439.71648999999996, "r": 286.36389, "b": 447.73245, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "Associates, Inc., 2017. 5", "bbox": {"l": 70.031006, "t": 450.67548, "r": 158.9239, "b": 458.69144, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[31] Ashish Vaswani, Noam Shazeer, Niki Parmar, Jakob Uszkoreit, Llion Jones, Aidan N Gomez, \u0141 ukasz Kaiser, and Illia Polosukhin. Attention is all you need. In I. Guyon, U. V. Luxburg, S. Bengio, H. Wallach, R. Fergus, S. Vishwanathan, and R. Garnett, editors, Advances in Neural Information Processing Systems 30 , pages 5998-6008. Curran Associates, Inc., 2017. 5"}, {"label": "list_item", "id": 6, "page_no": 9, "cluster": {"id": 6, "label": "list_item", "bbox": {"l": 50.112007, "t": 461.99948, "r": 286.36334, "b": 502.89243, "coord_origin": "TOPLEFT"}, "confidence": 0.8431925177574158, "cells": [{"id": 65, "text": "[32]", "bbox": {"l": 50.112007, "t": 461.99948, "r": 65.910469, "b": 470.01544, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "Oriol Vinyals, Alexander Toshev, Samy Bengio, and Du-", "bbox": {"l": 68.281181, "t": 461.99948, "r": 286.35873, "b": 470.01544, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "mitru Erhan.", "bbox": {"l": 70.031006, "t": 472.9585, "r": 116.27969999999999, "b": 480.97446, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "Show and tell: A neural image caption gen-", "bbox": {"l": 122.48445, "t": 472.9585, "r": 286.36334, "b": 480.97446, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "erator. In", "bbox": {"l": 70.031006, "t": 483.91748, "r": 103.30532, "b": 491.93344, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "Proceedings of the IEEE Conference on Computer", "bbox": {"l": 105.51601, "t": 483.99817, "r": 286.35931, "b": 491.72723, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Vision and Pattern Recognition (CVPR)", "bbox": {"l": 70.031006, "t": 494.95715, "r": 212.51607, "b": 502.68622, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": ", June 2015. 2", "bbox": {"l": 212.51401, "t": 494.87646, "r": 263.55975, "b": 502.89243, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[32] Oriol Vinyals, Alexander Toshev, Samy Bengio, and Dumitru Erhan. Show and tell: A neural image caption generator. In Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR) , June 2015. 2"}, {"label": "list_item", "id": 7, "page_no": 9, "cluster": {"id": 7, "label": "list_item", "bbox": {"l": 50.112015, "t": 506.20047, "r": 286.36337, "b": 547.09244, "coord_origin": "TOPLEFT"}, "confidence": 0.8405635952949524, "cells": [{"id": 73, "text": "[33]", "bbox": {"l": 50.112015, "t": 506.20047, "r": 65.682777, "b": 514.21643, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "Wenyuan Xue, Qingyong Li, and Dacheng Tao.", "bbox": {"l": 68.019325, "t": 506.20047, "r": 247.37280000000004, "b": 514.21643, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "Res2tim:", "bbox": {"l": 253.97208000000003, "t": 506.20047, "r": 286.3587, "b": 514.21643, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "reconstruct syntactic structures from table images. In", "bbox": {"l": 70.031013, "t": 517.15948, "r": 265.62408, "b": 525.17545, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "2019", "bbox": {"l": 268.42902, "t": 517.24017, "r": 286.36182, "b": 524.96924, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "International Conference on Document Analysis and Recog-", "bbox": {"l": 70.031021, "t": 528.19916, "r": 286.36337, "b": 535.92822, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "nition (ICDAR)", "bbox": {"l": 70.031021, "t": 539.15718, "r": 125.25507999999999, "b": 546.88622, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": ", pages 749-755. IEEE, 2019. 3", "bbox": {"l": 125.25402, "t": 539.07648, "r": 240.05083, "b": 547.09244, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[33] Wenyuan Xue, Qingyong Li, and Dacheng Tao. Res2tim: reconstruct syntactic structures from table images. In 2019 International Conference on Document Analysis and Recognition (ICDAR) , pages 749-755. IEEE, 2019. 3"}, {"label": "list_item", "id": 11, "page_no": 9, "cluster": {"id": 11, "label": "list_item", "bbox": {"l": 50.112022, "t": 550.40048, "r": 286.36337, "b": 591.29344, "coord_origin": "TOPLEFT"}, "confidence": 0.8241521716117859, "cells": [{"id": 81, "text": "[34]", "bbox": {"l": 50.112022, "t": 550.40048, "r": 66.037048, "b": 558.41644, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "Wenyuan Xue, Baosheng Yu, Wen Wang, Dacheng Tao,", "bbox": {"l": 68.426765, "t": 550.40048, "r": 286.3587, "b": 558.41644, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "and Qingyong Li.", "bbox": {"l": 70.031021, "t": 561.35948, "r": 137.08176, "b": 569.37544, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "Tgrnet:", "bbox": {"l": 145.9854, "t": 561.35948, "r": 172.38248, "b": 569.37544, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "A table graph reconstruction", "bbox": {"l": 178.7038, "t": 561.35948, "r": 286.36337, "b": 569.37544, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "network for table structure recognition.", "bbox": {"l": 70.031021, "t": 572.31848, "r": 221.00723, "b": 580.33444, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "arXiv preprint", "bbox": {"l": 232.54300999999998, "t": 572.39919, "r": 286.35938, "b": 580.12822, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "arXiv:2106.10598", "bbox": {"l": 70.031021, "t": 583.35818, "r": 135.53058, "b": 591.08722, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": ", 2021. 3", "bbox": {"l": 135.53003, "t": 583.27748, "r": 167.89876, "b": 591.29344, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[34] Wenyuan Xue, Baosheng Yu, Wen Wang, Dacheng Tao, and Qingyong Li. Tgrnet: A table graph reconstruction network for table structure recognition. arXiv preprint arXiv:2106.10598 , 2021. 3"}, {"label": "list_item", "id": 10, "page_no": 9, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 50.11203, "t": 594.60149, "r": 286.3634, "b": 635.49445, "coord_origin": "TOPLEFT"}, "confidence": 0.8360886573791504, "cells": [{"id": 90, "text": "[35]", "bbox": {"l": 50.11203, "t": 594.60149, "r": 65.23661, "b": 602.61745, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "Quanzeng You, Hailin Jin, Zhaowen Wang, Chen Fang, and", "bbox": {"l": 67.506203, "t": 594.60149, "r": 286.3587, "b": 602.61745, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Jiebo Luo.", "bbox": {"l": 70.031029, "t": 605.56049, "r": 109.1066, "b": 613.57645, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "Image captioning with semantic attention.", "bbox": {"l": 116.22592, "t": 605.56049, "r": 271.76605, "b": 613.57645, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "In", "bbox": {"l": 278.89435, "t": 605.56049, "r": 286.36337, "b": 613.57645, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "Proceedings of the IEEE conference on computer vision and", "bbox": {"l": 70.031029, "t": 616.60019, "r": 286.3634, "b": 624.32922, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "pattern recognition", "bbox": {"l": 70.031029, "t": 627.55919, "r": 139.09921, "b": 635.28822, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": ", pages 4651-4659, 2016. 4", "bbox": {"l": 139.09802, "t": 627.47849, "r": 238.95683, "b": 635.49445, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[35] Quanzeng You, Hailin Jin, Zhaowen Wang, Chen Fang, and Jiebo Luo. Image captioning with semantic attention. In Proceedings of the IEEE conference on computer vision and pattern recognition , pages 4651-4659, 2016. 4"}, {"label": "list_item", "id": 12, "page_no": 9, "cluster": {"id": 12, "label": "list_item", "bbox": {"l": 50.112022, "t": 638.80249, "r": 286.36337, "b": 690.65347, "coord_origin": "TOPLEFT"}, "confidence": 0.8079474568367004, "cells": [{"id": 98, "text": "[36]", "bbox": {"l": 50.112022, "t": 638.80249, "r": 65.203552, "b": 646.81845, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "Xinyi Zheng, Doug Burdick, Lucian Popa, Peter Zhong, and", "bbox": {"l": 67.468193, "t": 638.80249, "r": 286.35873, "b": 646.81845, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "Nancy Xin Ru Wang. Global table extractor (gte): A frame-", "bbox": {"l": 70.031021, "t": 649.7605, "r": 286.36337, "b": 657.77646, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "work for joint table identification and cell structure recogni-", "bbox": {"l": 70.031021, "t": 660.7195, "r": 286.36334, "b": 668.73547, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "tion using visual context.", "bbox": {"l": 70.031021, "t": 671.6785, "r": 158.45766, "b": 679.69447, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "Winter Conference for Applications", "bbox": {"l": 160.52802, "t": 671.7592, "r": 286.36249, "b": 679.48824, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "in Computer Vision (WACV)", "bbox": {"l": 70.031013, "t": 682.7182, "r": 171.42305, "b": 690.44724, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": ", 2021. 2, 3", "bbox": {"l": 171.42201, "t": 682.6375, "r": 212.75713, "b": 690.65347, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[36] Xinyi Zheng, Doug Burdick, Lucian Popa, Peter Zhong, and Nancy Xin Ru Wang. Global table extractor (gte): A framework for joint table identification and cell structure recognition using visual context. Winter Conference for Applications in Computer Vision (WACV) , 2021. 2, 3"}, {"label": "list_item", "id": 8, "page_no": 9, "cluster": {"id": 8, "label": "list_item", "bbox": {"l": 50.112015, "t": 693.961502, "r": 286.36334, "b": 712.936462, "coord_origin": "TOPLEFT"}, "confidence": 0.8385783433914185, "cells": [{"id": 106, "text": "[37]", "bbox": {"l": 50.112015, "t": 693.961502, "r": 66.506706, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "Xu", "bbox": {"l": 68.966896, "t": 693.961502, "r": 80.992294, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "Zhong,", "bbox": {"l": 89.062057, "t": 693.961502, "r": 114.71492999999998, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "Elaheh", "bbox": {"l": 124.24621000000002, "t": 693.961502, "r": 149.1459, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "ShafieiBavani,", "bbox": {"l": 157.22462, "t": 693.961502, "r": 209.37321, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "and", "bbox": {"l": 218.9045, "t": 693.961502, "r": 231.85196999999997, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "Antonio", "bbox": {"l": 239.93069, "t": 693.961502, "r": 269.32254, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "Ji-", "bbox": {"l": 277.3923, "t": 693.961502, "r": 286.3587, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "meno Yepes. Image-based table recognition: Data, model,", "bbox": {"l": 70.031013, "t": 704.920502, "r": 286.36334, "b": 712.936462, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[37] Xu Zhong, Elaheh ShafieiBavani, and Antonio Jimeno Yepes. Image-based table recognition: Data, model,"}, {"label": "list_item", "id": 14, "page_no": 9, "cluster": {"id": 14, "label": "list_item", "bbox": {"l": 328.78101, "t": 75.88347999999996, "r": 545.11456, "b": 116.77544999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.7556979060173035, "cells": [{"id": 115, "text": "and evaluation. In Andrea Vedaldi, Horst Bischof, Thomas", "bbox": {"l": 328.78101, "t": 75.88347999999996, "r": 545.11346, "b": 83.89948000000015, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "Brox, and Jan-Michael Frahm, editors,", "bbox": {"l": 328.78101, "t": 86.84149000000002, "r": 472.30618, "b": 94.85748000000001, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "Computer Vision -", "bbox": {"l": 475.88501, "t": 86.92218000000003, "r": 545.11456, "b": 94.65125, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "ECCV 2020", "bbox": {"l": 328.78101, "t": 97.88116000000002, "r": 371.92734, "b": 105.61023, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": ", pages 564-580, Cham, 2020. Springer Interna-", "bbox": {"l": 371.92599, "t": 97.80048, "r": 545.11206, "b": 105.81646999999987, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "tional Publishing. 2, 3, 7", "bbox": {"l": 328.78101, "t": 108.75945999999999, "r": 417.70087, "b": 116.77544999999998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "and evaluation. In Andrea Vedaldi, Horst Bischof, Thomas Brox, and Jan-Michael Frahm, editors, Computer Vision ECCV 2020 , pages 564-580, Cham, 2020. Springer International Publishing. 2, 3, 7"}, {"label": "list_item", "id": 9, "page_no": 9, "cluster": {"id": 9, "label": "list_item", "bbox": {"l": 308.862, "t": 120.71447999999998, "r": 545.11334, "b": 161.60742000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.8375797271728516, "cells": [{"id": 121, "text": "[38]", "bbox": {"l": 308.862, "t": 120.71447999999998, "r": 324.33197, "b": 128.73046999999997, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Xu Zhong, Jianbin Tang, and Antonio Jimeno Yepes. Pub-", "bbox": {"l": 326.65341, "t": 120.71447999999998, "r": 545.10876, "b": 128.73046999999997, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "laynet: Largest dataset ever for document layout analysis. In", "bbox": {"l": 328.78101, "t": 131.67345999999998, "r": 545.11334, "b": 139.68944999999997, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "2019 International Conference on Document Analysis and", "bbox": {"l": 328.78101, "t": 142.71312999999998, "r": 545.11328, "b": 150.44219999999996, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "Recognition (ICDAR)", "bbox": {"l": 328.78101, "t": 153.67211999999995, "r": 406.32245, "b": 161.40117999999995, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": ", pages 1015-1022, 2019. 1", "bbox": {"l": 406.32202, "t": 153.59142999999995, "r": 506.18085, "b": 161.60742000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[38] Xu Zhong, Jianbin Tang, and Antonio Jimeno Yepes. Publaynet: Largest dataset ever for document layout analysis. In 2019 International Conference on Document Analysis and Recognition (ICDAR) , pages 1015-1022, 2019. 1"}, {"label": "page_footer", "id": 0, "page_no": 9, "cluster": {"id": 0, "label": "page_footer", "bbox": {"l": 292.63, "t": 734.1329920000001, "r": 302.59259, "b": 743.039555, "coord_origin": "TOPLEFT"}, "confidence": 0.9069584012031555, "cells": [{"id": 127, "text": "10", "bbox": {"l": 292.63, "t": 734.1329920000001, "r": 302.59259, "b": 743.039555, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "10"}], "body": [{"label": "text", "id": 15, "page_no": 9, "cluster": {"id": 15, "label": "text", "bbox": {"l": 70.030998, "t": 75.88378999999998, "r": 286.36176, "b": 94.85875999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.6886764168739319, "cells": [{"id": 0, "text": "Computer Vision and Pattern Recognition", "bbox": {"l": 70.030998, "t": 75.96447999999998, "r": 223.58061, "b": 83.69353999999998, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": ", pages 658-666,", "bbox": {"l": 223.57901, "t": 75.88378999999998, "r": 286.36176, "b": 83.89977999999996, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "2019. 6", "bbox": {"l": 70.031006, "t": 86.84276999999997, "r": 97.916512, "b": 94.85875999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Computer Vision and Pattern Recognition , pages 658-666, 2019. 6"}, {"label": "list_item", "id": 13, "page_no": 9, "cluster": {"id": 13, "label": "list_item", "bbox": {"l": 50.112007, "t": 98.16576999999995, "r": 286.36578, "b": 160.97668, "coord_origin": "TOPLEFT"}, "confidence": 0.7723011374473572, "cells": [{"id": 3, "text": "[26]", "bbox": {"l": 50.112007, "t": 98.16576999999995, "r": 65.534088, "b": 106.18176000000005, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Sebastian Schreiber, Stefan Agne, Ivo Wolf, Andreas Den-", "bbox": {"l": 67.84832, "t": 98.16576999999995, "r": 286.35867, "b": 106.18176000000005, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "gel, and Sheraz Ahmed. Deepdesrt: Deep learning for detec-", "bbox": {"l": 70.031006, "t": 109.12476000000004, "r": 286.36331, "b": 117.14075000000003, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "tion and structure recognition of tables in document images.", "bbox": {"l": 70.031006, "t": 120.08374000000003, "r": 286.36334, "b": 128.0997299999999, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "In", "bbox": {"l": 70.031006, "t": 131.04272000000003, "r": 77.500015, "b": 139.05872, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "2017 14th IAPR International Conference on Document", "bbox": {"l": 80.560005, "t": 131.12341000000004, "r": 286.36578, "b": 138.85248, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Analysis and Recognition (ICDAR)", "bbox": {"l": 70.031006, "t": 142.0824, "r": 195.22885, "b": 149.81146, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": ", volume 01, pages 1162-", "bbox": {"l": 195.231, "t": 142.00171, "r": 286.36548, "b": 150.0177, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "1167, 2017. 1", "bbox": {"l": 70.031006, "t": 152.96069, "r": 120.33251, "b": 160.97668, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[26] Sebastian Schreiber, Stefan Agne, Ivo Wolf, Andreas Dengel, and Sheraz Ahmed. Deepdesrt: Deep learning for detection and structure recognition of tables in document images. In 2017 14th IAPR International Conference on Document Analysis and Recognition (ICDAR) , volume 01, pages 11621167, 2017. 1"}, {"label": "list_item", "id": 2, "page_no": 9, "cluster": {"id": 2, "label": "list_item", "bbox": {"l": 50.112007, "t": 164.28467, "r": 286.36337, "b": 227.0946, "coord_origin": "TOPLEFT"}, "confidence": 0.8580600619316101, "cells": [{"id": 12, "text": "[27]", "bbox": {"l": 50.112007, "t": 164.28467, "r": 65.534088, "b": 172.30066, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Sebastian Schreiber, Stefan Agne, Ivo Wolf, Andreas Den-", "bbox": {"l": 67.84832, "t": 164.28467, "r": 286.35867, "b": 172.30066, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "gel, and Sheraz Ahmed. Deepdesrt: Deep learning for de-", "bbox": {"l": 70.031006, "t": 175.24365, "r": 286.36337, "b": 183.25964, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "tection and structure recognition of tables in document im-", "bbox": {"l": 70.031006, "t": 186.20263999999997, "r": 286.36334, "b": 194.21862999999996, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "ages. In", "bbox": {"l": 70.031006, "t": 197.16161999999997, "r": 101.33271, "b": 205.17760999999996, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "2017 14th IAPR international conference on doc-", "bbox": {"l": 104.33101, "t": 197.24230999999997, "r": 286.35791, "b": 204.97136999999998, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "ument analysis and recognition (ICDAR)", "bbox": {"l": 70.031006, "t": 208.20032000000003, "r": 220.48719999999997, "b": 215.92938000000004, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": ", volume 1, pages", "bbox": {"l": 220.48401000000004, "t": 208.11963000000003, "r": 286.36017, "b": 216.13562000000002, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "1162-1167. IEEE, 2017. 3", "bbox": {"l": 70.031006, "t": 219.07861000000003, "r": 166.65294, "b": 227.0946, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[27] Sebastian Schreiber, Stefan Agne, Ivo Wolf, Andreas Dengel, and Sheraz Ahmed. Deepdesrt: Deep learning for detection and structure recognition of tables in document images. In 2017 14th IAPR international conference on document analysis and recognition (ICDAR) , volume 1, pages 1162-1167. IEEE, 2017. 3"}, {"label": "list_item", "id": 4, "page_no": 9, "cluster": {"id": 4, "label": "list_item", "bbox": {"l": 50.112007, "t": 230.40259000000003, "r": 286.36578, "b": 271.29553, "coord_origin": "TOPLEFT"}, "confidence": 0.8512731194496155, "cells": [{"id": 21, "text": "[28]", "bbox": {"l": 50.112007, "t": 230.40259000000003, "r": 65.650383, "b": 238.41858000000002, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "Faisal Shafait and Ray Smith. Table detection in heteroge-", "bbox": {"l": 67.982063, "t": 230.40259000000003, "r": 286.3587, "b": 238.41858000000002, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "neous documents. In", "bbox": {"l": 70.031006, "t": 241.36157000000003, "r": 147.16895, "b": 249.37756000000002, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "Proceedings of the 9th IAPR Interna-", "bbox": {"l": 149.93301, "t": 241.44226000000003, "r": 286.36578, "b": 249.17133, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "tional Workshop on Document Analysis Systems", "bbox": {"l": 70.031013, "t": 252.40125, "r": 244.6875, "b": 260.13031, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": ", pages 65-", "bbox": {"l": 244.69101, "t": 252.32056, "r": 286.35791, "b": 260.33655, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "72, 2010. 2", "bbox": {"l": 70.031006, "t": 263.27954, "r": 111.36611, "b": 271.29553, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[28] Faisal Shafait and Ray Smith. Table detection in heterogeneous documents. In Proceedings of the 9th IAPR International Workshop on Document Analysis Systems , pages 6572, 2010. 2"}, {"label": "list_item", "id": 5, "page_no": 9, "cluster": {"id": 5, "label": "list_item", "bbox": {"l": 50.112007, "t": 274.60357999999997, "r": 286.36627, "b": 326.4545, "coord_origin": "TOPLEFT"}, "confidence": 0.8494512438774109, "cells": [{"id": 28, "text": "[29]", "bbox": {"l": 50.112007, "t": 274.60357999999997, "r": 66.023834, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Shoaib", "bbox": {"l": 68.411568, "t": 274.60357999999997, "r": 94.944016, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Ahmed", "bbox": {"l": 100.8708, "t": 274.60357999999997, "r": 127.26788000000002, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Siddiqui,", "bbox": {"l": 133.19467, "t": 274.60357999999997, "r": 165.83237, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Imran", "bbox": {"l": 172.68269, "t": 274.60357999999997, "r": 194.09445, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "Ali", "bbox": {"l": 200.02124, "t": 274.60357999999997, "r": 211.4803, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Fateh,", "bbox": {"l": 217.40708999999998, "t": 274.60357999999997, "r": 239.43755, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "Syed", "bbox": {"l": 246.28787000000003, "t": 274.60357999999997, "r": 264.22067, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Tah-", "bbox": {"l": 270.14746, "t": 274.60357999999997, "r": 286.35873, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "seen Raza Rizvi, Andreas Dengel, and Sheraz Ahmed.", "bbox": {"l": 70.031006, "t": 285.56256, "r": 286.36331, "b": 293.57852, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "Deeptabstr: Deep learning based table structure recognition.", "bbox": {"l": 70.031006, "t": 296.52155, "r": 286.36331, "b": 304.53751, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "In", "bbox": {"l": 70.031006, "t": 307.48053, "r": 77.500015, "b": 315.49649, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "2019 International Conference on Document Analysis and", "bbox": {"l": 79.350006, "t": 307.56122, "r": 286.36627, "b": 315.29028, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Recognition (ICDAR)", "bbox": {"l": 70.031006, "t": 318.51923, "r": 147.57243, "b": 326.24829, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": ", pages 1403-1409. IEEE, 2019. 3", "bbox": {"l": 147.57201, "t": 318.43854, "r": 271.33521, "b": 326.4545, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[29] Shoaib Ahmed Siddiqui, Imran Ali Fateh, Syed Tahseen Raza Rizvi, Andreas Dengel, and Sheraz Ahmed. Deeptabstr: Deep learning based table structure recognition. In 2019 International Conference on Document Analysis and Recognition (ICDAR) , pages 1403-1409. IEEE, 2019. 3"}, {"label": "list_item", "id": 3, "page_no": 9, "cluster": {"id": 3, "label": "list_item", "bbox": {"l": 50.112007, "t": 329.76254, "r": 286.36334, "b": 381.61447, "coord_origin": "TOPLEFT"}, "confidence": 0.8567671179771423, "cells": [{"id": 43, "text": "[30]", "bbox": {"l": 50.112007, "t": 329.76254, "r": 65.366135, "b": 337.7785, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "Peter W J Staar, Michele Dolfi, Christoph Auer, and Costas", "bbox": {"l": 67.655159, "t": 329.76254, "r": 286.3587, "b": 337.7785, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Bekas. Corpus conversion service: A machine learning plat-", "bbox": {"l": 70.031006, "t": 340.72156000000007, "r": 286.36334, "b": 348.7375200000001, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "form to ingest documents at scale.", "bbox": {"l": 70.031006, "t": 351.68054, "r": 198.82439, "b": 359.6965, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "In", "bbox": {"l": 206.06027, "t": 351.68054, "r": 213.52928, "b": 359.6965, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Proceedings of the", "bbox": {"l": 217.02101, "t": 351.76123, "r": 286.35815, "b": 359.4903, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "24th ACM SIGKDD", "bbox": {"l": 70.031006, "t": 362.72021, "r": 143.08028, "b": 370.44928, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": ", KDD \u201918, pages 774-782, New York,", "bbox": {"l": 143.078, "t": 362.63953000000004, "r": 286.36111, "b": 370.65549000000004, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "NY, USA, 2018. ACM. 1", "bbox": {"l": 70.031006, "t": 373.59851, "r": 161.15652, "b": 381.61447, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[30] Peter W J Staar, Michele Dolfi, Christoph Auer, and Costas Bekas. Corpus conversion service: A machine learning platform to ingest documents at scale. In Proceedings of the 24th ACM SIGKDD , KDD \u201918, pages 774-782, New York, NY, USA, 2018. ACM. 1"}, {"label": "list_item", "id": 1, "page_no": 9, "cluster": {"id": 1, "label": "list_item", "bbox": {"l": 50.112007, "t": 384.92252, "r": 286.36389, "b": 458.69144, "coord_origin": "TOPLEFT"}, "confidence": 0.8832162618637085, "cells": [{"id": 52, "text": "[31]", "bbox": {"l": 50.112007, "t": 384.92252, "r": 65.140724, "b": 392.93848, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Ashish Vaswani, Noam Shazeer, Niki Parmar, Jakob Uszko-", "bbox": {"l": 67.395927, "t": 384.92252, "r": 286.35876, "b": 392.93848, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "reit, Llion Jones, Aidan N Gomez, \u0141 ukasz Kaiser, and Il-", "bbox": {"l": 70.031006, "t": 395.88153, "r": 286.36337, "b": 403.89749, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "lia Polosukhin.", "bbox": {"l": 70.031006, "t": 406.84052, "r": 125.47024999999998, "b": 414.85648, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Attention is all you need.", "bbox": {"l": 133.90764, "t": 406.84052, "r": 230.83444, "b": 414.85648, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "In I. Guyon,", "bbox": {"l": 239.27182, "t": 406.84052, "r": 286.36334, "b": 414.85648, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "U.", "bbox": {"l": 70.031006, "t": 417.7995, "r": 78.958366, "b": 425.81546, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "V. Luxburg, S. Bengio, H. Wallach, R. Fergus, S. Vish-", "bbox": {"l": 81.254494, "t": 417.7995, "r": 286.36334, "b": 425.81546, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "wanathan, and R. Garnett, editors,", "bbox": {"l": 70.031006, "t": 428.75751, "r": 196.7621, "b": 436.7734699999999, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "Advances in Neural In-", "bbox": {"l": 200.20201, "t": 428.8381999999999, "r": 286.36017, "b": 436.56726, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "formation Processing Systems 30", "bbox": {"l": 70.031006, "t": 439.79717999999997, "r": 189.19447, "b": 447.52624999999995, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": ", pages 5998-6008. Curran", "bbox": {"l": 189.19501, "t": 439.71648999999996, "r": 286.36389, "b": 447.73245, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "Associates, Inc., 2017. 5", "bbox": {"l": 70.031006, "t": 450.67548, "r": 158.9239, "b": 458.69144, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[31] Ashish Vaswani, Noam Shazeer, Niki Parmar, Jakob Uszkoreit, Llion Jones, Aidan N Gomez, \u0141 ukasz Kaiser, and Illia Polosukhin. Attention is all you need. In I. Guyon, U. V. Luxburg, S. Bengio, H. Wallach, R. Fergus, S. Vishwanathan, and R. Garnett, editors, Advances in Neural Information Processing Systems 30 , pages 5998-6008. Curran Associates, Inc., 2017. 5"}, {"label": "list_item", "id": 6, "page_no": 9, "cluster": {"id": 6, "label": "list_item", "bbox": {"l": 50.112007, "t": 461.99948, "r": 286.36334, "b": 502.89243, "coord_origin": "TOPLEFT"}, "confidence": 0.8431925177574158, "cells": [{"id": 65, "text": "[32]", "bbox": {"l": 50.112007, "t": 461.99948, "r": 65.910469, "b": 470.01544, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "Oriol Vinyals, Alexander Toshev, Samy Bengio, and Du-", "bbox": {"l": 68.281181, "t": 461.99948, "r": 286.35873, "b": 470.01544, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "mitru Erhan.", "bbox": {"l": 70.031006, "t": 472.9585, "r": 116.27969999999999, "b": 480.97446, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "Show and tell: A neural image caption gen-", "bbox": {"l": 122.48445, "t": 472.9585, "r": 286.36334, "b": 480.97446, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "erator. In", "bbox": {"l": 70.031006, "t": 483.91748, "r": 103.30532, "b": 491.93344, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "Proceedings of the IEEE Conference on Computer", "bbox": {"l": 105.51601, "t": 483.99817, "r": 286.35931, "b": 491.72723, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Vision and Pattern Recognition (CVPR)", "bbox": {"l": 70.031006, "t": 494.95715, "r": 212.51607, "b": 502.68622, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": ", June 2015. 2", "bbox": {"l": 212.51401, "t": 494.87646, "r": 263.55975, "b": 502.89243, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[32] Oriol Vinyals, Alexander Toshev, Samy Bengio, and Dumitru Erhan. Show and tell: A neural image caption generator. In Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR) , June 2015. 2"}, {"label": "list_item", "id": 7, "page_no": 9, "cluster": {"id": 7, "label": "list_item", "bbox": {"l": 50.112015, "t": 506.20047, "r": 286.36337, "b": 547.09244, "coord_origin": "TOPLEFT"}, "confidence": 0.8405635952949524, "cells": [{"id": 73, "text": "[33]", "bbox": {"l": 50.112015, "t": 506.20047, "r": 65.682777, "b": 514.21643, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "Wenyuan Xue, Qingyong Li, and Dacheng Tao.", "bbox": {"l": 68.019325, "t": 506.20047, "r": 247.37280000000004, "b": 514.21643, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "Res2tim:", "bbox": {"l": 253.97208000000003, "t": 506.20047, "r": 286.3587, "b": 514.21643, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "reconstruct syntactic structures from table images. In", "bbox": {"l": 70.031013, "t": 517.15948, "r": 265.62408, "b": 525.17545, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "2019", "bbox": {"l": 268.42902, "t": 517.24017, "r": 286.36182, "b": 524.96924, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "International Conference on Document Analysis and Recog-", "bbox": {"l": 70.031021, "t": 528.19916, "r": 286.36337, "b": 535.92822, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "nition (ICDAR)", "bbox": {"l": 70.031021, "t": 539.15718, "r": 125.25507999999999, "b": 546.88622, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": ", pages 749-755. IEEE, 2019. 3", "bbox": {"l": 125.25402, "t": 539.07648, "r": 240.05083, "b": 547.09244, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[33] Wenyuan Xue, Qingyong Li, and Dacheng Tao. Res2tim: reconstruct syntactic structures from table images. In 2019 International Conference on Document Analysis and Recognition (ICDAR) , pages 749-755. IEEE, 2019. 3"}, {"label": "list_item", "id": 11, "page_no": 9, "cluster": {"id": 11, "label": "list_item", "bbox": {"l": 50.112022, "t": 550.40048, "r": 286.36337, "b": 591.29344, "coord_origin": "TOPLEFT"}, "confidence": 0.8241521716117859, "cells": [{"id": 81, "text": "[34]", "bbox": {"l": 50.112022, "t": 550.40048, "r": 66.037048, "b": 558.41644, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "Wenyuan Xue, Baosheng Yu, Wen Wang, Dacheng Tao,", "bbox": {"l": 68.426765, "t": 550.40048, "r": 286.3587, "b": 558.41644, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "and Qingyong Li.", "bbox": {"l": 70.031021, "t": 561.35948, "r": 137.08176, "b": 569.37544, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "Tgrnet:", "bbox": {"l": 145.9854, "t": 561.35948, "r": 172.38248, "b": 569.37544, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "A table graph reconstruction", "bbox": {"l": 178.7038, "t": 561.35948, "r": 286.36337, "b": 569.37544, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "network for table structure recognition.", "bbox": {"l": 70.031021, "t": 572.31848, "r": 221.00723, "b": 580.33444, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "arXiv preprint", "bbox": {"l": 232.54300999999998, "t": 572.39919, "r": 286.35938, "b": 580.12822, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "arXiv:2106.10598", "bbox": {"l": 70.031021, "t": 583.35818, "r": 135.53058, "b": 591.08722, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": ", 2021. 3", "bbox": {"l": 135.53003, "t": 583.27748, "r": 167.89876, "b": 591.29344, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[34] Wenyuan Xue, Baosheng Yu, Wen Wang, Dacheng Tao, and Qingyong Li. Tgrnet: A table graph reconstruction network for table structure recognition. arXiv preprint arXiv:2106.10598 , 2021. 3"}, {"label": "list_item", "id": 10, "page_no": 9, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 50.11203, "t": 594.60149, "r": 286.3634, "b": 635.49445, "coord_origin": "TOPLEFT"}, "confidence": 0.8360886573791504, "cells": [{"id": 90, "text": "[35]", "bbox": {"l": 50.11203, "t": 594.60149, "r": 65.23661, "b": 602.61745, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "Quanzeng You, Hailin Jin, Zhaowen Wang, Chen Fang, and", "bbox": {"l": 67.506203, "t": 594.60149, "r": 286.3587, "b": 602.61745, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Jiebo Luo.", "bbox": {"l": 70.031029, "t": 605.56049, "r": 109.1066, "b": 613.57645, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "Image captioning with semantic attention.", "bbox": {"l": 116.22592, "t": 605.56049, "r": 271.76605, "b": 613.57645, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "In", "bbox": {"l": 278.89435, "t": 605.56049, "r": 286.36337, "b": 613.57645, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "Proceedings of the IEEE conference on computer vision and", "bbox": {"l": 70.031029, "t": 616.60019, "r": 286.3634, "b": 624.32922, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "pattern recognition", "bbox": {"l": 70.031029, "t": 627.55919, "r": 139.09921, "b": 635.28822, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": ", pages 4651-4659, 2016. 4", "bbox": {"l": 139.09802, "t": 627.47849, "r": 238.95683, "b": 635.49445, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[35] Quanzeng You, Hailin Jin, Zhaowen Wang, Chen Fang, and Jiebo Luo. Image captioning with semantic attention. In Proceedings of the IEEE conference on computer vision and pattern recognition , pages 4651-4659, 2016. 4"}, {"label": "list_item", "id": 12, "page_no": 9, "cluster": {"id": 12, "label": "list_item", "bbox": {"l": 50.112022, "t": 638.80249, "r": 286.36337, "b": 690.65347, "coord_origin": "TOPLEFT"}, "confidence": 0.8079474568367004, "cells": [{"id": 98, "text": "[36]", "bbox": {"l": 50.112022, "t": 638.80249, "r": 65.203552, "b": 646.81845, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "Xinyi Zheng, Doug Burdick, Lucian Popa, Peter Zhong, and", "bbox": {"l": 67.468193, "t": 638.80249, "r": 286.35873, "b": 646.81845, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "Nancy Xin Ru Wang. Global table extractor (gte): A frame-", "bbox": {"l": 70.031021, "t": 649.7605, "r": 286.36337, "b": 657.77646, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "work for joint table identification and cell structure recogni-", "bbox": {"l": 70.031021, "t": 660.7195, "r": 286.36334, "b": 668.73547, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "tion using visual context.", "bbox": {"l": 70.031021, "t": 671.6785, "r": 158.45766, "b": 679.69447, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "Winter Conference for Applications", "bbox": {"l": 160.52802, "t": 671.7592, "r": 286.36249, "b": 679.48824, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "in Computer Vision (WACV)", "bbox": {"l": 70.031013, "t": 682.7182, "r": 171.42305, "b": 690.44724, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": ", 2021. 2, 3", "bbox": {"l": 171.42201, "t": 682.6375, "r": 212.75713, "b": 690.65347, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[36] Xinyi Zheng, Doug Burdick, Lucian Popa, Peter Zhong, and Nancy Xin Ru Wang. Global table extractor (gte): A framework for joint table identification and cell structure recognition using visual context. Winter Conference for Applications in Computer Vision (WACV) , 2021. 2, 3"}, {"label": "list_item", "id": 8, "page_no": 9, "cluster": {"id": 8, "label": "list_item", "bbox": {"l": 50.112015, "t": 693.961502, "r": 286.36334, "b": 712.936462, "coord_origin": "TOPLEFT"}, "confidence": 0.8385783433914185, "cells": [{"id": 106, "text": "[37]", "bbox": {"l": 50.112015, "t": 693.961502, "r": 66.506706, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "Xu", "bbox": {"l": 68.966896, "t": 693.961502, "r": 80.992294, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "Zhong,", "bbox": {"l": 89.062057, "t": 693.961502, "r": 114.71492999999998, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "Elaheh", "bbox": {"l": 124.24621000000002, "t": 693.961502, "r": 149.1459, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "ShafieiBavani,", "bbox": {"l": 157.22462, "t": 693.961502, "r": 209.37321, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "and", "bbox": {"l": 218.9045, "t": 693.961502, "r": 231.85196999999997, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "Antonio", "bbox": {"l": 239.93069, "t": 693.961502, "r": 269.32254, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "Ji-", "bbox": {"l": 277.3923, "t": 693.961502, "r": 286.3587, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "meno Yepes. Image-based table recognition: Data, model,", "bbox": {"l": 70.031013, "t": 704.920502, "r": 286.36334, "b": 712.936462, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[37] Xu Zhong, Elaheh ShafieiBavani, and Antonio Jimeno Yepes. Image-based table recognition: Data, model,"}, {"label": "list_item", "id": 14, "page_no": 9, "cluster": {"id": 14, "label": "list_item", "bbox": {"l": 328.78101, "t": 75.88347999999996, "r": 545.11456, "b": 116.77544999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.7556979060173035, "cells": [{"id": 115, "text": "and evaluation. In Andrea Vedaldi, Horst Bischof, Thomas", "bbox": {"l": 328.78101, "t": 75.88347999999996, "r": 545.11346, "b": 83.89948000000015, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "Brox, and Jan-Michael Frahm, editors,", "bbox": {"l": 328.78101, "t": 86.84149000000002, "r": 472.30618, "b": 94.85748000000001, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "Computer Vision -", "bbox": {"l": 475.88501, "t": 86.92218000000003, "r": 545.11456, "b": 94.65125, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "ECCV 2020", "bbox": {"l": 328.78101, "t": 97.88116000000002, "r": 371.92734, "b": 105.61023, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": ", pages 564-580, Cham, 2020. Springer Interna-", "bbox": {"l": 371.92599, "t": 97.80048, "r": 545.11206, "b": 105.81646999999987, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "tional Publishing. 2, 3, 7", "bbox": {"l": 328.78101, "t": 108.75945999999999, "r": 417.70087, "b": 116.77544999999998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "and evaluation. In Andrea Vedaldi, Horst Bischof, Thomas Brox, and Jan-Michael Frahm, editors, Computer Vision ECCV 2020 , pages 564-580, Cham, 2020. Springer International Publishing. 2, 3, 7"}, {"label": "list_item", "id": 9, "page_no": 9, "cluster": {"id": 9, "label": "list_item", "bbox": {"l": 308.862, "t": 120.71447999999998, "r": 545.11334, "b": 161.60742000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.8375797271728516, "cells": [{"id": 121, "text": "[38]", "bbox": {"l": 308.862, "t": 120.71447999999998, "r": 324.33197, "b": 128.73046999999997, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Xu Zhong, Jianbin Tang, and Antonio Jimeno Yepes. Pub-", "bbox": {"l": 326.65341, "t": 120.71447999999998, "r": 545.10876, "b": 128.73046999999997, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "laynet: Largest dataset ever for document layout analysis. In", "bbox": {"l": 328.78101, "t": 131.67345999999998, "r": 545.11334, "b": 139.68944999999997, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "2019 International Conference on Document Analysis and", "bbox": {"l": 328.78101, "t": 142.71312999999998, "r": 545.11328, "b": 150.44219999999996, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "Recognition (ICDAR)", "bbox": {"l": 328.78101, "t": 153.67211999999995, "r": 406.32245, "b": 161.40117999999995, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": ", pages 1015-1022, 2019. 1", "bbox": {"l": 406.32202, "t": 153.59142999999995, "r": 506.18085, "b": 161.60742000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[38] Xu Zhong, Jianbin Tang, and Antonio Jimeno Yepes. Publaynet: Largest dataset ever for document layout analysis. In 2019 International Conference on Document Analysis and Recognition (ICDAR) , pages 1015-1022, 2019. 1"}], "headers": [{"label": "page_footer", "id": 0, "page_no": 9, "cluster": {"id": 0, "label": "page_footer", "bbox": {"l": 292.63, "t": 734.1329920000001, "r": 302.59259, "b": 743.039555, "coord_origin": "TOPLEFT"}, "confidence": 0.9069584012031555, "cells": [{"id": 127, "text": "10", "bbox": {"l": 292.63, "t": 734.1329920000001, "r": 302.59259, "b": 743.039555, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "10"}]}}, {"page_no": 10, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "TableFormer: Table Structure Understanding with Transformers", "bbox": {"l": 132.842, "t": 110.57488999999998, "r": 465.37591999999995, "b": 121.32263, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Supplementary Material", "bbox": {"l": 220.18399, "t": 122.25982999999997, "r": 375.04269, "b": 135.53008999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "1.", "bbox": {"l": 50.111984, "t": 161.16089, "r": 57.089828, "b": 171.90863000000002, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Details on the datasets", "bbox": {"l": 66.393616, "t": 161.16089, "r": 175.96437, "b": 171.90863000000002, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "1.1.", "bbox": {"l": 50.111984, "t": 180.97931000000005, "r": 64.210808, "b": 190.83136000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Data preparation", "bbox": {"l": 73.610023, "t": 180.97931000000005, "r": 150.36401, "b": 190.83136000000002, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "As a first step of our data preparation process, we have", "bbox": {"l": 62.06698600000001, "t": 199.92029000000002, "r": 286.36496, "b": 208.82683999999995, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "calculated statistics over the datasets across the following", "bbox": {"l": 50.111984, "t": 211.87627999999995, "r": 286.36505, "b": 220.78283999999996, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "dimensions: (1) table size measured in the number of rows", "bbox": {"l": 50.111984, "t": 223.83130000000006, "r": 286.36514, "b": 232.73784999999998, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "and columns, (2) complexity of the table, (3) strictness of", "bbox": {"l": 50.111984, "t": 235.78632000000005, "r": 286.36508, "b": 244.69286999999997, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "the provided HTML structure and (4) completeness (i.e. no", "bbox": {"l": 50.111984, "t": 247.74132999999995, "r": 286.36505, "b": 256.64788999999996, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "omitted bounding boxes). A table is considered to be simple", "bbox": {"l": 50.111984, "t": 259.69635000000005, "r": 286.36505, "b": 268.60290999999995, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "if it does not contain row spans or column spans. Addition-", "bbox": {"l": 50.111984, "t": 271.65137000000004, "r": 286.36505, "b": 280.55792, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "ally, a table has a strict HTML structure if every row has the", "bbox": {"l": 50.111984, "t": 283.60736, "r": 286.36502, "b": 292.5139199999999, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "same number of columns after taking into account any row", "bbox": {"l": 50.111984, "t": 295.56235, "r": 286.36505, "b": 304.4689, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "or column spans. Therefore a strict HTML structure looks", "bbox": {"l": 50.111984, "t": 307.5173300000001, "r": 286.36508, "b": 316.42389, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "always rectangular. However, HTML is a lenient encoding", "bbox": {"l": 50.111984, "t": 319.47232, "r": 286.36505, "b": 328.3788799999999, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "format, i.e. tables with rows of different sizes might still", "bbox": {"l": 50.111984, "t": 331.42731000000003, "r": 286.36502, "b": 340.33386, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "be regarded as correct due to implicit display rules. These", "bbox": {"l": 50.111984, "t": 343.3833, "r": 286.36508, "b": 352.28986, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "implicit rules leave room for ambiguity, which we want to", "bbox": {"l": 50.111984, "t": 355.33829, "r": 286.36505, "b": 364.24484000000007, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "avoid. As such, we prefer to have \u201dstrict\u201d tables, i.e. tables", "bbox": {"l": 50.111984, "t": 367.29327, "r": 286.36508, "b": 376.19983, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "where every row has exactly the same length.", "bbox": {"l": 50.111984, "t": 379.24826, "r": 230.80364999999998, "b": 388.15482000000003, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "We have developed a technique that tries to derive a", "bbox": {"l": 62.06698600000001, "t": 391.40527, "r": 286.36499, "b": 400.31183, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "missing bounding box out of its neighbors. As a first step,", "bbox": {"l": 50.111984, "t": 403.36026, "r": 286.36508, "b": 412.26681999999994, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "we use the annotation data to generate the most fine-grained", "bbox": {"l": 50.111984, "t": 415.31525, "r": 286.36505, "b": 424.22180000000003, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "grid that covers the table structure. In case of strict HTML", "bbox": {"l": 50.111984, "t": 427.2712399999999, "r": 286.36505, "b": 436.1778, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "tables, all grid squares are associated with some table cell", "bbox": {"l": 50.111984, "t": 439.22623, "r": 286.36508, "b": 448.1327800000001, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "and in the presence of table spans a cell extends across mul-", "bbox": {"l": 50.111984, "t": 451.18121, "r": 286.36511, "b": 460.08777, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "tiple grid squares. When enough bounding boxes are known", "bbox": {"l": 50.111984, "t": 463.1362, "r": 286.36505, "b": 472.04276, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "for a rectangular table, it is possible to compute the geo-", "bbox": {"l": 50.111984, "t": 475.09119, "r": 286.36508, "b": 483.99774, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "metrical border lines between the grid rows and columns.", "bbox": {"l": 50.111984, "t": 487.04617, "r": 286.36502, "b": 495.95273, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Eventually this information is used to generate the missing", "bbox": {"l": 50.111984, "t": 499.00217, "r": 286.36511, "b": 507.90872, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "bounding boxes. Additionally, the existence of unused grid", "bbox": {"l": 50.111984, "t": 510.95715, "r": 286.36508, "b": 519.8637100000001, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "squares indicates that the table rows have unequal number", "bbox": {"l": 50.111984, "t": 522.91214, "r": 286.36508, "b": 531.8187, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "of columns and the overall structure is non-strict. The gen-", "bbox": {"l": 50.111984, "t": 534.86713, "r": 286.36505, "b": 543.7737, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "eration of missing bounding boxes for non-strict HTML ta-", "bbox": {"l": 50.111984, "t": 546.82214, "r": 286.36502, "b": 555.7287, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "bles is ambiguous and therefore quite challenging.", "bbox": {"l": 50.111984, "t": 558.77814, "r": 257.47351, "b": 567.68469, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "Thus,", "bbox": {"l": 263.94919, "t": 558.77814, "r": 286.36505, "b": 567.68469, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "we have decided to simply discard those tables. In case of", "bbox": {"l": 50.111984, "t": 570.73314, "r": 286.36508, "b": 579.63969, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "PubTabNet we have computed missing bounding boxes for", "bbox": {"l": 50.111984, "t": 582.68814, "r": 286.36511, "b": 591.5947, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "48% of the simple and 69% of the complex tables. Regard-", "bbox": {"l": 50.111984, "t": 594.64314, "r": 286.36511, "b": 603.5497, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "ing FinTabNet, 68% of the simple and 98% of the complex", "bbox": {"l": 50.111984, "t": 606.5981400000001, "r": 286.36505, "b": 615.5047, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "tables require the generation of bounding boxes.", "bbox": {"l": 50.111984, "t": 618.55315, "r": 242.2606, "b": 627.4597, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Figure 7 illustrates the distribution of the tables across", "bbox": {"l": 62.06698600000001, "t": 630.71014, "r": 286.36496, "b": 639.6167, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "different dimensions per dataset.", "bbox": {"l": 50.111984, "t": 642.66614, "r": 179.90472, "b": 651.57269, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "1.2.", "bbox": {"l": 50.111984, "t": 662.39014, "r": 64.297272, "b": 672.24219, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "Synthetic datasets", "bbox": {"l": 73.754135, "t": 662.39014, "r": 153.60785, "b": 672.24219, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "Aiming to train and evaluate our models in a broader", "bbox": {"l": 62.06698600000001, "t": 681.33113, "r": 286.36493, "b": 690.2377, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "spectrum of table data we have synthesized four types of", "bbox": {"l": 50.111984, "t": 693.2861330000001, "r": 286.36505, "b": 702.1927029999999, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "datasets.", "bbox": {"l": 50.111984, "t": 705.241135, "r": 84.144226, "b": 714.147705, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Each one contains tables with different appear-", "bbox": {"l": 91.237595, "t": 705.241135, "r": 286.36505, "b": 714.147705, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "ances in regard to their size, structure, style and content.", "bbox": {"l": 308.862, "t": 162.65515000000005, "r": 545.11511, "b": 171.56170999999995, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Every synthetic dataset contains 150k examples, summing", "bbox": {"l": 308.862, "t": 174.61017000000004, "r": 545.11511, "b": 183.51671999999996, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "up to 600k synthetic examples. All datasets are divided into", "bbox": {"l": 308.862, "t": 186.56519000000003, "r": 545.11511, "b": 195.47173999999995, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "Train, Test and Val splits (80%, 10%, 10%).", "bbox": {"l": 308.862, "t": 198.52117999999996, "r": 484.07434, "b": 207.42773, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "The process of generating a synthetic dataset can be de-", "bbox": {"l": 320.81699, "t": 211.23517000000004, "r": 545.11505, "b": 220.14171999999996, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "composed into the following steps:", "bbox": {"l": 308.862, "t": 223.19019000000003, "r": 448.08939, "b": 232.09673999999995, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "1.", "bbox": {"l": 320.81699, "t": 235.90521, "r": 328.28894, "b": 244.81177000000002, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Prepare styling and content templates: The styling", "bbox": {"l": 335.38232, "t": 235.90521, "r": 545.11499, "b": 244.81177000000002, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "templates have been manually designed and organized into", "bbox": {"l": 308.862, "t": 247.86023, "r": 545.11511, "b": 256.76678000000004, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "groups of scope specific appearances (e.g. financial data,", "bbox": {"l": 308.862, "t": 259.81525, "r": 545.11511, "b": 268.72180000000003, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "marketing data, etc.)", "bbox": {"l": 308.862, "t": 271.77026, "r": 393.3847, "b": 280.67682, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "Additionally, we have prepared cu-", "bbox": {"l": 400.11942, "t": 271.77026, "r": 545.11511, "b": 280.67682, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "rated collections of content templates by extracting the most", "bbox": {"l": 308.862, "t": 283.72524999999996, "r": 545.11505, "b": 292.63181, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "frequently used terms out of non-synthetic datasets (e.g.", "bbox": {"l": 308.862, "t": 295.68124, "r": 545.11511, "b": 304.5878000000001, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "PubTabNet, FinTabNet, etc.).", "bbox": {"l": 308.862, "t": 307.63623, "r": 425.69348, "b": 316.54279, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "2.", "bbox": {"l": 320.81699, "t": 320.35022, "r": 328.4949, "b": 329.25677, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "Generate table structures: The structure of each syn-", "bbox": {"l": 331.05423, "t": 320.35022, "r": 545.11499, "b": 329.25677, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "thetic dataset assumes a horizontal table header which po-", "bbox": {"l": 308.862, "t": 332.30521000000005, "r": 545.11517, "b": 341.21176, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "tentially spans over multiple rows and a table body that", "bbox": {"l": 308.862, "t": 344.26018999999997, "r": 545.11505, "b": 353.16675, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "may contain a combination of row spans and column spans.", "bbox": {"l": 308.862, "t": 356.21619, "r": 545.11511, "b": 365.12273999999996, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "However, spans are not allowed to cross the header - body", "bbox": {"l": 308.862, "t": 368.17117, "r": 545.11511, "b": 377.07773, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "boundary. The table structure is described by the parame-", "bbox": {"l": 308.862, "t": 380.12616, "r": 545.11499, "b": 389.03271, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "ters: Total number of table rows and columns, number of", "bbox": {"l": 308.862, "t": 392.08115, "r": 545.11517, "b": 400.98769999999996, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "header rows, type of spans (header only spans, row only", "bbox": {"l": 308.862, "t": 404.03613000000007, "r": 545.11511, "b": 412.94269, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "spans, column only spans, both row and column spans),", "bbox": {"l": 308.862, "t": 415.99112, "r": 545.11499, "b": 424.89767, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "maximum span size and the ratio of the table area covered", "bbox": {"l": 308.862, "t": 427.94711, "r": 545.11517, "b": 436.85367, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "by spans.", "bbox": {"l": 308.862, "t": 439.9021, "r": 345.94278, "b": 448.80865, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "3.", "bbox": {"l": 320.81699, "t": 452.61609, "r": 328.30341, "b": 461.52264, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "Generate content: Based on the dataset", "bbox": {"l": 330.79889, "t": 452.61609, "r": 485.75772000000006, "b": 461.52264, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "theme", "bbox": {"l": 488.073, "t": 452.70575, "r": 511.86368, "b": 461.29352, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": ", a set of", "bbox": {"l": 511.86301, "t": 452.61609, "r": 545.10815, "b": 461.52264, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "suitable content templates is chosen first. Then, this content", "bbox": {"l": 308.862, "t": 464.57108, "r": 545.11505, "b": 473.47763, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "can be combined with purely random text to produce the", "bbox": {"l": 308.862, "t": 476.52707, "r": 545.11517, "b": 485.43362, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "synthetic content.", "bbox": {"l": 308.862, "t": 488.48206, "r": 379.14816, "b": 497.38861, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "4.", "bbox": {"l": 320.81699, "t": 501.19604, "r": 328.66177, "b": 510.1026, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Apply styling templates: Depending on the domain", "bbox": {"l": 331.2767, "t": 501.19604, "r": 545.11493, "b": 510.1026, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "of the synthetic dataset, a set of styling templates is first", "bbox": {"l": 308.862, "t": 513.15103, "r": 545.1153, "b": 522.05759, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "manually selected.", "bbox": {"l": 308.862, "t": 525.10703, "r": 384.29883, "b": 534.01358, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "Then, a style is randomly selected to", "bbox": {"l": 391.25272, "t": 525.10703, "r": 545.11511, "b": 534.01358, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "format the appearance of the synthesized table.", "bbox": {"l": 308.862, "t": 537.06203, "r": 496.15897000000007, "b": 545.96858, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "5.", "bbox": {"l": 320.81699, "t": 549.77603, "r": 328.28894, "b": 558.68259, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Render the complete tables: The synthetic table is", "bbox": {"l": 335.40222, "t": 549.77603, "r": 545.11499, "b": 558.68259, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "finally rendered by a web browser engine to generate the", "bbox": {"l": 308.862, "t": 561.73103, "r": 545.11517, "b": 570.63759, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "bounding boxes for each table cell. A batching technique is", "bbox": {"l": 308.862, "t": 573.68604, "r": 545.11511, "b": 582.59259, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "utilized to optimize the runtime overhead of the rendering", "bbox": {"l": 308.862, "t": 585.64203, "r": 545.11505, "b": 594.54858, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "process.", "bbox": {"l": 308.862, "t": 597.59703, "r": 341.2305, "b": 606.50359, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "2.", "bbox": {"l": 308.862, "t": 622.2905900000001, "r": 316.76675, "b": 633.03831, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "Prediction post-processing for PDF docu-", "bbox": {"l": 327.30643, "t": 622.2905900000001, "r": 545.10876, "b": 633.03831, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "ments", "bbox": {"l": 326.79501, "t": 636.2385899999999, "r": 357.34055, "b": 646.98631, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "Although TableFormer can predict the table structure and", "bbox": {"l": 320.81702, "t": 657.42104, "r": 545.11499, "b": 666.3276, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "the bounding boxes for tables recognized inside PDF docu-", "bbox": {"l": 308.86203, "t": 669.37604, "r": 545.11511, "b": 678.2826, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "ments, this is not enough when a full reconstruction of the", "bbox": {"l": 308.86203, "t": 681.33104, "r": 545.11517, "b": 690.2376, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "original table is required. This happens mainly due the fol-", "bbox": {"l": 308.86203, "t": 693.286041, "r": 545.11505, "b": 702.1926040000001, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "lowing reasons:", "bbox": {"l": 308.86203, "t": 705.242035, "r": 371.42719, "b": 714.148605, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "11", "bbox": {"l": 292.63104, "t": 734.1330379999999, "r": 302.59363, "b": 743.0396, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 18, "label": "section_header", "bbox": {"l": 132.842, "t": 110.57488999999998, "r": 465.37591999999995, "b": 135.53008999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.6497084498405457, "cells": [{"id": 0, "text": "TableFormer: Table Structure Understanding with Transformers", "bbox": {"l": 132.842, "t": 110.57488999999998, "r": 465.37591999999995, "b": 121.32263, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Supplementary Material", "bbox": {"l": 220.18399, "t": 122.25982999999997, "r": 375.04269, "b": 135.53008999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "section_header", "bbox": {"l": 50.111984, "t": 161.16089, "r": 175.96437, "b": 171.90863000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9454860091209412, "cells": [{"id": 2, "text": "1.", "bbox": {"l": 50.111984, "t": 161.16089, "r": 57.089828, "b": 171.90863000000002, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Details on the datasets", "bbox": {"l": 66.393616, "t": 161.16089, "r": 175.96437, "b": 171.90863000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "section_header", "bbox": {"l": 50.111984, "t": 180.97931000000005, "r": 150.36401, "b": 190.83136000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9535645842552185, "cells": [{"id": 4, "text": "1.1.", "bbox": {"l": 50.111984, "t": 180.97931000000005, "r": 64.210808, "b": 190.83136000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Data preparation", "bbox": {"l": 73.610023, "t": 180.97931000000005, "r": 150.36401, "b": 190.83136000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 50.111984, "t": 199.92029000000002, "r": 286.36514, "b": 388.15482000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9864971041679382, "cells": [{"id": 6, "text": "As a first step of our data preparation process, we have", "bbox": {"l": 62.06698600000001, "t": 199.92029000000002, "r": 286.36496, "b": 208.82683999999995, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "calculated statistics over the datasets across the following", "bbox": {"l": 50.111984, "t": 211.87627999999995, "r": 286.36505, "b": 220.78283999999996, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "dimensions: (1) table size measured in the number of rows", "bbox": {"l": 50.111984, "t": 223.83130000000006, "r": 286.36514, "b": 232.73784999999998, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "and columns, (2) complexity of the table, (3) strictness of", "bbox": {"l": 50.111984, "t": 235.78632000000005, "r": 286.36508, "b": 244.69286999999997, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "the provided HTML structure and (4) completeness (i.e. no", "bbox": {"l": 50.111984, "t": 247.74132999999995, "r": 286.36505, "b": 256.64788999999996, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "omitted bounding boxes). A table is considered to be simple", "bbox": {"l": 50.111984, "t": 259.69635000000005, "r": 286.36505, "b": 268.60290999999995, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "if it does not contain row spans or column spans. Addition-", "bbox": {"l": 50.111984, "t": 271.65137000000004, "r": 286.36505, "b": 280.55792, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "ally, a table has a strict HTML structure if every row has the", "bbox": {"l": 50.111984, "t": 283.60736, "r": 286.36502, "b": 292.5139199999999, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "same number of columns after taking into account any row", "bbox": {"l": 50.111984, "t": 295.56235, "r": 286.36505, "b": 304.4689, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "or column spans. Therefore a strict HTML structure looks", "bbox": {"l": 50.111984, "t": 307.5173300000001, "r": 286.36508, "b": 316.42389, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "always rectangular. However, HTML is a lenient encoding", "bbox": {"l": 50.111984, "t": 319.47232, "r": 286.36505, "b": 328.3788799999999, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "format, i.e. tables with rows of different sizes might still", "bbox": {"l": 50.111984, "t": 331.42731000000003, "r": 286.36502, "b": 340.33386, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "be regarded as correct due to implicit display rules. These", "bbox": {"l": 50.111984, "t": 343.3833, "r": 286.36508, "b": 352.28986, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "implicit rules leave room for ambiguity, which we want to", "bbox": {"l": 50.111984, "t": 355.33829, "r": 286.36505, "b": 364.24484000000007, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "avoid. As such, we prefer to have \u201dstrict\u201d tables, i.e. tables", "bbox": {"l": 50.111984, "t": 367.29327, "r": 286.36508, "b": 376.19983, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "where every row has exactly the same length.", "bbox": {"l": 50.111984, "t": 379.24826, "r": 230.80364999999998, "b": 388.15482000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 50.111984, "t": 391.40527, "r": 286.36511, "b": 627.4597, "coord_origin": "TOPLEFT"}, "confidence": 0.9826022386550903, "cells": [{"id": 22, "text": "We have developed a technique that tries to derive a", "bbox": {"l": 62.06698600000001, "t": 391.40527, "r": 286.36499, "b": 400.31183, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "missing bounding box out of its neighbors. As a first step,", "bbox": {"l": 50.111984, "t": 403.36026, "r": 286.36508, "b": 412.26681999999994, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "we use the annotation data to generate the most fine-grained", "bbox": {"l": 50.111984, "t": 415.31525, "r": 286.36505, "b": 424.22180000000003, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "grid that covers the table structure. In case of strict HTML", "bbox": {"l": 50.111984, "t": 427.2712399999999, "r": 286.36505, "b": 436.1778, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "tables, all grid squares are associated with some table cell", "bbox": {"l": 50.111984, "t": 439.22623, "r": 286.36508, "b": 448.1327800000001, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "and in the presence of table spans a cell extends across mul-", "bbox": {"l": 50.111984, "t": 451.18121, "r": 286.36511, "b": 460.08777, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "tiple grid squares. When enough bounding boxes are known", "bbox": {"l": 50.111984, "t": 463.1362, "r": 286.36505, "b": 472.04276, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "for a rectangular table, it is possible to compute the geo-", "bbox": {"l": 50.111984, "t": 475.09119, "r": 286.36508, "b": 483.99774, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "metrical border lines between the grid rows and columns.", "bbox": {"l": 50.111984, "t": 487.04617, "r": 286.36502, "b": 495.95273, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Eventually this information is used to generate the missing", "bbox": {"l": 50.111984, "t": 499.00217, "r": 286.36511, "b": 507.90872, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "bounding boxes. Additionally, the existence of unused grid", "bbox": {"l": 50.111984, "t": 510.95715, "r": 286.36508, "b": 519.8637100000001, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "squares indicates that the table rows have unequal number", "bbox": {"l": 50.111984, "t": 522.91214, "r": 286.36508, "b": 531.8187, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "of columns and the overall structure is non-strict. The gen-", "bbox": {"l": 50.111984, "t": 534.86713, "r": 286.36505, "b": 543.7737, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "eration of missing bounding boxes for non-strict HTML ta-", "bbox": {"l": 50.111984, "t": 546.82214, "r": 286.36502, "b": 555.7287, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "bles is ambiguous and therefore quite challenging.", "bbox": {"l": 50.111984, "t": 558.77814, "r": 257.47351, "b": 567.68469, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "Thus,", "bbox": {"l": 263.94919, "t": 558.77814, "r": 286.36505, "b": 567.68469, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "we have decided to simply discard those tables. In case of", "bbox": {"l": 50.111984, "t": 570.73314, "r": 286.36508, "b": 579.63969, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "PubTabNet we have computed missing bounding boxes for", "bbox": {"l": 50.111984, "t": 582.68814, "r": 286.36511, "b": 591.5947, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "48% of the simple and 69% of the complex tables. Regard-", "bbox": {"l": 50.111984, "t": 594.64314, "r": 286.36511, "b": 603.5497, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "ing FinTabNet, 68% of the simple and 98% of the complex", "bbox": {"l": 50.111984, "t": 606.5981400000001, "r": 286.36505, "b": 615.5047, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "tables require the generation of bounding boxes.", "bbox": {"l": 50.111984, "t": 618.55315, "r": 242.2606, "b": 627.4597, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 50.111984, "t": 630.71014, "r": 286.36496, "b": 651.57269, "coord_origin": "TOPLEFT"}, "confidence": 0.9335853457450867, "cells": [{"id": 43, "text": "Figure 7 illustrates the distribution of the tables across", "bbox": {"l": 62.06698600000001, "t": 630.71014, "r": 286.36496, "b": 639.6167, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "different dimensions per dataset.", "bbox": {"l": 50.111984, "t": 642.66614, "r": 179.90472, "b": 651.57269, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "section_header", "bbox": {"l": 50.111984, "t": 662.39014, "r": 153.60785, "b": 672.24219, "coord_origin": "TOPLEFT"}, "confidence": 0.9515743255615234, "cells": [{"id": 45, "text": "1.2.", "bbox": {"l": 50.111984, "t": 662.39014, "r": 64.297272, "b": 672.24219, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "Synthetic datasets", "bbox": {"l": 73.754135, "t": 662.39014, "r": 153.60785, "b": 672.24219, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 50.111984, "t": 681.33113, "r": 286.36505, "b": 714.147705, "coord_origin": "TOPLEFT"}, "confidence": 0.9783332347869873, "cells": [{"id": 47, "text": "Aiming to train and evaluate our models in a broader", "bbox": {"l": 62.06698600000001, "t": 681.33113, "r": 286.36493, "b": 690.2377, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "spectrum of table data we have synthesized four types of", "bbox": {"l": 50.111984, "t": 693.2861330000001, "r": 286.36505, "b": 702.1927029999999, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "datasets.", "bbox": {"l": 50.111984, "t": 705.241135, "r": 84.144226, "b": 714.147705, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Each one contains tables with different appear-", "bbox": {"l": 91.237595, "t": 705.241135, "r": 286.36505, "b": 714.147705, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "text", "bbox": {"l": 308.862, "t": 162.65515000000005, "r": 545.11511, "b": 207.42773, "coord_origin": "TOPLEFT"}, "confidence": 0.9596064686775208, "cells": [{"id": 51, "text": "ances in regard to their size, structure, style and content.", "bbox": {"l": 308.862, "t": 162.65515000000005, "r": 545.11511, "b": 171.56170999999995, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Every synthetic dataset contains 150k examples, summing", "bbox": {"l": 308.862, "t": 174.61017000000004, "r": 545.11511, "b": 183.51671999999996, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "up to 600k synthetic examples. All datasets are divided into", "bbox": {"l": 308.862, "t": 186.56519000000003, "r": 545.11511, "b": 195.47173999999995, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "Train, Test and Val splits (80%, 10%, 10%).", "bbox": {"l": 308.862, "t": 198.52117999999996, "r": 484.07434, "b": 207.42773, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 308.862, "t": 211.23517000000004, "r": 545.11505, "b": 232.09673999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9261796474456787, "cells": [{"id": 55, "text": "The process of generating a synthetic dataset can be de-", "bbox": {"l": 320.81699, "t": 211.23517000000004, "r": 545.11505, "b": 220.14171999999996, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "composed into the following steps:", "bbox": {"l": 308.862, "t": 223.19019000000003, "r": 448.08939, "b": 232.09673999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "list_item", "bbox": {"l": 308.862, "t": 235.90521, "r": 545.11511, "b": 316.54279, "coord_origin": "TOPLEFT"}, "confidence": 0.9642952680587769, "cells": [{"id": 57, "text": "1.", "bbox": {"l": 320.81699, "t": 235.90521, "r": 328.28894, "b": 244.81177000000002, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Prepare styling and content templates: The styling", "bbox": {"l": 335.38232, "t": 235.90521, "r": 545.11499, "b": 244.81177000000002, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "templates have been manually designed and organized into", "bbox": {"l": 308.862, "t": 247.86023, "r": 545.11511, "b": 256.76678000000004, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "groups of scope specific appearances (e.g. financial data,", "bbox": {"l": 308.862, "t": 259.81525, "r": 545.11511, "b": 268.72180000000003, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "marketing data, etc.)", "bbox": {"l": 308.862, "t": 271.77026, "r": 393.3847, "b": 280.67682, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "Additionally, we have prepared cu-", "bbox": {"l": 400.11942, "t": 271.77026, "r": 545.11511, "b": 280.67682, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "rated collections of content templates by extracting the most", "bbox": {"l": 308.862, "t": 283.72524999999996, "r": 545.11505, "b": 292.63181, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "frequently used terms out of non-synthetic datasets (e.g.", "bbox": {"l": 308.862, "t": 295.68124, "r": 545.11511, "b": 304.5878000000001, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "PubTabNet, FinTabNet, etc.).", "bbox": {"l": 308.862, "t": 307.63623, "r": 425.69348, "b": 316.54279, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "list_item", "bbox": {"l": 308.862, "t": 320.35022, "r": 545.11517, "b": 448.80865, "coord_origin": "TOPLEFT"}, "confidence": 0.9699994921684265, "cells": [{"id": 66, "text": "2.", "bbox": {"l": 320.81699, "t": 320.35022, "r": 328.4949, "b": 329.25677, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "Generate table structures: The structure of each syn-", "bbox": {"l": 331.05423, "t": 320.35022, "r": 545.11499, "b": 329.25677, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "thetic dataset assumes a horizontal table header which po-", "bbox": {"l": 308.862, "t": 332.30521000000005, "r": 545.11517, "b": 341.21176, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "tentially spans over multiple rows and a table body that", "bbox": {"l": 308.862, "t": 344.26018999999997, "r": 545.11505, "b": 353.16675, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "may contain a combination of row spans and column spans.", "bbox": {"l": 308.862, "t": 356.21619, "r": 545.11511, "b": 365.12273999999996, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "However, spans are not allowed to cross the header - body", "bbox": {"l": 308.862, "t": 368.17117, "r": 545.11511, "b": 377.07773, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "boundary. The table structure is described by the parame-", "bbox": {"l": 308.862, "t": 380.12616, "r": 545.11499, "b": 389.03271, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "ters: Total number of table rows and columns, number of", "bbox": {"l": 308.862, "t": 392.08115, "r": 545.11517, "b": 400.98769999999996, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "header rows, type of spans (header only spans, row only", "bbox": {"l": 308.862, "t": 404.03613000000007, "r": 545.11511, "b": 412.94269, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "spans, column only spans, both row and column spans),", "bbox": {"l": 308.862, "t": 415.99112, "r": 545.11499, "b": 424.89767, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "maximum span size and the ratio of the table area covered", "bbox": {"l": 308.862, "t": 427.94711, "r": 545.11517, "b": 436.85367, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "by spans.", "bbox": {"l": 308.862, "t": 439.9021, "r": 345.94278, "b": 448.80865, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "list_item", "bbox": {"l": 308.862, "t": 452.61609, "r": 545.11517, "b": 497.38861, "coord_origin": "TOPLEFT"}, "confidence": 0.9568928480148315, "cells": [{"id": 78, "text": "3.", "bbox": {"l": 320.81699, "t": 452.61609, "r": 328.30341, "b": 461.52264, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "Generate content: Based on the dataset", "bbox": {"l": 330.79889, "t": 452.61609, "r": 485.75772000000006, "b": 461.52264, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "theme", "bbox": {"l": 488.073, "t": 452.70575, "r": 511.86368, "b": 461.29352, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": ", a set of", "bbox": {"l": 511.86301, "t": 452.61609, "r": 545.10815, "b": 461.52264, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "suitable content templates is chosen first. Then, this content", "bbox": {"l": 308.862, "t": 464.57108, "r": 545.11505, "b": 473.47763, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "can be combined with purely random text to produce the", "bbox": {"l": 308.862, "t": 476.52707, "r": 545.11517, "b": 485.43362, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "synthetic content.", "bbox": {"l": 308.862, "t": 488.48206, "r": 379.14816, "b": 497.38861, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "list_item", "bbox": {"l": 308.862, "t": 501.19604, "r": 545.1153, "b": 545.96858, "coord_origin": "TOPLEFT"}, "confidence": 0.9710659980773926, "cells": [{"id": 85, "text": "4.", "bbox": {"l": 320.81699, "t": 501.19604, "r": 328.66177, "b": 510.1026, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Apply styling templates: Depending on the domain", "bbox": {"l": 331.2767, "t": 501.19604, "r": 545.11493, "b": 510.1026, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "of the synthetic dataset, a set of styling templates is first", "bbox": {"l": 308.862, "t": 513.15103, "r": 545.1153, "b": 522.05759, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "manually selected.", "bbox": {"l": 308.862, "t": 525.10703, "r": 384.29883, "b": 534.01358, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "Then, a style is randomly selected to", "bbox": {"l": 391.25272, "t": 525.10703, "r": 545.11511, "b": 534.01358, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "format the appearance of the synthesized table.", "bbox": {"l": 308.862, "t": 537.06203, "r": 496.15897000000007, "b": 545.96858, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "list_item", "bbox": {"l": 308.862, "t": 549.77603, "r": 545.11517, "b": 606.50359, "coord_origin": "TOPLEFT"}, "confidence": 0.9778757095336914, "cells": [{"id": 91, "text": "5.", "bbox": {"l": 320.81699, "t": 549.77603, "r": 328.28894, "b": 558.68259, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Render the complete tables: The synthetic table is", "bbox": {"l": 335.40222, "t": 549.77603, "r": 545.11499, "b": 558.68259, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "finally rendered by a web browser engine to generate the", "bbox": {"l": 308.862, "t": 561.73103, "r": 545.11517, "b": 570.63759, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "bounding boxes for each table cell. A batching technique is", "bbox": {"l": 308.862, "t": 573.68604, "r": 545.11511, "b": 582.59259, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "utilized to optimize the runtime overhead of the rendering", "bbox": {"l": 308.862, "t": 585.64203, "r": 545.11505, "b": 594.54858, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "process.", "bbox": {"l": 308.862, "t": 597.59703, "r": 341.2305, "b": 606.50359, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "section_header", "bbox": {"l": 308.862, "t": 622.2905900000001, "r": 545.10876, "b": 646.98631, "coord_origin": "TOPLEFT"}, "confidence": 0.954940915107727, "cells": [{"id": 97, "text": "2.", "bbox": {"l": 308.862, "t": 622.2905900000001, "r": 316.76675, "b": 633.03831, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "Prediction post-processing for PDF docu-", "bbox": {"l": 327.30643, "t": 622.2905900000001, "r": 545.10876, "b": 633.03831, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "ments", "bbox": {"l": 326.79501, "t": 636.2385899999999, "r": 357.34055, "b": 646.98631, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 308.86203, "t": 657.42104, "r": 545.11517, "b": 714.148605, "coord_origin": "TOPLEFT"}, "confidence": 0.9829329252243042, "cells": [{"id": 100, "text": "Although TableFormer can predict the table structure and", "bbox": {"l": 320.81702, "t": 657.42104, "r": 545.11499, "b": 666.3276, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "the bounding boxes for tables recognized inside PDF docu-", "bbox": {"l": 308.86203, "t": 669.37604, "r": 545.11511, "b": 678.2826, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "ments, this is not enough when a full reconstruction of the", "bbox": {"l": 308.86203, "t": 681.33104, "r": 545.11517, "b": 690.2376, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "original table is required. This happens mainly due the fol-", "bbox": {"l": 308.86203, "t": 693.286041, "r": 545.11505, "b": 702.1926040000001, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "lowing reasons:", "bbox": {"l": 308.86203, "t": 705.242035, "r": 371.42719, "b": 714.148605, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "page_footer", "bbox": {"l": 292.63104, "t": 734.1330379999999, "r": 302.59363, "b": 743.0396, "coord_origin": "TOPLEFT"}, "confidence": 0.8986663222312927, "cells": [{"id": 105, "text": "11", "bbox": {"l": 292.63104, "t": 734.1330379999999, "r": 302.59363, "b": 743.0396, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "section_header", "id": 18, "page_no": 10, "cluster": {"id": 18, "label": "section_header", "bbox": {"l": 132.842, "t": 110.57488999999998, "r": 465.37591999999995, "b": 135.53008999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.6497084498405457, "cells": [{"id": 0, "text": "TableFormer: Table Structure Understanding with Transformers", "bbox": {"l": 132.842, "t": 110.57488999999998, "r": 465.37591999999995, "b": 121.32263, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Supplementary Material", "bbox": {"l": 220.18399, "t": 122.25982999999997, "r": 375.04269, "b": 135.53008999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "TableFormer: Table Structure Understanding with Transformers Supplementary Material"}, {"label": "section_header", "id": 13, "page_no": 10, "cluster": {"id": 13, "label": "section_header", "bbox": {"l": 50.111984, "t": 161.16089, "r": 175.96437, "b": 171.90863000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9454860091209412, "cells": [{"id": 2, "text": "1.", "bbox": {"l": 50.111984, "t": 161.16089, "r": 57.089828, "b": 171.90863000000002, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Details on the datasets", "bbox": {"l": 66.393616, "t": 161.16089, "r": 175.96437, "b": 171.90863000000002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1. Details on the datasets"}, {"label": "section_header", "id": 11, "page_no": 10, "cluster": {"id": 11, "label": "section_header", "bbox": {"l": 50.111984, "t": 180.97931000000005, "r": 150.36401, "b": 190.83136000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9535645842552185, "cells": [{"id": 4, "text": "1.1.", "bbox": {"l": 50.111984, "t": 180.97931000000005, "r": 64.210808, "b": 190.83136000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Data preparation", "bbox": {"l": 73.610023, "t": 180.97931000000005, "r": 150.36401, "b": 190.83136000000002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1.1. Data preparation"}, {"label": "text", "id": 0, "page_no": 10, "cluster": {"id": 0, "label": "text", "bbox": {"l": 50.111984, "t": 199.92029000000002, "r": 286.36514, "b": 388.15482000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9864971041679382, "cells": [{"id": 6, "text": "As a first step of our data preparation process, we have", "bbox": {"l": 62.06698600000001, "t": 199.92029000000002, "r": 286.36496, "b": 208.82683999999995, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "calculated statistics over the datasets across the following", "bbox": {"l": 50.111984, "t": 211.87627999999995, "r": 286.36505, "b": 220.78283999999996, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "dimensions: (1) table size measured in the number of rows", "bbox": {"l": 50.111984, "t": 223.83130000000006, "r": 286.36514, "b": 232.73784999999998, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "and columns, (2) complexity of the table, (3) strictness of", "bbox": {"l": 50.111984, "t": 235.78632000000005, "r": 286.36508, "b": 244.69286999999997, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "the provided HTML structure and (4) completeness (i.e. no", "bbox": {"l": 50.111984, "t": 247.74132999999995, "r": 286.36505, "b": 256.64788999999996, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "omitted bounding boxes). A table is considered to be simple", "bbox": {"l": 50.111984, "t": 259.69635000000005, "r": 286.36505, "b": 268.60290999999995, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "if it does not contain row spans or column spans. Addition-", "bbox": {"l": 50.111984, "t": 271.65137000000004, "r": 286.36505, "b": 280.55792, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "ally, a table has a strict HTML structure if every row has the", "bbox": {"l": 50.111984, "t": 283.60736, "r": 286.36502, "b": 292.5139199999999, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "same number of columns after taking into account any row", "bbox": {"l": 50.111984, "t": 295.56235, "r": 286.36505, "b": 304.4689, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "or column spans. Therefore a strict HTML structure looks", "bbox": {"l": 50.111984, "t": 307.5173300000001, "r": 286.36508, "b": 316.42389, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "always rectangular. However, HTML is a lenient encoding", "bbox": {"l": 50.111984, "t": 319.47232, "r": 286.36505, "b": 328.3788799999999, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "format, i.e. tables with rows of different sizes might still", "bbox": {"l": 50.111984, "t": 331.42731000000003, "r": 286.36502, "b": 340.33386, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "be regarded as correct due to implicit display rules. These", "bbox": {"l": 50.111984, "t": 343.3833, "r": 286.36508, "b": 352.28986, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "implicit rules leave room for ambiguity, which we want to", "bbox": {"l": 50.111984, "t": 355.33829, "r": 286.36505, "b": 364.24484000000007, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "avoid. As such, we prefer to have \u201dstrict\u201d tables, i.e. tables", "bbox": {"l": 50.111984, "t": 367.29327, "r": 286.36508, "b": 376.19983, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "where every row has exactly the same length.", "bbox": {"l": 50.111984, "t": 379.24826, "r": 230.80364999999998, "b": 388.15482000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "As a first step of our data preparation process, we have calculated statistics over the datasets across the following dimensions: (1) table size measured in the number of rows and columns, (2) complexity of the table, (3) strictness of the provided HTML structure and (4) completeness (i.e. no omitted bounding boxes). A table is considered to be simple if it does not contain row spans or column spans. Additionally, a table has a strict HTML structure if every row has the same number of columns after taking into account any row or column spans. Therefore a strict HTML structure looks always rectangular. However, HTML is a lenient encoding format, i.e. tables with rows of different sizes might still be regarded as correct due to implicit display rules. These implicit rules leave room for ambiguity, which we want to avoid. As such, we prefer to have \u201dstrict\u201d tables, i.e. tables where every row has exactly the same length."}, {"label": "text", "id": 2, "page_no": 10, "cluster": {"id": 2, "label": "text", "bbox": {"l": 50.111984, "t": 391.40527, "r": 286.36511, "b": 627.4597, "coord_origin": "TOPLEFT"}, "confidence": 0.9826022386550903, "cells": [{"id": 22, "text": "We have developed a technique that tries to derive a", "bbox": {"l": 62.06698600000001, "t": 391.40527, "r": 286.36499, "b": 400.31183, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "missing bounding box out of its neighbors. As a first step,", "bbox": {"l": 50.111984, "t": 403.36026, "r": 286.36508, "b": 412.26681999999994, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "we use the annotation data to generate the most fine-grained", "bbox": {"l": 50.111984, "t": 415.31525, "r": 286.36505, "b": 424.22180000000003, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "grid that covers the table structure. In case of strict HTML", "bbox": {"l": 50.111984, "t": 427.2712399999999, "r": 286.36505, "b": 436.1778, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "tables, all grid squares are associated with some table cell", "bbox": {"l": 50.111984, "t": 439.22623, "r": 286.36508, "b": 448.1327800000001, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "and in the presence of table spans a cell extends across mul-", "bbox": {"l": 50.111984, "t": 451.18121, "r": 286.36511, "b": 460.08777, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "tiple grid squares. When enough bounding boxes are known", "bbox": {"l": 50.111984, "t": 463.1362, "r": 286.36505, "b": 472.04276, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "for a rectangular table, it is possible to compute the geo-", "bbox": {"l": 50.111984, "t": 475.09119, "r": 286.36508, "b": 483.99774, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "metrical border lines between the grid rows and columns.", "bbox": {"l": 50.111984, "t": 487.04617, "r": 286.36502, "b": 495.95273, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Eventually this information is used to generate the missing", "bbox": {"l": 50.111984, "t": 499.00217, "r": 286.36511, "b": 507.90872, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "bounding boxes. Additionally, the existence of unused grid", "bbox": {"l": 50.111984, "t": 510.95715, "r": 286.36508, "b": 519.8637100000001, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "squares indicates that the table rows have unequal number", "bbox": {"l": 50.111984, "t": 522.91214, "r": 286.36508, "b": 531.8187, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "of columns and the overall structure is non-strict. The gen-", "bbox": {"l": 50.111984, "t": 534.86713, "r": 286.36505, "b": 543.7737, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "eration of missing bounding boxes for non-strict HTML ta-", "bbox": {"l": 50.111984, "t": 546.82214, "r": 286.36502, "b": 555.7287, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "bles is ambiguous and therefore quite challenging.", "bbox": {"l": 50.111984, "t": 558.77814, "r": 257.47351, "b": 567.68469, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "Thus,", "bbox": {"l": 263.94919, "t": 558.77814, "r": 286.36505, "b": 567.68469, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "we have decided to simply discard those tables. In case of", "bbox": {"l": 50.111984, "t": 570.73314, "r": 286.36508, "b": 579.63969, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "PubTabNet we have computed missing bounding boxes for", "bbox": {"l": 50.111984, "t": 582.68814, "r": 286.36511, "b": 591.5947, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "48% of the simple and 69% of the complex tables. Regard-", "bbox": {"l": 50.111984, "t": 594.64314, "r": 286.36511, "b": 603.5497, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "ing FinTabNet, 68% of the simple and 98% of the complex", "bbox": {"l": 50.111984, "t": 606.5981400000001, "r": 286.36505, "b": 615.5047, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "tables require the generation of bounding boxes.", "bbox": {"l": 50.111984, "t": 618.55315, "r": 242.2606, "b": 627.4597, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "We have developed a technique that tries to derive a missing bounding box out of its neighbors. As a first step, we use the annotation data to generate the most fine-grained grid that covers the table structure. In case of strict HTML tables, all grid squares are associated with some table cell and in the presence of table spans a cell extends across multiple grid squares. When enough bounding boxes are known for a rectangular table, it is possible to compute the geometrical border lines between the grid rows and columns. Eventually this information is used to generate the missing bounding boxes. Additionally, the existence of unused grid squares indicates that the table rows have unequal number of columns and the overall structure is non-strict. The generation of missing bounding boxes for non-strict HTML tables is ambiguous and therefore quite challenging. Thus, we have decided to simply discard those tables. In case of PubTabNet we have computed missing bounding boxes for 48% of the simple and 69% of the complex tables. Regarding FinTabNet, 68% of the simple and 98% of the complex tables require the generation of bounding boxes."}, {"label": "text", "id": 14, "page_no": 10, "cluster": {"id": 14, "label": "text", "bbox": {"l": 50.111984, "t": 630.71014, "r": 286.36496, "b": 651.57269, "coord_origin": "TOPLEFT"}, "confidence": 0.9335853457450867, "cells": [{"id": 43, "text": "Figure 7 illustrates the distribution of the tables across", "bbox": {"l": 62.06698600000001, "t": 630.71014, "r": 286.36496, "b": 639.6167, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "different dimensions per dataset.", "bbox": {"l": 50.111984, "t": 642.66614, "r": 179.90472, "b": 651.57269, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 7 illustrates the distribution of the tables across different dimensions per dataset."}, {"label": "section_header", "id": 12, "page_no": 10, "cluster": {"id": 12, "label": "section_header", "bbox": {"l": 50.111984, "t": 662.39014, "r": 153.60785, "b": 672.24219, "coord_origin": "TOPLEFT"}, "confidence": 0.9515743255615234, "cells": [{"id": 45, "text": "1.2.", "bbox": {"l": 50.111984, "t": 662.39014, "r": 64.297272, "b": 672.24219, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "Synthetic datasets", "bbox": {"l": 73.754135, "t": 662.39014, "r": 153.60785, "b": 672.24219, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1.2. Synthetic datasets"}, {"label": "text", "id": 3, "page_no": 10, "cluster": {"id": 3, "label": "text", "bbox": {"l": 50.111984, "t": 681.33113, "r": 286.36505, "b": 714.147705, "coord_origin": "TOPLEFT"}, "confidence": 0.9783332347869873, "cells": [{"id": 47, "text": "Aiming to train and evaluate our models in a broader", "bbox": {"l": 62.06698600000001, "t": 681.33113, "r": 286.36493, "b": 690.2377, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "spectrum of table data we have synthesized four types of", "bbox": {"l": 50.111984, "t": 693.2861330000001, "r": 286.36505, "b": 702.1927029999999, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "datasets.", "bbox": {"l": 50.111984, "t": 705.241135, "r": 84.144226, "b": 714.147705, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Each one contains tables with different appear-", "bbox": {"l": 91.237595, "t": 705.241135, "r": 286.36505, "b": 714.147705, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Aiming to train and evaluate our models in a broader spectrum of table data we have synthesized four types of datasets. Each one contains tables with different appear-"}, {"label": "text", "id": 8, "page_no": 10, "cluster": {"id": 8, "label": "text", "bbox": {"l": 308.862, "t": 162.65515000000005, "r": 545.11511, "b": 207.42773, "coord_origin": "TOPLEFT"}, "confidence": 0.9596064686775208, "cells": [{"id": 51, "text": "ances in regard to their size, structure, style and content.", "bbox": {"l": 308.862, "t": 162.65515000000005, "r": 545.11511, "b": 171.56170999999995, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Every synthetic dataset contains 150k examples, summing", "bbox": {"l": 308.862, "t": 174.61017000000004, "r": 545.11511, "b": 183.51671999999996, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "up to 600k synthetic examples. All datasets are divided into", "bbox": {"l": 308.862, "t": 186.56519000000003, "r": 545.11511, "b": 195.47173999999995, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "Train, Test and Val splits (80%, 10%, 10%).", "bbox": {"l": 308.862, "t": 198.52117999999996, "r": 484.07434, "b": 207.42773, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "ances in regard to their size, structure, style and content. Every synthetic dataset contains 150k examples, summing up to 600k synthetic examples. All datasets are divided into Train, Test and Val splits (80%, 10%, 10%)."}, {"label": "text", "id": 15, "page_no": 10, "cluster": {"id": 15, "label": "text", "bbox": {"l": 308.862, "t": 211.23517000000004, "r": 545.11505, "b": 232.09673999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9261796474456787, "cells": [{"id": 55, "text": "The process of generating a synthetic dataset can be de-", "bbox": {"l": 320.81699, "t": 211.23517000000004, "r": 545.11505, "b": 220.14171999999996, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "composed into the following steps:", "bbox": {"l": 308.862, "t": 223.19019000000003, "r": 448.08939, "b": 232.09673999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The process of generating a synthetic dataset can be decomposed into the following steps:"}, {"label": "list_item", "id": 7, "page_no": 10, "cluster": {"id": 7, "label": "list_item", "bbox": {"l": 308.862, "t": 235.90521, "r": 545.11511, "b": 316.54279, "coord_origin": "TOPLEFT"}, "confidence": 0.9642952680587769, "cells": [{"id": 57, "text": "1.", "bbox": {"l": 320.81699, "t": 235.90521, "r": 328.28894, "b": 244.81177000000002, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Prepare styling and content templates: The styling", "bbox": {"l": 335.38232, "t": 235.90521, "r": 545.11499, "b": 244.81177000000002, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "templates have been manually designed and organized into", "bbox": {"l": 308.862, "t": 247.86023, "r": 545.11511, "b": 256.76678000000004, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "groups of scope specific appearances (e.g. financial data,", "bbox": {"l": 308.862, "t": 259.81525, "r": 545.11511, "b": 268.72180000000003, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "marketing data, etc.)", "bbox": {"l": 308.862, "t": 271.77026, "r": 393.3847, "b": 280.67682, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "Additionally, we have prepared cu-", "bbox": {"l": 400.11942, "t": 271.77026, "r": 545.11511, "b": 280.67682, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "rated collections of content templates by extracting the most", "bbox": {"l": 308.862, "t": 283.72524999999996, "r": 545.11505, "b": 292.63181, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "frequently used terms out of non-synthetic datasets (e.g.", "bbox": {"l": 308.862, "t": 295.68124, "r": 545.11511, "b": 304.5878000000001, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "PubTabNet, FinTabNet, etc.).", "bbox": {"l": 308.862, "t": 307.63623, "r": 425.69348, "b": 316.54279, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1. Prepare styling and content templates: The styling templates have been manually designed and organized into groups of scope specific appearances (e.g. financial data, marketing data, etc.) Additionally, we have prepared curated collections of content templates by extracting the most frequently used terms out of non-synthetic datasets (e.g. PubTabNet, FinTabNet, etc.)."}, {"label": "list_item", "id": 6, "page_no": 10, "cluster": {"id": 6, "label": "list_item", "bbox": {"l": 308.862, "t": 320.35022, "r": 545.11517, "b": 448.80865, "coord_origin": "TOPLEFT"}, "confidence": 0.9699994921684265, "cells": [{"id": 66, "text": "2.", "bbox": {"l": 320.81699, "t": 320.35022, "r": 328.4949, "b": 329.25677, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "Generate table structures: The structure of each syn-", "bbox": {"l": 331.05423, "t": 320.35022, "r": 545.11499, "b": 329.25677, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "thetic dataset assumes a horizontal table header which po-", "bbox": {"l": 308.862, "t": 332.30521000000005, "r": 545.11517, "b": 341.21176, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "tentially spans over multiple rows and a table body that", "bbox": {"l": 308.862, "t": 344.26018999999997, "r": 545.11505, "b": 353.16675, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "may contain a combination of row spans and column spans.", "bbox": {"l": 308.862, "t": 356.21619, "r": 545.11511, "b": 365.12273999999996, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "However, spans are not allowed to cross the header - body", "bbox": {"l": 308.862, "t": 368.17117, "r": 545.11511, "b": 377.07773, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "boundary. The table structure is described by the parame-", "bbox": {"l": 308.862, "t": 380.12616, "r": 545.11499, "b": 389.03271, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "ters: Total number of table rows and columns, number of", "bbox": {"l": 308.862, "t": 392.08115, "r": 545.11517, "b": 400.98769999999996, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "header rows, type of spans (header only spans, row only", "bbox": {"l": 308.862, "t": 404.03613000000007, "r": 545.11511, "b": 412.94269, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "spans, column only spans, both row and column spans),", "bbox": {"l": 308.862, "t": 415.99112, "r": 545.11499, "b": 424.89767, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "maximum span size and the ratio of the table area covered", "bbox": {"l": 308.862, "t": 427.94711, "r": 545.11517, "b": 436.85367, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "by spans.", "bbox": {"l": 308.862, "t": 439.9021, "r": 345.94278, "b": 448.80865, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2. Generate table structures: The structure of each synthetic dataset assumes a horizontal table header which potentially spans over multiple rows and a table body that may contain a combination of row spans and column spans. However, spans are not allowed to cross the header - body boundary. The table structure is described by the parameters: Total number of table rows and columns, number of header rows, type of spans (header only spans, row only spans, column only spans, both row and column spans), maximum span size and the ratio of the table area covered by spans."}, {"label": "list_item", "id": 9, "page_no": 10, "cluster": {"id": 9, "label": "list_item", "bbox": {"l": 308.862, "t": 452.61609, "r": 545.11517, "b": 497.38861, "coord_origin": "TOPLEFT"}, "confidence": 0.9568928480148315, "cells": [{"id": 78, "text": "3.", "bbox": {"l": 320.81699, "t": 452.61609, "r": 328.30341, "b": 461.52264, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "Generate content: Based on the dataset", "bbox": {"l": 330.79889, "t": 452.61609, "r": 485.75772000000006, "b": 461.52264, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "theme", "bbox": {"l": 488.073, "t": 452.70575, "r": 511.86368, "b": 461.29352, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": ", a set of", "bbox": {"l": 511.86301, "t": 452.61609, "r": 545.10815, "b": 461.52264, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "suitable content templates is chosen first. Then, this content", "bbox": {"l": 308.862, "t": 464.57108, "r": 545.11505, "b": 473.47763, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "can be combined with purely random text to produce the", "bbox": {"l": 308.862, "t": 476.52707, "r": 545.11517, "b": 485.43362, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "synthetic content.", "bbox": {"l": 308.862, "t": 488.48206, "r": 379.14816, "b": 497.38861, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3. Generate content: Based on the dataset theme , a set of suitable content templates is chosen first. Then, this content can be combined with purely random text to produce the synthetic content."}, {"label": "list_item", "id": 5, "page_no": 10, "cluster": {"id": 5, "label": "list_item", "bbox": {"l": 308.862, "t": 501.19604, "r": 545.1153, "b": 545.96858, "coord_origin": "TOPLEFT"}, "confidence": 0.9710659980773926, "cells": [{"id": 85, "text": "4.", "bbox": {"l": 320.81699, "t": 501.19604, "r": 328.66177, "b": 510.1026, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Apply styling templates: Depending on the domain", "bbox": {"l": 331.2767, "t": 501.19604, "r": 545.11493, "b": 510.1026, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "of the synthetic dataset, a set of styling templates is first", "bbox": {"l": 308.862, "t": 513.15103, "r": 545.1153, "b": 522.05759, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "manually selected.", "bbox": {"l": 308.862, "t": 525.10703, "r": 384.29883, "b": 534.01358, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "Then, a style is randomly selected to", "bbox": {"l": 391.25272, "t": 525.10703, "r": 545.11511, "b": 534.01358, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "format the appearance of the synthesized table.", "bbox": {"l": 308.862, "t": 537.06203, "r": 496.15897000000007, "b": 545.96858, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4. Apply styling templates: Depending on the domain of the synthetic dataset, a set of styling templates is first manually selected. Then, a style is randomly selected to format the appearance of the synthesized table."}, {"label": "list_item", "id": 4, "page_no": 10, "cluster": {"id": 4, "label": "list_item", "bbox": {"l": 308.862, "t": 549.77603, "r": 545.11517, "b": 606.50359, "coord_origin": "TOPLEFT"}, "confidence": 0.9778757095336914, "cells": [{"id": 91, "text": "5.", "bbox": {"l": 320.81699, "t": 549.77603, "r": 328.28894, "b": 558.68259, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Render the complete tables: The synthetic table is", "bbox": {"l": 335.40222, "t": 549.77603, "r": 545.11499, "b": 558.68259, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "finally rendered by a web browser engine to generate the", "bbox": {"l": 308.862, "t": 561.73103, "r": 545.11517, "b": 570.63759, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "bounding boxes for each table cell. A batching technique is", "bbox": {"l": 308.862, "t": 573.68604, "r": 545.11511, "b": 582.59259, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "utilized to optimize the runtime overhead of the rendering", "bbox": {"l": 308.862, "t": 585.64203, "r": 545.11505, "b": 594.54858, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "process.", "bbox": {"l": 308.862, "t": 597.59703, "r": 341.2305, "b": 606.50359, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5. Render the complete tables: The synthetic table is finally rendered by a web browser engine to generate the bounding boxes for each table cell. A batching technique is utilized to optimize the runtime overhead of the rendering process."}, {"label": "section_header", "id": 10, "page_no": 10, "cluster": {"id": 10, "label": "section_header", "bbox": {"l": 308.862, "t": 622.2905900000001, "r": 545.10876, "b": 646.98631, "coord_origin": "TOPLEFT"}, "confidence": 0.954940915107727, "cells": [{"id": 97, "text": "2.", "bbox": {"l": 308.862, "t": 622.2905900000001, "r": 316.76675, "b": 633.03831, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "Prediction post-processing for PDF docu-", "bbox": {"l": 327.30643, "t": 622.2905900000001, "r": 545.10876, "b": 633.03831, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "ments", "bbox": {"l": 326.79501, "t": 636.2385899999999, "r": 357.34055, "b": 646.98631, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2. Prediction post-processing for PDF documents"}, {"label": "text", "id": 1, "page_no": 10, "cluster": {"id": 1, "label": "text", "bbox": {"l": 308.86203, "t": 657.42104, "r": 545.11517, "b": 714.148605, "coord_origin": "TOPLEFT"}, "confidence": 0.9829329252243042, "cells": [{"id": 100, "text": "Although TableFormer can predict the table structure and", "bbox": {"l": 320.81702, "t": 657.42104, "r": 545.11499, "b": 666.3276, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "the bounding boxes for tables recognized inside PDF docu-", "bbox": {"l": 308.86203, "t": 669.37604, "r": 545.11511, "b": 678.2826, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "ments, this is not enough when a full reconstruction of the", "bbox": {"l": 308.86203, "t": 681.33104, "r": 545.11517, "b": 690.2376, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "original table is required. This happens mainly due the fol-", "bbox": {"l": 308.86203, "t": 693.286041, "r": 545.11505, "b": 702.1926040000001, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "lowing reasons:", "bbox": {"l": 308.86203, "t": 705.242035, "r": 371.42719, "b": 714.148605, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Although TableFormer can predict the table structure and the bounding boxes for tables recognized inside PDF documents, this is not enough when a full reconstruction of the original table is required. This happens mainly due the following reasons:"}, {"label": "page_footer", "id": 16, "page_no": 10, "cluster": {"id": 16, "label": "page_footer", "bbox": {"l": 292.63104, "t": 734.1330379999999, "r": 302.59363, "b": 743.0396, "coord_origin": "TOPLEFT"}, "confidence": 0.8986663222312927, "cells": [{"id": 105, "text": "11", "bbox": {"l": 292.63104, "t": 734.1330379999999, "r": 302.59363, "b": 743.0396, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "11"}], "body": [{"label": "section_header", "id": 18, "page_no": 10, "cluster": {"id": 18, "label": "section_header", "bbox": {"l": 132.842, "t": 110.57488999999998, "r": 465.37591999999995, "b": 135.53008999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.6497084498405457, "cells": [{"id": 0, "text": "TableFormer: Table Structure Understanding with Transformers", "bbox": {"l": 132.842, "t": 110.57488999999998, "r": 465.37591999999995, "b": 121.32263, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Supplementary Material", "bbox": {"l": 220.18399, "t": 122.25982999999997, "r": 375.04269, "b": 135.53008999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "TableFormer: Table Structure Understanding with Transformers Supplementary Material"}, {"label": "section_header", "id": 13, "page_no": 10, "cluster": {"id": 13, "label": "section_header", "bbox": {"l": 50.111984, "t": 161.16089, "r": 175.96437, "b": 171.90863000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9454860091209412, "cells": [{"id": 2, "text": "1.", "bbox": {"l": 50.111984, "t": 161.16089, "r": 57.089828, "b": 171.90863000000002, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Details on the datasets", "bbox": {"l": 66.393616, "t": 161.16089, "r": 175.96437, "b": 171.90863000000002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1. Details on the datasets"}, {"label": "section_header", "id": 11, "page_no": 10, "cluster": {"id": 11, "label": "section_header", "bbox": {"l": 50.111984, "t": 180.97931000000005, "r": 150.36401, "b": 190.83136000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9535645842552185, "cells": [{"id": 4, "text": "1.1.", "bbox": {"l": 50.111984, "t": 180.97931000000005, "r": 64.210808, "b": 190.83136000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Data preparation", "bbox": {"l": 73.610023, "t": 180.97931000000005, "r": 150.36401, "b": 190.83136000000002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1.1. Data preparation"}, {"label": "text", "id": 0, "page_no": 10, "cluster": {"id": 0, "label": "text", "bbox": {"l": 50.111984, "t": 199.92029000000002, "r": 286.36514, "b": 388.15482000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9864971041679382, "cells": [{"id": 6, "text": "As a first step of our data preparation process, we have", "bbox": {"l": 62.06698600000001, "t": 199.92029000000002, "r": 286.36496, "b": 208.82683999999995, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "calculated statistics over the datasets across the following", "bbox": {"l": 50.111984, "t": 211.87627999999995, "r": 286.36505, "b": 220.78283999999996, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "dimensions: (1) table size measured in the number of rows", "bbox": {"l": 50.111984, "t": 223.83130000000006, "r": 286.36514, "b": 232.73784999999998, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "and columns, (2) complexity of the table, (3) strictness of", "bbox": {"l": 50.111984, "t": 235.78632000000005, "r": 286.36508, "b": 244.69286999999997, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "the provided HTML structure and (4) completeness (i.e. no", "bbox": {"l": 50.111984, "t": 247.74132999999995, "r": 286.36505, "b": 256.64788999999996, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "omitted bounding boxes). A table is considered to be simple", "bbox": {"l": 50.111984, "t": 259.69635000000005, "r": 286.36505, "b": 268.60290999999995, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "if it does not contain row spans or column spans. Addition-", "bbox": {"l": 50.111984, "t": 271.65137000000004, "r": 286.36505, "b": 280.55792, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "ally, a table has a strict HTML structure if every row has the", "bbox": {"l": 50.111984, "t": 283.60736, "r": 286.36502, "b": 292.5139199999999, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "same number of columns after taking into account any row", "bbox": {"l": 50.111984, "t": 295.56235, "r": 286.36505, "b": 304.4689, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "or column spans. Therefore a strict HTML structure looks", "bbox": {"l": 50.111984, "t": 307.5173300000001, "r": 286.36508, "b": 316.42389, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "always rectangular. However, HTML is a lenient encoding", "bbox": {"l": 50.111984, "t": 319.47232, "r": 286.36505, "b": 328.3788799999999, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "format, i.e. tables with rows of different sizes might still", "bbox": {"l": 50.111984, "t": 331.42731000000003, "r": 286.36502, "b": 340.33386, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "be regarded as correct due to implicit display rules. These", "bbox": {"l": 50.111984, "t": 343.3833, "r": 286.36508, "b": 352.28986, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "implicit rules leave room for ambiguity, which we want to", "bbox": {"l": 50.111984, "t": 355.33829, "r": 286.36505, "b": 364.24484000000007, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "avoid. As such, we prefer to have \u201dstrict\u201d tables, i.e. tables", "bbox": {"l": 50.111984, "t": 367.29327, "r": 286.36508, "b": 376.19983, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "where every row has exactly the same length.", "bbox": {"l": 50.111984, "t": 379.24826, "r": 230.80364999999998, "b": 388.15482000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "As a first step of our data preparation process, we have calculated statistics over the datasets across the following dimensions: (1) table size measured in the number of rows and columns, (2) complexity of the table, (3) strictness of the provided HTML structure and (4) completeness (i.e. no omitted bounding boxes). A table is considered to be simple if it does not contain row spans or column spans. Additionally, a table has a strict HTML structure if every row has the same number of columns after taking into account any row or column spans. Therefore a strict HTML structure looks always rectangular. However, HTML is a lenient encoding format, i.e. tables with rows of different sizes might still be regarded as correct due to implicit display rules. These implicit rules leave room for ambiguity, which we want to avoid. As such, we prefer to have \u201dstrict\u201d tables, i.e. tables where every row has exactly the same length."}, {"label": "text", "id": 2, "page_no": 10, "cluster": {"id": 2, "label": "text", "bbox": {"l": 50.111984, "t": 391.40527, "r": 286.36511, "b": 627.4597, "coord_origin": "TOPLEFT"}, "confidence": 0.9826022386550903, "cells": [{"id": 22, "text": "We have developed a technique that tries to derive a", "bbox": {"l": 62.06698600000001, "t": 391.40527, "r": 286.36499, "b": 400.31183, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "missing bounding box out of its neighbors. As a first step,", "bbox": {"l": 50.111984, "t": 403.36026, "r": 286.36508, "b": 412.26681999999994, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "we use the annotation data to generate the most fine-grained", "bbox": {"l": 50.111984, "t": 415.31525, "r": 286.36505, "b": 424.22180000000003, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "grid that covers the table structure. In case of strict HTML", "bbox": {"l": 50.111984, "t": 427.2712399999999, "r": 286.36505, "b": 436.1778, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "tables, all grid squares are associated with some table cell", "bbox": {"l": 50.111984, "t": 439.22623, "r": 286.36508, "b": 448.1327800000001, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "and in the presence of table spans a cell extends across mul-", "bbox": {"l": 50.111984, "t": 451.18121, "r": 286.36511, "b": 460.08777, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "tiple grid squares. When enough bounding boxes are known", "bbox": {"l": 50.111984, "t": 463.1362, "r": 286.36505, "b": 472.04276, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "for a rectangular table, it is possible to compute the geo-", "bbox": {"l": 50.111984, "t": 475.09119, "r": 286.36508, "b": 483.99774, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "metrical border lines between the grid rows and columns.", "bbox": {"l": 50.111984, "t": 487.04617, "r": 286.36502, "b": 495.95273, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Eventually this information is used to generate the missing", "bbox": {"l": 50.111984, "t": 499.00217, "r": 286.36511, "b": 507.90872, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "bounding boxes. Additionally, the existence of unused grid", "bbox": {"l": 50.111984, "t": 510.95715, "r": 286.36508, "b": 519.8637100000001, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "squares indicates that the table rows have unequal number", "bbox": {"l": 50.111984, "t": 522.91214, "r": 286.36508, "b": 531.8187, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "of columns and the overall structure is non-strict. The gen-", "bbox": {"l": 50.111984, "t": 534.86713, "r": 286.36505, "b": 543.7737, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "eration of missing bounding boxes for non-strict HTML ta-", "bbox": {"l": 50.111984, "t": 546.82214, "r": 286.36502, "b": 555.7287, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "bles is ambiguous and therefore quite challenging.", "bbox": {"l": 50.111984, "t": 558.77814, "r": 257.47351, "b": 567.68469, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "Thus,", "bbox": {"l": 263.94919, "t": 558.77814, "r": 286.36505, "b": 567.68469, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "we have decided to simply discard those tables. In case of", "bbox": {"l": 50.111984, "t": 570.73314, "r": 286.36508, "b": 579.63969, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "PubTabNet we have computed missing bounding boxes for", "bbox": {"l": 50.111984, "t": 582.68814, "r": 286.36511, "b": 591.5947, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "48% of the simple and 69% of the complex tables. Regard-", "bbox": {"l": 50.111984, "t": 594.64314, "r": 286.36511, "b": 603.5497, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "ing FinTabNet, 68% of the simple and 98% of the complex", "bbox": {"l": 50.111984, "t": 606.5981400000001, "r": 286.36505, "b": 615.5047, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "tables require the generation of bounding boxes.", "bbox": {"l": 50.111984, "t": 618.55315, "r": 242.2606, "b": 627.4597, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "We have developed a technique that tries to derive a missing bounding box out of its neighbors. As a first step, we use the annotation data to generate the most fine-grained grid that covers the table structure. In case of strict HTML tables, all grid squares are associated with some table cell and in the presence of table spans a cell extends across multiple grid squares. When enough bounding boxes are known for a rectangular table, it is possible to compute the geometrical border lines between the grid rows and columns. Eventually this information is used to generate the missing bounding boxes. Additionally, the existence of unused grid squares indicates that the table rows have unequal number of columns and the overall structure is non-strict. The generation of missing bounding boxes for non-strict HTML tables is ambiguous and therefore quite challenging. Thus, we have decided to simply discard those tables. In case of PubTabNet we have computed missing bounding boxes for 48% of the simple and 69% of the complex tables. Regarding FinTabNet, 68% of the simple and 98% of the complex tables require the generation of bounding boxes."}, {"label": "text", "id": 14, "page_no": 10, "cluster": {"id": 14, "label": "text", "bbox": {"l": 50.111984, "t": 630.71014, "r": 286.36496, "b": 651.57269, "coord_origin": "TOPLEFT"}, "confidence": 0.9335853457450867, "cells": [{"id": 43, "text": "Figure 7 illustrates the distribution of the tables across", "bbox": {"l": 62.06698600000001, "t": 630.71014, "r": 286.36496, "b": 639.6167, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "different dimensions per dataset.", "bbox": {"l": 50.111984, "t": 642.66614, "r": 179.90472, "b": 651.57269, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 7 illustrates the distribution of the tables across different dimensions per dataset."}, {"label": "section_header", "id": 12, "page_no": 10, "cluster": {"id": 12, "label": "section_header", "bbox": {"l": 50.111984, "t": 662.39014, "r": 153.60785, "b": 672.24219, "coord_origin": "TOPLEFT"}, "confidence": 0.9515743255615234, "cells": [{"id": 45, "text": "1.2.", "bbox": {"l": 50.111984, "t": 662.39014, "r": 64.297272, "b": 672.24219, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "Synthetic datasets", "bbox": {"l": 73.754135, "t": 662.39014, "r": 153.60785, "b": 672.24219, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1.2. Synthetic datasets"}, {"label": "text", "id": 3, "page_no": 10, "cluster": {"id": 3, "label": "text", "bbox": {"l": 50.111984, "t": 681.33113, "r": 286.36505, "b": 714.147705, "coord_origin": "TOPLEFT"}, "confidence": 0.9783332347869873, "cells": [{"id": 47, "text": "Aiming to train and evaluate our models in a broader", "bbox": {"l": 62.06698600000001, "t": 681.33113, "r": 286.36493, "b": 690.2377, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "spectrum of table data we have synthesized four types of", "bbox": {"l": 50.111984, "t": 693.2861330000001, "r": 286.36505, "b": 702.1927029999999, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "datasets.", "bbox": {"l": 50.111984, "t": 705.241135, "r": 84.144226, "b": 714.147705, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Each one contains tables with different appear-", "bbox": {"l": 91.237595, "t": 705.241135, "r": 286.36505, "b": 714.147705, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Aiming to train and evaluate our models in a broader spectrum of table data we have synthesized four types of datasets. Each one contains tables with different appear-"}, {"label": "text", "id": 8, "page_no": 10, "cluster": {"id": 8, "label": "text", "bbox": {"l": 308.862, "t": 162.65515000000005, "r": 545.11511, "b": 207.42773, "coord_origin": "TOPLEFT"}, "confidence": 0.9596064686775208, "cells": [{"id": 51, "text": "ances in regard to their size, structure, style and content.", "bbox": {"l": 308.862, "t": 162.65515000000005, "r": 545.11511, "b": 171.56170999999995, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Every synthetic dataset contains 150k examples, summing", "bbox": {"l": 308.862, "t": 174.61017000000004, "r": 545.11511, "b": 183.51671999999996, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "up to 600k synthetic examples. All datasets are divided into", "bbox": {"l": 308.862, "t": 186.56519000000003, "r": 545.11511, "b": 195.47173999999995, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "Train, Test and Val splits (80%, 10%, 10%).", "bbox": {"l": 308.862, "t": 198.52117999999996, "r": 484.07434, "b": 207.42773, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "ances in regard to their size, structure, style and content. Every synthetic dataset contains 150k examples, summing up to 600k synthetic examples. All datasets are divided into Train, Test and Val splits (80%, 10%, 10%)."}, {"label": "text", "id": 15, "page_no": 10, "cluster": {"id": 15, "label": "text", "bbox": {"l": 308.862, "t": 211.23517000000004, "r": 545.11505, "b": 232.09673999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9261796474456787, "cells": [{"id": 55, "text": "The process of generating a synthetic dataset can be de-", "bbox": {"l": 320.81699, "t": 211.23517000000004, "r": 545.11505, "b": 220.14171999999996, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "composed into the following steps:", "bbox": {"l": 308.862, "t": 223.19019000000003, "r": 448.08939, "b": 232.09673999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The process of generating a synthetic dataset can be decomposed into the following steps:"}, {"label": "list_item", "id": 7, "page_no": 10, "cluster": {"id": 7, "label": "list_item", "bbox": {"l": 308.862, "t": 235.90521, "r": 545.11511, "b": 316.54279, "coord_origin": "TOPLEFT"}, "confidence": 0.9642952680587769, "cells": [{"id": 57, "text": "1.", "bbox": {"l": 320.81699, "t": 235.90521, "r": 328.28894, "b": 244.81177000000002, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Prepare styling and content templates: The styling", "bbox": {"l": 335.38232, "t": 235.90521, "r": 545.11499, "b": 244.81177000000002, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "templates have been manually designed and organized into", "bbox": {"l": 308.862, "t": 247.86023, "r": 545.11511, "b": 256.76678000000004, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "groups of scope specific appearances (e.g. financial data,", "bbox": {"l": 308.862, "t": 259.81525, "r": 545.11511, "b": 268.72180000000003, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "marketing data, etc.)", "bbox": {"l": 308.862, "t": 271.77026, "r": 393.3847, "b": 280.67682, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "Additionally, we have prepared cu-", "bbox": {"l": 400.11942, "t": 271.77026, "r": 545.11511, "b": 280.67682, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "rated collections of content templates by extracting the most", "bbox": {"l": 308.862, "t": 283.72524999999996, "r": 545.11505, "b": 292.63181, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "frequently used terms out of non-synthetic datasets (e.g.", "bbox": {"l": 308.862, "t": 295.68124, "r": 545.11511, "b": 304.5878000000001, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "PubTabNet, FinTabNet, etc.).", "bbox": {"l": 308.862, "t": 307.63623, "r": 425.69348, "b": 316.54279, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1. Prepare styling and content templates: The styling templates have been manually designed and organized into groups of scope specific appearances (e.g. financial data, marketing data, etc.) Additionally, we have prepared curated collections of content templates by extracting the most frequently used terms out of non-synthetic datasets (e.g. PubTabNet, FinTabNet, etc.)."}, {"label": "list_item", "id": 6, "page_no": 10, "cluster": {"id": 6, "label": "list_item", "bbox": {"l": 308.862, "t": 320.35022, "r": 545.11517, "b": 448.80865, "coord_origin": "TOPLEFT"}, "confidence": 0.9699994921684265, "cells": [{"id": 66, "text": "2.", "bbox": {"l": 320.81699, "t": 320.35022, "r": 328.4949, "b": 329.25677, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "Generate table structures: The structure of each syn-", "bbox": {"l": 331.05423, "t": 320.35022, "r": 545.11499, "b": 329.25677, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "thetic dataset assumes a horizontal table header which po-", "bbox": {"l": 308.862, "t": 332.30521000000005, "r": 545.11517, "b": 341.21176, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "tentially spans over multiple rows and a table body that", "bbox": {"l": 308.862, "t": 344.26018999999997, "r": 545.11505, "b": 353.16675, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "may contain a combination of row spans and column spans.", "bbox": {"l": 308.862, "t": 356.21619, "r": 545.11511, "b": 365.12273999999996, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "However, spans are not allowed to cross the header - body", "bbox": {"l": 308.862, "t": 368.17117, "r": 545.11511, "b": 377.07773, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "boundary. The table structure is described by the parame-", "bbox": {"l": 308.862, "t": 380.12616, "r": 545.11499, "b": 389.03271, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "ters: Total number of table rows and columns, number of", "bbox": {"l": 308.862, "t": 392.08115, "r": 545.11517, "b": 400.98769999999996, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "header rows, type of spans (header only spans, row only", "bbox": {"l": 308.862, "t": 404.03613000000007, "r": 545.11511, "b": 412.94269, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "spans, column only spans, both row and column spans),", "bbox": {"l": 308.862, "t": 415.99112, "r": 545.11499, "b": 424.89767, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "maximum span size and the ratio of the table area covered", "bbox": {"l": 308.862, "t": 427.94711, "r": 545.11517, "b": 436.85367, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "by spans.", "bbox": {"l": 308.862, "t": 439.9021, "r": 345.94278, "b": 448.80865, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2. Generate table structures: The structure of each synthetic dataset assumes a horizontal table header which potentially spans over multiple rows and a table body that may contain a combination of row spans and column spans. However, spans are not allowed to cross the header - body boundary. The table structure is described by the parameters: Total number of table rows and columns, number of header rows, type of spans (header only spans, row only spans, column only spans, both row and column spans), maximum span size and the ratio of the table area covered by spans."}, {"label": "list_item", "id": 9, "page_no": 10, "cluster": {"id": 9, "label": "list_item", "bbox": {"l": 308.862, "t": 452.61609, "r": 545.11517, "b": 497.38861, "coord_origin": "TOPLEFT"}, "confidence": 0.9568928480148315, "cells": [{"id": 78, "text": "3.", "bbox": {"l": 320.81699, "t": 452.61609, "r": 328.30341, "b": 461.52264, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "Generate content: Based on the dataset", "bbox": {"l": 330.79889, "t": 452.61609, "r": 485.75772000000006, "b": 461.52264, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "theme", "bbox": {"l": 488.073, "t": 452.70575, "r": 511.86368, "b": 461.29352, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": ", a set of", "bbox": {"l": 511.86301, "t": 452.61609, "r": 545.10815, "b": 461.52264, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "suitable content templates is chosen first. Then, this content", "bbox": {"l": 308.862, "t": 464.57108, "r": 545.11505, "b": 473.47763, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "can be combined with purely random text to produce the", "bbox": {"l": 308.862, "t": 476.52707, "r": 545.11517, "b": 485.43362, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "synthetic content.", "bbox": {"l": 308.862, "t": 488.48206, "r": 379.14816, "b": 497.38861, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3. Generate content: Based on the dataset theme , a set of suitable content templates is chosen first. Then, this content can be combined with purely random text to produce the synthetic content."}, {"label": "list_item", "id": 5, "page_no": 10, "cluster": {"id": 5, "label": "list_item", "bbox": {"l": 308.862, "t": 501.19604, "r": 545.1153, "b": 545.96858, "coord_origin": "TOPLEFT"}, "confidence": 0.9710659980773926, "cells": [{"id": 85, "text": "4.", "bbox": {"l": 320.81699, "t": 501.19604, "r": 328.66177, "b": 510.1026, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Apply styling templates: Depending on the domain", "bbox": {"l": 331.2767, "t": 501.19604, "r": 545.11493, "b": 510.1026, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "of the synthetic dataset, a set of styling templates is first", "bbox": {"l": 308.862, "t": 513.15103, "r": 545.1153, "b": 522.05759, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "manually selected.", "bbox": {"l": 308.862, "t": 525.10703, "r": 384.29883, "b": 534.01358, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "Then, a style is randomly selected to", "bbox": {"l": 391.25272, "t": 525.10703, "r": 545.11511, "b": 534.01358, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "format the appearance of the synthesized table.", "bbox": {"l": 308.862, "t": 537.06203, "r": 496.15897000000007, "b": 545.96858, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4. Apply styling templates: Depending on the domain of the synthetic dataset, a set of styling templates is first manually selected. Then, a style is randomly selected to format the appearance of the synthesized table."}, {"label": "list_item", "id": 4, "page_no": 10, "cluster": {"id": 4, "label": "list_item", "bbox": {"l": 308.862, "t": 549.77603, "r": 545.11517, "b": 606.50359, "coord_origin": "TOPLEFT"}, "confidence": 0.9778757095336914, "cells": [{"id": 91, "text": "5.", "bbox": {"l": 320.81699, "t": 549.77603, "r": 328.28894, "b": 558.68259, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Render the complete tables: The synthetic table is", "bbox": {"l": 335.40222, "t": 549.77603, "r": 545.11499, "b": 558.68259, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "finally rendered by a web browser engine to generate the", "bbox": {"l": 308.862, "t": 561.73103, "r": 545.11517, "b": 570.63759, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "bounding boxes for each table cell. A batching technique is", "bbox": {"l": 308.862, "t": 573.68604, "r": 545.11511, "b": 582.59259, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "utilized to optimize the runtime overhead of the rendering", "bbox": {"l": 308.862, "t": 585.64203, "r": 545.11505, "b": 594.54858, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "process.", "bbox": {"l": 308.862, "t": 597.59703, "r": 341.2305, "b": 606.50359, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5. Render the complete tables: The synthetic table is finally rendered by a web browser engine to generate the bounding boxes for each table cell. A batching technique is utilized to optimize the runtime overhead of the rendering process."}, {"label": "section_header", "id": 10, "page_no": 10, "cluster": {"id": 10, "label": "section_header", "bbox": {"l": 308.862, "t": 622.2905900000001, "r": 545.10876, "b": 646.98631, "coord_origin": "TOPLEFT"}, "confidence": 0.954940915107727, "cells": [{"id": 97, "text": "2.", "bbox": {"l": 308.862, "t": 622.2905900000001, "r": 316.76675, "b": 633.03831, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "Prediction post-processing for PDF docu-", "bbox": {"l": 327.30643, "t": 622.2905900000001, "r": 545.10876, "b": 633.03831, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "ments", "bbox": {"l": 326.79501, "t": 636.2385899999999, "r": 357.34055, "b": 646.98631, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2. Prediction post-processing for PDF documents"}, {"label": "text", "id": 1, "page_no": 10, "cluster": {"id": 1, "label": "text", "bbox": {"l": 308.86203, "t": 657.42104, "r": 545.11517, "b": 714.148605, "coord_origin": "TOPLEFT"}, "confidence": 0.9829329252243042, "cells": [{"id": 100, "text": "Although TableFormer can predict the table structure and", "bbox": {"l": 320.81702, "t": 657.42104, "r": 545.11499, "b": 666.3276, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "the bounding boxes for tables recognized inside PDF docu-", "bbox": {"l": 308.86203, "t": 669.37604, "r": 545.11511, "b": 678.2826, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "ments, this is not enough when a full reconstruction of the", "bbox": {"l": 308.86203, "t": 681.33104, "r": 545.11517, "b": 690.2376, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "original table is required. This happens mainly due the fol-", "bbox": {"l": 308.86203, "t": 693.286041, "r": 545.11505, "b": 702.1926040000001, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "lowing reasons:", "bbox": {"l": 308.86203, "t": 705.242035, "r": 371.42719, "b": 714.148605, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Although TableFormer can predict the table structure and the bounding boxes for tables recognized inside PDF documents, this is not enough when a full reconstruction of the original table is required. This happens mainly due the following reasons:"}], "headers": [{"label": "page_footer", "id": 16, "page_no": 10, "cluster": {"id": 16, "label": "page_footer", "bbox": {"l": 292.63104, "t": 734.1330379999999, "r": 302.59363, "b": 743.0396, "coord_origin": "TOPLEFT"}, "confidence": 0.8986663222312927, "cells": [{"id": 105, "text": "11", "bbox": {"l": 292.63104, "t": 734.1330379999999, "r": 302.59363, "b": 743.0396, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "11"}]}}, {"page_no": 11, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "PubTabNet", "bbox": {"l": 119.39108, "t": 77.31055000000003, "r": 151.94641, "b": 83.25922000000003, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "b.", "bbox": {"l": 53.345978, "t": 75.19152999999994, "r": 59.327053, "b": 81.14020000000005, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "FinTabNet", "bbox": {"l": 289.5791, "t": 77.45830999999998, "r": 319.8266, "b": 83.40698000000009, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Table Bank", "bbox": {"l": 448.37271, "t": 77.25396999999987, "r": 481.75916, "b": 83.20263999999997, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Train", "bbox": {"l": 82.553436, "t": 141.27617999999995, "r": 94.976013, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Complex", "bbox": {"l": 63.03878399999999, "t": 101.10413000000005, "r": 85.290085, "b": 106.06133999999986, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Simple", "bbox": {"l": 67.76786, "t": 124.39531999999997, "r": 85.231277, "b": 129.35253999999998, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Complex", "bbox": {"l": 227.55121, "t": 102.53992000000005, "r": 249.80251, "b": 107.49712999999997, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Simple", "bbox": {"l": 232.19898999999998, "t": 126.98577999999986, "r": 249.66241, "b": 131.94299, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Simple", "bbox": {"l": 396.2337, "t": 114.04522999999995, "r": 413.69711, "b": 119.00243999999998, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Val", "bbox": {"l": 97.382202, "t": 141.27617999999995, "r": 105.08014, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "100%", "bbox": {"l": 60.93763400000001, "t": 85.73321999999996, "r": 76.151443, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "500K 10K", "bbox": {"l": 82.304901, "t": 86.22351000000003, "r": 106.99162, "b": 91.18073000000015, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Train Test Val", "bbox": {"l": 246.20530999999997, "t": 141.60608000000002, "r": 281.88013, "b": 146.56329000000005, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "100%", "bbox": {"l": 226.69780000000003, "t": 85.73321999999996, "r": 241.91161, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "91K 10K 10K", "bbox": {"l": 249.93848999999997, "t": 86.08801000000005, "r": 282.49384, "b": 91.04522999999995, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Train Test Val", "bbox": {"l": 410.19409, "t": 141.27617999999995, "r": 444.68915, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "100% 130K 5K", "bbox": {"l": 391.37341, "t": 85.73321999999996, "r": 432.6716599999999, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "10K", "bbox": {"l": 435.60571000000004, "t": 86.26140999999996, "r": 445.62414999999993, "b": 91.21862999999996, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Complex", "bbox": {"l": 113.94921, "t": 141.28845, "r": 136.20052, "b": 146.24567000000002, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Non", "bbox": {"l": 116.91554000000001, "t": 94.81853999999998, "r": 127.05433999999998, "b": 99.77575999999999, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Strict", "bbox": {"l": 113.3146, "t": 100.93853999999999, "r": 127.05298, "b": 105.89575000000002, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "HTML", "bbox": {"l": 112.94112, "t": 107.05853000000013, "r": 127.05537, "b": 112.01575000000003, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Strict", "bbox": {"l": 113.22738999999999, "t": 122.61523, "r": 126.96577, "b": 127.57245, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "HTML", "bbox": {"l": 112.85390000000001, "t": 128.73523, "r": 126.96814999999998, "b": 133.69244000000003, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "Simple", "bbox": {"l": 138.57864, "t": 141.43640000000005, "r": 156.04207, "b": 146.39362000000006, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "230K 280K", "bbox": {"l": 122.03101, "t": 86.2713, "r": 151.04185, "b": 91.22852, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "65K", "bbox": {"l": 311.65359, "t": 86.55498999999998, "r": 321.67203, "b": 91.5122100000001, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Complex", "bbox": {"l": 287.89441, "t": 141.71063000000004, "r": 310.14572, "b": 146.66785000000004, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Non", "bbox": {"l": 289.23572, "t": 93.07977000000005, "r": 299.37451, "b": 98.03698999999995, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Strict", "bbox": {"l": 285.63513, "t": 99.19976999999994, "r": 299.3735, "b": 104.15698000000009, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "HTML", "bbox": {"l": 285.26111, "t": 105.31975999999997, "r": 299.37537, "b": 110.27697999999998, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Strict", "bbox": {"l": 285.43109, "t": 120.38995, "r": 299.16946, "b": 125.34717, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "HTML", "bbox": {"l": 285.05713, "t": 126.50995, "r": 299.17139, "b": 131.46716000000004, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Simple", "bbox": {"l": 311.34592, "t": 141.71063000000004, "r": 328.80933, "b": 146.66785000000004, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "47K", "bbox": {"l": 299.58362, "t": 86.69353999999998, "r": 309.60205, "b": 91.65075999999999, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Simple", "bbox": {"l": 466.04077000000007, "t": 141.67169, "r": 483.50418, "b": 146.62891000000002, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "Non", "bbox": {"l": 459.02151, "t": 93.76116999999999, "r": 469.16031000000004, "b": 98.71838000000002, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "Strict", "bbox": {"l": 455.4209, "t": 99.88116000000002, "r": 469.15927000000005, "b": 104.83838000000003, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "HTML", "bbox": {"l": 455.04691, "t": 106.00116000000014, "r": 469.16115999999994, "b": 110.95836999999995, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "145K", "bbox": {"l": 467.39401, "t": 85.57239000000004, "r": 480.6545100000001, "b": 90.52959999999996, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Complex", "bbox": {"l": 160.37672, "t": 141.58385999999996, "r": 182.62802, "b": 146.54107999999997, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "Contain", "bbox": {"l": 153.74265, "t": 94.86481000000003, "r": 173.32664, "b": 99.82201999999995, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Missing", "bbox": {"l": 154.50967, "t": 100.98479999999995, "r": 173.3246, "b": 105.94202000000007, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "bboxes", "bbox": {"l": 155.27162, "t": 107.10479999999995, "r": 173.32664, "b": 112.06200999999987, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Contain", "bbox": {"l": 326.41302, "t": 107.23248000000001, "r": 345.99701, "b": 112.18970000000002, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "Missing", "bbox": {"l": 327.17972, "t": 113.35248000000001, "r": 345.99463, "b": 118.30969000000005, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "bboxes", "bbox": {"l": 327.94131, "t": 119.47247000000004, "r": 345.99634, "b": 124.42969000000005, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Dataset", "bbox": {"l": 488.9942, "t": 104.15374999999983, "r": 508.76384999999993, "b": 109.11095999999998, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "doesn't", "bbox": {"l": 490.1893, "t": 110.27373999999998, "r": 508.76349000000005, "b": 115.2309600000001, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "provide", "bbox": {"l": 489.72009, "t": 116.39373999999998, "r": 508.76758, "b": 121.35095000000013, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "bboxes", "bbox": {"l": 490.71121, "t": 122.51373000000001, "r": 508.76624, "b": 127.47095000000002, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Simple", "bbox": {"l": 185.37759, "t": 141.71118, "r": 202.84102, "b": 146.66840000000002, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "230K 280K", "bbox": {"l": 168.50357, "t": 86.13611000000003, "r": 197.52699, "b": 91.09331999999995, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "65K", "bbox": {"l": 357.3768, "t": 85.99707000000001, "r": 367.39523, "b": 90.95428000000004, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "Complex Simple", "bbox": {"l": 333.73151, "t": 141.62323000000004, "r": 374.92862, "b": 146.58043999999995, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "47K", "bbox": {"l": 345.69101, "t": 86.05591000000004, "r": 355.70944, "b": 91.01312000000007, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Simple", "bbox": {"l": 508.54248, "t": 141.37683000000004, "r": 526.00592, "b": 146.33405000000005, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "145K", "bbox": {"l": 510.44653000000005, "t": 86.09258999999986, "r": 523.70703, "b": 91.0498, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Figure 7: Distribution of the tables across different dimensions per dataset. Simple vs complex tables per dataset and split,", "bbox": {"l": 50.112, "t": 165.50238000000002, "r": 545.11371, "b": 174.40894000000003, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "strict vs non strict html structures per dataset and table complexity, missing bboxes per dataset and table complexity.", "bbox": {"l": 50.112, "t": 177.4574, "r": 513.52234, "b": 186.36395000000005, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "\u2022", "bbox": {"l": 61.569, "t": 210.93140000000005, "r": 71.14743, "b": 219.83794999999998, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "TableFormer output does not include the table cell con-", "bbox": {"l": 73.542038, "t": 210.93140000000005, "r": 286.36511, "b": 219.83794999999998, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "tent.", "bbox": {"l": 70.037003, "t": 222.88640999999996, "r": 87.47155, "b": 231.79296999999997, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "\u2022", "bbox": {"l": 61.569, "t": 244.07141000000001, "r": 71.345718, "b": 252.97797000000003, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "There are occasional inaccuracies in the predictions of", "bbox": {"l": 73.789902, "t": 244.07141000000001, "r": 286.36514, "b": 252.97797000000003, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "the bounding boxes.", "bbox": {"l": 70.037003, "t": 256.02643, "r": 150.41524, "b": 264.93298000000004, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "However, it is possible to mitigate those limitations by", "bbox": {"l": 62.067001, "t": 279.20343, "r": 286.36499, "b": 288.10999, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "combining the TableFormer predictions with the informa-", "bbox": {"l": 50.112, "t": 291.15842, "r": 286.36505, "b": 300.06497, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "tion already present inside a programmatic PDF document.", "bbox": {"l": 50.112, "t": 303.1134, "r": 286.36511, "b": 312.01996, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "More specifically, PDF documents can be seen as a se-", "bbox": {"l": 50.112, "t": 315.06839, "r": 286.36511, "b": 323.97495, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "quence of PDF cells where each cell is described by its con-", "bbox": {"l": 50.112, "t": 327.02438, "r": 286.36511, "b": 335.93093999999996, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "tent and bounding box. If we are able to associate the PDF", "bbox": {"l": 50.112, "t": 338.97937, "r": 286.36505, "b": 347.88593, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "cells with the predicted table cells, we can directly link the", "bbox": {"l": 50.112, "t": 350.93436, "r": 286.36508, "b": 359.84091, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "PDF cell content to the table cell structure and use the PDF", "bbox": {"l": 50.112, "t": 362.88934, "r": 286.36511, "b": 371.7959, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "bounding boxes to correct misalignments in the predicted", "bbox": {"l": 50.112, "t": 374.84433000000007, "r": 286.36508, "b": 383.75089, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "table cell bounding boxes.", "bbox": {"l": 50.112, "t": 386.80032, "r": 154.55988, "b": 395.70688, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "Here is a step-by-step description of the prediction post-", "bbox": {"l": 62.067001, "t": 399.06934, "r": 286.36496, "b": 407.97589, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "processing:", "bbox": {"l": 50.112, "t": 411.02533, "r": 95.491638, "b": 419.93188, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "1.", "bbox": {"l": 62.067001, "t": 423.29532, "r": 69.37281, "b": 432.20187, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "Get the minimal grid dimensions - number of rows and", "bbox": {"l": 71.808075, "t": 423.29532, "r": 286.36502, "b": 432.20187, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "columns for the predicted table structure. This represents", "bbox": {"l": 50.112, "t": 435.25031, "r": 286.36508, "b": 444.15686, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "the most granular grid for the underlying table structure.", "bbox": {"l": 50.112, "t": 447.20529, "r": 274.50958, "b": 456.11185000000006, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "2.", "bbox": {"l": 62.067001, "t": 459.47528, "r": 69.538948, "b": 468.38184, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "Generate pair-wise matches between the bounding", "bbox": {"l": 77.429329, "t": 459.47528, "r": 286.36499, "b": 468.38184, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "boxes of the PDF cells and the predicted cells. The Intersec-", "bbox": {"l": 50.112, "t": 471.43027, "r": 286.36505, "b": 480.33682, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "tion Over Union (IOU) metric is used to evaluate the quality", "bbox": {"l": 50.112, "t": 483.38525, "r": 286.36505, "b": 492.29181, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "of the matches.", "bbox": {"l": 50.112, "t": 495.34024, "r": 110.70452999999999, "b": 504.2468, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "3.", "bbox": {"l": 62.067001, "t": 507.61023, "r": 69.863068, "b": 516.5167799999999, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "Use a carefully selected IOU threshold to designate", "bbox": {"l": 72.461754, "t": 507.61023, "r": 286.36493, "b": 516.5167799999999, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "the matches as \u201cgood\u201d ones and \u201cbad\u201d ones.", "bbox": {"l": 50.112, "t": 519.5662199999999, "r": 226.0714, "b": 528.4727800000001, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "3.a. If all IOU scores in a column are below the thresh-", "bbox": {"l": 62.067001, "t": 531.83521, "r": 286.36496, "b": 540.7417800000001, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "old, discard all predictions (structure and bounding boxes)", "bbox": {"l": 50.112, "t": 543.79121, "r": 286.36511, "b": 552.69777, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "for that column.", "bbox": {"l": 50.112, "t": 555.74622, "r": 114.03204, "b": 564.65277, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "4.", "bbox": {"l": 62.067001, "t": 568.01622, "r": 69.538948, "b": 576.92278, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "Find the best-fitting content alignment for the pre-", "bbox": {"l": 76.731949, "t": 568.01622, "r": 286.36502, "b": 576.92278, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "dicted cells with good IOU per each column. The alignment", "bbox": {"l": 50.112, "t": 579.97122, "r": 286.36508, "b": 588.87778, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "of the column can be identified by the following formula:", "bbox": {"l": 50.112, "t": 591.9262200000001, "r": 278.70383, "b": 600.83278, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "alignment", "bbox": {"l": 112.02799999999999, "t": 623.99382, "r": 157.9516, "b": 632.84061, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "= arg min", "bbox": {"l": 160.715, "t": 623.99382, "r": 203.4964, "b": 632.84061, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "c", "bbox": {"l": 185.58499, "t": 633.98305, "r": 189.14511, "b": 640.17578, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "{", "bbox": {"l": 203.49899, "t": 623.43591, "r": 208.48029, "b": 632.84061, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "D$_{c}$", "bbox": {"l": 208.48099, "t": 623.99382, "r": 220.28911, "b": 632.84061, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "}", "bbox": {"l": 220.78699, "t": 623.43591, "r": 225.76828, "b": 632.84061, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "D$_{c}$", "bbox": {"l": 110.70499, "t": 645.25882, "r": 122.51310999999998, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "=", "bbox": {"l": 125.77899000000001, "t": 645.25882, "r": 133.52791, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "max", "bbox": {"l": 136.295, "t": 645.25882, "r": 156.00201, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "{", "bbox": {"l": 156.00299, "t": 644.70091, "r": 160.98428, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "x$_{c}$", "bbox": {"l": 160.98399, "t": 645.25882, "r": 170.23811, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "} \u2212", "bbox": {"l": 170.73599, "t": 644.70091, "r": 185.6779, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "min", "bbox": {"l": 187.894, "t": 645.25882, "r": 206.05283, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "{", "bbox": {"l": 206.054, "t": 644.70091, "r": 211.03529, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "x$_{c}$", "bbox": {"l": 211.035, "t": 645.25882, "r": 220.28912, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "}", "bbox": {"l": 220.787, "t": 644.70091, "r": 225.76829999999998, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "(4)", "bbox": {"l": 274.746, "t": 634.88522, "r": 286.3624, "b": 643.79178, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "where", "bbox": {"l": 50.112, "t": 668.06522, "r": 74.45063, "b": 676.97179, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "c", "bbox": {"l": 78.335999, "t": 667.90582, "r": 82.647812, "b": 676.75261, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "is one of", "bbox": {"l": 86.532997, "t": 668.06522, "r": 123.63372, "b": 676.97179, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "{", "bbox": {"l": 127.51899999999999, "t": 667.3479199999999, "r": 132.50029, "b": 676.75261, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "left, centroid, right", "bbox": {"l": 132.50099, "t": 668.06522, "r": 210.69743, "b": 676.97179, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "}", "bbox": {"l": 210.69699, "t": 667.3479199999999, "r": 215.67828, "b": 676.75261, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "and", "bbox": {"l": 219.56299, "t": 668.06522, "r": 233.94897000000003, "b": 676.97179, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "x$_{c}$", "bbox": {"l": 237.83499000000003, "t": 667.90582, "r": 247.08911, "b": 676.75261, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "is the x-", "bbox": {"l": 251.47299000000004, "t": 668.06522, "r": 286.362, "b": 676.97179, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "coordinate for the corresponding point.", "bbox": {"l": 50.112, "t": 680.02022, "r": 205.88721, "b": 688.92679, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "5.", "bbox": {"l": 62.067001, "t": 692.290222, "r": 69.538948, "b": 701.196785, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "Use the alignment computed in step 4, to compute", "bbox": {"l": 76.273666, "t": 692.290222, "r": 286.36496, "b": 701.196785, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "the median", "bbox": {"l": 50.112, "t": 704.245224, "r": 94.604973, "b": 713.151787, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "x", "bbox": {"l": 97.598999, "t": 704.085815, "r": 103.29263, "b": 712.93261, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "-coordinate for all table columns and the me-", "bbox": {"l": 103.292, "t": 704.245224, "r": 286.36481, "b": 713.151787, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "dian cell size for all table cells. The usage of median dur-", "bbox": {"l": 308.862, "t": 210.93120999999996, "r": 545.11517, "b": 219.83776999999998, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "ing the computations, helps to eliminate outliers caused by", "bbox": {"l": 308.862, "t": 222.88720999999998, "r": 545.11511, "b": 231.79376000000002, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "occasional column spans which are usually wider than the", "bbox": {"l": 308.862, "t": 234.84222, "r": 545.11511, "b": 243.74878, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "normal.", "bbox": {"l": 308.862, "t": 246.79724, "r": 339.57669, "b": 255.7038, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "6.", "bbox": {"l": 320.81699, "t": 259.10222999999996, "r": 328.28894, "b": 268.00879, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "Snap all cells with bad IOU to their corresponding", "bbox": {"l": 334.88419, "t": 259.10222999999996, "r": 545.11499, "b": 268.00879, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "median", "bbox": {"l": 308.862, "t": 271.05724999999995, "r": 338.19189, "b": 279.96380999999997, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "x", "bbox": {"l": 340.68201, "t": 270.89783, "r": 346.37564, "b": 279.74463000000003, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "-coordinates and cell sizes.", "bbox": {"l": 346.37601, "t": 271.05724999999995, "r": 453.72305000000006, "b": 279.96380999999997, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "7.", "bbox": {"l": 320.81702, "t": 283.36325000000005, "r": 328.38953, "b": 292.26981, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "Generate a new set of pair-wise matches between the", "bbox": {"l": 330.9137, "t": 283.36325000000005, "r": 545.11499, "b": 292.26981, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "corrected bounding boxes and PDF cells. This time use a", "bbox": {"l": 308.86203, "t": 295.31824, "r": 545.11511, "b": 304.22479, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "modified version of the IOU metric, where the area of the", "bbox": {"l": 308.86203, "t": 307.27322, "r": 545.11505, "b": 316.17978, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "intersection between the predicted and PDF cells is divided", "bbox": {"l": 308.86203, "t": 319.22821000000005, "r": 545.11511, "b": 328.13477, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "by the PDF cell area.", "bbox": {"l": 308.86203, "t": 331.1842, "r": 397.19043, "b": 340.09076000000005, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "In case there are multiple matches", "bbox": {"l": 403.65616, "t": 331.1842, "r": 545.11511, "b": 340.09076000000005, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "for the same PDF cell, the prediction with the higher score", "bbox": {"l": 308.86203, "t": 343.13919, "r": 545.11511, "b": 352.04575, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "is preferred. This covers the cases where the PDF cells are", "bbox": {"l": 308.86203, "t": 355.09418, "r": 545.11505, "b": 364.00073, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "smaller than the area of predicted or corrected prediction", "bbox": {"l": 308.86203, "t": 367.04916, "r": 545.11505, "b": 375.95572000000004, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "cells.", "bbox": {"l": 308.86203, "t": 379.00415, "r": 329.61414, "b": 387.91071, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "8.", "bbox": {"l": 320.81702, "t": 391.31015, "r": 328.55356, "b": 400.2167099999999, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "In some rare occasions, we have noticed that Table-", "bbox": {"l": 331.13242, "t": 391.31015, "r": 545.11505, "b": 400.2167099999999, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "Former can confuse a single column as two. When the post-", "bbox": {"l": 308.86203, "t": 403.26514, "r": 545.11517, "b": 412.17169, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "processing steps are applied, this results with two predicted", "bbox": {"l": 308.86203, "t": 415.22012000000007, "r": 545.11511, "b": 424.12668, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "columns pointing to the same PDF column. In such case", "bbox": {"l": 308.86203, "t": 427.17511, "r": 545.11511, "b": 436.0816699999999, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "we must de-duplicate the columns according to highest to-", "bbox": {"l": 308.86203, "t": 439.1301, "r": 545.11505, "b": 448.03665, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "tal column intersection score.", "bbox": {"l": 308.86203, "t": 451.08507999999995, "r": 426.18161, "b": 459.99164, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "9.", "bbox": {"l": 320.81702, "t": 463.39108, "r": 328.67316, "b": 472.29764, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "Pick up the remaining orphan cells. There could be", "bbox": {"l": 331.29187, "t": 463.39108, "r": 545.11499, "b": 472.29764, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "cases, when after applying all the previous post-processing", "bbox": {"l": 308.86203, "t": 475.34607, "r": 545.11505, "b": 484.25262, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "steps, some PDF cells could still remain without any match", "bbox": {"l": 308.86203, "t": 487.30106, "r": 545.11517, "b": 496.20761, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "to predicted cells.", "bbox": {"l": 308.86203, "t": 499.25604, "r": 381.89786, "b": 508.1626, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "However, it is still possible to deduce", "bbox": {"l": 388.7023, "t": 499.25604, "r": 545.11517, "b": 508.1626, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "the correct matching for an orphan PDF cell by mapping its", "bbox": {"l": 308.86203, "t": 511.21204, "r": 545.11511, "b": 520.11859, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "bounding box on the geometry of the grid. This mapping", "bbox": {"l": 308.86203, "t": 523.16702, "r": 545.11505, "b": 532.07358, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "decides if the content of the orphan cell will be appended to", "bbox": {"l": 308.86203, "t": 535.12201, "r": 545.11499, "b": 544.02858, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "an already matched table cell, or a new table cell should be", "bbox": {"l": 308.86203, "t": 547.07703, "r": 545.11517, "b": 555.98358, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "created to match with the orphan.", "bbox": {"l": 308.86203, "t": 559.03203, "r": 442.22147000000007, "b": 567.93858, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "9a. Compute the top and bottom boundary of the hori-", "bbox": {"l": 320.81702, "t": 571.33803, "r": 545.11493, "b": 580.24458, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "zontal band for each grid row (min/max", "bbox": {"l": 308.86203, "t": 583.29303, "r": 471.64093, "b": 592.19958, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "y", "bbox": {"l": 474.83405, "t": 583.1336200000001, "r": 479.71872, "b": 591.98041, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "coordinates per", "bbox": {"l": 483.26903999999996, "t": 583.29303, "r": 545.11688, "b": 592.19958, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "row).", "bbox": {"l": 308.86206, "t": 595.24803, "r": 329.91306, "b": 604.15459, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "9b.", "bbox": {"l": 320.81705, "t": 607.55304, "r": 332.8718, "b": 616.4595899999999, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "Intersect the orphan\u2019s bounding box with the row", "bbox": {"l": 339.92532, "t": 607.55304, "r": 545.11505, "b": 616.4595899999999, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "bands, and map the cell to the closest grid row.", "bbox": {"l": 308.86206, "t": 619.50903, "r": 495.2923, "b": 628.4155900000001, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "9c. Compute the left and right boundary of the vertical", "bbox": {"l": 320.81705, "t": 631.81403, "r": 545.11505, "b": 640.72058, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "band for each grid column (min/max", "bbox": {"l": 308.86206, "t": 643.7690299999999, "r": 455.28238, "b": 652.67558, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "x", "bbox": {"l": 457.77704, "t": 643.60962, "r": 463.47067, "b": 652.45641, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "coordinates per col-", "bbox": {"l": 465.97104, "t": 643.7690299999999, "r": 545.11389, "b": 652.67558, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "umn).", "bbox": {"l": 308.86206, "t": 655.72403, "r": 332.38376, "b": 664.63059, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "9d. Intersect the orphan\u2019s bounding box with the column", "bbox": {"l": 320.81705, "t": 668.03003, "r": 545.11499, "b": 676.93659, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "bands, and map the cell to the closest grid column.", "bbox": {"l": 308.86206, "t": 679.98503, "r": 510.5848700000001, "b": 688.89159, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "9e. If the table cell under the identified row and column", "bbox": {"l": 320.81705, "t": 692.290024, "r": 545.11505, "b": 701.196594, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "is not empty, extend its content with the content of the or-", "bbox": {"l": 308.86206, "t": 704.245026, "r": 545.11517, "b": 713.151596, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": "12", "bbox": {"l": 292.63107, "t": 734.13303, "r": 302.59366, "b": 743.039593, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 30, "label": "picture", "bbox": {"l": 53.54227066040039, "t": 74.74854278564453, "r": 544.938232421875, "b": 147.59091186523438, "coord_origin": "TOPLEFT"}, "confidence": 0.6033818125724792, "cells": [{"id": 0, "text": "PubTabNet", "bbox": {"l": 119.39108, "t": 77.31055000000003, "r": 151.94641, "b": 83.25922000000003, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "b.", "bbox": {"l": 53.345978, "t": 75.19152999999994, "r": 59.327053, "b": 81.14020000000005, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "FinTabNet", "bbox": {"l": 289.5791, "t": 77.45830999999998, "r": 319.8266, "b": 83.40698000000009, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Table Bank", "bbox": {"l": 448.37271, "t": 77.25396999999987, "r": 481.75916, "b": 83.20263999999997, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Train", "bbox": {"l": 82.553436, "t": 141.27617999999995, "r": 94.976013, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Complex", "bbox": {"l": 63.03878399999999, "t": 101.10413000000005, "r": 85.290085, "b": 106.06133999999986, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Simple", "bbox": {"l": 67.76786, "t": 124.39531999999997, "r": 85.231277, "b": 129.35253999999998, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Complex", "bbox": {"l": 227.55121, "t": 102.53992000000005, "r": 249.80251, "b": 107.49712999999997, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Simple", "bbox": {"l": 232.19898999999998, "t": 126.98577999999986, "r": 249.66241, "b": 131.94299, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Simple", "bbox": {"l": 396.2337, "t": 114.04522999999995, "r": 413.69711, "b": 119.00243999999998, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Val", "bbox": {"l": 97.382202, "t": 141.27617999999995, "r": 105.08014, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "100%", "bbox": {"l": 60.93763400000001, "t": 85.73321999999996, "r": 76.151443, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "500K 10K", "bbox": {"l": 82.304901, "t": 86.22351000000003, "r": 106.99162, "b": 91.18073000000015, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Train Test Val", "bbox": {"l": 246.20530999999997, "t": 141.60608000000002, "r": 281.88013, "b": 146.56329000000005, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "100%", "bbox": {"l": 226.69780000000003, "t": 85.73321999999996, "r": 241.91161, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "91K 10K 10K", "bbox": {"l": 249.93848999999997, "t": 86.08801000000005, "r": 282.49384, "b": 91.04522999999995, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Train Test Val", "bbox": {"l": 410.19409, "t": 141.27617999999995, "r": 444.68915, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "100% 130K 5K", "bbox": {"l": 391.37341, "t": 85.73321999999996, "r": 432.6716599999999, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "10K", "bbox": {"l": 435.60571000000004, "t": 86.26140999999996, "r": 445.62414999999993, "b": 91.21862999999996, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Complex", "bbox": {"l": 113.94921, "t": 141.28845, "r": 136.20052, "b": 146.24567000000002, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Non", "bbox": {"l": 116.91554000000001, "t": 94.81853999999998, "r": 127.05433999999998, "b": 99.77575999999999, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Strict", "bbox": {"l": 113.3146, "t": 100.93853999999999, "r": 127.05298, "b": 105.89575000000002, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "HTML", "bbox": {"l": 112.94112, "t": 107.05853000000013, "r": 127.05537, "b": 112.01575000000003, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Strict", "bbox": {"l": 113.22738999999999, "t": 122.61523, "r": 126.96577, "b": 127.57245, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "HTML", "bbox": {"l": 112.85390000000001, "t": 128.73523, "r": 126.96814999999998, "b": 133.69244000000003, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "Simple", "bbox": {"l": 138.57864, "t": 141.43640000000005, "r": 156.04207, "b": 146.39362000000006, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "230K 280K", "bbox": {"l": 122.03101, "t": 86.2713, "r": 151.04185, "b": 91.22852, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "65K", "bbox": {"l": 311.65359, "t": 86.55498999999998, "r": 321.67203, "b": 91.5122100000001, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Complex", "bbox": {"l": 287.89441, "t": 141.71063000000004, "r": 310.14572, "b": 146.66785000000004, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Non", "bbox": {"l": 289.23572, "t": 93.07977000000005, "r": 299.37451, "b": 98.03698999999995, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Strict", "bbox": {"l": 285.63513, "t": 99.19976999999994, "r": 299.3735, "b": 104.15698000000009, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "HTML", "bbox": {"l": 285.26111, "t": 105.31975999999997, "r": 299.37537, "b": 110.27697999999998, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Strict", "bbox": {"l": 285.43109, "t": 120.38995, "r": 299.16946, "b": 125.34717, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "HTML", "bbox": {"l": 285.05713, "t": 126.50995, "r": 299.17139, "b": 131.46716000000004, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Simple", "bbox": {"l": 311.34592, "t": 141.71063000000004, "r": 328.80933, "b": 146.66785000000004, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "47K", "bbox": {"l": 299.58362, "t": 86.69353999999998, "r": 309.60205, "b": 91.65075999999999, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Simple", "bbox": {"l": 466.04077000000007, "t": 141.67169, "r": 483.50418, "b": 146.62891000000002, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "Non", "bbox": {"l": 459.02151, "t": 93.76116999999999, "r": 469.16031000000004, "b": 98.71838000000002, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "Strict", "bbox": {"l": 455.4209, "t": 99.88116000000002, "r": 469.15927000000005, "b": 104.83838000000003, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "HTML", "bbox": {"l": 455.04691, "t": 106.00116000000014, "r": 469.16115999999994, "b": 110.95836999999995, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "145K", "bbox": {"l": 467.39401, "t": 85.57239000000004, "r": 480.6545100000001, "b": 90.52959999999996, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Complex", "bbox": {"l": 160.37672, "t": 141.58385999999996, "r": 182.62802, "b": 146.54107999999997, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "Contain", "bbox": {"l": 153.74265, "t": 94.86481000000003, "r": 173.32664, "b": 99.82201999999995, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Missing", "bbox": {"l": 154.50967, "t": 100.98479999999995, "r": 173.3246, "b": 105.94202000000007, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "bboxes", "bbox": {"l": 155.27162, "t": 107.10479999999995, "r": 173.32664, "b": 112.06200999999987, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Contain", "bbox": {"l": 326.41302, "t": 107.23248000000001, "r": 345.99701, "b": 112.18970000000002, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "Missing", "bbox": {"l": 327.17972, "t": 113.35248000000001, "r": 345.99463, "b": 118.30969000000005, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "bboxes", "bbox": {"l": 327.94131, "t": 119.47247000000004, "r": 345.99634, "b": 124.42969000000005, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Dataset", "bbox": {"l": 488.9942, "t": 104.15374999999983, "r": 508.76384999999993, "b": 109.11095999999998, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "doesn't", "bbox": {"l": 490.1893, "t": 110.27373999999998, "r": 508.76349000000005, "b": 115.2309600000001, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "provide", "bbox": {"l": 489.72009, "t": 116.39373999999998, "r": 508.76758, "b": 121.35095000000013, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "bboxes", "bbox": {"l": 490.71121, "t": 122.51373000000001, "r": 508.76624, "b": 127.47095000000002, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Simple", "bbox": {"l": 185.37759, "t": 141.71118, "r": 202.84102, "b": 146.66840000000002, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "230K 280K", "bbox": {"l": 168.50357, "t": 86.13611000000003, "r": 197.52699, "b": 91.09331999999995, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "65K", "bbox": {"l": 357.3768, "t": 85.99707000000001, "r": 367.39523, "b": 90.95428000000004, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "Complex Simple", "bbox": {"l": 333.73151, "t": 141.62323000000004, "r": 374.92862, "b": 146.58043999999995, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "47K", "bbox": {"l": 345.69101, "t": 86.05591000000004, "r": 355.70944, "b": 91.01312000000007, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Simple", "bbox": {"l": 508.54248, "t": 141.37683000000004, "r": 526.00592, "b": 146.33405000000005, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "145K", "bbox": {"l": 510.44653000000005, "t": 86.09258999999986, "r": 523.70703, "b": 91.0498, "coord_origin": "TOPLEFT"}}], "children": [{"id": 26, "label": "text", "bbox": {"l": 119.39108, "t": 77.31055000000003, "r": 151.94641, "b": 83.25922000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 0, "text": "PubTabNet", "bbox": {"l": 119.39108, "t": 77.31055000000003, "r": 151.94641, "b": 83.25922000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 53.345978, "t": 75.19152999999994, "r": 59.327053, "b": 81.14020000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 1, "text": "b.", "bbox": {"l": 53.345978, "t": 75.19152999999994, "r": 59.327053, "b": 81.14020000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 289.5791, "t": 77.45830999999998, "r": 319.8266, "b": 83.40698000000009, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 2, "text": "FinTabNet", "bbox": {"l": 289.5791, "t": 77.45830999999998, "r": 319.8266, "b": 83.40698000000009, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 448.37271, "t": 77.25396999999987, "r": 481.75916, "b": 83.20263999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 3, "text": "Table Bank", "bbox": {"l": 448.37271, "t": 77.25396999999987, "r": 481.75916, "b": 83.20263999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 82.553436, "t": 141.27617999999995, "r": 94.976013, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 4, "text": "Train", "bbox": {"l": 82.553436, "t": 141.27617999999995, "r": 94.976013, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 63.03878399999999, "t": 101.10413000000005, "r": 85.290085, "b": 106.06133999999986, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 5, "text": "Complex", "bbox": {"l": 63.03878399999999, "t": 101.10413000000005, "r": 85.290085, "b": 106.06133999999986, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 67.76786, "t": 124.39531999999997, "r": 85.231277, "b": 129.35253999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": "Simple", "bbox": {"l": 67.76786, "t": 124.39531999999997, "r": 85.231277, "b": 129.35253999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 227.55121, "t": 102.53992000000005, "r": 249.80251, "b": 107.49712999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "Complex", "bbox": {"l": 227.55121, "t": 102.53992000000005, "r": 249.80251, "b": 107.49712999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 232.19898999999998, "t": 126.98577999999986, "r": 249.66241, "b": 131.94299, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "Simple", "bbox": {"l": 232.19898999999998, "t": 126.98577999999986, "r": 249.66241, "b": 131.94299, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 396.2337, "t": 114.04522999999995, "r": 413.69711, "b": 119.00243999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "Simple", "bbox": {"l": 396.2337, "t": 114.04522999999995, "r": 413.69711, "b": 119.00243999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 97.382202, "t": 141.27617999999995, "r": 105.08014, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "Val", "bbox": {"l": 97.382202, "t": 141.27617999999995, "r": 105.08014, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 60.93763400000001, "t": 85.73321999999996, "r": 76.151443, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "100%", "bbox": {"l": 60.93763400000001, "t": 85.73321999999996, "r": 76.151443, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 82.304901, "t": 86.22351000000003, "r": 106.99162, "b": 91.18073000000015, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "500K 10K", "bbox": {"l": 82.304901, "t": 86.22351000000003, "r": 106.99162, "b": 91.18073000000015, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 246.20530999999997, "t": 141.60608000000002, "r": 281.88013, "b": 146.56329000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "Train Test Val", "bbox": {"l": 246.20530999999997, "t": 141.60608000000002, "r": 281.88013, "b": 146.56329000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 226.69780000000003, "t": 85.73321999999996, "r": 241.91161, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "100%", "bbox": {"l": 226.69780000000003, "t": 85.73321999999996, "r": 241.91161, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 249.93848999999997, "t": 86.08801000000005, "r": 282.49384, "b": 91.04522999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "91K 10K 10K", "bbox": {"l": 249.93848999999997, "t": 86.08801000000005, "r": 282.49384, "b": 91.04522999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 410.19409, "t": 141.27617999999995, "r": 444.68915, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "Train Test Val", "bbox": {"l": 410.19409, "t": 141.27617999999995, "r": 444.68915, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 391.37341, "t": 85.73321999999996, "r": 432.6716599999999, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "100% 130K 5K", "bbox": {"l": 391.37341, "t": 85.73321999999996, "r": 432.6716599999999, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 435.60571000000004, "t": 86.26140999999996, "r": 445.62414999999993, "b": 91.21862999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "10K", "bbox": {"l": 435.60571000000004, "t": 86.26140999999996, "r": 445.62414999999993, "b": 91.21862999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 113.94921, "t": 141.28845, "r": 136.20052, "b": 146.24567000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "Complex", "bbox": {"l": 113.94921, "t": 141.28845, "r": 136.20052, "b": 146.24567000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 116.91554000000001, "t": 94.81853999999998, "r": 127.05433999999998, "b": 99.77575999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "Non", "bbox": {"l": 116.91554000000001, "t": 94.81853999999998, "r": 127.05433999999998, "b": 99.77575999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 113.3146, "t": 100.93853999999999, "r": 127.05298, "b": 105.89575000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "Strict", "bbox": {"l": 113.3146, "t": 100.93853999999999, "r": 127.05298, "b": 105.89575000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 112.94112, "t": 107.05853000000013, "r": 127.05537, "b": 112.01575000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "HTML", "bbox": {"l": 112.94112, "t": 107.05853000000013, "r": 127.05537, "b": 112.01575000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 113.22738999999999, "t": 122.61523, "r": 126.96577, "b": 127.57245, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "Strict", "bbox": {"l": 113.22738999999999, "t": 122.61523, "r": 126.96577, "b": 127.57245, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 112.85390000000001, "t": 128.73523, "r": 126.96814999999998, "b": 133.69244000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "HTML", "bbox": {"l": 112.85390000000001, "t": 128.73523, "r": 126.96814999999998, "b": 133.69244000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 138.57864, "t": 141.43640000000005, "r": 156.04207, "b": 146.39362000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "Simple", "bbox": {"l": 138.57864, "t": 141.43640000000005, "r": 156.04207, "b": 146.39362000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 122.03101, "t": 86.2713, "r": 151.04185, "b": 91.22852, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "230K 280K", "bbox": {"l": 122.03101, "t": 86.2713, "r": 151.04185, "b": 91.22852, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 311.65359, "t": 86.55498999999998, "r": 321.67203, "b": 91.5122100000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "65K", "bbox": {"l": 311.65359, "t": 86.55498999999998, "r": 321.67203, "b": 91.5122100000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 287.89441, "t": 141.71063000000004, "r": 310.14572, "b": 146.66785000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "Complex", "bbox": {"l": 287.89441, "t": 141.71063000000004, "r": 310.14572, "b": 146.66785000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 289.23572, "t": 93.07977000000005, "r": 299.37451, "b": 98.03698999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "Non", "bbox": {"l": 289.23572, "t": 93.07977000000005, "r": 299.37451, "b": 98.03698999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 285.63513, "t": 99.19976999999994, "r": 299.3735, "b": 104.15698000000009, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "Strict", "bbox": {"l": 285.63513, "t": 99.19976999999994, "r": 299.3735, "b": 104.15698000000009, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 285.26111, "t": 105.31975999999997, "r": 299.37537, "b": 110.27697999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "HTML", "bbox": {"l": 285.26111, "t": 105.31975999999997, "r": 299.37537, "b": 110.27697999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 285.43109, "t": 120.38995, "r": 299.16946, "b": 125.34717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "Strict", "bbox": {"l": 285.43109, "t": 120.38995, "r": 299.16946, "b": 125.34717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 285.05713, "t": 126.50995, "r": 299.17139, "b": 131.46716000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "HTML", "bbox": {"l": 285.05713, "t": 126.50995, "r": 299.17139, "b": 131.46716000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 311.34592, "t": 141.71063000000004, "r": 328.80933, "b": 146.66785000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "Simple", "bbox": {"l": 311.34592, "t": 141.71063000000004, "r": 328.80933, "b": 146.66785000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 299.58362, "t": 86.69353999999998, "r": 309.60205, "b": 91.65075999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "47K", "bbox": {"l": 299.58362, "t": 86.69353999999998, "r": 309.60205, "b": 91.65075999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 466.04077000000007, "t": 141.67169, "r": 483.50418, "b": 146.62891000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "Simple", "bbox": {"l": 466.04077000000007, "t": 141.67169, "r": 483.50418, "b": 146.62891000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 459.02151, "t": 93.76116999999999, "r": 469.16031000000004, "b": 98.71838000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "Non", "bbox": {"l": 459.02151, "t": 93.76116999999999, "r": 469.16031000000004, "b": 98.71838000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 455.4209, "t": 99.88116000000002, "r": 469.15927000000005, "b": 104.83838000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "Strict", "bbox": {"l": 455.4209, "t": 99.88116000000002, "r": 469.15927000000005, "b": 104.83838000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 455.04691, "t": 106.00116000000014, "r": 469.16115999999994, "b": 110.95836999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "HTML", "bbox": {"l": 455.04691, "t": 106.00116000000014, "r": 469.16115999999994, "b": 110.95836999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 467.39401, "t": 85.57239000000004, "r": 480.6545100000001, "b": 90.52959999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "145K", "bbox": {"l": 467.39401, "t": 85.57239000000004, "r": 480.6545100000001, "b": 90.52959999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 160.37672, "t": 141.58385999999996, "r": 182.62802, "b": 146.54107999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "Complex", "bbox": {"l": 160.37672, "t": 141.58385999999996, "r": 182.62802, "b": 146.54107999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 153.74265, "t": 94.86481000000003, "r": 173.32664, "b": 99.82201999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "Contain", "bbox": {"l": 153.74265, "t": 94.86481000000003, "r": 173.32664, "b": 99.82201999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 154.50967, "t": 100.98479999999995, "r": 173.3246, "b": 105.94202000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "Missing", "bbox": {"l": 154.50967, "t": 100.98479999999995, "r": 173.3246, "b": 105.94202000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 155.27162, "t": 107.10479999999995, "r": 173.32664, "b": 112.06200999999987, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "bboxes", "bbox": {"l": 155.27162, "t": 107.10479999999995, "r": 173.32664, "b": 112.06200999999987, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 326.41302, "t": 107.23248000000001, "r": 345.99701, "b": 112.18970000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "Contain", "bbox": {"l": 326.41302, "t": 107.23248000000001, "r": 345.99701, "b": 112.18970000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 327.17972, "t": 113.35248000000001, "r": 345.99463, "b": 118.30969000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "Missing", "bbox": {"l": 327.17972, "t": 113.35248000000001, "r": 345.99463, "b": 118.30969000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 327.94131, "t": 119.47247000000004, "r": 345.99634, "b": 124.42969000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "bboxes", "bbox": {"l": 327.94131, "t": 119.47247000000004, "r": 345.99634, "b": 124.42969000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 488.9942, "t": 104.15374999999983, "r": 508.76384999999993, "b": 109.11095999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "Dataset", "bbox": {"l": 488.9942, "t": 104.15374999999983, "r": 508.76384999999993, "b": 109.11095999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 490.1893, "t": 110.27373999999998, "r": 508.76349000000005, "b": 115.2309600000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "doesn't", "bbox": {"l": 490.1893, "t": 110.27373999999998, "r": 508.76349000000005, "b": 115.2309600000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 489.72009, "t": 116.39373999999998, "r": 508.76758, "b": 121.35095000000013, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "provide", "bbox": {"l": 489.72009, "t": 116.39373999999998, "r": 508.76758, "b": 121.35095000000013, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 490.71121, "t": 122.51373000000001, "r": 508.76624, "b": 127.47095000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "bboxes", "bbox": {"l": 490.71121, "t": 122.51373000000001, "r": 508.76624, "b": 127.47095000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 185.37759, "t": 141.71118, "r": 202.84102, "b": 146.66840000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "Simple", "bbox": {"l": 185.37759, "t": 141.71118, "r": 202.84102, "b": 146.66840000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 168.50357, "t": 86.13611000000003, "r": 197.52699, "b": 91.09331999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "230K 280K", "bbox": {"l": 168.50357, "t": 86.13611000000003, "r": 197.52699, "b": 91.09331999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 357.3768, "t": 85.99707000000001, "r": 367.39523, "b": 90.95428000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "65K", "bbox": {"l": 357.3768, "t": 85.99707000000001, "r": 367.39523, "b": 90.95428000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 333.73151, "t": 141.62323000000004, "r": 374.92862, "b": 146.58043999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "Complex Simple", "bbox": {"l": 333.73151, "t": 141.62323000000004, "r": 374.92862, "b": 146.58043999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 345.69101, "t": 86.05591000000004, "r": 355.70944, "b": 91.01312000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "47K", "bbox": {"l": 345.69101, "t": 86.05591000000004, "r": 355.70944, "b": 91.01312000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 508.54248, "t": 141.37683000000004, "r": 526.00592, "b": 146.33405000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "Simple", "bbox": {"l": 508.54248, "t": 141.37683000000004, "r": 526.00592, "b": 146.33405000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 510.44653000000005, "t": 86.09258999999986, "r": 523.70703, "b": 91.0498, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "145K", "bbox": {"l": 510.44653000000005, "t": 86.09258999999986, "r": 523.70703, "b": 91.0498, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 1, "label": "caption", "bbox": {"l": 50.112, "t": 165.50238000000002, "r": 545.11371, "b": 186.36395000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9661495685577393, "cells": [{"id": 59, "text": "Figure 7: Distribution of the tables across different dimensions per dataset. Simple vs complex tables per dataset and split,", "bbox": {"l": 50.112, "t": 165.50238000000002, "r": 545.11371, "b": 174.40894000000003, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "strict vs non strict html structures per dataset and table complexity, missing bboxes per dataset and table complexity.", "bbox": {"l": 50.112, "t": 177.4574, "r": 513.52234, "b": 186.36395000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "list_item", "bbox": {"l": 61.569, "t": 210.93140000000005, "r": 286.36511, "b": 231.79296999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9621952772140503, "cells": [{"id": 61, "text": "\u2022", "bbox": {"l": 61.569, "t": 210.93140000000005, "r": 71.14743, "b": 219.83794999999998, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "TableFormer output does not include the table cell con-", "bbox": {"l": 73.542038, "t": 210.93140000000005, "r": 286.36511, "b": 219.83794999999998, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "tent.", "bbox": {"l": 70.037003, "t": 222.88640999999996, "r": 87.47155, "b": 231.79296999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "list_item", "bbox": {"l": 61.569, "t": 244.07141000000001, "r": 286.36514, "b": 264.93298000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9629555344581604, "cells": [{"id": 64, "text": "\u2022", "bbox": {"l": 61.569, "t": 244.07141000000001, "r": 71.345718, "b": 252.97797000000003, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "There are occasional inaccuracies in the predictions of", "bbox": {"l": 73.789902, "t": 244.07141000000001, "r": 286.36514, "b": 252.97797000000003, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "the bounding boxes.", "bbox": {"l": 70.037003, "t": 256.02643, "r": 150.41524, "b": 264.93298000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 50.112, "t": 279.20343, "r": 286.36511, "b": 395.70688, "coord_origin": "TOPLEFT"}, "confidence": 0.9767085909843445, "cells": [{"id": 67, "text": "However, it is possible to mitigate those limitations by", "bbox": {"l": 62.067001, "t": 279.20343, "r": 286.36499, "b": 288.10999, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "combining the TableFormer predictions with the informa-", "bbox": {"l": 50.112, "t": 291.15842, "r": 286.36505, "b": 300.06497, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "tion already present inside a programmatic PDF document.", "bbox": {"l": 50.112, "t": 303.1134, "r": 286.36511, "b": 312.01996, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "More specifically, PDF documents can be seen as a se-", "bbox": {"l": 50.112, "t": 315.06839, "r": 286.36511, "b": 323.97495, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "quence of PDF cells where each cell is described by its con-", "bbox": {"l": 50.112, "t": 327.02438, "r": 286.36511, "b": 335.93093999999996, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "tent and bounding box. If we are able to associate the PDF", "bbox": {"l": 50.112, "t": 338.97937, "r": 286.36505, "b": 347.88593, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "cells with the predicted table cells, we can directly link the", "bbox": {"l": 50.112, "t": 350.93436, "r": 286.36508, "b": 359.84091, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "PDF cell content to the table cell structure and use the PDF", "bbox": {"l": 50.112, "t": 362.88934, "r": 286.36511, "b": 371.7959, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "bounding boxes to correct misalignments in the predicted", "bbox": {"l": 50.112, "t": 374.84433000000007, "r": 286.36508, "b": 383.75089, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "table cell bounding boxes.", "bbox": {"l": 50.112, "t": 386.80032, "r": 154.55988, "b": 395.70688, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 50.112, "t": 399.06934, "r": 286.36496, "b": 419.93188, "coord_origin": "TOPLEFT"}, "confidence": 0.934766411781311, "cells": [{"id": 77, "text": "Here is a step-by-step description of the prediction post-", "bbox": {"l": 62.067001, "t": 399.06934, "r": 286.36496, "b": 407.97589, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "processing:", "bbox": {"l": 50.112, "t": 411.02533, "r": 95.491638, "b": 419.93188, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "list_item", "bbox": {"l": 50.112, "t": 423.29532, "r": 286.36508, "b": 456.11185000000006, "coord_origin": "TOPLEFT"}, "confidence": 0.8280702233314514, "cells": [{"id": 79, "text": "1.", "bbox": {"l": 62.067001, "t": 423.29532, "r": 69.37281, "b": 432.20187, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "Get the minimal grid dimensions - number of rows and", "bbox": {"l": 71.808075, "t": 423.29532, "r": 286.36502, "b": 432.20187, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "columns for the predicted table structure. This represents", "bbox": {"l": 50.112, "t": 435.25031, "r": 286.36508, "b": 444.15686, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "the most granular grid for the underlying table structure.", "bbox": {"l": 50.112, "t": 447.20529, "r": 274.50958, "b": 456.11185000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "list_item", "bbox": {"l": 50.112, "t": 459.47528, "r": 286.36505, "b": 504.2468, "coord_origin": "TOPLEFT"}, "confidence": 0.9646760821342468, "cells": [{"id": 83, "text": "2.", "bbox": {"l": 62.067001, "t": 459.47528, "r": 69.538948, "b": 468.38184, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "Generate pair-wise matches between the bounding", "bbox": {"l": 77.429329, "t": 459.47528, "r": 286.36499, "b": 468.38184, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "boxes of the PDF cells and the predicted cells. The Intersec-", "bbox": {"l": 50.112, "t": 471.43027, "r": 286.36505, "b": 480.33682, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "tion Over Union (IOU) metric is used to evaluate the quality", "bbox": {"l": 50.112, "t": 483.38525, "r": 286.36505, "b": 492.29181, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "of the matches.", "bbox": {"l": 50.112, "t": 495.34024, "r": 110.70452999999999, "b": 504.2468, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "list_item", "bbox": {"l": 50.112, "t": 507.61023, "r": 286.36493, "b": 528.4727800000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9391399025917053, "cells": [{"id": 88, "text": "3.", "bbox": {"l": 62.067001, "t": 507.61023, "r": 69.863068, "b": 516.5167799999999, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "Use a carefully selected IOU threshold to designate", "bbox": {"l": 72.461754, "t": 507.61023, "r": 286.36493, "b": 516.5167799999999, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "the matches as \u201cgood\u201d ones and \u201cbad\u201d ones.", "bbox": {"l": 50.112, "t": 519.5662199999999, "r": 226.0714, "b": 528.4727800000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "list_item", "bbox": {"l": 50.112, "t": 531.83521, "r": 286.36511, "b": 564.65277, "coord_origin": "TOPLEFT"}, "confidence": 0.9491708874702454, "cells": [{"id": 91, "text": "3.a. If all IOU scores in a column are below the thresh-", "bbox": {"l": 62.067001, "t": 531.83521, "r": 286.36496, "b": 540.7417800000001, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "old, discard all predictions (structure and bounding boxes)", "bbox": {"l": 50.112, "t": 543.79121, "r": 286.36511, "b": 552.69777, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "for that column.", "bbox": {"l": 50.112, "t": 555.74622, "r": 114.03204, "b": 564.65277, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "list_item", "bbox": {"l": 50.112, "t": 568.01622, "r": 286.36508, "b": 600.83278, "coord_origin": "TOPLEFT"}, "confidence": 0.9587163329124451, "cells": [{"id": 94, "text": "4.", "bbox": {"l": 62.067001, "t": 568.01622, "r": 69.538948, "b": 576.92278, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "Find the best-fitting content alignment for the pre-", "bbox": {"l": 76.731949, "t": 568.01622, "r": 286.36502, "b": 576.92278, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "dicted cells with good IOU per each column. The alignment", "bbox": {"l": 50.112, "t": 579.97122, "r": 286.36508, "b": 588.87778, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "of the column can be identified by the following formula:", "bbox": {"l": 50.112, "t": 591.9262200000001, "r": 278.70383, "b": 600.83278, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "formula", "bbox": {"l": 110.70499, "t": 623.43591, "r": 286.3624, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9298412799835205, "cells": [{"id": 98, "text": "alignment", "bbox": {"l": 112.02799999999999, "t": 623.99382, "r": 157.9516, "b": 632.84061, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "= arg min", "bbox": {"l": 160.715, "t": 623.99382, "r": 203.4964, "b": 632.84061, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "c", "bbox": {"l": 185.58499, "t": 633.98305, "r": 189.14511, "b": 640.17578, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "{", "bbox": {"l": 203.49899, "t": 623.43591, "r": 208.48029, "b": 632.84061, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "D$_{c}$", "bbox": {"l": 208.48099, "t": 623.99382, "r": 220.28911, "b": 632.84061, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "}", "bbox": {"l": 220.78699, "t": 623.43591, "r": 225.76828, "b": 632.84061, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "D$_{c}$", "bbox": {"l": 110.70499, "t": 645.25882, "r": 122.51310999999998, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "=", "bbox": {"l": 125.77899000000001, "t": 645.25882, "r": 133.52791, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "max", "bbox": {"l": 136.295, "t": 645.25882, "r": 156.00201, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "{", "bbox": {"l": 156.00299, "t": 644.70091, "r": 160.98428, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "x$_{c}$", "bbox": {"l": 160.98399, "t": 645.25882, "r": 170.23811, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "} \u2212", "bbox": {"l": 170.73599, "t": 644.70091, "r": 185.6779, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "min", "bbox": {"l": 187.894, "t": 645.25882, "r": 206.05283, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "{", "bbox": {"l": 206.054, "t": 644.70091, "r": 211.03529, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "x$_{c}$", "bbox": {"l": 211.035, "t": 645.25882, "r": 220.28912, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "}", "bbox": {"l": 220.787, "t": 644.70091, "r": 225.76829999999998, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "(4)", "bbox": {"l": 274.746, "t": 634.88522, "r": 286.3624, "b": 643.79178, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "text", "bbox": {"l": 50.112, "t": 667.3479199999999, "r": 286.362, "b": 688.92679, "coord_origin": "TOPLEFT"}, "confidence": 0.9545555114746094, "cells": [{"id": 115, "text": "where", "bbox": {"l": 50.112, "t": 668.06522, "r": 74.45063, "b": 676.97179, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "c", "bbox": {"l": 78.335999, "t": 667.90582, "r": 82.647812, "b": 676.75261, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "is one of", "bbox": {"l": 86.532997, "t": 668.06522, "r": 123.63372, "b": 676.97179, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "{", "bbox": {"l": 127.51899999999999, "t": 667.3479199999999, "r": 132.50029, "b": 676.75261, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "left, centroid, right", "bbox": {"l": 132.50099, "t": 668.06522, "r": 210.69743, "b": 676.97179, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "}", "bbox": {"l": 210.69699, "t": 667.3479199999999, "r": 215.67828, "b": 676.75261, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "and", "bbox": {"l": 219.56299, "t": 668.06522, "r": 233.94897000000003, "b": 676.97179, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "x$_{c}$", "bbox": {"l": 237.83499000000003, "t": 667.90582, "r": 247.08911, "b": 676.75261, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "is the x-", "bbox": {"l": 251.47299000000004, "t": 668.06522, "r": 286.362, "b": 676.97179, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "coordinate for the corresponding point.", "bbox": {"l": 50.112, "t": 680.02022, "r": 205.88721, "b": 688.92679, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "list_item", "bbox": {"l": 50.112, "t": 692.290222, "r": 286.36496, "b": 713.151787, "coord_origin": "TOPLEFT"}, "confidence": 0.9260510206222534, "cells": [{"id": 125, "text": "5.", "bbox": {"l": 62.067001, "t": 692.290222, "r": 69.538948, "b": 701.196785, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "Use the alignment computed in step 4, to compute", "bbox": {"l": 76.273666, "t": 692.290222, "r": 286.36496, "b": 701.196785, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "the median", "bbox": {"l": 50.112, "t": 704.245224, "r": 94.604973, "b": 713.151787, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "x", "bbox": {"l": 97.598999, "t": 704.085815, "r": 103.29263, "b": 712.93261, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "-coordinate for all table columns and the me-", "bbox": {"l": 103.292, "t": 704.245224, "r": 286.36481, "b": 713.151787, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 308.862, "t": 210.93120999999996, "r": 545.11517, "b": 255.7038, "coord_origin": "TOPLEFT"}, "confidence": 0.8942298889160156, "cells": [{"id": 130, "text": "dian cell size for all table cells. The usage of median dur-", "bbox": {"l": 308.862, "t": 210.93120999999996, "r": 545.11517, "b": 219.83776999999998, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "ing the computations, helps to eliminate outliers caused by", "bbox": {"l": 308.862, "t": 222.88720999999998, "r": 545.11511, "b": 231.79376000000002, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "occasional column spans which are usually wider than the", "bbox": {"l": 308.862, "t": 234.84222, "r": 545.11511, "b": 243.74878, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "normal.", "bbox": {"l": 308.862, "t": 246.79724, "r": 339.57669, "b": 255.7038, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "list_item", "bbox": {"l": 308.862, "t": 259.10222999999996, "r": 545.11499, "b": 279.96380999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9423392415046692, "cells": [{"id": 134, "text": "6.", "bbox": {"l": 320.81699, "t": 259.10222999999996, "r": 328.28894, "b": 268.00879, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "Snap all cells with bad IOU to their corresponding", "bbox": {"l": 334.88419, "t": 259.10222999999996, "r": 545.11499, "b": 268.00879, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "median", "bbox": {"l": 308.862, "t": 271.05724999999995, "r": 338.19189, "b": 279.96380999999997, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "x", "bbox": {"l": 340.68201, "t": 270.89783, "r": 346.37564, "b": 279.74463000000003, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "-coordinates and cell sizes.", "bbox": {"l": 346.37601, "t": 271.05724999999995, "r": 453.72305000000006, "b": 279.96380999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "list_item", "bbox": {"l": 308.86203, "t": 283.36325000000005, "r": 545.11511, "b": 387.91071, "coord_origin": "TOPLEFT"}, "confidence": 0.9562004804611206, "cells": [{"id": 139, "text": "7.", "bbox": {"l": 320.81702, "t": 283.36325000000005, "r": 328.38953, "b": 292.26981, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "Generate a new set of pair-wise matches between the", "bbox": {"l": 330.9137, "t": 283.36325000000005, "r": 545.11499, "b": 292.26981, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "corrected bounding boxes and PDF cells. This time use a", "bbox": {"l": 308.86203, "t": 295.31824, "r": 545.11511, "b": 304.22479, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "modified version of the IOU metric, where the area of the", "bbox": {"l": 308.86203, "t": 307.27322, "r": 545.11505, "b": 316.17978, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "intersection between the predicted and PDF cells is divided", "bbox": {"l": 308.86203, "t": 319.22821000000005, "r": 545.11511, "b": 328.13477, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "by the PDF cell area.", "bbox": {"l": 308.86203, "t": 331.1842, "r": 397.19043, "b": 340.09076000000005, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "In case there are multiple matches", "bbox": {"l": 403.65616, "t": 331.1842, "r": 545.11511, "b": 340.09076000000005, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "for the same PDF cell, the prediction with the higher score", "bbox": {"l": 308.86203, "t": 343.13919, "r": 545.11511, "b": 352.04575, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "is preferred. This covers the cases where the PDF cells are", "bbox": {"l": 308.86203, "t": 355.09418, "r": 545.11505, "b": 364.00073, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "smaller than the area of predicted or corrected prediction", "bbox": {"l": 308.86203, "t": 367.04916, "r": 545.11505, "b": 375.95572000000004, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "cells.", "bbox": {"l": 308.86203, "t": 379.00415, "r": 329.61414, "b": 387.91071, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "list_item", "bbox": {"l": 308.86203, "t": 391.31015, "r": 545.11517, "b": 459.99164, "coord_origin": "TOPLEFT"}, "confidence": 0.8719939589500427, "cells": [{"id": 150, "text": "8.", "bbox": {"l": 320.81702, "t": 391.31015, "r": 328.55356, "b": 400.2167099999999, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "In some rare occasions, we have noticed that Table-", "bbox": {"l": 331.13242, "t": 391.31015, "r": 545.11505, "b": 400.2167099999999, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "Former can confuse a single column as two. When the post-", "bbox": {"l": 308.86203, "t": 403.26514, "r": 545.11517, "b": 412.17169, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "processing steps are applied, this results with two predicted", "bbox": {"l": 308.86203, "t": 415.22012000000007, "r": 545.11511, "b": 424.12668, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "columns pointing to the same PDF column. In such case", "bbox": {"l": 308.86203, "t": 427.17511, "r": 545.11511, "b": 436.0816699999999, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "we must de-duplicate the columns according to highest to-", "bbox": {"l": 308.86203, "t": 439.1301, "r": 545.11505, "b": 448.03665, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "tal column intersection score.", "bbox": {"l": 308.86203, "t": 451.08507999999995, "r": 426.18161, "b": 459.99164, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "list_item", "bbox": {"l": 308.86203, "t": 463.39108, "r": 545.11517, "b": 567.93858, "coord_origin": "TOPLEFT"}, "confidence": 0.9126082062721252, "cells": [{"id": 157, "text": "9.", "bbox": {"l": 320.81702, "t": 463.39108, "r": 328.67316, "b": 472.29764, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "Pick up the remaining orphan cells. There could be", "bbox": {"l": 331.29187, "t": 463.39108, "r": 545.11499, "b": 472.29764, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "cases, when after applying all the previous post-processing", "bbox": {"l": 308.86203, "t": 475.34607, "r": 545.11505, "b": 484.25262, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "steps, some PDF cells could still remain without any match", "bbox": {"l": 308.86203, "t": 487.30106, "r": 545.11517, "b": 496.20761, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "to predicted cells.", "bbox": {"l": 308.86203, "t": 499.25604, "r": 381.89786, "b": 508.1626, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "However, it is still possible to deduce", "bbox": {"l": 388.7023, "t": 499.25604, "r": 545.11517, "b": 508.1626, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "the correct matching for an orphan PDF cell by mapping its", "bbox": {"l": 308.86203, "t": 511.21204, "r": 545.11511, "b": 520.11859, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "bounding box on the geometry of the grid. This mapping", "bbox": {"l": 308.86203, "t": 523.16702, "r": 545.11505, "b": 532.07358, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "decides if the content of the orphan cell will be appended to", "bbox": {"l": 308.86203, "t": 535.12201, "r": 545.11499, "b": 544.02858, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "an already matched table cell, or a new table cell should be", "bbox": {"l": 308.86203, "t": 547.07703, "r": 545.11517, "b": 555.98358, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "created to match with the orphan.", "bbox": {"l": 308.86203, "t": 559.03203, "r": 442.22147000000007, "b": 567.93858, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 308.86203, "t": 571.33803, "r": 545.11688, "b": 604.15459, "coord_origin": "TOPLEFT"}, "confidence": 0.8459473848342896, "cells": [{"id": 168, "text": "9a. Compute the top and bottom boundary of the hori-", "bbox": {"l": 320.81702, "t": 571.33803, "r": 545.11493, "b": 580.24458, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "zontal band for each grid row (min/max", "bbox": {"l": 308.86203, "t": 583.29303, "r": 471.64093, "b": 592.19958, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "y", "bbox": {"l": 474.83405, "t": 583.1336200000001, "r": 479.71872, "b": 591.98041, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "coordinates per", "bbox": {"l": 483.26903999999996, "t": 583.29303, "r": 545.11688, "b": 592.19958, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "row).", "bbox": {"l": 308.86206, "t": 595.24803, "r": 329.91306, "b": 604.15459, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "list_item", "bbox": {"l": 308.86206, "t": 607.55304, "r": 545.11505, "b": 628.4155900000001, "coord_origin": "TOPLEFT"}, "confidence": 0.7716891169548035, "cells": [{"id": 173, "text": "9b.", "bbox": {"l": 320.81705, "t": 607.55304, "r": 332.8718, "b": 616.4595899999999, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "Intersect the orphan\u2019s bounding box with the row", "bbox": {"l": 339.92532, "t": 607.55304, "r": 545.11505, "b": 616.4595899999999, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "bands, and map the cell to the closest grid row.", "bbox": {"l": 308.86206, "t": 619.50903, "r": 495.2923, "b": 628.4155900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "list_item", "bbox": {"l": 308.86206, "t": 631.81403, "r": 545.11505, "b": 664.63059, "coord_origin": "TOPLEFT"}, "confidence": 0.8584907054901123, "cells": [{"id": 176, "text": "9c. Compute the left and right boundary of the vertical", "bbox": {"l": 320.81705, "t": 631.81403, "r": 545.11505, "b": 640.72058, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "band for each grid column (min/max", "bbox": {"l": 308.86206, "t": 643.7690299999999, "r": 455.28238, "b": 652.67558, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "x", "bbox": {"l": 457.77704, "t": 643.60962, "r": 463.47067, "b": 652.45641, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "coordinates per col-", "bbox": {"l": 465.97104, "t": 643.7690299999999, "r": 545.11389, "b": 652.67558, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "umn).", "bbox": {"l": 308.86206, "t": 655.72403, "r": 332.38376, "b": 664.63059, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "list_item", "bbox": {"l": 308.86206, "t": 668.03003, "r": 545.11499, "b": 688.89159, "coord_origin": "TOPLEFT"}, "confidence": 0.7590745091438293, "cells": [{"id": 181, "text": "9d. Intersect the orphan\u2019s bounding box with the column", "bbox": {"l": 320.81705, "t": 668.03003, "r": 545.11499, "b": 676.93659, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "bands, and map the cell to the closest grid column.", "bbox": {"l": 308.86206, "t": 679.98503, "r": 510.5848700000001, "b": 688.89159, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "list_item", "bbox": {"l": 308.86206, "t": 692.290024, "r": 545.11517, "b": 713.151596, "coord_origin": "TOPLEFT"}, "confidence": 0.6971189975738525, "cells": [{"id": 183, "text": "9e. If the table cell under the identified row and column", "bbox": {"l": 320.81705, "t": 692.290024, "r": 545.11505, "b": 701.196594, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "is not empty, extend its content with the content of the or-", "bbox": {"l": 308.86206, "t": 704.245026, "r": 545.11517, "b": 713.151596, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "page_footer", "bbox": {"l": 292.63107, "t": 734.13303, "r": 302.59366, "b": 743.039593, "coord_origin": "TOPLEFT"}, "confidence": 0.9126598238945007, "cells": [{"id": 185, "text": "12", "bbox": {"l": 292.63107, "t": 734.13303, "r": 302.59366, "b": 743.039593, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "picture", "id": 30, "page_no": 11, "cluster": {"id": 30, "label": "picture", "bbox": {"l": 53.54227066040039, "t": 74.74854278564453, "r": 544.938232421875, "b": 147.59091186523438, "coord_origin": "TOPLEFT"}, "confidence": 0.6033818125724792, "cells": [{"id": 0, "text": "PubTabNet", "bbox": {"l": 119.39108, "t": 77.31055000000003, "r": 151.94641, "b": 83.25922000000003, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "b.", "bbox": {"l": 53.345978, "t": 75.19152999999994, "r": 59.327053, "b": 81.14020000000005, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "FinTabNet", "bbox": {"l": 289.5791, "t": 77.45830999999998, "r": 319.8266, "b": 83.40698000000009, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Table Bank", "bbox": {"l": 448.37271, "t": 77.25396999999987, "r": 481.75916, "b": 83.20263999999997, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Train", "bbox": {"l": 82.553436, "t": 141.27617999999995, "r": 94.976013, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Complex", "bbox": {"l": 63.03878399999999, "t": 101.10413000000005, "r": 85.290085, "b": 106.06133999999986, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Simple", "bbox": {"l": 67.76786, "t": 124.39531999999997, "r": 85.231277, "b": 129.35253999999998, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Complex", "bbox": {"l": 227.55121, "t": 102.53992000000005, "r": 249.80251, "b": 107.49712999999997, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Simple", "bbox": {"l": 232.19898999999998, "t": 126.98577999999986, "r": 249.66241, "b": 131.94299, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Simple", "bbox": {"l": 396.2337, "t": 114.04522999999995, "r": 413.69711, "b": 119.00243999999998, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Val", "bbox": {"l": 97.382202, "t": 141.27617999999995, "r": 105.08014, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "100%", "bbox": {"l": 60.93763400000001, "t": 85.73321999999996, "r": 76.151443, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "500K 10K", "bbox": {"l": 82.304901, "t": 86.22351000000003, "r": 106.99162, "b": 91.18073000000015, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Train Test Val", "bbox": {"l": 246.20530999999997, "t": 141.60608000000002, "r": 281.88013, "b": 146.56329000000005, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "100%", "bbox": {"l": 226.69780000000003, "t": 85.73321999999996, "r": 241.91161, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "91K 10K 10K", "bbox": {"l": 249.93848999999997, "t": 86.08801000000005, "r": 282.49384, "b": 91.04522999999995, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Train Test Val", "bbox": {"l": 410.19409, "t": 141.27617999999995, "r": 444.68915, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "100% 130K 5K", "bbox": {"l": 391.37341, "t": 85.73321999999996, "r": 432.6716599999999, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "10K", "bbox": {"l": 435.60571000000004, "t": 86.26140999999996, "r": 445.62414999999993, "b": 91.21862999999996, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Complex", "bbox": {"l": 113.94921, "t": 141.28845, "r": 136.20052, "b": 146.24567000000002, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Non", "bbox": {"l": 116.91554000000001, "t": 94.81853999999998, "r": 127.05433999999998, "b": 99.77575999999999, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Strict", "bbox": {"l": 113.3146, "t": 100.93853999999999, "r": 127.05298, "b": 105.89575000000002, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "HTML", "bbox": {"l": 112.94112, "t": 107.05853000000013, "r": 127.05537, "b": 112.01575000000003, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Strict", "bbox": {"l": 113.22738999999999, "t": 122.61523, "r": 126.96577, "b": 127.57245, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "HTML", "bbox": {"l": 112.85390000000001, "t": 128.73523, "r": 126.96814999999998, "b": 133.69244000000003, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "Simple", "bbox": {"l": 138.57864, "t": 141.43640000000005, "r": 156.04207, "b": 146.39362000000006, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "230K 280K", "bbox": {"l": 122.03101, "t": 86.2713, "r": 151.04185, "b": 91.22852, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "65K", "bbox": {"l": 311.65359, "t": 86.55498999999998, "r": 321.67203, "b": 91.5122100000001, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Complex", "bbox": {"l": 287.89441, "t": 141.71063000000004, "r": 310.14572, "b": 146.66785000000004, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Non", "bbox": {"l": 289.23572, "t": 93.07977000000005, "r": 299.37451, "b": 98.03698999999995, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Strict", "bbox": {"l": 285.63513, "t": 99.19976999999994, "r": 299.3735, "b": 104.15698000000009, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "HTML", "bbox": {"l": 285.26111, "t": 105.31975999999997, "r": 299.37537, "b": 110.27697999999998, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Strict", "bbox": {"l": 285.43109, "t": 120.38995, "r": 299.16946, "b": 125.34717, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "HTML", "bbox": {"l": 285.05713, "t": 126.50995, "r": 299.17139, "b": 131.46716000000004, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Simple", "bbox": {"l": 311.34592, "t": 141.71063000000004, "r": 328.80933, "b": 146.66785000000004, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "47K", "bbox": {"l": 299.58362, "t": 86.69353999999998, "r": 309.60205, "b": 91.65075999999999, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Simple", "bbox": {"l": 466.04077000000007, "t": 141.67169, "r": 483.50418, "b": 146.62891000000002, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "Non", "bbox": {"l": 459.02151, "t": 93.76116999999999, "r": 469.16031000000004, "b": 98.71838000000002, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "Strict", "bbox": {"l": 455.4209, "t": 99.88116000000002, "r": 469.15927000000005, "b": 104.83838000000003, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "HTML", "bbox": {"l": 455.04691, "t": 106.00116000000014, "r": 469.16115999999994, "b": 110.95836999999995, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "145K", "bbox": {"l": 467.39401, "t": 85.57239000000004, "r": 480.6545100000001, "b": 90.52959999999996, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Complex", "bbox": {"l": 160.37672, "t": 141.58385999999996, "r": 182.62802, "b": 146.54107999999997, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "Contain", "bbox": {"l": 153.74265, "t": 94.86481000000003, "r": 173.32664, "b": 99.82201999999995, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Missing", "bbox": {"l": 154.50967, "t": 100.98479999999995, "r": 173.3246, "b": 105.94202000000007, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "bboxes", "bbox": {"l": 155.27162, "t": 107.10479999999995, "r": 173.32664, "b": 112.06200999999987, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Contain", "bbox": {"l": 326.41302, "t": 107.23248000000001, "r": 345.99701, "b": 112.18970000000002, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "Missing", "bbox": {"l": 327.17972, "t": 113.35248000000001, "r": 345.99463, "b": 118.30969000000005, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "bboxes", "bbox": {"l": 327.94131, "t": 119.47247000000004, "r": 345.99634, "b": 124.42969000000005, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Dataset", "bbox": {"l": 488.9942, "t": 104.15374999999983, "r": 508.76384999999993, "b": 109.11095999999998, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "doesn't", "bbox": {"l": 490.1893, "t": 110.27373999999998, "r": 508.76349000000005, "b": 115.2309600000001, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "provide", "bbox": {"l": 489.72009, "t": 116.39373999999998, "r": 508.76758, "b": 121.35095000000013, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "bboxes", "bbox": {"l": 490.71121, "t": 122.51373000000001, "r": 508.76624, "b": 127.47095000000002, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Simple", "bbox": {"l": 185.37759, "t": 141.71118, "r": 202.84102, "b": 146.66840000000002, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "230K 280K", "bbox": {"l": 168.50357, "t": 86.13611000000003, "r": 197.52699, "b": 91.09331999999995, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "65K", "bbox": {"l": 357.3768, "t": 85.99707000000001, "r": 367.39523, "b": 90.95428000000004, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "Complex Simple", "bbox": {"l": 333.73151, "t": 141.62323000000004, "r": 374.92862, "b": 146.58043999999995, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "47K", "bbox": {"l": 345.69101, "t": 86.05591000000004, "r": 355.70944, "b": 91.01312000000007, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Simple", "bbox": {"l": 508.54248, "t": 141.37683000000004, "r": 526.00592, "b": 146.33405000000005, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "145K", "bbox": {"l": 510.44653000000005, "t": 86.09258999999986, "r": 523.70703, "b": 91.0498, "coord_origin": "TOPLEFT"}}], "children": [{"id": 26, "label": "text", "bbox": {"l": 119.39108, "t": 77.31055000000003, "r": 151.94641, "b": 83.25922000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 0, "text": "PubTabNet", "bbox": {"l": 119.39108, "t": 77.31055000000003, "r": 151.94641, "b": 83.25922000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 53.345978, "t": 75.19152999999994, "r": 59.327053, "b": 81.14020000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 1, "text": "b.", "bbox": {"l": 53.345978, "t": 75.19152999999994, "r": 59.327053, "b": 81.14020000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 289.5791, "t": 77.45830999999998, "r": 319.8266, "b": 83.40698000000009, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 2, "text": "FinTabNet", "bbox": {"l": 289.5791, "t": 77.45830999999998, "r": 319.8266, "b": 83.40698000000009, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 448.37271, "t": 77.25396999999987, "r": 481.75916, "b": 83.20263999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 3, "text": "Table Bank", "bbox": {"l": 448.37271, "t": 77.25396999999987, "r": 481.75916, "b": 83.20263999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 82.553436, "t": 141.27617999999995, "r": 94.976013, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 4, "text": "Train", "bbox": {"l": 82.553436, "t": 141.27617999999995, "r": 94.976013, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 63.03878399999999, "t": 101.10413000000005, "r": 85.290085, "b": 106.06133999999986, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 5, "text": "Complex", "bbox": {"l": 63.03878399999999, "t": 101.10413000000005, "r": 85.290085, "b": 106.06133999999986, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 67.76786, "t": 124.39531999999997, "r": 85.231277, "b": 129.35253999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": "Simple", "bbox": {"l": 67.76786, "t": 124.39531999999997, "r": 85.231277, "b": 129.35253999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 227.55121, "t": 102.53992000000005, "r": 249.80251, "b": 107.49712999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "Complex", "bbox": {"l": 227.55121, "t": 102.53992000000005, "r": 249.80251, "b": 107.49712999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 232.19898999999998, "t": 126.98577999999986, "r": 249.66241, "b": 131.94299, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "Simple", "bbox": {"l": 232.19898999999998, "t": 126.98577999999986, "r": 249.66241, "b": 131.94299, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 396.2337, "t": 114.04522999999995, "r": 413.69711, "b": 119.00243999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "Simple", "bbox": {"l": 396.2337, "t": 114.04522999999995, "r": 413.69711, "b": 119.00243999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 97.382202, "t": 141.27617999999995, "r": 105.08014, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "Val", "bbox": {"l": 97.382202, "t": 141.27617999999995, "r": 105.08014, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 60.93763400000001, "t": 85.73321999999996, "r": 76.151443, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "100%", "bbox": {"l": 60.93763400000001, "t": 85.73321999999996, "r": 76.151443, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 82.304901, "t": 86.22351000000003, "r": 106.99162, "b": 91.18073000000015, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "500K 10K", "bbox": {"l": 82.304901, "t": 86.22351000000003, "r": 106.99162, "b": 91.18073000000015, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 246.20530999999997, "t": 141.60608000000002, "r": 281.88013, "b": 146.56329000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "Train Test Val", "bbox": {"l": 246.20530999999997, "t": 141.60608000000002, "r": 281.88013, "b": 146.56329000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 226.69780000000003, "t": 85.73321999999996, "r": 241.91161, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "100%", "bbox": {"l": 226.69780000000003, "t": 85.73321999999996, "r": 241.91161, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 249.93848999999997, "t": 86.08801000000005, "r": 282.49384, "b": 91.04522999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "91K 10K 10K", "bbox": {"l": 249.93848999999997, "t": 86.08801000000005, "r": 282.49384, "b": 91.04522999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 410.19409, "t": 141.27617999999995, "r": 444.68915, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "Train Test Val", "bbox": {"l": 410.19409, "t": 141.27617999999995, "r": 444.68915, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 391.37341, "t": 85.73321999999996, "r": 432.6716599999999, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "100% 130K 5K", "bbox": {"l": 391.37341, "t": 85.73321999999996, "r": 432.6716599999999, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 435.60571000000004, "t": 86.26140999999996, "r": 445.62414999999993, "b": 91.21862999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "10K", "bbox": {"l": 435.60571000000004, "t": 86.26140999999996, "r": 445.62414999999993, "b": 91.21862999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 113.94921, "t": 141.28845, "r": 136.20052, "b": 146.24567000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "Complex", "bbox": {"l": 113.94921, "t": 141.28845, "r": 136.20052, "b": 146.24567000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 116.91554000000001, "t": 94.81853999999998, "r": 127.05433999999998, "b": 99.77575999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "Non", "bbox": {"l": 116.91554000000001, "t": 94.81853999999998, "r": 127.05433999999998, "b": 99.77575999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 113.3146, "t": 100.93853999999999, "r": 127.05298, "b": 105.89575000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "Strict", "bbox": {"l": 113.3146, "t": 100.93853999999999, "r": 127.05298, "b": 105.89575000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 112.94112, "t": 107.05853000000013, "r": 127.05537, "b": 112.01575000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "HTML", "bbox": {"l": 112.94112, "t": 107.05853000000013, "r": 127.05537, "b": 112.01575000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 113.22738999999999, "t": 122.61523, "r": 126.96577, "b": 127.57245, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "Strict", "bbox": {"l": 113.22738999999999, "t": 122.61523, "r": 126.96577, "b": 127.57245, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 112.85390000000001, "t": 128.73523, "r": 126.96814999999998, "b": 133.69244000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "HTML", "bbox": {"l": 112.85390000000001, "t": 128.73523, "r": 126.96814999999998, "b": 133.69244000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 138.57864, "t": 141.43640000000005, "r": 156.04207, "b": 146.39362000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "Simple", "bbox": {"l": 138.57864, "t": 141.43640000000005, "r": 156.04207, "b": 146.39362000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 122.03101, "t": 86.2713, "r": 151.04185, "b": 91.22852, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "230K 280K", "bbox": {"l": 122.03101, "t": 86.2713, "r": 151.04185, "b": 91.22852, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 311.65359, "t": 86.55498999999998, "r": 321.67203, "b": 91.5122100000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "65K", "bbox": {"l": 311.65359, "t": 86.55498999999998, "r": 321.67203, "b": 91.5122100000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 287.89441, "t": 141.71063000000004, "r": 310.14572, "b": 146.66785000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "Complex", "bbox": {"l": 287.89441, "t": 141.71063000000004, "r": 310.14572, "b": 146.66785000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 289.23572, "t": 93.07977000000005, "r": 299.37451, "b": 98.03698999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "Non", "bbox": {"l": 289.23572, "t": 93.07977000000005, "r": 299.37451, "b": 98.03698999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 285.63513, "t": 99.19976999999994, "r": 299.3735, "b": 104.15698000000009, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "Strict", "bbox": {"l": 285.63513, "t": 99.19976999999994, "r": 299.3735, "b": 104.15698000000009, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 285.26111, "t": 105.31975999999997, "r": 299.37537, "b": 110.27697999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "HTML", "bbox": {"l": 285.26111, "t": 105.31975999999997, "r": 299.37537, "b": 110.27697999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 285.43109, "t": 120.38995, "r": 299.16946, "b": 125.34717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "Strict", "bbox": {"l": 285.43109, "t": 120.38995, "r": 299.16946, "b": 125.34717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 285.05713, "t": 126.50995, "r": 299.17139, "b": 131.46716000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "HTML", "bbox": {"l": 285.05713, "t": 126.50995, "r": 299.17139, "b": 131.46716000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 311.34592, "t": 141.71063000000004, "r": 328.80933, "b": 146.66785000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "Simple", "bbox": {"l": 311.34592, "t": 141.71063000000004, "r": 328.80933, "b": 146.66785000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 299.58362, "t": 86.69353999999998, "r": 309.60205, "b": 91.65075999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "47K", "bbox": {"l": 299.58362, "t": 86.69353999999998, "r": 309.60205, "b": 91.65075999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 466.04077000000007, "t": 141.67169, "r": 483.50418, "b": 146.62891000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "Simple", "bbox": {"l": 466.04077000000007, "t": 141.67169, "r": 483.50418, "b": 146.62891000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 459.02151, "t": 93.76116999999999, "r": 469.16031000000004, "b": 98.71838000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "Non", "bbox": {"l": 459.02151, "t": 93.76116999999999, "r": 469.16031000000004, "b": 98.71838000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 455.4209, "t": 99.88116000000002, "r": 469.15927000000005, "b": 104.83838000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "Strict", "bbox": {"l": 455.4209, "t": 99.88116000000002, "r": 469.15927000000005, "b": 104.83838000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 455.04691, "t": 106.00116000000014, "r": 469.16115999999994, "b": 110.95836999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "HTML", "bbox": {"l": 455.04691, "t": 106.00116000000014, "r": 469.16115999999994, "b": 110.95836999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 467.39401, "t": 85.57239000000004, "r": 480.6545100000001, "b": 90.52959999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "145K", "bbox": {"l": 467.39401, "t": 85.57239000000004, "r": 480.6545100000001, "b": 90.52959999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 160.37672, "t": 141.58385999999996, "r": 182.62802, "b": 146.54107999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "Complex", "bbox": {"l": 160.37672, "t": 141.58385999999996, "r": 182.62802, "b": 146.54107999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 153.74265, "t": 94.86481000000003, "r": 173.32664, "b": 99.82201999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "Contain", "bbox": {"l": 153.74265, "t": 94.86481000000003, "r": 173.32664, "b": 99.82201999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 154.50967, "t": 100.98479999999995, "r": 173.3246, "b": 105.94202000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "Missing", "bbox": {"l": 154.50967, "t": 100.98479999999995, "r": 173.3246, "b": 105.94202000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 155.27162, "t": 107.10479999999995, "r": 173.32664, "b": 112.06200999999987, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "bboxes", "bbox": {"l": 155.27162, "t": 107.10479999999995, "r": 173.32664, "b": 112.06200999999987, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 326.41302, "t": 107.23248000000001, "r": 345.99701, "b": 112.18970000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "Contain", "bbox": {"l": 326.41302, "t": 107.23248000000001, "r": 345.99701, "b": 112.18970000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 327.17972, "t": 113.35248000000001, "r": 345.99463, "b": 118.30969000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "Missing", "bbox": {"l": 327.17972, "t": 113.35248000000001, "r": 345.99463, "b": 118.30969000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 327.94131, "t": 119.47247000000004, "r": 345.99634, "b": 124.42969000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "bboxes", "bbox": {"l": 327.94131, "t": 119.47247000000004, "r": 345.99634, "b": 124.42969000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 488.9942, "t": 104.15374999999983, "r": 508.76384999999993, "b": 109.11095999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "Dataset", "bbox": {"l": 488.9942, "t": 104.15374999999983, "r": 508.76384999999993, "b": 109.11095999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 490.1893, "t": 110.27373999999998, "r": 508.76349000000005, "b": 115.2309600000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "doesn't", "bbox": {"l": 490.1893, "t": 110.27373999999998, "r": 508.76349000000005, "b": 115.2309600000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 489.72009, "t": 116.39373999999998, "r": 508.76758, "b": 121.35095000000013, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "provide", "bbox": {"l": 489.72009, "t": 116.39373999999998, "r": 508.76758, "b": 121.35095000000013, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 490.71121, "t": 122.51373000000001, "r": 508.76624, "b": 127.47095000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "bboxes", "bbox": {"l": 490.71121, "t": 122.51373000000001, "r": 508.76624, "b": 127.47095000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 185.37759, "t": 141.71118, "r": 202.84102, "b": 146.66840000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "Simple", "bbox": {"l": 185.37759, "t": 141.71118, "r": 202.84102, "b": 146.66840000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 168.50357, "t": 86.13611000000003, "r": 197.52699, "b": 91.09331999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "230K 280K", "bbox": {"l": 168.50357, "t": 86.13611000000003, "r": 197.52699, "b": 91.09331999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 357.3768, "t": 85.99707000000001, "r": 367.39523, "b": 90.95428000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "65K", "bbox": {"l": 357.3768, "t": 85.99707000000001, "r": 367.39523, "b": 90.95428000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 333.73151, "t": 141.62323000000004, "r": 374.92862, "b": 146.58043999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "Complex Simple", "bbox": {"l": 333.73151, "t": 141.62323000000004, "r": 374.92862, "b": 146.58043999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 345.69101, "t": 86.05591000000004, "r": 355.70944, "b": 91.01312000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "47K", "bbox": {"l": 345.69101, "t": 86.05591000000004, "r": 355.70944, "b": 91.01312000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 508.54248, "t": 141.37683000000004, "r": 526.00592, "b": 146.33405000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "Simple", "bbox": {"l": 508.54248, "t": 141.37683000000004, "r": 526.00592, "b": 146.33405000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 510.44653000000005, "t": 86.09258999999986, "r": 523.70703, "b": 91.0498, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "145K", "bbox": {"l": 510.44653000000005, "t": 86.09258999999986, "r": 523.70703, "b": 91.0498, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "caption", "id": 1, "page_no": 11, "cluster": {"id": 1, "label": "caption", "bbox": {"l": 50.112, "t": 165.50238000000002, "r": 545.11371, "b": 186.36395000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9661495685577393, "cells": [{"id": 59, "text": "Figure 7: Distribution of the tables across different dimensions per dataset. Simple vs complex tables per dataset and split,", "bbox": {"l": 50.112, "t": 165.50238000000002, "r": 545.11371, "b": 174.40894000000003, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "strict vs non strict html structures per dataset and table complexity, missing bboxes per dataset and table complexity.", "bbox": {"l": 50.112, "t": 177.4574, "r": 513.52234, "b": 186.36395000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 7: Distribution of the tables across different dimensions per dataset. Simple vs complex tables per dataset and split, strict vs non strict html structures per dataset and table complexity, missing bboxes per dataset and table complexity."}, {"label": "list_item", "id": 4, "page_no": 11, "cluster": {"id": 4, "label": "list_item", "bbox": {"l": 61.569, "t": 210.93140000000005, "r": 286.36511, "b": 231.79296999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9621952772140503, "cells": [{"id": 61, "text": "\u2022", "bbox": {"l": 61.569, "t": 210.93140000000005, "r": 71.14743, "b": 219.83794999999998, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "TableFormer output does not include the table cell con-", "bbox": {"l": 73.542038, "t": 210.93140000000005, "r": 286.36511, "b": 219.83794999999998, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "tent.", "bbox": {"l": 70.037003, "t": 222.88640999999996, "r": 87.47155, "b": 231.79296999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u2022 TableFormer output does not include the table cell content."}, {"label": "list_item", "id": 3, "page_no": 11, "cluster": {"id": 3, "label": "list_item", "bbox": {"l": 61.569, "t": 244.07141000000001, "r": 286.36514, "b": 264.93298000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9629555344581604, "cells": [{"id": 64, "text": "\u2022", "bbox": {"l": 61.569, "t": 244.07141000000001, "r": 71.345718, "b": 252.97797000000003, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "There are occasional inaccuracies in the predictions of", "bbox": {"l": 73.789902, "t": 244.07141000000001, "r": 286.36514, "b": 252.97797000000003, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "the bounding boxes.", "bbox": {"l": 70.037003, "t": 256.02643, "r": 150.41524, "b": 264.93298000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u2022 There are occasional inaccuracies in the predictions of the bounding boxes."}, {"label": "text", "id": 0, "page_no": 11, "cluster": {"id": 0, "label": "text", "bbox": {"l": 50.112, "t": 279.20343, "r": 286.36511, "b": 395.70688, "coord_origin": "TOPLEFT"}, "confidence": 0.9767085909843445, "cells": [{"id": 67, "text": "However, it is possible to mitigate those limitations by", "bbox": {"l": 62.067001, "t": 279.20343, "r": 286.36499, "b": 288.10999, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "combining the TableFormer predictions with the informa-", "bbox": {"l": 50.112, "t": 291.15842, "r": 286.36505, "b": 300.06497, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "tion already present inside a programmatic PDF document.", "bbox": {"l": 50.112, "t": 303.1134, "r": 286.36511, "b": 312.01996, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "More specifically, PDF documents can be seen as a se-", "bbox": {"l": 50.112, "t": 315.06839, "r": 286.36511, "b": 323.97495, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "quence of PDF cells where each cell is described by its con-", "bbox": {"l": 50.112, "t": 327.02438, "r": 286.36511, "b": 335.93093999999996, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "tent and bounding box. If we are able to associate the PDF", "bbox": {"l": 50.112, "t": 338.97937, "r": 286.36505, "b": 347.88593, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "cells with the predicted table cells, we can directly link the", "bbox": {"l": 50.112, "t": 350.93436, "r": 286.36508, "b": 359.84091, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "PDF cell content to the table cell structure and use the PDF", "bbox": {"l": 50.112, "t": 362.88934, "r": 286.36511, "b": 371.7959, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "bounding boxes to correct misalignments in the predicted", "bbox": {"l": 50.112, "t": 374.84433000000007, "r": 286.36508, "b": 383.75089, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "table cell bounding boxes.", "bbox": {"l": 50.112, "t": 386.80032, "r": 154.55988, "b": 395.70688, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "However, it is possible to mitigate those limitations by combining the TableFormer predictions with the information already present inside a programmatic PDF document. More specifically, PDF documents can be seen as a sequence of PDF cells where each cell is described by its content and bounding box. If we are able to associate the PDF cells with the predicted table cells, we can directly link the PDF cell content to the table cell structure and use the PDF bounding boxes to correct misalignments in the predicted table cell bounding boxes."}, {"label": "text", "id": 11, "page_no": 11, "cluster": {"id": 11, "label": "text", "bbox": {"l": 50.112, "t": 399.06934, "r": 286.36496, "b": 419.93188, "coord_origin": "TOPLEFT"}, "confidence": 0.934766411781311, "cells": [{"id": 77, "text": "Here is a step-by-step description of the prediction post-", "bbox": {"l": 62.067001, "t": 399.06934, "r": 286.36496, "b": 407.97589, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "processing:", "bbox": {"l": 50.112, "t": 411.02533, "r": 95.491638, "b": 419.93188, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Here is a step-by-step description of the prediction postprocessing:"}, {"label": "list_item", "id": 20, "page_no": 11, "cluster": {"id": 20, "label": "list_item", "bbox": {"l": 50.112, "t": 423.29532, "r": 286.36508, "b": 456.11185000000006, "coord_origin": "TOPLEFT"}, "confidence": 0.8280702233314514, "cells": [{"id": 79, "text": "1.", "bbox": {"l": 62.067001, "t": 423.29532, "r": 69.37281, "b": 432.20187, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "Get the minimal grid dimensions - number of rows and", "bbox": {"l": 71.808075, "t": 423.29532, "r": 286.36502, "b": 432.20187, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "columns for the predicted table structure. This represents", "bbox": {"l": 50.112, "t": 435.25031, "r": 286.36508, "b": 444.15686, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "the most granular grid for the underlying table structure.", "bbox": {"l": 50.112, "t": 447.20529, "r": 274.50958, "b": 456.11185000000006, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1. Get the minimal grid dimensions - number of rows and columns for the predicted table structure. This represents the most granular grid for the underlying table structure."}, {"label": "list_item", "id": 2, "page_no": 11, "cluster": {"id": 2, "label": "list_item", "bbox": {"l": 50.112, "t": 459.47528, "r": 286.36505, "b": 504.2468, "coord_origin": "TOPLEFT"}, "confidence": 0.9646760821342468, "cells": [{"id": 83, "text": "2.", "bbox": {"l": 62.067001, "t": 459.47528, "r": 69.538948, "b": 468.38184, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "Generate pair-wise matches between the bounding", "bbox": {"l": 77.429329, "t": 459.47528, "r": 286.36499, "b": 468.38184, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "boxes of the PDF cells and the predicted cells. The Intersec-", "bbox": {"l": 50.112, "t": 471.43027, "r": 286.36505, "b": 480.33682, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "tion Over Union (IOU) metric is used to evaluate the quality", "bbox": {"l": 50.112, "t": 483.38525, "r": 286.36505, "b": 492.29181, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "of the matches.", "bbox": {"l": 50.112, "t": 495.34024, "r": 110.70452999999999, "b": 504.2468, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2. Generate pair-wise matches between the bounding boxes of the PDF cells and the predicted cells. The Intersection Over Union (IOU) metric is used to evaluate the quality of the matches."}, {"label": "list_item", "id": 10, "page_no": 11, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 50.112, "t": 507.61023, "r": 286.36493, "b": 528.4727800000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9391399025917053, "cells": [{"id": 88, "text": "3.", "bbox": {"l": 62.067001, "t": 507.61023, "r": 69.863068, "b": 516.5167799999999, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "Use a carefully selected IOU threshold to designate", "bbox": {"l": 72.461754, "t": 507.61023, "r": 286.36493, "b": 516.5167799999999, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "the matches as \u201cgood\u201d ones and \u201cbad\u201d ones.", "bbox": {"l": 50.112, "t": 519.5662199999999, "r": 226.0714, "b": 528.4727800000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3. Use a carefully selected IOU threshold to designate the matches as \u201cgood\u201d ones and \u201cbad\u201d ones."}, {"label": "list_item", "id": 8, "page_no": 11, "cluster": {"id": 8, "label": "list_item", "bbox": {"l": 50.112, "t": 531.83521, "r": 286.36511, "b": 564.65277, "coord_origin": "TOPLEFT"}, "confidence": 0.9491708874702454, "cells": [{"id": 91, "text": "3.a. If all IOU scores in a column are below the thresh-", "bbox": {"l": 62.067001, "t": 531.83521, "r": 286.36496, "b": 540.7417800000001, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "old, discard all predictions (structure and bounding boxes)", "bbox": {"l": 50.112, "t": 543.79121, "r": 286.36511, "b": 552.69777, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "for that column.", "bbox": {"l": 50.112, "t": 555.74622, "r": 114.03204, "b": 564.65277, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3.a. If all IOU scores in a column are below the threshold, discard all predictions (structure and bounding boxes) for that column."}, {"label": "list_item", "id": 5, "page_no": 11, "cluster": {"id": 5, "label": "list_item", "bbox": {"l": 50.112, "t": 568.01622, "r": 286.36508, "b": 600.83278, "coord_origin": "TOPLEFT"}, "confidence": 0.9587163329124451, "cells": [{"id": 94, "text": "4.", "bbox": {"l": 62.067001, "t": 568.01622, "r": 69.538948, "b": 576.92278, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "Find the best-fitting content alignment for the pre-", "bbox": {"l": 76.731949, "t": 568.01622, "r": 286.36502, "b": 576.92278, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "dicted cells with good IOU per each column. The alignment", "bbox": {"l": 50.112, "t": 579.97122, "r": 286.36508, "b": 588.87778, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "of the column can be identified by the following formula:", "bbox": {"l": 50.112, "t": 591.9262200000001, "r": 278.70383, "b": 600.83278, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4. Find the best-fitting content alignment for the predicted cells with good IOU per each column. The alignment of the column can be identified by the following formula:"}, {"label": "formula", "id": 12, "page_no": 11, "cluster": {"id": 12, "label": "formula", "bbox": {"l": 110.70499, "t": 623.43591, "r": 286.3624, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9298412799835205, "cells": [{"id": 98, "text": "alignment", "bbox": {"l": 112.02799999999999, "t": 623.99382, "r": 157.9516, "b": 632.84061, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "= arg min", "bbox": {"l": 160.715, "t": 623.99382, "r": 203.4964, "b": 632.84061, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "c", "bbox": {"l": 185.58499, "t": 633.98305, "r": 189.14511, "b": 640.17578, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "{", "bbox": {"l": 203.49899, "t": 623.43591, "r": 208.48029, "b": 632.84061, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "D$_{c}$", "bbox": {"l": 208.48099, "t": 623.99382, "r": 220.28911, "b": 632.84061, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "}", "bbox": {"l": 220.78699, "t": 623.43591, "r": 225.76828, "b": 632.84061, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "D$_{c}$", "bbox": {"l": 110.70499, "t": 645.25882, "r": 122.51310999999998, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "=", "bbox": {"l": 125.77899000000001, "t": 645.25882, "r": 133.52791, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "max", "bbox": {"l": 136.295, "t": 645.25882, "r": 156.00201, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "{", "bbox": {"l": 156.00299, "t": 644.70091, "r": 160.98428, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "x$_{c}$", "bbox": {"l": 160.98399, "t": 645.25882, "r": 170.23811, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "} \u2212", "bbox": {"l": 170.73599, "t": 644.70091, "r": 185.6779, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "min", "bbox": {"l": 187.894, "t": 645.25882, "r": 206.05283, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "{", "bbox": {"l": 206.054, "t": 644.70091, "r": 211.03529, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "x$_{c}$", "bbox": {"l": 211.035, "t": 645.25882, "r": 220.28912, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "}", "bbox": {"l": 220.787, "t": 644.70091, "r": 225.76829999999998, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "(4)", "bbox": {"l": 274.746, "t": 634.88522, "r": 286.3624, "b": 643.79178, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "alignment = arg min c { D$_{c}$ } D$_{c}$ = max { x$_{c}$ } \u2212 min { x$_{c}$ } (4)"}, {"label": "text", "id": 7, "page_no": 11, "cluster": {"id": 7, "label": "text", "bbox": {"l": 50.112, "t": 667.3479199999999, "r": 286.362, "b": 688.92679, "coord_origin": "TOPLEFT"}, "confidence": 0.9545555114746094, "cells": [{"id": 115, "text": "where", "bbox": {"l": 50.112, "t": 668.06522, "r": 74.45063, "b": 676.97179, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "c", "bbox": {"l": 78.335999, "t": 667.90582, "r": 82.647812, "b": 676.75261, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "is one of", "bbox": {"l": 86.532997, "t": 668.06522, "r": 123.63372, "b": 676.97179, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "{", "bbox": {"l": 127.51899999999999, "t": 667.3479199999999, "r": 132.50029, "b": 676.75261, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "left, centroid, right", "bbox": {"l": 132.50099, "t": 668.06522, "r": 210.69743, "b": 676.97179, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "}", "bbox": {"l": 210.69699, "t": 667.3479199999999, "r": 215.67828, "b": 676.75261, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "and", "bbox": {"l": 219.56299, "t": 668.06522, "r": 233.94897000000003, "b": 676.97179, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "x$_{c}$", "bbox": {"l": 237.83499000000003, "t": 667.90582, "r": 247.08911, "b": 676.75261, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "is the x-", "bbox": {"l": 251.47299000000004, "t": 668.06522, "r": 286.362, "b": 676.97179, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "coordinate for the corresponding point.", "bbox": {"l": 50.112, "t": 680.02022, "r": 205.88721, "b": 688.92679, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "where c is one of { left, centroid, right } and x$_{c}$ is the xcoordinate for the corresponding point."}, {"label": "list_item", "id": 13, "page_no": 11, "cluster": {"id": 13, "label": "list_item", "bbox": {"l": 50.112, "t": 692.290222, "r": 286.36496, "b": 713.151787, "coord_origin": "TOPLEFT"}, "confidence": 0.9260510206222534, "cells": [{"id": 125, "text": "5.", "bbox": {"l": 62.067001, "t": 692.290222, "r": 69.538948, "b": 701.196785, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "Use the alignment computed in step 4, to compute", "bbox": {"l": 76.273666, "t": 692.290222, "r": 286.36496, "b": 701.196785, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "the median", "bbox": {"l": 50.112, "t": 704.245224, "r": 94.604973, "b": 713.151787, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "x", "bbox": {"l": 97.598999, "t": 704.085815, "r": 103.29263, "b": 712.93261, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "-coordinate for all table columns and the me-", "bbox": {"l": 103.292, "t": 704.245224, "r": 286.36481, "b": 713.151787, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5. Use the alignment computed in step 4, to compute the median x -coordinate for all table columns and the me-"}, {"label": "text", "id": 16, "page_no": 11, "cluster": {"id": 16, "label": "text", "bbox": {"l": 308.862, "t": 210.93120999999996, "r": 545.11517, "b": 255.7038, "coord_origin": "TOPLEFT"}, "confidence": 0.8942298889160156, "cells": [{"id": 130, "text": "dian cell size for all table cells. The usage of median dur-", "bbox": {"l": 308.862, "t": 210.93120999999996, "r": 545.11517, "b": 219.83776999999998, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "ing the computations, helps to eliminate outliers caused by", "bbox": {"l": 308.862, "t": 222.88720999999998, "r": 545.11511, "b": 231.79376000000002, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "occasional column spans which are usually wider than the", "bbox": {"l": 308.862, "t": 234.84222, "r": 545.11511, "b": 243.74878, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "normal.", "bbox": {"l": 308.862, "t": 246.79724, "r": 339.57669, "b": 255.7038, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "dian cell size for all table cells. The usage of median during the computations, helps to eliminate outliers caused by occasional column spans which are usually wider than the normal."}, {"label": "list_item", "id": 9, "page_no": 11, "cluster": {"id": 9, "label": "list_item", "bbox": {"l": 308.862, "t": 259.10222999999996, "r": 545.11499, "b": 279.96380999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9423392415046692, "cells": [{"id": 134, "text": "6.", "bbox": {"l": 320.81699, "t": 259.10222999999996, "r": 328.28894, "b": 268.00879, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "Snap all cells with bad IOU to their corresponding", "bbox": {"l": 334.88419, "t": 259.10222999999996, "r": 545.11499, "b": 268.00879, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "median", "bbox": {"l": 308.862, "t": 271.05724999999995, "r": 338.19189, "b": 279.96380999999997, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "x", "bbox": {"l": 340.68201, "t": 270.89783, "r": 346.37564, "b": 279.74463000000003, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "-coordinates and cell sizes.", "bbox": {"l": 346.37601, "t": 271.05724999999995, "r": 453.72305000000006, "b": 279.96380999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "6. Snap all cells with bad IOU to their corresponding median x -coordinates and cell sizes."}, {"label": "list_item", "id": 6, "page_no": 11, "cluster": {"id": 6, "label": "list_item", "bbox": {"l": 308.86203, "t": 283.36325000000005, "r": 545.11511, "b": 387.91071, "coord_origin": "TOPLEFT"}, "confidence": 0.9562004804611206, "cells": [{"id": 139, "text": "7.", "bbox": {"l": 320.81702, "t": 283.36325000000005, "r": 328.38953, "b": 292.26981, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "Generate a new set of pair-wise matches between the", "bbox": {"l": 330.9137, "t": 283.36325000000005, "r": 545.11499, "b": 292.26981, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "corrected bounding boxes and PDF cells. This time use a", "bbox": {"l": 308.86203, "t": 295.31824, "r": 545.11511, "b": 304.22479, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "modified version of the IOU metric, where the area of the", "bbox": {"l": 308.86203, "t": 307.27322, "r": 545.11505, "b": 316.17978, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "intersection between the predicted and PDF cells is divided", "bbox": {"l": 308.86203, "t": 319.22821000000005, "r": 545.11511, "b": 328.13477, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "by the PDF cell area.", "bbox": {"l": 308.86203, "t": 331.1842, "r": 397.19043, "b": 340.09076000000005, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "In case there are multiple matches", "bbox": {"l": 403.65616, "t": 331.1842, "r": 545.11511, "b": 340.09076000000005, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "for the same PDF cell, the prediction with the higher score", "bbox": {"l": 308.86203, "t": 343.13919, "r": 545.11511, "b": 352.04575, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "is preferred. This covers the cases where the PDF cells are", "bbox": {"l": 308.86203, "t": 355.09418, "r": 545.11505, "b": 364.00073, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "smaller than the area of predicted or corrected prediction", "bbox": {"l": 308.86203, "t": 367.04916, "r": 545.11505, "b": 375.95572000000004, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "cells.", "bbox": {"l": 308.86203, "t": 379.00415, "r": 329.61414, "b": 387.91071, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "7. Generate a new set of pair-wise matches between the corrected bounding boxes and PDF cells. This time use a modified version of the IOU metric, where the area of the intersection between the predicted and PDF cells is divided by the PDF cell area. In case there are multiple matches for the same PDF cell, the prediction with the higher score is preferred. This covers the cases where the PDF cells are smaller than the area of predicted or corrected prediction cells."}, {"label": "list_item", "id": 17, "page_no": 11, "cluster": {"id": 17, "label": "list_item", "bbox": {"l": 308.86203, "t": 391.31015, "r": 545.11517, "b": 459.99164, "coord_origin": "TOPLEFT"}, "confidence": 0.8719939589500427, "cells": [{"id": 150, "text": "8.", "bbox": {"l": 320.81702, "t": 391.31015, "r": 328.55356, "b": 400.2167099999999, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "In some rare occasions, we have noticed that Table-", "bbox": {"l": 331.13242, "t": 391.31015, "r": 545.11505, "b": 400.2167099999999, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "Former can confuse a single column as two. When the post-", "bbox": {"l": 308.86203, "t": 403.26514, "r": 545.11517, "b": 412.17169, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "processing steps are applied, this results with two predicted", "bbox": {"l": 308.86203, "t": 415.22012000000007, "r": 545.11511, "b": 424.12668, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "columns pointing to the same PDF column. In such case", "bbox": {"l": 308.86203, "t": 427.17511, "r": 545.11511, "b": 436.0816699999999, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "we must de-duplicate the columns according to highest to-", "bbox": {"l": 308.86203, "t": 439.1301, "r": 545.11505, "b": 448.03665, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "tal column intersection score.", "bbox": {"l": 308.86203, "t": 451.08507999999995, "r": 426.18161, "b": 459.99164, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "8. In some rare occasions, we have noticed that TableFormer can confuse a single column as two. When the postprocessing steps are applied, this results with two predicted columns pointing to the same PDF column. In such case we must de-duplicate the columns according to highest total column intersection score."}, {"label": "list_item", "id": 15, "page_no": 11, "cluster": {"id": 15, "label": "list_item", "bbox": {"l": 308.86203, "t": 463.39108, "r": 545.11517, "b": 567.93858, "coord_origin": "TOPLEFT"}, "confidence": 0.9126082062721252, "cells": [{"id": 157, "text": "9.", "bbox": {"l": 320.81702, "t": 463.39108, "r": 328.67316, "b": 472.29764, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "Pick up the remaining orphan cells. There could be", "bbox": {"l": 331.29187, "t": 463.39108, "r": 545.11499, "b": 472.29764, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "cases, when after applying all the previous post-processing", "bbox": {"l": 308.86203, "t": 475.34607, "r": 545.11505, "b": 484.25262, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "steps, some PDF cells could still remain without any match", "bbox": {"l": 308.86203, "t": 487.30106, "r": 545.11517, "b": 496.20761, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "to predicted cells.", "bbox": {"l": 308.86203, "t": 499.25604, "r": 381.89786, "b": 508.1626, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "However, it is still possible to deduce", "bbox": {"l": 388.7023, "t": 499.25604, "r": 545.11517, "b": 508.1626, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "the correct matching for an orphan PDF cell by mapping its", "bbox": {"l": 308.86203, "t": 511.21204, "r": 545.11511, "b": 520.11859, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "bounding box on the geometry of the grid. This mapping", "bbox": {"l": 308.86203, "t": 523.16702, "r": 545.11505, "b": 532.07358, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "decides if the content of the orphan cell will be appended to", "bbox": {"l": 308.86203, "t": 535.12201, "r": 545.11499, "b": 544.02858, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "an already matched table cell, or a new table cell should be", "bbox": {"l": 308.86203, "t": 547.07703, "r": 545.11517, "b": 555.98358, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "created to match with the orphan.", "bbox": {"l": 308.86203, "t": 559.03203, "r": 442.22147000000007, "b": 567.93858, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "9. Pick up the remaining orphan cells. There could be cases, when after applying all the previous post-processing steps, some PDF cells could still remain without any match to predicted cells. However, it is still possible to deduce the correct matching for an orphan PDF cell by mapping its bounding box on the geometry of the grid. This mapping decides if the content of the orphan cell will be appended to an already matched table cell, or a new table cell should be created to match with the orphan."}, {"label": "text", "id": 19, "page_no": 11, "cluster": {"id": 19, "label": "text", "bbox": {"l": 308.86203, "t": 571.33803, "r": 545.11688, "b": 604.15459, "coord_origin": "TOPLEFT"}, "confidence": 0.8459473848342896, "cells": [{"id": 168, "text": "9a. Compute the top and bottom boundary of the hori-", "bbox": {"l": 320.81702, "t": 571.33803, "r": 545.11493, "b": 580.24458, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "zontal band for each grid row (min/max", "bbox": {"l": 308.86203, "t": 583.29303, "r": 471.64093, "b": 592.19958, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "y", "bbox": {"l": 474.83405, "t": 583.1336200000001, "r": 479.71872, "b": 591.98041, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "coordinates per", "bbox": {"l": 483.26903999999996, "t": 583.29303, "r": 545.11688, "b": 592.19958, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "row).", "bbox": {"l": 308.86206, "t": 595.24803, "r": 329.91306, "b": 604.15459, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "9a. Compute the top and bottom boundary of the horizontal band for each grid row (min/max y coordinates per row)."}, {"label": "list_item", "id": 21, "page_no": 11, "cluster": {"id": 21, "label": "list_item", "bbox": {"l": 308.86206, "t": 607.55304, "r": 545.11505, "b": 628.4155900000001, "coord_origin": "TOPLEFT"}, "confidence": 0.7716891169548035, "cells": [{"id": 173, "text": "9b.", "bbox": {"l": 320.81705, "t": 607.55304, "r": 332.8718, "b": 616.4595899999999, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "Intersect the orphan\u2019s bounding box with the row", "bbox": {"l": 339.92532, "t": 607.55304, "r": 545.11505, "b": 616.4595899999999, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "bands, and map the cell to the closest grid row.", "bbox": {"l": 308.86206, "t": 619.50903, "r": 495.2923, "b": 628.4155900000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "9b. Intersect the orphan\u2019s bounding box with the row bands, and map the cell to the closest grid row."}, {"label": "list_item", "id": 18, "page_no": 11, "cluster": {"id": 18, "label": "list_item", "bbox": {"l": 308.86206, "t": 631.81403, "r": 545.11505, "b": 664.63059, "coord_origin": "TOPLEFT"}, "confidence": 0.8584907054901123, "cells": [{"id": 176, "text": "9c. Compute the left and right boundary of the vertical", "bbox": {"l": 320.81705, "t": 631.81403, "r": 545.11505, "b": 640.72058, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "band for each grid column (min/max", "bbox": {"l": 308.86206, "t": 643.7690299999999, "r": 455.28238, "b": 652.67558, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "x", "bbox": {"l": 457.77704, "t": 643.60962, "r": 463.47067, "b": 652.45641, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "coordinates per col-", "bbox": {"l": 465.97104, "t": 643.7690299999999, "r": 545.11389, "b": 652.67558, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "umn).", "bbox": {"l": 308.86206, "t": 655.72403, "r": 332.38376, "b": 664.63059, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "9c. Compute the left and right boundary of the vertical band for each grid column (min/max x coordinates per column)."}, {"label": "list_item", "id": 22, "page_no": 11, "cluster": {"id": 22, "label": "list_item", "bbox": {"l": 308.86206, "t": 668.03003, "r": 545.11499, "b": 688.89159, "coord_origin": "TOPLEFT"}, "confidence": 0.7590745091438293, "cells": [{"id": 181, "text": "9d. Intersect the orphan\u2019s bounding box with the column", "bbox": {"l": 320.81705, "t": 668.03003, "r": 545.11499, "b": 676.93659, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "bands, and map the cell to the closest grid column.", "bbox": {"l": 308.86206, "t": 679.98503, "r": 510.5848700000001, "b": 688.89159, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "9d. Intersect the orphan\u2019s bounding box with the column bands, and map the cell to the closest grid column."}, {"label": "list_item", "id": 25, "page_no": 11, "cluster": {"id": 25, "label": "list_item", "bbox": {"l": 308.86206, "t": 692.290024, "r": 545.11517, "b": 713.151596, "coord_origin": "TOPLEFT"}, "confidence": 0.6971189975738525, "cells": [{"id": 183, "text": "9e. If the table cell under the identified row and column", "bbox": {"l": 320.81705, "t": 692.290024, "r": 545.11505, "b": 701.196594, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "is not empty, extend its content with the content of the or-", "bbox": {"l": 308.86206, "t": 704.245026, "r": 545.11517, "b": 713.151596, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "9e. If the table cell under the identified row and column is not empty, extend its content with the content of the or-"}, {"label": "page_footer", "id": 14, "page_no": 11, "cluster": {"id": 14, "label": "page_footer", "bbox": {"l": 292.63107, "t": 734.13303, "r": 302.59366, "b": 743.039593, "coord_origin": "TOPLEFT"}, "confidence": 0.9126598238945007, "cells": [{"id": 185, "text": "12", "bbox": {"l": 292.63107, "t": 734.13303, "r": 302.59366, "b": 743.039593, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "12"}], "body": [{"label": "picture", "id": 30, "page_no": 11, "cluster": {"id": 30, "label": "picture", "bbox": {"l": 53.54227066040039, "t": 74.74854278564453, "r": 544.938232421875, "b": 147.59091186523438, "coord_origin": "TOPLEFT"}, "confidence": 0.6033818125724792, "cells": [{"id": 0, "text": "PubTabNet", "bbox": {"l": 119.39108, "t": 77.31055000000003, "r": 151.94641, "b": 83.25922000000003, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "b.", "bbox": {"l": 53.345978, "t": 75.19152999999994, "r": 59.327053, "b": 81.14020000000005, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "FinTabNet", "bbox": {"l": 289.5791, "t": 77.45830999999998, "r": 319.8266, "b": 83.40698000000009, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Table Bank", "bbox": {"l": 448.37271, "t": 77.25396999999987, "r": 481.75916, "b": 83.20263999999997, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Train", "bbox": {"l": 82.553436, "t": 141.27617999999995, "r": 94.976013, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Complex", "bbox": {"l": 63.03878399999999, "t": 101.10413000000005, "r": 85.290085, "b": 106.06133999999986, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Simple", "bbox": {"l": 67.76786, "t": 124.39531999999997, "r": 85.231277, "b": 129.35253999999998, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Complex", "bbox": {"l": 227.55121, "t": 102.53992000000005, "r": 249.80251, "b": 107.49712999999997, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Simple", "bbox": {"l": 232.19898999999998, "t": 126.98577999999986, "r": 249.66241, "b": 131.94299, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Simple", "bbox": {"l": 396.2337, "t": 114.04522999999995, "r": 413.69711, "b": 119.00243999999998, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Val", "bbox": {"l": 97.382202, "t": 141.27617999999995, "r": 105.08014, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "100%", "bbox": {"l": 60.93763400000001, "t": 85.73321999999996, "r": 76.151443, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "500K 10K", "bbox": {"l": 82.304901, "t": 86.22351000000003, "r": 106.99162, "b": 91.18073000000015, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Train Test Val", "bbox": {"l": 246.20530999999997, "t": 141.60608000000002, "r": 281.88013, "b": 146.56329000000005, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "100%", "bbox": {"l": 226.69780000000003, "t": 85.73321999999996, "r": 241.91161, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "91K 10K 10K", "bbox": {"l": 249.93848999999997, "t": 86.08801000000005, "r": 282.49384, "b": 91.04522999999995, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Train Test Val", "bbox": {"l": 410.19409, "t": 141.27617999999995, "r": 444.68915, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "100% 130K 5K", "bbox": {"l": 391.37341, "t": 85.73321999999996, "r": 432.6716599999999, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "10K", "bbox": {"l": 435.60571000000004, "t": 86.26140999999996, "r": 445.62414999999993, "b": 91.21862999999996, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Complex", "bbox": {"l": 113.94921, "t": 141.28845, "r": 136.20052, "b": 146.24567000000002, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Non", "bbox": {"l": 116.91554000000001, "t": 94.81853999999998, "r": 127.05433999999998, "b": 99.77575999999999, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Strict", "bbox": {"l": 113.3146, "t": 100.93853999999999, "r": 127.05298, "b": 105.89575000000002, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "HTML", "bbox": {"l": 112.94112, "t": 107.05853000000013, "r": 127.05537, "b": 112.01575000000003, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Strict", "bbox": {"l": 113.22738999999999, "t": 122.61523, "r": 126.96577, "b": 127.57245, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "HTML", "bbox": {"l": 112.85390000000001, "t": 128.73523, "r": 126.96814999999998, "b": 133.69244000000003, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "Simple", "bbox": {"l": 138.57864, "t": 141.43640000000005, "r": 156.04207, "b": 146.39362000000006, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "230K 280K", "bbox": {"l": 122.03101, "t": 86.2713, "r": 151.04185, "b": 91.22852, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "65K", "bbox": {"l": 311.65359, "t": 86.55498999999998, "r": 321.67203, "b": 91.5122100000001, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Complex", "bbox": {"l": 287.89441, "t": 141.71063000000004, "r": 310.14572, "b": 146.66785000000004, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Non", "bbox": {"l": 289.23572, "t": 93.07977000000005, "r": 299.37451, "b": 98.03698999999995, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Strict", "bbox": {"l": 285.63513, "t": 99.19976999999994, "r": 299.3735, "b": 104.15698000000009, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "HTML", "bbox": {"l": 285.26111, "t": 105.31975999999997, "r": 299.37537, "b": 110.27697999999998, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Strict", "bbox": {"l": 285.43109, "t": 120.38995, "r": 299.16946, "b": 125.34717, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "HTML", "bbox": {"l": 285.05713, "t": 126.50995, "r": 299.17139, "b": 131.46716000000004, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Simple", "bbox": {"l": 311.34592, "t": 141.71063000000004, "r": 328.80933, "b": 146.66785000000004, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "47K", "bbox": {"l": 299.58362, "t": 86.69353999999998, "r": 309.60205, "b": 91.65075999999999, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Simple", "bbox": {"l": 466.04077000000007, "t": 141.67169, "r": 483.50418, "b": 146.62891000000002, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "Non", "bbox": {"l": 459.02151, "t": 93.76116999999999, "r": 469.16031000000004, "b": 98.71838000000002, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "Strict", "bbox": {"l": 455.4209, "t": 99.88116000000002, "r": 469.15927000000005, "b": 104.83838000000003, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "HTML", "bbox": {"l": 455.04691, "t": 106.00116000000014, "r": 469.16115999999994, "b": 110.95836999999995, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "145K", "bbox": {"l": 467.39401, "t": 85.57239000000004, "r": 480.6545100000001, "b": 90.52959999999996, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Complex", "bbox": {"l": 160.37672, "t": 141.58385999999996, "r": 182.62802, "b": 146.54107999999997, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "Contain", "bbox": {"l": 153.74265, "t": 94.86481000000003, "r": 173.32664, "b": 99.82201999999995, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Missing", "bbox": {"l": 154.50967, "t": 100.98479999999995, "r": 173.3246, "b": 105.94202000000007, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "bboxes", "bbox": {"l": 155.27162, "t": 107.10479999999995, "r": 173.32664, "b": 112.06200999999987, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Contain", "bbox": {"l": 326.41302, "t": 107.23248000000001, "r": 345.99701, "b": 112.18970000000002, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "Missing", "bbox": {"l": 327.17972, "t": 113.35248000000001, "r": 345.99463, "b": 118.30969000000005, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "bboxes", "bbox": {"l": 327.94131, "t": 119.47247000000004, "r": 345.99634, "b": 124.42969000000005, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Dataset", "bbox": {"l": 488.9942, "t": 104.15374999999983, "r": 508.76384999999993, "b": 109.11095999999998, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "doesn't", "bbox": {"l": 490.1893, "t": 110.27373999999998, "r": 508.76349000000005, "b": 115.2309600000001, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "provide", "bbox": {"l": 489.72009, "t": 116.39373999999998, "r": 508.76758, "b": 121.35095000000013, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "bboxes", "bbox": {"l": 490.71121, "t": 122.51373000000001, "r": 508.76624, "b": 127.47095000000002, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Simple", "bbox": {"l": 185.37759, "t": 141.71118, "r": 202.84102, "b": 146.66840000000002, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "230K 280K", "bbox": {"l": 168.50357, "t": 86.13611000000003, "r": 197.52699, "b": 91.09331999999995, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "65K", "bbox": {"l": 357.3768, "t": 85.99707000000001, "r": 367.39523, "b": 90.95428000000004, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "Complex Simple", "bbox": {"l": 333.73151, "t": 141.62323000000004, "r": 374.92862, "b": 146.58043999999995, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "47K", "bbox": {"l": 345.69101, "t": 86.05591000000004, "r": 355.70944, "b": 91.01312000000007, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Simple", "bbox": {"l": 508.54248, "t": 141.37683000000004, "r": 526.00592, "b": 146.33405000000005, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "145K", "bbox": {"l": 510.44653000000005, "t": 86.09258999999986, "r": 523.70703, "b": 91.0498, "coord_origin": "TOPLEFT"}}], "children": [{"id": 26, "label": "text", "bbox": {"l": 119.39108, "t": 77.31055000000003, "r": 151.94641, "b": 83.25922000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 0, "text": "PubTabNet", "bbox": {"l": 119.39108, "t": 77.31055000000003, "r": 151.94641, "b": 83.25922000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 53.345978, "t": 75.19152999999994, "r": 59.327053, "b": 81.14020000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 1, "text": "b.", "bbox": {"l": 53.345978, "t": 75.19152999999994, "r": 59.327053, "b": 81.14020000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 289.5791, "t": 77.45830999999998, "r": 319.8266, "b": 83.40698000000009, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 2, "text": "FinTabNet", "bbox": {"l": 289.5791, "t": 77.45830999999998, "r": 319.8266, "b": 83.40698000000009, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 448.37271, "t": 77.25396999999987, "r": 481.75916, "b": 83.20263999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 3, "text": "Table Bank", "bbox": {"l": 448.37271, "t": 77.25396999999987, "r": 481.75916, "b": 83.20263999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 82.553436, "t": 141.27617999999995, "r": 94.976013, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 4, "text": "Train", "bbox": {"l": 82.553436, "t": 141.27617999999995, "r": 94.976013, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 63.03878399999999, "t": 101.10413000000005, "r": 85.290085, "b": 106.06133999999986, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 5, "text": "Complex", "bbox": {"l": 63.03878399999999, "t": 101.10413000000005, "r": 85.290085, "b": 106.06133999999986, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 67.76786, "t": 124.39531999999997, "r": 85.231277, "b": 129.35253999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": "Simple", "bbox": {"l": 67.76786, "t": 124.39531999999997, "r": 85.231277, "b": 129.35253999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 227.55121, "t": 102.53992000000005, "r": 249.80251, "b": 107.49712999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "Complex", "bbox": {"l": 227.55121, "t": 102.53992000000005, "r": 249.80251, "b": 107.49712999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 232.19898999999998, "t": 126.98577999999986, "r": 249.66241, "b": 131.94299, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "Simple", "bbox": {"l": 232.19898999999998, "t": 126.98577999999986, "r": 249.66241, "b": 131.94299, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 396.2337, "t": 114.04522999999995, "r": 413.69711, "b": 119.00243999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "Simple", "bbox": {"l": 396.2337, "t": 114.04522999999995, "r": 413.69711, "b": 119.00243999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 97.382202, "t": 141.27617999999995, "r": 105.08014, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "Val", "bbox": {"l": 97.382202, "t": 141.27617999999995, "r": 105.08014, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 60.93763400000001, "t": 85.73321999999996, "r": 76.151443, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "100%", "bbox": {"l": 60.93763400000001, "t": 85.73321999999996, "r": 76.151443, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 82.304901, "t": 86.22351000000003, "r": 106.99162, "b": 91.18073000000015, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "500K 10K", "bbox": {"l": 82.304901, "t": 86.22351000000003, "r": 106.99162, "b": 91.18073000000015, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 246.20530999999997, "t": 141.60608000000002, "r": 281.88013, "b": 146.56329000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "Train Test Val", "bbox": {"l": 246.20530999999997, "t": 141.60608000000002, "r": 281.88013, "b": 146.56329000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 226.69780000000003, "t": 85.73321999999996, "r": 241.91161, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "100%", "bbox": {"l": 226.69780000000003, "t": 85.73321999999996, "r": 241.91161, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 249.93848999999997, "t": 86.08801000000005, "r": 282.49384, "b": 91.04522999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "91K 10K 10K", "bbox": {"l": 249.93848999999997, "t": 86.08801000000005, "r": 282.49384, "b": 91.04522999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 410.19409, "t": 141.27617999999995, "r": 444.68915, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "Train Test Val", "bbox": {"l": 410.19409, "t": 141.27617999999995, "r": 444.68915, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 391.37341, "t": 85.73321999999996, "r": 432.6716599999999, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "100% 130K 5K", "bbox": {"l": 391.37341, "t": 85.73321999999996, "r": 432.6716599999999, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 435.60571000000004, "t": 86.26140999999996, "r": 445.62414999999993, "b": 91.21862999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "10K", "bbox": {"l": 435.60571000000004, "t": 86.26140999999996, "r": 445.62414999999993, "b": 91.21862999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 113.94921, "t": 141.28845, "r": 136.20052, "b": 146.24567000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "Complex", "bbox": {"l": 113.94921, "t": 141.28845, "r": 136.20052, "b": 146.24567000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 116.91554000000001, "t": 94.81853999999998, "r": 127.05433999999998, "b": 99.77575999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "Non", "bbox": {"l": 116.91554000000001, "t": 94.81853999999998, "r": 127.05433999999998, "b": 99.77575999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 113.3146, "t": 100.93853999999999, "r": 127.05298, "b": 105.89575000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "Strict", "bbox": {"l": 113.3146, "t": 100.93853999999999, "r": 127.05298, "b": 105.89575000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 112.94112, "t": 107.05853000000013, "r": 127.05537, "b": 112.01575000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "HTML", "bbox": {"l": 112.94112, "t": 107.05853000000013, "r": 127.05537, "b": 112.01575000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 113.22738999999999, "t": 122.61523, "r": 126.96577, "b": 127.57245, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "Strict", "bbox": {"l": 113.22738999999999, "t": 122.61523, "r": 126.96577, "b": 127.57245, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 112.85390000000001, "t": 128.73523, "r": 126.96814999999998, "b": 133.69244000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "HTML", "bbox": {"l": 112.85390000000001, "t": 128.73523, "r": 126.96814999999998, "b": 133.69244000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 138.57864, "t": 141.43640000000005, "r": 156.04207, "b": 146.39362000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "Simple", "bbox": {"l": 138.57864, "t": 141.43640000000005, "r": 156.04207, "b": 146.39362000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 122.03101, "t": 86.2713, "r": 151.04185, "b": 91.22852, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "230K 280K", "bbox": {"l": 122.03101, "t": 86.2713, "r": 151.04185, "b": 91.22852, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 311.65359, "t": 86.55498999999998, "r": 321.67203, "b": 91.5122100000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "65K", "bbox": {"l": 311.65359, "t": 86.55498999999998, "r": 321.67203, "b": 91.5122100000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 287.89441, "t": 141.71063000000004, "r": 310.14572, "b": 146.66785000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "Complex", "bbox": {"l": 287.89441, "t": 141.71063000000004, "r": 310.14572, "b": 146.66785000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 289.23572, "t": 93.07977000000005, "r": 299.37451, "b": 98.03698999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "Non", "bbox": {"l": 289.23572, "t": 93.07977000000005, "r": 299.37451, "b": 98.03698999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 285.63513, "t": 99.19976999999994, "r": 299.3735, "b": 104.15698000000009, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "Strict", "bbox": {"l": 285.63513, "t": 99.19976999999994, "r": 299.3735, "b": 104.15698000000009, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 285.26111, "t": 105.31975999999997, "r": 299.37537, "b": 110.27697999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "HTML", "bbox": {"l": 285.26111, "t": 105.31975999999997, "r": 299.37537, "b": 110.27697999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 285.43109, "t": 120.38995, "r": 299.16946, "b": 125.34717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "Strict", "bbox": {"l": 285.43109, "t": 120.38995, "r": 299.16946, "b": 125.34717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 285.05713, "t": 126.50995, "r": 299.17139, "b": 131.46716000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "HTML", "bbox": {"l": 285.05713, "t": 126.50995, "r": 299.17139, "b": 131.46716000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 311.34592, "t": 141.71063000000004, "r": 328.80933, "b": 146.66785000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "Simple", "bbox": {"l": 311.34592, "t": 141.71063000000004, "r": 328.80933, "b": 146.66785000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 299.58362, "t": 86.69353999999998, "r": 309.60205, "b": 91.65075999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "47K", "bbox": {"l": 299.58362, "t": 86.69353999999998, "r": 309.60205, "b": 91.65075999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 466.04077000000007, "t": 141.67169, "r": 483.50418, "b": 146.62891000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "Simple", "bbox": {"l": 466.04077000000007, "t": 141.67169, "r": 483.50418, "b": 146.62891000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 459.02151, "t": 93.76116999999999, "r": 469.16031000000004, "b": 98.71838000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "Non", "bbox": {"l": 459.02151, "t": 93.76116999999999, "r": 469.16031000000004, "b": 98.71838000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 455.4209, "t": 99.88116000000002, "r": 469.15927000000005, "b": 104.83838000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "Strict", "bbox": {"l": 455.4209, "t": 99.88116000000002, "r": 469.15927000000005, "b": 104.83838000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 455.04691, "t": 106.00116000000014, "r": 469.16115999999994, "b": 110.95836999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "HTML", "bbox": {"l": 455.04691, "t": 106.00116000000014, "r": 469.16115999999994, "b": 110.95836999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 467.39401, "t": 85.57239000000004, "r": 480.6545100000001, "b": 90.52959999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "145K", "bbox": {"l": 467.39401, "t": 85.57239000000004, "r": 480.6545100000001, "b": 90.52959999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 160.37672, "t": 141.58385999999996, "r": 182.62802, "b": 146.54107999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "Complex", "bbox": {"l": 160.37672, "t": 141.58385999999996, "r": 182.62802, "b": 146.54107999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 153.74265, "t": 94.86481000000003, "r": 173.32664, "b": 99.82201999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "Contain", "bbox": {"l": 153.74265, "t": 94.86481000000003, "r": 173.32664, "b": 99.82201999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 154.50967, "t": 100.98479999999995, "r": 173.3246, "b": 105.94202000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "Missing", "bbox": {"l": 154.50967, "t": 100.98479999999995, "r": 173.3246, "b": 105.94202000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 155.27162, "t": 107.10479999999995, "r": 173.32664, "b": 112.06200999999987, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "bboxes", "bbox": {"l": 155.27162, "t": 107.10479999999995, "r": 173.32664, "b": 112.06200999999987, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 326.41302, "t": 107.23248000000001, "r": 345.99701, "b": 112.18970000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "Contain", "bbox": {"l": 326.41302, "t": 107.23248000000001, "r": 345.99701, "b": 112.18970000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 327.17972, "t": 113.35248000000001, "r": 345.99463, "b": 118.30969000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "Missing", "bbox": {"l": 327.17972, "t": 113.35248000000001, "r": 345.99463, "b": 118.30969000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 327.94131, "t": 119.47247000000004, "r": 345.99634, "b": 124.42969000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "bboxes", "bbox": {"l": 327.94131, "t": 119.47247000000004, "r": 345.99634, "b": 124.42969000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 488.9942, "t": 104.15374999999983, "r": 508.76384999999993, "b": 109.11095999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "Dataset", "bbox": {"l": 488.9942, "t": 104.15374999999983, "r": 508.76384999999993, "b": 109.11095999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 490.1893, "t": 110.27373999999998, "r": 508.76349000000005, "b": 115.2309600000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "doesn't", "bbox": {"l": 490.1893, "t": 110.27373999999998, "r": 508.76349000000005, "b": 115.2309600000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 489.72009, "t": 116.39373999999998, "r": 508.76758, "b": 121.35095000000013, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "provide", "bbox": {"l": 489.72009, "t": 116.39373999999998, "r": 508.76758, "b": 121.35095000000013, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 490.71121, "t": 122.51373000000001, "r": 508.76624, "b": 127.47095000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "bboxes", "bbox": {"l": 490.71121, "t": 122.51373000000001, "r": 508.76624, "b": 127.47095000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 185.37759, "t": 141.71118, "r": 202.84102, "b": 146.66840000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "Simple", "bbox": {"l": 185.37759, "t": 141.71118, "r": 202.84102, "b": 146.66840000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 168.50357, "t": 86.13611000000003, "r": 197.52699, "b": 91.09331999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "230K 280K", "bbox": {"l": 168.50357, "t": 86.13611000000003, "r": 197.52699, "b": 91.09331999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 357.3768, "t": 85.99707000000001, "r": 367.39523, "b": 90.95428000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "65K", "bbox": {"l": 357.3768, "t": 85.99707000000001, "r": 367.39523, "b": 90.95428000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 333.73151, "t": 141.62323000000004, "r": 374.92862, "b": 146.58043999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "Complex Simple", "bbox": {"l": 333.73151, "t": 141.62323000000004, "r": 374.92862, "b": 146.58043999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 345.69101, "t": 86.05591000000004, "r": 355.70944, "b": 91.01312000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "47K", "bbox": {"l": 345.69101, "t": 86.05591000000004, "r": 355.70944, "b": 91.01312000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 508.54248, "t": 141.37683000000004, "r": 526.00592, "b": 146.33405000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "Simple", "bbox": {"l": 508.54248, "t": 141.37683000000004, "r": 526.00592, "b": 146.33405000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 510.44653000000005, "t": 86.09258999999986, "r": 523.70703, "b": 91.0498, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "145K", "bbox": {"l": 510.44653000000005, "t": 86.09258999999986, "r": 523.70703, "b": 91.0498, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "caption", "id": 1, "page_no": 11, "cluster": {"id": 1, "label": "caption", "bbox": {"l": 50.112, "t": 165.50238000000002, "r": 545.11371, "b": 186.36395000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9661495685577393, "cells": [{"id": 59, "text": "Figure 7: Distribution of the tables across different dimensions per dataset. Simple vs complex tables per dataset and split,", "bbox": {"l": 50.112, "t": 165.50238000000002, "r": 545.11371, "b": 174.40894000000003, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "strict vs non strict html structures per dataset and table complexity, missing bboxes per dataset and table complexity.", "bbox": {"l": 50.112, "t": 177.4574, "r": 513.52234, "b": 186.36395000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 7: Distribution of the tables across different dimensions per dataset. Simple vs complex tables per dataset and split, strict vs non strict html structures per dataset and table complexity, missing bboxes per dataset and table complexity."}, {"label": "list_item", "id": 4, "page_no": 11, "cluster": {"id": 4, "label": "list_item", "bbox": {"l": 61.569, "t": 210.93140000000005, "r": 286.36511, "b": 231.79296999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9621952772140503, "cells": [{"id": 61, "text": "\u2022", "bbox": {"l": 61.569, "t": 210.93140000000005, "r": 71.14743, "b": 219.83794999999998, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "TableFormer output does not include the table cell con-", "bbox": {"l": 73.542038, "t": 210.93140000000005, "r": 286.36511, "b": 219.83794999999998, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "tent.", "bbox": {"l": 70.037003, "t": 222.88640999999996, "r": 87.47155, "b": 231.79296999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u2022 TableFormer output does not include the table cell content."}, {"label": "list_item", "id": 3, "page_no": 11, "cluster": {"id": 3, "label": "list_item", "bbox": {"l": 61.569, "t": 244.07141000000001, "r": 286.36514, "b": 264.93298000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9629555344581604, "cells": [{"id": 64, "text": "\u2022", "bbox": {"l": 61.569, "t": 244.07141000000001, "r": 71.345718, "b": 252.97797000000003, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "There are occasional inaccuracies in the predictions of", "bbox": {"l": 73.789902, "t": 244.07141000000001, "r": 286.36514, "b": 252.97797000000003, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "the bounding boxes.", "bbox": {"l": 70.037003, "t": 256.02643, "r": 150.41524, "b": 264.93298000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u2022 There are occasional inaccuracies in the predictions of the bounding boxes."}, {"label": "text", "id": 0, "page_no": 11, "cluster": {"id": 0, "label": "text", "bbox": {"l": 50.112, "t": 279.20343, "r": 286.36511, "b": 395.70688, "coord_origin": "TOPLEFT"}, "confidence": 0.9767085909843445, "cells": [{"id": 67, "text": "However, it is possible to mitigate those limitations by", "bbox": {"l": 62.067001, "t": 279.20343, "r": 286.36499, "b": 288.10999, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "combining the TableFormer predictions with the informa-", "bbox": {"l": 50.112, "t": 291.15842, "r": 286.36505, "b": 300.06497, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "tion already present inside a programmatic PDF document.", "bbox": {"l": 50.112, "t": 303.1134, "r": 286.36511, "b": 312.01996, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "More specifically, PDF documents can be seen as a se-", "bbox": {"l": 50.112, "t": 315.06839, "r": 286.36511, "b": 323.97495, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "quence of PDF cells where each cell is described by its con-", "bbox": {"l": 50.112, "t": 327.02438, "r": 286.36511, "b": 335.93093999999996, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "tent and bounding box. If we are able to associate the PDF", "bbox": {"l": 50.112, "t": 338.97937, "r": 286.36505, "b": 347.88593, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "cells with the predicted table cells, we can directly link the", "bbox": {"l": 50.112, "t": 350.93436, "r": 286.36508, "b": 359.84091, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "PDF cell content to the table cell structure and use the PDF", "bbox": {"l": 50.112, "t": 362.88934, "r": 286.36511, "b": 371.7959, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "bounding boxes to correct misalignments in the predicted", "bbox": {"l": 50.112, "t": 374.84433000000007, "r": 286.36508, "b": 383.75089, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "table cell bounding boxes.", "bbox": {"l": 50.112, "t": 386.80032, "r": 154.55988, "b": 395.70688, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "However, it is possible to mitigate those limitations by combining the TableFormer predictions with the information already present inside a programmatic PDF document. More specifically, PDF documents can be seen as a sequence of PDF cells where each cell is described by its content and bounding box. If we are able to associate the PDF cells with the predicted table cells, we can directly link the PDF cell content to the table cell structure and use the PDF bounding boxes to correct misalignments in the predicted table cell bounding boxes."}, {"label": "text", "id": 11, "page_no": 11, "cluster": {"id": 11, "label": "text", "bbox": {"l": 50.112, "t": 399.06934, "r": 286.36496, "b": 419.93188, "coord_origin": "TOPLEFT"}, "confidence": 0.934766411781311, "cells": [{"id": 77, "text": "Here is a step-by-step description of the prediction post-", "bbox": {"l": 62.067001, "t": 399.06934, "r": 286.36496, "b": 407.97589, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "processing:", "bbox": {"l": 50.112, "t": 411.02533, "r": 95.491638, "b": 419.93188, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Here is a step-by-step description of the prediction postprocessing:"}, {"label": "list_item", "id": 20, "page_no": 11, "cluster": {"id": 20, "label": "list_item", "bbox": {"l": 50.112, "t": 423.29532, "r": 286.36508, "b": 456.11185000000006, "coord_origin": "TOPLEFT"}, "confidence": 0.8280702233314514, "cells": [{"id": 79, "text": "1.", "bbox": {"l": 62.067001, "t": 423.29532, "r": 69.37281, "b": 432.20187, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "Get the minimal grid dimensions - number of rows and", "bbox": {"l": 71.808075, "t": 423.29532, "r": 286.36502, "b": 432.20187, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "columns for the predicted table structure. This represents", "bbox": {"l": 50.112, "t": 435.25031, "r": 286.36508, "b": 444.15686, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "the most granular grid for the underlying table structure.", "bbox": {"l": 50.112, "t": 447.20529, "r": 274.50958, "b": 456.11185000000006, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1. Get the minimal grid dimensions - number of rows and columns for the predicted table structure. This represents the most granular grid for the underlying table structure."}, {"label": "list_item", "id": 2, "page_no": 11, "cluster": {"id": 2, "label": "list_item", "bbox": {"l": 50.112, "t": 459.47528, "r": 286.36505, "b": 504.2468, "coord_origin": "TOPLEFT"}, "confidence": 0.9646760821342468, "cells": [{"id": 83, "text": "2.", "bbox": {"l": 62.067001, "t": 459.47528, "r": 69.538948, "b": 468.38184, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "Generate pair-wise matches between the bounding", "bbox": {"l": 77.429329, "t": 459.47528, "r": 286.36499, "b": 468.38184, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "boxes of the PDF cells and the predicted cells. The Intersec-", "bbox": {"l": 50.112, "t": 471.43027, "r": 286.36505, "b": 480.33682, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "tion Over Union (IOU) metric is used to evaluate the quality", "bbox": {"l": 50.112, "t": 483.38525, "r": 286.36505, "b": 492.29181, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "of the matches.", "bbox": {"l": 50.112, "t": 495.34024, "r": 110.70452999999999, "b": 504.2468, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2. Generate pair-wise matches between the bounding boxes of the PDF cells and the predicted cells. The Intersection Over Union (IOU) metric is used to evaluate the quality of the matches."}, {"label": "list_item", "id": 10, "page_no": 11, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 50.112, "t": 507.61023, "r": 286.36493, "b": 528.4727800000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9391399025917053, "cells": [{"id": 88, "text": "3.", "bbox": {"l": 62.067001, "t": 507.61023, "r": 69.863068, "b": 516.5167799999999, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "Use a carefully selected IOU threshold to designate", "bbox": {"l": 72.461754, "t": 507.61023, "r": 286.36493, "b": 516.5167799999999, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "the matches as \u201cgood\u201d ones and \u201cbad\u201d ones.", "bbox": {"l": 50.112, "t": 519.5662199999999, "r": 226.0714, "b": 528.4727800000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3. Use a carefully selected IOU threshold to designate the matches as \u201cgood\u201d ones and \u201cbad\u201d ones."}, {"label": "list_item", "id": 8, "page_no": 11, "cluster": {"id": 8, "label": "list_item", "bbox": {"l": 50.112, "t": 531.83521, "r": 286.36511, "b": 564.65277, "coord_origin": "TOPLEFT"}, "confidence": 0.9491708874702454, "cells": [{"id": 91, "text": "3.a. If all IOU scores in a column are below the thresh-", "bbox": {"l": 62.067001, "t": 531.83521, "r": 286.36496, "b": 540.7417800000001, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "old, discard all predictions (structure and bounding boxes)", "bbox": {"l": 50.112, "t": 543.79121, "r": 286.36511, "b": 552.69777, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "for that column.", "bbox": {"l": 50.112, "t": 555.74622, "r": 114.03204, "b": 564.65277, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3.a. If all IOU scores in a column are below the threshold, discard all predictions (structure and bounding boxes) for that column."}, {"label": "list_item", "id": 5, "page_no": 11, "cluster": {"id": 5, "label": "list_item", "bbox": {"l": 50.112, "t": 568.01622, "r": 286.36508, "b": 600.83278, "coord_origin": "TOPLEFT"}, "confidence": 0.9587163329124451, "cells": [{"id": 94, "text": "4.", "bbox": {"l": 62.067001, "t": 568.01622, "r": 69.538948, "b": 576.92278, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "Find the best-fitting content alignment for the pre-", "bbox": {"l": 76.731949, "t": 568.01622, "r": 286.36502, "b": 576.92278, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "dicted cells with good IOU per each column. The alignment", "bbox": {"l": 50.112, "t": 579.97122, "r": 286.36508, "b": 588.87778, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "of the column can be identified by the following formula:", "bbox": {"l": 50.112, "t": 591.9262200000001, "r": 278.70383, "b": 600.83278, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4. Find the best-fitting content alignment for the predicted cells with good IOU per each column. The alignment of the column can be identified by the following formula:"}, {"label": "formula", "id": 12, "page_no": 11, "cluster": {"id": 12, "label": "formula", "bbox": {"l": 110.70499, "t": 623.43591, "r": 286.3624, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9298412799835205, "cells": [{"id": 98, "text": "alignment", "bbox": {"l": 112.02799999999999, "t": 623.99382, "r": 157.9516, "b": 632.84061, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "= arg min", "bbox": {"l": 160.715, "t": 623.99382, "r": 203.4964, "b": 632.84061, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "c", "bbox": {"l": 185.58499, "t": 633.98305, "r": 189.14511, "b": 640.17578, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "{", "bbox": {"l": 203.49899, "t": 623.43591, "r": 208.48029, "b": 632.84061, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "D$_{c}$", "bbox": {"l": 208.48099, "t": 623.99382, "r": 220.28911, "b": 632.84061, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "}", "bbox": {"l": 220.78699, "t": 623.43591, "r": 225.76828, "b": 632.84061, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "D$_{c}$", "bbox": {"l": 110.70499, "t": 645.25882, "r": 122.51310999999998, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "=", "bbox": {"l": 125.77899000000001, "t": 645.25882, "r": 133.52791, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "max", "bbox": {"l": 136.295, "t": 645.25882, "r": 156.00201, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "{", "bbox": {"l": 156.00299, "t": 644.70091, "r": 160.98428, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "x$_{c}$", "bbox": {"l": 160.98399, "t": 645.25882, "r": 170.23811, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "} \u2212", "bbox": {"l": 170.73599, "t": 644.70091, "r": 185.6779, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "min", "bbox": {"l": 187.894, "t": 645.25882, "r": 206.05283, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "{", "bbox": {"l": 206.054, "t": 644.70091, "r": 211.03529, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "x$_{c}$", "bbox": {"l": 211.035, "t": 645.25882, "r": 220.28912, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "}", "bbox": {"l": 220.787, "t": 644.70091, "r": 225.76829999999998, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "(4)", "bbox": {"l": 274.746, "t": 634.88522, "r": 286.3624, "b": 643.79178, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "alignment = arg min c { D$_{c}$ } D$_{c}$ = max { x$_{c}$ } \u2212 min { x$_{c}$ } (4)"}, {"label": "text", "id": 7, "page_no": 11, "cluster": {"id": 7, "label": "text", "bbox": {"l": 50.112, "t": 667.3479199999999, "r": 286.362, "b": 688.92679, "coord_origin": "TOPLEFT"}, "confidence": 0.9545555114746094, "cells": [{"id": 115, "text": "where", "bbox": {"l": 50.112, "t": 668.06522, "r": 74.45063, "b": 676.97179, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "c", "bbox": {"l": 78.335999, "t": 667.90582, "r": 82.647812, "b": 676.75261, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "is one of", "bbox": {"l": 86.532997, "t": 668.06522, "r": 123.63372, "b": 676.97179, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "{", "bbox": {"l": 127.51899999999999, "t": 667.3479199999999, "r": 132.50029, "b": 676.75261, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "left, centroid, right", "bbox": {"l": 132.50099, "t": 668.06522, "r": 210.69743, "b": 676.97179, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "}", "bbox": {"l": 210.69699, "t": 667.3479199999999, "r": 215.67828, "b": 676.75261, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "and", "bbox": {"l": 219.56299, "t": 668.06522, "r": 233.94897000000003, "b": 676.97179, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "x$_{c}$", "bbox": {"l": 237.83499000000003, "t": 667.90582, "r": 247.08911, "b": 676.75261, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "is the x-", "bbox": {"l": 251.47299000000004, "t": 668.06522, "r": 286.362, "b": 676.97179, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "coordinate for the corresponding point.", "bbox": {"l": 50.112, "t": 680.02022, "r": 205.88721, "b": 688.92679, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "where c is one of { left, centroid, right } and x$_{c}$ is the xcoordinate for the corresponding point."}, {"label": "list_item", "id": 13, "page_no": 11, "cluster": {"id": 13, "label": "list_item", "bbox": {"l": 50.112, "t": 692.290222, "r": 286.36496, "b": 713.151787, "coord_origin": "TOPLEFT"}, "confidence": 0.9260510206222534, "cells": [{"id": 125, "text": "5.", "bbox": {"l": 62.067001, "t": 692.290222, "r": 69.538948, "b": 701.196785, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "Use the alignment computed in step 4, to compute", "bbox": {"l": 76.273666, "t": 692.290222, "r": 286.36496, "b": 701.196785, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "the median", "bbox": {"l": 50.112, "t": 704.245224, "r": 94.604973, "b": 713.151787, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "x", "bbox": {"l": 97.598999, "t": 704.085815, "r": 103.29263, "b": 712.93261, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "-coordinate for all table columns and the me-", "bbox": {"l": 103.292, "t": 704.245224, "r": 286.36481, "b": 713.151787, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5. Use the alignment computed in step 4, to compute the median x -coordinate for all table columns and the me-"}, {"label": "text", "id": 16, "page_no": 11, "cluster": {"id": 16, "label": "text", "bbox": {"l": 308.862, "t": 210.93120999999996, "r": 545.11517, "b": 255.7038, "coord_origin": "TOPLEFT"}, "confidence": 0.8942298889160156, "cells": [{"id": 130, "text": "dian cell size for all table cells. The usage of median dur-", "bbox": {"l": 308.862, "t": 210.93120999999996, "r": 545.11517, "b": 219.83776999999998, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "ing the computations, helps to eliminate outliers caused by", "bbox": {"l": 308.862, "t": 222.88720999999998, "r": 545.11511, "b": 231.79376000000002, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "occasional column spans which are usually wider than the", "bbox": {"l": 308.862, "t": 234.84222, "r": 545.11511, "b": 243.74878, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "normal.", "bbox": {"l": 308.862, "t": 246.79724, "r": 339.57669, "b": 255.7038, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "dian cell size for all table cells. The usage of median during the computations, helps to eliminate outliers caused by occasional column spans which are usually wider than the normal."}, {"label": "list_item", "id": 9, "page_no": 11, "cluster": {"id": 9, "label": "list_item", "bbox": {"l": 308.862, "t": 259.10222999999996, "r": 545.11499, "b": 279.96380999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9423392415046692, "cells": [{"id": 134, "text": "6.", "bbox": {"l": 320.81699, "t": 259.10222999999996, "r": 328.28894, "b": 268.00879, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "Snap all cells with bad IOU to their corresponding", "bbox": {"l": 334.88419, "t": 259.10222999999996, "r": 545.11499, "b": 268.00879, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "median", "bbox": {"l": 308.862, "t": 271.05724999999995, "r": 338.19189, "b": 279.96380999999997, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "x", "bbox": {"l": 340.68201, "t": 270.89783, "r": 346.37564, "b": 279.74463000000003, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "-coordinates and cell sizes.", "bbox": {"l": 346.37601, "t": 271.05724999999995, "r": 453.72305000000006, "b": 279.96380999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "6. Snap all cells with bad IOU to their corresponding median x -coordinates and cell sizes."}, {"label": "list_item", "id": 6, "page_no": 11, "cluster": {"id": 6, "label": "list_item", "bbox": {"l": 308.86203, "t": 283.36325000000005, "r": 545.11511, "b": 387.91071, "coord_origin": "TOPLEFT"}, "confidence": 0.9562004804611206, "cells": [{"id": 139, "text": "7.", "bbox": {"l": 320.81702, "t": 283.36325000000005, "r": 328.38953, "b": 292.26981, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "Generate a new set of pair-wise matches between the", "bbox": {"l": 330.9137, "t": 283.36325000000005, "r": 545.11499, "b": 292.26981, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "corrected bounding boxes and PDF cells. This time use a", "bbox": {"l": 308.86203, "t": 295.31824, "r": 545.11511, "b": 304.22479, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "modified version of the IOU metric, where the area of the", "bbox": {"l": 308.86203, "t": 307.27322, "r": 545.11505, "b": 316.17978, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "intersection between the predicted and PDF cells is divided", "bbox": {"l": 308.86203, "t": 319.22821000000005, "r": 545.11511, "b": 328.13477, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "by the PDF cell area.", "bbox": {"l": 308.86203, "t": 331.1842, "r": 397.19043, "b": 340.09076000000005, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "In case there are multiple matches", "bbox": {"l": 403.65616, "t": 331.1842, "r": 545.11511, "b": 340.09076000000005, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "for the same PDF cell, the prediction with the higher score", "bbox": {"l": 308.86203, "t": 343.13919, "r": 545.11511, "b": 352.04575, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "is preferred. This covers the cases where the PDF cells are", "bbox": {"l": 308.86203, "t": 355.09418, "r": 545.11505, "b": 364.00073, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "smaller than the area of predicted or corrected prediction", "bbox": {"l": 308.86203, "t": 367.04916, "r": 545.11505, "b": 375.95572000000004, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "cells.", "bbox": {"l": 308.86203, "t": 379.00415, "r": 329.61414, "b": 387.91071, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "7. Generate a new set of pair-wise matches between the corrected bounding boxes and PDF cells. This time use a modified version of the IOU metric, where the area of the intersection between the predicted and PDF cells is divided by the PDF cell area. In case there are multiple matches for the same PDF cell, the prediction with the higher score is preferred. This covers the cases where the PDF cells are smaller than the area of predicted or corrected prediction cells."}, {"label": "list_item", "id": 17, "page_no": 11, "cluster": {"id": 17, "label": "list_item", "bbox": {"l": 308.86203, "t": 391.31015, "r": 545.11517, "b": 459.99164, "coord_origin": "TOPLEFT"}, "confidence": 0.8719939589500427, "cells": [{"id": 150, "text": "8.", "bbox": {"l": 320.81702, "t": 391.31015, "r": 328.55356, "b": 400.2167099999999, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "In some rare occasions, we have noticed that Table-", "bbox": {"l": 331.13242, "t": 391.31015, "r": 545.11505, "b": 400.2167099999999, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "Former can confuse a single column as two. When the post-", "bbox": {"l": 308.86203, "t": 403.26514, "r": 545.11517, "b": 412.17169, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "processing steps are applied, this results with two predicted", "bbox": {"l": 308.86203, "t": 415.22012000000007, "r": 545.11511, "b": 424.12668, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "columns pointing to the same PDF column. In such case", "bbox": {"l": 308.86203, "t": 427.17511, "r": 545.11511, "b": 436.0816699999999, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "we must de-duplicate the columns according to highest to-", "bbox": {"l": 308.86203, "t": 439.1301, "r": 545.11505, "b": 448.03665, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "tal column intersection score.", "bbox": {"l": 308.86203, "t": 451.08507999999995, "r": 426.18161, "b": 459.99164, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "8. In some rare occasions, we have noticed that TableFormer can confuse a single column as two. When the postprocessing steps are applied, this results with two predicted columns pointing to the same PDF column. In such case we must de-duplicate the columns according to highest total column intersection score."}, {"label": "list_item", "id": 15, "page_no": 11, "cluster": {"id": 15, "label": "list_item", "bbox": {"l": 308.86203, "t": 463.39108, "r": 545.11517, "b": 567.93858, "coord_origin": "TOPLEFT"}, "confidence": 0.9126082062721252, "cells": [{"id": 157, "text": "9.", "bbox": {"l": 320.81702, "t": 463.39108, "r": 328.67316, "b": 472.29764, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "Pick up the remaining orphan cells. There could be", "bbox": {"l": 331.29187, "t": 463.39108, "r": 545.11499, "b": 472.29764, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "cases, when after applying all the previous post-processing", "bbox": {"l": 308.86203, "t": 475.34607, "r": 545.11505, "b": 484.25262, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "steps, some PDF cells could still remain without any match", "bbox": {"l": 308.86203, "t": 487.30106, "r": 545.11517, "b": 496.20761, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "to predicted cells.", "bbox": {"l": 308.86203, "t": 499.25604, "r": 381.89786, "b": 508.1626, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "However, it is still possible to deduce", "bbox": {"l": 388.7023, "t": 499.25604, "r": 545.11517, "b": 508.1626, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "the correct matching for an orphan PDF cell by mapping its", "bbox": {"l": 308.86203, "t": 511.21204, "r": 545.11511, "b": 520.11859, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "bounding box on the geometry of the grid. This mapping", "bbox": {"l": 308.86203, "t": 523.16702, "r": 545.11505, "b": 532.07358, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "decides if the content of the orphan cell will be appended to", "bbox": {"l": 308.86203, "t": 535.12201, "r": 545.11499, "b": 544.02858, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "an already matched table cell, or a new table cell should be", "bbox": {"l": 308.86203, "t": 547.07703, "r": 545.11517, "b": 555.98358, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "created to match with the orphan.", "bbox": {"l": 308.86203, "t": 559.03203, "r": 442.22147000000007, "b": 567.93858, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "9. Pick up the remaining orphan cells. There could be cases, when after applying all the previous post-processing steps, some PDF cells could still remain without any match to predicted cells. However, it is still possible to deduce the correct matching for an orphan PDF cell by mapping its bounding box on the geometry of the grid. This mapping decides if the content of the orphan cell will be appended to an already matched table cell, or a new table cell should be created to match with the orphan."}, {"label": "text", "id": 19, "page_no": 11, "cluster": {"id": 19, "label": "text", "bbox": {"l": 308.86203, "t": 571.33803, "r": 545.11688, "b": 604.15459, "coord_origin": "TOPLEFT"}, "confidence": 0.8459473848342896, "cells": [{"id": 168, "text": "9a. Compute the top and bottom boundary of the hori-", "bbox": {"l": 320.81702, "t": 571.33803, "r": 545.11493, "b": 580.24458, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "zontal band for each grid row (min/max", "bbox": {"l": 308.86203, "t": 583.29303, "r": 471.64093, "b": 592.19958, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "y", "bbox": {"l": 474.83405, "t": 583.1336200000001, "r": 479.71872, "b": 591.98041, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "coordinates per", "bbox": {"l": 483.26903999999996, "t": 583.29303, "r": 545.11688, "b": 592.19958, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "row).", "bbox": {"l": 308.86206, "t": 595.24803, "r": 329.91306, "b": 604.15459, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "9a. Compute the top and bottom boundary of the horizontal band for each grid row (min/max y coordinates per row)."}, {"label": "list_item", "id": 21, "page_no": 11, "cluster": {"id": 21, "label": "list_item", "bbox": {"l": 308.86206, "t": 607.55304, "r": 545.11505, "b": 628.4155900000001, "coord_origin": "TOPLEFT"}, "confidence": 0.7716891169548035, "cells": [{"id": 173, "text": "9b.", "bbox": {"l": 320.81705, "t": 607.55304, "r": 332.8718, "b": 616.4595899999999, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "Intersect the orphan\u2019s bounding box with the row", "bbox": {"l": 339.92532, "t": 607.55304, "r": 545.11505, "b": 616.4595899999999, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "bands, and map the cell to the closest grid row.", "bbox": {"l": 308.86206, "t": 619.50903, "r": 495.2923, "b": 628.4155900000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "9b. Intersect the orphan\u2019s bounding box with the row bands, and map the cell to the closest grid row."}, {"label": "list_item", "id": 18, "page_no": 11, "cluster": {"id": 18, "label": "list_item", "bbox": {"l": 308.86206, "t": 631.81403, "r": 545.11505, "b": 664.63059, "coord_origin": "TOPLEFT"}, "confidence": 0.8584907054901123, "cells": [{"id": 176, "text": "9c. Compute the left and right boundary of the vertical", "bbox": {"l": 320.81705, "t": 631.81403, "r": 545.11505, "b": 640.72058, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "band for each grid column (min/max", "bbox": {"l": 308.86206, "t": 643.7690299999999, "r": 455.28238, "b": 652.67558, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "x", "bbox": {"l": 457.77704, "t": 643.60962, "r": 463.47067, "b": 652.45641, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "coordinates per col-", "bbox": {"l": 465.97104, "t": 643.7690299999999, "r": 545.11389, "b": 652.67558, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "umn).", "bbox": {"l": 308.86206, "t": 655.72403, "r": 332.38376, "b": 664.63059, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "9c. Compute the left and right boundary of the vertical band for each grid column (min/max x coordinates per column)."}, {"label": "list_item", "id": 22, "page_no": 11, "cluster": {"id": 22, "label": "list_item", "bbox": {"l": 308.86206, "t": 668.03003, "r": 545.11499, "b": 688.89159, "coord_origin": "TOPLEFT"}, "confidence": 0.7590745091438293, "cells": [{"id": 181, "text": "9d. Intersect the orphan\u2019s bounding box with the column", "bbox": {"l": 320.81705, "t": 668.03003, "r": 545.11499, "b": 676.93659, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "bands, and map the cell to the closest grid column.", "bbox": {"l": 308.86206, "t": 679.98503, "r": 510.5848700000001, "b": 688.89159, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "9d. Intersect the orphan\u2019s bounding box with the column bands, and map the cell to the closest grid column."}, {"label": "list_item", "id": 25, "page_no": 11, "cluster": {"id": 25, "label": "list_item", "bbox": {"l": 308.86206, "t": 692.290024, "r": 545.11517, "b": 713.151596, "coord_origin": "TOPLEFT"}, "confidence": 0.6971189975738525, "cells": [{"id": 183, "text": "9e. If the table cell under the identified row and column", "bbox": {"l": 320.81705, "t": 692.290024, "r": 545.11505, "b": 701.196594, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "is not empty, extend its content with the content of the or-", "bbox": {"l": 308.86206, "t": 704.245026, "r": 545.11517, "b": 713.151596, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "9e. If the table cell under the identified row and column is not empty, extend its content with the content of the or-"}], "headers": [{"label": "page_footer", "id": 14, "page_no": 11, "cluster": {"id": 14, "label": "page_footer", "bbox": {"l": 292.63107, "t": 734.13303, "r": 302.59366, "b": 743.039593, "coord_origin": "TOPLEFT"}, "confidence": 0.9126598238945007, "cells": [{"id": 185, "text": "12", "bbox": {"l": 292.63107, "t": 734.13303, "r": 302.59366, "b": 743.039593, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "12"}]}}, {"page_no": 12, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "phan cell.", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 88.846588, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "9f. Otherwise create a new structural cell and match it", "bbox": {"l": 62.067001, "t": 87.16339000000005, "r": 286.36496, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "wit the orphan cell.", "bbox": {"l": 50.112, "t": 99.11841000000004, "r": 127.03322, "b": 108.02495999999985, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Aditional images with examples of TableFormer predic-", "bbox": {"l": 62.067001, "t": 111.16309000000001, "r": 286.36499, "b": 119.7508499999999, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "tions and post-processing can be found below.", "bbox": {"l": 50.112, "t": 123.11810000000003, "r": 234.06139999999996, "b": 131.70587, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Figure 8: Example of a table with multi-line header.", "bbox": {"l": 63.341, "t": 502.05637, "r": 273.13342, "b": 510.96292, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Figure 9:", "bbox": {"l": 308.862, "t": 306.59836, "r": 345.63397, "b": 315.50491, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Example of a table with big empty distance be-", "bbox": {"l": 352.78711, "t": 306.59836, "r": 545.11511, "b": 315.50491, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "tween cells.", "bbox": {"l": 308.862, "t": 318.55334, "r": 355.89545, "b": 327.45990000000006, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Figure 10: Example of a complex table with empty cells.", "bbox": {"l": 312.34299, "t": 680.4933599999999, "r": 541.63232, "b": 689.39993, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "13", "bbox": {"l": 292.63098, "t": 734.133358, "r": 302.59357, "b": 743.039921, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 14, "label": "text", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 88.846588, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.7545598149299622, "cells": [{"id": 0, "text": "phan cell.", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 88.846588, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 50.112, "t": 87.16339000000005, "r": 286.36496, "b": 108.02495999999985, "coord_origin": "TOPLEFT"}, "confidence": 0.9170762300491333, "cells": [{"id": 1, "text": "9f. Otherwise create a new structural cell and match it", "bbox": {"l": 62.067001, "t": 87.16339000000005, "r": 286.36496, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "wit the orphan cell.", "bbox": {"l": 50.112, "t": 99.11841000000004, "r": 127.03322, "b": 108.02495999999985, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 50.112, "t": 111.16309000000001, "r": 286.36499, "b": 131.70587, "coord_origin": "TOPLEFT"}, "confidence": 0.9454683065414429, "cells": [{"id": 3, "text": "Aditional images with examples of TableFormer predic-", "bbox": {"l": 62.067001, "t": 111.16309000000001, "r": 286.36499, "b": 119.7508499999999, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "tions and post-processing can be found below.", "bbox": {"l": 50.112, "t": 123.11810000000003, "r": 234.06139999999996, "b": 131.70587, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "caption", "bbox": {"l": 63.341, "t": 502.05637, "r": 273.13342, "b": 510.96292, "coord_origin": "TOPLEFT"}, "confidence": 0.8971090316772461, "cells": [{"id": 5, "text": "Figure 8: Example of a table with multi-line header.", "bbox": {"l": 63.341, "t": 502.05637, "r": 273.13342, "b": 510.96292, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "caption", "bbox": {"l": 308.862, "t": 306.59836, "r": 545.11511, "b": 327.45990000000006, "coord_origin": "TOPLEFT"}, "confidence": 0.8773345351219177, "cells": [{"id": 6, "text": "Figure 9:", "bbox": {"l": 308.862, "t": 306.59836, "r": 345.63397, "b": 315.50491, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Example of a table with big empty distance be-", "bbox": {"l": 352.78711, "t": 306.59836, "r": 545.11511, "b": 315.50491, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "tween cells.", "bbox": {"l": 308.862, "t": 318.55334, "r": 355.89545, "b": 327.45990000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "caption", "bbox": {"l": 312.34299, "t": 680.4933599999999, "r": 541.63232, "b": 689.39993, "coord_origin": "TOPLEFT"}, "confidence": 0.9188510179519653, "cells": [{"id": 9, "text": "Figure 10: Example of a complex table with empty cells.", "bbox": {"l": 312.34299, "t": 680.4933599999999, "r": 541.63232, "b": 689.39993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "page_footer", "bbox": {"l": 292.63098, "t": 734.133358, "r": 302.59357, "b": 743.039921, "coord_origin": "TOPLEFT"}, "confidence": 0.9020507335662842, "cells": [{"id": 10, "text": "13", "bbox": {"l": 292.63098, "t": 734.133358, "r": 302.59357, "b": 743.039921, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "table", "bbox": {"l": 310.3294372558594, "t": 101.17767333984375, "r": 555.8338623046875, "b": 136.14752197265625, "coord_origin": "TOPLEFT"}, "confidence": 0.70481276512146, "cells": [], "children": []}, {"id": 32, "label": "table", "bbox": {"l": 309.9566345214844, "t": 154.61448669433594, "r": 555.7466430664062, "b": 184.7225341796875, "coord_origin": "TOPLEFT"}, "confidence": 0.564289927482605, "cells": [], "children": []}, {"id": 9, "label": "table", "bbox": {"l": 84.0283203125, "t": 156.3335418701172, "r": 239.1690673828125, "b": 214.39334106445312, "coord_origin": "TOPLEFT"}, "confidence": 0.8857279419898987, "cells": [], "children": []}, {"id": 21, "label": "table", "bbox": {"l": 309.9635314941406, "t": 195.70541381835938, "r": 555.7054443359375, "b": 233.55145263671875, "coord_origin": "TOPLEFT"}, "confidence": 0.6602518558502197, "cells": [], "children": []}, {"id": 4, "label": "table", "bbox": {"l": 82.92001342773438, "t": 233.7763214111328, "r": 239.1903533935547, "b": 291.283935546875, "coord_origin": "TOPLEFT"}, "confidence": 0.9155725836753845, "cells": [], "children": []}, {"id": 19, "label": "picture", "bbox": {"l": 309.79150390625, "t": 253.90536499023438, "r": 425.9603271484375, "b": 292.39398193359375, "coord_origin": "TOPLEFT"}, "confidence": 0.6956620812416077, "cells": [], "children": []}, {"id": 37, "label": "table", "bbox": {"l": 309.79150390625, "t": 253.90536499023438, "r": 425.9603271484375, "b": 292.39398193359375, "coord_origin": "TOPLEFT"}, "confidence": 0.52826988697052, "cells": [], "children": []}, {"id": 6, "label": "table", "bbox": {"l": 83.94786071777344, "t": 309.0477294921875, "r": 239.17135620117188, "b": 367.9095764160156, "coord_origin": "TOPLEFT"}, "confidence": 0.9085132479667664, "cells": [], "children": []}, {"id": 12, "label": "table", "bbox": {"l": 335.2694091796875, "t": 388.46746826171875, "r": 490.081787109375, "b": 437.02239990234375, "coord_origin": "TOPLEFT"}, "confidence": 0.8486077189445496, "cells": [], "children": []}, {"id": 0, "label": "table", "bbox": {"l": 83.31756591796875, "t": 396.0135498046875, "r": 248.873046875, "b": 487.2569885253906, "coord_origin": "TOPLEFT"}, "confidence": 0.9613965749740601, "cells": [], "children": []}, {"id": 10, "label": "table", "bbox": {"l": 334.9334716796875, "t": 453.9476318359375, "r": 490.0914306640625, "b": 502.7210998535156, "coord_origin": "TOPLEFT"}, "confidence": 0.8815538287162781, "cells": [], "children": []}, {"id": 5, "label": "table", "bbox": {"l": 335.2545471191406, "t": 519.07568359375, "r": 490.22369384765625, "b": 567.6879272460938, "coord_origin": "TOPLEFT"}, "confidence": 0.9096733927726746, "cells": [], "children": []}, {"id": 13, "label": "picture", "bbox": {"l": 333.9573669433594, "t": 593.1134033203125, "r": 518.4768676757812, "b": 665.4903564453125, "coord_origin": "TOPLEFT"}, "confidence": 0.8023569583892822, "cells": [], "children": []}, {"id": 30, "label": "table", "bbox": {"l": 333.9573669433594, "t": 593.1134033203125, "r": 518.4768676757812, "b": 665.4903564453125, "coord_origin": "TOPLEFT"}, "confidence": 0.5930293798446655, "cells": [], "children": []}]}, "tablestructure": {"table_map": {"17": {"label": "table", "id": 17, "page_no": 12, "cluster": {"id": 17, "label": "table", "bbox": {"l": 310.3294372558594, "t": 101.17767333984375, "r": 555.8338623046875, "b": 136.14752197265625, "coord_origin": "TOPLEFT"}, "confidence": 0.70481276512146, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, "32": {"label": "table", "id": 32, "page_no": 12, "cluster": {"id": 32, "label": "table", "bbox": {"l": 309.9566345214844, "t": 154.61448669433594, "r": 555.7466430664062, "b": 184.7225341796875, "coord_origin": "TOPLEFT"}, "confidence": 0.564289927482605, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, "9": {"label": "table", "id": 9, "page_no": 12, "cluster": {"id": 9, "label": "table", "bbox": {"l": 84.0283203125, "t": 156.3335418701172, "r": 239.1690673828125, "b": 214.39334106445312, "coord_origin": "TOPLEFT"}, "confidence": 0.8857279419898987, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, "21": {"label": "table", "id": 21, "page_no": 12, "cluster": {"id": 21, "label": "table", "bbox": {"l": 309.9635314941406, "t": 195.70541381835938, "r": 555.7054443359375, "b": 233.55145263671875, "coord_origin": "TOPLEFT"}, "confidence": 0.6602518558502197, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, "4": {"label": "table", "id": 4, "page_no": 12, "cluster": {"id": 4, "label": "table", "bbox": {"l": 82.92001342773438, "t": 233.7763214111328, "r": 239.1903533935547, "b": 291.283935546875, "coord_origin": "TOPLEFT"}, "confidence": 0.9155725836753845, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, "37": {"label": "table", "id": 37, "page_no": 12, "cluster": {"id": 37, "label": "table", "bbox": {"l": 309.79150390625, "t": 253.90536499023438, "r": 425.9603271484375, "b": 292.39398193359375, "coord_origin": "TOPLEFT"}, "confidence": 0.52826988697052, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, "6": {"label": "table", "id": 6, "page_no": 12, "cluster": {"id": 6, "label": "table", "bbox": {"l": 83.94786071777344, "t": 309.0477294921875, "r": 239.17135620117188, "b": 367.9095764160156, "coord_origin": "TOPLEFT"}, "confidence": 0.9085132479667664, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, "12": {"label": "table", "id": 12, "page_no": 12, "cluster": {"id": 12, "label": "table", "bbox": {"l": 335.2694091796875, "t": 388.46746826171875, "r": 490.081787109375, "b": 437.02239990234375, "coord_origin": "TOPLEFT"}, "confidence": 0.8486077189445496, "cells": [], "children": []}, "text": null, "otsl_seq": ["ecel", "ched", "ched", "lcel", "ched", "nl", "ecel", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, "0": {"label": "table", "id": 0, "page_no": 12, "cluster": {"id": 0, "label": "table", "bbox": {"l": 83.31756591796875, "t": 396.0135498046875, "r": 248.873046875, "b": 487.2569885253906, "coord_origin": "TOPLEFT"}, "confidence": 0.9613965749740601, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "ched", "nl", "fcel", "lcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "lcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, "10": {"label": "table", "id": 10, "page_no": 12, "cluster": {"id": 10, "label": "table", "bbox": {"l": 334.9334716796875, "t": 453.9476318359375, "r": 490.0914306640625, "b": 502.7210998535156, "coord_origin": "TOPLEFT"}, "confidence": 0.8815538287162781, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "lcel", "lcel", "lcel", "nl", "ched", "ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, "5": {"label": "table", "id": 5, "page_no": 12, "cluster": {"id": 5, "label": "table", "bbox": {"l": 335.2545471191406, "t": 519.07568359375, "r": 490.22369384765625, "b": 567.6879272460938, "coord_origin": "TOPLEFT"}, "confidence": 0.9096733927726746, "cells": [], "children": []}, "text": null, "otsl_seq": ["ecel", "ched", "lcel", "lcel", "lcel", "nl", "ecel", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, "30": {"label": "table", "id": 30, "page_no": 12, "cluster": {"id": 30, "label": "table", "bbox": {"l": 333.9573669433594, "t": 593.1134033203125, "r": 518.4768676757812, "b": 665.4903564453125, "coord_origin": "TOPLEFT"}, "confidence": 0.5930293798446655, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "text", "id": 14, "page_no": 12, "cluster": {"id": 14, "label": "text", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 88.846588, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.7545598149299622, "cells": [{"id": 0, "text": "phan cell.", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 88.846588, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "phan cell."}, {"label": "text", "id": 3, "page_no": 12, "cluster": {"id": 3, "label": "text", "bbox": {"l": 50.112, "t": 87.16339000000005, "r": 286.36496, "b": 108.02495999999985, "coord_origin": "TOPLEFT"}, "confidence": 0.9170762300491333, "cells": [{"id": 1, "text": "9f. Otherwise create a new structural cell and match it", "bbox": {"l": 62.067001, "t": 87.16339000000005, "r": 286.36496, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "wit the orphan cell.", "bbox": {"l": 50.112, "t": 99.11841000000004, "r": 127.03322, "b": 108.02495999999985, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "9f. Otherwise create a new structural cell and match it wit the orphan cell."}, {"label": "text", "id": 1, "page_no": 12, "cluster": {"id": 1, "label": "text", "bbox": {"l": 50.112, "t": 111.16309000000001, "r": 286.36499, "b": 131.70587, "coord_origin": "TOPLEFT"}, "confidence": 0.9454683065414429, "cells": [{"id": 3, "text": "Aditional images with examples of TableFormer predic-", "bbox": {"l": 62.067001, "t": 111.16309000000001, "r": 286.36499, "b": 119.7508499999999, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "tions and post-processing can be found below.", "bbox": {"l": 50.112, "t": 123.11810000000003, "r": 234.06139999999996, "b": 131.70587, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Aditional images with examples of TableFormer predictions and post-processing can be found below."}, {"label": "caption", "id": 8, "page_no": 12, "cluster": {"id": 8, "label": "caption", "bbox": {"l": 63.341, "t": 502.05637, "r": 273.13342, "b": 510.96292, "coord_origin": "TOPLEFT"}, "confidence": 0.8971090316772461, "cells": [{"id": 5, "text": "Figure 8: Example of a table with multi-line header.", "bbox": {"l": 63.341, "t": 502.05637, "r": 273.13342, "b": 510.96292, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 8: Example of a table with multi-line header."}, {"label": "caption", "id": 11, "page_no": 12, "cluster": {"id": 11, "label": "caption", "bbox": {"l": 308.862, "t": 306.59836, "r": 545.11511, "b": 327.45990000000006, "coord_origin": "TOPLEFT"}, "confidence": 0.8773345351219177, "cells": [{"id": 6, "text": "Figure 9:", "bbox": {"l": 308.862, "t": 306.59836, "r": 345.63397, "b": 315.50491, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Example of a table with big empty distance be-", "bbox": {"l": 352.78711, "t": 306.59836, "r": 545.11511, "b": 315.50491, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "tween cells.", "bbox": {"l": 308.862, "t": 318.55334, "r": 355.89545, "b": 327.45990000000006, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 9: Example of a table with big empty distance between cells."}, {"label": "caption", "id": 2, "page_no": 12, "cluster": {"id": 2, "label": "caption", "bbox": {"l": 312.34299, "t": 680.4933599999999, "r": 541.63232, "b": 689.39993, "coord_origin": "TOPLEFT"}, "confidence": 0.9188510179519653, "cells": [{"id": 9, "text": "Figure 10: Example of a complex table with empty cells.", "bbox": {"l": 312.34299, "t": 680.4933599999999, "r": 541.63232, "b": 689.39993, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 10: Example of a complex table with empty cells."}, {"label": "page_footer", "id": 7, "page_no": 12, "cluster": {"id": 7, "label": "page_footer", "bbox": {"l": 292.63098, "t": 734.133358, "r": 302.59357, "b": 743.039921, "coord_origin": "TOPLEFT"}, "confidence": 0.9020507335662842, "cells": [{"id": 10, "text": "13", "bbox": {"l": 292.63098, "t": 734.133358, "r": 302.59357, "b": 743.039921, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "13"}, {"label": "table", "id": 17, "page_no": 12, "cluster": {"id": 17, "label": "table", "bbox": {"l": 310.3294372558594, "t": 101.17767333984375, "r": 555.8338623046875, "b": 136.14752197265625, "coord_origin": "TOPLEFT"}, "confidence": 0.70481276512146, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 32, "page_no": 12, "cluster": {"id": 32, "label": "table", "bbox": {"l": 309.9566345214844, "t": 154.61448669433594, "r": 555.7466430664062, "b": 184.7225341796875, "coord_origin": "TOPLEFT"}, "confidence": 0.564289927482605, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 9, "page_no": 12, "cluster": {"id": 9, "label": "table", "bbox": {"l": 84.0283203125, "t": 156.3335418701172, "r": 239.1690673828125, "b": 214.39334106445312, "coord_origin": "TOPLEFT"}, "confidence": 0.8857279419898987, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 21, "page_no": 12, "cluster": {"id": 21, "label": "table", "bbox": {"l": 309.9635314941406, "t": 195.70541381835938, "r": 555.7054443359375, "b": 233.55145263671875, "coord_origin": "TOPLEFT"}, "confidence": 0.6602518558502197, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 4, "page_no": 12, "cluster": {"id": 4, "label": "table", "bbox": {"l": 82.92001342773438, "t": 233.7763214111328, "r": 239.1903533935547, "b": 291.283935546875, "coord_origin": "TOPLEFT"}, "confidence": 0.9155725836753845, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "picture", "id": 19, "page_no": 12, "cluster": {"id": 19, "label": "picture", "bbox": {"l": 309.79150390625, "t": 253.90536499023438, "r": 425.9603271484375, "b": 292.39398193359375, "coord_origin": "TOPLEFT"}, "confidence": 0.6956620812416077, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "table", "id": 37, "page_no": 12, "cluster": {"id": 37, "label": "table", "bbox": {"l": 309.79150390625, "t": 253.90536499023438, "r": 425.9603271484375, "b": 292.39398193359375, "coord_origin": "TOPLEFT"}, "confidence": 0.52826988697052, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 6, "page_no": 12, "cluster": {"id": 6, "label": "table", "bbox": {"l": 83.94786071777344, "t": 309.0477294921875, "r": 239.17135620117188, "b": 367.9095764160156, "coord_origin": "TOPLEFT"}, "confidence": 0.9085132479667664, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 12, "page_no": 12, "cluster": {"id": 12, "label": "table", "bbox": {"l": 335.2694091796875, "t": 388.46746826171875, "r": 490.081787109375, "b": 437.02239990234375, "coord_origin": "TOPLEFT"}, "confidence": 0.8486077189445496, "cells": [], "children": []}, "text": null, "otsl_seq": ["ecel", "ched", "ched", "lcel", "ched", "nl", "ecel", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 0, "page_no": 12, "cluster": {"id": 0, "label": "table", "bbox": {"l": 83.31756591796875, "t": 396.0135498046875, "r": 248.873046875, "b": 487.2569885253906, "coord_origin": "TOPLEFT"}, "confidence": 0.9613965749740601, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "ched", "nl", "fcel", "lcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "lcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 10, "page_no": 12, "cluster": {"id": 10, "label": "table", "bbox": {"l": 334.9334716796875, "t": 453.9476318359375, "r": 490.0914306640625, "b": 502.7210998535156, "coord_origin": "TOPLEFT"}, "confidence": 0.8815538287162781, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "lcel", "lcel", "lcel", "nl", "ched", "ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 5, "page_no": 12, "cluster": {"id": 5, "label": "table", "bbox": {"l": 335.2545471191406, "t": 519.07568359375, "r": 490.22369384765625, "b": 567.6879272460938, "coord_origin": "TOPLEFT"}, "confidence": 0.9096733927726746, "cells": [], "children": []}, "text": null, "otsl_seq": ["ecel", "ched", "lcel", "lcel", "lcel", "nl", "ecel", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "picture", "id": 13, "page_no": 12, "cluster": {"id": 13, "label": "picture", "bbox": {"l": 333.9573669433594, "t": 593.1134033203125, "r": 518.4768676757812, "b": 665.4903564453125, "coord_origin": "TOPLEFT"}, "confidence": 0.8023569583892822, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "table", "id": 30, "page_no": 12, "cluster": {"id": 30, "label": "table", "bbox": {"l": 333.9573669433594, "t": 593.1134033203125, "r": 518.4768676757812, "b": 665.4903564453125, "coord_origin": "TOPLEFT"}, "confidence": 0.5930293798446655, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}], "body": [{"label": "text", "id": 14, "page_no": 12, "cluster": {"id": 14, "label": "text", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 88.846588, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.7545598149299622, "cells": [{"id": 0, "text": "phan cell.", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 88.846588, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "phan cell."}, {"label": "text", "id": 3, "page_no": 12, "cluster": {"id": 3, "label": "text", "bbox": {"l": 50.112, "t": 87.16339000000005, "r": 286.36496, "b": 108.02495999999985, "coord_origin": "TOPLEFT"}, "confidence": 0.9170762300491333, "cells": [{"id": 1, "text": "9f. Otherwise create a new structural cell and match it", "bbox": {"l": 62.067001, "t": 87.16339000000005, "r": 286.36496, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "wit the orphan cell.", "bbox": {"l": 50.112, "t": 99.11841000000004, "r": 127.03322, "b": 108.02495999999985, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "9f. Otherwise create a new structural cell and match it wit the orphan cell."}, {"label": "text", "id": 1, "page_no": 12, "cluster": {"id": 1, "label": "text", "bbox": {"l": 50.112, "t": 111.16309000000001, "r": 286.36499, "b": 131.70587, "coord_origin": "TOPLEFT"}, "confidence": 0.9454683065414429, "cells": [{"id": 3, "text": "Aditional images with examples of TableFormer predic-", "bbox": {"l": 62.067001, "t": 111.16309000000001, "r": 286.36499, "b": 119.7508499999999, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "tions and post-processing can be found below.", "bbox": {"l": 50.112, "t": 123.11810000000003, "r": 234.06139999999996, "b": 131.70587, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Aditional images with examples of TableFormer predictions and post-processing can be found below."}, {"label": "caption", "id": 8, "page_no": 12, "cluster": {"id": 8, "label": "caption", "bbox": {"l": 63.341, "t": 502.05637, "r": 273.13342, "b": 510.96292, "coord_origin": "TOPLEFT"}, "confidence": 0.8971090316772461, "cells": [{"id": 5, "text": "Figure 8: Example of a table with multi-line header.", "bbox": {"l": 63.341, "t": 502.05637, "r": 273.13342, "b": 510.96292, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 8: Example of a table with multi-line header."}, {"label": "caption", "id": 11, "page_no": 12, "cluster": {"id": 11, "label": "caption", "bbox": {"l": 308.862, "t": 306.59836, "r": 545.11511, "b": 327.45990000000006, "coord_origin": "TOPLEFT"}, "confidence": 0.8773345351219177, "cells": [{"id": 6, "text": "Figure 9:", "bbox": {"l": 308.862, "t": 306.59836, "r": 345.63397, "b": 315.50491, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Example of a table with big empty distance be-", "bbox": {"l": 352.78711, "t": 306.59836, "r": 545.11511, "b": 315.50491, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "tween cells.", "bbox": {"l": 308.862, "t": 318.55334, "r": 355.89545, "b": 327.45990000000006, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 9: Example of a table with big empty distance between cells."}, {"label": "caption", "id": 2, "page_no": 12, "cluster": {"id": 2, "label": "caption", "bbox": {"l": 312.34299, "t": 680.4933599999999, "r": 541.63232, "b": 689.39993, "coord_origin": "TOPLEFT"}, "confidence": 0.9188510179519653, "cells": [{"id": 9, "text": "Figure 10: Example of a complex table with empty cells.", "bbox": {"l": 312.34299, "t": 680.4933599999999, "r": 541.63232, "b": 689.39993, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 10: Example of a complex table with empty cells."}, {"label": "table", "id": 17, "page_no": 12, "cluster": {"id": 17, "label": "table", "bbox": {"l": 310.3294372558594, "t": 101.17767333984375, "r": 555.8338623046875, "b": 136.14752197265625, "coord_origin": "TOPLEFT"}, "confidence": 0.70481276512146, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 32, "page_no": 12, "cluster": {"id": 32, "label": "table", "bbox": {"l": 309.9566345214844, "t": 154.61448669433594, "r": 555.7466430664062, "b": 184.7225341796875, "coord_origin": "TOPLEFT"}, "confidence": 0.564289927482605, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 9, "page_no": 12, "cluster": {"id": 9, "label": "table", "bbox": {"l": 84.0283203125, "t": 156.3335418701172, "r": 239.1690673828125, "b": 214.39334106445312, "coord_origin": "TOPLEFT"}, "confidence": 0.8857279419898987, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 21, "page_no": 12, "cluster": {"id": 21, "label": "table", "bbox": {"l": 309.9635314941406, "t": 195.70541381835938, "r": 555.7054443359375, "b": 233.55145263671875, "coord_origin": "TOPLEFT"}, "confidence": 0.6602518558502197, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 4, "page_no": 12, "cluster": {"id": 4, "label": "table", "bbox": {"l": 82.92001342773438, "t": 233.7763214111328, "r": 239.1903533935547, "b": 291.283935546875, "coord_origin": "TOPLEFT"}, "confidence": 0.9155725836753845, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "picture", "id": 19, "page_no": 12, "cluster": {"id": 19, "label": "picture", "bbox": {"l": 309.79150390625, "t": 253.90536499023438, "r": 425.9603271484375, "b": 292.39398193359375, "coord_origin": "TOPLEFT"}, "confidence": 0.6956620812416077, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "table", "id": 37, "page_no": 12, "cluster": {"id": 37, "label": "table", "bbox": {"l": 309.79150390625, "t": 253.90536499023438, "r": 425.9603271484375, "b": 292.39398193359375, "coord_origin": "TOPLEFT"}, "confidence": 0.52826988697052, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 6, "page_no": 12, "cluster": {"id": 6, "label": "table", "bbox": {"l": 83.94786071777344, "t": 309.0477294921875, "r": 239.17135620117188, "b": 367.9095764160156, "coord_origin": "TOPLEFT"}, "confidence": 0.9085132479667664, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 12, "page_no": 12, "cluster": {"id": 12, "label": "table", "bbox": {"l": 335.2694091796875, "t": 388.46746826171875, "r": 490.081787109375, "b": 437.02239990234375, "coord_origin": "TOPLEFT"}, "confidence": 0.8486077189445496, "cells": [], "children": []}, "text": null, "otsl_seq": ["ecel", "ched", "ched", "lcel", "ched", "nl", "ecel", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 0, "page_no": 12, "cluster": {"id": 0, "label": "table", "bbox": {"l": 83.31756591796875, "t": 396.0135498046875, "r": 248.873046875, "b": 487.2569885253906, "coord_origin": "TOPLEFT"}, "confidence": 0.9613965749740601, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "ched", "nl", "fcel", "lcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "lcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 10, "page_no": 12, "cluster": {"id": 10, "label": "table", "bbox": {"l": 334.9334716796875, "t": 453.9476318359375, "r": 490.0914306640625, "b": 502.7210998535156, "coord_origin": "TOPLEFT"}, "confidence": 0.8815538287162781, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "lcel", "lcel", "lcel", "nl", "ched", "ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 5, "page_no": 12, "cluster": {"id": 5, "label": "table", "bbox": {"l": 335.2545471191406, "t": 519.07568359375, "r": 490.22369384765625, "b": 567.6879272460938, "coord_origin": "TOPLEFT"}, "confidence": 0.9096733927726746, "cells": [], "children": []}, "text": null, "otsl_seq": ["ecel", "ched", "lcel", "lcel", "lcel", "nl", "ecel", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "picture", "id": 13, "page_no": 12, "cluster": {"id": 13, "label": "picture", "bbox": {"l": 333.9573669433594, "t": 593.1134033203125, "r": 518.4768676757812, "b": 665.4903564453125, "coord_origin": "TOPLEFT"}, "confidence": 0.8023569583892822, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "table", "id": 30, "page_no": 12, "cluster": {"id": 30, "label": "table", "bbox": {"l": 333.9573669433594, "t": 593.1134033203125, "r": 518.4768676757812, "b": 665.4903564453125, "coord_origin": "TOPLEFT"}, "confidence": 0.5930293798446655, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}], "headers": [{"label": "page_footer", "id": 7, "page_no": 12, "cluster": {"id": 7, "label": "page_footer", "bbox": {"l": 292.63098, "t": 734.133358, "r": 302.59357, "b": 743.039921, "coord_origin": "TOPLEFT"}, "confidence": 0.9020507335662842, "cells": [{"id": 10, "text": "13", "bbox": {"l": 292.63098, "t": 734.133358, "r": 302.59357, "b": 743.039921, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "13"}]}}, {"page_no": 13, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "Figure 11:", "bbox": {"l": 50.112, "t": 356.77036, "r": 93.050797, "b": 365.67691, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Simple table with different style and empty", "bbox": {"l": 103.73071, "t": 356.77036, "r": 286.36508, "b": 365.67691, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "cells.", "bbox": {"l": 50.112, "t": 368.72534, "r": 70.864098, "b": 377.6319, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Figure 12: Simple table predictions and post processing.", "bbox": {"l": 54.618998999999995, "t": 671.81836, "r": 281.8559, "b": 680.72492, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Figure 13: Table predictions example on colorful table.", "bbox": {"l": 315.79001, "t": 371.68436, "r": 538.18524, "b": 380.59091, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Figure 14: Example with multi-line text.", "bbox": {"l": 344.98499, "t": 683.54636, "r": 508.98935000000006, "b": 692.452927, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "14", "bbox": {"l": 292.63098, "t": 734.133362, "r": 302.59357, "b": 743.039925, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 0, "label": "caption", "bbox": {"l": 50.112, "t": 356.77036, "r": 286.36508, "b": 377.6319, "coord_origin": "TOPLEFT"}, "confidence": 0.951069176197052, "cells": [{"id": 0, "text": "Figure 11:", "bbox": {"l": 50.112, "t": 356.77036, "r": 93.050797, "b": 365.67691, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Simple table with different style and empty", "bbox": {"l": 103.73071, "t": 356.77036, "r": 286.36508, "b": 365.67691, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "cells.", "bbox": {"l": 50.112, "t": 368.72534, "r": 70.864098, "b": 377.6319, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "caption", "bbox": {"l": 54.618998999999995, "t": 671.81836, "r": 281.8559, "b": 680.72492, "coord_origin": "TOPLEFT"}, "confidence": 0.926384687423706, "cells": [{"id": 3, "text": "Figure 12: Simple table predictions and post processing.", "bbox": {"l": 54.618998999999995, "t": 671.81836, "r": 281.8559, "b": 680.72492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "caption", "bbox": {"l": 315.79001, "t": 371.68436, "r": 538.18524, "b": 380.59091, "coord_origin": "TOPLEFT"}, "confidence": 0.9178510904312134, "cells": [{"id": 4, "text": "Figure 13: Table predictions example on colorful table.", "bbox": {"l": 315.79001, "t": 371.68436, "r": 538.18524, "b": 380.59091, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "caption", "bbox": {"l": 344.98499, "t": 683.54636, "r": 508.98935000000006, "b": 692.452927, "coord_origin": "TOPLEFT"}, "confidence": 0.9191023111343384, "cells": [{"id": 5, "text": "Figure 14: Example with multi-line text.", "bbox": {"l": 344.98499, "t": 683.54636, "r": 508.98935000000006, "b": 692.452927, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "page_footer", "bbox": {"l": 292.63098, "t": 734.133362, "r": 302.59357, "b": 743.039925, "coord_origin": "TOPLEFT"}, "confidence": 0.887715220451355, "cells": [{"id": 6, "text": "14", "bbox": {"l": 292.63098, "t": 734.133362, "r": 302.59357, "b": 743.039925, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "picture", "bbox": {"l": 318.6332092285156, "t": 90.88423156738281, "r": 534.73583984375, "b": 359.0575866699219, "coord_origin": "TOPLEFT"}, "confidence": 0.5003598928451538, "cells": [], "children": []}, {"id": 30, "label": "picture", "bbox": {"l": 51.15378952026367, "t": 104.30851745605469, "r": 282.8598937988281, "b": 344.90667724609375, "coord_origin": "TOPLEFT"}, "confidence": 0.5613773465156555, "cells": [], "children": []}, {"id": 23, "label": "table", "bbox": {"l": 318.9809265136719, "t": 161.23460388183594, "r": 534.6229248046875, "b": 214.6260528564453, "coord_origin": "TOPLEFT"}, "confidence": 0.6235634684562683, "cells": [], "children": []}, {"id": 33, "label": "table", "bbox": {"l": 319.0057678222656, "t": 226.10633850097656, "r": 534.408935546875, "b": 279.8576965332031, "coord_origin": "TOPLEFT"}, "confidence": 0.5502500534057617, "cells": [], "children": []}, {"id": 27, "label": "table", "bbox": {"l": 51.72642135620117, "t": 273.6092834472656, "r": 283.114013671875, "b": 344.2445068359375, "coord_origin": "TOPLEFT"}, "confidence": 0.5696635246276855, "cells": [], "children": []}, {"id": 38, "label": "table", "bbox": {"l": 328.1381530761719, "t": 288.6817932128906, "r": 523.8916015625, "b": 358.2724304199219, "coord_origin": "TOPLEFT"}, "confidence": 0.5227423310279846, "cells": [], "children": []}, {"id": 10, "label": "table", "bbox": {"l": 319.4707946777344, "t": 430.90301513671875, "r": 518.5693359375, "b": 477.94354248046875, "coord_origin": "TOPLEFT"}, "confidence": 0.8384715914726257, "cells": [], "children": []}, {"id": 9, "label": "table", "bbox": {"l": 51.434879302978516, "t": 453.48748779296875, "r": 310.7267150878906, "b": 491.82025146484375, "coord_origin": "TOPLEFT"}, "confidence": 0.8418155908584595, "cells": [], "children": []}, {"id": 8, "label": "table", "bbox": {"l": 319.982666015625, "t": 489.2437438964844, "r": 519.0963745117188, "b": 535.69580078125, "coord_origin": "TOPLEFT"}, "confidence": 0.8502867221832275, "cells": [], "children": []}, {"id": 4, "label": "table", "bbox": {"l": 50.86823654174805, "t": 504.09625244140625, "r": 310.6080017089844, "b": 542.4459838867188, "coord_origin": "TOPLEFT"}, "confidence": 0.8922696709632874, "cells": [], "children": []}, {"id": 15, "label": "table", "bbox": {"l": 319.8287658691406, "t": 546.4093017578125, "r": 519.6065673828125, "b": 593.1064453125, "coord_origin": "TOPLEFT"}, "confidence": 0.6817973256111145, "cells": [], "children": []}, {"id": 6, "label": "table", "bbox": {"l": 51.27280807495117, "t": 553.728515625, "r": 311.0897216796875, "b": 591.913330078125, "coord_origin": "TOPLEFT"}, "confidence": 0.88722163438797, "cells": [], "children": []}, {"id": 7, "label": "table", "bbox": {"l": 319.06494140625, "t": 609.8408203125, "r": 533.77392578125, "b": 669.1920776367188, "coord_origin": "TOPLEFT"}, "confidence": 0.8717735409736633, "cells": [], "children": []}, {"id": 11, "label": "picture", "bbox": {"l": 50.40477752685547, "t": 611.0038452148438, "r": 177.0564422607422, "b": 656.1609497070312, "coord_origin": "TOPLEFT"}, "confidence": 0.7871124744415283, "cells": [], "children": []}]}, "tablestructure": {"table_map": {"23": {"label": "table", "id": 23, "page_no": 13, "cluster": {"id": 23, "label": "table", "bbox": {"l": 318.9809265136719, "t": 161.23460388183594, "r": 534.6229248046875, "b": 214.6260528564453, "coord_origin": "TOPLEFT"}, "confidence": 0.6235634684562683, "cells": [], "children": []}, "text": null, "otsl_seq": ["fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, "33": {"label": "table", "id": 33, "page_no": 13, "cluster": {"id": 33, "label": "table", "bbox": {"l": 319.0057678222656, "t": 226.10633850097656, "r": 534.408935546875, "b": 279.8576965332031, "coord_origin": "TOPLEFT"}, "confidence": 0.5502500534057617, "cells": [], "children": []}, "text": null, "otsl_seq": ["fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, "27": {"label": "table", "id": 27, "page_no": 13, "cluster": {"id": 27, "label": "table", "bbox": {"l": 51.72642135620117, "t": 273.6092834472656, "r": 283.114013671875, "b": 344.2445068359375, "coord_origin": "TOPLEFT"}, "confidence": 0.5696635246276855, "cells": [], "children": []}, "text": null, "otsl_seq": ["ecel", "ched", "ched", "ched", "nl", "ecel", "fcel", "fcel", "fcel", "nl", "ecel", "fcel", "fcel", "fcel", "nl", "ecel", "fcel", "fcel", "ecel", "nl", "ecel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "ecel", "nl", "rhed", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "ecel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, "38": {"label": "table", "id": 38, "page_no": 13, "cluster": {"id": 38, "label": "table", "bbox": {"l": 328.1381530761719, "t": 288.6817932128906, "r": 523.8916015625, "b": 358.2724304199219, "coord_origin": "TOPLEFT"}, "confidence": 0.5227423310279846, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "ecel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, "10": {"label": "table", "id": 10, "page_no": 13, "cluster": {"id": 10, "label": "table", "bbox": {"l": 319.4707946777344, "t": 430.90301513671875, "r": 518.5693359375, "b": 477.94354248046875, "coord_origin": "TOPLEFT"}, "confidence": 0.8384715914726257, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, "9": {"label": "table", "id": 9, "page_no": 13, "cluster": {"id": 9, "label": "table", "bbox": {"l": 51.434879302978516, "t": 453.48748779296875, "r": 310.7267150878906, "b": 491.82025146484375, "coord_origin": "TOPLEFT"}, "confidence": 0.8418155908584595, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, "8": {"label": "table", "id": 8, "page_no": 13, "cluster": {"id": 8, "label": "table", "bbox": {"l": 319.982666015625, "t": 489.2437438964844, "r": 519.0963745117188, "b": 535.69580078125, "coord_origin": "TOPLEFT"}, "confidence": 0.8502867221832275, "cells": [], "children": []}, "text": null, "otsl_seq": ["fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, "4": {"label": "table", "id": 4, "page_no": 13, "cluster": {"id": 4, "label": "table", "bbox": {"l": 50.86823654174805, "t": 504.09625244140625, "r": 310.6080017089844, "b": 542.4459838867188, "coord_origin": "TOPLEFT"}, "confidence": 0.8922696709632874, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, "15": {"label": "table", "id": 15, "page_no": 13, "cluster": {"id": 15, "label": "table", "bbox": {"l": 319.8287658691406, "t": 546.4093017578125, "r": 519.6065673828125, "b": 593.1064453125, "coord_origin": "TOPLEFT"}, "confidence": 0.6817973256111145, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, "6": {"label": "table", "id": 6, "page_no": 13, "cluster": {"id": 6, "label": "table", "bbox": {"l": 51.27280807495117, "t": 553.728515625, "r": 311.0897216796875, "b": 591.913330078125, "coord_origin": "TOPLEFT"}, "confidence": 0.88722163438797, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, "7": {"label": "table", "id": 7, "page_no": 13, "cluster": {"id": 7, "label": "table", "bbox": {"l": 319.06494140625, "t": 609.8408203125, "r": 533.77392578125, "b": 669.1920776367188, "coord_origin": "TOPLEFT"}, "confidence": 0.8717735409736633, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "caption", "id": 0, "page_no": 13, "cluster": {"id": 0, "label": "caption", "bbox": {"l": 50.112, "t": 356.77036, "r": 286.36508, "b": 377.6319, "coord_origin": "TOPLEFT"}, "confidence": 0.951069176197052, "cells": [{"id": 0, "text": "Figure 11:", "bbox": {"l": 50.112, "t": 356.77036, "r": 93.050797, "b": 365.67691, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Simple table with different style and empty", "bbox": {"l": 103.73071, "t": 356.77036, "r": 286.36508, "b": 365.67691, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "cells.", "bbox": {"l": 50.112, "t": 368.72534, "r": 70.864098, "b": 377.6319, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 11: Simple table with different style and empty cells."}, {"label": "caption", "id": 1, "page_no": 13, "cluster": {"id": 1, "label": "caption", "bbox": {"l": 54.618998999999995, "t": 671.81836, "r": 281.8559, "b": 680.72492, "coord_origin": "TOPLEFT"}, "confidence": 0.926384687423706, "cells": [{"id": 3, "text": "Figure 12: Simple table predictions and post processing.", "bbox": {"l": 54.618998999999995, "t": 671.81836, "r": 281.8559, "b": 680.72492, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 12: Simple table predictions and post processing."}, {"label": "caption", "id": 3, "page_no": 13, "cluster": {"id": 3, "label": "caption", "bbox": {"l": 315.79001, "t": 371.68436, "r": 538.18524, "b": 380.59091, "coord_origin": "TOPLEFT"}, "confidence": 0.9178510904312134, "cells": [{"id": 4, "text": "Figure 13: Table predictions example on colorful table.", "bbox": {"l": 315.79001, "t": 371.68436, "r": 538.18524, "b": 380.59091, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 13: Table predictions example on colorful table."}, {"label": "caption", "id": 2, "page_no": 13, "cluster": {"id": 2, "label": "caption", "bbox": {"l": 344.98499, "t": 683.54636, "r": 508.98935000000006, "b": 692.452927, "coord_origin": "TOPLEFT"}, "confidence": 0.9191023111343384, "cells": [{"id": 5, "text": "Figure 14: Example with multi-line text.", "bbox": {"l": 344.98499, "t": 683.54636, "r": 508.98935000000006, "b": 692.452927, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 14: Example with multi-line text."}, {"label": "page_footer", "id": 5, "page_no": 13, "cluster": {"id": 5, "label": "page_footer", "bbox": {"l": 292.63098, "t": 734.133362, "r": 302.59357, "b": 743.039925, "coord_origin": "TOPLEFT"}, "confidence": 0.887715220451355, "cells": [{"id": 6, "text": "14", "bbox": {"l": 292.63098, "t": 734.133362, "r": 302.59357, "b": 743.039925, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "14"}, {"label": "picture", "id": 41, "page_no": 13, "cluster": {"id": 41, "label": "picture", "bbox": {"l": 318.6332092285156, "t": 90.88423156738281, "r": 534.73583984375, "b": 359.0575866699219, "coord_origin": "TOPLEFT"}, "confidence": 0.5003598928451538, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "picture", "id": 30, "page_no": 13, "cluster": {"id": 30, "label": "picture", "bbox": {"l": 51.15378952026367, "t": 104.30851745605469, "r": 282.8598937988281, "b": 344.90667724609375, "coord_origin": "TOPLEFT"}, "confidence": 0.5613773465156555, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "table", "id": 23, "page_no": 13, "cluster": {"id": 23, "label": "table", "bbox": {"l": 318.9809265136719, "t": 161.23460388183594, "r": 534.6229248046875, "b": 214.6260528564453, "coord_origin": "TOPLEFT"}, "confidence": 0.6235634684562683, "cells": [], "children": []}, "text": null, "otsl_seq": ["fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 33, "page_no": 13, "cluster": {"id": 33, "label": "table", "bbox": {"l": 319.0057678222656, "t": 226.10633850097656, "r": 534.408935546875, "b": 279.8576965332031, "coord_origin": "TOPLEFT"}, "confidence": 0.5502500534057617, "cells": [], "children": []}, "text": null, "otsl_seq": ["fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 27, "page_no": 13, "cluster": {"id": 27, "label": "table", "bbox": {"l": 51.72642135620117, "t": 273.6092834472656, "r": 283.114013671875, "b": 344.2445068359375, "coord_origin": "TOPLEFT"}, "confidence": 0.5696635246276855, "cells": [], "children": []}, "text": null, "otsl_seq": ["ecel", "ched", "ched", "ched", "nl", "ecel", "fcel", "fcel", "fcel", "nl", "ecel", "fcel", "fcel", "fcel", "nl", "ecel", "fcel", "fcel", "ecel", "nl", "ecel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "ecel", "nl", "rhed", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "ecel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 38, "page_no": 13, "cluster": {"id": 38, "label": "table", "bbox": {"l": 328.1381530761719, "t": 288.6817932128906, "r": 523.8916015625, "b": 358.2724304199219, "coord_origin": "TOPLEFT"}, "confidence": 0.5227423310279846, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "ecel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 10, "page_no": 13, "cluster": {"id": 10, "label": "table", "bbox": {"l": 319.4707946777344, "t": 430.90301513671875, "r": 518.5693359375, "b": 477.94354248046875, "coord_origin": "TOPLEFT"}, "confidence": 0.8384715914726257, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 9, "page_no": 13, "cluster": {"id": 9, "label": "table", "bbox": {"l": 51.434879302978516, "t": 453.48748779296875, "r": 310.7267150878906, "b": 491.82025146484375, "coord_origin": "TOPLEFT"}, "confidence": 0.8418155908584595, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 8, "page_no": 13, "cluster": {"id": 8, "label": "table", "bbox": {"l": 319.982666015625, "t": 489.2437438964844, "r": 519.0963745117188, "b": 535.69580078125, "coord_origin": "TOPLEFT"}, "confidence": 0.8502867221832275, "cells": [], "children": []}, "text": null, "otsl_seq": ["fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 4, "page_no": 13, "cluster": {"id": 4, "label": "table", "bbox": {"l": 50.86823654174805, "t": 504.09625244140625, "r": 310.6080017089844, "b": 542.4459838867188, "coord_origin": "TOPLEFT"}, "confidence": 0.8922696709632874, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 15, "page_no": 13, "cluster": {"id": 15, "label": "table", "bbox": {"l": 319.8287658691406, "t": 546.4093017578125, "r": 519.6065673828125, "b": 593.1064453125, "coord_origin": "TOPLEFT"}, "confidence": 0.6817973256111145, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 6, "page_no": 13, "cluster": {"id": 6, "label": "table", "bbox": {"l": 51.27280807495117, "t": 553.728515625, "r": 311.0897216796875, "b": 591.913330078125, "coord_origin": "TOPLEFT"}, "confidence": 0.88722163438797, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 7, "page_no": 13, "cluster": {"id": 7, "label": "table", "bbox": {"l": 319.06494140625, "t": 609.8408203125, "r": 533.77392578125, "b": 669.1920776367188, "coord_origin": "TOPLEFT"}, "confidence": 0.8717735409736633, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "picture", "id": 11, "page_no": 13, "cluster": {"id": 11, "label": "picture", "bbox": {"l": 50.40477752685547, "t": 611.0038452148438, "r": 177.0564422607422, "b": 656.1609497070312, "coord_origin": "TOPLEFT"}, "confidence": 0.7871124744415283, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "body": [{"label": "caption", "id": 0, "page_no": 13, "cluster": {"id": 0, "label": "caption", "bbox": {"l": 50.112, "t": 356.77036, "r": 286.36508, "b": 377.6319, "coord_origin": "TOPLEFT"}, "confidence": 0.951069176197052, "cells": [{"id": 0, "text": "Figure 11:", "bbox": {"l": 50.112, "t": 356.77036, "r": 93.050797, "b": 365.67691, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Simple table with different style and empty", "bbox": {"l": 103.73071, "t": 356.77036, "r": 286.36508, "b": 365.67691, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "cells.", "bbox": {"l": 50.112, "t": 368.72534, "r": 70.864098, "b": 377.6319, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 11: Simple table with different style and empty cells."}, {"label": "caption", "id": 1, "page_no": 13, "cluster": {"id": 1, "label": "caption", "bbox": {"l": 54.618998999999995, "t": 671.81836, "r": 281.8559, "b": 680.72492, "coord_origin": "TOPLEFT"}, "confidence": 0.926384687423706, "cells": [{"id": 3, "text": "Figure 12: Simple table predictions and post processing.", "bbox": {"l": 54.618998999999995, "t": 671.81836, "r": 281.8559, "b": 680.72492, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 12: Simple table predictions and post processing."}, {"label": "caption", "id": 3, "page_no": 13, "cluster": {"id": 3, "label": "caption", "bbox": {"l": 315.79001, "t": 371.68436, "r": 538.18524, "b": 380.59091, "coord_origin": "TOPLEFT"}, "confidence": 0.9178510904312134, "cells": [{"id": 4, "text": "Figure 13: Table predictions example on colorful table.", "bbox": {"l": 315.79001, "t": 371.68436, "r": 538.18524, "b": 380.59091, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 13: Table predictions example on colorful table."}, {"label": "caption", "id": 2, "page_no": 13, "cluster": {"id": 2, "label": "caption", "bbox": {"l": 344.98499, "t": 683.54636, "r": 508.98935000000006, "b": 692.452927, "coord_origin": "TOPLEFT"}, "confidence": 0.9191023111343384, "cells": [{"id": 5, "text": "Figure 14: Example with multi-line text.", "bbox": {"l": 344.98499, "t": 683.54636, "r": 508.98935000000006, "b": 692.452927, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 14: Example with multi-line text."}, {"label": "picture", "id": 41, "page_no": 13, "cluster": {"id": 41, "label": "picture", "bbox": {"l": 318.6332092285156, "t": 90.88423156738281, "r": 534.73583984375, "b": 359.0575866699219, "coord_origin": "TOPLEFT"}, "confidence": 0.5003598928451538, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "picture", "id": 30, "page_no": 13, "cluster": {"id": 30, "label": "picture", "bbox": {"l": 51.15378952026367, "t": 104.30851745605469, "r": 282.8598937988281, "b": 344.90667724609375, "coord_origin": "TOPLEFT"}, "confidence": 0.5613773465156555, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "table", "id": 23, "page_no": 13, "cluster": {"id": 23, "label": "table", "bbox": {"l": 318.9809265136719, "t": 161.23460388183594, "r": 534.6229248046875, "b": 214.6260528564453, "coord_origin": "TOPLEFT"}, "confidence": 0.6235634684562683, "cells": [], "children": []}, "text": null, "otsl_seq": ["fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 33, "page_no": 13, "cluster": {"id": 33, "label": "table", "bbox": {"l": 319.0057678222656, "t": 226.10633850097656, "r": 534.408935546875, "b": 279.8576965332031, "coord_origin": "TOPLEFT"}, "confidence": 0.5502500534057617, "cells": [], "children": []}, "text": null, "otsl_seq": ["fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 27, "page_no": 13, "cluster": {"id": 27, "label": "table", "bbox": {"l": 51.72642135620117, "t": 273.6092834472656, "r": 283.114013671875, "b": 344.2445068359375, "coord_origin": "TOPLEFT"}, "confidence": 0.5696635246276855, "cells": [], "children": []}, "text": null, "otsl_seq": ["ecel", "ched", "ched", "ched", "nl", "ecel", "fcel", "fcel", "fcel", "nl", "ecel", "fcel", "fcel", "fcel", "nl", "ecel", "fcel", "fcel", "ecel", "nl", "ecel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "ecel", "nl", "rhed", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "ecel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 38, "page_no": 13, "cluster": {"id": 38, "label": "table", "bbox": {"l": 328.1381530761719, "t": 288.6817932128906, "r": 523.8916015625, "b": 358.2724304199219, "coord_origin": "TOPLEFT"}, "confidence": 0.5227423310279846, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "ecel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 10, "page_no": 13, "cluster": {"id": 10, "label": "table", "bbox": {"l": 319.4707946777344, "t": 430.90301513671875, "r": 518.5693359375, "b": 477.94354248046875, "coord_origin": "TOPLEFT"}, "confidence": 0.8384715914726257, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 9, "page_no": 13, "cluster": {"id": 9, "label": "table", "bbox": {"l": 51.434879302978516, "t": 453.48748779296875, "r": 310.7267150878906, "b": 491.82025146484375, "coord_origin": "TOPLEFT"}, "confidence": 0.8418155908584595, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 8, "page_no": 13, "cluster": {"id": 8, "label": "table", "bbox": {"l": 319.982666015625, "t": 489.2437438964844, "r": 519.0963745117188, "b": 535.69580078125, "coord_origin": "TOPLEFT"}, "confidence": 0.8502867221832275, "cells": [], "children": []}, "text": null, "otsl_seq": ["fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 4, "page_no": 13, "cluster": {"id": 4, "label": "table", "bbox": {"l": 50.86823654174805, "t": 504.09625244140625, "r": 310.6080017089844, "b": 542.4459838867188, "coord_origin": "TOPLEFT"}, "confidence": 0.8922696709632874, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 15, "page_no": 13, "cluster": {"id": 15, "label": "table", "bbox": {"l": 319.8287658691406, "t": 546.4093017578125, "r": 519.6065673828125, "b": 593.1064453125, "coord_origin": "TOPLEFT"}, "confidence": 0.6817973256111145, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 6, "page_no": 13, "cluster": {"id": 6, "label": "table", "bbox": {"l": 51.27280807495117, "t": 553.728515625, "r": 311.0897216796875, "b": 591.913330078125, "coord_origin": "TOPLEFT"}, "confidence": 0.88722163438797, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 7, "page_no": 13, "cluster": {"id": 7, "label": "table", "bbox": {"l": 319.06494140625, "t": 609.8408203125, "r": 533.77392578125, "b": 669.1920776367188, "coord_origin": "TOPLEFT"}, "confidence": 0.8717735409736633, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "picture", "id": 11, "page_no": 13, "cluster": {"id": 11, "label": "picture", "bbox": {"l": 50.40477752685547, "t": 611.0038452148438, "r": 177.0564422607422, "b": 656.1609497070312, "coord_origin": "TOPLEFT"}, "confidence": 0.7871124744415283, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "headers": [{"label": "page_footer", "id": 5, "page_no": 13, "cluster": {"id": 5, "label": "page_footer", "bbox": {"l": 292.63098, "t": 734.133362, "r": 302.59357, "b": 743.039925, "coord_origin": "TOPLEFT"}, "confidence": 0.887715220451355, "cells": [{"id": 6, "text": "14", "bbox": {"l": 292.63098, "t": 734.133362, "r": 302.59357, "b": 743.039925, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "14"}]}}, {"page_no": 14, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "Figure 15: Example with triangular table.", "bbox": {"l": 84.233002, "t": 644.3513800000001, "r": 252.24225, "b": 653.25793, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Figure 16: Example of how post-processing helps to restore", "bbox": {"l": 308.86197, "t": 652.93535, "r": 545.11511, "b": 661.8419, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "mis-aligned bounding boxes prediction artifact.", "bbox": {"l": 308.86197, "t": 664.89035, "r": 497.60349, "b": 673.79691, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "15", "bbox": {"l": 292.63098, "t": 734.133343, "r": 302.59357, "b": 743.039906, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 0, "label": "caption", "bbox": {"l": 84.233002, "t": 644.3513800000001, "r": 252.24225, "b": 653.25793, "coord_origin": "TOPLEFT"}, "confidence": 0.9257225394248962, "cells": [{"id": 0, "text": "Figure 15: Example with triangular table.", "bbox": {"l": 84.233002, "t": 644.3513800000001, "r": 252.24225, "b": 653.25793, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "caption", "bbox": {"l": 308.86197, "t": 652.93535, "r": 545.11511, "b": 673.79691, "coord_origin": "TOPLEFT"}, "confidence": 0.9134758710861206, "cells": [{"id": 1, "text": "Figure 16: Example of how post-processing helps to restore", "bbox": {"l": 308.86197, "t": 652.93535, "r": 545.11511, "b": 661.8419, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "mis-aligned bounding boxes prediction artifact.", "bbox": {"l": 308.86197, "t": 664.89035, "r": 497.60349, "b": 673.79691, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "page_footer", "bbox": {"l": 292.63098, "t": 734.133343, "r": 302.59357, "b": 743.039906, "coord_origin": "TOPLEFT"}, "confidence": 0.9037020802497864, "cells": [{"id": 3, "text": "15", "bbox": {"l": 292.63098, "t": 734.133343, "r": 302.59357, "b": 743.039906, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "table", "bbox": {"l": 323.0059509277344, "t": 121.54714965820312, "r": 525.95166015625, "b": 222.91140747070312, "coord_origin": "TOPLEFT"}, "confidence": 0.8569068908691406, "cells": [], "children": []}, {"id": 6, "label": "picture", "bbox": {"l": 55.116363525390625, "t": 136.2550048828125, "r": 279.370849609375, "b": 249.3345489501953, "coord_origin": "TOPLEFT"}, "confidence": 0.8099280595779419, "cells": [], "children": []}, {"id": 19, "label": "table", "bbox": {"l": 55.116363525390625, "t": 136.2550048828125, "r": 279.370849609375, "b": 249.3345489501953, "coord_origin": "TOPLEFT"}, "confidence": 0.5584819912910461, "cells": [], "children": []}, {"id": 2, "label": "table", "bbox": {"l": 323.384765625, "t": 241.9729461669922, "r": 526.1268920898438, "b": 344.09210205078125, "coord_origin": "TOPLEFT"}, "confidence": 0.9060239195823669, "cells": [], "children": []}, {"id": 18, "label": "picture", "bbox": {"l": 54.28135299682617, "t": 260.2615661621094, "r": 279.2568359375, "b": 373.5270690917969, "coord_origin": "TOPLEFT"}, "confidence": 0.567050039768219, "cells": [], "children": []}, {"id": 10, "label": "table", "bbox": {"l": 54.28135299682617, "t": 260.2615661621094, "r": 279.2568359375, "b": 373.5270690917969, "coord_origin": "TOPLEFT"}, "confidence": 0.7748245000839233, "cells": [], "children": []}, {"id": 20, "label": "picture", "bbox": {"l": 323.46868896484375, "t": 362.4508361816406, "r": 525.9569091796875, "b": 464.260498046875, "coord_origin": "TOPLEFT"}, "confidence": 0.5515198707580566, "cells": [], "children": []}, {"id": 9, "label": "table", "bbox": {"l": 323.46868896484375, "t": 362.4508361816406, "r": 525.9569091796875, "b": 464.260498046875, "coord_origin": "TOPLEFT"}, "confidence": 0.7755160927772522, "cells": [], "children": []}, {"id": 5, "label": "picture", "bbox": {"l": 55.423954010009766, "t": 384.5550537109375, "r": 280.2310791015625, "b": 497.563720703125, "coord_origin": "TOPLEFT"}, "confidence": 0.8410326838493347, "cells": [], "children": []}, {"id": 22, "label": "picture", "bbox": {"l": 353.6920471191406, "t": 487.405029296875, "r": 495.4288024902344, "b": 635.7732543945312, "coord_origin": "TOPLEFT"}, "confidence": 0.5478786826133728, "cells": [], "children": []}, {"id": 8, "label": "table", "bbox": {"l": 353.6920471191406, "t": 487.405029296875, "r": 495.4288024902344, "b": 635.7732543945312, "coord_origin": "TOPLEFT"}, "confidence": 0.7805566787719727, "cells": [], "children": []}, {"id": 7, "label": "picture", "bbox": {"l": 50.64818572998047, "t": 505.98046875, "r": 319.9103088378906, "b": 631.263671875, "coord_origin": "TOPLEFT"}, "confidence": 0.8057592511177063, "cells": [], "children": []}, {"id": 11, "label": "table", "bbox": {"l": 50.64818572998047, "t": 505.98046875, "r": 319.9103088378906, "b": 631.263671875, "coord_origin": "TOPLEFT"}, "confidence": 0.6835257411003113, "cells": [], "children": []}]}, "tablestructure": {"table_map": {"4": {"label": "table", "id": 4, "page_no": 14, "cluster": {"id": 4, "label": "table", "bbox": {"l": 323.0059509277344, "t": 121.54714965820312, "r": 525.95166015625, "b": 222.91140747070312, "coord_origin": "TOPLEFT"}, "confidence": 0.8569068908691406, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, "19": {"label": "table", "id": 19, "page_no": 14, "cluster": {"id": 19, "label": "table", "bbox": {"l": 55.116363525390625, "t": 136.2550048828125, "r": 279.370849609375, "b": 249.3345489501953, "coord_origin": "TOPLEFT"}, "confidence": 0.5584819912910461, "cells": [], "children": []}, "text": null, "otsl_seq": ["ecel", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, "2": {"label": "table", "id": 2, "page_no": 14, "cluster": {"id": 2, "label": "table", "bbox": {"l": 323.384765625, "t": 241.9729461669922, "r": 526.1268920898438, "b": 344.09210205078125, "coord_origin": "TOPLEFT"}, "confidence": 0.9060239195823669, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, "10": {"label": "table", "id": 10, "page_no": 14, "cluster": {"id": 10, "label": "table", "bbox": {"l": 54.28135299682617, "t": 260.2615661621094, "r": 279.2568359375, "b": 373.5270690917969, "coord_origin": "TOPLEFT"}, "confidence": 0.7748245000839233, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, "9": {"label": "table", "id": 9, "page_no": 14, "cluster": {"id": 9, "label": "table", "bbox": {"l": 323.46868896484375, "t": 362.4508361816406, "r": 525.9569091796875, "b": 464.260498046875, "coord_origin": "TOPLEFT"}, "confidence": 0.7755160927772522, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, "8": {"label": "table", "id": 8, "page_no": 14, "cluster": {"id": 8, "label": "table", "bbox": {"l": 353.6920471191406, "t": 487.405029296875, "r": 495.4288024902344, "b": 635.7732543945312, "coord_origin": "TOPLEFT"}, "confidence": 0.7805566787719727, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, "11": {"label": "table", "id": 11, "page_no": 14, "cluster": {"id": 11, "label": "table", "bbox": {"l": 50.64818572998047, "t": 505.98046875, "r": 319.9103088378906, "b": 631.263671875, "coord_origin": "TOPLEFT"}, "confidence": 0.6835257411003113, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "caption", "id": 0, "page_no": 14, "cluster": {"id": 0, "label": "caption", "bbox": {"l": 84.233002, "t": 644.3513800000001, "r": 252.24225, "b": 653.25793, "coord_origin": "TOPLEFT"}, "confidence": 0.9257225394248962, "cells": [{"id": 0, "text": "Figure 15: Example with triangular table.", "bbox": {"l": 84.233002, "t": 644.3513800000001, "r": 252.24225, "b": 653.25793, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 15: Example with triangular table."}, {"label": "caption", "id": 1, "page_no": 14, "cluster": {"id": 1, "label": "caption", "bbox": {"l": 308.86197, "t": 652.93535, "r": 545.11511, "b": 673.79691, "coord_origin": "TOPLEFT"}, "confidence": 0.9134758710861206, "cells": [{"id": 1, "text": "Figure 16: Example of how post-processing helps to restore", "bbox": {"l": 308.86197, "t": 652.93535, "r": 545.11511, "b": 661.8419, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "mis-aligned bounding boxes prediction artifact.", "bbox": {"l": 308.86197, "t": 664.89035, "r": 497.60349, "b": 673.79691, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 16: Example of how post-processing helps to restore mis-aligned bounding boxes prediction artifact."}, {"label": "page_footer", "id": 3, "page_no": 14, "cluster": {"id": 3, "label": "page_footer", "bbox": {"l": 292.63098, "t": 734.133343, "r": 302.59357, "b": 743.039906, "coord_origin": "TOPLEFT"}, "confidence": 0.9037020802497864, "cells": [{"id": 3, "text": "15", "bbox": {"l": 292.63098, "t": 734.133343, "r": 302.59357, "b": 743.039906, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "15"}, {"label": "table", "id": 4, "page_no": 14, "cluster": {"id": 4, "label": "table", "bbox": {"l": 323.0059509277344, "t": 121.54714965820312, "r": 525.95166015625, "b": 222.91140747070312, "coord_origin": "TOPLEFT"}, "confidence": 0.8569068908691406, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "picture", "id": 6, "page_no": 14, "cluster": {"id": 6, "label": "picture", "bbox": {"l": 55.116363525390625, "t": 136.2550048828125, "r": 279.370849609375, "b": 249.3345489501953, "coord_origin": "TOPLEFT"}, "confidence": 0.8099280595779419, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "table", "id": 19, "page_no": 14, "cluster": {"id": 19, "label": "table", "bbox": {"l": 55.116363525390625, "t": 136.2550048828125, "r": 279.370849609375, "b": 249.3345489501953, "coord_origin": "TOPLEFT"}, "confidence": 0.5584819912910461, "cells": [], "children": []}, "text": null, "otsl_seq": ["ecel", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 2, "page_no": 14, "cluster": {"id": 2, "label": "table", "bbox": {"l": 323.384765625, "t": 241.9729461669922, "r": 526.1268920898438, "b": 344.09210205078125, "coord_origin": "TOPLEFT"}, "confidence": 0.9060239195823669, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "picture", "id": 18, "page_no": 14, "cluster": {"id": 18, "label": "picture", "bbox": {"l": 54.28135299682617, "t": 260.2615661621094, "r": 279.2568359375, "b": 373.5270690917969, "coord_origin": "TOPLEFT"}, "confidence": 0.567050039768219, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "table", "id": 10, "page_no": 14, "cluster": {"id": 10, "label": "table", "bbox": {"l": 54.28135299682617, "t": 260.2615661621094, "r": 279.2568359375, "b": 373.5270690917969, "coord_origin": "TOPLEFT"}, "confidence": 0.7748245000839233, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "picture", "id": 20, "page_no": 14, "cluster": {"id": 20, "label": "picture", "bbox": {"l": 323.46868896484375, "t": 362.4508361816406, "r": 525.9569091796875, "b": 464.260498046875, "coord_origin": "TOPLEFT"}, "confidence": 0.5515198707580566, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "table", "id": 9, "page_no": 14, "cluster": {"id": 9, "label": "table", "bbox": {"l": 323.46868896484375, "t": 362.4508361816406, "r": 525.9569091796875, "b": 464.260498046875, "coord_origin": "TOPLEFT"}, "confidence": 0.7755160927772522, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "picture", "id": 5, "page_no": 14, "cluster": {"id": 5, "label": "picture", "bbox": {"l": 55.423954010009766, "t": 384.5550537109375, "r": 280.2310791015625, "b": 497.563720703125, "coord_origin": "TOPLEFT"}, "confidence": 0.8410326838493347, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "picture", "id": 22, "page_no": 14, "cluster": {"id": 22, "label": "picture", "bbox": {"l": 353.6920471191406, "t": 487.405029296875, "r": 495.4288024902344, "b": 635.7732543945312, "coord_origin": "TOPLEFT"}, "confidence": 0.5478786826133728, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "table", "id": 8, "page_no": 14, "cluster": {"id": 8, "label": "table", "bbox": {"l": 353.6920471191406, "t": 487.405029296875, "r": 495.4288024902344, "b": 635.7732543945312, "coord_origin": "TOPLEFT"}, "confidence": 0.7805566787719727, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "picture", "id": 7, "page_no": 14, "cluster": {"id": 7, "label": "picture", "bbox": {"l": 50.64818572998047, "t": 505.98046875, "r": 319.9103088378906, "b": 631.263671875, "coord_origin": "TOPLEFT"}, "confidence": 0.8057592511177063, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "table", "id": 11, "page_no": 14, "cluster": {"id": 11, "label": "table", "bbox": {"l": 50.64818572998047, "t": 505.98046875, "r": 319.9103088378906, "b": 631.263671875, "coord_origin": "TOPLEFT"}, "confidence": 0.6835257411003113, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}], "body": [{"label": "caption", "id": 0, "page_no": 14, "cluster": {"id": 0, "label": "caption", "bbox": {"l": 84.233002, "t": 644.3513800000001, "r": 252.24225, "b": 653.25793, "coord_origin": "TOPLEFT"}, "confidence": 0.9257225394248962, "cells": [{"id": 0, "text": "Figure 15: Example with triangular table.", "bbox": {"l": 84.233002, "t": 644.3513800000001, "r": 252.24225, "b": 653.25793, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 15: Example with triangular table."}, {"label": "caption", "id": 1, "page_no": 14, "cluster": {"id": 1, "label": "caption", "bbox": {"l": 308.86197, "t": 652.93535, "r": 545.11511, "b": 673.79691, "coord_origin": "TOPLEFT"}, "confidence": 0.9134758710861206, "cells": [{"id": 1, "text": "Figure 16: Example of how post-processing helps to restore", "bbox": {"l": 308.86197, "t": 652.93535, "r": 545.11511, "b": 661.8419, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "mis-aligned bounding boxes prediction artifact.", "bbox": {"l": 308.86197, "t": 664.89035, "r": 497.60349, "b": 673.79691, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 16: Example of how post-processing helps to restore mis-aligned bounding boxes prediction artifact."}, {"label": "table", "id": 4, "page_no": 14, "cluster": {"id": 4, "label": "table", "bbox": {"l": 323.0059509277344, "t": 121.54714965820312, "r": 525.95166015625, "b": 222.91140747070312, "coord_origin": "TOPLEFT"}, "confidence": 0.8569068908691406, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "picture", "id": 6, "page_no": 14, "cluster": {"id": 6, "label": "picture", "bbox": {"l": 55.116363525390625, "t": 136.2550048828125, "r": 279.370849609375, "b": 249.3345489501953, "coord_origin": "TOPLEFT"}, "confidence": 0.8099280595779419, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "table", "id": 19, "page_no": 14, "cluster": {"id": 19, "label": "table", "bbox": {"l": 55.116363525390625, "t": 136.2550048828125, "r": 279.370849609375, "b": 249.3345489501953, "coord_origin": "TOPLEFT"}, "confidence": 0.5584819912910461, "cells": [], "children": []}, "text": null, "otsl_seq": ["ecel", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 2, "page_no": 14, "cluster": {"id": 2, "label": "table", "bbox": {"l": 323.384765625, "t": 241.9729461669922, "r": 526.1268920898438, "b": 344.09210205078125, "coord_origin": "TOPLEFT"}, "confidence": 0.9060239195823669, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "picture", "id": 18, "page_no": 14, "cluster": {"id": 18, "label": "picture", "bbox": {"l": 54.28135299682617, "t": 260.2615661621094, "r": 279.2568359375, "b": 373.5270690917969, "coord_origin": "TOPLEFT"}, "confidence": 0.567050039768219, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "table", "id": 10, "page_no": 14, "cluster": {"id": 10, "label": "table", "bbox": {"l": 54.28135299682617, "t": 260.2615661621094, "r": 279.2568359375, "b": 373.5270690917969, "coord_origin": "TOPLEFT"}, "confidence": 0.7748245000839233, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "picture", "id": 20, "page_no": 14, "cluster": {"id": 20, "label": "picture", "bbox": {"l": 323.46868896484375, "t": 362.4508361816406, "r": 525.9569091796875, "b": 464.260498046875, "coord_origin": "TOPLEFT"}, "confidence": 0.5515198707580566, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "table", "id": 9, "page_no": 14, "cluster": {"id": 9, "label": "table", "bbox": {"l": 323.46868896484375, "t": 362.4508361816406, "r": 525.9569091796875, "b": 464.260498046875, "coord_origin": "TOPLEFT"}, "confidence": 0.7755160927772522, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "picture", "id": 5, "page_no": 14, "cluster": {"id": 5, "label": "picture", "bbox": {"l": 55.423954010009766, "t": 384.5550537109375, "r": 280.2310791015625, "b": 497.563720703125, "coord_origin": "TOPLEFT"}, "confidence": 0.8410326838493347, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "picture", "id": 22, "page_no": 14, "cluster": {"id": 22, "label": "picture", "bbox": {"l": 353.6920471191406, "t": 487.405029296875, "r": 495.4288024902344, "b": 635.7732543945312, "coord_origin": "TOPLEFT"}, "confidence": 0.5478786826133728, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "table", "id": 8, "page_no": 14, "cluster": {"id": 8, "label": "table", "bbox": {"l": 353.6920471191406, "t": 487.405029296875, "r": 495.4288024902344, "b": 635.7732543945312, "coord_origin": "TOPLEFT"}, "confidence": 0.7805566787719727, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "picture", "id": 7, "page_no": 14, "cluster": {"id": 7, "label": "picture", "bbox": {"l": 50.64818572998047, "t": 505.98046875, "r": 319.9103088378906, "b": 631.263671875, "coord_origin": "TOPLEFT"}, "confidence": 0.8057592511177063, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "table", "id": 11, "page_no": 14, "cluster": {"id": 11, "label": "table", "bbox": {"l": 50.64818572998047, "t": 505.98046875, "r": 319.9103088378906, "b": 631.263671875, "coord_origin": "TOPLEFT"}, "confidence": 0.6835257411003113, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}], "headers": [{"label": "page_footer", "id": 3, "page_no": 14, "cluster": {"id": 3, "label": "page_footer", "bbox": {"l": 292.63098, "t": 734.133343, "r": 302.59357, "b": 743.039906, "coord_origin": "TOPLEFT"}, "confidence": 0.9037020802497864, "cells": [{"id": 3, "text": "15", "bbox": {"l": 292.63098, "t": 734.133343, "r": 302.59357, "b": 743.039906, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "15"}]}}, {"page_no": 15, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "Figure 17: Example of long table. End-to-end example from initial PDF cells to prediction of bounding boxes, post process-", "bbox": {"l": 50.112, "t": 508.33737, "r": 545.11383, "b": 517.24393, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "ing and prediction of structure.", "bbox": {"l": 50.112, "t": 520.2923599999999, "r": 173.23975, "b": 529.1989100000001, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "16", "bbox": {"l": 292.63098, "t": 734.133358, "r": 302.59357, "b": 743.039921, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 0, "label": "caption", "bbox": {"l": 50.112, "t": 508.33737, "r": 545.11383, "b": 529.1989100000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9624594449996948, "cells": [{"id": 0, "text": "Figure 17: Example of long table. End-to-end example from initial PDF cells to prediction of bounding boxes, post process-", "bbox": {"l": 50.112, "t": 508.33737, "r": 545.11383, "b": 517.24393, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "ing and prediction of structure.", "bbox": {"l": 50.112, "t": 520.2923599999999, "r": 173.23975, "b": 529.1989100000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "page_footer", "bbox": {"l": 292.63098, "t": 734.133358, "r": 302.59357, "b": 743.039921, "coord_origin": "TOPLEFT"}, "confidence": 0.9134101271629333, "cells": [{"id": 2, "text": "16", "bbox": {"l": 292.63098, "t": 734.133358, "r": 302.59357, "b": 743.039921, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "picture", "bbox": {"l": 66.79948425292969, "t": 253.61631774902344, "r": 528.5565795898438, "b": 498.1383972167969, "coord_origin": "TOPLEFT"}, "confidence": 0.6913455724716187, "cells": [], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "caption", "id": 0, "page_no": 15, "cluster": {"id": 0, "label": "caption", "bbox": {"l": 50.112, "t": 508.33737, "r": 545.11383, "b": 529.1989100000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9624594449996948, "cells": [{"id": 0, "text": "Figure 17: Example of long table. End-to-end example from initial PDF cells to prediction of bounding boxes, post process-", "bbox": {"l": 50.112, "t": 508.33737, "r": 545.11383, "b": 517.24393, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "ing and prediction of structure.", "bbox": {"l": 50.112, "t": 520.2923599999999, "r": 173.23975, "b": 529.1989100000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 17: Example of long table. End-to-end example from initial PDF cells to prediction of bounding boxes, post processing and prediction of structure."}, {"label": "page_footer", "id": 1, "page_no": 15, "cluster": {"id": 1, "label": "page_footer", "bbox": {"l": 292.63098, "t": 734.133358, "r": 302.59357, "b": 743.039921, "coord_origin": "TOPLEFT"}, "confidence": 0.9134101271629333, "cells": [{"id": 2, "text": "16", "bbox": {"l": 292.63098, "t": 734.133358, "r": 302.59357, "b": 743.039921, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "16"}, {"label": "picture", "id": 2, "page_no": 15, "cluster": {"id": 2, "label": "picture", "bbox": {"l": 66.79948425292969, "t": 253.61631774902344, "r": 528.5565795898438, "b": 498.1383972167969, "coord_origin": "TOPLEFT"}, "confidence": 0.6913455724716187, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "body": [{"label": "caption", "id": 0, "page_no": 15, "cluster": {"id": 0, "label": "caption", "bbox": {"l": 50.112, "t": 508.33737, "r": 545.11383, "b": 529.1989100000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9624594449996948, "cells": [{"id": 0, "text": "Figure 17: Example of long table. End-to-end example from initial PDF cells to prediction of bounding boxes, post process-", "bbox": {"l": 50.112, "t": 508.33737, "r": 545.11383, "b": 517.24393, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "ing and prediction of structure.", "bbox": {"l": 50.112, "t": 520.2923599999999, "r": 173.23975, "b": 529.1989100000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 17: Example of long table. End-to-end example from initial PDF cells to prediction of bounding boxes, post processing and prediction of structure."}, {"label": "picture", "id": 2, "page_no": 15, "cluster": {"id": 2, "label": "picture", "bbox": {"l": 66.79948425292969, "t": 253.61631774902344, "r": 528.5565795898438, "b": 498.1383972167969, "coord_origin": "TOPLEFT"}, "confidence": 0.6913455724716187, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "headers": [{"label": "page_footer", "id": 1, "page_no": 15, "cluster": {"id": 1, "label": "page_footer", "bbox": {"l": 292.63098, "t": 734.133358, "r": 302.59357, "b": 743.039921, "coord_origin": "TOPLEFT"}, "confidence": 0.9134101271629333, "cells": [{"id": 2, "text": "16", "bbox": {"l": 292.63098, "t": 734.133358, "r": 302.59357, "b": 743.039921, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "16"}]}}]
\ No newline at end of file
+[{"page_no": 0, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "TableFormer: Table Structure Understanding with Transformers.", "bbox": {"l": 96.301003, "t": 107.03412000000003, "r": 498.92708999999996, "b": 119.93133999999998, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Ahmed Nassar, Nikolaos Livathinos, Maksym Lysak, Peter Staar", "bbox": {"l": 142.47701, "t": 146.68535999999995, "r": 452.75027, "b": 157.37334999999996, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "IBM Research", "bbox": {"l": 262.918, "t": 160.63239, "r": 332.30597, "b": 171.32037000000003, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "{", "bbox": {"l": 208.123, "t": 175.96123999999998, "r": 212.73083, "b": 184.42553999999996, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "ahn,nli,mly,taa", "bbox": {"l": 212.73, "t": 177.08203000000003, "r": 293.42761, "b": 184.00409000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "}", "bbox": {"l": 293.42798, "t": 175.96123999999998, "r": 298.0358, "b": 184.42553999999996, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "@zurich.ibm.com", "bbox": {"l": 298.03497, "t": 177.08203000000003, "r": 378.73257, "b": 184.00409000000002, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Abstract", "bbox": {"l": 145.99498, "t": 215.48297000000002, "r": 190.48029, "b": 226.23071000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Tables organize valuable content in a concise and com-", "bbox": {"l": 62.066978, "t": 241.39508, "r": 286.36493, "b": 249.98284999999998, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "pact representation. This content is extremely valuable for", "bbox": {"l": 50.111977, "t": 253.3501, "r": 286.36508, "b": 261.93787, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "systems such as search engines, Knowledge Graph\u2019s, etc,", "bbox": {"l": 50.111977, "t": 265.30511, "r": 286.36508, "b": 273.89288, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "since they enhance their predictive capabilities. Unfortu-", "bbox": {"l": 50.111977, "t": 277.26111000000003, "r": 286.36505, "b": 285.84888, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "nately, tables come in a large variety of shapes and sizes.", "bbox": {"l": 50.111977, "t": 289.21609, "r": 286.36505, "b": 297.80386, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Furthermore, they can have complex column/row-header", "bbox": {"l": 50.111977, "t": 301.17108, "r": 286.36505, "b": 309.75884999999994, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "configurations, multiline rows, different variety of separa-", "bbox": {"l": 50.111977, "t": 313.12607, "r": 286.36508, "b": 321.71384, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "tion lines, missing entries, etc. As such, the correct iden-", "bbox": {"l": 50.111977, "t": 325.08105, "r": 286.36508, "b": 333.66882, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "tification of the table-structure from an image is a non-", "bbox": {"l": 50.111977, "t": 337.03604, "r": 286.36505, "b": 345.62381, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "trivial task. In this paper, we present a new table-structure", "bbox": {"l": 50.111977, "t": 348.99203, "r": 286.36508, "b": 357.5798, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "identification model. The latter improves the latest end-to-", "bbox": {"l": 50.111977, "t": 360.94701999999995, "r": 286.36505, "b": 369.53479, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "end deep learning model (i.e. encoder-dual-decoder from", "bbox": {"l": 50.111977, "t": 372.90201, "r": 286.36508, "b": 381.48978, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "PubTabNet) in two significant ways. First, we introduce a", "bbox": {"l": 50.111977, "t": 384.85699, "r": 286.36505, "b": 393.44476, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "new object detection decoder for table-cells. In this way,", "bbox": {"l": 50.111977, "t": 396.81198, "r": 286.36511, "b": 405.39975000000004, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "we can obtain the content of the table-cells from program-", "bbox": {"l": 50.111977, "t": 408.76697, "r": 286.36508, "b": 417.35474, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "matic PDF\u2019s directly from the PDF source and avoid the", "bbox": {"l": 50.111977, "t": 420.72296000000006, "r": 286.36505, "b": 429.31073, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "training of the custom OCR decoders.", "bbox": {"l": 50.111977, "t": 432.67795, "r": 207.23216, "b": 441.26572, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "This architectural", "bbox": {"l": 214.09639, "t": 432.67795, "r": 286.36508, "b": 441.26572, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "change leads to more accurate table-content extraction and", "bbox": {"l": 50.111977, "t": 444.63293, "r": 286.36508, "b": 453.2207, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "allows us to tackle non-english tables. Second, we replace", "bbox": {"l": 50.111977, "t": 456.58792000000005, "r": 286.36505, "b": 465.17569, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "the LSTM decoders with transformer based decoders. This", "bbox": {"l": 50.111977, "t": 468.54291, "r": 286.36505, "b": 477.13068, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "upgrade improves significantly the previous state-of-the-art", "bbox": {"l": 50.111977, "t": 480.4989, "r": 286.36508, "b": 489.08667, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "tree-editing-distance-score (TEDS) from 91% to 98.5% on", "bbox": {"l": 50.111977, "t": 492.45389, "r": 286.36505, "b": 501.04166, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "simple tables and from 88.7% to 95% on complex tables.", "bbox": {"l": 50.111977, "t": 504.40887, "r": 276.65152, "b": 512.9966400000001, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "1.", "bbox": {"l": 50.111977, "t": 539.94276, "r": 58.121296, "b": 550.69049, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "Introduction", "bbox": {"l": 68.800385, "t": 539.94276, "r": 126.94804, "b": 550.69049, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "The occurrence of tables in documents is ubiquitous.", "bbox": {"l": 62.066978, "t": 560.7832, "r": 286.36496, "b": 569.68976, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "They often summarise quantitative or factual data, which is", "bbox": {"l": 50.111977, "t": 572.7382, "r": 286.36508, "b": 581.64476, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "cumbersome to describe in verbose text but nevertheless ex-", "bbox": {"l": 50.111977, "t": 584.69321, "r": 286.36505, "b": 593.5997600000001, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "tremely valuable. Unfortunately, this compact representa-", "bbox": {"l": 50.111977, "t": 596.6492000000001, "r": 286.36505, "b": 605.55576, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "tion is often not easy to parse by machines. There are many", "bbox": {"l": 50.111977, "t": 608.6042, "r": 286.36505, "b": 617.51076, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "implicit conventions used to obtain a compact table repre-", "bbox": {"l": 50.111977, "t": 620.5592, "r": 286.36505, "b": 629.46576, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "sentation. For example, tables often have complex column-", "bbox": {"l": 50.111977, "t": 632.51421, "r": 286.36508, "b": 641.42076, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "and row-headers in order to reduce duplicated cell content.", "bbox": {"l": 50.111977, "t": 644.46921, "r": 286.36508, "b": 653.37576, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "Lines of different shapes and sizes are leveraged to separate", "bbox": {"l": 50.111977, "t": 656.42421, "r": 286.36502, "b": 665.33077, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "content or indicate a tree structure. Additionally, tables can", "bbox": {"l": 50.111977, "t": 668.3802000000001, "r": 286.36505, "b": 677.28677, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "also have empty/missing table-entries or multi-row textual", "bbox": {"l": 50.111977, "t": 680.33521, "r": 286.36505, "b": 689.2417800000001, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "table-entries. Fig. 1 shows a table which presents all these", "bbox": {"l": 50.111977, "t": 692.290207, "r": 286.36505, "b": 701.196777, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "issues.", "bbox": {"l": 50.111977, "t": 704.245209, "r": 76.403275, "b": 713.151779, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "a.", "bbox": {"l": 315.56702, "t": 218.00684, "r": 324.01007, "b": 226.75482, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Picture of a table:", "bbox": {"l": 328.2316, "t": 218.00684, "r": 408.4407, "b": 226.75482, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "b.", "bbox": {"l": 315.56702, "t": 313.69478999999995, "r": 325.05786, "b": 322.44281, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Red-annotation of bounding boxes,", "bbox": {"l": 329.80325, "t": 313.69478999999995, "r": 486.40194999999994, "b": 322.44281, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Blue-predictions by TableFormer", "bbox": {"l": 326.46252, "t": 324.49478, "r": 472.47411999999997, "b": 333.2428, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "c.", "bbox": {"l": 315.56702, "t": 420.1828, "r": 324.81039, "b": 428.93082, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Structure predicted by TableFormer:", "bbox": {"l": 329.4321, "t": 420.1828, "r": 491.1912500000001, "b": 428.93082, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "1", "bbox": {"l": 408.14752, "t": 342.82828, "r": 412.54001, "b": 351.61322, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "0", "bbox": {"l": 356.11011, "t": 341.57217, "r": 360.50259, "b": 350.35712, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "2", "bbox": {"l": 500.6777, "t": 340.93768, "r": 505.0701900000001, "b": 349.7226299999999, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "3", "bbox": {"l": 356.13382, "t": 351.74789, "r": 360.52631, "b": 360.53284, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "4", "bbox": {"l": 402.53992, "t": 355.8765, "r": 406.9324, "b": 364.66144, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "5", "bbox": {"l": 448.58178999999996, "t": 352.84018, "r": 452.97427, "b": 361.62512, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "6", "bbox": {"l": 491.65161000000006, "t": 353.70657, "r": 496.0441, "b": 362.49152, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "7", "bbox": {"l": 535.13843, "t": 353.33969, "r": 539.53088, "b": 362.12463, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "8", "bbox": {"l": 348.82822, "t": 387.09781, "r": 353.2207, "b": 395.88275, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "9", "bbox": {"l": 389.27151, "t": 375.37228, "r": 393.664, "b": 384.15723, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "10", "bbox": {"l": 442.67479999999995, "t": 375.64621, "r": 451.45889000000005, "b": 384.43115, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "11", "bbox": {"l": 477.4382299999999, "t": 375.534, "r": 485.90167, "b": 384.31894000000005, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "12", "bbox": {"l": 522.57263, "t": 375.64621, "r": 531.35669, "b": 384.43115, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "13", "bbox": {"l": 400.22992, "t": 387.11429, "r": 409.01401, "b": 395.89923, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "14", "bbox": {"l": 442.30792, "t": 386.98981000000003, "r": 451.0920100000001, "b": 395.77475000000004, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "15", "bbox": {"l": 478.21941999999996, "t": 387.37469, "r": 487.00351000000006, "b": 396.15964, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "16", "bbox": {"l": 523.2287, "t": 386.98981000000003, "r": 532.01276, "b": 395.77475000000004, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "1", "bbox": {"l": 411.57233, "t": 399.42477, "r": 415.96481, "b": 408.20972, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "7", "bbox": {"l": 415.96393, "t": 399.42477, "r": 420.35641, "b": 408.20972, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "18", "bbox": {"l": 442.30521, "t": 399.0371999999999, "r": 451.08929, "b": 407.82213999999993, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "19", "bbox": {"l": 478.77893, "t": 398.99639999999994, "r": 487.56302, "b": 407.78133999999994, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "20", "bbox": {"l": 523.97241, "t": 398.6114799999999, "r": 532.75647, "b": 407.39642, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "1", "bbox": {"l": 347.24872, "t": 437.68588, "r": 351.6412, "b": 446.47083, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "0", "bbox": {"l": 318.88071, "t": 437.68588, "r": 323.27319, "b": 446.47083, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "2", "bbox": {"l": 394.10422, "t": 437.68588, "r": 398.4967, "b": 446.47083, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "3", "bbox": {"l": 318.77316, "t": 449.5455, "r": 323.16565, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "4", "bbox": {"l": 347.24872, "t": 449.5455, "r": 351.6412, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "5", "bbox": {"l": 394.10422, "t": 449.5455, "r": 398.4967, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "6", "bbox": {"l": 440.95941000000005, "t": 449.5455, "r": 445.3519, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "7", "bbox": {"l": 487.81491, "t": 449.5455, "r": 492.2074, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "8", "bbox": {"l": 318.77316, "t": 473.70425, "r": 323.16565, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "9", "bbox": {"l": 347.24872, "t": 461.8446, "r": 351.6412, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "10", "bbox": {"l": 394.10422, "t": 461.8446, "r": 402.88831, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "11", "bbox": {"l": 440.95941000000005, "t": 461.8446, "r": 449.42285, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "12", "bbox": {"l": 487.81491, "t": 461.8446, "r": 496.599, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "13", "bbox": {"l": 347.24872, "t": 473.70425, "r": 356.03281, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "14", "bbox": {"l": 394.10422, "t": 473.70425, "r": 402.88831, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "15", "bbox": {"l": 440.95941000000005, "t": 473.70425, "r": 449.7435, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "16", "bbox": {"l": 487.81491, "t": 473.70425, "r": 496.599, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "17", "bbox": {"l": 347.24872, "t": 485.12469, "r": 356.03281, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "18", "bbox": {"l": 394.10422, "t": 485.12469, "r": 402.88831, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "19", "bbox": {"l": 440.95941000000005, "t": 485.12469, "r": 449.7435, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "20", "bbox": {"l": 487.81491, "t": 485.12469, "r": 496.599, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "1", "bbox": {"l": 451.9457100000001, "t": 235.34704999999997, "r": 457.95050000000003, "b": 245.47748, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "3", "bbox": {"l": 385.09399, "t": 357.76030999999995, "r": 391.09879, "b": 367.89072, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "3", "bbox": {"l": 366.70102, "t": 449.12082, "r": 372.70581, "b": 459.25122, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "2", "bbox": {"l": 331.19681, "t": 269.35266, "r": 337.2016, "b": 279.48308999999995, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "2", "bbox": {"l": 333.43451, "t": 380.7265, "r": 339.4393, "b": 390.85689999999994, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "2", "bbox": {"l": 331.90424, "t": 473.32291, "r": 337.90903, "b": 483.45331, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "1", "bbox": {"l": 478.07210999999995, "t": 341.0368000000001, "r": 484.0769, "b": 351.16720999999995, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "1", "bbox": {"l": 459.87621999999993, "t": 437.5936, "r": 465.88101, "b": 447.724, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "3", "bbox": {"l": 384.0329, "t": 252.67895999999996, "r": 390.03769, "b": 262.80939, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "Figure 1:", "bbox": {"l": 308.862, "t": 514.50037, "r": 345.73361, "b": 523.40692, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "Picture of a table with subtle, complex features", "bbox": {"l": 353.17566, "t": 514.50037, "r": 545.11511, "b": 523.40692, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "such as (1) multi-column headers, (2) cell with multi-row", "bbox": {"l": 308.862, "t": 526.45535, "r": 545.11511, "b": 535.3619100000001, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "text and (3) cells with no content. Image from PubTabNet", "bbox": {"l": 308.862, "t": 538.41035, "r": 545.11517, "b": 547.31691, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "evaluation set, filename: \u2018PMC2944238 004 02\u2019.", "bbox": {"l": 308.862, "t": 550.36635, "r": 505.6917700000001, "b": 559.2729, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "Recently, significant progress has been made with vi-", "bbox": {"l": 320.81699, "t": 584.40936, "r": 545.11493, "b": 593.31592, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "sion based approaches to extract tables in documents. For", "bbox": {"l": 308.862, "t": 596.36436, "r": 545.11517, "b": 605.2709199999999, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "the sake of completeness, the issue of table extraction from", "bbox": {"l": 308.862, "t": 608.31937, "r": 545.11511, "b": 617.22592, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "documents is typically decomposed into two separate chal-", "bbox": {"l": 308.862, "t": 620.27437, "r": 545.11505, "b": 629.18092, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "lenges, i.e.", "bbox": {"l": 308.862, "t": 632.23036, "r": 353.6937, "b": 641.13692, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "(1)", "bbox": {"l": 362.11209, "t": 632.23036, "r": 374.66617, "b": 641.13692, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "finding the location of the table(s) on a", "bbox": {"l": 377.35785, "t": 632.23036, "r": 545.11505, "b": 641.13692, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "document-page and (2) finding the structure of a given table", "bbox": {"l": 308.862, "t": 644.18536, "r": 545.11517, "b": 653.09192, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "in the document.", "bbox": {"l": 308.862, "t": 656.14037, "r": 375.55167, "b": 665.04693, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "The first problem is called table-location and has been", "bbox": {"l": 320.81699, "t": 668.38036, "r": 545.11493, "b": 677.28693, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "previously addressed [30, 38, 19, 21, 23, 26, 8] with state-", "bbox": {"l": 308.862, "t": 680.33536, "r": 545.11511, "b": 689.24193, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "of-the-art object-detection networks (e.g. YOLO and later", "bbox": {"l": 308.862, "t": 692.290359, "r": 545.11511, "b": 701.19693, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "on Mask-RCNN [9]). For all practical purposes, it can be", "bbox": {"l": 308.862, "t": 704.245361, "r": 545.11499, "b": 713.151932, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "1", "bbox": {"l": 295.121, "t": 734.133366, "r": 300.10229, "b": 743.039928, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "arXiv:2203.01017v2 [cs.CV] 11 Mar 2022", "bbox": {"l": 18.340221, "t": 207.82001000000002, "r": 36.339779, "b": 560.00003, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 8, "label": "section_header", "bbox": {"l": 96.301003, "t": 107.03412000000003, "r": 498.92708999999996, "b": 119.93133999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.8868067860603333, "cells": [{"id": 0, "text": "TableFormer: Table Structure Understanding with Transformers.", "bbox": {"l": 96.301003, "t": 107.03412000000003, "r": 498.92708999999996, "b": 119.93133999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "section_header", "bbox": {"l": 142.47701, "t": 146.68535999999995, "r": 452.75027, "b": 171.32037000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.7586215734481812, "cells": [{"id": 1, "text": "Ahmed Nassar, Nikolaos Livathinos, Maksym Lysak, Peter Staar", "bbox": {"l": 142.47701, "t": 146.68535999999995, "r": 452.75027, "b": 157.37334999999996, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "IBM Research", "bbox": {"l": 262.918, "t": 160.63239, "r": 332.30597, "b": 171.32037000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "key_value_region", "bbox": {"l": 208.123, "t": 175.96123999999998, "r": 378.73257, "b": 184.42553999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.4854728579521179, "cells": [{"id": 3, "text": "{", "bbox": {"l": 208.123, "t": 175.96123999999998, "r": 212.73083, "b": 184.42553999999996, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "ahn,nli,mly,taa", "bbox": {"l": 212.73, "t": 177.08203000000003, "r": 293.42761, "b": 184.00409000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "}", "bbox": {"l": 293.42798, "t": 175.96123999999998, "r": 298.0358, "b": 184.42553999999996, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "@zurich.ibm.com", "bbox": {"l": 298.03497, "t": 177.08203000000003, "r": 378.73257, "b": 184.00409000000002, "coord_origin": "TOPLEFT"}}], "children": [{"id": 7, "label": "text", "bbox": {"l": 208.123, "t": 175.96123999999998, "r": 378.73257, "b": 184.42553999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9096331596374512, "cells": [{"id": 3, "text": "{", "bbox": {"l": 208.123, "t": 175.96123999999998, "r": 212.73083, "b": 184.42553999999996, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "ahn,nli,mly,taa", "bbox": {"l": 212.73, "t": 177.08203000000003, "r": 293.42761, "b": 184.00409000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "}", "bbox": {"l": 293.42798, "t": 175.96123999999998, "r": 298.0358, "b": 184.42553999999996, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "@zurich.ibm.com", "bbox": {"l": 298.03497, "t": 177.08203000000003, "r": 378.73257, "b": 184.00409000000002, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 5, "label": "section_header", "bbox": {"l": 145.99498, "t": 215.48297000000002, "r": 190.48029, "b": 226.23071000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9258671402931213, "cells": [{"id": 7, "text": "Abstract", "bbox": {"l": 145.99498, "t": 215.48297000000002, "r": 190.48029, "b": 226.23071000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 50.111977, "t": 241.39508, "r": 286.36511, "b": 512.9966400000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9838882088661194, "cells": [{"id": 8, "text": "Tables organize valuable content in a concise and com-", "bbox": {"l": 62.066978, "t": 241.39508, "r": 286.36493, "b": 249.98284999999998, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "pact representation. This content is extremely valuable for", "bbox": {"l": 50.111977, "t": 253.3501, "r": 286.36508, "b": 261.93787, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "systems such as search engines, Knowledge Graph\u2019s, etc,", "bbox": {"l": 50.111977, "t": 265.30511, "r": 286.36508, "b": 273.89288, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "since they enhance their predictive capabilities. Unfortu-", "bbox": {"l": 50.111977, "t": 277.26111000000003, "r": 286.36505, "b": 285.84888, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "nately, tables come in a large variety of shapes and sizes.", "bbox": {"l": 50.111977, "t": 289.21609, "r": 286.36505, "b": 297.80386, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Furthermore, they can have complex column/row-header", "bbox": {"l": 50.111977, "t": 301.17108, "r": 286.36505, "b": 309.75884999999994, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "configurations, multiline rows, different variety of separa-", "bbox": {"l": 50.111977, "t": 313.12607, "r": 286.36508, "b": 321.71384, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "tion lines, missing entries, etc. As such, the correct iden-", "bbox": {"l": 50.111977, "t": 325.08105, "r": 286.36508, "b": 333.66882, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "tification of the table-structure from an image is a non-", "bbox": {"l": 50.111977, "t": 337.03604, "r": 286.36505, "b": 345.62381, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "trivial task. In this paper, we present a new table-structure", "bbox": {"l": 50.111977, "t": 348.99203, "r": 286.36508, "b": 357.5798, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "identification model. The latter improves the latest end-to-", "bbox": {"l": 50.111977, "t": 360.94701999999995, "r": 286.36505, "b": 369.53479, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "end deep learning model (i.e. encoder-dual-decoder from", "bbox": {"l": 50.111977, "t": 372.90201, "r": 286.36508, "b": 381.48978, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "PubTabNet) in two significant ways. First, we introduce a", "bbox": {"l": 50.111977, "t": 384.85699, "r": 286.36505, "b": 393.44476, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "new object detection decoder for table-cells. In this way,", "bbox": {"l": 50.111977, "t": 396.81198, "r": 286.36511, "b": 405.39975000000004, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "we can obtain the content of the table-cells from program-", "bbox": {"l": 50.111977, "t": 408.76697, "r": 286.36508, "b": 417.35474, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "matic PDF\u2019s directly from the PDF source and avoid the", "bbox": {"l": 50.111977, "t": 420.72296000000006, "r": 286.36505, "b": 429.31073, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "training of the custom OCR decoders.", "bbox": {"l": 50.111977, "t": 432.67795, "r": 207.23216, "b": 441.26572, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "This architectural", "bbox": {"l": 214.09639, "t": 432.67795, "r": 286.36508, "b": 441.26572, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "change leads to more accurate table-content extraction and", "bbox": {"l": 50.111977, "t": 444.63293, "r": 286.36508, "b": 453.2207, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "allows us to tackle non-english tables. Second, we replace", "bbox": {"l": 50.111977, "t": 456.58792000000005, "r": 286.36505, "b": 465.17569, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "the LSTM decoders with transformer based decoders. This", "bbox": {"l": 50.111977, "t": 468.54291, "r": 286.36505, "b": 477.13068, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "upgrade improves significantly the previous state-of-the-art", "bbox": {"l": 50.111977, "t": 480.4989, "r": 286.36508, "b": 489.08667, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "tree-editing-distance-score (TEDS) from 91% to 98.5% on", "bbox": {"l": 50.111977, "t": 492.45389, "r": 286.36505, "b": 501.04166, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "simple tables and from 88.7% to 95% on complex tables.", "bbox": {"l": 50.111977, "t": 504.40887, "r": 276.65152, "b": 512.9966400000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "section_header", "bbox": {"l": 50.111977, "t": 539.94276, "r": 126.94804, "b": 550.69049, "coord_origin": "TOPLEFT"}, "confidence": 0.9317677617073059, "cells": [{"id": 32, "text": "1.", "bbox": {"l": 50.111977, "t": 539.94276, "r": 58.121296, "b": 550.69049, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "Introduction", "bbox": {"l": 68.800385, "t": 539.94276, "r": 126.94804, "b": 550.69049, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 50.111977, "t": 560.7832, "r": 286.36508, "b": 713.151779, "coord_origin": "TOPLEFT"}, "confidence": 0.9841895699501038, "cells": [{"id": 34, "text": "The occurrence of tables in documents is ubiquitous.", "bbox": {"l": 62.066978, "t": 560.7832, "r": 286.36496, "b": 569.68976, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "They often summarise quantitative or factual data, which is", "bbox": {"l": 50.111977, "t": 572.7382, "r": 286.36508, "b": 581.64476, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "cumbersome to describe in verbose text but nevertheless ex-", "bbox": {"l": 50.111977, "t": 584.69321, "r": 286.36505, "b": 593.5997600000001, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "tremely valuable. Unfortunately, this compact representa-", "bbox": {"l": 50.111977, "t": 596.6492000000001, "r": 286.36505, "b": 605.55576, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "tion is often not easy to parse by machines. There are many", "bbox": {"l": 50.111977, "t": 608.6042, "r": 286.36505, "b": 617.51076, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "implicit conventions used to obtain a compact table repre-", "bbox": {"l": 50.111977, "t": 620.5592, "r": 286.36505, "b": 629.46576, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "sentation. For example, tables often have complex column-", "bbox": {"l": 50.111977, "t": 632.51421, "r": 286.36508, "b": 641.42076, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "and row-headers in order to reduce duplicated cell content.", "bbox": {"l": 50.111977, "t": 644.46921, "r": 286.36508, "b": 653.37576, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "Lines of different shapes and sizes are leveraged to separate", "bbox": {"l": 50.111977, "t": 656.42421, "r": 286.36502, "b": 665.33077, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "content or indicate a tree structure. Additionally, tables can", "bbox": {"l": 50.111977, "t": 668.3802000000001, "r": 286.36505, "b": 677.28677, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "also have empty/missing table-entries or multi-row textual", "bbox": {"l": 50.111977, "t": 680.33521, "r": 286.36505, "b": 689.2417800000001, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "table-entries. Fig. 1 shows a table which presents all these", "bbox": {"l": 50.111977, "t": 692.290207, "r": 286.36505, "b": 701.196777, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "issues.", "bbox": {"l": 50.111977, "t": 704.245209, "r": 76.403275, "b": 713.151779, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "section_header", "bbox": {"l": 315.56702, "t": 218.00684, "r": 408.4407, "b": 226.75482, "coord_origin": "TOPLEFT"}, "confidence": 0.6724023818969727, "cells": [{"id": 47, "text": "a.", "bbox": {"l": 315.56702, "t": 218.00684, "r": 324.01007, "b": 226.75482, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Picture of a table:", "bbox": {"l": 328.2316, "t": 218.00684, "r": 408.4407, "b": 226.75482, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "list_item", "bbox": {"l": 315.56702, "t": 313.69478999999995, "r": 486.40194999999994, "b": 333.2428, "coord_origin": "TOPLEFT"}, "confidence": 0.5549328923225403, "cells": [{"id": 49, "text": "b.", "bbox": {"l": 315.56702, "t": 313.69478999999995, "r": 325.05786, "b": 322.44281, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Red-annotation of bounding boxes,", "bbox": {"l": 329.80325, "t": 313.69478999999995, "r": 486.40194999999994, "b": 322.44281, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Blue-predictions by TableFormer", "bbox": {"l": 326.46252, "t": 324.49478, "r": 472.47411999999997, "b": 333.2428, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "list_item", "bbox": {"l": 315.56702, "t": 420.1828, "r": 491.1912500000001, "b": 428.93082, "coord_origin": "TOPLEFT"}, "confidence": 0.5501358509063721, "cells": [{"id": 52, "text": "c.", "bbox": {"l": 315.56702, "t": 420.1828, "r": 324.81039, "b": 428.93082, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Structure predicted by TableFormer:", "bbox": {"l": 329.4321, "t": 420.1828, "r": 491.1912500000001, "b": 428.93082, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "picture", "bbox": {"l": 314.78173828125, "t": 338.0652770996094, "r": 539.1802978515625, "b": 410.0494384765625, "coord_origin": "TOPLEFT"}, "confidence": 0.8742761611938477, "cells": [{"id": 54, "text": "1", "bbox": {"l": 408.14752, "t": 342.82828, "r": 412.54001, "b": 351.61322, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "0", "bbox": {"l": 356.11011, "t": 341.57217, "r": 360.50259, "b": 350.35712, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "2", "bbox": {"l": 500.6777, "t": 340.93768, "r": 505.0701900000001, "b": 349.7226299999999, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "3", "bbox": {"l": 356.13382, "t": 351.74789, "r": 360.52631, "b": 360.53284, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "4", "bbox": {"l": 402.53992, "t": 355.8765, "r": 406.9324, "b": 364.66144, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "5", "bbox": {"l": 448.58178999999996, "t": 352.84018, "r": 452.97427, "b": 361.62512, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "6", "bbox": {"l": 491.65161000000006, "t": 353.70657, "r": 496.0441, "b": 362.49152, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "7", "bbox": {"l": 535.13843, "t": 353.33969, "r": 539.53088, "b": 362.12463, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "8", "bbox": {"l": 348.82822, "t": 387.09781, "r": 353.2207, "b": 395.88275, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "9", "bbox": {"l": 389.27151, "t": 375.37228, "r": 393.664, "b": 384.15723, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "10", "bbox": {"l": 442.67479999999995, "t": 375.64621, "r": 451.45889000000005, "b": 384.43115, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "11", "bbox": {"l": 477.4382299999999, "t": 375.534, "r": 485.90167, "b": 384.31894000000005, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "12", "bbox": {"l": 522.57263, "t": 375.64621, "r": 531.35669, "b": 384.43115, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "13", "bbox": {"l": 400.22992, "t": 387.11429, "r": 409.01401, "b": 395.89923, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "14", "bbox": {"l": 442.30792, "t": 386.98981000000003, "r": 451.0920100000001, "b": 395.77475000000004, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "15", "bbox": {"l": 478.21941999999996, "t": 387.37469, "r": 487.00351000000006, "b": 396.15964, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "16", "bbox": {"l": 523.2287, "t": 386.98981000000003, "r": 532.01276, "b": 395.77475000000004, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "1", "bbox": {"l": 411.57233, "t": 399.42477, "r": 415.96481, "b": 408.20972, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "7", "bbox": {"l": 415.96393, "t": 399.42477, "r": 420.35641, "b": 408.20972, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "18", "bbox": {"l": 442.30521, "t": 399.0371999999999, "r": 451.08929, "b": 407.82213999999993, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "19", "bbox": {"l": 478.77893, "t": 398.99639999999994, "r": 487.56302, "b": 407.78133999999994, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "20", "bbox": {"l": 523.97241, "t": 398.6114799999999, "r": 532.75647, "b": 407.39642, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "3", "bbox": {"l": 385.09399, "t": 357.76030999999995, "r": 391.09879, "b": 367.89072, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "2", "bbox": {"l": 333.43451, "t": 380.7265, "r": 339.4393, "b": 390.85689999999994, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "1", "bbox": {"l": 478.07210999999995, "t": 341.0368000000001, "r": 484.0769, "b": 351.16720999999995, "coord_origin": "TOPLEFT"}}], "children": [{"id": 19, "label": "text", "bbox": {"l": 408.14752, "t": 342.82828, "r": 412.54001, "b": 351.61322, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "1", "bbox": {"l": 408.14752, "t": 342.82828, "r": 412.54001, "b": 351.61322, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 356.11011, "t": 341.57217, "r": 360.50259, "b": 350.35712, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "0", "bbox": {"l": 356.11011, "t": 341.57217, "r": 360.50259, "b": 350.35712, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 500.6777, "t": 340.93768, "r": 505.0701900000001, "b": 349.7226299999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "2", "bbox": {"l": 500.6777, "t": 340.93768, "r": 505.0701900000001, "b": 349.7226299999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 356.13382, "t": 351.74789, "r": 360.52631, "b": 360.53284, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "3", "bbox": {"l": 356.13382, "t": 351.74789, "r": 360.52631, "b": 360.53284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 402.53992, "t": 355.8765, "r": 406.9324, "b": 364.66144, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "4", "bbox": {"l": 402.53992, "t": 355.8765, "r": 406.9324, "b": 364.66144, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 448.58178999999996, "t": 352.84018, "r": 452.97427, "b": 361.62512, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "5", "bbox": {"l": 448.58178999999996, "t": 352.84018, "r": 452.97427, "b": 361.62512, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 491.65161000000006, "t": 353.70657, "r": 496.0441, "b": 362.49152, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "6", "bbox": {"l": 491.65161000000006, "t": 353.70657, "r": 496.0441, "b": 362.49152, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 535.13843, "t": 353.33969, "r": 539.53088, "b": 362.12463, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "7", "bbox": {"l": 535.13843, "t": 353.33969, "r": 539.53088, "b": 362.12463, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 348.82822, "t": 387.09781, "r": 353.2207, "b": 395.88275, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "8", "bbox": {"l": 348.82822, "t": 387.09781, "r": 353.2207, "b": 395.88275, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 389.27151, "t": 375.37228, "r": 393.664, "b": 384.15723, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "9", "bbox": {"l": 389.27151, "t": 375.37228, "r": 393.664, "b": 384.15723, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 442.67479999999995, "t": 375.64621, "r": 451.45889000000005, "b": 384.43115, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "10", "bbox": {"l": 442.67479999999995, "t": 375.64621, "r": 451.45889000000005, "b": 384.43115, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 477.4382299999999, "t": 375.534, "r": 485.90167, "b": 384.31894000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "11", "bbox": {"l": 477.4382299999999, "t": 375.534, "r": 485.90167, "b": 384.31894000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 522.57263, "t": 375.64621, "r": 531.35669, "b": 384.43115, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "12", "bbox": {"l": 522.57263, "t": 375.64621, "r": 531.35669, "b": 384.43115, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 400.22992, "t": 387.11429, "r": 409.01401, "b": 395.89923, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "13", "bbox": {"l": 400.22992, "t": 387.11429, "r": 409.01401, "b": 395.89923, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 442.30792, "t": 386.98981000000003, "r": 451.0920100000001, "b": 395.77475000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "14", "bbox": {"l": 442.30792, "t": 386.98981000000003, "r": 451.0920100000001, "b": 395.77475000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 478.21941999999996, "t": 387.37469, "r": 487.00351000000006, "b": 396.15964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "15", "bbox": {"l": 478.21941999999996, "t": 387.37469, "r": 487.00351000000006, "b": 396.15964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 523.2287, "t": 386.98981000000003, "r": 532.01276, "b": 395.77475000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "16", "bbox": {"l": 523.2287, "t": 386.98981000000003, "r": 532.01276, "b": 395.77475000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 411.57233, "t": 399.42477, "r": 415.96481, "b": 408.20972, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "1", "bbox": {"l": 411.57233, "t": 399.42477, "r": 415.96481, "b": 408.20972, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 415.96393, "t": 399.42477, "r": 420.35641, "b": 408.20972, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "7", "bbox": {"l": 415.96393, "t": 399.42477, "r": 420.35641, "b": 408.20972, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 442.30521, "t": 399.0371999999999, "r": 451.08929, "b": 407.82213999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "18", "bbox": {"l": 442.30521, "t": 399.0371999999999, "r": 451.08929, "b": 407.82213999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 478.77893, "t": 398.99639999999994, "r": 487.56302, "b": 407.78133999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "19", "bbox": {"l": 478.77893, "t": 398.99639999999994, "r": 487.56302, "b": 407.78133999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 523.97241, "t": 398.6114799999999, "r": 532.75647, "b": 407.39642, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "20", "bbox": {"l": 523.97241, "t": 398.6114799999999, "r": 532.75647, "b": 407.39642, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 385.09399, "t": 357.76030999999995, "r": 391.09879, "b": 367.89072, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "3", "bbox": {"l": 385.09399, "t": 357.76030999999995, "r": 391.09879, "b": 367.89072, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 333.43451, "t": 380.7265, "r": 339.4393, "b": 390.85689999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "2", "bbox": {"l": 333.43451, "t": 380.7265, "r": 339.4393, "b": 390.85689999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 478.07210999999995, "t": 341.0368000000001, "r": 484.0769, "b": 351.16720999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": "1", "bbox": {"l": 478.07210999999995, "t": 341.0368000000001, "r": 484.0769, "b": 351.16720999999995, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 23, "label": "picture", "bbox": {"l": 315.7172546386719, "t": 433.823486328125, "r": 536.835693359375, "b": 496.0290222167969, "coord_origin": "TOPLEFT"}, "confidence": 0.5088632702827454, "cells": [{"id": 76, "text": "1", "bbox": {"l": 347.24872, "t": 437.68588, "r": 351.6412, "b": 446.47083, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "0", "bbox": {"l": 318.88071, "t": 437.68588, "r": 323.27319, "b": 446.47083, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "2", "bbox": {"l": 394.10422, "t": 437.68588, "r": 398.4967, "b": 446.47083, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "3", "bbox": {"l": 318.77316, "t": 449.5455, "r": 323.16565, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "4", "bbox": {"l": 347.24872, "t": 449.5455, "r": 351.6412, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "5", "bbox": {"l": 394.10422, "t": 449.5455, "r": 398.4967, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "6", "bbox": {"l": 440.95941000000005, "t": 449.5455, "r": 445.3519, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "7", "bbox": {"l": 487.81491, "t": 449.5455, "r": 492.2074, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "8", "bbox": {"l": 318.77316, "t": 473.70425, "r": 323.16565, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "9", "bbox": {"l": 347.24872, "t": 461.8446, "r": 351.6412, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "10", "bbox": {"l": 394.10422, "t": 461.8446, "r": 402.88831, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "11", "bbox": {"l": 440.95941000000005, "t": 461.8446, "r": 449.42285, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "12", "bbox": {"l": 487.81491, "t": 461.8446, "r": 496.599, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "13", "bbox": {"l": 347.24872, "t": 473.70425, "r": 356.03281, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "14", "bbox": {"l": 394.10422, "t": 473.70425, "r": 402.88831, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "15", "bbox": {"l": 440.95941000000005, "t": 473.70425, "r": 449.7435, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "16", "bbox": {"l": 487.81491, "t": 473.70425, "r": 496.599, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "17", "bbox": {"l": 347.24872, "t": 485.12469, "r": 356.03281, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "18", "bbox": {"l": 394.10422, "t": 485.12469, "r": 402.88831, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "19", "bbox": {"l": 440.95941000000005, "t": 485.12469, "r": 449.7435, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "20", "bbox": {"l": 487.81491, "t": 485.12469, "r": 496.599, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "3", "bbox": {"l": 366.70102, "t": 449.12082, "r": 372.70581, "b": 459.25122, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "2", "bbox": {"l": 331.90424, "t": 473.32291, "r": 337.90903, "b": 483.45331, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "1", "bbox": {"l": 459.87621999999993, "t": 437.5936, "r": 465.88101, "b": 447.724, "coord_origin": "TOPLEFT"}}], "children": [{"id": 41, "label": "text", "bbox": {"l": 347.24872, "t": 437.68588, "r": 351.6412, "b": 446.47083, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "1", "bbox": {"l": 347.24872, "t": 437.68588, "r": 351.6412, "b": 446.47083, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 318.88071, "t": 437.68588, "r": 323.27319, "b": 446.47083, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "0", "bbox": {"l": 318.88071, "t": 437.68588, "r": 323.27319, "b": 446.47083, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 394.10422, "t": 437.68588, "r": 398.4967, "b": 446.47083, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "2", "bbox": {"l": 394.10422, "t": 437.68588, "r": 398.4967, "b": 446.47083, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 318.77316, "t": 449.5455, "r": 323.16565, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "3", "bbox": {"l": 318.77316, "t": 449.5455, "r": 323.16565, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 347.24872, "t": 449.5455, "r": 351.6412, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "4", "bbox": {"l": 347.24872, "t": 449.5455, "r": 351.6412, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 394.10422, "t": 449.5455, "r": 398.4967, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "5", "bbox": {"l": 394.10422, "t": 449.5455, "r": 398.4967, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 440.95941000000005, "t": 449.5455, "r": 445.3519, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "6", "bbox": {"l": 440.95941000000005, "t": 449.5455, "r": 445.3519, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 487.81491, "t": 449.5455, "r": 492.2074, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "7", "bbox": {"l": 487.81491, "t": 449.5455, "r": 492.2074, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 318.77316, "t": 473.70425, "r": 323.16565, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "8", "bbox": {"l": 318.77316, "t": 473.70425, "r": 323.16565, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 347.24872, "t": 461.8446, "r": 351.6412, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "9", "bbox": {"l": 347.24872, "t": 461.8446, "r": 351.6412, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 394.10422, "t": 461.8446, "r": 402.88831, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "10", "bbox": {"l": 394.10422, "t": 461.8446, "r": 402.88831, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 440.95941000000005, "t": 461.8446, "r": 449.42285, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "11", "bbox": {"l": 440.95941000000005, "t": 461.8446, "r": 449.42285, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 487.81491, "t": 461.8446, "r": 496.599, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "12", "bbox": {"l": 487.81491, "t": 461.8446, "r": 496.599, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 347.24872, "t": 473.70425, "r": 356.03281, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "13", "bbox": {"l": 347.24872, "t": 473.70425, "r": 356.03281, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 394.10422, "t": 473.70425, "r": 402.88831, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "14", "bbox": {"l": 394.10422, "t": 473.70425, "r": 402.88831, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 440.95941000000005, "t": 473.70425, "r": 449.7435, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "15", "bbox": {"l": 440.95941000000005, "t": 473.70425, "r": 449.7435, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 487.81491, "t": 473.70425, "r": 496.599, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "16", "bbox": {"l": 487.81491, "t": 473.70425, "r": 496.599, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 347.24872, "t": 485.12469, "r": 356.03281, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "17", "bbox": {"l": 347.24872, "t": 485.12469, "r": 356.03281, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 394.10422, "t": 485.12469, "r": 402.88831, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "18", "bbox": {"l": 394.10422, "t": 485.12469, "r": 402.88831, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 440.95941000000005, "t": 485.12469, "r": 449.7435, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "19", "bbox": {"l": 440.95941000000005, "t": 485.12469, "r": 449.7435, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 487.81491, "t": 485.12469, "r": 496.599, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "20", "bbox": {"l": 487.81491, "t": 485.12469, "r": 496.599, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 366.70102, "t": 449.12082, "r": 372.70581, "b": 459.25122, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "3", "bbox": {"l": 366.70102, "t": 449.12082, "r": 372.70581, "b": 459.25122, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 331.90424, "t": 473.32291, "r": 337.90903, "b": 483.45331, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "2", "bbox": {"l": 331.90424, "t": 473.32291, "r": 337.90903, "b": 483.45331, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 459.87621999999993, "t": 437.5936, "r": 465.88101, "b": 447.724, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "1", "bbox": {"l": 459.87621999999993, "t": 437.5936, "r": 465.88101, "b": 447.724, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 11, "label": "table", "bbox": {"l": 315.7172546386719, "t": 433.823486328125, "r": 536.835693359375, "b": 496.0290222167969, "coord_origin": "TOPLEFT"}, "confidence": 0.8056110739707947, "cells": [{"id": 76, "text": "1", "bbox": {"l": 347.24872, "t": 437.68588, "r": 351.6412, "b": 446.47083, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "0", "bbox": {"l": 318.88071, "t": 437.68588, "r": 323.27319, "b": 446.47083, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "2", "bbox": {"l": 394.10422, "t": 437.68588, "r": 398.4967, "b": 446.47083, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "3", "bbox": {"l": 318.77316, "t": 449.5455, "r": 323.16565, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "4", "bbox": {"l": 347.24872, "t": 449.5455, "r": 351.6412, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "5", "bbox": {"l": 394.10422, "t": 449.5455, "r": 398.4967, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "6", "bbox": {"l": 440.95941000000005, "t": 449.5455, "r": 445.3519, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "7", "bbox": {"l": 487.81491, "t": 449.5455, "r": 492.2074, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "8", "bbox": {"l": 318.77316, "t": 473.70425, "r": 323.16565, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "9", "bbox": {"l": 347.24872, "t": 461.8446, "r": 351.6412, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "10", "bbox": {"l": 394.10422, "t": 461.8446, "r": 402.88831, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "11", "bbox": {"l": 440.95941000000005, "t": 461.8446, "r": 449.42285, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "12", "bbox": {"l": 487.81491, "t": 461.8446, "r": 496.599, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "13", "bbox": {"l": 347.24872, "t": 473.70425, "r": 356.03281, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "14", "bbox": {"l": 394.10422, "t": 473.70425, "r": 402.88831, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "15", "bbox": {"l": 440.95941000000005, "t": 473.70425, "r": 449.7435, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "16", "bbox": {"l": 487.81491, "t": 473.70425, "r": 496.599, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "17", "bbox": {"l": 347.24872, "t": 485.12469, "r": 356.03281, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "18", "bbox": {"l": 394.10422, "t": 485.12469, "r": 402.88831, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "19", "bbox": {"l": 440.95941000000005, "t": 485.12469, "r": 449.7435, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "20", "bbox": {"l": 487.81491, "t": 485.12469, "r": 496.599, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "3", "bbox": {"l": 366.70102, "t": 449.12082, "r": 372.70581, "b": 459.25122, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "2", "bbox": {"l": 331.90424, "t": 473.32291, "r": 337.90903, "b": 483.45331, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "1", "bbox": {"l": 459.87621999999993, "t": 437.5936, "r": 465.88101, "b": 447.724, "coord_origin": "TOPLEFT"}}], "children": [{"id": 41, "label": "text", "bbox": {"l": 347.24872, "t": 437.68588, "r": 351.6412, "b": 446.47083, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "1", "bbox": {"l": 347.24872, "t": 437.68588, "r": 351.6412, "b": 446.47083, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 318.88071, "t": 437.68588, "r": 323.27319, "b": 446.47083, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "0", "bbox": {"l": 318.88071, "t": 437.68588, "r": 323.27319, "b": 446.47083, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 394.10422, "t": 437.68588, "r": 398.4967, "b": 446.47083, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "2", "bbox": {"l": 394.10422, "t": 437.68588, "r": 398.4967, "b": 446.47083, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 318.77316, "t": 449.5455, "r": 323.16565, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "3", "bbox": {"l": 318.77316, "t": 449.5455, "r": 323.16565, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 347.24872, "t": 449.5455, "r": 351.6412, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "4", "bbox": {"l": 347.24872, "t": 449.5455, "r": 351.6412, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 394.10422, "t": 449.5455, "r": 398.4967, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "5", "bbox": {"l": 394.10422, "t": 449.5455, "r": 398.4967, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 440.95941000000005, "t": 449.5455, "r": 445.3519, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "6", "bbox": {"l": 440.95941000000005, "t": 449.5455, "r": 445.3519, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 487.81491, "t": 449.5455, "r": 492.2074, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "7", "bbox": {"l": 487.81491, "t": 449.5455, "r": 492.2074, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 318.77316, "t": 473.70425, "r": 323.16565, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "8", "bbox": {"l": 318.77316, "t": 473.70425, "r": 323.16565, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 347.24872, "t": 461.8446, "r": 351.6412, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "9", "bbox": {"l": 347.24872, "t": 461.8446, "r": 351.6412, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 394.10422, "t": 461.8446, "r": 402.88831, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "10", "bbox": {"l": 394.10422, "t": 461.8446, "r": 402.88831, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 440.95941000000005, "t": 461.8446, "r": 449.42285, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "11", "bbox": {"l": 440.95941000000005, "t": 461.8446, "r": 449.42285, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 487.81491, "t": 461.8446, "r": 496.599, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "12", "bbox": {"l": 487.81491, "t": 461.8446, "r": 496.599, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 347.24872, "t": 473.70425, "r": 356.03281, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "13", "bbox": {"l": 347.24872, "t": 473.70425, "r": 356.03281, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 394.10422, "t": 473.70425, "r": 402.88831, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "14", "bbox": {"l": 394.10422, "t": 473.70425, "r": 402.88831, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 440.95941000000005, "t": 473.70425, "r": 449.7435, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "15", "bbox": {"l": 440.95941000000005, "t": 473.70425, "r": 449.7435, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 487.81491, "t": 473.70425, "r": 496.599, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "16", "bbox": {"l": 487.81491, "t": 473.70425, "r": 496.599, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 347.24872, "t": 485.12469, "r": 356.03281, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "17", "bbox": {"l": 347.24872, "t": 485.12469, "r": 356.03281, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 394.10422, "t": 485.12469, "r": 402.88831, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "18", "bbox": {"l": 394.10422, "t": 485.12469, "r": 402.88831, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 440.95941000000005, "t": 485.12469, "r": 449.7435, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "19", "bbox": {"l": 440.95941000000005, "t": 485.12469, "r": 449.7435, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 487.81491, "t": 485.12469, "r": 496.599, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "20", "bbox": {"l": 487.81491, "t": 485.12469, "r": 496.599, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 366.70102, "t": 449.12082, "r": 372.70581, "b": 459.25122, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "3", "bbox": {"l": 366.70102, "t": 449.12082, "r": 372.70581, "b": 459.25122, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 331.90424, "t": 473.32291, "r": 337.90903, "b": 483.45331, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "2", "bbox": {"l": 331.90424, "t": 473.32291, "r": 337.90903, "b": 483.45331, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 459.87621999999993, "t": 437.5936, "r": 465.88101, "b": 447.724, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "1", "bbox": {"l": 459.87621999999993, "t": 437.5936, "r": 465.88101, "b": 447.724, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 16, "label": "picture", "bbox": {"l": 315.65362548828125, "t": 228.723388671875, "r": 537.1475219726562, "b": 302.8014221191406, "coord_origin": "TOPLEFT"}, "confidence": 0.608779788017273, "cells": [{"id": 97, "text": "1", "bbox": {"l": 451.9457100000001, "t": 235.34704999999997, "r": 457.95050000000003, "b": 245.47748, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "2", "bbox": {"l": 331.19681, "t": 269.35266, "r": 337.2016, "b": 279.48308999999995, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "3", "bbox": {"l": 384.0329, "t": 252.67895999999996, "r": 390.03769, "b": 262.80939, "coord_origin": "TOPLEFT"}}], "children": [{"id": 62, "label": "text", "bbox": {"l": 451.9457100000001, "t": 235.34704999999997, "r": 457.95050000000003, "b": 245.47748, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "1", "bbox": {"l": 451.9457100000001, "t": 235.34704999999997, "r": 457.95050000000003, "b": 245.47748, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 331.19681, "t": 269.35266, "r": 337.2016, "b": 279.48308999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "2", "bbox": {"l": 331.19681, "t": 269.35266, "r": 337.2016, "b": 279.48308999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 384.0329, "t": 252.67895999999996, "r": 390.03769, "b": 262.80939, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "3", "bbox": {"l": 384.0329, "t": 252.67895999999996, "r": 390.03769, "b": 262.80939, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 15, "label": "table", "bbox": {"l": 315.65362548828125, "t": 228.723388671875, "r": 537.1475219726562, "b": 302.8014221191406, "coord_origin": "TOPLEFT"}, "confidence": 0.6515864729881287, "cells": [{"id": 97, "text": "1", "bbox": {"l": 451.9457100000001, "t": 235.34704999999997, "r": 457.95050000000003, "b": 245.47748, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "2", "bbox": {"l": 331.19681, "t": 269.35266, "r": 337.2016, "b": 279.48308999999995, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "3", "bbox": {"l": 384.0329, "t": 252.67895999999996, "r": 390.03769, "b": 262.80939, "coord_origin": "TOPLEFT"}}], "children": [{"id": 62, "label": "text", "bbox": {"l": 451.9457100000001, "t": 235.34704999999997, "r": 457.95050000000003, "b": 245.47748, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "1", "bbox": {"l": 451.9457100000001, "t": 235.34704999999997, "r": 457.95050000000003, "b": 245.47748, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 331.19681, "t": 269.35266, "r": 337.2016, "b": 279.48308999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "2", "bbox": {"l": 331.19681, "t": 269.35266, "r": 337.2016, "b": 279.48308999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 384.0329, "t": 252.67895999999996, "r": 390.03769, "b": 262.80939, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "3", "bbox": {"l": 384.0329, "t": 252.67895999999996, "r": 390.03769, "b": 262.80939, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 6, "label": "caption", "bbox": {"l": 308.862, "t": 514.50037, "r": 545.11517, "b": 559.2729, "coord_origin": "TOPLEFT"}, "confidence": 0.9214619398117065, "cells": [{"id": 106, "text": "Figure 1:", "bbox": {"l": 308.862, "t": 514.50037, "r": 345.73361, "b": 523.40692, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "Picture of a table with subtle, complex features", "bbox": {"l": 353.17566, "t": 514.50037, "r": 545.11511, "b": 523.40692, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "such as (1) multi-column headers, (2) cell with multi-row", "bbox": {"l": 308.862, "t": 526.45535, "r": 545.11511, "b": 535.3619100000001, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "text and (3) cells with no content. Image from PubTabNet", "bbox": {"l": 308.862, "t": 538.41035, "r": 545.11517, "b": 547.31691, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "evaluation set, filename: \u2018PMC2944238 004 02\u2019.", "bbox": {"l": 308.862, "t": 550.36635, "r": 505.6917700000001, "b": 559.2729, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 308.862, "t": 584.40936, "r": 545.11517, "b": 665.04693, "coord_origin": "TOPLEFT"}, "confidence": 0.9848759770393372, "cells": [{"id": 111, "text": "Recently, significant progress has been made with vi-", "bbox": {"l": 320.81699, "t": 584.40936, "r": 545.11493, "b": 593.31592, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "sion based approaches to extract tables in documents. For", "bbox": {"l": 308.862, "t": 596.36436, "r": 545.11517, "b": 605.2709199999999, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "the sake of completeness, the issue of table extraction from", "bbox": {"l": 308.862, "t": 608.31937, "r": 545.11511, "b": 617.22592, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "documents is typically decomposed into two separate chal-", "bbox": {"l": 308.862, "t": 620.27437, "r": 545.11505, "b": 629.18092, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "lenges, i.e.", "bbox": {"l": 308.862, "t": 632.23036, "r": 353.6937, "b": 641.13692, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "(1)", "bbox": {"l": 362.11209, "t": 632.23036, "r": 374.66617, "b": 641.13692, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "finding the location of the table(s) on a", "bbox": {"l": 377.35785, "t": 632.23036, "r": 545.11505, "b": 641.13692, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "document-page and (2) finding the structure of a given table", "bbox": {"l": 308.862, "t": 644.18536, "r": 545.11517, "b": 653.09192, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "in the document.", "bbox": {"l": 308.862, "t": 656.14037, "r": 375.55167, "b": 665.04693, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 308.862, "t": 668.38036, "r": 545.11511, "b": 713.151932, "coord_origin": "TOPLEFT"}, "confidence": 0.979152262210846, "cells": [{"id": 120, "text": "The first problem is called table-location and has been", "bbox": {"l": 320.81699, "t": 668.38036, "r": 545.11493, "b": 677.28693, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "previously addressed [30, 38, 19, 21, 23, 26, 8] with state-", "bbox": {"l": 308.862, "t": 680.33536, "r": 545.11511, "b": 689.24193, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "of-the-art object-detection networks (e.g. YOLO and later", "bbox": {"l": 308.862, "t": 692.290359, "r": 545.11511, "b": 701.19693, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "on Mask-RCNN [9]). For all practical purposes, it can be", "bbox": {"l": 308.862, "t": 704.245361, "r": 545.11499, "b": 713.151932, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "page_footer", "bbox": {"l": 295.121, "t": 734.133366, "r": 300.10229, "b": 743.039928, "coord_origin": "TOPLEFT"}, "confidence": 0.8045893311500549, "cells": [{"id": 124, "text": "1", "bbox": {"l": 295.121, "t": 734.133366, "r": 300.10229, "b": 743.039928, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "page_header", "bbox": {"l": 18.340221, "t": 207.82001000000002, "r": 36.339779, "b": 560.00003, "coord_origin": "TOPLEFT"}, "confidence": 0.8773143887519836, "cells": [{"id": 125, "text": "arXiv:2203.01017v2 [cs.CV] 11 Mar 2022", "bbox": {"l": 18.340221, "t": 207.82001000000002, "r": 36.339779, "b": 560.00003, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {"11": {"label": "table", "id": 11, "page_no": 0, "cluster": {"id": 11, "label": "table", "bbox": {"l": 315.7172546386719, "t": 433.823486328125, "r": 536.835693359375, "b": 496.0290222167969, "coord_origin": "TOPLEFT"}, "confidence": 0.8056110739707947, "cells": [{"id": 76, "text": "1", "bbox": {"l": 347.24872, "t": 437.68588, "r": 351.6412, "b": 446.47083, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "0", "bbox": {"l": 318.88071, "t": 437.68588, "r": 323.27319, "b": 446.47083, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "2", "bbox": {"l": 394.10422, "t": 437.68588, "r": 398.4967, "b": 446.47083, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "3", "bbox": {"l": 318.77316, "t": 449.5455, "r": 323.16565, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "4", "bbox": {"l": 347.24872, "t": 449.5455, "r": 351.6412, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "5", "bbox": {"l": 394.10422, "t": 449.5455, "r": 398.4967, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "6", "bbox": {"l": 440.95941000000005, "t": 449.5455, "r": 445.3519, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "7", "bbox": {"l": 487.81491, "t": 449.5455, "r": 492.2074, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "8", "bbox": {"l": 318.77316, "t": 473.70425, "r": 323.16565, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "9", "bbox": {"l": 347.24872, "t": 461.8446, "r": 351.6412, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "10", "bbox": {"l": 394.10422, "t": 461.8446, "r": 402.88831, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "11", "bbox": {"l": 440.95941000000005, "t": 461.8446, "r": 449.42285, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "12", "bbox": {"l": 487.81491, "t": 461.8446, "r": 496.599, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "13", "bbox": {"l": 347.24872, "t": 473.70425, "r": 356.03281, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "14", "bbox": {"l": 394.10422, "t": 473.70425, "r": 402.88831, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "15", "bbox": {"l": 440.95941000000005, "t": 473.70425, "r": 449.7435, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "16", "bbox": {"l": 487.81491, "t": 473.70425, "r": 496.599, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "17", "bbox": {"l": 347.24872, "t": 485.12469, "r": 356.03281, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "18", "bbox": {"l": 394.10422, "t": 485.12469, "r": 402.88831, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "19", "bbox": {"l": 440.95941000000005, "t": 485.12469, "r": 449.7435, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "20", "bbox": {"l": 487.81491, "t": 485.12469, "r": 496.599, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "3", "bbox": {"l": 366.70102, "t": 449.12082, "r": 372.70581, "b": 459.25122, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "2", "bbox": {"l": 331.90424, "t": 473.32291, "r": 337.90903, "b": 483.45331, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "1", "bbox": {"l": 459.87621999999993, "t": 437.5936, "r": 465.88101, "b": 447.724, "coord_origin": "TOPLEFT"}}], "children": [{"id": 41, "label": "text", "bbox": {"l": 347.24872, "t": 437.68588, "r": 351.6412, "b": 446.47083, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "1", "bbox": {"l": 347.24872, "t": 437.68588, "r": 351.6412, "b": 446.47083, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 318.88071, "t": 437.68588, "r": 323.27319, "b": 446.47083, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "0", "bbox": {"l": 318.88071, "t": 437.68588, "r": 323.27319, "b": 446.47083, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 394.10422, "t": 437.68588, "r": 398.4967, "b": 446.47083, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "2", "bbox": {"l": 394.10422, "t": 437.68588, "r": 398.4967, "b": 446.47083, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 318.77316, "t": 449.5455, "r": 323.16565, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "3", "bbox": {"l": 318.77316, "t": 449.5455, "r": 323.16565, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 347.24872, "t": 449.5455, "r": 351.6412, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "4", "bbox": {"l": 347.24872, "t": 449.5455, "r": 351.6412, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 394.10422, "t": 449.5455, "r": 398.4967, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "5", "bbox": {"l": 394.10422, "t": 449.5455, "r": 398.4967, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 440.95941000000005, "t": 449.5455, "r": 445.3519, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "6", "bbox": {"l": 440.95941000000005, "t": 449.5455, "r": 445.3519, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 487.81491, "t": 449.5455, "r": 492.2074, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "7", "bbox": {"l": 487.81491, "t": 449.5455, "r": 492.2074, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 318.77316, "t": 473.70425, "r": 323.16565, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "8", "bbox": {"l": 318.77316, "t": 473.70425, "r": 323.16565, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 347.24872, "t": 461.8446, "r": 351.6412, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "9", "bbox": {"l": 347.24872, "t": 461.8446, "r": 351.6412, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 394.10422, "t": 461.8446, "r": 402.88831, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "10", "bbox": {"l": 394.10422, "t": 461.8446, "r": 402.88831, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 440.95941000000005, "t": 461.8446, "r": 449.42285, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "11", "bbox": {"l": 440.95941000000005, "t": 461.8446, "r": 449.42285, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 487.81491, "t": 461.8446, "r": 496.599, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "12", "bbox": {"l": 487.81491, "t": 461.8446, "r": 496.599, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 347.24872, "t": 473.70425, "r": 356.03281, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "13", "bbox": {"l": 347.24872, "t": 473.70425, "r": 356.03281, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 394.10422, "t": 473.70425, "r": 402.88831, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "14", "bbox": {"l": 394.10422, "t": 473.70425, "r": 402.88831, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 440.95941000000005, "t": 473.70425, "r": 449.7435, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "15", "bbox": {"l": 440.95941000000005, "t": 473.70425, "r": 449.7435, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 487.81491, "t": 473.70425, "r": 496.599, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "16", "bbox": {"l": 487.81491, "t": 473.70425, "r": 496.599, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 347.24872, "t": 485.12469, "r": 356.03281, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "17", "bbox": {"l": 347.24872, "t": 485.12469, "r": 356.03281, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 394.10422, "t": 485.12469, "r": 402.88831, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "18", "bbox": {"l": 394.10422, "t": 485.12469, "r": 402.88831, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 440.95941000000005, "t": 485.12469, "r": 449.7435, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "19", "bbox": {"l": 440.95941000000005, "t": 485.12469, "r": 449.7435, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 487.81491, "t": 485.12469, "r": 496.599, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "20", "bbox": {"l": 487.81491, "t": 485.12469, "r": 496.599, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 366.70102, "t": 449.12082, "r": 372.70581, "b": 459.25122, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "3", "bbox": {"l": 366.70102, "t": 449.12082, "r": 372.70581, "b": 459.25122, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 331.90424, "t": 473.32291, "r": 337.90903, "b": 483.45331, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "2", "bbox": {"l": 331.90424, "t": 473.32291, "r": 337.90903, "b": 483.45331, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 459.87621999999993, "t": 437.5936, "r": 465.88101, "b": 447.724, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "1", "bbox": {"l": 459.87621999999993, "t": 437.5936, "r": 465.88101, "b": 447.724, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "lcel", "ched", "lcel", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "ucel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "ucel", "nl"], "num_rows": 5, "num_cols": 6, "table_cells": [{"bbox": {"l": 347.24872, "t": 437.68588, "r": 351.6412, "b": 446.47083, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 3, "text": "1", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 318.88071, "t": 437.68588, "r": 323.27319, "b": 446.47083, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "0", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 394.10422, "t": 437.5936, "r": 465.88101, "b": 447.724, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 5, "text": "2 1", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 318.77316, "t": 449.5455, "r": 323.16565, "b": 458.33044, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 347.24872, "t": 449.5455, "r": 351.6412, "b": 458.33044, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 366.70102, "t": 449.12082, "r": 398.4967, "b": 459.25122, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "5 3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.95941000000005, "t": 449.5455, "r": 445.3519, "b": 458.33044, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.81491, "t": 449.5455, "r": 492.2074, "b": 458.33044, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 318.77316, "t": 473.70425, "r": 323.16565, "b": 482.4892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 347.24872, "t": 461.8446, "r": 351.6412, "b": 470.62955, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.10422, "t": 461.8446, "r": 402.88831, "b": 470.62955, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "10", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.95941000000005, "t": 461.8446, "r": 449.42285, "b": 470.62955, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "11", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.81491, "t": 461.8446, "r": 496.599, "b": 470.62955, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "12", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 347.24872, "t": 473.70425, "r": 356.03281, "b": 482.4892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "13", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.10422, "t": 473.70425, "r": 402.88831, "b": 482.4892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "14", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.95941000000005, "t": 473.70425, "r": 449.7435, "b": 482.4892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "15", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.81491, "t": 473.70425, "r": 496.599, "b": 482.4892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "16", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 347.24872, "t": 485.12469, "r": 356.03281, "b": 493.90964, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "17", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.10422, "t": 485.12469, "r": 402.88831, "b": 493.90964, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "18", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.95941000000005, "t": 485.12469, "r": 449.7435, "b": 493.90964, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "19", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.81491, "t": 485.12469, "r": 496.599, "b": 493.90964, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "20", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 331.90424, "t": 473.32291, "r": 337.90903, "b": 483.45331, "coord_origin": "TOPLEFT"}, "row_span": 3, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "2", "column_header": false, "row_header": false, "row_section": false}]}, "15": {"label": "table", "id": 15, "page_no": 0, "cluster": {"id": 15, "label": "table", "bbox": {"l": 315.65362548828125, "t": 228.723388671875, "r": 537.1475219726562, "b": 302.8014221191406, "coord_origin": "TOPLEFT"}, "confidence": 0.6515864729881287, "cells": [{"id": 97, "text": "1", "bbox": {"l": 451.9457100000001, "t": 235.34704999999997, "r": 457.95050000000003, "b": 245.47748, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "2", "bbox": {"l": 331.19681, "t": 269.35266, "r": 337.2016, "b": 279.48308999999995, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "3", "bbox": {"l": 384.0329, "t": 252.67895999999996, "r": 390.03769, "b": 262.80939, "coord_origin": "TOPLEFT"}}], "children": [{"id": 62, "label": "text", "bbox": {"l": 451.9457100000001, "t": 235.34704999999997, "r": 457.95050000000003, "b": 245.47748, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "1", "bbox": {"l": 451.9457100000001, "t": 235.34704999999997, "r": 457.95050000000003, "b": 245.47748, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 331.19681, "t": 269.35266, "r": 337.2016, "b": 279.48308999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "2", "bbox": {"l": 331.19681, "t": 269.35266, "r": 337.2016, "b": 279.48308999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 384.0329, "t": 252.67895999999996, "r": 390.03769, "b": 262.80939, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "3", "bbox": {"l": 384.0329, "t": 252.67895999999996, "r": 390.03769, "b": 262.80939, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ecel", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "ucel", "fcel", "fcel", "fcel", "fcel", "nl", "ucel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 1, "num_cols": 2, "table_cells": [{"bbox": {"l": 451.9457100000001, "t": 235.34704999999997, "r": 457.95050000000003, "b": 245.47748, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "1", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 384.0329, "t": 252.67895999999996, "r": 390.03769, "b": 262.80939, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3", "column_header": true, "row_header": false, "row_section": false}]}}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "section_header", "id": 8, "page_no": 0, "cluster": {"id": 8, "label": "section_header", "bbox": {"l": 96.301003, "t": 107.03412000000003, "r": 498.92708999999996, "b": 119.93133999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.8868067860603333, "cells": [{"id": 0, "text": "TableFormer: Table Structure Understanding with Transformers.", "bbox": {"l": 96.301003, "t": 107.03412000000003, "r": 498.92708999999996, "b": 119.93133999999998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "TableFormer: Table Structure Understanding with Transformers."}, {"label": "section_header", "id": 13, "page_no": 0, "cluster": {"id": 13, "label": "section_header", "bbox": {"l": 142.47701, "t": 146.68535999999995, "r": 452.75027, "b": 171.32037000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.7586215734481812, "cells": [{"id": 1, "text": "Ahmed Nassar, Nikolaos Livathinos, Maksym Lysak, Peter Staar", "bbox": {"l": 142.47701, "t": 146.68535999999995, "r": 452.75027, "b": 157.37334999999996, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "IBM Research", "bbox": {"l": 262.918, "t": 160.63239, "r": 332.30597, "b": 171.32037000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Ahmed Nassar, Nikolaos Livathinos, Maksym Lysak, Peter Staar IBM Research"}, {"label": "key_value_region", "id": 25, "page_no": 0, "cluster": {"id": 25, "label": "key_value_region", "bbox": {"l": 208.123, "t": 175.96123999999998, "r": 378.73257, "b": 184.42553999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.4854728579521179, "cells": [{"id": 3, "text": "{", "bbox": {"l": 208.123, "t": 175.96123999999998, "r": 212.73083, "b": 184.42553999999996, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "ahn,nli,mly,taa", "bbox": {"l": 212.73, "t": 177.08203000000003, "r": 293.42761, "b": 184.00409000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "}", "bbox": {"l": 293.42798, "t": 175.96123999999998, "r": 298.0358, "b": 184.42553999999996, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "@zurich.ibm.com", "bbox": {"l": 298.03497, "t": 177.08203000000003, "r": 378.73257, "b": 184.00409000000002, "coord_origin": "TOPLEFT"}}], "children": [{"id": 7, "label": "text", "bbox": {"l": 208.123, "t": 175.96123999999998, "r": 378.73257, "b": 184.42553999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9096331596374512, "cells": [{"id": 3, "text": "{", "bbox": {"l": 208.123, "t": 175.96123999999998, "r": 212.73083, "b": 184.42553999999996, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "ahn,nli,mly,taa", "bbox": {"l": 212.73, "t": 177.08203000000003, "r": 293.42761, "b": 184.00409000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "}", "bbox": {"l": 293.42798, "t": 175.96123999999998, "r": 298.0358, "b": 184.42553999999996, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "@zurich.ibm.com", "bbox": {"l": 298.03497, "t": 177.08203000000003, "r": 378.73257, "b": 184.00409000000002, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null}, {"label": "section_header", "id": 5, "page_no": 0, "cluster": {"id": 5, "label": "section_header", "bbox": {"l": 145.99498, "t": 215.48297000000002, "r": 190.48029, "b": 226.23071000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9258671402931213, "cells": [{"id": 7, "text": "Abstract", "bbox": {"l": 145.99498, "t": 215.48297000000002, "r": 190.48029, "b": 226.23071000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Abstract"}, {"label": "text", "id": 2, "page_no": 0, "cluster": {"id": 2, "label": "text", "bbox": {"l": 50.111977, "t": 241.39508, "r": 286.36511, "b": 512.9966400000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9838882088661194, "cells": [{"id": 8, "text": "Tables organize valuable content in a concise and com-", "bbox": {"l": 62.066978, "t": 241.39508, "r": 286.36493, "b": 249.98284999999998, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "pact representation. This content is extremely valuable for", "bbox": {"l": 50.111977, "t": 253.3501, "r": 286.36508, "b": 261.93787, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "systems such as search engines, Knowledge Graph\u2019s, etc,", "bbox": {"l": 50.111977, "t": 265.30511, "r": 286.36508, "b": 273.89288, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "since they enhance their predictive capabilities. Unfortu-", "bbox": {"l": 50.111977, "t": 277.26111000000003, "r": 286.36505, "b": 285.84888, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "nately, tables come in a large variety of shapes and sizes.", "bbox": {"l": 50.111977, "t": 289.21609, "r": 286.36505, "b": 297.80386, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Furthermore, they can have complex column/row-header", "bbox": {"l": 50.111977, "t": 301.17108, "r": 286.36505, "b": 309.75884999999994, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "configurations, multiline rows, different variety of separa-", "bbox": {"l": 50.111977, "t": 313.12607, "r": 286.36508, "b": 321.71384, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "tion lines, missing entries, etc. As such, the correct iden-", "bbox": {"l": 50.111977, "t": 325.08105, "r": 286.36508, "b": 333.66882, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "tification of the table-structure from an image is a non-", "bbox": {"l": 50.111977, "t": 337.03604, "r": 286.36505, "b": 345.62381, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "trivial task. In this paper, we present a new table-structure", "bbox": {"l": 50.111977, "t": 348.99203, "r": 286.36508, "b": 357.5798, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "identification model. The latter improves the latest end-to-", "bbox": {"l": 50.111977, "t": 360.94701999999995, "r": 286.36505, "b": 369.53479, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "end deep learning model (i.e. encoder-dual-decoder from", "bbox": {"l": 50.111977, "t": 372.90201, "r": 286.36508, "b": 381.48978, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "PubTabNet) in two significant ways. First, we introduce a", "bbox": {"l": 50.111977, "t": 384.85699, "r": 286.36505, "b": 393.44476, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "new object detection decoder for table-cells. In this way,", "bbox": {"l": 50.111977, "t": 396.81198, "r": 286.36511, "b": 405.39975000000004, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "we can obtain the content of the table-cells from program-", "bbox": {"l": 50.111977, "t": 408.76697, "r": 286.36508, "b": 417.35474, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "matic PDF\u2019s directly from the PDF source and avoid the", "bbox": {"l": 50.111977, "t": 420.72296000000006, "r": 286.36505, "b": 429.31073, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "training of the custom OCR decoders.", "bbox": {"l": 50.111977, "t": 432.67795, "r": 207.23216, "b": 441.26572, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "This architectural", "bbox": {"l": 214.09639, "t": 432.67795, "r": 286.36508, "b": 441.26572, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "change leads to more accurate table-content extraction and", "bbox": {"l": 50.111977, "t": 444.63293, "r": 286.36508, "b": 453.2207, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "allows us to tackle non-english tables. Second, we replace", "bbox": {"l": 50.111977, "t": 456.58792000000005, "r": 286.36505, "b": 465.17569, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "the LSTM decoders with transformer based decoders. This", "bbox": {"l": 50.111977, "t": 468.54291, "r": 286.36505, "b": 477.13068, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "upgrade improves significantly the previous state-of-the-art", "bbox": {"l": 50.111977, "t": 480.4989, "r": 286.36508, "b": 489.08667, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "tree-editing-distance-score (TEDS) from 91% to 98.5% on", "bbox": {"l": 50.111977, "t": 492.45389, "r": 286.36505, "b": 501.04166, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "simple tables and from 88.7% to 95% on complex tables.", "bbox": {"l": 50.111977, "t": 504.40887, "r": 276.65152, "b": 512.9966400000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Tables organize valuable content in a concise and compact representation. This content is extremely valuable for systems such as search engines, Knowledge Graph's, etc, since they enhance their predictive capabilities. Unfortunately, tables come in a large variety of shapes and sizes. Furthermore, they can have complex column/row-header configurations, multiline rows, different variety of separation lines, missing entries, etc. As such, the correct identification of the table-structure from an image is a nontrivial task. In this paper, we present a new table-structure identification model. The latter improves the latest end-toend deep learning model (i.e. encoder-dual-decoder from PubTabNet) in two significant ways. First, we introduce a new object detection decoder for table-cells. In this way, we can obtain the content of the table-cells from programmatic PDF's directly from the PDF source and avoid the training of the custom OCR decoders. This architectural change leads to more accurate table-content extraction and allows us to tackle non-english tables. Second, we replace the LSTM decoders with transformer based decoders. This upgrade improves significantly the previous state-of-the-art tree-editing-distance-score (TEDS) from 91% to 98.5% on simple tables and from 88.7% to 95% on complex tables."}, {"label": "section_header", "id": 4, "page_no": 0, "cluster": {"id": 4, "label": "section_header", "bbox": {"l": 50.111977, "t": 539.94276, "r": 126.94804, "b": 550.69049, "coord_origin": "TOPLEFT"}, "confidence": 0.9317677617073059, "cells": [{"id": 32, "text": "1.", "bbox": {"l": 50.111977, "t": 539.94276, "r": 58.121296, "b": 550.69049, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "Introduction", "bbox": {"l": 68.800385, "t": 539.94276, "r": 126.94804, "b": 550.69049, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1. Introduction"}, {"label": "text", "id": 1, "page_no": 0, "cluster": {"id": 1, "label": "text", "bbox": {"l": 50.111977, "t": 560.7832, "r": 286.36508, "b": 713.151779, "coord_origin": "TOPLEFT"}, "confidence": 0.9841895699501038, "cells": [{"id": 34, "text": "The occurrence of tables in documents is ubiquitous.", "bbox": {"l": 62.066978, "t": 560.7832, "r": 286.36496, "b": 569.68976, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "They often summarise quantitative or factual data, which is", "bbox": {"l": 50.111977, "t": 572.7382, "r": 286.36508, "b": 581.64476, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "cumbersome to describe in verbose text but nevertheless ex-", "bbox": {"l": 50.111977, "t": 584.69321, "r": 286.36505, "b": 593.5997600000001, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "tremely valuable. Unfortunately, this compact representa-", "bbox": {"l": 50.111977, "t": 596.6492000000001, "r": 286.36505, "b": 605.55576, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "tion is often not easy to parse by machines. There are many", "bbox": {"l": 50.111977, "t": 608.6042, "r": 286.36505, "b": 617.51076, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "implicit conventions used to obtain a compact table repre-", "bbox": {"l": 50.111977, "t": 620.5592, "r": 286.36505, "b": 629.46576, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "sentation. For example, tables often have complex column-", "bbox": {"l": 50.111977, "t": 632.51421, "r": 286.36508, "b": 641.42076, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "and row-headers in order to reduce duplicated cell content.", "bbox": {"l": 50.111977, "t": 644.46921, "r": 286.36508, "b": 653.37576, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "Lines of different shapes and sizes are leveraged to separate", "bbox": {"l": 50.111977, "t": 656.42421, "r": 286.36502, "b": 665.33077, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "content or indicate a tree structure. Additionally, tables can", "bbox": {"l": 50.111977, "t": 668.3802000000001, "r": 286.36505, "b": 677.28677, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "also have empty/missing table-entries or multi-row textual", "bbox": {"l": 50.111977, "t": 680.33521, "r": 286.36505, "b": 689.2417800000001, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "table-entries. Fig. 1 shows a table which presents all these", "bbox": {"l": 50.111977, "t": 692.290207, "r": 286.36505, "b": 701.196777, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "issues.", "bbox": {"l": 50.111977, "t": 704.245209, "r": 76.403275, "b": 713.151779, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The occurrence of tables in documents is ubiquitous. They often summarise quantitative or factual data, which is cumbersome to describe in verbose text but nevertheless extremely valuable. Unfortunately, this compact representation is often not easy to parse by machines. There are many implicit conventions used to obtain a compact table representation. For example, tables often have complex columnand row-headers in order to reduce duplicated cell content. Lines of different shapes and sizes are leveraged to separate content or indicate a tree structure. Additionally, tables can also have empty/missing table-entries or multi-row textual table-entries. Fig. 1 shows a table which presents all these issues."}, {"label": "section_header", "id": 14, "page_no": 0, "cluster": {"id": 14, "label": "section_header", "bbox": {"l": 315.56702, "t": 218.00684, "r": 408.4407, "b": 226.75482, "coord_origin": "TOPLEFT"}, "confidence": 0.6724023818969727, "cells": [{"id": 47, "text": "a.", "bbox": {"l": 315.56702, "t": 218.00684, "r": 324.01007, "b": 226.75482, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Picture of a table:", "bbox": {"l": 328.2316, "t": 218.00684, "r": 408.4407, "b": 226.75482, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "a. Picture of a table:"}, {"label": "list_item", "id": 17, "page_no": 0, "cluster": {"id": 17, "label": "list_item", "bbox": {"l": 315.56702, "t": 313.69478999999995, "r": 486.40194999999994, "b": 333.2428, "coord_origin": "TOPLEFT"}, "confidence": 0.5549328923225403, "cells": [{"id": 49, "text": "b.", "bbox": {"l": 315.56702, "t": 313.69478999999995, "r": 325.05786, "b": 322.44281, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Red-annotation of bounding boxes,", "bbox": {"l": 329.80325, "t": 313.69478999999995, "r": 486.40194999999994, "b": 322.44281, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Blue-predictions by TableFormer", "bbox": {"l": 326.46252, "t": 324.49478, "r": 472.47411999999997, "b": 333.2428, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "b. Red-annotation of bounding boxes, Blue-predictions by TableFormer"}, {"label": "list_item", "id": 18, "page_no": 0, "cluster": {"id": 18, "label": "list_item", "bbox": {"l": 315.56702, "t": 420.1828, "r": 491.1912500000001, "b": 428.93082, "coord_origin": "TOPLEFT"}, "confidence": 0.5501358509063721, "cells": [{"id": 52, "text": "c.", "bbox": {"l": 315.56702, "t": 420.1828, "r": 324.81039, "b": 428.93082, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Structure predicted by TableFormer:", "bbox": {"l": 329.4321, "t": 420.1828, "r": 491.1912500000001, "b": 428.93082, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "c. Structure predicted by TableFormer:"}, {"label": "picture", "id": 10, "page_no": 0, "cluster": {"id": 10, "label": "picture", "bbox": {"l": 314.78173828125, "t": 338.0652770996094, "r": 539.1802978515625, "b": 410.0494384765625, "coord_origin": "TOPLEFT"}, "confidence": 0.8742761611938477, "cells": [{"id": 54, "text": "1", "bbox": {"l": 408.14752, "t": 342.82828, "r": 412.54001, "b": 351.61322, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "0", "bbox": {"l": 356.11011, "t": 341.57217, "r": 360.50259, "b": 350.35712, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "2", "bbox": {"l": 500.6777, "t": 340.93768, "r": 505.0701900000001, "b": 349.7226299999999, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "3", "bbox": {"l": 356.13382, "t": 351.74789, "r": 360.52631, "b": 360.53284, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "4", "bbox": {"l": 402.53992, "t": 355.8765, "r": 406.9324, "b": 364.66144, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "5", "bbox": {"l": 448.58178999999996, "t": 352.84018, "r": 452.97427, "b": 361.62512, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "6", "bbox": {"l": 491.65161000000006, "t": 353.70657, "r": 496.0441, "b": 362.49152, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "7", "bbox": {"l": 535.13843, "t": 353.33969, "r": 539.53088, "b": 362.12463, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "8", "bbox": {"l": 348.82822, "t": 387.09781, "r": 353.2207, "b": 395.88275, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "9", "bbox": {"l": 389.27151, "t": 375.37228, "r": 393.664, "b": 384.15723, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "10", "bbox": {"l": 442.67479999999995, "t": 375.64621, "r": 451.45889000000005, "b": 384.43115, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "11", "bbox": {"l": 477.4382299999999, "t": 375.534, "r": 485.90167, "b": 384.31894000000005, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "12", "bbox": {"l": 522.57263, "t": 375.64621, "r": 531.35669, "b": 384.43115, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "13", "bbox": {"l": 400.22992, "t": 387.11429, "r": 409.01401, "b": 395.89923, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "14", "bbox": {"l": 442.30792, "t": 386.98981000000003, "r": 451.0920100000001, "b": 395.77475000000004, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "15", "bbox": {"l": 478.21941999999996, "t": 387.37469, "r": 487.00351000000006, "b": 396.15964, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "16", "bbox": {"l": 523.2287, "t": 386.98981000000003, "r": 532.01276, "b": 395.77475000000004, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "1", "bbox": {"l": 411.57233, "t": 399.42477, "r": 415.96481, "b": 408.20972, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "7", "bbox": {"l": 415.96393, "t": 399.42477, "r": 420.35641, "b": 408.20972, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "18", "bbox": {"l": 442.30521, "t": 399.0371999999999, "r": 451.08929, "b": 407.82213999999993, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "19", "bbox": {"l": 478.77893, "t": 398.99639999999994, "r": 487.56302, "b": 407.78133999999994, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "20", "bbox": {"l": 523.97241, "t": 398.6114799999999, "r": 532.75647, "b": 407.39642, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "3", "bbox": {"l": 385.09399, "t": 357.76030999999995, "r": 391.09879, "b": 367.89072, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "2", "bbox": {"l": 333.43451, "t": 380.7265, "r": 339.4393, "b": 390.85689999999994, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "1", "bbox": {"l": 478.07210999999995, "t": 341.0368000000001, "r": 484.0769, "b": 351.16720999999995, "coord_origin": "TOPLEFT"}}], "children": [{"id": 19, "label": "text", "bbox": {"l": 408.14752, "t": 342.82828, "r": 412.54001, "b": 351.61322, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "1", "bbox": {"l": 408.14752, "t": 342.82828, "r": 412.54001, "b": 351.61322, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 356.11011, "t": 341.57217, "r": 360.50259, "b": 350.35712, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "0", "bbox": {"l": 356.11011, "t": 341.57217, "r": 360.50259, "b": 350.35712, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 500.6777, "t": 340.93768, "r": 505.0701900000001, "b": 349.7226299999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "2", "bbox": {"l": 500.6777, "t": 340.93768, "r": 505.0701900000001, "b": 349.7226299999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 356.13382, "t": 351.74789, "r": 360.52631, "b": 360.53284, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "3", "bbox": {"l": 356.13382, "t": 351.74789, "r": 360.52631, "b": 360.53284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 402.53992, "t": 355.8765, "r": 406.9324, "b": 364.66144, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "4", "bbox": {"l": 402.53992, "t": 355.8765, "r": 406.9324, "b": 364.66144, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 448.58178999999996, "t": 352.84018, "r": 452.97427, "b": 361.62512, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "5", "bbox": {"l": 448.58178999999996, "t": 352.84018, "r": 452.97427, "b": 361.62512, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 491.65161000000006, "t": 353.70657, "r": 496.0441, "b": 362.49152, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "6", "bbox": {"l": 491.65161000000006, "t": 353.70657, "r": 496.0441, "b": 362.49152, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 535.13843, "t": 353.33969, "r": 539.53088, "b": 362.12463, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "7", "bbox": {"l": 535.13843, "t": 353.33969, "r": 539.53088, "b": 362.12463, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 348.82822, "t": 387.09781, "r": 353.2207, "b": 395.88275, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "8", "bbox": {"l": 348.82822, "t": 387.09781, "r": 353.2207, "b": 395.88275, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 389.27151, "t": 375.37228, "r": 393.664, "b": 384.15723, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "9", "bbox": {"l": 389.27151, "t": 375.37228, "r": 393.664, "b": 384.15723, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 442.67479999999995, "t": 375.64621, "r": 451.45889000000005, "b": 384.43115, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "10", "bbox": {"l": 442.67479999999995, "t": 375.64621, "r": 451.45889000000005, "b": 384.43115, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 477.4382299999999, "t": 375.534, "r": 485.90167, "b": 384.31894000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "11", "bbox": {"l": 477.4382299999999, "t": 375.534, "r": 485.90167, "b": 384.31894000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 522.57263, "t": 375.64621, "r": 531.35669, "b": 384.43115, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "12", "bbox": {"l": 522.57263, "t": 375.64621, "r": 531.35669, "b": 384.43115, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 400.22992, "t": 387.11429, "r": 409.01401, "b": 395.89923, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "13", "bbox": {"l": 400.22992, "t": 387.11429, "r": 409.01401, "b": 395.89923, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 442.30792, "t": 386.98981000000003, "r": 451.0920100000001, "b": 395.77475000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "14", "bbox": {"l": 442.30792, "t": 386.98981000000003, "r": 451.0920100000001, "b": 395.77475000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 478.21941999999996, "t": 387.37469, "r": 487.00351000000006, "b": 396.15964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "15", "bbox": {"l": 478.21941999999996, "t": 387.37469, "r": 487.00351000000006, "b": 396.15964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 523.2287, "t": 386.98981000000003, "r": 532.01276, "b": 395.77475000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "16", "bbox": {"l": 523.2287, "t": 386.98981000000003, "r": 532.01276, "b": 395.77475000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 411.57233, "t": 399.42477, "r": 415.96481, "b": 408.20972, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "1", "bbox": {"l": 411.57233, "t": 399.42477, "r": 415.96481, "b": 408.20972, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 415.96393, "t": 399.42477, "r": 420.35641, "b": 408.20972, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "7", "bbox": {"l": 415.96393, "t": 399.42477, "r": 420.35641, "b": 408.20972, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 442.30521, "t": 399.0371999999999, "r": 451.08929, "b": 407.82213999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "18", "bbox": {"l": 442.30521, "t": 399.0371999999999, "r": 451.08929, "b": 407.82213999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 478.77893, "t": 398.99639999999994, "r": 487.56302, "b": 407.78133999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "19", "bbox": {"l": 478.77893, "t": 398.99639999999994, "r": 487.56302, "b": 407.78133999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 523.97241, "t": 398.6114799999999, "r": 532.75647, "b": 407.39642, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "20", "bbox": {"l": 523.97241, "t": 398.6114799999999, "r": 532.75647, "b": 407.39642, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 385.09399, "t": 357.76030999999995, "r": 391.09879, "b": 367.89072, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "3", "bbox": {"l": 385.09399, "t": 357.76030999999995, "r": 391.09879, "b": 367.89072, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 333.43451, "t": 380.7265, "r": 339.4393, "b": 390.85689999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "2", "bbox": {"l": 333.43451, "t": 380.7265, "r": 339.4393, "b": 390.85689999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 478.07210999999995, "t": 341.0368000000001, "r": 484.0769, "b": 351.16720999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": "1", "bbox": {"l": 478.07210999999995, "t": 341.0368000000001, "r": 484.0769, "b": 351.16720999999995, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "picture", "id": 23, "page_no": 0, "cluster": {"id": 23, "label": "picture", "bbox": {"l": 315.7172546386719, "t": 433.823486328125, "r": 536.835693359375, "b": 496.0290222167969, "coord_origin": "TOPLEFT"}, "confidence": 0.5088632702827454, "cells": [{"id": 76, "text": "1", "bbox": {"l": 347.24872, "t": 437.68588, "r": 351.6412, "b": 446.47083, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "0", "bbox": {"l": 318.88071, "t": 437.68588, "r": 323.27319, "b": 446.47083, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "2", "bbox": {"l": 394.10422, "t": 437.68588, "r": 398.4967, "b": 446.47083, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "3", "bbox": {"l": 318.77316, "t": 449.5455, "r": 323.16565, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "4", "bbox": {"l": 347.24872, "t": 449.5455, "r": 351.6412, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "5", "bbox": {"l": 394.10422, "t": 449.5455, "r": 398.4967, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "6", "bbox": {"l": 440.95941000000005, "t": 449.5455, "r": 445.3519, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "7", "bbox": {"l": 487.81491, "t": 449.5455, "r": 492.2074, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "8", "bbox": {"l": 318.77316, "t": 473.70425, "r": 323.16565, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "9", "bbox": {"l": 347.24872, "t": 461.8446, "r": 351.6412, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "10", "bbox": {"l": 394.10422, "t": 461.8446, "r": 402.88831, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "11", "bbox": {"l": 440.95941000000005, "t": 461.8446, "r": 449.42285, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "12", "bbox": {"l": 487.81491, "t": 461.8446, "r": 496.599, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "13", "bbox": {"l": 347.24872, "t": 473.70425, "r": 356.03281, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "14", "bbox": {"l": 394.10422, "t": 473.70425, "r": 402.88831, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "15", "bbox": {"l": 440.95941000000005, "t": 473.70425, "r": 449.7435, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "16", "bbox": {"l": 487.81491, "t": 473.70425, "r": 496.599, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "17", "bbox": {"l": 347.24872, "t": 485.12469, "r": 356.03281, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "18", "bbox": {"l": 394.10422, "t": 485.12469, "r": 402.88831, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "19", "bbox": {"l": 440.95941000000005, "t": 485.12469, "r": 449.7435, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "20", "bbox": {"l": 487.81491, "t": 485.12469, "r": 496.599, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "3", "bbox": {"l": 366.70102, "t": 449.12082, "r": 372.70581, "b": 459.25122, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "2", "bbox": {"l": 331.90424, "t": 473.32291, "r": 337.90903, "b": 483.45331, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "1", "bbox": {"l": 459.87621999999993, "t": 437.5936, "r": 465.88101, "b": 447.724, "coord_origin": "TOPLEFT"}}], "children": [{"id": 41, "label": "text", "bbox": {"l": 347.24872, "t": 437.68588, "r": 351.6412, "b": 446.47083, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "1", "bbox": {"l": 347.24872, "t": 437.68588, "r": 351.6412, "b": 446.47083, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 318.88071, "t": 437.68588, "r": 323.27319, "b": 446.47083, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "0", "bbox": {"l": 318.88071, "t": 437.68588, "r": 323.27319, "b": 446.47083, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 394.10422, "t": 437.68588, "r": 398.4967, "b": 446.47083, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "2", "bbox": {"l": 394.10422, "t": 437.68588, "r": 398.4967, "b": 446.47083, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 318.77316, "t": 449.5455, "r": 323.16565, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "3", "bbox": {"l": 318.77316, "t": 449.5455, "r": 323.16565, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 347.24872, "t": 449.5455, "r": 351.6412, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "4", "bbox": {"l": 347.24872, "t": 449.5455, "r": 351.6412, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 394.10422, "t": 449.5455, "r": 398.4967, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "5", "bbox": {"l": 394.10422, "t": 449.5455, "r": 398.4967, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 440.95941000000005, "t": 449.5455, "r": 445.3519, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "6", "bbox": {"l": 440.95941000000005, "t": 449.5455, "r": 445.3519, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 487.81491, "t": 449.5455, "r": 492.2074, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "7", "bbox": {"l": 487.81491, "t": 449.5455, "r": 492.2074, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 318.77316, "t": 473.70425, "r": 323.16565, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "8", "bbox": {"l": 318.77316, "t": 473.70425, "r": 323.16565, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 347.24872, "t": 461.8446, "r": 351.6412, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "9", "bbox": {"l": 347.24872, "t": 461.8446, "r": 351.6412, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 394.10422, "t": 461.8446, "r": 402.88831, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "10", "bbox": {"l": 394.10422, "t": 461.8446, "r": 402.88831, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 440.95941000000005, "t": 461.8446, "r": 449.42285, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "11", "bbox": {"l": 440.95941000000005, "t": 461.8446, "r": 449.42285, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 487.81491, "t": 461.8446, "r": 496.599, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "12", "bbox": {"l": 487.81491, "t": 461.8446, "r": 496.599, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 347.24872, "t": 473.70425, "r": 356.03281, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "13", "bbox": {"l": 347.24872, "t": 473.70425, "r": 356.03281, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 394.10422, "t": 473.70425, "r": 402.88831, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "14", "bbox": {"l": 394.10422, "t": 473.70425, "r": 402.88831, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 440.95941000000005, "t": 473.70425, "r": 449.7435, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "15", "bbox": {"l": 440.95941000000005, "t": 473.70425, "r": 449.7435, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 487.81491, "t": 473.70425, "r": 496.599, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "16", "bbox": {"l": 487.81491, "t": 473.70425, "r": 496.599, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 347.24872, "t": 485.12469, "r": 356.03281, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "17", "bbox": {"l": 347.24872, "t": 485.12469, "r": 356.03281, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 394.10422, "t": 485.12469, "r": 402.88831, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "18", "bbox": {"l": 394.10422, "t": 485.12469, "r": 402.88831, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 440.95941000000005, "t": 485.12469, "r": 449.7435, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "19", "bbox": {"l": 440.95941000000005, "t": 485.12469, "r": 449.7435, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 487.81491, "t": 485.12469, "r": 496.599, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "20", "bbox": {"l": 487.81491, "t": 485.12469, "r": 496.599, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 366.70102, "t": 449.12082, "r": 372.70581, "b": 459.25122, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "3", "bbox": {"l": 366.70102, "t": 449.12082, "r": 372.70581, "b": 459.25122, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 331.90424, "t": 473.32291, "r": 337.90903, "b": 483.45331, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "2", "bbox": {"l": 331.90424, "t": 473.32291, "r": 337.90903, "b": 483.45331, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 459.87621999999993, "t": 437.5936, "r": 465.88101, "b": 447.724, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "1", "bbox": {"l": 459.87621999999993, "t": 437.5936, "r": 465.88101, "b": 447.724, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "table", "id": 11, "page_no": 0, "cluster": {"id": 11, "label": "table", "bbox": {"l": 315.7172546386719, "t": 433.823486328125, "r": 536.835693359375, "b": 496.0290222167969, "coord_origin": "TOPLEFT"}, "confidence": 0.8056110739707947, "cells": [{"id": 76, "text": "1", "bbox": {"l": 347.24872, "t": 437.68588, "r": 351.6412, "b": 446.47083, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "0", "bbox": {"l": 318.88071, "t": 437.68588, "r": 323.27319, "b": 446.47083, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "2", "bbox": {"l": 394.10422, "t": 437.68588, "r": 398.4967, "b": 446.47083, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "3", "bbox": {"l": 318.77316, "t": 449.5455, "r": 323.16565, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "4", "bbox": {"l": 347.24872, "t": 449.5455, "r": 351.6412, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "5", "bbox": {"l": 394.10422, "t": 449.5455, "r": 398.4967, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "6", "bbox": {"l": 440.95941000000005, "t": 449.5455, "r": 445.3519, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "7", "bbox": {"l": 487.81491, "t": 449.5455, "r": 492.2074, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "8", "bbox": {"l": 318.77316, "t": 473.70425, "r": 323.16565, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "9", "bbox": {"l": 347.24872, "t": 461.8446, "r": 351.6412, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "10", "bbox": {"l": 394.10422, "t": 461.8446, "r": 402.88831, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "11", "bbox": {"l": 440.95941000000005, "t": 461.8446, "r": 449.42285, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "12", "bbox": {"l": 487.81491, "t": 461.8446, "r": 496.599, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "13", "bbox": {"l": 347.24872, "t": 473.70425, "r": 356.03281, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "14", "bbox": {"l": 394.10422, "t": 473.70425, "r": 402.88831, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "15", "bbox": {"l": 440.95941000000005, "t": 473.70425, "r": 449.7435, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "16", "bbox": {"l": 487.81491, "t": 473.70425, "r": 496.599, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "17", "bbox": {"l": 347.24872, "t": 485.12469, "r": 356.03281, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "18", "bbox": {"l": 394.10422, "t": 485.12469, "r": 402.88831, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "19", "bbox": {"l": 440.95941000000005, "t": 485.12469, "r": 449.7435, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "20", "bbox": {"l": 487.81491, "t": 485.12469, "r": 496.599, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "3", "bbox": {"l": 366.70102, "t": 449.12082, "r": 372.70581, "b": 459.25122, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "2", "bbox": {"l": 331.90424, "t": 473.32291, "r": 337.90903, "b": 483.45331, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "1", "bbox": {"l": 459.87621999999993, "t": 437.5936, "r": 465.88101, "b": 447.724, "coord_origin": "TOPLEFT"}}], "children": [{"id": 41, "label": "text", "bbox": {"l": 347.24872, "t": 437.68588, "r": 351.6412, "b": 446.47083, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "1", "bbox": {"l": 347.24872, "t": 437.68588, "r": 351.6412, "b": 446.47083, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 318.88071, "t": 437.68588, "r": 323.27319, "b": 446.47083, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "0", "bbox": {"l": 318.88071, "t": 437.68588, "r": 323.27319, "b": 446.47083, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 394.10422, "t": 437.68588, "r": 398.4967, "b": 446.47083, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "2", "bbox": {"l": 394.10422, "t": 437.68588, "r": 398.4967, "b": 446.47083, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 318.77316, "t": 449.5455, "r": 323.16565, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "3", "bbox": {"l": 318.77316, "t": 449.5455, "r": 323.16565, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 347.24872, "t": 449.5455, "r": 351.6412, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "4", "bbox": {"l": 347.24872, "t": 449.5455, "r": 351.6412, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 394.10422, "t": 449.5455, "r": 398.4967, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "5", "bbox": {"l": 394.10422, "t": 449.5455, "r": 398.4967, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 440.95941000000005, "t": 449.5455, "r": 445.3519, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "6", "bbox": {"l": 440.95941000000005, "t": 449.5455, "r": 445.3519, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 487.81491, "t": 449.5455, "r": 492.2074, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "7", "bbox": {"l": 487.81491, "t": 449.5455, "r": 492.2074, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 318.77316, "t": 473.70425, "r": 323.16565, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "8", "bbox": {"l": 318.77316, "t": 473.70425, "r": 323.16565, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 347.24872, "t": 461.8446, "r": 351.6412, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "9", "bbox": {"l": 347.24872, "t": 461.8446, "r": 351.6412, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 394.10422, "t": 461.8446, "r": 402.88831, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "10", "bbox": {"l": 394.10422, "t": 461.8446, "r": 402.88831, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 440.95941000000005, "t": 461.8446, "r": 449.42285, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "11", "bbox": {"l": 440.95941000000005, "t": 461.8446, "r": 449.42285, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 487.81491, "t": 461.8446, "r": 496.599, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "12", "bbox": {"l": 487.81491, "t": 461.8446, "r": 496.599, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 347.24872, "t": 473.70425, "r": 356.03281, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "13", "bbox": {"l": 347.24872, "t": 473.70425, "r": 356.03281, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 394.10422, "t": 473.70425, "r": 402.88831, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "14", "bbox": {"l": 394.10422, "t": 473.70425, "r": 402.88831, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 440.95941000000005, "t": 473.70425, "r": 449.7435, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "15", "bbox": {"l": 440.95941000000005, "t": 473.70425, "r": 449.7435, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 487.81491, "t": 473.70425, "r": 496.599, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "16", "bbox": {"l": 487.81491, "t": 473.70425, "r": 496.599, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 347.24872, "t": 485.12469, "r": 356.03281, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "17", "bbox": {"l": 347.24872, "t": 485.12469, "r": 356.03281, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 394.10422, "t": 485.12469, "r": 402.88831, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "18", "bbox": {"l": 394.10422, "t": 485.12469, "r": 402.88831, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 440.95941000000005, "t": 485.12469, "r": 449.7435, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "19", "bbox": {"l": 440.95941000000005, "t": 485.12469, "r": 449.7435, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 487.81491, "t": 485.12469, "r": 496.599, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "20", "bbox": {"l": 487.81491, "t": 485.12469, "r": 496.599, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 366.70102, "t": 449.12082, "r": 372.70581, "b": 459.25122, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "3", "bbox": {"l": 366.70102, "t": 449.12082, "r": 372.70581, "b": 459.25122, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 331.90424, "t": 473.32291, "r": 337.90903, "b": 483.45331, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "2", "bbox": {"l": 331.90424, "t": 473.32291, "r": 337.90903, "b": 483.45331, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 459.87621999999993, "t": 437.5936, "r": 465.88101, "b": 447.724, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "1", "bbox": {"l": 459.87621999999993, "t": 437.5936, "r": 465.88101, "b": 447.724, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "lcel", "ched", "lcel", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "ucel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "ucel", "nl"], "num_rows": 5, "num_cols": 6, "table_cells": [{"bbox": {"l": 347.24872, "t": 437.68588, "r": 351.6412, "b": 446.47083, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 3, "text": "1", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 318.88071, "t": 437.68588, "r": 323.27319, "b": 446.47083, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "0", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 394.10422, "t": 437.5936, "r": 465.88101, "b": 447.724, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 5, "text": "2 1", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 318.77316, "t": 449.5455, "r": 323.16565, "b": 458.33044, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 347.24872, "t": 449.5455, "r": 351.6412, "b": 458.33044, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 366.70102, "t": 449.12082, "r": 398.4967, "b": 459.25122, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "5 3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.95941000000005, "t": 449.5455, "r": 445.3519, "b": 458.33044, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.81491, "t": 449.5455, "r": 492.2074, "b": 458.33044, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 318.77316, "t": 473.70425, "r": 323.16565, "b": 482.4892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 347.24872, "t": 461.8446, "r": 351.6412, "b": 470.62955, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.10422, "t": 461.8446, "r": 402.88831, "b": 470.62955, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "10", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.95941000000005, "t": 461.8446, "r": 449.42285, "b": 470.62955, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "11", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.81491, "t": 461.8446, "r": 496.599, "b": 470.62955, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "12", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 347.24872, "t": 473.70425, "r": 356.03281, "b": 482.4892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "13", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.10422, "t": 473.70425, "r": 402.88831, "b": 482.4892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "14", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.95941000000005, "t": 473.70425, "r": 449.7435, "b": 482.4892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "15", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.81491, "t": 473.70425, "r": 496.599, "b": 482.4892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "16", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 347.24872, "t": 485.12469, "r": 356.03281, "b": 493.90964, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "17", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.10422, "t": 485.12469, "r": 402.88831, "b": 493.90964, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "18", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.95941000000005, "t": 485.12469, "r": 449.7435, "b": 493.90964, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "19", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.81491, "t": 485.12469, "r": 496.599, "b": 493.90964, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "20", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 331.90424, "t": 473.32291, "r": 337.90903, "b": 483.45331, "coord_origin": "TOPLEFT"}, "row_span": 3, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "2", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "picture", "id": 16, "page_no": 0, "cluster": {"id": 16, "label": "picture", "bbox": {"l": 315.65362548828125, "t": 228.723388671875, "r": 537.1475219726562, "b": 302.8014221191406, "coord_origin": "TOPLEFT"}, "confidence": 0.608779788017273, "cells": [{"id": 97, "text": "1", "bbox": {"l": 451.9457100000001, "t": 235.34704999999997, "r": 457.95050000000003, "b": 245.47748, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "2", "bbox": {"l": 331.19681, "t": 269.35266, "r": 337.2016, "b": 279.48308999999995, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "3", "bbox": {"l": 384.0329, "t": 252.67895999999996, "r": 390.03769, "b": 262.80939, "coord_origin": "TOPLEFT"}}], "children": [{"id": 62, "label": "text", "bbox": {"l": 451.9457100000001, "t": 235.34704999999997, "r": 457.95050000000003, "b": 245.47748, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "1", "bbox": {"l": 451.9457100000001, "t": 235.34704999999997, "r": 457.95050000000003, "b": 245.47748, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 331.19681, "t": 269.35266, "r": 337.2016, "b": 279.48308999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "2", "bbox": {"l": 331.19681, "t": 269.35266, "r": 337.2016, "b": 279.48308999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 384.0329, "t": 252.67895999999996, "r": 390.03769, "b": 262.80939, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "3", "bbox": {"l": 384.0329, "t": 252.67895999999996, "r": 390.03769, "b": 262.80939, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "table", "id": 15, "page_no": 0, "cluster": {"id": 15, "label": "table", "bbox": {"l": 315.65362548828125, "t": 228.723388671875, "r": 537.1475219726562, "b": 302.8014221191406, "coord_origin": "TOPLEFT"}, "confidence": 0.6515864729881287, "cells": [{"id": 97, "text": "1", "bbox": {"l": 451.9457100000001, "t": 235.34704999999997, "r": 457.95050000000003, "b": 245.47748, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "2", "bbox": {"l": 331.19681, "t": 269.35266, "r": 337.2016, "b": 279.48308999999995, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "3", "bbox": {"l": 384.0329, "t": 252.67895999999996, "r": 390.03769, "b": 262.80939, "coord_origin": "TOPLEFT"}}], "children": [{"id": 62, "label": "text", "bbox": {"l": 451.9457100000001, "t": 235.34704999999997, "r": 457.95050000000003, "b": 245.47748, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "1", "bbox": {"l": 451.9457100000001, "t": 235.34704999999997, "r": 457.95050000000003, "b": 245.47748, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 331.19681, "t": 269.35266, "r": 337.2016, "b": 279.48308999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "2", "bbox": {"l": 331.19681, "t": 269.35266, "r": 337.2016, "b": 279.48308999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 384.0329, "t": 252.67895999999996, "r": 390.03769, "b": 262.80939, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "3", "bbox": {"l": 384.0329, "t": 252.67895999999996, "r": 390.03769, "b": 262.80939, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ecel", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "ucel", "fcel", "fcel", "fcel", "fcel", "nl", "ucel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 1, "num_cols": 2, "table_cells": [{"bbox": {"l": 451.9457100000001, "t": 235.34704999999997, "r": 457.95050000000003, "b": 245.47748, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "1", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 384.0329, "t": 252.67895999999996, "r": 390.03769, "b": 262.80939, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3", "column_header": true, "row_header": false, "row_section": false}]}, {"label": "caption", "id": 6, "page_no": 0, "cluster": {"id": 6, "label": "caption", "bbox": {"l": 308.862, "t": 514.50037, "r": 545.11517, "b": 559.2729, "coord_origin": "TOPLEFT"}, "confidence": 0.9214619398117065, "cells": [{"id": 106, "text": "Figure 1:", "bbox": {"l": 308.862, "t": 514.50037, "r": 345.73361, "b": 523.40692, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "Picture of a table with subtle, complex features", "bbox": {"l": 353.17566, "t": 514.50037, "r": 545.11511, "b": 523.40692, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "such as (1) multi-column headers, (2) cell with multi-row", "bbox": {"l": 308.862, "t": 526.45535, "r": 545.11511, "b": 535.3619100000001, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "text and (3) cells with no content. Image from PubTabNet", "bbox": {"l": 308.862, "t": 538.41035, "r": 545.11517, "b": 547.31691, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "evaluation set, filename: \u2018PMC2944238 004 02\u2019.", "bbox": {"l": 308.862, "t": 550.36635, "r": 505.6917700000001, "b": 559.2729, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 1: Picture of a table with subtle, complex features such as (1) multi-column headers, (2) cell with multi-row text and (3) cells with no content. Image from PubTabNet evaluation set, filename: 'PMC2944238 004 02'."}, {"label": "text", "id": 0, "page_no": 0, "cluster": {"id": 0, "label": "text", "bbox": {"l": 308.862, "t": 584.40936, "r": 545.11517, "b": 665.04693, "coord_origin": "TOPLEFT"}, "confidence": 0.9848759770393372, "cells": [{"id": 111, "text": "Recently, significant progress has been made with vi-", "bbox": {"l": 320.81699, "t": 584.40936, "r": 545.11493, "b": 593.31592, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "sion based approaches to extract tables in documents. For", "bbox": {"l": 308.862, "t": 596.36436, "r": 545.11517, "b": 605.2709199999999, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "the sake of completeness, the issue of table extraction from", "bbox": {"l": 308.862, "t": 608.31937, "r": 545.11511, "b": 617.22592, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "documents is typically decomposed into two separate chal-", "bbox": {"l": 308.862, "t": 620.27437, "r": 545.11505, "b": 629.18092, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "lenges, i.e.", "bbox": {"l": 308.862, "t": 632.23036, "r": 353.6937, "b": 641.13692, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "(1)", "bbox": {"l": 362.11209, "t": 632.23036, "r": 374.66617, "b": 641.13692, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "finding the location of the table(s) on a", "bbox": {"l": 377.35785, "t": 632.23036, "r": 545.11505, "b": 641.13692, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "document-page and (2) finding the structure of a given table", "bbox": {"l": 308.862, "t": 644.18536, "r": 545.11517, "b": 653.09192, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "in the document.", "bbox": {"l": 308.862, "t": 656.14037, "r": 375.55167, "b": 665.04693, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Recently, significant progress has been made with vision based approaches to extract tables in documents. For the sake of completeness, the issue of table extraction from documents is typically decomposed into two separate challenges, i.e. (1) finding the location of the table(s) on a document-page and (2) finding the structure of a given table in the document."}, {"label": "text", "id": 3, "page_no": 0, "cluster": {"id": 3, "label": "text", "bbox": {"l": 308.862, "t": 668.38036, "r": 545.11511, "b": 713.151932, "coord_origin": "TOPLEFT"}, "confidence": 0.979152262210846, "cells": [{"id": 120, "text": "The first problem is called table-location and has been", "bbox": {"l": 320.81699, "t": 668.38036, "r": 545.11493, "b": 677.28693, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "previously addressed [30, 38, 19, 21, 23, 26, 8] with state-", "bbox": {"l": 308.862, "t": 680.33536, "r": 545.11511, "b": 689.24193, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "of-the-art object-detection networks (e.g. YOLO and later", "bbox": {"l": 308.862, "t": 692.290359, "r": 545.11511, "b": 701.19693, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "on Mask-RCNN [9]). For all practical purposes, it can be", "bbox": {"l": 308.862, "t": 704.245361, "r": 545.11499, "b": 713.151932, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The first problem is called table-location and has been previously addressed [30, 38, 19, 21, 23, 26, 8] with stateof-the-art object-detection networks (e.g. YOLO and later on Mask-RCNN [9]). For all practical purposes, it can be"}, {"label": "page_footer", "id": 12, "page_no": 0, "cluster": {"id": 12, "label": "page_footer", "bbox": {"l": 295.121, "t": 734.133366, "r": 300.10229, "b": 743.039928, "coord_origin": "TOPLEFT"}, "confidence": 0.8045893311500549, "cells": [{"id": 124, "text": "1", "bbox": {"l": 295.121, "t": 734.133366, "r": 300.10229, "b": 743.039928, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1"}, {"label": "page_header", "id": 9, "page_no": 0, "cluster": {"id": 9, "label": "page_header", "bbox": {"l": 18.340221, "t": 207.82001000000002, "r": 36.339779, "b": 560.00003, "coord_origin": "TOPLEFT"}, "confidence": 0.8773143887519836, "cells": [{"id": 125, "text": "arXiv:2203.01017v2 [cs.CV] 11 Mar 2022", "bbox": {"l": 18.340221, "t": 207.82001000000002, "r": 36.339779, "b": 560.00003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "arXiv:2203.01017v2 [cs.CV] 11 Mar 2022"}], "body": [{"label": "section_header", "id": 8, "page_no": 0, "cluster": {"id": 8, "label": "section_header", "bbox": {"l": 96.301003, "t": 107.03412000000003, "r": 498.92708999999996, "b": 119.93133999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.8868067860603333, "cells": [{"id": 0, "text": "TableFormer: Table Structure Understanding with Transformers.", "bbox": {"l": 96.301003, "t": 107.03412000000003, "r": 498.92708999999996, "b": 119.93133999999998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "TableFormer: Table Structure Understanding with Transformers."}, {"label": "section_header", "id": 13, "page_no": 0, "cluster": {"id": 13, "label": "section_header", "bbox": {"l": 142.47701, "t": 146.68535999999995, "r": 452.75027, "b": 171.32037000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.7586215734481812, "cells": [{"id": 1, "text": "Ahmed Nassar, Nikolaos Livathinos, Maksym Lysak, Peter Staar", "bbox": {"l": 142.47701, "t": 146.68535999999995, "r": 452.75027, "b": 157.37334999999996, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "IBM Research", "bbox": {"l": 262.918, "t": 160.63239, "r": 332.30597, "b": 171.32037000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Ahmed Nassar, Nikolaos Livathinos, Maksym Lysak, Peter Staar IBM Research"}, {"label": "key_value_region", "id": 25, "page_no": 0, "cluster": {"id": 25, "label": "key_value_region", "bbox": {"l": 208.123, "t": 175.96123999999998, "r": 378.73257, "b": 184.42553999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.4854728579521179, "cells": [{"id": 3, "text": "{", "bbox": {"l": 208.123, "t": 175.96123999999998, "r": 212.73083, "b": 184.42553999999996, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "ahn,nli,mly,taa", "bbox": {"l": 212.73, "t": 177.08203000000003, "r": 293.42761, "b": 184.00409000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "}", "bbox": {"l": 293.42798, "t": 175.96123999999998, "r": 298.0358, "b": 184.42553999999996, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "@zurich.ibm.com", "bbox": {"l": 298.03497, "t": 177.08203000000003, "r": 378.73257, "b": 184.00409000000002, "coord_origin": "TOPLEFT"}}], "children": [{"id": 7, "label": "text", "bbox": {"l": 208.123, "t": 175.96123999999998, "r": 378.73257, "b": 184.42553999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9096331596374512, "cells": [{"id": 3, "text": "{", "bbox": {"l": 208.123, "t": 175.96123999999998, "r": 212.73083, "b": 184.42553999999996, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "ahn,nli,mly,taa", "bbox": {"l": 212.73, "t": 177.08203000000003, "r": 293.42761, "b": 184.00409000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "}", "bbox": {"l": 293.42798, "t": 175.96123999999998, "r": 298.0358, "b": 184.42553999999996, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "@zurich.ibm.com", "bbox": {"l": 298.03497, "t": 177.08203000000003, "r": 378.73257, "b": 184.00409000000002, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null}, {"label": "section_header", "id": 5, "page_no": 0, "cluster": {"id": 5, "label": "section_header", "bbox": {"l": 145.99498, "t": 215.48297000000002, "r": 190.48029, "b": 226.23071000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9258671402931213, "cells": [{"id": 7, "text": "Abstract", "bbox": {"l": 145.99498, "t": 215.48297000000002, "r": 190.48029, "b": 226.23071000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Abstract"}, {"label": "text", "id": 2, "page_no": 0, "cluster": {"id": 2, "label": "text", "bbox": {"l": 50.111977, "t": 241.39508, "r": 286.36511, "b": 512.9966400000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9838882088661194, "cells": [{"id": 8, "text": "Tables organize valuable content in a concise and com-", "bbox": {"l": 62.066978, "t": 241.39508, "r": 286.36493, "b": 249.98284999999998, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "pact representation. This content is extremely valuable for", "bbox": {"l": 50.111977, "t": 253.3501, "r": 286.36508, "b": 261.93787, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "systems such as search engines, Knowledge Graph\u2019s, etc,", "bbox": {"l": 50.111977, "t": 265.30511, "r": 286.36508, "b": 273.89288, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "since they enhance their predictive capabilities. Unfortu-", "bbox": {"l": 50.111977, "t": 277.26111000000003, "r": 286.36505, "b": 285.84888, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "nately, tables come in a large variety of shapes and sizes.", "bbox": {"l": 50.111977, "t": 289.21609, "r": 286.36505, "b": 297.80386, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Furthermore, they can have complex column/row-header", "bbox": {"l": 50.111977, "t": 301.17108, "r": 286.36505, "b": 309.75884999999994, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "configurations, multiline rows, different variety of separa-", "bbox": {"l": 50.111977, "t": 313.12607, "r": 286.36508, "b": 321.71384, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "tion lines, missing entries, etc. As such, the correct iden-", "bbox": {"l": 50.111977, "t": 325.08105, "r": 286.36508, "b": 333.66882, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "tification of the table-structure from an image is a non-", "bbox": {"l": 50.111977, "t": 337.03604, "r": 286.36505, "b": 345.62381, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "trivial task. In this paper, we present a new table-structure", "bbox": {"l": 50.111977, "t": 348.99203, "r": 286.36508, "b": 357.5798, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "identification model. The latter improves the latest end-to-", "bbox": {"l": 50.111977, "t": 360.94701999999995, "r": 286.36505, "b": 369.53479, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "end deep learning model (i.e. encoder-dual-decoder from", "bbox": {"l": 50.111977, "t": 372.90201, "r": 286.36508, "b": 381.48978, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "PubTabNet) in two significant ways. First, we introduce a", "bbox": {"l": 50.111977, "t": 384.85699, "r": 286.36505, "b": 393.44476, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "new object detection decoder for table-cells. In this way,", "bbox": {"l": 50.111977, "t": 396.81198, "r": 286.36511, "b": 405.39975000000004, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "we can obtain the content of the table-cells from program-", "bbox": {"l": 50.111977, "t": 408.76697, "r": 286.36508, "b": 417.35474, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "matic PDF\u2019s directly from the PDF source and avoid the", "bbox": {"l": 50.111977, "t": 420.72296000000006, "r": 286.36505, "b": 429.31073, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "training of the custom OCR decoders.", "bbox": {"l": 50.111977, "t": 432.67795, "r": 207.23216, "b": 441.26572, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "This architectural", "bbox": {"l": 214.09639, "t": 432.67795, "r": 286.36508, "b": 441.26572, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "change leads to more accurate table-content extraction and", "bbox": {"l": 50.111977, "t": 444.63293, "r": 286.36508, "b": 453.2207, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "allows us to tackle non-english tables. Second, we replace", "bbox": {"l": 50.111977, "t": 456.58792000000005, "r": 286.36505, "b": 465.17569, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "the LSTM decoders with transformer based decoders. This", "bbox": {"l": 50.111977, "t": 468.54291, "r": 286.36505, "b": 477.13068, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "upgrade improves significantly the previous state-of-the-art", "bbox": {"l": 50.111977, "t": 480.4989, "r": 286.36508, "b": 489.08667, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "tree-editing-distance-score (TEDS) from 91% to 98.5% on", "bbox": {"l": 50.111977, "t": 492.45389, "r": 286.36505, "b": 501.04166, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "simple tables and from 88.7% to 95% on complex tables.", "bbox": {"l": 50.111977, "t": 504.40887, "r": 276.65152, "b": 512.9966400000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Tables organize valuable content in a concise and compact representation. This content is extremely valuable for systems such as search engines, Knowledge Graph's, etc, since they enhance their predictive capabilities. Unfortunately, tables come in a large variety of shapes and sizes. Furthermore, they can have complex column/row-header configurations, multiline rows, different variety of separation lines, missing entries, etc. As such, the correct identification of the table-structure from an image is a nontrivial task. In this paper, we present a new table-structure identification model. The latter improves the latest end-toend deep learning model (i.e. encoder-dual-decoder from PubTabNet) in two significant ways. First, we introduce a new object detection decoder for table-cells. In this way, we can obtain the content of the table-cells from programmatic PDF's directly from the PDF source and avoid the training of the custom OCR decoders. This architectural change leads to more accurate table-content extraction and allows us to tackle non-english tables. Second, we replace the LSTM decoders with transformer based decoders. This upgrade improves significantly the previous state-of-the-art tree-editing-distance-score (TEDS) from 91% to 98.5% on simple tables and from 88.7% to 95% on complex tables."}, {"label": "section_header", "id": 4, "page_no": 0, "cluster": {"id": 4, "label": "section_header", "bbox": {"l": 50.111977, "t": 539.94276, "r": 126.94804, "b": 550.69049, "coord_origin": "TOPLEFT"}, "confidence": 0.9317677617073059, "cells": [{"id": 32, "text": "1.", "bbox": {"l": 50.111977, "t": 539.94276, "r": 58.121296, "b": 550.69049, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "Introduction", "bbox": {"l": 68.800385, "t": 539.94276, "r": 126.94804, "b": 550.69049, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1. Introduction"}, {"label": "text", "id": 1, "page_no": 0, "cluster": {"id": 1, "label": "text", "bbox": {"l": 50.111977, "t": 560.7832, "r": 286.36508, "b": 713.151779, "coord_origin": "TOPLEFT"}, "confidence": 0.9841895699501038, "cells": [{"id": 34, "text": "The occurrence of tables in documents is ubiquitous.", "bbox": {"l": 62.066978, "t": 560.7832, "r": 286.36496, "b": 569.68976, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "They often summarise quantitative or factual data, which is", "bbox": {"l": 50.111977, "t": 572.7382, "r": 286.36508, "b": 581.64476, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "cumbersome to describe in verbose text but nevertheless ex-", "bbox": {"l": 50.111977, "t": 584.69321, "r": 286.36505, "b": 593.5997600000001, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "tremely valuable. Unfortunately, this compact representa-", "bbox": {"l": 50.111977, "t": 596.6492000000001, "r": 286.36505, "b": 605.55576, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "tion is often not easy to parse by machines. There are many", "bbox": {"l": 50.111977, "t": 608.6042, "r": 286.36505, "b": 617.51076, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "implicit conventions used to obtain a compact table repre-", "bbox": {"l": 50.111977, "t": 620.5592, "r": 286.36505, "b": 629.46576, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "sentation. For example, tables often have complex column-", "bbox": {"l": 50.111977, "t": 632.51421, "r": 286.36508, "b": 641.42076, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "and row-headers in order to reduce duplicated cell content.", "bbox": {"l": 50.111977, "t": 644.46921, "r": 286.36508, "b": 653.37576, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "Lines of different shapes and sizes are leveraged to separate", "bbox": {"l": 50.111977, "t": 656.42421, "r": 286.36502, "b": 665.33077, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "content or indicate a tree structure. Additionally, tables can", "bbox": {"l": 50.111977, "t": 668.3802000000001, "r": 286.36505, "b": 677.28677, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "also have empty/missing table-entries or multi-row textual", "bbox": {"l": 50.111977, "t": 680.33521, "r": 286.36505, "b": 689.2417800000001, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "table-entries. Fig. 1 shows a table which presents all these", "bbox": {"l": 50.111977, "t": 692.290207, "r": 286.36505, "b": 701.196777, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "issues.", "bbox": {"l": 50.111977, "t": 704.245209, "r": 76.403275, "b": 713.151779, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The occurrence of tables in documents is ubiquitous. They often summarise quantitative or factual data, which is cumbersome to describe in verbose text but nevertheless extremely valuable. Unfortunately, this compact representation is often not easy to parse by machines. There are many implicit conventions used to obtain a compact table representation. For example, tables often have complex columnand row-headers in order to reduce duplicated cell content. Lines of different shapes and sizes are leveraged to separate content or indicate a tree structure. Additionally, tables can also have empty/missing table-entries or multi-row textual table-entries. Fig. 1 shows a table which presents all these issues."}, {"label": "section_header", "id": 14, "page_no": 0, "cluster": {"id": 14, "label": "section_header", "bbox": {"l": 315.56702, "t": 218.00684, "r": 408.4407, "b": 226.75482, "coord_origin": "TOPLEFT"}, "confidence": 0.6724023818969727, "cells": [{"id": 47, "text": "a.", "bbox": {"l": 315.56702, "t": 218.00684, "r": 324.01007, "b": 226.75482, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Picture of a table:", "bbox": {"l": 328.2316, "t": 218.00684, "r": 408.4407, "b": 226.75482, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "a. Picture of a table:"}, {"label": "list_item", "id": 17, "page_no": 0, "cluster": {"id": 17, "label": "list_item", "bbox": {"l": 315.56702, "t": 313.69478999999995, "r": 486.40194999999994, "b": 333.2428, "coord_origin": "TOPLEFT"}, "confidence": 0.5549328923225403, "cells": [{"id": 49, "text": "b.", "bbox": {"l": 315.56702, "t": 313.69478999999995, "r": 325.05786, "b": 322.44281, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Red-annotation of bounding boxes,", "bbox": {"l": 329.80325, "t": 313.69478999999995, "r": 486.40194999999994, "b": 322.44281, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Blue-predictions by TableFormer", "bbox": {"l": 326.46252, "t": 324.49478, "r": 472.47411999999997, "b": 333.2428, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "b. Red-annotation of bounding boxes, Blue-predictions by TableFormer"}, {"label": "list_item", "id": 18, "page_no": 0, "cluster": {"id": 18, "label": "list_item", "bbox": {"l": 315.56702, "t": 420.1828, "r": 491.1912500000001, "b": 428.93082, "coord_origin": "TOPLEFT"}, "confidence": 0.5501358509063721, "cells": [{"id": 52, "text": "c.", "bbox": {"l": 315.56702, "t": 420.1828, "r": 324.81039, "b": 428.93082, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Structure predicted by TableFormer:", "bbox": {"l": 329.4321, "t": 420.1828, "r": 491.1912500000001, "b": 428.93082, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "c. Structure predicted by TableFormer:"}, {"label": "picture", "id": 10, "page_no": 0, "cluster": {"id": 10, "label": "picture", "bbox": {"l": 314.78173828125, "t": 338.0652770996094, "r": 539.1802978515625, "b": 410.0494384765625, "coord_origin": "TOPLEFT"}, "confidence": 0.8742761611938477, "cells": [{"id": 54, "text": "1", "bbox": {"l": 408.14752, "t": 342.82828, "r": 412.54001, "b": 351.61322, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "0", "bbox": {"l": 356.11011, "t": 341.57217, "r": 360.50259, "b": 350.35712, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "2", "bbox": {"l": 500.6777, "t": 340.93768, "r": 505.0701900000001, "b": 349.7226299999999, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "3", "bbox": {"l": 356.13382, "t": 351.74789, "r": 360.52631, "b": 360.53284, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "4", "bbox": {"l": 402.53992, "t": 355.8765, "r": 406.9324, "b": 364.66144, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "5", "bbox": {"l": 448.58178999999996, "t": 352.84018, "r": 452.97427, "b": 361.62512, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "6", "bbox": {"l": 491.65161000000006, "t": 353.70657, "r": 496.0441, "b": 362.49152, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "7", "bbox": {"l": 535.13843, "t": 353.33969, "r": 539.53088, "b": 362.12463, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "8", "bbox": {"l": 348.82822, "t": 387.09781, "r": 353.2207, "b": 395.88275, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "9", "bbox": {"l": 389.27151, "t": 375.37228, "r": 393.664, "b": 384.15723, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "10", "bbox": {"l": 442.67479999999995, "t": 375.64621, "r": 451.45889000000005, "b": 384.43115, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "11", "bbox": {"l": 477.4382299999999, "t": 375.534, "r": 485.90167, "b": 384.31894000000005, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "12", "bbox": {"l": 522.57263, "t": 375.64621, "r": 531.35669, "b": 384.43115, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "13", "bbox": {"l": 400.22992, "t": 387.11429, "r": 409.01401, "b": 395.89923, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "14", "bbox": {"l": 442.30792, "t": 386.98981000000003, "r": 451.0920100000001, "b": 395.77475000000004, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "15", "bbox": {"l": 478.21941999999996, "t": 387.37469, "r": 487.00351000000006, "b": 396.15964, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "16", "bbox": {"l": 523.2287, "t": 386.98981000000003, "r": 532.01276, "b": 395.77475000000004, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "1", "bbox": {"l": 411.57233, "t": 399.42477, "r": 415.96481, "b": 408.20972, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "7", "bbox": {"l": 415.96393, "t": 399.42477, "r": 420.35641, "b": 408.20972, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "18", "bbox": {"l": 442.30521, "t": 399.0371999999999, "r": 451.08929, "b": 407.82213999999993, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "19", "bbox": {"l": 478.77893, "t": 398.99639999999994, "r": 487.56302, "b": 407.78133999999994, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "20", "bbox": {"l": 523.97241, "t": 398.6114799999999, "r": 532.75647, "b": 407.39642, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "3", "bbox": {"l": 385.09399, "t": 357.76030999999995, "r": 391.09879, "b": 367.89072, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "2", "bbox": {"l": 333.43451, "t": 380.7265, "r": 339.4393, "b": 390.85689999999994, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "1", "bbox": {"l": 478.07210999999995, "t": 341.0368000000001, "r": 484.0769, "b": 351.16720999999995, "coord_origin": "TOPLEFT"}}], "children": [{"id": 19, "label": "text", "bbox": {"l": 408.14752, "t": 342.82828, "r": 412.54001, "b": 351.61322, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "1", "bbox": {"l": 408.14752, "t": 342.82828, "r": 412.54001, "b": 351.61322, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 356.11011, "t": 341.57217, "r": 360.50259, "b": 350.35712, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "0", "bbox": {"l": 356.11011, "t": 341.57217, "r": 360.50259, "b": 350.35712, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 500.6777, "t": 340.93768, "r": 505.0701900000001, "b": 349.7226299999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "2", "bbox": {"l": 500.6777, "t": 340.93768, "r": 505.0701900000001, "b": 349.7226299999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 356.13382, "t": 351.74789, "r": 360.52631, "b": 360.53284, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "3", "bbox": {"l": 356.13382, "t": 351.74789, "r": 360.52631, "b": 360.53284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 402.53992, "t": 355.8765, "r": 406.9324, "b": 364.66144, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "4", "bbox": {"l": 402.53992, "t": 355.8765, "r": 406.9324, "b": 364.66144, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 448.58178999999996, "t": 352.84018, "r": 452.97427, "b": 361.62512, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "5", "bbox": {"l": 448.58178999999996, "t": 352.84018, "r": 452.97427, "b": 361.62512, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 491.65161000000006, "t": 353.70657, "r": 496.0441, "b": 362.49152, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "6", "bbox": {"l": 491.65161000000006, "t": 353.70657, "r": 496.0441, "b": 362.49152, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 535.13843, "t": 353.33969, "r": 539.53088, "b": 362.12463, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "7", "bbox": {"l": 535.13843, "t": 353.33969, "r": 539.53088, "b": 362.12463, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 348.82822, "t": 387.09781, "r": 353.2207, "b": 395.88275, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "8", "bbox": {"l": 348.82822, "t": 387.09781, "r": 353.2207, "b": 395.88275, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 389.27151, "t": 375.37228, "r": 393.664, "b": 384.15723, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "9", "bbox": {"l": 389.27151, "t": 375.37228, "r": 393.664, "b": 384.15723, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 442.67479999999995, "t": 375.64621, "r": 451.45889000000005, "b": 384.43115, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "10", "bbox": {"l": 442.67479999999995, "t": 375.64621, "r": 451.45889000000005, "b": 384.43115, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 477.4382299999999, "t": 375.534, "r": 485.90167, "b": 384.31894000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "11", "bbox": {"l": 477.4382299999999, "t": 375.534, "r": 485.90167, "b": 384.31894000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 522.57263, "t": 375.64621, "r": 531.35669, "b": 384.43115, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "12", "bbox": {"l": 522.57263, "t": 375.64621, "r": 531.35669, "b": 384.43115, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 400.22992, "t": 387.11429, "r": 409.01401, "b": 395.89923, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "13", "bbox": {"l": 400.22992, "t": 387.11429, "r": 409.01401, "b": 395.89923, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 442.30792, "t": 386.98981000000003, "r": 451.0920100000001, "b": 395.77475000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "14", "bbox": {"l": 442.30792, "t": 386.98981000000003, "r": 451.0920100000001, "b": 395.77475000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 478.21941999999996, "t": 387.37469, "r": 487.00351000000006, "b": 396.15964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "15", "bbox": {"l": 478.21941999999996, "t": 387.37469, "r": 487.00351000000006, "b": 396.15964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 523.2287, "t": 386.98981000000003, "r": 532.01276, "b": 395.77475000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "16", "bbox": {"l": 523.2287, "t": 386.98981000000003, "r": 532.01276, "b": 395.77475000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 411.57233, "t": 399.42477, "r": 415.96481, "b": 408.20972, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "1", "bbox": {"l": 411.57233, "t": 399.42477, "r": 415.96481, "b": 408.20972, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 415.96393, "t": 399.42477, "r": 420.35641, "b": 408.20972, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "7", "bbox": {"l": 415.96393, "t": 399.42477, "r": 420.35641, "b": 408.20972, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 442.30521, "t": 399.0371999999999, "r": 451.08929, "b": 407.82213999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "18", "bbox": {"l": 442.30521, "t": 399.0371999999999, "r": 451.08929, "b": 407.82213999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 478.77893, "t": 398.99639999999994, "r": 487.56302, "b": 407.78133999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "19", "bbox": {"l": 478.77893, "t": 398.99639999999994, "r": 487.56302, "b": 407.78133999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 523.97241, "t": 398.6114799999999, "r": 532.75647, "b": 407.39642, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "20", "bbox": {"l": 523.97241, "t": 398.6114799999999, "r": 532.75647, "b": 407.39642, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 385.09399, "t": 357.76030999999995, "r": 391.09879, "b": 367.89072, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "3", "bbox": {"l": 385.09399, "t": 357.76030999999995, "r": 391.09879, "b": 367.89072, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 333.43451, "t": 380.7265, "r": 339.4393, "b": 390.85689999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "2", "bbox": {"l": 333.43451, "t": 380.7265, "r": 339.4393, "b": 390.85689999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 478.07210999999995, "t": 341.0368000000001, "r": 484.0769, "b": 351.16720999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": "1", "bbox": {"l": 478.07210999999995, "t": 341.0368000000001, "r": 484.0769, "b": 351.16720999999995, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "picture", "id": 23, "page_no": 0, "cluster": {"id": 23, "label": "picture", "bbox": {"l": 315.7172546386719, "t": 433.823486328125, "r": 536.835693359375, "b": 496.0290222167969, "coord_origin": "TOPLEFT"}, "confidence": 0.5088632702827454, "cells": [{"id": 76, "text": "1", "bbox": {"l": 347.24872, "t": 437.68588, "r": 351.6412, "b": 446.47083, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "0", "bbox": {"l": 318.88071, "t": 437.68588, "r": 323.27319, "b": 446.47083, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "2", "bbox": {"l": 394.10422, "t": 437.68588, "r": 398.4967, "b": 446.47083, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "3", "bbox": {"l": 318.77316, "t": 449.5455, "r": 323.16565, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "4", "bbox": {"l": 347.24872, "t": 449.5455, "r": 351.6412, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "5", "bbox": {"l": 394.10422, "t": 449.5455, "r": 398.4967, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "6", "bbox": {"l": 440.95941000000005, "t": 449.5455, "r": 445.3519, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "7", "bbox": {"l": 487.81491, "t": 449.5455, "r": 492.2074, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "8", "bbox": {"l": 318.77316, "t": 473.70425, "r": 323.16565, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "9", "bbox": {"l": 347.24872, "t": 461.8446, "r": 351.6412, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "10", "bbox": {"l": 394.10422, "t": 461.8446, "r": 402.88831, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "11", "bbox": {"l": 440.95941000000005, "t": 461.8446, "r": 449.42285, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "12", "bbox": {"l": 487.81491, "t": 461.8446, "r": 496.599, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "13", "bbox": {"l": 347.24872, "t": 473.70425, "r": 356.03281, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "14", "bbox": {"l": 394.10422, "t": 473.70425, "r": 402.88831, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "15", "bbox": {"l": 440.95941000000005, "t": 473.70425, "r": 449.7435, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "16", "bbox": {"l": 487.81491, "t": 473.70425, "r": 496.599, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "17", "bbox": {"l": 347.24872, "t": 485.12469, "r": 356.03281, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "18", "bbox": {"l": 394.10422, "t": 485.12469, "r": 402.88831, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "19", "bbox": {"l": 440.95941000000005, "t": 485.12469, "r": 449.7435, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "20", "bbox": {"l": 487.81491, "t": 485.12469, "r": 496.599, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "3", "bbox": {"l": 366.70102, "t": 449.12082, "r": 372.70581, "b": 459.25122, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "2", "bbox": {"l": 331.90424, "t": 473.32291, "r": 337.90903, "b": 483.45331, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "1", "bbox": {"l": 459.87621999999993, "t": 437.5936, "r": 465.88101, "b": 447.724, "coord_origin": "TOPLEFT"}}], "children": [{"id": 41, "label": "text", "bbox": {"l": 347.24872, "t": 437.68588, "r": 351.6412, "b": 446.47083, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "1", "bbox": {"l": 347.24872, "t": 437.68588, "r": 351.6412, "b": 446.47083, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 318.88071, "t": 437.68588, "r": 323.27319, "b": 446.47083, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "0", "bbox": {"l": 318.88071, "t": 437.68588, "r": 323.27319, "b": 446.47083, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 394.10422, "t": 437.68588, "r": 398.4967, "b": 446.47083, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "2", "bbox": {"l": 394.10422, "t": 437.68588, "r": 398.4967, "b": 446.47083, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 318.77316, "t": 449.5455, "r": 323.16565, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "3", "bbox": {"l": 318.77316, "t": 449.5455, "r": 323.16565, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 347.24872, "t": 449.5455, "r": 351.6412, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "4", "bbox": {"l": 347.24872, "t": 449.5455, "r": 351.6412, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 394.10422, "t": 449.5455, "r": 398.4967, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "5", "bbox": {"l": 394.10422, "t": 449.5455, "r": 398.4967, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 440.95941000000005, "t": 449.5455, "r": 445.3519, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "6", "bbox": {"l": 440.95941000000005, "t": 449.5455, "r": 445.3519, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 487.81491, "t": 449.5455, "r": 492.2074, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "7", "bbox": {"l": 487.81491, "t": 449.5455, "r": 492.2074, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 318.77316, "t": 473.70425, "r": 323.16565, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "8", "bbox": {"l": 318.77316, "t": 473.70425, "r": 323.16565, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 347.24872, "t": 461.8446, "r": 351.6412, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "9", "bbox": {"l": 347.24872, "t": 461.8446, "r": 351.6412, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 394.10422, "t": 461.8446, "r": 402.88831, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "10", "bbox": {"l": 394.10422, "t": 461.8446, "r": 402.88831, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 440.95941000000005, "t": 461.8446, "r": 449.42285, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "11", "bbox": {"l": 440.95941000000005, "t": 461.8446, "r": 449.42285, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 487.81491, "t": 461.8446, "r": 496.599, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "12", "bbox": {"l": 487.81491, "t": 461.8446, "r": 496.599, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 347.24872, "t": 473.70425, "r": 356.03281, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "13", "bbox": {"l": 347.24872, "t": 473.70425, "r": 356.03281, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 394.10422, "t": 473.70425, "r": 402.88831, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "14", "bbox": {"l": 394.10422, "t": 473.70425, "r": 402.88831, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 440.95941000000005, "t": 473.70425, "r": 449.7435, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "15", "bbox": {"l": 440.95941000000005, "t": 473.70425, "r": 449.7435, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 487.81491, "t": 473.70425, "r": 496.599, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "16", "bbox": {"l": 487.81491, "t": 473.70425, "r": 496.599, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 347.24872, "t": 485.12469, "r": 356.03281, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "17", "bbox": {"l": 347.24872, "t": 485.12469, "r": 356.03281, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 394.10422, "t": 485.12469, "r": 402.88831, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "18", "bbox": {"l": 394.10422, "t": 485.12469, "r": 402.88831, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 440.95941000000005, "t": 485.12469, "r": 449.7435, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "19", "bbox": {"l": 440.95941000000005, "t": 485.12469, "r": 449.7435, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 487.81491, "t": 485.12469, "r": 496.599, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "20", "bbox": {"l": 487.81491, "t": 485.12469, "r": 496.599, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 366.70102, "t": 449.12082, "r": 372.70581, "b": 459.25122, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "3", "bbox": {"l": 366.70102, "t": 449.12082, "r": 372.70581, "b": 459.25122, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 331.90424, "t": 473.32291, "r": 337.90903, "b": 483.45331, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "2", "bbox": {"l": 331.90424, "t": 473.32291, "r": 337.90903, "b": 483.45331, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 459.87621999999993, "t": 437.5936, "r": 465.88101, "b": 447.724, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "1", "bbox": {"l": 459.87621999999993, "t": 437.5936, "r": 465.88101, "b": 447.724, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "table", "id": 11, "page_no": 0, "cluster": {"id": 11, "label": "table", "bbox": {"l": 315.7172546386719, "t": 433.823486328125, "r": 536.835693359375, "b": 496.0290222167969, "coord_origin": "TOPLEFT"}, "confidence": 0.8056110739707947, "cells": [{"id": 76, "text": "1", "bbox": {"l": 347.24872, "t": 437.68588, "r": 351.6412, "b": 446.47083, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "0", "bbox": {"l": 318.88071, "t": 437.68588, "r": 323.27319, "b": 446.47083, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "2", "bbox": {"l": 394.10422, "t": 437.68588, "r": 398.4967, "b": 446.47083, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "3", "bbox": {"l": 318.77316, "t": 449.5455, "r": 323.16565, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "4", "bbox": {"l": 347.24872, "t": 449.5455, "r": 351.6412, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "5", "bbox": {"l": 394.10422, "t": 449.5455, "r": 398.4967, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "6", "bbox": {"l": 440.95941000000005, "t": 449.5455, "r": 445.3519, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "7", "bbox": {"l": 487.81491, "t": 449.5455, "r": 492.2074, "b": 458.33044, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "8", "bbox": {"l": 318.77316, "t": 473.70425, "r": 323.16565, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "9", "bbox": {"l": 347.24872, "t": 461.8446, "r": 351.6412, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "10", "bbox": {"l": 394.10422, "t": 461.8446, "r": 402.88831, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "11", "bbox": {"l": 440.95941000000005, "t": 461.8446, "r": 449.42285, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "12", "bbox": {"l": 487.81491, "t": 461.8446, "r": 496.599, "b": 470.62955, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "13", "bbox": {"l": 347.24872, "t": 473.70425, "r": 356.03281, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "14", "bbox": {"l": 394.10422, "t": 473.70425, "r": 402.88831, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "15", "bbox": {"l": 440.95941000000005, "t": 473.70425, "r": 449.7435, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "16", "bbox": {"l": 487.81491, "t": 473.70425, "r": 496.599, "b": 482.4892, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "17", "bbox": {"l": 347.24872, "t": 485.12469, "r": 356.03281, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "18", "bbox": {"l": 394.10422, "t": 485.12469, "r": 402.88831, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "19", "bbox": {"l": 440.95941000000005, "t": 485.12469, "r": 449.7435, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "20", "bbox": {"l": 487.81491, "t": 485.12469, "r": 496.599, "b": 493.90964, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "3", "bbox": {"l": 366.70102, "t": 449.12082, "r": 372.70581, "b": 459.25122, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "2", "bbox": {"l": 331.90424, "t": 473.32291, "r": 337.90903, "b": 483.45331, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "1", "bbox": {"l": 459.87621999999993, "t": 437.5936, "r": 465.88101, "b": 447.724, "coord_origin": "TOPLEFT"}}], "children": [{"id": 41, "label": "text", "bbox": {"l": 347.24872, "t": 437.68588, "r": 351.6412, "b": 446.47083, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "1", "bbox": {"l": 347.24872, "t": 437.68588, "r": 351.6412, "b": 446.47083, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 318.88071, "t": 437.68588, "r": 323.27319, "b": 446.47083, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "0", "bbox": {"l": 318.88071, "t": 437.68588, "r": 323.27319, "b": 446.47083, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 394.10422, "t": 437.68588, "r": 398.4967, "b": 446.47083, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "2", "bbox": {"l": 394.10422, "t": 437.68588, "r": 398.4967, "b": 446.47083, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 318.77316, "t": 449.5455, "r": 323.16565, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "3", "bbox": {"l": 318.77316, "t": 449.5455, "r": 323.16565, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 347.24872, "t": 449.5455, "r": 351.6412, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "4", "bbox": {"l": 347.24872, "t": 449.5455, "r": 351.6412, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 394.10422, "t": 449.5455, "r": 398.4967, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "5", "bbox": {"l": 394.10422, "t": 449.5455, "r": 398.4967, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 440.95941000000005, "t": 449.5455, "r": 445.3519, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "6", "bbox": {"l": 440.95941000000005, "t": 449.5455, "r": 445.3519, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 487.81491, "t": 449.5455, "r": 492.2074, "b": 458.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "7", "bbox": {"l": 487.81491, "t": 449.5455, "r": 492.2074, "b": 458.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 318.77316, "t": 473.70425, "r": 323.16565, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "8", "bbox": {"l": 318.77316, "t": 473.70425, "r": 323.16565, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 347.24872, "t": 461.8446, "r": 351.6412, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "9", "bbox": {"l": 347.24872, "t": 461.8446, "r": 351.6412, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 394.10422, "t": 461.8446, "r": 402.88831, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "10", "bbox": {"l": 394.10422, "t": 461.8446, "r": 402.88831, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 440.95941000000005, "t": 461.8446, "r": 449.42285, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "11", "bbox": {"l": 440.95941000000005, "t": 461.8446, "r": 449.42285, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 487.81491, "t": 461.8446, "r": 496.599, "b": 470.62955, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "12", "bbox": {"l": 487.81491, "t": 461.8446, "r": 496.599, "b": 470.62955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 347.24872, "t": 473.70425, "r": 356.03281, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "13", "bbox": {"l": 347.24872, "t": 473.70425, "r": 356.03281, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 394.10422, "t": 473.70425, "r": 402.88831, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "14", "bbox": {"l": 394.10422, "t": 473.70425, "r": 402.88831, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 440.95941000000005, "t": 473.70425, "r": 449.7435, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "15", "bbox": {"l": 440.95941000000005, "t": 473.70425, "r": 449.7435, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 487.81491, "t": 473.70425, "r": 496.599, "b": 482.4892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "16", "bbox": {"l": 487.81491, "t": 473.70425, "r": 496.599, "b": 482.4892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 347.24872, "t": 485.12469, "r": 356.03281, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "17", "bbox": {"l": 347.24872, "t": 485.12469, "r": 356.03281, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 394.10422, "t": 485.12469, "r": 402.88831, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "18", "bbox": {"l": 394.10422, "t": 485.12469, "r": 402.88831, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 440.95941000000005, "t": 485.12469, "r": 449.7435, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "19", "bbox": {"l": 440.95941000000005, "t": 485.12469, "r": 449.7435, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 487.81491, "t": 485.12469, "r": 496.599, "b": 493.90964, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "20", "bbox": {"l": 487.81491, "t": 485.12469, "r": 496.599, "b": 493.90964, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 366.70102, "t": 449.12082, "r": 372.70581, "b": 459.25122, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "3", "bbox": {"l": 366.70102, "t": 449.12082, "r": 372.70581, "b": 459.25122, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 331.90424, "t": 473.32291, "r": 337.90903, "b": 483.45331, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "2", "bbox": {"l": 331.90424, "t": 473.32291, "r": 337.90903, "b": 483.45331, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 459.87621999999993, "t": 437.5936, "r": 465.88101, "b": 447.724, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "1", "bbox": {"l": 459.87621999999993, "t": 437.5936, "r": 465.88101, "b": 447.724, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "lcel", "ched", "lcel", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "ucel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "ucel", "nl"], "num_rows": 5, "num_cols": 6, "table_cells": [{"bbox": {"l": 347.24872, "t": 437.68588, "r": 351.6412, "b": 446.47083, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 3, "text": "1", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 318.88071, "t": 437.68588, "r": 323.27319, "b": 446.47083, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "0", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 394.10422, "t": 437.5936, "r": 465.88101, "b": 447.724, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 5, "text": "2 1", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 318.77316, "t": 449.5455, "r": 323.16565, "b": 458.33044, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 347.24872, "t": 449.5455, "r": 351.6412, "b": 458.33044, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 366.70102, "t": 449.12082, "r": 398.4967, "b": 459.25122, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "5 3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.95941000000005, "t": 449.5455, "r": 445.3519, "b": 458.33044, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.81491, "t": 449.5455, "r": 492.2074, "b": 458.33044, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 318.77316, "t": 473.70425, "r": 323.16565, "b": 482.4892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 347.24872, "t": 461.8446, "r": 351.6412, "b": 470.62955, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.10422, "t": 461.8446, "r": 402.88831, "b": 470.62955, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "10", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.95941000000005, "t": 461.8446, "r": 449.42285, "b": 470.62955, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "11", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.81491, "t": 461.8446, "r": 496.599, "b": 470.62955, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "12", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 347.24872, "t": 473.70425, "r": 356.03281, "b": 482.4892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "13", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.10422, "t": 473.70425, "r": 402.88831, "b": 482.4892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "14", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.95941000000005, "t": 473.70425, "r": 449.7435, "b": 482.4892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "15", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.81491, "t": 473.70425, "r": 496.599, "b": 482.4892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "16", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 347.24872, "t": 485.12469, "r": 356.03281, "b": 493.90964, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "17", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.10422, "t": 485.12469, "r": 402.88831, "b": 493.90964, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "18", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.95941000000005, "t": 485.12469, "r": 449.7435, "b": 493.90964, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "19", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.81491, "t": 485.12469, "r": 496.599, "b": 493.90964, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "20", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 331.90424, "t": 473.32291, "r": 337.90903, "b": 483.45331, "coord_origin": "TOPLEFT"}, "row_span": 3, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "2", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "picture", "id": 16, "page_no": 0, "cluster": {"id": 16, "label": "picture", "bbox": {"l": 315.65362548828125, "t": 228.723388671875, "r": 537.1475219726562, "b": 302.8014221191406, "coord_origin": "TOPLEFT"}, "confidence": 0.608779788017273, "cells": [{"id": 97, "text": "1", "bbox": {"l": 451.9457100000001, "t": 235.34704999999997, "r": 457.95050000000003, "b": 245.47748, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "2", "bbox": {"l": 331.19681, "t": 269.35266, "r": 337.2016, "b": 279.48308999999995, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "3", "bbox": {"l": 384.0329, "t": 252.67895999999996, "r": 390.03769, "b": 262.80939, "coord_origin": "TOPLEFT"}}], "children": [{"id": 62, "label": "text", "bbox": {"l": 451.9457100000001, "t": 235.34704999999997, "r": 457.95050000000003, "b": 245.47748, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "1", "bbox": {"l": 451.9457100000001, "t": 235.34704999999997, "r": 457.95050000000003, "b": 245.47748, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 331.19681, "t": 269.35266, "r": 337.2016, "b": 279.48308999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "2", "bbox": {"l": 331.19681, "t": 269.35266, "r": 337.2016, "b": 279.48308999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 384.0329, "t": 252.67895999999996, "r": 390.03769, "b": 262.80939, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "3", "bbox": {"l": 384.0329, "t": 252.67895999999996, "r": 390.03769, "b": 262.80939, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "table", "id": 15, "page_no": 0, "cluster": {"id": 15, "label": "table", "bbox": {"l": 315.65362548828125, "t": 228.723388671875, "r": 537.1475219726562, "b": 302.8014221191406, "coord_origin": "TOPLEFT"}, "confidence": 0.6515864729881287, "cells": [{"id": 97, "text": "1", "bbox": {"l": 451.9457100000001, "t": 235.34704999999997, "r": 457.95050000000003, "b": 245.47748, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "2", "bbox": {"l": 331.19681, "t": 269.35266, "r": 337.2016, "b": 279.48308999999995, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "3", "bbox": {"l": 384.0329, "t": 252.67895999999996, "r": 390.03769, "b": 262.80939, "coord_origin": "TOPLEFT"}}], "children": [{"id": 62, "label": "text", "bbox": {"l": 451.9457100000001, "t": 235.34704999999997, "r": 457.95050000000003, "b": 245.47748, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "1", "bbox": {"l": 451.9457100000001, "t": 235.34704999999997, "r": 457.95050000000003, "b": 245.47748, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 331.19681, "t": 269.35266, "r": 337.2016, "b": 279.48308999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "2", "bbox": {"l": 331.19681, "t": 269.35266, "r": 337.2016, "b": 279.48308999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 384.0329, "t": 252.67895999999996, "r": 390.03769, "b": 262.80939, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "3", "bbox": {"l": 384.0329, "t": 252.67895999999996, "r": 390.03769, "b": 262.80939, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ecel", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "ucel", "fcel", "fcel", "fcel", "fcel", "nl", "ucel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 1, "num_cols": 2, "table_cells": [{"bbox": {"l": 451.9457100000001, "t": 235.34704999999997, "r": 457.95050000000003, "b": 245.47748, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "1", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 384.0329, "t": 252.67895999999996, "r": 390.03769, "b": 262.80939, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3", "column_header": true, "row_header": false, "row_section": false}]}, {"label": "caption", "id": 6, "page_no": 0, "cluster": {"id": 6, "label": "caption", "bbox": {"l": 308.862, "t": 514.50037, "r": 545.11517, "b": 559.2729, "coord_origin": "TOPLEFT"}, "confidence": 0.9214619398117065, "cells": [{"id": 106, "text": "Figure 1:", "bbox": {"l": 308.862, "t": 514.50037, "r": 345.73361, "b": 523.40692, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "Picture of a table with subtle, complex features", "bbox": {"l": 353.17566, "t": 514.50037, "r": 545.11511, "b": 523.40692, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "such as (1) multi-column headers, (2) cell with multi-row", "bbox": {"l": 308.862, "t": 526.45535, "r": 545.11511, "b": 535.3619100000001, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "text and (3) cells with no content. Image from PubTabNet", "bbox": {"l": 308.862, "t": 538.41035, "r": 545.11517, "b": 547.31691, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "evaluation set, filename: \u2018PMC2944238 004 02\u2019.", "bbox": {"l": 308.862, "t": 550.36635, "r": 505.6917700000001, "b": 559.2729, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 1: Picture of a table with subtle, complex features such as (1) multi-column headers, (2) cell with multi-row text and (3) cells with no content. Image from PubTabNet evaluation set, filename: 'PMC2944238 004 02'."}, {"label": "text", "id": 0, "page_no": 0, "cluster": {"id": 0, "label": "text", "bbox": {"l": 308.862, "t": 584.40936, "r": 545.11517, "b": 665.04693, "coord_origin": "TOPLEFT"}, "confidence": 0.9848759770393372, "cells": [{"id": 111, "text": "Recently, significant progress has been made with vi-", "bbox": {"l": 320.81699, "t": 584.40936, "r": 545.11493, "b": 593.31592, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "sion based approaches to extract tables in documents. For", "bbox": {"l": 308.862, "t": 596.36436, "r": 545.11517, "b": 605.2709199999999, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "the sake of completeness, the issue of table extraction from", "bbox": {"l": 308.862, "t": 608.31937, "r": 545.11511, "b": 617.22592, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "documents is typically decomposed into two separate chal-", "bbox": {"l": 308.862, "t": 620.27437, "r": 545.11505, "b": 629.18092, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "lenges, i.e.", "bbox": {"l": 308.862, "t": 632.23036, "r": 353.6937, "b": 641.13692, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "(1)", "bbox": {"l": 362.11209, "t": 632.23036, "r": 374.66617, "b": 641.13692, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "finding the location of the table(s) on a", "bbox": {"l": 377.35785, "t": 632.23036, "r": 545.11505, "b": 641.13692, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "document-page and (2) finding the structure of a given table", "bbox": {"l": 308.862, "t": 644.18536, "r": 545.11517, "b": 653.09192, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "in the document.", "bbox": {"l": 308.862, "t": 656.14037, "r": 375.55167, "b": 665.04693, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Recently, significant progress has been made with vision based approaches to extract tables in documents. For the sake of completeness, the issue of table extraction from documents is typically decomposed into two separate challenges, i.e. (1) finding the location of the table(s) on a document-page and (2) finding the structure of a given table in the document."}, {"label": "text", "id": 3, "page_no": 0, "cluster": {"id": 3, "label": "text", "bbox": {"l": 308.862, "t": 668.38036, "r": 545.11511, "b": 713.151932, "coord_origin": "TOPLEFT"}, "confidence": 0.979152262210846, "cells": [{"id": 120, "text": "The first problem is called table-location and has been", "bbox": {"l": 320.81699, "t": 668.38036, "r": 545.11493, "b": 677.28693, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "previously addressed [30, 38, 19, 21, 23, 26, 8] with state-", "bbox": {"l": 308.862, "t": 680.33536, "r": 545.11511, "b": 689.24193, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "of-the-art object-detection networks (e.g. YOLO and later", "bbox": {"l": 308.862, "t": 692.290359, "r": 545.11511, "b": 701.19693, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "on Mask-RCNN [9]). For all practical purposes, it can be", "bbox": {"l": 308.862, "t": 704.245361, "r": 545.11499, "b": 713.151932, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The first problem is called table-location and has been previously addressed [30, 38, 19, 21, 23, 26, 8] with stateof-the-art object-detection networks (e.g. YOLO and later on Mask-RCNN [9]). For all practical purposes, it can be"}], "headers": [{"label": "page_footer", "id": 12, "page_no": 0, "cluster": {"id": 12, "label": "page_footer", "bbox": {"l": 295.121, "t": 734.133366, "r": 300.10229, "b": 743.039928, "coord_origin": "TOPLEFT"}, "confidence": 0.8045893311500549, "cells": [{"id": 124, "text": "1", "bbox": {"l": 295.121, "t": 734.133366, "r": 300.10229, "b": 743.039928, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1"}, {"label": "page_header", "id": 9, "page_no": 0, "cluster": {"id": 9, "label": "page_header", "bbox": {"l": 18.340221, "t": 207.82001000000002, "r": 36.339779, "b": 560.00003, "coord_origin": "TOPLEFT"}, "confidence": 0.8773143887519836, "cells": [{"id": 125, "text": "arXiv:2203.01017v2 [cs.CV] 11 Mar 2022", "bbox": {"l": 18.340221, "t": 207.82001000000002, "r": 36.339779, "b": 560.00003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "arXiv:2203.01017v2 [cs.CV] 11 Mar 2022"}]}}, {"page_no": 1, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "considered as a solved problem, given enough ground-truth", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 286.36505, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "data to train on.", "bbox": {"l": 50.112, "t": 87.16339000000005, "r": 112.64721999999999, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "The second problem is called table-structure decompo-", "bbox": {"l": 62.067001, "t": 99.57141000000001, "r": 286.36496, "b": 108.47797000000003, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "sition.", "bbox": {"l": 50.112, "t": 111.52643, "r": 74.749512, "b": 120.43297999999993, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "The latter is a long standing problem in the com-", "bbox": {"l": 81.334793, "t": 111.52643, "r": 286.36514, "b": 120.43297999999993, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "munity of document understanding [6, 4, 14]. Contrary to", "bbox": {"l": 50.112, "t": 123.48145, "r": 286.36511, "b": 132.38800000000003, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "the table-location problem, there are no commonly used ap-", "bbox": {"l": 50.112, "t": 135.43646, "r": 286.36511, "b": 144.34302000000002, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "proaches that can easily be re-purposed to solve this prob-", "bbox": {"l": 50.112, "t": 147.39246000000003, "r": 286.36505, "b": 156.29900999999995, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "lem. Lately, a set of new model-architectures has been pro-", "bbox": {"l": 50.112, "t": 159.34747000000004, "r": 286.36511, "b": 168.25402999999994, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "posed by the community to address table-structure decom-", "bbox": {"l": 50.112, "t": 171.30249000000003, "r": 286.36508, "b": 180.20905000000005, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "position [37, 36, 18, 20]. All these models have some weak-", "bbox": {"l": 50.112, "t": 183.25751000000002, "r": 286.36511, "b": 192.16405999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "nesses (see Sec. 2). The common denominator here is the", "bbox": {"l": 50.112, "t": 195.21252000000004, "r": 286.36508, "b": 204.11908000000005, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "reliance on textual features and/or the inability to provide", "bbox": {"l": 50.112, "t": 207.16754000000003, "r": 286.36514, "b": 216.07410000000004, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "the bounding box of each table-cell in the original image.", "bbox": {"l": 50.112, "t": 219.12354000000005, "r": 278.66397, "b": 228.03008999999997, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "In this paper, we want to address these weaknesses and", "bbox": {"l": 62.067001, "t": 231.53156, "r": 286.36493, "b": 240.43811000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "present a robust table-structure decomposition algorithm.", "bbox": {"l": 50.112, "t": 243.48657000000003, "r": 286.36511, "b": 252.39313000000004, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "The design criteria for our model are the following. First,", "bbox": {"l": 50.112, "t": 255.44159000000002, "r": 286.36511, "b": 264.34813999999994, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "we want our algorithm to be language agnostic. In this way,", "bbox": {"l": 50.112, "t": 267.39661, "r": 286.36502, "b": 276.30316000000005, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "we can obtain the structure of any table, irregardless of the", "bbox": {"l": 50.112, "t": 279.35155999999995, "r": 286.36508, "b": 288.25815, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "language.", "bbox": {"l": 50.112, "t": 291.30759, "r": 88.567635, "b": 300.21414, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Second, we want our algorithm to leverage as", "bbox": {"l": 95.501602, "t": 291.30759, "r": 286.36505, "b": 300.21414, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "much data as possible from the original PDF document. For", "bbox": {"l": 50.112, "t": 303.26257, "r": 286.36508, "b": 312.16913, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "programmatic PDF documents, the text-cells can often be", "bbox": {"l": 50.112, "t": 315.21756, "r": 286.36511, "b": 324.12411, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "extracted much faster and with higher accuracy compared", "bbox": {"l": 50.112, "t": 327.17255, "r": 286.36505, "b": 336.0791, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "to OCR methods. Last but not least, we want to have a di-", "bbox": {"l": 50.112, "t": 339.12753, "r": 286.36511, "b": 348.03409, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "rect link between the table-cell and its bounding box in the", "bbox": {"l": 50.112, "t": 351.08353, "r": 286.36508, "b": 359.99008, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "image.", "bbox": {"l": 50.112, "t": 363.03851, "r": 76.951241, "b": 371.94507, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "To meet the design criteria listed above, we developed a", "bbox": {"l": 62.067001, "t": 375.4465, "r": 286.36499, "b": 384.35306, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "new model called", "bbox": {"l": 50.112, "t": 387.40149, "r": 120.98594, "b": 396.30804, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "TableFormer", "bbox": {"l": 123.901, "t": 387.28192, "r": 179.7314, "b": 396.23830999999996, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "and a synthetically gener-", "bbox": {"l": 182.646, "t": 387.40149, "r": 286.36658, "b": 396.30804, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "ated table structure dataset called", "bbox": {"l": 50.112, "t": 399.35648, "r": 181.75778, "b": 408.26302999999996, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "SynthTabNet", "bbox": {"l": 184.104, "t": 399.23690999999997, "r": 240.2034, "b": 408.1933, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "$^{1}$. In partic-", "bbox": {"l": 240.20401, "t": 399.35648, "r": 286.36069, "b": 408.26302999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "ular, our contributions in this work can be summarised as", "bbox": {"l": 50.112015, "t": 411.31146, "r": 286.36511, "b": 420.21802, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "follows:", "bbox": {"l": 50.112015, "t": 423.26645, "r": 82.520355, "b": 432.173, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "\u2022", "bbox": {"l": 61.569016, "t": 444.55145, "r": 70.741714, "b": 453.45801, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "We propose", "bbox": {"l": 73.034889, "t": 444.55145, "r": 117.10054, "b": 453.45801, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "TableFormer", "bbox": {"l": 119.59001, "t": 444.43188, "r": 175.42041, "b": 453.38828, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": ", a transformer based model", "bbox": {"l": 175.42102, "t": 444.55145, "r": 286.36453, "b": 453.45801, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "that predicts tables structure and bounding boxes for", "bbox": {"l": 70.037018, "t": 456.50644000000005, "r": 286.3649, "b": 465.41299, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "the table content simultaneously in an end-to-end ap-", "bbox": {"l": 70.037018, "t": 468.46143, "r": 286.3649, "b": 477.36798, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "proach.", "bbox": {"l": 70.037018, "t": 480.41641, "r": 99.635902, "b": 489.32297, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "\u2022", "bbox": {"l": 61.569016, "t": 502.15341, "r": 71.619438, "b": 511.05997, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "Across all benchmark datasets", "bbox": {"l": 74.132042, "t": 502.15341, "r": 196.10396, "b": 511.05997, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "TableFormer", "bbox": {"l": 200.31001, "t": 502.03384, "r": 256.14041, "b": 510.99023, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "signif-", "bbox": {"l": 260.35001, "t": 502.15341, "r": 286.36237, "b": 511.05997, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "icantly outperforms existing state-of-the-art metrics,", "bbox": {"l": 70.037003, "t": 514.1084000000001, "r": 286.3649, "b": 523.01495, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "while being much more efficient in training and infer-", "bbox": {"l": 70.037003, "t": 526.06439, "r": 286.36487, "b": 534.97095, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "ence to existing works.", "bbox": {"l": 70.037003, "t": 538.0193899999999, "r": 161.65305, "b": 546.9259500000001, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "\u2022", "bbox": {"l": 61.569, "t": 559.75639, "r": 71.115913, "b": 568.66295, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "We present", "bbox": {"l": 73.502647, "t": 559.75639, "r": 116.71199, "b": 568.66295, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "SynthTabNet", "bbox": {"l": 121.583, "t": 559.63684, "r": 177.68239, "b": 568.59322, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "a synthetically generated", "bbox": {"l": 182.55301, "t": 559.75639, "r": 286.36328, "b": 568.66295, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "dataset, with various appearance styles and complex-", "bbox": {"l": 70.03701, "t": 571.7114, "r": 286.36493, "b": 580.6179500000001, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "ity.", "bbox": {"l": 70.03701, "t": 583.6664000000001, "r": 82.400597, "b": 592.57295, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "\u2022", "bbox": {"l": 61.569008000000004, "t": 605.4034, "r": 72.332527, "b": 614.30995, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "An augmented dataset based on PubTabNet [37],", "bbox": {"l": 75.023399, "t": 605.4034, "r": 286.36508, "b": 614.30995, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "FinTabNet [36], and TableBank [17] with generated", "bbox": {"l": 70.03701, "t": 617.3584, "r": 286.36487, "b": 626.26495, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "ground-truth for reproducibility.", "bbox": {"l": 70.03701, "t": 629.31439, "r": 198.05641, "b": 638.22095, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "The paper is structured as follows. In Sec. 2, we give", "bbox": {"l": 62.067009000000006, "t": 650.59839, "r": 286.36496, "b": 659.50494, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "a brief overview of the current state-of-the-art. In Sec. 3,", "bbox": {"l": 50.112007, "t": 662.55339, "r": 286.36511, "b": 671.45995, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "we describe the datasets on which we train. In Sec. 4, we", "bbox": {"l": 50.112007, "t": 674.50839, "r": 286.36511, "b": 683.41496, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "introduce the TableFormer model-architecture and describe", "bbox": {"l": 50.112007, "t": 686.46339, "r": 286.36511, "b": 695.369957, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "$^{1}$https://github.com/IBM/SynthTabNet", "bbox": {"l": 60.97100100000001, "t": 705.596275, "r": 183.73055, "b": 712.721542, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "its results & performance in Sec. 5. As a conclusion, we de-", "bbox": {"l": 308.862, "t": 75.20836999999995, "r": 545.11511, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "scribe how this new model-architecture can be re-purposed", "bbox": {"l": 308.862, "t": 87.16339000000005, "r": 545.11505, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "for other tasks in the computer-vision community.", "bbox": {"l": 308.862, "t": 99.11841000000004, "r": 508.08417000000003, "b": 108.02495999999985, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "2.", "bbox": {"l": 308.862, "t": 121.73193000000003, "r": 315.5831, "b": 132.47968000000003, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "Previous work and State of the Art", "bbox": {"l": 324.54456, "t": 121.73193000000003, "r": 498.28021, "b": 132.47968000000003, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "Identifying the structure of a table has been an outstand-", "bbox": {"l": 320.81699, "t": 142.22136999999998, "r": 545.11493, "b": 151.12793, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "ing problem in the document-parsing community, that mo-", "bbox": {"l": 308.862, "t": 154.17638999999997, "r": 545.11505, "b": 163.08294999999998, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "tivates many organised public challenges [6, 4, 14].", "bbox": {"l": 308.862, "t": 166.13140999999996, "r": 522.55975, "b": 175.03796, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "The", "bbox": {"l": 529.62323, "t": 166.13140999999996, "r": 545.11505, "b": 175.03796, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "difficulty of the problem can be attributed to a number of", "bbox": {"l": 308.862, "t": 178.08642999999995, "r": 545.11517, "b": 186.99298, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "factors. First, there is a large variety in the shapes and sizes", "bbox": {"l": 308.862, "t": 190.04143999999997, "r": 545.11511, "b": 198.94799999999998, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "of tables.", "bbox": {"l": 308.862, "t": 201.99645999999996, "r": 346.97891, "b": 210.90301999999997, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "Such large variety requires a flexible method.", "bbox": {"l": 354.86929, "t": 201.99645999999996, "r": 545.11511, "b": 210.90301999999997, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "This is especially true for complex column- and row head-", "bbox": {"l": 308.862, "t": 213.95245, "r": 545.11505, "b": 222.85901, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "ers, which can be extremely intricate and demanding.", "bbox": {"l": 308.862, "t": 225.90747, "r": 530.9184, "b": 234.81403, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "A", "bbox": {"l": 537.92212, "t": 225.90747, "r": 545.11511, "b": 234.81403, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "second factor of complexity is the lack of data with regard", "bbox": {"l": 308.862, "t": 237.86248999999998, "r": 545.11517, "b": 246.76904000000002, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "to table-structure. Until the publication of PubTabNet [37],", "bbox": {"l": 308.862, "t": 249.8175, "r": 545.11511, "b": 258.72406, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "there were no large datasets (i.e.", "bbox": {"l": 308.862, "t": 261.77252, "r": 439.8402699999999, "b": 270.67908, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": ">", "bbox": {"l": 444.43999999999994, "t": 261.61310000000003, "r": 452.1889, "b": 270.45989999999995, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "100", "bbox": {"l": 455.89001, "t": 261.61310000000003, "r": 470.83392000000003, "b": 270.45989999999995, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "K tables) that pro-", "bbox": {"l": 470.83401, "t": 261.77252, "r": 545.11517, "b": 270.67908, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "vided structure information. This happens primarily due to", "bbox": {"l": 308.862, "t": 273.72748, "r": 545.11511, "b": 282.63406, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "the fact that tables are notoriously time-consuming to an-", "bbox": {"l": 308.862, "t": 285.6835, "r": 545.11511, "b": 294.59006, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "notate by hand. However, this has definitely changed in re-", "bbox": {"l": 308.862, "t": 297.63849, "r": 545.11511, "b": 306.54504, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "cent years with the deliverance of PubTabNet [37], FinTab-", "bbox": {"l": 308.862, "t": 309.59348, "r": 545.11517, "b": 318.50003000000004, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "Net [36], TableBank [17] etc.", "bbox": {"l": 308.862, "t": 321.54846, "r": 425.92255, "b": 330.45502, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Before the rising popularity of deep neural networks,", "bbox": {"l": 320.81699, "t": 333.56946, "r": 545.11499, "b": 342.47601, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "the community relied heavily on heuristic and/or statistical", "bbox": {"l": 308.862, "t": 345.52444, "r": 545.11499, "b": 354.43100000000004, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "methods to do table structure identification [3, 7, 11, 5, 13,", "bbox": {"l": 308.862, "t": 357.47943, "r": 545.11517, "b": 366.38599, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "28]. Although such methods work well on constrained ta-", "bbox": {"l": 308.862, "t": 369.43542, "r": 545.11511, "b": 378.34198, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "bles [12], a more data-driven approach can be applied due", "bbox": {"l": 308.862, "t": 381.39041, "r": 545.11505, "b": 390.29697, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "to the advent of convolutional neural networks (CNNs) and", "bbox": {"l": 308.862, "t": 393.3453999999999, "r": 545.11505, "b": 402.25195, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "the availability of large datasets. To the best-of-our knowl-", "bbox": {"l": 308.862, "t": 405.30038, "r": 545.11517, "b": 414.20694, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "edge, there are currently two different types of network ar-", "bbox": {"l": 308.862, "t": 417.25537, "r": 545.11523, "b": 426.16193, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "chitecture that are being pursued for state-of-the-art table-", "bbox": {"l": 308.862, "t": 429.21136000000007, "r": 545.11511, "b": 438.11792, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "structure identification.", "bbox": {"l": 308.862, "t": 441.16635, "r": 401.28503, "b": 450.0729099999999, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "Image-to-Text networks", "bbox": {"l": 320.81699, "t": 453.06778, "r": 423.26236, "b": 462.02417, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": ": In this type of network, one", "bbox": {"l": 423.26697, "t": 453.18735, "r": 545.10956, "b": 462.0939, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "predicts a sequence of tokens starting from an encoded", "bbox": {"l": 308.86197, "t": 465.14233, "r": 545.11511, "b": 474.04889, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "image.", "bbox": {"l": 308.86197, "t": 477.09732, "r": 335.7012, "b": 486.00388, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "Such sequences of tokens can be HTML table", "bbox": {"l": 345.85309, "t": 477.09732, "r": 545.11505, "b": 486.00388, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "tags [37, 17] or LaTeX symbols[10]. The choice of sym-", "bbox": {"l": 308.86197, "t": 489.05231, "r": 545.11493, "b": 497.95886, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "bols is ultimately not very important, since one can be trans-", "bbox": {"l": 308.86197, "t": 501.00729, "r": 545.11499, "b": 509.91385, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "formed into the other. There are however subtle variations", "bbox": {"l": 308.86197, "t": 512.9632899999999, "r": 545.11505, "b": 521.8698400000001, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "in the Image-to-Text networks. The easiest network archi-", "bbox": {"l": 308.86197, "t": 524.91827, "r": 545.11505, "b": 533.82483, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "tectures are \u201cimage-encoder", "bbox": {"l": 308.86197, "t": 536.87328, "r": 420.94119, "b": 545.77983, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "\u2192", "bbox": {"l": 423.59497, "t": 536.1559599999999, "r": 433.5575600000001, "b": 545.56065, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "text-decoder\u201d (IETD), sim-", "bbox": {"l": 436.21198, "t": 536.87328, "r": 545.11316, "b": 545.77983, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "ilar to network architectures that try to provide captions to", "bbox": {"l": 308.86197, "t": 548.82828, "r": 545.11511, "b": 557.73483, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "images [32]. In these IETD networks, one expects as output", "bbox": {"l": 308.86197, "t": 560.78328, "r": 545.11493, "b": 569.68983, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "the LaTeX/HTML string of the entire table, i.e. the sym-", "bbox": {"l": 308.86197, "t": 572.73828, "r": 545.11499, "b": 581.6448399999999, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "bols necessary for creating the table with the content of the", "bbox": {"l": 308.86197, "t": 584.69427, "r": 545.11505, "b": 593.60083, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "table. Another approach is the \u201cimage-encoder", "bbox": {"l": 308.86197, "t": 596.6492800000001, "r": 497.07541, "b": 605.55583, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "\u2192", "bbox": {"l": 499.80496, "t": 595.93196, "r": 509.76755, "b": 605.33665, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "dual de-", "bbox": {"l": 512.50098, "t": 596.6492800000001, "r": 545.10852, "b": 605.55583, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "coder\u201d (IEDD) networks. In these type of networks, one has", "bbox": {"l": 308.86197, "t": 608.60428, "r": 545.11511, "b": 617.5108299999999, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "two consecutive decoders with different purposes. The first", "bbox": {"l": 308.86197, "t": 620.55928, "r": 545.11505, "b": 629.46584, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "decoder is the", "bbox": {"l": 308.86197, "t": 632.51428, "r": 364.78201, "b": 641.42084, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "tag-decoder", "bbox": {"l": 367.57397, "t": 632.60394, "r": 415.61362, "b": 641.1917, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": ", i.e. it only produces the HTM-", "bbox": {"l": 415.61298, "t": 632.51428, "r": 545.11688, "b": 641.42084, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "L/LaTeX tags which construct an empty table. The second", "bbox": {"l": 308.86197, "t": 644.46928, "r": 545.11511, "b": 653.37584, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "content-decoder", "bbox": {"l": 308.86197, "t": 656.51494, "r": 373.59894, "b": 665.1027, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "uses the encoding of the image in combi-", "bbox": {"l": 376.90698, "t": 656.4252799999999, "r": 545.11548, "b": 665.33184, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "nation with the output encoding of each cell-tag (from the", "bbox": {"l": 308.862, "t": 668.38028, "r": 545.11517, "b": 677.28684, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "tag-decoder", "bbox": {"l": 308.862, "t": 680.42494, "r": 356.90164, "b": 689.0127, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": ") to generate the textual content of each table", "bbox": {"l": 357.13101, "t": 680.33528, "r": 545.1153, "b": 689.24184, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "cell. The network architecture of IEDD is certainly more", "bbox": {"l": 308.862, "t": 692.290283, "r": 545.11511, "b": 701.196846, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "elaborate, but it has the advantage that one can pre-train the", "bbox": {"l": 308.862, "t": 704.245285, "r": 545.11517, "b": 713.151848, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "2", "bbox": {"l": 295.121, "t": 734.133282, "r": 300.10229, "b": 743.039845, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 12, "label": "text", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 286.36505, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9656890034675598, "cells": [{"id": 0, "text": "considered as a solved problem, given enough ground-truth", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 286.36505, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "data to train on.", "bbox": {"l": 50.112, "t": 87.16339000000005, "r": 112.64721999999999, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "text", "bbox": {"l": 50.112, "t": 99.57141000000001, "r": 286.36514, "b": 228.03008999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9838606119155884, "cells": [{"id": 2, "text": "The second problem is called table-structure decompo-", "bbox": {"l": 62.067001, "t": 99.57141000000001, "r": 286.36496, "b": 108.47797000000003, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "sition.", "bbox": {"l": 50.112, "t": 111.52643, "r": 74.749512, "b": 120.43297999999993, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "The latter is a long standing problem in the com-", "bbox": {"l": 81.334793, "t": 111.52643, "r": 286.36514, "b": 120.43297999999993, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "munity of document understanding [6, 4, 14]. Contrary to", "bbox": {"l": 50.112, "t": 123.48145, "r": 286.36511, "b": 132.38800000000003, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "the table-location problem, there are no commonly used ap-", "bbox": {"l": 50.112, "t": 135.43646, "r": 286.36511, "b": 144.34302000000002, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "proaches that can easily be re-purposed to solve this prob-", "bbox": {"l": 50.112, "t": 147.39246000000003, "r": 286.36505, "b": 156.29900999999995, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "lem. Lately, a set of new model-architectures has been pro-", "bbox": {"l": 50.112, "t": 159.34747000000004, "r": 286.36511, "b": 168.25402999999994, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "posed by the community to address table-structure decom-", "bbox": {"l": 50.112, "t": 171.30249000000003, "r": 286.36508, "b": 180.20905000000005, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "position [37, 36, 18, 20]. All these models have some weak-", "bbox": {"l": 50.112, "t": 183.25751000000002, "r": 286.36511, "b": 192.16405999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "nesses (see Sec. 2). The common denominator here is the", "bbox": {"l": 50.112, "t": 195.21252000000004, "r": 286.36508, "b": 204.11908000000005, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "reliance on textual features and/or the inability to provide", "bbox": {"l": 50.112, "t": 207.16754000000003, "r": 286.36514, "b": 216.07410000000004, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "the bounding box of each table-cell in the original image.", "bbox": {"l": 50.112, "t": 219.12354000000005, "r": 278.66397, "b": 228.03008999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 50.112, "t": 231.53156, "r": 286.36511, "b": 371.94507, "coord_origin": "TOPLEFT"}, "confidence": 0.9855920076370239, "cells": [{"id": 14, "text": "In this paper, we want to address these weaknesses and", "bbox": {"l": 62.067001, "t": 231.53156, "r": 286.36493, "b": 240.43811000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "present a robust table-structure decomposition algorithm.", "bbox": {"l": 50.112, "t": 243.48657000000003, "r": 286.36511, "b": 252.39313000000004, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "The design criteria for our model are the following. First,", "bbox": {"l": 50.112, "t": 255.44159000000002, "r": 286.36511, "b": 264.34813999999994, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "we want our algorithm to be language agnostic. In this way,", "bbox": {"l": 50.112, "t": 267.39661, "r": 286.36502, "b": 276.30316000000005, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "we can obtain the structure of any table, irregardless of the", "bbox": {"l": 50.112, "t": 279.35155999999995, "r": 286.36508, "b": 288.25815, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "language.", "bbox": {"l": 50.112, "t": 291.30759, "r": 88.567635, "b": 300.21414, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Second, we want our algorithm to leverage as", "bbox": {"l": 95.501602, "t": 291.30759, "r": 286.36505, "b": 300.21414, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "much data as possible from the original PDF document. For", "bbox": {"l": 50.112, "t": 303.26257, "r": 286.36508, "b": 312.16913, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "programmatic PDF documents, the text-cells can often be", "bbox": {"l": 50.112, "t": 315.21756, "r": 286.36511, "b": 324.12411, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "extracted much faster and with higher accuracy compared", "bbox": {"l": 50.112, "t": 327.17255, "r": 286.36505, "b": 336.0791, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "to OCR methods. Last but not least, we want to have a di-", "bbox": {"l": 50.112, "t": 339.12753, "r": 286.36511, "b": 348.03409, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "rect link between the table-cell and its bounding box in the", "bbox": {"l": 50.112, "t": 351.08353, "r": 286.36508, "b": 359.99008, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "image.", "bbox": {"l": 50.112, "t": 363.03851, "r": 76.951241, "b": 371.94507, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "text", "bbox": {"l": 50.112, "t": 375.4465, "r": 286.36658, "b": 432.173, "coord_origin": "TOPLEFT"}, "confidence": 0.9820111393928528, "cells": [{"id": 27, "text": "To meet the design criteria listed above, we developed a", "bbox": {"l": 62.067001, "t": 375.4465, "r": 286.36499, "b": 384.35306, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "new model called", "bbox": {"l": 50.112, "t": 387.40149, "r": 120.98594, "b": 396.30804, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "TableFormer", "bbox": {"l": 123.901, "t": 387.28192, "r": 179.7314, "b": 396.23830999999996, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "and a synthetically gener-", "bbox": {"l": 182.646, "t": 387.40149, "r": 286.36658, "b": 396.30804, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "ated table structure dataset called", "bbox": {"l": 50.112, "t": 399.35648, "r": 181.75778, "b": 408.26302999999996, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "SynthTabNet", "bbox": {"l": 184.104, "t": 399.23690999999997, "r": 240.2034, "b": 408.1933, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "$^{1}$. In partic-", "bbox": {"l": 240.20401, "t": 399.35648, "r": 286.36069, "b": 408.26302999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "ular, our contributions in this work can be summarised as", "bbox": {"l": 50.112015, "t": 411.31146, "r": 286.36511, "b": 420.21802, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "follows:", "bbox": {"l": 50.112015, "t": 423.26645, "r": 82.520355, "b": 432.173, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "list_item", "bbox": {"l": 61.569016, "t": 444.43188, "r": 286.3649, "b": 489.32297, "coord_origin": "TOPLEFT"}, "confidence": 0.9822162389755249, "cells": [{"id": 36, "text": "\u2022", "bbox": {"l": 61.569016, "t": 444.55145, "r": 70.741714, "b": 453.45801, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "We propose", "bbox": {"l": 73.034889, "t": 444.55145, "r": 117.10054, "b": 453.45801, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "TableFormer", "bbox": {"l": 119.59001, "t": 444.43188, "r": 175.42041, "b": 453.38828, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": ", a transformer based model", "bbox": {"l": 175.42102, "t": 444.55145, "r": 286.36453, "b": 453.45801, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "that predicts tables structure and bounding boxes for", "bbox": {"l": 70.037018, "t": 456.50644000000005, "r": 286.3649, "b": 465.41299, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "the table content simultaneously in an end-to-end ap-", "bbox": {"l": 70.037018, "t": 468.46143, "r": 286.3649, "b": 477.36798, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "proach.", "bbox": {"l": 70.037018, "t": 480.41641, "r": 99.635902, "b": 489.32297, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "list_item", "bbox": {"l": 61.569016, "t": 502.03384, "r": 286.3649, "b": 546.9259500000001, "coord_origin": "TOPLEFT"}, "confidence": 0.982271671295166, "cells": [{"id": 43, "text": "\u2022", "bbox": {"l": 61.569016, "t": 502.15341, "r": 71.619438, "b": 511.05997, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "Across all benchmark datasets", "bbox": {"l": 74.132042, "t": 502.15341, "r": 196.10396, "b": 511.05997, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "TableFormer", "bbox": {"l": 200.31001, "t": 502.03384, "r": 256.14041, "b": 510.99023, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "signif-", "bbox": {"l": 260.35001, "t": 502.15341, "r": 286.36237, "b": 511.05997, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "icantly outperforms existing state-of-the-art metrics,", "bbox": {"l": 70.037003, "t": 514.1084000000001, "r": 286.3649, "b": 523.01495, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "while being much more efficient in training and infer-", "bbox": {"l": 70.037003, "t": 526.06439, "r": 286.36487, "b": 534.97095, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "ence to existing works.", "bbox": {"l": 70.037003, "t": 538.0193899999999, "r": 161.65305, "b": 546.9259500000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "list_item", "bbox": {"l": 61.569, "t": 559.63684, "r": 286.36493, "b": 592.57295, "coord_origin": "TOPLEFT"}, "confidence": 0.9802963733673096, "cells": [{"id": 50, "text": "\u2022", "bbox": {"l": 61.569, "t": 559.75639, "r": 71.115913, "b": 568.66295, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "We present", "bbox": {"l": 73.502647, "t": 559.75639, "r": 116.71199, "b": 568.66295, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "SynthTabNet", "bbox": {"l": 121.583, "t": 559.63684, "r": 177.68239, "b": 568.59322, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "a synthetically generated", "bbox": {"l": 182.55301, "t": 559.75639, "r": 286.36328, "b": 568.66295, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "dataset, with various appearance styles and complex-", "bbox": {"l": 70.03701, "t": 571.7114, "r": 286.36493, "b": 580.6179500000001, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "ity.", "bbox": {"l": 70.03701, "t": 583.6664000000001, "r": 82.400597, "b": 592.57295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "list_item", "bbox": {"l": 61.569008000000004, "t": 605.4034, "r": 286.36508, "b": 638.22095, "coord_origin": "TOPLEFT"}, "confidence": 0.9806395173072815, "cells": [{"id": 56, "text": "\u2022", "bbox": {"l": 61.569008000000004, "t": 605.4034, "r": 72.332527, "b": 614.30995, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "An augmented dataset based on PubTabNet [37],", "bbox": {"l": 75.023399, "t": 605.4034, "r": 286.36508, "b": 614.30995, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "FinTabNet [36], and TableBank [17] with generated", "bbox": {"l": 70.03701, "t": 617.3584, "r": 286.36487, "b": 626.26495, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "ground-truth for reproducibility.", "bbox": {"l": 70.03701, "t": 629.31439, "r": 198.05641, "b": 638.22095, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 50.112007, "t": 650.59839, "r": 286.36511, "b": 695.369957, "coord_origin": "TOPLEFT"}, "confidence": 0.9742533564567566, "cells": [{"id": 60, "text": "The paper is structured as follows. In Sec. 2, we give", "bbox": {"l": 62.067009000000006, "t": 650.59839, "r": 286.36496, "b": 659.50494, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "a brief overview of the current state-of-the-art. In Sec. 3,", "bbox": {"l": 50.112007, "t": 662.55339, "r": 286.36511, "b": 671.45995, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "we describe the datasets on which we train. In Sec. 4, we", "bbox": {"l": 50.112007, "t": 674.50839, "r": 286.36511, "b": 683.41496, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "introduce the TableFormer model-architecture and describe", "bbox": {"l": 50.112007, "t": 686.46339, "r": 286.36511, "b": 695.369957, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "footnote", "bbox": {"l": 60.97100100000001, "t": 705.596275, "r": 183.73055, "b": 712.721542, "coord_origin": "TOPLEFT"}, "confidence": 0.895367443561554, "cells": [{"id": 64, "text": "$^{1}$https://github.com/IBM/SynthTabNet", "bbox": {"l": 60.97100100000001, "t": 705.596275, "r": 183.73055, "b": 712.721542, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "text", "bbox": {"l": 308.862, "t": 75.20836999999995, "r": 545.11511, "b": 108.02495999999985, "coord_origin": "TOPLEFT"}, "confidence": 0.9774322509765625, "cells": [{"id": 65, "text": "its results & performance in Sec. 5. As a conclusion, we de-", "bbox": {"l": 308.862, "t": 75.20836999999995, "r": 545.11511, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "scribe how this new model-architecture can be re-purposed", "bbox": {"l": 308.862, "t": 87.16339000000005, "r": 545.11505, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "for other tasks in the computer-vision community.", "bbox": {"l": 308.862, "t": 99.11841000000004, "r": 508.08417000000003, "b": 108.02495999999985, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "section_header", "bbox": {"l": 308.862, "t": 121.73193000000003, "r": 498.28021, "b": 132.47968000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9428724646568298, "cells": [{"id": 68, "text": "2.", "bbox": {"l": 308.862, "t": 121.73193000000003, "r": 315.5831, "b": 132.47968000000003, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "Previous work and State of the Art", "bbox": {"l": 324.54456, "t": 121.73193000000003, "r": 498.28021, "b": 132.47968000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 308.862, "t": 142.22136999999998, "r": 545.11517, "b": 330.45502, "coord_origin": "TOPLEFT"}, "confidence": 0.987194836139679, "cells": [{"id": 70, "text": "Identifying the structure of a table has been an outstand-", "bbox": {"l": 320.81699, "t": 142.22136999999998, "r": 545.11493, "b": 151.12793, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "ing problem in the document-parsing community, that mo-", "bbox": {"l": 308.862, "t": 154.17638999999997, "r": 545.11505, "b": 163.08294999999998, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "tivates many organised public challenges [6, 4, 14].", "bbox": {"l": 308.862, "t": 166.13140999999996, "r": 522.55975, "b": 175.03796, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "The", "bbox": {"l": 529.62323, "t": 166.13140999999996, "r": 545.11505, "b": 175.03796, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "difficulty of the problem can be attributed to a number of", "bbox": {"l": 308.862, "t": 178.08642999999995, "r": 545.11517, "b": 186.99298, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "factors. First, there is a large variety in the shapes and sizes", "bbox": {"l": 308.862, "t": 190.04143999999997, "r": 545.11511, "b": 198.94799999999998, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "of tables.", "bbox": {"l": 308.862, "t": 201.99645999999996, "r": 346.97891, "b": 210.90301999999997, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "Such large variety requires a flexible method.", "bbox": {"l": 354.86929, "t": 201.99645999999996, "r": 545.11511, "b": 210.90301999999997, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "This is especially true for complex column- and row head-", "bbox": {"l": 308.862, "t": 213.95245, "r": 545.11505, "b": 222.85901, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "ers, which can be extremely intricate and demanding.", "bbox": {"l": 308.862, "t": 225.90747, "r": 530.9184, "b": 234.81403, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "A", "bbox": {"l": 537.92212, "t": 225.90747, "r": 545.11511, "b": 234.81403, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "second factor of complexity is the lack of data with regard", "bbox": {"l": 308.862, "t": 237.86248999999998, "r": 545.11517, "b": 246.76904000000002, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "to table-structure. Until the publication of PubTabNet [37],", "bbox": {"l": 308.862, "t": 249.8175, "r": 545.11511, "b": 258.72406, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "there were no large datasets (i.e.", "bbox": {"l": 308.862, "t": 261.77252, "r": 439.8402699999999, "b": 270.67908, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": ">", "bbox": {"l": 444.43999999999994, "t": 261.61310000000003, "r": 452.1889, "b": 270.45989999999995, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "100", "bbox": {"l": 455.89001, "t": 261.61310000000003, "r": 470.83392000000003, "b": 270.45989999999995, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "K tables) that pro-", "bbox": {"l": 470.83401, "t": 261.77252, "r": 545.11517, "b": 270.67908, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "vided structure information. This happens primarily due to", "bbox": {"l": 308.862, "t": 273.72748, "r": 545.11511, "b": 282.63406, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "the fact that tables are notoriously time-consuming to an-", "bbox": {"l": 308.862, "t": 285.6835, "r": 545.11511, "b": 294.59006, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "notate by hand. However, this has definitely changed in re-", "bbox": {"l": 308.862, "t": 297.63849, "r": 545.11511, "b": 306.54504, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "cent years with the deliverance of PubTabNet [37], FinTab-", "bbox": {"l": 308.862, "t": 309.59348, "r": 545.11517, "b": 318.50003000000004, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "Net [36], TableBank [17] etc.", "bbox": {"l": 308.862, "t": 321.54846, "r": 425.92255, "b": 330.45502, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 308.862, "t": 333.56946, "r": 545.11523, "b": 450.0729099999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9869040250778198, "cells": [{"id": 92, "text": "Before the rising popularity of deep neural networks,", "bbox": {"l": 320.81699, "t": 333.56946, "r": 545.11499, "b": 342.47601, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "the community relied heavily on heuristic and/or statistical", "bbox": {"l": 308.862, "t": 345.52444, "r": 545.11499, "b": 354.43100000000004, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "methods to do table structure identification [3, 7, 11, 5, 13,", "bbox": {"l": 308.862, "t": 357.47943, "r": 545.11517, "b": 366.38599, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "28]. Although such methods work well on constrained ta-", "bbox": {"l": 308.862, "t": 369.43542, "r": 545.11511, "b": 378.34198, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "bles [12], a more data-driven approach can be applied due", "bbox": {"l": 308.862, "t": 381.39041, "r": 545.11505, "b": 390.29697, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "to the advent of convolutional neural networks (CNNs) and", "bbox": {"l": 308.862, "t": 393.3453999999999, "r": 545.11505, "b": 402.25195, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "the availability of large datasets. To the best-of-our knowl-", "bbox": {"l": 308.862, "t": 405.30038, "r": 545.11517, "b": 414.20694, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "edge, there are currently two different types of network ar-", "bbox": {"l": 308.862, "t": 417.25537, "r": 545.11523, "b": 426.16193, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "chitecture that are being pursued for state-of-the-art table-", "bbox": {"l": 308.862, "t": 429.21136000000007, "r": 545.11511, "b": 438.11792, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "structure identification.", "bbox": {"l": 308.862, "t": 441.16635, "r": 401.28503, "b": 450.0729099999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 308.86197, "t": 453.06778, "r": 545.11688, "b": 713.151848, "coord_origin": "TOPLEFT"}, "confidence": 0.9843218326568604, "cells": [{"id": 102, "text": "Image-to-Text networks", "bbox": {"l": 320.81699, "t": 453.06778, "r": 423.26236, "b": 462.02417, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": ": In this type of network, one", "bbox": {"l": 423.26697, "t": 453.18735, "r": 545.10956, "b": 462.0939, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "predicts a sequence of tokens starting from an encoded", "bbox": {"l": 308.86197, "t": 465.14233, "r": 545.11511, "b": 474.04889, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "image.", "bbox": {"l": 308.86197, "t": 477.09732, "r": 335.7012, "b": 486.00388, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "Such sequences of tokens can be HTML table", "bbox": {"l": 345.85309, "t": 477.09732, "r": 545.11505, "b": 486.00388, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "tags [37, 17] or LaTeX symbols[10]. The choice of sym-", "bbox": {"l": 308.86197, "t": 489.05231, "r": 545.11493, "b": 497.95886, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "bols is ultimately not very important, since one can be trans-", "bbox": {"l": 308.86197, "t": 501.00729, "r": 545.11499, "b": 509.91385, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "formed into the other. There are however subtle variations", "bbox": {"l": 308.86197, "t": 512.9632899999999, "r": 545.11505, "b": 521.8698400000001, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "in the Image-to-Text networks. The easiest network archi-", "bbox": {"l": 308.86197, "t": 524.91827, "r": 545.11505, "b": 533.82483, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "tectures are \u201cimage-encoder", "bbox": {"l": 308.86197, "t": 536.87328, "r": 420.94119, "b": 545.77983, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "\u2192", "bbox": {"l": 423.59497, "t": 536.1559599999999, "r": 433.5575600000001, "b": 545.56065, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "text-decoder\u201d (IETD), sim-", "bbox": {"l": 436.21198, "t": 536.87328, "r": 545.11316, "b": 545.77983, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "ilar to network architectures that try to provide captions to", "bbox": {"l": 308.86197, "t": 548.82828, "r": 545.11511, "b": 557.73483, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "images [32]. In these IETD networks, one expects as output", "bbox": {"l": 308.86197, "t": 560.78328, "r": 545.11493, "b": 569.68983, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "the LaTeX/HTML string of the entire table, i.e. the sym-", "bbox": {"l": 308.86197, "t": 572.73828, "r": 545.11499, "b": 581.6448399999999, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "bols necessary for creating the table with the content of the", "bbox": {"l": 308.86197, "t": 584.69427, "r": 545.11505, "b": 593.60083, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "table. Another approach is the \u201cimage-encoder", "bbox": {"l": 308.86197, "t": 596.6492800000001, "r": 497.07541, "b": 605.55583, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "\u2192", "bbox": {"l": 499.80496, "t": 595.93196, "r": 509.76755, "b": 605.33665, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "dual de-", "bbox": {"l": 512.50098, "t": 596.6492800000001, "r": 545.10852, "b": 605.55583, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "coder\u201d (IEDD) networks. In these type of networks, one has", "bbox": {"l": 308.86197, "t": 608.60428, "r": 545.11511, "b": 617.5108299999999, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "two consecutive decoders with different purposes. The first", "bbox": {"l": 308.86197, "t": 620.55928, "r": 545.11505, "b": 629.46584, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "decoder is the", "bbox": {"l": 308.86197, "t": 632.51428, "r": 364.78201, "b": 641.42084, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "tag-decoder", "bbox": {"l": 367.57397, "t": 632.60394, "r": 415.61362, "b": 641.1917, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": ", i.e. it only produces the HTM-", "bbox": {"l": 415.61298, "t": 632.51428, "r": 545.11688, "b": 641.42084, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "L/LaTeX tags which construct an empty table. The second", "bbox": {"l": 308.86197, "t": 644.46928, "r": 545.11511, "b": 653.37584, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "content-decoder", "bbox": {"l": 308.86197, "t": 656.51494, "r": 373.59894, "b": 665.1027, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "uses the encoding of the image in combi-", "bbox": {"l": 376.90698, "t": 656.4252799999999, "r": 545.11548, "b": 665.33184, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "nation with the output encoding of each cell-tag (from the", "bbox": {"l": 308.862, "t": 668.38028, "r": 545.11517, "b": 677.28684, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "tag-decoder", "bbox": {"l": 308.862, "t": 680.42494, "r": 356.90164, "b": 689.0127, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": ") to generate the textual content of each table", "bbox": {"l": 357.13101, "t": 680.33528, "r": 545.1153, "b": 689.24184, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "cell. The network architecture of IEDD is certainly more", "bbox": {"l": 308.862, "t": 692.290283, "r": 545.11511, "b": 701.196846, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "elaborate, but it has the advantage that one can pre-train the", "bbox": {"l": 308.862, "t": 704.245285, "r": 545.11517, "b": 713.151848, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "page_footer", "bbox": {"l": 295.121, "t": 734.133282, "r": 300.10229, "b": 743.039845, "coord_origin": "TOPLEFT"}, "confidence": 0.8778094053268433, "cells": [{"id": 134, "text": "2", "bbox": {"l": 295.121, "t": 734.133282, "r": 300.10229, "b": 743.039845, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "text", "id": 12, "page_no": 1, "cluster": {"id": 12, "label": "text", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 286.36505, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9656890034675598, "cells": [{"id": 0, "text": "considered as a solved problem, given enough ground-truth", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 286.36505, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "data to train on.", "bbox": {"l": 50.112, "t": 87.16339000000005, "r": 112.64721999999999, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "considered as a solved problem, given enough ground-truth data to train on."}, {"label": "text", "id": 4, "page_no": 1, "cluster": {"id": 4, "label": "text", "bbox": {"l": 50.112, "t": 99.57141000000001, "r": 286.36514, "b": 228.03008999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9838606119155884, "cells": [{"id": 2, "text": "The second problem is called table-structure decompo-", "bbox": {"l": 62.067001, "t": 99.57141000000001, "r": 286.36496, "b": 108.47797000000003, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "sition.", "bbox": {"l": 50.112, "t": 111.52643, "r": 74.749512, "b": 120.43297999999993, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "The latter is a long standing problem in the com-", "bbox": {"l": 81.334793, "t": 111.52643, "r": 286.36514, "b": 120.43297999999993, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "munity of document understanding [6, 4, 14]. Contrary to", "bbox": {"l": 50.112, "t": 123.48145, "r": 286.36511, "b": 132.38800000000003, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "the table-location problem, there are no commonly used ap-", "bbox": {"l": 50.112, "t": 135.43646, "r": 286.36511, "b": 144.34302000000002, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "proaches that can easily be re-purposed to solve this prob-", "bbox": {"l": 50.112, "t": 147.39246000000003, "r": 286.36505, "b": 156.29900999999995, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "lem. Lately, a set of new model-architectures has been pro-", "bbox": {"l": 50.112, "t": 159.34747000000004, "r": 286.36511, "b": 168.25402999999994, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "posed by the community to address table-structure decom-", "bbox": {"l": 50.112, "t": 171.30249000000003, "r": 286.36508, "b": 180.20905000000005, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "position [37, 36, 18, 20]. All these models have some weak-", "bbox": {"l": 50.112, "t": 183.25751000000002, "r": 286.36511, "b": 192.16405999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "nesses (see Sec. 2). The common denominator here is the", "bbox": {"l": 50.112, "t": 195.21252000000004, "r": 286.36508, "b": 204.11908000000005, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "reliance on textual features and/or the inability to provide", "bbox": {"l": 50.112, "t": 207.16754000000003, "r": 286.36514, "b": 216.07410000000004, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "the bounding box of each table-cell in the original image.", "bbox": {"l": 50.112, "t": 219.12354000000005, "r": 278.66397, "b": 228.03008999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The second problem is called table-structure decomposition. The latter is a long standing problem in the community of document understanding [6, 4, 14]. Contrary to the table-location problem, there are no commonly used approaches that can easily be re-purposed to solve this problem. Lately, a set of new model-architectures has been proposed by the community to address table-structure decomposition [37, 36, 18, 20]. All these models have some weaknesses (see Sec. 2). The common denominator here is the reliance on textual features and/or the inability to provide the bounding box of each table-cell in the original image."}, {"label": "text", "id": 2, "page_no": 1, "cluster": {"id": 2, "label": "text", "bbox": {"l": 50.112, "t": 231.53156, "r": 286.36511, "b": 371.94507, "coord_origin": "TOPLEFT"}, "confidence": 0.9855920076370239, "cells": [{"id": 14, "text": "In this paper, we want to address these weaknesses and", "bbox": {"l": 62.067001, "t": 231.53156, "r": 286.36493, "b": 240.43811000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "present a robust table-structure decomposition algorithm.", "bbox": {"l": 50.112, "t": 243.48657000000003, "r": 286.36511, "b": 252.39313000000004, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "The design criteria for our model are the following. First,", "bbox": {"l": 50.112, "t": 255.44159000000002, "r": 286.36511, "b": 264.34813999999994, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "we want our algorithm to be language agnostic. In this way,", "bbox": {"l": 50.112, "t": 267.39661, "r": 286.36502, "b": 276.30316000000005, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "we can obtain the structure of any table, irregardless of the", "bbox": {"l": 50.112, "t": 279.35155999999995, "r": 286.36508, "b": 288.25815, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "language.", "bbox": {"l": 50.112, "t": 291.30759, "r": 88.567635, "b": 300.21414, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Second, we want our algorithm to leverage as", "bbox": {"l": 95.501602, "t": 291.30759, "r": 286.36505, "b": 300.21414, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "much data as possible from the original PDF document. For", "bbox": {"l": 50.112, "t": 303.26257, "r": 286.36508, "b": 312.16913, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "programmatic PDF documents, the text-cells can often be", "bbox": {"l": 50.112, "t": 315.21756, "r": 286.36511, "b": 324.12411, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "extracted much faster and with higher accuracy compared", "bbox": {"l": 50.112, "t": 327.17255, "r": 286.36505, "b": 336.0791, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "to OCR methods. Last but not least, we want to have a di-", "bbox": {"l": 50.112, "t": 339.12753, "r": 286.36511, "b": 348.03409, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "rect link between the table-cell and its bounding box in the", "bbox": {"l": 50.112, "t": 351.08353, "r": 286.36508, "b": 359.99008, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "image.", "bbox": {"l": 50.112, "t": 363.03851, "r": 76.951241, "b": 371.94507, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In this paper, we want to address these weaknesses and present a robust table-structure decomposition algorithm. The design criteria for our model are the following. First, we want our algorithm to be language agnostic. In this way, we can obtain the structure of any table, irregardless of the language. Second, we want our algorithm to leverage as much data as possible from the original PDF document. For programmatic PDF documents, the text-cells can often be extracted much faster and with higher accuracy compared to OCR methods. Last but not least, we want to have a direct link between the table-cell and its bounding box in the image."}, {"label": "text", "id": 7, "page_no": 1, "cluster": {"id": 7, "label": "text", "bbox": {"l": 50.112, "t": 375.4465, "r": 286.36658, "b": 432.173, "coord_origin": "TOPLEFT"}, "confidence": 0.9820111393928528, "cells": [{"id": 27, "text": "To meet the design criteria listed above, we developed a", "bbox": {"l": 62.067001, "t": 375.4465, "r": 286.36499, "b": 384.35306, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "new model called", "bbox": {"l": 50.112, "t": 387.40149, "r": 120.98594, "b": 396.30804, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "TableFormer", "bbox": {"l": 123.901, "t": 387.28192, "r": 179.7314, "b": 396.23830999999996, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "and a synthetically gener-", "bbox": {"l": 182.646, "t": 387.40149, "r": 286.36658, "b": 396.30804, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "ated table structure dataset called", "bbox": {"l": 50.112, "t": 399.35648, "r": 181.75778, "b": 408.26302999999996, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "SynthTabNet", "bbox": {"l": 184.104, "t": 399.23690999999997, "r": 240.2034, "b": 408.1933, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "$^{1}$. In partic-", "bbox": {"l": 240.20401, "t": 399.35648, "r": 286.36069, "b": 408.26302999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "ular, our contributions in this work can be summarised as", "bbox": {"l": 50.112015, "t": 411.31146, "r": 286.36511, "b": 420.21802, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "follows:", "bbox": {"l": 50.112015, "t": 423.26645, "r": 82.520355, "b": 432.173, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "To meet the design criteria listed above, we developed a new model called TableFormer and a synthetically generated table structure dataset called SynthTabNet $^{1}$. In particular, our contributions in this work can be summarised as follows:"}, {"label": "list_item", "id": 6, "page_no": 1, "cluster": {"id": 6, "label": "list_item", "bbox": {"l": 61.569016, "t": 444.43188, "r": 286.3649, "b": 489.32297, "coord_origin": "TOPLEFT"}, "confidence": 0.9822162389755249, "cells": [{"id": 36, "text": "\u2022", "bbox": {"l": 61.569016, "t": 444.55145, "r": 70.741714, "b": 453.45801, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "We propose", "bbox": {"l": 73.034889, "t": 444.55145, "r": 117.10054, "b": 453.45801, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "TableFormer", "bbox": {"l": 119.59001, "t": 444.43188, "r": 175.42041, "b": 453.38828, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": ", a transformer based model", "bbox": {"l": 175.42102, "t": 444.55145, "r": 286.36453, "b": 453.45801, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "that predicts tables structure and bounding boxes for", "bbox": {"l": 70.037018, "t": 456.50644000000005, "r": 286.3649, "b": 465.41299, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "the table content simultaneously in an end-to-end ap-", "bbox": {"l": 70.037018, "t": 468.46143, "r": 286.3649, "b": 477.36798, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "proach.", "bbox": {"l": 70.037018, "t": 480.41641, "r": 99.635902, "b": 489.32297, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u00b7 We propose TableFormer , a transformer based model that predicts tables structure and bounding boxes for the table content simultaneously in an end-to-end approach."}, {"label": "list_item", "id": 5, "page_no": 1, "cluster": {"id": 5, "label": "list_item", "bbox": {"l": 61.569016, "t": 502.03384, "r": 286.3649, "b": 546.9259500000001, "coord_origin": "TOPLEFT"}, "confidence": 0.982271671295166, "cells": [{"id": 43, "text": "\u2022", "bbox": {"l": 61.569016, "t": 502.15341, "r": 71.619438, "b": 511.05997, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "Across all benchmark datasets", "bbox": {"l": 74.132042, "t": 502.15341, "r": 196.10396, "b": 511.05997, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "TableFormer", "bbox": {"l": 200.31001, "t": 502.03384, "r": 256.14041, "b": 510.99023, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "signif-", "bbox": {"l": 260.35001, "t": 502.15341, "r": 286.36237, "b": 511.05997, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "icantly outperforms existing state-of-the-art metrics,", "bbox": {"l": 70.037003, "t": 514.1084000000001, "r": 286.3649, "b": 523.01495, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "while being much more efficient in training and infer-", "bbox": {"l": 70.037003, "t": 526.06439, "r": 286.36487, "b": 534.97095, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "ence to existing works.", "bbox": {"l": 70.037003, "t": 538.0193899999999, "r": 161.65305, "b": 546.9259500000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u00b7 Across all benchmark datasets TableFormer significantly outperforms existing state-of-the-art metrics, while being much more efficient in training and inference to existing works."}, {"label": "list_item", "id": 9, "page_no": 1, "cluster": {"id": 9, "label": "list_item", "bbox": {"l": 61.569, "t": 559.63684, "r": 286.36493, "b": 592.57295, "coord_origin": "TOPLEFT"}, "confidence": 0.9802963733673096, "cells": [{"id": 50, "text": "\u2022", "bbox": {"l": 61.569, "t": 559.75639, "r": 71.115913, "b": 568.66295, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "We present", "bbox": {"l": 73.502647, "t": 559.75639, "r": 116.71199, "b": 568.66295, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "SynthTabNet", "bbox": {"l": 121.583, "t": 559.63684, "r": 177.68239, "b": 568.59322, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "a synthetically generated", "bbox": {"l": 182.55301, "t": 559.75639, "r": 286.36328, "b": 568.66295, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "dataset, with various appearance styles and complex-", "bbox": {"l": 70.03701, "t": 571.7114, "r": 286.36493, "b": 580.6179500000001, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "ity.", "bbox": {"l": 70.03701, "t": 583.6664000000001, "r": 82.400597, "b": 592.57295, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u00b7 We present SynthTabNet a synthetically generated dataset, with various appearance styles and complexity."}, {"label": "list_item", "id": 8, "page_no": 1, "cluster": {"id": 8, "label": "list_item", "bbox": {"l": 61.569008000000004, "t": 605.4034, "r": 286.36508, "b": 638.22095, "coord_origin": "TOPLEFT"}, "confidence": 0.9806395173072815, "cells": [{"id": 56, "text": "\u2022", "bbox": {"l": 61.569008000000004, "t": 605.4034, "r": 72.332527, "b": 614.30995, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "An augmented dataset based on PubTabNet [37],", "bbox": {"l": 75.023399, "t": 605.4034, "r": 286.36508, "b": 614.30995, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "FinTabNet [36], and TableBank [17] with generated", "bbox": {"l": 70.03701, "t": 617.3584, "r": 286.36487, "b": 626.26495, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "ground-truth for reproducibility.", "bbox": {"l": 70.03701, "t": 629.31439, "r": 198.05641, "b": 638.22095, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u00b7 An augmented dataset based on PubTabNet [37], FinTabNet [36], and TableBank [17] with generated ground-truth for reproducibility."}, {"label": "text", "id": 11, "page_no": 1, "cluster": {"id": 11, "label": "text", "bbox": {"l": 50.112007, "t": 650.59839, "r": 286.36511, "b": 695.369957, "coord_origin": "TOPLEFT"}, "confidence": 0.9742533564567566, "cells": [{"id": 60, "text": "The paper is structured as follows. In Sec. 2, we give", "bbox": {"l": 62.067009000000006, "t": 650.59839, "r": 286.36496, "b": 659.50494, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "a brief overview of the current state-of-the-art. In Sec. 3,", "bbox": {"l": 50.112007, "t": 662.55339, "r": 286.36511, "b": 671.45995, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "we describe the datasets on which we train. In Sec. 4, we", "bbox": {"l": 50.112007, "t": 674.50839, "r": 286.36511, "b": 683.41496, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "introduce the TableFormer model-architecture and describe", "bbox": {"l": 50.112007, "t": 686.46339, "r": 286.36511, "b": 695.369957, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The paper is structured as follows. In Sec. 2, we give a brief overview of the current state-of-the-art. In Sec. 3, we describe the datasets on which we train. In Sec. 4, we introduce the TableFormer model-architecture and describe"}, {"label": "footnote", "id": 14, "page_no": 1, "cluster": {"id": 14, "label": "footnote", "bbox": {"l": 60.97100100000001, "t": 705.596275, "r": 183.73055, "b": 712.721542, "coord_origin": "TOPLEFT"}, "confidence": 0.895367443561554, "cells": [{"id": 64, "text": "$^{1}$https://github.com/IBM/SynthTabNet", "bbox": {"l": 60.97100100000001, "t": 705.596275, "r": 183.73055, "b": 712.721542, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "$^{1}$https://github.com/IBM/SynthTabNet"}, {"label": "text", "id": 10, "page_no": 1, "cluster": {"id": 10, "label": "text", "bbox": {"l": 308.862, "t": 75.20836999999995, "r": 545.11511, "b": 108.02495999999985, "coord_origin": "TOPLEFT"}, "confidence": 0.9774322509765625, "cells": [{"id": 65, "text": "its results & performance in Sec. 5. As a conclusion, we de-", "bbox": {"l": 308.862, "t": 75.20836999999995, "r": 545.11511, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "scribe how this new model-architecture can be re-purposed", "bbox": {"l": 308.862, "t": 87.16339000000005, "r": 545.11505, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "for other tasks in the computer-vision community.", "bbox": {"l": 308.862, "t": 99.11841000000004, "r": 508.08417000000003, "b": 108.02495999999985, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "its results & performance in Sec. 5. As a conclusion, we describe how this new model-architecture can be re-purposed for other tasks in the computer-vision community."}, {"label": "section_header", "id": 13, "page_no": 1, "cluster": {"id": 13, "label": "section_header", "bbox": {"l": 308.862, "t": 121.73193000000003, "r": 498.28021, "b": 132.47968000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9428724646568298, "cells": [{"id": 68, "text": "2.", "bbox": {"l": 308.862, "t": 121.73193000000003, "r": 315.5831, "b": 132.47968000000003, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "Previous work and State of the Art", "bbox": {"l": 324.54456, "t": 121.73193000000003, "r": 498.28021, "b": 132.47968000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2. Previous work and State of the Art"}, {"label": "text", "id": 0, "page_no": 1, "cluster": {"id": 0, "label": "text", "bbox": {"l": 308.862, "t": 142.22136999999998, "r": 545.11517, "b": 330.45502, "coord_origin": "TOPLEFT"}, "confidence": 0.987194836139679, "cells": [{"id": 70, "text": "Identifying the structure of a table has been an outstand-", "bbox": {"l": 320.81699, "t": 142.22136999999998, "r": 545.11493, "b": 151.12793, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "ing problem in the document-parsing community, that mo-", "bbox": {"l": 308.862, "t": 154.17638999999997, "r": 545.11505, "b": 163.08294999999998, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "tivates many organised public challenges [6, 4, 14].", "bbox": {"l": 308.862, "t": 166.13140999999996, "r": 522.55975, "b": 175.03796, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "The", "bbox": {"l": 529.62323, "t": 166.13140999999996, "r": 545.11505, "b": 175.03796, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "difficulty of the problem can be attributed to a number of", "bbox": {"l": 308.862, "t": 178.08642999999995, "r": 545.11517, "b": 186.99298, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "factors. First, there is a large variety in the shapes and sizes", "bbox": {"l": 308.862, "t": 190.04143999999997, "r": 545.11511, "b": 198.94799999999998, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "of tables.", "bbox": {"l": 308.862, "t": 201.99645999999996, "r": 346.97891, "b": 210.90301999999997, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "Such large variety requires a flexible method.", "bbox": {"l": 354.86929, "t": 201.99645999999996, "r": 545.11511, "b": 210.90301999999997, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "This is especially true for complex column- and row head-", "bbox": {"l": 308.862, "t": 213.95245, "r": 545.11505, "b": 222.85901, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "ers, which can be extremely intricate and demanding.", "bbox": {"l": 308.862, "t": 225.90747, "r": 530.9184, "b": 234.81403, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "A", "bbox": {"l": 537.92212, "t": 225.90747, "r": 545.11511, "b": 234.81403, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "second factor of complexity is the lack of data with regard", "bbox": {"l": 308.862, "t": 237.86248999999998, "r": 545.11517, "b": 246.76904000000002, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "to table-structure. Until the publication of PubTabNet [37],", "bbox": {"l": 308.862, "t": 249.8175, "r": 545.11511, "b": 258.72406, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "there were no large datasets (i.e.", "bbox": {"l": 308.862, "t": 261.77252, "r": 439.8402699999999, "b": 270.67908, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": ">", "bbox": {"l": 444.43999999999994, "t": 261.61310000000003, "r": 452.1889, "b": 270.45989999999995, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "100", "bbox": {"l": 455.89001, "t": 261.61310000000003, "r": 470.83392000000003, "b": 270.45989999999995, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "K tables) that pro-", "bbox": {"l": 470.83401, "t": 261.77252, "r": 545.11517, "b": 270.67908, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "vided structure information. This happens primarily due to", "bbox": {"l": 308.862, "t": 273.72748, "r": 545.11511, "b": 282.63406, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "the fact that tables are notoriously time-consuming to an-", "bbox": {"l": 308.862, "t": 285.6835, "r": 545.11511, "b": 294.59006, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "notate by hand. However, this has definitely changed in re-", "bbox": {"l": 308.862, "t": 297.63849, "r": 545.11511, "b": 306.54504, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "cent years with the deliverance of PubTabNet [37], FinTab-", "bbox": {"l": 308.862, "t": 309.59348, "r": 545.11517, "b": 318.50003000000004, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "Net [36], TableBank [17] etc.", "bbox": {"l": 308.862, "t": 321.54846, "r": 425.92255, "b": 330.45502, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Identifying the structure of a table has been an outstanding problem in the document-parsing community, that motivates many organised public challenges [6, 4, 14]. The difficulty of the problem can be attributed to a number of factors. First, there is a large variety in the shapes and sizes of tables. Such large variety requires a flexible method. This is especially true for complex column- and row headers, which can be extremely intricate and demanding. A second factor of complexity is the lack of data with regard to table-structure. Until the publication of PubTabNet [37], there were no large datasets (i.e. > 100 K tables) that provided structure information. This happens primarily due to the fact that tables are notoriously time-consuming to annotate by hand. However, this has definitely changed in recent years with the deliverance of PubTabNet [37], FinTabNet [36], TableBank [17] etc."}, {"label": "text", "id": 1, "page_no": 1, "cluster": {"id": 1, "label": "text", "bbox": {"l": 308.862, "t": 333.56946, "r": 545.11523, "b": 450.0729099999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9869040250778198, "cells": [{"id": 92, "text": "Before the rising popularity of deep neural networks,", "bbox": {"l": 320.81699, "t": 333.56946, "r": 545.11499, "b": 342.47601, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "the community relied heavily on heuristic and/or statistical", "bbox": {"l": 308.862, "t": 345.52444, "r": 545.11499, "b": 354.43100000000004, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "methods to do table structure identification [3, 7, 11, 5, 13,", "bbox": {"l": 308.862, "t": 357.47943, "r": 545.11517, "b": 366.38599, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "28]. Although such methods work well on constrained ta-", "bbox": {"l": 308.862, "t": 369.43542, "r": 545.11511, "b": 378.34198, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "bles [12], a more data-driven approach can be applied due", "bbox": {"l": 308.862, "t": 381.39041, "r": 545.11505, "b": 390.29697, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "to the advent of convolutional neural networks (CNNs) and", "bbox": {"l": 308.862, "t": 393.3453999999999, "r": 545.11505, "b": 402.25195, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "the availability of large datasets. To the best-of-our knowl-", "bbox": {"l": 308.862, "t": 405.30038, "r": 545.11517, "b": 414.20694, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "edge, there are currently two different types of network ar-", "bbox": {"l": 308.862, "t": 417.25537, "r": 545.11523, "b": 426.16193, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "chitecture that are being pursued for state-of-the-art table-", "bbox": {"l": 308.862, "t": 429.21136000000007, "r": 545.11511, "b": 438.11792, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "structure identification.", "bbox": {"l": 308.862, "t": 441.16635, "r": 401.28503, "b": 450.0729099999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Before the rising popularity of deep neural networks, the community relied heavily on heuristic and/or statistical methods to do table structure identification [3, 7, 11, 5, 13, 28]. Although such methods work well on constrained tables [12], a more data-driven approach can be applied due to the advent of convolutional neural networks (CNNs) and the availability of large datasets. To the best-of-our knowledge, there are currently two different types of network architecture that are being pursued for state-of-the-art tablestructure identification."}, {"label": "text", "id": 3, "page_no": 1, "cluster": {"id": 3, "label": "text", "bbox": {"l": 308.86197, "t": 453.06778, "r": 545.11688, "b": 713.151848, "coord_origin": "TOPLEFT"}, "confidence": 0.9843218326568604, "cells": [{"id": 102, "text": "Image-to-Text networks", "bbox": {"l": 320.81699, "t": 453.06778, "r": 423.26236, "b": 462.02417, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": ": In this type of network, one", "bbox": {"l": 423.26697, "t": 453.18735, "r": 545.10956, "b": 462.0939, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "predicts a sequence of tokens starting from an encoded", "bbox": {"l": 308.86197, "t": 465.14233, "r": 545.11511, "b": 474.04889, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "image.", "bbox": {"l": 308.86197, "t": 477.09732, "r": 335.7012, "b": 486.00388, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "Such sequences of tokens can be HTML table", "bbox": {"l": 345.85309, "t": 477.09732, "r": 545.11505, "b": 486.00388, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "tags [37, 17] or LaTeX symbols[10]. The choice of sym-", "bbox": {"l": 308.86197, "t": 489.05231, "r": 545.11493, "b": 497.95886, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "bols is ultimately not very important, since one can be trans-", "bbox": {"l": 308.86197, "t": 501.00729, "r": 545.11499, "b": 509.91385, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "formed into the other. There are however subtle variations", "bbox": {"l": 308.86197, "t": 512.9632899999999, "r": 545.11505, "b": 521.8698400000001, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "in the Image-to-Text networks. The easiest network archi-", "bbox": {"l": 308.86197, "t": 524.91827, "r": 545.11505, "b": 533.82483, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "tectures are \u201cimage-encoder", "bbox": {"l": 308.86197, "t": 536.87328, "r": 420.94119, "b": 545.77983, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "\u2192", "bbox": {"l": 423.59497, "t": 536.1559599999999, "r": 433.5575600000001, "b": 545.56065, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "text-decoder\u201d (IETD), sim-", "bbox": {"l": 436.21198, "t": 536.87328, "r": 545.11316, "b": 545.77983, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "ilar to network architectures that try to provide captions to", "bbox": {"l": 308.86197, "t": 548.82828, "r": 545.11511, "b": 557.73483, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "images [32]. In these IETD networks, one expects as output", "bbox": {"l": 308.86197, "t": 560.78328, "r": 545.11493, "b": 569.68983, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "the LaTeX/HTML string of the entire table, i.e. the sym-", "bbox": {"l": 308.86197, "t": 572.73828, "r": 545.11499, "b": 581.6448399999999, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "bols necessary for creating the table with the content of the", "bbox": {"l": 308.86197, "t": 584.69427, "r": 545.11505, "b": 593.60083, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "table. Another approach is the \u201cimage-encoder", "bbox": {"l": 308.86197, "t": 596.6492800000001, "r": 497.07541, "b": 605.55583, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "\u2192", "bbox": {"l": 499.80496, "t": 595.93196, "r": 509.76755, "b": 605.33665, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "dual de-", "bbox": {"l": 512.50098, "t": 596.6492800000001, "r": 545.10852, "b": 605.55583, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "coder\u201d (IEDD) networks. In these type of networks, one has", "bbox": {"l": 308.86197, "t": 608.60428, "r": 545.11511, "b": 617.5108299999999, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "two consecutive decoders with different purposes. The first", "bbox": {"l": 308.86197, "t": 620.55928, "r": 545.11505, "b": 629.46584, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "decoder is the", "bbox": {"l": 308.86197, "t": 632.51428, "r": 364.78201, "b": 641.42084, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "tag-decoder", "bbox": {"l": 367.57397, "t": 632.60394, "r": 415.61362, "b": 641.1917, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": ", i.e. it only produces the HTM-", "bbox": {"l": 415.61298, "t": 632.51428, "r": 545.11688, "b": 641.42084, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "L/LaTeX tags which construct an empty table. The second", "bbox": {"l": 308.86197, "t": 644.46928, "r": 545.11511, "b": 653.37584, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "content-decoder", "bbox": {"l": 308.86197, "t": 656.51494, "r": 373.59894, "b": 665.1027, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "uses the encoding of the image in combi-", "bbox": {"l": 376.90698, "t": 656.4252799999999, "r": 545.11548, "b": 665.33184, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "nation with the output encoding of each cell-tag (from the", "bbox": {"l": 308.862, "t": 668.38028, "r": 545.11517, "b": 677.28684, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "tag-decoder", "bbox": {"l": 308.862, "t": 680.42494, "r": 356.90164, "b": 689.0127, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": ") to generate the textual content of each table", "bbox": {"l": 357.13101, "t": 680.33528, "r": 545.1153, "b": 689.24184, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "cell. The network architecture of IEDD is certainly more", "bbox": {"l": 308.862, "t": 692.290283, "r": 545.11511, "b": 701.196846, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "elaborate, but it has the advantage that one can pre-train the", "bbox": {"l": 308.862, "t": 704.245285, "r": 545.11517, "b": 713.151848, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Image-to-Text networks : In this type of network, one predicts a sequence of tokens starting from an encoded image. Such sequences of tokens can be HTML table tags [37, 17] or LaTeX symbols[10]. The choice of symbols is ultimately not very important, since one can be transformed into the other. There are however subtle variations in the Image-to-Text networks. The easiest network architectures are \"image-encoder \u2192 text-decoder\" (IETD), similar to network architectures that try to provide captions to images [32]. In these IETD networks, one expects as output the LaTeX/HTML string of the entire table, i.e. the symbols necessary for creating the table with the content of the table. Another approach is the \"image-encoder \u2192 dual decoder\" (IEDD) networks. In these type of networks, one has two consecutive decoders with different purposes. The first decoder is the tag-decoder , i.e. it only produces the HTML/LaTeX tags which construct an empty table. The second content-decoder uses the encoding of the image in combination with the output encoding of each cell-tag (from the tag-decoder ) to generate the textual content of each table cell. The network architecture of IEDD is certainly more elaborate, but it has the advantage that one can pre-train the"}, {"label": "page_footer", "id": 15, "page_no": 1, "cluster": {"id": 15, "label": "page_footer", "bbox": {"l": 295.121, "t": 734.133282, "r": 300.10229, "b": 743.039845, "coord_origin": "TOPLEFT"}, "confidence": 0.8778094053268433, "cells": [{"id": 134, "text": "2", "bbox": {"l": 295.121, "t": 734.133282, "r": 300.10229, "b": 743.039845, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2"}], "body": [{"label": "text", "id": 12, "page_no": 1, "cluster": {"id": 12, "label": "text", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 286.36505, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9656890034675598, "cells": [{"id": 0, "text": "considered as a solved problem, given enough ground-truth", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 286.36505, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "data to train on.", "bbox": {"l": 50.112, "t": 87.16339000000005, "r": 112.64721999999999, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "considered as a solved problem, given enough ground-truth data to train on."}, {"label": "text", "id": 4, "page_no": 1, "cluster": {"id": 4, "label": "text", "bbox": {"l": 50.112, "t": 99.57141000000001, "r": 286.36514, "b": 228.03008999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9838606119155884, "cells": [{"id": 2, "text": "The second problem is called table-structure decompo-", "bbox": {"l": 62.067001, "t": 99.57141000000001, "r": 286.36496, "b": 108.47797000000003, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "sition.", "bbox": {"l": 50.112, "t": 111.52643, "r": 74.749512, "b": 120.43297999999993, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "The latter is a long standing problem in the com-", "bbox": {"l": 81.334793, "t": 111.52643, "r": 286.36514, "b": 120.43297999999993, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "munity of document understanding [6, 4, 14]. Contrary to", "bbox": {"l": 50.112, "t": 123.48145, "r": 286.36511, "b": 132.38800000000003, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "the table-location problem, there are no commonly used ap-", "bbox": {"l": 50.112, "t": 135.43646, "r": 286.36511, "b": 144.34302000000002, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "proaches that can easily be re-purposed to solve this prob-", "bbox": {"l": 50.112, "t": 147.39246000000003, "r": 286.36505, "b": 156.29900999999995, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "lem. Lately, a set of new model-architectures has been pro-", "bbox": {"l": 50.112, "t": 159.34747000000004, "r": 286.36511, "b": 168.25402999999994, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "posed by the community to address table-structure decom-", "bbox": {"l": 50.112, "t": 171.30249000000003, "r": 286.36508, "b": 180.20905000000005, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "position [37, 36, 18, 20]. All these models have some weak-", "bbox": {"l": 50.112, "t": 183.25751000000002, "r": 286.36511, "b": 192.16405999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "nesses (see Sec. 2). The common denominator here is the", "bbox": {"l": 50.112, "t": 195.21252000000004, "r": 286.36508, "b": 204.11908000000005, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "reliance on textual features and/or the inability to provide", "bbox": {"l": 50.112, "t": 207.16754000000003, "r": 286.36514, "b": 216.07410000000004, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "the bounding box of each table-cell in the original image.", "bbox": {"l": 50.112, "t": 219.12354000000005, "r": 278.66397, "b": 228.03008999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The second problem is called table-structure decomposition. The latter is a long standing problem in the community of document understanding [6, 4, 14]. Contrary to the table-location problem, there are no commonly used approaches that can easily be re-purposed to solve this problem. Lately, a set of new model-architectures has been proposed by the community to address table-structure decomposition [37, 36, 18, 20]. All these models have some weaknesses (see Sec. 2). The common denominator here is the reliance on textual features and/or the inability to provide the bounding box of each table-cell in the original image."}, {"label": "text", "id": 2, "page_no": 1, "cluster": {"id": 2, "label": "text", "bbox": {"l": 50.112, "t": 231.53156, "r": 286.36511, "b": 371.94507, "coord_origin": "TOPLEFT"}, "confidence": 0.9855920076370239, "cells": [{"id": 14, "text": "In this paper, we want to address these weaknesses and", "bbox": {"l": 62.067001, "t": 231.53156, "r": 286.36493, "b": 240.43811000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "present a robust table-structure decomposition algorithm.", "bbox": {"l": 50.112, "t": 243.48657000000003, "r": 286.36511, "b": 252.39313000000004, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "The design criteria for our model are the following. First,", "bbox": {"l": 50.112, "t": 255.44159000000002, "r": 286.36511, "b": 264.34813999999994, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "we want our algorithm to be language agnostic. In this way,", "bbox": {"l": 50.112, "t": 267.39661, "r": 286.36502, "b": 276.30316000000005, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "we can obtain the structure of any table, irregardless of the", "bbox": {"l": 50.112, "t": 279.35155999999995, "r": 286.36508, "b": 288.25815, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "language.", "bbox": {"l": 50.112, "t": 291.30759, "r": 88.567635, "b": 300.21414, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Second, we want our algorithm to leverage as", "bbox": {"l": 95.501602, "t": 291.30759, "r": 286.36505, "b": 300.21414, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "much data as possible from the original PDF document. For", "bbox": {"l": 50.112, "t": 303.26257, "r": 286.36508, "b": 312.16913, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "programmatic PDF documents, the text-cells can often be", "bbox": {"l": 50.112, "t": 315.21756, "r": 286.36511, "b": 324.12411, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "extracted much faster and with higher accuracy compared", "bbox": {"l": 50.112, "t": 327.17255, "r": 286.36505, "b": 336.0791, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "to OCR methods. Last but not least, we want to have a di-", "bbox": {"l": 50.112, "t": 339.12753, "r": 286.36511, "b": 348.03409, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "rect link between the table-cell and its bounding box in the", "bbox": {"l": 50.112, "t": 351.08353, "r": 286.36508, "b": 359.99008, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "image.", "bbox": {"l": 50.112, "t": 363.03851, "r": 76.951241, "b": 371.94507, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In this paper, we want to address these weaknesses and present a robust table-structure decomposition algorithm. The design criteria for our model are the following. First, we want our algorithm to be language agnostic. In this way, we can obtain the structure of any table, irregardless of the language. Second, we want our algorithm to leverage as much data as possible from the original PDF document. For programmatic PDF documents, the text-cells can often be extracted much faster and with higher accuracy compared to OCR methods. Last but not least, we want to have a direct link between the table-cell and its bounding box in the image."}, {"label": "text", "id": 7, "page_no": 1, "cluster": {"id": 7, "label": "text", "bbox": {"l": 50.112, "t": 375.4465, "r": 286.36658, "b": 432.173, "coord_origin": "TOPLEFT"}, "confidence": 0.9820111393928528, "cells": [{"id": 27, "text": "To meet the design criteria listed above, we developed a", "bbox": {"l": 62.067001, "t": 375.4465, "r": 286.36499, "b": 384.35306, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "new model called", "bbox": {"l": 50.112, "t": 387.40149, "r": 120.98594, "b": 396.30804, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "TableFormer", "bbox": {"l": 123.901, "t": 387.28192, "r": 179.7314, "b": 396.23830999999996, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "and a synthetically gener-", "bbox": {"l": 182.646, "t": 387.40149, "r": 286.36658, "b": 396.30804, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "ated table structure dataset called", "bbox": {"l": 50.112, "t": 399.35648, "r": 181.75778, "b": 408.26302999999996, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "SynthTabNet", "bbox": {"l": 184.104, "t": 399.23690999999997, "r": 240.2034, "b": 408.1933, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "$^{1}$. In partic-", "bbox": {"l": 240.20401, "t": 399.35648, "r": 286.36069, "b": 408.26302999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "ular, our contributions in this work can be summarised as", "bbox": {"l": 50.112015, "t": 411.31146, "r": 286.36511, "b": 420.21802, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "follows:", "bbox": {"l": 50.112015, "t": 423.26645, "r": 82.520355, "b": 432.173, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "To meet the design criteria listed above, we developed a new model called TableFormer and a synthetically generated table structure dataset called SynthTabNet $^{1}$. In particular, our contributions in this work can be summarised as follows:"}, {"label": "list_item", "id": 6, "page_no": 1, "cluster": {"id": 6, "label": "list_item", "bbox": {"l": 61.569016, "t": 444.43188, "r": 286.3649, "b": 489.32297, "coord_origin": "TOPLEFT"}, "confidence": 0.9822162389755249, "cells": [{"id": 36, "text": "\u2022", "bbox": {"l": 61.569016, "t": 444.55145, "r": 70.741714, "b": 453.45801, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "We propose", "bbox": {"l": 73.034889, "t": 444.55145, "r": 117.10054, "b": 453.45801, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "TableFormer", "bbox": {"l": 119.59001, "t": 444.43188, "r": 175.42041, "b": 453.38828, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": ", a transformer based model", "bbox": {"l": 175.42102, "t": 444.55145, "r": 286.36453, "b": 453.45801, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "that predicts tables structure and bounding boxes for", "bbox": {"l": 70.037018, "t": 456.50644000000005, "r": 286.3649, "b": 465.41299, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "the table content simultaneously in an end-to-end ap-", "bbox": {"l": 70.037018, "t": 468.46143, "r": 286.3649, "b": 477.36798, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "proach.", "bbox": {"l": 70.037018, "t": 480.41641, "r": 99.635902, "b": 489.32297, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u00b7 We propose TableFormer , a transformer based model that predicts tables structure and bounding boxes for the table content simultaneously in an end-to-end approach."}, {"label": "list_item", "id": 5, "page_no": 1, "cluster": {"id": 5, "label": "list_item", "bbox": {"l": 61.569016, "t": 502.03384, "r": 286.3649, "b": 546.9259500000001, "coord_origin": "TOPLEFT"}, "confidence": 0.982271671295166, "cells": [{"id": 43, "text": "\u2022", "bbox": {"l": 61.569016, "t": 502.15341, "r": 71.619438, "b": 511.05997, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "Across all benchmark datasets", "bbox": {"l": 74.132042, "t": 502.15341, "r": 196.10396, "b": 511.05997, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "TableFormer", "bbox": {"l": 200.31001, "t": 502.03384, "r": 256.14041, "b": 510.99023, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "signif-", "bbox": {"l": 260.35001, "t": 502.15341, "r": 286.36237, "b": 511.05997, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "icantly outperforms existing state-of-the-art metrics,", "bbox": {"l": 70.037003, "t": 514.1084000000001, "r": 286.3649, "b": 523.01495, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "while being much more efficient in training and infer-", "bbox": {"l": 70.037003, "t": 526.06439, "r": 286.36487, "b": 534.97095, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "ence to existing works.", "bbox": {"l": 70.037003, "t": 538.0193899999999, "r": 161.65305, "b": 546.9259500000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u00b7 Across all benchmark datasets TableFormer significantly outperforms existing state-of-the-art metrics, while being much more efficient in training and inference to existing works."}, {"label": "list_item", "id": 9, "page_no": 1, "cluster": {"id": 9, "label": "list_item", "bbox": {"l": 61.569, "t": 559.63684, "r": 286.36493, "b": 592.57295, "coord_origin": "TOPLEFT"}, "confidence": 0.9802963733673096, "cells": [{"id": 50, "text": "\u2022", "bbox": {"l": 61.569, "t": 559.75639, "r": 71.115913, "b": 568.66295, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "We present", "bbox": {"l": 73.502647, "t": 559.75639, "r": 116.71199, "b": 568.66295, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "SynthTabNet", "bbox": {"l": 121.583, "t": 559.63684, "r": 177.68239, "b": 568.59322, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "a synthetically generated", "bbox": {"l": 182.55301, "t": 559.75639, "r": 286.36328, "b": 568.66295, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "dataset, with various appearance styles and complex-", "bbox": {"l": 70.03701, "t": 571.7114, "r": 286.36493, "b": 580.6179500000001, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "ity.", "bbox": {"l": 70.03701, "t": 583.6664000000001, "r": 82.400597, "b": 592.57295, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u00b7 We present SynthTabNet a synthetically generated dataset, with various appearance styles and complexity."}, {"label": "list_item", "id": 8, "page_no": 1, "cluster": {"id": 8, "label": "list_item", "bbox": {"l": 61.569008000000004, "t": 605.4034, "r": 286.36508, "b": 638.22095, "coord_origin": "TOPLEFT"}, "confidence": 0.9806395173072815, "cells": [{"id": 56, "text": "\u2022", "bbox": {"l": 61.569008000000004, "t": 605.4034, "r": 72.332527, "b": 614.30995, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "An augmented dataset based on PubTabNet [37],", "bbox": {"l": 75.023399, "t": 605.4034, "r": 286.36508, "b": 614.30995, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "FinTabNet [36], and TableBank [17] with generated", "bbox": {"l": 70.03701, "t": 617.3584, "r": 286.36487, "b": 626.26495, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "ground-truth for reproducibility.", "bbox": {"l": 70.03701, "t": 629.31439, "r": 198.05641, "b": 638.22095, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u00b7 An augmented dataset based on PubTabNet [37], FinTabNet [36], and TableBank [17] with generated ground-truth for reproducibility."}, {"label": "text", "id": 11, "page_no": 1, "cluster": {"id": 11, "label": "text", "bbox": {"l": 50.112007, "t": 650.59839, "r": 286.36511, "b": 695.369957, "coord_origin": "TOPLEFT"}, "confidence": 0.9742533564567566, "cells": [{"id": 60, "text": "The paper is structured as follows. In Sec. 2, we give", "bbox": {"l": 62.067009000000006, "t": 650.59839, "r": 286.36496, "b": 659.50494, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "a brief overview of the current state-of-the-art. In Sec. 3,", "bbox": {"l": 50.112007, "t": 662.55339, "r": 286.36511, "b": 671.45995, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "we describe the datasets on which we train. In Sec. 4, we", "bbox": {"l": 50.112007, "t": 674.50839, "r": 286.36511, "b": 683.41496, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "introduce the TableFormer model-architecture and describe", "bbox": {"l": 50.112007, "t": 686.46339, "r": 286.36511, "b": 695.369957, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The paper is structured as follows. In Sec. 2, we give a brief overview of the current state-of-the-art. In Sec. 3, we describe the datasets on which we train. In Sec. 4, we introduce the TableFormer model-architecture and describe"}, {"label": "footnote", "id": 14, "page_no": 1, "cluster": {"id": 14, "label": "footnote", "bbox": {"l": 60.97100100000001, "t": 705.596275, "r": 183.73055, "b": 712.721542, "coord_origin": "TOPLEFT"}, "confidence": 0.895367443561554, "cells": [{"id": 64, "text": "$^{1}$https://github.com/IBM/SynthTabNet", "bbox": {"l": 60.97100100000001, "t": 705.596275, "r": 183.73055, "b": 712.721542, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "$^{1}$https://github.com/IBM/SynthTabNet"}, {"label": "text", "id": 10, "page_no": 1, "cluster": {"id": 10, "label": "text", "bbox": {"l": 308.862, "t": 75.20836999999995, "r": 545.11511, "b": 108.02495999999985, "coord_origin": "TOPLEFT"}, "confidence": 0.9774322509765625, "cells": [{"id": 65, "text": "its results & performance in Sec. 5. As a conclusion, we de-", "bbox": {"l": 308.862, "t": 75.20836999999995, "r": 545.11511, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "scribe how this new model-architecture can be re-purposed", "bbox": {"l": 308.862, "t": 87.16339000000005, "r": 545.11505, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "for other tasks in the computer-vision community.", "bbox": {"l": 308.862, "t": 99.11841000000004, "r": 508.08417000000003, "b": 108.02495999999985, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "its results & performance in Sec. 5. As a conclusion, we describe how this new model-architecture can be re-purposed for other tasks in the computer-vision community."}, {"label": "section_header", "id": 13, "page_no": 1, "cluster": {"id": 13, "label": "section_header", "bbox": {"l": 308.862, "t": 121.73193000000003, "r": 498.28021, "b": 132.47968000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9428724646568298, "cells": [{"id": 68, "text": "2.", "bbox": {"l": 308.862, "t": 121.73193000000003, "r": 315.5831, "b": 132.47968000000003, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "Previous work and State of the Art", "bbox": {"l": 324.54456, "t": 121.73193000000003, "r": 498.28021, "b": 132.47968000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2. Previous work and State of the Art"}, {"label": "text", "id": 0, "page_no": 1, "cluster": {"id": 0, "label": "text", "bbox": {"l": 308.862, "t": 142.22136999999998, "r": 545.11517, "b": 330.45502, "coord_origin": "TOPLEFT"}, "confidence": 0.987194836139679, "cells": [{"id": 70, "text": "Identifying the structure of a table has been an outstand-", "bbox": {"l": 320.81699, "t": 142.22136999999998, "r": 545.11493, "b": 151.12793, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "ing problem in the document-parsing community, that mo-", "bbox": {"l": 308.862, "t": 154.17638999999997, "r": 545.11505, "b": 163.08294999999998, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "tivates many organised public challenges [6, 4, 14].", "bbox": {"l": 308.862, "t": 166.13140999999996, "r": 522.55975, "b": 175.03796, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "The", "bbox": {"l": 529.62323, "t": 166.13140999999996, "r": 545.11505, "b": 175.03796, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "difficulty of the problem can be attributed to a number of", "bbox": {"l": 308.862, "t": 178.08642999999995, "r": 545.11517, "b": 186.99298, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "factors. First, there is a large variety in the shapes and sizes", "bbox": {"l": 308.862, "t": 190.04143999999997, "r": 545.11511, "b": 198.94799999999998, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "of tables.", "bbox": {"l": 308.862, "t": 201.99645999999996, "r": 346.97891, "b": 210.90301999999997, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "Such large variety requires a flexible method.", "bbox": {"l": 354.86929, "t": 201.99645999999996, "r": 545.11511, "b": 210.90301999999997, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "This is especially true for complex column- and row head-", "bbox": {"l": 308.862, "t": 213.95245, "r": 545.11505, "b": 222.85901, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "ers, which can be extremely intricate and demanding.", "bbox": {"l": 308.862, "t": 225.90747, "r": 530.9184, "b": 234.81403, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "A", "bbox": {"l": 537.92212, "t": 225.90747, "r": 545.11511, "b": 234.81403, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "second factor of complexity is the lack of data with regard", "bbox": {"l": 308.862, "t": 237.86248999999998, "r": 545.11517, "b": 246.76904000000002, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "to table-structure. Until the publication of PubTabNet [37],", "bbox": {"l": 308.862, "t": 249.8175, "r": 545.11511, "b": 258.72406, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "there were no large datasets (i.e.", "bbox": {"l": 308.862, "t": 261.77252, "r": 439.8402699999999, "b": 270.67908, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": ">", "bbox": {"l": 444.43999999999994, "t": 261.61310000000003, "r": 452.1889, "b": 270.45989999999995, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "100", "bbox": {"l": 455.89001, "t": 261.61310000000003, "r": 470.83392000000003, "b": 270.45989999999995, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "K tables) that pro-", "bbox": {"l": 470.83401, "t": 261.77252, "r": 545.11517, "b": 270.67908, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "vided structure information. This happens primarily due to", "bbox": {"l": 308.862, "t": 273.72748, "r": 545.11511, "b": 282.63406, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "the fact that tables are notoriously time-consuming to an-", "bbox": {"l": 308.862, "t": 285.6835, "r": 545.11511, "b": 294.59006, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "notate by hand. However, this has definitely changed in re-", "bbox": {"l": 308.862, "t": 297.63849, "r": 545.11511, "b": 306.54504, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "cent years with the deliverance of PubTabNet [37], FinTab-", "bbox": {"l": 308.862, "t": 309.59348, "r": 545.11517, "b": 318.50003000000004, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "Net [36], TableBank [17] etc.", "bbox": {"l": 308.862, "t": 321.54846, "r": 425.92255, "b": 330.45502, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Identifying the structure of a table has been an outstanding problem in the document-parsing community, that motivates many organised public challenges [6, 4, 14]. The difficulty of the problem can be attributed to a number of factors. First, there is a large variety in the shapes and sizes of tables. Such large variety requires a flexible method. This is especially true for complex column- and row headers, which can be extremely intricate and demanding. A second factor of complexity is the lack of data with regard to table-structure. Until the publication of PubTabNet [37], there were no large datasets (i.e. > 100 K tables) that provided structure information. This happens primarily due to the fact that tables are notoriously time-consuming to annotate by hand. However, this has definitely changed in recent years with the deliverance of PubTabNet [37], FinTabNet [36], TableBank [17] etc."}, {"label": "text", "id": 1, "page_no": 1, "cluster": {"id": 1, "label": "text", "bbox": {"l": 308.862, "t": 333.56946, "r": 545.11523, "b": 450.0729099999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9869040250778198, "cells": [{"id": 92, "text": "Before the rising popularity of deep neural networks,", "bbox": {"l": 320.81699, "t": 333.56946, "r": 545.11499, "b": 342.47601, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "the community relied heavily on heuristic and/or statistical", "bbox": {"l": 308.862, "t": 345.52444, "r": 545.11499, "b": 354.43100000000004, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "methods to do table structure identification [3, 7, 11, 5, 13,", "bbox": {"l": 308.862, "t": 357.47943, "r": 545.11517, "b": 366.38599, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "28]. Although such methods work well on constrained ta-", "bbox": {"l": 308.862, "t": 369.43542, "r": 545.11511, "b": 378.34198, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "bles [12], a more data-driven approach can be applied due", "bbox": {"l": 308.862, "t": 381.39041, "r": 545.11505, "b": 390.29697, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "to the advent of convolutional neural networks (CNNs) and", "bbox": {"l": 308.862, "t": 393.3453999999999, "r": 545.11505, "b": 402.25195, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "the availability of large datasets. To the best-of-our knowl-", "bbox": {"l": 308.862, "t": 405.30038, "r": 545.11517, "b": 414.20694, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "edge, there are currently two different types of network ar-", "bbox": {"l": 308.862, "t": 417.25537, "r": 545.11523, "b": 426.16193, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "chitecture that are being pursued for state-of-the-art table-", "bbox": {"l": 308.862, "t": 429.21136000000007, "r": 545.11511, "b": 438.11792, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "structure identification.", "bbox": {"l": 308.862, "t": 441.16635, "r": 401.28503, "b": 450.0729099999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Before the rising popularity of deep neural networks, the community relied heavily on heuristic and/or statistical methods to do table structure identification [3, 7, 11, 5, 13, 28]. Although such methods work well on constrained tables [12], a more data-driven approach can be applied due to the advent of convolutional neural networks (CNNs) and the availability of large datasets. To the best-of-our knowledge, there are currently two different types of network architecture that are being pursued for state-of-the-art tablestructure identification."}, {"label": "text", "id": 3, "page_no": 1, "cluster": {"id": 3, "label": "text", "bbox": {"l": 308.86197, "t": 453.06778, "r": 545.11688, "b": 713.151848, "coord_origin": "TOPLEFT"}, "confidence": 0.9843218326568604, "cells": [{"id": 102, "text": "Image-to-Text networks", "bbox": {"l": 320.81699, "t": 453.06778, "r": 423.26236, "b": 462.02417, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": ": In this type of network, one", "bbox": {"l": 423.26697, "t": 453.18735, "r": 545.10956, "b": 462.0939, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "predicts a sequence of tokens starting from an encoded", "bbox": {"l": 308.86197, "t": 465.14233, "r": 545.11511, "b": 474.04889, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "image.", "bbox": {"l": 308.86197, "t": 477.09732, "r": 335.7012, "b": 486.00388, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "Such sequences of tokens can be HTML table", "bbox": {"l": 345.85309, "t": 477.09732, "r": 545.11505, "b": 486.00388, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "tags [37, 17] or LaTeX symbols[10]. The choice of sym-", "bbox": {"l": 308.86197, "t": 489.05231, "r": 545.11493, "b": 497.95886, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "bols is ultimately not very important, since one can be trans-", "bbox": {"l": 308.86197, "t": 501.00729, "r": 545.11499, "b": 509.91385, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "formed into the other. There are however subtle variations", "bbox": {"l": 308.86197, "t": 512.9632899999999, "r": 545.11505, "b": 521.8698400000001, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "in the Image-to-Text networks. The easiest network archi-", "bbox": {"l": 308.86197, "t": 524.91827, "r": 545.11505, "b": 533.82483, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "tectures are \u201cimage-encoder", "bbox": {"l": 308.86197, "t": 536.87328, "r": 420.94119, "b": 545.77983, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "\u2192", "bbox": {"l": 423.59497, "t": 536.1559599999999, "r": 433.5575600000001, "b": 545.56065, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "text-decoder\u201d (IETD), sim-", "bbox": {"l": 436.21198, "t": 536.87328, "r": 545.11316, "b": 545.77983, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "ilar to network architectures that try to provide captions to", "bbox": {"l": 308.86197, "t": 548.82828, "r": 545.11511, "b": 557.73483, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "images [32]. In these IETD networks, one expects as output", "bbox": {"l": 308.86197, "t": 560.78328, "r": 545.11493, "b": 569.68983, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "the LaTeX/HTML string of the entire table, i.e. the sym-", "bbox": {"l": 308.86197, "t": 572.73828, "r": 545.11499, "b": 581.6448399999999, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "bols necessary for creating the table with the content of the", "bbox": {"l": 308.86197, "t": 584.69427, "r": 545.11505, "b": 593.60083, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "table. Another approach is the \u201cimage-encoder", "bbox": {"l": 308.86197, "t": 596.6492800000001, "r": 497.07541, "b": 605.55583, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "\u2192", "bbox": {"l": 499.80496, "t": 595.93196, "r": 509.76755, "b": 605.33665, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "dual de-", "bbox": {"l": 512.50098, "t": 596.6492800000001, "r": 545.10852, "b": 605.55583, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "coder\u201d (IEDD) networks. In these type of networks, one has", "bbox": {"l": 308.86197, "t": 608.60428, "r": 545.11511, "b": 617.5108299999999, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "two consecutive decoders with different purposes. The first", "bbox": {"l": 308.86197, "t": 620.55928, "r": 545.11505, "b": 629.46584, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "decoder is the", "bbox": {"l": 308.86197, "t": 632.51428, "r": 364.78201, "b": 641.42084, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "tag-decoder", "bbox": {"l": 367.57397, "t": 632.60394, "r": 415.61362, "b": 641.1917, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": ", i.e. it only produces the HTM-", "bbox": {"l": 415.61298, "t": 632.51428, "r": 545.11688, "b": 641.42084, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "L/LaTeX tags which construct an empty table. The second", "bbox": {"l": 308.86197, "t": 644.46928, "r": 545.11511, "b": 653.37584, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "content-decoder", "bbox": {"l": 308.86197, "t": 656.51494, "r": 373.59894, "b": 665.1027, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "uses the encoding of the image in combi-", "bbox": {"l": 376.90698, "t": 656.4252799999999, "r": 545.11548, "b": 665.33184, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "nation with the output encoding of each cell-tag (from the", "bbox": {"l": 308.862, "t": 668.38028, "r": 545.11517, "b": 677.28684, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "tag-decoder", "bbox": {"l": 308.862, "t": 680.42494, "r": 356.90164, "b": 689.0127, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": ") to generate the textual content of each table", "bbox": {"l": 357.13101, "t": 680.33528, "r": 545.1153, "b": 689.24184, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "cell. The network architecture of IEDD is certainly more", "bbox": {"l": 308.862, "t": 692.290283, "r": 545.11511, "b": 701.196846, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "elaborate, but it has the advantage that one can pre-train the", "bbox": {"l": 308.862, "t": 704.245285, "r": 545.11517, "b": 713.151848, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Image-to-Text networks : In this type of network, one predicts a sequence of tokens starting from an encoded image. Such sequences of tokens can be HTML table tags [37, 17] or LaTeX symbols[10]. The choice of symbols is ultimately not very important, since one can be transformed into the other. There are however subtle variations in the Image-to-Text networks. The easiest network architectures are \"image-encoder \u2192 text-decoder\" (IETD), similar to network architectures that try to provide captions to images [32]. In these IETD networks, one expects as output the LaTeX/HTML string of the entire table, i.e. the symbols necessary for creating the table with the content of the table. Another approach is the \"image-encoder \u2192 dual decoder\" (IEDD) networks. In these type of networks, one has two consecutive decoders with different purposes. The first decoder is the tag-decoder , i.e. it only produces the HTML/LaTeX tags which construct an empty table. The second content-decoder uses the encoding of the image in combination with the output encoding of each cell-tag (from the tag-decoder ) to generate the textual content of each table cell. The network architecture of IEDD is certainly more elaborate, but it has the advantage that one can pre-train the"}], "headers": [{"label": "page_footer", "id": 15, "page_no": 1, "cluster": {"id": 15, "label": "page_footer", "bbox": {"l": 295.121, "t": 734.133282, "r": 300.10229, "b": 743.039845, "coord_origin": "TOPLEFT"}, "confidence": 0.8778094053268433, "cells": [{"id": 134, "text": "2", "bbox": {"l": 295.121, "t": 734.133282, "r": 300.10229, "b": 743.039845, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2"}]}}, {"page_no": 2, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "tag-decoder which is constrained to the table-tags.", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 250.15102, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "In", "bbox": {"l": 62.067001, "t": 87.21935999999994, "r": 70.365845, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "practice,", "bbox": {"l": 76.931198, "t": 87.21935999999994, "r": 110.95348000000001, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "both", "bbox": {"l": 118.54498, "t": 87.21935999999994, "r": 136.25848, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "network", "bbox": {"l": 142.82384, "t": 87.21935999999994, "r": 175.37166, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "architectures", "bbox": {"l": 181.94698, "t": 87.21935999999994, "r": 232.83594000000002, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "(IETD", "bbox": {"l": 239.41125, "t": 87.21935999999994, "r": 265.41364, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "and", "bbox": {"l": 271.979, "t": 87.21935999999994, "r": 286.36499, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "IEDD) require an implicit, custom trained object-character-", "bbox": {"l": 50.112, "t": 99.17437999999993, "r": 286.36505, "b": 108.08092999999997, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "recognition (OCR) to obtain the content of the table-cells.", "bbox": {"l": 50.112, "t": 111.13036999999997, "r": 286.36511, "b": 120.03692999999998, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "In the case of IETD, this OCR engine is implicit in the de-", "bbox": {"l": 50.112, "t": 123.08538999999996, "r": 286.36505, "b": 131.99194, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "coder similar to [24]. For the IEDD, the OCR is solely em-", "bbox": {"l": 50.112, "t": 135.04040999999995, "r": 286.36514, "b": 143.94696, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "bedded in the content-decoder. This reliance on a custom,", "bbox": {"l": 50.112, "t": 146.99541999999997, "r": 286.36511, "b": 155.90197999999998, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "implicit OCR decoder is of course problematic. OCR is a", "bbox": {"l": 50.112, "t": 158.95043999999996, "r": 286.36505, "b": 167.85699, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "well known and extremely tough problem, that often needs", "bbox": {"l": 50.112, "t": 170.90545999999995, "r": 286.36508, "b": 179.81201, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "custom training for each individual language. However, the", "bbox": {"l": 50.112, "t": 182.86145, "r": 286.36508, "b": 191.76801, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "limited availability for non-english content in the current", "bbox": {"l": 50.112, "t": 194.81646999999998, "r": 286.36511, "b": 203.72302000000002, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "datasets, makes it impractical to apply the IETD and IEDD", "bbox": {"l": 50.112, "t": 206.77148, "r": 286.36511, "b": 215.67804, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "methods on tables with other languages. Additionally, OCR", "bbox": {"l": 50.112, "t": 218.7265, "r": 286.36505, "b": 227.63306, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "can be completely omitted if the tables originate from pro-", "bbox": {"l": 50.112, "t": 230.68151999999998, "r": 286.36505, "b": 239.58807000000002, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "grammatic PDF documents with known positions of each", "bbox": {"l": 50.112, "t": 242.63653999999997, "r": 286.36511, "b": 251.54309, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "cell. The latter was the inspiration for the work of this pa-", "bbox": {"l": 50.112, "t": 254.59253, "r": 286.36508, "b": 263.49908000000005, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "per.", "bbox": {"l": 50.112, "t": 266.54755, "r": 64.776947, "b": 275.45410000000004, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Graph Neural networks", "bbox": {"l": 62.067001, "t": 278.43895999999995, "r": 171.56593, "b": 287.39536, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": ":", "bbox": {"l": 171.56799, "t": 278.55853, "r": 174.3376, "b": 287.46509, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "Graph Neural networks", "bbox": {"l": 185.18687, "t": 278.55853, "r": 286.35709, "b": 287.46509, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "(GNN\u2019s) take a radically different approach to table-", "bbox": {"l": 50.111992, "t": 290.51453000000004, "r": 286.36511, "b": 299.42108, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "structure extraction.", "bbox": {"l": 50.111992, "t": 302.46950999999996, "r": 131.16771, "b": 311.37607, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Note that one table cell can consti-", "bbox": {"l": 138.84888, "t": 302.46950999999996, "r": 286.36508, "b": 311.37607, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "tute out of multiple text-cells. To obtain the table-structure,", "bbox": {"l": 50.111992, "t": 314.4245, "r": 286.36505, "b": 323.33105, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "one creates an initial graph, where each of the text-cells", "bbox": {"l": 50.111992, "t": 326.37949000000003, "r": 286.36508, "b": 335.28604, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "becomes a node in the graph similar to [33, 34, 2]. Each", "bbox": {"l": 50.111992, "t": 338.33447, "r": 286.36505, "b": 347.2410300000001, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "node is then associated with en embedding vector coming", "bbox": {"l": 50.111992, "t": 350.28946, "r": 286.36505, "b": 359.19601, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "from the encoded image, its coordinates and the encoded", "bbox": {"l": 50.111992, "t": 362.24545000000006, "r": 286.36508, "b": 371.15201, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "text. Furthermore, nodes that represent adjacent text-cells", "bbox": {"l": 50.111992, "t": 374.20044, "r": 286.36508, "b": 383.10699, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "are linked. Graph Convolutional Networks (GCN\u2019s) based", "bbox": {"l": 50.111992, "t": 386.15542999999997, "r": 286.36508, "b": 395.06198, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "methods take the image as an input, but also the position of", "bbox": {"l": 50.111992, "t": 398.11041000000006, "r": 286.36508, "b": 407.01697, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "the text-cells and their content [18]. The purpose of a GCN", "bbox": {"l": 50.111992, "t": 410.0654, "r": 286.36508, "b": 418.97195, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "is to transform the input graph into a new graph, which re-", "bbox": {"l": 50.111992, "t": 422.02038999999996, "r": 286.36505, "b": 430.92694, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "places the old links with new ones.", "bbox": {"l": 50.111992, "t": 433.97638, "r": 198.2359, "b": 442.88293, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "The new links then", "bbox": {"l": 205.92703, "t": 433.97638, "r": 286.36505, "b": 442.88293, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "represent the table-structure. With this approach, one can", "bbox": {"l": 50.111992, "t": 445.93137, "r": 286.36508, "b": 454.83792000000005, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "avoid the need to build custom OCR decoders. However,", "bbox": {"l": 50.111992, "t": 457.88635, "r": 286.36505, "b": 466.79291, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "the quality of the reconstructed structure is not comparable", "bbox": {"l": 50.111992, "t": 469.84134, "r": 286.36505, "b": 478.74789, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "to the current state-of-the-art [18].", "bbox": {"l": 50.111992, "t": 481.79633, "r": 186.49998, "b": 490.70288, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Hybrid Deep Learning-Rule-Based approach", "bbox": {"l": 62.066994, "t": 493.68875, "r": 252.88068000000004, "b": 502.64514, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": ": A pop-", "bbox": {"l": 252.88199, "t": 493.80832, "r": 286.36627, "b": 502.71487, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "ular current model for table-structure identification is the", "bbox": {"l": 50.111984, "t": 505.76331, "r": 286.36505, "b": 514.66986, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "use of a hybrid Deep Learning-Rule-Based approach similar", "bbox": {"l": 50.111984, "t": 517.71829, "r": 286.36505, "b": 526.6248499999999, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "to [27, 29]. In this approach, one first detects the position of", "bbox": {"l": 50.111984, "t": 529.67328, "r": 286.36508, "b": 538.57985, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "the table-cells with object detection (e.g. YoloVx or Mask-", "bbox": {"l": 50.111984, "t": 541.62929, "r": 286.36508, "b": 550.53584, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "RCNN), then classifies the table into different types (from", "bbox": {"l": 50.111984, "t": 553.58429, "r": 286.36511, "b": 562.4908399999999, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "its images) and finally uses different rule-sets to obtain", "bbox": {"l": 50.111984, "t": 565.5392899999999, "r": 286.36511, "b": 574.44585, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "its table-structure. Currently, this approach achieves state-", "bbox": {"l": 50.111984, "t": 577.49429, "r": 286.36502, "b": 586.40085, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "of-the-art results, but is not an end-to-end deep-learning", "bbox": {"l": 50.111984, "t": 589.4493, "r": 286.36505, "b": 598.35585, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "method. As such, new rules need to be written if different", "bbox": {"l": 50.111984, "t": 601.4043, "r": 286.36502, "b": 610.31085, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "types of tables are encountered.", "bbox": {"l": 50.111984, "t": 613.36029, "r": 175.98943, "b": 622.26685, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "3.", "bbox": {"l": 50.111984, "t": 635.94484, "r": 57.82375699999999, "b": 646.6925699999999, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Datasets", "bbox": {"l": 68.106125, "t": 635.94484, "r": 105.22546, "b": 646.6925699999999, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "We rely on large-scale datasets such as PubTabNet [37],", "bbox": {"l": 62.06698600000001, "t": 656.42529, "r": 286.36493, "b": 665.33186, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "FinTabNet [36], and TableBank [17] datasets to train and", "bbox": {"l": 50.111984, "t": 668.38029, "r": 286.36508, "b": 677.2868599999999, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "evaluate our models. These datasets span over various ap-", "bbox": {"l": 50.111984, "t": 680.3353, "r": 286.36502, "b": 689.24186, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "pearance styles and content.", "bbox": {"l": 50.111984, "t": 692.290298, "r": 166.24602, "b": 701.196861, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "We also introduce our own", "bbox": {"l": 173.68808, "t": 692.290298, "r": 286.36508, "b": 701.196861, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "synthetically generated SynthTabNet dataset to fix an im-", "bbox": {"l": 50.111984, "t": 704.2453, "r": 286.36505, "b": 713.151863, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "PubTabNet + FinTabNet", "bbox": {"l": 380.79849, "t": 79.81176999999991, "r": 486.84909, "b": 88.55975000000001, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "Rows / Columns", "bbox": {"l": 396.76776, "t": 242.02697999999998, "r": 469.78748, "b": 250.77495999999996, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "0", "bbox": {"l": 320.97653, "t": 233.42296999999996, "r": 324.79254, "b": 239.255, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "20", "bbox": {"l": 410.483, "t": 233.42296999999996, "r": 418.11319, "b": 239.255, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "40", "bbox": {"l": 500.84949, "t": 233.42296999999996, "r": 508.47968000000003, "b": 239.255, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "10", "bbox": {"l": 365.29999, "t": 233.42296999999996, "r": 372.93018, "b": 239.255, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "30", "bbox": {"l": 455.66626, "t": 233.42296999999996, "r": 463.29645, "b": 239.255, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "50", "bbox": {"l": 542.03528, "t": 233.42296999999996, "r": 549.66547, "b": 239.255, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "0", "bbox": {"l": 316.04474, "t": 230.44617000000005, "r": 319.86075, "b": 236.27819999999997, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "2", "bbox": {"l": 312.62521, "t": 198.69073000000003, "r": 316.44122, "b": 204.52277000000004, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "0", "bbox": {"l": 316.43942, "t": 198.69073000000003, "r": 320.2554, "b": 204.52277000000004, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "4", "bbox": {"l": 313.14951, "t": 168.09795999999994, "r": 316.96552, "b": 173.92998999999998, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "0", "bbox": {"l": 316.96371, "t": 168.09795999999994, "r": 320.77969, "b": 173.92998999999998, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "6", "bbox": {"l": 312.92972, "t": 136.58771000000002, "r": 316.74573, "b": 142.41974000000005, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "0", "bbox": {"l": 316.74393, "t": 136.58771000000002, "r": 320.55991, "b": 142.41974000000005, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "8", "bbox": {"l": 312.48227, "t": 105.60175000000004, "r": 316.29828, "b": 111.43377999999996, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "0", "bbox": {"l": 316.29648, "t": 105.60175000000004, "r": 320.11246, "b": 111.43377999999996, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "1", "bbox": {"l": 312.48227, "t": 212.25922000000003, "r": 316.29828, "b": 218.09124999999995, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "0", "bbox": {"l": 316.29648, "t": 212.25922000000003, "r": 320.11246, "b": 218.09124999999995, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "3", "bbox": {"l": 313.07639, "t": 183.72198000000003, "r": 316.8924, "b": 189.55402000000004, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "0", "bbox": {"l": 316.89059, "t": 183.72198000000003, "r": 320.70657, "b": 189.55402000000004, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "5", "bbox": {"l": 312.76321, "t": 152.47400000000005, "r": 316.57922, "b": 158.30602999999996, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "0", "bbox": {"l": 316.57742, "t": 152.47400000000005, "r": 320.3934, "b": 158.30602999999996, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "7", "bbox": {"l": 312.19775, "t": 120.57050000000004, "r": 316.01376, "b": 126.40252999999996, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "0", "bbox": {"l": 316.01196, "t": 120.57050000000004, "r": 319.82794, "b": 126.40252999999996, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "9", "bbox": {"l": 312.8165, "t": 90.1087, "r": 316.63251, "b": 95.94073000000003, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "0", "bbox": {"l": 316.63071, "t": 90.1087, "r": 320.44669, "b": 95.94073000000003, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "0", "bbox": {"l": 532.17426, "t": 222.72729000000004, "r": 536.94427, "b": 230.01727000000005, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "10K", "bbox": {"l": 532.87952, "t": 108.26702999999986, "r": 547.61249, "b": 115.55700999999999, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "8K", "bbox": {"l": 532.7735, "t": 130.78101000000004, "r": 542.73877, "b": 138.07097999999996, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "6K", "bbox": {"l": 532.79901, "t": 153.92352000000005, "r": 542.76428, "b": 161.21349999999995, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "4K", "bbox": {"l": 532.5705, "t": 176.75800000000004, "r": 542.53577, "b": 184.04796999999996, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "2K", "bbox": {"l": 532.14551, "t": 199.6463, "r": 542.11078, "b": 206.93628, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "Figure 2:", "bbox": {"l": 308.862, "t": 267.83636, "r": 346.06238, "b": 276.74292, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "Distribution of the tables across different table", "bbox": {"l": 354.49072, "t": 267.83636, "r": 545.11511, "b": 276.74292, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "dimensions in PubTabNet + FinTabNet datasets", "bbox": {"l": 308.862, "t": 279.79132000000004, "r": 498.56989, "b": 288.6979099999999, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "balance in the previous datasets.", "bbox": {"l": 308.862, "t": 317.47336, "r": 437.27002, "b": 326.37991, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "The PubTabNet dataset contains 509k tables delivered as", "bbox": {"l": 320.81699, "t": 331.53137, "r": 545.11505, "b": 340.43793, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "annotated PNG images. The annotations consist of the table", "bbox": {"l": 308.862, "t": 343.48635999999993, "r": 545.11517, "b": 352.39291, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "structure represented in HTML format, the tokenized text", "bbox": {"l": 308.862, "t": 355.44235, "r": 545.11505, "b": 364.34890999999993, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "and its bounding boxes per table cell. Fig. 1 shows the ap-", "bbox": {"l": 308.862, "t": 367.39734, "r": 545.11505, "b": 376.30389, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "pearance style of PubTabNet. Depending on its complexity,", "bbox": {"l": 308.862, "t": 379.35233, "r": 545.11511, "b": 388.25888, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "a table is characterized as \u201csimple\u201d when it does not contain", "bbox": {"l": 308.862, "t": 391.30731, "r": 545.11511, "b": 400.21386999999993, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "row spans or column spans, otherwise it is \u201ccomplex\u201d. The", "bbox": {"l": 308.862, "t": 403.26230000000004, "r": 545.11505, "b": 412.16885, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "dataset is divided into Train and Val splits (roughly 98% and", "bbox": {"l": 308.862, "t": 415.21729, "r": 545.11511, "b": 424.12384, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "2%). The Train split consists of 54% simple and 46% com-", "bbox": {"l": 308.862, "t": 427.17328, "r": 545.11517, "b": 436.0798300000001, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "plex tables and the Val split of 51% and 49% respectively.", "bbox": {"l": 308.862, "t": 439.12827, "r": 545.11517, "b": 448.03482, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "The FinTabNet dataset contains 112k tables delivered as", "bbox": {"l": 308.862, "t": 451.08325, "r": 545.11511, "b": 459.98981000000003, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "single-page PDF documents with mixed table structures and", "bbox": {"l": 308.862, "t": 463.03824, "r": 545.11505, "b": 471.94479, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "text content. Similarly to the PubTabNet, the annotations", "bbox": {"l": 308.862, "t": 474.99323, "r": 545.11511, "b": 483.89978, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "of FinTabNet include the table structure in HTML, the to-", "bbox": {"l": 308.862, "t": 486.94922, "r": 545.11511, "b": 495.85577, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "kenized text and the bounding boxes on a table cell basis.", "bbox": {"l": 308.862, "t": 498.90421, "r": 545.11511, "b": 507.81076, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "The dataset is divided into Train, Test and Val splits (81%,", "bbox": {"l": 308.862, "t": 510.85919, "r": 545.11517, "b": 519.76575, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "9.5%, 9.5%), and each one is almost equally divided into", "bbox": {"l": 308.862, "t": 522.8141800000001, "r": 545.11517, "b": 531.72073, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "simple and complex tables (Train: 48% simple, 52% com-", "bbox": {"l": 308.862, "t": 534.76917, "r": 545.11505, "b": 543.67574, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "plex, Test: 48% simple, 52% complex, Test: 53% simple,", "bbox": {"l": 308.862, "t": 546.72418, "r": 545.11511, "b": 555.6307400000001, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "47% complex). Finally the TableBank dataset consists of", "bbox": {"l": 308.862, "t": 558.6801800000001, "r": 545.11511, "b": 567.58673, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "145k tables provided as JPEG images. The latter has anno-", "bbox": {"l": 308.862, "t": 570.63518, "r": 545.11505, "b": 579.54173, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "tations for the table structure, but only few with bounding", "bbox": {"l": 308.862, "t": 582.59018, "r": 545.11499, "b": 591.49673, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "boxes of the table cells. The entire dataset consists of sim-", "bbox": {"l": 308.862, "t": 594.54518, "r": 545.11517, "b": 603.45174, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "ple tables and it is divided into 90% Train, 3% Test and 7%", "bbox": {"l": 308.862, "t": 606.50018, "r": 545.11511, "b": 615.40674, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "Val splits.", "bbox": {"l": 308.862, "t": 618.45518, "r": 348.16446, "b": 627.36174, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "Due to the heterogeneity across the dataset formats, it", "bbox": {"l": 320.81699, "t": 632.51419, "r": 545.11487, "b": 641.42075, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "was necessary to combine all available data into one homog-", "bbox": {"l": 308.862, "t": 644.46919, "r": 545.11511, "b": 653.37575, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "enized dataset before we could train our models for practi-", "bbox": {"l": 308.862, "t": 656.42419, "r": 545.11511, "b": 665.33076, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "cal purposes. Given the size of PubTabNet, we adopted its", "bbox": {"l": 308.862, "t": 668.38019, "r": 545.11499, "b": 677.28676, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "annotation format and we extracted and converted all tables", "bbox": {"l": 308.862, "t": 680.33519, "r": 545.11505, "b": 689.24176, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "as PNG images with a resolution of 72 dpi. Additionally,", "bbox": {"l": 308.862, "t": 692.290192, "r": 545.11505, "b": 701.196762, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "we have filtered out tables with extreme sizes due to small", "bbox": {"l": 308.862, "t": 704.245193, "r": 545.11511, "b": 713.151764, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "3", "bbox": {"l": 295.121, "t": 734.133198, "r": 300.10229, "b": 743.039761, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 10, "label": "text", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 250.15102, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.8767216801643372, "cells": [{"id": 0, "text": "tag-decoder which is constrained to the table-tags.", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 250.15102, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "text", "bbox": {"l": 50.112, "t": 87.21935999999994, "r": 286.36514, "b": 275.45410000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9822593927383423, "cells": [{"id": 1, "text": "In", "bbox": {"l": 62.067001, "t": 87.21935999999994, "r": 70.365845, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "practice,", "bbox": {"l": 76.931198, "t": 87.21935999999994, "r": 110.95348000000001, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "both", "bbox": {"l": 118.54498, "t": 87.21935999999994, "r": 136.25848, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "network", "bbox": {"l": 142.82384, "t": 87.21935999999994, "r": 175.37166, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "architectures", "bbox": {"l": 181.94698, "t": 87.21935999999994, "r": 232.83594000000002, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "(IETD", "bbox": {"l": 239.41125, "t": 87.21935999999994, "r": 265.41364, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "and", "bbox": {"l": 271.979, "t": 87.21935999999994, "r": 286.36499, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "IEDD) require an implicit, custom trained object-character-", "bbox": {"l": 50.112, "t": 99.17437999999993, "r": 286.36505, "b": 108.08092999999997, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "recognition (OCR) to obtain the content of the table-cells.", "bbox": {"l": 50.112, "t": 111.13036999999997, "r": 286.36511, "b": 120.03692999999998, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "In the case of IETD, this OCR engine is implicit in the de-", "bbox": {"l": 50.112, "t": 123.08538999999996, "r": 286.36505, "b": 131.99194, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "coder similar to [24]. For the IEDD, the OCR is solely em-", "bbox": {"l": 50.112, "t": 135.04040999999995, "r": 286.36514, "b": 143.94696, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "bedded in the content-decoder. This reliance on a custom,", "bbox": {"l": 50.112, "t": 146.99541999999997, "r": 286.36511, "b": 155.90197999999998, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "implicit OCR decoder is of course problematic. OCR is a", "bbox": {"l": 50.112, "t": 158.95043999999996, "r": 286.36505, "b": 167.85699, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "well known and extremely tough problem, that often needs", "bbox": {"l": 50.112, "t": 170.90545999999995, "r": 286.36508, "b": 179.81201, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "custom training for each individual language. However, the", "bbox": {"l": 50.112, "t": 182.86145, "r": 286.36508, "b": 191.76801, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "limited availability for non-english content in the current", "bbox": {"l": 50.112, "t": 194.81646999999998, "r": 286.36511, "b": 203.72302000000002, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "datasets, makes it impractical to apply the IETD and IEDD", "bbox": {"l": 50.112, "t": 206.77148, "r": 286.36511, "b": 215.67804, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "methods on tables with other languages. Additionally, OCR", "bbox": {"l": 50.112, "t": 218.7265, "r": 286.36505, "b": 227.63306, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "can be completely omitted if the tables originate from pro-", "bbox": {"l": 50.112, "t": 230.68151999999998, "r": 286.36505, "b": 239.58807000000002, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "grammatic PDF documents with known positions of each", "bbox": {"l": 50.112, "t": 242.63653999999997, "r": 286.36511, "b": 251.54309, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "cell. The latter was the inspiration for the work of this pa-", "bbox": {"l": 50.112, "t": 254.59253, "r": 286.36508, "b": 263.49908000000005, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "per.", "bbox": {"l": 50.112, "t": 266.54755, "r": 64.776947, "b": 275.45410000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 50.111992, "t": 278.43895999999995, "r": 286.36511, "b": 490.70288, "coord_origin": "TOPLEFT"}, "confidence": 0.9878450036048889, "cells": [{"id": 23, "text": "Graph Neural networks", "bbox": {"l": 62.067001, "t": 278.43895999999995, "r": 171.56593, "b": 287.39536, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": ":", "bbox": {"l": 171.56799, "t": 278.55853, "r": 174.3376, "b": 287.46509, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "Graph Neural networks", "bbox": {"l": 185.18687, "t": 278.55853, "r": 286.35709, "b": 287.46509, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "(GNN\u2019s) take a radically different approach to table-", "bbox": {"l": 50.111992, "t": 290.51453000000004, "r": 286.36511, "b": 299.42108, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "structure extraction.", "bbox": {"l": 50.111992, "t": 302.46950999999996, "r": 131.16771, "b": 311.37607, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Note that one table cell can consti-", "bbox": {"l": 138.84888, "t": 302.46950999999996, "r": 286.36508, "b": 311.37607, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "tute out of multiple text-cells. To obtain the table-structure,", "bbox": {"l": 50.111992, "t": 314.4245, "r": 286.36505, "b": 323.33105, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "one creates an initial graph, where each of the text-cells", "bbox": {"l": 50.111992, "t": 326.37949000000003, "r": 286.36508, "b": 335.28604, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "becomes a node in the graph similar to [33, 34, 2]. Each", "bbox": {"l": 50.111992, "t": 338.33447, "r": 286.36505, "b": 347.2410300000001, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "node is then associated with en embedding vector coming", "bbox": {"l": 50.111992, "t": 350.28946, "r": 286.36505, "b": 359.19601, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "from the encoded image, its coordinates and the encoded", "bbox": {"l": 50.111992, "t": 362.24545000000006, "r": 286.36508, "b": 371.15201, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "text. Furthermore, nodes that represent adjacent text-cells", "bbox": {"l": 50.111992, "t": 374.20044, "r": 286.36508, "b": 383.10699, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "are linked. Graph Convolutional Networks (GCN\u2019s) based", "bbox": {"l": 50.111992, "t": 386.15542999999997, "r": 286.36508, "b": 395.06198, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "methods take the image as an input, but also the position of", "bbox": {"l": 50.111992, "t": 398.11041000000006, "r": 286.36508, "b": 407.01697, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "the text-cells and their content [18]. The purpose of a GCN", "bbox": {"l": 50.111992, "t": 410.0654, "r": 286.36508, "b": 418.97195, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "is to transform the input graph into a new graph, which re-", "bbox": {"l": 50.111992, "t": 422.02038999999996, "r": 286.36505, "b": 430.92694, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "places the old links with new ones.", "bbox": {"l": 50.111992, "t": 433.97638, "r": 198.2359, "b": 442.88293, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "The new links then", "bbox": {"l": 205.92703, "t": 433.97638, "r": 286.36505, "b": 442.88293, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "represent the table-structure. With this approach, one can", "bbox": {"l": 50.111992, "t": 445.93137, "r": 286.36508, "b": 454.83792000000005, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "avoid the need to build custom OCR decoders. However,", "bbox": {"l": 50.111992, "t": 457.88635, "r": 286.36505, "b": 466.79291, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "the quality of the reconstructed structure is not comparable", "bbox": {"l": 50.111992, "t": 469.84134, "r": 286.36505, "b": 478.74789, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "to the current state-of-the-art [18].", "bbox": {"l": 50.111992, "t": 481.79633, "r": 186.49998, "b": 490.70288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 50.111984, "t": 493.68875, "r": 286.36627, "b": 622.26685, "coord_origin": "TOPLEFT"}, "confidence": 0.9875094294548035, "cells": [{"id": 45, "text": "Hybrid Deep Learning-Rule-Based approach", "bbox": {"l": 62.066994, "t": 493.68875, "r": 252.88068000000004, "b": 502.64514, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": ": A pop-", "bbox": {"l": 252.88199, "t": 493.80832, "r": 286.36627, "b": 502.71487, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "ular current model for table-structure identification is the", "bbox": {"l": 50.111984, "t": 505.76331, "r": 286.36505, "b": 514.66986, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "use of a hybrid Deep Learning-Rule-Based approach similar", "bbox": {"l": 50.111984, "t": 517.71829, "r": 286.36505, "b": 526.6248499999999, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "to [27, 29]. In this approach, one first detects the position of", "bbox": {"l": 50.111984, "t": 529.67328, "r": 286.36508, "b": 538.57985, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "the table-cells with object detection (e.g. YoloVx or Mask-", "bbox": {"l": 50.111984, "t": 541.62929, "r": 286.36508, "b": 550.53584, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "RCNN), then classifies the table into different types (from", "bbox": {"l": 50.111984, "t": 553.58429, "r": 286.36511, "b": 562.4908399999999, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "its images) and finally uses different rule-sets to obtain", "bbox": {"l": 50.111984, "t": 565.5392899999999, "r": 286.36511, "b": 574.44585, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "its table-structure. Currently, this approach achieves state-", "bbox": {"l": 50.111984, "t": 577.49429, "r": 286.36502, "b": 586.40085, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "of-the-art results, but is not an end-to-end deep-learning", "bbox": {"l": 50.111984, "t": 589.4493, "r": 286.36505, "b": 598.35585, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "method. As such, new rules need to be written if different", "bbox": {"l": 50.111984, "t": 601.4043, "r": 286.36502, "b": 610.31085, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "types of tables are encountered.", "bbox": {"l": 50.111984, "t": 613.36029, "r": 175.98943, "b": 622.26685, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "section_header", "bbox": {"l": 50.111984, "t": 635.94484, "r": 105.22546, "b": 646.6925699999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9423062205314636, "cells": [{"id": 57, "text": "3.", "bbox": {"l": 50.111984, "t": 635.94484, "r": 57.82375699999999, "b": 646.6925699999999, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Datasets", "bbox": {"l": 68.106125, "t": 635.94484, "r": 105.22546, "b": 646.6925699999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 50.111984, "t": 656.42529, "r": 286.36508, "b": 713.151863, "coord_origin": "TOPLEFT"}, "confidence": 0.9862047433853149, "cells": [{"id": 59, "text": "We rely on large-scale datasets such as PubTabNet [37],", "bbox": {"l": 62.06698600000001, "t": 656.42529, "r": 286.36493, "b": 665.33186, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "FinTabNet [36], and TableBank [17] datasets to train and", "bbox": {"l": 50.111984, "t": 668.38029, "r": 286.36508, "b": 677.2868599999999, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "evaluate our models. These datasets span over various ap-", "bbox": {"l": 50.111984, "t": 680.3353, "r": 286.36502, "b": 689.24186, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "pearance styles and content.", "bbox": {"l": 50.111984, "t": 692.290298, "r": 166.24602, "b": 701.196861, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "We also introduce our own", "bbox": {"l": 173.68808, "t": 692.290298, "r": 286.36508, "b": 701.196861, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "synthetically generated SynthTabNet dataset to fix an im-", "bbox": {"l": 50.111984, "t": 704.2453, "r": 286.36505, "b": 713.151863, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "picture", "bbox": {"l": 312.10369873046875, "t": 78.44086456298828, "r": 550.38916015625, "b": 250.60984802246094, "coord_origin": "TOPLEFT"}, "confidence": 0.9746918082237244, "cells": [{"id": 65, "text": "PubTabNet + FinTabNet", "bbox": {"l": 380.79849, "t": 79.81176999999991, "r": 486.84909, "b": 88.55975000000001, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "Rows / Columns", "bbox": {"l": 396.76776, "t": 242.02697999999998, "r": 469.78748, "b": 250.77495999999996, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "0", "bbox": {"l": 320.97653, "t": 233.42296999999996, "r": 324.79254, "b": 239.255, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "20", "bbox": {"l": 410.483, "t": 233.42296999999996, "r": 418.11319, "b": 239.255, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "40", "bbox": {"l": 500.84949, "t": 233.42296999999996, "r": 508.47968000000003, "b": 239.255, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "10", "bbox": {"l": 365.29999, "t": 233.42296999999996, "r": 372.93018, "b": 239.255, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "30", "bbox": {"l": 455.66626, "t": 233.42296999999996, "r": 463.29645, "b": 239.255, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "50", "bbox": {"l": 542.03528, "t": 233.42296999999996, "r": 549.66547, "b": 239.255, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "0", "bbox": {"l": 316.04474, "t": 230.44617000000005, "r": 319.86075, "b": 236.27819999999997, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "2", "bbox": {"l": 312.62521, "t": 198.69073000000003, "r": 316.44122, "b": 204.52277000000004, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "0", "bbox": {"l": 316.43942, "t": 198.69073000000003, "r": 320.2554, "b": 204.52277000000004, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "4", "bbox": {"l": 313.14951, "t": 168.09795999999994, "r": 316.96552, "b": 173.92998999999998, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "0", "bbox": {"l": 316.96371, "t": 168.09795999999994, "r": 320.77969, "b": 173.92998999999998, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "6", "bbox": {"l": 312.92972, "t": 136.58771000000002, "r": 316.74573, "b": 142.41974000000005, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "0", "bbox": {"l": 316.74393, "t": 136.58771000000002, "r": 320.55991, "b": 142.41974000000005, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "8", "bbox": {"l": 312.48227, "t": 105.60175000000004, "r": 316.29828, "b": 111.43377999999996, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "0", "bbox": {"l": 316.29648, "t": 105.60175000000004, "r": 320.11246, "b": 111.43377999999996, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "1", "bbox": {"l": 312.48227, "t": 212.25922000000003, "r": 316.29828, "b": 218.09124999999995, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "0", "bbox": {"l": 316.29648, "t": 212.25922000000003, "r": 320.11246, "b": 218.09124999999995, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "3", "bbox": {"l": 313.07639, "t": 183.72198000000003, "r": 316.8924, "b": 189.55402000000004, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "0", "bbox": {"l": 316.89059, "t": 183.72198000000003, "r": 320.70657, "b": 189.55402000000004, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "5", "bbox": {"l": 312.76321, "t": 152.47400000000005, "r": 316.57922, "b": 158.30602999999996, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "0", "bbox": {"l": 316.57742, "t": 152.47400000000005, "r": 320.3934, "b": 158.30602999999996, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "7", "bbox": {"l": 312.19775, "t": 120.57050000000004, "r": 316.01376, "b": 126.40252999999996, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "0", "bbox": {"l": 316.01196, "t": 120.57050000000004, "r": 319.82794, "b": 126.40252999999996, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "9", "bbox": {"l": 312.8165, "t": 90.1087, "r": 316.63251, "b": 95.94073000000003, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "0", "bbox": {"l": 316.63071, "t": 90.1087, "r": 320.44669, "b": 95.94073000000003, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "0", "bbox": {"l": 532.17426, "t": 222.72729000000004, "r": 536.94427, "b": 230.01727000000005, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "10K", "bbox": {"l": 532.87952, "t": 108.26702999999986, "r": 547.61249, "b": 115.55700999999999, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "8K", "bbox": {"l": 532.7735, "t": 130.78101000000004, "r": 542.73877, "b": 138.07097999999996, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "6K", "bbox": {"l": 532.79901, "t": 153.92352000000005, "r": 542.76428, "b": 161.21349999999995, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "4K", "bbox": {"l": 532.5705, "t": 176.75800000000004, "r": 542.53577, "b": 184.04796999999996, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "2K", "bbox": {"l": 532.14551, "t": 199.6463, "r": 542.11078, "b": 206.93628, "coord_origin": "TOPLEFT"}}], "children": [{"id": 12, "label": "section_header", "bbox": {"l": 380.79849, "t": 79.81176999999991, "r": 486.84909, "b": 88.55975000000001, "coord_origin": "TOPLEFT"}, "confidence": 0.5687217116355896, "cells": [{"id": 65, "text": "PubTabNet + FinTabNet", "bbox": {"l": 380.79849, "t": 79.81176999999991, "r": 486.84909, "b": 88.55975000000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 396.76776, "t": 242.02697999999998, "r": 469.78748, "b": 250.77495999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "Rows / Columns", "bbox": {"l": 396.76776, "t": 242.02697999999998, "r": 469.78748, "b": 250.77495999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 320.97653, "t": 233.42296999999996, "r": 324.79254, "b": 239.255, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "0", "bbox": {"l": 320.97653, "t": 233.42296999999996, "r": 324.79254, "b": 239.255, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 410.483, "t": 233.42296999999996, "r": 418.11319, "b": 239.255, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "20", "bbox": {"l": 410.483, "t": 233.42296999999996, "r": 418.11319, "b": 239.255, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 500.84949, "t": 233.42296999999996, "r": 508.47968000000003, "b": 239.255, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "40", "bbox": {"l": 500.84949, "t": 233.42296999999996, "r": 508.47968000000003, "b": 239.255, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 365.29999, "t": 233.42296999999996, "r": 372.93018, "b": 239.255, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "10", "bbox": {"l": 365.29999, "t": 233.42296999999996, "r": 372.93018, "b": 239.255, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 455.66626, "t": 233.42296999999996, "r": 463.29645, "b": 239.255, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "30", "bbox": {"l": 455.66626, "t": 233.42296999999996, "r": 463.29645, "b": 239.255, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 542.03528, "t": 233.42296999999996, "r": 549.66547, "b": 239.255, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "50", "bbox": {"l": 542.03528, "t": 233.42296999999996, "r": 549.66547, "b": 239.255, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 316.04474, "t": 230.44617000000005, "r": 319.86075, "b": 236.27819999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "0", "bbox": {"l": 316.04474, "t": 230.44617000000005, "r": 319.86075, "b": 236.27819999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 312.62521, "t": 198.69073000000003, "r": 316.44122, "b": 204.52277000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "2", "bbox": {"l": 312.62521, "t": 198.69073000000003, "r": 316.44122, "b": 204.52277000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 316.43942, "t": 198.69073000000003, "r": 320.2554, "b": 204.52277000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "0", "bbox": {"l": 316.43942, "t": 198.69073000000003, "r": 320.2554, "b": 204.52277000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 313.14951, "t": 168.09795999999994, "r": 316.96552, "b": 173.92998999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "4", "bbox": {"l": 313.14951, "t": 168.09795999999994, "r": 316.96552, "b": 173.92998999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 316.96371, "t": 168.09795999999994, "r": 320.77969, "b": 173.92998999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "0", "bbox": {"l": 316.96371, "t": 168.09795999999994, "r": 320.77969, "b": 173.92998999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 312.92972, "t": 136.58771000000002, "r": 316.74573, "b": 142.41974000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "6", "bbox": {"l": 312.92972, "t": 136.58771000000002, "r": 316.74573, "b": 142.41974000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 316.74393, "t": 136.58771000000002, "r": 320.55991, "b": 142.41974000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "0", "bbox": {"l": 316.74393, "t": 136.58771000000002, "r": 320.55991, "b": 142.41974000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 312.48227, "t": 105.60175000000004, "r": 316.29828, "b": 111.43377999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "8", "bbox": {"l": 312.48227, "t": 105.60175000000004, "r": 316.29828, "b": 111.43377999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 316.29648, "t": 105.60175000000004, "r": 320.11246, "b": 111.43377999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "0", "bbox": {"l": 316.29648, "t": 105.60175000000004, "r": 320.11246, "b": 111.43377999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 312.48227, "t": 212.25922000000003, "r": 316.29828, "b": 218.09124999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "1", "bbox": {"l": 312.48227, "t": 212.25922000000003, "r": 316.29828, "b": 218.09124999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 316.29648, "t": 212.25922000000003, "r": 320.11246, "b": 218.09124999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "0", "bbox": {"l": 316.29648, "t": 212.25922000000003, "r": 320.11246, "b": 218.09124999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 313.07639, "t": 183.72198000000003, "r": 316.8924, "b": 189.55402000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "3", "bbox": {"l": 313.07639, "t": 183.72198000000003, "r": 316.8924, "b": 189.55402000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 316.89059, "t": 183.72198000000003, "r": 320.70657, "b": 189.55402000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "0", "bbox": {"l": 316.89059, "t": 183.72198000000003, "r": 320.70657, "b": 189.55402000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 312.76321, "t": 152.47400000000005, "r": 316.57922, "b": 158.30602999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "5", "bbox": {"l": 312.76321, "t": 152.47400000000005, "r": 316.57922, "b": 158.30602999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 316.57742, "t": 152.47400000000005, "r": 320.3934, "b": 158.30602999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "0", "bbox": {"l": 316.57742, "t": 152.47400000000005, "r": 320.3934, "b": 158.30602999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 312.19775, "t": 120.57050000000004, "r": 316.01376, "b": 126.40252999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "7", "bbox": {"l": 312.19775, "t": 120.57050000000004, "r": 316.01376, "b": 126.40252999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 316.01196, "t": 120.57050000000004, "r": 319.82794, "b": 126.40252999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "0", "bbox": {"l": 316.01196, "t": 120.57050000000004, "r": 319.82794, "b": 126.40252999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 312.8165, "t": 90.1087, "r": 316.63251, "b": 95.94073000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "9", "bbox": {"l": 312.8165, "t": 90.1087, "r": 316.63251, "b": 95.94073000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 316.63071, "t": 90.1087, "r": 320.44669, "b": 95.94073000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "0", "bbox": {"l": 316.63071, "t": 90.1087, "r": 320.44669, "b": 95.94073000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 532.17426, "t": 222.72729000000004, "r": 536.94427, "b": 230.01727000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "0", "bbox": {"l": 532.17426, "t": 222.72729000000004, "r": 536.94427, "b": 230.01727000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 532.87952, "t": 108.26702999999986, "r": 547.61249, "b": 115.55700999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "10K", "bbox": {"l": 532.87952, "t": 108.26702999999986, "r": 547.61249, "b": 115.55700999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 532.7735, "t": 130.78101000000004, "r": 542.73877, "b": 138.07097999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "8K", "bbox": {"l": 532.7735, "t": 130.78101000000004, "r": 542.73877, "b": 138.07097999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 532.79901, "t": 153.92352000000005, "r": 542.76428, "b": 161.21349999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "6K", "bbox": {"l": 532.79901, "t": 153.92352000000005, "r": 542.76428, "b": 161.21349999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 532.5705, "t": 176.75800000000004, "r": 542.53577, "b": 184.04796999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "4K", "bbox": {"l": 532.5705, "t": 176.75800000000004, "r": 542.53577, "b": 184.04796999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 532.14551, "t": 199.6463, "r": 542.11078, "b": 206.93628, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "2K", "bbox": {"l": 532.14551, "t": 199.6463, "r": 542.11078, "b": 206.93628, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 7, "label": "caption", "bbox": {"l": 308.862, "t": 267.83636, "r": 545.11511, "b": 288.6979099999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9667505025863647, "cells": [{"id": 98, "text": "Figure 2:", "bbox": {"l": 308.862, "t": 267.83636, "r": 346.06238, "b": 276.74292, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "Distribution of the tables across different table", "bbox": {"l": 354.49072, "t": 267.83636, "r": 545.11511, "b": 276.74292, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "dimensions in PubTabNet + FinTabNet datasets", "bbox": {"l": 308.862, "t": 279.79132000000004, "r": 498.56989, "b": 288.6979099999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 308.862, "t": 317.47336, "r": 437.27002, "b": 326.37991, "coord_origin": "TOPLEFT"}, "confidence": 0.8879811763763428, "cells": [{"id": 101, "text": "balance in the previous datasets.", "bbox": {"l": 308.862, "t": 317.47336, "r": 437.27002, "b": 326.37991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 308.862, "t": 331.53137, "r": 545.11517, "b": 627.36174, "coord_origin": "TOPLEFT"}, "confidence": 0.9870319366455078, "cells": [{"id": 102, "text": "The PubTabNet dataset contains 509k tables delivered as", "bbox": {"l": 320.81699, "t": 331.53137, "r": 545.11505, "b": 340.43793, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "annotated PNG images. The annotations consist of the table", "bbox": {"l": 308.862, "t": 343.48635999999993, "r": 545.11517, "b": 352.39291, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "structure represented in HTML format, the tokenized text", "bbox": {"l": 308.862, "t": 355.44235, "r": 545.11505, "b": 364.34890999999993, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "and its bounding boxes per table cell. Fig. 1 shows the ap-", "bbox": {"l": 308.862, "t": 367.39734, "r": 545.11505, "b": 376.30389, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "pearance style of PubTabNet. Depending on its complexity,", "bbox": {"l": 308.862, "t": 379.35233, "r": 545.11511, "b": 388.25888, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "a table is characterized as \u201csimple\u201d when it does not contain", "bbox": {"l": 308.862, "t": 391.30731, "r": 545.11511, "b": 400.21386999999993, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "row spans or column spans, otherwise it is \u201ccomplex\u201d. The", "bbox": {"l": 308.862, "t": 403.26230000000004, "r": 545.11505, "b": 412.16885, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "dataset is divided into Train and Val splits (roughly 98% and", "bbox": {"l": 308.862, "t": 415.21729, "r": 545.11511, "b": 424.12384, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "2%). The Train split consists of 54% simple and 46% com-", "bbox": {"l": 308.862, "t": 427.17328, "r": 545.11517, "b": 436.0798300000001, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "plex tables and the Val split of 51% and 49% respectively.", "bbox": {"l": 308.862, "t": 439.12827, "r": 545.11517, "b": 448.03482, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "The FinTabNet dataset contains 112k tables delivered as", "bbox": {"l": 308.862, "t": 451.08325, "r": 545.11511, "b": 459.98981000000003, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "single-page PDF documents with mixed table structures and", "bbox": {"l": 308.862, "t": 463.03824, "r": 545.11505, "b": 471.94479, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "text content. Similarly to the PubTabNet, the annotations", "bbox": {"l": 308.862, "t": 474.99323, "r": 545.11511, "b": 483.89978, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "of FinTabNet include the table structure in HTML, the to-", "bbox": {"l": 308.862, "t": 486.94922, "r": 545.11511, "b": 495.85577, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "kenized text and the bounding boxes on a table cell basis.", "bbox": {"l": 308.862, "t": 498.90421, "r": 545.11511, "b": 507.81076, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "The dataset is divided into Train, Test and Val splits (81%,", "bbox": {"l": 308.862, "t": 510.85919, "r": 545.11517, "b": 519.76575, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "9.5%, 9.5%), and each one is almost equally divided into", "bbox": {"l": 308.862, "t": 522.8141800000001, "r": 545.11517, "b": 531.72073, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "simple and complex tables (Train: 48% simple, 52% com-", "bbox": {"l": 308.862, "t": 534.76917, "r": 545.11505, "b": 543.67574, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "plex, Test: 48% simple, 52% complex, Test: 53% simple,", "bbox": {"l": 308.862, "t": 546.72418, "r": 545.11511, "b": 555.6307400000001, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "47% complex). Finally the TableBank dataset consists of", "bbox": {"l": 308.862, "t": 558.6801800000001, "r": 545.11511, "b": 567.58673, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "145k tables provided as JPEG images. The latter has anno-", "bbox": {"l": 308.862, "t": 570.63518, "r": 545.11505, "b": 579.54173, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "tations for the table structure, but only few with bounding", "bbox": {"l": 308.862, "t": 582.59018, "r": 545.11499, "b": 591.49673, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "boxes of the table cells. The entire dataset consists of sim-", "bbox": {"l": 308.862, "t": 594.54518, "r": 545.11517, "b": 603.45174, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "ple tables and it is divided into 90% Train, 3% Test and 7%", "bbox": {"l": 308.862, "t": 606.50018, "r": 545.11511, "b": 615.40674, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "Val splits.", "bbox": {"l": 308.862, "t": 618.45518, "r": 348.16446, "b": 627.36174, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "text", "bbox": {"l": 308.862, "t": 632.51419, "r": 545.11511, "b": 713.151764, "coord_origin": "TOPLEFT"}, "confidence": 0.9840091466903687, "cells": [{"id": 127, "text": "Due to the heterogeneity across the dataset formats, it", "bbox": {"l": 320.81699, "t": 632.51419, "r": 545.11487, "b": 641.42075, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "was necessary to combine all available data into one homog-", "bbox": {"l": 308.862, "t": 644.46919, "r": 545.11511, "b": 653.37575, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "enized dataset before we could train our models for practi-", "bbox": {"l": 308.862, "t": 656.42419, "r": 545.11511, "b": 665.33076, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "cal purposes. Given the size of PubTabNet, we adopted its", "bbox": {"l": 308.862, "t": 668.38019, "r": 545.11499, "b": 677.28676, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "annotation format and we extracted and converted all tables", "bbox": {"l": 308.862, "t": 680.33519, "r": 545.11505, "b": 689.24176, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "as PNG images with a resolution of 72 dpi. Additionally,", "bbox": {"l": 308.862, "t": 692.290192, "r": 545.11505, "b": 701.196762, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "we have filtered out tables with extreme sizes due to small", "bbox": {"l": 308.862, "t": 704.245193, "r": 545.11511, "b": 713.151764, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "page_footer", "bbox": {"l": 295.121, "t": 734.133198, "r": 300.10229, "b": 743.039761, "coord_origin": "TOPLEFT"}, "confidence": 0.8715606927871704, "cells": [{"id": 134, "text": "3", "bbox": {"l": 295.121, "t": 734.133198, "r": 300.10229, "b": 743.039761, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "text", "id": 10, "page_no": 2, "cluster": {"id": 10, "label": "text", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 250.15102, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.8767216801643372, "cells": [{"id": 0, "text": "tag-decoder which is constrained to the table-tags.", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 250.15102, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "tag-decoder which is constrained to the table-tags."}, {"label": "text", "id": 5, "page_no": 2, "cluster": {"id": 5, "label": "text", "bbox": {"l": 50.112, "t": 87.21935999999994, "r": 286.36514, "b": 275.45410000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9822593927383423, "cells": [{"id": 1, "text": "In", "bbox": {"l": 62.067001, "t": 87.21935999999994, "r": 70.365845, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "practice,", "bbox": {"l": 76.931198, "t": 87.21935999999994, "r": 110.95348000000001, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "both", "bbox": {"l": 118.54498, "t": 87.21935999999994, "r": 136.25848, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "network", "bbox": {"l": 142.82384, "t": 87.21935999999994, "r": 175.37166, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "architectures", "bbox": {"l": 181.94698, "t": 87.21935999999994, "r": 232.83594000000002, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "(IETD", "bbox": {"l": 239.41125, "t": 87.21935999999994, "r": 265.41364, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "and", "bbox": {"l": 271.979, "t": 87.21935999999994, "r": 286.36499, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "IEDD) require an implicit, custom trained object-character-", "bbox": {"l": 50.112, "t": 99.17437999999993, "r": 286.36505, "b": 108.08092999999997, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "recognition (OCR) to obtain the content of the table-cells.", "bbox": {"l": 50.112, "t": 111.13036999999997, "r": 286.36511, "b": 120.03692999999998, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "In the case of IETD, this OCR engine is implicit in the de-", "bbox": {"l": 50.112, "t": 123.08538999999996, "r": 286.36505, "b": 131.99194, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "coder similar to [24]. For the IEDD, the OCR is solely em-", "bbox": {"l": 50.112, "t": 135.04040999999995, "r": 286.36514, "b": 143.94696, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "bedded in the content-decoder. This reliance on a custom,", "bbox": {"l": 50.112, "t": 146.99541999999997, "r": 286.36511, "b": 155.90197999999998, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "implicit OCR decoder is of course problematic. OCR is a", "bbox": {"l": 50.112, "t": 158.95043999999996, "r": 286.36505, "b": 167.85699, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "well known and extremely tough problem, that often needs", "bbox": {"l": 50.112, "t": 170.90545999999995, "r": 286.36508, "b": 179.81201, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "custom training for each individual language. However, the", "bbox": {"l": 50.112, "t": 182.86145, "r": 286.36508, "b": 191.76801, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "limited availability for non-english content in the current", "bbox": {"l": 50.112, "t": 194.81646999999998, "r": 286.36511, "b": 203.72302000000002, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "datasets, makes it impractical to apply the IETD and IEDD", "bbox": {"l": 50.112, "t": 206.77148, "r": 286.36511, "b": 215.67804, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "methods on tables with other languages. Additionally, OCR", "bbox": {"l": 50.112, "t": 218.7265, "r": 286.36505, "b": 227.63306, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "can be completely omitted if the tables originate from pro-", "bbox": {"l": 50.112, "t": 230.68151999999998, "r": 286.36505, "b": 239.58807000000002, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "grammatic PDF documents with known positions of each", "bbox": {"l": 50.112, "t": 242.63653999999997, "r": 286.36511, "b": 251.54309, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "cell. The latter was the inspiration for the work of this pa-", "bbox": {"l": 50.112, "t": 254.59253, "r": 286.36508, "b": 263.49908000000005, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "per.", "bbox": {"l": 50.112, "t": 266.54755, "r": 64.776947, "b": 275.45410000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In practice, both network architectures (IETD and IEDD) require an implicit, custom trained object-characterrecognition (OCR) to obtain the content of the table-cells. In the case of IETD, this OCR engine is implicit in the decoder similar to [24]. For the IEDD, the OCR is solely embedded in the content-decoder. This reliance on a custom, implicit OCR decoder is of course problematic. OCR is a well known and extremely tough problem, that often needs custom training for each individual language. However, the limited availability for non-english content in the current datasets, makes it impractical to apply the IETD and IEDD methods on tables with other languages. Additionally, OCR can be completely omitted if the tables originate from programmatic PDF documents with known positions of each cell. The latter was the inspiration for the work of this paper."}, {"label": "text", "id": 0, "page_no": 2, "cluster": {"id": 0, "label": "text", "bbox": {"l": 50.111992, "t": 278.43895999999995, "r": 286.36511, "b": 490.70288, "coord_origin": "TOPLEFT"}, "confidence": 0.9878450036048889, "cells": [{"id": 23, "text": "Graph Neural networks", "bbox": {"l": 62.067001, "t": 278.43895999999995, "r": 171.56593, "b": 287.39536, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": ":", "bbox": {"l": 171.56799, "t": 278.55853, "r": 174.3376, "b": 287.46509, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "Graph Neural networks", "bbox": {"l": 185.18687, "t": 278.55853, "r": 286.35709, "b": 287.46509, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "(GNN\u2019s) take a radically different approach to table-", "bbox": {"l": 50.111992, "t": 290.51453000000004, "r": 286.36511, "b": 299.42108, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "structure extraction.", "bbox": {"l": 50.111992, "t": 302.46950999999996, "r": 131.16771, "b": 311.37607, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Note that one table cell can consti-", "bbox": {"l": 138.84888, "t": 302.46950999999996, "r": 286.36508, "b": 311.37607, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "tute out of multiple text-cells. To obtain the table-structure,", "bbox": {"l": 50.111992, "t": 314.4245, "r": 286.36505, "b": 323.33105, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "one creates an initial graph, where each of the text-cells", "bbox": {"l": 50.111992, "t": 326.37949000000003, "r": 286.36508, "b": 335.28604, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "becomes a node in the graph similar to [33, 34, 2]. Each", "bbox": {"l": 50.111992, "t": 338.33447, "r": 286.36505, "b": 347.2410300000001, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "node is then associated with en embedding vector coming", "bbox": {"l": 50.111992, "t": 350.28946, "r": 286.36505, "b": 359.19601, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "from the encoded image, its coordinates and the encoded", "bbox": {"l": 50.111992, "t": 362.24545000000006, "r": 286.36508, "b": 371.15201, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "text. Furthermore, nodes that represent adjacent text-cells", "bbox": {"l": 50.111992, "t": 374.20044, "r": 286.36508, "b": 383.10699, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "are linked. Graph Convolutional Networks (GCN\u2019s) based", "bbox": {"l": 50.111992, "t": 386.15542999999997, "r": 286.36508, "b": 395.06198, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "methods take the image as an input, but also the position of", "bbox": {"l": 50.111992, "t": 398.11041000000006, "r": 286.36508, "b": 407.01697, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "the text-cells and their content [18]. The purpose of a GCN", "bbox": {"l": 50.111992, "t": 410.0654, "r": 286.36508, "b": 418.97195, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "is to transform the input graph into a new graph, which re-", "bbox": {"l": 50.111992, "t": 422.02038999999996, "r": 286.36505, "b": 430.92694, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "places the old links with new ones.", "bbox": {"l": 50.111992, "t": 433.97638, "r": 198.2359, "b": 442.88293, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "The new links then", "bbox": {"l": 205.92703, "t": 433.97638, "r": 286.36505, "b": 442.88293, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "represent the table-structure. With this approach, one can", "bbox": {"l": 50.111992, "t": 445.93137, "r": 286.36508, "b": 454.83792000000005, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "avoid the need to build custom OCR decoders. However,", "bbox": {"l": 50.111992, "t": 457.88635, "r": 286.36505, "b": 466.79291, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "the quality of the reconstructed structure is not comparable", "bbox": {"l": 50.111992, "t": 469.84134, "r": 286.36505, "b": 478.74789, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "to the current state-of-the-art [18].", "bbox": {"l": 50.111992, "t": 481.79633, "r": 186.49998, "b": 490.70288, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Graph Neural networks : Graph Neural networks (GNN's) take a radically different approach to tablestructure extraction. Note that one table cell can constitute out of multiple text-cells. To obtain the table-structure, one creates an initial graph, where each of the text-cells becomes a node in the graph similar to [33, 34, 2]. Each node is then associated with en embedding vector coming from the encoded image, its coordinates and the encoded text. Furthermore, nodes that represent adjacent text-cells are linked. Graph Convolutional Networks (GCN's) based methods take the image as an input, but also the position of the text-cells and their content [18]. The purpose of a GCN is to transform the input graph into a new graph, which replaces the old links with new ones. The new links then represent the table-structure. With this approach, one can avoid the need to build custom OCR decoders. However, the quality of the reconstructed structure is not comparable to the current state-of-the-art [18]."}, {"label": "text", "id": 1, "page_no": 2, "cluster": {"id": 1, "label": "text", "bbox": {"l": 50.111984, "t": 493.68875, "r": 286.36627, "b": 622.26685, "coord_origin": "TOPLEFT"}, "confidence": 0.9875094294548035, "cells": [{"id": 45, "text": "Hybrid Deep Learning-Rule-Based approach", "bbox": {"l": 62.066994, "t": 493.68875, "r": 252.88068000000004, "b": 502.64514, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": ": A pop-", "bbox": {"l": 252.88199, "t": 493.80832, "r": 286.36627, "b": 502.71487, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "ular current model for table-structure identification is the", "bbox": {"l": 50.111984, "t": 505.76331, "r": 286.36505, "b": 514.66986, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "use of a hybrid Deep Learning-Rule-Based approach similar", "bbox": {"l": 50.111984, "t": 517.71829, "r": 286.36505, "b": 526.6248499999999, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "to [27, 29]. In this approach, one first detects the position of", "bbox": {"l": 50.111984, "t": 529.67328, "r": 286.36508, "b": 538.57985, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "the table-cells with object detection (e.g. YoloVx or Mask-", "bbox": {"l": 50.111984, "t": 541.62929, "r": 286.36508, "b": 550.53584, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "RCNN), then classifies the table into different types (from", "bbox": {"l": 50.111984, "t": 553.58429, "r": 286.36511, "b": 562.4908399999999, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "its images) and finally uses different rule-sets to obtain", "bbox": {"l": 50.111984, "t": 565.5392899999999, "r": 286.36511, "b": 574.44585, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "its table-structure. Currently, this approach achieves state-", "bbox": {"l": 50.111984, "t": 577.49429, "r": 286.36502, "b": 586.40085, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "of-the-art results, but is not an end-to-end deep-learning", "bbox": {"l": 50.111984, "t": 589.4493, "r": 286.36505, "b": 598.35585, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "method. As such, new rules need to be written if different", "bbox": {"l": 50.111984, "t": 601.4043, "r": 286.36502, "b": 610.31085, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "types of tables are encountered.", "bbox": {"l": 50.111984, "t": 613.36029, "r": 175.98943, "b": 622.26685, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Hybrid Deep Learning-Rule-Based approach : A popular current model for table-structure identification is the use of a hybrid Deep Learning-Rule-Based approach similar to [27, 29]. In this approach, one first detects the position of the table-cells with object detection (e.g. YoloVx or MaskRCNN), then classifies the table into different types (from its images) and finally uses different rule-sets to obtain its table-structure. Currently, this approach achieves stateof-the-art results, but is not an end-to-end deep-learning method. As such, new rules need to be written if different types of tables are encountered."}, {"label": "section_header", "id": 8, "page_no": 2, "cluster": {"id": 8, "label": "section_header", "bbox": {"l": 50.111984, "t": 635.94484, "r": 105.22546, "b": 646.6925699999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9423062205314636, "cells": [{"id": 57, "text": "3.", "bbox": {"l": 50.111984, "t": 635.94484, "r": 57.82375699999999, "b": 646.6925699999999, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Datasets", "bbox": {"l": 68.106125, "t": 635.94484, "r": 105.22546, "b": 646.6925699999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3. Datasets"}, {"label": "text", "id": 3, "page_no": 2, "cluster": {"id": 3, "label": "text", "bbox": {"l": 50.111984, "t": 656.42529, "r": 286.36508, "b": 713.151863, "coord_origin": "TOPLEFT"}, "confidence": 0.9862047433853149, "cells": [{"id": 59, "text": "We rely on large-scale datasets such as PubTabNet [37],", "bbox": {"l": 62.06698600000001, "t": 656.42529, "r": 286.36493, "b": 665.33186, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "FinTabNet [36], and TableBank [17] datasets to train and", "bbox": {"l": 50.111984, "t": 668.38029, "r": 286.36508, "b": 677.2868599999999, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "evaluate our models. These datasets span over various ap-", "bbox": {"l": 50.111984, "t": 680.3353, "r": 286.36502, "b": 689.24186, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "pearance styles and content.", "bbox": {"l": 50.111984, "t": 692.290298, "r": 166.24602, "b": 701.196861, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "We also introduce our own", "bbox": {"l": 173.68808, "t": 692.290298, "r": 286.36508, "b": 701.196861, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "synthetically generated SynthTabNet dataset to fix an im-", "bbox": {"l": 50.111984, "t": 704.2453, "r": 286.36505, "b": 713.151863, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "We rely on large-scale datasets such as PubTabNet [37], FinTabNet [36], and TableBank [17] datasets to train and evaluate our models. These datasets span over various appearance styles and content. We also introduce our own synthetically generated SynthTabNet dataset to fix an im-"}, {"label": "picture", "id": 6, "page_no": 2, "cluster": {"id": 6, "label": "picture", "bbox": {"l": 312.10369873046875, "t": 78.44086456298828, "r": 550.38916015625, "b": 250.60984802246094, "coord_origin": "TOPLEFT"}, "confidence": 0.9746918082237244, "cells": [{"id": 65, "text": "PubTabNet + FinTabNet", "bbox": {"l": 380.79849, "t": 79.81176999999991, "r": 486.84909, "b": 88.55975000000001, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "Rows / Columns", "bbox": {"l": 396.76776, "t": 242.02697999999998, "r": 469.78748, "b": 250.77495999999996, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "0", "bbox": {"l": 320.97653, "t": 233.42296999999996, "r": 324.79254, "b": 239.255, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "20", "bbox": {"l": 410.483, "t": 233.42296999999996, "r": 418.11319, "b": 239.255, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "40", "bbox": {"l": 500.84949, "t": 233.42296999999996, "r": 508.47968000000003, "b": 239.255, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "10", "bbox": {"l": 365.29999, "t": 233.42296999999996, "r": 372.93018, "b": 239.255, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "30", "bbox": {"l": 455.66626, "t": 233.42296999999996, "r": 463.29645, "b": 239.255, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "50", "bbox": {"l": 542.03528, "t": 233.42296999999996, "r": 549.66547, "b": 239.255, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "0", "bbox": {"l": 316.04474, "t": 230.44617000000005, "r": 319.86075, "b": 236.27819999999997, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "2", "bbox": {"l": 312.62521, "t": 198.69073000000003, "r": 316.44122, "b": 204.52277000000004, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "0", "bbox": {"l": 316.43942, "t": 198.69073000000003, "r": 320.2554, "b": 204.52277000000004, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "4", "bbox": {"l": 313.14951, "t": 168.09795999999994, "r": 316.96552, "b": 173.92998999999998, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "0", "bbox": {"l": 316.96371, "t": 168.09795999999994, "r": 320.77969, "b": 173.92998999999998, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "6", "bbox": {"l": 312.92972, "t": 136.58771000000002, "r": 316.74573, "b": 142.41974000000005, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "0", "bbox": {"l": 316.74393, "t": 136.58771000000002, "r": 320.55991, "b": 142.41974000000005, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "8", "bbox": {"l": 312.48227, "t": 105.60175000000004, "r": 316.29828, "b": 111.43377999999996, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "0", "bbox": {"l": 316.29648, "t": 105.60175000000004, "r": 320.11246, "b": 111.43377999999996, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "1", "bbox": {"l": 312.48227, "t": 212.25922000000003, "r": 316.29828, "b": 218.09124999999995, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "0", "bbox": {"l": 316.29648, "t": 212.25922000000003, "r": 320.11246, "b": 218.09124999999995, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "3", "bbox": {"l": 313.07639, "t": 183.72198000000003, "r": 316.8924, "b": 189.55402000000004, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "0", "bbox": {"l": 316.89059, "t": 183.72198000000003, "r": 320.70657, "b": 189.55402000000004, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "5", "bbox": {"l": 312.76321, "t": 152.47400000000005, "r": 316.57922, "b": 158.30602999999996, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "0", "bbox": {"l": 316.57742, "t": 152.47400000000005, "r": 320.3934, "b": 158.30602999999996, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "7", "bbox": {"l": 312.19775, "t": 120.57050000000004, "r": 316.01376, "b": 126.40252999999996, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "0", "bbox": {"l": 316.01196, "t": 120.57050000000004, "r": 319.82794, "b": 126.40252999999996, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "9", "bbox": {"l": 312.8165, "t": 90.1087, "r": 316.63251, "b": 95.94073000000003, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "0", "bbox": {"l": 316.63071, "t": 90.1087, "r": 320.44669, "b": 95.94073000000003, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "0", "bbox": {"l": 532.17426, "t": 222.72729000000004, "r": 536.94427, "b": 230.01727000000005, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "10K", "bbox": {"l": 532.87952, "t": 108.26702999999986, "r": 547.61249, "b": 115.55700999999999, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "8K", "bbox": {"l": 532.7735, "t": 130.78101000000004, "r": 542.73877, "b": 138.07097999999996, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "6K", "bbox": {"l": 532.79901, "t": 153.92352000000005, "r": 542.76428, "b": 161.21349999999995, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "4K", "bbox": {"l": 532.5705, "t": 176.75800000000004, "r": 542.53577, "b": 184.04796999999996, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "2K", "bbox": {"l": 532.14551, "t": 199.6463, "r": 542.11078, "b": 206.93628, "coord_origin": "TOPLEFT"}}], "children": [{"id": 12, "label": "section_header", "bbox": {"l": 380.79849, "t": 79.81176999999991, "r": 486.84909, "b": 88.55975000000001, "coord_origin": "TOPLEFT"}, "confidence": 0.5687217116355896, "cells": [{"id": 65, "text": "PubTabNet + FinTabNet", "bbox": {"l": 380.79849, "t": 79.81176999999991, "r": 486.84909, "b": 88.55975000000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 396.76776, "t": 242.02697999999998, "r": 469.78748, "b": 250.77495999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "Rows / Columns", "bbox": {"l": 396.76776, "t": 242.02697999999998, "r": 469.78748, "b": 250.77495999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 320.97653, "t": 233.42296999999996, "r": 324.79254, "b": 239.255, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "0", "bbox": {"l": 320.97653, "t": 233.42296999999996, "r": 324.79254, "b": 239.255, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 410.483, "t": 233.42296999999996, "r": 418.11319, "b": 239.255, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "20", "bbox": {"l": 410.483, "t": 233.42296999999996, "r": 418.11319, "b": 239.255, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 500.84949, "t": 233.42296999999996, "r": 508.47968000000003, "b": 239.255, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "40", "bbox": {"l": 500.84949, "t": 233.42296999999996, "r": 508.47968000000003, "b": 239.255, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 365.29999, "t": 233.42296999999996, "r": 372.93018, "b": 239.255, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "10", "bbox": {"l": 365.29999, "t": 233.42296999999996, "r": 372.93018, "b": 239.255, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 455.66626, "t": 233.42296999999996, "r": 463.29645, "b": 239.255, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "30", "bbox": {"l": 455.66626, "t": 233.42296999999996, "r": 463.29645, "b": 239.255, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 542.03528, "t": 233.42296999999996, "r": 549.66547, "b": 239.255, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "50", "bbox": {"l": 542.03528, "t": 233.42296999999996, "r": 549.66547, "b": 239.255, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 316.04474, "t": 230.44617000000005, "r": 319.86075, "b": 236.27819999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "0", "bbox": {"l": 316.04474, "t": 230.44617000000005, "r": 319.86075, "b": 236.27819999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 312.62521, "t": 198.69073000000003, "r": 316.44122, "b": 204.52277000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "2", "bbox": {"l": 312.62521, "t": 198.69073000000003, "r": 316.44122, "b": 204.52277000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 316.43942, "t": 198.69073000000003, "r": 320.2554, "b": 204.52277000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "0", "bbox": {"l": 316.43942, "t": 198.69073000000003, "r": 320.2554, "b": 204.52277000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 313.14951, "t": 168.09795999999994, "r": 316.96552, "b": 173.92998999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "4", "bbox": {"l": 313.14951, "t": 168.09795999999994, "r": 316.96552, "b": 173.92998999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 316.96371, "t": 168.09795999999994, "r": 320.77969, "b": 173.92998999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "0", "bbox": {"l": 316.96371, "t": 168.09795999999994, "r": 320.77969, "b": 173.92998999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 312.92972, "t": 136.58771000000002, "r": 316.74573, "b": 142.41974000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "6", "bbox": {"l": 312.92972, "t": 136.58771000000002, "r": 316.74573, "b": 142.41974000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 316.74393, "t": 136.58771000000002, "r": 320.55991, "b": 142.41974000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "0", "bbox": {"l": 316.74393, "t": 136.58771000000002, "r": 320.55991, "b": 142.41974000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 312.48227, "t": 105.60175000000004, "r": 316.29828, "b": 111.43377999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "8", "bbox": {"l": 312.48227, "t": 105.60175000000004, "r": 316.29828, "b": 111.43377999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 316.29648, "t": 105.60175000000004, "r": 320.11246, "b": 111.43377999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "0", "bbox": {"l": 316.29648, "t": 105.60175000000004, "r": 320.11246, "b": 111.43377999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 312.48227, "t": 212.25922000000003, "r": 316.29828, "b": 218.09124999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "1", "bbox": {"l": 312.48227, "t": 212.25922000000003, "r": 316.29828, "b": 218.09124999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 316.29648, "t": 212.25922000000003, "r": 320.11246, "b": 218.09124999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "0", "bbox": {"l": 316.29648, "t": 212.25922000000003, "r": 320.11246, "b": 218.09124999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 313.07639, "t": 183.72198000000003, "r": 316.8924, "b": 189.55402000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "3", "bbox": {"l": 313.07639, "t": 183.72198000000003, "r": 316.8924, "b": 189.55402000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 316.89059, "t": 183.72198000000003, "r": 320.70657, "b": 189.55402000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "0", "bbox": {"l": 316.89059, "t": 183.72198000000003, "r": 320.70657, "b": 189.55402000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 312.76321, "t": 152.47400000000005, "r": 316.57922, "b": 158.30602999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "5", "bbox": {"l": 312.76321, "t": 152.47400000000005, "r": 316.57922, "b": 158.30602999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 316.57742, "t": 152.47400000000005, "r": 320.3934, "b": 158.30602999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "0", "bbox": {"l": 316.57742, "t": 152.47400000000005, "r": 320.3934, "b": 158.30602999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 312.19775, "t": 120.57050000000004, "r": 316.01376, "b": 126.40252999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "7", "bbox": {"l": 312.19775, "t": 120.57050000000004, "r": 316.01376, "b": 126.40252999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 316.01196, "t": 120.57050000000004, "r": 319.82794, "b": 126.40252999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "0", "bbox": {"l": 316.01196, "t": 120.57050000000004, "r": 319.82794, "b": 126.40252999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 312.8165, "t": 90.1087, "r": 316.63251, "b": 95.94073000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "9", "bbox": {"l": 312.8165, "t": 90.1087, "r": 316.63251, "b": 95.94073000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 316.63071, "t": 90.1087, "r": 320.44669, "b": 95.94073000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "0", "bbox": {"l": 316.63071, "t": 90.1087, "r": 320.44669, "b": 95.94073000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 532.17426, "t": 222.72729000000004, "r": 536.94427, "b": 230.01727000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "0", "bbox": {"l": 532.17426, "t": 222.72729000000004, "r": 536.94427, "b": 230.01727000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 532.87952, "t": 108.26702999999986, "r": 547.61249, "b": 115.55700999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "10K", "bbox": {"l": 532.87952, "t": 108.26702999999986, "r": 547.61249, "b": 115.55700999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 532.7735, "t": 130.78101000000004, "r": 542.73877, "b": 138.07097999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "8K", "bbox": {"l": 532.7735, "t": 130.78101000000004, "r": 542.73877, "b": 138.07097999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 532.79901, "t": 153.92352000000005, "r": 542.76428, "b": 161.21349999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "6K", "bbox": {"l": 532.79901, "t": 153.92352000000005, "r": 542.76428, "b": 161.21349999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 532.5705, "t": 176.75800000000004, "r": 542.53577, "b": 184.04796999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "4K", "bbox": {"l": 532.5705, "t": 176.75800000000004, "r": 542.53577, "b": 184.04796999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 532.14551, "t": 199.6463, "r": 542.11078, "b": 206.93628, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "2K", "bbox": {"l": 532.14551, "t": 199.6463, "r": 542.11078, "b": 206.93628, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "caption", "id": 7, "page_no": 2, "cluster": {"id": 7, "label": "caption", "bbox": {"l": 308.862, "t": 267.83636, "r": 545.11511, "b": 288.6979099999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9667505025863647, "cells": [{"id": 98, "text": "Figure 2:", "bbox": {"l": 308.862, "t": 267.83636, "r": 346.06238, "b": 276.74292, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "Distribution of the tables across different table", "bbox": {"l": 354.49072, "t": 267.83636, "r": 545.11511, "b": 276.74292, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "dimensions in PubTabNet + FinTabNet datasets", "bbox": {"l": 308.862, "t": 279.79132000000004, "r": 498.56989, "b": 288.6979099999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 2: Distribution of the tables across different table dimensions in PubTabNet + FinTabNet datasets"}, {"label": "text", "id": 9, "page_no": 2, "cluster": {"id": 9, "label": "text", "bbox": {"l": 308.862, "t": 317.47336, "r": 437.27002, "b": 326.37991, "coord_origin": "TOPLEFT"}, "confidence": 0.8879811763763428, "cells": [{"id": 101, "text": "balance in the previous datasets.", "bbox": {"l": 308.862, "t": 317.47336, "r": 437.27002, "b": 326.37991, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "balance in the previous datasets."}, {"label": "text", "id": 2, "page_no": 2, "cluster": {"id": 2, "label": "text", "bbox": {"l": 308.862, "t": 331.53137, "r": 545.11517, "b": 627.36174, "coord_origin": "TOPLEFT"}, "confidence": 0.9870319366455078, "cells": [{"id": 102, "text": "The PubTabNet dataset contains 509k tables delivered as", "bbox": {"l": 320.81699, "t": 331.53137, "r": 545.11505, "b": 340.43793, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "annotated PNG images. The annotations consist of the table", "bbox": {"l": 308.862, "t": 343.48635999999993, "r": 545.11517, "b": 352.39291, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "structure represented in HTML format, the tokenized text", "bbox": {"l": 308.862, "t": 355.44235, "r": 545.11505, "b": 364.34890999999993, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "and its bounding boxes per table cell. Fig. 1 shows the ap-", "bbox": {"l": 308.862, "t": 367.39734, "r": 545.11505, "b": 376.30389, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "pearance style of PubTabNet. Depending on its complexity,", "bbox": {"l": 308.862, "t": 379.35233, "r": 545.11511, "b": 388.25888, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "a table is characterized as \u201csimple\u201d when it does not contain", "bbox": {"l": 308.862, "t": 391.30731, "r": 545.11511, "b": 400.21386999999993, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "row spans or column spans, otherwise it is \u201ccomplex\u201d. The", "bbox": {"l": 308.862, "t": 403.26230000000004, "r": 545.11505, "b": 412.16885, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "dataset is divided into Train and Val splits (roughly 98% and", "bbox": {"l": 308.862, "t": 415.21729, "r": 545.11511, "b": 424.12384, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "2%). The Train split consists of 54% simple and 46% com-", "bbox": {"l": 308.862, "t": 427.17328, "r": 545.11517, "b": 436.0798300000001, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "plex tables and the Val split of 51% and 49% respectively.", "bbox": {"l": 308.862, "t": 439.12827, "r": 545.11517, "b": 448.03482, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "The FinTabNet dataset contains 112k tables delivered as", "bbox": {"l": 308.862, "t": 451.08325, "r": 545.11511, "b": 459.98981000000003, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "single-page PDF documents with mixed table structures and", "bbox": {"l": 308.862, "t": 463.03824, "r": 545.11505, "b": 471.94479, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "text content. Similarly to the PubTabNet, the annotations", "bbox": {"l": 308.862, "t": 474.99323, "r": 545.11511, "b": 483.89978, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "of FinTabNet include the table structure in HTML, the to-", "bbox": {"l": 308.862, "t": 486.94922, "r": 545.11511, "b": 495.85577, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "kenized text and the bounding boxes on a table cell basis.", "bbox": {"l": 308.862, "t": 498.90421, "r": 545.11511, "b": 507.81076, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "The dataset is divided into Train, Test and Val splits (81%,", "bbox": {"l": 308.862, "t": 510.85919, "r": 545.11517, "b": 519.76575, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "9.5%, 9.5%), and each one is almost equally divided into", "bbox": {"l": 308.862, "t": 522.8141800000001, "r": 545.11517, "b": 531.72073, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "simple and complex tables (Train: 48% simple, 52% com-", "bbox": {"l": 308.862, "t": 534.76917, "r": 545.11505, "b": 543.67574, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "plex, Test: 48% simple, 52% complex, Test: 53% simple,", "bbox": {"l": 308.862, "t": 546.72418, "r": 545.11511, "b": 555.6307400000001, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "47% complex). Finally the TableBank dataset consists of", "bbox": {"l": 308.862, "t": 558.6801800000001, "r": 545.11511, "b": 567.58673, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "145k tables provided as JPEG images. The latter has anno-", "bbox": {"l": 308.862, "t": 570.63518, "r": 545.11505, "b": 579.54173, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "tations for the table structure, but only few with bounding", "bbox": {"l": 308.862, "t": 582.59018, "r": 545.11499, "b": 591.49673, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "boxes of the table cells. The entire dataset consists of sim-", "bbox": {"l": 308.862, "t": 594.54518, "r": 545.11517, "b": 603.45174, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "ple tables and it is divided into 90% Train, 3% Test and 7%", "bbox": {"l": 308.862, "t": 606.50018, "r": 545.11511, "b": 615.40674, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "Val splits.", "bbox": {"l": 308.862, "t": 618.45518, "r": 348.16446, "b": 627.36174, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The PubTabNet dataset contains 509k tables delivered as annotated PNG images. The annotations consist of the table structure represented in HTML format, the tokenized text and its bounding boxes per table cell. Fig. 1 shows the appearance style of PubTabNet. Depending on its complexity, a table is characterized as \"simple\" when it does not contain row spans or column spans, otherwise it is \"complex\". The dataset is divided into Train and Val splits (roughly 98% and 2%). The Train split consists of 54% simple and 46% complex tables and the Val split of 51% and 49% respectively. The FinTabNet dataset contains 112k tables delivered as single-page PDF documents with mixed table structures and text content. Similarly to the PubTabNet, the annotations of FinTabNet include the table structure in HTML, the tokenized text and the bounding boxes on a table cell basis. The dataset is divided into Train, Test and Val splits (81%, 9.5%, 9.5%), and each one is almost equally divided into simple and complex tables (Train: 48% simple, 52% complex, Test: 48% simple, 52% complex, Test: 53% simple, 47% complex). Finally the TableBank dataset consists of 145k tables provided as JPEG images. The latter has annotations for the table structure, but only few with bounding boxes of the table cells. The entire dataset consists of simple tables and it is divided into 90% Train, 3% Test and 7% Val splits."}, {"label": "text", "id": 4, "page_no": 2, "cluster": {"id": 4, "label": "text", "bbox": {"l": 308.862, "t": 632.51419, "r": 545.11511, "b": 713.151764, "coord_origin": "TOPLEFT"}, "confidence": 0.9840091466903687, "cells": [{"id": 127, "text": "Due to the heterogeneity across the dataset formats, it", "bbox": {"l": 320.81699, "t": 632.51419, "r": 545.11487, "b": 641.42075, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "was necessary to combine all available data into one homog-", "bbox": {"l": 308.862, "t": 644.46919, "r": 545.11511, "b": 653.37575, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "enized dataset before we could train our models for practi-", "bbox": {"l": 308.862, "t": 656.42419, "r": 545.11511, "b": 665.33076, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "cal purposes. Given the size of PubTabNet, we adopted its", "bbox": {"l": 308.862, "t": 668.38019, "r": 545.11499, "b": 677.28676, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "annotation format and we extracted and converted all tables", "bbox": {"l": 308.862, "t": 680.33519, "r": 545.11505, "b": 689.24176, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "as PNG images with a resolution of 72 dpi. Additionally,", "bbox": {"l": 308.862, "t": 692.290192, "r": 545.11505, "b": 701.196762, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "we have filtered out tables with extreme sizes due to small", "bbox": {"l": 308.862, "t": 704.245193, "r": 545.11511, "b": 713.151764, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Due to the heterogeneity across the dataset formats, it was necessary to combine all available data into one homogenized dataset before we could train our models for practical purposes. Given the size of PubTabNet, we adopted its annotation format and we extracted and converted all tables as PNG images with a resolution of 72 dpi. Additionally, we have filtered out tables with extreme sizes due to small"}, {"label": "page_footer", "id": 11, "page_no": 2, "cluster": {"id": 11, "label": "page_footer", "bbox": {"l": 295.121, "t": 734.133198, "r": 300.10229, "b": 743.039761, "coord_origin": "TOPLEFT"}, "confidence": 0.8715606927871704, "cells": [{"id": 134, "text": "3", "bbox": {"l": 295.121, "t": 734.133198, "r": 300.10229, "b": 743.039761, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3"}], "body": [{"label": "text", "id": 10, "page_no": 2, "cluster": {"id": 10, "label": "text", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 250.15102, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.8767216801643372, "cells": [{"id": 0, "text": "tag-decoder which is constrained to the table-tags.", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 250.15102, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "tag-decoder which is constrained to the table-tags."}, {"label": "text", "id": 5, "page_no": 2, "cluster": {"id": 5, "label": "text", "bbox": {"l": 50.112, "t": 87.21935999999994, "r": 286.36514, "b": 275.45410000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9822593927383423, "cells": [{"id": 1, "text": "In", "bbox": {"l": 62.067001, "t": 87.21935999999994, "r": 70.365845, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "practice,", "bbox": {"l": 76.931198, "t": 87.21935999999994, "r": 110.95348000000001, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "both", "bbox": {"l": 118.54498, "t": 87.21935999999994, "r": 136.25848, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "network", "bbox": {"l": 142.82384, "t": 87.21935999999994, "r": 175.37166, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "architectures", "bbox": {"l": 181.94698, "t": 87.21935999999994, "r": 232.83594000000002, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "(IETD", "bbox": {"l": 239.41125, "t": 87.21935999999994, "r": 265.41364, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "and", "bbox": {"l": 271.979, "t": 87.21935999999994, "r": 286.36499, "b": 96.12591999999995, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "IEDD) require an implicit, custom trained object-character-", "bbox": {"l": 50.112, "t": 99.17437999999993, "r": 286.36505, "b": 108.08092999999997, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "recognition (OCR) to obtain the content of the table-cells.", "bbox": {"l": 50.112, "t": 111.13036999999997, "r": 286.36511, "b": 120.03692999999998, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "In the case of IETD, this OCR engine is implicit in the de-", "bbox": {"l": 50.112, "t": 123.08538999999996, "r": 286.36505, "b": 131.99194, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "coder similar to [24]. For the IEDD, the OCR is solely em-", "bbox": {"l": 50.112, "t": 135.04040999999995, "r": 286.36514, "b": 143.94696, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "bedded in the content-decoder. This reliance on a custom,", "bbox": {"l": 50.112, "t": 146.99541999999997, "r": 286.36511, "b": 155.90197999999998, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "implicit OCR decoder is of course problematic. OCR is a", "bbox": {"l": 50.112, "t": 158.95043999999996, "r": 286.36505, "b": 167.85699, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "well known and extremely tough problem, that often needs", "bbox": {"l": 50.112, "t": 170.90545999999995, "r": 286.36508, "b": 179.81201, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "custom training for each individual language. However, the", "bbox": {"l": 50.112, "t": 182.86145, "r": 286.36508, "b": 191.76801, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "limited availability for non-english content in the current", "bbox": {"l": 50.112, "t": 194.81646999999998, "r": 286.36511, "b": 203.72302000000002, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "datasets, makes it impractical to apply the IETD and IEDD", "bbox": {"l": 50.112, "t": 206.77148, "r": 286.36511, "b": 215.67804, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "methods on tables with other languages. Additionally, OCR", "bbox": {"l": 50.112, "t": 218.7265, "r": 286.36505, "b": 227.63306, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "can be completely omitted if the tables originate from pro-", "bbox": {"l": 50.112, "t": 230.68151999999998, "r": 286.36505, "b": 239.58807000000002, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "grammatic PDF documents with known positions of each", "bbox": {"l": 50.112, "t": 242.63653999999997, "r": 286.36511, "b": 251.54309, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "cell. The latter was the inspiration for the work of this pa-", "bbox": {"l": 50.112, "t": 254.59253, "r": 286.36508, "b": 263.49908000000005, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "per.", "bbox": {"l": 50.112, "t": 266.54755, "r": 64.776947, "b": 275.45410000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In practice, both network architectures (IETD and IEDD) require an implicit, custom trained object-characterrecognition (OCR) to obtain the content of the table-cells. In the case of IETD, this OCR engine is implicit in the decoder similar to [24]. For the IEDD, the OCR is solely embedded in the content-decoder. This reliance on a custom, implicit OCR decoder is of course problematic. OCR is a well known and extremely tough problem, that often needs custom training for each individual language. However, the limited availability for non-english content in the current datasets, makes it impractical to apply the IETD and IEDD methods on tables with other languages. Additionally, OCR can be completely omitted if the tables originate from programmatic PDF documents with known positions of each cell. The latter was the inspiration for the work of this paper."}, {"label": "text", "id": 0, "page_no": 2, "cluster": {"id": 0, "label": "text", "bbox": {"l": 50.111992, "t": 278.43895999999995, "r": 286.36511, "b": 490.70288, "coord_origin": "TOPLEFT"}, "confidence": 0.9878450036048889, "cells": [{"id": 23, "text": "Graph Neural networks", "bbox": {"l": 62.067001, "t": 278.43895999999995, "r": 171.56593, "b": 287.39536, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": ":", "bbox": {"l": 171.56799, "t": 278.55853, "r": 174.3376, "b": 287.46509, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "Graph Neural networks", "bbox": {"l": 185.18687, "t": 278.55853, "r": 286.35709, "b": 287.46509, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "(GNN\u2019s) take a radically different approach to table-", "bbox": {"l": 50.111992, "t": 290.51453000000004, "r": 286.36511, "b": 299.42108, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "structure extraction.", "bbox": {"l": 50.111992, "t": 302.46950999999996, "r": 131.16771, "b": 311.37607, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Note that one table cell can consti-", "bbox": {"l": 138.84888, "t": 302.46950999999996, "r": 286.36508, "b": 311.37607, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "tute out of multiple text-cells. To obtain the table-structure,", "bbox": {"l": 50.111992, "t": 314.4245, "r": 286.36505, "b": 323.33105, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "one creates an initial graph, where each of the text-cells", "bbox": {"l": 50.111992, "t": 326.37949000000003, "r": 286.36508, "b": 335.28604, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "becomes a node in the graph similar to [33, 34, 2]. Each", "bbox": {"l": 50.111992, "t": 338.33447, "r": 286.36505, "b": 347.2410300000001, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "node is then associated with en embedding vector coming", "bbox": {"l": 50.111992, "t": 350.28946, "r": 286.36505, "b": 359.19601, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "from the encoded image, its coordinates and the encoded", "bbox": {"l": 50.111992, "t": 362.24545000000006, "r": 286.36508, "b": 371.15201, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "text. Furthermore, nodes that represent adjacent text-cells", "bbox": {"l": 50.111992, "t": 374.20044, "r": 286.36508, "b": 383.10699, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "are linked. Graph Convolutional Networks (GCN\u2019s) based", "bbox": {"l": 50.111992, "t": 386.15542999999997, "r": 286.36508, "b": 395.06198, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "methods take the image as an input, but also the position of", "bbox": {"l": 50.111992, "t": 398.11041000000006, "r": 286.36508, "b": 407.01697, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "the text-cells and their content [18]. The purpose of a GCN", "bbox": {"l": 50.111992, "t": 410.0654, "r": 286.36508, "b": 418.97195, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "is to transform the input graph into a new graph, which re-", "bbox": {"l": 50.111992, "t": 422.02038999999996, "r": 286.36505, "b": 430.92694, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "places the old links with new ones.", "bbox": {"l": 50.111992, "t": 433.97638, "r": 198.2359, "b": 442.88293, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "The new links then", "bbox": {"l": 205.92703, "t": 433.97638, "r": 286.36505, "b": 442.88293, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "represent the table-structure. With this approach, one can", "bbox": {"l": 50.111992, "t": 445.93137, "r": 286.36508, "b": 454.83792000000005, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "avoid the need to build custom OCR decoders. However,", "bbox": {"l": 50.111992, "t": 457.88635, "r": 286.36505, "b": 466.79291, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "the quality of the reconstructed structure is not comparable", "bbox": {"l": 50.111992, "t": 469.84134, "r": 286.36505, "b": 478.74789, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "to the current state-of-the-art [18].", "bbox": {"l": 50.111992, "t": 481.79633, "r": 186.49998, "b": 490.70288, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Graph Neural networks : Graph Neural networks (GNN's) take a radically different approach to tablestructure extraction. Note that one table cell can constitute out of multiple text-cells. To obtain the table-structure, one creates an initial graph, where each of the text-cells becomes a node in the graph similar to [33, 34, 2]. Each node is then associated with en embedding vector coming from the encoded image, its coordinates and the encoded text. Furthermore, nodes that represent adjacent text-cells are linked. Graph Convolutional Networks (GCN's) based methods take the image as an input, but also the position of the text-cells and their content [18]. The purpose of a GCN is to transform the input graph into a new graph, which replaces the old links with new ones. The new links then represent the table-structure. With this approach, one can avoid the need to build custom OCR decoders. However, the quality of the reconstructed structure is not comparable to the current state-of-the-art [18]."}, {"label": "text", "id": 1, "page_no": 2, "cluster": {"id": 1, "label": "text", "bbox": {"l": 50.111984, "t": 493.68875, "r": 286.36627, "b": 622.26685, "coord_origin": "TOPLEFT"}, "confidence": 0.9875094294548035, "cells": [{"id": 45, "text": "Hybrid Deep Learning-Rule-Based approach", "bbox": {"l": 62.066994, "t": 493.68875, "r": 252.88068000000004, "b": 502.64514, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": ": A pop-", "bbox": {"l": 252.88199, "t": 493.80832, "r": 286.36627, "b": 502.71487, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "ular current model for table-structure identification is the", "bbox": {"l": 50.111984, "t": 505.76331, "r": 286.36505, "b": 514.66986, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "use of a hybrid Deep Learning-Rule-Based approach similar", "bbox": {"l": 50.111984, "t": 517.71829, "r": 286.36505, "b": 526.6248499999999, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "to [27, 29]. In this approach, one first detects the position of", "bbox": {"l": 50.111984, "t": 529.67328, "r": 286.36508, "b": 538.57985, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "the table-cells with object detection (e.g. YoloVx or Mask-", "bbox": {"l": 50.111984, "t": 541.62929, "r": 286.36508, "b": 550.53584, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "RCNN), then classifies the table into different types (from", "bbox": {"l": 50.111984, "t": 553.58429, "r": 286.36511, "b": 562.4908399999999, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "its images) and finally uses different rule-sets to obtain", "bbox": {"l": 50.111984, "t": 565.5392899999999, "r": 286.36511, "b": 574.44585, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "its table-structure. Currently, this approach achieves state-", "bbox": {"l": 50.111984, "t": 577.49429, "r": 286.36502, "b": 586.40085, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "of-the-art results, but is not an end-to-end deep-learning", "bbox": {"l": 50.111984, "t": 589.4493, "r": 286.36505, "b": 598.35585, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "method. As such, new rules need to be written if different", "bbox": {"l": 50.111984, "t": 601.4043, "r": 286.36502, "b": 610.31085, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "types of tables are encountered.", "bbox": {"l": 50.111984, "t": 613.36029, "r": 175.98943, "b": 622.26685, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Hybrid Deep Learning-Rule-Based approach : A popular current model for table-structure identification is the use of a hybrid Deep Learning-Rule-Based approach similar to [27, 29]. In this approach, one first detects the position of the table-cells with object detection (e.g. YoloVx or MaskRCNN), then classifies the table into different types (from its images) and finally uses different rule-sets to obtain its table-structure. Currently, this approach achieves stateof-the-art results, but is not an end-to-end deep-learning method. As such, new rules need to be written if different types of tables are encountered."}, {"label": "section_header", "id": 8, "page_no": 2, "cluster": {"id": 8, "label": "section_header", "bbox": {"l": 50.111984, "t": 635.94484, "r": 105.22546, "b": 646.6925699999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9423062205314636, "cells": [{"id": 57, "text": "3.", "bbox": {"l": 50.111984, "t": 635.94484, "r": 57.82375699999999, "b": 646.6925699999999, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Datasets", "bbox": {"l": 68.106125, "t": 635.94484, "r": 105.22546, "b": 646.6925699999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3. Datasets"}, {"label": "text", "id": 3, "page_no": 2, "cluster": {"id": 3, "label": "text", "bbox": {"l": 50.111984, "t": 656.42529, "r": 286.36508, "b": 713.151863, "coord_origin": "TOPLEFT"}, "confidence": 0.9862047433853149, "cells": [{"id": 59, "text": "We rely on large-scale datasets such as PubTabNet [37],", "bbox": {"l": 62.06698600000001, "t": 656.42529, "r": 286.36493, "b": 665.33186, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "FinTabNet [36], and TableBank [17] datasets to train and", "bbox": {"l": 50.111984, "t": 668.38029, "r": 286.36508, "b": 677.2868599999999, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "evaluate our models. These datasets span over various ap-", "bbox": {"l": 50.111984, "t": 680.3353, "r": 286.36502, "b": 689.24186, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "pearance styles and content.", "bbox": {"l": 50.111984, "t": 692.290298, "r": 166.24602, "b": 701.196861, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "We also introduce our own", "bbox": {"l": 173.68808, "t": 692.290298, "r": 286.36508, "b": 701.196861, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "synthetically generated SynthTabNet dataset to fix an im-", "bbox": {"l": 50.111984, "t": 704.2453, "r": 286.36505, "b": 713.151863, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "We rely on large-scale datasets such as PubTabNet [37], FinTabNet [36], and TableBank [17] datasets to train and evaluate our models. These datasets span over various appearance styles and content. We also introduce our own synthetically generated SynthTabNet dataset to fix an im-"}, {"label": "picture", "id": 6, "page_no": 2, "cluster": {"id": 6, "label": "picture", "bbox": {"l": 312.10369873046875, "t": 78.44086456298828, "r": 550.38916015625, "b": 250.60984802246094, "coord_origin": "TOPLEFT"}, "confidence": 0.9746918082237244, "cells": [{"id": 65, "text": "PubTabNet + FinTabNet", "bbox": {"l": 380.79849, "t": 79.81176999999991, "r": 486.84909, "b": 88.55975000000001, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "Rows / Columns", "bbox": {"l": 396.76776, "t": 242.02697999999998, "r": 469.78748, "b": 250.77495999999996, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "0", "bbox": {"l": 320.97653, "t": 233.42296999999996, "r": 324.79254, "b": 239.255, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "20", "bbox": {"l": 410.483, "t": 233.42296999999996, "r": 418.11319, "b": 239.255, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "40", "bbox": {"l": 500.84949, "t": 233.42296999999996, "r": 508.47968000000003, "b": 239.255, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "10", "bbox": {"l": 365.29999, "t": 233.42296999999996, "r": 372.93018, "b": 239.255, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "30", "bbox": {"l": 455.66626, "t": 233.42296999999996, "r": 463.29645, "b": 239.255, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "50", "bbox": {"l": 542.03528, "t": 233.42296999999996, "r": 549.66547, "b": 239.255, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "0", "bbox": {"l": 316.04474, "t": 230.44617000000005, "r": 319.86075, "b": 236.27819999999997, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "2", "bbox": {"l": 312.62521, "t": 198.69073000000003, "r": 316.44122, "b": 204.52277000000004, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "0", "bbox": {"l": 316.43942, "t": 198.69073000000003, "r": 320.2554, "b": 204.52277000000004, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "4", "bbox": {"l": 313.14951, "t": 168.09795999999994, "r": 316.96552, "b": 173.92998999999998, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "0", "bbox": {"l": 316.96371, "t": 168.09795999999994, "r": 320.77969, "b": 173.92998999999998, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "6", "bbox": {"l": 312.92972, "t": 136.58771000000002, "r": 316.74573, "b": 142.41974000000005, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "0", "bbox": {"l": 316.74393, "t": 136.58771000000002, "r": 320.55991, "b": 142.41974000000005, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "8", "bbox": {"l": 312.48227, "t": 105.60175000000004, "r": 316.29828, "b": 111.43377999999996, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "0", "bbox": {"l": 316.29648, "t": 105.60175000000004, "r": 320.11246, "b": 111.43377999999996, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "1", "bbox": {"l": 312.48227, "t": 212.25922000000003, "r": 316.29828, "b": 218.09124999999995, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "0", "bbox": {"l": 316.29648, "t": 212.25922000000003, "r": 320.11246, "b": 218.09124999999995, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "3", "bbox": {"l": 313.07639, "t": 183.72198000000003, "r": 316.8924, "b": 189.55402000000004, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "0", "bbox": {"l": 316.89059, "t": 183.72198000000003, "r": 320.70657, "b": 189.55402000000004, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "5", "bbox": {"l": 312.76321, "t": 152.47400000000005, "r": 316.57922, "b": 158.30602999999996, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "0", "bbox": {"l": 316.57742, "t": 152.47400000000005, "r": 320.3934, "b": 158.30602999999996, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "7", "bbox": {"l": 312.19775, "t": 120.57050000000004, "r": 316.01376, "b": 126.40252999999996, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "0", "bbox": {"l": 316.01196, "t": 120.57050000000004, "r": 319.82794, "b": 126.40252999999996, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "9", "bbox": {"l": 312.8165, "t": 90.1087, "r": 316.63251, "b": 95.94073000000003, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "0", "bbox": {"l": 316.63071, "t": 90.1087, "r": 320.44669, "b": 95.94073000000003, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "0", "bbox": {"l": 532.17426, "t": 222.72729000000004, "r": 536.94427, "b": 230.01727000000005, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "10K", "bbox": {"l": 532.87952, "t": 108.26702999999986, "r": 547.61249, "b": 115.55700999999999, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "8K", "bbox": {"l": 532.7735, "t": 130.78101000000004, "r": 542.73877, "b": 138.07097999999996, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "6K", "bbox": {"l": 532.79901, "t": 153.92352000000005, "r": 542.76428, "b": 161.21349999999995, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "4K", "bbox": {"l": 532.5705, "t": 176.75800000000004, "r": 542.53577, "b": 184.04796999999996, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "2K", "bbox": {"l": 532.14551, "t": 199.6463, "r": 542.11078, "b": 206.93628, "coord_origin": "TOPLEFT"}}], "children": [{"id": 12, "label": "section_header", "bbox": {"l": 380.79849, "t": 79.81176999999991, "r": 486.84909, "b": 88.55975000000001, "coord_origin": "TOPLEFT"}, "confidence": 0.5687217116355896, "cells": [{"id": 65, "text": "PubTabNet + FinTabNet", "bbox": {"l": 380.79849, "t": 79.81176999999991, "r": 486.84909, "b": 88.55975000000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 396.76776, "t": 242.02697999999998, "r": 469.78748, "b": 250.77495999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "Rows / Columns", "bbox": {"l": 396.76776, "t": 242.02697999999998, "r": 469.78748, "b": 250.77495999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 320.97653, "t": 233.42296999999996, "r": 324.79254, "b": 239.255, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "0", "bbox": {"l": 320.97653, "t": 233.42296999999996, "r": 324.79254, "b": 239.255, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 410.483, "t": 233.42296999999996, "r": 418.11319, "b": 239.255, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "20", "bbox": {"l": 410.483, "t": 233.42296999999996, "r": 418.11319, "b": 239.255, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 500.84949, "t": 233.42296999999996, "r": 508.47968000000003, "b": 239.255, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "40", "bbox": {"l": 500.84949, "t": 233.42296999999996, "r": 508.47968000000003, "b": 239.255, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 365.29999, "t": 233.42296999999996, "r": 372.93018, "b": 239.255, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "10", "bbox": {"l": 365.29999, "t": 233.42296999999996, "r": 372.93018, "b": 239.255, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 455.66626, "t": 233.42296999999996, "r": 463.29645, "b": 239.255, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "30", "bbox": {"l": 455.66626, "t": 233.42296999999996, "r": 463.29645, "b": 239.255, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 542.03528, "t": 233.42296999999996, "r": 549.66547, "b": 239.255, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "50", "bbox": {"l": 542.03528, "t": 233.42296999999996, "r": 549.66547, "b": 239.255, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 316.04474, "t": 230.44617000000005, "r": 319.86075, "b": 236.27819999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "0", "bbox": {"l": 316.04474, "t": 230.44617000000005, "r": 319.86075, "b": 236.27819999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 312.62521, "t": 198.69073000000003, "r": 316.44122, "b": 204.52277000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "2", "bbox": {"l": 312.62521, "t": 198.69073000000003, "r": 316.44122, "b": 204.52277000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 316.43942, "t": 198.69073000000003, "r": 320.2554, "b": 204.52277000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "0", "bbox": {"l": 316.43942, "t": 198.69073000000003, "r": 320.2554, "b": 204.52277000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 313.14951, "t": 168.09795999999994, "r": 316.96552, "b": 173.92998999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "4", "bbox": {"l": 313.14951, "t": 168.09795999999994, "r": 316.96552, "b": 173.92998999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 316.96371, "t": 168.09795999999994, "r": 320.77969, "b": 173.92998999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "0", "bbox": {"l": 316.96371, "t": 168.09795999999994, "r": 320.77969, "b": 173.92998999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 312.92972, "t": 136.58771000000002, "r": 316.74573, "b": 142.41974000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "6", "bbox": {"l": 312.92972, "t": 136.58771000000002, "r": 316.74573, "b": 142.41974000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 316.74393, "t": 136.58771000000002, "r": 320.55991, "b": 142.41974000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "0", "bbox": {"l": 316.74393, "t": 136.58771000000002, "r": 320.55991, "b": 142.41974000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 312.48227, "t": 105.60175000000004, "r": 316.29828, "b": 111.43377999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "8", "bbox": {"l": 312.48227, "t": 105.60175000000004, "r": 316.29828, "b": 111.43377999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 316.29648, "t": 105.60175000000004, "r": 320.11246, "b": 111.43377999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "0", "bbox": {"l": 316.29648, "t": 105.60175000000004, "r": 320.11246, "b": 111.43377999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 312.48227, "t": 212.25922000000003, "r": 316.29828, "b": 218.09124999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "1", "bbox": {"l": 312.48227, "t": 212.25922000000003, "r": 316.29828, "b": 218.09124999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 316.29648, "t": 212.25922000000003, "r": 320.11246, "b": 218.09124999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "0", "bbox": {"l": 316.29648, "t": 212.25922000000003, "r": 320.11246, "b": 218.09124999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 313.07639, "t": 183.72198000000003, "r": 316.8924, "b": 189.55402000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "3", "bbox": {"l": 313.07639, "t": 183.72198000000003, "r": 316.8924, "b": 189.55402000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 316.89059, "t": 183.72198000000003, "r": 320.70657, "b": 189.55402000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "0", "bbox": {"l": 316.89059, "t": 183.72198000000003, "r": 320.70657, "b": 189.55402000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 312.76321, "t": 152.47400000000005, "r": 316.57922, "b": 158.30602999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "5", "bbox": {"l": 312.76321, "t": 152.47400000000005, "r": 316.57922, "b": 158.30602999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 316.57742, "t": 152.47400000000005, "r": 320.3934, "b": 158.30602999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "0", "bbox": {"l": 316.57742, "t": 152.47400000000005, "r": 320.3934, "b": 158.30602999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 312.19775, "t": 120.57050000000004, "r": 316.01376, "b": 126.40252999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "7", "bbox": {"l": 312.19775, "t": 120.57050000000004, "r": 316.01376, "b": 126.40252999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 316.01196, "t": 120.57050000000004, "r": 319.82794, "b": 126.40252999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "0", "bbox": {"l": 316.01196, "t": 120.57050000000004, "r": 319.82794, "b": 126.40252999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 312.8165, "t": 90.1087, "r": 316.63251, "b": 95.94073000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "9", "bbox": {"l": 312.8165, "t": 90.1087, "r": 316.63251, "b": 95.94073000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 316.63071, "t": 90.1087, "r": 320.44669, "b": 95.94073000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "0", "bbox": {"l": 316.63071, "t": 90.1087, "r": 320.44669, "b": 95.94073000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 532.17426, "t": 222.72729000000004, "r": 536.94427, "b": 230.01727000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "0", "bbox": {"l": 532.17426, "t": 222.72729000000004, "r": 536.94427, "b": 230.01727000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 532.87952, "t": 108.26702999999986, "r": 547.61249, "b": 115.55700999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "10K", "bbox": {"l": 532.87952, "t": 108.26702999999986, "r": 547.61249, "b": 115.55700999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 532.7735, "t": 130.78101000000004, "r": 542.73877, "b": 138.07097999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "8K", "bbox": {"l": 532.7735, "t": 130.78101000000004, "r": 542.73877, "b": 138.07097999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 532.79901, "t": 153.92352000000005, "r": 542.76428, "b": 161.21349999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "6K", "bbox": {"l": 532.79901, "t": 153.92352000000005, "r": 542.76428, "b": 161.21349999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 532.5705, "t": 176.75800000000004, "r": 542.53577, "b": 184.04796999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "4K", "bbox": {"l": 532.5705, "t": 176.75800000000004, "r": 542.53577, "b": 184.04796999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 532.14551, "t": 199.6463, "r": 542.11078, "b": 206.93628, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "2K", "bbox": {"l": 532.14551, "t": 199.6463, "r": 542.11078, "b": 206.93628, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "caption", "id": 7, "page_no": 2, "cluster": {"id": 7, "label": "caption", "bbox": {"l": 308.862, "t": 267.83636, "r": 545.11511, "b": 288.6979099999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9667505025863647, "cells": [{"id": 98, "text": "Figure 2:", "bbox": {"l": 308.862, "t": 267.83636, "r": 346.06238, "b": 276.74292, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "Distribution of the tables across different table", "bbox": {"l": 354.49072, "t": 267.83636, "r": 545.11511, "b": 276.74292, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "dimensions in PubTabNet + FinTabNet datasets", "bbox": {"l": 308.862, "t": 279.79132000000004, "r": 498.56989, "b": 288.6979099999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 2: Distribution of the tables across different table dimensions in PubTabNet + FinTabNet datasets"}, {"label": "text", "id": 9, "page_no": 2, "cluster": {"id": 9, "label": "text", "bbox": {"l": 308.862, "t": 317.47336, "r": 437.27002, "b": 326.37991, "coord_origin": "TOPLEFT"}, "confidence": 0.8879811763763428, "cells": [{"id": 101, "text": "balance in the previous datasets.", "bbox": {"l": 308.862, "t": 317.47336, "r": 437.27002, "b": 326.37991, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "balance in the previous datasets."}, {"label": "text", "id": 2, "page_no": 2, "cluster": {"id": 2, "label": "text", "bbox": {"l": 308.862, "t": 331.53137, "r": 545.11517, "b": 627.36174, "coord_origin": "TOPLEFT"}, "confidence": 0.9870319366455078, "cells": [{"id": 102, "text": "The PubTabNet dataset contains 509k tables delivered as", "bbox": {"l": 320.81699, "t": 331.53137, "r": 545.11505, "b": 340.43793, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "annotated PNG images. The annotations consist of the table", "bbox": {"l": 308.862, "t": 343.48635999999993, "r": 545.11517, "b": 352.39291, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "structure represented in HTML format, the tokenized text", "bbox": {"l": 308.862, "t": 355.44235, "r": 545.11505, "b": 364.34890999999993, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "and its bounding boxes per table cell. Fig. 1 shows the ap-", "bbox": {"l": 308.862, "t": 367.39734, "r": 545.11505, "b": 376.30389, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "pearance style of PubTabNet. Depending on its complexity,", "bbox": {"l": 308.862, "t": 379.35233, "r": 545.11511, "b": 388.25888, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "a table is characterized as \u201csimple\u201d when it does not contain", "bbox": {"l": 308.862, "t": 391.30731, "r": 545.11511, "b": 400.21386999999993, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "row spans or column spans, otherwise it is \u201ccomplex\u201d. The", "bbox": {"l": 308.862, "t": 403.26230000000004, "r": 545.11505, "b": 412.16885, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "dataset is divided into Train and Val splits (roughly 98% and", "bbox": {"l": 308.862, "t": 415.21729, "r": 545.11511, "b": 424.12384, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "2%). The Train split consists of 54% simple and 46% com-", "bbox": {"l": 308.862, "t": 427.17328, "r": 545.11517, "b": 436.0798300000001, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "plex tables and the Val split of 51% and 49% respectively.", "bbox": {"l": 308.862, "t": 439.12827, "r": 545.11517, "b": 448.03482, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "The FinTabNet dataset contains 112k tables delivered as", "bbox": {"l": 308.862, "t": 451.08325, "r": 545.11511, "b": 459.98981000000003, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "single-page PDF documents with mixed table structures and", "bbox": {"l": 308.862, "t": 463.03824, "r": 545.11505, "b": 471.94479, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "text content. Similarly to the PubTabNet, the annotations", "bbox": {"l": 308.862, "t": 474.99323, "r": 545.11511, "b": 483.89978, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "of FinTabNet include the table structure in HTML, the to-", "bbox": {"l": 308.862, "t": 486.94922, "r": 545.11511, "b": 495.85577, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "kenized text and the bounding boxes on a table cell basis.", "bbox": {"l": 308.862, "t": 498.90421, "r": 545.11511, "b": 507.81076, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "The dataset is divided into Train, Test and Val splits (81%,", "bbox": {"l": 308.862, "t": 510.85919, "r": 545.11517, "b": 519.76575, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "9.5%, 9.5%), and each one is almost equally divided into", "bbox": {"l": 308.862, "t": 522.8141800000001, "r": 545.11517, "b": 531.72073, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "simple and complex tables (Train: 48% simple, 52% com-", "bbox": {"l": 308.862, "t": 534.76917, "r": 545.11505, "b": 543.67574, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "plex, Test: 48% simple, 52% complex, Test: 53% simple,", "bbox": {"l": 308.862, "t": 546.72418, "r": 545.11511, "b": 555.6307400000001, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "47% complex). Finally the TableBank dataset consists of", "bbox": {"l": 308.862, "t": 558.6801800000001, "r": 545.11511, "b": 567.58673, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "145k tables provided as JPEG images. The latter has anno-", "bbox": {"l": 308.862, "t": 570.63518, "r": 545.11505, "b": 579.54173, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "tations for the table structure, but only few with bounding", "bbox": {"l": 308.862, "t": 582.59018, "r": 545.11499, "b": 591.49673, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "boxes of the table cells. The entire dataset consists of sim-", "bbox": {"l": 308.862, "t": 594.54518, "r": 545.11517, "b": 603.45174, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "ple tables and it is divided into 90% Train, 3% Test and 7%", "bbox": {"l": 308.862, "t": 606.50018, "r": 545.11511, "b": 615.40674, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "Val splits.", "bbox": {"l": 308.862, "t": 618.45518, "r": 348.16446, "b": 627.36174, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The PubTabNet dataset contains 509k tables delivered as annotated PNG images. The annotations consist of the table structure represented in HTML format, the tokenized text and its bounding boxes per table cell. Fig. 1 shows the appearance style of PubTabNet. Depending on its complexity, a table is characterized as \"simple\" when it does not contain row spans or column spans, otherwise it is \"complex\". The dataset is divided into Train and Val splits (roughly 98% and 2%). The Train split consists of 54% simple and 46% complex tables and the Val split of 51% and 49% respectively. The FinTabNet dataset contains 112k tables delivered as single-page PDF documents with mixed table structures and text content. Similarly to the PubTabNet, the annotations of FinTabNet include the table structure in HTML, the tokenized text and the bounding boxes on a table cell basis. The dataset is divided into Train, Test and Val splits (81%, 9.5%, 9.5%), and each one is almost equally divided into simple and complex tables (Train: 48% simple, 52% complex, Test: 48% simple, 52% complex, Test: 53% simple, 47% complex). Finally the TableBank dataset consists of 145k tables provided as JPEG images. The latter has annotations for the table structure, but only few with bounding boxes of the table cells. The entire dataset consists of simple tables and it is divided into 90% Train, 3% Test and 7% Val splits."}, {"label": "text", "id": 4, "page_no": 2, "cluster": {"id": 4, "label": "text", "bbox": {"l": 308.862, "t": 632.51419, "r": 545.11511, "b": 713.151764, "coord_origin": "TOPLEFT"}, "confidence": 0.9840091466903687, "cells": [{"id": 127, "text": "Due to the heterogeneity across the dataset formats, it", "bbox": {"l": 320.81699, "t": 632.51419, "r": 545.11487, "b": 641.42075, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "was necessary to combine all available data into one homog-", "bbox": {"l": 308.862, "t": 644.46919, "r": 545.11511, "b": 653.37575, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "enized dataset before we could train our models for practi-", "bbox": {"l": 308.862, "t": 656.42419, "r": 545.11511, "b": 665.33076, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "cal purposes. Given the size of PubTabNet, we adopted its", "bbox": {"l": 308.862, "t": 668.38019, "r": 545.11499, "b": 677.28676, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "annotation format and we extracted and converted all tables", "bbox": {"l": 308.862, "t": 680.33519, "r": 545.11505, "b": 689.24176, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "as PNG images with a resolution of 72 dpi. Additionally,", "bbox": {"l": 308.862, "t": 692.290192, "r": 545.11505, "b": 701.196762, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "we have filtered out tables with extreme sizes due to small", "bbox": {"l": 308.862, "t": 704.245193, "r": 545.11511, "b": 713.151764, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Due to the heterogeneity across the dataset formats, it was necessary to combine all available data into one homogenized dataset before we could train our models for practical purposes. Given the size of PubTabNet, we adopted its annotation format and we extracted and converted all tables as PNG images with a resolution of 72 dpi. Additionally, we have filtered out tables with extreme sizes due to small"}], "headers": [{"label": "page_footer", "id": 11, "page_no": 2, "cluster": {"id": 11, "label": "page_footer", "bbox": {"l": 295.121, "t": 734.133198, "r": 300.10229, "b": 743.039761, "coord_origin": "TOPLEFT"}, "confidence": 0.8715606927871704, "cells": [{"id": 134, "text": "3", "bbox": {"l": 295.121, "t": 734.133198, "r": 300.10229, "b": 743.039761, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3"}]}}, {"page_no": 3, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "amount of such tables, and kept only those ones ranging", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 286.36511, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "between 1*1 and 20*10 (rows/columns).", "bbox": {"l": 50.112, "t": 87.16339000000005, "r": 212.28319, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "The availability of the bounding boxes for all table cells", "bbox": {"l": 62.067001, "t": 100.96038999999996, "r": 286.36502, "b": 109.86694, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "is essential to train our models. In order to distinguish be-", "bbox": {"l": 50.112, "t": 112.91540999999995, "r": 286.36508, "b": 121.82195999999999, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "tween empty and non-empty bounding boxes, we have in-", "bbox": {"l": 50.112, "t": 124.87041999999997, "r": 286.36508, "b": 133.77697999999998, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "troduced a binary class in the annotation. Unfortunately, the", "bbox": {"l": 50.112, "t": 136.82641999999998, "r": 286.36511, "b": 145.73297000000002, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "original datasets either omit the bounding boxes for whole", "bbox": {"l": 50.112, "t": 148.78143, "r": 286.36511, "b": 157.68799, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "tables (e.g. TableBank) or they narrow their scope only to", "bbox": {"l": 50.112, "t": 160.73645, "r": 286.36508, "b": 169.64301, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "non-empty cells. Therefore, it was imperative to introduce", "bbox": {"l": 50.112, "t": 172.69146999999998, "r": 286.36505, "b": 181.59802000000002, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "a data pre-processing procedure that generates the missing", "bbox": {"l": 50.112, "t": 184.64648, "r": 286.36508, "b": 193.55304, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "bounding boxes out of the annotation information. This pro-", "bbox": {"l": 50.112, "t": 196.60248, "r": 286.36508, "b": 205.50903000000005, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "cedure first parses the provided table structure and calcu-", "bbox": {"l": 50.112, "t": 208.5575, "r": 286.36508, "b": 217.46405000000004, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "lates the dimensions of the most fine-grained grid that cov-", "bbox": {"l": 50.112, "t": 220.51251000000002, "r": 286.36511, "b": 229.41907000000003, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "ers the table structure. Notice that each table cell may oc-", "bbox": {"l": 50.112, "t": 232.46753, "r": 286.36508, "b": 241.37408000000005, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "cupy multiple grid squares due to row or column spans. In", "bbox": {"l": 50.112, "t": 244.42255, "r": 286.36508, "b": 253.32910000000004, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "case of PubTabNet we had to compute missing bounding", "bbox": {"l": 50.112, "t": 256.37756, "r": 286.36505, "b": 265.28412000000003, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "boxes for 48% of the simple and 69% of the complex ta-", "bbox": {"l": 50.112, "t": 268.33356000000003, "r": 286.36505, "b": 277.24010999999996, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "bles.", "bbox": {"l": 50.112, "t": 280.28853999999995, "r": 68.652397, "b": 289.1951, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Regarding FinTabNet, 68% of the simple and 98%", "bbox": {"l": 75.566444, "t": 280.28853999999995, "r": 286.36514, "b": 289.1951, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "of the complex tables require the generation of bounding", "bbox": {"l": 50.112, "t": 292.24353, "r": 286.36511, "b": 301.15009, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "boxes.", "bbox": {"l": 50.112, "t": 304.19852000000003, "r": 75.695961, "b": 313.10507, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "As it is illustrated in Fig. 2, the table distributions from", "bbox": {"l": 62.067001, "t": 317.99550999999997, "r": 286.36499, "b": 326.90207, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "all datasets are skewed towards simpler structures with", "bbox": {"l": 50.112, "t": 329.95151, "r": 286.36511, "b": 338.8580600000001, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "fewer number of rows/columns. Additionally, there is very", "bbox": {"l": 50.112, "t": 341.90649, "r": 286.36502, "b": 350.81305, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "limited variance in the table styles, which in case of Pub-", "bbox": {"l": 50.112, "t": 353.8614799999999, "r": 286.36505, "b": 362.76804, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "TabNet and FinTabNet means one styling format for the", "bbox": {"l": 50.112, "t": 365.81647, "r": 286.36508, "b": 374.72301999999996, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "majority of the tables.", "bbox": {"l": 50.112, "t": 377.77145, "r": 141.58859, "b": 386.67801, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Similar limitations appear also in", "bbox": {"l": 148.70189, "t": 377.77145, "r": 286.36508, "b": 386.67801, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "the type of table content, which in some cases (e.g. FinTab-", "bbox": {"l": 50.112, "t": 389.72644, "r": 286.36508, "b": 398.63300000000004, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Net) is restricted to a certain domain. Ultimately, the lack", "bbox": {"l": 50.112, "t": 401.68243, "r": 286.36511, "b": 410.58899, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "of diversity in the training dataset damages the ability of the", "bbox": {"l": 50.112, "t": 413.63742, "r": 286.36511, "b": 422.54398, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "models to generalize well on unseen data.", "bbox": {"l": 50.112, "t": 425.59241, "r": 216.39774, "b": 434.49896, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Motivated by those observations we aimed at generating", "bbox": {"l": 62.067001, "t": 439.3894, "r": 286.36499, "b": 448.2959599999999, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "a synthetic table dataset named", "bbox": {"l": 50.112, "t": 451.34439, "r": 172.14388, "b": 460.25095, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "SynthTabNet", "bbox": {"l": 174.14801, "t": 451.43405, "r": 224.70818999999997, "b": 460.02182, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": ". This approach", "bbox": {"l": 224.70801, "t": 451.34439, "r": 286.36655, "b": 460.25095, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "offers control over: 1) the size of the dataset, 2) the table", "bbox": {"l": 50.112015, "t": 463.30038, "r": 286.36505, "b": 472.20694, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "structure, 3) the table style and 4) the type of content. The", "bbox": {"l": 50.112015, "t": 475.25537, "r": 286.36511, "b": 484.16193, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "complexity of the table structure is described by the size of", "bbox": {"l": 50.112015, "t": 487.21036, "r": 286.36511, "b": 496.11691, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "the table header and the table body, as well as the percentage", "bbox": {"l": 50.112015, "t": 499.16534, "r": 286.36508, "b": 508.0719, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "of the table cells covered by row spans and column spans.", "bbox": {"l": 50.112015, "t": 511.12033, "r": 286.36505, "b": 520.02689, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "A set of carefully designed styling templates provides the", "bbox": {"l": 50.112015, "t": 523.07632, "r": 286.36508, "b": 531.98288, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "basis to build a wide range of table appearances. Lastly, the", "bbox": {"l": 50.112015, "t": 535.0313100000001, "r": 286.36508, "b": 543.93788, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "table content is generated out of a curated collection of text", "bbox": {"l": 50.112015, "t": 546.98633, "r": 286.36511, "b": 555.89288, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "corpora. By controlling the size and scope of the synthetic", "bbox": {"l": 50.112015, "t": 558.94133, "r": 286.36508, "b": 567.84789, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "datasets we are able to train and evaluate our models in a", "bbox": {"l": 50.112015, "t": 570.89633, "r": 286.36511, "b": 579.8028899999999, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "variety of different conditions. For example, we can first", "bbox": {"l": 50.112015, "t": 582.85133, "r": 286.36511, "b": 591.75789, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "generate a highly diverse dataset to train our models and", "bbox": {"l": 50.112015, "t": 594.80733, "r": 286.36505, "b": 603.71388, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "then evaluate their performance on other synthetic datasets", "bbox": {"l": 50.112015, "t": 606.76233, "r": 286.36508, "b": 615.6688800000001, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "which are focused on a specific domain.", "bbox": {"l": 50.112015, "t": 618.71733, "r": 209.7527, "b": 627.62389, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "In this regard, we have prepared four synthetic datasets,", "bbox": {"l": 62.067017, "t": 632.51433, "r": 286.36499, "b": 641.42088, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "each one containing 150k examples. The corpora to gener-", "bbox": {"l": 50.112015, "t": 644.46933, "r": 286.36508, "b": 653.37589, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "ate the table text consists of the most frequent terms appear-", "bbox": {"l": 50.112015, "t": 656.42532, "r": 286.36511, "b": 665.33189, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "ing in PubTabNet and FinTabNet together with randomly", "bbox": {"l": 50.112015, "t": 668.38033, "r": 286.36505, "b": 677.28689, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "generated text. The first two synthetic datasets have been", "bbox": {"l": 50.112015, "t": 680.33533, "r": 286.36508, "b": 689.24189, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "fine-tuned to mimic the appearance of the original datasets", "bbox": {"l": 50.112015, "t": 692.290329, "r": 286.36508, "b": 701.196892, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "but encompass more complicated table structures. The third", "bbox": {"l": 50.112015, "t": 704.245331, "r": 286.36511, "b": 713.151894, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Tags", "bbox": {"l": 412.332, "t": 73.61437999999998, "r": 430.90231, "b": 82.52094, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Bbox", "bbox": {"l": 442.85742, "t": 73.61437999999998, "r": 464.4463799999999, "b": 82.52094, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Size", "bbox": {"l": 477.78632, "t": 73.61437999999998, "r": 494.94193, "b": 82.52094, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Format", "bbox": {"l": 508.28186, "t": 73.61437999999998, "r": 536.91437, "b": 82.52094, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "PubTabNet", "bbox": {"l": 317.06, "t": 85.9673499999999, "r": 361.64264, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "3", "bbox": {"l": 417.85599, "t": 85.6684600000001, "r": 425.37775, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "3", "bbox": {"l": 449.89569, "t": 85.6684600000001, "r": 457.41745000000003, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "509k", "bbox": {"l": 476.401, "t": 85.9673499999999, "r": 496.3262, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "PNG", "bbox": {"l": 512.63495, "t": 85.9673499999999, "r": 532.56012, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "FinTabNet", "bbox": {"l": 317.06, "t": 97.92236000000003, "r": 359.43094, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "3", "bbox": {"l": 417.85599, "t": 97.62347, "r": 425.37775, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "3", "bbox": {"l": 449.89569, "t": 97.62347, "r": 457.41745000000003, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "112k", "bbox": {"l": 476.401, "t": 97.92236000000003, "r": 496.3262, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "PDF", "bbox": {"l": 513.46185, "t": 97.92236000000003, "r": 531.73328, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "TableBank", "bbox": {"l": 317.06, "t": 109.87836000000004, "r": 359.97888, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "3", "bbox": {"l": 417.85599, "t": 109.57947000000001, "r": 425.37775, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "7", "bbox": {"l": 450.81226, "t": 109.57947000000001, "r": 456.50091999999995, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "145k", "bbox": {"l": 476.401, "t": 109.87836000000004, "r": 496.3262, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "JPEG", "bbox": {"l": 511.25017999999994, "t": 109.87836000000004, "r": 533.94501, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "Combined-Tabnet(*)", "bbox": {"l": 317.06, "t": 121.83336999999995, "r": 400.37723, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "3", "bbox": {"l": 417.85599, "t": 121.53448000000003, "r": 425.37775, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "3", "bbox": {"l": 449.89569, "t": 121.53448000000003, "r": 457.41745000000003, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "400k", "bbox": {"l": 476.401, "t": 121.83336999999995, "r": 496.3262, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "PNG", "bbox": {"l": 512.63495, "t": 121.83336999999995, "r": 532.56012, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Combined(**)", "bbox": {"l": 317.06, "t": 133.78839000000005, "r": 375.17184, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "3", "bbox": {"l": 417.85599, "t": 133.48950000000002, "r": 425.37775, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "3", "bbox": {"l": 449.89569, "t": 133.48950000000002, "r": 457.41745000000003, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "500k", "bbox": {"l": 476.401, "t": 133.78839000000005, "r": 496.3262, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "PNG", "bbox": {"l": 512.63495, "t": 133.78839000000005, "r": 532.56012, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "SynthTabNet", "bbox": {"l": 317.06, "t": 145.74341000000004, "r": 369.39352, "b": 154.64995999999996, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "3", "bbox": {"l": 417.85599, "t": 145.44446000000005, "r": 425.37775, "b": 154.65985, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "3", "bbox": {"l": 449.89569, "t": 145.44446000000005, "r": 457.41745000000003, "b": 154.65985, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "600k", "bbox": {"l": 476.401, "t": 145.74334999999996, "r": 496.3262, "b": 154.6499, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "PNG", "bbox": {"l": 512.63495, "t": 145.74334999999996, "r": 532.56012, "b": 154.6499, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "Table 1:", "bbox": {"l": 308.862, "t": 167.66138, "r": 344.6178, "b": 176.56793000000005, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Both", "bbox": {"l": 361.07602, "t": 167.66138, "r": 380.45328, "b": 176.56793000000005, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "\u201cCombined-Tabnet\u201d", "bbox": {"l": 386.56799, "t": 167.75104, "r": 468.67974999999996, "b": 176.33880999999997, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "and", "bbox": {"l": 474.79599, "t": 167.66138, "r": 489.18198, "b": 176.56793000000005, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "\u201dCombined-", "bbox": {"l": 495.29898000000003, "t": 167.75104, "r": 545.112, "b": 176.33880999999997, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "Tabnet\u201d", "bbox": {"l": 308.862, "t": 179.70605, "r": 341.16077, "b": 188.29381999999998, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "are variations of the following: (*) The Combined-", "bbox": {"l": 343.457, "t": 179.61639000000002, "r": 545.11005, "b": 188.52295000000004, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "Tabnet dataset is the processed combination of PubTabNet", "bbox": {"l": 308.862, "t": 191.57141000000001, "r": 545.11505, "b": 200.47797000000003, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "and Fintabnet. (**) The combined dataset is the processed", "bbox": {"l": 308.862, "t": 203.52643, "r": 545.11499, "b": 212.43298000000004, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "combination of PubTabNet, Fintabnet and TableBank.", "bbox": {"l": 308.862, "t": 215.48242000000005, "r": 523.93469, "b": 224.38897999999995, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "one adopts a colorful appearance with high contrast and the", "bbox": {"l": 308.862, "t": 249.62041999999997, "r": 545.11517, "b": 258.52698, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "last one contains tables with sparse content. Lastly, we have", "bbox": {"l": 308.862, "t": 261.57543999999996, "r": 545.11517, "b": 270.48199, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "combined all synthetic datasets into one big unified syn-", "bbox": {"l": 308.862, "t": 273.5304, "r": 545.11505, "b": 282.43698, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "thetic dataset of 600k examples.", "bbox": {"l": 308.862, "t": 285.48541000000006, "r": 436.82169, "b": 294.39197, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "Tab. 1 summarizes the various attributes of the datasets.", "bbox": {"l": 320.81699, "t": 297.77240000000006, "r": 542.74396, "b": 306.67896, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "4.", "bbox": {"l": 308.862, "t": 321.18396, "r": 316.28476, "b": 331.93167000000005, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "The TableFormer model", "bbox": {"l": 326.18176, "t": 321.18396, "r": 444.93607000000003, "b": 331.93167000000005, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "Given the image of a table, TableFormer is able to pre-", "bbox": {"l": 320.81699, "t": 341.93939, "r": 545.11499, "b": 350.84594999999996, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "dict: 1) a sequence of tokens that represent the structure of", "bbox": {"l": 308.862, "t": 353.89438, "r": 545.11511, "b": 362.80092999999994, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "a table, and 2) a bounding box coupled to a subset of those", "bbox": {"l": 308.862, "t": 365.84937, "r": 545.11517, "b": 374.75592, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "tokens. The conversion of an image into a sequence of to-", "bbox": {"l": 308.862, "t": 377.80435, "r": 545.11505, "b": 386.71091, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "kens is a well-known task [35, 16]. While attention is often", "bbox": {"l": 308.862, "t": 389.75934000000007, "r": 545.11517, "b": 398.66588999999993, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "used as an implicit method to associate each token of the", "bbox": {"l": 308.862, "t": 401.71432000000004, "r": 545.11523, "b": 410.62088, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "sequence with a position in the original image, an explicit", "bbox": {"l": 308.862, "t": 413.67032, "r": 545.11517, "b": 422.57687, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "association between the individual table-cells and the image", "bbox": {"l": 308.862, "t": 425.62531, "r": 545.11505, "b": 434.53186, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "bounding boxes is also required.", "bbox": {"l": 308.862, "t": 437.58029, "r": 437.9375, "b": 446.48685000000006, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "4.1.", "bbox": {"l": 308.862, "t": 457.69427, "r": 323.14081, "b": 467.54633, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "Model architecture.", "bbox": {"l": 332.66003, "t": 457.69427, "r": 420.16058, "b": 467.54633, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "We now describe in detail the proposed method, which", "bbox": {"l": 320.81699, "t": 476.76529, "r": 545.11487, "b": 485.67184, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "is composed of three main components, see Fig.", "bbox": {"l": 308.862, "t": 488.72028, "r": 509.02054, "b": 497.62683, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "4.", "bbox": {"l": 515.58588, "t": 488.72028, "r": 523.05786, "b": 497.62683, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Our", "bbox": {"l": 529.62323, "t": 488.72028, "r": 545.11505, "b": 497.62683, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "CNN Backbone Network", "bbox": {"l": 308.862, "t": 500.76492, "r": 406.34601, "b": 509.35269, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "encodes the input as a feature vec-", "bbox": {"l": 408.87201, "t": 500.67526, "r": 545.1106, "b": 509.58182, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "tor of predefined length.", "bbox": {"l": 308.862, "t": 512.63126, "r": 409.39459, "b": 521.53781, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "The input feature vector of the", "bbox": {"l": 416.72705, "t": 512.63126, "r": 545.11505, "b": 521.53781, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "encoded image is passed to the", "bbox": {"l": 308.862, "t": 524.58624, "r": 436.194, "b": 533.4928, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "Structure Decoder", "bbox": {"l": 439.526, "t": 524.6759, "r": 513.86694, "b": 533.26367, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "to pro-", "bbox": {"l": 517.43201, "t": 524.58624, "r": 545.10815, "b": 533.4928, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "duce a sequence of HTML tags that represent the structure", "bbox": {"l": 308.862, "t": 536.54124, "r": 545.11511, "b": 545.4478, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "of the table.", "bbox": {"l": 308.862, "t": 548.49625, "r": 358.5455, "b": 557.4028000000001, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "With each prediction of an HTML standard", "bbox": {"l": 365.19055, "t": 548.49625, "r": 545.11517, "b": 557.4028000000001, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "data cell (\u2018", "bbox": {"l": 308.862, "t": 560.45125, "r": 352.40851, "b": 569.3578, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "<", "bbox": {"l": 352.409, "t": 560.29184, "r": 360.1579, "b": 569.13863, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "td", "bbox": {"l": 360.15799, "t": 560.45125, "r": 367.90891, "b": 569.3578, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": ">", "bbox": {"l": 367.909, "t": 560.29184, "r": 375.6579, "b": 569.13863, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "\u2019) the hidden state of that cell is passed to", "bbox": {"l": 375.65799, "t": 560.45125, "r": 545.11182, "b": 569.3578, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "the Cell BBox Decoder. As for spanning cells, such as row", "bbox": {"l": 308.862, "t": 572.40724, "r": 545.11499, "b": 581.3138, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "or column span, the tag is broken down to \u2018", "bbox": {"l": 308.862, "t": 584.3622399999999, "r": 483.11768, "b": 593.2688, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "<", "bbox": {"l": 483.11902, "t": 584.20284, "r": 490.86792, "b": 593.04962, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "\u2019, \u2018rowspan=\u2019", "bbox": {"l": 490.86800999999997, "t": 584.3622399999999, "r": 545.11438, "b": 593.2688, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "or \u2018colspan=\u2019, with the number of spanning cells (attribute),", "bbox": {"l": 308.862, "t": 596.31725, "r": 545.11493, "b": 605.2238, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "and \u2018", "bbox": {"l": 308.862, "t": 608.27225, "r": 329.64395, "b": 617.1788, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": ">", "bbox": {"l": 329.646, "t": 608.11284, "r": 337.3949, "b": 616.9596300000001, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "\u2019. The hidden state attached to \u2018", "bbox": {"l": 337.39398, "t": 608.27225, "r": 468.5914, "b": 617.1788, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "<", "bbox": {"l": 468.59496999999993, "t": 608.11284, "r": 476.34387000000004, "b": 616.9596300000001, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "\u2019 is passed to the", "bbox": {"l": 476.3439599999999, "t": 608.27225, "r": 545.11572, "b": 617.1788, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "Cell BBox Decoder. A shared feed forward network (FFN)", "bbox": {"l": 308.86197, "t": 620.22725, "r": 545.11499, "b": 629.1338000000001, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "receives the hidden states from the Structure Decoder, to", "bbox": {"l": 308.86197, "t": 632.1822500000001, "r": 545.11517, "b": 641.08881, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "provide the final detection predictions of the bounding box", "bbox": {"l": 308.86197, "t": 644.13824, "r": 545.11511, "b": 653.0448, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "coordinates and their classification.", "bbox": {"l": 308.86197, "t": 656.09325, "r": 449.42432, "b": 664.99981, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "CNN Backbone Network.", "bbox": {"l": 320.81696, "t": 668.2607, "r": 431.90985, "b": 677.21707, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "A ResNet-18 CNN is the", "bbox": {"l": 439.49896, "t": 668.3802499999999, "r": 545.11255, "b": 677.2868100000001, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "backbone that receives the table image and encodes it as a", "bbox": {"l": 308.86197, "t": 680.33525, "r": 545.11499, "b": 689.24181, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "vector of predefined length. The network has been modified", "bbox": {"l": 308.86197, "t": 692.290253, "r": 545.11511, "b": 701.196815, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "by removing the linear and pooling layer, as we are not per-", "bbox": {"l": 308.86197, "t": 704.245255, "r": 545.11505, "b": 713.1518169999999, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "4", "bbox": {"l": 295.12097, "t": 734.133251, "r": 300.10226, "b": 743.039814, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 10, "label": "text", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 286.36511, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9611433148384094, "cells": [{"id": 0, "text": "amount of such tables, and kept only those ones ranging", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 286.36511, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "between 1*1 and 20*10 (rows/columns).", "bbox": {"l": 50.112, "t": 87.16339000000005, "r": 212.28319, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 50.112, "t": 100.96038999999996, "r": 286.36514, "b": 313.10507, "coord_origin": "TOPLEFT"}, "confidence": 0.988013744354248, "cells": [{"id": 2, "text": "The availability of the bounding boxes for all table cells", "bbox": {"l": 62.067001, "t": 100.96038999999996, "r": 286.36502, "b": 109.86694, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "is essential to train our models. In order to distinguish be-", "bbox": {"l": 50.112, "t": 112.91540999999995, "r": 286.36508, "b": 121.82195999999999, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "tween empty and non-empty bounding boxes, we have in-", "bbox": {"l": 50.112, "t": 124.87041999999997, "r": 286.36508, "b": 133.77697999999998, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "troduced a binary class in the annotation. Unfortunately, the", "bbox": {"l": 50.112, "t": 136.82641999999998, "r": 286.36511, "b": 145.73297000000002, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "original datasets either omit the bounding boxes for whole", "bbox": {"l": 50.112, "t": 148.78143, "r": 286.36511, "b": 157.68799, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "tables (e.g. TableBank) or they narrow their scope only to", "bbox": {"l": 50.112, "t": 160.73645, "r": 286.36508, "b": 169.64301, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "non-empty cells. Therefore, it was imperative to introduce", "bbox": {"l": 50.112, "t": 172.69146999999998, "r": 286.36505, "b": 181.59802000000002, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "a data pre-processing procedure that generates the missing", "bbox": {"l": 50.112, "t": 184.64648, "r": 286.36508, "b": 193.55304, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "bounding boxes out of the annotation information. This pro-", "bbox": {"l": 50.112, "t": 196.60248, "r": 286.36508, "b": 205.50903000000005, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "cedure first parses the provided table structure and calcu-", "bbox": {"l": 50.112, "t": 208.5575, "r": 286.36508, "b": 217.46405000000004, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "lates the dimensions of the most fine-grained grid that cov-", "bbox": {"l": 50.112, "t": 220.51251000000002, "r": 286.36511, "b": 229.41907000000003, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "ers the table structure. Notice that each table cell may oc-", "bbox": {"l": 50.112, "t": 232.46753, "r": 286.36508, "b": 241.37408000000005, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "cupy multiple grid squares due to row or column spans. In", "bbox": {"l": 50.112, "t": 244.42255, "r": 286.36508, "b": 253.32910000000004, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "case of PubTabNet we had to compute missing bounding", "bbox": {"l": 50.112, "t": 256.37756, "r": 286.36505, "b": 265.28412000000003, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "boxes for 48% of the simple and 69% of the complex ta-", "bbox": {"l": 50.112, "t": 268.33356000000003, "r": 286.36505, "b": 277.24010999999996, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "bles.", "bbox": {"l": 50.112, "t": 280.28853999999995, "r": 68.652397, "b": 289.1951, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Regarding FinTabNet, 68% of the simple and 98%", "bbox": {"l": 75.566444, "t": 280.28853999999995, "r": 286.36514, "b": 289.1951, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "of the complex tables require the generation of bounding", "bbox": {"l": 50.112, "t": 292.24353, "r": 286.36511, "b": 301.15009, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "boxes.", "bbox": {"l": 50.112, "t": 304.19852000000003, "r": 75.695961, "b": 313.10507, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "text", "bbox": {"l": 50.112, "t": 317.99550999999997, "r": 286.36511, "b": 434.49896, "coord_origin": "TOPLEFT"}, "confidence": 0.9873981475830078, "cells": [{"id": 21, "text": "As it is illustrated in Fig. 2, the table distributions from", "bbox": {"l": 62.067001, "t": 317.99550999999997, "r": 286.36499, "b": 326.90207, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "all datasets are skewed towards simpler structures with", "bbox": {"l": 50.112, "t": 329.95151, "r": 286.36511, "b": 338.8580600000001, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "fewer number of rows/columns. Additionally, there is very", "bbox": {"l": 50.112, "t": 341.90649, "r": 286.36502, "b": 350.81305, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "limited variance in the table styles, which in case of Pub-", "bbox": {"l": 50.112, "t": 353.8614799999999, "r": 286.36505, "b": 362.76804, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "TabNet and FinTabNet means one styling format for the", "bbox": {"l": 50.112, "t": 365.81647, "r": 286.36508, "b": 374.72301999999996, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "majority of the tables.", "bbox": {"l": 50.112, "t": 377.77145, "r": 141.58859, "b": 386.67801, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Similar limitations appear also in", "bbox": {"l": 148.70189, "t": 377.77145, "r": 286.36508, "b": 386.67801, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "the type of table content, which in some cases (e.g. FinTab-", "bbox": {"l": 50.112, "t": 389.72644, "r": 286.36508, "b": 398.63300000000004, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Net) is restricted to a certain domain. Ultimately, the lack", "bbox": {"l": 50.112, "t": 401.68243, "r": 286.36511, "b": 410.58899, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "of diversity in the training dataset damages the ability of the", "bbox": {"l": 50.112, "t": 413.63742, "r": 286.36511, "b": 422.54398, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "models to generalize well on unseen data.", "bbox": {"l": 50.112, "t": 425.59241, "r": 216.39774, "b": 434.49896, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 50.112, "t": 439.3894, "r": 286.36655, "b": 627.62389, "coord_origin": "TOPLEFT"}, "confidence": 0.9876030087471008, "cells": [{"id": 32, "text": "Motivated by those observations we aimed at generating", "bbox": {"l": 62.067001, "t": 439.3894, "r": 286.36499, "b": 448.2959599999999, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "a synthetic table dataset named", "bbox": {"l": 50.112, "t": 451.34439, "r": 172.14388, "b": 460.25095, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "SynthTabNet", "bbox": {"l": 174.14801, "t": 451.43405, "r": 224.70818999999997, "b": 460.02182, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": ". This approach", "bbox": {"l": 224.70801, "t": 451.34439, "r": 286.36655, "b": 460.25095, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "offers control over: 1) the size of the dataset, 2) the table", "bbox": {"l": 50.112015, "t": 463.30038, "r": 286.36505, "b": 472.20694, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "structure, 3) the table style and 4) the type of content. The", "bbox": {"l": 50.112015, "t": 475.25537, "r": 286.36511, "b": 484.16193, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "complexity of the table structure is described by the size of", "bbox": {"l": 50.112015, "t": 487.21036, "r": 286.36511, "b": 496.11691, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "the table header and the table body, as well as the percentage", "bbox": {"l": 50.112015, "t": 499.16534, "r": 286.36508, "b": 508.0719, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "of the table cells covered by row spans and column spans.", "bbox": {"l": 50.112015, "t": 511.12033, "r": 286.36505, "b": 520.02689, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "A set of carefully designed styling templates provides the", "bbox": {"l": 50.112015, "t": 523.07632, "r": 286.36508, "b": 531.98288, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "basis to build a wide range of table appearances. Lastly, the", "bbox": {"l": 50.112015, "t": 535.0313100000001, "r": 286.36508, "b": 543.93788, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "table content is generated out of a curated collection of text", "bbox": {"l": 50.112015, "t": 546.98633, "r": 286.36511, "b": 555.89288, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "corpora. By controlling the size and scope of the synthetic", "bbox": {"l": 50.112015, "t": 558.94133, "r": 286.36508, "b": 567.84789, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "datasets we are able to train and evaluate our models in a", "bbox": {"l": 50.112015, "t": 570.89633, "r": 286.36511, "b": 579.8028899999999, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "variety of different conditions. For example, we can first", "bbox": {"l": 50.112015, "t": 582.85133, "r": 286.36511, "b": 591.75789, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "generate a highly diverse dataset to train our models and", "bbox": {"l": 50.112015, "t": 594.80733, "r": 286.36505, "b": 603.71388, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "then evaluate their performance on other synthetic datasets", "bbox": {"l": 50.112015, "t": 606.76233, "r": 286.36508, "b": 615.6688800000001, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "which are focused on a specific domain.", "bbox": {"l": 50.112015, "t": 618.71733, "r": 209.7527, "b": 627.62389, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "text", "bbox": {"l": 50.112015, "t": 632.51433, "r": 286.36511, "b": 713.151894, "coord_origin": "TOPLEFT"}, "confidence": 0.9871614575386047, "cells": [{"id": 50, "text": "In this regard, we have prepared four synthetic datasets,", "bbox": {"l": 62.067017, "t": 632.51433, "r": 286.36499, "b": 641.42088, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "each one containing 150k examples. The corpora to gener-", "bbox": {"l": 50.112015, "t": 644.46933, "r": 286.36508, "b": 653.37589, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "ate the table text consists of the most frequent terms appear-", "bbox": {"l": 50.112015, "t": 656.42532, "r": 286.36511, "b": 665.33189, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "ing in PubTabNet and FinTabNet together with randomly", "bbox": {"l": 50.112015, "t": 668.38033, "r": 286.36505, "b": 677.28689, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "generated text. The first two synthetic datasets have been", "bbox": {"l": 50.112015, "t": 680.33533, "r": 286.36508, "b": 689.24189, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "fine-tuned to mimic the appearance of the original datasets", "bbox": {"l": 50.112015, "t": 692.290329, "r": 286.36508, "b": 701.196892, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "but encompass more complicated table structures. The third", "bbox": {"l": 50.112015, "t": 704.245331, "r": 286.36511, "b": 713.151894, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "table", "bbox": {"l": 310.67584228515625, "t": 73.19388580322266, "r": 542.9547119140625, "b": 155.22052001953125, "coord_origin": "TOPLEFT"}, "confidence": 0.9777463674545288, "cells": [{"id": 57, "text": "Tags", "bbox": {"l": 412.332, "t": 73.61437999999998, "r": 430.90231, "b": 82.52094, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Bbox", "bbox": {"l": 442.85742, "t": 73.61437999999998, "r": 464.4463799999999, "b": 82.52094, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Size", "bbox": {"l": 477.78632, "t": 73.61437999999998, "r": 494.94193, "b": 82.52094, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Format", "bbox": {"l": 508.28186, "t": 73.61437999999998, "r": 536.91437, "b": 82.52094, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "PubTabNet", "bbox": {"l": 317.06, "t": 85.9673499999999, "r": 361.64264, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "3", "bbox": {"l": 417.85599, "t": 85.6684600000001, "r": 425.37775, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "3", "bbox": {"l": 449.89569, "t": 85.6684600000001, "r": 457.41745000000003, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "509k", "bbox": {"l": 476.401, "t": 85.9673499999999, "r": 496.3262, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "PNG", "bbox": {"l": 512.63495, "t": 85.9673499999999, "r": 532.56012, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "FinTabNet", "bbox": {"l": 317.06, "t": 97.92236000000003, "r": 359.43094, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "3", "bbox": {"l": 417.85599, "t": 97.62347, "r": 425.37775, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "3", "bbox": {"l": 449.89569, "t": 97.62347, "r": 457.41745000000003, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "112k", "bbox": {"l": 476.401, "t": 97.92236000000003, "r": 496.3262, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "PDF", "bbox": {"l": 513.46185, "t": 97.92236000000003, "r": 531.73328, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "TableBank", "bbox": {"l": 317.06, "t": 109.87836000000004, "r": 359.97888, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "3", "bbox": {"l": 417.85599, "t": 109.57947000000001, "r": 425.37775, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "7", "bbox": {"l": 450.81226, "t": 109.57947000000001, "r": 456.50091999999995, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "145k", "bbox": {"l": 476.401, "t": 109.87836000000004, "r": 496.3262, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "JPEG", "bbox": {"l": 511.25017999999994, "t": 109.87836000000004, "r": 533.94501, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "Combined-Tabnet(*)", "bbox": {"l": 317.06, "t": 121.83336999999995, "r": 400.37723, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "3", "bbox": {"l": 417.85599, "t": 121.53448000000003, "r": 425.37775, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "3", "bbox": {"l": 449.89569, "t": 121.53448000000003, "r": 457.41745000000003, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "400k", "bbox": {"l": 476.401, "t": 121.83336999999995, "r": 496.3262, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "PNG", "bbox": {"l": 512.63495, "t": 121.83336999999995, "r": 532.56012, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Combined(**)", "bbox": {"l": 317.06, "t": 133.78839000000005, "r": 375.17184, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "3", "bbox": {"l": 417.85599, "t": 133.48950000000002, "r": 425.37775, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "3", "bbox": {"l": 449.89569, "t": 133.48950000000002, "r": 457.41745000000003, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "500k", "bbox": {"l": 476.401, "t": 133.78839000000005, "r": 496.3262, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "PNG", "bbox": {"l": 512.63495, "t": 133.78839000000005, "r": 532.56012, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "SynthTabNet", "bbox": {"l": 317.06, "t": 145.74341000000004, "r": 369.39352, "b": 154.64995999999996, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "3", "bbox": {"l": 417.85599, "t": 145.44446000000005, "r": 425.37775, "b": 154.65985, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "3", "bbox": {"l": 449.89569, "t": 145.44446000000005, "r": 457.41745000000003, "b": 154.65985, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "600k", "bbox": {"l": 476.401, "t": 145.74334999999996, "r": 496.3262, "b": 154.6499, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "PNG", "bbox": {"l": 512.63495, "t": 145.74334999999996, "r": 532.56012, "b": 154.6499, "coord_origin": "TOPLEFT"}}], "children": [{"id": 15, "label": "text", "bbox": {"l": 412.332, "t": 73.61437999999998, "r": 430.90231, "b": 82.52094, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "Tags", "bbox": {"l": 412.332, "t": 73.61437999999998, "r": 430.90231, "b": 82.52094, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 442.85742, "t": 73.61437999999998, "r": 464.4463799999999, "b": 82.52094, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "Bbox", "bbox": {"l": 442.85742, "t": 73.61437999999998, "r": 464.4463799999999, "b": 82.52094, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 477.78632, "t": 73.61437999999998, "r": 494.94193, "b": 82.52094, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "Size", "bbox": {"l": 477.78632, "t": 73.61437999999998, "r": 494.94193, "b": 82.52094, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 508.28186, "t": 73.61437999999998, "r": 536.91437, "b": 82.52094, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "Format", "bbox": {"l": 508.28186, "t": 73.61437999999998, "r": 536.91437, "b": 82.52094, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 317.06, "t": 85.9673499999999, "r": 361.64264, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "PubTabNet", "bbox": {"l": 317.06, "t": 85.9673499999999, "r": 361.64264, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 417.85599, "t": 85.6684600000001, "r": 425.37775, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "3", "bbox": {"l": 417.85599, "t": 85.6684600000001, "r": 425.37775, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 449.89569, "t": 85.6684600000001, "r": 457.41745000000003, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "3", "bbox": {"l": 449.89569, "t": 85.6684600000001, "r": 457.41745000000003, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 476.401, "t": 85.9673499999999, "r": 496.3262, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "509k", "bbox": {"l": 476.401, "t": 85.9673499999999, "r": 496.3262, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 512.63495, "t": 85.9673499999999, "r": 532.56012, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "PNG", "bbox": {"l": 512.63495, "t": 85.9673499999999, "r": 532.56012, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 317.06, "t": 97.92236000000003, "r": 359.43094, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "FinTabNet", "bbox": {"l": 317.06, "t": 97.92236000000003, "r": 359.43094, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 417.85599, "t": 97.62347, "r": 425.37775, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "3", "bbox": {"l": 417.85599, "t": 97.62347, "r": 425.37775, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 449.89569, "t": 97.62347, "r": 457.41745000000003, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "3", "bbox": {"l": 449.89569, "t": 97.62347, "r": 457.41745000000003, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 476.401, "t": 97.92236000000003, "r": 496.3262, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "112k", "bbox": {"l": 476.401, "t": 97.92236000000003, "r": 496.3262, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 513.46185, "t": 97.92236000000003, "r": 531.73328, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "PDF", "bbox": {"l": 513.46185, "t": 97.92236000000003, "r": 531.73328, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 317.06, "t": 109.87836000000004, "r": 359.97888, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "TableBank", "bbox": {"l": 317.06, "t": 109.87836000000004, "r": 359.97888, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 417.85599, "t": 109.57947000000001, "r": 425.37775, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "3", "bbox": {"l": 417.85599, "t": 109.57947000000001, "r": 425.37775, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 450.81226, "t": 109.57947000000001, "r": 456.50091999999995, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "7", "bbox": {"l": 450.81226, "t": 109.57947000000001, "r": 456.50091999999995, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 476.401, "t": 109.87836000000004, "r": 496.3262, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "145k", "bbox": {"l": 476.401, "t": 109.87836000000004, "r": 496.3262, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 511.25017999999994, "t": 109.87836000000004, "r": 533.94501, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "JPEG", "bbox": {"l": 511.25017999999994, "t": 109.87836000000004, "r": 533.94501, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 317.06, "t": 121.83336999999995, "r": 400.37723, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "Combined-Tabnet(*)", "bbox": {"l": 317.06, "t": 121.83336999999995, "r": 400.37723, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 417.85599, "t": 121.53448000000003, "r": 425.37775, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "3", "bbox": {"l": 417.85599, "t": 121.53448000000003, "r": 425.37775, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 449.89569, "t": 121.53448000000003, "r": 457.41745000000003, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "3", "bbox": {"l": 449.89569, "t": 121.53448000000003, "r": 457.41745000000003, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 476.401, "t": 121.83336999999995, "r": 496.3262, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "400k", "bbox": {"l": 476.401, "t": 121.83336999999995, "r": 496.3262, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 512.63495, "t": 121.83336999999995, "r": 532.56012, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "PNG", "bbox": {"l": 512.63495, "t": 121.83336999999995, "r": 532.56012, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 317.06, "t": 133.78839000000005, "r": 375.17184, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "Combined(**)", "bbox": {"l": 317.06, "t": 133.78839000000005, "r": 375.17184, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 417.85599, "t": 133.48950000000002, "r": 425.37775, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "3", "bbox": {"l": 417.85599, "t": 133.48950000000002, "r": 425.37775, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 449.89569, "t": 133.48950000000002, "r": 457.41745000000003, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "3", "bbox": {"l": 449.89569, "t": 133.48950000000002, "r": 457.41745000000003, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 476.401, "t": 133.78839000000005, "r": 496.3262, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "500k", "bbox": {"l": 476.401, "t": 133.78839000000005, "r": 496.3262, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 512.63495, "t": 133.78839000000005, "r": 532.56012, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "PNG", "bbox": {"l": 512.63495, "t": 133.78839000000005, "r": 532.56012, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 317.06, "t": 145.74341000000004, "r": 369.39352, "b": 154.64995999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "SynthTabNet", "bbox": {"l": 317.06, "t": 145.74341000000004, "r": 369.39352, "b": 154.64995999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 417.85599, "t": 145.44446000000005, "r": 425.37775, "b": 154.65985, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "3", "bbox": {"l": 417.85599, "t": 145.44446000000005, "r": 425.37775, "b": 154.65985, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 449.89569, "t": 145.44446000000005, "r": 457.41745000000003, "b": 154.65985, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "3", "bbox": {"l": 449.89569, "t": 145.44446000000005, "r": 457.41745000000003, "b": 154.65985, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 476.401, "t": 145.74334999999996, "r": 496.3262, "b": 154.6499, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "600k", "bbox": {"l": 476.401, "t": 145.74334999999996, "r": 496.3262, "b": 154.6499, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 512.63495, "t": 145.74334999999996, "r": 532.56012, "b": 154.6499, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "PNG", "bbox": {"l": 512.63495, "t": 145.74334999999996, "r": 532.56012, "b": 154.6499, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 9, "label": "caption", "bbox": {"l": 308.862, "t": 167.66138, "r": 545.11505, "b": 224.38897999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9667726755142212, "cells": [{"id": 91, "text": "Table 1:", "bbox": {"l": 308.862, "t": 167.66138, "r": 344.6178, "b": 176.56793000000005, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Both", "bbox": {"l": 361.07602, "t": 167.66138, "r": 380.45328, "b": 176.56793000000005, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "\u201cCombined-Tabnet\u201d", "bbox": {"l": 386.56799, "t": 167.75104, "r": 468.67974999999996, "b": 176.33880999999997, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "and", "bbox": {"l": 474.79599, "t": 167.66138, "r": 489.18198, "b": 176.56793000000005, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "\u201dCombined-", "bbox": {"l": 495.29898000000003, "t": 167.75104, "r": 545.112, "b": 176.33880999999997, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "Tabnet\u201d", "bbox": {"l": 308.862, "t": 179.70605, "r": 341.16077, "b": 188.29381999999998, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "are variations of the following: (*) The Combined-", "bbox": {"l": 343.457, "t": 179.61639000000002, "r": 545.11005, "b": 188.52295000000004, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "Tabnet dataset is the processed combination of PubTabNet", "bbox": {"l": 308.862, "t": 191.57141000000001, "r": 545.11505, "b": 200.47797000000003, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "and Fintabnet. (**) The combined dataset is the processed", "bbox": {"l": 308.862, "t": 203.52643, "r": 545.11499, "b": 212.43298000000004, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "combination of PubTabNet, Fintabnet and TableBank.", "bbox": {"l": 308.862, "t": 215.48242000000005, "r": 523.93469, "b": 224.38897999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "text", "bbox": {"l": 308.862, "t": 249.62041999999997, "r": 545.11517, "b": 294.39197, "coord_origin": "TOPLEFT"}, "confidence": 0.978954017162323, "cells": [{"id": 101, "text": "one adopts a colorful appearance with high contrast and the", "bbox": {"l": 308.862, "t": 249.62041999999997, "r": 545.11517, "b": 258.52698, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "last one contains tables with sparse content. Lastly, we have", "bbox": {"l": 308.862, "t": 261.57543999999996, "r": 545.11517, "b": 270.48199, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "combined all synthetic datasets into one big unified syn-", "bbox": {"l": 308.862, "t": 273.5304, "r": 545.11505, "b": 282.43698, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "thetic dataset of 600k examples.", "bbox": {"l": 308.862, "t": 285.48541000000006, "r": 436.82169, "b": 294.39197, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 320.81699, "t": 297.77240000000006, "r": 542.74396, "b": 306.67896, "coord_origin": "TOPLEFT"}, "confidence": 0.9043695330619812, "cells": [{"id": 105, "text": "Tab. 1 summarizes the various attributes of the datasets.", "bbox": {"l": 320.81699, "t": 297.77240000000006, "r": 542.74396, "b": 306.67896, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "section_header", "bbox": {"l": 308.862, "t": 321.18396, "r": 444.93607000000003, "b": 331.93167000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9466595649719238, "cells": [{"id": 106, "text": "4.", "bbox": {"l": 308.862, "t": 321.18396, "r": 316.28476, "b": 331.93167000000005, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "The TableFormer model", "bbox": {"l": 326.18176, "t": 321.18396, "r": 444.93607000000003, "b": 331.93167000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 308.862, "t": 341.93939, "r": 545.11523, "b": 446.48685000000006, "coord_origin": "TOPLEFT"}, "confidence": 0.9884450435638428, "cells": [{"id": 108, "text": "Given the image of a table, TableFormer is able to pre-", "bbox": {"l": 320.81699, "t": 341.93939, "r": 545.11499, "b": 350.84594999999996, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "dict: 1) a sequence of tokens that represent the structure of", "bbox": {"l": 308.862, "t": 353.89438, "r": 545.11511, "b": 362.80092999999994, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "a table, and 2) a bounding box coupled to a subset of those", "bbox": {"l": 308.862, "t": 365.84937, "r": 545.11517, "b": 374.75592, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "tokens. The conversion of an image into a sequence of to-", "bbox": {"l": 308.862, "t": 377.80435, "r": 545.11505, "b": 386.71091, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "kens is a well-known task [35, 16]. While attention is often", "bbox": {"l": 308.862, "t": 389.75934000000007, "r": 545.11517, "b": 398.66588999999993, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "used as an implicit method to associate each token of the", "bbox": {"l": 308.862, "t": 401.71432000000004, "r": 545.11523, "b": 410.62088, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "sequence with a position in the original image, an explicit", "bbox": {"l": 308.862, "t": 413.67032, "r": 545.11517, "b": 422.57687, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "association between the individual table-cells and the image", "bbox": {"l": 308.862, "t": 425.62531, "r": 545.11505, "b": 434.53186, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "bounding boxes is also required.", "bbox": {"l": 308.862, "t": 437.58029, "r": 437.9375, "b": 446.48685000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "section_header", "bbox": {"l": 308.862, "t": 457.69427, "r": 420.16058, "b": 467.54633, "coord_origin": "TOPLEFT"}, "confidence": 0.937696099281311, "cells": [{"id": 117, "text": "4.1.", "bbox": {"l": 308.862, "t": 457.69427, "r": 323.14081, "b": 467.54633, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "Model architecture.", "bbox": {"l": 332.66003, "t": 457.69427, "r": 420.16058, "b": 467.54633, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 308.86197, "t": 476.76529, "r": 545.11572, "b": 664.99981, "coord_origin": "TOPLEFT"}, "confidence": 0.9878323078155518, "cells": [{"id": 119, "text": "We now describe in detail the proposed method, which", "bbox": {"l": 320.81699, "t": 476.76529, "r": 545.11487, "b": 485.67184, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "is composed of three main components, see Fig.", "bbox": {"l": 308.862, "t": 488.72028, "r": 509.02054, "b": 497.62683, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "4.", "bbox": {"l": 515.58588, "t": 488.72028, "r": 523.05786, "b": 497.62683, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Our", "bbox": {"l": 529.62323, "t": 488.72028, "r": 545.11505, "b": 497.62683, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "CNN Backbone Network", "bbox": {"l": 308.862, "t": 500.76492, "r": 406.34601, "b": 509.35269, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "encodes the input as a feature vec-", "bbox": {"l": 408.87201, "t": 500.67526, "r": 545.1106, "b": 509.58182, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "tor of predefined length.", "bbox": {"l": 308.862, "t": 512.63126, "r": 409.39459, "b": 521.53781, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "The input feature vector of the", "bbox": {"l": 416.72705, "t": 512.63126, "r": 545.11505, "b": 521.53781, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "encoded image is passed to the", "bbox": {"l": 308.862, "t": 524.58624, "r": 436.194, "b": 533.4928, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "Structure Decoder", "bbox": {"l": 439.526, "t": 524.6759, "r": 513.86694, "b": 533.26367, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "to pro-", "bbox": {"l": 517.43201, "t": 524.58624, "r": 545.10815, "b": 533.4928, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "duce a sequence of HTML tags that represent the structure", "bbox": {"l": 308.862, "t": 536.54124, "r": 545.11511, "b": 545.4478, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "of the table.", "bbox": {"l": 308.862, "t": 548.49625, "r": 358.5455, "b": 557.4028000000001, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "With each prediction of an HTML standard", "bbox": {"l": 365.19055, "t": 548.49625, "r": 545.11517, "b": 557.4028000000001, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "data cell (\u2018", "bbox": {"l": 308.862, "t": 560.45125, "r": 352.40851, "b": 569.3578, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "<", "bbox": {"l": 352.409, "t": 560.29184, "r": 360.1579, "b": 569.13863, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "td", "bbox": {"l": 360.15799, "t": 560.45125, "r": 367.90891, "b": 569.3578, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": ">", "bbox": {"l": 367.909, "t": 560.29184, "r": 375.6579, "b": 569.13863, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "\u2019) the hidden state of that cell is passed to", "bbox": {"l": 375.65799, "t": 560.45125, "r": 545.11182, "b": 569.3578, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "the Cell BBox Decoder. As for spanning cells, such as row", "bbox": {"l": 308.862, "t": 572.40724, "r": 545.11499, "b": 581.3138, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "or column span, the tag is broken down to \u2018", "bbox": {"l": 308.862, "t": 584.3622399999999, "r": 483.11768, "b": 593.2688, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "<", "bbox": {"l": 483.11902, "t": 584.20284, "r": 490.86792, "b": 593.04962, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "\u2019, \u2018rowspan=\u2019", "bbox": {"l": 490.86800999999997, "t": 584.3622399999999, "r": 545.11438, "b": 593.2688, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "or \u2018colspan=\u2019, with the number of spanning cells (attribute),", "bbox": {"l": 308.862, "t": 596.31725, "r": 545.11493, "b": 605.2238, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "and \u2018", "bbox": {"l": 308.862, "t": 608.27225, "r": 329.64395, "b": 617.1788, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": ">", "bbox": {"l": 329.646, "t": 608.11284, "r": 337.3949, "b": 616.9596300000001, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "\u2019. The hidden state attached to \u2018", "bbox": {"l": 337.39398, "t": 608.27225, "r": 468.5914, "b": 617.1788, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "<", "bbox": {"l": 468.59496999999993, "t": 608.11284, "r": 476.34387000000004, "b": 616.9596300000001, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "\u2019 is passed to the", "bbox": {"l": 476.3439599999999, "t": 608.27225, "r": 545.11572, "b": 617.1788, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "Cell BBox Decoder. A shared feed forward network (FFN)", "bbox": {"l": 308.86197, "t": 620.22725, "r": 545.11499, "b": 629.1338000000001, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "receives the hidden states from the Structure Decoder, to", "bbox": {"l": 308.86197, "t": 632.1822500000001, "r": 545.11517, "b": 641.08881, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "provide the final detection predictions of the bounding box", "bbox": {"l": 308.86197, "t": 644.13824, "r": 545.11511, "b": 653.0448, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "coordinates and their classification.", "bbox": {"l": 308.86197, "t": 656.09325, "r": 449.42432, "b": 664.99981, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "text", "bbox": {"l": 308.86197, "t": 668.2607, "r": 545.11511, "b": 713.1518169999999, "coord_origin": "TOPLEFT"}, "confidence": 0.978580117225647, "cells": [{"id": 152, "text": "CNN Backbone Network.", "bbox": {"l": 320.81696, "t": 668.2607, "r": 431.90985, "b": 677.21707, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "A ResNet-18 CNN is the", "bbox": {"l": 439.49896, "t": 668.3802499999999, "r": 545.11255, "b": 677.2868100000001, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "backbone that receives the table image and encodes it as a", "bbox": {"l": 308.86197, "t": 680.33525, "r": 545.11499, "b": 689.24181, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "vector of predefined length. The network has been modified", "bbox": {"l": 308.86197, "t": 692.290253, "r": 545.11511, "b": 701.196815, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "by removing the linear and pooling layer, as we are not per-", "bbox": {"l": 308.86197, "t": 704.245255, "r": 545.11505, "b": 713.1518169999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "page_footer", "bbox": {"l": 295.12097, "t": 734.133251, "r": 300.10226, "b": 743.039814, "coord_origin": "TOPLEFT"}, "confidence": 0.8565718531608582, "cells": [{"id": 157, "text": "4", "bbox": {"l": 295.12097, "t": 734.133251, "r": 300.10226, "b": 743.039814, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {"8": {"label": "table", "id": 8, "page_no": 3, "cluster": {"id": 8, "label": "table", "bbox": {"l": 310.67584228515625, "t": 73.19388580322266, "r": 542.9547119140625, "b": 155.22052001953125, "coord_origin": "TOPLEFT"}, "confidence": 0.9777463674545288, "cells": [{"id": 57, "text": "Tags", "bbox": {"l": 412.332, "t": 73.61437999999998, "r": 430.90231, "b": 82.52094, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Bbox", "bbox": {"l": 442.85742, "t": 73.61437999999998, "r": 464.4463799999999, "b": 82.52094, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Size", "bbox": {"l": 477.78632, "t": 73.61437999999998, "r": 494.94193, "b": 82.52094, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Format", "bbox": {"l": 508.28186, "t": 73.61437999999998, "r": 536.91437, "b": 82.52094, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "PubTabNet", "bbox": {"l": 317.06, "t": 85.9673499999999, "r": 361.64264, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "3", "bbox": {"l": 417.85599, "t": 85.6684600000001, "r": 425.37775, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "3", "bbox": {"l": 449.89569, "t": 85.6684600000001, "r": 457.41745000000003, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "509k", "bbox": {"l": 476.401, "t": 85.9673499999999, "r": 496.3262, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "PNG", "bbox": {"l": 512.63495, "t": 85.9673499999999, "r": 532.56012, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "FinTabNet", "bbox": {"l": 317.06, "t": 97.92236000000003, "r": 359.43094, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "3", "bbox": {"l": 417.85599, "t": 97.62347, "r": 425.37775, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "3", "bbox": {"l": 449.89569, "t": 97.62347, "r": 457.41745000000003, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "112k", "bbox": {"l": 476.401, "t": 97.92236000000003, "r": 496.3262, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "PDF", "bbox": {"l": 513.46185, "t": 97.92236000000003, "r": 531.73328, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "TableBank", "bbox": {"l": 317.06, "t": 109.87836000000004, "r": 359.97888, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "3", "bbox": {"l": 417.85599, "t": 109.57947000000001, "r": 425.37775, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "7", "bbox": {"l": 450.81226, "t": 109.57947000000001, "r": 456.50091999999995, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "145k", "bbox": {"l": 476.401, "t": 109.87836000000004, "r": 496.3262, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "JPEG", "bbox": {"l": 511.25017999999994, "t": 109.87836000000004, "r": 533.94501, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "Combined-Tabnet(*)", "bbox": {"l": 317.06, "t": 121.83336999999995, "r": 400.37723, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "3", "bbox": {"l": 417.85599, "t": 121.53448000000003, "r": 425.37775, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "3", "bbox": {"l": 449.89569, "t": 121.53448000000003, "r": 457.41745000000003, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "400k", "bbox": {"l": 476.401, "t": 121.83336999999995, "r": 496.3262, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "PNG", "bbox": {"l": 512.63495, "t": 121.83336999999995, "r": 532.56012, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Combined(**)", "bbox": {"l": 317.06, "t": 133.78839000000005, "r": 375.17184, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "3", "bbox": {"l": 417.85599, "t": 133.48950000000002, "r": 425.37775, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "3", "bbox": {"l": 449.89569, "t": 133.48950000000002, "r": 457.41745000000003, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "500k", "bbox": {"l": 476.401, "t": 133.78839000000005, "r": 496.3262, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "PNG", "bbox": {"l": 512.63495, "t": 133.78839000000005, "r": 532.56012, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "SynthTabNet", "bbox": {"l": 317.06, "t": 145.74341000000004, "r": 369.39352, "b": 154.64995999999996, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "3", "bbox": {"l": 417.85599, "t": 145.44446000000005, "r": 425.37775, "b": 154.65985, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "3", "bbox": {"l": 449.89569, "t": 145.44446000000005, "r": 457.41745000000003, "b": 154.65985, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "600k", "bbox": {"l": 476.401, "t": 145.74334999999996, "r": 496.3262, "b": 154.6499, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "PNG", "bbox": {"l": 512.63495, "t": 145.74334999999996, "r": 532.56012, "b": 154.6499, "coord_origin": "TOPLEFT"}}], "children": [{"id": 15, "label": "text", "bbox": {"l": 412.332, "t": 73.61437999999998, "r": 430.90231, "b": 82.52094, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "Tags", "bbox": {"l": 412.332, "t": 73.61437999999998, "r": 430.90231, "b": 82.52094, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 442.85742, "t": 73.61437999999998, "r": 464.4463799999999, "b": 82.52094, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "Bbox", "bbox": {"l": 442.85742, "t": 73.61437999999998, "r": 464.4463799999999, "b": 82.52094, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 477.78632, "t": 73.61437999999998, "r": 494.94193, "b": 82.52094, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "Size", "bbox": {"l": 477.78632, "t": 73.61437999999998, "r": 494.94193, "b": 82.52094, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 508.28186, "t": 73.61437999999998, "r": 536.91437, "b": 82.52094, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "Format", "bbox": {"l": 508.28186, "t": 73.61437999999998, "r": 536.91437, "b": 82.52094, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 317.06, "t": 85.9673499999999, "r": 361.64264, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "PubTabNet", "bbox": {"l": 317.06, "t": 85.9673499999999, "r": 361.64264, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 417.85599, "t": 85.6684600000001, "r": 425.37775, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "3", "bbox": {"l": 417.85599, "t": 85.6684600000001, "r": 425.37775, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 449.89569, "t": 85.6684600000001, "r": 457.41745000000003, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "3", "bbox": {"l": 449.89569, "t": 85.6684600000001, "r": 457.41745000000003, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 476.401, "t": 85.9673499999999, "r": 496.3262, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "509k", "bbox": {"l": 476.401, "t": 85.9673499999999, "r": 496.3262, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 512.63495, "t": 85.9673499999999, "r": 532.56012, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "PNG", "bbox": {"l": 512.63495, "t": 85.9673499999999, "r": 532.56012, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 317.06, "t": 97.92236000000003, "r": 359.43094, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "FinTabNet", "bbox": {"l": 317.06, "t": 97.92236000000003, "r": 359.43094, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 417.85599, "t": 97.62347, "r": 425.37775, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "3", "bbox": {"l": 417.85599, "t": 97.62347, "r": 425.37775, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 449.89569, "t": 97.62347, "r": 457.41745000000003, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "3", "bbox": {"l": 449.89569, "t": 97.62347, "r": 457.41745000000003, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 476.401, "t": 97.92236000000003, "r": 496.3262, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "112k", "bbox": {"l": 476.401, "t": 97.92236000000003, "r": 496.3262, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 513.46185, "t": 97.92236000000003, "r": 531.73328, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "PDF", "bbox": {"l": 513.46185, "t": 97.92236000000003, "r": 531.73328, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 317.06, "t": 109.87836000000004, "r": 359.97888, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "TableBank", "bbox": {"l": 317.06, "t": 109.87836000000004, "r": 359.97888, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 417.85599, "t": 109.57947000000001, "r": 425.37775, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "3", "bbox": {"l": 417.85599, "t": 109.57947000000001, "r": 425.37775, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 450.81226, "t": 109.57947000000001, "r": 456.50091999999995, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "7", "bbox": {"l": 450.81226, "t": 109.57947000000001, "r": 456.50091999999995, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 476.401, "t": 109.87836000000004, "r": 496.3262, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "145k", "bbox": {"l": 476.401, "t": 109.87836000000004, "r": 496.3262, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 511.25017999999994, "t": 109.87836000000004, "r": 533.94501, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "JPEG", "bbox": {"l": 511.25017999999994, "t": 109.87836000000004, "r": 533.94501, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 317.06, "t": 121.83336999999995, "r": 400.37723, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "Combined-Tabnet(*)", "bbox": {"l": 317.06, "t": 121.83336999999995, "r": 400.37723, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 417.85599, "t": 121.53448000000003, "r": 425.37775, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "3", "bbox": {"l": 417.85599, "t": 121.53448000000003, "r": 425.37775, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 449.89569, "t": 121.53448000000003, "r": 457.41745000000003, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "3", "bbox": {"l": 449.89569, "t": 121.53448000000003, "r": 457.41745000000003, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 476.401, "t": 121.83336999999995, "r": 496.3262, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "400k", "bbox": {"l": 476.401, "t": 121.83336999999995, "r": 496.3262, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 512.63495, "t": 121.83336999999995, "r": 532.56012, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "PNG", "bbox": {"l": 512.63495, "t": 121.83336999999995, "r": 532.56012, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 317.06, "t": 133.78839000000005, "r": 375.17184, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "Combined(**)", "bbox": {"l": 317.06, "t": 133.78839000000005, "r": 375.17184, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 417.85599, "t": 133.48950000000002, "r": 425.37775, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "3", "bbox": {"l": 417.85599, "t": 133.48950000000002, "r": 425.37775, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 449.89569, "t": 133.48950000000002, "r": 457.41745000000003, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "3", "bbox": {"l": 449.89569, "t": 133.48950000000002, "r": 457.41745000000003, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 476.401, "t": 133.78839000000005, "r": 496.3262, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "500k", "bbox": {"l": 476.401, "t": 133.78839000000005, "r": 496.3262, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 512.63495, "t": 133.78839000000005, "r": 532.56012, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "PNG", "bbox": {"l": 512.63495, "t": 133.78839000000005, "r": 532.56012, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 317.06, "t": 145.74341000000004, "r": 369.39352, "b": 154.64995999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "SynthTabNet", "bbox": {"l": 317.06, "t": 145.74341000000004, "r": 369.39352, "b": 154.64995999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 417.85599, "t": 145.44446000000005, "r": 425.37775, "b": 154.65985, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "3", "bbox": {"l": 417.85599, "t": 145.44446000000005, "r": 425.37775, "b": 154.65985, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 449.89569, "t": 145.44446000000005, "r": 457.41745000000003, "b": 154.65985, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "3", "bbox": {"l": 449.89569, "t": 145.44446000000005, "r": 457.41745000000003, "b": 154.65985, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 476.401, "t": 145.74334999999996, "r": 496.3262, "b": 154.6499, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "600k", "bbox": {"l": 476.401, "t": 145.74334999999996, "r": 496.3262, "b": 154.6499, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 512.63495, "t": 145.74334999999996, "r": 532.56012, "b": 154.6499, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "PNG", "bbox": {"l": 512.63495, "t": 145.74334999999996, "r": 532.56012, "b": 154.6499, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ecel", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 7, "num_cols": 5, "table_cells": [{"bbox": {"l": 412.332, "t": 73.61437999999998, "r": 430.90231, "b": 82.52094, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Tags", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 442.85742, "t": 73.61437999999998, "r": 464.4463799999999, "b": 82.52094, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Bbox", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 477.78632, "t": 73.61437999999998, "r": 494.94193, "b": 82.52094, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Size", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 508.28186, "t": 73.61437999999998, "r": 536.91437, "b": 82.52094, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Format", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 317.06, "t": 85.9673499999999, "r": 361.64264, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PubTabNet", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 417.85599, "t": 85.6684600000001, "r": 425.37775, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 449.89569, "t": 85.6684600000001, "r": 457.41745000000003, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 476.401, "t": 85.9673499999999, "r": 496.3262, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "509k", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 512.63495, "t": 85.9673499999999, "r": 532.56012, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "PNG", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 317.06, "t": 97.92236000000003, "r": 359.43094, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "FinTabNet", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 417.85599, "t": 97.62347, "r": 425.37775, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 449.89569, "t": 97.62347, "r": 457.41745000000003, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 476.401, "t": 97.92236000000003, "r": 496.3262, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "112k", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 513.46185, "t": 97.92236000000003, "r": 531.73328, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "PDF", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 317.06, "t": 109.87836000000004, "r": 359.97888, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableBank", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 417.85599, "t": 109.57947000000001, "r": 425.37775, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 450.81226, "t": 109.57947000000001, "r": 456.50091999999995, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 476.401, "t": 109.87836000000004, "r": 496.3262, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "145k", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 511.25017999999994, "t": 109.87836000000004, "r": 533.94501, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "JPEG", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 317.06, "t": 121.83336999999995, "r": 400.37723, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Combined-Tabnet(*)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 417.85599, "t": 121.53448000000003, "r": 425.37775, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 449.89569, "t": 121.53448000000003, "r": 457.41745000000003, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 476.401, "t": 121.83336999999995, "r": 496.3262, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "400k", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 512.63495, "t": 121.83336999999995, "r": 532.56012, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "PNG", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 317.06, "t": 133.78839000000005, "r": 375.17184, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Combined(**)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 417.85599, "t": 133.48950000000002, "r": 425.37775, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 449.89569, "t": 133.48950000000002, "r": 457.41745000000003, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 476.401, "t": 133.78839000000005, "r": 496.3262, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "500k", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 512.63495, "t": 133.78839000000005, "r": 532.56012, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "PNG", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 317.06, "t": 145.74341000000004, "r": 369.39352, "b": 154.64995999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "SynthTabNet", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 417.85599, "t": 145.44446000000005, "r": 425.37775, "b": 154.65985, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 449.89569, "t": 145.44446000000005, "r": 457.41745000000003, "b": 154.65985, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 476.401, "t": 145.74334999999996, "r": 496.3262, "b": 154.6499, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "600k", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 512.63495, "t": 145.74334999999996, "r": 532.56012, "b": 154.6499, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "PNG", "column_header": false, "row_header": false, "row_section": false}]}}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "text", "id": 10, "page_no": 3, "cluster": {"id": 10, "label": "text", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 286.36511, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9611433148384094, "cells": [{"id": 0, "text": "amount of such tables, and kept only those ones ranging", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 286.36511, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "between 1*1 and 20*10 (rows/columns).", "bbox": {"l": 50.112, "t": 87.16339000000005, "r": 212.28319, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "amount of such tables, and kept only those ones ranging between 1*1 and 20*10 (rows/columns)."}, {"label": "text", "id": 1, "page_no": 3, "cluster": {"id": 1, "label": "text", "bbox": {"l": 50.112, "t": 100.96038999999996, "r": 286.36514, "b": 313.10507, "coord_origin": "TOPLEFT"}, "confidence": 0.988013744354248, "cells": [{"id": 2, "text": "The availability of the bounding boxes for all table cells", "bbox": {"l": 62.067001, "t": 100.96038999999996, "r": 286.36502, "b": 109.86694, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "is essential to train our models. In order to distinguish be-", "bbox": {"l": 50.112, "t": 112.91540999999995, "r": 286.36508, "b": 121.82195999999999, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "tween empty and non-empty bounding boxes, we have in-", "bbox": {"l": 50.112, "t": 124.87041999999997, "r": 286.36508, "b": 133.77697999999998, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "troduced a binary class in the annotation. Unfortunately, the", "bbox": {"l": 50.112, "t": 136.82641999999998, "r": 286.36511, "b": 145.73297000000002, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "original datasets either omit the bounding boxes for whole", "bbox": {"l": 50.112, "t": 148.78143, "r": 286.36511, "b": 157.68799, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "tables (e.g. TableBank) or they narrow their scope only to", "bbox": {"l": 50.112, "t": 160.73645, "r": 286.36508, "b": 169.64301, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "non-empty cells. Therefore, it was imperative to introduce", "bbox": {"l": 50.112, "t": 172.69146999999998, "r": 286.36505, "b": 181.59802000000002, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "a data pre-processing procedure that generates the missing", "bbox": {"l": 50.112, "t": 184.64648, "r": 286.36508, "b": 193.55304, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "bounding boxes out of the annotation information. This pro-", "bbox": {"l": 50.112, "t": 196.60248, "r": 286.36508, "b": 205.50903000000005, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "cedure first parses the provided table structure and calcu-", "bbox": {"l": 50.112, "t": 208.5575, "r": 286.36508, "b": 217.46405000000004, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "lates the dimensions of the most fine-grained grid that cov-", "bbox": {"l": 50.112, "t": 220.51251000000002, "r": 286.36511, "b": 229.41907000000003, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "ers the table structure. Notice that each table cell may oc-", "bbox": {"l": 50.112, "t": 232.46753, "r": 286.36508, "b": 241.37408000000005, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "cupy multiple grid squares due to row or column spans. In", "bbox": {"l": 50.112, "t": 244.42255, "r": 286.36508, "b": 253.32910000000004, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "case of PubTabNet we had to compute missing bounding", "bbox": {"l": 50.112, "t": 256.37756, "r": 286.36505, "b": 265.28412000000003, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "boxes for 48% of the simple and 69% of the complex ta-", "bbox": {"l": 50.112, "t": 268.33356000000003, "r": 286.36505, "b": 277.24010999999996, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "bles.", "bbox": {"l": 50.112, "t": 280.28853999999995, "r": 68.652397, "b": 289.1951, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Regarding FinTabNet, 68% of the simple and 98%", "bbox": {"l": 75.566444, "t": 280.28853999999995, "r": 286.36514, "b": 289.1951, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "of the complex tables require the generation of bounding", "bbox": {"l": 50.112, "t": 292.24353, "r": 286.36511, "b": 301.15009, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "boxes.", "bbox": {"l": 50.112, "t": 304.19852000000003, "r": 75.695961, "b": 313.10507, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The availability of the bounding boxes for all table cells is essential to train our models. In order to distinguish between empty and non-empty bounding boxes, we have introduced a binary class in the annotation. Unfortunately, the original datasets either omit the bounding boxes for whole tables (e.g. TableBank) or they narrow their scope only to non-empty cells. Therefore, it was imperative to introduce a data pre-processing procedure that generates the missing bounding boxes out of the annotation information. This procedure first parses the provided table structure and calculates the dimensions of the most fine-grained grid that covers the table structure. Notice that each table cell may occupy multiple grid squares due to row or column spans. In case of PubTabNet we had to compute missing bounding boxes for 48% of the simple and 69% of the complex tables. Regarding FinTabNet, 68% of the simple and 98% of the complex tables require the generation of bounding boxes."}, {"label": "text", "id": 4, "page_no": 3, "cluster": {"id": 4, "label": "text", "bbox": {"l": 50.112, "t": 317.99550999999997, "r": 286.36511, "b": 434.49896, "coord_origin": "TOPLEFT"}, "confidence": 0.9873981475830078, "cells": [{"id": 21, "text": "As it is illustrated in Fig. 2, the table distributions from", "bbox": {"l": 62.067001, "t": 317.99550999999997, "r": 286.36499, "b": 326.90207, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "all datasets are skewed towards simpler structures with", "bbox": {"l": 50.112, "t": 329.95151, "r": 286.36511, "b": 338.8580600000001, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "fewer number of rows/columns. Additionally, there is very", "bbox": {"l": 50.112, "t": 341.90649, "r": 286.36502, "b": 350.81305, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "limited variance in the table styles, which in case of Pub-", "bbox": {"l": 50.112, "t": 353.8614799999999, "r": 286.36505, "b": 362.76804, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "TabNet and FinTabNet means one styling format for the", "bbox": {"l": 50.112, "t": 365.81647, "r": 286.36508, "b": 374.72301999999996, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "majority of the tables.", "bbox": {"l": 50.112, "t": 377.77145, "r": 141.58859, "b": 386.67801, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Similar limitations appear also in", "bbox": {"l": 148.70189, "t": 377.77145, "r": 286.36508, "b": 386.67801, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "the type of table content, which in some cases (e.g. FinTab-", "bbox": {"l": 50.112, "t": 389.72644, "r": 286.36508, "b": 398.63300000000004, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Net) is restricted to a certain domain. Ultimately, the lack", "bbox": {"l": 50.112, "t": 401.68243, "r": 286.36511, "b": 410.58899, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "of diversity in the training dataset damages the ability of the", "bbox": {"l": 50.112, "t": 413.63742, "r": 286.36511, "b": 422.54398, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "models to generalize well on unseen data.", "bbox": {"l": 50.112, "t": 425.59241, "r": 216.39774, "b": 434.49896, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "As it is illustrated in Fig. 2, the table distributions from all datasets are skewed towards simpler structures with fewer number of rows/columns. Additionally, there is very limited variance in the table styles, which in case of PubTabNet and FinTabNet means one styling format for the majority of the tables. Similar limitations appear also in the type of table content, which in some cases (e.g. FinTabNet) is restricted to a certain domain. Ultimately, the lack of diversity in the training dataset damages the ability of the models to generalize well on unseen data."}, {"label": "text", "id": 3, "page_no": 3, "cluster": {"id": 3, "label": "text", "bbox": {"l": 50.112, "t": 439.3894, "r": 286.36655, "b": 627.62389, "coord_origin": "TOPLEFT"}, "confidence": 0.9876030087471008, "cells": [{"id": 32, "text": "Motivated by those observations we aimed at generating", "bbox": {"l": 62.067001, "t": 439.3894, "r": 286.36499, "b": 448.2959599999999, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "a synthetic table dataset named", "bbox": {"l": 50.112, "t": 451.34439, "r": 172.14388, "b": 460.25095, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "SynthTabNet", "bbox": {"l": 174.14801, "t": 451.43405, "r": 224.70818999999997, "b": 460.02182, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": ". This approach", "bbox": {"l": 224.70801, "t": 451.34439, "r": 286.36655, "b": 460.25095, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "offers control over: 1) the size of the dataset, 2) the table", "bbox": {"l": 50.112015, "t": 463.30038, "r": 286.36505, "b": 472.20694, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "structure, 3) the table style and 4) the type of content. The", "bbox": {"l": 50.112015, "t": 475.25537, "r": 286.36511, "b": 484.16193, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "complexity of the table structure is described by the size of", "bbox": {"l": 50.112015, "t": 487.21036, "r": 286.36511, "b": 496.11691, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "the table header and the table body, as well as the percentage", "bbox": {"l": 50.112015, "t": 499.16534, "r": 286.36508, "b": 508.0719, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "of the table cells covered by row spans and column spans.", "bbox": {"l": 50.112015, "t": 511.12033, "r": 286.36505, "b": 520.02689, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "A set of carefully designed styling templates provides the", "bbox": {"l": 50.112015, "t": 523.07632, "r": 286.36508, "b": 531.98288, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "basis to build a wide range of table appearances. Lastly, the", "bbox": {"l": 50.112015, "t": 535.0313100000001, "r": 286.36508, "b": 543.93788, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "table content is generated out of a curated collection of text", "bbox": {"l": 50.112015, "t": 546.98633, "r": 286.36511, "b": 555.89288, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "corpora. By controlling the size and scope of the synthetic", "bbox": {"l": 50.112015, "t": 558.94133, "r": 286.36508, "b": 567.84789, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "datasets we are able to train and evaluate our models in a", "bbox": {"l": 50.112015, "t": 570.89633, "r": 286.36511, "b": 579.8028899999999, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "variety of different conditions. For example, we can first", "bbox": {"l": 50.112015, "t": 582.85133, "r": 286.36511, "b": 591.75789, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "generate a highly diverse dataset to train our models and", "bbox": {"l": 50.112015, "t": 594.80733, "r": 286.36505, "b": 603.71388, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "then evaluate their performance on other synthetic datasets", "bbox": {"l": 50.112015, "t": 606.76233, "r": 286.36508, "b": 615.6688800000001, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "which are focused on a specific domain.", "bbox": {"l": 50.112015, "t": 618.71733, "r": 209.7527, "b": 627.62389, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Motivated by those observations we aimed at generating a synthetic table dataset named SynthTabNet . This approach offers control over: 1) the size of the dataset, 2) the table structure, 3) the table style and 4) the type of content. The complexity of the table structure is described by the size of the table header and the table body, as well as the percentage of the table cells covered by row spans and column spans. A set of carefully designed styling templates provides the basis to build a wide range of table appearances. Lastly, the table content is generated out of a curated collection of text corpora. By controlling the size and scope of the synthetic datasets we are able to train and evaluate our models in a variety of different conditions. For example, we can first generate a highly diverse dataset to train our models and then evaluate their performance on other synthetic datasets which are focused on a specific domain."}, {"label": "text", "id": 5, "page_no": 3, "cluster": {"id": 5, "label": "text", "bbox": {"l": 50.112015, "t": 632.51433, "r": 286.36511, "b": 713.151894, "coord_origin": "TOPLEFT"}, "confidence": 0.9871614575386047, "cells": [{"id": 50, "text": "In this regard, we have prepared four synthetic datasets,", "bbox": {"l": 62.067017, "t": 632.51433, "r": 286.36499, "b": 641.42088, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "each one containing 150k examples. The corpora to gener-", "bbox": {"l": 50.112015, "t": 644.46933, "r": 286.36508, "b": 653.37589, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "ate the table text consists of the most frequent terms appear-", "bbox": {"l": 50.112015, "t": 656.42532, "r": 286.36511, "b": 665.33189, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "ing in PubTabNet and FinTabNet together with randomly", "bbox": {"l": 50.112015, "t": 668.38033, "r": 286.36505, "b": 677.28689, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "generated text. The first two synthetic datasets have been", "bbox": {"l": 50.112015, "t": 680.33533, "r": 286.36508, "b": 689.24189, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "fine-tuned to mimic the appearance of the original datasets", "bbox": {"l": 50.112015, "t": 692.290329, "r": 286.36508, "b": 701.196892, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "but encompass more complicated table structures. The third", "bbox": {"l": 50.112015, "t": 704.245331, "r": 286.36511, "b": 713.151894, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In this regard, we have prepared four synthetic datasets, each one containing 150k examples. The corpora to generate the table text consists of the most frequent terms appearing in PubTabNet and FinTabNet together with randomly generated text. The first two synthetic datasets have been fine-tuned to mimic the appearance of the original datasets but encompass more complicated table structures. The third"}, {"label": "table", "id": 8, "page_no": 3, "cluster": {"id": 8, "label": "table", "bbox": {"l": 310.67584228515625, "t": 73.19388580322266, "r": 542.9547119140625, "b": 155.22052001953125, "coord_origin": "TOPLEFT"}, "confidence": 0.9777463674545288, "cells": [{"id": 57, "text": "Tags", "bbox": {"l": 412.332, "t": 73.61437999999998, "r": 430.90231, "b": 82.52094, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Bbox", "bbox": {"l": 442.85742, "t": 73.61437999999998, "r": 464.4463799999999, "b": 82.52094, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Size", "bbox": {"l": 477.78632, "t": 73.61437999999998, "r": 494.94193, "b": 82.52094, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Format", "bbox": {"l": 508.28186, "t": 73.61437999999998, "r": 536.91437, "b": 82.52094, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "PubTabNet", "bbox": {"l": 317.06, "t": 85.9673499999999, "r": 361.64264, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "3", "bbox": {"l": 417.85599, "t": 85.6684600000001, "r": 425.37775, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "3", "bbox": {"l": 449.89569, "t": 85.6684600000001, "r": 457.41745000000003, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "509k", "bbox": {"l": 476.401, "t": 85.9673499999999, "r": 496.3262, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "PNG", "bbox": {"l": 512.63495, "t": 85.9673499999999, "r": 532.56012, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "FinTabNet", "bbox": {"l": 317.06, "t": 97.92236000000003, "r": 359.43094, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "3", "bbox": {"l": 417.85599, "t": 97.62347, "r": 425.37775, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "3", "bbox": {"l": 449.89569, "t": 97.62347, "r": 457.41745000000003, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "112k", "bbox": {"l": 476.401, "t": 97.92236000000003, "r": 496.3262, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "PDF", "bbox": {"l": 513.46185, "t": 97.92236000000003, "r": 531.73328, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "TableBank", "bbox": {"l": 317.06, "t": 109.87836000000004, "r": 359.97888, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "3", "bbox": {"l": 417.85599, "t": 109.57947000000001, "r": 425.37775, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "7", "bbox": {"l": 450.81226, "t": 109.57947000000001, "r": 456.50091999999995, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "145k", "bbox": {"l": 476.401, "t": 109.87836000000004, "r": 496.3262, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "JPEG", "bbox": {"l": 511.25017999999994, "t": 109.87836000000004, "r": 533.94501, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "Combined-Tabnet(*)", "bbox": {"l": 317.06, "t": 121.83336999999995, "r": 400.37723, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "3", "bbox": {"l": 417.85599, "t": 121.53448000000003, "r": 425.37775, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "3", "bbox": {"l": 449.89569, "t": 121.53448000000003, "r": 457.41745000000003, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "400k", "bbox": {"l": 476.401, "t": 121.83336999999995, "r": 496.3262, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "PNG", "bbox": {"l": 512.63495, "t": 121.83336999999995, "r": 532.56012, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Combined(**)", "bbox": {"l": 317.06, "t": 133.78839000000005, "r": 375.17184, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "3", "bbox": {"l": 417.85599, "t": 133.48950000000002, "r": 425.37775, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "3", "bbox": {"l": 449.89569, "t": 133.48950000000002, "r": 457.41745000000003, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "500k", "bbox": {"l": 476.401, "t": 133.78839000000005, "r": 496.3262, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "PNG", "bbox": {"l": 512.63495, "t": 133.78839000000005, "r": 532.56012, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "SynthTabNet", "bbox": {"l": 317.06, "t": 145.74341000000004, "r": 369.39352, "b": 154.64995999999996, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "3", "bbox": {"l": 417.85599, "t": 145.44446000000005, "r": 425.37775, "b": 154.65985, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "3", "bbox": {"l": 449.89569, "t": 145.44446000000005, "r": 457.41745000000003, "b": 154.65985, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "600k", "bbox": {"l": 476.401, "t": 145.74334999999996, "r": 496.3262, "b": 154.6499, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "PNG", "bbox": {"l": 512.63495, "t": 145.74334999999996, "r": 532.56012, "b": 154.6499, "coord_origin": "TOPLEFT"}}], "children": [{"id": 15, "label": "text", "bbox": {"l": 412.332, "t": 73.61437999999998, "r": 430.90231, "b": 82.52094, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "Tags", "bbox": {"l": 412.332, "t": 73.61437999999998, "r": 430.90231, "b": 82.52094, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 442.85742, "t": 73.61437999999998, "r": 464.4463799999999, "b": 82.52094, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "Bbox", "bbox": {"l": 442.85742, "t": 73.61437999999998, "r": 464.4463799999999, "b": 82.52094, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 477.78632, "t": 73.61437999999998, "r": 494.94193, "b": 82.52094, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "Size", "bbox": {"l": 477.78632, "t": 73.61437999999998, "r": 494.94193, "b": 82.52094, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 508.28186, "t": 73.61437999999998, "r": 536.91437, "b": 82.52094, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "Format", "bbox": {"l": 508.28186, "t": 73.61437999999998, "r": 536.91437, "b": 82.52094, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 317.06, "t": 85.9673499999999, "r": 361.64264, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "PubTabNet", "bbox": {"l": 317.06, "t": 85.9673499999999, "r": 361.64264, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 417.85599, "t": 85.6684600000001, "r": 425.37775, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "3", "bbox": {"l": 417.85599, "t": 85.6684600000001, "r": 425.37775, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 449.89569, "t": 85.6684600000001, "r": 457.41745000000003, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "3", "bbox": {"l": 449.89569, "t": 85.6684600000001, "r": 457.41745000000003, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 476.401, "t": 85.9673499999999, "r": 496.3262, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "509k", "bbox": {"l": 476.401, "t": 85.9673499999999, "r": 496.3262, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 512.63495, "t": 85.9673499999999, "r": 532.56012, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "PNG", "bbox": {"l": 512.63495, "t": 85.9673499999999, "r": 532.56012, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 317.06, "t": 97.92236000000003, "r": 359.43094, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "FinTabNet", "bbox": {"l": 317.06, "t": 97.92236000000003, "r": 359.43094, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 417.85599, "t": 97.62347, "r": 425.37775, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "3", "bbox": {"l": 417.85599, "t": 97.62347, "r": 425.37775, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 449.89569, "t": 97.62347, "r": 457.41745000000003, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "3", "bbox": {"l": 449.89569, "t": 97.62347, "r": 457.41745000000003, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 476.401, "t": 97.92236000000003, "r": 496.3262, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "112k", "bbox": {"l": 476.401, "t": 97.92236000000003, "r": 496.3262, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 513.46185, "t": 97.92236000000003, "r": 531.73328, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "PDF", "bbox": {"l": 513.46185, "t": 97.92236000000003, "r": 531.73328, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 317.06, "t": 109.87836000000004, "r": 359.97888, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "TableBank", "bbox": {"l": 317.06, "t": 109.87836000000004, "r": 359.97888, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 417.85599, "t": 109.57947000000001, "r": 425.37775, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "3", "bbox": {"l": 417.85599, "t": 109.57947000000001, "r": 425.37775, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 450.81226, "t": 109.57947000000001, "r": 456.50091999999995, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "7", "bbox": {"l": 450.81226, "t": 109.57947000000001, "r": 456.50091999999995, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 476.401, "t": 109.87836000000004, "r": 496.3262, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "145k", "bbox": {"l": 476.401, "t": 109.87836000000004, "r": 496.3262, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 511.25017999999994, "t": 109.87836000000004, "r": 533.94501, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "JPEG", "bbox": {"l": 511.25017999999994, "t": 109.87836000000004, "r": 533.94501, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 317.06, "t": 121.83336999999995, "r": 400.37723, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "Combined-Tabnet(*)", "bbox": {"l": 317.06, "t": 121.83336999999995, "r": 400.37723, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 417.85599, "t": 121.53448000000003, "r": 425.37775, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "3", "bbox": {"l": 417.85599, "t": 121.53448000000003, "r": 425.37775, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 449.89569, "t": 121.53448000000003, "r": 457.41745000000003, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "3", "bbox": {"l": 449.89569, "t": 121.53448000000003, "r": 457.41745000000003, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 476.401, "t": 121.83336999999995, "r": 496.3262, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "400k", "bbox": {"l": 476.401, "t": 121.83336999999995, "r": 496.3262, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 512.63495, "t": 121.83336999999995, "r": 532.56012, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "PNG", "bbox": {"l": 512.63495, "t": 121.83336999999995, "r": 532.56012, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 317.06, "t": 133.78839000000005, "r": 375.17184, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "Combined(**)", "bbox": {"l": 317.06, "t": 133.78839000000005, "r": 375.17184, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 417.85599, "t": 133.48950000000002, "r": 425.37775, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "3", "bbox": {"l": 417.85599, "t": 133.48950000000002, "r": 425.37775, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 449.89569, "t": 133.48950000000002, "r": 457.41745000000003, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "3", "bbox": {"l": 449.89569, "t": 133.48950000000002, "r": 457.41745000000003, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 476.401, "t": 133.78839000000005, "r": 496.3262, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "500k", "bbox": {"l": 476.401, "t": 133.78839000000005, "r": 496.3262, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 512.63495, "t": 133.78839000000005, "r": 532.56012, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "PNG", "bbox": {"l": 512.63495, "t": 133.78839000000005, "r": 532.56012, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 317.06, "t": 145.74341000000004, "r": 369.39352, "b": 154.64995999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "SynthTabNet", "bbox": {"l": 317.06, "t": 145.74341000000004, "r": 369.39352, "b": 154.64995999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 417.85599, "t": 145.44446000000005, "r": 425.37775, "b": 154.65985, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "3", "bbox": {"l": 417.85599, "t": 145.44446000000005, "r": 425.37775, "b": 154.65985, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 449.89569, "t": 145.44446000000005, "r": 457.41745000000003, "b": 154.65985, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "3", "bbox": {"l": 449.89569, "t": 145.44446000000005, "r": 457.41745000000003, "b": 154.65985, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 476.401, "t": 145.74334999999996, "r": 496.3262, "b": 154.6499, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "600k", "bbox": {"l": 476.401, "t": 145.74334999999996, "r": 496.3262, "b": 154.6499, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 512.63495, "t": 145.74334999999996, "r": 532.56012, "b": 154.6499, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "PNG", "bbox": {"l": 512.63495, "t": 145.74334999999996, "r": 532.56012, "b": 154.6499, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ecel", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 7, "num_cols": 5, "table_cells": [{"bbox": {"l": 412.332, "t": 73.61437999999998, "r": 430.90231, "b": 82.52094, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Tags", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 442.85742, "t": 73.61437999999998, "r": 464.4463799999999, "b": 82.52094, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Bbox", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 477.78632, "t": 73.61437999999998, "r": 494.94193, "b": 82.52094, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Size", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 508.28186, "t": 73.61437999999998, "r": 536.91437, "b": 82.52094, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Format", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 317.06, "t": 85.9673499999999, "r": 361.64264, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PubTabNet", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 417.85599, "t": 85.6684600000001, "r": 425.37775, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 449.89569, "t": 85.6684600000001, "r": 457.41745000000003, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 476.401, "t": 85.9673499999999, "r": 496.3262, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "509k", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 512.63495, "t": 85.9673499999999, "r": 532.56012, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "PNG", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 317.06, "t": 97.92236000000003, "r": 359.43094, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "FinTabNet", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 417.85599, "t": 97.62347, "r": 425.37775, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 449.89569, "t": 97.62347, "r": 457.41745000000003, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 476.401, "t": 97.92236000000003, "r": 496.3262, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "112k", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 513.46185, "t": 97.92236000000003, "r": 531.73328, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "PDF", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 317.06, "t": 109.87836000000004, "r": 359.97888, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableBank", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 417.85599, "t": 109.57947000000001, "r": 425.37775, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 450.81226, "t": 109.57947000000001, "r": 456.50091999999995, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 476.401, "t": 109.87836000000004, "r": 496.3262, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "145k", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 511.25017999999994, "t": 109.87836000000004, "r": 533.94501, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "JPEG", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 317.06, "t": 121.83336999999995, "r": 400.37723, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Combined-Tabnet(*)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 417.85599, "t": 121.53448000000003, "r": 425.37775, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 449.89569, "t": 121.53448000000003, "r": 457.41745000000003, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 476.401, "t": 121.83336999999995, "r": 496.3262, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "400k", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 512.63495, "t": 121.83336999999995, "r": 532.56012, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "PNG", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 317.06, "t": 133.78839000000005, "r": 375.17184, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Combined(**)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 417.85599, "t": 133.48950000000002, "r": 425.37775, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 449.89569, "t": 133.48950000000002, "r": 457.41745000000003, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 476.401, "t": 133.78839000000005, "r": 496.3262, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "500k", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 512.63495, "t": 133.78839000000005, "r": 532.56012, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "PNG", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 317.06, "t": 145.74341000000004, "r": 369.39352, "b": 154.64995999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "SynthTabNet", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 417.85599, "t": 145.44446000000005, "r": 425.37775, "b": 154.65985, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 449.89569, "t": 145.44446000000005, "r": 457.41745000000003, "b": 154.65985, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 476.401, "t": 145.74334999999996, "r": 496.3262, "b": 154.6499, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "600k", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 512.63495, "t": 145.74334999999996, "r": 532.56012, "b": 154.6499, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "PNG", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "caption", "id": 9, "page_no": 3, "cluster": {"id": 9, "label": "caption", "bbox": {"l": 308.862, "t": 167.66138, "r": 545.11505, "b": 224.38897999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9667726755142212, "cells": [{"id": 91, "text": "Table 1:", "bbox": {"l": 308.862, "t": 167.66138, "r": 344.6178, "b": 176.56793000000005, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Both", "bbox": {"l": 361.07602, "t": 167.66138, "r": 380.45328, "b": 176.56793000000005, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "\u201cCombined-Tabnet\u201d", "bbox": {"l": 386.56799, "t": 167.75104, "r": 468.67974999999996, "b": 176.33880999999997, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "and", "bbox": {"l": 474.79599, "t": 167.66138, "r": 489.18198, "b": 176.56793000000005, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "\u201dCombined-", "bbox": {"l": 495.29898000000003, "t": 167.75104, "r": 545.112, "b": 176.33880999999997, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "Tabnet\u201d", "bbox": {"l": 308.862, "t": 179.70605, "r": 341.16077, "b": 188.29381999999998, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "are variations of the following: (*) The Combined-", "bbox": {"l": 343.457, "t": 179.61639000000002, "r": 545.11005, "b": 188.52295000000004, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "Tabnet dataset is the processed combination of PubTabNet", "bbox": {"l": 308.862, "t": 191.57141000000001, "r": 545.11505, "b": 200.47797000000003, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "and Fintabnet. (**) The combined dataset is the processed", "bbox": {"l": 308.862, "t": 203.52643, "r": 545.11499, "b": 212.43298000000004, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "combination of PubTabNet, Fintabnet and TableBank.", "bbox": {"l": 308.862, "t": 215.48242000000005, "r": 523.93469, "b": 224.38897999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 1: Both \"Combined-Tabnet\" and \"CombinedTabnet\" are variations of the following: (*) The CombinedTabnet dataset is the processed combination of PubTabNet and Fintabnet. (**) The combined dataset is the processed combination of PubTabNet, Fintabnet and TableBank."}, {"label": "text", "id": 6, "page_no": 3, "cluster": {"id": 6, "label": "text", "bbox": {"l": 308.862, "t": 249.62041999999997, "r": 545.11517, "b": 294.39197, "coord_origin": "TOPLEFT"}, "confidence": 0.978954017162323, "cells": [{"id": 101, "text": "one adopts a colorful appearance with high contrast and the", "bbox": {"l": 308.862, "t": 249.62041999999997, "r": 545.11517, "b": 258.52698, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "last one contains tables with sparse content. Lastly, we have", "bbox": {"l": 308.862, "t": 261.57543999999996, "r": 545.11517, "b": 270.48199, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "combined all synthetic datasets into one big unified syn-", "bbox": {"l": 308.862, "t": 273.5304, "r": 545.11505, "b": 282.43698, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "thetic dataset of 600k examples.", "bbox": {"l": 308.862, "t": 285.48541000000006, "r": 436.82169, "b": 294.39197, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "one adopts a colorful appearance with high contrast and the last one contains tables with sparse content. Lastly, we have combined all synthetic datasets into one big unified synthetic dataset of 600k examples."}, {"label": "text", "id": 13, "page_no": 3, "cluster": {"id": 13, "label": "text", "bbox": {"l": 320.81699, "t": 297.77240000000006, "r": 542.74396, "b": 306.67896, "coord_origin": "TOPLEFT"}, "confidence": 0.9043695330619812, "cells": [{"id": 105, "text": "Tab. 1 summarizes the various attributes of the datasets.", "bbox": {"l": 320.81699, "t": 297.77240000000006, "r": 542.74396, "b": 306.67896, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Tab. 1 summarizes the various attributes of the datasets."}, {"label": "section_header", "id": 11, "page_no": 3, "cluster": {"id": 11, "label": "section_header", "bbox": {"l": 308.862, "t": 321.18396, "r": 444.93607000000003, "b": 331.93167000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9466595649719238, "cells": [{"id": 106, "text": "4.", "bbox": {"l": 308.862, "t": 321.18396, "r": 316.28476, "b": 331.93167000000005, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "The TableFormer model", "bbox": {"l": 326.18176, "t": 321.18396, "r": 444.93607000000003, "b": 331.93167000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4. The TableFormer model"}, {"label": "text", "id": 0, "page_no": 3, "cluster": {"id": 0, "label": "text", "bbox": {"l": 308.862, "t": 341.93939, "r": 545.11523, "b": 446.48685000000006, "coord_origin": "TOPLEFT"}, "confidence": 0.9884450435638428, "cells": [{"id": 108, "text": "Given the image of a table, TableFormer is able to pre-", "bbox": {"l": 320.81699, "t": 341.93939, "r": 545.11499, "b": 350.84594999999996, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "dict: 1) a sequence of tokens that represent the structure of", "bbox": {"l": 308.862, "t": 353.89438, "r": 545.11511, "b": 362.80092999999994, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "a table, and 2) a bounding box coupled to a subset of those", "bbox": {"l": 308.862, "t": 365.84937, "r": 545.11517, "b": 374.75592, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "tokens. The conversion of an image into a sequence of to-", "bbox": {"l": 308.862, "t": 377.80435, "r": 545.11505, "b": 386.71091, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "kens is a well-known task [35, 16]. While attention is often", "bbox": {"l": 308.862, "t": 389.75934000000007, "r": 545.11517, "b": 398.66588999999993, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "used as an implicit method to associate each token of the", "bbox": {"l": 308.862, "t": 401.71432000000004, "r": 545.11523, "b": 410.62088, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "sequence with a position in the original image, an explicit", "bbox": {"l": 308.862, "t": 413.67032, "r": 545.11517, "b": 422.57687, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "association between the individual table-cells and the image", "bbox": {"l": 308.862, "t": 425.62531, "r": 545.11505, "b": 434.53186, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "bounding boxes is also required.", "bbox": {"l": 308.862, "t": 437.58029, "r": 437.9375, "b": 446.48685000000006, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Given the image of a table, TableFormer is able to predict: 1) a sequence of tokens that represent the structure of a table, and 2) a bounding box coupled to a subset of those tokens. The conversion of an image into a sequence of tokens is a well-known task [35, 16]. While attention is often used as an implicit method to associate each token of the sequence with a position in the original image, an explicit association between the individual table-cells and the image bounding boxes is also required."}, {"label": "section_header", "id": 12, "page_no": 3, "cluster": {"id": 12, "label": "section_header", "bbox": {"l": 308.862, "t": 457.69427, "r": 420.16058, "b": 467.54633, "coord_origin": "TOPLEFT"}, "confidence": 0.937696099281311, "cells": [{"id": 117, "text": "4.1.", "bbox": {"l": 308.862, "t": 457.69427, "r": 323.14081, "b": 467.54633, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "Model architecture.", "bbox": {"l": 332.66003, "t": 457.69427, "r": 420.16058, "b": 467.54633, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4.1. Model architecture."}, {"label": "text", "id": 2, "page_no": 3, "cluster": {"id": 2, "label": "text", "bbox": {"l": 308.86197, "t": 476.76529, "r": 545.11572, "b": 664.99981, "coord_origin": "TOPLEFT"}, "confidence": 0.9878323078155518, "cells": [{"id": 119, "text": "We now describe in detail the proposed method, which", "bbox": {"l": 320.81699, "t": 476.76529, "r": 545.11487, "b": 485.67184, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "is composed of three main components, see Fig.", "bbox": {"l": 308.862, "t": 488.72028, "r": 509.02054, "b": 497.62683, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "4.", "bbox": {"l": 515.58588, "t": 488.72028, "r": 523.05786, "b": 497.62683, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Our", "bbox": {"l": 529.62323, "t": 488.72028, "r": 545.11505, "b": 497.62683, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "CNN Backbone Network", "bbox": {"l": 308.862, "t": 500.76492, "r": 406.34601, "b": 509.35269, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "encodes the input as a feature vec-", "bbox": {"l": 408.87201, "t": 500.67526, "r": 545.1106, "b": 509.58182, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "tor of predefined length.", "bbox": {"l": 308.862, "t": 512.63126, "r": 409.39459, "b": 521.53781, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "The input feature vector of the", "bbox": {"l": 416.72705, "t": 512.63126, "r": 545.11505, "b": 521.53781, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "encoded image is passed to the", "bbox": {"l": 308.862, "t": 524.58624, "r": 436.194, "b": 533.4928, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "Structure Decoder", "bbox": {"l": 439.526, "t": 524.6759, "r": 513.86694, "b": 533.26367, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "to pro-", "bbox": {"l": 517.43201, "t": 524.58624, "r": 545.10815, "b": 533.4928, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "duce a sequence of HTML tags that represent the structure", "bbox": {"l": 308.862, "t": 536.54124, "r": 545.11511, "b": 545.4478, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "of the table.", "bbox": {"l": 308.862, "t": 548.49625, "r": 358.5455, "b": 557.4028000000001, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "With each prediction of an HTML standard", "bbox": {"l": 365.19055, "t": 548.49625, "r": 545.11517, "b": 557.4028000000001, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "data cell (\u2018", "bbox": {"l": 308.862, "t": 560.45125, "r": 352.40851, "b": 569.3578, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "<", "bbox": {"l": 352.409, "t": 560.29184, "r": 360.1579, "b": 569.13863, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "td", "bbox": {"l": 360.15799, "t": 560.45125, "r": 367.90891, "b": 569.3578, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": ">", "bbox": {"l": 367.909, "t": 560.29184, "r": 375.6579, "b": 569.13863, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "\u2019) the hidden state of that cell is passed to", "bbox": {"l": 375.65799, "t": 560.45125, "r": 545.11182, "b": 569.3578, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "the Cell BBox Decoder. As for spanning cells, such as row", "bbox": {"l": 308.862, "t": 572.40724, "r": 545.11499, "b": 581.3138, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "or column span, the tag is broken down to \u2018", "bbox": {"l": 308.862, "t": 584.3622399999999, "r": 483.11768, "b": 593.2688, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "<", "bbox": {"l": 483.11902, "t": 584.20284, "r": 490.86792, "b": 593.04962, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "\u2019, \u2018rowspan=\u2019", "bbox": {"l": 490.86800999999997, "t": 584.3622399999999, "r": 545.11438, "b": 593.2688, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "or \u2018colspan=\u2019, with the number of spanning cells (attribute),", "bbox": {"l": 308.862, "t": 596.31725, "r": 545.11493, "b": 605.2238, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "and \u2018", "bbox": {"l": 308.862, "t": 608.27225, "r": 329.64395, "b": 617.1788, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": ">", "bbox": {"l": 329.646, "t": 608.11284, "r": 337.3949, "b": 616.9596300000001, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "\u2019. The hidden state attached to \u2018", "bbox": {"l": 337.39398, "t": 608.27225, "r": 468.5914, "b": 617.1788, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "<", "bbox": {"l": 468.59496999999993, "t": 608.11284, "r": 476.34387000000004, "b": 616.9596300000001, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "\u2019 is passed to the", "bbox": {"l": 476.3439599999999, "t": 608.27225, "r": 545.11572, "b": 617.1788, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "Cell BBox Decoder. A shared feed forward network (FFN)", "bbox": {"l": 308.86197, "t": 620.22725, "r": 545.11499, "b": 629.1338000000001, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "receives the hidden states from the Structure Decoder, to", "bbox": {"l": 308.86197, "t": 632.1822500000001, "r": 545.11517, "b": 641.08881, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "provide the final detection predictions of the bounding box", "bbox": {"l": 308.86197, "t": 644.13824, "r": 545.11511, "b": 653.0448, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "coordinates and their classification.", "bbox": {"l": 308.86197, "t": 656.09325, "r": 449.42432, "b": 664.99981, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "We now describe in detail the proposed method, which is composed of three main components, see Fig. 4. Our CNN Backbone Network encodes the input as a feature vector of predefined length. The input feature vector of the encoded image is passed to the Structure Decoder to produce a sequence of HTML tags that represent the structure of the table. With each prediction of an HTML standard data cell (' < td > ') the hidden state of that cell is passed to the Cell BBox Decoder. As for spanning cells, such as row or column span, the tag is broken down to ' < ', 'rowspan=' or 'colspan=', with the number of spanning cells (attribute), and ' > '. The hidden state attached to ' < ' is passed to the Cell BBox Decoder. A shared feed forward network (FFN) receives the hidden states from the Structure Decoder, to provide the final detection predictions of the bounding box coordinates and their classification."}, {"label": "text", "id": 7, "page_no": 3, "cluster": {"id": 7, "label": "text", "bbox": {"l": 308.86197, "t": 668.2607, "r": 545.11511, "b": 713.1518169999999, "coord_origin": "TOPLEFT"}, "confidence": 0.978580117225647, "cells": [{"id": 152, "text": "CNN Backbone Network.", "bbox": {"l": 320.81696, "t": 668.2607, "r": 431.90985, "b": 677.21707, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "A ResNet-18 CNN is the", "bbox": {"l": 439.49896, "t": 668.3802499999999, "r": 545.11255, "b": 677.2868100000001, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "backbone that receives the table image and encodes it as a", "bbox": {"l": 308.86197, "t": 680.33525, "r": 545.11499, "b": 689.24181, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "vector of predefined length. The network has been modified", "bbox": {"l": 308.86197, "t": 692.290253, "r": 545.11511, "b": 701.196815, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "by removing the linear and pooling layer, as we are not per-", "bbox": {"l": 308.86197, "t": 704.245255, "r": 545.11505, "b": 713.1518169999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "CNN Backbone Network. A ResNet-18 CNN is the backbone that receives the table image and encodes it as a vector of predefined length. The network has been modified by removing the linear and pooling layer, as we are not per-"}, {"label": "page_footer", "id": 14, "page_no": 3, "cluster": {"id": 14, "label": "page_footer", "bbox": {"l": 295.12097, "t": 734.133251, "r": 300.10226, "b": 743.039814, "coord_origin": "TOPLEFT"}, "confidence": 0.8565718531608582, "cells": [{"id": 157, "text": "4", "bbox": {"l": 295.12097, "t": 734.133251, "r": 300.10226, "b": 743.039814, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4"}], "body": [{"label": "text", "id": 10, "page_no": 3, "cluster": {"id": 10, "label": "text", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 286.36511, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9611433148384094, "cells": [{"id": 0, "text": "amount of such tables, and kept only those ones ranging", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 286.36511, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "between 1*1 and 20*10 (rows/columns).", "bbox": {"l": 50.112, "t": 87.16339000000005, "r": 212.28319, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "amount of such tables, and kept only those ones ranging between 1*1 and 20*10 (rows/columns)."}, {"label": "text", "id": 1, "page_no": 3, "cluster": {"id": 1, "label": "text", "bbox": {"l": 50.112, "t": 100.96038999999996, "r": 286.36514, "b": 313.10507, "coord_origin": "TOPLEFT"}, "confidence": 0.988013744354248, "cells": [{"id": 2, "text": "The availability of the bounding boxes for all table cells", "bbox": {"l": 62.067001, "t": 100.96038999999996, "r": 286.36502, "b": 109.86694, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "is essential to train our models. In order to distinguish be-", "bbox": {"l": 50.112, "t": 112.91540999999995, "r": 286.36508, "b": 121.82195999999999, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "tween empty and non-empty bounding boxes, we have in-", "bbox": {"l": 50.112, "t": 124.87041999999997, "r": 286.36508, "b": 133.77697999999998, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "troduced a binary class in the annotation. Unfortunately, the", "bbox": {"l": 50.112, "t": 136.82641999999998, "r": 286.36511, "b": 145.73297000000002, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "original datasets either omit the bounding boxes for whole", "bbox": {"l": 50.112, "t": 148.78143, "r": 286.36511, "b": 157.68799, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "tables (e.g. TableBank) or they narrow their scope only to", "bbox": {"l": 50.112, "t": 160.73645, "r": 286.36508, "b": 169.64301, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "non-empty cells. Therefore, it was imperative to introduce", "bbox": {"l": 50.112, "t": 172.69146999999998, "r": 286.36505, "b": 181.59802000000002, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "a data pre-processing procedure that generates the missing", "bbox": {"l": 50.112, "t": 184.64648, "r": 286.36508, "b": 193.55304, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "bounding boxes out of the annotation information. This pro-", "bbox": {"l": 50.112, "t": 196.60248, "r": 286.36508, "b": 205.50903000000005, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "cedure first parses the provided table structure and calcu-", "bbox": {"l": 50.112, "t": 208.5575, "r": 286.36508, "b": 217.46405000000004, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "lates the dimensions of the most fine-grained grid that cov-", "bbox": {"l": 50.112, "t": 220.51251000000002, "r": 286.36511, "b": 229.41907000000003, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "ers the table structure. Notice that each table cell may oc-", "bbox": {"l": 50.112, "t": 232.46753, "r": 286.36508, "b": 241.37408000000005, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "cupy multiple grid squares due to row or column spans. In", "bbox": {"l": 50.112, "t": 244.42255, "r": 286.36508, "b": 253.32910000000004, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "case of PubTabNet we had to compute missing bounding", "bbox": {"l": 50.112, "t": 256.37756, "r": 286.36505, "b": 265.28412000000003, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "boxes for 48% of the simple and 69% of the complex ta-", "bbox": {"l": 50.112, "t": 268.33356000000003, "r": 286.36505, "b": 277.24010999999996, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "bles.", "bbox": {"l": 50.112, "t": 280.28853999999995, "r": 68.652397, "b": 289.1951, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Regarding FinTabNet, 68% of the simple and 98%", "bbox": {"l": 75.566444, "t": 280.28853999999995, "r": 286.36514, "b": 289.1951, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "of the complex tables require the generation of bounding", "bbox": {"l": 50.112, "t": 292.24353, "r": 286.36511, "b": 301.15009, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "boxes.", "bbox": {"l": 50.112, "t": 304.19852000000003, "r": 75.695961, "b": 313.10507, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The availability of the bounding boxes for all table cells is essential to train our models. In order to distinguish between empty and non-empty bounding boxes, we have introduced a binary class in the annotation. Unfortunately, the original datasets either omit the bounding boxes for whole tables (e.g. TableBank) or they narrow their scope only to non-empty cells. Therefore, it was imperative to introduce a data pre-processing procedure that generates the missing bounding boxes out of the annotation information. This procedure first parses the provided table structure and calculates the dimensions of the most fine-grained grid that covers the table structure. Notice that each table cell may occupy multiple grid squares due to row or column spans. In case of PubTabNet we had to compute missing bounding boxes for 48% of the simple and 69% of the complex tables. Regarding FinTabNet, 68% of the simple and 98% of the complex tables require the generation of bounding boxes."}, {"label": "text", "id": 4, "page_no": 3, "cluster": {"id": 4, "label": "text", "bbox": {"l": 50.112, "t": 317.99550999999997, "r": 286.36511, "b": 434.49896, "coord_origin": "TOPLEFT"}, "confidence": 0.9873981475830078, "cells": [{"id": 21, "text": "As it is illustrated in Fig. 2, the table distributions from", "bbox": {"l": 62.067001, "t": 317.99550999999997, "r": 286.36499, "b": 326.90207, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "all datasets are skewed towards simpler structures with", "bbox": {"l": 50.112, "t": 329.95151, "r": 286.36511, "b": 338.8580600000001, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "fewer number of rows/columns. Additionally, there is very", "bbox": {"l": 50.112, "t": 341.90649, "r": 286.36502, "b": 350.81305, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "limited variance in the table styles, which in case of Pub-", "bbox": {"l": 50.112, "t": 353.8614799999999, "r": 286.36505, "b": 362.76804, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "TabNet and FinTabNet means one styling format for the", "bbox": {"l": 50.112, "t": 365.81647, "r": 286.36508, "b": 374.72301999999996, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "majority of the tables.", "bbox": {"l": 50.112, "t": 377.77145, "r": 141.58859, "b": 386.67801, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Similar limitations appear also in", "bbox": {"l": 148.70189, "t": 377.77145, "r": 286.36508, "b": 386.67801, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "the type of table content, which in some cases (e.g. FinTab-", "bbox": {"l": 50.112, "t": 389.72644, "r": 286.36508, "b": 398.63300000000004, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Net) is restricted to a certain domain. Ultimately, the lack", "bbox": {"l": 50.112, "t": 401.68243, "r": 286.36511, "b": 410.58899, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "of diversity in the training dataset damages the ability of the", "bbox": {"l": 50.112, "t": 413.63742, "r": 286.36511, "b": 422.54398, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "models to generalize well on unseen data.", "bbox": {"l": 50.112, "t": 425.59241, "r": 216.39774, "b": 434.49896, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "As it is illustrated in Fig. 2, the table distributions from all datasets are skewed towards simpler structures with fewer number of rows/columns. Additionally, there is very limited variance in the table styles, which in case of PubTabNet and FinTabNet means one styling format for the majority of the tables. Similar limitations appear also in the type of table content, which in some cases (e.g. FinTabNet) is restricted to a certain domain. Ultimately, the lack of diversity in the training dataset damages the ability of the models to generalize well on unseen data."}, {"label": "text", "id": 3, "page_no": 3, "cluster": {"id": 3, "label": "text", "bbox": {"l": 50.112, "t": 439.3894, "r": 286.36655, "b": 627.62389, "coord_origin": "TOPLEFT"}, "confidence": 0.9876030087471008, "cells": [{"id": 32, "text": "Motivated by those observations we aimed at generating", "bbox": {"l": 62.067001, "t": 439.3894, "r": 286.36499, "b": 448.2959599999999, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "a synthetic table dataset named", "bbox": {"l": 50.112, "t": 451.34439, "r": 172.14388, "b": 460.25095, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "SynthTabNet", "bbox": {"l": 174.14801, "t": 451.43405, "r": 224.70818999999997, "b": 460.02182, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": ". This approach", "bbox": {"l": 224.70801, "t": 451.34439, "r": 286.36655, "b": 460.25095, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "offers control over: 1) the size of the dataset, 2) the table", "bbox": {"l": 50.112015, "t": 463.30038, "r": 286.36505, "b": 472.20694, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "structure, 3) the table style and 4) the type of content. The", "bbox": {"l": 50.112015, "t": 475.25537, "r": 286.36511, "b": 484.16193, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "complexity of the table structure is described by the size of", "bbox": {"l": 50.112015, "t": 487.21036, "r": 286.36511, "b": 496.11691, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "the table header and the table body, as well as the percentage", "bbox": {"l": 50.112015, "t": 499.16534, "r": 286.36508, "b": 508.0719, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "of the table cells covered by row spans and column spans.", "bbox": {"l": 50.112015, "t": 511.12033, "r": 286.36505, "b": 520.02689, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "A set of carefully designed styling templates provides the", "bbox": {"l": 50.112015, "t": 523.07632, "r": 286.36508, "b": 531.98288, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "basis to build a wide range of table appearances. Lastly, the", "bbox": {"l": 50.112015, "t": 535.0313100000001, "r": 286.36508, "b": 543.93788, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "table content is generated out of a curated collection of text", "bbox": {"l": 50.112015, "t": 546.98633, "r": 286.36511, "b": 555.89288, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "corpora. By controlling the size and scope of the synthetic", "bbox": {"l": 50.112015, "t": 558.94133, "r": 286.36508, "b": 567.84789, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "datasets we are able to train and evaluate our models in a", "bbox": {"l": 50.112015, "t": 570.89633, "r": 286.36511, "b": 579.8028899999999, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "variety of different conditions. For example, we can first", "bbox": {"l": 50.112015, "t": 582.85133, "r": 286.36511, "b": 591.75789, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "generate a highly diverse dataset to train our models and", "bbox": {"l": 50.112015, "t": 594.80733, "r": 286.36505, "b": 603.71388, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "then evaluate their performance on other synthetic datasets", "bbox": {"l": 50.112015, "t": 606.76233, "r": 286.36508, "b": 615.6688800000001, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "which are focused on a specific domain.", "bbox": {"l": 50.112015, "t": 618.71733, "r": 209.7527, "b": 627.62389, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Motivated by those observations we aimed at generating a synthetic table dataset named SynthTabNet . This approach offers control over: 1) the size of the dataset, 2) the table structure, 3) the table style and 4) the type of content. The complexity of the table structure is described by the size of the table header and the table body, as well as the percentage of the table cells covered by row spans and column spans. A set of carefully designed styling templates provides the basis to build a wide range of table appearances. Lastly, the table content is generated out of a curated collection of text corpora. By controlling the size and scope of the synthetic datasets we are able to train and evaluate our models in a variety of different conditions. For example, we can first generate a highly diverse dataset to train our models and then evaluate their performance on other synthetic datasets which are focused on a specific domain."}, {"label": "text", "id": 5, "page_no": 3, "cluster": {"id": 5, "label": "text", "bbox": {"l": 50.112015, "t": 632.51433, "r": 286.36511, "b": 713.151894, "coord_origin": "TOPLEFT"}, "confidence": 0.9871614575386047, "cells": [{"id": 50, "text": "In this regard, we have prepared four synthetic datasets,", "bbox": {"l": 62.067017, "t": 632.51433, "r": 286.36499, "b": 641.42088, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "each one containing 150k examples. The corpora to gener-", "bbox": {"l": 50.112015, "t": 644.46933, "r": 286.36508, "b": 653.37589, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "ate the table text consists of the most frequent terms appear-", "bbox": {"l": 50.112015, "t": 656.42532, "r": 286.36511, "b": 665.33189, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "ing in PubTabNet and FinTabNet together with randomly", "bbox": {"l": 50.112015, "t": 668.38033, "r": 286.36505, "b": 677.28689, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "generated text. The first two synthetic datasets have been", "bbox": {"l": 50.112015, "t": 680.33533, "r": 286.36508, "b": 689.24189, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "fine-tuned to mimic the appearance of the original datasets", "bbox": {"l": 50.112015, "t": 692.290329, "r": 286.36508, "b": 701.196892, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "but encompass more complicated table structures. The third", "bbox": {"l": 50.112015, "t": 704.245331, "r": 286.36511, "b": 713.151894, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In this regard, we have prepared four synthetic datasets, each one containing 150k examples. The corpora to generate the table text consists of the most frequent terms appearing in PubTabNet and FinTabNet together with randomly generated text. The first two synthetic datasets have been fine-tuned to mimic the appearance of the original datasets but encompass more complicated table structures. The third"}, {"label": "table", "id": 8, "page_no": 3, "cluster": {"id": 8, "label": "table", "bbox": {"l": 310.67584228515625, "t": 73.19388580322266, "r": 542.9547119140625, "b": 155.22052001953125, "coord_origin": "TOPLEFT"}, "confidence": 0.9777463674545288, "cells": [{"id": 57, "text": "Tags", "bbox": {"l": 412.332, "t": 73.61437999999998, "r": 430.90231, "b": 82.52094, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Bbox", "bbox": {"l": 442.85742, "t": 73.61437999999998, "r": 464.4463799999999, "b": 82.52094, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Size", "bbox": {"l": 477.78632, "t": 73.61437999999998, "r": 494.94193, "b": 82.52094, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Format", "bbox": {"l": 508.28186, "t": 73.61437999999998, "r": 536.91437, "b": 82.52094, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "PubTabNet", "bbox": {"l": 317.06, "t": 85.9673499999999, "r": 361.64264, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "3", "bbox": {"l": 417.85599, "t": 85.6684600000001, "r": 425.37775, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "3", "bbox": {"l": 449.89569, "t": 85.6684600000001, "r": 457.41745000000003, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "509k", "bbox": {"l": 476.401, "t": 85.9673499999999, "r": 496.3262, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "PNG", "bbox": {"l": 512.63495, "t": 85.9673499999999, "r": 532.56012, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "FinTabNet", "bbox": {"l": 317.06, "t": 97.92236000000003, "r": 359.43094, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "3", "bbox": {"l": 417.85599, "t": 97.62347, "r": 425.37775, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "3", "bbox": {"l": 449.89569, "t": 97.62347, "r": 457.41745000000003, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "112k", "bbox": {"l": 476.401, "t": 97.92236000000003, "r": 496.3262, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "PDF", "bbox": {"l": 513.46185, "t": 97.92236000000003, "r": 531.73328, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "TableBank", "bbox": {"l": 317.06, "t": 109.87836000000004, "r": 359.97888, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "3", "bbox": {"l": 417.85599, "t": 109.57947000000001, "r": 425.37775, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "7", "bbox": {"l": 450.81226, "t": 109.57947000000001, "r": 456.50091999999995, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "145k", "bbox": {"l": 476.401, "t": 109.87836000000004, "r": 496.3262, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "JPEG", "bbox": {"l": 511.25017999999994, "t": 109.87836000000004, "r": 533.94501, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "Combined-Tabnet(*)", "bbox": {"l": 317.06, "t": 121.83336999999995, "r": 400.37723, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "3", "bbox": {"l": 417.85599, "t": 121.53448000000003, "r": 425.37775, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "3", "bbox": {"l": 449.89569, "t": 121.53448000000003, "r": 457.41745000000003, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "400k", "bbox": {"l": 476.401, "t": 121.83336999999995, "r": 496.3262, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "PNG", "bbox": {"l": 512.63495, "t": 121.83336999999995, "r": 532.56012, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Combined(**)", "bbox": {"l": 317.06, "t": 133.78839000000005, "r": 375.17184, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "3", "bbox": {"l": 417.85599, "t": 133.48950000000002, "r": 425.37775, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "3", "bbox": {"l": 449.89569, "t": 133.48950000000002, "r": 457.41745000000003, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "500k", "bbox": {"l": 476.401, "t": 133.78839000000005, "r": 496.3262, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "PNG", "bbox": {"l": 512.63495, "t": 133.78839000000005, "r": 532.56012, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "SynthTabNet", "bbox": {"l": 317.06, "t": 145.74341000000004, "r": 369.39352, "b": 154.64995999999996, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "3", "bbox": {"l": 417.85599, "t": 145.44446000000005, "r": 425.37775, "b": 154.65985, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "3", "bbox": {"l": 449.89569, "t": 145.44446000000005, "r": 457.41745000000003, "b": 154.65985, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "600k", "bbox": {"l": 476.401, "t": 145.74334999999996, "r": 496.3262, "b": 154.6499, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "PNG", "bbox": {"l": 512.63495, "t": 145.74334999999996, "r": 532.56012, "b": 154.6499, "coord_origin": "TOPLEFT"}}], "children": [{"id": 15, "label": "text", "bbox": {"l": 412.332, "t": 73.61437999999998, "r": 430.90231, "b": 82.52094, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "Tags", "bbox": {"l": 412.332, "t": 73.61437999999998, "r": 430.90231, "b": 82.52094, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 442.85742, "t": 73.61437999999998, "r": 464.4463799999999, "b": 82.52094, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "Bbox", "bbox": {"l": 442.85742, "t": 73.61437999999998, "r": 464.4463799999999, "b": 82.52094, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 477.78632, "t": 73.61437999999998, "r": 494.94193, "b": 82.52094, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "Size", "bbox": {"l": 477.78632, "t": 73.61437999999998, "r": 494.94193, "b": 82.52094, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 508.28186, "t": 73.61437999999998, "r": 536.91437, "b": 82.52094, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "Format", "bbox": {"l": 508.28186, "t": 73.61437999999998, "r": 536.91437, "b": 82.52094, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 317.06, "t": 85.9673499999999, "r": 361.64264, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "PubTabNet", "bbox": {"l": 317.06, "t": 85.9673499999999, "r": 361.64264, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 417.85599, "t": 85.6684600000001, "r": 425.37775, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "3", "bbox": {"l": 417.85599, "t": 85.6684600000001, "r": 425.37775, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 449.89569, "t": 85.6684600000001, "r": 457.41745000000003, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "3", "bbox": {"l": 449.89569, "t": 85.6684600000001, "r": 457.41745000000003, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 476.401, "t": 85.9673499999999, "r": 496.3262, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "509k", "bbox": {"l": 476.401, "t": 85.9673499999999, "r": 496.3262, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 512.63495, "t": 85.9673499999999, "r": 532.56012, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "PNG", "bbox": {"l": 512.63495, "t": 85.9673499999999, "r": 532.56012, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 317.06, "t": 97.92236000000003, "r": 359.43094, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "FinTabNet", "bbox": {"l": 317.06, "t": 97.92236000000003, "r": 359.43094, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 417.85599, "t": 97.62347, "r": 425.37775, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "3", "bbox": {"l": 417.85599, "t": 97.62347, "r": 425.37775, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 449.89569, "t": 97.62347, "r": 457.41745000000003, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "3", "bbox": {"l": 449.89569, "t": 97.62347, "r": 457.41745000000003, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 476.401, "t": 97.92236000000003, "r": 496.3262, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "112k", "bbox": {"l": 476.401, "t": 97.92236000000003, "r": 496.3262, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 513.46185, "t": 97.92236000000003, "r": 531.73328, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "PDF", "bbox": {"l": 513.46185, "t": 97.92236000000003, "r": 531.73328, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 317.06, "t": 109.87836000000004, "r": 359.97888, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "TableBank", "bbox": {"l": 317.06, "t": 109.87836000000004, "r": 359.97888, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 417.85599, "t": 109.57947000000001, "r": 425.37775, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "3", "bbox": {"l": 417.85599, "t": 109.57947000000001, "r": 425.37775, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 450.81226, "t": 109.57947000000001, "r": 456.50091999999995, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "7", "bbox": {"l": 450.81226, "t": 109.57947000000001, "r": 456.50091999999995, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 476.401, "t": 109.87836000000004, "r": 496.3262, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "145k", "bbox": {"l": 476.401, "t": 109.87836000000004, "r": 496.3262, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 511.25017999999994, "t": 109.87836000000004, "r": 533.94501, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "JPEG", "bbox": {"l": 511.25017999999994, "t": 109.87836000000004, "r": 533.94501, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 317.06, "t": 121.83336999999995, "r": 400.37723, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "Combined-Tabnet(*)", "bbox": {"l": 317.06, "t": 121.83336999999995, "r": 400.37723, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 417.85599, "t": 121.53448000000003, "r": 425.37775, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "3", "bbox": {"l": 417.85599, "t": 121.53448000000003, "r": 425.37775, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 449.89569, "t": 121.53448000000003, "r": 457.41745000000003, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "3", "bbox": {"l": 449.89569, "t": 121.53448000000003, "r": 457.41745000000003, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 476.401, "t": 121.83336999999995, "r": 496.3262, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "400k", "bbox": {"l": 476.401, "t": 121.83336999999995, "r": 496.3262, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 512.63495, "t": 121.83336999999995, "r": 532.56012, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "PNG", "bbox": {"l": 512.63495, "t": 121.83336999999995, "r": 532.56012, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 317.06, "t": 133.78839000000005, "r": 375.17184, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "Combined(**)", "bbox": {"l": 317.06, "t": 133.78839000000005, "r": 375.17184, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 417.85599, "t": 133.48950000000002, "r": 425.37775, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "3", "bbox": {"l": 417.85599, "t": 133.48950000000002, "r": 425.37775, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 449.89569, "t": 133.48950000000002, "r": 457.41745000000003, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "3", "bbox": {"l": 449.89569, "t": 133.48950000000002, "r": 457.41745000000003, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 476.401, "t": 133.78839000000005, "r": 496.3262, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "500k", "bbox": {"l": 476.401, "t": 133.78839000000005, "r": 496.3262, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 512.63495, "t": 133.78839000000005, "r": 532.56012, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "PNG", "bbox": {"l": 512.63495, "t": 133.78839000000005, "r": 532.56012, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 317.06, "t": 145.74341000000004, "r": 369.39352, "b": 154.64995999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "SynthTabNet", "bbox": {"l": 317.06, "t": 145.74341000000004, "r": 369.39352, "b": 154.64995999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 417.85599, "t": 145.44446000000005, "r": 425.37775, "b": 154.65985, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "3", "bbox": {"l": 417.85599, "t": 145.44446000000005, "r": 425.37775, "b": 154.65985, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 449.89569, "t": 145.44446000000005, "r": 457.41745000000003, "b": 154.65985, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "3", "bbox": {"l": 449.89569, "t": 145.44446000000005, "r": 457.41745000000003, "b": 154.65985, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 476.401, "t": 145.74334999999996, "r": 496.3262, "b": 154.6499, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "600k", "bbox": {"l": 476.401, "t": 145.74334999999996, "r": 496.3262, "b": 154.6499, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 512.63495, "t": 145.74334999999996, "r": 532.56012, "b": 154.6499, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "PNG", "bbox": {"l": 512.63495, "t": 145.74334999999996, "r": 532.56012, "b": 154.6499, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ecel", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 7, "num_cols": 5, "table_cells": [{"bbox": {"l": 412.332, "t": 73.61437999999998, "r": 430.90231, "b": 82.52094, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Tags", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 442.85742, "t": 73.61437999999998, "r": 464.4463799999999, "b": 82.52094, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Bbox", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 477.78632, "t": 73.61437999999998, "r": 494.94193, "b": 82.52094, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Size", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 508.28186, "t": 73.61437999999998, "r": 536.91437, "b": 82.52094, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Format", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 317.06, "t": 85.9673499999999, "r": 361.64264, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PubTabNet", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 417.85599, "t": 85.6684600000001, "r": 425.37775, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 449.89569, "t": 85.6684600000001, "r": 457.41745000000003, "b": 94.88385000000017, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 476.401, "t": 85.9673499999999, "r": 496.3262, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "509k", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 512.63495, "t": 85.9673499999999, "r": 532.56012, "b": 94.87390000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "PNG", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 317.06, "t": 97.92236000000003, "r": 359.43094, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "FinTabNet", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 417.85599, "t": 97.62347, "r": 425.37775, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 449.89569, "t": 97.62347, "r": 457.41745000000003, "b": 106.83887000000016, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 476.401, "t": 97.92236000000003, "r": 496.3262, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "112k", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 513.46185, "t": 97.92236000000003, "r": 531.73328, "b": 106.82892000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "PDF", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 317.06, "t": 109.87836000000004, "r": 359.97888, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableBank", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 417.85599, "t": 109.57947000000001, "r": 425.37775, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 450.81226, "t": 109.57947000000001, "r": 456.50091999999995, "b": 118.79485999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 476.401, "t": 109.87836000000004, "r": 496.3262, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "145k", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 511.25017999999994, "t": 109.87836000000004, "r": 533.94501, "b": 118.78490999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "JPEG", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 317.06, "t": 121.83336999999995, "r": 400.37723, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Combined-Tabnet(*)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 417.85599, "t": 121.53448000000003, "r": 425.37775, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 449.89569, "t": 121.53448000000003, "r": 457.41745000000003, "b": 130.74987999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 476.401, "t": 121.83336999999995, "r": 496.3262, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "400k", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 512.63495, "t": 121.83336999999995, "r": 532.56012, "b": 130.73992999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "PNG", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 317.06, "t": 133.78839000000005, "r": 375.17184, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Combined(**)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 417.85599, "t": 133.48950000000002, "r": 425.37775, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 449.89569, "t": 133.48950000000002, "r": 457.41745000000003, "b": 142.70489999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 476.401, "t": 133.78839000000005, "r": 496.3262, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "500k", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 512.63495, "t": 133.78839000000005, "r": 532.56012, "b": 142.69494999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "PNG", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 317.06, "t": 145.74341000000004, "r": 369.39352, "b": 154.64995999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "SynthTabNet", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 417.85599, "t": 145.44446000000005, "r": 425.37775, "b": 154.65985, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 449.89569, "t": 145.44446000000005, "r": 457.41745000000003, "b": 154.65985, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 476.401, "t": 145.74334999999996, "r": 496.3262, "b": 154.6499, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "600k", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 512.63495, "t": 145.74334999999996, "r": 532.56012, "b": 154.6499, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "PNG", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "caption", "id": 9, "page_no": 3, "cluster": {"id": 9, "label": "caption", "bbox": {"l": 308.862, "t": 167.66138, "r": 545.11505, "b": 224.38897999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9667726755142212, "cells": [{"id": 91, "text": "Table 1:", "bbox": {"l": 308.862, "t": 167.66138, "r": 344.6178, "b": 176.56793000000005, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Both", "bbox": {"l": 361.07602, "t": 167.66138, "r": 380.45328, "b": 176.56793000000005, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "\u201cCombined-Tabnet\u201d", "bbox": {"l": 386.56799, "t": 167.75104, "r": 468.67974999999996, "b": 176.33880999999997, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "and", "bbox": {"l": 474.79599, "t": 167.66138, "r": 489.18198, "b": 176.56793000000005, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "\u201dCombined-", "bbox": {"l": 495.29898000000003, "t": 167.75104, "r": 545.112, "b": 176.33880999999997, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "Tabnet\u201d", "bbox": {"l": 308.862, "t": 179.70605, "r": 341.16077, "b": 188.29381999999998, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "are variations of the following: (*) The Combined-", "bbox": {"l": 343.457, "t": 179.61639000000002, "r": 545.11005, "b": 188.52295000000004, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "Tabnet dataset is the processed combination of PubTabNet", "bbox": {"l": 308.862, "t": 191.57141000000001, "r": 545.11505, "b": 200.47797000000003, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "and Fintabnet. (**) The combined dataset is the processed", "bbox": {"l": 308.862, "t": 203.52643, "r": 545.11499, "b": 212.43298000000004, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "combination of PubTabNet, Fintabnet and TableBank.", "bbox": {"l": 308.862, "t": 215.48242000000005, "r": 523.93469, "b": 224.38897999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 1: Both \"Combined-Tabnet\" and \"CombinedTabnet\" are variations of the following: (*) The CombinedTabnet dataset is the processed combination of PubTabNet and Fintabnet. (**) The combined dataset is the processed combination of PubTabNet, Fintabnet and TableBank."}, {"label": "text", "id": 6, "page_no": 3, "cluster": {"id": 6, "label": "text", "bbox": {"l": 308.862, "t": 249.62041999999997, "r": 545.11517, "b": 294.39197, "coord_origin": "TOPLEFT"}, "confidence": 0.978954017162323, "cells": [{"id": 101, "text": "one adopts a colorful appearance with high contrast and the", "bbox": {"l": 308.862, "t": 249.62041999999997, "r": 545.11517, "b": 258.52698, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "last one contains tables with sparse content. Lastly, we have", "bbox": {"l": 308.862, "t": 261.57543999999996, "r": 545.11517, "b": 270.48199, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "combined all synthetic datasets into one big unified syn-", "bbox": {"l": 308.862, "t": 273.5304, "r": 545.11505, "b": 282.43698, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "thetic dataset of 600k examples.", "bbox": {"l": 308.862, "t": 285.48541000000006, "r": 436.82169, "b": 294.39197, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "one adopts a colorful appearance with high contrast and the last one contains tables with sparse content. Lastly, we have combined all synthetic datasets into one big unified synthetic dataset of 600k examples."}, {"label": "text", "id": 13, "page_no": 3, "cluster": {"id": 13, "label": "text", "bbox": {"l": 320.81699, "t": 297.77240000000006, "r": 542.74396, "b": 306.67896, "coord_origin": "TOPLEFT"}, "confidence": 0.9043695330619812, "cells": [{"id": 105, "text": "Tab. 1 summarizes the various attributes of the datasets.", "bbox": {"l": 320.81699, "t": 297.77240000000006, "r": 542.74396, "b": 306.67896, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Tab. 1 summarizes the various attributes of the datasets."}, {"label": "section_header", "id": 11, "page_no": 3, "cluster": {"id": 11, "label": "section_header", "bbox": {"l": 308.862, "t": 321.18396, "r": 444.93607000000003, "b": 331.93167000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9466595649719238, "cells": [{"id": 106, "text": "4.", "bbox": {"l": 308.862, "t": 321.18396, "r": 316.28476, "b": 331.93167000000005, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "The TableFormer model", "bbox": {"l": 326.18176, "t": 321.18396, "r": 444.93607000000003, "b": 331.93167000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4. The TableFormer model"}, {"label": "text", "id": 0, "page_no": 3, "cluster": {"id": 0, "label": "text", "bbox": {"l": 308.862, "t": 341.93939, "r": 545.11523, "b": 446.48685000000006, "coord_origin": "TOPLEFT"}, "confidence": 0.9884450435638428, "cells": [{"id": 108, "text": "Given the image of a table, TableFormer is able to pre-", "bbox": {"l": 320.81699, "t": 341.93939, "r": 545.11499, "b": 350.84594999999996, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "dict: 1) a sequence of tokens that represent the structure of", "bbox": {"l": 308.862, "t": 353.89438, "r": 545.11511, "b": 362.80092999999994, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "a table, and 2) a bounding box coupled to a subset of those", "bbox": {"l": 308.862, "t": 365.84937, "r": 545.11517, "b": 374.75592, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "tokens. The conversion of an image into a sequence of to-", "bbox": {"l": 308.862, "t": 377.80435, "r": 545.11505, "b": 386.71091, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "kens is a well-known task [35, 16]. While attention is often", "bbox": {"l": 308.862, "t": 389.75934000000007, "r": 545.11517, "b": 398.66588999999993, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "used as an implicit method to associate each token of the", "bbox": {"l": 308.862, "t": 401.71432000000004, "r": 545.11523, "b": 410.62088, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "sequence with a position in the original image, an explicit", "bbox": {"l": 308.862, "t": 413.67032, "r": 545.11517, "b": 422.57687, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "association between the individual table-cells and the image", "bbox": {"l": 308.862, "t": 425.62531, "r": 545.11505, "b": 434.53186, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "bounding boxes is also required.", "bbox": {"l": 308.862, "t": 437.58029, "r": 437.9375, "b": 446.48685000000006, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Given the image of a table, TableFormer is able to predict: 1) a sequence of tokens that represent the structure of a table, and 2) a bounding box coupled to a subset of those tokens. The conversion of an image into a sequence of tokens is a well-known task [35, 16]. While attention is often used as an implicit method to associate each token of the sequence with a position in the original image, an explicit association between the individual table-cells and the image bounding boxes is also required."}, {"label": "section_header", "id": 12, "page_no": 3, "cluster": {"id": 12, "label": "section_header", "bbox": {"l": 308.862, "t": 457.69427, "r": 420.16058, "b": 467.54633, "coord_origin": "TOPLEFT"}, "confidence": 0.937696099281311, "cells": [{"id": 117, "text": "4.1.", "bbox": {"l": 308.862, "t": 457.69427, "r": 323.14081, "b": 467.54633, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "Model architecture.", "bbox": {"l": 332.66003, "t": 457.69427, "r": 420.16058, "b": 467.54633, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4.1. Model architecture."}, {"label": "text", "id": 2, "page_no": 3, "cluster": {"id": 2, "label": "text", "bbox": {"l": 308.86197, "t": 476.76529, "r": 545.11572, "b": 664.99981, "coord_origin": "TOPLEFT"}, "confidence": 0.9878323078155518, "cells": [{"id": 119, "text": "We now describe in detail the proposed method, which", "bbox": {"l": 320.81699, "t": 476.76529, "r": 545.11487, "b": 485.67184, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "is composed of three main components, see Fig.", "bbox": {"l": 308.862, "t": 488.72028, "r": 509.02054, "b": 497.62683, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "4.", "bbox": {"l": 515.58588, "t": 488.72028, "r": 523.05786, "b": 497.62683, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Our", "bbox": {"l": 529.62323, "t": 488.72028, "r": 545.11505, "b": 497.62683, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "CNN Backbone Network", "bbox": {"l": 308.862, "t": 500.76492, "r": 406.34601, "b": 509.35269, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "encodes the input as a feature vec-", "bbox": {"l": 408.87201, "t": 500.67526, "r": 545.1106, "b": 509.58182, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "tor of predefined length.", "bbox": {"l": 308.862, "t": 512.63126, "r": 409.39459, "b": 521.53781, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "The input feature vector of the", "bbox": {"l": 416.72705, "t": 512.63126, "r": 545.11505, "b": 521.53781, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "encoded image is passed to the", "bbox": {"l": 308.862, "t": 524.58624, "r": 436.194, "b": 533.4928, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "Structure Decoder", "bbox": {"l": 439.526, "t": 524.6759, "r": 513.86694, "b": 533.26367, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "to pro-", "bbox": {"l": 517.43201, "t": 524.58624, "r": 545.10815, "b": 533.4928, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "duce a sequence of HTML tags that represent the structure", "bbox": {"l": 308.862, "t": 536.54124, "r": 545.11511, "b": 545.4478, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "of the table.", "bbox": {"l": 308.862, "t": 548.49625, "r": 358.5455, "b": 557.4028000000001, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "With each prediction of an HTML standard", "bbox": {"l": 365.19055, "t": 548.49625, "r": 545.11517, "b": 557.4028000000001, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "data cell (\u2018", "bbox": {"l": 308.862, "t": 560.45125, "r": 352.40851, "b": 569.3578, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "<", "bbox": {"l": 352.409, "t": 560.29184, "r": 360.1579, "b": 569.13863, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "td", "bbox": {"l": 360.15799, "t": 560.45125, "r": 367.90891, "b": 569.3578, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": ">", "bbox": {"l": 367.909, "t": 560.29184, "r": 375.6579, "b": 569.13863, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "\u2019) the hidden state of that cell is passed to", "bbox": {"l": 375.65799, "t": 560.45125, "r": 545.11182, "b": 569.3578, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "the Cell BBox Decoder. As for spanning cells, such as row", "bbox": {"l": 308.862, "t": 572.40724, "r": 545.11499, "b": 581.3138, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "or column span, the tag is broken down to \u2018", "bbox": {"l": 308.862, "t": 584.3622399999999, "r": 483.11768, "b": 593.2688, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "<", "bbox": {"l": 483.11902, "t": 584.20284, "r": 490.86792, "b": 593.04962, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "\u2019, \u2018rowspan=\u2019", "bbox": {"l": 490.86800999999997, "t": 584.3622399999999, "r": 545.11438, "b": 593.2688, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "or \u2018colspan=\u2019, with the number of spanning cells (attribute),", "bbox": {"l": 308.862, "t": 596.31725, "r": 545.11493, "b": 605.2238, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "and \u2018", "bbox": {"l": 308.862, "t": 608.27225, "r": 329.64395, "b": 617.1788, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": ">", "bbox": {"l": 329.646, "t": 608.11284, "r": 337.3949, "b": 616.9596300000001, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "\u2019. The hidden state attached to \u2018", "bbox": {"l": 337.39398, "t": 608.27225, "r": 468.5914, "b": 617.1788, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "<", "bbox": {"l": 468.59496999999993, "t": 608.11284, "r": 476.34387000000004, "b": 616.9596300000001, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "\u2019 is passed to the", "bbox": {"l": 476.3439599999999, "t": 608.27225, "r": 545.11572, "b": 617.1788, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "Cell BBox Decoder. A shared feed forward network (FFN)", "bbox": {"l": 308.86197, "t": 620.22725, "r": 545.11499, "b": 629.1338000000001, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "receives the hidden states from the Structure Decoder, to", "bbox": {"l": 308.86197, "t": 632.1822500000001, "r": 545.11517, "b": 641.08881, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "provide the final detection predictions of the bounding box", "bbox": {"l": 308.86197, "t": 644.13824, "r": 545.11511, "b": 653.0448, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "coordinates and their classification.", "bbox": {"l": 308.86197, "t": 656.09325, "r": 449.42432, "b": 664.99981, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "We now describe in detail the proposed method, which is composed of three main components, see Fig. 4. Our CNN Backbone Network encodes the input as a feature vector of predefined length. The input feature vector of the encoded image is passed to the Structure Decoder to produce a sequence of HTML tags that represent the structure of the table. With each prediction of an HTML standard data cell (' < td > ') the hidden state of that cell is passed to the Cell BBox Decoder. As for spanning cells, such as row or column span, the tag is broken down to ' < ', 'rowspan=' or 'colspan=', with the number of spanning cells (attribute), and ' > '. The hidden state attached to ' < ' is passed to the Cell BBox Decoder. A shared feed forward network (FFN) receives the hidden states from the Structure Decoder, to provide the final detection predictions of the bounding box coordinates and their classification."}, {"label": "text", "id": 7, "page_no": 3, "cluster": {"id": 7, "label": "text", "bbox": {"l": 308.86197, "t": 668.2607, "r": 545.11511, "b": 713.1518169999999, "coord_origin": "TOPLEFT"}, "confidence": 0.978580117225647, "cells": [{"id": 152, "text": "CNN Backbone Network.", "bbox": {"l": 320.81696, "t": 668.2607, "r": 431.90985, "b": 677.21707, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "A ResNet-18 CNN is the", "bbox": {"l": 439.49896, "t": 668.3802499999999, "r": 545.11255, "b": 677.2868100000001, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "backbone that receives the table image and encodes it as a", "bbox": {"l": 308.86197, "t": 680.33525, "r": 545.11499, "b": 689.24181, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "vector of predefined length. The network has been modified", "bbox": {"l": 308.86197, "t": 692.290253, "r": 545.11511, "b": 701.196815, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "by removing the linear and pooling layer, as we are not per-", "bbox": {"l": 308.86197, "t": 704.245255, "r": 545.11505, "b": 713.1518169999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "CNN Backbone Network. A ResNet-18 CNN is the backbone that receives the table image and encodes it as a vector of predefined length. The network has been modified by removing the linear and pooling layer, as we are not per-"}], "headers": [{"label": "page_footer", "id": 14, "page_no": 3, "cluster": {"id": 14, "label": "page_footer", "bbox": {"l": 295.12097, "t": 734.133251, "r": 300.10226, "b": 743.039814, "coord_origin": "TOPLEFT"}, "confidence": 0.8565718531608582, "cells": [{"id": 157, "text": "4", "bbox": {"l": 295.12097, "t": 734.133251, "r": 300.10226, "b": 743.039814, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4"}]}}, {"page_no": 4, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "1.", "bbox": {"l": 81.688072, "t": 122.43970000000002, "r": 84.927567, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Item", "bbox": {"l": 86.54731, "t": 122.43970000000002, "r": 93.026291, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Amount", "bbox": {"l": 102.50498, "t": 115.25214000000005, "r": 115.3461, "b": 118.44135000000006, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Names", "bbox": {"l": 82.140205, "t": 115.21489999999994, "r": 93.291527, "b": 118.40410999999995, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "1000", "bbox": {"l": 96.748268, "t": 122.43970000000002, "r": 104.3119, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "500", "bbox": {"l": 96.748268, "t": 127.74370999999985, "r": 102.42083, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "3500", "bbox": {"l": 96.748268, "t": 133.45569, "r": 104.3119, "b": 136.6449, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "150", "bbox": {"l": 96.748268, "t": 139.16772000000003, "r": 102.42083, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "unit", "bbox": {"l": 110.66107, "t": 122.43970000000002, "r": 116.14391, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "unit", "bbox": {"l": 110.66107, "t": 127.74370999999985, "r": 116.14391, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "unit", "bbox": {"l": 110.66107, "t": 133.45569, "r": 116.14391, "b": 136.6449, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "unit", "bbox": {"l": 110.66107, "t": 139.16772000000003, "r": 116.14391, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "2.", "bbox": {"l": 81.688072, "t": 127.74370999999985, "r": 84.927567, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Item", "bbox": {"l": 86.54731, "t": 127.74370999999985, "r": 93.026291, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "3.", "bbox": {"l": 81.688072, "t": 133.45569, "r": 84.927567, "b": 136.6449, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Item", "bbox": {"l": 86.54731, "t": 133.45569, "r": 93.026291, "b": 136.6449, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "4.", "bbox": {"l": 81.688072, "t": 139.16772000000003, "r": 84.927567, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "Item", "bbox": {"l": 86.54731, "t": 139.16772000000003, "r": 93.026291, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Extracted", "bbox": {"l": 88.084389, "t": 90.49738000000002, "r": 113.93649, "b": 96.23798, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Table Images", "bbox": {"l": 82.81002, "t": 97.63738999999998, "r": 119.21240000000002, "b": 103.37798999999995, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Standardized", "bbox": {"l": 143.94247, "t": 100.60235999999998, "r": 180.01131, "b": 106.34295999999995, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Images", "bbox": {"l": 151.94064, "t": 107.74237000000005, "r": 172.0118, "b": 113.48297000000014, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "BBox", "bbox": {"l": 251.76939000000002, "t": 80.93096999999989, "r": 266.39557, "b": 86.67156999999997, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Decoder", "bbox": {"l": 247.51601, "t": 86.03101000000004, "r": 270.65021, "b": 91.77161000000001, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "BBoxes", "bbox": {"l": 331.03699, "t": 78.55980999999997, "r": 352.12589, "b": 84.30042000000003, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "BBoxes can be", "bbox": {"l": 390.56421, "t": 96.03223000000003, "r": 431.7261, "b": 101.77282999999989, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "traced back to the", "bbox": {"l": 386.82422, "t": 102.15228000000013, "r": 435.46966999999995, "b": 107.89287999999999, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "original image to", "bbox": {"l": 388.69589, "t": 108.27228000000002, "r": 433.6032400000001, "b": 114.01288000000011, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "extract content", "bbox": {"l": 391.07761, "t": 114.39227000000005, "r": 431.22542999999996, "b": 120.13286999999991, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Structure Tags sequence", "bbox": {"l": 431.22650000000004, "t": 151.68511999999998, "r": 498.82068, "b": 157.42571999999996, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "provide full description of", "bbox": {"l": 431.1738, "t": 157.80517999999995, "r": 498.87753000000004, "b": 163.54578000000004, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "the table structure", "bbox": {"l": 440.5289, "t": 163.92516999999998, "r": 489.51827999999995, "b": 169.66576999999995, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Structure Tags", "bbox": {"l": 328.37479, "t": 178.25385000000006, "r": 367.72333, "b": 183.99445000000003, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "BBoxes in sync", "bbox": {"l": 331.84451, "t": 123.90886999999998, "r": 373.67963, "b": 129.64948000000015, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "with tag sequence", "bbox": {"l": 331.84451, "t": 129.00885000000017, "r": 381.17786, "b": 134.74945000000002, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "Encoder", "bbox": {"l": 196.62633, "t": 88.11621000000002, "r": 219.42332, "b": 93.85681, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Structure", "bbox": {"l": 246.66771, "t": 129.4946900000001, "r": 271.49899, "b": 135.23528999999996, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "Decoder", "bbox": {"l": 247.51601, "t": 134.59473000000003, "r": 270.65021, "b": 140.33533, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "[x1, y2, x2, y2]", "bbox": {"l": 330.63071, "t": 89.01923, "r": 365.55347, "b": 94.75982999999997, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "[x1', y2', x2', y2']", "bbox": {"l": 330.63071, "t": 97.17926, "r": 370.22717, "b": 102.91985999999997, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "[x1'', y2'', x2'', y2'']", "bbox": {"l": 330.63071, "t": 105.33922999999993, "r": 374.51157, "b": 111.07983000000002, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "...", "bbox": {"l": 330.63071, "t": 113.49926999999991, "r": 335.73233, "b": 119.23987, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "<TR>", "bbox": {"l": 322.30579, "t": 141.79236000000003, "r": 335.05988, "b": 146.57617000000005, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "<TD>", "bbox": {"l": 322.30579, "t": 148.93231000000003, "r": 335.05988, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "1", "bbox": {"l": 337.54971, "t": 148.55579, "r": 340.95242, "b": 154.29638999999997, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "</TD><TD colspan=\"2\">", "bbox": {"l": 343.56262, "t": 148.93231000000003, "r": 398.91446, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "</TD>", "bbox": {"l": 407.41718, "t": 148.93231000000003, "r": 421.58801, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "</TR><TR>", "bbox": {"l": 322.30579, "t": 156.07232999999997, "r": 349.23022, "b": 160.85613999999998, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "<TD>", "bbox": {"l": 322.30579, "t": 163.21234000000004, "r": 335.05988, "b": 167.99614999999994, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "</TD><TD>...", "bbox": {"l": 343.56155, "t": 163.21234000000004, "r": 374.73685, "b": 167.99614999999994, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "...", "bbox": {"l": 322.30579, "t": 170.35235999999998, "r": 326.55716, "b": 175.13617, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "1", "bbox": {"l": 323.51111, "t": 89.66967999999997, "r": 326.91382, "b": 95.41027999999994, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "2", "bbox": {"l": 323.71509, "t": 97.78887999999995, "r": 327.1178, "b": 103.52948000000004, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "3", "bbox": {"l": 323.71509, "t": 105.98969, "r": 327.1178, "b": 111.73029000000008, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "2", "bbox": {"l": 401.4816, "t": 148.54625999999996, "r": 404.88431, "b": 154.28687000000002, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "3", "bbox": {"l": 337.6976, "t": 162.68451000000005, "r": 341.10031, "b": 168.42511000000002, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "3", "bbox": {"l": 454.46378, "t": 104.54584, "r": 457.86648999999994, "b": 110.28644000000008, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "2", "bbox": {"l": 493.32580999999993, "t": 91.09546, "r": 496.72852, "b": 96.83605999999997, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "1", "bbox": {"l": 454.08298, "t": 90.56879000000015, "r": 457.48569000000003, "b": 96.30939000000001, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Figure 3:", "bbox": {"l": 50.112, "t": 204.10535000000004, "r": 86.883949, "b": 213.01189999999997, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "TableFormer", "bbox": {"l": 94.020996, "t": 203.98577999999998, "r": 149.85141, "b": 212.94214, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "takes in an image of the PDF and creates bounding box and HTML structure predictions that are", "bbox": {"l": 152.86099, "t": 204.10535000000004, "r": 545.10846, "b": 213.01189999999997, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "synchronized. The bounding boxes grabs the content from the PDF and inserts it in the structure.", "bbox": {"l": 50.111992, "t": 216.06035999999995, "r": 436.0134, "b": 224.96691999999996, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "Input Image", "bbox": {"l": 74.253464, "t": 258.21472000000006, "r": 101.75846, "b": 264.17474000000004, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "Tokenised Tags", "bbox": {"l": 122.29972, "t": 258.34520999999995, "r": 157.83972, "b": 264.30524, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "Multi-Head Attention", "bbox": {"l": 78.549347, "t": 371.38579999999996, "r": 125.68359000000001, "b": 377.04782, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "Add", "bbox": {"l": 78.513298, "t": 391.31857, "r": 84.644547, "b": 396.98059, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "& Normalisation", "bbox": {"l": 116.52705, "t": 391.31857, "r": 125.11079999999998, "b": 396.98059, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "Feed Forward Network", "bbox": {"l": 76.024773, "t": 424.45309, "r": 127.92327000000002, "b": 430.11511, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "Add", "bbox": {"l": 78.382828, "t": 444.88956, "r": 84.514076, "b": 450.55157, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "& Normalisation", "bbox": {"l": 116.39658, "t": 444.88956, "r": 124.98033, "b": 450.55157, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Linear", "bbox": {"l": 167.46945, "t": 462.44324, "r": 181.6292, "b": 468.10526, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "Softmax", "bbox": {"l": 165.61292, "t": 478.47107, "r": 184.43242, "b": 484.13309, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "CNN BACKBONE ENCODER", "bbox": {"l": 65.319511, "t": 324.26235999999994, "r": 132.9245, "b": 330.22235000000006, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "[30, 1, 2, 3, 4, \u2026 3, ", "bbox": {"l": 119.51457, "t": 269.66394, "r": 162.98782, "b": 274.72992, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "4, 5, 8, 31]", "bbox": {"l": 128.72858, "t": 274.91394, "r": 151.41083, "b": 279.97992, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "Positional ", "bbox": {"l": 60.434211999999995, "t": 338.95993, "r": 80.27021, "b": 344.26993, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "Encoding", "bbox": {"l": 60.598457, "t": 343.38605, "r": 78.854958, "b": 348.69604, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "Positional ", "bbox": {"l": 134.82877, "t": 293.37762, "r": 154.66476, "b": 298.68762, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "Encoding", "bbox": {"l": 134.99303, "t": 297.80370999999997, "r": 153.24953, "b": 303.11371, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "Add & Normalisation", "bbox": {"l": 150.55193, "t": 345.35861, "r": 197.14943, "b": 351.02063, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Add", "bbox": {"l": 150.55193, "t": 394.4234, "r": 156.68318, "b": 400.08542, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "& Normalisation", "bbox": {"l": 188.56567, "t": 394.4234, "r": 197.14943, "b": 400.08542, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "Multi-Head Attention", "bbox": {"l": 150.18539, "t": 375.66843, "r": 197.31964, "b": 381.33044, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "Add", "bbox": {"l": 150.55193, "t": 440.24847000000005, "r": 156.68318, "b": 445.91049, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "& Normalisation", "bbox": {"l": 188.56567, "t": 440.24847000000005, "r": 197.14943, "b": 445.91049, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Feed Forward Network", "bbox": {"l": 147.86377, "t": 422.09335, "r": 199.76227, "b": 427.75537, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Linear", "bbox": {"l": 241.56567000000004, "t": 314.26285000000007, "r": 255.72542, "b": 319.92487, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "Linear", "bbox": {"l": 241.91730000000004, "t": 361.36493, "r": 256.07706, "b": 367.02695, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "Attention", "bbox": {"l": 228.054, "t": 336.61929000000003, "r": 248.72363000000004, "b": 342.28131, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "Network", "bbox": {"l": 246.2919, "t": 336.61929000000003, "r": 269.39325, "b": 342.28131, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "MLP", "bbox": {"l": 228.44568000000004, "t": 405.14682, "r": 238.73892, "b": 410.80884, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Linear ", "bbox": {"l": 256.29767, "t": 405.2032500000001, "r": 271.77792, "b": 410.86526, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "Sigmoid", "bbox": {"l": 239.54543, "t": 382.21344, "r": 258.08942, "b": 387.87546, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "Transformer Encoder Network", "bbox": {"l": 54.14704100000001, "t": 384.87183, "r": 59.51152, "b": 449.78326, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "x2", "bbox": {"l": 54.235424, "t": 373.81232, "r": 59.30449699999999, "b": 378.45421999999996, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "Encoded Output", "bbox": {"l": 85.295891, "t": 484.53189, "r": 122.16431, "b": 490.36688, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "Encoded Output", "bbox": {"l": 229.66599, "t": 279.54607999999996, "r": 265.3194, "b": 285.45572000000004, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "Predicted Tags", "bbox": {"l": 157.17369, "t": 500.3031, "r": 190.41711, "b": 506.12943, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "Bounding Boxes & ", "bbox": {"l": 227.81598999999997, "t": 438.05542, "r": 270.78442, "b": 443.89206, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "Classification", "bbox": {"l": 233.70262, "t": 444.06183, "r": 263.51105, "b": 449.8904999999999, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "Transformer ", "bbox": {"l": 184.74655, "t": 293.39502, "r": 212.16055, "b": 298.75903, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "Decoder Network", "bbox": {"l": 178.91229, "t": 299.14502, "r": 216.74378999999996, "b": 304.50903, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "x4", "bbox": {"l": 194.24574, "t": 282.7822, "r": 198.89099, "b": 287.84817999999996, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "CELL BBOX DECODER", "bbox": {"l": 221.45587, "t": 271.86914, "r": 276.47089, "b": 277.82916, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "Masked Multi-Head ", "bbox": {"l": 151.65219, "t": 323.44241, "r": 197.29019, "b": 329.10443, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "Attention", "bbox": {"l": 163.43277, "t": 329.44241, "r": 184.19028, "b": 335.10443, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "Figure 4: Given an input image of a table, the", "bbox": {"l": 50.112, "t": 527.90237, "r": 229.78752, "b": 536.80893, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "Encoder", "bbox": {"l": 231.787, "t": 527.7828099999999, "r": 267.76196, "b": 536.7392, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "pro-", "bbox": {"l": 269.76401, "t": 527.90237, "r": 286.36169, "b": 536.80893, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "duces fixed-length features that represent the input image.", "bbox": {"l": 50.112015, "t": 539.85738, "r": 286.36508, "b": 548.76393, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "The features are then passed to both the", "bbox": {"l": 50.112015, "t": 551.81337, "r": 205.84735, "b": 560.71992, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "Structure Decoder", "bbox": {"l": 208.01802, "t": 551.69382, "r": 286.36392, "b": 560.6501900000001, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "and", "bbox": {"l": 50.112015, "t": 563.76837, "r": 64.498009, "b": 572.67493, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "Cell BBox Decoder", "bbox": {"l": 68.165016, "t": 563.64882, "r": 151.31288, "b": 572.60519, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": ".", "bbox": {"l": 151.31302, "t": 563.76837, "r": 153.80367, "b": 572.67493, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "During training, the", "bbox": {"l": 160.41884, "t": 563.76837, "r": 241.93283000000002, "b": 572.67493, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "Structure", "bbox": {"l": 245.59502, "t": 563.64882, "r": 286.362, "b": 572.60519, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "Decoder", "bbox": {"l": 50.112015, "t": 575.60382, "r": 85.519089, "b": 584.5602, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "receives \u2018tokenized tags\u2019 of the HTML code that", "bbox": {"l": 88.623016, "t": 575.7233699999999, "r": 286.36072, "b": 584.6299300000001, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "represent the table structure. Afterwards, a transformer en-", "bbox": {"l": 50.112015, "t": 587.6783800000001, "r": 286.36511, "b": 596.58493, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "coder and decoder architecture is employed to produce fea-", "bbox": {"l": 50.112015, "t": 599.63338, "r": 286.36508, "b": 608.53993, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "tures that are received by a linear layer, and the", "bbox": {"l": 50.112015, "t": 611.58838, "r": 240.43756000000002, "b": 620.4949300000001, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "Cell BBox", "bbox": {"l": 243.19801, "t": 611.46883, "r": 286.36597, "b": 620.4252, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "Decoder. The linear layer is applied to the features to", "bbox": {"l": 50.112015, "t": 623.42482, "r": 286.36511, "b": 632.3812, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "predict the tags. Simultaneously, the Cell BBox Decoder", "bbox": {"l": 50.112015, "t": 635.37982, "r": 286.36508, "b": 644.3362, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "selects features referring to the data cells (\u2018", "bbox": {"l": 50.112015, "t": 647.45438, "r": 220.58205, "b": 656.36093, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "<", "bbox": {"l": 220.57802000000004, "t": 647.29497, "r": 228.32693, "b": 656.14175, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "td", "bbox": {"l": 228.32700999999997, "t": 647.45438, "r": 236.07791000000003, "b": 656.36093, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": ">", "bbox": {"l": 236.07802000000004, "t": 647.29497, "r": 243.82693, "b": 656.14175, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "\u2019, \u2018", "bbox": {"l": 243.82602, "t": 647.45438, "r": 255.29298000000003, "b": 656.36093, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "<", "bbox": {"l": 255.29102000000003, "t": 647.29497, "r": 263.03992, "b": 656.14175, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "\u2019) and", "bbox": {"l": 263.04001, "t": 647.45438, "r": 286.36246, "b": 656.36093, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "passes them through an attention network, an MLP, and a", "bbox": {"l": 50.112015, "t": 659.40938, "r": 286.36511, "b": 668.31594, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "linear layer to predict the bounding boxes.", "bbox": {"l": 50.112015, "t": 671.36438, "r": 218.46996, "b": 680.27094, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "forming classification, and adding an adaptive pooling", "bbox": {"l": 308.862, "t": 249.53441999999995, "r": 523.05786, "b": 258.44097999999997, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "layer", "bbox": {"l": 525.19983, "t": 249.53441999999995, "r": 545.11505, "b": 258.44097999999997, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "of size 28*28. ResNet by default downsamples the", "bbox": {"l": 308.862, "t": 261.49042, "r": 517.55847, "b": 270.39697, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "image", "bbox": {"l": 520.76642, "t": 261.49042, "r": 545.11499, "b": 270.39697, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "resolution by 32 and then the encoded image is provided", "bbox": {"l": 308.862, "t": 273.44537, "r": 534.80377, "b": 282.35196, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "to", "bbox": {"l": 537.36414, "t": 273.44537, "r": 545.11505, "b": 282.35196, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "both the", "bbox": {"l": 308.862, "t": 285.40039, "r": 341.24045, "b": 294.3069499999999, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "Structure Decoder", "bbox": {"l": 343.73099, "t": 285.49005, "r": 417.23508, "b": 294.07782000000003, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": ", and", "bbox": {"l": 417.23398, "t": 285.40039, "r": 436.60129, "b": 294.3069499999999, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "Cell BBox Decoder", "bbox": {"l": 439.09198, "t": 285.49005, "r": 516.56116, "b": 294.07782000000003, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": ".", "bbox": {"l": 516.56097, "t": 285.40039, "r": 519.05164, "b": 294.3069499999999, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "Structure Decoder.", "bbox": {"l": 320.81696, "t": 297.33981, "r": 400.86649, "b": 306.2962, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "The transformer architecture of", "bbox": {"l": 403.91394, "t": 297.45938, "r": 528.33685, "b": 306.36594, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "this", "bbox": {"l": 530.7179, "t": 297.45938, "r": 545.11383, "b": 306.36594, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "component is based on the work proposed in [31].", "bbox": {"l": 308.86194, "t": 309.41437, "r": 517.5285, "b": 318.32092, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "After", "bbox": {"l": 524.09387, "t": 309.41437, "r": 545.11493, "b": 318.32092, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "extensive experimentation, the", "bbox": {"l": 308.86194, "t": 321.36934999999994, "r": 432.35833999999994, "b": 330.27591, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "Structure Decoder", "bbox": {"l": 435.81995000000006, "t": 321.45901, "r": 510.29041, "b": 330.04678, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "is", "bbox": {"l": 513.97797, "t": 321.36934999999994, "r": 520.62305, "b": 330.27591, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "mod-", "bbox": {"l": 524.08008, "t": 321.36934999999994, "r": 545.11115, "b": 330.27591, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "eled as a transformer encoder with two encoder layers", "bbox": {"l": 308.86197, "t": 333.32434, "r": 527.76013, "b": 342.2309, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "and", "bbox": {"l": 530.729, "t": 333.32434, "r": 545.11499, "b": 342.2309, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "a transformer decoder made from a stack of 4 decoder", "bbox": {"l": 308.86197, "t": 345.27933, "r": 526.85352, "b": 354.18588, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "lay-", "bbox": {"l": 529.62311, "t": 345.27933, "r": 545.11493, "b": 354.18588, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "ers that comprise mainly of multi-head attention and", "bbox": {"l": 308.86197, "t": 357.23532, "r": 524.51245, "b": 366.14188, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "feed", "bbox": {"l": 527.96948, "t": 357.23532, "r": 545.11511, "b": 366.14188, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "forward layers.", "bbox": {"l": 308.86197, "t": 369.19031000000007, "r": 370.39096, "b": 378.09685999999994, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "This configuration uses fewer layers", "bbox": {"l": 377.44449, "t": 369.19031000000007, "r": 526.91339, "b": 378.09685999999994, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "and", "bbox": {"l": 530.72906, "t": 369.19031000000007, "r": 545.11505, "b": 378.09685999999994, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "heads in comparison to networks applied to other", "bbox": {"l": 308.86197, "t": 381.14529000000005, "r": 505.46395999999993, "b": 390.05185, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "problems", "bbox": {"l": 508.03430000000003, "t": 381.14529000000005, "r": 545.11511, "b": 390.05185, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "(e.g. \u201cScene Understanding\u201d, \u201cImage Captioning\u201d),", "bbox": {"l": 308.86197, "t": 393.10028, "r": 517.68799, "b": 402.00684, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "some-", "bbox": {"l": 520.76642, "t": 393.10028, "r": 545.11499, "b": 402.00684, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "thing which we relate to the simplicity of table images.", "bbox": {"l": 308.86197, "t": 405.05526999999995, "r": 528.01935, "b": 413.96182, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "The transformer encoder receives an encoded", "bbox": {"l": 320.81696, "t": 417.11426, "r": 515.49609, "b": 426.02081, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "image", "bbox": {"l": 520.7663, "t": 417.11426, "r": 545.11487, "b": 426.02081, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "from the", "bbox": {"l": 308.86197, "t": 429.0692399999999, "r": 343.72107, "b": 437.9758, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "CNN Backbone Network", "bbox": {"l": 347.03796, "t": 429.15891, "r": 446.45471000000003, "b": 437.74667, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "and refines it", "bbox": {"l": 449.93996999999996, "t": 429.0692399999999, "r": 503.06055000000003, "b": 437.9758, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "through", "bbox": {"l": 506.37808, "t": 429.0692399999999, "r": 537.3717, "b": 437.9758, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "a", "bbox": {"l": 540.68927, "t": 429.0692399999999, "r": 545.11267, "b": 437.9758, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "multi-head dot-product attention layer, followed by a", "bbox": {"l": 308.86197, "t": 441.02423, "r": 522.78894, "b": 449.93079, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "Feed", "bbox": {"l": 525.7478, "t": 441.02423, "r": 545.11511, "b": 449.93079, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "Forward Network.", "bbox": {"l": 308.86197, "t": 452.97922, "r": 384.14929, "b": 461.88577, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "During training, the transformer", "bbox": {"l": 393.37466, "t": 452.97922, "r": 527.84985, "b": 461.88577, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "de-", "bbox": {"l": 532.39282, "t": 452.97922, "r": 545.11505, "b": 461.88577, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "coder receives as input the output feature produced by", "bbox": {"l": 308.86197, "t": 464.93521, "r": 529.7627, "b": 473.84177, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "the", "bbox": {"l": 532.94073, "t": 464.93521, "r": 545.11505, "b": 473.84177, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "transformer encoder, and the tokenized input of the", "bbox": {"l": 308.86197, "t": 476.8902, "r": 514.17126, "b": 485.79675, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "HTML", "bbox": {"l": 516.89105, "t": 476.8902, "r": 545.11511, "b": 485.79675, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": "ground-truth tags. Using a stack of multi-head attention", "bbox": {"l": 308.86197, "t": 488.84518, "r": 527.63068, "b": 497.75174, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "lay-", "bbox": {"l": 529.62317, "t": 488.84518, "r": 545.11499, "b": 497.75174, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "ers, different aspects of the tag sequence could be", "bbox": {"l": 308.86197, "t": 500.80017, "r": 508.3630999999999, "b": 509.70673, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": "inferred.", "bbox": {"l": 511.09286000000003, "t": 500.80017, "r": 545.11511, "b": 509.70673, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "This is achieved by each attention head on a layer operating", "bbox": {"l": 308.86197, "t": 512.7551599999999, "r": 545.11499, "b": 521.6617100000001, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "in a different subspace, and then combining altogether their", "bbox": {"l": 308.86197, "t": 524.71115, "r": 545.11511, "b": 533.61771, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "attention score.", "bbox": {"l": 308.86197, "t": 536.66615, "r": 369.73349, "b": 545.57271, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": "Cell BBox Decoder.", "bbox": {"l": 320.81696, "t": 548.6046, "r": 404.76184, "b": 557.56097, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "Our architecture allows to simul-", "bbox": {"l": 410.34094, "t": 548.72415, "r": 545.11505, "b": 557.63071, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "taneously predict HTML tags and bounding boxes for each", "bbox": {"l": 308.86194, "t": 560.68015, "r": 545.11493, "b": 569.5867000000001, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "table cell without the need of a separate object detector end", "bbox": {"l": 308.86194, "t": 572.6351500000001, "r": 545.11511, "b": 581.5417, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "to end. This approach is inspired by DETR [1] which em-", "bbox": {"l": 308.86194, "t": 584.59015, "r": 545.11493, "b": 593.4967, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "ploys a Transformer Encoder, and Decoder that looks for", "bbox": {"l": 308.86194, "t": 596.54515, "r": 545.11499, "b": 605.45171, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "a specific number of object queries (potential object detec-", "bbox": {"l": 308.86194, "t": 608.50015, "r": 545.11505, "b": 617.40671, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "tions). As our model utilizes a transformer architecture, the", "bbox": {"l": 308.86194, "t": 620.45515, "r": 545.11505, "b": 629.36171, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "hidden state of the", "bbox": {"l": 308.86194, "t": 632.41115, "r": 381.67859, "b": 641.3177000000001, "coord_origin": "TOPLEFT"}}, {"id": 201, "text": "<", "bbox": {"l": 383.99695, "t": 632.25174, "r": 391.74585, "b": 641.09853, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": "td", "bbox": {"l": 391.74594, "t": 632.41115, "r": 399.49686, "b": 641.3177000000001, "coord_origin": "TOPLEFT"}}, {"id": 203, "text": ">", "bbox": {"l": 399.49695, "t": 632.25174, "r": 407.24585, "b": 641.09853, "coord_origin": "TOPLEFT"}}, {"id": 204, "text": "\u2019 and \u2018", "bbox": {"l": 407.24594, "t": 632.41115, "r": 432.90958, "b": 641.3177000000001, "coord_origin": "TOPLEFT"}}, {"id": 205, "text": "<", "bbox": {"l": 432.90792999999996, "t": 632.25174, "r": 440.65683000000007, "b": 641.09853, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": "\u2019 HTML structure tags be-", "bbox": {"l": 440.65691999999996, "t": 632.41115, "r": 545.11475, "b": 641.3177000000001, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": "come the object query.", "bbox": {"l": 308.86194, "t": 644.3661500000001, "r": 398.96371, "b": 653.27271, "coord_origin": "TOPLEFT"}}, {"id": 208, "text": "The encoding generated by the", "bbox": {"l": 320.81693, "t": 656.42516, "r": 444.34316999999993, "b": 665.33172, "coord_origin": "TOPLEFT"}}, {"id": 209, "text": "CNN Backbone Network", "bbox": {"l": 447.00591999999995, "t": 656.51482, "r": 545.1076, "b": 665.10258, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": "along with the features acquired for every data cell from the", "bbox": {"l": 308.86194, "t": 668.38016, "r": 545.11505, "b": 677.2867200000001, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "Transformer Decoder are then passed to the attention net-", "bbox": {"l": 308.86194, "t": 680.33516, "r": 545.11505, "b": 689.24172, "coord_origin": "TOPLEFT"}}, {"id": 212, "text": "work. The attention network takes both inputs and learns to", "bbox": {"l": 308.86194, "t": 692.290161, "r": 545.11505, "b": 701.196724, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "provide an attention weighted encoding. This weighted at-", "bbox": {"l": 308.86194, "t": 704.245163, "r": 545.11505, "b": 713.151726, "coord_origin": "TOPLEFT"}}, {"id": 214, "text": "5", "bbox": {"l": 295.12094, "t": 734.13316, "r": 300.10223, "b": 743.039722, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 7, "label": "picture", "bbox": {"l": 74.30525970458984, "t": 77.91120147705078, "r": 519.9801025390625, "b": 183.70150756835938, "coord_origin": "TOPLEFT"}, "confidence": 0.9296807646751404, "cells": [{"id": 0, "text": "1.", "bbox": {"l": 81.688072, "t": 122.43970000000002, "r": 84.927567, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Item", "bbox": {"l": 86.54731, "t": 122.43970000000002, "r": 93.026291, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Amount", "bbox": {"l": 102.50498, "t": 115.25214000000005, "r": 115.3461, "b": 118.44135000000006, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Names", "bbox": {"l": 82.140205, "t": 115.21489999999994, "r": 93.291527, "b": 118.40410999999995, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "1000", "bbox": {"l": 96.748268, "t": 122.43970000000002, "r": 104.3119, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "500", "bbox": {"l": 96.748268, "t": 127.74370999999985, "r": 102.42083, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "3500", "bbox": {"l": 96.748268, "t": 133.45569, "r": 104.3119, "b": 136.6449, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "150", "bbox": {"l": 96.748268, "t": 139.16772000000003, "r": 102.42083, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "unit", "bbox": {"l": 110.66107, "t": 122.43970000000002, "r": 116.14391, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "unit", "bbox": {"l": 110.66107, "t": 127.74370999999985, "r": 116.14391, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "unit", "bbox": {"l": 110.66107, "t": 133.45569, "r": 116.14391, "b": 136.6449, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "unit", "bbox": {"l": 110.66107, "t": 139.16772000000003, "r": 116.14391, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "2.", "bbox": {"l": 81.688072, "t": 127.74370999999985, "r": 84.927567, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Item", "bbox": {"l": 86.54731, "t": 127.74370999999985, "r": 93.026291, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "3.", "bbox": {"l": 81.688072, "t": 133.45569, "r": 84.927567, "b": 136.6449, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Item", "bbox": {"l": 86.54731, "t": 133.45569, "r": 93.026291, "b": 136.6449, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "4.", "bbox": {"l": 81.688072, "t": 139.16772000000003, "r": 84.927567, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "Item", "bbox": {"l": 86.54731, "t": 139.16772000000003, "r": 93.026291, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Extracted", "bbox": {"l": 88.084389, "t": 90.49738000000002, "r": 113.93649, "b": 96.23798, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Table Images", "bbox": {"l": 82.81002, "t": 97.63738999999998, "r": 119.21240000000002, "b": 103.37798999999995, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Standardized", "bbox": {"l": 143.94247, "t": 100.60235999999998, "r": 180.01131, "b": 106.34295999999995, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Images", "bbox": {"l": 151.94064, "t": 107.74237000000005, "r": 172.0118, "b": 113.48297000000014, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "BBox", "bbox": {"l": 251.76939000000002, "t": 80.93096999999989, "r": 266.39557, "b": 86.67156999999997, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Decoder", "bbox": {"l": 247.51601, "t": 86.03101000000004, "r": 270.65021, "b": 91.77161000000001, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "BBoxes", "bbox": {"l": 331.03699, "t": 78.55980999999997, "r": 352.12589, "b": 84.30042000000003, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "BBoxes can be", "bbox": {"l": 390.56421, "t": 96.03223000000003, "r": 431.7261, "b": 101.77282999999989, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "traced back to the", "bbox": {"l": 386.82422, "t": 102.15228000000013, "r": 435.46966999999995, "b": 107.89287999999999, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "original image to", "bbox": {"l": 388.69589, "t": 108.27228000000002, "r": 433.6032400000001, "b": 114.01288000000011, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "extract content", "bbox": {"l": 391.07761, "t": 114.39227000000005, "r": 431.22542999999996, "b": 120.13286999999991, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Structure Tags sequence", "bbox": {"l": 431.22650000000004, "t": 151.68511999999998, "r": 498.82068, "b": 157.42571999999996, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "provide full description of", "bbox": {"l": 431.1738, "t": 157.80517999999995, "r": 498.87753000000004, "b": 163.54578000000004, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "the table structure", "bbox": {"l": 440.5289, "t": 163.92516999999998, "r": 489.51827999999995, "b": 169.66576999999995, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Structure Tags", "bbox": {"l": 328.37479, "t": 178.25385000000006, "r": 367.72333, "b": 183.99445000000003, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "BBoxes in sync", "bbox": {"l": 331.84451, "t": 123.90886999999998, "r": 373.67963, "b": 129.64948000000015, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "with tag sequence", "bbox": {"l": 331.84451, "t": 129.00885000000017, "r": 381.17786, "b": 134.74945000000002, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "Encoder", "bbox": {"l": 196.62633, "t": 88.11621000000002, "r": 219.42332, "b": 93.85681, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Structure", "bbox": {"l": 246.66771, "t": 129.4946900000001, "r": 271.49899, "b": 135.23528999999996, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "Decoder", "bbox": {"l": 247.51601, "t": 134.59473000000003, "r": 270.65021, "b": 140.33533, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "[x1, y2, x2, y2]", "bbox": {"l": 330.63071, "t": 89.01923, "r": 365.55347, "b": 94.75982999999997, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "[x1', y2', x2', y2']", "bbox": {"l": 330.63071, "t": 97.17926, "r": 370.22717, "b": 102.91985999999997, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "[x1'', y2'', x2'', y2'']", "bbox": {"l": 330.63071, "t": 105.33922999999993, "r": 374.51157, "b": 111.07983000000002, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "...", "bbox": {"l": 330.63071, "t": 113.49926999999991, "r": 335.73233, "b": 119.23987, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "<TR>", "bbox": {"l": 322.30579, "t": 141.79236000000003, "r": 335.05988, "b": 146.57617000000005, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "<TD>", "bbox": {"l": 322.30579, "t": 148.93231000000003, "r": 335.05988, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "1", "bbox": {"l": 337.54971, "t": 148.55579, "r": 340.95242, "b": 154.29638999999997, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "</TD><TD colspan=\"2\">", "bbox": {"l": 343.56262, "t": 148.93231000000003, "r": 398.91446, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "</TD>", "bbox": {"l": 407.41718, "t": 148.93231000000003, "r": 421.58801, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "</TR><TR>", "bbox": {"l": 322.30579, "t": 156.07232999999997, "r": 349.23022, "b": 160.85613999999998, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "<TD>", "bbox": {"l": 322.30579, "t": 163.21234000000004, "r": 335.05988, "b": 167.99614999999994, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "</TD><TD>...", "bbox": {"l": 343.56155, "t": 163.21234000000004, "r": 374.73685, "b": 167.99614999999994, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "...", "bbox": {"l": 322.30579, "t": 170.35235999999998, "r": 326.55716, "b": 175.13617, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "1", "bbox": {"l": 323.51111, "t": 89.66967999999997, "r": 326.91382, "b": 95.41027999999994, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "2", "bbox": {"l": 323.71509, "t": 97.78887999999995, "r": 327.1178, "b": 103.52948000000004, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "3", "bbox": {"l": 323.71509, "t": 105.98969, "r": 327.1178, "b": 111.73029000000008, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "2", "bbox": {"l": 401.4816, "t": 148.54625999999996, "r": 404.88431, "b": 154.28687000000002, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "3", "bbox": {"l": 337.6976, "t": 162.68451000000005, "r": 341.10031, "b": 168.42511000000002, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "3", "bbox": {"l": 454.46378, "t": 104.54584, "r": 457.86648999999994, "b": 110.28644000000008, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "2", "bbox": {"l": 493.32580999999993, "t": 91.09546, "r": 496.72852, "b": 96.83605999999997, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "1", "bbox": {"l": 454.08298, "t": 90.56879000000015, "r": 457.48569000000003, "b": 96.30939000000001, "coord_origin": "TOPLEFT"}}], "children": [{"id": 10, "label": "text", "bbox": {"l": 81.688072, "t": 122.43970000000002, "r": 84.927567, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 0, "text": "1.", "bbox": {"l": 81.688072, "t": 122.43970000000002, "r": 84.927567, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 86.54731, "t": 122.43970000000002, "r": 93.026291, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 1, "text": "Item", "bbox": {"l": 86.54731, "t": 122.43970000000002, "r": 93.026291, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 102.50498, "t": 115.25214000000005, "r": 115.3461, "b": 118.44135000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 2, "text": "Amount", "bbox": {"l": 102.50498, "t": 115.25214000000005, "r": 115.3461, "b": 118.44135000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 82.140205, "t": 115.21489999999994, "r": 93.291527, "b": 118.40410999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 3, "text": "Names", "bbox": {"l": 82.140205, "t": 115.21489999999994, "r": 93.291527, "b": 118.40410999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 96.748268, "t": 122.43970000000002, "r": 104.3119, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 4, "text": "1000", "bbox": {"l": 96.748268, "t": 122.43970000000002, "r": 104.3119, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 96.748268, "t": 127.74370999999985, "r": 102.42083, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 5, "text": "500", "bbox": {"l": 96.748268, "t": 127.74370999999985, "r": 102.42083, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 96.748268, "t": 133.45569, "r": 104.3119, "b": 136.6449, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": "3500", "bbox": {"l": 96.748268, "t": 133.45569, "r": 104.3119, "b": 136.6449, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 96.748268, "t": 139.16772000000003, "r": 102.42083, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "150", "bbox": {"l": 96.748268, "t": 139.16772000000003, "r": 102.42083, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 110.66107, "t": 122.43970000000002, "r": 116.14391, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "unit", "bbox": {"l": 110.66107, "t": 122.43970000000002, "r": 116.14391, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 110.66107, "t": 127.74370999999985, "r": 116.14391, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "unit", "bbox": {"l": 110.66107, "t": 127.74370999999985, "r": 116.14391, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 110.66107, "t": 133.45569, "r": 116.14391, "b": 136.6449, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "unit", "bbox": {"l": 110.66107, "t": 133.45569, "r": 116.14391, "b": 136.6449, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 110.66107, "t": 139.16772000000003, "r": 116.14391, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "unit", "bbox": {"l": 110.66107, "t": 139.16772000000003, "r": 116.14391, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 81.688072, "t": 127.74370999999985, "r": 84.927567, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "2.", "bbox": {"l": 81.688072, "t": 127.74370999999985, "r": 84.927567, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 86.54731, "t": 127.74370999999985, "r": 93.026291, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "Item", "bbox": {"l": 86.54731, "t": 127.74370999999985, "r": 93.026291, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 81.688072, "t": 133.45569, "r": 84.927567, "b": 136.6449, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "3.", "bbox": {"l": 81.688072, "t": 133.45569, "r": 84.927567, "b": 136.6449, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 86.54731, "t": 133.45569, "r": 93.026291, "b": 136.6449, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "Item", "bbox": {"l": 86.54731, "t": 133.45569, "r": 93.026291, "b": 136.6449, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 81.688072, "t": 139.16772000000003, "r": 84.927567, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "4.", "bbox": {"l": 81.688072, "t": 139.16772000000003, "r": 84.927567, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 86.54731, "t": 139.16772000000003, "r": 93.026291, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "Item", "bbox": {"l": 86.54731, "t": 139.16772000000003, "r": 93.026291, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 88.084389, "t": 90.49738000000002, "r": 113.93649, "b": 96.23798, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "Extracted", "bbox": {"l": 88.084389, "t": 90.49738000000002, "r": 113.93649, "b": 96.23798, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 82.81002, "t": 97.63738999999998, "r": 119.21240000000002, "b": 103.37798999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "Table Images", "bbox": {"l": 82.81002, "t": 97.63738999999998, "r": 119.21240000000002, "b": 103.37798999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 143.94247, "t": 100.60235999999998, "r": 180.01131, "b": 106.34295999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "Standardized", "bbox": {"l": 143.94247, "t": 100.60235999999998, "r": 180.01131, "b": 106.34295999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 151.94064, "t": 107.74237000000005, "r": 172.0118, "b": 113.48297000000014, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "Images", "bbox": {"l": 151.94064, "t": 107.74237000000005, "r": 172.0118, "b": 113.48297000000014, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 251.76939000000002, "t": 80.93096999999989, "r": 266.39557, "b": 86.67156999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "BBox", "bbox": {"l": 251.76939000000002, "t": 80.93096999999989, "r": 266.39557, "b": 86.67156999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 247.51601, "t": 86.03101000000004, "r": 270.65021, "b": 91.77161000000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "Decoder", "bbox": {"l": 247.51601, "t": 86.03101000000004, "r": 270.65021, "b": 91.77161000000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 331.03699, "t": 78.55980999999997, "r": 352.12589, "b": 84.30042000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "BBoxes", "bbox": {"l": 331.03699, "t": 78.55980999999997, "r": 352.12589, "b": 84.30042000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 390.56421, "t": 96.03223000000003, "r": 431.7261, "b": 101.77282999999989, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "BBoxes can be", "bbox": {"l": 390.56421, "t": 96.03223000000003, "r": 431.7261, "b": 101.77282999999989, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 386.82422, "t": 102.15228000000013, "r": 435.46966999999995, "b": 107.89287999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "traced back to the", "bbox": {"l": 386.82422, "t": 102.15228000000013, "r": 435.46966999999995, "b": 107.89287999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 388.69589, "t": 108.27228000000002, "r": 433.6032400000001, "b": 114.01288000000011, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "original image to", "bbox": {"l": 388.69589, "t": 108.27228000000002, "r": 433.6032400000001, "b": 114.01288000000011, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 391.07761, "t": 114.39227000000005, "r": 431.22542999999996, "b": 120.13286999999991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "extract content", "bbox": {"l": 391.07761, "t": 114.39227000000005, "r": 431.22542999999996, "b": 120.13286999999991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 431.22650000000004, "t": 151.68511999999998, "r": 498.82068, "b": 157.42571999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "Structure Tags sequence", "bbox": {"l": 431.22650000000004, "t": 151.68511999999998, "r": 498.82068, "b": 157.42571999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 431.1738, "t": 157.80517999999995, "r": 498.87753000000004, "b": 163.54578000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "provide full description of", "bbox": {"l": 431.1738, "t": 157.80517999999995, "r": 498.87753000000004, "b": 163.54578000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 440.5289, "t": 163.92516999999998, "r": 489.51827999999995, "b": 169.66576999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "the table structure", "bbox": {"l": 440.5289, "t": 163.92516999999998, "r": 489.51827999999995, "b": 169.66576999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 328.37479, "t": 178.25385000000006, "r": 367.72333, "b": 183.99445000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "Structure Tags", "bbox": {"l": 328.37479, "t": 178.25385000000006, "r": 367.72333, "b": 183.99445000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 331.84451, "t": 123.90886999999998, "r": 373.67963, "b": 129.64948000000015, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "BBoxes in sync", "bbox": {"l": 331.84451, "t": 123.90886999999998, "r": 373.67963, "b": 129.64948000000015, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 331.84451, "t": 129.00885000000017, "r": 381.17786, "b": 134.74945000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "with tag sequence", "bbox": {"l": 331.84451, "t": 129.00885000000017, "r": 381.17786, "b": 134.74945000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 196.62633, "t": 88.11621000000002, "r": 219.42332, "b": 93.85681, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "Encoder", "bbox": {"l": 196.62633, "t": 88.11621000000002, "r": 219.42332, "b": 93.85681, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 246.66771, "t": 129.4946900000001, "r": 271.49899, "b": 135.23528999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "Structure", "bbox": {"l": 246.66771, "t": 129.4946900000001, "r": 271.49899, "b": 135.23528999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 247.51601, "t": 134.59473000000003, "r": 270.65021, "b": 140.33533, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "Decoder", "bbox": {"l": 247.51601, "t": 134.59473000000003, "r": 270.65021, "b": 140.33533, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 330.63071, "t": 89.01923, "r": 365.55347, "b": 94.75982999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "[x1, y2, x2, y2]", "bbox": {"l": 330.63071, "t": 89.01923, "r": 365.55347, "b": 94.75982999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 330.63071, "t": 97.17926, "r": 370.22717, "b": 102.91985999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "[x1', y2', x2', y2']", "bbox": {"l": 330.63071, "t": 97.17926, "r": 370.22717, "b": 102.91985999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 330.63071, "t": 105.33922999999993, "r": 374.51157, "b": 111.07983000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "[x1'', y2'', x2'', y2'']", "bbox": {"l": 330.63071, "t": 105.33922999999993, "r": 374.51157, "b": 111.07983000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 330.63071, "t": 113.49926999999991, "r": 335.73233, "b": 119.23987, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "...", "bbox": {"l": 330.63071, "t": 113.49926999999991, "r": 335.73233, "b": 119.23987, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 322.30579, "t": 141.79236000000003, "r": 335.05988, "b": 146.57617000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "<TR>", "bbox": {"l": 322.30579, "t": 141.79236000000003, "r": 335.05988, "b": 146.57617000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 322.30579, "t": 148.93231000000003, "r": 335.05988, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "<TD>", "bbox": {"l": 322.30579, "t": 148.93231000000003, "r": 335.05988, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 337.54971, "t": 148.55579, "r": 340.95242, "b": 154.29638999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "1", "bbox": {"l": 337.54971, "t": 148.55579, "r": 340.95242, "b": 154.29638999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 343.56262, "t": 148.93231000000003, "r": 398.91446, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "</TD><TD colspan=\"2\">", "bbox": {"l": 343.56262, "t": 148.93231000000003, "r": 398.91446, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 407.41718, "t": 148.93231000000003, "r": 421.58801, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "</TD>", "bbox": {"l": 407.41718, "t": 148.93231000000003, "r": 421.58801, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 322.30579, "t": 156.07232999999997, "r": 349.23022, "b": 160.85613999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "</TR><TR>", "bbox": {"l": 322.30579, "t": 156.07232999999997, "r": 349.23022, "b": 160.85613999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 322.30579, "t": 163.21234000000004, "r": 335.05988, "b": 167.99614999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "<TD>", "bbox": {"l": 322.30579, "t": 163.21234000000004, "r": 335.05988, "b": 167.99614999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 343.56155, "t": 163.21234000000004, "r": 374.73685, "b": 167.99614999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "</TD><TD>...", "bbox": {"l": 343.56155, "t": 163.21234000000004, "r": 374.73685, "b": 167.99614999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 322.30579, "t": 170.35235999999998, "r": 326.55716, "b": 175.13617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "...", "bbox": {"l": 322.30579, "t": 170.35235999999998, "r": 326.55716, "b": 175.13617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 323.51111, "t": 89.66967999999997, "r": 326.91382, "b": 95.41027999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "1", "bbox": {"l": 323.51111, "t": 89.66967999999997, "r": 326.91382, "b": 95.41027999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 323.71509, "t": 97.78887999999995, "r": 327.1178, "b": 103.52948000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "2", "bbox": {"l": 323.71509, "t": 97.78887999999995, "r": 327.1178, "b": 103.52948000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 323.71509, "t": 105.98969, "r": 327.1178, "b": 111.73029000000008, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "3", "bbox": {"l": 323.71509, "t": 105.98969, "r": 327.1178, "b": 111.73029000000008, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 401.4816, "t": 148.54625999999996, "r": 404.88431, "b": 154.28687000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "2", "bbox": {"l": 401.4816, "t": 148.54625999999996, "r": 404.88431, "b": 154.28687000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 337.6976, "t": 162.68451000000005, "r": 341.10031, "b": 168.42511000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "3", "bbox": {"l": 337.6976, "t": 162.68451000000005, "r": 341.10031, "b": 168.42511000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 454.46378, "t": 104.54584, "r": 457.86648999999994, "b": 110.28644000000008, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "3", "bbox": {"l": 454.46378, "t": 104.54584, "r": 457.86648999999994, "b": 110.28644000000008, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 493.32580999999993, "t": 91.09546, "r": 496.72852, "b": 96.83605999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "2", "bbox": {"l": 493.32580999999993, "t": 91.09546, "r": 496.72852, "b": 96.83605999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 454.08298, "t": 90.56879000000015, "r": 457.48569000000003, "b": 96.30939000000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "1", "bbox": {"l": 454.08298, "t": 90.56879000000015, "r": 457.48569000000003, "b": 96.30939000000001, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 6, "label": "caption", "bbox": {"l": 50.111992, "t": 203.98577999999998, "r": 545.10846, "b": 224.96691999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9677652716636658, "cells": [{"id": 59, "text": "Figure 3:", "bbox": {"l": 50.112, "t": 204.10535000000004, "r": 86.883949, "b": 213.01189999999997, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "TableFormer", "bbox": {"l": 94.020996, "t": 203.98577999999998, "r": 149.85141, "b": 212.94214, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "takes in an image of the PDF and creates bounding box and HTML structure predictions that are", "bbox": {"l": 152.86099, "t": 204.10535000000004, "r": 545.10846, "b": 213.01189999999997, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "synchronized. The bounding boxes grabs the content from the PDF and inserts it in the structure.", "bbox": {"l": 50.111992, "t": 216.06035999999995, "r": 436.0134, "b": 224.96691999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "picture", "bbox": {"l": 53.03328323364258, "t": 257.66534423828125, "r": 285.3731689453125, "b": 507.6688537597656, "coord_origin": "TOPLEFT"}, "confidence": 0.9724942445755005, "cells": [{"id": 63, "text": "Input Image", "bbox": {"l": 74.253464, "t": 258.21472000000006, "r": 101.75846, "b": 264.17474000000004, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "Tokenised Tags", "bbox": {"l": 122.29972, "t": 258.34520999999995, "r": 157.83972, "b": 264.30524, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "Multi-Head Attention", "bbox": {"l": 78.549347, "t": 371.38579999999996, "r": 125.68359000000001, "b": 377.04782, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "Add", "bbox": {"l": 78.513298, "t": 391.31857, "r": 84.644547, "b": 396.98059, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "& Normalisation", "bbox": {"l": 116.52705, "t": 391.31857, "r": 125.11079999999998, "b": 396.98059, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "Feed Forward Network", "bbox": {"l": 76.024773, "t": 424.45309, "r": 127.92327000000002, "b": 430.11511, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "Add", "bbox": {"l": 78.382828, "t": 444.88956, "r": 84.514076, "b": 450.55157, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "& Normalisation", "bbox": {"l": 116.39658, "t": 444.88956, "r": 124.98033, "b": 450.55157, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Linear", "bbox": {"l": 167.46945, "t": 462.44324, "r": 181.6292, "b": 468.10526, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "Softmax", "bbox": {"l": 165.61292, "t": 478.47107, "r": 184.43242, "b": 484.13309, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "CNN BACKBONE ENCODER", "bbox": {"l": 65.319511, "t": 324.26235999999994, "r": 132.9245, "b": 330.22235000000006, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "[30, 1, 2, 3, 4, \u2026 3, ", "bbox": {"l": 119.51457, "t": 269.66394, "r": 162.98782, "b": 274.72992, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "4, 5, 8, 31]", "bbox": {"l": 128.72858, "t": 274.91394, "r": 151.41083, "b": 279.97992, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "Positional ", "bbox": {"l": 60.434211999999995, "t": 338.95993, "r": 80.27021, "b": 344.26993, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "Encoding", "bbox": {"l": 60.598457, "t": 343.38605, "r": 78.854958, "b": 348.69604, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "Positional ", "bbox": {"l": 134.82877, "t": 293.37762, "r": 154.66476, "b": 298.68762, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "Encoding", "bbox": {"l": 134.99303, "t": 297.80370999999997, "r": 153.24953, "b": 303.11371, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "Add & Normalisation", "bbox": {"l": 150.55193, "t": 345.35861, "r": 197.14943, "b": 351.02063, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Add", "bbox": {"l": 150.55193, "t": 394.4234, "r": 156.68318, "b": 400.08542, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "& Normalisation", "bbox": {"l": 188.56567, "t": 394.4234, "r": 197.14943, "b": 400.08542, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "Multi-Head Attention", "bbox": {"l": 150.18539, "t": 375.66843, "r": 197.31964, "b": 381.33044, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "Add", "bbox": {"l": 150.55193, "t": 440.24847000000005, "r": 156.68318, "b": 445.91049, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "& Normalisation", "bbox": {"l": 188.56567, "t": 440.24847000000005, "r": 197.14943, "b": 445.91049, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Feed Forward Network", "bbox": {"l": 147.86377, "t": 422.09335, "r": 199.76227, "b": 427.75537, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Linear", "bbox": {"l": 241.56567000000004, "t": 314.26285000000007, "r": 255.72542, "b": 319.92487, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "Linear", "bbox": {"l": 241.91730000000004, "t": 361.36493, "r": 256.07706, "b": 367.02695, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "Attention", "bbox": {"l": 228.054, "t": 336.61929000000003, "r": 248.72363000000004, "b": 342.28131, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "Network", "bbox": {"l": 246.2919, "t": 336.61929000000003, "r": 269.39325, "b": 342.28131, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "MLP", "bbox": {"l": 228.44568000000004, "t": 405.14682, "r": 238.73892, "b": 410.80884, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Linear ", "bbox": {"l": 256.29767, "t": 405.2032500000001, "r": 271.77792, "b": 410.86526, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "Sigmoid", "bbox": {"l": 239.54543, "t": 382.21344, "r": 258.08942, "b": 387.87546, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "Transformer Encoder Network", "bbox": {"l": 54.14704100000001, "t": 384.87183, "r": 59.51152, "b": 449.78326, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "x2", "bbox": {"l": 54.235424, "t": 373.81232, "r": 59.30449699999999, "b": 378.45421999999996, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "Encoded Output", "bbox": {"l": 85.295891, "t": 484.53189, "r": 122.16431, "b": 490.36688, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "Encoded Output", "bbox": {"l": 229.66599, "t": 279.54607999999996, "r": 265.3194, "b": 285.45572000000004, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "Predicted Tags", "bbox": {"l": 157.17369, "t": 500.3031, "r": 190.41711, "b": 506.12943, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "Bounding Boxes & ", "bbox": {"l": 227.81598999999997, "t": 438.05542, "r": 270.78442, "b": 443.89206, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "Classification", "bbox": {"l": 233.70262, "t": 444.06183, "r": 263.51105, "b": 449.8904999999999, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "Transformer ", "bbox": {"l": 184.74655, "t": 293.39502, "r": 212.16055, "b": 298.75903, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "Decoder Network", "bbox": {"l": 178.91229, "t": 299.14502, "r": 216.74378999999996, "b": 304.50903, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "x4", "bbox": {"l": 194.24574, "t": 282.7822, "r": 198.89099, "b": 287.84817999999996, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "CELL BBOX DECODER", "bbox": {"l": 221.45587, "t": 271.86914, "r": 276.47089, "b": 277.82916, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "Masked Multi-Head ", "bbox": {"l": 151.65219, "t": 323.44241, "r": 197.29019, "b": 329.10443, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "Attention", "bbox": {"l": 163.43277, "t": 329.44241, "r": 184.19028, "b": 335.10443, "coord_origin": "TOPLEFT"}}], "children": [{"id": 69, "label": "text", "bbox": {"l": 74.253464, "t": 258.21472000000006, "r": 101.75846, "b": 264.17474000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "Input Image", "bbox": {"l": 74.253464, "t": 258.21472000000006, "r": 101.75846, "b": 264.17474000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 122.29972, "t": 258.34520999999995, "r": 157.83972, "b": 264.30524, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "Tokenised Tags", "bbox": {"l": 122.29972, "t": 258.34520999999995, "r": 157.83972, "b": 264.30524, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 78.549347, "t": 371.38579999999996, "r": 125.68359000000001, "b": 377.04782, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "Multi-Head Attention", "bbox": {"l": 78.549347, "t": 371.38579999999996, "r": 125.68359000000001, "b": 377.04782, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 78.513298, "t": 391.31857, "r": 84.644547, "b": 396.98059, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "Add", "bbox": {"l": 78.513298, "t": 391.31857, "r": 84.644547, "b": 396.98059, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 116.52705, "t": 391.31857, "r": 125.11079999999998, "b": 396.98059, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "& Normalisation", "bbox": {"l": 116.52705, "t": 391.31857, "r": 125.11079999999998, "b": 396.98059, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 76.024773, "t": 424.45309, "r": 127.92327000000002, "b": 430.11511, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "Feed Forward Network", "bbox": {"l": 76.024773, "t": 424.45309, "r": 127.92327000000002, "b": 430.11511, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 78.382828, "t": 444.88956, "r": 84.514076, "b": 450.55157, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "Add", "bbox": {"l": 78.382828, "t": 444.88956, "r": 84.514076, "b": 450.55157, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 116.39658, "t": 444.88956, "r": 124.98033, "b": 450.55157, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "& Normalisation", "bbox": {"l": 116.39658, "t": 444.88956, "r": 124.98033, "b": 450.55157, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 167.46945, "t": 462.44324, "r": 181.6292, "b": 468.10526, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "Linear", "bbox": {"l": 167.46945, "t": 462.44324, "r": 181.6292, "b": 468.10526, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 165.61292, "t": 478.47107, "r": 184.43242, "b": 484.13309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "Softmax", "bbox": {"l": 165.61292, "t": 478.47107, "r": 184.43242, "b": 484.13309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 65.319511, "t": 324.26235999999994, "r": 132.9245, "b": 330.22235000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "CNN BACKBONE ENCODER", "bbox": {"l": 65.319511, "t": 324.26235999999994, "r": 132.9245, "b": 330.22235000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 119.51457, "t": 269.66394, "r": 162.98782, "b": 274.72992, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "[30, 1, 2, 3, 4, \u2026 3, ", "bbox": {"l": 119.51457, "t": 269.66394, "r": 162.98782, "b": 274.72992, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 128.72858, "t": 274.91394, "r": 151.41083, "b": 279.97992, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "4, 5, 8, 31]", "bbox": {"l": 128.72858, "t": 274.91394, "r": 151.41083, "b": 279.97992, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 60.434211999999995, "t": 338.95993, "r": 80.27021, "b": 344.26993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "Positional ", "bbox": {"l": 60.434211999999995, "t": 338.95993, "r": 80.27021, "b": 344.26993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 60.598457, "t": 343.38605, "r": 78.854958, "b": 348.69604, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "Encoding", "bbox": {"l": 60.598457, "t": 343.38605, "r": 78.854958, "b": 348.69604, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 134.82877, "t": 293.37762, "r": 154.66476, "b": 298.68762, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "Positional ", "bbox": {"l": 134.82877, "t": 293.37762, "r": 154.66476, "b": 298.68762, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 134.99303, "t": 297.80370999999997, "r": 153.24953, "b": 303.11371, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "Encoding", "bbox": {"l": 134.99303, "t": 297.80370999999997, "r": 153.24953, "b": 303.11371, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 150.55193, "t": 345.35861, "r": 197.14943, "b": 351.02063, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "Add & Normalisation", "bbox": {"l": 150.55193, "t": 345.35861, "r": 197.14943, "b": 351.02063, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 150.55193, "t": 394.4234, "r": 156.68318, "b": 400.08542, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "Add", "bbox": {"l": 150.55193, "t": 394.4234, "r": 156.68318, "b": 400.08542, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 188.56567, "t": 394.4234, "r": 197.14943, "b": 400.08542, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "& Normalisation", "bbox": {"l": 188.56567, "t": 394.4234, "r": 197.14943, "b": 400.08542, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 150.18539, "t": 375.66843, "r": 197.31964, "b": 381.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "Multi-Head Attention", "bbox": {"l": 150.18539, "t": 375.66843, "r": 197.31964, "b": 381.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 150.55193, "t": 440.24847000000005, "r": 156.68318, "b": 445.91049, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "Add", "bbox": {"l": 150.55193, "t": 440.24847000000005, "r": 156.68318, "b": 445.91049, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 188.56567, "t": 440.24847000000005, "r": 197.14943, "b": 445.91049, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "& Normalisation", "bbox": {"l": 188.56567, "t": 440.24847000000005, "r": 197.14943, "b": 445.91049, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 147.86377, "t": 422.09335, "r": 199.76227, "b": 427.75537, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "Feed Forward Network", "bbox": {"l": 147.86377, "t": 422.09335, "r": 199.76227, "b": 427.75537, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 241.56567000000004, "t": 314.26285000000007, "r": 255.72542, "b": 319.92487, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "Linear", "bbox": {"l": 241.56567000000004, "t": 314.26285000000007, "r": 255.72542, "b": 319.92487, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 241.91730000000004, "t": 361.36493, "r": 256.07706, "b": 367.02695, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "Linear", "bbox": {"l": 241.91730000000004, "t": 361.36493, "r": 256.07706, "b": 367.02695, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 228.054, "t": 336.61929000000003, "r": 248.72363000000004, "b": 342.28131, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "Attention", "bbox": {"l": 228.054, "t": 336.61929000000003, "r": 248.72363000000004, "b": 342.28131, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 246.2919, "t": 336.61929000000003, "r": 269.39325, "b": 342.28131, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "Network", "bbox": {"l": 246.2919, "t": 336.61929000000003, "r": 269.39325, "b": 342.28131, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 228.44568000000004, "t": 405.14682, "r": 238.73892, "b": 410.80884, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "MLP", "bbox": {"l": 228.44568000000004, "t": 405.14682, "r": 238.73892, "b": 410.80884, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 256.29767, "t": 405.2032500000001, "r": 271.77792, "b": 410.86526, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "Linear ", "bbox": {"l": 256.29767, "t": 405.2032500000001, "r": 271.77792, "b": 410.86526, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 239.54543, "t": 382.21344, "r": 258.08942, "b": 387.87546, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "Sigmoid", "bbox": {"l": 239.54543, "t": 382.21344, "r": 258.08942, "b": 387.87546, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 54.14704100000001, "t": 384.87183, "r": 59.51152, "b": 449.78326, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "Transformer Encoder Network", "bbox": {"l": 54.14704100000001, "t": 384.87183, "r": 59.51152, "b": 449.78326, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 54.235424, "t": 373.81232, "r": 59.30449699999999, "b": 378.45421999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "x2", "bbox": {"l": 54.235424, "t": 373.81232, "r": 59.30449699999999, "b": 378.45421999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 85.295891, "t": 484.53189, "r": 122.16431, "b": 490.36688, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "Encoded Output", "bbox": {"l": 85.295891, "t": 484.53189, "r": 122.16431, "b": 490.36688, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 229.66599, "t": 279.54607999999996, "r": 265.3194, "b": 285.45572000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "Encoded Output", "bbox": {"l": 229.66599, "t": 279.54607999999996, "r": 265.3194, "b": 285.45572000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 157.17369, "t": 500.3031, "r": 190.41711, "b": 506.12943, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "Predicted Tags", "bbox": {"l": 157.17369, "t": 500.3031, "r": 190.41711, "b": 506.12943, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 227.81598999999997, "t": 438.05542, "r": 270.78442, "b": 443.89206, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "Bounding Boxes & ", "bbox": {"l": 227.81598999999997, "t": 438.05542, "r": 270.78442, "b": 443.89206, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 233.70262, "t": 444.06183, "r": 263.51105, "b": 449.8904999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "Classification", "bbox": {"l": 233.70262, "t": 444.06183, "r": 263.51105, "b": 449.8904999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 184.74655, "t": 293.39502, "r": 212.16055, "b": 298.75903, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "Transformer ", "bbox": {"l": 184.74655, "t": 293.39502, "r": 212.16055, "b": 298.75903, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 178.91229, "t": 299.14502, "r": 216.74378999999996, "b": 304.50903, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "Decoder Network", "bbox": {"l": 178.91229, "t": 299.14502, "r": 216.74378999999996, "b": 304.50903, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 194.24574, "t": 282.7822, "r": 198.89099, "b": 287.84817999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": "x4", "bbox": {"l": 194.24574, "t": 282.7822, "r": 198.89099, "b": 287.84817999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 221.45587, "t": 271.86914, "r": 276.47089, "b": 277.82916, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "CELL BBOX DECODER", "bbox": {"l": 221.45587, "t": 271.86914, "r": 276.47089, "b": 277.82916, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 151.65219, "t": 323.44241, "r": 197.29019, "b": 329.10443, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "Masked Multi-Head ", "bbox": {"l": 151.65219, "t": 323.44241, "r": 197.29019, "b": 329.10443, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 163.43277, "t": 329.44241, "r": 184.19028, "b": 335.10443, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": "Attention", "bbox": {"l": 163.43277, "t": 329.44241, "r": 184.19028, "b": 335.10443, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 8, "label": "caption", "bbox": {"l": 50.112, "t": 527.7828099999999, "r": 286.36597, "b": 680.27094, "coord_origin": "TOPLEFT"}, "confidence": 0.8913407325744629, "cells": [{"id": 107, "text": "Figure 4: Given an input image of a table, the", "bbox": {"l": 50.112, "t": 527.90237, "r": 229.78752, "b": 536.80893, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "Encoder", "bbox": {"l": 231.787, "t": 527.7828099999999, "r": 267.76196, "b": 536.7392, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "pro-", "bbox": {"l": 269.76401, "t": 527.90237, "r": 286.36169, "b": 536.80893, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "duces fixed-length features that represent the input image.", "bbox": {"l": 50.112015, "t": 539.85738, "r": 286.36508, "b": 548.76393, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "The features are then passed to both the", "bbox": {"l": 50.112015, "t": 551.81337, "r": 205.84735, "b": 560.71992, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "Structure Decoder", "bbox": {"l": 208.01802, "t": 551.69382, "r": 286.36392, "b": 560.6501900000001, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "and", "bbox": {"l": 50.112015, "t": 563.76837, "r": 64.498009, "b": 572.67493, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "Cell BBox Decoder", "bbox": {"l": 68.165016, "t": 563.64882, "r": 151.31288, "b": 572.60519, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": ".", "bbox": {"l": 151.31302, "t": 563.76837, "r": 153.80367, "b": 572.67493, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "During training, the", "bbox": {"l": 160.41884, "t": 563.76837, "r": 241.93283000000002, "b": 572.67493, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "Structure", "bbox": {"l": 245.59502, "t": 563.64882, "r": 286.362, "b": 572.60519, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "Decoder", "bbox": {"l": 50.112015, "t": 575.60382, "r": 85.519089, "b": 584.5602, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "receives \u2018tokenized tags\u2019 of the HTML code that", "bbox": {"l": 88.623016, "t": 575.7233699999999, "r": 286.36072, "b": 584.6299300000001, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "represent the table structure. Afterwards, a transformer en-", "bbox": {"l": 50.112015, "t": 587.6783800000001, "r": 286.36511, "b": 596.58493, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "coder and decoder architecture is employed to produce fea-", "bbox": {"l": 50.112015, "t": 599.63338, "r": 286.36508, "b": 608.53993, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "tures that are received by a linear layer, and the", "bbox": {"l": 50.112015, "t": 611.58838, "r": 240.43756000000002, "b": 620.4949300000001, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "Cell BBox", "bbox": {"l": 243.19801, "t": 611.46883, "r": 286.36597, "b": 620.4252, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "Decoder. The linear layer is applied to the features to", "bbox": {"l": 50.112015, "t": 623.42482, "r": 286.36511, "b": 632.3812, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "predict the tags. Simultaneously, the Cell BBox Decoder", "bbox": {"l": 50.112015, "t": 635.37982, "r": 286.36508, "b": 644.3362, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "selects features referring to the data cells (\u2018", "bbox": {"l": 50.112015, "t": 647.45438, "r": 220.58205, "b": 656.36093, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "<", "bbox": {"l": 220.57802000000004, "t": 647.29497, "r": 228.32693, "b": 656.14175, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "td", "bbox": {"l": 228.32700999999997, "t": 647.45438, "r": 236.07791000000003, "b": 656.36093, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": ">", "bbox": {"l": 236.07802000000004, "t": 647.29497, "r": 243.82693, "b": 656.14175, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "\u2019, \u2018", "bbox": {"l": 243.82602, "t": 647.45438, "r": 255.29298000000003, "b": 656.36093, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "<", "bbox": {"l": 255.29102000000003, "t": 647.29497, "r": 263.03992, "b": 656.14175, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "\u2019) and", "bbox": {"l": 263.04001, "t": 647.45438, "r": 286.36246, "b": 656.36093, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "passes them through an attention network, an MLP, and a", "bbox": {"l": 50.112015, "t": 659.40938, "r": 286.36511, "b": 668.31594, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "linear layer to predict the bounding boxes.", "bbox": {"l": 50.112015, "t": 671.36438, "r": 218.46996, "b": 680.27094, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "text", "bbox": {"l": 308.862, "t": 249.53441999999995, "r": 545.11505, "b": 294.3069499999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9831458330154419, "cells": [{"id": 135, "text": "forming classification, and adding an adaptive pooling", "bbox": {"l": 308.862, "t": 249.53441999999995, "r": 523.05786, "b": 258.44097999999997, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "layer", "bbox": {"l": 525.19983, "t": 249.53441999999995, "r": 545.11505, "b": 258.44097999999997, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "of size 28*28. ResNet by default downsamples the", "bbox": {"l": 308.862, "t": 261.49042, "r": 517.55847, "b": 270.39697, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "image", "bbox": {"l": 520.76642, "t": 261.49042, "r": 545.11499, "b": 270.39697, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "resolution by 32 and then the encoded image is provided", "bbox": {"l": 308.862, "t": 273.44537, "r": 534.80377, "b": 282.35196, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "to", "bbox": {"l": 537.36414, "t": 273.44537, "r": 545.11505, "b": 282.35196, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "both the", "bbox": {"l": 308.862, "t": 285.40039, "r": 341.24045, "b": 294.3069499999999, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "Structure Decoder", "bbox": {"l": 343.73099, "t": 285.49005, "r": 417.23508, "b": 294.07782000000003, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": ", and", "bbox": {"l": 417.23398, "t": 285.40039, "r": 436.60129, "b": 294.3069499999999, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "Cell BBox Decoder", "bbox": {"l": 439.09198, "t": 285.49005, "r": 516.56116, "b": 294.07782000000003, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": ".", "bbox": {"l": 516.56097, "t": 285.40039, "r": 519.05164, "b": 294.3069499999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 308.86194, "t": 297.33981, "r": 545.11511, "b": 413.96182, "coord_origin": "TOPLEFT"}, "confidence": 0.9862009882926941, "cells": [{"id": 146, "text": "Structure Decoder.", "bbox": {"l": 320.81696, "t": 297.33981, "r": 400.86649, "b": 306.2962, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "The transformer architecture of", "bbox": {"l": 403.91394, "t": 297.45938, "r": 528.33685, "b": 306.36594, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "this", "bbox": {"l": 530.7179, "t": 297.45938, "r": 545.11383, "b": 306.36594, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "component is based on the work proposed in [31].", "bbox": {"l": 308.86194, "t": 309.41437, "r": 517.5285, "b": 318.32092, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "After", "bbox": {"l": 524.09387, "t": 309.41437, "r": 545.11493, "b": 318.32092, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "extensive experimentation, the", "bbox": {"l": 308.86194, "t": 321.36934999999994, "r": 432.35833999999994, "b": 330.27591, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "Structure Decoder", "bbox": {"l": 435.81995000000006, "t": 321.45901, "r": 510.29041, "b": 330.04678, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "is", "bbox": {"l": 513.97797, "t": 321.36934999999994, "r": 520.62305, "b": 330.27591, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "mod-", "bbox": {"l": 524.08008, "t": 321.36934999999994, "r": 545.11115, "b": 330.27591, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "eled as a transformer encoder with two encoder layers", "bbox": {"l": 308.86197, "t": 333.32434, "r": 527.76013, "b": 342.2309, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "and", "bbox": {"l": 530.729, "t": 333.32434, "r": 545.11499, "b": 342.2309, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "a transformer decoder made from a stack of 4 decoder", "bbox": {"l": 308.86197, "t": 345.27933, "r": 526.85352, "b": 354.18588, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "lay-", "bbox": {"l": 529.62311, "t": 345.27933, "r": 545.11493, "b": 354.18588, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "ers that comprise mainly of multi-head attention and", "bbox": {"l": 308.86197, "t": 357.23532, "r": 524.51245, "b": 366.14188, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "feed", "bbox": {"l": 527.96948, "t": 357.23532, "r": 545.11511, "b": 366.14188, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "forward layers.", "bbox": {"l": 308.86197, "t": 369.19031000000007, "r": 370.39096, "b": 378.09685999999994, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "This configuration uses fewer layers", "bbox": {"l": 377.44449, "t": 369.19031000000007, "r": 526.91339, "b": 378.09685999999994, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "and", "bbox": {"l": 530.72906, "t": 369.19031000000007, "r": 545.11505, "b": 378.09685999999994, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "heads in comparison to networks applied to other", "bbox": {"l": 308.86197, "t": 381.14529000000005, "r": 505.46395999999993, "b": 390.05185, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "problems", "bbox": {"l": 508.03430000000003, "t": 381.14529000000005, "r": 545.11511, "b": 390.05185, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "(e.g. \u201cScene Understanding\u201d, \u201cImage Captioning\u201d),", "bbox": {"l": 308.86197, "t": 393.10028, "r": 517.68799, "b": 402.00684, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "some-", "bbox": {"l": 520.76642, "t": 393.10028, "r": 545.11499, "b": 402.00684, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "thing which we relate to the simplicity of table images.", "bbox": {"l": 308.86197, "t": 405.05526999999995, "r": 528.01935, "b": 413.96182, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 308.86197, "t": 417.11426, "r": 545.11511, "b": 545.57271, "coord_origin": "TOPLEFT"}, "confidence": 0.9851906895637512, "cells": [{"id": 169, "text": "The transformer encoder receives an encoded", "bbox": {"l": 320.81696, "t": 417.11426, "r": 515.49609, "b": 426.02081, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "image", "bbox": {"l": 520.7663, "t": 417.11426, "r": 545.11487, "b": 426.02081, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "from the", "bbox": {"l": 308.86197, "t": 429.0692399999999, "r": 343.72107, "b": 437.9758, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "CNN Backbone Network", "bbox": {"l": 347.03796, "t": 429.15891, "r": 446.45471000000003, "b": 437.74667, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "and refines it", "bbox": {"l": 449.93996999999996, "t": 429.0692399999999, "r": 503.06055000000003, "b": 437.9758, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "through", "bbox": {"l": 506.37808, "t": 429.0692399999999, "r": 537.3717, "b": 437.9758, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "a", "bbox": {"l": 540.68927, "t": 429.0692399999999, "r": 545.11267, "b": 437.9758, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "multi-head dot-product attention layer, followed by a", "bbox": {"l": 308.86197, "t": 441.02423, "r": 522.78894, "b": 449.93079, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "Feed", "bbox": {"l": 525.7478, "t": 441.02423, "r": 545.11511, "b": 449.93079, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "Forward Network.", "bbox": {"l": 308.86197, "t": 452.97922, "r": 384.14929, "b": 461.88577, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "During training, the transformer", "bbox": {"l": 393.37466, "t": 452.97922, "r": 527.84985, "b": 461.88577, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "de-", "bbox": {"l": 532.39282, "t": 452.97922, "r": 545.11505, "b": 461.88577, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "coder receives as input the output feature produced by", "bbox": {"l": 308.86197, "t": 464.93521, "r": 529.7627, "b": 473.84177, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "the", "bbox": {"l": 532.94073, "t": 464.93521, "r": 545.11505, "b": 473.84177, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "transformer encoder, and the tokenized input of the", "bbox": {"l": 308.86197, "t": 476.8902, "r": 514.17126, "b": 485.79675, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "HTML", "bbox": {"l": 516.89105, "t": 476.8902, "r": 545.11511, "b": 485.79675, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": "ground-truth tags. Using a stack of multi-head attention", "bbox": {"l": 308.86197, "t": 488.84518, "r": 527.63068, "b": 497.75174, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "lay-", "bbox": {"l": 529.62317, "t": 488.84518, "r": 545.11499, "b": 497.75174, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "ers, different aspects of the tag sequence could be", "bbox": {"l": 308.86197, "t": 500.80017, "r": 508.3630999999999, "b": 509.70673, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": "inferred.", "bbox": {"l": 511.09286000000003, "t": 500.80017, "r": 545.11511, "b": 509.70673, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "This is achieved by each attention head on a layer operating", "bbox": {"l": 308.86197, "t": 512.7551599999999, "r": 545.11499, "b": 521.6617100000001, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "in a different subspace, and then combining altogether their", "bbox": {"l": 308.86197, "t": 524.71115, "r": 545.11511, "b": 533.61771, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "attention score.", "bbox": {"l": 308.86197, "t": 536.66615, "r": 369.73349, "b": 545.57271, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 308.86194, "t": 548.6046, "r": 545.11511, "b": 653.27271, "coord_origin": "TOPLEFT"}, "confidence": 0.9869195818901062, "cells": [{"id": 192, "text": "Cell BBox Decoder.", "bbox": {"l": 320.81696, "t": 548.6046, "r": 404.76184, "b": 557.56097, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "Our architecture allows to simul-", "bbox": {"l": 410.34094, "t": 548.72415, "r": 545.11505, "b": 557.63071, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "taneously predict HTML tags and bounding boxes for each", "bbox": {"l": 308.86194, "t": 560.68015, "r": 545.11493, "b": 569.5867000000001, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "table cell without the need of a separate object detector end", "bbox": {"l": 308.86194, "t": 572.6351500000001, "r": 545.11511, "b": 581.5417, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "to end. This approach is inspired by DETR [1] which em-", "bbox": {"l": 308.86194, "t": 584.59015, "r": 545.11493, "b": 593.4967, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "ploys a Transformer Encoder, and Decoder that looks for", "bbox": {"l": 308.86194, "t": 596.54515, "r": 545.11499, "b": 605.45171, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "a specific number of object queries (potential object detec-", "bbox": {"l": 308.86194, "t": 608.50015, "r": 545.11505, "b": 617.40671, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "tions). As our model utilizes a transformer architecture, the", "bbox": {"l": 308.86194, "t": 620.45515, "r": 545.11505, "b": 629.36171, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "hidden state of the", "bbox": {"l": 308.86194, "t": 632.41115, "r": 381.67859, "b": 641.3177000000001, "coord_origin": "TOPLEFT"}}, {"id": 201, "text": "<", "bbox": {"l": 383.99695, "t": 632.25174, "r": 391.74585, "b": 641.09853, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": "td", "bbox": {"l": 391.74594, "t": 632.41115, "r": 399.49686, "b": 641.3177000000001, "coord_origin": "TOPLEFT"}}, {"id": 203, "text": ">", "bbox": {"l": 399.49695, "t": 632.25174, "r": 407.24585, "b": 641.09853, "coord_origin": "TOPLEFT"}}, {"id": 204, "text": "\u2019 and \u2018", "bbox": {"l": 407.24594, "t": 632.41115, "r": 432.90958, "b": 641.3177000000001, "coord_origin": "TOPLEFT"}}, {"id": 205, "text": "<", "bbox": {"l": 432.90792999999996, "t": 632.25174, "r": 440.65683000000007, "b": 641.09853, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": "\u2019 HTML structure tags be-", "bbox": {"l": 440.65691999999996, "t": 632.41115, "r": 545.11475, "b": 641.3177000000001, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": "come the object query.", "bbox": {"l": 308.86194, "t": 644.3661500000001, "r": 398.96371, "b": 653.27271, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 308.86194, "t": 656.42516, "r": 545.11505, "b": 713.151726, "coord_origin": "TOPLEFT"}, "confidence": 0.9852352142333984, "cells": [{"id": 208, "text": "The encoding generated by the", "bbox": {"l": 320.81693, "t": 656.42516, "r": 444.34316999999993, "b": 665.33172, "coord_origin": "TOPLEFT"}}, {"id": 209, "text": "CNN Backbone Network", "bbox": {"l": 447.00591999999995, "t": 656.51482, "r": 545.1076, "b": 665.10258, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": "along with the features acquired for every data cell from the", "bbox": {"l": 308.86194, "t": 668.38016, "r": 545.11505, "b": 677.2867200000001, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "Transformer Decoder are then passed to the attention net-", "bbox": {"l": 308.86194, "t": 680.33516, "r": 545.11505, "b": 689.24172, "coord_origin": "TOPLEFT"}}, {"id": 212, "text": "work. The attention network takes both inputs and learns to", "bbox": {"l": 308.86194, "t": 692.290161, "r": 545.11505, "b": 701.196724, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "provide an attention weighted encoding. This weighted at-", "bbox": {"l": 308.86194, "t": 704.245163, "r": 545.11505, "b": 713.151726, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "page_footer", "bbox": {"l": 295.12094, "t": 734.13316, "r": 300.10223, "b": 743.039722, "coord_origin": "TOPLEFT"}, "confidence": 0.8719564080238342, "cells": [{"id": 214, "text": "5", "bbox": {"l": 295.12094, "t": 734.13316, "r": 300.10223, "b": 743.039722, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "picture", "id": 7, "page_no": 4, "cluster": {"id": 7, "label": "picture", "bbox": {"l": 74.30525970458984, "t": 77.91120147705078, "r": 519.9801025390625, "b": 183.70150756835938, "coord_origin": "TOPLEFT"}, "confidence": 0.9296807646751404, "cells": [{"id": 0, "text": "1.", "bbox": {"l": 81.688072, "t": 122.43970000000002, "r": 84.927567, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Item", "bbox": {"l": 86.54731, "t": 122.43970000000002, "r": 93.026291, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Amount", "bbox": {"l": 102.50498, "t": 115.25214000000005, "r": 115.3461, "b": 118.44135000000006, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Names", "bbox": {"l": 82.140205, "t": 115.21489999999994, "r": 93.291527, "b": 118.40410999999995, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "1000", "bbox": {"l": 96.748268, "t": 122.43970000000002, "r": 104.3119, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "500", "bbox": {"l": 96.748268, "t": 127.74370999999985, "r": 102.42083, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "3500", "bbox": {"l": 96.748268, "t": 133.45569, "r": 104.3119, "b": 136.6449, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "150", "bbox": {"l": 96.748268, "t": 139.16772000000003, "r": 102.42083, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "unit", "bbox": {"l": 110.66107, "t": 122.43970000000002, "r": 116.14391, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "unit", "bbox": {"l": 110.66107, "t": 127.74370999999985, "r": 116.14391, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "unit", "bbox": {"l": 110.66107, "t": 133.45569, "r": 116.14391, "b": 136.6449, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "unit", "bbox": {"l": 110.66107, "t": 139.16772000000003, "r": 116.14391, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "2.", "bbox": {"l": 81.688072, "t": 127.74370999999985, "r": 84.927567, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Item", "bbox": {"l": 86.54731, "t": 127.74370999999985, "r": 93.026291, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "3.", "bbox": {"l": 81.688072, "t": 133.45569, "r": 84.927567, "b": 136.6449, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Item", "bbox": {"l": 86.54731, "t": 133.45569, "r": 93.026291, "b": 136.6449, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "4.", "bbox": {"l": 81.688072, "t": 139.16772000000003, "r": 84.927567, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "Item", "bbox": {"l": 86.54731, "t": 139.16772000000003, "r": 93.026291, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Extracted", "bbox": {"l": 88.084389, "t": 90.49738000000002, "r": 113.93649, "b": 96.23798, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Table Images", "bbox": {"l": 82.81002, "t": 97.63738999999998, "r": 119.21240000000002, "b": 103.37798999999995, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Standardized", "bbox": {"l": 143.94247, "t": 100.60235999999998, "r": 180.01131, "b": 106.34295999999995, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Images", "bbox": {"l": 151.94064, "t": 107.74237000000005, "r": 172.0118, "b": 113.48297000000014, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "BBox", "bbox": {"l": 251.76939000000002, "t": 80.93096999999989, "r": 266.39557, "b": 86.67156999999997, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Decoder", "bbox": {"l": 247.51601, "t": 86.03101000000004, "r": 270.65021, "b": 91.77161000000001, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "BBoxes", "bbox": {"l": 331.03699, "t": 78.55980999999997, "r": 352.12589, "b": 84.30042000000003, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "BBoxes can be", "bbox": {"l": 390.56421, "t": 96.03223000000003, "r": 431.7261, "b": 101.77282999999989, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "traced back to the", "bbox": {"l": 386.82422, "t": 102.15228000000013, "r": 435.46966999999995, "b": 107.89287999999999, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "original image to", "bbox": {"l": 388.69589, "t": 108.27228000000002, "r": 433.6032400000001, "b": 114.01288000000011, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "extract content", "bbox": {"l": 391.07761, "t": 114.39227000000005, "r": 431.22542999999996, "b": 120.13286999999991, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Structure Tags sequence", "bbox": {"l": 431.22650000000004, "t": 151.68511999999998, "r": 498.82068, "b": 157.42571999999996, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "provide full description of", "bbox": {"l": 431.1738, "t": 157.80517999999995, "r": 498.87753000000004, "b": 163.54578000000004, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "the table structure", "bbox": {"l": 440.5289, "t": 163.92516999999998, "r": 489.51827999999995, "b": 169.66576999999995, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Structure Tags", "bbox": {"l": 328.37479, "t": 178.25385000000006, "r": 367.72333, "b": 183.99445000000003, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "BBoxes in sync", "bbox": {"l": 331.84451, "t": 123.90886999999998, "r": 373.67963, "b": 129.64948000000015, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "with tag sequence", "bbox": {"l": 331.84451, "t": 129.00885000000017, "r": 381.17786, "b": 134.74945000000002, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "Encoder", "bbox": {"l": 196.62633, "t": 88.11621000000002, "r": 219.42332, "b": 93.85681, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Structure", "bbox": {"l": 246.66771, "t": 129.4946900000001, "r": 271.49899, "b": 135.23528999999996, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "Decoder", "bbox": {"l": 247.51601, "t": 134.59473000000003, "r": 270.65021, "b": 140.33533, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "[x1, y2, x2, y2]", "bbox": {"l": 330.63071, "t": 89.01923, "r": 365.55347, "b": 94.75982999999997, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "[x1', y2', x2', y2']", "bbox": {"l": 330.63071, "t": 97.17926, "r": 370.22717, "b": 102.91985999999997, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "[x1'', y2'', x2'', y2'']", "bbox": {"l": 330.63071, "t": 105.33922999999993, "r": 374.51157, "b": 111.07983000000002, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "...", "bbox": {"l": 330.63071, "t": 113.49926999999991, "r": 335.73233, "b": 119.23987, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "<TR>", "bbox": {"l": 322.30579, "t": 141.79236000000003, "r": 335.05988, "b": 146.57617000000005, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "<TD>", "bbox": {"l": 322.30579, "t": 148.93231000000003, "r": 335.05988, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "1", "bbox": {"l": 337.54971, "t": 148.55579, "r": 340.95242, "b": 154.29638999999997, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "</TD><TD colspan=\"2\">", "bbox": {"l": 343.56262, "t": 148.93231000000003, "r": 398.91446, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "</TD>", "bbox": {"l": 407.41718, "t": 148.93231000000003, "r": 421.58801, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "</TR><TR>", "bbox": {"l": 322.30579, "t": 156.07232999999997, "r": 349.23022, "b": 160.85613999999998, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "<TD>", "bbox": {"l": 322.30579, "t": 163.21234000000004, "r": 335.05988, "b": 167.99614999999994, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "</TD><TD>...", "bbox": {"l": 343.56155, "t": 163.21234000000004, "r": 374.73685, "b": 167.99614999999994, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "...", "bbox": {"l": 322.30579, "t": 170.35235999999998, "r": 326.55716, "b": 175.13617, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "1", "bbox": {"l": 323.51111, "t": 89.66967999999997, "r": 326.91382, "b": 95.41027999999994, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "2", "bbox": {"l": 323.71509, "t": 97.78887999999995, "r": 327.1178, "b": 103.52948000000004, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "3", "bbox": {"l": 323.71509, "t": 105.98969, "r": 327.1178, "b": 111.73029000000008, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "2", "bbox": {"l": 401.4816, "t": 148.54625999999996, "r": 404.88431, "b": 154.28687000000002, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "3", "bbox": {"l": 337.6976, "t": 162.68451000000005, "r": 341.10031, "b": 168.42511000000002, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "3", "bbox": {"l": 454.46378, "t": 104.54584, "r": 457.86648999999994, "b": 110.28644000000008, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "2", "bbox": {"l": 493.32580999999993, "t": 91.09546, "r": 496.72852, "b": 96.83605999999997, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "1", "bbox": {"l": 454.08298, "t": 90.56879000000015, "r": 457.48569000000003, "b": 96.30939000000001, "coord_origin": "TOPLEFT"}}], "children": [{"id": 10, "label": "text", "bbox": {"l": 81.688072, "t": 122.43970000000002, "r": 84.927567, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 0, "text": "1.", "bbox": {"l": 81.688072, "t": 122.43970000000002, "r": 84.927567, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 86.54731, "t": 122.43970000000002, "r": 93.026291, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 1, "text": "Item", "bbox": {"l": 86.54731, "t": 122.43970000000002, "r": 93.026291, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 102.50498, "t": 115.25214000000005, "r": 115.3461, "b": 118.44135000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 2, "text": "Amount", "bbox": {"l": 102.50498, "t": 115.25214000000005, "r": 115.3461, "b": 118.44135000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 82.140205, "t": 115.21489999999994, "r": 93.291527, "b": 118.40410999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 3, "text": "Names", "bbox": {"l": 82.140205, "t": 115.21489999999994, "r": 93.291527, "b": 118.40410999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 96.748268, "t": 122.43970000000002, "r": 104.3119, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 4, "text": "1000", "bbox": {"l": 96.748268, "t": 122.43970000000002, "r": 104.3119, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 96.748268, "t": 127.74370999999985, "r": 102.42083, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 5, "text": "500", "bbox": {"l": 96.748268, "t": 127.74370999999985, "r": 102.42083, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 96.748268, "t": 133.45569, "r": 104.3119, "b": 136.6449, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": "3500", "bbox": {"l": 96.748268, "t": 133.45569, "r": 104.3119, "b": 136.6449, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 96.748268, "t": 139.16772000000003, "r": 102.42083, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "150", "bbox": {"l": 96.748268, "t": 139.16772000000003, "r": 102.42083, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 110.66107, "t": 122.43970000000002, "r": 116.14391, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "unit", "bbox": {"l": 110.66107, "t": 122.43970000000002, "r": 116.14391, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 110.66107, "t": 127.74370999999985, "r": 116.14391, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "unit", "bbox": {"l": 110.66107, "t": 127.74370999999985, "r": 116.14391, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 110.66107, "t": 133.45569, "r": 116.14391, "b": 136.6449, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "unit", "bbox": {"l": 110.66107, "t": 133.45569, "r": 116.14391, "b": 136.6449, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 110.66107, "t": 139.16772000000003, "r": 116.14391, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "unit", "bbox": {"l": 110.66107, "t": 139.16772000000003, "r": 116.14391, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 81.688072, "t": 127.74370999999985, "r": 84.927567, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "2.", "bbox": {"l": 81.688072, "t": 127.74370999999985, "r": 84.927567, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 86.54731, "t": 127.74370999999985, "r": 93.026291, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "Item", "bbox": {"l": 86.54731, "t": 127.74370999999985, "r": 93.026291, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 81.688072, "t": 133.45569, "r": 84.927567, "b": 136.6449, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "3.", "bbox": {"l": 81.688072, "t": 133.45569, "r": 84.927567, "b": 136.6449, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 86.54731, "t": 133.45569, "r": 93.026291, "b": 136.6449, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "Item", "bbox": {"l": 86.54731, "t": 133.45569, "r": 93.026291, "b": 136.6449, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 81.688072, "t": 139.16772000000003, "r": 84.927567, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "4.", "bbox": {"l": 81.688072, "t": 139.16772000000003, "r": 84.927567, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 86.54731, "t": 139.16772000000003, "r": 93.026291, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "Item", "bbox": {"l": 86.54731, "t": 139.16772000000003, "r": 93.026291, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 88.084389, "t": 90.49738000000002, "r": 113.93649, "b": 96.23798, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "Extracted", "bbox": {"l": 88.084389, "t": 90.49738000000002, "r": 113.93649, "b": 96.23798, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 82.81002, "t": 97.63738999999998, "r": 119.21240000000002, "b": 103.37798999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "Table Images", "bbox": {"l": 82.81002, "t": 97.63738999999998, "r": 119.21240000000002, "b": 103.37798999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 143.94247, "t": 100.60235999999998, "r": 180.01131, "b": 106.34295999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "Standardized", "bbox": {"l": 143.94247, "t": 100.60235999999998, "r": 180.01131, "b": 106.34295999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 151.94064, "t": 107.74237000000005, "r": 172.0118, "b": 113.48297000000014, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "Images", "bbox": {"l": 151.94064, "t": 107.74237000000005, "r": 172.0118, "b": 113.48297000000014, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 251.76939000000002, "t": 80.93096999999989, "r": 266.39557, "b": 86.67156999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "BBox", "bbox": {"l": 251.76939000000002, "t": 80.93096999999989, "r": 266.39557, "b": 86.67156999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 247.51601, "t": 86.03101000000004, "r": 270.65021, "b": 91.77161000000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "Decoder", "bbox": {"l": 247.51601, "t": 86.03101000000004, "r": 270.65021, "b": 91.77161000000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 331.03699, "t": 78.55980999999997, "r": 352.12589, "b": 84.30042000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "BBoxes", "bbox": {"l": 331.03699, "t": 78.55980999999997, "r": 352.12589, "b": 84.30042000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 390.56421, "t": 96.03223000000003, "r": 431.7261, "b": 101.77282999999989, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "BBoxes can be", "bbox": {"l": 390.56421, "t": 96.03223000000003, "r": 431.7261, "b": 101.77282999999989, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 386.82422, "t": 102.15228000000013, "r": 435.46966999999995, "b": 107.89287999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "traced back to the", "bbox": {"l": 386.82422, "t": 102.15228000000013, "r": 435.46966999999995, "b": 107.89287999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 388.69589, "t": 108.27228000000002, "r": 433.6032400000001, "b": 114.01288000000011, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "original image to", "bbox": {"l": 388.69589, "t": 108.27228000000002, "r": 433.6032400000001, "b": 114.01288000000011, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 391.07761, "t": 114.39227000000005, "r": 431.22542999999996, "b": 120.13286999999991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "extract content", "bbox": {"l": 391.07761, "t": 114.39227000000005, "r": 431.22542999999996, "b": 120.13286999999991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 431.22650000000004, "t": 151.68511999999998, "r": 498.82068, "b": 157.42571999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "Structure Tags sequence", "bbox": {"l": 431.22650000000004, "t": 151.68511999999998, "r": 498.82068, "b": 157.42571999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 431.1738, "t": 157.80517999999995, "r": 498.87753000000004, "b": 163.54578000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "provide full description of", "bbox": {"l": 431.1738, "t": 157.80517999999995, "r": 498.87753000000004, "b": 163.54578000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 440.5289, "t": 163.92516999999998, "r": 489.51827999999995, "b": 169.66576999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "the table structure", "bbox": {"l": 440.5289, "t": 163.92516999999998, "r": 489.51827999999995, "b": 169.66576999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 328.37479, "t": 178.25385000000006, "r": 367.72333, "b": 183.99445000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "Structure Tags", "bbox": {"l": 328.37479, "t": 178.25385000000006, "r": 367.72333, "b": 183.99445000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 331.84451, "t": 123.90886999999998, "r": 373.67963, "b": 129.64948000000015, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "BBoxes in sync", "bbox": {"l": 331.84451, "t": 123.90886999999998, "r": 373.67963, "b": 129.64948000000015, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 331.84451, "t": 129.00885000000017, "r": 381.17786, "b": 134.74945000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "with tag sequence", "bbox": {"l": 331.84451, "t": 129.00885000000017, "r": 381.17786, "b": 134.74945000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 196.62633, "t": 88.11621000000002, "r": 219.42332, "b": 93.85681, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "Encoder", "bbox": {"l": 196.62633, "t": 88.11621000000002, "r": 219.42332, "b": 93.85681, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 246.66771, "t": 129.4946900000001, "r": 271.49899, "b": 135.23528999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "Structure", "bbox": {"l": 246.66771, "t": 129.4946900000001, "r": 271.49899, "b": 135.23528999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 247.51601, "t": 134.59473000000003, "r": 270.65021, "b": 140.33533, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "Decoder", "bbox": {"l": 247.51601, "t": 134.59473000000003, "r": 270.65021, "b": 140.33533, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 330.63071, "t": 89.01923, "r": 365.55347, "b": 94.75982999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "[x1, y2, x2, y2]", "bbox": {"l": 330.63071, "t": 89.01923, "r": 365.55347, "b": 94.75982999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 330.63071, "t": 97.17926, "r": 370.22717, "b": 102.91985999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "[x1', y2', x2', y2']", "bbox": {"l": 330.63071, "t": 97.17926, "r": 370.22717, "b": 102.91985999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 330.63071, "t": 105.33922999999993, "r": 374.51157, "b": 111.07983000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "[x1'', y2'', x2'', y2'']", "bbox": {"l": 330.63071, "t": 105.33922999999993, "r": 374.51157, "b": 111.07983000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 330.63071, "t": 113.49926999999991, "r": 335.73233, "b": 119.23987, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "...", "bbox": {"l": 330.63071, "t": 113.49926999999991, "r": 335.73233, "b": 119.23987, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 322.30579, "t": 141.79236000000003, "r": 335.05988, "b": 146.57617000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "<TR>", "bbox": {"l": 322.30579, "t": 141.79236000000003, "r": 335.05988, "b": 146.57617000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 322.30579, "t": 148.93231000000003, "r": 335.05988, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "<TD>", "bbox": {"l": 322.30579, "t": 148.93231000000003, "r": 335.05988, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 337.54971, "t": 148.55579, "r": 340.95242, "b": 154.29638999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "1", "bbox": {"l": 337.54971, "t": 148.55579, "r": 340.95242, "b": 154.29638999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 343.56262, "t": 148.93231000000003, "r": 398.91446, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "</TD><TD colspan=\"2\">", "bbox": {"l": 343.56262, "t": 148.93231000000003, "r": 398.91446, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 407.41718, "t": 148.93231000000003, "r": 421.58801, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "</TD>", "bbox": {"l": 407.41718, "t": 148.93231000000003, "r": 421.58801, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 322.30579, "t": 156.07232999999997, "r": 349.23022, "b": 160.85613999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "</TR><TR>", "bbox": {"l": 322.30579, "t": 156.07232999999997, "r": 349.23022, "b": 160.85613999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 322.30579, "t": 163.21234000000004, "r": 335.05988, "b": 167.99614999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "<TD>", "bbox": {"l": 322.30579, "t": 163.21234000000004, "r": 335.05988, "b": 167.99614999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 343.56155, "t": 163.21234000000004, "r": 374.73685, "b": 167.99614999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "</TD><TD>...", "bbox": {"l": 343.56155, "t": 163.21234000000004, "r": 374.73685, "b": 167.99614999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 322.30579, "t": 170.35235999999998, "r": 326.55716, "b": 175.13617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "...", "bbox": {"l": 322.30579, "t": 170.35235999999998, "r": 326.55716, "b": 175.13617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 323.51111, "t": 89.66967999999997, "r": 326.91382, "b": 95.41027999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "1", "bbox": {"l": 323.51111, "t": 89.66967999999997, "r": 326.91382, "b": 95.41027999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 323.71509, "t": 97.78887999999995, "r": 327.1178, "b": 103.52948000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "2", "bbox": {"l": 323.71509, "t": 97.78887999999995, "r": 327.1178, "b": 103.52948000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 323.71509, "t": 105.98969, "r": 327.1178, "b": 111.73029000000008, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "3", "bbox": {"l": 323.71509, "t": 105.98969, "r": 327.1178, "b": 111.73029000000008, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 401.4816, "t": 148.54625999999996, "r": 404.88431, "b": 154.28687000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "2", "bbox": {"l": 401.4816, "t": 148.54625999999996, "r": 404.88431, "b": 154.28687000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 337.6976, "t": 162.68451000000005, "r": 341.10031, "b": 168.42511000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "3", "bbox": {"l": 337.6976, "t": 162.68451000000005, "r": 341.10031, "b": 168.42511000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 454.46378, "t": 104.54584, "r": 457.86648999999994, "b": 110.28644000000008, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "3", "bbox": {"l": 454.46378, "t": 104.54584, "r": 457.86648999999994, "b": 110.28644000000008, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 493.32580999999993, "t": 91.09546, "r": 496.72852, "b": 96.83605999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "2", "bbox": {"l": 493.32580999999993, "t": 91.09546, "r": 496.72852, "b": 96.83605999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 454.08298, "t": 90.56879000000015, "r": 457.48569000000003, "b": 96.30939000000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "1", "bbox": {"l": 454.08298, "t": 90.56879000000015, "r": 457.48569000000003, "b": 96.30939000000001, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "caption", "id": 6, "page_no": 4, "cluster": {"id": 6, "label": "caption", "bbox": {"l": 50.111992, "t": 203.98577999999998, "r": 545.10846, "b": 224.96691999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9677652716636658, "cells": [{"id": 59, "text": "Figure 3:", "bbox": {"l": 50.112, "t": 204.10535000000004, "r": 86.883949, "b": 213.01189999999997, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "TableFormer", "bbox": {"l": 94.020996, "t": 203.98577999999998, "r": 149.85141, "b": 212.94214, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "takes in an image of the PDF and creates bounding box and HTML structure predictions that are", "bbox": {"l": 152.86099, "t": 204.10535000000004, "r": 545.10846, "b": 213.01189999999997, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "synchronized. The bounding boxes grabs the content from the PDF and inserts it in the structure.", "bbox": {"l": 50.111992, "t": 216.06035999999995, "r": 436.0134, "b": 224.96691999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 3: TableFormer takes in an image of the PDF and creates bounding box and HTML structure predictions that are synchronized. The bounding boxes grabs the content from the PDF and inserts it in the structure."}, {"label": "picture", "id": 5, "page_no": 4, "cluster": {"id": 5, "label": "picture", "bbox": {"l": 53.03328323364258, "t": 257.66534423828125, "r": 285.3731689453125, "b": 507.6688537597656, "coord_origin": "TOPLEFT"}, "confidence": 0.9724942445755005, "cells": [{"id": 63, "text": "Input Image", "bbox": {"l": 74.253464, "t": 258.21472000000006, "r": 101.75846, "b": 264.17474000000004, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "Tokenised Tags", "bbox": {"l": 122.29972, "t": 258.34520999999995, "r": 157.83972, "b": 264.30524, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "Multi-Head Attention", "bbox": {"l": 78.549347, "t": 371.38579999999996, "r": 125.68359000000001, "b": 377.04782, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "Add", "bbox": {"l": 78.513298, "t": 391.31857, "r": 84.644547, "b": 396.98059, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "& Normalisation", "bbox": {"l": 116.52705, "t": 391.31857, "r": 125.11079999999998, "b": 396.98059, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "Feed Forward Network", "bbox": {"l": 76.024773, "t": 424.45309, "r": 127.92327000000002, "b": 430.11511, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "Add", "bbox": {"l": 78.382828, "t": 444.88956, "r": 84.514076, "b": 450.55157, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "& Normalisation", "bbox": {"l": 116.39658, "t": 444.88956, "r": 124.98033, "b": 450.55157, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Linear", "bbox": {"l": 167.46945, "t": 462.44324, "r": 181.6292, "b": 468.10526, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "Softmax", "bbox": {"l": 165.61292, "t": 478.47107, "r": 184.43242, "b": 484.13309, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "CNN BACKBONE ENCODER", "bbox": {"l": 65.319511, "t": 324.26235999999994, "r": 132.9245, "b": 330.22235000000006, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "[30, 1, 2, 3, 4, \u2026 3, ", "bbox": {"l": 119.51457, "t": 269.66394, "r": 162.98782, "b": 274.72992, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "4, 5, 8, 31]", "bbox": {"l": 128.72858, "t": 274.91394, "r": 151.41083, "b": 279.97992, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "Positional ", "bbox": {"l": 60.434211999999995, "t": 338.95993, "r": 80.27021, "b": 344.26993, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "Encoding", "bbox": {"l": 60.598457, "t": 343.38605, "r": 78.854958, "b": 348.69604, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "Positional ", "bbox": {"l": 134.82877, "t": 293.37762, "r": 154.66476, "b": 298.68762, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "Encoding", "bbox": {"l": 134.99303, "t": 297.80370999999997, "r": 153.24953, "b": 303.11371, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "Add & Normalisation", "bbox": {"l": 150.55193, "t": 345.35861, "r": 197.14943, "b": 351.02063, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Add", "bbox": {"l": 150.55193, "t": 394.4234, "r": 156.68318, "b": 400.08542, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "& Normalisation", "bbox": {"l": 188.56567, "t": 394.4234, "r": 197.14943, "b": 400.08542, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "Multi-Head Attention", "bbox": {"l": 150.18539, "t": 375.66843, "r": 197.31964, "b": 381.33044, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "Add", "bbox": {"l": 150.55193, "t": 440.24847000000005, "r": 156.68318, "b": 445.91049, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "& Normalisation", "bbox": {"l": 188.56567, "t": 440.24847000000005, "r": 197.14943, "b": 445.91049, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Feed Forward Network", "bbox": {"l": 147.86377, "t": 422.09335, "r": 199.76227, "b": 427.75537, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Linear", "bbox": {"l": 241.56567000000004, "t": 314.26285000000007, "r": 255.72542, "b": 319.92487, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "Linear", "bbox": {"l": 241.91730000000004, "t": 361.36493, "r": 256.07706, "b": 367.02695, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "Attention", "bbox": {"l": 228.054, "t": 336.61929000000003, "r": 248.72363000000004, "b": 342.28131, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "Network", "bbox": {"l": 246.2919, "t": 336.61929000000003, "r": 269.39325, "b": 342.28131, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "MLP", "bbox": {"l": 228.44568000000004, "t": 405.14682, "r": 238.73892, "b": 410.80884, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Linear ", "bbox": {"l": 256.29767, "t": 405.2032500000001, "r": 271.77792, "b": 410.86526, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "Sigmoid", "bbox": {"l": 239.54543, "t": 382.21344, "r": 258.08942, "b": 387.87546, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "Transformer Encoder Network", "bbox": {"l": 54.14704100000001, "t": 384.87183, "r": 59.51152, "b": 449.78326, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "x2", "bbox": {"l": 54.235424, "t": 373.81232, "r": 59.30449699999999, "b": 378.45421999999996, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "Encoded Output", "bbox": {"l": 85.295891, "t": 484.53189, "r": 122.16431, "b": 490.36688, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "Encoded Output", "bbox": {"l": 229.66599, "t": 279.54607999999996, "r": 265.3194, "b": 285.45572000000004, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "Predicted Tags", "bbox": {"l": 157.17369, "t": 500.3031, "r": 190.41711, "b": 506.12943, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "Bounding Boxes & ", "bbox": {"l": 227.81598999999997, "t": 438.05542, "r": 270.78442, "b": 443.89206, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "Classification", "bbox": {"l": 233.70262, "t": 444.06183, "r": 263.51105, "b": 449.8904999999999, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "Transformer ", "bbox": {"l": 184.74655, "t": 293.39502, "r": 212.16055, "b": 298.75903, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "Decoder Network", "bbox": {"l": 178.91229, "t": 299.14502, "r": 216.74378999999996, "b": 304.50903, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "x4", "bbox": {"l": 194.24574, "t": 282.7822, "r": 198.89099, "b": 287.84817999999996, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "CELL BBOX DECODER", "bbox": {"l": 221.45587, "t": 271.86914, "r": 276.47089, "b": 277.82916, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "Masked Multi-Head ", "bbox": {"l": 151.65219, "t": 323.44241, "r": 197.29019, "b": 329.10443, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "Attention", "bbox": {"l": 163.43277, "t": 329.44241, "r": 184.19028, "b": 335.10443, "coord_origin": "TOPLEFT"}}], "children": [{"id": 69, "label": "text", "bbox": {"l": 74.253464, "t": 258.21472000000006, "r": 101.75846, "b": 264.17474000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "Input Image", "bbox": {"l": 74.253464, "t": 258.21472000000006, "r": 101.75846, "b": 264.17474000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 122.29972, "t": 258.34520999999995, "r": 157.83972, "b": 264.30524, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "Tokenised Tags", "bbox": {"l": 122.29972, "t": 258.34520999999995, "r": 157.83972, "b": 264.30524, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 78.549347, "t": 371.38579999999996, "r": 125.68359000000001, "b": 377.04782, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "Multi-Head Attention", "bbox": {"l": 78.549347, "t": 371.38579999999996, "r": 125.68359000000001, "b": 377.04782, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 78.513298, "t": 391.31857, "r": 84.644547, "b": 396.98059, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "Add", "bbox": {"l": 78.513298, "t": 391.31857, "r": 84.644547, "b": 396.98059, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 116.52705, "t": 391.31857, "r": 125.11079999999998, "b": 396.98059, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "& Normalisation", "bbox": {"l": 116.52705, "t": 391.31857, "r": 125.11079999999998, "b": 396.98059, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 76.024773, "t": 424.45309, "r": 127.92327000000002, "b": 430.11511, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "Feed Forward Network", "bbox": {"l": 76.024773, "t": 424.45309, "r": 127.92327000000002, "b": 430.11511, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 78.382828, "t": 444.88956, "r": 84.514076, "b": 450.55157, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "Add", "bbox": {"l": 78.382828, "t": 444.88956, "r": 84.514076, "b": 450.55157, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 116.39658, "t": 444.88956, "r": 124.98033, "b": 450.55157, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "& Normalisation", "bbox": {"l": 116.39658, "t": 444.88956, "r": 124.98033, "b": 450.55157, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 167.46945, "t": 462.44324, "r": 181.6292, "b": 468.10526, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "Linear", "bbox": {"l": 167.46945, "t": 462.44324, "r": 181.6292, "b": 468.10526, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 165.61292, "t": 478.47107, "r": 184.43242, "b": 484.13309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "Softmax", "bbox": {"l": 165.61292, "t": 478.47107, "r": 184.43242, "b": 484.13309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 65.319511, "t": 324.26235999999994, "r": 132.9245, "b": 330.22235000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "CNN BACKBONE ENCODER", "bbox": {"l": 65.319511, "t": 324.26235999999994, "r": 132.9245, "b": 330.22235000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 119.51457, "t": 269.66394, "r": 162.98782, "b": 274.72992, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "[30, 1, 2, 3, 4, \u2026 3, ", "bbox": {"l": 119.51457, "t": 269.66394, "r": 162.98782, "b": 274.72992, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 128.72858, "t": 274.91394, "r": 151.41083, "b": 279.97992, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "4, 5, 8, 31]", "bbox": {"l": 128.72858, "t": 274.91394, "r": 151.41083, "b": 279.97992, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 60.434211999999995, "t": 338.95993, "r": 80.27021, "b": 344.26993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "Positional ", "bbox": {"l": 60.434211999999995, "t": 338.95993, "r": 80.27021, "b": 344.26993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 60.598457, "t": 343.38605, "r": 78.854958, "b": 348.69604, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "Encoding", "bbox": {"l": 60.598457, "t": 343.38605, "r": 78.854958, "b": 348.69604, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 134.82877, "t": 293.37762, "r": 154.66476, "b": 298.68762, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "Positional ", "bbox": {"l": 134.82877, "t": 293.37762, "r": 154.66476, "b": 298.68762, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 134.99303, "t": 297.80370999999997, "r": 153.24953, "b": 303.11371, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "Encoding", "bbox": {"l": 134.99303, "t": 297.80370999999997, "r": 153.24953, "b": 303.11371, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 150.55193, "t": 345.35861, "r": 197.14943, "b": 351.02063, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "Add & Normalisation", "bbox": {"l": 150.55193, "t": 345.35861, "r": 197.14943, "b": 351.02063, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 150.55193, "t": 394.4234, "r": 156.68318, "b": 400.08542, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "Add", "bbox": {"l": 150.55193, "t": 394.4234, "r": 156.68318, "b": 400.08542, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 188.56567, "t": 394.4234, "r": 197.14943, "b": 400.08542, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "& Normalisation", "bbox": {"l": 188.56567, "t": 394.4234, "r": 197.14943, "b": 400.08542, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 150.18539, "t": 375.66843, "r": 197.31964, "b": 381.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "Multi-Head Attention", "bbox": {"l": 150.18539, "t": 375.66843, "r": 197.31964, "b": 381.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 150.55193, "t": 440.24847000000005, "r": 156.68318, "b": 445.91049, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "Add", "bbox": {"l": 150.55193, "t": 440.24847000000005, "r": 156.68318, "b": 445.91049, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 188.56567, "t": 440.24847000000005, "r": 197.14943, "b": 445.91049, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "& Normalisation", "bbox": {"l": 188.56567, "t": 440.24847000000005, "r": 197.14943, "b": 445.91049, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 147.86377, "t": 422.09335, "r": 199.76227, "b": 427.75537, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "Feed Forward Network", "bbox": {"l": 147.86377, "t": 422.09335, "r": 199.76227, "b": 427.75537, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 241.56567000000004, "t": 314.26285000000007, "r": 255.72542, "b": 319.92487, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "Linear", "bbox": {"l": 241.56567000000004, "t": 314.26285000000007, "r": 255.72542, "b": 319.92487, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 241.91730000000004, "t": 361.36493, "r": 256.07706, "b": 367.02695, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "Linear", "bbox": {"l": 241.91730000000004, "t": 361.36493, "r": 256.07706, "b": 367.02695, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 228.054, "t": 336.61929000000003, "r": 248.72363000000004, "b": 342.28131, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "Attention", "bbox": {"l": 228.054, "t": 336.61929000000003, "r": 248.72363000000004, "b": 342.28131, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 246.2919, "t": 336.61929000000003, "r": 269.39325, "b": 342.28131, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "Network", "bbox": {"l": 246.2919, "t": 336.61929000000003, "r": 269.39325, "b": 342.28131, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 228.44568000000004, "t": 405.14682, "r": 238.73892, "b": 410.80884, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "MLP", "bbox": {"l": 228.44568000000004, "t": 405.14682, "r": 238.73892, "b": 410.80884, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 256.29767, "t": 405.2032500000001, "r": 271.77792, "b": 410.86526, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "Linear ", "bbox": {"l": 256.29767, "t": 405.2032500000001, "r": 271.77792, "b": 410.86526, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 239.54543, "t": 382.21344, "r": 258.08942, "b": 387.87546, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "Sigmoid", "bbox": {"l": 239.54543, "t": 382.21344, "r": 258.08942, "b": 387.87546, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 54.14704100000001, "t": 384.87183, "r": 59.51152, "b": 449.78326, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "Transformer Encoder Network", "bbox": {"l": 54.14704100000001, "t": 384.87183, "r": 59.51152, "b": 449.78326, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 54.235424, "t": 373.81232, "r": 59.30449699999999, "b": 378.45421999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "x2", "bbox": {"l": 54.235424, "t": 373.81232, "r": 59.30449699999999, "b": 378.45421999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 85.295891, "t": 484.53189, "r": 122.16431, "b": 490.36688, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "Encoded Output", "bbox": {"l": 85.295891, "t": 484.53189, "r": 122.16431, "b": 490.36688, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 229.66599, "t": 279.54607999999996, "r": 265.3194, "b": 285.45572000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "Encoded Output", "bbox": {"l": 229.66599, "t": 279.54607999999996, "r": 265.3194, "b": 285.45572000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 157.17369, "t": 500.3031, "r": 190.41711, "b": 506.12943, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "Predicted Tags", "bbox": {"l": 157.17369, "t": 500.3031, "r": 190.41711, "b": 506.12943, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 227.81598999999997, "t": 438.05542, "r": 270.78442, "b": 443.89206, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "Bounding Boxes & ", "bbox": {"l": 227.81598999999997, "t": 438.05542, "r": 270.78442, "b": 443.89206, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 233.70262, "t": 444.06183, "r": 263.51105, "b": 449.8904999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "Classification", "bbox": {"l": 233.70262, "t": 444.06183, "r": 263.51105, "b": 449.8904999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 184.74655, "t": 293.39502, "r": 212.16055, "b": 298.75903, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "Transformer ", "bbox": {"l": 184.74655, "t": 293.39502, "r": 212.16055, "b": 298.75903, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 178.91229, "t": 299.14502, "r": 216.74378999999996, "b": 304.50903, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "Decoder Network", "bbox": {"l": 178.91229, "t": 299.14502, "r": 216.74378999999996, "b": 304.50903, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 194.24574, "t": 282.7822, "r": 198.89099, "b": 287.84817999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": "x4", "bbox": {"l": 194.24574, "t": 282.7822, "r": 198.89099, "b": 287.84817999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 221.45587, "t": 271.86914, "r": 276.47089, "b": 277.82916, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "CELL BBOX DECODER", "bbox": {"l": 221.45587, "t": 271.86914, "r": 276.47089, "b": 277.82916, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 151.65219, "t": 323.44241, "r": 197.29019, "b": 329.10443, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "Masked Multi-Head ", "bbox": {"l": 151.65219, "t": 323.44241, "r": 197.29019, "b": 329.10443, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 163.43277, "t": 329.44241, "r": 184.19028, "b": 335.10443, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": "Attention", "bbox": {"l": 163.43277, "t": 329.44241, "r": 184.19028, "b": 335.10443, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "caption", "id": 8, "page_no": 4, "cluster": {"id": 8, "label": "caption", "bbox": {"l": 50.112, "t": 527.7828099999999, "r": 286.36597, "b": 680.27094, "coord_origin": "TOPLEFT"}, "confidence": 0.8913407325744629, "cells": [{"id": 107, "text": "Figure 4: Given an input image of a table, the", "bbox": {"l": 50.112, "t": 527.90237, "r": 229.78752, "b": 536.80893, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "Encoder", "bbox": {"l": 231.787, "t": 527.7828099999999, "r": 267.76196, "b": 536.7392, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "pro-", "bbox": {"l": 269.76401, "t": 527.90237, "r": 286.36169, "b": 536.80893, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "duces fixed-length features that represent the input image.", "bbox": {"l": 50.112015, "t": 539.85738, "r": 286.36508, "b": 548.76393, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "The features are then passed to both the", "bbox": {"l": 50.112015, "t": 551.81337, "r": 205.84735, "b": 560.71992, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "Structure Decoder", "bbox": {"l": 208.01802, "t": 551.69382, "r": 286.36392, "b": 560.6501900000001, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "and", "bbox": {"l": 50.112015, "t": 563.76837, "r": 64.498009, "b": 572.67493, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "Cell BBox Decoder", "bbox": {"l": 68.165016, "t": 563.64882, "r": 151.31288, "b": 572.60519, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": ".", "bbox": {"l": 151.31302, "t": 563.76837, "r": 153.80367, "b": 572.67493, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "During training, the", "bbox": {"l": 160.41884, "t": 563.76837, "r": 241.93283000000002, "b": 572.67493, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "Structure", "bbox": {"l": 245.59502, "t": 563.64882, "r": 286.362, "b": 572.60519, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "Decoder", "bbox": {"l": 50.112015, "t": 575.60382, "r": 85.519089, "b": 584.5602, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "receives \u2018tokenized tags\u2019 of the HTML code that", "bbox": {"l": 88.623016, "t": 575.7233699999999, "r": 286.36072, "b": 584.6299300000001, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "represent the table structure. Afterwards, a transformer en-", "bbox": {"l": 50.112015, "t": 587.6783800000001, "r": 286.36511, "b": 596.58493, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "coder and decoder architecture is employed to produce fea-", "bbox": {"l": 50.112015, "t": 599.63338, "r": 286.36508, "b": 608.53993, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "tures that are received by a linear layer, and the", "bbox": {"l": 50.112015, "t": 611.58838, "r": 240.43756000000002, "b": 620.4949300000001, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "Cell BBox", "bbox": {"l": 243.19801, "t": 611.46883, "r": 286.36597, "b": 620.4252, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "Decoder. The linear layer is applied to the features to", "bbox": {"l": 50.112015, "t": 623.42482, "r": 286.36511, "b": 632.3812, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "predict the tags. Simultaneously, the Cell BBox Decoder", "bbox": {"l": 50.112015, "t": 635.37982, "r": 286.36508, "b": 644.3362, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "selects features referring to the data cells (\u2018", "bbox": {"l": 50.112015, "t": 647.45438, "r": 220.58205, "b": 656.36093, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "<", "bbox": {"l": 220.57802000000004, "t": 647.29497, "r": 228.32693, "b": 656.14175, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "td", "bbox": {"l": 228.32700999999997, "t": 647.45438, "r": 236.07791000000003, "b": 656.36093, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": ">", "bbox": {"l": 236.07802000000004, "t": 647.29497, "r": 243.82693, "b": 656.14175, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "\u2019, \u2018", "bbox": {"l": 243.82602, "t": 647.45438, "r": 255.29298000000003, "b": 656.36093, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "<", "bbox": {"l": 255.29102000000003, "t": 647.29497, "r": 263.03992, "b": 656.14175, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "\u2019) and", "bbox": {"l": 263.04001, "t": 647.45438, "r": 286.36246, "b": 656.36093, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "passes them through an attention network, an MLP, and a", "bbox": {"l": 50.112015, "t": 659.40938, "r": 286.36511, "b": 668.31594, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "linear layer to predict the bounding boxes.", "bbox": {"l": 50.112015, "t": 671.36438, "r": 218.46996, "b": 680.27094, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 4: Given an input image of a table, the Encoder produces fixed-length features that represent the input image. The features are then passed to both the Structure Decoder and Cell BBox Decoder . During training, the Structure Decoder receives 'tokenized tags' of the HTML code that represent the table structure. Afterwards, a transformer encoder and decoder architecture is employed to produce features that are received by a linear layer, and the Cell BBox Decoder. The linear layer is applied to the features to predict the tags. Simultaneously, the Cell BBox Decoder selects features referring to the data cells (' < td > ', ' < ') and passes them through an attention network, an MLP, and a linear layer to predict the bounding boxes."}, {"label": "text", "id": 4, "page_no": 4, "cluster": {"id": 4, "label": "text", "bbox": {"l": 308.862, "t": 249.53441999999995, "r": 545.11505, "b": 294.3069499999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9831458330154419, "cells": [{"id": 135, "text": "forming classification, and adding an adaptive pooling", "bbox": {"l": 308.862, "t": 249.53441999999995, "r": 523.05786, "b": 258.44097999999997, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "layer", "bbox": {"l": 525.19983, "t": 249.53441999999995, "r": 545.11505, "b": 258.44097999999997, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "of size 28*28. ResNet by default downsamples the", "bbox": {"l": 308.862, "t": 261.49042, "r": 517.55847, "b": 270.39697, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "image", "bbox": {"l": 520.76642, "t": 261.49042, "r": 545.11499, "b": 270.39697, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "resolution by 32 and then the encoded image is provided", "bbox": {"l": 308.862, "t": 273.44537, "r": 534.80377, "b": 282.35196, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "to", "bbox": {"l": 537.36414, "t": 273.44537, "r": 545.11505, "b": 282.35196, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "both the", "bbox": {"l": 308.862, "t": 285.40039, "r": 341.24045, "b": 294.3069499999999, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "Structure Decoder", "bbox": {"l": 343.73099, "t": 285.49005, "r": 417.23508, "b": 294.07782000000003, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": ", and", "bbox": {"l": 417.23398, "t": 285.40039, "r": 436.60129, "b": 294.3069499999999, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "Cell BBox Decoder", "bbox": {"l": 439.09198, "t": 285.49005, "r": 516.56116, "b": 294.07782000000003, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": ".", "bbox": {"l": 516.56097, "t": 285.40039, "r": 519.05164, "b": 294.3069499999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "forming classification, and adding an adaptive pooling layer of size 28*28. ResNet by default downsamples the image resolution by 32 and then the encoded image is provided to both the Structure Decoder , and Cell BBox Decoder ."}, {"label": "text", "id": 1, "page_no": 4, "cluster": {"id": 1, "label": "text", "bbox": {"l": 308.86194, "t": 297.33981, "r": 545.11511, "b": 413.96182, "coord_origin": "TOPLEFT"}, "confidence": 0.9862009882926941, "cells": [{"id": 146, "text": "Structure Decoder.", "bbox": {"l": 320.81696, "t": 297.33981, "r": 400.86649, "b": 306.2962, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "The transformer architecture of", "bbox": {"l": 403.91394, "t": 297.45938, "r": 528.33685, "b": 306.36594, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "this", "bbox": {"l": 530.7179, "t": 297.45938, "r": 545.11383, "b": 306.36594, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "component is based on the work proposed in [31].", "bbox": {"l": 308.86194, "t": 309.41437, "r": 517.5285, "b": 318.32092, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "After", "bbox": {"l": 524.09387, "t": 309.41437, "r": 545.11493, "b": 318.32092, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "extensive experimentation, the", "bbox": {"l": 308.86194, "t": 321.36934999999994, "r": 432.35833999999994, "b": 330.27591, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "Structure Decoder", "bbox": {"l": 435.81995000000006, "t": 321.45901, "r": 510.29041, "b": 330.04678, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "is", "bbox": {"l": 513.97797, "t": 321.36934999999994, "r": 520.62305, "b": 330.27591, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "mod-", "bbox": {"l": 524.08008, "t": 321.36934999999994, "r": 545.11115, "b": 330.27591, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "eled as a transformer encoder with two encoder layers", "bbox": {"l": 308.86197, "t": 333.32434, "r": 527.76013, "b": 342.2309, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "and", "bbox": {"l": 530.729, "t": 333.32434, "r": 545.11499, "b": 342.2309, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "a transformer decoder made from a stack of 4 decoder", "bbox": {"l": 308.86197, "t": 345.27933, "r": 526.85352, "b": 354.18588, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "lay-", "bbox": {"l": 529.62311, "t": 345.27933, "r": 545.11493, "b": 354.18588, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "ers that comprise mainly of multi-head attention and", "bbox": {"l": 308.86197, "t": 357.23532, "r": 524.51245, "b": 366.14188, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "feed", "bbox": {"l": 527.96948, "t": 357.23532, "r": 545.11511, "b": 366.14188, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "forward layers.", "bbox": {"l": 308.86197, "t": 369.19031000000007, "r": 370.39096, "b": 378.09685999999994, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "This configuration uses fewer layers", "bbox": {"l": 377.44449, "t": 369.19031000000007, "r": 526.91339, "b": 378.09685999999994, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "and", "bbox": {"l": 530.72906, "t": 369.19031000000007, "r": 545.11505, "b": 378.09685999999994, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "heads in comparison to networks applied to other", "bbox": {"l": 308.86197, "t": 381.14529000000005, "r": 505.46395999999993, "b": 390.05185, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "problems", "bbox": {"l": 508.03430000000003, "t": 381.14529000000005, "r": 545.11511, "b": 390.05185, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "(e.g. \u201cScene Understanding\u201d, \u201cImage Captioning\u201d),", "bbox": {"l": 308.86197, "t": 393.10028, "r": 517.68799, "b": 402.00684, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "some-", "bbox": {"l": 520.76642, "t": 393.10028, "r": 545.11499, "b": 402.00684, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "thing which we relate to the simplicity of table images.", "bbox": {"l": 308.86197, "t": 405.05526999999995, "r": 528.01935, "b": 413.96182, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Structure Decoder. The transformer architecture of this component is based on the work proposed in [31]. After extensive experimentation, the Structure Decoder is modeled as a transformer encoder with two encoder layers and a transformer decoder made from a stack of 4 decoder layers that comprise mainly of multi-head attention and feed forward layers. This configuration uses fewer layers and heads in comparison to networks applied to other problems (e.g. \"Scene Understanding\", \"Image Captioning\"), something which we relate to the simplicity of table images."}, {"label": "text", "id": 3, "page_no": 4, "cluster": {"id": 3, "label": "text", "bbox": {"l": 308.86197, "t": 417.11426, "r": 545.11511, "b": 545.57271, "coord_origin": "TOPLEFT"}, "confidence": 0.9851906895637512, "cells": [{"id": 169, "text": "The transformer encoder receives an encoded", "bbox": {"l": 320.81696, "t": 417.11426, "r": 515.49609, "b": 426.02081, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "image", "bbox": {"l": 520.7663, "t": 417.11426, "r": 545.11487, "b": 426.02081, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "from the", "bbox": {"l": 308.86197, "t": 429.0692399999999, "r": 343.72107, "b": 437.9758, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "CNN Backbone Network", "bbox": {"l": 347.03796, "t": 429.15891, "r": 446.45471000000003, "b": 437.74667, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "and refines it", "bbox": {"l": 449.93996999999996, "t": 429.0692399999999, "r": 503.06055000000003, "b": 437.9758, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "through", "bbox": {"l": 506.37808, "t": 429.0692399999999, "r": 537.3717, "b": 437.9758, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "a", "bbox": {"l": 540.68927, "t": 429.0692399999999, "r": 545.11267, "b": 437.9758, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "multi-head dot-product attention layer, followed by a", "bbox": {"l": 308.86197, "t": 441.02423, "r": 522.78894, "b": 449.93079, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "Feed", "bbox": {"l": 525.7478, "t": 441.02423, "r": 545.11511, "b": 449.93079, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "Forward Network.", "bbox": {"l": 308.86197, "t": 452.97922, "r": 384.14929, "b": 461.88577, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "During training, the transformer", "bbox": {"l": 393.37466, "t": 452.97922, "r": 527.84985, "b": 461.88577, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "de-", "bbox": {"l": 532.39282, "t": 452.97922, "r": 545.11505, "b": 461.88577, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "coder receives as input the output feature produced by", "bbox": {"l": 308.86197, "t": 464.93521, "r": 529.7627, "b": 473.84177, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "the", "bbox": {"l": 532.94073, "t": 464.93521, "r": 545.11505, "b": 473.84177, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "transformer encoder, and the tokenized input of the", "bbox": {"l": 308.86197, "t": 476.8902, "r": 514.17126, "b": 485.79675, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "HTML", "bbox": {"l": 516.89105, "t": 476.8902, "r": 545.11511, "b": 485.79675, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": "ground-truth tags. Using a stack of multi-head attention", "bbox": {"l": 308.86197, "t": 488.84518, "r": 527.63068, "b": 497.75174, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "lay-", "bbox": {"l": 529.62317, "t": 488.84518, "r": 545.11499, "b": 497.75174, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "ers, different aspects of the tag sequence could be", "bbox": {"l": 308.86197, "t": 500.80017, "r": 508.3630999999999, "b": 509.70673, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": "inferred.", "bbox": {"l": 511.09286000000003, "t": 500.80017, "r": 545.11511, "b": 509.70673, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "This is achieved by each attention head on a layer operating", "bbox": {"l": 308.86197, "t": 512.7551599999999, "r": 545.11499, "b": 521.6617100000001, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "in a different subspace, and then combining altogether their", "bbox": {"l": 308.86197, "t": 524.71115, "r": 545.11511, "b": 533.61771, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "attention score.", "bbox": {"l": 308.86197, "t": 536.66615, "r": 369.73349, "b": 545.57271, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The transformer encoder receives an encoded image from the CNN Backbone Network and refines it through a multi-head dot-product attention layer, followed by a Feed Forward Network. During training, the transformer decoder receives as input the output feature produced by the transformer encoder, and the tokenized input of the HTML ground-truth tags. Using a stack of multi-head attention layers, different aspects of the tag sequence could be inferred. This is achieved by each attention head on a layer operating in a different subspace, and then combining altogether their attention score."}, {"label": "text", "id": 0, "page_no": 4, "cluster": {"id": 0, "label": "text", "bbox": {"l": 308.86194, "t": 548.6046, "r": 545.11511, "b": 653.27271, "coord_origin": "TOPLEFT"}, "confidence": 0.9869195818901062, "cells": [{"id": 192, "text": "Cell BBox Decoder.", "bbox": {"l": 320.81696, "t": 548.6046, "r": 404.76184, "b": 557.56097, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "Our architecture allows to simul-", "bbox": {"l": 410.34094, "t": 548.72415, "r": 545.11505, "b": 557.63071, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "taneously predict HTML tags and bounding boxes for each", "bbox": {"l": 308.86194, "t": 560.68015, "r": 545.11493, "b": 569.5867000000001, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "table cell without the need of a separate object detector end", "bbox": {"l": 308.86194, "t": 572.6351500000001, "r": 545.11511, "b": 581.5417, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "to end. This approach is inspired by DETR [1] which em-", "bbox": {"l": 308.86194, "t": 584.59015, "r": 545.11493, "b": 593.4967, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "ploys a Transformer Encoder, and Decoder that looks for", "bbox": {"l": 308.86194, "t": 596.54515, "r": 545.11499, "b": 605.45171, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "a specific number of object queries (potential object detec-", "bbox": {"l": 308.86194, "t": 608.50015, "r": 545.11505, "b": 617.40671, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "tions). As our model utilizes a transformer architecture, the", "bbox": {"l": 308.86194, "t": 620.45515, "r": 545.11505, "b": 629.36171, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "hidden state of the", "bbox": {"l": 308.86194, "t": 632.41115, "r": 381.67859, "b": 641.3177000000001, "coord_origin": "TOPLEFT"}}, {"id": 201, "text": "<", "bbox": {"l": 383.99695, "t": 632.25174, "r": 391.74585, "b": 641.09853, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": "td", "bbox": {"l": 391.74594, "t": 632.41115, "r": 399.49686, "b": 641.3177000000001, "coord_origin": "TOPLEFT"}}, {"id": 203, "text": ">", "bbox": {"l": 399.49695, "t": 632.25174, "r": 407.24585, "b": 641.09853, "coord_origin": "TOPLEFT"}}, {"id": 204, "text": "\u2019 and \u2018", "bbox": {"l": 407.24594, "t": 632.41115, "r": 432.90958, "b": 641.3177000000001, "coord_origin": "TOPLEFT"}}, {"id": 205, "text": "<", "bbox": {"l": 432.90792999999996, "t": 632.25174, "r": 440.65683000000007, "b": 641.09853, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": "\u2019 HTML structure tags be-", "bbox": {"l": 440.65691999999996, "t": 632.41115, "r": 545.11475, "b": 641.3177000000001, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": "come the object query.", "bbox": {"l": 308.86194, "t": 644.3661500000001, "r": 398.96371, "b": 653.27271, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Cell BBox Decoder. Our architecture allows to simultaneously predict HTML tags and bounding boxes for each table cell without the need of a separate object detector end to end. This approach is inspired by DETR [1] which employs a Transformer Encoder, and Decoder that looks for a specific number of object queries (potential object detections). As our model utilizes a transformer architecture, the hidden state of the < td > ' and ' < ' HTML structure tags become the object query."}, {"label": "text", "id": 2, "page_no": 4, "cluster": {"id": 2, "label": "text", "bbox": {"l": 308.86194, "t": 656.42516, "r": 545.11505, "b": 713.151726, "coord_origin": "TOPLEFT"}, "confidence": 0.9852352142333984, "cells": [{"id": 208, "text": "The encoding generated by the", "bbox": {"l": 320.81693, "t": 656.42516, "r": 444.34316999999993, "b": 665.33172, "coord_origin": "TOPLEFT"}}, {"id": 209, "text": "CNN Backbone Network", "bbox": {"l": 447.00591999999995, "t": 656.51482, "r": 545.1076, "b": 665.10258, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": "along with the features acquired for every data cell from the", "bbox": {"l": 308.86194, "t": 668.38016, "r": 545.11505, "b": 677.2867200000001, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "Transformer Decoder are then passed to the attention net-", "bbox": {"l": 308.86194, "t": 680.33516, "r": 545.11505, "b": 689.24172, "coord_origin": "TOPLEFT"}}, {"id": 212, "text": "work. The attention network takes both inputs and learns to", "bbox": {"l": 308.86194, "t": 692.290161, "r": 545.11505, "b": 701.196724, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "provide an attention weighted encoding. This weighted at-", "bbox": {"l": 308.86194, "t": 704.245163, "r": 545.11505, "b": 713.151726, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The encoding generated by the CNN Backbone Network along with the features acquired for every data cell from the Transformer Decoder are then passed to the attention network. The attention network takes both inputs and learns to provide an attention weighted encoding. This weighted at-"}, {"label": "page_footer", "id": 9, "page_no": 4, "cluster": {"id": 9, "label": "page_footer", "bbox": {"l": 295.12094, "t": 734.13316, "r": 300.10223, "b": 743.039722, "coord_origin": "TOPLEFT"}, "confidence": 0.8719564080238342, "cells": [{"id": 214, "text": "5", "bbox": {"l": 295.12094, "t": 734.13316, "r": 300.10223, "b": 743.039722, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5"}], "body": [{"label": "picture", "id": 7, "page_no": 4, "cluster": {"id": 7, "label": "picture", "bbox": {"l": 74.30525970458984, "t": 77.91120147705078, "r": 519.9801025390625, "b": 183.70150756835938, "coord_origin": "TOPLEFT"}, "confidence": 0.9296807646751404, "cells": [{"id": 0, "text": "1.", "bbox": {"l": 81.688072, "t": 122.43970000000002, "r": 84.927567, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Item", "bbox": {"l": 86.54731, "t": 122.43970000000002, "r": 93.026291, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Amount", "bbox": {"l": 102.50498, "t": 115.25214000000005, "r": 115.3461, "b": 118.44135000000006, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Names", "bbox": {"l": 82.140205, "t": 115.21489999999994, "r": 93.291527, "b": 118.40410999999995, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "1000", "bbox": {"l": 96.748268, "t": 122.43970000000002, "r": 104.3119, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "500", "bbox": {"l": 96.748268, "t": 127.74370999999985, "r": 102.42083, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "3500", "bbox": {"l": 96.748268, "t": 133.45569, "r": 104.3119, "b": 136.6449, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "150", "bbox": {"l": 96.748268, "t": 139.16772000000003, "r": 102.42083, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "unit", "bbox": {"l": 110.66107, "t": 122.43970000000002, "r": 116.14391, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "unit", "bbox": {"l": 110.66107, "t": 127.74370999999985, "r": 116.14391, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "unit", "bbox": {"l": 110.66107, "t": 133.45569, "r": 116.14391, "b": 136.6449, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "unit", "bbox": {"l": 110.66107, "t": 139.16772000000003, "r": 116.14391, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "2.", "bbox": {"l": 81.688072, "t": 127.74370999999985, "r": 84.927567, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Item", "bbox": {"l": 86.54731, "t": 127.74370999999985, "r": 93.026291, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "3.", "bbox": {"l": 81.688072, "t": 133.45569, "r": 84.927567, "b": 136.6449, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Item", "bbox": {"l": 86.54731, "t": 133.45569, "r": 93.026291, "b": 136.6449, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "4.", "bbox": {"l": 81.688072, "t": 139.16772000000003, "r": 84.927567, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "Item", "bbox": {"l": 86.54731, "t": 139.16772000000003, "r": 93.026291, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Extracted", "bbox": {"l": 88.084389, "t": 90.49738000000002, "r": 113.93649, "b": 96.23798, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Table Images", "bbox": {"l": 82.81002, "t": 97.63738999999998, "r": 119.21240000000002, "b": 103.37798999999995, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Standardized", "bbox": {"l": 143.94247, "t": 100.60235999999998, "r": 180.01131, "b": 106.34295999999995, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Images", "bbox": {"l": 151.94064, "t": 107.74237000000005, "r": 172.0118, "b": 113.48297000000014, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "BBox", "bbox": {"l": 251.76939000000002, "t": 80.93096999999989, "r": 266.39557, "b": 86.67156999999997, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Decoder", "bbox": {"l": 247.51601, "t": 86.03101000000004, "r": 270.65021, "b": 91.77161000000001, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "BBoxes", "bbox": {"l": 331.03699, "t": 78.55980999999997, "r": 352.12589, "b": 84.30042000000003, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "BBoxes can be", "bbox": {"l": 390.56421, "t": 96.03223000000003, "r": 431.7261, "b": 101.77282999999989, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "traced back to the", "bbox": {"l": 386.82422, "t": 102.15228000000013, "r": 435.46966999999995, "b": 107.89287999999999, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "original image to", "bbox": {"l": 388.69589, "t": 108.27228000000002, "r": 433.6032400000001, "b": 114.01288000000011, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "extract content", "bbox": {"l": 391.07761, "t": 114.39227000000005, "r": 431.22542999999996, "b": 120.13286999999991, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Structure Tags sequence", "bbox": {"l": 431.22650000000004, "t": 151.68511999999998, "r": 498.82068, "b": 157.42571999999996, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "provide full description of", "bbox": {"l": 431.1738, "t": 157.80517999999995, "r": 498.87753000000004, "b": 163.54578000000004, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "the table structure", "bbox": {"l": 440.5289, "t": 163.92516999999998, "r": 489.51827999999995, "b": 169.66576999999995, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Structure Tags", "bbox": {"l": 328.37479, "t": 178.25385000000006, "r": 367.72333, "b": 183.99445000000003, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "BBoxes in sync", "bbox": {"l": 331.84451, "t": 123.90886999999998, "r": 373.67963, "b": 129.64948000000015, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "with tag sequence", "bbox": {"l": 331.84451, "t": 129.00885000000017, "r": 381.17786, "b": 134.74945000000002, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "Encoder", "bbox": {"l": 196.62633, "t": 88.11621000000002, "r": 219.42332, "b": 93.85681, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Structure", "bbox": {"l": 246.66771, "t": 129.4946900000001, "r": 271.49899, "b": 135.23528999999996, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "Decoder", "bbox": {"l": 247.51601, "t": 134.59473000000003, "r": 270.65021, "b": 140.33533, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "[x1, y2, x2, y2]", "bbox": {"l": 330.63071, "t": 89.01923, "r": 365.55347, "b": 94.75982999999997, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "[x1', y2', x2', y2']", "bbox": {"l": 330.63071, "t": 97.17926, "r": 370.22717, "b": 102.91985999999997, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "[x1'', y2'', x2'', y2'']", "bbox": {"l": 330.63071, "t": 105.33922999999993, "r": 374.51157, "b": 111.07983000000002, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "...", "bbox": {"l": 330.63071, "t": 113.49926999999991, "r": 335.73233, "b": 119.23987, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "<TR>", "bbox": {"l": 322.30579, "t": 141.79236000000003, "r": 335.05988, "b": 146.57617000000005, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "<TD>", "bbox": {"l": 322.30579, "t": 148.93231000000003, "r": 335.05988, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "1", "bbox": {"l": 337.54971, "t": 148.55579, "r": 340.95242, "b": 154.29638999999997, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "</TD><TD colspan=\"2\">", "bbox": {"l": 343.56262, "t": 148.93231000000003, "r": 398.91446, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "</TD>", "bbox": {"l": 407.41718, "t": 148.93231000000003, "r": 421.58801, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "</TR><TR>", "bbox": {"l": 322.30579, "t": 156.07232999999997, "r": 349.23022, "b": 160.85613999999998, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "<TD>", "bbox": {"l": 322.30579, "t": 163.21234000000004, "r": 335.05988, "b": 167.99614999999994, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "</TD><TD>...", "bbox": {"l": 343.56155, "t": 163.21234000000004, "r": 374.73685, "b": 167.99614999999994, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "...", "bbox": {"l": 322.30579, "t": 170.35235999999998, "r": 326.55716, "b": 175.13617, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "1", "bbox": {"l": 323.51111, "t": 89.66967999999997, "r": 326.91382, "b": 95.41027999999994, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "2", "bbox": {"l": 323.71509, "t": 97.78887999999995, "r": 327.1178, "b": 103.52948000000004, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "3", "bbox": {"l": 323.71509, "t": 105.98969, "r": 327.1178, "b": 111.73029000000008, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "2", "bbox": {"l": 401.4816, "t": 148.54625999999996, "r": 404.88431, "b": 154.28687000000002, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "3", "bbox": {"l": 337.6976, "t": 162.68451000000005, "r": 341.10031, "b": 168.42511000000002, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "3", "bbox": {"l": 454.46378, "t": 104.54584, "r": 457.86648999999994, "b": 110.28644000000008, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "2", "bbox": {"l": 493.32580999999993, "t": 91.09546, "r": 496.72852, "b": 96.83605999999997, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "1", "bbox": {"l": 454.08298, "t": 90.56879000000015, "r": 457.48569000000003, "b": 96.30939000000001, "coord_origin": "TOPLEFT"}}], "children": [{"id": 10, "label": "text", "bbox": {"l": 81.688072, "t": 122.43970000000002, "r": 84.927567, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 0, "text": "1.", "bbox": {"l": 81.688072, "t": 122.43970000000002, "r": 84.927567, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 86.54731, "t": 122.43970000000002, "r": 93.026291, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 1, "text": "Item", "bbox": {"l": 86.54731, "t": 122.43970000000002, "r": 93.026291, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 102.50498, "t": 115.25214000000005, "r": 115.3461, "b": 118.44135000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 2, "text": "Amount", "bbox": {"l": 102.50498, "t": 115.25214000000005, "r": 115.3461, "b": 118.44135000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 82.140205, "t": 115.21489999999994, "r": 93.291527, "b": 118.40410999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 3, "text": "Names", "bbox": {"l": 82.140205, "t": 115.21489999999994, "r": 93.291527, "b": 118.40410999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 96.748268, "t": 122.43970000000002, "r": 104.3119, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 4, "text": "1000", "bbox": {"l": 96.748268, "t": 122.43970000000002, "r": 104.3119, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 96.748268, "t": 127.74370999999985, "r": 102.42083, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 5, "text": "500", "bbox": {"l": 96.748268, "t": 127.74370999999985, "r": 102.42083, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 96.748268, "t": 133.45569, "r": 104.3119, "b": 136.6449, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": "3500", "bbox": {"l": 96.748268, "t": 133.45569, "r": 104.3119, "b": 136.6449, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 96.748268, "t": 139.16772000000003, "r": 102.42083, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "150", "bbox": {"l": 96.748268, "t": 139.16772000000003, "r": 102.42083, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 110.66107, "t": 122.43970000000002, "r": 116.14391, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "unit", "bbox": {"l": 110.66107, "t": 122.43970000000002, "r": 116.14391, "b": 125.62891000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 110.66107, "t": 127.74370999999985, "r": 116.14391, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "unit", "bbox": {"l": 110.66107, "t": 127.74370999999985, "r": 116.14391, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 110.66107, "t": 133.45569, "r": 116.14391, "b": 136.6449, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "unit", "bbox": {"l": 110.66107, "t": 133.45569, "r": 116.14391, "b": 136.6449, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 110.66107, "t": 139.16772000000003, "r": 116.14391, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "unit", "bbox": {"l": 110.66107, "t": 139.16772000000003, "r": 116.14391, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 81.688072, "t": 127.74370999999985, "r": 84.927567, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "2.", "bbox": {"l": 81.688072, "t": 127.74370999999985, "r": 84.927567, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 86.54731, "t": 127.74370999999985, "r": 93.026291, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "Item", "bbox": {"l": 86.54731, "t": 127.74370999999985, "r": 93.026291, "b": 130.93291999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 81.688072, "t": 133.45569, "r": 84.927567, "b": 136.6449, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "3.", "bbox": {"l": 81.688072, "t": 133.45569, "r": 84.927567, "b": 136.6449, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 86.54731, "t": 133.45569, "r": 93.026291, "b": 136.6449, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "Item", "bbox": {"l": 86.54731, "t": 133.45569, "r": 93.026291, "b": 136.6449, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 81.688072, "t": 139.16772000000003, "r": 84.927567, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "4.", "bbox": {"l": 81.688072, "t": 139.16772000000003, "r": 84.927567, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 86.54731, "t": 139.16772000000003, "r": 93.026291, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "Item", "bbox": {"l": 86.54731, "t": 139.16772000000003, "r": 93.026291, "b": 142.35693000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 88.084389, "t": 90.49738000000002, "r": 113.93649, "b": 96.23798, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "Extracted", "bbox": {"l": 88.084389, "t": 90.49738000000002, "r": 113.93649, "b": 96.23798, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 82.81002, "t": 97.63738999999998, "r": 119.21240000000002, "b": 103.37798999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "Table Images", "bbox": {"l": 82.81002, "t": 97.63738999999998, "r": 119.21240000000002, "b": 103.37798999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 143.94247, "t": 100.60235999999998, "r": 180.01131, "b": 106.34295999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "Standardized", "bbox": {"l": 143.94247, "t": 100.60235999999998, "r": 180.01131, "b": 106.34295999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 151.94064, "t": 107.74237000000005, "r": 172.0118, "b": 113.48297000000014, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "Images", "bbox": {"l": 151.94064, "t": 107.74237000000005, "r": 172.0118, "b": 113.48297000000014, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 251.76939000000002, "t": 80.93096999999989, "r": 266.39557, "b": 86.67156999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "BBox", "bbox": {"l": 251.76939000000002, "t": 80.93096999999989, "r": 266.39557, "b": 86.67156999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 247.51601, "t": 86.03101000000004, "r": 270.65021, "b": 91.77161000000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "Decoder", "bbox": {"l": 247.51601, "t": 86.03101000000004, "r": 270.65021, "b": 91.77161000000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 331.03699, "t": 78.55980999999997, "r": 352.12589, "b": 84.30042000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "BBoxes", "bbox": {"l": 331.03699, "t": 78.55980999999997, "r": 352.12589, "b": 84.30042000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 390.56421, "t": 96.03223000000003, "r": 431.7261, "b": 101.77282999999989, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "BBoxes can be", "bbox": {"l": 390.56421, "t": 96.03223000000003, "r": 431.7261, "b": 101.77282999999989, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 386.82422, "t": 102.15228000000013, "r": 435.46966999999995, "b": 107.89287999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "traced back to the", "bbox": {"l": 386.82422, "t": 102.15228000000013, "r": 435.46966999999995, "b": 107.89287999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 388.69589, "t": 108.27228000000002, "r": 433.6032400000001, "b": 114.01288000000011, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "original image to", "bbox": {"l": 388.69589, "t": 108.27228000000002, "r": 433.6032400000001, "b": 114.01288000000011, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 391.07761, "t": 114.39227000000005, "r": 431.22542999999996, "b": 120.13286999999991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "extract content", "bbox": {"l": 391.07761, "t": 114.39227000000005, "r": 431.22542999999996, "b": 120.13286999999991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 431.22650000000004, "t": 151.68511999999998, "r": 498.82068, "b": 157.42571999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "Structure Tags sequence", "bbox": {"l": 431.22650000000004, "t": 151.68511999999998, "r": 498.82068, "b": 157.42571999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 431.1738, "t": 157.80517999999995, "r": 498.87753000000004, "b": 163.54578000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "provide full description of", "bbox": {"l": 431.1738, "t": 157.80517999999995, "r": 498.87753000000004, "b": 163.54578000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 440.5289, "t": 163.92516999999998, "r": 489.51827999999995, "b": 169.66576999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "the table structure", "bbox": {"l": 440.5289, "t": 163.92516999999998, "r": 489.51827999999995, "b": 169.66576999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 328.37479, "t": 178.25385000000006, "r": 367.72333, "b": 183.99445000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "Structure Tags", "bbox": {"l": 328.37479, "t": 178.25385000000006, "r": 367.72333, "b": 183.99445000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 331.84451, "t": 123.90886999999998, "r": 373.67963, "b": 129.64948000000015, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "BBoxes in sync", "bbox": {"l": 331.84451, "t": 123.90886999999998, "r": 373.67963, "b": 129.64948000000015, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 331.84451, "t": 129.00885000000017, "r": 381.17786, "b": 134.74945000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "with tag sequence", "bbox": {"l": 331.84451, "t": 129.00885000000017, "r": 381.17786, "b": 134.74945000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 196.62633, "t": 88.11621000000002, "r": 219.42332, "b": 93.85681, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "Encoder", "bbox": {"l": 196.62633, "t": 88.11621000000002, "r": 219.42332, "b": 93.85681, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 246.66771, "t": 129.4946900000001, "r": 271.49899, "b": 135.23528999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "Structure", "bbox": {"l": 246.66771, "t": 129.4946900000001, "r": 271.49899, "b": 135.23528999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 247.51601, "t": 134.59473000000003, "r": 270.65021, "b": 140.33533, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "Decoder", "bbox": {"l": 247.51601, "t": 134.59473000000003, "r": 270.65021, "b": 140.33533, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 330.63071, "t": 89.01923, "r": 365.55347, "b": 94.75982999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "[x1, y2, x2, y2]", "bbox": {"l": 330.63071, "t": 89.01923, "r": 365.55347, "b": 94.75982999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 330.63071, "t": 97.17926, "r": 370.22717, "b": 102.91985999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "[x1', y2', x2', y2']", "bbox": {"l": 330.63071, "t": 97.17926, "r": 370.22717, "b": 102.91985999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 330.63071, "t": 105.33922999999993, "r": 374.51157, "b": 111.07983000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "[x1'', y2'', x2'', y2'']", "bbox": {"l": 330.63071, "t": 105.33922999999993, "r": 374.51157, "b": 111.07983000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 330.63071, "t": 113.49926999999991, "r": 335.73233, "b": 119.23987, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "...", "bbox": {"l": 330.63071, "t": 113.49926999999991, "r": 335.73233, "b": 119.23987, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 322.30579, "t": 141.79236000000003, "r": 335.05988, "b": 146.57617000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "<TR>", "bbox": {"l": 322.30579, "t": 141.79236000000003, "r": 335.05988, "b": 146.57617000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 322.30579, "t": 148.93231000000003, "r": 335.05988, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "<TD>", "bbox": {"l": 322.30579, "t": 148.93231000000003, "r": 335.05988, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 337.54971, "t": 148.55579, "r": 340.95242, "b": 154.29638999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "1", "bbox": {"l": 337.54971, "t": 148.55579, "r": 340.95242, "b": 154.29638999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 343.56262, "t": 148.93231000000003, "r": 398.91446, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "</TD><TD colspan=\"2\">", "bbox": {"l": 343.56262, "t": 148.93231000000003, "r": 398.91446, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 407.41718, "t": 148.93231000000003, "r": 421.58801, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "</TD>", "bbox": {"l": 407.41718, "t": 148.93231000000003, "r": 421.58801, "b": 153.71613000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 322.30579, "t": 156.07232999999997, "r": 349.23022, "b": 160.85613999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "</TR><TR>", "bbox": {"l": 322.30579, "t": 156.07232999999997, "r": 349.23022, "b": 160.85613999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 322.30579, "t": 163.21234000000004, "r": 335.05988, "b": 167.99614999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "<TD>", "bbox": {"l": 322.30579, "t": 163.21234000000004, "r": 335.05988, "b": 167.99614999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 343.56155, "t": 163.21234000000004, "r": 374.73685, "b": 167.99614999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "</TD><TD>...", "bbox": {"l": 343.56155, "t": 163.21234000000004, "r": 374.73685, "b": 167.99614999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 322.30579, "t": 170.35235999999998, "r": 326.55716, "b": 175.13617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "...", "bbox": {"l": 322.30579, "t": 170.35235999999998, "r": 326.55716, "b": 175.13617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 323.51111, "t": 89.66967999999997, "r": 326.91382, "b": 95.41027999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "1", "bbox": {"l": 323.51111, "t": 89.66967999999997, "r": 326.91382, "b": 95.41027999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 323.71509, "t": 97.78887999999995, "r": 327.1178, "b": 103.52948000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "2", "bbox": {"l": 323.71509, "t": 97.78887999999995, "r": 327.1178, "b": 103.52948000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 323.71509, "t": 105.98969, "r": 327.1178, "b": 111.73029000000008, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "3", "bbox": {"l": 323.71509, "t": 105.98969, "r": 327.1178, "b": 111.73029000000008, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 401.4816, "t": 148.54625999999996, "r": 404.88431, "b": 154.28687000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "2", "bbox": {"l": 401.4816, "t": 148.54625999999996, "r": 404.88431, "b": 154.28687000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 337.6976, "t": 162.68451000000005, "r": 341.10031, "b": 168.42511000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "3", "bbox": {"l": 337.6976, "t": 162.68451000000005, "r": 341.10031, "b": 168.42511000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 454.46378, "t": 104.54584, "r": 457.86648999999994, "b": 110.28644000000008, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "3", "bbox": {"l": 454.46378, "t": 104.54584, "r": 457.86648999999994, "b": 110.28644000000008, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 493.32580999999993, "t": 91.09546, "r": 496.72852, "b": 96.83605999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "2", "bbox": {"l": 493.32580999999993, "t": 91.09546, "r": 496.72852, "b": 96.83605999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 454.08298, "t": 90.56879000000015, "r": 457.48569000000003, "b": 96.30939000000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "1", "bbox": {"l": 454.08298, "t": 90.56879000000015, "r": 457.48569000000003, "b": 96.30939000000001, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "caption", "id": 6, "page_no": 4, "cluster": {"id": 6, "label": "caption", "bbox": {"l": 50.111992, "t": 203.98577999999998, "r": 545.10846, "b": 224.96691999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9677652716636658, "cells": [{"id": 59, "text": "Figure 3:", "bbox": {"l": 50.112, "t": 204.10535000000004, "r": 86.883949, "b": 213.01189999999997, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "TableFormer", "bbox": {"l": 94.020996, "t": 203.98577999999998, "r": 149.85141, "b": 212.94214, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "takes in an image of the PDF and creates bounding box and HTML structure predictions that are", "bbox": {"l": 152.86099, "t": 204.10535000000004, "r": 545.10846, "b": 213.01189999999997, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "synchronized. The bounding boxes grabs the content from the PDF and inserts it in the structure.", "bbox": {"l": 50.111992, "t": 216.06035999999995, "r": 436.0134, "b": 224.96691999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 3: TableFormer takes in an image of the PDF and creates bounding box and HTML structure predictions that are synchronized. The bounding boxes grabs the content from the PDF and inserts it in the structure."}, {"label": "picture", "id": 5, "page_no": 4, "cluster": {"id": 5, "label": "picture", "bbox": {"l": 53.03328323364258, "t": 257.66534423828125, "r": 285.3731689453125, "b": 507.6688537597656, "coord_origin": "TOPLEFT"}, "confidence": 0.9724942445755005, "cells": [{"id": 63, "text": "Input Image", "bbox": {"l": 74.253464, "t": 258.21472000000006, "r": 101.75846, "b": 264.17474000000004, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "Tokenised Tags", "bbox": {"l": 122.29972, "t": 258.34520999999995, "r": 157.83972, "b": 264.30524, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "Multi-Head Attention", "bbox": {"l": 78.549347, "t": 371.38579999999996, "r": 125.68359000000001, "b": 377.04782, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "Add", "bbox": {"l": 78.513298, "t": 391.31857, "r": 84.644547, "b": 396.98059, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "& Normalisation", "bbox": {"l": 116.52705, "t": 391.31857, "r": 125.11079999999998, "b": 396.98059, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "Feed Forward Network", "bbox": {"l": 76.024773, "t": 424.45309, "r": 127.92327000000002, "b": 430.11511, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "Add", "bbox": {"l": 78.382828, "t": 444.88956, "r": 84.514076, "b": 450.55157, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "& Normalisation", "bbox": {"l": 116.39658, "t": 444.88956, "r": 124.98033, "b": 450.55157, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Linear", "bbox": {"l": 167.46945, "t": 462.44324, "r": 181.6292, "b": 468.10526, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "Softmax", "bbox": {"l": 165.61292, "t": 478.47107, "r": 184.43242, "b": 484.13309, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "CNN BACKBONE ENCODER", "bbox": {"l": 65.319511, "t": 324.26235999999994, "r": 132.9245, "b": 330.22235000000006, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "[30, 1, 2, 3, 4, \u2026 3, ", "bbox": {"l": 119.51457, "t": 269.66394, "r": 162.98782, "b": 274.72992, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "4, 5, 8, 31]", "bbox": {"l": 128.72858, "t": 274.91394, "r": 151.41083, "b": 279.97992, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "Positional ", "bbox": {"l": 60.434211999999995, "t": 338.95993, "r": 80.27021, "b": 344.26993, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "Encoding", "bbox": {"l": 60.598457, "t": 343.38605, "r": 78.854958, "b": 348.69604, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "Positional ", "bbox": {"l": 134.82877, "t": 293.37762, "r": 154.66476, "b": 298.68762, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "Encoding", "bbox": {"l": 134.99303, "t": 297.80370999999997, "r": 153.24953, "b": 303.11371, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "Add & Normalisation", "bbox": {"l": 150.55193, "t": 345.35861, "r": 197.14943, "b": 351.02063, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Add", "bbox": {"l": 150.55193, "t": 394.4234, "r": 156.68318, "b": 400.08542, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "& Normalisation", "bbox": {"l": 188.56567, "t": 394.4234, "r": 197.14943, "b": 400.08542, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "Multi-Head Attention", "bbox": {"l": 150.18539, "t": 375.66843, "r": 197.31964, "b": 381.33044, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "Add", "bbox": {"l": 150.55193, "t": 440.24847000000005, "r": 156.68318, "b": 445.91049, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "& Normalisation", "bbox": {"l": 188.56567, "t": 440.24847000000005, "r": 197.14943, "b": 445.91049, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Feed Forward Network", "bbox": {"l": 147.86377, "t": 422.09335, "r": 199.76227, "b": 427.75537, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Linear", "bbox": {"l": 241.56567000000004, "t": 314.26285000000007, "r": 255.72542, "b": 319.92487, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "Linear", "bbox": {"l": 241.91730000000004, "t": 361.36493, "r": 256.07706, "b": 367.02695, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "Attention", "bbox": {"l": 228.054, "t": 336.61929000000003, "r": 248.72363000000004, "b": 342.28131, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "Network", "bbox": {"l": 246.2919, "t": 336.61929000000003, "r": 269.39325, "b": 342.28131, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "MLP", "bbox": {"l": 228.44568000000004, "t": 405.14682, "r": 238.73892, "b": 410.80884, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Linear ", "bbox": {"l": 256.29767, "t": 405.2032500000001, "r": 271.77792, "b": 410.86526, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "Sigmoid", "bbox": {"l": 239.54543, "t": 382.21344, "r": 258.08942, "b": 387.87546, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "Transformer Encoder Network", "bbox": {"l": 54.14704100000001, "t": 384.87183, "r": 59.51152, "b": 449.78326, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "x2", "bbox": {"l": 54.235424, "t": 373.81232, "r": 59.30449699999999, "b": 378.45421999999996, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "Encoded Output", "bbox": {"l": 85.295891, "t": 484.53189, "r": 122.16431, "b": 490.36688, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "Encoded Output", "bbox": {"l": 229.66599, "t": 279.54607999999996, "r": 265.3194, "b": 285.45572000000004, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "Predicted Tags", "bbox": {"l": 157.17369, "t": 500.3031, "r": 190.41711, "b": 506.12943, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "Bounding Boxes & ", "bbox": {"l": 227.81598999999997, "t": 438.05542, "r": 270.78442, "b": 443.89206, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "Classification", "bbox": {"l": 233.70262, "t": 444.06183, "r": 263.51105, "b": 449.8904999999999, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "Transformer ", "bbox": {"l": 184.74655, "t": 293.39502, "r": 212.16055, "b": 298.75903, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "Decoder Network", "bbox": {"l": 178.91229, "t": 299.14502, "r": 216.74378999999996, "b": 304.50903, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "x4", "bbox": {"l": 194.24574, "t": 282.7822, "r": 198.89099, "b": 287.84817999999996, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "CELL BBOX DECODER", "bbox": {"l": 221.45587, "t": 271.86914, "r": 276.47089, "b": 277.82916, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "Masked Multi-Head ", "bbox": {"l": 151.65219, "t": 323.44241, "r": 197.29019, "b": 329.10443, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "Attention", "bbox": {"l": 163.43277, "t": 329.44241, "r": 184.19028, "b": 335.10443, "coord_origin": "TOPLEFT"}}], "children": [{"id": 69, "label": "text", "bbox": {"l": 74.253464, "t": 258.21472000000006, "r": 101.75846, "b": 264.17474000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "Input Image", "bbox": {"l": 74.253464, "t": 258.21472000000006, "r": 101.75846, "b": 264.17474000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 122.29972, "t": 258.34520999999995, "r": 157.83972, "b": 264.30524, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "Tokenised Tags", "bbox": {"l": 122.29972, "t": 258.34520999999995, "r": 157.83972, "b": 264.30524, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 78.549347, "t": 371.38579999999996, "r": 125.68359000000001, "b": 377.04782, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "Multi-Head Attention", "bbox": {"l": 78.549347, "t": 371.38579999999996, "r": 125.68359000000001, "b": 377.04782, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 78.513298, "t": 391.31857, "r": 84.644547, "b": 396.98059, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "Add", "bbox": {"l": 78.513298, "t": 391.31857, "r": 84.644547, "b": 396.98059, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 116.52705, "t": 391.31857, "r": 125.11079999999998, "b": 396.98059, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "& Normalisation", "bbox": {"l": 116.52705, "t": 391.31857, "r": 125.11079999999998, "b": 396.98059, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 76.024773, "t": 424.45309, "r": 127.92327000000002, "b": 430.11511, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "Feed Forward Network", "bbox": {"l": 76.024773, "t": 424.45309, "r": 127.92327000000002, "b": 430.11511, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 78.382828, "t": 444.88956, "r": 84.514076, "b": 450.55157, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "Add", "bbox": {"l": 78.382828, "t": 444.88956, "r": 84.514076, "b": 450.55157, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 116.39658, "t": 444.88956, "r": 124.98033, "b": 450.55157, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "& Normalisation", "bbox": {"l": 116.39658, "t": 444.88956, "r": 124.98033, "b": 450.55157, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 167.46945, "t": 462.44324, "r": 181.6292, "b": 468.10526, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "Linear", "bbox": {"l": 167.46945, "t": 462.44324, "r": 181.6292, "b": 468.10526, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 165.61292, "t": 478.47107, "r": 184.43242, "b": 484.13309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "Softmax", "bbox": {"l": 165.61292, "t": 478.47107, "r": 184.43242, "b": 484.13309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 65.319511, "t": 324.26235999999994, "r": 132.9245, "b": 330.22235000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "CNN BACKBONE ENCODER", "bbox": {"l": 65.319511, "t": 324.26235999999994, "r": 132.9245, "b": 330.22235000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 119.51457, "t": 269.66394, "r": 162.98782, "b": 274.72992, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "[30, 1, 2, 3, 4, \u2026 3, ", "bbox": {"l": 119.51457, "t": 269.66394, "r": 162.98782, "b": 274.72992, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 128.72858, "t": 274.91394, "r": 151.41083, "b": 279.97992, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "4, 5, 8, 31]", "bbox": {"l": 128.72858, "t": 274.91394, "r": 151.41083, "b": 279.97992, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 60.434211999999995, "t": 338.95993, "r": 80.27021, "b": 344.26993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "Positional ", "bbox": {"l": 60.434211999999995, "t": 338.95993, "r": 80.27021, "b": 344.26993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 60.598457, "t": 343.38605, "r": 78.854958, "b": 348.69604, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "Encoding", "bbox": {"l": 60.598457, "t": 343.38605, "r": 78.854958, "b": 348.69604, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 134.82877, "t": 293.37762, "r": 154.66476, "b": 298.68762, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "Positional ", "bbox": {"l": 134.82877, "t": 293.37762, "r": 154.66476, "b": 298.68762, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 134.99303, "t": 297.80370999999997, "r": 153.24953, "b": 303.11371, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "Encoding", "bbox": {"l": 134.99303, "t": 297.80370999999997, "r": 153.24953, "b": 303.11371, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 150.55193, "t": 345.35861, "r": 197.14943, "b": 351.02063, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "Add & Normalisation", "bbox": {"l": 150.55193, "t": 345.35861, "r": 197.14943, "b": 351.02063, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 150.55193, "t": 394.4234, "r": 156.68318, "b": 400.08542, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "Add", "bbox": {"l": 150.55193, "t": 394.4234, "r": 156.68318, "b": 400.08542, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 188.56567, "t": 394.4234, "r": 197.14943, "b": 400.08542, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "& Normalisation", "bbox": {"l": 188.56567, "t": 394.4234, "r": 197.14943, "b": 400.08542, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 150.18539, "t": 375.66843, "r": 197.31964, "b": 381.33044, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "Multi-Head Attention", "bbox": {"l": 150.18539, "t": 375.66843, "r": 197.31964, "b": 381.33044, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 150.55193, "t": 440.24847000000005, "r": 156.68318, "b": 445.91049, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "Add", "bbox": {"l": 150.55193, "t": 440.24847000000005, "r": 156.68318, "b": 445.91049, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 188.56567, "t": 440.24847000000005, "r": 197.14943, "b": 445.91049, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "& Normalisation", "bbox": {"l": 188.56567, "t": 440.24847000000005, "r": 197.14943, "b": 445.91049, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 147.86377, "t": 422.09335, "r": 199.76227, "b": 427.75537, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "Feed Forward Network", "bbox": {"l": 147.86377, "t": 422.09335, "r": 199.76227, "b": 427.75537, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 241.56567000000004, "t": 314.26285000000007, "r": 255.72542, "b": 319.92487, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "Linear", "bbox": {"l": 241.56567000000004, "t": 314.26285000000007, "r": 255.72542, "b": 319.92487, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 241.91730000000004, "t": 361.36493, "r": 256.07706, "b": 367.02695, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "Linear", "bbox": {"l": 241.91730000000004, "t": 361.36493, "r": 256.07706, "b": 367.02695, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 228.054, "t": 336.61929000000003, "r": 248.72363000000004, "b": 342.28131, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "Attention", "bbox": {"l": 228.054, "t": 336.61929000000003, "r": 248.72363000000004, "b": 342.28131, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 246.2919, "t": 336.61929000000003, "r": 269.39325, "b": 342.28131, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "Network", "bbox": {"l": 246.2919, "t": 336.61929000000003, "r": 269.39325, "b": 342.28131, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 228.44568000000004, "t": 405.14682, "r": 238.73892, "b": 410.80884, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "MLP", "bbox": {"l": 228.44568000000004, "t": 405.14682, "r": 238.73892, "b": 410.80884, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 256.29767, "t": 405.2032500000001, "r": 271.77792, "b": 410.86526, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "Linear ", "bbox": {"l": 256.29767, "t": 405.2032500000001, "r": 271.77792, "b": 410.86526, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 239.54543, "t": 382.21344, "r": 258.08942, "b": 387.87546, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "Sigmoid", "bbox": {"l": 239.54543, "t": 382.21344, "r": 258.08942, "b": 387.87546, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 54.14704100000001, "t": 384.87183, "r": 59.51152, "b": 449.78326, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "Transformer Encoder Network", "bbox": {"l": 54.14704100000001, "t": 384.87183, "r": 59.51152, "b": 449.78326, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 54.235424, "t": 373.81232, "r": 59.30449699999999, "b": 378.45421999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "x2", "bbox": {"l": 54.235424, "t": 373.81232, "r": 59.30449699999999, "b": 378.45421999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 85.295891, "t": 484.53189, "r": 122.16431, "b": 490.36688, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "Encoded Output", "bbox": {"l": 85.295891, "t": 484.53189, "r": 122.16431, "b": 490.36688, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 229.66599, "t": 279.54607999999996, "r": 265.3194, "b": 285.45572000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "Encoded Output", "bbox": {"l": 229.66599, "t": 279.54607999999996, "r": 265.3194, "b": 285.45572000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 157.17369, "t": 500.3031, "r": 190.41711, "b": 506.12943, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "Predicted Tags", "bbox": {"l": 157.17369, "t": 500.3031, "r": 190.41711, "b": 506.12943, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 227.81598999999997, "t": 438.05542, "r": 270.78442, "b": 443.89206, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "Bounding Boxes & ", "bbox": {"l": 227.81598999999997, "t": 438.05542, "r": 270.78442, "b": 443.89206, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 233.70262, "t": 444.06183, "r": 263.51105, "b": 449.8904999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "Classification", "bbox": {"l": 233.70262, "t": 444.06183, "r": 263.51105, "b": 449.8904999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 184.74655, "t": 293.39502, "r": 212.16055, "b": 298.75903, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "Transformer ", "bbox": {"l": 184.74655, "t": 293.39502, "r": 212.16055, "b": 298.75903, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 178.91229, "t": 299.14502, "r": 216.74378999999996, "b": 304.50903, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "Decoder Network", "bbox": {"l": 178.91229, "t": 299.14502, "r": 216.74378999999996, "b": 304.50903, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 194.24574, "t": 282.7822, "r": 198.89099, "b": 287.84817999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": "x4", "bbox": {"l": 194.24574, "t": 282.7822, "r": 198.89099, "b": 287.84817999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 221.45587, "t": 271.86914, "r": 276.47089, "b": 277.82916, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "CELL BBOX DECODER", "bbox": {"l": 221.45587, "t": 271.86914, "r": 276.47089, "b": 277.82916, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 151.65219, "t": 323.44241, "r": 197.29019, "b": 329.10443, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "Masked Multi-Head ", "bbox": {"l": 151.65219, "t": 323.44241, "r": 197.29019, "b": 329.10443, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 163.43277, "t": 329.44241, "r": 184.19028, "b": 335.10443, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": "Attention", "bbox": {"l": 163.43277, "t": 329.44241, "r": 184.19028, "b": 335.10443, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "caption", "id": 8, "page_no": 4, "cluster": {"id": 8, "label": "caption", "bbox": {"l": 50.112, "t": 527.7828099999999, "r": 286.36597, "b": 680.27094, "coord_origin": "TOPLEFT"}, "confidence": 0.8913407325744629, "cells": [{"id": 107, "text": "Figure 4: Given an input image of a table, the", "bbox": {"l": 50.112, "t": 527.90237, "r": 229.78752, "b": 536.80893, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "Encoder", "bbox": {"l": 231.787, "t": 527.7828099999999, "r": 267.76196, "b": 536.7392, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "pro-", "bbox": {"l": 269.76401, "t": 527.90237, "r": 286.36169, "b": 536.80893, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "duces fixed-length features that represent the input image.", "bbox": {"l": 50.112015, "t": 539.85738, "r": 286.36508, "b": 548.76393, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "The features are then passed to both the", "bbox": {"l": 50.112015, "t": 551.81337, "r": 205.84735, "b": 560.71992, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "Structure Decoder", "bbox": {"l": 208.01802, "t": 551.69382, "r": 286.36392, "b": 560.6501900000001, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "and", "bbox": {"l": 50.112015, "t": 563.76837, "r": 64.498009, "b": 572.67493, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "Cell BBox Decoder", "bbox": {"l": 68.165016, "t": 563.64882, "r": 151.31288, "b": 572.60519, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": ".", "bbox": {"l": 151.31302, "t": 563.76837, "r": 153.80367, "b": 572.67493, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "During training, the", "bbox": {"l": 160.41884, "t": 563.76837, "r": 241.93283000000002, "b": 572.67493, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "Structure", "bbox": {"l": 245.59502, "t": 563.64882, "r": 286.362, "b": 572.60519, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "Decoder", "bbox": {"l": 50.112015, "t": 575.60382, "r": 85.519089, "b": 584.5602, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "receives \u2018tokenized tags\u2019 of the HTML code that", "bbox": {"l": 88.623016, "t": 575.7233699999999, "r": 286.36072, "b": 584.6299300000001, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "represent the table structure. Afterwards, a transformer en-", "bbox": {"l": 50.112015, "t": 587.6783800000001, "r": 286.36511, "b": 596.58493, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "coder and decoder architecture is employed to produce fea-", "bbox": {"l": 50.112015, "t": 599.63338, "r": 286.36508, "b": 608.53993, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "tures that are received by a linear layer, and the", "bbox": {"l": 50.112015, "t": 611.58838, "r": 240.43756000000002, "b": 620.4949300000001, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "Cell BBox", "bbox": {"l": 243.19801, "t": 611.46883, "r": 286.36597, "b": 620.4252, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "Decoder. The linear layer is applied to the features to", "bbox": {"l": 50.112015, "t": 623.42482, "r": 286.36511, "b": 632.3812, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "predict the tags. Simultaneously, the Cell BBox Decoder", "bbox": {"l": 50.112015, "t": 635.37982, "r": 286.36508, "b": 644.3362, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "selects features referring to the data cells (\u2018", "bbox": {"l": 50.112015, "t": 647.45438, "r": 220.58205, "b": 656.36093, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "<", "bbox": {"l": 220.57802000000004, "t": 647.29497, "r": 228.32693, "b": 656.14175, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "td", "bbox": {"l": 228.32700999999997, "t": 647.45438, "r": 236.07791000000003, "b": 656.36093, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": ">", "bbox": {"l": 236.07802000000004, "t": 647.29497, "r": 243.82693, "b": 656.14175, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "\u2019, \u2018", "bbox": {"l": 243.82602, "t": 647.45438, "r": 255.29298000000003, "b": 656.36093, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "<", "bbox": {"l": 255.29102000000003, "t": 647.29497, "r": 263.03992, "b": 656.14175, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "\u2019) and", "bbox": {"l": 263.04001, "t": 647.45438, "r": 286.36246, "b": 656.36093, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "passes them through an attention network, an MLP, and a", "bbox": {"l": 50.112015, "t": 659.40938, "r": 286.36511, "b": 668.31594, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "linear layer to predict the bounding boxes.", "bbox": {"l": 50.112015, "t": 671.36438, "r": 218.46996, "b": 680.27094, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 4: Given an input image of a table, the Encoder produces fixed-length features that represent the input image. The features are then passed to both the Structure Decoder and Cell BBox Decoder . During training, the Structure Decoder receives 'tokenized tags' of the HTML code that represent the table structure. Afterwards, a transformer encoder and decoder architecture is employed to produce features that are received by a linear layer, and the Cell BBox Decoder. The linear layer is applied to the features to predict the tags. Simultaneously, the Cell BBox Decoder selects features referring to the data cells (' < td > ', ' < ') and passes them through an attention network, an MLP, and a linear layer to predict the bounding boxes."}, {"label": "text", "id": 4, "page_no": 4, "cluster": {"id": 4, "label": "text", "bbox": {"l": 308.862, "t": 249.53441999999995, "r": 545.11505, "b": 294.3069499999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9831458330154419, "cells": [{"id": 135, "text": "forming classification, and adding an adaptive pooling", "bbox": {"l": 308.862, "t": 249.53441999999995, "r": 523.05786, "b": 258.44097999999997, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "layer", "bbox": {"l": 525.19983, "t": 249.53441999999995, "r": 545.11505, "b": 258.44097999999997, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "of size 28*28. ResNet by default downsamples the", "bbox": {"l": 308.862, "t": 261.49042, "r": 517.55847, "b": 270.39697, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "image", "bbox": {"l": 520.76642, "t": 261.49042, "r": 545.11499, "b": 270.39697, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "resolution by 32 and then the encoded image is provided", "bbox": {"l": 308.862, "t": 273.44537, "r": 534.80377, "b": 282.35196, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "to", "bbox": {"l": 537.36414, "t": 273.44537, "r": 545.11505, "b": 282.35196, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "both the", "bbox": {"l": 308.862, "t": 285.40039, "r": 341.24045, "b": 294.3069499999999, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "Structure Decoder", "bbox": {"l": 343.73099, "t": 285.49005, "r": 417.23508, "b": 294.07782000000003, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": ", and", "bbox": {"l": 417.23398, "t": 285.40039, "r": 436.60129, "b": 294.3069499999999, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "Cell BBox Decoder", "bbox": {"l": 439.09198, "t": 285.49005, "r": 516.56116, "b": 294.07782000000003, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": ".", "bbox": {"l": 516.56097, "t": 285.40039, "r": 519.05164, "b": 294.3069499999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "forming classification, and adding an adaptive pooling layer of size 28*28. ResNet by default downsamples the image resolution by 32 and then the encoded image is provided to both the Structure Decoder , and Cell BBox Decoder ."}, {"label": "text", "id": 1, "page_no": 4, "cluster": {"id": 1, "label": "text", "bbox": {"l": 308.86194, "t": 297.33981, "r": 545.11511, "b": 413.96182, "coord_origin": "TOPLEFT"}, "confidence": 0.9862009882926941, "cells": [{"id": 146, "text": "Structure Decoder.", "bbox": {"l": 320.81696, "t": 297.33981, "r": 400.86649, "b": 306.2962, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "The transformer architecture of", "bbox": {"l": 403.91394, "t": 297.45938, "r": 528.33685, "b": 306.36594, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "this", "bbox": {"l": 530.7179, "t": 297.45938, "r": 545.11383, "b": 306.36594, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "component is based on the work proposed in [31].", "bbox": {"l": 308.86194, "t": 309.41437, "r": 517.5285, "b": 318.32092, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "After", "bbox": {"l": 524.09387, "t": 309.41437, "r": 545.11493, "b": 318.32092, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "extensive experimentation, the", "bbox": {"l": 308.86194, "t": 321.36934999999994, "r": 432.35833999999994, "b": 330.27591, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "Structure Decoder", "bbox": {"l": 435.81995000000006, "t": 321.45901, "r": 510.29041, "b": 330.04678, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "is", "bbox": {"l": 513.97797, "t": 321.36934999999994, "r": 520.62305, "b": 330.27591, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "mod-", "bbox": {"l": 524.08008, "t": 321.36934999999994, "r": 545.11115, "b": 330.27591, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "eled as a transformer encoder with two encoder layers", "bbox": {"l": 308.86197, "t": 333.32434, "r": 527.76013, "b": 342.2309, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "and", "bbox": {"l": 530.729, "t": 333.32434, "r": 545.11499, "b": 342.2309, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "a transformer decoder made from a stack of 4 decoder", "bbox": {"l": 308.86197, "t": 345.27933, "r": 526.85352, "b": 354.18588, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "lay-", "bbox": {"l": 529.62311, "t": 345.27933, "r": 545.11493, "b": 354.18588, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "ers that comprise mainly of multi-head attention and", "bbox": {"l": 308.86197, "t": 357.23532, "r": 524.51245, "b": 366.14188, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "feed", "bbox": {"l": 527.96948, "t": 357.23532, "r": 545.11511, "b": 366.14188, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "forward layers.", "bbox": {"l": 308.86197, "t": 369.19031000000007, "r": 370.39096, "b": 378.09685999999994, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "This configuration uses fewer layers", "bbox": {"l": 377.44449, "t": 369.19031000000007, "r": 526.91339, "b": 378.09685999999994, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "and", "bbox": {"l": 530.72906, "t": 369.19031000000007, "r": 545.11505, "b": 378.09685999999994, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "heads in comparison to networks applied to other", "bbox": {"l": 308.86197, "t": 381.14529000000005, "r": 505.46395999999993, "b": 390.05185, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "problems", "bbox": {"l": 508.03430000000003, "t": 381.14529000000005, "r": 545.11511, "b": 390.05185, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "(e.g. \u201cScene Understanding\u201d, \u201cImage Captioning\u201d),", "bbox": {"l": 308.86197, "t": 393.10028, "r": 517.68799, "b": 402.00684, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "some-", "bbox": {"l": 520.76642, "t": 393.10028, "r": 545.11499, "b": 402.00684, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "thing which we relate to the simplicity of table images.", "bbox": {"l": 308.86197, "t": 405.05526999999995, "r": 528.01935, "b": 413.96182, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Structure Decoder. The transformer architecture of this component is based on the work proposed in [31]. After extensive experimentation, the Structure Decoder is modeled as a transformer encoder with two encoder layers and a transformer decoder made from a stack of 4 decoder layers that comprise mainly of multi-head attention and feed forward layers. This configuration uses fewer layers and heads in comparison to networks applied to other problems (e.g. \"Scene Understanding\", \"Image Captioning\"), something which we relate to the simplicity of table images."}, {"label": "text", "id": 3, "page_no": 4, "cluster": {"id": 3, "label": "text", "bbox": {"l": 308.86197, "t": 417.11426, "r": 545.11511, "b": 545.57271, "coord_origin": "TOPLEFT"}, "confidence": 0.9851906895637512, "cells": [{"id": 169, "text": "The transformer encoder receives an encoded", "bbox": {"l": 320.81696, "t": 417.11426, "r": 515.49609, "b": 426.02081, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "image", "bbox": {"l": 520.7663, "t": 417.11426, "r": 545.11487, "b": 426.02081, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "from the", "bbox": {"l": 308.86197, "t": 429.0692399999999, "r": 343.72107, "b": 437.9758, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "CNN Backbone Network", "bbox": {"l": 347.03796, "t": 429.15891, "r": 446.45471000000003, "b": 437.74667, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "and refines it", "bbox": {"l": 449.93996999999996, "t": 429.0692399999999, "r": 503.06055000000003, "b": 437.9758, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "through", "bbox": {"l": 506.37808, "t": 429.0692399999999, "r": 537.3717, "b": 437.9758, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "a", "bbox": {"l": 540.68927, "t": 429.0692399999999, "r": 545.11267, "b": 437.9758, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "multi-head dot-product attention layer, followed by a", "bbox": {"l": 308.86197, "t": 441.02423, "r": 522.78894, "b": 449.93079, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "Feed", "bbox": {"l": 525.7478, "t": 441.02423, "r": 545.11511, "b": 449.93079, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "Forward Network.", "bbox": {"l": 308.86197, "t": 452.97922, "r": 384.14929, "b": 461.88577, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "During training, the transformer", "bbox": {"l": 393.37466, "t": 452.97922, "r": 527.84985, "b": 461.88577, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "de-", "bbox": {"l": 532.39282, "t": 452.97922, "r": 545.11505, "b": 461.88577, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "coder receives as input the output feature produced by", "bbox": {"l": 308.86197, "t": 464.93521, "r": 529.7627, "b": 473.84177, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "the", "bbox": {"l": 532.94073, "t": 464.93521, "r": 545.11505, "b": 473.84177, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "transformer encoder, and the tokenized input of the", "bbox": {"l": 308.86197, "t": 476.8902, "r": 514.17126, "b": 485.79675, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "HTML", "bbox": {"l": 516.89105, "t": 476.8902, "r": 545.11511, "b": 485.79675, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": "ground-truth tags. Using a stack of multi-head attention", "bbox": {"l": 308.86197, "t": 488.84518, "r": 527.63068, "b": 497.75174, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "lay-", "bbox": {"l": 529.62317, "t": 488.84518, "r": 545.11499, "b": 497.75174, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "ers, different aspects of the tag sequence could be", "bbox": {"l": 308.86197, "t": 500.80017, "r": 508.3630999999999, "b": 509.70673, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": "inferred.", "bbox": {"l": 511.09286000000003, "t": 500.80017, "r": 545.11511, "b": 509.70673, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "This is achieved by each attention head on a layer operating", "bbox": {"l": 308.86197, "t": 512.7551599999999, "r": 545.11499, "b": 521.6617100000001, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "in a different subspace, and then combining altogether their", "bbox": {"l": 308.86197, "t": 524.71115, "r": 545.11511, "b": 533.61771, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "attention score.", "bbox": {"l": 308.86197, "t": 536.66615, "r": 369.73349, "b": 545.57271, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The transformer encoder receives an encoded image from the CNN Backbone Network and refines it through a multi-head dot-product attention layer, followed by a Feed Forward Network. During training, the transformer decoder receives as input the output feature produced by the transformer encoder, and the tokenized input of the HTML ground-truth tags. Using a stack of multi-head attention layers, different aspects of the tag sequence could be inferred. This is achieved by each attention head on a layer operating in a different subspace, and then combining altogether their attention score."}, {"label": "text", "id": 0, "page_no": 4, "cluster": {"id": 0, "label": "text", "bbox": {"l": 308.86194, "t": 548.6046, "r": 545.11511, "b": 653.27271, "coord_origin": "TOPLEFT"}, "confidence": 0.9869195818901062, "cells": [{"id": 192, "text": "Cell BBox Decoder.", "bbox": {"l": 320.81696, "t": 548.6046, "r": 404.76184, "b": 557.56097, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "Our architecture allows to simul-", "bbox": {"l": 410.34094, "t": 548.72415, "r": 545.11505, "b": 557.63071, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "taneously predict HTML tags and bounding boxes for each", "bbox": {"l": 308.86194, "t": 560.68015, "r": 545.11493, "b": 569.5867000000001, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "table cell without the need of a separate object detector end", "bbox": {"l": 308.86194, "t": 572.6351500000001, "r": 545.11511, "b": 581.5417, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "to end. This approach is inspired by DETR [1] which em-", "bbox": {"l": 308.86194, "t": 584.59015, "r": 545.11493, "b": 593.4967, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "ploys a Transformer Encoder, and Decoder that looks for", "bbox": {"l": 308.86194, "t": 596.54515, "r": 545.11499, "b": 605.45171, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "a specific number of object queries (potential object detec-", "bbox": {"l": 308.86194, "t": 608.50015, "r": 545.11505, "b": 617.40671, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "tions). As our model utilizes a transformer architecture, the", "bbox": {"l": 308.86194, "t": 620.45515, "r": 545.11505, "b": 629.36171, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "hidden state of the", "bbox": {"l": 308.86194, "t": 632.41115, "r": 381.67859, "b": 641.3177000000001, "coord_origin": "TOPLEFT"}}, {"id": 201, "text": "<", "bbox": {"l": 383.99695, "t": 632.25174, "r": 391.74585, "b": 641.09853, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": "td", "bbox": {"l": 391.74594, "t": 632.41115, "r": 399.49686, "b": 641.3177000000001, "coord_origin": "TOPLEFT"}}, {"id": 203, "text": ">", "bbox": {"l": 399.49695, "t": 632.25174, "r": 407.24585, "b": 641.09853, "coord_origin": "TOPLEFT"}}, {"id": 204, "text": "\u2019 and \u2018", "bbox": {"l": 407.24594, "t": 632.41115, "r": 432.90958, "b": 641.3177000000001, "coord_origin": "TOPLEFT"}}, {"id": 205, "text": "<", "bbox": {"l": 432.90792999999996, "t": 632.25174, "r": 440.65683000000007, "b": 641.09853, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": "\u2019 HTML structure tags be-", "bbox": {"l": 440.65691999999996, "t": 632.41115, "r": 545.11475, "b": 641.3177000000001, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": "come the object query.", "bbox": {"l": 308.86194, "t": 644.3661500000001, "r": 398.96371, "b": 653.27271, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Cell BBox Decoder. Our architecture allows to simultaneously predict HTML tags and bounding boxes for each table cell without the need of a separate object detector end to end. This approach is inspired by DETR [1] which employs a Transformer Encoder, and Decoder that looks for a specific number of object queries (potential object detections). As our model utilizes a transformer architecture, the hidden state of the < td > ' and ' < ' HTML structure tags become the object query."}, {"label": "text", "id": 2, "page_no": 4, "cluster": {"id": 2, "label": "text", "bbox": {"l": 308.86194, "t": 656.42516, "r": 545.11505, "b": 713.151726, "coord_origin": "TOPLEFT"}, "confidence": 0.9852352142333984, "cells": [{"id": 208, "text": "The encoding generated by the", "bbox": {"l": 320.81693, "t": 656.42516, "r": 444.34316999999993, "b": 665.33172, "coord_origin": "TOPLEFT"}}, {"id": 209, "text": "CNN Backbone Network", "bbox": {"l": 447.00591999999995, "t": 656.51482, "r": 545.1076, "b": 665.10258, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": "along with the features acquired for every data cell from the", "bbox": {"l": 308.86194, "t": 668.38016, "r": 545.11505, "b": 677.2867200000001, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "Transformer Decoder are then passed to the attention net-", "bbox": {"l": 308.86194, "t": 680.33516, "r": 545.11505, "b": 689.24172, "coord_origin": "TOPLEFT"}}, {"id": 212, "text": "work. The attention network takes both inputs and learns to", "bbox": {"l": 308.86194, "t": 692.290161, "r": 545.11505, "b": 701.196724, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "provide an attention weighted encoding. This weighted at-", "bbox": {"l": 308.86194, "t": 704.245163, "r": 545.11505, "b": 713.151726, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The encoding generated by the CNN Backbone Network along with the features acquired for every data cell from the Transformer Decoder are then passed to the attention network. The attention network takes both inputs and learns to provide an attention weighted encoding. This weighted at-"}], "headers": [{"label": "page_footer", "id": 9, "page_no": 4, "cluster": {"id": 9, "label": "page_footer", "bbox": {"l": 295.12094, "t": 734.13316, "r": 300.10223, "b": 743.039722, "coord_origin": "TOPLEFT"}, "confidence": 0.8719564080238342, "cells": [{"id": 214, "text": "5", "bbox": {"l": 295.12094, "t": 734.13316, "r": 300.10223, "b": 743.039722, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5"}]}}, {"page_no": 5, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "tention encoding is then multiplied to the encoded image to", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 286.36514, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "produce a feature for each table cell. Notice that this is dif-", "bbox": {"l": 50.112, "t": 87.16339000000005, "r": 286.36508, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "ferent than the typical object detection problem where im-", "bbox": {"l": 50.112, "t": 99.11841000000004, "r": 286.36508, "b": 108.02495999999985, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "balances between the number of detections and the amount", "bbox": {"l": 50.112, "t": 111.07343000000003, "r": 286.36508, "b": 119.97997999999984, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "of objects may exist. In our case, we know up front that", "bbox": {"l": 50.112, "t": 123.02844000000005, "r": 286.36508, "b": 131.93499999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "the produced detections always match with the table cells", "bbox": {"l": 50.112, "t": 134.98443999999995, "r": 286.36514, "b": 143.89099, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "in number and correspondence.", "bbox": {"l": 50.112, "t": 146.93944999999997, "r": 175.16254, "b": 155.84600999999998, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "The output features for each table cell are then fed", "bbox": {"l": 62.067001, "t": 159.62445000000002, "r": 286.36496, "b": 168.53101000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "into the feed-forward network (FFN). The FFN consists", "bbox": {"l": 50.112, "t": 171.58043999999995, "r": 286.36511, "b": 180.48699999999997, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "of a Multi-Layer Perceptron (3 layers with ReLU activa-", "bbox": {"l": 50.112, "t": 183.53545999999994, "r": 286.36511, "b": 192.44201999999996, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "tion function) that predicts the normalized coordinates for", "bbox": {"l": 50.112, "t": 195.49048000000005, "r": 286.36511, "b": 204.39702999999997, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "the bounding box of each table cell. Finally, the predicted", "bbox": {"l": 50.112, "t": 207.44550000000004, "r": 286.36511, "b": 216.35204999999996, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "bounding boxes are classified based on whether they are", "bbox": {"l": 50.112, "t": 219.40051000000005, "r": 286.36511, "b": 228.30706999999995, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "empty or not using a linear layer.", "bbox": {"l": 50.112, "t": 231.35650999999996, "r": 181.54855, "b": 240.26306, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Loss Functions.", "bbox": {"l": 62.067001, "t": 243.92193999999995, "r": 129.21492, "b": 252.87829999999997, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "We formulate a multi-task loss Eq. 2", "bbox": {"l": 134.451, "t": 244.04150000000004, "r": 286.36078, "b": 252.94806000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "to train our network. The Cross-Entropy loss (denoted as", "bbox": {"l": 50.112007, "t": 255.99652000000003, "r": 286.36511, "b": 264.90308000000005, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "l$_{s}$", "bbox": {"l": 50.112007, "t": 267.79309, "r": 56.84528, "b": 276.63989000000004, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": ") is used to train the", "bbox": {"l": 57.343006, "t": 267.95250999999996, "r": 135.39996, "b": 276.85907, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Structure Decoder", "bbox": {"l": 137.735, "t": 268.04218000000003, "r": 211.07965, "b": 276.62994000000003, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "which predicts the", "bbox": {"l": 213.63699, "t": 267.95250999999996, "r": 286.36395, "b": 276.85907, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "structure tokens. As for the", "bbox": {"l": 50.112, "t": 279.90747, "r": 158.82388, "b": 288.81406, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "Cell BBox Decoder", "bbox": {"l": 161.31799, "t": 279.99712999999997, "r": 238.79712, "b": 288.58493, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "it is trained", "bbox": {"l": 241.521, "t": 279.90747, "r": 286.36264, "b": 288.81406, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "with a combination of losses denoted as", "bbox": {"l": 50.112, "t": 291.86249, "r": 211.3766, "b": 300.76904, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "l$_{box}$", "bbox": {"l": 214.271, "t": 291.70309, "r": 229.19780000000003, "b": 300.54987, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": ".", "bbox": {"l": 229.696, "t": 291.86249, "r": 232.18665000000001, "b": 300.76904, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "l$_{box}$", "bbox": {"l": 236.49001, "t": 291.70309, "r": 251.41681000000003, "b": 300.54987, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "consists", "bbox": {"l": 254.81099999999998, "t": 291.86249, "r": 286.36255, "b": 300.76904, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "of the generally used", "bbox": {"l": 50.112, "t": 303.81747, "r": 137.45412, "b": 312.72403, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "l$_{1}$", "bbox": {"l": 141.298, "t": 303.65808, "r": 148.24258, "b": 312.50485, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "loss for object detection and the", "bbox": {"l": 152.58601, "t": 303.81747, "r": 286.36377, "b": 312.72403, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "IoU loss (", "bbox": {"l": 50.112015, "t": 315.77245999999997, "r": 89.683464, "b": 324.67902, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "l$_{iou}$", "bbox": {"l": 89.68602, "t": 315.61307, "r": 104.12046, "b": 324.45984, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": ") to be scale invariant as explained in [25]. In", "bbox": {"l": 104.61802, "t": 315.77245999999997, "r": 286.36572, "b": 324.67902, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "comparison to DETR, we do not use the Hungarian algo-", "bbox": {"l": 50.112019, "t": 327.72845, "r": 286.36511, "b": 336.6350100000001, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "rithm [15] to match the predicted bounding boxes with the", "bbox": {"l": 50.112019, "t": 339.68344, "r": 286.36508, "b": 348.59, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "ground-truth boxes, as we have already achieved a one-to-", "bbox": {"l": 50.112019, "t": 351.63843, "r": 286.36511, "b": 360.54498, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "one match through two steps: 1) Our token input sequence", "bbox": {"l": 50.112019, "t": 363.59341, "r": 286.36508, "b": 372.49996999999996, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "is naturally ordered, therefore the hidden states of the table", "bbox": {"l": 50.112019, "t": 375.5484, "r": 286.36511, "b": 384.45496, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "data cells are also in order when they are provided as in-", "bbox": {"l": 50.112019, "t": 387.50339, "r": 286.36514, "b": 396.40994, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "put to the", "bbox": {"l": 50.112019, "t": 399.45938, "r": 88.68721, "b": 408.36594, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "Cell BBox Decoder", "bbox": {"l": 91.646019, "t": 399.54904, "r": 170.0517, "b": 408.13681, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": ", and 2) Our bounding boxes", "bbox": {"l": 170.05103, "t": 399.45938, "r": 286.36438, "b": 408.36594, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "generation mechanism (see Sec.", "bbox": {"l": 50.112022, "t": 411.41437, "r": 181.96703, "b": 420.32092, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "3)", "bbox": {"l": 189.09029, "t": 411.41437, "r": 197.74918, "b": 420.32092, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "ensures a one-to-one", "bbox": {"l": 200.34789, "t": 411.41437, "r": 286.36511, "b": 420.32092, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "mapping between the cell content and its bounding box for", "bbox": {"l": 50.112022, "t": 423.36934999999994, "r": 286.36511, "b": 432.27591, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "all post-processed datasets.", "bbox": {"l": 50.112022, "t": 435.32434, "r": 158.2959, "b": 444.2309, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "The loss used to train the TableFormer can be defined as", "bbox": {"l": 62.067024, "t": 448.01035, "r": 286.36499, "b": 456.9169, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "following:", "bbox": {"l": 50.112022, "t": 459.96533, "r": 91.377113, "b": 468.87189, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "l$_{box}$", "bbox": {"l": 125.71502, "t": 493.28094, "r": 140.64182, "b": 502.12772, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "=", "bbox": {"l": 143.90701, "t": 493.28094, "r": 151.65593, "b": 502.12772, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "\u03bb$_{iou}$l$_{iou}$", "bbox": {"l": 154.42302, "t": 493.28094, "r": 186.62846, "b": 502.12772, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "+", "bbox": {"l": 189.34003, "t": 493.28094, "r": 197.08894, "b": 502.12772, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "\u03bb$_{l}$$_{1}$", "bbox": {"l": 199.30302, "t": 493.28094, "r": 211.64659, "b": 502.12772, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "l", "bbox": {"l": 124.33002, "t": 508.22495, "r": 127.30286, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "=", "bbox": {"l": 130.26602, "t": 508.22495, "r": 138.01494, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "\u03bbl$_{s}$", "bbox": {"l": 140.78203, "t": 508.22495, "r": 153.32629, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "+ (1", "bbox": {"l": 156.03903, "t": 508.22495, "r": 174.85541, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "\u2212", "bbox": {"l": 177.07103, "t": 507.66702, "r": 184.81995, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "\u03bb", "bbox": {"l": 187.03304, "t": 508.22495, "r": 192.84422, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": ")", "bbox": {"l": 192.84503, "t": 508.22495, "r": 196.71948, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "l$_{box}$", "bbox": {"l": 196.71902, "t": 508.22495, "r": 211.64583, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "(1)", "bbox": {"l": 274.74603, "t": 501.01132, "r": 286.36243, "b": 509.91788, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "where", "bbox": {"l": 50.11203, "t": 531.30933, "r": 74.450661, "b": 540.21588, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "\u03bb", "bbox": {"l": 76.941032, "t": 531.14993, "r": 82.75222, "b": 539.9967, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "\u2208", "bbox": {"l": 85.520035, "t": 530.5920100000001, "r": 92.162102, "b": 539.9967, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "[0, 1], and", "bbox": {"l": 94.653038, "t": 531.30933, "r": 135.59932, "b": 540.21588, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "\u03bb$_{iou}$, \u03bb$_{l}$$_{1}$", "bbox": {"l": 138.09004, "t": 531.14993, "r": 172.63162, "b": 539.9967, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "\u2208$_{R}$", "bbox": {"l": 175.89705, "t": 530.5920100000001, "r": 192.50104, "b": 539.9967, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "are hyper-parameters.", "bbox": {"l": 194.99205, "t": 531.30933, "r": 281.59692, "b": 540.21588, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "5.", "bbox": {"l": 50.112045, "t": 555.91689, "r": 57.92831799999999, "b": 566.66461, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "Experimental Results", "bbox": {"l": 68.350014, "t": 555.91689, "r": 171.98335, "b": 566.66461, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "5.1.", "bbox": {"l": 50.112045, "t": 576.26433, "r": 64.693237, "b": 586.1163799999999, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "Implementation Details", "bbox": {"l": 74.414032, "t": 576.26433, "r": 179.17502, "b": 586.1163799999999, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "TableFormer uses ResNet-18 as the", "bbox": {"l": 62.067047, "t": 595.73433, "r": 202.97806, "b": 604.64088, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "CNN Backbone Net-", "bbox": {"l": 205.38405, "t": 595.82399, "r": 286.36008, "b": 604.41174, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "work", "bbox": {"l": 50.112045, "t": 607.77899, "r": 70.037247, "b": 616.3667399999999, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": ". The input images are resized to 448*448 pixels and", "bbox": {"l": 70.037048, "t": 607.68933, "r": 286.36496, "b": 616.59589, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "the feature map has a dimension of 28*28. Additionally, we", "bbox": {"l": 50.112049, "t": 619.64433, "r": 286.36517, "b": 628.55089, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "enforce the following input constraints:", "bbox": {"l": 50.112049, "t": 631.60033, "r": 207.03294, "b": 640.50688, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "Image width and height", "bbox": {"l": 91.661049, "t": 654.54532, "r": 186.01683, "b": 663.45187, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "\u2264", "bbox": {"l": 188.50705, "t": 653.828, "r": 196.25597, "b": 663.2327, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "1024 pixels", "bbox": {"l": 198.74605, "t": 654.54532, "r": 244.81310999999997, "b": 663.45187, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "Structural tags length", "bbox": {"l": 101.01604, "t": 669.48932, "r": 186.24606, "b": 678.39588, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "\u2264", "bbox": {"l": 188.73605, "t": 668.77201, "r": 196.48497, "b": 678.1767, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "512 tokens.", "bbox": {"l": 198.97505, "t": 669.48932, "r": 244.81296999999998, "b": 678.39588, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "(2)", "bbox": {"l": 274.74606, "t": 662.11731, "r": 286.36246, "b": 671.02388, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "Although input constraints are used also by other methods,", "bbox": {"l": 50.112061, "t": 692.290314, "r": 286.36514, "b": 701.196877, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "such as EDD, ours are less restrictive due to the improved", "bbox": {"l": 50.112061, "t": 704.245316, "r": 286.36514, "b": 713.151878, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "runtime performance and lower memory footprint of Table-", "bbox": {"l": 308.86206, "t": 75.20830999999998, "r": 545.11523, "b": 84.11487, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Former.", "bbox": {"l": 308.86206, "t": 87.16332999999997, "r": 339.98523, "b": 96.06988999999999, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "This allows to utilize input samples with longer", "bbox": {"l": 346.88931, "t": 87.16332999999997, "r": 545.11523, "b": 96.06988999999999, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "sequences and images with larger dimensions.", "bbox": {"l": 308.86206, "t": 99.11835000000008, "r": 492.96097, "b": 108.0249, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "The Transformer Encoder consists of two \u201cTransformer", "bbox": {"l": 320.81705, "t": 116.22937000000002, "r": 545.11499, "b": 125.13593000000003, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "Encoder Layers\u201d, with an input feature size of 512, feed", "bbox": {"l": 308.86206, "t": 128.18439, "r": 545.11517, "b": 137.09094000000005, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "forward network of 1024, and 4 attention heads. As for the", "bbox": {"l": 308.86206, "t": 140.13940000000002, "r": 545.11505, "b": 149.04596000000004, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "Transformer Decoder it is composed of four \u201cTransformer", "bbox": {"l": 308.86206, "t": 152.09442, "r": 545.11511, "b": 161.00098000000003, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "Decoder Layers\u201d with similar input and output dimensions", "bbox": {"l": 308.86206, "t": 164.04944, "r": 545.11517, "b": 172.95599000000004, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "as the \u201cTransformer Encoder Layers\u201d.", "bbox": {"l": 308.86206, "t": 176.00543000000005, "r": 467.21756000000005, "b": 184.91198999999995, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "Even though our", "bbox": {"l": 475.43671, "t": 176.00543000000005, "r": 545.11511, "b": 184.91198999999995, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "model uses fewer layers and heads than the default imple-", "bbox": {"l": 308.86206, "t": 187.96045000000004, "r": 545.11511, "b": 196.86699999999996, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "mentation parameters, our extensive experimentation has", "bbox": {"l": 308.86206, "t": 199.91547000000003, "r": 545.11511, "b": 208.82201999999995, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "proved this setup to be more suitable for table images. We", "bbox": {"l": 308.86206, "t": 211.87048000000004, "r": 545.11517, "b": 220.77704000000006, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "attribute this finding to the inherent design of table im-", "bbox": {"l": 308.86206, "t": 223.82550000000003, "r": 545.11511, "b": 232.73206000000005, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "ages, which contain mostly lines and text, unlike the more", "bbox": {"l": 308.86206, "t": 235.78052000000002, "r": 545.11511, "b": 244.68706999999995, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "elaborate content present in other scopes (e.g. the COCO", "bbox": {"l": 308.86206, "t": 247.73650999999995, "r": 545.11523, "b": 256.64306999999997, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "dataset).", "bbox": {"l": 308.86206, "t": 259.69152999999994, "r": 342.3364, "b": 268.59808, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "Moreover, we have added ResNet blocks to the", "bbox": {"l": 348.95157, "t": 259.69152999999994, "r": 545.11517, "b": 268.59808, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "inputs of the Structure Decoder and Cell BBox Decoder.", "bbox": {"l": 308.86206, "t": 271.64655000000005, "r": 545.11517, "b": 280.55310000000003, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "This prevents a decoder having a stronger influence over the", "bbox": {"l": 308.86206, "t": 283.6015300000001, "r": 545.1153, "b": 292.50809, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "learned weights which would damage the other prediction", "bbox": {"l": 308.86206, "t": 295.55652, "r": 545.11511, "b": 304.46307, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "task (structure vs bounding boxes), but learn task specific", "bbox": {"l": 308.86206, "t": 307.51151, "r": 545.11511, "b": 316.41806, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "weights instead. Lastly our dropout layers are set to 0.5.", "bbox": {"l": 308.86206, "t": 319.4674999999999, "r": 532.48267, "b": 328.37405, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "For training, TableFormer is trained with 3 Adam opti-", "bbox": {"l": 320.81705, "t": 336.57751, "r": 545.11499, "b": 345.48407000000003, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "mizers, each one for the", "bbox": {"l": 308.86206, "t": 348.5325000000001, "r": 403.7359, "b": 357.43906, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "CNN Backbone Network", "bbox": {"l": 406.07605, "t": 348.62216, "r": 503.54016, "b": 357.20993, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": ",", "bbox": {"l": 503.53906, "t": 348.5325000000001, "r": 506.02972, "b": 357.43906, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "Structure", "bbox": {"l": 508.40004999999996, "t": 348.62216, "r": 545.11224, "b": 357.20993, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "Decoder", "bbox": {"l": 308.86206, "t": 360.57715, "r": 343.1633, "b": 369.16492000000005, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": ", and", "bbox": {"l": 343.16306, "t": 360.48749, "r": 362.2016, "b": 369.39404, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Cell BBox Decoder", "bbox": {"l": 364.28604, "t": 360.57715, "r": 440.93829, "b": 369.16492000000005, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": ". Taking the PubTabNet as", "bbox": {"l": 440.93903, "t": 360.48749, "r": 545.10797, "b": 369.39404, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "an example for our parameter set up, the initializing learn-", "bbox": {"l": 308.86203, "t": 372.44247, "r": 545.11511, "b": 381.34903, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "ing rate is 0.001 for 12 epochs with a batch size of 24, and", "bbox": {"l": 308.86203, "t": 384.3984699999999, "r": 545.11517, "b": 393.30502, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "\u03bb", "bbox": {"l": 308.86203, "t": 396.19406000000004, "r": 314.67322, "b": 405.04083, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "set to 0.5.", "bbox": {"l": 318.65802, "t": 396.35345, "r": 360.39139, "b": 405.2600100000001, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "Afterwards, we reduce the learning rate to", "bbox": {"l": 367.96295, "t": 396.35345, "r": 545.10803, "b": 405.2600100000001, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "0.0001, the batch size to 18 and train for 12 more epochs or", "bbox": {"l": 308.86203, "t": 408.30844, "r": 545.11511, "b": 417.215, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "convergence.", "bbox": {"l": 308.86203, "t": 420.26343, "r": 360.9664, "b": 429.16998, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "TableFormer is implemented with PyTorch and Torchvi-", "bbox": {"l": 320.81702, "t": 437.37441999999993, "r": 545.11499, "b": 446.28098, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "sion libraries [22].", "bbox": {"l": 308.86203, "t": 449.32941, "r": 384.62759, "b": 458.23596, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "To speed up the inference, the image", "bbox": {"l": 391.37228, "t": 449.32941, "r": 545.11511, "b": 458.23596, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "undergoes a single forward pass through the", "bbox": {"l": 308.86203, "t": 461.28439, "r": 494.00693000000007, "b": 470.19095, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "CNN Back-", "bbox": {"l": 498.07803, "t": 461.37405, "r": 545.11145, "b": 469.96182, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "bone Network", "bbox": {"l": 308.86203, "t": 473.32904, "r": 364.44336, "b": 481.91681, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "and transformer encoder. This eliminates the", "bbox": {"l": 367.06104, "t": 473.23938, "r": 545.11267, "b": 482.14594, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "overhead of generating the same features for each decoding", "bbox": {"l": 308.86203, "t": 485.19437, "r": 545.11511, "b": 494.10092, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "step. Similarly, we employ a \u2019caching\u2019 technique to preform", "bbox": {"l": 308.86203, "t": 497.14935, "r": 545.11523, "b": 506.05591, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "faster autoregressive decoding. This is achieved by storing", "bbox": {"l": 308.86203, "t": 509.10535, "r": 545.11511, "b": 518.0119, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "the features of decoded tokens so we can reuse them for", "bbox": {"l": 308.86203, "t": 521.06033, "r": 545.11517, "b": 529.9668899999999, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "each time step. Therefore, we only compute the attention", "bbox": {"l": 308.86203, "t": 533.01532, "r": 545.11517, "b": 541.9218900000001, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "for each new tag.", "bbox": {"l": 308.86203, "t": 544.97034, "r": 377.21548, "b": 553.87689, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "5.2.", "bbox": {"l": 308.86203, "t": 579.55432, "r": 323.9046, "b": 589.40637, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "Generalization", "bbox": {"l": 333.93301, "t": 579.55432, "r": 397.44281, "b": 589.40637, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "TableFormer is evaluated on three major publicly avail-", "bbox": {"l": 320.81702, "t": 603.44933, "r": 545.11493, "b": 612.3558800000001, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "able datasets of different nature to prove the generalization", "bbox": {"l": 308.86203, "t": 615.40433, "r": 545.11511, "b": 624.31088, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "and effectiveness of our model. The datasets used for eval-", "bbox": {"l": 308.86203, "t": 627.35933, "r": 545.11517, "b": 636.26588, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "uation are the PubTabNet, FinTabNet and TableBank which", "bbox": {"l": 308.86203, "t": 639.31433, "r": 545.11511, "b": 648.22089, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "stem from the scientific, financial and general domains re-", "bbox": {"l": 308.86203, "t": 651.27032, "r": 545.11517, "b": 660.17688, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "spectively.", "bbox": {"l": 308.86203, "t": 663.22533, "r": 350.70493, "b": 672.13189, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "We also share our baseline results on the challenging", "bbox": {"l": 320.81702, "t": 680.33533, "r": 545.11505, "b": 689.24189, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "SynthTabNet dataset.", "bbox": {"l": 308.86203, "t": 692.290329, "r": 396.21411, "b": 701.196892, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "Throughout our experiments, the", "bbox": {"l": 406.40585, "t": 692.290329, "r": 545.11523, "b": 701.196892, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "same parameters stated in Sec. 5.1 are utilized.", "bbox": {"l": 308.86203, "t": 704.246323, "r": 495.93982, "b": 713.152893, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "6", "bbox": {"l": 295.12103, "t": 734.133327, "r": 300.10233, "b": 743.03989, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 5, "label": "text", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 286.36514, "b": 155.84600999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.9868090152740479, "cells": [{"id": 0, "text": "tention encoding is then multiplied to the encoded image to", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 286.36514, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "produce a feature for each table cell. Notice that this is dif-", "bbox": {"l": 50.112, "t": 87.16339000000005, "r": 286.36508, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "ferent than the typical object detection problem where im-", "bbox": {"l": 50.112, "t": 99.11841000000004, "r": 286.36508, "b": 108.02495999999985, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "balances between the number of detections and the amount", "bbox": {"l": 50.112, "t": 111.07343000000003, "r": 286.36508, "b": 119.97997999999984, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "of objects may exist. In our case, we know up front that", "bbox": {"l": 50.112, "t": 123.02844000000005, "r": 286.36508, "b": 131.93499999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "the produced detections always match with the table cells", "bbox": {"l": 50.112, "t": 134.98443999999995, "r": 286.36514, "b": 143.89099, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "in number and correspondence.", "bbox": {"l": 50.112, "t": 146.93944999999997, "r": 175.16254, "b": 155.84600999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "text", "bbox": {"l": 50.112, "t": 159.62445000000002, "r": 286.36511, "b": 240.26306, "coord_origin": "TOPLEFT"}, "confidence": 0.9860327839851379, "cells": [{"id": 7, "text": "The output features for each table cell are then fed", "bbox": {"l": 62.067001, "t": 159.62445000000002, "r": 286.36496, "b": 168.53101000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "into the feed-forward network (FFN). The FFN consists", "bbox": {"l": 50.112, "t": 171.58043999999995, "r": 286.36511, "b": 180.48699999999997, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "of a Multi-Layer Perceptron (3 layers with ReLU activa-", "bbox": {"l": 50.112, "t": 183.53545999999994, "r": 286.36511, "b": 192.44201999999996, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "tion function) that predicts the normalized coordinates for", "bbox": {"l": 50.112, "t": 195.49048000000005, "r": 286.36511, "b": 204.39702999999997, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "the bounding box of each table cell. Finally, the predicted", "bbox": {"l": 50.112, "t": 207.44550000000004, "r": 286.36511, "b": 216.35204999999996, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "bounding boxes are classified based on whether they are", "bbox": {"l": 50.112, "t": 219.40051000000005, "r": 286.36511, "b": 228.30706999999995, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "empty or not using a linear layer.", "bbox": {"l": 50.112, "t": 231.35650999999996, "r": 181.54855, "b": 240.26306, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "text", "bbox": {"l": 50.112, "t": 243.92193999999995, "r": 286.36572, "b": 444.2309, "coord_origin": "TOPLEFT"}, "confidence": 0.9873637557029724, "cells": [{"id": 14, "text": "Loss Functions.", "bbox": {"l": 62.067001, "t": 243.92193999999995, "r": 129.21492, "b": 252.87829999999997, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "We formulate a multi-task loss Eq. 2", "bbox": {"l": 134.451, "t": 244.04150000000004, "r": 286.36078, "b": 252.94806000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "to train our network. The Cross-Entropy loss (denoted as", "bbox": {"l": 50.112007, "t": 255.99652000000003, "r": 286.36511, "b": 264.90308000000005, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "l$_{s}$", "bbox": {"l": 50.112007, "t": 267.79309, "r": 56.84528, "b": 276.63989000000004, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": ") is used to train the", "bbox": {"l": 57.343006, "t": 267.95250999999996, "r": 135.39996, "b": 276.85907, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Structure Decoder", "bbox": {"l": 137.735, "t": 268.04218000000003, "r": 211.07965, "b": 276.62994000000003, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "which predicts the", "bbox": {"l": 213.63699, "t": 267.95250999999996, "r": 286.36395, "b": 276.85907, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "structure tokens. As for the", "bbox": {"l": 50.112, "t": 279.90747, "r": 158.82388, "b": 288.81406, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "Cell BBox Decoder", "bbox": {"l": 161.31799, "t": 279.99712999999997, "r": 238.79712, "b": 288.58493, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "it is trained", "bbox": {"l": 241.521, "t": 279.90747, "r": 286.36264, "b": 288.81406, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "with a combination of losses denoted as", "bbox": {"l": 50.112, "t": 291.86249, "r": 211.3766, "b": 300.76904, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "l$_{box}$", "bbox": {"l": 214.271, "t": 291.70309, "r": 229.19780000000003, "b": 300.54987, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": ".", "bbox": {"l": 229.696, "t": 291.86249, "r": 232.18665000000001, "b": 300.76904, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "l$_{box}$", "bbox": {"l": 236.49001, "t": 291.70309, "r": 251.41681000000003, "b": 300.54987, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "consists", "bbox": {"l": 254.81099999999998, "t": 291.86249, "r": 286.36255, "b": 300.76904, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "of the generally used", "bbox": {"l": 50.112, "t": 303.81747, "r": 137.45412, "b": 312.72403, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "l$_{1}$", "bbox": {"l": 141.298, "t": 303.65808, "r": 148.24258, "b": 312.50485, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "loss for object detection and the", "bbox": {"l": 152.58601, "t": 303.81747, "r": 286.36377, "b": 312.72403, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "IoU loss (", "bbox": {"l": 50.112015, "t": 315.77245999999997, "r": 89.683464, "b": 324.67902, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "l$_{iou}$", "bbox": {"l": 89.68602, "t": 315.61307, "r": 104.12046, "b": 324.45984, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": ") to be scale invariant as explained in [25]. In", "bbox": {"l": 104.61802, "t": 315.77245999999997, "r": 286.36572, "b": 324.67902, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "comparison to DETR, we do not use the Hungarian algo-", "bbox": {"l": 50.112019, "t": 327.72845, "r": 286.36511, "b": 336.6350100000001, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "rithm [15] to match the predicted bounding boxes with the", "bbox": {"l": 50.112019, "t": 339.68344, "r": 286.36508, "b": 348.59, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "ground-truth boxes, as we have already achieved a one-to-", "bbox": {"l": 50.112019, "t": 351.63843, "r": 286.36511, "b": 360.54498, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "one match through two steps: 1) Our token input sequence", "bbox": {"l": 50.112019, "t": 363.59341, "r": 286.36508, "b": 372.49996999999996, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "is naturally ordered, therefore the hidden states of the table", "bbox": {"l": 50.112019, "t": 375.5484, "r": 286.36511, "b": 384.45496, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "data cells are also in order when they are provided as in-", "bbox": {"l": 50.112019, "t": 387.50339, "r": 286.36514, "b": 396.40994, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "put to the", "bbox": {"l": 50.112019, "t": 399.45938, "r": 88.68721, "b": 408.36594, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "Cell BBox Decoder", "bbox": {"l": 91.646019, "t": 399.54904, "r": 170.0517, "b": 408.13681, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": ", and 2) Our bounding boxes", "bbox": {"l": 170.05103, "t": 399.45938, "r": 286.36438, "b": 408.36594, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "generation mechanism (see Sec.", "bbox": {"l": 50.112022, "t": 411.41437, "r": 181.96703, "b": 420.32092, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "3)", "bbox": {"l": 189.09029, "t": 411.41437, "r": 197.74918, "b": 420.32092, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "ensures a one-to-one", "bbox": {"l": 200.34789, "t": 411.41437, "r": 286.36511, "b": 420.32092, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "mapping between the cell content and its bounding box for", "bbox": {"l": 50.112022, "t": 423.36934999999994, "r": 286.36511, "b": 432.27591, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "all post-processed datasets.", "bbox": {"l": 50.112022, "t": 435.32434, "r": 158.2959, "b": 444.2309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 50.112022, "t": 448.01035, "r": 286.36499, "b": 468.87189, "coord_origin": "TOPLEFT"}, "confidence": 0.9724196195602417, "cells": [{"id": 49, "text": "The loss used to train the TableFormer can be defined as", "bbox": {"l": 62.067024, "t": 448.01035, "r": 286.36499, "b": 456.9169, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "following:", "bbox": {"l": 50.112022, "t": 459.96533, "r": 91.377113, "b": 468.87189, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "formula", "bbox": {"l": 124.33002, "t": 493.28094, "r": 286.36243, "b": 517.07172, "coord_origin": "TOPLEFT"}, "confidence": 0.9423348307609558, "cells": [{"id": 51, "text": "l$_{box}$", "bbox": {"l": 125.71502, "t": 493.28094, "r": 140.64182, "b": 502.12772, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "=", "bbox": {"l": 143.90701, "t": 493.28094, "r": 151.65593, "b": 502.12772, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "\u03bb$_{iou}$l$_{iou}$", "bbox": {"l": 154.42302, "t": 493.28094, "r": 186.62846, "b": 502.12772, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "+", "bbox": {"l": 189.34003, "t": 493.28094, "r": 197.08894, "b": 502.12772, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "\u03bb$_{l}$$_{1}$", "bbox": {"l": 199.30302, "t": 493.28094, "r": 211.64659, "b": 502.12772, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "l", "bbox": {"l": 124.33002, "t": 508.22495, "r": 127.30286, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "=", "bbox": {"l": 130.26602, "t": 508.22495, "r": 138.01494, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "\u03bbl$_{s}$", "bbox": {"l": 140.78203, "t": 508.22495, "r": 153.32629, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "+ (1", "bbox": {"l": 156.03903, "t": 508.22495, "r": 174.85541, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "\u2212", "bbox": {"l": 177.07103, "t": 507.66702, "r": 184.81995, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "\u03bb", "bbox": {"l": 187.03304, "t": 508.22495, "r": 192.84422, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": ")", "bbox": {"l": 192.84503, "t": 508.22495, "r": 196.71948, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "l$_{box}$", "bbox": {"l": 196.71902, "t": 508.22495, "r": 211.64583, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "(1)", "bbox": {"l": 274.74603, "t": 501.01132, "r": 286.36243, "b": 509.91788, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 50.11203, "t": 530.5920100000001, "r": 281.59692, "b": 540.21588, "coord_origin": "TOPLEFT"}, "confidence": 0.9363929629325867, "cells": [{"id": 65, "text": "where", "bbox": {"l": 50.11203, "t": 531.30933, "r": 74.450661, "b": 540.21588, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "\u03bb", "bbox": {"l": 76.941032, "t": 531.14993, "r": 82.75222, "b": 539.9967, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "\u2208", "bbox": {"l": 85.520035, "t": 530.5920100000001, "r": 92.162102, "b": 539.9967, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "[0, 1], and", "bbox": {"l": 94.653038, "t": 531.30933, "r": 135.59932, "b": 540.21588, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "\u03bb$_{iou}$, \u03bb$_{l}$$_{1}$", "bbox": {"l": 138.09004, "t": 531.14993, "r": 172.63162, "b": 539.9967, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "\u2208$_{R}$", "bbox": {"l": 175.89705, "t": 530.5920100000001, "r": 192.50104, "b": 539.9967, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "are hyper-parameters.", "bbox": {"l": 194.99205, "t": 531.30933, "r": 281.59692, "b": 540.21588, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "section_header", "bbox": {"l": 50.112045, "t": 555.91689, "r": 171.98335, "b": 566.66461, "coord_origin": "TOPLEFT"}, "confidence": 0.9554555416107178, "cells": [{"id": 72, "text": "5.", "bbox": {"l": 50.112045, "t": 555.91689, "r": 57.92831799999999, "b": 566.66461, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "Experimental Results", "bbox": {"l": 68.350014, "t": 555.91689, "r": 171.98335, "b": 566.66461, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "section_header", "bbox": {"l": 50.112045, "t": 576.26433, "r": 179.17502, "b": 586.1163799999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9538503289222717, "cells": [{"id": 74, "text": "5.1.", "bbox": {"l": 50.112045, "t": 576.26433, "r": 64.693237, "b": 586.1163799999999, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "Implementation Details", "bbox": {"l": 74.414032, "t": 576.26433, "r": 179.17502, "b": 586.1163799999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "text", "bbox": {"l": 50.112045, "t": 595.73433, "r": 286.36517, "b": 640.50688, "coord_origin": "TOPLEFT"}, "confidence": 0.9856163263320923, "cells": [{"id": 76, "text": "TableFormer uses ResNet-18 as the", "bbox": {"l": 62.067047, "t": 595.73433, "r": 202.97806, "b": 604.64088, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "CNN Backbone Net-", "bbox": {"l": 205.38405, "t": 595.82399, "r": 286.36008, "b": 604.41174, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "work", "bbox": {"l": 50.112045, "t": 607.77899, "r": 70.037247, "b": 616.3667399999999, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": ". The input images are resized to 448*448 pixels and", "bbox": {"l": 70.037048, "t": 607.68933, "r": 286.36496, "b": 616.59589, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "the feature map has a dimension of 28*28. Additionally, we", "bbox": {"l": 50.112049, "t": 619.64433, "r": 286.36517, "b": 628.55089, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "enforce the following input constraints:", "bbox": {"l": 50.112049, "t": 631.60033, "r": 207.03294, "b": 640.50688, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "formula", "bbox": {"l": 91.661049, "t": 653.828, "r": 286.36246, "b": 678.39588, "coord_origin": "TOPLEFT"}, "confidence": 0.844183623790741, "cells": [{"id": 82, "text": "Image width and height", "bbox": {"l": 91.661049, "t": 654.54532, "r": 186.01683, "b": 663.45187, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "\u2264", "bbox": {"l": 188.50705, "t": 653.828, "r": 196.25597, "b": 663.2327, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "1024 pixels", "bbox": {"l": 198.74605, "t": 654.54532, "r": 244.81310999999997, "b": 663.45187, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "Structural tags length", "bbox": {"l": 101.01604, "t": 669.48932, "r": 186.24606, "b": 678.39588, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "\u2264", "bbox": {"l": 188.73605, "t": 668.77201, "r": 196.48497, "b": 678.1767, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "512 tokens.", "bbox": {"l": 198.97505, "t": 669.48932, "r": 244.81296999999998, "b": 678.39588, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "(2)", "bbox": {"l": 274.74606, "t": 662.11731, "r": 286.36246, "b": 671.02388, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "text", "bbox": {"l": 50.112061, "t": 692.290314, "r": 286.36514, "b": 713.151878, "coord_origin": "TOPLEFT"}, "confidence": 0.9724979996681213, "cells": [{"id": 89, "text": "Although input constraints are used also by other methods,", "bbox": {"l": 50.112061, "t": 692.290314, "r": 286.36514, "b": 701.196877, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "such as EDD, ours are less restrictive due to the improved", "bbox": {"l": 50.112061, "t": 704.245316, "r": 286.36514, "b": 713.151878, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 308.86206, "t": 75.20830999999998, "r": 545.11523, "b": 108.0249, "coord_origin": "TOPLEFT"}, "confidence": 0.9799237847328186, "cells": [{"id": 91, "text": "runtime performance and lower memory footprint of Table-", "bbox": {"l": 308.86206, "t": 75.20830999999998, "r": 545.11523, "b": 84.11487, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Former.", "bbox": {"l": 308.86206, "t": 87.16332999999997, "r": 339.98523, "b": 96.06988999999999, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "This allows to utilize input samples with longer", "bbox": {"l": 346.88931, "t": 87.16332999999997, "r": 545.11523, "b": 96.06988999999999, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "sequences and images with larger dimensions.", "bbox": {"l": 308.86206, "t": 99.11835000000008, "r": 492.96097, "b": 108.0249, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 308.86206, "t": 116.22937000000002, "r": 545.1153, "b": 328.37405, "coord_origin": "TOPLEFT"}, "confidence": 0.9880930781364441, "cells": [{"id": 95, "text": "The Transformer Encoder consists of two \u201cTransformer", "bbox": {"l": 320.81705, "t": 116.22937000000002, "r": 545.11499, "b": 125.13593000000003, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "Encoder Layers\u201d, with an input feature size of 512, feed", "bbox": {"l": 308.86206, "t": 128.18439, "r": 545.11517, "b": 137.09094000000005, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "forward network of 1024, and 4 attention heads. As for the", "bbox": {"l": 308.86206, "t": 140.13940000000002, "r": 545.11505, "b": 149.04596000000004, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "Transformer Decoder it is composed of four \u201cTransformer", "bbox": {"l": 308.86206, "t": 152.09442, "r": 545.11511, "b": 161.00098000000003, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "Decoder Layers\u201d with similar input and output dimensions", "bbox": {"l": 308.86206, "t": 164.04944, "r": 545.11517, "b": 172.95599000000004, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "as the \u201cTransformer Encoder Layers\u201d.", "bbox": {"l": 308.86206, "t": 176.00543000000005, "r": 467.21756000000005, "b": 184.91198999999995, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "Even though our", "bbox": {"l": 475.43671, "t": 176.00543000000005, "r": 545.11511, "b": 184.91198999999995, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "model uses fewer layers and heads than the default imple-", "bbox": {"l": 308.86206, "t": 187.96045000000004, "r": 545.11511, "b": 196.86699999999996, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "mentation parameters, our extensive experimentation has", "bbox": {"l": 308.86206, "t": 199.91547000000003, "r": 545.11511, "b": 208.82201999999995, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "proved this setup to be more suitable for table images. We", "bbox": {"l": 308.86206, "t": 211.87048000000004, "r": 545.11517, "b": 220.77704000000006, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "attribute this finding to the inherent design of table im-", "bbox": {"l": 308.86206, "t": 223.82550000000003, "r": 545.11511, "b": 232.73206000000005, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "ages, which contain mostly lines and text, unlike the more", "bbox": {"l": 308.86206, "t": 235.78052000000002, "r": 545.11511, "b": 244.68706999999995, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "elaborate content present in other scopes (e.g. the COCO", "bbox": {"l": 308.86206, "t": 247.73650999999995, "r": 545.11523, "b": 256.64306999999997, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "dataset).", "bbox": {"l": 308.86206, "t": 259.69152999999994, "r": 342.3364, "b": 268.59808, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "Moreover, we have added ResNet blocks to the", "bbox": {"l": 348.95157, "t": 259.69152999999994, "r": 545.11517, "b": 268.59808, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "inputs of the Structure Decoder and Cell BBox Decoder.", "bbox": {"l": 308.86206, "t": 271.64655000000005, "r": 545.11517, "b": 280.55310000000003, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "This prevents a decoder having a stronger influence over the", "bbox": {"l": 308.86206, "t": 283.6015300000001, "r": 545.1153, "b": 292.50809, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "learned weights which would damage the other prediction", "bbox": {"l": 308.86206, "t": 295.55652, "r": 545.11511, "b": 304.46307, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "task (structure vs bounding boxes), but learn task specific", "bbox": {"l": 308.86206, "t": 307.51151, "r": 545.11511, "b": 316.41806, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "weights instead. Lastly our dropout layers are set to 0.5.", "bbox": {"l": 308.86206, "t": 319.4674999999999, "r": 532.48267, "b": 328.37405, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 308.86203, "t": 336.57751, "r": 545.11517, "b": 429.16998, "coord_origin": "TOPLEFT"}, "confidence": 0.9877589344978333, "cells": [{"id": 115, "text": "For training, TableFormer is trained with 3 Adam opti-", "bbox": {"l": 320.81705, "t": 336.57751, "r": 545.11499, "b": 345.48407000000003, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "mizers, each one for the", "bbox": {"l": 308.86206, "t": 348.5325000000001, "r": 403.7359, "b": 357.43906, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "CNN Backbone Network", "bbox": {"l": 406.07605, "t": 348.62216, "r": 503.54016, "b": 357.20993, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": ",", "bbox": {"l": 503.53906, "t": 348.5325000000001, "r": 506.02972, "b": 357.43906, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "Structure", "bbox": {"l": 508.40004999999996, "t": 348.62216, "r": 545.11224, "b": 357.20993, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "Decoder", "bbox": {"l": 308.86206, "t": 360.57715, "r": 343.1633, "b": 369.16492000000005, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": ", and", "bbox": {"l": 343.16306, "t": 360.48749, "r": 362.2016, "b": 369.39404, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Cell BBox Decoder", "bbox": {"l": 364.28604, "t": 360.57715, "r": 440.93829, "b": 369.16492000000005, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": ". Taking the PubTabNet as", "bbox": {"l": 440.93903, "t": 360.48749, "r": 545.10797, "b": 369.39404, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "an example for our parameter set up, the initializing learn-", "bbox": {"l": 308.86203, "t": 372.44247, "r": 545.11511, "b": 381.34903, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "ing rate is 0.001 for 12 epochs with a batch size of 24, and", "bbox": {"l": 308.86203, "t": 384.3984699999999, "r": 545.11517, "b": 393.30502, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "\u03bb", "bbox": {"l": 308.86203, "t": 396.19406000000004, "r": 314.67322, "b": 405.04083, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "set to 0.5.", "bbox": {"l": 318.65802, "t": 396.35345, "r": 360.39139, "b": 405.2600100000001, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "Afterwards, we reduce the learning rate to", "bbox": {"l": 367.96295, "t": 396.35345, "r": 545.10803, "b": 405.2600100000001, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "0.0001, the batch size to 18 and train for 12 more epochs or", "bbox": {"l": 308.86203, "t": 408.30844, "r": 545.11511, "b": 417.215, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "convergence.", "bbox": {"l": 308.86203, "t": 420.26343, "r": 360.9664, "b": 429.16998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 308.86203, "t": 437.37441999999993, "r": 545.11523, "b": 553.87689, "coord_origin": "TOPLEFT"}, "confidence": 0.9884491562843323, "cells": [{"id": 131, "text": "TableFormer is implemented with PyTorch and Torchvi-", "bbox": {"l": 320.81702, "t": 437.37441999999993, "r": 545.11499, "b": 446.28098, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "sion libraries [22].", "bbox": {"l": 308.86203, "t": 449.32941, "r": 384.62759, "b": 458.23596, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "To speed up the inference, the image", "bbox": {"l": 391.37228, "t": 449.32941, "r": 545.11511, "b": 458.23596, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "undergoes a single forward pass through the", "bbox": {"l": 308.86203, "t": 461.28439, "r": 494.00693000000007, "b": 470.19095, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "CNN Back-", "bbox": {"l": 498.07803, "t": 461.37405, "r": 545.11145, "b": 469.96182, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "bone Network", "bbox": {"l": 308.86203, "t": 473.32904, "r": 364.44336, "b": 481.91681, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "and transformer encoder. This eliminates the", "bbox": {"l": 367.06104, "t": 473.23938, "r": 545.11267, "b": 482.14594, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "overhead of generating the same features for each decoding", "bbox": {"l": 308.86203, "t": 485.19437, "r": 545.11511, "b": 494.10092, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "step. Similarly, we employ a \u2019caching\u2019 technique to preform", "bbox": {"l": 308.86203, "t": 497.14935, "r": 545.11523, "b": 506.05591, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "faster autoregressive decoding. This is achieved by storing", "bbox": {"l": 308.86203, "t": 509.10535, "r": 545.11511, "b": 518.0119, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "the features of decoded tokens so we can reuse them for", "bbox": {"l": 308.86203, "t": 521.06033, "r": 545.11517, "b": 529.9668899999999, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "each time step. Therefore, we only compute the attention", "bbox": {"l": 308.86203, "t": 533.01532, "r": 545.11517, "b": 541.9218900000001, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "for each new tag.", "bbox": {"l": 308.86203, "t": 544.97034, "r": 377.21548, "b": 553.87689, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "section_header", "bbox": {"l": 308.86203, "t": 579.55432, "r": 397.44281, "b": 589.40637, "coord_origin": "TOPLEFT"}, "confidence": 0.9450808763504028, "cells": [{"id": 144, "text": "5.2.", "bbox": {"l": 308.86203, "t": 579.55432, "r": 323.9046, "b": 589.40637, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "Generalization", "bbox": {"l": 333.93301, "t": 579.55432, "r": 397.44281, "b": 589.40637, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 308.86203, "t": 603.44933, "r": 545.11517, "b": 672.13189, "coord_origin": "TOPLEFT"}, "confidence": 0.9880595803260803, "cells": [{"id": 146, "text": "TableFormer is evaluated on three major publicly avail-", "bbox": {"l": 320.81702, "t": 603.44933, "r": 545.11493, "b": 612.3558800000001, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "able datasets of different nature to prove the generalization", "bbox": {"l": 308.86203, "t": 615.40433, "r": 545.11511, "b": 624.31088, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "and effectiveness of our model. The datasets used for eval-", "bbox": {"l": 308.86203, "t": 627.35933, "r": 545.11517, "b": 636.26588, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "uation are the PubTabNet, FinTabNet and TableBank which", "bbox": {"l": 308.86203, "t": 639.31433, "r": 545.11511, "b": 648.22089, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "stem from the scientific, financial and general domains re-", "bbox": {"l": 308.86203, "t": 651.27032, "r": 545.11517, "b": 660.17688, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "spectively.", "bbox": {"l": 308.86203, "t": 663.22533, "r": 350.70493, "b": 672.13189, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "text", "bbox": {"l": 308.86203, "t": 680.33533, "r": 545.11523, "b": 713.152893, "coord_origin": "TOPLEFT"}, "confidence": 0.9830910563468933, "cells": [{"id": 152, "text": "We also share our baseline results on the challenging", "bbox": {"l": 320.81702, "t": 680.33533, "r": 545.11505, "b": 689.24189, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "SynthTabNet dataset.", "bbox": {"l": 308.86203, "t": 692.290329, "r": 396.21411, "b": 701.196892, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "Throughout our experiments, the", "bbox": {"l": 406.40585, "t": 692.290329, "r": 545.11523, "b": 701.196892, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "same parameters stated in Sec. 5.1 are utilized.", "bbox": {"l": 308.86203, "t": 704.246323, "r": 495.93982, "b": 713.152893, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "page_footer", "bbox": {"l": 295.12103, "t": 734.133327, "r": 300.10233, "b": 743.03989, "coord_origin": "TOPLEFT"}, "confidence": 0.8820409178733826, "cells": [{"id": 156, "text": "6", "bbox": {"l": 295.12103, "t": 734.133327, "r": 300.10233, "b": 743.03989, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "text", "id": 5, "page_no": 5, "cluster": {"id": 5, "label": "text", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 286.36514, "b": 155.84600999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.9868090152740479, "cells": [{"id": 0, "text": "tention encoding is then multiplied to the encoded image to", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 286.36514, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "produce a feature for each table cell. Notice that this is dif-", "bbox": {"l": 50.112, "t": 87.16339000000005, "r": 286.36508, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "ferent than the typical object detection problem where im-", "bbox": {"l": 50.112, "t": 99.11841000000004, "r": 286.36508, "b": 108.02495999999985, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "balances between the number of detections and the amount", "bbox": {"l": 50.112, "t": 111.07343000000003, "r": 286.36508, "b": 119.97997999999984, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "of objects may exist. In our case, we know up front that", "bbox": {"l": 50.112, "t": 123.02844000000005, "r": 286.36508, "b": 131.93499999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "the produced detections always match with the table cells", "bbox": {"l": 50.112, "t": 134.98443999999995, "r": 286.36514, "b": 143.89099, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "in number and correspondence.", "bbox": {"l": 50.112, "t": 146.93944999999997, "r": 175.16254, "b": 155.84600999999998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "tention encoding is then multiplied to the encoded image to produce a feature for each table cell. Notice that this is different than the typical object detection problem where imbalances between the number of detections and the amount of objects may exist. In our case, we know up front that the produced detections always match with the table cells in number and correspondence."}, {"label": "text", "id": 6, "page_no": 5, "cluster": {"id": 6, "label": "text", "bbox": {"l": 50.112, "t": 159.62445000000002, "r": 286.36511, "b": 240.26306, "coord_origin": "TOPLEFT"}, "confidence": 0.9860327839851379, "cells": [{"id": 7, "text": "The output features for each table cell are then fed", "bbox": {"l": 62.067001, "t": 159.62445000000002, "r": 286.36496, "b": 168.53101000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "into the feed-forward network (FFN). The FFN consists", "bbox": {"l": 50.112, "t": 171.58043999999995, "r": 286.36511, "b": 180.48699999999997, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "of a Multi-Layer Perceptron (3 layers with ReLU activa-", "bbox": {"l": 50.112, "t": 183.53545999999994, "r": 286.36511, "b": 192.44201999999996, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "tion function) that predicts the normalized coordinates for", "bbox": {"l": 50.112, "t": 195.49048000000005, "r": 286.36511, "b": 204.39702999999997, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "the bounding box of each table cell. Finally, the predicted", "bbox": {"l": 50.112, "t": 207.44550000000004, "r": 286.36511, "b": 216.35204999999996, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "bounding boxes are classified based on whether they are", "bbox": {"l": 50.112, "t": 219.40051000000005, "r": 286.36511, "b": 228.30706999999995, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "empty or not using a linear layer.", "bbox": {"l": 50.112, "t": 231.35650999999996, "r": 181.54855, "b": 240.26306, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The output features for each table cell are then fed into the feed-forward network (FFN). The FFN consists of a Multi-Layer Perceptron (3 layers with ReLU activation function) that predicts the normalized coordinates for the bounding box of each table cell. Finally, the predicted bounding boxes are classified based on whether they are empty or not using a linear layer."}, {"label": "text", "id": 4, "page_no": 5, "cluster": {"id": 4, "label": "text", "bbox": {"l": 50.112, "t": 243.92193999999995, "r": 286.36572, "b": 444.2309, "coord_origin": "TOPLEFT"}, "confidence": 0.9873637557029724, "cells": [{"id": 14, "text": "Loss Functions.", "bbox": {"l": 62.067001, "t": 243.92193999999995, "r": 129.21492, "b": 252.87829999999997, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "We formulate a multi-task loss Eq. 2", "bbox": {"l": 134.451, "t": 244.04150000000004, "r": 286.36078, "b": 252.94806000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "to train our network. The Cross-Entropy loss (denoted as", "bbox": {"l": 50.112007, "t": 255.99652000000003, "r": 286.36511, "b": 264.90308000000005, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "l$_{s}$", "bbox": {"l": 50.112007, "t": 267.79309, "r": 56.84528, "b": 276.63989000000004, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": ") is used to train the", "bbox": {"l": 57.343006, "t": 267.95250999999996, "r": 135.39996, "b": 276.85907, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Structure Decoder", "bbox": {"l": 137.735, "t": 268.04218000000003, "r": 211.07965, "b": 276.62994000000003, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "which predicts the", "bbox": {"l": 213.63699, "t": 267.95250999999996, "r": 286.36395, "b": 276.85907, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "structure tokens. As for the", "bbox": {"l": 50.112, "t": 279.90747, "r": 158.82388, "b": 288.81406, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "Cell BBox Decoder", "bbox": {"l": 161.31799, "t": 279.99712999999997, "r": 238.79712, "b": 288.58493, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "it is trained", "bbox": {"l": 241.521, "t": 279.90747, "r": 286.36264, "b": 288.81406, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "with a combination of losses denoted as", "bbox": {"l": 50.112, "t": 291.86249, "r": 211.3766, "b": 300.76904, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "l$_{box}$", "bbox": {"l": 214.271, "t": 291.70309, "r": 229.19780000000003, "b": 300.54987, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": ".", "bbox": {"l": 229.696, "t": 291.86249, "r": 232.18665000000001, "b": 300.76904, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "l$_{box}$", "bbox": {"l": 236.49001, "t": 291.70309, "r": 251.41681000000003, "b": 300.54987, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "consists", "bbox": {"l": 254.81099999999998, "t": 291.86249, "r": 286.36255, "b": 300.76904, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "of the generally used", "bbox": {"l": 50.112, "t": 303.81747, "r": 137.45412, "b": 312.72403, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "l$_{1}$", "bbox": {"l": 141.298, "t": 303.65808, "r": 148.24258, "b": 312.50485, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "loss for object detection and the", "bbox": {"l": 152.58601, "t": 303.81747, "r": 286.36377, "b": 312.72403, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "IoU loss (", "bbox": {"l": 50.112015, "t": 315.77245999999997, "r": 89.683464, "b": 324.67902, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "l$_{iou}$", "bbox": {"l": 89.68602, "t": 315.61307, "r": 104.12046, "b": 324.45984, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": ") to be scale invariant as explained in [25]. In", "bbox": {"l": 104.61802, "t": 315.77245999999997, "r": 286.36572, "b": 324.67902, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "comparison to DETR, we do not use the Hungarian algo-", "bbox": {"l": 50.112019, "t": 327.72845, "r": 286.36511, "b": 336.6350100000001, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "rithm [15] to match the predicted bounding boxes with the", "bbox": {"l": 50.112019, "t": 339.68344, "r": 286.36508, "b": 348.59, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "ground-truth boxes, as we have already achieved a one-to-", "bbox": {"l": 50.112019, "t": 351.63843, "r": 286.36511, "b": 360.54498, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "one match through two steps: 1) Our token input sequence", "bbox": {"l": 50.112019, "t": 363.59341, "r": 286.36508, "b": 372.49996999999996, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "is naturally ordered, therefore the hidden states of the table", "bbox": {"l": 50.112019, "t": 375.5484, "r": 286.36511, "b": 384.45496, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "data cells are also in order when they are provided as in-", "bbox": {"l": 50.112019, "t": 387.50339, "r": 286.36514, "b": 396.40994, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "put to the", "bbox": {"l": 50.112019, "t": 399.45938, "r": 88.68721, "b": 408.36594, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "Cell BBox Decoder", "bbox": {"l": 91.646019, "t": 399.54904, "r": 170.0517, "b": 408.13681, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": ", and 2) Our bounding boxes", "bbox": {"l": 170.05103, "t": 399.45938, "r": 286.36438, "b": 408.36594, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "generation mechanism (see Sec.", "bbox": {"l": 50.112022, "t": 411.41437, "r": 181.96703, "b": 420.32092, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "3)", "bbox": {"l": 189.09029, "t": 411.41437, "r": 197.74918, "b": 420.32092, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "ensures a one-to-one", "bbox": {"l": 200.34789, "t": 411.41437, "r": 286.36511, "b": 420.32092, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "mapping between the cell content and its bounding box for", "bbox": {"l": 50.112022, "t": 423.36934999999994, "r": 286.36511, "b": 432.27591, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "all post-processed datasets.", "bbox": {"l": 50.112022, "t": 435.32434, "r": 158.2959, "b": 444.2309, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Loss Functions. We formulate a multi-task loss Eq. 2 to train our network. The Cross-Entropy loss (denoted as l$_{s}$ ) is used to train the Structure Decoder which predicts the structure tokens. As for the Cell BBox Decoder it is trained with a combination of losses denoted as l$_{box}$ . l$_{box}$ consists of the generally used l$_{1}$ loss for object detection and the IoU loss ( l$_{iou}$ ) to be scale invariant as explained in [25]. In comparison to DETR, we do not use the Hungarian algorithm [15] to match the predicted bounding boxes with the ground-truth boxes, as we have already achieved a one-toone match through two steps: 1) Our token input sequence is naturally ordered, therefore the hidden states of the table data cells are also in order when they are provided as input to the Cell BBox Decoder , and 2) Our bounding boxes generation mechanism (see Sec. 3) ensures a one-to-one mapping between the cell content and its bounding box for all post-processed datasets."}, {"label": "text", "id": 11, "page_no": 5, "cluster": {"id": 11, "label": "text", "bbox": {"l": 50.112022, "t": 448.01035, "r": 286.36499, "b": 468.87189, "coord_origin": "TOPLEFT"}, "confidence": 0.9724196195602417, "cells": [{"id": 49, "text": "The loss used to train the TableFormer can be defined as", "bbox": {"l": 62.067024, "t": 448.01035, "r": 286.36499, "b": 456.9169, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "following:", "bbox": {"l": 50.112022, "t": 459.96533, "r": 91.377113, "b": 468.87189, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The loss used to train the TableFormer can be defined as following:"}, {"label": "formula", "id": 15, "page_no": 5, "cluster": {"id": 15, "label": "formula", "bbox": {"l": 124.33002, "t": 493.28094, "r": 286.36243, "b": 517.07172, "coord_origin": "TOPLEFT"}, "confidence": 0.9423348307609558, "cells": [{"id": 51, "text": "l$_{box}$", "bbox": {"l": 125.71502, "t": 493.28094, "r": 140.64182, "b": 502.12772, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "=", "bbox": {"l": 143.90701, "t": 493.28094, "r": 151.65593, "b": 502.12772, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "\u03bb$_{iou}$l$_{iou}$", "bbox": {"l": 154.42302, "t": 493.28094, "r": 186.62846, "b": 502.12772, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "+", "bbox": {"l": 189.34003, "t": 493.28094, "r": 197.08894, "b": 502.12772, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "\u03bb$_{l}$$_{1}$", "bbox": {"l": 199.30302, "t": 493.28094, "r": 211.64659, "b": 502.12772, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "l", "bbox": {"l": 124.33002, "t": 508.22495, "r": 127.30286, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "=", "bbox": {"l": 130.26602, "t": 508.22495, "r": 138.01494, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "\u03bbl$_{s}$", "bbox": {"l": 140.78203, "t": 508.22495, "r": 153.32629, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "+ (1", "bbox": {"l": 156.03903, "t": 508.22495, "r": 174.85541, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "\u2212", "bbox": {"l": 177.07103, "t": 507.66702, "r": 184.81995, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "\u03bb", "bbox": {"l": 187.03304, "t": 508.22495, "r": 192.84422, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": ")", "bbox": {"l": 192.84503, "t": 508.22495, "r": 196.71948, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "l$_{box}$", "bbox": {"l": 196.71902, "t": 508.22495, "r": 211.64583, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "(1)", "bbox": {"l": 274.74603, "t": 501.01132, "r": 286.36243, "b": 509.91788, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "l$_{box}$ = \u03bb$_{iou}$l$_{iou}$ + \u03bb$_{l}$$_{1}$ l = \u03bbl$_{s}$ + (1 \u2212 \u03bb ) l$_{box}$ (1)"}, {"label": "text", "id": 16, "page_no": 5, "cluster": {"id": 16, "label": "text", "bbox": {"l": 50.11203, "t": 530.5920100000001, "r": 281.59692, "b": 540.21588, "coord_origin": "TOPLEFT"}, "confidence": 0.9363929629325867, "cells": [{"id": 65, "text": "where", "bbox": {"l": 50.11203, "t": 531.30933, "r": 74.450661, "b": 540.21588, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "\u03bb", "bbox": {"l": 76.941032, "t": 531.14993, "r": 82.75222, "b": 539.9967, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "\u2208", "bbox": {"l": 85.520035, "t": 530.5920100000001, "r": 92.162102, "b": 539.9967, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "[0, 1], and", "bbox": {"l": 94.653038, "t": 531.30933, "r": 135.59932, "b": 540.21588, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "\u03bb$_{iou}$, \u03bb$_{l}$$_{1}$", "bbox": {"l": 138.09004, "t": 531.14993, "r": 172.63162, "b": 539.9967, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "\u2208$_{R}$", "bbox": {"l": 175.89705, "t": 530.5920100000001, "r": 192.50104, "b": 539.9967, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "are hyper-parameters.", "bbox": {"l": 194.99205, "t": 531.30933, "r": 281.59692, "b": 540.21588, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "where \u03bb \u2208 [0, 1], and \u03bb$_{iou}$, \u03bb$_{l}$$_{1}$ \u2208$_{R}$ are hyper-parameters."}, {"label": "section_header", "id": 12, "page_no": 5, "cluster": {"id": 12, "label": "section_header", "bbox": {"l": 50.112045, "t": 555.91689, "r": 171.98335, "b": 566.66461, "coord_origin": "TOPLEFT"}, "confidence": 0.9554555416107178, "cells": [{"id": 72, "text": "5.", "bbox": {"l": 50.112045, "t": 555.91689, "r": 57.92831799999999, "b": 566.66461, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "Experimental Results", "bbox": {"l": 68.350014, "t": 555.91689, "r": 171.98335, "b": 566.66461, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5. Experimental Results"}, {"label": "section_header", "id": 13, "page_no": 5, "cluster": {"id": 13, "label": "section_header", "bbox": {"l": 50.112045, "t": 576.26433, "r": 179.17502, "b": 586.1163799999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9538503289222717, "cells": [{"id": 74, "text": "5.1.", "bbox": {"l": 50.112045, "t": 576.26433, "r": 64.693237, "b": 586.1163799999999, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "Implementation Details", "bbox": {"l": 74.414032, "t": 576.26433, "r": 179.17502, "b": 586.1163799999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5.1. Implementation Details"}, {"label": "text", "id": 7, "page_no": 5, "cluster": {"id": 7, "label": "text", "bbox": {"l": 50.112045, "t": 595.73433, "r": 286.36517, "b": 640.50688, "coord_origin": "TOPLEFT"}, "confidence": 0.9856163263320923, "cells": [{"id": 76, "text": "TableFormer uses ResNet-18 as the", "bbox": {"l": 62.067047, "t": 595.73433, "r": 202.97806, "b": 604.64088, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "CNN Backbone Net-", "bbox": {"l": 205.38405, "t": 595.82399, "r": 286.36008, "b": 604.41174, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "work", "bbox": {"l": 50.112045, "t": 607.77899, "r": 70.037247, "b": 616.3667399999999, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": ". The input images are resized to 448*448 pixels and", "bbox": {"l": 70.037048, "t": 607.68933, "r": 286.36496, "b": 616.59589, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "the feature map has a dimension of 28*28. Additionally, we", "bbox": {"l": 50.112049, "t": 619.64433, "r": 286.36517, "b": 628.55089, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "enforce the following input constraints:", "bbox": {"l": 50.112049, "t": 631.60033, "r": 207.03294, "b": 640.50688, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "TableFormer uses ResNet-18 as the CNN Backbone Network . The input images are resized to 448*448 pixels and the feature map has a dimension of 28*28. Additionally, we enforce the following input constraints:"}, {"label": "formula", "id": 18, "page_no": 5, "cluster": {"id": 18, "label": "formula", "bbox": {"l": 91.661049, "t": 653.828, "r": 286.36246, "b": 678.39588, "coord_origin": "TOPLEFT"}, "confidence": 0.844183623790741, "cells": [{"id": 82, "text": "Image width and height", "bbox": {"l": 91.661049, "t": 654.54532, "r": 186.01683, "b": 663.45187, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "\u2264", "bbox": {"l": 188.50705, "t": 653.828, "r": 196.25597, "b": 663.2327, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "1024 pixels", "bbox": {"l": 198.74605, "t": 654.54532, "r": 244.81310999999997, "b": 663.45187, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "Structural tags length", "bbox": {"l": 101.01604, "t": 669.48932, "r": 186.24606, "b": 678.39588, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "\u2264", "bbox": {"l": 188.73605, "t": 668.77201, "r": 196.48497, "b": 678.1767, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "512 tokens.", "bbox": {"l": 198.97505, "t": 669.48932, "r": 244.81296999999998, "b": 678.39588, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "(2)", "bbox": {"l": 274.74606, "t": 662.11731, "r": 286.36246, "b": 671.02388, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Image width and height \u2264 1024 pixels Structural tags length \u2264 512 tokens. (2)"}, {"label": "text", "id": 10, "page_no": 5, "cluster": {"id": 10, "label": "text", "bbox": {"l": 50.112061, "t": 692.290314, "r": 286.36514, "b": 713.151878, "coord_origin": "TOPLEFT"}, "confidence": 0.9724979996681213, "cells": [{"id": 89, "text": "Although input constraints are used also by other methods,", "bbox": {"l": 50.112061, "t": 692.290314, "r": 286.36514, "b": 701.196877, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "such as EDD, ours are less restrictive due to the improved", "bbox": {"l": 50.112061, "t": 704.245316, "r": 286.36514, "b": 713.151878, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Although input constraints are used also by other methods, such as EDD, ours are less restrictive due to the improved"}, {"label": "text", "id": 9, "page_no": 5, "cluster": {"id": 9, "label": "text", "bbox": {"l": 308.86206, "t": 75.20830999999998, "r": 545.11523, "b": 108.0249, "coord_origin": "TOPLEFT"}, "confidence": 0.9799237847328186, "cells": [{"id": 91, "text": "runtime performance and lower memory footprint of Table-", "bbox": {"l": 308.86206, "t": 75.20830999999998, "r": 545.11523, "b": 84.11487, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Former.", "bbox": {"l": 308.86206, "t": 87.16332999999997, "r": 339.98523, "b": 96.06988999999999, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "This allows to utilize input samples with longer", "bbox": {"l": 346.88931, "t": 87.16332999999997, "r": 545.11523, "b": 96.06988999999999, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "sequences and images with larger dimensions.", "bbox": {"l": 308.86206, "t": 99.11835000000008, "r": 492.96097, "b": 108.0249, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "runtime performance and lower memory footprint of TableFormer. This allows to utilize input samples with longer sequences and images with larger dimensions."}, {"label": "text", "id": 1, "page_no": 5, "cluster": {"id": 1, "label": "text", "bbox": {"l": 308.86206, "t": 116.22937000000002, "r": 545.1153, "b": 328.37405, "coord_origin": "TOPLEFT"}, "confidence": 0.9880930781364441, "cells": [{"id": 95, "text": "The Transformer Encoder consists of two \u201cTransformer", "bbox": {"l": 320.81705, "t": 116.22937000000002, "r": 545.11499, "b": 125.13593000000003, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "Encoder Layers\u201d, with an input feature size of 512, feed", "bbox": {"l": 308.86206, "t": 128.18439, "r": 545.11517, "b": 137.09094000000005, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "forward network of 1024, and 4 attention heads. As for the", "bbox": {"l": 308.86206, "t": 140.13940000000002, "r": 545.11505, "b": 149.04596000000004, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "Transformer Decoder it is composed of four \u201cTransformer", "bbox": {"l": 308.86206, "t": 152.09442, "r": 545.11511, "b": 161.00098000000003, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "Decoder Layers\u201d with similar input and output dimensions", "bbox": {"l": 308.86206, "t": 164.04944, "r": 545.11517, "b": 172.95599000000004, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "as the \u201cTransformer Encoder Layers\u201d.", "bbox": {"l": 308.86206, "t": 176.00543000000005, "r": 467.21756000000005, "b": 184.91198999999995, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "Even though our", "bbox": {"l": 475.43671, "t": 176.00543000000005, "r": 545.11511, "b": 184.91198999999995, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "model uses fewer layers and heads than the default imple-", "bbox": {"l": 308.86206, "t": 187.96045000000004, "r": 545.11511, "b": 196.86699999999996, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "mentation parameters, our extensive experimentation has", "bbox": {"l": 308.86206, "t": 199.91547000000003, "r": 545.11511, "b": 208.82201999999995, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "proved this setup to be more suitable for table images. We", "bbox": {"l": 308.86206, "t": 211.87048000000004, "r": 545.11517, "b": 220.77704000000006, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "attribute this finding to the inherent design of table im-", "bbox": {"l": 308.86206, "t": 223.82550000000003, "r": 545.11511, "b": 232.73206000000005, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "ages, which contain mostly lines and text, unlike the more", "bbox": {"l": 308.86206, "t": 235.78052000000002, "r": 545.11511, "b": 244.68706999999995, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "elaborate content present in other scopes (e.g. the COCO", "bbox": {"l": 308.86206, "t": 247.73650999999995, "r": 545.11523, "b": 256.64306999999997, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "dataset).", "bbox": {"l": 308.86206, "t": 259.69152999999994, "r": 342.3364, "b": 268.59808, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "Moreover, we have added ResNet blocks to the", "bbox": {"l": 348.95157, "t": 259.69152999999994, "r": 545.11517, "b": 268.59808, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "inputs of the Structure Decoder and Cell BBox Decoder.", "bbox": {"l": 308.86206, "t": 271.64655000000005, "r": 545.11517, "b": 280.55310000000003, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "This prevents a decoder having a stronger influence over the", "bbox": {"l": 308.86206, "t": 283.6015300000001, "r": 545.1153, "b": 292.50809, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "learned weights which would damage the other prediction", "bbox": {"l": 308.86206, "t": 295.55652, "r": 545.11511, "b": 304.46307, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "task (structure vs bounding boxes), but learn task specific", "bbox": {"l": 308.86206, "t": 307.51151, "r": 545.11511, "b": 316.41806, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "weights instead. Lastly our dropout layers are set to 0.5.", "bbox": {"l": 308.86206, "t": 319.4674999999999, "r": 532.48267, "b": 328.37405, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The Transformer Encoder consists of two \"Transformer Encoder Layers\", with an input feature size of 512, feed forward network of 1024, and 4 attention heads. As for the Transformer Decoder it is composed of four \"Transformer Decoder Layers\" with similar input and output dimensions as the \"Transformer Encoder Layers\". Even though our model uses fewer layers and heads than the default implementation parameters, our extensive experimentation has proved this setup to be more suitable for table images. We attribute this finding to the inherent design of table images, which contain mostly lines and text, unlike the more elaborate content present in other scopes (e.g. the COCO dataset). Moreover, we have added ResNet blocks to the inputs of the Structure Decoder and Cell BBox Decoder. This prevents a decoder having a stronger influence over the learned weights which would damage the other prediction task (structure vs bounding boxes), but learn task specific weights instead. Lastly our dropout layers are set to 0.5."}, {"label": "text", "id": 3, "page_no": 5, "cluster": {"id": 3, "label": "text", "bbox": {"l": 308.86203, "t": 336.57751, "r": 545.11517, "b": 429.16998, "coord_origin": "TOPLEFT"}, "confidence": 0.9877589344978333, "cells": [{"id": 115, "text": "For training, TableFormer is trained with 3 Adam opti-", "bbox": {"l": 320.81705, "t": 336.57751, "r": 545.11499, "b": 345.48407000000003, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "mizers, each one for the", "bbox": {"l": 308.86206, "t": 348.5325000000001, "r": 403.7359, "b": 357.43906, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "CNN Backbone Network", "bbox": {"l": 406.07605, "t": 348.62216, "r": 503.54016, "b": 357.20993, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": ",", "bbox": {"l": 503.53906, "t": 348.5325000000001, "r": 506.02972, "b": 357.43906, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "Structure", "bbox": {"l": 508.40004999999996, "t": 348.62216, "r": 545.11224, "b": 357.20993, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "Decoder", "bbox": {"l": 308.86206, "t": 360.57715, "r": 343.1633, "b": 369.16492000000005, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": ", and", "bbox": {"l": 343.16306, "t": 360.48749, "r": 362.2016, "b": 369.39404, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Cell BBox Decoder", "bbox": {"l": 364.28604, "t": 360.57715, "r": 440.93829, "b": 369.16492000000005, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": ". Taking the PubTabNet as", "bbox": {"l": 440.93903, "t": 360.48749, "r": 545.10797, "b": 369.39404, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "an example for our parameter set up, the initializing learn-", "bbox": {"l": 308.86203, "t": 372.44247, "r": 545.11511, "b": 381.34903, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "ing rate is 0.001 for 12 epochs with a batch size of 24, and", "bbox": {"l": 308.86203, "t": 384.3984699999999, "r": 545.11517, "b": 393.30502, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "\u03bb", "bbox": {"l": 308.86203, "t": 396.19406000000004, "r": 314.67322, "b": 405.04083, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "set to 0.5.", "bbox": {"l": 318.65802, "t": 396.35345, "r": 360.39139, "b": 405.2600100000001, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "Afterwards, we reduce the learning rate to", "bbox": {"l": 367.96295, "t": 396.35345, "r": 545.10803, "b": 405.2600100000001, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "0.0001, the batch size to 18 and train for 12 more epochs or", "bbox": {"l": 308.86203, "t": 408.30844, "r": 545.11511, "b": 417.215, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "convergence.", "bbox": {"l": 308.86203, "t": 420.26343, "r": 360.9664, "b": 429.16998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "For training, TableFormer is trained with 3 Adam optimizers, each one for the CNN Backbone Network , Structure Decoder , and Cell BBox Decoder . Taking the PubTabNet as an example for our parameter set up, the initializing learning rate is 0.001 for 12 epochs with a batch size of 24, and \u03bb set to 0.5. Afterwards, we reduce the learning rate to 0.0001, the batch size to 18 and train for 12 more epochs or convergence."}, {"label": "text", "id": 0, "page_no": 5, "cluster": {"id": 0, "label": "text", "bbox": {"l": 308.86203, "t": 437.37441999999993, "r": 545.11523, "b": 553.87689, "coord_origin": "TOPLEFT"}, "confidence": 0.9884491562843323, "cells": [{"id": 131, "text": "TableFormer is implemented with PyTorch and Torchvi-", "bbox": {"l": 320.81702, "t": 437.37441999999993, "r": 545.11499, "b": 446.28098, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "sion libraries [22].", "bbox": {"l": 308.86203, "t": 449.32941, "r": 384.62759, "b": 458.23596, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "To speed up the inference, the image", "bbox": {"l": 391.37228, "t": 449.32941, "r": 545.11511, "b": 458.23596, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "undergoes a single forward pass through the", "bbox": {"l": 308.86203, "t": 461.28439, "r": 494.00693000000007, "b": 470.19095, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "CNN Back-", "bbox": {"l": 498.07803, "t": 461.37405, "r": 545.11145, "b": 469.96182, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "bone Network", "bbox": {"l": 308.86203, "t": 473.32904, "r": 364.44336, "b": 481.91681, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "and transformer encoder. This eliminates the", "bbox": {"l": 367.06104, "t": 473.23938, "r": 545.11267, "b": 482.14594, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "overhead of generating the same features for each decoding", "bbox": {"l": 308.86203, "t": 485.19437, "r": 545.11511, "b": 494.10092, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "step. Similarly, we employ a \u2019caching\u2019 technique to preform", "bbox": {"l": 308.86203, "t": 497.14935, "r": 545.11523, "b": 506.05591, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "faster autoregressive decoding. This is achieved by storing", "bbox": {"l": 308.86203, "t": 509.10535, "r": 545.11511, "b": 518.0119, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "the features of decoded tokens so we can reuse them for", "bbox": {"l": 308.86203, "t": 521.06033, "r": 545.11517, "b": 529.9668899999999, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "each time step. Therefore, we only compute the attention", "bbox": {"l": 308.86203, "t": 533.01532, "r": 545.11517, "b": 541.9218900000001, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "for each new tag.", "bbox": {"l": 308.86203, "t": 544.97034, "r": 377.21548, "b": 553.87689, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "TableFormer is implemented with PyTorch and Torchvision libraries [22]. To speed up the inference, the image undergoes a single forward pass through the CNN Backbone Network and transformer encoder. This eliminates the overhead of generating the same features for each decoding step. Similarly, we employ a 'caching' technique to preform faster autoregressive decoding. This is achieved by storing the features of decoded tokens so we can reuse them for each time step. Therefore, we only compute the attention for each new tag."}, {"label": "section_header", "id": 14, "page_no": 5, "cluster": {"id": 14, "label": "section_header", "bbox": {"l": 308.86203, "t": 579.55432, "r": 397.44281, "b": 589.40637, "coord_origin": "TOPLEFT"}, "confidence": 0.9450808763504028, "cells": [{"id": 144, "text": "5.2.", "bbox": {"l": 308.86203, "t": 579.55432, "r": 323.9046, "b": 589.40637, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "Generalization", "bbox": {"l": 333.93301, "t": 579.55432, "r": 397.44281, "b": 589.40637, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5.2. Generalization"}, {"label": "text", "id": 2, "page_no": 5, "cluster": {"id": 2, "label": "text", "bbox": {"l": 308.86203, "t": 603.44933, "r": 545.11517, "b": 672.13189, "coord_origin": "TOPLEFT"}, "confidence": 0.9880595803260803, "cells": [{"id": 146, "text": "TableFormer is evaluated on three major publicly avail-", "bbox": {"l": 320.81702, "t": 603.44933, "r": 545.11493, "b": 612.3558800000001, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "able datasets of different nature to prove the generalization", "bbox": {"l": 308.86203, "t": 615.40433, "r": 545.11511, "b": 624.31088, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "and effectiveness of our model. The datasets used for eval-", "bbox": {"l": 308.86203, "t": 627.35933, "r": 545.11517, "b": 636.26588, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "uation are the PubTabNet, FinTabNet and TableBank which", "bbox": {"l": 308.86203, "t": 639.31433, "r": 545.11511, "b": 648.22089, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "stem from the scientific, financial and general domains re-", "bbox": {"l": 308.86203, "t": 651.27032, "r": 545.11517, "b": 660.17688, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "spectively.", "bbox": {"l": 308.86203, "t": 663.22533, "r": 350.70493, "b": 672.13189, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "TableFormer is evaluated on three major publicly available datasets of different nature to prove the generalization and effectiveness of our model. The datasets used for evaluation are the PubTabNet, FinTabNet and TableBank which stem from the scientific, financial and general domains respectively."}, {"label": "text", "id": 8, "page_no": 5, "cluster": {"id": 8, "label": "text", "bbox": {"l": 308.86203, "t": 680.33533, "r": 545.11523, "b": 713.152893, "coord_origin": "TOPLEFT"}, "confidence": 0.9830910563468933, "cells": [{"id": 152, "text": "We also share our baseline results on the challenging", "bbox": {"l": 320.81702, "t": 680.33533, "r": 545.11505, "b": 689.24189, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "SynthTabNet dataset.", "bbox": {"l": 308.86203, "t": 692.290329, "r": 396.21411, "b": 701.196892, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "Throughout our experiments, the", "bbox": {"l": 406.40585, "t": 692.290329, "r": 545.11523, "b": 701.196892, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "same parameters stated in Sec. 5.1 are utilized.", "bbox": {"l": 308.86203, "t": 704.246323, "r": 495.93982, "b": 713.152893, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "We also share our baseline results on the challenging SynthTabNet dataset. Throughout our experiments, the same parameters stated in Sec. 5.1 are utilized."}, {"label": "page_footer", "id": 17, "page_no": 5, "cluster": {"id": 17, "label": "page_footer", "bbox": {"l": 295.12103, "t": 734.133327, "r": 300.10233, "b": 743.03989, "coord_origin": "TOPLEFT"}, "confidence": 0.8820409178733826, "cells": [{"id": 156, "text": "6", "bbox": {"l": 295.12103, "t": 734.133327, "r": 300.10233, "b": 743.03989, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "6"}], "body": [{"label": "text", "id": 5, "page_no": 5, "cluster": {"id": 5, "label": "text", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 286.36514, "b": 155.84600999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.9868090152740479, "cells": [{"id": 0, "text": "tention encoding is then multiplied to the encoded image to", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 286.36514, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "produce a feature for each table cell. Notice that this is dif-", "bbox": {"l": 50.112, "t": 87.16339000000005, "r": 286.36508, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "ferent than the typical object detection problem where im-", "bbox": {"l": 50.112, "t": 99.11841000000004, "r": 286.36508, "b": 108.02495999999985, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "balances between the number of detections and the amount", "bbox": {"l": 50.112, "t": 111.07343000000003, "r": 286.36508, "b": 119.97997999999984, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "of objects may exist. In our case, we know up front that", "bbox": {"l": 50.112, "t": 123.02844000000005, "r": 286.36508, "b": 131.93499999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "the produced detections always match with the table cells", "bbox": {"l": 50.112, "t": 134.98443999999995, "r": 286.36514, "b": 143.89099, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "in number and correspondence.", "bbox": {"l": 50.112, "t": 146.93944999999997, "r": 175.16254, "b": 155.84600999999998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "tention encoding is then multiplied to the encoded image to produce a feature for each table cell. Notice that this is different than the typical object detection problem where imbalances between the number of detections and the amount of objects may exist. In our case, we know up front that the produced detections always match with the table cells in number and correspondence."}, {"label": "text", "id": 6, "page_no": 5, "cluster": {"id": 6, "label": "text", "bbox": {"l": 50.112, "t": 159.62445000000002, "r": 286.36511, "b": 240.26306, "coord_origin": "TOPLEFT"}, "confidence": 0.9860327839851379, "cells": [{"id": 7, "text": "The output features for each table cell are then fed", "bbox": {"l": 62.067001, "t": 159.62445000000002, "r": 286.36496, "b": 168.53101000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "into the feed-forward network (FFN). The FFN consists", "bbox": {"l": 50.112, "t": 171.58043999999995, "r": 286.36511, "b": 180.48699999999997, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "of a Multi-Layer Perceptron (3 layers with ReLU activa-", "bbox": {"l": 50.112, "t": 183.53545999999994, "r": 286.36511, "b": 192.44201999999996, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "tion function) that predicts the normalized coordinates for", "bbox": {"l": 50.112, "t": 195.49048000000005, "r": 286.36511, "b": 204.39702999999997, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "the bounding box of each table cell. Finally, the predicted", "bbox": {"l": 50.112, "t": 207.44550000000004, "r": 286.36511, "b": 216.35204999999996, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "bounding boxes are classified based on whether they are", "bbox": {"l": 50.112, "t": 219.40051000000005, "r": 286.36511, "b": 228.30706999999995, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "empty or not using a linear layer.", "bbox": {"l": 50.112, "t": 231.35650999999996, "r": 181.54855, "b": 240.26306, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The output features for each table cell are then fed into the feed-forward network (FFN). The FFN consists of a Multi-Layer Perceptron (3 layers with ReLU activation function) that predicts the normalized coordinates for the bounding box of each table cell. Finally, the predicted bounding boxes are classified based on whether they are empty or not using a linear layer."}, {"label": "text", "id": 4, "page_no": 5, "cluster": {"id": 4, "label": "text", "bbox": {"l": 50.112, "t": 243.92193999999995, "r": 286.36572, "b": 444.2309, "coord_origin": "TOPLEFT"}, "confidence": 0.9873637557029724, "cells": [{"id": 14, "text": "Loss Functions.", "bbox": {"l": 62.067001, "t": 243.92193999999995, "r": 129.21492, "b": 252.87829999999997, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "We formulate a multi-task loss Eq. 2", "bbox": {"l": 134.451, "t": 244.04150000000004, "r": 286.36078, "b": 252.94806000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "to train our network. The Cross-Entropy loss (denoted as", "bbox": {"l": 50.112007, "t": 255.99652000000003, "r": 286.36511, "b": 264.90308000000005, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "l$_{s}$", "bbox": {"l": 50.112007, "t": 267.79309, "r": 56.84528, "b": 276.63989000000004, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": ") is used to train the", "bbox": {"l": 57.343006, "t": 267.95250999999996, "r": 135.39996, "b": 276.85907, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Structure Decoder", "bbox": {"l": 137.735, "t": 268.04218000000003, "r": 211.07965, "b": 276.62994000000003, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "which predicts the", "bbox": {"l": 213.63699, "t": 267.95250999999996, "r": 286.36395, "b": 276.85907, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "structure tokens. As for the", "bbox": {"l": 50.112, "t": 279.90747, "r": 158.82388, "b": 288.81406, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "Cell BBox Decoder", "bbox": {"l": 161.31799, "t": 279.99712999999997, "r": 238.79712, "b": 288.58493, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "it is trained", "bbox": {"l": 241.521, "t": 279.90747, "r": 286.36264, "b": 288.81406, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "with a combination of losses denoted as", "bbox": {"l": 50.112, "t": 291.86249, "r": 211.3766, "b": 300.76904, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "l$_{box}$", "bbox": {"l": 214.271, "t": 291.70309, "r": 229.19780000000003, "b": 300.54987, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": ".", "bbox": {"l": 229.696, "t": 291.86249, "r": 232.18665000000001, "b": 300.76904, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "l$_{box}$", "bbox": {"l": 236.49001, "t": 291.70309, "r": 251.41681000000003, "b": 300.54987, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "consists", "bbox": {"l": 254.81099999999998, "t": 291.86249, "r": 286.36255, "b": 300.76904, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "of the generally used", "bbox": {"l": 50.112, "t": 303.81747, "r": 137.45412, "b": 312.72403, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "l$_{1}$", "bbox": {"l": 141.298, "t": 303.65808, "r": 148.24258, "b": 312.50485, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "loss for object detection and the", "bbox": {"l": 152.58601, "t": 303.81747, "r": 286.36377, "b": 312.72403, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "IoU loss (", "bbox": {"l": 50.112015, "t": 315.77245999999997, "r": 89.683464, "b": 324.67902, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "l$_{iou}$", "bbox": {"l": 89.68602, "t": 315.61307, "r": 104.12046, "b": 324.45984, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": ") to be scale invariant as explained in [25]. In", "bbox": {"l": 104.61802, "t": 315.77245999999997, "r": 286.36572, "b": 324.67902, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "comparison to DETR, we do not use the Hungarian algo-", "bbox": {"l": 50.112019, "t": 327.72845, "r": 286.36511, "b": 336.6350100000001, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "rithm [15] to match the predicted bounding boxes with the", "bbox": {"l": 50.112019, "t": 339.68344, "r": 286.36508, "b": 348.59, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "ground-truth boxes, as we have already achieved a one-to-", "bbox": {"l": 50.112019, "t": 351.63843, "r": 286.36511, "b": 360.54498, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "one match through two steps: 1) Our token input sequence", "bbox": {"l": 50.112019, "t": 363.59341, "r": 286.36508, "b": 372.49996999999996, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "is naturally ordered, therefore the hidden states of the table", "bbox": {"l": 50.112019, "t": 375.5484, "r": 286.36511, "b": 384.45496, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "data cells are also in order when they are provided as in-", "bbox": {"l": 50.112019, "t": 387.50339, "r": 286.36514, "b": 396.40994, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "put to the", "bbox": {"l": 50.112019, "t": 399.45938, "r": 88.68721, "b": 408.36594, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "Cell BBox Decoder", "bbox": {"l": 91.646019, "t": 399.54904, "r": 170.0517, "b": 408.13681, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": ", and 2) Our bounding boxes", "bbox": {"l": 170.05103, "t": 399.45938, "r": 286.36438, "b": 408.36594, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "generation mechanism (see Sec.", "bbox": {"l": 50.112022, "t": 411.41437, "r": 181.96703, "b": 420.32092, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "3)", "bbox": {"l": 189.09029, "t": 411.41437, "r": 197.74918, "b": 420.32092, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "ensures a one-to-one", "bbox": {"l": 200.34789, "t": 411.41437, "r": 286.36511, "b": 420.32092, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "mapping between the cell content and its bounding box for", "bbox": {"l": 50.112022, "t": 423.36934999999994, "r": 286.36511, "b": 432.27591, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "all post-processed datasets.", "bbox": {"l": 50.112022, "t": 435.32434, "r": 158.2959, "b": 444.2309, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Loss Functions. We formulate a multi-task loss Eq. 2 to train our network. The Cross-Entropy loss (denoted as l$_{s}$ ) is used to train the Structure Decoder which predicts the structure tokens. As for the Cell BBox Decoder it is trained with a combination of losses denoted as l$_{box}$ . l$_{box}$ consists of the generally used l$_{1}$ loss for object detection and the IoU loss ( l$_{iou}$ ) to be scale invariant as explained in [25]. In comparison to DETR, we do not use the Hungarian algorithm [15] to match the predicted bounding boxes with the ground-truth boxes, as we have already achieved a one-toone match through two steps: 1) Our token input sequence is naturally ordered, therefore the hidden states of the table data cells are also in order when they are provided as input to the Cell BBox Decoder , and 2) Our bounding boxes generation mechanism (see Sec. 3) ensures a one-to-one mapping between the cell content and its bounding box for all post-processed datasets."}, {"label": "text", "id": 11, "page_no": 5, "cluster": {"id": 11, "label": "text", "bbox": {"l": 50.112022, "t": 448.01035, "r": 286.36499, "b": 468.87189, "coord_origin": "TOPLEFT"}, "confidence": 0.9724196195602417, "cells": [{"id": 49, "text": "The loss used to train the TableFormer can be defined as", "bbox": {"l": 62.067024, "t": 448.01035, "r": 286.36499, "b": 456.9169, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "following:", "bbox": {"l": 50.112022, "t": 459.96533, "r": 91.377113, "b": 468.87189, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The loss used to train the TableFormer can be defined as following:"}, {"label": "formula", "id": 15, "page_no": 5, "cluster": {"id": 15, "label": "formula", "bbox": {"l": 124.33002, "t": 493.28094, "r": 286.36243, "b": 517.07172, "coord_origin": "TOPLEFT"}, "confidence": 0.9423348307609558, "cells": [{"id": 51, "text": "l$_{box}$", "bbox": {"l": 125.71502, "t": 493.28094, "r": 140.64182, "b": 502.12772, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "=", "bbox": {"l": 143.90701, "t": 493.28094, "r": 151.65593, "b": 502.12772, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "\u03bb$_{iou}$l$_{iou}$", "bbox": {"l": 154.42302, "t": 493.28094, "r": 186.62846, "b": 502.12772, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "+", "bbox": {"l": 189.34003, "t": 493.28094, "r": 197.08894, "b": 502.12772, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "\u03bb$_{l}$$_{1}$", "bbox": {"l": 199.30302, "t": 493.28094, "r": 211.64659, "b": 502.12772, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "l", "bbox": {"l": 124.33002, "t": 508.22495, "r": 127.30286, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "=", "bbox": {"l": 130.26602, "t": 508.22495, "r": 138.01494, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "\u03bbl$_{s}$", "bbox": {"l": 140.78203, "t": 508.22495, "r": 153.32629, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "+ (1", "bbox": {"l": 156.03903, "t": 508.22495, "r": 174.85541, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "\u2212", "bbox": {"l": 177.07103, "t": 507.66702, "r": 184.81995, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "\u03bb", "bbox": {"l": 187.03304, "t": 508.22495, "r": 192.84422, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": ")", "bbox": {"l": 192.84503, "t": 508.22495, "r": 196.71948, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "l$_{box}$", "bbox": {"l": 196.71902, "t": 508.22495, "r": 211.64583, "b": 517.07172, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "(1)", "bbox": {"l": 274.74603, "t": 501.01132, "r": 286.36243, "b": 509.91788, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "l$_{box}$ = \u03bb$_{iou}$l$_{iou}$ + \u03bb$_{l}$$_{1}$ l = \u03bbl$_{s}$ + (1 \u2212 \u03bb ) l$_{box}$ (1)"}, {"label": "text", "id": 16, "page_no": 5, "cluster": {"id": 16, "label": "text", "bbox": {"l": 50.11203, "t": 530.5920100000001, "r": 281.59692, "b": 540.21588, "coord_origin": "TOPLEFT"}, "confidence": 0.9363929629325867, "cells": [{"id": 65, "text": "where", "bbox": {"l": 50.11203, "t": 531.30933, "r": 74.450661, "b": 540.21588, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "\u03bb", "bbox": {"l": 76.941032, "t": 531.14993, "r": 82.75222, "b": 539.9967, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "\u2208", "bbox": {"l": 85.520035, "t": 530.5920100000001, "r": 92.162102, "b": 539.9967, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "[0, 1], and", "bbox": {"l": 94.653038, "t": 531.30933, "r": 135.59932, "b": 540.21588, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "\u03bb$_{iou}$, \u03bb$_{l}$$_{1}$", "bbox": {"l": 138.09004, "t": 531.14993, "r": 172.63162, "b": 539.9967, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "\u2208$_{R}$", "bbox": {"l": 175.89705, "t": 530.5920100000001, "r": 192.50104, "b": 539.9967, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "are hyper-parameters.", "bbox": {"l": 194.99205, "t": 531.30933, "r": 281.59692, "b": 540.21588, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "where \u03bb \u2208 [0, 1], and \u03bb$_{iou}$, \u03bb$_{l}$$_{1}$ \u2208$_{R}$ are hyper-parameters."}, {"label": "section_header", "id": 12, "page_no": 5, "cluster": {"id": 12, "label": "section_header", "bbox": {"l": 50.112045, "t": 555.91689, "r": 171.98335, "b": 566.66461, "coord_origin": "TOPLEFT"}, "confidence": 0.9554555416107178, "cells": [{"id": 72, "text": "5.", "bbox": {"l": 50.112045, "t": 555.91689, "r": 57.92831799999999, "b": 566.66461, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "Experimental Results", "bbox": {"l": 68.350014, "t": 555.91689, "r": 171.98335, "b": 566.66461, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5. Experimental Results"}, {"label": "section_header", "id": 13, "page_no": 5, "cluster": {"id": 13, "label": "section_header", "bbox": {"l": 50.112045, "t": 576.26433, "r": 179.17502, "b": 586.1163799999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9538503289222717, "cells": [{"id": 74, "text": "5.1.", "bbox": {"l": 50.112045, "t": 576.26433, "r": 64.693237, "b": 586.1163799999999, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "Implementation Details", "bbox": {"l": 74.414032, "t": 576.26433, "r": 179.17502, "b": 586.1163799999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5.1. Implementation Details"}, {"label": "text", "id": 7, "page_no": 5, "cluster": {"id": 7, "label": "text", "bbox": {"l": 50.112045, "t": 595.73433, "r": 286.36517, "b": 640.50688, "coord_origin": "TOPLEFT"}, "confidence": 0.9856163263320923, "cells": [{"id": 76, "text": "TableFormer uses ResNet-18 as the", "bbox": {"l": 62.067047, "t": 595.73433, "r": 202.97806, "b": 604.64088, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "CNN Backbone Net-", "bbox": {"l": 205.38405, "t": 595.82399, "r": 286.36008, "b": 604.41174, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "work", "bbox": {"l": 50.112045, "t": 607.77899, "r": 70.037247, "b": 616.3667399999999, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": ". The input images are resized to 448*448 pixels and", "bbox": {"l": 70.037048, "t": 607.68933, "r": 286.36496, "b": 616.59589, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "the feature map has a dimension of 28*28. Additionally, we", "bbox": {"l": 50.112049, "t": 619.64433, "r": 286.36517, "b": 628.55089, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "enforce the following input constraints:", "bbox": {"l": 50.112049, "t": 631.60033, "r": 207.03294, "b": 640.50688, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "TableFormer uses ResNet-18 as the CNN Backbone Network . The input images are resized to 448*448 pixels and the feature map has a dimension of 28*28. Additionally, we enforce the following input constraints:"}, {"label": "formula", "id": 18, "page_no": 5, "cluster": {"id": 18, "label": "formula", "bbox": {"l": 91.661049, "t": 653.828, "r": 286.36246, "b": 678.39588, "coord_origin": "TOPLEFT"}, "confidence": 0.844183623790741, "cells": [{"id": 82, "text": "Image width and height", "bbox": {"l": 91.661049, "t": 654.54532, "r": 186.01683, "b": 663.45187, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "\u2264", "bbox": {"l": 188.50705, "t": 653.828, "r": 196.25597, "b": 663.2327, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "1024 pixels", "bbox": {"l": 198.74605, "t": 654.54532, "r": 244.81310999999997, "b": 663.45187, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "Structural tags length", "bbox": {"l": 101.01604, "t": 669.48932, "r": 186.24606, "b": 678.39588, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "\u2264", "bbox": {"l": 188.73605, "t": 668.77201, "r": 196.48497, "b": 678.1767, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "512 tokens.", "bbox": {"l": 198.97505, "t": 669.48932, "r": 244.81296999999998, "b": 678.39588, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "(2)", "bbox": {"l": 274.74606, "t": 662.11731, "r": 286.36246, "b": 671.02388, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Image width and height \u2264 1024 pixels Structural tags length \u2264 512 tokens. (2)"}, {"label": "text", "id": 10, "page_no": 5, "cluster": {"id": 10, "label": "text", "bbox": {"l": 50.112061, "t": 692.290314, "r": 286.36514, "b": 713.151878, "coord_origin": "TOPLEFT"}, "confidence": 0.9724979996681213, "cells": [{"id": 89, "text": "Although input constraints are used also by other methods,", "bbox": {"l": 50.112061, "t": 692.290314, "r": 286.36514, "b": 701.196877, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "such as EDD, ours are less restrictive due to the improved", "bbox": {"l": 50.112061, "t": 704.245316, "r": 286.36514, "b": 713.151878, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Although input constraints are used also by other methods, such as EDD, ours are less restrictive due to the improved"}, {"label": "text", "id": 9, "page_no": 5, "cluster": {"id": 9, "label": "text", "bbox": {"l": 308.86206, "t": 75.20830999999998, "r": 545.11523, "b": 108.0249, "coord_origin": "TOPLEFT"}, "confidence": 0.9799237847328186, "cells": [{"id": 91, "text": "runtime performance and lower memory footprint of Table-", "bbox": {"l": 308.86206, "t": 75.20830999999998, "r": 545.11523, "b": 84.11487, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Former.", "bbox": {"l": 308.86206, "t": 87.16332999999997, "r": 339.98523, "b": 96.06988999999999, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "This allows to utilize input samples with longer", "bbox": {"l": 346.88931, "t": 87.16332999999997, "r": 545.11523, "b": 96.06988999999999, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "sequences and images with larger dimensions.", "bbox": {"l": 308.86206, "t": 99.11835000000008, "r": 492.96097, "b": 108.0249, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "runtime performance and lower memory footprint of TableFormer. This allows to utilize input samples with longer sequences and images with larger dimensions."}, {"label": "text", "id": 1, "page_no": 5, "cluster": {"id": 1, "label": "text", "bbox": {"l": 308.86206, "t": 116.22937000000002, "r": 545.1153, "b": 328.37405, "coord_origin": "TOPLEFT"}, "confidence": 0.9880930781364441, "cells": [{"id": 95, "text": "The Transformer Encoder consists of two \u201cTransformer", "bbox": {"l": 320.81705, "t": 116.22937000000002, "r": 545.11499, "b": 125.13593000000003, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "Encoder Layers\u201d, with an input feature size of 512, feed", "bbox": {"l": 308.86206, "t": 128.18439, "r": 545.11517, "b": 137.09094000000005, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "forward network of 1024, and 4 attention heads. As for the", "bbox": {"l": 308.86206, "t": 140.13940000000002, "r": 545.11505, "b": 149.04596000000004, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "Transformer Decoder it is composed of four \u201cTransformer", "bbox": {"l": 308.86206, "t": 152.09442, "r": 545.11511, "b": 161.00098000000003, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "Decoder Layers\u201d with similar input and output dimensions", "bbox": {"l": 308.86206, "t": 164.04944, "r": 545.11517, "b": 172.95599000000004, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "as the \u201cTransformer Encoder Layers\u201d.", "bbox": {"l": 308.86206, "t": 176.00543000000005, "r": 467.21756000000005, "b": 184.91198999999995, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "Even though our", "bbox": {"l": 475.43671, "t": 176.00543000000005, "r": 545.11511, "b": 184.91198999999995, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "model uses fewer layers and heads than the default imple-", "bbox": {"l": 308.86206, "t": 187.96045000000004, "r": 545.11511, "b": 196.86699999999996, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "mentation parameters, our extensive experimentation has", "bbox": {"l": 308.86206, "t": 199.91547000000003, "r": 545.11511, "b": 208.82201999999995, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "proved this setup to be more suitable for table images. We", "bbox": {"l": 308.86206, "t": 211.87048000000004, "r": 545.11517, "b": 220.77704000000006, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "attribute this finding to the inherent design of table im-", "bbox": {"l": 308.86206, "t": 223.82550000000003, "r": 545.11511, "b": 232.73206000000005, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "ages, which contain mostly lines and text, unlike the more", "bbox": {"l": 308.86206, "t": 235.78052000000002, "r": 545.11511, "b": 244.68706999999995, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "elaborate content present in other scopes (e.g. the COCO", "bbox": {"l": 308.86206, "t": 247.73650999999995, "r": 545.11523, "b": 256.64306999999997, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "dataset).", "bbox": {"l": 308.86206, "t": 259.69152999999994, "r": 342.3364, "b": 268.59808, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "Moreover, we have added ResNet blocks to the", "bbox": {"l": 348.95157, "t": 259.69152999999994, "r": 545.11517, "b": 268.59808, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "inputs of the Structure Decoder and Cell BBox Decoder.", "bbox": {"l": 308.86206, "t": 271.64655000000005, "r": 545.11517, "b": 280.55310000000003, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "This prevents a decoder having a stronger influence over the", "bbox": {"l": 308.86206, "t": 283.6015300000001, "r": 545.1153, "b": 292.50809, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "learned weights which would damage the other prediction", "bbox": {"l": 308.86206, "t": 295.55652, "r": 545.11511, "b": 304.46307, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "task (structure vs bounding boxes), but learn task specific", "bbox": {"l": 308.86206, "t": 307.51151, "r": 545.11511, "b": 316.41806, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "weights instead. Lastly our dropout layers are set to 0.5.", "bbox": {"l": 308.86206, "t": 319.4674999999999, "r": 532.48267, "b": 328.37405, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The Transformer Encoder consists of two \"Transformer Encoder Layers\", with an input feature size of 512, feed forward network of 1024, and 4 attention heads. As for the Transformer Decoder it is composed of four \"Transformer Decoder Layers\" with similar input and output dimensions as the \"Transformer Encoder Layers\". Even though our model uses fewer layers and heads than the default implementation parameters, our extensive experimentation has proved this setup to be more suitable for table images. We attribute this finding to the inherent design of table images, which contain mostly lines and text, unlike the more elaborate content present in other scopes (e.g. the COCO dataset). Moreover, we have added ResNet blocks to the inputs of the Structure Decoder and Cell BBox Decoder. This prevents a decoder having a stronger influence over the learned weights which would damage the other prediction task (structure vs bounding boxes), but learn task specific weights instead. Lastly our dropout layers are set to 0.5."}, {"label": "text", "id": 3, "page_no": 5, "cluster": {"id": 3, "label": "text", "bbox": {"l": 308.86203, "t": 336.57751, "r": 545.11517, "b": 429.16998, "coord_origin": "TOPLEFT"}, "confidence": 0.9877589344978333, "cells": [{"id": 115, "text": "For training, TableFormer is trained with 3 Adam opti-", "bbox": {"l": 320.81705, "t": 336.57751, "r": 545.11499, "b": 345.48407000000003, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "mizers, each one for the", "bbox": {"l": 308.86206, "t": 348.5325000000001, "r": 403.7359, "b": 357.43906, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "CNN Backbone Network", "bbox": {"l": 406.07605, "t": 348.62216, "r": 503.54016, "b": 357.20993, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": ",", "bbox": {"l": 503.53906, "t": 348.5325000000001, "r": 506.02972, "b": 357.43906, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "Structure", "bbox": {"l": 508.40004999999996, "t": 348.62216, "r": 545.11224, "b": 357.20993, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "Decoder", "bbox": {"l": 308.86206, "t": 360.57715, "r": 343.1633, "b": 369.16492000000005, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": ", and", "bbox": {"l": 343.16306, "t": 360.48749, "r": 362.2016, "b": 369.39404, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Cell BBox Decoder", "bbox": {"l": 364.28604, "t": 360.57715, "r": 440.93829, "b": 369.16492000000005, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": ". Taking the PubTabNet as", "bbox": {"l": 440.93903, "t": 360.48749, "r": 545.10797, "b": 369.39404, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "an example for our parameter set up, the initializing learn-", "bbox": {"l": 308.86203, "t": 372.44247, "r": 545.11511, "b": 381.34903, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "ing rate is 0.001 for 12 epochs with a batch size of 24, and", "bbox": {"l": 308.86203, "t": 384.3984699999999, "r": 545.11517, "b": 393.30502, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "\u03bb", "bbox": {"l": 308.86203, "t": 396.19406000000004, "r": 314.67322, "b": 405.04083, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "set to 0.5.", "bbox": {"l": 318.65802, "t": 396.35345, "r": 360.39139, "b": 405.2600100000001, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "Afterwards, we reduce the learning rate to", "bbox": {"l": 367.96295, "t": 396.35345, "r": 545.10803, "b": 405.2600100000001, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "0.0001, the batch size to 18 and train for 12 more epochs or", "bbox": {"l": 308.86203, "t": 408.30844, "r": 545.11511, "b": 417.215, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "convergence.", "bbox": {"l": 308.86203, "t": 420.26343, "r": 360.9664, "b": 429.16998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "For training, TableFormer is trained with 3 Adam optimizers, each one for the CNN Backbone Network , Structure Decoder , and Cell BBox Decoder . Taking the PubTabNet as an example for our parameter set up, the initializing learning rate is 0.001 for 12 epochs with a batch size of 24, and \u03bb set to 0.5. Afterwards, we reduce the learning rate to 0.0001, the batch size to 18 and train for 12 more epochs or convergence."}, {"label": "text", "id": 0, "page_no": 5, "cluster": {"id": 0, "label": "text", "bbox": {"l": 308.86203, "t": 437.37441999999993, "r": 545.11523, "b": 553.87689, "coord_origin": "TOPLEFT"}, "confidence": 0.9884491562843323, "cells": [{"id": 131, "text": "TableFormer is implemented with PyTorch and Torchvi-", "bbox": {"l": 320.81702, "t": 437.37441999999993, "r": 545.11499, "b": 446.28098, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "sion libraries [22].", "bbox": {"l": 308.86203, "t": 449.32941, "r": 384.62759, "b": 458.23596, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "To speed up the inference, the image", "bbox": {"l": 391.37228, "t": 449.32941, "r": 545.11511, "b": 458.23596, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "undergoes a single forward pass through the", "bbox": {"l": 308.86203, "t": 461.28439, "r": 494.00693000000007, "b": 470.19095, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "CNN Back-", "bbox": {"l": 498.07803, "t": 461.37405, "r": 545.11145, "b": 469.96182, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "bone Network", "bbox": {"l": 308.86203, "t": 473.32904, "r": 364.44336, "b": 481.91681, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "and transformer encoder. This eliminates the", "bbox": {"l": 367.06104, "t": 473.23938, "r": 545.11267, "b": 482.14594, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "overhead of generating the same features for each decoding", "bbox": {"l": 308.86203, "t": 485.19437, "r": 545.11511, "b": 494.10092, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "step. Similarly, we employ a \u2019caching\u2019 technique to preform", "bbox": {"l": 308.86203, "t": 497.14935, "r": 545.11523, "b": 506.05591, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "faster autoregressive decoding. This is achieved by storing", "bbox": {"l": 308.86203, "t": 509.10535, "r": 545.11511, "b": 518.0119, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "the features of decoded tokens so we can reuse them for", "bbox": {"l": 308.86203, "t": 521.06033, "r": 545.11517, "b": 529.9668899999999, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "each time step. Therefore, we only compute the attention", "bbox": {"l": 308.86203, "t": 533.01532, "r": 545.11517, "b": 541.9218900000001, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "for each new tag.", "bbox": {"l": 308.86203, "t": 544.97034, "r": 377.21548, "b": 553.87689, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "TableFormer is implemented with PyTorch and Torchvision libraries [22]. To speed up the inference, the image undergoes a single forward pass through the CNN Backbone Network and transformer encoder. This eliminates the overhead of generating the same features for each decoding step. Similarly, we employ a 'caching' technique to preform faster autoregressive decoding. This is achieved by storing the features of decoded tokens so we can reuse them for each time step. Therefore, we only compute the attention for each new tag."}, {"label": "section_header", "id": 14, "page_no": 5, "cluster": {"id": 14, "label": "section_header", "bbox": {"l": 308.86203, "t": 579.55432, "r": 397.44281, "b": 589.40637, "coord_origin": "TOPLEFT"}, "confidence": 0.9450808763504028, "cells": [{"id": 144, "text": "5.2.", "bbox": {"l": 308.86203, "t": 579.55432, "r": 323.9046, "b": 589.40637, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "Generalization", "bbox": {"l": 333.93301, "t": 579.55432, "r": 397.44281, "b": 589.40637, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5.2. Generalization"}, {"label": "text", "id": 2, "page_no": 5, "cluster": {"id": 2, "label": "text", "bbox": {"l": 308.86203, "t": 603.44933, "r": 545.11517, "b": 672.13189, "coord_origin": "TOPLEFT"}, "confidence": 0.9880595803260803, "cells": [{"id": 146, "text": "TableFormer is evaluated on three major publicly avail-", "bbox": {"l": 320.81702, "t": 603.44933, "r": 545.11493, "b": 612.3558800000001, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "able datasets of different nature to prove the generalization", "bbox": {"l": 308.86203, "t": 615.40433, "r": 545.11511, "b": 624.31088, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "and effectiveness of our model. The datasets used for eval-", "bbox": {"l": 308.86203, "t": 627.35933, "r": 545.11517, "b": 636.26588, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "uation are the PubTabNet, FinTabNet and TableBank which", "bbox": {"l": 308.86203, "t": 639.31433, "r": 545.11511, "b": 648.22089, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "stem from the scientific, financial and general domains re-", "bbox": {"l": 308.86203, "t": 651.27032, "r": 545.11517, "b": 660.17688, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "spectively.", "bbox": {"l": 308.86203, "t": 663.22533, "r": 350.70493, "b": 672.13189, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "TableFormer is evaluated on three major publicly available datasets of different nature to prove the generalization and effectiveness of our model. The datasets used for evaluation are the PubTabNet, FinTabNet and TableBank which stem from the scientific, financial and general domains respectively."}, {"label": "text", "id": 8, "page_no": 5, "cluster": {"id": 8, "label": "text", "bbox": {"l": 308.86203, "t": 680.33533, "r": 545.11523, "b": 713.152893, "coord_origin": "TOPLEFT"}, "confidence": 0.9830910563468933, "cells": [{"id": 152, "text": "We also share our baseline results on the challenging", "bbox": {"l": 320.81702, "t": 680.33533, "r": 545.11505, "b": 689.24189, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "SynthTabNet dataset.", "bbox": {"l": 308.86203, "t": 692.290329, "r": 396.21411, "b": 701.196892, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "Throughout our experiments, the", "bbox": {"l": 406.40585, "t": 692.290329, "r": 545.11523, "b": 701.196892, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "same parameters stated in Sec. 5.1 are utilized.", "bbox": {"l": 308.86203, "t": 704.246323, "r": 495.93982, "b": 713.152893, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "We also share our baseline results on the challenging SynthTabNet dataset. Throughout our experiments, the same parameters stated in Sec. 5.1 are utilized."}], "headers": [{"label": "page_footer", "id": 17, "page_no": 5, "cluster": {"id": 17, "label": "page_footer", "bbox": {"l": 295.12103, "t": 734.133327, "r": 300.10233, "b": 743.03989, "coord_origin": "TOPLEFT"}, "confidence": 0.8820409178733826, "cells": [{"id": 156, "text": "6", "bbox": {"l": 295.12103, "t": 734.133327, "r": 300.10233, "b": 743.03989, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "6"}]}}, {"page_no": 6, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "5.3.", "bbox": {"l": 50.112, "t": 74.40137000000016, "r": 63.704811, "b": 84.25342, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Datasets and Metrics", "bbox": {"l": 72.766685, "t": 74.40137000000016, "r": 167.89825, "b": 84.25342, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "The Tree-Edit-Distance-Based Similarity (TEDS) met-", "bbox": {"l": 62.067001, "t": 93.35039999999992, "r": 286.36499, "b": 102.25696000000016, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "ric was introduced in [37]. It represents the prediction, and", "bbox": {"l": 50.112, "t": 105.30542000000003, "r": 286.36511, "b": 114.21198000000015, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "ground-truth as a tree structure of HTML tags. This simi-", "bbox": {"l": 50.112, "t": 117.26044000000002, "r": 286.36505, "b": 126.16699000000006, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "larity is calculated as:", "bbox": {"l": 50.112, "t": 129.21642999999995, "r": 136.71687, "b": 138.12298999999996, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "TEDS (", "bbox": {"l": 86.218994, "t": 157.05798000000004, "r": 118.8784, "b": 165.90479000000005, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "T$_{a}$, T$_{b}$", "bbox": {"l": 118.87499, "t": 157.05798000000004, "r": 143.26962, "b": 165.90479000000005, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": ") = 1", "bbox": {"l": 143.76799, "t": 157.05798000000004, "r": 165.9019, "b": 165.90479000000005, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "\u2212", "bbox": {"l": 168.12099, "t": 156.50012000000004, "r": 175.8699, "b": 165.90479000000005, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "EditDist (", "bbox": {"l": 179.27899, "t": 150.31799, "r": 221.95677, "b": 159.16479000000004, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "T$_{a}$, T$_{b}$", "bbox": {"l": 221.95200000000003, "t": 150.31799, "r": 246.34663, "b": 159.16479000000004, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": ")", "bbox": {"l": 246.84499999999997, "t": 150.31799, "r": 250.71945, "b": 159.16479000000004, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "max (", "bbox": {"l": 182.21201, "t": 163.89197000000001, "r": 206.29161, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "|", "bbox": {"l": 206.289, "t": 163.33411, "r": 209.05661, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "T$_{a}$", "bbox": {"l": 209.056, "t": 163.89197000000001, "r": 219.19968, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "|", "bbox": {"l": 219.69700999999998, "t": 163.33411, "r": 222.46461000000002, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": ",", "bbox": {"l": 224.125, "t": 163.89197000000001, "r": 226.89261, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "|", "bbox": {"l": 228.55299000000002, "t": 163.33411, "r": 231.3206, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "T$_{b}$", "bbox": {"l": 231.31999, "t": 163.89197000000001, "r": 240.64563, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "|", "bbox": {"l": 241.144, "t": 163.33411, "r": 243.91161, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": ")", "bbox": {"l": 243.911, "t": 163.89197000000001, "r": 247.78545, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "(3)", "bbox": {"l": 274.746, "t": 157.21740999999997, "r": 286.3624, "b": 166.12396, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "where", "bbox": {"l": 62.067001, "t": 181.16241000000002, "r": 86.405632, "b": 190.06897000000004, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "T$_{a}$", "bbox": {"l": 88.581001, "t": 181.00298999999995, "r": 98.724663, "b": 189.84978999999998, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "and", "bbox": {"l": 101.399, "t": 181.16241000000002, "r": 115.785, "b": 190.06897000000004, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "T$_{b}$", "bbox": {"l": 117.961, "t": 181.00298999999995, "r": 127.28664, "b": 189.84978999999998, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "represent tables in tree structure HTML", "bbox": {"l": 129.95999, "t": 181.16241000000002, "r": 286.36285, "b": 190.06897000000004, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "format. EditDist denotes the tree-edit distance, and", "bbox": {"l": 50.111992, "t": 193.11743, "r": 252.78116000000003, "b": 202.02399000000003, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "|", "bbox": {"l": 255.18201, "t": 192.40015000000005, "r": 257.94962, "b": 201.80480999999997, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "T", "bbox": {"l": 257.94901, "t": 192.95800999999994, "r": 263.77115, "b": 201.80480999999997, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "|", "bbox": {"l": 265.155, "t": 192.40015000000005, "r": 267.92261, "b": 201.80480999999997, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "rep-", "bbox": {"l": 270.32199, "t": 193.11743, "r": 286.36179, "b": 202.02399000000003, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "resents the number of nodes in", "bbox": {"l": 50.111984, "t": 205.07245, "r": 172.13388, "b": 213.97900000000004, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "T", "bbox": {"l": 174.62399, "t": 204.91301999999996, "r": 180.44614, "b": 213.75982999999997, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": ".", "bbox": {"l": 181.82899, "t": 205.07245, "r": 184.31964, "b": 213.97900000000004, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "5.4.", "bbox": {"l": 50.112, "t": 224.81946000000005, "r": 64.551605, "b": 234.67151, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "Quantitative Analysis", "bbox": {"l": 74.178009, "t": 224.81946000000005, "r": 170.45169, "b": 234.67151, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "Structure.", "bbox": {"l": 62.067001, "t": 243.6499, "r": 105.32461, "b": 252.60626000000002, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "As shown in Tab.", "bbox": {"l": 112.12600000000002, "t": 243.76946999999996, "r": 184.68361, "b": 252.67602999999997, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "2, TableFormer outper-", "bbox": {"l": 191.4781, "t": 243.76946999999996, "r": 286.36188, "b": 252.67602999999997, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "forms all SOTA methods across different datasets by a large", "bbox": {"l": 50.112, "t": 255.72448999999995, "r": 286.36508, "b": 264.63104, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "margin for predicting the table structure from an image.", "bbox": {"l": 50.112, "t": 267.67949999999996, "r": 286.36508, "b": 276.58606, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "All the more, our model outperforms pre-trained methods.", "bbox": {"l": 50.112, "t": 279.63446, "r": 286.36508, "b": 288.54105, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "During the evaluation we do not apply any table filtering.", "bbox": {"l": 50.112, "t": 291.59048, "r": 286.36514, "b": 300.49704, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "We also provide our baseline results on the SynthTabNet", "bbox": {"l": 50.112, "t": 303.54547, "r": 286.36508, "b": 312.45203000000004, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "dataset. It has been observed that large tables (e.g. tables", "bbox": {"l": 50.112, "t": 315.50046, "r": 286.36505, "b": 324.40700999999996, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "that occupy half of the page or more) yield poor predictions.", "bbox": {"l": 50.112, "t": 327.45544, "r": 286.36508, "b": 336.362, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "We attribute this issue to the image resizing during the pre-", "bbox": {"l": 50.112, "t": 339.41043, "r": 286.36508, "b": 348.31699000000003, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "processing step, that produces downsampled images with", "bbox": {"l": 50.112, "t": 351.36542, "r": 286.36505, "b": 360.27197, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "indistinguishable features. This problem can be addressed", "bbox": {"l": 50.112, "t": 363.32141, "r": 286.36508, "b": 372.2279700000001, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "by treating such big tables with a separate model which ac-", "bbox": {"l": 50.112, "t": 375.2764, "r": 286.36511, "b": 384.18295000000006, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "cepts a large input image size.", "bbox": {"l": 50.112, "t": 387.23138, "r": 170.01187, "b": 396.13794, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Model", "bbox": {"l": 78.843002, "t": 420.69037, "r": 104.85535, "b": 429.59692, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "TEDS", "bbox": {"l": 211.2, "t": 414.71237, "r": 236.10649, "b": 423.61893, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "Dataset", "bbox": {"l": 129.338, "t": 426.66736, "r": 159.21584, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Simple", "bbox": {"l": 171.17096, "t": 426.66736, "r": 199.40497, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Complex", "bbox": {"l": 211.36009, "t": 426.66736, "r": 247.74349999999998, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "All", "bbox": {"l": 264.54044, "t": 426.66736, "r": 277.27264, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "EDD", "bbox": {"l": 81.612, "t": 443.62436, "r": 102.08514, "b": 452.53091, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "PTN", "bbox": {"l": 134.87206, "t": 443.62436, "r": 153.69141, "b": 452.53091, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "91.1", "bbox": {"l": 176.56554, "t": 443.62436, "r": 194.00009, "b": 452.53091, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "88.7", "bbox": {"l": 220.82938000000001, "t": 443.62436, "r": 238.26393, "b": 452.53091, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "89.9", "bbox": {"l": 262.18414, "t": 443.62436, "r": 279.61868, "b": 452.53091, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "GTE", "bbox": {"l": 82.165001, "t": 455.58035, "r": 101.5323, "b": 464.48691, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "PTN", "bbox": {"l": 134.86716, "t": 455.58035, "r": 153.68651, "b": 464.48691, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "-", "bbox": {"l": 183.62411, "t": 455.58035, "r": 186.94167, "b": 464.48691, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "-", "bbox": {"l": 227.88795000000002, "t": 455.58035, "r": 231.20551, "b": 464.48691, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "93.01", "bbox": {"l": 259.69855, "t": 455.58035, "r": 282.11441, "b": 464.48691, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 468.13336, "r": 117.38329000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "PTN", "bbox": {"l": 134.86766, "t": 468.13336, "r": 153.68701, "b": 477.03992, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "98.5", "bbox": {"l": 176.57111, "t": 468.13336, "r": 194.00566, "b": 477.03992, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "95.0", "bbox": {"l": 220.83495, "t": 468.13336, "r": 238.26950000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "96.75", "bbox": {"l": 259.698, "t": 468.01379, "r": 282.11386, "b": 476.97018, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "EDD", "bbox": {"l": 81.612, "t": 483.32635, "r": 102.08514, "b": 492.23291, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "FTN", "bbox": {"l": 134.87206, "t": 483.32635, "r": 153.69141, "b": 492.23291, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "88.4", "bbox": {"l": 176.56554, "t": 483.32635, "r": 194.00009, "b": 492.23291, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "92.08", "bbox": {"l": 218.33870999999996, "t": 483.32635, "r": 240.75455999999997, "b": 492.23291, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "90.6", "bbox": {"l": 262.18411, "t": 483.32635, "r": 279.61865, "b": 492.23291, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "GTE", "bbox": {"l": 82.165001, "t": 495.28134, "r": 101.5323, "b": 504.1879, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "FTN", "bbox": {"l": 134.86716, "t": 495.28134, "r": 153.68651, "b": 504.1879, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "-", "bbox": {"l": 183.62411, "t": 495.28134, "r": 186.94167, "b": 504.1879, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "-", "bbox": {"l": 227.88795000000002, "t": 495.28134, "r": 231.20551, "b": 504.1879, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "87.14", "bbox": {"l": 259.69855, "t": 495.28134, "r": 282.11441, "b": 504.1879, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "GTE (FT)", "bbox": {"l": 71.789001, "t": 507.23633, "r": 111.90838999999998, "b": 516.14288, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "FTN", "bbox": {"l": 134.86221, "t": 507.23633, "r": 153.68156, "b": 516.14288, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "-", "bbox": {"l": 183.62914, "t": 507.23633, "r": 186.94669, "b": 516.14288, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "-", "bbox": {"l": 227.89297, "t": 507.23633, "r": 231.21053000000003, "b": 516.14288, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "91.02", "bbox": {"l": 259.6936, "t": 507.23633, "r": 282.10947, "b": 516.14288, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 519.1913099999999, "r": 117.38329000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "FTN", "bbox": {"l": 134.86766, "t": 519.1913099999999, "r": 153.68701, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "97.5", "bbox": {"l": 176.57111, "t": 519.1913099999999, "r": 194.00566, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "96.0", "bbox": {"l": 220.83495, "t": 519.1913099999999, "r": 238.26950000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "96.8", "bbox": {"l": 262.189, "t": 519.0717500000001, "r": 279.62354, "b": 528.02814, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "EDD", "bbox": {"l": 81.612, "t": 536.49837, "r": 102.08514, "b": 545.40492, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "TB", "bbox": {"l": 137.91064, "t": 536.49837, "r": 150.64285, "b": 545.40492, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "86.0", "bbox": {"l": 176.56554, "t": 536.49837, "r": 194.00009, "b": 545.40492, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "-", "bbox": {"l": 227.89285, "t": 536.49837, "r": 231.21040000000002, "b": 545.40492, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "86.0", "bbox": {"l": 262.18411, "t": 536.49837, "r": 279.61865, "b": 545.40492, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 548.45436, "r": 117.38329000000002, "b": 557.36092, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "TB", "bbox": {"l": 137.90625, "t": 548.45436, "r": 150.63846, "b": 557.36092, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "89.6", "bbox": {"l": 176.57111, "t": 548.45436, "r": 194.00566, "b": 557.36092, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "-", "bbox": {"l": 227.88845999999998, "t": 548.45436, "r": 231.20601, "b": 557.36092, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "89.6", "bbox": {"l": 262.189, "t": 548.3348100000001, "r": 279.62354, "b": 557.2911799999999, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 568.00237, "r": 117.38329000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "STN", "bbox": {"l": 134.86766, "t": 568.00237, "r": 153.68701, "b": 576.90892, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "96.9", "bbox": {"l": 176.57111, "t": 568.00237, "r": 194.00566, "b": 576.90892, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "95.7", "bbox": {"l": 220.83495, "t": 568.00237, "r": 238.26950000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "96.7", "bbox": {"l": 262.1897, "t": 568.00237, "r": 279.62424, "b": 576.90892, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "Table 2: Structure results on PubTabNet (PTN), FinTabNet", "bbox": {"l": 50.112, "t": 592.43336, "r": 286.36511, "b": 601.33992, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "(FTN), TableBank (TB) and SynthTabNet (STN).", "bbox": {"l": 50.112, "t": 604.38837, "r": 247.46114, "b": 613.29492, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "FT: Model was trained on PubTabNet then finetuned.", "bbox": {"l": 50.112, "t": 616.34337, "r": 261.78732, "b": 625.24992, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "Cell Detection.", "bbox": {"l": 62.067001, "t": 644.3498099999999, "r": 124.72179, "b": 653.30618, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "Like any object detector, our", "bbox": {"l": 128.20401, "t": 644.46936, "r": 242.9333, "b": 653.37592, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "Cell BBox", "bbox": {"l": 245.55401999999998, "t": 644.55902, "r": 286.36084, "b": 653.1467700000001, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "Detector", "bbox": {"l": 50.112015, "t": 656.51402, "r": 84.971146, "b": 665.10178, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "provides bounding boxes that can be improved", "bbox": {"l": 89.515015, "t": 656.42436, "r": 286.366, "b": 665.33092, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "with post-processing during inference. We make use of the", "bbox": {"l": 50.112015, "t": 668.37936, "r": 286.36511, "b": 677.28593, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "grid-like structure of tables to refine the predictions. A de-", "bbox": {"l": 50.112015, "t": 680.33536, "r": 286.36505, "b": 689.24193, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "tailed explanation on the post-processing is available in the", "bbox": {"l": 50.112015, "t": 692.290359, "r": 286.36511, "b": 701.19693, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "supplementary material. As shown in Tab. 3, we evaluate", "bbox": {"l": 50.112015, "t": 704.245361, "r": 286.36508, "b": 713.151932, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "our", "bbox": {"l": 308.862, "t": 75.20836999999995, "r": 322.14215, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Cell BBox Decoder", "bbox": {"l": 325.45401, "t": 75.29803000000004, "r": 404.56702, "b": 83.88580000000002, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "accuracy for cells with a class la-", "bbox": {"l": 408.104, "t": 75.20836999999995, "r": 545.10968, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "bel of \u2018content\u2019 only using the PASCAL VOC mAP metric", "bbox": {"l": 308.862, "t": 87.16339000000005, "r": 545.11511, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "for pre-processing and post-processing.", "bbox": {"l": 308.862, "t": 99.11841000000004, "r": 470.22626, "b": 108.02495999999985, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "Note that we do", "bbox": {"l": 477.52884, "t": 99.11841000000004, "r": 545.11511, "b": 108.02495999999985, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "not have post-processing results for SynthTabNet as images", "bbox": {"l": 308.862, "t": 111.07343000000003, "r": 545.11517, "b": 119.97997999999984, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "are only provided. To compare the performance of our pro-", "bbox": {"l": 308.862, "t": 123.02844000000005, "r": 545.11511, "b": 131.93499999999995, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "posed approach, we\u2019ve integrated TableFormer\u2019s", "bbox": {"l": 308.862, "t": 134.98443999999995, "r": 502.01691000000005, "b": 143.89099, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "Cell BBox", "bbox": {"l": 504.47299, "t": 135.07410000000004, "r": 545.11041, "b": 143.66187000000002, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "Decoder", "bbox": {"l": 308.862, "t": 147.02910999999995, "r": 343.16324, "b": 155.61688000000004, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "into EDD architecture. As mentioned previously,", "bbox": {"l": 346.371, "t": 146.93944999999997, "r": 545.11493, "b": 155.84600999999998, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "the Structure Decoder provides the", "bbox": {"l": 308.862, "t": 158.89446999999996, "r": 446.15652, "b": 167.80102999999997, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "Cell BBox Decoder", "bbox": {"l": 448.28998000000007, "t": 158.98413000000005, "r": 525.04181, "b": 167.57190000000003, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "with", "bbox": {"l": 527.39899, "t": 158.89446999999996, "r": 545.11249, "b": 167.80102999999997, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "the features needed to predict the bounding box predictions.", "bbox": {"l": 308.862, "t": 170.84948999999995, "r": 545.11511, "b": 179.75603999999998, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "Therefore, the accuracy of the", "bbox": {"l": 308.862, "t": 182.80449999999996, "r": 432.86642000000006, "b": 191.71105999999997, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "Structure Decoder", "bbox": {"l": 436.39001, "t": 182.89417000000003, "r": 510.93021, "b": 191.48193000000003, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "directly", "bbox": {"l": 514.677, "t": 182.80449999999996, "r": 545.11273, "b": 191.71105999999997, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "influences the accuracy of the", "bbox": {"l": 308.862, "t": 194.75951999999995, "r": 431.17285, "b": 203.66607999999997, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "Cell BBox Decoder", "bbox": {"l": 434.6790199999999, "t": 194.84918000000005, "r": 514.18054, "b": 203.43695000000002, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": ". If the", "bbox": {"l": 514.17603, "t": 194.75951999999995, "r": 545.10992, "b": 203.66607999999997, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "Structure Decoder", "bbox": {"l": 308.86203, "t": 206.80517999999995, "r": 382.35614, "b": 215.39293999999995, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "predicts an extra column, this will result", "bbox": {"l": 385.07501, "t": 206.71551999999997, "r": 545.11426, "b": 215.62207, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "in an extra column of predicted bounding boxes.", "bbox": {"l": 308.862, "t": 218.67052999999999, "r": 501.6981799999999, "b": 227.57709, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "Model", "bbox": {"l": 339.323, "t": 253.66436999999996, "r": 365.33536, "b": 262.57092, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "Dataset", "bbox": {"l": 401.04132, "t": 253.66436999999996, "r": 430.91916, "b": 262.57092, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "mAP", "bbox": {"l": 454.10214, "t": 253.66436999999996, "r": 474.58523999999994, "b": 262.57092, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "mAP (PP)", "bbox": {"l": 486.54034, "t": 253.66436999999996, "r": 527.2276, "b": 262.57092, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "EDD+BBox", "bbox": {"l": 327.65601, "t": 270.62134000000003, "r": 377.00076, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "PubTabNet", "bbox": {"l": 393.69809, "t": 270.62134000000003, "r": 438.28073, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "79.2", "bbox": {"l": 455.63559, "t": 270.62134000000003, "r": 473.07013, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "82.7", "bbox": {"l": 498.16592, "t": 270.62134000000003, "r": 515.60046, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "TableFormer", "bbox": {"l": 326.79501, "t": 282.57631999999995, "r": 377.86331, "b": 291.48288, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "PubTabNet", "bbox": {"l": 393.69388, "t": 282.57631999999995, "r": 438.27652, "b": 291.48288, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "82.1", "bbox": {"l": 455.63101, "t": 282.45676, "r": 473.06555000000003, "b": 291.41315, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "86.8", "bbox": {"l": 498.1713, "t": 282.45676, "r": 515.60583, "b": 291.41315, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "TableFormer", "bbox": {"l": 326.79501, "t": 294.53131, "r": 377.86331, "b": 303.43787, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "SynthTabNet", "bbox": {"l": 389.81842, "t": 294.53131, "r": 442.15194999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "87.7", "bbox": {"l": 455.63135, "t": 294.53131, "r": 473.06589, "b": 303.43787, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "-", "bbox": {"l": 505.22515999999996, "t": 294.53131, "r": 508.54268999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "Table 3:", "bbox": {"l": 308.862, "t": 316.44931, "r": 341.49951, "b": 325.35587, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "Cell Bounding Box detection results on PubTab-", "bbox": {"l": 348.60284, "t": 316.44931, "r": 545.11517, "b": 325.35587, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "Net, and FinTabNet. PP: Post-processing.", "bbox": {"l": 308.862, "t": 328.4043, "r": 474.97845, "b": 337.3108500000001, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "Cell Content.", "bbox": {"l": 320.81699, "t": 367.6797199999999, "r": 378.94876, "b": 376.63611, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "In this section, we evaluate the entire", "bbox": {"l": 387.07898, "t": 367.79929, "r": 545.11566, "b": 376.70584, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "pipeline of recovering a table with content.", "bbox": {"l": 308.86197, "t": 379.75426999999996, "r": 487.19257, "b": 388.66083, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "Here we put", "bbox": {"l": 493.96713, "t": 379.75426999999996, "r": 545.11511, "b": 388.66083, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "our approach to test by capitalizing on extracting content", "bbox": {"l": 308.86197, "t": 391.70926, "r": 545.11505, "b": 400.61581, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "from the PDF cells rather than decoding from images. Tab.", "bbox": {"l": 308.86197, "t": 403.66525, "r": 545.11523, "b": 412.57181, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "4", "bbox": {"l": 308.86197, "t": 415.62024, "r": 314.08096, "b": 424.52679, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "shows the TEDs score of HTML code representing the", "bbox": {"l": 316.69046, "t": 415.62024, "r": 545.11517, "b": 424.52679, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "structure of the table along with the content inserted in the", "bbox": {"l": 308.86197, "t": 427.57523, "r": 545.11505, "b": 436.48177999999996, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "data cell and compared with the ground-truth. Our method", "bbox": {"l": 308.86197, "t": 439.53021, "r": 545.11505, "b": 448.43677, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "achieved a", "bbox": {"l": 308.86197, "t": 451.4852, "r": 350.23666, "b": 460.39175, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "5.3%", "bbox": {"l": 352.17596, "t": 451.36563, "r": 374.59183, "b": 460.32201999999995, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "increase over the state-of-the-art, and com-", "bbox": {"l": 376.53296, "t": 451.4852, "r": 545.11011, "b": 460.39175, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "mercial solutions. We believe our scores would be higher", "bbox": {"l": 308.86197, "t": 463.44019, "r": 545.11511, "b": 472.34674, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "if the HTML ground-truth matched the extracted PDF cell", "bbox": {"l": 308.86197, "t": 475.39618, "r": 545.11517, "b": 484.30273, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "content. Unfortunately, there are small discrepancies such", "bbox": {"l": 308.86197, "t": 487.35117, "r": 545.11511, "b": 496.25772, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "as spacings around words or special characters with various", "bbox": {"l": 308.86197, "t": 499.30615, "r": 545.11505, "b": 508.21271, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "unicode representations.", "bbox": {"l": 308.86197, "t": 511.26114, "r": 405.69846, "b": 520.16769, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "Model", "bbox": {"l": 358.01099, "t": 552.23337, "r": 384.02335, "b": 561.1399200000001, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "TEDS", "bbox": {"l": 449.03400000000005, "t": 546.25537, "r": 473.94049000000007, "b": 555.16193, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": "Simple", "bbox": {"l": 408.50598, "t": 558.21037, "r": 436.73999, "b": 567.11693, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "Complex", "bbox": {"l": 448.6951, "t": 558.21037, "r": 485.07849, "b": 567.11693, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "All", "bbox": {"l": 499.3848, "t": 558.21037, "r": 512.117, "b": 567.11693, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": "Tabula", "bbox": {"l": 357.68201, "t": 575.16736, "r": 384.3519, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "78.0", "bbox": {"l": 413.90097, "t": 575.16736, "r": 431.33550999999994, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "57.8", "bbox": {"l": 458.16479000000004, "t": 575.16736, "r": 475.59933000000007, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "67.9", "bbox": {"l": 497.0289, "t": 575.16736, "r": 514.46344, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": "Traprange", "bbox": {"l": 350.72299, "t": 587.12236, "r": 391.31064, "b": 596.02892, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "60.8", "bbox": {"l": 413.90582, "t": 587.12236, "r": 431.34036, "b": 596.02892, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "49.9", "bbox": {"l": 458.16965, "t": 587.12236, "r": 475.60419, "b": 596.02892, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "55.4", "bbox": {"l": 497.03374999999994, "t": 587.12236, "r": 514.46832, "b": 596.02892, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "Camelot", "bbox": {"l": 354.13599, "t": 599.07835, "r": 387.89923, "b": 607.98491, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "80.0", "bbox": {"l": 413.90161, "t": 599.07835, "r": 431.33615, "b": 607.98491, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "66.0", "bbox": {"l": 458.16544, "t": 599.07835, "r": 475.59998, "b": 607.98491, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "73.0", "bbox": {"l": 497.02954000000005, "t": 599.07835, "r": 514.46411, "b": 607.98491, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "Acrobat Pro", "bbox": {"l": 346.55899, "t": 611.03336, "r": 395.47534, "b": 619.93991, "coord_origin": "TOPLEFT"}}, {"id": 201, "text": "68.9", "bbox": {"l": 413.90616, "t": 611.03336, "r": 431.34069999999997, "b": 619.93991, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": "61.8", "bbox": {"l": 458.16998000000007, "t": 611.03336, "r": 475.60452, "b": 619.93991, "coord_origin": "TOPLEFT"}}, {"id": 203, "text": "65.3", "bbox": {"l": 497.03409, "t": 611.03336, "r": 514.46863, "b": 619.93991, "coord_origin": "TOPLEFT"}}, {"id": 204, "text": "EDD", "bbox": {"l": 360.78101, "t": 622.9883600000001, "r": 381.25415, "b": 631.89491, "coord_origin": "TOPLEFT"}}, {"id": 205, "text": "91.2", "bbox": {"l": 413.90158, "t": 622.9883600000001, "r": 431.33612, "b": 631.89491, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": "85.4", "bbox": {"l": 458.16541, "t": 622.9883600000001, "r": 475.59995000000004, "b": 631.89491, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": "88.3", "bbox": {"l": 497.0295100000001, "t": 622.9883600000001, "r": 514.46405, "b": 631.89491, "coord_origin": "TOPLEFT"}}, {"id": 208, "text": "TableFormer", "bbox": {"l": 345.483, "t": 634.94336, "r": 396.5513, "b": 643.84991, "coord_origin": "TOPLEFT"}}, {"id": 209, "text": "95.4", "bbox": {"l": 413.90616, "t": 634.94336, "r": 431.34069999999997, "b": 643.84991, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": "90.1", "bbox": {"l": 458.16998000000007, "t": 634.94336, "r": 475.60452, "b": 643.84991, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "93.6", "bbox": {"l": 497.03400000000005, "t": 634.82381, "r": 514.46857, "b": 643.78018, "coord_origin": "TOPLEFT"}}, {"id": 212, "text": "Table 4:", "bbox": {"l": 308.862, "t": 656.86136, "r": 341.73862, "b": 665.76792, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "Results of structure with content retrieved using", "bbox": {"l": 349.55927, "t": 656.86136, "r": 545.11517, "b": 665.76792, "coord_origin": "TOPLEFT"}}, {"id": 214, "text": "cell detection on PubTabNet. In all cases the input is PDF", "bbox": {"l": 308.862, "t": 668.81636, "r": 545.11505, "b": 677.7229199999999, "coord_origin": "TOPLEFT"}}, {"id": 215, "text": "documents with cropped tables.", "bbox": {"l": 308.862, "t": 680.77136, "r": 435.03836, "b": 689.6779300000001, "coord_origin": "TOPLEFT"}}, {"id": 216, "text": "7", "bbox": {"l": 295.121, "t": 734.133358, "r": 300.10229, "b": 743.039921, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 10, "label": "section_header", "bbox": {"l": 50.112, "t": 74.40137000000016, "r": 167.89825, "b": 84.25342, "coord_origin": "TOPLEFT"}, "confidence": 0.9554274082183838, "cells": [{"id": 0, "text": "5.3.", "bbox": {"l": 50.112, "t": 74.40137000000016, "r": 63.704811, "b": 84.25342, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Datasets and Metrics", "bbox": {"l": 72.766685, "t": 74.40137000000016, "r": 167.89825, "b": 84.25342, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 50.112, "t": 93.35039999999992, "r": 286.36511, "b": 138.12298999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9862998127937317, "cells": [{"id": 2, "text": "The Tree-Edit-Distance-Based Similarity (TEDS) met-", "bbox": {"l": 62.067001, "t": 93.35039999999992, "r": 286.36499, "b": 102.25696000000016, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "ric was introduced in [37]. It represents the prediction, and", "bbox": {"l": 50.112, "t": 105.30542000000003, "r": 286.36511, "b": 114.21198000000015, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "ground-truth as a tree structure of HTML tags. This simi-", "bbox": {"l": 50.112, "t": 117.26044000000002, "r": 286.36505, "b": 126.16699000000006, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "larity is calculated as:", "bbox": {"l": 50.112, "t": 129.21642999999995, "r": 136.71687, "b": 138.12298999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "formula", "bbox": {"l": 86.218994, "t": 150.31799, "r": 286.3624, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9500409364700317, "cells": [{"id": 6, "text": "TEDS (", "bbox": {"l": 86.218994, "t": 157.05798000000004, "r": 118.8784, "b": 165.90479000000005, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "T$_{a}$, T$_{b}$", "bbox": {"l": 118.87499, "t": 157.05798000000004, "r": 143.26962, "b": 165.90479000000005, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": ") = 1", "bbox": {"l": 143.76799, "t": 157.05798000000004, "r": 165.9019, "b": 165.90479000000005, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "\u2212", "bbox": {"l": 168.12099, "t": 156.50012000000004, "r": 175.8699, "b": 165.90479000000005, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "EditDist (", "bbox": {"l": 179.27899, "t": 150.31799, "r": 221.95677, "b": 159.16479000000004, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "T$_{a}$, T$_{b}$", "bbox": {"l": 221.95200000000003, "t": 150.31799, "r": 246.34663, "b": 159.16479000000004, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": ")", "bbox": {"l": 246.84499999999997, "t": 150.31799, "r": 250.71945, "b": 159.16479000000004, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "max (", "bbox": {"l": 182.21201, "t": 163.89197000000001, "r": 206.29161, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "|", "bbox": {"l": 206.289, "t": 163.33411, "r": 209.05661, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "T$_{a}$", "bbox": {"l": 209.056, "t": 163.89197000000001, "r": 219.19968, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "|", "bbox": {"l": 219.69700999999998, "t": 163.33411, "r": 222.46461000000002, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": ",", "bbox": {"l": 224.125, "t": 163.89197000000001, "r": 226.89261, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "|", "bbox": {"l": 228.55299000000002, "t": 163.33411, "r": 231.3206, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "T$_{b}$", "bbox": {"l": 231.31999, "t": 163.89197000000001, "r": 240.64563, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "|", "bbox": {"l": 241.144, "t": 163.33411, "r": 243.91161, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": ")", "bbox": {"l": 243.911, "t": 163.89197000000001, "r": 247.78545, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "(3)", "bbox": {"l": 274.746, "t": 157.21740999999997, "r": 286.3624, "b": 166.12396, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "text", "bbox": {"l": 50.111984, "t": 181.00298999999995, "r": 286.36285, "b": 213.97900000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9735319018363953, "cells": [{"id": 23, "text": "where", "bbox": {"l": 62.067001, "t": 181.16241000000002, "r": 86.405632, "b": 190.06897000000004, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "T$_{a}$", "bbox": {"l": 88.581001, "t": 181.00298999999995, "r": 98.724663, "b": 189.84978999999998, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "and", "bbox": {"l": 101.399, "t": 181.16241000000002, "r": 115.785, "b": 190.06897000000004, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "T$_{b}$", "bbox": {"l": 117.961, "t": 181.00298999999995, "r": 127.28664, "b": 189.84978999999998, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "represent tables in tree structure HTML", "bbox": {"l": 129.95999, "t": 181.16241000000002, "r": 286.36285, "b": 190.06897000000004, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "format. EditDist denotes the tree-edit distance, and", "bbox": {"l": 50.111992, "t": 193.11743, "r": 252.78116000000003, "b": 202.02399000000003, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "|", "bbox": {"l": 255.18201, "t": 192.40015000000005, "r": 257.94962, "b": 201.80480999999997, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "T", "bbox": {"l": 257.94901, "t": 192.95800999999994, "r": 263.77115, "b": 201.80480999999997, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "|", "bbox": {"l": 265.155, "t": 192.40015000000005, "r": 267.92261, "b": 201.80480999999997, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "rep-", "bbox": {"l": 270.32199, "t": 193.11743, "r": 286.36179, "b": 202.02399000000003, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "resents the number of nodes in", "bbox": {"l": 50.111984, "t": 205.07245, "r": 172.13388, "b": 213.97900000000004, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "T", "bbox": {"l": 174.62399, "t": 204.91301999999996, "r": 180.44614, "b": 213.75982999999997, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": ".", "bbox": {"l": 181.82899, "t": 205.07245, "r": 184.31964, "b": 213.97900000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "section_header", "bbox": {"l": 50.112, "t": 224.81946000000005, "r": 170.45169, "b": 234.67151, "coord_origin": "TOPLEFT"}, "confidence": 0.9588837027549744, "cells": [{"id": 36, "text": "5.4.", "bbox": {"l": 50.112, "t": 224.81946000000005, "r": 64.551605, "b": 234.67151, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "Quantitative Analysis", "bbox": {"l": 74.178009, "t": 224.81946000000005, "r": 170.45169, "b": 234.67151, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 50.112, "t": 243.6499, "r": 286.36514, "b": 396.13794, "coord_origin": "TOPLEFT"}, "confidence": 0.9855090975761414, "cells": [{"id": 38, "text": "Structure.", "bbox": {"l": 62.067001, "t": 243.6499, "r": 105.32461, "b": 252.60626000000002, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "As shown in Tab.", "bbox": {"l": 112.12600000000002, "t": 243.76946999999996, "r": 184.68361, "b": 252.67602999999997, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "2, TableFormer outper-", "bbox": {"l": 191.4781, "t": 243.76946999999996, "r": 286.36188, "b": 252.67602999999997, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "forms all SOTA methods across different datasets by a large", "bbox": {"l": 50.112, "t": 255.72448999999995, "r": 286.36508, "b": 264.63104, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "margin for predicting the table structure from an image.", "bbox": {"l": 50.112, "t": 267.67949999999996, "r": 286.36508, "b": 276.58606, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "All the more, our model outperforms pre-trained methods.", "bbox": {"l": 50.112, "t": 279.63446, "r": 286.36508, "b": 288.54105, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "During the evaluation we do not apply any table filtering.", "bbox": {"l": 50.112, "t": 291.59048, "r": 286.36514, "b": 300.49704, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "We also provide our baseline results on the SynthTabNet", "bbox": {"l": 50.112, "t": 303.54547, "r": 286.36508, "b": 312.45203000000004, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "dataset. It has been observed that large tables (e.g. tables", "bbox": {"l": 50.112, "t": 315.50046, "r": 286.36505, "b": 324.40700999999996, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "that occupy half of the page or more) yield poor predictions.", "bbox": {"l": 50.112, "t": 327.45544, "r": 286.36508, "b": 336.362, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "We attribute this issue to the image resizing during the pre-", "bbox": {"l": 50.112, "t": 339.41043, "r": 286.36508, "b": 348.31699000000003, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "processing step, that produces downsampled images with", "bbox": {"l": 50.112, "t": 351.36542, "r": 286.36505, "b": 360.27197, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "indistinguishable features. This problem can be addressed", "bbox": {"l": 50.112, "t": 363.32141, "r": 286.36508, "b": 372.2279700000001, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "by treating such big tables with a separate model which ac-", "bbox": {"l": 50.112, "t": 375.2764, "r": 286.36511, "b": 384.18295000000006, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "cepts a large input image size.", "bbox": {"l": 50.112, "t": 387.23138, "r": 170.01187, "b": 396.13794, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "table", "bbox": {"l": 53.368526458740234, "t": 409.1357727050781, "r": 283.0443420410156, "b": 582.3977661132812, "coord_origin": "TOPLEFT"}, "confidence": 0.9892510175704956, "cells": [{"id": 53, "text": "Model", "bbox": {"l": 78.843002, "t": 420.69037, "r": 104.85535, "b": 429.59692, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "TEDS", "bbox": {"l": 211.2, "t": 414.71237, "r": 236.10649, "b": 423.61893, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "Dataset", "bbox": {"l": 129.338, "t": 426.66736, "r": 159.21584, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Simple", "bbox": {"l": 171.17096, "t": 426.66736, "r": 199.40497, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Complex", "bbox": {"l": 211.36009, "t": 426.66736, "r": 247.74349999999998, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "All", "bbox": {"l": 264.54044, "t": 426.66736, "r": 277.27264, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "EDD", "bbox": {"l": 81.612, "t": 443.62436, "r": 102.08514, "b": 452.53091, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "PTN", "bbox": {"l": 134.87206, "t": 443.62436, "r": 153.69141, "b": 452.53091, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "91.1", "bbox": {"l": 176.56554, "t": 443.62436, "r": 194.00009, "b": 452.53091, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "88.7", "bbox": {"l": 220.82938000000001, "t": 443.62436, "r": 238.26393, "b": 452.53091, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "89.9", "bbox": {"l": 262.18414, "t": 443.62436, "r": 279.61868, "b": 452.53091, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "GTE", "bbox": {"l": 82.165001, "t": 455.58035, "r": 101.5323, "b": 464.48691, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "PTN", "bbox": {"l": 134.86716, "t": 455.58035, "r": 153.68651, "b": 464.48691, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "-", "bbox": {"l": 183.62411, "t": 455.58035, "r": 186.94167, "b": 464.48691, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "-", "bbox": {"l": 227.88795000000002, "t": 455.58035, "r": 231.20551, "b": 464.48691, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "93.01", "bbox": {"l": 259.69855, "t": 455.58035, "r": 282.11441, "b": 464.48691, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 468.13336, "r": 117.38329000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "PTN", "bbox": {"l": 134.86766, "t": 468.13336, "r": 153.68701, "b": 477.03992, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "98.5", "bbox": {"l": 176.57111, "t": 468.13336, "r": 194.00566, "b": 477.03992, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "95.0", "bbox": {"l": 220.83495, "t": 468.13336, "r": 238.26950000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "96.75", "bbox": {"l": 259.698, "t": 468.01379, "r": 282.11386, "b": 476.97018, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "EDD", "bbox": {"l": 81.612, "t": 483.32635, "r": 102.08514, "b": 492.23291, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "FTN", "bbox": {"l": 134.87206, "t": 483.32635, "r": 153.69141, "b": 492.23291, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "88.4", "bbox": {"l": 176.56554, "t": 483.32635, "r": 194.00009, "b": 492.23291, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "92.08", "bbox": {"l": 218.33870999999996, "t": 483.32635, "r": 240.75455999999997, "b": 492.23291, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "90.6", "bbox": {"l": 262.18411, "t": 483.32635, "r": 279.61865, "b": 492.23291, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "GTE", "bbox": {"l": 82.165001, "t": 495.28134, "r": 101.5323, "b": 504.1879, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "FTN", "bbox": {"l": 134.86716, "t": 495.28134, "r": 153.68651, "b": 504.1879, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "-", "bbox": {"l": 183.62411, "t": 495.28134, "r": 186.94167, "b": 504.1879, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "-", "bbox": {"l": 227.88795000000002, "t": 495.28134, "r": 231.20551, "b": 504.1879, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "87.14", "bbox": {"l": 259.69855, "t": 495.28134, "r": 282.11441, "b": 504.1879, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "GTE (FT)", "bbox": {"l": 71.789001, "t": 507.23633, "r": 111.90838999999998, "b": 516.14288, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "FTN", "bbox": {"l": 134.86221, "t": 507.23633, "r": 153.68156, "b": 516.14288, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "-", "bbox": {"l": 183.62914, "t": 507.23633, "r": 186.94669, "b": 516.14288, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "-", "bbox": {"l": 227.89297, "t": 507.23633, "r": 231.21053000000003, "b": 516.14288, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "91.02", "bbox": {"l": 259.6936, "t": 507.23633, "r": 282.10947, "b": 516.14288, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 519.1913099999999, "r": 117.38329000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "FTN", "bbox": {"l": 134.86766, "t": 519.1913099999999, "r": 153.68701, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "97.5", "bbox": {"l": 176.57111, "t": 519.1913099999999, "r": 194.00566, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "96.0", "bbox": {"l": 220.83495, "t": 519.1913099999999, "r": 238.26950000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "96.8", "bbox": {"l": 262.189, "t": 519.0717500000001, "r": 279.62354, "b": 528.02814, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "EDD", "bbox": {"l": 81.612, "t": 536.49837, "r": 102.08514, "b": 545.40492, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "TB", "bbox": {"l": 137.91064, "t": 536.49837, "r": 150.64285, "b": 545.40492, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "86.0", "bbox": {"l": 176.56554, "t": 536.49837, "r": 194.00009, "b": 545.40492, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "-", "bbox": {"l": 227.89285, "t": 536.49837, "r": 231.21040000000002, "b": 545.40492, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "86.0", "bbox": {"l": 262.18411, "t": 536.49837, "r": 279.61865, "b": 545.40492, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 548.45436, "r": 117.38329000000002, "b": 557.36092, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "TB", "bbox": {"l": 137.90625, "t": 548.45436, "r": 150.63846, "b": 557.36092, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "89.6", "bbox": {"l": 176.57111, "t": 548.45436, "r": 194.00566, "b": 557.36092, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "-", "bbox": {"l": 227.88845999999998, "t": 548.45436, "r": 231.20601, "b": 557.36092, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "89.6", "bbox": {"l": 262.189, "t": 548.3348100000001, "r": 279.62354, "b": 557.2911799999999, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 568.00237, "r": 117.38329000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "STN", "bbox": {"l": 134.86766, "t": 568.00237, "r": 153.68701, "b": 576.90892, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "96.9", "bbox": {"l": 176.57111, "t": 568.00237, "r": 194.00566, "b": 576.90892, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "95.7", "bbox": {"l": 220.83495, "t": 568.00237, "r": 238.26950000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "96.7", "bbox": {"l": 262.1897, "t": 568.00237, "r": 279.62424, "b": 576.90892, "coord_origin": "TOPLEFT"}}], "children": [{"id": 17, "label": "text", "bbox": {"l": 78.843002, "t": 420.69037, "r": 104.85535, "b": 429.59692, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "Model", "bbox": {"l": 78.843002, "t": 420.69037, "r": 104.85535, "b": 429.59692, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 211.2, "t": 414.71237, "r": 236.10649, "b": 423.61893, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "TEDS", "bbox": {"l": 211.2, "t": 414.71237, "r": 236.10649, "b": 423.61893, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 129.338, "t": 426.66736, "r": 159.21584, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "Dataset", "bbox": {"l": 129.338, "t": 426.66736, "r": 159.21584, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 171.17096, "t": 426.66736, "r": 199.40497, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "Simple", "bbox": {"l": 171.17096, "t": 426.66736, "r": 199.40497, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 211.36009, "t": 426.66736, "r": 247.74349999999998, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "Complex", "bbox": {"l": 211.36009, "t": 426.66736, "r": 247.74349999999998, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 264.54044, "t": 426.66736, "r": 277.27264, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "All", "bbox": {"l": 264.54044, "t": 426.66736, "r": 277.27264, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 81.612, "t": 443.62436, "r": 102.08514, "b": 452.53091, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "EDD", "bbox": {"l": 81.612, "t": 443.62436, "r": 102.08514, "b": 452.53091, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 134.87206, "t": 443.62436, "r": 153.69141, "b": 452.53091, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "PTN", "bbox": {"l": 134.87206, "t": 443.62436, "r": 153.69141, "b": 452.53091, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 176.56554, "t": 443.62436, "r": 194.00009, "b": 452.53091, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "91.1", "bbox": {"l": 176.56554, "t": 443.62436, "r": 194.00009, "b": 452.53091, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 220.82938000000001, "t": 443.62436, "r": 238.26393, "b": 452.53091, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "88.7", "bbox": {"l": 220.82938000000001, "t": 443.62436, "r": 238.26393, "b": 452.53091, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 262.18414, "t": 443.62436, "r": 279.61868, "b": 452.53091, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "89.9", "bbox": {"l": 262.18414, "t": 443.62436, "r": 279.61868, "b": 452.53091, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 82.165001, "t": 455.58035, "r": 101.5323, "b": 464.48691, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "GTE", "bbox": {"l": 82.165001, "t": 455.58035, "r": 101.5323, "b": 464.48691, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 134.86716, "t": 455.58035, "r": 153.68651, "b": 464.48691, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "PTN", "bbox": {"l": 134.86716, "t": 455.58035, "r": 153.68651, "b": 464.48691, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 183.62411, "t": 455.58035, "r": 186.94167, "b": 464.48691, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "-", "bbox": {"l": 183.62411, "t": 455.58035, "r": 186.94167, "b": 464.48691, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 227.88795000000002, "t": 455.58035, "r": 231.20551, "b": 464.48691, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "-", "bbox": {"l": 227.88795000000002, "t": 455.58035, "r": 231.20551, "b": 464.48691, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 259.69855, "t": 455.58035, "r": 282.11441, "b": 464.48691, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "93.01", "bbox": {"l": 259.69855, "t": 455.58035, "r": 282.11441, "b": 464.48691, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 66.315002, "t": 468.13336, "r": 117.38329000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 468.13336, "r": 117.38329000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 134.86766, "t": 468.13336, "r": 153.68701, "b": 477.03992, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "PTN", "bbox": {"l": 134.86766, "t": 468.13336, "r": 153.68701, "b": 477.03992, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 176.57111, "t": 468.13336, "r": 194.00566, "b": 477.03992, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "98.5", "bbox": {"l": 176.57111, "t": 468.13336, "r": 194.00566, "b": 477.03992, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 220.83495, "t": 468.13336, "r": 238.26950000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "95.0", "bbox": {"l": 220.83495, "t": 468.13336, "r": 238.26950000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 259.698, "t": 468.01379, "r": 282.11386, "b": 476.97018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "96.75", "bbox": {"l": 259.698, "t": 468.01379, "r": 282.11386, "b": 476.97018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 81.612, "t": 483.32635, "r": 102.08514, "b": 492.23291, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "EDD", "bbox": {"l": 81.612, "t": 483.32635, "r": 102.08514, "b": 492.23291, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 134.87206, "t": 483.32635, "r": 153.69141, "b": 492.23291, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "FTN", "bbox": {"l": 134.87206, "t": 483.32635, "r": 153.69141, "b": 492.23291, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 176.56554, "t": 483.32635, "r": 194.00009, "b": 492.23291, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "88.4", "bbox": {"l": 176.56554, "t": 483.32635, "r": 194.00009, "b": 492.23291, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 218.33870999999996, "t": 483.32635, "r": 240.75455999999997, "b": 492.23291, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "92.08", "bbox": {"l": 218.33870999999996, "t": 483.32635, "r": 240.75455999999997, "b": 492.23291, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 262.18411, "t": 483.32635, "r": 279.61865, "b": 492.23291, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "90.6", "bbox": {"l": 262.18411, "t": 483.32635, "r": 279.61865, "b": 492.23291, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 82.165001, "t": 495.28134, "r": 101.5323, "b": 504.1879, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "GTE", "bbox": {"l": 82.165001, "t": 495.28134, "r": 101.5323, "b": 504.1879, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 134.86716, "t": 495.28134, "r": 153.68651, "b": 504.1879, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "FTN", "bbox": {"l": 134.86716, "t": 495.28134, "r": 153.68651, "b": 504.1879, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 183.62411, "t": 495.28134, "r": 186.94167, "b": 504.1879, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "-", "bbox": {"l": 183.62411, "t": 495.28134, "r": 186.94167, "b": 504.1879, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 227.88795000000002, "t": 495.28134, "r": 231.20551, "b": 504.1879, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "-", "bbox": {"l": 227.88795000000002, "t": 495.28134, "r": 231.20551, "b": 504.1879, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 259.69855, "t": 495.28134, "r": 282.11441, "b": 504.1879, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "87.14", "bbox": {"l": 259.69855, "t": 495.28134, "r": 282.11441, "b": 504.1879, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 71.789001, "t": 507.23633, "r": 111.90838999999998, "b": 516.14288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "GTE (FT)", "bbox": {"l": 71.789001, "t": 507.23633, "r": 111.90838999999998, "b": 516.14288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 134.86221, "t": 507.23633, "r": 153.68156, "b": 516.14288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "FTN", "bbox": {"l": 134.86221, "t": 507.23633, "r": 153.68156, "b": 516.14288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 183.62914, "t": 507.23633, "r": 186.94669, "b": 516.14288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "-", "bbox": {"l": 183.62914, "t": 507.23633, "r": 186.94669, "b": 516.14288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 227.89297, "t": 507.23633, "r": 231.21053000000003, "b": 516.14288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "-", "bbox": {"l": 227.89297, "t": 507.23633, "r": 231.21053000000003, "b": 516.14288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 259.6936, "t": 507.23633, "r": 282.10947, "b": 516.14288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "91.02", "bbox": {"l": 259.6936, "t": 507.23633, "r": 282.10947, "b": 516.14288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 66.315002, "t": 519.1913099999999, "r": 117.38329000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 519.1913099999999, "r": 117.38329000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 134.86766, "t": 519.1913099999999, "r": 153.68701, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "FTN", "bbox": {"l": 134.86766, "t": 519.1913099999999, "r": 153.68701, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 176.57111, "t": 519.1913099999999, "r": 194.00566, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "97.5", "bbox": {"l": 176.57111, "t": 519.1913099999999, "r": 194.00566, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 220.83495, "t": 519.1913099999999, "r": 238.26950000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "96.0", "bbox": {"l": 220.83495, "t": 519.1913099999999, "r": 238.26950000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 262.189, "t": 519.0717500000001, "r": 279.62354, "b": 528.02814, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "96.8", "bbox": {"l": 262.189, "t": 519.0717500000001, "r": 279.62354, "b": 528.02814, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 81.612, "t": 536.49837, "r": 102.08514, "b": 545.40492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "EDD", "bbox": {"l": 81.612, "t": 536.49837, "r": 102.08514, "b": 545.40492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 137.91064, "t": 536.49837, "r": 150.64285, "b": 545.40492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "TB", "bbox": {"l": 137.91064, "t": 536.49837, "r": 150.64285, "b": 545.40492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 176.56554, "t": 536.49837, "r": 194.00009, "b": 545.40492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "86.0", "bbox": {"l": 176.56554, "t": 536.49837, "r": 194.00009, "b": 545.40492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 227.89285, "t": 536.49837, "r": 231.21040000000002, "b": 545.40492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "-", "bbox": {"l": 227.89285, "t": 536.49837, "r": 231.21040000000002, "b": 545.40492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 262.18411, "t": 536.49837, "r": 279.61865, "b": 545.40492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "86.0", "bbox": {"l": 262.18411, "t": 536.49837, "r": 279.61865, "b": 545.40492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 66.315002, "t": 548.45436, "r": 117.38329000000002, "b": 557.36092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 548.45436, "r": 117.38329000000002, "b": 557.36092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 137.90625, "t": 548.45436, "r": 150.63846, "b": 557.36092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "TB", "bbox": {"l": 137.90625, "t": 548.45436, "r": 150.63846, "b": 557.36092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 176.57111, "t": 548.45436, "r": 194.00566, "b": 557.36092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "89.6", "bbox": {"l": 176.57111, "t": 548.45436, "r": 194.00566, "b": 557.36092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 227.88845999999998, "t": 548.45436, "r": 231.20601, "b": 557.36092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "-", "bbox": {"l": 227.88845999999998, "t": 548.45436, "r": 231.20601, "b": 557.36092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 262.189, "t": 548.3348100000001, "r": 279.62354, "b": 557.2911799999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": "89.6", "bbox": {"l": 262.189, "t": 548.3348100000001, "r": 279.62354, "b": 557.2911799999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 66.315002, "t": 568.00237, "r": 117.38329000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 568.00237, "r": 117.38329000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 134.86766, "t": 568.00237, "r": 153.68701, "b": 576.90892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "STN", "bbox": {"l": 134.86766, "t": 568.00237, "r": 153.68701, "b": 576.90892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 176.57111, "t": 568.00237, "r": 194.00566, "b": 576.90892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": "96.9", "bbox": {"l": 176.57111, "t": 568.00237, "r": 194.00566, "b": 576.90892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 220.83495, "t": 568.00237, "r": 238.26950000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 107, "text": "95.7", "bbox": {"l": 220.83495, "t": 568.00237, "r": 238.26950000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 262.1897, "t": 568.00237, "r": 279.62424, "b": 576.90892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 108, "text": "96.7", "bbox": {"l": 262.1897, "t": 568.00237, "r": 279.62424, "b": 576.90892, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 15, "label": "text", "bbox": {"l": 50.112, "t": 592.43336, "r": 286.36511, "b": 613.29492, "coord_origin": "TOPLEFT"}, "confidence": 0.7209173440933228, "cells": [{"id": 109, "text": "Table 2: Structure results on PubTabNet (PTN), FinTabNet", "bbox": {"l": 50.112, "t": 592.43336, "r": 286.36511, "b": 601.33992, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "(FTN), TableBank (TB) and SynthTabNet (STN).", "bbox": {"l": 50.112, "t": 604.38837, "r": 247.46114, "b": 613.29492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 50.112, "t": 616.34337, "r": 261.78732, "b": 625.24992, "coord_origin": "TOPLEFT"}, "confidence": 0.6433312892913818, "cells": [{"id": 111, "text": "FT: Model was trained on PubTabNet then finetuned.", "bbox": {"l": 50.112, "t": 616.34337, "r": 261.78732, "b": 625.24992, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 50.112015, "t": 644.3498099999999, "r": 286.366, "b": 713.151932, "coord_origin": "TOPLEFT"}, "confidence": 0.9854635000228882, "cells": [{"id": 112, "text": "Cell Detection.", "bbox": {"l": 62.067001, "t": 644.3498099999999, "r": 124.72179, "b": 653.30618, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "Like any object detector, our", "bbox": {"l": 128.20401, "t": 644.46936, "r": 242.9333, "b": 653.37592, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "Cell BBox", "bbox": {"l": 245.55401999999998, "t": 644.55902, "r": 286.36084, "b": 653.1467700000001, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "Detector", "bbox": {"l": 50.112015, "t": 656.51402, "r": 84.971146, "b": 665.10178, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "provides bounding boxes that can be improved", "bbox": {"l": 89.515015, "t": 656.42436, "r": 286.366, "b": 665.33092, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "with post-processing during inference. We make use of the", "bbox": {"l": 50.112015, "t": 668.37936, "r": 286.36511, "b": 677.28593, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "grid-like structure of tables to refine the predictions. A de-", "bbox": {"l": 50.112015, "t": 680.33536, "r": 286.36505, "b": 689.24193, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "tailed explanation on the post-processing is available in the", "bbox": {"l": 50.112015, "t": 692.290359, "r": 286.36511, "b": 701.19693, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "supplementary material. As shown in Tab. 3, we evaluate", "bbox": {"l": 50.112015, "t": 704.245361, "r": 286.36508, "b": 713.151932, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "text", "bbox": {"l": 308.862, "t": 75.20836999999995, "r": 545.11517, "b": 227.57709, "coord_origin": "TOPLEFT"}, "confidence": 0.9713197946548462, "cells": [{"id": 121, "text": "our", "bbox": {"l": 308.862, "t": 75.20836999999995, "r": 322.14215, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Cell BBox Decoder", "bbox": {"l": 325.45401, "t": 75.29803000000004, "r": 404.56702, "b": 83.88580000000002, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "accuracy for cells with a class la-", "bbox": {"l": 408.104, "t": 75.20836999999995, "r": 545.10968, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "bel of \u2018content\u2019 only using the PASCAL VOC mAP metric", "bbox": {"l": 308.862, "t": 87.16339000000005, "r": 545.11511, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "for pre-processing and post-processing.", "bbox": {"l": 308.862, "t": 99.11841000000004, "r": 470.22626, "b": 108.02495999999985, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "Note that we do", "bbox": {"l": 477.52884, "t": 99.11841000000004, "r": 545.11511, "b": 108.02495999999985, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "not have post-processing results for SynthTabNet as images", "bbox": {"l": 308.862, "t": 111.07343000000003, "r": 545.11517, "b": 119.97997999999984, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "are only provided. To compare the performance of our pro-", "bbox": {"l": 308.862, "t": 123.02844000000005, "r": 545.11511, "b": 131.93499999999995, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "posed approach, we\u2019ve integrated TableFormer\u2019s", "bbox": {"l": 308.862, "t": 134.98443999999995, "r": 502.01691000000005, "b": 143.89099, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "Cell BBox", "bbox": {"l": 504.47299, "t": 135.07410000000004, "r": 545.11041, "b": 143.66187000000002, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "Decoder", "bbox": {"l": 308.862, "t": 147.02910999999995, "r": 343.16324, "b": 155.61688000000004, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "into EDD architecture. As mentioned previously,", "bbox": {"l": 346.371, "t": 146.93944999999997, "r": 545.11493, "b": 155.84600999999998, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "the Structure Decoder provides the", "bbox": {"l": 308.862, "t": 158.89446999999996, "r": 446.15652, "b": 167.80102999999997, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "Cell BBox Decoder", "bbox": {"l": 448.28998000000007, "t": 158.98413000000005, "r": 525.04181, "b": 167.57190000000003, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "with", "bbox": {"l": 527.39899, "t": 158.89446999999996, "r": 545.11249, "b": 167.80102999999997, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "the features needed to predict the bounding box predictions.", "bbox": {"l": 308.862, "t": 170.84948999999995, "r": 545.11511, "b": 179.75603999999998, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "Therefore, the accuracy of the", "bbox": {"l": 308.862, "t": 182.80449999999996, "r": 432.86642000000006, "b": 191.71105999999997, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "Structure Decoder", "bbox": {"l": 436.39001, "t": 182.89417000000003, "r": 510.93021, "b": 191.48193000000003, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "directly", "bbox": {"l": 514.677, "t": 182.80449999999996, "r": 545.11273, "b": 191.71105999999997, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "influences the accuracy of the", "bbox": {"l": 308.862, "t": 194.75951999999995, "r": 431.17285, "b": 203.66607999999997, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "Cell BBox Decoder", "bbox": {"l": 434.6790199999999, "t": 194.84918000000005, "r": 514.18054, "b": 203.43695000000002, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": ". If the", "bbox": {"l": 514.17603, "t": 194.75951999999995, "r": 545.10992, "b": 203.66607999999997, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "Structure Decoder", "bbox": {"l": 308.86203, "t": 206.80517999999995, "r": 382.35614, "b": 215.39293999999995, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "predicts an extra column, this will result", "bbox": {"l": 385.07501, "t": 206.71551999999997, "r": 545.11426, "b": 215.62207, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "in an extra column of predicted bounding boxes.", "bbox": {"l": 308.862, "t": 218.67052999999999, "r": 501.6981799999999, "b": 227.57709, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "table", "bbox": {"l": 308.4068603515625, "t": 247.87631225585938, "r": 533.6419677734375, "b": 303.8056640625, "coord_origin": "TOPLEFT"}, "confidence": 0.9691730737686157, "cells": [{"id": 146, "text": "Model", "bbox": {"l": 339.323, "t": 253.66436999999996, "r": 365.33536, "b": 262.57092, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "Dataset", "bbox": {"l": 401.04132, "t": 253.66436999999996, "r": 430.91916, "b": 262.57092, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "mAP", "bbox": {"l": 454.10214, "t": 253.66436999999996, "r": 474.58523999999994, "b": 262.57092, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "mAP (PP)", "bbox": {"l": 486.54034, "t": 253.66436999999996, "r": 527.2276, "b": 262.57092, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "EDD+BBox", "bbox": {"l": 327.65601, "t": 270.62134000000003, "r": 377.00076, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "PubTabNet", "bbox": {"l": 393.69809, "t": 270.62134000000003, "r": 438.28073, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "79.2", "bbox": {"l": 455.63559, "t": 270.62134000000003, "r": 473.07013, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "82.7", "bbox": {"l": 498.16592, "t": 270.62134000000003, "r": 515.60046, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "TableFormer", "bbox": {"l": 326.79501, "t": 282.57631999999995, "r": 377.86331, "b": 291.48288, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "PubTabNet", "bbox": {"l": 393.69388, "t": 282.57631999999995, "r": 438.27652, "b": 291.48288, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "82.1", "bbox": {"l": 455.63101, "t": 282.45676, "r": 473.06555000000003, "b": 291.41315, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "86.8", "bbox": {"l": 498.1713, "t": 282.45676, "r": 515.60583, "b": 291.41315, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "TableFormer", "bbox": {"l": 326.79501, "t": 294.53131, "r": 377.86331, "b": 303.43787, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "SynthTabNet", "bbox": {"l": 389.81842, "t": 294.53131, "r": 442.15194999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "87.7", "bbox": {"l": 455.63135, "t": 294.53131, "r": 473.06589, "b": 303.43787, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "-", "bbox": {"l": 505.22515999999996, "t": 294.53131, "r": 508.54268999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}}], "children": [{"id": 73, "label": "text", "bbox": {"l": 339.323, "t": 253.66436999999996, "r": 365.33536, "b": 262.57092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 146, "text": "Model", "bbox": {"l": 339.323, "t": 253.66436999999996, "r": 365.33536, "b": 262.57092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 401.04132, "t": 253.66436999999996, "r": 430.91916, "b": 262.57092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 147, "text": "Dataset", "bbox": {"l": 401.04132, "t": 253.66436999999996, "r": 430.91916, "b": 262.57092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 454.10214, "t": 253.66436999999996, "r": 474.58523999999994, "b": 262.57092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 148, "text": "mAP", "bbox": {"l": 454.10214, "t": 253.66436999999996, "r": 474.58523999999994, "b": 262.57092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 486.54034, "t": 253.66436999999996, "r": 527.2276, "b": 262.57092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 149, "text": "mAP (PP)", "bbox": {"l": 486.54034, "t": 253.66436999999996, "r": 527.2276, "b": 262.57092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 327.65601, "t": 270.62134000000003, "r": 377.00076, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 150, "text": "EDD+BBox", "bbox": {"l": 327.65601, "t": 270.62134000000003, "r": 377.00076, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 393.69809, "t": 270.62134000000003, "r": 438.28073, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 151, "text": "PubTabNet", "bbox": {"l": 393.69809, "t": 270.62134000000003, "r": 438.28073, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 455.63559, "t": 270.62134000000003, "r": 473.07013, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 152, "text": "79.2", "bbox": {"l": 455.63559, "t": 270.62134000000003, "r": 473.07013, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 498.16592, "t": 270.62134000000003, "r": 515.60046, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 153, "text": "82.7", "bbox": {"l": 498.16592, "t": 270.62134000000003, "r": 515.60046, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 326.79501, "t": 282.57631999999995, "r": 377.86331, "b": 291.48288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 154, "text": "TableFormer", "bbox": {"l": 326.79501, "t": 282.57631999999995, "r": 377.86331, "b": 291.48288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 393.69388, "t": 282.57631999999995, "r": 438.27652, "b": 291.48288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 155, "text": "PubTabNet", "bbox": {"l": 393.69388, "t": 282.57631999999995, "r": 438.27652, "b": 291.48288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 455.63101, "t": 282.45676, "r": 473.06555000000003, "b": 291.41315, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 156, "text": "82.1", "bbox": {"l": 455.63101, "t": 282.45676, "r": 473.06555000000003, "b": 291.41315, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 498.1713, "t": 282.45676, "r": 515.60583, "b": 291.41315, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 157, "text": "86.8", "bbox": {"l": 498.1713, "t": 282.45676, "r": 515.60583, "b": 291.41315, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 326.79501, "t": 294.53131, "r": 377.86331, "b": 303.43787, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 158, "text": "TableFormer", "bbox": {"l": 326.79501, "t": 294.53131, "r": 377.86331, "b": 303.43787, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 389.81842, "t": 294.53131, "r": 442.15194999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 159, "text": "SynthTabNet", "bbox": {"l": 389.81842, "t": 294.53131, "r": 442.15194999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 455.63135, "t": 294.53131, "r": 473.06589, "b": 303.43787, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 160, "text": "87.7", "bbox": {"l": 455.63135, "t": 294.53131, "r": 473.06589, "b": 303.43787, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 505.22515999999996, "t": 294.53131, "r": 508.54268999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 161, "text": "-", "bbox": {"l": 505.22515999999996, "t": 294.53131, "r": 508.54268999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 12, "label": "caption", "bbox": {"l": 308.862, "t": 316.44931, "r": 545.11517, "b": 337.3108500000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9519917964935303, "cells": [{"id": 162, "text": "Table 3:", "bbox": {"l": 308.862, "t": 316.44931, "r": 341.49951, "b": 325.35587, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "Cell Bounding Box detection results on PubTab-", "bbox": {"l": 348.60284, "t": 316.44931, "r": 545.11517, "b": 325.35587, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "Net, and FinTabNet. PP: Post-processing.", "bbox": {"l": 308.862, "t": 328.4043, "r": 474.97845, "b": 337.3108500000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "text", "bbox": {"l": 308.86197, "t": 367.6797199999999, "r": 545.11566, "b": 520.16769, "coord_origin": "TOPLEFT"}, "confidence": 0.9835010766983032, "cells": [{"id": 165, "text": "Cell Content.", "bbox": {"l": 320.81699, "t": 367.6797199999999, "r": 378.94876, "b": 376.63611, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "In this section, we evaluate the entire", "bbox": {"l": 387.07898, "t": 367.79929, "r": 545.11566, "b": 376.70584, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "pipeline of recovering a table with content.", "bbox": {"l": 308.86197, "t": 379.75426999999996, "r": 487.19257, "b": 388.66083, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "Here we put", "bbox": {"l": 493.96713, "t": 379.75426999999996, "r": 545.11511, "b": 388.66083, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "our approach to test by capitalizing on extracting content", "bbox": {"l": 308.86197, "t": 391.70926, "r": 545.11505, "b": 400.61581, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "from the PDF cells rather than decoding from images. Tab.", "bbox": {"l": 308.86197, "t": 403.66525, "r": 545.11523, "b": 412.57181, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "4", "bbox": {"l": 308.86197, "t": 415.62024, "r": 314.08096, "b": 424.52679, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "shows the TEDs score of HTML code representing the", "bbox": {"l": 316.69046, "t": 415.62024, "r": 545.11517, "b": 424.52679, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "structure of the table along with the content inserted in the", "bbox": {"l": 308.86197, "t": 427.57523, "r": 545.11505, "b": 436.48177999999996, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "data cell and compared with the ground-truth. Our method", "bbox": {"l": 308.86197, "t": 439.53021, "r": 545.11505, "b": 448.43677, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "achieved a", "bbox": {"l": 308.86197, "t": 451.4852, "r": 350.23666, "b": 460.39175, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "5.3%", "bbox": {"l": 352.17596, "t": 451.36563, "r": 374.59183, "b": 460.32201999999995, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "increase over the state-of-the-art, and com-", "bbox": {"l": 376.53296, "t": 451.4852, "r": 545.11011, "b": 460.39175, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "mercial solutions. We believe our scores would be higher", "bbox": {"l": 308.86197, "t": 463.44019, "r": 545.11511, "b": 472.34674, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "if the HTML ground-truth matched the extracted PDF cell", "bbox": {"l": 308.86197, "t": 475.39618, "r": 545.11517, "b": 484.30273, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "content. Unfortunately, there are small discrepancies such", "bbox": {"l": 308.86197, "t": 487.35117, "r": 545.11511, "b": 496.25772, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "as spacings around words or special characters with various", "bbox": {"l": 308.86197, "t": 499.30615, "r": 545.11505, "b": 508.21271, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "unicode representations.", "bbox": {"l": 308.86197, "t": 511.26114, "r": 405.69846, "b": 520.16769, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "table", "bbox": {"l": 332.9688720703125, "t": 540.2835693359375, "r": 520.942138671875, "b": 643.2697143554688, "coord_origin": "TOPLEFT"}, "confidence": 0.9775567650794983, "cells": [{"id": 183, "text": "Model", "bbox": {"l": 358.01099, "t": 552.23337, "r": 384.02335, "b": 561.1399200000001, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "TEDS", "bbox": {"l": 449.03400000000005, "t": 546.25537, "r": 473.94049000000007, "b": 555.16193, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": "Simple", "bbox": {"l": 408.50598, "t": 558.21037, "r": 436.73999, "b": 567.11693, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "Complex", "bbox": {"l": 448.6951, "t": 558.21037, "r": 485.07849, "b": 567.11693, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "All", "bbox": {"l": 499.3848, "t": 558.21037, "r": 512.117, "b": 567.11693, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": "Tabula", "bbox": {"l": 357.68201, "t": 575.16736, "r": 384.3519, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "78.0", "bbox": {"l": 413.90097, "t": 575.16736, "r": 431.33550999999994, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "57.8", "bbox": {"l": 458.16479000000004, "t": 575.16736, "r": 475.59933000000007, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "67.9", "bbox": {"l": 497.0289, "t": 575.16736, "r": 514.46344, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": "Traprange", "bbox": {"l": 350.72299, "t": 587.12236, "r": 391.31064, "b": 596.02892, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "60.8", "bbox": {"l": 413.90582, "t": 587.12236, "r": 431.34036, "b": 596.02892, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "49.9", "bbox": {"l": 458.16965, "t": 587.12236, "r": 475.60419, "b": 596.02892, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "55.4", "bbox": {"l": 497.03374999999994, "t": 587.12236, "r": 514.46832, "b": 596.02892, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "Camelot", "bbox": {"l": 354.13599, "t": 599.07835, "r": 387.89923, "b": 607.98491, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "80.0", "bbox": {"l": 413.90161, "t": 599.07835, "r": 431.33615, "b": 607.98491, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "66.0", "bbox": {"l": 458.16544, "t": 599.07835, "r": 475.59998, "b": 607.98491, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "73.0", "bbox": {"l": 497.02954000000005, "t": 599.07835, "r": 514.46411, "b": 607.98491, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "Acrobat Pro", "bbox": {"l": 346.55899, "t": 611.03336, "r": 395.47534, "b": 619.93991, "coord_origin": "TOPLEFT"}}, {"id": 201, "text": "68.9", "bbox": {"l": 413.90616, "t": 611.03336, "r": 431.34069999999997, "b": 619.93991, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": "61.8", "bbox": {"l": 458.16998000000007, "t": 611.03336, "r": 475.60452, "b": 619.93991, "coord_origin": "TOPLEFT"}}, {"id": 203, "text": "65.3", "bbox": {"l": 497.03409, "t": 611.03336, "r": 514.46863, "b": 619.93991, "coord_origin": "TOPLEFT"}}, {"id": 204, "text": "EDD", "bbox": {"l": 360.78101, "t": 622.9883600000001, "r": 381.25415, "b": 631.89491, "coord_origin": "TOPLEFT"}}, {"id": 205, "text": "91.2", "bbox": {"l": 413.90158, "t": 622.9883600000001, "r": 431.33612, "b": 631.89491, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": "85.4", "bbox": {"l": 458.16541, "t": 622.9883600000001, "r": 475.59995000000004, "b": 631.89491, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": "88.3", "bbox": {"l": 497.0295100000001, "t": 622.9883600000001, "r": 514.46405, "b": 631.89491, "coord_origin": "TOPLEFT"}}, {"id": 208, "text": "TableFormer", "bbox": {"l": 345.483, "t": 634.94336, "r": 396.5513, "b": 643.84991, "coord_origin": "TOPLEFT"}}, {"id": 209, "text": "95.4", "bbox": {"l": 413.90616, "t": 634.94336, "r": 431.34069999999997, "b": 643.84991, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": "90.1", "bbox": {"l": 458.16998000000007, "t": 634.94336, "r": 475.60452, "b": 643.84991, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "93.6", "bbox": {"l": 497.03400000000005, "t": 634.82381, "r": 514.46857, "b": 643.78018, "coord_origin": "TOPLEFT"}}], "children": [{"id": 89, "label": "text", "bbox": {"l": 358.01099, "t": 552.23337, "r": 384.02335, "b": 561.1399200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 183, "text": "Model", "bbox": {"l": 358.01099, "t": 552.23337, "r": 384.02335, "b": 561.1399200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 449.03400000000005, "t": 546.25537, "r": 473.94049000000007, "b": 555.16193, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 184, "text": "TEDS", "bbox": {"l": 449.03400000000005, "t": 546.25537, "r": 473.94049000000007, "b": 555.16193, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 408.50598, "t": 558.21037, "r": 436.73999, "b": 567.11693, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 185, "text": "Simple", "bbox": {"l": 408.50598, "t": 558.21037, "r": 436.73999, "b": 567.11693, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 448.6951, "t": 558.21037, "r": 485.07849, "b": 567.11693, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 186, "text": "Complex", "bbox": {"l": 448.6951, "t": 558.21037, "r": 485.07849, "b": 567.11693, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 499.3848, "t": 558.21037, "r": 512.117, "b": 567.11693, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 187, "text": "All", "bbox": {"l": 499.3848, "t": 558.21037, "r": 512.117, "b": 567.11693, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 357.68201, "t": 575.16736, "r": 384.3519, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 188, "text": "Tabula", "bbox": {"l": 357.68201, "t": 575.16736, "r": 384.3519, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 413.90097, "t": 575.16736, "r": 431.33550999999994, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 189, "text": "78.0", "bbox": {"l": 413.90097, "t": 575.16736, "r": 431.33550999999994, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 458.16479000000004, "t": 575.16736, "r": 475.59933000000007, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 190, "text": "57.8", "bbox": {"l": 458.16479000000004, "t": 575.16736, "r": 475.59933000000007, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 497.0289, "t": 575.16736, "r": 514.46344, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 191, "text": "67.9", "bbox": {"l": 497.0289, "t": 575.16736, "r": 514.46344, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 350.72299, "t": 587.12236, "r": 391.31064, "b": 596.02892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 192, "text": "Traprange", "bbox": {"l": 350.72299, "t": 587.12236, "r": 391.31064, "b": 596.02892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 413.90582, "t": 587.12236, "r": 431.34036, "b": 596.02892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 193, "text": "60.8", "bbox": {"l": 413.90582, "t": 587.12236, "r": 431.34036, "b": 596.02892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 458.16965, "t": 587.12236, "r": 475.60419, "b": 596.02892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 194, "text": "49.9", "bbox": {"l": 458.16965, "t": 587.12236, "r": 475.60419, "b": 596.02892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 497.03374999999994, "t": 587.12236, "r": 514.46832, "b": 596.02892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 195, "text": "55.4", "bbox": {"l": 497.03374999999994, "t": 587.12236, "r": 514.46832, "b": 596.02892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 354.13599, "t": 599.07835, "r": 387.89923, "b": 607.98491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 196, "text": "Camelot", "bbox": {"l": 354.13599, "t": 599.07835, "r": 387.89923, "b": 607.98491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 413.90161, "t": 599.07835, "r": 431.33615, "b": 607.98491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 197, "text": "80.0", "bbox": {"l": 413.90161, "t": 599.07835, "r": 431.33615, "b": 607.98491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 458.16544, "t": 599.07835, "r": 475.59998, "b": 607.98491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 198, "text": "66.0", "bbox": {"l": 458.16544, "t": 599.07835, "r": 475.59998, "b": 607.98491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 497.02954000000005, "t": 599.07835, "r": 514.46411, "b": 607.98491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 199, "text": "73.0", "bbox": {"l": 497.02954000000005, "t": 599.07835, "r": 514.46411, "b": 607.98491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 346.55899, "t": 611.03336, "r": 395.47534, "b": 619.93991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 200, "text": "Acrobat Pro", "bbox": {"l": 346.55899, "t": 611.03336, "r": 395.47534, "b": 619.93991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 413.90616, "t": 611.03336, "r": 431.34069999999997, "b": 619.93991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 201, "text": "68.9", "bbox": {"l": 413.90616, "t": 611.03336, "r": 431.34069999999997, "b": 619.93991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 458.16998000000007, "t": 611.03336, "r": 475.60452, "b": 619.93991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 202, "text": "61.8", "bbox": {"l": 458.16998000000007, "t": 611.03336, "r": 475.60452, "b": 619.93991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 497.03409, "t": 611.03336, "r": 514.46863, "b": 619.93991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 203, "text": "65.3", "bbox": {"l": 497.03409, "t": 611.03336, "r": 514.46863, "b": 619.93991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 360.78101, "t": 622.9883600000001, "r": 381.25415, "b": 631.89491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 204, "text": "EDD", "bbox": {"l": 360.78101, "t": 622.9883600000001, "r": 381.25415, "b": 631.89491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 413.90158, "t": 622.9883600000001, "r": 431.33612, "b": 631.89491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 205, "text": "91.2", "bbox": {"l": 413.90158, "t": 622.9883600000001, "r": 431.33612, "b": 631.89491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 458.16541, "t": 622.9883600000001, "r": 475.59995000000004, "b": 631.89491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 206, "text": "85.4", "bbox": {"l": 458.16541, "t": 622.9883600000001, "r": 475.59995000000004, "b": 631.89491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 497.0295100000001, "t": 622.9883600000001, "r": 514.46405, "b": 631.89491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 207, "text": "88.3", "bbox": {"l": 497.0295100000001, "t": 622.9883600000001, "r": 514.46405, "b": 631.89491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 114, "label": "text", "bbox": {"l": 345.483, "t": 634.94336, "r": 396.5513, "b": 643.84991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 208, "text": "TableFormer", "bbox": {"l": 345.483, "t": 634.94336, "r": 396.5513, "b": 643.84991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 115, "label": "text", "bbox": {"l": 413.90616, "t": 634.94336, "r": 431.34069999999997, "b": 643.84991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 209, "text": "95.4", "bbox": {"l": 413.90616, "t": 634.94336, "r": 431.34069999999997, "b": 643.84991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 116, "label": "text", "bbox": {"l": 458.16998000000007, "t": 634.94336, "r": 475.60452, "b": 643.84991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 210, "text": "90.1", "bbox": {"l": 458.16998000000007, "t": 634.94336, "r": 475.60452, "b": 643.84991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 117, "label": "text", "bbox": {"l": 497.03400000000005, "t": 634.82381, "r": 514.46857, "b": 643.78018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 211, "text": "93.6", "bbox": {"l": 497.03400000000005, "t": 634.82381, "r": 514.46857, "b": 643.78018, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 11, "label": "caption", "bbox": {"l": 308.862, "t": 656.86136, "r": 545.11517, "b": 689.6779300000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9541404247283936, "cells": [{"id": 212, "text": "Table 4:", "bbox": {"l": 308.862, "t": 656.86136, "r": 341.73862, "b": 665.76792, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "Results of structure with content retrieved using", "bbox": {"l": 349.55927, "t": 656.86136, "r": 545.11517, "b": 665.76792, "coord_origin": "TOPLEFT"}}, {"id": 214, "text": "cell detection on PubTabNet. In all cases the input is PDF", "bbox": {"l": 308.862, "t": 668.81636, "r": 545.11505, "b": 677.7229199999999, "coord_origin": "TOPLEFT"}}, {"id": 215, "text": "documents with cropped tables.", "bbox": {"l": 308.862, "t": 680.77136, "r": 435.03836, "b": 689.6779300000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "page_footer", "bbox": {"l": 295.121, "t": 734.133358, "r": 300.10229, "b": 743.039921, "coord_origin": "TOPLEFT"}, "confidence": 0.8787972331047058, "cells": [{"id": 216, "text": "7", "bbox": {"l": 295.121, "t": 734.133358, "r": 300.10229, "b": 743.039921, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {"0": {"label": "table", "id": 0, "page_no": 6, "cluster": {"id": 0, "label": "table", "bbox": {"l": 53.368526458740234, "t": 409.1357727050781, "r": 283.0443420410156, "b": 582.3977661132812, "coord_origin": "TOPLEFT"}, "confidence": 0.9892510175704956, "cells": [{"id": 53, "text": "Model", "bbox": {"l": 78.843002, "t": 420.69037, "r": 104.85535, "b": 429.59692, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "TEDS", "bbox": {"l": 211.2, "t": 414.71237, "r": 236.10649, "b": 423.61893, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "Dataset", "bbox": {"l": 129.338, "t": 426.66736, "r": 159.21584, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Simple", "bbox": {"l": 171.17096, "t": 426.66736, "r": 199.40497, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Complex", "bbox": {"l": 211.36009, "t": 426.66736, "r": 247.74349999999998, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "All", "bbox": {"l": 264.54044, "t": 426.66736, "r": 277.27264, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "EDD", "bbox": {"l": 81.612, "t": 443.62436, "r": 102.08514, "b": 452.53091, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "PTN", "bbox": {"l": 134.87206, "t": 443.62436, "r": 153.69141, "b": 452.53091, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "91.1", "bbox": {"l": 176.56554, "t": 443.62436, "r": 194.00009, "b": 452.53091, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "88.7", "bbox": {"l": 220.82938000000001, "t": 443.62436, "r": 238.26393, "b": 452.53091, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "89.9", "bbox": {"l": 262.18414, "t": 443.62436, "r": 279.61868, "b": 452.53091, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "GTE", "bbox": {"l": 82.165001, "t": 455.58035, "r": 101.5323, "b": 464.48691, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "PTN", "bbox": {"l": 134.86716, "t": 455.58035, "r": 153.68651, "b": 464.48691, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "-", "bbox": {"l": 183.62411, "t": 455.58035, "r": 186.94167, "b": 464.48691, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "-", "bbox": {"l": 227.88795000000002, "t": 455.58035, "r": 231.20551, "b": 464.48691, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "93.01", "bbox": {"l": 259.69855, "t": 455.58035, "r": 282.11441, "b": 464.48691, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 468.13336, "r": 117.38329000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "PTN", "bbox": {"l": 134.86766, "t": 468.13336, "r": 153.68701, "b": 477.03992, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "98.5", "bbox": {"l": 176.57111, "t": 468.13336, "r": 194.00566, "b": 477.03992, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "95.0", "bbox": {"l": 220.83495, "t": 468.13336, "r": 238.26950000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "96.75", "bbox": {"l": 259.698, "t": 468.01379, "r": 282.11386, "b": 476.97018, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "EDD", "bbox": {"l": 81.612, "t": 483.32635, "r": 102.08514, "b": 492.23291, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "FTN", "bbox": {"l": 134.87206, "t": 483.32635, "r": 153.69141, "b": 492.23291, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "88.4", "bbox": {"l": 176.56554, "t": 483.32635, "r": 194.00009, "b": 492.23291, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "92.08", "bbox": {"l": 218.33870999999996, "t": 483.32635, "r": 240.75455999999997, "b": 492.23291, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "90.6", "bbox": {"l": 262.18411, "t": 483.32635, "r": 279.61865, "b": 492.23291, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "GTE", "bbox": {"l": 82.165001, "t": 495.28134, "r": 101.5323, "b": 504.1879, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "FTN", "bbox": {"l": 134.86716, "t": 495.28134, "r": 153.68651, "b": 504.1879, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "-", "bbox": {"l": 183.62411, "t": 495.28134, "r": 186.94167, "b": 504.1879, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "-", "bbox": {"l": 227.88795000000002, "t": 495.28134, "r": 231.20551, "b": 504.1879, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "87.14", "bbox": {"l": 259.69855, "t": 495.28134, "r": 282.11441, "b": 504.1879, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "GTE (FT)", "bbox": {"l": 71.789001, "t": 507.23633, "r": 111.90838999999998, "b": 516.14288, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "FTN", "bbox": {"l": 134.86221, "t": 507.23633, "r": 153.68156, "b": 516.14288, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "-", "bbox": {"l": 183.62914, "t": 507.23633, "r": 186.94669, "b": 516.14288, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "-", "bbox": {"l": 227.89297, "t": 507.23633, "r": 231.21053000000003, "b": 516.14288, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "91.02", "bbox": {"l": 259.6936, "t": 507.23633, "r": 282.10947, "b": 516.14288, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 519.1913099999999, "r": 117.38329000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "FTN", "bbox": {"l": 134.86766, "t": 519.1913099999999, "r": 153.68701, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "97.5", "bbox": {"l": 176.57111, "t": 519.1913099999999, "r": 194.00566, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "96.0", "bbox": {"l": 220.83495, "t": 519.1913099999999, "r": 238.26950000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "96.8", "bbox": {"l": 262.189, "t": 519.0717500000001, "r": 279.62354, "b": 528.02814, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "EDD", "bbox": {"l": 81.612, "t": 536.49837, "r": 102.08514, "b": 545.40492, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "TB", "bbox": {"l": 137.91064, "t": 536.49837, "r": 150.64285, "b": 545.40492, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "86.0", "bbox": {"l": 176.56554, "t": 536.49837, "r": 194.00009, "b": 545.40492, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "-", "bbox": {"l": 227.89285, "t": 536.49837, "r": 231.21040000000002, "b": 545.40492, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "86.0", "bbox": {"l": 262.18411, "t": 536.49837, "r": 279.61865, "b": 545.40492, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 548.45436, "r": 117.38329000000002, "b": 557.36092, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "TB", "bbox": {"l": 137.90625, "t": 548.45436, "r": 150.63846, "b": 557.36092, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "89.6", "bbox": {"l": 176.57111, "t": 548.45436, "r": 194.00566, "b": 557.36092, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "-", "bbox": {"l": 227.88845999999998, "t": 548.45436, "r": 231.20601, "b": 557.36092, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "89.6", "bbox": {"l": 262.189, "t": 548.3348100000001, "r": 279.62354, "b": 557.2911799999999, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 568.00237, "r": 117.38329000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "STN", "bbox": {"l": 134.86766, "t": 568.00237, "r": 153.68701, "b": 576.90892, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "96.9", "bbox": {"l": 176.57111, "t": 568.00237, "r": 194.00566, "b": 576.90892, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "95.7", "bbox": {"l": 220.83495, "t": 568.00237, "r": 238.26950000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "96.7", "bbox": {"l": 262.1897, "t": 568.00237, "r": 279.62424, "b": 576.90892, "coord_origin": "TOPLEFT"}}], "children": [{"id": 17, "label": "text", "bbox": {"l": 78.843002, "t": 420.69037, "r": 104.85535, "b": 429.59692, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "Model", "bbox": {"l": 78.843002, "t": 420.69037, "r": 104.85535, "b": 429.59692, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 211.2, "t": 414.71237, "r": 236.10649, "b": 423.61893, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "TEDS", "bbox": {"l": 211.2, "t": 414.71237, "r": 236.10649, "b": 423.61893, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 129.338, "t": 426.66736, "r": 159.21584, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "Dataset", "bbox": {"l": 129.338, "t": 426.66736, "r": 159.21584, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 171.17096, "t": 426.66736, "r": 199.40497, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "Simple", "bbox": {"l": 171.17096, "t": 426.66736, "r": 199.40497, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 211.36009, "t": 426.66736, "r": 247.74349999999998, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "Complex", "bbox": {"l": 211.36009, "t": 426.66736, "r": 247.74349999999998, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 264.54044, "t": 426.66736, "r": 277.27264, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "All", "bbox": {"l": 264.54044, "t": 426.66736, "r": 277.27264, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 81.612, "t": 443.62436, "r": 102.08514, "b": 452.53091, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "EDD", "bbox": {"l": 81.612, "t": 443.62436, "r": 102.08514, "b": 452.53091, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 134.87206, "t": 443.62436, "r": 153.69141, "b": 452.53091, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "PTN", "bbox": {"l": 134.87206, "t": 443.62436, "r": 153.69141, "b": 452.53091, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 176.56554, "t": 443.62436, "r": 194.00009, "b": 452.53091, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "91.1", "bbox": {"l": 176.56554, "t": 443.62436, "r": 194.00009, "b": 452.53091, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 220.82938000000001, "t": 443.62436, "r": 238.26393, "b": 452.53091, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "88.7", "bbox": {"l": 220.82938000000001, "t": 443.62436, "r": 238.26393, "b": 452.53091, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 262.18414, "t": 443.62436, "r": 279.61868, "b": 452.53091, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "89.9", "bbox": {"l": 262.18414, "t": 443.62436, "r": 279.61868, "b": 452.53091, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 82.165001, "t": 455.58035, "r": 101.5323, "b": 464.48691, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "GTE", "bbox": {"l": 82.165001, "t": 455.58035, "r": 101.5323, "b": 464.48691, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 134.86716, "t": 455.58035, "r": 153.68651, "b": 464.48691, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "PTN", "bbox": {"l": 134.86716, "t": 455.58035, "r": 153.68651, "b": 464.48691, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 183.62411, "t": 455.58035, "r": 186.94167, "b": 464.48691, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "-", "bbox": {"l": 183.62411, "t": 455.58035, "r": 186.94167, "b": 464.48691, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 227.88795000000002, "t": 455.58035, "r": 231.20551, "b": 464.48691, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "-", "bbox": {"l": 227.88795000000002, "t": 455.58035, "r": 231.20551, "b": 464.48691, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 259.69855, "t": 455.58035, "r": 282.11441, "b": 464.48691, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "93.01", "bbox": {"l": 259.69855, "t": 455.58035, "r": 282.11441, "b": 464.48691, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 66.315002, "t": 468.13336, "r": 117.38329000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 468.13336, "r": 117.38329000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 134.86766, "t": 468.13336, "r": 153.68701, "b": 477.03992, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "PTN", "bbox": {"l": 134.86766, "t": 468.13336, "r": 153.68701, "b": 477.03992, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 176.57111, "t": 468.13336, "r": 194.00566, "b": 477.03992, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "98.5", "bbox": {"l": 176.57111, "t": 468.13336, "r": 194.00566, "b": 477.03992, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 220.83495, "t": 468.13336, "r": 238.26950000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "95.0", "bbox": {"l": 220.83495, "t": 468.13336, "r": 238.26950000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 259.698, "t": 468.01379, "r": 282.11386, "b": 476.97018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "96.75", "bbox": {"l": 259.698, "t": 468.01379, "r": 282.11386, "b": 476.97018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 81.612, "t": 483.32635, "r": 102.08514, "b": 492.23291, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "EDD", "bbox": {"l": 81.612, "t": 483.32635, "r": 102.08514, "b": 492.23291, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 134.87206, "t": 483.32635, "r": 153.69141, "b": 492.23291, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "FTN", "bbox": {"l": 134.87206, "t": 483.32635, "r": 153.69141, "b": 492.23291, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 176.56554, "t": 483.32635, "r": 194.00009, "b": 492.23291, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "88.4", "bbox": {"l": 176.56554, "t": 483.32635, "r": 194.00009, "b": 492.23291, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 218.33870999999996, "t": 483.32635, "r": 240.75455999999997, "b": 492.23291, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "92.08", "bbox": {"l": 218.33870999999996, "t": 483.32635, "r": 240.75455999999997, "b": 492.23291, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 262.18411, "t": 483.32635, "r": 279.61865, "b": 492.23291, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "90.6", "bbox": {"l": 262.18411, "t": 483.32635, "r": 279.61865, "b": 492.23291, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 82.165001, "t": 495.28134, "r": 101.5323, "b": 504.1879, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "GTE", "bbox": {"l": 82.165001, "t": 495.28134, "r": 101.5323, "b": 504.1879, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 134.86716, "t": 495.28134, "r": 153.68651, "b": 504.1879, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "FTN", "bbox": {"l": 134.86716, "t": 495.28134, "r": 153.68651, "b": 504.1879, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 183.62411, "t": 495.28134, "r": 186.94167, "b": 504.1879, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "-", "bbox": {"l": 183.62411, "t": 495.28134, "r": 186.94167, "b": 504.1879, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 227.88795000000002, "t": 495.28134, "r": 231.20551, "b": 504.1879, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "-", "bbox": {"l": 227.88795000000002, "t": 495.28134, "r": 231.20551, "b": 504.1879, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 259.69855, "t": 495.28134, "r": 282.11441, "b": 504.1879, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "87.14", "bbox": {"l": 259.69855, "t": 495.28134, "r": 282.11441, "b": 504.1879, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 71.789001, "t": 507.23633, "r": 111.90838999999998, "b": 516.14288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "GTE (FT)", "bbox": {"l": 71.789001, "t": 507.23633, "r": 111.90838999999998, "b": 516.14288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 134.86221, "t": 507.23633, "r": 153.68156, "b": 516.14288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "FTN", "bbox": {"l": 134.86221, "t": 507.23633, "r": 153.68156, "b": 516.14288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 183.62914, "t": 507.23633, "r": 186.94669, "b": 516.14288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "-", "bbox": {"l": 183.62914, "t": 507.23633, "r": 186.94669, "b": 516.14288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 227.89297, "t": 507.23633, "r": 231.21053000000003, "b": 516.14288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "-", "bbox": {"l": 227.89297, "t": 507.23633, "r": 231.21053000000003, "b": 516.14288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 259.6936, "t": 507.23633, "r": 282.10947, "b": 516.14288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "91.02", "bbox": {"l": 259.6936, "t": 507.23633, "r": 282.10947, "b": 516.14288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 66.315002, "t": 519.1913099999999, "r": 117.38329000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 519.1913099999999, "r": 117.38329000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 134.86766, "t": 519.1913099999999, "r": 153.68701, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "FTN", "bbox": {"l": 134.86766, "t": 519.1913099999999, "r": 153.68701, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 176.57111, "t": 519.1913099999999, "r": 194.00566, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "97.5", "bbox": {"l": 176.57111, "t": 519.1913099999999, "r": 194.00566, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 220.83495, "t": 519.1913099999999, "r": 238.26950000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "96.0", "bbox": {"l": 220.83495, "t": 519.1913099999999, "r": 238.26950000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 262.189, "t": 519.0717500000001, "r": 279.62354, "b": 528.02814, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "96.8", "bbox": {"l": 262.189, "t": 519.0717500000001, "r": 279.62354, "b": 528.02814, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 81.612, "t": 536.49837, "r": 102.08514, "b": 545.40492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "EDD", "bbox": {"l": 81.612, "t": 536.49837, "r": 102.08514, "b": 545.40492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 137.91064, "t": 536.49837, "r": 150.64285, "b": 545.40492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "TB", "bbox": {"l": 137.91064, "t": 536.49837, "r": 150.64285, "b": 545.40492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 176.56554, "t": 536.49837, "r": 194.00009, "b": 545.40492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "86.0", "bbox": {"l": 176.56554, "t": 536.49837, "r": 194.00009, "b": 545.40492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 227.89285, "t": 536.49837, "r": 231.21040000000002, "b": 545.40492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "-", "bbox": {"l": 227.89285, "t": 536.49837, "r": 231.21040000000002, "b": 545.40492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 262.18411, "t": 536.49837, "r": 279.61865, "b": 545.40492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "86.0", "bbox": {"l": 262.18411, "t": 536.49837, "r": 279.61865, "b": 545.40492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 66.315002, "t": 548.45436, "r": 117.38329000000002, "b": 557.36092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 548.45436, "r": 117.38329000000002, "b": 557.36092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 137.90625, "t": 548.45436, "r": 150.63846, "b": 557.36092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "TB", "bbox": {"l": 137.90625, "t": 548.45436, "r": 150.63846, "b": 557.36092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 176.57111, "t": 548.45436, "r": 194.00566, "b": 557.36092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "89.6", "bbox": {"l": 176.57111, "t": 548.45436, "r": 194.00566, "b": 557.36092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 227.88845999999998, "t": 548.45436, "r": 231.20601, "b": 557.36092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "-", "bbox": {"l": 227.88845999999998, "t": 548.45436, "r": 231.20601, "b": 557.36092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 262.189, "t": 548.3348100000001, "r": 279.62354, "b": 557.2911799999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": "89.6", "bbox": {"l": 262.189, "t": 548.3348100000001, "r": 279.62354, "b": 557.2911799999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 66.315002, "t": 568.00237, "r": 117.38329000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 568.00237, "r": 117.38329000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 134.86766, "t": 568.00237, "r": 153.68701, "b": 576.90892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "STN", "bbox": {"l": 134.86766, "t": 568.00237, "r": 153.68701, "b": 576.90892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 176.57111, "t": 568.00237, "r": 194.00566, "b": 576.90892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": "96.9", "bbox": {"l": 176.57111, "t": 568.00237, "r": 194.00566, "b": 576.90892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 220.83495, "t": 568.00237, "r": 238.26950000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 107, "text": "95.7", "bbox": {"l": 220.83495, "t": 568.00237, "r": 238.26950000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 262.1897, "t": 568.00237, "r": 279.62424, "b": 576.90892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 108, "text": "96.7", "bbox": {"l": 262.1897, "t": 568.00237, "r": 279.62424, "b": 576.90892, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 11, "num_cols": 5, "table_cells": [{"bbox": {"l": 78.843002, "t": 420.69037, "r": 104.85535, "b": 429.59692, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Model", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 211.2, "t": 414.71237, "r": 247.74349999999998, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "TEDS Complex", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 129.338, "t": 426.66736, "r": 159.21584, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Dataset", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 171.17096, "t": 426.66736, "r": 199.40497, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Simple", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 264.54044, "t": 426.66736, "r": 277.27264, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "All", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 81.612, "t": 443.62436, "r": 102.08514, "b": 452.53091, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "EDD", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.87206, "t": 443.62436, "r": 153.69141, "b": 452.53091, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "PTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.56554, "t": 443.62436, "r": 194.00009, "b": 452.53091, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "91.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 220.82938000000001, "t": 443.62436, "r": 238.26393, "b": 452.53091, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "88.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 262.18414, "t": 443.62436, "r": 279.61868, "b": 452.53091, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "89.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 82.165001, "t": 455.58035, "r": 101.5323, "b": 464.48691, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "GTE", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.86716, "t": 455.58035, "r": 153.68651, "b": 464.48691, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "PTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 183.62411, "t": 455.58035, "r": 186.94167, "b": 464.48691, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 227.88795000000002, "t": 455.58035, "r": 231.20551, "b": 464.48691, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 259.69855, "t": 455.58035, "r": 282.11441, "b": 464.48691, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "93.01", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 66.315002, "t": 468.13336, "r": 117.38329000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.86766, "t": 468.13336, "r": 153.68701, "b": 477.03992, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "PTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.57111, "t": 468.13336, "r": 194.00566, "b": 477.03992, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "98.5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 220.83495, "t": 468.13336, "r": 238.26950000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "95.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 259.698, "t": 468.01379, "r": 282.11386, "b": 476.97018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "96.75", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 81.612, "t": 483.32635, "r": 102.08514, "b": 492.23291, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "EDD", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.87206, "t": 483.32635, "r": 153.69141, "b": 492.23291, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "FTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.56554, "t": 483.32635, "r": 194.00009, "b": 492.23291, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "88.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 218.33870999999996, "t": 483.32635, "r": 240.75455999999997, "b": 492.23291, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "92.08", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 262.18411, "t": 483.32635, "r": 279.61865, "b": 492.23291, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "90.6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 82.165001, "t": 495.28134, "r": 101.5323, "b": 504.1879, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "GTE", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.86716, "t": 495.28134, "r": 153.68651, "b": 504.1879, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "FTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 183.62411, "t": 495.28134, "r": 186.94167, "b": 504.1879, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 227.88795000000002, "t": 495.28134, "r": 231.20551, "b": 504.1879, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 259.69855, "t": 495.28134, "r": 282.11441, "b": 504.1879, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "87.14", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 71.789001, "t": 507.23633, "r": 111.90838999999998, "b": 516.14288, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "GTE (FT)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.86221, "t": 507.23633, "r": 153.68156, "b": 516.14288, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "FTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 183.62914, "t": 507.23633, "r": 186.94669, "b": 516.14288, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 227.89297, "t": 507.23633, "r": 231.21053000000003, "b": 516.14288, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 259.6936, "t": 507.23633, "r": 282.10947, "b": 516.14288, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "91.02", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 66.315002, "t": 519.1913099999999, "r": 117.38329000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.86766, "t": 519.1913099999999, "r": 153.68701, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "FTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.57111, "t": 519.1913099999999, "r": 194.00566, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "97.5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 220.83495, "t": 519.1913099999999, "r": 238.26950000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "96.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 262.189, "t": 519.0717500000001, "r": 279.62354, "b": 528.02814, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "96.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 81.612, "t": 536.49837, "r": 102.08514, "b": 545.40492, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "EDD", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 137.91064, "t": 536.49837, "r": 150.64285, "b": 545.40492, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "TB", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.56554, "t": 536.49837, "r": 194.00009, "b": 545.40492, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "86.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 227.89285, "t": 536.49837, "r": 231.21040000000002, "b": 545.40492, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 262.18411, "t": 536.49837, "r": 279.61865, "b": 545.40492, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "86.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 66.315002, "t": 548.45436, "r": 117.38329000000002, "b": 557.36092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 137.90625, "t": 548.45436, "r": 150.63846, "b": 557.36092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "TB", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.57111, "t": 548.45436, "r": 194.00566, "b": 557.36092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "89.6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 227.88845999999998, "t": 548.45436, "r": 231.20601, "b": 557.36092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 262.189, "t": 548.3348100000001, "r": 279.62354, "b": 557.2911799999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "89.6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 66.315002, "t": 568.00237, "r": 117.38329000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.86766, "t": 568.00237, "r": 153.68701, "b": 576.90892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "STN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.57111, "t": 568.00237, "r": 194.00566, "b": 576.90892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "96.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 220.83495, "t": 568.00237, "r": 238.26950000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "95.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 262.1897, "t": 568.00237, "r": 279.62424, "b": 576.90892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "96.7", "column_header": false, "row_header": false, "row_section": false}]}, "8": {"label": "table", "id": 8, "page_no": 6, "cluster": {"id": 8, "label": "table", "bbox": {"l": 308.4068603515625, "t": 247.87631225585938, "r": 533.6419677734375, "b": 303.8056640625, "coord_origin": "TOPLEFT"}, "confidence": 0.9691730737686157, "cells": [{"id": 146, "text": "Model", "bbox": {"l": 339.323, "t": 253.66436999999996, "r": 365.33536, "b": 262.57092, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "Dataset", "bbox": {"l": 401.04132, "t": 253.66436999999996, "r": 430.91916, "b": 262.57092, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "mAP", "bbox": {"l": 454.10214, "t": 253.66436999999996, "r": 474.58523999999994, "b": 262.57092, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "mAP (PP)", "bbox": {"l": 486.54034, "t": 253.66436999999996, "r": 527.2276, "b": 262.57092, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "EDD+BBox", "bbox": {"l": 327.65601, "t": 270.62134000000003, "r": 377.00076, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "PubTabNet", "bbox": {"l": 393.69809, "t": 270.62134000000003, "r": 438.28073, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "79.2", "bbox": {"l": 455.63559, "t": 270.62134000000003, "r": 473.07013, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "82.7", "bbox": {"l": 498.16592, "t": 270.62134000000003, "r": 515.60046, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "TableFormer", "bbox": {"l": 326.79501, "t": 282.57631999999995, "r": 377.86331, "b": 291.48288, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "PubTabNet", "bbox": {"l": 393.69388, "t": 282.57631999999995, "r": 438.27652, "b": 291.48288, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "82.1", "bbox": {"l": 455.63101, "t": 282.45676, "r": 473.06555000000003, "b": 291.41315, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "86.8", "bbox": {"l": 498.1713, "t": 282.45676, "r": 515.60583, "b": 291.41315, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "TableFormer", "bbox": {"l": 326.79501, "t": 294.53131, "r": 377.86331, "b": 303.43787, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "SynthTabNet", "bbox": {"l": 389.81842, "t": 294.53131, "r": 442.15194999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "87.7", "bbox": {"l": 455.63135, "t": 294.53131, "r": 473.06589, "b": 303.43787, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "-", "bbox": {"l": 505.22515999999996, "t": 294.53131, "r": 508.54268999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}}], "children": [{"id": 73, "label": "text", "bbox": {"l": 339.323, "t": 253.66436999999996, "r": 365.33536, "b": 262.57092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 146, "text": "Model", "bbox": {"l": 339.323, "t": 253.66436999999996, "r": 365.33536, "b": 262.57092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 401.04132, "t": 253.66436999999996, "r": 430.91916, "b": 262.57092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 147, "text": "Dataset", "bbox": {"l": 401.04132, "t": 253.66436999999996, "r": 430.91916, "b": 262.57092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 454.10214, "t": 253.66436999999996, "r": 474.58523999999994, "b": 262.57092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 148, "text": "mAP", "bbox": {"l": 454.10214, "t": 253.66436999999996, "r": 474.58523999999994, "b": 262.57092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 486.54034, "t": 253.66436999999996, "r": 527.2276, "b": 262.57092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 149, "text": "mAP (PP)", "bbox": {"l": 486.54034, "t": 253.66436999999996, "r": 527.2276, "b": 262.57092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 327.65601, "t": 270.62134000000003, "r": 377.00076, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 150, "text": "EDD+BBox", "bbox": {"l": 327.65601, "t": 270.62134000000003, "r": 377.00076, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 393.69809, "t": 270.62134000000003, "r": 438.28073, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 151, "text": "PubTabNet", "bbox": {"l": 393.69809, "t": 270.62134000000003, "r": 438.28073, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 455.63559, "t": 270.62134000000003, "r": 473.07013, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 152, "text": "79.2", "bbox": {"l": 455.63559, "t": 270.62134000000003, "r": 473.07013, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 498.16592, "t": 270.62134000000003, "r": 515.60046, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 153, "text": "82.7", "bbox": {"l": 498.16592, "t": 270.62134000000003, "r": 515.60046, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 326.79501, "t": 282.57631999999995, "r": 377.86331, "b": 291.48288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 154, "text": "TableFormer", "bbox": {"l": 326.79501, "t": 282.57631999999995, "r": 377.86331, "b": 291.48288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 393.69388, "t": 282.57631999999995, "r": 438.27652, "b": 291.48288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 155, "text": "PubTabNet", "bbox": {"l": 393.69388, "t": 282.57631999999995, "r": 438.27652, "b": 291.48288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 455.63101, "t": 282.45676, "r": 473.06555000000003, "b": 291.41315, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 156, "text": "82.1", "bbox": {"l": 455.63101, "t": 282.45676, "r": 473.06555000000003, "b": 291.41315, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 498.1713, "t": 282.45676, "r": 515.60583, "b": 291.41315, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 157, "text": "86.8", "bbox": {"l": 498.1713, "t": 282.45676, "r": 515.60583, "b": 291.41315, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 326.79501, "t": 294.53131, "r": 377.86331, "b": 303.43787, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 158, "text": "TableFormer", "bbox": {"l": 326.79501, "t": 294.53131, "r": 377.86331, "b": 303.43787, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 389.81842, "t": 294.53131, "r": 442.15194999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 159, "text": "SynthTabNet", "bbox": {"l": 389.81842, "t": 294.53131, "r": 442.15194999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 455.63135, "t": 294.53131, "r": 473.06589, "b": 303.43787, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 160, "text": "87.7", "bbox": {"l": 455.63135, "t": 294.53131, "r": 473.06589, "b": 303.43787, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 505.22515999999996, "t": 294.53131, "r": 508.54268999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 161, "text": "-", "bbox": {"l": 505.22515999999996, "t": 294.53131, "r": 508.54268999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 4, "num_cols": 4, "table_cells": [{"bbox": {"l": 339.323, "t": 253.66436999999996, "r": 365.33536, "b": 262.57092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Model", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 401.04132, "t": 253.66436999999996, "r": 430.91916, "b": 262.57092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Dataset", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 454.10214, "t": 253.66436999999996, "r": 474.58523999999994, "b": 262.57092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "mAP", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 486.54034, "t": 253.66436999999996, "r": 527.2276, "b": 262.57092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "mAP (PP)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 327.65601, "t": 270.62134000000003, "r": 377.00076, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "EDD+BBox", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 393.69809, "t": 270.62134000000003, "r": 438.28073, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "PubTabNet", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 455.63559, "t": 270.62134000000003, "r": 473.07013, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "79.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 498.16592, "t": 270.62134000000003, "r": 515.60046, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "82.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.79501, "t": 282.57631999999995, "r": 377.86331, "b": 291.48288, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 393.69388, "t": 282.57631999999995, "r": 438.27652, "b": 291.48288, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "PubTabNet", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 455.63101, "t": 282.45676, "r": 473.06555000000003, "b": 291.41315, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "82.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 498.1713, "t": 282.45676, "r": 515.60583, "b": 291.41315, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "86.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.79501, "t": 294.53131, "r": 377.86331, "b": 303.43787, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 389.81842, "t": 294.53131, "r": 442.15194999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "SynthTabNet", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 455.63135, "t": 294.53131, "r": 473.06589, "b": 303.43787, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "87.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 505.22515999999996, "t": 294.53131, "r": 508.54268999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}]}, "5": {"label": "table", "id": 5, "page_no": 6, "cluster": {"id": 5, "label": "table", "bbox": {"l": 332.9688720703125, "t": 540.2835693359375, "r": 520.942138671875, "b": 643.2697143554688, "coord_origin": "TOPLEFT"}, "confidence": 0.9775567650794983, "cells": [{"id": 183, "text": "Model", "bbox": {"l": 358.01099, "t": 552.23337, "r": 384.02335, "b": 561.1399200000001, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "TEDS", "bbox": {"l": 449.03400000000005, "t": 546.25537, "r": 473.94049000000007, "b": 555.16193, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": "Simple", "bbox": {"l": 408.50598, "t": 558.21037, "r": 436.73999, "b": 567.11693, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "Complex", "bbox": {"l": 448.6951, "t": 558.21037, "r": 485.07849, "b": 567.11693, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "All", "bbox": {"l": 499.3848, "t": 558.21037, "r": 512.117, "b": 567.11693, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": "Tabula", "bbox": {"l": 357.68201, "t": 575.16736, "r": 384.3519, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "78.0", "bbox": {"l": 413.90097, "t": 575.16736, "r": 431.33550999999994, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "57.8", "bbox": {"l": 458.16479000000004, "t": 575.16736, "r": 475.59933000000007, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "67.9", "bbox": {"l": 497.0289, "t": 575.16736, "r": 514.46344, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": "Traprange", "bbox": {"l": 350.72299, "t": 587.12236, "r": 391.31064, "b": 596.02892, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "60.8", "bbox": {"l": 413.90582, "t": 587.12236, "r": 431.34036, "b": 596.02892, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "49.9", "bbox": {"l": 458.16965, "t": 587.12236, "r": 475.60419, "b": 596.02892, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "55.4", "bbox": {"l": 497.03374999999994, "t": 587.12236, "r": 514.46832, "b": 596.02892, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "Camelot", "bbox": {"l": 354.13599, "t": 599.07835, "r": 387.89923, "b": 607.98491, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "80.0", "bbox": {"l": 413.90161, "t": 599.07835, "r": 431.33615, "b": 607.98491, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "66.0", "bbox": {"l": 458.16544, "t": 599.07835, "r": 475.59998, "b": 607.98491, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "73.0", "bbox": {"l": 497.02954000000005, "t": 599.07835, "r": 514.46411, "b": 607.98491, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "Acrobat Pro", "bbox": {"l": 346.55899, "t": 611.03336, "r": 395.47534, "b": 619.93991, "coord_origin": "TOPLEFT"}}, {"id": 201, "text": "68.9", "bbox": {"l": 413.90616, "t": 611.03336, "r": 431.34069999999997, "b": 619.93991, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": "61.8", "bbox": {"l": 458.16998000000007, "t": 611.03336, "r": 475.60452, "b": 619.93991, "coord_origin": "TOPLEFT"}}, {"id": 203, "text": "65.3", "bbox": {"l": 497.03409, "t": 611.03336, "r": 514.46863, "b": 619.93991, "coord_origin": "TOPLEFT"}}, {"id": 204, "text": "EDD", "bbox": {"l": 360.78101, "t": 622.9883600000001, "r": 381.25415, "b": 631.89491, "coord_origin": "TOPLEFT"}}, {"id": 205, "text": "91.2", "bbox": {"l": 413.90158, "t": 622.9883600000001, "r": 431.33612, "b": 631.89491, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": "85.4", "bbox": {"l": 458.16541, "t": 622.9883600000001, "r": 475.59995000000004, "b": 631.89491, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": "88.3", "bbox": {"l": 497.0295100000001, "t": 622.9883600000001, "r": 514.46405, "b": 631.89491, "coord_origin": "TOPLEFT"}}, {"id": 208, "text": "TableFormer", "bbox": {"l": 345.483, "t": 634.94336, "r": 396.5513, "b": 643.84991, "coord_origin": "TOPLEFT"}}, {"id": 209, "text": "95.4", "bbox": {"l": 413.90616, "t": 634.94336, "r": 431.34069999999997, "b": 643.84991, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": "90.1", "bbox": {"l": 458.16998000000007, "t": 634.94336, "r": 475.60452, "b": 643.84991, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "93.6", "bbox": {"l": 497.03400000000005, "t": 634.82381, "r": 514.46857, "b": 643.78018, "coord_origin": "TOPLEFT"}}], "children": [{"id": 89, "label": "text", "bbox": {"l": 358.01099, "t": 552.23337, "r": 384.02335, "b": 561.1399200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 183, "text": "Model", "bbox": {"l": 358.01099, "t": 552.23337, "r": 384.02335, "b": 561.1399200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 449.03400000000005, "t": 546.25537, "r": 473.94049000000007, "b": 555.16193, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 184, "text": "TEDS", "bbox": {"l": 449.03400000000005, "t": 546.25537, "r": 473.94049000000007, "b": 555.16193, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 408.50598, "t": 558.21037, "r": 436.73999, "b": 567.11693, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 185, "text": "Simple", "bbox": {"l": 408.50598, "t": 558.21037, "r": 436.73999, "b": 567.11693, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 448.6951, "t": 558.21037, "r": 485.07849, "b": 567.11693, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 186, "text": "Complex", "bbox": {"l": 448.6951, "t": 558.21037, "r": 485.07849, "b": 567.11693, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 499.3848, "t": 558.21037, "r": 512.117, "b": 567.11693, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 187, "text": "All", "bbox": {"l": 499.3848, "t": 558.21037, "r": 512.117, "b": 567.11693, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 357.68201, "t": 575.16736, "r": 384.3519, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 188, "text": "Tabula", "bbox": {"l": 357.68201, "t": 575.16736, "r": 384.3519, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 413.90097, "t": 575.16736, "r": 431.33550999999994, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 189, "text": "78.0", "bbox": {"l": 413.90097, "t": 575.16736, "r": 431.33550999999994, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 458.16479000000004, "t": 575.16736, "r": 475.59933000000007, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 190, "text": "57.8", "bbox": {"l": 458.16479000000004, "t": 575.16736, "r": 475.59933000000007, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 497.0289, "t": 575.16736, "r": 514.46344, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 191, "text": "67.9", "bbox": {"l": 497.0289, "t": 575.16736, "r": 514.46344, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 350.72299, "t": 587.12236, "r": 391.31064, "b": 596.02892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 192, "text": "Traprange", "bbox": {"l": 350.72299, "t": 587.12236, "r": 391.31064, "b": 596.02892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 413.90582, "t": 587.12236, "r": 431.34036, "b": 596.02892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 193, "text": "60.8", "bbox": {"l": 413.90582, "t": 587.12236, "r": 431.34036, "b": 596.02892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 458.16965, "t": 587.12236, "r": 475.60419, "b": 596.02892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 194, "text": "49.9", "bbox": {"l": 458.16965, "t": 587.12236, "r": 475.60419, "b": 596.02892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 497.03374999999994, "t": 587.12236, "r": 514.46832, "b": 596.02892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 195, "text": "55.4", "bbox": {"l": 497.03374999999994, "t": 587.12236, "r": 514.46832, "b": 596.02892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 354.13599, "t": 599.07835, "r": 387.89923, "b": 607.98491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 196, "text": "Camelot", "bbox": {"l": 354.13599, "t": 599.07835, "r": 387.89923, "b": 607.98491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 413.90161, "t": 599.07835, "r": 431.33615, "b": 607.98491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 197, "text": "80.0", "bbox": {"l": 413.90161, "t": 599.07835, "r": 431.33615, "b": 607.98491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 458.16544, "t": 599.07835, "r": 475.59998, "b": 607.98491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 198, "text": "66.0", "bbox": {"l": 458.16544, "t": 599.07835, "r": 475.59998, "b": 607.98491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 497.02954000000005, "t": 599.07835, "r": 514.46411, "b": 607.98491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 199, "text": "73.0", "bbox": {"l": 497.02954000000005, "t": 599.07835, "r": 514.46411, "b": 607.98491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 346.55899, "t": 611.03336, "r": 395.47534, "b": 619.93991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 200, "text": "Acrobat Pro", "bbox": {"l": 346.55899, "t": 611.03336, "r": 395.47534, "b": 619.93991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 413.90616, "t": 611.03336, "r": 431.34069999999997, "b": 619.93991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 201, "text": "68.9", "bbox": {"l": 413.90616, "t": 611.03336, "r": 431.34069999999997, "b": 619.93991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 458.16998000000007, "t": 611.03336, "r": 475.60452, "b": 619.93991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 202, "text": "61.8", "bbox": {"l": 458.16998000000007, "t": 611.03336, "r": 475.60452, "b": 619.93991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 497.03409, "t": 611.03336, "r": 514.46863, "b": 619.93991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 203, "text": "65.3", "bbox": {"l": 497.03409, "t": 611.03336, "r": 514.46863, "b": 619.93991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 360.78101, "t": 622.9883600000001, "r": 381.25415, "b": 631.89491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 204, "text": "EDD", "bbox": {"l": 360.78101, "t": 622.9883600000001, "r": 381.25415, "b": 631.89491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 413.90158, "t": 622.9883600000001, "r": 431.33612, "b": 631.89491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 205, "text": "91.2", "bbox": {"l": 413.90158, "t": 622.9883600000001, "r": 431.33612, "b": 631.89491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 458.16541, "t": 622.9883600000001, "r": 475.59995000000004, "b": 631.89491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 206, "text": "85.4", "bbox": {"l": 458.16541, "t": 622.9883600000001, "r": 475.59995000000004, "b": 631.89491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 497.0295100000001, "t": 622.9883600000001, "r": 514.46405, "b": 631.89491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 207, "text": "88.3", "bbox": {"l": 497.0295100000001, "t": 622.9883600000001, "r": 514.46405, "b": 631.89491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 114, "label": "text", "bbox": {"l": 345.483, "t": 634.94336, "r": 396.5513, "b": 643.84991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 208, "text": "TableFormer", "bbox": {"l": 345.483, "t": 634.94336, "r": 396.5513, "b": 643.84991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 115, "label": "text", "bbox": {"l": 413.90616, "t": 634.94336, "r": 431.34069999999997, "b": 643.84991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 209, "text": "95.4", "bbox": {"l": 413.90616, "t": 634.94336, "r": 431.34069999999997, "b": 643.84991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 116, "label": "text", "bbox": {"l": 458.16998000000007, "t": 634.94336, "r": 475.60452, "b": 643.84991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 210, "text": "90.1", "bbox": {"l": 458.16998000000007, "t": 634.94336, "r": 475.60452, "b": 643.84991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 117, "label": "text", "bbox": {"l": 497.03400000000005, "t": 634.82381, "r": 514.46857, "b": 643.78018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 211, "text": "93.6", "bbox": {"l": 497.03400000000005, "t": 634.82381, "r": 514.46857, "b": 643.78018, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["fcel", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "nl"], "num_rows": 7, "num_cols": 4, "table_cells": [{"bbox": {"l": 358.01099, "t": 552.23337, "r": 384.02335, "b": 561.1399200000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Model", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 448.6951, "t": 546.25537, "r": 485.07849, "b": 567.11693, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "TEDS Complex", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 408.50598, "t": 558.21037, "r": 436.73999, "b": 567.11693, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Simple", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 499.3848, "t": 558.21037, "r": 512.117, "b": 567.11693, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "All", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 357.68201, "t": 575.16736, "r": 384.3519, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Tabula", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 413.90097, "t": 575.16736, "r": 431.33550999999994, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "78.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 458.16479000000004, "t": 575.16736, "r": 475.59933000000007, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "57.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 497.0289, "t": 575.16736, "r": 514.46344, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "67.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 350.72299, "t": 587.12236, "r": 391.31064, "b": 596.02892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Traprange", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 413.90582, "t": 587.12236, "r": 431.34036, "b": 596.02892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "60.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 458.16965, "t": 587.12236, "r": 475.60419, "b": 596.02892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "49.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 497.03374999999994, "t": 587.12236, "r": 514.46832, "b": 596.02892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "55.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 354.13599, "t": 599.07835, "r": 387.89923, "b": 607.98491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Camelot", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 413.90161, "t": 599.07835, "r": 431.33615, "b": 607.98491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "80.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 458.16544, "t": 599.07835, "r": 475.59998, "b": 607.98491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "66.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 497.02954000000005, "t": 599.07835, "r": 514.46411, "b": 607.98491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "73.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 346.55899, "t": 611.03336, "r": 395.47534, "b": 619.93991, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Acrobat Pro", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 413.90616, "t": 611.03336, "r": 431.34069999999997, "b": 619.93991, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "68.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 458.16998000000007, "t": 611.03336, "r": 475.60452, "b": 619.93991, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "61.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 497.03409, "t": 611.03336, "r": 514.46863, "b": 619.93991, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "65.3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 360.78101, "t": 622.9883600000001, "r": 381.25415, "b": 631.89491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "EDD", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 413.90158, "t": 622.9883600000001, "r": 431.33612, "b": 631.89491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "91.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 458.16541, "t": 622.9883600000001, "r": 475.59995000000004, "b": 631.89491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "85.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 497.0295100000001, "t": 622.9883600000001, "r": 514.46405, "b": 631.89491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "88.3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 345.483, "t": 634.94336, "r": 396.5513, "b": 643.84991, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 413.90616, "t": 634.94336, "r": 431.34069999999997, "b": 643.84991, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "95.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 458.16998000000007, "t": 634.94336, "r": 475.60452, "b": 643.84991, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "90.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 497.03400000000005, "t": 634.82381, "r": 514.46857, "b": 643.78018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "93.6", "column_header": false, "row_header": false, "row_section": false}]}}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "section_header", "id": 10, "page_no": 6, "cluster": {"id": 10, "label": "section_header", "bbox": {"l": 50.112, "t": 74.40137000000016, "r": 167.89825, "b": 84.25342, "coord_origin": "TOPLEFT"}, "confidence": 0.9554274082183838, "cells": [{"id": 0, "text": "5.3.", "bbox": {"l": 50.112, "t": 74.40137000000016, "r": 63.704811, "b": 84.25342, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Datasets and Metrics", "bbox": {"l": 72.766685, "t": 74.40137000000016, "r": 167.89825, "b": 84.25342, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5.3. Datasets and Metrics"}, {"label": "text", "id": 1, "page_no": 6, "cluster": {"id": 1, "label": "text", "bbox": {"l": 50.112, "t": 93.35039999999992, "r": 286.36511, "b": 138.12298999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9862998127937317, "cells": [{"id": 2, "text": "The Tree-Edit-Distance-Based Similarity (TEDS) met-", "bbox": {"l": 62.067001, "t": 93.35039999999992, "r": 286.36499, "b": 102.25696000000016, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "ric was introduced in [37]. It represents the prediction, and", "bbox": {"l": 50.112, "t": 105.30542000000003, "r": 286.36511, "b": 114.21198000000015, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "ground-truth as a tree structure of HTML tags. This simi-", "bbox": {"l": 50.112, "t": 117.26044000000002, "r": 286.36505, "b": 126.16699000000006, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "larity is calculated as:", "bbox": {"l": 50.112, "t": 129.21642999999995, "r": 136.71687, "b": 138.12298999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The Tree-Edit-Distance-Based Similarity (TEDS) metric was introduced in [37]. It represents the prediction, and ground-truth as a tree structure of HTML tags. This similarity is calculated as:"}, {"label": "formula", "id": 13, "page_no": 6, "cluster": {"id": 13, "label": "formula", "bbox": {"l": 86.218994, "t": 150.31799, "r": 286.3624, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9500409364700317, "cells": [{"id": 6, "text": "TEDS (", "bbox": {"l": 86.218994, "t": 157.05798000000004, "r": 118.8784, "b": 165.90479000000005, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "T$_{a}$, T$_{b}$", "bbox": {"l": 118.87499, "t": 157.05798000000004, "r": 143.26962, "b": 165.90479000000005, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": ") = 1", "bbox": {"l": 143.76799, "t": 157.05798000000004, "r": 165.9019, "b": 165.90479000000005, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "\u2212", "bbox": {"l": 168.12099, "t": 156.50012000000004, "r": 175.8699, "b": 165.90479000000005, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "EditDist (", "bbox": {"l": 179.27899, "t": 150.31799, "r": 221.95677, "b": 159.16479000000004, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "T$_{a}$, T$_{b}$", "bbox": {"l": 221.95200000000003, "t": 150.31799, "r": 246.34663, "b": 159.16479000000004, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": ")", "bbox": {"l": 246.84499999999997, "t": 150.31799, "r": 250.71945, "b": 159.16479000000004, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "max (", "bbox": {"l": 182.21201, "t": 163.89197000000001, "r": 206.29161, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "|", "bbox": {"l": 206.289, "t": 163.33411, "r": 209.05661, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "T$_{a}$", "bbox": {"l": 209.056, "t": 163.89197000000001, "r": 219.19968, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "|", "bbox": {"l": 219.69700999999998, "t": 163.33411, "r": 222.46461000000002, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": ",", "bbox": {"l": 224.125, "t": 163.89197000000001, "r": 226.89261, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "|", "bbox": {"l": 228.55299000000002, "t": 163.33411, "r": 231.3206, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "T$_{b}$", "bbox": {"l": 231.31999, "t": 163.89197000000001, "r": 240.64563, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "|", "bbox": {"l": 241.144, "t": 163.33411, "r": 243.91161, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": ")", "bbox": {"l": 243.911, "t": 163.89197000000001, "r": 247.78545, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "(3)", "bbox": {"l": 274.746, "t": 157.21740999999997, "r": 286.3624, "b": 166.12396, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "TEDS ( T$_{a}$, T$_{b}$ ) = 1 \u2212 EditDist ( T$_{a}$, T$_{b}$ ) max ( | T$_{a}$ | , | T$_{b}$ | ) (3)"}, {"label": "text", "id": 6, "page_no": 6, "cluster": {"id": 6, "label": "text", "bbox": {"l": 50.111984, "t": 181.00298999999995, "r": 286.36285, "b": 213.97900000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9735319018363953, "cells": [{"id": 23, "text": "where", "bbox": {"l": 62.067001, "t": 181.16241000000002, "r": 86.405632, "b": 190.06897000000004, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "T$_{a}$", "bbox": {"l": 88.581001, "t": 181.00298999999995, "r": 98.724663, "b": 189.84978999999998, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "and", "bbox": {"l": 101.399, "t": 181.16241000000002, "r": 115.785, "b": 190.06897000000004, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "T$_{b}$", "bbox": {"l": 117.961, "t": 181.00298999999995, "r": 127.28664, "b": 189.84978999999998, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "represent tables in tree structure HTML", "bbox": {"l": 129.95999, "t": 181.16241000000002, "r": 286.36285, "b": 190.06897000000004, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "format. EditDist denotes the tree-edit distance, and", "bbox": {"l": 50.111992, "t": 193.11743, "r": 252.78116000000003, "b": 202.02399000000003, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "|", "bbox": {"l": 255.18201, "t": 192.40015000000005, "r": 257.94962, "b": 201.80480999999997, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "T", "bbox": {"l": 257.94901, "t": 192.95800999999994, "r": 263.77115, "b": 201.80480999999997, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "|", "bbox": {"l": 265.155, "t": 192.40015000000005, "r": 267.92261, "b": 201.80480999999997, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "rep-", "bbox": {"l": 270.32199, "t": 193.11743, "r": 286.36179, "b": 202.02399000000003, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "resents the number of nodes in", "bbox": {"l": 50.111984, "t": 205.07245, "r": 172.13388, "b": 213.97900000000004, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "T", "bbox": {"l": 174.62399, "t": 204.91301999999996, "r": 180.44614, "b": 213.75982999999997, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": ".", "bbox": {"l": 181.82899, "t": 205.07245, "r": 184.31964, "b": 213.97900000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "where T$_{a}$ and T$_{b}$ represent tables in tree structure HTML format. EditDist denotes the tree-edit distance, and | T | represents the number of nodes in T ."}, {"label": "section_header", "id": 9, "page_no": 6, "cluster": {"id": 9, "label": "section_header", "bbox": {"l": 50.112, "t": 224.81946000000005, "r": 170.45169, "b": 234.67151, "coord_origin": "TOPLEFT"}, "confidence": 0.9588837027549744, "cells": [{"id": 36, "text": "5.4.", "bbox": {"l": 50.112, "t": 224.81946000000005, "r": 64.551605, "b": 234.67151, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "Quantitative Analysis", "bbox": {"l": 74.178009, "t": 224.81946000000005, "r": 170.45169, "b": 234.67151, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5.4. Quantitative Analysis"}, {"label": "text", "id": 2, "page_no": 6, "cluster": {"id": 2, "label": "text", "bbox": {"l": 50.112, "t": 243.6499, "r": 286.36514, "b": 396.13794, "coord_origin": "TOPLEFT"}, "confidence": 0.9855090975761414, "cells": [{"id": 38, "text": "Structure.", "bbox": {"l": 62.067001, "t": 243.6499, "r": 105.32461, "b": 252.60626000000002, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "As shown in Tab.", "bbox": {"l": 112.12600000000002, "t": 243.76946999999996, "r": 184.68361, "b": 252.67602999999997, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "2, TableFormer outper-", "bbox": {"l": 191.4781, "t": 243.76946999999996, "r": 286.36188, "b": 252.67602999999997, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "forms all SOTA methods across different datasets by a large", "bbox": {"l": 50.112, "t": 255.72448999999995, "r": 286.36508, "b": 264.63104, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "margin for predicting the table structure from an image.", "bbox": {"l": 50.112, "t": 267.67949999999996, "r": 286.36508, "b": 276.58606, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "All the more, our model outperforms pre-trained methods.", "bbox": {"l": 50.112, "t": 279.63446, "r": 286.36508, "b": 288.54105, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "During the evaluation we do not apply any table filtering.", "bbox": {"l": 50.112, "t": 291.59048, "r": 286.36514, "b": 300.49704, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "We also provide our baseline results on the SynthTabNet", "bbox": {"l": 50.112, "t": 303.54547, "r": 286.36508, "b": 312.45203000000004, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "dataset. It has been observed that large tables (e.g. tables", "bbox": {"l": 50.112, "t": 315.50046, "r": 286.36505, "b": 324.40700999999996, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "that occupy half of the page or more) yield poor predictions.", "bbox": {"l": 50.112, "t": 327.45544, "r": 286.36508, "b": 336.362, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "We attribute this issue to the image resizing during the pre-", "bbox": {"l": 50.112, "t": 339.41043, "r": 286.36508, "b": 348.31699000000003, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "processing step, that produces downsampled images with", "bbox": {"l": 50.112, "t": 351.36542, "r": 286.36505, "b": 360.27197, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "indistinguishable features. This problem can be addressed", "bbox": {"l": 50.112, "t": 363.32141, "r": 286.36508, "b": 372.2279700000001, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "by treating such big tables with a separate model which ac-", "bbox": {"l": 50.112, "t": 375.2764, "r": 286.36511, "b": 384.18295000000006, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "cepts a large input image size.", "bbox": {"l": 50.112, "t": 387.23138, "r": 170.01187, "b": 396.13794, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Structure. As shown in Tab. 2, TableFormer outperforms all SOTA methods across different datasets by a large margin for predicting the table structure from an image. All the more, our model outperforms pre-trained methods. During the evaluation we do not apply any table filtering. We also provide our baseline results on the SynthTabNet dataset. It has been observed that large tables (e.g. tables that occupy half of the page or more) yield poor predictions. We attribute this issue to the image resizing during the preprocessing step, that produces downsampled images with indistinguishable features. This problem can be addressed by treating such big tables with a separate model which accepts a large input image size."}, {"label": "table", "id": 0, "page_no": 6, "cluster": {"id": 0, "label": "table", "bbox": {"l": 53.368526458740234, "t": 409.1357727050781, "r": 283.0443420410156, "b": 582.3977661132812, "coord_origin": "TOPLEFT"}, "confidence": 0.9892510175704956, "cells": [{"id": 53, "text": "Model", "bbox": {"l": 78.843002, "t": 420.69037, "r": 104.85535, "b": 429.59692, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "TEDS", "bbox": {"l": 211.2, "t": 414.71237, "r": 236.10649, "b": 423.61893, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "Dataset", "bbox": {"l": 129.338, "t": 426.66736, "r": 159.21584, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Simple", "bbox": {"l": 171.17096, "t": 426.66736, "r": 199.40497, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Complex", "bbox": {"l": 211.36009, "t": 426.66736, "r": 247.74349999999998, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "All", "bbox": {"l": 264.54044, "t": 426.66736, "r": 277.27264, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "EDD", "bbox": {"l": 81.612, "t": 443.62436, "r": 102.08514, "b": 452.53091, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "PTN", "bbox": {"l": 134.87206, "t": 443.62436, "r": 153.69141, "b": 452.53091, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "91.1", "bbox": {"l": 176.56554, "t": 443.62436, "r": 194.00009, "b": 452.53091, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "88.7", "bbox": {"l": 220.82938000000001, "t": 443.62436, "r": 238.26393, "b": 452.53091, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "89.9", "bbox": {"l": 262.18414, "t": 443.62436, "r": 279.61868, "b": 452.53091, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "GTE", "bbox": {"l": 82.165001, "t": 455.58035, "r": 101.5323, "b": 464.48691, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "PTN", "bbox": {"l": 134.86716, "t": 455.58035, "r": 153.68651, "b": 464.48691, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "-", "bbox": {"l": 183.62411, "t": 455.58035, "r": 186.94167, "b": 464.48691, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "-", "bbox": {"l": 227.88795000000002, "t": 455.58035, "r": 231.20551, "b": 464.48691, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "93.01", "bbox": {"l": 259.69855, "t": 455.58035, "r": 282.11441, "b": 464.48691, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 468.13336, "r": 117.38329000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "PTN", "bbox": {"l": 134.86766, "t": 468.13336, "r": 153.68701, "b": 477.03992, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "98.5", "bbox": {"l": 176.57111, "t": 468.13336, "r": 194.00566, "b": 477.03992, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "95.0", "bbox": {"l": 220.83495, "t": 468.13336, "r": 238.26950000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "96.75", "bbox": {"l": 259.698, "t": 468.01379, "r": 282.11386, "b": 476.97018, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "EDD", "bbox": {"l": 81.612, "t": 483.32635, "r": 102.08514, "b": 492.23291, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "FTN", "bbox": {"l": 134.87206, "t": 483.32635, "r": 153.69141, "b": 492.23291, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "88.4", "bbox": {"l": 176.56554, "t": 483.32635, "r": 194.00009, "b": 492.23291, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "92.08", "bbox": {"l": 218.33870999999996, "t": 483.32635, "r": 240.75455999999997, "b": 492.23291, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "90.6", "bbox": {"l": 262.18411, "t": 483.32635, "r": 279.61865, "b": 492.23291, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "GTE", "bbox": {"l": 82.165001, "t": 495.28134, "r": 101.5323, "b": 504.1879, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "FTN", "bbox": {"l": 134.86716, "t": 495.28134, "r": 153.68651, "b": 504.1879, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "-", "bbox": {"l": 183.62411, "t": 495.28134, "r": 186.94167, "b": 504.1879, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "-", "bbox": {"l": 227.88795000000002, "t": 495.28134, "r": 231.20551, "b": 504.1879, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "87.14", "bbox": {"l": 259.69855, "t": 495.28134, "r": 282.11441, "b": 504.1879, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "GTE (FT)", "bbox": {"l": 71.789001, "t": 507.23633, "r": 111.90838999999998, "b": 516.14288, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "FTN", "bbox": {"l": 134.86221, "t": 507.23633, "r": 153.68156, "b": 516.14288, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "-", "bbox": {"l": 183.62914, "t": 507.23633, "r": 186.94669, "b": 516.14288, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "-", "bbox": {"l": 227.89297, "t": 507.23633, "r": 231.21053000000003, "b": 516.14288, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "91.02", "bbox": {"l": 259.6936, "t": 507.23633, "r": 282.10947, "b": 516.14288, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 519.1913099999999, "r": 117.38329000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "FTN", "bbox": {"l": 134.86766, "t": 519.1913099999999, "r": 153.68701, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "97.5", "bbox": {"l": 176.57111, "t": 519.1913099999999, "r": 194.00566, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "96.0", "bbox": {"l": 220.83495, "t": 519.1913099999999, "r": 238.26950000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "96.8", "bbox": {"l": 262.189, "t": 519.0717500000001, "r": 279.62354, "b": 528.02814, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "EDD", "bbox": {"l": 81.612, "t": 536.49837, "r": 102.08514, "b": 545.40492, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "TB", "bbox": {"l": 137.91064, "t": 536.49837, "r": 150.64285, "b": 545.40492, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "86.0", "bbox": {"l": 176.56554, "t": 536.49837, "r": 194.00009, "b": 545.40492, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "-", "bbox": {"l": 227.89285, "t": 536.49837, "r": 231.21040000000002, "b": 545.40492, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "86.0", "bbox": {"l": 262.18411, "t": 536.49837, "r": 279.61865, "b": 545.40492, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 548.45436, "r": 117.38329000000002, "b": 557.36092, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "TB", "bbox": {"l": 137.90625, "t": 548.45436, "r": 150.63846, "b": 557.36092, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "89.6", "bbox": {"l": 176.57111, "t": 548.45436, "r": 194.00566, "b": 557.36092, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "-", "bbox": {"l": 227.88845999999998, "t": 548.45436, "r": 231.20601, "b": 557.36092, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "89.6", "bbox": {"l": 262.189, "t": 548.3348100000001, "r": 279.62354, "b": 557.2911799999999, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 568.00237, "r": 117.38329000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "STN", "bbox": {"l": 134.86766, "t": 568.00237, "r": 153.68701, "b": 576.90892, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "96.9", "bbox": {"l": 176.57111, "t": 568.00237, "r": 194.00566, "b": 576.90892, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "95.7", "bbox": {"l": 220.83495, "t": 568.00237, "r": 238.26950000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "96.7", "bbox": {"l": 262.1897, "t": 568.00237, "r": 279.62424, "b": 576.90892, "coord_origin": "TOPLEFT"}}], "children": [{"id": 17, "label": "text", "bbox": {"l": 78.843002, "t": 420.69037, "r": 104.85535, "b": 429.59692, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "Model", "bbox": {"l": 78.843002, "t": 420.69037, "r": 104.85535, "b": 429.59692, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 211.2, "t": 414.71237, "r": 236.10649, "b": 423.61893, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "TEDS", "bbox": {"l": 211.2, "t": 414.71237, "r": 236.10649, "b": 423.61893, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 129.338, "t": 426.66736, "r": 159.21584, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "Dataset", "bbox": {"l": 129.338, "t": 426.66736, "r": 159.21584, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 171.17096, "t": 426.66736, "r": 199.40497, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "Simple", "bbox": {"l": 171.17096, "t": 426.66736, "r": 199.40497, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 211.36009, "t": 426.66736, "r": 247.74349999999998, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "Complex", "bbox": {"l": 211.36009, "t": 426.66736, "r": 247.74349999999998, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 264.54044, "t": 426.66736, "r": 277.27264, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "All", "bbox": {"l": 264.54044, "t": 426.66736, "r": 277.27264, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 81.612, "t": 443.62436, "r": 102.08514, "b": 452.53091, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "EDD", "bbox": {"l": 81.612, "t": 443.62436, "r": 102.08514, "b": 452.53091, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 134.87206, "t": 443.62436, "r": 153.69141, "b": 452.53091, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "PTN", "bbox": {"l": 134.87206, "t": 443.62436, "r": 153.69141, "b": 452.53091, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 176.56554, "t": 443.62436, "r": 194.00009, "b": 452.53091, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "91.1", "bbox": {"l": 176.56554, "t": 443.62436, "r": 194.00009, "b": 452.53091, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 220.82938000000001, "t": 443.62436, "r": 238.26393, "b": 452.53091, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "88.7", "bbox": {"l": 220.82938000000001, "t": 443.62436, "r": 238.26393, "b": 452.53091, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 262.18414, "t": 443.62436, "r": 279.61868, "b": 452.53091, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "89.9", "bbox": {"l": 262.18414, "t": 443.62436, "r": 279.61868, "b": 452.53091, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 82.165001, "t": 455.58035, "r": 101.5323, "b": 464.48691, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "GTE", "bbox": {"l": 82.165001, "t": 455.58035, "r": 101.5323, "b": 464.48691, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 134.86716, "t": 455.58035, "r": 153.68651, "b": 464.48691, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "PTN", "bbox": {"l": 134.86716, "t": 455.58035, "r": 153.68651, "b": 464.48691, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 183.62411, "t": 455.58035, "r": 186.94167, "b": 464.48691, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "-", "bbox": {"l": 183.62411, "t": 455.58035, "r": 186.94167, "b": 464.48691, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 227.88795000000002, "t": 455.58035, "r": 231.20551, "b": 464.48691, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "-", "bbox": {"l": 227.88795000000002, "t": 455.58035, "r": 231.20551, "b": 464.48691, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 259.69855, "t": 455.58035, "r": 282.11441, "b": 464.48691, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "93.01", "bbox": {"l": 259.69855, "t": 455.58035, "r": 282.11441, "b": 464.48691, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 66.315002, "t": 468.13336, "r": 117.38329000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 468.13336, "r": 117.38329000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 134.86766, "t": 468.13336, "r": 153.68701, "b": 477.03992, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "PTN", "bbox": {"l": 134.86766, "t": 468.13336, "r": 153.68701, "b": 477.03992, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 176.57111, "t": 468.13336, "r": 194.00566, "b": 477.03992, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "98.5", "bbox": {"l": 176.57111, "t": 468.13336, "r": 194.00566, "b": 477.03992, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 220.83495, "t": 468.13336, "r": 238.26950000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "95.0", "bbox": {"l": 220.83495, "t": 468.13336, "r": 238.26950000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 259.698, "t": 468.01379, "r": 282.11386, "b": 476.97018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "96.75", "bbox": {"l": 259.698, "t": 468.01379, "r": 282.11386, "b": 476.97018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 81.612, "t": 483.32635, "r": 102.08514, "b": 492.23291, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "EDD", "bbox": {"l": 81.612, "t": 483.32635, "r": 102.08514, "b": 492.23291, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 134.87206, "t": 483.32635, "r": 153.69141, "b": 492.23291, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "FTN", "bbox": {"l": 134.87206, "t": 483.32635, "r": 153.69141, "b": 492.23291, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 176.56554, "t": 483.32635, "r": 194.00009, "b": 492.23291, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "88.4", "bbox": {"l": 176.56554, "t": 483.32635, "r": 194.00009, "b": 492.23291, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 218.33870999999996, "t": 483.32635, "r": 240.75455999999997, "b": 492.23291, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "92.08", "bbox": {"l": 218.33870999999996, "t": 483.32635, "r": 240.75455999999997, "b": 492.23291, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 262.18411, "t": 483.32635, "r": 279.61865, "b": 492.23291, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "90.6", "bbox": {"l": 262.18411, "t": 483.32635, "r": 279.61865, "b": 492.23291, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 82.165001, "t": 495.28134, "r": 101.5323, "b": 504.1879, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "GTE", "bbox": {"l": 82.165001, "t": 495.28134, "r": 101.5323, "b": 504.1879, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 134.86716, "t": 495.28134, "r": 153.68651, "b": 504.1879, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "FTN", "bbox": {"l": 134.86716, "t": 495.28134, "r": 153.68651, "b": 504.1879, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 183.62411, "t": 495.28134, "r": 186.94167, "b": 504.1879, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "-", "bbox": {"l": 183.62411, "t": 495.28134, "r": 186.94167, "b": 504.1879, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 227.88795000000002, "t": 495.28134, "r": 231.20551, "b": 504.1879, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "-", "bbox": {"l": 227.88795000000002, "t": 495.28134, "r": 231.20551, "b": 504.1879, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 259.69855, "t": 495.28134, "r": 282.11441, "b": 504.1879, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "87.14", "bbox": {"l": 259.69855, "t": 495.28134, "r": 282.11441, "b": 504.1879, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 71.789001, "t": 507.23633, "r": 111.90838999999998, "b": 516.14288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "GTE (FT)", "bbox": {"l": 71.789001, "t": 507.23633, "r": 111.90838999999998, "b": 516.14288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 134.86221, "t": 507.23633, "r": 153.68156, "b": 516.14288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "FTN", "bbox": {"l": 134.86221, "t": 507.23633, "r": 153.68156, "b": 516.14288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 183.62914, "t": 507.23633, "r": 186.94669, "b": 516.14288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "-", "bbox": {"l": 183.62914, "t": 507.23633, "r": 186.94669, "b": 516.14288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 227.89297, "t": 507.23633, "r": 231.21053000000003, "b": 516.14288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "-", "bbox": {"l": 227.89297, "t": 507.23633, "r": 231.21053000000003, "b": 516.14288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 259.6936, "t": 507.23633, "r": 282.10947, "b": 516.14288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "91.02", "bbox": {"l": 259.6936, "t": 507.23633, "r": 282.10947, "b": 516.14288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 66.315002, "t": 519.1913099999999, "r": 117.38329000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 519.1913099999999, "r": 117.38329000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 134.86766, "t": 519.1913099999999, "r": 153.68701, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "FTN", "bbox": {"l": 134.86766, "t": 519.1913099999999, "r": 153.68701, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 176.57111, "t": 519.1913099999999, "r": 194.00566, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "97.5", "bbox": {"l": 176.57111, "t": 519.1913099999999, "r": 194.00566, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 220.83495, "t": 519.1913099999999, "r": 238.26950000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "96.0", "bbox": {"l": 220.83495, "t": 519.1913099999999, "r": 238.26950000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 262.189, "t": 519.0717500000001, "r": 279.62354, "b": 528.02814, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "96.8", "bbox": {"l": 262.189, "t": 519.0717500000001, "r": 279.62354, "b": 528.02814, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 81.612, "t": 536.49837, "r": 102.08514, "b": 545.40492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "EDD", "bbox": {"l": 81.612, "t": 536.49837, "r": 102.08514, "b": 545.40492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 137.91064, "t": 536.49837, "r": 150.64285, "b": 545.40492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "TB", "bbox": {"l": 137.91064, "t": 536.49837, "r": 150.64285, "b": 545.40492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 176.56554, "t": 536.49837, "r": 194.00009, "b": 545.40492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "86.0", "bbox": {"l": 176.56554, "t": 536.49837, "r": 194.00009, "b": 545.40492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 227.89285, "t": 536.49837, "r": 231.21040000000002, "b": 545.40492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "-", "bbox": {"l": 227.89285, "t": 536.49837, "r": 231.21040000000002, "b": 545.40492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 262.18411, "t": 536.49837, "r": 279.61865, "b": 545.40492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "86.0", "bbox": {"l": 262.18411, "t": 536.49837, "r": 279.61865, "b": 545.40492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 66.315002, "t": 548.45436, "r": 117.38329000000002, "b": 557.36092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 548.45436, "r": 117.38329000000002, "b": 557.36092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 137.90625, "t": 548.45436, "r": 150.63846, "b": 557.36092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "TB", "bbox": {"l": 137.90625, "t": 548.45436, "r": 150.63846, "b": 557.36092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 176.57111, "t": 548.45436, "r": 194.00566, "b": 557.36092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "89.6", "bbox": {"l": 176.57111, "t": 548.45436, "r": 194.00566, "b": 557.36092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 227.88845999999998, "t": 548.45436, "r": 231.20601, "b": 557.36092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "-", "bbox": {"l": 227.88845999999998, "t": 548.45436, "r": 231.20601, "b": 557.36092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 262.189, "t": 548.3348100000001, "r": 279.62354, "b": 557.2911799999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": "89.6", "bbox": {"l": 262.189, "t": 548.3348100000001, "r": 279.62354, "b": 557.2911799999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 66.315002, "t": 568.00237, "r": 117.38329000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 568.00237, "r": 117.38329000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 134.86766, "t": 568.00237, "r": 153.68701, "b": 576.90892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "STN", "bbox": {"l": 134.86766, "t": 568.00237, "r": 153.68701, "b": 576.90892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 176.57111, "t": 568.00237, "r": 194.00566, "b": 576.90892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": "96.9", "bbox": {"l": 176.57111, "t": 568.00237, "r": 194.00566, "b": 576.90892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 220.83495, "t": 568.00237, "r": 238.26950000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 107, "text": "95.7", "bbox": {"l": 220.83495, "t": 568.00237, "r": 238.26950000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 262.1897, "t": 568.00237, "r": 279.62424, "b": 576.90892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 108, "text": "96.7", "bbox": {"l": 262.1897, "t": 568.00237, "r": 279.62424, "b": 576.90892, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 11, "num_cols": 5, "table_cells": [{"bbox": {"l": 78.843002, "t": 420.69037, "r": 104.85535, "b": 429.59692, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Model", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 211.2, "t": 414.71237, "r": 247.74349999999998, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "TEDS Complex", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 129.338, "t": 426.66736, "r": 159.21584, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Dataset", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 171.17096, "t": 426.66736, "r": 199.40497, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Simple", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 264.54044, "t": 426.66736, "r": 277.27264, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "All", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 81.612, "t": 443.62436, "r": 102.08514, "b": 452.53091, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "EDD", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.87206, "t": 443.62436, "r": 153.69141, "b": 452.53091, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "PTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.56554, "t": 443.62436, "r": 194.00009, "b": 452.53091, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "91.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 220.82938000000001, "t": 443.62436, "r": 238.26393, "b": 452.53091, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "88.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 262.18414, "t": 443.62436, "r": 279.61868, "b": 452.53091, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "89.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 82.165001, "t": 455.58035, "r": 101.5323, "b": 464.48691, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "GTE", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.86716, "t": 455.58035, "r": 153.68651, "b": 464.48691, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "PTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 183.62411, "t": 455.58035, "r": 186.94167, "b": 464.48691, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 227.88795000000002, "t": 455.58035, "r": 231.20551, "b": 464.48691, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 259.69855, "t": 455.58035, "r": 282.11441, "b": 464.48691, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "93.01", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 66.315002, "t": 468.13336, "r": 117.38329000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.86766, "t": 468.13336, "r": 153.68701, "b": 477.03992, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "PTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.57111, "t": 468.13336, "r": 194.00566, "b": 477.03992, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "98.5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 220.83495, "t": 468.13336, "r": 238.26950000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "95.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 259.698, "t": 468.01379, "r": 282.11386, "b": 476.97018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "96.75", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 81.612, "t": 483.32635, "r": 102.08514, "b": 492.23291, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "EDD", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.87206, "t": 483.32635, "r": 153.69141, "b": 492.23291, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "FTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.56554, "t": 483.32635, "r": 194.00009, "b": 492.23291, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "88.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 218.33870999999996, "t": 483.32635, "r": 240.75455999999997, "b": 492.23291, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "92.08", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 262.18411, "t": 483.32635, "r": 279.61865, "b": 492.23291, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "90.6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 82.165001, "t": 495.28134, "r": 101.5323, "b": 504.1879, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "GTE", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.86716, "t": 495.28134, "r": 153.68651, "b": 504.1879, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "FTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 183.62411, "t": 495.28134, "r": 186.94167, "b": 504.1879, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 227.88795000000002, "t": 495.28134, "r": 231.20551, "b": 504.1879, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 259.69855, "t": 495.28134, "r": 282.11441, "b": 504.1879, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "87.14", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 71.789001, "t": 507.23633, "r": 111.90838999999998, "b": 516.14288, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "GTE (FT)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.86221, "t": 507.23633, "r": 153.68156, "b": 516.14288, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "FTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 183.62914, "t": 507.23633, "r": 186.94669, "b": 516.14288, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 227.89297, "t": 507.23633, "r": 231.21053000000003, "b": 516.14288, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 259.6936, "t": 507.23633, "r": 282.10947, "b": 516.14288, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "91.02", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 66.315002, "t": 519.1913099999999, "r": 117.38329000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.86766, "t": 519.1913099999999, "r": 153.68701, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "FTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.57111, "t": 519.1913099999999, "r": 194.00566, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "97.5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 220.83495, "t": 519.1913099999999, "r": 238.26950000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "96.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 262.189, "t": 519.0717500000001, "r": 279.62354, "b": 528.02814, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "96.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 81.612, "t": 536.49837, "r": 102.08514, "b": 545.40492, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "EDD", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 137.91064, "t": 536.49837, "r": 150.64285, "b": 545.40492, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "TB", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.56554, "t": 536.49837, "r": 194.00009, "b": 545.40492, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "86.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 227.89285, "t": 536.49837, "r": 231.21040000000002, "b": 545.40492, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 262.18411, "t": 536.49837, "r": 279.61865, "b": 545.40492, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "86.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 66.315002, "t": 548.45436, "r": 117.38329000000002, "b": 557.36092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 137.90625, "t": 548.45436, "r": 150.63846, "b": 557.36092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "TB", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.57111, "t": 548.45436, "r": 194.00566, "b": 557.36092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "89.6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 227.88845999999998, "t": 548.45436, "r": 231.20601, "b": 557.36092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 262.189, "t": 548.3348100000001, "r": 279.62354, "b": 557.2911799999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "89.6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 66.315002, "t": 568.00237, "r": 117.38329000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.86766, "t": 568.00237, "r": 153.68701, "b": 576.90892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "STN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.57111, "t": 568.00237, "r": 194.00566, "b": 576.90892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "96.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 220.83495, "t": 568.00237, "r": 238.26950000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "95.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 262.1897, "t": 568.00237, "r": 279.62424, "b": 576.90892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "96.7", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "text", "id": 15, "page_no": 6, "cluster": {"id": 15, "label": "text", "bbox": {"l": 50.112, "t": 592.43336, "r": 286.36511, "b": 613.29492, "coord_origin": "TOPLEFT"}, "confidence": 0.7209173440933228, "cells": [{"id": 109, "text": "Table 2: Structure results on PubTabNet (PTN), FinTabNet", "bbox": {"l": 50.112, "t": 592.43336, "r": 286.36511, "b": 601.33992, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "(FTN), TableBank (TB) and SynthTabNet (STN).", "bbox": {"l": 50.112, "t": 604.38837, "r": 247.46114, "b": 613.29492, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 2: Structure results on PubTabNet (PTN), FinTabNet (FTN), TableBank (TB) and SynthTabNet (STN)."}, {"label": "text", "id": 16, "page_no": 6, "cluster": {"id": 16, "label": "text", "bbox": {"l": 50.112, "t": 616.34337, "r": 261.78732, "b": 625.24992, "coord_origin": "TOPLEFT"}, "confidence": 0.6433312892913818, "cells": [{"id": 111, "text": "FT: Model was trained on PubTabNet then finetuned.", "bbox": {"l": 50.112, "t": 616.34337, "r": 261.78732, "b": 625.24992, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "FT: Model was trained on PubTabNet then finetuned."}, {"label": "text", "id": 3, "page_no": 6, "cluster": {"id": 3, "label": "text", "bbox": {"l": 50.112015, "t": 644.3498099999999, "r": 286.366, "b": 713.151932, "coord_origin": "TOPLEFT"}, "confidence": 0.9854635000228882, "cells": [{"id": 112, "text": "Cell Detection.", "bbox": {"l": 62.067001, "t": 644.3498099999999, "r": 124.72179, "b": 653.30618, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "Like any object detector, our", "bbox": {"l": 128.20401, "t": 644.46936, "r": 242.9333, "b": 653.37592, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "Cell BBox", "bbox": {"l": 245.55401999999998, "t": 644.55902, "r": 286.36084, "b": 653.1467700000001, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "Detector", "bbox": {"l": 50.112015, "t": 656.51402, "r": 84.971146, "b": 665.10178, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "provides bounding boxes that can be improved", "bbox": {"l": 89.515015, "t": 656.42436, "r": 286.366, "b": 665.33092, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "with post-processing during inference. We make use of the", "bbox": {"l": 50.112015, "t": 668.37936, "r": 286.36511, "b": 677.28593, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "grid-like structure of tables to refine the predictions. A de-", "bbox": {"l": 50.112015, "t": 680.33536, "r": 286.36505, "b": 689.24193, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "tailed explanation on the post-processing is available in the", "bbox": {"l": 50.112015, "t": 692.290359, "r": 286.36511, "b": 701.19693, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "supplementary material. As shown in Tab. 3, we evaluate", "bbox": {"l": 50.112015, "t": 704.245361, "r": 286.36508, "b": 713.151932, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Cell Detection. Like any object detector, our Cell BBox Detector provides bounding boxes that can be improved with post-processing during inference. We make use of the grid-like structure of tables to refine the predictions. A detailed explanation on the post-processing is available in the supplementary material. As shown in Tab. 3, we evaluate"}, {"label": "text", "id": 7, "page_no": 6, "cluster": {"id": 7, "label": "text", "bbox": {"l": 308.862, "t": 75.20836999999995, "r": 545.11517, "b": 227.57709, "coord_origin": "TOPLEFT"}, "confidence": 0.9713197946548462, "cells": [{"id": 121, "text": "our", "bbox": {"l": 308.862, "t": 75.20836999999995, "r": 322.14215, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Cell BBox Decoder", "bbox": {"l": 325.45401, "t": 75.29803000000004, "r": 404.56702, "b": 83.88580000000002, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "accuracy for cells with a class la-", "bbox": {"l": 408.104, "t": 75.20836999999995, "r": 545.10968, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "bel of \u2018content\u2019 only using the PASCAL VOC mAP metric", "bbox": {"l": 308.862, "t": 87.16339000000005, "r": 545.11511, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "for pre-processing and post-processing.", "bbox": {"l": 308.862, "t": 99.11841000000004, "r": 470.22626, "b": 108.02495999999985, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "Note that we do", "bbox": {"l": 477.52884, "t": 99.11841000000004, "r": 545.11511, "b": 108.02495999999985, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "not have post-processing results for SynthTabNet as images", "bbox": {"l": 308.862, "t": 111.07343000000003, "r": 545.11517, "b": 119.97997999999984, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "are only provided. To compare the performance of our pro-", "bbox": {"l": 308.862, "t": 123.02844000000005, "r": 545.11511, "b": 131.93499999999995, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "posed approach, we\u2019ve integrated TableFormer\u2019s", "bbox": {"l": 308.862, "t": 134.98443999999995, "r": 502.01691000000005, "b": 143.89099, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "Cell BBox", "bbox": {"l": 504.47299, "t": 135.07410000000004, "r": 545.11041, "b": 143.66187000000002, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "Decoder", "bbox": {"l": 308.862, "t": 147.02910999999995, "r": 343.16324, "b": 155.61688000000004, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "into EDD architecture. As mentioned previously,", "bbox": {"l": 346.371, "t": 146.93944999999997, "r": 545.11493, "b": 155.84600999999998, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "the Structure Decoder provides the", "bbox": {"l": 308.862, "t": 158.89446999999996, "r": 446.15652, "b": 167.80102999999997, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "Cell BBox Decoder", "bbox": {"l": 448.28998000000007, "t": 158.98413000000005, "r": 525.04181, "b": 167.57190000000003, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "with", "bbox": {"l": 527.39899, "t": 158.89446999999996, "r": 545.11249, "b": 167.80102999999997, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "the features needed to predict the bounding box predictions.", "bbox": {"l": 308.862, "t": 170.84948999999995, "r": 545.11511, "b": 179.75603999999998, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "Therefore, the accuracy of the", "bbox": {"l": 308.862, "t": 182.80449999999996, "r": 432.86642000000006, "b": 191.71105999999997, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "Structure Decoder", "bbox": {"l": 436.39001, "t": 182.89417000000003, "r": 510.93021, "b": 191.48193000000003, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "directly", "bbox": {"l": 514.677, "t": 182.80449999999996, "r": 545.11273, "b": 191.71105999999997, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "influences the accuracy of the", "bbox": {"l": 308.862, "t": 194.75951999999995, "r": 431.17285, "b": 203.66607999999997, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "Cell BBox Decoder", "bbox": {"l": 434.6790199999999, "t": 194.84918000000005, "r": 514.18054, "b": 203.43695000000002, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": ". If the", "bbox": {"l": 514.17603, "t": 194.75951999999995, "r": 545.10992, "b": 203.66607999999997, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "Structure Decoder", "bbox": {"l": 308.86203, "t": 206.80517999999995, "r": 382.35614, "b": 215.39293999999995, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "predicts an extra column, this will result", "bbox": {"l": 385.07501, "t": 206.71551999999997, "r": 545.11426, "b": 215.62207, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "in an extra column of predicted bounding boxes.", "bbox": {"l": 308.862, "t": 218.67052999999999, "r": 501.6981799999999, "b": 227.57709, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "our Cell BBox Decoder accuracy for cells with a class label of 'content' only using the PASCAL VOC mAP metric for pre-processing and post-processing. Note that we do not have post-processing results for SynthTabNet as images are only provided. To compare the performance of our proposed approach, we've integrated TableFormer's Cell BBox Decoder into EDD architecture. As mentioned previously, the Structure Decoder provides the Cell BBox Decoder with the features needed to predict the bounding box predictions. Therefore, the accuracy of the Structure Decoder directly influences the accuracy of the Cell BBox Decoder . If the Structure Decoder predicts an extra column, this will result in an extra column of predicted bounding boxes."}, {"label": "table", "id": 8, "page_no": 6, "cluster": {"id": 8, "label": "table", "bbox": {"l": 308.4068603515625, "t": 247.87631225585938, "r": 533.6419677734375, "b": 303.8056640625, "coord_origin": "TOPLEFT"}, "confidence": 0.9691730737686157, "cells": [{"id": 146, "text": "Model", "bbox": {"l": 339.323, "t": 253.66436999999996, "r": 365.33536, "b": 262.57092, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "Dataset", "bbox": {"l": 401.04132, "t": 253.66436999999996, "r": 430.91916, "b": 262.57092, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "mAP", "bbox": {"l": 454.10214, "t": 253.66436999999996, "r": 474.58523999999994, "b": 262.57092, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "mAP (PP)", "bbox": {"l": 486.54034, "t": 253.66436999999996, "r": 527.2276, "b": 262.57092, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "EDD+BBox", "bbox": {"l": 327.65601, "t": 270.62134000000003, "r": 377.00076, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "PubTabNet", "bbox": {"l": 393.69809, "t": 270.62134000000003, "r": 438.28073, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "79.2", "bbox": {"l": 455.63559, "t": 270.62134000000003, "r": 473.07013, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "82.7", "bbox": {"l": 498.16592, "t": 270.62134000000003, "r": 515.60046, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "TableFormer", "bbox": {"l": 326.79501, "t": 282.57631999999995, "r": 377.86331, "b": 291.48288, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "PubTabNet", "bbox": {"l": 393.69388, "t": 282.57631999999995, "r": 438.27652, "b": 291.48288, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "82.1", "bbox": {"l": 455.63101, "t": 282.45676, "r": 473.06555000000003, "b": 291.41315, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "86.8", "bbox": {"l": 498.1713, "t": 282.45676, "r": 515.60583, "b": 291.41315, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "TableFormer", "bbox": {"l": 326.79501, "t": 294.53131, "r": 377.86331, "b": 303.43787, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "SynthTabNet", "bbox": {"l": 389.81842, "t": 294.53131, "r": 442.15194999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "87.7", "bbox": {"l": 455.63135, "t": 294.53131, "r": 473.06589, "b": 303.43787, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "-", "bbox": {"l": 505.22515999999996, "t": 294.53131, "r": 508.54268999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}}], "children": [{"id": 73, "label": "text", "bbox": {"l": 339.323, "t": 253.66436999999996, "r": 365.33536, "b": 262.57092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 146, "text": "Model", "bbox": {"l": 339.323, "t": 253.66436999999996, "r": 365.33536, "b": 262.57092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 401.04132, "t": 253.66436999999996, "r": 430.91916, "b": 262.57092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 147, "text": "Dataset", "bbox": {"l": 401.04132, "t": 253.66436999999996, "r": 430.91916, "b": 262.57092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 454.10214, "t": 253.66436999999996, "r": 474.58523999999994, "b": 262.57092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 148, "text": "mAP", "bbox": {"l": 454.10214, "t": 253.66436999999996, "r": 474.58523999999994, "b": 262.57092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 486.54034, "t": 253.66436999999996, "r": 527.2276, "b": 262.57092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 149, "text": "mAP (PP)", "bbox": {"l": 486.54034, "t": 253.66436999999996, "r": 527.2276, "b": 262.57092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 327.65601, "t": 270.62134000000003, "r": 377.00076, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 150, "text": "EDD+BBox", "bbox": {"l": 327.65601, "t": 270.62134000000003, "r": 377.00076, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 393.69809, "t": 270.62134000000003, "r": 438.28073, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 151, "text": "PubTabNet", "bbox": {"l": 393.69809, "t": 270.62134000000003, "r": 438.28073, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 455.63559, "t": 270.62134000000003, "r": 473.07013, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 152, "text": "79.2", "bbox": {"l": 455.63559, "t": 270.62134000000003, "r": 473.07013, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 498.16592, "t": 270.62134000000003, "r": 515.60046, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 153, "text": "82.7", "bbox": {"l": 498.16592, "t": 270.62134000000003, "r": 515.60046, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 326.79501, "t": 282.57631999999995, "r": 377.86331, "b": 291.48288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 154, "text": "TableFormer", "bbox": {"l": 326.79501, "t": 282.57631999999995, "r": 377.86331, "b": 291.48288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 393.69388, "t": 282.57631999999995, "r": 438.27652, "b": 291.48288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 155, "text": "PubTabNet", "bbox": {"l": 393.69388, "t": 282.57631999999995, "r": 438.27652, "b": 291.48288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 455.63101, "t": 282.45676, "r": 473.06555000000003, "b": 291.41315, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 156, "text": "82.1", "bbox": {"l": 455.63101, "t": 282.45676, "r": 473.06555000000003, "b": 291.41315, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 498.1713, "t": 282.45676, "r": 515.60583, "b": 291.41315, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 157, "text": "86.8", "bbox": {"l": 498.1713, "t": 282.45676, "r": 515.60583, "b": 291.41315, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 326.79501, "t": 294.53131, "r": 377.86331, "b": 303.43787, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 158, "text": "TableFormer", "bbox": {"l": 326.79501, "t": 294.53131, "r": 377.86331, "b": 303.43787, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 389.81842, "t": 294.53131, "r": 442.15194999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 159, "text": "SynthTabNet", "bbox": {"l": 389.81842, "t": 294.53131, "r": 442.15194999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 455.63135, "t": 294.53131, "r": 473.06589, "b": 303.43787, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 160, "text": "87.7", "bbox": {"l": 455.63135, "t": 294.53131, "r": 473.06589, "b": 303.43787, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 505.22515999999996, "t": 294.53131, "r": 508.54268999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 161, "text": "-", "bbox": {"l": 505.22515999999996, "t": 294.53131, "r": 508.54268999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 4, "num_cols": 4, "table_cells": [{"bbox": {"l": 339.323, "t": 253.66436999999996, "r": 365.33536, "b": 262.57092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Model", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 401.04132, "t": 253.66436999999996, "r": 430.91916, "b": 262.57092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Dataset", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 454.10214, "t": 253.66436999999996, "r": 474.58523999999994, "b": 262.57092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "mAP", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 486.54034, "t": 253.66436999999996, "r": 527.2276, "b": 262.57092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "mAP (PP)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 327.65601, "t": 270.62134000000003, "r": 377.00076, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "EDD+BBox", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 393.69809, "t": 270.62134000000003, "r": 438.28073, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "PubTabNet", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 455.63559, "t": 270.62134000000003, "r": 473.07013, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "79.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 498.16592, "t": 270.62134000000003, "r": 515.60046, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "82.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.79501, "t": 282.57631999999995, "r": 377.86331, "b": 291.48288, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 393.69388, "t": 282.57631999999995, "r": 438.27652, "b": 291.48288, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "PubTabNet", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 455.63101, "t": 282.45676, "r": 473.06555000000003, "b": 291.41315, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "82.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 498.1713, "t": 282.45676, "r": 515.60583, "b": 291.41315, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "86.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.79501, "t": 294.53131, "r": 377.86331, "b": 303.43787, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 389.81842, "t": 294.53131, "r": 442.15194999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "SynthTabNet", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 455.63135, "t": 294.53131, "r": 473.06589, "b": 303.43787, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "87.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 505.22515999999996, "t": 294.53131, "r": 508.54268999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "caption", "id": 12, "page_no": 6, "cluster": {"id": 12, "label": "caption", "bbox": {"l": 308.862, "t": 316.44931, "r": 545.11517, "b": 337.3108500000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9519917964935303, "cells": [{"id": 162, "text": "Table 3:", "bbox": {"l": 308.862, "t": 316.44931, "r": 341.49951, "b": 325.35587, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "Cell Bounding Box detection results on PubTab-", "bbox": {"l": 348.60284, "t": 316.44931, "r": 545.11517, "b": 325.35587, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "Net, and FinTabNet. PP: Post-processing.", "bbox": {"l": 308.862, "t": 328.4043, "r": 474.97845, "b": 337.3108500000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 3: Cell Bounding Box detection results on PubTabNet, and FinTabNet. PP: Post-processing."}, {"label": "text", "id": 4, "page_no": 6, "cluster": {"id": 4, "label": "text", "bbox": {"l": 308.86197, "t": 367.6797199999999, "r": 545.11566, "b": 520.16769, "coord_origin": "TOPLEFT"}, "confidence": 0.9835010766983032, "cells": [{"id": 165, "text": "Cell Content.", "bbox": {"l": 320.81699, "t": 367.6797199999999, "r": 378.94876, "b": 376.63611, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "In this section, we evaluate the entire", "bbox": {"l": 387.07898, "t": 367.79929, "r": 545.11566, "b": 376.70584, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "pipeline of recovering a table with content.", "bbox": {"l": 308.86197, "t": 379.75426999999996, "r": 487.19257, "b": 388.66083, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "Here we put", "bbox": {"l": 493.96713, "t": 379.75426999999996, "r": 545.11511, "b": 388.66083, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "our approach to test by capitalizing on extracting content", "bbox": {"l": 308.86197, "t": 391.70926, "r": 545.11505, "b": 400.61581, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "from the PDF cells rather than decoding from images. Tab.", "bbox": {"l": 308.86197, "t": 403.66525, "r": 545.11523, "b": 412.57181, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "4", "bbox": {"l": 308.86197, "t": 415.62024, "r": 314.08096, "b": 424.52679, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "shows the TEDs score of HTML code representing the", "bbox": {"l": 316.69046, "t": 415.62024, "r": 545.11517, "b": 424.52679, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "structure of the table along with the content inserted in the", "bbox": {"l": 308.86197, "t": 427.57523, "r": 545.11505, "b": 436.48177999999996, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "data cell and compared with the ground-truth. Our method", "bbox": {"l": 308.86197, "t": 439.53021, "r": 545.11505, "b": 448.43677, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "achieved a", "bbox": {"l": 308.86197, "t": 451.4852, "r": 350.23666, "b": 460.39175, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "5.3%", "bbox": {"l": 352.17596, "t": 451.36563, "r": 374.59183, "b": 460.32201999999995, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "increase over the state-of-the-art, and com-", "bbox": {"l": 376.53296, "t": 451.4852, "r": 545.11011, "b": 460.39175, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "mercial solutions. We believe our scores would be higher", "bbox": {"l": 308.86197, "t": 463.44019, "r": 545.11511, "b": 472.34674, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "if the HTML ground-truth matched the extracted PDF cell", "bbox": {"l": 308.86197, "t": 475.39618, "r": 545.11517, "b": 484.30273, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "content. Unfortunately, there are small discrepancies such", "bbox": {"l": 308.86197, "t": 487.35117, "r": 545.11511, "b": 496.25772, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "as spacings around words or special characters with various", "bbox": {"l": 308.86197, "t": 499.30615, "r": 545.11505, "b": 508.21271, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "unicode representations.", "bbox": {"l": 308.86197, "t": 511.26114, "r": 405.69846, "b": 520.16769, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Cell Content. In this section, we evaluate the entire pipeline of recovering a table with content. Here we put our approach to test by capitalizing on extracting content from the PDF cells rather than decoding from images. Tab. 4 shows the TEDs score of HTML code representing the structure of the table along with the content inserted in the data cell and compared with the ground-truth. Our method achieved a 5.3% increase over the state-of-the-art, and commercial solutions. We believe our scores would be higher if the HTML ground-truth matched the extracted PDF cell content. Unfortunately, there are small discrepancies such as spacings around words or special characters with various unicode representations."}, {"label": "table", "id": 5, "page_no": 6, "cluster": {"id": 5, "label": "table", "bbox": {"l": 332.9688720703125, "t": 540.2835693359375, "r": 520.942138671875, "b": 643.2697143554688, "coord_origin": "TOPLEFT"}, "confidence": 0.9775567650794983, "cells": [{"id": 183, "text": "Model", "bbox": {"l": 358.01099, "t": 552.23337, "r": 384.02335, "b": 561.1399200000001, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "TEDS", "bbox": {"l": 449.03400000000005, "t": 546.25537, "r": 473.94049000000007, "b": 555.16193, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": "Simple", "bbox": {"l": 408.50598, "t": 558.21037, "r": 436.73999, "b": 567.11693, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "Complex", "bbox": {"l": 448.6951, "t": 558.21037, "r": 485.07849, "b": 567.11693, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "All", "bbox": {"l": 499.3848, "t": 558.21037, "r": 512.117, "b": 567.11693, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": "Tabula", "bbox": {"l": 357.68201, "t": 575.16736, "r": 384.3519, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "78.0", "bbox": {"l": 413.90097, "t": 575.16736, "r": 431.33550999999994, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "57.8", "bbox": {"l": 458.16479000000004, "t": 575.16736, "r": 475.59933000000007, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "67.9", "bbox": {"l": 497.0289, "t": 575.16736, "r": 514.46344, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": "Traprange", "bbox": {"l": 350.72299, "t": 587.12236, "r": 391.31064, "b": 596.02892, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "60.8", "bbox": {"l": 413.90582, "t": 587.12236, "r": 431.34036, "b": 596.02892, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "49.9", "bbox": {"l": 458.16965, "t": 587.12236, "r": 475.60419, "b": 596.02892, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "55.4", "bbox": {"l": 497.03374999999994, "t": 587.12236, "r": 514.46832, "b": 596.02892, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "Camelot", "bbox": {"l": 354.13599, "t": 599.07835, "r": 387.89923, "b": 607.98491, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "80.0", "bbox": {"l": 413.90161, "t": 599.07835, "r": 431.33615, "b": 607.98491, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "66.0", "bbox": {"l": 458.16544, "t": 599.07835, "r": 475.59998, "b": 607.98491, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "73.0", "bbox": {"l": 497.02954000000005, "t": 599.07835, "r": 514.46411, "b": 607.98491, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "Acrobat Pro", "bbox": {"l": 346.55899, "t": 611.03336, "r": 395.47534, "b": 619.93991, "coord_origin": "TOPLEFT"}}, {"id": 201, "text": "68.9", "bbox": {"l": 413.90616, "t": 611.03336, "r": 431.34069999999997, "b": 619.93991, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": "61.8", "bbox": {"l": 458.16998000000007, "t": 611.03336, "r": 475.60452, "b": 619.93991, "coord_origin": "TOPLEFT"}}, {"id": 203, "text": "65.3", "bbox": {"l": 497.03409, "t": 611.03336, "r": 514.46863, "b": 619.93991, "coord_origin": "TOPLEFT"}}, {"id": 204, "text": "EDD", "bbox": {"l": 360.78101, "t": 622.9883600000001, "r": 381.25415, "b": 631.89491, "coord_origin": "TOPLEFT"}}, {"id": 205, "text": "91.2", "bbox": {"l": 413.90158, "t": 622.9883600000001, "r": 431.33612, "b": 631.89491, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": "85.4", "bbox": {"l": 458.16541, "t": 622.9883600000001, "r": 475.59995000000004, "b": 631.89491, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": "88.3", "bbox": {"l": 497.0295100000001, "t": 622.9883600000001, "r": 514.46405, "b": 631.89491, "coord_origin": "TOPLEFT"}}, {"id": 208, "text": "TableFormer", "bbox": {"l": 345.483, "t": 634.94336, "r": 396.5513, "b": 643.84991, "coord_origin": "TOPLEFT"}}, {"id": 209, "text": "95.4", "bbox": {"l": 413.90616, "t": 634.94336, "r": 431.34069999999997, "b": 643.84991, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": "90.1", "bbox": {"l": 458.16998000000007, "t": 634.94336, "r": 475.60452, "b": 643.84991, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "93.6", "bbox": {"l": 497.03400000000005, "t": 634.82381, "r": 514.46857, "b": 643.78018, "coord_origin": "TOPLEFT"}}], "children": [{"id": 89, "label": "text", "bbox": {"l": 358.01099, "t": 552.23337, "r": 384.02335, "b": 561.1399200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 183, "text": "Model", "bbox": {"l": 358.01099, "t": 552.23337, "r": 384.02335, "b": 561.1399200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 449.03400000000005, "t": 546.25537, "r": 473.94049000000007, "b": 555.16193, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 184, "text": "TEDS", "bbox": {"l": 449.03400000000005, "t": 546.25537, "r": 473.94049000000007, "b": 555.16193, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 408.50598, "t": 558.21037, "r": 436.73999, "b": 567.11693, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 185, "text": "Simple", "bbox": {"l": 408.50598, "t": 558.21037, "r": 436.73999, "b": 567.11693, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 448.6951, "t": 558.21037, "r": 485.07849, "b": 567.11693, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 186, "text": "Complex", "bbox": {"l": 448.6951, "t": 558.21037, "r": 485.07849, "b": 567.11693, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 499.3848, "t": 558.21037, "r": 512.117, "b": 567.11693, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 187, "text": "All", "bbox": {"l": 499.3848, "t": 558.21037, "r": 512.117, "b": 567.11693, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 357.68201, "t": 575.16736, "r": 384.3519, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 188, "text": "Tabula", "bbox": {"l": 357.68201, "t": 575.16736, "r": 384.3519, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 413.90097, "t": 575.16736, "r": 431.33550999999994, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 189, "text": "78.0", "bbox": {"l": 413.90097, "t": 575.16736, "r": 431.33550999999994, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 458.16479000000004, "t": 575.16736, "r": 475.59933000000007, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 190, "text": "57.8", "bbox": {"l": 458.16479000000004, "t": 575.16736, "r": 475.59933000000007, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 497.0289, "t": 575.16736, "r": 514.46344, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 191, "text": "67.9", "bbox": {"l": 497.0289, "t": 575.16736, "r": 514.46344, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 350.72299, "t": 587.12236, "r": 391.31064, "b": 596.02892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 192, "text": "Traprange", "bbox": {"l": 350.72299, "t": 587.12236, "r": 391.31064, "b": 596.02892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 413.90582, "t": 587.12236, "r": 431.34036, "b": 596.02892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 193, "text": "60.8", "bbox": {"l": 413.90582, "t": 587.12236, "r": 431.34036, "b": 596.02892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 458.16965, "t": 587.12236, "r": 475.60419, "b": 596.02892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 194, "text": "49.9", "bbox": {"l": 458.16965, "t": 587.12236, "r": 475.60419, "b": 596.02892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 497.03374999999994, "t": 587.12236, "r": 514.46832, "b": 596.02892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 195, "text": "55.4", "bbox": {"l": 497.03374999999994, "t": 587.12236, "r": 514.46832, "b": 596.02892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 354.13599, "t": 599.07835, "r": 387.89923, "b": 607.98491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 196, "text": "Camelot", "bbox": {"l": 354.13599, "t": 599.07835, "r": 387.89923, "b": 607.98491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 413.90161, "t": 599.07835, "r": 431.33615, "b": 607.98491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 197, "text": "80.0", "bbox": {"l": 413.90161, "t": 599.07835, "r": 431.33615, "b": 607.98491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 458.16544, "t": 599.07835, "r": 475.59998, "b": 607.98491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 198, "text": "66.0", "bbox": {"l": 458.16544, "t": 599.07835, "r": 475.59998, "b": 607.98491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 497.02954000000005, "t": 599.07835, "r": 514.46411, "b": 607.98491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 199, "text": "73.0", "bbox": {"l": 497.02954000000005, "t": 599.07835, "r": 514.46411, "b": 607.98491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 346.55899, "t": 611.03336, "r": 395.47534, "b": 619.93991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 200, "text": "Acrobat Pro", "bbox": {"l": 346.55899, "t": 611.03336, "r": 395.47534, "b": 619.93991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 413.90616, "t": 611.03336, "r": 431.34069999999997, "b": 619.93991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 201, "text": "68.9", "bbox": {"l": 413.90616, "t": 611.03336, "r": 431.34069999999997, "b": 619.93991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 458.16998000000007, "t": 611.03336, "r": 475.60452, "b": 619.93991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 202, "text": "61.8", "bbox": {"l": 458.16998000000007, "t": 611.03336, "r": 475.60452, "b": 619.93991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 497.03409, "t": 611.03336, "r": 514.46863, "b": 619.93991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 203, "text": "65.3", "bbox": {"l": 497.03409, "t": 611.03336, "r": 514.46863, "b": 619.93991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 360.78101, "t": 622.9883600000001, "r": 381.25415, "b": 631.89491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 204, "text": "EDD", "bbox": {"l": 360.78101, "t": 622.9883600000001, "r": 381.25415, "b": 631.89491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 413.90158, "t": 622.9883600000001, "r": 431.33612, "b": 631.89491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 205, "text": "91.2", "bbox": {"l": 413.90158, "t": 622.9883600000001, "r": 431.33612, "b": 631.89491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 458.16541, "t": 622.9883600000001, "r": 475.59995000000004, "b": 631.89491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 206, "text": "85.4", "bbox": {"l": 458.16541, "t": 622.9883600000001, "r": 475.59995000000004, "b": 631.89491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 497.0295100000001, "t": 622.9883600000001, "r": 514.46405, "b": 631.89491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 207, "text": "88.3", "bbox": {"l": 497.0295100000001, "t": 622.9883600000001, "r": 514.46405, "b": 631.89491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 114, "label": "text", "bbox": {"l": 345.483, "t": 634.94336, "r": 396.5513, "b": 643.84991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 208, "text": "TableFormer", "bbox": {"l": 345.483, "t": 634.94336, "r": 396.5513, "b": 643.84991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 115, "label": "text", "bbox": {"l": 413.90616, "t": 634.94336, "r": 431.34069999999997, "b": 643.84991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 209, "text": "95.4", "bbox": {"l": 413.90616, "t": 634.94336, "r": 431.34069999999997, "b": 643.84991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 116, "label": "text", "bbox": {"l": 458.16998000000007, "t": 634.94336, "r": 475.60452, "b": 643.84991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 210, "text": "90.1", "bbox": {"l": 458.16998000000007, "t": 634.94336, "r": 475.60452, "b": 643.84991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 117, "label": "text", "bbox": {"l": 497.03400000000005, "t": 634.82381, "r": 514.46857, "b": 643.78018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 211, "text": "93.6", "bbox": {"l": 497.03400000000005, "t": 634.82381, "r": 514.46857, "b": 643.78018, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["fcel", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "nl"], "num_rows": 7, "num_cols": 4, "table_cells": [{"bbox": {"l": 358.01099, "t": 552.23337, "r": 384.02335, "b": 561.1399200000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Model", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 448.6951, "t": 546.25537, "r": 485.07849, "b": 567.11693, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "TEDS Complex", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 408.50598, "t": 558.21037, "r": 436.73999, "b": 567.11693, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Simple", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 499.3848, "t": 558.21037, "r": 512.117, "b": 567.11693, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "All", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 357.68201, "t": 575.16736, "r": 384.3519, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Tabula", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 413.90097, "t": 575.16736, "r": 431.33550999999994, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "78.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 458.16479000000004, "t": 575.16736, "r": 475.59933000000007, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "57.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 497.0289, "t": 575.16736, "r": 514.46344, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "67.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 350.72299, "t": 587.12236, "r": 391.31064, "b": 596.02892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Traprange", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 413.90582, "t": 587.12236, "r": 431.34036, "b": 596.02892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "60.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 458.16965, "t": 587.12236, "r": 475.60419, "b": 596.02892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "49.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 497.03374999999994, "t": 587.12236, "r": 514.46832, "b": 596.02892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "55.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 354.13599, "t": 599.07835, "r": 387.89923, "b": 607.98491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Camelot", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 413.90161, "t": 599.07835, "r": 431.33615, "b": 607.98491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "80.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 458.16544, "t": 599.07835, "r": 475.59998, "b": 607.98491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "66.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 497.02954000000005, "t": 599.07835, "r": 514.46411, "b": 607.98491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "73.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 346.55899, "t": 611.03336, "r": 395.47534, "b": 619.93991, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Acrobat Pro", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 413.90616, "t": 611.03336, "r": 431.34069999999997, "b": 619.93991, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "68.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 458.16998000000007, "t": 611.03336, "r": 475.60452, "b": 619.93991, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "61.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 497.03409, "t": 611.03336, "r": 514.46863, "b": 619.93991, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "65.3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 360.78101, "t": 622.9883600000001, "r": 381.25415, "b": 631.89491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "EDD", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 413.90158, "t": 622.9883600000001, "r": 431.33612, "b": 631.89491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "91.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 458.16541, "t": 622.9883600000001, "r": 475.59995000000004, "b": 631.89491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "85.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 497.0295100000001, "t": 622.9883600000001, "r": 514.46405, "b": 631.89491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "88.3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 345.483, "t": 634.94336, "r": 396.5513, "b": 643.84991, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 413.90616, "t": 634.94336, "r": 431.34069999999997, "b": 643.84991, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "95.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 458.16998000000007, "t": 634.94336, "r": 475.60452, "b": 643.84991, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "90.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 497.03400000000005, "t": 634.82381, "r": 514.46857, "b": 643.78018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "93.6", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "caption", "id": 11, "page_no": 6, "cluster": {"id": 11, "label": "caption", "bbox": {"l": 308.862, "t": 656.86136, "r": 545.11517, "b": 689.6779300000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9541404247283936, "cells": [{"id": 212, "text": "Table 4:", "bbox": {"l": 308.862, "t": 656.86136, "r": 341.73862, "b": 665.76792, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "Results of structure with content retrieved using", "bbox": {"l": 349.55927, "t": 656.86136, "r": 545.11517, "b": 665.76792, "coord_origin": "TOPLEFT"}}, {"id": 214, "text": "cell detection on PubTabNet. In all cases the input is PDF", "bbox": {"l": 308.862, "t": 668.81636, "r": 545.11505, "b": 677.7229199999999, "coord_origin": "TOPLEFT"}}, {"id": 215, "text": "documents with cropped tables.", "bbox": {"l": 308.862, "t": 680.77136, "r": 435.03836, "b": 689.6779300000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 4: Results of structure with content retrieved using cell detection on PubTabNet. In all cases the input is PDF documents with cropped tables."}, {"label": "page_footer", "id": 14, "page_no": 6, "cluster": {"id": 14, "label": "page_footer", "bbox": {"l": 295.121, "t": 734.133358, "r": 300.10229, "b": 743.039921, "coord_origin": "TOPLEFT"}, "confidence": 0.8787972331047058, "cells": [{"id": 216, "text": "7", "bbox": {"l": 295.121, "t": 734.133358, "r": 300.10229, "b": 743.039921, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "7"}], "body": [{"label": "section_header", "id": 10, "page_no": 6, "cluster": {"id": 10, "label": "section_header", "bbox": {"l": 50.112, "t": 74.40137000000016, "r": 167.89825, "b": 84.25342, "coord_origin": "TOPLEFT"}, "confidence": 0.9554274082183838, "cells": [{"id": 0, "text": "5.3.", "bbox": {"l": 50.112, "t": 74.40137000000016, "r": 63.704811, "b": 84.25342, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Datasets and Metrics", "bbox": {"l": 72.766685, "t": 74.40137000000016, "r": 167.89825, "b": 84.25342, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5.3. Datasets and Metrics"}, {"label": "text", "id": 1, "page_no": 6, "cluster": {"id": 1, "label": "text", "bbox": {"l": 50.112, "t": 93.35039999999992, "r": 286.36511, "b": 138.12298999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9862998127937317, "cells": [{"id": 2, "text": "The Tree-Edit-Distance-Based Similarity (TEDS) met-", "bbox": {"l": 62.067001, "t": 93.35039999999992, "r": 286.36499, "b": 102.25696000000016, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "ric was introduced in [37]. It represents the prediction, and", "bbox": {"l": 50.112, "t": 105.30542000000003, "r": 286.36511, "b": 114.21198000000015, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "ground-truth as a tree structure of HTML tags. This simi-", "bbox": {"l": 50.112, "t": 117.26044000000002, "r": 286.36505, "b": 126.16699000000006, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "larity is calculated as:", "bbox": {"l": 50.112, "t": 129.21642999999995, "r": 136.71687, "b": 138.12298999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The Tree-Edit-Distance-Based Similarity (TEDS) metric was introduced in [37]. It represents the prediction, and ground-truth as a tree structure of HTML tags. This similarity is calculated as:"}, {"label": "formula", "id": 13, "page_no": 6, "cluster": {"id": 13, "label": "formula", "bbox": {"l": 86.218994, "t": 150.31799, "r": 286.3624, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9500409364700317, "cells": [{"id": 6, "text": "TEDS (", "bbox": {"l": 86.218994, "t": 157.05798000000004, "r": 118.8784, "b": 165.90479000000005, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "T$_{a}$, T$_{b}$", "bbox": {"l": 118.87499, "t": 157.05798000000004, "r": 143.26962, "b": 165.90479000000005, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": ") = 1", "bbox": {"l": 143.76799, "t": 157.05798000000004, "r": 165.9019, "b": 165.90479000000005, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "\u2212", "bbox": {"l": 168.12099, "t": 156.50012000000004, "r": 175.8699, "b": 165.90479000000005, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "EditDist (", "bbox": {"l": 179.27899, "t": 150.31799, "r": 221.95677, "b": 159.16479000000004, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "T$_{a}$, T$_{b}$", "bbox": {"l": 221.95200000000003, "t": 150.31799, "r": 246.34663, "b": 159.16479000000004, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": ")", "bbox": {"l": 246.84499999999997, "t": 150.31799, "r": 250.71945, "b": 159.16479000000004, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "max (", "bbox": {"l": 182.21201, "t": 163.89197000000001, "r": 206.29161, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "|", "bbox": {"l": 206.289, "t": 163.33411, "r": 209.05661, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "T$_{a}$", "bbox": {"l": 209.056, "t": 163.89197000000001, "r": 219.19968, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "|", "bbox": {"l": 219.69700999999998, "t": 163.33411, "r": 222.46461000000002, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": ",", "bbox": {"l": 224.125, "t": 163.89197000000001, "r": 226.89261, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "|", "bbox": {"l": 228.55299000000002, "t": 163.33411, "r": 231.3206, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "T$_{b}$", "bbox": {"l": 231.31999, "t": 163.89197000000001, "r": 240.64563, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "|", "bbox": {"l": 241.144, "t": 163.33411, "r": 243.91161, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": ")", "bbox": {"l": 243.911, "t": 163.89197000000001, "r": 247.78545, "b": 172.73877000000005, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "(3)", "bbox": {"l": 274.746, "t": 157.21740999999997, "r": 286.3624, "b": 166.12396, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "TEDS ( T$_{a}$, T$_{b}$ ) = 1 \u2212 EditDist ( T$_{a}$, T$_{b}$ ) max ( | T$_{a}$ | , | T$_{b}$ | ) (3)"}, {"label": "text", "id": 6, "page_no": 6, "cluster": {"id": 6, "label": "text", "bbox": {"l": 50.111984, "t": 181.00298999999995, "r": 286.36285, "b": 213.97900000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9735319018363953, "cells": [{"id": 23, "text": "where", "bbox": {"l": 62.067001, "t": 181.16241000000002, "r": 86.405632, "b": 190.06897000000004, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "T$_{a}$", "bbox": {"l": 88.581001, "t": 181.00298999999995, "r": 98.724663, "b": 189.84978999999998, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "and", "bbox": {"l": 101.399, "t": 181.16241000000002, "r": 115.785, "b": 190.06897000000004, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "T$_{b}$", "bbox": {"l": 117.961, "t": 181.00298999999995, "r": 127.28664, "b": 189.84978999999998, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "represent tables in tree structure HTML", "bbox": {"l": 129.95999, "t": 181.16241000000002, "r": 286.36285, "b": 190.06897000000004, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "format. EditDist denotes the tree-edit distance, and", "bbox": {"l": 50.111992, "t": 193.11743, "r": 252.78116000000003, "b": 202.02399000000003, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "|", "bbox": {"l": 255.18201, "t": 192.40015000000005, "r": 257.94962, "b": 201.80480999999997, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "T", "bbox": {"l": 257.94901, "t": 192.95800999999994, "r": 263.77115, "b": 201.80480999999997, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "|", "bbox": {"l": 265.155, "t": 192.40015000000005, "r": 267.92261, "b": 201.80480999999997, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "rep-", "bbox": {"l": 270.32199, "t": 193.11743, "r": 286.36179, "b": 202.02399000000003, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "resents the number of nodes in", "bbox": {"l": 50.111984, "t": 205.07245, "r": 172.13388, "b": 213.97900000000004, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "T", "bbox": {"l": 174.62399, "t": 204.91301999999996, "r": 180.44614, "b": 213.75982999999997, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": ".", "bbox": {"l": 181.82899, "t": 205.07245, "r": 184.31964, "b": 213.97900000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "where T$_{a}$ and T$_{b}$ represent tables in tree structure HTML format. EditDist denotes the tree-edit distance, and | T | represents the number of nodes in T ."}, {"label": "section_header", "id": 9, "page_no": 6, "cluster": {"id": 9, "label": "section_header", "bbox": {"l": 50.112, "t": 224.81946000000005, "r": 170.45169, "b": 234.67151, "coord_origin": "TOPLEFT"}, "confidence": 0.9588837027549744, "cells": [{"id": 36, "text": "5.4.", "bbox": {"l": 50.112, "t": 224.81946000000005, "r": 64.551605, "b": 234.67151, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "Quantitative Analysis", "bbox": {"l": 74.178009, "t": 224.81946000000005, "r": 170.45169, "b": 234.67151, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5.4. Quantitative Analysis"}, {"label": "text", "id": 2, "page_no": 6, "cluster": {"id": 2, "label": "text", "bbox": {"l": 50.112, "t": 243.6499, "r": 286.36514, "b": 396.13794, "coord_origin": "TOPLEFT"}, "confidence": 0.9855090975761414, "cells": [{"id": 38, "text": "Structure.", "bbox": {"l": 62.067001, "t": 243.6499, "r": 105.32461, "b": 252.60626000000002, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "As shown in Tab.", "bbox": {"l": 112.12600000000002, "t": 243.76946999999996, "r": 184.68361, "b": 252.67602999999997, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "2, TableFormer outper-", "bbox": {"l": 191.4781, "t": 243.76946999999996, "r": 286.36188, "b": 252.67602999999997, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "forms all SOTA methods across different datasets by a large", "bbox": {"l": 50.112, "t": 255.72448999999995, "r": 286.36508, "b": 264.63104, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "margin for predicting the table structure from an image.", "bbox": {"l": 50.112, "t": 267.67949999999996, "r": 286.36508, "b": 276.58606, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "All the more, our model outperforms pre-trained methods.", "bbox": {"l": 50.112, "t": 279.63446, "r": 286.36508, "b": 288.54105, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "During the evaluation we do not apply any table filtering.", "bbox": {"l": 50.112, "t": 291.59048, "r": 286.36514, "b": 300.49704, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "We also provide our baseline results on the SynthTabNet", "bbox": {"l": 50.112, "t": 303.54547, "r": 286.36508, "b": 312.45203000000004, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "dataset. It has been observed that large tables (e.g. tables", "bbox": {"l": 50.112, "t": 315.50046, "r": 286.36505, "b": 324.40700999999996, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "that occupy half of the page or more) yield poor predictions.", "bbox": {"l": 50.112, "t": 327.45544, "r": 286.36508, "b": 336.362, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "We attribute this issue to the image resizing during the pre-", "bbox": {"l": 50.112, "t": 339.41043, "r": 286.36508, "b": 348.31699000000003, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "processing step, that produces downsampled images with", "bbox": {"l": 50.112, "t": 351.36542, "r": 286.36505, "b": 360.27197, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "indistinguishable features. This problem can be addressed", "bbox": {"l": 50.112, "t": 363.32141, "r": 286.36508, "b": 372.2279700000001, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "by treating such big tables with a separate model which ac-", "bbox": {"l": 50.112, "t": 375.2764, "r": 286.36511, "b": 384.18295000000006, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "cepts a large input image size.", "bbox": {"l": 50.112, "t": 387.23138, "r": 170.01187, "b": 396.13794, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Structure. As shown in Tab. 2, TableFormer outperforms all SOTA methods across different datasets by a large margin for predicting the table structure from an image. All the more, our model outperforms pre-trained methods. During the evaluation we do not apply any table filtering. We also provide our baseline results on the SynthTabNet dataset. It has been observed that large tables (e.g. tables that occupy half of the page or more) yield poor predictions. We attribute this issue to the image resizing during the preprocessing step, that produces downsampled images with indistinguishable features. This problem can be addressed by treating such big tables with a separate model which accepts a large input image size."}, {"label": "table", "id": 0, "page_no": 6, "cluster": {"id": 0, "label": "table", "bbox": {"l": 53.368526458740234, "t": 409.1357727050781, "r": 283.0443420410156, "b": 582.3977661132812, "coord_origin": "TOPLEFT"}, "confidence": 0.9892510175704956, "cells": [{"id": 53, "text": "Model", "bbox": {"l": 78.843002, "t": 420.69037, "r": 104.85535, "b": 429.59692, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "TEDS", "bbox": {"l": 211.2, "t": 414.71237, "r": 236.10649, "b": 423.61893, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "Dataset", "bbox": {"l": 129.338, "t": 426.66736, "r": 159.21584, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Simple", "bbox": {"l": 171.17096, "t": 426.66736, "r": 199.40497, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Complex", "bbox": {"l": 211.36009, "t": 426.66736, "r": 247.74349999999998, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "All", "bbox": {"l": 264.54044, "t": 426.66736, "r": 277.27264, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "EDD", "bbox": {"l": 81.612, "t": 443.62436, "r": 102.08514, "b": 452.53091, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "PTN", "bbox": {"l": 134.87206, "t": 443.62436, "r": 153.69141, "b": 452.53091, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "91.1", "bbox": {"l": 176.56554, "t": 443.62436, "r": 194.00009, "b": 452.53091, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "88.7", "bbox": {"l": 220.82938000000001, "t": 443.62436, "r": 238.26393, "b": 452.53091, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "89.9", "bbox": {"l": 262.18414, "t": 443.62436, "r": 279.61868, "b": 452.53091, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "GTE", "bbox": {"l": 82.165001, "t": 455.58035, "r": 101.5323, "b": 464.48691, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "PTN", "bbox": {"l": 134.86716, "t": 455.58035, "r": 153.68651, "b": 464.48691, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "-", "bbox": {"l": 183.62411, "t": 455.58035, "r": 186.94167, "b": 464.48691, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "-", "bbox": {"l": 227.88795000000002, "t": 455.58035, "r": 231.20551, "b": 464.48691, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "93.01", "bbox": {"l": 259.69855, "t": 455.58035, "r": 282.11441, "b": 464.48691, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 468.13336, "r": 117.38329000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "PTN", "bbox": {"l": 134.86766, "t": 468.13336, "r": 153.68701, "b": 477.03992, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "98.5", "bbox": {"l": 176.57111, "t": 468.13336, "r": 194.00566, "b": 477.03992, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "95.0", "bbox": {"l": 220.83495, "t": 468.13336, "r": 238.26950000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "96.75", "bbox": {"l": 259.698, "t": 468.01379, "r": 282.11386, "b": 476.97018, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "EDD", "bbox": {"l": 81.612, "t": 483.32635, "r": 102.08514, "b": 492.23291, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "FTN", "bbox": {"l": 134.87206, "t": 483.32635, "r": 153.69141, "b": 492.23291, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "88.4", "bbox": {"l": 176.56554, "t": 483.32635, "r": 194.00009, "b": 492.23291, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "92.08", "bbox": {"l": 218.33870999999996, "t": 483.32635, "r": 240.75455999999997, "b": 492.23291, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "90.6", "bbox": {"l": 262.18411, "t": 483.32635, "r": 279.61865, "b": 492.23291, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "GTE", "bbox": {"l": 82.165001, "t": 495.28134, "r": 101.5323, "b": 504.1879, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "FTN", "bbox": {"l": 134.86716, "t": 495.28134, "r": 153.68651, "b": 504.1879, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "-", "bbox": {"l": 183.62411, "t": 495.28134, "r": 186.94167, "b": 504.1879, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "-", "bbox": {"l": 227.88795000000002, "t": 495.28134, "r": 231.20551, "b": 504.1879, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "87.14", "bbox": {"l": 259.69855, "t": 495.28134, "r": 282.11441, "b": 504.1879, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "GTE (FT)", "bbox": {"l": 71.789001, "t": 507.23633, "r": 111.90838999999998, "b": 516.14288, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "FTN", "bbox": {"l": 134.86221, "t": 507.23633, "r": 153.68156, "b": 516.14288, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "-", "bbox": {"l": 183.62914, "t": 507.23633, "r": 186.94669, "b": 516.14288, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "-", "bbox": {"l": 227.89297, "t": 507.23633, "r": 231.21053000000003, "b": 516.14288, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "91.02", "bbox": {"l": 259.6936, "t": 507.23633, "r": 282.10947, "b": 516.14288, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 519.1913099999999, "r": 117.38329000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "FTN", "bbox": {"l": 134.86766, "t": 519.1913099999999, "r": 153.68701, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "97.5", "bbox": {"l": 176.57111, "t": 519.1913099999999, "r": 194.00566, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "96.0", "bbox": {"l": 220.83495, "t": 519.1913099999999, "r": 238.26950000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "96.8", "bbox": {"l": 262.189, "t": 519.0717500000001, "r": 279.62354, "b": 528.02814, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "EDD", "bbox": {"l": 81.612, "t": 536.49837, "r": 102.08514, "b": 545.40492, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "TB", "bbox": {"l": 137.91064, "t": 536.49837, "r": 150.64285, "b": 545.40492, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "86.0", "bbox": {"l": 176.56554, "t": 536.49837, "r": 194.00009, "b": 545.40492, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "-", "bbox": {"l": 227.89285, "t": 536.49837, "r": 231.21040000000002, "b": 545.40492, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "86.0", "bbox": {"l": 262.18411, "t": 536.49837, "r": 279.61865, "b": 545.40492, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 548.45436, "r": 117.38329000000002, "b": 557.36092, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "TB", "bbox": {"l": 137.90625, "t": 548.45436, "r": 150.63846, "b": 557.36092, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "89.6", "bbox": {"l": 176.57111, "t": 548.45436, "r": 194.00566, "b": 557.36092, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "-", "bbox": {"l": 227.88845999999998, "t": 548.45436, "r": 231.20601, "b": 557.36092, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "89.6", "bbox": {"l": 262.189, "t": 548.3348100000001, "r": 279.62354, "b": 557.2911799999999, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 568.00237, "r": 117.38329000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "STN", "bbox": {"l": 134.86766, "t": 568.00237, "r": 153.68701, "b": 576.90892, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "96.9", "bbox": {"l": 176.57111, "t": 568.00237, "r": 194.00566, "b": 576.90892, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "95.7", "bbox": {"l": 220.83495, "t": 568.00237, "r": 238.26950000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "96.7", "bbox": {"l": 262.1897, "t": 568.00237, "r": 279.62424, "b": 576.90892, "coord_origin": "TOPLEFT"}}], "children": [{"id": 17, "label": "text", "bbox": {"l": 78.843002, "t": 420.69037, "r": 104.85535, "b": 429.59692, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "Model", "bbox": {"l": 78.843002, "t": 420.69037, "r": 104.85535, "b": 429.59692, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 211.2, "t": 414.71237, "r": 236.10649, "b": 423.61893, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "TEDS", "bbox": {"l": 211.2, "t": 414.71237, "r": 236.10649, "b": 423.61893, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 129.338, "t": 426.66736, "r": 159.21584, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "Dataset", "bbox": {"l": 129.338, "t": 426.66736, "r": 159.21584, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 171.17096, "t": 426.66736, "r": 199.40497, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "Simple", "bbox": {"l": 171.17096, "t": 426.66736, "r": 199.40497, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 211.36009, "t": 426.66736, "r": 247.74349999999998, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "Complex", "bbox": {"l": 211.36009, "t": 426.66736, "r": 247.74349999999998, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 264.54044, "t": 426.66736, "r": 277.27264, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "All", "bbox": {"l": 264.54044, "t": 426.66736, "r": 277.27264, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 81.612, "t": 443.62436, "r": 102.08514, "b": 452.53091, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "EDD", "bbox": {"l": 81.612, "t": 443.62436, "r": 102.08514, "b": 452.53091, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 134.87206, "t": 443.62436, "r": 153.69141, "b": 452.53091, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "PTN", "bbox": {"l": 134.87206, "t": 443.62436, "r": 153.69141, "b": 452.53091, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 176.56554, "t": 443.62436, "r": 194.00009, "b": 452.53091, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "91.1", "bbox": {"l": 176.56554, "t": 443.62436, "r": 194.00009, "b": 452.53091, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 220.82938000000001, "t": 443.62436, "r": 238.26393, "b": 452.53091, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "88.7", "bbox": {"l": 220.82938000000001, "t": 443.62436, "r": 238.26393, "b": 452.53091, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 262.18414, "t": 443.62436, "r": 279.61868, "b": 452.53091, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "89.9", "bbox": {"l": 262.18414, "t": 443.62436, "r": 279.61868, "b": 452.53091, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 82.165001, "t": 455.58035, "r": 101.5323, "b": 464.48691, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "GTE", "bbox": {"l": 82.165001, "t": 455.58035, "r": 101.5323, "b": 464.48691, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 134.86716, "t": 455.58035, "r": 153.68651, "b": 464.48691, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "PTN", "bbox": {"l": 134.86716, "t": 455.58035, "r": 153.68651, "b": 464.48691, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 183.62411, "t": 455.58035, "r": 186.94167, "b": 464.48691, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "-", "bbox": {"l": 183.62411, "t": 455.58035, "r": 186.94167, "b": 464.48691, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 227.88795000000002, "t": 455.58035, "r": 231.20551, "b": 464.48691, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "-", "bbox": {"l": 227.88795000000002, "t": 455.58035, "r": 231.20551, "b": 464.48691, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 259.69855, "t": 455.58035, "r": 282.11441, "b": 464.48691, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "93.01", "bbox": {"l": 259.69855, "t": 455.58035, "r": 282.11441, "b": 464.48691, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 66.315002, "t": 468.13336, "r": 117.38329000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 468.13336, "r": 117.38329000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 134.86766, "t": 468.13336, "r": 153.68701, "b": 477.03992, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "PTN", "bbox": {"l": 134.86766, "t": 468.13336, "r": 153.68701, "b": 477.03992, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 176.57111, "t": 468.13336, "r": 194.00566, "b": 477.03992, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "98.5", "bbox": {"l": 176.57111, "t": 468.13336, "r": 194.00566, "b": 477.03992, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 220.83495, "t": 468.13336, "r": 238.26950000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "95.0", "bbox": {"l": 220.83495, "t": 468.13336, "r": 238.26950000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 259.698, "t": 468.01379, "r": 282.11386, "b": 476.97018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "96.75", "bbox": {"l": 259.698, "t": 468.01379, "r": 282.11386, "b": 476.97018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 81.612, "t": 483.32635, "r": 102.08514, "b": 492.23291, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "EDD", "bbox": {"l": 81.612, "t": 483.32635, "r": 102.08514, "b": 492.23291, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 134.87206, "t": 483.32635, "r": 153.69141, "b": 492.23291, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "FTN", "bbox": {"l": 134.87206, "t": 483.32635, "r": 153.69141, "b": 492.23291, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 176.56554, "t": 483.32635, "r": 194.00009, "b": 492.23291, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "88.4", "bbox": {"l": 176.56554, "t": 483.32635, "r": 194.00009, "b": 492.23291, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 218.33870999999996, "t": 483.32635, "r": 240.75455999999997, "b": 492.23291, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "92.08", "bbox": {"l": 218.33870999999996, "t": 483.32635, "r": 240.75455999999997, "b": 492.23291, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 262.18411, "t": 483.32635, "r": 279.61865, "b": 492.23291, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "90.6", "bbox": {"l": 262.18411, "t": 483.32635, "r": 279.61865, "b": 492.23291, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 82.165001, "t": 495.28134, "r": 101.5323, "b": 504.1879, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "GTE", "bbox": {"l": 82.165001, "t": 495.28134, "r": 101.5323, "b": 504.1879, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 134.86716, "t": 495.28134, "r": 153.68651, "b": 504.1879, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "FTN", "bbox": {"l": 134.86716, "t": 495.28134, "r": 153.68651, "b": 504.1879, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 183.62411, "t": 495.28134, "r": 186.94167, "b": 504.1879, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "-", "bbox": {"l": 183.62411, "t": 495.28134, "r": 186.94167, "b": 504.1879, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 227.88795000000002, "t": 495.28134, "r": 231.20551, "b": 504.1879, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "-", "bbox": {"l": 227.88795000000002, "t": 495.28134, "r": 231.20551, "b": 504.1879, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 259.69855, "t": 495.28134, "r": 282.11441, "b": 504.1879, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "87.14", "bbox": {"l": 259.69855, "t": 495.28134, "r": 282.11441, "b": 504.1879, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 71.789001, "t": 507.23633, "r": 111.90838999999998, "b": 516.14288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "GTE (FT)", "bbox": {"l": 71.789001, "t": 507.23633, "r": 111.90838999999998, "b": 516.14288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 134.86221, "t": 507.23633, "r": 153.68156, "b": 516.14288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "FTN", "bbox": {"l": 134.86221, "t": 507.23633, "r": 153.68156, "b": 516.14288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 183.62914, "t": 507.23633, "r": 186.94669, "b": 516.14288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "-", "bbox": {"l": 183.62914, "t": 507.23633, "r": 186.94669, "b": 516.14288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 227.89297, "t": 507.23633, "r": 231.21053000000003, "b": 516.14288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "-", "bbox": {"l": 227.89297, "t": 507.23633, "r": 231.21053000000003, "b": 516.14288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 259.6936, "t": 507.23633, "r": 282.10947, "b": 516.14288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "91.02", "bbox": {"l": 259.6936, "t": 507.23633, "r": 282.10947, "b": 516.14288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 66.315002, "t": 519.1913099999999, "r": 117.38329000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 519.1913099999999, "r": 117.38329000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 134.86766, "t": 519.1913099999999, "r": 153.68701, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "FTN", "bbox": {"l": 134.86766, "t": 519.1913099999999, "r": 153.68701, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 176.57111, "t": 519.1913099999999, "r": 194.00566, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "97.5", "bbox": {"l": 176.57111, "t": 519.1913099999999, "r": 194.00566, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 220.83495, "t": 519.1913099999999, "r": 238.26950000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "96.0", "bbox": {"l": 220.83495, "t": 519.1913099999999, "r": 238.26950000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 262.189, "t": 519.0717500000001, "r": 279.62354, "b": 528.02814, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "96.8", "bbox": {"l": 262.189, "t": 519.0717500000001, "r": 279.62354, "b": 528.02814, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 81.612, "t": 536.49837, "r": 102.08514, "b": 545.40492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "EDD", "bbox": {"l": 81.612, "t": 536.49837, "r": 102.08514, "b": 545.40492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 137.91064, "t": 536.49837, "r": 150.64285, "b": 545.40492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "TB", "bbox": {"l": 137.91064, "t": 536.49837, "r": 150.64285, "b": 545.40492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 176.56554, "t": 536.49837, "r": 194.00009, "b": 545.40492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "86.0", "bbox": {"l": 176.56554, "t": 536.49837, "r": 194.00009, "b": 545.40492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 227.89285, "t": 536.49837, "r": 231.21040000000002, "b": 545.40492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "-", "bbox": {"l": 227.89285, "t": 536.49837, "r": 231.21040000000002, "b": 545.40492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 262.18411, "t": 536.49837, "r": 279.61865, "b": 545.40492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "86.0", "bbox": {"l": 262.18411, "t": 536.49837, "r": 279.61865, "b": 545.40492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 66.315002, "t": 548.45436, "r": 117.38329000000002, "b": 557.36092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 548.45436, "r": 117.38329000000002, "b": 557.36092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 137.90625, "t": 548.45436, "r": 150.63846, "b": 557.36092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "TB", "bbox": {"l": 137.90625, "t": 548.45436, "r": 150.63846, "b": 557.36092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 176.57111, "t": 548.45436, "r": 194.00566, "b": 557.36092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "89.6", "bbox": {"l": 176.57111, "t": 548.45436, "r": 194.00566, "b": 557.36092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 227.88845999999998, "t": 548.45436, "r": 231.20601, "b": 557.36092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "-", "bbox": {"l": 227.88845999999998, "t": 548.45436, "r": 231.20601, "b": 557.36092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 262.189, "t": 548.3348100000001, "r": 279.62354, "b": 557.2911799999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": "89.6", "bbox": {"l": 262.189, "t": 548.3348100000001, "r": 279.62354, "b": 557.2911799999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 66.315002, "t": 568.00237, "r": 117.38329000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "TableFormer", "bbox": {"l": 66.315002, "t": 568.00237, "r": 117.38329000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 134.86766, "t": 568.00237, "r": 153.68701, "b": 576.90892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "STN", "bbox": {"l": 134.86766, "t": 568.00237, "r": 153.68701, "b": 576.90892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 176.57111, "t": 568.00237, "r": 194.00566, "b": 576.90892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": "96.9", "bbox": {"l": 176.57111, "t": 568.00237, "r": 194.00566, "b": 576.90892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 220.83495, "t": 568.00237, "r": 238.26950000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 107, "text": "95.7", "bbox": {"l": 220.83495, "t": 568.00237, "r": 238.26950000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 262.1897, "t": 568.00237, "r": 279.62424, "b": 576.90892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 108, "text": "96.7", "bbox": {"l": 262.1897, "t": 568.00237, "r": 279.62424, "b": 576.90892, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 11, "num_cols": 5, "table_cells": [{"bbox": {"l": 78.843002, "t": 420.69037, "r": 104.85535, "b": 429.59692, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Model", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 211.2, "t": 414.71237, "r": 247.74349999999998, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "TEDS Complex", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 129.338, "t": 426.66736, "r": 159.21584, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Dataset", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 171.17096, "t": 426.66736, "r": 199.40497, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Simple", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 264.54044, "t": 426.66736, "r": 277.27264, "b": 435.57391000000007, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "All", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 81.612, "t": 443.62436, "r": 102.08514, "b": 452.53091, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "EDD", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.87206, "t": 443.62436, "r": 153.69141, "b": 452.53091, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "PTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.56554, "t": 443.62436, "r": 194.00009, "b": 452.53091, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "91.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 220.82938000000001, "t": 443.62436, "r": 238.26393, "b": 452.53091, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "88.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 262.18414, "t": 443.62436, "r": 279.61868, "b": 452.53091, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "89.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 82.165001, "t": 455.58035, "r": 101.5323, "b": 464.48691, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "GTE", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.86716, "t": 455.58035, "r": 153.68651, "b": 464.48691, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "PTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 183.62411, "t": 455.58035, "r": 186.94167, "b": 464.48691, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 227.88795000000002, "t": 455.58035, "r": 231.20551, "b": 464.48691, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 259.69855, "t": 455.58035, "r": 282.11441, "b": 464.48691, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "93.01", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 66.315002, "t": 468.13336, "r": 117.38329000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.86766, "t": 468.13336, "r": 153.68701, "b": 477.03992, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "PTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.57111, "t": 468.13336, "r": 194.00566, "b": 477.03992, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "98.5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 220.83495, "t": 468.13336, "r": 238.26950000000002, "b": 477.03992, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "95.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 259.698, "t": 468.01379, "r": 282.11386, "b": 476.97018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "96.75", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 81.612, "t": 483.32635, "r": 102.08514, "b": 492.23291, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "EDD", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.87206, "t": 483.32635, "r": 153.69141, "b": 492.23291, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "FTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.56554, "t": 483.32635, "r": 194.00009, "b": 492.23291, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "88.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 218.33870999999996, "t": 483.32635, "r": 240.75455999999997, "b": 492.23291, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "92.08", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 262.18411, "t": 483.32635, "r": 279.61865, "b": 492.23291, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "90.6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 82.165001, "t": 495.28134, "r": 101.5323, "b": 504.1879, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "GTE", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.86716, "t": 495.28134, "r": 153.68651, "b": 504.1879, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "FTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 183.62411, "t": 495.28134, "r": 186.94167, "b": 504.1879, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 227.88795000000002, "t": 495.28134, "r": 231.20551, "b": 504.1879, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 259.69855, "t": 495.28134, "r": 282.11441, "b": 504.1879, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "87.14", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 71.789001, "t": 507.23633, "r": 111.90838999999998, "b": 516.14288, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "GTE (FT)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.86221, "t": 507.23633, "r": 153.68156, "b": 516.14288, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "FTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 183.62914, "t": 507.23633, "r": 186.94669, "b": 516.14288, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 227.89297, "t": 507.23633, "r": 231.21053000000003, "b": 516.14288, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 259.6936, "t": 507.23633, "r": 282.10947, "b": 516.14288, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "91.02", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 66.315002, "t": 519.1913099999999, "r": 117.38329000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.86766, "t": 519.1913099999999, "r": 153.68701, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "FTN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.57111, "t": 519.1913099999999, "r": 194.00566, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "97.5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 220.83495, "t": 519.1913099999999, "r": 238.26950000000002, "b": 528.0978700000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "96.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 262.189, "t": 519.0717500000001, "r": 279.62354, "b": 528.02814, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "96.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 81.612, "t": 536.49837, "r": 102.08514, "b": 545.40492, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "EDD", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 137.91064, "t": 536.49837, "r": 150.64285, "b": 545.40492, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "TB", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.56554, "t": 536.49837, "r": 194.00009, "b": 545.40492, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "86.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 227.89285, "t": 536.49837, "r": 231.21040000000002, "b": 545.40492, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 262.18411, "t": 536.49837, "r": 279.61865, "b": 545.40492, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "86.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 66.315002, "t": 548.45436, "r": 117.38329000000002, "b": 557.36092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 137.90625, "t": 548.45436, "r": 150.63846, "b": 557.36092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "TB", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.57111, "t": 548.45436, "r": 194.00566, "b": 557.36092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "89.6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 227.88845999999998, "t": 548.45436, "r": 231.20601, "b": 557.36092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 262.189, "t": 548.3348100000001, "r": 279.62354, "b": 557.2911799999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "89.6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 66.315002, "t": 568.00237, "r": 117.38329000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 134.86766, "t": 568.00237, "r": 153.68701, "b": 576.90892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "STN", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 176.57111, "t": 568.00237, "r": 194.00566, "b": 576.90892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "96.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 220.83495, "t": 568.00237, "r": 238.26950000000002, "b": 576.90892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "95.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 262.1897, "t": 568.00237, "r": 279.62424, "b": 576.90892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "96.7", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "text", "id": 15, "page_no": 6, "cluster": {"id": 15, "label": "text", "bbox": {"l": 50.112, "t": 592.43336, "r": 286.36511, "b": 613.29492, "coord_origin": "TOPLEFT"}, "confidence": 0.7209173440933228, "cells": [{"id": 109, "text": "Table 2: Structure results on PubTabNet (PTN), FinTabNet", "bbox": {"l": 50.112, "t": 592.43336, "r": 286.36511, "b": 601.33992, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "(FTN), TableBank (TB) and SynthTabNet (STN).", "bbox": {"l": 50.112, "t": 604.38837, "r": 247.46114, "b": 613.29492, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 2: Structure results on PubTabNet (PTN), FinTabNet (FTN), TableBank (TB) and SynthTabNet (STN)."}, {"label": "text", "id": 16, "page_no": 6, "cluster": {"id": 16, "label": "text", "bbox": {"l": 50.112, "t": 616.34337, "r": 261.78732, "b": 625.24992, "coord_origin": "TOPLEFT"}, "confidence": 0.6433312892913818, "cells": [{"id": 111, "text": "FT: Model was trained on PubTabNet then finetuned.", "bbox": {"l": 50.112, "t": 616.34337, "r": 261.78732, "b": 625.24992, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "FT: Model was trained on PubTabNet then finetuned."}, {"label": "text", "id": 3, "page_no": 6, "cluster": {"id": 3, "label": "text", "bbox": {"l": 50.112015, "t": 644.3498099999999, "r": 286.366, "b": 713.151932, "coord_origin": "TOPLEFT"}, "confidence": 0.9854635000228882, "cells": [{"id": 112, "text": "Cell Detection.", "bbox": {"l": 62.067001, "t": 644.3498099999999, "r": 124.72179, "b": 653.30618, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "Like any object detector, our", "bbox": {"l": 128.20401, "t": 644.46936, "r": 242.9333, "b": 653.37592, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "Cell BBox", "bbox": {"l": 245.55401999999998, "t": 644.55902, "r": 286.36084, "b": 653.1467700000001, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "Detector", "bbox": {"l": 50.112015, "t": 656.51402, "r": 84.971146, "b": 665.10178, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "provides bounding boxes that can be improved", "bbox": {"l": 89.515015, "t": 656.42436, "r": 286.366, "b": 665.33092, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "with post-processing during inference. We make use of the", "bbox": {"l": 50.112015, "t": 668.37936, "r": 286.36511, "b": 677.28593, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "grid-like structure of tables to refine the predictions. A de-", "bbox": {"l": 50.112015, "t": 680.33536, "r": 286.36505, "b": 689.24193, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "tailed explanation on the post-processing is available in the", "bbox": {"l": 50.112015, "t": 692.290359, "r": 286.36511, "b": 701.19693, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "supplementary material. As shown in Tab. 3, we evaluate", "bbox": {"l": 50.112015, "t": 704.245361, "r": 286.36508, "b": 713.151932, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Cell Detection. Like any object detector, our Cell BBox Detector provides bounding boxes that can be improved with post-processing during inference. We make use of the grid-like structure of tables to refine the predictions. A detailed explanation on the post-processing is available in the supplementary material. As shown in Tab. 3, we evaluate"}, {"label": "text", "id": 7, "page_no": 6, "cluster": {"id": 7, "label": "text", "bbox": {"l": 308.862, "t": 75.20836999999995, "r": 545.11517, "b": 227.57709, "coord_origin": "TOPLEFT"}, "confidence": 0.9713197946548462, "cells": [{"id": 121, "text": "our", "bbox": {"l": 308.862, "t": 75.20836999999995, "r": 322.14215, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Cell BBox Decoder", "bbox": {"l": 325.45401, "t": 75.29803000000004, "r": 404.56702, "b": 83.88580000000002, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "accuracy for cells with a class la-", "bbox": {"l": 408.104, "t": 75.20836999999995, "r": 545.10968, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "bel of \u2018content\u2019 only using the PASCAL VOC mAP metric", "bbox": {"l": 308.862, "t": 87.16339000000005, "r": 545.11511, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "for pre-processing and post-processing.", "bbox": {"l": 308.862, "t": 99.11841000000004, "r": 470.22626, "b": 108.02495999999985, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "Note that we do", "bbox": {"l": 477.52884, "t": 99.11841000000004, "r": 545.11511, "b": 108.02495999999985, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "not have post-processing results for SynthTabNet as images", "bbox": {"l": 308.862, "t": 111.07343000000003, "r": 545.11517, "b": 119.97997999999984, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "are only provided. To compare the performance of our pro-", "bbox": {"l": 308.862, "t": 123.02844000000005, "r": 545.11511, "b": 131.93499999999995, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "posed approach, we\u2019ve integrated TableFormer\u2019s", "bbox": {"l": 308.862, "t": 134.98443999999995, "r": 502.01691000000005, "b": 143.89099, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "Cell BBox", "bbox": {"l": 504.47299, "t": 135.07410000000004, "r": 545.11041, "b": 143.66187000000002, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "Decoder", "bbox": {"l": 308.862, "t": 147.02910999999995, "r": 343.16324, "b": 155.61688000000004, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "into EDD architecture. As mentioned previously,", "bbox": {"l": 346.371, "t": 146.93944999999997, "r": 545.11493, "b": 155.84600999999998, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "the Structure Decoder provides the", "bbox": {"l": 308.862, "t": 158.89446999999996, "r": 446.15652, "b": 167.80102999999997, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "Cell BBox Decoder", "bbox": {"l": 448.28998000000007, "t": 158.98413000000005, "r": 525.04181, "b": 167.57190000000003, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "with", "bbox": {"l": 527.39899, "t": 158.89446999999996, "r": 545.11249, "b": 167.80102999999997, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "the features needed to predict the bounding box predictions.", "bbox": {"l": 308.862, "t": 170.84948999999995, "r": 545.11511, "b": 179.75603999999998, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "Therefore, the accuracy of the", "bbox": {"l": 308.862, "t": 182.80449999999996, "r": 432.86642000000006, "b": 191.71105999999997, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "Structure Decoder", "bbox": {"l": 436.39001, "t": 182.89417000000003, "r": 510.93021, "b": 191.48193000000003, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "directly", "bbox": {"l": 514.677, "t": 182.80449999999996, "r": 545.11273, "b": 191.71105999999997, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "influences the accuracy of the", "bbox": {"l": 308.862, "t": 194.75951999999995, "r": 431.17285, "b": 203.66607999999997, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "Cell BBox Decoder", "bbox": {"l": 434.6790199999999, "t": 194.84918000000005, "r": 514.18054, "b": 203.43695000000002, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": ". If the", "bbox": {"l": 514.17603, "t": 194.75951999999995, "r": 545.10992, "b": 203.66607999999997, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "Structure Decoder", "bbox": {"l": 308.86203, "t": 206.80517999999995, "r": 382.35614, "b": 215.39293999999995, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "predicts an extra column, this will result", "bbox": {"l": 385.07501, "t": 206.71551999999997, "r": 545.11426, "b": 215.62207, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "in an extra column of predicted bounding boxes.", "bbox": {"l": 308.862, "t": 218.67052999999999, "r": 501.6981799999999, "b": 227.57709, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "our Cell BBox Decoder accuracy for cells with a class label of 'content' only using the PASCAL VOC mAP metric for pre-processing and post-processing. Note that we do not have post-processing results for SynthTabNet as images are only provided. To compare the performance of our proposed approach, we've integrated TableFormer's Cell BBox Decoder into EDD architecture. As mentioned previously, the Structure Decoder provides the Cell BBox Decoder with the features needed to predict the bounding box predictions. Therefore, the accuracy of the Structure Decoder directly influences the accuracy of the Cell BBox Decoder . If the Structure Decoder predicts an extra column, this will result in an extra column of predicted bounding boxes."}, {"label": "table", "id": 8, "page_no": 6, "cluster": {"id": 8, "label": "table", "bbox": {"l": 308.4068603515625, "t": 247.87631225585938, "r": 533.6419677734375, "b": 303.8056640625, "coord_origin": "TOPLEFT"}, "confidence": 0.9691730737686157, "cells": [{"id": 146, "text": "Model", "bbox": {"l": 339.323, "t": 253.66436999999996, "r": 365.33536, "b": 262.57092, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "Dataset", "bbox": {"l": 401.04132, "t": 253.66436999999996, "r": 430.91916, "b": 262.57092, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "mAP", "bbox": {"l": 454.10214, "t": 253.66436999999996, "r": 474.58523999999994, "b": 262.57092, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "mAP (PP)", "bbox": {"l": 486.54034, "t": 253.66436999999996, "r": 527.2276, "b": 262.57092, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "EDD+BBox", "bbox": {"l": 327.65601, "t": 270.62134000000003, "r": 377.00076, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "PubTabNet", "bbox": {"l": 393.69809, "t": 270.62134000000003, "r": 438.28073, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "79.2", "bbox": {"l": 455.63559, "t": 270.62134000000003, "r": 473.07013, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "82.7", "bbox": {"l": 498.16592, "t": 270.62134000000003, "r": 515.60046, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "TableFormer", "bbox": {"l": 326.79501, "t": 282.57631999999995, "r": 377.86331, "b": 291.48288, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "PubTabNet", "bbox": {"l": 393.69388, "t": 282.57631999999995, "r": 438.27652, "b": 291.48288, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "82.1", "bbox": {"l": 455.63101, "t": 282.45676, "r": 473.06555000000003, "b": 291.41315, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "86.8", "bbox": {"l": 498.1713, "t": 282.45676, "r": 515.60583, "b": 291.41315, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "TableFormer", "bbox": {"l": 326.79501, "t": 294.53131, "r": 377.86331, "b": 303.43787, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "SynthTabNet", "bbox": {"l": 389.81842, "t": 294.53131, "r": 442.15194999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "87.7", "bbox": {"l": 455.63135, "t": 294.53131, "r": 473.06589, "b": 303.43787, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "-", "bbox": {"l": 505.22515999999996, "t": 294.53131, "r": 508.54268999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}}], "children": [{"id": 73, "label": "text", "bbox": {"l": 339.323, "t": 253.66436999999996, "r": 365.33536, "b": 262.57092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 146, "text": "Model", "bbox": {"l": 339.323, "t": 253.66436999999996, "r": 365.33536, "b": 262.57092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 401.04132, "t": 253.66436999999996, "r": 430.91916, "b": 262.57092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 147, "text": "Dataset", "bbox": {"l": 401.04132, "t": 253.66436999999996, "r": 430.91916, "b": 262.57092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 454.10214, "t": 253.66436999999996, "r": 474.58523999999994, "b": 262.57092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 148, "text": "mAP", "bbox": {"l": 454.10214, "t": 253.66436999999996, "r": 474.58523999999994, "b": 262.57092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 486.54034, "t": 253.66436999999996, "r": 527.2276, "b": 262.57092, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 149, "text": "mAP (PP)", "bbox": {"l": 486.54034, "t": 253.66436999999996, "r": 527.2276, "b": 262.57092, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 327.65601, "t": 270.62134000000003, "r": 377.00076, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 150, "text": "EDD+BBox", "bbox": {"l": 327.65601, "t": 270.62134000000003, "r": 377.00076, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 393.69809, "t": 270.62134000000003, "r": 438.28073, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 151, "text": "PubTabNet", "bbox": {"l": 393.69809, "t": 270.62134000000003, "r": 438.28073, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 455.63559, "t": 270.62134000000003, "r": 473.07013, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 152, "text": "79.2", "bbox": {"l": 455.63559, "t": 270.62134000000003, "r": 473.07013, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 498.16592, "t": 270.62134000000003, "r": 515.60046, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 153, "text": "82.7", "bbox": {"l": 498.16592, "t": 270.62134000000003, "r": 515.60046, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 326.79501, "t": 282.57631999999995, "r": 377.86331, "b": 291.48288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 154, "text": "TableFormer", "bbox": {"l": 326.79501, "t": 282.57631999999995, "r": 377.86331, "b": 291.48288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 393.69388, "t": 282.57631999999995, "r": 438.27652, "b": 291.48288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 155, "text": "PubTabNet", "bbox": {"l": 393.69388, "t": 282.57631999999995, "r": 438.27652, "b": 291.48288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 455.63101, "t": 282.45676, "r": 473.06555000000003, "b": 291.41315, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 156, "text": "82.1", "bbox": {"l": 455.63101, "t": 282.45676, "r": 473.06555000000003, "b": 291.41315, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 498.1713, "t": 282.45676, "r": 515.60583, "b": 291.41315, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 157, "text": "86.8", "bbox": {"l": 498.1713, "t": 282.45676, "r": 515.60583, "b": 291.41315, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 326.79501, "t": 294.53131, "r": 377.86331, "b": 303.43787, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 158, "text": "TableFormer", "bbox": {"l": 326.79501, "t": 294.53131, "r": 377.86331, "b": 303.43787, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 389.81842, "t": 294.53131, "r": 442.15194999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 159, "text": "SynthTabNet", "bbox": {"l": 389.81842, "t": 294.53131, "r": 442.15194999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 455.63135, "t": 294.53131, "r": 473.06589, "b": 303.43787, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 160, "text": "87.7", "bbox": {"l": 455.63135, "t": 294.53131, "r": 473.06589, "b": 303.43787, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 505.22515999999996, "t": 294.53131, "r": 508.54268999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 161, "text": "-", "bbox": {"l": 505.22515999999996, "t": 294.53131, "r": 508.54268999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 4, "num_cols": 4, "table_cells": [{"bbox": {"l": 339.323, "t": 253.66436999999996, "r": 365.33536, "b": 262.57092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Model", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 401.04132, "t": 253.66436999999996, "r": 430.91916, "b": 262.57092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Dataset", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 454.10214, "t": 253.66436999999996, "r": 474.58523999999994, "b": 262.57092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "mAP", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 486.54034, "t": 253.66436999999996, "r": 527.2276, "b": 262.57092, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "mAP (PP)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 327.65601, "t": 270.62134000000003, "r": 377.00076, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "EDD+BBox", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 393.69809, "t": 270.62134000000003, "r": 438.28073, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "PubTabNet", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 455.63559, "t": 270.62134000000003, "r": 473.07013, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "79.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 498.16592, "t": 270.62134000000003, "r": 515.60046, "b": 279.52788999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "82.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.79501, "t": 282.57631999999995, "r": 377.86331, "b": 291.48288, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 393.69388, "t": 282.57631999999995, "r": 438.27652, "b": 291.48288, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "PubTabNet", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 455.63101, "t": 282.45676, "r": 473.06555000000003, "b": 291.41315, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "82.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 498.1713, "t": 282.45676, "r": 515.60583, "b": 291.41315, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "86.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.79501, "t": 294.53131, "r": 377.86331, "b": 303.43787, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 389.81842, "t": 294.53131, "r": 442.15194999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "SynthTabNet", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 455.63135, "t": 294.53131, "r": 473.06589, "b": 303.43787, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "87.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 505.22515999999996, "t": 294.53131, "r": 508.54268999999994, "b": 303.43787, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "caption", "id": 12, "page_no": 6, "cluster": {"id": 12, "label": "caption", "bbox": {"l": 308.862, "t": 316.44931, "r": 545.11517, "b": 337.3108500000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9519917964935303, "cells": [{"id": 162, "text": "Table 3:", "bbox": {"l": 308.862, "t": 316.44931, "r": 341.49951, "b": 325.35587, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "Cell Bounding Box detection results on PubTab-", "bbox": {"l": 348.60284, "t": 316.44931, "r": 545.11517, "b": 325.35587, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "Net, and FinTabNet. PP: Post-processing.", "bbox": {"l": 308.862, "t": 328.4043, "r": 474.97845, "b": 337.3108500000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 3: Cell Bounding Box detection results on PubTabNet, and FinTabNet. PP: Post-processing."}, {"label": "text", "id": 4, "page_no": 6, "cluster": {"id": 4, "label": "text", "bbox": {"l": 308.86197, "t": 367.6797199999999, "r": 545.11566, "b": 520.16769, "coord_origin": "TOPLEFT"}, "confidence": 0.9835010766983032, "cells": [{"id": 165, "text": "Cell Content.", "bbox": {"l": 320.81699, "t": 367.6797199999999, "r": 378.94876, "b": 376.63611, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "In this section, we evaluate the entire", "bbox": {"l": 387.07898, "t": 367.79929, "r": 545.11566, "b": 376.70584, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "pipeline of recovering a table with content.", "bbox": {"l": 308.86197, "t": 379.75426999999996, "r": 487.19257, "b": 388.66083, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "Here we put", "bbox": {"l": 493.96713, "t": 379.75426999999996, "r": 545.11511, "b": 388.66083, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "our approach to test by capitalizing on extracting content", "bbox": {"l": 308.86197, "t": 391.70926, "r": 545.11505, "b": 400.61581, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "from the PDF cells rather than decoding from images. Tab.", "bbox": {"l": 308.86197, "t": 403.66525, "r": 545.11523, "b": 412.57181, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "4", "bbox": {"l": 308.86197, "t": 415.62024, "r": 314.08096, "b": 424.52679, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "shows the TEDs score of HTML code representing the", "bbox": {"l": 316.69046, "t": 415.62024, "r": 545.11517, "b": 424.52679, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "structure of the table along with the content inserted in the", "bbox": {"l": 308.86197, "t": 427.57523, "r": 545.11505, "b": 436.48177999999996, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "data cell and compared with the ground-truth. Our method", "bbox": {"l": 308.86197, "t": 439.53021, "r": 545.11505, "b": 448.43677, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "achieved a", "bbox": {"l": 308.86197, "t": 451.4852, "r": 350.23666, "b": 460.39175, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "5.3%", "bbox": {"l": 352.17596, "t": 451.36563, "r": 374.59183, "b": 460.32201999999995, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "increase over the state-of-the-art, and com-", "bbox": {"l": 376.53296, "t": 451.4852, "r": 545.11011, "b": 460.39175, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "mercial solutions. We believe our scores would be higher", "bbox": {"l": 308.86197, "t": 463.44019, "r": 545.11511, "b": 472.34674, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "if the HTML ground-truth matched the extracted PDF cell", "bbox": {"l": 308.86197, "t": 475.39618, "r": 545.11517, "b": 484.30273, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "content. Unfortunately, there are small discrepancies such", "bbox": {"l": 308.86197, "t": 487.35117, "r": 545.11511, "b": 496.25772, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "as spacings around words or special characters with various", "bbox": {"l": 308.86197, "t": 499.30615, "r": 545.11505, "b": 508.21271, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "unicode representations.", "bbox": {"l": 308.86197, "t": 511.26114, "r": 405.69846, "b": 520.16769, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Cell Content. In this section, we evaluate the entire pipeline of recovering a table with content. Here we put our approach to test by capitalizing on extracting content from the PDF cells rather than decoding from images. Tab. 4 shows the TEDs score of HTML code representing the structure of the table along with the content inserted in the data cell and compared with the ground-truth. Our method achieved a 5.3% increase over the state-of-the-art, and commercial solutions. We believe our scores would be higher if the HTML ground-truth matched the extracted PDF cell content. Unfortunately, there are small discrepancies such as spacings around words or special characters with various unicode representations."}, {"label": "table", "id": 5, "page_no": 6, "cluster": {"id": 5, "label": "table", "bbox": {"l": 332.9688720703125, "t": 540.2835693359375, "r": 520.942138671875, "b": 643.2697143554688, "coord_origin": "TOPLEFT"}, "confidence": 0.9775567650794983, "cells": [{"id": 183, "text": "Model", "bbox": {"l": 358.01099, "t": 552.23337, "r": 384.02335, "b": 561.1399200000001, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "TEDS", "bbox": {"l": 449.03400000000005, "t": 546.25537, "r": 473.94049000000007, "b": 555.16193, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": "Simple", "bbox": {"l": 408.50598, "t": 558.21037, "r": 436.73999, "b": 567.11693, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "Complex", "bbox": {"l": 448.6951, "t": 558.21037, "r": 485.07849, "b": 567.11693, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "All", "bbox": {"l": 499.3848, "t": 558.21037, "r": 512.117, "b": 567.11693, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": "Tabula", "bbox": {"l": 357.68201, "t": 575.16736, "r": 384.3519, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "78.0", "bbox": {"l": 413.90097, "t": 575.16736, "r": 431.33550999999994, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "57.8", "bbox": {"l": 458.16479000000004, "t": 575.16736, "r": 475.59933000000007, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "67.9", "bbox": {"l": 497.0289, "t": 575.16736, "r": 514.46344, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": "Traprange", "bbox": {"l": 350.72299, "t": 587.12236, "r": 391.31064, "b": 596.02892, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "60.8", "bbox": {"l": 413.90582, "t": 587.12236, "r": 431.34036, "b": 596.02892, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "49.9", "bbox": {"l": 458.16965, "t": 587.12236, "r": 475.60419, "b": 596.02892, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "55.4", "bbox": {"l": 497.03374999999994, "t": 587.12236, "r": 514.46832, "b": 596.02892, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "Camelot", "bbox": {"l": 354.13599, "t": 599.07835, "r": 387.89923, "b": 607.98491, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "80.0", "bbox": {"l": 413.90161, "t": 599.07835, "r": 431.33615, "b": 607.98491, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "66.0", "bbox": {"l": 458.16544, "t": 599.07835, "r": 475.59998, "b": 607.98491, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "73.0", "bbox": {"l": 497.02954000000005, "t": 599.07835, "r": 514.46411, "b": 607.98491, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "Acrobat Pro", "bbox": {"l": 346.55899, "t": 611.03336, "r": 395.47534, "b": 619.93991, "coord_origin": "TOPLEFT"}}, {"id": 201, "text": "68.9", "bbox": {"l": 413.90616, "t": 611.03336, "r": 431.34069999999997, "b": 619.93991, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": "61.8", "bbox": {"l": 458.16998000000007, "t": 611.03336, "r": 475.60452, "b": 619.93991, "coord_origin": "TOPLEFT"}}, {"id": 203, "text": "65.3", "bbox": {"l": 497.03409, "t": 611.03336, "r": 514.46863, "b": 619.93991, "coord_origin": "TOPLEFT"}}, {"id": 204, "text": "EDD", "bbox": {"l": 360.78101, "t": 622.9883600000001, "r": 381.25415, "b": 631.89491, "coord_origin": "TOPLEFT"}}, {"id": 205, "text": "91.2", "bbox": {"l": 413.90158, "t": 622.9883600000001, "r": 431.33612, "b": 631.89491, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": "85.4", "bbox": {"l": 458.16541, "t": 622.9883600000001, "r": 475.59995000000004, "b": 631.89491, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": "88.3", "bbox": {"l": 497.0295100000001, "t": 622.9883600000001, "r": 514.46405, "b": 631.89491, "coord_origin": "TOPLEFT"}}, {"id": 208, "text": "TableFormer", "bbox": {"l": 345.483, "t": 634.94336, "r": 396.5513, "b": 643.84991, "coord_origin": "TOPLEFT"}}, {"id": 209, "text": "95.4", "bbox": {"l": 413.90616, "t": 634.94336, "r": 431.34069999999997, "b": 643.84991, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": "90.1", "bbox": {"l": 458.16998000000007, "t": 634.94336, "r": 475.60452, "b": 643.84991, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "93.6", "bbox": {"l": 497.03400000000005, "t": 634.82381, "r": 514.46857, "b": 643.78018, "coord_origin": "TOPLEFT"}}], "children": [{"id": 89, "label": "text", "bbox": {"l": 358.01099, "t": 552.23337, "r": 384.02335, "b": 561.1399200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 183, "text": "Model", "bbox": {"l": 358.01099, "t": 552.23337, "r": 384.02335, "b": 561.1399200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 449.03400000000005, "t": 546.25537, "r": 473.94049000000007, "b": 555.16193, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 184, "text": "TEDS", "bbox": {"l": 449.03400000000005, "t": 546.25537, "r": 473.94049000000007, "b": 555.16193, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 408.50598, "t": 558.21037, "r": 436.73999, "b": 567.11693, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 185, "text": "Simple", "bbox": {"l": 408.50598, "t": 558.21037, "r": 436.73999, "b": 567.11693, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 448.6951, "t": 558.21037, "r": 485.07849, "b": 567.11693, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 186, "text": "Complex", "bbox": {"l": 448.6951, "t": 558.21037, "r": 485.07849, "b": 567.11693, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 499.3848, "t": 558.21037, "r": 512.117, "b": 567.11693, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 187, "text": "All", "bbox": {"l": 499.3848, "t": 558.21037, "r": 512.117, "b": 567.11693, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 357.68201, "t": 575.16736, "r": 384.3519, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 188, "text": "Tabula", "bbox": {"l": 357.68201, "t": 575.16736, "r": 384.3519, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 413.90097, "t": 575.16736, "r": 431.33550999999994, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 189, "text": "78.0", "bbox": {"l": 413.90097, "t": 575.16736, "r": 431.33550999999994, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 458.16479000000004, "t": 575.16736, "r": 475.59933000000007, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 190, "text": "57.8", "bbox": {"l": 458.16479000000004, "t": 575.16736, "r": 475.59933000000007, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 497.0289, "t": 575.16736, "r": 514.46344, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 191, "text": "67.9", "bbox": {"l": 497.0289, "t": 575.16736, "r": 514.46344, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 350.72299, "t": 587.12236, "r": 391.31064, "b": 596.02892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 192, "text": "Traprange", "bbox": {"l": 350.72299, "t": 587.12236, "r": 391.31064, "b": 596.02892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 413.90582, "t": 587.12236, "r": 431.34036, "b": 596.02892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 193, "text": "60.8", "bbox": {"l": 413.90582, "t": 587.12236, "r": 431.34036, "b": 596.02892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 458.16965, "t": 587.12236, "r": 475.60419, "b": 596.02892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 194, "text": "49.9", "bbox": {"l": 458.16965, "t": 587.12236, "r": 475.60419, "b": 596.02892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 497.03374999999994, "t": 587.12236, "r": 514.46832, "b": 596.02892, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 195, "text": "55.4", "bbox": {"l": 497.03374999999994, "t": 587.12236, "r": 514.46832, "b": 596.02892, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 354.13599, "t": 599.07835, "r": 387.89923, "b": 607.98491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 196, "text": "Camelot", "bbox": {"l": 354.13599, "t": 599.07835, "r": 387.89923, "b": 607.98491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 413.90161, "t": 599.07835, "r": 431.33615, "b": 607.98491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 197, "text": "80.0", "bbox": {"l": 413.90161, "t": 599.07835, "r": 431.33615, "b": 607.98491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 458.16544, "t": 599.07835, "r": 475.59998, "b": 607.98491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 198, "text": "66.0", "bbox": {"l": 458.16544, "t": 599.07835, "r": 475.59998, "b": 607.98491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 497.02954000000005, "t": 599.07835, "r": 514.46411, "b": 607.98491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 199, "text": "73.0", "bbox": {"l": 497.02954000000005, "t": 599.07835, "r": 514.46411, "b": 607.98491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 346.55899, "t": 611.03336, "r": 395.47534, "b": 619.93991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 200, "text": "Acrobat Pro", "bbox": {"l": 346.55899, "t": 611.03336, "r": 395.47534, "b": 619.93991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 413.90616, "t": 611.03336, "r": 431.34069999999997, "b": 619.93991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 201, "text": "68.9", "bbox": {"l": 413.90616, "t": 611.03336, "r": 431.34069999999997, "b": 619.93991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 458.16998000000007, "t": 611.03336, "r": 475.60452, "b": 619.93991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 202, "text": "61.8", "bbox": {"l": 458.16998000000007, "t": 611.03336, "r": 475.60452, "b": 619.93991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 497.03409, "t": 611.03336, "r": 514.46863, "b": 619.93991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 203, "text": "65.3", "bbox": {"l": 497.03409, "t": 611.03336, "r": 514.46863, "b": 619.93991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 360.78101, "t": 622.9883600000001, "r": 381.25415, "b": 631.89491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 204, "text": "EDD", "bbox": {"l": 360.78101, "t": 622.9883600000001, "r": 381.25415, "b": 631.89491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 413.90158, "t": 622.9883600000001, "r": 431.33612, "b": 631.89491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 205, "text": "91.2", "bbox": {"l": 413.90158, "t": 622.9883600000001, "r": 431.33612, "b": 631.89491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 458.16541, "t": 622.9883600000001, "r": 475.59995000000004, "b": 631.89491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 206, "text": "85.4", "bbox": {"l": 458.16541, "t": 622.9883600000001, "r": 475.59995000000004, "b": 631.89491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 497.0295100000001, "t": 622.9883600000001, "r": 514.46405, "b": 631.89491, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 207, "text": "88.3", "bbox": {"l": 497.0295100000001, "t": 622.9883600000001, "r": 514.46405, "b": 631.89491, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 114, "label": "text", "bbox": {"l": 345.483, "t": 634.94336, "r": 396.5513, "b": 643.84991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 208, "text": "TableFormer", "bbox": {"l": 345.483, "t": 634.94336, "r": 396.5513, "b": 643.84991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 115, "label": "text", "bbox": {"l": 413.90616, "t": 634.94336, "r": 431.34069999999997, "b": 643.84991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 209, "text": "95.4", "bbox": {"l": 413.90616, "t": 634.94336, "r": 431.34069999999997, "b": 643.84991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 116, "label": "text", "bbox": {"l": 458.16998000000007, "t": 634.94336, "r": 475.60452, "b": 643.84991, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 210, "text": "90.1", "bbox": {"l": 458.16998000000007, "t": 634.94336, "r": 475.60452, "b": 643.84991, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 117, "label": "text", "bbox": {"l": 497.03400000000005, "t": 634.82381, "r": 514.46857, "b": 643.78018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 211, "text": "93.6", "bbox": {"l": 497.03400000000005, "t": 634.82381, "r": 514.46857, "b": 643.78018, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["fcel", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "nl"], "num_rows": 7, "num_cols": 4, "table_cells": [{"bbox": {"l": 358.01099, "t": 552.23337, "r": 384.02335, "b": 561.1399200000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Model", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 448.6951, "t": 546.25537, "r": 485.07849, "b": 567.11693, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "TEDS Complex", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 408.50598, "t": 558.21037, "r": 436.73999, "b": 567.11693, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Simple", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 499.3848, "t": 558.21037, "r": 512.117, "b": 567.11693, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "All", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 357.68201, "t": 575.16736, "r": 384.3519, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Tabula", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 413.90097, "t": 575.16736, "r": 431.33550999999994, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "78.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 458.16479000000004, "t": 575.16736, "r": 475.59933000000007, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "57.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 497.0289, "t": 575.16736, "r": 514.46344, "b": 584.0739100000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "67.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 350.72299, "t": 587.12236, "r": 391.31064, "b": 596.02892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Traprange", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 413.90582, "t": 587.12236, "r": 431.34036, "b": 596.02892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "60.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 458.16965, "t": 587.12236, "r": 475.60419, "b": 596.02892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "49.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 497.03374999999994, "t": 587.12236, "r": 514.46832, "b": 596.02892, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "55.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 354.13599, "t": 599.07835, "r": 387.89923, "b": 607.98491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Camelot", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 413.90161, "t": 599.07835, "r": 431.33615, "b": 607.98491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "80.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 458.16544, "t": 599.07835, "r": 475.59998, "b": 607.98491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "66.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 497.02954000000005, "t": 599.07835, "r": 514.46411, "b": 607.98491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "73.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 346.55899, "t": 611.03336, "r": 395.47534, "b": 619.93991, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Acrobat Pro", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 413.90616, "t": 611.03336, "r": 431.34069999999997, "b": 619.93991, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "68.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 458.16998000000007, "t": 611.03336, "r": 475.60452, "b": 619.93991, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "61.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 497.03409, "t": 611.03336, "r": 514.46863, "b": 619.93991, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "65.3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 360.78101, "t": 622.9883600000001, "r": 381.25415, "b": 631.89491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "EDD", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 413.90158, "t": 622.9883600000001, "r": 431.33612, "b": 631.89491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "91.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 458.16541, "t": 622.9883600000001, "r": 475.59995000000004, "b": 631.89491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "85.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 497.0295100000001, "t": 622.9883600000001, "r": 514.46405, "b": 631.89491, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "88.3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 345.483, "t": 634.94336, "r": 396.5513, "b": 643.84991, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "TableFormer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 413.90616, "t": 634.94336, "r": 431.34069999999997, "b": 643.84991, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "95.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 458.16998000000007, "t": 634.94336, "r": 475.60452, "b": 643.84991, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "90.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 497.03400000000005, "t": 634.82381, "r": 514.46857, "b": 643.78018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "93.6", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "caption", "id": 11, "page_no": 6, "cluster": {"id": 11, "label": "caption", "bbox": {"l": 308.862, "t": 656.86136, "r": 545.11517, "b": 689.6779300000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9541404247283936, "cells": [{"id": 212, "text": "Table 4:", "bbox": {"l": 308.862, "t": 656.86136, "r": 341.73862, "b": 665.76792, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "Results of structure with content retrieved using", "bbox": {"l": 349.55927, "t": 656.86136, "r": 545.11517, "b": 665.76792, "coord_origin": "TOPLEFT"}}, {"id": 214, "text": "cell detection on PubTabNet. In all cases the input is PDF", "bbox": {"l": 308.862, "t": 668.81636, "r": 545.11505, "b": 677.7229199999999, "coord_origin": "TOPLEFT"}}, {"id": 215, "text": "documents with cropped tables.", "bbox": {"l": 308.862, "t": 680.77136, "r": 435.03836, "b": 689.6779300000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 4: Results of structure with content retrieved using cell detection on PubTabNet. In all cases the input is PDF documents with cropped tables."}], "headers": [{"label": "page_footer", "id": 14, "page_no": 6, "cluster": {"id": 14, "label": "page_footer", "bbox": {"l": 295.121, "t": 734.133358, "r": 300.10229, "b": 743.039921, "coord_origin": "TOPLEFT"}, "confidence": 0.8787972331047058, "cells": [{"id": 216, "text": "7", "bbox": {"l": 295.121, "t": 734.133358, "r": 300.10229, "b": 743.039921, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "7"}]}}, {"page_no": 7, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "b.", "bbox": {"l": 53.811783000000005, "t": 208.23328000000004, "r": 62.219952, "b": 216.10645, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Structure predicted by TableFormer, with superimposed matched PDF cell text:", "bbox": {"l": 66.424026, "t": 208.23328000000004, "r": 385.93451, "b": 216.10645, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Japanese language (previously unseen by TableFormer):", "bbox": {"l": 53.811783000000005, "t": 94.28112999999996, "r": 284.34592, "b": 102.15430000000003, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Example table from FinTabNet:", "bbox": {"l": 304.83081, "t": 94.28112999999996, "r": 431.09119, "b": 102.15430000000003, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "a.", "bbox": {"l": 53.286037, "t": 78.68756000000008, "r": 61.550289, "b": 86.56073000000004, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Red - PDF cells, Green - predicted bounding boxes, Blue - post-processed predictions matched to PDF cells", "bbox": {"l": 65.682419, "t": 78.68756000000008, "r": 499.55563, "b": 86.56073000000004, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "\u8ad6\u6587\u30d5\u30a1\u30a4\u30eb", "bbox": {"l": 209.93285, "t": 222.18073000000004, "r": 241.04458999999997, "b": 226.36212, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "\u53c2\u8003\u6587\u732e", "bbox": {"l": 263.76489, "t": 222.18073000000004, "r": 284.50589, "b": 226.36212, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "\u51fa\u5178", "bbox": {"l": 110.24990999999999, "t": 229.66594999999995, "r": 120.62018, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "\u30d5\u30a1\u30a4\u30eb", "bbox": {"l": 175.36609, "t": 229.66594999999995, "r": 196.1071, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "\u6570", "bbox": {"l": 196.10756, "t": 229.66594999999995, "r": 201.29247, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "\u82f1\u8a9e", "bbox": {"l": 209.62408, "t": 229.66594999999995, "r": 219.99435, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "\u65e5\u672c\u8a9e", "bbox": {"l": 229.19814, "t": 229.66594999999995, "r": 244.75377, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "\u82f1\u8a9e", "bbox": {"l": 256.1142, "t": 229.66594999999995, "r": 266.48447, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "\u65e5\u672c\u8a9e", "bbox": {"l": 278.38434, "t": 229.66594999999995, "r": 293.93997, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Association for Computational Linguistics(ACL2003)", "bbox": {"l": 55.53052099999999, "t": 236.42584, "r": 162.7131, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "65", "bbox": {"l": 184.39731, "t": 236.42584, "r": 189.56456, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "65", "bbox": {"l": 208.99026, "t": 236.42584, "r": 214.15752, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "0", "bbox": {"l": 234.87517, "t": 236.42584, "r": 237.45833000000002, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "150", "bbox": {"l": 256.88446, "t": 236.42584, "r": 264.6358, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "0", "bbox": {"l": 284.06134, "t": 236.42584, "r": 286.6445, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Computational Linguistics(COLING2002)", "bbox": {"l": 55.53052099999999, "t": 242.62048000000004, "r": 139.72253, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "140", "bbox": {"l": 183.10536, "t": 242.62048000000004, "r": 190.8567, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "140", "bbox": {"l": 207.69832, "t": 242.62048000000004, "r": 215.44965999999997, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "0", "bbox": {"l": 234.87517, "t": 242.62048000000004, "r": 237.45833000000002, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "150", "bbox": {"l": 256.88446, "t": 242.62048000000004, "r": 264.6358, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "0", "bbox": {"l": 284.06134, "t": 242.62048000000004, "r": 286.6445, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "\u96fb\u6c17\u60c5\u5831\u901a\u4fe1\u5b66\u4f1a", "bbox": {"l": 55.53052099999999, "t": 249.79845999999998, "r": 97.013, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "2003", "bbox": {"l": 92.698288, "t": 249.58942000000002, "r": 103.03371, "b": 253.94732999999997, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "\u5e74\u7dcf\u5408\u5927\u4f1a", "bbox": {"l": 103.03389, "t": 249.79845999999998, "r": 128.96027, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "150", "bbox": {"l": 183.10536, "t": 248.81506000000002, "r": 190.8567, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "8", "bbox": {"l": 210.28223, "t": 248.81506000000002, "r": 212.86539, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "142", "bbox": {"l": 232.29153, "t": 248.81506000000002, "r": 240.04287999999997, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "223", "bbox": {"l": 256.88446, "t": 248.81506000000002, "r": 264.6358, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "147", "bbox": {"l": 281.47742, "t": 248.81506000000002, "r": 289.22876, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "\u60c5\u5831\u51e6\u7406\u5b66\u4f1a\u7b2c", "bbox": {"l": 55.53052099999999, "t": 257.28369, "r": 91.827637, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "65", "bbox": {"l": 88.052673, "t": 257.07465, "r": 93.219925, "b": 261.43255999999997, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "\u56de\u5168\u56fd\u5927\u4f1a", "bbox": {"l": 93.220474, "t": 257.28369, "r": 119.14685, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "(2003)", "bbox": {"l": 116.45073999999998, "t": 257.07465, "r": 129.88177, "b": 261.43255999999997, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "177", "bbox": {"l": 183.10536, "t": 256.30029, "r": 190.8567, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "1", "bbox": {"l": 210.28223, "t": 256.30029, "r": 212.86539, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "176", "bbox": {"l": 232.29153, "t": 256.30029, "r": 240.04287999999997, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "150", "bbox": {"l": 256.88446, "t": 256.30029, "r": 264.6358, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "236", "bbox": {"l": 281.47742, "t": 256.30029, "r": 289.22876, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "\u7b2c", "bbox": {"l": 55.53052099999999, "t": 264.5108, "r": 60.715424, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "17", "bbox": {"l": 60.17654799999999, "t": 264.30175999999994, "r": 65.343796, "b": 268.65967, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "\u56de\u4eba\u5de5\u77e5\u80fd\u5b66\u4f1a\u5168\u56fd\u5927\u4f1a", "bbox": {"l": 65.344376, "t": 264.5108, "r": 122.38297000000001, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "(2003)", "bbox": {"l": 116.45073999999998, "t": 264.30175999999994, "r": 129.88177, "b": 268.65967, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "208", "bbox": {"l": 183.10536, "t": 263.52739999999994, "r": 190.8567, "b": 267.88531, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "5", "bbox": {"l": 210.28223, "t": 263.52739999999994, "r": 212.86539, "b": 267.88531, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "203", "bbox": {"l": 232.29153, "t": 263.52739999999994, "r": 240.04287999999997, "b": 267.88531, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "152", "bbox": {"l": 256.88446, "t": 263.52739999999994, "r": 264.6358, "b": 267.88531, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "244", "bbox": {"l": 281.47742, "t": 263.52739999999994, "r": 289.22876, "b": 267.88531, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "\u81ea\u7136\u8a00\u8a9e\u51e6\u7406\u7814\u7a76\u4f1a\u7b2c", "bbox": {"l": 55.53052099999999, "t": 271.73785, "r": 107.38374, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "146", "bbox": {"l": 101.99034, "t": 271.52881, "r": 109.74168000000002, "b": 275.88671999999997, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "\u301c", "bbox": {"l": 109.74204, "t": 271.73785, "r": 114.92695000000002, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "155", "bbox": {"l": 114.38793, "t": 271.52881, "r": 122.13927, "b": 275.88671999999997, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "\u56de", "bbox": {"l": 122.13963, "t": 271.73785, "r": 127.32454000000001, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "98", "bbox": {"l": 184.39731, "t": 270.75446, "r": 189.56456, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "2", "bbox": {"l": 210.28223, "t": 270.75446, "r": 212.86539, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "96", "bbox": {"l": 233.58348, "t": 270.75446, "r": 238.75072999999998, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "150", "bbox": {"l": 256.88446, "t": 270.75446, "r": 264.6358, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "232", "bbox": {"l": 281.47742, "t": 270.75446, "r": 289.22876, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "WWW", "bbox": {"l": 55.53052099999999, "t": 279.01392, "r": 68.68605, "b": 283.37183, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "\u304b\u3089\u53ce\u96c6\u3057\u305f\u8ad6\u6587", "bbox": {"l": 68.685814, "t": 279.22295999999994, "r": 110.16829999999999, "b": 283.40436, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "107", "bbox": {"l": 183.10536, "t": 277.98157000000003, "r": 190.8567, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "73", "bbox": {"l": 208.99026, "t": 277.98157000000003, "r": 214.15752, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "34", "bbox": {"l": 233.58348, "t": 277.98157000000003, "r": 238.75072999999998, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "147", "bbox": {"l": 256.88446, "t": 277.98157000000003, "r": 264.6358, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "96", "bbox": {"l": 282.76938, "t": 277.98157000000003, "r": 287.93661, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "\u8a08", "bbox": {"l": 169.61508, "t": 286.45004, "r": 174.79999, "b": 290.63141, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "945", "bbox": {"l": 183.10536, "t": 285.46667, "r": 190.8567, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "294", "bbox": {"l": 207.69832, "t": 285.46667, "r": 215.44965999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "651", "bbox": {"l": 232.29153, "t": 285.46667, "r": 240.04287999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "1122", "bbox": {"l": 255.76506, "t": 285.46667, "r": 265.75204, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "955", "bbox": {"l": 281.47742, "t": 285.46667, "r": 289.22876, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "Text is aligned to match original for ease of viewing", "bbox": {"l": 380.42731, "t": 292.30426, "r": 549.42175, "b": 298.60284, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "Weighted Average Grant Date Fair", "bbox": {"l": 459.04861, "t": 221.62415, "r": 542.00018, "b": 226.68933000000004, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "Value", "bbox": {"l": 493.82193, "t": 227.83416999999997, "r": 507.2258, "b": 232.89935000000003, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "RS", "bbox": {"l": 393.2442, "t": 236.74712999999997, "r": 400.74588, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "U", "bbox": {"l": 400.74643, "t": 236.74712999999997, "r": 404.64523, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "s", "bbox": {"l": 404.6463, "t": 236.74712999999997, "r": 407.34631, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "Shares (in millions)", "bbox": {"l": 392.09671, "t": 221.57446000000004, "r": 438.0145, "b": 226.63964999999996, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "PSUs", "bbox": {"l": 427.18323, "t": 236.74712999999997, "r": 440.98778999999996, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "RSUs", "bbox": {"l": 468.38254, "t": 236.74712999999997, "r": 482.48465000000004, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "PSUs", "bbox": {"l": 516.92578, "t": 236.74712999999997, "r": 530.73035, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Nonvested on Janua", "bbox": {"l": 306.11493, "t": 244.61084000000005, "r": 355.6532, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "ry 1", "bbox": {"l": 355.65427, "t": 244.61084000000005, "r": 364.65607, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "1.", "bbox": {"l": 396.24661, "t": 244.91327, "r": 400.75238, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "1", "bbox": {"l": 400.7529, "t": 244.91327, "r": 403.75531, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "0.3", "bbox": {"l": 429.81838999999997, "t": 244.91327, "r": 437.32708999999994, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "90.10", "bbox": {"l": 465.52859, "t": 244.91327, "r": 478.40103, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "$", "bbox": {"l": 480.97552, "t": 244.91327, "r": 483.55001999999996, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "$ 91.19", "bbox": {"l": 513.44824, "t": 244.91327, "r": 531.46967, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "Granted", "bbox": {"l": 306.11493, "t": 253.68451000000005, "r": 325.62674, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "0.", "bbox": {"l": 396.24661, "t": 253.68451000000005, "r": 400.75238, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "5", "bbox": {"l": 400.7529, "t": 253.68451000000005, "r": 403.75531, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "0.1", "bbox": {"l": 429.81838999999997, "t": 253.68451000000005, "r": 437.32708999999994, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "117.44", "bbox": {"l": 466.43579000000005, "t": 253.68451000000005, "r": 482.54831, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "122.41", "bbox": {"l": 514.29065, "t": 253.68451000000005, "r": 530.80981, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "Vested", "bbox": {"l": 306.11493, "t": 261.54822, "r": 322.62866, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "(0.", "bbox": {"l": 394.43222, "t": 261.54822, "r": 400.73563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "5", "bbox": {"l": 400.73456, "t": 261.54822, "r": 403.73697, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": ")", "bbox": {"l": 403.73804, "t": 261.54822, "r": 405.53625, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "(0.1)", "bbox": {"l": 427.7016, "t": 261.54822, "r": 438.80563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "87.08", "bbox": {"l": 468.55533, "t": 261.54822, "r": 482.07043, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "81.14", "bbox": {"l": 516.01862, "t": 261.54822, "r": 529.53375, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "Canceled or forfeited", "bbox": {"l": 306.11493, "t": 269.64148, "r": 356.24771, "b": 274.70667000000003, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "(0.", "bbox": {"l": 394.43222, "t": 270.31946000000005, "r": 400.73563, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "1", "bbox": {"l": 400.73456, "t": 270.31946000000005, "r": 403.73697, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": ")", "bbox": {"l": 403.73804, "t": 270.31946000000005, "r": 405.53625, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "-", "bbox": {"l": 431.02802, "t": 270.31946000000005, "r": 436.4280099999999, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "102.01", "bbox": {"l": 465.83099000000004, "t": 270.31946000000005, "r": 482.35013, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "92.18", "bbox": {"l": 516.01862, "t": 270.31946000000005, "r": 529.53375, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "Nonvested on December 31", "bbox": {"l": 306.11493, "t": 278.48572, "r": 373.35764, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "1.0", "bbox": {"l": 396.24661, "t": 278.48572, "r": 403.75531, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "0.3", "bbox": {"l": 429.51599, "t": 278.48572, "r": 437.02469, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "104.85 $", "bbox": {"l": 463.7142, "t": 278.48572, "r": 484.73965000000004, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "$ 104.51", "bbox": {"l": 512.99463, "t": 278.48572, "r": 534.02008, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "Figure 5:", "bbox": {"l": 50.112, "t": 320.87735, "r": 86.864021, "b": 329.78391, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "One of the benefits of TableFormer is that it is language agnostic, as an example, the left part of the illustration", "bbox": {"l": 93.917542, "t": 320.87735, "r": 545.11371, "b": 329.78391, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "demonstrates TableFormer predictions on previously unseen language (Japanese). Additionally, we see that TableFormer is", "bbox": {"l": 50.112, "t": 332.83233999999993, "r": 545.11371, "b": 341.73889, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "robust to variability in style and content, right side of the illustration shows the example of the TableFormer prediction from", "bbox": {"l": 50.112, "t": 344.78732, "r": 545.11377, "b": 353.69388, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "the FinTabNet dataset.", "bbox": {"l": 50.112, "t": 356.74332, "r": 139.79532, "b": 365.64987, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "Red - PDF cells, Green - predicted bounding boxes", "bbox": {"l": 220.26282, "t": 381.77722, "r": 342.07819, "b": 386.44281, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "Ground Truth", "bbox": {"l": 53.715248, "t": 381.77722, "r": 85.657333, "b": 386.44281, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "16", "bbox": {"l": 437.37939, "t": 400.55295, "r": 443.69870000000003, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "17", "bbox": {"l": 450.33203, "t": 400.55295, "r": 456.6513100000001, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "18", "bbox": {"l": 463.28464, "t": 400.55295, "r": 469.60394, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "19", "bbox": {"l": 476.23724000000004, "t": 400.55295, "r": 482.5565500000001, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "20", "bbox": {"l": 489.18988, "t": 400.55295, "r": 495.50916, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "21", "bbox": {"l": 502.14251999999993, "t": 400.55295, "r": 508.46178999999995, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "22", "bbox": {"l": 515.09509, "t": 400.55295, "r": 521.41443, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "23", "bbox": {"l": 385.2814, "t": 411.03836000000007, "r": 391.60071, "b": 417.35699, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "24", "bbox": {"l": 398.52341, "t": 411.03836000000007, "r": 404.84271, "b": 417.35699, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "25", "bbox": {"l": 411.47604, "t": 411.03836000000007, "r": 417.79535, "b": 417.35699, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "26", "bbox": {"l": 437.37939, "t": 411.03836000000007, "r": 443.69870000000003, "b": 417.35699, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "27", "bbox": {"l": 450.33203, "t": 411.03836000000007, "r": 456.6513100000001, "b": 417.35699, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "28", "bbox": {"l": 463.28464, "t": 411.03836000000007, "r": 469.60394, "b": 417.35699, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "30", "bbox": {"l": 385.2814, "t": 421.0697, "r": 391.60071, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "31", "bbox": {"l": 398.52341, "t": 421.0697, "r": 404.84271, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "32", "bbox": {"l": 411.47604, "t": 421.0697, "r": 417.79532, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "33", "bbox": {"l": 424.42865, "t": 421.0697, "r": 430.74796, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "34", "bbox": {"l": 437.38129, "t": 421.0697, "r": 443.70056, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "35", "bbox": {"l": 450.33389000000005, "t": 421.0697, "r": 456.65319999999997, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "36", "bbox": {"l": 463.2865, "t": 421.0697, "r": 469.6058, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "37", "bbox": {"l": 476.23914, "t": 421.0697, "r": 482.55841, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "38", "bbox": {"l": 489.1917700000001, "t": 421.0697, "r": 495.51105, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "39", "bbox": {"l": 502.14438, "t": 421.0697, "r": 508.46368, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "40", "bbox": {"l": 515.09705, "t": 421.0697, "r": 521.41632, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "41", "bbox": {"l": 528.04962, "t": 421.0697, "r": 534.3689, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "42", "bbox": {"l": 385.2814, "t": 432.04431, "r": 391.60071, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "43", "bbox": {"l": 398.52341, "t": 432.04431, "r": 404.84271, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "44", "bbox": {"l": 411.47604, "t": 432.04431, "r": 417.79532, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "45", "bbox": {"l": 424.42865, "t": 432.04431, "r": 430.74796, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "46", "bbox": {"l": 437.38129, "t": 432.04431, "r": 443.70056, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "47", "bbox": {"l": 450.33389000000005, "t": 432.04431, "r": 456.65319999999997, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "48", "bbox": {"l": 463.2865, "t": 432.04431, "r": 469.6058, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "49", "bbox": {"l": 476.23914, "t": 432.04431, "r": 482.55841, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "50", "bbox": {"l": 489.1917700000001, "t": 432.04431, "r": 495.51105, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "51", "bbox": {"l": 502.14438, "t": 432.04431, "r": 508.46368, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "52", "bbox": {"l": 515.09705, "t": 432.04431, "r": 521.41632, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "53", "bbox": {"l": 528.04962, "t": 432.04431, "r": 534.3689, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "0", "bbox": {"l": 385.2814, "t": 389.20004, "r": 388.44073, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "1", "bbox": {"l": 398.52341, "t": 389.20004, "r": 401.68274, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "2", "bbox": {"l": 411.4754, "t": 389.20004, "r": 414.63474, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "3", "bbox": {"l": 424.4274, "t": 389.20004, "r": 427.58673, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "4", "bbox": {"l": 437.37939, "t": 389.20004, "r": 440.53870000000006, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "5", "bbox": {"l": 450.33136, "t": 389.20004, "r": 453.49069000000003, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "6", "bbox": {"l": 463.28336, "t": 389.20004, "r": 466.44269, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "7", "bbox": {"l": 476.23535, "t": 389.20004, "r": 479.39468, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "8", "bbox": {"l": 489.18735, "t": 389.20004, "r": 492.34668, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "9", "bbox": {"l": 502.13933999999995, "t": 389.20004, "r": 505.29868000000005, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "10", "bbox": {"l": 515.09131, "t": 389.20004, "r": 521.41064, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "11", "bbox": {"l": 528.04364, "t": 389.20004, "r": 534.13104, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "12", "bbox": {"l": 385.2814, "t": 398.97464, "r": 391.60071, "b": 405.29327, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "13", "bbox": {"l": 398.52341, "t": 398.97464, "r": 404.84271, "b": 405.29327, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "14", "bbox": {"l": 411.47604, "t": 398.97464, "r": 417.79535, "b": 405.29327, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "15", "bbox": {"l": 424.42719, "t": 406.77463000000006, "r": 430.74648999999994, "b": 413.09326, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "29", "bbox": {"l": 502.86941999999993, "t": 410.99438, "r": 509.18871999999993, "b": 417.31302, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "Predicted Structure", "bbox": {"l": 384.35437, "t": 381.77722, "r": 430.99261, "b": 386.44281, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "Figure 6: An example of TableFormer predictions (bounding boxes and structure) from generated SynthTabNet table.", "bbox": {"l": 62.595001, "t": 458.72836, "r": 532.63049, "b": 467.63492, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "5.5.", "bbox": {"l": 50.112, "t": 491.39536, "r": 64.448898, "b": 501.24741, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "Qualitative Analysis", "bbox": {"l": 74.006828, "t": 491.39536, "r": 163.7558, "b": 501.24741, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "We showcase several visualizations for the different", "bbox": {"l": 62.067001, "t": 536.87337, "r": 286.36499, "b": 545.77992, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": "components of our network on various", "bbox": {"l": 50.112, "t": 548.82837, "r": 211.15741, "b": 557.73492, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "\u201ccomplex\u201d", "bbox": {"l": 215.10000999999997, "t": 548.91803, "r": 259.17453, "b": 557.50578, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "tables", "bbox": {"l": 263.12, "t": 548.82837, "r": 286.36273, "b": 557.73492, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": "within datasets presented in this work in Fig. 5 and Fig. 6", "bbox": {"l": 50.112, "t": 560.78337, "r": 286.36505, "b": 569.68993, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "As it is shown, our model is able to predict bounding boxes", "bbox": {"l": 50.112, "t": 572.73837, "r": 286.36508, "b": 581.6449299999999, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "for all table cells, even for the empty ones. Additionally,", "bbox": {"l": 50.112, "t": 584.69337, "r": 286.36508, "b": 593.59993, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "our post-processing techniques can extract the cell content", "bbox": {"l": 50.112, "t": 596.64937, "r": 286.36505, "b": 605.55592, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": "by matching the predicted bounding boxes to the PDF cells", "bbox": {"l": 50.112, "t": 608.60437, "r": 286.36508, "b": 617.51093, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "based on their overlap and spatial proximity. The left part", "bbox": {"l": 50.112, "t": 620.55937, "r": 286.36508, "b": 629.46593, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "of Fig. 5 demonstrates also the adaptability of our method", "bbox": {"l": 50.112, "t": 632.51437, "r": 286.36508, "b": 641.42093, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "to any language, as it can successfully extract Japanese", "bbox": {"l": 50.112, "t": 644.46938, "r": 286.36508, "b": 653.37593, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "text, although the training set contains only English content.", "bbox": {"l": 50.112, "t": 656.42438, "r": 286.36511, "b": 665.33094, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "We provide more visualizations including the intermediate", "bbox": {"l": 50.112, "t": 668.38037, "r": 286.36508, "b": 677.28694, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "steps in the supplementary material. Overall these illustra-", "bbox": {"l": 50.112, "t": 680.33537, "r": 286.36511, "b": 689.24194, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "tions justify the versatility of our method across a diverse", "bbox": {"l": 50.112, "t": 692.290375, "r": 286.36511, "b": 701.196945, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "range of table appearances and content type.", "bbox": {"l": 50.112, "t": 704.245377, "r": 226.88833999999997, "b": 713.1519470000001, "coord_origin": "TOPLEFT"}}, {"id": 201, "text": "6.", "bbox": {"l": 308.862, "t": 490.70892, "r": 316.07382, "b": 501.45663, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": "Future Work & Conclusion", "bbox": {"l": 325.68954, "t": 490.70892, "r": 460.84848, "b": 501.45663, "coord_origin": "TOPLEFT"}}, {"id": 203, "text": "In this paper, we presented TableFormer an end-to-end", "bbox": {"l": 320.81699, "t": 512.89337, "r": 545.11505, "b": 521.79993, "coord_origin": "TOPLEFT"}}, {"id": 204, "text": "transformer based approach to predict table structures and", "bbox": {"l": 308.862, "t": 524.84836, "r": 545.11517, "b": 533.75491, "coord_origin": "TOPLEFT"}}, {"id": 205, "text": "bounding boxes of cells from an image. This approach en-", "bbox": {"l": 308.862, "t": 536.80336, "r": 545.11511, "b": 545.70992, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": "ables us to recreate the table structure, and extract the cell", "bbox": {"l": 308.862, "t": 548.75836, "r": 545.11505, "b": 557.6649199999999, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": "content from PDF or OCR by using bounding boxes. Ad-", "bbox": {"l": 308.862, "t": 560.71336, "r": 545.11517, "b": 569.61992, "coord_origin": "TOPLEFT"}}, {"id": 208, "text": "ditionally, it provides the versatility required in real-world", "bbox": {"l": 308.862, "t": 572.66837, "r": 545.11511, "b": 581.57492, "coord_origin": "TOPLEFT"}}, {"id": 209, "text": "scenarios when dealing with various types of PDF docu-", "bbox": {"l": 308.862, "t": 584.62436, "r": 545.11511, "b": 593.53091, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": "ments, and languages.", "bbox": {"l": 308.862, "t": 596.57936, "r": 400.46808, "b": 605.48592, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "Furthermore, our method outper-", "bbox": {"l": 408.37839, "t": 596.57936, "r": 545.11511, "b": 605.48592, "coord_origin": "TOPLEFT"}}, {"id": 212, "text": "forms all state-of-the-arts with a wide margin. Finally, we", "bbox": {"l": 308.862, "t": 608.53436, "r": 545.11505, "b": 617.44092, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "introduce \u201cSynthTabNet\u201d a challenging synthetically gen-", "bbox": {"l": 308.862, "t": 620.48936, "r": 545.11511, "b": 629.3959199999999, "coord_origin": "TOPLEFT"}}, {"id": 214, "text": "erated dataset that reinforces missing characteristics from", "bbox": {"l": 308.862, "t": 632.4443699999999, "r": 545.11505, "b": 641.35092, "coord_origin": "TOPLEFT"}}, {"id": 215, "text": "other datasets.", "bbox": {"l": 308.862, "t": 644.39937, "r": 365.85803, "b": 653.30592, "coord_origin": "TOPLEFT"}}, {"id": 216, "text": "References", "bbox": {"l": 308.862, "t": 672.09892, "r": 364.40585, "b": 682.84664, "coord_origin": "TOPLEFT"}}, {"id": 217, "text": "[1]", "bbox": {"l": 313.345, "t": 693.9617920000001, "r": 323.80792, "b": 701.977753, "coord_origin": "TOPLEFT"}}, {"id": 218, "text": "Nicolas Carion, Francisco Massa, Gabriel Synnaeve, Nicolas", "bbox": {"l": 326.05127, "t": 693.9617920000001, "r": 545.10852, "b": 701.977753, "coord_origin": "TOPLEFT"}}, {"id": 219, "text": "Usunier, Alexander Kirillov, and Sergey Zagoruyko. End-to-", "bbox": {"l": 328.78101, "t": 704.920792, "r": 545.1134, "b": 712.936752, "coord_origin": "TOPLEFT"}}, {"id": 220, "text": "8", "bbox": {"l": 295.121, "t": 734.133366, "r": 300.10229, "b": 743.039928, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 18, "label": "caption", "bbox": {"l": 53.811783000000005, "t": 208.23328000000004, "r": 385.93451, "b": 216.10645, "coord_origin": "TOPLEFT"}, "confidence": 0.5986505746841431, "cells": [{"id": 0, "text": "b.", "bbox": {"l": 53.811783000000005, "t": 208.23328000000004, "r": 62.219952, "b": 216.10645, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Structure predicted by TableFormer, with superimposed matched PDF cell text:", "bbox": {"l": 66.424026, "t": 208.23328000000004, "r": 385.93451, "b": 216.10645, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "section_header", "bbox": {"l": 53.811783000000005, "t": 94.28112999999996, "r": 284.34592, "b": 102.15430000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.46452972292900085, "cells": [{"id": 2, "text": "Japanese language (previously unseen by TableFormer):", "bbox": {"l": 53.811783000000005, "t": 94.28112999999996, "r": 284.34592, "b": 102.15430000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "section_header", "bbox": {"l": 304.83081, "t": 94.28112999999996, "r": 431.09119, "b": 102.15430000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.4629225730895996, "cells": [{"id": 3, "text": "Example table from FinTabNet:", "bbox": {"l": 304.83081, "t": 94.28112999999996, "r": 431.09119, "b": 102.15430000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "list_item", "bbox": {"l": 53.286037, "t": 78.68756000000008, "r": 61.550289, "b": 86.56073000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.5820134282112122, "cells": [{"id": 4, "text": "a.", "bbox": {"l": 53.286037, "t": 78.68756000000008, "r": 61.550289, "b": 86.56073000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "list_item", "bbox": {"l": 65.682419, "t": 78.68756000000008, "r": 499.55563, "b": 86.56073000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.541211724281311, "cells": [{"id": 5, "text": "Red - PDF cells, Green - predicted bounding boxes, Blue - post-processed predictions matched to PDF cells", "bbox": {"l": 65.682419, "t": 78.68756000000008, "r": 499.55563, "b": 86.56073000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "table", "bbox": {"l": 53.62853240966797, "t": 218.94857788085938, "r": 298.5574951171875, "b": 292.39996337890625, "coord_origin": "TOPLEFT"}, "confidence": 0.8824009299278259, "cells": [{"id": 6, "text": "\u8ad6\u6587\u30d5\u30a1\u30a4\u30eb", "bbox": {"l": 209.93285, "t": 222.18073000000004, "r": 241.04458999999997, "b": 226.36212, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "\u53c2\u8003\u6587\u732e", "bbox": {"l": 263.76489, "t": 222.18073000000004, "r": 284.50589, "b": 226.36212, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "\u51fa\u5178", "bbox": {"l": 110.24990999999999, "t": 229.66594999999995, "r": 120.62018, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "\u30d5\u30a1\u30a4\u30eb", "bbox": {"l": 175.36609, "t": 229.66594999999995, "r": 196.1071, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "\u6570", "bbox": {"l": 196.10756, "t": 229.66594999999995, "r": 201.29247, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "\u82f1\u8a9e", "bbox": {"l": 209.62408, "t": 229.66594999999995, "r": 219.99435, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "\u65e5\u672c\u8a9e", "bbox": {"l": 229.19814, "t": 229.66594999999995, "r": 244.75377, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "\u82f1\u8a9e", "bbox": {"l": 256.1142, "t": 229.66594999999995, "r": 266.48447, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "\u65e5\u672c\u8a9e", "bbox": {"l": 278.38434, "t": 229.66594999999995, "r": 293.93997, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Association for Computational Linguistics(ACL2003)", "bbox": {"l": 55.53052099999999, "t": 236.42584, "r": 162.7131, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "65", "bbox": {"l": 184.39731, "t": 236.42584, "r": 189.56456, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "65", "bbox": {"l": 208.99026, "t": 236.42584, "r": 214.15752, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "0", "bbox": {"l": 234.87517, "t": 236.42584, "r": 237.45833000000002, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "150", "bbox": {"l": 256.88446, "t": 236.42584, "r": 264.6358, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "0", "bbox": {"l": 284.06134, "t": 236.42584, "r": 286.6445, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Computational Linguistics(COLING2002)", "bbox": {"l": 55.53052099999999, "t": 242.62048000000004, "r": 139.72253, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "140", "bbox": {"l": 183.10536, "t": 242.62048000000004, "r": 190.8567, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "140", "bbox": {"l": 207.69832, "t": 242.62048000000004, "r": 215.44965999999997, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "0", "bbox": {"l": 234.87517, "t": 242.62048000000004, "r": 237.45833000000002, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "150", "bbox": {"l": 256.88446, "t": 242.62048000000004, "r": 264.6358, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "0", "bbox": {"l": 284.06134, "t": 242.62048000000004, "r": 286.6445, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "\u96fb\u6c17\u60c5\u5831\u901a\u4fe1\u5b66\u4f1a", "bbox": {"l": 55.53052099999999, "t": 249.79845999999998, "r": 97.013, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "2003", "bbox": {"l": 92.698288, "t": 249.58942000000002, "r": 103.03371, "b": 253.94732999999997, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "\u5e74\u7dcf\u5408\u5927\u4f1a", "bbox": {"l": 103.03389, "t": 249.79845999999998, "r": 128.96027, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "150", "bbox": {"l": 183.10536, "t": 248.81506000000002, "r": 190.8567, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "8", "bbox": {"l": 210.28223, "t": 248.81506000000002, "r": 212.86539, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "142", "bbox": {"l": 232.29153, "t": 248.81506000000002, "r": 240.04287999999997, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "223", "bbox": {"l": 256.88446, "t": 248.81506000000002, "r": 264.6358, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "147", "bbox": {"l": 281.47742, "t": 248.81506000000002, "r": 289.22876, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "\u60c5\u5831\u51e6\u7406\u5b66\u4f1a\u7b2c", "bbox": {"l": 55.53052099999999, "t": 257.28369, "r": 91.827637, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "65", "bbox": {"l": 88.052673, "t": 257.07465, "r": 93.219925, "b": 261.43255999999997, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "\u56de\u5168\u56fd\u5927\u4f1a", "bbox": {"l": 93.220474, "t": 257.28369, "r": 119.14685, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "(2003)", "bbox": {"l": 116.45073999999998, "t": 257.07465, "r": 129.88177, "b": 261.43255999999997, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "177", "bbox": {"l": 183.10536, "t": 256.30029, "r": 190.8567, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "1", "bbox": {"l": 210.28223, "t": 256.30029, "r": 212.86539, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "176", "bbox": {"l": 232.29153, "t": 256.30029, "r": 240.04287999999997, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "150", "bbox": {"l": 256.88446, "t": 256.30029, "r": 264.6358, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "236", "bbox": {"l": 281.47742, "t": 256.30029, "r": 289.22876, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "\u7b2c", "bbox": {"l": 55.53052099999999, "t": 264.5108, "r": 60.715424, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "17", "bbox": {"l": 60.17654799999999, "t": 264.30175999999994, "r": 65.343796, "b": 268.65967, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "\u56de\u4eba\u5de5\u77e5\u80fd\u5b66\u4f1a\u5168\u56fd\u5927\u4f1a", "bbox": {"l": 65.344376, "t": 264.5108, "r": 122.38297000000001, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "(2003)", "bbox": {"l": 116.45073999999998, "t": 264.30175999999994, "r": 129.88177, "b": 268.65967, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "208", "bbox": {"l": 183.10536, "t": 263.52739999999994, "r": 190.8567, "b": 267.88531, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "5", "bbox": {"l": 210.28223, "t": 263.52739999999994, "r": 212.86539, "b": 267.88531, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "203", "bbox": {"l": 232.29153, "t": 263.52739999999994, "r": 240.04287999999997, "b": 267.88531, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "152", "bbox": {"l": 256.88446, "t": 263.52739999999994, "r": 264.6358, "b": 267.88531, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "244", "bbox": {"l": 281.47742, "t": 263.52739999999994, "r": 289.22876, "b": 267.88531, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "\u81ea\u7136\u8a00\u8a9e\u51e6\u7406\u7814\u7a76\u4f1a\u7b2c", "bbox": {"l": 55.53052099999999, "t": 271.73785, "r": 107.38374, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "146", "bbox": {"l": 101.99034, "t": 271.52881, "r": 109.74168000000002, "b": 275.88671999999997, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "\u301c", "bbox": {"l": 109.74204, "t": 271.73785, "r": 114.92695000000002, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "155", "bbox": {"l": 114.38793, "t": 271.52881, "r": 122.13927, "b": 275.88671999999997, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "\u56de", "bbox": {"l": 122.13963, "t": 271.73785, "r": 127.32454000000001, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "98", "bbox": {"l": 184.39731, "t": 270.75446, "r": 189.56456, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "2", "bbox": {"l": 210.28223, "t": 270.75446, "r": 212.86539, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "96", "bbox": {"l": 233.58348, "t": 270.75446, "r": 238.75072999999998, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "150", "bbox": {"l": 256.88446, "t": 270.75446, "r": 264.6358, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "232", "bbox": {"l": 281.47742, "t": 270.75446, "r": 289.22876, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "WWW", "bbox": {"l": 55.53052099999999, "t": 279.01392, "r": 68.68605, "b": 283.37183, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "\u304b\u3089\u53ce\u96c6\u3057\u305f\u8ad6\u6587", "bbox": {"l": 68.685814, "t": 279.22295999999994, "r": 110.16829999999999, "b": 283.40436, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "107", "bbox": {"l": 183.10536, "t": 277.98157000000003, "r": 190.8567, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "73", "bbox": {"l": 208.99026, "t": 277.98157000000003, "r": 214.15752, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "34", "bbox": {"l": 233.58348, "t": 277.98157000000003, "r": 238.75072999999998, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "147", "bbox": {"l": 256.88446, "t": 277.98157000000003, "r": 264.6358, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "96", "bbox": {"l": 282.76938, "t": 277.98157000000003, "r": 287.93661, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "\u8a08", "bbox": {"l": 169.61508, "t": 286.45004, "r": 174.79999, "b": 290.63141, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "945", "bbox": {"l": 183.10536, "t": 285.46667, "r": 190.8567, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "294", "bbox": {"l": 207.69832, "t": 285.46667, "r": 215.44965999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "651", "bbox": {"l": 232.29153, "t": 285.46667, "r": 240.04287999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "1122", "bbox": {"l": 255.76506, "t": 285.46667, "r": 265.75204, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "955", "bbox": {"l": 281.47742, "t": 285.46667, "r": 289.22876, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}], "children": [{"id": 32, "label": "text", "bbox": {"l": 209.93285, "t": 222.18073000000004, "r": 241.04458999999997, "b": 226.36212, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": "\u8ad6\u6587\u30d5\u30a1\u30a4\u30eb", "bbox": {"l": 209.93285, "t": 222.18073000000004, "r": 241.04458999999997, "b": 226.36212, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 263.76489, "t": 222.18073000000004, "r": 284.50589, "b": 226.36212, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "\u53c2\u8003\u6587\u732e", "bbox": {"l": 263.76489, "t": 222.18073000000004, "r": 284.50589, "b": 226.36212, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 110.24990999999999, "t": 229.66594999999995, "r": 120.62018, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "\u51fa\u5178", "bbox": {"l": 110.24990999999999, "t": 229.66594999999995, "r": 120.62018, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 175.36609, "t": 229.66594999999995, "r": 196.1071, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "\u30d5\u30a1\u30a4\u30eb", "bbox": {"l": 175.36609, "t": 229.66594999999995, "r": 196.1071, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 196.10756, "t": 229.66594999999995, "r": 201.29247, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "\u6570", "bbox": {"l": 196.10756, "t": 229.66594999999995, "r": 201.29247, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 209.62408, "t": 229.66594999999995, "r": 219.99435, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "\u82f1\u8a9e", "bbox": {"l": 209.62408, "t": 229.66594999999995, "r": 219.99435, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 229.19814, "t": 229.66594999999995, "r": 244.75377, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "\u65e5\u672c\u8a9e", "bbox": {"l": 229.19814, "t": 229.66594999999995, "r": 244.75377, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 256.1142, "t": 229.66594999999995, "r": 266.48447, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "\u82f1\u8a9e", "bbox": {"l": 256.1142, "t": 229.66594999999995, "r": 266.48447, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 278.38434, "t": 229.66594999999995, "r": 293.93997, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "\u65e5\u672c\u8a9e", "bbox": {"l": 278.38434, "t": 229.66594999999995, "r": 293.93997, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 55.53052099999999, "t": 236.42584, "r": 162.7131, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "Association for Computational Linguistics(ACL2003)", "bbox": {"l": 55.53052099999999, "t": 236.42584, "r": 162.7131, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 184.39731, "t": 236.42584, "r": 189.56456, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "65", "bbox": {"l": 184.39731, "t": 236.42584, "r": 189.56456, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 208.99026, "t": 236.42584, "r": 214.15752, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "65", "bbox": {"l": 208.99026, "t": 236.42584, "r": 214.15752, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 234.87517, "t": 236.42584, "r": 237.45833000000002, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "0", "bbox": {"l": 234.87517, "t": 236.42584, "r": 237.45833000000002, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 256.88446, "t": 236.42584, "r": 264.6358, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "150", "bbox": {"l": 256.88446, "t": 236.42584, "r": 264.6358, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 284.06134, "t": 236.42584, "r": 286.6445, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "0", "bbox": {"l": 284.06134, "t": 236.42584, "r": 286.6445, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 55.53052099999999, "t": 242.62048000000004, "r": 139.72253, "b": 246.97839, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "Computational Linguistics(COLING2002)", "bbox": {"l": 55.53052099999999, "t": 242.62048000000004, "r": 139.72253, "b": 246.97839, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 183.10536, "t": 242.62048000000004, "r": 190.8567, "b": 246.97839, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "140", "bbox": {"l": 183.10536, "t": 242.62048000000004, "r": 190.8567, "b": 246.97839, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 207.69832, "t": 242.62048000000004, "r": 215.44965999999997, "b": 246.97839, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "140", "bbox": {"l": 207.69832, "t": 242.62048000000004, "r": 215.44965999999997, "b": 246.97839, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 234.87517, "t": 242.62048000000004, "r": 237.45833000000002, "b": 246.97839, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "0", "bbox": {"l": 234.87517, "t": 242.62048000000004, "r": 237.45833000000002, "b": 246.97839, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 256.88446, "t": 242.62048000000004, "r": 264.6358, "b": 246.97839, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "150", "bbox": {"l": 256.88446, "t": 242.62048000000004, "r": 264.6358, "b": 246.97839, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 284.06134, "t": 242.62048000000004, "r": 286.6445, "b": 246.97839, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "0", "bbox": {"l": 284.06134, "t": 242.62048000000004, "r": 286.6445, "b": 246.97839, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 55.53052099999999, "t": 249.79845999999998, "r": 97.013, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "\u96fb\u6c17\u60c5\u5831\u901a\u4fe1\u5b66\u4f1a", "bbox": {"l": 55.53052099999999, "t": 249.79845999999998, "r": 97.013, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 92.698288, "t": 249.58942000000002, "r": 103.03371, "b": 253.94732999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "2003", "bbox": {"l": 92.698288, "t": 249.58942000000002, "r": 103.03371, "b": 253.94732999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 103.03389, "t": 249.79845999999998, "r": 128.96027, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "\u5e74\u7dcf\u5408\u5927\u4f1a", "bbox": {"l": 103.03389, "t": 249.79845999999998, "r": 128.96027, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 183.10536, "t": 248.81506000000002, "r": 190.8567, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "150", "bbox": {"l": 183.10536, "t": 248.81506000000002, "r": 190.8567, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 210.28223, "t": 248.81506000000002, "r": 212.86539, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "8", "bbox": {"l": 210.28223, "t": 248.81506000000002, "r": 212.86539, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 232.29153, "t": 248.81506000000002, "r": 240.04287999999997, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "142", "bbox": {"l": 232.29153, "t": 248.81506000000002, "r": 240.04287999999997, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 256.88446, "t": 248.81506000000002, "r": 264.6358, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "223", "bbox": {"l": 256.88446, "t": 248.81506000000002, "r": 264.6358, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 281.47742, "t": 248.81506000000002, "r": 289.22876, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "147", "bbox": {"l": 281.47742, "t": 248.81506000000002, "r": 289.22876, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 55.53052099999999, "t": 257.28369, "r": 91.827637, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "\u60c5\u5831\u51e6\u7406\u5b66\u4f1a\u7b2c", "bbox": {"l": 55.53052099999999, "t": 257.28369, "r": 91.827637, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 88.052673, "t": 257.07465, "r": 93.219925, "b": 261.43255999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "65", "bbox": {"l": 88.052673, "t": 257.07465, "r": 93.219925, "b": 261.43255999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 93.220474, "t": 257.28369, "r": 119.14685, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "\u56de\u5168\u56fd\u5927\u4f1a", "bbox": {"l": 93.220474, "t": 257.28369, "r": 119.14685, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 116.45073999999998, "t": 257.07465, "r": 129.88177, "b": 261.43255999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "(2003)", "bbox": {"l": 116.45073999999998, "t": 257.07465, "r": 129.88177, "b": 261.43255999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 183.10536, "t": 256.30029, "r": 190.8567, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "177", "bbox": {"l": 183.10536, "t": 256.30029, "r": 190.8567, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 210.28223, "t": 256.30029, "r": 212.86539, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "1", "bbox": {"l": 210.28223, "t": 256.30029, "r": 212.86539, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 232.29153, "t": 256.30029, "r": 240.04287999999997, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "176", "bbox": {"l": 232.29153, "t": 256.30029, "r": 240.04287999999997, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 256.88446, "t": 256.30029, "r": 264.6358, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "150", "bbox": {"l": 256.88446, "t": 256.30029, "r": 264.6358, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 281.47742, "t": 256.30029, "r": 289.22876, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "236", "bbox": {"l": 281.47742, "t": 256.30029, "r": 289.22876, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 55.53052099999999, "t": 264.5108, "r": 60.715424, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "\u7b2c", "bbox": {"l": 55.53052099999999, "t": 264.5108, "r": 60.715424, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 60.17654799999999, "t": 264.30175999999994, "r": 65.343796, "b": 268.65967, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "17", "bbox": {"l": 60.17654799999999, "t": 264.30175999999994, "r": 65.343796, "b": 268.65967, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 65.344376, "t": 264.5108, "r": 122.38297000000001, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "\u56de\u4eba\u5de5\u77e5\u80fd\u5b66\u4f1a\u5168\u56fd\u5927\u4f1a", "bbox": {"l": 65.344376, "t": 264.5108, "r": 122.38297000000001, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 116.45073999999998, "t": 264.30175999999994, "r": 129.88177, "b": 268.65967, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "(2003)", "bbox": {"l": 116.45073999999998, "t": 264.30175999999994, "r": 129.88177, "b": 268.65967, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 183.10536, "t": 263.52739999999994, "r": 190.8567, "b": 267.88531, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "208", "bbox": {"l": 183.10536, "t": 263.52739999999994, "r": 190.8567, "b": 267.88531, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 210.28223, "t": 263.52739999999994, "r": 212.86539, "b": 267.88531, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "5", "bbox": {"l": 210.28223, "t": 263.52739999999994, "r": 212.86539, "b": 267.88531, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 232.29153, "t": 263.52739999999994, "r": 240.04287999999997, "b": 267.88531, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "203", "bbox": {"l": 232.29153, "t": 263.52739999999994, "r": 240.04287999999997, "b": 267.88531, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 256.88446, "t": 263.52739999999994, "r": 264.6358, "b": 267.88531, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "152", "bbox": {"l": 256.88446, "t": 263.52739999999994, "r": 264.6358, "b": 267.88531, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 281.47742, "t": 263.52739999999994, "r": 289.22876, "b": 267.88531, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "244", "bbox": {"l": 281.47742, "t": 263.52739999999994, "r": 289.22876, "b": 267.88531, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 55.53052099999999, "t": 271.73785, "r": 107.38374, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "\u81ea\u7136\u8a00\u8a9e\u51e6\u7406\u7814\u7a76\u4f1a\u7b2c", "bbox": {"l": 55.53052099999999, "t": 271.73785, "r": 107.38374, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 101.99034, "t": 271.52881, "r": 109.74168000000002, "b": 275.88671999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "146", "bbox": {"l": 101.99034, "t": 271.52881, "r": 109.74168000000002, "b": 275.88671999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 109.74204, "t": 271.73785, "r": 114.92695000000002, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "\u301c", "bbox": {"l": 109.74204, "t": 271.73785, "r": 114.92695000000002, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 114.38793, "t": 271.52881, "r": 122.13927, "b": 275.88671999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "155", "bbox": {"l": 114.38793, "t": 271.52881, "r": 122.13927, "b": 275.88671999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 122.13963, "t": 271.73785, "r": 127.32454000000001, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "\u56de", "bbox": {"l": 122.13963, "t": 271.73785, "r": 127.32454000000001, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 184.39731, "t": 270.75446, "r": 189.56456, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "98", "bbox": {"l": 184.39731, "t": 270.75446, "r": 189.56456, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 210.28223, "t": 270.75446, "r": 212.86539, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "2", "bbox": {"l": 210.28223, "t": 270.75446, "r": 212.86539, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 233.58348, "t": 270.75446, "r": 238.75072999999998, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "96", "bbox": {"l": 233.58348, "t": 270.75446, "r": 238.75072999999998, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 256.88446, "t": 270.75446, "r": 264.6358, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "150", "bbox": {"l": 256.88446, "t": 270.75446, "r": 264.6358, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 281.47742, "t": 270.75446, "r": 289.22876, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "232", "bbox": {"l": 281.47742, "t": 270.75446, "r": 289.22876, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 55.53052099999999, "t": 279.01392, "r": 68.68605, "b": 283.37183, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "WWW", "bbox": {"l": 55.53052099999999, "t": 279.01392, "r": 68.68605, "b": 283.37183, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 68.685814, "t": 279.22295999999994, "r": 110.16829999999999, "b": 283.40436, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "\u304b\u3089\u53ce\u96c6\u3057\u305f\u8ad6\u6587", "bbox": {"l": 68.685814, "t": 279.22295999999994, "r": 110.16829999999999, "b": 283.40436, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 183.10536, "t": 277.98157000000003, "r": 190.8567, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "107", "bbox": {"l": 183.10536, "t": 277.98157000000003, "r": 190.8567, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 208.99026, "t": 277.98157000000003, "r": 214.15752, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "73", "bbox": {"l": 208.99026, "t": 277.98157000000003, "r": 214.15752, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 233.58348, "t": 277.98157000000003, "r": 238.75072999999998, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "34", "bbox": {"l": 233.58348, "t": 277.98157000000003, "r": 238.75072999999998, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 256.88446, "t": 277.98157000000003, "r": 264.6358, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "147", "bbox": {"l": 256.88446, "t": 277.98157000000003, "r": 264.6358, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 282.76938, "t": 277.98157000000003, "r": 287.93661, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "96", "bbox": {"l": 282.76938, "t": 277.98157000000003, "r": 287.93661, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 169.61508, "t": 286.45004, "r": 174.79999, "b": 290.63141, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "\u8a08", "bbox": {"l": 169.61508, "t": 286.45004, "r": 174.79999, "b": 290.63141, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 183.10536, "t": 285.46667, "r": 190.8567, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "945", "bbox": {"l": 183.10536, "t": 285.46667, "r": 190.8567, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 207.69832, "t": 285.46667, "r": 215.44965999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "294", "bbox": {"l": 207.69832, "t": 285.46667, "r": 215.44965999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 232.29153, "t": 285.46667, "r": 240.04287999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "651", "bbox": {"l": 232.29153, "t": 285.46667, "r": 240.04287999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 255.76506, "t": 285.46667, "r": 265.75204, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "1122", "bbox": {"l": 255.76506, "t": 285.46667, "r": 265.75204, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 281.47742, "t": 285.46667, "r": 289.22876, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "955", "bbox": {"l": 281.47742, "t": 285.46667, "r": 289.22876, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 16, "label": "caption", "bbox": {"l": 380.42731, "t": 292.30426, "r": 549.42175, "b": 298.60284, "coord_origin": "TOPLEFT"}, "confidence": 0.7499915957450867, "cells": [{"id": 76, "text": "Text is aligned to match original for ease of viewing", "bbox": {"l": 380.42731, "t": 292.30426, "r": 549.42175, "b": 298.60284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "table", "bbox": {"l": 304.9219970703125, "t": 218.51486206054688, "r": 550.2321166992188, "b": 287.90069580078125, "coord_origin": "TOPLEFT"}, "confidence": 0.8899767994880676, "cells": [{"id": 77, "text": "Weighted Average Grant Date Fair", "bbox": {"l": 459.04861, "t": 221.62415, "r": 542.00018, "b": 226.68933000000004, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "Value", "bbox": {"l": 493.82193, "t": 227.83416999999997, "r": 507.2258, "b": 232.89935000000003, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "RS", "bbox": {"l": 393.2442, "t": 236.74712999999997, "r": 400.74588, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "U", "bbox": {"l": 400.74643, "t": 236.74712999999997, "r": 404.64523, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "s", "bbox": {"l": 404.6463, "t": 236.74712999999997, "r": 407.34631, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "Shares (in millions)", "bbox": {"l": 392.09671, "t": 221.57446000000004, "r": 438.0145, "b": 226.63964999999996, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "PSUs", "bbox": {"l": 427.18323, "t": 236.74712999999997, "r": 440.98778999999996, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "RSUs", "bbox": {"l": 468.38254, "t": 236.74712999999997, "r": 482.48465000000004, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "PSUs", "bbox": {"l": 516.92578, "t": 236.74712999999997, "r": 530.73035, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Nonvested on Janua", "bbox": {"l": 306.11493, "t": 244.61084000000005, "r": 355.6532, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "ry 1", "bbox": {"l": 355.65427, "t": 244.61084000000005, "r": 364.65607, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "1.", "bbox": {"l": 396.24661, "t": 244.91327, "r": 400.75238, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "1", "bbox": {"l": 400.7529, "t": 244.91327, "r": 403.75531, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "0.3", "bbox": {"l": 429.81838999999997, "t": 244.91327, "r": 437.32708999999994, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "90.10", "bbox": {"l": 465.52859, "t": 244.91327, "r": 478.40103, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "$", "bbox": {"l": 480.97552, "t": 244.91327, "r": 483.55001999999996, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "$ 91.19", "bbox": {"l": 513.44824, "t": 244.91327, "r": 531.46967, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "Granted", "bbox": {"l": 306.11493, "t": 253.68451000000005, "r": 325.62674, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "0.", "bbox": {"l": 396.24661, "t": 253.68451000000005, "r": 400.75238, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "5", "bbox": {"l": 400.7529, "t": 253.68451000000005, "r": 403.75531, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "0.1", "bbox": {"l": 429.81838999999997, "t": 253.68451000000005, "r": 437.32708999999994, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "117.44", "bbox": {"l": 466.43579000000005, "t": 253.68451000000005, "r": 482.54831, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "122.41", "bbox": {"l": 514.29065, "t": 253.68451000000005, "r": 530.80981, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "Vested", "bbox": {"l": 306.11493, "t": 261.54822, "r": 322.62866, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "(0.", "bbox": {"l": 394.43222, "t": 261.54822, "r": 400.73563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "5", "bbox": {"l": 400.73456, "t": 261.54822, "r": 403.73697, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": ")", "bbox": {"l": 403.73804, "t": 261.54822, "r": 405.53625, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "(0.1)", "bbox": {"l": 427.7016, "t": 261.54822, "r": 438.80563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "87.08", "bbox": {"l": 468.55533, "t": 261.54822, "r": 482.07043, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "81.14", "bbox": {"l": 516.01862, "t": 261.54822, "r": 529.53375, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "Canceled or forfeited", "bbox": {"l": 306.11493, "t": 269.64148, "r": 356.24771, "b": 274.70667000000003, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "(0.", "bbox": {"l": 394.43222, "t": 270.31946000000005, "r": 400.73563, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "1", "bbox": {"l": 400.73456, "t": 270.31946000000005, "r": 403.73697, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": ")", "bbox": {"l": 403.73804, "t": 270.31946000000005, "r": 405.53625, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "-", "bbox": {"l": 431.02802, "t": 270.31946000000005, "r": 436.4280099999999, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "102.01", "bbox": {"l": 465.83099000000004, "t": 270.31946000000005, "r": 482.35013, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "92.18", "bbox": {"l": 516.01862, "t": 270.31946000000005, "r": 529.53375, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "Nonvested on December 31", "bbox": {"l": 306.11493, "t": 278.48572, "r": 373.35764, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "1.0", "bbox": {"l": 396.24661, "t": 278.48572, "r": 403.75531, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "0.3", "bbox": {"l": 429.51599, "t": 278.48572, "r": 437.02469, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "104.85 $", "bbox": {"l": 463.7142, "t": 278.48572, "r": 484.73965000000004, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "$ 104.51", "bbox": {"l": 512.99463, "t": 278.48572, "r": 534.02008, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}], "children": [{"id": 102, "label": "text", "bbox": {"l": 459.04861, "t": 221.62415, "r": 542.00018, "b": 226.68933000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "Weighted Average Grant Date Fair", "bbox": {"l": 459.04861, "t": 221.62415, "r": 542.00018, "b": 226.68933000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 493.82193, "t": 227.83416999999997, "r": 507.2258, "b": 232.89935000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "Value", "bbox": {"l": 493.82193, "t": 227.83416999999997, "r": 507.2258, "b": 232.89935000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 393.2442, "t": 236.74712999999997, "r": 400.74588, "b": 241.81232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "RS", "bbox": {"l": 393.2442, "t": 236.74712999999997, "r": 400.74588, "b": 241.81232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 400.74643, "t": 236.74712999999997, "r": 404.64523, "b": 241.81232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "U", "bbox": {"l": 400.74643, "t": 236.74712999999997, "r": 404.64523, "b": 241.81232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 404.6463, "t": 236.74712999999997, "r": 407.34631, "b": 241.81232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "s", "bbox": {"l": 404.6463, "t": 236.74712999999997, "r": 407.34631, "b": 241.81232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 392.09671, "t": 221.57446000000004, "r": 438.0145, "b": 226.63964999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "Shares (in millions)", "bbox": {"l": 392.09671, "t": 221.57446000000004, "r": 438.0145, "b": 226.63964999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 427.18323, "t": 236.74712999999997, "r": 440.98778999999996, "b": 241.81232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "PSUs", "bbox": {"l": 427.18323, "t": 236.74712999999997, "r": 440.98778999999996, "b": 241.81232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 468.38254, "t": 236.74712999999997, "r": 482.48465000000004, "b": 241.81232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "RSUs", "bbox": {"l": 468.38254, "t": 236.74712999999997, "r": 482.48465000000004, "b": 241.81232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 516.92578, "t": 236.74712999999997, "r": 530.73035, "b": 241.81232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "PSUs", "bbox": {"l": 516.92578, "t": 236.74712999999997, "r": 530.73035, "b": 241.81232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 306.11493, "t": 244.61084000000005, "r": 355.6532, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "Nonvested on Janua", "bbox": {"l": 306.11493, "t": 244.61084000000005, "r": 355.6532, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 355.65427, "t": 244.61084000000005, "r": 364.65607, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "ry 1", "bbox": {"l": 355.65427, "t": 244.61084000000005, "r": 364.65607, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 396.24661, "t": 244.91327, "r": 400.75238, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "1.", "bbox": {"l": 396.24661, "t": 244.91327, "r": 400.75238, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 114, "label": "text", "bbox": {"l": 400.7529, "t": 244.91327, "r": 403.75531, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "1", "bbox": {"l": 400.7529, "t": 244.91327, "r": 403.75531, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 115, "label": "text", "bbox": {"l": 429.81838999999997, "t": 244.91327, "r": 437.32708999999994, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "0.3", "bbox": {"l": 429.81838999999997, "t": 244.91327, "r": 437.32708999999994, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 116, "label": "text", "bbox": {"l": 465.52859, "t": 244.91327, "r": 478.40103, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "90.10", "bbox": {"l": 465.52859, "t": 244.91327, "r": 478.40103, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 117, "label": "text", "bbox": {"l": 480.97552, "t": 244.91327, "r": 483.55001999999996, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "$", "bbox": {"l": 480.97552, "t": 244.91327, "r": 483.55001999999996, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 118, "label": "text", "bbox": {"l": 513.44824, "t": 244.91327, "r": 531.46967, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "$ 91.19", "bbox": {"l": 513.44824, "t": 244.91327, "r": 531.46967, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 119, "label": "text", "bbox": {"l": 306.11493, "t": 253.68451000000005, "r": 325.62674, "b": 258.74969, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "Granted", "bbox": {"l": 306.11493, "t": 253.68451000000005, "r": 325.62674, "b": 258.74969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 120, "label": "text", "bbox": {"l": 396.24661, "t": 253.68451000000005, "r": 400.75238, "b": 258.74969, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "0.", "bbox": {"l": 396.24661, "t": 253.68451000000005, "r": 400.75238, "b": 258.74969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 121, "label": "text", "bbox": {"l": 400.7529, "t": 253.68451000000005, "r": 403.75531, "b": 258.74969, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "5", "bbox": {"l": 400.7529, "t": 253.68451000000005, "r": 403.75531, "b": 258.74969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 122, "label": "text", "bbox": {"l": 429.81838999999997, "t": 253.68451000000005, "r": 437.32708999999994, "b": 258.74969, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "0.1", "bbox": {"l": 429.81838999999997, "t": 253.68451000000005, "r": 437.32708999999994, "b": 258.74969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 123, "label": "text", "bbox": {"l": 466.43579000000005, "t": 253.68451000000005, "r": 482.54831, "b": 258.74969, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "117.44", "bbox": {"l": 466.43579000000005, "t": 253.68451000000005, "r": 482.54831, "b": 258.74969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 124, "label": "text", "bbox": {"l": 514.29065, "t": 253.68451000000005, "r": 530.80981, "b": 258.74969, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "122.41", "bbox": {"l": 514.29065, "t": 253.68451000000005, "r": 530.80981, "b": 258.74969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 125, "label": "text", "bbox": {"l": 306.11493, "t": 261.54822, "r": 322.62866, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "Vested", "bbox": {"l": 306.11493, "t": 261.54822, "r": 322.62866, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 126, "label": "text", "bbox": {"l": 394.43222, "t": 261.54822, "r": 400.73563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "(0.", "bbox": {"l": 394.43222, "t": 261.54822, "r": 400.73563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 127, "label": "text", "bbox": {"l": 400.73456, "t": 261.54822, "r": 403.73697, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "5", "bbox": {"l": 400.73456, "t": 261.54822, "r": 403.73697, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 128, "label": "text", "bbox": {"l": 403.73804, "t": 261.54822, "r": 405.53625, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": ")", "bbox": {"l": 403.73804, "t": 261.54822, "r": 405.53625, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 129, "label": "text", "bbox": {"l": 427.7016, "t": 261.54822, "r": 438.80563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "(0.1)", "bbox": {"l": 427.7016, "t": 261.54822, "r": 438.80563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 130, "label": "text", "bbox": {"l": 468.55533, "t": 261.54822, "r": 482.07043, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "87.08", "bbox": {"l": 468.55533, "t": 261.54822, "r": 482.07043, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 131, "label": "text", "bbox": {"l": 516.01862, "t": 261.54822, "r": 529.53375, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": "81.14", "bbox": {"l": 516.01862, "t": 261.54822, "r": 529.53375, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 132, "label": "text", "bbox": {"l": 306.11493, "t": 269.64148, "r": 356.24771, "b": 274.70667000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 107, "text": "Canceled or forfeited", "bbox": {"l": 306.11493, "t": 269.64148, "r": 356.24771, "b": 274.70667000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 133, "label": "text", "bbox": {"l": 394.43222, "t": 270.31946000000005, "r": 400.73563, "b": 275.38464, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 108, "text": "(0.", "bbox": {"l": 394.43222, "t": 270.31946000000005, "r": 400.73563, "b": 275.38464, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 134, "label": "text", "bbox": {"l": 400.73456, "t": 270.31946000000005, "r": 403.73697, "b": 275.38464, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 109, "text": "1", "bbox": {"l": 400.73456, "t": 270.31946000000005, "r": 403.73697, "b": 275.38464, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 135, "label": "text", "bbox": {"l": 403.73804, "t": 270.31946000000005, "r": 405.53625, "b": 275.38464, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 110, "text": ")", "bbox": {"l": 403.73804, "t": 270.31946000000005, "r": 405.53625, "b": 275.38464, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 136, "label": "text", "bbox": {"l": 431.02802, "t": 270.31946000000005, "r": 436.4280099999999, "b": 275.38464, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 111, "text": "-", "bbox": {"l": 431.02802, "t": 270.31946000000005, "r": 436.4280099999999, "b": 275.38464, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 137, "label": "text", "bbox": {"l": 465.83099000000004, "t": 270.31946000000005, "r": 482.35013, "b": 275.38464, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 112, "text": "102.01", "bbox": {"l": 465.83099000000004, "t": 270.31946000000005, "r": 482.35013, "b": 275.38464, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 138, "label": "text", "bbox": {"l": 516.01862, "t": 270.31946000000005, "r": 529.53375, "b": 275.38464, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 113, "text": "92.18", "bbox": {"l": 516.01862, "t": 270.31946000000005, "r": 529.53375, "b": 275.38464, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 139, "label": "text", "bbox": {"l": 306.11493, "t": 278.48572, "r": 373.35764, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 114, "text": "Nonvested on December 31", "bbox": {"l": 306.11493, "t": 278.48572, "r": 373.35764, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 140, "label": "text", "bbox": {"l": 396.24661, "t": 278.48572, "r": 403.75531, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 115, "text": "1.0", "bbox": {"l": 396.24661, "t": 278.48572, "r": 403.75531, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 141, "label": "text", "bbox": {"l": 429.51599, "t": 278.48572, "r": 437.02469, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 116, "text": "0.3", "bbox": {"l": 429.51599, "t": 278.48572, "r": 437.02469, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 142, "label": "text", "bbox": {"l": 463.7142, "t": 278.48572, "r": 484.73965000000004, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 117, "text": "104.85 $", "bbox": {"l": 463.7142, "t": 278.48572, "r": 484.73965000000004, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 143, "label": "text", "bbox": {"l": 512.99463, "t": 278.48572, "r": 534.02008, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 118, "text": "$ 104.51", "bbox": {"l": 512.99463, "t": 278.48572, "r": 534.02008, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 6, "label": "caption", "bbox": {"l": 50.112, "t": 320.87735, "r": 545.11377, "b": 365.64987, "coord_origin": "TOPLEFT"}, "confidence": 0.9140303134918213, "cells": [{"id": 119, "text": "Figure 5:", "bbox": {"l": 50.112, "t": 320.87735, "r": 86.864021, "b": 329.78391, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "One of the benefits of TableFormer is that it is language agnostic, as an example, the left part of the illustration", "bbox": {"l": 93.917542, "t": 320.87735, "r": 545.11371, "b": 329.78391, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "demonstrates TableFormer predictions on previously unseen language (Japanese). Additionally, we see that TableFormer is", "bbox": {"l": 50.112, "t": 332.83233999999993, "r": 545.11371, "b": 341.73889, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "robust to variability in style and content, right side of the illustration shows the example of the TableFormer prediction from", "bbox": {"l": 50.112, "t": 344.78732, "r": 545.11377, "b": 353.69388, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "the FinTabNet dataset.", "bbox": {"l": 50.112, "t": 356.74332, "r": 139.79532, "b": 365.64987, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "picture", "bbox": {"l": 216.76925659179688, "t": 380.4906311035156, "r": 375.7829284667969, "b": 443.34698486328125, "coord_origin": "TOPLEFT"}, "confidence": 0.805853009223938, "cells": [{"id": 124, "text": "Red - PDF cells, Green - predicted bounding boxes", "bbox": {"l": 220.26282, "t": 381.77722, "r": 342.07819, "b": 386.44281, "coord_origin": "TOPLEFT"}}], "children": [{"id": 144, "label": "text", "bbox": {"l": 220.26282, "t": 381.77722, "r": 342.07819, "b": 386.44281, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 124, "text": "Red - PDF cells, Green - predicted bounding boxes", "bbox": {"l": 220.26282, "t": 381.77722, "r": 342.07819, "b": 386.44281, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 11, "label": "picture", "bbox": {"l": 51.736167907714844, "t": 380.48065185546875, "r": 211.83778381347656, "b": 443.6580810546875, "coord_origin": "TOPLEFT"}, "confidence": 0.8308426737785339, "cells": [{"id": 125, "text": "Ground Truth", "bbox": {"l": 53.715248, "t": 381.77722, "r": 85.657333, "b": 386.44281, "coord_origin": "TOPLEFT"}}], "children": [{"id": 145, "label": "text", "bbox": {"l": 53.715248, "t": 381.77722, "r": 85.657333, "b": 386.44281, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 125, "text": "Ground Truth", "bbox": {"l": 53.715248, "t": 381.77722, "r": 85.657333, "b": 386.44281, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 13, "label": "picture", "bbox": {"l": 383.1364440917969, "t": 381.2313232421875, "r": 542.1132202148438, "b": 442.7749328613281, "coord_origin": "TOPLEFT"}, "confidence": 0.7881615161895752, "cells": [{"id": 126, "text": "16", "bbox": {"l": 437.37939, "t": 400.55295, "r": 443.69870000000003, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "17", "bbox": {"l": 450.33203, "t": 400.55295, "r": 456.6513100000001, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "18", "bbox": {"l": 463.28464, "t": 400.55295, "r": 469.60394, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "19", "bbox": {"l": 476.23724000000004, "t": 400.55295, "r": 482.5565500000001, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "20", "bbox": {"l": 489.18988, "t": 400.55295, "r": 495.50916, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "21", "bbox": {"l": 502.14251999999993, "t": 400.55295, "r": 508.46178999999995, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "22", "bbox": {"l": 515.09509, "t": 400.55295, "r": 521.41443, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "23", "bbox": {"l": 385.2814, "t": 411.03836000000007, "r": 391.60071, "b": 417.35699, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "24", "bbox": {"l": 398.52341, "t": 411.03836000000007, "r": 404.84271, "b": 417.35699, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "25", "bbox": {"l": 411.47604, "t": 411.03836000000007, "r": 417.79535, "b": 417.35699, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "26", "bbox": {"l": 437.37939, "t": 411.03836000000007, "r": 443.69870000000003, "b": 417.35699, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "27", "bbox": {"l": 450.33203, "t": 411.03836000000007, "r": 456.6513100000001, "b": 417.35699, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "28", "bbox": {"l": 463.28464, "t": 411.03836000000007, "r": 469.60394, "b": 417.35699, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "30", "bbox": {"l": 385.2814, "t": 421.0697, "r": 391.60071, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "31", "bbox": {"l": 398.52341, "t": 421.0697, "r": 404.84271, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "32", "bbox": {"l": 411.47604, "t": 421.0697, "r": 417.79532, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "33", "bbox": {"l": 424.42865, "t": 421.0697, "r": 430.74796, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "34", "bbox": {"l": 437.38129, "t": 421.0697, "r": 443.70056, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "35", "bbox": {"l": 450.33389000000005, "t": 421.0697, "r": 456.65319999999997, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "36", "bbox": {"l": 463.2865, "t": 421.0697, "r": 469.6058, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "37", "bbox": {"l": 476.23914, "t": 421.0697, "r": 482.55841, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "38", "bbox": {"l": 489.1917700000001, "t": 421.0697, "r": 495.51105, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "39", "bbox": {"l": 502.14438, "t": 421.0697, "r": 508.46368, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "40", "bbox": {"l": 515.09705, "t": 421.0697, "r": 521.41632, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "41", "bbox": {"l": 528.04962, "t": 421.0697, "r": 534.3689, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "42", "bbox": {"l": 385.2814, "t": 432.04431, "r": 391.60071, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "43", "bbox": {"l": 398.52341, "t": 432.04431, "r": 404.84271, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "44", "bbox": {"l": 411.47604, "t": 432.04431, "r": 417.79532, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "45", "bbox": {"l": 424.42865, "t": 432.04431, "r": 430.74796, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "46", "bbox": {"l": 437.38129, "t": 432.04431, "r": 443.70056, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "47", "bbox": {"l": 450.33389000000005, "t": 432.04431, "r": 456.65319999999997, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "48", "bbox": {"l": 463.2865, "t": 432.04431, "r": 469.6058, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "49", "bbox": {"l": 476.23914, "t": 432.04431, "r": 482.55841, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "50", "bbox": {"l": 489.1917700000001, "t": 432.04431, "r": 495.51105, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "51", "bbox": {"l": 502.14438, "t": 432.04431, "r": 508.46368, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "52", "bbox": {"l": 515.09705, "t": 432.04431, "r": 521.41632, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "53", "bbox": {"l": 528.04962, "t": 432.04431, "r": 534.3689, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "0", "bbox": {"l": 385.2814, "t": 389.20004, "r": 388.44073, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "1", "bbox": {"l": 398.52341, "t": 389.20004, "r": 401.68274, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "2", "bbox": {"l": 411.4754, "t": 389.20004, "r": 414.63474, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "3", "bbox": {"l": 424.4274, "t": 389.20004, "r": 427.58673, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "4", "bbox": {"l": 437.37939, "t": 389.20004, "r": 440.53870000000006, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "5", "bbox": {"l": 450.33136, "t": 389.20004, "r": 453.49069000000003, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "6", "bbox": {"l": 463.28336, "t": 389.20004, "r": 466.44269, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "7", "bbox": {"l": 476.23535, "t": 389.20004, "r": 479.39468, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "8", "bbox": {"l": 489.18735, "t": 389.20004, "r": 492.34668, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "9", "bbox": {"l": 502.13933999999995, "t": 389.20004, "r": 505.29868000000005, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "10", "bbox": {"l": 515.09131, "t": 389.20004, "r": 521.41064, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "11", "bbox": {"l": 528.04364, "t": 389.20004, "r": 534.13104, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "12", "bbox": {"l": 385.2814, "t": 398.97464, "r": 391.60071, "b": 405.29327, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "13", "bbox": {"l": 398.52341, "t": 398.97464, "r": 404.84271, "b": 405.29327, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "14", "bbox": {"l": 411.47604, "t": 398.97464, "r": 417.79535, "b": 405.29327, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "15", "bbox": {"l": 424.42719, "t": 406.77463000000006, "r": 430.74648999999994, "b": 413.09326, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "29", "bbox": {"l": 502.86941999999993, "t": 410.99438, "r": 509.18871999999993, "b": 417.31302, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "Predicted Structure", "bbox": {"l": 384.35437, "t": 381.77722, "r": 430.99261, "b": 386.44281, "coord_origin": "TOPLEFT"}}], "children": [{"id": 146, "label": "text", "bbox": {"l": 437.37939, "t": 400.55295, "r": 443.69870000000003, "b": 406.87158, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 126, "text": "16", "bbox": {"l": 437.37939, "t": 400.55295, "r": 443.69870000000003, "b": 406.87158, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 147, "label": "text", "bbox": {"l": 450.33203, "t": 400.55295, "r": 456.6513100000001, "b": 406.87158, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 127, "text": "17", "bbox": {"l": 450.33203, "t": 400.55295, "r": 456.6513100000001, "b": 406.87158, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 148, "label": "text", "bbox": {"l": 463.28464, "t": 400.55295, "r": 469.60394, "b": 406.87158, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 128, "text": "18", "bbox": {"l": 463.28464, "t": 400.55295, "r": 469.60394, "b": 406.87158, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 149, "label": "text", "bbox": {"l": 476.23724000000004, "t": 400.55295, "r": 482.5565500000001, "b": 406.87158, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 129, "text": "19", "bbox": {"l": 476.23724000000004, "t": 400.55295, "r": 482.5565500000001, "b": 406.87158, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 150, "label": "text", "bbox": {"l": 489.18988, "t": 400.55295, "r": 495.50916, "b": 406.87158, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 130, "text": "20", "bbox": {"l": 489.18988, "t": 400.55295, "r": 495.50916, "b": 406.87158, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 151, "label": "text", "bbox": {"l": 502.14251999999993, "t": 400.55295, "r": 508.46178999999995, "b": 406.87158, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 131, "text": "21", "bbox": {"l": 502.14251999999993, "t": 400.55295, "r": 508.46178999999995, "b": 406.87158, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 152, "label": "text", "bbox": {"l": 515.09509, "t": 400.55295, "r": 521.41443, "b": 406.87158, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 132, "text": "22", "bbox": {"l": 515.09509, "t": 400.55295, "r": 521.41443, "b": 406.87158, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 153, "label": "text", "bbox": {"l": 385.2814, "t": 411.03836000000007, "r": 391.60071, "b": 417.35699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 133, "text": "23", "bbox": {"l": 385.2814, "t": 411.03836000000007, "r": 391.60071, "b": 417.35699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 154, "label": "text", "bbox": {"l": 398.52341, "t": 411.03836000000007, "r": 404.84271, "b": 417.35699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 134, "text": "24", "bbox": {"l": 398.52341, "t": 411.03836000000007, "r": 404.84271, "b": 417.35699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 155, "label": "text", "bbox": {"l": 411.47604, "t": 411.03836000000007, "r": 417.79535, "b": 417.35699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 135, "text": "25", "bbox": {"l": 411.47604, "t": 411.03836000000007, "r": 417.79535, "b": 417.35699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 156, "label": "text", "bbox": {"l": 437.37939, "t": 411.03836000000007, "r": 443.69870000000003, "b": 417.35699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 136, "text": "26", "bbox": {"l": 437.37939, "t": 411.03836000000007, "r": 443.69870000000003, "b": 417.35699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 157, "label": "text", "bbox": {"l": 450.33203, "t": 411.03836000000007, "r": 456.6513100000001, "b": 417.35699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 137, "text": "27", "bbox": {"l": 450.33203, "t": 411.03836000000007, "r": 456.6513100000001, "b": 417.35699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 158, "label": "text", "bbox": {"l": 463.28464, "t": 411.03836000000007, "r": 469.60394, "b": 417.35699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 138, "text": "28", "bbox": {"l": 463.28464, "t": 411.03836000000007, "r": 469.60394, "b": 417.35699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 159, "label": "text", "bbox": {"l": 385.2814, "t": 421.0697, "r": 391.60071, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 139, "text": "30", "bbox": {"l": 385.2814, "t": 421.0697, "r": 391.60071, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 160, "label": "text", "bbox": {"l": 398.52341, "t": 421.0697, "r": 404.84271, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 140, "text": "31", "bbox": {"l": 398.52341, "t": 421.0697, "r": 404.84271, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 161, "label": "text", "bbox": {"l": 411.47604, "t": 421.0697, "r": 417.79532, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 141, "text": "32", "bbox": {"l": 411.47604, "t": 421.0697, "r": 417.79532, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 162, "label": "text", "bbox": {"l": 424.42865, "t": 421.0697, "r": 430.74796, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 142, "text": "33", "bbox": {"l": 424.42865, "t": 421.0697, "r": 430.74796, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 163, "label": "text", "bbox": {"l": 437.38129, "t": 421.0697, "r": 443.70056, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 143, "text": "34", "bbox": {"l": 437.38129, "t": 421.0697, "r": 443.70056, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 164, "label": "text", "bbox": {"l": 450.33389000000005, "t": 421.0697, "r": 456.65319999999997, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 144, "text": "35", "bbox": {"l": 450.33389000000005, "t": 421.0697, "r": 456.65319999999997, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 165, "label": "text", "bbox": {"l": 463.2865, "t": 421.0697, "r": 469.6058, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 145, "text": "36", "bbox": {"l": 463.2865, "t": 421.0697, "r": 469.6058, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 166, "label": "text", "bbox": {"l": 476.23914, "t": 421.0697, "r": 482.55841, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 146, "text": "37", "bbox": {"l": 476.23914, "t": 421.0697, "r": 482.55841, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 167, "label": "text", "bbox": {"l": 489.1917700000001, "t": 421.0697, "r": 495.51105, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 147, "text": "38", "bbox": {"l": 489.1917700000001, "t": 421.0697, "r": 495.51105, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 168, "label": "text", "bbox": {"l": 502.14438, "t": 421.0697, "r": 508.46368, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 148, "text": "39", "bbox": {"l": 502.14438, "t": 421.0697, "r": 508.46368, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 169, "label": "text", "bbox": {"l": 515.09705, "t": 421.0697, "r": 521.41632, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 149, "text": "40", "bbox": {"l": 515.09705, "t": 421.0697, "r": 521.41632, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 170, "label": "text", "bbox": {"l": 528.04962, "t": 421.0697, "r": 534.3689, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 150, "text": "41", "bbox": {"l": 528.04962, "t": 421.0697, "r": 534.3689, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 171, "label": "text", "bbox": {"l": 385.2814, "t": 432.04431, "r": 391.60071, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 151, "text": "42", "bbox": {"l": 385.2814, "t": 432.04431, "r": 391.60071, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 172, "label": "text", "bbox": {"l": 398.52341, "t": 432.04431, "r": 404.84271, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 152, "text": "43", "bbox": {"l": 398.52341, "t": 432.04431, "r": 404.84271, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 173, "label": "text", "bbox": {"l": 411.47604, "t": 432.04431, "r": 417.79532, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 153, "text": "44", "bbox": {"l": 411.47604, "t": 432.04431, "r": 417.79532, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 174, "label": "text", "bbox": {"l": 424.42865, "t": 432.04431, "r": 430.74796, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 154, "text": "45", "bbox": {"l": 424.42865, "t": 432.04431, "r": 430.74796, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 175, "label": "text", "bbox": {"l": 437.38129, "t": 432.04431, "r": 443.70056, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 155, "text": "46", "bbox": {"l": 437.38129, "t": 432.04431, "r": 443.70056, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 176, "label": "text", "bbox": {"l": 450.33389000000005, "t": 432.04431, "r": 456.65319999999997, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 156, "text": "47", "bbox": {"l": 450.33389000000005, "t": 432.04431, "r": 456.65319999999997, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 177, "label": "text", "bbox": {"l": 463.2865, "t": 432.04431, "r": 469.6058, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 157, "text": "48", "bbox": {"l": 463.2865, "t": 432.04431, "r": 469.6058, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 178, "label": "text", "bbox": {"l": 476.23914, "t": 432.04431, "r": 482.55841, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 158, "text": "49", "bbox": {"l": 476.23914, "t": 432.04431, "r": 482.55841, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 179, "label": "text", "bbox": {"l": 489.1917700000001, "t": 432.04431, "r": 495.51105, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 159, "text": "50", "bbox": {"l": 489.1917700000001, "t": 432.04431, "r": 495.51105, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 180, "label": "text", "bbox": {"l": 502.14438, "t": 432.04431, "r": 508.46368, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 160, "text": "51", "bbox": {"l": 502.14438, "t": 432.04431, "r": 508.46368, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 181, "label": "text", "bbox": {"l": 515.09705, "t": 432.04431, "r": 521.41632, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 161, "text": "52", "bbox": {"l": 515.09705, "t": 432.04431, "r": 521.41632, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 182, "label": "text", "bbox": {"l": 528.04962, "t": 432.04431, "r": 534.3689, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 162, "text": "53", "bbox": {"l": 528.04962, "t": 432.04431, "r": 534.3689, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 183, "label": "text", "bbox": {"l": 385.2814, "t": 389.20004, "r": 388.44073, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 163, "text": "0", "bbox": {"l": 385.2814, "t": 389.20004, "r": 388.44073, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 184, "label": "text", "bbox": {"l": 398.52341, "t": 389.20004, "r": 401.68274, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 164, "text": "1", "bbox": {"l": 398.52341, "t": 389.20004, "r": 401.68274, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 185, "label": "text", "bbox": {"l": 411.4754, "t": 389.20004, "r": 414.63474, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 165, "text": "2", "bbox": {"l": 411.4754, "t": 389.20004, "r": 414.63474, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 186, "label": "text", "bbox": {"l": 424.4274, "t": 389.20004, "r": 427.58673, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 166, "text": "3", "bbox": {"l": 424.4274, "t": 389.20004, "r": 427.58673, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 187, "label": "text", "bbox": {"l": 437.37939, "t": 389.20004, "r": 440.53870000000006, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 167, "text": "4", "bbox": {"l": 437.37939, "t": 389.20004, "r": 440.53870000000006, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 188, "label": "text", "bbox": {"l": 450.33136, "t": 389.20004, "r": 453.49069000000003, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 168, "text": "5", "bbox": {"l": 450.33136, "t": 389.20004, "r": 453.49069000000003, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 189, "label": "text", "bbox": {"l": 463.28336, "t": 389.20004, "r": 466.44269, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 169, "text": "6", "bbox": {"l": 463.28336, "t": 389.20004, "r": 466.44269, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 190, "label": "text", "bbox": {"l": 476.23535, "t": 389.20004, "r": 479.39468, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 170, "text": "7", "bbox": {"l": 476.23535, "t": 389.20004, "r": 479.39468, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 191, "label": "text", "bbox": {"l": 489.18735, "t": 389.20004, "r": 492.34668, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 171, "text": "8", "bbox": {"l": 489.18735, "t": 389.20004, "r": 492.34668, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 192, "label": "text", "bbox": {"l": 502.13933999999995, "t": 389.20004, "r": 505.29868000000005, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 172, "text": "9", "bbox": {"l": 502.13933999999995, "t": 389.20004, "r": 505.29868000000005, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 193, "label": "text", "bbox": {"l": 515.09131, "t": 389.20004, "r": 521.41064, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 173, "text": "10", "bbox": {"l": 515.09131, "t": 389.20004, "r": 521.41064, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 194, "label": "text", "bbox": {"l": 528.04364, "t": 389.20004, "r": 534.13104, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 174, "text": "11", "bbox": {"l": 528.04364, "t": 389.20004, "r": 534.13104, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 195, "label": "text", "bbox": {"l": 385.2814, "t": 398.97464, "r": 391.60071, "b": 405.29327, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 175, "text": "12", "bbox": {"l": 385.2814, "t": 398.97464, "r": 391.60071, "b": 405.29327, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 196, "label": "text", "bbox": {"l": 398.52341, "t": 398.97464, "r": 404.84271, "b": 405.29327, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 176, "text": "13", "bbox": {"l": 398.52341, "t": 398.97464, "r": 404.84271, "b": 405.29327, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 197, "label": "text", "bbox": {"l": 411.47604, "t": 398.97464, "r": 417.79535, "b": 405.29327, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 177, "text": "14", "bbox": {"l": 411.47604, "t": 398.97464, "r": 417.79535, "b": 405.29327, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 198, "label": "text", "bbox": {"l": 424.42719, "t": 406.77463000000006, "r": 430.74648999999994, "b": 413.09326, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 178, "text": "15", "bbox": {"l": 424.42719, "t": 406.77463000000006, "r": 430.74648999999994, "b": 413.09326, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 199, "label": "text", "bbox": {"l": 502.86941999999993, "t": 410.99438, "r": 509.18871999999993, "b": 417.31302, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 179, "text": "29", "bbox": {"l": 502.86941999999993, "t": 410.99438, "r": 509.18871999999993, "b": 417.31302, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 200, "label": "text", "bbox": {"l": 384.35437, "t": 381.77722, "r": 430.99261, "b": 386.44281, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 180, "text": "Predicted Structure", "bbox": {"l": 384.35437, "t": 381.77722, "r": 430.99261, "b": 386.44281, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 5, "label": "caption", "bbox": {"l": 62.595001, "t": 458.72836, "r": 532.63049, "b": 467.63492, "coord_origin": "TOPLEFT"}, "confidence": 0.9153602719306946, "cells": [{"id": 181, "text": "Figure 6: An example of TableFormer predictions (bounding boxes and structure) from generated SynthTabNet table.", "bbox": {"l": 62.595001, "t": 458.72836, "r": 532.63049, "b": 467.63492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "section_header", "bbox": {"l": 50.112, "t": 491.39536, "r": 163.7558, "b": 501.24741, "coord_origin": "TOPLEFT"}, "confidence": 0.9561247229576111, "cells": [{"id": 182, "text": "5.5.", "bbox": {"l": 50.112, "t": 491.39536, "r": 64.448898, "b": 501.24741, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "Qualitative Analysis", "bbox": {"l": 74.006828, "t": 491.39536, "r": 163.7558, "b": 501.24741, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 50.112, "t": 536.87337, "r": 286.36511, "b": 713.1519470000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9852361679077148, "cells": [{"id": 184, "text": "We showcase several visualizations for the different", "bbox": {"l": 62.067001, "t": 536.87337, "r": 286.36499, "b": 545.77992, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": "components of our network on various", "bbox": {"l": 50.112, "t": 548.82837, "r": 211.15741, "b": 557.73492, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "\u201ccomplex\u201d", "bbox": {"l": 215.10000999999997, "t": 548.91803, "r": 259.17453, "b": 557.50578, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "tables", "bbox": {"l": 263.12, "t": 548.82837, "r": 286.36273, "b": 557.73492, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": "within datasets presented in this work in Fig. 5 and Fig. 6", "bbox": {"l": 50.112, "t": 560.78337, "r": 286.36505, "b": 569.68993, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "As it is shown, our model is able to predict bounding boxes", "bbox": {"l": 50.112, "t": 572.73837, "r": 286.36508, "b": 581.6449299999999, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "for all table cells, even for the empty ones. Additionally,", "bbox": {"l": 50.112, "t": 584.69337, "r": 286.36508, "b": 593.59993, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "our post-processing techniques can extract the cell content", "bbox": {"l": 50.112, "t": 596.64937, "r": 286.36505, "b": 605.55592, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": "by matching the predicted bounding boxes to the PDF cells", "bbox": {"l": 50.112, "t": 608.60437, "r": 286.36508, "b": 617.51093, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "based on their overlap and spatial proximity. The left part", "bbox": {"l": 50.112, "t": 620.55937, "r": 286.36508, "b": 629.46593, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "of Fig. 5 demonstrates also the adaptability of our method", "bbox": {"l": 50.112, "t": 632.51437, "r": 286.36508, "b": 641.42093, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "to any language, as it can successfully extract Japanese", "bbox": {"l": 50.112, "t": 644.46938, "r": 286.36508, "b": 653.37593, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "text, although the training set contains only English content.", "bbox": {"l": 50.112, "t": 656.42438, "r": 286.36511, "b": 665.33094, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "We provide more visualizations including the intermediate", "bbox": {"l": 50.112, "t": 668.38037, "r": 286.36508, "b": 677.28694, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "steps in the supplementary material. Overall these illustra-", "bbox": {"l": 50.112, "t": 680.33537, "r": 286.36511, "b": 689.24194, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "tions justify the versatility of our method across a diverse", "bbox": {"l": 50.112, "t": 692.290375, "r": 286.36511, "b": 701.196945, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "range of table appearances and content type.", "bbox": {"l": 50.112, "t": 704.245377, "r": 226.88833999999997, "b": 713.1519470000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "section_header", "bbox": {"l": 308.862, "t": 490.70892, "r": 460.84848, "b": 501.45663, "coord_origin": "TOPLEFT"}, "confidence": 0.9436525702476501, "cells": [{"id": 201, "text": "6.", "bbox": {"l": 308.862, "t": 490.70892, "r": 316.07382, "b": 501.45663, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": "Future Work & Conclusion", "bbox": {"l": 325.68954, "t": 490.70892, "r": 460.84848, "b": 501.45663, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 308.862, "t": 512.89337, "r": 545.11517, "b": 653.30592, "coord_origin": "TOPLEFT"}, "confidence": 0.9875594973564148, "cells": [{"id": 203, "text": "In this paper, we presented TableFormer an end-to-end", "bbox": {"l": 320.81699, "t": 512.89337, "r": 545.11505, "b": 521.79993, "coord_origin": "TOPLEFT"}}, {"id": 204, "text": "transformer based approach to predict table structures and", "bbox": {"l": 308.862, "t": 524.84836, "r": 545.11517, "b": 533.75491, "coord_origin": "TOPLEFT"}}, {"id": 205, "text": "bounding boxes of cells from an image. This approach en-", "bbox": {"l": 308.862, "t": 536.80336, "r": 545.11511, "b": 545.70992, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": "ables us to recreate the table structure, and extract the cell", "bbox": {"l": 308.862, "t": 548.75836, "r": 545.11505, "b": 557.6649199999999, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": "content from PDF or OCR by using bounding boxes. Ad-", "bbox": {"l": 308.862, "t": 560.71336, "r": 545.11517, "b": 569.61992, "coord_origin": "TOPLEFT"}}, {"id": 208, "text": "ditionally, it provides the versatility required in real-world", "bbox": {"l": 308.862, "t": 572.66837, "r": 545.11511, "b": 581.57492, "coord_origin": "TOPLEFT"}}, {"id": 209, "text": "scenarios when dealing with various types of PDF docu-", "bbox": {"l": 308.862, "t": 584.62436, "r": 545.11511, "b": 593.53091, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": "ments, and languages.", "bbox": {"l": 308.862, "t": 596.57936, "r": 400.46808, "b": 605.48592, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "Furthermore, our method outper-", "bbox": {"l": 408.37839, "t": 596.57936, "r": 545.11511, "b": 605.48592, "coord_origin": "TOPLEFT"}}, {"id": 212, "text": "forms all state-of-the-arts with a wide margin. Finally, we", "bbox": {"l": 308.862, "t": 608.53436, "r": 545.11505, "b": 617.44092, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "introduce \u201cSynthTabNet\u201d a challenging synthetically gen-", "bbox": {"l": 308.862, "t": 620.48936, "r": 545.11511, "b": 629.3959199999999, "coord_origin": "TOPLEFT"}}, {"id": 214, "text": "erated dataset that reinforces missing characteristics from", "bbox": {"l": 308.862, "t": 632.4443699999999, "r": 545.11505, "b": 641.35092, "coord_origin": "TOPLEFT"}}, {"id": 215, "text": "other datasets.", "bbox": {"l": 308.862, "t": 644.39937, "r": 365.85803, "b": 653.30592, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "section_header", "bbox": {"l": 308.862, "t": 672.09892, "r": 364.40585, "b": 682.84664, "coord_origin": "TOPLEFT"}, "confidence": 0.9442470073699951, "cells": [{"id": 216, "text": "References", "bbox": {"l": 308.862, "t": 672.09892, "r": 364.40585, "b": 682.84664, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "list_item", "bbox": {"l": 313.345, "t": 693.9617920000001, "r": 545.1134, "b": 712.936752, "coord_origin": "TOPLEFT"}, "confidence": 0.8318753838539124, "cells": [{"id": 217, "text": "[1]", "bbox": {"l": 313.345, "t": 693.9617920000001, "r": 323.80792, "b": 701.977753, "coord_origin": "TOPLEFT"}}, {"id": 218, "text": "Nicolas Carion, Francisco Massa, Gabriel Synnaeve, Nicolas", "bbox": {"l": 326.05127, "t": 693.9617920000001, "r": 545.10852, "b": 701.977753, "coord_origin": "TOPLEFT"}}, {"id": 219, "text": "Usunier, Alexander Kirillov, and Sergey Zagoruyko. End-to-", "bbox": {"l": 328.78101, "t": 704.920792, "r": 545.1134, "b": 712.936752, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "page_footer", "bbox": {"l": 295.121, "t": 734.133366, "r": 300.10229, "b": 743.039928, "coord_origin": "TOPLEFT"}, "confidence": 0.8709858059883118, "cells": [{"id": 220, "text": "8", "bbox": {"l": 295.121, "t": 734.133366, "r": 300.10229, "b": 743.039928, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "picture", "bbox": {"l": 305.5836486816406, "t": 98.65415954589844, "r": 554.8258666992188, "b": 180.6267547607422, "coord_origin": "TOPLEFT"}, "confidence": 0.7699173092842102, "cells": [], "children": []}, {"id": 14, "label": "picture", "bbox": {"l": 49.97503662109375, "t": 103.71266174316406, "r": 301.6335754394531, "b": 187.5789337158203, "coord_origin": "TOPLEFT"}, "confidence": 0.7873926162719727, "cells": [], "children": []}]}, "tablestructure": {"table_map": {"8": {"label": "table", "id": 8, "page_no": 7, "cluster": {"id": 8, "label": "table", "bbox": {"l": 53.62853240966797, "t": 218.94857788085938, "r": 298.5574951171875, "b": 292.39996337890625, "coord_origin": "TOPLEFT"}, "confidence": 0.8824009299278259, "cells": [{"id": 6, "text": "\u8ad6\u6587\u30d5\u30a1\u30a4\u30eb", "bbox": {"l": 209.93285, "t": 222.18073000000004, "r": 241.04458999999997, "b": 226.36212, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "\u53c2\u8003\u6587\u732e", "bbox": {"l": 263.76489, "t": 222.18073000000004, "r": 284.50589, "b": 226.36212, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "\u51fa\u5178", "bbox": {"l": 110.24990999999999, "t": 229.66594999999995, "r": 120.62018, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "\u30d5\u30a1\u30a4\u30eb", "bbox": {"l": 175.36609, "t": 229.66594999999995, "r": 196.1071, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "\u6570", "bbox": {"l": 196.10756, "t": 229.66594999999995, "r": 201.29247, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "\u82f1\u8a9e", "bbox": {"l": 209.62408, "t": 229.66594999999995, "r": 219.99435, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "\u65e5\u672c\u8a9e", "bbox": {"l": 229.19814, "t": 229.66594999999995, "r": 244.75377, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "\u82f1\u8a9e", "bbox": {"l": 256.1142, "t": 229.66594999999995, "r": 266.48447, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "\u65e5\u672c\u8a9e", "bbox": {"l": 278.38434, "t": 229.66594999999995, "r": 293.93997, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Association for Computational Linguistics(ACL2003)", "bbox": {"l": 55.53052099999999, "t": 236.42584, "r": 162.7131, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "65", "bbox": {"l": 184.39731, "t": 236.42584, "r": 189.56456, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "65", "bbox": {"l": 208.99026, "t": 236.42584, "r": 214.15752, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "0", "bbox": {"l": 234.87517, "t": 236.42584, "r": 237.45833000000002, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "150", "bbox": {"l": 256.88446, "t": 236.42584, "r": 264.6358, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "0", "bbox": {"l": 284.06134, "t": 236.42584, "r": 286.6445, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Computational Linguistics(COLING2002)", "bbox": {"l": 55.53052099999999, "t": 242.62048000000004, "r": 139.72253, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "140", "bbox": {"l": 183.10536, "t": 242.62048000000004, "r": 190.8567, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "140", "bbox": {"l": 207.69832, "t": 242.62048000000004, "r": 215.44965999999997, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "0", "bbox": {"l": 234.87517, "t": 242.62048000000004, "r": 237.45833000000002, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "150", "bbox": {"l": 256.88446, "t": 242.62048000000004, "r": 264.6358, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "0", "bbox": {"l": 284.06134, "t": 242.62048000000004, "r": 286.6445, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "\u96fb\u6c17\u60c5\u5831\u901a\u4fe1\u5b66\u4f1a", "bbox": {"l": 55.53052099999999, "t": 249.79845999999998, "r": 97.013, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "2003", "bbox": {"l": 92.698288, "t": 249.58942000000002, "r": 103.03371, "b": 253.94732999999997, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "\u5e74\u7dcf\u5408\u5927\u4f1a", "bbox": {"l": 103.03389, "t": 249.79845999999998, "r": 128.96027, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "150", "bbox": {"l": 183.10536, "t": 248.81506000000002, "r": 190.8567, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "8", "bbox": {"l": 210.28223, "t": 248.81506000000002, "r": 212.86539, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "142", "bbox": {"l": 232.29153, "t": 248.81506000000002, "r": 240.04287999999997, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "223", "bbox": {"l": 256.88446, "t": 248.81506000000002, "r": 264.6358, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "147", "bbox": {"l": 281.47742, "t": 248.81506000000002, "r": 289.22876, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "\u60c5\u5831\u51e6\u7406\u5b66\u4f1a\u7b2c", "bbox": {"l": 55.53052099999999, "t": 257.28369, "r": 91.827637, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "65", "bbox": {"l": 88.052673, "t": 257.07465, "r": 93.219925, "b": 261.43255999999997, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "\u56de\u5168\u56fd\u5927\u4f1a", "bbox": {"l": 93.220474, "t": 257.28369, "r": 119.14685, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "(2003)", "bbox": {"l": 116.45073999999998, "t": 257.07465, "r": 129.88177, "b": 261.43255999999997, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "177", "bbox": {"l": 183.10536, "t": 256.30029, "r": 190.8567, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "1", "bbox": {"l": 210.28223, "t": 256.30029, "r": 212.86539, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "176", "bbox": {"l": 232.29153, "t": 256.30029, "r": 240.04287999999997, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "150", "bbox": {"l": 256.88446, "t": 256.30029, "r": 264.6358, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "236", "bbox": {"l": 281.47742, "t": 256.30029, "r": 289.22876, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "\u7b2c", "bbox": {"l": 55.53052099999999, "t": 264.5108, "r": 60.715424, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "17", "bbox": {"l": 60.17654799999999, "t": 264.30175999999994, "r": 65.343796, "b": 268.65967, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "\u56de\u4eba\u5de5\u77e5\u80fd\u5b66\u4f1a\u5168\u56fd\u5927\u4f1a", "bbox": {"l": 65.344376, "t": 264.5108, "r": 122.38297000000001, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "(2003)", "bbox": {"l": 116.45073999999998, "t": 264.30175999999994, "r": 129.88177, "b": 268.65967, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "208", "bbox": {"l": 183.10536, "t": 263.52739999999994, "r": 190.8567, "b": 267.88531, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "5", "bbox": {"l": 210.28223, "t": 263.52739999999994, "r": 212.86539, "b": 267.88531, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "203", "bbox": {"l": 232.29153, "t": 263.52739999999994, "r": 240.04287999999997, "b": 267.88531, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "152", "bbox": {"l": 256.88446, "t": 263.52739999999994, "r": 264.6358, "b": 267.88531, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "244", "bbox": {"l": 281.47742, "t": 263.52739999999994, "r": 289.22876, "b": 267.88531, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "\u81ea\u7136\u8a00\u8a9e\u51e6\u7406\u7814\u7a76\u4f1a\u7b2c", "bbox": {"l": 55.53052099999999, "t": 271.73785, "r": 107.38374, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "146", "bbox": {"l": 101.99034, "t": 271.52881, "r": 109.74168000000002, "b": 275.88671999999997, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "\u301c", "bbox": {"l": 109.74204, "t": 271.73785, "r": 114.92695000000002, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "155", "bbox": {"l": 114.38793, "t": 271.52881, "r": 122.13927, "b": 275.88671999999997, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "\u56de", "bbox": {"l": 122.13963, "t": 271.73785, "r": 127.32454000000001, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "98", "bbox": {"l": 184.39731, "t": 270.75446, "r": 189.56456, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "2", "bbox": {"l": 210.28223, "t": 270.75446, "r": 212.86539, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "96", "bbox": {"l": 233.58348, "t": 270.75446, "r": 238.75072999999998, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "150", "bbox": {"l": 256.88446, "t": 270.75446, "r": 264.6358, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "232", "bbox": {"l": 281.47742, "t": 270.75446, "r": 289.22876, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "WWW", "bbox": {"l": 55.53052099999999, "t": 279.01392, "r": 68.68605, "b": 283.37183, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "\u304b\u3089\u53ce\u96c6\u3057\u305f\u8ad6\u6587", "bbox": {"l": 68.685814, "t": 279.22295999999994, "r": 110.16829999999999, "b": 283.40436, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "107", "bbox": {"l": 183.10536, "t": 277.98157000000003, "r": 190.8567, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "73", "bbox": {"l": 208.99026, "t": 277.98157000000003, "r": 214.15752, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "34", "bbox": {"l": 233.58348, "t": 277.98157000000003, "r": 238.75072999999998, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "147", "bbox": {"l": 256.88446, "t": 277.98157000000003, "r": 264.6358, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "96", "bbox": {"l": 282.76938, "t": 277.98157000000003, "r": 287.93661, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "\u8a08", "bbox": {"l": 169.61508, "t": 286.45004, "r": 174.79999, "b": 290.63141, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "945", "bbox": {"l": 183.10536, "t": 285.46667, "r": 190.8567, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "294", "bbox": {"l": 207.69832, "t": 285.46667, "r": 215.44965999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "651", "bbox": {"l": 232.29153, "t": 285.46667, "r": 240.04287999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "1122", "bbox": {"l": 255.76506, "t": 285.46667, "r": 265.75204, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "955", "bbox": {"l": 281.47742, "t": 285.46667, "r": 289.22876, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}], "children": [{"id": 32, "label": "text", "bbox": {"l": 209.93285, "t": 222.18073000000004, "r": 241.04458999999997, "b": 226.36212, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": "\u8ad6\u6587\u30d5\u30a1\u30a4\u30eb", "bbox": {"l": 209.93285, "t": 222.18073000000004, "r": 241.04458999999997, "b": 226.36212, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 263.76489, "t": 222.18073000000004, "r": 284.50589, "b": 226.36212, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "\u53c2\u8003\u6587\u732e", "bbox": {"l": 263.76489, "t": 222.18073000000004, "r": 284.50589, "b": 226.36212, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 110.24990999999999, "t": 229.66594999999995, "r": 120.62018, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "\u51fa\u5178", "bbox": {"l": 110.24990999999999, "t": 229.66594999999995, "r": 120.62018, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 175.36609, "t": 229.66594999999995, "r": 196.1071, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "\u30d5\u30a1\u30a4\u30eb", "bbox": {"l": 175.36609, "t": 229.66594999999995, "r": 196.1071, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 196.10756, "t": 229.66594999999995, "r": 201.29247, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "\u6570", "bbox": {"l": 196.10756, "t": 229.66594999999995, "r": 201.29247, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 209.62408, "t": 229.66594999999995, "r": 219.99435, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "\u82f1\u8a9e", "bbox": {"l": 209.62408, "t": 229.66594999999995, "r": 219.99435, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 229.19814, "t": 229.66594999999995, "r": 244.75377, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "\u65e5\u672c\u8a9e", "bbox": {"l": 229.19814, "t": 229.66594999999995, "r": 244.75377, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 256.1142, "t": 229.66594999999995, "r": 266.48447, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "\u82f1\u8a9e", "bbox": {"l": 256.1142, "t": 229.66594999999995, "r": 266.48447, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 278.38434, "t": 229.66594999999995, "r": 293.93997, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "\u65e5\u672c\u8a9e", "bbox": {"l": 278.38434, "t": 229.66594999999995, "r": 293.93997, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 55.53052099999999, "t": 236.42584, "r": 162.7131, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "Association for Computational Linguistics(ACL2003)", "bbox": {"l": 55.53052099999999, "t": 236.42584, "r": 162.7131, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 184.39731, "t": 236.42584, "r": 189.56456, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "65", "bbox": {"l": 184.39731, "t": 236.42584, "r": 189.56456, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 208.99026, "t": 236.42584, "r": 214.15752, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "65", "bbox": {"l": 208.99026, "t": 236.42584, "r": 214.15752, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 234.87517, "t": 236.42584, "r": 237.45833000000002, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "0", "bbox": {"l": 234.87517, "t": 236.42584, "r": 237.45833000000002, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 256.88446, "t": 236.42584, "r": 264.6358, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "150", "bbox": {"l": 256.88446, "t": 236.42584, "r": 264.6358, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 284.06134, "t": 236.42584, "r": 286.6445, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "0", "bbox": {"l": 284.06134, "t": 236.42584, "r": 286.6445, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 55.53052099999999, "t": 242.62048000000004, "r": 139.72253, "b": 246.97839, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "Computational Linguistics(COLING2002)", "bbox": {"l": 55.53052099999999, "t": 242.62048000000004, "r": 139.72253, "b": 246.97839, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 183.10536, "t": 242.62048000000004, "r": 190.8567, "b": 246.97839, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "140", "bbox": {"l": 183.10536, "t": 242.62048000000004, "r": 190.8567, "b": 246.97839, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 207.69832, "t": 242.62048000000004, "r": 215.44965999999997, "b": 246.97839, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "140", "bbox": {"l": 207.69832, "t": 242.62048000000004, "r": 215.44965999999997, "b": 246.97839, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 234.87517, "t": 242.62048000000004, "r": 237.45833000000002, "b": 246.97839, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "0", "bbox": {"l": 234.87517, "t": 242.62048000000004, "r": 237.45833000000002, "b": 246.97839, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 256.88446, "t": 242.62048000000004, "r": 264.6358, "b": 246.97839, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "150", "bbox": {"l": 256.88446, "t": 242.62048000000004, "r": 264.6358, "b": 246.97839, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 284.06134, "t": 242.62048000000004, "r": 286.6445, "b": 246.97839, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "0", "bbox": {"l": 284.06134, "t": 242.62048000000004, "r": 286.6445, "b": 246.97839, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 55.53052099999999, "t": 249.79845999999998, "r": 97.013, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "\u96fb\u6c17\u60c5\u5831\u901a\u4fe1\u5b66\u4f1a", "bbox": {"l": 55.53052099999999, "t": 249.79845999999998, "r": 97.013, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 92.698288, "t": 249.58942000000002, "r": 103.03371, "b": 253.94732999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "2003", "bbox": {"l": 92.698288, "t": 249.58942000000002, "r": 103.03371, "b": 253.94732999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 103.03389, "t": 249.79845999999998, "r": 128.96027, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "\u5e74\u7dcf\u5408\u5927\u4f1a", "bbox": {"l": 103.03389, "t": 249.79845999999998, "r": 128.96027, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 183.10536, "t": 248.81506000000002, "r": 190.8567, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "150", "bbox": {"l": 183.10536, "t": 248.81506000000002, "r": 190.8567, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 210.28223, "t": 248.81506000000002, "r": 212.86539, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "8", "bbox": {"l": 210.28223, "t": 248.81506000000002, "r": 212.86539, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 232.29153, "t": 248.81506000000002, "r": 240.04287999999997, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "142", "bbox": {"l": 232.29153, "t": 248.81506000000002, "r": 240.04287999999997, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 256.88446, "t": 248.81506000000002, "r": 264.6358, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "223", "bbox": {"l": 256.88446, "t": 248.81506000000002, "r": 264.6358, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 281.47742, "t": 248.81506000000002, "r": 289.22876, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "147", "bbox": {"l": 281.47742, "t": 248.81506000000002, "r": 289.22876, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 55.53052099999999, "t": 257.28369, "r": 91.827637, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "\u60c5\u5831\u51e6\u7406\u5b66\u4f1a\u7b2c", "bbox": {"l": 55.53052099999999, "t": 257.28369, "r": 91.827637, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 88.052673, "t": 257.07465, "r": 93.219925, "b": 261.43255999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "65", "bbox": {"l": 88.052673, "t": 257.07465, "r": 93.219925, "b": 261.43255999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 93.220474, "t": 257.28369, "r": 119.14685, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "\u56de\u5168\u56fd\u5927\u4f1a", "bbox": {"l": 93.220474, "t": 257.28369, "r": 119.14685, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 116.45073999999998, "t": 257.07465, "r": 129.88177, "b": 261.43255999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "(2003)", "bbox": {"l": 116.45073999999998, "t": 257.07465, "r": 129.88177, "b": 261.43255999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 183.10536, "t": 256.30029, "r": 190.8567, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "177", "bbox": {"l": 183.10536, "t": 256.30029, "r": 190.8567, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 210.28223, "t": 256.30029, "r": 212.86539, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "1", "bbox": {"l": 210.28223, "t": 256.30029, "r": 212.86539, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 232.29153, "t": 256.30029, "r": 240.04287999999997, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "176", "bbox": {"l": 232.29153, "t": 256.30029, "r": 240.04287999999997, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 256.88446, "t": 256.30029, "r": 264.6358, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "150", "bbox": {"l": 256.88446, "t": 256.30029, "r": 264.6358, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 281.47742, "t": 256.30029, "r": 289.22876, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "236", "bbox": {"l": 281.47742, "t": 256.30029, "r": 289.22876, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 55.53052099999999, "t": 264.5108, "r": 60.715424, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "\u7b2c", "bbox": {"l": 55.53052099999999, "t": 264.5108, "r": 60.715424, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 60.17654799999999, "t": 264.30175999999994, "r": 65.343796, "b": 268.65967, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "17", "bbox": {"l": 60.17654799999999, "t": 264.30175999999994, "r": 65.343796, "b": 268.65967, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 65.344376, "t": 264.5108, "r": 122.38297000000001, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "\u56de\u4eba\u5de5\u77e5\u80fd\u5b66\u4f1a\u5168\u56fd\u5927\u4f1a", "bbox": {"l": 65.344376, "t": 264.5108, "r": 122.38297000000001, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 116.45073999999998, "t": 264.30175999999994, "r": 129.88177, "b": 268.65967, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "(2003)", "bbox": {"l": 116.45073999999998, "t": 264.30175999999994, "r": 129.88177, "b": 268.65967, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 183.10536, "t": 263.52739999999994, "r": 190.8567, "b": 267.88531, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "208", "bbox": {"l": 183.10536, "t": 263.52739999999994, "r": 190.8567, "b": 267.88531, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 210.28223, "t": 263.52739999999994, "r": 212.86539, "b": 267.88531, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "5", "bbox": {"l": 210.28223, "t": 263.52739999999994, "r": 212.86539, "b": 267.88531, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 232.29153, "t": 263.52739999999994, "r": 240.04287999999997, "b": 267.88531, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "203", "bbox": {"l": 232.29153, "t": 263.52739999999994, "r": 240.04287999999997, "b": 267.88531, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 256.88446, "t": 263.52739999999994, "r": 264.6358, "b": 267.88531, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "152", "bbox": {"l": 256.88446, "t": 263.52739999999994, "r": 264.6358, "b": 267.88531, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 281.47742, "t": 263.52739999999994, "r": 289.22876, "b": 267.88531, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "244", "bbox": {"l": 281.47742, "t": 263.52739999999994, "r": 289.22876, "b": 267.88531, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 55.53052099999999, "t": 271.73785, "r": 107.38374, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "\u81ea\u7136\u8a00\u8a9e\u51e6\u7406\u7814\u7a76\u4f1a\u7b2c", "bbox": {"l": 55.53052099999999, "t": 271.73785, "r": 107.38374, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 101.99034, "t": 271.52881, "r": 109.74168000000002, "b": 275.88671999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "146", "bbox": {"l": 101.99034, "t": 271.52881, "r": 109.74168000000002, "b": 275.88671999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 109.74204, "t": 271.73785, "r": 114.92695000000002, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "\u301c", "bbox": {"l": 109.74204, "t": 271.73785, "r": 114.92695000000002, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 114.38793, "t": 271.52881, "r": 122.13927, "b": 275.88671999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "155", "bbox": {"l": 114.38793, "t": 271.52881, "r": 122.13927, "b": 275.88671999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 122.13963, "t": 271.73785, "r": 127.32454000000001, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "\u56de", "bbox": {"l": 122.13963, "t": 271.73785, "r": 127.32454000000001, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 184.39731, "t": 270.75446, "r": 189.56456, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "98", "bbox": {"l": 184.39731, "t": 270.75446, "r": 189.56456, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 210.28223, "t": 270.75446, "r": 212.86539, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "2", "bbox": {"l": 210.28223, "t": 270.75446, "r": 212.86539, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 233.58348, "t": 270.75446, "r": 238.75072999999998, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "96", "bbox": {"l": 233.58348, "t": 270.75446, "r": 238.75072999999998, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 256.88446, "t": 270.75446, "r": 264.6358, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "150", "bbox": {"l": 256.88446, "t": 270.75446, "r": 264.6358, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 281.47742, "t": 270.75446, "r": 289.22876, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "232", "bbox": {"l": 281.47742, "t": 270.75446, "r": 289.22876, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 55.53052099999999, "t": 279.01392, "r": 68.68605, "b": 283.37183, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "WWW", "bbox": {"l": 55.53052099999999, "t": 279.01392, "r": 68.68605, "b": 283.37183, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 68.685814, "t": 279.22295999999994, "r": 110.16829999999999, "b": 283.40436, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "\u304b\u3089\u53ce\u96c6\u3057\u305f\u8ad6\u6587", "bbox": {"l": 68.685814, "t": 279.22295999999994, "r": 110.16829999999999, "b": 283.40436, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 183.10536, "t": 277.98157000000003, "r": 190.8567, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "107", "bbox": {"l": 183.10536, "t": 277.98157000000003, "r": 190.8567, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 208.99026, "t": 277.98157000000003, "r": 214.15752, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "73", "bbox": {"l": 208.99026, "t": 277.98157000000003, "r": 214.15752, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 233.58348, "t": 277.98157000000003, "r": 238.75072999999998, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "34", "bbox": {"l": 233.58348, "t": 277.98157000000003, "r": 238.75072999999998, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 256.88446, "t": 277.98157000000003, "r": 264.6358, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "147", "bbox": {"l": 256.88446, "t": 277.98157000000003, "r": 264.6358, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 282.76938, "t": 277.98157000000003, "r": 287.93661, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "96", "bbox": {"l": 282.76938, "t": 277.98157000000003, "r": 287.93661, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 169.61508, "t": 286.45004, "r": 174.79999, "b": 290.63141, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "\u8a08", "bbox": {"l": 169.61508, "t": 286.45004, "r": 174.79999, "b": 290.63141, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 183.10536, "t": 285.46667, "r": 190.8567, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "945", "bbox": {"l": 183.10536, "t": 285.46667, "r": 190.8567, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 207.69832, "t": 285.46667, "r": 215.44965999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "294", "bbox": {"l": 207.69832, "t": 285.46667, "r": 215.44965999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 232.29153, "t": 285.46667, "r": 240.04287999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "651", "bbox": {"l": 232.29153, "t": 285.46667, "r": 240.04287999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 255.76506, "t": 285.46667, "r": 265.75204, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "1122", "bbox": {"l": 255.76506, "t": 285.46667, "r": 265.75204, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 281.47742, "t": 285.46667, "r": 289.22876, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "955", "bbox": {"l": 281.47742, "t": 285.46667, "r": 289.22876, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "lcel", "ched", "lcel", "nl", "ched", "ched", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 10, "num_cols": 6, "table_cells": [{"bbox": {"l": 209.93285, "t": 222.18073000000004, "r": 241.04458999999997, "b": 226.36212, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 4, "text": "\u8ad6\u6587\u30d5\u30a1\u30a4\u30eb", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 263.76489, "t": 222.18073000000004, "r": 284.50589, "b": 226.36212, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 4, "end_col_offset_idx": 6, "text": "\u53c2\u8003\u6587\u732e", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 110.24990999999999, "t": 229.66594999999995, "r": 120.62018, "b": 233.84735, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "\u51fa\u5178", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 175.36609, "t": 229.66594999999995, "r": 201.29247, "b": 233.84735, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "\u30d5\u30a1\u30a4\u30eb \u6570", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 209.62408, "t": 229.66594999999995, "r": 219.99435, "b": 233.84735, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "\u82f1\u8a9e", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 229.19814, "t": 229.66594999999995, "r": 244.75377, "b": 233.84735, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "\u65e5\u672c\u8a9e", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 256.1142, "t": 229.66594999999995, "r": 266.48447, "b": 233.84735, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "\u82f1\u8a9e", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 278.38434, "t": 229.66594999999995, "r": 293.93997, "b": 233.84735, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "\u65e5\u672c\u8a9e", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 55.53052099999999, "t": 236.42584, "r": 162.7131, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Association for Computational Linguistics(ACL2003)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 184.39731, "t": 236.42584, "r": 189.56456, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "65", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 208.99026, "t": 236.42584, "r": 214.15752, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "65", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 234.87517, "t": 236.42584, "r": 237.45833000000002, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446, "t": 236.42584, "r": 264.6358, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "150", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 284.06134, "t": 236.42584, "r": 286.6445, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 55.53052099999999, "t": 242.62048000000004, "r": 139.72253, "b": 246.97839, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Computational Linguistics(COLING2002)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 183.10536, "t": 242.62048000000004, "r": 190.8567, "b": 246.97839, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "140", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 207.69832, "t": 242.62048000000004, "r": 215.44965999999997, "b": 246.97839, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "140", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 234.87517, "t": 242.62048000000004, "r": 237.45833000000002, "b": 246.97839, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446, "t": 242.62048000000004, "r": 264.6358, "b": 246.97839, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "150", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 284.06134, "t": 242.62048000000004, "r": 286.6445, "b": 246.97839, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 55.53052099999999, "t": 249.58942000000002, "r": 128.96027, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "\u96fb\u6c17\u60c5\u5831\u901a\u4fe1\u5b66\u4f1a 2003 \u5e74\u7dcf\u5408\u5927\u4f1a", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 183.10536, "t": 248.81506000000002, "r": 190.8567, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "150", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 210.28223, "t": 248.81506000000002, "r": 212.86539, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.29153, "t": 248.81506000000002, "r": 240.04287999999997, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "142", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446, "t": 248.81506000000002, "r": 264.6358, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "223", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.47742, "t": 248.81506000000002, "r": 289.22876, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "147", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 55.53052099999999, "t": 257.07465, "r": 129.88177, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "\u60c5\u5831\u51e6\u7406\u5b66\u4f1a\u7b2c 65 \u56de\u5168\u56fd\u5927\u4f1a (2003)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 183.10536, "t": 256.30029, "r": 190.8567, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "177", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 210.28223, "t": 256.30029, "r": 212.86539, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.29153, "t": 256.30029, "r": 240.04287999999997, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "176", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446, "t": 256.30029, "r": 264.6358, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "150", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.47742, "t": 256.30029, "r": 289.22876, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "236", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 55.53052099999999, "t": 264.30175999999994, "r": 129.88177, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "\u7b2c 17 \u56de\u4eba\u5de5\u77e5\u80fd\u5b66\u4f1a\u5168\u56fd\u5927\u4f1a (2003)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 183.10536, "t": 263.52739999999994, "r": 190.8567, "b": 267.88531, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "208", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 210.28223, "t": 263.52739999999994, "r": 212.86539, "b": 267.88531, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.29153, "t": 263.52739999999994, "r": 240.04287999999997, "b": 267.88531, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "203", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446, "t": 263.52739999999994, "r": 264.6358, "b": 267.88531, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "152", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.47742, "t": 263.52739999999994, "r": 289.22876, "b": 267.88531, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "244", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 55.53052099999999, "t": 271.52881, "r": 127.32454000000001, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "\u81ea\u7136\u8a00\u8a9e\u51e6\u7406\u7814\u7a76\u4f1a\u7b2c 146 \u301c 155 \u56de", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 184.39731, "t": 270.75446, "r": 189.56456, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "98", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 210.28223, "t": 270.75446, "r": 212.86539, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 233.58348, "t": 270.75446, "r": 238.75072999999998, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446, "t": 270.75446, "r": 264.6358, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "150", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.47742, "t": 270.75446, "r": 289.22876, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "232", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 55.53052099999999, "t": 279.01392, "r": 110.16829999999999, "b": 283.40436, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "WWW \u304b\u3089\u53ce\u96c6\u3057\u305f\u8ad6\u6587", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 183.10536, "t": 277.98157000000003, "r": 190.8567, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "107", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 208.99026, "t": 277.98157000000003, "r": 214.15752, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "73", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 233.58348, "t": 277.98157000000003, "r": 238.75072999999998, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "34", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446, "t": 277.98157000000003, "r": 264.6358, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "147", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 282.76938, "t": 277.98157000000003, "r": 287.93661, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 183.10536, "t": 285.46667, "r": 190.8567, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "945", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 207.69832, "t": 285.46667, "r": 215.44965999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "294", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.29153, "t": 285.46667, "r": 240.04287999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "651", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 255.76506, "t": 285.46667, "r": 265.75204, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "1122", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.47742, "t": 285.46667, "r": 289.22876, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "955", "column_header": false, "row_header": false, "row_section": false}]}, "7": {"label": "table", "id": 7, "page_no": 7, "cluster": {"id": 7, "label": "table", "bbox": {"l": 304.9219970703125, "t": 218.51486206054688, "r": 550.2321166992188, "b": 287.90069580078125, "coord_origin": "TOPLEFT"}, "confidence": 0.8899767994880676, "cells": [{"id": 77, "text": "Weighted Average Grant Date Fair", "bbox": {"l": 459.04861, "t": 221.62415, "r": 542.00018, "b": 226.68933000000004, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "Value", "bbox": {"l": 493.82193, "t": 227.83416999999997, "r": 507.2258, "b": 232.89935000000003, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "RS", "bbox": {"l": 393.2442, "t": 236.74712999999997, "r": 400.74588, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "U", "bbox": {"l": 400.74643, "t": 236.74712999999997, "r": 404.64523, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "s", "bbox": {"l": 404.6463, "t": 236.74712999999997, "r": 407.34631, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "Shares (in millions)", "bbox": {"l": 392.09671, "t": 221.57446000000004, "r": 438.0145, "b": 226.63964999999996, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "PSUs", "bbox": {"l": 427.18323, "t": 236.74712999999997, "r": 440.98778999999996, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "RSUs", "bbox": {"l": 468.38254, "t": 236.74712999999997, "r": 482.48465000000004, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "PSUs", "bbox": {"l": 516.92578, "t": 236.74712999999997, "r": 530.73035, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Nonvested on Janua", "bbox": {"l": 306.11493, "t": 244.61084000000005, "r": 355.6532, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "ry 1", "bbox": {"l": 355.65427, "t": 244.61084000000005, "r": 364.65607, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "1.", "bbox": {"l": 396.24661, "t": 244.91327, "r": 400.75238, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "1", "bbox": {"l": 400.7529, "t": 244.91327, "r": 403.75531, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "0.3", "bbox": {"l": 429.81838999999997, "t": 244.91327, "r": 437.32708999999994, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "90.10", "bbox": {"l": 465.52859, "t": 244.91327, "r": 478.40103, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "$", "bbox": {"l": 480.97552, "t": 244.91327, "r": 483.55001999999996, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "$ 91.19", "bbox": {"l": 513.44824, "t": 244.91327, "r": 531.46967, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "Granted", "bbox": {"l": 306.11493, "t": 253.68451000000005, "r": 325.62674, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "0.", "bbox": {"l": 396.24661, "t": 253.68451000000005, "r": 400.75238, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "5", "bbox": {"l": 400.7529, "t": 253.68451000000005, "r": 403.75531, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "0.1", "bbox": {"l": 429.81838999999997, "t": 253.68451000000005, "r": 437.32708999999994, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "117.44", "bbox": {"l": 466.43579000000005, "t": 253.68451000000005, "r": 482.54831, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "122.41", "bbox": {"l": 514.29065, "t": 253.68451000000005, "r": 530.80981, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "Vested", "bbox": {"l": 306.11493, "t": 261.54822, "r": 322.62866, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "(0.", "bbox": {"l": 394.43222, "t": 261.54822, "r": 400.73563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "5", "bbox": {"l": 400.73456, "t": 261.54822, "r": 403.73697, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": ")", "bbox": {"l": 403.73804, "t": 261.54822, "r": 405.53625, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "(0.1)", "bbox": {"l": 427.7016, "t": 261.54822, "r": 438.80563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "87.08", "bbox": {"l": 468.55533, "t": 261.54822, "r": 482.07043, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "81.14", "bbox": {"l": 516.01862, "t": 261.54822, "r": 529.53375, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "Canceled or forfeited", "bbox": {"l": 306.11493, "t": 269.64148, "r": 356.24771, "b": 274.70667000000003, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "(0.", "bbox": {"l": 394.43222, "t": 270.31946000000005, "r": 400.73563, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "1", "bbox": {"l": 400.73456, "t": 270.31946000000005, "r": 403.73697, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": ")", "bbox": {"l": 403.73804, "t": 270.31946000000005, "r": 405.53625, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "-", "bbox": {"l": 431.02802, "t": 270.31946000000005, "r": 436.4280099999999, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "102.01", "bbox": {"l": 465.83099000000004, "t": 270.31946000000005, "r": 482.35013, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "92.18", "bbox": {"l": 516.01862, "t": 270.31946000000005, "r": 529.53375, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "Nonvested on December 31", "bbox": {"l": 306.11493, "t": 278.48572, "r": 373.35764, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "1.0", "bbox": {"l": 396.24661, "t": 278.48572, "r": 403.75531, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "0.3", "bbox": {"l": 429.51599, "t": 278.48572, "r": 437.02469, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "104.85 $", "bbox": {"l": 463.7142, "t": 278.48572, "r": 484.73965000000004, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "$ 104.51", "bbox": {"l": 512.99463, "t": 278.48572, "r": 534.02008, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}], "children": [{"id": 102, "label": "text", "bbox": {"l": 459.04861, "t": 221.62415, "r": 542.00018, "b": 226.68933000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "Weighted Average Grant Date Fair", "bbox": {"l": 459.04861, "t": 221.62415, "r": 542.00018, "b": 226.68933000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 493.82193, "t": 227.83416999999997, "r": 507.2258, "b": 232.89935000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "Value", "bbox": {"l": 493.82193, "t": 227.83416999999997, "r": 507.2258, "b": 232.89935000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 393.2442, "t": 236.74712999999997, "r": 400.74588, "b": 241.81232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "RS", "bbox": {"l": 393.2442, "t": 236.74712999999997, "r": 400.74588, "b": 241.81232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 400.74643, "t": 236.74712999999997, "r": 404.64523, "b": 241.81232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "U", "bbox": {"l": 400.74643, "t": 236.74712999999997, "r": 404.64523, "b": 241.81232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 404.6463, "t": 236.74712999999997, "r": 407.34631, "b": 241.81232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "s", "bbox": {"l": 404.6463, "t": 236.74712999999997, "r": 407.34631, "b": 241.81232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 392.09671, "t": 221.57446000000004, "r": 438.0145, "b": 226.63964999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "Shares (in millions)", "bbox": {"l": 392.09671, "t": 221.57446000000004, "r": 438.0145, "b": 226.63964999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 427.18323, "t": 236.74712999999997, "r": 440.98778999999996, "b": 241.81232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "PSUs", "bbox": {"l": 427.18323, "t": 236.74712999999997, "r": 440.98778999999996, "b": 241.81232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 468.38254, "t": 236.74712999999997, "r": 482.48465000000004, "b": 241.81232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "RSUs", "bbox": {"l": 468.38254, "t": 236.74712999999997, "r": 482.48465000000004, "b": 241.81232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 516.92578, "t": 236.74712999999997, "r": 530.73035, "b": 241.81232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "PSUs", "bbox": {"l": 516.92578, "t": 236.74712999999997, "r": 530.73035, "b": 241.81232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 306.11493, "t": 244.61084000000005, "r": 355.6532, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "Nonvested on Janua", "bbox": {"l": 306.11493, "t": 244.61084000000005, "r": 355.6532, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 355.65427, "t": 244.61084000000005, "r": 364.65607, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "ry 1", "bbox": {"l": 355.65427, "t": 244.61084000000005, "r": 364.65607, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 396.24661, "t": 244.91327, "r": 400.75238, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "1.", "bbox": {"l": 396.24661, "t": 244.91327, "r": 400.75238, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 114, "label": "text", "bbox": {"l": 400.7529, "t": 244.91327, "r": 403.75531, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "1", "bbox": {"l": 400.7529, "t": 244.91327, "r": 403.75531, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 115, "label": "text", "bbox": {"l": 429.81838999999997, "t": 244.91327, "r": 437.32708999999994, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "0.3", "bbox": {"l": 429.81838999999997, "t": 244.91327, "r": 437.32708999999994, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 116, "label": "text", "bbox": {"l": 465.52859, "t": 244.91327, "r": 478.40103, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "90.10", "bbox": {"l": 465.52859, "t": 244.91327, "r": 478.40103, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 117, "label": "text", "bbox": {"l": 480.97552, "t": 244.91327, "r": 483.55001999999996, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "$", "bbox": {"l": 480.97552, "t": 244.91327, "r": 483.55001999999996, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 118, "label": "text", "bbox": {"l": 513.44824, "t": 244.91327, "r": 531.46967, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "$ 91.19", "bbox": {"l": 513.44824, "t": 244.91327, "r": 531.46967, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 119, "label": "text", "bbox": {"l": 306.11493, "t": 253.68451000000005, "r": 325.62674, "b": 258.74969, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "Granted", "bbox": {"l": 306.11493, "t": 253.68451000000005, "r": 325.62674, "b": 258.74969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 120, "label": "text", "bbox": {"l": 396.24661, "t": 253.68451000000005, "r": 400.75238, "b": 258.74969, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "0.", "bbox": {"l": 396.24661, "t": 253.68451000000005, "r": 400.75238, "b": 258.74969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 121, "label": "text", "bbox": {"l": 400.7529, "t": 253.68451000000005, "r": 403.75531, "b": 258.74969, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "5", "bbox": {"l": 400.7529, "t": 253.68451000000005, "r": 403.75531, "b": 258.74969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 122, "label": "text", "bbox": {"l": 429.81838999999997, "t": 253.68451000000005, "r": 437.32708999999994, "b": 258.74969, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "0.1", "bbox": {"l": 429.81838999999997, "t": 253.68451000000005, "r": 437.32708999999994, "b": 258.74969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 123, "label": "text", "bbox": {"l": 466.43579000000005, "t": 253.68451000000005, "r": 482.54831, "b": 258.74969, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "117.44", "bbox": {"l": 466.43579000000005, "t": 253.68451000000005, "r": 482.54831, "b": 258.74969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 124, "label": "text", "bbox": {"l": 514.29065, "t": 253.68451000000005, "r": 530.80981, "b": 258.74969, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "122.41", "bbox": {"l": 514.29065, "t": 253.68451000000005, "r": 530.80981, "b": 258.74969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 125, "label": "text", "bbox": {"l": 306.11493, "t": 261.54822, "r": 322.62866, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "Vested", "bbox": {"l": 306.11493, "t": 261.54822, "r": 322.62866, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 126, "label": "text", "bbox": {"l": 394.43222, "t": 261.54822, "r": 400.73563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "(0.", "bbox": {"l": 394.43222, "t": 261.54822, "r": 400.73563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 127, "label": "text", "bbox": {"l": 400.73456, "t": 261.54822, "r": 403.73697, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "5", "bbox": {"l": 400.73456, "t": 261.54822, "r": 403.73697, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 128, "label": "text", "bbox": {"l": 403.73804, "t": 261.54822, "r": 405.53625, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": ")", "bbox": {"l": 403.73804, "t": 261.54822, "r": 405.53625, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 129, "label": "text", "bbox": {"l": 427.7016, "t": 261.54822, "r": 438.80563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "(0.1)", "bbox": {"l": 427.7016, "t": 261.54822, "r": 438.80563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 130, "label": "text", "bbox": {"l": 468.55533, "t": 261.54822, "r": 482.07043, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "87.08", "bbox": {"l": 468.55533, "t": 261.54822, "r": 482.07043, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 131, "label": "text", "bbox": {"l": 516.01862, "t": 261.54822, "r": 529.53375, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": "81.14", "bbox": {"l": 516.01862, "t": 261.54822, "r": 529.53375, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 132, "label": "text", "bbox": {"l": 306.11493, "t": 269.64148, "r": 356.24771, "b": 274.70667000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 107, "text": "Canceled or forfeited", "bbox": {"l": 306.11493, "t": 269.64148, "r": 356.24771, "b": 274.70667000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 133, "label": "text", "bbox": {"l": 394.43222, "t": 270.31946000000005, "r": 400.73563, "b": 275.38464, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 108, "text": "(0.", "bbox": {"l": 394.43222, "t": 270.31946000000005, "r": 400.73563, "b": 275.38464, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 134, "label": "text", "bbox": {"l": 400.73456, "t": 270.31946000000005, "r": 403.73697, "b": 275.38464, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 109, "text": "1", "bbox": {"l": 400.73456, "t": 270.31946000000005, "r": 403.73697, "b": 275.38464, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 135, "label": "text", "bbox": {"l": 403.73804, "t": 270.31946000000005, "r": 405.53625, "b": 275.38464, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 110, "text": ")", "bbox": {"l": 403.73804, "t": 270.31946000000005, "r": 405.53625, "b": 275.38464, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 136, "label": "text", "bbox": {"l": 431.02802, "t": 270.31946000000005, "r": 436.4280099999999, "b": 275.38464, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 111, "text": "-", "bbox": {"l": 431.02802, "t": 270.31946000000005, "r": 436.4280099999999, "b": 275.38464, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 137, "label": "text", "bbox": {"l": 465.83099000000004, "t": 270.31946000000005, "r": 482.35013, "b": 275.38464, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 112, "text": "102.01", "bbox": {"l": 465.83099000000004, "t": 270.31946000000005, "r": 482.35013, "b": 275.38464, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 138, "label": "text", "bbox": {"l": 516.01862, "t": 270.31946000000005, "r": 529.53375, "b": 275.38464, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 113, "text": "92.18", "bbox": {"l": 516.01862, "t": 270.31946000000005, "r": 529.53375, "b": 275.38464, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 139, "label": "text", "bbox": {"l": 306.11493, "t": 278.48572, "r": 373.35764, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 114, "text": "Nonvested on December 31", "bbox": {"l": 306.11493, "t": 278.48572, "r": 373.35764, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 140, "label": "text", "bbox": {"l": 396.24661, "t": 278.48572, "r": 403.75531, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 115, "text": "1.0", "bbox": {"l": 396.24661, "t": 278.48572, "r": 403.75531, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 141, "label": "text", "bbox": {"l": 429.51599, "t": 278.48572, "r": 437.02469, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 116, "text": "0.3", "bbox": {"l": 429.51599, "t": 278.48572, "r": 437.02469, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 142, "label": "text", "bbox": {"l": 463.7142, "t": 278.48572, "r": 484.73965000000004, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 117, "text": "104.85 $", "bbox": {"l": 463.7142, "t": 278.48572, "r": 484.73965000000004, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 143, "label": "text", "bbox": {"l": 512.99463, "t": 278.48572, "r": 534.02008, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 118, "text": "$ 104.51", "bbox": {"l": 512.99463, "t": 278.48572, "r": 534.02008, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ecel", "ched", "lcel", "ched", "lcel", "nl", "ecel", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 7, "num_cols": 5, "table_cells": [{"bbox": {"l": 459.04861, "t": 221.62415, "r": 542.00018, "b": 232.89935000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 5, "text": "Weighted Average Grant Date Fair Value", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 393.2442, "t": 236.74712999999997, "r": 407.34631, "b": 241.81232, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "RS U s", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 392.09671, "t": 221.57446000000004, "r": 438.0145, "b": 226.63964999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 3, "text": "Shares (in millions)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 427.18323, "t": 236.74712999999997, "r": 440.98778999999996, "b": 241.81232, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "PSUs", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 468.38254, "t": 236.74712999999997, "r": 482.48465000000004, "b": 241.81232, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "RSUs", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 516.92578, "t": 236.74712999999997, "r": 530.73035, "b": 241.81232, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "PSUs", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 306.11493, "t": 244.61084000000005, "r": 364.65607, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Nonvested on Janua ry 1", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 396.24661, "t": 244.91327, "r": 403.75531, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "1. 1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 429.81838999999997, "t": 244.91327, "r": 437.32708999999994, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 465.52859, "t": 244.91327, "r": 483.55001999999996, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "90.10 $", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 513.44824, "t": 244.91327, "r": 531.46967, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "$ 91.19", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 306.11493, "t": 253.68451000000005, "r": 325.62674, "b": 258.74969, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Granted", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 396.24661, "t": 253.68451000000005, "r": 403.75531, "b": 258.74969, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "0. 5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 429.81838999999997, "t": 253.68451000000005, "r": 437.32708999999994, "b": 258.74969, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 466.43579000000005, "t": 253.68451000000005, "r": 482.54831, "b": 258.74969, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "117.44", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 514.29065, "t": 253.68451000000005, "r": 530.80981, "b": 258.74969, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "122.41", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 306.11493, "t": 261.54822, "r": 322.62866, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Vested", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 394.43222, "t": 261.54822, "r": 405.53625, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "(0. 5 )", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 427.7016, "t": 261.54822, "r": 438.80563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "(0.1)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 468.55533, "t": 261.54822, "r": 482.07043, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "87.08", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 516.01862, "t": 261.54822, "r": 529.53375, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "81.14", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 306.11493, "t": 269.64148, "r": 356.24771, "b": 274.70667000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Canceled or forfeited", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 394.43222, "t": 270.31946000000005, "r": 405.53625, "b": 275.38464, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "(0. 1 )", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 431.02802, "t": 270.31946000000005, "r": 436.4280099999999, "b": 275.38464, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 465.83099000000004, "t": 270.31946000000005, "r": 482.35013, "b": 275.38464, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "102.01", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 516.01862, "t": 270.31946000000005, "r": 529.53375, "b": 275.38464, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "92.18", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 306.11493, "t": 278.48572, "r": 373.35764, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Nonvested on December 31", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 396.24661, "t": 278.48572, "r": 403.75531, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "1.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 429.51599, "t": 278.48572, "r": 437.02469, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 463.7142, "t": 278.48572, "r": 484.73965000000004, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "104.85 $", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 512.99463, "t": 278.48572, "r": 534.02008, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "$ 104.51", "column_header": false, "row_header": false, "row_section": false}]}}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "caption", "id": 18, "page_no": 7, "cluster": {"id": 18, "label": "caption", "bbox": {"l": 53.811783000000005, "t": 208.23328000000004, "r": 385.93451, "b": 216.10645, "coord_origin": "TOPLEFT"}, "confidence": 0.5986505746841431, "cells": [{"id": 0, "text": "b.", "bbox": {"l": 53.811783000000005, "t": 208.23328000000004, "r": 62.219952, "b": 216.10645, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Structure predicted by TableFormer, with superimposed matched PDF cell text:", "bbox": {"l": 66.424026, "t": 208.23328000000004, "r": 385.93451, "b": 216.10645, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "b. Structure predicted by TableFormer, with superimposed matched PDF cell text:"}, {"label": "section_header", "id": 29, "page_no": 7, "cluster": {"id": 29, "label": "section_header", "bbox": {"l": 53.811783000000005, "t": 94.28112999999996, "r": 284.34592, "b": 102.15430000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.46452972292900085, "cells": [{"id": 2, "text": "Japanese language (previously unseen by TableFormer):", "bbox": {"l": 53.811783000000005, "t": 94.28112999999996, "r": 284.34592, "b": 102.15430000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Japanese language (previously unseen by TableFormer):"}, {"label": "section_header", "id": 31, "page_no": 7, "cluster": {"id": 31, "label": "section_header", "bbox": {"l": 304.83081, "t": 94.28112999999996, "r": 431.09119, "b": 102.15430000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.4629225730895996, "cells": [{"id": 3, "text": "Example table from FinTabNet:", "bbox": {"l": 304.83081, "t": 94.28112999999996, "r": 431.09119, "b": 102.15430000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Example table from FinTabNet:"}, {"label": "list_item", "id": 20, "page_no": 7, "cluster": {"id": 20, "label": "list_item", "bbox": {"l": 53.286037, "t": 78.68756000000008, "r": 61.550289, "b": 86.56073000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.5820134282112122, "cells": [{"id": 4, "text": "a.", "bbox": {"l": 53.286037, "t": 78.68756000000008, "r": 61.550289, "b": 86.56073000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "a."}, {"label": "list_item", "id": 21, "page_no": 7, "cluster": {"id": 21, "label": "list_item", "bbox": {"l": 65.682419, "t": 78.68756000000008, "r": 499.55563, "b": 86.56073000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.541211724281311, "cells": [{"id": 5, "text": "Red - PDF cells, Green - predicted bounding boxes, Blue - post-processed predictions matched to PDF cells", "bbox": {"l": 65.682419, "t": 78.68756000000008, "r": 499.55563, "b": 86.56073000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Red - PDF cells, Green - predicted bounding boxes, Blue - post-processed predictions matched to PDF cells"}, {"label": "table", "id": 8, "page_no": 7, "cluster": {"id": 8, "label": "table", "bbox": {"l": 53.62853240966797, "t": 218.94857788085938, "r": 298.5574951171875, "b": 292.39996337890625, "coord_origin": "TOPLEFT"}, "confidence": 0.8824009299278259, "cells": [{"id": 6, "text": "\u8ad6\u6587\u30d5\u30a1\u30a4\u30eb", "bbox": {"l": 209.93285, "t": 222.18073000000004, "r": 241.04458999999997, "b": 226.36212, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "\u53c2\u8003\u6587\u732e", "bbox": {"l": 263.76489, "t": 222.18073000000004, "r": 284.50589, "b": 226.36212, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "\u51fa\u5178", "bbox": {"l": 110.24990999999999, "t": 229.66594999999995, "r": 120.62018, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "\u30d5\u30a1\u30a4\u30eb", "bbox": {"l": 175.36609, "t": 229.66594999999995, "r": 196.1071, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "\u6570", "bbox": {"l": 196.10756, "t": 229.66594999999995, "r": 201.29247, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "\u82f1\u8a9e", "bbox": {"l": 209.62408, "t": 229.66594999999995, "r": 219.99435, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "\u65e5\u672c\u8a9e", "bbox": {"l": 229.19814, "t": 229.66594999999995, "r": 244.75377, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "\u82f1\u8a9e", "bbox": {"l": 256.1142, "t": 229.66594999999995, "r": 266.48447, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "\u65e5\u672c\u8a9e", "bbox": {"l": 278.38434, "t": 229.66594999999995, "r": 293.93997, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Association for Computational Linguistics(ACL2003)", "bbox": {"l": 55.53052099999999, "t": 236.42584, "r": 162.7131, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "65", "bbox": {"l": 184.39731, "t": 236.42584, "r": 189.56456, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "65", "bbox": {"l": 208.99026, "t": 236.42584, "r": 214.15752, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "0", "bbox": {"l": 234.87517, "t": 236.42584, "r": 237.45833000000002, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "150", "bbox": {"l": 256.88446, "t": 236.42584, "r": 264.6358, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "0", "bbox": {"l": 284.06134, "t": 236.42584, "r": 286.6445, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Computational Linguistics(COLING2002)", "bbox": {"l": 55.53052099999999, "t": 242.62048000000004, "r": 139.72253, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "140", "bbox": {"l": 183.10536, "t": 242.62048000000004, "r": 190.8567, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "140", "bbox": {"l": 207.69832, "t": 242.62048000000004, "r": 215.44965999999997, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "0", "bbox": {"l": 234.87517, "t": 242.62048000000004, "r": 237.45833000000002, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "150", "bbox": {"l": 256.88446, "t": 242.62048000000004, "r": 264.6358, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "0", "bbox": {"l": 284.06134, "t": 242.62048000000004, "r": 286.6445, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "\u96fb\u6c17\u60c5\u5831\u901a\u4fe1\u5b66\u4f1a", "bbox": {"l": 55.53052099999999, "t": 249.79845999999998, "r": 97.013, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "2003", "bbox": {"l": 92.698288, "t": 249.58942000000002, "r": 103.03371, "b": 253.94732999999997, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "\u5e74\u7dcf\u5408\u5927\u4f1a", "bbox": {"l": 103.03389, "t": 249.79845999999998, "r": 128.96027, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "150", "bbox": {"l": 183.10536, "t": 248.81506000000002, "r": 190.8567, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "8", "bbox": {"l": 210.28223, "t": 248.81506000000002, "r": 212.86539, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "142", "bbox": {"l": 232.29153, "t": 248.81506000000002, "r": 240.04287999999997, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "223", "bbox": {"l": 256.88446, "t": 248.81506000000002, "r": 264.6358, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "147", "bbox": {"l": 281.47742, "t": 248.81506000000002, "r": 289.22876, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "\u60c5\u5831\u51e6\u7406\u5b66\u4f1a\u7b2c", "bbox": {"l": 55.53052099999999, "t": 257.28369, "r": 91.827637, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "65", "bbox": {"l": 88.052673, "t": 257.07465, "r": 93.219925, "b": 261.43255999999997, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "\u56de\u5168\u56fd\u5927\u4f1a", "bbox": {"l": 93.220474, "t": 257.28369, "r": 119.14685, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "(2003)", "bbox": {"l": 116.45073999999998, "t": 257.07465, "r": 129.88177, "b": 261.43255999999997, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "177", "bbox": {"l": 183.10536, "t": 256.30029, "r": 190.8567, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "1", "bbox": {"l": 210.28223, "t": 256.30029, "r": 212.86539, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "176", "bbox": {"l": 232.29153, "t": 256.30029, "r": 240.04287999999997, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "150", "bbox": {"l": 256.88446, "t": 256.30029, "r": 264.6358, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "236", "bbox": {"l": 281.47742, "t": 256.30029, "r": 289.22876, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "\u7b2c", "bbox": {"l": 55.53052099999999, "t": 264.5108, "r": 60.715424, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "17", "bbox": {"l": 60.17654799999999, "t": 264.30175999999994, "r": 65.343796, "b": 268.65967, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "\u56de\u4eba\u5de5\u77e5\u80fd\u5b66\u4f1a\u5168\u56fd\u5927\u4f1a", "bbox": {"l": 65.344376, "t": 264.5108, "r": 122.38297000000001, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "(2003)", "bbox": {"l": 116.45073999999998, "t": 264.30175999999994, "r": 129.88177, "b": 268.65967, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "208", "bbox": {"l": 183.10536, "t": 263.52739999999994, "r": 190.8567, "b": 267.88531, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "5", "bbox": {"l": 210.28223, "t": 263.52739999999994, "r": 212.86539, "b": 267.88531, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "203", "bbox": {"l": 232.29153, "t": 263.52739999999994, "r": 240.04287999999997, "b": 267.88531, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "152", "bbox": {"l": 256.88446, "t": 263.52739999999994, "r": 264.6358, "b": 267.88531, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "244", "bbox": {"l": 281.47742, "t": 263.52739999999994, "r": 289.22876, "b": 267.88531, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "\u81ea\u7136\u8a00\u8a9e\u51e6\u7406\u7814\u7a76\u4f1a\u7b2c", "bbox": {"l": 55.53052099999999, "t": 271.73785, "r": 107.38374, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "146", "bbox": {"l": 101.99034, "t": 271.52881, "r": 109.74168000000002, "b": 275.88671999999997, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "\u301c", "bbox": {"l": 109.74204, "t": 271.73785, "r": 114.92695000000002, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "155", "bbox": {"l": 114.38793, "t": 271.52881, "r": 122.13927, "b": 275.88671999999997, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "\u56de", "bbox": {"l": 122.13963, "t": 271.73785, "r": 127.32454000000001, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "98", "bbox": {"l": 184.39731, "t": 270.75446, "r": 189.56456, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "2", "bbox": {"l": 210.28223, "t": 270.75446, "r": 212.86539, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "96", "bbox": {"l": 233.58348, "t": 270.75446, "r": 238.75072999999998, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "150", "bbox": {"l": 256.88446, "t": 270.75446, "r": 264.6358, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "232", "bbox": {"l": 281.47742, "t": 270.75446, "r": 289.22876, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "WWW", "bbox": {"l": 55.53052099999999, "t": 279.01392, "r": 68.68605, "b": 283.37183, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "\u304b\u3089\u53ce\u96c6\u3057\u305f\u8ad6\u6587", "bbox": {"l": 68.685814, "t": 279.22295999999994, "r": 110.16829999999999, "b": 283.40436, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "107", "bbox": {"l": 183.10536, "t": 277.98157000000003, "r": 190.8567, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "73", "bbox": {"l": 208.99026, "t": 277.98157000000003, "r": 214.15752, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "34", "bbox": {"l": 233.58348, "t": 277.98157000000003, "r": 238.75072999999998, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "147", "bbox": {"l": 256.88446, "t": 277.98157000000003, "r": 264.6358, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "96", "bbox": {"l": 282.76938, "t": 277.98157000000003, "r": 287.93661, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "\u8a08", "bbox": {"l": 169.61508, "t": 286.45004, "r": 174.79999, "b": 290.63141, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "945", "bbox": {"l": 183.10536, "t": 285.46667, "r": 190.8567, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "294", "bbox": {"l": 207.69832, "t": 285.46667, "r": 215.44965999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "651", "bbox": {"l": 232.29153, "t": 285.46667, "r": 240.04287999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "1122", "bbox": {"l": 255.76506, "t": 285.46667, "r": 265.75204, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "955", "bbox": {"l": 281.47742, "t": 285.46667, "r": 289.22876, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}], "children": [{"id": 32, "label": "text", "bbox": {"l": 209.93285, "t": 222.18073000000004, "r": 241.04458999999997, "b": 226.36212, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": "\u8ad6\u6587\u30d5\u30a1\u30a4\u30eb", "bbox": {"l": 209.93285, "t": 222.18073000000004, "r": 241.04458999999997, "b": 226.36212, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 263.76489, "t": 222.18073000000004, "r": 284.50589, "b": 226.36212, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "\u53c2\u8003\u6587\u732e", "bbox": {"l": 263.76489, "t": 222.18073000000004, "r": 284.50589, "b": 226.36212, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 110.24990999999999, "t": 229.66594999999995, "r": 120.62018, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "\u51fa\u5178", "bbox": {"l": 110.24990999999999, "t": 229.66594999999995, "r": 120.62018, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 175.36609, "t": 229.66594999999995, "r": 196.1071, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "\u30d5\u30a1\u30a4\u30eb", "bbox": {"l": 175.36609, "t": 229.66594999999995, "r": 196.1071, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 196.10756, "t": 229.66594999999995, "r": 201.29247, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "\u6570", "bbox": {"l": 196.10756, "t": 229.66594999999995, "r": 201.29247, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 209.62408, "t": 229.66594999999995, "r": 219.99435, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "\u82f1\u8a9e", "bbox": {"l": 209.62408, "t": 229.66594999999995, "r": 219.99435, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 229.19814, "t": 229.66594999999995, "r": 244.75377, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "\u65e5\u672c\u8a9e", "bbox": {"l": 229.19814, "t": 229.66594999999995, "r": 244.75377, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 256.1142, "t": 229.66594999999995, "r": 266.48447, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "\u82f1\u8a9e", "bbox": {"l": 256.1142, "t": 229.66594999999995, "r": 266.48447, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 278.38434, "t": 229.66594999999995, "r": 293.93997, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "\u65e5\u672c\u8a9e", "bbox": {"l": 278.38434, "t": 229.66594999999995, "r": 293.93997, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 55.53052099999999, "t": 236.42584, "r": 162.7131, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "Association for Computational Linguistics(ACL2003)", "bbox": {"l": 55.53052099999999, "t": 236.42584, "r": 162.7131, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 184.39731, "t": 236.42584, "r": 189.56456, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "65", "bbox": {"l": 184.39731, "t": 236.42584, "r": 189.56456, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 208.99026, "t": 236.42584, "r": 214.15752, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "65", "bbox": {"l": 208.99026, "t": 236.42584, "r": 214.15752, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 234.87517, "t": 236.42584, "r": 237.45833000000002, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "0", "bbox": {"l": 234.87517, "t": 236.42584, "r": 237.45833000000002, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 256.88446, "t": 236.42584, "r": 264.6358, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "150", "bbox": {"l": 256.88446, "t": 236.42584, "r": 264.6358, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 284.06134, "t": 236.42584, "r": 286.6445, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "0", "bbox": {"l": 284.06134, "t": 236.42584, "r": 286.6445, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 55.53052099999999, "t": 242.62048000000004, "r": 139.72253, "b": 246.97839, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "Computational Linguistics(COLING2002)", "bbox": {"l": 55.53052099999999, "t": 242.62048000000004, "r": 139.72253, "b": 246.97839, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 183.10536, "t": 242.62048000000004, "r": 190.8567, "b": 246.97839, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "140", "bbox": {"l": 183.10536, "t": 242.62048000000004, "r": 190.8567, "b": 246.97839, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 207.69832, "t": 242.62048000000004, "r": 215.44965999999997, "b": 246.97839, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "140", "bbox": {"l": 207.69832, "t": 242.62048000000004, "r": 215.44965999999997, "b": 246.97839, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 234.87517, "t": 242.62048000000004, "r": 237.45833000000002, "b": 246.97839, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "0", "bbox": {"l": 234.87517, "t": 242.62048000000004, "r": 237.45833000000002, "b": 246.97839, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 256.88446, "t": 242.62048000000004, "r": 264.6358, "b": 246.97839, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "150", "bbox": {"l": 256.88446, "t": 242.62048000000004, "r": 264.6358, "b": 246.97839, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 284.06134, "t": 242.62048000000004, "r": 286.6445, "b": 246.97839, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "0", "bbox": {"l": 284.06134, "t": 242.62048000000004, "r": 286.6445, "b": 246.97839, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 55.53052099999999, "t": 249.79845999999998, "r": 97.013, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "\u96fb\u6c17\u60c5\u5831\u901a\u4fe1\u5b66\u4f1a", "bbox": {"l": 55.53052099999999, "t": 249.79845999999998, "r": 97.013, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 92.698288, "t": 249.58942000000002, "r": 103.03371, "b": 253.94732999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "2003", "bbox": {"l": 92.698288, "t": 249.58942000000002, "r": 103.03371, "b": 253.94732999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 103.03389, "t": 249.79845999999998, "r": 128.96027, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "\u5e74\u7dcf\u5408\u5927\u4f1a", "bbox": {"l": 103.03389, "t": 249.79845999999998, "r": 128.96027, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 183.10536, "t": 248.81506000000002, "r": 190.8567, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "150", "bbox": {"l": 183.10536, "t": 248.81506000000002, "r": 190.8567, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 210.28223, "t": 248.81506000000002, "r": 212.86539, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "8", "bbox": {"l": 210.28223, "t": 248.81506000000002, "r": 212.86539, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 232.29153, "t": 248.81506000000002, "r": 240.04287999999997, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "142", "bbox": {"l": 232.29153, "t": 248.81506000000002, "r": 240.04287999999997, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 256.88446, "t": 248.81506000000002, "r": 264.6358, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "223", "bbox": {"l": 256.88446, "t": 248.81506000000002, "r": 264.6358, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 281.47742, "t": 248.81506000000002, "r": 289.22876, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "147", "bbox": {"l": 281.47742, "t": 248.81506000000002, "r": 289.22876, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 55.53052099999999, "t": 257.28369, "r": 91.827637, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "\u60c5\u5831\u51e6\u7406\u5b66\u4f1a\u7b2c", "bbox": {"l": 55.53052099999999, "t": 257.28369, "r": 91.827637, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 88.052673, "t": 257.07465, "r": 93.219925, "b": 261.43255999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "65", "bbox": {"l": 88.052673, "t": 257.07465, "r": 93.219925, "b": 261.43255999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 93.220474, "t": 257.28369, "r": 119.14685, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "\u56de\u5168\u56fd\u5927\u4f1a", "bbox": {"l": 93.220474, "t": 257.28369, "r": 119.14685, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 116.45073999999998, "t": 257.07465, "r": 129.88177, "b": 261.43255999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "(2003)", "bbox": {"l": 116.45073999999998, "t": 257.07465, "r": 129.88177, "b": 261.43255999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 183.10536, "t": 256.30029, "r": 190.8567, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "177", "bbox": {"l": 183.10536, "t": 256.30029, "r": 190.8567, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 210.28223, "t": 256.30029, "r": 212.86539, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "1", "bbox": {"l": 210.28223, "t": 256.30029, "r": 212.86539, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 232.29153, "t": 256.30029, "r": 240.04287999999997, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "176", "bbox": {"l": 232.29153, "t": 256.30029, "r": 240.04287999999997, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 256.88446, "t": 256.30029, "r": 264.6358, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "150", "bbox": {"l": 256.88446, "t": 256.30029, "r": 264.6358, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 281.47742, "t": 256.30029, "r": 289.22876, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "236", "bbox": {"l": 281.47742, "t": 256.30029, "r": 289.22876, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 55.53052099999999, "t": 264.5108, "r": 60.715424, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "\u7b2c", "bbox": {"l": 55.53052099999999, "t": 264.5108, "r": 60.715424, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 60.17654799999999, "t": 264.30175999999994, "r": 65.343796, "b": 268.65967, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "17", "bbox": {"l": 60.17654799999999, "t": 264.30175999999994, "r": 65.343796, "b": 268.65967, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 65.344376, "t": 264.5108, "r": 122.38297000000001, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "\u56de\u4eba\u5de5\u77e5\u80fd\u5b66\u4f1a\u5168\u56fd\u5927\u4f1a", "bbox": {"l": 65.344376, "t": 264.5108, "r": 122.38297000000001, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 116.45073999999998, "t": 264.30175999999994, "r": 129.88177, "b": 268.65967, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "(2003)", "bbox": {"l": 116.45073999999998, "t": 264.30175999999994, "r": 129.88177, "b": 268.65967, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 183.10536, "t": 263.52739999999994, "r": 190.8567, "b": 267.88531, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "208", "bbox": {"l": 183.10536, "t": 263.52739999999994, "r": 190.8567, "b": 267.88531, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 210.28223, "t": 263.52739999999994, "r": 212.86539, "b": 267.88531, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "5", "bbox": {"l": 210.28223, "t": 263.52739999999994, "r": 212.86539, "b": 267.88531, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 232.29153, "t": 263.52739999999994, "r": 240.04287999999997, "b": 267.88531, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "203", "bbox": {"l": 232.29153, "t": 263.52739999999994, "r": 240.04287999999997, "b": 267.88531, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 256.88446, "t": 263.52739999999994, "r": 264.6358, "b": 267.88531, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "152", "bbox": {"l": 256.88446, "t": 263.52739999999994, "r": 264.6358, "b": 267.88531, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 281.47742, "t": 263.52739999999994, "r": 289.22876, "b": 267.88531, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "244", "bbox": {"l": 281.47742, "t": 263.52739999999994, "r": 289.22876, "b": 267.88531, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 55.53052099999999, "t": 271.73785, "r": 107.38374, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "\u81ea\u7136\u8a00\u8a9e\u51e6\u7406\u7814\u7a76\u4f1a\u7b2c", "bbox": {"l": 55.53052099999999, "t": 271.73785, "r": 107.38374, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 101.99034, "t": 271.52881, "r": 109.74168000000002, "b": 275.88671999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "146", "bbox": {"l": 101.99034, "t": 271.52881, "r": 109.74168000000002, "b": 275.88671999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 109.74204, "t": 271.73785, "r": 114.92695000000002, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "\u301c", "bbox": {"l": 109.74204, "t": 271.73785, "r": 114.92695000000002, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 114.38793, "t": 271.52881, "r": 122.13927, "b": 275.88671999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "155", "bbox": {"l": 114.38793, "t": 271.52881, "r": 122.13927, "b": 275.88671999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 122.13963, "t": 271.73785, "r": 127.32454000000001, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "\u56de", "bbox": {"l": 122.13963, "t": 271.73785, "r": 127.32454000000001, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 184.39731, "t": 270.75446, "r": 189.56456, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "98", "bbox": {"l": 184.39731, "t": 270.75446, "r": 189.56456, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 210.28223, "t": 270.75446, "r": 212.86539, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "2", "bbox": {"l": 210.28223, "t": 270.75446, "r": 212.86539, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 233.58348, "t": 270.75446, "r": 238.75072999999998, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "96", "bbox": {"l": 233.58348, "t": 270.75446, "r": 238.75072999999998, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 256.88446, "t": 270.75446, "r": 264.6358, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "150", "bbox": {"l": 256.88446, "t": 270.75446, "r": 264.6358, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 281.47742, "t": 270.75446, "r": 289.22876, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "232", "bbox": {"l": 281.47742, "t": 270.75446, "r": 289.22876, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 55.53052099999999, "t": 279.01392, "r": 68.68605, "b": 283.37183, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "WWW", "bbox": {"l": 55.53052099999999, "t": 279.01392, "r": 68.68605, "b": 283.37183, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 68.685814, "t": 279.22295999999994, "r": 110.16829999999999, "b": 283.40436, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "\u304b\u3089\u53ce\u96c6\u3057\u305f\u8ad6\u6587", "bbox": {"l": 68.685814, "t": 279.22295999999994, "r": 110.16829999999999, "b": 283.40436, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 183.10536, "t": 277.98157000000003, "r": 190.8567, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "107", "bbox": {"l": 183.10536, "t": 277.98157000000003, "r": 190.8567, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 208.99026, "t": 277.98157000000003, "r": 214.15752, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "73", "bbox": {"l": 208.99026, "t": 277.98157000000003, "r": 214.15752, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 233.58348, "t": 277.98157000000003, "r": 238.75072999999998, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "34", "bbox": {"l": 233.58348, "t": 277.98157000000003, "r": 238.75072999999998, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 256.88446, "t": 277.98157000000003, "r": 264.6358, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "147", "bbox": {"l": 256.88446, "t": 277.98157000000003, "r": 264.6358, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 282.76938, "t": 277.98157000000003, "r": 287.93661, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "96", "bbox": {"l": 282.76938, "t": 277.98157000000003, "r": 287.93661, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 169.61508, "t": 286.45004, "r": 174.79999, "b": 290.63141, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "\u8a08", "bbox": {"l": 169.61508, "t": 286.45004, "r": 174.79999, "b": 290.63141, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 183.10536, "t": 285.46667, "r": 190.8567, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "945", "bbox": {"l": 183.10536, "t": 285.46667, "r": 190.8567, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 207.69832, "t": 285.46667, "r": 215.44965999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "294", "bbox": {"l": 207.69832, "t": 285.46667, "r": 215.44965999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 232.29153, "t": 285.46667, "r": 240.04287999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "651", "bbox": {"l": 232.29153, "t": 285.46667, "r": 240.04287999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 255.76506, "t": 285.46667, "r": 265.75204, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "1122", "bbox": {"l": 255.76506, "t": 285.46667, "r": 265.75204, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 281.47742, "t": 285.46667, "r": 289.22876, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "955", "bbox": {"l": 281.47742, "t": 285.46667, "r": 289.22876, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "lcel", "ched", "lcel", "nl", "ched", "ched", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 10, "num_cols": 6, "table_cells": [{"bbox": {"l": 209.93285, "t": 222.18073000000004, "r": 241.04458999999997, "b": 226.36212, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 4, "text": "\u8ad6\u6587\u30d5\u30a1\u30a4\u30eb", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 263.76489, "t": 222.18073000000004, "r": 284.50589, "b": 226.36212, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 4, "end_col_offset_idx": 6, "text": "\u53c2\u8003\u6587\u732e", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 110.24990999999999, "t": 229.66594999999995, "r": 120.62018, "b": 233.84735, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "\u51fa\u5178", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 175.36609, "t": 229.66594999999995, "r": 201.29247, "b": 233.84735, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "\u30d5\u30a1\u30a4\u30eb \u6570", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 209.62408, "t": 229.66594999999995, "r": 219.99435, "b": 233.84735, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "\u82f1\u8a9e", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 229.19814, "t": 229.66594999999995, "r": 244.75377, "b": 233.84735, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "\u65e5\u672c\u8a9e", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 256.1142, "t": 229.66594999999995, "r": 266.48447, "b": 233.84735, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "\u82f1\u8a9e", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 278.38434, "t": 229.66594999999995, "r": 293.93997, "b": 233.84735, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "\u65e5\u672c\u8a9e", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 55.53052099999999, "t": 236.42584, "r": 162.7131, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Association for Computational Linguistics(ACL2003)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 184.39731, "t": 236.42584, "r": 189.56456, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "65", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 208.99026, "t": 236.42584, "r": 214.15752, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "65", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 234.87517, "t": 236.42584, "r": 237.45833000000002, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446, "t": 236.42584, "r": 264.6358, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "150", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 284.06134, "t": 236.42584, "r": 286.6445, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 55.53052099999999, "t": 242.62048000000004, "r": 139.72253, "b": 246.97839, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Computational Linguistics(COLING2002)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 183.10536, "t": 242.62048000000004, "r": 190.8567, "b": 246.97839, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "140", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 207.69832, "t": 242.62048000000004, "r": 215.44965999999997, "b": 246.97839, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "140", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 234.87517, "t": 242.62048000000004, "r": 237.45833000000002, "b": 246.97839, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446, "t": 242.62048000000004, "r": 264.6358, "b": 246.97839, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "150", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 284.06134, "t": 242.62048000000004, "r": 286.6445, "b": 246.97839, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 55.53052099999999, "t": 249.58942000000002, "r": 128.96027, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "\u96fb\u6c17\u60c5\u5831\u901a\u4fe1\u5b66\u4f1a 2003 \u5e74\u7dcf\u5408\u5927\u4f1a", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 183.10536, "t": 248.81506000000002, "r": 190.8567, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "150", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 210.28223, "t": 248.81506000000002, "r": 212.86539, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.29153, "t": 248.81506000000002, "r": 240.04287999999997, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "142", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446, "t": 248.81506000000002, "r": 264.6358, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "223", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.47742, "t": 248.81506000000002, "r": 289.22876, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "147", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 55.53052099999999, "t": 257.07465, "r": 129.88177, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "\u60c5\u5831\u51e6\u7406\u5b66\u4f1a\u7b2c 65 \u56de\u5168\u56fd\u5927\u4f1a (2003)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 183.10536, "t": 256.30029, "r": 190.8567, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "177", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 210.28223, "t": 256.30029, "r": 212.86539, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.29153, "t": 256.30029, "r": 240.04287999999997, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "176", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446, "t": 256.30029, "r": 264.6358, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "150", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.47742, "t": 256.30029, "r": 289.22876, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "236", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 55.53052099999999, "t": 264.30175999999994, "r": 129.88177, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "\u7b2c 17 \u56de\u4eba\u5de5\u77e5\u80fd\u5b66\u4f1a\u5168\u56fd\u5927\u4f1a (2003)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 183.10536, "t": 263.52739999999994, "r": 190.8567, "b": 267.88531, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "208", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 210.28223, "t": 263.52739999999994, "r": 212.86539, "b": 267.88531, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.29153, "t": 263.52739999999994, "r": 240.04287999999997, "b": 267.88531, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "203", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446, "t": 263.52739999999994, "r": 264.6358, "b": 267.88531, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "152", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.47742, "t": 263.52739999999994, "r": 289.22876, "b": 267.88531, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "244", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 55.53052099999999, "t": 271.52881, "r": 127.32454000000001, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "\u81ea\u7136\u8a00\u8a9e\u51e6\u7406\u7814\u7a76\u4f1a\u7b2c 146 \u301c 155 \u56de", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 184.39731, "t": 270.75446, "r": 189.56456, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "98", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 210.28223, "t": 270.75446, "r": 212.86539, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 233.58348, "t": 270.75446, "r": 238.75072999999998, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446, "t": 270.75446, "r": 264.6358, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "150", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.47742, "t": 270.75446, "r": 289.22876, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "232", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 55.53052099999999, "t": 279.01392, "r": 110.16829999999999, "b": 283.40436, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "WWW \u304b\u3089\u53ce\u96c6\u3057\u305f\u8ad6\u6587", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 183.10536, "t": 277.98157000000003, "r": 190.8567, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "107", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 208.99026, "t": 277.98157000000003, "r": 214.15752, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "73", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 233.58348, "t": 277.98157000000003, "r": 238.75072999999998, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "34", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446, "t": 277.98157000000003, "r": 264.6358, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "147", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 282.76938, "t": 277.98157000000003, "r": 287.93661, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 183.10536, "t": 285.46667, "r": 190.8567, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "945", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 207.69832, "t": 285.46667, "r": 215.44965999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "294", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.29153, "t": 285.46667, "r": 240.04287999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "651", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 255.76506, "t": 285.46667, "r": 265.75204, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "1122", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.47742, "t": 285.46667, "r": 289.22876, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "955", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "caption", "id": 16, "page_no": 7, "cluster": {"id": 16, "label": "caption", "bbox": {"l": 380.42731, "t": 292.30426, "r": 549.42175, "b": 298.60284, "coord_origin": "TOPLEFT"}, "confidence": 0.7499915957450867, "cells": [{"id": 76, "text": "Text is aligned to match original for ease of viewing", "bbox": {"l": 380.42731, "t": 292.30426, "r": 549.42175, "b": 298.60284, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Text is aligned to match original for ease of viewing"}, {"label": "table", "id": 7, "page_no": 7, "cluster": {"id": 7, "label": "table", "bbox": {"l": 304.9219970703125, "t": 218.51486206054688, "r": 550.2321166992188, "b": 287.90069580078125, "coord_origin": "TOPLEFT"}, "confidence": 0.8899767994880676, "cells": [{"id": 77, "text": "Weighted Average Grant Date Fair", "bbox": {"l": 459.04861, "t": 221.62415, "r": 542.00018, "b": 226.68933000000004, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "Value", "bbox": {"l": 493.82193, "t": 227.83416999999997, "r": 507.2258, "b": 232.89935000000003, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "RS", "bbox": {"l": 393.2442, "t": 236.74712999999997, "r": 400.74588, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "U", "bbox": {"l": 400.74643, "t": 236.74712999999997, "r": 404.64523, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "s", "bbox": {"l": 404.6463, "t": 236.74712999999997, "r": 407.34631, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "Shares (in millions)", "bbox": {"l": 392.09671, "t": 221.57446000000004, "r": 438.0145, "b": 226.63964999999996, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "PSUs", "bbox": {"l": 427.18323, "t": 236.74712999999997, "r": 440.98778999999996, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "RSUs", "bbox": {"l": 468.38254, "t": 236.74712999999997, "r": 482.48465000000004, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "PSUs", "bbox": {"l": 516.92578, "t": 236.74712999999997, "r": 530.73035, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Nonvested on Janua", "bbox": {"l": 306.11493, "t": 244.61084000000005, "r": 355.6532, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "ry 1", "bbox": {"l": 355.65427, "t": 244.61084000000005, "r": 364.65607, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "1.", "bbox": {"l": 396.24661, "t": 244.91327, "r": 400.75238, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "1", "bbox": {"l": 400.7529, "t": 244.91327, "r": 403.75531, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "0.3", "bbox": {"l": 429.81838999999997, "t": 244.91327, "r": 437.32708999999994, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "90.10", "bbox": {"l": 465.52859, "t": 244.91327, "r": 478.40103, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "$", "bbox": {"l": 480.97552, "t": 244.91327, "r": 483.55001999999996, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "$ 91.19", "bbox": {"l": 513.44824, "t": 244.91327, "r": 531.46967, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "Granted", "bbox": {"l": 306.11493, "t": 253.68451000000005, "r": 325.62674, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "0.", "bbox": {"l": 396.24661, "t": 253.68451000000005, "r": 400.75238, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "5", "bbox": {"l": 400.7529, "t": 253.68451000000005, "r": 403.75531, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "0.1", "bbox": {"l": 429.81838999999997, "t": 253.68451000000005, "r": 437.32708999999994, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "117.44", "bbox": {"l": 466.43579000000005, "t": 253.68451000000005, "r": 482.54831, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "122.41", "bbox": {"l": 514.29065, "t": 253.68451000000005, "r": 530.80981, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "Vested", "bbox": {"l": 306.11493, "t": 261.54822, "r": 322.62866, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "(0.", "bbox": {"l": 394.43222, "t": 261.54822, "r": 400.73563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "5", "bbox": {"l": 400.73456, "t": 261.54822, "r": 403.73697, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": ")", "bbox": {"l": 403.73804, "t": 261.54822, "r": 405.53625, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "(0.1)", "bbox": {"l": 427.7016, "t": 261.54822, "r": 438.80563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "87.08", "bbox": {"l": 468.55533, "t": 261.54822, "r": 482.07043, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "81.14", "bbox": {"l": 516.01862, "t": 261.54822, "r": 529.53375, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "Canceled or forfeited", "bbox": {"l": 306.11493, "t": 269.64148, "r": 356.24771, "b": 274.70667000000003, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "(0.", "bbox": {"l": 394.43222, "t": 270.31946000000005, "r": 400.73563, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "1", "bbox": {"l": 400.73456, "t": 270.31946000000005, "r": 403.73697, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": ")", "bbox": {"l": 403.73804, "t": 270.31946000000005, "r": 405.53625, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "-", "bbox": {"l": 431.02802, "t": 270.31946000000005, "r": 436.4280099999999, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "102.01", "bbox": {"l": 465.83099000000004, "t": 270.31946000000005, "r": 482.35013, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "92.18", "bbox": {"l": 516.01862, "t": 270.31946000000005, "r": 529.53375, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "Nonvested on December 31", "bbox": {"l": 306.11493, "t": 278.48572, "r": 373.35764, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "1.0", "bbox": {"l": 396.24661, "t": 278.48572, "r": 403.75531, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "0.3", "bbox": {"l": 429.51599, "t": 278.48572, "r": 437.02469, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "104.85 $", "bbox": {"l": 463.7142, "t": 278.48572, "r": 484.73965000000004, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "$ 104.51", "bbox": {"l": 512.99463, "t": 278.48572, "r": 534.02008, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}], "children": [{"id": 102, "label": "text", "bbox": {"l": 459.04861, "t": 221.62415, "r": 542.00018, "b": 226.68933000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "Weighted Average Grant Date Fair", "bbox": {"l": 459.04861, "t": 221.62415, "r": 542.00018, "b": 226.68933000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 493.82193, "t": 227.83416999999997, "r": 507.2258, "b": 232.89935000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "Value", "bbox": {"l": 493.82193, "t": 227.83416999999997, "r": 507.2258, "b": 232.89935000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 393.2442, "t": 236.74712999999997, "r": 400.74588, "b": 241.81232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "RS", "bbox": {"l": 393.2442, "t": 236.74712999999997, "r": 400.74588, "b": 241.81232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 400.74643, "t": 236.74712999999997, "r": 404.64523, "b": 241.81232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "U", "bbox": {"l": 400.74643, "t": 236.74712999999997, "r": 404.64523, "b": 241.81232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 404.6463, "t": 236.74712999999997, "r": 407.34631, "b": 241.81232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "s", "bbox": {"l": 404.6463, "t": 236.74712999999997, "r": 407.34631, "b": 241.81232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 392.09671, "t": 221.57446000000004, "r": 438.0145, "b": 226.63964999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "Shares (in millions)", "bbox": {"l": 392.09671, "t": 221.57446000000004, "r": 438.0145, "b": 226.63964999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 427.18323, "t": 236.74712999999997, "r": 440.98778999999996, "b": 241.81232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "PSUs", "bbox": {"l": 427.18323, "t": 236.74712999999997, "r": 440.98778999999996, "b": 241.81232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 468.38254, "t": 236.74712999999997, "r": 482.48465000000004, "b": 241.81232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "RSUs", "bbox": {"l": 468.38254, "t": 236.74712999999997, "r": 482.48465000000004, "b": 241.81232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 516.92578, "t": 236.74712999999997, "r": 530.73035, "b": 241.81232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "PSUs", "bbox": {"l": 516.92578, "t": 236.74712999999997, "r": 530.73035, "b": 241.81232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 306.11493, "t": 244.61084000000005, "r": 355.6532, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "Nonvested on Janua", "bbox": {"l": 306.11493, "t": 244.61084000000005, "r": 355.6532, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 355.65427, "t": 244.61084000000005, "r": 364.65607, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "ry 1", "bbox": {"l": 355.65427, "t": 244.61084000000005, "r": 364.65607, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 396.24661, "t": 244.91327, "r": 400.75238, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "1.", "bbox": {"l": 396.24661, "t": 244.91327, "r": 400.75238, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 114, "label": "text", "bbox": {"l": 400.7529, "t": 244.91327, "r": 403.75531, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "1", "bbox": {"l": 400.7529, "t": 244.91327, "r": 403.75531, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 115, "label": "text", "bbox": {"l": 429.81838999999997, "t": 244.91327, "r": 437.32708999999994, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "0.3", "bbox": {"l": 429.81838999999997, "t": 244.91327, "r": 437.32708999999994, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 116, "label": "text", "bbox": {"l": 465.52859, "t": 244.91327, "r": 478.40103, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "90.10", "bbox": {"l": 465.52859, "t": 244.91327, "r": 478.40103, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 117, "label": "text", "bbox": {"l": 480.97552, "t": 244.91327, "r": 483.55001999999996, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "$", "bbox": {"l": 480.97552, "t": 244.91327, "r": 483.55001999999996, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 118, "label": "text", "bbox": {"l": 513.44824, "t": 244.91327, "r": 531.46967, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "$ 91.19", "bbox": {"l": 513.44824, "t": 244.91327, "r": 531.46967, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 119, "label": "text", "bbox": {"l": 306.11493, "t": 253.68451000000005, "r": 325.62674, "b": 258.74969, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "Granted", "bbox": {"l": 306.11493, "t": 253.68451000000005, "r": 325.62674, "b": 258.74969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 120, "label": "text", "bbox": {"l": 396.24661, "t": 253.68451000000005, "r": 400.75238, "b": 258.74969, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "0.", "bbox": {"l": 396.24661, "t": 253.68451000000005, "r": 400.75238, "b": 258.74969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 121, "label": "text", "bbox": {"l": 400.7529, "t": 253.68451000000005, "r": 403.75531, "b": 258.74969, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "5", "bbox": {"l": 400.7529, "t": 253.68451000000005, "r": 403.75531, "b": 258.74969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 122, "label": "text", "bbox": {"l": 429.81838999999997, "t": 253.68451000000005, "r": 437.32708999999994, "b": 258.74969, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "0.1", "bbox": {"l": 429.81838999999997, "t": 253.68451000000005, "r": 437.32708999999994, "b": 258.74969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 123, "label": "text", "bbox": {"l": 466.43579000000005, "t": 253.68451000000005, "r": 482.54831, "b": 258.74969, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "117.44", "bbox": {"l": 466.43579000000005, "t": 253.68451000000005, "r": 482.54831, "b": 258.74969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 124, "label": "text", "bbox": {"l": 514.29065, "t": 253.68451000000005, "r": 530.80981, "b": 258.74969, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "122.41", "bbox": {"l": 514.29065, "t": 253.68451000000005, "r": 530.80981, "b": 258.74969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 125, "label": "text", "bbox": {"l": 306.11493, "t": 261.54822, "r": 322.62866, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "Vested", "bbox": {"l": 306.11493, "t": 261.54822, "r": 322.62866, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 126, "label": "text", "bbox": {"l": 394.43222, "t": 261.54822, "r": 400.73563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "(0.", "bbox": {"l": 394.43222, "t": 261.54822, "r": 400.73563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 127, "label": "text", "bbox": {"l": 400.73456, "t": 261.54822, "r": 403.73697, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "5", "bbox": {"l": 400.73456, "t": 261.54822, "r": 403.73697, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 128, "label": "text", "bbox": {"l": 403.73804, "t": 261.54822, "r": 405.53625, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": ")", "bbox": {"l": 403.73804, "t": 261.54822, "r": 405.53625, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 129, "label": "text", "bbox": {"l": 427.7016, "t": 261.54822, "r": 438.80563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "(0.1)", "bbox": {"l": 427.7016, "t": 261.54822, "r": 438.80563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 130, "label": "text", "bbox": {"l": 468.55533, "t": 261.54822, "r": 482.07043, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "87.08", "bbox": {"l": 468.55533, "t": 261.54822, "r": 482.07043, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 131, "label": "text", "bbox": {"l": 516.01862, "t": 261.54822, "r": 529.53375, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": "81.14", "bbox": {"l": 516.01862, "t": 261.54822, "r": 529.53375, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 132, "label": "text", "bbox": {"l": 306.11493, "t": 269.64148, "r": 356.24771, "b": 274.70667000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 107, "text": "Canceled or forfeited", "bbox": {"l": 306.11493, "t": 269.64148, "r": 356.24771, "b": 274.70667000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 133, "label": "text", "bbox": {"l": 394.43222, "t": 270.31946000000005, "r": 400.73563, "b": 275.38464, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 108, "text": "(0.", "bbox": {"l": 394.43222, "t": 270.31946000000005, "r": 400.73563, "b": 275.38464, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 134, "label": "text", "bbox": {"l": 400.73456, "t": 270.31946000000005, "r": 403.73697, "b": 275.38464, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 109, "text": "1", "bbox": {"l": 400.73456, "t": 270.31946000000005, "r": 403.73697, "b": 275.38464, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 135, "label": "text", "bbox": {"l": 403.73804, "t": 270.31946000000005, "r": 405.53625, "b": 275.38464, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 110, "text": ")", "bbox": {"l": 403.73804, "t": 270.31946000000005, "r": 405.53625, "b": 275.38464, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 136, "label": "text", "bbox": {"l": 431.02802, "t": 270.31946000000005, "r": 436.4280099999999, "b": 275.38464, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 111, "text": "-", "bbox": {"l": 431.02802, "t": 270.31946000000005, "r": 436.4280099999999, "b": 275.38464, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 137, "label": "text", "bbox": {"l": 465.83099000000004, "t": 270.31946000000005, "r": 482.35013, "b": 275.38464, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 112, "text": "102.01", "bbox": {"l": 465.83099000000004, "t": 270.31946000000005, "r": 482.35013, "b": 275.38464, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 138, "label": "text", "bbox": {"l": 516.01862, "t": 270.31946000000005, "r": 529.53375, "b": 275.38464, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 113, "text": "92.18", "bbox": {"l": 516.01862, "t": 270.31946000000005, "r": 529.53375, "b": 275.38464, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 139, "label": "text", "bbox": {"l": 306.11493, "t": 278.48572, "r": 373.35764, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 114, "text": "Nonvested on December 31", "bbox": {"l": 306.11493, "t": 278.48572, "r": 373.35764, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 140, "label": "text", "bbox": {"l": 396.24661, "t": 278.48572, "r": 403.75531, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 115, "text": "1.0", "bbox": {"l": 396.24661, "t": 278.48572, "r": 403.75531, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 141, "label": "text", "bbox": {"l": 429.51599, "t": 278.48572, "r": 437.02469, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 116, "text": "0.3", "bbox": {"l": 429.51599, "t": 278.48572, "r": 437.02469, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 142, "label": "text", "bbox": {"l": 463.7142, "t": 278.48572, "r": 484.73965000000004, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 117, "text": "104.85 $", "bbox": {"l": 463.7142, "t": 278.48572, "r": 484.73965000000004, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 143, "label": "text", "bbox": {"l": 512.99463, "t": 278.48572, "r": 534.02008, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 118, "text": "$ 104.51", "bbox": {"l": 512.99463, "t": 278.48572, "r": 534.02008, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ecel", "ched", "lcel", "ched", "lcel", "nl", "ecel", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 7, "num_cols": 5, "table_cells": [{"bbox": {"l": 459.04861, "t": 221.62415, "r": 542.00018, "b": 232.89935000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 5, "text": "Weighted Average Grant Date Fair Value", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 393.2442, "t": 236.74712999999997, "r": 407.34631, "b": 241.81232, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "RS U s", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 392.09671, "t": 221.57446000000004, "r": 438.0145, "b": 226.63964999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 3, "text": "Shares (in millions)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 427.18323, "t": 236.74712999999997, "r": 440.98778999999996, "b": 241.81232, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "PSUs", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 468.38254, "t": 236.74712999999997, "r": 482.48465000000004, "b": 241.81232, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "RSUs", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 516.92578, "t": 236.74712999999997, "r": 530.73035, "b": 241.81232, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "PSUs", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 306.11493, "t": 244.61084000000005, "r": 364.65607, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Nonvested on Janua ry 1", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 396.24661, "t": 244.91327, "r": 403.75531, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "1. 1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 429.81838999999997, "t": 244.91327, "r": 437.32708999999994, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 465.52859, "t": 244.91327, "r": 483.55001999999996, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "90.10 $", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 513.44824, "t": 244.91327, "r": 531.46967, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "$ 91.19", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 306.11493, "t": 253.68451000000005, "r": 325.62674, "b": 258.74969, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Granted", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 396.24661, "t": 253.68451000000005, "r": 403.75531, "b": 258.74969, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "0. 5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 429.81838999999997, "t": 253.68451000000005, "r": 437.32708999999994, "b": 258.74969, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 466.43579000000005, "t": 253.68451000000005, "r": 482.54831, "b": 258.74969, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "117.44", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 514.29065, "t": 253.68451000000005, "r": 530.80981, "b": 258.74969, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "122.41", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 306.11493, "t": 261.54822, "r": 322.62866, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Vested", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 394.43222, "t": 261.54822, "r": 405.53625, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "(0. 5 )", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 427.7016, "t": 261.54822, "r": 438.80563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "(0.1)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 468.55533, "t": 261.54822, "r": 482.07043, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "87.08", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 516.01862, "t": 261.54822, "r": 529.53375, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "81.14", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 306.11493, "t": 269.64148, "r": 356.24771, "b": 274.70667000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Canceled or forfeited", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 394.43222, "t": 270.31946000000005, "r": 405.53625, "b": 275.38464, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "(0. 1 )", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 431.02802, "t": 270.31946000000005, "r": 436.4280099999999, "b": 275.38464, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 465.83099000000004, "t": 270.31946000000005, "r": 482.35013, "b": 275.38464, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "102.01", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 516.01862, "t": 270.31946000000005, "r": 529.53375, "b": 275.38464, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "92.18", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 306.11493, "t": 278.48572, "r": 373.35764, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Nonvested on December 31", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 396.24661, "t": 278.48572, "r": 403.75531, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "1.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 429.51599, "t": 278.48572, "r": 437.02469, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 463.7142, "t": 278.48572, "r": 484.73965000000004, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "104.85 $", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 512.99463, "t": 278.48572, "r": 534.02008, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "$ 104.51", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "caption", "id": 6, "page_no": 7, "cluster": {"id": 6, "label": "caption", "bbox": {"l": 50.112, "t": 320.87735, "r": 545.11377, "b": 365.64987, "coord_origin": "TOPLEFT"}, "confidence": 0.9140303134918213, "cells": [{"id": 119, "text": "Figure 5:", "bbox": {"l": 50.112, "t": 320.87735, "r": 86.864021, "b": 329.78391, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "One of the benefits of TableFormer is that it is language agnostic, as an example, the left part of the illustration", "bbox": {"l": 93.917542, "t": 320.87735, "r": 545.11371, "b": 329.78391, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "demonstrates TableFormer predictions on previously unseen language (Japanese). Additionally, we see that TableFormer is", "bbox": {"l": 50.112, "t": 332.83233999999993, "r": 545.11371, "b": 341.73889, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "robust to variability in style and content, right side of the illustration shows the example of the TableFormer prediction from", "bbox": {"l": 50.112, "t": 344.78732, "r": 545.11377, "b": 353.69388, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "the FinTabNet dataset.", "bbox": {"l": 50.112, "t": 356.74332, "r": 139.79532, "b": 365.64987, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 5: One of the benefits of TableFormer is that it is language agnostic, as an example, the left part of the illustration demonstrates TableFormer predictions on previously unseen language (Japanese). Additionally, we see that TableFormer is robust to variability in style and content, right side of the illustration shows the example of the TableFormer prediction from the FinTabNet dataset."}, {"label": "picture", "id": 12, "page_no": 7, "cluster": {"id": 12, "label": "picture", "bbox": {"l": 216.76925659179688, "t": 380.4906311035156, "r": 375.7829284667969, "b": 443.34698486328125, "coord_origin": "TOPLEFT"}, "confidence": 0.805853009223938, "cells": [{"id": 124, "text": "Red - PDF cells, Green - predicted bounding boxes", "bbox": {"l": 220.26282, "t": 381.77722, "r": 342.07819, "b": 386.44281, "coord_origin": "TOPLEFT"}}], "children": [{"id": 144, "label": "text", "bbox": {"l": 220.26282, "t": 381.77722, "r": 342.07819, "b": 386.44281, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 124, "text": "Red - PDF cells, Green - predicted bounding boxes", "bbox": {"l": 220.26282, "t": 381.77722, "r": 342.07819, "b": 386.44281, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "picture", "id": 11, "page_no": 7, "cluster": {"id": 11, "label": "picture", "bbox": {"l": 51.736167907714844, "t": 380.48065185546875, "r": 211.83778381347656, "b": 443.6580810546875, "coord_origin": "TOPLEFT"}, "confidence": 0.8308426737785339, "cells": [{"id": 125, "text": "Ground Truth", "bbox": {"l": 53.715248, "t": 381.77722, "r": 85.657333, "b": 386.44281, "coord_origin": "TOPLEFT"}}], "children": [{"id": 145, "label": "text", "bbox": {"l": 53.715248, "t": 381.77722, "r": 85.657333, "b": 386.44281, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 125, "text": "Ground Truth", "bbox": {"l": 53.715248, "t": 381.77722, "r": 85.657333, "b": 386.44281, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "picture", "id": 13, "page_no": 7, "cluster": {"id": 13, "label": "picture", "bbox": {"l": 383.1364440917969, "t": 381.2313232421875, "r": 542.1132202148438, "b": 442.7749328613281, "coord_origin": "TOPLEFT"}, "confidence": 0.7881615161895752, "cells": [{"id": 126, "text": "16", "bbox": {"l": 437.37939, "t": 400.55295, "r": 443.69870000000003, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "17", "bbox": {"l": 450.33203, "t": 400.55295, "r": 456.6513100000001, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "18", "bbox": {"l": 463.28464, "t": 400.55295, "r": 469.60394, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "19", "bbox": {"l": 476.23724000000004, "t": 400.55295, "r": 482.5565500000001, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "20", "bbox": {"l": 489.18988, "t": 400.55295, "r": 495.50916, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "21", "bbox": {"l": 502.14251999999993, "t": 400.55295, "r": 508.46178999999995, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "22", "bbox": {"l": 515.09509, "t": 400.55295, "r": 521.41443, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "23", "bbox": {"l": 385.2814, "t": 411.03836000000007, "r": 391.60071, "b": 417.35699, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "24", "bbox": {"l": 398.52341, "t": 411.03836000000007, "r": 404.84271, "b": 417.35699, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "25", "bbox": {"l": 411.47604, "t": 411.03836000000007, "r": 417.79535, "b": 417.35699, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "26", "bbox": {"l": 437.37939, "t": 411.03836000000007, "r": 443.69870000000003, "b": 417.35699, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "27", "bbox": {"l": 450.33203, "t": 411.03836000000007, "r": 456.6513100000001, "b": 417.35699, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "28", "bbox": {"l": 463.28464, "t": 411.03836000000007, "r": 469.60394, "b": 417.35699, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "30", "bbox": {"l": 385.2814, "t": 421.0697, "r": 391.60071, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "31", "bbox": {"l": 398.52341, "t": 421.0697, "r": 404.84271, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "32", "bbox": {"l": 411.47604, "t": 421.0697, "r": 417.79532, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "33", "bbox": {"l": 424.42865, "t": 421.0697, "r": 430.74796, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "34", "bbox": {"l": 437.38129, "t": 421.0697, "r": 443.70056, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "35", "bbox": {"l": 450.33389000000005, "t": 421.0697, "r": 456.65319999999997, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "36", "bbox": {"l": 463.2865, "t": 421.0697, "r": 469.6058, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "37", "bbox": {"l": 476.23914, "t": 421.0697, "r": 482.55841, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "38", "bbox": {"l": 489.1917700000001, "t": 421.0697, "r": 495.51105, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "39", "bbox": {"l": 502.14438, "t": 421.0697, "r": 508.46368, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "40", "bbox": {"l": 515.09705, "t": 421.0697, "r": 521.41632, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "41", "bbox": {"l": 528.04962, "t": 421.0697, "r": 534.3689, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "42", "bbox": {"l": 385.2814, "t": 432.04431, "r": 391.60071, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "43", "bbox": {"l": 398.52341, "t": 432.04431, "r": 404.84271, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "44", "bbox": {"l": 411.47604, "t": 432.04431, "r": 417.79532, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "45", "bbox": {"l": 424.42865, "t": 432.04431, "r": 430.74796, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "46", "bbox": {"l": 437.38129, "t": 432.04431, "r": 443.70056, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "47", "bbox": {"l": 450.33389000000005, "t": 432.04431, "r": 456.65319999999997, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "48", "bbox": {"l": 463.2865, "t": 432.04431, "r": 469.6058, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "49", "bbox": {"l": 476.23914, "t": 432.04431, "r": 482.55841, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "50", "bbox": {"l": 489.1917700000001, "t": 432.04431, "r": 495.51105, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "51", "bbox": {"l": 502.14438, "t": 432.04431, "r": 508.46368, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "52", "bbox": {"l": 515.09705, "t": 432.04431, "r": 521.41632, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "53", "bbox": {"l": 528.04962, "t": 432.04431, "r": 534.3689, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "0", "bbox": {"l": 385.2814, "t": 389.20004, "r": 388.44073, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "1", "bbox": {"l": 398.52341, "t": 389.20004, "r": 401.68274, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "2", "bbox": {"l": 411.4754, "t": 389.20004, "r": 414.63474, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "3", "bbox": {"l": 424.4274, "t": 389.20004, "r": 427.58673, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "4", "bbox": {"l": 437.37939, "t": 389.20004, "r": 440.53870000000006, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "5", "bbox": {"l": 450.33136, "t": 389.20004, "r": 453.49069000000003, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "6", "bbox": {"l": 463.28336, "t": 389.20004, "r": 466.44269, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "7", "bbox": {"l": 476.23535, "t": 389.20004, "r": 479.39468, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "8", "bbox": {"l": 489.18735, "t": 389.20004, "r": 492.34668, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "9", "bbox": {"l": 502.13933999999995, "t": 389.20004, "r": 505.29868000000005, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "10", "bbox": {"l": 515.09131, "t": 389.20004, "r": 521.41064, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "11", "bbox": {"l": 528.04364, "t": 389.20004, "r": 534.13104, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "12", "bbox": {"l": 385.2814, "t": 398.97464, "r": 391.60071, "b": 405.29327, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "13", "bbox": {"l": 398.52341, "t": 398.97464, "r": 404.84271, "b": 405.29327, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "14", "bbox": {"l": 411.47604, "t": 398.97464, "r": 417.79535, "b": 405.29327, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "15", "bbox": {"l": 424.42719, "t": 406.77463000000006, "r": 430.74648999999994, "b": 413.09326, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "29", "bbox": {"l": 502.86941999999993, "t": 410.99438, "r": 509.18871999999993, "b": 417.31302, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "Predicted Structure", "bbox": {"l": 384.35437, "t": 381.77722, "r": 430.99261, "b": 386.44281, "coord_origin": "TOPLEFT"}}], "children": [{"id": 146, "label": "text", "bbox": {"l": 437.37939, "t": 400.55295, "r": 443.69870000000003, "b": 406.87158, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 126, "text": "16", "bbox": {"l": 437.37939, "t": 400.55295, "r": 443.69870000000003, "b": 406.87158, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 147, "label": "text", "bbox": {"l": 450.33203, "t": 400.55295, "r": 456.6513100000001, "b": 406.87158, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 127, "text": "17", "bbox": {"l": 450.33203, "t": 400.55295, "r": 456.6513100000001, "b": 406.87158, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 148, "label": "text", "bbox": {"l": 463.28464, "t": 400.55295, "r": 469.60394, "b": 406.87158, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 128, "text": "18", "bbox": {"l": 463.28464, "t": 400.55295, "r": 469.60394, "b": 406.87158, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 149, "label": "text", "bbox": {"l": 476.23724000000004, "t": 400.55295, "r": 482.5565500000001, "b": 406.87158, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 129, "text": "19", "bbox": {"l": 476.23724000000004, "t": 400.55295, "r": 482.5565500000001, "b": 406.87158, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 150, "label": "text", "bbox": {"l": 489.18988, "t": 400.55295, "r": 495.50916, "b": 406.87158, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 130, "text": "20", "bbox": {"l": 489.18988, "t": 400.55295, "r": 495.50916, "b": 406.87158, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 151, "label": "text", "bbox": {"l": 502.14251999999993, "t": 400.55295, "r": 508.46178999999995, "b": 406.87158, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 131, "text": "21", "bbox": {"l": 502.14251999999993, "t": 400.55295, "r": 508.46178999999995, "b": 406.87158, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 152, "label": "text", "bbox": {"l": 515.09509, "t": 400.55295, "r": 521.41443, "b": 406.87158, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 132, "text": "22", "bbox": {"l": 515.09509, "t": 400.55295, "r": 521.41443, "b": 406.87158, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 153, "label": "text", "bbox": {"l": 385.2814, "t": 411.03836000000007, "r": 391.60071, "b": 417.35699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 133, "text": "23", "bbox": {"l": 385.2814, "t": 411.03836000000007, "r": 391.60071, "b": 417.35699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 154, "label": "text", "bbox": {"l": 398.52341, "t": 411.03836000000007, "r": 404.84271, "b": 417.35699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 134, "text": "24", "bbox": {"l": 398.52341, "t": 411.03836000000007, "r": 404.84271, "b": 417.35699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 155, "label": "text", "bbox": {"l": 411.47604, "t": 411.03836000000007, "r": 417.79535, "b": 417.35699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 135, "text": "25", "bbox": {"l": 411.47604, "t": 411.03836000000007, "r": 417.79535, "b": 417.35699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 156, "label": "text", "bbox": {"l": 437.37939, "t": 411.03836000000007, "r": 443.69870000000003, "b": 417.35699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 136, "text": "26", "bbox": {"l": 437.37939, "t": 411.03836000000007, "r": 443.69870000000003, "b": 417.35699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 157, "label": "text", "bbox": {"l": 450.33203, "t": 411.03836000000007, "r": 456.6513100000001, "b": 417.35699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 137, "text": "27", "bbox": {"l": 450.33203, "t": 411.03836000000007, "r": 456.6513100000001, "b": 417.35699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 158, "label": "text", "bbox": {"l": 463.28464, "t": 411.03836000000007, "r": 469.60394, "b": 417.35699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 138, "text": "28", "bbox": {"l": 463.28464, "t": 411.03836000000007, "r": 469.60394, "b": 417.35699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 159, "label": "text", "bbox": {"l": 385.2814, "t": 421.0697, "r": 391.60071, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 139, "text": "30", "bbox": {"l": 385.2814, "t": 421.0697, "r": 391.60071, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 160, "label": "text", "bbox": {"l": 398.52341, "t": 421.0697, "r": 404.84271, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 140, "text": "31", "bbox": {"l": 398.52341, "t": 421.0697, "r": 404.84271, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 161, "label": "text", "bbox": {"l": 411.47604, "t": 421.0697, "r": 417.79532, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 141, "text": "32", "bbox": {"l": 411.47604, "t": 421.0697, "r": 417.79532, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 162, "label": "text", "bbox": {"l": 424.42865, "t": 421.0697, "r": 430.74796, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 142, "text": "33", "bbox": {"l": 424.42865, "t": 421.0697, "r": 430.74796, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 163, "label": "text", "bbox": {"l": 437.38129, "t": 421.0697, "r": 443.70056, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 143, "text": "34", "bbox": {"l": 437.38129, "t": 421.0697, "r": 443.70056, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 164, "label": "text", "bbox": {"l": 450.33389000000005, "t": 421.0697, "r": 456.65319999999997, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 144, "text": "35", "bbox": {"l": 450.33389000000005, "t": 421.0697, "r": 456.65319999999997, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 165, "label": "text", "bbox": {"l": 463.2865, "t": 421.0697, "r": 469.6058, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 145, "text": "36", "bbox": {"l": 463.2865, "t": 421.0697, "r": 469.6058, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 166, "label": "text", "bbox": {"l": 476.23914, "t": 421.0697, "r": 482.55841, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 146, "text": "37", "bbox": {"l": 476.23914, "t": 421.0697, "r": 482.55841, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 167, "label": "text", "bbox": {"l": 489.1917700000001, "t": 421.0697, "r": 495.51105, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 147, "text": "38", "bbox": {"l": 489.1917700000001, "t": 421.0697, "r": 495.51105, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 168, "label": "text", "bbox": {"l": 502.14438, "t": 421.0697, "r": 508.46368, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 148, "text": "39", "bbox": {"l": 502.14438, "t": 421.0697, "r": 508.46368, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 169, "label": "text", "bbox": {"l": 515.09705, "t": 421.0697, "r": 521.41632, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 149, "text": "40", "bbox": {"l": 515.09705, "t": 421.0697, "r": 521.41632, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 170, "label": "text", "bbox": {"l": 528.04962, "t": 421.0697, "r": 534.3689, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 150, "text": "41", "bbox": {"l": 528.04962, "t": 421.0697, "r": 534.3689, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 171, "label": "text", "bbox": {"l": 385.2814, "t": 432.04431, "r": 391.60071, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 151, "text": "42", "bbox": {"l": 385.2814, "t": 432.04431, "r": 391.60071, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 172, "label": "text", "bbox": {"l": 398.52341, "t": 432.04431, "r": 404.84271, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 152, "text": "43", "bbox": {"l": 398.52341, "t": 432.04431, "r": 404.84271, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 173, "label": "text", "bbox": {"l": 411.47604, "t": 432.04431, "r": 417.79532, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 153, "text": "44", "bbox": {"l": 411.47604, "t": 432.04431, "r": 417.79532, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 174, "label": "text", "bbox": {"l": 424.42865, "t": 432.04431, "r": 430.74796, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 154, "text": "45", "bbox": {"l": 424.42865, "t": 432.04431, "r": 430.74796, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 175, "label": "text", "bbox": {"l": 437.38129, "t": 432.04431, "r": 443.70056, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 155, "text": "46", "bbox": {"l": 437.38129, "t": 432.04431, "r": 443.70056, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 176, "label": "text", "bbox": {"l": 450.33389000000005, "t": 432.04431, "r": 456.65319999999997, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 156, "text": "47", "bbox": {"l": 450.33389000000005, "t": 432.04431, "r": 456.65319999999997, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 177, "label": "text", "bbox": {"l": 463.2865, "t": 432.04431, "r": 469.6058, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 157, "text": "48", "bbox": {"l": 463.2865, "t": 432.04431, "r": 469.6058, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 178, "label": "text", "bbox": {"l": 476.23914, "t": 432.04431, "r": 482.55841, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 158, "text": "49", "bbox": {"l": 476.23914, "t": 432.04431, "r": 482.55841, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 179, "label": "text", "bbox": {"l": 489.1917700000001, "t": 432.04431, "r": 495.51105, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 159, "text": "50", "bbox": {"l": 489.1917700000001, "t": 432.04431, "r": 495.51105, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 180, "label": "text", "bbox": {"l": 502.14438, "t": 432.04431, "r": 508.46368, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 160, "text": "51", "bbox": {"l": 502.14438, "t": 432.04431, "r": 508.46368, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 181, "label": "text", "bbox": {"l": 515.09705, "t": 432.04431, "r": 521.41632, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 161, "text": "52", "bbox": {"l": 515.09705, "t": 432.04431, "r": 521.41632, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 182, "label": "text", "bbox": {"l": 528.04962, "t": 432.04431, "r": 534.3689, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 162, "text": "53", "bbox": {"l": 528.04962, "t": 432.04431, "r": 534.3689, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 183, "label": "text", "bbox": {"l": 385.2814, "t": 389.20004, "r": 388.44073, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 163, "text": "0", "bbox": {"l": 385.2814, "t": 389.20004, "r": 388.44073, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 184, "label": "text", "bbox": {"l": 398.52341, "t": 389.20004, "r": 401.68274, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 164, "text": "1", "bbox": {"l": 398.52341, "t": 389.20004, "r": 401.68274, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 185, "label": "text", "bbox": {"l": 411.4754, "t": 389.20004, "r": 414.63474, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 165, "text": "2", "bbox": {"l": 411.4754, "t": 389.20004, "r": 414.63474, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 186, "label": "text", "bbox": {"l": 424.4274, "t": 389.20004, "r": 427.58673, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 166, "text": "3", "bbox": {"l": 424.4274, "t": 389.20004, "r": 427.58673, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 187, "label": "text", "bbox": {"l": 437.37939, "t": 389.20004, "r": 440.53870000000006, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 167, "text": "4", "bbox": {"l": 437.37939, "t": 389.20004, "r": 440.53870000000006, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 188, "label": "text", "bbox": {"l": 450.33136, "t": 389.20004, "r": 453.49069000000003, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 168, "text": "5", "bbox": {"l": 450.33136, "t": 389.20004, "r": 453.49069000000003, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 189, "label": "text", "bbox": {"l": 463.28336, "t": 389.20004, "r": 466.44269, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 169, "text": "6", "bbox": {"l": 463.28336, "t": 389.20004, "r": 466.44269, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 190, "label": "text", "bbox": {"l": 476.23535, "t": 389.20004, "r": 479.39468, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 170, "text": "7", "bbox": {"l": 476.23535, "t": 389.20004, "r": 479.39468, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 191, "label": "text", "bbox": {"l": 489.18735, "t": 389.20004, "r": 492.34668, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 171, "text": "8", "bbox": {"l": 489.18735, "t": 389.20004, "r": 492.34668, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 192, "label": "text", "bbox": {"l": 502.13933999999995, "t": 389.20004, "r": 505.29868000000005, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 172, "text": "9", "bbox": {"l": 502.13933999999995, "t": 389.20004, "r": 505.29868000000005, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 193, "label": "text", "bbox": {"l": 515.09131, "t": 389.20004, "r": 521.41064, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 173, "text": "10", "bbox": {"l": 515.09131, "t": 389.20004, "r": 521.41064, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 194, "label": "text", "bbox": {"l": 528.04364, "t": 389.20004, "r": 534.13104, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 174, "text": "11", "bbox": {"l": 528.04364, "t": 389.20004, "r": 534.13104, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 195, "label": "text", "bbox": {"l": 385.2814, "t": 398.97464, "r": 391.60071, "b": 405.29327, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 175, "text": "12", "bbox": {"l": 385.2814, "t": 398.97464, "r": 391.60071, "b": 405.29327, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 196, "label": "text", "bbox": {"l": 398.52341, "t": 398.97464, "r": 404.84271, "b": 405.29327, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 176, "text": "13", "bbox": {"l": 398.52341, "t": 398.97464, "r": 404.84271, "b": 405.29327, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 197, "label": "text", "bbox": {"l": 411.47604, "t": 398.97464, "r": 417.79535, "b": 405.29327, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 177, "text": "14", "bbox": {"l": 411.47604, "t": 398.97464, "r": 417.79535, "b": 405.29327, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 198, "label": "text", "bbox": {"l": 424.42719, "t": 406.77463000000006, "r": 430.74648999999994, "b": 413.09326, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 178, "text": "15", "bbox": {"l": 424.42719, "t": 406.77463000000006, "r": 430.74648999999994, "b": 413.09326, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 199, "label": "text", "bbox": {"l": 502.86941999999993, "t": 410.99438, "r": 509.18871999999993, "b": 417.31302, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 179, "text": "29", "bbox": {"l": 502.86941999999993, "t": 410.99438, "r": 509.18871999999993, "b": 417.31302, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 200, "label": "text", "bbox": {"l": 384.35437, "t": 381.77722, "r": 430.99261, "b": 386.44281, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 180, "text": "Predicted Structure", "bbox": {"l": 384.35437, "t": 381.77722, "r": 430.99261, "b": 386.44281, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "caption", "id": 5, "page_no": 7, "cluster": {"id": 5, "label": "caption", "bbox": {"l": 62.595001, "t": 458.72836, "r": 532.63049, "b": 467.63492, "coord_origin": "TOPLEFT"}, "confidence": 0.9153602719306946, "cells": [{"id": 181, "text": "Figure 6: An example of TableFormer predictions (bounding boxes and structure) from generated SynthTabNet table.", "bbox": {"l": 62.595001, "t": 458.72836, "r": 532.63049, "b": 467.63492, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 6: An example of TableFormer predictions (bounding boxes and structure) from generated SynthTabNet table."}, {"label": "section_header", "id": 2, "page_no": 7, "cluster": {"id": 2, "label": "section_header", "bbox": {"l": 50.112, "t": 491.39536, "r": 163.7558, "b": 501.24741, "coord_origin": "TOPLEFT"}, "confidence": 0.9561247229576111, "cells": [{"id": 182, "text": "5.5.", "bbox": {"l": 50.112, "t": 491.39536, "r": 64.448898, "b": 501.24741, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "Qualitative Analysis", "bbox": {"l": 74.006828, "t": 491.39536, "r": 163.7558, "b": 501.24741, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5.5. Qualitative Analysis"}, {"label": "text", "id": 1, "page_no": 7, "cluster": {"id": 1, "label": "text", "bbox": {"l": 50.112, "t": 536.87337, "r": 286.36511, "b": 713.1519470000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9852361679077148, "cells": [{"id": 184, "text": "We showcase several visualizations for the different", "bbox": {"l": 62.067001, "t": 536.87337, "r": 286.36499, "b": 545.77992, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": "components of our network on various", "bbox": {"l": 50.112, "t": 548.82837, "r": 211.15741, "b": 557.73492, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "\u201ccomplex\u201d", "bbox": {"l": 215.10000999999997, "t": 548.91803, "r": 259.17453, "b": 557.50578, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "tables", "bbox": {"l": 263.12, "t": 548.82837, "r": 286.36273, "b": 557.73492, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": "within datasets presented in this work in Fig. 5 and Fig. 6", "bbox": {"l": 50.112, "t": 560.78337, "r": 286.36505, "b": 569.68993, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "As it is shown, our model is able to predict bounding boxes", "bbox": {"l": 50.112, "t": 572.73837, "r": 286.36508, "b": 581.6449299999999, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "for all table cells, even for the empty ones. Additionally,", "bbox": {"l": 50.112, "t": 584.69337, "r": 286.36508, "b": 593.59993, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "our post-processing techniques can extract the cell content", "bbox": {"l": 50.112, "t": 596.64937, "r": 286.36505, "b": 605.55592, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": "by matching the predicted bounding boxes to the PDF cells", "bbox": {"l": 50.112, "t": 608.60437, "r": 286.36508, "b": 617.51093, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "based on their overlap and spatial proximity. The left part", "bbox": {"l": 50.112, "t": 620.55937, "r": 286.36508, "b": 629.46593, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "of Fig. 5 demonstrates also the adaptability of our method", "bbox": {"l": 50.112, "t": 632.51437, "r": 286.36508, "b": 641.42093, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "to any language, as it can successfully extract Japanese", "bbox": {"l": 50.112, "t": 644.46938, "r": 286.36508, "b": 653.37593, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "text, although the training set contains only English content.", "bbox": {"l": 50.112, "t": 656.42438, "r": 286.36511, "b": 665.33094, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "We provide more visualizations including the intermediate", "bbox": {"l": 50.112, "t": 668.38037, "r": 286.36508, "b": 677.28694, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "steps in the supplementary material. Overall these illustra-", "bbox": {"l": 50.112, "t": 680.33537, "r": 286.36511, "b": 689.24194, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "tions justify the versatility of our method across a diverse", "bbox": {"l": 50.112, "t": 692.290375, "r": 286.36511, "b": 701.196945, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "range of table appearances and content type.", "bbox": {"l": 50.112, "t": 704.245377, "r": 226.88833999999997, "b": 713.1519470000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "We showcase several visualizations for the different components of our network on various \"complex\" tables within datasets presented in this work in Fig. 5 and Fig. 6 As it is shown, our model is able to predict bounding boxes for all table cells, even for the empty ones. Additionally, our post-processing techniques can extract the cell content by matching the predicted bounding boxes to the PDF cells based on their overlap and spatial proximity. The left part of Fig. 5 demonstrates also the adaptability of our method to any language, as it can successfully extract Japanese text, although the training set contains only English content. We provide more visualizations including the intermediate steps in the supplementary material. Overall these illustrations justify the versatility of our method across a diverse range of table appearances and content type."}, {"label": "section_header", "id": 4, "page_no": 7, "cluster": {"id": 4, "label": "section_header", "bbox": {"l": 308.862, "t": 490.70892, "r": 460.84848, "b": 501.45663, "coord_origin": "TOPLEFT"}, "confidence": 0.9436525702476501, "cells": [{"id": 201, "text": "6.", "bbox": {"l": 308.862, "t": 490.70892, "r": 316.07382, "b": 501.45663, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": "Future Work & Conclusion", "bbox": {"l": 325.68954, "t": 490.70892, "r": 460.84848, "b": 501.45663, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "6. Future Work & Conclusion"}, {"label": "text", "id": 0, "page_no": 7, "cluster": {"id": 0, "label": "text", "bbox": {"l": 308.862, "t": 512.89337, "r": 545.11517, "b": 653.30592, "coord_origin": "TOPLEFT"}, "confidence": 0.9875594973564148, "cells": [{"id": 203, "text": "In this paper, we presented TableFormer an end-to-end", "bbox": {"l": 320.81699, "t": 512.89337, "r": 545.11505, "b": 521.79993, "coord_origin": "TOPLEFT"}}, {"id": 204, "text": "transformer based approach to predict table structures and", "bbox": {"l": 308.862, "t": 524.84836, "r": 545.11517, "b": 533.75491, "coord_origin": "TOPLEFT"}}, {"id": 205, "text": "bounding boxes of cells from an image. This approach en-", "bbox": {"l": 308.862, "t": 536.80336, "r": 545.11511, "b": 545.70992, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": "ables us to recreate the table structure, and extract the cell", "bbox": {"l": 308.862, "t": 548.75836, "r": 545.11505, "b": 557.6649199999999, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": "content from PDF or OCR by using bounding boxes. Ad-", "bbox": {"l": 308.862, "t": 560.71336, "r": 545.11517, "b": 569.61992, "coord_origin": "TOPLEFT"}}, {"id": 208, "text": "ditionally, it provides the versatility required in real-world", "bbox": {"l": 308.862, "t": 572.66837, "r": 545.11511, "b": 581.57492, "coord_origin": "TOPLEFT"}}, {"id": 209, "text": "scenarios when dealing with various types of PDF docu-", "bbox": {"l": 308.862, "t": 584.62436, "r": 545.11511, "b": 593.53091, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": "ments, and languages.", "bbox": {"l": 308.862, "t": 596.57936, "r": 400.46808, "b": 605.48592, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "Furthermore, our method outper-", "bbox": {"l": 408.37839, "t": 596.57936, "r": 545.11511, "b": 605.48592, "coord_origin": "TOPLEFT"}}, {"id": 212, "text": "forms all state-of-the-arts with a wide margin. Finally, we", "bbox": {"l": 308.862, "t": 608.53436, "r": 545.11505, "b": 617.44092, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "introduce \u201cSynthTabNet\u201d a challenging synthetically gen-", "bbox": {"l": 308.862, "t": 620.48936, "r": 545.11511, "b": 629.3959199999999, "coord_origin": "TOPLEFT"}}, {"id": 214, "text": "erated dataset that reinforces missing characteristics from", "bbox": {"l": 308.862, "t": 632.4443699999999, "r": 545.11505, "b": 641.35092, "coord_origin": "TOPLEFT"}}, {"id": 215, "text": "other datasets.", "bbox": {"l": 308.862, "t": 644.39937, "r": 365.85803, "b": 653.30592, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In this paper, we presented TableFormer an end-to-end transformer based approach to predict table structures and bounding boxes of cells from an image. This approach enables us to recreate the table structure, and extract the cell content from PDF or OCR by using bounding boxes. Additionally, it provides the versatility required in real-world scenarios when dealing with various types of PDF documents, and languages. Furthermore, our method outperforms all state-of-the-arts with a wide margin. Finally, we introduce \"SynthTabNet\" a challenging synthetically generated dataset that reinforces missing characteristics from other datasets."}, {"label": "section_header", "id": 3, "page_no": 7, "cluster": {"id": 3, "label": "section_header", "bbox": {"l": 308.862, "t": 672.09892, "r": 364.40585, "b": 682.84664, "coord_origin": "TOPLEFT"}, "confidence": 0.9442470073699951, "cells": [{"id": 216, "text": "References", "bbox": {"l": 308.862, "t": 672.09892, "r": 364.40585, "b": 682.84664, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "References"}, {"label": "list_item", "id": 10, "page_no": 7, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 313.345, "t": 693.9617920000001, "r": 545.1134, "b": 712.936752, "coord_origin": "TOPLEFT"}, "confidence": 0.8318753838539124, "cells": [{"id": 217, "text": "[1]", "bbox": {"l": 313.345, "t": 693.9617920000001, "r": 323.80792, "b": 701.977753, "coord_origin": "TOPLEFT"}}, {"id": 218, "text": "Nicolas Carion, Francisco Massa, Gabriel Synnaeve, Nicolas", "bbox": {"l": 326.05127, "t": 693.9617920000001, "r": 545.10852, "b": 701.977753, "coord_origin": "TOPLEFT"}}, {"id": 219, "text": "Usunier, Alexander Kirillov, and Sergey Zagoruyko. End-to-", "bbox": {"l": 328.78101, "t": 704.920792, "r": 545.1134, "b": 712.936752, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[1] Nicolas Carion, Francisco Massa, Gabriel Synnaeve, Nicolas Usunier, Alexander Kirillov, and Sergey Zagoruyko. End-to-"}, {"label": "page_footer", "id": 9, "page_no": 7, "cluster": {"id": 9, "label": "page_footer", "bbox": {"l": 295.121, "t": 734.133366, "r": 300.10229, "b": 743.039928, "coord_origin": "TOPLEFT"}, "confidence": 0.8709858059883118, "cells": [{"id": 220, "text": "8", "bbox": {"l": 295.121, "t": 734.133366, "r": 300.10229, "b": 743.039928, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "8"}, {"label": "picture", "id": 15, "page_no": 7, "cluster": {"id": 15, "label": "picture", "bbox": {"l": 305.5836486816406, "t": 98.65415954589844, "r": 554.8258666992188, "b": 180.6267547607422, "coord_origin": "TOPLEFT"}, "confidence": 0.7699173092842102, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "picture", "id": 14, "page_no": 7, "cluster": {"id": 14, "label": "picture", "bbox": {"l": 49.97503662109375, "t": 103.71266174316406, "r": 301.6335754394531, "b": 187.5789337158203, "coord_origin": "TOPLEFT"}, "confidence": 0.7873926162719727, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "body": [{"label": "caption", "id": 18, "page_no": 7, "cluster": {"id": 18, "label": "caption", "bbox": {"l": 53.811783000000005, "t": 208.23328000000004, "r": 385.93451, "b": 216.10645, "coord_origin": "TOPLEFT"}, "confidence": 0.5986505746841431, "cells": [{"id": 0, "text": "b.", "bbox": {"l": 53.811783000000005, "t": 208.23328000000004, "r": 62.219952, "b": 216.10645, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Structure predicted by TableFormer, with superimposed matched PDF cell text:", "bbox": {"l": 66.424026, "t": 208.23328000000004, "r": 385.93451, "b": 216.10645, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "b. Structure predicted by TableFormer, with superimposed matched PDF cell text:"}, {"label": "section_header", "id": 29, "page_no": 7, "cluster": {"id": 29, "label": "section_header", "bbox": {"l": 53.811783000000005, "t": 94.28112999999996, "r": 284.34592, "b": 102.15430000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.46452972292900085, "cells": [{"id": 2, "text": "Japanese language (previously unseen by TableFormer):", "bbox": {"l": 53.811783000000005, "t": 94.28112999999996, "r": 284.34592, "b": 102.15430000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Japanese language (previously unseen by TableFormer):"}, {"label": "section_header", "id": 31, "page_no": 7, "cluster": {"id": 31, "label": "section_header", "bbox": {"l": 304.83081, "t": 94.28112999999996, "r": 431.09119, "b": 102.15430000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.4629225730895996, "cells": [{"id": 3, "text": "Example table from FinTabNet:", "bbox": {"l": 304.83081, "t": 94.28112999999996, "r": 431.09119, "b": 102.15430000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Example table from FinTabNet:"}, {"label": "list_item", "id": 20, "page_no": 7, "cluster": {"id": 20, "label": "list_item", "bbox": {"l": 53.286037, "t": 78.68756000000008, "r": 61.550289, "b": 86.56073000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.5820134282112122, "cells": [{"id": 4, "text": "a.", "bbox": {"l": 53.286037, "t": 78.68756000000008, "r": 61.550289, "b": 86.56073000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "a."}, {"label": "list_item", "id": 21, "page_no": 7, "cluster": {"id": 21, "label": "list_item", "bbox": {"l": 65.682419, "t": 78.68756000000008, "r": 499.55563, "b": 86.56073000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.541211724281311, "cells": [{"id": 5, "text": "Red - PDF cells, Green - predicted bounding boxes, Blue - post-processed predictions matched to PDF cells", "bbox": {"l": 65.682419, "t": 78.68756000000008, "r": 499.55563, "b": 86.56073000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Red - PDF cells, Green - predicted bounding boxes, Blue - post-processed predictions matched to PDF cells"}, {"label": "table", "id": 8, "page_no": 7, "cluster": {"id": 8, "label": "table", "bbox": {"l": 53.62853240966797, "t": 218.94857788085938, "r": 298.5574951171875, "b": 292.39996337890625, "coord_origin": "TOPLEFT"}, "confidence": 0.8824009299278259, "cells": [{"id": 6, "text": "\u8ad6\u6587\u30d5\u30a1\u30a4\u30eb", "bbox": {"l": 209.93285, "t": 222.18073000000004, "r": 241.04458999999997, "b": 226.36212, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "\u53c2\u8003\u6587\u732e", "bbox": {"l": 263.76489, "t": 222.18073000000004, "r": 284.50589, "b": 226.36212, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "\u51fa\u5178", "bbox": {"l": 110.24990999999999, "t": 229.66594999999995, "r": 120.62018, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "\u30d5\u30a1\u30a4\u30eb", "bbox": {"l": 175.36609, "t": 229.66594999999995, "r": 196.1071, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "\u6570", "bbox": {"l": 196.10756, "t": 229.66594999999995, "r": 201.29247, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "\u82f1\u8a9e", "bbox": {"l": 209.62408, "t": 229.66594999999995, "r": 219.99435, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "\u65e5\u672c\u8a9e", "bbox": {"l": 229.19814, "t": 229.66594999999995, "r": 244.75377, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "\u82f1\u8a9e", "bbox": {"l": 256.1142, "t": 229.66594999999995, "r": 266.48447, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "\u65e5\u672c\u8a9e", "bbox": {"l": 278.38434, "t": 229.66594999999995, "r": 293.93997, "b": 233.84735, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Association for Computational Linguistics(ACL2003)", "bbox": {"l": 55.53052099999999, "t": 236.42584, "r": 162.7131, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "65", "bbox": {"l": 184.39731, "t": 236.42584, "r": 189.56456, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "65", "bbox": {"l": 208.99026, "t": 236.42584, "r": 214.15752, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "0", "bbox": {"l": 234.87517, "t": 236.42584, "r": 237.45833000000002, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "150", "bbox": {"l": 256.88446, "t": 236.42584, "r": 264.6358, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "0", "bbox": {"l": 284.06134, "t": 236.42584, "r": 286.6445, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Computational Linguistics(COLING2002)", "bbox": {"l": 55.53052099999999, "t": 242.62048000000004, "r": 139.72253, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "140", "bbox": {"l": 183.10536, "t": 242.62048000000004, "r": 190.8567, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "140", "bbox": {"l": 207.69832, "t": 242.62048000000004, "r": 215.44965999999997, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "0", "bbox": {"l": 234.87517, "t": 242.62048000000004, "r": 237.45833000000002, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "150", "bbox": {"l": 256.88446, "t": 242.62048000000004, "r": 264.6358, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "0", "bbox": {"l": 284.06134, "t": 242.62048000000004, "r": 286.6445, "b": 246.97839, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "\u96fb\u6c17\u60c5\u5831\u901a\u4fe1\u5b66\u4f1a", "bbox": {"l": 55.53052099999999, "t": 249.79845999999998, "r": 97.013, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "2003", "bbox": {"l": 92.698288, "t": 249.58942000000002, "r": 103.03371, "b": 253.94732999999997, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "\u5e74\u7dcf\u5408\u5927\u4f1a", "bbox": {"l": 103.03389, "t": 249.79845999999998, "r": 128.96027, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "150", "bbox": {"l": 183.10536, "t": 248.81506000000002, "r": 190.8567, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "8", "bbox": {"l": 210.28223, "t": 248.81506000000002, "r": 212.86539, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "142", "bbox": {"l": 232.29153, "t": 248.81506000000002, "r": 240.04287999999997, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "223", "bbox": {"l": 256.88446, "t": 248.81506000000002, "r": 264.6358, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "147", "bbox": {"l": 281.47742, "t": 248.81506000000002, "r": 289.22876, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "\u60c5\u5831\u51e6\u7406\u5b66\u4f1a\u7b2c", "bbox": {"l": 55.53052099999999, "t": 257.28369, "r": 91.827637, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "65", "bbox": {"l": 88.052673, "t": 257.07465, "r": 93.219925, "b": 261.43255999999997, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "\u56de\u5168\u56fd\u5927\u4f1a", "bbox": {"l": 93.220474, "t": 257.28369, "r": 119.14685, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "(2003)", "bbox": {"l": 116.45073999999998, "t": 257.07465, "r": 129.88177, "b": 261.43255999999997, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "177", "bbox": {"l": 183.10536, "t": 256.30029, "r": 190.8567, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "1", "bbox": {"l": 210.28223, "t": 256.30029, "r": 212.86539, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "176", "bbox": {"l": 232.29153, "t": 256.30029, "r": 240.04287999999997, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "150", "bbox": {"l": 256.88446, "t": 256.30029, "r": 264.6358, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "236", "bbox": {"l": 281.47742, "t": 256.30029, "r": 289.22876, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "\u7b2c", "bbox": {"l": 55.53052099999999, "t": 264.5108, "r": 60.715424, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "17", "bbox": {"l": 60.17654799999999, "t": 264.30175999999994, "r": 65.343796, "b": 268.65967, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "\u56de\u4eba\u5de5\u77e5\u80fd\u5b66\u4f1a\u5168\u56fd\u5927\u4f1a", "bbox": {"l": 65.344376, "t": 264.5108, "r": 122.38297000000001, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "(2003)", "bbox": {"l": 116.45073999999998, "t": 264.30175999999994, "r": 129.88177, "b": 268.65967, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "208", "bbox": {"l": 183.10536, "t": 263.52739999999994, "r": 190.8567, "b": 267.88531, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "5", "bbox": {"l": 210.28223, "t": 263.52739999999994, "r": 212.86539, "b": 267.88531, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "203", "bbox": {"l": 232.29153, "t": 263.52739999999994, "r": 240.04287999999997, "b": 267.88531, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "152", "bbox": {"l": 256.88446, "t": 263.52739999999994, "r": 264.6358, "b": 267.88531, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "244", "bbox": {"l": 281.47742, "t": 263.52739999999994, "r": 289.22876, "b": 267.88531, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "\u81ea\u7136\u8a00\u8a9e\u51e6\u7406\u7814\u7a76\u4f1a\u7b2c", "bbox": {"l": 55.53052099999999, "t": 271.73785, "r": 107.38374, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "146", "bbox": {"l": 101.99034, "t": 271.52881, "r": 109.74168000000002, "b": 275.88671999999997, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "\u301c", "bbox": {"l": 109.74204, "t": 271.73785, "r": 114.92695000000002, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "155", "bbox": {"l": 114.38793, "t": 271.52881, "r": 122.13927, "b": 275.88671999999997, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "\u56de", "bbox": {"l": 122.13963, "t": 271.73785, "r": 127.32454000000001, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "98", "bbox": {"l": 184.39731, "t": 270.75446, "r": 189.56456, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "2", "bbox": {"l": 210.28223, "t": 270.75446, "r": 212.86539, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "96", "bbox": {"l": 233.58348, "t": 270.75446, "r": 238.75072999999998, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "150", "bbox": {"l": 256.88446, "t": 270.75446, "r": 264.6358, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "232", "bbox": {"l": 281.47742, "t": 270.75446, "r": 289.22876, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "WWW", "bbox": {"l": 55.53052099999999, "t": 279.01392, "r": 68.68605, "b": 283.37183, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "\u304b\u3089\u53ce\u96c6\u3057\u305f\u8ad6\u6587", "bbox": {"l": 68.685814, "t": 279.22295999999994, "r": 110.16829999999999, "b": 283.40436, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "107", "bbox": {"l": 183.10536, "t": 277.98157000000003, "r": 190.8567, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "73", "bbox": {"l": 208.99026, "t": 277.98157000000003, "r": 214.15752, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "34", "bbox": {"l": 233.58348, "t": 277.98157000000003, "r": 238.75072999999998, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "147", "bbox": {"l": 256.88446, "t": 277.98157000000003, "r": 264.6358, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "96", "bbox": {"l": 282.76938, "t": 277.98157000000003, "r": 287.93661, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "\u8a08", "bbox": {"l": 169.61508, "t": 286.45004, "r": 174.79999, "b": 290.63141, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "945", "bbox": {"l": 183.10536, "t": 285.46667, "r": 190.8567, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "294", "bbox": {"l": 207.69832, "t": 285.46667, "r": 215.44965999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "651", "bbox": {"l": 232.29153, "t": 285.46667, "r": 240.04287999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "1122", "bbox": {"l": 255.76506, "t": 285.46667, "r": 265.75204, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "955", "bbox": {"l": 281.47742, "t": 285.46667, "r": 289.22876, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}], "children": [{"id": 32, "label": "text", "bbox": {"l": 209.93285, "t": 222.18073000000004, "r": 241.04458999999997, "b": 226.36212, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": "\u8ad6\u6587\u30d5\u30a1\u30a4\u30eb", "bbox": {"l": 209.93285, "t": 222.18073000000004, "r": 241.04458999999997, "b": 226.36212, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 263.76489, "t": 222.18073000000004, "r": 284.50589, "b": 226.36212, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "\u53c2\u8003\u6587\u732e", "bbox": {"l": 263.76489, "t": 222.18073000000004, "r": 284.50589, "b": 226.36212, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 110.24990999999999, "t": 229.66594999999995, "r": 120.62018, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "\u51fa\u5178", "bbox": {"l": 110.24990999999999, "t": 229.66594999999995, "r": 120.62018, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 175.36609, "t": 229.66594999999995, "r": 196.1071, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "\u30d5\u30a1\u30a4\u30eb", "bbox": {"l": 175.36609, "t": 229.66594999999995, "r": 196.1071, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 196.10756, "t": 229.66594999999995, "r": 201.29247, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "\u6570", "bbox": {"l": 196.10756, "t": 229.66594999999995, "r": 201.29247, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 209.62408, "t": 229.66594999999995, "r": 219.99435, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "\u82f1\u8a9e", "bbox": {"l": 209.62408, "t": 229.66594999999995, "r": 219.99435, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 229.19814, "t": 229.66594999999995, "r": 244.75377, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "\u65e5\u672c\u8a9e", "bbox": {"l": 229.19814, "t": 229.66594999999995, "r": 244.75377, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 256.1142, "t": 229.66594999999995, "r": 266.48447, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "\u82f1\u8a9e", "bbox": {"l": 256.1142, "t": 229.66594999999995, "r": 266.48447, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 278.38434, "t": 229.66594999999995, "r": 293.93997, "b": 233.84735, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "\u65e5\u672c\u8a9e", "bbox": {"l": 278.38434, "t": 229.66594999999995, "r": 293.93997, "b": 233.84735, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 55.53052099999999, "t": 236.42584, "r": 162.7131, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "Association for Computational Linguistics(ACL2003)", "bbox": {"l": 55.53052099999999, "t": 236.42584, "r": 162.7131, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 184.39731, "t": 236.42584, "r": 189.56456, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "65", "bbox": {"l": 184.39731, "t": 236.42584, "r": 189.56456, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 208.99026, "t": 236.42584, "r": 214.15752, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "65", "bbox": {"l": 208.99026, "t": 236.42584, "r": 214.15752, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 234.87517, "t": 236.42584, "r": 237.45833000000002, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "0", "bbox": {"l": 234.87517, "t": 236.42584, "r": 237.45833000000002, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 256.88446, "t": 236.42584, "r": 264.6358, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "150", "bbox": {"l": 256.88446, "t": 236.42584, "r": 264.6358, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 284.06134, "t": 236.42584, "r": 286.6445, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "0", "bbox": {"l": 284.06134, "t": 236.42584, "r": 286.6445, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 55.53052099999999, "t": 242.62048000000004, "r": 139.72253, "b": 246.97839, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "Computational Linguistics(COLING2002)", "bbox": {"l": 55.53052099999999, "t": 242.62048000000004, "r": 139.72253, "b": 246.97839, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 183.10536, "t": 242.62048000000004, "r": 190.8567, "b": 246.97839, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "140", "bbox": {"l": 183.10536, "t": 242.62048000000004, "r": 190.8567, "b": 246.97839, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 207.69832, "t": 242.62048000000004, "r": 215.44965999999997, "b": 246.97839, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "140", "bbox": {"l": 207.69832, "t": 242.62048000000004, "r": 215.44965999999997, "b": 246.97839, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 234.87517, "t": 242.62048000000004, "r": 237.45833000000002, "b": 246.97839, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "0", "bbox": {"l": 234.87517, "t": 242.62048000000004, "r": 237.45833000000002, "b": 246.97839, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 256.88446, "t": 242.62048000000004, "r": 264.6358, "b": 246.97839, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "150", "bbox": {"l": 256.88446, "t": 242.62048000000004, "r": 264.6358, "b": 246.97839, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 284.06134, "t": 242.62048000000004, "r": 286.6445, "b": 246.97839, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "0", "bbox": {"l": 284.06134, "t": 242.62048000000004, "r": 286.6445, "b": 246.97839, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 55.53052099999999, "t": 249.79845999999998, "r": 97.013, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "\u96fb\u6c17\u60c5\u5831\u901a\u4fe1\u5b66\u4f1a", "bbox": {"l": 55.53052099999999, "t": 249.79845999999998, "r": 97.013, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 92.698288, "t": 249.58942000000002, "r": 103.03371, "b": 253.94732999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "2003", "bbox": {"l": 92.698288, "t": 249.58942000000002, "r": 103.03371, "b": 253.94732999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 103.03389, "t": 249.79845999999998, "r": 128.96027, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "\u5e74\u7dcf\u5408\u5927\u4f1a", "bbox": {"l": 103.03389, "t": 249.79845999999998, "r": 128.96027, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 183.10536, "t": 248.81506000000002, "r": 190.8567, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "150", "bbox": {"l": 183.10536, "t": 248.81506000000002, "r": 190.8567, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 210.28223, "t": 248.81506000000002, "r": 212.86539, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "8", "bbox": {"l": 210.28223, "t": 248.81506000000002, "r": 212.86539, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 232.29153, "t": 248.81506000000002, "r": 240.04287999999997, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "142", "bbox": {"l": 232.29153, "t": 248.81506000000002, "r": 240.04287999999997, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 256.88446, "t": 248.81506000000002, "r": 264.6358, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "223", "bbox": {"l": 256.88446, "t": 248.81506000000002, "r": 264.6358, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 281.47742, "t": 248.81506000000002, "r": 289.22876, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "147", "bbox": {"l": 281.47742, "t": 248.81506000000002, "r": 289.22876, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 55.53052099999999, "t": 257.28369, "r": 91.827637, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "\u60c5\u5831\u51e6\u7406\u5b66\u4f1a\u7b2c", "bbox": {"l": 55.53052099999999, "t": 257.28369, "r": 91.827637, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 88.052673, "t": 257.07465, "r": 93.219925, "b": 261.43255999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "65", "bbox": {"l": 88.052673, "t": 257.07465, "r": 93.219925, "b": 261.43255999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 93.220474, "t": 257.28369, "r": 119.14685, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "\u56de\u5168\u56fd\u5927\u4f1a", "bbox": {"l": 93.220474, "t": 257.28369, "r": 119.14685, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 116.45073999999998, "t": 257.07465, "r": 129.88177, "b": 261.43255999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "(2003)", "bbox": {"l": 116.45073999999998, "t": 257.07465, "r": 129.88177, "b": 261.43255999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 183.10536, "t": 256.30029, "r": 190.8567, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "177", "bbox": {"l": 183.10536, "t": 256.30029, "r": 190.8567, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 210.28223, "t": 256.30029, "r": 212.86539, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "1", "bbox": {"l": 210.28223, "t": 256.30029, "r": 212.86539, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 232.29153, "t": 256.30029, "r": 240.04287999999997, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "176", "bbox": {"l": 232.29153, "t": 256.30029, "r": 240.04287999999997, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 256.88446, "t": 256.30029, "r": 264.6358, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "150", "bbox": {"l": 256.88446, "t": 256.30029, "r": 264.6358, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 281.47742, "t": 256.30029, "r": 289.22876, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "236", "bbox": {"l": 281.47742, "t": 256.30029, "r": 289.22876, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 55.53052099999999, "t": 264.5108, "r": 60.715424, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "\u7b2c", "bbox": {"l": 55.53052099999999, "t": 264.5108, "r": 60.715424, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 60.17654799999999, "t": 264.30175999999994, "r": 65.343796, "b": 268.65967, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "17", "bbox": {"l": 60.17654799999999, "t": 264.30175999999994, "r": 65.343796, "b": 268.65967, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 65.344376, "t": 264.5108, "r": 122.38297000000001, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "\u56de\u4eba\u5de5\u77e5\u80fd\u5b66\u4f1a\u5168\u56fd\u5927\u4f1a", "bbox": {"l": 65.344376, "t": 264.5108, "r": 122.38297000000001, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 116.45073999999998, "t": 264.30175999999994, "r": 129.88177, "b": 268.65967, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "(2003)", "bbox": {"l": 116.45073999999998, "t": 264.30175999999994, "r": 129.88177, "b": 268.65967, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 183.10536, "t": 263.52739999999994, "r": 190.8567, "b": 267.88531, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "208", "bbox": {"l": 183.10536, "t": 263.52739999999994, "r": 190.8567, "b": 267.88531, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 210.28223, "t": 263.52739999999994, "r": 212.86539, "b": 267.88531, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "5", "bbox": {"l": 210.28223, "t": 263.52739999999994, "r": 212.86539, "b": 267.88531, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 232.29153, "t": 263.52739999999994, "r": 240.04287999999997, "b": 267.88531, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "203", "bbox": {"l": 232.29153, "t": 263.52739999999994, "r": 240.04287999999997, "b": 267.88531, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 256.88446, "t": 263.52739999999994, "r": 264.6358, "b": 267.88531, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "152", "bbox": {"l": 256.88446, "t": 263.52739999999994, "r": 264.6358, "b": 267.88531, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 281.47742, "t": 263.52739999999994, "r": 289.22876, "b": 267.88531, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "244", "bbox": {"l": 281.47742, "t": 263.52739999999994, "r": 289.22876, "b": 267.88531, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 55.53052099999999, "t": 271.73785, "r": 107.38374, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "\u81ea\u7136\u8a00\u8a9e\u51e6\u7406\u7814\u7a76\u4f1a\u7b2c", "bbox": {"l": 55.53052099999999, "t": 271.73785, "r": 107.38374, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 101.99034, "t": 271.52881, "r": 109.74168000000002, "b": 275.88671999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "146", "bbox": {"l": 101.99034, "t": 271.52881, "r": 109.74168000000002, "b": 275.88671999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 109.74204, "t": 271.73785, "r": 114.92695000000002, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "\u301c", "bbox": {"l": 109.74204, "t": 271.73785, "r": 114.92695000000002, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 114.38793, "t": 271.52881, "r": 122.13927, "b": 275.88671999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "155", "bbox": {"l": 114.38793, "t": 271.52881, "r": 122.13927, "b": 275.88671999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 122.13963, "t": 271.73785, "r": 127.32454000000001, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "\u56de", "bbox": {"l": 122.13963, "t": 271.73785, "r": 127.32454000000001, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 184.39731, "t": 270.75446, "r": 189.56456, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "98", "bbox": {"l": 184.39731, "t": 270.75446, "r": 189.56456, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 210.28223, "t": 270.75446, "r": 212.86539, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "2", "bbox": {"l": 210.28223, "t": 270.75446, "r": 212.86539, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 233.58348, "t": 270.75446, "r": 238.75072999999998, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "96", "bbox": {"l": 233.58348, "t": 270.75446, "r": 238.75072999999998, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 256.88446, "t": 270.75446, "r": 264.6358, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "150", "bbox": {"l": 256.88446, "t": 270.75446, "r": 264.6358, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 281.47742, "t": 270.75446, "r": 289.22876, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "232", "bbox": {"l": 281.47742, "t": 270.75446, "r": 289.22876, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 55.53052099999999, "t": 279.01392, "r": 68.68605, "b": 283.37183, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "WWW", "bbox": {"l": 55.53052099999999, "t": 279.01392, "r": 68.68605, "b": 283.37183, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 68.685814, "t": 279.22295999999994, "r": 110.16829999999999, "b": 283.40436, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "\u304b\u3089\u53ce\u96c6\u3057\u305f\u8ad6\u6587", "bbox": {"l": 68.685814, "t": 279.22295999999994, "r": 110.16829999999999, "b": 283.40436, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 183.10536, "t": 277.98157000000003, "r": 190.8567, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "107", "bbox": {"l": 183.10536, "t": 277.98157000000003, "r": 190.8567, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 208.99026, "t": 277.98157000000003, "r": 214.15752, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "73", "bbox": {"l": 208.99026, "t": 277.98157000000003, "r": 214.15752, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 233.58348, "t": 277.98157000000003, "r": 238.75072999999998, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "34", "bbox": {"l": 233.58348, "t": 277.98157000000003, "r": 238.75072999999998, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 256.88446, "t": 277.98157000000003, "r": 264.6358, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "147", "bbox": {"l": 256.88446, "t": 277.98157000000003, "r": 264.6358, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 282.76938, "t": 277.98157000000003, "r": 287.93661, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "96", "bbox": {"l": 282.76938, "t": 277.98157000000003, "r": 287.93661, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 169.61508, "t": 286.45004, "r": 174.79999, "b": 290.63141, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "\u8a08", "bbox": {"l": 169.61508, "t": 286.45004, "r": 174.79999, "b": 290.63141, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 183.10536, "t": 285.46667, "r": 190.8567, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "945", "bbox": {"l": 183.10536, "t": 285.46667, "r": 190.8567, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 207.69832, "t": 285.46667, "r": 215.44965999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "294", "bbox": {"l": 207.69832, "t": 285.46667, "r": 215.44965999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 232.29153, "t": 285.46667, "r": 240.04287999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "651", "bbox": {"l": 232.29153, "t": 285.46667, "r": 240.04287999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 255.76506, "t": 285.46667, "r": 265.75204, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "1122", "bbox": {"l": 255.76506, "t": 285.46667, "r": 265.75204, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 281.47742, "t": 285.46667, "r": 289.22876, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "955", "bbox": {"l": 281.47742, "t": 285.46667, "r": 289.22876, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "lcel", "ched", "lcel", "nl", "ched", "ched", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 10, "num_cols": 6, "table_cells": [{"bbox": {"l": 209.93285, "t": 222.18073000000004, "r": 241.04458999999997, "b": 226.36212, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 4, "text": "\u8ad6\u6587\u30d5\u30a1\u30a4\u30eb", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 263.76489, "t": 222.18073000000004, "r": 284.50589, "b": 226.36212, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 4, "end_col_offset_idx": 6, "text": "\u53c2\u8003\u6587\u732e", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 110.24990999999999, "t": 229.66594999999995, "r": 120.62018, "b": 233.84735, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "\u51fa\u5178", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 175.36609, "t": 229.66594999999995, "r": 201.29247, "b": 233.84735, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "\u30d5\u30a1\u30a4\u30eb \u6570", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 209.62408, "t": 229.66594999999995, "r": 219.99435, "b": 233.84735, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "\u82f1\u8a9e", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 229.19814, "t": 229.66594999999995, "r": 244.75377, "b": 233.84735, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "\u65e5\u672c\u8a9e", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 256.1142, "t": 229.66594999999995, "r": 266.48447, "b": 233.84735, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "\u82f1\u8a9e", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 278.38434, "t": 229.66594999999995, "r": 293.93997, "b": 233.84735, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "\u65e5\u672c\u8a9e", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 55.53052099999999, "t": 236.42584, "r": 162.7131, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Association for Computational Linguistics(ACL2003)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 184.39731, "t": 236.42584, "r": 189.56456, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "65", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 208.99026, "t": 236.42584, "r": 214.15752, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "65", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 234.87517, "t": 236.42584, "r": 237.45833000000002, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446, "t": 236.42584, "r": 264.6358, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "150", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 284.06134, "t": 236.42584, "r": 286.6445, "b": 240.78375000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 55.53052099999999, "t": 242.62048000000004, "r": 139.72253, "b": 246.97839, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Computational Linguistics(COLING2002)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 183.10536, "t": 242.62048000000004, "r": 190.8567, "b": 246.97839, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "140", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 207.69832, "t": 242.62048000000004, "r": 215.44965999999997, "b": 246.97839, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "140", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 234.87517, "t": 242.62048000000004, "r": 237.45833000000002, "b": 246.97839, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446, "t": 242.62048000000004, "r": 264.6358, "b": 246.97839, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "150", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 284.06134, "t": 242.62048000000004, "r": 286.6445, "b": 246.97839, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 55.53052099999999, "t": 249.58942000000002, "r": 128.96027, "b": 253.97986000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "\u96fb\u6c17\u60c5\u5831\u901a\u4fe1\u5b66\u4f1a 2003 \u5e74\u7dcf\u5408\u5927\u4f1a", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 183.10536, "t": 248.81506000000002, "r": 190.8567, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "150", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 210.28223, "t": 248.81506000000002, "r": 212.86539, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.29153, "t": 248.81506000000002, "r": 240.04287999999997, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "142", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446, "t": 248.81506000000002, "r": 264.6358, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "223", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.47742, "t": 248.81506000000002, "r": 289.22876, "b": 253.17296999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "147", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 55.53052099999999, "t": 257.07465, "r": 129.88177, "b": 261.46509000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "\u60c5\u5831\u51e6\u7406\u5b66\u4f1a\u7b2c 65 \u56de\u5168\u56fd\u5927\u4f1a (2003)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 183.10536, "t": 256.30029, "r": 190.8567, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "177", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 210.28223, "t": 256.30029, "r": 212.86539, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.29153, "t": 256.30029, "r": 240.04287999999997, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "176", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446, "t": 256.30029, "r": 264.6358, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "150", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.47742, "t": 256.30029, "r": 289.22876, "b": 260.65819999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "236", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 55.53052099999999, "t": 264.30175999999994, "r": 129.88177, "b": 268.69219999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "\u7b2c 17 \u56de\u4eba\u5de5\u77e5\u80fd\u5b66\u4f1a\u5168\u56fd\u5927\u4f1a (2003)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 183.10536, "t": 263.52739999999994, "r": 190.8567, "b": 267.88531, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "208", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 210.28223, "t": 263.52739999999994, "r": 212.86539, "b": 267.88531, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.29153, "t": 263.52739999999994, "r": 240.04287999999997, "b": 267.88531, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "203", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446, "t": 263.52739999999994, "r": 264.6358, "b": 267.88531, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "152", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.47742, "t": 263.52739999999994, "r": 289.22876, "b": 267.88531, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "244", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 55.53052099999999, "t": 271.52881, "r": 127.32454000000001, "b": 275.91925000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "\u81ea\u7136\u8a00\u8a9e\u51e6\u7406\u7814\u7a76\u4f1a\u7b2c 146 \u301c 155 \u56de", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 184.39731, "t": 270.75446, "r": 189.56456, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "98", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 210.28223, "t": 270.75446, "r": 212.86539, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 233.58348, "t": 270.75446, "r": 238.75072999999998, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446, "t": 270.75446, "r": 264.6358, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "150", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.47742, "t": 270.75446, "r": 289.22876, "b": 275.11237000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "232", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 55.53052099999999, "t": 279.01392, "r": 110.16829999999999, "b": 283.40436, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "WWW \u304b\u3089\u53ce\u96c6\u3057\u305f\u8ad6\u6587", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 183.10536, "t": 277.98157000000003, "r": 190.8567, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "107", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 208.99026, "t": 277.98157000000003, "r": 214.15752, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "73", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 233.58348, "t": 277.98157000000003, "r": 238.75072999999998, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "34", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.88446, "t": 277.98157000000003, "r": 264.6358, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "147", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 282.76938, "t": 277.98157000000003, "r": 287.93661, "b": 282.33948000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 183.10536, "t": 285.46667, "r": 190.8567, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "945", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 207.69832, "t": 285.46667, "r": 215.44965999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "294", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.29153, "t": 285.46667, "r": 240.04287999999997, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "651", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 255.76506, "t": 285.46667, "r": 265.75204, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "1122", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.47742, "t": 285.46667, "r": 289.22876, "b": 289.8245800000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "955", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "caption", "id": 16, "page_no": 7, "cluster": {"id": 16, "label": "caption", "bbox": {"l": 380.42731, "t": 292.30426, "r": 549.42175, "b": 298.60284, "coord_origin": "TOPLEFT"}, "confidence": 0.7499915957450867, "cells": [{"id": 76, "text": "Text is aligned to match original for ease of viewing", "bbox": {"l": 380.42731, "t": 292.30426, "r": 549.42175, "b": 298.60284, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Text is aligned to match original for ease of viewing"}, {"label": "table", "id": 7, "page_no": 7, "cluster": {"id": 7, "label": "table", "bbox": {"l": 304.9219970703125, "t": 218.51486206054688, "r": 550.2321166992188, "b": 287.90069580078125, "coord_origin": "TOPLEFT"}, "confidence": 0.8899767994880676, "cells": [{"id": 77, "text": "Weighted Average Grant Date Fair", "bbox": {"l": 459.04861, "t": 221.62415, "r": 542.00018, "b": 226.68933000000004, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "Value", "bbox": {"l": 493.82193, "t": 227.83416999999997, "r": 507.2258, "b": 232.89935000000003, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "RS", "bbox": {"l": 393.2442, "t": 236.74712999999997, "r": 400.74588, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "U", "bbox": {"l": 400.74643, "t": 236.74712999999997, "r": 404.64523, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "s", "bbox": {"l": 404.6463, "t": 236.74712999999997, "r": 407.34631, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "Shares (in millions)", "bbox": {"l": 392.09671, "t": 221.57446000000004, "r": 438.0145, "b": 226.63964999999996, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "PSUs", "bbox": {"l": 427.18323, "t": 236.74712999999997, "r": 440.98778999999996, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "RSUs", "bbox": {"l": 468.38254, "t": 236.74712999999997, "r": 482.48465000000004, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "PSUs", "bbox": {"l": 516.92578, "t": 236.74712999999997, "r": 530.73035, "b": 241.81232, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Nonvested on Janua", "bbox": {"l": 306.11493, "t": 244.61084000000005, "r": 355.6532, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "ry 1", "bbox": {"l": 355.65427, "t": 244.61084000000005, "r": 364.65607, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "1.", "bbox": {"l": 396.24661, "t": 244.91327, "r": 400.75238, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "1", "bbox": {"l": 400.7529, "t": 244.91327, "r": 403.75531, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "0.3", "bbox": {"l": 429.81838999999997, "t": 244.91327, "r": 437.32708999999994, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "90.10", "bbox": {"l": 465.52859, "t": 244.91327, "r": 478.40103, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "$", "bbox": {"l": 480.97552, "t": 244.91327, "r": 483.55001999999996, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "$ 91.19", "bbox": {"l": 513.44824, "t": 244.91327, "r": 531.46967, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "Granted", "bbox": {"l": 306.11493, "t": 253.68451000000005, "r": 325.62674, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "0.", "bbox": {"l": 396.24661, "t": 253.68451000000005, "r": 400.75238, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "5", "bbox": {"l": 400.7529, "t": 253.68451000000005, "r": 403.75531, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "0.1", "bbox": {"l": 429.81838999999997, "t": 253.68451000000005, "r": 437.32708999999994, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "117.44", "bbox": {"l": 466.43579000000005, "t": 253.68451000000005, "r": 482.54831, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "122.41", "bbox": {"l": 514.29065, "t": 253.68451000000005, "r": 530.80981, "b": 258.74969, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "Vested", "bbox": {"l": 306.11493, "t": 261.54822, "r": 322.62866, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "(0.", "bbox": {"l": 394.43222, "t": 261.54822, "r": 400.73563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "5", "bbox": {"l": 400.73456, "t": 261.54822, "r": 403.73697, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": ")", "bbox": {"l": 403.73804, "t": 261.54822, "r": 405.53625, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "(0.1)", "bbox": {"l": 427.7016, "t": 261.54822, "r": 438.80563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "87.08", "bbox": {"l": 468.55533, "t": 261.54822, "r": 482.07043, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "81.14", "bbox": {"l": 516.01862, "t": 261.54822, "r": 529.53375, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "Canceled or forfeited", "bbox": {"l": 306.11493, "t": 269.64148, "r": 356.24771, "b": 274.70667000000003, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "(0.", "bbox": {"l": 394.43222, "t": 270.31946000000005, "r": 400.73563, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "1", "bbox": {"l": 400.73456, "t": 270.31946000000005, "r": 403.73697, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": ")", "bbox": {"l": 403.73804, "t": 270.31946000000005, "r": 405.53625, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "-", "bbox": {"l": 431.02802, "t": 270.31946000000005, "r": 436.4280099999999, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "102.01", "bbox": {"l": 465.83099000000004, "t": 270.31946000000005, "r": 482.35013, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "92.18", "bbox": {"l": 516.01862, "t": 270.31946000000005, "r": 529.53375, "b": 275.38464, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "Nonvested on December 31", "bbox": {"l": 306.11493, "t": 278.48572, "r": 373.35764, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "1.0", "bbox": {"l": 396.24661, "t": 278.48572, "r": 403.75531, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "0.3", "bbox": {"l": 429.51599, "t": 278.48572, "r": 437.02469, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "104.85 $", "bbox": {"l": 463.7142, "t": 278.48572, "r": 484.73965000000004, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "$ 104.51", "bbox": {"l": 512.99463, "t": 278.48572, "r": 534.02008, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}], "children": [{"id": 102, "label": "text", "bbox": {"l": 459.04861, "t": 221.62415, "r": 542.00018, "b": 226.68933000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "Weighted Average Grant Date Fair", "bbox": {"l": 459.04861, "t": 221.62415, "r": 542.00018, "b": 226.68933000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 493.82193, "t": 227.83416999999997, "r": 507.2258, "b": 232.89935000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "Value", "bbox": {"l": 493.82193, "t": 227.83416999999997, "r": 507.2258, "b": 232.89935000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 393.2442, "t": 236.74712999999997, "r": 400.74588, "b": 241.81232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "RS", "bbox": {"l": 393.2442, "t": 236.74712999999997, "r": 400.74588, "b": 241.81232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 400.74643, "t": 236.74712999999997, "r": 404.64523, "b": 241.81232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "U", "bbox": {"l": 400.74643, "t": 236.74712999999997, "r": 404.64523, "b": 241.81232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 404.6463, "t": 236.74712999999997, "r": 407.34631, "b": 241.81232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "s", "bbox": {"l": 404.6463, "t": 236.74712999999997, "r": 407.34631, "b": 241.81232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 392.09671, "t": 221.57446000000004, "r": 438.0145, "b": 226.63964999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "Shares (in millions)", "bbox": {"l": 392.09671, "t": 221.57446000000004, "r": 438.0145, "b": 226.63964999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 427.18323, "t": 236.74712999999997, "r": 440.98778999999996, "b": 241.81232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "PSUs", "bbox": {"l": 427.18323, "t": 236.74712999999997, "r": 440.98778999999996, "b": 241.81232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 468.38254, "t": 236.74712999999997, "r": 482.48465000000004, "b": 241.81232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "RSUs", "bbox": {"l": 468.38254, "t": 236.74712999999997, "r": 482.48465000000004, "b": 241.81232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 516.92578, "t": 236.74712999999997, "r": 530.73035, "b": 241.81232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "PSUs", "bbox": {"l": 516.92578, "t": 236.74712999999997, "r": 530.73035, "b": 241.81232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 306.11493, "t": 244.61084000000005, "r": 355.6532, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "Nonvested on Janua", "bbox": {"l": 306.11493, "t": 244.61084000000005, "r": 355.6532, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 355.65427, "t": 244.61084000000005, "r": 364.65607, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "ry 1", "bbox": {"l": 355.65427, "t": 244.61084000000005, "r": 364.65607, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 396.24661, "t": 244.91327, "r": 400.75238, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "1.", "bbox": {"l": 396.24661, "t": 244.91327, "r": 400.75238, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 114, "label": "text", "bbox": {"l": 400.7529, "t": 244.91327, "r": 403.75531, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "1", "bbox": {"l": 400.7529, "t": 244.91327, "r": 403.75531, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 115, "label": "text", "bbox": {"l": 429.81838999999997, "t": 244.91327, "r": 437.32708999999994, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "0.3", "bbox": {"l": 429.81838999999997, "t": 244.91327, "r": 437.32708999999994, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 116, "label": "text", "bbox": {"l": 465.52859, "t": 244.91327, "r": 478.40103, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "90.10", "bbox": {"l": 465.52859, "t": 244.91327, "r": 478.40103, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 117, "label": "text", "bbox": {"l": 480.97552, "t": 244.91327, "r": 483.55001999999996, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "$", "bbox": {"l": 480.97552, "t": 244.91327, "r": 483.55001999999996, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 118, "label": "text", "bbox": {"l": 513.44824, "t": 244.91327, "r": 531.46967, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "$ 91.19", "bbox": {"l": 513.44824, "t": 244.91327, "r": 531.46967, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 119, "label": "text", "bbox": {"l": 306.11493, "t": 253.68451000000005, "r": 325.62674, "b": 258.74969, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "Granted", "bbox": {"l": 306.11493, "t": 253.68451000000005, "r": 325.62674, "b": 258.74969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 120, "label": "text", "bbox": {"l": 396.24661, "t": 253.68451000000005, "r": 400.75238, "b": 258.74969, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "0.", "bbox": {"l": 396.24661, "t": 253.68451000000005, "r": 400.75238, "b": 258.74969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 121, "label": "text", "bbox": {"l": 400.7529, "t": 253.68451000000005, "r": 403.75531, "b": 258.74969, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "5", "bbox": {"l": 400.7529, "t": 253.68451000000005, "r": 403.75531, "b": 258.74969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 122, "label": "text", "bbox": {"l": 429.81838999999997, "t": 253.68451000000005, "r": 437.32708999999994, "b": 258.74969, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "0.1", "bbox": {"l": 429.81838999999997, "t": 253.68451000000005, "r": 437.32708999999994, "b": 258.74969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 123, "label": "text", "bbox": {"l": 466.43579000000005, "t": 253.68451000000005, "r": 482.54831, "b": 258.74969, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "117.44", "bbox": {"l": 466.43579000000005, "t": 253.68451000000005, "r": 482.54831, "b": 258.74969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 124, "label": "text", "bbox": {"l": 514.29065, "t": 253.68451000000005, "r": 530.80981, "b": 258.74969, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "122.41", "bbox": {"l": 514.29065, "t": 253.68451000000005, "r": 530.80981, "b": 258.74969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 125, "label": "text", "bbox": {"l": 306.11493, "t": 261.54822, "r": 322.62866, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "Vested", "bbox": {"l": 306.11493, "t": 261.54822, "r": 322.62866, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 126, "label": "text", "bbox": {"l": 394.43222, "t": 261.54822, "r": 400.73563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "(0.", "bbox": {"l": 394.43222, "t": 261.54822, "r": 400.73563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 127, "label": "text", "bbox": {"l": 400.73456, "t": 261.54822, "r": 403.73697, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "5", "bbox": {"l": 400.73456, "t": 261.54822, "r": 403.73697, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 128, "label": "text", "bbox": {"l": 403.73804, "t": 261.54822, "r": 405.53625, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": ")", "bbox": {"l": 403.73804, "t": 261.54822, "r": 405.53625, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 129, "label": "text", "bbox": {"l": 427.7016, "t": 261.54822, "r": 438.80563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "(0.1)", "bbox": {"l": 427.7016, "t": 261.54822, "r": 438.80563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 130, "label": "text", "bbox": {"l": 468.55533, "t": 261.54822, "r": 482.07043, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "87.08", "bbox": {"l": 468.55533, "t": 261.54822, "r": 482.07043, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 131, "label": "text", "bbox": {"l": 516.01862, "t": 261.54822, "r": 529.53375, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": "81.14", "bbox": {"l": 516.01862, "t": 261.54822, "r": 529.53375, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 132, "label": "text", "bbox": {"l": 306.11493, "t": 269.64148, "r": 356.24771, "b": 274.70667000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 107, "text": "Canceled or forfeited", "bbox": {"l": 306.11493, "t": 269.64148, "r": 356.24771, "b": 274.70667000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 133, "label": "text", "bbox": {"l": 394.43222, "t": 270.31946000000005, "r": 400.73563, "b": 275.38464, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 108, "text": "(0.", "bbox": {"l": 394.43222, "t": 270.31946000000005, "r": 400.73563, "b": 275.38464, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 134, "label": "text", "bbox": {"l": 400.73456, "t": 270.31946000000005, "r": 403.73697, "b": 275.38464, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 109, "text": "1", "bbox": {"l": 400.73456, "t": 270.31946000000005, "r": 403.73697, "b": 275.38464, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 135, "label": "text", "bbox": {"l": 403.73804, "t": 270.31946000000005, "r": 405.53625, "b": 275.38464, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 110, "text": ")", "bbox": {"l": 403.73804, "t": 270.31946000000005, "r": 405.53625, "b": 275.38464, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 136, "label": "text", "bbox": {"l": 431.02802, "t": 270.31946000000005, "r": 436.4280099999999, "b": 275.38464, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 111, "text": "-", "bbox": {"l": 431.02802, "t": 270.31946000000005, "r": 436.4280099999999, "b": 275.38464, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 137, "label": "text", "bbox": {"l": 465.83099000000004, "t": 270.31946000000005, "r": 482.35013, "b": 275.38464, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 112, "text": "102.01", "bbox": {"l": 465.83099000000004, "t": 270.31946000000005, "r": 482.35013, "b": 275.38464, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 138, "label": "text", "bbox": {"l": 516.01862, "t": 270.31946000000005, "r": 529.53375, "b": 275.38464, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 113, "text": "92.18", "bbox": {"l": 516.01862, "t": 270.31946000000005, "r": 529.53375, "b": 275.38464, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 139, "label": "text", "bbox": {"l": 306.11493, "t": 278.48572, "r": 373.35764, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 114, "text": "Nonvested on December 31", "bbox": {"l": 306.11493, "t": 278.48572, "r": 373.35764, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 140, "label": "text", "bbox": {"l": 396.24661, "t": 278.48572, "r": 403.75531, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 115, "text": "1.0", "bbox": {"l": 396.24661, "t": 278.48572, "r": 403.75531, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 141, "label": "text", "bbox": {"l": 429.51599, "t": 278.48572, "r": 437.02469, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 116, "text": "0.3", "bbox": {"l": 429.51599, "t": 278.48572, "r": 437.02469, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 142, "label": "text", "bbox": {"l": 463.7142, "t": 278.48572, "r": 484.73965000000004, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 117, "text": "104.85 $", "bbox": {"l": 463.7142, "t": 278.48572, "r": 484.73965000000004, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 143, "label": "text", "bbox": {"l": 512.99463, "t": 278.48572, "r": 534.02008, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 118, "text": "$ 104.51", "bbox": {"l": 512.99463, "t": 278.48572, "r": 534.02008, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ecel", "ched", "lcel", "ched", "lcel", "nl", "ecel", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 7, "num_cols": 5, "table_cells": [{"bbox": {"l": 459.04861, "t": 221.62415, "r": 542.00018, "b": 232.89935000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 5, "text": "Weighted Average Grant Date Fair Value", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 393.2442, "t": 236.74712999999997, "r": 407.34631, "b": 241.81232, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "RS U s", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 392.09671, "t": 221.57446000000004, "r": 438.0145, "b": 226.63964999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 3, "text": "Shares (in millions)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 427.18323, "t": 236.74712999999997, "r": 440.98778999999996, "b": 241.81232, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "PSUs", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 468.38254, "t": 236.74712999999997, "r": 482.48465000000004, "b": 241.81232, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "RSUs", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 516.92578, "t": 236.74712999999997, "r": 530.73035, "b": 241.81232, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "PSUs", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 306.11493, "t": 244.61084000000005, "r": 364.65607, "b": 249.67602999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Nonvested on Janua ry 1", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 396.24661, "t": 244.91327, "r": 403.75531, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "1. 1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 429.81838999999997, "t": 244.91327, "r": 437.32708999999994, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 465.52859, "t": 244.91327, "r": 483.55001999999996, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "90.10 $", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 513.44824, "t": 244.91327, "r": 531.46967, "b": 249.97844999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "$ 91.19", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 306.11493, "t": 253.68451000000005, "r": 325.62674, "b": 258.74969, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Granted", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 396.24661, "t": 253.68451000000005, "r": 403.75531, "b": 258.74969, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "0. 5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 429.81838999999997, "t": 253.68451000000005, "r": 437.32708999999994, "b": 258.74969, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 466.43579000000005, "t": 253.68451000000005, "r": 482.54831, "b": 258.74969, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "117.44", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 514.29065, "t": 253.68451000000005, "r": 530.80981, "b": 258.74969, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "122.41", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 306.11493, "t": 261.54822, "r": 322.62866, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Vested", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 394.43222, "t": 261.54822, "r": 405.53625, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "(0. 5 )", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 427.7016, "t": 261.54822, "r": 438.80563, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "(0.1)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 468.55533, "t": 261.54822, "r": 482.07043, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "87.08", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 516.01862, "t": 261.54822, "r": 529.53375, "b": 266.61339999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "81.14", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 306.11493, "t": 269.64148, "r": 356.24771, "b": 274.70667000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Canceled or forfeited", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 394.43222, "t": 270.31946000000005, "r": 405.53625, "b": 275.38464, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "(0. 1 )", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 431.02802, "t": 270.31946000000005, "r": 436.4280099999999, "b": 275.38464, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 465.83099000000004, "t": 270.31946000000005, "r": 482.35013, "b": 275.38464, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "102.01", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 516.01862, "t": 270.31946000000005, "r": 529.53375, "b": 275.38464, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "92.18", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 306.11493, "t": 278.48572, "r": 373.35764, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Nonvested on December 31", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 396.24661, "t": 278.48572, "r": 403.75531, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "1.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 429.51599, "t": 278.48572, "r": 437.02469, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 463.7142, "t": 278.48572, "r": 484.73965000000004, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "104.85 $", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 512.99463, "t": 278.48572, "r": 534.02008, "b": 283.55092999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "$ 104.51", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "caption", "id": 6, "page_no": 7, "cluster": {"id": 6, "label": "caption", "bbox": {"l": 50.112, "t": 320.87735, "r": 545.11377, "b": 365.64987, "coord_origin": "TOPLEFT"}, "confidence": 0.9140303134918213, "cells": [{"id": 119, "text": "Figure 5:", "bbox": {"l": 50.112, "t": 320.87735, "r": 86.864021, "b": 329.78391, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "One of the benefits of TableFormer is that it is language agnostic, as an example, the left part of the illustration", "bbox": {"l": 93.917542, "t": 320.87735, "r": 545.11371, "b": 329.78391, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "demonstrates TableFormer predictions on previously unseen language (Japanese). Additionally, we see that TableFormer is", "bbox": {"l": 50.112, "t": 332.83233999999993, "r": 545.11371, "b": 341.73889, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "robust to variability in style and content, right side of the illustration shows the example of the TableFormer prediction from", "bbox": {"l": 50.112, "t": 344.78732, "r": 545.11377, "b": 353.69388, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "the FinTabNet dataset.", "bbox": {"l": 50.112, "t": 356.74332, "r": 139.79532, "b": 365.64987, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 5: One of the benefits of TableFormer is that it is language agnostic, as an example, the left part of the illustration demonstrates TableFormer predictions on previously unseen language (Japanese). Additionally, we see that TableFormer is robust to variability in style and content, right side of the illustration shows the example of the TableFormer prediction from the FinTabNet dataset."}, {"label": "picture", "id": 12, "page_no": 7, "cluster": {"id": 12, "label": "picture", "bbox": {"l": 216.76925659179688, "t": 380.4906311035156, "r": 375.7829284667969, "b": 443.34698486328125, "coord_origin": "TOPLEFT"}, "confidence": 0.805853009223938, "cells": [{"id": 124, "text": "Red - PDF cells, Green - predicted bounding boxes", "bbox": {"l": 220.26282, "t": 381.77722, "r": 342.07819, "b": 386.44281, "coord_origin": "TOPLEFT"}}], "children": [{"id": 144, "label": "text", "bbox": {"l": 220.26282, "t": 381.77722, "r": 342.07819, "b": 386.44281, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 124, "text": "Red - PDF cells, Green - predicted bounding boxes", "bbox": {"l": 220.26282, "t": 381.77722, "r": 342.07819, "b": 386.44281, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "picture", "id": 11, "page_no": 7, "cluster": {"id": 11, "label": "picture", "bbox": {"l": 51.736167907714844, "t": 380.48065185546875, "r": 211.83778381347656, "b": 443.6580810546875, "coord_origin": "TOPLEFT"}, "confidence": 0.8308426737785339, "cells": [{"id": 125, "text": "Ground Truth", "bbox": {"l": 53.715248, "t": 381.77722, "r": 85.657333, "b": 386.44281, "coord_origin": "TOPLEFT"}}], "children": [{"id": 145, "label": "text", "bbox": {"l": 53.715248, "t": 381.77722, "r": 85.657333, "b": 386.44281, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 125, "text": "Ground Truth", "bbox": {"l": 53.715248, "t": 381.77722, "r": 85.657333, "b": 386.44281, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "picture", "id": 13, "page_no": 7, "cluster": {"id": 13, "label": "picture", "bbox": {"l": 383.1364440917969, "t": 381.2313232421875, "r": 542.1132202148438, "b": 442.7749328613281, "coord_origin": "TOPLEFT"}, "confidence": 0.7881615161895752, "cells": [{"id": 126, "text": "16", "bbox": {"l": 437.37939, "t": 400.55295, "r": 443.69870000000003, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "17", "bbox": {"l": 450.33203, "t": 400.55295, "r": 456.6513100000001, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "18", "bbox": {"l": 463.28464, "t": 400.55295, "r": 469.60394, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "19", "bbox": {"l": 476.23724000000004, "t": 400.55295, "r": 482.5565500000001, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "20", "bbox": {"l": 489.18988, "t": 400.55295, "r": 495.50916, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "21", "bbox": {"l": 502.14251999999993, "t": 400.55295, "r": 508.46178999999995, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "22", "bbox": {"l": 515.09509, "t": 400.55295, "r": 521.41443, "b": 406.87158, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "23", "bbox": {"l": 385.2814, "t": 411.03836000000007, "r": 391.60071, "b": 417.35699, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "24", "bbox": {"l": 398.52341, "t": 411.03836000000007, "r": 404.84271, "b": 417.35699, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "25", "bbox": {"l": 411.47604, "t": 411.03836000000007, "r": 417.79535, "b": 417.35699, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "26", "bbox": {"l": 437.37939, "t": 411.03836000000007, "r": 443.69870000000003, "b": 417.35699, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "27", "bbox": {"l": 450.33203, "t": 411.03836000000007, "r": 456.6513100000001, "b": 417.35699, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "28", "bbox": {"l": 463.28464, "t": 411.03836000000007, "r": 469.60394, "b": 417.35699, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "30", "bbox": {"l": 385.2814, "t": 421.0697, "r": 391.60071, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "31", "bbox": {"l": 398.52341, "t": 421.0697, "r": 404.84271, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "32", "bbox": {"l": 411.47604, "t": 421.0697, "r": 417.79532, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "33", "bbox": {"l": 424.42865, "t": 421.0697, "r": 430.74796, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "34", "bbox": {"l": 437.38129, "t": 421.0697, "r": 443.70056, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "35", "bbox": {"l": 450.33389000000005, "t": 421.0697, "r": 456.65319999999997, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "36", "bbox": {"l": 463.2865, "t": 421.0697, "r": 469.6058, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "37", "bbox": {"l": 476.23914, "t": 421.0697, "r": 482.55841, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "38", "bbox": {"l": 489.1917700000001, "t": 421.0697, "r": 495.51105, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "39", "bbox": {"l": 502.14438, "t": 421.0697, "r": 508.46368, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "40", "bbox": {"l": 515.09705, "t": 421.0697, "r": 521.41632, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "41", "bbox": {"l": 528.04962, "t": 421.0697, "r": 534.3689, "b": 427.38834, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "42", "bbox": {"l": 385.2814, "t": 432.04431, "r": 391.60071, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "43", "bbox": {"l": 398.52341, "t": 432.04431, "r": 404.84271, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "44", "bbox": {"l": 411.47604, "t": 432.04431, "r": 417.79532, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "45", "bbox": {"l": 424.42865, "t": 432.04431, "r": 430.74796, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "46", "bbox": {"l": 437.38129, "t": 432.04431, "r": 443.70056, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "47", "bbox": {"l": 450.33389000000005, "t": 432.04431, "r": 456.65319999999997, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "48", "bbox": {"l": 463.2865, "t": 432.04431, "r": 469.6058, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "49", "bbox": {"l": 476.23914, "t": 432.04431, "r": 482.55841, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "50", "bbox": {"l": 489.1917700000001, "t": 432.04431, "r": 495.51105, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "51", "bbox": {"l": 502.14438, "t": 432.04431, "r": 508.46368, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "52", "bbox": {"l": 515.09705, "t": 432.04431, "r": 521.41632, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "53", "bbox": {"l": 528.04962, "t": 432.04431, "r": 534.3689, "b": 438.36295, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "0", "bbox": {"l": 385.2814, "t": 389.20004, "r": 388.44073, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "1", "bbox": {"l": 398.52341, "t": 389.20004, "r": 401.68274, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "2", "bbox": {"l": 411.4754, "t": 389.20004, "r": 414.63474, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "3", "bbox": {"l": 424.4274, "t": 389.20004, "r": 427.58673, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "4", "bbox": {"l": 437.37939, "t": 389.20004, "r": 440.53870000000006, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "5", "bbox": {"l": 450.33136, "t": 389.20004, "r": 453.49069000000003, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "6", "bbox": {"l": 463.28336, "t": 389.20004, "r": 466.44269, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "7", "bbox": {"l": 476.23535, "t": 389.20004, "r": 479.39468, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "8", "bbox": {"l": 489.18735, "t": 389.20004, "r": 492.34668, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "9", "bbox": {"l": 502.13933999999995, "t": 389.20004, "r": 505.29868000000005, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "10", "bbox": {"l": 515.09131, "t": 389.20004, "r": 521.41064, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "11", "bbox": {"l": 528.04364, "t": 389.20004, "r": 534.13104, "b": 395.51868, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "12", "bbox": {"l": 385.2814, "t": 398.97464, "r": 391.60071, "b": 405.29327, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "13", "bbox": {"l": 398.52341, "t": 398.97464, "r": 404.84271, "b": 405.29327, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "14", "bbox": {"l": 411.47604, "t": 398.97464, "r": 417.79535, "b": 405.29327, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "15", "bbox": {"l": 424.42719, "t": 406.77463000000006, "r": 430.74648999999994, "b": 413.09326, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "29", "bbox": {"l": 502.86941999999993, "t": 410.99438, "r": 509.18871999999993, "b": 417.31302, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "Predicted Structure", "bbox": {"l": 384.35437, "t": 381.77722, "r": 430.99261, "b": 386.44281, "coord_origin": "TOPLEFT"}}], "children": [{"id": 146, "label": "text", "bbox": {"l": 437.37939, "t": 400.55295, "r": 443.69870000000003, "b": 406.87158, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 126, "text": "16", "bbox": {"l": 437.37939, "t": 400.55295, "r": 443.69870000000003, "b": 406.87158, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 147, "label": "text", "bbox": {"l": 450.33203, "t": 400.55295, "r": 456.6513100000001, "b": 406.87158, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 127, "text": "17", "bbox": {"l": 450.33203, "t": 400.55295, "r": 456.6513100000001, "b": 406.87158, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 148, "label": "text", "bbox": {"l": 463.28464, "t": 400.55295, "r": 469.60394, "b": 406.87158, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 128, "text": "18", "bbox": {"l": 463.28464, "t": 400.55295, "r": 469.60394, "b": 406.87158, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 149, "label": "text", "bbox": {"l": 476.23724000000004, "t": 400.55295, "r": 482.5565500000001, "b": 406.87158, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 129, "text": "19", "bbox": {"l": 476.23724000000004, "t": 400.55295, "r": 482.5565500000001, "b": 406.87158, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 150, "label": "text", "bbox": {"l": 489.18988, "t": 400.55295, "r": 495.50916, "b": 406.87158, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 130, "text": "20", "bbox": {"l": 489.18988, "t": 400.55295, "r": 495.50916, "b": 406.87158, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 151, "label": "text", "bbox": {"l": 502.14251999999993, "t": 400.55295, "r": 508.46178999999995, "b": 406.87158, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 131, "text": "21", "bbox": {"l": 502.14251999999993, "t": 400.55295, "r": 508.46178999999995, "b": 406.87158, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 152, "label": "text", "bbox": {"l": 515.09509, "t": 400.55295, "r": 521.41443, "b": 406.87158, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 132, "text": "22", "bbox": {"l": 515.09509, "t": 400.55295, "r": 521.41443, "b": 406.87158, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 153, "label": "text", "bbox": {"l": 385.2814, "t": 411.03836000000007, "r": 391.60071, "b": 417.35699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 133, "text": "23", "bbox": {"l": 385.2814, "t": 411.03836000000007, "r": 391.60071, "b": 417.35699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 154, "label": "text", "bbox": {"l": 398.52341, "t": 411.03836000000007, "r": 404.84271, "b": 417.35699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 134, "text": "24", "bbox": {"l": 398.52341, "t": 411.03836000000007, "r": 404.84271, "b": 417.35699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 155, "label": "text", "bbox": {"l": 411.47604, "t": 411.03836000000007, "r": 417.79535, "b": 417.35699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 135, "text": "25", "bbox": {"l": 411.47604, "t": 411.03836000000007, "r": 417.79535, "b": 417.35699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 156, "label": "text", "bbox": {"l": 437.37939, "t": 411.03836000000007, "r": 443.69870000000003, "b": 417.35699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 136, "text": "26", "bbox": {"l": 437.37939, "t": 411.03836000000007, "r": 443.69870000000003, "b": 417.35699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 157, "label": "text", "bbox": {"l": 450.33203, "t": 411.03836000000007, "r": 456.6513100000001, "b": 417.35699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 137, "text": "27", "bbox": {"l": 450.33203, "t": 411.03836000000007, "r": 456.6513100000001, "b": 417.35699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 158, "label": "text", "bbox": {"l": 463.28464, "t": 411.03836000000007, "r": 469.60394, "b": 417.35699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 138, "text": "28", "bbox": {"l": 463.28464, "t": 411.03836000000007, "r": 469.60394, "b": 417.35699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 159, "label": "text", "bbox": {"l": 385.2814, "t": 421.0697, "r": 391.60071, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 139, "text": "30", "bbox": {"l": 385.2814, "t": 421.0697, "r": 391.60071, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 160, "label": "text", "bbox": {"l": 398.52341, "t": 421.0697, "r": 404.84271, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 140, "text": "31", "bbox": {"l": 398.52341, "t": 421.0697, "r": 404.84271, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 161, "label": "text", "bbox": {"l": 411.47604, "t": 421.0697, "r": 417.79532, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 141, "text": "32", "bbox": {"l": 411.47604, "t": 421.0697, "r": 417.79532, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 162, "label": "text", "bbox": {"l": 424.42865, "t": 421.0697, "r": 430.74796, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 142, "text": "33", "bbox": {"l": 424.42865, "t": 421.0697, "r": 430.74796, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 163, "label": "text", "bbox": {"l": 437.38129, "t": 421.0697, "r": 443.70056, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 143, "text": "34", "bbox": {"l": 437.38129, "t": 421.0697, "r": 443.70056, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 164, "label": "text", "bbox": {"l": 450.33389000000005, "t": 421.0697, "r": 456.65319999999997, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 144, "text": "35", "bbox": {"l": 450.33389000000005, "t": 421.0697, "r": 456.65319999999997, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 165, "label": "text", "bbox": {"l": 463.2865, "t": 421.0697, "r": 469.6058, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 145, "text": "36", "bbox": {"l": 463.2865, "t": 421.0697, "r": 469.6058, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 166, "label": "text", "bbox": {"l": 476.23914, "t": 421.0697, "r": 482.55841, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 146, "text": "37", "bbox": {"l": 476.23914, "t": 421.0697, "r": 482.55841, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 167, "label": "text", "bbox": {"l": 489.1917700000001, "t": 421.0697, "r": 495.51105, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 147, "text": "38", "bbox": {"l": 489.1917700000001, "t": 421.0697, "r": 495.51105, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 168, "label": "text", "bbox": {"l": 502.14438, "t": 421.0697, "r": 508.46368, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 148, "text": "39", "bbox": {"l": 502.14438, "t": 421.0697, "r": 508.46368, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 169, "label": "text", "bbox": {"l": 515.09705, "t": 421.0697, "r": 521.41632, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 149, "text": "40", "bbox": {"l": 515.09705, "t": 421.0697, "r": 521.41632, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 170, "label": "text", "bbox": {"l": 528.04962, "t": 421.0697, "r": 534.3689, "b": 427.38834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 150, "text": "41", "bbox": {"l": 528.04962, "t": 421.0697, "r": 534.3689, "b": 427.38834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 171, "label": "text", "bbox": {"l": 385.2814, "t": 432.04431, "r": 391.60071, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 151, "text": "42", "bbox": {"l": 385.2814, "t": 432.04431, "r": 391.60071, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 172, "label": "text", "bbox": {"l": 398.52341, "t": 432.04431, "r": 404.84271, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 152, "text": "43", "bbox": {"l": 398.52341, "t": 432.04431, "r": 404.84271, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 173, "label": "text", "bbox": {"l": 411.47604, "t": 432.04431, "r": 417.79532, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 153, "text": "44", "bbox": {"l": 411.47604, "t": 432.04431, "r": 417.79532, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 174, "label": "text", "bbox": {"l": 424.42865, "t": 432.04431, "r": 430.74796, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 154, "text": "45", "bbox": {"l": 424.42865, "t": 432.04431, "r": 430.74796, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 175, "label": "text", "bbox": {"l": 437.38129, "t": 432.04431, "r": 443.70056, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 155, "text": "46", "bbox": {"l": 437.38129, "t": 432.04431, "r": 443.70056, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 176, "label": "text", "bbox": {"l": 450.33389000000005, "t": 432.04431, "r": 456.65319999999997, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 156, "text": "47", "bbox": {"l": 450.33389000000005, "t": 432.04431, "r": 456.65319999999997, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 177, "label": "text", "bbox": {"l": 463.2865, "t": 432.04431, "r": 469.6058, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 157, "text": "48", "bbox": {"l": 463.2865, "t": 432.04431, "r": 469.6058, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 178, "label": "text", "bbox": {"l": 476.23914, "t": 432.04431, "r": 482.55841, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 158, "text": "49", "bbox": {"l": 476.23914, "t": 432.04431, "r": 482.55841, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 179, "label": "text", "bbox": {"l": 489.1917700000001, "t": 432.04431, "r": 495.51105, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 159, "text": "50", "bbox": {"l": 489.1917700000001, "t": 432.04431, "r": 495.51105, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 180, "label": "text", "bbox": {"l": 502.14438, "t": 432.04431, "r": 508.46368, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 160, "text": "51", "bbox": {"l": 502.14438, "t": 432.04431, "r": 508.46368, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 181, "label": "text", "bbox": {"l": 515.09705, "t": 432.04431, "r": 521.41632, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 161, "text": "52", "bbox": {"l": 515.09705, "t": 432.04431, "r": 521.41632, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 182, "label": "text", "bbox": {"l": 528.04962, "t": 432.04431, "r": 534.3689, "b": 438.36295, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 162, "text": "53", "bbox": {"l": 528.04962, "t": 432.04431, "r": 534.3689, "b": 438.36295, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 183, "label": "text", "bbox": {"l": 385.2814, "t": 389.20004, "r": 388.44073, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 163, "text": "0", "bbox": {"l": 385.2814, "t": 389.20004, "r": 388.44073, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 184, "label": "text", "bbox": {"l": 398.52341, "t": 389.20004, "r": 401.68274, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 164, "text": "1", "bbox": {"l": 398.52341, "t": 389.20004, "r": 401.68274, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 185, "label": "text", "bbox": {"l": 411.4754, "t": 389.20004, "r": 414.63474, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 165, "text": "2", "bbox": {"l": 411.4754, "t": 389.20004, "r": 414.63474, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 186, "label": "text", "bbox": {"l": 424.4274, "t": 389.20004, "r": 427.58673, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 166, "text": "3", "bbox": {"l": 424.4274, "t": 389.20004, "r": 427.58673, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 187, "label": "text", "bbox": {"l": 437.37939, "t": 389.20004, "r": 440.53870000000006, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 167, "text": "4", "bbox": {"l": 437.37939, "t": 389.20004, "r": 440.53870000000006, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 188, "label": "text", "bbox": {"l": 450.33136, "t": 389.20004, "r": 453.49069000000003, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 168, "text": "5", "bbox": {"l": 450.33136, "t": 389.20004, "r": 453.49069000000003, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 189, "label": "text", "bbox": {"l": 463.28336, "t": 389.20004, "r": 466.44269, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 169, "text": "6", "bbox": {"l": 463.28336, "t": 389.20004, "r": 466.44269, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 190, "label": "text", "bbox": {"l": 476.23535, "t": 389.20004, "r": 479.39468, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 170, "text": "7", "bbox": {"l": 476.23535, "t": 389.20004, "r": 479.39468, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 191, "label": "text", "bbox": {"l": 489.18735, "t": 389.20004, "r": 492.34668, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 171, "text": "8", "bbox": {"l": 489.18735, "t": 389.20004, "r": 492.34668, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 192, "label": "text", "bbox": {"l": 502.13933999999995, "t": 389.20004, "r": 505.29868000000005, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 172, "text": "9", "bbox": {"l": 502.13933999999995, "t": 389.20004, "r": 505.29868000000005, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 193, "label": "text", "bbox": {"l": 515.09131, "t": 389.20004, "r": 521.41064, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 173, "text": "10", "bbox": {"l": 515.09131, "t": 389.20004, "r": 521.41064, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 194, "label": "text", "bbox": {"l": 528.04364, "t": 389.20004, "r": 534.13104, "b": 395.51868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 174, "text": "11", "bbox": {"l": 528.04364, "t": 389.20004, "r": 534.13104, "b": 395.51868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 195, "label": "text", "bbox": {"l": 385.2814, "t": 398.97464, "r": 391.60071, "b": 405.29327, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 175, "text": "12", "bbox": {"l": 385.2814, "t": 398.97464, "r": 391.60071, "b": 405.29327, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 196, "label": "text", "bbox": {"l": 398.52341, "t": 398.97464, "r": 404.84271, "b": 405.29327, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 176, "text": "13", "bbox": {"l": 398.52341, "t": 398.97464, "r": 404.84271, "b": 405.29327, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 197, "label": "text", "bbox": {"l": 411.47604, "t": 398.97464, "r": 417.79535, "b": 405.29327, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 177, "text": "14", "bbox": {"l": 411.47604, "t": 398.97464, "r": 417.79535, "b": 405.29327, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 198, "label": "text", "bbox": {"l": 424.42719, "t": 406.77463000000006, "r": 430.74648999999994, "b": 413.09326, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 178, "text": "15", "bbox": {"l": 424.42719, "t": 406.77463000000006, "r": 430.74648999999994, "b": 413.09326, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 199, "label": "text", "bbox": {"l": 502.86941999999993, "t": 410.99438, "r": 509.18871999999993, "b": 417.31302, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 179, "text": "29", "bbox": {"l": 502.86941999999993, "t": 410.99438, "r": 509.18871999999993, "b": 417.31302, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 200, "label": "text", "bbox": {"l": 384.35437, "t": 381.77722, "r": 430.99261, "b": 386.44281, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 180, "text": "Predicted Structure", "bbox": {"l": 384.35437, "t": 381.77722, "r": 430.99261, "b": 386.44281, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "caption", "id": 5, "page_no": 7, "cluster": {"id": 5, "label": "caption", "bbox": {"l": 62.595001, "t": 458.72836, "r": 532.63049, "b": 467.63492, "coord_origin": "TOPLEFT"}, "confidence": 0.9153602719306946, "cells": [{"id": 181, "text": "Figure 6: An example of TableFormer predictions (bounding boxes and structure) from generated SynthTabNet table.", "bbox": {"l": 62.595001, "t": 458.72836, "r": 532.63049, "b": 467.63492, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 6: An example of TableFormer predictions (bounding boxes and structure) from generated SynthTabNet table."}, {"label": "section_header", "id": 2, "page_no": 7, "cluster": {"id": 2, "label": "section_header", "bbox": {"l": 50.112, "t": 491.39536, "r": 163.7558, "b": 501.24741, "coord_origin": "TOPLEFT"}, "confidence": 0.9561247229576111, "cells": [{"id": 182, "text": "5.5.", "bbox": {"l": 50.112, "t": 491.39536, "r": 64.448898, "b": 501.24741, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "Qualitative Analysis", "bbox": {"l": 74.006828, "t": 491.39536, "r": 163.7558, "b": 501.24741, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5.5. Qualitative Analysis"}, {"label": "text", "id": 1, "page_no": 7, "cluster": {"id": 1, "label": "text", "bbox": {"l": 50.112, "t": 536.87337, "r": 286.36511, "b": 713.1519470000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9852361679077148, "cells": [{"id": 184, "text": "We showcase several visualizations for the different", "bbox": {"l": 62.067001, "t": 536.87337, "r": 286.36499, "b": 545.77992, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": "components of our network on various", "bbox": {"l": 50.112, "t": 548.82837, "r": 211.15741, "b": 557.73492, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "\u201ccomplex\u201d", "bbox": {"l": 215.10000999999997, "t": 548.91803, "r": 259.17453, "b": 557.50578, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "tables", "bbox": {"l": 263.12, "t": 548.82837, "r": 286.36273, "b": 557.73492, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": "within datasets presented in this work in Fig. 5 and Fig. 6", "bbox": {"l": 50.112, "t": 560.78337, "r": 286.36505, "b": 569.68993, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "As it is shown, our model is able to predict bounding boxes", "bbox": {"l": 50.112, "t": 572.73837, "r": 286.36508, "b": 581.6449299999999, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "for all table cells, even for the empty ones. Additionally,", "bbox": {"l": 50.112, "t": 584.69337, "r": 286.36508, "b": 593.59993, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "our post-processing techniques can extract the cell content", "bbox": {"l": 50.112, "t": 596.64937, "r": 286.36505, "b": 605.55592, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": "by matching the predicted bounding boxes to the PDF cells", "bbox": {"l": 50.112, "t": 608.60437, "r": 286.36508, "b": 617.51093, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "based on their overlap and spatial proximity. The left part", "bbox": {"l": 50.112, "t": 620.55937, "r": 286.36508, "b": 629.46593, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "of Fig. 5 demonstrates also the adaptability of our method", "bbox": {"l": 50.112, "t": 632.51437, "r": 286.36508, "b": 641.42093, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "to any language, as it can successfully extract Japanese", "bbox": {"l": 50.112, "t": 644.46938, "r": 286.36508, "b": 653.37593, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "text, although the training set contains only English content.", "bbox": {"l": 50.112, "t": 656.42438, "r": 286.36511, "b": 665.33094, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "We provide more visualizations including the intermediate", "bbox": {"l": 50.112, "t": 668.38037, "r": 286.36508, "b": 677.28694, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "steps in the supplementary material. Overall these illustra-", "bbox": {"l": 50.112, "t": 680.33537, "r": 286.36511, "b": 689.24194, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "tions justify the versatility of our method across a diverse", "bbox": {"l": 50.112, "t": 692.290375, "r": 286.36511, "b": 701.196945, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "range of table appearances and content type.", "bbox": {"l": 50.112, "t": 704.245377, "r": 226.88833999999997, "b": 713.1519470000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "We showcase several visualizations for the different components of our network on various \"complex\" tables within datasets presented in this work in Fig. 5 and Fig. 6 As it is shown, our model is able to predict bounding boxes for all table cells, even for the empty ones. Additionally, our post-processing techniques can extract the cell content by matching the predicted bounding boxes to the PDF cells based on their overlap and spatial proximity. The left part of Fig. 5 demonstrates also the adaptability of our method to any language, as it can successfully extract Japanese text, although the training set contains only English content. We provide more visualizations including the intermediate steps in the supplementary material. Overall these illustrations justify the versatility of our method across a diverse range of table appearances and content type."}, {"label": "section_header", "id": 4, "page_no": 7, "cluster": {"id": 4, "label": "section_header", "bbox": {"l": 308.862, "t": 490.70892, "r": 460.84848, "b": 501.45663, "coord_origin": "TOPLEFT"}, "confidence": 0.9436525702476501, "cells": [{"id": 201, "text": "6.", "bbox": {"l": 308.862, "t": 490.70892, "r": 316.07382, "b": 501.45663, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": "Future Work & Conclusion", "bbox": {"l": 325.68954, "t": 490.70892, "r": 460.84848, "b": 501.45663, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "6. Future Work & Conclusion"}, {"label": "text", "id": 0, "page_no": 7, "cluster": {"id": 0, "label": "text", "bbox": {"l": 308.862, "t": 512.89337, "r": 545.11517, "b": 653.30592, "coord_origin": "TOPLEFT"}, "confidence": 0.9875594973564148, "cells": [{"id": 203, "text": "In this paper, we presented TableFormer an end-to-end", "bbox": {"l": 320.81699, "t": 512.89337, "r": 545.11505, "b": 521.79993, "coord_origin": "TOPLEFT"}}, {"id": 204, "text": "transformer based approach to predict table structures and", "bbox": {"l": 308.862, "t": 524.84836, "r": 545.11517, "b": 533.75491, "coord_origin": "TOPLEFT"}}, {"id": 205, "text": "bounding boxes of cells from an image. This approach en-", "bbox": {"l": 308.862, "t": 536.80336, "r": 545.11511, "b": 545.70992, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": "ables us to recreate the table structure, and extract the cell", "bbox": {"l": 308.862, "t": 548.75836, "r": 545.11505, "b": 557.6649199999999, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": "content from PDF or OCR by using bounding boxes. Ad-", "bbox": {"l": 308.862, "t": 560.71336, "r": 545.11517, "b": 569.61992, "coord_origin": "TOPLEFT"}}, {"id": 208, "text": "ditionally, it provides the versatility required in real-world", "bbox": {"l": 308.862, "t": 572.66837, "r": 545.11511, "b": 581.57492, "coord_origin": "TOPLEFT"}}, {"id": 209, "text": "scenarios when dealing with various types of PDF docu-", "bbox": {"l": 308.862, "t": 584.62436, "r": 545.11511, "b": 593.53091, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": "ments, and languages.", "bbox": {"l": 308.862, "t": 596.57936, "r": 400.46808, "b": 605.48592, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "Furthermore, our method outper-", "bbox": {"l": 408.37839, "t": 596.57936, "r": 545.11511, "b": 605.48592, "coord_origin": "TOPLEFT"}}, {"id": 212, "text": "forms all state-of-the-arts with a wide margin. Finally, we", "bbox": {"l": 308.862, "t": 608.53436, "r": 545.11505, "b": 617.44092, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "introduce \u201cSynthTabNet\u201d a challenging synthetically gen-", "bbox": {"l": 308.862, "t": 620.48936, "r": 545.11511, "b": 629.3959199999999, "coord_origin": "TOPLEFT"}}, {"id": 214, "text": "erated dataset that reinforces missing characteristics from", "bbox": {"l": 308.862, "t": 632.4443699999999, "r": 545.11505, "b": 641.35092, "coord_origin": "TOPLEFT"}}, {"id": 215, "text": "other datasets.", "bbox": {"l": 308.862, "t": 644.39937, "r": 365.85803, "b": 653.30592, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In this paper, we presented TableFormer an end-to-end transformer based approach to predict table structures and bounding boxes of cells from an image. This approach enables us to recreate the table structure, and extract the cell content from PDF or OCR by using bounding boxes. Additionally, it provides the versatility required in real-world scenarios when dealing with various types of PDF documents, and languages. Furthermore, our method outperforms all state-of-the-arts with a wide margin. Finally, we introduce \"SynthTabNet\" a challenging synthetically generated dataset that reinforces missing characteristics from other datasets."}, {"label": "section_header", "id": 3, "page_no": 7, "cluster": {"id": 3, "label": "section_header", "bbox": {"l": 308.862, "t": 672.09892, "r": 364.40585, "b": 682.84664, "coord_origin": "TOPLEFT"}, "confidence": 0.9442470073699951, "cells": [{"id": 216, "text": "References", "bbox": {"l": 308.862, "t": 672.09892, "r": 364.40585, "b": 682.84664, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "References"}, {"label": "list_item", "id": 10, "page_no": 7, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 313.345, "t": 693.9617920000001, "r": 545.1134, "b": 712.936752, "coord_origin": "TOPLEFT"}, "confidence": 0.8318753838539124, "cells": [{"id": 217, "text": "[1]", "bbox": {"l": 313.345, "t": 693.9617920000001, "r": 323.80792, "b": 701.977753, "coord_origin": "TOPLEFT"}}, {"id": 218, "text": "Nicolas Carion, Francisco Massa, Gabriel Synnaeve, Nicolas", "bbox": {"l": 326.05127, "t": 693.9617920000001, "r": 545.10852, "b": 701.977753, "coord_origin": "TOPLEFT"}}, {"id": 219, "text": "Usunier, Alexander Kirillov, and Sergey Zagoruyko. End-to-", "bbox": {"l": 328.78101, "t": 704.920792, "r": 545.1134, "b": 712.936752, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[1] Nicolas Carion, Francisco Massa, Gabriel Synnaeve, Nicolas Usunier, Alexander Kirillov, and Sergey Zagoruyko. End-to-"}, {"label": "picture", "id": 15, "page_no": 7, "cluster": {"id": 15, "label": "picture", "bbox": {"l": 305.5836486816406, "t": 98.65415954589844, "r": 554.8258666992188, "b": 180.6267547607422, "coord_origin": "TOPLEFT"}, "confidence": 0.7699173092842102, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "picture", "id": 14, "page_no": 7, "cluster": {"id": 14, "label": "picture", "bbox": {"l": 49.97503662109375, "t": 103.71266174316406, "r": 301.6335754394531, "b": 187.5789337158203, "coord_origin": "TOPLEFT"}, "confidence": 0.7873926162719727, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "headers": [{"label": "page_footer", "id": 9, "page_no": 7, "cluster": {"id": 9, "label": "page_footer", "bbox": {"l": 295.121, "t": 734.133366, "r": 300.10229, "b": 743.039928, "coord_origin": "TOPLEFT"}, "confidence": 0.8709858059883118, "cells": [{"id": 220, "text": "8", "bbox": {"l": 295.121, "t": 734.133366, "r": 300.10229, "b": 743.039928, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "8"}]}}, {"page_no": 8, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "end object detection with transformers. In Andrea Vedaldi,", "bbox": {"l": 70.030998, "t": 75.88378999999998, "r": 286.36334, "b": 83.89977999999996, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Horst Bischof, Thomas Brox, and Jan-Michael Frahm, edi-", "bbox": {"l": 70.030998, "t": 86.84276999999997, "r": 286.36331, "b": 94.85875999999996, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "tors,", "bbox": {"l": 70.030998, "t": 97.80078000000003, "r": 85.722198, "b": 105.81677000000002, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Computer Vision - ECCV 2020", "bbox": {"l": 87.889, "t": 97.88147000000004, "r": 199.93315, "b": 105.61053000000004, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": ", pages 213-229, Cham,", "bbox": {"l": 199.936, "t": 97.80078000000003, "r": 286.36313, "b": 105.81677000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "2020. Springer International Publishing. 5", "bbox": {"l": 70.031006, "t": 108.75977, "r": 221.94871999999998, "b": 116.77575999999999, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "[2]", "bbox": {"l": 54.595005, "t": 120.03174000000013, "r": 65.206657, "b": 128.04773, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Zewen Chi, Heyan Huang, Heng-Da Xu, Houjin Yu, Wanx-", "bbox": {"l": 67.481873, "t": 120.03174000000013, "r": 286.35852, "b": 128.04773, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "uan Yin, and Xian-Ling Mao.", "bbox": {"l": 70.031006, "t": 130.99072, "r": 179.67215, "b": 139.00671, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Complicated table structure", "bbox": {"l": 185.58101, "t": 130.99072, "r": 286.36334, "b": 139.00671, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "recognition.", "bbox": {"l": 70.031006, "t": 141.94970999999998, "r": 113.11456, "b": 149.96569999999997, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "arXiv preprint arXiv:1908.04729", "bbox": {"l": 116.34200999999999, "t": 142.0304, "r": 235.3082, "b": 149.75946, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": ", 2019. 3", "bbox": {"l": 235.30701, "t": 141.94970999999998, "r": 267.67572, "b": 149.96569999999997, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "[3]", "bbox": {"l": 54.595001, "t": 153.22168, "r": 65.103195, "b": 161.23766999999998, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Bertrand Couasnon and Aurelie Lemaitre.", "bbox": {"l": 67.356239, "t": 153.22168, "r": 218.77876, "b": 161.23766999999998, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Recognition of Ta-", "bbox": {"l": 220.97999999999996, "t": 153.30237, "r": 286.36301, "b": 161.03143, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "bles and Forms", "bbox": {"l": 70.030991, "t": 164.26135, "r": 125.26401000000001, "b": 171.99041999999997, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": ", pages 647-677. Springer London, London,", "bbox": {"l": 125.26098999999999, "t": 164.18066, "r": 286.36029, "b": 172.19665999999995, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "2014. 2", "bbox": {"l": 70.030991, "t": 175.13867000000005, "r": 97.916496, "b": 183.15466000000004, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "[4]", "bbox": {"l": 54.59499, "t": 186.41063999999994, "r": 65.806984, "b": 194.42664000000002, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Herv\u00b4e D\u00b4ejean, Jean-Luc Meunier, Liangcai Gao, Yilun", "bbox": {"l": 68.210922, "t": 186.41063999999994, "r": 286.36401, "b": 194.42664000000002, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Huang, Yu Fang, Florian Kleber, and Eva-Maria Lang. IC-", "bbox": {"l": 70.030983, "t": 197.36963000000003, "r": 286.36331, "b": 205.38562000000002, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "DAR 2019 Competition on Table Detection and Recognition", "bbox": {"l": 70.030983, "t": 208.32861000000003, "r": 286.36334, "b": 216.3446, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "(cTDaR), Apr. 2019. http://sac.founderit.com/. 2", "bbox": {"l": 70.030983, "t": 219.2876, "r": 245.83519, "b": 227.30358999999999, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "[5]", "bbox": {"l": 54.594982, "t": 230.55957, "r": 65.381134, "b": 238.57556, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "Basilios Gatos, Dimitrios Danatsas, Ioannis Pratikakis, and", "bbox": {"l": 67.693779, "t": 230.55957, "r": 286.35849, "b": 238.57556, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "Stavros J Perantonis. Automatic table detection in document", "bbox": {"l": 70.030983, "t": 241.51855, "r": 286.36334, "b": 249.53454999999997, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "images. In", "bbox": {"l": 70.030983, "t": 252.47655999999995, "r": 108.39821, "b": 260.49255000000005, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "International Conference on Pattern Recognition", "bbox": {"l": 110.64498000000002, "t": 252.55724999999995, "r": 286.3595, "b": 260.28632000000005, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "and Image Analysis", "bbox": {"l": 70.030983, "t": 263.51624000000004, "r": 140.57861, "b": 271.24530000000004, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": ", pages 609-618. Springer, 2005. 2", "bbox": {"l": 140.57797, "t": 263.43555000000003, "r": 266.47522, "b": 271.45154, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "[6]", "bbox": {"l": 54.594971, "t": 274.70758, "r": 64.848648, "b": 282.72351, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Max G\u00a8obel, Tamir Hassan, Ermelinda Oro, and Giorgio Orsi.", "bbox": {"l": 67.047119, "t": 274.70758, "r": 286.36676, "b": 282.72351, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "Icdar 2013 table competition.", "bbox": {"l": 70.030975, "t": 285.66655999999995, "r": 179.57349, "b": 293.68253, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "In", "bbox": {"l": 187.01559, "t": 285.66655999999995, "r": 194.4846, "b": 293.68253, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "2013 12th International", "bbox": {"l": 198.04398, "t": 285.74725, "r": 286.36304, "b": 293.47632, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Conference on Document Analysis and Recognition", "bbox": {"l": 70.030975, "t": 296.70624, "r": 260.19937, "b": 304.43530000000004, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": ", pages", "bbox": {"l": 260.198, "t": 296.62555, "r": 286.36197, "b": 304.64151, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "1449-1453, 2013. 2", "bbox": {"l": 70.030991, "t": 307.5845299999999, "r": 142.74849, "b": 315.6004899999999, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "[7]", "bbox": {"l": 54.59499, "t": 318.85654, "r": 65.61586, "b": 326.8725, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "EA Green and M Krishnamoorthy.", "bbox": {"l": 67.978821, "t": 318.85654, "r": 199.492, "b": 326.8725, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Recognition of tables", "bbox": {"l": 206.98792, "t": 318.85654, "r": 286.35849, "b": 326.8725, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "using table grammars. procs.", "bbox": {"l": 70.030991, "t": 329.8145400000001, "r": 176.28284, "b": 337.83051, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "In", "bbox": {"l": 182.60416, "t": 329.8145400000001, "r": 190.07317, "b": 337.83051, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "Symposium on Document", "bbox": {"l": 193.28299, "t": 329.89522999999997, "r": 286.36319, "b": 337.62429999999995, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Analysis and Recognition (SDAIR\u201995)", "bbox": {"l": 70.030991, "t": 340.85425, "r": 206.34717, "b": 348.58331, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": ", pages 261-277. 2", "bbox": {"l": 206.34599, "t": 340.77356, "r": 274.82239, "b": 348.78952, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "[8]", "bbox": {"l": 54.594986000000006, "t": 352.0455600000001, "r": 65.04657, "b": 360.06152, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Khurram Azeem Hashmi, Alain Pagani, Marcus Liwicki, Di-", "bbox": {"l": 67.287483, "t": 352.0455600000001, "r": 286.35849, "b": 360.06152, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "dier Stricker, and Muhammad Zeshan Afzal.", "bbox": {"l": 70.030983, "t": 363.00458, "r": 234.12507999999997, "b": 371.02054, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Castabdetec-", "bbox": {"l": 240.05186, "t": 363.00458, "r": 286.36331, "b": 371.02054, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "tors: Cascade network for table detection in document im-", "bbox": {"l": 70.030983, "t": 373.96356, "r": 286.36331, "b": 381.97952, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "ages with recursive feature pyramid and switchable atrous", "bbox": {"l": 70.030983, "t": 384.92255, "r": 286.36331, "b": 392.93851, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "convolution.", "bbox": {"l": 70.030983, "t": 395.88153, "r": 114.57605, "b": 403.89749, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "Journal of Imaging", "bbox": {"l": 117.80399000000001, "t": 395.96222, "r": 186.7287, "b": 403.69128, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": ", 7(10), 2021. 1", "bbox": {"l": 186.728, "t": 395.88153, "r": 243.00113999999996, "b": 403.89749, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "[9]", "bbox": {"l": 54.595001, "t": 407.15253000000007, "r": 65.334427, "b": 415.1684900000001, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Kaiming He, Georgia Gkioxari, Piotr Dollar, and Ross Gir-", "bbox": {"l": 67.637054, "t": 407.15253000000007, "r": 286.35852, "b": 415.1684900000001, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "shick. Mask r-cnn. In", "bbox": {"l": 70.030998, "t": 418.11151, "r": 147.13306, "b": 426.12747, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Proceedings of the IEEE International", "bbox": {"l": 149.15601, "t": 418.1922, "r": 286.35989, "b": 425.92126, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Conference on Computer Vision (ICCV)", "bbox": {"l": 70.031006, "t": 429.15118, "r": 213.48445, "b": 436.88025, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": ", Oct 2017. 1", "bbox": {"l": 213.483, "t": 429.07050000000004, "r": 261.04083, "b": 437.08646000000005, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "[10]", "bbox": {"l": 50.112, "t": 440.3424999999999, "r": 65.399307, "b": 448.3584599999999, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "Yelin He, X. Qi, Jiaquan Ye, Peng Gao, Yihao Chen, Bing-", "bbox": {"l": 67.693321, "t": 440.3424999999999, "r": 286.3587, "b": 448.3584599999999, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "cong Li, Xin Tang, and Rong Xiao.", "bbox": {"l": 70.030998, "t": 451.30151, "r": 202.74268, "b": 459.31747, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "Pingan-vcgroup\u2019s so-", "bbox": {"l": 209.00122, "t": 451.30151, "r": 286.36331, "b": 459.31747, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "lution for icdar 2021 competition on scientific table image", "bbox": {"l": 70.030998, "t": 462.2605, "r": 286.36334, "b": 470.27646, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "recognition to latex.", "bbox": {"l": 70.030998, "t": 473.21948, "r": 141.86981, "b": 481.23544, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "ArXiv", "bbox": {"l": 145.097, "t": 473.30017, "r": 166.01561, "b": 481.02924, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": ", abs/2105.01846, 2021. 2", "bbox": {"l": 166.015, "t": 473.21948, "r": 259.90216, "b": 481.23544, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "[11]", "bbox": {"l": 50.112, "t": 484.49048, "r": 66.033806, "b": 492.50644, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Jianying Hu, Ramanujan S Kashi, Daniel P Lopresti, and", "bbox": {"l": 68.423035, "t": 484.49048, "r": 286.35873, "b": 492.50644, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "Gordon Wilfong. Medium-independent table detection. In", "bbox": {"l": 70.030998, "t": 495.44946, "r": 286.36331, "b": 503.46542, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "Document Recognition and Retrieval VII", "bbox": {"l": 70.030998, "t": 506.48914, "r": 227.40926, "b": 514.2182, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": ", volume 3967,", "bbox": {"l": 227.40500000000003, "t": 506.40845, "r": 286.35913, "b": 514.4244100000001, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "pages 291-302. International Society for Optics and Photon-", "bbox": {"l": 70.031006, "t": 517.36743, "r": 286.36328, "b": 525.38339, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "ics, 1999. 2", "bbox": {"l": 70.031006, "t": 528.32642, "r": 112.36138000000001, "b": 536.34238, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "[12]", "bbox": {"l": 50.112007, "t": 539.59842, "r": 65.466705, "b": 547.61438, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "Matthew Hurst. A constraint-based approach to table struc-", "bbox": {"l": 67.770828, "t": 539.59842, "r": 286.35873, "b": 547.61438, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "ture derivation. In", "bbox": {"l": 70.031006, "t": 550.55742, "r": 136.28374, "b": 558.57338, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "Proceedings of the Seventh International", "bbox": {"l": 138.811, "t": 550.63812, "r": 286.36206, "b": 558.36716, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Conference on Document Analysis and Recognition - Volume", "bbox": {"l": 70.031006, "t": 561.5971199999999, "r": 286.36334, "b": 569.32616, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "2", "bbox": {"l": 70.031006, "t": 572.55612, "r": 74.514206, "b": 580.28516, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": ", ICDAR \u201903, page 911, USA, 2003. IEEE Computer Soci-", "bbox": {"l": 74.514008, "t": 572.47542, "r": 286.36313, "b": 580.4913799999999, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "ety. 2", "bbox": {"l": 70.031006, "t": 583.4334100000001, "r": 90.357834, "b": 591.44937, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "[13]", "bbox": {"l": 50.112007, "t": 594.70541, "r": 66.270439, "b": 602.72137, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Thotreingam Kasar, Philippine Barlas, Sebastien Adam,", "bbox": {"l": 68.695168, "t": 594.70541, "r": 286.35873, "b": 602.72137, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Cl\u00b4ement Chatelain, and Thierry Paquet. Learning to detect", "bbox": {"l": 70.031006, "t": 605.66441, "r": 286.3631, "b": 613.68037, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "tables in scanned document images using line information.", "bbox": {"l": 70.031006, "t": 616.62341, "r": 286.36331, "b": 624.63937, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "In", "bbox": {"l": 70.031006, "t": 627.58241, "r": 77.500015, "b": 635.5983699999999, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "2013 12th International Conference on Document Analy-", "bbox": {"l": 79.920006, "t": 627.6631199999999, "r": 286.3624, "b": 635.39215, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "sis and Recognition", "bbox": {"l": 70.031006, "t": 638.62212, "r": 140.67728, "b": 646.35115, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": ", pages 1185-1189. IEEE, 2013. 2", "bbox": {"l": 140.67599, "t": 638.54141, "r": 264.43921, "b": 646.55737, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "[14]", "bbox": {"l": 50.111992, "t": 649.81342, "r": 66.534035, "b": 657.82938, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "Pratik Kayal, Mrinal Anand, Harsh Desai, and Mayank", "bbox": {"l": 68.998329, "t": 649.81342, "r": 286.35873, "b": 657.82938, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "Singh.", "bbox": {"l": 70.030991, "t": 660.77142, "r": 93.200165, "b": 668.78738, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "Icdar 2021 competition on scientific table image", "bbox": {"l": 102.20243, "t": 660.77142, "r": 286.36334, "b": 668.78738, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "recognition to latex, 2021. 2", "bbox": {"l": 70.030991, "t": 671.73042, "r": 171.9969, "b": 679.74638, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "[15]", "bbox": {"l": 50.111992, "t": 683.00243, "r": 65.515968, "b": 691.01839, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "Harold W Kuhn. The hungarian method for the assignment", "bbox": {"l": 67.827499, "t": 683.00243, "r": 286.3587, "b": 691.01839, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "problem.", "bbox": {"l": 70.030991, "t": 693.9614260000001, "r": 102.15761, "b": 701.977386, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "Naval research logistics quarterly", "bbox": {"l": 107.54999, "t": 694.0421220000001, "r": 231.47461, "b": 701.771156, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": ", 2(1-2):83-97,", "bbox": {"l": 231.47598, "t": 693.9614260000001, "r": 286.35931, "b": 701.977386, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "1955. 6", "bbox": {"l": 70.030975, "t": 704.920425, "r": 97.916481, "b": 712.936386, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "[16]", "bbox": {"l": 308.86197, "t": 75.88342000000011, "r": 324.74973, "b": 83.89940999999999, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "Girish Kulkarni, Visruth Premraj, Vicente Ordonez, Sag-", "bbox": {"l": 327.13382, "t": 75.88342000000011, "r": 545.1087, "b": 83.89940999999999, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "nik Dhar, Siming Li, Yejin Choi, Alexander C. Berg, and", "bbox": {"l": 328.78098, "t": 86.84142999999995, "r": 545.1134, "b": 94.85741999999993, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "Tamara L. Berg.", "bbox": {"l": 328.78098, "t": 97.80042000000003, "r": 390.96295, "b": 105.81641000000002, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "Babytalk:", "bbox": {"l": 400.27008, "t": 97.80042000000003, "r": 435.1404099999999, "b": 105.81641000000002, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "Understanding and generat-", "bbox": {"l": 441.71277, "t": 97.80042000000003, "r": 545.11328, "b": 105.81641000000002, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "ing simple image descriptions.", "bbox": {"l": 328.78098, "t": 108.75940000000003, "r": 440.80719, "b": 116.7753899999999, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "IEEE Transactions on Pat-", "bbox": {"l": 446.63498, "t": 108.84009000000003, "r": 545.11304, "b": 116.56914999999992, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "tern Analysis and Machine Intelligence", "bbox": {"l": 328.78098, "t": 119.79907000000003, "r": 471.13153, "b": 127.52814000000001, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": ", 35(12):2891-2903,", "bbox": {"l": 471.13300000000004, "t": 119.71838000000002, "r": 545.11475, "b": 127.73437999999999, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "2013. 4", "bbox": {"l": 328.78101, "t": 130.67737, "r": 356.6665, "b": 138.69335999999998, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "[17]", "bbox": {"l": 308.862, "t": 142.12334999999996, "r": 325.24371, "b": 150.13933999999995, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "Minghao Li, Lei Cui, Shaohan Huang, Furu Wei, Ming", "bbox": {"l": 327.70197, "t": 142.12334999999996, "r": 545.10883, "b": 150.13933999999995, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "Zhou, and Zhoujun Li.", "bbox": {"l": 328.78101, "t": 153.08136000000002, "r": 414.44598, "b": 161.09735, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "Tablebank: A benchmark dataset", "bbox": {"l": 421.82532, "t": 153.08136000000002, "r": 545.1134, "b": 161.09735, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "for table detection and recognition, 2019. 2, 3", "bbox": {"l": 328.78101, "t": 164.04034000000001, "r": 493.62835999999993, "b": 172.05633999999998, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "[18]", "bbox": {"l": 308.862, "t": 175.48632999999995, "r": 324.26599, "b": 183.50232000000005, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "Yiren Li, Zheng Huang, Junchi Yan, Yi Zhou, Fan Ye, and", "bbox": {"l": 326.57751, "t": 175.48632999999995, "r": 545.10876, "b": 183.50232000000005, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Xianhui Liu. Gfte: Graph-based financial table extraction.", "bbox": {"l": 328.78101, "t": 186.44530999999995, "r": 545.11334, "b": 194.46130000000005, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "In Alberto Del Bimbo, Rita Cucchiara, Stan Sclaroff, Gio-", "bbox": {"l": 328.78101, "t": 197.40430000000003, "r": 545.11346, "b": 205.42029000000002, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "vanni Maria Farinella, Tao Mei, Marco Bertini, Hugo Jair", "bbox": {"l": 328.78101, "t": 208.36328000000003, "r": 545.11353, "b": 216.37927000000002, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "Escalante, and Roberto Vezzani, editors,", "bbox": {"l": 328.78101, "t": 219.32227, "r": 479.26413, "b": 227.33826, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "Pattern Recogni-", "bbox": {"l": 483.11902, "t": 219.40295000000003, "r": 545.11273, "b": 227.13202, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "tion. ICPR International Workshops and Challenges", "bbox": {"l": 328.78101, "t": 230.36095999999998, "r": 519.39771, "b": 238.09002999999996, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": ", pages", "bbox": {"l": 519.401, "t": 230.28026999999997, "r": 545.10767, "b": 238.29625999999996, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "644-658, Cham, 2021. Springer International Publishing. 2,", "bbox": {"l": 328.78101, "t": 241.23925999999994, "r": 545.11328, "b": 249.25525000000005, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "3", "bbox": {"l": 328.78101, "t": 252.19824000000006, "r": 333.26422, "b": 260.21423000000004, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "[19]", "bbox": {"l": 308.862, "t": 263.64423, "r": 324.26477, "b": 271.66022, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "Nikolaos Livathinos, Cesar Berrospi, Maksym Lysak, Vik-", "bbox": {"l": 326.57611, "t": 263.64423, "r": 545.10883, "b": 271.66022, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "tor Kuropiatnyk, Ahmed Nassar, Andre Carvalho, Michele", "bbox": {"l": 328.78101, "t": 274.60321, "r": 545.1134, "b": 282.61917000000005, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "Dolfi, Christoph Auer, Kasper Dinkla, and Peter Staar. Ro-", "bbox": {"l": 328.78101, "t": 285.56219, "r": 545.11328, "b": 293.57816, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "bust pdf document conversion using recurrent neural net-", "bbox": {"l": 328.78101, "t": 296.52118, "r": 545.11334, "b": 304.53714, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "works.", "bbox": {"l": 328.78101, "t": 307.47919, "r": 352.84683, "b": 315.49515, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "Proceedings of the AAAI Conference on Artificial", "bbox": {"l": 360.23599, "t": 307.55988, "r": 545.1142, "b": 315.28894, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "Intelligence", "bbox": {"l": 328.78101, "t": 318.51886, "r": 371.02173, "b": 326.24792, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": ", 35(17):15137-15145, May 2021. 1", "bbox": {"l": 371.021, "t": 318.43817, "r": 502.26227, "b": 326.45413, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "[20]", "bbox": {"l": 308.862, "t": 329.88419, "r": 323.82672, "b": 337.90015, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "Rujiao Long, Wen Wang, Nan Xue, Feiyu Gao, Zhibo Yang,", "bbox": {"l": 326.07233, "t": 329.88419, "r": 545.10876, "b": 337.90015, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "Yongpan Wang, and Gui-Song Xia. Parsing table structures", "bbox": {"l": 328.78101, "t": 340.8432, "r": 545.11346, "b": 348.85916, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "in the wild. In", "bbox": {"l": 328.78101, "t": 351.80219000000005, "r": 382.7767, "b": 359.81815000000006, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "Proceedings of the IEEE/CVF International", "bbox": {"l": 385.54102, "t": 351.88287, "r": 545.11609, "b": 359.61194, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "Conference on Computer Vision", "bbox": {"l": 328.78101, "t": 362.84186, "r": 443.59579, "b": 370.57092, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": ", pages 944-952, 2021. 2", "bbox": {"l": 443.59399, "t": 362.76117, "r": 534.48645, "b": 370.77713, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "[21]", "bbox": {"l": 308.862, "t": 374.20618, "r": 324.60281, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "Shubham", "bbox": {"l": 326.96487, "t": 374.20618, "r": 362.6604, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "Singh", "bbox": {"l": 368.69479, "t": 374.20618, "r": 389.6134, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "Paliwal,", "bbox": {"l": 395.6478, "t": 374.20618, "r": 424.56445, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "D", "bbox": {"l": 431.5492899999999, "t": 374.20618, "r": 438.0230399999999, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "Vishwanath,", "bbox": {"l": 444.05743, "t": 374.20618, "r": 488.5038799999999, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "Rohit", "bbox": {"l": 495.47974, "t": 374.20618, "r": 515.41205, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "Rahul,", "bbox": {"l": 521.44641, "t": 374.20618, "r": 545.10876, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "Monika Sharma, and Lovekesh Vig. Tablenet: Deep learn-", "bbox": {"l": 328.78101, "t": 385.16516, "r": 545.1134, "b": 393.18112, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "ing model for end-to-end table detection and tabular data ex-", "bbox": {"l": 328.78101, "t": 396.12415, "r": 545.11346, "b": 404.14011, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "traction from scanned document images.", "bbox": {"l": 328.78101, "t": 407.08313, "r": 478.00881999999996, "b": 415.09909, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "In", "bbox": {"l": 484.0701, "t": 407.08313, "r": 491.53912, "b": 415.09909, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "2019 Interna-", "bbox": {"l": 494.668, "t": 407.16382, "r": 545.11298, "b": 414.89288, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "tional Conference on Document Analysis and Recognition", "bbox": {"l": 328.78101, "t": 418.12280000000004, "r": 545.11334, "b": 425.85187, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "(ICDAR)", "bbox": {"l": 328.78101, "t": 429.08179, "r": 360.83591, "b": 436.8108500000001, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": ", pages 128-133. IEEE, 2019. 1", "bbox": {"l": 360.836, "t": 429.0011, "r": 475.63287, "b": 437.01706, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "[22]", "bbox": {"l": 308.862, "t": 440.44611, "r": 324.57407, "b": 448.46207, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "Adam Paszke, Sam Gross, Francisco Massa, Adam Lerer,", "bbox": {"l": 326.93179, "t": 440.44611, "r": 545.1087, "b": 448.46207, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "James Bradbury, Gregory Chanan, Trevor Killeen, Zeming", "bbox": {"l": 328.78101, "t": 451.40509, "r": 545.11346, "b": 459.42105, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "Lin, Natalia Gimelshein, Luca Antiga, Alban Desmaison,", "bbox": {"l": 328.78101, "t": 462.36407, "r": 545.11328, "b": 470.38004, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "Andreas Kopf, Edward Yang, Zachary DeVito, Martin Rai-", "bbox": {"l": 328.78101, "t": 473.32306, "r": 545.11328, "b": 481.33902, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "son, Alykhan Tejani, Sasank Chilamkurthy, Benoit Steiner,", "bbox": {"l": 328.78101, "t": 484.28204, "r": 545.11328, "b": 492.298, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "Lu Fang, Junjie Bai, and Soumith Chintala. Pytorch: An im-", "bbox": {"l": 328.78101, "t": 495.24103, "r": 545.1134, "b": 503.25699, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "perative style, high-performance deep learning library. In H.", "bbox": {"l": 328.78101, "t": 506.20001, "r": 545.1134, "b": 514.21597, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "Wallach, H. Larochelle, A. Beygelzimer, F. d'Alch\u00b4e-Buc, E.", "bbox": {"l": 328.78101, "t": 517.159, "r": 545.1098, "b": 525.17496, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "Fox, and R. Garnett, editors,", "bbox": {"l": 328.78101, "t": 528.117, "r": 434.56659, "b": 536.13297, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "Advances in Neural Informa-", "bbox": {"l": 437.86401, "t": 528.19769, "r": 545.11115, "b": 535.9267600000001, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "tion Processing Systems 32", "bbox": {"l": 328.78101, "t": 539.15671, "r": 425.73471, "b": 546.8857399999999, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": ", pages 8024-8035. Curran Asso-", "bbox": {"l": 425.73602, "t": 539.076, "r": 545.11475, "b": 547.09196, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "ciates, Inc., 2019. 6", "bbox": {"l": 328.78101, "t": 550.035, "r": 399.74109, "b": 558.05096, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "[23]", "bbox": {"l": 308.862, "t": 561.481, "r": 324.50351, "b": 569.49696, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "Devashish Prasad, Ayan Gadpal, Kshitij Kapadni, Manish", "bbox": {"l": 326.85068, "t": 561.481, "r": 545.10876, "b": 569.49696, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "Visave, and Kavita Sultanpure. Cascadetabnet: An approach", "bbox": {"l": 328.78101, "t": 572.44, "r": 545.1134, "b": 580.45596, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "for end to end table detection and structure recognition from", "bbox": {"l": 328.78101, "t": 583.399, "r": 545.11334, "b": 591.4149600000001, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "image-based documents. In", "bbox": {"l": 328.78101, "t": 594.358, "r": 431.61667, "b": 602.37396, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "Proceedings of the IEEE/CVF", "bbox": {"l": 434.69101000000006, "t": 594.4387099999999, "r": 545.11224, "b": 602.16774, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "Conference on Computer Vision and Pattern Recognition", "bbox": {"l": 328.78101, "t": 605.39671, "r": 545.1134, "b": 613.12575, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "Workshops", "bbox": {"l": 328.78101, "t": 616.35571, "r": 367.8028, "b": 624.08475, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": ", pages 572-573, 2020. 1", "bbox": {"l": 367.802, "t": 616.2750100000001, "r": 458.69446000000005, "b": 624.29097, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "[24]", "bbox": {"l": 308.862, "t": 627.72101, "r": 324.69476, "b": 635.73697, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "Shah Rukh Qasim, Hassan Mahmood, and Faisal Shafait.", "bbox": {"l": 327.07065, "t": 627.72101, "r": 545.1087, "b": 635.73697, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": "Rethinking table recognition using graph neural networks.", "bbox": {"l": 328.78101, "t": 638.68001, "r": 545.11328, "b": 646.69597, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "In", "bbox": {"l": 328.78101, "t": 649.63901, "r": 336.25003, "b": 657.65497, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "2019 International Conference on Document Analysis and", "bbox": {"l": 338.10001, "t": 649.71971, "r": 545.11621, "b": 657.44875, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "Recognition (ICDAR)", "bbox": {"l": 328.78101, "t": 660.67871, "r": 406.32245, "b": 668.40775, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": ", pages 142-147. IEEE, 2019. 3", "bbox": {"l": 406.32202, "t": 660.5980099999999, "r": 521.1189, "b": 668.61398, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "[25]", "bbox": {"l": 308.86203, "t": 672.04301, "r": 324.71329, "b": 680.05898, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "Hamid Rezatofighi, Nathan Tsoi, JunYoung Gwak, Amir", "bbox": {"l": 327.09195, "t": 672.04301, "r": 545.10876, "b": 680.05898, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "Sadeghian, Ian Reid, and Silvio Savarese.", "bbox": {"l": 328.78104, "t": 683.0020099999999, "r": 482.81488, "b": 691.01797, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "Generalized in-", "bbox": {"l": 488.75064, "t": 683.0020099999999, "r": 545.1134, "b": 691.01797, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "tersection over union: A metric and a loss for bounding box", "bbox": {"l": 328.78104, "t": 693.961014, "r": 545.11334, "b": 701.976974, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "regression. In", "bbox": {"l": 328.78104, "t": 704.920013, "r": 379.1543, "b": 712.935974, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "Proceedings of the IEEE/CVF Conference on", "bbox": {"l": 381.61603, "t": 705.00071, "r": 545.10938, "b": 712.729744, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "9", "bbox": {"l": 295.12103, "t": 734.1325870000001, "r": 300.10233, "b": 743.0391500000001, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 25, "label": "list_item", "bbox": {"l": 70.030998, "t": 75.88378999999998, "r": 286.36334, "b": 116.77575999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.7310384511947632, "cells": [{"id": 0, "text": "end object detection with transformers. In Andrea Vedaldi,", "bbox": {"l": 70.030998, "t": 75.88378999999998, "r": 286.36334, "b": 83.89977999999996, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Horst Bischof, Thomas Brox, and Jan-Michael Frahm, edi-", "bbox": {"l": 70.030998, "t": 86.84276999999997, "r": 286.36331, "b": 94.85875999999996, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "tors,", "bbox": {"l": 70.030998, "t": 97.80078000000003, "r": 85.722198, "b": 105.81677000000002, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Computer Vision - ECCV 2020", "bbox": {"l": 87.889, "t": 97.88147000000004, "r": 199.93315, "b": 105.61053000000004, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": ", pages 213-229, Cham,", "bbox": {"l": 199.936, "t": 97.80078000000003, "r": 286.36313, "b": 105.81677000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "2020. Springer International Publishing. 5", "bbox": {"l": 70.031006, "t": 108.75977, "r": 221.94871999999998, "b": 116.77575999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "list_item", "bbox": {"l": 54.595005, "t": 120.03174000000013, "r": 286.36334, "b": 149.96569999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9372755885124207, "cells": [{"id": 6, "text": "[2]", "bbox": {"l": 54.595005, "t": 120.03174000000013, "r": 65.206657, "b": 128.04773, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Zewen Chi, Heyan Huang, Heng-Da Xu, Houjin Yu, Wanx-", "bbox": {"l": 67.481873, "t": 120.03174000000013, "r": 286.35852, "b": 128.04773, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "uan Yin, and Xian-Ling Mao.", "bbox": {"l": 70.031006, "t": 130.99072, "r": 179.67215, "b": 139.00671, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Complicated table structure", "bbox": {"l": 185.58101, "t": 130.99072, "r": 286.36334, "b": 139.00671, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "recognition.", "bbox": {"l": 70.031006, "t": 141.94970999999998, "r": 113.11456, "b": 149.96569999999997, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "arXiv preprint arXiv:1908.04729", "bbox": {"l": 116.34200999999999, "t": 142.0304, "r": 235.3082, "b": 149.75946, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": ", 2019. 3", "bbox": {"l": 235.30701, "t": 141.94970999999998, "r": 267.67572, "b": 149.96569999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "list_item", "bbox": {"l": 54.595001, "t": 153.22168, "r": 286.36301, "b": 183.15466000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9378374218940735, "cells": [{"id": 13, "text": "[3]", "bbox": {"l": 54.595001, "t": 153.22168, "r": 65.103195, "b": 161.23766999999998, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Bertrand Couasnon and Aurelie Lemaitre.", "bbox": {"l": 67.356239, "t": 153.22168, "r": 218.77876, "b": 161.23766999999998, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Recognition of Ta-", "bbox": {"l": 220.97999999999996, "t": 153.30237, "r": 286.36301, "b": 161.03143, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "bles and Forms", "bbox": {"l": 70.030991, "t": 164.26135, "r": 125.26401000000001, "b": 171.99041999999997, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": ", pages 647-677. Springer London, London,", "bbox": {"l": 125.26098999999999, "t": 164.18066, "r": 286.36029, "b": 172.19665999999995, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "2014. 2", "bbox": {"l": 70.030991, "t": 175.13867000000005, "r": 97.916496, "b": 183.15466000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "list_item", "bbox": {"l": 54.59499, "t": 186.41063999999994, "r": 286.36401, "b": 227.30358999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9648825526237488, "cells": [{"id": 19, "text": "[4]", "bbox": {"l": 54.59499, "t": 186.41063999999994, "r": 65.806984, "b": 194.42664000000002, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Herv\u00b4e D\u00b4ejean, Jean-Luc Meunier, Liangcai Gao, Yilun", "bbox": {"l": 68.210922, "t": 186.41063999999994, "r": 286.36401, "b": 194.42664000000002, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Huang, Yu Fang, Florian Kleber, and Eva-Maria Lang. IC-", "bbox": {"l": 70.030983, "t": 197.36963000000003, "r": 286.36331, "b": 205.38562000000002, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "DAR 2019 Competition on Table Detection and Recognition", "bbox": {"l": 70.030983, "t": 208.32861000000003, "r": 286.36334, "b": 216.3446, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "(cTDaR), Apr. 2019. http://sac.founderit.com/. 2", "bbox": {"l": 70.030983, "t": 219.2876, "r": 245.83519, "b": 227.30358999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "list_item", "bbox": {"l": 54.594982, "t": 230.55957, "r": 286.36334, "b": 271.45154, "coord_origin": "TOPLEFT"}, "confidence": 0.9620943069458008, "cells": [{"id": 24, "text": "[5]", "bbox": {"l": 54.594982, "t": 230.55957, "r": 65.381134, "b": 238.57556, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "Basilios Gatos, Dimitrios Danatsas, Ioannis Pratikakis, and", "bbox": {"l": 67.693779, "t": 230.55957, "r": 286.35849, "b": 238.57556, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "Stavros J Perantonis. Automatic table detection in document", "bbox": {"l": 70.030983, "t": 241.51855, "r": 286.36334, "b": 249.53454999999997, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "images. In", "bbox": {"l": 70.030983, "t": 252.47655999999995, "r": 108.39821, "b": 260.49255000000005, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "International Conference on Pattern Recognition", "bbox": {"l": 110.64498000000002, "t": 252.55724999999995, "r": 286.3595, "b": 260.28632000000005, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "and Image Analysis", "bbox": {"l": 70.030983, "t": 263.51624000000004, "r": 140.57861, "b": 271.24530000000004, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": ", pages 609-618. Springer, 2005. 2", "bbox": {"l": 140.57797, "t": 263.43555000000003, "r": 266.47522, "b": 271.45154, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "list_item", "bbox": {"l": 54.594971, "t": 274.70758, "r": 286.36676, "b": 315.6004899999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9555517435073853, "cells": [{"id": 31, "text": "[6]", "bbox": {"l": 54.594971, "t": 274.70758, "r": 64.848648, "b": 282.72351, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Max G\u00a8obel, Tamir Hassan, Ermelinda Oro, and Giorgio Orsi.", "bbox": {"l": 67.047119, "t": 274.70758, "r": 286.36676, "b": 282.72351, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "Icdar 2013 table competition.", "bbox": {"l": 70.030975, "t": 285.66655999999995, "r": 179.57349, "b": 293.68253, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "In", "bbox": {"l": 187.01559, "t": 285.66655999999995, "r": 194.4846, "b": 293.68253, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "2013 12th International", "bbox": {"l": 198.04398, "t": 285.74725, "r": 286.36304, "b": 293.47632, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Conference on Document Analysis and Recognition", "bbox": {"l": 70.030975, "t": 296.70624, "r": 260.19937, "b": 304.43530000000004, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": ", pages", "bbox": {"l": 260.198, "t": 296.62555, "r": 286.36197, "b": 304.64151, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "1449-1453, 2013. 2", "bbox": {"l": 70.030991, "t": 307.5845299999999, "r": 142.74849, "b": 315.6004899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "list_item", "bbox": {"l": 54.59499, "t": 318.85654, "r": 286.36319, "b": 348.78952, "coord_origin": "TOPLEFT"}, "confidence": 0.9479843378067017, "cells": [{"id": 39, "text": "[7]", "bbox": {"l": 54.59499, "t": 318.85654, "r": 65.61586, "b": 326.8725, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "EA Green and M Krishnamoorthy.", "bbox": {"l": 67.978821, "t": 318.85654, "r": 199.492, "b": 326.8725, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Recognition of tables", "bbox": {"l": 206.98792, "t": 318.85654, "r": 286.35849, "b": 326.8725, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "using table grammars. procs.", "bbox": {"l": 70.030991, "t": 329.8145400000001, "r": 176.28284, "b": 337.83051, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "In", "bbox": {"l": 182.60416, "t": 329.8145400000001, "r": 190.07317, "b": 337.83051, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "Symposium on Document", "bbox": {"l": 193.28299, "t": 329.89522999999997, "r": 286.36319, "b": 337.62429999999995, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Analysis and Recognition (SDAIR\u201995)", "bbox": {"l": 70.030991, "t": 340.85425, "r": 206.34717, "b": 348.58331, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": ", pages 261-277. 2", "bbox": {"l": 206.34599, "t": 340.77356, "r": 274.82239, "b": 348.78952, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "list_item", "bbox": {"l": 54.594986000000006, "t": 352.0455600000001, "r": 286.36331, "b": 403.89749, "coord_origin": "TOPLEFT"}, "confidence": 0.9484425187110901, "cells": [{"id": 47, "text": "[8]", "bbox": {"l": 54.594986000000006, "t": 352.0455600000001, "r": 65.04657, "b": 360.06152, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Khurram Azeem Hashmi, Alain Pagani, Marcus Liwicki, Di-", "bbox": {"l": 67.287483, "t": 352.0455600000001, "r": 286.35849, "b": 360.06152, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "dier Stricker, and Muhammad Zeshan Afzal.", "bbox": {"l": 70.030983, "t": 363.00458, "r": 234.12507999999997, "b": 371.02054, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Castabdetec-", "bbox": {"l": 240.05186, "t": 363.00458, "r": 286.36331, "b": 371.02054, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "tors: Cascade network for table detection in document im-", "bbox": {"l": 70.030983, "t": 373.96356, "r": 286.36331, "b": 381.97952, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "ages with recursive feature pyramid and switchable atrous", "bbox": {"l": 70.030983, "t": 384.92255, "r": 286.36331, "b": 392.93851, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "convolution.", "bbox": {"l": 70.030983, "t": 395.88153, "r": 114.57605, "b": 403.89749, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "Journal of Imaging", "bbox": {"l": 117.80399000000001, "t": 395.96222, "r": 186.7287, "b": 403.69128, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": ", 7(10), 2021. 1", "bbox": {"l": 186.728, "t": 395.88153, "r": 243.00113999999996, "b": 403.89749, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "list_item", "bbox": {"l": 54.595001, "t": 407.15253000000007, "r": 286.35989, "b": 437.08646000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9330756664276123, "cells": [{"id": 56, "text": "[9]", "bbox": {"l": 54.595001, "t": 407.15253000000007, "r": 65.334427, "b": 415.1684900000001, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Kaiming He, Georgia Gkioxari, Piotr Dollar, and Ross Gir-", "bbox": {"l": 67.637054, "t": 407.15253000000007, "r": 286.35852, "b": 415.1684900000001, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "shick. Mask r-cnn. In", "bbox": {"l": 70.030998, "t": 418.11151, "r": 147.13306, "b": 426.12747, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Proceedings of the IEEE International", "bbox": {"l": 149.15601, "t": 418.1922, "r": 286.35989, "b": 425.92126, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Conference on Computer Vision (ICCV)", "bbox": {"l": 70.031006, "t": 429.15118, "r": 213.48445, "b": 436.88025, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": ", Oct 2017. 1", "bbox": {"l": 213.483, "t": 429.07050000000004, "r": 261.04083, "b": 437.08646000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "list_item", "bbox": {"l": 50.112, "t": 440.3424999999999, "r": 286.36334, "b": 481.23544, "coord_origin": "TOPLEFT"}, "confidence": 0.9274735450744629, "cells": [{"id": 62, "text": "[10]", "bbox": {"l": 50.112, "t": 440.3424999999999, "r": 65.399307, "b": 448.3584599999999, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "Yelin He, X. Qi, Jiaquan Ye, Peng Gao, Yihao Chen, Bing-", "bbox": {"l": 67.693321, "t": 440.3424999999999, "r": 286.3587, "b": 448.3584599999999, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "cong Li, Xin Tang, and Rong Xiao.", "bbox": {"l": 70.030998, "t": 451.30151, "r": 202.74268, "b": 459.31747, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "Pingan-vcgroup\u2019s so-", "bbox": {"l": 209.00122, "t": 451.30151, "r": 286.36331, "b": 459.31747, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "lution for icdar 2021 competition on scientific table image", "bbox": {"l": 70.030998, "t": 462.2605, "r": 286.36334, "b": 470.27646, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "recognition to latex.", "bbox": {"l": 70.030998, "t": 473.21948, "r": 141.86981, "b": 481.23544, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "ArXiv", "bbox": {"l": 145.097, "t": 473.30017, "r": 166.01561, "b": 481.02924, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": ", abs/2105.01846, 2021. 2", "bbox": {"l": 166.015, "t": 473.21948, "r": 259.90216, "b": 481.23544, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "list_item", "bbox": {"l": 50.112, "t": 484.49048, "r": 286.36331, "b": 536.34238, "coord_origin": "TOPLEFT"}, "confidence": 0.9299950003623962, "cells": [{"id": 70, "text": "[11]", "bbox": {"l": 50.112, "t": 484.49048, "r": 66.033806, "b": 492.50644, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Jianying Hu, Ramanujan S Kashi, Daniel P Lopresti, and", "bbox": {"l": 68.423035, "t": 484.49048, "r": 286.35873, "b": 492.50644, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "Gordon Wilfong. Medium-independent table detection. In", "bbox": {"l": 70.030998, "t": 495.44946, "r": 286.36331, "b": 503.46542, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "Document Recognition and Retrieval VII", "bbox": {"l": 70.030998, "t": 506.48914, "r": 227.40926, "b": 514.2182, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": ", volume 3967,", "bbox": {"l": 227.40500000000003, "t": 506.40845, "r": 286.35913, "b": 514.4244100000001, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "pages 291-302. International Society for Optics and Photon-", "bbox": {"l": 70.031006, "t": 517.36743, "r": 286.36328, "b": 525.38339, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "ics, 1999. 2", "bbox": {"l": 70.031006, "t": 528.32642, "r": 112.36138000000001, "b": 536.34238, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "list_item", "bbox": {"l": 50.112007, "t": 539.59842, "r": 286.36334, "b": 591.44937, "coord_origin": "TOPLEFT"}, "confidence": 0.9394103288650513, "cells": [{"id": 77, "text": "[12]", "bbox": {"l": 50.112007, "t": 539.59842, "r": 65.466705, "b": 547.61438, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "Matthew Hurst. A constraint-based approach to table struc-", "bbox": {"l": 67.770828, "t": 539.59842, "r": 286.35873, "b": 547.61438, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "ture derivation. In", "bbox": {"l": 70.031006, "t": 550.55742, "r": 136.28374, "b": 558.57338, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "Proceedings of the Seventh International", "bbox": {"l": 138.811, "t": 550.63812, "r": 286.36206, "b": 558.36716, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Conference on Document Analysis and Recognition - Volume", "bbox": {"l": 70.031006, "t": 561.5971199999999, "r": 286.36334, "b": 569.32616, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "2", "bbox": {"l": 70.031006, "t": 572.55612, "r": 74.514206, "b": 580.28516, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": ", ICDAR \u201903, page 911, USA, 2003. IEEE Computer Soci-", "bbox": {"l": 74.514008, "t": 572.47542, "r": 286.36313, "b": 580.4913799999999, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "ety. 2", "bbox": {"l": 70.031006, "t": 583.4334100000001, "r": 90.357834, "b": 591.44937, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "list_item", "bbox": {"l": 50.112007, "t": 594.70541, "r": 286.36331, "b": 646.55737, "coord_origin": "TOPLEFT"}, "confidence": 0.9298838973045349, "cells": [{"id": 85, "text": "[13]", "bbox": {"l": 50.112007, "t": 594.70541, "r": 66.270439, "b": 602.72137, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Thotreingam Kasar, Philippine Barlas, Sebastien Adam,", "bbox": {"l": 68.695168, "t": 594.70541, "r": 286.35873, "b": 602.72137, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Cl\u00b4ement Chatelain, and Thierry Paquet. Learning to detect", "bbox": {"l": 70.031006, "t": 605.66441, "r": 286.3631, "b": 613.68037, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "tables in scanned document images using line information.", "bbox": {"l": 70.031006, "t": 616.62341, "r": 286.36331, "b": 624.63937, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "In", "bbox": {"l": 70.031006, "t": 627.58241, "r": 77.500015, "b": 635.5983699999999, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "2013 12th International Conference on Document Analy-", "bbox": {"l": 79.920006, "t": 627.6631199999999, "r": 286.3624, "b": 635.39215, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "sis and Recognition", "bbox": {"l": 70.031006, "t": 638.62212, "r": 140.67728, "b": 646.35115, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": ", pages 1185-1189. IEEE, 2013. 2", "bbox": {"l": 140.67599, "t": 638.54141, "r": 264.43921, "b": 646.55737, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "list_item", "bbox": {"l": 50.111992, "t": 649.81342, "r": 286.36334, "b": 679.74638, "coord_origin": "TOPLEFT"}, "confidence": 0.9115257263183594, "cells": [{"id": 93, "text": "[14]", "bbox": {"l": 50.111992, "t": 649.81342, "r": 66.534035, "b": 657.82938, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "Pratik Kayal, Mrinal Anand, Harsh Desai, and Mayank", "bbox": {"l": 68.998329, "t": 649.81342, "r": 286.35873, "b": 657.82938, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "Singh.", "bbox": {"l": 70.030991, "t": 660.77142, "r": 93.200165, "b": 668.78738, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "Icdar 2021 competition on scientific table image", "bbox": {"l": 102.20243, "t": 660.77142, "r": 286.36334, "b": 668.78738, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "recognition to latex, 2021. 2", "bbox": {"l": 70.030991, "t": 671.73042, "r": 171.9969, "b": 679.74638, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "list_item", "bbox": {"l": 50.111992, "t": 683.00243, "r": 286.35931, "b": 712.936386, "coord_origin": "TOPLEFT"}, "confidence": 0.912230372428894, "cells": [{"id": 98, "text": "[15]", "bbox": {"l": 50.111992, "t": 683.00243, "r": 65.515968, "b": 691.01839, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "Harold W Kuhn. The hungarian method for the assignment", "bbox": {"l": 67.827499, "t": 683.00243, "r": 286.3587, "b": 691.01839, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "problem.", "bbox": {"l": 70.030991, "t": 693.9614260000001, "r": 102.15761, "b": 701.977386, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "Naval research logistics quarterly", "bbox": {"l": 107.54999, "t": 694.0421220000001, "r": 231.47461, "b": 701.771156, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": ", 2(1-2):83-97,", "bbox": {"l": 231.47598, "t": 693.9614260000001, "r": 286.35931, "b": 701.977386, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "1955. 6", "bbox": {"l": 70.030975, "t": 704.920425, "r": 97.916481, "b": 712.936386, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "list_item", "bbox": {"l": 308.86197, "t": 75.88342000000011, "r": 545.11475, "b": 138.69335999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.9389600157737732, "cells": [{"id": 104, "text": "[16]", "bbox": {"l": 308.86197, "t": 75.88342000000011, "r": 324.74973, "b": 83.89940999999999, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "Girish Kulkarni, Visruth Premraj, Vicente Ordonez, Sag-", "bbox": {"l": 327.13382, "t": 75.88342000000011, "r": 545.1087, "b": 83.89940999999999, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "nik Dhar, Siming Li, Yejin Choi, Alexander C. Berg, and", "bbox": {"l": 328.78098, "t": 86.84142999999995, "r": 545.1134, "b": 94.85741999999993, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "Tamara L. Berg.", "bbox": {"l": 328.78098, "t": 97.80042000000003, "r": 390.96295, "b": 105.81641000000002, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "Babytalk:", "bbox": {"l": 400.27008, "t": 97.80042000000003, "r": 435.1404099999999, "b": 105.81641000000002, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "Understanding and generat-", "bbox": {"l": 441.71277, "t": 97.80042000000003, "r": 545.11328, "b": 105.81641000000002, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "ing simple image descriptions.", "bbox": {"l": 328.78098, "t": 108.75940000000003, "r": 440.80719, "b": 116.7753899999999, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "IEEE Transactions on Pat-", "bbox": {"l": 446.63498, "t": 108.84009000000003, "r": 545.11304, "b": 116.56914999999992, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "tern Analysis and Machine Intelligence", "bbox": {"l": 328.78098, "t": 119.79907000000003, "r": 471.13153, "b": 127.52814000000001, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": ", 35(12):2891-2903,", "bbox": {"l": 471.13300000000004, "t": 119.71838000000002, "r": 545.11475, "b": 127.73437999999999, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "2013. 4", "bbox": {"l": 328.78101, "t": 130.67737, "r": 356.6665, "b": 138.69335999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "list_item", "bbox": {"l": 308.862, "t": 142.12334999999996, "r": 545.1134, "b": 172.05633999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.9253129959106445, "cells": [{"id": 115, "text": "[17]", "bbox": {"l": 308.862, "t": 142.12334999999996, "r": 325.24371, "b": 150.13933999999995, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "Minghao Li, Lei Cui, Shaohan Huang, Furu Wei, Ming", "bbox": {"l": 327.70197, "t": 142.12334999999996, "r": 545.10883, "b": 150.13933999999995, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "Zhou, and Zhoujun Li.", "bbox": {"l": 328.78101, "t": 153.08136000000002, "r": 414.44598, "b": 161.09735, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "Tablebank: A benchmark dataset", "bbox": {"l": 421.82532, "t": 153.08136000000002, "r": 545.1134, "b": 161.09735, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "for table detection and recognition, 2019. 2, 3", "bbox": {"l": 328.78101, "t": 164.04034000000001, "r": 493.62835999999993, "b": 172.05633999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "list_item", "bbox": {"l": 308.862, "t": 175.48632999999995, "r": 545.11353, "b": 260.21423000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9299732446670532, "cells": [{"id": 120, "text": "[18]", "bbox": {"l": 308.862, "t": 175.48632999999995, "r": 324.26599, "b": 183.50232000000005, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "Yiren Li, Zheng Huang, Junchi Yan, Yi Zhou, Fan Ye, and", "bbox": {"l": 326.57751, "t": 175.48632999999995, "r": 545.10876, "b": 183.50232000000005, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Xianhui Liu. Gfte: Graph-based financial table extraction.", "bbox": {"l": 328.78101, "t": 186.44530999999995, "r": 545.11334, "b": 194.46130000000005, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "In Alberto Del Bimbo, Rita Cucchiara, Stan Sclaroff, Gio-", "bbox": {"l": 328.78101, "t": 197.40430000000003, "r": 545.11346, "b": 205.42029000000002, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "vanni Maria Farinella, Tao Mei, Marco Bertini, Hugo Jair", "bbox": {"l": 328.78101, "t": 208.36328000000003, "r": 545.11353, "b": 216.37927000000002, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "Escalante, and Roberto Vezzani, editors,", "bbox": {"l": 328.78101, "t": 219.32227, "r": 479.26413, "b": 227.33826, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "Pattern Recogni-", "bbox": {"l": 483.11902, "t": 219.40295000000003, "r": 545.11273, "b": 227.13202, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "tion. ICPR International Workshops and Challenges", "bbox": {"l": 328.78101, "t": 230.36095999999998, "r": 519.39771, "b": 238.09002999999996, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": ", pages", "bbox": {"l": 519.401, "t": 230.28026999999997, "r": 545.10767, "b": 238.29625999999996, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "644-658, Cham, 2021. Springer International Publishing. 2,", "bbox": {"l": 328.78101, "t": 241.23925999999994, "r": 545.11328, "b": 249.25525000000005, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "3", "bbox": {"l": 328.78101, "t": 252.19824000000006, "r": 333.26422, "b": 260.21423000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "list_item", "bbox": {"l": 308.862, "t": 263.64423, "r": 545.1142, "b": 326.45413, "coord_origin": "TOPLEFT"}, "confidence": 0.937321662902832, "cells": [{"id": 131, "text": "[19]", "bbox": {"l": 308.862, "t": 263.64423, "r": 324.26477, "b": 271.66022, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "Nikolaos Livathinos, Cesar Berrospi, Maksym Lysak, Vik-", "bbox": {"l": 326.57611, "t": 263.64423, "r": 545.10883, "b": 271.66022, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "tor Kuropiatnyk, Ahmed Nassar, Andre Carvalho, Michele", "bbox": {"l": 328.78101, "t": 274.60321, "r": 545.1134, "b": 282.61917000000005, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "Dolfi, Christoph Auer, Kasper Dinkla, and Peter Staar. Ro-", "bbox": {"l": 328.78101, "t": 285.56219, "r": 545.11328, "b": 293.57816, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "bust pdf document conversion using recurrent neural net-", "bbox": {"l": 328.78101, "t": 296.52118, "r": 545.11334, "b": 304.53714, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "works.", "bbox": {"l": 328.78101, "t": 307.47919, "r": 352.84683, "b": 315.49515, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "Proceedings of the AAAI Conference on Artificial", "bbox": {"l": 360.23599, "t": 307.55988, "r": 545.1142, "b": 315.28894, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "Intelligence", "bbox": {"l": 328.78101, "t": 318.51886, "r": 371.02173, "b": 326.24792, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": ", 35(17):15137-15145, May 2021. 1", "bbox": {"l": 371.021, "t": 318.43817, "r": 502.26227, "b": 326.45413, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "list_item", "bbox": {"l": 308.862, "t": 329.88419, "r": 545.11609, "b": 370.77713, "coord_origin": "TOPLEFT"}, "confidence": 0.9027292728424072, "cells": [{"id": 140, "text": "[20]", "bbox": {"l": 308.862, "t": 329.88419, "r": 323.82672, "b": 337.90015, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "Rujiao Long, Wen Wang, Nan Xue, Feiyu Gao, Zhibo Yang,", "bbox": {"l": 326.07233, "t": 329.88419, "r": 545.10876, "b": 337.90015, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "Yongpan Wang, and Gui-Song Xia. Parsing table structures", "bbox": {"l": 328.78101, "t": 340.8432, "r": 545.11346, "b": 348.85916, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "in the wild. In", "bbox": {"l": 328.78101, "t": 351.80219000000005, "r": 382.7767, "b": 359.81815000000006, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "Proceedings of the IEEE/CVF International", "bbox": {"l": 385.54102, "t": 351.88287, "r": 545.11609, "b": 359.61194, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "Conference on Computer Vision", "bbox": {"l": 328.78101, "t": 362.84186, "r": 443.59579, "b": 370.57092, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": ", pages 944-952, 2021. 2", "bbox": {"l": 443.59399, "t": 362.76117, "r": 534.48645, "b": 370.77713, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "list_item", "bbox": {"l": 308.862, "t": 374.20618, "r": 545.11346, "b": 437.01706, "coord_origin": "TOPLEFT"}, "confidence": 0.882714569568634, "cells": [{"id": 147, "text": "[21]", "bbox": {"l": 308.862, "t": 374.20618, "r": 324.60281, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "Shubham", "bbox": {"l": 326.96487, "t": 374.20618, "r": 362.6604, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "Singh", "bbox": {"l": 368.69479, "t": 374.20618, "r": 389.6134, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "Paliwal,", "bbox": {"l": 395.6478, "t": 374.20618, "r": 424.56445, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "D", "bbox": {"l": 431.5492899999999, "t": 374.20618, "r": 438.0230399999999, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "Vishwanath,", "bbox": {"l": 444.05743, "t": 374.20618, "r": 488.5038799999999, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "Rohit", "bbox": {"l": 495.47974, "t": 374.20618, "r": 515.41205, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "Rahul,", "bbox": {"l": 521.44641, "t": 374.20618, "r": 545.10876, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "Monika Sharma, and Lovekesh Vig. Tablenet: Deep learn-", "bbox": {"l": 328.78101, "t": 385.16516, "r": 545.1134, "b": 393.18112, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "ing model for end-to-end table detection and tabular data ex-", "bbox": {"l": 328.78101, "t": 396.12415, "r": 545.11346, "b": 404.14011, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "traction from scanned document images.", "bbox": {"l": 328.78101, "t": 407.08313, "r": 478.00881999999996, "b": 415.09909, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "In", "bbox": {"l": 484.0701, "t": 407.08313, "r": 491.53912, "b": 415.09909, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "2019 Interna-", "bbox": {"l": 494.668, "t": 407.16382, "r": 545.11298, "b": 414.89288, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "tional Conference on Document Analysis and Recognition", "bbox": {"l": 328.78101, "t": 418.12280000000004, "r": 545.11334, "b": 425.85187, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "(ICDAR)", "bbox": {"l": 328.78101, "t": 429.08179, "r": 360.83591, "b": 436.8108500000001, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": ", pages 128-133. IEEE, 2019. 1", "bbox": {"l": 360.836, "t": 429.0011, "r": 475.63287, "b": 437.01706, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "list_item", "bbox": {"l": 308.862, "t": 440.44611, "r": 545.11475, "b": 558.05096, "coord_origin": "TOPLEFT"}, "confidence": 0.8896440863609314, "cells": [{"id": 163, "text": "[22]", "bbox": {"l": 308.862, "t": 440.44611, "r": 324.57407, "b": 448.46207, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "Adam Paszke, Sam Gross, Francisco Massa, Adam Lerer,", "bbox": {"l": 326.93179, "t": 440.44611, "r": 545.1087, "b": 448.46207, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "James Bradbury, Gregory Chanan, Trevor Killeen, Zeming", "bbox": {"l": 328.78101, "t": 451.40509, "r": 545.11346, "b": 459.42105, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "Lin, Natalia Gimelshein, Luca Antiga, Alban Desmaison,", "bbox": {"l": 328.78101, "t": 462.36407, "r": 545.11328, "b": 470.38004, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "Andreas Kopf, Edward Yang, Zachary DeVito, Martin Rai-", "bbox": {"l": 328.78101, "t": 473.32306, "r": 545.11328, "b": 481.33902, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "son, Alykhan Tejani, Sasank Chilamkurthy, Benoit Steiner,", "bbox": {"l": 328.78101, "t": 484.28204, "r": 545.11328, "b": 492.298, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "Lu Fang, Junjie Bai, and Soumith Chintala. Pytorch: An im-", "bbox": {"l": 328.78101, "t": 495.24103, "r": 545.1134, "b": 503.25699, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "perative style, high-performance deep learning library. In H.", "bbox": {"l": 328.78101, "t": 506.20001, "r": 545.1134, "b": 514.21597, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "Wallach, H. Larochelle, A. Beygelzimer, F. d'Alch\u00b4e-Buc, E.", "bbox": {"l": 328.78101, "t": 517.159, "r": 545.1098, "b": 525.17496, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "Fox, and R. Garnett, editors,", "bbox": {"l": 328.78101, "t": 528.117, "r": 434.56659, "b": 536.13297, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "Advances in Neural Informa-", "bbox": {"l": 437.86401, "t": 528.19769, "r": 545.11115, "b": 535.9267600000001, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "tion Processing Systems 32", "bbox": {"l": 328.78101, "t": 539.15671, "r": 425.73471, "b": 546.8857399999999, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": ", pages 8024-8035. Curran Asso-", "bbox": {"l": 425.73602, "t": 539.076, "r": 545.11475, "b": 547.09196, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "ciates, Inc., 2019. 6", "bbox": {"l": 328.78101, "t": 550.035, "r": 399.74109, "b": 558.05096, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "list_item", "bbox": {"l": 308.862, "t": 561.481, "r": 545.1134, "b": 624.29097, "coord_origin": "TOPLEFT"}, "confidence": 0.9025435447692871, "cells": [{"id": 177, "text": "[23]", "bbox": {"l": 308.862, "t": 561.481, "r": 324.50351, "b": 569.49696, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "Devashish Prasad, Ayan Gadpal, Kshitij Kapadni, Manish", "bbox": {"l": 326.85068, "t": 561.481, "r": 545.10876, "b": 569.49696, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "Visave, and Kavita Sultanpure. Cascadetabnet: An approach", "bbox": {"l": 328.78101, "t": 572.44, "r": 545.1134, "b": 580.45596, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "for end to end table detection and structure recognition from", "bbox": {"l": 328.78101, "t": 583.399, "r": 545.11334, "b": 591.4149600000001, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "image-based documents. In", "bbox": {"l": 328.78101, "t": 594.358, "r": 431.61667, "b": 602.37396, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "Proceedings of the IEEE/CVF", "bbox": {"l": 434.69101000000006, "t": 594.4387099999999, "r": 545.11224, "b": 602.16774, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "Conference on Computer Vision and Pattern Recognition", "bbox": {"l": 328.78101, "t": 605.39671, "r": 545.1134, "b": 613.12575, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "Workshops", "bbox": {"l": 328.78101, "t": 616.35571, "r": 367.8028, "b": 624.08475, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": ", pages 572-573, 2020. 1", "bbox": {"l": 367.802, "t": 616.2750100000001, "r": 458.69446000000005, "b": 624.29097, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "list_item", "bbox": {"l": 308.862, "t": 627.72101, "r": 545.11621, "b": 668.61398, "coord_origin": "TOPLEFT"}, "confidence": 0.8777532577514648, "cells": [{"id": 186, "text": "[24]", "bbox": {"l": 308.862, "t": 627.72101, "r": 324.69476, "b": 635.73697, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "Shah Rukh Qasim, Hassan Mahmood, and Faisal Shafait.", "bbox": {"l": 327.07065, "t": 627.72101, "r": 545.1087, "b": 635.73697, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": "Rethinking table recognition using graph neural networks.", "bbox": {"l": 328.78101, "t": 638.68001, "r": 545.11328, "b": 646.69597, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "In", "bbox": {"l": 328.78101, "t": 649.63901, "r": 336.25003, "b": 657.65497, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "2019 International Conference on Document Analysis and", "bbox": {"l": 338.10001, "t": 649.71971, "r": 545.11621, "b": 657.44875, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "Recognition (ICDAR)", "bbox": {"l": 328.78101, "t": 660.67871, "r": 406.32245, "b": 668.40775, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": ", pages 142-147. IEEE, 2019. 3", "bbox": {"l": 406.32202, "t": 660.5980099999999, "r": 521.1189, "b": 668.61398, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "list_item", "bbox": {"l": 308.86203, "t": 672.04301, "r": 545.1134, "b": 712.935974, "coord_origin": "TOPLEFT"}, "confidence": 0.8654531240463257, "cells": [{"id": 193, "text": "[25]", "bbox": {"l": 308.86203, "t": 672.04301, "r": 324.71329, "b": 680.05898, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "Hamid Rezatofighi, Nathan Tsoi, JunYoung Gwak, Amir", "bbox": {"l": 327.09195, "t": 672.04301, "r": 545.10876, "b": 680.05898, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "Sadeghian, Ian Reid, and Silvio Savarese.", "bbox": {"l": 328.78104, "t": 683.0020099999999, "r": 482.81488, "b": 691.01797, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "Generalized in-", "bbox": {"l": 488.75064, "t": 683.0020099999999, "r": 545.1134, "b": 691.01797, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "tersection over union: A metric and a loss for bounding box", "bbox": {"l": 328.78104, "t": 693.961014, "r": 545.11334, "b": 701.976974, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "regression. In", "bbox": {"l": 328.78104, "t": 704.920013, "r": 379.1543, "b": 712.935974, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "Proceedings of the IEEE/CVF Conference on", "bbox": {"l": 381.61603, "t": 705.00071, "r": 545.10938, "b": 712.729744, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "page_footer", "bbox": {"l": 295.12103, "t": 734.1325870000001, "r": 300.10233, "b": 743.0391500000001, "coord_origin": "TOPLEFT"}, "confidence": 0.8797808885574341, "cells": [{"id": 200, "text": "9", "bbox": {"l": 295.12103, "t": 734.1325870000001, "r": 300.10233, "b": 743.0391500000001, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "list_item", "id": 25, "page_no": 8, "cluster": {"id": 25, "label": "list_item", "bbox": {"l": 70.030998, "t": 75.88378999999998, "r": 286.36334, "b": 116.77575999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.7310384511947632, "cells": [{"id": 0, "text": "end object detection with transformers. In Andrea Vedaldi,", "bbox": {"l": 70.030998, "t": 75.88378999999998, "r": 286.36334, "b": 83.89977999999996, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Horst Bischof, Thomas Brox, and Jan-Michael Frahm, edi-", "bbox": {"l": 70.030998, "t": 86.84276999999997, "r": 286.36331, "b": 94.85875999999996, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "tors,", "bbox": {"l": 70.030998, "t": 97.80078000000003, "r": 85.722198, "b": 105.81677000000002, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Computer Vision - ECCV 2020", "bbox": {"l": 87.889, "t": 97.88147000000004, "r": 199.93315, "b": 105.61053000000004, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": ", pages 213-229, Cham,", "bbox": {"l": 199.936, "t": 97.80078000000003, "r": 286.36313, "b": 105.81677000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "2020. Springer International Publishing. 5", "bbox": {"l": 70.031006, "t": 108.75977, "r": 221.94871999999998, "b": 116.77575999999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "end object detection with transformers. In Andrea Vedaldi, Horst Bischof, Thomas Brox, and Jan-Michael Frahm, editors, Computer Vision - ECCV 2020 , pages 213-229, Cham, 2020. Springer International Publishing. 5"}, {"label": "list_item", "id": 9, "page_no": 8, "cluster": {"id": 9, "label": "list_item", "bbox": {"l": 54.595005, "t": 120.03174000000013, "r": 286.36334, "b": 149.96569999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9372755885124207, "cells": [{"id": 6, "text": "[2]", "bbox": {"l": 54.595005, "t": 120.03174000000013, "r": 65.206657, "b": 128.04773, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Zewen Chi, Heyan Huang, Heng-Da Xu, Houjin Yu, Wanx-", "bbox": {"l": 67.481873, "t": 120.03174000000013, "r": 286.35852, "b": 128.04773, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "uan Yin, and Xian-Ling Mao.", "bbox": {"l": 70.031006, "t": 130.99072, "r": 179.67215, "b": 139.00671, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Complicated table structure", "bbox": {"l": 185.58101, "t": 130.99072, "r": 286.36334, "b": 139.00671, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "recognition.", "bbox": {"l": 70.031006, "t": 141.94970999999998, "r": 113.11456, "b": 149.96569999999997, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "arXiv preprint arXiv:1908.04729", "bbox": {"l": 116.34200999999999, "t": 142.0304, "r": 235.3082, "b": 149.75946, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": ", 2019. 3", "bbox": {"l": 235.30701, "t": 141.94970999999998, "r": 267.67572, "b": 149.96569999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[2] Zewen Chi, Heyan Huang, Heng-Da Xu, Houjin Yu, Wanxuan Yin, and Xian-Ling Mao. Complicated table structure recognition. arXiv preprint arXiv:1908.04729 , 2019. 3"}, {"label": "list_item", "id": 7, "page_no": 8, "cluster": {"id": 7, "label": "list_item", "bbox": {"l": 54.595001, "t": 153.22168, "r": 286.36301, "b": 183.15466000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9378374218940735, "cells": [{"id": 13, "text": "[3]", "bbox": {"l": 54.595001, "t": 153.22168, "r": 65.103195, "b": 161.23766999999998, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Bertrand Couasnon and Aurelie Lemaitre.", "bbox": {"l": 67.356239, "t": 153.22168, "r": 218.77876, "b": 161.23766999999998, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Recognition of Ta-", "bbox": {"l": 220.97999999999996, "t": 153.30237, "r": 286.36301, "b": 161.03143, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "bles and Forms", "bbox": {"l": 70.030991, "t": 164.26135, "r": 125.26401000000001, "b": 171.99041999999997, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": ", pages 647-677. Springer London, London,", "bbox": {"l": 125.26098999999999, "t": 164.18066, "r": 286.36029, "b": 172.19665999999995, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "2014. 2", "bbox": {"l": 70.030991, "t": 175.13867000000005, "r": 97.916496, "b": 183.15466000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[3] Bertrand Couasnon and Aurelie Lemaitre. Recognition of Tables and Forms , pages 647-677. Springer London, London, 2014. 2"}, {"label": "list_item", "id": 0, "page_no": 8, "cluster": {"id": 0, "label": "list_item", "bbox": {"l": 54.59499, "t": 186.41063999999994, "r": 286.36401, "b": 227.30358999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9648825526237488, "cells": [{"id": 19, "text": "[4]", "bbox": {"l": 54.59499, "t": 186.41063999999994, "r": 65.806984, "b": 194.42664000000002, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Herv\u00b4e D\u00b4ejean, Jean-Luc Meunier, Liangcai Gao, Yilun", "bbox": {"l": 68.210922, "t": 186.41063999999994, "r": 286.36401, "b": 194.42664000000002, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Huang, Yu Fang, Florian Kleber, and Eva-Maria Lang. IC-", "bbox": {"l": 70.030983, "t": 197.36963000000003, "r": 286.36331, "b": 205.38562000000002, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "DAR 2019 Competition on Table Detection and Recognition", "bbox": {"l": 70.030983, "t": 208.32861000000003, "r": 286.36334, "b": 216.3446, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "(cTDaR), Apr. 2019. http://sac.founderit.com/. 2", "bbox": {"l": 70.030983, "t": 219.2876, "r": 245.83519, "b": 227.30358999999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[4] Herv\u00b4e D\u00b4ejean, Jean-Luc Meunier, Liangcai Gao, Yilun Huang, Yu Fang, Florian Kleber, and Eva-Maria Lang. ICDAR 2019 Competition on Table Detection and Recognition (cTDaR), Apr. 2019. http://sac.founderit.com/. 2"}, {"label": "list_item", "id": 1, "page_no": 8, "cluster": {"id": 1, "label": "list_item", "bbox": {"l": 54.594982, "t": 230.55957, "r": 286.36334, "b": 271.45154, "coord_origin": "TOPLEFT"}, "confidence": 0.9620943069458008, "cells": [{"id": 24, "text": "[5]", "bbox": {"l": 54.594982, "t": 230.55957, "r": 65.381134, "b": 238.57556, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "Basilios Gatos, Dimitrios Danatsas, Ioannis Pratikakis, and", "bbox": {"l": 67.693779, "t": 230.55957, "r": 286.35849, "b": 238.57556, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "Stavros J Perantonis. Automatic table detection in document", "bbox": {"l": 70.030983, "t": 241.51855, "r": 286.36334, "b": 249.53454999999997, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "images. In", "bbox": {"l": 70.030983, "t": 252.47655999999995, "r": 108.39821, "b": 260.49255000000005, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "International Conference on Pattern Recognition", "bbox": {"l": 110.64498000000002, "t": 252.55724999999995, "r": 286.3595, "b": 260.28632000000005, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "and Image Analysis", "bbox": {"l": 70.030983, "t": 263.51624000000004, "r": 140.57861, "b": 271.24530000000004, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": ", pages 609-618. Springer, 2005. 2", "bbox": {"l": 140.57797, "t": 263.43555000000003, "r": 266.47522, "b": 271.45154, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[5] Basilios Gatos, Dimitrios Danatsas, Ioannis Pratikakis, and Stavros J Perantonis. Automatic table detection in document images. In International Conference on Pattern Recognition and Image Analysis , pages 609-618. Springer, 2005. 2"}, {"label": "list_item", "id": 2, "page_no": 8, "cluster": {"id": 2, "label": "list_item", "bbox": {"l": 54.594971, "t": 274.70758, "r": 286.36676, "b": 315.6004899999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9555517435073853, "cells": [{"id": 31, "text": "[6]", "bbox": {"l": 54.594971, "t": 274.70758, "r": 64.848648, "b": 282.72351, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Max G\u00a8obel, Tamir Hassan, Ermelinda Oro, and Giorgio Orsi.", "bbox": {"l": 67.047119, "t": 274.70758, "r": 286.36676, "b": 282.72351, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "Icdar 2013 table competition.", "bbox": {"l": 70.030975, "t": 285.66655999999995, "r": 179.57349, "b": 293.68253, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "In", "bbox": {"l": 187.01559, "t": 285.66655999999995, "r": 194.4846, "b": 293.68253, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "2013 12th International", "bbox": {"l": 198.04398, "t": 285.74725, "r": 286.36304, "b": 293.47632, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Conference on Document Analysis and Recognition", "bbox": {"l": 70.030975, "t": 296.70624, "r": 260.19937, "b": 304.43530000000004, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": ", pages", "bbox": {"l": 260.198, "t": 296.62555, "r": 286.36197, "b": 304.64151, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "1449-1453, 2013. 2", "bbox": {"l": 70.030991, "t": 307.5845299999999, "r": 142.74849, "b": 315.6004899999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[6] Max G\u00a8obel, Tamir Hassan, Ermelinda Oro, and Giorgio Orsi. Icdar 2013 table competition. In 2013 12th International Conference on Document Analysis and Recognition , pages 1449-1453, 2013. 2"}, {"label": "list_item", "id": 4, "page_no": 8, "cluster": {"id": 4, "label": "list_item", "bbox": {"l": 54.59499, "t": 318.85654, "r": 286.36319, "b": 348.78952, "coord_origin": "TOPLEFT"}, "confidence": 0.9479843378067017, "cells": [{"id": 39, "text": "[7]", "bbox": {"l": 54.59499, "t": 318.85654, "r": 65.61586, "b": 326.8725, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "EA Green and M Krishnamoorthy.", "bbox": {"l": 67.978821, "t": 318.85654, "r": 199.492, "b": 326.8725, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Recognition of tables", "bbox": {"l": 206.98792, "t": 318.85654, "r": 286.35849, "b": 326.8725, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "using table grammars. procs.", "bbox": {"l": 70.030991, "t": 329.8145400000001, "r": 176.28284, "b": 337.83051, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "In", "bbox": {"l": 182.60416, "t": 329.8145400000001, "r": 190.07317, "b": 337.83051, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "Symposium on Document", "bbox": {"l": 193.28299, "t": 329.89522999999997, "r": 286.36319, "b": 337.62429999999995, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Analysis and Recognition (SDAIR\u201995)", "bbox": {"l": 70.030991, "t": 340.85425, "r": 206.34717, "b": 348.58331, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": ", pages 261-277. 2", "bbox": {"l": 206.34599, "t": 340.77356, "r": 274.82239, "b": 348.78952, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[7] EA Green and M Krishnamoorthy. Recognition of tables using table grammars. procs. In Symposium on Document Analysis and Recognition (SDAIR'95) , pages 261-277. 2"}, {"label": "list_item", "id": 3, "page_no": 8, "cluster": {"id": 3, "label": "list_item", "bbox": {"l": 54.594986000000006, "t": 352.0455600000001, "r": 286.36331, "b": 403.89749, "coord_origin": "TOPLEFT"}, "confidence": 0.9484425187110901, "cells": [{"id": 47, "text": "[8]", "bbox": {"l": 54.594986000000006, "t": 352.0455600000001, "r": 65.04657, "b": 360.06152, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Khurram Azeem Hashmi, Alain Pagani, Marcus Liwicki, Di-", "bbox": {"l": 67.287483, "t": 352.0455600000001, "r": 286.35849, "b": 360.06152, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "dier Stricker, and Muhammad Zeshan Afzal.", "bbox": {"l": 70.030983, "t": 363.00458, "r": 234.12507999999997, "b": 371.02054, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Castabdetec-", "bbox": {"l": 240.05186, "t": 363.00458, "r": 286.36331, "b": 371.02054, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "tors: Cascade network for table detection in document im-", "bbox": {"l": 70.030983, "t": 373.96356, "r": 286.36331, "b": 381.97952, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "ages with recursive feature pyramid and switchable atrous", "bbox": {"l": 70.030983, "t": 384.92255, "r": 286.36331, "b": 392.93851, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "convolution.", "bbox": {"l": 70.030983, "t": 395.88153, "r": 114.57605, "b": 403.89749, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "Journal of Imaging", "bbox": {"l": 117.80399000000001, "t": 395.96222, "r": 186.7287, "b": 403.69128, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": ", 7(10), 2021. 1", "bbox": {"l": 186.728, "t": 395.88153, "r": 243.00113999999996, "b": 403.89749, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[8] Khurram Azeem Hashmi, Alain Pagani, Marcus Liwicki, Didier Stricker, and Muhammad Zeshan Afzal. Castabdetectors: Cascade network for table detection in document images with recursive feature pyramid and switchable atrous convolution. Journal of Imaging , 7(10), 2021. 1"}, {"label": "list_item", "id": 10, "page_no": 8, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 54.595001, "t": 407.15253000000007, "r": 286.35989, "b": 437.08646000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9330756664276123, "cells": [{"id": 56, "text": "[9]", "bbox": {"l": 54.595001, "t": 407.15253000000007, "r": 65.334427, "b": 415.1684900000001, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Kaiming He, Georgia Gkioxari, Piotr Dollar, and Ross Gir-", "bbox": {"l": 67.637054, "t": 407.15253000000007, "r": 286.35852, "b": 415.1684900000001, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "shick. Mask r-cnn. In", "bbox": {"l": 70.030998, "t": 418.11151, "r": 147.13306, "b": 426.12747, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Proceedings of the IEEE International", "bbox": {"l": 149.15601, "t": 418.1922, "r": 286.35989, "b": 425.92126, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Conference on Computer Vision (ICCV)", "bbox": {"l": 70.031006, "t": 429.15118, "r": 213.48445, "b": 436.88025, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": ", Oct 2017. 1", "bbox": {"l": 213.483, "t": 429.07050000000004, "r": 261.04083, "b": 437.08646000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[9] Kaiming He, Georgia Gkioxari, Piotr Dollar, and Ross Girshick. Mask r-cnn. In Proceedings of the IEEE International Conference on Computer Vision (ICCV) , Oct 2017. 1"}, {"label": "list_item", "id": 14, "page_no": 8, "cluster": {"id": 14, "label": "list_item", "bbox": {"l": 50.112, "t": 440.3424999999999, "r": 286.36334, "b": 481.23544, "coord_origin": "TOPLEFT"}, "confidence": 0.9274735450744629, "cells": [{"id": 62, "text": "[10]", "bbox": {"l": 50.112, "t": 440.3424999999999, "r": 65.399307, "b": 448.3584599999999, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "Yelin He, X. Qi, Jiaquan Ye, Peng Gao, Yihao Chen, Bing-", "bbox": {"l": 67.693321, "t": 440.3424999999999, "r": 286.3587, "b": 448.3584599999999, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "cong Li, Xin Tang, and Rong Xiao.", "bbox": {"l": 70.030998, "t": 451.30151, "r": 202.74268, "b": 459.31747, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "Pingan-vcgroup\u2019s so-", "bbox": {"l": 209.00122, "t": 451.30151, "r": 286.36331, "b": 459.31747, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "lution for icdar 2021 competition on scientific table image", "bbox": {"l": 70.030998, "t": 462.2605, "r": 286.36334, "b": 470.27646, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "recognition to latex.", "bbox": {"l": 70.030998, "t": 473.21948, "r": 141.86981, "b": 481.23544, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "ArXiv", "bbox": {"l": 145.097, "t": 473.30017, "r": 166.01561, "b": 481.02924, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": ", abs/2105.01846, 2021. 2", "bbox": {"l": 166.015, "t": 473.21948, "r": 259.90216, "b": 481.23544, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[10] Yelin He, X. Qi, Jiaquan Ye, Peng Gao, Yihao Chen, Bingcong Li, Xin Tang, and Rong Xiao. Pingan-vcgroup's solution for icdar 2021 competition on scientific table image recognition to latex. ArXiv , abs/2105.01846, 2021. 2"}, {"label": "list_item", "id": 11, "page_no": 8, "cluster": {"id": 11, "label": "list_item", "bbox": {"l": 50.112, "t": 484.49048, "r": 286.36331, "b": 536.34238, "coord_origin": "TOPLEFT"}, "confidence": 0.9299950003623962, "cells": [{"id": 70, "text": "[11]", "bbox": {"l": 50.112, "t": 484.49048, "r": 66.033806, "b": 492.50644, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Jianying Hu, Ramanujan S Kashi, Daniel P Lopresti, and", "bbox": {"l": 68.423035, "t": 484.49048, "r": 286.35873, "b": 492.50644, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "Gordon Wilfong. Medium-independent table detection. In", "bbox": {"l": 70.030998, "t": 495.44946, "r": 286.36331, "b": 503.46542, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "Document Recognition and Retrieval VII", "bbox": {"l": 70.030998, "t": 506.48914, "r": 227.40926, "b": 514.2182, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": ", volume 3967,", "bbox": {"l": 227.40500000000003, "t": 506.40845, "r": 286.35913, "b": 514.4244100000001, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "pages 291-302. International Society for Optics and Photon-", "bbox": {"l": 70.031006, "t": 517.36743, "r": 286.36328, "b": 525.38339, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "ics, 1999. 2", "bbox": {"l": 70.031006, "t": 528.32642, "r": 112.36138000000001, "b": 536.34238, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[11] Jianying Hu, Ramanujan S Kashi, Daniel P Lopresti, and Gordon Wilfong. Medium-independent table detection. In Document Recognition and Retrieval VII , volume 3967, pages 291-302. International Society for Optics and Photonics, 1999. 2"}, {"label": "list_item", "id": 5, "page_no": 8, "cluster": {"id": 5, "label": "list_item", "bbox": {"l": 50.112007, "t": 539.59842, "r": 286.36334, "b": 591.44937, "coord_origin": "TOPLEFT"}, "confidence": 0.9394103288650513, "cells": [{"id": 77, "text": "[12]", "bbox": {"l": 50.112007, "t": 539.59842, "r": 65.466705, "b": 547.61438, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "Matthew Hurst. A constraint-based approach to table struc-", "bbox": {"l": 67.770828, "t": 539.59842, "r": 286.35873, "b": 547.61438, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "ture derivation. In", "bbox": {"l": 70.031006, "t": 550.55742, "r": 136.28374, "b": 558.57338, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "Proceedings of the Seventh International", "bbox": {"l": 138.811, "t": 550.63812, "r": 286.36206, "b": 558.36716, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Conference on Document Analysis and Recognition - Volume", "bbox": {"l": 70.031006, "t": 561.5971199999999, "r": 286.36334, "b": 569.32616, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "2", "bbox": {"l": 70.031006, "t": 572.55612, "r": 74.514206, "b": 580.28516, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": ", ICDAR \u201903, page 911, USA, 2003. IEEE Computer Soci-", "bbox": {"l": 74.514008, "t": 572.47542, "r": 286.36313, "b": 580.4913799999999, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "ety. 2", "bbox": {"l": 70.031006, "t": 583.4334100000001, "r": 90.357834, "b": 591.44937, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[12] Matthew Hurst. A constraint-based approach to table structure derivation. In Proceedings of the Seventh International Conference on Document Analysis and Recognition - Volume 2 , ICDAR '03, page 911, USA, 2003. IEEE Computer Society. 2"}, {"label": "list_item", "id": 13, "page_no": 8, "cluster": {"id": 13, "label": "list_item", "bbox": {"l": 50.112007, "t": 594.70541, "r": 286.36331, "b": 646.55737, "coord_origin": "TOPLEFT"}, "confidence": 0.9298838973045349, "cells": [{"id": 85, "text": "[13]", "bbox": {"l": 50.112007, "t": 594.70541, "r": 66.270439, "b": 602.72137, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Thotreingam Kasar, Philippine Barlas, Sebastien Adam,", "bbox": {"l": 68.695168, "t": 594.70541, "r": 286.35873, "b": 602.72137, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Cl\u00b4ement Chatelain, and Thierry Paquet. Learning to detect", "bbox": {"l": 70.031006, "t": 605.66441, "r": 286.3631, "b": 613.68037, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "tables in scanned document images using line information.", "bbox": {"l": 70.031006, "t": 616.62341, "r": 286.36331, "b": 624.63937, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "In", "bbox": {"l": 70.031006, "t": 627.58241, "r": 77.500015, "b": 635.5983699999999, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "2013 12th International Conference on Document Analy-", "bbox": {"l": 79.920006, "t": 627.6631199999999, "r": 286.3624, "b": 635.39215, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "sis and Recognition", "bbox": {"l": 70.031006, "t": 638.62212, "r": 140.67728, "b": 646.35115, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": ", pages 1185-1189. IEEE, 2013. 2", "bbox": {"l": 140.67599, "t": 638.54141, "r": 264.43921, "b": 646.55737, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[13] Thotreingam Kasar, Philippine Barlas, Sebastien Adam, Cl\u00b4ement Chatelain, and Thierry Paquet. Learning to detect tables in scanned document images using line information. In 2013 12th International Conference on Document Analysis and Recognition , pages 1185-1189. IEEE, 2013. 2"}, {"label": "list_item", "id": 17, "page_no": 8, "cluster": {"id": 17, "label": "list_item", "bbox": {"l": 50.111992, "t": 649.81342, "r": 286.36334, "b": 679.74638, "coord_origin": "TOPLEFT"}, "confidence": 0.9115257263183594, "cells": [{"id": 93, "text": "[14]", "bbox": {"l": 50.111992, "t": 649.81342, "r": 66.534035, "b": 657.82938, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "Pratik Kayal, Mrinal Anand, Harsh Desai, and Mayank", "bbox": {"l": 68.998329, "t": 649.81342, "r": 286.35873, "b": 657.82938, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "Singh.", "bbox": {"l": 70.030991, "t": 660.77142, "r": 93.200165, "b": 668.78738, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "Icdar 2021 competition on scientific table image", "bbox": {"l": 102.20243, "t": 660.77142, "r": 286.36334, "b": 668.78738, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "recognition to latex, 2021. 2", "bbox": {"l": 70.030991, "t": 671.73042, "r": 171.9969, "b": 679.74638, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[14] Pratik Kayal, Mrinal Anand, Harsh Desai, and Mayank Singh. Icdar 2021 competition on scientific table image recognition to latex, 2021. 2"}, {"label": "list_item", "id": 16, "page_no": 8, "cluster": {"id": 16, "label": "list_item", "bbox": {"l": 50.111992, "t": 683.00243, "r": 286.35931, "b": 712.936386, "coord_origin": "TOPLEFT"}, "confidence": 0.912230372428894, "cells": [{"id": 98, "text": "[15]", "bbox": {"l": 50.111992, "t": 683.00243, "r": 65.515968, "b": 691.01839, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "Harold W Kuhn. The hungarian method for the assignment", "bbox": {"l": 67.827499, "t": 683.00243, "r": 286.3587, "b": 691.01839, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "problem.", "bbox": {"l": 70.030991, "t": 693.9614260000001, "r": 102.15761, "b": 701.977386, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "Naval research logistics quarterly", "bbox": {"l": 107.54999, "t": 694.0421220000001, "r": 231.47461, "b": 701.771156, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": ", 2(1-2):83-97,", "bbox": {"l": 231.47598, "t": 693.9614260000001, "r": 286.35931, "b": 701.977386, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "1955. 6", "bbox": {"l": 70.030975, "t": 704.920425, "r": 97.916481, "b": 712.936386, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[15] Harold W Kuhn. The hungarian method for the assignment problem. Naval research logistics quarterly , 2(1-2):83-97, 1955. 6"}, {"label": "list_item", "id": 6, "page_no": 8, "cluster": {"id": 6, "label": "list_item", "bbox": {"l": 308.86197, "t": 75.88342000000011, "r": 545.11475, "b": 138.69335999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.9389600157737732, "cells": [{"id": 104, "text": "[16]", "bbox": {"l": 308.86197, "t": 75.88342000000011, "r": 324.74973, "b": 83.89940999999999, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "Girish Kulkarni, Visruth Premraj, Vicente Ordonez, Sag-", "bbox": {"l": 327.13382, "t": 75.88342000000011, "r": 545.1087, "b": 83.89940999999999, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "nik Dhar, Siming Li, Yejin Choi, Alexander C. Berg, and", "bbox": {"l": 328.78098, "t": 86.84142999999995, "r": 545.1134, "b": 94.85741999999993, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "Tamara L. Berg.", "bbox": {"l": 328.78098, "t": 97.80042000000003, "r": 390.96295, "b": 105.81641000000002, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "Babytalk:", "bbox": {"l": 400.27008, "t": 97.80042000000003, "r": 435.1404099999999, "b": 105.81641000000002, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "Understanding and generat-", "bbox": {"l": 441.71277, "t": 97.80042000000003, "r": 545.11328, "b": 105.81641000000002, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "ing simple image descriptions.", "bbox": {"l": 328.78098, "t": 108.75940000000003, "r": 440.80719, "b": 116.7753899999999, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "IEEE Transactions on Pat-", "bbox": {"l": 446.63498, "t": 108.84009000000003, "r": 545.11304, "b": 116.56914999999992, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "tern Analysis and Machine Intelligence", "bbox": {"l": 328.78098, "t": 119.79907000000003, "r": 471.13153, "b": 127.52814000000001, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": ", 35(12):2891-2903,", "bbox": {"l": 471.13300000000004, "t": 119.71838000000002, "r": 545.11475, "b": 127.73437999999999, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "2013. 4", "bbox": {"l": 328.78101, "t": 130.67737, "r": 356.6665, "b": 138.69335999999998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[16] Girish Kulkarni, Visruth Premraj, Vicente Ordonez, Sagnik Dhar, Siming Li, Yejin Choi, Alexander C. Berg, and Tamara L. Berg. Babytalk: Understanding and generating simple image descriptions. IEEE Transactions on Pattern Analysis and Machine Intelligence , 35(12):2891-2903, 2013. 4"}, {"label": "list_item", "id": 15, "page_no": 8, "cluster": {"id": 15, "label": "list_item", "bbox": {"l": 308.862, "t": 142.12334999999996, "r": 545.1134, "b": 172.05633999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.9253129959106445, "cells": [{"id": 115, "text": "[17]", "bbox": {"l": 308.862, "t": 142.12334999999996, "r": 325.24371, "b": 150.13933999999995, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "Minghao Li, Lei Cui, Shaohan Huang, Furu Wei, Ming", "bbox": {"l": 327.70197, "t": 142.12334999999996, "r": 545.10883, "b": 150.13933999999995, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "Zhou, and Zhoujun Li.", "bbox": {"l": 328.78101, "t": 153.08136000000002, "r": 414.44598, "b": 161.09735, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "Tablebank: A benchmark dataset", "bbox": {"l": 421.82532, "t": 153.08136000000002, "r": 545.1134, "b": 161.09735, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "for table detection and recognition, 2019. 2, 3", "bbox": {"l": 328.78101, "t": 164.04034000000001, "r": 493.62835999999993, "b": 172.05633999999998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[17] Minghao Li, Lei Cui, Shaohan Huang, Furu Wei, Ming Zhou, and Zhoujun Li. Tablebank: A benchmark dataset for table detection and recognition, 2019. 2, 3"}, {"label": "list_item", "id": 12, "page_no": 8, "cluster": {"id": 12, "label": "list_item", "bbox": {"l": 308.862, "t": 175.48632999999995, "r": 545.11353, "b": 260.21423000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9299732446670532, "cells": [{"id": 120, "text": "[18]", "bbox": {"l": 308.862, "t": 175.48632999999995, "r": 324.26599, "b": 183.50232000000005, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "Yiren Li, Zheng Huang, Junchi Yan, Yi Zhou, Fan Ye, and", "bbox": {"l": 326.57751, "t": 175.48632999999995, "r": 545.10876, "b": 183.50232000000005, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Xianhui Liu. Gfte: Graph-based financial table extraction.", "bbox": {"l": 328.78101, "t": 186.44530999999995, "r": 545.11334, "b": 194.46130000000005, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "In Alberto Del Bimbo, Rita Cucchiara, Stan Sclaroff, Gio-", "bbox": {"l": 328.78101, "t": 197.40430000000003, "r": 545.11346, "b": 205.42029000000002, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "vanni Maria Farinella, Tao Mei, Marco Bertini, Hugo Jair", "bbox": {"l": 328.78101, "t": 208.36328000000003, "r": 545.11353, "b": 216.37927000000002, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "Escalante, and Roberto Vezzani, editors,", "bbox": {"l": 328.78101, "t": 219.32227, "r": 479.26413, "b": 227.33826, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "Pattern Recogni-", "bbox": {"l": 483.11902, "t": 219.40295000000003, "r": 545.11273, "b": 227.13202, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "tion. ICPR International Workshops and Challenges", "bbox": {"l": 328.78101, "t": 230.36095999999998, "r": 519.39771, "b": 238.09002999999996, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": ", pages", "bbox": {"l": 519.401, "t": 230.28026999999997, "r": 545.10767, "b": 238.29625999999996, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "644-658, Cham, 2021. Springer International Publishing. 2,", "bbox": {"l": 328.78101, "t": 241.23925999999994, "r": 545.11328, "b": 249.25525000000005, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "3", "bbox": {"l": 328.78101, "t": 252.19824000000006, "r": 333.26422, "b": 260.21423000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[18] Yiren Li, Zheng Huang, Junchi Yan, Yi Zhou, Fan Ye, and Xianhui Liu. Gfte: Graph-based financial table extraction. In Alberto Del Bimbo, Rita Cucchiara, Stan Sclaroff, Giovanni Maria Farinella, Tao Mei, Marco Bertini, Hugo Jair Escalante, and Roberto Vezzani, editors, Pattern Recognition. ICPR International Workshops and Challenges , pages 644-658, Cham, 2021. Springer International Publishing. 2, 3"}, {"label": "list_item", "id": 8, "page_no": 8, "cluster": {"id": 8, "label": "list_item", "bbox": {"l": 308.862, "t": 263.64423, "r": 545.1142, "b": 326.45413, "coord_origin": "TOPLEFT"}, "confidence": 0.937321662902832, "cells": [{"id": 131, "text": "[19]", "bbox": {"l": 308.862, "t": 263.64423, "r": 324.26477, "b": 271.66022, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "Nikolaos Livathinos, Cesar Berrospi, Maksym Lysak, Vik-", "bbox": {"l": 326.57611, "t": 263.64423, "r": 545.10883, "b": 271.66022, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "tor Kuropiatnyk, Ahmed Nassar, Andre Carvalho, Michele", "bbox": {"l": 328.78101, "t": 274.60321, "r": 545.1134, "b": 282.61917000000005, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "Dolfi, Christoph Auer, Kasper Dinkla, and Peter Staar. Ro-", "bbox": {"l": 328.78101, "t": 285.56219, "r": 545.11328, "b": 293.57816, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "bust pdf document conversion using recurrent neural net-", "bbox": {"l": 328.78101, "t": 296.52118, "r": 545.11334, "b": 304.53714, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "works.", "bbox": {"l": 328.78101, "t": 307.47919, "r": 352.84683, "b": 315.49515, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "Proceedings of the AAAI Conference on Artificial", "bbox": {"l": 360.23599, "t": 307.55988, "r": 545.1142, "b": 315.28894, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "Intelligence", "bbox": {"l": 328.78101, "t": 318.51886, "r": 371.02173, "b": 326.24792, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": ", 35(17):15137-15145, May 2021. 1", "bbox": {"l": 371.021, "t": 318.43817, "r": 502.26227, "b": 326.45413, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[19] Nikolaos Livathinos, Cesar Berrospi, Maksym Lysak, Viktor Kuropiatnyk, Ahmed Nassar, Andre Carvalho, Michele Dolfi, Christoph Auer, Kasper Dinkla, and Peter Staar. Robust pdf document conversion using recurrent neural networks. Proceedings of the AAAI Conference on Artificial Intelligence , 35(17):15137-15145, May 2021. 1"}, {"label": "list_item", "id": 18, "page_no": 8, "cluster": {"id": 18, "label": "list_item", "bbox": {"l": 308.862, "t": 329.88419, "r": 545.11609, "b": 370.77713, "coord_origin": "TOPLEFT"}, "confidence": 0.9027292728424072, "cells": [{"id": 140, "text": "[20]", "bbox": {"l": 308.862, "t": 329.88419, "r": 323.82672, "b": 337.90015, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "Rujiao Long, Wen Wang, Nan Xue, Feiyu Gao, Zhibo Yang,", "bbox": {"l": 326.07233, "t": 329.88419, "r": 545.10876, "b": 337.90015, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "Yongpan Wang, and Gui-Song Xia. Parsing table structures", "bbox": {"l": 328.78101, "t": 340.8432, "r": 545.11346, "b": 348.85916, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "in the wild. In", "bbox": {"l": 328.78101, "t": 351.80219000000005, "r": 382.7767, "b": 359.81815000000006, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "Proceedings of the IEEE/CVF International", "bbox": {"l": 385.54102, "t": 351.88287, "r": 545.11609, "b": 359.61194, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "Conference on Computer Vision", "bbox": {"l": 328.78101, "t": 362.84186, "r": 443.59579, "b": 370.57092, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": ", pages 944-952, 2021. 2", "bbox": {"l": 443.59399, "t": 362.76117, "r": 534.48645, "b": 370.77713, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[20] Rujiao Long, Wen Wang, Nan Xue, Feiyu Gao, Zhibo Yang, Yongpan Wang, and Gui-Song Xia. Parsing table structures in the wild. In Proceedings of the IEEE/CVF International Conference on Computer Vision , pages 944-952, 2021. 2"}, {"label": "list_item", "id": 21, "page_no": 8, "cluster": {"id": 21, "label": "list_item", "bbox": {"l": 308.862, "t": 374.20618, "r": 545.11346, "b": 437.01706, "coord_origin": "TOPLEFT"}, "confidence": 0.882714569568634, "cells": [{"id": 147, "text": "[21]", "bbox": {"l": 308.862, "t": 374.20618, "r": 324.60281, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "Shubham", "bbox": {"l": 326.96487, "t": 374.20618, "r": 362.6604, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "Singh", "bbox": {"l": 368.69479, "t": 374.20618, "r": 389.6134, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "Paliwal,", "bbox": {"l": 395.6478, "t": 374.20618, "r": 424.56445, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "D", "bbox": {"l": 431.5492899999999, "t": 374.20618, "r": 438.0230399999999, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "Vishwanath,", "bbox": {"l": 444.05743, "t": 374.20618, "r": 488.5038799999999, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "Rohit", "bbox": {"l": 495.47974, "t": 374.20618, "r": 515.41205, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "Rahul,", "bbox": {"l": 521.44641, "t": 374.20618, "r": 545.10876, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "Monika Sharma, and Lovekesh Vig. Tablenet: Deep learn-", "bbox": {"l": 328.78101, "t": 385.16516, "r": 545.1134, "b": 393.18112, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "ing model for end-to-end table detection and tabular data ex-", "bbox": {"l": 328.78101, "t": 396.12415, "r": 545.11346, "b": 404.14011, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "traction from scanned document images.", "bbox": {"l": 328.78101, "t": 407.08313, "r": 478.00881999999996, "b": 415.09909, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "In", "bbox": {"l": 484.0701, "t": 407.08313, "r": 491.53912, "b": 415.09909, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "2019 Interna-", "bbox": {"l": 494.668, "t": 407.16382, "r": 545.11298, "b": 414.89288, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "tional Conference on Document Analysis and Recognition", "bbox": {"l": 328.78101, "t": 418.12280000000004, "r": 545.11334, "b": 425.85187, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "(ICDAR)", "bbox": {"l": 328.78101, "t": 429.08179, "r": 360.83591, "b": 436.8108500000001, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": ", pages 128-133. IEEE, 2019. 1", "bbox": {"l": 360.836, "t": 429.0011, "r": 475.63287, "b": 437.01706, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[21] Shubham Singh Paliwal, D Vishwanath, Rohit Rahul, Monika Sharma, and Lovekesh Vig. Tablenet: Deep learning model for end-to-end table detection and tabular data extraction from scanned document images. In 2019 International Conference on Document Analysis and Recognition (ICDAR) , pages 128-133. IEEE, 2019. 1"}, {"label": "list_item", "id": 20, "page_no": 8, "cluster": {"id": 20, "label": "list_item", "bbox": {"l": 308.862, "t": 440.44611, "r": 545.11475, "b": 558.05096, "coord_origin": "TOPLEFT"}, "confidence": 0.8896440863609314, "cells": [{"id": 163, "text": "[22]", "bbox": {"l": 308.862, "t": 440.44611, "r": 324.57407, "b": 448.46207, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "Adam Paszke, Sam Gross, Francisco Massa, Adam Lerer,", "bbox": {"l": 326.93179, "t": 440.44611, "r": 545.1087, "b": 448.46207, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "James Bradbury, Gregory Chanan, Trevor Killeen, Zeming", "bbox": {"l": 328.78101, "t": 451.40509, "r": 545.11346, "b": 459.42105, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "Lin, Natalia Gimelshein, Luca Antiga, Alban Desmaison,", "bbox": {"l": 328.78101, "t": 462.36407, "r": 545.11328, "b": 470.38004, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "Andreas Kopf, Edward Yang, Zachary DeVito, Martin Rai-", "bbox": {"l": 328.78101, "t": 473.32306, "r": 545.11328, "b": 481.33902, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "son, Alykhan Tejani, Sasank Chilamkurthy, Benoit Steiner,", "bbox": {"l": 328.78101, "t": 484.28204, "r": 545.11328, "b": 492.298, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "Lu Fang, Junjie Bai, and Soumith Chintala. Pytorch: An im-", "bbox": {"l": 328.78101, "t": 495.24103, "r": 545.1134, "b": 503.25699, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "perative style, high-performance deep learning library. In H.", "bbox": {"l": 328.78101, "t": 506.20001, "r": 545.1134, "b": 514.21597, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "Wallach, H. Larochelle, A. Beygelzimer, F. d'Alch\u00b4e-Buc, E.", "bbox": {"l": 328.78101, "t": 517.159, "r": 545.1098, "b": 525.17496, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "Fox, and R. Garnett, editors,", "bbox": {"l": 328.78101, "t": 528.117, "r": 434.56659, "b": 536.13297, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "Advances in Neural Informa-", "bbox": {"l": 437.86401, "t": 528.19769, "r": 545.11115, "b": 535.9267600000001, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "tion Processing Systems 32", "bbox": {"l": 328.78101, "t": 539.15671, "r": 425.73471, "b": 546.8857399999999, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": ", pages 8024-8035. Curran Asso-", "bbox": {"l": 425.73602, "t": 539.076, "r": 545.11475, "b": 547.09196, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "ciates, Inc., 2019. 6", "bbox": {"l": 328.78101, "t": 550.035, "r": 399.74109, "b": 558.05096, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[22] Adam Paszke, Sam Gross, Francisco Massa, Adam Lerer, James Bradbury, Gregory Chanan, Trevor Killeen, Zeming Lin, Natalia Gimelshein, Luca Antiga, Alban Desmaison, Andreas Kopf, Edward Yang, Zachary DeVito, Martin Raison, Alykhan Tejani, Sasank Chilamkurthy, Benoit Steiner, Lu Fang, Junjie Bai, and Soumith Chintala. Pytorch: An imperative style, high-performance deep learning library. In H. Wallach, H. Larochelle, A. Beygelzimer, F. d'Alch\u00b4e-Buc, E. Fox, and R. Garnett, editors, Advances in Neural Information Processing Systems 32 , pages 8024-8035. Curran Associates, Inc., 2019. 6"}, {"label": "list_item", "id": 19, "page_no": 8, "cluster": {"id": 19, "label": "list_item", "bbox": {"l": 308.862, "t": 561.481, "r": 545.1134, "b": 624.29097, "coord_origin": "TOPLEFT"}, "confidence": 0.9025435447692871, "cells": [{"id": 177, "text": "[23]", "bbox": {"l": 308.862, "t": 561.481, "r": 324.50351, "b": 569.49696, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "Devashish Prasad, Ayan Gadpal, Kshitij Kapadni, Manish", "bbox": {"l": 326.85068, "t": 561.481, "r": 545.10876, "b": 569.49696, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "Visave, and Kavita Sultanpure. Cascadetabnet: An approach", "bbox": {"l": 328.78101, "t": 572.44, "r": 545.1134, "b": 580.45596, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "for end to end table detection and structure recognition from", "bbox": {"l": 328.78101, "t": 583.399, "r": 545.11334, "b": 591.4149600000001, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "image-based documents. In", "bbox": {"l": 328.78101, "t": 594.358, "r": 431.61667, "b": 602.37396, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "Proceedings of the IEEE/CVF", "bbox": {"l": 434.69101000000006, "t": 594.4387099999999, "r": 545.11224, "b": 602.16774, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "Conference on Computer Vision and Pattern Recognition", "bbox": {"l": 328.78101, "t": 605.39671, "r": 545.1134, "b": 613.12575, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "Workshops", "bbox": {"l": 328.78101, "t": 616.35571, "r": 367.8028, "b": 624.08475, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": ", pages 572-573, 2020. 1", "bbox": {"l": 367.802, "t": 616.2750100000001, "r": 458.69446000000005, "b": 624.29097, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[23] Devashish Prasad, Ayan Gadpal, Kshitij Kapadni, Manish Visave, and Kavita Sultanpure. Cascadetabnet: An approach for end to end table detection and structure recognition from image-based documents. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition Workshops , pages 572-573, 2020. 1"}, {"label": "list_item", "id": 23, "page_no": 8, "cluster": {"id": 23, "label": "list_item", "bbox": {"l": 308.862, "t": 627.72101, "r": 545.11621, "b": 668.61398, "coord_origin": "TOPLEFT"}, "confidence": 0.8777532577514648, "cells": [{"id": 186, "text": "[24]", "bbox": {"l": 308.862, "t": 627.72101, "r": 324.69476, "b": 635.73697, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "Shah Rukh Qasim, Hassan Mahmood, and Faisal Shafait.", "bbox": {"l": 327.07065, "t": 627.72101, "r": 545.1087, "b": 635.73697, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": "Rethinking table recognition using graph neural networks.", "bbox": {"l": 328.78101, "t": 638.68001, "r": 545.11328, "b": 646.69597, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "In", "bbox": {"l": 328.78101, "t": 649.63901, "r": 336.25003, "b": 657.65497, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "2019 International Conference on Document Analysis and", "bbox": {"l": 338.10001, "t": 649.71971, "r": 545.11621, "b": 657.44875, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "Recognition (ICDAR)", "bbox": {"l": 328.78101, "t": 660.67871, "r": 406.32245, "b": 668.40775, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": ", pages 142-147. IEEE, 2019. 3", "bbox": {"l": 406.32202, "t": 660.5980099999999, "r": 521.1189, "b": 668.61398, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[24] Shah Rukh Qasim, Hassan Mahmood, and Faisal Shafait. Rethinking table recognition using graph neural networks. In 2019 International Conference on Document Analysis and Recognition (ICDAR) , pages 142-147. IEEE, 2019. 3"}, {"label": "list_item", "id": 24, "page_no": 8, "cluster": {"id": 24, "label": "list_item", "bbox": {"l": 308.86203, "t": 672.04301, "r": 545.1134, "b": 712.935974, "coord_origin": "TOPLEFT"}, "confidence": 0.8654531240463257, "cells": [{"id": 193, "text": "[25]", "bbox": {"l": 308.86203, "t": 672.04301, "r": 324.71329, "b": 680.05898, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "Hamid Rezatofighi, Nathan Tsoi, JunYoung Gwak, Amir", "bbox": {"l": 327.09195, "t": 672.04301, "r": 545.10876, "b": 680.05898, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "Sadeghian, Ian Reid, and Silvio Savarese.", "bbox": {"l": 328.78104, "t": 683.0020099999999, "r": 482.81488, "b": 691.01797, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "Generalized in-", "bbox": {"l": 488.75064, "t": 683.0020099999999, "r": 545.1134, "b": 691.01797, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "tersection over union: A metric and a loss for bounding box", "bbox": {"l": 328.78104, "t": 693.961014, "r": 545.11334, "b": 701.976974, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "regression. In", "bbox": {"l": 328.78104, "t": 704.920013, "r": 379.1543, "b": 712.935974, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "Proceedings of the IEEE/CVF Conference on", "bbox": {"l": 381.61603, "t": 705.00071, "r": 545.10938, "b": 712.729744, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[25] Hamid Rezatofighi, Nathan Tsoi, JunYoung Gwak, Amir Sadeghian, Ian Reid, and Silvio Savarese. Generalized intersection over union: A metric and a loss for bounding box regression. In Proceedings of the IEEE/CVF Conference on"}, {"label": "page_footer", "id": 22, "page_no": 8, "cluster": {"id": 22, "label": "page_footer", "bbox": {"l": 295.12103, "t": 734.1325870000001, "r": 300.10233, "b": 743.0391500000001, "coord_origin": "TOPLEFT"}, "confidence": 0.8797808885574341, "cells": [{"id": 200, "text": "9", "bbox": {"l": 295.12103, "t": 734.1325870000001, "r": 300.10233, "b": 743.0391500000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "9"}], "body": [{"label": "list_item", "id": 25, "page_no": 8, "cluster": {"id": 25, "label": "list_item", "bbox": {"l": 70.030998, "t": 75.88378999999998, "r": 286.36334, "b": 116.77575999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.7310384511947632, "cells": [{"id": 0, "text": "end object detection with transformers. In Andrea Vedaldi,", "bbox": {"l": 70.030998, "t": 75.88378999999998, "r": 286.36334, "b": 83.89977999999996, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Horst Bischof, Thomas Brox, and Jan-Michael Frahm, edi-", "bbox": {"l": 70.030998, "t": 86.84276999999997, "r": 286.36331, "b": 94.85875999999996, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "tors,", "bbox": {"l": 70.030998, "t": 97.80078000000003, "r": 85.722198, "b": 105.81677000000002, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Computer Vision - ECCV 2020", "bbox": {"l": 87.889, "t": 97.88147000000004, "r": 199.93315, "b": 105.61053000000004, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": ", pages 213-229, Cham,", "bbox": {"l": 199.936, "t": 97.80078000000003, "r": 286.36313, "b": 105.81677000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "2020. Springer International Publishing. 5", "bbox": {"l": 70.031006, "t": 108.75977, "r": 221.94871999999998, "b": 116.77575999999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "end object detection with transformers. In Andrea Vedaldi, Horst Bischof, Thomas Brox, and Jan-Michael Frahm, editors, Computer Vision - ECCV 2020 , pages 213-229, Cham, 2020. Springer International Publishing. 5"}, {"label": "list_item", "id": 9, "page_no": 8, "cluster": {"id": 9, "label": "list_item", "bbox": {"l": 54.595005, "t": 120.03174000000013, "r": 286.36334, "b": 149.96569999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9372755885124207, "cells": [{"id": 6, "text": "[2]", "bbox": {"l": 54.595005, "t": 120.03174000000013, "r": 65.206657, "b": 128.04773, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Zewen Chi, Heyan Huang, Heng-Da Xu, Houjin Yu, Wanx-", "bbox": {"l": 67.481873, "t": 120.03174000000013, "r": 286.35852, "b": 128.04773, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "uan Yin, and Xian-Ling Mao.", "bbox": {"l": 70.031006, "t": 130.99072, "r": 179.67215, "b": 139.00671, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Complicated table structure", "bbox": {"l": 185.58101, "t": 130.99072, "r": 286.36334, "b": 139.00671, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "recognition.", "bbox": {"l": 70.031006, "t": 141.94970999999998, "r": 113.11456, "b": 149.96569999999997, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "arXiv preprint arXiv:1908.04729", "bbox": {"l": 116.34200999999999, "t": 142.0304, "r": 235.3082, "b": 149.75946, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": ", 2019. 3", "bbox": {"l": 235.30701, "t": 141.94970999999998, "r": 267.67572, "b": 149.96569999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[2] Zewen Chi, Heyan Huang, Heng-Da Xu, Houjin Yu, Wanxuan Yin, and Xian-Ling Mao. Complicated table structure recognition. arXiv preprint arXiv:1908.04729 , 2019. 3"}, {"label": "list_item", "id": 7, "page_no": 8, "cluster": {"id": 7, "label": "list_item", "bbox": {"l": 54.595001, "t": 153.22168, "r": 286.36301, "b": 183.15466000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9378374218940735, "cells": [{"id": 13, "text": "[3]", "bbox": {"l": 54.595001, "t": 153.22168, "r": 65.103195, "b": 161.23766999999998, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Bertrand Couasnon and Aurelie Lemaitre.", "bbox": {"l": 67.356239, "t": 153.22168, "r": 218.77876, "b": 161.23766999999998, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Recognition of Ta-", "bbox": {"l": 220.97999999999996, "t": 153.30237, "r": 286.36301, "b": 161.03143, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "bles and Forms", "bbox": {"l": 70.030991, "t": 164.26135, "r": 125.26401000000001, "b": 171.99041999999997, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": ", pages 647-677. Springer London, London,", "bbox": {"l": 125.26098999999999, "t": 164.18066, "r": 286.36029, "b": 172.19665999999995, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "2014. 2", "bbox": {"l": 70.030991, "t": 175.13867000000005, "r": 97.916496, "b": 183.15466000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[3] Bertrand Couasnon and Aurelie Lemaitre. Recognition of Tables and Forms , pages 647-677. Springer London, London, 2014. 2"}, {"label": "list_item", "id": 0, "page_no": 8, "cluster": {"id": 0, "label": "list_item", "bbox": {"l": 54.59499, "t": 186.41063999999994, "r": 286.36401, "b": 227.30358999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9648825526237488, "cells": [{"id": 19, "text": "[4]", "bbox": {"l": 54.59499, "t": 186.41063999999994, "r": 65.806984, "b": 194.42664000000002, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Herv\u00b4e D\u00b4ejean, Jean-Luc Meunier, Liangcai Gao, Yilun", "bbox": {"l": 68.210922, "t": 186.41063999999994, "r": 286.36401, "b": 194.42664000000002, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Huang, Yu Fang, Florian Kleber, and Eva-Maria Lang. IC-", "bbox": {"l": 70.030983, "t": 197.36963000000003, "r": 286.36331, "b": 205.38562000000002, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "DAR 2019 Competition on Table Detection and Recognition", "bbox": {"l": 70.030983, "t": 208.32861000000003, "r": 286.36334, "b": 216.3446, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "(cTDaR), Apr. 2019. http://sac.founderit.com/. 2", "bbox": {"l": 70.030983, "t": 219.2876, "r": 245.83519, "b": 227.30358999999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[4] Herv\u00b4e D\u00b4ejean, Jean-Luc Meunier, Liangcai Gao, Yilun Huang, Yu Fang, Florian Kleber, and Eva-Maria Lang. ICDAR 2019 Competition on Table Detection and Recognition (cTDaR), Apr. 2019. http://sac.founderit.com/. 2"}, {"label": "list_item", "id": 1, "page_no": 8, "cluster": {"id": 1, "label": "list_item", "bbox": {"l": 54.594982, "t": 230.55957, "r": 286.36334, "b": 271.45154, "coord_origin": "TOPLEFT"}, "confidence": 0.9620943069458008, "cells": [{"id": 24, "text": "[5]", "bbox": {"l": 54.594982, "t": 230.55957, "r": 65.381134, "b": 238.57556, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "Basilios Gatos, Dimitrios Danatsas, Ioannis Pratikakis, and", "bbox": {"l": 67.693779, "t": 230.55957, "r": 286.35849, "b": 238.57556, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "Stavros J Perantonis. Automatic table detection in document", "bbox": {"l": 70.030983, "t": 241.51855, "r": 286.36334, "b": 249.53454999999997, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "images. In", "bbox": {"l": 70.030983, "t": 252.47655999999995, "r": 108.39821, "b": 260.49255000000005, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "International Conference on Pattern Recognition", "bbox": {"l": 110.64498000000002, "t": 252.55724999999995, "r": 286.3595, "b": 260.28632000000005, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "and Image Analysis", "bbox": {"l": 70.030983, "t": 263.51624000000004, "r": 140.57861, "b": 271.24530000000004, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": ", pages 609-618. Springer, 2005. 2", "bbox": {"l": 140.57797, "t": 263.43555000000003, "r": 266.47522, "b": 271.45154, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[5] Basilios Gatos, Dimitrios Danatsas, Ioannis Pratikakis, and Stavros J Perantonis. Automatic table detection in document images. In International Conference on Pattern Recognition and Image Analysis , pages 609-618. Springer, 2005. 2"}, {"label": "list_item", "id": 2, "page_no": 8, "cluster": {"id": 2, "label": "list_item", "bbox": {"l": 54.594971, "t": 274.70758, "r": 286.36676, "b": 315.6004899999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9555517435073853, "cells": [{"id": 31, "text": "[6]", "bbox": {"l": 54.594971, "t": 274.70758, "r": 64.848648, "b": 282.72351, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Max G\u00a8obel, Tamir Hassan, Ermelinda Oro, and Giorgio Orsi.", "bbox": {"l": 67.047119, "t": 274.70758, "r": 286.36676, "b": 282.72351, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "Icdar 2013 table competition.", "bbox": {"l": 70.030975, "t": 285.66655999999995, "r": 179.57349, "b": 293.68253, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "In", "bbox": {"l": 187.01559, "t": 285.66655999999995, "r": 194.4846, "b": 293.68253, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "2013 12th International", "bbox": {"l": 198.04398, "t": 285.74725, "r": 286.36304, "b": 293.47632, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Conference on Document Analysis and Recognition", "bbox": {"l": 70.030975, "t": 296.70624, "r": 260.19937, "b": 304.43530000000004, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": ", pages", "bbox": {"l": 260.198, "t": 296.62555, "r": 286.36197, "b": 304.64151, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "1449-1453, 2013. 2", "bbox": {"l": 70.030991, "t": 307.5845299999999, "r": 142.74849, "b": 315.6004899999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[6] Max G\u00a8obel, Tamir Hassan, Ermelinda Oro, and Giorgio Orsi. Icdar 2013 table competition. In 2013 12th International Conference on Document Analysis and Recognition , pages 1449-1453, 2013. 2"}, {"label": "list_item", "id": 4, "page_no": 8, "cluster": {"id": 4, "label": "list_item", "bbox": {"l": 54.59499, "t": 318.85654, "r": 286.36319, "b": 348.78952, "coord_origin": "TOPLEFT"}, "confidence": 0.9479843378067017, "cells": [{"id": 39, "text": "[7]", "bbox": {"l": 54.59499, "t": 318.85654, "r": 65.61586, "b": 326.8725, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "EA Green and M Krishnamoorthy.", "bbox": {"l": 67.978821, "t": 318.85654, "r": 199.492, "b": 326.8725, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Recognition of tables", "bbox": {"l": 206.98792, "t": 318.85654, "r": 286.35849, "b": 326.8725, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "using table grammars. procs.", "bbox": {"l": 70.030991, "t": 329.8145400000001, "r": 176.28284, "b": 337.83051, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "In", "bbox": {"l": 182.60416, "t": 329.8145400000001, "r": 190.07317, "b": 337.83051, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "Symposium on Document", "bbox": {"l": 193.28299, "t": 329.89522999999997, "r": 286.36319, "b": 337.62429999999995, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Analysis and Recognition (SDAIR\u201995)", "bbox": {"l": 70.030991, "t": 340.85425, "r": 206.34717, "b": 348.58331, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": ", pages 261-277. 2", "bbox": {"l": 206.34599, "t": 340.77356, "r": 274.82239, "b": 348.78952, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[7] EA Green and M Krishnamoorthy. Recognition of tables using table grammars. procs. In Symposium on Document Analysis and Recognition (SDAIR'95) , pages 261-277. 2"}, {"label": "list_item", "id": 3, "page_no": 8, "cluster": {"id": 3, "label": "list_item", "bbox": {"l": 54.594986000000006, "t": 352.0455600000001, "r": 286.36331, "b": 403.89749, "coord_origin": "TOPLEFT"}, "confidence": 0.9484425187110901, "cells": [{"id": 47, "text": "[8]", "bbox": {"l": 54.594986000000006, "t": 352.0455600000001, "r": 65.04657, "b": 360.06152, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Khurram Azeem Hashmi, Alain Pagani, Marcus Liwicki, Di-", "bbox": {"l": 67.287483, "t": 352.0455600000001, "r": 286.35849, "b": 360.06152, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "dier Stricker, and Muhammad Zeshan Afzal.", "bbox": {"l": 70.030983, "t": 363.00458, "r": 234.12507999999997, "b": 371.02054, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Castabdetec-", "bbox": {"l": 240.05186, "t": 363.00458, "r": 286.36331, "b": 371.02054, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "tors: Cascade network for table detection in document im-", "bbox": {"l": 70.030983, "t": 373.96356, "r": 286.36331, "b": 381.97952, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "ages with recursive feature pyramid and switchable atrous", "bbox": {"l": 70.030983, "t": 384.92255, "r": 286.36331, "b": 392.93851, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "convolution.", "bbox": {"l": 70.030983, "t": 395.88153, "r": 114.57605, "b": 403.89749, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "Journal of Imaging", "bbox": {"l": 117.80399000000001, "t": 395.96222, "r": 186.7287, "b": 403.69128, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": ", 7(10), 2021. 1", "bbox": {"l": 186.728, "t": 395.88153, "r": 243.00113999999996, "b": 403.89749, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[8] Khurram Azeem Hashmi, Alain Pagani, Marcus Liwicki, Didier Stricker, and Muhammad Zeshan Afzal. Castabdetectors: Cascade network for table detection in document images with recursive feature pyramid and switchable atrous convolution. Journal of Imaging , 7(10), 2021. 1"}, {"label": "list_item", "id": 10, "page_no": 8, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 54.595001, "t": 407.15253000000007, "r": 286.35989, "b": 437.08646000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9330756664276123, "cells": [{"id": 56, "text": "[9]", "bbox": {"l": 54.595001, "t": 407.15253000000007, "r": 65.334427, "b": 415.1684900000001, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Kaiming He, Georgia Gkioxari, Piotr Dollar, and Ross Gir-", "bbox": {"l": 67.637054, "t": 407.15253000000007, "r": 286.35852, "b": 415.1684900000001, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "shick. Mask r-cnn. In", "bbox": {"l": 70.030998, "t": 418.11151, "r": 147.13306, "b": 426.12747, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Proceedings of the IEEE International", "bbox": {"l": 149.15601, "t": 418.1922, "r": 286.35989, "b": 425.92126, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Conference on Computer Vision (ICCV)", "bbox": {"l": 70.031006, "t": 429.15118, "r": 213.48445, "b": 436.88025, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": ", Oct 2017. 1", "bbox": {"l": 213.483, "t": 429.07050000000004, "r": 261.04083, "b": 437.08646000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[9] Kaiming He, Georgia Gkioxari, Piotr Dollar, and Ross Girshick. Mask r-cnn. In Proceedings of the IEEE International Conference on Computer Vision (ICCV) , Oct 2017. 1"}, {"label": "list_item", "id": 14, "page_no": 8, "cluster": {"id": 14, "label": "list_item", "bbox": {"l": 50.112, "t": 440.3424999999999, "r": 286.36334, "b": 481.23544, "coord_origin": "TOPLEFT"}, "confidence": 0.9274735450744629, "cells": [{"id": 62, "text": "[10]", "bbox": {"l": 50.112, "t": 440.3424999999999, "r": 65.399307, "b": 448.3584599999999, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "Yelin He, X. Qi, Jiaquan Ye, Peng Gao, Yihao Chen, Bing-", "bbox": {"l": 67.693321, "t": 440.3424999999999, "r": 286.3587, "b": 448.3584599999999, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "cong Li, Xin Tang, and Rong Xiao.", "bbox": {"l": 70.030998, "t": 451.30151, "r": 202.74268, "b": 459.31747, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "Pingan-vcgroup\u2019s so-", "bbox": {"l": 209.00122, "t": 451.30151, "r": 286.36331, "b": 459.31747, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "lution for icdar 2021 competition on scientific table image", "bbox": {"l": 70.030998, "t": 462.2605, "r": 286.36334, "b": 470.27646, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "recognition to latex.", "bbox": {"l": 70.030998, "t": 473.21948, "r": 141.86981, "b": 481.23544, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "ArXiv", "bbox": {"l": 145.097, "t": 473.30017, "r": 166.01561, "b": 481.02924, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": ", abs/2105.01846, 2021. 2", "bbox": {"l": 166.015, "t": 473.21948, "r": 259.90216, "b": 481.23544, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[10] Yelin He, X. Qi, Jiaquan Ye, Peng Gao, Yihao Chen, Bingcong Li, Xin Tang, and Rong Xiao. Pingan-vcgroup's solution for icdar 2021 competition on scientific table image recognition to latex. ArXiv , abs/2105.01846, 2021. 2"}, {"label": "list_item", "id": 11, "page_no": 8, "cluster": {"id": 11, "label": "list_item", "bbox": {"l": 50.112, "t": 484.49048, "r": 286.36331, "b": 536.34238, "coord_origin": "TOPLEFT"}, "confidence": 0.9299950003623962, "cells": [{"id": 70, "text": "[11]", "bbox": {"l": 50.112, "t": 484.49048, "r": 66.033806, "b": 492.50644, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Jianying Hu, Ramanujan S Kashi, Daniel P Lopresti, and", "bbox": {"l": 68.423035, "t": 484.49048, "r": 286.35873, "b": 492.50644, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "Gordon Wilfong. Medium-independent table detection. In", "bbox": {"l": 70.030998, "t": 495.44946, "r": 286.36331, "b": 503.46542, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "Document Recognition and Retrieval VII", "bbox": {"l": 70.030998, "t": 506.48914, "r": 227.40926, "b": 514.2182, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": ", volume 3967,", "bbox": {"l": 227.40500000000003, "t": 506.40845, "r": 286.35913, "b": 514.4244100000001, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "pages 291-302. International Society for Optics and Photon-", "bbox": {"l": 70.031006, "t": 517.36743, "r": 286.36328, "b": 525.38339, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "ics, 1999. 2", "bbox": {"l": 70.031006, "t": 528.32642, "r": 112.36138000000001, "b": 536.34238, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[11] Jianying Hu, Ramanujan S Kashi, Daniel P Lopresti, and Gordon Wilfong. Medium-independent table detection. In Document Recognition and Retrieval VII , volume 3967, pages 291-302. International Society for Optics and Photonics, 1999. 2"}, {"label": "list_item", "id": 5, "page_no": 8, "cluster": {"id": 5, "label": "list_item", "bbox": {"l": 50.112007, "t": 539.59842, "r": 286.36334, "b": 591.44937, "coord_origin": "TOPLEFT"}, "confidence": 0.9394103288650513, "cells": [{"id": 77, "text": "[12]", "bbox": {"l": 50.112007, "t": 539.59842, "r": 65.466705, "b": 547.61438, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "Matthew Hurst. A constraint-based approach to table struc-", "bbox": {"l": 67.770828, "t": 539.59842, "r": 286.35873, "b": 547.61438, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "ture derivation. In", "bbox": {"l": 70.031006, "t": 550.55742, "r": 136.28374, "b": 558.57338, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "Proceedings of the Seventh International", "bbox": {"l": 138.811, "t": 550.63812, "r": 286.36206, "b": 558.36716, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Conference on Document Analysis and Recognition - Volume", "bbox": {"l": 70.031006, "t": 561.5971199999999, "r": 286.36334, "b": 569.32616, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "2", "bbox": {"l": 70.031006, "t": 572.55612, "r": 74.514206, "b": 580.28516, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": ", ICDAR \u201903, page 911, USA, 2003. IEEE Computer Soci-", "bbox": {"l": 74.514008, "t": 572.47542, "r": 286.36313, "b": 580.4913799999999, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "ety. 2", "bbox": {"l": 70.031006, "t": 583.4334100000001, "r": 90.357834, "b": 591.44937, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[12] Matthew Hurst. A constraint-based approach to table structure derivation. In Proceedings of the Seventh International Conference on Document Analysis and Recognition - Volume 2 , ICDAR '03, page 911, USA, 2003. IEEE Computer Society. 2"}, {"label": "list_item", "id": 13, "page_no": 8, "cluster": {"id": 13, "label": "list_item", "bbox": {"l": 50.112007, "t": 594.70541, "r": 286.36331, "b": 646.55737, "coord_origin": "TOPLEFT"}, "confidence": 0.9298838973045349, "cells": [{"id": 85, "text": "[13]", "bbox": {"l": 50.112007, "t": 594.70541, "r": 66.270439, "b": 602.72137, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Thotreingam Kasar, Philippine Barlas, Sebastien Adam,", "bbox": {"l": 68.695168, "t": 594.70541, "r": 286.35873, "b": 602.72137, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Cl\u00b4ement Chatelain, and Thierry Paquet. Learning to detect", "bbox": {"l": 70.031006, "t": 605.66441, "r": 286.3631, "b": 613.68037, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "tables in scanned document images using line information.", "bbox": {"l": 70.031006, "t": 616.62341, "r": 286.36331, "b": 624.63937, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "In", "bbox": {"l": 70.031006, "t": 627.58241, "r": 77.500015, "b": 635.5983699999999, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "2013 12th International Conference on Document Analy-", "bbox": {"l": 79.920006, "t": 627.6631199999999, "r": 286.3624, "b": 635.39215, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "sis and Recognition", "bbox": {"l": 70.031006, "t": 638.62212, "r": 140.67728, "b": 646.35115, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": ", pages 1185-1189. IEEE, 2013. 2", "bbox": {"l": 140.67599, "t": 638.54141, "r": 264.43921, "b": 646.55737, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[13] Thotreingam Kasar, Philippine Barlas, Sebastien Adam, Cl\u00b4ement Chatelain, and Thierry Paquet. Learning to detect tables in scanned document images using line information. In 2013 12th International Conference on Document Analysis and Recognition , pages 1185-1189. IEEE, 2013. 2"}, {"label": "list_item", "id": 17, "page_no": 8, "cluster": {"id": 17, "label": "list_item", "bbox": {"l": 50.111992, "t": 649.81342, "r": 286.36334, "b": 679.74638, "coord_origin": "TOPLEFT"}, "confidence": 0.9115257263183594, "cells": [{"id": 93, "text": "[14]", "bbox": {"l": 50.111992, "t": 649.81342, "r": 66.534035, "b": 657.82938, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "Pratik Kayal, Mrinal Anand, Harsh Desai, and Mayank", "bbox": {"l": 68.998329, "t": 649.81342, "r": 286.35873, "b": 657.82938, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "Singh.", "bbox": {"l": 70.030991, "t": 660.77142, "r": 93.200165, "b": 668.78738, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "Icdar 2021 competition on scientific table image", "bbox": {"l": 102.20243, "t": 660.77142, "r": 286.36334, "b": 668.78738, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "recognition to latex, 2021. 2", "bbox": {"l": 70.030991, "t": 671.73042, "r": 171.9969, "b": 679.74638, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[14] Pratik Kayal, Mrinal Anand, Harsh Desai, and Mayank Singh. Icdar 2021 competition on scientific table image recognition to latex, 2021. 2"}, {"label": "list_item", "id": 16, "page_no": 8, "cluster": {"id": 16, "label": "list_item", "bbox": {"l": 50.111992, "t": 683.00243, "r": 286.35931, "b": 712.936386, "coord_origin": "TOPLEFT"}, "confidence": 0.912230372428894, "cells": [{"id": 98, "text": "[15]", "bbox": {"l": 50.111992, "t": 683.00243, "r": 65.515968, "b": 691.01839, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "Harold W Kuhn. The hungarian method for the assignment", "bbox": {"l": 67.827499, "t": 683.00243, "r": 286.3587, "b": 691.01839, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "problem.", "bbox": {"l": 70.030991, "t": 693.9614260000001, "r": 102.15761, "b": 701.977386, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "Naval research logistics quarterly", "bbox": {"l": 107.54999, "t": 694.0421220000001, "r": 231.47461, "b": 701.771156, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": ", 2(1-2):83-97,", "bbox": {"l": 231.47598, "t": 693.9614260000001, "r": 286.35931, "b": 701.977386, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "1955. 6", "bbox": {"l": 70.030975, "t": 704.920425, "r": 97.916481, "b": 712.936386, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[15] Harold W Kuhn. The hungarian method for the assignment problem. Naval research logistics quarterly , 2(1-2):83-97, 1955. 6"}, {"label": "list_item", "id": 6, "page_no": 8, "cluster": {"id": 6, "label": "list_item", "bbox": {"l": 308.86197, "t": 75.88342000000011, "r": 545.11475, "b": 138.69335999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.9389600157737732, "cells": [{"id": 104, "text": "[16]", "bbox": {"l": 308.86197, "t": 75.88342000000011, "r": 324.74973, "b": 83.89940999999999, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "Girish Kulkarni, Visruth Premraj, Vicente Ordonez, Sag-", "bbox": {"l": 327.13382, "t": 75.88342000000011, "r": 545.1087, "b": 83.89940999999999, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "nik Dhar, Siming Li, Yejin Choi, Alexander C. Berg, and", "bbox": {"l": 328.78098, "t": 86.84142999999995, "r": 545.1134, "b": 94.85741999999993, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "Tamara L. Berg.", "bbox": {"l": 328.78098, "t": 97.80042000000003, "r": 390.96295, "b": 105.81641000000002, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "Babytalk:", "bbox": {"l": 400.27008, "t": 97.80042000000003, "r": 435.1404099999999, "b": 105.81641000000002, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "Understanding and generat-", "bbox": {"l": 441.71277, "t": 97.80042000000003, "r": 545.11328, "b": 105.81641000000002, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "ing simple image descriptions.", "bbox": {"l": 328.78098, "t": 108.75940000000003, "r": 440.80719, "b": 116.7753899999999, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "IEEE Transactions on Pat-", "bbox": {"l": 446.63498, "t": 108.84009000000003, "r": 545.11304, "b": 116.56914999999992, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "tern Analysis and Machine Intelligence", "bbox": {"l": 328.78098, "t": 119.79907000000003, "r": 471.13153, "b": 127.52814000000001, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": ", 35(12):2891-2903,", "bbox": {"l": 471.13300000000004, "t": 119.71838000000002, "r": 545.11475, "b": 127.73437999999999, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "2013. 4", "bbox": {"l": 328.78101, "t": 130.67737, "r": 356.6665, "b": 138.69335999999998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[16] Girish Kulkarni, Visruth Premraj, Vicente Ordonez, Sagnik Dhar, Siming Li, Yejin Choi, Alexander C. Berg, and Tamara L. Berg. Babytalk: Understanding and generating simple image descriptions. IEEE Transactions on Pattern Analysis and Machine Intelligence , 35(12):2891-2903, 2013. 4"}, {"label": "list_item", "id": 15, "page_no": 8, "cluster": {"id": 15, "label": "list_item", "bbox": {"l": 308.862, "t": 142.12334999999996, "r": 545.1134, "b": 172.05633999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.9253129959106445, "cells": [{"id": 115, "text": "[17]", "bbox": {"l": 308.862, "t": 142.12334999999996, "r": 325.24371, "b": 150.13933999999995, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "Minghao Li, Lei Cui, Shaohan Huang, Furu Wei, Ming", "bbox": {"l": 327.70197, "t": 142.12334999999996, "r": 545.10883, "b": 150.13933999999995, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "Zhou, and Zhoujun Li.", "bbox": {"l": 328.78101, "t": 153.08136000000002, "r": 414.44598, "b": 161.09735, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "Tablebank: A benchmark dataset", "bbox": {"l": 421.82532, "t": 153.08136000000002, "r": 545.1134, "b": 161.09735, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "for table detection and recognition, 2019. 2, 3", "bbox": {"l": 328.78101, "t": 164.04034000000001, "r": 493.62835999999993, "b": 172.05633999999998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[17] Minghao Li, Lei Cui, Shaohan Huang, Furu Wei, Ming Zhou, and Zhoujun Li. Tablebank: A benchmark dataset for table detection and recognition, 2019. 2, 3"}, {"label": "list_item", "id": 12, "page_no": 8, "cluster": {"id": 12, "label": "list_item", "bbox": {"l": 308.862, "t": 175.48632999999995, "r": 545.11353, "b": 260.21423000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9299732446670532, "cells": [{"id": 120, "text": "[18]", "bbox": {"l": 308.862, "t": 175.48632999999995, "r": 324.26599, "b": 183.50232000000005, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "Yiren Li, Zheng Huang, Junchi Yan, Yi Zhou, Fan Ye, and", "bbox": {"l": 326.57751, "t": 175.48632999999995, "r": 545.10876, "b": 183.50232000000005, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Xianhui Liu. Gfte: Graph-based financial table extraction.", "bbox": {"l": 328.78101, "t": 186.44530999999995, "r": 545.11334, "b": 194.46130000000005, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "In Alberto Del Bimbo, Rita Cucchiara, Stan Sclaroff, Gio-", "bbox": {"l": 328.78101, "t": 197.40430000000003, "r": 545.11346, "b": 205.42029000000002, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "vanni Maria Farinella, Tao Mei, Marco Bertini, Hugo Jair", "bbox": {"l": 328.78101, "t": 208.36328000000003, "r": 545.11353, "b": 216.37927000000002, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "Escalante, and Roberto Vezzani, editors,", "bbox": {"l": 328.78101, "t": 219.32227, "r": 479.26413, "b": 227.33826, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "Pattern Recogni-", "bbox": {"l": 483.11902, "t": 219.40295000000003, "r": 545.11273, "b": 227.13202, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "tion. ICPR International Workshops and Challenges", "bbox": {"l": 328.78101, "t": 230.36095999999998, "r": 519.39771, "b": 238.09002999999996, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": ", pages", "bbox": {"l": 519.401, "t": 230.28026999999997, "r": 545.10767, "b": 238.29625999999996, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "644-658, Cham, 2021. Springer International Publishing. 2,", "bbox": {"l": 328.78101, "t": 241.23925999999994, "r": 545.11328, "b": 249.25525000000005, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "3", "bbox": {"l": 328.78101, "t": 252.19824000000006, "r": 333.26422, "b": 260.21423000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[18] Yiren Li, Zheng Huang, Junchi Yan, Yi Zhou, Fan Ye, and Xianhui Liu. Gfte: Graph-based financial table extraction. In Alberto Del Bimbo, Rita Cucchiara, Stan Sclaroff, Giovanni Maria Farinella, Tao Mei, Marco Bertini, Hugo Jair Escalante, and Roberto Vezzani, editors, Pattern Recognition. ICPR International Workshops and Challenges , pages 644-658, Cham, 2021. Springer International Publishing. 2, 3"}, {"label": "list_item", "id": 8, "page_no": 8, "cluster": {"id": 8, "label": "list_item", "bbox": {"l": 308.862, "t": 263.64423, "r": 545.1142, "b": 326.45413, "coord_origin": "TOPLEFT"}, "confidence": 0.937321662902832, "cells": [{"id": 131, "text": "[19]", "bbox": {"l": 308.862, "t": 263.64423, "r": 324.26477, "b": 271.66022, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "Nikolaos Livathinos, Cesar Berrospi, Maksym Lysak, Vik-", "bbox": {"l": 326.57611, "t": 263.64423, "r": 545.10883, "b": 271.66022, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "tor Kuropiatnyk, Ahmed Nassar, Andre Carvalho, Michele", "bbox": {"l": 328.78101, "t": 274.60321, "r": 545.1134, "b": 282.61917000000005, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "Dolfi, Christoph Auer, Kasper Dinkla, and Peter Staar. Ro-", "bbox": {"l": 328.78101, "t": 285.56219, "r": 545.11328, "b": 293.57816, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "bust pdf document conversion using recurrent neural net-", "bbox": {"l": 328.78101, "t": 296.52118, "r": 545.11334, "b": 304.53714, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "works.", "bbox": {"l": 328.78101, "t": 307.47919, "r": 352.84683, "b": 315.49515, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "Proceedings of the AAAI Conference on Artificial", "bbox": {"l": 360.23599, "t": 307.55988, "r": 545.1142, "b": 315.28894, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "Intelligence", "bbox": {"l": 328.78101, "t": 318.51886, "r": 371.02173, "b": 326.24792, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": ", 35(17):15137-15145, May 2021. 1", "bbox": {"l": 371.021, "t": 318.43817, "r": 502.26227, "b": 326.45413, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[19] Nikolaos Livathinos, Cesar Berrospi, Maksym Lysak, Viktor Kuropiatnyk, Ahmed Nassar, Andre Carvalho, Michele Dolfi, Christoph Auer, Kasper Dinkla, and Peter Staar. Robust pdf document conversion using recurrent neural networks. Proceedings of the AAAI Conference on Artificial Intelligence , 35(17):15137-15145, May 2021. 1"}, {"label": "list_item", "id": 18, "page_no": 8, "cluster": {"id": 18, "label": "list_item", "bbox": {"l": 308.862, "t": 329.88419, "r": 545.11609, "b": 370.77713, "coord_origin": "TOPLEFT"}, "confidence": 0.9027292728424072, "cells": [{"id": 140, "text": "[20]", "bbox": {"l": 308.862, "t": 329.88419, "r": 323.82672, "b": 337.90015, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "Rujiao Long, Wen Wang, Nan Xue, Feiyu Gao, Zhibo Yang,", "bbox": {"l": 326.07233, "t": 329.88419, "r": 545.10876, "b": 337.90015, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "Yongpan Wang, and Gui-Song Xia. Parsing table structures", "bbox": {"l": 328.78101, "t": 340.8432, "r": 545.11346, "b": 348.85916, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "in the wild. In", "bbox": {"l": 328.78101, "t": 351.80219000000005, "r": 382.7767, "b": 359.81815000000006, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "Proceedings of the IEEE/CVF International", "bbox": {"l": 385.54102, "t": 351.88287, "r": 545.11609, "b": 359.61194, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "Conference on Computer Vision", "bbox": {"l": 328.78101, "t": 362.84186, "r": 443.59579, "b": 370.57092, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": ", pages 944-952, 2021. 2", "bbox": {"l": 443.59399, "t": 362.76117, "r": 534.48645, "b": 370.77713, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[20] Rujiao Long, Wen Wang, Nan Xue, Feiyu Gao, Zhibo Yang, Yongpan Wang, and Gui-Song Xia. Parsing table structures in the wild. In Proceedings of the IEEE/CVF International Conference on Computer Vision , pages 944-952, 2021. 2"}, {"label": "list_item", "id": 21, "page_no": 8, "cluster": {"id": 21, "label": "list_item", "bbox": {"l": 308.862, "t": 374.20618, "r": 545.11346, "b": 437.01706, "coord_origin": "TOPLEFT"}, "confidence": 0.882714569568634, "cells": [{"id": 147, "text": "[21]", "bbox": {"l": 308.862, "t": 374.20618, "r": 324.60281, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "Shubham", "bbox": {"l": 326.96487, "t": 374.20618, "r": 362.6604, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "Singh", "bbox": {"l": 368.69479, "t": 374.20618, "r": 389.6134, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "Paliwal,", "bbox": {"l": 395.6478, "t": 374.20618, "r": 424.56445, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "D", "bbox": {"l": 431.5492899999999, "t": 374.20618, "r": 438.0230399999999, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "Vishwanath,", "bbox": {"l": 444.05743, "t": 374.20618, "r": 488.5038799999999, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "Rohit", "bbox": {"l": 495.47974, "t": 374.20618, "r": 515.41205, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "Rahul,", "bbox": {"l": 521.44641, "t": 374.20618, "r": 545.10876, "b": 382.22214, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "Monika Sharma, and Lovekesh Vig. Tablenet: Deep learn-", "bbox": {"l": 328.78101, "t": 385.16516, "r": 545.1134, "b": 393.18112, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "ing model for end-to-end table detection and tabular data ex-", "bbox": {"l": 328.78101, "t": 396.12415, "r": 545.11346, "b": 404.14011, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "traction from scanned document images.", "bbox": {"l": 328.78101, "t": 407.08313, "r": 478.00881999999996, "b": 415.09909, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "In", "bbox": {"l": 484.0701, "t": 407.08313, "r": 491.53912, "b": 415.09909, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "2019 Interna-", "bbox": {"l": 494.668, "t": 407.16382, "r": 545.11298, "b": 414.89288, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "tional Conference on Document Analysis and Recognition", "bbox": {"l": 328.78101, "t": 418.12280000000004, "r": 545.11334, "b": 425.85187, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "(ICDAR)", "bbox": {"l": 328.78101, "t": 429.08179, "r": 360.83591, "b": 436.8108500000001, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": ", pages 128-133. IEEE, 2019. 1", "bbox": {"l": 360.836, "t": 429.0011, "r": 475.63287, "b": 437.01706, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[21] Shubham Singh Paliwal, D Vishwanath, Rohit Rahul, Monika Sharma, and Lovekesh Vig. Tablenet: Deep learning model for end-to-end table detection and tabular data extraction from scanned document images. In 2019 International Conference on Document Analysis and Recognition (ICDAR) , pages 128-133. IEEE, 2019. 1"}, {"label": "list_item", "id": 20, "page_no": 8, "cluster": {"id": 20, "label": "list_item", "bbox": {"l": 308.862, "t": 440.44611, "r": 545.11475, "b": 558.05096, "coord_origin": "TOPLEFT"}, "confidence": 0.8896440863609314, "cells": [{"id": 163, "text": "[22]", "bbox": {"l": 308.862, "t": 440.44611, "r": 324.57407, "b": 448.46207, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "Adam Paszke, Sam Gross, Francisco Massa, Adam Lerer,", "bbox": {"l": 326.93179, "t": 440.44611, "r": 545.1087, "b": 448.46207, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "James Bradbury, Gregory Chanan, Trevor Killeen, Zeming", "bbox": {"l": 328.78101, "t": 451.40509, "r": 545.11346, "b": 459.42105, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "Lin, Natalia Gimelshein, Luca Antiga, Alban Desmaison,", "bbox": {"l": 328.78101, "t": 462.36407, "r": 545.11328, "b": 470.38004, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "Andreas Kopf, Edward Yang, Zachary DeVito, Martin Rai-", "bbox": {"l": 328.78101, "t": 473.32306, "r": 545.11328, "b": 481.33902, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "son, Alykhan Tejani, Sasank Chilamkurthy, Benoit Steiner,", "bbox": {"l": 328.78101, "t": 484.28204, "r": 545.11328, "b": 492.298, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "Lu Fang, Junjie Bai, and Soumith Chintala. Pytorch: An im-", "bbox": {"l": 328.78101, "t": 495.24103, "r": 545.1134, "b": 503.25699, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "perative style, high-performance deep learning library. In H.", "bbox": {"l": 328.78101, "t": 506.20001, "r": 545.1134, "b": 514.21597, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "Wallach, H. Larochelle, A. Beygelzimer, F. d'Alch\u00b4e-Buc, E.", "bbox": {"l": 328.78101, "t": 517.159, "r": 545.1098, "b": 525.17496, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "Fox, and R. Garnett, editors,", "bbox": {"l": 328.78101, "t": 528.117, "r": 434.56659, "b": 536.13297, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "Advances in Neural Informa-", "bbox": {"l": 437.86401, "t": 528.19769, "r": 545.11115, "b": 535.9267600000001, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "tion Processing Systems 32", "bbox": {"l": 328.78101, "t": 539.15671, "r": 425.73471, "b": 546.8857399999999, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": ", pages 8024-8035. Curran Asso-", "bbox": {"l": 425.73602, "t": 539.076, "r": 545.11475, "b": 547.09196, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "ciates, Inc., 2019. 6", "bbox": {"l": 328.78101, "t": 550.035, "r": 399.74109, "b": 558.05096, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[22] Adam Paszke, Sam Gross, Francisco Massa, Adam Lerer, James Bradbury, Gregory Chanan, Trevor Killeen, Zeming Lin, Natalia Gimelshein, Luca Antiga, Alban Desmaison, Andreas Kopf, Edward Yang, Zachary DeVito, Martin Raison, Alykhan Tejani, Sasank Chilamkurthy, Benoit Steiner, Lu Fang, Junjie Bai, and Soumith Chintala. Pytorch: An imperative style, high-performance deep learning library. In H. Wallach, H. Larochelle, A. Beygelzimer, F. d'Alch\u00b4e-Buc, E. Fox, and R. Garnett, editors, Advances in Neural Information Processing Systems 32 , pages 8024-8035. Curran Associates, Inc., 2019. 6"}, {"label": "list_item", "id": 19, "page_no": 8, "cluster": {"id": 19, "label": "list_item", "bbox": {"l": 308.862, "t": 561.481, "r": 545.1134, "b": 624.29097, "coord_origin": "TOPLEFT"}, "confidence": 0.9025435447692871, "cells": [{"id": 177, "text": "[23]", "bbox": {"l": 308.862, "t": 561.481, "r": 324.50351, "b": 569.49696, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "Devashish Prasad, Ayan Gadpal, Kshitij Kapadni, Manish", "bbox": {"l": 326.85068, "t": 561.481, "r": 545.10876, "b": 569.49696, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "Visave, and Kavita Sultanpure. Cascadetabnet: An approach", "bbox": {"l": 328.78101, "t": 572.44, "r": 545.1134, "b": 580.45596, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "for end to end table detection and structure recognition from", "bbox": {"l": 328.78101, "t": 583.399, "r": 545.11334, "b": 591.4149600000001, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "image-based documents. In", "bbox": {"l": 328.78101, "t": 594.358, "r": 431.61667, "b": 602.37396, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "Proceedings of the IEEE/CVF", "bbox": {"l": 434.69101000000006, "t": 594.4387099999999, "r": 545.11224, "b": 602.16774, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "Conference on Computer Vision and Pattern Recognition", "bbox": {"l": 328.78101, "t": 605.39671, "r": 545.1134, "b": 613.12575, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "Workshops", "bbox": {"l": 328.78101, "t": 616.35571, "r": 367.8028, "b": 624.08475, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": ", pages 572-573, 2020. 1", "bbox": {"l": 367.802, "t": 616.2750100000001, "r": 458.69446000000005, "b": 624.29097, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[23] Devashish Prasad, Ayan Gadpal, Kshitij Kapadni, Manish Visave, and Kavita Sultanpure. Cascadetabnet: An approach for end to end table detection and structure recognition from image-based documents. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition Workshops , pages 572-573, 2020. 1"}, {"label": "list_item", "id": 23, "page_no": 8, "cluster": {"id": 23, "label": "list_item", "bbox": {"l": 308.862, "t": 627.72101, "r": 545.11621, "b": 668.61398, "coord_origin": "TOPLEFT"}, "confidence": 0.8777532577514648, "cells": [{"id": 186, "text": "[24]", "bbox": {"l": 308.862, "t": 627.72101, "r": 324.69476, "b": 635.73697, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "Shah Rukh Qasim, Hassan Mahmood, and Faisal Shafait.", "bbox": {"l": 327.07065, "t": 627.72101, "r": 545.1087, "b": 635.73697, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": "Rethinking table recognition using graph neural networks.", "bbox": {"l": 328.78101, "t": 638.68001, "r": 545.11328, "b": 646.69597, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "In", "bbox": {"l": 328.78101, "t": 649.63901, "r": 336.25003, "b": 657.65497, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "2019 International Conference on Document Analysis and", "bbox": {"l": 338.10001, "t": 649.71971, "r": 545.11621, "b": 657.44875, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "Recognition (ICDAR)", "bbox": {"l": 328.78101, "t": 660.67871, "r": 406.32245, "b": 668.40775, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": ", pages 142-147. IEEE, 2019. 3", "bbox": {"l": 406.32202, "t": 660.5980099999999, "r": 521.1189, "b": 668.61398, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[24] Shah Rukh Qasim, Hassan Mahmood, and Faisal Shafait. Rethinking table recognition using graph neural networks. In 2019 International Conference on Document Analysis and Recognition (ICDAR) , pages 142-147. IEEE, 2019. 3"}, {"label": "list_item", "id": 24, "page_no": 8, "cluster": {"id": 24, "label": "list_item", "bbox": {"l": 308.86203, "t": 672.04301, "r": 545.1134, "b": 712.935974, "coord_origin": "TOPLEFT"}, "confidence": 0.8654531240463257, "cells": [{"id": 193, "text": "[25]", "bbox": {"l": 308.86203, "t": 672.04301, "r": 324.71329, "b": 680.05898, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "Hamid Rezatofighi, Nathan Tsoi, JunYoung Gwak, Amir", "bbox": {"l": 327.09195, "t": 672.04301, "r": 545.10876, "b": 680.05898, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "Sadeghian, Ian Reid, and Silvio Savarese.", "bbox": {"l": 328.78104, "t": 683.0020099999999, "r": 482.81488, "b": 691.01797, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "Generalized in-", "bbox": {"l": 488.75064, "t": 683.0020099999999, "r": 545.1134, "b": 691.01797, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "tersection over union: A metric and a loss for bounding box", "bbox": {"l": 328.78104, "t": 693.961014, "r": 545.11334, "b": 701.976974, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "regression. In", "bbox": {"l": 328.78104, "t": 704.920013, "r": 379.1543, "b": 712.935974, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "Proceedings of the IEEE/CVF Conference on", "bbox": {"l": 381.61603, "t": 705.00071, "r": 545.10938, "b": 712.729744, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[25] Hamid Rezatofighi, Nathan Tsoi, JunYoung Gwak, Amir Sadeghian, Ian Reid, and Silvio Savarese. Generalized intersection over union: A metric and a loss for bounding box regression. In Proceedings of the IEEE/CVF Conference on"}], "headers": [{"label": "page_footer", "id": 22, "page_no": 8, "cluster": {"id": 22, "label": "page_footer", "bbox": {"l": 295.12103, "t": 734.1325870000001, "r": 300.10233, "b": 743.0391500000001, "coord_origin": "TOPLEFT"}, "confidence": 0.8797808885574341, "cells": [{"id": 200, "text": "9", "bbox": {"l": 295.12103, "t": 734.1325870000001, "r": 300.10233, "b": 743.0391500000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "9"}]}}, {"page_no": 9, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "Computer Vision and Pattern Recognition", "bbox": {"l": 70.030998, "t": 75.96447999999998, "r": 223.58061, "b": 83.69353999999998, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": ", pages 658-666,", "bbox": {"l": 223.57901, "t": 75.88378999999998, "r": 286.36176, "b": 83.89977999999996, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "2019. 6", "bbox": {"l": 70.031006, "t": 86.84276999999997, "r": 97.916512, "b": 94.85875999999996, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "[26]", "bbox": {"l": 50.112007, "t": 98.16576999999995, "r": 65.534088, "b": 106.18176000000005, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Sebastian Schreiber, Stefan Agne, Ivo Wolf, Andreas Den-", "bbox": {"l": 67.84832, "t": 98.16576999999995, "r": 286.35867, "b": 106.18176000000005, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "gel, and Sheraz Ahmed. Deepdesrt: Deep learning for detec-", "bbox": {"l": 70.031006, "t": 109.12476000000004, "r": 286.36331, "b": 117.14075000000003, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "tion and structure recognition of tables in document images.", "bbox": {"l": 70.031006, "t": 120.08374000000003, "r": 286.36334, "b": 128.0997299999999, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "In", "bbox": {"l": 70.031006, "t": 131.04272000000003, "r": 77.500015, "b": 139.05872, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "2017 14th IAPR International Conference on Document", "bbox": {"l": 80.560005, "t": 131.12341000000004, "r": 286.36578, "b": 138.85248, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Analysis and Recognition (ICDAR)", "bbox": {"l": 70.031006, "t": 142.0824, "r": 195.22885, "b": 149.81146, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": ", volume 01, pages 1162-", "bbox": {"l": 195.231, "t": 142.00171, "r": 286.36548, "b": 150.0177, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "1167, 2017. 1", "bbox": {"l": 70.031006, "t": 152.96069, "r": 120.33251, "b": 160.97668, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "[27]", "bbox": {"l": 50.112007, "t": 164.28467, "r": 65.534088, "b": 172.30066, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Sebastian Schreiber, Stefan Agne, Ivo Wolf, Andreas Den-", "bbox": {"l": 67.84832, "t": 164.28467, "r": 286.35867, "b": 172.30066, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "gel, and Sheraz Ahmed. Deepdesrt: Deep learning for de-", "bbox": {"l": 70.031006, "t": 175.24365, "r": 286.36337, "b": 183.25964, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "tection and structure recognition of tables in document im-", "bbox": {"l": 70.031006, "t": 186.20263999999997, "r": 286.36334, "b": 194.21862999999996, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "ages. In", "bbox": {"l": 70.031006, "t": 197.16161999999997, "r": 101.33271, "b": 205.17760999999996, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "2017 14th IAPR international conference on doc-", "bbox": {"l": 104.33101, "t": 197.24230999999997, "r": 286.35791, "b": 204.97136999999998, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "ument analysis and recognition (ICDAR)", "bbox": {"l": 70.031006, "t": 208.20032000000003, "r": 220.48719999999997, "b": 215.92938000000004, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": ", volume 1, pages", "bbox": {"l": 220.48401000000004, "t": 208.11963000000003, "r": 286.36017, "b": 216.13562000000002, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "1162-1167. IEEE, 2017. 3", "bbox": {"l": 70.031006, "t": 219.07861000000003, "r": 166.65294, "b": 227.0946, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "[28]", "bbox": {"l": 50.112007, "t": 230.40259000000003, "r": 65.650383, "b": 238.41858000000002, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "Faisal Shafait and Ray Smith. Table detection in heteroge-", "bbox": {"l": 67.982063, "t": 230.40259000000003, "r": 286.3587, "b": 238.41858000000002, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "neous documents. In", "bbox": {"l": 70.031006, "t": 241.36157000000003, "r": 147.16895, "b": 249.37756000000002, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "Proceedings of the 9th IAPR Interna-", "bbox": {"l": 149.93301, "t": 241.44226000000003, "r": 286.36578, "b": 249.17133, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "tional Workshop on Document Analysis Systems", "bbox": {"l": 70.031013, "t": 252.40125, "r": 244.6875, "b": 260.13031, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": ", pages 65-", "bbox": {"l": 244.69101, "t": 252.32056, "r": 286.35791, "b": 260.33655, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "72, 2010. 2", "bbox": {"l": 70.031006, "t": 263.27954, "r": 111.36611, "b": 271.29553, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "[29]", "bbox": {"l": 50.112007, "t": 274.60357999999997, "r": 66.023834, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Shoaib", "bbox": {"l": 68.411568, "t": 274.60357999999997, "r": 94.944016, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Ahmed", "bbox": {"l": 100.8708, "t": 274.60357999999997, "r": 127.26788000000002, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Siddiqui,", "bbox": {"l": 133.19467, "t": 274.60357999999997, "r": 165.83237, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Imran", "bbox": {"l": 172.68269, "t": 274.60357999999997, "r": 194.09445, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "Ali", "bbox": {"l": 200.02124, "t": 274.60357999999997, "r": 211.4803, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Fateh,", "bbox": {"l": 217.40708999999998, "t": 274.60357999999997, "r": 239.43755, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "Syed", "bbox": {"l": 246.28787000000003, "t": 274.60357999999997, "r": 264.22067, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Tah-", "bbox": {"l": 270.14746, "t": 274.60357999999997, "r": 286.35873, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "seen Raza Rizvi, Andreas Dengel, and Sheraz Ahmed.", "bbox": {"l": 70.031006, "t": 285.56256, "r": 286.36331, "b": 293.57852, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "Deeptabstr: Deep learning based table structure recognition.", "bbox": {"l": 70.031006, "t": 296.52155, "r": 286.36331, "b": 304.53751, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "In", "bbox": {"l": 70.031006, "t": 307.48053, "r": 77.500015, "b": 315.49649, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "2019 International Conference on Document Analysis and", "bbox": {"l": 79.350006, "t": 307.56122, "r": 286.36627, "b": 315.29028, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Recognition (ICDAR)", "bbox": {"l": 70.031006, "t": 318.51923, "r": 147.57243, "b": 326.24829, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": ", pages 1403-1409. IEEE, 2019. 3", "bbox": {"l": 147.57201, "t": 318.43854, "r": 271.33521, "b": 326.4545, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "[30]", "bbox": {"l": 50.112007, "t": 329.76254, "r": 65.366135, "b": 337.7785, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "Peter W J Staar, Michele Dolfi, Christoph Auer, and Costas", "bbox": {"l": 67.655159, "t": 329.76254, "r": 286.3587, "b": 337.7785, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Bekas. Corpus conversion service: A machine learning plat-", "bbox": {"l": 70.031006, "t": 340.72156000000007, "r": 286.36334, "b": 348.7375200000001, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "form to ingest documents at scale.", "bbox": {"l": 70.031006, "t": 351.68054, "r": 198.82439, "b": 359.6965, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "In", "bbox": {"l": 206.06027, "t": 351.68054, "r": 213.52928, "b": 359.6965, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Proceedings of the", "bbox": {"l": 217.02101, "t": 351.76123, "r": 286.35815, "b": 359.4903, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "24th ACM SIGKDD", "bbox": {"l": 70.031006, "t": 362.72021, "r": 143.08028, "b": 370.44928, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": ", KDD \u201918, pages 774-782, New York,", "bbox": {"l": 143.078, "t": 362.63953000000004, "r": 286.36111, "b": 370.65549000000004, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "NY, USA, 2018. ACM. 1", "bbox": {"l": 70.031006, "t": 373.59851, "r": 161.15652, "b": 381.61447, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "[31]", "bbox": {"l": 50.112007, "t": 384.92252, "r": 65.140724, "b": 392.93848, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Ashish Vaswani, Noam Shazeer, Niki Parmar, Jakob Uszko-", "bbox": {"l": 67.395927, "t": 384.92252, "r": 286.35876, "b": 392.93848, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "reit, Llion Jones, Aidan N Gomez, \u0141 ukasz Kaiser, and Il-", "bbox": {"l": 70.031006, "t": 395.88153, "r": 286.36337, "b": 403.89749, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "lia Polosukhin.", "bbox": {"l": 70.031006, "t": 406.84052, "r": 125.47024999999998, "b": 414.85648, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Attention is all you need.", "bbox": {"l": 133.90764, "t": 406.84052, "r": 230.83444, "b": 414.85648, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "In I. Guyon,", "bbox": {"l": 239.27182, "t": 406.84052, "r": 286.36334, "b": 414.85648, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "U.", "bbox": {"l": 70.031006, "t": 417.7995, "r": 78.958366, "b": 425.81546, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "V. Luxburg, S. Bengio, H. Wallach, R. Fergus, S. Vish-", "bbox": {"l": 81.254494, "t": 417.7995, "r": 286.36334, "b": 425.81546, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "wanathan, and R. Garnett, editors,", "bbox": {"l": 70.031006, "t": 428.75751, "r": 196.7621, "b": 436.7734699999999, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "Advances in Neural In-", "bbox": {"l": 200.20201, "t": 428.8381999999999, "r": 286.36017, "b": 436.56726, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "formation Processing Systems 30", "bbox": {"l": 70.031006, "t": 439.79717999999997, "r": 189.19447, "b": 447.52624999999995, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": ", pages 5998-6008. Curran", "bbox": {"l": 189.19501, "t": 439.71648999999996, "r": 286.36389, "b": 447.73245, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "Associates, Inc., 2017. 5", "bbox": {"l": 70.031006, "t": 450.67548, "r": 158.9239, "b": 458.69144, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "[32]", "bbox": {"l": 50.112007, "t": 461.99948, "r": 65.910469, "b": 470.01544, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "Oriol Vinyals, Alexander Toshev, Samy Bengio, and Du-", "bbox": {"l": 68.281181, "t": 461.99948, "r": 286.35873, "b": 470.01544, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "mitru Erhan.", "bbox": {"l": 70.031006, "t": 472.9585, "r": 116.27969999999999, "b": 480.97446, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "Show and tell: A neural image caption gen-", "bbox": {"l": 122.48445, "t": 472.9585, "r": 286.36334, "b": 480.97446, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "erator. In", "bbox": {"l": 70.031006, "t": 483.91748, "r": 103.30532, "b": 491.93344, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "Proceedings of the IEEE Conference on Computer", "bbox": {"l": 105.51601, "t": 483.99817, "r": 286.35931, "b": 491.72723, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Vision and Pattern Recognition (CVPR)", "bbox": {"l": 70.031006, "t": 494.95715, "r": 212.51607, "b": 502.68622, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": ", June 2015. 2", "bbox": {"l": 212.51401, "t": 494.87646, "r": 263.55975, "b": 502.89243, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "[33]", "bbox": {"l": 50.112015, "t": 506.20047, "r": 65.682777, "b": 514.21643, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "Wenyuan Xue, Qingyong Li, and Dacheng Tao.", "bbox": {"l": 68.019325, "t": 506.20047, "r": 247.37280000000004, "b": 514.21643, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "Res2tim:", "bbox": {"l": 253.97208000000003, "t": 506.20047, "r": 286.3587, "b": 514.21643, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "reconstruct syntactic structures from table images. In", "bbox": {"l": 70.031013, "t": 517.15948, "r": 265.62408, "b": 525.17545, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "2019", "bbox": {"l": 268.42902, "t": 517.24017, "r": 286.36182, "b": 524.96924, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "International Conference on Document Analysis and Recog-", "bbox": {"l": 70.031021, "t": 528.19916, "r": 286.36337, "b": 535.92822, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "nition (ICDAR)", "bbox": {"l": 70.031021, "t": 539.15718, "r": 125.25507999999999, "b": 546.88622, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": ", pages 749-755. IEEE, 2019. 3", "bbox": {"l": 125.25402, "t": 539.07648, "r": 240.05083, "b": 547.09244, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "[34]", "bbox": {"l": 50.112022, "t": 550.40048, "r": 66.037048, "b": 558.41644, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "Wenyuan Xue, Baosheng Yu, Wen Wang, Dacheng Tao,", "bbox": {"l": 68.426765, "t": 550.40048, "r": 286.3587, "b": 558.41644, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "and Qingyong Li.", "bbox": {"l": 70.031021, "t": 561.35948, "r": 137.08176, "b": 569.37544, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "Tgrnet:", "bbox": {"l": 145.9854, "t": 561.35948, "r": 172.38248, "b": 569.37544, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "A table graph reconstruction", "bbox": {"l": 178.7038, "t": 561.35948, "r": 286.36337, "b": 569.37544, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "network for table structure recognition.", "bbox": {"l": 70.031021, "t": 572.31848, "r": 221.00723, "b": 580.33444, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "arXiv preprint", "bbox": {"l": 232.54300999999998, "t": 572.39919, "r": 286.35938, "b": 580.12822, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "arXiv:2106.10598", "bbox": {"l": 70.031021, "t": 583.35818, "r": 135.53058, "b": 591.08722, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": ", 2021. 3", "bbox": {"l": 135.53003, "t": 583.27748, "r": 167.89876, "b": 591.29344, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "[35]", "bbox": {"l": 50.11203, "t": 594.60149, "r": 65.23661, "b": 602.61745, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "Quanzeng You, Hailin Jin, Zhaowen Wang, Chen Fang, and", "bbox": {"l": 67.506203, "t": 594.60149, "r": 286.3587, "b": 602.61745, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Jiebo Luo.", "bbox": {"l": 70.031029, "t": 605.56049, "r": 109.1066, "b": 613.57645, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "Image captioning with semantic attention.", "bbox": {"l": 116.22592, "t": 605.56049, "r": 271.76605, "b": 613.57645, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "In", "bbox": {"l": 278.89435, "t": 605.56049, "r": 286.36337, "b": 613.57645, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "Proceedings of the IEEE conference on computer vision and", "bbox": {"l": 70.031029, "t": 616.60019, "r": 286.3634, "b": 624.32922, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "pattern recognition", "bbox": {"l": 70.031029, "t": 627.55919, "r": 139.09921, "b": 635.28822, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": ", pages 4651-4659, 2016. 4", "bbox": {"l": 139.09802, "t": 627.47849, "r": 238.95683, "b": 635.49445, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "[36]", "bbox": {"l": 50.112022, "t": 638.80249, "r": 65.203552, "b": 646.81845, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "Xinyi Zheng, Doug Burdick, Lucian Popa, Peter Zhong, and", "bbox": {"l": 67.468193, "t": 638.80249, "r": 286.35873, "b": 646.81845, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "Nancy Xin Ru Wang. Global table extractor (gte): A frame-", "bbox": {"l": 70.031021, "t": 649.7605, "r": 286.36337, "b": 657.77646, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "work for joint table identification and cell structure recogni-", "bbox": {"l": 70.031021, "t": 660.7195, "r": 286.36334, "b": 668.73547, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "tion using visual context.", "bbox": {"l": 70.031021, "t": 671.6785, "r": 158.45766, "b": 679.69447, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "Winter Conference for Applications", "bbox": {"l": 160.52802, "t": 671.7592, "r": 286.36249, "b": 679.48824, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "in Computer Vision (WACV)", "bbox": {"l": 70.031013, "t": 682.7182, "r": 171.42305, "b": 690.44724, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": ", 2021. 2, 3", "bbox": {"l": 171.42201, "t": 682.6375, "r": 212.75713, "b": 690.65347, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "[37]", "bbox": {"l": 50.112015, "t": 693.961502, "r": 66.506706, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "Xu", "bbox": {"l": 68.966896, "t": 693.961502, "r": 80.992294, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "Zhong,", "bbox": {"l": 89.062057, "t": 693.961502, "r": 114.71492999999998, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "Elaheh", "bbox": {"l": 124.24621000000002, "t": 693.961502, "r": 149.1459, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "ShafieiBavani,", "bbox": {"l": 157.22462, "t": 693.961502, "r": 209.37321, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "and", "bbox": {"l": 218.9045, "t": 693.961502, "r": 231.85196999999997, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "Antonio", "bbox": {"l": 239.93069, "t": 693.961502, "r": 269.32254, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "Ji-", "bbox": {"l": 277.3923, "t": 693.961502, "r": 286.3587, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "meno Yepes. Image-based table recognition: Data, model,", "bbox": {"l": 70.031013, "t": 704.920502, "r": 286.36334, "b": 712.936462, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "and evaluation. In Andrea Vedaldi, Horst Bischof, Thomas", "bbox": {"l": 328.78101, "t": 75.88347999999996, "r": 545.11346, "b": 83.89948000000015, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "Brox, and Jan-Michael Frahm, editors,", "bbox": {"l": 328.78101, "t": 86.84149000000002, "r": 472.30618, "b": 94.85748000000001, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "Computer Vision -", "bbox": {"l": 475.88501, "t": 86.92218000000003, "r": 545.11456, "b": 94.65125, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "ECCV 2020", "bbox": {"l": 328.78101, "t": 97.88116000000002, "r": 371.92734, "b": 105.61023, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": ", pages 564-580, Cham, 2020. Springer Interna-", "bbox": {"l": 371.92599, "t": 97.80048, "r": 545.11206, "b": 105.81646999999987, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "tional Publishing. 2, 3, 7", "bbox": {"l": 328.78101, "t": 108.75945999999999, "r": 417.70087, "b": 116.77544999999998, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "[38]", "bbox": {"l": 308.862, "t": 120.71447999999998, "r": 324.33197, "b": 128.73046999999997, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Xu Zhong, Jianbin Tang, and Antonio Jimeno Yepes. Pub-", "bbox": {"l": 326.65341, "t": 120.71447999999998, "r": 545.10876, "b": 128.73046999999997, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "laynet: Largest dataset ever for document layout analysis. In", "bbox": {"l": 328.78101, "t": 131.67345999999998, "r": 545.11334, "b": 139.68944999999997, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "2019 International Conference on Document Analysis and", "bbox": {"l": 328.78101, "t": 142.71312999999998, "r": 545.11328, "b": 150.44219999999996, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "Recognition (ICDAR)", "bbox": {"l": 328.78101, "t": 153.67211999999995, "r": 406.32245, "b": 161.40117999999995, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": ", pages 1015-1022, 2019. 1", "bbox": {"l": 406.32202, "t": 153.59142999999995, "r": 506.18085, "b": 161.60742000000005, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "10", "bbox": {"l": 292.63, "t": 734.1329920000001, "r": 302.59259, "b": 743.039555, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 15, "label": "text", "bbox": {"l": 70.030998, "t": 75.88378999999998, "r": 286.36176, "b": 94.85875999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.6886764168739319, "cells": [{"id": 0, "text": "Computer Vision and Pattern Recognition", "bbox": {"l": 70.030998, "t": 75.96447999999998, "r": 223.58061, "b": 83.69353999999998, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": ", pages 658-666,", "bbox": {"l": 223.57901, "t": 75.88378999999998, "r": 286.36176, "b": 83.89977999999996, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "2019. 6", "bbox": {"l": 70.031006, "t": 86.84276999999997, "r": 97.916512, "b": 94.85875999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "list_item", "bbox": {"l": 50.112007, "t": 98.16576999999995, "r": 286.36578, "b": 160.97668, "coord_origin": "TOPLEFT"}, "confidence": 0.7723011374473572, "cells": [{"id": 3, "text": "[26]", "bbox": {"l": 50.112007, "t": 98.16576999999995, "r": 65.534088, "b": 106.18176000000005, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Sebastian Schreiber, Stefan Agne, Ivo Wolf, Andreas Den-", "bbox": {"l": 67.84832, "t": 98.16576999999995, "r": 286.35867, "b": 106.18176000000005, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "gel, and Sheraz Ahmed. Deepdesrt: Deep learning for detec-", "bbox": {"l": 70.031006, "t": 109.12476000000004, "r": 286.36331, "b": 117.14075000000003, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "tion and structure recognition of tables in document images.", "bbox": {"l": 70.031006, "t": 120.08374000000003, "r": 286.36334, "b": 128.0997299999999, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "In", "bbox": {"l": 70.031006, "t": 131.04272000000003, "r": 77.500015, "b": 139.05872, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "2017 14th IAPR International Conference on Document", "bbox": {"l": 80.560005, "t": 131.12341000000004, "r": 286.36578, "b": 138.85248, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Analysis and Recognition (ICDAR)", "bbox": {"l": 70.031006, "t": 142.0824, "r": 195.22885, "b": 149.81146, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": ", volume 01, pages 1162-", "bbox": {"l": 195.231, "t": 142.00171, "r": 286.36548, "b": 150.0177, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "1167, 2017. 1", "bbox": {"l": 70.031006, "t": 152.96069, "r": 120.33251, "b": 160.97668, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "list_item", "bbox": {"l": 50.112007, "t": 164.28467, "r": 286.36337, "b": 227.0946, "coord_origin": "TOPLEFT"}, "confidence": 0.8580600619316101, "cells": [{"id": 12, "text": "[27]", "bbox": {"l": 50.112007, "t": 164.28467, "r": 65.534088, "b": 172.30066, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Sebastian Schreiber, Stefan Agne, Ivo Wolf, Andreas Den-", "bbox": {"l": 67.84832, "t": 164.28467, "r": 286.35867, "b": 172.30066, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "gel, and Sheraz Ahmed. Deepdesrt: Deep learning for de-", "bbox": {"l": 70.031006, "t": 175.24365, "r": 286.36337, "b": 183.25964, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "tection and structure recognition of tables in document im-", "bbox": {"l": 70.031006, "t": 186.20263999999997, "r": 286.36334, "b": 194.21862999999996, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "ages. In", "bbox": {"l": 70.031006, "t": 197.16161999999997, "r": 101.33271, "b": 205.17760999999996, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "2017 14th IAPR international conference on doc-", "bbox": {"l": 104.33101, "t": 197.24230999999997, "r": 286.35791, "b": 204.97136999999998, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "ument analysis and recognition (ICDAR)", "bbox": {"l": 70.031006, "t": 208.20032000000003, "r": 220.48719999999997, "b": 215.92938000000004, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": ", volume 1, pages", "bbox": {"l": 220.48401000000004, "t": 208.11963000000003, "r": 286.36017, "b": 216.13562000000002, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "1162-1167. IEEE, 2017. 3", "bbox": {"l": 70.031006, "t": 219.07861000000003, "r": 166.65294, "b": 227.0946, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "list_item", "bbox": {"l": 50.112007, "t": 230.40259000000003, "r": 286.36578, "b": 271.29553, "coord_origin": "TOPLEFT"}, "confidence": 0.8512731194496155, "cells": [{"id": 21, "text": "[28]", "bbox": {"l": 50.112007, "t": 230.40259000000003, "r": 65.650383, "b": 238.41858000000002, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "Faisal Shafait and Ray Smith. Table detection in heteroge-", "bbox": {"l": 67.982063, "t": 230.40259000000003, "r": 286.3587, "b": 238.41858000000002, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "neous documents. In", "bbox": {"l": 70.031006, "t": 241.36157000000003, "r": 147.16895, "b": 249.37756000000002, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "Proceedings of the 9th IAPR Interna-", "bbox": {"l": 149.93301, "t": 241.44226000000003, "r": 286.36578, "b": 249.17133, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "tional Workshop on Document Analysis Systems", "bbox": {"l": 70.031013, "t": 252.40125, "r": 244.6875, "b": 260.13031, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": ", pages 65-", "bbox": {"l": 244.69101, "t": 252.32056, "r": 286.35791, "b": 260.33655, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "72, 2010. 2", "bbox": {"l": 70.031006, "t": 263.27954, "r": 111.36611, "b": 271.29553, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "list_item", "bbox": {"l": 50.112007, "t": 274.60357999999997, "r": 286.36627, "b": 326.4545, "coord_origin": "TOPLEFT"}, "confidence": 0.8494512438774109, "cells": [{"id": 28, "text": "[29]", "bbox": {"l": 50.112007, "t": 274.60357999999997, "r": 66.023834, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Shoaib", "bbox": {"l": 68.411568, "t": 274.60357999999997, "r": 94.944016, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Ahmed", "bbox": {"l": 100.8708, "t": 274.60357999999997, "r": 127.26788000000002, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Siddiqui,", "bbox": {"l": 133.19467, "t": 274.60357999999997, "r": 165.83237, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Imran", "bbox": {"l": 172.68269, "t": 274.60357999999997, "r": 194.09445, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "Ali", "bbox": {"l": 200.02124, "t": 274.60357999999997, "r": 211.4803, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Fateh,", "bbox": {"l": 217.40708999999998, "t": 274.60357999999997, "r": 239.43755, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "Syed", "bbox": {"l": 246.28787000000003, "t": 274.60357999999997, "r": 264.22067, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Tah-", "bbox": {"l": 270.14746, "t": 274.60357999999997, "r": 286.35873, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "seen Raza Rizvi, Andreas Dengel, and Sheraz Ahmed.", "bbox": {"l": 70.031006, "t": 285.56256, "r": 286.36331, "b": 293.57852, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "Deeptabstr: Deep learning based table structure recognition.", "bbox": {"l": 70.031006, "t": 296.52155, "r": 286.36331, "b": 304.53751, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "In", "bbox": {"l": 70.031006, "t": 307.48053, "r": 77.500015, "b": 315.49649, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "2019 International Conference on Document Analysis and", "bbox": {"l": 79.350006, "t": 307.56122, "r": 286.36627, "b": 315.29028, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Recognition (ICDAR)", "bbox": {"l": 70.031006, "t": 318.51923, "r": 147.57243, "b": 326.24829, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": ", pages 1403-1409. IEEE, 2019. 3", "bbox": {"l": 147.57201, "t": 318.43854, "r": 271.33521, "b": 326.4545, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "list_item", "bbox": {"l": 50.112007, "t": 329.76254, "r": 286.36334, "b": 381.61447, "coord_origin": "TOPLEFT"}, "confidence": 0.8567671179771423, "cells": [{"id": 43, "text": "[30]", "bbox": {"l": 50.112007, "t": 329.76254, "r": 65.366135, "b": 337.7785, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "Peter W J Staar, Michele Dolfi, Christoph Auer, and Costas", "bbox": {"l": 67.655159, "t": 329.76254, "r": 286.3587, "b": 337.7785, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Bekas. Corpus conversion service: A machine learning plat-", "bbox": {"l": 70.031006, "t": 340.72156000000007, "r": 286.36334, "b": 348.7375200000001, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "form to ingest documents at scale.", "bbox": {"l": 70.031006, "t": 351.68054, "r": 198.82439, "b": 359.6965, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "In", "bbox": {"l": 206.06027, "t": 351.68054, "r": 213.52928, "b": 359.6965, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Proceedings of the", "bbox": {"l": 217.02101, "t": 351.76123, "r": 286.35815, "b": 359.4903, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "24th ACM SIGKDD", "bbox": {"l": 70.031006, "t": 362.72021, "r": 143.08028, "b": 370.44928, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": ", KDD \u201918, pages 774-782, New York,", "bbox": {"l": 143.078, "t": 362.63953000000004, "r": 286.36111, "b": 370.65549000000004, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "NY, USA, 2018. ACM. 1", "bbox": {"l": 70.031006, "t": 373.59851, "r": 161.15652, "b": 381.61447, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "list_item", "bbox": {"l": 50.112007, "t": 384.92252, "r": 286.36389, "b": 458.69144, "coord_origin": "TOPLEFT"}, "confidence": 0.8832162618637085, "cells": [{"id": 52, "text": "[31]", "bbox": {"l": 50.112007, "t": 384.92252, "r": 65.140724, "b": 392.93848, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Ashish Vaswani, Noam Shazeer, Niki Parmar, Jakob Uszko-", "bbox": {"l": 67.395927, "t": 384.92252, "r": 286.35876, "b": 392.93848, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "reit, Llion Jones, Aidan N Gomez, \u0141 ukasz Kaiser, and Il-", "bbox": {"l": 70.031006, "t": 395.88153, "r": 286.36337, "b": 403.89749, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "lia Polosukhin.", "bbox": {"l": 70.031006, "t": 406.84052, "r": 125.47024999999998, "b": 414.85648, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Attention is all you need.", "bbox": {"l": 133.90764, "t": 406.84052, "r": 230.83444, "b": 414.85648, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "In I. Guyon,", "bbox": {"l": 239.27182, "t": 406.84052, "r": 286.36334, "b": 414.85648, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "U.", "bbox": {"l": 70.031006, "t": 417.7995, "r": 78.958366, "b": 425.81546, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "V. Luxburg, S. Bengio, H. Wallach, R. Fergus, S. Vish-", "bbox": {"l": 81.254494, "t": 417.7995, "r": 286.36334, "b": 425.81546, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "wanathan, and R. Garnett, editors,", "bbox": {"l": 70.031006, "t": 428.75751, "r": 196.7621, "b": 436.7734699999999, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "Advances in Neural In-", "bbox": {"l": 200.20201, "t": 428.8381999999999, "r": 286.36017, "b": 436.56726, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "formation Processing Systems 30", "bbox": {"l": 70.031006, "t": 439.79717999999997, "r": 189.19447, "b": 447.52624999999995, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": ", pages 5998-6008. Curran", "bbox": {"l": 189.19501, "t": 439.71648999999996, "r": 286.36389, "b": 447.73245, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "Associates, Inc., 2017. 5", "bbox": {"l": 70.031006, "t": 450.67548, "r": 158.9239, "b": 458.69144, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "list_item", "bbox": {"l": 50.112007, "t": 461.99948, "r": 286.36334, "b": 502.89243, "coord_origin": "TOPLEFT"}, "confidence": 0.8431925177574158, "cells": [{"id": 65, "text": "[32]", "bbox": {"l": 50.112007, "t": 461.99948, "r": 65.910469, "b": 470.01544, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "Oriol Vinyals, Alexander Toshev, Samy Bengio, and Du-", "bbox": {"l": 68.281181, "t": 461.99948, "r": 286.35873, "b": 470.01544, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "mitru Erhan.", "bbox": {"l": 70.031006, "t": 472.9585, "r": 116.27969999999999, "b": 480.97446, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "Show and tell: A neural image caption gen-", "bbox": {"l": 122.48445, "t": 472.9585, "r": 286.36334, "b": 480.97446, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "erator. In", "bbox": {"l": 70.031006, "t": 483.91748, "r": 103.30532, "b": 491.93344, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "Proceedings of the IEEE Conference on Computer", "bbox": {"l": 105.51601, "t": 483.99817, "r": 286.35931, "b": 491.72723, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Vision and Pattern Recognition (CVPR)", "bbox": {"l": 70.031006, "t": 494.95715, "r": 212.51607, "b": 502.68622, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": ", June 2015. 2", "bbox": {"l": 212.51401, "t": 494.87646, "r": 263.55975, "b": 502.89243, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "list_item", "bbox": {"l": 50.112015, "t": 506.20047, "r": 286.36337, "b": 547.09244, "coord_origin": "TOPLEFT"}, "confidence": 0.8405635952949524, "cells": [{"id": 73, "text": "[33]", "bbox": {"l": 50.112015, "t": 506.20047, "r": 65.682777, "b": 514.21643, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "Wenyuan Xue, Qingyong Li, and Dacheng Tao.", "bbox": {"l": 68.019325, "t": 506.20047, "r": 247.37280000000004, "b": 514.21643, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "Res2tim:", "bbox": {"l": 253.97208000000003, "t": 506.20047, "r": 286.3587, "b": 514.21643, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "reconstruct syntactic structures from table images. In", "bbox": {"l": 70.031013, "t": 517.15948, "r": 265.62408, "b": 525.17545, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "2019", "bbox": {"l": 268.42902, "t": 517.24017, "r": 286.36182, "b": 524.96924, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "International Conference on Document Analysis and Recog-", "bbox": {"l": 70.031021, "t": 528.19916, "r": 286.36337, "b": 535.92822, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "nition (ICDAR)", "bbox": {"l": 70.031021, "t": 539.15718, "r": 125.25507999999999, "b": 546.88622, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": ", pages 749-755. IEEE, 2019. 3", "bbox": {"l": 125.25402, "t": 539.07648, "r": 240.05083, "b": 547.09244, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "list_item", "bbox": {"l": 50.112022, "t": 550.40048, "r": 286.36337, "b": 591.29344, "coord_origin": "TOPLEFT"}, "confidence": 0.8241521716117859, "cells": [{"id": 81, "text": "[34]", "bbox": {"l": 50.112022, "t": 550.40048, "r": 66.037048, "b": 558.41644, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "Wenyuan Xue, Baosheng Yu, Wen Wang, Dacheng Tao,", "bbox": {"l": 68.426765, "t": 550.40048, "r": 286.3587, "b": 558.41644, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "and Qingyong Li.", "bbox": {"l": 70.031021, "t": 561.35948, "r": 137.08176, "b": 569.37544, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "Tgrnet:", "bbox": {"l": 145.9854, "t": 561.35948, "r": 172.38248, "b": 569.37544, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "A table graph reconstruction", "bbox": {"l": 178.7038, "t": 561.35948, "r": 286.36337, "b": 569.37544, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "network for table structure recognition.", "bbox": {"l": 70.031021, "t": 572.31848, "r": 221.00723, "b": 580.33444, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "arXiv preprint", "bbox": {"l": 232.54300999999998, "t": 572.39919, "r": 286.35938, "b": 580.12822, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "arXiv:2106.10598", "bbox": {"l": 70.031021, "t": 583.35818, "r": 135.53058, "b": 591.08722, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": ", 2021. 3", "bbox": {"l": 135.53003, "t": 583.27748, "r": 167.89876, "b": 591.29344, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "list_item", "bbox": {"l": 50.11203, "t": 594.60149, "r": 286.3634, "b": 635.49445, "coord_origin": "TOPLEFT"}, "confidence": 0.8360886573791504, "cells": [{"id": 90, "text": "[35]", "bbox": {"l": 50.11203, "t": 594.60149, "r": 65.23661, "b": 602.61745, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "Quanzeng You, Hailin Jin, Zhaowen Wang, Chen Fang, and", "bbox": {"l": 67.506203, "t": 594.60149, "r": 286.3587, "b": 602.61745, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Jiebo Luo.", "bbox": {"l": 70.031029, "t": 605.56049, "r": 109.1066, "b": 613.57645, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "Image captioning with semantic attention.", "bbox": {"l": 116.22592, "t": 605.56049, "r": 271.76605, "b": 613.57645, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "In", "bbox": {"l": 278.89435, "t": 605.56049, "r": 286.36337, "b": 613.57645, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "Proceedings of the IEEE conference on computer vision and", "bbox": {"l": 70.031029, "t": 616.60019, "r": 286.3634, "b": 624.32922, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "pattern recognition", "bbox": {"l": 70.031029, "t": 627.55919, "r": 139.09921, "b": 635.28822, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": ", pages 4651-4659, 2016. 4", "bbox": {"l": 139.09802, "t": 627.47849, "r": 238.95683, "b": 635.49445, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "list_item", "bbox": {"l": 50.112022, "t": 638.80249, "r": 286.36337, "b": 690.65347, "coord_origin": "TOPLEFT"}, "confidence": 0.8079474568367004, "cells": [{"id": 98, "text": "[36]", "bbox": {"l": 50.112022, "t": 638.80249, "r": 65.203552, "b": 646.81845, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "Xinyi Zheng, Doug Burdick, Lucian Popa, Peter Zhong, and", "bbox": {"l": 67.468193, "t": 638.80249, "r": 286.35873, "b": 646.81845, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "Nancy Xin Ru Wang. Global table extractor (gte): A frame-", "bbox": {"l": 70.031021, "t": 649.7605, "r": 286.36337, "b": 657.77646, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "work for joint table identification and cell structure recogni-", "bbox": {"l": 70.031021, "t": 660.7195, "r": 286.36334, "b": 668.73547, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "tion using visual context.", "bbox": {"l": 70.031021, "t": 671.6785, "r": 158.45766, "b": 679.69447, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "Winter Conference for Applications", "bbox": {"l": 160.52802, "t": 671.7592, "r": 286.36249, "b": 679.48824, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "in Computer Vision (WACV)", "bbox": {"l": 70.031013, "t": 682.7182, "r": 171.42305, "b": 690.44724, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": ", 2021. 2, 3", "bbox": {"l": 171.42201, "t": 682.6375, "r": 212.75713, "b": 690.65347, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "list_item", "bbox": {"l": 50.112015, "t": 693.961502, "r": 286.36334, "b": 712.936462, "coord_origin": "TOPLEFT"}, "confidence": 0.8385783433914185, "cells": [{"id": 106, "text": "[37]", "bbox": {"l": 50.112015, "t": 693.961502, "r": 66.506706, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "Xu", "bbox": {"l": 68.966896, "t": 693.961502, "r": 80.992294, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "Zhong,", "bbox": {"l": 89.062057, "t": 693.961502, "r": 114.71492999999998, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "Elaheh", "bbox": {"l": 124.24621000000002, "t": 693.961502, "r": 149.1459, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "ShafieiBavani,", "bbox": {"l": 157.22462, "t": 693.961502, "r": 209.37321, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "and", "bbox": {"l": 218.9045, "t": 693.961502, "r": 231.85196999999997, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "Antonio", "bbox": {"l": 239.93069, "t": 693.961502, "r": 269.32254, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "Ji-", "bbox": {"l": 277.3923, "t": 693.961502, "r": 286.3587, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "meno Yepes. Image-based table recognition: Data, model,", "bbox": {"l": 70.031013, "t": 704.920502, "r": 286.36334, "b": 712.936462, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "list_item", "bbox": {"l": 328.78101, "t": 75.88347999999996, "r": 545.11456, "b": 116.77544999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.7556979060173035, "cells": [{"id": 115, "text": "and evaluation. In Andrea Vedaldi, Horst Bischof, Thomas", "bbox": {"l": 328.78101, "t": 75.88347999999996, "r": 545.11346, "b": 83.89948000000015, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "Brox, and Jan-Michael Frahm, editors,", "bbox": {"l": 328.78101, "t": 86.84149000000002, "r": 472.30618, "b": 94.85748000000001, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "Computer Vision -", "bbox": {"l": 475.88501, "t": 86.92218000000003, "r": 545.11456, "b": 94.65125, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "ECCV 2020", "bbox": {"l": 328.78101, "t": 97.88116000000002, "r": 371.92734, "b": 105.61023, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": ", pages 564-580, Cham, 2020. Springer Interna-", "bbox": {"l": 371.92599, "t": 97.80048, "r": 545.11206, "b": 105.81646999999987, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "tional Publishing. 2, 3, 7", "bbox": {"l": 328.78101, "t": 108.75945999999999, "r": 417.70087, "b": 116.77544999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "list_item", "bbox": {"l": 308.862, "t": 120.71447999999998, "r": 545.11334, "b": 161.60742000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.8375797271728516, "cells": [{"id": 121, "text": "[38]", "bbox": {"l": 308.862, "t": 120.71447999999998, "r": 324.33197, "b": 128.73046999999997, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Xu Zhong, Jianbin Tang, and Antonio Jimeno Yepes. Pub-", "bbox": {"l": 326.65341, "t": 120.71447999999998, "r": 545.10876, "b": 128.73046999999997, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "laynet: Largest dataset ever for document layout analysis. In", "bbox": {"l": 328.78101, "t": 131.67345999999998, "r": 545.11334, "b": 139.68944999999997, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "2019 International Conference on Document Analysis and", "bbox": {"l": 328.78101, "t": 142.71312999999998, "r": 545.11328, "b": 150.44219999999996, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "Recognition (ICDAR)", "bbox": {"l": 328.78101, "t": 153.67211999999995, "r": 406.32245, "b": 161.40117999999995, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": ", pages 1015-1022, 2019. 1", "bbox": {"l": 406.32202, "t": 153.59142999999995, "r": 506.18085, "b": 161.60742000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "page_footer", "bbox": {"l": 292.63, "t": 734.1329920000001, "r": 302.59259, "b": 743.039555, "coord_origin": "TOPLEFT"}, "confidence": 0.9069584012031555, "cells": [{"id": 127, "text": "10", "bbox": {"l": 292.63, "t": 734.1329920000001, "r": 302.59259, "b": 743.039555, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "text", "id": 15, "page_no": 9, "cluster": {"id": 15, "label": "text", "bbox": {"l": 70.030998, "t": 75.88378999999998, "r": 286.36176, "b": 94.85875999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.6886764168739319, "cells": [{"id": 0, "text": "Computer Vision and Pattern Recognition", "bbox": {"l": 70.030998, "t": 75.96447999999998, "r": 223.58061, "b": 83.69353999999998, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": ", pages 658-666,", "bbox": {"l": 223.57901, "t": 75.88378999999998, "r": 286.36176, "b": 83.89977999999996, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "2019. 6", "bbox": {"l": 70.031006, "t": 86.84276999999997, "r": 97.916512, "b": 94.85875999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Computer Vision and Pattern Recognition , pages 658-666, 2019. 6"}, {"label": "list_item", "id": 13, "page_no": 9, "cluster": {"id": 13, "label": "list_item", "bbox": {"l": 50.112007, "t": 98.16576999999995, "r": 286.36578, "b": 160.97668, "coord_origin": "TOPLEFT"}, "confidence": 0.7723011374473572, "cells": [{"id": 3, "text": "[26]", "bbox": {"l": 50.112007, "t": 98.16576999999995, "r": 65.534088, "b": 106.18176000000005, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Sebastian Schreiber, Stefan Agne, Ivo Wolf, Andreas Den-", "bbox": {"l": 67.84832, "t": 98.16576999999995, "r": 286.35867, "b": 106.18176000000005, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "gel, and Sheraz Ahmed. Deepdesrt: Deep learning for detec-", "bbox": {"l": 70.031006, "t": 109.12476000000004, "r": 286.36331, "b": 117.14075000000003, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "tion and structure recognition of tables in document images.", "bbox": {"l": 70.031006, "t": 120.08374000000003, "r": 286.36334, "b": 128.0997299999999, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "In", "bbox": {"l": 70.031006, "t": 131.04272000000003, "r": 77.500015, "b": 139.05872, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "2017 14th IAPR International Conference on Document", "bbox": {"l": 80.560005, "t": 131.12341000000004, "r": 286.36578, "b": 138.85248, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Analysis and Recognition (ICDAR)", "bbox": {"l": 70.031006, "t": 142.0824, "r": 195.22885, "b": 149.81146, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": ", volume 01, pages 1162-", "bbox": {"l": 195.231, "t": 142.00171, "r": 286.36548, "b": 150.0177, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "1167, 2017. 1", "bbox": {"l": 70.031006, "t": 152.96069, "r": 120.33251, "b": 160.97668, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[26] Sebastian Schreiber, Stefan Agne, Ivo Wolf, Andreas Dengel, and Sheraz Ahmed. Deepdesrt: Deep learning for detection and structure recognition of tables in document images. In 2017 14th IAPR International Conference on Document Analysis and Recognition (ICDAR) , volume 01, pages 11621167, 2017. 1"}, {"label": "list_item", "id": 2, "page_no": 9, "cluster": {"id": 2, "label": "list_item", "bbox": {"l": 50.112007, "t": 164.28467, "r": 286.36337, "b": 227.0946, "coord_origin": "TOPLEFT"}, "confidence": 0.8580600619316101, "cells": [{"id": 12, "text": "[27]", "bbox": {"l": 50.112007, "t": 164.28467, "r": 65.534088, "b": 172.30066, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Sebastian Schreiber, Stefan Agne, Ivo Wolf, Andreas Den-", "bbox": {"l": 67.84832, "t": 164.28467, "r": 286.35867, "b": 172.30066, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "gel, and Sheraz Ahmed. Deepdesrt: Deep learning for de-", "bbox": {"l": 70.031006, "t": 175.24365, "r": 286.36337, "b": 183.25964, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "tection and structure recognition of tables in document im-", "bbox": {"l": 70.031006, "t": 186.20263999999997, "r": 286.36334, "b": 194.21862999999996, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "ages. In", "bbox": {"l": 70.031006, "t": 197.16161999999997, "r": 101.33271, "b": 205.17760999999996, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "2017 14th IAPR international conference on doc-", "bbox": {"l": 104.33101, "t": 197.24230999999997, "r": 286.35791, "b": 204.97136999999998, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "ument analysis and recognition (ICDAR)", "bbox": {"l": 70.031006, "t": 208.20032000000003, "r": 220.48719999999997, "b": 215.92938000000004, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": ", volume 1, pages", "bbox": {"l": 220.48401000000004, "t": 208.11963000000003, "r": 286.36017, "b": 216.13562000000002, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "1162-1167. IEEE, 2017. 3", "bbox": {"l": 70.031006, "t": 219.07861000000003, "r": 166.65294, "b": 227.0946, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[27] Sebastian Schreiber, Stefan Agne, Ivo Wolf, Andreas Dengel, and Sheraz Ahmed. Deepdesrt: Deep learning for detection and structure recognition of tables in document images. In 2017 14th IAPR international conference on document analysis and recognition (ICDAR) , volume 1, pages 1162-1167. IEEE, 2017. 3"}, {"label": "list_item", "id": 4, "page_no": 9, "cluster": {"id": 4, "label": "list_item", "bbox": {"l": 50.112007, "t": 230.40259000000003, "r": 286.36578, "b": 271.29553, "coord_origin": "TOPLEFT"}, "confidence": 0.8512731194496155, "cells": [{"id": 21, "text": "[28]", "bbox": {"l": 50.112007, "t": 230.40259000000003, "r": 65.650383, "b": 238.41858000000002, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "Faisal Shafait and Ray Smith. Table detection in heteroge-", "bbox": {"l": 67.982063, "t": 230.40259000000003, "r": 286.3587, "b": 238.41858000000002, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "neous documents. In", "bbox": {"l": 70.031006, "t": 241.36157000000003, "r": 147.16895, "b": 249.37756000000002, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "Proceedings of the 9th IAPR Interna-", "bbox": {"l": 149.93301, "t": 241.44226000000003, "r": 286.36578, "b": 249.17133, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "tional Workshop on Document Analysis Systems", "bbox": {"l": 70.031013, "t": 252.40125, "r": 244.6875, "b": 260.13031, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": ", pages 65-", "bbox": {"l": 244.69101, "t": 252.32056, "r": 286.35791, "b": 260.33655, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "72, 2010. 2", "bbox": {"l": 70.031006, "t": 263.27954, "r": 111.36611, "b": 271.29553, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[28] Faisal Shafait and Ray Smith. Table detection in heterogeneous documents. In Proceedings of the 9th IAPR International Workshop on Document Analysis Systems , pages 6572, 2010. 2"}, {"label": "list_item", "id": 5, "page_no": 9, "cluster": {"id": 5, "label": "list_item", "bbox": {"l": 50.112007, "t": 274.60357999999997, "r": 286.36627, "b": 326.4545, "coord_origin": "TOPLEFT"}, "confidence": 0.8494512438774109, "cells": [{"id": 28, "text": "[29]", "bbox": {"l": 50.112007, "t": 274.60357999999997, "r": 66.023834, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Shoaib", "bbox": {"l": 68.411568, "t": 274.60357999999997, "r": 94.944016, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Ahmed", "bbox": {"l": 100.8708, "t": 274.60357999999997, "r": 127.26788000000002, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Siddiqui,", "bbox": {"l": 133.19467, "t": 274.60357999999997, "r": 165.83237, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Imran", "bbox": {"l": 172.68269, "t": 274.60357999999997, "r": 194.09445, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "Ali", "bbox": {"l": 200.02124, "t": 274.60357999999997, "r": 211.4803, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Fateh,", "bbox": {"l": 217.40708999999998, "t": 274.60357999999997, "r": 239.43755, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "Syed", "bbox": {"l": 246.28787000000003, "t": 274.60357999999997, "r": 264.22067, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Tah-", "bbox": {"l": 270.14746, "t": 274.60357999999997, "r": 286.35873, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "seen Raza Rizvi, Andreas Dengel, and Sheraz Ahmed.", "bbox": {"l": 70.031006, "t": 285.56256, "r": 286.36331, "b": 293.57852, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "Deeptabstr: Deep learning based table structure recognition.", "bbox": {"l": 70.031006, "t": 296.52155, "r": 286.36331, "b": 304.53751, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "In", "bbox": {"l": 70.031006, "t": 307.48053, "r": 77.500015, "b": 315.49649, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "2019 International Conference on Document Analysis and", "bbox": {"l": 79.350006, "t": 307.56122, "r": 286.36627, "b": 315.29028, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Recognition (ICDAR)", "bbox": {"l": 70.031006, "t": 318.51923, "r": 147.57243, "b": 326.24829, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": ", pages 1403-1409. IEEE, 2019. 3", "bbox": {"l": 147.57201, "t": 318.43854, "r": 271.33521, "b": 326.4545, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[29] Shoaib Ahmed Siddiqui, Imran Ali Fateh, Syed Tahseen Raza Rizvi, Andreas Dengel, and Sheraz Ahmed. Deeptabstr: Deep learning based table structure recognition. In 2019 International Conference on Document Analysis and Recognition (ICDAR) , pages 1403-1409. IEEE, 2019. 3"}, {"label": "list_item", "id": 3, "page_no": 9, "cluster": {"id": 3, "label": "list_item", "bbox": {"l": 50.112007, "t": 329.76254, "r": 286.36334, "b": 381.61447, "coord_origin": "TOPLEFT"}, "confidence": 0.8567671179771423, "cells": [{"id": 43, "text": "[30]", "bbox": {"l": 50.112007, "t": 329.76254, "r": 65.366135, "b": 337.7785, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "Peter W J Staar, Michele Dolfi, Christoph Auer, and Costas", "bbox": {"l": 67.655159, "t": 329.76254, "r": 286.3587, "b": 337.7785, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Bekas. Corpus conversion service: A machine learning plat-", "bbox": {"l": 70.031006, "t": 340.72156000000007, "r": 286.36334, "b": 348.7375200000001, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "form to ingest documents at scale.", "bbox": {"l": 70.031006, "t": 351.68054, "r": 198.82439, "b": 359.6965, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "In", "bbox": {"l": 206.06027, "t": 351.68054, "r": 213.52928, "b": 359.6965, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Proceedings of the", "bbox": {"l": 217.02101, "t": 351.76123, "r": 286.35815, "b": 359.4903, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "24th ACM SIGKDD", "bbox": {"l": 70.031006, "t": 362.72021, "r": 143.08028, "b": 370.44928, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": ", KDD \u201918, pages 774-782, New York,", "bbox": {"l": 143.078, "t": 362.63953000000004, "r": 286.36111, "b": 370.65549000000004, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "NY, USA, 2018. ACM. 1", "bbox": {"l": 70.031006, "t": 373.59851, "r": 161.15652, "b": 381.61447, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[30] Peter W J Staar, Michele Dolfi, Christoph Auer, and Costas Bekas. Corpus conversion service: A machine learning platform to ingest documents at scale. In Proceedings of the 24th ACM SIGKDD , KDD '18, pages 774-782, New York, NY, USA, 2018. ACM. 1"}, {"label": "list_item", "id": 1, "page_no": 9, "cluster": {"id": 1, "label": "list_item", "bbox": {"l": 50.112007, "t": 384.92252, "r": 286.36389, "b": 458.69144, "coord_origin": "TOPLEFT"}, "confidence": 0.8832162618637085, "cells": [{"id": 52, "text": "[31]", "bbox": {"l": 50.112007, "t": 384.92252, "r": 65.140724, "b": 392.93848, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Ashish Vaswani, Noam Shazeer, Niki Parmar, Jakob Uszko-", "bbox": {"l": 67.395927, "t": 384.92252, "r": 286.35876, "b": 392.93848, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "reit, Llion Jones, Aidan N Gomez, \u0141 ukasz Kaiser, and Il-", "bbox": {"l": 70.031006, "t": 395.88153, "r": 286.36337, "b": 403.89749, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "lia Polosukhin.", "bbox": {"l": 70.031006, "t": 406.84052, "r": 125.47024999999998, "b": 414.85648, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Attention is all you need.", "bbox": {"l": 133.90764, "t": 406.84052, "r": 230.83444, "b": 414.85648, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "In I. Guyon,", "bbox": {"l": 239.27182, "t": 406.84052, "r": 286.36334, "b": 414.85648, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "U.", "bbox": {"l": 70.031006, "t": 417.7995, "r": 78.958366, "b": 425.81546, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "V. Luxburg, S. Bengio, H. Wallach, R. Fergus, S. Vish-", "bbox": {"l": 81.254494, "t": 417.7995, "r": 286.36334, "b": 425.81546, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "wanathan, and R. Garnett, editors,", "bbox": {"l": 70.031006, "t": 428.75751, "r": 196.7621, "b": 436.7734699999999, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "Advances in Neural In-", "bbox": {"l": 200.20201, "t": 428.8381999999999, "r": 286.36017, "b": 436.56726, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "formation Processing Systems 30", "bbox": {"l": 70.031006, "t": 439.79717999999997, "r": 189.19447, "b": 447.52624999999995, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": ", pages 5998-6008. Curran", "bbox": {"l": 189.19501, "t": 439.71648999999996, "r": 286.36389, "b": 447.73245, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "Associates, Inc., 2017. 5", "bbox": {"l": 70.031006, "t": 450.67548, "r": 158.9239, "b": 458.69144, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[31] Ashish Vaswani, Noam Shazeer, Niki Parmar, Jakob Uszkoreit, Llion Jones, Aidan N Gomez, \u0141 ukasz Kaiser, and Illia Polosukhin. Attention is all you need. In I. Guyon, U. V. Luxburg, S. Bengio, H. Wallach, R. Fergus, S. Vishwanathan, and R. Garnett, editors, Advances in Neural Information Processing Systems 30 , pages 5998-6008. Curran Associates, Inc., 2017. 5"}, {"label": "list_item", "id": 6, "page_no": 9, "cluster": {"id": 6, "label": "list_item", "bbox": {"l": 50.112007, "t": 461.99948, "r": 286.36334, "b": 502.89243, "coord_origin": "TOPLEFT"}, "confidence": 0.8431925177574158, "cells": [{"id": 65, "text": "[32]", "bbox": {"l": 50.112007, "t": 461.99948, "r": 65.910469, "b": 470.01544, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "Oriol Vinyals, Alexander Toshev, Samy Bengio, and Du-", "bbox": {"l": 68.281181, "t": 461.99948, "r": 286.35873, "b": 470.01544, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "mitru Erhan.", "bbox": {"l": 70.031006, "t": 472.9585, "r": 116.27969999999999, "b": 480.97446, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "Show and tell: A neural image caption gen-", "bbox": {"l": 122.48445, "t": 472.9585, "r": 286.36334, "b": 480.97446, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "erator. In", "bbox": {"l": 70.031006, "t": 483.91748, "r": 103.30532, "b": 491.93344, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "Proceedings of the IEEE Conference on Computer", "bbox": {"l": 105.51601, "t": 483.99817, "r": 286.35931, "b": 491.72723, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Vision and Pattern Recognition (CVPR)", "bbox": {"l": 70.031006, "t": 494.95715, "r": 212.51607, "b": 502.68622, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": ", June 2015. 2", "bbox": {"l": 212.51401, "t": 494.87646, "r": 263.55975, "b": 502.89243, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[32] Oriol Vinyals, Alexander Toshev, Samy Bengio, and Dumitru Erhan. Show and tell: A neural image caption generator. In Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR) , June 2015. 2"}, {"label": "list_item", "id": 7, "page_no": 9, "cluster": {"id": 7, "label": "list_item", "bbox": {"l": 50.112015, "t": 506.20047, "r": 286.36337, "b": 547.09244, "coord_origin": "TOPLEFT"}, "confidence": 0.8405635952949524, "cells": [{"id": 73, "text": "[33]", "bbox": {"l": 50.112015, "t": 506.20047, "r": 65.682777, "b": 514.21643, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "Wenyuan Xue, Qingyong Li, and Dacheng Tao.", "bbox": {"l": 68.019325, "t": 506.20047, "r": 247.37280000000004, "b": 514.21643, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "Res2tim:", "bbox": {"l": 253.97208000000003, "t": 506.20047, "r": 286.3587, "b": 514.21643, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "reconstruct syntactic structures from table images. In", "bbox": {"l": 70.031013, "t": 517.15948, "r": 265.62408, "b": 525.17545, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "2019", "bbox": {"l": 268.42902, "t": 517.24017, "r": 286.36182, "b": 524.96924, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "International Conference on Document Analysis and Recog-", "bbox": {"l": 70.031021, "t": 528.19916, "r": 286.36337, "b": 535.92822, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "nition (ICDAR)", "bbox": {"l": 70.031021, "t": 539.15718, "r": 125.25507999999999, "b": 546.88622, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": ", pages 749-755. IEEE, 2019. 3", "bbox": {"l": 125.25402, "t": 539.07648, "r": 240.05083, "b": 547.09244, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[33] Wenyuan Xue, Qingyong Li, and Dacheng Tao. Res2tim: reconstruct syntactic structures from table images. In 2019 International Conference on Document Analysis and Recognition (ICDAR) , pages 749-755. IEEE, 2019. 3"}, {"label": "list_item", "id": 11, "page_no": 9, "cluster": {"id": 11, "label": "list_item", "bbox": {"l": 50.112022, "t": 550.40048, "r": 286.36337, "b": 591.29344, "coord_origin": "TOPLEFT"}, "confidence": 0.8241521716117859, "cells": [{"id": 81, "text": "[34]", "bbox": {"l": 50.112022, "t": 550.40048, "r": 66.037048, "b": 558.41644, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "Wenyuan Xue, Baosheng Yu, Wen Wang, Dacheng Tao,", "bbox": {"l": 68.426765, "t": 550.40048, "r": 286.3587, "b": 558.41644, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "and Qingyong Li.", "bbox": {"l": 70.031021, "t": 561.35948, "r": 137.08176, "b": 569.37544, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "Tgrnet:", "bbox": {"l": 145.9854, "t": 561.35948, "r": 172.38248, "b": 569.37544, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "A table graph reconstruction", "bbox": {"l": 178.7038, "t": 561.35948, "r": 286.36337, "b": 569.37544, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "network for table structure recognition.", "bbox": {"l": 70.031021, "t": 572.31848, "r": 221.00723, "b": 580.33444, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "arXiv preprint", "bbox": {"l": 232.54300999999998, "t": 572.39919, "r": 286.35938, "b": 580.12822, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "arXiv:2106.10598", "bbox": {"l": 70.031021, "t": 583.35818, "r": 135.53058, "b": 591.08722, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": ", 2021. 3", "bbox": {"l": 135.53003, "t": 583.27748, "r": 167.89876, "b": 591.29344, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[34] Wenyuan Xue, Baosheng Yu, Wen Wang, Dacheng Tao, and Qingyong Li. Tgrnet: A table graph reconstruction network for table structure recognition. arXiv preprint arXiv:2106.10598 , 2021. 3"}, {"label": "list_item", "id": 10, "page_no": 9, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 50.11203, "t": 594.60149, "r": 286.3634, "b": 635.49445, "coord_origin": "TOPLEFT"}, "confidence": 0.8360886573791504, "cells": [{"id": 90, "text": "[35]", "bbox": {"l": 50.11203, "t": 594.60149, "r": 65.23661, "b": 602.61745, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "Quanzeng You, Hailin Jin, Zhaowen Wang, Chen Fang, and", "bbox": {"l": 67.506203, "t": 594.60149, "r": 286.3587, "b": 602.61745, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Jiebo Luo.", "bbox": {"l": 70.031029, "t": 605.56049, "r": 109.1066, "b": 613.57645, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "Image captioning with semantic attention.", "bbox": {"l": 116.22592, "t": 605.56049, "r": 271.76605, "b": 613.57645, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "In", "bbox": {"l": 278.89435, "t": 605.56049, "r": 286.36337, "b": 613.57645, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "Proceedings of the IEEE conference on computer vision and", "bbox": {"l": 70.031029, "t": 616.60019, "r": 286.3634, "b": 624.32922, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "pattern recognition", "bbox": {"l": 70.031029, "t": 627.55919, "r": 139.09921, "b": 635.28822, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": ", pages 4651-4659, 2016. 4", "bbox": {"l": 139.09802, "t": 627.47849, "r": 238.95683, "b": 635.49445, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[35] Quanzeng You, Hailin Jin, Zhaowen Wang, Chen Fang, and Jiebo Luo. Image captioning with semantic attention. In Proceedings of the IEEE conference on computer vision and pattern recognition , pages 4651-4659, 2016. 4"}, {"label": "list_item", "id": 12, "page_no": 9, "cluster": {"id": 12, "label": "list_item", "bbox": {"l": 50.112022, "t": 638.80249, "r": 286.36337, "b": 690.65347, "coord_origin": "TOPLEFT"}, "confidence": 0.8079474568367004, "cells": [{"id": 98, "text": "[36]", "bbox": {"l": 50.112022, "t": 638.80249, "r": 65.203552, "b": 646.81845, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "Xinyi Zheng, Doug Burdick, Lucian Popa, Peter Zhong, and", "bbox": {"l": 67.468193, "t": 638.80249, "r": 286.35873, "b": 646.81845, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "Nancy Xin Ru Wang. Global table extractor (gte): A frame-", "bbox": {"l": 70.031021, "t": 649.7605, "r": 286.36337, "b": 657.77646, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "work for joint table identification and cell structure recogni-", "bbox": {"l": 70.031021, "t": 660.7195, "r": 286.36334, "b": 668.73547, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "tion using visual context.", "bbox": {"l": 70.031021, "t": 671.6785, "r": 158.45766, "b": 679.69447, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "Winter Conference for Applications", "bbox": {"l": 160.52802, "t": 671.7592, "r": 286.36249, "b": 679.48824, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "in Computer Vision (WACV)", "bbox": {"l": 70.031013, "t": 682.7182, "r": 171.42305, "b": 690.44724, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": ", 2021. 2, 3", "bbox": {"l": 171.42201, "t": 682.6375, "r": 212.75713, "b": 690.65347, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[36] Xinyi Zheng, Doug Burdick, Lucian Popa, Peter Zhong, and Nancy Xin Ru Wang. Global table extractor (gte): A framework for joint table identification and cell structure recognition using visual context. Winter Conference for Applications in Computer Vision (WACV) , 2021. 2, 3"}, {"label": "list_item", "id": 8, "page_no": 9, "cluster": {"id": 8, "label": "list_item", "bbox": {"l": 50.112015, "t": 693.961502, "r": 286.36334, "b": 712.936462, "coord_origin": "TOPLEFT"}, "confidence": 0.8385783433914185, "cells": [{"id": 106, "text": "[37]", "bbox": {"l": 50.112015, "t": 693.961502, "r": 66.506706, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "Xu", "bbox": {"l": 68.966896, "t": 693.961502, "r": 80.992294, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "Zhong,", "bbox": {"l": 89.062057, "t": 693.961502, "r": 114.71492999999998, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "Elaheh", "bbox": {"l": 124.24621000000002, "t": 693.961502, "r": 149.1459, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "ShafieiBavani,", "bbox": {"l": 157.22462, "t": 693.961502, "r": 209.37321, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "and", "bbox": {"l": 218.9045, "t": 693.961502, "r": 231.85196999999997, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "Antonio", "bbox": {"l": 239.93069, "t": 693.961502, "r": 269.32254, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "Ji-", "bbox": {"l": 277.3923, "t": 693.961502, "r": 286.3587, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "meno Yepes. Image-based table recognition: Data, model,", "bbox": {"l": 70.031013, "t": 704.920502, "r": 286.36334, "b": 712.936462, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[37] Xu Zhong, Elaheh ShafieiBavani, and Antonio Jimeno Yepes. Image-based table recognition: Data, model,"}, {"label": "list_item", "id": 14, "page_no": 9, "cluster": {"id": 14, "label": "list_item", "bbox": {"l": 328.78101, "t": 75.88347999999996, "r": 545.11456, "b": 116.77544999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.7556979060173035, "cells": [{"id": 115, "text": "and evaluation. In Andrea Vedaldi, Horst Bischof, Thomas", "bbox": {"l": 328.78101, "t": 75.88347999999996, "r": 545.11346, "b": 83.89948000000015, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "Brox, and Jan-Michael Frahm, editors,", "bbox": {"l": 328.78101, "t": 86.84149000000002, "r": 472.30618, "b": 94.85748000000001, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "Computer Vision -", "bbox": {"l": 475.88501, "t": 86.92218000000003, "r": 545.11456, "b": 94.65125, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "ECCV 2020", "bbox": {"l": 328.78101, "t": 97.88116000000002, "r": 371.92734, "b": 105.61023, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": ", pages 564-580, Cham, 2020. Springer Interna-", "bbox": {"l": 371.92599, "t": 97.80048, "r": 545.11206, "b": 105.81646999999987, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "tional Publishing. 2, 3, 7", "bbox": {"l": 328.78101, "t": 108.75945999999999, "r": 417.70087, "b": 116.77544999999998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "and evaluation. In Andrea Vedaldi, Horst Bischof, Thomas Brox, and Jan-Michael Frahm, editors, Computer Vision ECCV 2020 , pages 564-580, Cham, 2020. Springer International Publishing. 2, 3, 7"}, {"label": "list_item", "id": 9, "page_no": 9, "cluster": {"id": 9, "label": "list_item", "bbox": {"l": 308.862, "t": 120.71447999999998, "r": 545.11334, "b": 161.60742000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.8375797271728516, "cells": [{"id": 121, "text": "[38]", "bbox": {"l": 308.862, "t": 120.71447999999998, "r": 324.33197, "b": 128.73046999999997, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Xu Zhong, Jianbin Tang, and Antonio Jimeno Yepes. Pub-", "bbox": {"l": 326.65341, "t": 120.71447999999998, "r": 545.10876, "b": 128.73046999999997, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "laynet: Largest dataset ever for document layout analysis. In", "bbox": {"l": 328.78101, "t": 131.67345999999998, "r": 545.11334, "b": 139.68944999999997, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "2019 International Conference on Document Analysis and", "bbox": {"l": 328.78101, "t": 142.71312999999998, "r": 545.11328, "b": 150.44219999999996, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "Recognition (ICDAR)", "bbox": {"l": 328.78101, "t": 153.67211999999995, "r": 406.32245, "b": 161.40117999999995, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": ", pages 1015-1022, 2019. 1", "bbox": {"l": 406.32202, "t": 153.59142999999995, "r": 506.18085, "b": 161.60742000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[38] Xu Zhong, Jianbin Tang, and Antonio Jimeno Yepes. Publaynet: Largest dataset ever for document layout analysis. In 2019 International Conference on Document Analysis and Recognition (ICDAR) , pages 1015-1022, 2019. 1"}, {"label": "page_footer", "id": 0, "page_no": 9, "cluster": {"id": 0, "label": "page_footer", "bbox": {"l": 292.63, "t": 734.1329920000001, "r": 302.59259, "b": 743.039555, "coord_origin": "TOPLEFT"}, "confidence": 0.9069584012031555, "cells": [{"id": 127, "text": "10", "bbox": {"l": 292.63, "t": 734.1329920000001, "r": 302.59259, "b": 743.039555, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "10"}], "body": [{"label": "text", "id": 15, "page_no": 9, "cluster": {"id": 15, "label": "text", "bbox": {"l": 70.030998, "t": 75.88378999999998, "r": 286.36176, "b": 94.85875999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.6886764168739319, "cells": [{"id": 0, "text": "Computer Vision and Pattern Recognition", "bbox": {"l": 70.030998, "t": 75.96447999999998, "r": 223.58061, "b": 83.69353999999998, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": ", pages 658-666,", "bbox": {"l": 223.57901, "t": 75.88378999999998, "r": 286.36176, "b": 83.89977999999996, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "2019. 6", "bbox": {"l": 70.031006, "t": 86.84276999999997, "r": 97.916512, "b": 94.85875999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Computer Vision and Pattern Recognition , pages 658-666, 2019. 6"}, {"label": "list_item", "id": 13, "page_no": 9, "cluster": {"id": 13, "label": "list_item", "bbox": {"l": 50.112007, "t": 98.16576999999995, "r": 286.36578, "b": 160.97668, "coord_origin": "TOPLEFT"}, "confidence": 0.7723011374473572, "cells": [{"id": 3, "text": "[26]", "bbox": {"l": 50.112007, "t": 98.16576999999995, "r": 65.534088, "b": 106.18176000000005, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Sebastian Schreiber, Stefan Agne, Ivo Wolf, Andreas Den-", "bbox": {"l": 67.84832, "t": 98.16576999999995, "r": 286.35867, "b": 106.18176000000005, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "gel, and Sheraz Ahmed. Deepdesrt: Deep learning for detec-", "bbox": {"l": 70.031006, "t": 109.12476000000004, "r": 286.36331, "b": 117.14075000000003, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "tion and structure recognition of tables in document images.", "bbox": {"l": 70.031006, "t": 120.08374000000003, "r": 286.36334, "b": 128.0997299999999, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "In", "bbox": {"l": 70.031006, "t": 131.04272000000003, "r": 77.500015, "b": 139.05872, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "2017 14th IAPR International Conference on Document", "bbox": {"l": 80.560005, "t": 131.12341000000004, "r": 286.36578, "b": 138.85248, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Analysis and Recognition (ICDAR)", "bbox": {"l": 70.031006, "t": 142.0824, "r": 195.22885, "b": 149.81146, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": ", volume 01, pages 1162-", "bbox": {"l": 195.231, "t": 142.00171, "r": 286.36548, "b": 150.0177, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "1167, 2017. 1", "bbox": {"l": 70.031006, "t": 152.96069, "r": 120.33251, "b": 160.97668, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[26] Sebastian Schreiber, Stefan Agne, Ivo Wolf, Andreas Dengel, and Sheraz Ahmed. Deepdesrt: Deep learning for detection and structure recognition of tables in document images. In 2017 14th IAPR International Conference on Document Analysis and Recognition (ICDAR) , volume 01, pages 11621167, 2017. 1"}, {"label": "list_item", "id": 2, "page_no": 9, "cluster": {"id": 2, "label": "list_item", "bbox": {"l": 50.112007, "t": 164.28467, "r": 286.36337, "b": 227.0946, "coord_origin": "TOPLEFT"}, "confidence": 0.8580600619316101, "cells": [{"id": 12, "text": "[27]", "bbox": {"l": 50.112007, "t": 164.28467, "r": 65.534088, "b": 172.30066, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Sebastian Schreiber, Stefan Agne, Ivo Wolf, Andreas Den-", "bbox": {"l": 67.84832, "t": 164.28467, "r": 286.35867, "b": 172.30066, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "gel, and Sheraz Ahmed. Deepdesrt: Deep learning for de-", "bbox": {"l": 70.031006, "t": 175.24365, "r": 286.36337, "b": 183.25964, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "tection and structure recognition of tables in document im-", "bbox": {"l": 70.031006, "t": 186.20263999999997, "r": 286.36334, "b": 194.21862999999996, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "ages. In", "bbox": {"l": 70.031006, "t": 197.16161999999997, "r": 101.33271, "b": 205.17760999999996, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "2017 14th IAPR international conference on doc-", "bbox": {"l": 104.33101, "t": 197.24230999999997, "r": 286.35791, "b": 204.97136999999998, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "ument analysis and recognition (ICDAR)", "bbox": {"l": 70.031006, "t": 208.20032000000003, "r": 220.48719999999997, "b": 215.92938000000004, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": ", volume 1, pages", "bbox": {"l": 220.48401000000004, "t": 208.11963000000003, "r": 286.36017, "b": 216.13562000000002, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "1162-1167. IEEE, 2017. 3", "bbox": {"l": 70.031006, "t": 219.07861000000003, "r": 166.65294, "b": 227.0946, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[27] Sebastian Schreiber, Stefan Agne, Ivo Wolf, Andreas Dengel, and Sheraz Ahmed. Deepdesrt: Deep learning for detection and structure recognition of tables in document images. In 2017 14th IAPR international conference on document analysis and recognition (ICDAR) , volume 1, pages 1162-1167. IEEE, 2017. 3"}, {"label": "list_item", "id": 4, "page_no": 9, "cluster": {"id": 4, "label": "list_item", "bbox": {"l": 50.112007, "t": 230.40259000000003, "r": 286.36578, "b": 271.29553, "coord_origin": "TOPLEFT"}, "confidence": 0.8512731194496155, "cells": [{"id": 21, "text": "[28]", "bbox": {"l": 50.112007, "t": 230.40259000000003, "r": 65.650383, "b": 238.41858000000002, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "Faisal Shafait and Ray Smith. Table detection in heteroge-", "bbox": {"l": 67.982063, "t": 230.40259000000003, "r": 286.3587, "b": 238.41858000000002, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "neous documents. In", "bbox": {"l": 70.031006, "t": 241.36157000000003, "r": 147.16895, "b": 249.37756000000002, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "Proceedings of the 9th IAPR Interna-", "bbox": {"l": 149.93301, "t": 241.44226000000003, "r": 286.36578, "b": 249.17133, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "tional Workshop on Document Analysis Systems", "bbox": {"l": 70.031013, "t": 252.40125, "r": 244.6875, "b": 260.13031, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": ", pages 65-", "bbox": {"l": 244.69101, "t": 252.32056, "r": 286.35791, "b": 260.33655, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "72, 2010. 2", "bbox": {"l": 70.031006, "t": 263.27954, "r": 111.36611, "b": 271.29553, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[28] Faisal Shafait and Ray Smith. Table detection in heterogeneous documents. In Proceedings of the 9th IAPR International Workshop on Document Analysis Systems , pages 6572, 2010. 2"}, {"label": "list_item", "id": 5, "page_no": 9, "cluster": {"id": 5, "label": "list_item", "bbox": {"l": 50.112007, "t": 274.60357999999997, "r": 286.36627, "b": 326.4545, "coord_origin": "TOPLEFT"}, "confidence": 0.8494512438774109, "cells": [{"id": 28, "text": "[29]", "bbox": {"l": 50.112007, "t": 274.60357999999997, "r": 66.023834, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Shoaib", "bbox": {"l": 68.411568, "t": 274.60357999999997, "r": 94.944016, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Ahmed", "bbox": {"l": 100.8708, "t": 274.60357999999997, "r": 127.26788000000002, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Siddiqui,", "bbox": {"l": 133.19467, "t": 274.60357999999997, "r": 165.83237, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Imran", "bbox": {"l": 172.68269, "t": 274.60357999999997, "r": 194.09445, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "Ali", "bbox": {"l": 200.02124, "t": 274.60357999999997, "r": 211.4803, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Fateh,", "bbox": {"l": 217.40708999999998, "t": 274.60357999999997, "r": 239.43755, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "Syed", "bbox": {"l": 246.28787000000003, "t": 274.60357999999997, "r": 264.22067, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Tah-", "bbox": {"l": 270.14746, "t": 274.60357999999997, "r": 286.35873, "b": 282.61951, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "seen Raza Rizvi, Andreas Dengel, and Sheraz Ahmed.", "bbox": {"l": 70.031006, "t": 285.56256, "r": 286.36331, "b": 293.57852, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "Deeptabstr: Deep learning based table structure recognition.", "bbox": {"l": 70.031006, "t": 296.52155, "r": 286.36331, "b": 304.53751, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "In", "bbox": {"l": 70.031006, "t": 307.48053, "r": 77.500015, "b": 315.49649, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "2019 International Conference on Document Analysis and", "bbox": {"l": 79.350006, "t": 307.56122, "r": 286.36627, "b": 315.29028, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Recognition (ICDAR)", "bbox": {"l": 70.031006, "t": 318.51923, "r": 147.57243, "b": 326.24829, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": ", pages 1403-1409. IEEE, 2019. 3", "bbox": {"l": 147.57201, "t": 318.43854, "r": 271.33521, "b": 326.4545, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[29] Shoaib Ahmed Siddiqui, Imran Ali Fateh, Syed Tahseen Raza Rizvi, Andreas Dengel, and Sheraz Ahmed. Deeptabstr: Deep learning based table structure recognition. In 2019 International Conference on Document Analysis and Recognition (ICDAR) , pages 1403-1409. IEEE, 2019. 3"}, {"label": "list_item", "id": 3, "page_no": 9, "cluster": {"id": 3, "label": "list_item", "bbox": {"l": 50.112007, "t": 329.76254, "r": 286.36334, "b": 381.61447, "coord_origin": "TOPLEFT"}, "confidence": 0.8567671179771423, "cells": [{"id": 43, "text": "[30]", "bbox": {"l": 50.112007, "t": 329.76254, "r": 65.366135, "b": 337.7785, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "Peter W J Staar, Michele Dolfi, Christoph Auer, and Costas", "bbox": {"l": 67.655159, "t": 329.76254, "r": 286.3587, "b": 337.7785, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Bekas. Corpus conversion service: A machine learning plat-", "bbox": {"l": 70.031006, "t": 340.72156000000007, "r": 286.36334, "b": 348.7375200000001, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "form to ingest documents at scale.", "bbox": {"l": 70.031006, "t": 351.68054, "r": 198.82439, "b": 359.6965, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "In", "bbox": {"l": 206.06027, "t": 351.68054, "r": 213.52928, "b": 359.6965, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Proceedings of the", "bbox": {"l": 217.02101, "t": 351.76123, "r": 286.35815, "b": 359.4903, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "24th ACM SIGKDD", "bbox": {"l": 70.031006, "t": 362.72021, "r": 143.08028, "b": 370.44928, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": ", KDD \u201918, pages 774-782, New York,", "bbox": {"l": 143.078, "t": 362.63953000000004, "r": 286.36111, "b": 370.65549000000004, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "NY, USA, 2018. ACM. 1", "bbox": {"l": 70.031006, "t": 373.59851, "r": 161.15652, "b": 381.61447, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[30] Peter W J Staar, Michele Dolfi, Christoph Auer, and Costas Bekas. Corpus conversion service: A machine learning platform to ingest documents at scale. In Proceedings of the 24th ACM SIGKDD , KDD '18, pages 774-782, New York, NY, USA, 2018. ACM. 1"}, {"label": "list_item", "id": 1, "page_no": 9, "cluster": {"id": 1, "label": "list_item", "bbox": {"l": 50.112007, "t": 384.92252, "r": 286.36389, "b": 458.69144, "coord_origin": "TOPLEFT"}, "confidence": 0.8832162618637085, "cells": [{"id": 52, "text": "[31]", "bbox": {"l": 50.112007, "t": 384.92252, "r": 65.140724, "b": 392.93848, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Ashish Vaswani, Noam Shazeer, Niki Parmar, Jakob Uszko-", "bbox": {"l": 67.395927, "t": 384.92252, "r": 286.35876, "b": 392.93848, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "reit, Llion Jones, Aidan N Gomez, \u0141 ukasz Kaiser, and Il-", "bbox": {"l": 70.031006, "t": 395.88153, "r": 286.36337, "b": 403.89749, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "lia Polosukhin.", "bbox": {"l": 70.031006, "t": 406.84052, "r": 125.47024999999998, "b": 414.85648, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Attention is all you need.", "bbox": {"l": 133.90764, "t": 406.84052, "r": 230.83444, "b": 414.85648, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "In I. Guyon,", "bbox": {"l": 239.27182, "t": 406.84052, "r": 286.36334, "b": 414.85648, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "U.", "bbox": {"l": 70.031006, "t": 417.7995, "r": 78.958366, "b": 425.81546, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "V. Luxburg, S. Bengio, H. Wallach, R. Fergus, S. Vish-", "bbox": {"l": 81.254494, "t": 417.7995, "r": 286.36334, "b": 425.81546, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "wanathan, and R. Garnett, editors,", "bbox": {"l": 70.031006, "t": 428.75751, "r": 196.7621, "b": 436.7734699999999, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "Advances in Neural In-", "bbox": {"l": 200.20201, "t": 428.8381999999999, "r": 286.36017, "b": 436.56726, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "formation Processing Systems 30", "bbox": {"l": 70.031006, "t": 439.79717999999997, "r": 189.19447, "b": 447.52624999999995, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": ", pages 5998-6008. Curran", "bbox": {"l": 189.19501, "t": 439.71648999999996, "r": 286.36389, "b": 447.73245, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "Associates, Inc., 2017. 5", "bbox": {"l": 70.031006, "t": 450.67548, "r": 158.9239, "b": 458.69144, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[31] Ashish Vaswani, Noam Shazeer, Niki Parmar, Jakob Uszkoreit, Llion Jones, Aidan N Gomez, \u0141 ukasz Kaiser, and Illia Polosukhin. Attention is all you need. In I. Guyon, U. V. Luxburg, S. Bengio, H. Wallach, R. Fergus, S. Vishwanathan, and R. Garnett, editors, Advances in Neural Information Processing Systems 30 , pages 5998-6008. Curran Associates, Inc., 2017. 5"}, {"label": "list_item", "id": 6, "page_no": 9, "cluster": {"id": 6, "label": "list_item", "bbox": {"l": 50.112007, "t": 461.99948, "r": 286.36334, "b": 502.89243, "coord_origin": "TOPLEFT"}, "confidence": 0.8431925177574158, "cells": [{"id": 65, "text": "[32]", "bbox": {"l": 50.112007, "t": 461.99948, "r": 65.910469, "b": 470.01544, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "Oriol Vinyals, Alexander Toshev, Samy Bengio, and Du-", "bbox": {"l": 68.281181, "t": 461.99948, "r": 286.35873, "b": 470.01544, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "mitru Erhan.", "bbox": {"l": 70.031006, "t": 472.9585, "r": 116.27969999999999, "b": 480.97446, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "Show and tell: A neural image caption gen-", "bbox": {"l": 122.48445, "t": 472.9585, "r": 286.36334, "b": 480.97446, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "erator. In", "bbox": {"l": 70.031006, "t": 483.91748, "r": 103.30532, "b": 491.93344, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "Proceedings of the IEEE Conference on Computer", "bbox": {"l": 105.51601, "t": 483.99817, "r": 286.35931, "b": 491.72723, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Vision and Pattern Recognition (CVPR)", "bbox": {"l": 70.031006, "t": 494.95715, "r": 212.51607, "b": 502.68622, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": ", June 2015. 2", "bbox": {"l": 212.51401, "t": 494.87646, "r": 263.55975, "b": 502.89243, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[32] Oriol Vinyals, Alexander Toshev, Samy Bengio, and Dumitru Erhan. Show and tell: A neural image caption generator. In Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR) , June 2015. 2"}, {"label": "list_item", "id": 7, "page_no": 9, "cluster": {"id": 7, "label": "list_item", "bbox": {"l": 50.112015, "t": 506.20047, "r": 286.36337, "b": 547.09244, "coord_origin": "TOPLEFT"}, "confidence": 0.8405635952949524, "cells": [{"id": 73, "text": "[33]", "bbox": {"l": 50.112015, "t": 506.20047, "r": 65.682777, "b": 514.21643, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "Wenyuan Xue, Qingyong Li, and Dacheng Tao.", "bbox": {"l": 68.019325, "t": 506.20047, "r": 247.37280000000004, "b": 514.21643, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "Res2tim:", "bbox": {"l": 253.97208000000003, "t": 506.20047, "r": 286.3587, "b": 514.21643, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "reconstruct syntactic structures from table images. In", "bbox": {"l": 70.031013, "t": 517.15948, "r": 265.62408, "b": 525.17545, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "2019", "bbox": {"l": 268.42902, "t": 517.24017, "r": 286.36182, "b": 524.96924, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "International Conference on Document Analysis and Recog-", "bbox": {"l": 70.031021, "t": 528.19916, "r": 286.36337, "b": 535.92822, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "nition (ICDAR)", "bbox": {"l": 70.031021, "t": 539.15718, "r": 125.25507999999999, "b": 546.88622, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": ", pages 749-755. IEEE, 2019. 3", "bbox": {"l": 125.25402, "t": 539.07648, "r": 240.05083, "b": 547.09244, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[33] Wenyuan Xue, Qingyong Li, and Dacheng Tao. Res2tim: reconstruct syntactic structures from table images. In 2019 International Conference on Document Analysis and Recognition (ICDAR) , pages 749-755. IEEE, 2019. 3"}, {"label": "list_item", "id": 11, "page_no": 9, "cluster": {"id": 11, "label": "list_item", "bbox": {"l": 50.112022, "t": 550.40048, "r": 286.36337, "b": 591.29344, "coord_origin": "TOPLEFT"}, "confidence": 0.8241521716117859, "cells": [{"id": 81, "text": "[34]", "bbox": {"l": 50.112022, "t": 550.40048, "r": 66.037048, "b": 558.41644, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "Wenyuan Xue, Baosheng Yu, Wen Wang, Dacheng Tao,", "bbox": {"l": 68.426765, "t": 550.40048, "r": 286.3587, "b": 558.41644, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "and Qingyong Li.", "bbox": {"l": 70.031021, "t": 561.35948, "r": 137.08176, "b": 569.37544, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "Tgrnet:", "bbox": {"l": 145.9854, "t": 561.35948, "r": 172.38248, "b": 569.37544, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "A table graph reconstruction", "bbox": {"l": 178.7038, "t": 561.35948, "r": 286.36337, "b": 569.37544, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "network for table structure recognition.", "bbox": {"l": 70.031021, "t": 572.31848, "r": 221.00723, "b": 580.33444, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "arXiv preprint", "bbox": {"l": 232.54300999999998, "t": 572.39919, "r": 286.35938, "b": 580.12822, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "arXiv:2106.10598", "bbox": {"l": 70.031021, "t": 583.35818, "r": 135.53058, "b": 591.08722, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": ", 2021. 3", "bbox": {"l": 135.53003, "t": 583.27748, "r": 167.89876, "b": 591.29344, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[34] Wenyuan Xue, Baosheng Yu, Wen Wang, Dacheng Tao, and Qingyong Li. Tgrnet: A table graph reconstruction network for table structure recognition. arXiv preprint arXiv:2106.10598 , 2021. 3"}, {"label": "list_item", "id": 10, "page_no": 9, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 50.11203, "t": 594.60149, "r": 286.3634, "b": 635.49445, "coord_origin": "TOPLEFT"}, "confidence": 0.8360886573791504, "cells": [{"id": 90, "text": "[35]", "bbox": {"l": 50.11203, "t": 594.60149, "r": 65.23661, "b": 602.61745, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "Quanzeng You, Hailin Jin, Zhaowen Wang, Chen Fang, and", "bbox": {"l": 67.506203, "t": 594.60149, "r": 286.3587, "b": 602.61745, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Jiebo Luo.", "bbox": {"l": 70.031029, "t": 605.56049, "r": 109.1066, "b": 613.57645, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "Image captioning with semantic attention.", "bbox": {"l": 116.22592, "t": 605.56049, "r": 271.76605, "b": 613.57645, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "In", "bbox": {"l": 278.89435, "t": 605.56049, "r": 286.36337, "b": 613.57645, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "Proceedings of the IEEE conference on computer vision and", "bbox": {"l": 70.031029, "t": 616.60019, "r": 286.3634, "b": 624.32922, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "pattern recognition", "bbox": {"l": 70.031029, "t": 627.55919, "r": 139.09921, "b": 635.28822, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": ", pages 4651-4659, 2016. 4", "bbox": {"l": 139.09802, "t": 627.47849, "r": 238.95683, "b": 635.49445, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[35] Quanzeng You, Hailin Jin, Zhaowen Wang, Chen Fang, and Jiebo Luo. Image captioning with semantic attention. In Proceedings of the IEEE conference on computer vision and pattern recognition , pages 4651-4659, 2016. 4"}, {"label": "list_item", "id": 12, "page_no": 9, "cluster": {"id": 12, "label": "list_item", "bbox": {"l": 50.112022, "t": 638.80249, "r": 286.36337, "b": 690.65347, "coord_origin": "TOPLEFT"}, "confidence": 0.8079474568367004, "cells": [{"id": 98, "text": "[36]", "bbox": {"l": 50.112022, "t": 638.80249, "r": 65.203552, "b": 646.81845, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "Xinyi Zheng, Doug Burdick, Lucian Popa, Peter Zhong, and", "bbox": {"l": 67.468193, "t": 638.80249, "r": 286.35873, "b": 646.81845, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "Nancy Xin Ru Wang. Global table extractor (gte): A frame-", "bbox": {"l": 70.031021, "t": 649.7605, "r": 286.36337, "b": 657.77646, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "work for joint table identification and cell structure recogni-", "bbox": {"l": 70.031021, "t": 660.7195, "r": 286.36334, "b": 668.73547, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "tion using visual context.", "bbox": {"l": 70.031021, "t": 671.6785, "r": 158.45766, "b": 679.69447, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "Winter Conference for Applications", "bbox": {"l": 160.52802, "t": 671.7592, "r": 286.36249, "b": 679.48824, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "in Computer Vision (WACV)", "bbox": {"l": 70.031013, "t": 682.7182, "r": 171.42305, "b": 690.44724, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": ", 2021. 2, 3", "bbox": {"l": 171.42201, "t": 682.6375, "r": 212.75713, "b": 690.65347, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[36] Xinyi Zheng, Doug Burdick, Lucian Popa, Peter Zhong, and Nancy Xin Ru Wang. Global table extractor (gte): A framework for joint table identification and cell structure recognition using visual context. Winter Conference for Applications in Computer Vision (WACV) , 2021. 2, 3"}, {"label": "list_item", "id": 8, "page_no": 9, "cluster": {"id": 8, "label": "list_item", "bbox": {"l": 50.112015, "t": 693.961502, "r": 286.36334, "b": 712.936462, "coord_origin": "TOPLEFT"}, "confidence": 0.8385783433914185, "cells": [{"id": 106, "text": "[37]", "bbox": {"l": 50.112015, "t": 693.961502, "r": 66.506706, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "Xu", "bbox": {"l": 68.966896, "t": 693.961502, "r": 80.992294, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "Zhong,", "bbox": {"l": 89.062057, "t": 693.961502, "r": 114.71492999999998, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "Elaheh", "bbox": {"l": 124.24621000000002, "t": 693.961502, "r": 149.1459, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "ShafieiBavani,", "bbox": {"l": 157.22462, "t": 693.961502, "r": 209.37321, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "and", "bbox": {"l": 218.9045, "t": 693.961502, "r": 231.85196999999997, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "Antonio", "bbox": {"l": 239.93069, "t": 693.961502, "r": 269.32254, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "Ji-", "bbox": {"l": 277.3923, "t": 693.961502, "r": 286.3587, "b": 701.977463, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "meno Yepes. Image-based table recognition: Data, model,", "bbox": {"l": 70.031013, "t": 704.920502, "r": 286.36334, "b": 712.936462, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[37] Xu Zhong, Elaheh ShafieiBavani, and Antonio Jimeno Yepes. Image-based table recognition: Data, model,"}, {"label": "list_item", "id": 14, "page_no": 9, "cluster": {"id": 14, "label": "list_item", "bbox": {"l": 328.78101, "t": 75.88347999999996, "r": 545.11456, "b": 116.77544999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.7556979060173035, "cells": [{"id": 115, "text": "and evaluation. In Andrea Vedaldi, Horst Bischof, Thomas", "bbox": {"l": 328.78101, "t": 75.88347999999996, "r": 545.11346, "b": 83.89948000000015, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "Brox, and Jan-Michael Frahm, editors,", "bbox": {"l": 328.78101, "t": 86.84149000000002, "r": 472.30618, "b": 94.85748000000001, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "Computer Vision -", "bbox": {"l": 475.88501, "t": 86.92218000000003, "r": 545.11456, "b": 94.65125, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "ECCV 2020", "bbox": {"l": 328.78101, "t": 97.88116000000002, "r": 371.92734, "b": 105.61023, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": ", pages 564-580, Cham, 2020. Springer Interna-", "bbox": {"l": 371.92599, "t": 97.80048, "r": 545.11206, "b": 105.81646999999987, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "tional Publishing. 2, 3, 7", "bbox": {"l": 328.78101, "t": 108.75945999999999, "r": 417.70087, "b": 116.77544999999998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "and evaluation. In Andrea Vedaldi, Horst Bischof, Thomas Brox, and Jan-Michael Frahm, editors, Computer Vision ECCV 2020 , pages 564-580, Cham, 2020. Springer International Publishing. 2, 3, 7"}, {"label": "list_item", "id": 9, "page_no": 9, "cluster": {"id": 9, "label": "list_item", "bbox": {"l": 308.862, "t": 120.71447999999998, "r": 545.11334, "b": 161.60742000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.8375797271728516, "cells": [{"id": 121, "text": "[38]", "bbox": {"l": 308.862, "t": 120.71447999999998, "r": 324.33197, "b": 128.73046999999997, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Xu Zhong, Jianbin Tang, and Antonio Jimeno Yepes. Pub-", "bbox": {"l": 326.65341, "t": 120.71447999999998, "r": 545.10876, "b": 128.73046999999997, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "laynet: Largest dataset ever for document layout analysis. In", "bbox": {"l": 328.78101, "t": 131.67345999999998, "r": 545.11334, "b": 139.68944999999997, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "2019 International Conference on Document Analysis and", "bbox": {"l": 328.78101, "t": 142.71312999999998, "r": 545.11328, "b": 150.44219999999996, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "Recognition (ICDAR)", "bbox": {"l": 328.78101, "t": 153.67211999999995, "r": 406.32245, "b": 161.40117999999995, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": ", pages 1015-1022, 2019. 1", "bbox": {"l": 406.32202, "t": 153.59142999999995, "r": 506.18085, "b": 161.60742000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[38] Xu Zhong, Jianbin Tang, and Antonio Jimeno Yepes. Publaynet: Largest dataset ever for document layout analysis. In 2019 International Conference on Document Analysis and Recognition (ICDAR) , pages 1015-1022, 2019. 1"}], "headers": [{"label": "page_footer", "id": 0, "page_no": 9, "cluster": {"id": 0, "label": "page_footer", "bbox": {"l": 292.63, "t": 734.1329920000001, "r": 302.59259, "b": 743.039555, "coord_origin": "TOPLEFT"}, "confidence": 0.9069584012031555, "cells": [{"id": 127, "text": "10", "bbox": {"l": 292.63, "t": 734.1329920000001, "r": 302.59259, "b": 743.039555, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "10"}]}}, {"page_no": 10, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "TableFormer: Table Structure Understanding with Transformers", "bbox": {"l": 132.842, "t": 110.57488999999998, "r": 465.37591999999995, "b": 121.32263, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Supplementary Material", "bbox": {"l": 220.18399, "t": 122.25982999999997, "r": 375.04269, "b": 135.53008999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "1.", "bbox": {"l": 50.111984, "t": 161.16089, "r": 57.089828, "b": 171.90863000000002, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Details on the datasets", "bbox": {"l": 66.393616, "t": 161.16089, "r": 175.96437, "b": 171.90863000000002, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "1.1.", "bbox": {"l": 50.111984, "t": 180.97931000000005, "r": 64.210808, "b": 190.83136000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Data preparation", "bbox": {"l": 73.610023, "t": 180.97931000000005, "r": 150.36401, "b": 190.83136000000002, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "As a first step of our data preparation process, we have", "bbox": {"l": 62.06698600000001, "t": 199.92029000000002, "r": 286.36496, "b": 208.82683999999995, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "calculated statistics over the datasets across the following", "bbox": {"l": 50.111984, "t": 211.87627999999995, "r": 286.36505, "b": 220.78283999999996, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "dimensions: (1) table size measured in the number of rows", "bbox": {"l": 50.111984, "t": 223.83130000000006, "r": 286.36514, "b": 232.73784999999998, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "and columns, (2) complexity of the table, (3) strictness of", "bbox": {"l": 50.111984, "t": 235.78632000000005, "r": 286.36508, "b": 244.69286999999997, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "the provided HTML structure and (4) completeness (i.e. no", "bbox": {"l": 50.111984, "t": 247.74132999999995, "r": 286.36505, "b": 256.64788999999996, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "omitted bounding boxes). A table is considered to be simple", "bbox": {"l": 50.111984, "t": 259.69635000000005, "r": 286.36505, "b": 268.60290999999995, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "if it does not contain row spans or column spans. Addition-", "bbox": {"l": 50.111984, "t": 271.65137000000004, "r": 286.36505, "b": 280.55792, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "ally, a table has a strict HTML structure if every row has the", "bbox": {"l": 50.111984, "t": 283.60736, "r": 286.36502, "b": 292.5139199999999, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "same number of columns after taking into account any row", "bbox": {"l": 50.111984, "t": 295.56235, "r": 286.36505, "b": 304.4689, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "or column spans. Therefore a strict HTML structure looks", "bbox": {"l": 50.111984, "t": 307.5173300000001, "r": 286.36508, "b": 316.42389, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "always rectangular. However, HTML is a lenient encoding", "bbox": {"l": 50.111984, "t": 319.47232, "r": 286.36505, "b": 328.3788799999999, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "format, i.e. tables with rows of different sizes might still", "bbox": {"l": 50.111984, "t": 331.42731000000003, "r": 286.36502, "b": 340.33386, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "be regarded as correct due to implicit display rules. These", "bbox": {"l": 50.111984, "t": 343.3833, "r": 286.36508, "b": 352.28986, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "implicit rules leave room for ambiguity, which we want to", "bbox": {"l": 50.111984, "t": 355.33829, "r": 286.36505, "b": 364.24484000000007, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "avoid. As such, we prefer to have \u201dstrict\u201d tables, i.e. tables", "bbox": {"l": 50.111984, "t": 367.29327, "r": 286.36508, "b": 376.19983, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "where every row has exactly the same length.", "bbox": {"l": 50.111984, "t": 379.24826, "r": 230.80364999999998, "b": 388.15482000000003, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "We have developed a technique that tries to derive a", "bbox": {"l": 62.06698600000001, "t": 391.40527, "r": 286.36499, "b": 400.31183, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "missing bounding box out of its neighbors. As a first step,", "bbox": {"l": 50.111984, "t": 403.36026, "r": 286.36508, "b": 412.26681999999994, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "we use the annotation data to generate the most fine-grained", "bbox": {"l": 50.111984, "t": 415.31525, "r": 286.36505, "b": 424.22180000000003, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "grid that covers the table structure. In case of strict HTML", "bbox": {"l": 50.111984, "t": 427.2712399999999, "r": 286.36505, "b": 436.1778, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "tables, all grid squares are associated with some table cell", "bbox": {"l": 50.111984, "t": 439.22623, "r": 286.36508, "b": 448.1327800000001, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "and in the presence of table spans a cell extends across mul-", "bbox": {"l": 50.111984, "t": 451.18121, "r": 286.36511, "b": 460.08777, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "tiple grid squares. When enough bounding boxes are known", "bbox": {"l": 50.111984, "t": 463.1362, "r": 286.36505, "b": 472.04276, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "for a rectangular table, it is possible to compute the geo-", "bbox": {"l": 50.111984, "t": 475.09119, "r": 286.36508, "b": 483.99774, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "metrical border lines between the grid rows and columns.", "bbox": {"l": 50.111984, "t": 487.04617, "r": 286.36502, "b": 495.95273, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Eventually this information is used to generate the missing", "bbox": {"l": 50.111984, "t": 499.00217, "r": 286.36511, "b": 507.90872, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "bounding boxes. Additionally, the existence of unused grid", "bbox": {"l": 50.111984, "t": 510.95715, "r": 286.36508, "b": 519.8637100000001, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "squares indicates that the table rows have unequal number", "bbox": {"l": 50.111984, "t": 522.91214, "r": 286.36508, "b": 531.8187, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "of columns and the overall structure is non-strict. The gen-", "bbox": {"l": 50.111984, "t": 534.86713, "r": 286.36505, "b": 543.7737, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "eration of missing bounding boxes for non-strict HTML ta-", "bbox": {"l": 50.111984, "t": 546.82214, "r": 286.36502, "b": 555.7287, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "bles is ambiguous and therefore quite challenging.", "bbox": {"l": 50.111984, "t": 558.77814, "r": 257.47351, "b": 567.68469, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "Thus,", "bbox": {"l": 263.94919, "t": 558.77814, "r": 286.36505, "b": 567.68469, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "we have decided to simply discard those tables. In case of", "bbox": {"l": 50.111984, "t": 570.73314, "r": 286.36508, "b": 579.63969, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "PubTabNet we have computed missing bounding boxes for", "bbox": {"l": 50.111984, "t": 582.68814, "r": 286.36511, "b": 591.5947, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "48% of the simple and 69% of the complex tables. Regard-", "bbox": {"l": 50.111984, "t": 594.64314, "r": 286.36511, "b": 603.5497, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "ing FinTabNet, 68% of the simple and 98% of the complex", "bbox": {"l": 50.111984, "t": 606.5981400000001, "r": 286.36505, "b": 615.5047, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "tables require the generation of bounding boxes.", "bbox": {"l": 50.111984, "t": 618.55315, "r": 242.2606, "b": 627.4597, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Figure 7 illustrates the distribution of the tables across", "bbox": {"l": 62.06698600000001, "t": 630.71014, "r": 286.36496, "b": 639.6167, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "different dimensions per dataset.", "bbox": {"l": 50.111984, "t": 642.66614, "r": 179.90472, "b": 651.57269, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "1.2.", "bbox": {"l": 50.111984, "t": 662.39014, "r": 64.297272, "b": 672.24219, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "Synthetic datasets", "bbox": {"l": 73.754135, "t": 662.39014, "r": 153.60785, "b": 672.24219, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "Aiming to train and evaluate our models in a broader", "bbox": {"l": 62.06698600000001, "t": 681.33113, "r": 286.36493, "b": 690.2377, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "spectrum of table data we have synthesized four types of", "bbox": {"l": 50.111984, "t": 693.2861330000001, "r": 286.36505, "b": 702.1927029999999, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "datasets.", "bbox": {"l": 50.111984, "t": 705.241135, "r": 84.144226, "b": 714.147705, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Each one contains tables with different appear-", "bbox": {"l": 91.237595, "t": 705.241135, "r": 286.36505, "b": 714.147705, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "ances in regard to their size, structure, style and content.", "bbox": {"l": 308.862, "t": 162.65515000000005, "r": 545.11511, "b": 171.56170999999995, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Every synthetic dataset contains 150k examples, summing", "bbox": {"l": 308.862, "t": 174.61017000000004, "r": 545.11511, "b": 183.51671999999996, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "up to 600k synthetic examples. All datasets are divided into", "bbox": {"l": 308.862, "t": 186.56519000000003, "r": 545.11511, "b": 195.47173999999995, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "Train, Test and Val splits (80%, 10%, 10%).", "bbox": {"l": 308.862, "t": 198.52117999999996, "r": 484.07434, "b": 207.42773, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "The process of generating a synthetic dataset can be de-", "bbox": {"l": 320.81699, "t": 211.23517000000004, "r": 545.11505, "b": 220.14171999999996, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "composed into the following steps:", "bbox": {"l": 308.862, "t": 223.19019000000003, "r": 448.08939, "b": 232.09673999999995, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "1.", "bbox": {"l": 320.81699, "t": 235.90521, "r": 328.28894, "b": 244.81177000000002, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Prepare styling and content templates: The styling", "bbox": {"l": 335.38232, "t": 235.90521, "r": 545.11499, "b": 244.81177000000002, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "templates have been manually designed and organized into", "bbox": {"l": 308.862, "t": 247.86023, "r": 545.11511, "b": 256.76678000000004, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "groups of scope specific appearances (e.g. financial data,", "bbox": {"l": 308.862, "t": 259.81525, "r": 545.11511, "b": 268.72180000000003, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "marketing data, etc.)", "bbox": {"l": 308.862, "t": 271.77026, "r": 393.3847, "b": 280.67682, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "Additionally, we have prepared cu-", "bbox": {"l": 400.11942, "t": 271.77026, "r": 545.11511, "b": 280.67682, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "rated collections of content templates by extracting the most", "bbox": {"l": 308.862, "t": 283.72524999999996, "r": 545.11505, "b": 292.63181, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "frequently used terms out of non-synthetic datasets (e.g.", "bbox": {"l": 308.862, "t": 295.68124, "r": 545.11511, "b": 304.5878000000001, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "PubTabNet, FinTabNet, etc.).", "bbox": {"l": 308.862, "t": 307.63623, "r": 425.69348, "b": 316.54279, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "2.", "bbox": {"l": 320.81699, "t": 320.35022, "r": 328.4949, "b": 329.25677, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "Generate table structures: The structure of each syn-", "bbox": {"l": 331.05423, "t": 320.35022, "r": 545.11499, "b": 329.25677, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "thetic dataset assumes a horizontal table header which po-", "bbox": {"l": 308.862, "t": 332.30521000000005, "r": 545.11517, "b": 341.21176, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "tentially spans over multiple rows and a table body that", "bbox": {"l": 308.862, "t": 344.26018999999997, "r": 545.11505, "b": 353.16675, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "may contain a combination of row spans and column spans.", "bbox": {"l": 308.862, "t": 356.21619, "r": 545.11511, "b": 365.12273999999996, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "However, spans are not allowed to cross the header - body", "bbox": {"l": 308.862, "t": 368.17117, "r": 545.11511, "b": 377.07773, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "boundary. The table structure is described by the parame-", "bbox": {"l": 308.862, "t": 380.12616, "r": 545.11499, "b": 389.03271, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "ters: Total number of table rows and columns, number of", "bbox": {"l": 308.862, "t": 392.08115, "r": 545.11517, "b": 400.98769999999996, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "header rows, type of spans (header only spans, row only", "bbox": {"l": 308.862, "t": 404.03613000000007, "r": 545.11511, "b": 412.94269, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "spans, column only spans, both row and column spans),", "bbox": {"l": 308.862, "t": 415.99112, "r": 545.11499, "b": 424.89767, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "maximum span size and the ratio of the table area covered", "bbox": {"l": 308.862, "t": 427.94711, "r": 545.11517, "b": 436.85367, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "by spans.", "bbox": {"l": 308.862, "t": 439.9021, "r": 345.94278, "b": 448.80865, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "3.", "bbox": {"l": 320.81699, "t": 452.61609, "r": 328.30341, "b": 461.52264, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "Generate content: Based on the dataset", "bbox": {"l": 330.79889, "t": 452.61609, "r": 485.75772000000006, "b": 461.52264, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "theme", "bbox": {"l": 488.073, "t": 452.70575, "r": 511.86368, "b": 461.29352, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": ", a set of", "bbox": {"l": 511.86301, "t": 452.61609, "r": 545.10815, "b": 461.52264, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "suitable content templates is chosen first. Then, this content", "bbox": {"l": 308.862, "t": 464.57108, "r": 545.11505, "b": 473.47763, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "can be combined with purely random text to produce the", "bbox": {"l": 308.862, "t": 476.52707, "r": 545.11517, "b": 485.43362, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "synthetic content.", "bbox": {"l": 308.862, "t": 488.48206, "r": 379.14816, "b": 497.38861, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "4.", "bbox": {"l": 320.81699, "t": 501.19604, "r": 328.66177, "b": 510.1026, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Apply styling templates: Depending on the domain", "bbox": {"l": 331.2767, "t": 501.19604, "r": 545.11493, "b": 510.1026, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "of the synthetic dataset, a set of styling templates is first", "bbox": {"l": 308.862, "t": 513.15103, "r": 545.1153, "b": 522.05759, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "manually selected.", "bbox": {"l": 308.862, "t": 525.10703, "r": 384.29883, "b": 534.01358, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "Then, a style is randomly selected to", "bbox": {"l": 391.25272, "t": 525.10703, "r": 545.11511, "b": 534.01358, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "format the appearance of the synthesized table.", "bbox": {"l": 308.862, "t": 537.06203, "r": 496.15897000000007, "b": 545.96858, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "5.", "bbox": {"l": 320.81699, "t": 549.77603, "r": 328.28894, "b": 558.68259, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Render the complete tables: The synthetic table is", "bbox": {"l": 335.40222, "t": 549.77603, "r": 545.11499, "b": 558.68259, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "finally rendered by a web browser engine to generate the", "bbox": {"l": 308.862, "t": 561.73103, "r": 545.11517, "b": 570.63759, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "bounding boxes for each table cell. A batching technique is", "bbox": {"l": 308.862, "t": 573.68604, "r": 545.11511, "b": 582.59259, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "utilized to optimize the runtime overhead of the rendering", "bbox": {"l": 308.862, "t": 585.64203, "r": 545.11505, "b": 594.54858, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "process.", "bbox": {"l": 308.862, "t": 597.59703, "r": 341.2305, "b": 606.50359, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "2.", "bbox": {"l": 308.862, "t": 622.2905900000001, "r": 316.76675, "b": 633.03831, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "Prediction post-processing for PDF docu-", "bbox": {"l": 327.30643, "t": 622.2905900000001, "r": 545.10876, "b": 633.03831, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "ments", "bbox": {"l": 326.79501, "t": 636.2385899999999, "r": 357.34055, "b": 646.98631, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "Although TableFormer can predict the table structure and", "bbox": {"l": 320.81702, "t": 657.42104, "r": 545.11499, "b": 666.3276, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "the bounding boxes for tables recognized inside PDF docu-", "bbox": {"l": 308.86203, "t": 669.37604, "r": 545.11511, "b": 678.2826, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "ments, this is not enough when a full reconstruction of the", "bbox": {"l": 308.86203, "t": 681.33104, "r": 545.11517, "b": 690.2376, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "original table is required. This happens mainly due the fol-", "bbox": {"l": 308.86203, "t": 693.286041, "r": 545.11505, "b": 702.1926040000001, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "lowing reasons:", "bbox": {"l": 308.86203, "t": 705.242035, "r": 371.42719, "b": 714.148605, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "11", "bbox": {"l": 292.63104, "t": 734.1330379999999, "r": 302.59363, "b": 743.0396, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 18, "label": "section_header", "bbox": {"l": 132.842, "t": 110.57488999999998, "r": 465.37591999999995, "b": 135.53008999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.6497084498405457, "cells": [{"id": 0, "text": "TableFormer: Table Structure Understanding with Transformers", "bbox": {"l": 132.842, "t": 110.57488999999998, "r": 465.37591999999995, "b": 121.32263, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Supplementary Material", "bbox": {"l": 220.18399, "t": 122.25982999999997, "r": 375.04269, "b": 135.53008999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "section_header", "bbox": {"l": 50.111984, "t": 161.16089, "r": 175.96437, "b": 171.90863000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9454860091209412, "cells": [{"id": 2, "text": "1.", "bbox": {"l": 50.111984, "t": 161.16089, "r": 57.089828, "b": 171.90863000000002, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Details on the datasets", "bbox": {"l": 66.393616, "t": 161.16089, "r": 175.96437, "b": 171.90863000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "section_header", "bbox": {"l": 50.111984, "t": 180.97931000000005, "r": 150.36401, "b": 190.83136000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9535645842552185, "cells": [{"id": 4, "text": "1.1.", "bbox": {"l": 50.111984, "t": 180.97931000000005, "r": 64.210808, "b": 190.83136000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Data preparation", "bbox": {"l": 73.610023, "t": 180.97931000000005, "r": 150.36401, "b": 190.83136000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 50.111984, "t": 199.92029000000002, "r": 286.36514, "b": 388.15482000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9864971041679382, "cells": [{"id": 6, "text": "As a first step of our data preparation process, we have", "bbox": {"l": 62.06698600000001, "t": 199.92029000000002, "r": 286.36496, "b": 208.82683999999995, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "calculated statistics over the datasets across the following", "bbox": {"l": 50.111984, "t": 211.87627999999995, "r": 286.36505, "b": 220.78283999999996, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "dimensions: (1) table size measured in the number of rows", "bbox": {"l": 50.111984, "t": 223.83130000000006, "r": 286.36514, "b": 232.73784999999998, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "and columns, (2) complexity of the table, (3) strictness of", "bbox": {"l": 50.111984, "t": 235.78632000000005, "r": 286.36508, "b": 244.69286999999997, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "the provided HTML structure and (4) completeness (i.e. no", "bbox": {"l": 50.111984, "t": 247.74132999999995, "r": 286.36505, "b": 256.64788999999996, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "omitted bounding boxes). A table is considered to be simple", "bbox": {"l": 50.111984, "t": 259.69635000000005, "r": 286.36505, "b": 268.60290999999995, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "if it does not contain row spans or column spans. Addition-", "bbox": {"l": 50.111984, "t": 271.65137000000004, "r": 286.36505, "b": 280.55792, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "ally, a table has a strict HTML structure if every row has the", "bbox": {"l": 50.111984, "t": 283.60736, "r": 286.36502, "b": 292.5139199999999, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "same number of columns after taking into account any row", "bbox": {"l": 50.111984, "t": 295.56235, "r": 286.36505, "b": 304.4689, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "or column spans. Therefore a strict HTML structure looks", "bbox": {"l": 50.111984, "t": 307.5173300000001, "r": 286.36508, "b": 316.42389, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "always rectangular. However, HTML is a lenient encoding", "bbox": {"l": 50.111984, "t": 319.47232, "r": 286.36505, "b": 328.3788799999999, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "format, i.e. tables with rows of different sizes might still", "bbox": {"l": 50.111984, "t": 331.42731000000003, "r": 286.36502, "b": 340.33386, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "be regarded as correct due to implicit display rules. These", "bbox": {"l": 50.111984, "t": 343.3833, "r": 286.36508, "b": 352.28986, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "implicit rules leave room for ambiguity, which we want to", "bbox": {"l": 50.111984, "t": 355.33829, "r": 286.36505, "b": 364.24484000000007, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "avoid. As such, we prefer to have \u201dstrict\u201d tables, i.e. tables", "bbox": {"l": 50.111984, "t": 367.29327, "r": 286.36508, "b": 376.19983, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "where every row has exactly the same length.", "bbox": {"l": 50.111984, "t": 379.24826, "r": 230.80364999999998, "b": 388.15482000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 50.111984, "t": 391.40527, "r": 286.36511, "b": 627.4597, "coord_origin": "TOPLEFT"}, "confidence": 0.9826022386550903, "cells": [{"id": 22, "text": "We have developed a technique that tries to derive a", "bbox": {"l": 62.06698600000001, "t": 391.40527, "r": 286.36499, "b": 400.31183, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "missing bounding box out of its neighbors. As a first step,", "bbox": {"l": 50.111984, "t": 403.36026, "r": 286.36508, "b": 412.26681999999994, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "we use the annotation data to generate the most fine-grained", "bbox": {"l": 50.111984, "t": 415.31525, "r": 286.36505, "b": 424.22180000000003, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "grid that covers the table structure. In case of strict HTML", "bbox": {"l": 50.111984, "t": 427.2712399999999, "r": 286.36505, "b": 436.1778, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "tables, all grid squares are associated with some table cell", "bbox": {"l": 50.111984, "t": 439.22623, "r": 286.36508, "b": 448.1327800000001, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "and in the presence of table spans a cell extends across mul-", "bbox": {"l": 50.111984, "t": 451.18121, "r": 286.36511, "b": 460.08777, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "tiple grid squares. When enough bounding boxes are known", "bbox": {"l": 50.111984, "t": 463.1362, "r": 286.36505, "b": 472.04276, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "for a rectangular table, it is possible to compute the geo-", "bbox": {"l": 50.111984, "t": 475.09119, "r": 286.36508, "b": 483.99774, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "metrical border lines between the grid rows and columns.", "bbox": {"l": 50.111984, "t": 487.04617, "r": 286.36502, "b": 495.95273, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Eventually this information is used to generate the missing", "bbox": {"l": 50.111984, "t": 499.00217, "r": 286.36511, "b": 507.90872, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "bounding boxes. Additionally, the existence of unused grid", "bbox": {"l": 50.111984, "t": 510.95715, "r": 286.36508, "b": 519.8637100000001, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "squares indicates that the table rows have unequal number", "bbox": {"l": 50.111984, "t": 522.91214, "r": 286.36508, "b": 531.8187, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "of columns and the overall structure is non-strict. The gen-", "bbox": {"l": 50.111984, "t": 534.86713, "r": 286.36505, "b": 543.7737, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "eration of missing bounding boxes for non-strict HTML ta-", "bbox": {"l": 50.111984, "t": 546.82214, "r": 286.36502, "b": 555.7287, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "bles is ambiguous and therefore quite challenging.", "bbox": {"l": 50.111984, "t": 558.77814, "r": 257.47351, "b": 567.68469, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "Thus,", "bbox": {"l": 263.94919, "t": 558.77814, "r": 286.36505, "b": 567.68469, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "we have decided to simply discard those tables. In case of", "bbox": {"l": 50.111984, "t": 570.73314, "r": 286.36508, "b": 579.63969, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "PubTabNet we have computed missing bounding boxes for", "bbox": {"l": 50.111984, "t": 582.68814, "r": 286.36511, "b": 591.5947, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "48% of the simple and 69% of the complex tables. Regard-", "bbox": {"l": 50.111984, "t": 594.64314, "r": 286.36511, "b": 603.5497, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "ing FinTabNet, 68% of the simple and 98% of the complex", "bbox": {"l": 50.111984, "t": 606.5981400000001, "r": 286.36505, "b": 615.5047, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "tables require the generation of bounding boxes.", "bbox": {"l": 50.111984, "t": 618.55315, "r": 242.2606, "b": 627.4597, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 50.111984, "t": 630.71014, "r": 286.36496, "b": 651.57269, "coord_origin": "TOPLEFT"}, "confidence": 0.9335853457450867, "cells": [{"id": 43, "text": "Figure 7 illustrates the distribution of the tables across", "bbox": {"l": 62.06698600000001, "t": 630.71014, "r": 286.36496, "b": 639.6167, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "different dimensions per dataset.", "bbox": {"l": 50.111984, "t": 642.66614, "r": 179.90472, "b": 651.57269, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "section_header", "bbox": {"l": 50.111984, "t": 662.39014, "r": 153.60785, "b": 672.24219, "coord_origin": "TOPLEFT"}, "confidence": 0.9515743255615234, "cells": [{"id": 45, "text": "1.2.", "bbox": {"l": 50.111984, "t": 662.39014, "r": 64.297272, "b": 672.24219, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "Synthetic datasets", "bbox": {"l": 73.754135, "t": 662.39014, "r": 153.60785, "b": 672.24219, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 50.111984, "t": 681.33113, "r": 286.36505, "b": 714.147705, "coord_origin": "TOPLEFT"}, "confidence": 0.9783332347869873, "cells": [{"id": 47, "text": "Aiming to train and evaluate our models in a broader", "bbox": {"l": 62.06698600000001, "t": 681.33113, "r": 286.36493, "b": 690.2377, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "spectrum of table data we have synthesized four types of", "bbox": {"l": 50.111984, "t": 693.2861330000001, "r": 286.36505, "b": 702.1927029999999, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "datasets.", "bbox": {"l": 50.111984, "t": 705.241135, "r": 84.144226, "b": 714.147705, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Each one contains tables with different appear-", "bbox": {"l": 91.237595, "t": 705.241135, "r": 286.36505, "b": 714.147705, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "text", "bbox": {"l": 308.862, "t": 162.65515000000005, "r": 545.11511, "b": 207.42773, "coord_origin": "TOPLEFT"}, "confidence": 0.9596064686775208, "cells": [{"id": 51, "text": "ances in regard to their size, structure, style and content.", "bbox": {"l": 308.862, "t": 162.65515000000005, "r": 545.11511, "b": 171.56170999999995, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Every synthetic dataset contains 150k examples, summing", "bbox": {"l": 308.862, "t": 174.61017000000004, "r": 545.11511, "b": 183.51671999999996, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "up to 600k synthetic examples. All datasets are divided into", "bbox": {"l": 308.862, "t": 186.56519000000003, "r": 545.11511, "b": 195.47173999999995, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "Train, Test and Val splits (80%, 10%, 10%).", "bbox": {"l": 308.862, "t": 198.52117999999996, "r": 484.07434, "b": 207.42773, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 308.862, "t": 211.23517000000004, "r": 545.11505, "b": 232.09673999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9261796474456787, "cells": [{"id": 55, "text": "The process of generating a synthetic dataset can be de-", "bbox": {"l": 320.81699, "t": 211.23517000000004, "r": 545.11505, "b": 220.14171999999996, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "composed into the following steps:", "bbox": {"l": 308.862, "t": 223.19019000000003, "r": 448.08939, "b": 232.09673999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "list_item", "bbox": {"l": 308.862, "t": 235.90521, "r": 545.11511, "b": 316.54279, "coord_origin": "TOPLEFT"}, "confidence": 0.9642952680587769, "cells": [{"id": 57, "text": "1.", "bbox": {"l": 320.81699, "t": 235.90521, "r": 328.28894, "b": 244.81177000000002, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Prepare styling and content templates: The styling", "bbox": {"l": 335.38232, "t": 235.90521, "r": 545.11499, "b": 244.81177000000002, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "templates have been manually designed and organized into", "bbox": {"l": 308.862, "t": 247.86023, "r": 545.11511, "b": 256.76678000000004, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "groups of scope specific appearances (e.g. financial data,", "bbox": {"l": 308.862, "t": 259.81525, "r": 545.11511, "b": 268.72180000000003, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "marketing data, etc.)", "bbox": {"l": 308.862, "t": 271.77026, "r": 393.3847, "b": 280.67682, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "Additionally, we have prepared cu-", "bbox": {"l": 400.11942, "t": 271.77026, "r": 545.11511, "b": 280.67682, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "rated collections of content templates by extracting the most", "bbox": {"l": 308.862, "t": 283.72524999999996, "r": 545.11505, "b": 292.63181, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "frequently used terms out of non-synthetic datasets (e.g.", "bbox": {"l": 308.862, "t": 295.68124, "r": 545.11511, "b": 304.5878000000001, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "PubTabNet, FinTabNet, etc.).", "bbox": {"l": 308.862, "t": 307.63623, "r": 425.69348, "b": 316.54279, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "list_item", "bbox": {"l": 308.862, "t": 320.35022, "r": 545.11517, "b": 448.80865, "coord_origin": "TOPLEFT"}, "confidence": 0.9699994921684265, "cells": [{"id": 66, "text": "2.", "bbox": {"l": 320.81699, "t": 320.35022, "r": 328.4949, "b": 329.25677, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "Generate table structures: The structure of each syn-", "bbox": {"l": 331.05423, "t": 320.35022, "r": 545.11499, "b": 329.25677, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "thetic dataset assumes a horizontal table header which po-", "bbox": {"l": 308.862, "t": 332.30521000000005, "r": 545.11517, "b": 341.21176, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "tentially spans over multiple rows and a table body that", "bbox": {"l": 308.862, "t": 344.26018999999997, "r": 545.11505, "b": 353.16675, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "may contain a combination of row spans and column spans.", "bbox": {"l": 308.862, "t": 356.21619, "r": 545.11511, "b": 365.12273999999996, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "However, spans are not allowed to cross the header - body", "bbox": {"l": 308.862, "t": 368.17117, "r": 545.11511, "b": 377.07773, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "boundary. The table structure is described by the parame-", "bbox": {"l": 308.862, "t": 380.12616, "r": 545.11499, "b": 389.03271, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "ters: Total number of table rows and columns, number of", "bbox": {"l": 308.862, "t": 392.08115, "r": 545.11517, "b": 400.98769999999996, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "header rows, type of spans (header only spans, row only", "bbox": {"l": 308.862, "t": 404.03613000000007, "r": 545.11511, "b": 412.94269, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "spans, column only spans, both row and column spans),", "bbox": {"l": 308.862, "t": 415.99112, "r": 545.11499, "b": 424.89767, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "maximum span size and the ratio of the table area covered", "bbox": {"l": 308.862, "t": 427.94711, "r": 545.11517, "b": 436.85367, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "by spans.", "bbox": {"l": 308.862, "t": 439.9021, "r": 345.94278, "b": 448.80865, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "list_item", "bbox": {"l": 308.862, "t": 452.61609, "r": 545.11517, "b": 497.38861, "coord_origin": "TOPLEFT"}, "confidence": 0.9568928480148315, "cells": [{"id": 78, "text": "3.", "bbox": {"l": 320.81699, "t": 452.61609, "r": 328.30341, "b": 461.52264, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "Generate content: Based on the dataset", "bbox": {"l": 330.79889, "t": 452.61609, "r": 485.75772000000006, "b": 461.52264, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "theme", "bbox": {"l": 488.073, "t": 452.70575, "r": 511.86368, "b": 461.29352, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": ", a set of", "bbox": {"l": 511.86301, "t": 452.61609, "r": 545.10815, "b": 461.52264, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "suitable content templates is chosen first. Then, this content", "bbox": {"l": 308.862, "t": 464.57108, "r": 545.11505, "b": 473.47763, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "can be combined with purely random text to produce the", "bbox": {"l": 308.862, "t": 476.52707, "r": 545.11517, "b": 485.43362, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "synthetic content.", "bbox": {"l": 308.862, "t": 488.48206, "r": 379.14816, "b": 497.38861, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "list_item", "bbox": {"l": 308.862, "t": 501.19604, "r": 545.1153, "b": 545.96858, "coord_origin": "TOPLEFT"}, "confidence": 0.9710659980773926, "cells": [{"id": 85, "text": "4.", "bbox": {"l": 320.81699, "t": 501.19604, "r": 328.66177, "b": 510.1026, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Apply styling templates: Depending on the domain", "bbox": {"l": 331.2767, "t": 501.19604, "r": 545.11493, "b": 510.1026, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "of the synthetic dataset, a set of styling templates is first", "bbox": {"l": 308.862, "t": 513.15103, "r": 545.1153, "b": 522.05759, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "manually selected.", "bbox": {"l": 308.862, "t": 525.10703, "r": 384.29883, "b": 534.01358, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "Then, a style is randomly selected to", "bbox": {"l": 391.25272, "t": 525.10703, "r": 545.11511, "b": 534.01358, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "format the appearance of the synthesized table.", "bbox": {"l": 308.862, "t": 537.06203, "r": 496.15897000000007, "b": 545.96858, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "list_item", "bbox": {"l": 308.862, "t": 549.77603, "r": 545.11517, "b": 606.50359, "coord_origin": "TOPLEFT"}, "confidence": 0.9778757095336914, "cells": [{"id": 91, "text": "5.", "bbox": {"l": 320.81699, "t": 549.77603, "r": 328.28894, "b": 558.68259, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Render the complete tables: The synthetic table is", "bbox": {"l": 335.40222, "t": 549.77603, "r": 545.11499, "b": 558.68259, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "finally rendered by a web browser engine to generate the", "bbox": {"l": 308.862, "t": 561.73103, "r": 545.11517, "b": 570.63759, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "bounding boxes for each table cell. A batching technique is", "bbox": {"l": 308.862, "t": 573.68604, "r": 545.11511, "b": 582.59259, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "utilized to optimize the runtime overhead of the rendering", "bbox": {"l": 308.862, "t": 585.64203, "r": 545.11505, "b": 594.54858, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "process.", "bbox": {"l": 308.862, "t": 597.59703, "r": 341.2305, "b": 606.50359, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "section_header", "bbox": {"l": 308.862, "t": 622.2905900000001, "r": 545.10876, "b": 646.98631, "coord_origin": "TOPLEFT"}, "confidence": 0.954940915107727, "cells": [{"id": 97, "text": "2.", "bbox": {"l": 308.862, "t": 622.2905900000001, "r": 316.76675, "b": 633.03831, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "Prediction post-processing for PDF docu-", "bbox": {"l": 327.30643, "t": 622.2905900000001, "r": 545.10876, "b": 633.03831, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "ments", "bbox": {"l": 326.79501, "t": 636.2385899999999, "r": 357.34055, "b": 646.98631, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 308.86203, "t": 657.42104, "r": 545.11517, "b": 714.148605, "coord_origin": "TOPLEFT"}, "confidence": 0.9829329252243042, "cells": [{"id": 100, "text": "Although TableFormer can predict the table structure and", "bbox": {"l": 320.81702, "t": 657.42104, "r": 545.11499, "b": 666.3276, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "the bounding boxes for tables recognized inside PDF docu-", "bbox": {"l": 308.86203, "t": 669.37604, "r": 545.11511, "b": 678.2826, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "ments, this is not enough when a full reconstruction of the", "bbox": {"l": 308.86203, "t": 681.33104, "r": 545.11517, "b": 690.2376, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "original table is required. This happens mainly due the fol-", "bbox": {"l": 308.86203, "t": 693.286041, "r": 545.11505, "b": 702.1926040000001, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "lowing reasons:", "bbox": {"l": 308.86203, "t": 705.242035, "r": 371.42719, "b": 714.148605, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "page_footer", "bbox": {"l": 292.63104, "t": 734.1330379999999, "r": 302.59363, "b": 743.0396, "coord_origin": "TOPLEFT"}, "confidence": 0.8986663222312927, "cells": [{"id": 105, "text": "11", "bbox": {"l": 292.63104, "t": 734.1330379999999, "r": 302.59363, "b": 743.0396, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "section_header", "id": 18, "page_no": 10, "cluster": {"id": 18, "label": "section_header", "bbox": {"l": 132.842, "t": 110.57488999999998, "r": 465.37591999999995, "b": 135.53008999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.6497084498405457, "cells": [{"id": 0, "text": "TableFormer: Table Structure Understanding with Transformers", "bbox": {"l": 132.842, "t": 110.57488999999998, "r": 465.37591999999995, "b": 121.32263, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Supplementary Material", "bbox": {"l": 220.18399, "t": 122.25982999999997, "r": 375.04269, "b": 135.53008999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "TableFormer: Table Structure Understanding with Transformers Supplementary Material"}, {"label": "section_header", "id": 13, "page_no": 10, "cluster": {"id": 13, "label": "section_header", "bbox": {"l": 50.111984, "t": 161.16089, "r": 175.96437, "b": 171.90863000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9454860091209412, "cells": [{"id": 2, "text": "1.", "bbox": {"l": 50.111984, "t": 161.16089, "r": 57.089828, "b": 171.90863000000002, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Details on the datasets", "bbox": {"l": 66.393616, "t": 161.16089, "r": 175.96437, "b": 171.90863000000002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1. Details on the datasets"}, {"label": "section_header", "id": 11, "page_no": 10, "cluster": {"id": 11, "label": "section_header", "bbox": {"l": 50.111984, "t": 180.97931000000005, "r": 150.36401, "b": 190.83136000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9535645842552185, "cells": [{"id": 4, "text": "1.1.", "bbox": {"l": 50.111984, "t": 180.97931000000005, "r": 64.210808, "b": 190.83136000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Data preparation", "bbox": {"l": 73.610023, "t": 180.97931000000005, "r": 150.36401, "b": 190.83136000000002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1.1. Data preparation"}, {"label": "text", "id": 0, "page_no": 10, "cluster": {"id": 0, "label": "text", "bbox": {"l": 50.111984, "t": 199.92029000000002, "r": 286.36514, "b": 388.15482000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9864971041679382, "cells": [{"id": 6, "text": "As a first step of our data preparation process, we have", "bbox": {"l": 62.06698600000001, "t": 199.92029000000002, "r": 286.36496, "b": 208.82683999999995, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "calculated statistics over the datasets across the following", "bbox": {"l": 50.111984, "t": 211.87627999999995, "r": 286.36505, "b": 220.78283999999996, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "dimensions: (1) table size measured in the number of rows", "bbox": {"l": 50.111984, "t": 223.83130000000006, "r": 286.36514, "b": 232.73784999999998, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "and columns, (2) complexity of the table, (3) strictness of", "bbox": {"l": 50.111984, "t": 235.78632000000005, "r": 286.36508, "b": 244.69286999999997, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "the provided HTML structure and (4) completeness (i.e. no", "bbox": {"l": 50.111984, "t": 247.74132999999995, "r": 286.36505, "b": 256.64788999999996, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "omitted bounding boxes). A table is considered to be simple", "bbox": {"l": 50.111984, "t": 259.69635000000005, "r": 286.36505, "b": 268.60290999999995, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "if it does not contain row spans or column spans. Addition-", "bbox": {"l": 50.111984, "t": 271.65137000000004, "r": 286.36505, "b": 280.55792, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "ally, a table has a strict HTML structure if every row has the", "bbox": {"l": 50.111984, "t": 283.60736, "r": 286.36502, "b": 292.5139199999999, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "same number of columns after taking into account any row", "bbox": {"l": 50.111984, "t": 295.56235, "r": 286.36505, "b": 304.4689, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "or column spans. Therefore a strict HTML structure looks", "bbox": {"l": 50.111984, "t": 307.5173300000001, "r": 286.36508, "b": 316.42389, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "always rectangular. However, HTML is a lenient encoding", "bbox": {"l": 50.111984, "t": 319.47232, "r": 286.36505, "b": 328.3788799999999, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "format, i.e. tables with rows of different sizes might still", "bbox": {"l": 50.111984, "t": 331.42731000000003, "r": 286.36502, "b": 340.33386, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "be regarded as correct due to implicit display rules. These", "bbox": {"l": 50.111984, "t": 343.3833, "r": 286.36508, "b": 352.28986, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "implicit rules leave room for ambiguity, which we want to", "bbox": {"l": 50.111984, "t": 355.33829, "r": 286.36505, "b": 364.24484000000007, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "avoid. As such, we prefer to have \u201dstrict\u201d tables, i.e. tables", "bbox": {"l": 50.111984, "t": 367.29327, "r": 286.36508, "b": 376.19983, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "where every row has exactly the same length.", "bbox": {"l": 50.111984, "t": 379.24826, "r": 230.80364999999998, "b": 388.15482000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "As a first step of our data preparation process, we have calculated statistics over the datasets across the following dimensions: (1) table size measured in the number of rows and columns, (2) complexity of the table, (3) strictness of the provided HTML structure and (4) completeness (i.e. no omitted bounding boxes). A table is considered to be simple if it does not contain row spans or column spans. Additionally, a table has a strict HTML structure if every row has the same number of columns after taking into account any row or column spans. Therefore a strict HTML structure looks always rectangular. However, HTML is a lenient encoding format, i.e. tables with rows of different sizes might still be regarded as correct due to implicit display rules. These implicit rules leave room for ambiguity, which we want to avoid. As such, we prefer to have \"strict\" tables, i.e. tables where every row has exactly the same length."}, {"label": "text", "id": 2, "page_no": 10, "cluster": {"id": 2, "label": "text", "bbox": {"l": 50.111984, "t": 391.40527, "r": 286.36511, "b": 627.4597, "coord_origin": "TOPLEFT"}, "confidence": 0.9826022386550903, "cells": [{"id": 22, "text": "We have developed a technique that tries to derive a", "bbox": {"l": 62.06698600000001, "t": 391.40527, "r": 286.36499, "b": 400.31183, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "missing bounding box out of its neighbors. As a first step,", "bbox": {"l": 50.111984, "t": 403.36026, "r": 286.36508, "b": 412.26681999999994, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "we use the annotation data to generate the most fine-grained", "bbox": {"l": 50.111984, "t": 415.31525, "r": 286.36505, "b": 424.22180000000003, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "grid that covers the table structure. In case of strict HTML", "bbox": {"l": 50.111984, "t": 427.2712399999999, "r": 286.36505, "b": 436.1778, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "tables, all grid squares are associated with some table cell", "bbox": {"l": 50.111984, "t": 439.22623, "r": 286.36508, "b": 448.1327800000001, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "and in the presence of table spans a cell extends across mul-", "bbox": {"l": 50.111984, "t": 451.18121, "r": 286.36511, "b": 460.08777, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "tiple grid squares. When enough bounding boxes are known", "bbox": {"l": 50.111984, "t": 463.1362, "r": 286.36505, "b": 472.04276, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "for a rectangular table, it is possible to compute the geo-", "bbox": {"l": 50.111984, "t": 475.09119, "r": 286.36508, "b": 483.99774, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "metrical border lines between the grid rows and columns.", "bbox": {"l": 50.111984, "t": 487.04617, "r": 286.36502, "b": 495.95273, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Eventually this information is used to generate the missing", "bbox": {"l": 50.111984, "t": 499.00217, "r": 286.36511, "b": 507.90872, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "bounding boxes. Additionally, the existence of unused grid", "bbox": {"l": 50.111984, "t": 510.95715, "r": 286.36508, "b": 519.8637100000001, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "squares indicates that the table rows have unequal number", "bbox": {"l": 50.111984, "t": 522.91214, "r": 286.36508, "b": 531.8187, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "of columns and the overall structure is non-strict. The gen-", "bbox": {"l": 50.111984, "t": 534.86713, "r": 286.36505, "b": 543.7737, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "eration of missing bounding boxes for non-strict HTML ta-", "bbox": {"l": 50.111984, "t": 546.82214, "r": 286.36502, "b": 555.7287, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "bles is ambiguous and therefore quite challenging.", "bbox": {"l": 50.111984, "t": 558.77814, "r": 257.47351, "b": 567.68469, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "Thus,", "bbox": {"l": 263.94919, "t": 558.77814, "r": 286.36505, "b": 567.68469, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "we have decided to simply discard those tables. In case of", "bbox": {"l": 50.111984, "t": 570.73314, "r": 286.36508, "b": 579.63969, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "PubTabNet we have computed missing bounding boxes for", "bbox": {"l": 50.111984, "t": 582.68814, "r": 286.36511, "b": 591.5947, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "48% of the simple and 69% of the complex tables. Regard-", "bbox": {"l": 50.111984, "t": 594.64314, "r": 286.36511, "b": 603.5497, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "ing FinTabNet, 68% of the simple and 98% of the complex", "bbox": {"l": 50.111984, "t": 606.5981400000001, "r": 286.36505, "b": 615.5047, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "tables require the generation of bounding boxes.", "bbox": {"l": 50.111984, "t": 618.55315, "r": 242.2606, "b": 627.4597, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "We have developed a technique that tries to derive a missing bounding box out of its neighbors. As a first step, we use the annotation data to generate the most fine-grained grid that covers the table structure. In case of strict HTML tables, all grid squares are associated with some table cell and in the presence of table spans a cell extends across multiple grid squares. When enough bounding boxes are known for a rectangular table, it is possible to compute the geometrical border lines between the grid rows and columns. Eventually this information is used to generate the missing bounding boxes. Additionally, the existence of unused grid squares indicates that the table rows have unequal number of columns and the overall structure is non-strict. The generation of missing bounding boxes for non-strict HTML tables is ambiguous and therefore quite challenging. Thus, we have decided to simply discard those tables. In case of PubTabNet we have computed missing bounding boxes for 48% of the simple and 69% of the complex tables. Regarding FinTabNet, 68% of the simple and 98% of the complex tables require the generation of bounding boxes."}, {"label": "text", "id": 14, "page_no": 10, "cluster": {"id": 14, "label": "text", "bbox": {"l": 50.111984, "t": 630.71014, "r": 286.36496, "b": 651.57269, "coord_origin": "TOPLEFT"}, "confidence": 0.9335853457450867, "cells": [{"id": 43, "text": "Figure 7 illustrates the distribution of the tables across", "bbox": {"l": 62.06698600000001, "t": 630.71014, "r": 286.36496, "b": 639.6167, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "different dimensions per dataset.", "bbox": {"l": 50.111984, "t": 642.66614, "r": 179.90472, "b": 651.57269, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 7 illustrates the distribution of the tables across different dimensions per dataset."}, {"label": "section_header", "id": 12, "page_no": 10, "cluster": {"id": 12, "label": "section_header", "bbox": {"l": 50.111984, "t": 662.39014, "r": 153.60785, "b": 672.24219, "coord_origin": "TOPLEFT"}, "confidence": 0.9515743255615234, "cells": [{"id": 45, "text": "1.2.", "bbox": {"l": 50.111984, "t": 662.39014, "r": 64.297272, "b": 672.24219, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "Synthetic datasets", "bbox": {"l": 73.754135, "t": 662.39014, "r": 153.60785, "b": 672.24219, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1.2. Synthetic datasets"}, {"label": "text", "id": 3, "page_no": 10, "cluster": {"id": 3, "label": "text", "bbox": {"l": 50.111984, "t": 681.33113, "r": 286.36505, "b": 714.147705, "coord_origin": "TOPLEFT"}, "confidence": 0.9783332347869873, "cells": [{"id": 47, "text": "Aiming to train and evaluate our models in a broader", "bbox": {"l": 62.06698600000001, "t": 681.33113, "r": 286.36493, "b": 690.2377, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "spectrum of table data we have synthesized four types of", "bbox": {"l": 50.111984, "t": 693.2861330000001, "r": 286.36505, "b": 702.1927029999999, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "datasets.", "bbox": {"l": 50.111984, "t": 705.241135, "r": 84.144226, "b": 714.147705, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Each one contains tables with different appear-", "bbox": {"l": 91.237595, "t": 705.241135, "r": 286.36505, "b": 714.147705, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Aiming to train and evaluate our models in a broader spectrum of table data we have synthesized four types of datasets. Each one contains tables with different appear-"}, {"label": "text", "id": 8, "page_no": 10, "cluster": {"id": 8, "label": "text", "bbox": {"l": 308.862, "t": 162.65515000000005, "r": 545.11511, "b": 207.42773, "coord_origin": "TOPLEFT"}, "confidence": 0.9596064686775208, "cells": [{"id": 51, "text": "ances in regard to their size, structure, style and content.", "bbox": {"l": 308.862, "t": 162.65515000000005, "r": 545.11511, "b": 171.56170999999995, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Every synthetic dataset contains 150k examples, summing", "bbox": {"l": 308.862, "t": 174.61017000000004, "r": 545.11511, "b": 183.51671999999996, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "up to 600k synthetic examples. All datasets are divided into", "bbox": {"l": 308.862, "t": 186.56519000000003, "r": 545.11511, "b": 195.47173999999995, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "Train, Test and Val splits (80%, 10%, 10%).", "bbox": {"l": 308.862, "t": 198.52117999999996, "r": 484.07434, "b": 207.42773, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "ances in regard to their size, structure, style and content. Every synthetic dataset contains 150k examples, summing up to 600k synthetic examples. All datasets are divided into Train, Test and Val splits (80%, 10%, 10%)."}, {"label": "text", "id": 15, "page_no": 10, "cluster": {"id": 15, "label": "text", "bbox": {"l": 308.862, "t": 211.23517000000004, "r": 545.11505, "b": 232.09673999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9261796474456787, "cells": [{"id": 55, "text": "The process of generating a synthetic dataset can be de-", "bbox": {"l": 320.81699, "t": 211.23517000000004, "r": 545.11505, "b": 220.14171999999996, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "composed into the following steps:", "bbox": {"l": 308.862, "t": 223.19019000000003, "r": 448.08939, "b": 232.09673999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The process of generating a synthetic dataset can be decomposed into the following steps:"}, {"label": "list_item", "id": 7, "page_no": 10, "cluster": {"id": 7, "label": "list_item", "bbox": {"l": 308.862, "t": 235.90521, "r": 545.11511, "b": 316.54279, "coord_origin": "TOPLEFT"}, "confidence": 0.9642952680587769, "cells": [{"id": 57, "text": "1.", "bbox": {"l": 320.81699, "t": 235.90521, "r": 328.28894, "b": 244.81177000000002, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Prepare styling and content templates: The styling", "bbox": {"l": 335.38232, "t": 235.90521, "r": 545.11499, "b": 244.81177000000002, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "templates have been manually designed and organized into", "bbox": {"l": 308.862, "t": 247.86023, "r": 545.11511, "b": 256.76678000000004, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "groups of scope specific appearances (e.g. financial data,", "bbox": {"l": 308.862, "t": 259.81525, "r": 545.11511, "b": 268.72180000000003, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "marketing data, etc.)", "bbox": {"l": 308.862, "t": 271.77026, "r": 393.3847, "b": 280.67682, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "Additionally, we have prepared cu-", "bbox": {"l": 400.11942, "t": 271.77026, "r": 545.11511, "b": 280.67682, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "rated collections of content templates by extracting the most", "bbox": {"l": 308.862, "t": 283.72524999999996, "r": 545.11505, "b": 292.63181, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "frequently used terms out of non-synthetic datasets (e.g.", "bbox": {"l": 308.862, "t": 295.68124, "r": 545.11511, "b": 304.5878000000001, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "PubTabNet, FinTabNet, etc.).", "bbox": {"l": 308.862, "t": 307.63623, "r": 425.69348, "b": 316.54279, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1. Prepare styling and content templates: The styling templates have been manually designed and organized into groups of scope specific appearances (e.g. financial data, marketing data, etc.) Additionally, we have prepared curated collections of content templates by extracting the most frequently used terms out of non-synthetic datasets (e.g. PubTabNet, FinTabNet, etc.)."}, {"label": "list_item", "id": 6, "page_no": 10, "cluster": {"id": 6, "label": "list_item", "bbox": {"l": 308.862, "t": 320.35022, "r": 545.11517, "b": 448.80865, "coord_origin": "TOPLEFT"}, "confidence": 0.9699994921684265, "cells": [{"id": 66, "text": "2.", "bbox": {"l": 320.81699, "t": 320.35022, "r": 328.4949, "b": 329.25677, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "Generate table structures: The structure of each syn-", "bbox": {"l": 331.05423, "t": 320.35022, "r": 545.11499, "b": 329.25677, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "thetic dataset assumes a horizontal table header which po-", "bbox": {"l": 308.862, "t": 332.30521000000005, "r": 545.11517, "b": 341.21176, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "tentially spans over multiple rows and a table body that", "bbox": {"l": 308.862, "t": 344.26018999999997, "r": 545.11505, "b": 353.16675, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "may contain a combination of row spans and column spans.", "bbox": {"l": 308.862, "t": 356.21619, "r": 545.11511, "b": 365.12273999999996, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "However, spans are not allowed to cross the header - body", "bbox": {"l": 308.862, "t": 368.17117, "r": 545.11511, "b": 377.07773, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "boundary. The table structure is described by the parame-", "bbox": {"l": 308.862, "t": 380.12616, "r": 545.11499, "b": 389.03271, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "ters: Total number of table rows and columns, number of", "bbox": {"l": 308.862, "t": 392.08115, "r": 545.11517, "b": 400.98769999999996, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "header rows, type of spans (header only spans, row only", "bbox": {"l": 308.862, "t": 404.03613000000007, "r": 545.11511, "b": 412.94269, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "spans, column only spans, both row and column spans),", "bbox": {"l": 308.862, "t": 415.99112, "r": 545.11499, "b": 424.89767, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "maximum span size and the ratio of the table area covered", "bbox": {"l": 308.862, "t": 427.94711, "r": 545.11517, "b": 436.85367, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "by spans.", "bbox": {"l": 308.862, "t": 439.9021, "r": 345.94278, "b": 448.80865, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2. Generate table structures: The structure of each synthetic dataset assumes a horizontal table header which potentially spans over multiple rows and a table body that may contain a combination of row spans and column spans. However, spans are not allowed to cross the header - body boundary. The table structure is described by the parameters: Total number of table rows and columns, number of header rows, type of spans (header only spans, row only spans, column only spans, both row and column spans), maximum span size and the ratio of the table area covered by spans."}, {"label": "list_item", "id": 9, "page_no": 10, "cluster": {"id": 9, "label": "list_item", "bbox": {"l": 308.862, "t": 452.61609, "r": 545.11517, "b": 497.38861, "coord_origin": "TOPLEFT"}, "confidence": 0.9568928480148315, "cells": [{"id": 78, "text": "3.", "bbox": {"l": 320.81699, "t": 452.61609, "r": 328.30341, "b": 461.52264, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "Generate content: Based on the dataset", "bbox": {"l": 330.79889, "t": 452.61609, "r": 485.75772000000006, "b": 461.52264, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "theme", "bbox": {"l": 488.073, "t": 452.70575, "r": 511.86368, "b": 461.29352, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": ", a set of", "bbox": {"l": 511.86301, "t": 452.61609, "r": 545.10815, "b": 461.52264, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "suitable content templates is chosen first. Then, this content", "bbox": {"l": 308.862, "t": 464.57108, "r": 545.11505, "b": 473.47763, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "can be combined with purely random text to produce the", "bbox": {"l": 308.862, "t": 476.52707, "r": 545.11517, "b": 485.43362, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "synthetic content.", "bbox": {"l": 308.862, "t": 488.48206, "r": 379.14816, "b": 497.38861, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3. Generate content: Based on the dataset theme , a set of suitable content templates is chosen first. Then, this content can be combined with purely random text to produce the synthetic content."}, {"label": "list_item", "id": 5, "page_no": 10, "cluster": {"id": 5, "label": "list_item", "bbox": {"l": 308.862, "t": 501.19604, "r": 545.1153, "b": 545.96858, "coord_origin": "TOPLEFT"}, "confidence": 0.9710659980773926, "cells": [{"id": 85, "text": "4.", "bbox": {"l": 320.81699, "t": 501.19604, "r": 328.66177, "b": 510.1026, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Apply styling templates: Depending on the domain", "bbox": {"l": 331.2767, "t": 501.19604, "r": 545.11493, "b": 510.1026, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "of the synthetic dataset, a set of styling templates is first", "bbox": {"l": 308.862, "t": 513.15103, "r": 545.1153, "b": 522.05759, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "manually selected.", "bbox": {"l": 308.862, "t": 525.10703, "r": 384.29883, "b": 534.01358, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "Then, a style is randomly selected to", "bbox": {"l": 391.25272, "t": 525.10703, "r": 545.11511, "b": 534.01358, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "format the appearance of the synthesized table.", "bbox": {"l": 308.862, "t": 537.06203, "r": 496.15897000000007, "b": 545.96858, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4. Apply styling templates: Depending on the domain of the synthetic dataset, a set of styling templates is first manually selected. Then, a style is randomly selected to format the appearance of the synthesized table."}, {"label": "list_item", "id": 4, "page_no": 10, "cluster": {"id": 4, "label": "list_item", "bbox": {"l": 308.862, "t": 549.77603, "r": 545.11517, "b": 606.50359, "coord_origin": "TOPLEFT"}, "confidence": 0.9778757095336914, "cells": [{"id": 91, "text": "5.", "bbox": {"l": 320.81699, "t": 549.77603, "r": 328.28894, "b": 558.68259, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Render the complete tables: The synthetic table is", "bbox": {"l": 335.40222, "t": 549.77603, "r": 545.11499, "b": 558.68259, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "finally rendered by a web browser engine to generate the", "bbox": {"l": 308.862, "t": 561.73103, "r": 545.11517, "b": 570.63759, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "bounding boxes for each table cell. A batching technique is", "bbox": {"l": 308.862, "t": 573.68604, "r": 545.11511, "b": 582.59259, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "utilized to optimize the runtime overhead of the rendering", "bbox": {"l": 308.862, "t": 585.64203, "r": 545.11505, "b": 594.54858, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "process.", "bbox": {"l": 308.862, "t": 597.59703, "r": 341.2305, "b": 606.50359, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5. Render the complete tables: The synthetic table is finally rendered by a web browser engine to generate the bounding boxes for each table cell. A batching technique is utilized to optimize the runtime overhead of the rendering process."}, {"label": "section_header", "id": 10, "page_no": 10, "cluster": {"id": 10, "label": "section_header", "bbox": {"l": 308.862, "t": 622.2905900000001, "r": 545.10876, "b": 646.98631, "coord_origin": "TOPLEFT"}, "confidence": 0.954940915107727, "cells": [{"id": 97, "text": "2.", "bbox": {"l": 308.862, "t": 622.2905900000001, "r": 316.76675, "b": 633.03831, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "Prediction post-processing for PDF docu-", "bbox": {"l": 327.30643, "t": 622.2905900000001, "r": 545.10876, "b": 633.03831, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "ments", "bbox": {"l": 326.79501, "t": 636.2385899999999, "r": 357.34055, "b": 646.98631, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2. Prediction post-processing for PDF documents"}, {"label": "text", "id": 1, "page_no": 10, "cluster": {"id": 1, "label": "text", "bbox": {"l": 308.86203, "t": 657.42104, "r": 545.11517, "b": 714.148605, "coord_origin": "TOPLEFT"}, "confidence": 0.9829329252243042, "cells": [{"id": 100, "text": "Although TableFormer can predict the table structure and", "bbox": {"l": 320.81702, "t": 657.42104, "r": 545.11499, "b": 666.3276, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "the bounding boxes for tables recognized inside PDF docu-", "bbox": {"l": 308.86203, "t": 669.37604, "r": 545.11511, "b": 678.2826, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "ments, this is not enough when a full reconstruction of the", "bbox": {"l": 308.86203, "t": 681.33104, "r": 545.11517, "b": 690.2376, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "original table is required. This happens mainly due the fol-", "bbox": {"l": 308.86203, "t": 693.286041, "r": 545.11505, "b": 702.1926040000001, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "lowing reasons:", "bbox": {"l": 308.86203, "t": 705.242035, "r": 371.42719, "b": 714.148605, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Although TableFormer can predict the table structure and the bounding boxes for tables recognized inside PDF documents, this is not enough when a full reconstruction of the original table is required. This happens mainly due the following reasons:"}, {"label": "page_footer", "id": 16, "page_no": 10, "cluster": {"id": 16, "label": "page_footer", "bbox": {"l": 292.63104, "t": 734.1330379999999, "r": 302.59363, "b": 743.0396, "coord_origin": "TOPLEFT"}, "confidence": 0.8986663222312927, "cells": [{"id": 105, "text": "11", "bbox": {"l": 292.63104, "t": 734.1330379999999, "r": 302.59363, "b": 743.0396, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "11"}], "body": [{"label": "section_header", "id": 18, "page_no": 10, "cluster": {"id": 18, "label": "section_header", "bbox": {"l": 132.842, "t": 110.57488999999998, "r": 465.37591999999995, "b": 135.53008999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.6497084498405457, "cells": [{"id": 0, "text": "TableFormer: Table Structure Understanding with Transformers", "bbox": {"l": 132.842, "t": 110.57488999999998, "r": 465.37591999999995, "b": 121.32263, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Supplementary Material", "bbox": {"l": 220.18399, "t": 122.25982999999997, "r": 375.04269, "b": 135.53008999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "TableFormer: Table Structure Understanding with Transformers Supplementary Material"}, {"label": "section_header", "id": 13, "page_no": 10, "cluster": {"id": 13, "label": "section_header", "bbox": {"l": 50.111984, "t": 161.16089, "r": 175.96437, "b": 171.90863000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9454860091209412, "cells": [{"id": 2, "text": "1.", "bbox": {"l": 50.111984, "t": 161.16089, "r": 57.089828, "b": 171.90863000000002, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Details on the datasets", "bbox": {"l": 66.393616, "t": 161.16089, "r": 175.96437, "b": 171.90863000000002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1. Details on the datasets"}, {"label": "section_header", "id": 11, "page_no": 10, "cluster": {"id": 11, "label": "section_header", "bbox": {"l": 50.111984, "t": 180.97931000000005, "r": 150.36401, "b": 190.83136000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9535645842552185, "cells": [{"id": 4, "text": "1.1.", "bbox": {"l": 50.111984, "t": 180.97931000000005, "r": 64.210808, "b": 190.83136000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Data preparation", "bbox": {"l": 73.610023, "t": 180.97931000000005, "r": 150.36401, "b": 190.83136000000002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1.1. Data preparation"}, {"label": "text", "id": 0, "page_no": 10, "cluster": {"id": 0, "label": "text", "bbox": {"l": 50.111984, "t": 199.92029000000002, "r": 286.36514, "b": 388.15482000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9864971041679382, "cells": [{"id": 6, "text": "As a first step of our data preparation process, we have", "bbox": {"l": 62.06698600000001, "t": 199.92029000000002, "r": 286.36496, "b": 208.82683999999995, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "calculated statistics over the datasets across the following", "bbox": {"l": 50.111984, "t": 211.87627999999995, "r": 286.36505, "b": 220.78283999999996, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "dimensions: (1) table size measured in the number of rows", "bbox": {"l": 50.111984, "t": 223.83130000000006, "r": 286.36514, "b": 232.73784999999998, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "and columns, (2) complexity of the table, (3) strictness of", "bbox": {"l": 50.111984, "t": 235.78632000000005, "r": 286.36508, "b": 244.69286999999997, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "the provided HTML structure and (4) completeness (i.e. no", "bbox": {"l": 50.111984, "t": 247.74132999999995, "r": 286.36505, "b": 256.64788999999996, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "omitted bounding boxes). A table is considered to be simple", "bbox": {"l": 50.111984, "t": 259.69635000000005, "r": 286.36505, "b": 268.60290999999995, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "if it does not contain row spans or column spans. Addition-", "bbox": {"l": 50.111984, "t": 271.65137000000004, "r": 286.36505, "b": 280.55792, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "ally, a table has a strict HTML structure if every row has the", "bbox": {"l": 50.111984, "t": 283.60736, "r": 286.36502, "b": 292.5139199999999, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "same number of columns after taking into account any row", "bbox": {"l": 50.111984, "t": 295.56235, "r": 286.36505, "b": 304.4689, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "or column spans. Therefore a strict HTML structure looks", "bbox": {"l": 50.111984, "t": 307.5173300000001, "r": 286.36508, "b": 316.42389, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "always rectangular. However, HTML is a lenient encoding", "bbox": {"l": 50.111984, "t": 319.47232, "r": 286.36505, "b": 328.3788799999999, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "format, i.e. tables with rows of different sizes might still", "bbox": {"l": 50.111984, "t": 331.42731000000003, "r": 286.36502, "b": 340.33386, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "be regarded as correct due to implicit display rules. These", "bbox": {"l": 50.111984, "t": 343.3833, "r": 286.36508, "b": 352.28986, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "implicit rules leave room for ambiguity, which we want to", "bbox": {"l": 50.111984, "t": 355.33829, "r": 286.36505, "b": 364.24484000000007, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "avoid. As such, we prefer to have \u201dstrict\u201d tables, i.e. tables", "bbox": {"l": 50.111984, "t": 367.29327, "r": 286.36508, "b": 376.19983, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "where every row has exactly the same length.", "bbox": {"l": 50.111984, "t": 379.24826, "r": 230.80364999999998, "b": 388.15482000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "As a first step of our data preparation process, we have calculated statistics over the datasets across the following dimensions: (1) table size measured in the number of rows and columns, (2) complexity of the table, (3) strictness of the provided HTML structure and (4) completeness (i.e. no omitted bounding boxes). A table is considered to be simple if it does not contain row spans or column spans. Additionally, a table has a strict HTML structure if every row has the same number of columns after taking into account any row or column spans. Therefore a strict HTML structure looks always rectangular. However, HTML is a lenient encoding format, i.e. tables with rows of different sizes might still be regarded as correct due to implicit display rules. These implicit rules leave room for ambiguity, which we want to avoid. As such, we prefer to have \"strict\" tables, i.e. tables where every row has exactly the same length."}, {"label": "text", "id": 2, "page_no": 10, "cluster": {"id": 2, "label": "text", "bbox": {"l": 50.111984, "t": 391.40527, "r": 286.36511, "b": 627.4597, "coord_origin": "TOPLEFT"}, "confidence": 0.9826022386550903, "cells": [{"id": 22, "text": "We have developed a technique that tries to derive a", "bbox": {"l": 62.06698600000001, "t": 391.40527, "r": 286.36499, "b": 400.31183, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "missing bounding box out of its neighbors. As a first step,", "bbox": {"l": 50.111984, "t": 403.36026, "r": 286.36508, "b": 412.26681999999994, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "we use the annotation data to generate the most fine-grained", "bbox": {"l": 50.111984, "t": 415.31525, "r": 286.36505, "b": 424.22180000000003, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "grid that covers the table structure. In case of strict HTML", "bbox": {"l": 50.111984, "t": 427.2712399999999, "r": 286.36505, "b": 436.1778, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "tables, all grid squares are associated with some table cell", "bbox": {"l": 50.111984, "t": 439.22623, "r": 286.36508, "b": 448.1327800000001, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "and in the presence of table spans a cell extends across mul-", "bbox": {"l": 50.111984, "t": 451.18121, "r": 286.36511, "b": 460.08777, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "tiple grid squares. When enough bounding boxes are known", "bbox": {"l": 50.111984, "t": 463.1362, "r": 286.36505, "b": 472.04276, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "for a rectangular table, it is possible to compute the geo-", "bbox": {"l": 50.111984, "t": 475.09119, "r": 286.36508, "b": 483.99774, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "metrical border lines between the grid rows and columns.", "bbox": {"l": 50.111984, "t": 487.04617, "r": 286.36502, "b": 495.95273, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Eventually this information is used to generate the missing", "bbox": {"l": 50.111984, "t": 499.00217, "r": 286.36511, "b": 507.90872, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "bounding boxes. Additionally, the existence of unused grid", "bbox": {"l": 50.111984, "t": 510.95715, "r": 286.36508, "b": 519.8637100000001, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "squares indicates that the table rows have unequal number", "bbox": {"l": 50.111984, "t": 522.91214, "r": 286.36508, "b": 531.8187, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "of columns and the overall structure is non-strict. The gen-", "bbox": {"l": 50.111984, "t": 534.86713, "r": 286.36505, "b": 543.7737, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "eration of missing bounding boxes for non-strict HTML ta-", "bbox": {"l": 50.111984, "t": 546.82214, "r": 286.36502, "b": 555.7287, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "bles is ambiguous and therefore quite challenging.", "bbox": {"l": 50.111984, "t": 558.77814, "r": 257.47351, "b": 567.68469, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "Thus,", "bbox": {"l": 263.94919, "t": 558.77814, "r": 286.36505, "b": 567.68469, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "we have decided to simply discard those tables. In case of", "bbox": {"l": 50.111984, "t": 570.73314, "r": 286.36508, "b": 579.63969, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "PubTabNet we have computed missing bounding boxes for", "bbox": {"l": 50.111984, "t": 582.68814, "r": 286.36511, "b": 591.5947, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "48% of the simple and 69% of the complex tables. Regard-", "bbox": {"l": 50.111984, "t": 594.64314, "r": 286.36511, "b": 603.5497, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "ing FinTabNet, 68% of the simple and 98% of the complex", "bbox": {"l": 50.111984, "t": 606.5981400000001, "r": 286.36505, "b": 615.5047, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "tables require the generation of bounding boxes.", "bbox": {"l": 50.111984, "t": 618.55315, "r": 242.2606, "b": 627.4597, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "We have developed a technique that tries to derive a missing bounding box out of its neighbors. As a first step, we use the annotation data to generate the most fine-grained grid that covers the table structure. In case of strict HTML tables, all grid squares are associated with some table cell and in the presence of table spans a cell extends across multiple grid squares. When enough bounding boxes are known for a rectangular table, it is possible to compute the geometrical border lines between the grid rows and columns. Eventually this information is used to generate the missing bounding boxes. Additionally, the existence of unused grid squares indicates that the table rows have unequal number of columns and the overall structure is non-strict. The generation of missing bounding boxes for non-strict HTML tables is ambiguous and therefore quite challenging. Thus, we have decided to simply discard those tables. In case of PubTabNet we have computed missing bounding boxes for 48% of the simple and 69% of the complex tables. Regarding FinTabNet, 68% of the simple and 98% of the complex tables require the generation of bounding boxes."}, {"label": "text", "id": 14, "page_no": 10, "cluster": {"id": 14, "label": "text", "bbox": {"l": 50.111984, "t": 630.71014, "r": 286.36496, "b": 651.57269, "coord_origin": "TOPLEFT"}, "confidence": 0.9335853457450867, "cells": [{"id": 43, "text": "Figure 7 illustrates the distribution of the tables across", "bbox": {"l": 62.06698600000001, "t": 630.71014, "r": 286.36496, "b": 639.6167, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "different dimensions per dataset.", "bbox": {"l": 50.111984, "t": 642.66614, "r": 179.90472, "b": 651.57269, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 7 illustrates the distribution of the tables across different dimensions per dataset."}, {"label": "section_header", "id": 12, "page_no": 10, "cluster": {"id": 12, "label": "section_header", "bbox": {"l": 50.111984, "t": 662.39014, "r": 153.60785, "b": 672.24219, "coord_origin": "TOPLEFT"}, "confidence": 0.9515743255615234, "cells": [{"id": 45, "text": "1.2.", "bbox": {"l": 50.111984, "t": 662.39014, "r": 64.297272, "b": 672.24219, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "Synthetic datasets", "bbox": {"l": 73.754135, "t": 662.39014, "r": 153.60785, "b": 672.24219, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1.2. Synthetic datasets"}, {"label": "text", "id": 3, "page_no": 10, "cluster": {"id": 3, "label": "text", "bbox": {"l": 50.111984, "t": 681.33113, "r": 286.36505, "b": 714.147705, "coord_origin": "TOPLEFT"}, "confidence": 0.9783332347869873, "cells": [{"id": 47, "text": "Aiming to train and evaluate our models in a broader", "bbox": {"l": 62.06698600000001, "t": 681.33113, "r": 286.36493, "b": 690.2377, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "spectrum of table data we have synthesized four types of", "bbox": {"l": 50.111984, "t": 693.2861330000001, "r": 286.36505, "b": 702.1927029999999, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "datasets.", "bbox": {"l": 50.111984, "t": 705.241135, "r": 84.144226, "b": 714.147705, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Each one contains tables with different appear-", "bbox": {"l": 91.237595, "t": 705.241135, "r": 286.36505, "b": 714.147705, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Aiming to train and evaluate our models in a broader spectrum of table data we have synthesized four types of datasets. Each one contains tables with different appear-"}, {"label": "text", "id": 8, "page_no": 10, "cluster": {"id": 8, "label": "text", "bbox": {"l": 308.862, "t": 162.65515000000005, "r": 545.11511, "b": 207.42773, "coord_origin": "TOPLEFT"}, "confidence": 0.9596064686775208, "cells": [{"id": 51, "text": "ances in regard to their size, structure, style and content.", "bbox": {"l": 308.862, "t": 162.65515000000005, "r": 545.11511, "b": 171.56170999999995, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Every synthetic dataset contains 150k examples, summing", "bbox": {"l": 308.862, "t": 174.61017000000004, "r": 545.11511, "b": 183.51671999999996, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "up to 600k synthetic examples. All datasets are divided into", "bbox": {"l": 308.862, "t": 186.56519000000003, "r": 545.11511, "b": 195.47173999999995, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "Train, Test and Val splits (80%, 10%, 10%).", "bbox": {"l": 308.862, "t": 198.52117999999996, "r": 484.07434, "b": 207.42773, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "ances in regard to their size, structure, style and content. Every synthetic dataset contains 150k examples, summing up to 600k synthetic examples. All datasets are divided into Train, Test and Val splits (80%, 10%, 10%)."}, {"label": "text", "id": 15, "page_no": 10, "cluster": {"id": 15, "label": "text", "bbox": {"l": 308.862, "t": 211.23517000000004, "r": 545.11505, "b": 232.09673999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9261796474456787, "cells": [{"id": 55, "text": "The process of generating a synthetic dataset can be de-", "bbox": {"l": 320.81699, "t": 211.23517000000004, "r": 545.11505, "b": 220.14171999999996, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "composed into the following steps:", "bbox": {"l": 308.862, "t": 223.19019000000003, "r": 448.08939, "b": 232.09673999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The process of generating a synthetic dataset can be decomposed into the following steps:"}, {"label": "list_item", "id": 7, "page_no": 10, "cluster": {"id": 7, "label": "list_item", "bbox": {"l": 308.862, "t": 235.90521, "r": 545.11511, "b": 316.54279, "coord_origin": "TOPLEFT"}, "confidence": 0.9642952680587769, "cells": [{"id": 57, "text": "1.", "bbox": {"l": 320.81699, "t": 235.90521, "r": 328.28894, "b": 244.81177000000002, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Prepare styling and content templates: The styling", "bbox": {"l": 335.38232, "t": 235.90521, "r": 545.11499, "b": 244.81177000000002, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "templates have been manually designed and organized into", "bbox": {"l": 308.862, "t": 247.86023, "r": 545.11511, "b": 256.76678000000004, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "groups of scope specific appearances (e.g. financial data,", "bbox": {"l": 308.862, "t": 259.81525, "r": 545.11511, "b": 268.72180000000003, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "marketing data, etc.)", "bbox": {"l": 308.862, "t": 271.77026, "r": 393.3847, "b": 280.67682, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "Additionally, we have prepared cu-", "bbox": {"l": 400.11942, "t": 271.77026, "r": 545.11511, "b": 280.67682, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "rated collections of content templates by extracting the most", "bbox": {"l": 308.862, "t": 283.72524999999996, "r": 545.11505, "b": 292.63181, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "frequently used terms out of non-synthetic datasets (e.g.", "bbox": {"l": 308.862, "t": 295.68124, "r": 545.11511, "b": 304.5878000000001, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "PubTabNet, FinTabNet, etc.).", "bbox": {"l": 308.862, "t": 307.63623, "r": 425.69348, "b": 316.54279, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1. Prepare styling and content templates: The styling templates have been manually designed and organized into groups of scope specific appearances (e.g. financial data, marketing data, etc.) Additionally, we have prepared curated collections of content templates by extracting the most frequently used terms out of non-synthetic datasets (e.g. PubTabNet, FinTabNet, etc.)."}, {"label": "list_item", "id": 6, "page_no": 10, "cluster": {"id": 6, "label": "list_item", "bbox": {"l": 308.862, "t": 320.35022, "r": 545.11517, "b": 448.80865, "coord_origin": "TOPLEFT"}, "confidence": 0.9699994921684265, "cells": [{"id": 66, "text": "2.", "bbox": {"l": 320.81699, "t": 320.35022, "r": 328.4949, "b": 329.25677, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "Generate table structures: The structure of each syn-", "bbox": {"l": 331.05423, "t": 320.35022, "r": 545.11499, "b": 329.25677, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "thetic dataset assumes a horizontal table header which po-", "bbox": {"l": 308.862, "t": 332.30521000000005, "r": 545.11517, "b": 341.21176, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "tentially spans over multiple rows and a table body that", "bbox": {"l": 308.862, "t": 344.26018999999997, "r": 545.11505, "b": 353.16675, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "may contain a combination of row spans and column spans.", "bbox": {"l": 308.862, "t": 356.21619, "r": 545.11511, "b": 365.12273999999996, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "However, spans are not allowed to cross the header - body", "bbox": {"l": 308.862, "t": 368.17117, "r": 545.11511, "b": 377.07773, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "boundary. The table structure is described by the parame-", "bbox": {"l": 308.862, "t": 380.12616, "r": 545.11499, "b": 389.03271, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "ters: Total number of table rows and columns, number of", "bbox": {"l": 308.862, "t": 392.08115, "r": 545.11517, "b": 400.98769999999996, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "header rows, type of spans (header only spans, row only", "bbox": {"l": 308.862, "t": 404.03613000000007, "r": 545.11511, "b": 412.94269, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "spans, column only spans, both row and column spans),", "bbox": {"l": 308.862, "t": 415.99112, "r": 545.11499, "b": 424.89767, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "maximum span size and the ratio of the table area covered", "bbox": {"l": 308.862, "t": 427.94711, "r": 545.11517, "b": 436.85367, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "by spans.", "bbox": {"l": 308.862, "t": 439.9021, "r": 345.94278, "b": 448.80865, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2. Generate table structures: The structure of each synthetic dataset assumes a horizontal table header which potentially spans over multiple rows and a table body that may contain a combination of row spans and column spans. However, spans are not allowed to cross the header - body boundary. The table structure is described by the parameters: Total number of table rows and columns, number of header rows, type of spans (header only spans, row only spans, column only spans, both row and column spans), maximum span size and the ratio of the table area covered by spans."}, {"label": "list_item", "id": 9, "page_no": 10, "cluster": {"id": 9, "label": "list_item", "bbox": {"l": 308.862, "t": 452.61609, "r": 545.11517, "b": 497.38861, "coord_origin": "TOPLEFT"}, "confidence": 0.9568928480148315, "cells": [{"id": 78, "text": "3.", "bbox": {"l": 320.81699, "t": 452.61609, "r": 328.30341, "b": 461.52264, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "Generate content: Based on the dataset", "bbox": {"l": 330.79889, "t": 452.61609, "r": 485.75772000000006, "b": 461.52264, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "theme", "bbox": {"l": 488.073, "t": 452.70575, "r": 511.86368, "b": 461.29352, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": ", a set of", "bbox": {"l": 511.86301, "t": 452.61609, "r": 545.10815, "b": 461.52264, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "suitable content templates is chosen first. Then, this content", "bbox": {"l": 308.862, "t": 464.57108, "r": 545.11505, "b": 473.47763, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "can be combined with purely random text to produce the", "bbox": {"l": 308.862, "t": 476.52707, "r": 545.11517, "b": 485.43362, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "synthetic content.", "bbox": {"l": 308.862, "t": 488.48206, "r": 379.14816, "b": 497.38861, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3. Generate content: Based on the dataset theme , a set of suitable content templates is chosen first. Then, this content can be combined with purely random text to produce the synthetic content."}, {"label": "list_item", "id": 5, "page_no": 10, "cluster": {"id": 5, "label": "list_item", "bbox": {"l": 308.862, "t": 501.19604, "r": 545.1153, "b": 545.96858, "coord_origin": "TOPLEFT"}, "confidence": 0.9710659980773926, "cells": [{"id": 85, "text": "4.", "bbox": {"l": 320.81699, "t": 501.19604, "r": 328.66177, "b": 510.1026, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Apply styling templates: Depending on the domain", "bbox": {"l": 331.2767, "t": 501.19604, "r": 545.11493, "b": 510.1026, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "of the synthetic dataset, a set of styling templates is first", "bbox": {"l": 308.862, "t": 513.15103, "r": 545.1153, "b": 522.05759, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "manually selected.", "bbox": {"l": 308.862, "t": 525.10703, "r": 384.29883, "b": 534.01358, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "Then, a style is randomly selected to", "bbox": {"l": 391.25272, "t": 525.10703, "r": 545.11511, "b": 534.01358, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "format the appearance of the synthesized table.", "bbox": {"l": 308.862, "t": 537.06203, "r": 496.15897000000007, "b": 545.96858, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4. Apply styling templates: Depending on the domain of the synthetic dataset, a set of styling templates is first manually selected. Then, a style is randomly selected to format the appearance of the synthesized table."}, {"label": "list_item", "id": 4, "page_no": 10, "cluster": {"id": 4, "label": "list_item", "bbox": {"l": 308.862, "t": 549.77603, "r": 545.11517, "b": 606.50359, "coord_origin": "TOPLEFT"}, "confidence": 0.9778757095336914, "cells": [{"id": 91, "text": "5.", "bbox": {"l": 320.81699, "t": 549.77603, "r": 328.28894, "b": 558.68259, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Render the complete tables: The synthetic table is", "bbox": {"l": 335.40222, "t": 549.77603, "r": 545.11499, "b": 558.68259, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "finally rendered by a web browser engine to generate the", "bbox": {"l": 308.862, "t": 561.73103, "r": 545.11517, "b": 570.63759, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "bounding boxes for each table cell. A batching technique is", "bbox": {"l": 308.862, "t": 573.68604, "r": 545.11511, "b": 582.59259, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "utilized to optimize the runtime overhead of the rendering", "bbox": {"l": 308.862, "t": 585.64203, "r": 545.11505, "b": 594.54858, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "process.", "bbox": {"l": 308.862, "t": 597.59703, "r": 341.2305, "b": 606.50359, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5. Render the complete tables: The synthetic table is finally rendered by a web browser engine to generate the bounding boxes for each table cell. A batching technique is utilized to optimize the runtime overhead of the rendering process."}, {"label": "section_header", "id": 10, "page_no": 10, "cluster": {"id": 10, "label": "section_header", "bbox": {"l": 308.862, "t": 622.2905900000001, "r": 545.10876, "b": 646.98631, "coord_origin": "TOPLEFT"}, "confidence": 0.954940915107727, "cells": [{"id": 97, "text": "2.", "bbox": {"l": 308.862, "t": 622.2905900000001, "r": 316.76675, "b": 633.03831, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "Prediction post-processing for PDF docu-", "bbox": {"l": 327.30643, "t": 622.2905900000001, "r": 545.10876, "b": 633.03831, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "ments", "bbox": {"l": 326.79501, "t": 636.2385899999999, "r": 357.34055, "b": 646.98631, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2. Prediction post-processing for PDF documents"}, {"label": "text", "id": 1, "page_no": 10, "cluster": {"id": 1, "label": "text", "bbox": {"l": 308.86203, "t": 657.42104, "r": 545.11517, "b": 714.148605, "coord_origin": "TOPLEFT"}, "confidence": 0.9829329252243042, "cells": [{"id": 100, "text": "Although TableFormer can predict the table structure and", "bbox": {"l": 320.81702, "t": 657.42104, "r": 545.11499, "b": 666.3276, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "the bounding boxes for tables recognized inside PDF docu-", "bbox": {"l": 308.86203, "t": 669.37604, "r": 545.11511, "b": 678.2826, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "ments, this is not enough when a full reconstruction of the", "bbox": {"l": 308.86203, "t": 681.33104, "r": 545.11517, "b": 690.2376, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "original table is required. This happens mainly due the fol-", "bbox": {"l": 308.86203, "t": 693.286041, "r": 545.11505, "b": 702.1926040000001, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "lowing reasons:", "bbox": {"l": 308.86203, "t": 705.242035, "r": 371.42719, "b": 714.148605, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Although TableFormer can predict the table structure and the bounding boxes for tables recognized inside PDF documents, this is not enough when a full reconstruction of the original table is required. This happens mainly due the following reasons:"}], "headers": [{"label": "page_footer", "id": 16, "page_no": 10, "cluster": {"id": 16, "label": "page_footer", "bbox": {"l": 292.63104, "t": 734.1330379999999, "r": 302.59363, "b": 743.0396, "coord_origin": "TOPLEFT"}, "confidence": 0.8986663222312927, "cells": [{"id": 105, "text": "11", "bbox": {"l": 292.63104, "t": 734.1330379999999, "r": 302.59363, "b": 743.0396, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "11"}]}}, {"page_no": 11, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "PubTabNet", "bbox": {"l": 119.39108, "t": 77.31055000000003, "r": 151.94641, "b": 83.25922000000003, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "b.", "bbox": {"l": 53.345978, "t": 75.19152999999994, "r": 59.327053, "b": 81.14020000000005, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "FinTabNet", "bbox": {"l": 289.5791, "t": 77.45830999999998, "r": 319.8266, "b": 83.40698000000009, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Table Bank", "bbox": {"l": 448.37271, "t": 77.25396999999987, "r": 481.75916, "b": 83.20263999999997, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Train", "bbox": {"l": 82.553436, "t": 141.27617999999995, "r": 94.976013, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Complex", "bbox": {"l": 63.03878399999999, "t": 101.10413000000005, "r": 85.290085, "b": 106.06133999999986, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Simple", "bbox": {"l": 67.76786, "t": 124.39531999999997, "r": 85.231277, "b": 129.35253999999998, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Complex", "bbox": {"l": 227.55121, "t": 102.53992000000005, "r": 249.80251, "b": 107.49712999999997, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Simple", "bbox": {"l": 232.19898999999998, "t": 126.98577999999986, "r": 249.66241, "b": 131.94299, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Simple", "bbox": {"l": 396.2337, "t": 114.04522999999995, "r": 413.69711, "b": 119.00243999999998, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Val", "bbox": {"l": 97.382202, "t": 141.27617999999995, "r": 105.08014, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "100%", "bbox": {"l": 60.93763400000001, "t": 85.73321999999996, "r": 76.151443, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "500K 10K", "bbox": {"l": 82.304901, "t": 86.22351000000003, "r": 106.99162, "b": 91.18073000000015, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Train Test Val", "bbox": {"l": 246.20530999999997, "t": 141.60608000000002, "r": 281.88013, "b": 146.56329000000005, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "100%", "bbox": {"l": 226.69780000000003, "t": 85.73321999999996, "r": 241.91161, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "91K 10K 10K", "bbox": {"l": 249.93848999999997, "t": 86.08801000000005, "r": 282.49384, "b": 91.04522999999995, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Train Test Val", "bbox": {"l": 410.19409, "t": 141.27617999999995, "r": 444.68915, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "100% 130K 5K", "bbox": {"l": 391.37341, "t": 85.73321999999996, "r": 432.6716599999999, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "10K", "bbox": {"l": 435.60571000000004, "t": 86.26140999999996, "r": 445.62414999999993, "b": 91.21862999999996, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Complex", "bbox": {"l": 113.94921, "t": 141.28845, "r": 136.20052, "b": 146.24567000000002, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Non", "bbox": {"l": 116.91554000000001, "t": 94.81853999999998, "r": 127.05433999999998, "b": 99.77575999999999, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Strict", "bbox": {"l": 113.3146, "t": 100.93853999999999, "r": 127.05298, "b": 105.89575000000002, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "HTML", "bbox": {"l": 112.94112, "t": 107.05853000000013, "r": 127.05537, "b": 112.01575000000003, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Strict", "bbox": {"l": 113.22738999999999, "t": 122.61523, "r": 126.96577, "b": 127.57245, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "HTML", "bbox": {"l": 112.85390000000001, "t": 128.73523, "r": 126.96814999999998, "b": 133.69244000000003, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "Simple", "bbox": {"l": 138.57864, "t": 141.43640000000005, "r": 156.04207, "b": 146.39362000000006, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "230K 280K", "bbox": {"l": 122.03101, "t": 86.2713, "r": 151.04185, "b": 91.22852, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "65K", "bbox": {"l": 311.65359, "t": 86.55498999999998, "r": 321.67203, "b": 91.5122100000001, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Complex", "bbox": {"l": 287.89441, "t": 141.71063000000004, "r": 310.14572, "b": 146.66785000000004, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Non", "bbox": {"l": 289.23572, "t": 93.07977000000005, "r": 299.37451, "b": 98.03698999999995, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Strict", "bbox": {"l": 285.63513, "t": 99.19976999999994, "r": 299.3735, "b": 104.15698000000009, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "HTML", "bbox": {"l": 285.26111, "t": 105.31975999999997, "r": 299.37537, "b": 110.27697999999998, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Strict", "bbox": {"l": 285.43109, "t": 120.38995, "r": 299.16946, "b": 125.34717, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "HTML", "bbox": {"l": 285.05713, "t": 126.50995, "r": 299.17139, "b": 131.46716000000004, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Simple", "bbox": {"l": 311.34592, "t": 141.71063000000004, "r": 328.80933, "b": 146.66785000000004, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "47K", "bbox": {"l": 299.58362, "t": 86.69353999999998, "r": 309.60205, "b": 91.65075999999999, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Simple", "bbox": {"l": 466.04077000000007, "t": 141.67169, "r": 483.50418, "b": 146.62891000000002, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "Non", "bbox": {"l": 459.02151, "t": 93.76116999999999, "r": 469.16031000000004, "b": 98.71838000000002, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "Strict", "bbox": {"l": 455.4209, "t": 99.88116000000002, "r": 469.15927000000005, "b": 104.83838000000003, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "HTML", "bbox": {"l": 455.04691, "t": 106.00116000000014, "r": 469.16115999999994, "b": 110.95836999999995, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "145K", "bbox": {"l": 467.39401, "t": 85.57239000000004, "r": 480.6545100000001, "b": 90.52959999999996, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Complex", "bbox": {"l": 160.37672, "t": 141.58385999999996, "r": 182.62802, "b": 146.54107999999997, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "Contain", "bbox": {"l": 153.74265, "t": 94.86481000000003, "r": 173.32664, "b": 99.82201999999995, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Missing", "bbox": {"l": 154.50967, "t": 100.98479999999995, "r": 173.3246, "b": 105.94202000000007, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "bboxes", "bbox": {"l": 155.27162, "t": 107.10479999999995, "r": 173.32664, "b": 112.06200999999987, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Contain", "bbox": {"l": 326.41302, "t": 107.23248000000001, "r": 345.99701, "b": 112.18970000000002, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "Missing", "bbox": {"l": 327.17972, "t": 113.35248000000001, "r": 345.99463, "b": 118.30969000000005, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "bboxes", "bbox": {"l": 327.94131, "t": 119.47247000000004, "r": 345.99634, "b": 124.42969000000005, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Dataset", "bbox": {"l": 488.9942, "t": 104.15374999999983, "r": 508.76384999999993, "b": 109.11095999999998, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "doesn't", "bbox": {"l": 490.1893, "t": 110.27373999999998, "r": 508.76349000000005, "b": 115.2309600000001, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "provide", "bbox": {"l": 489.72009, "t": 116.39373999999998, "r": 508.76758, "b": 121.35095000000013, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "bboxes", "bbox": {"l": 490.71121, "t": 122.51373000000001, "r": 508.76624, "b": 127.47095000000002, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Simple", "bbox": {"l": 185.37759, "t": 141.71118, "r": 202.84102, "b": 146.66840000000002, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "230K 280K", "bbox": {"l": 168.50357, "t": 86.13611000000003, "r": 197.52699, "b": 91.09331999999995, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "65K", "bbox": {"l": 357.3768, "t": 85.99707000000001, "r": 367.39523, "b": 90.95428000000004, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "Complex Simple", "bbox": {"l": 333.73151, "t": 141.62323000000004, "r": 374.92862, "b": 146.58043999999995, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "47K", "bbox": {"l": 345.69101, "t": 86.05591000000004, "r": 355.70944, "b": 91.01312000000007, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Simple", "bbox": {"l": 508.54248, "t": 141.37683000000004, "r": 526.00592, "b": 146.33405000000005, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "145K", "bbox": {"l": 510.44653000000005, "t": 86.09258999999986, "r": 523.70703, "b": 91.0498, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Figure 7: Distribution of the tables across different dimensions per dataset. Simple vs complex tables per dataset and split,", "bbox": {"l": 50.112, "t": 165.50238000000002, "r": 545.11371, "b": 174.40894000000003, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "strict vs non strict html structures per dataset and table complexity, missing bboxes per dataset and table complexity.", "bbox": {"l": 50.112, "t": 177.4574, "r": 513.52234, "b": 186.36395000000005, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "\u2022", "bbox": {"l": 61.569, "t": 210.93140000000005, "r": 71.14743, "b": 219.83794999999998, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "TableFormer output does not include the table cell con-", "bbox": {"l": 73.542038, "t": 210.93140000000005, "r": 286.36511, "b": 219.83794999999998, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "tent.", "bbox": {"l": 70.037003, "t": 222.88640999999996, "r": 87.47155, "b": 231.79296999999997, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "\u2022", "bbox": {"l": 61.569, "t": 244.07141000000001, "r": 71.345718, "b": 252.97797000000003, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "There are occasional inaccuracies in the predictions of", "bbox": {"l": 73.789902, "t": 244.07141000000001, "r": 286.36514, "b": 252.97797000000003, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "the bounding boxes.", "bbox": {"l": 70.037003, "t": 256.02643, "r": 150.41524, "b": 264.93298000000004, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "However, it is possible to mitigate those limitations by", "bbox": {"l": 62.067001, "t": 279.20343, "r": 286.36499, "b": 288.10999, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "combining the TableFormer predictions with the informa-", "bbox": {"l": 50.112, "t": 291.15842, "r": 286.36505, "b": 300.06497, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "tion already present inside a programmatic PDF document.", "bbox": {"l": 50.112, "t": 303.1134, "r": 286.36511, "b": 312.01996, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "More specifically, PDF documents can be seen as a se-", "bbox": {"l": 50.112, "t": 315.06839, "r": 286.36511, "b": 323.97495, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "quence of PDF cells where each cell is described by its con-", "bbox": {"l": 50.112, "t": 327.02438, "r": 286.36511, "b": 335.93093999999996, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "tent and bounding box. If we are able to associate the PDF", "bbox": {"l": 50.112, "t": 338.97937, "r": 286.36505, "b": 347.88593, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "cells with the predicted table cells, we can directly link the", "bbox": {"l": 50.112, "t": 350.93436, "r": 286.36508, "b": 359.84091, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "PDF cell content to the table cell structure and use the PDF", "bbox": {"l": 50.112, "t": 362.88934, "r": 286.36511, "b": 371.7959, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "bounding boxes to correct misalignments in the predicted", "bbox": {"l": 50.112, "t": 374.84433000000007, "r": 286.36508, "b": 383.75089, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "table cell bounding boxes.", "bbox": {"l": 50.112, "t": 386.80032, "r": 154.55988, "b": 395.70688, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "Here is a step-by-step description of the prediction post-", "bbox": {"l": 62.067001, "t": 399.06934, "r": 286.36496, "b": 407.97589, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "processing:", "bbox": {"l": 50.112, "t": 411.02533, "r": 95.491638, "b": 419.93188, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "1.", "bbox": {"l": 62.067001, "t": 423.29532, "r": 69.37281, "b": 432.20187, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "Get the minimal grid dimensions - number of rows and", "bbox": {"l": 71.808075, "t": 423.29532, "r": 286.36502, "b": 432.20187, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "columns for the predicted table structure. This represents", "bbox": {"l": 50.112, "t": 435.25031, "r": 286.36508, "b": 444.15686, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "the most granular grid for the underlying table structure.", "bbox": {"l": 50.112, "t": 447.20529, "r": 274.50958, "b": 456.11185000000006, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "2.", "bbox": {"l": 62.067001, "t": 459.47528, "r": 69.538948, "b": 468.38184, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "Generate pair-wise matches between the bounding", "bbox": {"l": 77.429329, "t": 459.47528, "r": 286.36499, "b": 468.38184, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "boxes of the PDF cells and the predicted cells. The Intersec-", "bbox": {"l": 50.112, "t": 471.43027, "r": 286.36505, "b": 480.33682, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "tion Over Union (IOU) metric is used to evaluate the quality", "bbox": {"l": 50.112, "t": 483.38525, "r": 286.36505, "b": 492.29181, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "of the matches.", "bbox": {"l": 50.112, "t": 495.34024, "r": 110.70452999999999, "b": 504.2468, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "3.", "bbox": {"l": 62.067001, "t": 507.61023, "r": 69.863068, "b": 516.5167799999999, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "Use a carefully selected IOU threshold to designate", "bbox": {"l": 72.461754, "t": 507.61023, "r": 286.36493, "b": 516.5167799999999, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "the matches as \u201cgood\u201d ones and \u201cbad\u201d ones.", "bbox": {"l": 50.112, "t": 519.5662199999999, "r": 226.0714, "b": 528.4727800000001, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "3.a. If all IOU scores in a column are below the thresh-", "bbox": {"l": 62.067001, "t": 531.83521, "r": 286.36496, "b": 540.7417800000001, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "old, discard all predictions (structure and bounding boxes)", "bbox": {"l": 50.112, "t": 543.79121, "r": 286.36511, "b": 552.69777, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "for that column.", "bbox": {"l": 50.112, "t": 555.74622, "r": 114.03204, "b": 564.65277, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "4.", "bbox": {"l": 62.067001, "t": 568.01622, "r": 69.538948, "b": 576.92278, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "Find the best-fitting content alignment for the pre-", "bbox": {"l": 76.731949, "t": 568.01622, "r": 286.36502, "b": 576.92278, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "dicted cells with good IOU per each column. The alignment", "bbox": {"l": 50.112, "t": 579.97122, "r": 286.36508, "b": 588.87778, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "of the column can be identified by the following formula:", "bbox": {"l": 50.112, "t": 591.9262200000001, "r": 278.70383, "b": 600.83278, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "alignment", "bbox": {"l": 112.02799999999999, "t": 623.99382, "r": 157.9516, "b": 632.84061, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "= arg min", "bbox": {"l": 160.715, "t": 623.99382, "r": 203.4964, "b": 632.84061, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "c", "bbox": {"l": 185.58499, "t": 633.98305, "r": 189.14511, "b": 640.17578, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "{", "bbox": {"l": 203.49899, "t": 623.43591, "r": 208.48029, "b": 632.84061, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "D$_{c}$", "bbox": {"l": 208.48099, "t": 623.99382, "r": 220.28911, "b": 632.84061, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "}", "bbox": {"l": 220.78699, "t": 623.43591, "r": 225.76828, "b": 632.84061, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "D$_{c}$", "bbox": {"l": 110.70499, "t": 645.25882, "r": 122.51310999999998, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "=", "bbox": {"l": 125.77899000000001, "t": 645.25882, "r": 133.52791, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "max", "bbox": {"l": 136.295, "t": 645.25882, "r": 156.00201, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "{", "bbox": {"l": 156.00299, "t": 644.70091, "r": 160.98428, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "x$_{c}$", "bbox": {"l": 160.98399, "t": 645.25882, "r": 170.23811, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "} \u2212", "bbox": {"l": 170.73599, "t": 644.70091, "r": 185.6779, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "min", "bbox": {"l": 187.894, "t": 645.25882, "r": 206.05283, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "{", "bbox": {"l": 206.054, "t": 644.70091, "r": 211.03529, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "x$_{c}$", "bbox": {"l": 211.035, "t": 645.25882, "r": 220.28912, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "}", "bbox": {"l": 220.787, "t": 644.70091, "r": 225.76829999999998, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "(4)", "bbox": {"l": 274.746, "t": 634.88522, "r": 286.3624, "b": 643.79178, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "where", "bbox": {"l": 50.112, "t": 668.06522, "r": 74.45063, "b": 676.97179, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "c", "bbox": {"l": 78.335999, "t": 667.90582, "r": 82.647812, "b": 676.75261, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "is one of", "bbox": {"l": 86.532997, "t": 668.06522, "r": 123.63372, "b": 676.97179, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "{", "bbox": {"l": 127.51899999999999, "t": 667.3479199999999, "r": 132.50029, "b": 676.75261, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "left, centroid, right", "bbox": {"l": 132.50099, "t": 668.06522, "r": 210.69743, "b": 676.97179, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "}", "bbox": {"l": 210.69699, "t": 667.3479199999999, "r": 215.67828, "b": 676.75261, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "and", "bbox": {"l": 219.56299, "t": 668.06522, "r": 233.94897000000003, "b": 676.97179, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "x$_{c}$", "bbox": {"l": 237.83499000000003, "t": 667.90582, "r": 247.08911, "b": 676.75261, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "is the x-", "bbox": {"l": 251.47299000000004, "t": 668.06522, "r": 286.362, "b": 676.97179, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "coordinate for the corresponding point.", "bbox": {"l": 50.112, "t": 680.02022, "r": 205.88721, "b": 688.92679, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "5.", "bbox": {"l": 62.067001, "t": 692.290222, "r": 69.538948, "b": 701.196785, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "Use the alignment computed in step 4, to compute", "bbox": {"l": 76.273666, "t": 692.290222, "r": 286.36496, "b": 701.196785, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "the median", "bbox": {"l": 50.112, "t": 704.245224, "r": 94.604973, "b": 713.151787, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "x", "bbox": {"l": 97.598999, "t": 704.085815, "r": 103.29263, "b": 712.93261, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "-coordinate for all table columns and the me-", "bbox": {"l": 103.292, "t": 704.245224, "r": 286.36481, "b": 713.151787, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "dian cell size for all table cells. The usage of median dur-", "bbox": {"l": 308.862, "t": 210.93120999999996, "r": 545.11517, "b": 219.83776999999998, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "ing the computations, helps to eliminate outliers caused by", "bbox": {"l": 308.862, "t": 222.88720999999998, "r": 545.11511, "b": 231.79376000000002, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "occasional column spans which are usually wider than the", "bbox": {"l": 308.862, "t": 234.84222, "r": 545.11511, "b": 243.74878, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "normal.", "bbox": {"l": 308.862, "t": 246.79724, "r": 339.57669, "b": 255.7038, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "6.", "bbox": {"l": 320.81699, "t": 259.10222999999996, "r": 328.28894, "b": 268.00879, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "Snap all cells with bad IOU to their corresponding", "bbox": {"l": 334.88419, "t": 259.10222999999996, "r": 545.11499, "b": 268.00879, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "median", "bbox": {"l": 308.862, "t": 271.05724999999995, "r": 338.19189, "b": 279.96380999999997, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "x", "bbox": {"l": 340.68201, "t": 270.89783, "r": 346.37564, "b": 279.74463000000003, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "-coordinates and cell sizes.", "bbox": {"l": 346.37601, "t": 271.05724999999995, "r": 453.72305000000006, "b": 279.96380999999997, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "7.", "bbox": {"l": 320.81702, "t": 283.36325000000005, "r": 328.38953, "b": 292.26981, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "Generate a new set of pair-wise matches between the", "bbox": {"l": 330.9137, "t": 283.36325000000005, "r": 545.11499, "b": 292.26981, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "corrected bounding boxes and PDF cells. This time use a", "bbox": {"l": 308.86203, "t": 295.31824, "r": 545.11511, "b": 304.22479, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "modified version of the IOU metric, where the area of the", "bbox": {"l": 308.86203, "t": 307.27322, "r": 545.11505, "b": 316.17978, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "intersection between the predicted and PDF cells is divided", "bbox": {"l": 308.86203, "t": 319.22821000000005, "r": 545.11511, "b": 328.13477, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "by the PDF cell area.", "bbox": {"l": 308.86203, "t": 331.1842, "r": 397.19043, "b": 340.09076000000005, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "In case there are multiple matches", "bbox": {"l": 403.65616, "t": 331.1842, "r": 545.11511, "b": 340.09076000000005, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "for the same PDF cell, the prediction with the higher score", "bbox": {"l": 308.86203, "t": 343.13919, "r": 545.11511, "b": 352.04575, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "is preferred. This covers the cases where the PDF cells are", "bbox": {"l": 308.86203, "t": 355.09418, "r": 545.11505, "b": 364.00073, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "smaller than the area of predicted or corrected prediction", "bbox": {"l": 308.86203, "t": 367.04916, "r": 545.11505, "b": 375.95572000000004, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "cells.", "bbox": {"l": 308.86203, "t": 379.00415, "r": 329.61414, "b": 387.91071, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "8.", "bbox": {"l": 320.81702, "t": 391.31015, "r": 328.55356, "b": 400.2167099999999, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "In some rare occasions, we have noticed that Table-", "bbox": {"l": 331.13242, "t": 391.31015, "r": 545.11505, "b": 400.2167099999999, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "Former can confuse a single column as two. When the post-", "bbox": {"l": 308.86203, "t": 403.26514, "r": 545.11517, "b": 412.17169, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "processing steps are applied, this results with two predicted", "bbox": {"l": 308.86203, "t": 415.22012000000007, "r": 545.11511, "b": 424.12668, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "columns pointing to the same PDF column. In such case", "bbox": {"l": 308.86203, "t": 427.17511, "r": 545.11511, "b": 436.0816699999999, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "we must de-duplicate the columns according to highest to-", "bbox": {"l": 308.86203, "t": 439.1301, "r": 545.11505, "b": 448.03665, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "tal column intersection score.", "bbox": {"l": 308.86203, "t": 451.08507999999995, "r": 426.18161, "b": 459.99164, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "9.", "bbox": {"l": 320.81702, "t": 463.39108, "r": 328.67316, "b": 472.29764, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "Pick up the remaining orphan cells. There could be", "bbox": {"l": 331.29187, "t": 463.39108, "r": 545.11499, "b": 472.29764, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "cases, when after applying all the previous post-processing", "bbox": {"l": 308.86203, "t": 475.34607, "r": 545.11505, "b": 484.25262, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "steps, some PDF cells could still remain without any match", "bbox": {"l": 308.86203, "t": 487.30106, "r": 545.11517, "b": 496.20761, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "to predicted cells.", "bbox": {"l": 308.86203, "t": 499.25604, "r": 381.89786, "b": 508.1626, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "However, it is still possible to deduce", "bbox": {"l": 388.7023, "t": 499.25604, "r": 545.11517, "b": 508.1626, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "the correct matching for an orphan PDF cell by mapping its", "bbox": {"l": 308.86203, "t": 511.21204, "r": 545.11511, "b": 520.11859, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "bounding box on the geometry of the grid. This mapping", "bbox": {"l": 308.86203, "t": 523.16702, "r": 545.11505, "b": 532.07358, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "decides if the content of the orphan cell will be appended to", "bbox": {"l": 308.86203, "t": 535.12201, "r": 545.11499, "b": 544.02858, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "an already matched table cell, or a new table cell should be", "bbox": {"l": 308.86203, "t": 547.07703, "r": 545.11517, "b": 555.98358, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "created to match with the orphan.", "bbox": {"l": 308.86203, "t": 559.03203, "r": 442.22147000000007, "b": 567.93858, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "9a. Compute the top and bottom boundary of the hori-", "bbox": {"l": 320.81702, "t": 571.33803, "r": 545.11493, "b": 580.24458, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "zontal band for each grid row (min/max", "bbox": {"l": 308.86203, "t": 583.29303, "r": 471.64093, "b": 592.19958, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "y", "bbox": {"l": 474.83405, "t": 583.1336200000001, "r": 479.71872, "b": 591.98041, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "coordinates per", "bbox": {"l": 483.26903999999996, "t": 583.29303, "r": 545.11688, "b": 592.19958, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "row).", "bbox": {"l": 308.86206, "t": 595.24803, "r": 329.91306, "b": 604.15459, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "9b.", "bbox": {"l": 320.81705, "t": 607.55304, "r": 332.8718, "b": 616.4595899999999, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "Intersect the orphan\u2019s bounding box with the row", "bbox": {"l": 339.92532, "t": 607.55304, "r": 545.11505, "b": 616.4595899999999, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "bands, and map the cell to the closest grid row.", "bbox": {"l": 308.86206, "t": 619.50903, "r": 495.2923, "b": 628.4155900000001, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "9c. Compute the left and right boundary of the vertical", "bbox": {"l": 320.81705, "t": 631.81403, "r": 545.11505, "b": 640.72058, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "band for each grid column (min/max", "bbox": {"l": 308.86206, "t": 643.7690299999999, "r": 455.28238, "b": 652.67558, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "x", "bbox": {"l": 457.77704, "t": 643.60962, "r": 463.47067, "b": 652.45641, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "coordinates per col-", "bbox": {"l": 465.97104, "t": 643.7690299999999, "r": 545.11389, "b": 652.67558, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "umn).", "bbox": {"l": 308.86206, "t": 655.72403, "r": 332.38376, "b": 664.63059, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "9d. Intersect the orphan\u2019s bounding box with the column", "bbox": {"l": 320.81705, "t": 668.03003, "r": 545.11499, "b": 676.93659, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "bands, and map the cell to the closest grid column.", "bbox": {"l": 308.86206, "t": 679.98503, "r": 510.5848700000001, "b": 688.89159, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "9e. If the table cell under the identified row and column", "bbox": {"l": 320.81705, "t": 692.290024, "r": 545.11505, "b": 701.196594, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "is not empty, extend its content with the content of the or-", "bbox": {"l": 308.86206, "t": 704.245026, "r": 545.11517, "b": 713.151596, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": "12", "bbox": {"l": 292.63107, "t": 734.13303, "r": 302.59366, "b": 743.039593, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 30, "label": "picture", "bbox": {"l": 53.54227066040039, "t": 74.74854278564453, "r": 544.938232421875, "b": 147.59091186523438, "coord_origin": "TOPLEFT"}, "confidence": 0.6033818125724792, "cells": [{"id": 0, "text": "PubTabNet", "bbox": {"l": 119.39108, "t": 77.31055000000003, "r": 151.94641, "b": 83.25922000000003, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "b.", "bbox": {"l": 53.345978, "t": 75.19152999999994, "r": 59.327053, "b": 81.14020000000005, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "FinTabNet", "bbox": {"l": 289.5791, "t": 77.45830999999998, "r": 319.8266, "b": 83.40698000000009, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Table Bank", "bbox": {"l": 448.37271, "t": 77.25396999999987, "r": 481.75916, "b": 83.20263999999997, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Train", "bbox": {"l": 82.553436, "t": 141.27617999999995, "r": 94.976013, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Complex", "bbox": {"l": 63.03878399999999, "t": 101.10413000000005, "r": 85.290085, "b": 106.06133999999986, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Simple", "bbox": {"l": 67.76786, "t": 124.39531999999997, "r": 85.231277, "b": 129.35253999999998, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Complex", "bbox": {"l": 227.55121, "t": 102.53992000000005, "r": 249.80251, "b": 107.49712999999997, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Simple", "bbox": {"l": 232.19898999999998, "t": 126.98577999999986, "r": 249.66241, "b": 131.94299, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Simple", "bbox": {"l": 396.2337, "t": 114.04522999999995, "r": 413.69711, "b": 119.00243999999998, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Val", "bbox": {"l": 97.382202, "t": 141.27617999999995, "r": 105.08014, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "100%", "bbox": {"l": 60.93763400000001, "t": 85.73321999999996, "r": 76.151443, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "500K 10K", "bbox": {"l": 82.304901, "t": 86.22351000000003, "r": 106.99162, "b": 91.18073000000015, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Train Test Val", "bbox": {"l": 246.20530999999997, "t": 141.60608000000002, "r": 281.88013, "b": 146.56329000000005, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "100%", "bbox": {"l": 226.69780000000003, "t": 85.73321999999996, "r": 241.91161, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "91K 10K 10K", "bbox": {"l": 249.93848999999997, "t": 86.08801000000005, "r": 282.49384, "b": 91.04522999999995, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Train Test Val", "bbox": {"l": 410.19409, "t": 141.27617999999995, "r": 444.68915, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "100% 130K 5K", "bbox": {"l": 391.37341, "t": 85.73321999999996, "r": 432.6716599999999, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "10K", "bbox": {"l": 435.60571000000004, "t": 86.26140999999996, "r": 445.62414999999993, "b": 91.21862999999996, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Complex", "bbox": {"l": 113.94921, "t": 141.28845, "r": 136.20052, "b": 146.24567000000002, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Non", "bbox": {"l": 116.91554000000001, "t": 94.81853999999998, "r": 127.05433999999998, "b": 99.77575999999999, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Strict", "bbox": {"l": 113.3146, "t": 100.93853999999999, "r": 127.05298, "b": 105.89575000000002, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "HTML", "bbox": {"l": 112.94112, "t": 107.05853000000013, "r": 127.05537, "b": 112.01575000000003, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Strict", "bbox": {"l": 113.22738999999999, "t": 122.61523, "r": 126.96577, "b": 127.57245, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "HTML", "bbox": {"l": 112.85390000000001, "t": 128.73523, "r": 126.96814999999998, "b": 133.69244000000003, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "Simple", "bbox": {"l": 138.57864, "t": 141.43640000000005, "r": 156.04207, "b": 146.39362000000006, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "230K 280K", "bbox": {"l": 122.03101, "t": 86.2713, "r": 151.04185, "b": 91.22852, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "65K", "bbox": {"l": 311.65359, "t": 86.55498999999998, "r": 321.67203, "b": 91.5122100000001, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Complex", "bbox": {"l": 287.89441, "t": 141.71063000000004, "r": 310.14572, "b": 146.66785000000004, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Non", "bbox": {"l": 289.23572, "t": 93.07977000000005, "r": 299.37451, "b": 98.03698999999995, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Strict", "bbox": {"l": 285.63513, "t": 99.19976999999994, "r": 299.3735, "b": 104.15698000000009, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "HTML", "bbox": {"l": 285.26111, "t": 105.31975999999997, "r": 299.37537, "b": 110.27697999999998, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Strict", "bbox": {"l": 285.43109, "t": 120.38995, "r": 299.16946, "b": 125.34717, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "HTML", "bbox": {"l": 285.05713, "t": 126.50995, "r": 299.17139, "b": 131.46716000000004, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Simple", "bbox": {"l": 311.34592, "t": 141.71063000000004, "r": 328.80933, "b": 146.66785000000004, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "47K", "bbox": {"l": 299.58362, "t": 86.69353999999998, "r": 309.60205, "b": 91.65075999999999, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Simple", "bbox": {"l": 466.04077000000007, "t": 141.67169, "r": 483.50418, "b": 146.62891000000002, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "Non", "bbox": {"l": 459.02151, "t": 93.76116999999999, "r": 469.16031000000004, "b": 98.71838000000002, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "Strict", "bbox": {"l": 455.4209, "t": 99.88116000000002, "r": 469.15927000000005, "b": 104.83838000000003, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "HTML", "bbox": {"l": 455.04691, "t": 106.00116000000014, "r": 469.16115999999994, "b": 110.95836999999995, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "145K", "bbox": {"l": 467.39401, "t": 85.57239000000004, "r": 480.6545100000001, "b": 90.52959999999996, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Complex", "bbox": {"l": 160.37672, "t": 141.58385999999996, "r": 182.62802, "b": 146.54107999999997, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "Contain", "bbox": {"l": 153.74265, "t": 94.86481000000003, "r": 173.32664, "b": 99.82201999999995, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Missing", "bbox": {"l": 154.50967, "t": 100.98479999999995, "r": 173.3246, "b": 105.94202000000007, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "bboxes", "bbox": {"l": 155.27162, "t": 107.10479999999995, "r": 173.32664, "b": 112.06200999999987, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Contain", "bbox": {"l": 326.41302, "t": 107.23248000000001, "r": 345.99701, "b": 112.18970000000002, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "Missing", "bbox": {"l": 327.17972, "t": 113.35248000000001, "r": 345.99463, "b": 118.30969000000005, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "bboxes", "bbox": {"l": 327.94131, "t": 119.47247000000004, "r": 345.99634, "b": 124.42969000000005, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Dataset", "bbox": {"l": 488.9942, "t": 104.15374999999983, "r": 508.76384999999993, "b": 109.11095999999998, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "doesn't", "bbox": {"l": 490.1893, "t": 110.27373999999998, "r": 508.76349000000005, "b": 115.2309600000001, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "provide", "bbox": {"l": 489.72009, "t": 116.39373999999998, "r": 508.76758, "b": 121.35095000000013, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "bboxes", "bbox": {"l": 490.71121, "t": 122.51373000000001, "r": 508.76624, "b": 127.47095000000002, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Simple", "bbox": {"l": 185.37759, "t": 141.71118, "r": 202.84102, "b": 146.66840000000002, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "230K 280K", "bbox": {"l": 168.50357, "t": 86.13611000000003, "r": 197.52699, "b": 91.09331999999995, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "65K", "bbox": {"l": 357.3768, "t": 85.99707000000001, "r": 367.39523, "b": 90.95428000000004, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "Complex Simple", "bbox": {"l": 333.73151, "t": 141.62323000000004, "r": 374.92862, "b": 146.58043999999995, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "47K", "bbox": {"l": 345.69101, "t": 86.05591000000004, "r": 355.70944, "b": 91.01312000000007, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Simple", "bbox": {"l": 508.54248, "t": 141.37683000000004, "r": 526.00592, "b": 146.33405000000005, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "145K", "bbox": {"l": 510.44653000000005, "t": 86.09258999999986, "r": 523.70703, "b": 91.0498, "coord_origin": "TOPLEFT"}}], "children": [{"id": 26, "label": "text", "bbox": {"l": 119.39108, "t": 77.31055000000003, "r": 151.94641, "b": 83.25922000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 0, "text": "PubTabNet", "bbox": {"l": 119.39108, "t": 77.31055000000003, "r": 151.94641, "b": 83.25922000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 53.345978, "t": 75.19152999999994, "r": 59.327053, "b": 81.14020000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 1, "text": "b.", "bbox": {"l": 53.345978, "t": 75.19152999999994, "r": 59.327053, "b": 81.14020000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 289.5791, "t": 77.45830999999998, "r": 319.8266, "b": 83.40698000000009, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 2, "text": "FinTabNet", "bbox": {"l": 289.5791, "t": 77.45830999999998, "r": 319.8266, "b": 83.40698000000009, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 448.37271, "t": 77.25396999999987, "r": 481.75916, "b": 83.20263999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 3, "text": "Table Bank", "bbox": {"l": 448.37271, "t": 77.25396999999987, "r": 481.75916, "b": 83.20263999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 82.553436, "t": 141.27617999999995, "r": 94.976013, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 4, "text": "Train", "bbox": {"l": 82.553436, "t": 141.27617999999995, "r": 94.976013, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 63.03878399999999, "t": 101.10413000000005, "r": 85.290085, "b": 106.06133999999986, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 5, "text": "Complex", "bbox": {"l": 63.03878399999999, "t": 101.10413000000005, "r": 85.290085, "b": 106.06133999999986, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 67.76786, "t": 124.39531999999997, "r": 85.231277, "b": 129.35253999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": "Simple", "bbox": {"l": 67.76786, "t": 124.39531999999997, "r": 85.231277, "b": 129.35253999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 227.55121, "t": 102.53992000000005, "r": 249.80251, "b": 107.49712999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "Complex", "bbox": {"l": 227.55121, "t": 102.53992000000005, "r": 249.80251, "b": 107.49712999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 232.19898999999998, "t": 126.98577999999986, "r": 249.66241, "b": 131.94299, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "Simple", "bbox": {"l": 232.19898999999998, "t": 126.98577999999986, "r": 249.66241, "b": 131.94299, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 396.2337, "t": 114.04522999999995, "r": 413.69711, "b": 119.00243999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "Simple", "bbox": {"l": 396.2337, "t": 114.04522999999995, "r": 413.69711, "b": 119.00243999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 97.382202, "t": 141.27617999999995, "r": 105.08014, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "Val", "bbox": {"l": 97.382202, "t": 141.27617999999995, "r": 105.08014, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 60.93763400000001, "t": 85.73321999999996, "r": 76.151443, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "100%", "bbox": {"l": 60.93763400000001, "t": 85.73321999999996, "r": 76.151443, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 82.304901, "t": 86.22351000000003, "r": 106.99162, "b": 91.18073000000015, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "500K 10K", "bbox": {"l": 82.304901, "t": 86.22351000000003, "r": 106.99162, "b": 91.18073000000015, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 246.20530999999997, "t": 141.60608000000002, "r": 281.88013, "b": 146.56329000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "Train Test Val", "bbox": {"l": 246.20530999999997, "t": 141.60608000000002, "r": 281.88013, "b": 146.56329000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 226.69780000000003, "t": 85.73321999999996, "r": 241.91161, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "100%", "bbox": {"l": 226.69780000000003, "t": 85.73321999999996, "r": 241.91161, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 249.93848999999997, "t": 86.08801000000005, "r": 282.49384, "b": 91.04522999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "91K 10K 10K", "bbox": {"l": 249.93848999999997, "t": 86.08801000000005, "r": 282.49384, "b": 91.04522999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 410.19409, "t": 141.27617999999995, "r": 444.68915, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "Train Test Val", "bbox": {"l": 410.19409, "t": 141.27617999999995, "r": 444.68915, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 391.37341, "t": 85.73321999999996, "r": 432.6716599999999, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "100% 130K 5K", "bbox": {"l": 391.37341, "t": 85.73321999999996, "r": 432.6716599999999, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 435.60571000000004, "t": 86.26140999999996, "r": 445.62414999999993, "b": 91.21862999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "10K", "bbox": {"l": 435.60571000000004, "t": 86.26140999999996, "r": 445.62414999999993, "b": 91.21862999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 113.94921, "t": 141.28845, "r": 136.20052, "b": 146.24567000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "Complex", "bbox": {"l": 113.94921, "t": 141.28845, "r": 136.20052, "b": 146.24567000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 116.91554000000001, "t": 94.81853999999998, "r": 127.05433999999998, "b": 99.77575999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "Non", "bbox": {"l": 116.91554000000001, "t": 94.81853999999998, "r": 127.05433999999998, "b": 99.77575999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 113.3146, "t": 100.93853999999999, "r": 127.05298, "b": 105.89575000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "Strict", "bbox": {"l": 113.3146, "t": 100.93853999999999, "r": 127.05298, "b": 105.89575000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 112.94112, "t": 107.05853000000013, "r": 127.05537, "b": 112.01575000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "HTML", "bbox": {"l": 112.94112, "t": 107.05853000000013, "r": 127.05537, "b": 112.01575000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 113.22738999999999, "t": 122.61523, "r": 126.96577, "b": 127.57245, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "Strict", "bbox": {"l": 113.22738999999999, "t": 122.61523, "r": 126.96577, "b": 127.57245, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 112.85390000000001, "t": 128.73523, "r": 126.96814999999998, "b": 133.69244000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "HTML", "bbox": {"l": 112.85390000000001, "t": 128.73523, "r": 126.96814999999998, "b": 133.69244000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 138.57864, "t": 141.43640000000005, "r": 156.04207, "b": 146.39362000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "Simple", "bbox": {"l": 138.57864, "t": 141.43640000000005, "r": 156.04207, "b": 146.39362000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 122.03101, "t": 86.2713, "r": 151.04185, "b": 91.22852, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "230K 280K", "bbox": {"l": 122.03101, "t": 86.2713, "r": 151.04185, "b": 91.22852, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 311.65359, "t": 86.55498999999998, "r": 321.67203, "b": 91.5122100000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "65K", "bbox": {"l": 311.65359, "t": 86.55498999999998, "r": 321.67203, "b": 91.5122100000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 287.89441, "t": 141.71063000000004, "r": 310.14572, "b": 146.66785000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "Complex", "bbox": {"l": 287.89441, "t": 141.71063000000004, "r": 310.14572, "b": 146.66785000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 289.23572, "t": 93.07977000000005, "r": 299.37451, "b": 98.03698999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "Non", "bbox": {"l": 289.23572, "t": 93.07977000000005, "r": 299.37451, "b": 98.03698999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 285.63513, "t": 99.19976999999994, "r": 299.3735, "b": 104.15698000000009, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "Strict", "bbox": {"l": 285.63513, "t": 99.19976999999994, "r": 299.3735, "b": 104.15698000000009, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 285.26111, "t": 105.31975999999997, "r": 299.37537, "b": 110.27697999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "HTML", "bbox": {"l": 285.26111, "t": 105.31975999999997, "r": 299.37537, "b": 110.27697999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 285.43109, "t": 120.38995, "r": 299.16946, "b": 125.34717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "Strict", "bbox": {"l": 285.43109, "t": 120.38995, "r": 299.16946, "b": 125.34717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 285.05713, "t": 126.50995, "r": 299.17139, "b": 131.46716000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "HTML", "bbox": {"l": 285.05713, "t": 126.50995, "r": 299.17139, "b": 131.46716000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 311.34592, "t": 141.71063000000004, "r": 328.80933, "b": 146.66785000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "Simple", "bbox": {"l": 311.34592, "t": 141.71063000000004, "r": 328.80933, "b": 146.66785000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 299.58362, "t": 86.69353999999998, "r": 309.60205, "b": 91.65075999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "47K", "bbox": {"l": 299.58362, "t": 86.69353999999998, "r": 309.60205, "b": 91.65075999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 466.04077000000007, "t": 141.67169, "r": 483.50418, "b": 146.62891000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "Simple", "bbox": {"l": 466.04077000000007, "t": 141.67169, "r": 483.50418, "b": 146.62891000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 459.02151, "t": 93.76116999999999, "r": 469.16031000000004, "b": 98.71838000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "Non", "bbox": {"l": 459.02151, "t": 93.76116999999999, "r": 469.16031000000004, "b": 98.71838000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 455.4209, "t": 99.88116000000002, "r": 469.15927000000005, "b": 104.83838000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "Strict", "bbox": {"l": 455.4209, "t": 99.88116000000002, "r": 469.15927000000005, "b": 104.83838000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 455.04691, "t": 106.00116000000014, "r": 469.16115999999994, "b": 110.95836999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "HTML", "bbox": {"l": 455.04691, "t": 106.00116000000014, "r": 469.16115999999994, "b": 110.95836999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 467.39401, "t": 85.57239000000004, "r": 480.6545100000001, "b": 90.52959999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "145K", "bbox": {"l": 467.39401, "t": 85.57239000000004, "r": 480.6545100000001, "b": 90.52959999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 160.37672, "t": 141.58385999999996, "r": 182.62802, "b": 146.54107999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "Complex", "bbox": {"l": 160.37672, "t": 141.58385999999996, "r": 182.62802, "b": 146.54107999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 153.74265, "t": 94.86481000000003, "r": 173.32664, "b": 99.82201999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "Contain", "bbox": {"l": 153.74265, "t": 94.86481000000003, "r": 173.32664, "b": 99.82201999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 154.50967, "t": 100.98479999999995, "r": 173.3246, "b": 105.94202000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "Missing", "bbox": {"l": 154.50967, "t": 100.98479999999995, "r": 173.3246, "b": 105.94202000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 155.27162, "t": 107.10479999999995, "r": 173.32664, "b": 112.06200999999987, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "bboxes", "bbox": {"l": 155.27162, "t": 107.10479999999995, "r": 173.32664, "b": 112.06200999999987, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 326.41302, "t": 107.23248000000001, "r": 345.99701, "b": 112.18970000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "Contain", "bbox": {"l": 326.41302, "t": 107.23248000000001, "r": 345.99701, "b": 112.18970000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 327.17972, "t": 113.35248000000001, "r": 345.99463, "b": 118.30969000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "Missing", "bbox": {"l": 327.17972, "t": 113.35248000000001, "r": 345.99463, "b": 118.30969000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 327.94131, "t": 119.47247000000004, "r": 345.99634, "b": 124.42969000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "bboxes", "bbox": {"l": 327.94131, "t": 119.47247000000004, "r": 345.99634, "b": 124.42969000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 488.9942, "t": 104.15374999999983, "r": 508.76384999999993, "b": 109.11095999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "Dataset", "bbox": {"l": 488.9942, "t": 104.15374999999983, "r": 508.76384999999993, "b": 109.11095999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 490.1893, "t": 110.27373999999998, "r": 508.76349000000005, "b": 115.2309600000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "doesn't", "bbox": {"l": 490.1893, "t": 110.27373999999998, "r": 508.76349000000005, "b": 115.2309600000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 489.72009, "t": 116.39373999999998, "r": 508.76758, "b": 121.35095000000013, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "provide", "bbox": {"l": 489.72009, "t": 116.39373999999998, "r": 508.76758, "b": 121.35095000000013, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 490.71121, "t": 122.51373000000001, "r": 508.76624, "b": 127.47095000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "bboxes", "bbox": {"l": 490.71121, "t": 122.51373000000001, "r": 508.76624, "b": 127.47095000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 185.37759, "t": 141.71118, "r": 202.84102, "b": 146.66840000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "Simple", "bbox": {"l": 185.37759, "t": 141.71118, "r": 202.84102, "b": 146.66840000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 168.50357, "t": 86.13611000000003, "r": 197.52699, "b": 91.09331999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "230K 280K", "bbox": {"l": 168.50357, "t": 86.13611000000003, "r": 197.52699, "b": 91.09331999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 357.3768, "t": 85.99707000000001, "r": 367.39523, "b": 90.95428000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "65K", "bbox": {"l": 357.3768, "t": 85.99707000000001, "r": 367.39523, "b": 90.95428000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 333.73151, "t": 141.62323000000004, "r": 374.92862, "b": 146.58043999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "Complex Simple", "bbox": {"l": 333.73151, "t": 141.62323000000004, "r": 374.92862, "b": 146.58043999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 345.69101, "t": 86.05591000000004, "r": 355.70944, "b": 91.01312000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "47K", "bbox": {"l": 345.69101, "t": 86.05591000000004, "r": 355.70944, "b": 91.01312000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 508.54248, "t": 141.37683000000004, "r": 526.00592, "b": 146.33405000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "Simple", "bbox": {"l": 508.54248, "t": 141.37683000000004, "r": 526.00592, "b": 146.33405000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 510.44653000000005, "t": 86.09258999999986, "r": 523.70703, "b": 91.0498, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "145K", "bbox": {"l": 510.44653000000005, "t": 86.09258999999986, "r": 523.70703, "b": 91.0498, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 1, "label": "caption", "bbox": {"l": 50.112, "t": 165.50238000000002, "r": 545.11371, "b": 186.36395000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9661495685577393, "cells": [{"id": 59, "text": "Figure 7: Distribution of the tables across different dimensions per dataset. Simple vs complex tables per dataset and split,", "bbox": {"l": 50.112, "t": 165.50238000000002, "r": 545.11371, "b": 174.40894000000003, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "strict vs non strict html structures per dataset and table complexity, missing bboxes per dataset and table complexity.", "bbox": {"l": 50.112, "t": 177.4574, "r": 513.52234, "b": 186.36395000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "list_item", "bbox": {"l": 61.569, "t": 210.93140000000005, "r": 286.36511, "b": 231.79296999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9621952772140503, "cells": [{"id": 61, "text": "\u2022", "bbox": {"l": 61.569, "t": 210.93140000000005, "r": 71.14743, "b": 219.83794999999998, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "TableFormer output does not include the table cell con-", "bbox": {"l": 73.542038, "t": 210.93140000000005, "r": 286.36511, "b": 219.83794999999998, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "tent.", "bbox": {"l": 70.037003, "t": 222.88640999999996, "r": 87.47155, "b": 231.79296999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "list_item", "bbox": {"l": 61.569, "t": 244.07141000000001, "r": 286.36514, "b": 264.93298000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9629555344581604, "cells": [{"id": 64, "text": "\u2022", "bbox": {"l": 61.569, "t": 244.07141000000001, "r": 71.345718, "b": 252.97797000000003, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "There are occasional inaccuracies in the predictions of", "bbox": {"l": 73.789902, "t": 244.07141000000001, "r": 286.36514, "b": 252.97797000000003, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "the bounding boxes.", "bbox": {"l": 70.037003, "t": 256.02643, "r": 150.41524, "b": 264.93298000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 50.112, "t": 279.20343, "r": 286.36511, "b": 395.70688, "coord_origin": "TOPLEFT"}, "confidence": 0.9767085909843445, "cells": [{"id": 67, "text": "However, it is possible to mitigate those limitations by", "bbox": {"l": 62.067001, "t": 279.20343, "r": 286.36499, "b": 288.10999, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "combining the TableFormer predictions with the informa-", "bbox": {"l": 50.112, "t": 291.15842, "r": 286.36505, "b": 300.06497, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "tion already present inside a programmatic PDF document.", "bbox": {"l": 50.112, "t": 303.1134, "r": 286.36511, "b": 312.01996, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "More specifically, PDF documents can be seen as a se-", "bbox": {"l": 50.112, "t": 315.06839, "r": 286.36511, "b": 323.97495, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "quence of PDF cells where each cell is described by its con-", "bbox": {"l": 50.112, "t": 327.02438, "r": 286.36511, "b": 335.93093999999996, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "tent and bounding box. If we are able to associate the PDF", "bbox": {"l": 50.112, "t": 338.97937, "r": 286.36505, "b": 347.88593, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "cells with the predicted table cells, we can directly link the", "bbox": {"l": 50.112, "t": 350.93436, "r": 286.36508, "b": 359.84091, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "PDF cell content to the table cell structure and use the PDF", "bbox": {"l": 50.112, "t": 362.88934, "r": 286.36511, "b": 371.7959, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "bounding boxes to correct misalignments in the predicted", "bbox": {"l": 50.112, "t": 374.84433000000007, "r": 286.36508, "b": 383.75089, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "table cell bounding boxes.", "bbox": {"l": 50.112, "t": 386.80032, "r": 154.55988, "b": 395.70688, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 50.112, "t": 399.06934, "r": 286.36496, "b": 419.93188, "coord_origin": "TOPLEFT"}, "confidence": 0.934766411781311, "cells": [{"id": 77, "text": "Here is a step-by-step description of the prediction post-", "bbox": {"l": 62.067001, "t": 399.06934, "r": 286.36496, "b": 407.97589, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "processing:", "bbox": {"l": 50.112, "t": 411.02533, "r": 95.491638, "b": 419.93188, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "list_item", "bbox": {"l": 50.112, "t": 423.29532, "r": 286.36508, "b": 456.11185000000006, "coord_origin": "TOPLEFT"}, "confidence": 0.8280702233314514, "cells": [{"id": 79, "text": "1.", "bbox": {"l": 62.067001, "t": 423.29532, "r": 69.37281, "b": 432.20187, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "Get the minimal grid dimensions - number of rows and", "bbox": {"l": 71.808075, "t": 423.29532, "r": 286.36502, "b": 432.20187, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "columns for the predicted table structure. This represents", "bbox": {"l": 50.112, "t": 435.25031, "r": 286.36508, "b": 444.15686, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "the most granular grid for the underlying table structure.", "bbox": {"l": 50.112, "t": 447.20529, "r": 274.50958, "b": 456.11185000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "list_item", "bbox": {"l": 50.112, "t": 459.47528, "r": 286.36505, "b": 504.2468, "coord_origin": "TOPLEFT"}, "confidence": 0.9646760821342468, "cells": [{"id": 83, "text": "2.", "bbox": {"l": 62.067001, "t": 459.47528, "r": 69.538948, "b": 468.38184, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "Generate pair-wise matches between the bounding", "bbox": {"l": 77.429329, "t": 459.47528, "r": 286.36499, "b": 468.38184, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "boxes of the PDF cells and the predicted cells. The Intersec-", "bbox": {"l": 50.112, "t": 471.43027, "r": 286.36505, "b": 480.33682, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "tion Over Union (IOU) metric is used to evaluate the quality", "bbox": {"l": 50.112, "t": 483.38525, "r": 286.36505, "b": 492.29181, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "of the matches.", "bbox": {"l": 50.112, "t": 495.34024, "r": 110.70452999999999, "b": 504.2468, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "list_item", "bbox": {"l": 50.112, "t": 507.61023, "r": 286.36493, "b": 528.4727800000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9391399025917053, "cells": [{"id": 88, "text": "3.", "bbox": {"l": 62.067001, "t": 507.61023, "r": 69.863068, "b": 516.5167799999999, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "Use a carefully selected IOU threshold to designate", "bbox": {"l": 72.461754, "t": 507.61023, "r": 286.36493, "b": 516.5167799999999, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "the matches as \u201cgood\u201d ones and \u201cbad\u201d ones.", "bbox": {"l": 50.112, "t": 519.5662199999999, "r": 226.0714, "b": 528.4727800000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "list_item", "bbox": {"l": 50.112, "t": 531.83521, "r": 286.36511, "b": 564.65277, "coord_origin": "TOPLEFT"}, "confidence": 0.9491708874702454, "cells": [{"id": 91, "text": "3.a. If all IOU scores in a column are below the thresh-", "bbox": {"l": 62.067001, "t": 531.83521, "r": 286.36496, "b": 540.7417800000001, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "old, discard all predictions (structure and bounding boxes)", "bbox": {"l": 50.112, "t": 543.79121, "r": 286.36511, "b": 552.69777, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "for that column.", "bbox": {"l": 50.112, "t": 555.74622, "r": 114.03204, "b": 564.65277, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "list_item", "bbox": {"l": 50.112, "t": 568.01622, "r": 286.36508, "b": 600.83278, "coord_origin": "TOPLEFT"}, "confidence": 0.9587163329124451, "cells": [{"id": 94, "text": "4.", "bbox": {"l": 62.067001, "t": 568.01622, "r": 69.538948, "b": 576.92278, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "Find the best-fitting content alignment for the pre-", "bbox": {"l": 76.731949, "t": 568.01622, "r": 286.36502, "b": 576.92278, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "dicted cells with good IOU per each column. The alignment", "bbox": {"l": 50.112, "t": 579.97122, "r": 286.36508, "b": 588.87778, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "of the column can be identified by the following formula:", "bbox": {"l": 50.112, "t": 591.9262200000001, "r": 278.70383, "b": 600.83278, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "formula", "bbox": {"l": 110.70499, "t": 623.43591, "r": 286.3624, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9298412799835205, "cells": [{"id": 98, "text": "alignment", "bbox": {"l": 112.02799999999999, "t": 623.99382, "r": 157.9516, "b": 632.84061, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "= arg min", "bbox": {"l": 160.715, "t": 623.99382, "r": 203.4964, "b": 632.84061, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "c", "bbox": {"l": 185.58499, "t": 633.98305, "r": 189.14511, "b": 640.17578, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "{", "bbox": {"l": 203.49899, "t": 623.43591, "r": 208.48029, "b": 632.84061, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "D$_{c}$", "bbox": {"l": 208.48099, "t": 623.99382, "r": 220.28911, "b": 632.84061, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "}", "bbox": {"l": 220.78699, "t": 623.43591, "r": 225.76828, "b": 632.84061, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "D$_{c}$", "bbox": {"l": 110.70499, "t": 645.25882, "r": 122.51310999999998, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "=", "bbox": {"l": 125.77899000000001, "t": 645.25882, "r": 133.52791, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "max", "bbox": {"l": 136.295, "t": 645.25882, "r": 156.00201, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "{", "bbox": {"l": 156.00299, "t": 644.70091, "r": 160.98428, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "x$_{c}$", "bbox": {"l": 160.98399, "t": 645.25882, "r": 170.23811, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "} \u2212", "bbox": {"l": 170.73599, "t": 644.70091, "r": 185.6779, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "min", "bbox": {"l": 187.894, "t": 645.25882, "r": 206.05283, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "{", "bbox": {"l": 206.054, "t": 644.70091, "r": 211.03529, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "x$_{c}$", "bbox": {"l": 211.035, "t": 645.25882, "r": 220.28912, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "}", "bbox": {"l": 220.787, "t": 644.70091, "r": 225.76829999999998, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "(4)", "bbox": {"l": 274.746, "t": 634.88522, "r": 286.3624, "b": 643.79178, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "text", "bbox": {"l": 50.112, "t": 667.3479199999999, "r": 286.362, "b": 688.92679, "coord_origin": "TOPLEFT"}, "confidence": 0.9545555114746094, "cells": [{"id": 115, "text": "where", "bbox": {"l": 50.112, "t": 668.06522, "r": 74.45063, "b": 676.97179, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "c", "bbox": {"l": 78.335999, "t": 667.90582, "r": 82.647812, "b": 676.75261, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "is one of", "bbox": {"l": 86.532997, "t": 668.06522, "r": 123.63372, "b": 676.97179, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "{", "bbox": {"l": 127.51899999999999, "t": 667.3479199999999, "r": 132.50029, "b": 676.75261, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "left, centroid, right", "bbox": {"l": 132.50099, "t": 668.06522, "r": 210.69743, "b": 676.97179, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "}", "bbox": {"l": 210.69699, "t": 667.3479199999999, "r": 215.67828, "b": 676.75261, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "and", "bbox": {"l": 219.56299, "t": 668.06522, "r": 233.94897000000003, "b": 676.97179, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "x$_{c}$", "bbox": {"l": 237.83499000000003, "t": 667.90582, "r": 247.08911, "b": 676.75261, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "is the x-", "bbox": {"l": 251.47299000000004, "t": 668.06522, "r": 286.362, "b": 676.97179, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "coordinate for the corresponding point.", "bbox": {"l": 50.112, "t": 680.02022, "r": 205.88721, "b": 688.92679, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "list_item", "bbox": {"l": 50.112, "t": 692.290222, "r": 286.36496, "b": 713.151787, "coord_origin": "TOPLEFT"}, "confidence": 0.9260510206222534, "cells": [{"id": 125, "text": "5.", "bbox": {"l": 62.067001, "t": 692.290222, "r": 69.538948, "b": 701.196785, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "Use the alignment computed in step 4, to compute", "bbox": {"l": 76.273666, "t": 692.290222, "r": 286.36496, "b": 701.196785, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "the median", "bbox": {"l": 50.112, "t": 704.245224, "r": 94.604973, "b": 713.151787, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "x", "bbox": {"l": 97.598999, "t": 704.085815, "r": 103.29263, "b": 712.93261, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "-coordinate for all table columns and the me-", "bbox": {"l": 103.292, "t": 704.245224, "r": 286.36481, "b": 713.151787, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 308.862, "t": 210.93120999999996, "r": 545.11517, "b": 255.7038, "coord_origin": "TOPLEFT"}, "confidence": 0.8942298889160156, "cells": [{"id": 130, "text": "dian cell size for all table cells. The usage of median dur-", "bbox": {"l": 308.862, "t": 210.93120999999996, "r": 545.11517, "b": 219.83776999999998, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "ing the computations, helps to eliminate outliers caused by", "bbox": {"l": 308.862, "t": 222.88720999999998, "r": 545.11511, "b": 231.79376000000002, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "occasional column spans which are usually wider than the", "bbox": {"l": 308.862, "t": 234.84222, "r": 545.11511, "b": 243.74878, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "normal.", "bbox": {"l": 308.862, "t": 246.79724, "r": 339.57669, "b": 255.7038, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "list_item", "bbox": {"l": 308.862, "t": 259.10222999999996, "r": 545.11499, "b": 279.96380999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9423392415046692, "cells": [{"id": 134, "text": "6.", "bbox": {"l": 320.81699, "t": 259.10222999999996, "r": 328.28894, "b": 268.00879, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "Snap all cells with bad IOU to their corresponding", "bbox": {"l": 334.88419, "t": 259.10222999999996, "r": 545.11499, "b": 268.00879, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "median", "bbox": {"l": 308.862, "t": 271.05724999999995, "r": 338.19189, "b": 279.96380999999997, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "x", "bbox": {"l": 340.68201, "t": 270.89783, "r": 346.37564, "b": 279.74463000000003, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "-coordinates and cell sizes.", "bbox": {"l": 346.37601, "t": 271.05724999999995, "r": 453.72305000000006, "b": 279.96380999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "list_item", "bbox": {"l": 308.86203, "t": 283.36325000000005, "r": 545.11511, "b": 387.91071, "coord_origin": "TOPLEFT"}, "confidence": 0.9562004804611206, "cells": [{"id": 139, "text": "7.", "bbox": {"l": 320.81702, "t": 283.36325000000005, "r": 328.38953, "b": 292.26981, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "Generate a new set of pair-wise matches between the", "bbox": {"l": 330.9137, "t": 283.36325000000005, "r": 545.11499, "b": 292.26981, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "corrected bounding boxes and PDF cells. This time use a", "bbox": {"l": 308.86203, "t": 295.31824, "r": 545.11511, "b": 304.22479, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "modified version of the IOU metric, where the area of the", "bbox": {"l": 308.86203, "t": 307.27322, "r": 545.11505, "b": 316.17978, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "intersection between the predicted and PDF cells is divided", "bbox": {"l": 308.86203, "t": 319.22821000000005, "r": 545.11511, "b": 328.13477, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "by the PDF cell area.", "bbox": {"l": 308.86203, "t": 331.1842, "r": 397.19043, "b": 340.09076000000005, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "In case there are multiple matches", "bbox": {"l": 403.65616, "t": 331.1842, "r": 545.11511, "b": 340.09076000000005, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "for the same PDF cell, the prediction with the higher score", "bbox": {"l": 308.86203, "t": 343.13919, "r": 545.11511, "b": 352.04575, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "is preferred. This covers the cases where the PDF cells are", "bbox": {"l": 308.86203, "t": 355.09418, "r": 545.11505, "b": 364.00073, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "smaller than the area of predicted or corrected prediction", "bbox": {"l": 308.86203, "t": 367.04916, "r": 545.11505, "b": 375.95572000000004, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "cells.", "bbox": {"l": 308.86203, "t": 379.00415, "r": 329.61414, "b": 387.91071, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "list_item", "bbox": {"l": 308.86203, "t": 391.31015, "r": 545.11517, "b": 459.99164, "coord_origin": "TOPLEFT"}, "confidence": 0.8719939589500427, "cells": [{"id": 150, "text": "8.", "bbox": {"l": 320.81702, "t": 391.31015, "r": 328.55356, "b": 400.2167099999999, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "In some rare occasions, we have noticed that Table-", "bbox": {"l": 331.13242, "t": 391.31015, "r": 545.11505, "b": 400.2167099999999, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "Former can confuse a single column as two. When the post-", "bbox": {"l": 308.86203, "t": 403.26514, "r": 545.11517, "b": 412.17169, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "processing steps are applied, this results with two predicted", "bbox": {"l": 308.86203, "t": 415.22012000000007, "r": 545.11511, "b": 424.12668, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "columns pointing to the same PDF column. In such case", "bbox": {"l": 308.86203, "t": 427.17511, "r": 545.11511, "b": 436.0816699999999, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "we must de-duplicate the columns according to highest to-", "bbox": {"l": 308.86203, "t": 439.1301, "r": 545.11505, "b": 448.03665, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "tal column intersection score.", "bbox": {"l": 308.86203, "t": 451.08507999999995, "r": 426.18161, "b": 459.99164, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "list_item", "bbox": {"l": 308.86203, "t": 463.39108, "r": 545.11517, "b": 567.93858, "coord_origin": "TOPLEFT"}, "confidence": 0.9126082062721252, "cells": [{"id": 157, "text": "9.", "bbox": {"l": 320.81702, "t": 463.39108, "r": 328.67316, "b": 472.29764, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "Pick up the remaining orphan cells. There could be", "bbox": {"l": 331.29187, "t": 463.39108, "r": 545.11499, "b": 472.29764, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "cases, when after applying all the previous post-processing", "bbox": {"l": 308.86203, "t": 475.34607, "r": 545.11505, "b": 484.25262, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "steps, some PDF cells could still remain without any match", "bbox": {"l": 308.86203, "t": 487.30106, "r": 545.11517, "b": 496.20761, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "to predicted cells.", "bbox": {"l": 308.86203, "t": 499.25604, "r": 381.89786, "b": 508.1626, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "However, it is still possible to deduce", "bbox": {"l": 388.7023, "t": 499.25604, "r": 545.11517, "b": 508.1626, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "the correct matching for an orphan PDF cell by mapping its", "bbox": {"l": 308.86203, "t": 511.21204, "r": 545.11511, "b": 520.11859, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "bounding box on the geometry of the grid. This mapping", "bbox": {"l": 308.86203, "t": 523.16702, "r": 545.11505, "b": 532.07358, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "decides if the content of the orphan cell will be appended to", "bbox": {"l": 308.86203, "t": 535.12201, "r": 545.11499, "b": 544.02858, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "an already matched table cell, or a new table cell should be", "bbox": {"l": 308.86203, "t": 547.07703, "r": 545.11517, "b": 555.98358, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "created to match with the orphan.", "bbox": {"l": 308.86203, "t": 559.03203, "r": 442.22147000000007, "b": 567.93858, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 308.86203, "t": 571.33803, "r": 545.11688, "b": 604.15459, "coord_origin": "TOPLEFT"}, "confidence": 0.8459473848342896, "cells": [{"id": 168, "text": "9a. Compute the top and bottom boundary of the hori-", "bbox": {"l": 320.81702, "t": 571.33803, "r": 545.11493, "b": 580.24458, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "zontal band for each grid row (min/max", "bbox": {"l": 308.86203, "t": 583.29303, "r": 471.64093, "b": 592.19958, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "y", "bbox": {"l": 474.83405, "t": 583.1336200000001, "r": 479.71872, "b": 591.98041, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "coordinates per", "bbox": {"l": 483.26903999999996, "t": 583.29303, "r": 545.11688, "b": 592.19958, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "row).", "bbox": {"l": 308.86206, "t": 595.24803, "r": 329.91306, "b": 604.15459, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "list_item", "bbox": {"l": 308.86206, "t": 607.55304, "r": 545.11505, "b": 628.4155900000001, "coord_origin": "TOPLEFT"}, "confidence": 0.7716891169548035, "cells": [{"id": 173, "text": "9b.", "bbox": {"l": 320.81705, "t": 607.55304, "r": 332.8718, "b": 616.4595899999999, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "Intersect the orphan\u2019s bounding box with the row", "bbox": {"l": 339.92532, "t": 607.55304, "r": 545.11505, "b": 616.4595899999999, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "bands, and map the cell to the closest grid row.", "bbox": {"l": 308.86206, "t": 619.50903, "r": 495.2923, "b": 628.4155900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "list_item", "bbox": {"l": 308.86206, "t": 631.81403, "r": 545.11505, "b": 664.63059, "coord_origin": "TOPLEFT"}, "confidence": 0.8584907054901123, "cells": [{"id": 176, "text": "9c. Compute the left and right boundary of the vertical", "bbox": {"l": 320.81705, "t": 631.81403, "r": 545.11505, "b": 640.72058, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "band for each grid column (min/max", "bbox": {"l": 308.86206, "t": 643.7690299999999, "r": 455.28238, "b": 652.67558, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "x", "bbox": {"l": 457.77704, "t": 643.60962, "r": 463.47067, "b": 652.45641, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "coordinates per col-", "bbox": {"l": 465.97104, "t": 643.7690299999999, "r": 545.11389, "b": 652.67558, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "umn).", "bbox": {"l": 308.86206, "t": 655.72403, "r": 332.38376, "b": 664.63059, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "list_item", "bbox": {"l": 308.86206, "t": 668.03003, "r": 545.11499, "b": 688.89159, "coord_origin": "TOPLEFT"}, "confidence": 0.7590745091438293, "cells": [{"id": 181, "text": "9d. Intersect the orphan\u2019s bounding box with the column", "bbox": {"l": 320.81705, "t": 668.03003, "r": 545.11499, "b": 676.93659, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "bands, and map the cell to the closest grid column.", "bbox": {"l": 308.86206, "t": 679.98503, "r": 510.5848700000001, "b": 688.89159, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "list_item", "bbox": {"l": 308.86206, "t": 692.290024, "r": 545.11517, "b": 713.151596, "coord_origin": "TOPLEFT"}, "confidence": 0.6971189975738525, "cells": [{"id": 183, "text": "9e. If the table cell under the identified row and column", "bbox": {"l": 320.81705, "t": 692.290024, "r": 545.11505, "b": 701.196594, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "is not empty, extend its content with the content of the or-", "bbox": {"l": 308.86206, "t": 704.245026, "r": 545.11517, "b": 713.151596, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "page_footer", "bbox": {"l": 292.63107, "t": 734.13303, "r": 302.59366, "b": 743.039593, "coord_origin": "TOPLEFT"}, "confidence": 0.9126598238945007, "cells": [{"id": 185, "text": "12", "bbox": {"l": 292.63107, "t": 734.13303, "r": 302.59366, "b": 743.039593, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "picture", "id": 30, "page_no": 11, "cluster": {"id": 30, "label": "picture", "bbox": {"l": 53.54227066040039, "t": 74.74854278564453, "r": 544.938232421875, "b": 147.59091186523438, "coord_origin": "TOPLEFT"}, "confidence": 0.6033818125724792, "cells": [{"id": 0, "text": "PubTabNet", "bbox": {"l": 119.39108, "t": 77.31055000000003, "r": 151.94641, "b": 83.25922000000003, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "b.", "bbox": {"l": 53.345978, "t": 75.19152999999994, "r": 59.327053, "b": 81.14020000000005, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "FinTabNet", "bbox": {"l": 289.5791, "t": 77.45830999999998, "r": 319.8266, "b": 83.40698000000009, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Table Bank", "bbox": {"l": 448.37271, "t": 77.25396999999987, "r": 481.75916, "b": 83.20263999999997, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Train", "bbox": {"l": 82.553436, "t": 141.27617999999995, "r": 94.976013, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Complex", "bbox": {"l": 63.03878399999999, "t": 101.10413000000005, "r": 85.290085, "b": 106.06133999999986, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Simple", "bbox": {"l": 67.76786, "t": 124.39531999999997, "r": 85.231277, "b": 129.35253999999998, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Complex", "bbox": {"l": 227.55121, "t": 102.53992000000005, "r": 249.80251, "b": 107.49712999999997, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Simple", "bbox": {"l": 232.19898999999998, "t": 126.98577999999986, "r": 249.66241, "b": 131.94299, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Simple", "bbox": {"l": 396.2337, "t": 114.04522999999995, "r": 413.69711, "b": 119.00243999999998, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Val", "bbox": {"l": 97.382202, "t": 141.27617999999995, "r": 105.08014, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "100%", "bbox": {"l": 60.93763400000001, "t": 85.73321999999996, "r": 76.151443, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "500K 10K", "bbox": {"l": 82.304901, "t": 86.22351000000003, "r": 106.99162, "b": 91.18073000000015, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Train Test Val", "bbox": {"l": 246.20530999999997, "t": 141.60608000000002, "r": 281.88013, "b": 146.56329000000005, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "100%", "bbox": {"l": 226.69780000000003, "t": 85.73321999999996, "r": 241.91161, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "91K 10K 10K", "bbox": {"l": 249.93848999999997, "t": 86.08801000000005, "r": 282.49384, "b": 91.04522999999995, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Train Test Val", "bbox": {"l": 410.19409, "t": 141.27617999999995, "r": 444.68915, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "100% 130K 5K", "bbox": {"l": 391.37341, "t": 85.73321999999996, "r": 432.6716599999999, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "10K", "bbox": {"l": 435.60571000000004, "t": 86.26140999999996, "r": 445.62414999999993, "b": 91.21862999999996, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Complex", "bbox": {"l": 113.94921, "t": 141.28845, "r": 136.20052, "b": 146.24567000000002, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Non", "bbox": {"l": 116.91554000000001, "t": 94.81853999999998, "r": 127.05433999999998, "b": 99.77575999999999, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Strict", "bbox": {"l": 113.3146, "t": 100.93853999999999, "r": 127.05298, "b": 105.89575000000002, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "HTML", "bbox": {"l": 112.94112, "t": 107.05853000000013, "r": 127.05537, "b": 112.01575000000003, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Strict", "bbox": {"l": 113.22738999999999, "t": 122.61523, "r": 126.96577, "b": 127.57245, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "HTML", "bbox": {"l": 112.85390000000001, "t": 128.73523, "r": 126.96814999999998, "b": 133.69244000000003, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "Simple", "bbox": {"l": 138.57864, "t": 141.43640000000005, "r": 156.04207, "b": 146.39362000000006, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "230K 280K", "bbox": {"l": 122.03101, "t": 86.2713, "r": 151.04185, "b": 91.22852, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "65K", "bbox": {"l": 311.65359, "t": 86.55498999999998, "r": 321.67203, "b": 91.5122100000001, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Complex", "bbox": {"l": 287.89441, "t": 141.71063000000004, "r": 310.14572, "b": 146.66785000000004, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Non", "bbox": {"l": 289.23572, "t": 93.07977000000005, "r": 299.37451, "b": 98.03698999999995, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Strict", "bbox": {"l": 285.63513, "t": 99.19976999999994, "r": 299.3735, "b": 104.15698000000009, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "HTML", "bbox": {"l": 285.26111, "t": 105.31975999999997, "r": 299.37537, "b": 110.27697999999998, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Strict", "bbox": {"l": 285.43109, "t": 120.38995, "r": 299.16946, "b": 125.34717, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "HTML", "bbox": {"l": 285.05713, "t": 126.50995, "r": 299.17139, "b": 131.46716000000004, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Simple", "bbox": {"l": 311.34592, "t": 141.71063000000004, "r": 328.80933, "b": 146.66785000000004, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "47K", "bbox": {"l": 299.58362, "t": 86.69353999999998, "r": 309.60205, "b": 91.65075999999999, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Simple", "bbox": {"l": 466.04077000000007, "t": 141.67169, "r": 483.50418, "b": 146.62891000000002, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "Non", "bbox": {"l": 459.02151, "t": 93.76116999999999, "r": 469.16031000000004, "b": 98.71838000000002, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "Strict", "bbox": {"l": 455.4209, "t": 99.88116000000002, "r": 469.15927000000005, "b": 104.83838000000003, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "HTML", "bbox": {"l": 455.04691, "t": 106.00116000000014, "r": 469.16115999999994, "b": 110.95836999999995, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "145K", "bbox": {"l": 467.39401, "t": 85.57239000000004, "r": 480.6545100000001, "b": 90.52959999999996, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Complex", "bbox": {"l": 160.37672, "t": 141.58385999999996, "r": 182.62802, "b": 146.54107999999997, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "Contain", "bbox": {"l": 153.74265, "t": 94.86481000000003, "r": 173.32664, "b": 99.82201999999995, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Missing", "bbox": {"l": 154.50967, "t": 100.98479999999995, "r": 173.3246, "b": 105.94202000000007, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "bboxes", "bbox": {"l": 155.27162, "t": 107.10479999999995, "r": 173.32664, "b": 112.06200999999987, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Contain", "bbox": {"l": 326.41302, "t": 107.23248000000001, "r": 345.99701, "b": 112.18970000000002, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "Missing", "bbox": {"l": 327.17972, "t": 113.35248000000001, "r": 345.99463, "b": 118.30969000000005, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "bboxes", "bbox": {"l": 327.94131, "t": 119.47247000000004, "r": 345.99634, "b": 124.42969000000005, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Dataset", "bbox": {"l": 488.9942, "t": 104.15374999999983, "r": 508.76384999999993, "b": 109.11095999999998, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "doesn't", "bbox": {"l": 490.1893, "t": 110.27373999999998, "r": 508.76349000000005, "b": 115.2309600000001, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "provide", "bbox": {"l": 489.72009, "t": 116.39373999999998, "r": 508.76758, "b": 121.35095000000013, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "bboxes", "bbox": {"l": 490.71121, "t": 122.51373000000001, "r": 508.76624, "b": 127.47095000000002, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Simple", "bbox": {"l": 185.37759, "t": 141.71118, "r": 202.84102, "b": 146.66840000000002, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "230K 280K", "bbox": {"l": 168.50357, "t": 86.13611000000003, "r": 197.52699, "b": 91.09331999999995, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "65K", "bbox": {"l": 357.3768, "t": 85.99707000000001, "r": 367.39523, "b": 90.95428000000004, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "Complex Simple", "bbox": {"l": 333.73151, "t": 141.62323000000004, "r": 374.92862, "b": 146.58043999999995, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "47K", "bbox": {"l": 345.69101, "t": 86.05591000000004, "r": 355.70944, "b": 91.01312000000007, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Simple", "bbox": {"l": 508.54248, "t": 141.37683000000004, "r": 526.00592, "b": 146.33405000000005, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "145K", "bbox": {"l": 510.44653000000005, "t": 86.09258999999986, "r": 523.70703, "b": 91.0498, "coord_origin": "TOPLEFT"}}], "children": [{"id": 26, "label": "text", "bbox": {"l": 119.39108, "t": 77.31055000000003, "r": 151.94641, "b": 83.25922000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 0, "text": "PubTabNet", "bbox": {"l": 119.39108, "t": 77.31055000000003, "r": 151.94641, "b": 83.25922000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 53.345978, "t": 75.19152999999994, "r": 59.327053, "b": 81.14020000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 1, "text": "b.", "bbox": {"l": 53.345978, "t": 75.19152999999994, "r": 59.327053, "b": 81.14020000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 289.5791, "t": 77.45830999999998, "r": 319.8266, "b": 83.40698000000009, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 2, "text": "FinTabNet", "bbox": {"l": 289.5791, "t": 77.45830999999998, "r": 319.8266, "b": 83.40698000000009, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 448.37271, "t": 77.25396999999987, "r": 481.75916, "b": 83.20263999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 3, "text": "Table Bank", "bbox": {"l": 448.37271, "t": 77.25396999999987, "r": 481.75916, "b": 83.20263999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 82.553436, "t": 141.27617999999995, "r": 94.976013, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 4, "text": "Train", "bbox": {"l": 82.553436, "t": 141.27617999999995, "r": 94.976013, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 63.03878399999999, "t": 101.10413000000005, "r": 85.290085, "b": 106.06133999999986, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 5, "text": "Complex", "bbox": {"l": 63.03878399999999, "t": 101.10413000000005, "r": 85.290085, "b": 106.06133999999986, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 67.76786, "t": 124.39531999999997, "r": 85.231277, "b": 129.35253999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": "Simple", "bbox": {"l": 67.76786, "t": 124.39531999999997, "r": 85.231277, "b": 129.35253999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 227.55121, "t": 102.53992000000005, "r": 249.80251, "b": 107.49712999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "Complex", "bbox": {"l": 227.55121, "t": 102.53992000000005, "r": 249.80251, "b": 107.49712999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 232.19898999999998, "t": 126.98577999999986, "r": 249.66241, "b": 131.94299, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "Simple", "bbox": {"l": 232.19898999999998, "t": 126.98577999999986, "r": 249.66241, "b": 131.94299, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 396.2337, "t": 114.04522999999995, "r": 413.69711, "b": 119.00243999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "Simple", "bbox": {"l": 396.2337, "t": 114.04522999999995, "r": 413.69711, "b": 119.00243999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 97.382202, "t": 141.27617999999995, "r": 105.08014, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "Val", "bbox": {"l": 97.382202, "t": 141.27617999999995, "r": 105.08014, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 60.93763400000001, "t": 85.73321999999996, "r": 76.151443, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "100%", "bbox": {"l": 60.93763400000001, "t": 85.73321999999996, "r": 76.151443, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 82.304901, "t": 86.22351000000003, "r": 106.99162, "b": 91.18073000000015, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "500K 10K", "bbox": {"l": 82.304901, "t": 86.22351000000003, "r": 106.99162, "b": 91.18073000000015, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 246.20530999999997, "t": 141.60608000000002, "r": 281.88013, "b": 146.56329000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "Train Test Val", "bbox": {"l": 246.20530999999997, "t": 141.60608000000002, "r": 281.88013, "b": 146.56329000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 226.69780000000003, "t": 85.73321999999996, "r": 241.91161, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "100%", "bbox": {"l": 226.69780000000003, "t": 85.73321999999996, "r": 241.91161, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 249.93848999999997, "t": 86.08801000000005, "r": 282.49384, "b": 91.04522999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "91K 10K 10K", "bbox": {"l": 249.93848999999997, "t": 86.08801000000005, "r": 282.49384, "b": 91.04522999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 410.19409, "t": 141.27617999999995, "r": 444.68915, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "Train Test Val", "bbox": {"l": 410.19409, "t": 141.27617999999995, "r": 444.68915, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 391.37341, "t": 85.73321999999996, "r": 432.6716599999999, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "100% 130K 5K", "bbox": {"l": 391.37341, "t": 85.73321999999996, "r": 432.6716599999999, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 435.60571000000004, "t": 86.26140999999996, "r": 445.62414999999993, "b": 91.21862999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "10K", "bbox": {"l": 435.60571000000004, "t": 86.26140999999996, "r": 445.62414999999993, "b": 91.21862999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 113.94921, "t": 141.28845, "r": 136.20052, "b": 146.24567000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "Complex", "bbox": {"l": 113.94921, "t": 141.28845, "r": 136.20052, "b": 146.24567000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 116.91554000000001, "t": 94.81853999999998, "r": 127.05433999999998, "b": 99.77575999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "Non", "bbox": {"l": 116.91554000000001, "t": 94.81853999999998, "r": 127.05433999999998, "b": 99.77575999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 113.3146, "t": 100.93853999999999, "r": 127.05298, "b": 105.89575000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "Strict", "bbox": {"l": 113.3146, "t": 100.93853999999999, "r": 127.05298, "b": 105.89575000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 112.94112, "t": 107.05853000000013, "r": 127.05537, "b": 112.01575000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "HTML", "bbox": {"l": 112.94112, "t": 107.05853000000013, "r": 127.05537, "b": 112.01575000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 113.22738999999999, "t": 122.61523, "r": 126.96577, "b": 127.57245, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "Strict", "bbox": {"l": 113.22738999999999, "t": 122.61523, "r": 126.96577, "b": 127.57245, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 112.85390000000001, "t": 128.73523, "r": 126.96814999999998, "b": 133.69244000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "HTML", "bbox": {"l": 112.85390000000001, "t": 128.73523, "r": 126.96814999999998, "b": 133.69244000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 138.57864, "t": 141.43640000000005, "r": 156.04207, "b": 146.39362000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "Simple", "bbox": {"l": 138.57864, "t": 141.43640000000005, "r": 156.04207, "b": 146.39362000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 122.03101, "t": 86.2713, "r": 151.04185, "b": 91.22852, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "230K 280K", "bbox": {"l": 122.03101, "t": 86.2713, "r": 151.04185, "b": 91.22852, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 311.65359, "t": 86.55498999999998, "r": 321.67203, "b": 91.5122100000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "65K", "bbox": {"l": 311.65359, "t": 86.55498999999998, "r": 321.67203, "b": 91.5122100000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 287.89441, "t": 141.71063000000004, "r": 310.14572, "b": 146.66785000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "Complex", "bbox": {"l": 287.89441, "t": 141.71063000000004, "r": 310.14572, "b": 146.66785000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 289.23572, "t": 93.07977000000005, "r": 299.37451, "b": 98.03698999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "Non", "bbox": {"l": 289.23572, "t": 93.07977000000005, "r": 299.37451, "b": 98.03698999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 285.63513, "t": 99.19976999999994, "r": 299.3735, "b": 104.15698000000009, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "Strict", "bbox": {"l": 285.63513, "t": 99.19976999999994, "r": 299.3735, "b": 104.15698000000009, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 285.26111, "t": 105.31975999999997, "r": 299.37537, "b": 110.27697999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "HTML", "bbox": {"l": 285.26111, "t": 105.31975999999997, "r": 299.37537, "b": 110.27697999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 285.43109, "t": 120.38995, "r": 299.16946, "b": 125.34717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "Strict", "bbox": {"l": 285.43109, "t": 120.38995, "r": 299.16946, "b": 125.34717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 285.05713, "t": 126.50995, "r": 299.17139, "b": 131.46716000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "HTML", "bbox": {"l": 285.05713, "t": 126.50995, "r": 299.17139, "b": 131.46716000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 311.34592, "t": 141.71063000000004, "r": 328.80933, "b": 146.66785000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "Simple", "bbox": {"l": 311.34592, "t": 141.71063000000004, "r": 328.80933, "b": 146.66785000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 299.58362, "t": 86.69353999999998, "r": 309.60205, "b": 91.65075999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "47K", "bbox": {"l": 299.58362, "t": 86.69353999999998, "r": 309.60205, "b": 91.65075999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 466.04077000000007, "t": 141.67169, "r": 483.50418, "b": 146.62891000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "Simple", "bbox": {"l": 466.04077000000007, "t": 141.67169, "r": 483.50418, "b": 146.62891000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 459.02151, "t": 93.76116999999999, "r": 469.16031000000004, "b": 98.71838000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "Non", "bbox": {"l": 459.02151, "t": 93.76116999999999, "r": 469.16031000000004, "b": 98.71838000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 455.4209, "t": 99.88116000000002, "r": 469.15927000000005, "b": 104.83838000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "Strict", "bbox": {"l": 455.4209, "t": 99.88116000000002, "r": 469.15927000000005, "b": 104.83838000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 455.04691, "t": 106.00116000000014, "r": 469.16115999999994, "b": 110.95836999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "HTML", "bbox": {"l": 455.04691, "t": 106.00116000000014, "r": 469.16115999999994, "b": 110.95836999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 467.39401, "t": 85.57239000000004, "r": 480.6545100000001, "b": 90.52959999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "145K", "bbox": {"l": 467.39401, "t": 85.57239000000004, "r": 480.6545100000001, "b": 90.52959999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 160.37672, "t": 141.58385999999996, "r": 182.62802, "b": 146.54107999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "Complex", "bbox": {"l": 160.37672, "t": 141.58385999999996, "r": 182.62802, "b": 146.54107999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 153.74265, "t": 94.86481000000003, "r": 173.32664, "b": 99.82201999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "Contain", "bbox": {"l": 153.74265, "t": 94.86481000000003, "r": 173.32664, "b": 99.82201999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 154.50967, "t": 100.98479999999995, "r": 173.3246, "b": 105.94202000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "Missing", "bbox": {"l": 154.50967, "t": 100.98479999999995, "r": 173.3246, "b": 105.94202000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 155.27162, "t": 107.10479999999995, "r": 173.32664, "b": 112.06200999999987, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "bboxes", "bbox": {"l": 155.27162, "t": 107.10479999999995, "r": 173.32664, "b": 112.06200999999987, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 326.41302, "t": 107.23248000000001, "r": 345.99701, "b": 112.18970000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "Contain", "bbox": {"l": 326.41302, "t": 107.23248000000001, "r": 345.99701, "b": 112.18970000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 327.17972, "t": 113.35248000000001, "r": 345.99463, "b": 118.30969000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "Missing", "bbox": {"l": 327.17972, "t": 113.35248000000001, "r": 345.99463, "b": 118.30969000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 327.94131, "t": 119.47247000000004, "r": 345.99634, "b": 124.42969000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "bboxes", "bbox": {"l": 327.94131, "t": 119.47247000000004, "r": 345.99634, "b": 124.42969000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 488.9942, "t": 104.15374999999983, "r": 508.76384999999993, "b": 109.11095999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "Dataset", "bbox": {"l": 488.9942, "t": 104.15374999999983, "r": 508.76384999999993, "b": 109.11095999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 490.1893, "t": 110.27373999999998, "r": 508.76349000000005, "b": 115.2309600000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "doesn't", "bbox": {"l": 490.1893, "t": 110.27373999999998, "r": 508.76349000000005, "b": 115.2309600000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 489.72009, "t": 116.39373999999998, "r": 508.76758, "b": 121.35095000000013, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "provide", "bbox": {"l": 489.72009, "t": 116.39373999999998, "r": 508.76758, "b": 121.35095000000013, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 490.71121, "t": 122.51373000000001, "r": 508.76624, "b": 127.47095000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "bboxes", "bbox": {"l": 490.71121, "t": 122.51373000000001, "r": 508.76624, "b": 127.47095000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 185.37759, "t": 141.71118, "r": 202.84102, "b": 146.66840000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "Simple", "bbox": {"l": 185.37759, "t": 141.71118, "r": 202.84102, "b": 146.66840000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 168.50357, "t": 86.13611000000003, "r": 197.52699, "b": 91.09331999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "230K 280K", "bbox": {"l": 168.50357, "t": 86.13611000000003, "r": 197.52699, "b": 91.09331999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 357.3768, "t": 85.99707000000001, "r": 367.39523, "b": 90.95428000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "65K", "bbox": {"l": 357.3768, "t": 85.99707000000001, "r": 367.39523, "b": 90.95428000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 333.73151, "t": 141.62323000000004, "r": 374.92862, "b": 146.58043999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "Complex Simple", "bbox": {"l": 333.73151, "t": 141.62323000000004, "r": 374.92862, "b": 146.58043999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 345.69101, "t": 86.05591000000004, "r": 355.70944, "b": 91.01312000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "47K", "bbox": {"l": 345.69101, "t": 86.05591000000004, "r": 355.70944, "b": 91.01312000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 508.54248, "t": 141.37683000000004, "r": 526.00592, "b": 146.33405000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "Simple", "bbox": {"l": 508.54248, "t": 141.37683000000004, "r": 526.00592, "b": 146.33405000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 510.44653000000005, "t": 86.09258999999986, "r": 523.70703, "b": 91.0498, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "145K", "bbox": {"l": 510.44653000000005, "t": 86.09258999999986, "r": 523.70703, "b": 91.0498, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "caption", "id": 1, "page_no": 11, "cluster": {"id": 1, "label": "caption", "bbox": {"l": 50.112, "t": 165.50238000000002, "r": 545.11371, "b": 186.36395000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9661495685577393, "cells": [{"id": 59, "text": "Figure 7: Distribution of the tables across different dimensions per dataset. Simple vs complex tables per dataset and split,", "bbox": {"l": 50.112, "t": 165.50238000000002, "r": 545.11371, "b": 174.40894000000003, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "strict vs non strict html structures per dataset and table complexity, missing bboxes per dataset and table complexity.", "bbox": {"l": 50.112, "t": 177.4574, "r": 513.52234, "b": 186.36395000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 7: Distribution of the tables across different dimensions per dataset. Simple vs complex tables per dataset and split, strict vs non strict html structures per dataset and table complexity, missing bboxes per dataset and table complexity."}, {"label": "list_item", "id": 4, "page_no": 11, "cluster": {"id": 4, "label": "list_item", "bbox": {"l": 61.569, "t": 210.93140000000005, "r": 286.36511, "b": 231.79296999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9621952772140503, "cells": [{"id": 61, "text": "\u2022", "bbox": {"l": 61.569, "t": 210.93140000000005, "r": 71.14743, "b": 219.83794999999998, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "TableFormer output does not include the table cell con-", "bbox": {"l": 73.542038, "t": 210.93140000000005, "r": 286.36511, "b": 219.83794999999998, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "tent.", "bbox": {"l": 70.037003, "t": 222.88640999999996, "r": 87.47155, "b": 231.79296999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u00b7 TableFormer output does not include the table cell content."}, {"label": "list_item", "id": 3, "page_no": 11, "cluster": {"id": 3, "label": "list_item", "bbox": {"l": 61.569, "t": 244.07141000000001, "r": 286.36514, "b": 264.93298000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9629555344581604, "cells": [{"id": 64, "text": "\u2022", "bbox": {"l": 61.569, "t": 244.07141000000001, "r": 71.345718, "b": 252.97797000000003, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "There are occasional inaccuracies in the predictions of", "bbox": {"l": 73.789902, "t": 244.07141000000001, "r": 286.36514, "b": 252.97797000000003, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "the bounding boxes.", "bbox": {"l": 70.037003, "t": 256.02643, "r": 150.41524, "b": 264.93298000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u00b7 There are occasional inaccuracies in the predictions of the bounding boxes."}, {"label": "text", "id": 0, "page_no": 11, "cluster": {"id": 0, "label": "text", "bbox": {"l": 50.112, "t": 279.20343, "r": 286.36511, "b": 395.70688, "coord_origin": "TOPLEFT"}, "confidence": 0.9767085909843445, "cells": [{"id": 67, "text": "However, it is possible to mitigate those limitations by", "bbox": {"l": 62.067001, "t": 279.20343, "r": 286.36499, "b": 288.10999, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "combining the TableFormer predictions with the informa-", "bbox": {"l": 50.112, "t": 291.15842, "r": 286.36505, "b": 300.06497, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "tion already present inside a programmatic PDF document.", "bbox": {"l": 50.112, "t": 303.1134, "r": 286.36511, "b": 312.01996, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "More specifically, PDF documents can be seen as a se-", "bbox": {"l": 50.112, "t": 315.06839, "r": 286.36511, "b": 323.97495, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "quence of PDF cells where each cell is described by its con-", "bbox": {"l": 50.112, "t": 327.02438, "r": 286.36511, "b": 335.93093999999996, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "tent and bounding box. If we are able to associate the PDF", "bbox": {"l": 50.112, "t": 338.97937, "r": 286.36505, "b": 347.88593, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "cells with the predicted table cells, we can directly link the", "bbox": {"l": 50.112, "t": 350.93436, "r": 286.36508, "b": 359.84091, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "PDF cell content to the table cell structure and use the PDF", "bbox": {"l": 50.112, "t": 362.88934, "r": 286.36511, "b": 371.7959, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "bounding boxes to correct misalignments in the predicted", "bbox": {"l": 50.112, "t": 374.84433000000007, "r": 286.36508, "b": 383.75089, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "table cell bounding boxes.", "bbox": {"l": 50.112, "t": 386.80032, "r": 154.55988, "b": 395.70688, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "However, it is possible to mitigate those limitations by combining the TableFormer predictions with the information already present inside a programmatic PDF document. More specifically, PDF documents can be seen as a sequence of PDF cells where each cell is described by its content and bounding box. If we are able to associate the PDF cells with the predicted table cells, we can directly link the PDF cell content to the table cell structure and use the PDF bounding boxes to correct misalignments in the predicted table cell bounding boxes."}, {"label": "text", "id": 11, "page_no": 11, "cluster": {"id": 11, "label": "text", "bbox": {"l": 50.112, "t": 399.06934, "r": 286.36496, "b": 419.93188, "coord_origin": "TOPLEFT"}, "confidence": 0.934766411781311, "cells": [{"id": 77, "text": "Here is a step-by-step description of the prediction post-", "bbox": {"l": 62.067001, "t": 399.06934, "r": 286.36496, "b": 407.97589, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "processing:", "bbox": {"l": 50.112, "t": 411.02533, "r": 95.491638, "b": 419.93188, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Here is a step-by-step description of the prediction postprocessing:"}, {"label": "list_item", "id": 20, "page_no": 11, "cluster": {"id": 20, "label": "list_item", "bbox": {"l": 50.112, "t": 423.29532, "r": 286.36508, "b": 456.11185000000006, "coord_origin": "TOPLEFT"}, "confidence": 0.8280702233314514, "cells": [{"id": 79, "text": "1.", "bbox": {"l": 62.067001, "t": 423.29532, "r": 69.37281, "b": 432.20187, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "Get the minimal grid dimensions - number of rows and", "bbox": {"l": 71.808075, "t": 423.29532, "r": 286.36502, "b": 432.20187, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "columns for the predicted table structure. This represents", "bbox": {"l": 50.112, "t": 435.25031, "r": 286.36508, "b": 444.15686, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "the most granular grid for the underlying table structure.", "bbox": {"l": 50.112, "t": 447.20529, "r": 274.50958, "b": 456.11185000000006, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1. Get the minimal grid dimensions - number of rows and columns for the predicted table structure. This represents the most granular grid for the underlying table structure."}, {"label": "list_item", "id": 2, "page_no": 11, "cluster": {"id": 2, "label": "list_item", "bbox": {"l": 50.112, "t": 459.47528, "r": 286.36505, "b": 504.2468, "coord_origin": "TOPLEFT"}, "confidence": 0.9646760821342468, "cells": [{"id": 83, "text": "2.", "bbox": {"l": 62.067001, "t": 459.47528, "r": 69.538948, "b": 468.38184, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "Generate pair-wise matches between the bounding", "bbox": {"l": 77.429329, "t": 459.47528, "r": 286.36499, "b": 468.38184, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "boxes of the PDF cells and the predicted cells. The Intersec-", "bbox": {"l": 50.112, "t": 471.43027, "r": 286.36505, "b": 480.33682, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "tion Over Union (IOU) metric is used to evaluate the quality", "bbox": {"l": 50.112, "t": 483.38525, "r": 286.36505, "b": 492.29181, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "of the matches.", "bbox": {"l": 50.112, "t": 495.34024, "r": 110.70452999999999, "b": 504.2468, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2. Generate pair-wise matches between the bounding boxes of the PDF cells and the predicted cells. The Intersection Over Union (IOU) metric is used to evaluate the quality of the matches."}, {"label": "list_item", "id": 10, "page_no": 11, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 50.112, "t": 507.61023, "r": 286.36493, "b": 528.4727800000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9391399025917053, "cells": [{"id": 88, "text": "3.", "bbox": {"l": 62.067001, "t": 507.61023, "r": 69.863068, "b": 516.5167799999999, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "Use a carefully selected IOU threshold to designate", "bbox": {"l": 72.461754, "t": 507.61023, "r": 286.36493, "b": 516.5167799999999, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "the matches as \u201cgood\u201d ones and \u201cbad\u201d ones.", "bbox": {"l": 50.112, "t": 519.5662199999999, "r": 226.0714, "b": 528.4727800000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3. Use a carefully selected IOU threshold to designate the matches as \"good\" ones and \"bad\" ones."}, {"label": "list_item", "id": 8, "page_no": 11, "cluster": {"id": 8, "label": "list_item", "bbox": {"l": 50.112, "t": 531.83521, "r": 286.36511, "b": 564.65277, "coord_origin": "TOPLEFT"}, "confidence": 0.9491708874702454, "cells": [{"id": 91, "text": "3.a. If all IOU scores in a column are below the thresh-", "bbox": {"l": 62.067001, "t": 531.83521, "r": 286.36496, "b": 540.7417800000001, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "old, discard all predictions (structure and bounding boxes)", "bbox": {"l": 50.112, "t": 543.79121, "r": 286.36511, "b": 552.69777, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "for that column.", "bbox": {"l": 50.112, "t": 555.74622, "r": 114.03204, "b": 564.65277, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3.a. If all IOU scores in a column are below the threshold, discard all predictions (structure and bounding boxes) for that column."}, {"label": "list_item", "id": 5, "page_no": 11, "cluster": {"id": 5, "label": "list_item", "bbox": {"l": 50.112, "t": 568.01622, "r": 286.36508, "b": 600.83278, "coord_origin": "TOPLEFT"}, "confidence": 0.9587163329124451, "cells": [{"id": 94, "text": "4.", "bbox": {"l": 62.067001, "t": 568.01622, "r": 69.538948, "b": 576.92278, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "Find the best-fitting content alignment for the pre-", "bbox": {"l": 76.731949, "t": 568.01622, "r": 286.36502, "b": 576.92278, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "dicted cells with good IOU per each column. The alignment", "bbox": {"l": 50.112, "t": 579.97122, "r": 286.36508, "b": 588.87778, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "of the column can be identified by the following formula:", "bbox": {"l": 50.112, "t": 591.9262200000001, "r": 278.70383, "b": 600.83278, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4. Find the best-fitting content alignment for the predicted cells with good IOU per each column. The alignment of the column can be identified by the following formula:"}, {"label": "formula", "id": 12, "page_no": 11, "cluster": {"id": 12, "label": "formula", "bbox": {"l": 110.70499, "t": 623.43591, "r": 286.3624, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9298412799835205, "cells": [{"id": 98, "text": "alignment", "bbox": {"l": 112.02799999999999, "t": 623.99382, "r": 157.9516, "b": 632.84061, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "= arg min", "bbox": {"l": 160.715, "t": 623.99382, "r": 203.4964, "b": 632.84061, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "c", "bbox": {"l": 185.58499, "t": 633.98305, "r": 189.14511, "b": 640.17578, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "{", "bbox": {"l": 203.49899, "t": 623.43591, "r": 208.48029, "b": 632.84061, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "D$_{c}$", "bbox": {"l": 208.48099, "t": 623.99382, "r": 220.28911, "b": 632.84061, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "}", "bbox": {"l": 220.78699, "t": 623.43591, "r": 225.76828, "b": 632.84061, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "D$_{c}$", "bbox": {"l": 110.70499, "t": 645.25882, "r": 122.51310999999998, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "=", "bbox": {"l": 125.77899000000001, "t": 645.25882, "r": 133.52791, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "max", "bbox": {"l": 136.295, "t": 645.25882, "r": 156.00201, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "{", "bbox": {"l": 156.00299, "t": 644.70091, "r": 160.98428, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "x$_{c}$", "bbox": {"l": 160.98399, "t": 645.25882, "r": 170.23811, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "} \u2212", "bbox": {"l": 170.73599, "t": 644.70091, "r": 185.6779, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "min", "bbox": {"l": 187.894, "t": 645.25882, "r": 206.05283, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "{", "bbox": {"l": 206.054, "t": 644.70091, "r": 211.03529, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "x$_{c}$", "bbox": {"l": 211.035, "t": 645.25882, "r": 220.28912, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "}", "bbox": {"l": 220.787, "t": 644.70091, "r": 225.76829999999998, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "(4)", "bbox": {"l": 274.746, "t": 634.88522, "r": 286.3624, "b": 643.79178, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "alignment = arg min c { D$_{c}$ } D$_{c}$ = max { x$_{c}$ } \u2212 min { x$_{c}$ } (4)"}, {"label": "text", "id": 7, "page_no": 11, "cluster": {"id": 7, "label": "text", "bbox": {"l": 50.112, "t": 667.3479199999999, "r": 286.362, "b": 688.92679, "coord_origin": "TOPLEFT"}, "confidence": 0.9545555114746094, "cells": [{"id": 115, "text": "where", "bbox": {"l": 50.112, "t": 668.06522, "r": 74.45063, "b": 676.97179, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "c", "bbox": {"l": 78.335999, "t": 667.90582, "r": 82.647812, "b": 676.75261, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "is one of", "bbox": {"l": 86.532997, "t": 668.06522, "r": 123.63372, "b": 676.97179, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "{", "bbox": {"l": 127.51899999999999, "t": 667.3479199999999, "r": 132.50029, "b": 676.75261, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "left, centroid, right", "bbox": {"l": 132.50099, "t": 668.06522, "r": 210.69743, "b": 676.97179, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "}", "bbox": {"l": 210.69699, "t": 667.3479199999999, "r": 215.67828, "b": 676.75261, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "and", "bbox": {"l": 219.56299, "t": 668.06522, "r": 233.94897000000003, "b": 676.97179, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "x$_{c}$", "bbox": {"l": 237.83499000000003, "t": 667.90582, "r": 247.08911, "b": 676.75261, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "is the x-", "bbox": {"l": 251.47299000000004, "t": 668.06522, "r": 286.362, "b": 676.97179, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "coordinate for the corresponding point.", "bbox": {"l": 50.112, "t": 680.02022, "r": 205.88721, "b": 688.92679, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "where c is one of { left, centroid, right } and x$_{c}$ is the xcoordinate for the corresponding point."}, {"label": "list_item", "id": 13, "page_no": 11, "cluster": {"id": 13, "label": "list_item", "bbox": {"l": 50.112, "t": 692.290222, "r": 286.36496, "b": 713.151787, "coord_origin": "TOPLEFT"}, "confidence": 0.9260510206222534, "cells": [{"id": 125, "text": "5.", "bbox": {"l": 62.067001, "t": 692.290222, "r": 69.538948, "b": 701.196785, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "Use the alignment computed in step 4, to compute", "bbox": {"l": 76.273666, "t": 692.290222, "r": 286.36496, "b": 701.196785, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "the median", "bbox": {"l": 50.112, "t": 704.245224, "r": 94.604973, "b": 713.151787, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "x", "bbox": {"l": 97.598999, "t": 704.085815, "r": 103.29263, "b": 712.93261, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "-coordinate for all table columns and the me-", "bbox": {"l": 103.292, "t": 704.245224, "r": 286.36481, "b": 713.151787, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5. Use the alignment computed in step 4, to compute the median x -coordinate for all table columns and the me-"}, {"label": "text", "id": 16, "page_no": 11, "cluster": {"id": 16, "label": "text", "bbox": {"l": 308.862, "t": 210.93120999999996, "r": 545.11517, "b": 255.7038, "coord_origin": "TOPLEFT"}, "confidence": 0.8942298889160156, "cells": [{"id": 130, "text": "dian cell size for all table cells. The usage of median dur-", "bbox": {"l": 308.862, "t": 210.93120999999996, "r": 545.11517, "b": 219.83776999999998, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "ing the computations, helps to eliminate outliers caused by", "bbox": {"l": 308.862, "t": 222.88720999999998, "r": 545.11511, "b": 231.79376000000002, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "occasional column spans which are usually wider than the", "bbox": {"l": 308.862, "t": 234.84222, "r": 545.11511, "b": 243.74878, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "normal.", "bbox": {"l": 308.862, "t": 246.79724, "r": 339.57669, "b": 255.7038, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "dian cell size for all table cells. The usage of median during the computations, helps to eliminate outliers caused by occasional column spans which are usually wider than the normal."}, {"label": "list_item", "id": 9, "page_no": 11, "cluster": {"id": 9, "label": "list_item", "bbox": {"l": 308.862, "t": 259.10222999999996, "r": 545.11499, "b": 279.96380999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9423392415046692, "cells": [{"id": 134, "text": "6.", "bbox": {"l": 320.81699, "t": 259.10222999999996, "r": 328.28894, "b": 268.00879, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "Snap all cells with bad IOU to their corresponding", "bbox": {"l": 334.88419, "t": 259.10222999999996, "r": 545.11499, "b": 268.00879, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "median", "bbox": {"l": 308.862, "t": 271.05724999999995, "r": 338.19189, "b": 279.96380999999997, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "x", "bbox": {"l": 340.68201, "t": 270.89783, "r": 346.37564, "b": 279.74463000000003, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "-coordinates and cell sizes.", "bbox": {"l": 346.37601, "t": 271.05724999999995, "r": 453.72305000000006, "b": 279.96380999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "6. Snap all cells with bad IOU to their corresponding median x -coordinates and cell sizes."}, {"label": "list_item", "id": 6, "page_no": 11, "cluster": {"id": 6, "label": "list_item", "bbox": {"l": 308.86203, "t": 283.36325000000005, "r": 545.11511, "b": 387.91071, "coord_origin": "TOPLEFT"}, "confidence": 0.9562004804611206, "cells": [{"id": 139, "text": "7.", "bbox": {"l": 320.81702, "t": 283.36325000000005, "r": 328.38953, "b": 292.26981, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "Generate a new set of pair-wise matches between the", "bbox": {"l": 330.9137, "t": 283.36325000000005, "r": 545.11499, "b": 292.26981, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "corrected bounding boxes and PDF cells. This time use a", "bbox": {"l": 308.86203, "t": 295.31824, "r": 545.11511, "b": 304.22479, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "modified version of the IOU metric, where the area of the", "bbox": {"l": 308.86203, "t": 307.27322, "r": 545.11505, "b": 316.17978, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "intersection between the predicted and PDF cells is divided", "bbox": {"l": 308.86203, "t": 319.22821000000005, "r": 545.11511, "b": 328.13477, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "by the PDF cell area.", "bbox": {"l": 308.86203, "t": 331.1842, "r": 397.19043, "b": 340.09076000000005, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "In case there are multiple matches", "bbox": {"l": 403.65616, "t": 331.1842, "r": 545.11511, "b": 340.09076000000005, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "for the same PDF cell, the prediction with the higher score", "bbox": {"l": 308.86203, "t": 343.13919, "r": 545.11511, "b": 352.04575, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "is preferred. This covers the cases where the PDF cells are", "bbox": {"l": 308.86203, "t": 355.09418, "r": 545.11505, "b": 364.00073, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "smaller than the area of predicted or corrected prediction", "bbox": {"l": 308.86203, "t": 367.04916, "r": 545.11505, "b": 375.95572000000004, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "cells.", "bbox": {"l": 308.86203, "t": 379.00415, "r": 329.61414, "b": 387.91071, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "7. Generate a new set of pair-wise matches between the corrected bounding boxes and PDF cells. This time use a modified version of the IOU metric, where the area of the intersection between the predicted and PDF cells is divided by the PDF cell area. In case there are multiple matches for the same PDF cell, the prediction with the higher score is preferred. This covers the cases where the PDF cells are smaller than the area of predicted or corrected prediction cells."}, {"label": "list_item", "id": 17, "page_no": 11, "cluster": {"id": 17, "label": "list_item", "bbox": {"l": 308.86203, "t": 391.31015, "r": 545.11517, "b": 459.99164, "coord_origin": "TOPLEFT"}, "confidence": 0.8719939589500427, "cells": [{"id": 150, "text": "8.", "bbox": {"l": 320.81702, "t": 391.31015, "r": 328.55356, "b": 400.2167099999999, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "In some rare occasions, we have noticed that Table-", "bbox": {"l": 331.13242, "t": 391.31015, "r": 545.11505, "b": 400.2167099999999, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "Former can confuse a single column as two. When the post-", "bbox": {"l": 308.86203, "t": 403.26514, "r": 545.11517, "b": 412.17169, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "processing steps are applied, this results with two predicted", "bbox": {"l": 308.86203, "t": 415.22012000000007, "r": 545.11511, "b": 424.12668, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "columns pointing to the same PDF column. In such case", "bbox": {"l": 308.86203, "t": 427.17511, "r": 545.11511, "b": 436.0816699999999, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "we must de-duplicate the columns according to highest to-", "bbox": {"l": 308.86203, "t": 439.1301, "r": 545.11505, "b": 448.03665, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "tal column intersection score.", "bbox": {"l": 308.86203, "t": 451.08507999999995, "r": 426.18161, "b": 459.99164, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "8. In some rare occasions, we have noticed that TableFormer can confuse a single column as two. When the postprocessing steps are applied, this results with two predicted columns pointing to the same PDF column. In such case we must de-duplicate the columns according to highest total column intersection score."}, {"label": "list_item", "id": 15, "page_no": 11, "cluster": {"id": 15, "label": "list_item", "bbox": {"l": 308.86203, "t": 463.39108, "r": 545.11517, "b": 567.93858, "coord_origin": "TOPLEFT"}, "confidence": 0.9126082062721252, "cells": [{"id": 157, "text": "9.", "bbox": {"l": 320.81702, "t": 463.39108, "r": 328.67316, "b": 472.29764, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "Pick up the remaining orphan cells. There could be", "bbox": {"l": 331.29187, "t": 463.39108, "r": 545.11499, "b": 472.29764, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "cases, when after applying all the previous post-processing", "bbox": {"l": 308.86203, "t": 475.34607, "r": 545.11505, "b": 484.25262, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "steps, some PDF cells could still remain without any match", "bbox": {"l": 308.86203, "t": 487.30106, "r": 545.11517, "b": 496.20761, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "to predicted cells.", "bbox": {"l": 308.86203, "t": 499.25604, "r": 381.89786, "b": 508.1626, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "However, it is still possible to deduce", "bbox": {"l": 388.7023, "t": 499.25604, "r": 545.11517, "b": 508.1626, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "the correct matching for an orphan PDF cell by mapping its", "bbox": {"l": 308.86203, "t": 511.21204, "r": 545.11511, "b": 520.11859, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "bounding box on the geometry of the grid. This mapping", "bbox": {"l": 308.86203, "t": 523.16702, "r": 545.11505, "b": 532.07358, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "decides if the content of the orphan cell will be appended to", "bbox": {"l": 308.86203, "t": 535.12201, "r": 545.11499, "b": 544.02858, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "an already matched table cell, or a new table cell should be", "bbox": {"l": 308.86203, "t": 547.07703, "r": 545.11517, "b": 555.98358, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "created to match with the orphan.", "bbox": {"l": 308.86203, "t": 559.03203, "r": 442.22147000000007, "b": 567.93858, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "9. Pick up the remaining orphan cells. There could be cases, when after applying all the previous post-processing steps, some PDF cells could still remain without any match to predicted cells. However, it is still possible to deduce the correct matching for an orphan PDF cell by mapping its bounding box on the geometry of the grid. This mapping decides if the content of the orphan cell will be appended to an already matched table cell, or a new table cell should be created to match with the orphan."}, {"label": "text", "id": 19, "page_no": 11, "cluster": {"id": 19, "label": "text", "bbox": {"l": 308.86203, "t": 571.33803, "r": 545.11688, "b": 604.15459, "coord_origin": "TOPLEFT"}, "confidence": 0.8459473848342896, "cells": [{"id": 168, "text": "9a. Compute the top and bottom boundary of the hori-", "bbox": {"l": 320.81702, "t": 571.33803, "r": 545.11493, "b": 580.24458, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "zontal band for each grid row (min/max", "bbox": {"l": 308.86203, "t": 583.29303, "r": 471.64093, "b": 592.19958, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "y", "bbox": {"l": 474.83405, "t": 583.1336200000001, "r": 479.71872, "b": 591.98041, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "coordinates per", "bbox": {"l": 483.26903999999996, "t": 583.29303, "r": 545.11688, "b": 592.19958, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "row).", "bbox": {"l": 308.86206, "t": 595.24803, "r": 329.91306, "b": 604.15459, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "9a. Compute the top and bottom boundary of the horizontal band for each grid row (min/max y coordinates per row)."}, {"label": "list_item", "id": 21, "page_no": 11, "cluster": {"id": 21, "label": "list_item", "bbox": {"l": 308.86206, "t": 607.55304, "r": 545.11505, "b": 628.4155900000001, "coord_origin": "TOPLEFT"}, "confidence": 0.7716891169548035, "cells": [{"id": 173, "text": "9b.", "bbox": {"l": 320.81705, "t": 607.55304, "r": 332.8718, "b": 616.4595899999999, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "Intersect the orphan\u2019s bounding box with the row", "bbox": {"l": 339.92532, "t": 607.55304, "r": 545.11505, "b": 616.4595899999999, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "bands, and map the cell to the closest grid row.", "bbox": {"l": 308.86206, "t": 619.50903, "r": 495.2923, "b": 628.4155900000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "9b. Intersect the orphan's bounding box with the row bands, and map the cell to the closest grid row."}, {"label": "list_item", "id": 18, "page_no": 11, "cluster": {"id": 18, "label": "list_item", "bbox": {"l": 308.86206, "t": 631.81403, "r": 545.11505, "b": 664.63059, "coord_origin": "TOPLEFT"}, "confidence": 0.8584907054901123, "cells": [{"id": 176, "text": "9c. Compute the left and right boundary of the vertical", "bbox": {"l": 320.81705, "t": 631.81403, "r": 545.11505, "b": 640.72058, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "band for each grid column (min/max", "bbox": {"l": 308.86206, "t": 643.7690299999999, "r": 455.28238, "b": 652.67558, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "x", "bbox": {"l": 457.77704, "t": 643.60962, "r": 463.47067, "b": 652.45641, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "coordinates per col-", "bbox": {"l": 465.97104, "t": 643.7690299999999, "r": 545.11389, "b": 652.67558, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "umn).", "bbox": {"l": 308.86206, "t": 655.72403, "r": 332.38376, "b": 664.63059, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "9c. Compute the left and right boundary of the vertical band for each grid column (min/max x coordinates per column)."}, {"label": "list_item", "id": 22, "page_no": 11, "cluster": {"id": 22, "label": "list_item", "bbox": {"l": 308.86206, "t": 668.03003, "r": 545.11499, "b": 688.89159, "coord_origin": "TOPLEFT"}, "confidence": 0.7590745091438293, "cells": [{"id": 181, "text": "9d. Intersect the orphan\u2019s bounding box with the column", "bbox": {"l": 320.81705, "t": 668.03003, "r": 545.11499, "b": 676.93659, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "bands, and map the cell to the closest grid column.", "bbox": {"l": 308.86206, "t": 679.98503, "r": 510.5848700000001, "b": 688.89159, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "9d. Intersect the orphan's bounding box with the column bands, and map the cell to the closest grid column."}, {"label": "list_item", "id": 25, "page_no": 11, "cluster": {"id": 25, "label": "list_item", "bbox": {"l": 308.86206, "t": 692.290024, "r": 545.11517, "b": 713.151596, "coord_origin": "TOPLEFT"}, "confidence": 0.6971189975738525, "cells": [{"id": 183, "text": "9e. If the table cell under the identified row and column", "bbox": {"l": 320.81705, "t": 692.290024, "r": 545.11505, "b": 701.196594, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "is not empty, extend its content with the content of the or-", "bbox": {"l": 308.86206, "t": 704.245026, "r": 545.11517, "b": 713.151596, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "9e. If the table cell under the identified row and column is not empty, extend its content with the content of the or-"}, {"label": "page_footer", "id": 14, "page_no": 11, "cluster": {"id": 14, "label": "page_footer", "bbox": {"l": 292.63107, "t": 734.13303, "r": 302.59366, "b": 743.039593, "coord_origin": "TOPLEFT"}, "confidence": 0.9126598238945007, "cells": [{"id": 185, "text": "12", "bbox": {"l": 292.63107, "t": 734.13303, "r": 302.59366, "b": 743.039593, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "12"}], "body": [{"label": "picture", "id": 30, "page_no": 11, "cluster": {"id": 30, "label": "picture", "bbox": {"l": 53.54227066040039, "t": 74.74854278564453, "r": 544.938232421875, "b": 147.59091186523438, "coord_origin": "TOPLEFT"}, "confidence": 0.6033818125724792, "cells": [{"id": 0, "text": "PubTabNet", "bbox": {"l": 119.39108, "t": 77.31055000000003, "r": 151.94641, "b": 83.25922000000003, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "b.", "bbox": {"l": 53.345978, "t": 75.19152999999994, "r": 59.327053, "b": 81.14020000000005, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "FinTabNet", "bbox": {"l": 289.5791, "t": 77.45830999999998, "r": 319.8266, "b": 83.40698000000009, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Table Bank", "bbox": {"l": 448.37271, "t": 77.25396999999987, "r": 481.75916, "b": 83.20263999999997, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Train", "bbox": {"l": 82.553436, "t": 141.27617999999995, "r": 94.976013, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Complex", "bbox": {"l": 63.03878399999999, "t": 101.10413000000005, "r": 85.290085, "b": 106.06133999999986, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Simple", "bbox": {"l": 67.76786, "t": 124.39531999999997, "r": 85.231277, "b": 129.35253999999998, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Complex", "bbox": {"l": 227.55121, "t": 102.53992000000005, "r": 249.80251, "b": 107.49712999999997, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Simple", "bbox": {"l": 232.19898999999998, "t": 126.98577999999986, "r": 249.66241, "b": 131.94299, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Simple", "bbox": {"l": 396.2337, "t": 114.04522999999995, "r": 413.69711, "b": 119.00243999999998, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Val", "bbox": {"l": 97.382202, "t": 141.27617999999995, "r": 105.08014, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "100%", "bbox": {"l": 60.93763400000001, "t": 85.73321999999996, "r": 76.151443, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "500K 10K", "bbox": {"l": 82.304901, "t": 86.22351000000003, "r": 106.99162, "b": 91.18073000000015, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Train Test Val", "bbox": {"l": 246.20530999999997, "t": 141.60608000000002, "r": 281.88013, "b": 146.56329000000005, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "100%", "bbox": {"l": 226.69780000000003, "t": 85.73321999999996, "r": 241.91161, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "91K 10K 10K", "bbox": {"l": 249.93848999999997, "t": 86.08801000000005, "r": 282.49384, "b": 91.04522999999995, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Train Test Val", "bbox": {"l": 410.19409, "t": 141.27617999999995, "r": 444.68915, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "100% 130K 5K", "bbox": {"l": 391.37341, "t": 85.73321999999996, "r": 432.6716599999999, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "10K", "bbox": {"l": 435.60571000000004, "t": 86.26140999999996, "r": 445.62414999999993, "b": 91.21862999999996, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Complex", "bbox": {"l": 113.94921, "t": 141.28845, "r": 136.20052, "b": 146.24567000000002, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Non", "bbox": {"l": 116.91554000000001, "t": 94.81853999999998, "r": 127.05433999999998, "b": 99.77575999999999, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Strict", "bbox": {"l": 113.3146, "t": 100.93853999999999, "r": 127.05298, "b": 105.89575000000002, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "HTML", "bbox": {"l": 112.94112, "t": 107.05853000000013, "r": 127.05537, "b": 112.01575000000003, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Strict", "bbox": {"l": 113.22738999999999, "t": 122.61523, "r": 126.96577, "b": 127.57245, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "HTML", "bbox": {"l": 112.85390000000001, "t": 128.73523, "r": 126.96814999999998, "b": 133.69244000000003, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "Simple", "bbox": {"l": 138.57864, "t": 141.43640000000005, "r": 156.04207, "b": 146.39362000000006, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "230K 280K", "bbox": {"l": 122.03101, "t": 86.2713, "r": 151.04185, "b": 91.22852, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "65K", "bbox": {"l": 311.65359, "t": 86.55498999999998, "r": 321.67203, "b": 91.5122100000001, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Complex", "bbox": {"l": 287.89441, "t": 141.71063000000004, "r": 310.14572, "b": 146.66785000000004, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Non", "bbox": {"l": 289.23572, "t": 93.07977000000005, "r": 299.37451, "b": 98.03698999999995, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Strict", "bbox": {"l": 285.63513, "t": 99.19976999999994, "r": 299.3735, "b": 104.15698000000009, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "HTML", "bbox": {"l": 285.26111, "t": 105.31975999999997, "r": 299.37537, "b": 110.27697999999998, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Strict", "bbox": {"l": 285.43109, "t": 120.38995, "r": 299.16946, "b": 125.34717, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "HTML", "bbox": {"l": 285.05713, "t": 126.50995, "r": 299.17139, "b": 131.46716000000004, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Simple", "bbox": {"l": 311.34592, "t": 141.71063000000004, "r": 328.80933, "b": 146.66785000000004, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "47K", "bbox": {"l": 299.58362, "t": 86.69353999999998, "r": 309.60205, "b": 91.65075999999999, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Simple", "bbox": {"l": 466.04077000000007, "t": 141.67169, "r": 483.50418, "b": 146.62891000000002, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "Non", "bbox": {"l": 459.02151, "t": 93.76116999999999, "r": 469.16031000000004, "b": 98.71838000000002, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "Strict", "bbox": {"l": 455.4209, "t": 99.88116000000002, "r": 469.15927000000005, "b": 104.83838000000003, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "HTML", "bbox": {"l": 455.04691, "t": 106.00116000000014, "r": 469.16115999999994, "b": 110.95836999999995, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "145K", "bbox": {"l": 467.39401, "t": 85.57239000000004, "r": 480.6545100000001, "b": 90.52959999999996, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Complex", "bbox": {"l": 160.37672, "t": 141.58385999999996, "r": 182.62802, "b": 146.54107999999997, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "Contain", "bbox": {"l": 153.74265, "t": 94.86481000000003, "r": 173.32664, "b": 99.82201999999995, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Missing", "bbox": {"l": 154.50967, "t": 100.98479999999995, "r": 173.3246, "b": 105.94202000000007, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "bboxes", "bbox": {"l": 155.27162, "t": 107.10479999999995, "r": 173.32664, "b": 112.06200999999987, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Contain", "bbox": {"l": 326.41302, "t": 107.23248000000001, "r": 345.99701, "b": 112.18970000000002, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "Missing", "bbox": {"l": 327.17972, "t": 113.35248000000001, "r": 345.99463, "b": 118.30969000000005, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "bboxes", "bbox": {"l": 327.94131, "t": 119.47247000000004, "r": 345.99634, "b": 124.42969000000005, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Dataset", "bbox": {"l": 488.9942, "t": 104.15374999999983, "r": 508.76384999999993, "b": 109.11095999999998, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "doesn't", "bbox": {"l": 490.1893, "t": 110.27373999999998, "r": 508.76349000000005, "b": 115.2309600000001, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "provide", "bbox": {"l": 489.72009, "t": 116.39373999999998, "r": 508.76758, "b": 121.35095000000013, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "bboxes", "bbox": {"l": 490.71121, "t": 122.51373000000001, "r": 508.76624, "b": 127.47095000000002, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Simple", "bbox": {"l": 185.37759, "t": 141.71118, "r": 202.84102, "b": 146.66840000000002, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "230K 280K", "bbox": {"l": 168.50357, "t": 86.13611000000003, "r": 197.52699, "b": 91.09331999999995, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "65K", "bbox": {"l": 357.3768, "t": 85.99707000000001, "r": 367.39523, "b": 90.95428000000004, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "Complex Simple", "bbox": {"l": 333.73151, "t": 141.62323000000004, "r": 374.92862, "b": 146.58043999999995, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "47K", "bbox": {"l": 345.69101, "t": 86.05591000000004, "r": 355.70944, "b": 91.01312000000007, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Simple", "bbox": {"l": 508.54248, "t": 141.37683000000004, "r": 526.00592, "b": 146.33405000000005, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "145K", "bbox": {"l": 510.44653000000005, "t": 86.09258999999986, "r": 523.70703, "b": 91.0498, "coord_origin": "TOPLEFT"}}], "children": [{"id": 26, "label": "text", "bbox": {"l": 119.39108, "t": 77.31055000000003, "r": 151.94641, "b": 83.25922000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 0, "text": "PubTabNet", "bbox": {"l": 119.39108, "t": 77.31055000000003, "r": 151.94641, "b": 83.25922000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 53.345978, "t": 75.19152999999994, "r": 59.327053, "b": 81.14020000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 1, "text": "b.", "bbox": {"l": 53.345978, "t": 75.19152999999994, "r": 59.327053, "b": 81.14020000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 289.5791, "t": 77.45830999999998, "r": 319.8266, "b": 83.40698000000009, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 2, "text": "FinTabNet", "bbox": {"l": 289.5791, "t": 77.45830999999998, "r": 319.8266, "b": 83.40698000000009, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 448.37271, "t": 77.25396999999987, "r": 481.75916, "b": 83.20263999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 3, "text": "Table Bank", "bbox": {"l": 448.37271, "t": 77.25396999999987, "r": 481.75916, "b": 83.20263999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 82.553436, "t": 141.27617999999995, "r": 94.976013, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 4, "text": "Train", "bbox": {"l": 82.553436, "t": 141.27617999999995, "r": 94.976013, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 63.03878399999999, "t": 101.10413000000005, "r": 85.290085, "b": 106.06133999999986, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 5, "text": "Complex", "bbox": {"l": 63.03878399999999, "t": 101.10413000000005, "r": 85.290085, "b": 106.06133999999986, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 67.76786, "t": 124.39531999999997, "r": 85.231277, "b": 129.35253999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": "Simple", "bbox": {"l": 67.76786, "t": 124.39531999999997, "r": 85.231277, "b": 129.35253999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 227.55121, "t": 102.53992000000005, "r": 249.80251, "b": 107.49712999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "Complex", "bbox": {"l": 227.55121, "t": 102.53992000000005, "r": 249.80251, "b": 107.49712999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 232.19898999999998, "t": 126.98577999999986, "r": 249.66241, "b": 131.94299, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "Simple", "bbox": {"l": 232.19898999999998, "t": 126.98577999999986, "r": 249.66241, "b": 131.94299, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 396.2337, "t": 114.04522999999995, "r": 413.69711, "b": 119.00243999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "Simple", "bbox": {"l": 396.2337, "t": 114.04522999999995, "r": 413.69711, "b": 119.00243999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 97.382202, "t": 141.27617999999995, "r": 105.08014, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "Val", "bbox": {"l": 97.382202, "t": 141.27617999999995, "r": 105.08014, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 60.93763400000001, "t": 85.73321999999996, "r": 76.151443, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "100%", "bbox": {"l": 60.93763400000001, "t": 85.73321999999996, "r": 76.151443, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 82.304901, "t": 86.22351000000003, "r": 106.99162, "b": 91.18073000000015, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "500K 10K", "bbox": {"l": 82.304901, "t": 86.22351000000003, "r": 106.99162, "b": 91.18073000000015, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 246.20530999999997, "t": 141.60608000000002, "r": 281.88013, "b": 146.56329000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "Train Test Val", "bbox": {"l": 246.20530999999997, "t": 141.60608000000002, "r": 281.88013, "b": 146.56329000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 226.69780000000003, "t": 85.73321999999996, "r": 241.91161, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "100%", "bbox": {"l": 226.69780000000003, "t": 85.73321999999996, "r": 241.91161, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 249.93848999999997, "t": 86.08801000000005, "r": 282.49384, "b": 91.04522999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "91K 10K 10K", "bbox": {"l": 249.93848999999997, "t": 86.08801000000005, "r": 282.49384, "b": 91.04522999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 410.19409, "t": 141.27617999999995, "r": 444.68915, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "Train Test Val", "bbox": {"l": 410.19409, "t": 141.27617999999995, "r": 444.68915, "b": 146.23339999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 391.37341, "t": 85.73321999999996, "r": 432.6716599999999, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "100% 130K 5K", "bbox": {"l": 391.37341, "t": 85.73321999999996, "r": 432.6716599999999, "b": 90.69042999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 435.60571000000004, "t": 86.26140999999996, "r": 445.62414999999993, "b": 91.21862999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "10K", "bbox": {"l": 435.60571000000004, "t": 86.26140999999996, "r": 445.62414999999993, "b": 91.21862999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 113.94921, "t": 141.28845, "r": 136.20052, "b": 146.24567000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "Complex", "bbox": {"l": 113.94921, "t": 141.28845, "r": 136.20052, "b": 146.24567000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 116.91554000000001, "t": 94.81853999999998, "r": 127.05433999999998, "b": 99.77575999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "Non", "bbox": {"l": 116.91554000000001, "t": 94.81853999999998, "r": 127.05433999999998, "b": 99.77575999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 113.3146, "t": 100.93853999999999, "r": 127.05298, "b": 105.89575000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "Strict", "bbox": {"l": 113.3146, "t": 100.93853999999999, "r": 127.05298, "b": 105.89575000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 112.94112, "t": 107.05853000000013, "r": 127.05537, "b": 112.01575000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "HTML", "bbox": {"l": 112.94112, "t": 107.05853000000013, "r": 127.05537, "b": 112.01575000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 113.22738999999999, "t": 122.61523, "r": 126.96577, "b": 127.57245, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "Strict", "bbox": {"l": 113.22738999999999, "t": 122.61523, "r": 126.96577, "b": 127.57245, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 112.85390000000001, "t": 128.73523, "r": 126.96814999999998, "b": 133.69244000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "HTML", "bbox": {"l": 112.85390000000001, "t": 128.73523, "r": 126.96814999999998, "b": 133.69244000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 138.57864, "t": 141.43640000000005, "r": 156.04207, "b": 146.39362000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "Simple", "bbox": {"l": 138.57864, "t": 141.43640000000005, "r": 156.04207, "b": 146.39362000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 122.03101, "t": 86.2713, "r": 151.04185, "b": 91.22852, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "230K 280K", "bbox": {"l": 122.03101, "t": 86.2713, "r": 151.04185, "b": 91.22852, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 311.65359, "t": 86.55498999999998, "r": 321.67203, "b": 91.5122100000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "65K", "bbox": {"l": 311.65359, "t": 86.55498999999998, "r": 321.67203, "b": 91.5122100000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 287.89441, "t": 141.71063000000004, "r": 310.14572, "b": 146.66785000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "Complex", "bbox": {"l": 287.89441, "t": 141.71063000000004, "r": 310.14572, "b": 146.66785000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 289.23572, "t": 93.07977000000005, "r": 299.37451, "b": 98.03698999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "Non", "bbox": {"l": 289.23572, "t": 93.07977000000005, "r": 299.37451, "b": 98.03698999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 285.63513, "t": 99.19976999999994, "r": 299.3735, "b": 104.15698000000009, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "Strict", "bbox": {"l": 285.63513, "t": 99.19976999999994, "r": 299.3735, "b": 104.15698000000009, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 285.26111, "t": 105.31975999999997, "r": 299.37537, "b": 110.27697999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "HTML", "bbox": {"l": 285.26111, "t": 105.31975999999997, "r": 299.37537, "b": 110.27697999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 285.43109, "t": 120.38995, "r": 299.16946, "b": 125.34717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "Strict", "bbox": {"l": 285.43109, "t": 120.38995, "r": 299.16946, "b": 125.34717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 285.05713, "t": 126.50995, "r": 299.17139, "b": 131.46716000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "HTML", "bbox": {"l": 285.05713, "t": 126.50995, "r": 299.17139, "b": 131.46716000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 311.34592, "t": 141.71063000000004, "r": 328.80933, "b": 146.66785000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "Simple", "bbox": {"l": 311.34592, "t": 141.71063000000004, "r": 328.80933, "b": 146.66785000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 299.58362, "t": 86.69353999999998, "r": 309.60205, "b": 91.65075999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "47K", "bbox": {"l": 299.58362, "t": 86.69353999999998, "r": 309.60205, "b": 91.65075999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 466.04077000000007, "t": 141.67169, "r": 483.50418, "b": 146.62891000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "Simple", "bbox": {"l": 466.04077000000007, "t": 141.67169, "r": 483.50418, "b": 146.62891000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 459.02151, "t": 93.76116999999999, "r": 469.16031000000004, "b": 98.71838000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "Non", "bbox": {"l": 459.02151, "t": 93.76116999999999, "r": 469.16031000000004, "b": 98.71838000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 455.4209, "t": 99.88116000000002, "r": 469.15927000000005, "b": 104.83838000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "Strict", "bbox": {"l": 455.4209, "t": 99.88116000000002, "r": 469.15927000000005, "b": 104.83838000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 455.04691, "t": 106.00116000000014, "r": 469.16115999999994, "b": 110.95836999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "HTML", "bbox": {"l": 455.04691, "t": 106.00116000000014, "r": 469.16115999999994, "b": 110.95836999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 467.39401, "t": 85.57239000000004, "r": 480.6545100000001, "b": 90.52959999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "145K", "bbox": {"l": 467.39401, "t": 85.57239000000004, "r": 480.6545100000001, "b": 90.52959999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 160.37672, "t": 141.58385999999996, "r": 182.62802, "b": 146.54107999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "Complex", "bbox": {"l": 160.37672, "t": 141.58385999999996, "r": 182.62802, "b": 146.54107999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 153.74265, "t": 94.86481000000003, "r": 173.32664, "b": 99.82201999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "Contain", "bbox": {"l": 153.74265, "t": 94.86481000000003, "r": 173.32664, "b": 99.82201999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 154.50967, "t": 100.98479999999995, "r": 173.3246, "b": 105.94202000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "Missing", "bbox": {"l": 154.50967, "t": 100.98479999999995, "r": 173.3246, "b": 105.94202000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 155.27162, "t": 107.10479999999995, "r": 173.32664, "b": 112.06200999999987, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "bboxes", "bbox": {"l": 155.27162, "t": 107.10479999999995, "r": 173.32664, "b": 112.06200999999987, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 326.41302, "t": 107.23248000000001, "r": 345.99701, "b": 112.18970000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "Contain", "bbox": {"l": 326.41302, "t": 107.23248000000001, "r": 345.99701, "b": 112.18970000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 327.17972, "t": 113.35248000000001, "r": 345.99463, "b": 118.30969000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "Missing", "bbox": {"l": 327.17972, "t": 113.35248000000001, "r": 345.99463, "b": 118.30969000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 327.94131, "t": 119.47247000000004, "r": 345.99634, "b": 124.42969000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "bboxes", "bbox": {"l": 327.94131, "t": 119.47247000000004, "r": 345.99634, "b": 124.42969000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 488.9942, "t": 104.15374999999983, "r": 508.76384999999993, "b": 109.11095999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "Dataset", "bbox": {"l": 488.9942, "t": 104.15374999999983, "r": 508.76384999999993, "b": 109.11095999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 490.1893, "t": 110.27373999999998, "r": 508.76349000000005, "b": 115.2309600000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "doesn't", "bbox": {"l": 490.1893, "t": 110.27373999999998, "r": 508.76349000000005, "b": 115.2309600000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 489.72009, "t": 116.39373999999998, "r": 508.76758, "b": 121.35095000000013, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "provide", "bbox": {"l": 489.72009, "t": 116.39373999999998, "r": 508.76758, "b": 121.35095000000013, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 490.71121, "t": 122.51373000000001, "r": 508.76624, "b": 127.47095000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "bboxes", "bbox": {"l": 490.71121, "t": 122.51373000000001, "r": 508.76624, "b": 127.47095000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 185.37759, "t": 141.71118, "r": 202.84102, "b": 146.66840000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "Simple", "bbox": {"l": 185.37759, "t": 141.71118, "r": 202.84102, "b": 146.66840000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 168.50357, "t": 86.13611000000003, "r": 197.52699, "b": 91.09331999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "230K 280K", "bbox": {"l": 168.50357, "t": 86.13611000000003, "r": 197.52699, "b": 91.09331999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 357.3768, "t": 85.99707000000001, "r": 367.39523, "b": 90.95428000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "65K", "bbox": {"l": 357.3768, "t": 85.99707000000001, "r": 367.39523, "b": 90.95428000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 333.73151, "t": 141.62323000000004, "r": 374.92862, "b": 146.58043999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "Complex Simple", "bbox": {"l": 333.73151, "t": 141.62323000000004, "r": 374.92862, "b": 146.58043999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 345.69101, "t": 86.05591000000004, "r": 355.70944, "b": 91.01312000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "47K", "bbox": {"l": 345.69101, "t": 86.05591000000004, "r": 355.70944, "b": 91.01312000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 508.54248, "t": 141.37683000000004, "r": 526.00592, "b": 146.33405000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "Simple", "bbox": {"l": 508.54248, "t": 141.37683000000004, "r": 526.00592, "b": 146.33405000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 510.44653000000005, "t": 86.09258999999986, "r": 523.70703, "b": 91.0498, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "145K", "bbox": {"l": 510.44653000000005, "t": 86.09258999999986, "r": 523.70703, "b": 91.0498, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "caption", "id": 1, "page_no": 11, "cluster": {"id": 1, "label": "caption", "bbox": {"l": 50.112, "t": 165.50238000000002, "r": 545.11371, "b": 186.36395000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9661495685577393, "cells": [{"id": 59, "text": "Figure 7: Distribution of the tables across different dimensions per dataset. Simple vs complex tables per dataset and split,", "bbox": {"l": 50.112, "t": 165.50238000000002, "r": 545.11371, "b": 174.40894000000003, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "strict vs non strict html structures per dataset and table complexity, missing bboxes per dataset and table complexity.", "bbox": {"l": 50.112, "t": 177.4574, "r": 513.52234, "b": 186.36395000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 7: Distribution of the tables across different dimensions per dataset. Simple vs complex tables per dataset and split, strict vs non strict html structures per dataset and table complexity, missing bboxes per dataset and table complexity."}, {"label": "list_item", "id": 4, "page_no": 11, "cluster": {"id": 4, "label": "list_item", "bbox": {"l": 61.569, "t": 210.93140000000005, "r": 286.36511, "b": 231.79296999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9621952772140503, "cells": [{"id": 61, "text": "\u2022", "bbox": {"l": 61.569, "t": 210.93140000000005, "r": 71.14743, "b": 219.83794999999998, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "TableFormer output does not include the table cell con-", "bbox": {"l": 73.542038, "t": 210.93140000000005, "r": 286.36511, "b": 219.83794999999998, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "tent.", "bbox": {"l": 70.037003, "t": 222.88640999999996, "r": 87.47155, "b": 231.79296999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u00b7 TableFormer output does not include the table cell content."}, {"label": "list_item", "id": 3, "page_no": 11, "cluster": {"id": 3, "label": "list_item", "bbox": {"l": 61.569, "t": 244.07141000000001, "r": 286.36514, "b": 264.93298000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9629555344581604, "cells": [{"id": 64, "text": "\u2022", "bbox": {"l": 61.569, "t": 244.07141000000001, "r": 71.345718, "b": 252.97797000000003, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "There are occasional inaccuracies in the predictions of", "bbox": {"l": 73.789902, "t": 244.07141000000001, "r": 286.36514, "b": 252.97797000000003, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "the bounding boxes.", "bbox": {"l": 70.037003, "t": 256.02643, "r": 150.41524, "b": 264.93298000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u00b7 There are occasional inaccuracies in the predictions of the bounding boxes."}, {"label": "text", "id": 0, "page_no": 11, "cluster": {"id": 0, "label": "text", "bbox": {"l": 50.112, "t": 279.20343, "r": 286.36511, "b": 395.70688, "coord_origin": "TOPLEFT"}, "confidence": 0.9767085909843445, "cells": [{"id": 67, "text": "However, it is possible to mitigate those limitations by", "bbox": {"l": 62.067001, "t": 279.20343, "r": 286.36499, "b": 288.10999, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "combining the TableFormer predictions with the informa-", "bbox": {"l": 50.112, "t": 291.15842, "r": 286.36505, "b": 300.06497, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "tion already present inside a programmatic PDF document.", "bbox": {"l": 50.112, "t": 303.1134, "r": 286.36511, "b": 312.01996, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "More specifically, PDF documents can be seen as a se-", "bbox": {"l": 50.112, "t": 315.06839, "r": 286.36511, "b": 323.97495, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "quence of PDF cells where each cell is described by its con-", "bbox": {"l": 50.112, "t": 327.02438, "r": 286.36511, "b": 335.93093999999996, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "tent and bounding box. If we are able to associate the PDF", "bbox": {"l": 50.112, "t": 338.97937, "r": 286.36505, "b": 347.88593, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "cells with the predicted table cells, we can directly link the", "bbox": {"l": 50.112, "t": 350.93436, "r": 286.36508, "b": 359.84091, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "PDF cell content to the table cell structure and use the PDF", "bbox": {"l": 50.112, "t": 362.88934, "r": 286.36511, "b": 371.7959, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "bounding boxes to correct misalignments in the predicted", "bbox": {"l": 50.112, "t": 374.84433000000007, "r": 286.36508, "b": 383.75089, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "table cell bounding boxes.", "bbox": {"l": 50.112, "t": 386.80032, "r": 154.55988, "b": 395.70688, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "However, it is possible to mitigate those limitations by combining the TableFormer predictions with the information already present inside a programmatic PDF document. More specifically, PDF documents can be seen as a sequence of PDF cells where each cell is described by its content and bounding box. If we are able to associate the PDF cells with the predicted table cells, we can directly link the PDF cell content to the table cell structure and use the PDF bounding boxes to correct misalignments in the predicted table cell bounding boxes."}, {"label": "text", "id": 11, "page_no": 11, "cluster": {"id": 11, "label": "text", "bbox": {"l": 50.112, "t": 399.06934, "r": 286.36496, "b": 419.93188, "coord_origin": "TOPLEFT"}, "confidence": 0.934766411781311, "cells": [{"id": 77, "text": "Here is a step-by-step description of the prediction post-", "bbox": {"l": 62.067001, "t": 399.06934, "r": 286.36496, "b": 407.97589, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "processing:", "bbox": {"l": 50.112, "t": 411.02533, "r": 95.491638, "b": 419.93188, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Here is a step-by-step description of the prediction postprocessing:"}, {"label": "list_item", "id": 20, "page_no": 11, "cluster": {"id": 20, "label": "list_item", "bbox": {"l": 50.112, "t": 423.29532, "r": 286.36508, "b": 456.11185000000006, "coord_origin": "TOPLEFT"}, "confidence": 0.8280702233314514, "cells": [{"id": 79, "text": "1.", "bbox": {"l": 62.067001, "t": 423.29532, "r": 69.37281, "b": 432.20187, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "Get the minimal grid dimensions - number of rows and", "bbox": {"l": 71.808075, "t": 423.29532, "r": 286.36502, "b": 432.20187, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "columns for the predicted table structure. This represents", "bbox": {"l": 50.112, "t": 435.25031, "r": 286.36508, "b": 444.15686, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "the most granular grid for the underlying table structure.", "bbox": {"l": 50.112, "t": 447.20529, "r": 274.50958, "b": 456.11185000000006, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1. Get the minimal grid dimensions - number of rows and columns for the predicted table structure. This represents the most granular grid for the underlying table structure."}, {"label": "list_item", "id": 2, "page_no": 11, "cluster": {"id": 2, "label": "list_item", "bbox": {"l": 50.112, "t": 459.47528, "r": 286.36505, "b": 504.2468, "coord_origin": "TOPLEFT"}, "confidence": 0.9646760821342468, "cells": [{"id": 83, "text": "2.", "bbox": {"l": 62.067001, "t": 459.47528, "r": 69.538948, "b": 468.38184, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "Generate pair-wise matches between the bounding", "bbox": {"l": 77.429329, "t": 459.47528, "r": 286.36499, "b": 468.38184, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "boxes of the PDF cells and the predicted cells. The Intersec-", "bbox": {"l": 50.112, "t": 471.43027, "r": 286.36505, "b": 480.33682, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "tion Over Union (IOU) metric is used to evaluate the quality", "bbox": {"l": 50.112, "t": 483.38525, "r": 286.36505, "b": 492.29181, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "of the matches.", "bbox": {"l": 50.112, "t": 495.34024, "r": 110.70452999999999, "b": 504.2468, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2. Generate pair-wise matches between the bounding boxes of the PDF cells and the predicted cells. The Intersection Over Union (IOU) metric is used to evaluate the quality of the matches."}, {"label": "list_item", "id": 10, "page_no": 11, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 50.112, "t": 507.61023, "r": 286.36493, "b": 528.4727800000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9391399025917053, "cells": [{"id": 88, "text": "3.", "bbox": {"l": 62.067001, "t": 507.61023, "r": 69.863068, "b": 516.5167799999999, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "Use a carefully selected IOU threshold to designate", "bbox": {"l": 72.461754, "t": 507.61023, "r": 286.36493, "b": 516.5167799999999, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "the matches as \u201cgood\u201d ones and \u201cbad\u201d ones.", "bbox": {"l": 50.112, "t": 519.5662199999999, "r": 226.0714, "b": 528.4727800000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3. Use a carefully selected IOU threshold to designate the matches as \"good\" ones and \"bad\" ones."}, {"label": "list_item", "id": 8, "page_no": 11, "cluster": {"id": 8, "label": "list_item", "bbox": {"l": 50.112, "t": 531.83521, "r": 286.36511, "b": 564.65277, "coord_origin": "TOPLEFT"}, "confidence": 0.9491708874702454, "cells": [{"id": 91, "text": "3.a. If all IOU scores in a column are below the thresh-", "bbox": {"l": 62.067001, "t": 531.83521, "r": 286.36496, "b": 540.7417800000001, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "old, discard all predictions (structure and bounding boxes)", "bbox": {"l": 50.112, "t": 543.79121, "r": 286.36511, "b": 552.69777, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "for that column.", "bbox": {"l": 50.112, "t": 555.74622, "r": 114.03204, "b": 564.65277, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3.a. If all IOU scores in a column are below the threshold, discard all predictions (structure and bounding boxes) for that column."}, {"label": "list_item", "id": 5, "page_no": 11, "cluster": {"id": 5, "label": "list_item", "bbox": {"l": 50.112, "t": 568.01622, "r": 286.36508, "b": 600.83278, "coord_origin": "TOPLEFT"}, "confidence": 0.9587163329124451, "cells": [{"id": 94, "text": "4.", "bbox": {"l": 62.067001, "t": 568.01622, "r": 69.538948, "b": 576.92278, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "Find the best-fitting content alignment for the pre-", "bbox": {"l": 76.731949, "t": 568.01622, "r": 286.36502, "b": 576.92278, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "dicted cells with good IOU per each column. The alignment", "bbox": {"l": 50.112, "t": 579.97122, "r": 286.36508, "b": 588.87778, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "of the column can be identified by the following formula:", "bbox": {"l": 50.112, "t": 591.9262200000001, "r": 278.70383, "b": 600.83278, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4. Find the best-fitting content alignment for the predicted cells with good IOU per each column. The alignment of the column can be identified by the following formula:"}, {"label": "formula", "id": 12, "page_no": 11, "cluster": {"id": 12, "label": "formula", "bbox": {"l": 110.70499, "t": 623.43591, "r": 286.3624, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9298412799835205, "cells": [{"id": 98, "text": "alignment", "bbox": {"l": 112.02799999999999, "t": 623.99382, "r": 157.9516, "b": 632.84061, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "= arg min", "bbox": {"l": 160.715, "t": 623.99382, "r": 203.4964, "b": 632.84061, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "c", "bbox": {"l": 185.58499, "t": 633.98305, "r": 189.14511, "b": 640.17578, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "{", "bbox": {"l": 203.49899, "t": 623.43591, "r": 208.48029, "b": 632.84061, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "D$_{c}$", "bbox": {"l": 208.48099, "t": 623.99382, "r": 220.28911, "b": 632.84061, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "}", "bbox": {"l": 220.78699, "t": 623.43591, "r": 225.76828, "b": 632.84061, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "D$_{c}$", "bbox": {"l": 110.70499, "t": 645.25882, "r": 122.51310999999998, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "=", "bbox": {"l": 125.77899000000001, "t": 645.25882, "r": 133.52791, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "max", "bbox": {"l": 136.295, "t": 645.25882, "r": 156.00201, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "{", "bbox": {"l": 156.00299, "t": 644.70091, "r": 160.98428, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "x$_{c}$", "bbox": {"l": 160.98399, "t": 645.25882, "r": 170.23811, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "} \u2212", "bbox": {"l": 170.73599, "t": 644.70091, "r": 185.6779, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "min", "bbox": {"l": 187.894, "t": 645.25882, "r": 206.05283, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "{", "bbox": {"l": 206.054, "t": 644.70091, "r": 211.03529, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "x$_{c}$", "bbox": {"l": 211.035, "t": 645.25882, "r": 220.28912, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "}", "bbox": {"l": 220.787, "t": 644.70091, "r": 225.76829999999998, "b": 654.1056100000001, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "(4)", "bbox": {"l": 274.746, "t": 634.88522, "r": 286.3624, "b": 643.79178, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "alignment = arg min c { D$_{c}$ } D$_{c}$ = max { x$_{c}$ } \u2212 min { x$_{c}$ } (4)"}, {"label": "text", "id": 7, "page_no": 11, "cluster": {"id": 7, "label": "text", "bbox": {"l": 50.112, "t": 667.3479199999999, "r": 286.362, "b": 688.92679, "coord_origin": "TOPLEFT"}, "confidence": 0.9545555114746094, "cells": [{"id": 115, "text": "where", "bbox": {"l": 50.112, "t": 668.06522, "r": 74.45063, "b": 676.97179, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "c", "bbox": {"l": 78.335999, "t": 667.90582, "r": 82.647812, "b": 676.75261, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "is one of", "bbox": {"l": 86.532997, "t": 668.06522, "r": 123.63372, "b": 676.97179, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "{", "bbox": {"l": 127.51899999999999, "t": 667.3479199999999, "r": 132.50029, "b": 676.75261, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "left, centroid, right", "bbox": {"l": 132.50099, "t": 668.06522, "r": 210.69743, "b": 676.97179, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "}", "bbox": {"l": 210.69699, "t": 667.3479199999999, "r": 215.67828, "b": 676.75261, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "and", "bbox": {"l": 219.56299, "t": 668.06522, "r": 233.94897000000003, "b": 676.97179, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "x$_{c}$", "bbox": {"l": 237.83499000000003, "t": 667.90582, "r": 247.08911, "b": 676.75261, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "is the x-", "bbox": {"l": 251.47299000000004, "t": 668.06522, "r": 286.362, "b": 676.97179, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "coordinate for the corresponding point.", "bbox": {"l": 50.112, "t": 680.02022, "r": 205.88721, "b": 688.92679, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "where c is one of { left, centroid, right } and x$_{c}$ is the xcoordinate for the corresponding point."}, {"label": "list_item", "id": 13, "page_no": 11, "cluster": {"id": 13, "label": "list_item", "bbox": {"l": 50.112, "t": 692.290222, "r": 286.36496, "b": 713.151787, "coord_origin": "TOPLEFT"}, "confidence": 0.9260510206222534, "cells": [{"id": 125, "text": "5.", "bbox": {"l": 62.067001, "t": 692.290222, "r": 69.538948, "b": 701.196785, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "Use the alignment computed in step 4, to compute", "bbox": {"l": 76.273666, "t": 692.290222, "r": 286.36496, "b": 701.196785, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "the median", "bbox": {"l": 50.112, "t": 704.245224, "r": 94.604973, "b": 713.151787, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "x", "bbox": {"l": 97.598999, "t": 704.085815, "r": 103.29263, "b": 712.93261, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "-coordinate for all table columns and the me-", "bbox": {"l": 103.292, "t": 704.245224, "r": 286.36481, "b": 713.151787, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5. Use the alignment computed in step 4, to compute the median x -coordinate for all table columns and the me-"}, {"label": "text", "id": 16, "page_no": 11, "cluster": {"id": 16, "label": "text", "bbox": {"l": 308.862, "t": 210.93120999999996, "r": 545.11517, "b": 255.7038, "coord_origin": "TOPLEFT"}, "confidence": 0.8942298889160156, "cells": [{"id": 130, "text": "dian cell size for all table cells. The usage of median dur-", "bbox": {"l": 308.862, "t": 210.93120999999996, "r": 545.11517, "b": 219.83776999999998, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "ing the computations, helps to eliminate outliers caused by", "bbox": {"l": 308.862, "t": 222.88720999999998, "r": 545.11511, "b": 231.79376000000002, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "occasional column spans which are usually wider than the", "bbox": {"l": 308.862, "t": 234.84222, "r": 545.11511, "b": 243.74878, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "normal.", "bbox": {"l": 308.862, "t": 246.79724, "r": 339.57669, "b": 255.7038, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "dian cell size for all table cells. The usage of median during the computations, helps to eliminate outliers caused by occasional column spans which are usually wider than the normal."}, {"label": "list_item", "id": 9, "page_no": 11, "cluster": {"id": 9, "label": "list_item", "bbox": {"l": 308.862, "t": 259.10222999999996, "r": 545.11499, "b": 279.96380999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9423392415046692, "cells": [{"id": 134, "text": "6.", "bbox": {"l": 320.81699, "t": 259.10222999999996, "r": 328.28894, "b": 268.00879, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "Snap all cells with bad IOU to their corresponding", "bbox": {"l": 334.88419, "t": 259.10222999999996, "r": 545.11499, "b": 268.00879, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "median", "bbox": {"l": 308.862, "t": 271.05724999999995, "r": 338.19189, "b": 279.96380999999997, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "x", "bbox": {"l": 340.68201, "t": 270.89783, "r": 346.37564, "b": 279.74463000000003, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "-coordinates and cell sizes.", "bbox": {"l": 346.37601, "t": 271.05724999999995, "r": 453.72305000000006, "b": 279.96380999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "6. Snap all cells with bad IOU to their corresponding median x -coordinates and cell sizes."}, {"label": "list_item", "id": 6, "page_no": 11, "cluster": {"id": 6, "label": "list_item", "bbox": {"l": 308.86203, "t": 283.36325000000005, "r": 545.11511, "b": 387.91071, "coord_origin": "TOPLEFT"}, "confidence": 0.9562004804611206, "cells": [{"id": 139, "text": "7.", "bbox": {"l": 320.81702, "t": 283.36325000000005, "r": 328.38953, "b": 292.26981, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "Generate a new set of pair-wise matches between the", "bbox": {"l": 330.9137, "t": 283.36325000000005, "r": 545.11499, "b": 292.26981, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "corrected bounding boxes and PDF cells. This time use a", "bbox": {"l": 308.86203, "t": 295.31824, "r": 545.11511, "b": 304.22479, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "modified version of the IOU metric, where the area of the", "bbox": {"l": 308.86203, "t": 307.27322, "r": 545.11505, "b": 316.17978, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "intersection between the predicted and PDF cells is divided", "bbox": {"l": 308.86203, "t": 319.22821000000005, "r": 545.11511, "b": 328.13477, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "by the PDF cell area.", "bbox": {"l": 308.86203, "t": 331.1842, "r": 397.19043, "b": 340.09076000000005, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "In case there are multiple matches", "bbox": {"l": 403.65616, "t": 331.1842, "r": 545.11511, "b": 340.09076000000005, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "for the same PDF cell, the prediction with the higher score", "bbox": {"l": 308.86203, "t": 343.13919, "r": 545.11511, "b": 352.04575, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "is preferred. This covers the cases where the PDF cells are", "bbox": {"l": 308.86203, "t": 355.09418, "r": 545.11505, "b": 364.00073, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "smaller than the area of predicted or corrected prediction", "bbox": {"l": 308.86203, "t": 367.04916, "r": 545.11505, "b": 375.95572000000004, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "cells.", "bbox": {"l": 308.86203, "t": 379.00415, "r": 329.61414, "b": 387.91071, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "7. Generate a new set of pair-wise matches between the corrected bounding boxes and PDF cells. This time use a modified version of the IOU metric, where the area of the intersection between the predicted and PDF cells is divided by the PDF cell area. In case there are multiple matches for the same PDF cell, the prediction with the higher score is preferred. This covers the cases where the PDF cells are smaller than the area of predicted or corrected prediction cells."}, {"label": "list_item", "id": 17, "page_no": 11, "cluster": {"id": 17, "label": "list_item", "bbox": {"l": 308.86203, "t": 391.31015, "r": 545.11517, "b": 459.99164, "coord_origin": "TOPLEFT"}, "confidence": 0.8719939589500427, "cells": [{"id": 150, "text": "8.", "bbox": {"l": 320.81702, "t": 391.31015, "r": 328.55356, "b": 400.2167099999999, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "In some rare occasions, we have noticed that Table-", "bbox": {"l": 331.13242, "t": 391.31015, "r": 545.11505, "b": 400.2167099999999, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "Former can confuse a single column as two. When the post-", "bbox": {"l": 308.86203, "t": 403.26514, "r": 545.11517, "b": 412.17169, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "processing steps are applied, this results with two predicted", "bbox": {"l": 308.86203, "t": 415.22012000000007, "r": 545.11511, "b": 424.12668, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "columns pointing to the same PDF column. In such case", "bbox": {"l": 308.86203, "t": 427.17511, "r": 545.11511, "b": 436.0816699999999, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "we must de-duplicate the columns according to highest to-", "bbox": {"l": 308.86203, "t": 439.1301, "r": 545.11505, "b": 448.03665, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "tal column intersection score.", "bbox": {"l": 308.86203, "t": 451.08507999999995, "r": 426.18161, "b": 459.99164, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "8. In some rare occasions, we have noticed that TableFormer can confuse a single column as two. When the postprocessing steps are applied, this results with two predicted columns pointing to the same PDF column. In such case we must de-duplicate the columns according to highest total column intersection score."}, {"label": "list_item", "id": 15, "page_no": 11, "cluster": {"id": 15, "label": "list_item", "bbox": {"l": 308.86203, "t": 463.39108, "r": 545.11517, "b": 567.93858, "coord_origin": "TOPLEFT"}, "confidence": 0.9126082062721252, "cells": [{"id": 157, "text": "9.", "bbox": {"l": 320.81702, "t": 463.39108, "r": 328.67316, "b": 472.29764, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "Pick up the remaining orphan cells. There could be", "bbox": {"l": 331.29187, "t": 463.39108, "r": 545.11499, "b": 472.29764, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "cases, when after applying all the previous post-processing", "bbox": {"l": 308.86203, "t": 475.34607, "r": 545.11505, "b": 484.25262, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "steps, some PDF cells could still remain without any match", "bbox": {"l": 308.86203, "t": 487.30106, "r": 545.11517, "b": 496.20761, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "to predicted cells.", "bbox": {"l": 308.86203, "t": 499.25604, "r": 381.89786, "b": 508.1626, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "However, it is still possible to deduce", "bbox": {"l": 388.7023, "t": 499.25604, "r": 545.11517, "b": 508.1626, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "the correct matching for an orphan PDF cell by mapping its", "bbox": {"l": 308.86203, "t": 511.21204, "r": 545.11511, "b": 520.11859, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "bounding box on the geometry of the grid. This mapping", "bbox": {"l": 308.86203, "t": 523.16702, "r": 545.11505, "b": 532.07358, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "decides if the content of the orphan cell will be appended to", "bbox": {"l": 308.86203, "t": 535.12201, "r": 545.11499, "b": 544.02858, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "an already matched table cell, or a new table cell should be", "bbox": {"l": 308.86203, "t": 547.07703, "r": 545.11517, "b": 555.98358, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "created to match with the orphan.", "bbox": {"l": 308.86203, "t": 559.03203, "r": 442.22147000000007, "b": 567.93858, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "9. Pick up the remaining orphan cells. There could be cases, when after applying all the previous post-processing steps, some PDF cells could still remain without any match to predicted cells. However, it is still possible to deduce the correct matching for an orphan PDF cell by mapping its bounding box on the geometry of the grid. This mapping decides if the content of the orphan cell will be appended to an already matched table cell, or a new table cell should be created to match with the orphan."}, {"label": "text", "id": 19, "page_no": 11, "cluster": {"id": 19, "label": "text", "bbox": {"l": 308.86203, "t": 571.33803, "r": 545.11688, "b": 604.15459, "coord_origin": "TOPLEFT"}, "confidence": 0.8459473848342896, "cells": [{"id": 168, "text": "9a. Compute the top and bottom boundary of the hori-", "bbox": {"l": 320.81702, "t": 571.33803, "r": 545.11493, "b": 580.24458, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "zontal band for each grid row (min/max", "bbox": {"l": 308.86203, "t": 583.29303, "r": 471.64093, "b": 592.19958, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "y", "bbox": {"l": 474.83405, "t": 583.1336200000001, "r": 479.71872, "b": 591.98041, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "coordinates per", "bbox": {"l": 483.26903999999996, "t": 583.29303, "r": 545.11688, "b": 592.19958, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "row).", "bbox": {"l": 308.86206, "t": 595.24803, "r": 329.91306, "b": 604.15459, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "9a. Compute the top and bottom boundary of the horizontal band for each grid row (min/max y coordinates per row)."}, {"label": "list_item", "id": 21, "page_no": 11, "cluster": {"id": 21, "label": "list_item", "bbox": {"l": 308.86206, "t": 607.55304, "r": 545.11505, "b": 628.4155900000001, "coord_origin": "TOPLEFT"}, "confidence": 0.7716891169548035, "cells": [{"id": 173, "text": "9b.", "bbox": {"l": 320.81705, "t": 607.55304, "r": 332.8718, "b": 616.4595899999999, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "Intersect the orphan\u2019s bounding box with the row", "bbox": {"l": 339.92532, "t": 607.55304, "r": 545.11505, "b": 616.4595899999999, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "bands, and map the cell to the closest grid row.", "bbox": {"l": 308.86206, "t": 619.50903, "r": 495.2923, "b": 628.4155900000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "9b. Intersect the orphan's bounding box with the row bands, and map the cell to the closest grid row."}, {"label": "list_item", "id": 18, "page_no": 11, "cluster": {"id": 18, "label": "list_item", "bbox": {"l": 308.86206, "t": 631.81403, "r": 545.11505, "b": 664.63059, "coord_origin": "TOPLEFT"}, "confidence": 0.8584907054901123, "cells": [{"id": 176, "text": "9c. Compute the left and right boundary of the vertical", "bbox": {"l": 320.81705, "t": 631.81403, "r": 545.11505, "b": 640.72058, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "band for each grid column (min/max", "bbox": {"l": 308.86206, "t": 643.7690299999999, "r": 455.28238, "b": 652.67558, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "x", "bbox": {"l": 457.77704, "t": 643.60962, "r": 463.47067, "b": 652.45641, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "coordinates per col-", "bbox": {"l": 465.97104, "t": 643.7690299999999, "r": 545.11389, "b": 652.67558, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "umn).", "bbox": {"l": 308.86206, "t": 655.72403, "r": 332.38376, "b": 664.63059, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "9c. Compute the left and right boundary of the vertical band for each grid column (min/max x coordinates per column)."}, {"label": "list_item", "id": 22, "page_no": 11, "cluster": {"id": 22, "label": "list_item", "bbox": {"l": 308.86206, "t": 668.03003, "r": 545.11499, "b": 688.89159, "coord_origin": "TOPLEFT"}, "confidence": 0.7590745091438293, "cells": [{"id": 181, "text": "9d. Intersect the orphan\u2019s bounding box with the column", "bbox": {"l": 320.81705, "t": 668.03003, "r": 545.11499, "b": 676.93659, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "bands, and map the cell to the closest grid column.", "bbox": {"l": 308.86206, "t": 679.98503, "r": 510.5848700000001, "b": 688.89159, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "9d. Intersect the orphan's bounding box with the column bands, and map the cell to the closest grid column."}, {"label": "list_item", "id": 25, "page_no": 11, "cluster": {"id": 25, "label": "list_item", "bbox": {"l": 308.86206, "t": 692.290024, "r": 545.11517, "b": 713.151596, "coord_origin": "TOPLEFT"}, "confidence": 0.6971189975738525, "cells": [{"id": 183, "text": "9e. If the table cell under the identified row and column", "bbox": {"l": 320.81705, "t": 692.290024, "r": 545.11505, "b": 701.196594, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "is not empty, extend its content with the content of the or-", "bbox": {"l": 308.86206, "t": 704.245026, "r": 545.11517, "b": 713.151596, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "9e. If the table cell under the identified row and column is not empty, extend its content with the content of the or-"}], "headers": [{"label": "page_footer", "id": 14, "page_no": 11, "cluster": {"id": 14, "label": "page_footer", "bbox": {"l": 292.63107, "t": 734.13303, "r": 302.59366, "b": 743.039593, "coord_origin": "TOPLEFT"}, "confidence": 0.9126598238945007, "cells": [{"id": 185, "text": "12", "bbox": {"l": 292.63107, "t": 734.13303, "r": 302.59366, "b": 743.039593, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "12"}]}}, {"page_no": 12, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "phan cell.", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 88.846588, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "9f. Otherwise create a new structural cell and match it", "bbox": {"l": 62.067001, "t": 87.16339000000005, "r": 286.36496, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "wit the orphan cell.", "bbox": {"l": 50.112, "t": 99.11841000000004, "r": 127.03322, "b": 108.02495999999985, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Aditional images with examples of TableFormer predic-", "bbox": {"l": 62.067001, "t": 111.16309000000001, "r": 286.36499, "b": 119.7508499999999, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "tions and post-processing can be found below.", "bbox": {"l": 50.112, "t": 123.11810000000003, "r": 234.06139999999996, "b": 131.70587, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Figure 8: Example of a table with multi-line header.", "bbox": {"l": 63.341, "t": 502.05637, "r": 273.13342, "b": 510.96292, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Figure 9:", "bbox": {"l": 308.862, "t": 306.59836, "r": 345.63397, "b": 315.50491, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Example of a table with big empty distance be-", "bbox": {"l": 352.78711, "t": 306.59836, "r": 545.11511, "b": 315.50491, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "tween cells.", "bbox": {"l": 308.862, "t": 318.55334, "r": 355.89545, "b": 327.45990000000006, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Figure 10: Example of a complex table with empty cells.", "bbox": {"l": 312.34299, "t": 680.4933599999999, "r": 541.63232, "b": 689.39993, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "13", "bbox": {"l": 292.63098, "t": 734.133358, "r": 302.59357, "b": 743.039921, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 14, "label": "text", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 88.846588, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.7545598149299622, "cells": [{"id": 0, "text": "phan cell.", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 88.846588, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 50.112, "t": 87.16339000000005, "r": 286.36496, "b": 108.02495999999985, "coord_origin": "TOPLEFT"}, "confidence": 0.9170762300491333, "cells": [{"id": 1, "text": "9f. Otherwise create a new structural cell and match it", "bbox": {"l": 62.067001, "t": 87.16339000000005, "r": 286.36496, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "wit the orphan cell.", "bbox": {"l": 50.112, "t": 99.11841000000004, "r": 127.03322, "b": 108.02495999999985, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 50.112, "t": 111.16309000000001, "r": 286.36499, "b": 131.70587, "coord_origin": "TOPLEFT"}, "confidence": 0.9454683065414429, "cells": [{"id": 3, "text": "Aditional images with examples of TableFormer predic-", "bbox": {"l": 62.067001, "t": 111.16309000000001, "r": 286.36499, "b": 119.7508499999999, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "tions and post-processing can be found below.", "bbox": {"l": 50.112, "t": 123.11810000000003, "r": 234.06139999999996, "b": 131.70587, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "caption", "bbox": {"l": 63.341, "t": 502.05637, "r": 273.13342, "b": 510.96292, "coord_origin": "TOPLEFT"}, "confidence": 0.8971090316772461, "cells": [{"id": 5, "text": "Figure 8: Example of a table with multi-line header.", "bbox": {"l": 63.341, "t": 502.05637, "r": 273.13342, "b": 510.96292, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "caption", "bbox": {"l": 308.862, "t": 306.59836, "r": 545.11511, "b": 327.45990000000006, "coord_origin": "TOPLEFT"}, "confidence": 0.8773345351219177, "cells": [{"id": 6, "text": "Figure 9:", "bbox": {"l": 308.862, "t": 306.59836, "r": 345.63397, "b": 315.50491, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Example of a table with big empty distance be-", "bbox": {"l": 352.78711, "t": 306.59836, "r": 545.11511, "b": 315.50491, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "tween cells.", "bbox": {"l": 308.862, "t": 318.55334, "r": 355.89545, "b": 327.45990000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "caption", "bbox": {"l": 312.34299, "t": 680.4933599999999, "r": 541.63232, "b": 689.39993, "coord_origin": "TOPLEFT"}, "confidence": 0.9188510179519653, "cells": [{"id": 9, "text": "Figure 10: Example of a complex table with empty cells.", "bbox": {"l": 312.34299, "t": 680.4933599999999, "r": 541.63232, "b": 689.39993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "page_footer", "bbox": {"l": 292.63098, "t": 734.133358, "r": 302.59357, "b": 743.039921, "coord_origin": "TOPLEFT"}, "confidence": 0.9020507335662842, "cells": [{"id": 10, "text": "13", "bbox": {"l": 292.63098, "t": 734.133358, "r": 302.59357, "b": 743.039921, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "table", "bbox": {"l": 310.3294372558594, "t": 101.17767333984375, "r": 555.8338623046875, "b": 136.14752197265625, "coord_origin": "TOPLEFT"}, "confidence": 0.70481276512146, "cells": [], "children": []}, {"id": 32, "label": "table", "bbox": {"l": 309.9566345214844, "t": 154.61448669433594, "r": 555.7466430664062, "b": 184.7225341796875, "coord_origin": "TOPLEFT"}, "confidence": 0.564289927482605, "cells": [], "children": []}, {"id": 9, "label": "table", "bbox": {"l": 84.0283203125, "t": 156.3335418701172, "r": 239.1690673828125, "b": 214.39334106445312, "coord_origin": "TOPLEFT"}, "confidence": 0.8857279419898987, "cells": [], "children": []}, {"id": 21, "label": "table", "bbox": {"l": 309.9635314941406, "t": 195.70541381835938, "r": 555.7054443359375, "b": 233.55145263671875, "coord_origin": "TOPLEFT"}, "confidence": 0.6602518558502197, "cells": [], "children": []}, {"id": 4, "label": "table", "bbox": {"l": 82.92001342773438, "t": 233.7763214111328, "r": 239.1903533935547, "b": 291.283935546875, "coord_origin": "TOPLEFT"}, "confidence": 0.9155725836753845, "cells": [], "children": []}, {"id": 19, "label": "picture", "bbox": {"l": 309.79150390625, "t": 253.90536499023438, "r": 425.9603271484375, "b": 292.39398193359375, "coord_origin": "TOPLEFT"}, "confidence": 0.6956620812416077, "cells": [], "children": []}, {"id": 37, "label": "table", "bbox": {"l": 309.79150390625, "t": 253.90536499023438, "r": 425.9603271484375, "b": 292.39398193359375, "coord_origin": "TOPLEFT"}, "confidence": 0.52826988697052, "cells": [], "children": []}, {"id": 6, "label": "table", "bbox": {"l": 83.94786071777344, "t": 309.0477294921875, "r": 239.17135620117188, "b": 367.9095764160156, "coord_origin": "TOPLEFT"}, "confidence": 0.9085132479667664, "cells": [], "children": []}, {"id": 12, "label": "table", "bbox": {"l": 335.2694091796875, "t": 388.46746826171875, "r": 490.081787109375, "b": 437.02239990234375, "coord_origin": "TOPLEFT"}, "confidence": 0.8486077189445496, "cells": [], "children": []}, {"id": 0, "label": "table", "bbox": {"l": 83.31756591796875, "t": 396.0135498046875, "r": 248.873046875, "b": 487.2569885253906, "coord_origin": "TOPLEFT"}, "confidence": 0.9613965749740601, "cells": [], "children": []}, {"id": 10, "label": "table", "bbox": {"l": 334.9334716796875, "t": 453.9476318359375, "r": 490.0914306640625, "b": 502.7210998535156, "coord_origin": "TOPLEFT"}, "confidence": 0.8815538287162781, "cells": [], "children": []}, {"id": 5, "label": "table", "bbox": {"l": 335.2545471191406, "t": 519.07568359375, "r": 490.22369384765625, "b": 567.6879272460938, "coord_origin": "TOPLEFT"}, "confidence": 0.9096733927726746, "cells": [], "children": []}, {"id": 13, "label": "picture", "bbox": {"l": 333.9573669433594, "t": 593.1134033203125, "r": 518.4768676757812, "b": 665.4903564453125, "coord_origin": "TOPLEFT"}, "confidence": 0.8023569583892822, "cells": [], "children": []}, {"id": 30, "label": "table", "bbox": {"l": 333.9573669433594, "t": 593.1134033203125, "r": 518.4768676757812, "b": 665.4903564453125, "coord_origin": "TOPLEFT"}, "confidence": 0.5930293798446655, "cells": [], "children": []}]}, "tablestructure": {"table_map": {"17": {"label": "table", "id": 17, "page_no": 12, "cluster": {"id": 17, "label": "table", "bbox": {"l": 310.3294372558594, "t": 101.17767333984375, "r": 555.8338623046875, "b": 136.14752197265625, "coord_origin": "TOPLEFT"}, "confidence": 0.70481276512146, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, "32": {"label": "table", "id": 32, "page_no": 12, "cluster": {"id": 32, "label": "table", "bbox": {"l": 309.9566345214844, "t": 154.61448669433594, "r": 555.7466430664062, "b": 184.7225341796875, "coord_origin": "TOPLEFT"}, "confidence": 0.564289927482605, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, "9": {"label": "table", "id": 9, "page_no": 12, "cluster": {"id": 9, "label": "table", "bbox": {"l": 84.0283203125, "t": 156.3335418701172, "r": 239.1690673828125, "b": 214.39334106445312, "coord_origin": "TOPLEFT"}, "confidence": 0.8857279419898987, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, "21": {"label": "table", "id": 21, "page_no": 12, "cluster": {"id": 21, "label": "table", "bbox": {"l": 309.9635314941406, "t": 195.70541381835938, "r": 555.7054443359375, "b": 233.55145263671875, "coord_origin": "TOPLEFT"}, "confidence": 0.6602518558502197, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, "4": {"label": "table", "id": 4, "page_no": 12, "cluster": {"id": 4, "label": "table", "bbox": {"l": 82.92001342773438, "t": 233.7763214111328, "r": 239.1903533935547, "b": 291.283935546875, "coord_origin": "TOPLEFT"}, "confidence": 0.9155725836753845, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, "37": {"label": "table", "id": 37, "page_no": 12, "cluster": {"id": 37, "label": "table", "bbox": {"l": 309.79150390625, "t": 253.90536499023438, "r": 425.9603271484375, "b": 292.39398193359375, "coord_origin": "TOPLEFT"}, "confidence": 0.52826988697052, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, "6": {"label": "table", "id": 6, "page_no": 12, "cluster": {"id": 6, "label": "table", "bbox": {"l": 83.94786071777344, "t": 309.0477294921875, "r": 239.17135620117188, "b": 367.9095764160156, "coord_origin": "TOPLEFT"}, "confidence": 0.9085132479667664, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, "12": {"label": "table", "id": 12, "page_no": 12, "cluster": {"id": 12, "label": "table", "bbox": {"l": 335.2694091796875, "t": 388.46746826171875, "r": 490.081787109375, "b": 437.02239990234375, "coord_origin": "TOPLEFT"}, "confidence": 0.8486077189445496, "cells": [], "children": []}, "text": null, "otsl_seq": ["ecel", "ched", "ched", "lcel", "ched", "nl", "ecel", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, "0": {"label": "table", "id": 0, "page_no": 12, "cluster": {"id": 0, "label": "table", "bbox": {"l": 83.31756591796875, "t": 396.0135498046875, "r": 248.873046875, "b": 487.2569885253906, "coord_origin": "TOPLEFT"}, "confidence": 0.9613965749740601, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "ched", "nl", "fcel", "lcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "lcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, "10": {"label": "table", "id": 10, "page_no": 12, "cluster": {"id": 10, "label": "table", "bbox": {"l": 334.9334716796875, "t": 453.9476318359375, "r": 490.0914306640625, "b": 502.7210998535156, "coord_origin": "TOPLEFT"}, "confidence": 0.8815538287162781, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "lcel", "lcel", "lcel", "nl", "ched", "ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, "5": {"label": "table", "id": 5, "page_no": 12, "cluster": {"id": 5, "label": "table", "bbox": {"l": 335.2545471191406, "t": 519.07568359375, "r": 490.22369384765625, "b": 567.6879272460938, "coord_origin": "TOPLEFT"}, "confidence": 0.9096733927726746, "cells": [], "children": []}, "text": null, "otsl_seq": ["ecel", "ched", "lcel", "lcel", "lcel", "nl", "ecel", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, "30": {"label": "table", "id": 30, "page_no": 12, "cluster": {"id": 30, "label": "table", "bbox": {"l": 333.9573669433594, "t": 593.1134033203125, "r": 518.4768676757812, "b": 665.4903564453125, "coord_origin": "TOPLEFT"}, "confidence": 0.5930293798446655, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "text", "id": 14, "page_no": 12, "cluster": {"id": 14, "label": "text", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 88.846588, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.7545598149299622, "cells": [{"id": 0, "text": "phan cell.", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 88.846588, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "phan cell."}, {"label": "text", "id": 3, "page_no": 12, "cluster": {"id": 3, "label": "text", "bbox": {"l": 50.112, "t": 87.16339000000005, "r": 286.36496, "b": 108.02495999999985, "coord_origin": "TOPLEFT"}, "confidence": 0.9170762300491333, "cells": [{"id": 1, "text": "9f. Otherwise create a new structural cell and match it", "bbox": {"l": 62.067001, "t": 87.16339000000005, "r": 286.36496, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "wit the orphan cell.", "bbox": {"l": 50.112, "t": 99.11841000000004, "r": 127.03322, "b": 108.02495999999985, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "9f. Otherwise create a new structural cell and match it wit the orphan cell."}, {"label": "text", "id": 1, "page_no": 12, "cluster": {"id": 1, "label": "text", "bbox": {"l": 50.112, "t": 111.16309000000001, "r": 286.36499, "b": 131.70587, "coord_origin": "TOPLEFT"}, "confidence": 0.9454683065414429, "cells": [{"id": 3, "text": "Aditional images with examples of TableFormer predic-", "bbox": {"l": 62.067001, "t": 111.16309000000001, "r": 286.36499, "b": 119.7508499999999, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "tions and post-processing can be found below.", "bbox": {"l": 50.112, "t": 123.11810000000003, "r": 234.06139999999996, "b": 131.70587, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Aditional images with examples of TableFormer predictions and post-processing can be found below."}, {"label": "caption", "id": 8, "page_no": 12, "cluster": {"id": 8, "label": "caption", "bbox": {"l": 63.341, "t": 502.05637, "r": 273.13342, "b": 510.96292, "coord_origin": "TOPLEFT"}, "confidence": 0.8971090316772461, "cells": [{"id": 5, "text": "Figure 8: Example of a table with multi-line header.", "bbox": {"l": 63.341, "t": 502.05637, "r": 273.13342, "b": 510.96292, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 8: Example of a table with multi-line header."}, {"label": "caption", "id": 11, "page_no": 12, "cluster": {"id": 11, "label": "caption", "bbox": {"l": 308.862, "t": 306.59836, "r": 545.11511, "b": 327.45990000000006, "coord_origin": "TOPLEFT"}, "confidence": 0.8773345351219177, "cells": [{"id": 6, "text": "Figure 9:", "bbox": {"l": 308.862, "t": 306.59836, "r": 345.63397, "b": 315.50491, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Example of a table with big empty distance be-", "bbox": {"l": 352.78711, "t": 306.59836, "r": 545.11511, "b": 315.50491, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "tween cells.", "bbox": {"l": 308.862, "t": 318.55334, "r": 355.89545, "b": 327.45990000000006, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 9: Example of a table with big empty distance between cells."}, {"label": "caption", "id": 2, "page_no": 12, "cluster": {"id": 2, "label": "caption", "bbox": {"l": 312.34299, "t": 680.4933599999999, "r": 541.63232, "b": 689.39993, "coord_origin": "TOPLEFT"}, "confidence": 0.9188510179519653, "cells": [{"id": 9, "text": "Figure 10: Example of a complex table with empty cells.", "bbox": {"l": 312.34299, "t": 680.4933599999999, "r": 541.63232, "b": 689.39993, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 10: Example of a complex table with empty cells."}, {"label": "page_footer", "id": 7, "page_no": 12, "cluster": {"id": 7, "label": "page_footer", "bbox": {"l": 292.63098, "t": 734.133358, "r": 302.59357, "b": 743.039921, "coord_origin": "TOPLEFT"}, "confidence": 0.9020507335662842, "cells": [{"id": 10, "text": "13", "bbox": {"l": 292.63098, "t": 734.133358, "r": 302.59357, "b": 743.039921, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "13"}, {"label": "table", "id": 17, "page_no": 12, "cluster": {"id": 17, "label": "table", "bbox": {"l": 310.3294372558594, "t": 101.17767333984375, "r": 555.8338623046875, "b": 136.14752197265625, "coord_origin": "TOPLEFT"}, "confidence": 0.70481276512146, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 32, "page_no": 12, "cluster": {"id": 32, "label": "table", "bbox": {"l": 309.9566345214844, "t": 154.61448669433594, "r": 555.7466430664062, "b": 184.7225341796875, "coord_origin": "TOPLEFT"}, "confidence": 0.564289927482605, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 9, "page_no": 12, "cluster": {"id": 9, "label": "table", "bbox": {"l": 84.0283203125, "t": 156.3335418701172, "r": 239.1690673828125, "b": 214.39334106445312, "coord_origin": "TOPLEFT"}, "confidence": 0.8857279419898987, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 21, "page_no": 12, "cluster": {"id": 21, "label": "table", "bbox": {"l": 309.9635314941406, "t": 195.70541381835938, "r": 555.7054443359375, "b": 233.55145263671875, "coord_origin": "TOPLEFT"}, "confidence": 0.6602518558502197, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 4, "page_no": 12, "cluster": {"id": 4, "label": "table", "bbox": {"l": 82.92001342773438, "t": 233.7763214111328, "r": 239.1903533935547, "b": 291.283935546875, "coord_origin": "TOPLEFT"}, "confidence": 0.9155725836753845, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "picture", "id": 19, "page_no": 12, "cluster": {"id": 19, "label": "picture", "bbox": {"l": 309.79150390625, "t": 253.90536499023438, "r": 425.9603271484375, "b": 292.39398193359375, "coord_origin": "TOPLEFT"}, "confidence": 0.6956620812416077, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "table", "id": 37, "page_no": 12, "cluster": {"id": 37, "label": "table", "bbox": {"l": 309.79150390625, "t": 253.90536499023438, "r": 425.9603271484375, "b": 292.39398193359375, "coord_origin": "TOPLEFT"}, "confidence": 0.52826988697052, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 6, "page_no": 12, "cluster": {"id": 6, "label": "table", "bbox": {"l": 83.94786071777344, "t": 309.0477294921875, "r": 239.17135620117188, "b": 367.9095764160156, "coord_origin": "TOPLEFT"}, "confidence": 0.9085132479667664, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 12, "page_no": 12, "cluster": {"id": 12, "label": "table", "bbox": {"l": 335.2694091796875, "t": 388.46746826171875, "r": 490.081787109375, "b": 437.02239990234375, "coord_origin": "TOPLEFT"}, "confidence": 0.8486077189445496, "cells": [], "children": []}, "text": null, "otsl_seq": ["ecel", "ched", "ched", "lcel", "ched", "nl", "ecel", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 0, "page_no": 12, "cluster": {"id": 0, "label": "table", "bbox": {"l": 83.31756591796875, "t": 396.0135498046875, "r": 248.873046875, "b": 487.2569885253906, "coord_origin": "TOPLEFT"}, "confidence": 0.9613965749740601, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "ched", "nl", "fcel", "lcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "lcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 10, "page_no": 12, "cluster": {"id": 10, "label": "table", "bbox": {"l": 334.9334716796875, "t": 453.9476318359375, "r": 490.0914306640625, "b": 502.7210998535156, "coord_origin": "TOPLEFT"}, "confidence": 0.8815538287162781, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "lcel", "lcel", "lcel", "nl", "ched", "ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 5, "page_no": 12, "cluster": {"id": 5, "label": "table", "bbox": {"l": 335.2545471191406, "t": 519.07568359375, "r": 490.22369384765625, "b": 567.6879272460938, "coord_origin": "TOPLEFT"}, "confidence": 0.9096733927726746, "cells": [], "children": []}, "text": null, "otsl_seq": ["ecel", "ched", "lcel", "lcel", "lcel", "nl", "ecel", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "picture", "id": 13, "page_no": 12, "cluster": {"id": 13, "label": "picture", "bbox": {"l": 333.9573669433594, "t": 593.1134033203125, "r": 518.4768676757812, "b": 665.4903564453125, "coord_origin": "TOPLEFT"}, "confidence": 0.8023569583892822, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "table", "id": 30, "page_no": 12, "cluster": {"id": 30, "label": "table", "bbox": {"l": 333.9573669433594, "t": 593.1134033203125, "r": 518.4768676757812, "b": 665.4903564453125, "coord_origin": "TOPLEFT"}, "confidence": 0.5930293798446655, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}], "body": [{"label": "text", "id": 14, "page_no": 12, "cluster": {"id": 14, "label": "text", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 88.846588, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.7545598149299622, "cells": [{"id": 0, "text": "phan cell.", "bbox": {"l": 50.112, "t": 75.20836999999995, "r": 88.846588, "b": 84.11492999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "phan cell."}, {"label": "text", "id": 3, "page_no": 12, "cluster": {"id": 3, "label": "text", "bbox": {"l": 50.112, "t": 87.16339000000005, "r": 286.36496, "b": 108.02495999999985, "coord_origin": "TOPLEFT"}, "confidence": 0.9170762300491333, "cells": [{"id": 1, "text": "9f. Otherwise create a new structural cell and match it", "bbox": {"l": 62.067001, "t": 87.16339000000005, "r": 286.36496, "b": 96.06994999999995, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "wit the orphan cell.", "bbox": {"l": 50.112, "t": 99.11841000000004, "r": 127.03322, "b": 108.02495999999985, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "9f. Otherwise create a new structural cell and match it wit the orphan cell."}, {"label": "text", "id": 1, "page_no": 12, "cluster": {"id": 1, "label": "text", "bbox": {"l": 50.112, "t": 111.16309000000001, "r": 286.36499, "b": 131.70587, "coord_origin": "TOPLEFT"}, "confidence": 0.9454683065414429, "cells": [{"id": 3, "text": "Aditional images with examples of TableFormer predic-", "bbox": {"l": 62.067001, "t": 111.16309000000001, "r": 286.36499, "b": 119.7508499999999, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "tions and post-processing can be found below.", "bbox": {"l": 50.112, "t": 123.11810000000003, "r": 234.06139999999996, "b": 131.70587, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Aditional images with examples of TableFormer predictions and post-processing can be found below."}, {"label": "caption", "id": 8, "page_no": 12, "cluster": {"id": 8, "label": "caption", "bbox": {"l": 63.341, "t": 502.05637, "r": 273.13342, "b": 510.96292, "coord_origin": "TOPLEFT"}, "confidence": 0.8971090316772461, "cells": [{"id": 5, "text": "Figure 8: Example of a table with multi-line header.", "bbox": {"l": 63.341, "t": 502.05637, "r": 273.13342, "b": 510.96292, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 8: Example of a table with multi-line header."}, {"label": "caption", "id": 11, "page_no": 12, "cluster": {"id": 11, "label": "caption", "bbox": {"l": 308.862, "t": 306.59836, "r": 545.11511, "b": 327.45990000000006, "coord_origin": "TOPLEFT"}, "confidence": 0.8773345351219177, "cells": [{"id": 6, "text": "Figure 9:", "bbox": {"l": 308.862, "t": 306.59836, "r": 345.63397, "b": 315.50491, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Example of a table with big empty distance be-", "bbox": {"l": 352.78711, "t": 306.59836, "r": 545.11511, "b": 315.50491, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "tween cells.", "bbox": {"l": 308.862, "t": 318.55334, "r": 355.89545, "b": 327.45990000000006, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 9: Example of a table with big empty distance between cells."}, {"label": "caption", "id": 2, "page_no": 12, "cluster": {"id": 2, "label": "caption", "bbox": {"l": 312.34299, "t": 680.4933599999999, "r": 541.63232, "b": 689.39993, "coord_origin": "TOPLEFT"}, "confidence": 0.9188510179519653, "cells": [{"id": 9, "text": "Figure 10: Example of a complex table with empty cells.", "bbox": {"l": 312.34299, "t": 680.4933599999999, "r": 541.63232, "b": 689.39993, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 10: Example of a complex table with empty cells."}, {"label": "table", "id": 17, "page_no": 12, "cluster": {"id": 17, "label": "table", "bbox": {"l": 310.3294372558594, "t": 101.17767333984375, "r": 555.8338623046875, "b": 136.14752197265625, "coord_origin": "TOPLEFT"}, "confidence": 0.70481276512146, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 32, "page_no": 12, "cluster": {"id": 32, "label": "table", "bbox": {"l": 309.9566345214844, "t": 154.61448669433594, "r": 555.7466430664062, "b": 184.7225341796875, "coord_origin": "TOPLEFT"}, "confidence": 0.564289927482605, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 9, "page_no": 12, "cluster": {"id": 9, "label": "table", "bbox": {"l": 84.0283203125, "t": 156.3335418701172, "r": 239.1690673828125, "b": 214.39334106445312, "coord_origin": "TOPLEFT"}, "confidence": 0.8857279419898987, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 21, "page_no": 12, "cluster": {"id": 21, "label": "table", "bbox": {"l": 309.9635314941406, "t": 195.70541381835938, "r": 555.7054443359375, "b": 233.55145263671875, "coord_origin": "TOPLEFT"}, "confidence": 0.6602518558502197, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 4, "page_no": 12, "cluster": {"id": 4, "label": "table", "bbox": {"l": 82.92001342773438, "t": 233.7763214111328, "r": 239.1903533935547, "b": 291.283935546875, "coord_origin": "TOPLEFT"}, "confidence": 0.9155725836753845, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "picture", "id": 19, "page_no": 12, "cluster": {"id": 19, "label": "picture", "bbox": {"l": 309.79150390625, "t": 253.90536499023438, "r": 425.9603271484375, "b": 292.39398193359375, "coord_origin": "TOPLEFT"}, "confidence": 0.6956620812416077, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "table", "id": 37, "page_no": 12, "cluster": {"id": 37, "label": "table", "bbox": {"l": 309.79150390625, "t": 253.90536499023438, "r": 425.9603271484375, "b": 292.39398193359375, "coord_origin": "TOPLEFT"}, "confidence": 0.52826988697052, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 6, "page_no": 12, "cluster": {"id": 6, "label": "table", "bbox": {"l": 83.94786071777344, "t": 309.0477294921875, "r": 239.17135620117188, "b": 367.9095764160156, "coord_origin": "TOPLEFT"}, "confidence": 0.9085132479667664, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 12, "page_no": 12, "cluster": {"id": 12, "label": "table", "bbox": {"l": 335.2694091796875, "t": 388.46746826171875, "r": 490.081787109375, "b": 437.02239990234375, "coord_origin": "TOPLEFT"}, "confidence": 0.8486077189445496, "cells": [], "children": []}, "text": null, "otsl_seq": ["ecel", "ched", "ched", "lcel", "ched", "nl", "ecel", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 0, "page_no": 12, "cluster": {"id": 0, "label": "table", "bbox": {"l": 83.31756591796875, "t": 396.0135498046875, "r": 248.873046875, "b": 487.2569885253906, "coord_origin": "TOPLEFT"}, "confidence": 0.9613965749740601, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "ched", "nl", "fcel", "lcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "lcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 10, "page_no": 12, "cluster": {"id": 10, "label": "table", "bbox": {"l": 334.9334716796875, "t": 453.9476318359375, "r": 490.0914306640625, "b": 502.7210998535156, "coord_origin": "TOPLEFT"}, "confidence": 0.8815538287162781, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "lcel", "lcel", "lcel", "nl", "ched", "ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 5, "page_no": 12, "cluster": {"id": 5, "label": "table", "bbox": {"l": 335.2545471191406, "t": 519.07568359375, "r": 490.22369384765625, "b": 567.6879272460938, "coord_origin": "TOPLEFT"}, "confidence": 0.9096733927726746, "cells": [], "children": []}, "text": null, "otsl_seq": ["ecel", "ched", "lcel", "lcel", "lcel", "nl", "ecel", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "picture", "id": 13, "page_no": 12, "cluster": {"id": 13, "label": "picture", "bbox": {"l": 333.9573669433594, "t": 593.1134033203125, "r": 518.4768676757812, "b": 665.4903564453125, "coord_origin": "TOPLEFT"}, "confidence": 0.8023569583892822, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "table", "id": 30, "page_no": 12, "cluster": {"id": 30, "label": "table", "bbox": {"l": 333.9573669433594, "t": 593.1134033203125, "r": 518.4768676757812, "b": 665.4903564453125, "coord_origin": "TOPLEFT"}, "confidence": 0.5930293798446655, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}], "headers": [{"label": "page_footer", "id": 7, "page_no": 12, "cluster": {"id": 7, "label": "page_footer", "bbox": {"l": 292.63098, "t": 734.133358, "r": 302.59357, "b": 743.039921, "coord_origin": "TOPLEFT"}, "confidence": 0.9020507335662842, "cells": [{"id": 10, "text": "13", "bbox": {"l": 292.63098, "t": 734.133358, "r": 302.59357, "b": 743.039921, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "13"}]}}, {"page_no": 13, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "Figure 11:", "bbox": {"l": 50.112, "t": 356.77036, "r": 93.050797, "b": 365.67691, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Simple table with different style and empty", "bbox": {"l": 103.73071, "t": 356.77036, "r": 286.36508, "b": 365.67691, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "cells.", "bbox": {"l": 50.112, "t": 368.72534, "r": 70.864098, "b": 377.6319, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Figure 12: Simple table predictions and post processing.", "bbox": {"l": 54.618998999999995, "t": 671.81836, "r": 281.8559, "b": 680.72492, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Figure 13: Table predictions example on colorful table.", "bbox": {"l": 315.79001, "t": 371.68436, "r": 538.18524, "b": 380.59091, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Figure 14: Example with multi-line text.", "bbox": {"l": 344.98499, "t": 683.54636, "r": 508.98935000000006, "b": 692.452927, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "14", "bbox": {"l": 292.63098, "t": 734.133362, "r": 302.59357, "b": 743.039925, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 0, "label": "caption", "bbox": {"l": 50.112, "t": 356.77036, "r": 286.36508, "b": 377.6319, "coord_origin": "TOPLEFT"}, "confidence": 0.951069176197052, "cells": [{"id": 0, "text": "Figure 11:", "bbox": {"l": 50.112, "t": 356.77036, "r": 93.050797, "b": 365.67691, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Simple table with different style and empty", "bbox": {"l": 103.73071, "t": 356.77036, "r": 286.36508, "b": 365.67691, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "cells.", "bbox": {"l": 50.112, "t": 368.72534, "r": 70.864098, "b": 377.6319, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "caption", "bbox": {"l": 54.618998999999995, "t": 671.81836, "r": 281.8559, "b": 680.72492, "coord_origin": "TOPLEFT"}, "confidence": 0.926384687423706, "cells": [{"id": 3, "text": "Figure 12: Simple table predictions and post processing.", "bbox": {"l": 54.618998999999995, "t": 671.81836, "r": 281.8559, "b": 680.72492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "caption", "bbox": {"l": 315.79001, "t": 371.68436, "r": 538.18524, "b": 380.59091, "coord_origin": "TOPLEFT"}, "confidence": 0.9178510904312134, "cells": [{"id": 4, "text": "Figure 13: Table predictions example on colorful table.", "bbox": {"l": 315.79001, "t": 371.68436, "r": 538.18524, "b": 380.59091, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "caption", "bbox": {"l": 344.98499, "t": 683.54636, "r": 508.98935000000006, "b": 692.452927, "coord_origin": "TOPLEFT"}, "confidence": 0.9191023111343384, "cells": [{"id": 5, "text": "Figure 14: Example with multi-line text.", "bbox": {"l": 344.98499, "t": 683.54636, "r": 508.98935000000006, "b": 692.452927, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "page_footer", "bbox": {"l": 292.63098, "t": 734.133362, "r": 302.59357, "b": 743.039925, "coord_origin": "TOPLEFT"}, "confidence": 0.887715220451355, "cells": [{"id": 6, "text": "14", "bbox": {"l": 292.63098, "t": 734.133362, "r": 302.59357, "b": 743.039925, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "picture", "bbox": {"l": 318.6332092285156, "t": 90.88423156738281, "r": 534.73583984375, "b": 359.0575866699219, "coord_origin": "TOPLEFT"}, "confidence": 0.5003598928451538, "cells": [], "children": []}, {"id": 30, "label": "picture", "bbox": {"l": 51.15378952026367, "t": 104.30851745605469, "r": 282.8598937988281, "b": 344.90667724609375, "coord_origin": "TOPLEFT"}, "confidence": 0.5613773465156555, "cells": [], "children": []}, {"id": 23, "label": "table", "bbox": {"l": 318.9809265136719, "t": 161.23460388183594, "r": 534.6229248046875, "b": 214.6260528564453, "coord_origin": "TOPLEFT"}, "confidence": 0.6235634684562683, "cells": [], "children": []}, {"id": 33, "label": "table", "bbox": {"l": 319.0057678222656, "t": 226.10633850097656, "r": 534.408935546875, "b": 279.8576965332031, "coord_origin": "TOPLEFT"}, "confidence": 0.5502500534057617, "cells": [], "children": []}, {"id": 27, "label": "table", "bbox": {"l": 51.72642135620117, "t": 273.6092834472656, "r": 283.114013671875, "b": 344.2445068359375, "coord_origin": "TOPLEFT"}, "confidence": 0.5696635246276855, "cells": [], "children": []}, {"id": 38, "label": "table", "bbox": {"l": 328.1381530761719, "t": 288.6817932128906, "r": 523.8916015625, "b": 358.2724304199219, "coord_origin": "TOPLEFT"}, "confidence": 0.5227423310279846, "cells": [], "children": []}, {"id": 10, "label": "table", "bbox": {"l": 319.4707946777344, "t": 430.90301513671875, "r": 518.5693359375, "b": 477.94354248046875, "coord_origin": "TOPLEFT"}, "confidence": 0.8384715914726257, "cells": [], "children": []}, {"id": 9, "label": "table", "bbox": {"l": 51.434879302978516, "t": 453.48748779296875, "r": 310.7267150878906, "b": 491.82025146484375, "coord_origin": "TOPLEFT"}, "confidence": 0.8418155908584595, "cells": [], "children": []}, {"id": 8, "label": "table", "bbox": {"l": 319.982666015625, "t": 489.2437438964844, "r": 519.0963745117188, "b": 535.69580078125, "coord_origin": "TOPLEFT"}, "confidence": 0.8502867221832275, "cells": [], "children": []}, {"id": 4, "label": "table", "bbox": {"l": 50.86823654174805, "t": 504.09625244140625, "r": 310.6080017089844, "b": 542.4459838867188, "coord_origin": "TOPLEFT"}, "confidence": 0.8922696709632874, "cells": [], "children": []}, {"id": 15, "label": "table", "bbox": {"l": 319.8287658691406, "t": 546.4093017578125, "r": 519.6065673828125, "b": 593.1064453125, "coord_origin": "TOPLEFT"}, "confidence": 0.6817973256111145, "cells": [], "children": []}, {"id": 6, "label": "table", "bbox": {"l": 51.27280807495117, "t": 553.728515625, "r": 311.0897216796875, "b": 591.913330078125, "coord_origin": "TOPLEFT"}, "confidence": 0.88722163438797, "cells": [], "children": []}, {"id": 7, "label": "table", "bbox": {"l": 319.06494140625, "t": 609.8408203125, "r": 533.77392578125, "b": 669.1920776367188, "coord_origin": "TOPLEFT"}, "confidence": 0.8717735409736633, "cells": [], "children": []}, {"id": 11, "label": "picture", "bbox": {"l": 50.40477752685547, "t": 611.0038452148438, "r": 177.0564422607422, "b": 656.1609497070312, "coord_origin": "TOPLEFT"}, "confidence": 0.7871124744415283, "cells": [], "children": []}]}, "tablestructure": {"table_map": {"23": {"label": "table", "id": 23, "page_no": 13, "cluster": {"id": 23, "label": "table", "bbox": {"l": 318.9809265136719, "t": 161.23460388183594, "r": 534.6229248046875, "b": 214.6260528564453, "coord_origin": "TOPLEFT"}, "confidence": 0.6235634684562683, "cells": [], "children": []}, "text": null, "otsl_seq": ["fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, "33": {"label": "table", "id": 33, "page_no": 13, "cluster": {"id": 33, "label": "table", "bbox": {"l": 319.0057678222656, "t": 226.10633850097656, "r": 534.408935546875, "b": 279.8576965332031, "coord_origin": "TOPLEFT"}, "confidence": 0.5502500534057617, "cells": [], "children": []}, "text": null, "otsl_seq": ["fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, "27": {"label": "table", "id": 27, "page_no": 13, "cluster": {"id": 27, "label": "table", "bbox": {"l": 51.72642135620117, "t": 273.6092834472656, "r": 283.114013671875, "b": 344.2445068359375, "coord_origin": "TOPLEFT"}, "confidence": 0.5696635246276855, "cells": [], "children": []}, "text": null, "otsl_seq": ["ecel", "ched", "ched", "ched", "nl", "ecel", "fcel", "fcel", "fcel", "nl", "ecel", "fcel", "fcel", "fcel", "nl", "ecel", "fcel", "fcel", "ecel", "nl", "ecel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "ecel", "nl", "rhed", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "ecel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, "38": {"label": "table", "id": 38, "page_no": 13, "cluster": {"id": 38, "label": "table", "bbox": {"l": 328.1381530761719, "t": 288.6817932128906, "r": 523.8916015625, "b": 358.2724304199219, "coord_origin": "TOPLEFT"}, "confidence": 0.5227423310279846, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "ecel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, "10": {"label": "table", "id": 10, "page_no": 13, "cluster": {"id": 10, "label": "table", "bbox": {"l": 319.4707946777344, "t": 430.90301513671875, "r": 518.5693359375, "b": 477.94354248046875, "coord_origin": "TOPLEFT"}, "confidence": 0.8384715914726257, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, "9": {"label": "table", "id": 9, "page_no": 13, "cluster": {"id": 9, "label": "table", "bbox": {"l": 51.434879302978516, "t": 453.48748779296875, "r": 310.7267150878906, "b": 491.82025146484375, "coord_origin": "TOPLEFT"}, "confidence": 0.8418155908584595, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, "8": {"label": "table", "id": 8, "page_no": 13, "cluster": {"id": 8, "label": "table", "bbox": {"l": 319.982666015625, "t": 489.2437438964844, "r": 519.0963745117188, "b": 535.69580078125, "coord_origin": "TOPLEFT"}, "confidence": 0.8502867221832275, "cells": [], "children": []}, "text": null, "otsl_seq": ["fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, "4": {"label": "table", "id": 4, "page_no": 13, "cluster": {"id": 4, "label": "table", "bbox": {"l": 50.86823654174805, "t": 504.09625244140625, "r": 310.6080017089844, "b": 542.4459838867188, "coord_origin": "TOPLEFT"}, "confidence": 0.8922696709632874, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, "15": {"label": "table", "id": 15, "page_no": 13, "cluster": {"id": 15, "label": "table", "bbox": {"l": 319.8287658691406, "t": 546.4093017578125, "r": 519.6065673828125, "b": 593.1064453125, "coord_origin": "TOPLEFT"}, "confidence": 0.6817973256111145, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, "6": {"label": "table", "id": 6, "page_no": 13, "cluster": {"id": 6, "label": "table", "bbox": {"l": 51.27280807495117, "t": 553.728515625, "r": 311.0897216796875, "b": 591.913330078125, "coord_origin": "TOPLEFT"}, "confidence": 0.88722163438797, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, "7": {"label": "table", "id": 7, "page_no": 13, "cluster": {"id": 7, "label": "table", "bbox": {"l": 319.06494140625, "t": 609.8408203125, "r": 533.77392578125, "b": 669.1920776367188, "coord_origin": "TOPLEFT"}, "confidence": 0.8717735409736633, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "caption", "id": 0, "page_no": 13, "cluster": {"id": 0, "label": "caption", "bbox": {"l": 50.112, "t": 356.77036, "r": 286.36508, "b": 377.6319, "coord_origin": "TOPLEFT"}, "confidence": 0.951069176197052, "cells": [{"id": 0, "text": "Figure 11:", "bbox": {"l": 50.112, "t": 356.77036, "r": 93.050797, "b": 365.67691, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Simple table with different style and empty", "bbox": {"l": 103.73071, "t": 356.77036, "r": 286.36508, "b": 365.67691, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "cells.", "bbox": {"l": 50.112, "t": 368.72534, "r": 70.864098, "b": 377.6319, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 11: Simple table with different style and empty cells."}, {"label": "caption", "id": 1, "page_no": 13, "cluster": {"id": 1, "label": "caption", "bbox": {"l": 54.618998999999995, "t": 671.81836, "r": 281.8559, "b": 680.72492, "coord_origin": "TOPLEFT"}, "confidence": 0.926384687423706, "cells": [{"id": 3, "text": "Figure 12: Simple table predictions and post processing.", "bbox": {"l": 54.618998999999995, "t": 671.81836, "r": 281.8559, "b": 680.72492, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 12: Simple table predictions and post processing."}, {"label": "caption", "id": 3, "page_no": 13, "cluster": {"id": 3, "label": "caption", "bbox": {"l": 315.79001, "t": 371.68436, "r": 538.18524, "b": 380.59091, "coord_origin": "TOPLEFT"}, "confidence": 0.9178510904312134, "cells": [{"id": 4, "text": "Figure 13: Table predictions example on colorful table.", "bbox": {"l": 315.79001, "t": 371.68436, "r": 538.18524, "b": 380.59091, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 13: Table predictions example on colorful table."}, {"label": "caption", "id": 2, "page_no": 13, "cluster": {"id": 2, "label": "caption", "bbox": {"l": 344.98499, "t": 683.54636, "r": 508.98935000000006, "b": 692.452927, "coord_origin": "TOPLEFT"}, "confidence": 0.9191023111343384, "cells": [{"id": 5, "text": "Figure 14: Example with multi-line text.", "bbox": {"l": 344.98499, "t": 683.54636, "r": 508.98935000000006, "b": 692.452927, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 14: Example with multi-line text."}, {"label": "page_footer", "id": 5, "page_no": 13, "cluster": {"id": 5, "label": "page_footer", "bbox": {"l": 292.63098, "t": 734.133362, "r": 302.59357, "b": 743.039925, "coord_origin": "TOPLEFT"}, "confidence": 0.887715220451355, "cells": [{"id": 6, "text": "14", "bbox": {"l": 292.63098, "t": 734.133362, "r": 302.59357, "b": 743.039925, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "14"}, {"label": "picture", "id": 41, "page_no": 13, "cluster": {"id": 41, "label": "picture", "bbox": {"l": 318.6332092285156, "t": 90.88423156738281, "r": 534.73583984375, "b": 359.0575866699219, "coord_origin": "TOPLEFT"}, "confidence": 0.5003598928451538, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "picture", "id": 30, "page_no": 13, "cluster": {"id": 30, "label": "picture", "bbox": {"l": 51.15378952026367, "t": 104.30851745605469, "r": 282.8598937988281, "b": 344.90667724609375, "coord_origin": "TOPLEFT"}, "confidence": 0.5613773465156555, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "table", "id": 23, "page_no": 13, "cluster": {"id": 23, "label": "table", "bbox": {"l": 318.9809265136719, "t": 161.23460388183594, "r": 534.6229248046875, "b": 214.6260528564453, "coord_origin": "TOPLEFT"}, "confidence": 0.6235634684562683, "cells": [], "children": []}, "text": null, "otsl_seq": ["fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 33, "page_no": 13, "cluster": {"id": 33, "label": "table", "bbox": {"l": 319.0057678222656, "t": 226.10633850097656, "r": 534.408935546875, "b": 279.8576965332031, "coord_origin": "TOPLEFT"}, "confidence": 0.5502500534057617, "cells": [], "children": []}, "text": null, "otsl_seq": ["fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 27, "page_no": 13, "cluster": {"id": 27, "label": "table", "bbox": {"l": 51.72642135620117, "t": 273.6092834472656, "r": 283.114013671875, "b": 344.2445068359375, "coord_origin": "TOPLEFT"}, "confidence": 0.5696635246276855, "cells": [], "children": []}, "text": null, "otsl_seq": ["ecel", "ched", "ched", "ched", "nl", "ecel", "fcel", "fcel", "fcel", "nl", "ecel", "fcel", "fcel", "fcel", "nl", "ecel", "fcel", "fcel", "ecel", "nl", "ecel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "ecel", "nl", "rhed", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "ecel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 38, "page_no": 13, "cluster": {"id": 38, "label": "table", "bbox": {"l": 328.1381530761719, "t": 288.6817932128906, "r": 523.8916015625, "b": 358.2724304199219, "coord_origin": "TOPLEFT"}, "confidence": 0.5227423310279846, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "ecel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 10, "page_no": 13, "cluster": {"id": 10, "label": "table", "bbox": {"l": 319.4707946777344, "t": 430.90301513671875, "r": 518.5693359375, "b": 477.94354248046875, "coord_origin": "TOPLEFT"}, "confidence": 0.8384715914726257, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 9, "page_no": 13, "cluster": {"id": 9, "label": "table", "bbox": {"l": 51.434879302978516, "t": 453.48748779296875, "r": 310.7267150878906, "b": 491.82025146484375, "coord_origin": "TOPLEFT"}, "confidence": 0.8418155908584595, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 8, "page_no": 13, "cluster": {"id": 8, "label": "table", "bbox": {"l": 319.982666015625, "t": 489.2437438964844, "r": 519.0963745117188, "b": 535.69580078125, "coord_origin": "TOPLEFT"}, "confidence": 0.8502867221832275, "cells": [], "children": []}, "text": null, "otsl_seq": ["fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 4, "page_no": 13, "cluster": {"id": 4, "label": "table", "bbox": {"l": 50.86823654174805, "t": 504.09625244140625, "r": 310.6080017089844, "b": 542.4459838867188, "coord_origin": "TOPLEFT"}, "confidence": 0.8922696709632874, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 15, "page_no": 13, "cluster": {"id": 15, "label": "table", "bbox": {"l": 319.8287658691406, "t": 546.4093017578125, "r": 519.6065673828125, "b": 593.1064453125, "coord_origin": "TOPLEFT"}, "confidence": 0.6817973256111145, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 6, "page_no": 13, "cluster": {"id": 6, "label": "table", "bbox": {"l": 51.27280807495117, "t": 553.728515625, "r": 311.0897216796875, "b": 591.913330078125, "coord_origin": "TOPLEFT"}, "confidence": 0.88722163438797, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 7, "page_no": 13, "cluster": {"id": 7, "label": "table", "bbox": {"l": 319.06494140625, "t": 609.8408203125, "r": 533.77392578125, "b": 669.1920776367188, "coord_origin": "TOPLEFT"}, "confidence": 0.8717735409736633, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "picture", "id": 11, "page_no": 13, "cluster": {"id": 11, "label": "picture", "bbox": {"l": 50.40477752685547, "t": 611.0038452148438, "r": 177.0564422607422, "b": 656.1609497070312, "coord_origin": "TOPLEFT"}, "confidence": 0.7871124744415283, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "body": [{"label": "caption", "id": 0, "page_no": 13, "cluster": {"id": 0, "label": "caption", "bbox": {"l": 50.112, "t": 356.77036, "r": 286.36508, "b": 377.6319, "coord_origin": "TOPLEFT"}, "confidence": 0.951069176197052, "cells": [{"id": 0, "text": "Figure 11:", "bbox": {"l": 50.112, "t": 356.77036, "r": 93.050797, "b": 365.67691, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Simple table with different style and empty", "bbox": {"l": 103.73071, "t": 356.77036, "r": 286.36508, "b": 365.67691, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "cells.", "bbox": {"l": 50.112, "t": 368.72534, "r": 70.864098, "b": 377.6319, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 11: Simple table with different style and empty cells."}, {"label": "caption", "id": 1, "page_no": 13, "cluster": {"id": 1, "label": "caption", "bbox": {"l": 54.618998999999995, "t": 671.81836, "r": 281.8559, "b": 680.72492, "coord_origin": "TOPLEFT"}, "confidence": 0.926384687423706, "cells": [{"id": 3, "text": "Figure 12: Simple table predictions and post processing.", "bbox": {"l": 54.618998999999995, "t": 671.81836, "r": 281.8559, "b": 680.72492, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 12: Simple table predictions and post processing."}, {"label": "caption", "id": 3, "page_no": 13, "cluster": {"id": 3, "label": "caption", "bbox": {"l": 315.79001, "t": 371.68436, "r": 538.18524, "b": 380.59091, "coord_origin": "TOPLEFT"}, "confidence": 0.9178510904312134, "cells": [{"id": 4, "text": "Figure 13: Table predictions example on colorful table.", "bbox": {"l": 315.79001, "t": 371.68436, "r": 538.18524, "b": 380.59091, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 13: Table predictions example on colorful table."}, {"label": "caption", "id": 2, "page_no": 13, "cluster": {"id": 2, "label": "caption", "bbox": {"l": 344.98499, "t": 683.54636, "r": 508.98935000000006, "b": 692.452927, "coord_origin": "TOPLEFT"}, "confidence": 0.9191023111343384, "cells": [{"id": 5, "text": "Figure 14: Example with multi-line text.", "bbox": {"l": 344.98499, "t": 683.54636, "r": 508.98935000000006, "b": 692.452927, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 14: Example with multi-line text."}, {"label": "picture", "id": 41, "page_no": 13, "cluster": {"id": 41, "label": "picture", "bbox": {"l": 318.6332092285156, "t": 90.88423156738281, "r": 534.73583984375, "b": 359.0575866699219, "coord_origin": "TOPLEFT"}, "confidence": 0.5003598928451538, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "picture", "id": 30, "page_no": 13, "cluster": {"id": 30, "label": "picture", "bbox": {"l": 51.15378952026367, "t": 104.30851745605469, "r": 282.8598937988281, "b": 344.90667724609375, "coord_origin": "TOPLEFT"}, "confidence": 0.5613773465156555, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "table", "id": 23, "page_no": 13, "cluster": {"id": 23, "label": "table", "bbox": {"l": 318.9809265136719, "t": 161.23460388183594, "r": 534.6229248046875, "b": 214.6260528564453, "coord_origin": "TOPLEFT"}, "confidence": 0.6235634684562683, "cells": [], "children": []}, "text": null, "otsl_seq": ["fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 33, "page_no": 13, "cluster": {"id": 33, "label": "table", "bbox": {"l": 319.0057678222656, "t": 226.10633850097656, "r": 534.408935546875, "b": 279.8576965332031, "coord_origin": "TOPLEFT"}, "confidence": 0.5502500534057617, "cells": [], "children": []}, "text": null, "otsl_seq": ["fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 27, "page_no": 13, "cluster": {"id": 27, "label": "table", "bbox": {"l": 51.72642135620117, "t": 273.6092834472656, "r": 283.114013671875, "b": 344.2445068359375, "coord_origin": "TOPLEFT"}, "confidence": 0.5696635246276855, "cells": [], "children": []}, "text": null, "otsl_seq": ["ecel", "ched", "ched", "ched", "nl", "ecel", "fcel", "fcel", "fcel", "nl", "ecel", "fcel", "fcel", "fcel", "nl", "ecel", "fcel", "fcel", "ecel", "nl", "ecel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "ecel", "nl", "rhed", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "ecel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 38, "page_no": 13, "cluster": {"id": 38, "label": "table", "bbox": {"l": 328.1381530761719, "t": 288.6817932128906, "r": 523.8916015625, "b": 358.2724304199219, "coord_origin": "TOPLEFT"}, "confidence": 0.5227423310279846, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "ecel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "ecel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 10, "page_no": 13, "cluster": {"id": 10, "label": "table", "bbox": {"l": 319.4707946777344, "t": 430.90301513671875, "r": 518.5693359375, "b": 477.94354248046875, "coord_origin": "TOPLEFT"}, "confidence": 0.8384715914726257, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 9, "page_no": 13, "cluster": {"id": 9, "label": "table", "bbox": {"l": 51.434879302978516, "t": 453.48748779296875, "r": 310.7267150878906, "b": 491.82025146484375, "coord_origin": "TOPLEFT"}, "confidence": 0.8418155908584595, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 8, "page_no": 13, "cluster": {"id": 8, "label": "table", "bbox": {"l": 319.982666015625, "t": 489.2437438964844, "r": 519.0963745117188, "b": 535.69580078125, "coord_origin": "TOPLEFT"}, "confidence": 0.8502867221832275, "cells": [], "children": []}, "text": null, "otsl_seq": ["fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 4, "page_no": 13, "cluster": {"id": 4, "label": "table", "bbox": {"l": 50.86823654174805, "t": 504.09625244140625, "r": 310.6080017089844, "b": 542.4459838867188, "coord_origin": "TOPLEFT"}, "confidence": 0.8922696709632874, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 15, "page_no": 13, "cluster": {"id": 15, "label": "table", "bbox": {"l": 319.8287658691406, "t": 546.4093017578125, "r": 519.6065673828125, "b": 593.1064453125, "coord_origin": "TOPLEFT"}, "confidence": 0.6817973256111145, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 6, "page_no": 13, "cluster": {"id": 6, "label": "table", "bbox": {"l": 51.27280807495117, "t": 553.728515625, "r": 311.0897216796875, "b": 591.913330078125, "coord_origin": "TOPLEFT"}, "confidence": 0.88722163438797, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 7, "page_no": 13, "cluster": {"id": 7, "label": "table", "bbox": {"l": 319.06494140625, "t": 609.8408203125, "r": 533.77392578125, "b": 669.1920776367188, "coord_origin": "TOPLEFT"}, "confidence": 0.8717735409736633, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "picture", "id": 11, "page_no": 13, "cluster": {"id": 11, "label": "picture", "bbox": {"l": 50.40477752685547, "t": 611.0038452148438, "r": 177.0564422607422, "b": 656.1609497070312, "coord_origin": "TOPLEFT"}, "confidence": 0.7871124744415283, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "headers": [{"label": "page_footer", "id": 5, "page_no": 13, "cluster": {"id": 5, "label": "page_footer", "bbox": {"l": 292.63098, "t": 734.133362, "r": 302.59357, "b": 743.039925, "coord_origin": "TOPLEFT"}, "confidence": 0.887715220451355, "cells": [{"id": 6, "text": "14", "bbox": {"l": 292.63098, "t": 734.133362, "r": 302.59357, "b": 743.039925, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "14"}]}}, {"page_no": 14, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "Figure 15: Example with triangular table.", "bbox": {"l": 84.233002, "t": 644.3513800000001, "r": 252.24225, "b": 653.25793, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Figure 16: Example of how post-processing helps to restore", "bbox": {"l": 308.86197, "t": 652.93535, "r": 545.11511, "b": 661.8419, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "mis-aligned bounding boxes prediction artifact.", "bbox": {"l": 308.86197, "t": 664.89035, "r": 497.60349, "b": 673.79691, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "15", "bbox": {"l": 292.63098, "t": 734.133343, "r": 302.59357, "b": 743.039906, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 0, "label": "caption", "bbox": {"l": 84.233002, "t": 644.3513800000001, "r": 252.24225, "b": 653.25793, "coord_origin": "TOPLEFT"}, "confidence": 0.9257225394248962, "cells": [{"id": 0, "text": "Figure 15: Example with triangular table.", "bbox": {"l": 84.233002, "t": 644.3513800000001, "r": 252.24225, "b": 653.25793, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "caption", "bbox": {"l": 308.86197, "t": 652.93535, "r": 545.11511, "b": 673.79691, "coord_origin": "TOPLEFT"}, "confidence": 0.9134758710861206, "cells": [{"id": 1, "text": "Figure 16: Example of how post-processing helps to restore", "bbox": {"l": 308.86197, "t": 652.93535, "r": 545.11511, "b": 661.8419, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "mis-aligned bounding boxes prediction artifact.", "bbox": {"l": 308.86197, "t": 664.89035, "r": 497.60349, "b": 673.79691, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "page_footer", "bbox": {"l": 292.63098, "t": 734.133343, "r": 302.59357, "b": 743.039906, "coord_origin": "TOPLEFT"}, "confidence": 0.9037020802497864, "cells": [{"id": 3, "text": "15", "bbox": {"l": 292.63098, "t": 734.133343, "r": 302.59357, "b": 743.039906, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "table", "bbox": {"l": 323.0059509277344, "t": 121.54714965820312, "r": 525.95166015625, "b": 222.91140747070312, "coord_origin": "TOPLEFT"}, "confidence": 0.8569068908691406, "cells": [], "children": []}, {"id": 6, "label": "picture", "bbox": {"l": 55.116363525390625, "t": 136.2550048828125, "r": 279.370849609375, "b": 249.3345489501953, "coord_origin": "TOPLEFT"}, "confidence": 0.8099280595779419, "cells": [], "children": []}, {"id": 19, "label": "table", "bbox": {"l": 55.116363525390625, "t": 136.2550048828125, "r": 279.370849609375, "b": 249.3345489501953, "coord_origin": "TOPLEFT"}, "confidence": 0.5584819912910461, "cells": [], "children": []}, {"id": 2, "label": "table", "bbox": {"l": 323.384765625, "t": 241.9729461669922, "r": 526.1268920898438, "b": 344.09210205078125, "coord_origin": "TOPLEFT"}, "confidence": 0.9060239195823669, "cells": [], "children": []}, {"id": 18, "label": "picture", "bbox": {"l": 54.28135299682617, "t": 260.2615661621094, "r": 279.2568359375, "b": 373.5270690917969, "coord_origin": "TOPLEFT"}, "confidence": 0.567050039768219, "cells": [], "children": []}, {"id": 10, "label": "table", "bbox": {"l": 54.28135299682617, "t": 260.2615661621094, "r": 279.2568359375, "b": 373.5270690917969, "coord_origin": "TOPLEFT"}, "confidence": 0.7748245000839233, "cells": [], "children": []}, {"id": 20, "label": "picture", "bbox": {"l": 323.46868896484375, "t": 362.4508361816406, "r": 525.9569091796875, "b": 464.260498046875, "coord_origin": "TOPLEFT"}, "confidence": 0.5515198707580566, "cells": [], "children": []}, {"id": 9, "label": "table", "bbox": {"l": 323.46868896484375, "t": 362.4508361816406, "r": 525.9569091796875, "b": 464.260498046875, "coord_origin": "TOPLEFT"}, "confidence": 0.7755160927772522, "cells": [], "children": []}, {"id": 5, "label": "picture", "bbox": {"l": 55.423954010009766, "t": 384.5550537109375, "r": 280.2310791015625, "b": 497.563720703125, "coord_origin": "TOPLEFT"}, "confidence": 0.8410326838493347, "cells": [], "children": []}, {"id": 22, "label": "picture", "bbox": {"l": 353.6920471191406, "t": 487.405029296875, "r": 495.4288024902344, "b": 635.7732543945312, "coord_origin": "TOPLEFT"}, "confidence": 0.5478786826133728, "cells": [], "children": []}, {"id": 8, "label": "table", "bbox": {"l": 353.6920471191406, "t": 487.405029296875, "r": 495.4288024902344, "b": 635.7732543945312, "coord_origin": "TOPLEFT"}, "confidence": 0.7805566787719727, "cells": [], "children": []}, {"id": 7, "label": "picture", "bbox": {"l": 50.64818572998047, "t": 505.98046875, "r": 319.9103088378906, "b": 631.263671875, "coord_origin": "TOPLEFT"}, "confidence": 0.8057592511177063, "cells": [], "children": []}, {"id": 11, "label": "table", "bbox": {"l": 50.64818572998047, "t": 505.98046875, "r": 319.9103088378906, "b": 631.263671875, "coord_origin": "TOPLEFT"}, "confidence": 0.6835257411003113, "cells": [], "children": []}]}, "tablestructure": {"table_map": {"4": {"label": "table", "id": 4, "page_no": 14, "cluster": {"id": 4, "label": "table", "bbox": {"l": 323.0059509277344, "t": 121.54714965820312, "r": 525.95166015625, "b": 222.91140747070312, "coord_origin": "TOPLEFT"}, "confidence": 0.8569068908691406, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, "19": {"label": "table", "id": 19, "page_no": 14, "cluster": {"id": 19, "label": "table", "bbox": {"l": 55.116363525390625, "t": 136.2550048828125, "r": 279.370849609375, "b": 249.3345489501953, "coord_origin": "TOPLEFT"}, "confidence": 0.5584819912910461, "cells": [], "children": []}, "text": null, "otsl_seq": ["ecel", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, "2": {"label": "table", "id": 2, "page_no": 14, "cluster": {"id": 2, "label": "table", "bbox": {"l": 323.384765625, "t": 241.9729461669922, "r": 526.1268920898438, "b": 344.09210205078125, "coord_origin": "TOPLEFT"}, "confidence": 0.9060239195823669, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, "10": {"label": "table", "id": 10, "page_no": 14, "cluster": {"id": 10, "label": "table", "bbox": {"l": 54.28135299682617, "t": 260.2615661621094, "r": 279.2568359375, "b": 373.5270690917969, "coord_origin": "TOPLEFT"}, "confidence": 0.7748245000839233, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, "9": {"label": "table", "id": 9, "page_no": 14, "cluster": {"id": 9, "label": "table", "bbox": {"l": 323.46868896484375, "t": 362.4508361816406, "r": 525.9569091796875, "b": 464.260498046875, "coord_origin": "TOPLEFT"}, "confidence": 0.7755160927772522, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, "8": {"label": "table", "id": 8, "page_no": 14, "cluster": {"id": 8, "label": "table", "bbox": {"l": 353.6920471191406, "t": 487.405029296875, "r": 495.4288024902344, "b": 635.7732543945312, "coord_origin": "TOPLEFT"}, "confidence": 0.7805566787719727, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, "11": {"label": "table", "id": 11, "page_no": 14, "cluster": {"id": 11, "label": "table", "bbox": {"l": 50.64818572998047, "t": 505.98046875, "r": 319.9103088378906, "b": 631.263671875, "coord_origin": "TOPLEFT"}, "confidence": 0.6835257411003113, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "caption", "id": 0, "page_no": 14, "cluster": {"id": 0, "label": "caption", "bbox": {"l": 84.233002, "t": 644.3513800000001, "r": 252.24225, "b": 653.25793, "coord_origin": "TOPLEFT"}, "confidence": 0.9257225394248962, "cells": [{"id": 0, "text": "Figure 15: Example with triangular table.", "bbox": {"l": 84.233002, "t": 644.3513800000001, "r": 252.24225, "b": 653.25793, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 15: Example with triangular table."}, {"label": "caption", "id": 1, "page_no": 14, "cluster": {"id": 1, "label": "caption", "bbox": {"l": 308.86197, "t": 652.93535, "r": 545.11511, "b": 673.79691, "coord_origin": "TOPLEFT"}, "confidence": 0.9134758710861206, "cells": [{"id": 1, "text": "Figure 16: Example of how post-processing helps to restore", "bbox": {"l": 308.86197, "t": 652.93535, "r": 545.11511, "b": 661.8419, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "mis-aligned bounding boxes prediction artifact.", "bbox": {"l": 308.86197, "t": 664.89035, "r": 497.60349, "b": 673.79691, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 16: Example of how post-processing helps to restore mis-aligned bounding boxes prediction artifact."}, {"label": "page_footer", "id": 3, "page_no": 14, "cluster": {"id": 3, "label": "page_footer", "bbox": {"l": 292.63098, "t": 734.133343, "r": 302.59357, "b": 743.039906, "coord_origin": "TOPLEFT"}, "confidence": 0.9037020802497864, "cells": [{"id": 3, "text": "15", "bbox": {"l": 292.63098, "t": 734.133343, "r": 302.59357, "b": 743.039906, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "15"}, {"label": "table", "id": 4, "page_no": 14, "cluster": {"id": 4, "label": "table", "bbox": {"l": 323.0059509277344, "t": 121.54714965820312, "r": 525.95166015625, "b": 222.91140747070312, "coord_origin": "TOPLEFT"}, "confidence": 0.8569068908691406, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "picture", "id": 6, "page_no": 14, "cluster": {"id": 6, "label": "picture", "bbox": {"l": 55.116363525390625, "t": 136.2550048828125, "r": 279.370849609375, "b": 249.3345489501953, "coord_origin": "TOPLEFT"}, "confidence": 0.8099280595779419, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "table", "id": 19, "page_no": 14, "cluster": {"id": 19, "label": "table", "bbox": {"l": 55.116363525390625, "t": 136.2550048828125, "r": 279.370849609375, "b": 249.3345489501953, "coord_origin": "TOPLEFT"}, "confidence": 0.5584819912910461, "cells": [], "children": []}, "text": null, "otsl_seq": ["ecel", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 2, "page_no": 14, "cluster": {"id": 2, "label": "table", "bbox": {"l": 323.384765625, "t": 241.9729461669922, "r": 526.1268920898438, "b": 344.09210205078125, "coord_origin": "TOPLEFT"}, "confidence": 0.9060239195823669, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "picture", "id": 18, "page_no": 14, "cluster": {"id": 18, "label": "picture", "bbox": {"l": 54.28135299682617, "t": 260.2615661621094, "r": 279.2568359375, "b": 373.5270690917969, "coord_origin": "TOPLEFT"}, "confidence": 0.567050039768219, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "table", "id": 10, "page_no": 14, "cluster": {"id": 10, "label": "table", "bbox": {"l": 54.28135299682617, "t": 260.2615661621094, "r": 279.2568359375, "b": 373.5270690917969, "coord_origin": "TOPLEFT"}, "confidence": 0.7748245000839233, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "picture", "id": 20, "page_no": 14, "cluster": {"id": 20, "label": "picture", "bbox": {"l": 323.46868896484375, "t": 362.4508361816406, "r": 525.9569091796875, "b": 464.260498046875, "coord_origin": "TOPLEFT"}, "confidence": 0.5515198707580566, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "table", "id": 9, "page_no": 14, "cluster": {"id": 9, "label": "table", "bbox": {"l": 323.46868896484375, "t": 362.4508361816406, "r": 525.9569091796875, "b": 464.260498046875, "coord_origin": "TOPLEFT"}, "confidence": 0.7755160927772522, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "picture", "id": 5, "page_no": 14, "cluster": {"id": 5, "label": "picture", "bbox": {"l": 55.423954010009766, "t": 384.5550537109375, "r": 280.2310791015625, "b": 497.563720703125, "coord_origin": "TOPLEFT"}, "confidence": 0.8410326838493347, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "picture", "id": 22, "page_no": 14, "cluster": {"id": 22, "label": "picture", "bbox": {"l": 353.6920471191406, "t": 487.405029296875, "r": 495.4288024902344, "b": 635.7732543945312, "coord_origin": "TOPLEFT"}, "confidence": 0.5478786826133728, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "table", "id": 8, "page_no": 14, "cluster": {"id": 8, "label": "table", "bbox": {"l": 353.6920471191406, "t": 487.405029296875, "r": 495.4288024902344, "b": 635.7732543945312, "coord_origin": "TOPLEFT"}, "confidence": 0.7805566787719727, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "picture", "id": 7, "page_no": 14, "cluster": {"id": 7, "label": "picture", "bbox": {"l": 50.64818572998047, "t": 505.98046875, "r": 319.9103088378906, "b": 631.263671875, "coord_origin": "TOPLEFT"}, "confidence": 0.8057592511177063, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "table", "id": 11, "page_no": 14, "cluster": {"id": 11, "label": "table", "bbox": {"l": 50.64818572998047, "t": 505.98046875, "r": 319.9103088378906, "b": 631.263671875, "coord_origin": "TOPLEFT"}, "confidence": 0.6835257411003113, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}], "body": [{"label": "caption", "id": 0, "page_no": 14, "cluster": {"id": 0, "label": "caption", "bbox": {"l": 84.233002, "t": 644.3513800000001, "r": 252.24225, "b": 653.25793, "coord_origin": "TOPLEFT"}, "confidence": 0.9257225394248962, "cells": [{"id": 0, "text": "Figure 15: Example with triangular table.", "bbox": {"l": 84.233002, "t": 644.3513800000001, "r": 252.24225, "b": 653.25793, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 15: Example with triangular table."}, {"label": "caption", "id": 1, "page_no": 14, "cluster": {"id": 1, "label": "caption", "bbox": {"l": 308.86197, "t": 652.93535, "r": 545.11511, "b": 673.79691, "coord_origin": "TOPLEFT"}, "confidence": 0.9134758710861206, "cells": [{"id": 1, "text": "Figure 16: Example of how post-processing helps to restore", "bbox": {"l": 308.86197, "t": 652.93535, "r": 545.11511, "b": 661.8419, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "mis-aligned bounding boxes prediction artifact.", "bbox": {"l": 308.86197, "t": 664.89035, "r": 497.60349, "b": 673.79691, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 16: Example of how post-processing helps to restore mis-aligned bounding boxes prediction artifact."}, {"label": "table", "id": 4, "page_no": 14, "cluster": {"id": 4, "label": "table", "bbox": {"l": 323.0059509277344, "t": 121.54714965820312, "r": 525.95166015625, "b": 222.91140747070312, "coord_origin": "TOPLEFT"}, "confidence": 0.8569068908691406, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "picture", "id": 6, "page_no": 14, "cluster": {"id": 6, "label": "picture", "bbox": {"l": 55.116363525390625, "t": 136.2550048828125, "r": 279.370849609375, "b": 249.3345489501953, "coord_origin": "TOPLEFT"}, "confidence": 0.8099280595779419, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "table", "id": 19, "page_no": 14, "cluster": {"id": 19, "label": "table", "bbox": {"l": 55.116363525390625, "t": 136.2550048828125, "r": 279.370849609375, "b": 249.3345489501953, "coord_origin": "TOPLEFT"}, "confidence": 0.5584819912910461, "cells": [], "children": []}, "text": null, "otsl_seq": ["ecel", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "table", "id": 2, "page_no": 14, "cluster": {"id": 2, "label": "table", "bbox": {"l": 323.384765625, "t": 241.9729461669922, "r": 526.1268920898438, "b": 344.09210205078125, "coord_origin": "TOPLEFT"}, "confidence": 0.9060239195823669, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "picture", "id": 18, "page_no": 14, "cluster": {"id": 18, "label": "picture", "bbox": {"l": 54.28135299682617, "t": 260.2615661621094, "r": 279.2568359375, "b": 373.5270690917969, "coord_origin": "TOPLEFT"}, "confidence": 0.567050039768219, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "table", "id": 10, "page_no": 14, "cluster": {"id": 10, "label": "table", "bbox": {"l": 54.28135299682617, "t": 260.2615661621094, "r": 279.2568359375, "b": 373.5270690917969, "coord_origin": "TOPLEFT"}, "confidence": 0.7748245000839233, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "picture", "id": 20, "page_no": 14, "cluster": {"id": 20, "label": "picture", "bbox": {"l": 323.46868896484375, "t": 362.4508361816406, "r": 525.9569091796875, "b": 464.260498046875, "coord_origin": "TOPLEFT"}, "confidence": 0.5515198707580566, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "table", "id": 9, "page_no": 14, "cluster": {"id": 9, "label": "table", "bbox": {"l": 323.46868896484375, "t": 362.4508361816406, "r": 525.9569091796875, "b": 464.260498046875, "coord_origin": "TOPLEFT"}, "confidence": 0.7755160927772522, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "picture", "id": 5, "page_no": 14, "cluster": {"id": 5, "label": "picture", "bbox": {"l": 55.423954010009766, "t": 384.5550537109375, "r": 280.2310791015625, "b": 497.563720703125, "coord_origin": "TOPLEFT"}, "confidence": 0.8410326838493347, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "picture", "id": 22, "page_no": 14, "cluster": {"id": 22, "label": "picture", "bbox": {"l": 353.6920471191406, "t": 487.405029296875, "r": 495.4288024902344, "b": 635.7732543945312, "coord_origin": "TOPLEFT"}, "confidence": 0.5478786826133728, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "table", "id": 8, "page_no": 14, "cluster": {"id": 8, "label": "table", "bbox": {"l": 353.6920471191406, "t": 487.405029296875, "r": 495.4288024902344, "b": 635.7732543945312, "coord_origin": "TOPLEFT"}, "confidence": 0.7805566787719727, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}, {"label": "picture", "id": 7, "page_no": 14, "cluster": {"id": 7, "label": "picture", "bbox": {"l": 50.64818572998047, "t": 505.98046875, "r": 319.9103088378906, "b": 631.263671875, "coord_origin": "TOPLEFT"}, "confidence": 0.8057592511177063, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "table", "id": 11, "page_no": 14, "cluster": {"id": 11, "label": "table", "bbox": {"l": 50.64818572998047, "t": 505.98046875, "r": 319.9103088378906, "b": 631.263671875, "coord_origin": "TOPLEFT"}, "confidence": 0.6835257411003113, "cells": [], "children": []}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "nl", "rhed", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "ecel", "nl"], "num_rows": 0, "num_cols": 0, "table_cells": []}], "headers": [{"label": "page_footer", "id": 3, "page_no": 14, "cluster": {"id": 3, "label": "page_footer", "bbox": {"l": 292.63098, "t": 734.133343, "r": 302.59357, "b": 743.039906, "coord_origin": "TOPLEFT"}, "confidence": 0.9037020802497864, "cells": [{"id": 3, "text": "15", "bbox": {"l": 292.63098, "t": 734.133343, "r": 302.59357, "b": 743.039906, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "15"}]}}, {"page_no": 15, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "Figure 17: Example of long table. End-to-end example from initial PDF cells to prediction of bounding boxes, post process-", "bbox": {"l": 50.112, "t": 508.33737, "r": 545.11383, "b": 517.24393, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "ing and prediction of structure.", "bbox": {"l": 50.112, "t": 520.2923599999999, "r": 173.23975, "b": 529.1989100000001, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "16", "bbox": {"l": 292.63098, "t": 734.133358, "r": 302.59357, "b": 743.039921, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 0, "label": "caption", "bbox": {"l": 50.112, "t": 508.33737, "r": 545.11383, "b": 529.1989100000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9624594449996948, "cells": [{"id": 0, "text": "Figure 17: Example of long table. End-to-end example from initial PDF cells to prediction of bounding boxes, post process-", "bbox": {"l": 50.112, "t": 508.33737, "r": 545.11383, "b": 517.24393, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "ing and prediction of structure.", "bbox": {"l": 50.112, "t": 520.2923599999999, "r": 173.23975, "b": 529.1989100000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "page_footer", "bbox": {"l": 292.63098, "t": 734.133358, "r": 302.59357, "b": 743.039921, "coord_origin": "TOPLEFT"}, "confidence": 0.9134101271629333, "cells": [{"id": 2, "text": "16", "bbox": {"l": 292.63098, "t": 734.133358, "r": 302.59357, "b": 743.039921, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "picture", "bbox": {"l": 66.79948425292969, "t": 253.61631774902344, "r": 528.5565795898438, "b": 498.1383972167969, "coord_origin": "TOPLEFT"}, "confidence": 0.6913455724716187, "cells": [], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "caption", "id": 0, "page_no": 15, "cluster": {"id": 0, "label": "caption", "bbox": {"l": 50.112, "t": 508.33737, "r": 545.11383, "b": 529.1989100000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9624594449996948, "cells": [{"id": 0, "text": "Figure 17: Example of long table. End-to-end example from initial PDF cells to prediction of bounding boxes, post process-", "bbox": {"l": 50.112, "t": 508.33737, "r": 545.11383, "b": 517.24393, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "ing and prediction of structure.", "bbox": {"l": 50.112, "t": 520.2923599999999, "r": 173.23975, "b": 529.1989100000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 17: Example of long table. End-to-end example from initial PDF cells to prediction of bounding boxes, post processing and prediction of structure."}, {"label": "page_footer", "id": 1, "page_no": 15, "cluster": {"id": 1, "label": "page_footer", "bbox": {"l": 292.63098, "t": 734.133358, "r": 302.59357, "b": 743.039921, "coord_origin": "TOPLEFT"}, "confidence": 0.9134101271629333, "cells": [{"id": 2, "text": "16", "bbox": {"l": 292.63098, "t": 734.133358, "r": 302.59357, "b": 743.039921, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "16"}, {"label": "picture", "id": 2, "page_no": 15, "cluster": {"id": 2, "label": "picture", "bbox": {"l": 66.79948425292969, "t": 253.61631774902344, "r": 528.5565795898438, "b": 498.1383972167969, "coord_origin": "TOPLEFT"}, "confidence": 0.6913455724716187, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "body": [{"label": "caption", "id": 0, "page_no": 15, "cluster": {"id": 0, "label": "caption", "bbox": {"l": 50.112, "t": 508.33737, "r": 545.11383, "b": 529.1989100000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9624594449996948, "cells": [{"id": 0, "text": "Figure 17: Example of long table. End-to-end example from initial PDF cells to prediction of bounding boxes, post process-", "bbox": {"l": 50.112, "t": 508.33737, "r": 545.11383, "b": 517.24393, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "ing and prediction of structure.", "bbox": {"l": 50.112, "t": 520.2923599999999, "r": 173.23975, "b": 529.1989100000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 17: Example of long table. End-to-end example from initial PDF cells to prediction of bounding boxes, post processing and prediction of structure."}, {"label": "picture", "id": 2, "page_no": 15, "cluster": {"id": 2, "label": "picture", "bbox": {"l": 66.79948425292969, "t": 253.61631774902344, "r": 528.5565795898438, "b": 498.1383972167969, "coord_origin": "TOPLEFT"}, "confidence": 0.6913455724716187, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "headers": [{"label": "page_footer", "id": 1, "page_no": 15, "cluster": {"id": 1, "label": "page_footer", "bbox": {"l": 292.63098, "t": 734.133358, "r": 302.59357, "b": 743.039921, "coord_origin": "TOPLEFT"}, "confidence": 0.9134101271629333, "cells": [{"id": 2, "text": "16", "bbox": {"l": 292.63098, "t": 734.133358, "r": 302.59357, "b": 743.039921, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "16"}]}}]
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v2/2206.01062.doctags.txt b/tests/data/groundtruth/docling_v2/2206.01062.doctags.txt
index 6269eb06..60a105d9 100644
--- a/tests/data/groundtruth/docling_v2/2206.01062.doctags.txt
+++ b/tests/data/groundtruth/docling_v2/2206.01062.doctags.txt
@@ -1,240 +1,160 @@
-<document>
-<section_header_level_1><location><page_1><loc_18><loc_85><loc_83><loc_89></location>DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis</section_header_level_1>
-<text><location><page_1><loc_15><loc_77><loc_32><loc_83></location>Birgit Pfitzmann IBM Research Rueschlikon, Switzerland bpf@zurich.ibm.com</text>
-<text><location><page_1><loc_42><loc_77><loc_58><loc_83></location>Christoph Auer IBM Research Rueschlikon, Switzerland cau@zurich.ibm.com</text>
-<text><location><page_1><loc_69><loc_77><loc_85><loc_83></location>Michele Dolfi IBM Research Rueschlikon, Switzerland dol@zurich.ibm.com</text>
-<text><location><page_1><loc_28><loc_70><loc_45><loc_76></location>Ahmed S. Nassar IBM Research Rueschlikon, Switzerland ahn@zurich.ibm.com</text>
-<text><location><page_1><loc_55><loc_70><loc_72><loc_76></location>Peter Staar IBM Research Rueschlikon, Switzerland taa@zurich.ibm.com</text>
-<section_header_level_1><location><page_1><loc_9><loc_67><loc_18><loc_69></location>ABSTRACT</section_header_level_1>
-<text><location><page_1><loc_9><loc_33><loc_48><loc_67></location>Accurate document layout analysis is a key requirement for highquality PDF document conversion. With the recent availability of public, large ground-truth datasets such as PubLayNet and DocBank, deep-learning models have proven to be very effective at layout detection and segmentation. While these datasets are of adequate size to train such models, they severely lack in layout variability since they are sourced from scientific article repositories such as PubMed and arXiv only. Consequently, the accuracy of the layout segmentation drops significantly when these models are applied on more challenging and diverse layouts. In this paper, we present DocLayNet , a new, publicly available, document-layout annotation dataset in COCO format. It contains 80863 manually annotated pages from diverse data sources to represent a wide variability in layouts. For each PDF page, the layout annotations provide labelled bounding-boxes with a choice of 11 distinct classes. DocLayNet also provides a subset of double- and triple-annotated pages to determine the inter-annotator agreement. In multiple experiments, we provide baseline accuracy scores (in mAP) for a set of popular object detection models. We also demonstrate that these models fall approximately 10% behind the inter-annotator agreement. Furthermore, we provide evidence that DocLayNet is of sufficient size. Lastly, we compare models trained on PubLayNet, DocBank and DocLayNet, showing that layout predictions of the DocLayNettrained models are more robust and thus the preferred choice for general-purpose document-layout analysis.</text>
-<section_header_level_1><location><page_1><loc_9><loc_29><loc_22><loc_30></location>CCS CONCEPTS</section_header_level_1>
-<text><location><page_1><loc_9><loc_25><loc_49><loc_29></location>· Information systems → Document structure ; · Applied computing → Document analysis ; · Computing methodologies → Machine learning ; Computer vision ; Object detection ;</text>
-<text><location><page_1><loc_9><loc_15><loc_48><loc_20></location>Permission to make digital or hard copies of part or all of this work for personal or classroom use is granted without fee provided that copies are not made or distributed for profit or commercial advantage and that copies bear this notice and the full citation on the first page. Copyrights for third-party components of this work must be honored. For all other uses, contact the owner/author(s).</text>
-<text><location><page_1><loc_9><loc_14><loc_32><loc_15></location>KDD '22, August 14-18, 2022, Washington, DC, USA</text>
-<text><location><page_1><loc_9><loc_13><loc_31><loc_14></location>© 2022 Copyright held by the owner/author(s).</text>
-<text><location><page_1><loc_9><loc_12><loc_26><loc_13></location>ACM ISBN 978-1-4503-9385-0/22/08.</text>
-<text><location><page_1><loc_9><loc_11><loc_27><loc_12></location>https://doi.org/10.1145/3534678.3539043</text>
-<figure>
-<location><page_1><loc_53><loc_34><loc_90><loc_68></location>
-<caption>Figure 1: Four examples of complex page layouts across different document categories</caption>
-</figure>
-<section_header_level_1><location><page_1><loc_52><loc_24><loc_62><loc_25></location>KEYWORDS</section_header_level_1>
-<text><location><page_1><loc_52><loc_21><loc_91><loc_23></location>PDF document conversion, layout segmentation, object-detection, data set, Machine Learning</text>
-<section_header_level_1><location><page_1><loc_52><loc_18><loc_66><loc_19></location>ACM Reference Format:</section_header_level_1>
-<text><location><page_1><loc_52><loc_11><loc_91><loc_18></location>Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar. 2022. DocLayNet: A Large Human-Annotated Dataset for DocumentLayout Analysis. In Proceedings of the 28th ACM SIGKDD Conference on Knowledge Discovery and Data Mining (KDD '22), August 14-18, 2022, Washington, DC, USA. ACM, New York, NY, USA, 9 pages. https://doi.org/10.1145/ 3534678.3539043</text>
-<section_header_level_1><location><page_2><loc_9><loc_88><loc_26><loc_89></location>1 INTRODUCTION</section_header_level_1>
-<text><location><page_2><loc_9><loc_71><loc_50><loc_86></location>Despite the substantial improvements achieved with machine-learning (ML) approaches and deep neural networks in recent years, document conversion remains a challenging problem, as demonstrated by the numerous public competitions held on this topic [1-4]. The challenge originates from the huge variability in PDF documents regarding layout, language and formats (scanned, programmatic or a combination of both). Engineering a single ML model that can be applied on all types of documents and provides high-quality layout segmentation remains to this day extremely challenging [5]. To highlight the variability in document layouts, we show a few example documents from the DocLayNet dataset in Figure 1.</text>
-<text><location><page_2><loc_9><loc_37><loc_48><loc_71></location>A key problem in the process of document conversion is to understand the structure of a single document page, i.e. which segments of text should be grouped together in a unit. To train models for this task, there are currently two large datasets available to the community, PubLayNet [6] and DocBank [7]. They were introduced in 2019 and 2020 respectively and significantly accelerated the implementation of layout detection and segmentation models due to their sizes of 300K and 500K ground-truth pages. These sizes were achieved by leveraging an automation approach. The benefit of automated ground-truth generation is obvious: one can generate large ground-truth datasets at virtually no cost. However, the automation introduces a constraint on the variability in the dataset, because corresponding structured source data must be available. PubLayNet and DocBank were both generated from scientific document repositories (PubMed and arXiv), which provide XML or L A T E X sources. Those scientific documents present a limited variability in their layouts, because they are typeset in uniform templates provided by the publishers. Obviously, documents such as technical manuals, annual company reports, legal text, government tenders, etc. have very different and partially unique layouts. As a consequence, the layout predictions obtained from models trained on PubLayNet or DocBank is very reasonable when applied on scientific documents. However, for more artistic or free-style layouts, we see sub-par prediction quality from these models, which we demonstrate in Section 5.</text>
-<text><location><page_2><loc_9><loc_27><loc_48><loc_36></location>In this paper, we present the DocLayNet dataset. It provides pageby-page layout annotation ground-truth using bounding-boxes for 11 distinct class labels on 80863 unique document pages, of which a fraction carry double- or triple-annotations. DocLayNet is similar in spirit to PubLayNet and DocBank and will likewise be made available to the public 1 in order to stimulate the document-layout analysis community. It distinguishes itself in the following aspects:</text>
-<unordered_list>
-<list_item><location><page_2><loc_11><loc_22><loc_48><loc_26></location>(1) Human Annotation : In contrast to PubLayNet and DocBank, we relied on human annotation instead of automation approaches to generate the data set.</list_item>
-<list_item><location><page_2><loc_11><loc_20><loc_48><loc_22></location>(2) Large Layout Variability : We include diverse and complex layouts from a large variety of public sources.</list_item>
-<list_item><location><page_2><loc_11><loc_15><loc_48><loc_19></location>(3) Detailed Label Set : We define 11 class labels to distinguish layout features in high detail. PubLayNet provides 5 labels; DocBank provides 13, although not a superset of ours.</list_item>
-<list_item><location><page_2><loc_11><loc_13><loc_48><loc_15></location>(4) Redundant Annotations : A fraction of the pages in the DocLayNet data set carry more than one human annotation.</list_item>
+<doctag><page_header><loc_15><loc_138><loc_30><loc_350>arXiv:2206.01062v1 [cs.CV] 2 Jun 2022</page_header>
+<section_header_level_1><loc_88><loc_53><loc_413><loc_76>DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis</section_header_level_1>
+<text><loc_74><loc_84><loc_158><loc_114>Birgit Pfitzmann IBM Research Rueschlikon, Switzerland bpf@zurich.ibm.com</text>
+<text><loc_208><loc_84><loc_292><loc_114>Christoph Auer IBM Research Rueschlikon, Switzerland cau@zurich.ibm.com</text>
+<text><loc_343><loc_84><loc_426><loc_114>Michele Dolfi IBM Research Rueschlikon, Switzerland dol@zurich.ibm.com</text>
+<text><loc_141><loc_121><loc_225><loc_151>Ahmed S. Nassar IBM Research Rueschlikon, Switzerland ahn@zurich.ibm.com</text>
+<text><loc_275><loc_121><loc_359><loc_151>Peter Staar IBM Research Rueschlikon, Switzerland taa@zurich.ibm.com</text>
+<section_header_level_1><loc_44><loc_156><loc_91><loc_163>ABSTRACT</section_header_level_1>
+<text><loc_44><loc_166><loc_241><loc_337>Accurate document layout analysis is a key requirement for highquality PDF document conversion. With the recent availability of public, large ground-truth datasets such as PubLayNet and DocBank, deep-learning models have proven to be very effective at layout detection and segmentation. While these datasets are of adequate size to train such models, they severely lack in layout variability since they are sourced from scientific article repositories such as PubMed and arXiv only. Consequently, the accuracy of the layout segmentation drops significantly when these models are applied on more challenging and diverse layouts. In this paper, we present DocLayNet , a new, publicly available, document-layout annotation dataset in COCO format. It contains 80863 manually annotated pages from diverse data sources to represent a wide variability in layouts. For each PDF page, the layout annotations provide labelled bounding-boxes with a choice of 11 distinct classes. DocLayNet also provides a subset of double- and triple-annotated pages to determine the inter-annotator agreement. In multiple experiments, we provide baseline accuracy scores (in mAP) for a set of popular object detection models. We also demonstrate that these models fall approximately 10% behind the inter-annotator agreement. Furthermore, we provide evidence that DocLayNet is of sufficient size. Lastly, we compare models trained on PubLayNet, DocBank and DocLayNet, showing that layout predictions of the DocLayNettrained models are more robust and thus the preferred choice for general-purpose document-layout analysis.</text>
+<section_header_level_1><loc_44><loc_348><loc_110><loc_354>CCS CONCEPTS</section_header_level_1>
+<text><loc_44><loc_357><loc_243><loc_377>· Information systems → Document structure ; · Applied computing → Document analysis ; · Computing methodologies → Machine learning ; Computer vision ; Object detection ;</text>
+<text><loc_44><loc_401><loc_241><loc_425>Permission to make digital or hard copies of part or all of this work for personal or classroom use is granted without fee provided that copies are not made or distributed for profit or commercial advantage and that copies bear this notice and the full citation on the first page. Copyrights for third-party components of this work must be honored. For all other uses, contact the owner/author(s).</text>
+<text><loc_44><loc_426><loc_162><loc_430>KDD ’22, August 14-18, 2022, Washington, DC, USA</text>
+<text><loc_44><loc_432><loc_153><loc_436>© 2022 Copyright held by the owner/author(s).</text>
+<text><loc_44><loc_437><loc_128><loc_441>ACM ISBN 978-1-4503-9385-0/22/08.</text>
+<text><loc_44><loc_442><loc_136><loc_446>https://doi.org/10.1145/3534678.3539043</text>
+<picture><loc_264><loc_158><loc_452><loc_332><caption><loc_260><loc_341><loc_457><loc_353>Figure 1: Four examples of complex page layouts across different document categories</caption></picture>
+<section_header_level_1><loc_260><loc_374><loc_310><loc_381>KEYWORDS</section_header_level_1>
+<text><loc_260><loc_384><loc_457><loc_396>PDF document conversion, layout segmentation, object-detection, data set, Machine Learning</text>
+<section_header_level_1><loc_260><loc_404><loc_331><loc_409>ACM Reference Format:</section_header_level_1>
+<text><loc_260><loc_410><loc_457><loc_447>Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar. 2022. DocLayNet: A Large Human-Annotated Dataset for DocumentLayout Analysis. In Proceedings of the 28th ACM SIGKDD Conference on Knowledge Discovery and Data Mining (KDD '22), August 14-18, 2022, Washington, DC, USA. ACM, New York, NY, USA, 9 pages. https://doi.org/10.1145/ 3534678.3539043</text>
+<page_break>
+<page_header><loc_44><loc_38><loc_456><loc_43>KDD '22, August 14-18, 2022, Washington, DC, USA Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar</page_header>
+<section_header_level_1><loc_44><loc_54><loc_128><loc_61>1 INTRODUCTION</section_header_level_1>
+<text><loc_44><loc_70><loc_248><loc_145>Despite the substantial improvements achieved with machine-learning (ML) approaches and deep neural networks in recent years, document conversion remains a challenging problem, as demonstrated by the numerous public competitions held on this topic [1-4]. The challenge originates from the huge variability in PDF documents regarding layout, language and formats (scanned, programmatic or a combination of both). Engineering a single ML model that can be applied on all types of documents and provides high-quality layout segmentation remains to this day extremely challenging [5]. To highlight the variability in document layouts, we show a few example documents from the DocLayNet dataset in Figure 1.</text>
+<text><loc_44><loc_146><loc_241><loc_317>A key problem in the process of document conversion is to understand the structure of a single document page, i.e. which segments of text should be grouped together in a unit. To train models for this task, there are currently two large datasets available to the community, PubLayNet [6] and DocBank [7]. They were introduced in 2019 and 2020 respectively and significantly accelerated the implementation of layout detection and segmentation models due to their sizes of 300K and 500K ground-truth pages. These sizes were achieved by leveraging an automation approach. The benefit of automated ground-truth generation is obvious: one can generate large ground-truth datasets at virtually no cost. However, the automation introduces a constraint on the variability in the dataset, because corresponding structured source data must be available. PubLayNet and DocBank were both generated from scientific document repositories (PubMed and arXiv), which provide XML or L A T E X sources. Those scientific documents present a limited variability in their layouts, because they are typeset in uniform templates provided by the publishers. Obviously, documents such as technical manuals, annual company reports, legal text, government tenders, etc. have very different and partially unique layouts. As a consequence, the layout predictions obtained from models trained on PubLayNet or DocBank is very reasonable when applied on scientific documents. However, for more artistic or free-style layouts, we see sub-par prediction quality from these models, which we demonstrate in Section 5.</text>
+<text><loc_44><loc_319><loc_241><loc_366>In this paper, we present the DocLayNet dataset. It provides pageby-page layout annotation ground-truth using bounding-boxes for 11 distinct class labels on 80863 unique document pages, of which a fraction carry double- or triple-annotations. DocLayNet is similar in spirit to PubLayNet and DocBank and will likewise be made available to the public 1 in order to stimulate the document-layout analysis community. It distinguishes itself in the following aspects:</text>
+<unordered_list><list_item><loc_53><loc_369><loc_241><loc_388>(1) Human Annotation : In contrast to PubLayNet and DocBank, we relied on human annotation instead of automation approaches to generate the data set.</list_item>
+<list_item><loc_53><loc_390><loc_240><loc_402>(2) Large Layout Variability : We include diverse and complex layouts from a large variety of public sources.</list_item>
+<list_item><loc_53><loc_404><loc_241><loc_423>(3) Detailed Label Set : We define 11 class labels to distinguish layout features in high detail. PubLayNet provides 5 labels; DocBank provides 13, although not a superset of ours.</list_item>
+<list_item><loc_53><loc_424><loc_241><loc_437>(4) Redundant Annotations : A fraction of the pages in the DocLayNet data set carry more than one human annotation.</list_item>
 </unordered_list>
-<text><location><page_2><loc_56><loc_87><loc_91><loc_89></location>This enables experimentation with annotation uncertainty and quality control analysis.</text>
-<unordered_list>
-<list_item><location><page_2><loc_54><loc_80><loc_91><loc_86></location>(5) Pre-defined Train-, Test- & Validation-set : Like DocBank, we provide fixed train-, test- & validation-sets to ensure proportional representation of the class-labels. Further, we prevent leakage of unique layouts across sets, which has a large effect on model accuracy scores.</list_item>
+<footnote><loc_44><loc_443><loc_176><loc_447>$^{1}$https://developer.ibm.com/exchanges/data/all/doclaynet</footnote>
+<text><loc_279><loc_55><loc_456><loc_67>This enables experimentation with annotation uncertainty and quality control analysis.</text>
+<unordered_list><list_item><loc_269><loc_69><loc_457><loc_102>(5) Pre-defined Train-, Test- & Validation-set : Like DocBank, we provide fixed train-, test- & validation-sets to ensure proportional representation of the class-labels. Further, we prevent leakage of unique layouts across sets, which has a large effect on model accuracy scores.</list_item>
 </unordered_list>
-<text><location><page_2><loc_52><loc_72><loc_91><loc_79></location>All aspects outlined above are detailed in Section 3. In Section 4, we will elaborate on how we designed and executed this large-scale human annotation campaign. We will also share key insights and lessons learned that might prove helpful for other parties planning to set up annotation campaigns.</text>
-<text><location><page_2><loc_52><loc_61><loc_91><loc_72></location>In Section 5, we will present baseline accuracy numbers for a variety of object detection methods (Faster R-CNN, Mask R-CNN and YOLOv5) trained on DocLayNet. We further show how the model performance is impacted by varying the DocLayNet dataset size, reducing the label set and modifying the train/test-split. Last but not least, we compare the performance of models trained on PubLayNet, DocBank and DocLayNet and demonstrate that a model trained on DocLayNet provides overall more robust layout recovery.</text>
-<section_header_level_1><location><page_2><loc_52><loc_58><loc_69><loc_59></location>2 RELATED WORK</section_header_level_1>
-<text><location><page_2><loc_52><loc_41><loc_91><loc_56></location>While early approaches in document-layout analysis used rulebased algorithms and heuristics [8], the problem is lately addressed with deep learning methods. The most common approach is to leverage object detection models [9-15]. In the last decade, the accuracy and speed of these models has increased dramatically. Furthermore, most state-of-the-art object detection methods can be trained and applied with very little work, thanks to a standardisation effort of the ground-truth data format [16] and common deep-learning frameworks [17]. Reference data sets such as PubLayNet [6] and DocBank provide their data in the commonly accepted COCO format [16].</text>
-<text><location><page_2><loc_52><loc_30><loc_91><loc_41></location>Lately, new types of ML models for document-layout analysis have emerged in the community [18-21]. These models do not approach the problem of layout analysis purely based on an image representation of the page, as computer vision methods do. Instead, they combine the text tokens and image representation of a page in order to obtain a segmentation. While the reported accuracies appear to be promising, a broadly accepted data format which links geometric and textual features has yet to establish.</text>
-<section_header_level_1><location><page_2><loc_52><loc_27><loc_78><loc_29></location>3 THE DOCLAYNET DATASET</section_header_level_1>
-<text><location><page_2><loc_52><loc_15><loc_91><loc_25></location>DocLayNet contains 80863 PDF pages. Among these, 7059 carry two instances of human annotations, and 1591 carry three. This amounts to 91104 total annotation instances. The annotations provide layout information in the shape of labeled, rectangular boundingboxes. We define 11 distinct labels for layout features, namely Caption , Footnote , Formula , List-item , Page-footer , Page-header , Picture , Section-header , Table , Text , and Title . Our reasoning for picking this particular label set is detailed in Section 4.</text>
-<text><location><page_2><loc_52><loc_11><loc_91><loc_14></location>In addition to open intellectual property constraints for the source documents, we required that the documents in DocLayNet adhere to a few conditions. Firstly, we kept scanned documents</text>
-<figure>
-<location><page_3><loc_14><loc_72><loc_43><loc_88></location>
-<caption>Figure 2: Distribution of DocLayNet pages across document categories.</caption>
-</figure>
-<text><location><page_3><loc_9><loc_54><loc_48><loc_64></location>to a minimum, since they introduce difficulties in annotation (see Section 4). As a second condition, we focussed on medium to large documents ( > 10 pages) with technical content, dense in complex tables, figures, plots and captions. Such documents carry a lot of information value, but are often hard to analyse with high accuracy due to their challenging layouts. Counterexamples of documents not included in the dataset are receipts, invoices, hand-written documents or photographs showing "text in the wild".</text>
-<text><location><page_3><loc_9><loc_36><loc_48><loc_53></location>The pages in DocLayNet can be grouped into six distinct categories, namely Financial Reports , Manuals , Scientific Articles , Laws & Regulations , Patents and Government Tenders . Each document category was sourced from various repositories. For example, Financial Reports contain both free-style format annual reports 2 which expose company-specific, artistic layouts as well as the more formal SEC filings. The two largest categories ( Financial Reports and Manuals ) contain a large amount of free-style layouts in order to obtain maximum variability. In the other four categories, we boosted the variability by mixing documents from independent providers, such as different government websites or publishers. In Figure 2, we show the document categories contained in DocLayNet with their respective sizes.</text>
-<text><location><page_3><loc_9><loc_23><loc_48><loc_35></location>We did not control the document selection with regard to language. The vast majority of documents contained in DocLayNet (close to 95%) are published in English language. However, DocLayNet also contains a number of documents in other languages such as German (2.5%), French (1.0%) and Japanese (1.0%). While the document language has negligible impact on the performance of computer vision methods such as object detection and segmentation models, it might prove challenging for layout analysis methods which exploit textual features.</text>
-<text><location><page_3><loc_9><loc_14><loc_48><loc_23></location>To ensure that future benchmarks in the document-layout analysis community can be easily compared, we have split up DocLayNet into pre-defined train-, test- and validation-sets. In this way, we can avoid spurious variations in the evaluation scores due to random splitting in train-, test- and validation-sets. We also ensured that less frequent labels are represented in train and test sets in equal proportions.</text>
-<text><location><page_3><loc_52><loc_80><loc_91><loc_89></location>Table 1 shows the overall frequency and distribution of the labels among the different sets. Importantly, we ensure that subsets are only split on full-document boundaries. This avoids that pages of the same document are spread over train, test and validation set, which can give an undesired evaluation advantage to models and lead to overestimation of their prediction accuracy. We will show the impact of this decision in Section 5.</text>
-<text><location><page_3><loc_52><loc_66><loc_91><loc_79></location>In order to accommodate the different types of models currently in use by the community, we provide DocLayNet in an augmented COCO format [16]. This entails the standard COCO ground-truth file (in JSON format) with the associated page images (in PNG format, 1025 × 1025 pixels). Furthermore, custom fields have been added to each COCO record to specify document category, original document filename and page number. In addition, we also provide the original PDF pages, as well as sidecar files containing parsed PDF text and text-cell coordinates (in JSON). All additional files are linked to the primary page images by their matching filenames.</text>
-<text><location><page_3><loc_52><loc_26><loc_91><loc_65></location>Despite being cost-intense and far less scalable than automation, human annotation has several benefits over automated groundtruth generation. The first and most obvious reason to leverage human annotations is the freedom to annotate any type of document without requiring a programmatic source. For most PDF documents, the original source document is not available. The latter is not a hard constraint with human annotation, but it is for automated methods. A second reason to use human annotations is that the latter usually provide a more natural interpretation of the page layout. The human-interpreted layout can significantly deviate from the programmatic layout used in typesetting. For example, "invisible" tables might be used solely for aligning text paragraphs on columns. Such typesetting tricks might be interpreted by automated methods incorrectly as an actual table, while the human annotation will interpret it correctly as Text or other styles. The same applies to multi-line text elements, when authors decided to space them as "invisible" list elements without bullet symbols. A third reason to gather ground-truth through human annotation is to estimate a "natural" upper bound on the segmentation accuracy. As we will show in Section 4, certain documents featuring complex layouts can have different but equally acceptable layout interpretations. This natural upper bound for segmentation accuracy can be found by annotating the same pages multiple times by different people and evaluating the inter-annotator agreement. Such a baseline consistency evaluation is very useful to define expectations for a good target accuracy in trained deep neural network models and avoid overfitting (see Table 1). On the flip side, achieving high annotation consistency proved to be a key challenge in human annotation, as we outline in Section 4.</text>
-<section_header_level_1><location><page_3><loc_52><loc_22><loc_77><loc_23></location>4 ANNOTATION CAMPAIGN</section_header_level_1>
-<text><location><page_3><loc_52><loc_11><loc_91><loc_20></location>The annotation campaign was carried out in four phases. In phase one, we identified and prepared the data sources for annotation. In phase two, we determined the class labels and how annotations should be done on the documents in order to obtain maximum consistency. The latter was guided by a detailed requirement analysis and exhaustive experiments. In phase three, we trained the annotation staff and performed exams for quality assurance. In phase four,</text>
-<table>
-<location><page_4><loc_16><loc_63><loc_84><loc_83></location>
-<caption>Table 1: DocLayNet dataset overview. Along with the frequency of each class label, we present the relative occurrence (as % of row "Total") in the train, test and validation sets. The inter-annotator agreement is computed as the mAP@0.5-0.95 metric between pairwise annotations from the triple-annotated pages, from which we obtain accuracy ranges.</caption>
-<row_0><col_0><body></col_0><col_1><body></col_1><col_2><col_header>% of Total</col_2><col_3><col_header>% of Total</col_3><col_4><col_header>% of Total</col_4><col_5><col_header>% of Total</col_5><col_6><col_header>triple inter-annotator mAP @ 0.5-0.95 (%)</col_6><col_7><col_header>triple inter-annotator mAP @ 0.5-0.95 (%)</col_7><col_8><col_header>triple inter-annotator mAP @ 0.5-0.95 (%)</col_8><col_9><col_header>triple inter-annotator mAP @ 0.5-0.95 (%)</col_9><col_10><col_header>triple inter-annotator mAP @ 0.5-0.95 (%)</col_10><col_11><col_header>triple inter-annotator mAP @ 0.5-0.95 (%)</col_11></row_0>
-<row_1><col_0><col_header>class label</col_0><col_1><col_header>Count</col_1><col_2><col_header>Train</col_2><col_3><col_header>Test</col_3><col_4><col_header>Val</col_4><col_5><col_header>All</col_5><col_6><col_header>Fin</col_6><col_7><col_header>Man</col_7><col_8><col_header>Sci</col_8><col_9><col_header>Law</col_9><col_10><col_header>Pat</col_10><col_11><col_header>Ten</col_11></row_1>
-<row_2><col_0><row_header>Caption</col_0><col_1><body>22524</col_1><col_2><body>2.04</col_2><col_3><body>1.77</col_3><col_4><body>2.32</col_4><col_5><body>84-89</col_5><col_6><body>40-61</col_6><col_7><body>86-92</col_7><col_8><body>94-99</col_8><col_9><body>95-99</col_9><col_10><body>69-78</col_10><col_11><body>n/a</col_11></row_2>
-<row_3><col_0><row_header>Footnote</col_0><col_1><body>6318</col_1><col_2><body>0.60</col_2><col_3><body>0.31</col_3><col_4><body>0.58</col_4><col_5><body>83-91</col_5><col_6><body>n/a</col_6><col_7><body>100</col_7><col_8><body>62-88</col_8><col_9><body>85-94</col_9><col_10><body>n/a</col_10><col_11><body>82-97</col_11></row_3>
-<row_4><col_0><row_header>Formula</col_0><col_1><body>25027</col_1><col_2><body>2.25</col_2><col_3><body>1.90</col_3><col_4><body>2.96</col_4><col_5><body>83-85</col_5><col_6><body>n/a</col_6><col_7><body>n/a</col_7><col_8><body>84-87</col_8><col_9><body>86-96</col_9><col_10><body>n/a</col_10><col_11><body>n/a</col_11></row_4>
-<row_5><col_0><row_header>List-item</col_0><col_1><body>185660</col_1><col_2><body>17.19</col_2><col_3><body>13.34</col_3><col_4><body>15.82</col_4><col_5><body>87-88</col_5><col_6><body>74-83</col_6><col_7><body>90-92</col_7><col_8><body>97-97</col_8><col_9><body>81-85</col_9><col_10><body>75-88</col_10><col_11><body>93-95</col_11></row_5>
-<row_6><col_0><row_header>Page-footer</col_0><col_1><body>70878</col_1><col_2><body>6.51</col_2><col_3><body>5.58</col_3><col_4><body>6.00</col_4><col_5><body>93-94</col_5><col_6><body>88-90</col_6><col_7><body>95-96</col_7><col_8><body>100</col_8><col_9><body>92-97</col_9><col_10><body>100</col_10><col_11><body>96-98</col_11></row_6>
-<row_7><col_0><row_header>Page-header</col_0><col_1><body>58022</col_1><col_2><body>5.10</col_2><col_3><body>6.70</col_3><col_4><body>5.06</col_4><col_5><body>85-89</col_5><col_6><body>66-76</col_6><col_7><body>90-94</col_7><col_8><body>98-100</col_8><col_9><body>91-92</col_9><col_10><body>97-99</col_10><col_11><body>81-86</col_11></row_7>
-<row_8><col_0><row_header>Picture</col_0><col_1><body>45976</col_1><col_2><body>4.21</col_2><col_3><body>2.78</col_3><col_4><body>5.31</col_4><col_5><body>69-71</col_5><col_6><body>56-59</col_6><col_7><body>82-86</col_7><col_8><body>69-82</col_8><col_9><body>80-95</col_9><col_10><body>66-71</col_10><col_11><body>59-76</col_11></row_8>
-<row_9><col_0><row_header>Section-header</col_0><col_1><body>142884</col_1><col_2><body>12.60</col_2><col_3><body>15.77</col_3><col_4><body>12.85</col_4><col_5><body>83-84</col_5><col_6><body>76-81</col_6><col_7><body>90-92</col_7><col_8><body>94-95</col_8><col_9><body>87-94</col_9><col_10><body>69-73</col_10><col_11><body>78-86</col_11></row_9>
-<row_10><col_0><row_header>Table</col_0><col_1><body>34733</col_1><col_2><body>3.20</col_2><col_3><body>2.27</col_3><col_4><body>3.60</col_4><col_5><body>77-81</col_5><col_6><body>75-80</col_6><col_7><body>83-86</col_7><col_8><body>98-99</col_8><col_9><body>58-80</col_9><col_10><body>79-84</col_10><col_11><body>70-85</col_11></row_10>
-<row_11><col_0><row_header>Text</col_0><col_1><body>510377</col_1><col_2><body>45.82</col_2><col_3><body>49.28</col_3><col_4><body>45.00</col_4><col_5><body>84-86</col_5><col_6><body>81-86</col_6><col_7><body>88-93</col_7><col_8><body>89-93</col_8><col_9><body>87-92</col_9><col_10><body>71-79</col_10><col_11><body>87-95</col_11></row_11>
-<row_12><col_0><row_header>Title</col_0><col_1><body>5071</col_1><col_2><body>0.47</col_2><col_3><body>0.30</col_3><col_4><body>0.50</col_4><col_5><body>60-72</col_5><col_6><body>24-63</col_6><col_7><body>50-63</col_7><col_8><body>94-100</col_8><col_9><body>82-96</col_9><col_10><body>68-79</col_10><col_11><body>24-56</col_11></row_12>
-<row_13><col_0><row_header>Total</col_0><col_1><body>1107470</col_1><col_2><body>941123</col_2><col_3><body>99816</col_3><col_4><body>66531</col_4><col_5><body>82-83</col_5><col_6><body>71-74</col_6><col_7><body>79-81</col_7><col_8><body>89-94</col_8><col_9><body>86-91</col_9><col_10><body>71-76</col_10><col_11><body>68-85</col_11></row_13>
-</table>
-<figure>
-<location><page_4><loc_9><loc_32><loc_48><loc_61></location>
-<caption>Figure 3: Corpus Conversion Service annotation user interface. The PDF page is shown in the background, with overlaid text-cells (in darker shades). The annotation boxes can be drawn by dragging a rectangle over each segment with the respective label from the palette on the right.</caption>
-</figure>
-<text><location><page_4><loc_9><loc_15><loc_48><loc_20></location>we distributed the annotation workload and performed continuous quality controls. Phase one and two required a small team of experts only. For phases three and four, a group of 40 dedicated annotators were assembled and supervised.</text>
-<text><location><page_4><loc_9><loc_11><loc_48><loc_14></location>Phase 1: Data selection and preparation. Our inclusion criteria for documents were described in Section 3. A large effort went into ensuring that all documents are free to use. The data sources</text>
-<text><location><page_4><loc_52><loc_53><loc_91><loc_61></location>include publication repositories such as arXiv$^{3}$, government offices, company websites as well as data directory services for financial reports and patents. Scanned documents were excluded wherever possible because they can be rotated or skewed. This would not allow us to perform annotation with rectangular bounding-boxes and therefore complicate the annotation process.</text>
-<text><location><page_4><loc_52><loc_36><loc_91><loc_52></location>Preparation work included uploading and parsing the sourced PDF documents in the Corpus Conversion Service (CCS) [22], a cloud-native platform which provides a visual annotation interface and allows for dataset inspection and analysis. The annotation interface of CCS is shown in Figure 3. The desired balance of pages between the different document categories was achieved by selective subsampling of pages with certain desired properties. For example, we made sure to include the title page of each document and bias the remaining page selection to those with figures or tables. The latter was achieved by leveraging pre-trained object detection models from PubLayNet, which helped us estimate how many figures and tables a given page contains.</text>
-<text><location><page_4><loc_52><loc_12><loc_91><loc_36></location>Phase 2: Label selection and guideline. We reviewed the collected documents and identified the most common structural features they exhibit. This was achieved by identifying recurrent layout elements and lead us to the definition of 11 distinct class labels. These 11 class labels are Caption , Footnote , Formula , List-item , Pagefooter , Page-header , Picture , Section-header , Table , Text , and Title . Critical factors that were considered for the choice of these class labels were (1) the overall occurrence of the label, (2) the specificity of the label, (3) recognisability on a single page (i.e. no need for context from previous or next page) and (4) overall coverage of the page. Specificity ensures that the choice of label is not ambiguous, while coverage ensures that all meaningful items on a page can be annotated. We refrained from class labels that are very specific to a document category, such as Abstract in the Scientific Articles category. We also avoided class labels that are tightly linked to the semantics of the text. Labels such as Author and Affiliation , as seen in DocBank, are often only distinguishable by discriminating on</text>
-<text><location><page_5><loc_9><loc_87><loc_48><loc_89></location>the textual content of an element, which goes beyond visual layout recognition, in particular outside the Scientific Articles category.</text>
-<text><location><page_5><loc_9><loc_69><loc_48><loc_86></location>At first sight, the task of visual document-layout interpretation appears intuitive enough to obtain plausible annotations in most cases. However, during early trial-runs in the core team, we observed many cases in which annotators use different annotation styles, especially for documents with challenging layouts. For example, if a figure is presented with subfigures, one annotator might draw a single figure bounding-box, while another might annotate each subfigure separately. The same applies for lists, where one might annotate all list items in one block or each list item separately. In essence, we observed that challenging layouts would be annotated in different but plausible ways. To illustrate this, we show in Figure 4 multiple examples of plausible but inconsistent annotations on the same pages.</text>
-<text><location><page_5><loc_9><loc_57><loc_48><loc_68></location>Obviously, this inconsistency in annotations is not desirable for datasets which are intended to be used for model training. To minimise these inconsistencies, we created a detailed annotation guideline. While perfect consistency across 40 annotation staff members is clearly not possible to achieve, we saw a huge improvement in annotation consistency after the introduction of our annotation guideline. A few selected, non-trivial highlights of the guideline are:</text>
-<unordered_list>
-<list_item><location><page_5><loc_11><loc_51><loc_48><loc_56></location>(1) Every list-item is an individual object instance with class label List-item . This definition is different from PubLayNet and DocBank, where all list-items are grouped together into one List object.</list_item>
-<list_item><location><page_5><loc_11><loc_45><loc_48><loc_50></location>(2) A List-item is a paragraph with hanging indentation. Singleline elements can qualify as List-item if the neighbour elements expose hanging indentation. Bullet or enumeration symbols are not a requirement.</list_item>
-<list_item><location><page_5><loc_11><loc_42><loc_48><loc_45></location>(3) For every Caption , there must be exactly one corresponding Picture or Table .</list_item>
-<list_item><location><page_5><loc_11><loc_40><loc_48><loc_42></location>(4) Connected sub-pictures are grouped together in one Picture object.</list_item>
-<list_item><location><page_5><loc_11><loc_38><loc_43><loc_39></location>(5) Formula numbers are included in a Formula object.</list_item>
-<list_item><location><page_5><loc_11><loc_34><loc_48><loc_38></location>(6) Emphasised text (e.g. in italic or bold) at the beginning of a paragraph is not considered a Section-header , unless it appears exclusively on its own line.</list_item>
+<text><loc_259><loc_106><loc_457><loc_139>All aspects outlined above are detailed in Section 3. In Section 4, we will elaborate on how we designed and executed this large-scale human annotation campaign. We will also share key insights and lessons learned that might prove helpful for other parties planning to set up annotation campaigns.</text>
+<text><loc_260><loc_141><loc_457><loc_194>In Section 5, we will present baseline accuracy numbers for a variety of object detection methods (Faster R-CNN, Mask R-CNN and YOLOv5) trained on DocLayNet. We further show how the model performance is impacted by varying the DocLayNet dataset size, reducing the label set and modifying the train/test-split. Last but not least, we compare the performance of models trained on PubLayNet, DocBank and DocLayNet and demonstrate that a model trained on DocLayNet provides overall more robust layout recovery.</text>
+<section_header_level_1><loc_260><loc_203><loc_345><loc_209>2 RELATED WORK</section_header_level_1>
+<text><loc_259><loc_219><loc_457><loc_293>While early approaches in document-layout analysis used rulebased algorithms and heuristics [8], the problem is lately addressed with deep learning methods. The most common approach is to leverage object detection models [9-15]. In the last decade, the accuracy and speed of these models has increased dramatically. Furthermore, most state-of-the-art object detection methods can be trained and applied with very little work, thanks to a standardisation effort of the ground-truth data format [16] and common deep-learning frameworks [17]. Reference data sets such as PubLayNet [6] and DocBank provide their data in the commonly accepted COCO format [16].</text>
+<text><loc_260><loc_295><loc_457><loc_348>Lately, new types of ML models for document-layout analysis have emerged in the community [18-21]. These models do not approach the problem of layout analysis purely based on an image representation of the page, as computer vision methods do. Instead, they combine the text tokens and image representation of a page in order to obtain a segmentation. While the reported accuracies appear to be promising, a broadly accepted data format which links geometric and textual features has yet to establish.</text>
+<section_header_level_1><loc_260><loc_357><loc_390><loc_363>3 THE DOCLAYNET DATASET</section_header_level_1>
+<text><loc_260><loc_373><loc_457><loc_426>DocLayNet contains 80863 PDF pages. Among these, 7059 carry two instances of human annotations, and 1591 carry three. This amounts to 91104 total annotation instances. The annotations provide layout information in the shape of labeled, rectangular boundingboxes. We define 11 distinct labels for layout features, namely Caption , Footnote , Formula , List-item , Page-footer , Page-header , Picture , Section-header , Table , Text , and Title . Our reasoning for picking this particular label set is detailed in Section 4.</text>
+<text><loc_260><loc_428><loc_456><loc_447>In addition to open intellectual property constraints for the source documents, we required that the documents in DocLayNet adhere to a few conditions. Firstly, we kept scanned documents</text>
+<page_break>
+<page_header><loc_44><loc_38><loc_284><loc_43>DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis</page_header>
+<page_header><loc_299><loc_38><loc_456><loc_43>KDD ’22, August 14-18, 2022, Washington, DC, USA</page_header>
+<picture><loc_72><loc_59><loc_215><loc_139><caption><loc_44><loc_149><loc_240><loc_161>Figure 2: Distribution of DocLayNet pages across document categories.</caption></picture>
+<text><loc_44><loc_178><loc_240><loc_232>to a minimum, since they introduce difficulties in annotation (see Section 4). As a second condition, we focussed on medium to large documents ( > 10 pages) with technical content, dense in complex tables, figures, plots and captions. Such documents carry a lot of information value, but are often hard to analyse with high accuracy due to their challenging layouts. Counterexamples of documents not included in the dataset are receipts, invoices, hand-written documents or photographs showing "text in the wild".</text>
+<text><loc_44><loc_233><loc_241><loc_322>The pages in DocLayNet can be grouped into six distinct categories, namely Financial Reports , Manuals , Scientific Articles , Laws & Regulations , Patents and Government Tenders . Each document category was sourced from various repositories. For example, Financial Reports contain both free-style format annual reports 2 which expose company-specific, artistic layouts as well as the more formal SEC filings. The two largest categories ( Financial Reports and Manuals ) contain a large amount of free-style layouts in order to obtain maximum variability. In the other four categories, we boosted the variability by mixing documents from independent providers, such as different government websites or publishers. In Figure 2, we show the document categories contained in DocLayNet with their respective sizes.</text>
+<text><loc_44><loc_323><loc_241><loc_384>We did not control the document selection with regard to language. The vast majority of documents contained in DocLayNet (close to 95%) are published in English language. However, DocLayNet also contains a number of documents in other languages such as German (2.5%), French (1.0%) and Japanese (1.0%). While the document language has negligible impact on the performance of computer vision methods such as object detection and segmentation models, it might prove challenging for layout analysis methods which exploit textual features.</text>
+<text><loc_44><loc_385><loc_241><loc_432>To ensure that future benchmarks in the document-layout analysis community can be easily compared, we have split up DocLayNet into pre-defined train-, test- and validation-sets. In this way, we can avoid spurious variations in the evaluation scores due to random splitting in train-, test- and validation-sets. We also ensured that less frequent labels are represented in train and test sets in equal proportions.</text>
+<footnote><loc_44><loc_443><loc_160><loc_447>$^{2}$e.g. AAPL from https://www.annualreports.com/</footnote>
+<text><loc_259><loc_55><loc_457><loc_102>Table 1 shows the overall frequency and distribution of the labels among the different sets. Importantly, we ensure that subsets are only split on full-document boundaries. This avoids that pages of the same document are spread over train, test and validation set, which can give an undesired evaluation advantage to models and lead to overestimation of their prediction accuracy. We will show the impact of this decision in Section 5.</text>
+<text><loc_260><loc_104><loc_456><loc_171>In order to accommodate the different types of models currently in use by the community, we provide DocLayNet in an augmented COCO format [16]. This entails the standard COCO ground-truth file (in JSON format) with the associated page images (in PNG format, 1025 × 1025 pixels). Furthermore, custom fields have been added to each COCO record to specify document category, original document filename and page number. In addition, we also provide the original PDF pages, as well as sidecar files containing parsed PDF text and text-cell coordinates (in JSON). All additional files are linked to the primary page images by their matching filenames.</text>
+<text><loc_259><loc_173><loc_457><loc_372>Despite being cost-intense and far less scalable than automation, human annotation has several benefits over automated groundtruth generation. The first and most obvious reason to leverage human annotations is the freedom to annotate any type of document without requiring a programmatic source. For most PDF documents, the original source document is not available. The latter is not a hard constraint with human annotation, but it is for automated methods. A second reason to use human annotations is that the latter usually provide a more natural interpretation of the page layout. The human-interpreted layout can significantly deviate from the programmatic layout used in typesetting. For example, "invisible" tables might be used solely for aligning text paragraphs on columns. Such typesetting tricks might be interpreted by automated methods incorrectly as an actual table, while the human annotation will interpret it correctly as Text or other styles. The same applies to multi-line text elements, when authors decided to space them as "invisible" list elements without bullet symbols. A third reason to gather ground-truth through human annotation is to estimate a "natural" upper bound on the segmentation accuracy. As we will show in Section 4, certain documents featuring complex layouts can have different but equally acceptable layout interpretations. This natural upper bound for segmentation accuracy can be found by annotating the same pages multiple times by different people and evaluating the inter-annotator agreement. Such a baseline consistency evaluation is very useful to define expectations for a good target accuracy in trained deep neural network models and avoid overfitting (see Table 1). On the flip side, achieving high annotation consistency proved to be a key challenge in human annotation, as we outline in Section 4.</text>
+<section_header_level_1><loc_260><loc_383><loc_384><loc_390>4 ANNOTATION CAMPAIGN</section_header_level_1>
+<text><loc_260><loc_399><loc_457><loc_446>The annotation campaign was carried out in four phases. In phase one, we identified and prepared the data sources for annotation. In phase two, we determined the class labels and how annotations should be done on the documents in order to obtain maximum consistency. The latter was guided by a detailed requirement analysis and exhaustive experiments. In phase three, we trained the annotation staff and performed exams for quality assurance. In phase four,</text>
+<page_break>
+<page_header><loc_44><loc_38><loc_456><loc_43>KDD '22, August 14-18, 2022, Washington, DC, USA Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar</page_header>
+<otsl><loc_81><loc_87><loc_419><loc_186><ecel><ecel><ched>% of Total<lcel><lcel><lcel><ched>triple inter-annotator mAP @ 0.5-0.95 (%)<lcel><lcel><lcel><lcel><lcel><nl><ched>class label<ched>Count<ched>Train<ched>Test<ched>Val<ched>All<ched>Fin<ched>Man<ched>Sci<ched>Law<ched>Pat<ched>Ten<nl><rhed>Caption<fcel>22524<fcel>2.04<fcel>1.77<fcel>2.32<fcel>84-89<fcel>40-61<fcel>86-92<fcel>94-99<fcel>95-99<fcel>69-78<fcel>n/a<nl><rhed>Footnote<fcel>6318<fcel>0.60<fcel>0.31<fcel>0.58<fcel>83-91<fcel>n/a<fcel>100<fcel>62-88<fcel>85-94<fcel>n/a<fcel>82-97<nl><rhed>Formula<fcel>25027<fcel>2.25<fcel>1.90<fcel>2.96<fcel>83-85<fcel>n/a<fcel>n/a<fcel>84-87<fcel>86-96<fcel>n/a<fcel>n/a<nl><rhed>List-item<fcel>185660<fcel>17.19<fcel>13.34<fcel>15.82<fcel>87-88<fcel>74-83<fcel>90-92<fcel>97-97<fcel>81-85<fcel>75-88<fcel>93-95<nl><rhed>Page-footer<fcel>70878<fcel>6.51<fcel>5.58<fcel>6.00<fcel>93-94<fcel>88-90<fcel>95-96<fcel>100<fcel>92-97<fcel>100<fcel>96-98<nl><rhed>Page-header<fcel>58022<fcel>5.10<fcel>6.70<fcel>5.06<fcel>85-89<fcel>66-76<fcel>90-94<fcel>98-100<fcel>91-92<fcel>97-99<fcel>81-86<nl><rhed>Picture<fcel>45976<fcel>4.21<fcel>2.78<fcel>5.31<fcel>69-71<fcel>56-59<fcel>82-86<fcel>69-82<fcel>80-95<fcel>66-71<fcel>59-76<nl><rhed>Section-header<fcel>142884<fcel>12.60<fcel>15.77<fcel>12.85<fcel>83-84<fcel>76-81<fcel>90-92<fcel>94-95<fcel>87-94<fcel>69-73<fcel>78-86<nl><rhed>Table<fcel>34733<fcel>3.20<fcel>2.27<fcel>3.60<fcel>77-81<fcel>75-80<fcel>83-86<fcel>98-99<fcel>58-80<fcel>79-84<fcel>70-85<nl><rhed>Text<fcel>510377<fcel>45.82<fcel>49.28<fcel>45.00<fcel>84-86<fcel>81-86<fcel>88-93<fcel>89-93<fcel>87-92<fcel>71-79<fcel>87-95<nl><rhed>Title<fcel>5071<fcel>0.47<fcel>0.30<fcel>0.50<fcel>60-72<fcel>24-63<fcel>50-63<fcel>94-100<fcel>82-96<fcel>68-79<fcel>24-56<nl><rhed>Total<fcel>1107470<fcel>941123<fcel>99816<fcel>66531<fcel>82-83<fcel>71-74<fcel>79-81<fcel>89-94<fcel>86-91<fcel>71-76<fcel>68-85<nl><caption><loc_44><loc_54><loc_456><loc_73>Table 1: DocLayNet dataset overview. Along with the frequency of each class label, we present the relative occurrence (as % of row "Total") in the train, test and validation sets. The inter-annotator agreement is computed as the mAP@0.5-0.95 metric between pairwise annotations from the triple-annotated pages, from which we obtain accuracy ranges.</caption></otsl>
+<picture><loc_43><loc_196><loc_242><loc_341><caption><loc_44><loc_350><loc_242><loc_383>Figure 3: Corpus Conversion Service annotation user interface. The PDF page is shown in the background, with overlaid text-cells (in darker shades). The annotation boxes can be drawn by dragging a rectangle over each segment with the respective label from the palette on the right.</caption></picture>
+<text><loc_44><loc_400><loc_240><loc_426>we distributed the annotation workload and performed continuous quality controls. Phase one and two required a small team of experts only. For phases three and four, a group of 40 dedicated annotators were assembled and supervised.</text>
+<text><loc_44><loc_428><loc_241><loc_447><loc_44><loc_428><loc_241><loc_447>Phase 1: Data selection and preparation. Our inclusion criteria for documents were described in Section 3. A large effort went into ensuring that all documents are free to use. The data sources include publication repositories such as arXiv$^{3}$, government offices, company websites as well as data directory services for financial reports and patents. Scanned documents were excluded wherever possible because they can be rotated or skewed. This would not allow us to perform annotation with rectangular bounding-boxes and therefore complicate the annotation process.</text>
+<text><loc_260><loc_239><loc_457><loc_320>Preparation work included uploading and parsing the sourced PDF documents in the Corpus Conversion Service (CCS) [22], a cloud-native platform which provides a visual annotation interface and allows for dataset inspection and analysis. The annotation interface of CCS is shown in Figure 3. The desired balance of pages between the different document categories was achieved by selective subsampling of pages with certain desired properties. For example, we made sure to include the title page of each document and bias the remaining page selection to those with figures or tables. The latter was achieved by leveraging pre-trained object detection models from PubLayNet, which helped us estimate how many figures and tables a given page contains.</text>
+<text><loc_259><loc_321><loc_457><loc_438>Phase 2: Label selection and guideline. We reviewed the collected documents and identified the most common structural features they exhibit. This was achieved by identifying recurrent layout elements and lead us to the definition of 11 distinct class labels. These 11 class labels are Caption , Footnote , Formula , List-item , Pagefooter , Page-header , Picture , Section-header , Table , Text , and Title . Critical factors that were considered for the choice of these class labels were (1) the overall occurrence of the label, (2) the specificity of the label, (3) recognisability on a single page (i.e. no need for context from previous or next page) and (4) overall coverage of the page. Specificity ensures that the choice of label is not ambiguous, while coverage ensures that all meaningful items on a page can be annotated. We refrained from class labels that are very specific to a document category, such as Abstract in the Scientific Articles category. We also avoided class labels that are tightly linked to the semantics of the text. Labels such as Author and Affiliation , as seen in DocBank, are often only distinguishable by discriminating on</text>
+<footnote><loc_260><loc_443><loc_302><loc_448>$^{3}$https://arxiv.org/</footnote>
+<page_break>
+<page_header><loc_44><loc_38><loc_284><loc_43>DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis</page_header>
+<page_header><loc_299><loc_38><loc_456><loc_43>KDD ’22, August 14-18, 2022, Washington, DC, USA</page_header>
+<text><loc_44><loc_55><loc_240><loc_67>the textual content of an element, which goes beyond visual layout recognition, in particular outside the Scientific Articles category.</text>
+<text><loc_44><loc_69><loc_241><loc_157>At first sight, the task of visual document-layout interpretation appears intuitive enough to obtain plausible annotations in most cases. However, during early trial-runs in the core team, we observed many cases in which annotators use different annotation styles, especially for documents with challenging layouts. For example, if a figure is presented with subfigures, one annotator might draw a single figure bounding-box, while another might annotate each subfigure separately. The same applies for lists, where one might annotate all list items in one block or each list item separately. In essence, we observed that challenging layouts would be annotated in different but plausible ways. To illustrate this, we show in Figure 4 multiple examples of plausible but inconsistent annotations on the same pages.</text>
+<text><loc_44><loc_159><loc_241><loc_213>Obviously, this inconsistency in annotations is not desirable for datasets which are intended to be used for model training. To minimise these inconsistencies, we created a detailed annotation guideline. While perfect consistency across 40 annotation staff members is clearly not possible to achieve, we saw a huge improvement in annotation consistency after the introduction of our annotation guideline. A few selected, non-trivial highlights of the guideline are:</text>
+<unordered_list><list_item><loc_53><loc_220><loc_240><loc_246>(1) Every list-item is an individual object instance with class label List-item . This definition is different from PubLayNet and DocBank, where all list-items are grouped together into one List object.</list_item>
+<list_item><loc_53><loc_248><loc_241><loc_274>(2) A List-item is a paragraph with hanging indentation. Singleline elements can qualify as List-item if the neighbour elements expose hanging indentation. Bullet or enumeration symbols are not a requirement.</list_item>
+<list_item><loc_53><loc_275><loc_240><loc_288>(3) For every Caption , there must be exactly one corresponding Picture or Table .</list_item>
+<list_item><loc_53><loc_289><loc_240><loc_301>(4) Connected sub-pictures are grouped together in one Picture object.</list_item>
+<list_item><loc_53><loc_303><loc_216><loc_308>(5) Formula numbers are included in a Formula object.</list_item>
+<list_item><loc_53><loc_310><loc_240><loc_329>(6) Emphasised text (e.g. in italic or bold) at the beginning of a paragraph is not considered a Section-header , unless it appears exclusively on its own line.</list_item>
 </unordered_list>
-<text><location><page_5><loc_9><loc_27><loc_48><loc_33></location>The complete annotation guideline is over 100 pages long and a detailed description is obviously out of scope for this paper. Nevertheless, it will be made publicly available alongside with DocLayNet for future reference.</text>
-<text><location><page_5><loc_9><loc_11><loc_48><loc_27></location>Phase 3: Training. After a first trial with a small group of people, we realised that providing the annotation guideline and a set of random practice pages did not yield the desired quality level for layout annotation. Therefore we prepared a subset of pages with two different complexity levels, each with a practice and an exam part. 974 pages were reference-annotated by one proficient core team member. Annotation staff were then given the task to annotate the same subsets (blinded from the reference). By comparing the annotations of each staff member with the reference annotations, we could quantify how closely their annotations matched the reference. Only after passing two exam levels with high annotation quality, staff were admitted into the production phase. Practice iterations</text>
-<figure>
-<location><page_5><loc_52><loc_42><loc_91><loc_89></location>
-<caption>Figure 4: Examples of plausible annotation alternatives for the same page. Criteria in our annotation guideline can resolve cases A to C, while the case D remains ambiguous.</caption>
-</figure>
-<text><location><page_5><loc_65><loc_42><loc_78><loc_42></location>05237a14f2524e3f53c8454b074409d05078038a6a36b770fcc8ec7e540deae0</text>
-<text><location><page_5><loc_52><loc_31><loc_91><loc_34></location>were carried out over a timeframe of 12 weeks, after which 8 of the 40 initially allocated annotators did not pass the bar.</text>
-<text><location><page_5><loc_52><loc_10><loc_91><loc_31></location>Phase 4: Production annotation. The previously selected 80K pages were annotated with the defined 11 class labels by 32 annotators. This production phase took around three months to complete. All annotations were created online through CCS, which visualises the programmatic PDF text-cells as an overlay on the page. The page annotation are obtained by drawing rectangular bounding-boxes, as shown in Figure 3. With regard to the annotation practices, we implemented a few constraints and capabilities on the tooling level. First, we only allow non-overlapping, vertically oriented, rectangular boxes. For the large majority of documents, this constraint was sufficient and it speeds up the annotation considerably in comparison with arbitrary segmentation shapes. Second, annotator staff were not able to see each other's annotations. This was enforced by design to avoid any bias in the annotation, which could skew the numbers of the inter-annotator agreement (see Table 1). We wanted</text>
-<table>
-<location><page_6><loc_10><loc_56><loc_47><loc_75></location>
-<caption>Table 2: Prediction performance (mAP@0.5-0.95) of object detection networks on DocLayNet test set. The MRCNN (Mask R-CNN) and FRCNN (Faster R-CNN) models with ResNet-50 or ResNet-101 backbone were trained based on the network architectures from the detectron2 model zoo (Mask R-CNN R50, R101-FPN 3x, Faster R-CNN R101-FPN 3x), with default configurations. The YOLO implementation utilized was YOLOv5x6 [13]. All models were initialised using pre-trained weights from the COCO 2017 dataset.</caption>
-<row_0><col_0><body></col_0><col_1><col_header>human</col_1><col_2><col_header>MRCNN</col_2><col_3><col_header>MRCNN</col_3><col_4><col_header>FRCNN</col_4><col_5><col_header>YOLO</col_5></row_0>
-<row_1><col_0><body></col_0><col_1><col_header>human</col_1><col_2><col_header>R50</col_2><col_3><col_header>R101</col_3><col_4><col_header>R101</col_4><col_5><col_header>v5x6</col_5></row_1>
-<row_2><col_0><row_header>Caption</col_0><col_1><body>84-89</col_1><col_2><body>68.4</col_2><col_3><body>71.5</col_3><col_4><body>70.1</col_4><col_5><body>77.7</col_5></row_2>
-<row_3><col_0><row_header>Footnote</col_0><col_1><body>83-91</col_1><col_2><body>70.9</col_2><col_3><body>71.8</col_3><col_4><body>73.7</col_4><col_5><body>77.2</col_5></row_3>
-<row_4><col_0><row_header>Formula</col_0><col_1><body>83-85</col_1><col_2><body>60.1</col_2><col_3><body>63.4</col_3><col_4><body>63.5</col_4><col_5><body>66.2</col_5></row_4>
-<row_5><col_0><row_header>List-item</col_0><col_1><body>87-88</col_1><col_2><body>81.2</col_2><col_3><body>80.8</col_3><col_4><body>81.0</col_4><col_5><body>86.2</col_5></row_5>
-<row_6><col_0><row_header>Page-footer</col_0><col_1><body>93-94</col_1><col_2><body>61.6</col_2><col_3><body>59.3</col_3><col_4><body>58.9</col_4><col_5><body>61.1</col_5></row_6>
-<row_7><col_0><row_header>Page-header</col_0><col_1><body>85-89</col_1><col_2><body>71.9</col_2><col_3><body>70.0</col_3><col_4><body>72.0</col_4><col_5><body>67.9</col_5></row_7>
-<row_8><col_0><row_header>Picture</col_0><col_1><body>69-71</col_1><col_2><body>71.7</col_2><col_3><body>72.7</col_3><col_4><body>72.0</col_4><col_5><body>77.1</col_5></row_8>
-<row_9><col_0><row_header>Section-header</col_0><col_1><body>83-84</col_1><col_2><body>67.6</col_2><col_3><body>69.3</col_3><col_4><body>68.4</col_4><col_5><body>74.6</col_5></row_9>
-<row_10><col_0><row_header>Table</col_0><col_1><body>77-81</col_1><col_2><body>82.2</col_2><col_3><body>82.9</col_3><col_4><body>82.2</col_4><col_5><body>86.3</col_5></row_10>
-<row_11><col_0><row_header>Text</col_0><col_1><body>84-86</col_1><col_2><body>84.6</col_2><col_3><body>85.8</col_3><col_4><body>85.4</col_4><col_5><body>88.1</col_5></row_11>
-<row_12><col_0><row_header>Title</col_0><col_1><body>60-72</col_1><col_2><body>76.7</col_2><col_3><body>80.4</col_3><col_4><body>79.9</col_4><col_5><body>82.7</col_5></row_12>
-<row_13><col_0><row_header>All</col_0><col_1><body>82-83</col_1><col_2><body>72.4</col_2><col_3><body>73.5</col_3><col_4><body>73.4</col_4><col_5><body>76.8</col_5></row_13>
-</table>
-<text><location><page_6><loc_9><loc_27><loc_48><loc_53></location>to avoid this at any cost in order to have clear, unbiased baseline numbers for human document-layout annotation. Third, we introduced the feature of snapping boxes around text segments to obtain a pixel-accurate annotation and again reduce time and effort. The CCS annotation tool automatically shrinks every user-drawn box to the minimum bounding-box around the enclosed text-cells for all purely text-based segments, which excludes only Table and Picture . For the latter, we instructed annotation staff to minimise inclusion of surrounding whitespace while including all graphical lines. A downside of snapping boxes to enclosed text cells is that some wrongly parsed PDF pages cannot be annotated correctly and need to be skipped. Fourth, we established a way to flag pages as rejected for cases where no valid annotation according to the label guidelines could be achieved. Example cases for this would be PDF pages that render incorrectly or contain layouts that are impossible to capture with non-overlapping rectangles. Such rejected pages are not contained in the final dataset. With all these measures in place, experienced annotation staff managed to annotate a single page in a typical timeframe of 20s to 60s, depending on its complexity.</text>
-<section_header_level_1><location><page_6><loc_9><loc_24><loc_24><loc_26></location>5 EXPERIMENTS</section_header_level_1>
-<text><location><page_6><loc_9><loc_10><loc_48><loc_23></location>The primary goal of DocLayNet is to obtain high-quality ML models capable of accurate document-layout analysis on a wide variety of challenging layouts. As discussed in Section 2, object detection models are currently the easiest to use, due to the standardisation of ground-truth data in COCO format [16] and the availability of general frameworks such as detectron2 [17]. Furthermore, baseline numbers in PubLayNet and DocBank were obtained using standard object detection models such as Mask R-CNN and Faster R-CNN. As such, we will relate to these object detection methods in this</text>
-<figure>
-<location><page_6><loc_53><loc_67><loc_90><loc_89></location>
-<caption>Figure 5: Prediction performance (mAP@0.5-0.95) of a Mask R-CNN network with ResNet50 backbone trained on increasing fractions of the DocLayNet dataset. The learning curve flattens around the 80% mark, indicating that increasing the size of the DocLayNet dataset with similar data will not yield significantly better predictions.</caption>
-</figure>
-<text><location><page_6><loc_52><loc_49><loc_91><loc_52></location>paper and leave the detailed evaluation of more recent methods mentioned in Section 2 for future work.</text>
-<text><location><page_6><loc_52><loc_39><loc_91><loc_49></location>In this section, we will present several aspects related to the performance of object detection models on DocLayNet. Similarly as in PubLayNet, we will evaluate the quality of their predictions using mean average precision (mAP) with 10 overlaps that range from 0.5 to 0.95 in steps of 0.05 (mAP@0.5-0.95). These scores are computed by leveraging the evaluation code provided by the COCO API [16].</text>
-<section_header_level_1><location><page_6><loc_52><loc_36><loc_76><loc_37></location>Baselines for Object Detection</section_header_level_1>
-<text><location><page_6><loc_52><loc_11><loc_91><loc_35></location>In Table 2, we present baseline experiments (given in mAP) on Mask R-CNN [12], Faster R-CNN [11], and YOLOv5 [13]. Both training and evaluation were performed on RGB images with dimensions of 1025 × 1025 pixels. For training, we only used one annotation in case of redundantly annotated pages. As one can observe, the variation in mAP between the models is rather low, but overall between 6 and 10% lower than the mAP computed from the pairwise human annotations on triple-annotated pages. This gives a good indication that the DocLayNet dataset poses a worthwhile challenge for the research community to close the gap between human recognition and ML approaches. It is interesting to see that Mask R-CNN and Faster R-CNN produce very comparable mAP scores, indicating that pixel-based image segmentation derived from bounding-boxes does not help to obtain better predictions. On the other hand, the more recent Yolov5x model does very well and even out-performs humans on selected labels such as Text , Table and Picture . This is not entirely surprising, as Text , Table and Picture are abundant and the most visually distinctive in a document.</text>
-<text><location><page_7><loc_9><loc_84><loc_48><loc_89></location>Table 3: Performance of a Mask R-CNN R50 network in mAP@0.5-0.95 scores trained on DocLayNet with different class label sets. The reduced label sets were obtained by either down-mapping or dropping labels.</text>
-<table>
-<location><page_7><loc_13><loc_63><loc_44><loc_81></location>
-<caption>Table 4: Performance of a Mask R-CNN R50 network with document-wise and page-wise split for different label sets. Naive page-wise split will result in GLYPH<tildelow> 10% point improvement.</caption>
-<row_0><col_0><col_header>Class-count</col_0><col_1><col_header>11</col_1><col_2><col_header>6</col_2><col_3><col_header>5</col_3><col_4><col_header>4</col_4></row_0>
-<row_1><col_0><row_header>Caption</col_0><col_1><body>68</col_1><col_2><body>Text</col_2><col_3><body>Text</col_3><col_4><body>Text</col_4></row_1>
-<row_2><col_0><row_header>Footnote</col_0><col_1><body>71</col_1><col_2><body>Text</col_2><col_3><body>Text</col_3><col_4><body>Text</col_4></row_2>
-<row_3><col_0><row_header>Formula</col_0><col_1><body>60</col_1><col_2><body>Text</col_2><col_3><body>Text</col_3><col_4><body>Text</col_4></row_3>
-<row_4><col_0><row_header>List-item</col_0><col_1><body>81</col_1><col_2><body>Text</col_2><col_3><body>82</col_3><col_4><body>Text</col_4></row_4>
-<row_5><col_0><row_header>Page-footer</col_0><col_1><body>62</col_1><col_2><body>62</col_2><col_3><body>-</col_3><col_4><body>-</col_4></row_5>
-<row_6><col_0><row_header>Page-header</col_0><col_1><body>72</col_1><col_2><body>68</col_2><col_3><body>-</col_3><col_4><body>-</col_4></row_6>
-<row_7><col_0><row_header>Picture</col_0><col_1><body>72</col_1><col_2><body>72</col_2><col_3><body>72</col_3><col_4><body>72</col_4></row_7>
-<row_8><col_0><row_header>Section-header</col_0><col_1><body>68</col_1><col_2><body>67</col_2><col_3><body>69</col_3><col_4><body>68</col_4></row_8>
-<row_9><col_0><row_header>Table</col_0><col_1><body>82</col_1><col_2><body>83</col_2><col_3><body>82</col_3><col_4><body>82</col_4></row_9>
-<row_10><col_0><row_header>Text</col_0><col_1><body>85</col_1><col_2><body>84</col_2><col_3><body>84</col_3><col_4><body>84</col_4></row_10>
-<row_11><col_0><row_header>Title</col_0><col_1><body>77</col_1><col_2><body>Sec.-h.</col_2><col_3><body>Sec.-h.</col_3><col_4><body>Sec.-h.</col_4></row_11>
-<row_12><col_0><row_header>Overall</col_0><col_1><body>72</col_1><col_2><body>73</col_2><col_3><body>78</col_3><col_4><body>77</col_4></row_12>
-</table>
-<section_header_level_1><location><page_7><loc_9><loc_58><loc_21><loc_60></location>Learning Curve</section_header_level_1>
-<text><location><page_7><loc_9><loc_33><loc_48><loc_58></location>One of the fundamental questions related to any dataset is if it is "large enough". To answer this question for DocLayNet, we performed a data ablation study in which we evaluated a Mask R-CNN model trained on increasing fractions of the DocLayNet dataset. As can be seen in Figure 5, the mAP score rises sharply in the beginning and eventually levels out. To estimate the error-bar on the metrics, we ran the training five times on the entire data-set. This resulted in a 1% error-bar, depicted by the shaded area in Figure 5. In the inset of Figure 5, we show the exact same data-points, but with a logarithmic scale on the x-axis. As is expected, the mAP score increases linearly as a function of the data-size in the inset. The curve ultimately flattens out between the 80% and 100% mark, with the 80% mark falling within the error-bars of the 100% mark. This provides a good indication that the model would not improve significantly by yet increasing the data size. Rather, it would probably benefit more from improved data consistency (as discussed in Section 3), data augmentation methods [23], or the addition of more document categories and styles.</text>
-<section_header_level_1><location><page_7><loc_9><loc_30><loc_27><loc_32></location>Impact of Class Labels</section_header_level_1>
-<text><location><page_7><loc_9><loc_11><loc_48><loc_30></location>The choice and number of labels can have a significant effect on the overall model performance. Since PubLayNet, DocBank and DocLayNet all have different label sets, it is of particular interest to understand and quantify this influence of the label set on the model performance. We investigate this by either down-mapping labels into more common ones (e.g. Caption → Text ) or excluding them from the annotations entirely. Furthermore, it must be stressed that all mappings and exclusions were performed on the data before model training. In Table 3, we present the mAP scores for a Mask R-CNN R50 network on different label sets. Where a label is down-mapped, we show its corresponding label, otherwise it was excluded. We present three different label sets, with 6, 5 and 4 different labels respectively. The set of 5 labels contains the same labels as PubLayNet. However, due to the different definition of</text>
-<table>
-<location><page_7><loc_58><loc_61><loc_85><loc_81></location>
-<row_0><col_0><body>Class-count</col_0><col_1><col_header>11</col_1><col_2><col_header>11</col_2><col_3><col_header>5</col_3><col_4><col_header>5</col_4></row_0>
-<row_1><col_0><body>Split</col_0><col_1><col_header>Doc</col_1><col_2><col_header>Page</col_2><col_3><col_header>Doc</col_3><col_4><col_header>Page</col_4></row_1>
-<row_2><col_0><row_header>Caption</col_0><col_1><body>68</col_1><col_2><body>83</col_2><col_3><body></col_3><col_4><body></col_4></row_2>
-<row_3><col_0><row_header>Footnote</col_0><col_1><body>71</col_1><col_2><body>84</col_2><col_3><body></col_3><col_4><body></col_4></row_3>
-<row_4><col_0><row_header>Formula</col_0><col_1><body>60</col_1><col_2><body>66</col_2><col_3><body></col_3><col_4><body></col_4></row_4>
-<row_5><col_0><row_header>List-item</col_0><col_1><body>81</col_1><col_2><body>88</col_2><col_3><body>82</col_3><col_4><body>88</col_4></row_5>
-<row_6><col_0><row_header>Page-footer</col_0><col_1><body>62</col_1><col_2><body>89</col_2><col_3><body></col_3><col_4><body></col_4></row_6>
-<row_7><col_0><row_header>Page-header</col_0><col_1><body>72</col_1><col_2><body>90</col_2><col_3><body></col_3><col_4><body></col_4></row_7>
-<row_8><col_0><row_header>Picture</col_0><col_1><body>72</col_1><col_2><body>82</col_2><col_3><body>72</col_3><col_4><body>82</col_4></row_8>
-<row_9><col_0><row_header>Section-header</col_0><col_1><body>68</col_1><col_2><body>83</col_2><col_3><body>69</col_3><col_4><body>83</col_4></row_9>
-<row_10><col_0><row_header>Table</col_0><col_1><body>82</col_1><col_2><body>89</col_2><col_3><body>82</col_3><col_4><body>90</col_4></row_10>
-<row_11><col_0><row_header>Text</col_0><col_1><body>85</col_1><col_2><body>91</col_2><col_3><body>84</col_3><col_4><body>90</col_4></row_11>
-<row_12><col_0><row_header>Title</col_0><col_1><body>77</col_1><col_2><body>81</col_2><col_3><body></col_3><col_4><body></col_4></row_12>
-<row_13><col_0><row_header>All</col_0><col_1><body>72</col_1><col_2><body>84</col_2><col_3><body>78</col_3><col_4><body>87</col_4></row_13>
-</table>
-<text><location><page_7><loc_52><loc_47><loc_91><loc_58></location>lists in PubLayNet (grouped list-items) versus DocLayNet (separate list-items), the label set of size 4 is the closest to PubLayNet, in the assumption that the List is down-mapped to Text in PubLayNet. The results in Table 3 show that the prediction accuracy on the remaining class labels does not change significantly when other classes are merged into them. The overall macro-average improves by around 5%, in particular when Page-footer and Page-header are excluded.</text>
-<section_header_level_1><location><page_7><loc_52><loc_44><loc_90><loc_46></location>Impact of Document Split in Train and Test Set</section_header_level_1>
-<text><location><page_7><loc_52><loc_25><loc_91><loc_44></location>Many documents in DocLayNet have a unique styling. In order to avoid overfitting on a particular style, we have split the train-, test- and validation-sets of DocLayNet on document boundaries, i.e. every document contributes pages to only one set. To the best of our knowledge, this was not considered in PubLayNet or DocBank. To quantify how this affects model performance, we trained and evaluated a Mask R-CNN R50 model on a modified dataset version. Here, the train-, test- and validation-sets were obtained by a randomised draw over the individual pages. As can be seen in Table 4, the difference in model performance is surprisingly large: pagewise splitting gains ˜ 10% in mAP over the document-wise splitting. Thus, random page-wise splitting of DocLayNet can easily lead to accidental overestimation of model performance and should be avoided.</text>
-<section_header_level_1><location><page_7><loc_52><loc_22><loc_68><loc_23></location>Dataset Comparison</section_header_level_1>
-<text><location><page_7><loc_52><loc_11><loc_91><loc_21></location>Throughout this paper, we claim that DocLayNet's wider variety of document layouts leads to more robust layout detection models. In Table 5, we provide evidence for that. We trained models on each of the available datasets (PubLayNet, DocBank and DocLayNet) and evaluated them on the test sets of the other datasets. Due to the different label sets and annotation styles, a direct comparison is not possible. Hence, we focussed on the common labels among the datasets. Between PubLayNet and DocLayNet, these are Picture ,</text>
-<table>
-<location><page_8><loc_12><loc_57><loc_45><loc_78></location>
-<caption>Table 5: Prediction Performance (mAP@0.5-0.95) of a Mask R-CNN R50 network across the PubLayNet, DocBank & DocLayNet data-sets. By evaluating on common label classes of each dataset, we observe that the DocLayNet-trained model has much less pronounced variations in performance across all datasets.</caption>
-<row_0><col_0><body></col_0><col_1><body></col_1><col_2><col_header>Testing on</col_2><col_3><col_header>Testing on</col_3><col_4><col_header>Testing on</col_4></row_0>
-<row_1><col_0><col_header>Training on</col_0><col_1><col_header>labels</col_1><col_2><col_header>PLN</col_2><col_3><col_header>DB</col_3><col_4><col_header>DLN</col_4></row_1>
-<row_2><col_0><row_header>PubLayNet (PLN)</col_0><col_1><row_header>Figure</col_1><col_2><body>96</col_2><col_3><body>43</col_3><col_4><body>23</col_4></row_2>
-<row_3><col_0><row_header>PubLayNet (PLN)</col_0><col_1><row_header>Sec-header</col_1><col_2><body>87</col_2><col_3><body>-</col_3><col_4><body>32</col_4></row_3>
-<row_4><col_0><row_header>PubLayNet (PLN)</col_0><col_1><row_header>Table</col_1><col_2><body>95</col_2><col_3><body>24</col_3><col_4><body>49</col_4></row_4>
-<row_5><col_0><row_header>PubLayNet (PLN)</col_0><col_1><row_header>Text</col_1><col_2><body>96</col_2><col_3><body>-</col_3><col_4><body>42</col_4></row_5>
-<row_6><col_0><row_header>PubLayNet (PLN)</col_0><col_1><row_header>total</col_1><col_2><body>93</col_2><col_3><body>34</col_3><col_4><body>30</col_4></row_6>
-<row_7><col_0><row_header>DocBank (DB)</col_0><col_1><row_header>Figure</col_1><col_2><body>77</col_2><col_3><body>71</col_3><col_4><body>31</col_4></row_7>
-<row_8><col_0><row_header>DocBank (DB)</col_0><col_1><row_header>Table</col_1><col_2><body>19</col_2><col_3><body>65</col_3><col_4><body>22</col_4></row_8>
-<row_9><col_0><row_header>DocBank (DB)</col_0><col_1><row_header>total</col_1><col_2><body>48</col_2><col_3><body>68</col_3><col_4><body>27</col_4></row_9>
-<row_10><col_0><row_header>DocLayNet (DLN)</col_0><col_1><row_header>Figure</col_1><col_2><body>67</col_2><col_3><body>51</col_3><col_4><body>72</col_4></row_10>
-<row_11><col_0><row_header>DocLayNet (DLN)</col_0><col_1><row_header>Sec-header</col_1><col_2><body>53</col_2><col_3><body>-</col_3><col_4><body>68</col_4></row_11>
-<row_12><col_0><row_header>DocLayNet (DLN)</col_0><col_1><row_header>Table</col_1><col_2><body>87</col_2><col_3><body>43</col_3><col_4><body>82</col_4></row_12>
-<row_13><col_0><row_header>DocLayNet (DLN)</col_0><col_1><row_header>Text</col_1><col_2><body>77</col_2><col_3><body>-</col_3><col_4><body>84</col_4></row_13>
-<row_14><col_0><row_header>DocLayNet (DLN)</col_0><col_1><row_header>total</col_1><col_2><body>59</col_2><col_3><body>47</col_3><col_4><body>78</col_4></row_14>
-</table>
-<text><location><page_8><loc_9><loc_44><loc_48><loc_51></location>Section-header , Table and Text . Before training, we either mapped or excluded DocLayNet's other labels as specified in table 3, and also PubLayNet's List to Text . Note that the different clustering of lists (by list-element vs. whole list objects) naturally decreases the mAP score for Text .</text>
-<text><location><page_8><loc_9><loc_26><loc_48><loc_44></location>For comparison of DocBank with DocLayNet, we trained only on Picture and Table clusters of each dataset. We had to exclude Text because successive paragraphs are often grouped together into a single object in DocBank. This paragraph grouping is incompatible with the individual paragraphs of DocLayNet. As can be seen in Table 5, DocLayNet trained models yield better performance compared to the previous datasets. It is noteworthy that the models trained on PubLayNet and DocBank perform very well on their own test set, but have a much lower performance on the foreign datasets. While this also applies to DocLayNet, the difference is far less pronounced. Thus we conclude that DocLayNet trained models are overall more robust and will produce better results for challenging, unseen layouts.</text>
-<section_header_level_1><location><page_8><loc_9><loc_22><loc_25><loc_24></location>Example Predictions</section_header_level_1>
-<text><location><page_8><loc_9><loc_11><loc_48><loc_22></location>To conclude this section, we illustrate the quality of layout predictions one can expect from DocLayNet-trained models by providing a selection of examples without any further post-processing applied. Figure 6 shows selected layout predictions on pages from the test-set of DocLayNet. Results look decent in general across document categories, however one can also observe mistakes such as overlapping clusters of different classes, or entirely missing boxes due to low confidence.</text>
-<section_header_level_1><location><page_8><loc_52><loc_88><loc_66><loc_89></location>6 CONCLUSION</section_header_level_1>
-<text><location><page_8><loc_52><loc_76><loc_91><loc_87></location>In this paper, we presented the DocLayNet dataset. It provides the document conversion and layout analysis research community a new and challenging dataset to improve and fine-tune novel ML methods on. In contrast to many other datasets, DocLayNet was created by human annotation in order to obtain reliable layout ground-truth on a wide variety of publication- and typesettingstyles. Including a large proportion of documents outside the scientific publishing domain adds significant value in this respect.</text>
-<text><location><page_8><loc_52><loc_64><loc_91><loc_76></location>From the dataset, we have derived on the one hand reference metrics for human performance on document-layout annotation (through double and triple annotations) and on the other hand evaluated the baseline performance of commonly used object detection methods. We also illustrated the impact of various dataset-related aspects on model performance through data-ablation experiments, both from a size and class-label perspective. Last but not least, we compared the accuracy of models trained on other public datasets and showed that DocLayNet trained models are more robust.</text>
-<text><location><page_8><loc_52><loc_60><loc_91><loc_64></location>To date, there is still a significant gap between human and ML accuracy on the layout interpretation task, and we hope that this work will inspire the research community to close that gap.</text>
-<section_header_level_1><location><page_8><loc_52><loc_56><loc_63><loc_58></location>REFERENCES</section_header_level_1>
-<unordered_list>
-<list_item><location><page_8><loc_52><loc_53><loc_91><loc_56></location>[1] Max Göbel, Tamir Hassan, Ermelinda Oro, and Giorgio Orsi. Icdar 2013 table competition. In 2013 12th International Conference on Document Analysis and Recognition , pages 1449-1453, 2013.</list_item>
-<list_item><location><page_8><loc_52><loc_49><loc_91><loc_53></location>[2] Christian Clausner, Apostolos Antonacopoulos, and Stefan Pletschacher. Icdar2017 competition on recognition of documents with complex layouts rdcl2017. In 2017 14th IAPR International Conference on Document Analysis and Recognition (ICDAR) , volume 01, pages 1404-1410, 2017.</list_item>
-<list_item><location><page_8><loc_52><loc_46><loc_91><loc_49></location>[3] Hervé Déjean, Jean-Luc Meunier, Liangcai Gao, Yilun Huang, Yu Fang, Florian Kleber, and Eva-Maria Lang. ICDAR 2019 Competition on Table Detection and Recognition (cTDaR), April 2019. http://sac.founderit.com/.</list_item>
-<list_item><location><page_8><loc_52><loc_42><loc_91><loc_46></location>[4] Antonio Jimeno Yepes, Peter Zhong, and Douglas Burdick. Competition on scientific literature parsing. In Proceedings of the International Conference on Document Analysis and Recognition , ICDAR, pages 605-617. LNCS 12824, SpringerVerlag, sep 2021.</list_item>
-<list_item><location><page_8><loc_52><loc_38><loc_91><loc_42></location>[5] Logan Markewich, Hao Zhang, Yubin Xing, Navid Lambert-Shirzad, Jiang Zhexin, Roy Lee, Zhi Li, and Seok-Bum Ko. Segmentation for document layout analysis: not dead yet. International Journal on Document Analysis and Recognition (IJDAR) , pages 1-11, 01 2022.</list_item>
-<list_item><location><page_8><loc_52><loc_35><loc_91><loc_38></location>[6] Xu Zhong, Jianbin Tang, and Antonio Jimeno-Yepes. Publaynet: Largest dataset ever for document layout analysis. In Proceedings of the International Conference on Document Analysis and Recognition , ICDAR, pages 1015-1022, sep 2019.</list_item>
-<list_item><location><page_8><loc_52><loc_30><loc_91><loc_35></location>[7] Minghao Li, Yiheng Xu, Lei Cui, Shaohan Huang, Furu Wei, Zhoujun Li, and Ming Zhou. Docbank: A benchmark dataset for document layout analysis. In Proceedings of the 28th International Conference on Computational Linguistics , COLING, pages 949-960. International Committee on Computational Linguistics, dec 2020.</list_item>
-<list_item><location><page_8><loc_52><loc_27><loc_91><loc_30></location>[8] Riaz Ahmad, Muhammad Tanvir Afzal, and M. Qadir. Information extraction from pdf sources based on rule-based system using integrated formats. In SemWebEval@ESWC , 2016.</list_item>
-<list_item><location><page_8><loc_52><loc_23><loc_91><loc_27></location>[9] Ross B. Girshick, Jeff Donahue, Trevor Darrell, and Jitendra Malik. Rich feature hierarchies for accurate object detection and semantic segmentation. In IEEE Conference on Computer Vision and Pattern Recognition , CVPR, pages 580-587. IEEE Computer Society, jun 2014.</list_item>
-<list_item><location><page_8><loc_52><loc_21><loc_91><loc_23></location>[10] Ross B. Girshick. Fast R-CNN. In 2015 IEEE International Conference on Computer Vision , ICCV, pages 1440-1448. IEEE Computer Society, dec 2015.</list_item>
-<list_item><location><page_8><loc_52><loc_18><loc_91><loc_21></location>[11] Shaoqing Ren, Kaiming He, Ross Girshick, and Jian Sun. Faster r-cnn: Towards real-time object detection with region proposal networks. IEEE Transactions on Pattern Analysis and Machine Intelligence , 39(6):1137-1149, 2017.</list_item>
-<list_item><location><page_8><loc_52><loc_15><loc_91><loc_18></location>[12] Kaiming He, Georgia Gkioxari, Piotr Dollár, and Ross B. Girshick. Mask R-CNN. In IEEE International Conference on Computer Vision , ICCV, pages 2980-2988. IEEE Computer Society, Oct 2017.</list_item>
-<list_item><location><page_8><loc_52><loc_11><loc_91><loc_15></location>[13] Glenn Jocher, Alex Stoken, Ayush Chaurasia, Jirka Borovec, NanoCode012, TaoXie, Yonghye Kwon, Kalen Michael, Liu Changyu, Jiacong Fang, Abhiram V, Laughing, tkianai, yxNONG, Piotr Skalski, Adam Hogan, Jebastin Nadar, imyhxy, Lorenzo Mammana, Alex Wang, Cristi Fati, Diego Montes, Jan Hajek, Laurentiu</list_item>
+<text><loc_44><loc_336><loc_241><loc_363>The complete annotation guideline is over 100 pages long and a detailed description is obviously out of scope for this paper. Nevertheless, it will be made publicly available alongside with DocLayNet for future reference.</text>
+<text><loc_44><loc_364><loc_241><loc_446>Phase 3: Training. After a first trial with a small group of people, we realised that providing the annotation guideline and a set of random practice pages did not yield the desired quality level for layout annotation. Therefore we prepared a subset of pages with two different complexity levels, each with a practice and an exam part. 974 pages were reference-annotated by one proficient core team member. Annotation staff were then given the task to annotate the same subsets (blinded from the reference). By comparing the annotations of each staff member with the reference annotations, we could quantify how closely their annotations matched the reference. Only after passing two exam levels with high annotation quality, staff were admitted into the production phase. Practice iterations</text>
+<picture><loc_258><loc_54><loc_457><loc_290></picture>
+<text><loc_327><loc_289><loc_389><loc_291>05237a14f2524e3f53c8454b074409d05078038a6a36b770fcc8ec7e540deae0</text>
+<caption><loc_260><loc_299><loc_457><loc_318>Figure 4: Examples of plausible annotation alternatives for the same page. Criteria in our annotation guideline can resolve cases A to C, while the case D remains ambiguous.</caption>
+<text><loc_259><loc_332><loc_456><loc_344>were carried out over a timeframe of 12 weeks, after which 8 of the 40 initially allocated annotators did not pass the bar.</text>
+<text><loc_259><loc_346><loc_457><loc_448>Phase 4: Production annotation. The previously selected 80K pages were annotated with the defined 11 class labels by 32 annotators. This production phase took around three months to complete. All annotations were created online through CCS, which visualises the programmatic PDF text-cells as an overlay on the page. The page annotation are obtained by drawing rectangular bounding-boxes, as shown in Figure 3. With regard to the annotation practices, we implemented a few constraints and capabilities on the tooling level. First, we only allow non-overlapping, vertically oriented, rectangular boxes. For the large majority of documents, this constraint was sufficient and it speeds up the annotation considerably in comparison with arbitrary segmentation shapes. Second, annotator staff were not able to see each other's annotations. This was enforced by design to avoid any bias in the annotation, which could skew the numbers of the inter-annotator agreement (see Table 1). We wanted</text>
+<page_break>
+<page_header><loc_44><loc_38><loc_456><loc_43>KDD '22, August 14-18, 2022, Washington, DC, USA Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar</page_header>
+<text><loc_44><loc_55><loc_242><loc_116>Table 2: Prediction performance (mAP@0.5-0.95) of object detection networks on DocLayNet test set. The MRCNN (Mask R-CNN) and FRCNN (Faster R-CNN) models with ResNet-50 or ResNet-101 backbone were trained based on the network architectures from the detectron2 model zoo (Mask R-CNN R50, R101-FPN 3x, Faster R-CNN R101-FPN 3x), with default configurations. The YOLO implementation utilized was YOLOv5x6 [13]. All models were initialised using pre-trained weights from the COCO 2017 dataset.</text>
+<otsl><loc_51><loc_124><loc_233><loc_222><ecel><ched>human<ched>MRCNN<lcel><ched>FRCNN<ched>YOLO<nl><ecel><ucel><ched>R50<ched>R101<ched>R101<ched>v5x6<nl><rhed>Caption<fcel>84-89<fcel>68.4<fcel>71.5<fcel>70.1<fcel>77.7<nl><rhed>Footnote<fcel>83-91<fcel>70.9<fcel>71.8<fcel>73.7<fcel>77.2<nl><rhed>Formula<fcel>83-85<fcel>60.1<fcel>63.4<fcel>63.5<fcel>66.2<nl><rhed>List-item<fcel>87-88<fcel>81.2<fcel>80.8<fcel>81.0<fcel>86.2<nl><rhed>Page-footer<fcel>93-94<fcel>61.6<fcel>59.3<fcel>58.9<fcel>61.1<nl><rhed>Page-header<fcel>85-89<fcel>71.9<fcel>70.0<fcel>72.0<fcel>67.9<nl><rhed>Picture<fcel>69-71<fcel>71.7<fcel>72.7<fcel>72.0<fcel>77.1<nl><rhed>Section-header<fcel>83-84<fcel>67.6<fcel>69.3<fcel>68.4<fcel>74.6<nl><rhed>Table<fcel>77-81<fcel>82.2<fcel>82.9<fcel>82.2<fcel>86.3<nl><rhed>Text<fcel>84-86<fcel>84.6<fcel>85.8<fcel>85.4<fcel>88.1<nl><rhed>Title<fcel>60-72<fcel>76.7<fcel>80.4<fcel>79.9<fcel>82.7<nl><rhed>All<fcel>82-83<fcel>72.4<fcel>73.5<fcel>73.4<fcel>76.8<nl></otsl>
+<text><loc_44><loc_234><loc_241><loc_364>to avoid this at any cost in order to have clear, unbiased baseline numbers for human document-layout annotation. Third, we introduced the feature of snapping boxes around text segments to obtain a pixel-accurate annotation and again reduce time and effort. The CCS annotation tool automatically shrinks every user-drawn box to the minimum bounding-box around the enclosed text-cells for all purely text-based segments, which excludes only Table and Picture . For the latter, we instructed annotation staff to minimise inclusion of surrounding whitespace while including all graphical lines. A downside of snapping boxes to enclosed text cells is that some wrongly parsed PDF pages cannot be annotated correctly and need to be skipped. Fourth, we established a way to flag pages as rejected for cases where no valid annotation according to the label guidelines could be achieved. Example cases for this would be PDF pages that render incorrectly or contain layouts that are impossible to capture with non-overlapping rectangles. Such rejected pages are not contained in the final dataset. With all these measures in place, experienced annotation staff managed to annotate a single page in a typical timeframe of 20s to 60s, depending on its complexity.</text>
+<section_header_level_1><loc_44><loc_371><loc_120><loc_378>5 EXPERIMENTS</section_header_level_1>
+<text><loc_44><loc_387><loc_241><loc_448>The primary goal of DocLayNet is to obtain high-quality ML models capable of accurate document-layout analysis on a wide variety of challenging layouts. As discussed in Section 2, object detection models are currently the easiest to use, due to the standardisation of ground-truth data in COCO format [16] and the availability of general frameworks such as detectron2 [17]. Furthermore, baseline numbers in PubLayNet and DocBank were obtained using standard object detection models such as Mask R-CNN and Faster R-CNN. As such, we will relate to these object detection methods in this</text>
+<picture><loc_264><loc_57><loc_452><loc_164><caption><loc_260><loc_176><loc_457><loc_216>Figure 5: Prediction performance (mAP@0.5-0.95) of a Mask R-CNN network with ResNet50 backbone trained on increasing fractions of the DocLayNet dataset. The learning curve flattens around the 80% mark, indicating that increasing the size of the DocLayNet dataset with similar data will not yield significantly better predictions.</caption></picture>
+<text><loc_260><loc_242><loc_456><loc_255>paper and leave the detailed evaluation of more recent methods mentioned in Section 2 for future work.</text>
+<text><loc_260><loc_256><loc_456><loc_303>In this section, we will present several aspects related to the performance of object detection models on DocLayNet. Similarly as in PubLayNet, we will evaluate the quality of their predictions using mean average precision (mAP) with 10 overlaps that range from 0.5 to 0.95 in steps of 0.05 (mAP@0.5-0.95). These scores are computed by leveraging the evaluation code provided by the COCO API [16].</text>
+<section_header_level_1><loc_260><loc_314><loc_381><loc_320>Baselines for Object Detection</section_header_level_1>
+<text><loc_260><loc_323><loc_456><loc_446>In Table 2, we present baseline experiments (given in mAP) on Mask R-CNN [12], Faster R-CNN [11], and YOLOv5 [13]. Both training and evaluation were performed on RGB images with dimensions of 1025 × 1025 pixels. For training, we only used one annotation in case of redundantly annotated pages. As one can observe, the variation in mAP between the models is rather low, but overall between 6 and 10% lower than the mAP computed from the pairwise human annotations on triple-annotated pages. This gives a good indication that the DocLayNet dataset poses a worthwhile challenge for the research community to close the gap between human recognition and ML approaches. It is interesting to see that Mask R-CNN and Faster R-CNN produce very comparable mAP scores, indicating that pixel-based image segmentation derived from bounding-boxes does not help to obtain better predictions. On the other hand, the more recent Yolov5x model does very well and even out-performs humans on selected labels such as Text , Table and Picture . This is not entirely surprising, as Text , Table and Picture are abundant and the most visually distinctive in a document.</text>
+<page_break>
+<page_header><loc_44><loc_38><loc_284><loc_43>DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis</page_header>
+<page_header><loc_299><loc_38><loc_456><loc_43>KDD ’22, August 14-18, 2022, Washington, DC, USA</page_header>
+<text><loc_44><loc_55><loc_242><loc_81>Table 3: Performance of a Mask R-CNN R50 network in mAP@0.5-0.95 scores trained on DocLayNet with different class label sets. The reduced label sets were obtained by either down-mapping or dropping labels.</text>
+<otsl><loc_66><loc_95><loc_218><loc_187><ched>Class-count<ched>11<ched>6<ched>5<ched>4<nl><rhed>Caption<fcel>68<fcel>Text<fcel>Text<fcel>Text<nl><rhed>Footnote<fcel>71<fcel>Text<fcel>Text<fcel>Text<nl><rhed>Formula<fcel>60<fcel>Text<fcel>Text<fcel>Text<nl><rhed>List-item<fcel>81<fcel>Text<fcel>82<fcel>Text<nl><rhed>Page-footer<fcel>62<fcel>62<fcel>-<fcel>-<nl><rhed>Page-header<fcel>72<fcel>68<fcel>-<fcel>-<nl><rhed>Picture<fcel>72<fcel>72<fcel>72<fcel>72<nl><rhed>Section-header<fcel>68<fcel>67<fcel>69<fcel>68<nl><rhed>Table<fcel>82<fcel>83<fcel>82<fcel>82<nl><rhed>Text<fcel>85<fcel>84<fcel>84<fcel>84<nl><rhed>Title<fcel>77<fcel>Sec.-h.<fcel>Sec.-h.<fcel>Sec.-h.<nl><rhed>Overall<fcel>72<fcel>73<fcel>78<fcel>77<nl></otsl>
+<section_header_level_1><loc_44><loc_202><loc_107><loc_208>Learning Curve</section_header_level_1>
+<text><loc_43><loc_211><loc_241><loc_334>One of the fundamental questions related to any dataset is if it is "large enough". To answer this question for DocLayNet, we performed a data ablation study in which we evaluated a Mask R-CNN model trained on increasing fractions of the DocLayNet dataset. As can be seen in Figure 5, the mAP score rises sharply in the beginning and eventually levels out. To estimate the error-bar on the metrics, we ran the training five times on the entire data-set. This resulted in a 1% error-bar, depicted by the shaded area in Figure 5. In the inset of Figure 5, we show the exact same data-points, but with a logarithmic scale on the x-axis. As is expected, the mAP score increases linearly as a function of the data-size in the inset. The curve ultimately flattens out between the 80% and 100% mark, with the 80% mark falling within the error-bars of the 100% mark. This provides a good indication that the model would not improve significantly by yet increasing the data size. Rather, it would probably benefit more from improved data consistency (as discussed in Section 3), data augmentation methods [23], or the addition of more document categories and styles.</text>
+<section_header_level_1><loc_44><loc_342><loc_134><loc_349>Impact of Class Labels</section_header_level_1>
+<text><loc_44><loc_352><loc_241><loc_447>The choice and number of labels can have a significant effect on the overall model performance. Since PubLayNet, DocBank and DocLayNet all have different label sets, it is of particular interest to understand and quantify this influence of the label set on the model performance. We investigate this by either down-mapping labels into more common ones (e.g. Caption → Text ) or excluding them from the annotations entirely. Furthermore, it must be stressed that all mappings and exclusions were performed on the data before model training. In Table 3, we present the mAP scores for a Mask R-CNN R50 network on different label sets. Where a label is down-mapped, we show its corresponding label, otherwise it was excluded. We present three different label sets, with 6, 5 and 4 different labels respectively. The set of 5 labels contains the same labels as PubLayNet. However, due to the different definition of</text>
+<text><loc_260><loc_55><loc_457><loc_81>Table 4: Performance of a Mask R-CNN R50 network with document-wise and page-wise split for different label sets. Naive page-wise split will result in GLYPH<tildelow> 10% point improvement.</text>
+<otsl><loc_288><loc_95><loc_427><loc_193><fcel>Class-count<ched>11<lcel><ched>5<lcel><nl><fcel>Split<ched>Doc<ched>Page<ched>Doc<ched>Page<nl><rhed>Caption<fcel>68<fcel>83<ecel><ecel><nl><rhed>Footnote<fcel>71<fcel>84<ecel><ecel><nl><rhed>Formula<fcel>60<fcel>66<ecel><ecel><nl><rhed>List-item<fcel>81<fcel>88<fcel>82<fcel>88<nl><rhed>Page-footer<fcel>62<fcel>89<ecel><ecel><nl><rhed>Page-header<fcel>72<fcel>90<ecel><ecel><nl><rhed>Picture<fcel>72<fcel>82<fcel>72<fcel>82<nl><rhed>Section-header<fcel>68<fcel>83<fcel>69<fcel>83<nl><rhed>Table<fcel>82<fcel>89<fcel>82<fcel>90<nl><rhed>Text<fcel>85<fcel>91<fcel>84<fcel>90<nl><rhed>Title<fcel>77<fcel>81<ecel><ecel><nl><rhed>All<fcel>72<fcel>84<fcel>78<fcel>87<nl></otsl>
+<text><loc_260><loc_209><loc_457><loc_263>lists in PubLayNet (grouped list-items) versus DocLayNet (separate list-items), the label set of size 4 is the closest to PubLayNet, in the assumption that the List is down-mapped to Text in PubLayNet. The results in Table 3 show that the prediction accuracy on the remaining class labels does not change significantly when other classes are merged into them. The overall macro-average improves by around 5%, in particular when Page-footer and Page-header are excluded.</text>
+<section_header_level_1><loc_260><loc_271><loc_449><loc_278>Impact of Document Split in Train and Test Set</section_header_level_1>
+<text><loc_259><loc_281><loc_457><loc_376>Many documents in DocLayNet have a unique styling. In order to avoid overfitting on a particular style, we have split the train-, test- and validation-sets of DocLayNet on document boundaries, i.e. every document contributes pages to only one set. To the best of our knowledge, this was not considered in PubLayNet or DocBank. To quantify how this affects model performance, we trained and evaluated a Mask R-CNN R50 model on a modified dataset version. Here, the train-, test- and validation-sets were obtained by a randomised draw over the individual pages. As can be seen in Table 4, the difference in model performance is surprisingly large: pagewise splitting gains ˜ 10% in mAP over the document-wise splitting. Thus, random page-wise splitting of DocLayNet can easily lead to accidental overestimation of model performance and should be avoided.</text>
+<section_header_level_1><loc_260><loc_384><loc_342><loc_391>Dataset Comparison</section_header_level_1>
+<text><loc_260><loc_394><loc_457><loc_447>Throughout this paper, we claim that DocLayNet's wider variety of document layouts leads to more robust layout detection models. In Table 5, we provide evidence for that. We trained models on each of the available datasets (PubLayNet, DocBank and DocLayNet) and evaluated them on the test sets of the other datasets. Due to the different label sets and annotation styles, a direct comparison is not possible. Hence, we focussed on the common labels among the datasets. Between PubLayNet and DocLayNet, these are Picture ,</text>
+<page_break>
+<page_header><loc_44><loc_38><loc_456><loc_43>KDD '22, August 14-18, 2022, Washington, DC, USA Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar</page_header>
+<text><loc_44><loc_55><loc_242><loc_95>Table 5: Prediction Performance (mAP@0.5-0.95) of a Mask R-CNN R50 network across the PubLayNet, DocBank & DocLayNet data-sets. By evaluating on common label classes of each dataset, we observe that the DocLayNet-trained model has much less pronounced variations in performance across all datasets.</text>
+<otsl><loc_59><loc_109><loc_225><loc_215><ecel><ecel><ched>Testing on<lcel><lcel><nl><ched>Training on<ched>labels<ched>PLN<ched>DB<ched>DLN<nl><rhed>PubLayNet (PLN)<rhed>Figure<fcel>96<fcel>43<fcel>23<nl><ucel><rhed>Sec-header<fcel>87<fcel>-<fcel>32<nl><ucel><rhed>Table<fcel>95<fcel>24<fcel>49<nl><ucel><rhed>Text<fcel>96<fcel>-<fcel>42<nl><ucel><rhed>total<fcel>93<fcel>34<fcel>30<nl><rhed>DocBank (DB)<rhed>Figure<fcel>77<fcel>71<fcel>31<nl><ucel><rhed>Table<fcel>19<fcel>65<fcel>22<nl><ucel><rhed>total<fcel>48<fcel>68<fcel>27<nl><rhed>DocLayNet (DLN)<rhed>Figure<fcel>67<fcel>51<fcel>72<nl><ucel><rhed>Sec-header<fcel>53<fcel>-<fcel>68<nl><ucel><rhed>Table<fcel>87<fcel>43<fcel>82<nl><ucel><rhed>Text<fcel>77<fcel>-<fcel>84<nl><ucel><rhed>total<fcel>59<fcel>47<fcel>78<nl></otsl>
+<text><loc_44><loc_247><loc_240><loc_280>Section-header , Table and Text . Before training, we either mapped or excluded DocLayNet's other labels as specified in table 3, and also PubLayNet's List to Text . Note that the different clustering of lists (by list-element vs. whole list objects) naturally decreases the mAP score for Text .</text>
+<text><loc_44><loc_281><loc_241><loc_370>For comparison of DocBank with DocLayNet, we trained only on Picture and Table clusters of each dataset. We had to exclude Text because successive paragraphs are often grouped together into a single object in DocBank. This paragraph grouping is incompatible with the individual paragraphs of DocLayNet. As can be seen in Table 5, DocLayNet trained models yield better performance compared to the previous datasets. It is noteworthy that the models trained on PubLayNet and DocBank perform very well on their own test set, but have a much lower performance on the foreign datasets. While this also applies to DocLayNet, the difference is far less pronounced. Thus we conclude that DocLayNet trained models are overall more robust and will produce better results for challenging, unseen layouts.</text>
+<section_header_level_1><loc_44><loc_382><loc_127><loc_388>Example Predictions</section_header_level_1>
+<text><loc_44><loc_392><loc_241><loc_445>To conclude this section, we illustrate the quality of layout predictions one can expect from DocLayNet-trained models by providing a selection of examples without any further post-processing applied. Figure 6 shows selected layout predictions on pages from the test-set of DocLayNet. Results look decent in general across document categories, however one can also observe mistakes such as overlapping clusters of different classes, or entirely missing boxes due to low confidence.</text>
+<section_header_level_1><loc_260><loc_54><loc_331><loc_61>6 CONCLUSION</section_header_level_1>
+<text><loc_260><loc_64><loc_457><loc_118>In this paper, we presented the DocLayNet dataset. It provides the document conversion and layout analysis research community a new and challenging dataset to improve and fine-tune novel ML methods on. In contrast to many other datasets, DocLayNet was created by human annotation in order to obtain reliable layout ground-truth on a wide variety of publication- and typesettingstyles. Including a large proportion of documents outside the scientific publishing domain adds significant value in this respect.</text>
+<text><loc_260><loc_119><loc_457><loc_180>From the dataset, we have derived on the one hand reference metrics for human performance on document-layout annotation (through double and triple annotations) and on the other hand evaluated the baseline performance of commonly used object detection methods. We also illustrated the impact of various dataset-related aspects on model performance through data-ablation experiments, both from a size and class-label perspective. Last but not least, we compared the accuracy of models trained on other public datasets and showed that DocLayNet trained models are more robust.</text>
+<text><loc_259><loc_181><loc_456><loc_201>To date, there is still a significant gap between human and ML accuracy on the layout interpretation task, and we hope that this work will inspire the research community to close that gap.</text>
+<section_header_level_1><loc_260><loc_212><loc_316><loc_218>REFERENCES</section_header_level_1>
+<unordered_list><list_item><loc_262><loc_220><loc_456><loc_234>[1] Max Göbel, Tamir Hassan, Ermelinda Oro, and Giorgio Orsi. Icdar 2013 table competition. In 2013 12th International Conference on Document Analysis and Recognition , pages 1449-1453, 2013.</list_item>
+<list_item><loc_262><loc_235><loc_457><loc_254>[2] Christian Clausner, Apostolos Antonacopoulos, and Stefan Pletschacher. Icdar2017 competition on recognition of documents with complex layouts rdcl2017. In 2017 14th IAPR International Conference on Document Analysis and Recognition (ICDAR) , volume 01, pages 1404-1410, 2017.</list_item>
+<list_item><loc_262><loc_255><loc_456><loc_270>[3] Hervé Déjean, Jean-Luc Meunier, Liangcai Gao, Yilun Huang, Yu Fang, Florian Kleber, and Eva-Maria Lang. ICDAR 2019 Competition on Table Detection and Recognition (cTDaR), April 2019. http://sac.founderit.com/.</list_item>
+<list_item><loc_262><loc_270><loc_457><loc_290>[4] Antonio Jimeno Yepes, Peter Zhong, and Douglas Burdick. Competition on scientific literature parsing. In Proceedings of the International Conference on Document Analysis and Recognition , ICDAR, pages 605-617. LNCS 12824, SpringerVerlag, sep 2021.</list_item>
+<list_item><loc_262><loc_291><loc_457><loc_310>[5] Logan Markewich, Hao Zhang, Yubin Xing, Navid Lambert-Shirzad, Jiang Zhexin, Roy Lee, Zhi Li, and Seok-Bum Ko. Segmentation for document layout analysis: not dead yet. International Journal on Document Analysis and Recognition (IJDAR) , pages 1-11, 01 2022.</list_item>
+<list_item><loc_262><loc_311><loc_456><loc_325>[6] Xu Zhong, Jianbin Tang, and Antonio Jimeno-Yepes. Publaynet: Largest dataset ever for document layout analysis. In Proceedings of the International Conference on Document Analysis and Recognition , ICDAR, pages 1015-1022, sep 2019.</list_item>
+<list_item><loc_262><loc_326><loc_457><loc_350>[7] Minghao Li, Yiheng Xu, Lei Cui, Shaohan Huang, Furu Wei, Zhoujun Li, and Ming Zhou. Docbank: A benchmark dataset for document layout analysis. In Proceedings of the 28th International Conference on Computational Linguistics , COLING, pages 949-960. International Committee on Computational Linguistics, dec 2020.</list_item>
+<list_item><loc_262><loc_351><loc_457><loc_365>[8] Riaz Ahmad, Muhammad Tanvir Afzal, and M. Qadir. Information extraction from pdf sources based on rule-based system using integrated formats. In SemWebEval@ESWC , 2016.</list_item>
+<list_item><loc_262><loc_366><loc_457><loc_385>[9] Ross B. Girshick, Jeff Donahue, Trevor Darrell, and Jitendra Malik. Rich feature hierarchies for accurate object detection and semantic segmentation. In IEEE Conference on Computer Vision and Pattern Recognition , CVPR, pages 580-587. IEEE Computer Society, jun 2014.</list_item>
+<list_item><loc_260><loc_386><loc_456><loc_395>[10] Ross B. Girshick. Fast R-CNN. In 2015 IEEE International Conference on Computer Vision , ICCV, pages 1440-1448. IEEE Computer Society, dec 2015.</list_item>
+<list_item><loc_260><loc_396><loc_456><loc_410>[11] Shaoqing Ren, Kaiming He, Ross Girshick, and Jian Sun. Faster r-cnn: Towards real-time object detection with region proposal networks. IEEE Transactions on Pattern Analysis and Machine Intelligence , 39(6):1137-1149, 2017.</list_item>
+<list_item><loc_260><loc_411><loc_457><loc_426>[12] Kaiming He, Georgia Gkioxari, Piotr Dollár, and Ross B. Girshick. Mask R-CNN. In IEEE International Conference on Computer Vision , ICCV, pages 2980-2988. IEEE Computer Society, Oct 2017.</list_item>
+<list_item><loc_260><loc_426><loc_457><loc_446>[13] Glenn Jocher, Alex Stoken, Ayush Chaurasia, Jirka Borovec, NanoCode012, TaoXie, Yonghye Kwon, Kalen Michael, Liu Changyu, Jiacong Fang, Abhiram V, Laughing, tkianai, yxNONG, Piotr Skalski, Adam Hogan, Jebastin Nadar, imyhxy, Lorenzo Mammana, Alex Wang, Cristi Fati, Diego Montes, Jan Hajek, Laurentiu</list_item>
 </unordered_list>
-<figure>
-<location><page_9><loc_9><loc_44><loc_91><loc_89></location>
-<caption>Text Caption List-Item Formula Table Section-Header Picture Page-Header Page-Footer Title</caption>
-</figure>
-<text><location><page_9><loc_9><loc_36><loc_91><loc_41></location>Figure 6: Example layout predictions on selected pages from the DocLayNet test-set. (A, D) exhibit favourable results on coloured backgrounds. (B, C) show accurate list-item and paragraph differentiation despite densely-spaced lines. (E) demonstrates good table and figure distinction. (F) shows predictions on a Chinese patent with multiple overlaps, label confusion and missing boxes.</text>
-<text><location><page_9><loc_11><loc_31><loc_48><loc_33></location>Diaconu, Mai Thanh Minh, Marc, albinxavi, fatih, oleg, and wanghao yang. ultralytics/yolov5: v6.0 - yolov5n nano models, roboflow integration, tensorflow export, opencv dnn support, October 2021.</text>
-<unordered_list>
-<list_item><location><page_9><loc_9><loc_28><loc_48><loc_30></location>[14] Nicolas Carion, Francisco Massa, Gabriel Synnaeve, Nicolas Usunier, Alexander Kirillov, and Sergey Zagoruyko. End-to-end object detection with transformers. CoRR , abs/2005.12872, 2020.</list_item>
-<list_item><location><page_9><loc_9><loc_26><loc_48><loc_27></location>[15] Mingxing Tan, Ruoming Pang, and Quoc V. Le. Efficientdet: Scalable and efficient object detection. CoRR , abs/1911.09070, 2019.</list_item>
-<list_item><location><page_9><loc_9><loc_23><loc_48><loc_25></location>[16] Tsung-Yi Lin, Michael Maire, Serge J. Belongie, Lubomir D. Bourdev, Ross B. Girshick, James Hays, Pietro Perona, Deva Ramanan, Piotr Dollár, and C. Lawrence Zitnick. Microsoft COCO: common objects in context, 2014.</list_item>
-<list_item><location><page_9><loc_9><loc_21><loc_48><loc_22></location>[17] Yuxin Wu, Alexander Kirillov, Francisco Massa, Wan-Yen Lo, and Ross Girshick. Detectron2, 2019.</list_item>
-<list_item><location><page_9><loc_9><loc_16><loc_48><loc_20></location>[18] Nikolaos Livathinos, Cesar Berrospi, Maksym Lysak, Viktor Kuropiatnyk, Ahmed Nassar, Andre Carvalho, Michele Dolfi, Christoph Auer, Kasper Dinkla, and Peter W. J. Staar. Robust pdf document conversion using recurrent neural networks. In Proceedings of the 35th Conference on Artificial Intelligence , AAAI, pages 1513715145, feb 2021.</list_item>
-<list_item><location><page_9><loc_9><loc_10><loc_48><loc_15></location>[19] Yiheng Xu, Minghao Li, Lei Cui, Shaohan Huang, Furu Wei, and Ming Zhou. Layoutlm: Pre-training of text and layout for document image understanding. In Proceedings of the 26th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining , KDD, pages 1192-1200, New York, USA, 2020. Association for Computing Machinery.</list_item>
-<list_item><location><page_9><loc_52><loc_32><loc_91><loc_33></location>[20] Shoubin Li, Xuyan Ma, Shuaiqun Pan, Jun Hu, Lin Shi, and Qing Wang. Vtlayout: Fusion of visual and text features for document layout analysis, 2021.</list_item>
-<list_item><location><page_9><loc_52><loc_29><loc_91><loc_31></location>[21] Peng Zhang, Can Li, Liang Qiao, Zhanzhan Cheng, Shiliang Pu, Yi Niu, and Fei Wu. Vsr: A unified framework for document layout analysis combining vision, semantics and relations, 2021.</list_item>
-<list_item><location><page_9><loc_52><loc_25><loc_91><loc_28></location>[22] Peter W J Staar, Michele Dolfi, Christoph Auer, and Costas Bekas. Corpus conversion service: A machine learning platform to ingest documents at scale. In Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining , KDD, pages 774-782. ACM, 2018.</list_item>
-<list_item><location><page_9><loc_52><loc_23><loc_91><loc_24></location>[23] Connor Shorten and Taghi M. Khoshgoftaar. A survey on image data augmentation for deep learning. Journal of Big Data , 6(1):60, 2019.</list_item>
-</document>
\ No newline at end of file
+<page_break>
+<page_header><loc_44><loc_38><loc_284><loc_43>DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis</page_header>
+<page_header><loc_299><loc_38><loc_456><loc_43>KDD ’22, August 14-18, 2022, Washington, DC, USA</page_header>
+<picture><loc_43><loc_53><loc_455><loc_279><caption><loc_51><loc_279><loc_260><loc_283>Text Caption List-Item Formula Table Section-Header Picture Page-Header Page-Footer Title</caption></picture>
+<text><loc_44><loc_293><loc_457><loc_319>Figure 6: Example layout predictions on selected pages from the DocLayNet test-set. (A, D) exhibit favourable results on coloured backgrounds. (B, C) show accurate list-item and paragraph differentiation despite densely-spaced lines. (E) demonstrates good table and figure distinction. (F) shows predictions on a Chinese patent with multiple overlaps, label confusion and missing boxes.</text>
+<text><loc_57><loc_333><loc_241><loc_347>Diaconu, Mai Thanh Minh, Marc, albinxavi, fatih, oleg, and wanghao yang. ultralytics/yolov5: v6.0 - yolov5n nano models, roboflow integration, tensorflow export, opencv dnn support, October 2021.</text>
+<unordered_list><list_item><loc_260><loc_333><loc_457><loc_342>[20] Shoubin Li, Xuyan Ma, Shuaiqun Pan, Jun Hu, Lin Shi, and Qing Wang. Vtlayout: Fusion of visual and text features for document layout analysis, 2021.</list_item>
+<list_item><loc_44><loc_348><loc_241><loc_362>[14] Nicolas Carion, Francisco Massa, Gabriel Synnaeve, Nicolas Usunier, Alexander Kirillov, and Sergey Zagoruyko. End-to-end object detection with transformers. CoRR , abs/2005.12872, 2020.</list_item>
+<list_item><loc_44><loc_363><loc_240><loc_372>[15] Mingxing Tan, Ruoming Pang, and Quoc V. Le. Efficientdet: Scalable and efficient object detection. CoRR , abs/1911.09070, 2019.</list_item>
+<list_item><loc_44><loc_373><loc_241><loc_387>[16] Tsung-Yi Lin, Michael Maire, Serge J. Belongie, Lubomir D. Bourdev, Ross B. Girshick, James Hays, Pietro Perona, Deva Ramanan, Piotr Dollár, and C. Lawrence Zitnick. Microsoft COCO: common objects in context, 2014.</list_item>
+<list_item><loc_44><loc_388><loc_241><loc_397>[17] Yuxin Wu, Alexander Kirillov, Francisco Massa, Wan-Yen Lo, and Ross Girshick. Detectron2, 2019.</list_item>
+<list_item><loc_44><loc_398><loc_241><loc_422>[18] Nikolaos Livathinos, Cesar Berrospi, Maksym Lysak, Viktor Kuropiatnyk, Ahmed Nassar, Andre Carvalho, Michele Dolfi, Christoph Auer, Kasper Dinkla, and Peter W. J. Staar. Robust pdf document conversion using recurrent neural networks. In Proceedings of the 35th Conference on Artificial Intelligence , AAAI, pages 1513715145, feb 2021.</list_item>
+<list_item><loc_44><loc_423><loc_241><loc_448>[19] Yiheng Xu, Minghao Li, Lei Cui, Shaohan Huang, Furu Wei, and Ming Zhou. Layoutlm: Pre-training of text and layout for document image understanding. In Proceedings of the 26th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining , KDD, pages 1192-1200, New York, USA, 2020. Association for Computing Machinery.</list_item>
+<list_item><loc_260><loc_343><loc_457><loc_357>[21] Peng Zhang, Can Li, Liang Qiao, Zhanzhan Cheng, Shiliang Pu, Yi Niu, and Fei Wu. Vsr: A unified framework for document layout analysis combining vision, semantics and relations, 2021.</list_item>
+<list_item><loc_260><loc_358><loc_457><loc_377>[22] Peter W J Staar, Michele Dolfi, Christoph Auer, and Costas Bekas. Corpus conversion service: A machine learning platform to ingest documents at scale. In Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining , KDD, pages 774-782. ACM, 2018.</list_item>
+<list_item><loc_260><loc_378><loc_457><loc_387>[23] Connor Shorten and Taghi M. Khoshgoftaar. A survey on image data augmentation for deep learning. Journal of Big Data , 6(1):60, 2019.</list_item>
+</unordered_list>
+</doctag>
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v2/2206.01062.json b/tests/data/groundtruth/docling_v2/2206.01062.json
index 44506402..e1de21b6 100644
--- a/tests/data/groundtruth/docling_v2/2206.01062.json
+++ b/tests/data/groundtruth/docling_v2/2206.01062.json
@@ -1 +1 @@
-{"schema_name": "DoclingDocument", "version": "1.0.0", "name": "2206.01062", "origin": {"mimetype": "application/pdf", "binary_hash": 7156212269791437020, "filename": "2206.01062.pdf", "uri": null}, "furniture": {"self_ref": "#/furniture", "parent": null, "children": [], "name": "_root_", "label": "unspecified"}, "body": {"self_ref": "#/body", "parent": null, "children": [{"cref": "#/texts/0"}, {"cref": "#/texts/1"}, {"cref": "#/texts/2"}, {"cref": "#/texts/3"}, {"cref": "#/texts/4"}, {"cref": "#/texts/5"}, {"cref": "#/texts/6"}, {"cref": "#/texts/7"}, {"cref": "#/texts/8"}, {"cref": "#/texts/9"}, {"cref": "#/texts/10"}, {"cref": "#/texts/11"}, {"cref": "#/texts/12"}, {"cref": "#/texts/13"}, {"cref": "#/texts/14"}, {"cref": "#/texts/15"}, {"cref": "#/texts/16"}, {"cref": "#/pictures/0"}, {"cref": "#/texts/346"}, {"cref": "#/texts/347"}, {"cref": "#/texts/348"}, {"cref": "#/texts/349"}, {"cref": "#/texts/350"}, {"cref": "#/texts/351"}, {"cref": "#/texts/352"}, {"cref": "#/texts/353"}, {"cref": "#/texts/354"}, {"cref": "#/groups/0"}, {"cref": "#/texts/359"}, {"cref": "#/texts/360"}, {"cref": "#/groups/1"}, {"cref": "#/texts/362"}, {"cref": "#/texts/363"}, {"cref": "#/texts/364"}, {"cref": "#/texts/365"}, {"cref": "#/texts/366"}, {"cref": "#/texts/367"}, {"cref": "#/texts/368"}, {"cref": "#/texts/369"}, {"cref": "#/texts/370"}, {"cref": "#/texts/371"}, {"cref": "#/texts/372"}, {"cref": "#/pictures/1"}, {"cref": "#/texts/385"}, {"cref": "#/texts/386"}, {"cref": "#/texts/387"}, {"cref": "#/texts/388"}, {"cref": "#/texts/389"}, {"cref": "#/texts/390"}, {"cref": "#/texts/391"}, {"cref": "#/texts/392"}, {"cref": "#/texts/393"}, {"cref": "#/texts/394"}, {"cref": "#/texts/395"}, {"cref": "#/texts/396"}, {"cref": "#/tables/0"}, {"cref": "#/texts/397"}, {"cref": "#/pictures/2"}, {"cref": "#/texts/398"}, {"cref": "#/texts/399"}, {"cref": "#/texts/400"}, {"cref": "#/texts/401"}, {"cref": "#/texts/402"}, {"cref": "#/texts/403"}, {"cref": "#/texts/404"}, {"cref": "#/texts/405"}, {"cref": "#/texts/406"}, {"cref": "#/texts/407"}, {"cref": "#/texts/408"}, {"cref": "#/groups/2"}, {"cref": "#/texts/415"}, {"cref": "#/texts/416"}, {"cref": "#/texts/417"}, {"cref": "#/pictures/3"}, {"cref": "#/texts/428"}, {"cref": "#/texts/429"}, {"cref": "#/texts/430"}, {"cref": "#/texts/431"}, {"cref": "#/texts/432"}, {"cref": "#/tables/1"}, {"cref": "#/texts/433"}, {"cref": "#/texts/434"}, {"cref": "#/texts/435"}, {"cref": "#/texts/436"}, {"cref": "#/pictures/4"}, {"cref": "#/texts/459"}, {"cref": "#/texts/460"}, {"cref": "#/texts/461"}, {"cref": "#/texts/462"}, {"cref": "#/texts/463"}, {"cref": "#/texts/464"}, {"cref": "#/texts/465"}, {"cref": "#/texts/466"}, {"cref": "#/tables/2"}, {"cref": "#/texts/467"}, {"cref": "#/texts/468"}, {"cref": "#/texts/469"}, {"cref": "#/texts/470"}, {"cref": "#/tables/3"}, {"cref": "#/texts/471"}, {"cref": "#/texts/472"}, {"cref": "#/texts/473"}, {"cref": "#/texts/474"}, {"cref": "#/texts/475"}, {"cref": "#/texts/476"}, {"cref": "#/texts/477"}, {"cref": "#/tables/4"}, {"cref": "#/texts/478"}, {"cref": "#/texts/479"}, {"cref": "#/texts/480"}, {"cref": "#/texts/481"}, {"cref": "#/texts/482"}, {"cref": "#/texts/483"}, {"cref": "#/texts/484"}, {"cref": "#/texts/485"}, {"cref": "#/texts/486"}, {"cref": "#/groups/3"}, {"cref": "#/texts/500"}, {"cref": "#/texts/501"}, {"cref": "#/texts/502"}, {"cref": "#/pictures/5"}, {"cref": "#/texts/514"}, {"cref": "#/texts/515"}, {"cref": "#/groups/4"}], "name": "_root_", "label": "unspecified"}, "groups": [{"self_ref": "#/groups/0", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/355"}, {"cref": "#/texts/356"}, {"cref": "#/texts/357"}, {"cref": "#/texts/358"}], "name": "list", "label": "list"}, {"self_ref": "#/groups/1", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/361"}], "name": "list", "label": "list"}, {"self_ref": "#/groups/2", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/409"}, {"cref": "#/texts/410"}, {"cref": "#/texts/411"}, {"cref": "#/texts/412"}, {"cref": "#/texts/413"}, {"cref": "#/texts/414"}], "name": "list", "label": "list"}, {"self_ref": "#/groups/3", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/487"}, {"cref": "#/texts/488"}, {"cref": "#/texts/489"}, {"cref": "#/texts/490"}, {"cref": "#/texts/491"}, {"cref": "#/texts/492"}, {"cref": "#/texts/493"}, {"cref": "#/texts/494"}, {"cref": "#/texts/495"}, {"cref": "#/texts/496"}, {"cref": "#/texts/497"}, {"cref": "#/texts/498"}, {"cref": "#/texts/499"}], "name": "list", "label": "list"}, {"self_ref": "#/groups/4", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/516"}, {"cref": "#/texts/517"}, {"cref": "#/texts/518"}, {"cref": "#/texts/519"}, {"cref": "#/texts/520"}, {"cref": "#/texts/521"}, {"cref": "#/texts/522"}, {"cref": "#/texts/523"}, {"cref": "#/texts/524"}, {"cref": "#/texts/525"}], "name": "list", "label": "list"}], "texts": [{"self_ref": "#/texts/0", "parent": {"cref": "#/body"}, "children": [], "label": "page_header", "prov": [{"page_no": 1, "bbox": {"l": 18.3402099609375, "t": 573.6400146484375, "r": 36.33979415893555, "b": 236.99996948242188, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 37]}], "orig": "arXiv:2206.01062v1 [cs.CV] 2 Jun 2022", "text": "arXiv:2206.01062v1 [cs.CV] 2 Jun 2022"}, {"self_ref": "#/texts/1", "parent": {"cref": "#/body"}, "children": [], "label": "section_header", "prov": [{"page_no": 1, "bbox": {"l": 107.30000305175781, "t": 708.3052978515625, "r": 505.06195068359375, "b": 672.4044189453125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 71]}], "orig": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis", "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis", "level": 1}, {"self_ref": "#/texts/2", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 90.96701049804688, "t": 658.32763671875, "r": 193.73123168945312, "b": 611.7597045898438, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 73]}], "orig": "Birgit Pfitzmann IBM Research Rueschlikon, Switzerland bpf@zurich.ibm.com", "text": "Birgit Pfitzmann IBM Research Rueschlikon, Switzerland bpf@zurich.ibm.com"}, {"self_ref": "#/texts/3", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 255.11602783203125, "t": 658.32763671875, "r": 357.8802490234375, "b": 611.7597045898438, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 71]}], "orig": "Christoph Auer IBM Research Rueschlikon, Switzerland cau@zurich.ibm.com", "text": "Christoph Auer IBM Research Rueschlikon, Switzerland cau@zurich.ibm.com"}, {"self_ref": "#/texts/4", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 419.2650451660156, "t": 658.32763671875, "r": 522.029296875, "b": 611.7597045898438, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 70]}], "orig": "Michele Dolfi IBM Research Rueschlikon, Switzerland dol@zurich.ibm.com", "text": "Michele Dolfi IBM Research Rueschlikon, Switzerland dol@zurich.ibm.com"}, {"self_ref": "#/texts/5", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 172.54302978515625, "t": 599.942626953125, "r": 275.3072509765625, "b": 553.3746948242188, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 72]}], "orig": "Ahmed S. Nassar IBM Research Rueschlikon, Switzerland ahn@zurich.ibm.com", "text": "Ahmed S. Nassar IBM Research Rueschlikon, Switzerland ahn@zurich.ibm.com"}, {"self_ref": "#/texts/6", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 336.6930236816406, "t": 599.942626953125, "r": 439.457275390625, "b": 553.3746948242188, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 68]}], "orig": "Peter Staar IBM Research Rueschlikon, Switzerland taa@zurich.ibm.com", "text": "Peter Staar IBM Research Rueschlikon, Switzerland taa@zurich.ibm.com"}, {"self_ref": "#/texts/7", "parent": {"cref": "#/body"}, "children": [], "label": "section_header", "prov": [{"page_no": 1, "bbox": {"l": 53.79803466796875, "t": 544.297119140625, "r": 111.94354248046875, "b": 533.9879760742188, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 8]}], "orig": "ABSTRACT", "text": "ABSTRACT", "level": 1}, {"self_ref": "#/texts/8", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 53.46699905395508, "t": 529.095458984375, "r": 295.5601806640625, "b": 257.7068176269531, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1595]}], "orig": "Accurate document layout analysis is a key requirement for highquality PDF document conversion. With the recent availability of public, large ground-truth datasets such as PubLayNet and DocBank, deep-learning models have proven to be very effective at layout detection and segmentation. While these datasets are of adequate size to train such models, they severely lack in layout variability since they are sourced from scientific article repositories such as PubMed and arXiv only. Consequently, the accuracy of the layout segmentation drops significantly when these models are applied on more challenging and diverse layouts. In this paper, we present DocLayNet , a new, publicly available, document-layout annotation dataset in COCO format. It contains 80863 manually annotated pages from diverse data sources to represent a wide variability in layouts. For each PDF page, the layout annotations provide labelled bounding-boxes with a choice of 11 distinct classes. DocLayNet also provides a subset of double- and triple-annotated pages to determine the inter-annotator agreement. In multiple experiments, we provide baseline accuracy scores (in mAP) for a set of popular object detection models. We also demonstrate that these models fall approximately 10% behind the inter-annotator agreement. Furthermore, we provide evidence that DocLayNet is of sufficient size. Lastly, we compare models trained on PubLayNet, DocBank and DocLayNet, showing that layout predictions of the DocLayNettrained models are more robust and thus the preferred choice for general-purpose document-layout analysis.", "text": "Accurate document layout analysis is a key requirement for highquality PDF document conversion. With the recent availability of public, large ground-truth datasets such as PubLayNet and DocBank, deep-learning models have proven to be very effective at layout detection and segmentation. While these datasets are of adequate size to train such models, they severely lack in layout variability since they are sourced from scientific article repositories such as PubMed and arXiv only. Consequently, the accuracy of the layout segmentation drops significantly when these models are applied on more challenging and diverse layouts. In this paper, we present DocLayNet , a new, publicly available, document-layout annotation dataset in COCO format. It contains 80863 manually annotated pages from diverse data sources to represent a wide variability in layouts. For each PDF page, the layout annotations provide labelled bounding-boxes with a choice of 11 distinct classes. DocLayNet also provides a subset of double- and triple-annotated pages to determine the inter-annotator agreement. In multiple experiments, we provide baseline accuracy scores (in mAP) for a set of popular object detection models. We also demonstrate that these models fall approximately 10% behind the inter-annotator agreement. Furthermore, we provide evidence that DocLayNet is of sufficient size. Lastly, we compare models trained on PubLayNet, DocBank and DocLayNet, showing that layout predictions of the DocLayNettrained models are more robust and thus the preferred choice for general-purpose document-layout analysis."}, {"self_ref": "#/texts/9", "parent": {"cref": "#/body"}, "children": [], "label": "section_header", "prov": [{"page_no": 1, "bbox": {"l": 53.79800033569336, "t": 241.00308227539062, "r": 134.81988525390625, "b": 230.69398498535156, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 12]}], "orig": "CCS CONCEPTS", "text": "CCS CONCEPTS", "level": 1}, {"self_ref": "#/texts/10", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 53.79798889160156, "t": 225.91700744628906, "r": 297.8529357910156, "b": 195.4988555908203, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 170]}], "orig": "\u00b7 Information systems \u2192 Document structure ; \u00b7 Applied computing \u2192 Document analysis ; \u00b7 Computing methodologies \u2192 Machine learning ; Computer vision ; Object detection ;", "text": "\u00b7 Information systems \u2192 Document structure ; \u00b7 Applied computing \u2192 Document analysis ; \u00b7 Computing methodologies \u2192 Machine learning ; Computer vision ; Object detection ;"}, {"self_ref": "#/texts/11", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 53.79800033569336, "t": 157.60162353515625, "r": 295.11798095703125, "b": 119.2081069946289, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 397]}], "orig": "Permission to make digital or hard copies of part or all of this work for personal or classroom use is granted without fee provided that copies are not made or distributed for profit or commercial advantage and that copies bear this notice and the full citation on the first page. Copyrights for third-party components of this work must be honored. For all other uses, contact the owner/author(s).", "text": "Permission to make digital or hard copies of part or all of this work for personal or classroom use is granted without fee provided that copies are not made or distributed for profit or commercial advantage and that copies bear this notice and the full citation on the first page. Copyrights for third-party components of this work must be honored. For all other uses, contact the owner/author(s)."}, {"self_ref": "#/texts/12", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 53.79800033569336, "t": 116.91976928710938, "r": 197.8627471923828, "b": 110.43414306640625, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 48]}], "orig": "KDD '22, August 14-18, 2022, Washington, DC, USA", "text": "KDD '22, August 14-18, 2022, Washington, DC, USA"}, {"self_ref": "#/texts/13", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 53.31700134277344, "t": 108.18763732910156, "r": 186.74652099609375, "b": 101.67411041259766, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 45]}], "orig": "\u00a9 2022 Copyright held by the owner/author(s).", "text": "\u00a9 2022 Copyright held by the owner/author(s)."}, {"self_ref": "#/texts/14", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 53.55400085449219, "t": 100.21663665771484, "r": 157.03125, "b": 93.70310974121094, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 33]}], "orig": "ACM ISBN 978-1-4503-9385-0/22/08.", "text": "ACM ISBN 978-1-4503-9385-0/22/08."}, {"self_ref": "#/texts/15", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 53.79800033569336, "t": 92.24663543701172, "r": 166.94093322753906, "b": 85.73310852050781, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 39]}], "orig": "https://doi.org/10.1145/3534678.3539043", "text": "https://doi.org/10.1145/3534678.3539043"}, {"self_ref": "#/texts/16", "parent": {"cref": "#/body"}, "children": [], "label": "caption", "prov": [{"page_no": 1, "bbox": {"l": 317.9549865722656, "t": 251.91700744628906, "r": 559.8057861328125, "b": 232.48475646972656, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 84]}], "orig": "Figure 1: Four examples of complex page layouts across different document categories", "text": "Figure 1: Four examples of complex page layouts across different document categories"}, {"self_ref": "#/texts/17", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 327.86951, "t": 440.21915, "r": 330.41248, "b": 438.04535, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "13", "text": "13"}, {"self_ref": "#/texts/18", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 327.83005, "t": 460.42731000000003, "r": 351.16092, "b": 458.68829, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 25]}], "orig": "USING THE VERTICAL TUBE -", "text": "USING THE VERTICAL TUBE -"}, {"self_ref": "#/texts/19", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 327.83005, "t": 458.81708, "r": 348.30536, "b": 457.07806, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 20]}], "orig": "MODELS AY11230/11234", "text": "MODELS AY11230/11234"}, {"self_ref": "#/texts/20", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 327.83005, "t": 455.59561, "r": 329.05914, "b": 454.07394, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "1.", "text": "1."}, {"self_ref": "#/texts/21", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 329.67368, "t": 455.59561, "r": 349.95349, "b": 454.07394, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 33]}], "orig": "The vertical tube can be used for", "text": "The vertical tube can be used for"}, {"self_ref": "#/texts/22", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 329.11752, "t": 454.16412, "r": 353.57977, "b": 452.64248999999995, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 38]}], "orig": "instructional viewing or to photograph", "text": "instructional viewing or to photograph"}, {"self_ref": "#/texts/23", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 327.77121, "t": 452.73264, "r": 352.4306, "b": 451.211, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 36]}], "orig": "the image with a digital camera or a", "text": "the image with a digital camera or a"}, {"self_ref": "#/texts/24", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 328.15176, "t": 451.30118, "r": 337.91086, "b": 449.77951, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 13]}], "orig": "micro TV unit", "text": "micro TV unit"}, {"self_ref": "#/texts/25", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 327.8313, "t": 449.80956999999995, "r": 329.09155, "b": 448.28793, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "2.", "text": "2."}, {"self_ref": "#/texts/26", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 329.72168, "t": 449.80956999999995, "r": 354.9267, "b": 448.28793, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 39]}], "orig": "Loosen the retention screw, then rotate", "text": "Loosen the retention screw, then rotate"}, {"self_ref": "#/texts/27", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 327.8313, "t": 448.37808, "r": 351.66949, "b": 446.85645, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 33]}], "orig": "the adjustment ring to change the", "text": "the adjustment ring to change the"}, {"self_ref": "#/texts/28", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 328.21185, "t": 446.94662, "r": 346.33179, "b": 445.42496, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 28]}], "orig": "length of the vertical tube.", "text": "length of the vertical tube."}, {"self_ref": "#/texts/29", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 327.83005, "t": 445.15319999999997, "r": 329.12726, "b": 443.63153, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "3.", "text": "3."}, {"self_ref": "#/texts/30", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 329.77588, "t": 445.15319999999997, "r": 351.18005, "b": 443.63153, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 33]}], "orig": "Make sure that both the images in", "text": "Make sure that both the images in"}, {"self_ref": "#/texts/31", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 327.25311, "t": 537.05188, "r": 350.07861, "b": 533.13904, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 9]}], "orig": "OPERATION", "text": "OPERATION"}, {"self_ref": "#/texts/32", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 350.07861, "t": 537.23218, "r": 351.82651, "b": 533.31934, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "(", "text": "("}, {"self_ref": "#/texts/33", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 351.82651, "t": 537.05188, "r": 360.85242, "b": 533.13904, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 5]}], "orig": "cont.", "text": "cont."}, {"self_ref": "#/texts/34", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 360.85242, "t": 537.23218, "r": 362.60028, "b": 533.31934, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": ")", "text": ")"}, {"self_ref": "#/texts/35", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 326.88037, "t": 528.50507, "r": 345.84351, "b": 526.76605, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 19]}], "orig": "SELECTING OBJECTIVE", "text": "SELECTING OBJECTIVE"}, {"self_ref": "#/texts/36", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 326.88037, "t": 526.89484, "r": 340.54153, "b": 525.15582, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 13]}], "orig": "MAGNIFICATION", "text": "MAGNIFICATION"}, {"self_ref": "#/texts/37", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 326.88037, "t": 525.28467, "r": 328.31903, "b": 523.54559, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "1.", "text": "1."}, {"self_ref": "#/texts/38", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 329.03836, "t": 525.28467, "r": 354.21472, "b": 523.54559, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 35]}], "orig": "There are two objectives. The lower", "text": "There are two objectives. The lower"}, {"self_ref": "#/texts/39", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 326.88037, "t": 523.67444, "r": 355.19193, "b": 521.93542, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 37]}], "orig": "magnification objective has a greater", "text": "magnification objective has a greater"}, {"self_ref": "#/texts/40", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 326.88037, "t": 522.06421, "r": 345.80057, "b": 520.3252, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 24]}], "orig": "depth of field and view.", "text": "depth of field and view."}, {"self_ref": "#/texts/41", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 326.88037, "t": 520.45398, "r": 328.33862, "b": 518.71497, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "2.", "text": "2."}, {"self_ref": "#/texts/42", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 329.06775, "t": 520.45398, "r": 352.39969, "b": 518.71497, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 32]}], "orig": "In order to observe the specimen", "text": "In order to observe the specimen"}, {"self_ref": "#/texts/43", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 326.88037, "t": 518.84381, "r": 352.90042, "b": 517.10474, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 34]}], "orig": "easily use the lower magnification", "text": "easily use the lower magnification"}, {"self_ref": "#/texts/44", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 326.88037, "t": 517.23358, "r": 354.59546, "b": 515.49457, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 38]}], "orig": "objective first. Then, by rotating the", "text": "objective first. Then, by rotating the"}, {"self_ref": "#/texts/45", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 326.88037, "t": 515.62335, "r": 350.81885, "b": 513.88434, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 30]}], "orig": "case, the magnification can be", "text": "case, the magnification can be"}, {"self_ref": "#/texts/46", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 326.88037, "t": 514.01312, "r": 335.46707, "b": 512.27411, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 8]}], "orig": "changed.", "text": "changed."}, {"self_ref": "#/texts/47", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 326.88037, "t": 510.79272, "r": 354.57755, "b": 509.05368, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 27]}], "orig": "CHANGING THE INTERPUPILLARY", "text": "CHANGING THE INTERPUPILLARY"}, {"self_ref": "#/texts/48", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 326.88037, "t": 509.18249999999995, "r": 335.1752, "b": 507.44348, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 8]}], "orig": "DISTANCE", "text": "DISTANCE"}, {"self_ref": "#/texts/49", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 326.88037, "t": 507.5723, "r": 328.34784, "b": 505.83325, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "1.", "text": "1."}, {"self_ref": "#/texts/50", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 329.08157, "t": 507.5723, "r": 354.76245, "b": 505.83325, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 35]}], "orig": "The distance between the observer's", "text": "The distance between the observer's"}, {"self_ref": "#/texts/51", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 326.88037, "t": 505.96207, "r": 354.6499, "b": 504.22305, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 38]}], "orig": "pupils is the interpupillary distance.", "text": "pupils is the interpupillary distance."}, {"self_ref": "#/texts/52", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 326.88037, "t": 504.35187, "r": 328.25125, "b": 502.61282, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "2.", "text": "2."}, {"self_ref": "#/texts/53", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 328.93671, "t": 504.35187, "r": 354.29825, "b": 502.61282, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 37]}], "orig": "To adjust the interpupillary distance", "text": "To adjust the interpupillary distance"}, {"self_ref": "#/texts/54", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 326.88181, "t": 502.74164, "r": 355.02075, "b": 501.00262, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 37]}], "orig": "rotate the prism caps until both eyes", "text": "rotate the prism caps until both eyes"}, {"self_ref": "#/texts/55", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 326.88181, "t": 501.13144000000005, "r": 350.82028, "b": 499.3924, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 30]}], "orig": "coincide with the image in the", "text": "coincide with the image in the"}, {"self_ref": "#/texts/56", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 326.88181, "t": 499.52121, "r": 336.2067, "b": 497.7822, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 9]}], "orig": "eyepiece.", "text": "eyepiece."}, {"self_ref": "#/texts/57", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 326.88181, "t": 496.30078, "r": 335.3941, "b": 494.56177, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 8]}], "orig": "FOCUSING", "text": "FOCUSING"}, {"self_ref": "#/texts/58", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 326.88181, "t": 494.69058, "r": 328.34314, "b": 492.95154, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "1.", "text": "1."}, {"self_ref": "#/texts/59", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 329.07379, "t": 494.69058, "r": 353.18555, "b": 492.95154, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 33]}], "orig": "Remove the lens protective cover.", "text": "Remove the lens protective cover."}, {"self_ref": "#/texts/60", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 326.88324, "t": 493.08035, "r": 328.35919, "b": 491.34134, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "2.", "text": "2."}, {"self_ref": "#/texts/61", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 329.0972, "t": 493.08035, "r": 353.45065, "b": 491.34134, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 33]}], "orig": "Place the specimen on the working", "text": "Place the specimen on the working"}, {"self_ref": "#/texts/62", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 326.88324, "t": 491.47015, "r": 333.32825, "b": 489.73110999999994, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 6]}], "orig": "stage.", "text": "stage."}, {"self_ref": "#/texts/63", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 326.88324, "t": 489.85991999999993, "r": 328.31296, "b": 488.1209099999999, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "3.", "text": "3."}, {"self_ref": "#/texts/64", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 329.02783, "t": 489.85991999999993, "r": 354.76303, "b": 488.1209099999999, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 36]}], "orig": "Focus the specimen with the left eye", "text": "Focus the specimen with the left eye"}, {"self_ref": "#/texts/65", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 326.88324, "t": 488.24973, "r": 355.96307, "b": 486.51068, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 40]}], "orig": "first while turning the focus knob until", "text": "first while turning the focus knob until"}, {"self_ref": "#/texts/66", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 326.88324, "t": 486.6395, "r": 354.46594, "b": 484.90047999999996, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 34]}], "orig": "the image appears clear and sharp.", "text": "the image appears clear and sharp."}, {"self_ref": "#/texts/67", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 326.88324, "t": 485.0293, "r": 328.25488, "b": 483.29025, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "4.", "text": "4."}, {"self_ref": "#/texts/68", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 328.9407, "t": 485.0293, "r": 356.37335, "b": 483.29025, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 40]}], "orig": "Rotate the right eyepiece ring until the", "text": "Rotate the right eyepiece ring until the"}, {"self_ref": "#/texts/69", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 326.88324, "t": 483.41907, "r": 355.38867, "b": 481.68005, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 36]}], "orig": "images in each eyepiece coincide and", "text": "images in each eyepiece coincide and"}, {"self_ref": "#/texts/70", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 326.88324, "t": 481.80887, "r": 343.17249, "b": 480.06982, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 20]}], "orig": "are sharp and clear.", "text": "are sharp and clear."}, {"self_ref": "#/texts/71", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 326.88324, "t": 478.58844, "r": 344.13388, "b": 476.84940000000006, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 17]}], "orig": "CHANGING THE BULB", "text": "CHANGING THE BULB"}, {"self_ref": "#/texts/72", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 326.88324, "t": 476.97821000000005, "r": 328.37418, "b": 475.23920000000004, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "1.", "text": "1."}, {"self_ref": "#/texts/73", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 329.11963, "t": 476.97821000000005, "r": 348.50162, "b": 475.23920000000004, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 26]}], "orig": "Disconnect the power cord.", "text": "Disconnect the power cord."}, {"self_ref": "#/texts/74", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 326.88324, "t": 475.36801, "r": 328.34061, "b": 473.62897, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "2.", "text": "2."}, {"self_ref": "#/texts/75", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 329.06931, "t": 475.36801, "r": 353.11588, "b": 473.62897, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 33]}], "orig": "When the bulb is cool, remove the", "text": "When the bulb is cool, remove the"}, {"self_ref": "#/texts/76", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 326.88464, "t": 473.7577800000001, "r": 353.79517, "b": 472.0187700000001, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 34]}], "orig": "oblique illuminator cap and remove", "text": "oblique illuminator cap and remove"}, {"self_ref": "#/texts/77", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 326.88464, "t": 472.14757999999995, "r": 348.02094, "b": 470.40854, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 26]}], "orig": "the halogen bulb with cap.", "text": "the halogen bulb with cap."}, {"self_ref": "#/texts/78", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 326.88464, "t": 470.53735, "r": 328.37512, "b": 468.79834, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "3.", "text": "3."}, {"self_ref": "#/texts/79", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 329.12036, "t": 470.53735, "r": 352.96808, "b": 468.79834, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 32]}], "orig": "Replace with a new halogen bulb.", "text": "Replace with a new halogen bulb."}, {"self_ref": "#/texts/80", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 326.88608, "t": 468.92715, "r": 328.36884, "b": 467.18811, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "4.", "text": "4."}, {"self_ref": "#/texts/81", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 329.1102, "t": 468.92715, "r": 356.5412, "b": 467.18811, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 37]}], "orig": "Open the window in the base plate and", "text": "Open the window in the base plate and"}, {"self_ref": "#/texts/82", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 326.88608, "t": 467.31692999999996, "r": 350.13828, "b": 465.57791, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 27]}], "orig": "replace the halogen lamp or", "text": "replace the halogen lamp or"}, {"self_ref": "#/texts/83", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 326.88608, "t": 465.70673, "r": 351.59677, "b": 463.96768, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 31]}], "orig": "fluorescent lamp of transmitted", "text": "fluorescent lamp of transmitted"}, {"self_ref": "#/texts/84", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 326.88608, "t": 464.0965, "r": 336.89197, "b": 462.35748, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 12]}], "orig": "illuminator.", "text": "illuminator."}, {"self_ref": "#/texts/85", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 358.42023, "t": 528.50507, "r": 366.93256, "b": 526.76605, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 8]}], "orig": "FOCUSING", "text": "FOCUSING"}, {"self_ref": "#/texts/86", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 358.42023, "t": 526.89484, "r": 359.89841, "b": 525.15582, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "1.", "text": "1."}, {"self_ref": "#/texts/87", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 360.63751, "t": 526.89484, "r": 387.98407, "b": 525.15582, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 37]}], "orig": "Turn the focusing knob away or toward", "text": "Turn the focusing knob away or toward"}, {"self_ref": "#/texts/88", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 358.42023, "t": 525.28467, "r": 384.58948, "b": 523.54559, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 34]}], "orig": "you until a clear image is viewed.", "text": "you until a clear image is viewed."}, {"self_ref": "#/texts/89", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 358.42166, "t": 523.67444, "r": 359.78549, "b": 521.93542, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "2.", "text": "2."}, {"self_ref": "#/texts/90", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 360.46741, "t": 523.67444, "r": 384.33441, "b": 521.93542, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 35]}], "orig": "If the image is unclear, adjust the", "text": "If the image is unclear, adjust the"}, {"self_ref": "#/texts/91", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 358.4231, "t": 522.06421, "r": 384.61502, "b": 520.3252, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 34]}], "orig": "height of the elevator up or down,", "text": "height of the elevator up or down,"}, {"self_ref": "#/texts/92", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 358.4231, "t": 520.45398, "r": 385.38922, "b": 518.71497, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 34]}], "orig": "then turn the focusing knob again.", "text": "then turn the focusing knob again."}, {"self_ref": "#/texts/93", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 358.4231, "t": 517.23358, "r": 377.35046, "b": 515.49457, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 18]}], "orig": "ZOOM MAGNIFICATION", "text": "ZOOM MAGNIFICATION"}, {"self_ref": "#/texts/94", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 358.4231, "t": 515.62335, "r": 359.89429, "b": 513.88434, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "1.", "text": "1."}, {"self_ref": "#/texts/95", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 360.62988, "t": 515.62335, "r": 386.37589, "b": 513.88434, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 35]}], "orig": "Turn the zoom magnification knob to", "text": "Turn the zoom magnification knob to"}, {"self_ref": "#/texts/96", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 358.4231, "t": 514.01312, "r": 386.78732, "b": 512.27411, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 38]}], "orig": "the desired magnification and field of", "text": "the desired magnification and field of"}, {"self_ref": "#/texts/97", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 358.4231, "t": 512.40295, "r": 364.16855, "b": 510.66391, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 5]}], "orig": "view.", "text": "view."}, {"self_ref": "#/texts/98", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 358.4231, "t": 510.79272, "r": 359.86777, "b": 509.05368, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "2.", "text": "2."}, {"self_ref": "#/texts/99", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 360.59012, "t": 510.79272, "r": 387.31656, "b": 509.05368, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 37]}], "orig": "In most situations, it is recommended", "text": "In most situations, it is recommended"}, {"self_ref": "#/texts/100", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 358.4231, "t": 509.18249999999995, "r": 381.56656, "b": 507.44348, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 28]}], "orig": "that you focus at the lowest", "text": "that you focus at the lowest"}, {"self_ref": "#/texts/101", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 358.4231, "t": 507.5723, "r": 386.63403, "b": 505.83325, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 36]}], "orig": "magnification, then move to a higher", "text": "magnification, then move to a higher"}, {"self_ref": "#/texts/102", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 358.42453, "t": 505.96207, "r": 382.77115, "b": 504.22305, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 29]}], "orig": "magnification and re-focus as", "text": "magnification and re-focus as"}, {"self_ref": "#/texts/103", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 358.42453, "t": 504.35187, "r": 367.98694, "b": 502.61282, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 10]}], "orig": "necessary.", "text": "necessary."}, {"self_ref": "#/texts/104", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 358.42453, "t": 502.74164, "r": 359.80386, "b": 501.00262, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "3.", "text": "3."}, {"self_ref": "#/texts/105", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 360.49353, "t": 502.74164, "r": 386.70093, "b": 501.00262, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 38]}], "orig": "If the image is not clear to both eyes", "text": "If the image is not clear to both eyes"}, {"self_ref": "#/texts/106", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 358.42453, "t": 501.13144000000005, "r": 388.03534, "b": 499.3924, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 38]}], "orig": "at the same time, the diopter ring may", "text": "at the same time, the diopter ring may"}, {"self_ref": "#/texts/107", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 358.42453, "t": 499.52121, "r": 373.13724, "b": 497.7822, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 16]}], "orig": "need adjustment.", "text": "need adjustment."}, {"self_ref": "#/texts/108", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 358.42453, "t": 496.30078, "r": 381.74539, "b": 494.56177, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 23]}], "orig": "DIOPTER RING ADJUSTMENT", "text": "DIOPTER RING ADJUSTMENT"}, {"self_ref": "#/texts/109", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 358.42453, "t": 494.69058, "r": 359.83682, "b": 492.95154, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "1.", "text": "1."}, {"self_ref": "#/texts/110", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 360.54297, "t": 494.69058, "r": 388.08289, "b": 492.95154, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 39]}], "orig": "To adjust the eyepiece for viewing with", "text": "To adjust the eyepiece for viewing with"}, {"self_ref": "#/texts/111", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 358.42453, "t": 493.08035, "r": 382.73251, "b": 491.34134, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 29]}], "orig": "or without eyeglasses and for", "text": "or without eyeglasses and for"}, {"self_ref": "#/texts/112", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 358.42453, "t": 491.47015, "r": 387.72266, "b": 489.73110999999994, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 39]}], "orig": "differences in acuity between the right", "text": "differences in acuity between the right"}, {"self_ref": "#/texts/113", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 358.42453, "t": 489.85991999999993, "r": 384.1991, "b": 488.1209099999999, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 35]}], "orig": "and left eyes, follow the following", "text": "and left eyes, follow the following"}, {"self_ref": "#/texts/114", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 358.42453, "t": 488.24973, "r": 364.88672, "b": 486.51068, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 6]}], "orig": "steps:", "text": "steps:"}, {"self_ref": "#/texts/115", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 358.42453, "t": 486.6395, "r": 359.95078, "b": 484.90047999999996, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "a.", "text": "a."}, {"self_ref": "#/texts/116", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 361.47699, "t": 486.6395, "r": 386.65988, "b": 484.90047999999996, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 33]}], "orig": "Observe an image through the left", "text": "Observe an image through the left"}, {"self_ref": "#/texts/117", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 358.42453, "t": 485.0293, "r": 386.7634, "b": 483.29025, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 35]}], "orig": "eyepiece and bring a specific point", "text": "eyepiece and bring a specific point"}, {"self_ref": "#/texts/118", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 358.42453, "t": 483.41907, "r": 385.41354, "b": 481.68005, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 32]}], "orig": "into focus using the focus knob.", "text": "into focus using the focus knob."}, {"self_ref": "#/texts/119", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 358.42453, "t": 481.80887, "r": 359.93304, "b": 480.06982, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "b.", "text": "b."}, {"self_ref": "#/texts/120", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 361.44156, "t": 481.80887, "r": 382.56085, "b": 480.06982, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 27]}], "orig": "By turning the diopter ring", "text": "By turning the diopter ring"}, {"self_ref": "#/texts/121", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 358.42596, "t": 480.19864, "r": 385.4559, "b": 478.45963, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 33]}], "orig": "adjustment for the left eyepiece,", "text": "adjustment for the left eyepiece,"}, {"self_ref": "#/texts/122", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 358.42596, "t": 478.58844, "r": 384.56122, "b": 476.84940000000006, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 31]}], "orig": "bring the same point into sharp", "text": "bring the same point into sharp"}, {"self_ref": "#/texts/123", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 358.42596, "t": 476.97821000000005, "r": 366.74371, "b": 475.23920000000004, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 6]}], "orig": "focus.", "text": "focus."}, {"self_ref": "#/texts/124", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 358.42596, "t": 475.36801, "r": 383.93884, "b": 473.62897, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 32]}], "orig": "c.Then bring the same point into", "text": "c.Then bring the same point into"}, {"self_ref": "#/texts/125", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 358.42596, "t": 473.7577800000001, "r": 385.69241, "b": 472.0187700000001, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 32]}], "orig": "focus through the right eyepiece", "text": "focus through the right eyepiece"}, {"self_ref": "#/texts/126", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 358.42596, "t": 472.14757999999995, "r": 385.94861, "b": 470.40854, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 34]}], "orig": "by turning the right diopter ring.", "text": "by turning the right diopter ring."}, {"self_ref": "#/texts/127", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 358.42596, "t": 470.53735, "r": 385.54236, "b": 468.79834, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 33]}], "orig": "d.With more than one viewer, each", "text": "d.With more than one viewer, each"}, {"self_ref": "#/texts/128", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 358.42596, "t": 468.92715, "r": 382.98718, "b": 467.18811, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 28]}], "orig": "viewer should note their own", "text": "viewer should note their own"}, {"self_ref": "#/texts/129", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 358.42596, "t": 467.31692999999996, "r": 385.06448, "b": 465.57791, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 34]}], "orig": "diopter ring position for the left", "text": "diopter ring position for the left"}, {"self_ref": "#/texts/130", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 358.42596, "t": 465.70673, "r": 385.20682, "b": 463.96768, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 32]}], "orig": "and right eyepieces, then before", "text": "and right eyepieces, then before"}, {"self_ref": "#/texts/131", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 358.42596, "t": 464.0965, "r": 382.21964, "b": 462.35748, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 28]}], "orig": "viewing set the diopter ring", "text": "viewing set the diopter ring"}, {"self_ref": "#/texts/132", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 358.42596, "t": 462.4863, "r": 382.63382, "b": 460.74725, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 28]}], "orig": "adjustments to that setting.", "text": "adjustments to that setting."}, {"self_ref": "#/texts/133", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 358.42596, "t": 459.26587000000006, "r": 375.67661, "b": 457.52682000000004, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 17]}], "orig": "CHANGING THE BULB", "text": "CHANGING THE BULB"}, {"self_ref": "#/texts/134", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 358.42596, "t": 457.65564, "r": 359.90311, "b": 455.91663, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "1.", "text": "1."}, {"self_ref": "#/texts/135", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 360.64169, "t": 457.65564, "r": 385.75333, "b": 455.91663, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 34]}], "orig": "Disconnect the power cord from the", "text": "Disconnect the power cord from the"}, {"self_ref": "#/texts/136", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 358.42596, "t": 456.04544, "r": 372.01416, "b": 454.3064, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 18]}], "orig": "electrical outlet.", "text": "electrical outlet."}, {"self_ref": "#/texts/137", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 358.42596, "t": 454.43521, "r": 359.88327, "b": 452.6962, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "2.", "text": "2."}, {"self_ref": "#/texts/138", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 360.61191, "t": 454.43521, "r": 384.65726, "b": 452.6962, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 33]}], "orig": "When the bulb is cool, remove the", "text": "When the bulb is cool, remove the"}, {"self_ref": "#/texts/139", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 358.42596, "t": 452.82501, "r": 385.33649, "b": 451.0859699999999, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 34]}], "orig": "oblique illuminator cap and remove", "text": "oblique illuminator cap and remove"}, {"self_ref": "#/texts/140", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 358.42596, "t": 451.21478, "r": 379.57224, "b": 449.47577, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 26]}], "orig": "the halogen bulb with cap.", "text": "the halogen bulb with cap."}, {"self_ref": "#/texts/141", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 358.4274, "t": 449.60458, "r": 359.91788, "b": 447.86553999999995, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "3.", "text": "3."}, {"self_ref": "#/texts/142", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 360.66312, "t": 449.60458, "r": 384.5108, "b": 447.86553999999995, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 32]}], "orig": "Replace with a new halogen bulb.", "text": "Replace with a new halogen bulb."}, {"self_ref": "#/texts/143", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 358.42883, "t": 447.99434999999994, "r": 359.92792, "b": 446.25534, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "4.", "text": "4."}, {"self_ref": "#/texts/144", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 360.67746, "t": 447.99434999999994, "r": 385.41235, "b": 446.25534, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 33]}], "orig": "Open the window in the base plate", "text": "Open the window in the base plate"}, {"self_ref": "#/texts/145", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 358.42883, "t": 446.38416, "r": 383.2782, "b": 444.64511, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 31]}], "orig": "and replace the halogen lamp or", "text": "and replace the halogen lamp or"}, {"self_ref": "#/texts/146", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 358.42883, "t": 444.77393, "r": 383.13953, "b": 443.03491, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 31]}], "orig": "fluorescent lamp of transmitted", "text": "fluorescent lamp of transmitted"}, {"self_ref": "#/texts/147", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 358.42883, "t": 443.16373, "r": 368.43472, "b": 441.42468, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 12]}], "orig": "illuminator.", "text": "illuminator."}, {"self_ref": "#/texts/148", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 326.59567, "t": 530.85815, "r": 339.11377, "b": 529.11908, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 13]}], "orig": "Model AY11230", "text": "Model AY11230"}, {"self_ref": "#/texts/149", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 358.48605, "t": 530.85815, "r": 371.00415, "b": 529.11908, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 13]}], "orig": "Model AY11234", "text": "Model AY11234"}, {"self_ref": "#/texts/150", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 455.43533, "t": 440.22961000000004, "r": 457.97827000000007, "b": 438.05585, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "14", "text": "14"}, {"self_ref": "#/texts/151", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 408.24518, "t": 516.47327, "r": 414.4234, "b": 515.03979, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 10]}], "orig": "Objectives", "text": "Objectives"}, {"self_ref": "#/texts/152", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 409.39554, "t": 523.01764, "r": 419.06677, "b": 521.58417, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 16]}], "orig": "Revolving Turret", "text": "Revolving Turret"}, {"self_ref": "#/texts/153", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 441.3895, "t": 512.87372, "r": 445.87192, "b": 511.44025, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 6]}], "orig": "Coarse", "text": "Coarse"}, {"self_ref": "#/texts/154", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 441.3895, "t": 511.69391, "r": 448.22338999999994, "b": 510.2604099999999, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 10]}], "orig": "Adjustment", "text": "Adjustment"}, {"self_ref": "#/texts/155", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 441.3895, "t": 510.51407, "r": 444.40371999999996, "b": 509.08060000000006, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "Knob", "text": "Knob"}, {"self_ref": "#/texts/156", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 398.79288, "t": 537.05353, "r": 428.91568, "b": 533.14069, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 13]}], "orig": "MODEL AY11236", "text": "MODEL AY11236"}, {"self_ref": "#/texts/157", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 398.32535, "t": 486.95709, "r": 435.93542, "b": 483.04427999999996, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 16]}], "orig": "MICROSCOPE USAGE", "text": "MICROSCOPE USAGE"}, {"self_ref": "#/texts/158", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 398.08594, "t": 481.64108, "r": 453.72171, "b": 479.46729, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 55]}], "orig": "BARSKA Model AY11236 is a powerful fixed power compound", "text": "BARSKA Model AY11236 is a powerful fixed power compound"}, {"self_ref": "#/texts/159", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 398.08594, "t": 479.49414, "r": 453.09939999999995, "b": 477.32034, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 59]}], "orig": "microscope designed for biological studies such as specimen", "text": "microscope designed for biological studies such as specimen"}, {"self_ref": "#/texts/160", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 398.08594, "t": 477.3472, "r": 456.65246999999994, "b": 475.1734, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 59]}], "orig": "examination. It can also be used for examining bacteria and", "text": "examination. It can also be used for examining bacteria and"}, {"self_ref": "#/texts/161", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 398.08594, "t": 475.20023, "r": 456.73859000000004, "b": 473.02646, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 67]}], "orig": "for general clinical and medical studies and other scientific uses.", "text": "for general clinical and medical studies and other scientific uses."}, {"self_ref": "#/texts/162", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 398.62399, "t": 471.57059, "r": 427.77472, "b": 467.65777999999995, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 12]}], "orig": "CONSTRUCTION", "text": "CONSTRUCTION"}, {"self_ref": "#/texts/163", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 398.08594, "t": 465.53930999999994, "r": 456.02639999999997, "b": 463.36551, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 58]}], "orig": "BARSKA Model AY11236 is a fixed power compound microscope.", "text": "BARSKA Model AY11236 is a fixed power compound microscope."}, {"self_ref": "#/texts/164", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 398.08414, "t": 463.3923300000001, "r": 455.42238999999995, "b": 461.2185400000001, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 65]}], "orig": "It is constructed with two optical paths at the same angle. It is", "text": "It is constructed with two optical paths at the same angle. It is"}, {"self_ref": "#/texts/165", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 398.08414, "t": 461.24539, "r": 457.39844, "b": 459.07159, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 65]}], "orig": "equipped with transmitted illumination. By using this instrument,", "text": "equipped with transmitted illumination. By using this instrument,"}, {"self_ref": "#/texts/166", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 398.08414, "t": 459.09845, "r": 453.97745, "b": 456.92464999999993, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 59]}], "orig": "the user can observe specimens at magnification from 40x to", "text": "the user can observe specimens at magnification from 40x to"}, {"self_ref": "#/texts/167", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 398.08414, "t": 456.95148, "r": 454.70708999999994, "b": 454.77768, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 62]}], "orig": "1000x by selecting the desired objective lens. Coarse and fine", "text": "1000x by selecting the desired objective lens. Coarse and fine"}, {"self_ref": "#/texts/168", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 398.08414, "t": 454.80453, "r": 458.90240000000006, "b": 452.63074, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 65]}], "orig": "focus adjustments provide accuracy and image detail. The rotating", "text": "focus adjustments provide accuracy and image detail. The rotating"}, {"self_ref": "#/texts/169", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 398.08594, "t": 452.65759, "r": 453.0672, "b": 450.4838, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 58]}], "orig": "head allows the user to position the eyepieces for maximum", "text": "head allows the user to position the eyepieces for maximum"}, {"self_ref": "#/texts/170", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 398.08594, "t": 450.51062, "r": 449.63113, "b": 448.33682, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 56]}], "orig": "viewing comfort and easy access to all adjustment knobs.", "text": "viewing comfort and easy access to all adjustment knobs."}, {"self_ref": "#/texts/171", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 422.10626, "t": 490.75809, "r": 434.62433000000004, "b": 489.01904, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 13]}], "orig": "Model AY11236", "text": "Model AY11236"}, {"self_ref": "#/texts/172", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 442.01610999999997, "t": 508.91351, "r": 444.8817399999999, "b": 507.48004, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "Fine", "text": "Fine"}, {"self_ref": "#/texts/173", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 442.01610999999997, "t": 507.7337, "r": 448.85001, "b": 506.30019999999996, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 10]}], "orig": "Adjustment", "text": "Adjustment"}, {"self_ref": "#/texts/174", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 442.01610999999997, "t": 506.55389, "r": 445.03033000000005, "b": 505.12039, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "Knob", "text": "Knob"}, {"self_ref": "#/texts/175", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 408.00577, "t": 512.87421, "r": 411.42212, "b": 511.4407, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 5]}], "orig": "Stage", "text": "Stage"}, {"self_ref": "#/texts/176", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 404.07172, "t": 511.0855700000001, "r": 410.77707, "b": 509.6521, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 9]}], "orig": "Condenser", "text": "Condenser"}, {"self_ref": "#/texts/177", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 404.07172, "t": 509.90576, "r": 409.2157, "b": 508.47226, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 8]}], "orig": "Focusing", "text": "Focusing"}, {"self_ref": "#/texts/178", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 404.07172, "t": 508.72592, "r": 407.08594, "b": 507.2924499999999, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "Knob", "text": "Knob"}, {"self_ref": "#/texts/179", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 441.81281, "t": 529.67822, "r": 447.03702, "b": 528.24475, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 8]}], "orig": "Eyepiece", "text": "Eyepiece"}, {"self_ref": "#/texts/180", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 437.34607, "t": 520.86975, "r": 440.80496, "b": 519.43719, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 5]}], "orig": "Stand", "text": "Stand"}, {"self_ref": "#/texts/181", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 409.7164, "t": 507.59973, "r": 413.3768, "b": 506.16718, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "Lamp", "text": "Lamp"}, {"self_ref": "#/texts/182", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 409.7164, "t": 506.16837, "r": 413.68201, "b": 504.73584, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 6]}], "orig": "On/Off", "text": "On/Off"}, {"self_ref": "#/texts/183", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 409.7164, "t": 504.737, "r": 413.6337, "b": 503.30447, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 6]}], "orig": "Switch", "text": "Switch"}, {"self_ref": "#/texts/184", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 434.8712499999999, "t": 495.2847, "r": 438.53164999999996, "b": 493.85217, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "Lamp", "text": "Lamp"}, {"self_ref": "#/texts/185", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 439.52039, "t": 499.81692999999996, "r": 443.08768, "b": 498.38439999999997, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 5]}], "orig": "Power", "text": "Power"}, {"self_ref": "#/texts/186", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 439.52039, "t": 498.38556, "r": 442.29575, "b": 496.95303, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "Cord", "text": "Cord"}, {"self_ref": "#/texts/187", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 413.55829, "t": 527.33911, "r": 421.94913, "b": 525.90656, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 13]}], "orig": "Rotating Head", "text": "Rotating Head"}, {"self_ref": "#/texts/188", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 441.84316999999993, "t": 505.09427, "r": 447.87585000000007, "b": 503.66174, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 10]}], "orig": "Stage Clip", "text": "Stage Clip"}, {"self_ref": "#/texts/189", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 441.84316999999993, "t": 503.6629, "r": 448.67252, "b": 502.23037999999997, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 10]}], "orig": "Adjustment", "text": "Adjustment"}, {"self_ref": "#/texts/190", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 407.2403, "t": 532.13354, "r": 425.79089, "b": 530.70105, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 31]}], "orig": "Interpupillary Slide Adjustment", "text": "Interpupillary Slide Adjustment"}, {"self_ref": "#/texts/191", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 449.10074000000003, "t": 413.33698, "r": 466.08835000000005, "b": 411.21588, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 17]}], "orig": "Circling Minimums", "text": "Circling Minimums"}, {"self_ref": "#/texts/192", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 449.10074000000003, "t": 408.7796000000001, "r": 449.64444, "b": 406.65851000000004, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "7", "text": "7"}, {"self_ref": "#/texts/193", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 450.18811, "t": 408.7796000000001, "r": 550.77124, "b": 406.65851000000004, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 184]}], "orig": "K H U H Z D V D F K D Q J H W R W K H 7 ( 5 3 6 F U L W H U L D L Q W K D W D \u1087H F W V F L U F O L Q J D U H D G L P H Q V L R Q E \\ H [ S D Q G L Q J W K H D U H D V W R S U R Y L G H", "text": "K H U H Z D V D F K D Q J H W R W K H 7 ( 5 3 6 F U L W H U L D L Q W K D W D \u1087H F W V F L U F O L Q J D U H D G L P H Q V L R Q E \\ H [ S D Q G L Q J W K H D U H D V W R S U R Y L G H"}, {"self_ref": "#/texts/194", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 449.10074000000003, "t": 406.24268, "r": 536.14716, "b": 404.12158, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 104]}], "orig": "improved obstacle protection. To indicate that the new criteria had been applied to a given procedure, a", "text": "improved obstacle protection. To indicate that the new criteria had been applied to a given procedure, a"}, {"self_ref": "#/texts/195", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 538.31085, "t": 406.24268, "r": 549.49921, "b": 404.12158, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 12]}], "orig": "is placed on", "text": "is placed on"}, {"self_ref": "#/texts/196", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 449.10074000000003, "t": 403.96399, "r": 547.58185, "b": 401.8429, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 119]}], "orig": "the circling line of minimums. The new circling tables and explanatory information is located in the Legend of the TPP.", "text": "the circling line of minimums. The new circling tables and explanatory information is located in the Legend of the TPP."}, {"self_ref": "#/texts/197", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 449.10074000000003, "t": 398.7871999999999, "r": 449.6163, "b": 396.66614, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "7", "text": "7"}, {"self_ref": "#/texts/198", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 450.1319, "t": 398.7871999999999, "r": 529.53082, "b": 396.66614, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 153]}], "orig": "K H D S S U R D F K H V X V L Q J V W D Q G D U G F L U F O L Q J D S S U R D F K D U H D V F D Q E H L G H Q W L \u00bf H G E \\ W K H D E V H Q F H R I W K H", "text": "K H D S S U R D F K H V X V L Q J V W D Q G D U G F L U F O L Q J D S S U R D F K D U H D V F D Q E H L G H Q W L \u00bf H G E \\ W K H D E V H Q F H R I W K H"}, {"self_ref": "#/texts/199", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 532.05829, "t": 398.7871999999999, "r": 550.42261, "b": 396.66614, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 23]}], "orig": "on the circling line of", "text": "on the circling line of"}, {"self_ref": "#/texts/200", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 449.10074000000003, "t": 396.50851, "r": 455.74692, "b": 394.38745, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 7]}], "orig": "minima.", "text": "minima."}, {"self_ref": "#/texts/201", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 449.95525999999995, "t": 376.40451, "r": 496.2829, "b": 374.49554, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 101]}], "orig": "$ S S O \\ 6 W D Q G D U G & L U F O L Q J $ S S U R D F K 0 D Q H X Y H U L Q J 5 D G L X V 7 D E O H", "text": "$ S S O \\ 6 W D Q G D U G & L U F O L Q J $ S S U R D F K 0 D Q H X Y H U L Q J 5 D G L X V 7 D E O H"}, {"self_ref": "#/texts/202", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 501.13077, "t": 382.74457, "r": 551.16101, "b": 380.8356, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 107]}], "orig": "$ S S O \\ ( [ S D Q G H G & L U F O L Q J $ S S U R D F K 0 D Q H X Y H U L Q J $ L U V S D F H 5 D G L X V", "text": "$ S S O \\ ( [ S D Q G H G & L U F O L Q J $ S S U R D F K 0 D Q H X Y H U L Q J $ L U V S D F H 5 D G L X V"}, {"self_ref": "#/texts/203", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 501.13077, "t": 380.69376, "r": 505.2477999999999, "b": 378.78479, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 5]}], "orig": "Table", "text": "Table"}, {"self_ref": "#/texts/204", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 449.10074000000003, "t": 371.81198, "r": 469.35599, "b": 369.26669, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 14]}], "orig": "AIRPORT SKETCH", "text": "AIRPORT SKETCH"}, {"self_ref": "#/texts/205", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 449.10074000000003, "t": 366.91092, "r": 525.93616, "b": 364.78983, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 92]}], "orig": "The airport sketch is a depiction of the airport with emphasis on runway pattern and related", "text": "The airport sketch is a depiction of the airport with emphasis on runway pattern and related"}, {"self_ref": "#/texts/206", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 449.10074000000003, "t": 364.6322, "r": 522.0343, "b": 362.51114, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 94]}], "orig": "information, positioned in either the lower left or lower right corner of the chart to aid pi-", "text": "information, positioned in either the lower left or lower right corner of the chart to aid pi-"}, {"self_ref": "#/texts/207", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 449.10074000000003, "t": 362.35352, "r": 524.67151, "b": 360.23245, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 92]}], "orig": "lot recognition of the airport from the air and to provide some information to aid on ground", "text": "lot recognition of the airport from the air and to provide some information to aid on ground"}, {"self_ref": "#/texts/208", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 449.10074000000003, "t": 360.07485999999994, "r": 527.172, "b": 357.95377, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 92]}], "orig": "navigation of the airport. The runways are drawn to scale and oriented to true north. Runway", "text": "navigation of the airport. The runways are drawn to scale and oriented to true north. Runway"}, {"self_ref": "#/texts/209", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 449.10074000000003, "t": 357.79617, "r": 502.39545, "b": 355.67508, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 63]}], "orig": "dimensions (length and width) are shown for all active runways.", "text": "dimensions (length and width) are shown for all active runways."}, {"self_ref": "#/texts/210", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 449.10074000000003, "t": 353.2388000000001, "r": 512.92676, "b": 351.11771000000005, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 73]}], "orig": "Runway(s) are depicted based on what type and construction of the runway.", "text": "Runway(s) are depicted based on what type and construction of the runway."}, {"self_ref": "#/texts/211", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 449.95525999999995, "t": 347.92999, "r": 460.02307, "b": 346.02099999999996, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 12]}], "orig": "Hard Surface", "text": "Hard Surface"}, {"self_ref": "#/texts/212", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 464.89963, "t": 347.92999, "r": 473.98819, "b": 346.02099999999996, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 10]}], "orig": "Other Than", "text": "Other Than"}, {"self_ref": "#/texts/213", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 464.89963, "t": 345.87915, "r": 474.96744, "b": 343.97021, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 12]}], "orig": "Hard Surface", "text": "Hard Surface"}, {"self_ref": "#/texts/214", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 478.91357, "t": 347.92999, "r": 489.45648, "b": 346.02099999999996, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 13]}], "orig": "Metal Surface", "text": "Metal Surface"}, {"self_ref": "#/texts/215", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 493.06420999999995, "t": 347.92999, "r": 505.03076, "b": 346.02099999999996, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 13]}], "orig": "Closed Runway", "text": "Closed Runway"}, {"self_ref": "#/texts/216", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 509.5809, "t": 347.92999, "r": 524.30237, "b": 346.02099999999996, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 18]}], "orig": "Under Construction", "text": "Under Construction"}, {"self_ref": "#/texts/217", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 449.95525999999995, "t": 337.18793, "r": 458.31406, "b": 335.27896, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 9]}], "orig": "Stopways,", "text": "Stopways,"}, {"self_ref": "#/texts/218", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 449.95525999999995, "t": 335.13712, "r": 461.92083999999994, "b": 333.22814999999997, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 15]}], "orig": "Taxiways, Park-", "text": "Taxiways, Park-"}, {"self_ref": "#/texts/219", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 449.95525999999995, "t": 333.08627, "r": 457.08014, "b": 331.17731000000003, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 9]}], "orig": "ing Areas", "text": "ing Areas"}, {"self_ref": "#/texts/220", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 464.89963, "t": 337.18793, "r": 472.87732, "b": 335.27896, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 9]}], "orig": "Displaced", "text": "Displaced"}, {"self_ref": "#/texts/221", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 464.89963, "t": 335.13712, "r": 472.49792, "b": 333.22814999999997, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 9]}], "orig": "Threshold", "text": "Threshold"}, {"self_ref": "#/texts/222", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 478.91357, "t": 337.18793, "r": 483.61584, "b": 335.27896, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 6]}], "orig": "Closed", "text": "Closed"}, {"self_ref": "#/texts/223", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 478.91357, "t": 335.13712, "r": 486.60754000000003, "b": 333.22814999999997, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 8]}], "orig": "Pavement", "text": "Pavement"}, {"self_ref": "#/texts/224", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 493.06420999999995, "t": 337.18793, "r": 504.20648, "b": 335.27896, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 12]}], "orig": "Water Runway", "text": "Water Runway"}, {"self_ref": "#/texts/225", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 449.10074000000003, "t": 322.67026, "r": 548.59674, "b": 320.54919, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 110]}], "orig": "Taxiways and aprons are shaded grey. Other runway features that may be shown are runway numbers, runway dimen-", "text": "Taxiways and aprons are shaded grey. Other runway features that may be shown are runway numbers, runway dimen-"}, {"self_ref": "#/texts/226", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 449.10074000000003, "t": 320.39157, "r": 500.08181999999994, "b": 318.27051, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 61]}], "orig": "sions, runway slope, arresting gear, and displaced threshold.", "text": "sions, runway slope, arresting gear, and displaced threshold."}, {"self_ref": "#/texts/227", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 449.10074000000003, "t": 315.83423, "r": 449.59933000000007, "b": 313.71313, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "2", "text": "2"}, {"self_ref": "#/texts/228", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 450.09796, "t": 315.83423, "r": 547.82562, "b": 313.71313, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 195]}], "orig": "W K H U L Q I R U P D W L R Q F R Q F H U Q L Q J O L J K W L Q J \u00bf Q D O D S S U R D F K E H D U L Q J V D L U S R U W E H D F R Q R E V W D F O H V F R Q W U R O W R Z H U 1 $ 9 $ , ' V K H O L", "text": "W K H U L Q I R U P D W L R Q F R Q F H U Q L Q J O L J K W L Q J \u00bf Q D O D S S U R D F K E H D U L Q J V D L U S R U W E H D F R Q R E V W D F O H V F R Q W U R O W R Z H U 1 $ 9 $ , ' V K H O L"}, {"self_ref": "#/texts/229", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 547.82623, "t": 315.83423, "r": 548.45862, "b": 313.71313, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "-", "text": "-"}, {"self_ref": "#/texts/230", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 449.10074000000003, "t": 313.55554, "r": 470.52609000000007, "b": 311.43445, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 23]}], "orig": "pads may also be shown.", "text": "pads may also be shown."}, {"self_ref": "#/texts/231", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 449.10074000000003, "t": 308.99817, "r": 493.37906000000004, "b": 306.87708, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 81]}], "orig": "$ L U S R U W ( O H Y D W L R Q D Q G 7 R X F K G R Z Q = R Q H ( O H Y D W L R Q", "text": "$ L U S R U W ( O H Y D W L R Q D Q G 7 R X F K G R Z Q = R Q H ( O H Y D W L R Q"}, {"self_ref": "#/texts/232", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 449.10074000000003, "t": 304.4408, "r": 551.80023, "b": 295.48364, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 496]}], "orig": "The airport elevation is shown enclosed within a box in the upper left corner of the sketch box and the touchdown zone elevation (TDZE) is shown in the upper right corner of the sketch box. The airport elevation is the highest point of an D L U S R U W \u00b6 V X V D E O H U X Q Z D \\ V P H D V X U H G L Q I H H W I U R P P H D Q V H D O H Y H O 7 K H 7 ' = ( L V W K H K L J K H V W H O H Y D W L R Q L Q W K H \u00bf U V W I H H W R I the landing surface. Circling only approaches will not show a TDZE.", "text": "The airport elevation is shown enclosed within a box in the upper left corner of the sketch box and the touchdown zone elevation (TDZE) is shown in the upper right corner of the sketch box. The airport elevation is the highest point of an D L U S R U W \u00b6 V X V D E O H U X Q Z D \\ V P H D V X U H G L Q I H H W I U R P P H D Q V H D O H Y H O 7 K H 7 ' = ( L V W K H K L J K H V W H O H Y D W L R Q L Q W K H \u00bf U V W I H H W R I the landing surface. Circling only approaches will not show a TDZE."}, {"self_ref": "#/texts/233", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 498.80661000000003, "t": 276.05629999999996, "r": 502.08792, "b": 272.98235999999997, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 3]}], "orig": "114", "text": "114"}, {"self_ref": "#/texts/234", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 444.56319999999994, "t": 369.15131, "r": 446.25998, "b": 320.12872, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 70]}], "orig": "FAA Chart Users\u2019 Guide - Terminal Procedures Publication (TPP) - Terms", "text": "FAA Chart Users\u2019 Guide - Terminal Procedures Publication (TPP) - Terms"}, {"self_ref": "#/texts/235", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 329.40536, "t": 412.62463, "r": 355.13138, "b": 409.86664, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 27]}], "orig": "AGL 2013 Financial Calendar", "text": "AGL 2013 Financial Calendar"}, {"self_ref": "#/texts/236", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 329.40536, "t": 409.69727, "r": 330.96848, "b": 407.44073, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "22", "text": "22"}, {"self_ref": "#/texts/237", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 331.75003, "t": 409.69727, "r": 341.12875, "b": 407.44073, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 11]}], "orig": "August 2012", "text": "August 2012"}, {"self_ref": "#/texts/238", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 350.4722, "t": 409.69727, "r": 384.81079, "b": 407.44073, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 51]}], "orig": "2012 full year result and fi nal dividend announced", "text": "2012 full year result and fi nal dividend announced"}, {"self_ref": "#/texts/239", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 329.40536, "t": 407.15448, "r": 330.97336, "b": 404.89795, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "30", "text": "30"}, {"self_ref": "#/texts/240", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 331.75735, "t": 407.15448, "r": 341.16534, "b": 404.89795, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 11]}], "orig": "August 2012", "text": "August 2012"}, {"self_ref": "#/texts/241", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 350.4722, "t": 407.15448, "r": 372.90613, "b": 404.89795, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 29]}], "orig": "Ex-dividend trading commences", "text": "Ex-dividend trading commences"}, {"self_ref": "#/texts/242", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 329.40536, "t": 404.61172, "r": 330.20337, "b": 402.35516000000007, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "5", "text": "5"}, {"self_ref": "#/texts/243", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 331.00137, "t": 404.61172, "r": 342.9715, "b": 402.35516000000007, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 14]}], "orig": "September 2012", "text": "September 2012"}, {"self_ref": "#/texts/244", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 350.4722, "t": 404.61172, "r": 374.88693, "b": 402.35516000000007, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 36]}], "orig": "Record date for 2012 fi nal dividend", "text": "Record date for 2012 fi nal dividend"}, {"self_ref": "#/texts/245", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 329.40536, "t": 402.06897, "r": 331.0173, "b": 399.81238, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "27", "text": "27"}, {"self_ref": "#/texts/246", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 331.82327, "t": 402.06897, "r": 343.91284, "b": 399.81238, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 14]}], "orig": "September 2012", "text": "September 2012"}, {"self_ref": "#/texts/247", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 350.4722, "t": 402.06897, "r": 365.65988, "b": 399.81238, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 22]}], "orig": "Final dividend payable", "text": "Final dividend payable"}, {"self_ref": "#/texts/248", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 329.40536, "t": 399.52618, "r": 330.98804, "b": 397.26962000000003, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "23", "text": "23"}, {"self_ref": "#/texts/249", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 331.77936, "t": 399.52618, "r": 342.06674, "b": 397.26962000000003, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 12]}], "orig": "October 2012", "text": "October 2012"}, {"self_ref": "#/texts/250", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 350.4722, "t": 399.52618, "r": 367.22156, "b": 397.26962000000003, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 22]}], "orig": "Annual General Meeting", "text": "Annual General Meeting"}, {"self_ref": "#/texts/251", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 329.40536, "t": 396.9834, "r": 330.99741, "b": 394.72687, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "27", "text": "27"}, {"self_ref": "#/texts/252", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 331.7934, "t": 396.9834, "r": 342.1416, "b": 394.72687, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 13]}], "orig": "February 2013", "text": "February 2013"}, {"self_ref": "#/texts/253", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 342.64841, "t": 396.81702, "r": 342.65811, "b": 395.50142999999997, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "1", "text": "1"}, {"self_ref": "#/texts/254", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 350.47177, "t": 396.98526, "r": 386.25897, "b": 394.7287, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 50]}], "orig": "2013 interim result and interim dividend announced", "text": "2013 interim result and interim dividend announced"}, {"self_ref": "#/texts/255", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 329.40491, "t": 394.44250000000005, "r": 331.02695, "b": 392.18594, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "28", "text": "28"}, {"self_ref": "#/texts/256", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 331.83795, "t": 394.44250000000005, "r": 340.75909, "b": 392.18594, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 11]}], "orig": "August 2013", "text": "August 2013"}, {"self_ref": "#/texts/257", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 341.26437, "t": 394.2746, "r": 341.27408, "b": 392.95905, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "1", "text": "1"}, {"self_ref": "#/texts/258", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 350.47144, "t": 394.44287, "r": 385.93265, "b": 392.18631, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 52]}], "orig": "2013 full year results and fi nal dividend announced", "text": "2013 full year results and fi nal dividend announced"}, {"self_ref": "#/texts/259", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 329.40536, "t": 391.53845, "r": 329.87708, "b": 390.03412, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "1", "text": "1"}, {"self_ref": "#/texts/260", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 330.34882, "t": 391.53845, "r": 358.65204, "b": 390.03412, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 60]}], "orig": "Indicative dates only, subject to change/Board confi rmation", "text": "Indicative dates only, subject to change/Board confi rmation"}, {"self_ref": "#/texts/261", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 329.40536, "t": 387.65497, "r": 391.771, "b": 385.39844, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 87]}], "orig": "AGL\u2019s Annual General Meeting will be held at the City Recital Hall, Angel Place, Sydney", "text": "AGL\u2019s Annual General Meeting will be held at the City Recital Hall, Angel Place, Sydney"}, {"self_ref": "#/texts/262", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 329.40536, "t": 385.62143, "r": 369.65308, "b": 383.36486999999994, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 49]}], "orig": "commencing at 10.30am on Tuesday 23 October 2012.", "text": "commencing at 10.30am on Tuesday 23 October 2012."}, {"self_ref": "#/texts/263", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 363.54486, "t": 331.46945000000005, "r": 379.25955, "b": 326.45493, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 13]}], "orig": "Ye s te rd ay", "text": "Ye s te rd ay"}, {"self_ref": "#/texts/264", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 363.54486, "t": 325.2843, "r": 391.38229, "b": 323.02777, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 39]}], "orig": "Established in Sydney in 1837, and then", "text": "Established in Sydney in 1837, and then"}, {"self_ref": "#/texts/265", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 363.54486, "t": 323.25076, "r": 395.01788, "b": 320.99423, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 42]}], "orig": "known as The Australian Gas Light Company,", "text": "known as The Australian Gas Light Company,"}, {"self_ref": "#/texts/266", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 363.54486, "t": 321.21719, "r": 394.08322, "b": 318.96066, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 43]}], "orig": "the AGL business has an established history", "text": "the AGL business has an established history"}, {"self_ref": "#/texts/267", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 363.54486, "t": 319.18365, "r": 390.60727, "b": 316.92712, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 38]}], "orig": "and reputation for serving the gas and", "text": "and reputation for serving the gas and"}, {"self_ref": "#/texts/268", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 363.54486, "t": 317.15012, "r": 393.49612, "b": 314.89355, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 43]}], "orig": "electricity needs of Australian households.", "text": "electricity needs of Australian households."}, {"self_ref": "#/texts/269", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 363.54486, "t": 315.11655, "r": 394.11481, "b": 312.86002, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 43]}], "orig": "In 1841, when AGL supplied the gas to light", "text": "In 1841, when AGL supplied the gas to light"}, {"self_ref": "#/texts/270", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 363.54486, "t": 313.08301, "r": 393.75891, "b": 310.82648, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 46]}], "orig": "the fi rst public street lamp, it was reported", "text": "the fi rst public street lamp, it was reported"}, {"self_ref": "#/texts/271", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 363.54486, "t": 311.04947, "r": 390.4975, "b": 308.79291, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 37]}], "orig": "in the Sydney Gazette as a \u201cwonderful", "text": "in the Sydney Gazette as a \u201cwonderful"}, {"self_ref": "#/texts/272", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 363.54486, "t": 309.0159, "r": 395.70975, "b": 306.75937, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 46]}], "orig": "achievement of scientifi c knowledge, assisted", "text": "achievement of scientifi c knowledge, assisted"}, {"self_ref": "#/texts/273", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 363.54486, "t": 306.98236, "r": 394.27283, "b": 304.7258, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 43]}], "orig": "by mechanical ingenuity.\u201d Within two years,", "text": "by mechanical ingenuity.\u201d Within two years,"}, {"self_ref": "#/texts/274", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 363.54486, "t": 304.94879, "r": 396.65939, "b": 302.69226, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 47]}], "orig": "165 gas lamps were lighting the City of Sydney.", "text": "165 gas lamps were lighting the City of Sydney."}, {"self_ref": "#/texts/275", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 329.4054, "t": 372.06876, "r": 384.19696, "b": 360.90588, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 15]}], "orig": "Looking back on", "text": "Looking back on"}, {"self_ref": "#/texts/276", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 329.4054, "t": 361.89621, "r": 372.16626, "b": 350.73331, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 12]}], "orig": "175 years of", "text": "175 years of"}, {"self_ref": "#/texts/277", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 329.4054, "t": 351.72363000000007, "r": 385.3981, "b": 340.56076, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 16]}], "orig": "looking forward.", "text": "looking forward."}, {"self_ref": "#/texts/278", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 329.40536, "t": 419.83841, "r": 353.36179, "b": 418.08331, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 37]}], "orig": "AGL Energy Limited ABN 74 115 061 375", "text": "AGL Energy Limited ABN 74 115 061 375"}, {"self_ref": "#/texts/279", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 546.20587, "t": 431.09552, "r": 548.23407, "b": 429.17758, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "29", "text": "29"}, {"self_ref": "#/texts/280", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 497.77728, "t": 540.56616, "r": 542.8255, "b": 537.05615, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 32]}], "orig": "signs, signals and road markings", "text": "signs, signals and road markings"}, {"self_ref": "#/texts/281", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 490.30679, "t": 540.52521, "r": 492.09982, "b": 537.0152, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "3", "text": "3"}, {"self_ref": "#/texts/282", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 498.15335, "t": 528.11078, "r": 500.05637, "b": 526.07281, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "In", "text": "In"}, {"self_ref": "#/texts/283", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 500.05637, "t": 528.14282, "r": 524.37036, "b": 526.1369, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 31]}], "orig": "chapter 2, you and your vehicle", "text": "chapter 2, you and your vehicle"}, {"self_ref": "#/texts/284", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 524.37036, "t": 528.11078, "r": 539.89124, "b": 526.07281, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 19]}], "orig": ", you learned about", "text": ", you learned about"}, {"self_ref": "#/texts/285", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 498.15335, "t": 526.06775, "r": 544.50403, "b": 524.02979, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 61]}], "orig": "some of the controls in your vehicle. This chapter is a handy", "text": "some of the controls in your vehicle. This chapter is a handy"}, {"self_ref": "#/texts/286", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 498.15335, "t": 524.02466, "r": 544.01343, "b": 521.98669, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 56]}], "orig": "reference section that gives examples of the most common", "text": "reference section that gives examples of the most common"}, {"self_ref": "#/texts/287", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 498.15335, "t": 521.98169, "r": 544.11987, "b": 519.94366, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 61]}], "orig": "signs, signals and road markings that keep traffi c organized", "text": "signs, signals and road markings that keep traffi c organized"}, {"self_ref": "#/texts/288", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 498.15335, "t": 519.9386, "r": 515.41071, "b": 517.90063, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 21]}], "orig": "and flowing smoothly.", "text": "and flowing smoothly."}, {"self_ref": "#/texts/289", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 498.15335, "t": 514.65381, "r": 505.64642000000003, "b": 511.0643, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 5]}], "orig": "Signs", "text": "Signs"}, {"self_ref": "#/texts/290", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 498.15335, "t": 510.17813, "r": 543.92957, "b": 508.14017, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 62]}], "orig": "There are three ways to read signs: by their shape, colour and", "text": "There are three ways to read signs: by their shape, colour and"}, {"self_ref": "#/texts/291", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 498.15335, "t": 508.1351, "r": 545.67834, "b": 506.09711, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 60]}], "orig": "the messages printed on them. Understanding these three ways", "text": "the messages printed on them. Understanding these three ways"}, {"self_ref": "#/texts/292", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 498.15335, "t": 506.09204, "r": 545.26471, "b": 504.05408, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 66]}], "orig": "of classifying signs will help you figure out the meaning of signs", "text": "of classifying signs will help you figure out the meaning of signs"}, {"self_ref": "#/texts/293", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 498.15335, "t": 504.04901, "r": 513.31335, "b": 502.01105, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 20]}], "orig": "that are new to you.", "text": "that are new to you."}, {"self_ref": "#/texts/294", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 505.43439, "t": 488.92404, "r": 508.53033000000005, "b": 487.10361, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "Stop", "text": "Stop"}, {"self_ref": "#/texts/295", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 527.45502, "t": 488.74646, "r": 541.44678, "b": 486.92603, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 22]}], "orig": "Yield the right-of-way", "text": "Yield the right-of-way"}, {"self_ref": "#/texts/296", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 501.79385, "t": 470.81027, "r": 510.41632, "b": 468.98984, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 13]}], "orig": "Shows driving", "text": "Shows driving"}, {"self_ref": "#/texts/297", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 501.79385, "t": 469.12268000000006, "r": 509.04268999999994, "b": 467.30224999999996, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 11]}], "orig": "regulations", "text": "regulations"}, {"self_ref": "#/texts/298", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 518.66455, "t": 472.40854, "r": 529.80902, "b": 470.58809999999994, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 17]}], "orig": "Explains lane use", "text": "Explains lane use"}, {"self_ref": "#/texts/299", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 534.87561, "t": 473.62384, "r": 546.95142, "b": 471.80341, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 17]}], "orig": "School zone signs", "text": "School zone signs"}, {"self_ref": "#/texts/300", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 534.87561, "t": 471.9362499999999, "r": 545.05762, "b": 470.11581, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 16]}], "orig": "are fl uorescent", "text": "are fl uorescent"}, {"self_ref": "#/texts/301", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 534.87561, "t": 470.24866, "r": 543.32263, "b": 468.42822, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 12]}], "orig": "yellow-green", "text": "yellow-green"}, {"self_ref": "#/texts/302", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 499.21862999999996, "t": 453.87228, "r": 512.62451, "b": 452.05185, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 20]}], "orig": "Tells about motorist", "text": "Tells about motorist"}, {"self_ref": "#/texts/303", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 499.21862999999996, "t": 452.18468999999993, "r": 504.39917, "b": 450.36426, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 8]}], "orig": "services", "text": "services"}, {"self_ref": "#/texts/304", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 516.97748, "t": 453.93961, "r": 529.77484, "b": 452.11917000000005, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 17]}], "orig": "Shows a permitted", "text": "Shows a permitted"}, {"self_ref": "#/texts/305", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 516.97748, "t": 452.25201, "r": 520.96399, "b": 450.43158, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 6]}], "orig": "action", "text": "action"}, {"self_ref": "#/texts/306", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 534.55847, "t": 454.11719, "r": 548.58453, "b": 452.2967499999999, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 20]}], "orig": "Shows an action that", "text": "Shows an action that"}, {"self_ref": "#/texts/307", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 534.55847, "t": 452.42959999999994, "r": 545.08862, "b": 450.60916, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 16]}], "orig": "is not permitted", "text": "is not permitted"}, {"self_ref": "#/texts/308", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 483.05853, "t": 435.82584, "r": 494.72577, "b": 434.0054, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 16]}], "orig": "Warns of hazards", "text": "Warns of hazards"}, {"self_ref": "#/texts/309", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 483.05853, "t": 434.13821, "r": 487.07525999999996, "b": 432.31778, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 5]}], "orig": "ahead", "text": "ahead"}, {"self_ref": "#/texts/310", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 499.39645, "t": 435.73702999999995, "r": 504.69171, "b": 433.9166, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 8]}], "orig": "Warns of", "text": "Warns of"}, {"self_ref": "#/texts/311", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 499.39645, "t": 434.04944, "r": 511.69116, "b": 432.22900000000004, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 18]}], "orig": "construction zones", "text": "construction zones"}, {"self_ref": "#/texts/312", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 516.75891, "t": 435.73702999999995, "r": 527.42938, "b": 433.9166, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 16]}], "orig": "Railway crossing", "text": "Railway crossing"}, {"self_ref": "#/texts/313", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 534.5141, "t": 439.07019, "r": 547.89862, "b": 437.24976, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 18]}], "orig": "Shows distance and", "text": "Shows distance and"}, {"self_ref": "#/texts/314", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 534.5141, "t": 437.3826, "r": 540.2818, "b": 435.56216, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 9]}], "orig": "direction", "text": "direction"}, {"self_ref": "#/texts/315", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 478.37466, "t": 521.85925, "r": 479.14251999999993, "b": 519.82123, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "\u2022", "text": "\u2022"}, {"self_ref": "#/texts/316", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 479.91036999999994, "t": 521.85925, "r": 483.74963, "b": 519.82123, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 5]}], "orig": "Signs", "text": "Signs"}, {"self_ref": "#/texts/317", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 479.97293, "t": 519.15283, "r": 492.31219, "b": 517.65112, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 18]}], "orig": "- regulatory signs", "text": "- regulatory signs"}, {"self_ref": "#/texts/318", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 479.97293, "t": 516.85486, "r": 486.72598000000005, "b": 515.35321, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 9]}], "orig": "- school,", "text": "- school,"}, {"self_ref": "#/texts/319", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 481.21602999999993, "t": 515.22028, "r": 492.93286000000006, "b": 513.18231, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 14]}], "orig": "playground and", "text": "playground and"}, {"self_ref": "#/texts/320", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 481.21602999999993, "t": 513.17725, "r": 491.82938000000007, "b": 511.13925, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 15]}], "orig": "crosswalk signs", "text": "crosswalk signs"}, {"self_ref": "#/texts/321", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 479.97293, "t": 510.47241, "r": 491.00775000000004, "b": 508.97076, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 16]}], "orig": "- lane use signs", "text": "- lane use signs"}, {"self_ref": "#/texts/322", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 479.97293, "t": 508.17444, "r": 493.32748, "b": 506.6727900000001, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 20]}], "orig": "- turn control signs", "text": "- turn control signs"}, {"self_ref": "#/texts/323", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 479.97293, "t": 505.8765, "r": 490.4915199999999, "b": 504.37482, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 15]}], "orig": "- parking signs", "text": "- parking signs"}, {"self_ref": "#/texts/324", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 479.97293, "t": 503.57852, "r": 491.17004000000003, "b": 502.07684, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 15]}], "orig": "- reserved lane", "text": "- reserved lane"}, {"self_ref": "#/texts/325", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 481.21602999999993, "t": 501.94394000000005, "r": 484.77405000000005, "b": 499.90594, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 5]}], "orig": "signs", "text": "signs"}, {"self_ref": "#/texts/326", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 479.97293, "t": 499.23830999999996, "r": 490.83398, "b": 497.73666, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 15]}], "orig": "- warning signs", "text": "- warning signs"}, {"self_ref": "#/texts/327", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 479.97293, "t": 496.94037, "r": 491.62692, "b": 495.43869, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 16]}], "orig": "- object markers", "text": "- object markers"}, {"self_ref": "#/texts/328", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 479.97293, "t": 494.6424, "r": 490.37341, "b": 493.1407500000001, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 14]}], "orig": "- construction", "text": "- construction"}, {"self_ref": "#/texts/329", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 481.21602999999993, "t": 493.00781, "r": 484.77405000000005, "b": 490.96985, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 5]}], "orig": "signs", "text": "signs"}, {"self_ref": "#/texts/330", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 479.97293, "t": 490.30219000000005, "r": 492.93912, "b": 488.80054, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 17]}], "orig": "- information and", "text": "- information and"}, {"self_ref": "#/texts/331", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 481.21602999999993, "t": 488.6676, "r": 493.00525, "b": 486.62964, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 17]}], "orig": "destination signs", "text": "destination signs"}, {"self_ref": "#/texts/332", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 479.97293, "t": 485.9620100000001, "r": 489.99047999999993, "b": 484.46033, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 15]}], "orig": "- railway signs", "text": "- railway signs"}, {"self_ref": "#/texts/333", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 478.375, "t": 483.75211, "r": 479.1032400000001, "b": 481.71414, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "\u2022", "text": "\u2022"}, {"self_ref": "#/texts/334", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 479.83151, "t": 483.75211, "r": 484.92925999999994, "b": 481.71414, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 7]}], "orig": "Signals", "text": "Signals"}, {"self_ref": "#/texts/335", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 479.97293, "t": 481.04642, "r": 490.00091999999995, "b": 479.54474, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 14]}], "orig": "- lane control", "text": "- lane control"}, {"self_ref": "#/texts/336", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 481.21602999999993, "t": 479.4118000000001, "r": 485.95331, "b": 477.37384, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 7]}], "orig": "signals", "text": "signals"}, {"self_ref": "#/texts/337", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 479.97293, "t": 476.70621, "r": 489.29876999999993, "b": 475.20456, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 16]}], "orig": "- traffic lights", "text": "- traffic lights"}, {"self_ref": "#/texts/338", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 478.375, "t": 474.49634, "r": 479.18129999999996, "b": 472.4583400000001, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "\u2022", "text": "\u2022"}, {"self_ref": "#/texts/339", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 479.98761, "t": 474.49634, "r": 490.46960000000007, "b": 472.4583400000001, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 13]}], "orig": "Road markings", "text": "Road markings"}, {"self_ref": "#/texts/340", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 479.97293, "t": 471.79062, "r": 489.26166000000006, "b": 470.28897, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 14]}], "orig": "- yellow lines", "text": "- yellow lines"}, {"self_ref": "#/texts/341", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 479.97293, "t": 469.49268, "r": 488.59189, "b": 467.991, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 13]}], "orig": "- white lines", "text": "- white lines"}, {"self_ref": "#/texts/342", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 479.97293, "t": 467.1947, "r": 491.17004000000003, "b": 465.69302, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 15]}], "orig": "- reserved lane", "text": "- reserved lane"}, {"self_ref": "#/texts/343", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 481.21602999999993, "t": 465.56012, "r": 487.58978, "b": 463.52216, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 8]}], "orig": "markings", "text": "markings"}, {"self_ref": "#/texts/344", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 479.97293, "t": 462.85449, "r": 491.75177, "b": 461.35284, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 16]}], "orig": "- other markings", "text": "- other markings"}, {"self_ref": "#/texts/345", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 478.15246999999994, "t": 526.92969, "r": 493.75586, "b": 523.93127, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 15]}], "orig": "in this chapter", "text": "in this chapter"}, {"self_ref": "#/texts/346", "parent": {"cref": "#/body"}, "children": [], "label": "section_header", "prov": [{"page_no": 1, "bbox": {"l": 317.9549865722656, "t": 199.53408813476562, "r": 379.82049560546875, "b": 189.22499084472656, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 8]}], "orig": "KEYWORDS", "text": "KEYWORDS", "level": 1}, {"self_ref": "#/texts/347", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 317.9549865722656, "t": 184.3324432373047, "r": 559.1859741210938, "b": 164.9988250732422, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 90]}], "orig": "PDF document conversion, layout segmentation, object-detection, data set, Machine Learning", "text": "PDF document conversion, layout segmentation, object-detection, data set, Machine Learning"}, {"self_ref": "#/texts/348", "parent": {"cref": "#/body"}, "children": [], "label": "section_header", "prov": [{"page_no": 1, "bbox": {"l": 317.65997314453125, "t": 151.94566345214844, "r": 404.6536560058594, "b": 144.41390991210938, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 21]}], "orig": "ACM Reference Format:", "text": "ACM Reference Format:", "level": 1}, {"self_ref": "#/texts/349", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 317.9549865722656, "t": 141.88003540039062, "r": 559.5494995117188, "b": 84.62297058105469, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 374]}], "orig": "Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar. 2022. DocLayNet: A Large Human-Annotated Dataset for DocumentLayout Analysis. In Proceedings of the 28th ACM SIGKDD Conference on Knowledge Discovery and Data Mining (KDD '22), August 14-18, 2022, Washington, DC, USA. ACM, New York, NY, USA, 9 pages. https://doi.org/10.1145/ 3534678.3539043", "text": "Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar. 2022. DocLayNet: A Large Human-Annotated Dataset for DocumentLayout Analysis. In Proceedings of the 28th ACM SIGKDD Conference on Knowledge Discovery and Data Mining (KDD '22), August 14-18, 2022, Washington, DC, USA. ACM, New York, NY, USA, 9 pages. https://doi.org/10.1145/ 3534678.3539043"}, {"self_ref": "#/texts/350", "parent": {"cref": "#/body"}, "children": [], "label": "page_header", "prov": [{"page_no": 2, "bbox": {"l": 53.79800033569336, "t": 731.6909790039062, "r": 558.202880859375, "b": 723.4239501953125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 130]}], "orig": "KDD \u201922, August 14-18, 2022, Washington, DC, USA Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar", "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar"}, {"self_ref": "#/texts/351", "parent": {"cref": "#/body"}, "children": [], "label": "section_header", "prov": [{"page_no": 2, "bbox": {"l": 53.79800033569336, "t": 706.14013671875, "r": 156.52899169921875, "b": 695.8309936523438, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 14]}], "orig": "1 INTRODUCTION", "text": "1 INTRODUCTION", "level": 1}, {"self_ref": "#/texts/352", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 53.52899932861328, "t": 681.0164794921875, "r": 303.0169677734375, "b": 563.0528564453125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 702]}], "orig": "Despite the substantial improvements achieved with machine-learning (ML) approaches and deep neural networks in recent years, document conversion remains a challenging problem, as demonstrated by the numerous public competitions held on this topic [1-4]. The challenge originates from the huge variability in PDF documents regarding layout, language and formats (scanned, programmatic or a combination of both). Engineering a single ML model that can be applied on all types of documents and provides high-quality layout segmentation remains to this day extremely challenging [5]. To highlight the variability in document layouts, we show a few example documents from the DocLayNet dataset in Figure 1.", "text": "Despite the substantial improvements achieved with machine-learning (ML) approaches and deep neural networks in recent years, document conversion remains a challenging problem, as demonstrated by the numerous public competitions held on this topic [1-4]. The challenge originates from the huge variability in PDF documents regarding layout, language and formats (scanned, programmatic or a combination of both). Engineering a single ML model that can be applied on all types of documents and provides high-quality layout segmentation remains to this day extremely challenging [5]. To highlight the variability in document layouts, we show a few example documents from the DocLayNet dataset in Figure 1."}, {"self_ref": "#/texts/353", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 53.52899932861328, "t": 560.4684448242188, "r": 295.5641174316406, "b": 289.0808410644531, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1580]}], "orig": "A key problem in the process of document conversion is to understand the structure of a single document page, i.e. which segments of text should be grouped together in a unit. To train models for this task, there are currently two large datasets available to the community, PubLayNet [6] and DocBank [7]. They were introduced in 2019 and 2020 respectively and significantly accelerated the implementation of layout detection and segmentation models due to their sizes of 300K and 500K ground-truth pages. These sizes were achieved by leveraging an automation approach. The benefit of automated ground-truth generation is obvious: one can generate large ground-truth datasets at virtually no cost. However, the automation introduces a constraint on the variability in the dataset, because corresponding structured source data must be available. PubLayNet and DocBank were both generated from scientific document repositories (PubMed and arXiv), which provide XML or L A T E X sources. Those scientific documents present a limited variability in their layouts, because they are typeset in uniform templates provided by the publishers. Obviously, documents such as technical manuals, annual company reports, legal text, government tenders, etc. have very different and partially unique layouts. As a consequence, the layout predictions obtained from models trained on PubLayNet or DocBank is very reasonable when applied on scientific documents. However, for more artistic or free-style layouts, we see sub-par prediction quality from these models, which we demonstrate in Section 5.", "text": "A key problem in the process of document conversion is to understand the structure of a single document page, i.e. which segments of text should be grouped together in a unit. To train models for this task, there are currently two large datasets available to the community, PubLayNet [6] and DocBank [7]. They were introduced in 2019 and 2020 respectively and significantly accelerated the implementation of layout detection and segmentation models due to their sizes of 300K and 500K ground-truth pages. These sizes were achieved by leveraging an automation approach. The benefit of automated ground-truth generation is obvious: one can generate large ground-truth datasets at virtually no cost. However, the automation introduces a constraint on the variability in the dataset, because corresponding structured source data must be available. PubLayNet and DocBank were both generated from scientific document repositories (PubMed and arXiv), which provide XML or L A T E X sources. Those scientific documents present a limited variability in their layouts, because they are typeset in uniform templates provided by the publishers. Obviously, documents such as technical manuals, annual company reports, legal text, government tenders, etc. have very different and partially unique layouts. As a consequence, the layout predictions obtained from models trained on PubLayNet or DocBank is very reasonable when applied on scientific documents. However, for more artistic or free-style layouts, we see sub-par prediction quality from these models, which we demonstrate in Section 5."}, {"self_ref": "#/texts/354", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 53.59199905395508, "t": 286.4964599609375, "r": 295.56396484375, "b": 212.36782836914062, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 462]}], "orig": "In this paper, we present the DocLayNet dataset. It provides pageby-page layout annotation ground-truth using bounding-boxes for 11 distinct class labels on 80863 unique document pages, of which a fraction carry double- or triple-annotations. DocLayNet is similar in spirit to PubLayNet and DocBank and will likewise be made available to the public 1 in order to stimulate the document-layout analysis community. It distinguishes itself in the following aspects:", "text": "In this paper, we present the DocLayNet dataset. It provides pageby-page layout annotation ground-truth using bounding-boxes for 11 distinct class labels on 80863 unique document pages, of which a fraction carry double- or triple-annotations. DocLayNet is similar in spirit to PubLayNet and DocBank and will likewise be made available to the public 1 in order to stimulate the document-layout analysis community. It distinguishes itself in the following aspects:"}, {"self_ref": "#/texts/355", "parent": {"cref": "#/groups/0"}, "children": [], "label": "list_item", "prov": [{"page_no": 2, "bbox": {"l": 64.70800018310547, "t": 207.41844177246094, "r": 295.5616455078125, "b": 177.12582397460938, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 149]}], "orig": "(1) Human Annotation : In contrast to PubLayNet and DocBank, we relied on human annotation instead of automation approaches to generate the data set.", "text": "(1) Human Annotation : In contrast to PubLayNet and DocBank, we relied on human annotation instead of automation approaches to generate the data set.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/356", "parent": {"cref": "#/groups/0"}, "children": [], "label": "list_item", "prov": [{"page_no": 2, "bbox": {"l": 64.70800018310547, "t": 174.54144287109375, "r": 294.2625427246094, "b": 155.20883178710938, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 109]}], "orig": "(2) Large Layout Variability : We include diverse and complex layouts from a large variety of public sources.", "text": "(2) Large Layout Variability : We include diverse and complex layouts from a large variety of public sources.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/357", "parent": {"cref": "#/groups/0"}, "children": [], "label": "list_item", "prov": [{"page_no": 2, "bbox": {"l": 64.70800018310547, "t": 152.62445068359375, "r": 294.6838073730469, "b": 122.33183288574219, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 180]}], "orig": "(3) Detailed Label Set : We define 11 class labels to distinguish layout features in high detail. PubLayNet provides 5 labels; DocBank provides 13, although not a superset of ours.", "text": "(3) Detailed Label Set : We define 11 class labels to distinguish layout features in high detail. PubLayNet provides 5 labels; DocBank provides 13, although not a superset of ours.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/358", "parent": {"cref": "#/groups/0"}, "children": [], "label": "list_item", "prov": [{"page_no": 2, "bbox": {"l": 64.70800018310547, "t": 119.7474365234375, "r": 295.56439208984375, "b": 100.41383361816406, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 115]}], "orig": "(4) Redundant Annotations : A fraction of the pages in the DocLayNet data set carry more than one human annotation.", "text": "(4) Redundant Annotations : A fraction of the pages in the DocLayNet data set carry more than one human annotation.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/359", "parent": {"cref": "#/body"}, "children": [], "label": "footnote", "prov": [{"page_no": 2, "bbox": {"l": 53.672000885009766, "t": 89.77363586425781, "r": 216.02749633789062, "b": 83.2601089477539, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 60]}], "orig": "$^{1}$https://developer.ibm.com/exchanges/data/all/doclaynet", "text": "$^{1}$https://developer.ibm.com/exchanges/data/all/doclaynet"}, {"self_ref": "#/texts/360", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 342.0950012207031, "t": 704.636474609375, "r": 558.4320068359375, "b": 685.3028564453125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 86]}], "orig": "This enables experimentation with annotation uncertainty and quality control analysis.", "text": "This enables experimentation with annotation uncertainty and quality control analysis."}, {"self_ref": "#/texts/361", "parent": {"cref": "#/groups/1"}, "children": [], "label": "list_item", "prov": [{"page_no": 2, "bbox": {"l": 328.8650207519531, "t": 682.718505859375, "r": 559.7210083007812, "b": 630.5088500976562, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 280]}], "orig": "(5) Pre-defined Train-, Test- & Validation-set : Like DocBank, we provide fixed train-, test- & validation-sets to ensure proportional representation of the class-labels. Further, we prevent leakage of unique layouts across sets, which has a large effect on model accuracy scores.", "text": "(5) Pre-defined Train-, Test- & Validation-set : Like DocBank, we provide fixed train-, test- & validation-sets to ensure proportional representation of the class-labels. Further, we prevent leakage of unique layouts across sets, which has a large effect on model accuracy scores.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/362", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 317.62298583984375, "t": 624.0244750976562, "r": 559.1903076171875, "b": 571.8138427734375, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 297]}], "orig": "All aspects outlined above are detailed in Section 3. In Section 4, we will elaborate on how we designed and executed this large-scale human annotation campaign. We will also share key insights and lessons learned that might prove helpful for other parties planning to set up annotation campaigns.", "text": "All aspects outlined above are detailed in Section 3. In Section 4, we will elaborate on how we designed and executed this large-scale human annotation campaign. We will also share key insights and lessons learned that might prove helpful for other parties planning to set up annotation campaigns."}, {"self_ref": "#/texts/363", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 317.7309875488281, "t": 569.2294311523438, "r": 559.5819702148438, "b": 484.142822265625, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 506]}], "orig": "In Section 5, we will present baseline accuracy numbers for a variety of object detection methods (Faster R-CNN, Mask R-CNN and YOLOv5) trained on DocLayNet. We further show how the model performance is impacted by varying the DocLayNet dataset size, reducing the label set and modifying the train/test-split. Last but not least, we compare the performance of models trained on PubLayNet, DocBank and DocLayNet and demonstrate that a model trained on DocLayNet provides overall more robust layout recovery.", "text": "In Section 5, we will present baseline accuracy numbers for a variety of object detection methods (Faster R-CNN, Mask R-CNN and YOLOv5) trained on DocLayNet. We further show how the model performance is impacted by varying the DocLayNet dataset size, reducing the label set and modifying the train/test-split. Last but not least, we compare the performance of models trained on PubLayNet, DocBank and DocLayNet and demonstrate that a model trained on DocLayNet provides overall more robust layout recovery."}, {"self_ref": "#/texts/364", "parent": {"cref": "#/body"}, "children": [], "label": "section_header", "prov": [{"page_no": 2, "bbox": {"l": 317.9549865722656, "t": 470.7911071777344, "r": 421.7441101074219, "b": 460.4820251464844, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 14]}], "orig": "2 RELATED WORK", "text": "2 RELATED WORK", "level": 1}, {"self_ref": "#/texts/365", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 317.5249938964844, "t": 445.6674499511719, "r": 559.7161254882812, "b": 327.7038269042969, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 655]}], "orig": "While early approaches in document-layout analysis used rulebased algorithms and heuristics [8], the problem is lately addressed with deep learning methods. The most common approach is to leverage object detection models [9-15]. In the last decade, the accuracy and speed of these models has increased dramatically. Furthermore, most state-of-the-art object detection methods can be trained and applied with very little work, thanks to a standardisation effort of the ground-truth data format [16] and common deep-learning frameworks [17]. Reference data sets such as PubLayNet [6] and DocBank provide their data in the commonly accepted COCO format [16].", "text": "While early approaches in document-layout analysis used rulebased algorithms and heuristics [8], the problem is lately addressed with deep learning methods. The most common approach is to leverage object detection models [9-15]. In the last decade, the accuracy and speed of these models has increased dramatically. Furthermore, most state-of-the-art object detection methods can be trained and applied with very little work, thanks to a standardisation effort of the ground-truth data format [16] and common deep-learning frameworks [17]. Reference data sets such as PubLayNet [6] and DocBank provide their data in the commonly accepted COCO format [16]."}, {"self_ref": "#/texts/366", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 317.9549865722656, "t": 325.1194763183594, "r": 559.1864624023438, "b": 240.03182983398438, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 500]}], "orig": "Lately, new types of ML models for document-layout analysis have emerged in the community [18-21]. These models do not approach the problem of layout analysis purely based on an image representation of the page, as computer vision methods do. Instead, they combine the text tokens and image representation of a page in order to obtain a segmentation. While the reported accuracies appear to be promising, a broadly accepted data format which links geometric and textual features has yet to establish.", "text": "Lately, new types of ML models for document-layout analysis have emerged in the community [18-21]. These models do not approach the problem of layout analysis purely based on an image representation of the page, as computer vision methods do. Instead, they combine the text tokens and image representation of a page in order to obtain a segmentation. While the reported accuracies appear to be promising, a broadly accepted data format which links geometric and textual features has yet to establish."}, {"self_ref": "#/texts/367", "parent": {"cref": "#/body"}, "children": [], "label": "section_header", "prov": [{"page_no": 2, "bbox": {"l": 317.9549865722656, "t": 226.6800994873047, "r": 477.4568786621094, "b": 216.37100219726562, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 23]}], "orig": "3 THE DOCLAYNET DATASET", "text": "3 THE DOCLAYNET DATASET", "level": 1}, {"self_ref": "#/texts/368", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 317.9549865722656, "t": 201.5564422607422, "r": 559.7131958007812, "b": 116.46983337402344, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 522]}], "orig": "DocLayNet contains 80863 PDF pages. Among these, 7059 carry two instances of human annotations, and 1591 carry three. This amounts to 91104 total annotation instances. The annotations provide layout information in the shape of labeled, rectangular boundingboxes. We define 11 distinct labels for layout features, namely Caption , Footnote , Formula , List-item , Page-footer , Page-header , Picture , Section-header , Table , Text , and Title . Our reasoning for picking this particular label set is detailed in Section 4.", "text": "DocLayNet contains 80863 PDF pages. Among these, 7059 carry two instances of human annotations, and 1591 carry three. This amounts to 91104 total annotation instances. The annotations provide layout information in the shape of labeled, rectangular boundingboxes. We define 11 distinct labels for layout features, namely Caption , Footnote , Formula , List-item , Page-footer , Page-header , Picture , Section-header , Table , Text , and Title . Our reasoning for picking this particular label set is detailed in Section 4."}, {"self_ref": "#/texts/369", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 317.9549865722656, "t": 113.88543701171875, "r": 558.2041015625, "b": 83.59282684326172, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 186]}], "orig": "In addition to open intellectual property constraints for the source documents, we required that the documents in DocLayNet adhere to a few conditions. Firstly, we kept scanned documents", "text": "In addition to open intellectual property constraints for the source documents, we required that the documents in DocLayNet adhere to a few conditions. Firstly, we kept scanned documents"}, {"self_ref": "#/texts/370", "parent": {"cref": "#/body"}, "children": [], "label": "page_header", "prov": [{"page_no": 3, "bbox": {"l": 53.79800033569336, "t": 731.6909790039062, "r": 347.0172424316406, "b": 723.4239501953125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 71]}], "orig": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis", "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis"}, {"self_ref": "#/texts/371", "parent": {"cref": "#/body"}, "children": [], "label": "page_header", "prov": [{"page_no": 3, "bbox": {"l": 365.75701904296875, "t": 731.6909790039062, "r": 558.2028198242188, "b": 723.4239501953125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 48]}], "orig": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA"}, {"self_ref": "#/texts/372", "parent": {"cref": "#/body"}, "children": [], "label": "caption", "prov": [{"page_no": 3, "bbox": {"l": 53.79800033569336, "t": 555.885009765625, "r": 294.0437316894531, "b": 536.4527587890625, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 69]}], "orig": "Figure 2: Distribution of DocLayNet pages across document categories.", "text": "Figure 2: Distribution of DocLayNet pages across document categories."}, {"self_ref": "#/texts/373", "parent": {"cref": "#/pictures/1"}, "children": [], "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 237.11293, "t": 658.91284, "r": 262.97623, "b": 650.3858, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 7]}], "orig": "Patents", "text": "Patents"}, {"self_ref": "#/texts/374", "parent": {"cref": "#/pictures/1"}, "children": [], "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 202.87892, "t": 651.53821, "r": 213.89999, "b": 643.01117, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "8%", "text": "8%"}, {"self_ref": "#/texts/375", "parent": {"cref": "#/pictures/1"}, "children": [], "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 207.13306, "t": 698.8423499999999, "r": 237.64882999999998, "b": 690.31531, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 10]}], "orig": "Scientific", "text": "Scientific"}, {"self_ref": "#/texts/376", "parent": {"cref": "#/pictures/1"}, "children": [], "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 184.40349, "t": 673.31793, "r": 199.66519, "b": 664.79089, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 3]}], "orig": "17%", "text": "17%"}, {"self_ref": "#/texts/377", "parent": {"cref": "#/pictures/1"}, "children": [], "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 88.288223, "t": 677.6452600000001, "r": 118.80401, "b": 669.1182300000002, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 9]}], "orig": "Financial", "text": "Financial"}, {"self_ref": "#/texts/378", "parent": {"cref": "#/pictures/1"}, "children": [], "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 136.24422, "t": 661.75592, "r": 151.50592, "b": 653.22888, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 3]}], "orig": "32%", "text": "32%"}, {"self_ref": "#/texts/379", "parent": {"cref": "#/pictures/1"}, "children": [], "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 93.973373, "t": 604.34235, "r": 121.11515, "b": 595.81531, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 7]}], "orig": "Tenders", "text": "Tenders"}, {"self_ref": "#/texts/380", "parent": {"cref": "#/pictures/1"}, "children": [], "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 139.6235, "t": 621.77252, "r": 150.64458, "b": 613.24548, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "6%", "text": "6%"}, {"self_ref": "#/texts/381", "parent": {"cref": "#/pictures/1"}, "children": [], "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 139.88339, "t": 579.49963, "r": 157.68491, "b": 570.9726, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "Laws", "text": "Laws"}, {"self_ref": "#/texts/382", "parent": {"cref": "#/pictures/1"}, "children": [], "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 157.43983, "t": 608.22192, "r": 172.70154, "b": 599.69489, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 3]}], "orig": "16%", "text": "16%"}, {"self_ref": "#/texts/383", "parent": {"cref": "#/pictures/1"}, "children": [], "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 225.47252, "t": 602.70343, "r": 254.29510000000002, "b": 594.17639, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 7]}], "orig": "Manuals", "text": "Manuals"}, {"self_ref": "#/texts/384", "parent": {"cref": "#/pictures/1"}, "children": [], "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 194.40683, "t": 620.87854, "r": 209.66853, "b": 612.3515, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 3]}], "orig": "21%", "text": "21%"}, {"self_ref": "#/texts/385", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 53.79800033569336, "t": 510.19647216796875, "r": 294.2738342285156, "b": 425.1098327636719, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 513]}], "orig": "to a minimum, since they introduce difficulties in annotation (see Section 4). As a second condition, we focussed on medium to large documents ( > 10 pages) with technical content, dense in complex tables, figures, plots and captions. Such documents carry a lot of information value, but are often hard to analyse with high accuracy due to their challenging layouts. Counterexamples of documents not included in the dataset are receipts, invoices, hand-written documents or photographs showing \"text in the wild\".", "text": "to a minimum, since they introduce difficulties in annotation (see Section 4). As a second condition, we focussed on medium to large documents ( > 10 pages) with technical content, dense in complex tables, figures, plots and captions. Such documents carry a lot of information value, but are often hard to analyse with high accuracy due to their challenging layouts. Counterexamples of documents not included in the dataset are receipts, invoices, hand-written documents or photographs showing \"text in the wild\"."}, {"self_ref": "#/texts/386", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 53.57400131225586, "t": 422.52545166015625, "r": 295.5604553222656, "b": 282.6438293457031, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 810]}], "orig": "The pages in DocLayNet can be grouped into six distinct categories, namely Financial Reports , Manuals , Scientific Articles , Laws & Regulations , Patents and Government Tenders . Each document category was sourced from various repositories. For example, Financial Reports contain both free-style format annual reports 2 which expose company-specific, artistic layouts as well as the more formal SEC filings. The two largest categories ( Financial Reports and Manuals ) contain a large amount of free-style layouts in order to obtain maximum variability. In the other four categories, we boosted the variability by mixing documents from independent providers, such as different government websites or publishers. In Figure 2, we show the document categories contained in DocLayNet with their respective sizes.", "text": "The pages in DocLayNet can be grouped into six distinct categories, namely Financial Reports , Manuals , Scientific Articles , Laws & Regulations , Patents and Government Tenders . Each document category was sourced from various repositories. For example, Financial Reports contain both free-style format annual reports 2 which expose company-specific, artistic layouts as well as the more formal SEC filings. The two largest categories ( Financial Reports and Manuals ) contain a large amount of free-style layouts in order to obtain maximum variability. In the other four categories, we boosted the variability by mixing documents from independent providers, such as different government websites or publishers. In Figure 2, we show the document categories contained in DocLayNet with their respective sizes."}, {"self_ref": "#/texts/387", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 53.46699905395508, "t": 280.0594482421875, "r": 295.5615539550781, "b": 184.01382446289062, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 535]}], "orig": "We did not control the document selection with regard to language. The vast majority of documents contained in DocLayNet (close to 95%) are published in English language. However, DocLayNet also contains a number of documents in other languages such as German (2.5%), French (1.0%) and Japanese (1.0%). While the document language has negligible impact on the performance of computer vision methods such as object detection and segmentation models, it might prove challenging for layout analysis methods which exploit textual features.", "text": "We did not control the document selection with regard to language. The vast majority of documents contained in DocLayNet (close to 95%) are published in English language. However, DocLayNet also contains a number of documents in other languages such as German (2.5%), French (1.0%) and Japanese (1.0%). While the document language has negligible impact on the performance of computer vision methods such as object detection and segmentation models, it might prove challenging for layout analysis methods which exploit textual features."}, {"self_ref": "#/texts/388", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 53.79800033569336, "t": 181.429443359375, "r": 295.56396484375, "b": 107.30182647705078, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 413]}], "orig": "To ensure that future benchmarks in the document-layout analysis community can be easily compared, we have split up DocLayNet into pre-defined train-, test- and validation-sets. In this way, we can avoid spurious variations in the evaluation scores due to random splitting in train-, test- and validation-sets. We also ensured that less frequent labels are represented in train and test sets in equal proportions.", "text": "To ensure that future benchmarks in the document-layout analysis community can be easily compared, we have split up DocLayNet into pre-defined train-, test- and validation-sets. In this way, we can avoid spurious variations in the evaluation scores due to random splitting in train-, test- and validation-sets. We also ensured that less frequent labels are represented in train and test sets in equal proportions."}, {"self_ref": "#/texts/389", "parent": {"cref": "#/body"}, "children": [], "label": "footnote", "prov": [{"page_no": 3, "bbox": {"l": 53.79800033569336, "t": 90.34363555908203, "r": 195.78997802734375, "b": 83.83010864257812, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 51]}], "orig": "$^{2}$e.g. AAPL from https://www.annualreports.com/", "text": "$^{2}$e.g. AAPL from https://www.annualreports.com/"}, {"self_ref": "#/texts/390", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 317.62298583984375, "t": 704.636474609375, "r": 559.1918334960938, "b": 630.5088500976562, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 435]}], "orig": "Table 1 shows the overall frequency and distribution of the labels among the different sets. Importantly, we ensure that subsets are only split on full-document boundaries. This avoids that pages of the same document are spread over train, test and validation set, which can give an undesired evaluation advantage to models and lead to overestimation of their prediction accuracy. We will show the impact of this decision in Section 5.", "text": "Table 1 shows the overall frequency and distribution of the labels among the different sets. Importantly, we ensure that subsets are only split on full-document boundaries. This avoids that pages of the same document are spread over train, test and validation set, which can give an undesired evaluation advantage to models and lead to overestimation of their prediction accuracy. We will show the impact of this decision in Section 5."}, {"self_ref": "#/texts/391", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 317.9549865722656, "t": 627.9244384765625, "r": 558.4381103515625, "b": 520.9197998046875, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 645]}], "orig": "In order to accommodate the different types of models currently in use by the community, we provide DocLayNet in an augmented COCO format [16]. This entails the standard COCO ground-truth file (in JSON format) with the associated page images (in PNG format, 1025 \u00d7 1025 pixels). Furthermore, custom fields have been added to each COCO record to specify document category, original document filename and page number. In addition, we also provide the original PDF pages, as well as sidecar files containing parsed PDF text and text-cell coordinates (in JSON). All additional files are linked to the primary page images by their matching filenames.", "text": "In order to accommodate the different types of models currently in use by the community, we provide DocLayNet in an augmented COCO format [16]. This entails the standard COCO ground-truth file (in JSON format) with the associated page images (in PNG format, 1025 \u00d7 1025 pixels). Furthermore, custom fields have been added to each COCO record to specify document category, original document filename and page number. In addition, we also provide the original PDF pages, as well as sidecar files containing parsed PDF text and text-cell coordinates (in JSON). All additional files are linked to the primary page images by their matching filenames."}, {"self_ref": "#/texts/392", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 316.9419860839844, "t": 518.33544921875, "r": 559.7215576171875, "b": 203.11082458496094, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1854]}], "orig": "Despite being cost-intense and far less scalable than automation, human annotation has several benefits over automated groundtruth generation. The first and most obvious reason to leverage human annotations is the freedom to annotate any type of document without requiring a programmatic source. For most PDF documents, the original source document is not available. The latter is not a hard constraint with human annotation, but it is for automated methods. A second reason to use human annotations is that the latter usually provide a more natural interpretation of the page layout. The human-interpreted layout can significantly deviate from the programmatic layout used in typesetting. For example, \"invisible\" tables might be used solely for aligning text paragraphs on columns. Such typesetting tricks might be interpreted by automated methods incorrectly as an actual table, while the human annotation will interpret it correctly as Text or other styles. The same applies to multi-line text elements, when authors decided to space them as \"invisible\" list elements without bullet symbols. A third reason to gather ground-truth through human annotation is to estimate a \"natural\" upper bound on the segmentation accuracy. As we will show in Section 4, certain documents featuring complex layouts can have different but equally acceptable layout interpretations. This natural upper bound for segmentation accuracy can be found by annotating the same pages multiple times by different people and evaluating the inter-annotator agreement. Such a baseline consistency evaluation is very useful to define expectations for a good target accuracy in trained deep neural network models and avoid overfitting (see Table 1). On the flip side, achieving high annotation consistency proved to be a key challenge in human annotation, as we outline in Section 4.", "text": "Despite being cost-intense and far less scalable than automation, human annotation has several benefits over automated groundtruth generation. The first and most obvious reason to leverage human annotations is the freedom to annotate any type of document without requiring a programmatic source. For most PDF documents, the original source document is not available. The latter is not a hard constraint with human annotation, but it is for automated methods. A second reason to use human annotations is that the latter usually provide a more natural interpretation of the page layout. The human-interpreted layout can significantly deviate from the programmatic layout used in typesetting. For example, \"invisible\" tables might be used solely for aligning text paragraphs on columns. Such typesetting tricks might be interpreted by automated methods incorrectly as an actual table, while the human annotation will interpret it correctly as Text or other styles. The same applies to multi-line text elements, when authors decided to space them as \"invisible\" list elements without bullet symbols. A third reason to gather ground-truth through human annotation is to estimate a \"natural\" upper bound on the segmentation accuracy. As we will show in Section 4, certain documents featuring complex layouts can have different but equally acceptable layout interpretations. This natural upper bound for segmentation accuracy can be found by annotating the same pages multiple times by different people and evaluating the inter-annotator agreement. Such a baseline consistency evaluation is very useful to define expectations for a good target accuracy in trained deep neural network models and avoid overfitting (see Table 1). On the flip side, achieving high annotation consistency proved to be a key challenge in human annotation, as we outline in Section 4."}, {"self_ref": "#/texts/393", "parent": {"cref": "#/body"}, "children": [], "label": "section_header", "prov": [{"page_no": 3, "bbox": {"l": 317.9549865722656, "t": 185.15008544921875, "r": 470.2132568359375, "b": 174.8409881591797, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 21]}], "orig": "4 ANNOTATION CAMPAIGN", "text": "4 ANNOTATION CAMPAIGN", "level": 1}, {"self_ref": "#/texts/394", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 317.6860046386719, "t": 160.0264434814453, "r": 559.7138061523438, "b": 85.8978271484375, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 457]}], "orig": "The annotation campaign was carried out in four phases. In phase one, we identified and prepared the data sources for annotation. In phase two, we determined the class labels and how annotations should be done on the documents in order to obtain maximum consistency. The latter was guided by a detailed requirement analysis and exhaustive experiments. In phase three, we trained the annotation staff and performed exams for quality assurance. In phase four,", "text": "The annotation campaign was carried out in four phases. In phase one, we identified and prepared the data sources for annotation. In phase two, we determined the class labels and how annotations should be done on the documents in order to obtain maximum consistency. The latter was guided by a detailed requirement analysis and exhaustive experiments. In phase three, we trained the annotation staff and performed exams for quality assurance. In phase four,"}, {"self_ref": "#/texts/395", "parent": {"cref": "#/body"}, "children": [], "label": "page_header", "prov": [{"page_no": 4, "bbox": {"l": 53.79800033569336, "t": 731.6909790039062, "r": 558.202880859375, "b": 723.4239501953125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 130]}], "orig": "KDD \u201922, August 14-18, 2022, Washington, DC, USA Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar", "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar"}, {"self_ref": "#/texts/396", "parent": {"cref": "#/body"}, "children": [], "label": "caption", "prov": [{"page_no": 4, "bbox": {"l": 53.50199890136719, "t": 707.0450439453125, "r": 558.4896850585938, "b": 676.65380859375, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 348]}], "orig": "Table 1: DocLayNet dataset overview. Along with the frequency of each class label, we present the relative occurrence (as % of row \"Total\") in the train, test and validation sets. The inter-annotator agreement is computed as the mAP@0.5-0.95 metric between pairwise annotations from the triple-annotated pages, from which we obtain accuracy ranges.", "text": "Table 1: DocLayNet dataset overview. Along with the frequency of each class label, we present the relative occurrence (as % of row \"Total\") in the train, test and validation sets. The inter-annotator agreement is computed as the mAP@0.5-0.95 metric between pairwise annotations from the triple-annotated pages, from which we obtain accuracy ranges."}, {"self_ref": "#/texts/397", "parent": {"cref": "#/body"}, "children": [], "label": "caption", "prov": [{"page_no": 4, "bbox": {"l": 53.79800033569336, "t": 237.99000549316406, "r": 295.64874267578125, "b": 185.68075561523438, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 281]}], "orig": "Figure 3: Corpus Conversion Service annotation user interface. The PDF page is shown in the background, with overlaid text-cells (in darker shades). The annotation boxes can be drawn by dragging a rectangle over each segment with the respective label from the palette on the right.", "text": "Figure 3: Corpus Conversion Service annotation user interface. The PDF page is shown in the background, with overlaid text-cells (in darker shades). The annotation boxes can be drawn by dragging a rectangle over each segment with the respective label from the palette on the right."}, {"self_ref": "#/texts/398", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 4, "bbox": {"l": 53.46699905395508, "t": 157.7084503173828, "r": 294.0474548339844, "b": 116.45683288574219, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 231]}], "orig": "we distributed the annotation workload and performed continuous quality controls. Phase one and two required a small team of experts only. For phases three and four, a group of 40 dedicated annotators were assembled and supervised.", "text": "we distributed the annotation workload and performed continuous quality controls. Phase one and two required a small team of experts only. For phases three and four, a group of 40 dedicated annotators were assembled and supervised."}, {"self_ref": "#/texts/399", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 4, "bbox": {"l": 53.79800033569336, "t": 113.989013671875, "r": 295.5584411621094, "b": 83.57982635498047, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 193]}], "orig": "Phase 1: Data selection and preparation. Our inclusion criteria for documents were described in Section 3. A large effort went into ensuring that all documents are free to use. The data sources", "text": "Phase 1: Data selection and preparation. Our inclusion criteria for documents were described in Section 3. A large effort went into ensuring that all documents are free to use. The data sources"}, {"self_ref": "#/texts/400", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 4, "bbox": {"l": 317.9549865722656, "t": 479.92047119140625, "r": 559.1853637695312, "b": 416.7518310546875, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 376]}], "orig": "include publication repositories such as arXiv$^{3}$, government offices, company websites as well as data directory services for financial reports and patents. Scanned documents were excluded wherever possible because they can be rotated or skewed. This would not allow us to perform annotation with rectangular bounding-boxes and therefore complicate the annotation process.", "text": "include publication repositories such as arXiv$^{3}$, government offices, company websites as well as data directory services for financial reports and patents. Scanned documents were excluded wherever possible because they can be rotated or skewed. This would not allow us to perform annotation with rectangular bounding-boxes and therefore complicate the annotation process."}, {"self_ref": "#/texts/401", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 4, "bbox": {"l": 317.9549865722656, "t": 414.1674499511719, "r": 559.7130737304688, "b": 285.2448425292969, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 746]}], "orig": "Preparation work included uploading and parsing the sourced PDF documents in the Corpus Conversion Service (CCS) [22], a cloud-native platform which provides a visual annotation interface and allows for dataset inspection and analysis. The annotation interface of CCS is shown in Figure 3. The desired balance of pages between the different document categories was achieved by selective subsampling of pages with certain desired properties. For example, we made sure to include the title page of each document and bias the remaining page selection to those with figures or tables. The latter was achieved by leveraging pre-trained object detection models from PubLayNet, which helped us estimate how many figures and tables a given page contains.", "text": "Preparation work included uploading and parsing the sourced PDF documents in the Corpus Conversion Service (CCS) [22], a cloud-native platform which provides a visual annotation interface and allows for dataset inspection and analysis. The annotation interface of CCS is shown in Figure 3. The desired balance of pages between the different document categories was achieved by selective subsampling of pages with certain desired properties. For example, we made sure to include the title page of each document and bias the remaining page selection to those with figures or tables. The latter was achieved by leveraging pre-trained object detection models from PubLayNet, which helped us estimate how many figures and tables a given page contains."}, {"self_ref": "#/texts/402", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 4, "bbox": {"l": 317.62298583984375, "t": 282.7770080566406, "r": 559.7176513671875, "b": 98.9438247680664, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1159]}], "orig": "Phase 2: Label selection and guideline. We reviewed the collected documents and identified the most common structural features they exhibit. This was achieved by identifying recurrent layout elements and lead us to the definition of 11 distinct class labels. These 11 class labels are Caption , Footnote , Formula , List-item , Pagefooter , Page-header , Picture , Section-header , Table , Text , and Title . Critical factors that were considered for the choice of these class labels were (1) the overall occurrence of the label, (2) the specificity of the label, (3) recognisability on a single page (i.e. no need for context from previous or next page) and (4) overall coverage of the page. Specificity ensures that the choice of label is not ambiguous, while coverage ensures that all meaningful items on a page can be annotated. We refrained from class labels that are very specific to a document category, such as Abstract in the Scientific Articles category. We also avoided class labels that are tightly linked to the semantics of the text. Labels such as Author and Affiliation , as seen in DocBank, are often only distinguishable by discriminating on", "text": "Phase 2: Label selection and guideline. We reviewed the collected documents and identified the most common structural features they exhibit. This was achieved by identifying recurrent layout elements and lead us to the definition of 11 distinct class labels. These 11 class labels are Caption , Footnote , Formula , List-item , Pagefooter , Page-header , Picture , Section-header , Table , Text , and Title . Critical factors that were considered for the choice of these class labels were (1) the overall occurrence of the label, (2) the specificity of the label, (3) recognisability on a single page (i.e. no need for context from previous or next page) and (4) overall coverage of the page. Specificity ensures that the choice of label is not ambiguous, while coverage ensures that all meaningful items on a page can be annotated. We refrained from class labels that are very specific to a document category, such as Abstract in the Scientific Articles category. We also avoided class labels that are tightly linked to the semantics of the text. Labels such as Author and Affiliation , as seen in DocBank, are often only distinguishable by discriminating on"}, {"self_ref": "#/texts/403", "parent": {"cref": "#/body"}, "children": [], "label": "footnote", "prov": [{"page_no": 4, "bbox": {"l": 317.9549865722656, "t": 89.64663696289062, "r": 369.2456970214844, "b": 83.13311004638672, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 24]}], "orig": "$^{3}$https://arxiv.org/", "text": "$^{3}$https://arxiv.org/"}, {"self_ref": "#/texts/404", "parent": {"cref": "#/body"}, "children": [], "label": "page_header", "prov": [{"page_no": 5, "bbox": {"l": 53.79800033569336, "t": 731.6909790039062, "r": 347.0172424316406, "b": 723.4239501953125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 71]}], "orig": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis", "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis"}, {"self_ref": "#/texts/405", "parent": {"cref": "#/body"}, "children": [], "label": "page_header", "prov": [{"page_no": 5, "bbox": {"l": 365.75701904296875, "t": 731.6909790039062, "r": 558.2028198242188, "b": 723.4239501953125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 48]}], "orig": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA"}, {"self_ref": "#/texts/406", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 53.79800033569336, "t": 704.636474609375, "r": 294.04541015625, "b": 685.2938842773438, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 135]}], "orig": "the textual content of an element, which goes beyond visual layout recognition, in particular outside the Scientific Articles category.", "text": "the textual content of an element, which goes beyond visual layout recognition, in particular outside the Scientific Articles category."}, {"self_ref": "#/texts/407", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 53.79800033569336, "t": 682.7184448242188, "r": 295.5592346191406, "b": 542.8378295898438, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 812]}], "orig": "At first sight, the task of visual document-layout interpretation appears intuitive enough to obtain plausible annotations in most cases. However, during early trial-runs in the core team, we observed many cases in which annotators use different annotation styles, especially for documents with challenging layouts. For example, if a figure is presented with subfigures, one annotator might draw a single figure bounding-box, while another might annotate each subfigure separately. The same applies for lists, where one might annotate all list items in one block or each list item separately. In essence, we observed that challenging layouts would be annotated in different but plausible ways. To illustrate this, we show in Figure 4 multiple examples of plausible but inconsistent annotations on the same pages.", "text": "At first sight, the task of visual document-layout interpretation appears intuitive enough to obtain plausible annotations in most cases. However, during early trial-runs in the core team, we observed many cases in which annotators use different annotation styles, especially for documents with challenging layouts. For example, if a figure is presented with subfigures, one annotator might draw a single figure bounding-box, while another might annotate each subfigure separately. The same applies for lists, where one might annotate all list items in one block or each list item separately. In essence, we observed that challenging layouts would be annotated in different but plausible ways. To illustrate this, we show in Figure 4 multiple examples of plausible but inconsistent annotations on the same pages."}, {"self_ref": "#/texts/408", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 53.79800033569336, "t": 540.2534790039062, "r": 295.56005859375, "b": 455.16583251953125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 465]}], "orig": "Obviously, this inconsistency in annotations is not desirable for datasets which are intended to be used for model training. To minimise these inconsistencies, we created a detailed annotation guideline. While perfect consistency across 40 annotation staff members is clearly not possible to achieve, we saw a huge improvement in annotation consistency after the introduction of our annotation guideline. A few selected, non-trivial highlights of the guideline are:", "text": "Obviously, this inconsistency in annotations is not desirable for datasets which are intended to be used for model training. To minimise these inconsistencies, we created a detailed annotation guideline. While perfect consistency across 40 annotation staff members is clearly not possible to achieve, we saw a huge improvement in annotation consistency after the introduction of our annotation guideline. A few selected, non-trivial highlights of the guideline are:"}, {"self_ref": "#/texts/409", "parent": {"cref": "#/groups/2"}, "children": [], "label": "list_item", "prov": [{"page_no": 5, "bbox": {"l": 64.70800018310547, "t": 443.4874572753906, "r": 294.04620361328125, "b": 402.22686767578125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 202]}], "orig": "(1) Every list-item is an individual object instance with class label List-item . This definition is different from PubLayNet and DocBank, where all list-items are grouped together into one List object.", "text": "(1) Every list-item is an individual object instance with class label List-item . This definition is different from PubLayNet and DocBank, where all list-items are grouped together into one List object.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/410", "parent": {"cref": "#/groups/2"}, "children": [], "label": "list_item", "prov": [{"page_no": 5, "bbox": {"l": 64.70799255371094, "t": 399.6514892578125, "r": 295.563720703125, "b": 358.39984130859375, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 208]}], "orig": "(2) A List-item is a paragraph with hanging indentation. Singleline elements can qualify as List-item if the neighbour elements expose hanging indentation. Bullet or enumeration symbols are not a requirement.", "text": "(2) A List-item is a paragraph with hanging indentation. Singleline elements can qualify as List-item if the neighbour elements expose hanging indentation. Bullet or enumeration symbols are not a requirement.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/411", "parent": {"cref": "#/groups/2"}, "children": [], "label": "list_item", "prov": [{"page_no": 5, "bbox": {"l": 64.70800018310547, "t": 355.81549072265625, "r": 294.0472412109375, "b": 336.4728698730469, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 82]}], "orig": "(3) For every Caption , there must be exactly one corresponding Picture or Table .", "text": "(3) For every Caption , there must be exactly one corresponding Picture or Table .", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/412", "parent": {"cref": "#/groups/2"}, "children": [], "label": "list_item", "prov": [{"page_no": 5, "bbox": {"l": 64.70800018310547, "t": 333.8984680175781, "r": 294.0459899902344, "b": 314.5648193359375, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 70]}], "orig": "(4) Connected sub-pictures are grouped together in one Picture object.", "text": "(4) Connected sub-pictures are grouped together in one Picture object.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/413", "parent": {"cref": "#/groups/2"}, "children": [], "label": "list_item", "prov": [{"page_no": 5, "bbox": {"l": 64.70800018310547, "t": 311.98046875, "r": 264.5057067871094, "b": 303.59686279296875, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 53]}], "orig": "(5) Formula numbers are included in a Formula object.", "text": "(5) Formula numbers are included in a Formula object.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/414", "parent": {"cref": "#/groups/2"}, "children": [], "label": "list_item", "prov": [{"page_no": 5, "bbox": {"l": 64.7080078125, "t": 301.021484375, "r": 294.0461730957031, "b": 270.72882080078125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 160]}], "orig": "(6) Emphasised text (e.g. in italic or bold) at the beginning of a paragraph is not considered a Section-header , unless it appears exclusively on its own line.", "text": "(6) Emphasised text (e.g. in italic or bold) at the beginning of a paragraph is not considered a Section-header , unless it appears exclusively on its own line.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/415", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 53.52899932861328, "t": 259.0494689941406, "r": 295.5625305175781, "b": 217.798828125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 221]}], "orig": "The complete annotation guideline is over 100 pages long and a detailed description is obviously out of scope for this paper. Nevertheless, it will be made publicly available alongside with DocLayNet for future reference.", "text": "The complete annotation guideline is over 100 pages long and a detailed description is obviously out of scope for this paper. Nevertheless, it will be made publicly available alongside with DocLayNet for future reference."}, {"self_ref": "#/texts/416", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 53.79800033569336, "t": 215.3310089111328, "r": 295.562255859375, "b": 86.29182434082031, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 792]}], "orig": "Phase 3: Training. After a first trial with a small group of people, we realised that providing the annotation guideline and a set of random practice pages did not yield the desired quality level for layout annotation. Therefore we prepared a subset of pages with two different complexity levels, each with a practice and an exam part. 974 pages were reference-annotated by one proficient core team member. Annotation staff were then given the task to annotate the same subsets (blinded from the reference). By comparing the annotations of each staff member with the reference annotations, we could quantify how closely their annotations matched the reference. Only after passing two exam levels with high annotation quality, staff were admitted into the production phase. Practice iterations", "text": "Phase 3: Training. After a first trial with a small group of people, we realised that providing the annotation guideline and a set of random practice pages did not yield the desired quality level for layout annotation. Therefore we prepared a subset of pages with two different complexity levels, each with a practice and an exam part. 974 pages were reference-annotated by one proficient core team member. Annotation staff were then given the task to annotate the same subsets (blinded from the reference). By comparing the annotations of each staff member with the reference annotations, we could quantify how closely their annotations matched the reference. Only after passing two exam levels with high annotation quality, staff were admitted into the production phase. Practice iterations"}, {"self_ref": "#/texts/417", "parent": {"cref": "#/body"}, "children": [], "label": "caption", "prov": [{"page_no": 5, "bbox": {"l": 317.9549865722656, "t": 318.5060119628906, "r": 559.8057861328125, "b": 288.11480712890625, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 173]}], "orig": "Figure 4: Examples of plausible annotation alternatives for the same page. Criteria in our annotation guideline can resolve cases A to C, while the case D remains ambiguous.", "text": "Figure 4: Examples of plausible annotation alternatives for the same page. Criteria in our annotation guideline can resolve cases A to C, while the case D remains ambiguous."}, {"self_ref": "#/texts/418", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 340.00214, "t": 612.20703, "r": 416.20551, "b": 610.09027, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 64]}], "orig": "1ef23f5e6d7f10d393f9947e8208285dce9ae87250ac483ac4b4a59d51b4e037", "text": "1ef23f5e6d7f10d393f9947e8208285dce9ae87250ac483ac4b4a59d51b4e037"}, {"self_ref": "#/texts/419", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 339.38269, "t": 706.80933, "r": 417.83722, "b": 699.716, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 25]}], "orig": "Compliant with guidelines", "text": "Compliant with guidelines"}, {"self_ref": "#/texts/420", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 451.42834, "t": 706.80933, "r": 546.22913, "b": 699.716, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 33]}], "orig": "Plausible but invalid alternative", "text": "Plausible but invalid alternative"}, {"self_ref": "#/texts/421", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 350.33701, "t": 427.14294, "r": 513.48035, "b": 420.04964999999993, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 53]}], "orig": "Borderline case: Two guideline-compliant alternatives", "text": "Borderline case: Two guideline-compliant alternatives"}, {"self_ref": "#/texts/422", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 340.00201, "t": 546.92615, "r": 416.20538, "b": 544.80939, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 64]}], "orig": "03c31a2ee1ed1b583c28957f475ee545d144e1b5a264dc4dd068c8d2f6a64860", "text": "03c31a2ee1ed1b583c28957f475ee545d144e1b5a264dc4dd068c8d2f6a64860"}, {"self_ref": "#/texts/423", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 340.00201, "t": 432.87512, "r": 416.20538, "b": 430.75833, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 64]}], "orig": "1a5cd524f1844c1260c8e8c073e1f442423c264583212b0d0b6626fc780e6ed4", "text": "1a5cd524f1844c1260c8e8c073e1f442423c264583212b0d0b6626fc780e6ed4"}, {"self_ref": "#/texts/424", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 322.19424, "t": 693.65894, "r": 326.01498, "b": 687.74786, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "A", "text": "A"}, {"self_ref": "#/texts/425", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 322.19424, "t": 605.00897, "r": 326.01498, "b": 599.09796, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "B", "text": "B"}, {"self_ref": "#/texts/426", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 322.19424, "t": 538.45807, "r": 326.01498, "b": 532.547, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/427", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 322.19424, "t": 424.91504000000003, "r": 326.01498, "b": 419.004, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "D", "text": "D"}, {"self_ref": "#/texts/428", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 400.12841796875, "t": 333.5567321777344, "r": 476.331787109375, "b": 331.43994140625, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 64]}], "orig": "05237a14f2524e3f53c8454b074409d05078038a6a36b770fcc8ec7e540deae0", "text": "05237a14f2524e3f53c8454b074409d05078038a6a36b770fcc8ec7e540deae0"}, {"self_ref": "#/texts/429", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 317.62298583984375, "t": 266.5024719238281, "r": 558.204345703125, "b": 247.1688232421875, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 123]}], "orig": "were carried out over a timeframe of 12 weeks, after which 8 of the 40 initially allocated annotators did not pass the bar.", "text": "were carried out over a timeframe of 12 weeks, after which 8 of the 40 initially allocated annotators did not pass the bar."}, {"self_ref": "#/texts/430", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 317.62298583984375, "t": 244.7010040283203, "r": 559.7149047851562, "b": 82.78482818603516, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 987]}], "orig": "Phase 4: Production annotation. The previously selected 80K pages were annotated with the defined 11 class labels by 32 annotators. This production phase took around three months to complete. All annotations were created online through CCS, which visualises the programmatic PDF text-cells as an overlay on the page. The page annotation are obtained by drawing rectangular bounding-boxes, as shown in Figure 3. With regard to the annotation practices, we implemented a few constraints and capabilities on the tooling level. First, we only allow non-overlapping, vertically oriented, rectangular boxes. For the large majority of documents, this constraint was sufficient and it speeds up the annotation considerably in comparison with arbitrary segmentation shapes. Second, annotator staff were not able to see each other's annotations. This was enforced by design to avoid any bias in the annotation, which could skew the numbers of the inter-annotator agreement (see Table 1). We wanted", "text": "Phase 4: Production annotation. The previously selected 80K pages were annotated with the defined 11 class labels by 32 annotators. This production phase took around three months to complete. All annotations were created online through CCS, which visualises the programmatic PDF text-cells as an overlay on the page. The page annotation are obtained by drawing rectangular bounding-boxes, as shown in Figure 3. With regard to the annotation practices, we implemented a few constraints and capabilities on the tooling level. First, we only allow non-overlapping, vertically oriented, rectangular boxes. For the large majority of documents, this constraint was sufficient and it speeds up the annotation considerably in comparison with arbitrary segmentation shapes. Second, annotator staff were not able to see each other's annotations. This was enforced by design to avoid any bias in the annotation, which could skew the numbers of the inter-annotator agreement (see Table 1). We wanted"}, {"self_ref": "#/texts/431", "parent": {"cref": "#/body"}, "children": [], "label": "page_header", "prov": [{"page_no": 6, "bbox": {"l": 53.79800033569336, "t": 731.6909790039062, "r": 558.202880859375, "b": 723.4239501953125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 130]}], "orig": "KDD \u201922, August 14-18, 2022, Washington, DC, USA Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar", "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar"}, {"self_ref": "#/texts/432", "parent": {"cref": "#/body"}, "children": [], "label": "caption", "prov": [{"page_no": 6, "bbox": {"l": 53.50199890136719, "t": 705.1270751953125, "r": 295.64874267578125, "b": 608.98291015625, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 489]}], "orig": "Table 2: Prediction performance (mAP@0.5-0.95) of object detection networks on DocLayNet test set. The MRCNN (Mask R-CNN) and FRCNN (Faster R-CNN) models with ResNet-50 or ResNet-101 backbone were trained based on the network architectures from the detectron2 model zoo (Mask R-CNN R50, R101-FPN 3x, Faster R-CNN R101-FPN 3x), with default configurations. The YOLO implementation utilized was YOLOv5x6 [13]. All models were initialised using pre-trained weights from the COCO 2017 dataset.", "text": "Table 2: Prediction performance (mAP@0.5-0.95) of object detection networks on DocLayNet test set. The MRCNN (Mask R-CNN) and FRCNN (Faster R-CNN) models with ResNet-50 or ResNet-101 backbone were trained based on the network architectures from the detectron2 model zoo (Mask R-CNN R50, R101-FPN 3x, Faster R-CNN R101-FPN 3x), with default configurations. The YOLO implementation utilized was YOLOv5x6 [13]. All models were initialised using pre-trained weights from the COCO 2017 dataset."}, {"self_ref": "#/texts/433", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 6, "bbox": {"l": 53.52899932861328, "t": 421.07244873046875, "r": 295.5561218261719, "b": 215.43682861328125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1252]}], "orig": "to avoid this at any cost in order to have clear, unbiased baseline numbers for human document-layout annotation. Third, we introduced the feature of snapping boxes around text segments to obtain a pixel-accurate annotation and again reduce time and effort. The CCS annotation tool automatically shrinks every user-drawn box to the minimum bounding-box around the enclosed text-cells for all purely text-based segments, which excludes only Table and Picture . For the latter, we instructed annotation staff to minimise inclusion of surrounding whitespace while including all graphical lines. A downside of snapping boxes to enclosed text cells is that some wrongly parsed PDF pages cannot be annotated correctly and need to be skipped. Fourth, we established a way to flag pages as rejected for cases where no valid annotation according to the label guidelines could be achieved. Example cases for this would be PDF pages that render incorrectly or contain layouts that are impossible to capture with non-overlapping rectangles. Such rejected pages are not contained in the final dataset. With all these measures in place, experienced annotation staff managed to annotate a single page in a typical timeframe of 20s to 60s, depending on its complexity.", "text": "to avoid this at any cost in order to have clear, unbiased baseline numbers for human document-layout annotation. Third, we introduced the feature of snapping boxes around text segments to obtain a pixel-accurate annotation and again reduce time and effort. The CCS annotation tool automatically shrinks every user-drawn box to the minimum bounding-box around the enclosed text-cells for all purely text-based segments, which excludes only Table and Picture . For the latter, we instructed annotation staff to minimise inclusion of surrounding whitespace while including all graphical lines. A downside of snapping boxes to enclosed text cells is that some wrongly parsed PDF pages cannot be annotated correctly and need to be skipped. Fourth, we established a way to flag pages as rejected for cases where no valid annotation according to the label guidelines could be achieved. Example cases for this would be PDF pages that render incorrectly or contain layouts that are impossible to capture with non-overlapping rectangles. Such rejected pages are not contained in the final dataset. With all these measures in place, experienced annotation staff managed to annotate a single page in a typical timeframe of 20s to 60s, depending on its complexity."}, {"self_ref": "#/texts/434", "parent": {"cref": "#/body"}, "children": [], "label": "section_header", "prov": [{"page_no": 6, "bbox": {"l": 53.79800033569336, "t": 203.87008666992188, "r": 147.4853515625, "b": 193.5609893798828, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 13]}], "orig": "5 EXPERIMENTS", "text": "5 EXPERIMENTS", "level": 1}, {"self_ref": "#/texts/435", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 6, "bbox": {"l": 53.48400115966797, "t": 178.74644470214844, "r": 295.4281005859375, "b": 82.7008285522461, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 584]}], "orig": "The primary goal of DocLayNet is to obtain high-quality ML models capable of accurate document-layout analysis on a wide variety of challenging layouts. As discussed in Section 2, object detection models are currently the easiest to use, due to the standardisation of ground-truth data in COCO format [16] and the availability of general frameworks such as detectron2 [17]. Furthermore, baseline numbers in PubLayNet and DocBank were obtained using standard object detection models such as Mask R-CNN and Faster R-CNN. As such, we will relate to these object detection methods in this", "text": "The primary goal of DocLayNet is to obtain high-quality ML models capable of accurate document-layout analysis on a wide variety of challenging layouts. As discussed in Section 2, object detection models are currently the easiest to use, due to the standardisation of ground-truth data in COCO format [16] and the availability of general frameworks such as detectron2 [17]. Furthermore, baseline numbers in PubLayNet and DocBank were obtained using standard object detection models such as Mask R-CNN and Faster R-CNN. As such, we will relate to these object detection methods in this"}, {"self_ref": "#/texts/436", "parent": {"cref": "#/body"}, "children": [], "label": "caption", "prov": [{"page_no": 6, "bbox": {"l": 317.9549865722656, "t": 512.9840087890625, "r": 559.8057861328125, "b": 449.7158203125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 329]}], "orig": "Figure 5: Prediction performance (mAP@0.5-0.95) of a Mask R-CNN network with ResNet50 backbone trained on increasing fractions of the DocLayNet dataset. The learning curve flattens around the 80% mark, indicating that increasing the size of the DocLayNet dataset with similar data will not yield significantly better predictions.", "text": "Figure 5: Prediction performance (mAP@0.5-0.95) of a Mask R-CNN network with ResNet50 backbone trained on increasing fractions of the DocLayNet dataset. The learning curve flattens around the 80% mark, indicating that increasing the size of the DocLayNet dataset with similar data will not yield significantly better predictions."}, {"self_ref": "#/texts/437", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 6, "bbox": {"l": 349.16577, "t": 545.31982, "r": 352.48175, "b": 539.24573, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "0", "text": "0"}, {"self_ref": "#/texts/438", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 6, "bbox": {"l": 385.93698, "t": 545.31982, "r": 392.56894, "b": 539.24573, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "20", "text": "20"}, {"self_ref": "#/texts/439", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 6, "bbox": {"l": 424.366, "t": 545.31982, "r": 430.99796, "b": 539.24573, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "40", "text": "40"}, {"self_ref": "#/texts/440", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 6, "bbox": {"l": 462.79504000000003, "t": 545.31982, "r": 469.427, "b": 539.24573, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "60", "text": "60"}, {"self_ref": "#/texts/441", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 6, "bbox": {"l": 501.22406, "t": 545.31982, "r": 507.85602, "b": 539.24573, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "80", "text": "80"}, {"self_ref": "#/texts/442", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 6, "bbox": {"l": 537.99524, "t": 545.31982, "r": 547.94318, "b": 539.24573, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 3]}], "orig": "100", "text": "100"}, {"self_ref": "#/texts/443", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 6, "bbox": {"l": 410.28143, "t": 538.19159, "r": 483.47278000000006, "b": 532.11749, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 27]}], "orig": "% of DocLayNet training set", "text": "% of DocLayNet training set"}, {"self_ref": "#/texts/444", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 6, "bbox": {"l": 330.93539, "t": 573.61536, "r": 337.56735, "b": 567.54126, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "50", "text": "50"}, {"self_ref": "#/texts/445", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 6, "bbox": {"l": 330.93539, "t": 599.91339, "r": 337.56735, "b": 593.83929, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "55", "text": "55"}, {"self_ref": "#/texts/446", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 6, "bbox": {"l": 330.93539, "t": 626.21136, "r": 337.56735, "b": 620.13727, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "60", "text": "60"}, {"self_ref": "#/texts/447", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 6, "bbox": {"l": 330.93539, "t": 652.5094, "r": 337.56735, "b": 646.4353, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "65", "text": "65"}, {"self_ref": "#/texts/448", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 6, "bbox": {"l": 330.93539, "t": 678.80737, "r": 337.56735, "b": 672.73328, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "70", "text": "70"}, {"self_ref": "#/texts/449", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 6, "bbox": {"l": 322.92276, "t": 643.62311, "r": 328.99686, "b": 605.20782, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 13]}], "orig": "mAP 0.50:0.95", "text": "mAP 0.50:0.95"}, {"self_ref": "#/texts/450", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 6, "bbox": {"l": 470.97235, "t": 556.63324, "r": 477.6055, "b": 550.55914, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "10", "text": "10"}, {"self_ref": "#/texts/451", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 6, "bbox": {"l": 477.65662, "t": 557.17609, "r": 479.97778000000005, "b": 552.92419, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "1", "text": "1"}, {"self_ref": "#/texts/452", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 6, "bbox": {"l": 531.55127, "t": 556.58765, "r": 538.18445, "b": 550.51355, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "10", "text": "10"}, {"self_ref": "#/texts/453", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 6, "bbox": {"l": 538.23553, "t": 557.13049, "r": 540.5567, "b": 552.8786, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "2", "text": "2"}, {"self_ref": "#/texts/454", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 6, "bbox": {"l": 404.91125, "t": 575.99994, "r": 411.54321, "b": 569.92584, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "50", "text": "50"}, {"self_ref": "#/texts/455", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 6, "bbox": {"l": 404.91125, "t": 591.77875, "r": 411.54321, "b": 585.70465, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "55", "text": "55"}, {"self_ref": "#/texts/456", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 6, "bbox": {"l": 404.91125, "t": 607.55756, "r": 411.54321, "b": 601.48346, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "60", "text": "60"}, {"self_ref": "#/texts/457", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 6, "bbox": {"l": 404.91125, "t": 623.33636, "r": 411.54321, "b": 617.26227, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "65", "text": "65"}, {"self_ref": "#/texts/458", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 6, "bbox": {"l": 404.91125, "t": 639.11511, "r": 411.54321, "b": 633.04102, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "70", "text": "70"}, {"self_ref": "#/texts/459", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 6, "bbox": {"l": 317.9549865722656, "t": 407.98846435546875, "r": 558.2041625976562, "b": 388.6548156738281, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 102]}], "orig": "paper and leave the detailed evaluation of more recent methods mentioned in Section 2 for future work.", "text": "paper and leave the detailed evaluation of more recent methods mentioned in Section 2 for future work."}, {"self_ref": "#/texts/460", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 6, "bbox": {"l": 317.6409912109375, "t": 386.0704650878906, "r": 558.4364013671875, "b": 311.9428405761719, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 397]}], "orig": "In this section, we will present several aspects related to the performance of object detection models on DocLayNet. Similarly as in PubLayNet, we will evaluate the quality of their predictions using mean average precision (mAP) with 10 overlaps that range from 0.5 to 0.95 in steps of 0.05 (mAP@0.5-0.95). These scores are computed by leveraging the evaluation code provided by the COCO API [16].", "text": "In this section, we will present several aspects related to the performance of object detection models on DocLayNet. Similarly as in PubLayNet, we will evaluate the quality of their predictions using mean average precision (mAP) with 10 overlaps that range from 0.5 to 0.95 in steps of 0.05 (mAP@0.5-0.95). These scores are computed by leveraging the evaluation code provided by the COCO API [16]."}, {"self_ref": "#/texts/461", "parent": {"cref": "#/body"}, "children": [], "label": "section_header", "prov": [{"page_no": 6, "bbox": {"l": 317.9549865722656, "t": 295.1781005859375, "r": 466.8532409667969, "b": 284.8690185546875, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 30]}], "orig": "Baselines for Object Detection", "text": "Baselines for Object Detection", "level": 1}, {"self_ref": "#/texts/462", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 6, "bbox": {"l": 317.7489929199219, "t": 279.9754638671875, "r": 558.4308471679688, "b": 85.2998275756836, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1146]}], "orig": "In Table 2, we present baseline experiments (given in mAP) on Mask R-CNN [12], Faster R-CNN [11], and YOLOv5 [13]. Both training and evaluation were performed on RGB images with dimensions of 1025 \u00d7 1025 pixels. For training, we only used one annotation in case of redundantly annotated pages. As one can observe, the variation in mAP between the models is rather low, but overall between 6 and 10% lower than the mAP computed from the pairwise human annotations on triple-annotated pages. This gives a good indication that the DocLayNet dataset poses a worthwhile challenge for the research community to close the gap between human recognition and ML approaches. It is interesting to see that Mask R-CNN and Faster R-CNN produce very comparable mAP scores, indicating that pixel-based image segmentation derived from bounding-boxes does not help to obtain better predictions. On the other hand, the more recent Yolov5x model does very well and even out-performs humans on selected labels such as Text , Table and Picture . This is not entirely surprising, as Text , Table and Picture are abundant and the most visually distinctive in a document.", "text": "In Table 2, we present baseline experiments (given in mAP) on Mask R-CNN [12], Faster R-CNN [11], and YOLOv5 [13]. Both training and evaluation were performed on RGB images with dimensions of 1025 \u00d7 1025 pixels. For training, we only used one annotation in case of redundantly annotated pages. As one can observe, the variation in mAP between the models is rather low, but overall between 6 and 10% lower than the mAP computed from the pairwise human annotations on triple-annotated pages. This gives a good indication that the DocLayNet dataset poses a worthwhile challenge for the research community to close the gap between human recognition and ML approaches. It is interesting to see that Mask R-CNN and Faster R-CNN produce very comparable mAP scores, indicating that pixel-based image segmentation derived from bounding-boxes does not help to obtain better predictions. On the other hand, the more recent Yolov5x model does very well and even out-performs humans on selected labels such as Text , Table and Picture . This is not entirely surprising, as Text , Table and Picture are abundant and the most visually distinctive in a document."}, {"self_ref": "#/texts/463", "parent": {"cref": "#/body"}, "children": [], "label": "page_header", "prov": [{"page_no": 7, "bbox": {"l": 53.79800033569336, "t": 731.6909790039062, "r": 347.0172424316406, "b": 723.4239501953125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 71]}], "orig": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis", "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis"}, {"self_ref": "#/texts/464", "parent": {"cref": "#/body"}, "children": [], "label": "page_header", "prov": [{"page_no": 7, "bbox": {"l": 365.75701904296875, "t": 731.6909790039062, "r": 558.2028198242188, "b": 723.4239501953125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 48]}], "orig": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA"}, {"self_ref": "#/texts/465", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 53.50199890136719, "t": 705.1270751953125, "r": 295.6486511230469, "b": 663.77685546875, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 205]}], "orig": "Table 3: Performance of a Mask R-CNN R50 network in mAP@0.5-0.95 scores trained on DocLayNet with different class label sets. The reduced label sets were obtained by either down-mapping or dropping labels.", "text": "Table 3: Performance of a Mask R-CNN R50 network in mAP@0.5-0.95 scores trained on DocLayNet with different class label sets. The reduced label sets were obtained by either down-mapping or dropping labels."}, {"self_ref": "#/texts/466", "parent": {"cref": "#/body"}, "children": [], "label": "caption", "prov": [{"page_no": 7, "bbox": {"l": 317.65899658203125, "t": 705.1270141601562, "r": 559.8068237304688, "b": 663.7767944335938, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 189]}], "orig": "Table 4: Performance of a Mask R-CNN R50 network with document-wise and page-wise split for different label sets. Naive page-wise split will result in GLYPH<tildelow> 10% point improvement.", "text": "Table 4: Performance of a Mask R-CNN R50 network with document-wise and page-wise split for different label sets. Naive page-wise split will result in GLYPH<tildelow> 10% point improvement."}, {"self_ref": "#/texts/467", "parent": {"cref": "#/body"}, "children": [], "label": "section_header", "prov": [{"page_no": 7, "bbox": {"l": 53.79800033569336, "t": 472.4300842285156, "r": 131.05624389648438, "b": 462.1210021972656, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 14]}], "orig": "Learning Curve", "text": "Learning Curve", "level": 1}, {"self_ref": "#/texts/468", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 52.78499984741211, "t": 457.22845458984375, "r": 295.558349609375, "b": 262.55181884765625, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1157]}], "orig": "One of the fundamental questions related to any dataset is if it is \"large enough\". To answer this question for DocLayNet, we performed a data ablation study in which we evaluated a Mask R-CNN model trained on increasing fractions of the DocLayNet dataset. As can be seen in Figure 5, the mAP score rises sharply in the beginning and eventually levels out. To estimate the error-bar on the metrics, we ran the training five times on the entire data-set. This resulted in a 1% error-bar, depicted by the shaded area in Figure 5. In the inset of Figure 5, we show the exact same data-points, but with a logarithmic scale on the x-axis. As is expected, the mAP score increases linearly as a function of the data-size in the inset. The curve ultimately flattens out between the 80% and 100% mark, with the 80% mark falling within the error-bars of the 100% mark. This provides a good indication that the model would not improve significantly by yet increasing the data size. Rather, it would probably benefit more from improved data consistency (as discussed in Section 3), data augmentation methods [23], or the addition of more document categories and styles.", "text": "One of the fundamental questions related to any dataset is if it is \"large enough\". To answer this question for DocLayNet, we performed a data ablation study in which we evaluated a Mask R-CNN model trained on increasing fractions of the DocLayNet dataset. As can be seen in Figure 5, the mAP score rises sharply in the beginning and eventually levels out. To estimate the error-bar on the metrics, we ran the training five times on the entire data-set. This resulted in a 1% error-bar, depicted by the shaded area in Figure 5. In the inset of Figure 5, we show the exact same data-points, but with a logarithmic scale on the x-axis. As is expected, the mAP score increases linearly as a function of the data-size in the inset. The curve ultimately flattens out between the 80% and 100% mark, with the 80% mark falling within the error-bars of the 100% mark. This provides a good indication that the model would not improve significantly by yet increasing the data size. Rather, it would probably benefit more from improved data consistency (as discussed in Section 3), data augmentation methods [23], or the addition of more document categories and styles."}, {"self_ref": "#/texts/469", "parent": {"cref": "#/body"}, "children": [], "label": "section_header", "prov": [{"page_no": 7, "bbox": {"l": 53.79800033569336, "t": 249.49008178710938, "r": 164.3289794921875, "b": 239.1809844970703, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 22]}], "orig": "Impact of Class Labels", "text": "Impact of Class Labels", "level": 1}, {"self_ref": "#/texts/470", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 53.46699905395508, "t": 234.2884521484375, "r": 295.5567932128906, "b": 83.44783020019531, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 910]}], "orig": "The choice and number of labels can have a significant effect on the overall model performance. Since PubLayNet, DocBank and DocLayNet all have different label sets, it is of particular interest to understand and quantify this influence of the label set on the model performance. We investigate this by either down-mapping labels into more common ones (e.g. Caption \u2192 Text ) or excluding them from the annotations entirely. Furthermore, it must be stressed that all mappings and exclusions were performed on the data before model training. In Table 3, we present the mAP scores for a Mask R-CNN R50 network on different label sets. Where a label is down-mapped, we show its corresponding label, otherwise it was excluded. We present three different label sets, with 6, 5 and 4 different labels respectively. The set of 5 labels contains the same labels as PubLayNet. However, due to the different definition of", "text": "The choice and number of labels can have a significant effect on the overall model performance. Since PubLayNet, DocBank and DocLayNet all have different label sets, it is of particular interest to understand and quantify this influence of the label set on the model performance. We investigate this by either down-mapping labels into more common ones (e.g. Caption \u2192 Text ) or excluding them from the annotations entirely. Furthermore, it must be stressed that all mappings and exclusions were performed on the data before model training. In Table 3, we present the mAP scores for a Mask R-CNN R50 network on different label sets. Where a label is down-mapped, we show its corresponding label, otherwise it was excluded. We present three different label sets, with 6, 5 and 4 different labels respectively. The set of 5 labels contains the same labels as PubLayNet. However, due to the different definition of"}, {"self_ref": "#/texts/471", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 317.6860046386719, "t": 460.5964660644531, "r": 559.5849609375, "b": 375.50982666015625, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 469]}], "orig": "lists in PubLayNet (grouped list-items) versus DocLayNet (separate list-items), the label set of size 4 is the closest to PubLayNet, in the assumption that the List is down-mapped to Text in PubLayNet. The results in Table 3 show that the prediction accuracy on the remaining class labels does not change significantly when other classes are merged into them. The overall macro-average improves by around 5%, in particular when Page-footer and Page-header are excluded.", "text": "lists in PubLayNet (grouped list-items) versus DocLayNet (separate list-items), the label set of size 4 is the closest to PubLayNet, in the assumption that the List is down-mapped to Text in PubLayNet. The results in Table 3 show that the prediction accuracy on the remaining class labels does not change significantly when other classes are merged into them. The overall macro-average improves by around 5%, in particular when Page-footer and Page-header are excluded."}, {"self_ref": "#/texts/472", "parent": {"cref": "#/body"}, "children": [], "label": "section_header", "prov": [{"page_no": 7, "bbox": {"l": 317.9549560546875, "t": 362.6051025390625, "r": 549.860595703125, "b": 352.2960205078125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 46]}], "orig": "Impact of Document Split in Train and Test Set", "text": "Impact of Document Split in Train and Test Set", "level": 1}, {"self_ref": "#/texts/473", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 317.62298583984375, "t": 347.4034729003906, "r": 559.7138061523438, "b": 196.5628204345703, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 852]}], "orig": "Many documents in DocLayNet have a unique styling. In order to avoid overfitting on a particular style, we have split the train-, test- and validation-sets of DocLayNet on document boundaries, i.e. every document contributes pages to only one set. To the best of our knowledge, this was not considered in PubLayNet or DocBank. To quantify how this affects model performance, we trained and evaluated a Mask R-CNN R50 model on a modified dataset version. Here, the train-, test- and validation-sets were obtained by a randomised draw over the individual pages. As can be seen in Table 4, the difference in model performance is surprisingly large: pagewise splitting gains \u02dc 10% in mAP over the document-wise splitting. Thus, random page-wise splitting of DocLayNet can easily lead to accidental overestimation of model performance and should be avoided.", "text": "Many documents in DocLayNet have a unique styling. In order to avoid overfitting on a particular style, we have split the train-, test- and validation-sets of DocLayNet on document boundaries, i.e. every document contributes pages to only one set. To the best of our knowledge, this was not considered in PubLayNet or DocBank. To quantify how this affects model performance, we trained and evaluated a Mask R-CNN R50 model on a modified dataset version. Here, the train-, test- and validation-sets were obtained by a randomised draw over the individual pages. As can be seen in Table 4, the difference in model performance is surprisingly large: pagewise splitting gains \u02dc 10% in mAP over the document-wise splitting. Thus, random page-wise splitting of DocLayNet can easily lead to accidental overestimation of model performance and should be avoided."}, {"self_ref": "#/texts/474", "parent": {"cref": "#/body"}, "children": [], "label": "section_header", "prov": [{"page_no": 7, "bbox": {"l": 317.9549865722656, "t": 183.6580810546875, "r": 418.5477600097656, "b": 173.34898376464844, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 18]}], "orig": "Dataset Comparison", "text": "Dataset Comparison", "level": 1}, {"self_ref": "#/texts/475", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 317.6860046386719, "t": 168.45645141601562, "r": 559.1881713867188, "b": 83.35986328125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 521]}], "orig": "Throughout this paper, we claim that DocLayNet's wider variety of document layouts leads to more robust layout detection models. In Table 5, we provide evidence for that. We trained models on each of the available datasets (PubLayNet, DocBank and DocLayNet) and evaluated them on the test sets of the other datasets. Due to the different label sets and annotation styles, a direct comparison is not possible. Hence, we focussed on the common labels among the datasets. Between PubLayNet and DocLayNet, these are Picture ,", "text": "Throughout this paper, we claim that DocLayNet's wider variety of document layouts leads to more robust layout detection models. In Table 5, we provide evidence for that. We trained models on each of the available datasets (PubLayNet, DocBank and DocLayNet) and evaluated them on the test sets of the other datasets. Due to the different label sets and annotation styles, a direct comparison is not possible. Hence, we focussed on the common labels among the datasets. Between PubLayNet and DocLayNet, these are Picture ,"}, {"self_ref": "#/texts/476", "parent": {"cref": "#/body"}, "children": [], "label": "page_header", "prov": [{"page_no": 8, "bbox": {"l": 53.79800033569336, "t": 731.6909790039062, "r": 558.202880859375, "b": 723.4239501953125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 130]}], "orig": "KDD \u201922, August 14-18, 2022, Washington, DC, USA Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar", "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar"}, {"self_ref": "#/texts/477", "parent": {"cref": "#/body"}, "children": [], "label": "caption", "prov": [{"page_no": 8, "bbox": {"l": 53.50199890136719, "t": 705.1270751953125, "r": 295.648681640625, "b": 641.85888671875, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 298]}], "orig": "Table 5: Prediction Performance (mAP@0.5-0.95) of a Mask R-CNN R50 network across the PubLayNet, DocBank & DocLayNet data-sets. By evaluating on common label classes of each dataset, we observe that the DocLayNet-trained model has much less pronounced variations in performance across all datasets.", "text": "Table 5: Prediction Performance (mAP@0.5-0.95) of a Mask R-CNN R50 network across the PubLayNet, DocBank & DocLayNet data-sets. By evaluating on common label classes of each dataset, we observe that the DocLayNet-trained model has much less pronounced variations in performance across all datasets."}, {"self_ref": "#/texts/478", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 53.79800033569336, "t": 401.0794677734375, "r": 294.047119140625, "b": 348.85986328125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 295]}], "orig": "Section-header , Table and Text . Before training, we either mapped or excluded DocLayNet's other labels as specified in table 3, and also PubLayNet's List to Text . Note that the different clustering of lists (by list-element vs. whole list objects) naturally decreases the mAP score for Text .", "text": "Section-header , Table and Text . Before training, we either mapped or excluded DocLayNet's other labels as specified in table 3, and also PubLayNet's List to Text . Note that the different clustering of lists (by list-element vs. whole list objects) naturally decreases the mAP score for Text ."}, {"self_ref": "#/texts/479", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 53.46699905395508, "t": 346.28546142578125, "r": 295.55908203125, "b": 206.40382385253906, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 793]}], "orig": "For comparison of DocBank with DocLayNet, we trained only on Picture and Table clusters of each dataset. We had to exclude Text because successive paragraphs are often grouped together into a single object in DocBank. This paragraph grouping is incompatible with the individual paragraphs of DocLayNet. As can be seen in Table 5, DocLayNet trained models yield better performance compared to the previous datasets. It is noteworthy that the models trained on PubLayNet and DocBank perform very well on their own test set, but have a much lower performance on the foreign datasets. While this also applies to DocLayNet, the difference is far less pronounced. Thus we conclude that DocLayNet trained models are overall more robust and will produce better results for challenging, unseen layouts.", "text": "For comparison of DocBank with DocLayNet, we trained only on Picture and Table clusters of each dataset. We had to exclude Text because successive paragraphs are often grouped together into a single object in DocBank. This paragraph grouping is incompatible with the individual paragraphs of DocLayNet. As can be seen in Table 5, DocLayNet trained models yield better performance compared to the previous datasets. It is noteworthy that the models trained on PubLayNet and DocBank perform very well on their own test set, but have a much lower performance on the foreign datasets. While this also applies to DocLayNet, the difference is far less pronounced. Thus we conclude that DocLayNet trained models are overall more robust and will produce better results for challenging, unseen layouts."}, {"self_ref": "#/texts/480", "parent": {"cref": "#/body"}, "children": [], "label": "section_header", "prov": [{"page_no": 8, "bbox": {"l": 53.79800033569336, "t": 186.9390869140625, "r": 156.00534057617188, "b": 176.62998962402344, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 19]}], "orig": "Example Predictions", "text": "Example Predictions", "level": 1}, {"self_ref": "#/texts/481", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 53.52899932861328, "t": 171.7364501953125, "r": 295.5584411621094, "b": 86.64982604980469, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 481]}], "orig": "To conclude this section, we illustrate the quality of layout predictions one can expect from DocLayNet-trained models by providing a selection of examples without any further post-processing applied. Figure 6 shows selected layout predictions on pages from the test-set of DocLayNet. Results look decent in general across document categories, however one can also observe mistakes such as overlapping clusters of different classes, or entirely missing boxes due to low confidence.", "text": "To conclude this section, we illustrate the quality of layout predictions one can expect from DocLayNet-trained models by providing a selection of examples without any further post-processing applied. Figure 6 shows selected layout predictions on pages from the test-set of DocLayNet. Results look decent in general across document categories, however one can also observe mistakes such as overlapping clusters of different classes, or entirely missing boxes due to low confidence."}, {"self_ref": "#/texts/482", "parent": {"cref": "#/body"}, "children": [], "label": "section_header", "prov": [{"page_no": 8, "bbox": {"l": 317.95501708984375, "t": 706.14013671875, "r": 405.7296142578125, "b": 695.8309936523438, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 12]}], "orig": "6 CONCLUSION", "text": "6 CONCLUSION", "level": 1}, {"self_ref": "#/texts/483", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 317.9549865722656, "t": 690.9384765625, "r": 559.7137451171875, "b": 605.850830078125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 507]}], "orig": "In this paper, we presented the DocLayNet dataset. It provides the document conversion and layout analysis research community a new and challenging dataset to improve and fine-tune novel ML methods on. In contrast to many other datasets, DocLayNet was created by human annotation in order to obtain reliable layout ground-truth on a wide variety of publication- and typesettingstyles. Including a large proportion of documents outside the scientific publishing domain adds significant value in this respect.", "text": "In this paper, we presented the DocLayNet dataset. It provides the document conversion and layout analysis research community a new and challenging dataset to improve and fine-tune novel ML methods on. In contrast to many other datasets, DocLayNet was created by human annotation in order to obtain reliable layout ground-truth on a wide variety of publication- and typesettingstyles. Including a large proportion of documents outside the scientific publishing domain adds significant value in this respect."}, {"self_ref": "#/texts/484", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 317.6860046386719, "t": 603.2664794921875, "r": 559.717041015625, "b": 507.2208251953125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 573]}], "orig": "From the dataset, we have derived on the one hand reference metrics for human performance on document-layout annotation (through double and triple annotations) and on the other hand evaluated the baseline performance of commonly used object detection methods. We also illustrated the impact of various dataset-related aspects on model performance through data-ablation experiments, both from a size and class-label perspective. Last but not least, we compared the accuracy of models trained on other public datasets and showed that DocLayNet trained models are more robust.", "text": "From the dataset, we have derived on the one hand reference metrics for human performance on document-layout annotation (through double and triple annotations) and on the other hand evaluated the baseline performance of commonly used object detection methods. We also illustrated the impact of various dataset-related aspects on model performance through data-ablation experiments, both from a size and class-label perspective. Last but not least, we compared the accuracy of models trained on other public datasets and showed that DocLayNet trained models are more robust."}, {"self_ref": "#/texts/485", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 317.62298583984375, "t": 504.636474609375, "r": 558.4346923828125, "b": 474.3438415527344, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 188]}], "orig": "To date, there is still a significant gap between human and ML accuracy on the layout interpretation task, and we hope that this work will inspire the research community to close that gap.", "text": "To date, there is still a significant gap between human and ML accuracy on the layout interpretation task, and we hope that this work will inspire the research community to close that gap."}, {"self_ref": "#/texts/486", "parent": {"cref": "#/body"}, "children": [], "label": "section_header", "prov": [{"page_no": 8, "bbox": {"l": 317.9549865722656, "t": 456.9081115722656, "r": 387.3695983886719, "b": 446.5990295410156, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 10]}], "orig": "REFERENCES", "text": "REFERENCES", "level": 1}, {"self_ref": "#/texts/487", "parent": {"cref": "#/groups/3"}, "children": [], "label": "list_item", "prov": [{"page_no": 8, "bbox": {"l": 321.197998046875, "t": 443.29766845703125, "r": 558.2009887695312, "b": 420.8371276855469, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 191]}], "orig": "[1] Max G\u00f6bel, Tamir Hassan, Ermelinda Oro, and Giorgio Orsi. Icdar 2013 table competition. In 2013 12th International Conference on Document Analysis and Recognition , pages 1449-1453, 2013.", "text": "[1] Max G\u00f6bel, Tamir Hassan, Ermelinda Oro, and Giorgio Orsi. Icdar 2013 table competition. In 2013 12th International Conference on Document Analysis and Recognition , pages 1449-1453, 2013.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/488", "parent": {"cref": "#/groups/3"}, "children": [], "label": "list_item", "prov": [{"page_no": 8, "bbox": {"l": 321.197998046875, "t": 419.38763427734375, "r": 559.3798217773438, "b": 388.9571228027344, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 279]}], "orig": "[2] Christian Clausner, Apostolos Antonacopoulos, and Stefan Pletschacher. Icdar2017 competition on recognition of documents with complex layouts rdcl2017. In 2017 14th IAPR International Conference on Document Analysis and Recognition (ICDAR) , volume 01, pages 1404-1410, 2017.", "text": "[2] Christian Clausner, Apostolos Antonacopoulos, and Stefan Pletschacher. Icdar2017 competition on recognition of documents with complex layouts rdcl2017. In 2017 14th IAPR International Conference on Document Analysis and Recognition (ICDAR) , volume 01, pages 1404-1410, 2017.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/489", "parent": {"cref": "#/groups/3"}, "children": [], "label": "list_item", "prov": [{"page_no": 8, "bbox": {"l": 321.197998046875, "t": 387.50762939453125, "r": 558.2001342773438, "b": 365.0531005859375, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 213]}], "orig": "[3] Herv\u00e9 D\u00e9jean, Jean-Luc Meunier, Liangcai Gao, Yilun Huang, Yu Fang, Florian Kleber, and Eva-Maria Lang. ICDAR 2019 Competition on Table Detection and Recognition (cTDaR), April 2019. http://sac.founderit.com/.", "text": "[3] Herv\u00e9 D\u00e9jean, Jean-Luc Meunier, Liangcai Gao, Yilun Huang, Yu Fang, Florian Kleber, and Eva-Maria Lang. ICDAR 2019 Competition on Table Detection and Recognition (cTDaR), April 2019. http://sac.founderit.com/.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/490", "parent": {"cref": "#/groups/3"}, "children": [], "label": "list_item", "prov": [{"page_no": 8, "bbox": {"l": 321.197998046875, "t": 363.5966491699219, "r": 559.3787231445312, "b": 333.173095703125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 251]}], "orig": "[4] Antonio Jimeno Yepes, Peter Zhong, and Douglas Burdick. Competition on scientific literature parsing. In Proceedings of the International Conference on Document Analysis and Recognition , ICDAR, pages 605-617. LNCS 12824, SpringerVerlag, sep 2021.", "text": "[4] Antonio Jimeno Yepes, Peter Zhong, and Douglas Burdick. Competition on scientific literature parsing. In Proceedings of the International Conference on Document Analysis and Recognition , ICDAR, pages 605-617. LNCS 12824, SpringerVerlag, sep 2021.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/491", "parent": {"cref": "#/groups/3"}, "children": [], "label": "list_item", "prov": [{"page_no": 8, "bbox": {"l": 321.197998046875, "t": 331.7166442871094, "r": 559.0262451171875, "b": 301.2920837402344, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 261]}], "orig": "[5] Logan Markewich, Hao Zhang, Yubin Xing, Navid Lambert-Shirzad, Jiang Zhexin, Roy Lee, Zhi Li, and Seok-Bum Ko. Segmentation for document layout analysis: not dead yet. International Journal on Document Analysis and Recognition (IJDAR) , pages 1-11, 01 2022.", "text": "[5] Logan Markewich, Hao Zhang, Yubin Xing, Navid Lambert-Shirzad, Jiang Zhexin, Roy Lee, Zhi Li, and Seok-Bum Ko. Segmentation for document layout analysis: not dead yet. International Journal on Document Analysis and Recognition (IJDAR) , pages 1-11, 01 2022.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/492", "parent": {"cref": "#/groups/3"}, "children": [], "label": "list_item", "prov": [{"page_no": 8, "bbox": {"l": 321.197998046875, "t": 299.83563232421875, "r": 558.20361328125, "b": 277.3751220703125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 235]}], "orig": "[6] Xu Zhong, Jianbin Tang, and Antonio Jimeno-Yepes. Publaynet: Largest dataset ever for document layout analysis. In Proceedings of the International Conference on Document Analysis and Recognition , ICDAR, pages 1015-1022, sep 2019.", "text": "[6] Xu Zhong, Jianbin Tang, and Antonio Jimeno-Yepes. Publaynet: Largest dataset ever for document layout analysis. In Proceedings of the International Conference on Document Analysis and Recognition , ICDAR, pages 1015-1022, sep 2019.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/493", "parent": {"cref": "#/groups/3"}, "children": [], "label": "list_item", "prov": [{"page_no": 8, "bbox": {"l": 321.1979675292969, "t": 275.9256286621094, "r": 558.9714965820312, "b": 237.53111267089844, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 316]}], "orig": "[7] Minghao Li, Yiheng Xu, Lei Cui, Shaohan Huang, Furu Wei, Zhoujun Li, and Ming Zhou. Docbank: A benchmark dataset for document layout analysis. In Proceedings of the 28th International Conference on Computational Linguistics , COLING, pages 949-960. International Committee on Computational Linguistics, dec 2020.", "text": "[7] Minghao Li, Yiheng Xu, Lei Cui, Shaohan Huang, Furu Wei, Zhoujun Li, and Ming Zhou. Docbank: A benchmark dataset for document layout analysis. In Proceedings of the 28th International Conference on Computational Linguistics , COLING, pages 949-960. International Committee on Computational Linguistics, dec 2020.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/494", "parent": {"cref": "#/groups/3"}, "children": [], "label": "list_item", "prov": [{"page_no": 8, "bbox": {"l": 321.197998046875, "t": 236.07464599609375, "r": 558.9022216796875, "b": 213.6141357421875, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 172]}], "orig": "[8] Riaz Ahmad, Muhammad Tanvir Afzal, and M. Qadir. Information extraction from pdf sources based on rule-based system using integrated formats. In SemWebEval@ESWC , 2016.", "text": "[8] Riaz Ahmad, Muhammad Tanvir Afzal, and M. Qadir. Information extraction from pdf sources based on rule-based system using integrated formats. In SemWebEval@ESWC , 2016.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/495", "parent": {"cref": "#/groups/3"}, "children": [], "label": "list_item", "prov": [{"page_no": 8, "bbox": {"l": 321.197998046875, "t": 212.16464233398438, "r": 559.2744750976562, "b": 181.74110412597656, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 271]}], "orig": "[9] Ross B. Girshick, Jeff Donahue, Trevor Darrell, and Jitendra Malik. Rich feature hierarchies for accurate object detection and semantic segmentation. In IEEE Conference on Computer Vision and Pattern Recognition , CVPR, pages 580-587. IEEE Computer Society, jun 2014.", "text": "[9] Ross B. Girshick, Jeff Donahue, Trevor Darrell, and Jitendra Malik. Rich feature hierarchies for accurate object detection and semantic segmentation. In IEEE Conference on Computer Vision and Pattern Recognition , CVPR, pages 580-587. IEEE Computer Society, jun 2014.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/496", "parent": {"cref": "#/groups/3"}, "children": [], "label": "list_item", "prov": [{"page_no": 8, "bbox": {"l": 317.9549865722656, "t": 180.28463745117188, "r": 558.2020263671875, "b": 165.7931365966797, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 149]}], "orig": "[10] Ross B. Girshick. Fast R-CNN. In 2015 IEEE International Conference on Computer Vision , ICCV, pages 1440-1448. IEEE Computer Society, dec 2015.", "text": "[10] Ross B. Girshick. Fast R-CNN. In 2015 IEEE International Conference on Computer Vision , ICCV, pages 1440-1448. IEEE Computer Society, dec 2015.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/497", "parent": {"cref": "#/groups/3"}, "children": [], "label": "list_item", "prov": [{"page_no": 8, "bbox": {"l": 317.9549865722656, "t": 164.3436279296875, "r": 558.201416015625, "b": 141.8831329345703, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 227]}], "orig": "[11] Shaoqing Ren, Kaiming He, Ross Girshick, and Jian Sun. Faster r-cnn: Towards real-time object detection with region proposal networks. IEEE Transactions on Pattern Analysis and Machine Intelligence , 39(6):1137-1149, 2017.", "text": "[11] Shaoqing Ren, Kaiming He, Ross Girshick, and Jian Sun. Faster r-cnn: Towards real-time object detection with region proposal networks. IEEE Transactions on Pattern Analysis and Machine Intelligence , 39(6):1137-1149, 2017.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/498", "parent": {"cref": "#/groups/3"}, "children": [], "label": "list_item", "prov": [{"page_no": 8, "bbox": {"l": 317.9549865722656, "t": 140.43362426757812, "r": 559.278076171875, "b": 117.98011016845703, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 192]}], "orig": "[12] Kaiming He, Georgia Gkioxari, Piotr Doll\u00e1r, and Ross B. Girshick. Mask R-CNN. In IEEE International Conference on Computer Vision , ICCV, pages 2980-2988. IEEE Computer Society, Oct 2017.", "text": "[12] Kaiming He, Georgia Gkioxari, Piotr Doll\u00e1r, and Ross B. Girshick. Mask R-CNN. In IEEE International Conference on Computer Vision , ICCV, pages 2980-2988. IEEE Computer Society, Oct 2017.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/499", "parent": {"cref": "#/groups/3"}, "children": [], "label": "list_item", "prov": [{"page_no": 8, "bbox": {"l": 317.9549865722656, "t": 116.52364349365234, "r": 558.9715576171875, "b": 86.09910583496094, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 305]}], "orig": "[13] Glenn Jocher, Alex Stoken, Ayush Chaurasia, Jirka Borovec, NanoCode012, TaoXie, Yonghye Kwon, Kalen Michael, Liu Changyu, Jiacong Fang, Abhiram V, Laughing, tkianai, yxNONG, Piotr Skalski, Adam Hogan, Jebastin Nadar, imyhxy, Lorenzo Mammana, Alex Wang, Cristi Fati, Diego Montes, Jan Hajek, Laurentiu", "text": "[13] Glenn Jocher, Alex Stoken, Ayush Chaurasia, Jirka Borovec, NanoCode012, TaoXie, Yonghye Kwon, Kalen Michael, Liu Changyu, Jiacong Fang, Abhiram V, Laughing, tkianai, yxNONG, Piotr Skalski, Adam Hogan, Jebastin Nadar, imyhxy, Lorenzo Mammana, Alex Wang, Cristi Fati, Diego Montes, Jan Hajek, Laurentiu", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/500", "parent": {"cref": "#/body"}, "children": [], "label": "page_header", "prov": [{"page_no": 9, "bbox": {"l": 53.79800033569336, "t": 731.6909790039062, "r": 347.0172424316406, "b": 723.4239501953125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 71]}], "orig": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis", "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis"}, {"self_ref": "#/texts/501", "parent": {"cref": "#/body"}, "children": [], "label": "page_header", "prov": [{"page_no": 9, "bbox": {"l": 365.75701904296875, "t": 731.6909790039062, "r": 558.2028198242188, "b": 723.4239501953125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 48]}], "orig": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA"}, {"self_ref": "#/texts/502", "parent": {"cref": "#/body"}, "children": [], "label": "caption", "prov": [{"page_no": 9, "bbox": {"l": 62.323875427246094, "t": 349.7145690917969, "r": 318.5047302246094, "b": 343.73516845703125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 89]}], "orig": "Text Caption List-Item Formula Table Section-Header Picture Page-Header Page-Footer Title", "text": "Text Caption List-Item Formula Table Section-Header Picture Page-Header Page-Footer Title"}, {"self_ref": "#/texts/503", "parent": {"cref": "#/pictures/5"}, "children": [], "label": "text", "prov": [{"page_no": 9, "bbox": {"l": 231.8804, "t": 490.49457, "r": 235.14504999999997, "b": 377.30856, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 64]}], "orig": "4bed2a8aa51ac37058e79605821bbc426d032b0b6ca8bdf3409ed8508ccd8c67", "text": "4bed2a8aa51ac37058e79605821bbc426d032b0b6ca8bdf3409ed8508ccd8c67"}, {"self_ref": "#/texts/504", "parent": {"cref": "#/pictures/5"}, "children": [], "label": "text", "prov": [{"page_no": 9, "bbox": {"l": 395.06876, "t": 674.62817, "r": 398.33353, "b": 561.44214, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 64]}], "orig": "2f2a06d08f5ad565d0f5e815f4ddf666365b2cff435cdaeb8850217e8a8efabf", "text": "2f2a06d08f5ad565d0f5e815f4ddf666365b2cff435cdaeb8850217e8a8efabf"}, {"self_ref": "#/texts/505", "parent": {"cref": "#/pictures/5"}, "children": [], "label": "text", "prov": [{"page_no": 9, "bbox": {"l": 55.775887, "t": 490.49457, "r": 59.04052000000001, "b": 377.30856, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 64]}], "orig": "7f2fd7293e04bf4f1756ae51f5779764933da1d1d2002e3915356050570fc75b", "text": "7f2fd7293e04bf4f1756ae51f5779764933da1d1d2002e3915356050570fc75b"}, {"self_ref": "#/texts/506", "parent": {"cref": "#/pictures/5"}, "children": [], "label": "text", "prov": [{"page_no": 9, "bbox": {"l": 232.01364, "t": 674.62817, "r": 235.27841000000004, "b": 561.44214, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 64]}], "orig": "1b81cf65f47456ad4faa725d1eb09879bd633af16cfe2bf8cea661b87907bfac", "text": "1b81cf65f47456ad4faa725d1eb09879bd633af16cfe2bf8cea661b87907bfac"}, {"self_ref": "#/texts/507", "parent": {"cref": "#/pictures/5"}, "children": [], "label": "text", "prov": [{"page_no": 9, "bbox": {"l": 395.20047, "t": 490.49457, "r": 398.46512, "b": 377.30856, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 64]}], "orig": "b60da9d26f488cb133e47d101d35fda1bdca2671ade60764d1cd569590270327", "text": "b60da9d26f488cb133e47d101d35fda1bdca2671ade60764d1cd569590270327"}, {"self_ref": "#/texts/508", "parent": {"cref": "#/pictures/5"}, "children": [], "label": "text", "prov": [{"page_no": 9, "bbox": {"l": 55.775818, "t": 674.62817, "r": 65.409912, "b": 561.44214, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 70]}], "orig": "2b7b8355a42ebef0cf91583aad9f30f7c9fa63c5b05911730ba15275c024965b$^{A}$", "text": "2b7b8355a42ebef0cf91583aad9f30f7c9fa63c5b05911730ba15275c024965b$^{A}$"}, {"self_ref": "#/texts/509", "parent": {"cref": "#/pictures/5"}, "children": [], "label": "text", "prov": [{"page_no": 9, "bbox": {"l": 234.56980999999996, "t": 703.4981699999998, "r": 240.06987, "b": 694.9890100000001, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "B", "text": "B"}, {"self_ref": "#/texts/510", "parent": {"cref": "#/pictures/5"}, "children": [], "label": "text", "prov": [{"page_no": 9, "bbox": {"l": 397.81934, "t": 703.10645, "r": 403.3194, "b": 694.59729, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/511", "parent": {"cref": "#/pictures/5"}, "children": [], "label": "text", "prov": [{"page_no": 9, "bbox": {"l": 59.909843, "t": 525.24115, "r": 65.409912, "b": 516.73206, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "D", "text": "D"}, {"self_ref": "#/texts/512", "parent": {"cref": "#/pictures/5"}, "children": [], "label": "text", "prov": [{"page_no": 9, "bbox": {"l": 234.77386, "t": 525.63293, "r": 239.85495000000003, "b": 517.12384, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "E", "text": "E"}, {"self_ref": "#/texts/513", "parent": {"cref": "#/pictures/5"}, "children": [], "label": "text", "prov": [{"page_no": 9, "bbox": {"l": 398.26144, "t": 525.24115, "r": 402.91592, "b": 516.73206, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "F", "text": "F"}, {"self_ref": "#/texts/514", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 9, "bbox": {"l": 53.79800033569336, "t": 327.51800537109375, "r": 559.807861328125, "b": 286.16876220703125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 386]}], "orig": "Figure 6: Example layout predictions on selected pages from the DocLayNet test-set. (A, D) exhibit favourable results on coloured backgrounds. (B, C) show accurate list-item and paragraph differentiation despite densely-spaced lines. (E) demonstrates good table and figure distinction. (F) shows predictions on a Chinese patent with multiple overlaps, label confusion and missing boxes.", "text": "Figure 6: Example layout predictions on selected pages from the DocLayNet test-set. (A, D) exhibit favourable results on coloured backgrounds. (B, C) show accurate list-item and paragraph differentiation despite densely-spaced lines. (E) demonstrates good table and figure distinction. (F) shows predictions on a Chinese patent with multiple overlaps, label confusion and missing boxes."}, {"self_ref": "#/texts/515", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 9, "bbox": {"l": 69.23400115966797, "t": 264.93365478515625, "r": 295.22406005859375, "b": 242.4801025390625, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 195]}], "orig": "Diaconu, Mai Thanh Minh, Marc, albinxavi, fatih, oleg, and wanghao yang. ultralytics/yolov5: v6.0 - yolov5n nano models, roboflow integration, tensorflow export, opencv dnn support, October 2021.", "text": "Diaconu, Mai Thanh Minh, Marc, albinxavi, fatih, oleg, and wanghao yang. ultralytics/yolov5: v6.0 - yolov5n nano models, roboflow integration, tensorflow export, opencv dnn support, October 2021."}, {"self_ref": "#/texts/516", "parent": {"cref": "#/groups/4"}, "children": [], "label": "list_item", "prov": [{"page_no": 9, "bbox": {"l": 53.79800033569336, "t": 241.02362060546875, "r": 295.12176513671875, "b": 218.56314086914062, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 190]}], "orig": "[14] Nicolas Carion, Francisco Massa, Gabriel Synnaeve, Nicolas Usunier, Alexander Kirillov, and Sergey Zagoruyko. End-to-end object detection with transformers. CoRR , abs/2005.12872, 2020.", "text": "[14] Nicolas Carion, Francisco Massa, Gabriel Synnaeve, Nicolas Usunier, Alexander Kirillov, and Sergey Zagoruyko. End-to-end object detection with transformers. CoRR , abs/2005.12872, 2020.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/517", "parent": {"cref": "#/groups/4"}, "children": [], "label": "list_item", "prov": [{"page_no": 9, "bbox": {"l": 53.79800033569336, "t": 217.1136474609375, "r": 294.042236328125, "b": 202.62213134765625, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 132]}], "orig": "[15] Mingxing Tan, Ruoming Pang, and Quoc V. Le. Efficientdet: Scalable and efficient object detection. CoRR , abs/1911.09070, 2019.", "text": "[15] Mingxing Tan, Ruoming Pang, and Quoc V. Le. Efficientdet: Scalable and efficient object detection. CoRR , abs/1911.09070, 2019.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/518", "parent": {"cref": "#/groups/4"}, "children": [], "label": "list_item", "prov": [{"page_no": 9, "bbox": {"l": 53.798004150390625, "t": 201.17263793945312, "r": 295.2226257324219, "b": 178.71910095214844, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 219]}], "orig": "[16] Tsung-Yi Lin, Michael Maire, Serge J. Belongie, Lubomir D. Bourdev, Ross B. Girshick, James Hays, Pietro Perona, Deva Ramanan, Piotr Doll\u00e1r, and C. Lawrence Zitnick. Microsoft COCO: common objects in context, 2014.", "text": "[16] Tsung-Yi Lin, Michael Maire, Serge J. Belongie, Lubomir D. Bourdev, Ross B. Girshick, James Hays, Pietro Perona, Deva Ramanan, Piotr Doll\u00e1r, and C. Lawrence Zitnick. Microsoft COCO: common objects in context, 2014.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/519", "parent": {"cref": "#/groups/4"}, "children": [], "label": "list_item", "prov": [{"page_no": 9, "bbox": {"l": 53.79800033569336, "t": 177.26263427734375, "r": 295.1200866699219, "b": 162.77911376953125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 100]}], "orig": "[17] Yuxin Wu, Alexander Kirillov, Francisco Massa, Wan-Yen Lo, and Ross Girshick. Detectron2, 2019.", "text": "[17] Yuxin Wu, Alexander Kirillov, Francisco Massa, Wan-Yen Lo, and Ross Girshick. Detectron2, 2019.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/520", "parent": {"cref": "#/groups/4"}, "children": [], "label": "list_item", "prov": [{"page_no": 9, "bbox": {"l": 53.79800033569336, "t": 161.3226318359375, "r": 294.80889892578125, "b": 122.92810821533203, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 339]}], "orig": "[18] Nikolaos Livathinos, Cesar Berrospi, Maksym Lysak, Viktor Kuropiatnyk, Ahmed Nassar, Andre Carvalho, Michele Dolfi, Christoph Auer, Kasper Dinkla, and Peter W. J. Staar. Robust pdf document conversion using recurrent neural networks. In Proceedings of the 35th Conference on Artificial Intelligence , AAAI, pages 1513715145, feb 2021.", "text": "[18] Nikolaos Livathinos, Cesar Berrospi, Maksym Lysak, Viktor Kuropiatnyk, Ahmed Nassar, Andre Carvalho, Michele Dolfi, Christoph Auer, Kasper Dinkla, and Peter W. J. Staar. Robust pdf document conversion using recurrent neural networks. In Proceedings of the 35th Conference on Artificial Intelligence , AAAI, pages 1513715145, feb 2021.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/521", "parent": {"cref": "#/groups/4"}, "children": [], "label": "list_item", "prov": [{"page_no": 9, "bbox": {"l": 53.797996520996094, "t": 121.47162628173828, "r": 295.22174072265625, "b": 83.07810974121094, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 336]}], "orig": "[19] Yiheng Xu, Minghao Li, Lei Cui, Shaohan Huang, Furu Wei, and Ming Zhou. Layoutlm: Pre-training of text and layout for document image understanding. In Proceedings of the 26th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining , KDD, pages 1192-1200, New York, USA, 2020. Association for Computing Machinery.", "text": "[19] Yiheng Xu, Minghao Li, Lei Cui, Shaohan Huang, Furu Wei, and Ming Zhou. Layoutlm: Pre-training of text and layout for document image understanding. In Proceedings of the 26th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining , KDD, pages 1192-1200, New York, USA, 2020. Association for Computing Machinery.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/522", "parent": {"cref": "#/groups/4"}, "children": [], "label": "list_item", "prov": [{"page_no": 9, "bbox": {"l": 317.9549865722656, "t": 264.9336242675781, "r": 559.0263671875, "b": 250.45010375976562, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 153]}], "orig": "[20] Shoubin Li, Xuyan Ma, Shuaiqun Pan, Jun Hu, Lin Shi, and Qing Wang. Vtlayout: Fusion of visual and text features for document layout analysis, 2021.", "text": "[20] Shoubin Li, Xuyan Ma, Shuaiqun Pan, Jun Hu, Lin Shi, and Qing Wang. Vtlayout: Fusion of visual and text features for document layout analysis, 2021.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/523", "parent": {"cref": "#/groups/4"}, "children": [], "label": "list_item", "prov": [{"page_no": 9, "bbox": {"l": 317.9549865722656, "t": 248.99362182617188, "r": 558.9714965820312, "b": 226.54010009765625, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 188]}], "orig": "[21] Peng Zhang, Can Li, Liang Qiao, Zhanzhan Cheng, Shiliang Pu, Yi Niu, and Fei Wu. Vsr: A unified framework for document layout analysis combining vision, semantics and relations, 2021.", "text": "[21] Peng Zhang, Can Li, Liang Qiao, Zhanzhan Cheng, Shiliang Pu, Yi Niu, and Fei Wu. Vsr: A unified framework for document layout analysis combining vision, semantics and relations, 2021.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/524", "parent": {"cref": "#/groups/4"}, "children": [], "label": "list_item", "prov": [{"page_no": 9, "bbox": {"l": 317.9549865722656, "t": 225.08364868164062, "r": 559.275390625, "b": 194.65213012695312, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 290]}], "orig": "[22] Peter W J Staar, Michele Dolfi, Christoph Auer, and Costas Bekas. Corpus conversion service: A machine learning platform to ingest documents at scale. In Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining , KDD, pages 774-782. ACM, 2018.", "text": "[22] Peter W J Staar, Michele Dolfi, Christoph Auer, and Costas Bekas. Corpus conversion service: A machine learning platform to ingest documents at scale. In Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining , KDD, pages 774-782. ACM, 2018.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/525", "parent": {"cref": "#/groups/4"}, "children": [], "label": "list_item", "prov": [{"page_no": 9, "bbox": {"l": 317.9549865722656, "t": 193.20263671875, "r": 559.3782958984375, "b": 178.71212768554688, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 138]}], "orig": "[23] Connor Shorten and Taghi M. Khoshgoftaar. A survey on image data augmentation for deep learning. Journal of Big Data , 6(1):60, 2019.", "text": "[23] Connor Shorten and Taghi M. Khoshgoftaar. A survey on image data augmentation for deep learning. Journal of Big Data , 6(1):60, 2019.", "enumerated": false, "marker": "-"}], "pictures": [{"self_ref": "#/pictures/0", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/17"}, {"cref": "#/texts/18"}, {"cref": "#/texts/19"}, {"cref": "#/texts/20"}, {"cref": "#/texts/21"}, {"cref": "#/texts/22"}, {"cref": "#/texts/23"}, {"cref": "#/texts/24"}, {"cref": "#/texts/25"}, {"cref": "#/texts/26"}, {"cref": "#/texts/27"}, {"cref": "#/texts/28"}, {"cref": "#/texts/29"}, {"cref": "#/texts/30"}, {"cref": "#/texts/31"}, {"cref": "#/texts/32"}, {"cref": "#/texts/33"}, {"cref": "#/texts/34"}, {"cref": "#/texts/35"}, {"cref": "#/texts/36"}, {"cref": "#/texts/37"}, {"cref": "#/texts/38"}, {"cref": "#/texts/39"}, {"cref": "#/texts/40"}, {"cref": "#/texts/41"}, {"cref": "#/texts/42"}, {"cref": "#/texts/43"}, {"cref": "#/texts/44"}, {"cref": "#/texts/45"}, {"cref": "#/texts/46"}, {"cref": "#/texts/47"}, {"cref": "#/texts/48"}, {"cref": "#/texts/49"}, {"cref": "#/texts/50"}, {"cref": "#/texts/51"}, {"cref": "#/texts/52"}, {"cref": "#/texts/53"}, {"cref": "#/texts/54"}, {"cref": "#/texts/55"}, {"cref": "#/texts/56"}, {"cref": "#/texts/57"}, {"cref": "#/texts/58"}, {"cref": "#/texts/59"}, {"cref": "#/texts/60"}, {"cref": "#/texts/61"}, {"cref": "#/texts/62"}, {"cref": "#/texts/63"}, {"cref": "#/texts/64"}, {"cref": "#/texts/65"}, {"cref": "#/texts/66"}, {"cref": "#/texts/67"}, {"cref": "#/texts/68"}, {"cref": "#/texts/69"}, {"cref": "#/texts/70"}, {"cref": "#/texts/71"}, {"cref": "#/texts/72"}, {"cref": "#/texts/73"}, {"cref": "#/texts/74"}, {"cref": "#/texts/75"}, {"cref": "#/texts/76"}, {"cref": "#/texts/77"}, {"cref": "#/texts/78"}, {"cref": "#/texts/79"}, {"cref": "#/texts/80"}, {"cref": "#/texts/81"}, {"cref": "#/texts/82"}, {"cref": "#/texts/83"}, {"cref": "#/texts/84"}, {"cref": "#/texts/85"}, {"cref": "#/texts/86"}, {"cref": "#/texts/87"}, {"cref": "#/texts/88"}, {"cref": "#/texts/89"}, {"cref": "#/texts/90"}, {"cref": "#/texts/91"}, {"cref": "#/texts/92"}, {"cref": "#/texts/93"}, {"cref": "#/texts/94"}, {"cref": "#/texts/95"}, {"cref": "#/texts/96"}, {"cref": "#/texts/97"}, {"cref": "#/texts/98"}, {"cref": "#/texts/99"}, {"cref": "#/texts/100"}, {"cref": "#/texts/101"}, {"cref": "#/texts/102"}, {"cref": "#/texts/103"}, {"cref": "#/texts/104"}, {"cref": "#/texts/105"}, {"cref": "#/texts/106"}, {"cref": "#/texts/107"}, {"cref": "#/texts/108"}, {"cref": "#/texts/109"}, {"cref": "#/texts/110"}, {"cref": "#/texts/111"}, {"cref": "#/texts/112"}, {"cref": "#/texts/113"}, {"cref": "#/texts/114"}, {"cref": "#/texts/115"}, {"cref": "#/texts/116"}, {"cref": "#/texts/117"}, {"cref": "#/texts/118"}, {"cref": "#/texts/119"}, {"cref": "#/texts/120"}, {"cref": "#/texts/121"}, {"cref": "#/texts/122"}, {"cref": "#/texts/123"}, {"cref": "#/texts/124"}, {"cref": "#/texts/125"}, {"cref": "#/texts/126"}, {"cref": "#/texts/127"}, {"cref": "#/texts/128"}, {"cref": "#/texts/129"}, {"cref": "#/texts/130"}, {"cref": "#/texts/131"}, {"cref": "#/texts/132"}, {"cref": "#/texts/133"}, {"cref": "#/texts/134"}, {"cref": "#/texts/135"}, {"cref": "#/texts/136"}, {"cref": "#/texts/137"}, {"cref": "#/texts/138"}, {"cref": "#/texts/139"}, {"cref": "#/texts/140"}, {"cref": "#/texts/141"}, {"cref": "#/texts/142"}, {"cref": "#/texts/143"}, {"cref": "#/texts/144"}, {"cref": "#/texts/145"}, {"cref": "#/texts/146"}, {"cref": "#/texts/147"}, {"cref": "#/texts/148"}, {"cref": "#/texts/149"}, {"cref": "#/texts/150"}, {"cref": "#/texts/151"}, {"cref": "#/texts/152"}, {"cref": "#/texts/153"}, {"cref": "#/texts/154"}, {"cref": "#/texts/155"}, {"cref": "#/texts/156"}, {"cref": "#/texts/157"}, {"cref": "#/texts/158"}, {"cref": "#/texts/159"}, {"cref": "#/texts/160"}, {"cref": "#/texts/161"}, {"cref": "#/texts/162"}, {"cref": "#/texts/163"}, {"cref": "#/texts/164"}, {"cref": "#/texts/165"}, {"cref": "#/texts/166"}, {"cref": "#/texts/167"}, {"cref": "#/texts/168"}, {"cref": "#/texts/169"}, {"cref": "#/texts/170"}, {"cref": "#/texts/171"}, {"cref": "#/texts/172"}, {"cref": "#/texts/173"}, {"cref": "#/texts/174"}, {"cref": "#/texts/175"}, {"cref": "#/texts/176"}, {"cref": "#/texts/177"}, {"cref": "#/texts/178"}, {"cref": "#/texts/179"}, {"cref": "#/texts/180"}, {"cref": "#/texts/181"}, {"cref": "#/texts/182"}, {"cref": "#/texts/183"}, {"cref": "#/texts/184"}, {"cref": "#/texts/185"}, {"cref": "#/texts/186"}, {"cref": "#/texts/187"}, {"cref": "#/texts/188"}, {"cref": "#/texts/189"}, {"cref": "#/texts/190"}, {"cref": "#/texts/191"}, {"cref": "#/texts/192"}, {"cref": "#/texts/193"}, {"cref": "#/texts/194"}, {"cref": "#/texts/195"}, {"cref": "#/texts/196"}, {"cref": "#/texts/197"}, {"cref": "#/texts/198"}, {"cref": "#/texts/199"}, {"cref": "#/texts/200"}, {"cref": "#/texts/201"}, {"cref": "#/texts/202"}, {"cref": "#/texts/203"}, {"cref": "#/texts/204"}, {"cref": "#/texts/205"}, {"cref": "#/texts/206"}, {"cref": "#/texts/207"}, {"cref": "#/texts/208"}, {"cref": "#/texts/209"}, {"cref": "#/texts/210"}, {"cref": "#/texts/211"}, {"cref": "#/texts/212"}, {"cref": "#/texts/213"}, {"cref": "#/texts/214"}, {"cref": "#/texts/215"}, {"cref": "#/texts/216"}, {"cref": "#/texts/217"}, {"cref": "#/texts/218"}, {"cref": "#/texts/219"}, {"cref": "#/texts/220"}, {"cref": "#/texts/221"}, {"cref": "#/texts/222"}, {"cref": "#/texts/223"}, {"cref": "#/texts/224"}, {"cref": "#/texts/225"}, {"cref": "#/texts/226"}, {"cref": "#/texts/227"}, {"cref": "#/texts/228"}, {"cref": "#/texts/229"}, {"cref": "#/texts/230"}, {"cref": "#/texts/231"}, {"cref": "#/texts/232"}, {"cref": "#/texts/233"}, {"cref": "#/texts/234"}, {"cref": "#/texts/235"}, {"cref": "#/texts/236"}, {"cref": "#/texts/237"}, {"cref": "#/texts/238"}, {"cref": "#/texts/239"}, {"cref": "#/texts/240"}, {"cref": "#/texts/241"}, {"cref": "#/texts/242"}, {"cref": "#/texts/243"}, {"cref": "#/texts/244"}, {"cref": "#/texts/245"}, {"cref": "#/texts/246"}, {"cref": "#/texts/247"}, {"cref": "#/texts/248"}, {"cref": "#/texts/249"}, {"cref": "#/texts/250"}, {"cref": "#/texts/251"}, {"cref": "#/texts/252"}, {"cref": "#/texts/253"}, {"cref": "#/texts/254"}, {"cref": "#/texts/255"}, {"cref": "#/texts/256"}, {"cref": "#/texts/257"}, {"cref": "#/texts/258"}, {"cref": "#/texts/259"}, {"cref": "#/texts/260"}, {"cref": "#/texts/261"}, {"cref": "#/texts/262"}, {"cref": "#/texts/263"}, {"cref": "#/texts/264"}, {"cref": "#/texts/265"}, {"cref": "#/texts/266"}, {"cref": "#/texts/267"}, {"cref": "#/texts/268"}, {"cref": "#/texts/269"}, {"cref": "#/texts/270"}, {"cref": "#/texts/271"}, {"cref": "#/texts/272"}, {"cref": "#/texts/273"}, {"cref": "#/texts/274"}, {"cref": "#/texts/275"}, {"cref": "#/texts/276"}, {"cref": "#/texts/277"}, {"cref": "#/texts/278"}, {"cref": "#/texts/279"}, {"cref": "#/texts/280"}, {"cref": "#/texts/281"}, {"cref": "#/texts/282"}, {"cref": "#/texts/283"}, {"cref": "#/texts/284"}, {"cref": "#/texts/285"}, {"cref": "#/texts/286"}, {"cref": "#/texts/287"}, {"cref": "#/texts/288"}, {"cref": "#/texts/289"}, {"cref": "#/texts/290"}, {"cref": "#/texts/291"}, {"cref": "#/texts/292"}, {"cref": "#/texts/293"}, {"cref": "#/texts/294"}, {"cref": "#/texts/295"}, {"cref": "#/texts/296"}, {"cref": "#/texts/297"}, {"cref": "#/texts/298"}, {"cref": "#/texts/299"}, {"cref": "#/texts/300"}, {"cref": "#/texts/301"}, {"cref": "#/texts/302"}, {"cref": "#/texts/303"}, {"cref": "#/texts/304"}, {"cref": "#/texts/305"}, {"cref": "#/texts/306"}, {"cref": "#/texts/307"}, {"cref": "#/texts/308"}, {"cref": "#/texts/309"}, {"cref": "#/texts/310"}, {"cref": "#/texts/311"}, {"cref": "#/texts/312"}, {"cref": "#/texts/313"}, {"cref": "#/texts/314"}, {"cref": "#/texts/315"}, {"cref": "#/texts/316"}, {"cref": "#/texts/317"}, {"cref": "#/texts/318"}, {"cref": "#/texts/319"}, {"cref": "#/texts/320"}, {"cref": "#/texts/321"}, {"cref": "#/texts/322"}, {"cref": "#/texts/323"}, {"cref": "#/texts/324"}, {"cref": "#/texts/325"}, {"cref": "#/texts/326"}, {"cref": "#/texts/327"}, {"cref": "#/texts/328"}, {"cref": "#/texts/329"}, {"cref": "#/texts/330"}, {"cref": "#/texts/331"}, {"cref": "#/texts/332"}, {"cref": "#/texts/333"}, {"cref": "#/texts/334"}, {"cref": "#/texts/335"}, {"cref": "#/texts/336"}, {"cref": "#/texts/337"}, {"cref": "#/texts/338"}, {"cref": "#/texts/339"}, {"cref": "#/texts/340"}, {"cref": "#/texts/341"}, {"cref": "#/texts/342"}, {"cref": "#/texts/343"}, {"cref": "#/texts/344"}, {"cref": "#/texts/345"}], "label": "picture", "prov": [{"page_no": 1, "bbox": {"l": 323.408203125, "t": 541.6512451171875, "r": 553.2952270507812, "b": 266.1492919921875, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 84]}], "captions": [{"cref": "#/texts/16"}], "references": [], "footnotes": [], "image": null, "annotations": []}, {"self_ref": "#/pictures/1", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/373"}, {"cref": "#/texts/374"}, {"cref": "#/texts/375"}, {"cref": "#/texts/376"}, {"cref": "#/texts/377"}, {"cref": "#/texts/378"}, {"cref": "#/texts/379"}, {"cref": "#/texts/380"}, {"cref": "#/texts/381"}, {"cref": "#/texts/382"}, {"cref": "#/texts/383"}, {"cref": "#/texts/384"}], "label": "picture", "prov": [{"page_no": 3, "bbox": {"l": 88.33030700683594, "t": 699.1134643554688, "r": 263.7049560546875, "b": 571.4317626953125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 69]}], "captions": [{"cref": "#/texts/372"}], "references": [], "footnotes": [], "image": null, "annotations": []}, {"self_ref": "#/pictures/2", "parent": {"cref": "#/body"}, "children": [], "label": "picture", "prov": [{"page_no": 4, "bbox": {"l": 53.05912780761719, "t": 481.2087097167969, "r": 295.8506164550781, "b": 251.135986328125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 281]}], "captions": [{"cref": "#/texts/397"}], "references": [], "footnotes": [], "image": null, "annotations": []}, {"self_ref": "#/pictures/3", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/418"}, {"cref": "#/texts/419"}, {"cref": "#/texts/420"}, {"cref": "#/texts/421"}, {"cref": "#/texts/422"}, {"cref": "#/texts/423"}, {"cref": "#/texts/424"}, {"cref": "#/texts/425"}, {"cref": "#/texts/426"}, {"cref": "#/texts/427"}], "label": "picture", "prov": [{"page_no": 5, "bbox": {"l": 315.960205078125, "t": 706.6611938476562, "r": 559.396484375, "b": 332.31915283203125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 173]}], "captions": [{"cref": "#/texts/417"}], "references": [], "footnotes": [], "image": null, "annotations": []}, {"self_ref": "#/pictures/4", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/437"}, {"cref": "#/texts/438"}, {"cref": "#/texts/439"}, {"cref": "#/texts/440"}, {"cref": "#/texts/441"}, {"cref": "#/texts/442"}, {"cref": "#/texts/443"}, {"cref": "#/texts/444"}, {"cref": "#/texts/445"}, {"cref": "#/texts/446"}, {"cref": "#/texts/447"}, {"cref": "#/texts/448"}, {"cref": "#/texts/449"}, {"cref": "#/texts/450"}, {"cref": "#/texts/451"}, {"cref": "#/texts/452"}, {"cref": "#/texts/453"}, {"cref": "#/texts/454"}, {"cref": "#/texts/455"}, {"cref": "#/texts/456"}, {"cref": "#/texts/457"}, {"cref": "#/texts/458"}], "label": "picture", "prov": [{"page_no": 6, "bbox": {"l": 323.48431396484375, "t": 702.1139526367188, "r": 553.5411376953125, "b": 531.9892578125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 329]}], "captions": [{"cref": "#/texts/436"}], "references": [], "footnotes": [], "image": null, "annotations": []}, {"self_ref": "#/pictures/5", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/503"}, {"cref": "#/texts/504"}, {"cref": "#/texts/505"}, {"cref": "#/texts/506"}, {"cref": "#/texts/507"}, {"cref": "#/texts/508"}, {"cref": "#/texts/509"}, {"cref": "#/texts/510"}, {"cref": "#/texts/511"}, {"cref": "#/texts/512"}, {"cref": "#/texts/513"}], "label": "picture", "prov": [{"page_no": 9, "bbox": {"l": 52.963985443115234, "t": 707.2640991210938, "r": 556.931640625, "b": 349.8648681640625, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 89]}], "captions": [{"cref": "#/texts/502"}], "references": [], "footnotes": [], "image": null, "annotations": []}], "tables": [{"self_ref": "#/tables/0", "parent": {"cref": "#/body"}, "children": [], "label": "table", "prov": [{"page_no": 4, "bbox": {"l": 98.93103790283203, "t": 654.5245361328125, "r": 512.579833984375, "b": 497.91851806640625, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [{"cref": "#/texts/396"}], "references": [], "footnotes": [], "image": null, "data": {"table_cells": [{"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 233.94400024414062, "t": 651.7764892578125, "r": 270.042724609375, "b": 643.40185546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 4, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 6, "text": "% of Total", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 329.04998779296875, "t": 651.7764892578125, "r": 483.39764404296875, "b": 643.40185546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 6, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 6, "end_col_offset_idx": 12, "text": "triple inter-annotator mAP @ 0.5-0.95 (%)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 104.82499694824219, "t": 640.8174438476562, "r": 141.7127685546875, "b": 632.4428100585938, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "class label", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 175.94700622558594, "t": 640.8174438476562, "r": 198.7126922607422, "b": 632.4428100585938, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Count", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 213.7949981689453, "t": 640.8174438476562, "r": 233.69143676757812, "b": 632.4428100585938, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Train", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 249.37367248535156, "t": 640.8174438476562, "r": 264.5, "b": 632.4428100585938, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Test", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 283.5356750488281, "t": 640.8174438476562, "r": 295.3085632324219, "b": 632.4428100585938, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Val", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 314.0150146484375, "t": 640.8174438476562, "r": 324.9809265136719, "b": 632.4428100585938, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "All", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 343.0123596191406, "t": 640.8174438476562, "r": 354.6507568359375, "b": 632.4428100585938, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "Fin", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 367.84033203125, "t": 640.8174438476562, "r": 384.3205871582031, "b": 632.4428100585938, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "Man", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 407.5435791015625, "t": 640.8174438476562, "r": 418.1597900390625, "b": 632.4428100585938, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "Sci", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 432.2998046875, "t": 640.8174438476562, "r": 447.8296203613281, "b": 632.4428100585938, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "Law", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 465.7265625, "t": 640.8174438476562, "r": 477.5084228515625, "b": 632.4428100585938, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "Pat", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 493.52239990234375, "t": 640.8174438476562, "r": 507.17822265625, "b": 632.4428100585938, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "Ten", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 104.82499694824219, "t": 629.46044921875, "r": 134.01063537597656, "b": 621.0858154296875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Caption", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 177.86599731445312, "t": 629.46044921875, "r": 198.71287536621094, "b": 621.0858154296875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "22524", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.21099853515625, "t": 629.46044921875, "r": 233.69174194335938, "b": 621.0858154296875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "2.04", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956176757812, "t": 629.46044921875, "r": 264.50030517578125, "b": 621.0858154296875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "1.77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.828125, "t": 629.46044921875, "r": 295.3088684082031, "b": 621.0858154296875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "2.32", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301025390625, "t": 629.46044921875, "r": 324.9811706542969, "b": 621.0858154296875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "84-89", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.9428405761719, "t": 629.46044921875, "r": 354.6510009765625, "b": 621.0858154296875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "40-61", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.6126708984375, "t": 629.46044921875, "r": 384.3208312988281, "b": 621.0858154296875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "86-92", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.4518737792969, "t": 629.46044921875, "r": 418.1600341796875, "b": 621.0858154296875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "94-99", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217041015625, "t": 629.46044921875, "r": 447.8298645019531, "b": 621.0858154296875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "95-99", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.8005065917969, "t": 629.46044921875, "r": 477.5086669921875, "b": 621.0858154296875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "69-78", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 495.32489013671875, "t": 629.46044921875, "r": 507.178466796875, "b": 621.0858154296875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.82499694824219, "t": 618.50146484375, "r": 137.3282012939453, "b": 610.1268310546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Footnote", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 182.03500366210938, "t": 618.50146484375, "r": 198.71250915527344, "b": 610.1268310546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "6318", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.21099853515625, "t": 618.50146484375, "r": 233.69174194335938, "b": 610.1268310546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.60", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956176757812, "t": 618.50146484375, "r": 264.50030517578125, "b": 610.1268310546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.31", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.828125, "t": 618.50146484375, "r": 295.3088684082031, "b": 610.1268310546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.58", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301025390625, "t": 618.50146484375, "r": 324.9811706542969, "b": 610.1268310546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "83-91", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 342.7973937988281, "t": 618.50146484375, "r": 354.6509704589844, "b": 610.1268310546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 371.8126525878906, "t": 618.50146484375, "r": 384.3207702636719, "b": 610.1268310546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "100", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.4518127441406, "t": 618.50146484375, "r": 418.15997314453125, "b": 610.1268310546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "62-88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.12164306640625, "t": 618.50146484375, "r": 447.8298034667969, "b": 610.1268310546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "85-94", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 465.6549987792969, "t": 618.50146484375, "r": 477.5085754394531, "b": 610.1268310546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.4702453613281, "t": 618.50146484375, "r": 507.17840576171875, "b": 610.1268310546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "82-97", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.82499694824219, "t": 607.54248046875, "r": 135.33766174316406, "b": 599.1678466796875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Formula", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 177.86599731445312, "t": 607.54248046875, "r": 198.71287536621094, "b": 599.1678466796875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "25027", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.21099853515625, "t": 607.54248046875, "r": 233.69174194335938, "b": 599.1678466796875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "2.25", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956176757812, "t": 607.54248046875, "r": 264.50030517578125, "b": 599.1678466796875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "1.90", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.828125, "t": 607.54248046875, "r": 295.3088684082031, "b": 599.1678466796875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "2.96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301025390625, "t": 607.54248046875, "r": 324.9811706542969, "b": 599.1678466796875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "83-85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 342.7973937988281, "t": 607.54248046875, "r": 354.6509704589844, "b": 599.1678466796875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 372.4671936035156, "t": 607.54248046875, "r": 384.3207702636719, "b": 599.1678466796875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.4518127441406, "t": 607.54248046875, "r": 418.15997314453125, "b": 599.1678466796875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "84-87", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.12164306640625, "t": 607.54248046875, "r": 447.8298034667969, "b": 599.1678466796875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "86-96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 465.6549987792969, "t": 607.54248046875, "r": 477.5085754394531, "b": 599.1678466796875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 495.3247985839844, "t": 607.54248046875, "r": 507.1783752441406, "b": 599.1678466796875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.82499694824219, "t": 596.5834350585938, "r": 137.7047882080078, "b": 588.2088012695312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "List-item", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 173.69700622558594, "t": 596.5834350585938, "r": 198.7132568359375, "b": 588.2088012695312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "185660", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 215.04200744628906, "t": 596.5834350585938, "r": 233.69212341308594, "b": 588.2088012695312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "17.19", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.85055541992188, "t": 596.5834350585938, "r": 264.50067138671875, "b": 588.2088012695312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "13.34", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 276.65911865234375, "t": 596.5834350585938, "r": 295.3092346191406, "b": 588.2088012695312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "15.82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301025390625, "t": 596.5834350585938, "r": 324.9811706542969, "b": 588.2088012695312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "87-88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.9428405761719, "t": 596.5834350585938, "r": 354.6510009765625, "b": 588.2088012695312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "74-83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.6126708984375, "t": 596.5834350585938, "r": 384.3208312988281, "b": 588.2088012695312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "90-92", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.4518737792969, "t": 596.5834350585938, "r": 418.1600341796875, "b": 588.2088012695312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "97-97", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217041015625, "t": 596.5834350585938, "r": 447.8298645019531, "b": 588.2088012695312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "81-85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.8005065917969, "t": 596.5834350585938, "r": 477.5086669921875, "b": 588.2088012695312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "75-88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.4703369140625, "t": 596.5834350585938, "r": 507.1784973144531, "b": 588.2088012695312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "93-95", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.82499694824219, "t": 585.6244506835938, "r": 147.3526153564453, "b": 577.2498168945312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-footer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 177.86599731445312, "t": 585.6244506835938, "r": 198.71287536621094, "b": 577.2498168945312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "70878", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.21099853515625, "t": 585.6244506835938, "r": 233.69174194335938, "b": 577.2498168945312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "6.51", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956176757812, "t": 585.6244506835938, "r": 264.50030517578125, "b": 577.2498168945312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "5.58", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.828125, "t": 585.6244506835938, "r": 295.3088684082031, "b": 577.2498168945312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "6.00", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301025390625, "t": 585.6244506835938, "r": 324.9811706542969, "b": 577.2498168945312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "93-94", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.9428405761719, "t": 585.6244506835938, "r": 354.6510009765625, "b": 577.2498168945312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "88-90", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.6126708984375, "t": 585.6244506835938, "r": 384.3208312988281, "b": 577.2498168945312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "95-96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 405.6518859863281, "t": 585.6244506835938, "r": 418.1600036621094, "b": 577.2498168945312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "100", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1216735839844, "t": 585.6244506835938, "r": 447.829833984375, "b": 577.2498168945312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "92-97", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 465.00048828125, "t": 585.6244506835938, "r": 477.50860595703125, "b": 577.2498168945312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "100", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47027587890625, "t": 585.6244506835938, "r": 507.1784362792969, "b": 577.2498168945312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "96-98", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.82499694824219, "t": 574.6654663085938, "r": 150.10531616210938, "b": 566.2908325195312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 177.86599731445312, "t": 574.6654663085938, "r": 198.71287536621094, "b": 566.2908325195312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "58022", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.21099853515625, "t": 574.6654663085938, "r": 233.69174194335938, "b": 566.2908325195312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "5.10", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956176757812, "t": 574.6654663085938, "r": 264.50030517578125, "b": 566.2908325195312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "6.70", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.828125, "t": 574.6654663085938, "r": 295.3088684082031, "b": 566.2908325195312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "5.06", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301025390625, "t": 574.6654663085938, "r": 324.9811706542969, "b": 566.2908325195312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "85-89", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.9428405761719, "t": 574.6654663085938, "r": 354.6510009765625, "b": 566.2908325195312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "66-76", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.6126708984375, "t": 574.6654663085938, "r": 384.3208312988281, "b": 566.2908325195312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "90-94", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.2825012207031, "t": 574.6654663085938, "r": 418.1600341796875, "b": 566.2908325195312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "98-100", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217041015625, "t": 574.6654663085938, "r": 447.8298645019531, "b": 566.2908325195312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "91-92", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.8005065917969, "t": 574.6654663085938, "r": 477.5086669921875, "b": 566.2908325195312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "97-99", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.4703369140625, "t": 574.6654663085938, "r": 507.1784973144531, "b": 566.2908325195312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "81-86", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.82499694824219, "t": 563.7064819335938, "r": 130.80963134765625, "b": 555.3318481445312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Picture", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 177.86599731445312, "t": 563.7064819335938, "r": 198.71287536621094, "b": 555.3318481445312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "45976", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.21099853515625, "t": 563.7064819335938, "r": 233.69174194335938, "b": 555.3318481445312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "4.21", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956176757812, "t": 563.7064819335938, "r": 264.50030517578125, "b": 555.3318481445312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "2.78", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.828125, "t": 563.7064819335938, "r": 295.3088684082031, "b": 555.3318481445312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "5.31", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301025390625, "t": 563.7064819335938, "r": 324.9811706542969, "b": 555.3318481445312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "69-71", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.9428405761719, "t": 563.7064819335938, "r": 354.6510009765625, "b": 555.3318481445312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "56-59", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.6126708984375, "t": 563.7064819335938, "r": 384.3208312988281, "b": 555.3318481445312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "82-86", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.4518737792969, "t": 563.7064819335938, "r": 418.1600341796875, "b": 555.3318481445312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "69-82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217041015625, "t": 563.7064819335938, "r": 447.8298645019531, "b": 555.3318481445312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "80-95", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.8005065917969, "t": 563.7064819335938, "r": 477.5086669921875, "b": 555.3318481445312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "66-71", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.4703369140625, "t": 563.7064819335938, "r": 507.1784973144531, "b": 555.3318481445312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "59-76", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.82499694824219, "t": 552.7474365234375, "r": 159.5648651123047, "b": 544.372802734375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Section-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 173.69700622558594, "t": 552.7474365234375, "r": 198.7132568359375, "b": 544.372802734375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "142884", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 215.04200744628906, "t": 552.7474365234375, "r": 233.69212341308594, "b": 544.372802734375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "12.60", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.85055541992188, "t": 552.7474365234375, "r": 264.50067138671875, "b": 544.372802734375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "15.77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 276.65911865234375, "t": 552.7474365234375, "r": 295.3092346191406, "b": 544.372802734375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "12.85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301025390625, "t": 552.7474365234375, "r": 324.9811706542969, "b": 544.372802734375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "83-84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.9428405761719, "t": 552.7474365234375, "r": 354.6510009765625, "b": 544.372802734375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "76-81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.6126708984375, "t": 552.7474365234375, "r": 384.3208312988281, "b": 544.372802734375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "90-92", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.4518737792969, "t": 552.7474365234375, "r": 418.1600341796875, "b": 544.372802734375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "94-95", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217041015625, "t": 552.7474365234375, "r": 447.8298645019531, "b": 544.372802734375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "87-94", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.8005065917969, "t": 552.7474365234375, "r": 477.5086669921875, "b": 544.372802734375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "69-73", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.4703369140625, "t": 552.7474365234375, "r": 507.1784973144531, "b": 544.372802734375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "78-86", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.82499694824219, "t": 541.7884521484375, "r": 124.63176727294922, "b": 533.413818359375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 177.86599731445312, "t": 541.7884521484375, "r": 198.71287536621094, "b": 533.413818359375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "34733", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.21099853515625, "t": 541.7884521484375, "r": 233.69174194335938, "b": 533.413818359375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "3.20", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956176757812, "t": 541.7884521484375, "r": 264.50030517578125, "b": 533.413818359375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "2.27", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.828125, "t": 541.7884521484375, "r": 295.3088684082031, "b": 533.413818359375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "3.60", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301025390625, "t": 541.7884521484375, "r": 324.9811706542969, "b": 533.413818359375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "77-81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.9428405761719, "t": 541.7884521484375, "r": 354.6510009765625, "b": 533.413818359375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "75-80", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.6126708984375, "t": 541.7884521484375, "r": 384.3208312988281, "b": 533.413818359375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "83-86", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.4518737792969, "t": 541.7884521484375, "r": 418.1600341796875, "b": 533.413818359375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "98-99", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217041015625, "t": 541.7884521484375, "r": 447.8298645019531, "b": 533.413818359375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "58-80", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.8005065917969, "t": 541.7884521484375, "r": 477.5086669921875, "b": 533.413818359375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "79-84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.4703369140625, "t": 541.7884521484375, "r": 507.1784973144531, "b": 533.413818359375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "70-85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.82499694824219, "t": 530.8304443359375, "r": 120.78518676757812, "b": 522.455810546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Text", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 173.69700622558594, "t": 530.8304443359375, "r": 198.7132568359375, "b": 522.455810546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "510377", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 215.04200744628906, "t": 530.8304443359375, "r": 233.69212341308594, "b": 522.455810546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "45.82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.85055541992188, "t": 530.8304443359375, "r": 264.50067138671875, "b": 522.455810546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "49.28", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 276.65911865234375, "t": 530.8304443359375, "r": 295.3092346191406, "b": 522.455810546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "45.00", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301025390625, "t": 530.8304443359375, "r": 324.9811706542969, "b": 522.455810546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "84-86", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.9428405761719, "t": 530.8304443359375, "r": 354.6510009765625, "b": 522.455810546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "81-86", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.6126708984375, "t": 530.8304443359375, "r": 384.3208312988281, "b": 522.455810546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "88-93", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.4518737792969, "t": 530.8304443359375, "r": 418.1600341796875, "b": 522.455810546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "89-93", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217041015625, "t": 530.8304443359375, "r": 447.8298645019531, "b": 522.455810546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "87-92", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.8005065917969, "t": 530.8304443359375, "r": 477.5086669921875, "b": 522.455810546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "71-79", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.4703369140625, "t": 530.8304443359375, "r": 507.1784973144531, "b": 522.455810546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "87-95", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.82499694824219, "t": 519.8714599609375, "r": 121.81632995605469, "b": 511.496826171875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Title", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 182.03500366210938, "t": 519.8714599609375, "r": 198.71250915527344, "b": 511.496826171875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "5071", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.21099853515625, "t": 519.8714599609375, "r": 233.69174194335938, "b": 511.496826171875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.47", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956176757812, "t": 519.8714599609375, "r": 264.50030517578125, "b": 511.496826171875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.30", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.828125, "t": 519.8714599609375, "r": 295.3088684082031, "b": 511.496826171875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.50", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301025390625, "t": 519.8714599609375, "r": 324.9811706542969, "b": 511.496826171875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "60-72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.9428405761719, "t": 519.8714599609375, "r": 354.6510009765625, "b": 511.496826171875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "24-63", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.6126708984375, "t": 519.8714599609375, "r": 384.3208312988281, "b": 511.496826171875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "50-63", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.2825012207031, "t": 519.8714599609375, "r": 418.1600341796875, "b": 511.496826171875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "94-100", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217041015625, "t": 519.8714599609375, "r": 447.8298645019531, "b": 511.496826171875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "82-96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.8005065917969, "t": 519.8714599609375, "r": 477.5086669921875, "b": 511.496826171875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "68-79", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.4703369140625, "t": 519.8714599609375, "r": 507.1784973144531, "b": 511.496826171875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "24-56", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.82499694824219, "t": 508.5134582519531, "r": 123.43028259277344, "b": 500.1388244628906, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Total", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 169.52699279785156, "t": 508.5134582519531, "r": 198.71263122558594, "b": 500.1388244628906, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "1107470", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 208.6750030517578, "t": 508.5134582519531, "r": 233.69125366210938, "b": 500.1388244628906, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "941123", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 243.65292358398438, "t": 508.5134582519531, "r": 264.49981689453125, "b": 500.1388244628906, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "99816", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 274.46148681640625, "t": 508.5134582519531, "r": 295.3083801269531, "b": 500.1388244628906, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "66531", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301025390625, "t": 508.5134582519531, "r": 324.9811706542969, "b": 500.1388244628906, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "82-83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.9428405761719, "t": 508.5134582519531, "r": 354.6510009765625, "b": 500.1388244628906, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "71-74", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.6126708984375, "t": 508.5134582519531, "r": 384.3208312988281, "b": 500.1388244628906, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "79-81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.4518737792969, "t": 508.5134582519531, "r": 418.1600341796875, "b": 500.1388244628906, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "89-94", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217041015625, "t": 508.5134582519531, "r": 447.8298645019531, "b": 500.1388244628906, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "86-91", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.8005065917969, "t": 508.5134582519531, "r": 477.5086669921875, "b": 500.1388244628906, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "71-76", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.4703369140625, "t": 508.5134582519531, "r": 507.1784973144531, "b": 500.1388244628906, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "68-85", "column_header": false, "row_header": false, "row_section": false}], "num_rows": 14, "num_cols": 12, "grid": [[{"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 233.94400024414062, "t": 651.7764892578125, "r": 270.042724609375, "b": 643.40185546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 4, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 6, "text": "% of Total", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 233.94400024414062, "t": 651.7764892578125, "r": 270.042724609375, "b": 643.40185546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 4, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 6, "text": "% of Total", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 233.94400024414062, "t": 651.7764892578125, "r": 270.042724609375, "b": 643.40185546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 4, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 6, "text": "% of Total", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 233.94400024414062, "t": 651.7764892578125, "r": 270.042724609375, "b": 643.40185546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 4, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 6, "text": "% of Total", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 329.04998779296875, "t": 651.7764892578125, "r": 483.39764404296875, "b": 643.40185546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 6, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 6, "end_col_offset_idx": 12, "text": "triple inter-annotator mAP @ 0.5-0.95 (%)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 329.04998779296875, "t": 651.7764892578125, "r": 483.39764404296875, "b": 643.40185546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 6, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 6, "end_col_offset_idx": 12, "text": "triple inter-annotator mAP @ 0.5-0.95 (%)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 329.04998779296875, "t": 651.7764892578125, "r": 483.39764404296875, "b": 643.40185546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 6, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 6, "end_col_offset_idx": 12, "text": "triple inter-annotator mAP @ 0.5-0.95 (%)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 329.04998779296875, "t": 651.7764892578125, "r": 483.39764404296875, "b": 643.40185546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 6, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 6, "end_col_offset_idx": 12, "text": "triple inter-annotator mAP @ 0.5-0.95 (%)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 329.04998779296875, "t": 651.7764892578125, "r": 483.39764404296875, "b": 643.40185546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 6, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 6, "end_col_offset_idx": 12, "text": "triple inter-annotator mAP @ 0.5-0.95 (%)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 329.04998779296875, "t": 651.7764892578125, "r": 483.39764404296875, "b": 643.40185546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 6, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 6, "end_col_offset_idx": 12, "text": "triple inter-annotator mAP @ 0.5-0.95 (%)", "column_header": true, "row_header": false, "row_section": false}], [{"bbox": {"l": 104.82499694824219, "t": 640.8174438476562, "r": 141.7127685546875, "b": 632.4428100585938, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "class label", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 175.94700622558594, "t": 640.8174438476562, "r": 198.7126922607422, "b": 632.4428100585938, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Count", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 213.7949981689453, "t": 640.8174438476562, "r": 233.69143676757812, "b": 632.4428100585938, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Train", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 249.37367248535156, "t": 640.8174438476562, "r": 264.5, "b": 632.4428100585938, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Test", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 283.5356750488281, "t": 640.8174438476562, "r": 295.3085632324219, "b": 632.4428100585938, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Val", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 314.0150146484375, "t": 640.8174438476562, "r": 324.9809265136719, "b": 632.4428100585938, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "All", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 343.0123596191406, "t": 640.8174438476562, "r": 354.6507568359375, "b": 632.4428100585938, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "Fin", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 367.84033203125, "t": 640.8174438476562, "r": 384.3205871582031, "b": 632.4428100585938, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "Man", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 407.5435791015625, "t": 640.8174438476562, "r": 418.1597900390625, "b": 632.4428100585938, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "Sci", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 432.2998046875, "t": 640.8174438476562, "r": 447.8296203613281, "b": 632.4428100585938, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "Law", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 465.7265625, "t": 640.8174438476562, "r": 477.5084228515625, "b": 632.4428100585938, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "Pat", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 493.52239990234375, "t": 640.8174438476562, "r": 507.17822265625, "b": 632.4428100585938, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "Ten", "column_header": true, "row_header": false, "row_section": false}], [{"bbox": {"l": 104.82499694824219, "t": 629.46044921875, "r": 134.01063537597656, "b": 621.0858154296875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Caption", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 177.86599731445312, "t": 629.46044921875, "r": 198.71287536621094, "b": 621.0858154296875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "22524", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.21099853515625, "t": 629.46044921875, "r": 233.69174194335938, "b": 621.0858154296875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "2.04", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956176757812, "t": 629.46044921875, "r": 264.50030517578125, "b": 621.0858154296875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "1.77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.828125, "t": 629.46044921875, "r": 295.3088684082031, "b": 621.0858154296875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "2.32", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301025390625, "t": 629.46044921875, "r": 324.9811706542969, "b": 621.0858154296875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "84-89", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.9428405761719, "t": 629.46044921875, "r": 354.6510009765625, "b": 621.0858154296875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "40-61", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.6126708984375, "t": 629.46044921875, "r": 384.3208312988281, "b": 621.0858154296875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "86-92", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.4518737792969, "t": 629.46044921875, "r": 418.1600341796875, "b": 621.0858154296875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "94-99", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217041015625, "t": 629.46044921875, "r": 447.8298645019531, "b": 621.0858154296875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "95-99", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.8005065917969, "t": 629.46044921875, "r": 477.5086669921875, "b": 621.0858154296875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "69-78", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 495.32489013671875, "t": 629.46044921875, "r": 507.178466796875, "b": 621.0858154296875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 104.82499694824219, "t": 618.50146484375, "r": 137.3282012939453, "b": 610.1268310546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Footnote", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 182.03500366210938, "t": 618.50146484375, "r": 198.71250915527344, "b": 610.1268310546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "6318", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.21099853515625, "t": 618.50146484375, "r": 233.69174194335938, "b": 610.1268310546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.60", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956176757812, "t": 618.50146484375, "r": 264.50030517578125, "b": 610.1268310546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.31", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.828125, "t": 618.50146484375, "r": 295.3088684082031, "b": 610.1268310546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.58", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301025390625, "t": 618.50146484375, "r": 324.9811706542969, "b": 610.1268310546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "83-91", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 342.7973937988281, "t": 618.50146484375, "r": 354.6509704589844, "b": 610.1268310546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 371.8126525878906, "t": 618.50146484375, "r": 384.3207702636719, "b": 610.1268310546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "100", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.4518127441406, "t": 618.50146484375, "r": 418.15997314453125, "b": 610.1268310546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "62-88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.12164306640625, "t": 618.50146484375, "r": 447.8298034667969, "b": 610.1268310546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "85-94", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 465.6549987792969, "t": 618.50146484375, "r": 477.5085754394531, "b": 610.1268310546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.4702453613281, "t": 618.50146484375, "r": 507.17840576171875, "b": 610.1268310546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "82-97", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 104.82499694824219, "t": 607.54248046875, "r": 135.33766174316406, "b": 599.1678466796875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Formula", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 177.86599731445312, "t": 607.54248046875, "r": 198.71287536621094, "b": 599.1678466796875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "25027", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.21099853515625, "t": 607.54248046875, "r": 233.69174194335938, "b": 599.1678466796875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "2.25", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956176757812, "t": 607.54248046875, "r": 264.50030517578125, "b": 599.1678466796875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "1.90", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.828125, "t": 607.54248046875, "r": 295.3088684082031, "b": 599.1678466796875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "2.96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301025390625, "t": 607.54248046875, "r": 324.9811706542969, "b": 599.1678466796875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "83-85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 342.7973937988281, "t": 607.54248046875, "r": 354.6509704589844, "b": 599.1678466796875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 372.4671936035156, "t": 607.54248046875, "r": 384.3207702636719, "b": 599.1678466796875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.4518127441406, "t": 607.54248046875, "r": 418.15997314453125, "b": 599.1678466796875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "84-87", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.12164306640625, "t": 607.54248046875, "r": 447.8298034667969, "b": 599.1678466796875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "86-96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 465.6549987792969, "t": 607.54248046875, "r": 477.5085754394531, "b": 599.1678466796875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 495.3247985839844, "t": 607.54248046875, "r": 507.1783752441406, "b": 599.1678466796875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 104.82499694824219, "t": 596.5834350585938, "r": 137.7047882080078, "b": 588.2088012695312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "List-item", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 173.69700622558594, "t": 596.5834350585938, "r": 198.7132568359375, "b": 588.2088012695312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "185660", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 215.04200744628906, "t": 596.5834350585938, "r": 233.69212341308594, "b": 588.2088012695312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "17.19", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.85055541992188, "t": 596.5834350585938, "r": 264.50067138671875, "b": 588.2088012695312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "13.34", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 276.65911865234375, "t": 596.5834350585938, "r": 295.3092346191406, "b": 588.2088012695312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "15.82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301025390625, "t": 596.5834350585938, "r": 324.9811706542969, "b": 588.2088012695312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "87-88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.9428405761719, "t": 596.5834350585938, "r": 354.6510009765625, "b": 588.2088012695312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "74-83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.6126708984375, "t": 596.5834350585938, "r": 384.3208312988281, "b": 588.2088012695312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "90-92", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.4518737792969, "t": 596.5834350585938, "r": 418.1600341796875, "b": 588.2088012695312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "97-97", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217041015625, "t": 596.5834350585938, "r": 447.8298645019531, "b": 588.2088012695312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "81-85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.8005065917969, "t": 596.5834350585938, "r": 477.5086669921875, "b": 588.2088012695312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "75-88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.4703369140625, "t": 596.5834350585938, "r": 507.1784973144531, "b": 588.2088012695312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "93-95", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 104.82499694824219, "t": 585.6244506835938, "r": 147.3526153564453, "b": 577.2498168945312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-footer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 177.86599731445312, "t": 585.6244506835938, "r": 198.71287536621094, "b": 577.2498168945312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "70878", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.21099853515625, "t": 585.6244506835938, "r": 233.69174194335938, "b": 577.2498168945312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "6.51", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956176757812, "t": 585.6244506835938, "r": 264.50030517578125, "b": 577.2498168945312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "5.58", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.828125, "t": 585.6244506835938, "r": 295.3088684082031, "b": 577.2498168945312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "6.00", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301025390625, "t": 585.6244506835938, "r": 324.9811706542969, "b": 577.2498168945312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "93-94", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.9428405761719, "t": 585.6244506835938, "r": 354.6510009765625, "b": 577.2498168945312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "88-90", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.6126708984375, "t": 585.6244506835938, "r": 384.3208312988281, "b": 577.2498168945312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "95-96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 405.6518859863281, "t": 585.6244506835938, "r": 418.1600036621094, "b": 577.2498168945312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "100", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1216735839844, "t": 585.6244506835938, "r": 447.829833984375, "b": 577.2498168945312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "92-97", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 465.00048828125, "t": 585.6244506835938, "r": 477.50860595703125, "b": 577.2498168945312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "100", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47027587890625, "t": 585.6244506835938, "r": 507.1784362792969, "b": 577.2498168945312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "96-98", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 104.82499694824219, "t": 574.6654663085938, "r": 150.10531616210938, "b": 566.2908325195312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 177.86599731445312, "t": 574.6654663085938, "r": 198.71287536621094, "b": 566.2908325195312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "58022", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.21099853515625, "t": 574.6654663085938, "r": 233.69174194335938, "b": 566.2908325195312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "5.10", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956176757812, "t": 574.6654663085938, "r": 264.50030517578125, "b": 566.2908325195312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "6.70", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.828125, "t": 574.6654663085938, "r": 295.3088684082031, "b": 566.2908325195312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "5.06", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301025390625, "t": 574.6654663085938, "r": 324.9811706542969, "b": 566.2908325195312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "85-89", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.9428405761719, "t": 574.6654663085938, "r": 354.6510009765625, "b": 566.2908325195312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "66-76", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.6126708984375, "t": 574.6654663085938, "r": 384.3208312988281, "b": 566.2908325195312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "90-94", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.2825012207031, "t": 574.6654663085938, "r": 418.1600341796875, "b": 566.2908325195312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "98-100", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217041015625, "t": 574.6654663085938, "r": 447.8298645019531, "b": 566.2908325195312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "91-92", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.8005065917969, "t": 574.6654663085938, "r": 477.5086669921875, "b": 566.2908325195312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "97-99", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.4703369140625, "t": 574.6654663085938, "r": 507.1784973144531, "b": 566.2908325195312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "81-86", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 104.82499694824219, "t": 563.7064819335938, "r": 130.80963134765625, "b": 555.3318481445312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Picture", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 177.86599731445312, "t": 563.7064819335938, "r": 198.71287536621094, "b": 555.3318481445312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "45976", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.21099853515625, "t": 563.7064819335938, "r": 233.69174194335938, "b": 555.3318481445312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "4.21", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956176757812, "t": 563.7064819335938, "r": 264.50030517578125, "b": 555.3318481445312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "2.78", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.828125, "t": 563.7064819335938, "r": 295.3088684082031, "b": 555.3318481445312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "5.31", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301025390625, "t": 563.7064819335938, "r": 324.9811706542969, "b": 555.3318481445312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "69-71", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.9428405761719, "t": 563.7064819335938, "r": 354.6510009765625, "b": 555.3318481445312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "56-59", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.6126708984375, "t": 563.7064819335938, "r": 384.3208312988281, "b": 555.3318481445312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "82-86", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.4518737792969, "t": 563.7064819335938, "r": 418.1600341796875, "b": 555.3318481445312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "69-82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217041015625, "t": 563.7064819335938, "r": 447.8298645019531, "b": 555.3318481445312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "80-95", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.8005065917969, "t": 563.7064819335938, "r": 477.5086669921875, "b": 555.3318481445312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "66-71", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.4703369140625, "t": 563.7064819335938, "r": 507.1784973144531, "b": 555.3318481445312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "59-76", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 104.82499694824219, "t": 552.7474365234375, "r": 159.5648651123047, "b": 544.372802734375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Section-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 173.69700622558594, "t": 552.7474365234375, "r": 198.7132568359375, "b": 544.372802734375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "142884", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 215.04200744628906, "t": 552.7474365234375, "r": 233.69212341308594, "b": 544.372802734375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "12.60", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.85055541992188, "t": 552.7474365234375, "r": 264.50067138671875, "b": 544.372802734375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "15.77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 276.65911865234375, "t": 552.7474365234375, "r": 295.3092346191406, "b": 544.372802734375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "12.85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301025390625, "t": 552.7474365234375, "r": 324.9811706542969, "b": 544.372802734375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "83-84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.9428405761719, "t": 552.7474365234375, "r": 354.6510009765625, "b": 544.372802734375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "76-81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.6126708984375, "t": 552.7474365234375, "r": 384.3208312988281, "b": 544.372802734375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "90-92", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.4518737792969, "t": 552.7474365234375, "r": 418.1600341796875, "b": 544.372802734375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "94-95", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217041015625, "t": 552.7474365234375, "r": 447.8298645019531, "b": 544.372802734375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "87-94", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.8005065917969, "t": 552.7474365234375, "r": 477.5086669921875, "b": 544.372802734375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "69-73", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.4703369140625, "t": 552.7474365234375, "r": 507.1784973144531, "b": 544.372802734375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "78-86", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 104.82499694824219, "t": 541.7884521484375, "r": 124.63176727294922, "b": 533.413818359375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 177.86599731445312, "t": 541.7884521484375, "r": 198.71287536621094, "b": 533.413818359375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "34733", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.21099853515625, "t": 541.7884521484375, "r": 233.69174194335938, "b": 533.413818359375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "3.20", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956176757812, "t": 541.7884521484375, "r": 264.50030517578125, "b": 533.413818359375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "2.27", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.828125, "t": 541.7884521484375, "r": 295.3088684082031, "b": 533.413818359375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "3.60", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301025390625, "t": 541.7884521484375, "r": 324.9811706542969, "b": 533.413818359375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "77-81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.9428405761719, "t": 541.7884521484375, "r": 354.6510009765625, "b": 533.413818359375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "75-80", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.6126708984375, "t": 541.7884521484375, "r": 384.3208312988281, "b": 533.413818359375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "83-86", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.4518737792969, "t": 541.7884521484375, "r": 418.1600341796875, "b": 533.413818359375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "98-99", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217041015625, "t": 541.7884521484375, "r": 447.8298645019531, "b": 533.413818359375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "58-80", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.8005065917969, "t": 541.7884521484375, "r": 477.5086669921875, "b": 533.413818359375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "79-84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.4703369140625, "t": 541.7884521484375, "r": 507.1784973144531, "b": 533.413818359375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "70-85", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 104.82499694824219, "t": 530.8304443359375, "r": 120.78518676757812, "b": 522.455810546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Text", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 173.69700622558594, "t": 530.8304443359375, "r": 198.7132568359375, "b": 522.455810546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "510377", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 215.04200744628906, "t": 530.8304443359375, "r": 233.69212341308594, "b": 522.455810546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "45.82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.85055541992188, "t": 530.8304443359375, "r": 264.50067138671875, "b": 522.455810546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "49.28", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 276.65911865234375, "t": 530.8304443359375, "r": 295.3092346191406, "b": 522.455810546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "45.00", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301025390625, "t": 530.8304443359375, "r": 324.9811706542969, "b": 522.455810546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "84-86", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.9428405761719, "t": 530.8304443359375, "r": 354.6510009765625, "b": 522.455810546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "81-86", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.6126708984375, "t": 530.8304443359375, "r": 384.3208312988281, "b": 522.455810546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "88-93", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.4518737792969, "t": 530.8304443359375, "r": 418.1600341796875, "b": 522.455810546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "89-93", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217041015625, "t": 530.8304443359375, "r": 447.8298645019531, "b": 522.455810546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "87-92", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.8005065917969, "t": 530.8304443359375, "r": 477.5086669921875, "b": 522.455810546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "71-79", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.4703369140625, "t": 530.8304443359375, "r": 507.1784973144531, "b": 522.455810546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "87-95", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 104.82499694824219, "t": 519.8714599609375, "r": 121.81632995605469, "b": 511.496826171875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Title", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 182.03500366210938, "t": 519.8714599609375, "r": 198.71250915527344, "b": 511.496826171875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "5071", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.21099853515625, "t": 519.8714599609375, "r": 233.69174194335938, "b": 511.496826171875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.47", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956176757812, "t": 519.8714599609375, "r": 264.50030517578125, "b": 511.496826171875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.30", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.828125, "t": 519.8714599609375, "r": 295.3088684082031, "b": 511.496826171875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.50", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301025390625, "t": 519.8714599609375, "r": 324.9811706542969, "b": 511.496826171875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "60-72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.9428405761719, "t": 519.8714599609375, "r": 354.6510009765625, "b": 511.496826171875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "24-63", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.6126708984375, "t": 519.8714599609375, "r": 384.3208312988281, "b": 511.496826171875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "50-63", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.2825012207031, "t": 519.8714599609375, "r": 418.1600341796875, "b": 511.496826171875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "94-100", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217041015625, "t": 519.8714599609375, "r": 447.8298645019531, "b": 511.496826171875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "82-96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.8005065917969, "t": 519.8714599609375, "r": 477.5086669921875, "b": 511.496826171875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "68-79", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.4703369140625, "t": 519.8714599609375, "r": 507.1784973144531, "b": 511.496826171875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "24-56", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 104.82499694824219, "t": 508.5134582519531, "r": 123.43028259277344, "b": 500.1388244628906, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Total", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 169.52699279785156, "t": 508.5134582519531, "r": 198.71263122558594, "b": 500.1388244628906, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "1107470", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 208.6750030517578, "t": 508.5134582519531, "r": 233.69125366210938, "b": 500.1388244628906, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "941123", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 243.65292358398438, "t": 508.5134582519531, "r": 264.49981689453125, "b": 500.1388244628906, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "99816", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 274.46148681640625, "t": 508.5134582519531, "r": 295.3083801269531, "b": 500.1388244628906, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "66531", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301025390625, "t": 508.5134582519531, "r": 324.9811706542969, "b": 500.1388244628906, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "82-83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.9428405761719, "t": 508.5134582519531, "r": 354.6510009765625, "b": 500.1388244628906, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "71-74", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.6126708984375, "t": 508.5134582519531, "r": 384.3208312988281, "b": 500.1388244628906, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "79-81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.4518737792969, "t": 508.5134582519531, "r": 418.1600341796875, "b": 500.1388244628906, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "89-94", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217041015625, "t": 508.5134582519531, "r": 447.8298645019531, "b": 500.1388244628906, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "86-91", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.8005065917969, "t": 508.5134582519531, "r": 477.5086669921875, "b": 500.1388244628906, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "71-76", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.4703369140625, "t": 508.5134582519531, "r": 507.1784973144531, "b": 500.1388244628906, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "68-85", "column_header": false, "row_header": false, "row_section": false}]]}}, {"self_ref": "#/tables/1", "parent": {"cref": "#/body"}, "children": [], "label": "table", "prov": [{"page_no": 6, "bbox": {"l": 62.02753829956055, "t": 596.3199462890625, "r": 285.78955078125, "b": 440.3381042480469, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [{"cref": "#/texts/432"}], "references": [], "footnotes": [], "image": null, "data": {"table_cells": [{"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 132.36500549316406, "t": 594.0264892578125, "r": 157.99098205566406, "b": 585.65185546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "human", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 173.5050048828125, "t": 594.0264892578125, "r": 204.618408203125, "b": 585.65185546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 4, "text": "MRCNN", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 220.13027954101562, "t": 594.0264892578125, "r": 248.069580078125, "b": 585.65185546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "FRCNN", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 258.03125, "t": 594.0264892578125, "r": 280.1782531738281, "b": 585.65185546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "YOLO", "column_header": true, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 168.39300537109375, "t": 583.0674438476562, "r": 181.9950408935547, "b": 574.6928100585938, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "R50", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 192.39605712890625, "t": 583.0674438476562, "r": 210.16746520996094, "b": 574.6928100585938, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "R101", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 225.2130889892578, "t": 583.0674438476562, "r": 242.9844970703125, "b": 574.6928100585938, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "R101", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 260.5137939453125, "t": 583.0674438476562, "r": 277.702392578125, "b": 574.6928100585938, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "v5x6", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 67.66300201416016, "t": 571.71044921875, "r": 96.8486328125, "b": 563.3358154296875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Caption", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32400512695312, "t": 571.71044921875, "r": 155.0321502685547, "b": 563.3358154296875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "84-89", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399475097656, "t": 571.71044921875, "r": 182.43472290039062, "b": 563.3358154296875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "68.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.04620361328125, "t": 571.71044921875, "r": 208.52694702148438, "b": 563.3358154296875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "71.5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.8632354736328, "t": 571.71044921875, "r": 241.34396362304688, "b": 563.3358154296875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "70.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.8680419921875, "t": 571.71044921875, "r": 276.3487854003906, "b": 563.3358154296875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "77.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.66300201416016, "t": 560.75146484375, "r": 100.16619873046875, "b": 552.3768310546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Footnote", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32400512695312, "t": 560.75146484375, "r": 155.0321502685547, "b": 552.3768310546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "83-91", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399475097656, "t": 560.75146484375, "r": 182.43472290039062, "b": 552.3768310546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "70.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.04620361328125, "t": 560.75146484375, "r": 208.52694702148438, "b": 552.3768310546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "71.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.8632354736328, "t": 560.75146484375, "r": 241.34396362304688, "b": 552.3768310546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "73.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.8680419921875, "t": 560.75146484375, "r": 276.3487854003906, "b": 552.3768310546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "77.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.66300201416016, "t": 549.79248046875, "r": 98.1756591796875, "b": 541.4178466796875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Formula", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32400512695312, "t": 549.79248046875, "r": 155.0321502685547, "b": 541.4178466796875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "83-85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399475097656, "t": 549.79248046875, "r": 182.43472290039062, "b": 541.4178466796875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "60.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.04620361328125, "t": 549.79248046875, "r": 208.52694702148438, "b": 541.4178466796875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "63.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.8632354736328, "t": 549.79248046875, "r": 241.34396362304688, "b": 541.4178466796875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "63.5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.8680419921875, "t": 549.79248046875, "r": 276.3487854003906, "b": 541.4178466796875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "66.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.66300201416016, "t": 538.8334350585938, "r": 100.54279327392578, "b": 530.4588012695312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "List-item", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32400512695312, "t": 538.8334350585938, "r": 155.0321502685547, "b": 530.4588012695312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "87-88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399475097656, "t": 538.8334350585938, "r": 182.43472290039062, "b": 530.4588012695312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "81.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.04620361328125, "t": 538.8334350585938, "r": 208.52694702148438, "b": 530.4588012695312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "80.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.8632354736328, "t": 538.8334350585938, "r": 241.34396362304688, "b": 530.4588012695312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "81.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.8680419921875, "t": 538.8334350585938, "r": 276.3487854003906, "b": 530.4588012695312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "86.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.66300201416016, "t": 527.8744506835938, "r": 110.19064331054688, "b": 519.4998168945312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-footer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32400512695312, "t": 527.8744506835938, "r": 155.0321502685547, "b": 519.4998168945312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "93-94", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399475097656, "t": 527.8744506835938, "r": 182.43472290039062, "b": 519.4998168945312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "61.6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.04620361328125, "t": 527.8744506835938, "r": 208.52694702148438, "b": 519.4998168945312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "59.3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.8632354736328, "t": 527.8744506835938, "r": 241.34396362304688, "b": 519.4998168945312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "58.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.8680419921875, "t": 527.8744506835938, "r": 276.3487854003906, "b": 519.4998168945312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "61.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.66300201416016, "t": 516.9154663085938, "r": 112.94332122802734, "b": 508.54083251953125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32400512695312, "t": 516.9154663085938, "r": 155.0321502685547, "b": 508.54083251953125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "85-89", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399475097656, "t": 516.9154663085938, "r": 182.43472290039062, "b": 508.54083251953125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "71.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.04620361328125, "t": 516.9154663085938, "r": 208.52694702148438, "b": 508.54083251953125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "70.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.8632354736328, "t": 516.9154663085938, "r": 241.34396362304688, "b": 508.54083251953125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "72.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.8680419921875, "t": 516.9154663085938, "r": 276.3487854003906, "b": 508.54083251953125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "67.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.66300201416016, "t": 505.9564514160156, "r": 93.64762878417969, "b": 497.5818176269531, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Picture", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32400512695312, "t": 505.9564514160156, "r": 155.0321502685547, "b": 497.5818176269531, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "69-71", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399475097656, "t": 505.9564514160156, "r": 182.43472290039062, "b": 497.5818176269531, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "71.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.04620361328125, "t": 505.9564514160156, "r": 208.52694702148438, "b": 497.5818176269531, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "72.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.8632354736328, "t": 505.9564514160156, "r": 241.34396362304688, "b": 497.5818176269531, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "72.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.8680419921875, "t": 505.9564514160156, "r": 276.3487854003906, "b": 497.5818176269531, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "77.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.66300201416016, "t": 494.9974670410156, "r": 122.40287780761719, "b": 486.6228332519531, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Section-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32400512695312, "t": 494.9974670410156, "r": 155.0321502685547, "b": 486.6228332519531, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "83-84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399475097656, "t": 494.9974670410156, "r": 182.43472290039062, "b": 486.6228332519531, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "67.6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.04620361328125, "t": 494.9974670410156, "r": 208.52694702148438, "b": 486.6228332519531, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "69.3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.8632354736328, "t": 494.9974670410156, "r": 241.34396362304688, "b": 486.6228332519531, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "68.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.8680419921875, "t": 494.9974670410156, "r": 276.3487854003906, "b": 486.6228332519531, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "74.6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.66300201416016, "t": 484.0384521484375, "r": 87.46977996826172, "b": 475.663818359375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32400512695312, "t": 484.0384521484375, "r": 155.0321502685547, "b": 475.663818359375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "77-81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399475097656, "t": 484.0384521484375, "r": 182.43472290039062, "b": 475.663818359375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "82.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.04620361328125, "t": 484.0384521484375, "r": 208.52694702148438, "b": 475.663818359375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "82.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.8632354736328, "t": 484.0384521484375, "r": 241.34396362304688, "b": 475.663818359375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "82.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.8680419921875, "t": 484.0384521484375, "r": 276.3487854003906, "b": 475.663818359375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "86.3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.66300201416016, "t": 473.0804748535156, "r": 83.62319946289062, "b": 464.7058410644531, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Text", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32400512695312, "t": 473.0804748535156, "r": 155.0321502685547, "b": 464.7058410644531, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "84-86", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399475097656, "t": 473.0804748535156, "r": 182.43472290039062, "b": 464.7058410644531, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "84.6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.04620361328125, "t": 473.0804748535156, "r": 208.52694702148438, "b": 464.7058410644531, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "85.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.8632354736328, "t": 473.0804748535156, "r": 241.34396362304688, "b": 464.7058410644531, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "85.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.8680419921875, "t": 473.0804748535156, "r": 276.3487854003906, "b": 464.7058410644531, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "88.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.66300201416016, "t": 462.1214599609375, "r": 84.65432739257812, "b": 453.746826171875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Title", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32400512695312, "t": 462.1214599609375, "r": 155.0321502685547, "b": 453.746826171875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "60-72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399475097656, "t": 462.1214599609375, "r": 182.43472290039062, "b": 453.746826171875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "76.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.04620361328125, "t": 462.1214599609375, "r": 208.52694702148438, "b": 453.746826171875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "80.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.8632354736328, "t": 462.1214599609375, "r": 241.34396362304688, "b": 453.746826171875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "79.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.8680419921875, "t": 462.1214599609375, "r": 276.3487854003906, "b": 453.746826171875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "82.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.66300201416016, "t": 450.7634582519531, "r": 78.62890625, "b": 442.3888244628906, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "All", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32400512695312, "t": 450.7634582519531, "r": 155.0321502685547, "b": 442.3888244628906, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "82-83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399475097656, "t": 450.7634582519531, "r": 182.43472290039062, "b": 442.3888244628906, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "72.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.04620361328125, "t": 450.7634582519531, "r": 208.52694702148438, "b": 442.3888244628906, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "73.5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.8632354736328, "t": 450.7634582519531, "r": 241.34396362304688, "b": 442.3888244628906, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "73.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.8680419921875, "t": 450.7634582519531, "r": 276.3487854003906, "b": 442.3888244628906, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "76.8", "column_header": false, "row_header": false, "row_section": false}], "num_rows": 14, "num_cols": 6, "grid": [[{"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 132.36500549316406, "t": 594.0264892578125, "r": 157.99098205566406, "b": 585.65185546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "human", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 173.5050048828125, "t": 594.0264892578125, "r": 204.618408203125, "b": 585.65185546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 4, "text": "MRCNN", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 173.5050048828125, "t": 594.0264892578125, "r": 204.618408203125, "b": 585.65185546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 4, "text": "MRCNN", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 220.13027954101562, "t": 594.0264892578125, "r": 248.069580078125, "b": 585.65185546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "FRCNN", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 258.03125, "t": 594.0264892578125, "r": 280.1782531738281, "b": 585.65185546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "YOLO", "column_header": true, "row_header": false, "row_section": false}], [{"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 132.36500549316406, "t": 594.0264892578125, "r": 157.99098205566406, "b": 585.65185546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "human", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 168.39300537109375, "t": 583.0674438476562, "r": 181.9950408935547, "b": 574.6928100585938, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "R50", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 192.39605712890625, "t": 583.0674438476562, "r": 210.16746520996094, "b": 574.6928100585938, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "R101", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 225.2130889892578, "t": 583.0674438476562, "r": 242.9844970703125, "b": 574.6928100585938, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "R101", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 260.5137939453125, "t": 583.0674438476562, "r": 277.702392578125, "b": 574.6928100585938, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "v5x6", "column_header": true, "row_header": false, "row_section": false}], [{"bbox": {"l": 67.66300201416016, "t": 571.71044921875, "r": 96.8486328125, "b": 563.3358154296875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Caption", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32400512695312, "t": 571.71044921875, "r": 155.0321502685547, "b": 563.3358154296875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "84-89", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399475097656, "t": 571.71044921875, "r": 182.43472290039062, "b": 563.3358154296875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "68.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.04620361328125, "t": 571.71044921875, "r": 208.52694702148438, "b": 563.3358154296875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "71.5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.8632354736328, "t": 571.71044921875, "r": 241.34396362304688, "b": 563.3358154296875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "70.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.8680419921875, "t": 571.71044921875, "r": 276.3487854003906, "b": 563.3358154296875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "77.7", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 67.66300201416016, "t": 560.75146484375, "r": 100.16619873046875, "b": 552.3768310546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Footnote", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32400512695312, "t": 560.75146484375, "r": 155.0321502685547, "b": 552.3768310546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "83-91", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399475097656, "t": 560.75146484375, "r": 182.43472290039062, "b": 552.3768310546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "70.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.04620361328125, "t": 560.75146484375, "r": 208.52694702148438, "b": 552.3768310546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "71.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.8632354736328, "t": 560.75146484375, "r": 241.34396362304688, "b": 552.3768310546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "73.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.8680419921875, "t": 560.75146484375, "r": 276.3487854003906, "b": 552.3768310546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "77.2", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 67.66300201416016, "t": 549.79248046875, "r": 98.1756591796875, "b": 541.4178466796875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Formula", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32400512695312, "t": 549.79248046875, "r": 155.0321502685547, "b": 541.4178466796875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "83-85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399475097656, "t": 549.79248046875, "r": 182.43472290039062, "b": 541.4178466796875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "60.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.04620361328125, "t": 549.79248046875, "r": 208.52694702148438, "b": 541.4178466796875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "63.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.8632354736328, "t": 549.79248046875, "r": 241.34396362304688, "b": 541.4178466796875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "63.5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.8680419921875, "t": 549.79248046875, "r": 276.3487854003906, "b": 541.4178466796875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "66.2", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 67.66300201416016, "t": 538.8334350585938, "r": 100.54279327392578, "b": 530.4588012695312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "List-item", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32400512695312, "t": 538.8334350585938, "r": 155.0321502685547, "b": 530.4588012695312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "87-88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399475097656, "t": 538.8334350585938, "r": 182.43472290039062, "b": 530.4588012695312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "81.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.04620361328125, "t": 538.8334350585938, "r": 208.52694702148438, "b": 530.4588012695312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "80.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.8632354736328, "t": 538.8334350585938, "r": 241.34396362304688, "b": 530.4588012695312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "81.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.8680419921875, "t": 538.8334350585938, "r": 276.3487854003906, "b": 530.4588012695312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "86.2", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 67.66300201416016, "t": 527.8744506835938, "r": 110.19064331054688, "b": 519.4998168945312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-footer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32400512695312, "t": 527.8744506835938, "r": 155.0321502685547, "b": 519.4998168945312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "93-94", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399475097656, "t": 527.8744506835938, "r": 182.43472290039062, "b": 519.4998168945312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "61.6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.04620361328125, "t": 527.8744506835938, "r": 208.52694702148438, "b": 519.4998168945312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "59.3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.8632354736328, "t": 527.8744506835938, "r": 241.34396362304688, "b": 519.4998168945312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "58.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.8680419921875, "t": 527.8744506835938, "r": 276.3487854003906, "b": 519.4998168945312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "61.1", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 67.66300201416016, "t": 516.9154663085938, "r": 112.94332122802734, "b": 508.54083251953125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32400512695312, "t": 516.9154663085938, "r": 155.0321502685547, "b": 508.54083251953125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "85-89", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399475097656, "t": 516.9154663085938, "r": 182.43472290039062, "b": 508.54083251953125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "71.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.04620361328125, "t": 516.9154663085938, "r": 208.52694702148438, "b": 508.54083251953125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "70.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.8632354736328, "t": 516.9154663085938, "r": 241.34396362304688, "b": 508.54083251953125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "72.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.8680419921875, "t": 516.9154663085938, "r": 276.3487854003906, "b": 508.54083251953125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "67.9", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 67.66300201416016, "t": 505.9564514160156, "r": 93.64762878417969, "b": 497.5818176269531, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Picture", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32400512695312, "t": 505.9564514160156, "r": 155.0321502685547, "b": 497.5818176269531, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "69-71", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399475097656, "t": 505.9564514160156, "r": 182.43472290039062, "b": 497.5818176269531, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "71.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.04620361328125, "t": 505.9564514160156, "r": 208.52694702148438, "b": 497.5818176269531, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "72.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.8632354736328, "t": 505.9564514160156, "r": 241.34396362304688, "b": 497.5818176269531, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "72.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.8680419921875, "t": 505.9564514160156, "r": 276.3487854003906, "b": 497.5818176269531, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "77.1", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 67.66300201416016, "t": 494.9974670410156, "r": 122.40287780761719, "b": 486.6228332519531, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Section-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32400512695312, "t": 494.9974670410156, "r": 155.0321502685547, "b": 486.6228332519531, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "83-84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399475097656, "t": 494.9974670410156, "r": 182.43472290039062, "b": 486.6228332519531, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "67.6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.04620361328125, "t": 494.9974670410156, "r": 208.52694702148438, "b": 486.6228332519531, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "69.3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.8632354736328, "t": 494.9974670410156, "r": 241.34396362304688, "b": 486.6228332519531, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "68.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.8680419921875, "t": 494.9974670410156, "r": 276.3487854003906, "b": 486.6228332519531, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "74.6", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 67.66300201416016, "t": 484.0384521484375, "r": 87.46977996826172, "b": 475.663818359375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32400512695312, "t": 484.0384521484375, "r": 155.0321502685547, "b": 475.663818359375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "77-81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399475097656, "t": 484.0384521484375, "r": 182.43472290039062, "b": 475.663818359375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "82.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.04620361328125, "t": 484.0384521484375, "r": 208.52694702148438, "b": 475.663818359375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "82.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.8632354736328, "t": 484.0384521484375, "r": 241.34396362304688, "b": 475.663818359375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "82.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.8680419921875, "t": 484.0384521484375, "r": 276.3487854003906, "b": 475.663818359375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "86.3", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 67.66300201416016, "t": 473.0804748535156, "r": 83.62319946289062, "b": 464.7058410644531, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Text", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32400512695312, "t": 473.0804748535156, "r": 155.0321502685547, "b": 464.7058410644531, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "84-86", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399475097656, "t": 473.0804748535156, "r": 182.43472290039062, "b": 464.7058410644531, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "84.6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.04620361328125, "t": 473.0804748535156, "r": 208.52694702148438, "b": 464.7058410644531, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "85.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.8632354736328, "t": 473.0804748535156, "r": 241.34396362304688, "b": 464.7058410644531, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "85.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.8680419921875, "t": 473.0804748535156, "r": 276.3487854003906, "b": 464.7058410644531, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "88.1", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 67.66300201416016, "t": 462.1214599609375, "r": 84.65432739257812, "b": 453.746826171875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Title", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32400512695312, "t": 462.1214599609375, "r": 155.0321502685547, "b": 453.746826171875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "60-72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399475097656, "t": 462.1214599609375, "r": 182.43472290039062, "b": 453.746826171875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "76.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.04620361328125, "t": 462.1214599609375, "r": 208.52694702148438, "b": 453.746826171875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "80.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.8632354736328, "t": 462.1214599609375, "r": 241.34396362304688, "b": 453.746826171875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "79.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.8680419921875, "t": 462.1214599609375, "r": 276.3487854003906, "b": 453.746826171875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "82.7", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 67.66300201416016, "t": 450.7634582519531, "r": 78.62890625, "b": 442.3888244628906, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "All", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32400512695312, "t": 450.7634582519531, "r": 155.0321502685547, "b": 442.3888244628906, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "82-83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399475097656, "t": 450.7634582519531, "r": 182.43472290039062, "b": 442.3888244628906, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "72.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.04620361328125, "t": 450.7634582519531, "r": 208.52694702148438, "b": 442.3888244628906, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "73.5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.8632354736328, "t": 450.7634582519531, "r": 241.34396362304688, "b": 442.3888244628906, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "73.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.8680419921875, "t": 450.7634582519531, "r": 276.3487854003906, "b": 442.3888244628906, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "76.8", "column_header": false, "row_header": false, "row_section": false}]]}}, {"self_ref": "#/tables/2", "parent": {"cref": "#/body"}, "children": [], "label": "table", "prov": [{"page_no": 7, "bbox": {"l": 80.35525512695312, "t": 641.063720703125, "r": 267.0082092285156, "b": 496.5545349121094, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [{"cref": "#/texts/466"}], "references": [], "footnotes": [], "image": null, "data": {"table_cells": [{"bbox": {"l": 86.37200164794922, "t": 638.8994750976562, "r": 129.4645233154297, "b": 630.5248413085938, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Class-count", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 151.07400512695312, "t": 638.8994750976562, "r": 159.41275024414062, "b": 630.5248413085938, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "11", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 179.3181610107422, "t": 638.8994750976562, "r": 183.48753356933594, "b": 630.5248413085938, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "6", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 213.33668518066406, "t": 638.8994750976562, "r": 217.5060577392578, "b": 630.5248413085938, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "5", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 247.35520935058594, "t": 638.8994750976562, "r": 251.5245819091797, "b": 630.5248413085938, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "4", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 86.37200164794922, "t": 627.54248046875, "r": 115.55763244628906, "b": 619.1678466796875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Caption", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07400512695312, "t": 627.54248046875, "r": 159.41275024414062, "b": 619.1678466796875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 173.42723083496094, "t": 627.54248046875, "r": 189.38742065429688, "b": 619.1678466796875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 207.4457550048828, "t": 627.54248046875, "r": 223.40594482421875, "b": 619.1678466796875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 241.4642791748047, "t": 627.54248046875, "r": 257.4244689941406, "b": 619.1678466796875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.37200164794922, "t": 616.5834350585938, "r": 118.87519836425781, "b": 608.2088012695312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Footnote", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07400512695312, "t": 616.5834350585938, "r": 159.41275024414062, "b": 608.2088012695312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "71", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 173.42723083496094, "t": 616.5834350585938, "r": 189.38742065429688, "b": 608.2088012695312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 207.4457550048828, "t": 616.5834350585938, "r": 223.40594482421875, "b": 608.2088012695312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 241.4642791748047, "t": 616.5834350585938, "r": 257.4244689941406, "b": 608.2088012695312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.37200164794922, "t": 605.6244506835938, "r": 116.88465881347656, "b": 597.2498168945312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Formula", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07400512695312, "t": 605.6244506835938, "r": 159.41275024414062, "b": 597.2498168945312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "60", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 173.42723083496094, "t": 605.6244506835938, "r": 189.38742065429688, "b": 597.2498168945312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 207.4457550048828, "t": 605.6244506835938, "r": 223.40594482421875, "b": 597.2498168945312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 241.4642791748047, "t": 605.6244506835938, "r": 257.4244689941406, "b": 597.2498168945312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.37200164794922, "t": 594.6654663085938, "r": 119.25179290771484, "b": 586.2908325195312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "List-item", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07400512695312, "t": 594.6654663085938, "r": 159.41275024414062, "b": 586.2908325195312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 173.42723083496094, "t": 594.6654663085938, "r": 189.38742065429688, "b": 586.2908325195312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 211.2564697265625, "t": 594.6654663085938, "r": 219.59521484375, "b": 586.2908325195312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 241.46426391601562, "t": 594.6654663085938, "r": 257.4244689941406, "b": 586.2908325195312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.37200164794922, "t": 583.7064819335938, "r": 128.89964294433594, "b": 575.3318481445312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-footer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07400512695312, "t": 583.7064819335938, "r": 159.41275024414062, "b": 575.3318481445312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "62", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23794555664062, "t": 583.7064819335938, "r": 185.57669067382812, "b": 575.3318481445312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "62", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 213.9105224609375, "t": 583.7064819335938, "r": 216.941162109375, "b": 575.3318481445312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 247.92904663085938, "t": 583.7064819335938, "r": 250.95968627929688, "b": 575.3318481445312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.37200164794922, "t": 572.7474365234375, "r": 131.65231323242188, "b": 564.372802734375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07400512695312, "t": 572.7474365234375, "r": 159.41275024414062, "b": 564.372802734375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23794555664062, "t": 572.7474365234375, "r": 185.57669067382812, "b": 564.372802734375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 213.9105224609375, "t": 572.7474365234375, "r": 216.941162109375, "b": 564.372802734375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 247.92904663085938, "t": 572.7474365234375, "r": 250.95968627929688, "b": 564.372802734375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.37200164794922, "t": 561.7884521484375, "r": 112.35662841796875, "b": 553.413818359375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Picture", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07400512695312, "t": 561.7884521484375, "r": 159.41275024414062, "b": 553.413818359375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23794555664062, "t": 561.7884521484375, "r": 185.57669067382812, "b": 553.413818359375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 211.25645446777344, "t": 561.7884521484375, "r": 219.59519958496094, "b": 553.413818359375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.27496337890625, "t": 561.7884521484375, "r": 253.61370849609375, "b": 553.413818359375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.37200164794922, "t": 550.8304443359375, "r": 141.11187744140625, "b": 542.455810546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Section-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07400512695312, "t": 550.8304443359375, "r": 159.41275024414062, "b": 542.455810546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23794555664062, "t": 550.8304443359375, "r": 185.57669067382812, "b": 542.455810546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "67", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 211.25645446777344, "t": 550.8304443359375, "r": 219.59519958496094, "b": 542.455810546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "69", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.27496337890625, "t": 550.8304443359375, "r": 253.61370849609375, "b": 542.455810546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.37200164794922, "t": 539.8714599609375, "r": 106.17877960205078, "b": 531.496826171875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07400512695312, "t": 539.8714599609375, "r": 159.41275024414062, "b": 531.496826171875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23794555664062, "t": 539.8714599609375, "r": 185.57669067382812, "b": 531.496826171875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 211.25645446777344, "t": 539.8714599609375, "r": 219.59519958496094, "b": 531.496826171875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.27496337890625, "t": 539.8714599609375, "r": 253.61370849609375, "b": 531.496826171875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.37200164794922, "t": 528.9124755859375, "r": 102.33219909667969, "b": 520.537841796875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Text", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07400512695312, "t": 528.9124755859375, "r": 159.41275024414062, "b": 520.537841796875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23794555664062, "t": 528.9124755859375, "r": 185.57669067382812, "b": 520.537841796875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 211.25645446777344, "t": 528.9124755859375, "r": 219.59519958496094, "b": 520.537841796875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.27496337890625, "t": 528.9124755859375, "r": 253.61370849609375, "b": 520.537841796875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.37200164794922, "t": 517.9534301757812, "r": 103.36332702636719, "b": 509.5788269042969, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Title", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07400512695312, "t": 517.9534301757812, "r": 159.41275024414062, "b": 509.5788269042969, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 169.37442016601562, "t": 517.9534301757812, "r": 193.4312744140625, "b": 509.5788269042969, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Sec.-h.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 203.3929443359375, "t": 517.9534301757812, "r": 227.44979858398438, "b": 509.5788269042969, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Sec.-h.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 237.41146850585938, "t": 517.9534301757812, "r": 261.46832275390625, "b": 509.5788269042969, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Sec.-h.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.37200164794922, "t": 506.595458984375, "r": 113.3160171508789, "b": 498.2208251953125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Overall", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07400512695312, "t": 506.595458984375, "r": 159.41275024414062, "b": 498.2208251953125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23794555664062, "t": 506.595458984375, "r": 185.57669067382812, "b": 498.2208251953125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "73", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 211.25645446777344, "t": 506.595458984375, "r": 219.59519958496094, "b": 498.2208251953125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "78", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.27496337890625, "t": 506.595458984375, "r": 253.61370849609375, "b": 498.2208251953125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "77", "column_header": false, "row_header": false, "row_section": false}], "num_rows": 13, "num_cols": 5, "grid": [[{"bbox": {"l": 86.37200164794922, "t": 638.8994750976562, "r": 129.4645233154297, "b": 630.5248413085938, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Class-count", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 151.07400512695312, "t": 638.8994750976562, "r": 159.41275024414062, "b": 630.5248413085938, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "11", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 179.3181610107422, "t": 638.8994750976562, "r": 183.48753356933594, "b": 630.5248413085938, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "6", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 213.33668518066406, "t": 638.8994750976562, "r": 217.5060577392578, "b": 630.5248413085938, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "5", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 247.35520935058594, "t": 638.8994750976562, "r": 251.5245819091797, "b": 630.5248413085938, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "4", "column_header": true, "row_header": false, "row_section": false}], [{"bbox": {"l": 86.37200164794922, "t": 627.54248046875, "r": 115.55763244628906, "b": 619.1678466796875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Caption", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07400512695312, "t": 627.54248046875, "r": 159.41275024414062, "b": 619.1678466796875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 173.42723083496094, "t": 627.54248046875, "r": 189.38742065429688, "b": 619.1678466796875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 207.4457550048828, "t": 627.54248046875, "r": 223.40594482421875, "b": 619.1678466796875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 241.4642791748047, "t": 627.54248046875, "r": 257.4244689941406, "b": 619.1678466796875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Text", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 86.37200164794922, "t": 616.5834350585938, "r": 118.87519836425781, "b": 608.2088012695312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Footnote", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07400512695312, "t": 616.5834350585938, "r": 159.41275024414062, "b": 608.2088012695312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "71", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 173.42723083496094, "t": 616.5834350585938, "r": 189.38742065429688, "b": 608.2088012695312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 207.4457550048828, "t": 616.5834350585938, "r": 223.40594482421875, "b": 608.2088012695312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 241.4642791748047, "t": 616.5834350585938, "r": 257.4244689941406, "b": 608.2088012695312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Text", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 86.37200164794922, "t": 605.6244506835938, "r": 116.88465881347656, "b": 597.2498168945312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Formula", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07400512695312, "t": 605.6244506835938, "r": 159.41275024414062, "b": 597.2498168945312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "60", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 173.42723083496094, "t": 605.6244506835938, "r": 189.38742065429688, "b": 597.2498168945312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 207.4457550048828, "t": 605.6244506835938, "r": 223.40594482421875, "b": 597.2498168945312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 241.4642791748047, "t": 605.6244506835938, "r": 257.4244689941406, "b": 597.2498168945312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Text", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 86.37200164794922, "t": 594.6654663085938, "r": 119.25179290771484, "b": 586.2908325195312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "List-item", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07400512695312, "t": 594.6654663085938, "r": 159.41275024414062, "b": 586.2908325195312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 173.42723083496094, "t": 594.6654663085938, "r": 189.38742065429688, "b": 586.2908325195312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 211.2564697265625, "t": 594.6654663085938, "r": 219.59521484375, "b": 586.2908325195312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 241.46426391601562, "t": 594.6654663085938, "r": 257.4244689941406, "b": 586.2908325195312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Text", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 86.37200164794922, "t": 583.7064819335938, "r": 128.89964294433594, "b": 575.3318481445312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-footer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07400512695312, "t": 583.7064819335938, "r": 159.41275024414062, "b": 575.3318481445312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "62", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23794555664062, "t": 583.7064819335938, "r": 185.57669067382812, "b": 575.3318481445312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "62", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 213.9105224609375, "t": 583.7064819335938, "r": 216.941162109375, "b": 575.3318481445312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 247.92904663085938, "t": 583.7064819335938, "r": 250.95968627929688, "b": 575.3318481445312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "-", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 86.37200164794922, "t": 572.7474365234375, "r": 131.65231323242188, "b": 564.372802734375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07400512695312, "t": 572.7474365234375, "r": 159.41275024414062, "b": 564.372802734375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23794555664062, "t": 572.7474365234375, "r": 185.57669067382812, "b": 564.372802734375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 213.9105224609375, "t": 572.7474365234375, "r": 216.941162109375, "b": 564.372802734375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 247.92904663085938, "t": 572.7474365234375, "r": 250.95968627929688, "b": 564.372802734375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "-", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 86.37200164794922, "t": 561.7884521484375, "r": 112.35662841796875, "b": 553.413818359375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Picture", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07400512695312, "t": 561.7884521484375, "r": 159.41275024414062, "b": 553.413818359375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23794555664062, "t": 561.7884521484375, "r": 185.57669067382812, "b": 553.413818359375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 211.25645446777344, "t": 561.7884521484375, "r": 219.59519958496094, "b": 553.413818359375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.27496337890625, "t": 561.7884521484375, "r": 253.61370849609375, "b": 553.413818359375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "72", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 86.37200164794922, "t": 550.8304443359375, "r": 141.11187744140625, "b": 542.455810546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Section-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07400512695312, "t": 550.8304443359375, "r": 159.41275024414062, "b": 542.455810546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23794555664062, "t": 550.8304443359375, "r": 185.57669067382812, "b": 542.455810546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "67", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 211.25645446777344, "t": 550.8304443359375, "r": 219.59519958496094, "b": 542.455810546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "69", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.27496337890625, "t": 550.8304443359375, "r": 253.61370849609375, "b": 542.455810546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "68", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 86.37200164794922, "t": 539.8714599609375, "r": 106.17877960205078, "b": 531.496826171875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07400512695312, "t": 539.8714599609375, "r": 159.41275024414062, "b": 531.496826171875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23794555664062, "t": 539.8714599609375, "r": 185.57669067382812, "b": 531.496826171875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 211.25645446777344, "t": 539.8714599609375, "r": 219.59519958496094, "b": 531.496826171875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.27496337890625, "t": 539.8714599609375, "r": 253.61370849609375, "b": 531.496826171875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "82", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 86.37200164794922, "t": 528.9124755859375, "r": 102.33219909667969, "b": 520.537841796875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Text", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07400512695312, "t": 528.9124755859375, "r": 159.41275024414062, "b": 520.537841796875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23794555664062, "t": 528.9124755859375, "r": 185.57669067382812, "b": 520.537841796875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 211.25645446777344, "t": 528.9124755859375, "r": 219.59519958496094, "b": 520.537841796875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.27496337890625, "t": 528.9124755859375, "r": 253.61370849609375, "b": 520.537841796875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "84", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 86.37200164794922, "t": 517.9534301757812, "r": 103.36332702636719, "b": 509.5788269042969, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Title", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07400512695312, "t": 517.9534301757812, "r": 159.41275024414062, "b": 509.5788269042969, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 169.37442016601562, "t": 517.9534301757812, "r": 193.4312744140625, "b": 509.5788269042969, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Sec.-h.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 203.3929443359375, "t": 517.9534301757812, "r": 227.44979858398438, "b": 509.5788269042969, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Sec.-h.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 237.41146850585938, "t": 517.9534301757812, "r": 261.46832275390625, "b": 509.5788269042969, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Sec.-h.", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 86.37200164794922, "t": 506.595458984375, "r": 113.3160171508789, "b": 498.2208251953125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Overall", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07400512695312, "t": 506.595458984375, "r": 159.41275024414062, "b": 498.2208251953125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23794555664062, "t": 506.595458984375, "r": 185.57669067382812, "b": 498.2208251953125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "73", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 211.25645446777344, "t": 506.595458984375, "r": 219.59519958496094, "b": 498.2208251953125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "78", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.27496337890625, "t": 506.595458984375, "r": 253.61370849609375, "b": 498.2208251953125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "77", "column_header": false, "row_header": false, "row_section": false}]]}}, {"self_ref": "#/tables/3", "parent": {"cref": "#/body"}, "children": [], "label": "table", "prov": [{"page_no": 7, "bbox": {"l": 352.97747802734375, "t": 641.208740234375, "r": 522.9158935546875, "b": 485.7341613769531, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "data": {"table_cells": [{"bbox": {"l": 358.6390075683594, "t": 638.8994750976562, "r": 401.7315368652344, "b": 630.5248413085938, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Class-count", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.2250061035156, "t": 638.8994750976562, "r": 448.5637512207031, "b": 630.5248413085938, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 3, "text": "11", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 494.3800048828125, "t": 638.8994750976562, "r": 498.54937744140625, "b": 630.5248413085938, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 5, "text": "5", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 358.6390075683594, "t": 627.9404907226562, "r": 375.27166748046875, "b": 619.5658569335938, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Split", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 423.34100341796875, "t": 627.9404907226562, "r": 438.0458984375, "b": 619.5658569335938, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Doc", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 448.007568359375, "t": 627.9404907226562, "r": 465.44720458984375, "b": 619.5658569335938, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Page", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 475.4110107421875, "t": 627.9404907226562, "r": 490.11590576171875, "b": 619.5658569335938, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Doc", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 500.07757568359375, "t": 627.9404907226562, "r": 517.5172119140625, "b": 619.5658569335938, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Page", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 358.6390075683594, "t": 616.5834350585938, "r": 387.82464599609375, "b": 608.2088012695312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Caption", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52398681640625, "t": 616.5834350585938, "r": 434.86273193359375, "b": 608.2088012695312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.5624084472656, "t": 616.5834350585938, "r": 460.9011535644531, "b": 608.2088012695312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.6390075683594, "t": 605.6244506835938, "r": 391.1422119140625, "b": 597.2498168945312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Footnote", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52398681640625, "t": 605.6244506835938, "r": 434.86273193359375, "b": 597.2498168945312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "71", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.5624084472656, "t": 605.6244506835938, "r": 460.9011535644531, "b": 597.2498168945312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.6390075683594, "t": 594.6654663085938, "r": 389.15167236328125, "b": 586.2908325195312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Formula", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52398681640625, "t": 594.6654663085938, "r": 434.86273193359375, "b": 586.2908325195312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "60", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.5624084472656, "t": 594.6654663085938, "r": 460.9011535644531, "b": 586.2908325195312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "66", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.6390075683594, "t": 583.7064819335938, "r": 391.518798828125, "b": 575.3318481445312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "List-item", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52398681640625, "t": 583.7064819335938, "r": 434.86273193359375, "b": 575.3318481445312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.5624084472656, "t": 583.7064819335938, "r": 460.9011535644531, "b": 575.3318481445312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 478.593994140625, "t": 583.7064819335938, "r": 486.9327392578125, "b": 575.3318481445312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 504.6324157714844, "t": 583.7064819335938, "r": 512.97119140625, "b": 575.3318481445312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.6390075683594, "t": 572.7474365234375, "r": 401.1666564941406, "b": 564.372802734375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-footer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52398681640625, "t": 572.7474365234375, "r": 434.86273193359375, "b": 564.372802734375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "62", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.5624084472656, "t": 572.7474365234375, "r": 460.9011535644531, "b": 564.372802734375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "89", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.6390075683594, "t": 561.7884521484375, "r": 403.9193115234375, "b": 553.413818359375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52398681640625, "t": 561.7884521484375, "r": 434.86273193359375, "b": 553.413818359375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.5624084472656, "t": 561.7884521484375, "r": 460.9011535644531, "b": 553.413818359375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "90", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.6390075683594, "t": 550.8304443359375, "r": 384.6236572265625, "b": 542.455810546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Picture", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52398681640625, "t": 550.8304443359375, "r": 434.86273193359375, "b": 542.455810546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.5624084472656, "t": 550.8304443359375, "r": 460.9011535644531, "b": 542.455810546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 478.593994140625, "t": 550.8304443359375, "r": 486.9327392578125, "b": 542.455810546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 504.6324157714844, "t": 550.8304443359375, "r": 512.97119140625, "b": 542.455810546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.6390075683594, "t": 539.8714599609375, "r": 413.37890625, "b": 531.496826171875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Section-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52398681640625, "t": 539.8714599609375, "r": 434.86273193359375, "b": 531.496826171875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.5624084472656, "t": 539.8714599609375, "r": 460.9011535644531, "b": 531.496826171875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 478.593994140625, "t": 539.8714599609375, "r": 486.9327392578125, "b": 531.496826171875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "69", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 504.6324157714844, "t": 539.8714599609375, "r": 512.97119140625, "b": 531.496826171875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.6390075683594, "t": 528.9124755859375, "r": 378.4457702636719, "b": 520.537841796875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52398681640625, "t": 528.9124755859375, "r": 434.86273193359375, "b": 520.537841796875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.5624084472656, "t": 528.9124755859375, "r": 460.9011535644531, "b": 520.537841796875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "89", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 478.593994140625, "t": 528.9124755859375, "r": 486.9327392578125, "b": 520.537841796875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 504.6324157714844, "t": 528.9124755859375, "r": 512.97119140625, "b": 520.537841796875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "90", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.6390075683594, "t": 517.9534301757812, "r": 374.5992126464844, "b": 509.5788269042969, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Text", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52398681640625, "t": 517.9534301757812, "r": 434.86273193359375, "b": 509.5788269042969, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.5624084472656, "t": 517.9534301757812, "r": 460.9011535644531, "b": 509.5788269042969, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "91", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 478.593994140625, "t": 517.9534301757812, "r": 486.9327392578125, "b": 509.5788269042969, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 504.6324157714844, "t": 517.9534301757812, "r": 512.97119140625, "b": 509.5788269042969, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "90", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.6390075683594, "t": 506.9944763183594, "r": 375.6303405761719, "b": 498.6198425292969, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Title", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52398681640625, "t": 506.9944763183594, "r": 434.86273193359375, "b": 498.6198425292969, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.5624084472656, "t": 506.9944763183594, "r": 460.9011535644531, "b": 498.6198425292969, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.6390075683594, "t": 495.637451171875, "r": 369.60491943359375, "b": 487.2628173828125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "All", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52398681640625, "t": 495.637451171875, "r": 434.86273193359375, "b": 487.2628173828125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.5624084472656, "t": 495.637451171875, "r": 460.9011535644531, "b": 487.2628173828125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 478.593994140625, "t": 495.637451171875, "r": 486.9327392578125, "b": 487.2628173828125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "78", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 504.6324157714844, "t": 495.637451171875, "r": 512.97119140625, "b": 487.2628173828125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "87", "column_header": false, "row_header": false, "row_section": false}], "num_rows": 14, "num_cols": 5, "grid": [[{"bbox": {"l": 358.6390075683594, "t": 638.8994750976562, "r": 401.7315368652344, "b": 630.5248413085938, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Class-count", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.2250061035156, "t": 638.8994750976562, "r": 448.5637512207031, "b": 630.5248413085938, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 3, "text": "11", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 440.2250061035156, "t": 638.8994750976562, "r": 448.5637512207031, "b": 630.5248413085938, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 3, "text": "11", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 494.3800048828125, "t": 638.8994750976562, "r": 498.54937744140625, "b": 630.5248413085938, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 5, "text": "5", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 494.3800048828125, "t": 638.8994750976562, "r": 498.54937744140625, "b": 630.5248413085938, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 5, "text": "5", "column_header": true, "row_header": false, "row_section": false}], [{"bbox": {"l": 358.6390075683594, "t": 627.9404907226562, "r": 375.27166748046875, "b": 619.5658569335938, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Split", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 423.34100341796875, "t": 627.9404907226562, "r": 438.0458984375, "b": 619.5658569335938, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Doc", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 448.007568359375, "t": 627.9404907226562, "r": 465.44720458984375, "b": 619.5658569335938, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Page", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 475.4110107421875, "t": 627.9404907226562, "r": 490.11590576171875, "b": 619.5658569335938, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Doc", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 500.07757568359375, "t": 627.9404907226562, "r": 517.5172119140625, "b": 619.5658569335938, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Page", "column_header": true, "row_header": false, "row_section": false}], [{"bbox": {"l": 358.6390075683594, "t": 616.5834350585938, "r": 387.82464599609375, "b": 608.2088012695312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Caption", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52398681640625, "t": 616.5834350585938, "r": 434.86273193359375, "b": 608.2088012695312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.5624084472656, "t": 616.5834350585938, "r": 460.9011535644531, "b": 608.2088012695312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 358.6390075683594, "t": 605.6244506835938, "r": 391.1422119140625, "b": 597.2498168945312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Footnote", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52398681640625, "t": 605.6244506835938, "r": 434.86273193359375, "b": 597.2498168945312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "71", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.5624084472656, "t": 605.6244506835938, "r": 460.9011535644531, "b": 597.2498168945312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 358.6390075683594, "t": 594.6654663085938, "r": 389.15167236328125, "b": 586.2908325195312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Formula", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52398681640625, "t": 594.6654663085938, "r": 434.86273193359375, "b": 586.2908325195312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "60", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.5624084472656, "t": 594.6654663085938, "r": 460.9011535644531, "b": 586.2908325195312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "66", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 358.6390075683594, "t": 583.7064819335938, "r": 391.518798828125, "b": 575.3318481445312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "List-item", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52398681640625, "t": 583.7064819335938, "r": 434.86273193359375, "b": 575.3318481445312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.5624084472656, "t": 583.7064819335938, "r": 460.9011535644531, "b": 575.3318481445312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 478.593994140625, "t": 583.7064819335938, "r": 486.9327392578125, "b": 575.3318481445312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 504.6324157714844, "t": 583.7064819335938, "r": 512.97119140625, "b": 575.3318481445312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "88", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 358.6390075683594, "t": 572.7474365234375, "r": 401.1666564941406, "b": 564.372802734375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-footer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52398681640625, "t": 572.7474365234375, "r": 434.86273193359375, "b": 564.372802734375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "62", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.5624084472656, "t": 572.7474365234375, "r": 460.9011535644531, "b": 564.372802734375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "89", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 358.6390075683594, "t": 561.7884521484375, "r": 403.9193115234375, "b": 553.413818359375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52398681640625, "t": 561.7884521484375, "r": 434.86273193359375, "b": 553.413818359375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.5624084472656, "t": 561.7884521484375, "r": 460.9011535644531, "b": 553.413818359375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "90", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 358.6390075683594, "t": 550.8304443359375, "r": 384.6236572265625, "b": 542.455810546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Picture", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52398681640625, "t": 550.8304443359375, "r": 434.86273193359375, "b": 542.455810546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.5624084472656, "t": 550.8304443359375, "r": 460.9011535644531, "b": 542.455810546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 478.593994140625, "t": 550.8304443359375, "r": 486.9327392578125, "b": 542.455810546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 504.6324157714844, "t": 550.8304443359375, "r": 512.97119140625, "b": 542.455810546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "82", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 358.6390075683594, "t": 539.8714599609375, "r": 413.37890625, "b": 531.496826171875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Section-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52398681640625, "t": 539.8714599609375, "r": 434.86273193359375, "b": 531.496826171875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.5624084472656, "t": 539.8714599609375, "r": 460.9011535644531, "b": 531.496826171875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 478.593994140625, "t": 539.8714599609375, "r": 486.9327392578125, "b": 531.496826171875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "69", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 504.6324157714844, "t": 539.8714599609375, "r": 512.97119140625, "b": 531.496826171875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "83", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 358.6390075683594, "t": 528.9124755859375, "r": 378.4457702636719, "b": 520.537841796875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52398681640625, "t": 528.9124755859375, "r": 434.86273193359375, "b": 520.537841796875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.5624084472656, "t": 528.9124755859375, "r": 460.9011535644531, "b": 520.537841796875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "89", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 478.593994140625, "t": 528.9124755859375, "r": 486.9327392578125, "b": 520.537841796875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 504.6324157714844, "t": 528.9124755859375, "r": 512.97119140625, "b": 520.537841796875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "90", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 358.6390075683594, "t": 517.9534301757812, "r": 374.5992126464844, "b": 509.5788269042969, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Text", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52398681640625, "t": 517.9534301757812, "r": 434.86273193359375, "b": 509.5788269042969, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.5624084472656, "t": 517.9534301757812, "r": 460.9011535644531, "b": 509.5788269042969, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "91", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 478.593994140625, "t": 517.9534301757812, "r": 486.9327392578125, "b": 509.5788269042969, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 504.6324157714844, "t": 517.9534301757812, "r": 512.97119140625, "b": 509.5788269042969, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "90", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 358.6390075683594, "t": 506.9944763183594, "r": 375.6303405761719, "b": 498.6198425292969, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Title", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52398681640625, "t": 506.9944763183594, "r": 434.86273193359375, "b": 498.6198425292969, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.5624084472656, "t": 506.9944763183594, "r": 460.9011535644531, "b": 498.6198425292969, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 358.6390075683594, "t": 495.637451171875, "r": 369.60491943359375, "b": 487.2628173828125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "All", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52398681640625, "t": 495.637451171875, "r": 434.86273193359375, "b": 487.2628173828125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.5624084472656, "t": 495.637451171875, "r": 460.9011535644531, "b": 487.2628173828125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 478.593994140625, "t": 495.637451171875, "r": 486.9327392578125, "b": 487.2628173828125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "78", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 504.6324157714844, "t": 495.637451171875, "r": 512.97119140625, "b": 487.2628173828125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "87", "column_header": false, "row_header": false, "row_section": false}]]}}, {"self_ref": "#/tables/4", "parent": {"cref": "#/body"}, "children": [], "label": "table", "prov": [{"page_no": 8, "bbox": {"l": 72.6590347290039, "t": 619.5191650390625, "r": 274.83465576171875, "b": 452.1459655761719, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [{"cref": "#/texts/477"}], "references": [], "footnotes": [], "image": null, "data": {"table_cells": [{"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 217.74099731445312, "t": 616.9814453125, "r": 256.2606506347656, "b": 608.6068115234375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 3, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 5, "text": "Testing on", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 89.9540023803711, "t": 606.0234375, "r": 133.24378967285156, "b": 597.6488037109375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Training on", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 154.62899780273438, "t": 606.0234375, "r": 175.4758758544922, "b": 597.6488037109375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "labels", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 204.69000244140625, "t": 606.0234375, "r": 220.5426025390625, "b": 597.6488037109375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "PLN", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 230.5042724609375, "t": 606.0234375, "r": 242.0619659423828, "b": 597.6488037109375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "DB", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 252.0236358642578, "t": 606.0234375, "r": 269.31085205078125, "b": 597.6488037109375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "DLN", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 78.53099822998047, "t": 572.7474365234375, "r": 142.56005859375, "b": 564.372802734375, "coord_origin": "BOTTOMLEFT"}, "row_span": 5, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PubLayNet (PLN)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 154.62899780273438, "t": 594.6654663085938, "r": 177.9237060546875, "b": 586.2908325195312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Figure", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44700622558594, "t": 594.6654663085938, "r": 216.78575134277344, "b": 586.2908325195312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.11830139160156, "t": 594.6654663085938, "r": 240.45704650878906, "b": 586.2908325195312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "43", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.4979248046875, "t": 594.6654663085938, "r": 264.836669921875, "b": 586.2908325195312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "23", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.62899780273438, "t": 583.7064819335938, "r": 194.72674560546875, "b": 575.3318481445312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Sec-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44700622558594, "t": 583.7064819335938, "r": 216.78575134277344, "b": 575.3318481445312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "87", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 234.77235412597656, "t": 583.7064819335938, "r": 237.80299377441406, "b": 575.3318481445312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.4979248046875, "t": 583.7064819335938, "r": 264.836669921875, "b": 575.3318481445312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "32", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.62899780273438, "t": 572.7474365234375, "r": 174.43577575683594, "b": 564.372802734375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44700622558594, "t": 572.7474365234375, "r": 216.78575134277344, "b": 564.372802734375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "95", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.11830139160156, "t": 572.7474365234375, "r": 240.45704650878906, "b": 564.372802734375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "24", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.4979248046875, "t": 572.7474365234375, "r": 264.836669921875, "b": 564.372802734375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "49", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.62899780273438, "t": 561.7884521484375, "r": 170.5891876220703, "b": 553.413818359375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Text", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44700622558594, "t": 561.7884521484375, "r": 216.78575134277344, "b": 553.413818359375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 234.77235412597656, "t": 561.7884521484375, "r": 237.80299377441406, "b": 553.413818359375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.4979248046875, "t": 561.7884521484375, "r": 264.836669921875, "b": 553.413818359375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "42", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.62899780273438, "t": 550.8304443359375, "r": 171.27960205078125, "b": 542.455810546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "total", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44700622558594, "t": 550.8304443359375, "r": 216.78575134277344, "b": 542.455810546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "93", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.11830139160156, "t": 550.8304443359375, "r": 240.45704650878906, "b": 542.455810546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "34", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.4979248046875, "t": 550.8304443359375, "r": 264.836669921875, "b": 542.455810546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "30", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 78.53099822998047, "t": 528.5134887695312, "r": 131.1996307373047, "b": 520.1388549804688, "coord_origin": "BOTTOMLEFT"}, "row_span": 3, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "DocBank (DB)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 154.62899780273438, "t": 539.4724731445312, "r": 177.9237060546875, "b": 531.0978393554688, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Figure", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44700622558594, "t": 539.4724731445312, "r": 216.78575134277344, "b": 531.0978393554688, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.11830139160156, "t": 539.4724731445312, "r": 240.45704650878906, "b": 531.0978393554688, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "71", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.4979248046875, "t": 539.4724731445312, "r": 264.836669921875, "b": 531.0978393554688, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "31", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.62899780273438, "t": 528.5134887695312, "r": 174.43577575683594, "b": 520.1388549804688, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44700622558594, "t": 528.5134887695312, "r": 216.78575134277344, "b": 520.1388549804688, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "19", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.11830139160156, "t": 528.5134887695312, "r": 240.45704650878906, "b": 520.1388549804688, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "65", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.4979248046875, "t": 528.5134887695312, "r": 264.836669921875, "b": 520.1388549804688, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "22", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.62899780273438, "t": 517.554443359375, "r": 171.27960205078125, "b": 509.1798400878906, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "total", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44700622558594, "t": 517.554443359375, "r": 216.78575134277344, "b": 509.1798400878906, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "48", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.11830139160156, "t": 517.554443359375, "r": 240.45704650878906, "b": 509.1798400878906, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.4979248046875, "t": 517.554443359375, "r": 264.836669921875, "b": 509.1798400878906, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "27", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 78.53099822998047, "t": 484.2794494628906, "r": 144.6671600341797, "b": 475.9048156738281, "coord_origin": "BOTTOMLEFT"}, "row_span": 5, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 15, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "DocLayNet (DLN)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 154.62899780273438, "t": 506.19744873046875, "r": 177.9237060546875, "b": 497.82281494140625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Figure", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44700622558594, "t": 506.19744873046875, "r": 216.78575134277344, "b": 497.82281494140625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "67", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.11830139160156, "t": 506.19744873046875, "r": 240.45704650878906, "b": 497.82281494140625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "51", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.4979248046875, "t": 506.19744873046875, "r": 264.836669921875, "b": 497.82281494140625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.62899780273438, "t": 495.23846435546875, "r": 194.72674560546875, "b": 486.86383056640625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Sec-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44700622558594, "t": 495.23846435546875, "r": 216.78575134277344, "b": 486.86383056640625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "53", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 234.77235412597656, "t": 495.23846435546875, "r": 237.80299377441406, "b": 486.86383056640625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.4979248046875, "t": 495.23846435546875, "r": 264.836669921875, "b": 486.86383056640625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.62899780273438, "t": 484.2794494628906, "r": 174.43577575683594, "b": 475.9048156738281, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44700622558594, "t": 484.2794494628906, "r": 216.78575134277344, "b": 475.9048156738281, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "87", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.11830139160156, "t": 484.2794494628906, "r": 240.45704650878906, "b": 475.9048156738281, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "43", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.4979248046875, "t": 484.2794494628906, "r": 264.836669921875, "b": 475.9048156738281, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.62899780273438, "t": 473.3204650878906, "r": 170.5891876220703, "b": 464.9458312988281, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Text", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44700622558594, "t": 473.3204650878906, "r": 216.78575134277344, "b": 464.9458312988281, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 234.77235412597656, "t": 473.3204650878906, "r": 237.80299377441406, "b": 464.9458312988281, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.4979248046875, "t": 473.3204650878906, "r": 264.836669921875, "b": 464.9458312988281, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.62899780273438, "t": 462.3614501953125, "r": 171.27960205078125, "b": 453.98681640625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 14, "end_row_offset_idx": 15, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "total", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44700622558594, "t": 462.3614501953125, "r": 216.78575134277344, "b": 453.98681640625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 14, "end_row_offset_idx": 15, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "59", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.11830139160156, "t": 462.3614501953125, "r": 240.45704650878906, "b": 453.98681640625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 14, "end_row_offset_idx": 15, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "47", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.4979248046875, "t": 462.3614501953125, "r": 264.836669921875, "b": 453.98681640625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 14, "end_row_offset_idx": 15, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "78", "column_header": false, "row_header": false, "row_section": false}], "num_rows": 15, "num_cols": 5, "grid": [[{"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 217.74099731445312, "t": 616.9814453125, "r": 256.2606506347656, "b": 608.6068115234375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 3, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 5, "text": "Testing on", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 217.74099731445312, "t": 616.9814453125, "r": 256.2606506347656, "b": 608.6068115234375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 3, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 5, "text": "Testing on", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 217.74099731445312, "t": 616.9814453125, "r": 256.2606506347656, "b": 608.6068115234375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 3, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 5, "text": "Testing on", "column_header": true, "row_header": false, "row_section": false}], [{"bbox": {"l": 89.9540023803711, "t": 606.0234375, "r": 133.24378967285156, "b": 597.6488037109375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Training on", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 154.62899780273438, "t": 606.0234375, "r": 175.4758758544922, "b": 597.6488037109375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "labels", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 204.69000244140625, "t": 606.0234375, "r": 220.5426025390625, "b": 597.6488037109375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "PLN", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 230.5042724609375, "t": 606.0234375, "r": 242.0619659423828, "b": 597.6488037109375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "DB", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 252.0236358642578, "t": 606.0234375, "r": 269.31085205078125, "b": 597.6488037109375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "DLN", "column_header": true, "row_header": false, "row_section": false}], [{"bbox": {"l": 78.53099822998047, "t": 572.7474365234375, "r": 142.56005859375, "b": 564.372802734375, "coord_origin": "BOTTOMLEFT"}, "row_span": 5, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PubLayNet (PLN)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 154.62899780273438, "t": 594.6654663085938, "r": 177.9237060546875, "b": 586.2908325195312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Figure", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44700622558594, "t": 594.6654663085938, "r": 216.78575134277344, "b": 586.2908325195312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.11830139160156, "t": 594.6654663085938, "r": 240.45704650878906, "b": 586.2908325195312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "43", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.4979248046875, "t": 594.6654663085938, "r": 264.836669921875, "b": 586.2908325195312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "23", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 78.53099822998047, "t": 572.7474365234375, "r": 142.56005859375, "b": 564.372802734375, "coord_origin": "BOTTOMLEFT"}, "row_span": 5, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PubLayNet (PLN)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 154.62899780273438, "t": 583.7064819335938, "r": 194.72674560546875, "b": 575.3318481445312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Sec-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44700622558594, "t": 583.7064819335938, "r": 216.78575134277344, "b": 575.3318481445312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "87", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 234.77235412597656, "t": 583.7064819335938, "r": 237.80299377441406, "b": 575.3318481445312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.4979248046875, "t": 583.7064819335938, "r": 264.836669921875, "b": 575.3318481445312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "32", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 78.53099822998047, "t": 572.7474365234375, "r": 142.56005859375, "b": 564.372802734375, "coord_origin": "BOTTOMLEFT"}, "row_span": 5, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PubLayNet (PLN)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 154.62899780273438, "t": 572.7474365234375, "r": 174.43577575683594, "b": 564.372802734375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44700622558594, "t": 572.7474365234375, "r": 216.78575134277344, "b": 564.372802734375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "95", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.11830139160156, "t": 572.7474365234375, "r": 240.45704650878906, "b": 564.372802734375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "24", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.4979248046875, "t": 572.7474365234375, "r": 264.836669921875, "b": 564.372802734375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "49", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 78.53099822998047, "t": 572.7474365234375, "r": 142.56005859375, "b": 564.372802734375, "coord_origin": "BOTTOMLEFT"}, "row_span": 5, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PubLayNet (PLN)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 154.62899780273438, "t": 561.7884521484375, "r": 170.5891876220703, "b": 553.413818359375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Text", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44700622558594, "t": 561.7884521484375, "r": 216.78575134277344, "b": 553.413818359375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 234.77235412597656, "t": 561.7884521484375, "r": 237.80299377441406, "b": 553.413818359375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.4979248046875, "t": 561.7884521484375, "r": 264.836669921875, "b": 553.413818359375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "42", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 78.53099822998047, "t": 572.7474365234375, "r": 142.56005859375, "b": 564.372802734375, "coord_origin": "BOTTOMLEFT"}, "row_span": 5, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PubLayNet (PLN)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 154.62899780273438, "t": 550.8304443359375, "r": 171.27960205078125, "b": 542.455810546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "total", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44700622558594, "t": 550.8304443359375, "r": 216.78575134277344, "b": 542.455810546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "93", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.11830139160156, "t": 550.8304443359375, "r": 240.45704650878906, "b": 542.455810546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "34", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.4979248046875, "t": 550.8304443359375, "r": 264.836669921875, "b": 542.455810546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "30", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 78.53099822998047, "t": 528.5134887695312, "r": 131.1996307373047, "b": 520.1388549804688, "coord_origin": "BOTTOMLEFT"}, "row_span": 3, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "DocBank (DB)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 154.62899780273438, "t": 539.4724731445312, "r": 177.9237060546875, "b": 531.0978393554688, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Figure", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44700622558594, "t": 539.4724731445312, "r": 216.78575134277344, "b": 531.0978393554688, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.11830139160156, "t": 539.4724731445312, "r": 240.45704650878906, "b": 531.0978393554688, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "71", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.4979248046875, "t": 539.4724731445312, "r": 264.836669921875, "b": 531.0978393554688, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "31", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 78.53099822998047, "t": 528.5134887695312, "r": 131.1996307373047, "b": 520.1388549804688, "coord_origin": "BOTTOMLEFT"}, "row_span": 3, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "DocBank (DB)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 154.62899780273438, "t": 528.5134887695312, "r": 174.43577575683594, "b": 520.1388549804688, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44700622558594, "t": 528.5134887695312, "r": 216.78575134277344, "b": 520.1388549804688, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "19", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.11830139160156, "t": 528.5134887695312, "r": 240.45704650878906, "b": 520.1388549804688, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "65", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.4979248046875, "t": 528.5134887695312, "r": 264.836669921875, "b": 520.1388549804688, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "22", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 78.53099822998047, "t": 528.5134887695312, "r": 131.1996307373047, "b": 520.1388549804688, "coord_origin": "BOTTOMLEFT"}, "row_span": 3, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "DocBank (DB)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 154.62899780273438, "t": 517.554443359375, "r": 171.27960205078125, "b": 509.1798400878906, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "total", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44700622558594, "t": 517.554443359375, "r": 216.78575134277344, "b": 509.1798400878906, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "48", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.11830139160156, "t": 517.554443359375, "r": 240.45704650878906, "b": 509.1798400878906, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.4979248046875, "t": 517.554443359375, "r": 264.836669921875, "b": 509.1798400878906, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "27", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 78.53099822998047, "t": 484.2794494628906, "r": 144.6671600341797, "b": 475.9048156738281, "coord_origin": "BOTTOMLEFT"}, "row_span": 5, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 15, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "DocLayNet (DLN)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 154.62899780273438, "t": 506.19744873046875, "r": 177.9237060546875, "b": 497.82281494140625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Figure", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44700622558594, "t": 506.19744873046875, "r": 216.78575134277344, "b": 497.82281494140625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "67", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.11830139160156, "t": 506.19744873046875, "r": 240.45704650878906, "b": 497.82281494140625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "51", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.4979248046875, "t": 506.19744873046875, "r": 264.836669921875, "b": 497.82281494140625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "72", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 78.53099822998047, "t": 484.2794494628906, "r": 144.6671600341797, "b": 475.9048156738281, "coord_origin": "BOTTOMLEFT"}, "row_span": 5, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 15, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "DocLayNet (DLN)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 154.62899780273438, "t": 495.23846435546875, "r": 194.72674560546875, "b": 486.86383056640625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Sec-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44700622558594, "t": 495.23846435546875, "r": 216.78575134277344, "b": 486.86383056640625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "53", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 234.77235412597656, "t": 495.23846435546875, "r": 237.80299377441406, "b": 486.86383056640625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.4979248046875, "t": 495.23846435546875, "r": 264.836669921875, "b": 486.86383056640625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "68", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 78.53099822998047, "t": 484.2794494628906, "r": 144.6671600341797, "b": 475.9048156738281, "coord_origin": "BOTTOMLEFT"}, "row_span": 5, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 15, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "DocLayNet (DLN)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 154.62899780273438, "t": 484.2794494628906, "r": 174.43577575683594, "b": 475.9048156738281, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44700622558594, "t": 484.2794494628906, "r": 216.78575134277344, "b": 475.9048156738281, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "87", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.11830139160156, "t": 484.2794494628906, "r": 240.45704650878906, "b": 475.9048156738281, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "43", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.4979248046875, "t": 484.2794494628906, "r": 264.836669921875, "b": 475.9048156738281, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "82", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 78.53099822998047, "t": 484.2794494628906, "r": 144.6671600341797, "b": 475.9048156738281, "coord_origin": "BOTTOMLEFT"}, "row_span": 5, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 15, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "DocLayNet (DLN)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 154.62899780273438, "t": 473.3204650878906, "r": 170.5891876220703, "b": 464.9458312988281, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Text", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44700622558594, "t": 473.3204650878906, "r": 216.78575134277344, "b": 464.9458312988281, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 234.77235412597656, "t": 473.3204650878906, "r": 237.80299377441406, "b": 464.9458312988281, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.4979248046875, "t": 473.3204650878906, "r": 264.836669921875, "b": 464.9458312988281, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "84", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 78.53099822998047, "t": 484.2794494628906, "r": 144.6671600341797, "b": 475.9048156738281, "coord_origin": "BOTTOMLEFT"}, "row_span": 5, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 15, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "DocLayNet (DLN)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 154.62899780273438, "t": 462.3614501953125, "r": 171.27960205078125, "b": 453.98681640625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 14, "end_row_offset_idx": 15, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "total", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44700622558594, "t": 462.3614501953125, "r": 216.78575134277344, "b": 453.98681640625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 14, "end_row_offset_idx": 15, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "59", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.11830139160156, "t": 462.3614501953125, "r": 240.45704650878906, "b": 453.98681640625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 14, "end_row_offset_idx": 15, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "47", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.4979248046875, "t": 462.3614501953125, "r": 264.836669921875, "b": 453.98681640625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 14, "end_row_offset_idx": 15, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "78", "column_header": false, "row_header": false, "row_section": false}]]}}], "key_value_items": [], "pages": {"1": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 1}, "2": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 2}, "3": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 3}, "4": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 4}, "5": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 5}, "6": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 6}, "7": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 7}, "8": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 8}, "9": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 9}}}
\ No newline at end of file
+{"schema_name": "DoclingDocument", "version": "1.1.0", "name": "2206.01062", "origin": {"mimetype": "application/pdf", "binary_hash": 7156212269791437020, "filename": "2206.01062.pdf", "uri": null}, "furniture": {"self_ref": "#/furniture", "parent": null, "children": [], "content_layer": "furniture", "name": "_root_", "label": "unspecified"}, "body": {"self_ref": "#/body", "parent": null, "children": [{"cref": "#/texts/0"}, {"cref": "#/texts/1"}, {"cref": "#/texts/2"}, {"cref": "#/texts/3"}, {"cref": "#/texts/4"}, {"cref": "#/texts/5"}, {"cref": "#/texts/6"}, {"cref": "#/texts/7"}, {"cref": "#/texts/8"}, {"cref": "#/texts/9"}, {"cref": "#/texts/10"}, {"cref": "#/texts/11"}, {"cref": "#/texts/12"}, {"cref": "#/texts/13"}, {"cref": "#/texts/14"}, {"cref": "#/texts/15"}, {"cref": "#/pictures/0"}, {"cref": "#/texts/346"}, {"cref": "#/texts/347"}, {"cref": "#/texts/348"}, {"cref": "#/texts/349"}, {"cref": "#/texts/350"}, {"cref": "#/texts/351"}, {"cref": "#/texts/352"}, {"cref": "#/texts/353"}, {"cref": "#/texts/354"}, {"cref": "#/groups/0"}, {"cref": "#/texts/359"}, {"cref": "#/texts/360"}, {"cref": "#/groups/1"}, {"cref": "#/texts/362"}, {"cref": "#/texts/363"}, {"cref": "#/texts/364"}, {"cref": "#/texts/365"}, {"cref": "#/texts/366"}, {"cref": "#/texts/367"}, {"cref": "#/texts/368"}, {"cref": "#/texts/369"}, {"cref": "#/texts/370"}, {"cref": "#/texts/371"}, {"cref": "#/pictures/1"}, {"cref": "#/texts/385"}, {"cref": "#/texts/386"}, {"cref": "#/texts/387"}, {"cref": "#/texts/388"}, {"cref": "#/texts/389"}, {"cref": "#/texts/390"}, {"cref": "#/texts/391"}, {"cref": "#/texts/392"}, {"cref": "#/texts/393"}, {"cref": "#/texts/394"}, {"cref": "#/texts/395"}, {"cref": "#/tables/0"}, {"cref": "#/pictures/2"}, {"cref": "#/texts/398"}, {"cref": "#/texts/399"}, {"cref": "#/texts/400"}, {"cref": "#/texts/401"}, {"cref": "#/texts/402"}, {"cref": "#/texts/403"}, {"cref": "#/texts/404"}, {"cref": "#/texts/405"}, {"cref": "#/texts/406"}, {"cref": "#/texts/407"}, {"cref": "#/groups/2"}, {"cref": "#/texts/414"}, {"cref": "#/texts/415"}, {"cref": "#/pictures/3"}, {"cref": "#/texts/426"}, {"cref": "#/texts/427"}, {"cref": "#/texts/428"}, {"cref": "#/texts/429"}, {"cref": "#/texts/430"}, {"cref": "#/texts/431"}, {"cref": "#/tables/1"}, {"cref": "#/texts/432"}, {"cref": "#/texts/433"}, {"cref": "#/texts/434"}, {"cref": "#/pictures/4"}, {"cref": "#/texts/458"}, {"cref": "#/texts/459"}, {"cref": "#/texts/460"}, {"cref": "#/texts/461"}, {"cref": "#/texts/462"}, {"cref": "#/texts/463"}, {"cref": "#/texts/464"}, {"cref": "#/tables/2"}, {"cref": "#/texts/465"}, {"cref": "#/texts/466"}, {"cref": "#/texts/467"}, {"cref": "#/texts/468"}, {"cref": "#/texts/469"}, {"cref": "#/tables/3"}, {"cref": "#/texts/470"}, {"cref": "#/texts/471"}, {"cref": "#/texts/472"}, {"cref": "#/texts/473"}, {"cref": "#/texts/474"}, {"cref": "#/texts/475"}, {"cref": "#/texts/476"}, {"cref": "#/tables/4"}, {"cref": "#/texts/477"}, {"cref": "#/texts/478"}, {"cref": "#/texts/479"}, {"cref": "#/texts/480"}, {"cref": "#/texts/481"}, {"cref": "#/texts/482"}, {"cref": "#/texts/483"}, {"cref": "#/texts/484"}, {"cref": "#/texts/485"}, {"cref": "#/groups/3"}, {"cref": "#/texts/499"}, {"cref": "#/texts/500"}, {"cref": "#/pictures/5"}, {"cref": "#/texts/513"}, {"cref": "#/texts/514"}, {"cref": "#/groups/4"}], "content_layer": "body", "name": "_root_", "label": "unspecified"}, "groups": [{"self_ref": "#/groups/0", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/355"}, {"cref": "#/texts/356"}, {"cref": "#/texts/357"}, {"cref": "#/texts/358"}], "content_layer": "body", "name": "list", "label": "list"}, {"self_ref": "#/groups/1", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/361"}], "content_layer": "body", "name": "list", "label": "list"}, {"self_ref": "#/groups/2", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/408"}, {"cref": "#/texts/409"}, {"cref": "#/texts/410"}, {"cref": "#/texts/411"}, {"cref": "#/texts/412"}, {"cref": "#/texts/413"}], "content_layer": "body", "name": "list", "label": "list"}, {"self_ref": "#/groups/3", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/486"}, {"cref": "#/texts/487"}, {"cref": "#/texts/488"}, {"cref": "#/texts/489"}, {"cref": "#/texts/490"}, {"cref": "#/texts/491"}, {"cref": "#/texts/492"}, {"cref": "#/texts/493"}, {"cref": "#/texts/494"}, {"cref": "#/texts/495"}, {"cref": "#/texts/496"}, {"cref": "#/texts/497"}, {"cref": "#/texts/498"}], "content_layer": "body", "name": "list", "label": "list"}, {"self_ref": "#/groups/4", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/515"}, {"cref": "#/texts/516"}, {"cref": "#/texts/517"}, {"cref": "#/texts/518"}, {"cref": "#/texts/519"}, {"cref": "#/texts/520"}, {"cref": "#/texts/521"}, {"cref": "#/texts/522"}, {"cref": "#/texts/523"}, {"cref": "#/texts/524"}], "content_layer": "body", "name": "list", "label": "list"}], "texts": [{"self_ref": "#/texts/0", "parent": {"cref": "#/body"}, "children": [], "content_layer": "furniture", "label": "page_header", "prov": [{"page_no": 1, "bbox": {"l": 18.34021, "t": 573.64001, "r": 36.339794, "b": 236.99996999999996, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 37]}], "orig": "arXiv:2206.01062v1 [cs.CV] 2 Jun 2022", "text": "arXiv:2206.01062v1 [cs.CV] 2 Jun 2022"}, {"self_ref": "#/texts/1", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "section_header", "prov": [{"page_no": 1, "bbox": {"l": 107.29999999999998, "t": 708.3052999999999, "r": 505.06195, "b": 672.4044199999998, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 71]}], "orig": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis", "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis", "level": 1}, {"self_ref": "#/texts/2", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 90.96701, "t": 658.32764, "r": 193.73123, "b": 611.7597, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 73]}], "orig": "Birgit Pfitzmann IBM Research Rueschlikon, Switzerland bpf@zurich.ibm.com", "text": "Birgit Pfitzmann IBM Research Rueschlikon, Switzerland bpf@zurich.ibm.com"}, {"self_ref": "#/texts/3", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 255.11602999999997, "t": 658.32764, "r": 357.88025, "b": 611.7597, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 71]}], "orig": "Christoph Auer IBM Research Rueschlikon, Switzerland cau@zurich.ibm.com", "text": "Christoph Auer IBM Research Rueschlikon, Switzerland cau@zurich.ibm.com"}, {"self_ref": "#/texts/4", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 419.26505, "t": 658.32764, "r": 522.0293, "b": 611.7597, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 70]}], "orig": "Michele Dolfi IBM Research Rueschlikon, Switzerland dol@zurich.ibm.com", "text": "Michele Dolfi IBM Research Rueschlikon, Switzerland dol@zurich.ibm.com"}, {"self_ref": "#/texts/5", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 172.54303, "t": 599.94263, "r": 275.30725, "b": 553.37469, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 72]}], "orig": "Ahmed S. Nassar IBM Research Rueschlikon, Switzerland ahn@zurich.ibm.com", "text": "Ahmed S. Nassar IBM Research Rueschlikon, Switzerland ahn@zurich.ibm.com"}, {"self_ref": "#/texts/6", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 336.69302, "t": 599.94263, "r": 439.45727999999997, "b": 553.37469, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 68]}], "orig": "Peter Staar IBM Research Rueschlikon, Switzerland taa@zurich.ibm.com", "text": "Peter Staar IBM Research Rueschlikon, Switzerland taa@zurich.ibm.com"}, {"self_ref": "#/texts/7", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "section_header", "prov": [{"page_no": 1, "bbox": {"l": 53.798035, "t": 544.29712, "r": 111.94354, "b": 533.98798, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 8]}], "orig": "ABSTRACT", "text": "ABSTRACT", "level": 1}, {"self_ref": "#/texts/8", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 53.466999, "t": 529.09546, "r": 295.56018, "b": 257.70682, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1595]}], "orig": "Accurate document layout analysis is a key requirement for highquality PDF document conversion. With the recent availability of public, large ground-truth datasets such as PubLayNet and DocBank, deep-learning models have proven to be very effective at layout detection and segmentation. While these datasets are of adequate size to train such models, they severely lack in layout variability since they are sourced from scientific article repositories such as PubMed and arXiv only. Consequently, the accuracy of the layout segmentation drops significantly when these models are applied on more challenging and diverse layouts. In this paper, we present DocLayNet , a new, publicly available, document-layout annotation dataset in COCO format. It contains 80863 manually annotated pages from diverse data sources to represent a wide variability in layouts. For each PDF page, the layout annotations provide labelled bounding-boxes with a choice of 11 distinct classes. DocLayNet also provides a subset of double- and triple-annotated pages to determine the inter-annotator agreement. In multiple experiments, we provide baseline accuracy scores (in mAP) for a set of popular object detection models. We also demonstrate that these models fall approximately 10% behind the inter-annotator agreement. Furthermore, we provide evidence that DocLayNet is of sufficient size. Lastly, we compare models trained on PubLayNet, DocBank and DocLayNet, showing that layout predictions of the DocLayNettrained models are more robust and thus the preferred choice for general-purpose document-layout analysis.", "text": "Accurate document layout analysis is a key requirement for highquality PDF document conversion. With the recent availability of public, large ground-truth datasets such as PubLayNet and DocBank, deep-learning models have proven to be very effective at layout detection and segmentation. While these datasets are of adequate size to train such models, they severely lack in layout variability since they are sourced from scientific article repositories such as PubMed and arXiv only. Consequently, the accuracy of the layout segmentation drops significantly when these models are applied on more challenging and diverse layouts. In this paper, we present DocLayNet , a new, publicly available, document-layout annotation dataset in COCO format. It contains 80863 manually annotated pages from diverse data sources to represent a wide variability in layouts. For each PDF page, the layout annotations provide labelled bounding-boxes with a choice of 11 distinct classes. DocLayNet also provides a subset of double- and triple-annotated pages to determine the inter-annotator agreement. In multiple experiments, we provide baseline accuracy scores (in mAP) for a set of popular object detection models. We also demonstrate that these models fall approximately 10% behind the inter-annotator agreement. Furthermore, we provide evidence that DocLayNet is of sufficient size. Lastly, we compare models trained on PubLayNet, DocBank and DocLayNet, showing that layout predictions of the DocLayNettrained models are more robust and thus the preferred choice for general-purpose document-layout analysis."}, {"self_ref": "#/texts/9", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "section_header", "prov": [{"page_no": 1, "bbox": {"l": 53.79800000000001, "t": 241.00307999999995, "r": 134.81989, "b": 230.69398, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 12]}], "orig": "CCS CONCEPTS", "text": "CCS CONCEPTS", "level": 1}, {"self_ref": "#/texts/10", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 53.797989, "t": 225.91701, "r": 297.85294, "b": 195.49886000000004, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 170]}], "orig": "\u00b7 Information systems \u2192 Document structure ; \u00b7 Applied computing \u2192 Document analysis ; \u00b7 Computing methodologies \u2192 Machine learning ; Computer vision ; Object detection ;", "text": "\u00b7 Information systems \u2192 Document structure ; \u00b7 Applied computing \u2192 Document analysis ; \u00b7 Computing methodologies \u2192 Machine learning ; Computer vision ; Object detection ;"}, {"self_ref": "#/texts/11", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 53.79800000000001, "t": 157.60162000000003, "r": 295.11798, "b": 119.20811000000003, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 397]}], "orig": "Permission to make digital or hard copies of part or all of this work for personal or classroom use is granted without fee provided that copies are not made or distributed for profit or commercial advantage and that copies bear this notice and the full citation on the first page. Copyrights for third-party components of this work must be honored. For all other uses, contact the owner/author(s).", "text": "Permission to make digital or hard copies of part or all of this work for personal or classroom use is granted without fee provided that copies are not made or distributed for profit or commercial advantage and that copies bear this notice and the full citation on the first page. Copyrights for third-party components of this work must be honored. For all other uses, contact the owner/author(s)."}, {"self_ref": "#/texts/12", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 53.79800000000001, "t": 116.91976999999997, "r": 197.86275, "b": 110.43413999999996, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 48]}], "orig": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA"}, {"self_ref": "#/texts/13", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 53.317001, "t": 108.18763999999999, "r": 186.74652, "b": 101.67411000000004, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 45]}], "orig": "\u00a9 2022 Copyright held by the owner/author(s).", "text": "\u00a9 2022 Copyright held by the owner/author(s)."}, {"self_ref": "#/texts/14", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 53.554001, "t": 100.21663999999998, "r": 157.03125, "b": 93.70311000000004, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 33]}], "orig": "ACM ISBN 978-1-4503-9385-0/22/08.", "text": "ACM ISBN 978-1-4503-9385-0/22/08."}, {"self_ref": "#/texts/15", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 53.79800000000001, "t": 92.24663499999997, "r": 166.94093, "b": 85.73310900000001, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 39]}], "orig": "https://doi.org/10.1145/3534678.3539043", "text": "https://doi.org/10.1145/3534678.3539043"}, {"self_ref": "#/texts/16", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "caption", "prov": [{"page_no": 1, "bbox": {"l": 317.95499, "t": 251.91701, "r": 559.80579, "b": 232.48476000000005, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 84]}], "orig": "Figure 1: Four examples of complex page layouts across different document categories", "text": "Figure 1: Four examples of complex page layouts across different document categories"}, {"self_ref": "#/texts/17", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 327.86951, "t": 440.21915, "r": 330.41248, "b": 438.04535, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "13", "text": "13"}, {"self_ref": "#/texts/18", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 327.83005, "t": 460.42731000000003, "r": 351.16092, "b": 458.68829, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 25]}], "orig": "USING THE VERTICAL TUBE -", "text": "USING THE VERTICAL TUBE -"}, {"self_ref": "#/texts/19", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 327.83005, "t": 458.81708, "r": 348.30536, "b": 457.07806, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 20]}], "orig": "MODELS AY11230/11234", "text": "MODELS AY11230/11234"}, {"self_ref": "#/texts/20", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 327.83005, "t": 455.59561, "r": 329.05914, "b": 454.07394, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "1.", "text": "1."}, {"self_ref": "#/texts/21", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 329.67368, "t": 455.59561, "r": 349.95349, "b": 454.07394, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 33]}], "orig": "The vertical tube can be used for", "text": "The vertical tube can be used for"}, {"self_ref": "#/texts/22", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 329.11752, "t": 454.16412, "r": 353.57977, "b": 452.64248999999995, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 38]}], "orig": "instructional viewing or to photograph", "text": "instructional viewing or to photograph"}, {"self_ref": "#/texts/23", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 327.77121, "t": 452.73264, "r": 352.4306, "b": 451.211, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 36]}], "orig": "the image with a digital camera or a", "text": "the image with a digital camera or a"}, {"self_ref": "#/texts/24", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 328.15176, "t": 451.30118, "r": 337.91086, "b": 449.77951, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 13]}], "orig": "micro TV unit", "text": "micro TV unit"}, {"self_ref": "#/texts/25", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 327.8313, "t": 449.80956999999995, "r": 329.09155, "b": 448.28793, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "2.", "text": "2."}, {"self_ref": "#/texts/26", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 329.72168, "t": 449.80956999999995, "r": 354.9267, "b": 448.28793, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 39]}], "orig": "Loosen the retention screw, then rotate", "text": "Loosen the retention screw, then rotate"}, {"self_ref": "#/texts/27", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 327.8313, "t": 448.37808, "r": 351.66949, "b": 446.85645, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 33]}], "orig": "the adjustment ring to change the", "text": "the adjustment ring to change the"}, {"self_ref": "#/texts/28", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 328.21185, "t": 446.94662, "r": 346.33179, "b": 445.42496, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 28]}], "orig": "length of the vertical tube.", "text": "length of the vertical tube."}, {"self_ref": "#/texts/29", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 327.83005, "t": 445.15319999999997, "r": 329.12726, "b": 443.63153, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "3.", "text": "3."}, {"self_ref": "#/texts/30", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 329.77588, "t": 445.15319999999997, "r": 351.18005, "b": 443.63153, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 33]}], "orig": "Make sure that both the images in", "text": "Make sure that both the images in"}, {"self_ref": "#/texts/31", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 327.25311, "t": 537.05188, "r": 350.07861, "b": 533.13904, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 9]}], "orig": "OPERATION", "text": "OPERATION"}, {"self_ref": "#/texts/32", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 350.07861, "t": 537.23218, "r": 351.82651, "b": 533.31934, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "(", "text": "("}, {"self_ref": "#/texts/33", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 351.82651, "t": 537.05188, "r": 360.85242, "b": 533.13904, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 5]}], "orig": "cont.", "text": "cont."}, {"self_ref": "#/texts/34", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 360.85242, "t": 537.23218, "r": 362.60028, "b": 533.31934, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": ")", "text": ")"}, {"self_ref": "#/texts/35", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 326.88037, "t": 528.50507, "r": 345.84351, "b": 526.76605, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 19]}], "orig": "SELECTING OBJECTIVE", "text": "SELECTING OBJECTIVE"}, {"self_ref": "#/texts/36", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 326.88037, "t": 526.89484, "r": 340.54153, "b": 525.15582, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 13]}], "orig": "MAGNIFICATION", "text": "MAGNIFICATION"}, {"self_ref": "#/texts/37", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 326.88037, "t": 525.28467, "r": 328.31903, "b": 523.54559, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "1.", "text": "1."}, {"self_ref": "#/texts/38", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 329.03836, "t": 525.28467, "r": 354.21472, "b": 523.54559, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 35]}], "orig": "There are two objectives. The lower", "text": "There are two objectives. The lower"}, {"self_ref": "#/texts/39", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 326.88037, "t": 523.67444, "r": 355.19193, "b": 521.93542, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 37]}], "orig": "magnification objective has a greater", "text": "magnification objective has a greater"}, {"self_ref": "#/texts/40", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 326.88037, "t": 522.06421, "r": 345.80057, "b": 520.3252, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 24]}], "orig": "depth of field and view.", "text": "depth of field and view."}, {"self_ref": "#/texts/41", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 326.88037, "t": 520.45398, "r": 328.33862, "b": 518.71497, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "2.", "text": "2."}, {"self_ref": "#/texts/42", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 329.06775, "t": 520.45398, "r": 352.39969, "b": 518.71497, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 32]}], "orig": "In order to observe the specimen", "text": "In order to observe the specimen"}, {"self_ref": "#/texts/43", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 326.88037, "t": 518.84381, "r": 352.90042, "b": 517.10474, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 34]}], "orig": "easily use the lower magnification", "text": "easily use the lower magnification"}, {"self_ref": "#/texts/44", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 326.88037, "t": 517.23358, "r": 354.59546, "b": 515.49457, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 38]}], "orig": "objective first. Then, by rotating the", "text": "objective first. Then, by rotating the"}, {"self_ref": "#/texts/45", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 326.88037, "t": 515.62335, "r": 350.81885, "b": 513.88434, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 30]}], "orig": "case, the magnification can be", "text": "case, the magnification can be"}, {"self_ref": "#/texts/46", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 326.88037, "t": 514.01312, "r": 335.46707, "b": 512.27411, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 8]}], "orig": "changed.", "text": "changed."}, {"self_ref": "#/texts/47", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 326.88037, "t": 510.79272, "r": 354.57755, "b": 509.05368, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 27]}], "orig": "CHANGING THE INTERPUPILLARY", "text": "CHANGING THE INTERPUPILLARY"}, {"self_ref": "#/texts/48", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 326.88037, "t": 509.18249999999995, "r": 335.1752, "b": 507.44348, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 8]}], "orig": "DISTANCE", "text": "DISTANCE"}, {"self_ref": "#/texts/49", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 326.88037, "t": 507.5723, "r": 328.34784, "b": 505.83325, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "1.", "text": "1."}, {"self_ref": "#/texts/50", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 329.08157, "t": 507.5723, "r": 354.76245, "b": 505.83325, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 35]}], "orig": "The distance between the observer's", "text": "The distance between the observer's"}, {"self_ref": "#/texts/51", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 326.88037, "t": 505.96207, "r": 354.6499, "b": 504.22305, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 38]}], "orig": "pupils is the interpupillary distance.", "text": "pupils is the interpupillary distance."}, {"self_ref": "#/texts/52", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 326.88037, "t": 504.35187, "r": 328.25125, "b": 502.61282, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "2.", "text": "2."}, {"self_ref": "#/texts/53", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 328.93671, "t": 504.35187, "r": 354.29825, "b": 502.61282, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 37]}], "orig": "To adjust the interpupillary distance", "text": "To adjust the interpupillary distance"}, {"self_ref": "#/texts/54", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 326.88181, "t": 502.74164, "r": 355.02075, "b": 501.00262, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 37]}], "orig": "rotate the prism caps until both eyes", "text": "rotate the prism caps until both eyes"}, {"self_ref": "#/texts/55", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 326.88181, "t": 501.13144000000005, "r": 350.82028, "b": 499.3924, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 30]}], "orig": "coincide with the image in the", "text": "coincide with the image in the"}, {"self_ref": "#/texts/56", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 326.88181, "t": 499.52121, "r": 336.2067, "b": 497.7822, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 9]}], "orig": "eyepiece.", "text": "eyepiece."}, {"self_ref": "#/texts/57", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 326.88181, "t": 496.30078, "r": 335.3941, "b": 494.56177, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 8]}], "orig": "FOCUSING", "text": "FOCUSING"}, {"self_ref": "#/texts/58", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 326.88181, "t": 494.69058, "r": 328.34314, "b": 492.95154, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "1.", "text": "1."}, {"self_ref": "#/texts/59", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 329.07379, "t": 494.69058, "r": 353.18555, "b": 492.95154, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 33]}], "orig": "Remove the lens protective cover.", "text": "Remove the lens protective cover."}, {"self_ref": "#/texts/60", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 326.88324, "t": 493.08035, "r": 328.35919, "b": 491.34134, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "2.", "text": "2."}, {"self_ref": "#/texts/61", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 329.0972, "t": 493.08035, "r": 353.45065, "b": 491.34134, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 33]}], "orig": "Place the specimen on the working", "text": "Place the specimen on the working"}, {"self_ref": "#/texts/62", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 326.88324, "t": 491.47015, "r": 333.32825, "b": 489.73110999999994, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 6]}], "orig": "stage.", "text": "stage."}, {"self_ref": "#/texts/63", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 326.88324, "t": 489.85991999999993, "r": 328.31296, "b": 488.1209099999999, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "3.", "text": "3."}, {"self_ref": "#/texts/64", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 329.02783, "t": 489.85991999999993, "r": 354.76303, "b": 488.1209099999999, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 36]}], "orig": "Focus the specimen with the left eye", "text": "Focus the specimen with the left eye"}, {"self_ref": "#/texts/65", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 326.88324, "t": 488.24973, "r": 355.96307, "b": 486.51068, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 40]}], "orig": "first while turning the focus knob until", "text": "first while turning the focus knob until"}, {"self_ref": "#/texts/66", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 326.88324, "t": 486.6395, "r": 354.46594, "b": 484.90047999999996, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 34]}], "orig": "the image appears clear and sharp.", "text": "the image appears clear and sharp."}, {"self_ref": "#/texts/67", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 326.88324, "t": 485.0293, "r": 328.25488, "b": 483.29025, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "4.", "text": "4."}, {"self_ref": "#/texts/68", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 328.9407, "t": 485.0293, "r": 356.37335, "b": 483.29025, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 40]}], "orig": "Rotate the right eyepiece ring until the", "text": "Rotate the right eyepiece ring until the"}, {"self_ref": "#/texts/69", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 326.88324, "t": 483.41907, "r": 355.38867, "b": 481.68005, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 36]}], "orig": "images in each eyepiece coincide and", "text": "images in each eyepiece coincide and"}, {"self_ref": "#/texts/70", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 326.88324, "t": 481.80887, "r": 343.17249, "b": 480.06982, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 20]}], "orig": "are sharp and clear.", "text": "are sharp and clear."}, {"self_ref": "#/texts/71", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 326.88324, "t": 478.58844, "r": 344.13388, "b": 476.84940000000006, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 17]}], "orig": "CHANGING THE BULB", "text": "CHANGING THE BULB"}, {"self_ref": "#/texts/72", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 326.88324, "t": 476.97821000000005, "r": 328.37418, "b": 475.23920000000004, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "1.", "text": "1."}, {"self_ref": "#/texts/73", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 329.11963, "t": 476.97821000000005, "r": 348.50162, "b": 475.23920000000004, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 26]}], "orig": "Disconnect the power cord.", "text": "Disconnect the power cord."}, {"self_ref": "#/texts/74", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 326.88324, "t": 475.36801, "r": 328.34061, "b": 473.62897, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "2.", "text": "2."}, {"self_ref": "#/texts/75", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 329.06931, "t": 475.36801, "r": 353.11588, "b": 473.62897, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 33]}], "orig": "When the bulb is cool, remove the", "text": "When the bulb is cool, remove the"}, {"self_ref": "#/texts/76", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 326.88464, "t": 473.7577800000001, "r": 353.79517, "b": 472.0187700000001, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 34]}], "orig": "oblique illuminator cap and remove", "text": "oblique illuminator cap and remove"}, {"self_ref": "#/texts/77", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 326.88464, "t": 472.14757999999995, "r": 348.02094, "b": 470.40854, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 26]}], "orig": "the halogen bulb with cap.", "text": "the halogen bulb with cap."}, {"self_ref": "#/texts/78", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 326.88464, "t": 470.53735, "r": 328.37512, "b": 468.79834, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "3.", "text": "3."}, {"self_ref": "#/texts/79", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 329.12036, "t": 470.53735, "r": 352.96808, "b": 468.79834, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 32]}], "orig": "Replace with a new halogen bulb.", "text": "Replace with a new halogen bulb."}, {"self_ref": "#/texts/80", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 326.88608, "t": 468.92715, "r": 328.36884, "b": 467.18811, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "4.", "text": "4."}, {"self_ref": "#/texts/81", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 329.1102, "t": 468.92715, "r": 356.5412, "b": 467.18811, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 37]}], "orig": "Open the window in the base plate and", "text": "Open the window in the base plate and"}, {"self_ref": "#/texts/82", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 326.88608, "t": 467.31692999999996, "r": 350.13828, "b": 465.57791, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 27]}], "orig": "replace the halogen lamp or", "text": "replace the halogen lamp or"}, {"self_ref": "#/texts/83", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 326.88608, "t": 465.70673, "r": 351.59677, "b": 463.96768, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 31]}], "orig": "fluorescent lamp of transmitted", "text": "fluorescent lamp of transmitted"}, {"self_ref": "#/texts/84", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 326.88608, "t": 464.0965, "r": 336.89197, "b": 462.35748, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 12]}], "orig": "illuminator.", "text": "illuminator."}, {"self_ref": "#/texts/85", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 358.42023, "t": 528.50507, "r": 366.93256, "b": 526.76605, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 8]}], "orig": "FOCUSING", "text": "FOCUSING"}, {"self_ref": "#/texts/86", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 358.42023, "t": 526.89484, "r": 359.89841, "b": 525.15582, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "1.", "text": "1."}, {"self_ref": "#/texts/87", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 360.63751, "t": 526.89484, "r": 387.98407, "b": 525.15582, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 37]}], "orig": "Turn the focusing knob away or toward", "text": "Turn the focusing knob away or toward"}, {"self_ref": "#/texts/88", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 358.42023, "t": 525.28467, "r": 384.58948, "b": 523.54559, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 34]}], "orig": "you until a clear image is viewed.", "text": "you until a clear image is viewed."}, {"self_ref": "#/texts/89", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 358.42166, "t": 523.67444, "r": 359.78549, "b": 521.93542, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "2.", "text": "2."}, {"self_ref": "#/texts/90", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 360.46741, "t": 523.67444, "r": 384.33441, "b": 521.93542, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 35]}], "orig": "If the image is unclear, adjust the", "text": "If the image is unclear, adjust the"}, {"self_ref": "#/texts/91", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 358.4231, "t": 522.06421, "r": 384.61502, "b": 520.3252, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 34]}], "orig": "height of the elevator up or down,", "text": "height of the elevator up or down,"}, {"self_ref": "#/texts/92", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 358.4231, "t": 520.45398, "r": 385.38922, "b": 518.71497, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 34]}], "orig": "then turn the focusing knob again.", "text": "then turn the focusing knob again."}, {"self_ref": "#/texts/93", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 358.4231, "t": 517.23358, "r": 377.35046, "b": 515.49457, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 18]}], "orig": "ZOOM MAGNIFICATION", "text": "ZOOM MAGNIFICATION"}, {"self_ref": "#/texts/94", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 358.4231, "t": 515.62335, "r": 359.89429, "b": 513.88434, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "1.", "text": "1."}, {"self_ref": "#/texts/95", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 360.62988, "t": 515.62335, "r": 386.37589, "b": 513.88434, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 35]}], "orig": "Turn the zoom magnification knob to", "text": "Turn the zoom magnification knob to"}, {"self_ref": "#/texts/96", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 358.4231, "t": 514.01312, "r": 386.78732, "b": 512.27411, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 38]}], "orig": "the desired magnification and field of", "text": "the desired magnification and field of"}, {"self_ref": "#/texts/97", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 358.4231, "t": 512.40295, "r": 364.16855, "b": 510.66391, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 5]}], "orig": "view.", "text": "view."}, {"self_ref": "#/texts/98", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 358.4231, "t": 510.79272, "r": 359.86777, "b": 509.05368, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "2.", "text": "2."}, {"self_ref": "#/texts/99", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 360.59012, "t": 510.79272, "r": 387.31656, "b": 509.05368, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 37]}], "orig": "In most situations, it is recommended", "text": "In most situations, it is recommended"}, {"self_ref": "#/texts/100", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 358.4231, "t": 509.18249999999995, "r": 381.56656, "b": 507.44348, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 28]}], "orig": "that you focus at the lowest", "text": "that you focus at the lowest"}, {"self_ref": "#/texts/101", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 358.4231, "t": 507.5723, "r": 386.63403, "b": 505.83325, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 36]}], "orig": "magnification, then move to a higher", "text": "magnification, then move to a higher"}, {"self_ref": "#/texts/102", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 358.42453, "t": 505.96207, "r": 382.77115, "b": 504.22305, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 29]}], "orig": "magnification and re-focus as", "text": "magnification and re-focus as"}, {"self_ref": "#/texts/103", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 358.42453, "t": 504.35187, "r": 367.98694, "b": 502.61282, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 10]}], "orig": "necessary.", "text": "necessary."}, {"self_ref": "#/texts/104", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 358.42453, "t": 502.74164, "r": 359.80386, "b": 501.00262, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "3.", "text": "3."}, {"self_ref": "#/texts/105", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 360.49353, "t": 502.74164, "r": 386.70093, "b": 501.00262, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 38]}], "orig": "If the image is not clear to both eyes", "text": "If the image is not clear to both eyes"}, {"self_ref": "#/texts/106", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 358.42453, "t": 501.13144000000005, "r": 388.03534, "b": 499.3924, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 38]}], "orig": "at the same time, the diopter ring may", "text": "at the same time, the diopter ring may"}, {"self_ref": "#/texts/107", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 358.42453, "t": 499.52121, "r": 373.13724, "b": 497.7822, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 16]}], "orig": "need adjustment.", "text": "need adjustment."}, {"self_ref": "#/texts/108", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 358.42453, "t": 496.30078, "r": 381.74539, "b": 494.56177, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 23]}], "orig": "DIOPTER RING ADJUSTMENT", "text": "DIOPTER RING ADJUSTMENT"}, {"self_ref": "#/texts/109", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 358.42453, "t": 494.69058, "r": 359.83682, "b": 492.95154, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "1.", "text": "1."}, {"self_ref": "#/texts/110", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 360.54297, "t": 494.69058, "r": 388.08289, "b": 492.95154, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 39]}], "orig": "To adjust the eyepiece for viewing with", "text": "To adjust the eyepiece for viewing with"}, {"self_ref": "#/texts/111", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 358.42453, "t": 493.08035, "r": 382.73251, "b": 491.34134, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 29]}], "orig": "or without eyeglasses and for", "text": "or without eyeglasses and for"}, {"self_ref": "#/texts/112", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 358.42453, "t": 491.47015, "r": 387.72266, "b": 489.73110999999994, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 39]}], "orig": "differences in acuity between the right", "text": "differences in acuity between the right"}, {"self_ref": "#/texts/113", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 358.42453, "t": 489.85991999999993, "r": 384.1991, "b": 488.1209099999999, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 35]}], "orig": "and left eyes, follow the following", "text": "and left eyes, follow the following"}, {"self_ref": "#/texts/114", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 358.42453, "t": 488.24973, "r": 364.88672, "b": 486.51068, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 6]}], "orig": "steps:", "text": "steps:"}, {"self_ref": "#/texts/115", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 358.42453, "t": 486.6395, "r": 359.95078, "b": 484.90047999999996, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "a.", "text": "a."}, {"self_ref": "#/texts/116", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 361.47699, "t": 486.6395, "r": 386.65988, "b": 484.90047999999996, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 33]}], "orig": "Observe an image through the left", "text": "Observe an image through the left"}, {"self_ref": "#/texts/117", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 358.42453, "t": 485.0293, "r": 386.7634, "b": 483.29025, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 35]}], "orig": "eyepiece and bring a specific point", "text": "eyepiece and bring a specific point"}, {"self_ref": "#/texts/118", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 358.42453, "t": 483.41907, "r": 385.41354, "b": 481.68005, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 32]}], "orig": "into focus using the focus knob.", "text": "into focus using the focus knob."}, {"self_ref": "#/texts/119", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 358.42453, "t": 481.80887, "r": 359.93304, "b": 480.06982, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "b.", "text": "b."}, {"self_ref": "#/texts/120", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 361.44156, "t": 481.80887, "r": 382.56085, "b": 480.06982, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 27]}], "orig": "By turning the diopter ring", "text": "By turning the diopter ring"}, {"self_ref": "#/texts/121", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 358.42596, "t": 480.19864, "r": 385.4559, "b": 478.45963, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 33]}], "orig": "adjustment for the left eyepiece,", "text": "adjustment for the left eyepiece,"}, {"self_ref": "#/texts/122", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 358.42596, "t": 478.58844, "r": 384.56122, "b": 476.84940000000006, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 31]}], "orig": "bring the same point into sharp", "text": "bring the same point into sharp"}, {"self_ref": "#/texts/123", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 358.42596, "t": 476.97821000000005, "r": 366.74371, "b": 475.23920000000004, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 6]}], "orig": "focus.", "text": "focus."}, {"self_ref": "#/texts/124", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 358.42596, "t": 475.36801, "r": 383.93884, "b": 473.62897, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 32]}], "orig": "c.Then bring the same point into", "text": "c.Then bring the same point into"}, {"self_ref": "#/texts/125", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 358.42596, "t": 473.7577800000001, "r": 385.69241, "b": 472.0187700000001, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 32]}], "orig": "focus through the right eyepiece", "text": "focus through the right eyepiece"}, {"self_ref": "#/texts/126", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 358.42596, "t": 472.14757999999995, "r": 385.94861, "b": 470.40854, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 34]}], "orig": "by turning the right diopter ring.", "text": "by turning the right diopter ring."}, {"self_ref": "#/texts/127", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 358.42596, "t": 470.53735, "r": 385.54236, "b": 468.79834, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 33]}], "orig": "d.With more than one viewer, each", "text": "d.With more than one viewer, each"}, {"self_ref": "#/texts/128", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 358.42596, "t": 468.92715, "r": 382.98718, "b": 467.18811, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 28]}], "orig": "viewer should note their own", "text": "viewer should note their own"}, {"self_ref": "#/texts/129", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 358.42596, "t": 467.31692999999996, "r": 385.06448, "b": 465.57791, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 34]}], "orig": "diopter ring position for the left", "text": "diopter ring position for the left"}, {"self_ref": "#/texts/130", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 358.42596, "t": 465.70673, "r": 385.20682, "b": 463.96768, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 32]}], "orig": "and right eyepieces, then before", "text": "and right eyepieces, then before"}, {"self_ref": "#/texts/131", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 358.42596, "t": 464.0965, "r": 382.21964, "b": 462.35748, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 28]}], "orig": "viewing set the diopter ring", "text": "viewing set the diopter ring"}, {"self_ref": "#/texts/132", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 358.42596, "t": 462.4863, "r": 382.63382, "b": 460.74725, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 28]}], "orig": "adjustments to that setting.", "text": "adjustments to that setting."}, {"self_ref": "#/texts/133", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 358.42596, "t": 459.26587000000006, "r": 375.67661, "b": 457.52682000000004, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 17]}], "orig": "CHANGING THE BULB", "text": "CHANGING THE BULB"}, {"self_ref": "#/texts/134", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 358.42596, "t": 457.65564, "r": 359.90311, "b": 455.91663, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "1.", "text": "1."}, {"self_ref": "#/texts/135", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 360.64169, "t": 457.65564, "r": 385.75333, "b": 455.91663, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 34]}], "orig": "Disconnect the power cord from the", "text": "Disconnect the power cord from the"}, {"self_ref": "#/texts/136", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 358.42596, "t": 456.04544, "r": 372.01416, "b": 454.3064, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 18]}], "orig": "electrical outlet.", "text": "electrical outlet."}, {"self_ref": "#/texts/137", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 358.42596, "t": 454.43521, "r": 359.88327, "b": 452.6962, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "2.", "text": "2."}, {"self_ref": "#/texts/138", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 360.61191, "t": 454.43521, "r": 384.65726, "b": 452.6962, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 33]}], "orig": "When the bulb is cool, remove the", "text": "When the bulb is cool, remove the"}, {"self_ref": "#/texts/139", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 358.42596, "t": 452.82501, "r": 385.33649, "b": 451.0859699999999, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 34]}], "orig": "oblique illuminator cap and remove", "text": "oblique illuminator cap and remove"}, {"self_ref": "#/texts/140", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 358.42596, "t": 451.21478, "r": 379.57224, "b": 449.47577, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 26]}], "orig": "the halogen bulb with cap.", "text": "the halogen bulb with cap."}, {"self_ref": "#/texts/141", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 358.4274, "t": 449.60458, "r": 359.91788, "b": 447.86553999999995, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "3.", "text": "3."}, {"self_ref": "#/texts/142", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 360.66312, "t": 449.60458, "r": 384.5108, "b": 447.86553999999995, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 32]}], "orig": "Replace with a new halogen bulb.", "text": "Replace with a new halogen bulb."}, {"self_ref": "#/texts/143", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 358.42883, "t": 447.99434999999994, "r": 359.92792, "b": 446.25534, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "4.", "text": "4."}, {"self_ref": "#/texts/144", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 360.67746, "t": 447.99434999999994, "r": 385.41235, "b": 446.25534, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 33]}], "orig": "Open the window in the base plate", "text": "Open the window in the base plate"}, {"self_ref": "#/texts/145", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 358.42883, "t": 446.38416, "r": 383.2782, "b": 444.64511, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 31]}], "orig": "and replace the halogen lamp or", "text": "and replace the halogen lamp or"}, {"self_ref": "#/texts/146", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 358.42883, "t": 444.77393, "r": 383.13953, "b": 443.03491, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 31]}], "orig": "fluorescent lamp of transmitted", "text": "fluorescent lamp of transmitted"}, {"self_ref": "#/texts/147", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 358.42883, "t": 443.16373, "r": 368.43472, "b": 441.42468, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 12]}], "orig": "illuminator.", "text": "illuminator."}, {"self_ref": "#/texts/148", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 326.59567, "t": 530.85815, "r": 339.11377, "b": 529.11908, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 13]}], "orig": "Model AY11230", "text": "Model AY11230"}, {"self_ref": "#/texts/149", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 358.48605, "t": 530.85815, "r": 371.00415, "b": 529.11908, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 13]}], "orig": "Model AY11234", "text": "Model AY11234"}, {"self_ref": "#/texts/150", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 455.43533, "t": 440.22961000000004, "r": 457.97827000000007, "b": 438.05585, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "14", "text": "14"}, {"self_ref": "#/texts/151", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 408.24518, "t": 516.47327, "r": 414.4234, "b": 515.03979, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 10]}], "orig": "Objectives", "text": "Objectives"}, {"self_ref": "#/texts/152", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 409.39554, "t": 523.01764, "r": 419.06677, "b": 521.58417, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 16]}], "orig": "Revolving Turret", "text": "Revolving Turret"}, {"self_ref": "#/texts/153", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 441.3895, "t": 512.87372, "r": 445.87192, "b": 511.44025, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 6]}], "orig": "Coarse", "text": "Coarse"}, {"self_ref": "#/texts/154", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 441.3895, "t": 511.69391, "r": 448.22338999999994, "b": 510.2604099999999, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 10]}], "orig": "Adjustment", "text": "Adjustment"}, {"self_ref": "#/texts/155", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 441.3895, "t": 510.51407, "r": 444.40371999999996, "b": 509.08060000000006, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "Knob", "text": "Knob"}, {"self_ref": "#/texts/156", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 398.79288, "t": 537.05353, "r": 428.91568, "b": 533.14069, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 13]}], "orig": "MODEL AY11236", "text": "MODEL AY11236"}, {"self_ref": "#/texts/157", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 398.32535, "t": 486.95709, "r": 435.93542, "b": 483.04427999999996, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 16]}], "orig": "MICROSCOPE USAGE", "text": "MICROSCOPE USAGE"}, {"self_ref": "#/texts/158", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 398.08594, "t": 481.64108, "r": 453.72171, "b": 479.46729, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 55]}], "orig": "BARSKA Model AY11236 is a powerful fixed power compound", "text": "BARSKA Model AY11236 is a powerful fixed power compound"}, {"self_ref": "#/texts/159", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 398.08594, "t": 479.49414, "r": 453.09939999999995, "b": 477.32034, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 59]}], "orig": "microscope designed for biological studies such as specimen", "text": "microscope designed for biological studies such as specimen"}, {"self_ref": "#/texts/160", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 398.08594, "t": 477.3472, "r": 456.65246999999994, "b": 475.1734, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 59]}], "orig": "examination. It can also be used for examining bacteria and", "text": "examination. It can also be used for examining bacteria and"}, {"self_ref": "#/texts/161", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 398.08594, "t": 475.20023, "r": 456.73859000000004, "b": 473.02646, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 67]}], "orig": "for general clinical and medical studies and other scientific uses.", "text": "for general clinical and medical studies and other scientific uses."}, {"self_ref": "#/texts/162", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 398.62399, "t": 471.57059, "r": 427.77472, "b": 467.65777999999995, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 12]}], "orig": "CONSTRUCTION", "text": "CONSTRUCTION"}, {"self_ref": "#/texts/163", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 398.08594, "t": 465.53930999999994, "r": 456.02639999999997, "b": 463.36551, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 58]}], "orig": "BARSKA Model AY11236 is a fixed power compound microscope.", "text": "BARSKA Model AY11236 is a fixed power compound microscope."}, {"self_ref": "#/texts/164", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 398.08414, "t": 463.3923300000001, "r": 455.42238999999995, "b": 461.2185400000001, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 65]}], "orig": "It is constructed with two optical paths at the same angle. It is", "text": "It is constructed with two optical paths at the same angle. It is"}, {"self_ref": "#/texts/165", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 398.08414, "t": 461.24539, "r": 457.39844, "b": 459.07159, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 65]}], "orig": "equipped with transmitted illumination. By using this instrument,", "text": "equipped with transmitted illumination. By using this instrument,"}, {"self_ref": "#/texts/166", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 398.08414, "t": 459.09845, "r": 453.97745, "b": 456.92464999999993, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 59]}], "orig": "the user can observe specimens at magnification from 40x to", "text": "the user can observe specimens at magnification from 40x to"}, {"self_ref": "#/texts/167", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 398.08414, "t": 456.95148, "r": 454.70708999999994, "b": 454.77768, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 62]}], "orig": "1000x by selecting the desired objective lens. Coarse and fine", "text": "1000x by selecting the desired objective lens. Coarse and fine"}, {"self_ref": "#/texts/168", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 398.08414, "t": 454.80453, "r": 458.90240000000006, "b": 452.63074, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 65]}], "orig": "focus adjustments provide accuracy and image detail. The rotating", "text": "focus adjustments provide accuracy and image detail. The rotating"}, {"self_ref": "#/texts/169", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 398.08594, "t": 452.65759, "r": 453.0672, "b": 450.4838, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 58]}], "orig": "head allows the user to position the eyepieces for maximum", "text": "head allows the user to position the eyepieces for maximum"}, {"self_ref": "#/texts/170", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 398.08594, "t": 450.51062, "r": 449.63113, "b": 448.33682, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 56]}], "orig": "viewing comfort and easy access to all adjustment knobs.", "text": "viewing comfort and easy access to all adjustment knobs."}, {"self_ref": "#/texts/171", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 422.10626, "t": 490.75809, "r": 434.62433000000004, "b": 489.01904, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 13]}], "orig": "Model AY11236", "text": "Model AY11236"}, {"self_ref": "#/texts/172", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 442.01610999999997, "t": 508.91351, "r": 444.8817399999999, "b": 507.48004, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "Fine", "text": "Fine"}, {"self_ref": "#/texts/173", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 442.01610999999997, "t": 507.7337, "r": 448.85001, "b": 506.30019999999996, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 10]}], "orig": "Adjustment", "text": "Adjustment"}, {"self_ref": "#/texts/174", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 442.01610999999997, "t": 506.55389, "r": 445.03033000000005, "b": 505.12039, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "Knob", "text": "Knob"}, {"self_ref": "#/texts/175", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 408.00577, "t": 512.87421, "r": 411.42212, "b": 511.4407, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 5]}], "orig": "Stage", "text": "Stage"}, {"self_ref": "#/texts/176", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 404.07172, "t": 511.0855700000001, "r": 410.77707, "b": 509.6521, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 9]}], "orig": "Condenser", "text": "Condenser"}, {"self_ref": "#/texts/177", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 404.07172, "t": 509.90576, "r": 409.2157, "b": 508.47226, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 8]}], "orig": "Focusing", "text": "Focusing"}, {"self_ref": "#/texts/178", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 404.07172, "t": 508.72592, "r": 407.08594, "b": 507.2924499999999, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "Knob", "text": "Knob"}, {"self_ref": "#/texts/179", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 441.81281, "t": 529.67822, "r": 447.03702, "b": 528.24475, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 8]}], "orig": "Eyepiece", "text": "Eyepiece"}, {"self_ref": "#/texts/180", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 437.34607, "t": 520.86975, "r": 440.80496, "b": 519.43719, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 5]}], "orig": "Stand", "text": "Stand"}, {"self_ref": "#/texts/181", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 409.7164, "t": 507.59973, "r": 413.3768, "b": 506.16718, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "Lamp", "text": "Lamp"}, {"self_ref": "#/texts/182", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 409.7164, "t": 506.16837, "r": 413.68201, "b": 504.73584, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 6]}], "orig": "On/Off", "text": "On/Off"}, {"self_ref": "#/texts/183", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 409.7164, "t": 504.737, "r": 413.6337, "b": 503.30447, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 6]}], "orig": "Switch", "text": "Switch"}, {"self_ref": "#/texts/184", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 434.8712499999999, "t": 495.2847, "r": 438.53164999999996, "b": 493.85217, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "Lamp", "text": "Lamp"}, {"self_ref": "#/texts/185", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 439.52039, "t": 499.81692999999996, "r": 443.08768, "b": 498.38439999999997, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 5]}], "orig": "Power", "text": "Power"}, {"self_ref": "#/texts/186", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 439.52039, "t": 498.38556, "r": 442.29575, "b": 496.95303, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "Cord", "text": "Cord"}, {"self_ref": "#/texts/187", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 413.55829, "t": 527.33911, "r": 421.94913, "b": 525.90656, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 13]}], "orig": "Rotating Head", "text": "Rotating Head"}, {"self_ref": "#/texts/188", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 441.84316999999993, "t": 505.09427, "r": 447.87585000000007, "b": 503.66174, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 10]}], "orig": "Stage Clip", "text": "Stage Clip"}, {"self_ref": "#/texts/189", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 441.84316999999993, "t": 503.6629, "r": 448.67252, "b": 502.23037999999997, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 10]}], "orig": "Adjustment", "text": "Adjustment"}, {"self_ref": "#/texts/190", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 407.2403, "t": 532.13354, "r": 425.79089, "b": 530.70105, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 31]}], "orig": "Interpupillary Slide Adjustment", "text": "Interpupillary Slide Adjustment"}, {"self_ref": "#/texts/191", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 449.10074000000003, "t": 413.33698, "r": 466.08835000000005, "b": 411.21588, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 17]}], "orig": "Circling Minimums", "text": "Circling Minimums"}, {"self_ref": "#/texts/192", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 449.10074000000003, "t": 408.7796000000001, "r": 449.64444, "b": 406.65851000000004, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "7", "text": "7"}, {"self_ref": "#/texts/193", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 450.18811, "t": 408.7796000000001, "r": 550.77124, "b": 406.65851000000004, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 184]}], "orig": "K H U H Z D V D F K D Q J H W R W K H 7 ( 5 3 6 F U L W H U L D L Q W K D W D \u1087H F W V F L U F O L Q J D U H D G L P H Q V L R Q E \\ H [ S D Q G L Q J W K H D U H D V W R S U R Y L G H", "text": "K H U H Z D V D F K D Q J H W R W K H 7 ( 5 3 6 F U L W H U L D L Q W K D W D \u1087H F W V F L U F O L Q J D U H D G L P H Q V L R Q E \\ H [ S D Q G L Q J W K H D U H D V W R S U R Y L G H"}, {"self_ref": "#/texts/194", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 449.10074000000003, "t": 406.24268, "r": 536.14716, "b": 404.12158, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 104]}], "orig": "improved obstacle protection. To indicate that the new criteria had been applied to a given procedure, a", "text": "improved obstacle protection. To indicate that the new criteria had been applied to a given procedure, a"}, {"self_ref": "#/texts/195", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 538.31085, "t": 406.24268, "r": 549.49921, "b": 404.12158, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 12]}], "orig": "is placed on", "text": "is placed on"}, {"self_ref": "#/texts/196", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 449.10074000000003, "t": 403.96399, "r": 547.58185, "b": 401.8429, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 119]}], "orig": "the circling line of minimums. The new circling tables and explanatory information is located in the Legend of the TPP.", "text": "the circling line of minimums. The new circling tables and explanatory information is located in the Legend of the TPP."}, {"self_ref": "#/texts/197", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 449.10074000000003, "t": 398.7871999999999, "r": 449.6163, "b": 396.66614, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "7", "text": "7"}, {"self_ref": "#/texts/198", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 450.1319, "t": 398.7871999999999, "r": 529.53082, "b": 396.66614, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 153]}], "orig": "K H D S S U R D F K H V X V L Q J V W D Q G D U G F L U F O L Q J D S S U R D F K D U H D V F D Q E H L G H Q W L \u00bf H G E \\ W K H D E V H Q F H R I W K H", "text": "K H D S S U R D F K H V X V L Q J V W D Q G D U G F L U F O L Q J D S S U R D F K D U H D V F D Q E H L G H Q W L \u00bf H G E \\ W K H D E V H Q F H R I W K H"}, {"self_ref": "#/texts/199", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 532.05829, "t": 398.7871999999999, "r": 550.42261, "b": 396.66614, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 23]}], "orig": "on the circling line of", "text": "on the circling line of"}, {"self_ref": "#/texts/200", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 449.10074000000003, "t": 396.50851, "r": 455.74692, "b": 394.38745, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 7]}], "orig": "minima.", "text": "minima."}, {"self_ref": "#/texts/201", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 449.95525999999995, "t": 376.40451, "r": 496.2829, "b": 374.49554, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 101]}], "orig": "$ S S O \\ 6 W D Q G D U G & L U F O L Q J $ S S U R D F K 0 D Q H X Y H U L Q J 5 D G L X V 7 D E O H", "text": "$ S S O \\ 6 W D Q G D U G & L U F O L Q J $ S S U R D F K 0 D Q H X Y H U L Q J 5 D G L X V 7 D E O H"}, {"self_ref": "#/texts/202", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 501.13077, "t": 382.74457, "r": 551.16101, "b": 380.8356, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 107]}], "orig": "$ S S O \\ ( [ S D Q G H G & L U F O L Q J $ S S U R D F K 0 D Q H X Y H U L Q J $ L U V S D F H 5 D G L X V", "text": "$ S S O \\ ( [ S D Q G H G & L U F O L Q J $ S S U R D F K 0 D Q H X Y H U L Q J $ L U V S D F H 5 D G L X V"}, {"self_ref": "#/texts/203", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 501.13077, "t": 380.69376, "r": 505.2477999999999, "b": 378.78479, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 5]}], "orig": "Table", "text": "Table"}, {"self_ref": "#/texts/204", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 449.10074000000003, "t": 371.81198, "r": 469.35599, "b": 369.26669, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 14]}], "orig": "AIRPORT SKETCH", "text": "AIRPORT SKETCH"}, {"self_ref": "#/texts/205", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 449.10074000000003, "t": 366.91092, "r": 525.93616, "b": 364.78983, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 92]}], "orig": "The airport sketch is a depiction of the airport with emphasis on runway pattern and related", "text": "The airport sketch is a depiction of the airport with emphasis on runway pattern and related"}, {"self_ref": "#/texts/206", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 449.10074000000003, "t": 364.6322, "r": 522.0343, "b": 362.51114, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 94]}], "orig": "information, positioned in either the lower left or lower right corner of the chart to aid pi-", "text": "information, positioned in either the lower left or lower right corner of the chart to aid pi-"}, {"self_ref": "#/texts/207", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 449.10074000000003, "t": 362.35352, "r": 524.67151, "b": 360.23245, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 92]}], "orig": "lot recognition of the airport from the air and to provide some information to aid on ground", "text": "lot recognition of the airport from the air and to provide some information to aid on ground"}, {"self_ref": "#/texts/208", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 449.10074000000003, "t": 360.07485999999994, "r": 527.172, "b": 357.95377, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 92]}], "orig": "navigation of the airport. The runways are drawn to scale and oriented to true north. Runway", "text": "navigation of the airport. The runways are drawn to scale and oriented to true north. Runway"}, {"self_ref": "#/texts/209", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 449.10074000000003, "t": 357.79617, "r": 502.39545, "b": 355.67508, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 63]}], "orig": "dimensions (length and width) are shown for all active runways.", "text": "dimensions (length and width) are shown for all active runways."}, {"self_ref": "#/texts/210", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 449.10074000000003, "t": 353.2388000000001, "r": 512.92676, "b": 351.11771000000005, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 73]}], "orig": "Runway(s) are depicted based on what type and construction of the runway.", "text": "Runway(s) are depicted based on what type and construction of the runway."}, {"self_ref": "#/texts/211", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 449.95525999999995, "t": 347.92999, "r": 460.02307, "b": 346.02099999999996, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 12]}], "orig": "Hard Surface", "text": "Hard Surface"}, {"self_ref": "#/texts/212", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 464.89963, "t": 347.92999, "r": 473.98819, "b": 346.02099999999996, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 10]}], "orig": "Other Than", "text": "Other Than"}, {"self_ref": "#/texts/213", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 464.89963, "t": 345.87915, "r": 474.96744, "b": 343.97021, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 12]}], "orig": "Hard Surface", "text": "Hard Surface"}, {"self_ref": "#/texts/214", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 478.91357, "t": 347.92999, "r": 489.45648, "b": 346.02099999999996, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 13]}], "orig": "Metal Surface", "text": "Metal Surface"}, {"self_ref": "#/texts/215", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 493.06420999999995, "t": 347.92999, "r": 505.03076, "b": 346.02099999999996, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 13]}], "orig": "Closed Runway", "text": "Closed Runway"}, {"self_ref": "#/texts/216", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 509.5809, "t": 347.92999, "r": 524.30237, "b": 346.02099999999996, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 18]}], "orig": "Under Construction", "text": "Under Construction"}, {"self_ref": "#/texts/217", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 449.95525999999995, "t": 337.18793, "r": 458.31406, "b": 335.27896, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 9]}], "orig": "Stopways,", "text": "Stopways,"}, {"self_ref": "#/texts/218", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 449.95525999999995, "t": 335.13712, "r": 461.92083999999994, "b": 333.22814999999997, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 15]}], "orig": "Taxiways, Park-", "text": "Taxiways, Park-"}, {"self_ref": "#/texts/219", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 449.95525999999995, "t": 333.08627, "r": 457.08014, "b": 331.17731000000003, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 9]}], "orig": "ing Areas", "text": "ing Areas"}, {"self_ref": "#/texts/220", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 464.89963, "t": 337.18793, "r": 472.87732, "b": 335.27896, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 9]}], "orig": "Displaced", "text": "Displaced"}, {"self_ref": "#/texts/221", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 464.89963, "t": 335.13712, "r": 472.49792, "b": 333.22814999999997, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 9]}], "orig": "Threshold", "text": "Threshold"}, {"self_ref": "#/texts/222", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 478.91357, "t": 337.18793, "r": 483.61584, "b": 335.27896, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 6]}], "orig": "Closed", "text": "Closed"}, {"self_ref": "#/texts/223", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 478.91357, "t": 335.13712, "r": 486.60754000000003, "b": 333.22814999999997, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 8]}], "orig": "Pavement", "text": "Pavement"}, {"self_ref": "#/texts/224", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 493.06420999999995, "t": 337.18793, "r": 504.20648, "b": 335.27896, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 12]}], "orig": "Water Runway", "text": "Water Runway"}, {"self_ref": "#/texts/225", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 449.10074000000003, "t": 322.67026, "r": 548.59674, "b": 320.54919, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 110]}], "orig": "Taxiways and aprons are shaded grey. Other runway features that may be shown are runway numbers, runway dimen-", "text": "Taxiways and aprons are shaded grey. Other runway features that may be shown are runway numbers, runway dimen-"}, {"self_ref": "#/texts/226", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 449.10074000000003, "t": 320.39157, "r": 500.08181999999994, "b": 318.27051, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 61]}], "orig": "sions, runway slope, arresting gear, and displaced threshold.", "text": "sions, runway slope, arresting gear, and displaced threshold."}, {"self_ref": "#/texts/227", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 449.10074000000003, "t": 315.83423, "r": 449.59933000000007, "b": 313.71313, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "2", "text": "2"}, {"self_ref": "#/texts/228", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 450.09796, "t": 315.83423, "r": 547.82562, "b": 313.71313, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 195]}], "orig": "W K H U L Q I R U P D W L R Q F R Q F H U Q L Q J O L J K W L Q J \u00bf Q D O D S S U R D F K E H D U L Q J V D L U S R U W E H D F R Q R E V W D F O H V F R Q W U R O W R Z H U 1 $ 9 $ , ' V K H O L", "text": "W K H U L Q I R U P D W L R Q F R Q F H U Q L Q J O L J K W L Q J \u00bf Q D O D S S U R D F K E H D U L Q J V D L U S R U W E H D F R Q R E V W D F O H V F R Q W U R O W R Z H U 1 $ 9 $ , ' V K H O L"}, {"self_ref": "#/texts/229", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 547.82623, "t": 315.83423, "r": 548.45862, "b": 313.71313, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "-", "text": "-"}, {"self_ref": "#/texts/230", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 449.10074000000003, "t": 313.55554, "r": 470.52609000000007, "b": 311.43445, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 23]}], "orig": "pads may also be shown.", "text": "pads may also be shown."}, {"self_ref": "#/texts/231", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 449.10074000000003, "t": 308.99817, "r": 493.37906000000004, "b": 306.87708, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 81]}], "orig": "$ L U S R U W ( O H Y D W L R Q D Q G 7 R X F K G R Z Q = R Q H ( O H Y D W L R Q", "text": "$ L U S R U W ( O H Y D W L R Q D Q G 7 R X F K G R Z Q = R Q H ( O H Y D W L R Q"}, {"self_ref": "#/texts/232", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 449.10074000000003, "t": 304.4408, "r": 551.80023, "b": 295.48364, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 496]}], "orig": "The airport elevation is shown enclosed within a box in the upper left corner of the sketch box and the touchdown zone elevation (TDZE) is shown in the upper right corner of the sketch box. The airport elevation is the highest point of an D L U S R U W \u00b6 V X V D E O H U X Q Z D \\ V P H D V X U H G L Q I H H W I U R P P H D Q V H D O H Y H O 7 K H 7 ' = ( L V W K H K L J K H V W H O H Y D W L R Q L Q W K H \u00bf U V W I H H W R I the landing surface. Circling only approaches will not show a TDZE.", "text": "The airport elevation is shown enclosed within a box in the upper left corner of the sketch box and the touchdown zone elevation (TDZE) is shown in the upper right corner of the sketch box. The airport elevation is the highest point of an D L U S R U W \u00b6 V X V D E O H U X Q Z D \\ V P H D V X U H G L Q I H H W I U R P P H D Q V H D O H Y H O 7 K H 7 ' = ( L V W K H K L J K H V W H O H Y D W L R Q L Q W K H \u00bf U V W I H H W R I the landing surface. Circling only approaches will not show a TDZE."}, {"self_ref": "#/texts/233", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 498.80661000000003, "t": 276.05629999999996, "r": 502.08792, "b": 272.98235999999997, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 3]}], "orig": "114", "text": "114"}, {"self_ref": "#/texts/234", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 444.56319999999994, "t": 369.15131, "r": 446.25998, "b": 320.12872, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 70]}], "orig": "FAA Chart Users\u2019 Guide - Terminal Procedures Publication (TPP) - Terms", "text": "FAA Chart Users\u2019 Guide - Terminal Procedures Publication (TPP) - Terms"}, {"self_ref": "#/texts/235", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 329.40536, "t": 412.62463, "r": 355.13138, "b": 409.86664, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 27]}], "orig": "AGL 2013 Financial Calendar", "text": "AGL 2013 Financial Calendar"}, {"self_ref": "#/texts/236", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 329.40536, "t": 409.69727, "r": 330.96848, "b": 407.44073, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "22", "text": "22"}, {"self_ref": "#/texts/237", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 331.75003, "t": 409.69727, "r": 341.12875, "b": 407.44073, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 11]}], "orig": "August 2012", "text": "August 2012"}, {"self_ref": "#/texts/238", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 350.4722, "t": 409.69727, "r": 384.81079, "b": 407.44073, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 51]}], "orig": "2012 full year result and fi nal dividend announced", "text": "2012 full year result and fi nal dividend announced"}, {"self_ref": "#/texts/239", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 329.40536, "t": 407.15448, "r": 330.97336, "b": 404.89795, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "30", "text": "30"}, {"self_ref": "#/texts/240", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 331.75735, "t": 407.15448, "r": 341.16534, "b": 404.89795, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 11]}], "orig": "August 2012", "text": "August 2012"}, {"self_ref": "#/texts/241", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 350.4722, "t": 407.15448, "r": 372.90613, "b": 404.89795, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 29]}], "orig": "Ex-dividend trading commences", "text": "Ex-dividend trading commences"}, {"self_ref": "#/texts/242", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 329.40536, "t": 404.61172, "r": 330.20337, "b": 402.35516000000007, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "5", "text": "5"}, {"self_ref": "#/texts/243", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 331.00137, "t": 404.61172, "r": 342.9715, "b": 402.35516000000007, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 14]}], "orig": "September 2012", "text": "September 2012"}, {"self_ref": "#/texts/244", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 350.4722, "t": 404.61172, "r": 374.88693, "b": 402.35516000000007, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 36]}], "orig": "Record date for 2012 fi nal dividend", "text": "Record date for 2012 fi nal dividend"}, {"self_ref": "#/texts/245", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 329.40536, "t": 402.06897, "r": 331.0173, "b": 399.81238, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "27", "text": "27"}, {"self_ref": "#/texts/246", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 331.82327, "t": 402.06897, "r": 343.91284, "b": 399.81238, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 14]}], "orig": "September 2012", "text": "September 2012"}, {"self_ref": "#/texts/247", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 350.4722, "t": 402.06897, "r": 365.65988, "b": 399.81238, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 22]}], "orig": "Final dividend payable", "text": "Final dividend payable"}, {"self_ref": "#/texts/248", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 329.40536, "t": 399.52618, "r": 330.98804, "b": 397.26962000000003, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "23", "text": "23"}, {"self_ref": "#/texts/249", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 331.77936, "t": 399.52618, "r": 342.06674, "b": 397.26962000000003, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 12]}], "orig": "October 2012", "text": "October 2012"}, {"self_ref": "#/texts/250", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 350.4722, "t": 399.52618, "r": 367.22156, "b": 397.26962000000003, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 22]}], "orig": "Annual General Meeting", "text": "Annual General Meeting"}, {"self_ref": "#/texts/251", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 329.40536, "t": 396.9834, "r": 330.99741, "b": 394.72687, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "27", "text": "27"}, {"self_ref": "#/texts/252", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 331.7934, "t": 396.9834, "r": 342.1416, "b": 394.72687, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 13]}], "orig": "February 2013", "text": "February 2013"}, {"self_ref": "#/texts/253", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 342.64841, "t": 396.81702, "r": 342.65811, "b": 395.50142999999997, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "1", "text": "1"}, {"self_ref": "#/texts/254", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 350.47177, "t": 396.98526, "r": 386.25897, "b": 394.7287, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 50]}], "orig": "2013 interim result and interim dividend announced", "text": "2013 interim result and interim dividend announced"}, {"self_ref": "#/texts/255", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 329.40491, "t": 394.44250000000005, "r": 331.02695, "b": 392.18594, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "28", "text": "28"}, {"self_ref": "#/texts/256", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 331.83795, "t": 394.44250000000005, "r": 340.75909, "b": 392.18594, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 11]}], "orig": "August 2013", "text": "August 2013"}, {"self_ref": "#/texts/257", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 341.26437, "t": 394.2746, "r": 341.27408, "b": 392.95905, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "1", "text": "1"}, {"self_ref": "#/texts/258", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 350.47144, "t": 394.44287, "r": 385.93265, "b": 392.18631, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 52]}], "orig": "2013 full year results and fi nal dividend announced", "text": "2013 full year results and fi nal dividend announced"}, {"self_ref": "#/texts/259", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 329.40536, "t": 391.53845, "r": 329.87708, "b": 390.03412, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "1", "text": "1"}, {"self_ref": "#/texts/260", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 330.34882, "t": 391.53845, "r": 358.65204, "b": 390.03412, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 60]}], "orig": "Indicative dates only, subject to change/Board confi rmation", "text": "Indicative dates only, subject to change/Board confi rmation"}, {"self_ref": "#/texts/261", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 329.40536, "t": 387.65497, "r": 391.771, "b": 385.39844, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 87]}], "orig": "AGL\u2019s Annual General Meeting will be held at the City Recital Hall, Angel Place, Sydney", "text": "AGL\u2019s Annual General Meeting will be held at the City Recital Hall, Angel Place, Sydney"}, {"self_ref": "#/texts/262", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 329.40536, "t": 385.62143, "r": 369.65308, "b": 383.36486999999994, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 49]}], "orig": "commencing at 10.30am on Tuesday 23 October 2012.", "text": "commencing at 10.30am on Tuesday 23 October 2012."}, {"self_ref": "#/texts/263", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 363.54486, "t": 331.46945000000005, "r": 379.25955, "b": 326.45493, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 13]}], "orig": "Ye s te rd ay", "text": "Ye s te rd ay"}, {"self_ref": "#/texts/264", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 363.54486, "t": 325.2843, "r": 391.38229, "b": 323.02777, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 39]}], "orig": "Established in Sydney in 1837, and then", "text": "Established in Sydney in 1837, and then"}, {"self_ref": "#/texts/265", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 363.54486, "t": 323.25076, "r": 395.01788, "b": 320.99423, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 42]}], "orig": "known as The Australian Gas Light Company,", "text": "known as The Australian Gas Light Company,"}, {"self_ref": "#/texts/266", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 363.54486, "t": 321.21719, "r": 394.08322, "b": 318.96066, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 43]}], "orig": "the AGL business has an established history", "text": "the AGL business has an established history"}, {"self_ref": "#/texts/267", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 363.54486, "t": 319.18365, "r": 390.60727, "b": 316.92712, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 38]}], "orig": "and reputation for serving the gas and", "text": "and reputation for serving the gas and"}, {"self_ref": "#/texts/268", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 363.54486, "t": 317.15012, "r": 393.49612, "b": 314.89355, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 43]}], "orig": "electricity needs of Australian households.", "text": "electricity needs of Australian households."}, {"self_ref": "#/texts/269", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 363.54486, "t": 315.11655, "r": 394.11481, "b": 312.86002, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 43]}], "orig": "In 1841, when AGL supplied the gas to light", "text": "In 1841, when AGL supplied the gas to light"}, {"self_ref": "#/texts/270", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 363.54486, "t": 313.08301, "r": 393.75891, "b": 310.82648, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 46]}], "orig": "the fi rst public street lamp, it was reported", "text": "the fi rst public street lamp, it was reported"}, {"self_ref": "#/texts/271", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 363.54486, "t": 311.04947, "r": 390.4975, "b": 308.79291, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 37]}], "orig": "in the Sydney Gazette as a \u201cwonderful", "text": "in the Sydney Gazette as a \u201cwonderful"}, {"self_ref": "#/texts/272", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 363.54486, "t": 309.0159, "r": 395.70975, "b": 306.75937, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 46]}], "orig": "achievement of scientifi c knowledge, assisted", "text": "achievement of scientifi c knowledge, assisted"}, {"self_ref": "#/texts/273", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 363.54486, "t": 306.98236, "r": 394.27283, "b": 304.7258, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 43]}], "orig": "by mechanical ingenuity.\u201d Within two years,", "text": "by mechanical ingenuity.\u201d Within two years,"}, {"self_ref": "#/texts/274", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 363.54486, "t": 304.94879, "r": 396.65939, "b": 302.69226, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 47]}], "orig": "165 gas lamps were lighting the City of Sydney.", "text": "165 gas lamps were lighting the City of Sydney."}, {"self_ref": "#/texts/275", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 329.4054, "t": 372.06876, "r": 384.19696, "b": 360.90588, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 15]}], "orig": "Looking back on", "text": "Looking back on"}, {"self_ref": "#/texts/276", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 329.4054, "t": 361.89621, "r": 372.16626, "b": 350.73331, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 12]}], "orig": "175 years of", "text": "175 years of"}, {"self_ref": "#/texts/277", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 329.4054, "t": 351.72363000000007, "r": 385.3981, "b": 340.56076, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 16]}], "orig": "looking forward.", "text": "looking forward."}, {"self_ref": "#/texts/278", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 329.40536, "t": 419.83841, "r": 353.36179, "b": 418.08331, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 37]}], "orig": "AGL Energy Limited ABN 74 115 061 375", "text": "AGL Energy Limited ABN 74 115 061 375"}, {"self_ref": "#/texts/279", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 546.20587, "t": 431.09552, "r": 548.23407, "b": 429.17758, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "29", "text": "29"}, {"self_ref": "#/texts/280", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 497.77728, "t": 540.56616, "r": 542.8255, "b": 537.05615, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 32]}], "orig": "signs, signals and road markings", "text": "signs, signals and road markings"}, {"self_ref": "#/texts/281", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 490.30679, "t": 540.52521, "r": 492.09982, "b": 537.0152, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "3", "text": "3"}, {"self_ref": "#/texts/282", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 498.15335, "t": 528.11078, "r": 500.05637, "b": 526.07281, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "In", "text": "In"}, {"self_ref": "#/texts/283", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 500.05637, "t": 528.14282, "r": 524.37036, "b": 526.1369, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 31]}], "orig": "chapter 2, you and your vehicle", "text": "chapter 2, you and your vehicle"}, {"self_ref": "#/texts/284", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 524.37036, "t": 528.11078, "r": 539.89124, "b": 526.07281, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 19]}], "orig": ", you learned about", "text": ", you learned about"}, {"self_ref": "#/texts/285", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 498.15335, "t": 526.06775, "r": 544.50403, "b": 524.02979, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 61]}], "orig": "some of the controls in your vehicle. This chapter is a handy", "text": "some of the controls in your vehicle. This chapter is a handy"}, {"self_ref": "#/texts/286", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 498.15335, "t": 524.02466, "r": 544.01343, "b": 521.98669, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 56]}], "orig": "reference section that gives examples of the most common", "text": "reference section that gives examples of the most common"}, {"self_ref": "#/texts/287", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 498.15335, "t": 521.98169, "r": 544.11987, "b": 519.94366, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 61]}], "orig": "signs, signals and road markings that keep traffi c organized", "text": "signs, signals and road markings that keep traffi c organized"}, {"self_ref": "#/texts/288", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 498.15335, "t": 519.9386, "r": 515.41071, "b": 517.90063, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 21]}], "orig": "and flowing smoothly.", "text": "and flowing smoothly."}, {"self_ref": "#/texts/289", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 498.15335, "t": 514.65381, "r": 505.64642000000003, "b": 511.0643, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 5]}], "orig": "Signs", "text": "Signs"}, {"self_ref": "#/texts/290", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 498.15335, "t": 510.17813, "r": 543.92957, "b": 508.14017, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 62]}], "orig": "There are three ways to read signs: by their shape, colour and", "text": "There are three ways to read signs: by their shape, colour and"}, {"self_ref": "#/texts/291", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 498.15335, "t": 508.1351, "r": 545.67834, "b": 506.09711, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 60]}], "orig": "the messages printed on them. Understanding these three ways", "text": "the messages printed on them. Understanding these three ways"}, {"self_ref": "#/texts/292", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 498.15335, "t": 506.09204, "r": 545.26471, "b": 504.05408, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 66]}], "orig": "of classifying signs will help you figure out the meaning of signs", "text": "of classifying signs will help you figure out the meaning of signs"}, {"self_ref": "#/texts/293", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 498.15335, "t": 504.04901, "r": 513.31335, "b": 502.01105, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 20]}], "orig": "that are new to you.", "text": "that are new to you."}, {"self_ref": "#/texts/294", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 505.43439, "t": 488.92404, "r": 508.53033000000005, "b": 487.10361, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "Stop", "text": "Stop"}, {"self_ref": "#/texts/295", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 527.45502, "t": 488.74646, "r": 541.44678, "b": 486.92603, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 22]}], "orig": "Yield the right-of-way", "text": "Yield the right-of-way"}, {"self_ref": "#/texts/296", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 501.79385, "t": 470.81027, "r": 510.41632, "b": 468.98984, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 13]}], "orig": "Shows driving", "text": "Shows driving"}, {"self_ref": "#/texts/297", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 501.79385, "t": 469.12268000000006, "r": 509.04268999999994, "b": 467.30224999999996, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 11]}], "orig": "regulations", "text": "regulations"}, {"self_ref": "#/texts/298", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 518.66455, "t": 472.40854, "r": 529.80902, "b": 470.58809999999994, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 17]}], "orig": "Explains lane use", "text": "Explains lane use"}, {"self_ref": "#/texts/299", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 534.87561, "t": 473.62384, "r": 546.95142, "b": 471.80341, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 17]}], "orig": "School zone signs", "text": "School zone signs"}, {"self_ref": "#/texts/300", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 534.87561, "t": 471.9362499999999, "r": 545.05762, "b": 470.11581, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 16]}], "orig": "are fl uorescent", "text": "are fl uorescent"}, {"self_ref": "#/texts/301", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 534.87561, "t": 470.24866, "r": 543.32263, "b": 468.42822, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 12]}], "orig": "yellow-green", "text": "yellow-green"}, {"self_ref": "#/texts/302", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 499.21862999999996, "t": 453.87228, "r": 512.62451, "b": 452.05185, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 20]}], "orig": "Tells about motorist", "text": "Tells about motorist"}, {"self_ref": "#/texts/303", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 499.21862999999996, "t": 452.18468999999993, "r": 504.39917, "b": 450.36426, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 8]}], "orig": "services", "text": "services"}, {"self_ref": "#/texts/304", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 516.97748, "t": 453.93961, "r": 529.77484, "b": 452.11917000000005, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 17]}], "orig": "Shows a permitted", "text": "Shows a permitted"}, {"self_ref": "#/texts/305", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 516.97748, "t": 452.25201, "r": 520.96399, "b": 450.43158, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 6]}], "orig": "action", "text": "action"}, {"self_ref": "#/texts/306", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 534.55847, "t": 454.11719, "r": 548.58453, "b": 452.2967499999999, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 20]}], "orig": "Shows an action that", "text": "Shows an action that"}, {"self_ref": "#/texts/307", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 534.55847, "t": 452.42959999999994, "r": 545.08862, "b": 450.60916, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 16]}], "orig": "is not permitted", "text": "is not permitted"}, {"self_ref": "#/texts/308", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 483.05853, "t": 435.82584, "r": 494.72577, "b": 434.0054, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 16]}], "orig": "Warns of hazards", "text": "Warns of hazards"}, {"self_ref": "#/texts/309", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 483.05853, "t": 434.13821, "r": 487.07525999999996, "b": 432.31778, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 5]}], "orig": "ahead", "text": "ahead"}, {"self_ref": "#/texts/310", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 499.39645, "t": 435.73702999999995, "r": 504.69171, "b": 433.9166, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 8]}], "orig": "Warns of", "text": "Warns of"}, {"self_ref": "#/texts/311", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 499.39645, "t": 434.04944, "r": 511.69116, "b": 432.22900000000004, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 18]}], "orig": "construction zones", "text": "construction zones"}, {"self_ref": "#/texts/312", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 516.75891, "t": 435.73702999999995, "r": 527.42938, "b": 433.9166, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 16]}], "orig": "Railway crossing", "text": "Railway crossing"}, {"self_ref": "#/texts/313", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 534.5141, "t": 439.07019, "r": 547.89862, "b": 437.24976, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 18]}], "orig": "Shows distance and", "text": "Shows distance and"}, {"self_ref": "#/texts/314", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 534.5141, "t": 437.3826, "r": 540.2818, "b": 435.56216, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 9]}], "orig": "direction", "text": "direction"}, {"self_ref": "#/texts/315", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 478.37466, "t": 521.85925, "r": 479.14251999999993, "b": 519.82123, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "\u2022", "text": "\u2022"}, {"self_ref": "#/texts/316", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 479.91036999999994, "t": 521.85925, "r": 483.74963, "b": 519.82123, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 5]}], "orig": "Signs", "text": "Signs"}, {"self_ref": "#/texts/317", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 479.97293, "t": 519.15283, "r": 492.31219, "b": 517.65112, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 18]}], "orig": "- regulatory signs", "text": "- regulatory signs"}, {"self_ref": "#/texts/318", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 479.97293, "t": 516.85486, "r": 486.72598000000005, "b": 515.35321, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 9]}], "orig": "- school,", "text": "- school,"}, {"self_ref": "#/texts/319", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 481.21602999999993, "t": 515.22028, "r": 492.93286000000006, "b": 513.18231, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 14]}], "orig": "playground and", "text": "playground and"}, {"self_ref": "#/texts/320", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 481.21602999999993, "t": 513.17725, "r": 491.82938000000007, "b": 511.13925, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 15]}], "orig": "crosswalk signs", "text": "crosswalk signs"}, {"self_ref": "#/texts/321", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 479.97293, "t": 510.47241, "r": 491.00775000000004, "b": 508.97076, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 16]}], "orig": "- lane use signs", "text": "- lane use signs"}, {"self_ref": "#/texts/322", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 479.97293, "t": 508.17444, "r": 493.32748, "b": 506.6727900000001, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 20]}], "orig": "- turn control signs", "text": "- turn control signs"}, {"self_ref": "#/texts/323", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 479.97293, "t": 505.8765, "r": 490.4915199999999, "b": 504.37482, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 15]}], "orig": "- parking signs", "text": "- parking signs"}, {"self_ref": "#/texts/324", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 479.97293, "t": 503.57852, "r": 491.17004000000003, "b": 502.07684, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 15]}], "orig": "- reserved lane", "text": "- reserved lane"}, {"self_ref": "#/texts/325", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 481.21602999999993, "t": 501.94394000000005, "r": 484.77405000000005, "b": 499.90594, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 5]}], "orig": "signs", "text": "signs"}, {"self_ref": "#/texts/326", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 479.97293, "t": 499.23830999999996, "r": 490.83398, "b": 497.73666, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 15]}], "orig": "- warning signs", "text": "- warning signs"}, {"self_ref": "#/texts/327", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 479.97293, "t": 496.94037, "r": 491.62692, "b": 495.43869, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 16]}], "orig": "- object markers", "text": "- object markers"}, {"self_ref": "#/texts/328", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 479.97293, "t": 494.6424, "r": 490.37341, "b": 493.1407500000001, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 14]}], "orig": "- construction", "text": "- construction"}, {"self_ref": "#/texts/329", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 481.21602999999993, "t": 493.00781, "r": 484.77405000000005, "b": 490.96985, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 5]}], "orig": "signs", "text": "signs"}, {"self_ref": "#/texts/330", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 479.97293, "t": 490.30219000000005, "r": 492.93912, "b": 488.80054, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 17]}], "orig": "- information and", "text": "- information and"}, {"self_ref": "#/texts/331", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 481.21602999999993, "t": 488.6676, "r": 493.00525, "b": 486.62964, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 17]}], "orig": "destination signs", "text": "destination signs"}, {"self_ref": "#/texts/332", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 479.97293, "t": 485.9620100000001, "r": 489.99047999999993, "b": 484.46033, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 15]}], "orig": "- railway signs", "text": "- railway signs"}, {"self_ref": "#/texts/333", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 478.375, "t": 483.75211, "r": 479.1032400000001, "b": 481.71414, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "\u2022", "text": "\u2022"}, {"self_ref": "#/texts/334", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 479.83151, "t": 483.75211, "r": 484.92925999999994, "b": 481.71414, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 7]}], "orig": "Signals", "text": "Signals"}, {"self_ref": "#/texts/335", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 479.97293, "t": 481.04642, "r": 490.00091999999995, "b": 479.54474, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 14]}], "orig": "- lane control", "text": "- lane control"}, {"self_ref": "#/texts/336", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 481.21602999999993, "t": 479.4118000000001, "r": 485.95331, "b": 477.37384, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 7]}], "orig": "signals", "text": "signals"}, {"self_ref": "#/texts/337", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 479.97293, "t": 476.70621, "r": 489.29876999999993, "b": 475.20456, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 16]}], "orig": "- traffic lights", "text": "- traffic lights"}, {"self_ref": "#/texts/338", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 478.375, "t": 474.49634, "r": 479.18129999999996, "b": 472.4583400000001, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "\u2022", "text": "\u2022"}, {"self_ref": "#/texts/339", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 479.98761, "t": 474.49634, "r": 490.46960000000007, "b": 472.4583400000001, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 13]}], "orig": "Road markings", "text": "Road markings"}, {"self_ref": "#/texts/340", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 479.97293, "t": 471.79062, "r": 489.26166000000006, "b": 470.28897, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 14]}], "orig": "- yellow lines", "text": "- yellow lines"}, {"self_ref": "#/texts/341", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 479.97293, "t": 469.49268, "r": 488.59189, "b": 467.991, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 13]}], "orig": "- white lines", "text": "- white lines"}, {"self_ref": "#/texts/342", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 479.97293, "t": 467.1947, "r": 491.17004000000003, "b": 465.69302, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 15]}], "orig": "- reserved lane", "text": "- reserved lane"}, {"self_ref": "#/texts/343", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 481.21602999999993, "t": 465.56012, "r": 487.58978, "b": 463.52216, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 8]}], "orig": "markings", "text": "markings"}, {"self_ref": "#/texts/344", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 479.97293, "t": 462.85449, "r": 491.75177, "b": 461.35284, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 16]}], "orig": "- other markings", "text": "- other markings"}, {"self_ref": "#/texts/345", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 478.15246999999994, "t": 526.92969, "r": 493.75586, "b": 523.93127, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 15]}], "orig": "in this chapter", "text": "in this chapter"}, {"self_ref": "#/texts/346", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "section_header", "prov": [{"page_no": 1, "bbox": {"l": 317.95499, "t": 199.53409, "r": 379.8205, "b": 189.22498999999993, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 8]}], "orig": "KEYWORDS", "text": "KEYWORDS", "level": 1}, {"self_ref": "#/texts/347", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 317.95499, "t": 184.33244000000002, "r": 559.18597, "b": 164.99883, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 90]}], "orig": "PDF document conversion, layout segmentation, object-detection, data set, Machine Learning", "text": "PDF document conversion, layout segmentation, object-detection, data set, Machine Learning"}, {"self_ref": "#/texts/348", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "section_header", "prov": [{"page_no": 1, "bbox": {"l": 317.65997, "t": 151.94565999999998, "r": 404.65366, "b": 144.41391, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 21]}], "orig": "ACM Reference Format:", "text": "ACM Reference Format:", "level": 1}, {"self_ref": "#/texts/349", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 317.95499, "t": 141.88004, "r": 559.5495, "b": 84.622971, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 374]}], "orig": "Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar. 2022. DocLayNet: A Large Human-Annotated Dataset for DocumentLayout Analysis. In Proceedings of the 28th ACM SIGKDD Conference on Knowledge Discovery and Data Mining (KDD '22), August 14-18, 2022, Washington, DC, USA. ACM, New York, NY, USA, 9 pages. https://doi.org/10.1145/ 3534678.3539043", "text": "Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar. 2022. DocLayNet: A Large Human-Annotated Dataset for DocumentLayout Analysis. In Proceedings of the 28th ACM SIGKDD Conference on Knowledge Discovery and Data Mining (KDD '22), August 14-18, 2022, Washington, DC, USA. ACM, New York, NY, USA, 9 pages. https://doi.org/10.1145/ 3534678.3539043"}, {"self_ref": "#/texts/350", "parent": {"cref": "#/body"}, "children": [], "content_layer": "furniture", "label": "page_header", "prov": [{"page_no": 2, "bbox": {"l": 53.79800000000001, "t": 731.69098, "r": 558.20288, "b": 723.4239499999999, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 130]}], "orig": "KDD '22, August 14-18, 2022, Washington, DC, USA Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar", "text": "KDD '22, August 14-18, 2022, Washington, DC, USA Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar"}, {"self_ref": "#/texts/351", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "section_header", "prov": [{"page_no": 2, "bbox": {"l": 53.79800000000001, "t": 706.14014, "r": 156.52899, "b": 695.83099, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 14]}], "orig": "1 INTRODUCTION", "text": "1 INTRODUCTION", "level": 1}, {"self_ref": "#/texts/352", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 53.528999, "t": 681.01648, "r": 303.01697, "b": 563.05286, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 702]}], "orig": "Despite the substantial improvements achieved with machine-learning (ML) approaches and deep neural networks in recent years, document conversion remains a challenging problem, as demonstrated by the numerous public competitions held on this topic [1-4]. The challenge originates from the huge variability in PDF documents regarding layout, language and formats (scanned, programmatic or a combination of both). Engineering a single ML model that can be applied on all types of documents and provides high-quality layout segmentation remains to this day extremely challenging [5]. To highlight the variability in document layouts, we show a few example documents from the DocLayNet dataset in Figure 1.", "text": "Despite the substantial improvements achieved with machine-learning (ML) approaches and deep neural networks in recent years, document conversion remains a challenging problem, as demonstrated by the numerous public competitions held on this topic [1-4]. The challenge originates from the huge variability in PDF documents regarding layout, language and formats (scanned, programmatic or a combination of both). Engineering a single ML model that can be applied on all types of documents and provides high-quality layout segmentation remains to this day extremely challenging [5]. To highlight the variability in document layouts, we show a few example documents from the DocLayNet dataset in Figure 1."}, {"self_ref": "#/texts/353", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 53.528999, "t": 560.46844, "r": 295.56412, "b": 289.08084, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1580]}], "orig": "A key problem in the process of document conversion is to understand the structure of a single document page, i.e. which segments of text should be grouped together in a unit. To train models for this task, there are currently two large datasets available to the community, PubLayNet [6] and DocBank [7]. They were introduced in 2019 and 2020 respectively and significantly accelerated the implementation of layout detection and segmentation models due to their sizes of 300K and 500K ground-truth pages. These sizes were achieved by leveraging an automation approach. The benefit of automated ground-truth generation is obvious: one can generate large ground-truth datasets at virtually no cost. However, the automation introduces a constraint on the variability in the dataset, because corresponding structured source data must be available. PubLayNet and DocBank were both generated from scientific document repositories (PubMed and arXiv), which provide XML or L A T E X sources. Those scientific documents present a limited variability in their layouts, because they are typeset in uniform templates provided by the publishers. Obviously, documents such as technical manuals, annual company reports, legal text, government tenders, etc. have very different and partially unique layouts. As a consequence, the layout predictions obtained from models trained on PubLayNet or DocBank is very reasonable when applied on scientific documents. However, for more artistic or free-style layouts, we see sub-par prediction quality from these models, which we demonstrate in Section 5.", "text": "A key problem in the process of document conversion is to understand the structure of a single document page, i.e. which segments of text should be grouped together in a unit. To train models for this task, there are currently two large datasets available to the community, PubLayNet [6] and DocBank [7]. They were introduced in 2019 and 2020 respectively and significantly accelerated the implementation of layout detection and segmentation models due to their sizes of 300K and 500K ground-truth pages. These sizes were achieved by leveraging an automation approach. The benefit of automated ground-truth generation is obvious: one can generate large ground-truth datasets at virtually no cost. However, the automation introduces a constraint on the variability in the dataset, because corresponding structured source data must be available. PubLayNet and DocBank were both generated from scientific document repositories (PubMed and arXiv), which provide XML or L A T E X sources. Those scientific documents present a limited variability in their layouts, because they are typeset in uniform templates provided by the publishers. Obviously, documents such as technical manuals, annual company reports, legal text, government tenders, etc. have very different and partially unique layouts. As a consequence, the layout predictions obtained from models trained on PubLayNet or DocBank is very reasonable when applied on scientific documents. However, for more artistic or free-style layouts, we see sub-par prediction quality from these models, which we demonstrate in Section 5."}, {"self_ref": "#/texts/354", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 53.591999, "t": 286.49646, "r": 295.56396, "b": 212.36783000000003, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 462]}], "orig": "In this paper, we present the DocLayNet dataset. It provides pageby-page layout annotation ground-truth using bounding-boxes for 11 distinct class labels on 80863 unique document pages, of which a fraction carry double- or triple-annotations. DocLayNet is similar in spirit to PubLayNet and DocBank and will likewise be made available to the public 1 in order to stimulate the document-layout analysis community. It distinguishes itself in the following aspects:", "text": "In this paper, we present the DocLayNet dataset. It provides pageby-page layout annotation ground-truth using bounding-boxes for 11 distinct class labels on 80863 unique document pages, of which a fraction carry double- or triple-annotations. DocLayNet is similar in spirit to PubLayNet and DocBank and will likewise be made available to the public 1 in order to stimulate the document-layout analysis community. It distinguishes itself in the following aspects:"}, {"self_ref": "#/texts/355", "parent": {"cref": "#/groups/0"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 2, "bbox": {"l": 64.708, "t": 207.41844000000003, "r": 295.56165, "b": 177.12581999999998, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 149]}], "orig": "(1) Human Annotation : In contrast to PubLayNet and DocBank, we relied on human annotation instead of automation approaches to generate the data set.", "text": "(1) Human Annotation : In contrast to PubLayNet and DocBank, we relied on human annotation instead of automation approaches to generate the data set.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/356", "parent": {"cref": "#/groups/0"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 2, "bbox": {"l": 64.708, "t": 174.54143999999997, "r": 294.26254, "b": 155.20883000000003, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 109]}], "orig": "(2) Large Layout Variability : We include diverse and complex layouts from a large variety of public sources.", "text": "(2) Large Layout Variability : We include diverse and complex layouts from a large variety of public sources.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/357", "parent": {"cref": "#/groups/0"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 2, "bbox": {"l": 64.708, "t": 152.62445000000002, "r": 294.68381, "b": 122.33182999999997, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 180]}], "orig": "(3) Detailed Label Set : We define 11 class labels to distinguish layout features in high detail. PubLayNet provides 5 labels; DocBank provides 13, although not a superset of ours.", "text": "(3) Detailed Label Set : We define 11 class labels to distinguish layout features in high detail. PubLayNet provides 5 labels; DocBank provides 13, although not a superset of ours.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/358", "parent": {"cref": "#/groups/0"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 2, "bbox": {"l": 64.708, "t": 119.74743999999998, "r": 295.56439, "b": 100.41382999999996, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 115]}], "orig": "(4) Redundant Annotations : A fraction of the pages in the DocLayNet data set carry more than one human annotation.", "text": "(4) Redundant Annotations : A fraction of the pages in the DocLayNet data set carry more than one human annotation.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/359", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "footnote", "prov": [{"page_no": 2, "bbox": {"l": 53.672001, "t": 89.77363600000001, "r": 216.02750000000003, "b": 83.26010900000006, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 60]}], "orig": "$^{1}$https://developer.ibm.com/exchanges/data/all/doclaynet", "text": "$^{1}$https://developer.ibm.com/exchanges/data/all/doclaynet"}, {"self_ref": "#/texts/360", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 342.095, "t": 704.63647, "r": 558.43201, "b": 685.30286, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 86]}], "orig": "This enables experimentation with annotation uncertainty and quality control analysis.", "text": "This enables experimentation with annotation uncertainty and quality control analysis."}, {"self_ref": "#/texts/361", "parent": {"cref": "#/groups/1"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 2, "bbox": {"l": 328.86502, "t": 682.71851, "r": 559.72101, "b": 630.50885, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 280]}], "orig": "(5) Pre-defined Train-, Test- & Validation-set : Like DocBank, we provide fixed train-, test- & validation-sets to ensure proportional representation of the class-labels. Further, we prevent leakage of unique layouts across sets, which has a large effect on model accuracy scores.", "text": "(5) Pre-defined Train-, Test- & Validation-set : Like DocBank, we provide fixed train-, test- & validation-sets to ensure proportional representation of the class-labels. Further, we prevent leakage of unique layouts across sets, which has a large effect on model accuracy scores.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/362", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 317.62299, "t": 624.02448, "r": 559.19031, "b": 571.81384, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 297]}], "orig": "All aspects outlined above are detailed in Section 3. In Section 4, we will elaborate on how we designed and executed this large-scale human annotation campaign. We will also share key insights and lessons learned that might prove helpful for other parties planning to set up annotation campaigns.", "text": "All aspects outlined above are detailed in Section 3. In Section 4, we will elaborate on how we designed and executed this large-scale human annotation campaign. We will also share key insights and lessons learned that might prove helpful for other parties planning to set up annotation campaigns."}, {"self_ref": "#/texts/363", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 317.73099, "t": 569.22943, "r": 559.58197, "b": 484.14282, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 506]}], "orig": "In Section 5, we will present baseline accuracy numbers for a variety of object detection methods (Faster R-CNN, Mask R-CNN and YOLOv5) trained on DocLayNet. We further show how the model performance is impacted by varying the DocLayNet dataset size, reducing the label set and modifying the train/test-split. Last but not least, we compare the performance of models trained on PubLayNet, DocBank and DocLayNet and demonstrate that a model trained on DocLayNet provides overall more robust layout recovery.", "text": "In Section 5, we will present baseline accuracy numbers for a variety of object detection methods (Faster R-CNN, Mask R-CNN and YOLOv5) trained on DocLayNet. We further show how the model performance is impacted by varying the DocLayNet dataset size, reducing the label set and modifying the train/test-split. Last but not least, we compare the performance of models trained on PubLayNet, DocBank and DocLayNet and demonstrate that a model trained on DocLayNet provides overall more robust layout recovery."}, {"self_ref": "#/texts/364", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "section_header", "prov": [{"page_no": 2, "bbox": {"l": 317.95499, "t": 470.79111, "r": 421.74411, "b": 460.48203, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 14]}], "orig": "2 RELATED WORK", "text": "2 RELATED WORK", "level": 1}, {"self_ref": "#/texts/365", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 317.52499, "t": 445.6674499999999, "r": 559.71613, "b": 327.70383, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 655]}], "orig": "While early approaches in document-layout analysis used rulebased algorithms and heuristics [8], the problem is lately addressed with deep learning methods. The most common approach is to leverage object detection models [9-15]. In the last decade, the accuracy and speed of these models has increased dramatically. Furthermore, most state-of-the-art object detection methods can be trained and applied with very little work, thanks to a standardisation effort of the ground-truth data format [16] and common deep-learning frameworks [17]. Reference data sets such as PubLayNet [6] and DocBank provide their data in the commonly accepted COCO format [16].", "text": "While early approaches in document-layout analysis used rulebased algorithms and heuristics [8], the problem is lately addressed with deep learning methods. The most common approach is to leverage object detection models [9-15]. In the last decade, the accuracy and speed of these models has increased dramatically. Furthermore, most state-of-the-art object detection methods can be trained and applied with very little work, thanks to a standardisation effort of the ground-truth data format [16] and common deep-learning frameworks [17]. Reference data sets such as PubLayNet [6] and DocBank provide their data in the commonly accepted COCO format [16]."}, {"self_ref": "#/texts/366", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 317.95499, "t": 325.11948, "r": 559.18646, "b": 240.03183, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 500]}], "orig": "Lately, new types of ML models for document-layout analysis have emerged in the community [18-21]. These models do not approach the problem of layout analysis purely based on an image representation of the page, as computer vision methods do. Instead, they combine the text tokens and image representation of a page in order to obtain a segmentation. While the reported accuracies appear to be promising, a broadly accepted data format which links geometric and textual features has yet to establish.", "text": "Lately, new types of ML models for document-layout analysis have emerged in the community [18-21]. These models do not approach the problem of layout analysis purely based on an image representation of the page, as computer vision methods do. Instead, they combine the text tokens and image representation of a page in order to obtain a segmentation. While the reported accuracies appear to be promising, a broadly accepted data format which links geometric and textual features has yet to establish."}, {"self_ref": "#/texts/367", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "section_header", "prov": [{"page_no": 2, "bbox": {"l": 317.95499, "t": 226.68010000000004, "r": 477.45688, "b": 216.37099999999998, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 23]}], "orig": "3 THE DOCLAYNET DATASET", "text": "3 THE DOCLAYNET DATASET", "level": 1}, {"self_ref": "#/texts/368", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 317.95499, "t": 201.55644000000007, "r": 559.7132, "b": 116.46983, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 522]}], "orig": "DocLayNet contains 80863 PDF pages. Among these, 7059 carry two instances of human annotations, and 1591 carry three. This amounts to 91104 total annotation instances. The annotations provide layout information in the shape of labeled, rectangular boundingboxes. We define 11 distinct labels for layout features, namely Caption , Footnote , Formula , List-item , Page-footer , Page-header , Picture , Section-header , Table , Text , and Title . Our reasoning for picking this particular label set is detailed in Section 4.", "text": "DocLayNet contains 80863 PDF pages. Among these, 7059 carry two instances of human annotations, and 1591 carry three. This amounts to 91104 total annotation instances. The annotations provide layout information in the shape of labeled, rectangular boundingboxes. We define 11 distinct labels for layout features, namely Caption , Footnote , Formula , List-item , Page-footer , Page-header , Picture , Section-header , Table , Text , and Title . Our reasoning for picking this particular label set is detailed in Section 4."}, {"self_ref": "#/texts/369", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 317.95499, "t": 113.88544000000002, "r": 558.2041, "b": 83.59282699999994, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 186]}], "orig": "In addition to open intellectual property constraints for the source documents, we required that the documents in DocLayNet adhere to a few conditions. Firstly, we kept scanned documents", "text": "In addition to open intellectual property constraints for the source documents, we required that the documents in DocLayNet adhere to a few conditions. Firstly, we kept scanned documents"}, {"self_ref": "#/texts/370", "parent": {"cref": "#/body"}, "children": [], "content_layer": "furniture", "label": "page_header", "prov": [{"page_no": 3, "bbox": {"l": 53.79800000000001, "t": 731.69098, "r": 347.01724, "b": 723.4239499999999, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 71]}], "orig": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis", "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis"}, {"self_ref": "#/texts/371", "parent": {"cref": "#/body"}, "children": [], "content_layer": "furniture", "label": "page_header", "prov": [{"page_no": 3, "bbox": {"l": 365.75702, "t": 731.69098, "r": 558.20282, "b": 723.4239499999999, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 48]}], "orig": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA"}, {"self_ref": "#/texts/372", "parent": {"cref": "#/pictures/1"}, "children": [], "content_layer": "body", "label": "caption", "prov": [{"page_no": 3, "bbox": {"l": 53.79800000000001, "t": 555.88501, "r": 294.04373, "b": 536.45276, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 69]}], "orig": "Figure 2: Distribution of DocLayNet pages across document categories.", "text": "Figure 2: Distribution of DocLayNet pages across document categories."}, {"self_ref": "#/texts/373", "parent": {"cref": "#/pictures/1"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 237.11293, "t": 658.91284, "r": 262.97623, "b": 650.3858, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 7]}], "orig": "Patents", "text": "Patents"}, {"self_ref": "#/texts/374", "parent": {"cref": "#/pictures/1"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 202.87892, "t": 651.53821, "r": 213.89999, "b": 643.01117, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "8%", "text": "8%"}, {"self_ref": "#/texts/375", "parent": {"cref": "#/pictures/1"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 207.13306, "t": 698.8423499999999, "r": 237.64882999999998, "b": 690.31531, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 10]}], "orig": "Scientific", "text": "Scientific"}, {"self_ref": "#/texts/376", "parent": {"cref": "#/pictures/1"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 184.40349, "t": 673.31793, "r": 199.66519, "b": 664.79089, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 3]}], "orig": "17%", "text": "17%"}, {"self_ref": "#/texts/377", "parent": {"cref": "#/pictures/1"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 88.288223, "t": 677.6452600000001, "r": 118.80401, "b": 669.1182300000002, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 9]}], "orig": "Financial", "text": "Financial"}, {"self_ref": "#/texts/378", "parent": {"cref": "#/pictures/1"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 136.24422, "t": 661.75592, "r": 151.50592, "b": 653.22888, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 3]}], "orig": "32%", "text": "32%"}, {"self_ref": "#/texts/379", "parent": {"cref": "#/pictures/1"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 93.973373, "t": 604.34235, "r": 121.11515, "b": 595.81531, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 7]}], "orig": "Tenders", "text": "Tenders"}, {"self_ref": "#/texts/380", "parent": {"cref": "#/pictures/1"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 139.6235, "t": 621.77252, "r": 150.64458, "b": 613.24548, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "6%", "text": "6%"}, {"self_ref": "#/texts/381", "parent": {"cref": "#/pictures/1"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 139.88339, "t": 579.49963, "r": 157.68491, "b": 570.9726, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "Laws", "text": "Laws"}, {"self_ref": "#/texts/382", "parent": {"cref": "#/pictures/1"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 157.43983, "t": 608.22192, "r": 172.70154, "b": 599.69489, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 3]}], "orig": "16%", "text": "16%"}, {"self_ref": "#/texts/383", "parent": {"cref": "#/pictures/1"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 225.47252, "t": 602.70343, "r": 254.29510000000002, "b": 594.17639, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 7]}], "orig": "Manuals", "text": "Manuals"}, {"self_ref": "#/texts/384", "parent": {"cref": "#/pictures/1"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 194.40683, "t": 620.87854, "r": 209.66853, "b": 612.3515, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 3]}], "orig": "21%", "text": "21%"}, {"self_ref": "#/texts/385", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 53.79800000000001, "t": 510.1964699999999, "r": 294.27383, "b": 425.10983, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 513]}], "orig": "to a minimum, since they introduce difficulties in annotation (see Section 4). As a second condition, we focussed on medium to large documents ( > 10 pages) with technical content, dense in complex tables, figures, plots and captions. Such documents carry a lot of information value, but are often hard to analyse with high accuracy due to their challenging layouts. Counterexamples of documents not included in the dataset are receipts, invoices, hand-written documents or photographs showing \"text in the wild\".", "text": "to a minimum, since they introduce difficulties in annotation (see Section 4). As a second condition, we focussed on medium to large documents ( > 10 pages) with technical content, dense in complex tables, figures, plots and captions. Such documents carry a lot of information value, but are often hard to analyse with high accuracy due to their challenging layouts. Counterexamples of documents not included in the dataset are receipts, invoices, hand-written documents or photographs showing \"text in the wild\"."}, {"self_ref": "#/texts/386", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 53.57400100000001, "t": 422.52545, "r": 295.56046, "b": 282.64383, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 810]}], "orig": "The pages in DocLayNet can be grouped into six distinct categories, namely Financial Reports , Manuals , Scientific Articles , Laws & Regulations , Patents and Government Tenders . Each document category was sourced from various repositories. For example, Financial Reports contain both free-style format annual reports 2 which expose company-specific, artistic layouts as well as the more formal SEC filings. The two largest categories ( Financial Reports and Manuals ) contain a large amount of free-style layouts in order to obtain maximum variability. In the other four categories, we boosted the variability by mixing documents from independent providers, such as different government websites or publishers. In Figure 2, we show the document categories contained in DocLayNet with their respective sizes.", "text": "The pages in DocLayNet can be grouped into six distinct categories, namely Financial Reports , Manuals , Scientific Articles , Laws & Regulations , Patents and Government Tenders . Each document category was sourced from various repositories. For example, Financial Reports contain both free-style format annual reports 2 which expose company-specific, artistic layouts as well as the more formal SEC filings. The two largest categories ( Financial Reports and Manuals ) contain a large amount of free-style layouts in order to obtain maximum variability. In the other four categories, we boosted the variability by mixing documents from independent providers, such as different government websites or publishers. In Figure 2, we show the document categories contained in DocLayNet with their respective sizes."}, {"self_ref": "#/texts/387", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 53.466999, "t": 280.05945, "r": 295.56155, "b": 184.01382, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 535]}], "orig": "We did not control the document selection with regard to language. The vast majority of documents contained in DocLayNet (close to 95%) are published in English language. However, DocLayNet also contains a number of documents in other languages such as German (2.5%), French (1.0%) and Japanese (1.0%). While the document language has negligible impact on the performance of computer vision methods such as object detection and segmentation models, it might prove challenging for layout analysis methods which exploit textual features.", "text": "We did not control the document selection with regard to language. The vast majority of documents contained in DocLayNet (close to 95%) are published in English language. However, DocLayNet also contains a number of documents in other languages such as German (2.5%), French (1.0%) and Japanese (1.0%). While the document language has negligible impact on the performance of computer vision methods such as object detection and segmentation models, it might prove challenging for layout analysis methods which exploit textual features."}, {"self_ref": "#/texts/388", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 53.79800000000001, "t": 181.42944, "r": 295.56396, "b": 107.30183, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 413]}], "orig": "To ensure that future benchmarks in the document-layout analysis community can be easily compared, we have split up DocLayNet into pre-defined train-, test- and validation-sets. In this way, we can avoid spurious variations in the evaluation scores due to random splitting in train-, test- and validation-sets. We also ensured that less frequent labels are represented in train and test sets in equal proportions.", "text": "To ensure that future benchmarks in the document-layout analysis community can be easily compared, we have split up DocLayNet into pre-defined train-, test- and validation-sets. In this way, we can avoid spurious variations in the evaluation scores due to random splitting in train-, test- and validation-sets. We also ensured that less frequent labels are represented in train and test sets in equal proportions."}, {"self_ref": "#/texts/389", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "footnote", "prov": [{"page_no": 3, "bbox": {"l": 53.79800000000001, "t": 90.34363600000006, "r": 195.78998, "b": 83.830109, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 51]}], "orig": "$^{2}$e.g. AAPL from https://www.annualreports.com/", "text": "$^{2}$e.g. AAPL from https://www.annualreports.com/"}, {"self_ref": "#/texts/390", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 317.62299, "t": 704.63647, "r": 559.19183, "b": 630.50885, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 435]}], "orig": "Table 1 shows the overall frequency and distribution of the labels among the different sets. Importantly, we ensure that subsets are only split on full-document boundaries. This avoids that pages of the same document are spread over train, test and validation set, which can give an undesired evaluation advantage to models and lead to overestimation of their prediction accuracy. We will show the impact of this decision in Section 5.", "text": "Table 1 shows the overall frequency and distribution of the labels among the different sets. Importantly, we ensure that subsets are only split on full-document boundaries. This avoids that pages of the same document are spread over train, test and validation set, which can give an undesired evaluation advantage to models and lead to overestimation of their prediction accuracy. We will show the impact of this decision in Section 5."}, {"self_ref": "#/texts/391", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 317.95499, "t": 627.92444, "r": 558.43811, "b": 520.9198, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 645]}], "orig": "In order to accommodate the different types of models currently in use by the community, we provide DocLayNet in an augmented COCO format [16]. This entails the standard COCO ground-truth file (in JSON format) with the associated page images (in PNG format, 1025 \u00d7 1025 pixels). Furthermore, custom fields have been added to each COCO record to specify document category, original document filename and page number. In addition, we also provide the original PDF pages, as well as sidecar files containing parsed PDF text and text-cell coordinates (in JSON). All additional files are linked to the primary page images by their matching filenames.", "text": "In order to accommodate the different types of models currently in use by the community, we provide DocLayNet in an augmented COCO format [16]. This entails the standard COCO ground-truth file (in JSON format) with the associated page images (in PNG format, 1025 \u00d7 1025 pixels). Furthermore, custom fields have been added to each COCO record to specify document category, original document filename and page number. In addition, we also provide the original PDF pages, as well as sidecar files containing parsed PDF text and text-cell coordinates (in JSON). All additional files are linked to the primary page images by their matching filenames."}, {"self_ref": "#/texts/392", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 316.94199, "t": 518.33545, "r": 559.72156, "b": 203.11082, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1854]}], "orig": "Despite being cost-intense and far less scalable than automation, human annotation has several benefits over automated groundtruth generation. The first and most obvious reason to leverage human annotations is the freedom to annotate any type of document without requiring a programmatic source. For most PDF documents, the original source document is not available. The latter is not a hard constraint with human annotation, but it is for automated methods. A second reason to use human annotations is that the latter usually provide a more natural interpretation of the page layout. The human-interpreted layout can significantly deviate from the programmatic layout used in typesetting. For example, \"invisible\" tables might be used solely for aligning text paragraphs on columns. Such typesetting tricks might be interpreted by automated methods incorrectly as an actual table, while the human annotation will interpret it correctly as Text or other styles. The same applies to multi-line text elements, when authors decided to space them as \"invisible\" list elements without bullet symbols. A third reason to gather ground-truth through human annotation is to estimate a \"natural\" upper bound on the segmentation accuracy. As we will show in Section 4, certain documents featuring complex layouts can have different but equally acceptable layout interpretations. This natural upper bound for segmentation accuracy can be found by annotating the same pages multiple times by different people and evaluating the inter-annotator agreement. Such a baseline consistency evaluation is very useful to define expectations for a good target accuracy in trained deep neural network models and avoid overfitting (see Table 1). On the flip side, achieving high annotation consistency proved to be a key challenge in human annotation, as we outline in Section 4.", "text": "Despite being cost-intense and far less scalable than automation, human annotation has several benefits over automated groundtruth generation. The first and most obvious reason to leverage human annotations is the freedom to annotate any type of document without requiring a programmatic source. For most PDF documents, the original source document is not available. The latter is not a hard constraint with human annotation, but it is for automated methods. A second reason to use human annotations is that the latter usually provide a more natural interpretation of the page layout. The human-interpreted layout can significantly deviate from the programmatic layout used in typesetting. For example, \"invisible\" tables might be used solely for aligning text paragraphs on columns. Such typesetting tricks might be interpreted by automated methods incorrectly as an actual table, while the human annotation will interpret it correctly as Text or other styles. The same applies to multi-line text elements, when authors decided to space them as \"invisible\" list elements without bullet symbols. A third reason to gather ground-truth through human annotation is to estimate a \"natural\" upper bound on the segmentation accuracy. As we will show in Section 4, certain documents featuring complex layouts can have different but equally acceptable layout interpretations. This natural upper bound for segmentation accuracy can be found by annotating the same pages multiple times by different people and evaluating the inter-annotator agreement. Such a baseline consistency evaluation is very useful to define expectations for a good target accuracy in trained deep neural network models and avoid overfitting (see Table 1). On the flip side, achieving high annotation consistency proved to be a key challenge in human annotation, as we outline in Section 4."}, {"self_ref": "#/texts/393", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "section_header", "prov": [{"page_no": 3, "bbox": {"l": 317.95499, "t": 185.15008999999998, "r": 470.21326, "b": 174.84099000000003, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 21]}], "orig": "4 ANNOTATION CAMPAIGN", "text": "4 ANNOTATION CAMPAIGN", "level": 1}, {"self_ref": "#/texts/394", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 317.686, "t": 160.02643999999998, "r": 559.71381, "b": 85.897827, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 457]}], "orig": "The annotation campaign was carried out in four phases. In phase one, we identified and prepared the data sources for annotation. In phase two, we determined the class labels and how annotations should be done on the documents in order to obtain maximum consistency. The latter was guided by a detailed requirement analysis and exhaustive experiments. In phase three, we trained the annotation staff and performed exams for quality assurance. In phase four,", "text": "The annotation campaign was carried out in four phases. In phase one, we identified and prepared the data sources for annotation. In phase two, we determined the class labels and how annotations should be done on the documents in order to obtain maximum consistency. The latter was guided by a detailed requirement analysis and exhaustive experiments. In phase three, we trained the annotation staff and performed exams for quality assurance. In phase four,"}, {"self_ref": "#/texts/395", "parent": {"cref": "#/body"}, "children": [], "content_layer": "furniture", "label": "page_header", "prov": [{"page_no": 4, "bbox": {"l": 53.79800000000001, "t": 731.69098, "r": 558.20288, "b": 723.4239499999999, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 130]}], "orig": "KDD '22, August 14-18, 2022, Washington, DC, USA Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar", "text": "KDD '22, August 14-18, 2022, Washington, DC, USA Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar"}, {"self_ref": "#/texts/396", "parent": {"cref": "#/tables/0"}, "children": [], "content_layer": "body", "label": "caption", "prov": [{"page_no": 4, "bbox": {"l": 53.501999, "t": 707.0450400000001, "r": 558.48969, "b": 676.65381, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 348]}], "orig": "Table 1: DocLayNet dataset overview. Along with the frequency of each class label, we present the relative occurrence (as % of row \"Total\") in the train, test and validation sets. The inter-annotator agreement is computed as the mAP@0.5-0.95 metric between pairwise annotations from the triple-annotated pages, from which we obtain accuracy ranges.", "text": "Table 1: DocLayNet dataset overview. Along with the frequency of each class label, we present the relative occurrence (as % of row \"Total\") in the train, test and validation sets. The inter-annotator agreement is computed as the mAP@0.5-0.95 metric between pairwise annotations from the triple-annotated pages, from which we obtain accuracy ranges."}, {"self_ref": "#/texts/397", "parent": {"cref": "#/pictures/2"}, "children": [], "content_layer": "body", "label": "caption", "prov": [{"page_no": 4, "bbox": {"l": 53.79800000000001, "t": 237.99000999999998, "r": 295.64874, "b": 185.68075999999996, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 281]}], "orig": "Figure 3: Corpus Conversion Service annotation user interface. The PDF page is shown in the background, with overlaid text-cells (in darker shades). The annotation boxes can be drawn by dragging a rectangle over each segment with the respective label from the palette on the right.", "text": "Figure 3: Corpus Conversion Service annotation user interface. The PDF page is shown in the background, with overlaid text-cells (in darker shades). The annotation boxes can be drawn by dragging a rectangle over each segment with the respective label from the palette on the right."}, {"self_ref": "#/texts/398", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 4, "bbox": {"l": 53.466999, "t": 157.70844999999997, "r": 294.04745, "b": 116.45682999999997, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 231]}], "orig": "we distributed the annotation workload and performed continuous quality controls. Phase one and two required a small team of experts only. For phases three and four, a group of 40 dedicated annotators were assembled and supervised.", "text": "we distributed the annotation workload and performed continuous quality controls. Phase one and two required a small team of experts only. For phases three and four, a group of 40 dedicated annotators were assembled and supervised."}, {"self_ref": "#/texts/399", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 4, "bbox": {"l": 53.79800000000001, "t": 113.98901000000001, "r": 295.55844, "b": 83.57982600000003, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 193]}, {"page_no": 4, "bbox": {"l": 53.79800000000001, "t": 113.98901000000001, "r": 295.55844, "b": 83.57982600000003, "coord_origin": "BOTTOMLEFT"}, "charspan": [194, 570]}], "orig": "Phase 1: Data selection and preparation. Our inclusion criteria for documents were described in Section 3. A large effort went into ensuring that all documents are free to use. The data sources include publication repositories such as arXiv$^{3}$, government offices, company websites as well as data directory services for financial reports and patents. Scanned documents were excluded wherever possible because they can be rotated or skewed. This would not allow us to perform annotation with rectangular bounding-boxes and therefore complicate the annotation process.", "text": "Phase 1: Data selection and preparation. Our inclusion criteria for documents were described in Section 3. A large effort went into ensuring that all documents are free to use. The data sources include publication repositories such as arXiv$^{3}$, government offices, company websites as well as data directory services for financial reports and patents. Scanned documents were excluded wherever possible because they can be rotated or skewed. This would not allow us to perform annotation with rectangular bounding-boxes and therefore complicate the annotation process."}, {"self_ref": "#/texts/400", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 4, "bbox": {"l": 317.95499, "t": 414.1674499999999, "r": 559.71307, "b": 285.24484, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 746]}], "orig": "Preparation work included uploading and parsing the sourced PDF documents in the Corpus Conversion Service (CCS) [22], a cloud-native platform which provides a visual annotation interface and allows for dataset inspection and analysis. The annotation interface of CCS is shown in Figure 3. The desired balance of pages between the different document categories was achieved by selective subsampling of pages with certain desired properties. For example, we made sure to include the title page of each document and bias the remaining page selection to those with figures or tables. The latter was achieved by leveraging pre-trained object detection models from PubLayNet, which helped us estimate how many figures and tables a given page contains.", "text": "Preparation work included uploading and parsing the sourced PDF documents in the Corpus Conversion Service (CCS) [22], a cloud-native platform which provides a visual annotation interface and allows for dataset inspection and analysis. The annotation interface of CCS is shown in Figure 3. The desired balance of pages between the different document categories was achieved by selective subsampling of pages with certain desired properties. For example, we made sure to include the title page of each document and bias the remaining page selection to those with figures or tables. The latter was achieved by leveraging pre-trained object detection models from PubLayNet, which helped us estimate how many figures and tables a given page contains."}, {"self_ref": "#/texts/401", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 4, "bbox": {"l": 317.62299, "t": 282.77701, "r": 559.71765, "b": 98.94382500000006, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1159]}], "orig": "Phase 2: Label selection and guideline. We reviewed the collected documents and identified the most common structural features they exhibit. This was achieved by identifying recurrent layout elements and lead us to the definition of 11 distinct class labels. These 11 class labels are Caption , Footnote , Formula , List-item , Pagefooter , Page-header , Picture , Section-header , Table , Text , and Title . Critical factors that were considered for the choice of these class labels were (1) the overall occurrence of the label, (2) the specificity of the label, (3) recognisability on a single page (i.e. no need for context from previous or next page) and (4) overall coverage of the page. Specificity ensures that the choice of label is not ambiguous, while coverage ensures that all meaningful items on a page can be annotated. We refrained from class labels that are very specific to a document category, such as Abstract in the Scientific Articles category. We also avoided class labels that are tightly linked to the semantics of the text. Labels such as Author and Affiliation , as seen in DocBank, are often only distinguishable by discriminating on", "text": "Phase 2: Label selection and guideline. We reviewed the collected documents and identified the most common structural features they exhibit. This was achieved by identifying recurrent layout elements and lead us to the definition of 11 distinct class labels. These 11 class labels are Caption , Footnote , Formula , List-item , Pagefooter , Page-header , Picture , Section-header , Table , Text , and Title . Critical factors that were considered for the choice of these class labels were (1) the overall occurrence of the label, (2) the specificity of the label, (3) recognisability on a single page (i.e. no need for context from previous or next page) and (4) overall coverage of the page. Specificity ensures that the choice of label is not ambiguous, while coverage ensures that all meaningful items on a page can be annotated. We refrained from class labels that are very specific to a document category, such as Abstract in the Scientific Articles category. We also avoided class labels that are tightly linked to the semantics of the text. Labels such as Author and Affiliation , as seen in DocBank, are often only distinguishable by discriminating on"}, {"self_ref": "#/texts/402", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "footnote", "prov": [{"page_no": 4, "bbox": {"l": 317.95499, "t": 89.64663700000006, "r": 369.2457, "b": 83.13310999999999, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 24]}], "orig": "$^{3}$https://arxiv.org/", "text": "$^{3}$https://arxiv.org/"}, {"self_ref": "#/texts/403", "parent": {"cref": "#/body"}, "children": [], "content_layer": "furniture", "label": "page_header", "prov": [{"page_no": 5, "bbox": {"l": 53.79800000000001, "t": 731.69098, "r": 347.01724, "b": 723.4239499999999, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 71]}], "orig": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis", "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis"}, {"self_ref": "#/texts/404", "parent": {"cref": "#/body"}, "children": [], "content_layer": "furniture", "label": "page_header", "prov": [{"page_no": 5, "bbox": {"l": 365.75702, "t": 731.69098, "r": 558.20282, "b": 723.4239499999999, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 48]}], "orig": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA"}, {"self_ref": "#/texts/405", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 53.79800000000001, "t": 704.63647, "r": 294.04541, "b": 685.29388, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 135]}], "orig": "the textual content of an element, which goes beyond visual layout recognition, in particular outside the Scientific Articles category.", "text": "the textual content of an element, which goes beyond visual layout recognition, in particular outside the Scientific Articles category."}, {"self_ref": "#/texts/406", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 53.79800000000001, "t": 682.71844, "r": 295.55923, "b": 542.83783, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 812]}], "orig": "At first sight, the task of visual document-layout interpretation appears intuitive enough to obtain plausible annotations in most cases. However, during early trial-runs in the core team, we observed many cases in which annotators use different annotation styles, especially for documents with challenging layouts. For example, if a figure is presented with subfigures, one annotator might draw a single figure bounding-box, while another might annotate each subfigure separately. The same applies for lists, where one might annotate all list items in one block or each list item separately. In essence, we observed that challenging layouts would be annotated in different but plausible ways. To illustrate this, we show in Figure 4 multiple examples of plausible but inconsistent annotations on the same pages.", "text": "At first sight, the task of visual document-layout interpretation appears intuitive enough to obtain plausible annotations in most cases. However, during early trial-runs in the core team, we observed many cases in which annotators use different annotation styles, especially for documents with challenging layouts. For example, if a figure is presented with subfigures, one annotator might draw a single figure bounding-box, while another might annotate each subfigure separately. The same applies for lists, where one might annotate all list items in one block or each list item separately. In essence, we observed that challenging layouts would be annotated in different but plausible ways. To illustrate this, we show in Figure 4 multiple examples of plausible but inconsistent annotations on the same pages."}, {"self_ref": "#/texts/407", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 53.79800000000001, "t": 540.25348, "r": 295.56006, "b": 455.16583, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 465]}], "orig": "Obviously, this inconsistency in annotations is not desirable for datasets which are intended to be used for model training. To minimise these inconsistencies, we created a detailed annotation guideline. While perfect consistency across 40 annotation staff members is clearly not possible to achieve, we saw a huge improvement in annotation consistency after the introduction of our annotation guideline. A few selected, non-trivial highlights of the guideline are:", "text": "Obviously, this inconsistency in annotations is not desirable for datasets which are intended to be used for model training. To minimise these inconsistencies, we created a detailed annotation guideline. While perfect consistency across 40 annotation staff members is clearly not possible to achieve, we saw a huge improvement in annotation consistency after the introduction of our annotation guideline. A few selected, non-trivial highlights of the guideline are:"}, {"self_ref": "#/texts/408", "parent": {"cref": "#/groups/2"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 5, "bbox": {"l": 64.708, "t": 443.48746, "r": 294.0462, "b": 402.22687, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 202]}], "orig": "(1) Every list-item is an individual object instance with class label List-item . This definition is different from PubLayNet and DocBank, where all list-items are grouped together into one List object.", "text": "(1) Every list-item is an individual object instance with class label List-item . This definition is different from PubLayNet and DocBank, where all list-items are grouped together into one List object.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/409", "parent": {"cref": "#/groups/2"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 5, "bbox": {"l": 64.707993, "t": 399.65149, "r": 295.56372, "b": 358.39984, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 208]}], "orig": "(2) A List-item is a paragraph with hanging indentation. Singleline elements can qualify as List-item if the neighbour elements expose hanging indentation. Bullet or enumeration symbols are not a requirement.", "text": "(2) A List-item is a paragraph with hanging indentation. Singleline elements can qualify as List-item if the neighbour elements expose hanging indentation. Bullet or enumeration symbols are not a requirement.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/410", "parent": {"cref": "#/groups/2"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 5, "bbox": {"l": 64.708, "t": 355.81548999999995, "r": 294.04724, "b": 336.47287, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 82]}], "orig": "(3) For every Caption , there must be exactly one corresponding Picture or Table .", "text": "(3) For every Caption , there must be exactly one corresponding Picture or Table .", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/411", "parent": {"cref": "#/groups/2"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 5, "bbox": {"l": 64.708, "t": 333.8984699999999, "r": 294.04599, "b": 314.56482, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 70]}], "orig": "(4) Connected sub-pictures are grouped together in one Picture object.", "text": "(4) Connected sub-pictures are grouped together in one Picture object.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/412", "parent": {"cref": "#/groups/2"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 5, "bbox": {"l": 64.708, "t": 311.98047, "r": 264.50571, "b": 303.59686, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 53]}], "orig": "(5) Formula numbers are included in a Formula object.", "text": "(5) Formula numbers are included in a Formula object.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/413", "parent": {"cref": "#/groups/2"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 5, "bbox": {"l": 64.708008, "t": 301.02148, "r": 294.04617, "b": 270.72882000000004, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 160]}], "orig": "(6) Emphasised text (e.g. in italic or bold) at the beginning of a paragraph is not considered a Section-header , unless it appears exclusively on its own line.", "text": "(6) Emphasised text (e.g. in italic or bold) at the beginning of a paragraph is not considered a Section-header , unless it appears exclusively on its own line.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/414", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 53.528999, "t": 259.0494699999999, "r": 295.56253, "b": 217.79882999999995, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 221]}], "orig": "The complete annotation guideline is over 100 pages long and a detailed description is obviously out of scope for this paper. Nevertheless, it will be made publicly available alongside with DocLayNet for future reference.", "text": "The complete annotation guideline is over 100 pages long and a detailed description is obviously out of scope for this paper. Nevertheless, it will be made publicly available alongside with DocLayNet for future reference."}, {"self_ref": "#/texts/415", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 53.79800000000001, "t": 215.33101, "r": 295.56226, "b": 86.29182400000002, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 792]}], "orig": "Phase 3: Training. After a first trial with a small group of people, we realised that providing the annotation guideline and a set of random practice pages did not yield the desired quality level for layout annotation. Therefore we prepared a subset of pages with two different complexity levels, each with a practice and an exam part. 974 pages were reference-annotated by one proficient core team member. Annotation staff were then given the task to annotate the same subsets (blinded from the reference). By comparing the annotations of each staff member with the reference annotations, we could quantify how closely their annotations matched the reference. Only after passing two exam levels with high annotation quality, staff were admitted into the production phase. Practice iterations", "text": "Phase 3: Training. After a first trial with a small group of people, we realised that providing the annotation guideline and a set of random practice pages did not yield the desired quality level for layout annotation. Therefore we prepared a subset of pages with two different complexity levels, each with a practice and an exam part. 974 pages were reference-annotated by one proficient core team member. Annotation staff were then given the task to annotate the same subsets (blinded from the reference). By comparing the annotations of each staff member with the reference annotations, we could quantify how closely their annotations matched the reference. Only after passing two exam levels with high annotation quality, staff were admitted into the production phase. Practice iterations"}, {"self_ref": "#/texts/416", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 340.00214, "t": 612.20703, "r": 416.20551, "b": 610.09027, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 64]}], "orig": "1ef23f5e6d7f10d393f9947e8208285dce9ae87250ac483ac4b4a59d51b4e037", "text": "1ef23f5e6d7f10d393f9947e8208285dce9ae87250ac483ac4b4a59d51b4e037"}, {"self_ref": "#/texts/417", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 339.38269, "t": 706.80933, "r": 417.83722, "b": 699.716, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 25]}], "orig": "Compliant with guidelines", "text": "Compliant with guidelines"}, {"self_ref": "#/texts/418", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 451.42834, "t": 706.80933, "r": 546.22913, "b": 699.716, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 33]}], "orig": "Plausible but invalid alternative", "text": "Plausible but invalid alternative"}, {"self_ref": "#/texts/419", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 350.33701, "t": 427.14294, "r": 513.48035, "b": 420.04964999999993, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 53]}], "orig": "Borderline case: Two guideline-compliant alternatives", "text": "Borderline case: Two guideline-compliant alternatives"}, {"self_ref": "#/texts/420", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 340.00201, "t": 546.92615, "r": 416.20538, "b": 544.80939, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 64]}], "orig": "03c31a2ee1ed1b583c28957f475ee545d144e1b5a264dc4dd068c8d2f6a64860", "text": "03c31a2ee1ed1b583c28957f475ee545d144e1b5a264dc4dd068c8d2f6a64860"}, {"self_ref": "#/texts/421", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 340.00201, "t": 432.87512, "r": 416.20538, "b": 430.75833, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 64]}], "orig": "1a5cd524f1844c1260c8e8c073e1f442423c264583212b0d0b6626fc780e6ed4", "text": "1a5cd524f1844c1260c8e8c073e1f442423c264583212b0d0b6626fc780e6ed4"}, {"self_ref": "#/texts/422", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 322.19424, "t": 693.65894, "r": 326.01498, "b": 687.74786, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "A", "text": "A"}, {"self_ref": "#/texts/423", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 322.19424, "t": 605.00897, "r": 326.01498, "b": 599.09796, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "B", "text": "B"}, {"self_ref": "#/texts/424", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 322.19424, "t": 538.45807, "r": 326.01498, "b": 532.547, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/425", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 322.19424, "t": 424.91504000000003, "r": 326.01498, "b": 419.004, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "D", "text": "D"}, {"self_ref": "#/texts/426", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 400.12842, "t": 333.55672999999996, "r": 476.33178999999996, "b": 331.4399399999999, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 64]}], "orig": "05237a14f2524e3f53c8454b074409d05078038a6a36b770fcc8ec7e540deae0", "text": "05237a14f2524e3f53c8454b074409d05078038a6a36b770fcc8ec7e540deae0"}, {"self_ref": "#/texts/427", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "caption", "prov": [{"page_no": 5, "bbox": {"l": 317.95499, "t": 318.50601, "r": 559.80579, "b": 288.11481, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 173]}], "orig": "Figure 4: Examples of plausible annotation alternatives for the same page. Criteria in our annotation guideline can resolve cases A to C, while the case D remains ambiguous.", "text": "Figure 4: Examples of plausible annotation alternatives for the same page. Criteria in our annotation guideline can resolve cases A to C, while the case D remains ambiguous."}, {"self_ref": "#/texts/428", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 317.62299, "t": 266.50247, "r": 558.20435, "b": 247.16881999999998, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 123]}], "orig": "were carried out over a timeframe of 12 weeks, after which 8 of the 40 initially allocated annotators did not pass the bar.", "text": "were carried out over a timeframe of 12 weeks, after which 8 of the 40 initially allocated annotators did not pass the bar."}, {"self_ref": "#/texts/429", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 317.62299, "t": 244.70100000000002, "r": 559.7149, "b": 82.78482800000006, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 987]}], "orig": "Phase 4: Production annotation. The previously selected 80K pages were annotated with the defined 11 class labels by 32 annotators. This production phase took around three months to complete. All annotations were created online through CCS, which visualises the programmatic PDF text-cells as an overlay on the page. The page annotation are obtained by drawing rectangular bounding-boxes, as shown in Figure 3. With regard to the annotation practices, we implemented a few constraints and capabilities on the tooling level. First, we only allow non-overlapping, vertically oriented, rectangular boxes. For the large majority of documents, this constraint was sufficient and it speeds up the annotation considerably in comparison with arbitrary segmentation shapes. Second, annotator staff were not able to see each other's annotations. This was enforced by design to avoid any bias in the annotation, which could skew the numbers of the inter-annotator agreement (see Table 1). We wanted", "text": "Phase 4: Production annotation. The previously selected 80K pages were annotated with the defined 11 class labels by 32 annotators. This production phase took around three months to complete. All annotations were created online through CCS, which visualises the programmatic PDF text-cells as an overlay on the page. The page annotation are obtained by drawing rectangular bounding-boxes, as shown in Figure 3. With regard to the annotation practices, we implemented a few constraints and capabilities on the tooling level. First, we only allow non-overlapping, vertically oriented, rectangular boxes. For the large majority of documents, this constraint was sufficient and it speeds up the annotation considerably in comparison with arbitrary segmentation shapes. Second, annotator staff were not able to see each other's annotations. This was enforced by design to avoid any bias in the annotation, which could skew the numbers of the inter-annotator agreement (see Table 1). We wanted"}, {"self_ref": "#/texts/430", "parent": {"cref": "#/body"}, "children": [], "content_layer": "furniture", "label": "page_header", "prov": [{"page_no": 6, "bbox": {"l": 53.79800000000001, "t": 731.69098, "r": 558.20288, "b": 723.4239499999999, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 130]}], "orig": "KDD '22, August 14-18, 2022, Washington, DC, USA Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar", "text": "KDD '22, August 14-18, 2022, Washington, DC, USA Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar"}, {"self_ref": "#/texts/431", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 6, "bbox": {"l": 53.501999, "t": 705.12708, "r": 295.64874, "b": 608.98291, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 489]}], "orig": "Table 2: Prediction performance (mAP@0.5-0.95) of object detection networks on DocLayNet test set. The MRCNN (Mask R-CNN) and FRCNN (Faster R-CNN) models with ResNet-50 or ResNet-101 backbone were trained based on the network architectures from the detectron2 model zoo (Mask R-CNN R50, R101-FPN 3x, Faster R-CNN R101-FPN 3x), with default configurations. The YOLO implementation utilized was YOLOv5x6 [13]. All models were initialised using pre-trained weights from the COCO 2017 dataset.", "text": "Table 2: Prediction performance (mAP@0.5-0.95) of object detection networks on DocLayNet test set. The MRCNN (Mask R-CNN) and FRCNN (Faster R-CNN) models with ResNet-50 or ResNet-101 backbone were trained based on the network architectures from the detectron2 model zoo (Mask R-CNN R50, R101-FPN 3x, Faster R-CNN R101-FPN 3x), with default configurations. The YOLO implementation utilized was YOLOv5x6 [13]. All models were initialised using pre-trained weights from the COCO 2017 dataset."}, {"self_ref": "#/texts/432", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 6, "bbox": {"l": 53.528999, "t": 421.07245, "r": 295.55612, "b": 215.43683, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1252]}], "orig": "to avoid this at any cost in order to have clear, unbiased baseline numbers for human document-layout annotation. Third, we introduced the feature of snapping boxes around text segments to obtain a pixel-accurate annotation and again reduce time and effort. The CCS annotation tool automatically shrinks every user-drawn box to the minimum bounding-box around the enclosed text-cells for all purely text-based segments, which excludes only Table and Picture . For the latter, we instructed annotation staff to minimise inclusion of surrounding whitespace while including all graphical lines. A downside of snapping boxes to enclosed text cells is that some wrongly parsed PDF pages cannot be annotated correctly and need to be skipped. Fourth, we established a way to flag pages as rejected for cases where no valid annotation according to the label guidelines could be achieved. Example cases for this would be PDF pages that render incorrectly or contain layouts that are impossible to capture with non-overlapping rectangles. Such rejected pages are not contained in the final dataset. With all these measures in place, experienced annotation staff managed to annotate a single page in a typical timeframe of 20s to 60s, depending on its complexity.", "text": "to avoid this at any cost in order to have clear, unbiased baseline numbers for human document-layout annotation. Third, we introduced the feature of snapping boxes around text segments to obtain a pixel-accurate annotation and again reduce time and effort. The CCS annotation tool automatically shrinks every user-drawn box to the minimum bounding-box around the enclosed text-cells for all purely text-based segments, which excludes only Table and Picture . For the latter, we instructed annotation staff to minimise inclusion of surrounding whitespace while including all graphical lines. A downside of snapping boxes to enclosed text cells is that some wrongly parsed PDF pages cannot be annotated correctly and need to be skipped. Fourth, we established a way to flag pages as rejected for cases where no valid annotation according to the label guidelines could be achieved. Example cases for this would be PDF pages that render incorrectly or contain layouts that are impossible to capture with non-overlapping rectangles. Such rejected pages are not contained in the final dataset. With all these measures in place, experienced annotation staff managed to annotate a single page in a typical timeframe of 20s to 60s, depending on its complexity."}, {"self_ref": "#/texts/433", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "section_header", "prov": [{"page_no": 6, "bbox": {"l": 53.79800000000001, "t": 203.87009, "r": 147.48535, "b": 193.56098999999995, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 13]}], "orig": "5 EXPERIMENTS", "text": "5 EXPERIMENTS", "level": 1}, {"self_ref": "#/texts/434", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 6, "bbox": {"l": 53.484001, "t": 178.74644, "r": 295.4281, "b": 82.700829, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 584]}], "orig": "The primary goal of DocLayNet is to obtain high-quality ML models capable of accurate document-layout analysis on a wide variety of challenging layouts. As discussed in Section 2, object detection models are currently the easiest to use, due to the standardisation of ground-truth data in COCO format [16] and the availability of general frameworks such as detectron2 [17]. Furthermore, baseline numbers in PubLayNet and DocBank were obtained using standard object detection models such as Mask R-CNN and Faster R-CNN. As such, we will relate to these object detection methods in this", "text": "The primary goal of DocLayNet is to obtain high-quality ML models capable of accurate document-layout analysis on a wide variety of challenging layouts. As discussed in Section 2, object detection models are currently the easiest to use, due to the standardisation of ground-truth data in COCO format [16] and the availability of general frameworks such as detectron2 [17]. Furthermore, baseline numbers in PubLayNet and DocBank were obtained using standard object detection models such as Mask R-CNN and Faster R-CNN. As such, we will relate to these object detection methods in this"}, {"self_ref": "#/texts/435", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "caption", "prov": [{"page_no": 6, "bbox": {"l": 317.95499, "t": 512.98401, "r": 559.80579, "b": 449.71581999999995, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 329]}], "orig": "Figure 5: Prediction performance (mAP@0.5-0.95) of a Mask R-CNN network with ResNet50 backbone trained on increasing fractions of the DocLayNet dataset. The learning curve flattens around the 80% mark, indicating that increasing the size of the DocLayNet dataset with similar data will not yield significantly better predictions.", "text": "Figure 5: Prediction performance (mAP@0.5-0.95) of a Mask R-CNN network with ResNet50 backbone trained on increasing fractions of the DocLayNet dataset. The learning curve flattens around the 80% mark, indicating that increasing the size of the DocLayNet dataset with similar data will not yield significantly better predictions."}, {"self_ref": "#/texts/436", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 6, "bbox": {"l": 349.16577, "t": 545.31982, "r": 352.48175, "b": 539.24573, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "0", "text": "0"}, {"self_ref": "#/texts/437", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 6, "bbox": {"l": 385.93698, "t": 545.31982, "r": 392.56894, "b": 539.24573, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "20", "text": "20"}, {"self_ref": "#/texts/438", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 6, "bbox": {"l": 424.366, "t": 545.31982, "r": 430.99796, "b": 539.24573, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "40", "text": "40"}, {"self_ref": "#/texts/439", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 6, "bbox": {"l": 462.79504000000003, "t": 545.31982, "r": 469.427, "b": 539.24573, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "60", "text": "60"}, {"self_ref": "#/texts/440", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 6, "bbox": {"l": 501.22406, "t": 545.31982, "r": 507.85602, "b": 539.24573, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "80", "text": "80"}, {"self_ref": "#/texts/441", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 6, "bbox": {"l": 537.99524, "t": 545.31982, "r": 547.94318, "b": 539.24573, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 3]}], "orig": "100", "text": "100"}, {"self_ref": "#/texts/442", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 6, "bbox": {"l": 410.28143, "t": 538.19159, "r": 483.47278000000006, "b": 532.11749, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 27]}], "orig": "% of DocLayNet training set", "text": "% of DocLayNet training set"}, {"self_ref": "#/texts/443", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 6, "bbox": {"l": 330.93539, "t": 573.61536, "r": 337.56735, "b": 567.54126, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "50", "text": "50"}, {"self_ref": "#/texts/444", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 6, "bbox": {"l": 330.93539, "t": 599.91339, "r": 337.56735, "b": 593.83929, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "55", "text": "55"}, {"self_ref": "#/texts/445", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 6, "bbox": {"l": 330.93539, "t": 626.21136, "r": 337.56735, "b": 620.13727, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "60", "text": "60"}, {"self_ref": "#/texts/446", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 6, "bbox": {"l": 330.93539, "t": 652.5094, "r": 337.56735, "b": 646.4353, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "65", "text": "65"}, {"self_ref": "#/texts/447", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 6, "bbox": {"l": 330.93539, "t": 678.80737, "r": 337.56735, "b": 672.73328, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "70", "text": "70"}, {"self_ref": "#/texts/448", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 6, "bbox": {"l": 322.92276, "t": 643.62311, "r": 328.99686, "b": 605.20782, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 13]}], "orig": "mAP 0.50:0.95", "text": "mAP 0.50:0.95"}, {"self_ref": "#/texts/449", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 6, "bbox": {"l": 470.97235, "t": 556.63324, "r": 477.6055, "b": 550.55914, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "10", "text": "10"}, {"self_ref": "#/texts/450", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 6, "bbox": {"l": 477.65662, "t": 557.17609, "r": 479.97778000000005, "b": 552.92419, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "1", "text": "1"}, {"self_ref": "#/texts/451", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 6, "bbox": {"l": 531.55127, "t": 556.58765, "r": 538.18445, "b": 550.51355, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "10", "text": "10"}, {"self_ref": "#/texts/452", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 6, "bbox": {"l": 538.23553, "t": 557.13049, "r": 540.5567, "b": 552.8786, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "2", "text": "2"}, {"self_ref": "#/texts/453", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 6, "bbox": {"l": 404.91125, "t": 575.99994, "r": 411.54321, "b": 569.92584, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "50", "text": "50"}, {"self_ref": "#/texts/454", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 6, "bbox": {"l": 404.91125, "t": 591.77875, "r": 411.54321, "b": 585.70465, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "55", "text": "55"}, {"self_ref": "#/texts/455", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 6, "bbox": {"l": 404.91125, "t": 607.55756, "r": 411.54321, "b": 601.48346, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "60", "text": "60"}, {"self_ref": "#/texts/456", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 6, "bbox": {"l": 404.91125, "t": 623.33636, "r": 411.54321, "b": 617.26227, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "65", "text": "65"}, {"self_ref": "#/texts/457", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 6, "bbox": {"l": 404.91125, "t": 639.11511, "r": 411.54321, "b": 633.04102, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "70", "text": "70"}, {"self_ref": "#/texts/458", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 6, "bbox": {"l": 317.95499, "t": 407.98846, "r": 558.20416, "b": 388.65482000000003, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 102]}], "orig": "paper and leave the detailed evaluation of more recent methods mentioned in Section 2 for future work.", "text": "paper and leave the detailed evaluation of more recent methods mentioned in Section 2 for future work."}, {"self_ref": "#/texts/459", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 6, "bbox": {"l": 317.64099, "t": 386.07047, "r": 558.4364, "b": 311.94284, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 397]}], "orig": "In this section, we will present several aspects related to the performance of object detection models on DocLayNet. Similarly as in PubLayNet, we will evaluate the quality of their predictions using mean average precision (mAP) with 10 overlaps that range from 0.5 to 0.95 in steps of 0.05 (mAP@0.5-0.95). These scores are computed by leveraging the evaluation code provided by the COCO API [16].", "text": "In this section, we will present several aspects related to the performance of object detection models on DocLayNet. Similarly as in PubLayNet, we will evaluate the quality of their predictions using mean average precision (mAP) with 10 overlaps that range from 0.5 to 0.95 in steps of 0.05 (mAP@0.5-0.95). These scores are computed by leveraging the evaluation code provided by the COCO API [16]."}, {"self_ref": "#/texts/460", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "section_header", "prov": [{"page_no": 6, "bbox": {"l": 317.95499, "t": 295.1781, "r": 466.8532400000001, "b": 284.86902, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 30]}], "orig": "Baselines for Object Detection", "text": "Baselines for Object Detection", "level": 1}, {"self_ref": "#/texts/461", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 6, "bbox": {"l": 317.74899, "t": 279.97546, "r": 558.43085, "b": 85.29982800000005, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1146]}], "orig": "In Table 2, we present baseline experiments (given in mAP) on Mask R-CNN [12], Faster R-CNN [11], and YOLOv5 [13]. Both training and evaluation were performed on RGB images with dimensions of 1025 \u00d7 1025 pixels. For training, we only used one annotation in case of redundantly annotated pages. As one can observe, the variation in mAP between the models is rather low, but overall between 6 and 10% lower than the mAP computed from the pairwise human annotations on triple-annotated pages. This gives a good indication that the DocLayNet dataset poses a worthwhile challenge for the research community to close the gap between human recognition and ML approaches. It is interesting to see that Mask R-CNN and Faster R-CNN produce very comparable mAP scores, indicating that pixel-based image segmentation derived from bounding-boxes does not help to obtain better predictions. On the other hand, the more recent Yolov5x model does very well and even out-performs humans on selected labels such as Text , Table and Picture . This is not entirely surprising, as Text , Table and Picture are abundant and the most visually distinctive in a document.", "text": "In Table 2, we present baseline experiments (given in mAP) on Mask R-CNN [12], Faster R-CNN [11], and YOLOv5 [13]. Both training and evaluation were performed on RGB images with dimensions of 1025 \u00d7 1025 pixels. For training, we only used one annotation in case of redundantly annotated pages. As one can observe, the variation in mAP between the models is rather low, but overall between 6 and 10% lower than the mAP computed from the pairwise human annotations on triple-annotated pages. This gives a good indication that the DocLayNet dataset poses a worthwhile challenge for the research community to close the gap between human recognition and ML approaches. It is interesting to see that Mask R-CNN and Faster R-CNN produce very comparable mAP scores, indicating that pixel-based image segmentation derived from bounding-boxes does not help to obtain better predictions. On the other hand, the more recent Yolov5x model does very well and even out-performs humans on selected labels such as Text , Table and Picture . This is not entirely surprising, as Text , Table and Picture are abundant and the most visually distinctive in a document."}, {"self_ref": "#/texts/462", "parent": {"cref": "#/body"}, "children": [], "content_layer": "furniture", "label": "page_header", "prov": [{"page_no": 7, "bbox": {"l": 53.79800000000001, "t": 731.69098, "r": 347.01724, "b": 723.4239499999999, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 71]}], "orig": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis", "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis"}, {"self_ref": "#/texts/463", "parent": {"cref": "#/body"}, "children": [], "content_layer": "furniture", "label": "page_header", "prov": [{"page_no": 7, "bbox": {"l": 365.75702, "t": 731.69098, "r": 558.20282, "b": 723.4239499999999, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 48]}], "orig": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA"}, {"self_ref": "#/texts/464", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 53.501999, "t": 705.12708, "r": 295.64865, "b": 663.77686, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 205]}], "orig": "Table 3: Performance of a Mask R-CNN R50 network in mAP@0.5-0.95 scores trained on DocLayNet with different class label sets. The reduced label sets were obtained by either down-mapping or dropping labels.", "text": "Table 3: Performance of a Mask R-CNN R50 network in mAP@0.5-0.95 scores trained on DocLayNet with different class label sets. The reduced label sets were obtained by either down-mapping or dropping labels."}, {"self_ref": "#/texts/465", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "section_header", "prov": [{"page_no": 7, "bbox": {"l": 53.79800000000001, "t": 472.43008, "r": 131.05624, "b": 462.121, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 14]}], "orig": "Learning Curve", "text": "Learning Curve", "level": 1}, {"self_ref": "#/texts/466", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 52.785, "t": 457.22845, "r": 295.55835, "b": 262.55182, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1157]}], "orig": "One of the fundamental questions related to any dataset is if it is \"large enough\". To answer this question for DocLayNet, we performed a data ablation study in which we evaluated a Mask R-CNN model trained on increasing fractions of the DocLayNet dataset. As can be seen in Figure 5, the mAP score rises sharply in the beginning and eventually levels out. To estimate the error-bar on the metrics, we ran the training five times on the entire data-set. This resulted in a 1% error-bar, depicted by the shaded area in Figure 5. In the inset of Figure 5, we show the exact same data-points, but with a logarithmic scale on the x-axis. As is expected, the mAP score increases linearly as a function of the data-size in the inset. The curve ultimately flattens out between the 80% and 100% mark, with the 80% mark falling within the error-bars of the 100% mark. This provides a good indication that the model would not improve significantly by yet increasing the data size. Rather, it would probably benefit more from improved data consistency (as discussed in Section 3), data augmentation methods [23], or the addition of more document categories and styles.", "text": "One of the fundamental questions related to any dataset is if it is \"large enough\". To answer this question for DocLayNet, we performed a data ablation study in which we evaluated a Mask R-CNN model trained on increasing fractions of the DocLayNet dataset. As can be seen in Figure 5, the mAP score rises sharply in the beginning and eventually levels out. To estimate the error-bar on the metrics, we ran the training five times on the entire data-set. This resulted in a 1% error-bar, depicted by the shaded area in Figure 5. In the inset of Figure 5, we show the exact same data-points, but with a logarithmic scale on the x-axis. As is expected, the mAP score increases linearly as a function of the data-size in the inset. The curve ultimately flattens out between the 80% and 100% mark, with the 80% mark falling within the error-bars of the 100% mark. This provides a good indication that the model would not improve significantly by yet increasing the data size. Rather, it would probably benefit more from improved data consistency (as discussed in Section 3), data augmentation methods [23], or the addition of more document categories and styles."}, {"self_ref": "#/texts/467", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "section_header", "prov": [{"page_no": 7, "bbox": {"l": 53.79800000000001, "t": 249.49008000000003, "r": 164.32898, "b": 239.18097999999998, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 22]}], "orig": "Impact of Class Labels", "text": "Impact of Class Labels", "level": 1}, {"self_ref": "#/texts/468", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 53.466999, "t": 234.28845, "r": 295.55679, "b": 83.44782999999995, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 910]}], "orig": "The choice and number of labels can have a significant effect on the overall model performance. Since PubLayNet, DocBank and DocLayNet all have different label sets, it is of particular interest to understand and quantify this influence of the label set on the model performance. We investigate this by either down-mapping labels into more common ones (e.g. Caption \u2192 Text ) or excluding them from the annotations entirely. Furthermore, it must be stressed that all mappings and exclusions were performed on the data before model training. In Table 3, we present the mAP scores for a Mask R-CNN R50 network on different label sets. Where a label is down-mapped, we show its corresponding label, otherwise it was excluded. We present three different label sets, with 6, 5 and 4 different labels respectively. The set of 5 labels contains the same labels as PubLayNet. However, due to the different definition of", "text": "The choice and number of labels can have a significant effect on the overall model performance. Since PubLayNet, DocBank and DocLayNet all have different label sets, it is of particular interest to understand and quantify this influence of the label set on the model performance. We investigate this by either down-mapping labels into more common ones (e.g. Caption \u2192 Text ) or excluding them from the annotations entirely. Furthermore, it must be stressed that all mappings and exclusions were performed on the data before model training. In Table 3, we present the mAP scores for a Mask R-CNN R50 network on different label sets. Where a label is down-mapped, we show its corresponding label, otherwise it was excluded. We present three different label sets, with 6, 5 and 4 different labels respectively. The set of 5 labels contains the same labels as PubLayNet. However, due to the different definition of"}, {"self_ref": "#/texts/469", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 317.659, "t": 705.12701, "r": 559.80682, "b": 663.77679, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 189]}], "orig": "Table 4: Performance of a Mask R-CNN R50 network with document-wise and page-wise split for different label sets. Naive page-wise split will result in GLYPH<tildelow> 10% point improvement.", "text": "Table 4: Performance of a Mask R-CNN R50 network with document-wise and page-wise split for different label sets. Naive page-wise split will result in GLYPH<tildelow> 10% point improvement."}, {"self_ref": "#/texts/470", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 317.686, "t": 460.59647, "r": 559.58496, "b": 375.50983, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 469]}], "orig": "lists in PubLayNet (grouped list-items) versus DocLayNet (separate list-items), the label set of size 4 is the closest to PubLayNet, in the assumption that the List is down-mapped to Text in PubLayNet. The results in Table 3 show that the prediction accuracy on the remaining class labels does not change significantly when other classes are merged into them. The overall macro-average improves by around 5%, in particular when Page-footer and Page-header are excluded.", "text": "lists in PubLayNet (grouped list-items) versus DocLayNet (separate list-items), the label set of size 4 is the closest to PubLayNet, in the assumption that the List is down-mapped to Text in PubLayNet. The results in Table 3 show that the prediction accuracy on the remaining class labels does not change significantly when other classes are merged into them. The overall macro-average improves by around 5%, in particular when Page-footer and Page-header are excluded."}, {"self_ref": "#/texts/471", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "section_header", "prov": [{"page_no": 7, "bbox": {"l": 317.95496, "t": 362.6051, "r": 549.8606, "b": 352.29602, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 46]}], "orig": "Impact of Document Split in Train and Test Set", "text": "Impact of Document Split in Train and Test Set", "level": 1}, {"self_ref": "#/texts/472", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 317.62299, "t": 347.40347, "r": 559.71381, "b": 196.56282, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 852]}], "orig": "Many documents in DocLayNet have a unique styling. In order to avoid overfitting on a particular style, we have split the train-, test- and validation-sets of DocLayNet on document boundaries, i.e. every document contributes pages to only one set. To the best of our knowledge, this was not considered in PubLayNet or DocBank. To quantify how this affects model performance, we trained and evaluated a Mask R-CNN R50 model on a modified dataset version. Here, the train-, test- and validation-sets were obtained by a randomised draw over the individual pages. As can be seen in Table 4, the difference in model performance is surprisingly large: pagewise splitting gains \u02dc 10% in mAP over the document-wise splitting. Thus, random page-wise splitting of DocLayNet can easily lead to accidental overestimation of model performance and should be avoided.", "text": "Many documents in DocLayNet have a unique styling. In order to avoid overfitting on a particular style, we have split the train-, test- and validation-sets of DocLayNet on document boundaries, i.e. every document contributes pages to only one set. To the best of our knowledge, this was not considered in PubLayNet or DocBank. To quantify how this affects model performance, we trained and evaluated a Mask R-CNN R50 model on a modified dataset version. Here, the train-, test- and validation-sets were obtained by a randomised draw over the individual pages. As can be seen in Table 4, the difference in model performance is surprisingly large: pagewise splitting gains \u02dc 10% in mAP over the document-wise splitting. Thus, random page-wise splitting of DocLayNet can easily lead to accidental overestimation of model performance and should be avoided."}, {"self_ref": "#/texts/473", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "section_header", "prov": [{"page_no": 7, "bbox": {"l": 317.95499, "t": 183.65808000000004, "r": 418.54776, "b": 173.34897999999998, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 18]}], "orig": "Dataset Comparison", "text": "Dataset Comparison", "level": 1}, {"self_ref": "#/texts/474", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 317.686, "t": 168.45645000000002, "r": 559.18817, "b": 83.35986300000002, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 521]}], "orig": "Throughout this paper, we claim that DocLayNet's wider variety of document layouts leads to more robust layout detection models. In Table 5, we provide evidence for that. We trained models on each of the available datasets (PubLayNet, DocBank and DocLayNet) and evaluated them on the test sets of the other datasets. Due to the different label sets and annotation styles, a direct comparison is not possible. Hence, we focussed on the common labels among the datasets. Between PubLayNet and DocLayNet, these are Picture ,", "text": "Throughout this paper, we claim that DocLayNet's wider variety of document layouts leads to more robust layout detection models. In Table 5, we provide evidence for that. We trained models on each of the available datasets (PubLayNet, DocBank and DocLayNet) and evaluated them on the test sets of the other datasets. Due to the different label sets and annotation styles, a direct comparison is not possible. Hence, we focussed on the common labels among the datasets. Between PubLayNet and DocLayNet, these are Picture ,"}, {"self_ref": "#/texts/475", "parent": {"cref": "#/body"}, "children": [], "content_layer": "furniture", "label": "page_header", "prov": [{"page_no": 8, "bbox": {"l": 53.79800000000001, "t": 731.69098, "r": 558.20288, "b": 723.4239499999999, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 130]}], "orig": "KDD '22, August 14-18, 2022, Washington, DC, USA Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar", "text": "KDD '22, August 14-18, 2022, Washington, DC, USA Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar"}, {"self_ref": "#/texts/476", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 53.501999, "t": 705.12708, "r": 295.64868, "b": 641.85889, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 298]}], "orig": "Table 5: Prediction Performance (mAP@0.5-0.95) of a Mask R-CNN R50 network across the PubLayNet, DocBank & DocLayNet data-sets. By evaluating on common label classes of each dataset, we observe that the DocLayNet-trained model has much less pronounced variations in performance across all datasets.", "text": "Table 5: Prediction Performance (mAP@0.5-0.95) of a Mask R-CNN R50 network across the PubLayNet, DocBank & DocLayNet data-sets. By evaluating on common label classes of each dataset, we observe that the DocLayNet-trained model has much less pronounced variations in performance across all datasets."}, {"self_ref": "#/texts/477", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 53.79800000000001, "t": 401.07947, "r": 294.04712, "b": 348.85986, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 295]}], "orig": "Section-header , Table and Text . Before training, we either mapped or excluded DocLayNet's other labels as specified in table 3, and also PubLayNet's List to Text . Note that the different clustering of lists (by list-element vs. whole list objects) naturally decreases the mAP score for Text .", "text": "Section-header , Table and Text . Before training, we either mapped or excluded DocLayNet's other labels as specified in table 3, and also PubLayNet's List to Text . Note that the different clustering of lists (by list-element vs. whole list objects) naturally decreases the mAP score for Text ."}, {"self_ref": "#/texts/478", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 53.466999, "t": 346.28546000000006, "r": 295.55908, "b": 206.40382, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 793]}], "orig": "For comparison of DocBank with DocLayNet, we trained only on Picture and Table clusters of each dataset. We had to exclude Text because successive paragraphs are often grouped together into a single object in DocBank. This paragraph grouping is incompatible with the individual paragraphs of DocLayNet. As can be seen in Table 5, DocLayNet trained models yield better performance compared to the previous datasets. It is noteworthy that the models trained on PubLayNet and DocBank perform very well on their own test set, but have a much lower performance on the foreign datasets. While this also applies to DocLayNet, the difference is far less pronounced. Thus we conclude that DocLayNet trained models are overall more robust and will produce better results for challenging, unseen layouts.", "text": "For comparison of DocBank with DocLayNet, we trained only on Picture and Table clusters of each dataset. We had to exclude Text because successive paragraphs are often grouped together into a single object in DocBank. This paragraph grouping is incompatible with the individual paragraphs of DocLayNet. As can be seen in Table 5, DocLayNet trained models yield better performance compared to the previous datasets. It is noteworthy that the models trained on PubLayNet and DocBank perform very well on their own test set, but have a much lower performance on the foreign datasets. While this also applies to DocLayNet, the difference is far less pronounced. Thus we conclude that DocLayNet trained models are overall more robust and will produce better results for challenging, unseen layouts."}, {"self_ref": "#/texts/479", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "section_header", "prov": [{"page_no": 8, "bbox": {"l": 53.79800000000001, "t": 186.93908999999996, "r": 156.00534, "b": 176.62999000000002, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 19]}], "orig": "Example Predictions", "text": "Example Predictions", "level": 1}, {"self_ref": "#/texts/480", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 53.528999, "t": 171.73645, "r": 295.55844, "b": 86.64982599999996, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 481]}], "orig": "To conclude this section, we illustrate the quality of layout predictions one can expect from DocLayNet-trained models by providing a selection of examples without any further post-processing applied. Figure 6 shows selected layout predictions on pages from the test-set of DocLayNet. Results look decent in general across document categories, however one can also observe mistakes such as overlapping clusters of different classes, or entirely missing boxes due to low confidence.", "text": "To conclude this section, we illustrate the quality of layout predictions one can expect from DocLayNet-trained models by providing a selection of examples without any further post-processing applied. Figure 6 shows selected layout predictions on pages from the test-set of DocLayNet. Results look decent in general across document categories, however one can also observe mistakes such as overlapping clusters of different classes, or entirely missing boxes due to low confidence."}, {"self_ref": "#/texts/481", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "section_header", "prov": [{"page_no": 8, "bbox": {"l": 317.95502, "t": 706.14014, "r": 405.72961, "b": 695.83099, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 12]}], "orig": "6 CONCLUSION", "text": "6 CONCLUSION", "level": 1}, {"self_ref": "#/texts/482", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 317.95499, "t": 690.93848, "r": 559.71375, "b": 605.85083, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 507]}], "orig": "In this paper, we presented the DocLayNet dataset. It provides the document conversion and layout analysis research community a new and challenging dataset to improve and fine-tune novel ML methods on. In contrast to many other datasets, DocLayNet was created by human annotation in order to obtain reliable layout ground-truth on a wide variety of publication- and typesettingstyles. Including a large proportion of documents outside the scientific publishing domain adds significant value in this respect.", "text": "In this paper, we presented the DocLayNet dataset. It provides the document conversion and layout analysis research community a new and challenging dataset to improve and fine-tune novel ML methods on. In contrast to many other datasets, DocLayNet was created by human annotation in order to obtain reliable layout ground-truth on a wide variety of publication- and typesettingstyles. Including a large proportion of documents outside the scientific publishing domain adds significant value in this respect."}, {"self_ref": "#/texts/483", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 317.686, "t": 603.26648, "r": 559.71704, "b": 507.22083, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 573]}], "orig": "From the dataset, we have derived on the one hand reference metrics for human performance on document-layout annotation (through double and triple annotations) and on the other hand evaluated the baseline performance of commonly used object detection methods. We also illustrated the impact of various dataset-related aspects on model performance through data-ablation experiments, both from a size and class-label perspective. Last but not least, we compared the accuracy of models trained on other public datasets and showed that DocLayNet trained models are more robust.", "text": "From the dataset, we have derived on the one hand reference metrics for human performance on document-layout annotation (through double and triple annotations) and on the other hand evaluated the baseline performance of commonly used object detection methods. We also illustrated the impact of various dataset-related aspects on model performance through data-ablation experiments, both from a size and class-label perspective. Last but not least, we compared the accuracy of models trained on other public datasets and showed that DocLayNet trained models are more robust."}, {"self_ref": "#/texts/484", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 317.62299, "t": 504.63647, "r": 558.43469, "b": 474.34383999999994, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 188]}], "orig": "To date, there is still a significant gap between human and ML accuracy on the layout interpretation task, and we hope that this work will inspire the research community to close that gap.", "text": "To date, there is still a significant gap between human and ML accuracy on the layout interpretation task, and we hope that this work will inspire the research community to close that gap."}, {"self_ref": "#/texts/485", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "section_header", "prov": [{"page_no": 8, "bbox": {"l": 317.95499, "t": 456.90811, "r": 387.3696, "b": 446.59903, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 10]}], "orig": "REFERENCES", "text": "REFERENCES", "level": 1}, {"self_ref": "#/texts/486", "parent": {"cref": "#/groups/3"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 8, "bbox": {"l": 321.198, "t": 443.29767, "r": 558.20099, "b": 420.83713000000006, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 191]}], "orig": "[1] Max G\u00f6bel, Tamir Hassan, Ermelinda Oro, and Giorgio Orsi. Icdar 2013 table competition. In 2013 12th International Conference on Document Analysis and Recognition , pages 1449-1453, 2013.", "text": "[1] Max G\u00f6bel, Tamir Hassan, Ermelinda Oro, and Giorgio Orsi. Icdar 2013 table competition. In 2013 12th International Conference on Document Analysis and Recognition , pages 1449-1453, 2013.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/487", "parent": {"cref": "#/groups/3"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 8, "bbox": {"l": 321.198, "t": 419.38763, "r": 559.37982, "b": 388.95712000000003, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 279]}], "orig": "[2] Christian Clausner, Apostolos Antonacopoulos, and Stefan Pletschacher. Icdar2017 competition on recognition of documents with complex layouts rdcl2017. In 2017 14th IAPR International Conference on Document Analysis and Recognition (ICDAR) , volume 01, pages 1404-1410, 2017.", "text": "[2] Christian Clausner, Apostolos Antonacopoulos, and Stefan Pletschacher. Icdar2017 competition on recognition of documents with complex layouts rdcl2017. In 2017 14th IAPR International Conference on Document Analysis and Recognition (ICDAR) , volume 01, pages 1404-1410, 2017.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/488", "parent": {"cref": "#/groups/3"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 8, "bbox": {"l": 321.198, "t": 387.50763, "r": 558.20013, "b": 365.05310000000003, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 213]}], "orig": "[3] Herv\u00e9 D\u00e9jean, Jean-Luc Meunier, Liangcai Gao, Yilun Huang, Yu Fang, Florian Kleber, and Eva-Maria Lang. ICDAR 2019 Competition on Table Detection and Recognition (cTDaR), April 2019. http://sac.founderit.com/.", "text": "[3] Herv\u00e9 D\u00e9jean, Jean-Luc Meunier, Liangcai Gao, Yilun Huang, Yu Fang, Florian Kleber, and Eva-Maria Lang. ICDAR 2019 Competition on Table Detection and Recognition (cTDaR), April 2019. http://sac.founderit.com/.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/489", "parent": {"cref": "#/groups/3"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 8, "bbox": {"l": 321.198, "t": 363.59665, "r": 559.37872, "b": 333.1731, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 251]}], "orig": "[4] Antonio Jimeno Yepes, Peter Zhong, and Douglas Burdick. Competition on scientific literature parsing. In Proceedings of the International Conference on Document Analysis and Recognition , ICDAR, pages 605-617. LNCS 12824, SpringerVerlag, sep 2021.", "text": "[4] Antonio Jimeno Yepes, Peter Zhong, and Douglas Burdick. Competition on scientific literature parsing. In Proceedings of the International Conference on Document Analysis and Recognition , ICDAR, pages 605-617. LNCS 12824, SpringerVerlag, sep 2021.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/490", "parent": {"cref": "#/groups/3"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 8, "bbox": {"l": 321.198, "t": 331.71664, "r": 559.02625, "b": 301.29208, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 261]}], "orig": "[5] Logan Markewich, Hao Zhang, Yubin Xing, Navid Lambert-Shirzad, Jiang Zhexin, Roy Lee, Zhi Li, and Seok-Bum Ko. Segmentation for document layout analysis: not dead yet. International Journal on Document Analysis and Recognition (IJDAR) , pages 1-11, 01 2022.", "text": "[5] Logan Markewich, Hao Zhang, Yubin Xing, Navid Lambert-Shirzad, Jiang Zhexin, Roy Lee, Zhi Li, and Seok-Bum Ko. Segmentation for document layout analysis: not dead yet. International Journal on Document Analysis and Recognition (IJDAR) , pages 1-11, 01 2022.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/491", "parent": {"cref": "#/groups/3"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 8, "bbox": {"l": 321.198, "t": 299.83563, "r": 558.20361, "b": 277.3751199999999, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 235]}], "orig": "[6] Xu Zhong, Jianbin Tang, and Antonio Jimeno-Yepes. Publaynet: Largest dataset ever for document layout analysis. In Proceedings of the International Conference on Document Analysis and Recognition , ICDAR, pages 1015-1022, sep 2019.", "text": "[6] Xu Zhong, Jianbin Tang, and Antonio Jimeno-Yepes. Publaynet: Largest dataset ever for document layout analysis. In Proceedings of the International Conference on Document Analysis and Recognition , ICDAR, pages 1015-1022, sep 2019.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/492", "parent": {"cref": "#/groups/3"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 8, "bbox": {"l": 321.19797, "t": 275.92562999999996, "r": 558.9715, "b": 237.53111, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 316]}], "orig": "[7] Minghao Li, Yiheng Xu, Lei Cui, Shaohan Huang, Furu Wei, Zhoujun Li, and Ming Zhou. Docbank: A benchmark dataset for document layout analysis. In Proceedings of the 28th International Conference on Computational Linguistics , COLING, pages 949-960. International Committee on Computational Linguistics, dec 2020.", "text": "[7] Minghao Li, Yiheng Xu, Lei Cui, Shaohan Huang, Furu Wei, Zhoujun Li, and Ming Zhou. Docbank: A benchmark dataset for document layout analysis. In Proceedings of the 28th International Conference on Computational Linguistics , COLING, pages 949-960. International Committee on Computational Linguistics, dec 2020.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/493", "parent": {"cref": "#/groups/3"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 8, "bbox": {"l": 321.198, "t": 236.07465000000002, "r": 558.90222, "b": 213.61414000000002, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 172]}], "orig": "[8] Riaz Ahmad, Muhammad Tanvir Afzal, and M. Qadir. Information extraction from pdf sources based on rule-based system using integrated formats. In SemWebEval@ESWC , 2016.", "text": "[8] Riaz Ahmad, Muhammad Tanvir Afzal, and M. Qadir. Information extraction from pdf sources based on rule-based system using integrated formats. In SemWebEval@ESWC , 2016.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/494", "parent": {"cref": "#/groups/3"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 8, "bbox": {"l": 321.198, "t": 212.16463999999996, "r": 559.27448, "b": 181.74109999999996, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 271]}], "orig": "[9] Ross B. Girshick, Jeff Donahue, Trevor Darrell, and Jitendra Malik. Rich feature hierarchies for accurate object detection and semantic segmentation. In IEEE Conference on Computer Vision and Pattern Recognition , CVPR, pages 580-587. IEEE Computer Society, jun 2014.", "text": "[9] Ross B. Girshick, Jeff Donahue, Trevor Darrell, and Jitendra Malik. Rich feature hierarchies for accurate object detection and semantic segmentation. In IEEE Conference on Computer Vision and Pattern Recognition , CVPR, pages 580-587. IEEE Computer Society, jun 2014.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/495", "parent": {"cref": "#/groups/3"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 8, "bbox": {"l": 317.95499, "t": 180.28463999999997, "r": 558.20203, "b": 165.79314, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 149]}], "orig": "[10] Ross B. Girshick. Fast R-CNN. In 2015 IEEE International Conference on Computer Vision , ICCV, pages 1440-1448. IEEE Computer Society, dec 2015.", "text": "[10] Ross B. Girshick. Fast R-CNN. In 2015 IEEE International Conference on Computer Vision , ICCV, pages 1440-1448. IEEE Computer Society, dec 2015.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/496", "parent": {"cref": "#/groups/3"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 8, "bbox": {"l": 317.95499, "t": 164.34362999999996, "r": 558.20142, "b": 141.88312999999994, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 227]}], "orig": "[11] Shaoqing Ren, Kaiming He, Ross Girshick, and Jian Sun. Faster r-cnn: Towards real-time object detection with region proposal networks. IEEE Transactions on Pattern Analysis and Machine Intelligence , 39(6):1137-1149, 2017.", "text": "[11] Shaoqing Ren, Kaiming He, Ross Girshick, and Jian Sun. Faster r-cnn: Towards real-time object detection with region proposal networks. IEEE Transactions on Pattern Analysis and Machine Intelligence , 39(6):1137-1149, 2017.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/497", "parent": {"cref": "#/groups/3"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 8, "bbox": {"l": 317.95499, "t": 140.43362000000002, "r": 559.27808, "b": 117.98010999999997, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 192]}], "orig": "[12] Kaiming He, Georgia Gkioxari, Piotr Doll\u00e1r, and Ross B. Girshick. Mask R-CNN. In IEEE International Conference on Computer Vision , ICCV, pages 2980-2988. IEEE Computer Society, Oct 2017.", "text": "[12] Kaiming He, Georgia Gkioxari, Piotr Doll\u00e1r, and Ross B. Girshick. Mask R-CNN. In IEEE International Conference on Computer Vision , ICCV, pages 2980-2988. IEEE Computer Society, Oct 2017.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/498", "parent": {"cref": "#/groups/3"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 8, "bbox": {"l": 317.95499, "t": 116.52364, "r": 558.97156, "b": 86.099106, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 305]}], "orig": "[13] Glenn Jocher, Alex Stoken, Ayush Chaurasia, Jirka Borovec, NanoCode012, TaoXie, Yonghye Kwon, Kalen Michael, Liu Changyu, Jiacong Fang, Abhiram V, Laughing, tkianai, yxNONG, Piotr Skalski, Adam Hogan, Jebastin Nadar, imyhxy, Lorenzo Mammana, Alex Wang, Cristi Fati, Diego Montes, Jan Hajek, Laurentiu", "text": "[13] Glenn Jocher, Alex Stoken, Ayush Chaurasia, Jirka Borovec, NanoCode012, TaoXie, Yonghye Kwon, Kalen Michael, Liu Changyu, Jiacong Fang, Abhiram V, Laughing, tkianai, yxNONG, Piotr Skalski, Adam Hogan, Jebastin Nadar, imyhxy, Lorenzo Mammana, Alex Wang, Cristi Fati, Diego Montes, Jan Hajek, Laurentiu", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/499", "parent": {"cref": "#/body"}, "children": [], "content_layer": "furniture", "label": "page_header", "prov": [{"page_no": 9, "bbox": {"l": 53.79800000000001, "t": 731.69098, "r": 347.01724, "b": 723.4239499999999, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 71]}], "orig": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis", "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis"}, {"self_ref": "#/texts/500", "parent": {"cref": "#/body"}, "children": [], "content_layer": "furniture", "label": "page_header", "prov": [{"page_no": 9, "bbox": {"l": 365.75702, "t": 731.69098, "r": 558.20282, "b": 723.4239499999999, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 48]}], "orig": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA"}, {"self_ref": "#/texts/501", "parent": {"cref": "#/pictures/5"}, "children": [], "content_layer": "body", "label": "caption", "prov": [{"page_no": 9, "bbox": {"l": 62.323874999999994, "t": 349.71457, "r": 318.50473, "b": 343.73517, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 89]}], "orig": "Text Caption List-Item Formula Table Section-Header Picture Page-Header Page-Footer Title", "text": "Text Caption List-Item Formula Table Section-Header Picture Page-Header Page-Footer Title"}, {"self_ref": "#/texts/502", "parent": {"cref": "#/pictures/5"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 9, "bbox": {"l": 231.8804, "t": 490.49457, "r": 235.14504999999997, "b": 377.30856, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 64]}], "orig": "4bed2a8aa51ac37058e79605821bbc426d032b0b6ca8bdf3409ed8508ccd8c67", "text": "4bed2a8aa51ac37058e79605821bbc426d032b0b6ca8bdf3409ed8508ccd8c67"}, {"self_ref": "#/texts/503", "parent": {"cref": "#/pictures/5"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 9, "bbox": {"l": 395.06876, "t": 674.62817, "r": 398.33353, "b": 561.44214, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 64]}], "orig": "2f2a06d08f5ad565d0f5e815f4ddf666365b2cff435cdaeb8850217e8a8efabf", "text": "2f2a06d08f5ad565d0f5e815f4ddf666365b2cff435cdaeb8850217e8a8efabf"}, {"self_ref": "#/texts/504", "parent": {"cref": "#/pictures/5"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 9, "bbox": {"l": 55.775887, "t": 490.49457, "r": 59.04052000000001, "b": 377.30856, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 64]}], "orig": "7f2fd7293e04bf4f1756ae51f5779764933da1d1d2002e3915356050570fc75b", "text": "7f2fd7293e04bf4f1756ae51f5779764933da1d1d2002e3915356050570fc75b"}, {"self_ref": "#/texts/505", "parent": {"cref": "#/pictures/5"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 9, "bbox": {"l": 232.01364, "t": 674.62817, "r": 235.27841000000004, "b": 561.44214, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 64]}], "orig": "1b81cf65f47456ad4faa725d1eb09879bd633af16cfe2bf8cea661b87907bfac", "text": "1b81cf65f47456ad4faa725d1eb09879bd633af16cfe2bf8cea661b87907bfac"}, {"self_ref": "#/texts/506", "parent": {"cref": "#/pictures/5"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 9, "bbox": {"l": 395.20047, "t": 490.49457, "r": 398.46512, "b": 377.30856, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 64]}], "orig": "b60da9d26f488cb133e47d101d35fda1bdca2671ade60764d1cd569590270327", "text": "b60da9d26f488cb133e47d101d35fda1bdca2671ade60764d1cd569590270327"}, {"self_ref": "#/texts/507", "parent": {"cref": "#/pictures/5"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 9, "bbox": {"l": 55.775818, "t": 674.62817, "r": 65.409912, "b": 561.44214, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 70]}], "orig": "2b7b8355a42ebef0cf91583aad9f30f7c9fa63c5b05911730ba15275c024965b$^{A}$", "text": "2b7b8355a42ebef0cf91583aad9f30f7c9fa63c5b05911730ba15275c024965b$^{A}$"}, {"self_ref": "#/texts/508", "parent": {"cref": "#/pictures/5"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 9, "bbox": {"l": 234.56980999999996, "t": 703.4981699999998, "r": 240.06987, "b": 694.9890100000001, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "B", "text": "B"}, {"self_ref": "#/texts/509", "parent": {"cref": "#/pictures/5"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 9, "bbox": {"l": 397.81934, "t": 703.10645, "r": 403.3194, "b": 694.59729, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/510", "parent": {"cref": "#/pictures/5"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 9, "bbox": {"l": 59.909843, "t": 525.24115, "r": 65.409912, "b": 516.73206, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "D", "text": "D"}, {"self_ref": "#/texts/511", "parent": {"cref": "#/pictures/5"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 9, "bbox": {"l": 234.77386, "t": 525.63293, "r": 239.85495000000003, "b": 517.12384, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "E", "text": "E"}, {"self_ref": "#/texts/512", "parent": {"cref": "#/pictures/5"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 9, "bbox": {"l": 398.26144, "t": 525.24115, "r": 402.91592, "b": 516.73206, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "F", "text": "F"}, {"self_ref": "#/texts/513", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 9, "bbox": {"l": 53.79800000000001, "t": 327.51801, "r": 559.80786, "b": 286.16876, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 386]}], "orig": "Figure 6: Example layout predictions on selected pages from the DocLayNet test-set. (A, D) exhibit favourable results on coloured backgrounds. (B, C) show accurate list-item and paragraph differentiation despite densely-spaced lines. (E) demonstrates good table and figure distinction. (F) shows predictions on a Chinese patent with multiple overlaps, label confusion and missing boxes.", "text": "Figure 6: Example layout predictions on selected pages from the DocLayNet test-set. (A, D) exhibit favourable results on coloured backgrounds. (B, C) show accurate list-item and paragraph differentiation despite densely-spaced lines. (E) demonstrates good table and figure distinction. (F) shows predictions on a Chinese patent with multiple overlaps, label confusion and missing boxes."}, {"self_ref": "#/texts/514", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 9, "bbox": {"l": 69.234001, "t": 264.93364999999994, "r": 295.22406, "b": 242.4801, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 195]}], "orig": "Diaconu, Mai Thanh Minh, Marc, albinxavi, fatih, oleg, and wanghao yang. ultralytics/yolov5: v6.0 - yolov5n nano models, roboflow integration, tensorflow export, opencv dnn support, October 2021.", "text": "Diaconu, Mai Thanh Minh, Marc, albinxavi, fatih, oleg, and wanghao yang. ultralytics/yolov5: v6.0 - yolov5n nano models, roboflow integration, tensorflow export, opencv dnn support, October 2021."}, {"self_ref": "#/texts/515", "parent": {"cref": "#/groups/4"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 9, "bbox": {"l": 317.95499, "t": 264.93362, "r": 559.02637, "b": 250.45010000000002, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 153]}], "orig": "[20] Shoubin Li, Xuyan Ma, Shuaiqun Pan, Jun Hu, Lin Shi, and Qing Wang. Vtlayout: Fusion of visual and text features for document layout analysis, 2021.", "text": "[20] Shoubin Li, Xuyan Ma, Shuaiqun Pan, Jun Hu, Lin Shi, and Qing Wang. Vtlayout: Fusion of visual and text features for document layout analysis, 2021.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/516", "parent": {"cref": "#/groups/4"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 9, "bbox": {"l": 53.79800000000001, "t": 241.02362000000005, "r": 295.12177, "b": 218.56313999999998, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 190]}], "orig": "[14] Nicolas Carion, Francisco Massa, Gabriel Synnaeve, Nicolas Usunier, Alexander Kirillov, and Sergey Zagoruyko. End-to-end object detection with transformers. CoRR , abs/2005.12872, 2020.", "text": "[14] Nicolas Carion, Francisco Massa, Gabriel Synnaeve, Nicolas Usunier, Alexander Kirillov, and Sergey Zagoruyko. End-to-end object detection with transformers. CoRR , abs/2005.12872, 2020.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/517", "parent": {"cref": "#/groups/4"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 9, "bbox": {"l": 53.79800000000001, "t": 217.11365, "r": 294.04224, "b": 202.62212999999997, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 132]}], "orig": "[15] Mingxing Tan, Ruoming Pang, and Quoc V. Le. Efficientdet: Scalable and efficient object detection. CoRR , abs/1911.09070, 2019.", "text": "[15] Mingxing Tan, Ruoming Pang, and Quoc V. Le. Efficientdet: Scalable and efficient object detection. CoRR , abs/1911.09070, 2019.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/518", "parent": {"cref": "#/groups/4"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 9, "bbox": {"l": 53.79800399999999, "t": 201.17264, "r": 295.22263, "b": 178.71910000000003, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 219]}], "orig": "[16] Tsung-Yi Lin, Michael Maire, Serge J. Belongie, Lubomir D. Bourdev, Ross B. Girshick, James Hays, Pietro Perona, Deva Ramanan, Piotr Doll\u00e1r, and C. Lawrence Zitnick. Microsoft COCO: common objects in context, 2014.", "text": "[16] Tsung-Yi Lin, Michael Maire, Serge J. Belongie, Lubomir D. Bourdev, Ross B. Girshick, James Hays, Pietro Perona, Deva Ramanan, Piotr Doll\u00e1r, and C. Lawrence Zitnick. Microsoft COCO: common objects in context, 2014.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/519", "parent": {"cref": "#/groups/4"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 9, "bbox": {"l": 53.79800000000001, "t": 177.26263000000006, "r": 295.12009, "b": 162.77910999999995, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 100]}], "orig": "[17] Yuxin Wu, Alexander Kirillov, Francisco Massa, Wan-Yen Lo, and Ross Girshick. Detectron2, 2019.", "text": "[17] Yuxin Wu, Alexander Kirillov, Francisco Massa, Wan-Yen Lo, and Ross Girshick. Detectron2, 2019.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/520", "parent": {"cref": "#/groups/4"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 9, "bbox": {"l": 53.79800000000001, "t": 161.32263, "r": 294.8089, "b": 122.92811000000006, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 339]}], "orig": "[18] Nikolaos Livathinos, Cesar Berrospi, Maksym Lysak, Viktor Kuropiatnyk, Ahmed Nassar, Andre Carvalho, Michele Dolfi, Christoph Auer, Kasper Dinkla, and Peter W. J. Staar. Robust pdf document conversion using recurrent neural networks. In Proceedings of the 35th Conference on Artificial Intelligence , AAAI, pages 1513715145, feb 2021.", "text": "[18] Nikolaos Livathinos, Cesar Berrospi, Maksym Lysak, Viktor Kuropiatnyk, Ahmed Nassar, Andre Carvalho, Michele Dolfi, Christoph Auer, Kasper Dinkla, and Peter W. J. Staar. Robust pdf document conversion using recurrent neural networks. In Proceedings of the 35th Conference on Artificial Intelligence , AAAI, pages 1513715145, feb 2021.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/521", "parent": {"cref": "#/groups/4"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 9, "bbox": {"l": 53.797997, "t": 121.47163, "r": 295.22174, "b": 83.07811000000004, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 336]}], "orig": "[19] Yiheng Xu, Minghao Li, Lei Cui, Shaohan Huang, Furu Wei, and Ming Zhou. Layoutlm: Pre-training of text and layout for document image understanding. In Proceedings of the 26th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining , KDD, pages 1192-1200, New York, USA, 2020. Association for Computing Machinery.", "text": "[19] Yiheng Xu, Minghao Li, Lei Cui, Shaohan Huang, Furu Wei, and Ming Zhou. Layoutlm: Pre-training of text and layout for document image understanding. In Proceedings of the 26th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining , KDD, pages 1192-1200, New York, USA, 2020. Association for Computing Machinery.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/522", "parent": {"cref": "#/groups/4"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 9, "bbox": {"l": 317.95499, "t": 248.99361999999996, "r": 558.9715, "b": 226.54009999999994, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 188]}], "orig": "[21] Peng Zhang, Can Li, Liang Qiao, Zhanzhan Cheng, Shiliang Pu, Yi Niu, and Fei Wu. Vsr: A unified framework for document layout analysis combining vision, semantics and relations, 2021.", "text": "[21] Peng Zhang, Can Li, Liang Qiao, Zhanzhan Cheng, Shiliang Pu, Yi Niu, and Fei Wu. Vsr: A unified framework for document layout analysis combining vision, semantics and relations, 2021.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/523", "parent": {"cref": "#/groups/4"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 9, "bbox": {"l": 317.95499, "t": 225.08365000000003, "r": 559.27539, "b": 194.65212999999994, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 290]}], "orig": "[22] Peter W J Staar, Michele Dolfi, Christoph Auer, and Costas Bekas. Corpus conversion service: A machine learning platform to ingest documents at scale. In Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining , KDD, pages 774-782. ACM, 2018.", "text": "[22] Peter W J Staar, Michele Dolfi, Christoph Auer, and Costas Bekas. Corpus conversion service: A machine learning platform to ingest documents at scale. In Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining , KDD, pages 774-782. ACM, 2018.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/524", "parent": {"cref": "#/groups/4"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 9, "bbox": {"l": 317.95499, "t": 193.20263999999997, "r": 559.3783, "b": 178.71213, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 138]}], "orig": "[23] Connor Shorten and Taghi M. Khoshgoftaar. A survey on image data augmentation for deep learning. Journal of Big Data , 6(1):60, 2019.", "text": "[23] Connor Shorten and Taghi M. Khoshgoftaar. A survey on image data augmentation for deep learning. Journal of Big Data , 6(1):60, 2019.", "enumerated": false, "marker": "-"}], "pictures": [{"self_ref": "#/pictures/0", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/16"}, {"cref": "#/texts/17"}, {"cref": "#/texts/18"}, {"cref": "#/texts/19"}, {"cref": "#/texts/20"}, {"cref": "#/texts/21"}, {"cref": "#/texts/22"}, {"cref": "#/texts/23"}, {"cref": "#/texts/24"}, {"cref": "#/texts/25"}, {"cref": "#/texts/26"}, {"cref": "#/texts/27"}, {"cref": "#/texts/28"}, {"cref": "#/texts/29"}, {"cref": "#/texts/30"}, {"cref": "#/texts/31"}, {"cref": "#/texts/32"}, {"cref": "#/texts/33"}, {"cref": "#/texts/34"}, {"cref": "#/texts/35"}, {"cref": "#/texts/36"}, {"cref": "#/texts/37"}, {"cref": "#/texts/38"}, {"cref": "#/texts/39"}, {"cref": "#/texts/40"}, {"cref": "#/texts/41"}, {"cref": "#/texts/42"}, {"cref": "#/texts/43"}, {"cref": "#/texts/44"}, {"cref": "#/texts/45"}, {"cref": "#/texts/46"}, {"cref": "#/texts/47"}, {"cref": "#/texts/48"}, {"cref": "#/texts/49"}, {"cref": "#/texts/50"}, {"cref": "#/texts/51"}, {"cref": "#/texts/52"}, {"cref": "#/texts/53"}, {"cref": "#/texts/54"}, {"cref": "#/texts/55"}, {"cref": "#/texts/56"}, {"cref": "#/texts/57"}, {"cref": "#/texts/58"}, {"cref": "#/texts/59"}, {"cref": "#/texts/60"}, {"cref": "#/texts/61"}, {"cref": "#/texts/62"}, {"cref": "#/texts/63"}, {"cref": "#/texts/64"}, {"cref": "#/texts/65"}, {"cref": "#/texts/66"}, {"cref": "#/texts/67"}, {"cref": "#/texts/68"}, {"cref": "#/texts/69"}, {"cref": "#/texts/70"}, {"cref": "#/texts/71"}, {"cref": "#/texts/72"}, {"cref": "#/texts/73"}, {"cref": "#/texts/74"}, {"cref": "#/texts/75"}, {"cref": "#/texts/76"}, {"cref": "#/texts/77"}, {"cref": "#/texts/78"}, {"cref": "#/texts/79"}, {"cref": "#/texts/80"}, {"cref": "#/texts/81"}, {"cref": "#/texts/82"}, {"cref": "#/texts/83"}, {"cref": "#/texts/84"}, {"cref": "#/texts/85"}, {"cref": "#/texts/86"}, {"cref": "#/texts/87"}, {"cref": "#/texts/88"}, {"cref": "#/texts/89"}, {"cref": "#/texts/90"}, {"cref": "#/texts/91"}, {"cref": "#/texts/92"}, {"cref": "#/texts/93"}, {"cref": "#/texts/94"}, {"cref": "#/texts/95"}, {"cref": "#/texts/96"}, {"cref": "#/texts/97"}, {"cref": "#/texts/98"}, {"cref": "#/texts/99"}, {"cref": "#/texts/100"}, {"cref": "#/texts/101"}, {"cref": "#/texts/102"}, {"cref": "#/texts/103"}, {"cref": "#/texts/104"}, {"cref": "#/texts/105"}, {"cref": "#/texts/106"}, {"cref": "#/texts/107"}, {"cref": "#/texts/108"}, {"cref": "#/texts/109"}, {"cref": "#/texts/110"}, {"cref": "#/texts/111"}, {"cref": "#/texts/112"}, {"cref": "#/texts/113"}, {"cref": "#/texts/114"}, {"cref": "#/texts/115"}, {"cref": "#/texts/116"}, {"cref": "#/texts/117"}, {"cref": "#/texts/118"}, {"cref": "#/texts/119"}, {"cref": "#/texts/120"}, {"cref": "#/texts/121"}, {"cref": "#/texts/122"}, {"cref": "#/texts/123"}, {"cref": "#/texts/124"}, {"cref": "#/texts/125"}, {"cref": "#/texts/126"}, {"cref": "#/texts/127"}, {"cref": "#/texts/128"}, {"cref": "#/texts/129"}, {"cref": "#/texts/130"}, {"cref": "#/texts/131"}, {"cref": "#/texts/132"}, {"cref": "#/texts/133"}, {"cref": "#/texts/134"}, {"cref": "#/texts/135"}, {"cref": "#/texts/136"}, {"cref": "#/texts/137"}, {"cref": "#/texts/138"}, {"cref": "#/texts/139"}, {"cref": "#/texts/140"}, {"cref": "#/texts/141"}, {"cref": "#/texts/142"}, {"cref": "#/texts/143"}, {"cref": "#/texts/144"}, {"cref": "#/texts/145"}, {"cref": "#/texts/146"}, {"cref": "#/texts/147"}, {"cref": "#/texts/148"}, {"cref": "#/texts/149"}, {"cref": "#/texts/150"}, {"cref": "#/texts/151"}, {"cref": "#/texts/152"}, {"cref": "#/texts/153"}, {"cref": "#/texts/154"}, {"cref": "#/texts/155"}, {"cref": "#/texts/156"}, {"cref": "#/texts/157"}, {"cref": "#/texts/158"}, {"cref": "#/texts/159"}, {"cref": "#/texts/160"}, {"cref": "#/texts/161"}, {"cref": "#/texts/162"}, {"cref": "#/texts/163"}, {"cref": "#/texts/164"}, {"cref": "#/texts/165"}, {"cref": "#/texts/166"}, {"cref": "#/texts/167"}, {"cref": "#/texts/168"}, {"cref": "#/texts/169"}, {"cref": "#/texts/170"}, {"cref": "#/texts/171"}, {"cref": "#/texts/172"}, {"cref": "#/texts/173"}, {"cref": "#/texts/174"}, {"cref": "#/texts/175"}, {"cref": "#/texts/176"}, {"cref": "#/texts/177"}, {"cref": "#/texts/178"}, {"cref": "#/texts/179"}, {"cref": "#/texts/180"}, {"cref": "#/texts/181"}, {"cref": "#/texts/182"}, {"cref": "#/texts/183"}, {"cref": "#/texts/184"}, {"cref": "#/texts/185"}, {"cref": "#/texts/186"}, {"cref": "#/texts/187"}, {"cref": "#/texts/188"}, {"cref": "#/texts/189"}, {"cref": "#/texts/190"}, {"cref": "#/texts/191"}, {"cref": "#/texts/192"}, {"cref": "#/texts/193"}, {"cref": "#/texts/194"}, {"cref": "#/texts/195"}, {"cref": "#/texts/196"}, {"cref": "#/texts/197"}, {"cref": "#/texts/198"}, {"cref": "#/texts/199"}, {"cref": "#/texts/200"}, {"cref": "#/texts/201"}, {"cref": "#/texts/202"}, {"cref": "#/texts/203"}, {"cref": "#/texts/204"}, {"cref": "#/texts/205"}, {"cref": "#/texts/206"}, {"cref": "#/texts/207"}, {"cref": "#/texts/208"}, {"cref": "#/texts/209"}, {"cref": "#/texts/210"}, {"cref": "#/texts/211"}, {"cref": "#/texts/212"}, {"cref": "#/texts/213"}, {"cref": "#/texts/214"}, {"cref": "#/texts/215"}, {"cref": "#/texts/216"}, {"cref": "#/texts/217"}, {"cref": "#/texts/218"}, {"cref": "#/texts/219"}, {"cref": "#/texts/220"}, {"cref": "#/texts/221"}, {"cref": "#/texts/222"}, {"cref": "#/texts/223"}, {"cref": "#/texts/224"}, {"cref": "#/texts/225"}, {"cref": "#/texts/226"}, {"cref": "#/texts/227"}, {"cref": "#/texts/228"}, {"cref": "#/texts/229"}, {"cref": "#/texts/230"}, {"cref": "#/texts/231"}, {"cref": "#/texts/232"}, {"cref": "#/texts/233"}, {"cref": "#/texts/234"}, {"cref": "#/texts/235"}, {"cref": "#/texts/236"}, {"cref": "#/texts/237"}, {"cref": "#/texts/238"}, {"cref": "#/texts/239"}, {"cref": "#/texts/240"}, {"cref": "#/texts/241"}, {"cref": "#/texts/242"}, {"cref": "#/texts/243"}, {"cref": "#/texts/244"}, {"cref": "#/texts/245"}, {"cref": "#/texts/246"}, {"cref": "#/texts/247"}, {"cref": "#/texts/248"}, {"cref": "#/texts/249"}, {"cref": "#/texts/250"}, {"cref": "#/texts/251"}, {"cref": "#/texts/252"}, {"cref": "#/texts/253"}, {"cref": "#/texts/254"}, {"cref": "#/texts/255"}, {"cref": "#/texts/256"}, {"cref": "#/texts/257"}, {"cref": "#/texts/258"}, {"cref": "#/texts/259"}, {"cref": "#/texts/260"}, {"cref": "#/texts/261"}, {"cref": "#/texts/262"}, {"cref": "#/texts/263"}, {"cref": "#/texts/264"}, {"cref": "#/texts/265"}, {"cref": "#/texts/266"}, {"cref": "#/texts/267"}, {"cref": "#/texts/268"}, {"cref": "#/texts/269"}, {"cref": "#/texts/270"}, {"cref": "#/texts/271"}, {"cref": "#/texts/272"}, {"cref": "#/texts/273"}, {"cref": "#/texts/274"}, {"cref": "#/texts/275"}, {"cref": "#/texts/276"}, {"cref": "#/texts/277"}, {"cref": "#/texts/278"}, {"cref": "#/texts/279"}, {"cref": "#/texts/280"}, {"cref": "#/texts/281"}, {"cref": "#/texts/282"}, {"cref": "#/texts/283"}, {"cref": "#/texts/284"}, {"cref": "#/texts/285"}, {"cref": "#/texts/286"}, {"cref": "#/texts/287"}, {"cref": "#/texts/288"}, {"cref": "#/texts/289"}, {"cref": "#/texts/290"}, {"cref": "#/texts/291"}, {"cref": "#/texts/292"}, {"cref": "#/texts/293"}, {"cref": "#/texts/294"}, {"cref": "#/texts/295"}, {"cref": "#/texts/296"}, {"cref": "#/texts/297"}, {"cref": "#/texts/298"}, {"cref": "#/texts/299"}, {"cref": "#/texts/300"}, {"cref": "#/texts/301"}, {"cref": "#/texts/302"}, {"cref": "#/texts/303"}, {"cref": "#/texts/304"}, {"cref": "#/texts/305"}, {"cref": "#/texts/306"}, {"cref": "#/texts/307"}, {"cref": "#/texts/308"}, {"cref": "#/texts/309"}, {"cref": "#/texts/310"}, {"cref": "#/texts/311"}, {"cref": "#/texts/312"}, {"cref": "#/texts/313"}, {"cref": "#/texts/314"}, {"cref": "#/texts/315"}, {"cref": "#/texts/316"}, {"cref": "#/texts/317"}, {"cref": "#/texts/318"}, {"cref": "#/texts/319"}, {"cref": "#/texts/320"}, {"cref": "#/texts/321"}, {"cref": "#/texts/322"}, {"cref": "#/texts/323"}, {"cref": "#/texts/324"}, {"cref": "#/texts/325"}, {"cref": "#/texts/326"}, {"cref": "#/texts/327"}, {"cref": "#/texts/328"}, {"cref": "#/texts/329"}, {"cref": "#/texts/330"}, {"cref": "#/texts/331"}, {"cref": "#/texts/332"}, {"cref": "#/texts/333"}, {"cref": "#/texts/334"}, {"cref": "#/texts/335"}, {"cref": "#/texts/336"}, {"cref": "#/texts/337"}, {"cref": "#/texts/338"}, {"cref": "#/texts/339"}, {"cref": "#/texts/340"}, {"cref": "#/texts/341"}, {"cref": "#/texts/342"}, {"cref": "#/texts/343"}, {"cref": "#/texts/344"}, {"cref": "#/texts/345"}], "content_layer": "body", "label": "picture", "prov": [{"page_no": 1, "bbox": {"l": 323.408203125, "t": 541.6512603759766, "r": 553.2952270507812, "b": 266.1492919921875, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [{"cref": "#/texts/16"}], "references": [], "footnotes": [], "image": null, "annotations": []}, {"self_ref": "#/pictures/1", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/372"}, {"cref": "#/texts/373"}, {"cref": "#/texts/374"}, {"cref": "#/texts/375"}, {"cref": "#/texts/376"}, {"cref": "#/texts/377"}, {"cref": "#/texts/378"}, {"cref": "#/texts/379"}, {"cref": "#/texts/380"}, {"cref": "#/texts/381"}, {"cref": "#/texts/382"}, {"cref": "#/texts/383"}, {"cref": "#/texts/384"}], "content_layer": "body", "label": "picture", "prov": [{"page_no": 3, "bbox": {"l": 88.33030700683594, "t": 699.1134796142578, "r": 263.7049560546875, "b": 571.4317321777344, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [{"cref": "#/texts/372"}], "references": [], "footnotes": [], "image": null, "annotations": []}, {"self_ref": "#/pictures/2", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/397"}], "content_layer": "body", "label": "picture", "prov": [{"page_no": 4, "bbox": {"l": 53.05912780761719, "t": 481.2087097167969, "r": 295.8506164550781, "b": 251.135986328125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [{"cref": "#/texts/397"}], "references": [], "footnotes": [], "image": null, "annotations": []}, {"self_ref": "#/pictures/3", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/416"}, {"cref": "#/texts/417"}, {"cref": "#/texts/418"}, {"cref": "#/texts/419"}, {"cref": "#/texts/420"}, {"cref": "#/texts/421"}, {"cref": "#/texts/422"}, {"cref": "#/texts/423"}, {"cref": "#/texts/424"}, {"cref": "#/texts/425"}], "content_layer": "body", "label": "picture", "prov": [{"page_no": 5, "bbox": {"l": 315.960205078125, "t": 706.6611862182617, "r": 559.396484375, "b": 332.31915283203125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "annotations": []}, {"self_ref": "#/pictures/4", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/435"}, {"cref": "#/texts/436"}, {"cref": "#/texts/437"}, {"cref": "#/texts/438"}, {"cref": "#/texts/439"}, {"cref": "#/texts/440"}, {"cref": "#/texts/441"}, {"cref": "#/texts/442"}, {"cref": "#/texts/443"}, {"cref": "#/texts/444"}, {"cref": "#/texts/445"}, {"cref": "#/texts/446"}, {"cref": "#/texts/447"}, {"cref": "#/texts/448"}, {"cref": "#/texts/449"}, {"cref": "#/texts/450"}, {"cref": "#/texts/451"}, {"cref": "#/texts/452"}, {"cref": "#/texts/453"}, {"cref": "#/texts/454"}, {"cref": "#/texts/455"}, {"cref": "#/texts/456"}, {"cref": "#/texts/457"}], "content_layer": "body", "label": "picture", "prov": [{"page_no": 6, "bbox": {"l": 323.48431396484375, "t": 702.1139678955078, "r": 553.5411376953125, "b": 531.9892272949219, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [{"cref": "#/texts/435"}], "references": [], "footnotes": [], "image": null, "annotations": []}, {"self_ref": "#/pictures/5", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/501"}, {"cref": "#/texts/502"}, {"cref": "#/texts/503"}, {"cref": "#/texts/504"}, {"cref": "#/texts/505"}, {"cref": "#/texts/506"}, {"cref": "#/texts/507"}, {"cref": "#/texts/508"}, {"cref": "#/texts/509"}, {"cref": "#/texts/510"}, {"cref": "#/texts/511"}, {"cref": "#/texts/512"}], "content_layer": "body", "label": "picture", "prov": [{"page_no": 9, "bbox": {"l": 52.963985443115234, "t": 707.2641143798828, "r": 556.931640625, "b": 349.8648681640625, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [{"cref": "#/texts/501"}], "references": [], "footnotes": [], "image": null, "annotations": []}], "tables": [{"self_ref": "#/tables/0", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/396"}], "content_layer": "body", "label": "table", "prov": [{"page_no": 4, "bbox": {"l": 98.93103790283203, "t": 654.5245208740234, "r": 512.579833984375, "b": 497.91851806640625, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [{"cref": "#/texts/396"}], "references": [], "footnotes": [], "image": null, "data": {"table_cells": [{"bbox": {"l": 233.94400000000002, "t": 140.22351000000003, "r": 270.04272, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 4, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 6, "text": "% of Total", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 329.04999, "t": 140.22351000000003, "r": 483.3976400000001, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 6, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 6, "end_col_offset_idx": 12, "text": "triple inter-annotator mAP @ 0.5-0.95 (%)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 151.18255999999997, "r": 141.71277, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "class label", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 175.94701, "t": 151.18255999999997, "r": 198.71269, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Count", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 213.795, "t": 151.18255999999997, "r": 233.69144, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Train", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 249.37367, "t": 151.18255999999997, "r": 264.5, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Test", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 283.53568, "t": 151.18255999999997, "r": 295.30856, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Val", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 314.01501, "t": 151.18255999999997, "r": 324.98093, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "All", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 343.01236, "t": 151.18255999999997, "r": 354.65076, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "Fin", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 367.84033, "t": 151.18255999999997, "r": 384.32059, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "Man", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 407.54358, "t": 151.18255999999997, "r": 418.15979, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "Sci", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 432.29979999999995, "t": 151.18255999999997, "r": 447.82962, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "Law", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 465.72656, "t": 151.18255999999997, "r": 477.50842, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "Pat", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 493.52240000000006, "t": 151.18255999999997, "r": 507.17822, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "Ten", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 162.53954999999996, "r": 134.01064, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Caption", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 177.866, "t": 162.53954999999996, "r": 198.71288, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "22524", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 162.53954999999996, "r": 233.69174000000004, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "2.04", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 162.53954999999996, "r": 264.50031, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "1.77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 162.53954999999996, "r": 295.30887, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "2.32", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 162.53954999999996, "r": 324.98117, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "84-89", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 162.53954999999996, "r": 354.651, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "40-61", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 162.53954999999996, "r": 384.32083, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "86-92", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45187, "t": 162.53954999999996, "r": 418.16003, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "94-99", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 162.53954999999996, "r": 447.82986, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "95-99", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 162.53954999999996, "r": 477.50867, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "69-78", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 495.32489, "t": 162.53954999999996, "r": 507.17846999999995, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 173.49854000000005, "r": 137.3282, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Footnote", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 182.035, "t": 173.49854000000005, "r": 198.71251, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "6318", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 173.49854000000005, "r": 233.69174000000004, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.60", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 173.49854000000005, "r": 264.50031, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.31", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 173.49854000000005, "r": 295.30887, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.58", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 173.49854000000005, "r": 324.98117, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "83-91", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 342.79739, "t": 173.49854000000005, "r": 354.65097, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 371.81265, "t": 173.49854000000005, "r": 384.32077, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "100", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45181, "t": 173.49854000000005, "r": 418.15997, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "62-88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.12164, "t": 173.49854000000005, "r": 447.8298, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "85-94", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 465.655, "t": 173.49854000000005, "r": 477.50857999999994, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47025, "t": 173.49854000000005, "r": 507.17841, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "82-97", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 184.45752000000005, "r": 135.33766, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Formula", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 177.866, "t": 184.45752000000005, "r": 198.71288, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "25027", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 184.45752000000005, "r": 233.69174000000004, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "2.25", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 184.45752000000005, "r": 264.50031, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "1.90", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 184.45752000000005, "r": 295.30887, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "2.96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 184.45752000000005, "r": 324.98117, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "83-85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 342.79739, "t": 184.45752000000005, "r": 354.65097, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 372.46719, "t": 184.45752000000005, "r": 384.32077, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45181, "t": 184.45752000000005, "r": 418.15997, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "84-87", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.12164, "t": 184.45752000000005, "r": 447.8298, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "86-96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 465.655, "t": 184.45752000000005, "r": 477.50857999999994, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 495.3248, "t": 184.45752000000005, "r": 507.17838000000006, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 195.41656, "r": 137.70479, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "List-item", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 173.69701, "t": 195.41656, "r": 198.71326, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "185660", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 215.04201, "t": 195.41656, "r": 233.69212, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "17.19", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.85056, "t": 195.41656, "r": 264.50067, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "13.34", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 276.65912, "t": 195.41656, "r": 295.30923, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "15.82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 195.41656, "r": 324.98117, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "87-88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 195.41656, "r": 354.651, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "74-83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 195.41656, "r": 384.32083, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "90-92", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45187, "t": 195.41656, "r": 418.16003, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "97-97", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 195.41656, "r": 447.82986, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "81-85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 195.41656, "r": 477.50867, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "75-88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 195.41656, "r": 507.17849999999993, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "93-95", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 206.37554999999998, "r": 147.35262, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-footer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 177.866, "t": 206.37554999999998, "r": 198.71288, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "70878", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 206.37554999999998, "r": 233.69174000000004, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "6.51", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 206.37554999999998, "r": 264.50031, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "5.58", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 206.37554999999998, "r": 295.30887, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "6.00", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 206.37554999999998, "r": 324.98117, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "93-94", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 206.37554999999998, "r": 354.651, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "88-90", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 206.37554999999998, "r": 384.32083, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "95-96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 405.65189, "t": 206.37554999999998, "r": 418.16, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "100", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.12167, "t": 206.37554999999998, "r": 447.82983, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "92-97", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 465.00049, "t": 206.37554999999998, "r": 477.5086099999999, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "100", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47028, "t": 206.37554999999998, "r": 507.17843999999997, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "96-98", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 217.33452999999997, "r": 150.10532, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 177.866, "t": 217.33452999999997, "r": 198.71288, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "58022", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 217.33452999999997, "r": 233.69174000000004, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "5.10", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 217.33452999999997, "r": 264.50031, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "6.70", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 217.33452999999997, "r": 295.30887, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "5.06", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 217.33452999999997, "r": 324.98117, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "85-89", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 217.33452999999997, "r": 354.651, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "66-76", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 217.33452999999997, "r": 384.32083, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "90-94", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.2825, "t": 217.33452999999997, "r": 418.16003, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "98-100", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 217.33452999999997, "r": 447.82986, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "91-92", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 217.33452999999997, "r": 477.50867, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "97-99", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 217.33452999999997, "r": 507.17849999999993, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "81-86", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 228.29351999999994, "r": 130.80963, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Picture", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 177.866, "t": 228.29351999999994, "r": 198.71288, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "45976", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 228.29351999999994, "r": 233.69174000000004, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "4.21", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 228.29351999999994, "r": 264.50031, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "2.78", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 228.29351999999994, "r": 295.30887, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "5.31", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 228.29351999999994, "r": 324.98117, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "69-71", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 228.29351999999994, "r": 354.651, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "56-59", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 228.29351999999994, "r": 384.32083, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "82-86", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45187, "t": 228.29351999999994, "r": 418.16003, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "69-82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 228.29351999999994, "r": 447.82986, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "80-95", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 228.29351999999994, "r": 477.50867, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "66-71", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 228.29351999999994, "r": 507.17849999999993, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "59-76", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 239.25256000000002, "r": 159.56487, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Section-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 173.69701, "t": 239.25256000000002, "r": 198.71326, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "142884", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 215.04201, "t": 239.25256000000002, "r": 233.69212, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "12.60", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.85056, "t": 239.25256000000002, "r": 264.50067, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "15.77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 276.65912, "t": 239.25256000000002, "r": 295.30923, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "12.85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 239.25256000000002, "r": 324.98117, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "83-84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 239.25256000000002, "r": 354.651, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "76-81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 239.25256000000002, "r": 384.32083, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "90-92", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45187, "t": 239.25256000000002, "r": 418.16003, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "94-95", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 239.25256000000002, "r": 447.82986, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "87-94", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 239.25256000000002, "r": 477.50867, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "69-73", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 239.25256000000002, "r": 507.17849999999993, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "78-86", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 250.21155, "r": 124.63177, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 177.866, "t": 250.21155, "r": 198.71288, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "34733", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 250.21155, "r": 233.69174000000004, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "3.20", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 250.21155, "r": 264.50031, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "2.27", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 250.21155, "r": 295.30887, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "3.60", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 250.21155, "r": 324.98117, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "77-81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 250.21155, "r": 354.651, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "75-80", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 250.21155, "r": 384.32083, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "83-86", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45187, "t": 250.21155, "r": 418.16003, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "98-99", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 250.21155, "r": 447.82986, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "58-80", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 250.21155, "r": 477.50867, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "79-84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 250.21155, "r": 507.17849999999993, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "70-85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 261.16956000000005, "r": 120.78519, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Text", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 173.69701, "t": 261.16956000000005, "r": 198.71326, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "510377", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 215.04201, "t": 261.16956000000005, "r": 233.69212, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "45.82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.85056, "t": 261.16956000000005, "r": 264.50067, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "49.28", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 276.65912, "t": 261.16956000000005, "r": 295.30923, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "45.00", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 261.16956000000005, "r": 324.98117, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "84-86", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 261.16956000000005, "r": 354.651, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "81-86", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 261.16956000000005, "r": 384.32083, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "88-93", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45187, "t": 261.16956000000005, "r": 418.16003, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "89-93", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 261.16956000000005, "r": 447.82986, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "87-92", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 261.16956000000005, "r": 477.50867, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "71-79", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 261.16956000000005, "r": 507.17849999999993, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "87-95", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 272.12854000000004, "r": 121.81633, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Title", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 182.035, "t": 272.12854000000004, "r": 198.71251, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "5071", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 272.12854000000004, "r": 233.69174000000004, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.47", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 272.12854000000004, "r": 264.50031, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.30", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 272.12854000000004, "r": 295.30887, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.50", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 272.12854000000004, "r": 324.98117, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "60-72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 272.12854000000004, "r": 354.651, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "24-63", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 272.12854000000004, "r": 384.32083, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "50-63", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.2825, "t": 272.12854000000004, "r": 418.16003, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "94-100", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 272.12854000000004, "r": 447.82986, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "82-96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 272.12854000000004, "r": 477.50867, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "68-79", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 272.12854000000004, "r": 507.17849999999993, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "24-56", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 283.48654, "r": 123.43028, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Total", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 169.52699, "t": 283.48654, "r": 198.71263, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "1107470", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 208.675, "t": 283.48654, "r": 233.69124999999997, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "941123", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 243.65291999999997, "t": 283.48654, "r": 264.49982, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "99816", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 274.46149, "t": 283.48654, "r": 295.30838, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "66531", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 283.48654, "r": 324.98117, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "82-83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 283.48654, "r": 354.651, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "71-74", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 283.48654, "r": 384.32083, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "79-81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45187, "t": 283.48654, "r": 418.16003, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "89-94", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 283.48654, "r": 447.82986, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "86-91", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 283.48654, "r": 477.50867, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "71-76", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 283.48654, "r": 507.17849999999993, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "68-85", "column_header": false, "row_header": false, "row_section": false}], "num_rows": 14, "num_cols": 12, "grid": [[{"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 233.94400000000002, "t": 140.22351000000003, "r": 270.04272, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 4, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 6, "text": "% of Total", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 233.94400000000002, "t": 140.22351000000003, "r": 270.04272, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 4, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 6, "text": "% of Total", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 233.94400000000002, "t": 140.22351000000003, "r": 270.04272, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 4, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 6, "text": "% of Total", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 233.94400000000002, "t": 140.22351000000003, "r": 270.04272, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 4, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 6, "text": "% of Total", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 329.04999, "t": 140.22351000000003, "r": 483.3976400000001, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 6, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 6, "end_col_offset_idx": 12, "text": "triple inter-annotator mAP @ 0.5-0.95 (%)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 329.04999, "t": 140.22351000000003, "r": 483.3976400000001, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 6, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 6, "end_col_offset_idx": 12, "text": "triple inter-annotator mAP @ 0.5-0.95 (%)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 329.04999, "t": 140.22351000000003, "r": 483.3976400000001, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 6, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 6, "end_col_offset_idx": 12, "text": "triple inter-annotator mAP @ 0.5-0.95 (%)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 329.04999, "t": 140.22351000000003, "r": 483.3976400000001, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 6, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 6, "end_col_offset_idx": 12, "text": "triple inter-annotator mAP @ 0.5-0.95 (%)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 329.04999, "t": 140.22351000000003, "r": 483.3976400000001, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 6, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 6, "end_col_offset_idx": 12, "text": "triple inter-annotator mAP @ 0.5-0.95 (%)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 329.04999, "t": 140.22351000000003, "r": 483.3976400000001, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 6, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 6, "end_col_offset_idx": 12, "text": "triple inter-annotator mAP @ 0.5-0.95 (%)", "column_header": true, "row_header": false, "row_section": false}], [{"bbox": {"l": 104.825, "t": 151.18255999999997, "r": 141.71277, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "class label", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 175.94701, "t": 151.18255999999997, "r": 198.71269, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Count", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 213.795, "t": 151.18255999999997, "r": 233.69144, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Train", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 249.37367, "t": 151.18255999999997, "r": 264.5, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Test", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 283.53568, "t": 151.18255999999997, "r": 295.30856, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Val", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 314.01501, "t": 151.18255999999997, "r": 324.98093, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "All", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 343.01236, "t": 151.18255999999997, "r": 354.65076, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "Fin", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 367.84033, "t": 151.18255999999997, "r": 384.32059, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "Man", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 407.54358, "t": 151.18255999999997, "r": 418.15979, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "Sci", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 432.29979999999995, "t": 151.18255999999997, "r": 447.82962, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "Law", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 465.72656, "t": 151.18255999999997, "r": 477.50842, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "Pat", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 493.52240000000006, "t": 151.18255999999997, "r": 507.17822, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "Ten", "column_header": true, "row_header": false, "row_section": false}], [{"bbox": {"l": 104.825, "t": 162.53954999999996, "r": 134.01064, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Caption", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 177.866, "t": 162.53954999999996, "r": 198.71288, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "22524", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 162.53954999999996, "r": 233.69174000000004, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "2.04", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 162.53954999999996, "r": 264.50031, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "1.77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 162.53954999999996, "r": 295.30887, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "2.32", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 162.53954999999996, "r": 324.98117, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "84-89", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 162.53954999999996, "r": 354.651, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "40-61", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 162.53954999999996, "r": 384.32083, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "86-92", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45187, "t": 162.53954999999996, "r": 418.16003, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "94-99", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 162.53954999999996, "r": 447.82986, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "95-99", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 162.53954999999996, "r": 477.50867, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "69-78", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 495.32489, "t": 162.53954999999996, "r": 507.17846999999995, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 104.825, "t": 173.49854000000005, "r": 137.3282, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Footnote", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 182.035, "t": 173.49854000000005, "r": 198.71251, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "6318", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 173.49854000000005, "r": 233.69174000000004, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.60", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 173.49854000000005, "r": 264.50031, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.31", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 173.49854000000005, "r": 295.30887, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.58", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 173.49854000000005, "r": 324.98117, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "83-91", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 342.79739, "t": 173.49854000000005, "r": 354.65097, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 371.81265, "t": 173.49854000000005, "r": 384.32077, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "100", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45181, "t": 173.49854000000005, "r": 418.15997, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "62-88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.12164, "t": 173.49854000000005, "r": 447.8298, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "85-94", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 465.655, "t": 173.49854000000005, "r": 477.50857999999994, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47025, "t": 173.49854000000005, "r": 507.17841, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "82-97", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 104.825, "t": 184.45752000000005, "r": 135.33766, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Formula", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 177.866, "t": 184.45752000000005, "r": 198.71288, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "25027", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 184.45752000000005, "r": 233.69174000000004, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "2.25", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 184.45752000000005, "r": 264.50031, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "1.90", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 184.45752000000005, "r": 295.30887, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "2.96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 184.45752000000005, "r": 324.98117, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "83-85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 342.79739, "t": 184.45752000000005, "r": 354.65097, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 372.46719, "t": 184.45752000000005, "r": 384.32077, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45181, "t": 184.45752000000005, "r": 418.15997, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "84-87", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.12164, "t": 184.45752000000005, "r": 447.8298, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "86-96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 465.655, "t": 184.45752000000005, "r": 477.50857999999994, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 495.3248, "t": 184.45752000000005, "r": 507.17838000000006, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 104.825, "t": 195.41656, "r": 137.70479, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "List-item", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 173.69701, "t": 195.41656, "r": 198.71326, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "185660", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 215.04201, "t": 195.41656, "r": 233.69212, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "17.19", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.85056, "t": 195.41656, "r": 264.50067, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "13.34", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 276.65912, "t": 195.41656, "r": 295.30923, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "15.82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 195.41656, "r": 324.98117, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "87-88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 195.41656, "r": 354.651, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "74-83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 195.41656, "r": 384.32083, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "90-92", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45187, "t": 195.41656, "r": 418.16003, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "97-97", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 195.41656, "r": 447.82986, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "81-85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 195.41656, "r": 477.50867, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "75-88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 195.41656, "r": 507.17849999999993, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "93-95", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 104.825, "t": 206.37554999999998, "r": 147.35262, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-footer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 177.866, "t": 206.37554999999998, "r": 198.71288, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "70878", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 206.37554999999998, "r": 233.69174000000004, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "6.51", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 206.37554999999998, "r": 264.50031, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "5.58", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 206.37554999999998, "r": 295.30887, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "6.00", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 206.37554999999998, "r": 324.98117, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "93-94", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 206.37554999999998, "r": 354.651, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "88-90", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 206.37554999999998, "r": 384.32083, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "95-96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 405.65189, "t": 206.37554999999998, "r": 418.16, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "100", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.12167, "t": 206.37554999999998, "r": 447.82983, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "92-97", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 465.00049, "t": 206.37554999999998, "r": 477.5086099999999, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "100", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47028, "t": 206.37554999999998, "r": 507.17843999999997, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "96-98", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 104.825, "t": 217.33452999999997, "r": 150.10532, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 177.866, "t": 217.33452999999997, "r": 198.71288, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "58022", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 217.33452999999997, "r": 233.69174000000004, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "5.10", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 217.33452999999997, "r": 264.50031, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "6.70", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 217.33452999999997, "r": 295.30887, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "5.06", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 217.33452999999997, "r": 324.98117, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "85-89", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 217.33452999999997, "r": 354.651, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "66-76", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 217.33452999999997, "r": 384.32083, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "90-94", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.2825, "t": 217.33452999999997, "r": 418.16003, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "98-100", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 217.33452999999997, "r": 447.82986, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "91-92", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 217.33452999999997, "r": 477.50867, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "97-99", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 217.33452999999997, "r": 507.17849999999993, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "81-86", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 104.825, "t": 228.29351999999994, "r": 130.80963, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Picture", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 177.866, "t": 228.29351999999994, "r": 198.71288, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "45976", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 228.29351999999994, "r": 233.69174000000004, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "4.21", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 228.29351999999994, "r": 264.50031, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "2.78", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 228.29351999999994, "r": 295.30887, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "5.31", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 228.29351999999994, "r": 324.98117, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "69-71", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 228.29351999999994, "r": 354.651, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "56-59", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 228.29351999999994, "r": 384.32083, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "82-86", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45187, "t": 228.29351999999994, "r": 418.16003, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "69-82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 228.29351999999994, "r": 447.82986, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "80-95", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 228.29351999999994, "r": 477.50867, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "66-71", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 228.29351999999994, "r": 507.17849999999993, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "59-76", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 104.825, "t": 239.25256000000002, "r": 159.56487, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Section-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 173.69701, "t": 239.25256000000002, "r": 198.71326, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "142884", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 215.04201, "t": 239.25256000000002, "r": 233.69212, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "12.60", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.85056, "t": 239.25256000000002, "r": 264.50067, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "15.77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 276.65912, "t": 239.25256000000002, "r": 295.30923, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "12.85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 239.25256000000002, "r": 324.98117, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "83-84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 239.25256000000002, "r": 354.651, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "76-81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 239.25256000000002, "r": 384.32083, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "90-92", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45187, "t": 239.25256000000002, "r": 418.16003, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "94-95", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 239.25256000000002, "r": 447.82986, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "87-94", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 239.25256000000002, "r": 477.50867, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "69-73", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 239.25256000000002, "r": 507.17849999999993, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "78-86", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 104.825, "t": 250.21155, "r": 124.63177, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 177.866, "t": 250.21155, "r": 198.71288, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "34733", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 250.21155, "r": 233.69174000000004, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "3.20", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 250.21155, "r": 264.50031, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "2.27", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 250.21155, "r": 295.30887, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "3.60", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 250.21155, "r": 324.98117, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "77-81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 250.21155, "r": 354.651, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "75-80", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 250.21155, "r": 384.32083, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "83-86", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45187, "t": 250.21155, "r": 418.16003, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "98-99", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 250.21155, "r": 447.82986, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "58-80", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 250.21155, "r": 477.50867, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "79-84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 250.21155, "r": 507.17849999999993, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "70-85", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 104.825, "t": 261.16956000000005, "r": 120.78519, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Text", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 173.69701, "t": 261.16956000000005, "r": 198.71326, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "510377", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 215.04201, "t": 261.16956000000005, "r": 233.69212, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "45.82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.85056, "t": 261.16956000000005, "r": 264.50067, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "49.28", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 276.65912, "t": 261.16956000000005, "r": 295.30923, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "45.00", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 261.16956000000005, "r": 324.98117, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "84-86", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 261.16956000000005, "r": 354.651, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "81-86", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 261.16956000000005, "r": 384.32083, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "88-93", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45187, "t": 261.16956000000005, "r": 418.16003, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "89-93", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 261.16956000000005, "r": 447.82986, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "87-92", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 261.16956000000005, "r": 477.50867, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "71-79", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 261.16956000000005, "r": 507.17849999999993, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "87-95", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 104.825, "t": 272.12854000000004, "r": 121.81633, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Title", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 182.035, "t": 272.12854000000004, "r": 198.71251, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "5071", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 272.12854000000004, "r": 233.69174000000004, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.47", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 272.12854000000004, "r": 264.50031, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.30", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 272.12854000000004, "r": 295.30887, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.50", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 272.12854000000004, "r": 324.98117, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "60-72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 272.12854000000004, "r": 354.651, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "24-63", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 272.12854000000004, "r": 384.32083, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "50-63", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.2825, "t": 272.12854000000004, "r": 418.16003, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "94-100", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 272.12854000000004, "r": 447.82986, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "82-96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 272.12854000000004, "r": 477.50867, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "68-79", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 272.12854000000004, "r": 507.17849999999993, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "24-56", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 104.825, "t": 283.48654, "r": 123.43028, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Total", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 169.52699, "t": 283.48654, "r": 198.71263, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "1107470", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 208.675, "t": 283.48654, "r": 233.69124999999997, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "941123", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 243.65291999999997, "t": 283.48654, "r": 264.49982, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "99816", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 274.46149, "t": 283.48654, "r": 295.30838, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "66531", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 283.48654, "r": 324.98117, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "82-83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 283.48654, "r": 354.651, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "71-74", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 283.48654, "r": 384.32083, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "79-81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45187, "t": 283.48654, "r": 418.16003, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "89-94", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 283.48654, "r": 447.82986, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "86-91", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 283.48654, "r": 477.50867, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "71-76", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 283.48654, "r": 507.17849999999993, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "68-85", "column_header": false, "row_header": false, "row_section": false}]]}}, {"self_ref": "#/tables/1", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "table", "prov": [{"page_no": 6, "bbox": {"l": 62.02753829956055, "t": 596.3199310302734, "r": 285.78955078125, "b": 440.3381042480469, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "data": {"table_cells": [{"bbox": {"l": 132.36501, "t": 197.97351000000003, "r": 157.99098, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "human", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 173.505, "t": 197.97351000000003, "r": 204.61841, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 4, "text": "MRCNN", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 220.13028, "t": 197.97351000000003, "r": 248.06958, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "FRCNN", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 258.03125, "t": 197.97351000000003, "r": 280.17825, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "YOLO", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 168.39301, "t": 208.93255999999997, "r": 181.99504, "b": 217.30719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "R50", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 192.39606, "t": 208.93255999999997, "r": 210.16747, "b": 217.30719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "R101", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 225.21309, "t": 208.93255999999997, "r": 242.9845, "b": 217.30719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "R101", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 260.51379, "t": 208.93255999999997, "r": 277.70239, "b": 217.30719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "v5x6", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 220.28954999999996, "r": 96.848633, "b": 228.66418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Caption", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 220.28954999999996, "r": 155.03215, "b": 228.66418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "84-89", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 220.28954999999996, "r": 182.43472, "b": 228.66418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "68.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 220.28954999999996, "r": 208.52695, "b": 228.66418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "71.5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 220.28954999999996, "r": 241.34396, "b": 228.66418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "70.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 220.28954999999996, "r": 276.34879, "b": 228.66418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "77.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 231.24854000000005, "r": 100.1662, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Footnote", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 231.24854000000005, "r": 155.03215, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "83-91", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 231.24854000000005, "r": 182.43472, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "70.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 231.24854000000005, "r": 208.52695, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "71.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 231.24854000000005, "r": 241.34396, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "73.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 231.24854000000005, "r": 276.34879, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "77.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 242.20752000000005, "r": 98.175659, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Formula", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 242.20752000000005, "r": 155.03215, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "83-85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 242.20752000000005, "r": 182.43472, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "60.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 242.20752000000005, "r": 208.52695, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "63.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 242.20752000000005, "r": 241.34396, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "63.5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 242.20752000000005, "r": 276.34879, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "66.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 253.16656, "r": 100.54279, "b": 261.5412, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "List-item", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 253.16656, "r": 155.03215, "b": 261.5412, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "87-88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 253.16656, "r": 182.43472, "b": 261.5412, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "81.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 253.16656, "r": 208.52695, "b": 261.5412, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "80.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 253.16656, "r": 241.34396, "b": 261.5412, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "81.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 253.16656, "r": 276.34879, "b": 261.5412, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "86.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 264.12555, "r": 110.19064, "b": 272.50018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-footer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 264.12555, "r": 155.03215, "b": 272.50018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "93-94", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 264.12555, "r": 182.43472, "b": 272.50018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "61.6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 264.12555, "r": 208.52695, "b": 272.50018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "59.3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 264.12555, "r": 241.34396, "b": 272.50018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "58.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 264.12555, "r": 276.34879, "b": 272.50018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "61.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 275.08453, "r": 112.94331999999999, "b": 283.45917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 275.08453, "r": 155.03215, "b": 283.45917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "85-89", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 275.08453, "r": 182.43472, "b": 283.45917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "71.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 275.08453, "r": 208.52695, "b": 283.45917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "70.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 275.08453, "r": 241.34396, "b": 283.45917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "72.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 275.08453, "r": 276.34879, "b": 283.45917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "67.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 286.04355000000004, "r": 93.647629, "b": 294.41818, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Picture", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 286.04355000000004, "r": 155.03215, "b": 294.41818, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "69-71", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 286.04355000000004, "r": 182.43472, "b": 294.41818, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "71.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 286.04355000000004, "r": 208.52695, "b": 294.41818, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "72.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 286.04355000000004, "r": 241.34396, "b": 294.41818, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "72.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 286.04355000000004, "r": 276.34879, "b": 294.41818, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "77.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 297.00253, "r": 122.40287999999998, "b": 305.37717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Section-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 297.00253, "r": 155.03215, "b": 305.37717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "83-84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 297.00253, "r": 182.43472, "b": 305.37717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "67.6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 297.00253, "r": 208.52695, "b": 305.37717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "69.3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 297.00253, "r": 241.34396, "b": 305.37717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "68.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 297.00253, "r": 276.34879, "b": 305.37717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "74.6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 307.96155, "r": 87.46978, "b": 316.33618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 307.96155, "r": 155.03215, "b": 316.33618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "77-81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 307.96155, "r": 182.43472, "b": 316.33618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "82.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 307.96155, "r": 208.52695, "b": 316.33618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "82.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 307.96155, "r": 241.34396, "b": 316.33618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "82.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 307.96155, "r": 276.34879, "b": 316.33618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "86.3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 318.91953, "r": 83.623199, "b": 327.29416, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Text", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 318.91953, "r": 155.03215, "b": 327.29416, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "84-86", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 318.91953, "r": 182.43472, "b": 327.29416, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "84.6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 318.91953, "r": 208.52695, "b": 327.29416, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "85.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 318.91953, "r": 241.34396, "b": 327.29416, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "85.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 318.91953, "r": 276.34879, "b": 327.29416, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "88.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 329.87854, "r": 84.654327, "b": 338.25317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Title", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 329.87854, "r": 155.03215, "b": 338.25317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "60-72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 329.87854, "r": 182.43472, "b": 338.25317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "76.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 329.87854, "r": 208.52695, "b": 338.25317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "80.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 329.87854, "r": 241.34396, "b": 338.25317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "79.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 329.87854, "r": 276.34879, "b": 338.25317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "82.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 341.23654, "r": 78.628906, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "All", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 341.23654, "r": 155.03215, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "82-83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 341.23654, "r": 182.43472, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "72.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 341.23654, "r": 208.52695, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "73.5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 341.23654, "r": 241.34396, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "73.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 341.23654, "r": 276.34879, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "76.8", "column_header": false, "row_header": false, "row_section": false}], "num_rows": 14, "num_cols": 6, "grid": [[{"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 132.36501, "t": 197.97351000000003, "r": 157.99098, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "human", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 173.505, "t": 197.97351000000003, "r": 204.61841, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 4, "text": "MRCNN", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 173.505, "t": 197.97351000000003, "r": 204.61841, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 4, "text": "MRCNN", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 220.13028, "t": 197.97351000000003, "r": 248.06958, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "FRCNN", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 258.03125, "t": 197.97351000000003, "r": 280.17825, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "YOLO", "column_header": true, "row_header": false, "row_section": false}], [{"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 132.36501, "t": 197.97351000000003, "r": 157.99098, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "human", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 168.39301, "t": 208.93255999999997, "r": 181.99504, "b": 217.30719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "R50", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 192.39606, "t": 208.93255999999997, "r": 210.16747, "b": 217.30719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "R101", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 225.21309, "t": 208.93255999999997, "r": 242.9845, "b": 217.30719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "R101", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 260.51379, "t": 208.93255999999997, "r": 277.70239, "b": 217.30719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "v5x6", "column_header": true, "row_header": false, "row_section": false}], [{"bbox": {"l": 67.663002, "t": 220.28954999999996, "r": 96.848633, "b": 228.66418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Caption", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 220.28954999999996, "r": 155.03215, "b": 228.66418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "84-89", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 220.28954999999996, "r": 182.43472, "b": 228.66418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "68.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 220.28954999999996, "r": 208.52695, "b": 228.66418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "71.5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 220.28954999999996, "r": 241.34396, "b": 228.66418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "70.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 220.28954999999996, "r": 276.34879, "b": 228.66418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "77.7", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 67.663002, "t": 231.24854000000005, "r": 100.1662, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Footnote", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 231.24854000000005, "r": 155.03215, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "83-91", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 231.24854000000005, "r": 182.43472, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "70.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 231.24854000000005, "r": 208.52695, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "71.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 231.24854000000005, "r": 241.34396, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "73.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 231.24854000000005, "r": 276.34879, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "77.2", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 67.663002, "t": 242.20752000000005, "r": 98.175659, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Formula", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 242.20752000000005, "r": 155.03215, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "83-85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 242.20752000000005, "r": 182.43472, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "60.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 242.20752000000005, "r": 208.52695, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "63.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 242.20752000000005, "r": 241.34396, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "63.5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 242.20752000000005, "r": 276.34879, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "66.2", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 67.663002, "t": 253.16656, "r": 100.54279, "b": 261.5412, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "List-item", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 253.16656, "r": 155.03215, "b": 261.5412, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "87-88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 253.16656, "r": 182.43472, "b": 261.5412, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "81.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 253.16656, "r": 208.52695, "b": 261.5412, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "80.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 253.16656, "r": 241.34396, "b": 261.5412, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "81.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 253.16656, "r": 276.34879, "b": 261.5412, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "86.2", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 67.663002, "t": 264.12555, "r": 110.19064, "b": 272.50018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-footer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 264.12555, "r": 155.03215, "b": 272.50018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "93-94", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 264.12555, "r": 182.43472, "b": 272.50018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "61.6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 264.12555, "r": 208.52695, "b": 272.50018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "59.3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 264.12555, "r": 241.34396, "b": 272.50018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "58.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 264.12555, "r": 276.34879, "b": 272.50018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "61.1", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 67.663002, "t": 275.08453, "r": 112.94331999999999, "b": 283.45917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 275.08453, "r": 155.03215, "b": 283.45917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "85-89", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 275.08453, "r": 182.43472, "b": 283.45917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "71.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 275.08453, "r": 208.52695, "b": 283.45917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "70.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 275.08453, "r": 241.34396, "b": 283.45917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "72.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 275.08453, "r": 276.34879, "b": 283.45917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "67.9", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 67.663002, "t": 286.04355000000004, "r": 93.647629, "b": 294.41818, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Picture", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 286.04355000000004, "r": 155.03215, "b": 294.41818, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "69-71", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 286.04355000000004, "r": 182.43472, "b": 294.41818, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "71.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 286.04355000000004, "r": 208.52695, "b": 294.41818, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "72.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 286.04355000000004, "r": 241.34396, "b": 294.41818, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "72.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 286.04355000000004, "r": 276.34879, "b": 294.41818, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "77.1", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 67.663002, "t": 297.00253, "r": 122.40287999999998, "b": 305.37717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Section-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 297.00253, "r": 155.03215, "b": 305.37717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "83-84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 297.00253, "r": 182.43472, "b": 305.37717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "67.6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 297.00253, "r": 208.52695, "b": 305.37717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "69.3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 297.00253, "r": 241.34396, "b": 305.37717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "68.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 297.00253, "r": 276.34879, "b": 305.37717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "74.6", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 67.663002, "t": 307.96155, "r": 87.46978, "b": 316.33618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 307.96155, "r": 155.03215, "b": 316.33618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "77-81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 307.96155, "r": 182.43472, "b": 316.33618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "82.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 307.96155, "r": 208.52695, "b": 316.33618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "82.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 307.96155, "r": 241.34396, "b": 316.33618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "82.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 307.96155, "r": 276.34879, "b": 316.33618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "86.3", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 67.663002, "t": 318.91953, "r": 83.623199, "b": 327.29416, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Text", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 318.91953, "r": 155.03215, "b": 327.29416, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "84-86", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 318.91953, "r": 182.43472, "b": 327.29416, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "84.6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 318.91953, "r": 208.52695, "b": 327.29416, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "85.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 318.91953, "r": 241.34396, "b": 327.29416, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "85.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 318.91953, "r": 276.34879, "b": 327.29416, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "88.1", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 67.663002, "t": 329.87854, "r": 84.654327, "b": 338.25317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Title", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 329.87854, "r": 155.03215, "b": 338.25317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "60-72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 329.87854, "r": 182.43472, "b": 338.25317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "76.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 329.87854, "r": 208.52695, "b": 338.25317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "80.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 329.87854, "r": 241.34396, "b": 338.25317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "79.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 329.87854, "r": 276.34879, "b": 338.25317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "82.7", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 67.663002, "t": 341.23654, "r": 78.628906, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "All", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 341.23654, "r": 155.03215, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "82-83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 341.23654, "r": 182.43472, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "72.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 341.23654, "r": 208.52695, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "73.5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 341.23654, "r": 241.34396, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "73.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 341.23654, "r": 276.34879, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "76.8", "column_header": false, "row_header": false, "row_section": false}]]}}, {"self_ref": "#/tables/2", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "table", "prov": [{"page_no": 7, "bbox": {"l": 80.35525512695312, "t": 641.0637054443359, "r": 267.0082092285156, "b": 496.5545349121094, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "data": {"table_cells": [{"bbox": {"l": 86.372002, "t": 153.10051999999996, "r": 129.46452, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Class-count", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 151.07401, "t": 153.10051999999996, "r": 159.41275, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "11", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 179.31816, "t": 153.10051999999996, "r": 183.48753, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "6", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 213.33669, "t": 153.10051999999996, "r": 217.50606, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "5", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 247.35521, "t": 153.10051999999996, "r": 251.52458, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "4", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 164.45752000000005, "r": 115.55763, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Caption", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 164.45752000000005, "r": 159.41275, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 173.42723, "t": 164.45752000000005, "r": 189.38742, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 207.44576, "t": 164.45752000000005, "r": 223.40594000000002, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 241.46428, "t": 164.45752000000005, "r": 257.42447, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 175.41656, "r": 118.8752, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Footnote", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 175.41656, "r": 159.41275, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "71", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 173.42723, "t": 175.41656, "r": 189.38742, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 207.44576, "t": 175.41656, "r": 223.40594000000002, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 241.46428, "t": 175.41656, "r": 257.42447, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 186.37554999999998, "r": 116.88466, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Formula", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 186.37554999999998, "r": 159.41275, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "60", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 173.42723, "t": 186.37554999999998, "r": 189.38742, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 207.44576, "t": 186.37554999999998, "r": 223.40594000000002, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 241.46428, "t": 186.37554999999998, "r": 257.42447, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 197.33452999999997, "r": 119.25179, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "List-item", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 197.33452999999997, "r": 159.41275, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 173.42723, "t": 197.33452999999997, "r": 189.38742, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 211.25647, "t": 197.33452999999997, "r": 219.59521, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 241.46426, "t": 197.33452999999997, "r": 257.42447, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 208.29351999999994, "r": 128.89964, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-footer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 208.29351999999994, "r": 159.41275, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "62", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23795, "t": 208.29351999999994, "r": 185.57669, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "62", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 213.91052, "t": 208.29351999999994, "r": 216.94116, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 247.92905000000002, "t": 208.29351999999994, "r": 250.95969, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 219.25256000000002, "r": 131.65231, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 219.25256000000002, "r": 159.41275, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23795, "t": 219.25256000000002, "r": 185.57669, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 213.91052, "t": 219.25256000000002, "r": 216.94116, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 247.92905000000002, "t": 219.25256000000002, "r": 250.95969, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 230.21155, "r": 112.35663, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Picture", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 230.21155, "r": 159.41275, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23795, "t": 230.21155, "r": 185.57669, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 211.25645, "t": 230.21155, "r": 219.5952, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.27496, "t": 230.21155, "r": 253.61371, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 241.16956000000005, "r": 141.11188, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Section-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 241.16956000000005, "r": 159.41275, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23795, "t": 241.16956000000005, "r": 185.57669, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "67", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 211.25645, "t": 241.16956000000005, "r": 219.5952, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "69", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.27496, "t": 241.16956000000005, "r": 253.61371, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 252.12854000000004, "r": 106.17878, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 252.12854000000004, "r": 159.41275, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23795, "t": 252.12854000000004, "r": 185.57669, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 211.25645, "t": 252.12854000000004, "r": 219.5952, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.27496, "t": 252.12854000000004, "r": 253.61371, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 263.08752000000004, "r": 102.3322, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Text", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 263.08752000000004, "r": 159.41275, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23795, "t": 263.08752000000004, "r": 185.57669, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 211.25645, "t": 263.08752000000004, "r": 219.5952, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.27496, "t": 263.08752000000004, "r": 253.61371, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 274.04657, "r": 103.36333, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Title", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 274.04657, "r": 159.41275, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 169.37442, "t": 274.04657, "r": 193.43127, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Sec.-h.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 203.39294, "t": 274.04657, "r": 227.4498, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Sec.-h.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 237.41147, "t": 274.04657, "r": 261.46832, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Sec.-h.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 285.40454, "r": 113.31602000000001, "b": 293.77917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Overall", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 285.40454, "r": 159.41275, "b": 293.77917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23795, "t": 285.40454, "r": 185.57669, "b": 293.77917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "73", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 211.25645, "t": 285.40454, "r": 219.5952, "b": 293.77917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "78", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.27496, "t": 285.40454, "r": 253.61371, "b": 293.77917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "77", "column_header": false, "row_header": false, "row_section": false}], "num_rows": 13, "num_cols": 5, "grid": [[{"bbox": {"l": 86.372002, "t": 153.10051999999996, "r": 129.46452, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Class-count", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 151.07401, "t": 153.10051999999996, "r": 159.41275, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "11", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 179.31816, "t": 153.10051999999996, "r": 183.48753, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "6", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 213.33669, "t": 153.10051999999996, "r": 217.50606, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "5", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 247.35521, "t": 153.10051999999996, "r": 251.52458, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "4", "column_header": true, "row_header": false, "row_section": false}], [{"bbox": {"l": 86.372002, "t": 164.45752000000005, "r": 115.55763, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Caption", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 164.45752000000005, "r": 159.41275, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 173.42723, "t": 164.45752000000005, "r": 189.38742, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 207.44576, "t": 164.45752000000005, "r": 223.40594000000002, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 241.46428, "t": 164.45752000000005, "r": 257.42447, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Text", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 86.372002, "t": 175.41656, "r": 118.8752, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Footnote", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 175.41656, "r": 159.41275, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "71", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 173.42723, "t": 175.41656, "r": 189.38742, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 207.44576, "t": 175.41656, "r": 223.40594000000002, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 241.46428, "t": 175.41656, "r": 257.42447, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Text", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 86.372002, "t": 186.37554999999998, "r": 116.88466, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Formula", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 186.37554999999998, "r": 159.41275, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "60", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 173.42723, "t": 186.37554999999998, "r": 189.38742, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 207.44576, "t": 186.37554999999998, "r": 223.40594000000002, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 241.46428, "t": 186.37554999999998, "r": 257.42447, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Text", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 86.372002, "t": 197.33452999999997, "r": 119.25179, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "List-item", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 197.33452999999997, "r": 159.41275, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 173.42723, "t": 197.33452999999997, "r": 189.38742, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 211.25647, "t": 197.33452999999997, "r": 219.59521, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 241.46426, "t": 197.33452999999997, "r": 257.42447, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Text", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 86.372002, "t": 208.29351999999994, "r": 128.89964, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-footer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 208.29351999999994, "r": 159.41275, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "62", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23795, "t": 208.29351999999994, "r": 185.57669, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "62", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 213.91052, "t": 208.29351999999994, "r": 216.94116, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 247.92905000000002, "t": 208.29351999999994, "r": 250.95969, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "-", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 86.372002, "t": 219.25256000000002, "r": 131.65231, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 219.25256000000002, "r": 159.41275, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23795, "t": 219.25256000000002, "r": 185.57669, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 213.91052, "t": 219.25256000000002, "r": 216.94116, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 247.92905000000002, "t": 219.25256000000002, "r": 250.95969, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "-", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 86.372002, "t": 230.21155, "r": 112.35663, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Picture", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 230.21155, "r": 159.41275, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23795, "t": 230.21155, "r": 185.57669, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 211.25645, "t": 230.21155, "r": 219.5952, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.27496, "t": 230.21155, "r": 253.61371, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "72", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 86.372002, "t": 241.16956000000005, "r": 141.11188, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Section-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 241.16956000000005, "r": 159.41275, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23795, "t": 241.16956000000005, "r": 185.57669, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "67", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 211.25645, "t": 241.16956000000005, "r": 219.5952, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "69", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.27496, "t": 241.16956000000005, "r": 253.61371, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "68", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 86.372002, "t": 252.12854000000004, "r": 106.17878, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 252.12854000000004, "r": 159.41275, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23795, "t": 252.12854000000004, "r": 185.57669, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 211.25645, "t": 252.12854000000004, "r": 219.5952, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.27496, "t": 252.12854000000004, "r": 253.61371, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "82", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 86.372002, "t": 263.08752000000004, "r": 102.3322, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Text", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 263.08752000000004, "r": 159.41275, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23795, "t": 263.08752000000004, "r": 185.57669, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 211.25645, "t": 263.08752000000004, "r": 219.5952, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.27496, "t": 263.08752000000004, "r": 253.61371, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "84", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 86.372002, "t": 274.04657, "r": 103.36333, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Title", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 274.04657, "r": 159.41275, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 169.37442, "t": 274.04657, "r": 193.43127, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Sec.-h.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 203.39294, "t": 274.04657, "r": 227.4498, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Sec.-h.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 237.41147, "t": 274.04657, "r": 261.46832, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Sec.-h.", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 86.372002, "t": 285.40454, "r": 113.31602000000001, "b": 293.77917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Overall", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 285.40454, "r": 159.41275, "b": 293.77917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23795, "t": 285.40454, "r": 185.57669, "b": 293.77917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "73", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 211.25645, "t": 285.40454, "r": 219.5952, "b": 293.77917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "78", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.27496, "t": 285.40454, "r": 253.61371, "b": 293.77917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "77", "column_header": false, "row_header": false, "row_section": false}]]}}, {"self_ref": "#/tables/3", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "table", "prov": [{"page_no": 7, "bbox": {"l": 352.97747802734375, "t": 641.208740234375, "r": 522.9158935546875, "b": 485.7341613769531, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "data": {"table_cells": [{"bbox": {"l": 358.63901, "t": 153.10051999999996, "r": 401.73154, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Class-count", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.22501, "t": 153.10051999999996, "r": 448.56375, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 3, "text": "11", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 494.38, "t": 153.10051999999996, "r": 498.54938, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 5, "text": "5", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 164.05951000000005, "r": 375.27167, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Split", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 423.341, "t": 164.05951000000005, "r": 438.0459, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Doc", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 448.00757, "t": 164.05951000000005, "r": 465.4472, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Page", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 475.41101, "t": 164.05951000000005, "r": 490.11591, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Doc", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 500.07757999999995, "t": 164.05951000000005, "r": 517.51721, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Page", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 175.41656, "r": 387.82465, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Caption", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 175.41656, "r": 434.86273, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 175.41656, "r": 460.90115000000003, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 186.37554999999998, "r": 391.14221, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Footnote", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 186.37554999999998, "r": 434.86273, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "71", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 186.37554999999998, "r": 460.90115000000003, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 197.33452999999997, "r": 389.15167, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Formula", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 197.33452999999997, "r": 434.86273, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "60", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 197.33452999999997, "r": 460.90115000000003, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "66", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 208.29351999999994, "r": 391.5188, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "List-item", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 208.29351999999994, "r": 434.86273, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 208.29351999999994, "r": 460.90115000000003, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 478.59399, "t": 208.29351999999994, "r": 486.93274, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 504.6324200000001, "t": 208.29351999999994, "r": 512.97119, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 219.25256000000002, "r": 401.16666, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-footer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 219.25256000000002, "r": 434.86273, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "62", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 219.25256000000002, "r": 460.90115000000003, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "89", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 230.21155, "r": 403.91931, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 230.21155, "r": 434.86273, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 230.21155, "r": 460.90115000000003, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "90", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 241.16956000000005, "r": 384.62366, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Picture", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 241.16956000000005, "r": 434.86273, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 241.16956000000005, "r": 460.90115000000003, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 478.59399, "t": 241.16956000000005, "r": 486.93274, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 504.6324200000001, "t": 241.16956000000005, "r": 512.97119, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 252.12854000000004, "r": 413.37891, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Section-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 252.12854000000004, "r": 434.86273, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 252.12854000000004, "r": 460.90115000000003, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 478.59399, "t": 252.12854000000004, "r": 486.93274, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "69", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 504.6324200000001, "t": 252.12854000000004, "r": 512.97119, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 263.08752000000004, "r": 378.44577, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 263.08752000000004, "r": 434.86273, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 263.08752000000004, "r": 460.90115000000003, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "89", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 478.59399, "t": 263.08752000000004, "r": 486.93274, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 504.6324200000001, "t": 263.08752000000004, "r": 512.97119, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "90", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 274.04657, "r": 374.59921, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Text", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 274.04657, "r": 434.86273, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 274.04657, "r": 460.90115000000003, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "91", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 478.59399, "t": 274.04657, "r": 486.93274, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 504.6324200000001, "t": 274.04657, "r": 512.97119, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "90", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 285.00552, "r": 375.63034, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Title", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 285.00552, "r": 434.86273, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 285.00552, "r": 460.90115000000003, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 296.36255, "r": 369.60492, "b": 304.73718, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "All", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 296.36255, "r": 434.86273, "b": 304.73718, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 296.36255, "r": 460.90115000000003, "b": 304.73718, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 478.59399, "t": 296.36255, "r": 486.93274, "b": 304.73718, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "78", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 504.6324200000001, "t": 296.36255, "r": 512.97119, "b": 304.73718, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "87", "column_header": false, "row_header": false, "row_section": false}], "num_rows": 14, "num_cols": 5, "grid": [[{"bbox": {"l": 358.63901, "t": 153.10051999999996, "r": 401.73154, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Class-count", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.22501, "t": 153.10051999999996, "r": 448.56375, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 3, "text": "11", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 440.22501, "t": 153.10051999999996, "r": 448.56375, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 3, "text": "11", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 494.38, "t": 153.10051999999996, "r": 498.54938, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 5, "text": "5", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 494.38, "t": 153.10051999999996, "r": 498.54938, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 5, "text": "5", "column_header": true, "row_header": false, "row_section": false}], [{"bbox": {"l": 358.63901, "t": 164.05951000000005, "r": 375.27167, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Split", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 423.341, "t": 164.05951000000005, "r": 438.0459, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Doc", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 448.00757, "t": 164.05951000000005, "r": 465.4472, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Page", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 475.41101, "t": 164.05951000000005, "r": 490.11591, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Doc", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 500.07757999999995, "t": 164.05951000000005, "r": 517.51721, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Page", "column_header": true, "row_header": false, "row_section": false}], [{"bbox": {"l": 358.63901, "t": 175.41656, "r": 387.82465, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Caption", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 175.41656, "r": 434.86273, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 175.41656, "r": 460.90115000000003, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 358.63901, "t": 186.37554999999998, "r": 391.14221, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Footnote", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 186.37554999999998, "r": 434.86273, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "71", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 186.37554999999998, "r": 460.90115000000003, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 358.63901, "t": 197.33452999999997, "r": 389.15167, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Formula", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 197.33452999999997, "r": 434.86273, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "60", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 197.33452999999997, "r": 460.90115000000003, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "66", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 358.63901, "t": 208.29351999999994, "r": 391.5188, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "List-item", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 208.29351999999994, "r": 434.86273, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 208.29351999999994, "r": 460.90115000000003, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 478.59399, "t": 208.29351999999994, "r": 486.93274, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 504.6324200000001, "t": 208.29351999999994, "r": 512.97119, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "88", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 358.63901, "t": 219.25256000000002, "r": 401.16666, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-footer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 219.25256000000002, "r": 434.86273, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "62", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 219.25256000000002, "r": 460.90115000000003, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "89", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 358.63901, "t": 230.21155, "r": 403.91931, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 230.21155, "r": 434.86273, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 230.21155, "r": 460.90115000000003, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "90", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 358.63901, "t": 241.16956000000005, "r": 384.62366, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Picture", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 241.16956000000005, "r": 434.86273, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 241.16956000000005, "r": 460.90115000000003, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 478.59399, "t": 241.16956000000005, "r": 486.93274, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 504.6324200000001, "t": 241.16956000000005, "r": 512.97119, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "82", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 358.63901, "t": 252.12854000000004, "r": 413.37891, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Section-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 252.12854000000004, "r": 434.86273, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 252.12854000000004, "r": 460.90115000000003, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 478.59399, "t": 252.12854000000004, "r": 486.93274, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "69", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 504.6324200000001, "t": 252.12854000000004, "r": 512.97119, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "83", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 358.63901, "t": 263.08752000000004, "r": 378.44577, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 263.08752000000004, "r": 434.86273, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 263.08752000000004, "r": 460.90115000000003, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "89", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 478.59399, "t": 263.08752000000004, "r": 486.93274, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 504.6324200000001, "t": 263.08752000000004, "r": 512.97119, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "90", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 358.63901, "t": 274.04657, "r": 374.59921, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Text", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 274.04657, "r": 434.86273, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 274.04657, "r": 460.90115000000003, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "91", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 478.59399, "t": 274.04657, "r": 486.93274, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 504.6324200000001, "t": 274.04657, "r": 512.97119, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "90", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 358.63901, "t": 285.00552, "r": 375.63034, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Title", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 285.00552, "r": 434.86273, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 285.00552, "r": 460.90115000000003, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 358.63901, "t": 296.36255, "r": 369.60492, "b": 304.73718, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "All", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 296.36255, "r": 434.86273, "b": 304.73718, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 296.36255, "r": 460.90115000000003, "b": 304.73718, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 478.59399, "t": 296.36255, "r": 486.93274, "b": 304.73718, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "78", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 504.6324200000001, "t": 296.36255, "r": 512.97119, "b": 304.73718, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "87", "column_header": false, "row_header": false, "row_section": false}]]}}, {"self_ref": "#/tables/4", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "table", "prov": [{"page_no": 8, "bbox": {"l": 72.6590347290039, "t": 619.5191955566406, "r": 274.83465576171875, "b": 452.1459655761719, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "data": {"table_cells": [{"bbox": {"l": 217.74099999999999, "t": 175.01855, "r": 256.26065, "b": 183.39319, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 3, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 5, "text": "Testing on", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 89.954002, "t": 185.97655999999995, "r": 133.24379, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Training on", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 185.97655999999995, "r": 175.47588, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "labels", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 204.69, "t": 185.97655999999995, "r": 220.54260000000002, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "PLN", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 230.50427000000002, "t": 185.97655999999995, "r": 242.06197, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "DB", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 252.02364, "t": 185.97655999999995, "r": 269.31085, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "DLN", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 78.530998, "t": 219.25256000000002, "r": 142.56006, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 5, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PubLayNet (PLN)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 154.629, "t": 197.33452999999997, "r": 177.92371, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Figure", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 197.33452999999997, "r": 216.78575000000004, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 197.33452999999997, "r": 240.45705, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "43", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 197.33452999999997, "r": 264.83667, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "23", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 208.29351999999994, "r": 194.72675, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Sec-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 208.29351999999994, "r": 216.78575000000004, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "87", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 234.77235, "t": 208.29351999999994, "r": 237.80299000000002, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 208.29351999999994, "r": 264.83667, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "32", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 219.25256000000002, "r": 174.43578, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 219.25256000000002, "r": 216.78575000000004, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "95", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 219.25256000000002, "r": 240.45705, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "24", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 219.25256000000002, "r": 264.83667, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "49", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 230.21155, "r": 170.58919, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Text", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 230.21155, "r": 216.78575000000004, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 234.77235, "t": 230.21155, "r": 237.80299000000002, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 230.21155, "r": 264.83667, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "42", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 241.16956000000005, "r": 171.2796, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "total", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 241.16956000000005, "r": 216.78575000000004, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "93", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 241.16956000000005, "r": 240.45705, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "34", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 241.16956000000005, "r": 264.83667, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "30", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 78.530998, "t": 263.48650999999995, "r": 131.19963, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "row_span": 3, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "DocBank (DB)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 154.629, "t": 252.52752999999996, "r": 177.92371, "b": 260.90216, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Figure", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 252.52752999999996, "r": 216.78575000000004, "b": 260.90216, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 252.52752999999996, "r": 240.45705, "b": 260.90216, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "71", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 252.52752999999996, "r": 264.83667, "b": 260.90216, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "31", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 263.48650999999995, "r": 174.43578, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 263.48650999999995, "r": 216.78575000000004, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "19", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 263.48650999999995, "r": 240.45705, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "65", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 263.48650999999995, "r": 264.83667, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "22", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 274.44556, "r": 171.2796, "b": 282.82016, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "total", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 274.44556, "r": 216.78575000000004, "b": 282.82016, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "48", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 274.44556, "r": 240.45705, "b": 282.82016, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 274.44556, "r": 264.83667, "b": 282.82016, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "27", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 78.530998, "t": 307.72055, "r": 144.66716, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "row_span": 5, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 15, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "DocLayNet (DLN)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 154.629, "t": 285.80255, "r": 177.92371, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Figure", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 285.80255, "r": 216.78575000000004, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "67", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 285.80255, "r": 240.45705, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "51", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 285.80255, "r": 264.83667, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 296.76154, "r": 194.72675, "b": 305.13617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Sec-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 296.76154, "r": 216.78575000000004, "b": 305.13617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "53", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 234.77235, "t": 296.76154, "r": 237.80299000000002, "b": 305.13617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 296.76154, "r": 264.83667, "b": 305.13617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 307.72055, "r": 174.43578, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 307.72055, "r": 216.78575000000004, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "87", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 307.72055, "r": 240.45705, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "43", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 307.72055, "r": 264.83667, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 318.67953, "r": 170.58919, "b": 327.05417, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Text", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 318.67953, "r": 216.78575000000004, "b": 327.05417, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 234.77235, "t": 318.67953, "r": 237.80299000000002, "b": 327.05417, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 318.67953, "r": 264.83667, "b": 327.05417, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 329.63855, "r": 171.2796, "b": 338.01318, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 14, "end_row_offset_idx": 15, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "total", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 329.63855, "r": 216.78575000000004, "b": 338.01318, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 14, "end_row_offset_idx": 15, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "59", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 329.63855, "r": 240.45705, "b": 338.01318, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 14, "end_row_offset_idx": 15, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "47", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 329.63855, "r": 264.83667, "b": 338.01318, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 14, "end_row_offset_idx": 15, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "78", "column_header": false, "row_header": false, "row_section": false}], "num_rows": 15, "num_cols": 5, "grid": [[{"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 217.74099999999999, "t": 175.01855, "r": 256.26065, "b": 183.39319, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 3, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 5, "text": "Testing on", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 217.74099999999999, "t": 175.01855, "r": 256.26065, "b": 183.39319, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 3, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 5, "text": "Testing on", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 217.74099999999999, "t": 175.01855, "r": 256.26065, "b": 183.39319, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 3, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 5, "text": "Testing on", "column_header": true, "row_header": false, "row_section": false}], [{"bbox": {"l": 89.954002, "t": 185.97655999999995, "r": 133.24379, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Training on", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 185.97655999999995, "r": 175.47588, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "labels", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 204.69, "t": 185.97655999999995, "r": 220.54260000000002, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "PLN", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 230.50427000000002, "t": 185.97655999999995, "r": 242.06197, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "DB", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 252.02364, "t": 185.97655999999995, "r": 269.31085, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "DLN", "column_header": true, "row_header": false, "row_section": false}], [{"bbox": {"l": 78.530998, "t": 219.25256000000002, "r": 142.56006, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 5, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PubLayNet (PLN)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 154.629, "t": 197.33452999999997, "r": 177.92371, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Figure", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 197.33452999999997, "r": 216.78575000000004, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 197.33452999999997, "r": 240.45705, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "43", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 197.33452999999997, "r": 264.83667, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "23", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 78.530998, "t": 219.25256000000002, "r": 142.56006, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 5, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PubLayNet (PLN)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 154.629, "t": 208.29351999999994, "r": 194.72675, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Sec-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 208.29351999999994, "r": 216.78575000000004, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "87", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 234.77235, "t": 208.29351999999994, "r": 237.80299000000002, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 208.29351999999994, "r": 264.83667, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "32", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 78.530998, "t": 219.25256000000002, "r": 142.56006, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 5, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PubLayNet (PLN)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 154.629, "t": 219.25256000000002, "r": 174.43578, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 219.25256000000002, "r": 216.78575000000004, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "95", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 219.25256000000002, "r": 240.45705, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "24", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 219.25256000000002, "r": 264.83667, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "49", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 78.530998, "t": 219.25256000000002, "r": 142.56006, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 5, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PubLayNet (PLN)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 154.629, "t": 230.21155, "r": 170.58919, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Text", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 230.21155, "r": 216.78575000000004, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 234.77235, "t": 230.21155, "r": 237.80299000000002, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 230.21155, "r": 264.83667, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "42", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 78.530998, "t": 219.25256000000002, "r": 142.56006, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 5, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PubLayNet (PLN)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 154.629, "t": 241.16956000000005, "r": 171.2796, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "total", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 241.16956000000005, "r": 216.78575000000004, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "93", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 241.16956000000005, "r": 240.45705, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "34", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 241.16956000000005, "r": 264.83667, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "30", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 78.530998, "t": 263.48650999999995, "r": 131.19963, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "row_span": 3, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "DocBank (DB)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 154.629, "t": 252.52752999999996, "r": 177.92371, "b": 260.90216, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Figure", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 252.52752999999996, "r": 216.78575000000004, "b": 260.90216, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 252.52752999999996, "r": 240.45705, "b": 260.90216, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "71", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 252.52752999999996, "r": 264.83667, "b": 260.90216, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "31", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 78.530998, "t": 263.48650999999995, "r": 131.19963, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "row_span": 3, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "DocBank (DB)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 154.629, "t": 263.48650999999995, "r": 174.43578, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 263.48650999999995, "r": 216.78575000000004, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "19", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 263.48650999999995, "r": 240.45705, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "65", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 263.48650999999995, "r": 264.83667, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "22", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 78.530998, "t": 263.48650999999995, "r": 131.19963, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "row_span": 3, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "DocBank (DB)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 154.629, "t": 274.44556, "r": 171.2796, "b": 282.82016, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "total", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 274.44556, "r": 216.78575000000004, "b": 282.82016, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "48", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 274.44556, "r": 240.45705, "b": 282.82016, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 274.44556, "r": 264.83667, "b": 282.82016, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "27", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 78.530998, "t": 307.72055, "r": 144.66716, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "row_span": 5, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 15, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "DocLayNet (DLN)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 154.629, "t": 285.80255, "r": 177.92371, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Figure", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 285.80255, "r": 216.78575000000004, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "67", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 285.80255, "r": 240.45705, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "51", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 285.80255, "r": 264.83667, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "72", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 78.530998, "t": 307.72055, "r": 144.66716, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "row_span": 5, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 15, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "DocLayNet (DLN)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 154.629, "t": 296.76154, "r": 194.72675, "b": 305.13617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Sec-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 296.76154, "r": 216.78575000000004, "b": 305.13617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "53", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 234.77235, "t": 296.76154, "r": 237.80299000000002, "b": 305.13617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 296.76154, "r": 264.83667, "b": 305.13617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "68", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 78.530998, "t": 307.72055, "r": 144.66716, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "row_span": 5, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 15, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "DocLayNet (DLN)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 154.629, "t": 307.72055, "r": 174.43578, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 307.72055, "r": 216.78575000000004, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "87", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 307.72055, "r": 240.45705, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "43", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 307.72055, "r": 264.83667, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "82", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 78.530998, "t": 307.72055, "r": 144.66716, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "row_span": 5, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 15, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "DocLayNet (DLN)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 154.629, "t": 318.67953, "r": 170.58919, "b": 327.05417, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Text", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 318.67953, "r": 216.78575000000004, "b": 327.05417, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 234.77235, "t": 318.67953, "r": 237.80299000000002, "b": 327.05417, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 318.67953, "r": 264.83667, "b": 327.05417, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "84", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 78.530998, "t": 307.72055, "r": 144.66716, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "row_span": 5, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 15, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "DocLayNet (DLN)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 154.629, "t": 329.63855, "r": 171.2796, "b": 338.01318, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 14, "end_row_offset_idx": 15, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "total", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 329.63855, "r": 216.78575000000004, "b": 338.01318, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 14, "end_row_offset_idx": 15, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "59", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 329.63855, "r": 240.45705, "b": 338.01318, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 14, "end_row_offset_idx": 15, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "47", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 329.63855, "r": 264.83667, "b": 338.01318, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 14, "end_row_offset_idx": 15, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "78", "column_header": false, "row_header": false, "row_section": false}]]}}], "key_value_items": [], "form_items": [], "pages": {"1": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 1}, "2": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 2}, "3": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 3}, "4": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 4}, "5": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 5}, "6": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 6}, "7": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 7}, "8": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 8}, "9": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 9}}}
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v2/2206.01062.md b/tests/data/groundtruth/docling_v2/2206.01062.md
index c5452c57..2401fb63 100644
--- a/tests/data/groundtruth/docling_v2/2206.01062.md
+++ b/tests/data/groundtruth/docling_v2/2206.01062.md
@@ -20,7 +20,7 @@ Accurate document layout analysis is a key requirement for highquality PDF docum
 
 Permission to make digital or hard copies of part or all of this work for personal or classroom use is granted without fee provided that copies are not made or distributed for profit or commercial advantage and that copies bear this notice and the full citation on the first page. Copyrights for third-party components of this work must be honored. For all other uses, contact the owner/author(s).
 
-KDD '22, August 14-18, 2022, Washington, DC, USA
+KDD ’22, August 14-18, 2022, Washington, DC, USA
 
 © 2022 Copyright held by the owner/author(s).
 
@@ -55,7 +55,7 @@ In this paper, we present the DocLayNet dataset. It provides pageby-page layout
 
 This enables experimentation with annotation uncertainty and quality control analysis.
 
-- (5) Pre-defined Train-, Test- & Validation-set : Like DocBank, we provide fixed train-, test- & validation-sets to ensure proportional representation of the class-labels. Further, we prevent leakage of unique layouts across sets, which has a large effect on model accuracy scores.
+- (5) Pre-defined Train-, Test- &amp; Validation-set : Like DocBank, we provide fixed train-, test- &amp; validation-sets to ensure proportional representation of the class-labels. Further, we prevent leakage of unique layouts across sets, which has a large effect on model accuracy scores.
 
 All aspects outlined above are detailed in Section 3. In Section 4, we will elaborate on how we designed and executed this large-scale human annotation campaign. We will also share key insights and lessons learned that might prove helpful for other parties planning to set up annotation campaigns.
 
@@ -77,9 +77,9 @@ Figure 2: Distribution of DocLayNet pages across document categories.
 
 <!-- image -->
 
-to a minimum, since they introduce difficulties in annotation (see Section 4). As a second condition, we focussed on medium to large documents ( > 10 pages) with technical content, dense in complex tables, figures, plots and captions. Such documents carry a lot of information value, but are often hard to analyse with high accuracy due to their challenging layouts. Counterexamples of documents not included in the dataset are receipts, invoices, hand-written documents or photographs showing "text in the wild".
+to a minimum, since they introduce difficulties in annotation (see Section 4). As a second condition, we focussed on medium to large documents ( &gt; 10 pages) with technical content, dense in complex tables, figures, plots and captions. Such documents carry a lot of information value, but are often hard to analyse with high accuracy due to their challenging layouts. Counterexamples of documents not included in the dataset are receipts, invoices, hand-written documents or photographs showing "text in the wild".
 
-The pages in DocLayNet can be grouped into six distinct categories, namely Financial Reports , Manuals , Scientific Articles , Laws & Regulations , Patents and Government Tenders . Each document category was sourced from various repositories. For example, Financial Reports contain both free-style format annual reports 2 which expose company-specific, artistic layouts as well as the more formal SEC filings. The two largest categories ( Financial Reports and Manuals ) contain a large amount of free-style layouts in order to obtain maximum variability. In the other four categories, we boosted the variability by mixing documents from independent providers, such as different government websites or publishers. In Figure 2, we show the document categories contained in DocLayNet with their respective sizes.
+The pages in DocLayNet can be grouped into six distinct categories, namely Financial Reports , Manuals , Scientific Articles , Laws &amp; Regulations , Patents and Government Tenders . Each document category was sourced from various repositories. For example, Financial Reports contain both free-style format annual reports 2 which expose company-specific, artistic layouts as well as the more formal SEC filings. The two largest categories ( Financial Reports and Manuals ) contain a large amount of free-style layouts in order to obtain maximum variability. In the other four categories, we boosted the variability by mixing documents from independent providers, such as different government websites or publishers. In Figure 2, we show the document categories contained in DocLayNet with their respective sizes.
 
 We did not control the document selection with regard to language. The vast majority of documents contained in DocLayNet (close to 95%) are published in English language. However, DocLayNet also contains a number of documents in other languages such as German (2.5%), French (1.0%) and Japanese (1.0%). While the document language has negligible impact on the performance of computer vision methods such as object detection and segmentation models, it might prove challenging for layout analysis methods which exploit textual features.
 
@@ -119,9 +119,7 @@ Figure 3: Corpus Conversion Service annotation user interface. The PDF page is s
 
 we distributed the annotation workload and performed continuous quality controls. Phase one and two required a small team of experts only. For phases three and four, a group of 40 dedicated annotators were assembled and supervised.
 
-Phase 1: Data selection and preparation. Our inclusion criteria for documents were described in Section 3. A large effort went into ensuring that all documents are free to use. The data sources
-
-include publication repositories such as arXiv$^{3}$, government offices, company websites as well as data directory services for financial reports and patents. Scanned documents were excluded wherever possible because they can be rotated or skewed. This would not allow us to perform annotation with rectangular bounding-boxes and therefore complicate the annotation process.
+Phase 1: Data selection and preparation. Our inclusion criteria for documents were described in Section 3. A large effort went into ensuring that all documents are free to use. The data sources include publication repositories such as arXiv$^{3}$, government offices, company websites as well as data directory services for financial reports and patents. Scanned documents were excluded wherever possible because they can be rotated or skewed. This would not allow us to perform annotation with rectangular bounding-boxes and therefore complicate the annotation process.
 
 Preparation work included uploading and parsing the sourced PDF documents in the Corpus Conversion Service (CCS) [22], a cloud-native platform which provides a visual annotation interface and allows for dataset inspection and analysis. The annotation interface of CCS is shown in Figure 3. The desired balance of pages between the different document categories was achieved by selective subsampling of pages with certain desired properties. For example, we made sure to include the title page of each document and bias the remaining page selection to those with figures or tables. The latter was achieved by leveraging pre-trained object detection models from PubLayNet, which helped us estimate how many figures and tables a given page contains.
 
@@ -144,8 +142,6 @@ The complete annotation guideline is over 100 pages long and a detailed descript
 
 Phase 3: Training. After a first trial with a small group of people, we realised that providing the annotation guideline and a set of random practice pages did not yield the desired quality level for layout annotation. Therefore we prepared a subset of pages with two different complexity levels, each with a practice and an exam part. 974 pages were reference-annotated by one proficient core team member. Annotation staff were then given the task to annotate the same subsets (blinded from the reference). By comparing the annotations of each staff member with the reference annotations, we could quantify how closely their annotations matched the reference. Only after passing two exam levels with high annotation quality, staff were admitted into the production phase. Practice iterations
 
-Figure 4: Examples of plausible annotation alternatives for the same page. Criteria in our annotation guideline can resolve cases A to C, while the case D remains ambiguous.
-
 <!-- image -->
 
 05237a14f2524e3f53c8454b074409d05078038a6a36b770fcc8ec7e540deae0
@@ -192,8 +188,6 @@ In Table 2, we present baseline experiments (given in mAP) on Mask R-CNN [12], F
 
 Table 3: Performance of a Mask R-CNN R50 network in mAP@0.5-0.95 scores trained on DocLayNet with different class label sets. The reduced label sets were obtained by either down-mapping or dropping labels.
 
-Table 4: Performance of a Mask R-CNN R50 network with document-wise and page-wise split for different label sets. Naive page-wise split will result in GLYPH<tildelow> 10% point improvement.
-
 | Class-count    |   11 | 6       | 5       | 4       |
 |----------------|------|---------|---------|---------|
 | Caption        |   68 | Text    | Text    | Text    |
@@ -217,6 +211,8 @@ One of the fundamental questions related to any dataset is if it is "large enoug
 
 The choice and number of labels can have a significant effect on the overall model performance. Since PubLayNet, DocBank and DocLayNet all have different label sets, it is of particular interest to understand and quantify this influence of the label set on the model performance. We investigate this by either down-mapping labels into more common ones (e.g. Caption → Text ) or excluding them from the annotations entirely. Furthermore, it must be stressed that all mappings and exclusions were performed on the data before model training. In Table 3, we present the mAP scores for a Mask R-CNN R50 network on different label sets. Where a label is down-mapped, we show its corresponding label, otherwise it was excluded. We present three different label sets, with 6, 5 and 4 different labels respectively. The set of 5 labels contains the same labels as PubLayNet. However, due to the different definition of
 
+Table 4: Performance of a Mask R-CNN R50 network with document-wise and page-wise split for different label sets. Naive page-wise split will result in GLYPH&lt;tildelow&gt; 10% point improvement.
+
 | Class-count    | 11   | 11   | 5   | 5    |
 |----------------|------|------|-----|------|
 | Split          | Doc  | Page | Doc | Page |
@@ -243,7 +239,7 @@ Many documents in DocLayNet have a unique styling. In order to avoid overfitting
 
 Throughout this paper, we claim that DocLayNet's wider variety of document layouts leads to more robust layout detection models. In Table 5, we provide evidence for that. We trained models on each of the available datasets (PubLayNet, DocBank and DocLayNet) and evaluated them on the test sets of the other datasets. Due to the different label sets and annotation styles, a direct comparison is not possible. Hence, we focussed on the common labels among the datasets. Between PubLayNet and DocLayNet, these are Picture ,
 
-Table 5: Prediction Performance (mAP@0.5-0.95) of a Mask R-CNN R50 network across the PubLayNet, DocBank & DocLayNet data-sets. By evaluating on common label classes of each dataset, we observe that the DocLayNet-trained model has much less pronounced variations in performance across all datasets.
+Table 5: Prediction Performance (mAP@0.5-0.95) of a Mask R-CNN R50 network across the PubLayNet, DocBank &amp; DocLayNet data-sets. By evaluating on common label classes of each dataset, we observe that the DocLayNet-trained model has much less pronounced variations in performance across all datasets.
 
 |                 |            | Testing on   | Testing on   | Testing on   |
 |-----------------|------------|--------------|--------------|--------------|
@@ -302,13 +298,13 @@ Figure 6: Example layout predictions on selected pages from the DocLayNet test-s
 
 Diaconu, Mai Thanh Minh, Marc, albinxavi, fatih, oleg, and wanghao yang. ultralytics/yolov5: v6.0 - yolov5n nano models, roboflow integration, tensorflow export, opencv dnn support, October 2021.
 
+- [20] Shoubin Li, Xuyan Ma, Shuaiqun Pan, Jun Hu, Lin Shi, and Qing Wang. Vtlayout: Fusion of visual and text features for document layout analysis, 2021.
 - [14] Nicolas Carion, Francisco Massa, Gabriel Synnaeve, Nicolas Usunier, Alexander Kirillov, and Sergey Zagoruyko. End-to-end object detection with transformers. CoRR , abs/2005.12872, 2020.
 - [15] Mingxing Tan, Ruoming Pang, and Quoc V. Le. Efficientdet: Scalable and efficient object detection. CoRR , abs/1911.09070, 2019.
 - [16] Tsung-Yi Lin, Michael Maire, Serge J. Belongie, Lubomir D. Bourdev, Ross B. Girshick, James Hays, Pietro Perona, Deva Ramanan, Piotr Dollár, and C. Lawrence Zitnick. Microsoft COCO: common objects in context, 2014.
 - [17] Yuxin Wu, Alexander Kirillov, Francisco Massa, Wan-Yen Lo, and Ross Girshick. Detectron2, 2019.
 - [18] Nikolaos Livathinos, Cesar Berrospi, Maksym Lysak, Viktor Kuropiatnyk, Ahmed Nassar, Andre Carvalho, Michele Dolfi, Christoph Auer, Kasper Dinkla, and Peter W. J. Staar. Robust pdf document conversion using recurrent neural networks. In Proceedings of the 35th Conference on Artificial Intelligence , AAAI, pages 1513715145, feb 2021.
 - [19] Yiheng Xu, Minghao Li, Lei Cui, Shaohan Huang, Furu Wei, and Ming Zhou. Layoutlm: Pre-training of text and layout for document image understanding. In Proceedings of the 26th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining , KDD, pages 1192-1200, New York, USA, 2020. Association for Computing Machinery.
-- [20] Shoubin Li, Xuyan Ma, Shuaiqun Pan, Jun Hu, Lin Shi, and Qing Wang. Vtlayout: Fusion of visual and text features for document layout analysis, 2021.
 - [21] Peng Zhang, Can Li, Liang Qiao, Zhanzhan Cheng, Shiliang Pu, Yi Niu, and Fei Wu. Vsr: A unified framework for document layout analysis combining vision, semantics and relations, 2021.
 - [22] Peter W J Staar, Michele Dolfi, Christoph Auer, and Costas Bekas. Corpus conversion service: A machine learning platform to ingest documents at scale. In Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining , KDD, pages 774-782. ACM, 2018.
 - [23] Connor Shorten and Taghi M. Khoshgoftaar. A survey on image data augmentation for deep learning. Journal of Big Data , 6(1):60, 2019.
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v2/2206.01062.pages.json b/tests/data/groundtruth/docling_v2/2206.01062.pages.json
index 5991c6e9..f59ac8a0 100644
--- a/tests/data/groundtruth/docling_v2/2206.01062.pages.json
+++ b/tests/data/groundtruth/docling_v2/2206.01062.pages.json
@@ -1 +1 @@
-[{"page_no": 0, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "DocLayNet: A Large Human-Annotated Dataset for", "bbox": {"l": 107.29999999999998, "t": 83.69470000000013, "r": 505.06195, "b": 99.67058999999995, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Document-Layout Analysis", "bbox": {"l": 200.117, "t": 103.6196900000001, "r": 411.88367, "b": 119.59558000000015, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Birgit Pfitzmann", "bbox": {"l": 102.06001, "t": 133.67236000000003, "r": 182.63805, "b": 144.83856000000003, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "IBM Research", "bbox": {"l": 114.29401000000001, "t": 147.02423, "r": 170.40337, "b": 156.32928000000004, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Rueschlikon, Switzerland", "bbox": {"l": 90.96701, "t": 158.97924999999998, "r": 193.73123, "b": 168.28430000000003, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "bpf@zurich.ibm.com", "bbox": {"l": 100.02301, "t": 170.93524000000002, "r": 184.67522, "b": 180.24030000000005, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Christoph Auer", "bbox": {"l": 268.62402, "t": 133.67236000000003, "r": 344.59933, "b": 144.83856000000003, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "IBM Research", "bbox": {"l": 278.44302, "t": 147.02423, "r": 334.55237, "b": 156.32928000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Rueschlikon, Switzerland", "bbox": {"l": 255.11602999999997, "t": 158.97924999999998, "r": 357.88025, "b": 168.28430000000003, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "cau@zurich.ibm.com", "bbox": {"l": 263.70404, "t": 170.93524000000002, "r": 349.29272, "b": 180.24030000000005, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Michele Dolfi", "bbox": {"l": 437.6930500000001, "t": 133.67236000000003, "r": 503.60208, "b": 144.83856000000003, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "IBM Research", "bbox": {"l": 442.59305000000006, "t": 147.02423, "r": 498.7023899999999, "b": 156.32928000000004, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Rueschlikon, Switzerland", "bbox": {"l": 419.26505, "t": 158.97924999999998, "r": 522.0293, "b": 168.28430000000003, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "dol@zurich.ibm.com", "bbox": {"l": 428.56104000000005, "t": 170.93524000000002, "r": 512.73505, "b": 180.24030000000005, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Ahmed S. Nassar", "bbox": {"l": 182.26804, "t": 192.05737, "r": 265.39255, "b": 203.22357, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "IBM Research", "bbox": {"l": 195.87103, "t": 205.40923999999995, "r": 251.98038999999997, "b": 214.71429, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Rueschlikon, Switzerland", "bbox": {"l": 172.54303, "t": 217.36425999999994, "r": 275.30725, "b": 226.66931, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "ahn@zurich.ibm.com", "bbox": {"l": 180.52803, "t": 229.32025, "r": 267.3222, "b": 238.62531, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Peter Staar", "bbox": {"l": 361.52802, "t": 192.05737, "r": 414.84821, "b": 203.22357, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "IBM Research", "bbox": {"l": 360.02002, "t": 205.40923999999995, "r": 416.12939, "b": 214.71429, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Rueschlikon, Switzerland", "bbox": {"l": 336.69302, "t": 217.36425999999994, "r": 439.45727999999997, "b": 226.66931, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "taa@zurich.ibm.com", "bbox": {"l": 346.20703, "t": 229.32025, "r": 429.94269, "b": 238.62531, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "ABSTRACT", "bbox": {"l": 53.798035, "t": 247.70288000000005, "r": 111.94354, "b": 258.01202, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Accurate document layout analysis is a key requirement for high-", "bbox": {"l": 53.484001, "t": 262.90454, "r": 295.55591, "b": 271.27917, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "quality PDF document conversion. With the recent availability of", "bbox": {"l": 53.79800000000001, "t": 273.86352999999997, "r": 294.04199, "b": 282.23816, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "public, large ground-truth datasets such as PubLayNet and DocBank,", "bbox": {"l": 53.79800000000001, "t": 284.82254, "r": 295.34586, "b": 293.19717, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "deep-learning models have proven to be very effective at layout", "bbox": {"l": 53.79800000000001, "t": 295.78152, "r": 294.04709, "b": 304.15616000000006, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "detection and segmentation. While these datasets are of adequate", "bbox": {"l": 53.79800000000001, "t": 306.74053999999995, "r": 294.04645, "b": 315.11517, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "size to train such models, they severely lack in layout variability", "bbox": {"l": 53.79800000000001, "t": 317.69952, "r": 294.27573, "b": 326.07416, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "since they are sourced from scientific article repositories such as", "bbox": {"l": 53.79800000000001, "t": 328.65854, "r": 294.04712, "b": 337.03317, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "PubMed and arXiv only. Consequently, the accuracy of the layout", "bbox": {"l": 53.79800000000001, "t": 339.61755, "r": 294.0437, "b": 347.99219, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "segmentation drops significantly when these models are applied", "bbox": {"l": 53.79800000000001, "t": 350.57654, "r": 294.04715, "b": 358.95117, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "on more challenging and diverse layouts. In this paper, we present", "bbox": {"l": 53.79800000000001, "t": 361.53455, "r": 294.04364, "b": 369.90918000000005, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "DocLayNet", "bbox": {"l": 53.79800000000001, "t": 372.53839, "r": 92.863388, "b": 380.87714000000005, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": ", a new, publicly available, document-layout annotation", "bbox": {"l": 92.863998, "t": 372.49353, "r": 294.04361, "b": 380.86816, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "dataset in COCO format. It contains 80863 manually annotated", "bbox": {"l": 53.79800000000001, "t": 383.45255, "r": 294.04718, "b": 391.82718, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "pages from diverse data sources to represent a wide variability in", "bbox": {"l": 53.79800000000001, "t": 394.41153, "r": 294.0437, "b": 402.78616, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "layouts. For each PDF page, the layout annotations provide labelled", "bbox": {"l": 53.79800000000001, "t": 405.37054, "r": 294.04535, "b": 413.74518, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "bounding-boxes with a choice of 11 distinct classes. DocLayNet", "bbox": {"l": 53.79800000000001, "t": 416.32953, "r": 294.04715, "b": 424.70416000000006, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "also provides a subset of double- and triple-annotated pages to", "bbox": {"l": 53.79800000000001, "t": 427.28853999999995, "r": 294.04712, "b": 435.66318, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "determine the inter-annotator agreement. In multiple experiments,", "bbox": {"l": 53.79800000000001, "t": 438.24753, "r": 295.03, "b": 446.62216, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "we provide baseline accuracy scores (in mAP) for a set of popular", "bbox": {"l": 53.466999, "t": 449.20654, "r": 294.21616, "b": 457.58118, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "object detection models. We also demonstrate that these models", "bbox": {"l": 53.79800000000001, "t": 460.16553, "r": 294.04712, "b": 468.54016, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "fall approximately 10% behind the inter-annotator agreement. Fur-", "bbox": {"l": 53.79800000000001, "t": 471.12354, "r": 295.56018, "b": 479.49817, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "thermore, we provide evidence that DocLayNet is of sufficient size.", "bbox": {"l": 53.79800000000001, "t": 482.08255, "r": 295.42783, "b": 490.45718, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Lastly, we compare models trained on PubLayNet, DocBank and", "bbox": {"l": 53.79800000000001, "t": 493.04153, "r": 294.04715, "b": 501.41617, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "DocLayNet, showing that layout predictions of the DocLayNet-", "bbox": {"l": 53.79800000000001, "t": 504.00055, "r": 295.55618, "b": 512.37518, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "trained models are more robust and thus the preferred choice for", "bbox": {"l": 53.79800000000001, "t": 514.95953, "r": 294.21643, "b": 523.33417, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "general-purpose document-layout analysis.", "bbox": {"l": 53.79800000000001, "t": 525.91855, "r": 212.05495, "b": 534.29318, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "CCS CONCEPTS", "bbox": {"l": 53.79800000000001, "t": 550.99692, "r": 134.81989, "b": 561.30602, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "\u2022", "bbox": {"l": 53.79800000000001, "t": 566.19957, "r": 56.945206000000006, "b": 574.57419, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Information systems", "bbox": {"l": 58.440002, "t": 566.0830100000001, "r": 142.4462, "b": 574.5562600000001, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "\u2192", "bbox": {"l": 143.938, "t": 566.36096, "r": 153.15099, "b": 574.43073, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Document structure", "bbox": {"l": 154.646, "t": 566.0830100000001, "r": 235.46015999999997, "b": 574.5562600000001, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "; \u2022", "bbox": {"l": 235.45700000000002, "t": 566.19955, "r": 242.17419, "b": 574.57417, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "Applied com-", "bbox": {"l": 243.66899, "t": 566.08299, "r": 297.85294, "b": 574.55624, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "puting", "bbox": {"l": 53.797989, "t": 577.0419899999999, "r": 80.661324, "b": 585.51524, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "\u2192", "bbox": {"l": 83.565987, "t": 577.3199500000001, "r": 92.778961, "b": 585.38971, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Document analysis", "bbox": {"l": 95.68399, "t": 577.0419899999999, "r": 173.91583, "b": 585.51524, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "; \u2022", "bbox": {"l": 173.916, "t": 577.15855, "r": 182.1272, "b": 585.53317, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Computing methodologies", "bbox": {"l": 185.032, "t": 577.0419899999999, "r": 294.0455, "b": 585.51524, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "\u2192", "bbox": {"l": 53.79800399999999, "t": 588.27895, "r": 63.01097899999999, "b": 596.34871, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "Machine learning", "bbox": {"l": 65.253006, "t": 588.00099, "r": 136.80487, "b": 596.47424, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": ";", "bbox": {"l": 136.80501, "t": 588.1175499999999, "r": 138.92108, "b": 596.49217, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "Computer vision", "bbox": {"l": 141.162, "t": 588.00099, "r": 209.60254, "b": 596.47424, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": ";", "bbox": {"l": 209.60201, "t": 588.1175499999999, "r": 211.71808, "b": 596.49217, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "Object detection", "bbox": {"l": 213.96001, "t": 588.16238, "r": 270.45728, "b": 596.50114, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": ";", "bbox": {"l": 270.48001, "t": 588.1175499999999, "r": 272.59607, "b": 596.49217, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "Permission to make digital or hard copies of part or all of this work for personal or", "bbox": {"l": 53.79800000000001, "t": 634.39838, "r": 294.17697, "b": 640.9119000000001, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "classroom use is granted without fee provided that copies are not made or distributed", "bbox": {"l": 53.79800000000001, "t": 642.36838, "r": 294.04443, "b": 648.8819, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "for profit or commercial advantage and that copies bear this notice and the full citation", "bbox": {"l": 53.79800000000001, "t": 650.33838, "r": 294.04498, "b": 656.8519, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "on the first page. Copyrights for third-party components of this work must be honored.", "bbox": {"l": 53.79800000000001, "t": 658.3083799999999, "r": 295.11798, "b": 664.8219, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "For all other uses, contact the owner/author(s).", "bbox": {"l": 53.79800000000001, "t": 666.27837, "r": 187.72285, "b": 672.79189, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 53.79800000000001, "t": 675.08023, "r": 197.86275, "b": 681.56586, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "\u00a9 2022 Copyright held by the owner/author(s).", "bbox": {"l": 53.317001, "t": 683.81236, "r": 186.74652, "b": 690.32589, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "ACM ISBN 978-1-4503-9385-0/22/08.", "bbox": {"l": 53.554001, "t": 691.78336, "r": 157.03125, "b": 698.29689, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "https://doi.org/10.1145/3534678.3539043", "bbox": {"l": 53.79800000000001, "t": 699.753365, "r": 166.94093, "b": 706.266891, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "13", "bbox": {"l": 327.86951, "t": 351.78085, "r": 330.41248, "b": 353.95465, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "USING THE VERTICAL TUBE -", "bbox": {"l": 327.83005, "t": 331.57268999999997, "r": 351.16092, "b": 333.31171, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "MODELS AY11230/11234", "bbox": {"l": 327.83005, "t": 333.18292, "r": 348.30536, "b": 334.92194, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "1.", "bbox": {"l": 327.83005, "t": 336.40439, "r": 329.05914, "b": 337.92606, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "The vertical tube can be used for", "bbox": {"l": 329.67368, "t": 336.40439, "r": 349.95349, "b": 337.92606, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "instructional viewing or to photograph", "bbox": {"l": 329.11752, "t": 337.83588, "r": 353.57977, "b": 339.35751000000005, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": " the image with a digital camera or a", "bbox": {"l": 327.77121, "t": 339.26736, "r": 352.4306, "b": 340.789, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": " micro TV unit", "bbox": {"l": 328.15176, "t": 340.69882, "r": 337.91086, "b": 342.22049, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "2.", "bbox": {"l": 327.8313, "t": 342.19043000000005, "r": 329.09155, "b": 343.71207, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Loosen the retention screw, then rotate ", "bbox": {"l": 329.72168, "t": 342.19043000000005, "r": 354.9267, "b": 343.71207, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": " the adjustment ring to change the ", "bbox": {"l": 327.8313, "t": 343.62192, "r": 351.66949, "b": 345.14355, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": " length of the vertical tube.", "bbox": {"l": 328.21185, "t": 345.05338, "r": 346.33179, "b": 346.57504, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "3.", "bbox": {"l": 327.83005, "t": 346.84680000000003, "r": 329.12726, "b": 348.36847, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "Make sure that both the images in", "bbox": {"l": 329.77588, "t": 346.84680000000003, "r": 351.18005, "b": 348.36847, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "OPERATION ", "bbox": {"l": 327.25311, "t": 254.94812000000002, "r": 350.07861, "b": 258.86096, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "(", "bbox": {"l": 350.07861, "t": 254.76782000000003, "r": 351.82651, "b": 258.68066, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "cont.", "bbox": {"l": 351.82651, "t": 254.94812000000002, "r": 360.85242, "b": 258.86096, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": ")", "bbox": {"l": 360.85242, "t": 254.76782000000003, "r": 362.60028, "b": 258.68066, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "SELECTING OBJECTIVE ", "bbox": {"l": 326.88037, "t": 263.49492999999995, "r": 345.84351, "b": 265.23395000000005, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "MAGNIFICATION", "bbox": {"l": 326.88037, "t": 265.10515999999996, "r": 340.54153, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "1.", "bbox": {"l": 326.88037, "t": 266.71533, "r": 328.31903, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "There are two objectives. The lower", "bbox": {"l": 329.03836, "t": 266.71533, "r": 354.21472, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": " magnification objective has a greater", "bbox": {"l": 326.88037, "t": 268.32556, "r": 355.19193, "b": 270.06458, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": " depth of field and view.", "bbox": {"l": 326.88037, "t": 269.93579, "r": 345.80057, "b": 271.6748, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "2.", "bbox": {"l": 326.88037, "t": 271.54602, "r": 328.33862, "b": 273.28503, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "In order to observe the specimen", "bbox": {"l": 329.06775, "t": 271.54602, "r": 352.39969, "b": 273.28503, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": " easily use the lower magnification", "bbox": {"l": 326.88037, "t": 273.15619000000004, "r": 352.90042, "b": 274.89526, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": " objective first. Then, by rotating the", "bbox": {"l": 326.88037, "t": 274.76642000000004, "r": 354.59546, "b": 276.50543000000005, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": " case, the magnification can be", "bbox": {"l": 326.88037, "t": 276.37665000000004, "r": 350.81885, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": " changed.", "bbox": {"l": 326.88037, "t": 277.98688000000004, "r": 335.46707, "b": 279.72589000000005, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "CHANGING THE INTERPUPILLARY ", "bbox": {"l": 326.88037, "t": 281.20728, "r": 354.57755, "b": 282.94632, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "DISTANCE", "bbox": {"l": 326.88037, "t": 282.81750000000005, "r": 335.1752, "b": 284.55652, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "1.", "bbox": {"l": 326.88037, "t": 284.4277, "r": 328.34784, "b": 286.16675, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "The distance between the observer's", "bbox": {"l": 329.08157, "t": 284.4277, "r": 354.76245, "b": 286.16675, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": " pupils is the interpupillary distance.", "bbox": {"l": 326.88037, "t": 286.03793, "r": 354.6499, "b": 287.77695, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "2.", "bbox": {"l": 326.88037, "t": 287.64813, "r": 328.25125, "b": 289.38718, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "To adjust the interpupillary distance", "bbox": {"l": 328.93671, "t": 287.64813, "r": 354.29825, "b": 289.38718, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": " rotate the prism caps until both eyes", "bbox": {"l": 326.88181, "t": 289.25836, "r": 355.02075, "b": 290.99738, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": " coincide with the image in the", "bbox": {"l": 326.88181, "t": 290.86855999999995, "r": 350.82028, "b": 292.6076, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": " eyepiece. ", "bbox": {"l": 326.88181, "t": 292.47879, "r": 336.2067, "b": 294.2178, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "FOCUSING", "bbox": {"l": 326.88181, "t": 295.69922, "r": 335.3941, "b": 297.43823, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "1.", "bbox": {"l": 326.88181, "t": 297.30942, "r": 328.34314, "b": 299.04846, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "Remove the lens protective cover.", "bbox": {"l": 329.07379, "t": 297.30942, "r": 353.18555, "b": 299.04846, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "2.", "bbox": {"l": 326.88324, "t": 298.91965, "r": 328.35919, "b": 300.65866, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "Place the specimen on the working", "bbox": {"l": 329.0972, "t": 298.91965, "r": 353.45065, "b": 300.65866, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": " stage.", "bbox": {"l": 326.88324, "t": 300.52985, "r": 333.32825, "b": 302.26889000000006, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "3.", "bbox": {"l": 326.88324, "t": 302.14008000000007, "r": 328.31296, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "Focus the specimen with the left eye", "bbox": {"l": 329.02783, "t": 302.14008000000007, "r": 354.76303, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": " first while turning the focus knob until", "bbox": {"l": 326.88324, "t": 303.75027, "r": 355.96307, "b": 305.48932, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": " the image appears clear and sharp.", "bbox": {"l": 326.88324, "t": 305.3605, "r": 354.46594, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "4.", "bbox": {"l": 326.88324, "t": 306.9707, "r": 328.25488, "b": 308.70975, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "Rotate the right eyepiece ring until the", "bbox": {"l": 328.9407, "t": 306.9707, "r": 356.37335, "b": 308.70975, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": " images in each eyepiece coincide and", "bbox": {"l": 326.88324, "t": 308.58093, "r": 355.38867, "b": 310.31995, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": " are sharp and clear.", "bbox": {"l": 326.88324, "t": 310.19113, "r": 343.17249, "b": 311.93018, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "CHANGING THE BULB", "bbox": {"l": 326.88324, "t": 313.41156, "r": 344.13388, "b": 315.15059999999994, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "1.", "bbox": {"l": 326.88324, "t": 315.02178999999995, "r": 328.37418, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "Disconnect the power cord.", "bbox": {"l": 329.11963, "t": 315.02178999999995, "r": 348.50162, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "2.", "bbox": {"l": 326.88324, "t": 316.63199, "r": 328.34061, "b": 318.37103, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "When the bulb is cool, remove the", "bbox": {"l": 329.06931, "t": 316.63199, "r": 353.11588, "b": 318.37103, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": " oblique illuminator cap and remove", "bbox": {"l": 326.88464, "t": 318.2422199999999, "r": 353.79517, "b": 319.9812299999999, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": " the halogen bulb with cap.", "bbox": {"l": 326.88464, "t": 319.85242000000005, "r": 348.02094, "b": 321.59146, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "3.", "bbox": {"l": 326.88464, "t": 321.46265, "r": 328.37512, "b": 323.20166, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "Replace with a new halogen bulb.", "bbox": {"l": 329.12036, "t": 321.46265, "r": 352.96808, "b": 323.20166, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "4.", "bbox": {"l": 326.88608, "t": 323.07285, "r": 328.36884, "b": 324.81189, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "Open the window in the base plate and", "bbox": {"l": 329.1102, "t": 323.07285, "r": 356.5412, "b": 324.81189, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": " replace the halogen lamp or ", "bbox": {"l": 326.88608, "t": 324.68307000000004, "r": 350.13828, "b": 326.42209, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": " fluorescent lamp of transmitted", "bbox": {"l": 326.88608, "t": 326.29327, "r": 351.59677, "b": 328.03232, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": " illuminator.", "bbox": {"l": 326.88608, "t": 327.9035, "r": 336.89197, "b": 329.64252, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "FOCUSING", "bbox": {"l": 358.42023, "t": 263.49492999999995, "r": 366.93256, "b": 265.23395000000005, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "1.", "bbox": {"l": 358.42023, "t": 265.10515999999996, "r": 359.89841, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "Turn the focusing knob away or toward", "bbox": {"l": 360.63751, "t": 265.10515999999996, "r": 387.98407, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": " you until a clear image is viewed.", "bbox": {"l": 358.42023, "t": 266.71533, "r": 384.58948, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "2.", "bbox": {"l": 358.42166, "t": 268.32556, "r": 359.78549, "b": 270.06458, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "If the image is unclear, adjust the", "bbox": {"l": 360.46741, "t": 268.32556, "r": 384.33441, "b": 270.06458, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": " height of the elevator up or down,", "bbox": {"l": 358.4231, "t": 269.93579, "r": 384.61502, "b": 271.6748, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": " then turn the focusing knob again.", "bbox": {"l": 358.4231, "t": 271.54602, "r": 385.38922, "b": 273.28503, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "ZOOM MAGNIFICATION", "bbox": {"l": 358.4231, "t": 274.76642000000004, "r": 377.35046, "b": 276.50543000000005, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "1.", "bbox": {"l": 358.4231, "t": 276.37665000000004, "r": 359.89429, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "Turn the zoom magnification knob to", "bbox": {"l": 360.62988, "t": 276.37665000000004, "r": 386.37589, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": " the desired magnification and field of", "bbox": {"l": 358.4231, "t": 277.98688000000004, "r": 386.78732, "b": 279.72589000000005, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": " view.", "bbox": {"l": 358.4231, "t": 279.59704999999997, "r": 364.16855, "b": 281.33609, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "2.", "bbox": {"l": 358.4231, "t": 281.20728, "r": 359.86777, "b": 282.94632, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "In most situations, it is recommended", "bbox": {"l": 360.59012, "t": 281.20728, "r": 387.31656, "b": 282.94632, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": " that you focus at the lowest ", "bbox": {"l": 358.4231, "t": 282.81750000000005, "r": 381.56656, "b": 284.55652, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": " magnification, then move to a higher", "bbox": {"l": 358.4231, "t": 284.4277, "r": 386.63403, "b": 286.16675, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": " magnification and re-focus as ", "bbox": {"l": 358.42453, "t": 286.03793, "r": 382.77115, "b": 287.77695, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": " necessary.", "bbox": {"l": 358.42453, "t": 287.64813, "r": 367.98694, "b": 289.38718, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "3.", "bbox": {"l": 358.42453, "t": 289.25836, "r": 359.80386, "b": 290.99738, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "If the image is not clear to both eyes", "bbox": {"l": 360.49353, "t": 289.25836, "r": 386.70093, "b": 290.99738, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": " at the same time, the diopter ring may", "bbox": {"l": 358.42453, "t": 290.86855999999995, "r": 388.03534, "b": 292.6076, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": " need adjustment.", "bbox": {"l": 358.42453, "t": 292.47879, "r": 373.13724, "b": 294.2178, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "DIOPTER RING ADJUSTMENT", "bbox": {"l": 358.42453, "t": 295.69922, "r": 381.74539, "b": 297.43823, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "1.", "bbox": {"l": 358.42453, "t": 297.30942, "r": 359.83682, "b": 299.04846, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "To adjust the eyepiece for viewing with", "bbox": {"l": 360.54297, "t": 297.30942, "r": 388.08289, "b": 299.04846, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": " or without eyeglasses and for ", "bbox": {"l": 358.42453, "t": 298.91965, "r": 382.73251, "b": 300.65866, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": " differences in acuity between the right", "bbox": {"l": 358.42453, "t": 300.52985, "r": 387.72266, "b": 302.26889000000006, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": " and left eyes, follow the following", "bbox": {"l": 358.42453, "t": 302.14008000000007, "r": 384.1991, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": " steps:", "bbox": {"l": 358.42453, "t": 303.75027, "r": 364.88672, "b": 305.48932, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "a.", "bbox": {"l": 358.42453, "t": 305.3605, "r": 359.95078, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "Observe an image through the left", "bbox": {"l": 361.47699, "t": 305.3605, "r": 386.65988, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": " eyepiece and bring a specific point", "bbox": {"l": 358.42453, "t": 306.9707, "r": 386.7634, "b": 308.70975, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": " into focus using the focus knob.", "bbox": {"l": 358.42453, "t": 308.58093, "r": 385.41354, "b": 310.31995, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "b.", "bbox": {"l": 358.42453, "t": 310.19113, "r": 359.93304, "b": 311.93018, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "By turning the diopter ring ", "bbox": {"l": 361.44156, "t": 310.19113, "r": 382.56085, "b": 311.93018, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": " adjustment for the left eyepiece,", "bbox": {"l": 358.42596, "t": 311.80136, "r": 385.4559, "b": 313.54037, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": " bring the same point into sharp", "bbox": {"l": 358.42596, "t": 313.41156, "r": 384.56122, "b": 315.15059999999994, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": " focus.", "bbox": {"l": 358.42596, "t": 315.02178999999995, "r": 366.74371, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": " c.Then bring the same point into", "bbox": {"l": 358.42596, "t": 316.63199, "r": 383.93884, "b": 318.37103, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": " focus through the right eyepiece", "bbox": {"l": 358.42596, "t": 318.2422199999999, "r": 385.69241, "b": 319.9812299999999, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": " by turning the right diopter ring.", "bbox": {"l": 358.42596, "t": 319.85242000000005, "r": 385.94861, "b": 321.59146, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": " d.With more than one viewer, each", "bbox": {"l": 358.42596, "t": 321.46265, "r": 385.54236, "b": 323.20166, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": " viewer should note their own", "bbox": {"l": 358.42596, "t": 323.07285, "r": 382.98718, "b": 324.81189, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": " diopter ring position for the left", "bbox": {"l": 358.42596, "t": 324.68307000000004, "r": 385.06448, "b": 326.42209, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": " and right eyepieces, then before", "bbox": {"l": 358.42596, "t": 326.29327, "r": 385.20682, "b": 328.03232, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": " viewing set the diopter ring", "bbox": {"l": 358.42596, "t": 327.9035, "r": 382.21964, "b": 329.64252, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": " adjustments to that setting.", "bbox": {"l": 358.42596, "t": 329.5137, "r": 382.63382, "b": 331.25275, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "CHANGING THE BULB", "bbox": {"l": 358.42596, "t": 332.73412999999994, "r": 375.67661, "b": 334.47317999999996, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "1.", "bbox": {"l": 358.42596, "t": 334.34436, "r": 359.90311, "b": 336.08337, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "Disconnect the power cord from the", "bbox": {"l": 360.64169, "t": 334.34436, "r": 385.75333, "b": 336.08337, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": " electrical outlet.", "bbox": {"l": 358.42596, "t": 335.95456, "r": 372.01416, "b": 337.6936, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "2.", "bbox": {"l": 358.42596, "t": 337.56479, "r": 359.88327, "b": 339.3038, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "When the bulb is cool, remove the", "bbox": {"l": 360.61191, "t": 337.56479, "r": 384.65726, "b": 339.3038, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": " oblique illuminator cap and remove", "bbox": {"l": 358.42596, "t": 339.17499, "r": 385.33649, "b": 340.9140300000001, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": " the halogen bulb with cap.", "bbox": {"l": 358.42596, "t": 340.78522, "r": 379.57224, "b": 342.52423, "coord_origin": "TOPLEFT"}}, {"id": 201, "text": "3.", "bbox": {"l": 358.4274, "t": 342.39542, "r": 359.91788, "b": 344.13446000000005, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": "Replace with a new halogen bulb.", "bbox": {"l": 360.66312, "t": 342.39542, "r": 384.5108, "b": 344.13446000000005, "coord_origin": "TOPLEFT"}}, {"id": 203, "text": "4.", "bbox": {"l": 358.42883, "t": 344.00565000000006, "r": 359.92792, "b": 345.74466, "coord_origin": "TOPLEFT"}}, {"id": 204, "text": "Open the window in the base plate", "bbox": {"l": 360.67746, "t": 344.00565000000006, "r": 385.41235, "b": 345.74466, "coord_origin": "TOPLEFT"}}, {"id": 205, "text": " and replace the halogen lamp or", "bbox": {"l": 358.42883, "t": 345.61584, "r": 383.2782, "b": 347.35489, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": " fluorescent lamp of transmitted", "bbox": {"l": 358.42883, "t": 347.22607, "r": 383.13953, "b": 348.96509, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": " illuminator.", "bbox": {"l": 358.42883, "t": 348.83627, "r": 368.43472, "b": 350.57532, "coord_origin": "TOPLEFT"}}, {"id": 208, "text": "Model AY11230", "bbox": {"l": 326.59567, "t": 261.14185, "r": 339.11377, "b": 262.88091999999995, "coord_origin": "TOPLEFT"}}, {"id": 209, "text": "Model AY11234", "bbox": {"l": 358.48605, "t": 261.14185, "r": 371.00415, "b": 262.88091999999995, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": "14", "bbox": {"l": 455.43533, "t": 351.77038999999996, "r": 457.97827000000007, "b": 353.94415, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "Objectives", "bbox": {"l": 408.24518, "t": 275.52673000000004, "r": 414.4234, "b": 276.96020999999996, "coord_origin": "TOPLEFT"}}, {"id": 212, "text": "Revolving Turret", "bbox": {"l": 409.39554, "t": 268.98235999999997, "r": 419.06677, "b": 270.41583, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "Coarse ", "bbox": {"l": 441.3895, "t": 279.12627999999995, "r": 445.87192, "b": 280.55975, "coord_origin": "TOPLEFT"}}, {"id": 214, "text": "Adjustment", "bbox": {"l": 441.3895, "t": 280.30609, "r": 448.22338999999994, "b": 281.7395900000001, "coord_origin": "TOPLEFT"}}, {"id": 215, "text": "Knob", "bbox": {"l": 441.3895, "t": 281.48593, "r": 444.40371999999996, "b": 282.91939999999994, "coord_origin": "TOPLEFT"}}, {"id": 216, "text": "MODEL AY11236", "bbox": {"l": 398.79288, "t": 254.94646999999998, "r": 428.91568, "b": 258.85931000000005, "coord_origin": "TOPLEFT"}}, {"id": 217, "text": "MICROSCOPE USAGE", "bbox": {"l": 398.32535, "t": 305.04291, "r": 435.93542, "b": 308.95572000000004, "coord_origin": "TOPLEFT"}}, {"id": 218, "text": "BARSKA Model AY11236 is a powerful fixed power compound ", "bbox": {"l": 398.08594, "t": 310.35892, "r": 453.72171, "b": 312.53271, "coord_origin": "TOPLEFT"}}, {"id": 219, "text": "microscope designed for biological studies such as specimen ", "bbox": {"l": 398.08594, "t": 312.50586, "r": 453.09939999999995, "b": 314.67966, "coord_origin": "TOPLEFT"}}, {"id": 220, "text": "examination. It can also be used for examining bacteria and", "bbox": {"l": 398.08594, "t": 314.6528, "r": 456.65246999999994, "b": 316.8266, "coord_origin": "TOPLEFT"}}, {"id": 221, "text": "for general clinical and medical studies and other scientific uses. ", "bbox": {"l": 398.08594, "t": 316.79977, "r": 456.73859000000004, "b": 318.97354, "coord_origin": "TOPLEFT"}}, {"id": 222, "text": "CONSTRUCTION", "bbox": {"l": 398.62399, "t": 320.42941, "r": 427.77472, "b": 324.34222000000005, "coord_origin": "TOPLEFT"}}, {"id": 223, "text": "BARSKA Model AY11236 is a fixed power compound microscope.", "bbox": {"l": 398.08594, "t": 326.46069000000006, "r": 456.02639999999997, "b": 328.63449, "coord_origin": "TOPLEFT"}}, {"id": 224, "text": "It is constructed with two optical paths at the same angle. It is ", "bbox": {"l": 398.08414, "t": 328.6076699999999, "r": 455.42238999999995, "b": 330.7814599999999, "coord_origin": "TOPLEFT"}}, {"id": 225, "text": "equipped with transmitted illumination. By using this instrument, ", "bbox": {"l": 398.08414, "t": 330.75461, "r": 457.39844, "b": 332.92841, "coord_origin": "TOPLEFT"}}, {"id": 226, "text": "the user can observe specimens at magnification from 40x to ", "bbox": {"l": 398.08414, "t": 332.90155, "r": 453.97745, "b": 335.07535000000007, "coord_origin": "TOPLEFT"}}, {"id": 227, "text": "1000x by selecting the desired objective lens. Coarse and fine ", "bbox": {"l": 398.08414, "t": 335.04852, "r": 454.70708999999994, "b": 337.22232, "coord_origin": "TOPLEFT"}}, {"id": 228, "text": "focus adjustments provide accuracy and image detail. The rotating ", "bbox": {"l": 398.08414, "t": 337.19547, "r": 458.90240000000006, "b": 339.36926, "coord_origin": "TOPLEFT"}}, {"id": 229, "text": "head allows the user to position the eyepieces for maximum ", "bbox": {"l": 398.08594, "t": 339.34241, "r": 453.0672, "b": 341.5162, "coord_origin": "TOPLEFT"}}, {"id": 230, "text": "viewing comfort and easy access to all adjustment knobs.", "bbox": {"l": 398.08594, "t": 341.48938, "r": 449.63113, "b": 343.66318, "coord_origin": "TOPLEFT"}}, {"id": 231, "text": "Model AY11236", "bbox": {"l": 422.10626, "t": 301.24191, "r": 434.62433000000004, "b": 302.98096, "coord_origin": "TOPLEFT"}}, {"id": 232, "text": "Fine ", "bbox": {"l": 442.01610999999997, "t": 283.08649, "r": 444.8817399999999, "b": 284.51996, "coord_origin": "TOPLEFT"}}, {"id": 233, "text": "Adjustment", "bbox": {"l": 442.01610999999997, "t": 284.2663, "r": 448.85001, "b": 285.69980000000004, "coord_origin": "TOPLEFT"}}, {"id": 234, "text": "Knob", "bbox": {"l": 442.01610999999997, "t": 285.44611, "r": 445.03033000000005, "b": 286.87961, "coord_origin": "TOPLEFT"}}, {"id": 235, "text": "Stage", "bbox": {"l": 408.00577, "t": 279.12579000000005, "r": 411.42212, "b": 280.5593, "coord_origin": "TOPLEFT"}}, {"id": 236, "text": "Condenser ", "bbox": {"l": 404.07172, "t": 280.9144299999999, "r": 410.77707, "b": 282.3479, "coord_origin": "TOPLEFT"}}, {"id": 237, "text": "Focusing", "bbox": {"l": 404.07172, "t": 282.09424, "r": 409.2157, "b": 283.52774, "coord_origin": "TOPLEFT"}}, {"id": 238, "text": "Knob", "bbox": {"l": 404.07172, "t": 283.27408, "r": 407.08594, "b": 284.7075500000001, "coord_origin": "TOPLEFT"}}, {"id": 239, "text": "Eyepiece", "bbox": {"l": 441.81281, "t": 262.32178, "r": 447.03702, "b": 263.75525000000005, "coord_origin": "TOPLEFT"}}, {"id": 240, "text": "Stand", "bbox": {"l": 437.34607, "t": 271.13025000000005, "r": 440.80496, "b": 272.56281, "coord_origin": "TOPLEFT"}}, {"id": 241, "text": "Lamp ", "bbox": {"l": 409.7164, "t": 284.40027, "r": 413.3768, "b": 285.83282, "coord_origin": "TOPLEFT"}}, {"id": 242, "text": "On/Off", "bbox": {"l": 409.7164, "t": 285.83163, "r": 413.68201, "b": 287.26416, "coord_origin": "TOPLEFT"}}, {"id": 243, "text": "Switch", "bbox": {"l": 409.7164, "t": 287.263, "r": 413.6337, "b": 288.69553, "coord_origin": "TOPLEFT"}}, {"id": 244, "text": "Lamp ", "bbox": {"l": 434.8712499999999, "t": 296.7153, "r": 438.53164999999996, "b": 298.14783, "coord_origin": "TOPLEFT"}}, {"id": 245, "text": "Power", "bbox": {"l": 439.52039, "t": 292.18307000000004, "r": 443.08768, "b": 293.61560000000003, "coord_origin": "TOPLEFT"}}, {"id": 246, "text": "Cord", "bbox": {"l": 439.52039, "t": 293.61444, "r": 442.29575, "b": 295.04697, "coord_origin": "TOPLEFT"}}, {"id": 247, "text": "Rotating Head", "bbox": {"l": 413.55829, "t": 264.66089, "r": 421.94913, "b": 266.09344, "coord_origin": "TOPLEFT"}}, {"id": 248, "text": "Stage Clip", "bbox": {"l": 441.84316999999993, "t": 286.90573, "r": 447.87585000000007, "b": 288.33826, "coord_origin": "TOPLEFT"}}, {"id": 249, "text": "Adjustment", "bbox": {"l": 441.84316999999993, "t": 288.3371, "r": 448.67252, "b": 289.76962000000003, "coord_origin": "TOPLEFT"}}, {"id": 250, "text": "Interpupillary Slide Adjustment", "bbox": {"l": 407.2403, "t": 259.86645999999996, "r": 425.79089, "b": 261.29895, "coord_origin": "TOPLEFT"}}, {"id": 251, "text": "Circling Minimums", "bbox": {"l": 449.10074000000003, "t": 378.66302, "r": 466.08835000000005, "b": 380.78412, "coord_origin": "TOPLEFT"}}, {"id": 252, "text": "7", "bbox": {"l": 449.10074000000003, "t": 383.2203999999999, "r": 449.64444, "b": 385.34148999999996, "coord_origin": "TOPLEFT"}}, {"id": 253, "text": "K H U H Z D V D F K D Q J H W R W K H 7 ( 5 3 6 F U L W H U L D L Q W K D W D \u1087H F W V F L U F O L Q J D U H D G L P H Q V L R Q E \\ H [ S D Q G L Q J W K H D U H D V W R S U R Y L G H ", "bbox": {"l": 450.18811, "t": 383.2203999999999, "r": 550.77124, "b": 385.34148999999996, "coord_origin": "TOPLEFT"}}, {"id": 254, "text": "improved obstacle protection. To indicate that the new criteria had been applied to a given procedure, a ", "bbox": {"l": 449.10074000000003, "t": 385.75732, "r": 536.14716, "b": 387.87842, "coord_origin": "TOPLEFT"}}, {"id": 255, "text": " is placed on ", "bbox": {"l": 538.31085, "t": 385.75732, "r": 549.49921, "b": 387.87842, "coord_origin": "TOPLEFT"}}, {"id": 256, "text": "the circling line of minimums. The new circling tables and explanatory information is located in the Legend of the TPP.", "bbox": {"l": 449.10074000000003, "t": 388.03601, "r": 547.58185, "b": 390.1571, "coord_origin": "TOPLEFT"}}, {"id": 257, "text": "7", "bbox": {"l": 449.10074000000003, "t": 393.2128000000001, "r": 449.6163, "b": 395.33386, "coord_origin": "TOPLEFT"}}, {"id": 258, "text": "K H D S S U R D F K H V X V L Q J V W D Q G D U G F L U F O L Q J D S S U R D F K D U H D V F D Q E H L G H Q W L \u00bf H G E \\ W K H D E V H Q F H R I W K H ", "bbox": {"l": 450.1319, "t": 393.2128000000001, "r": 529.53082, "b": 395.33386, "coord_origin": "TOPLEFT"}}, {"id": 259, "text": " on the circling line of ", "bbox": {"l": 532.05829, "t": 393.2128000000001, "r": 550.42261, "b": 395.33386, "coord_origin": "TOPLEFT"}}, {"id": 260, "text": "minima.", "bbox": {"l": 449.10074000000003, "t": 395.49149, "r": 455.74692, "b": 397.61255, "coord_origin": "TOPLEFT"}}, {"id": 261, "text": "$ S S O \\ 6 W D Q G D U G & L U F O L Q J $ S S U R D F K 0 D Q H X Y H U L Q J 5 D G L X V 7 D E O H ", "bbox": {"l": 449.95525999999995, "t": 415.59549, "r": 496.2829, "b": 417.50446, "coord_origin": "TOPLEFT"}}, {"id": 262, "text": "$ S S O \\ ( [ S D Q G H G & L U F O L Q J $ S S U R D F K 0 D Q H X Y H U L Q J $ L U V S D F H 5 D G L X V ", "bbox": {"l": 501.13077, "t": 409.25543, "r": 551.16101, "b": 411.1644, "coord_origin": "TOPLEFT"}}, {"id": 263, "text": "Table", "bbox": {"l": 501.13077, "t": 411.30624, "r": 505.2477999999999, "b": 413.21521, "coord_origin": "TOPLEFT"}}, {"id": 264, "text": "AIRPORT SKETCH", "bbox": {"l": 449.10074000000003, "t": 420.18802, "r": 469.35599, "b": 422.73331, "coord_origin": "TOPLEFT"}}, {"id": 265, "text": "The airport sketch is a depiction of the airport with emphasis on runway pattern and related ", "bbox": {"l": 449.10074000000003, "t": 425.08908, "r": 525.93616, "b": 427.21017, "coord_origin": "TOPLEFT"}}, {"id": 266, "text": "information, positioned in either the lower left or lower right corner of the chart to aid pi-", "bbox": {"l": 449.10074000000003, "t": 427.3678, "r": 522.0343, "b": 429.48886, "coord_origin": "TOPLEFT"}}, {"id": 267, "text": "lot recognition of the airport from the air and to provide some information to aid on ground ", "bbox": {"l": 449.10074000000003, "t": 429.64648, "r": 524.67151, "b": 431.76755, "coord_origin": "TOPLEFT"}}, {"id": 268, "text": "navigation of the airport. The runways are drawn to scale and oriented to true north. Runway ", "bbox": {"l": 449.10074000000003, "t": 431.92514000000006, "r": 527.172, "b": 434.04623, "coord_origin": "TOPLEFT"}}, {"id": 269, "text": "dimensions (length and width) are shown for all active runways.", "bbox": {"l": 449.10074000000003, "t": 434.20383, "r": 502.39545, "b": 436.32492, "coord_origin": "TOPLEFT"}}, {"id": 270, "text": "Runway(s) are depicted based on what type and construction of the runway.", "bbox": {"l": 449.10074000000003, "t": 438.7611999999999, "r": 512.92676, "b": 440.88228999999995, "coord_origin": "TOPLEFT"}}, {"id": 271, "text": "Hard Surface", "bbox": {"l": 449.95525999999995, "t": 444.07001, "r": 460.02307, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}, {"id": 272, "text": "Other Than ", "bbox": {"l": 464.89963, "t": 444.07001, "r": 473.98819, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}, {"id": 273, "text": "Hard Surface", "bbox": {"l": 464.89963, "t": 446.12085, "r": 474.96744, "b": 448.02979, "coord_origin": "TOPLEFT"}}, {"id": 274, "text": "Metal Surface", "bbox": {"l": 478.91357, "t": 444.07001, "r": 489.45648, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}, {"id": 275, "text": "Closed Runway", "bbox": {"l": 493.06420999999995, "t": 444.07001, "r": 505.03076, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}, {"id": 276, "text": "Under Construction", "bbox": {"l": 509.5809, "t": 444.07001, "r": 524.30237, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}, {"id": 277, "text": "Stopways, ", "bbox": {"l": 449.95525999999995, "t": 454.81207, "r": 458.31406, "b": 456.72104, "coord_origin": "TOPLEFT"}}, {"id": 278, "text": "Taxiways, Park-", "bbox": {"l": 449.95525999999995, "t": 456.86288, "r": 461.92083999999994, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}}, {"id": 279, "text": "ing Areas", "bbox": {"l": 449.95525999999995, "t": 458.91373, "r": 457.08014, "b": 460.82268999999997, "coord_origin": "TOPLEFT"}}, {"id": 280, "text": "Displaced ", "bbox": {"l": 464.89963, "t": 454.81207, "r": 472.87732, "b": 456.72104, "coord_origin": "TOPLEFT"}}, {"id": 281, "text": "Threshold", "bbox": {"l": 464.89963, "t": 456.86288, "r": 472.49792, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}}, {"id": 282, "text": "Closed", "bbox": {"l": 478.91357, "t": 454.81207, "r": 483.61584, "b": 456.72104, "coord_origin": "TOPLEFT"}}, {"id": 283, "text": "Pavement", "bbox": {"l": 478.91357, "t": 456.86288, "r": 486.60754000000003, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}}, {"id": 284, "text": "Water Runway", "bbox": {"l": 493.06420999999995, "t": 454.81207, "r": 504.20648, "b": 456.72104, "coord_origin": "TOPLEFT"}}, {"id": 285, "text": "Taxiways and aprons are shaded grey. Other runway features that may be shown are runway numbers, runway dimen-", "bbox": {"l": 449.10074000000003, "t": 469.32974, "r": 548.59674, "b": 471.45081, "coord_origin": "TOPLEFT"}}, {"id": 286, "text": "sions, runway slope, arresting gear, and displaced threshold.", "bbox": {"l": 449.10074000000003, "t": 471.60843, "r": 500.08181999999994, "b": 473.72949, "coord_origin": "TOPLEFT"}}, {"id": 287, "text": "2", "bbox": {"l": 449.10074000000003, "t": 476.16577, "r": 449.59933000000007, "b": 478.28687, "coord_origin": "TOPLEFT"}}, {"id": 288, "text": "W K H U L Q I R U P D W L R Q F R Q F H U Q L Q J O L J K W L Q J \u00bf Q D O D S S U R D F K E H D U L Q J V D L U S R U W E H D F R Q R E V W D F O H V F R Q W U R O W R Z H U 1 $ 9 $ , ' V K H O L ", "bbox": {"l": 450.09796, "t": 476.16577, "r": 547.82562, "b": 478.28687, "coord_origin": "TOPLEFT"}}, {"id": 289, "text": "-", "bbox": {"l": 547.82623, "t": 476.16577, "r": 548.45862, "b": 478.28687, "coord_origin": "TOPLEFT"}}, {"id": 290, "text": "pads may also be shown.", "bbox": {"l": 449.10074000000003, "t": 478.44446, "r": 470.52609000000007, "b": 480.56555, "coord_origin": "TOPLEFT"}}, {"id": 291, "text": "$ L U S R U W ( O H Y D W L R Q D Q G 7 R X F K G R Z Q = R Q H ( O H Y D W L R Q ", "bbox": {"l": 449.10074000000003, "t": 483.00183, "r": 493.37906000000004, "b": 485.12292, "coord_origin": "TOPLEFT"}}, {"id": 292, "text": "The airport elevation is shown enclosed within a box in the upper left corner of the sketch box and the touchdown zone ", "bbox": {"l": 449.10074000000003, "t": 487.5592, "r": 549.16168, "b": 489.6803, "coord_origin": "TOPLEFT"}}, {"id": 293, "text": "elevation (TDZE) is shown in the upper right corner of the sketch box. The airport elevation is the highest point of an ", "bbox": {"l": 449.10074000000003, "t": 489.83789, "r": 546.90881, "b": 491.95898, "coord_origin": "TOPLEFT"}}, {"id": 294, "text": "D L U S R U W \u00b6 V X V D E O H U X Q Z D \\ V P H D V X U H G L Q I H H W I U R P P H D Q V H D O H Y H O 7 K H 7 ' = ( L V W K H K L J K H V W H O H Y D W L R Q L Q W K H \u00bf U V W I H H W R I ", "bbox": {"l": 449.10074000000003, "t": 492.11658, "r": 551.80023, "b": 494.23767, "coord_origin": "TOPLEFT"}}, {"id": 295, "text": "the landing surface. Circling only approaches will not show a TDZE.", "bbox": {"l": 449.10074000000003, "t": 494.39526, "r": 505.85068000000007, "b": 496.51636, "coord_origin": "TOPLEFT"}}, {"id": 296, "text": "114", "bbox": {"l": 498.80661000000003, "t": 515.9437, "r": 502.08792, "b": 519.01764, "coord_origin": "TOPLEFT"}}, {"id": 297, "text": "FAA Chart Users\u2019 Guide - Terminal Procedures Publication (TPP) - Terms", "bbox": {"l": 444.56319999999994, "t": 422.84869, "r": 446.25998, "b": 471.87128, "coord_origin": "TOPLEFT"}}, {"id": 298, "text": "AGL 2013 Financial Calendar", "bbox": {"l": 329.40536, "t": 379.37537, "r": 355.13138, "b": 382.13336, "coord_origin": "TOPLEFT"}}, {"id": 299, "text": "22", "bbox": {"l": 329.40536, "t": 382.30273, "r": 330.96848, "b": 384.55927, "coord_origin": "TOPLEFT"}}, {"id": 300, "text": "August 2012 ", "bbox": {"l": 331.75003, "t": 382.30273, "r": 341.12875, "b": 384.55927, "coord_origin": "TOPLEFT"}}, {"id": 301, "text": "2012 full year result and fi nal dividend announced", "bbox": {"l": 350.4722, "t": 382.30273, "r": 384.81079, "b": 384.55927, "coord_origin": "TOPLEFT"}}, {"id": 302, "text": "30", "bbox": {"l": 329.40536, "t": 384.84552, "r": 330.97336, "b": 387.10205, "coord_origin": "TOPLEFT"}}, {"id": 303, "text": "August 2012 ", "bbox": {"l": 331.75735, "t": 384.84552, "r": 341.16534, "b": 387.10205, "coord_origin": "TOPLEFT"}}, {"id": 304, "text": "Ex-dividend trading commences", "bbox": {"l": 350.4722, "t": 384.84552, "r": 372.90613, "b": 387.10205, "coord_origin": "TOPLEFT"}}, {"id": 305, "text": "5", "bbox": {"l": 329.40536, "t": 387.38828, "r": 330.20337, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}}, {"id": 306, "text": "September 2012 ", "bbox": {"l": 331.00137, "t": 387.38828, "r": 342.9715, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}}, {"id": 307, "text": "Record date for 2012 fi nal dividend", "bbox": {"l": 350.4722, "t": 387.38828, "r": 374.88693, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}}, {"id": 308, "text": "27", "bbox": {"l": 329.40536, "t": 389.93103, "r": 331.0173, "b": 392.18762, "coord_origin": "TOPLEFT"}}, {"id": 309, "text": "September 2012 ", "bbox": {"l": 331.82327, "t": 389.93103, "r": 343.91284, "b": 392.18762, "coord_origin": "TOPLEFT"}}, {"id": 310, "text": "Final dividend payable", "bbox": {"l": 350.4722, "t": 389.93103, "r": 365.65988, "b": 392.18762, "coord_origin": "TOPLEFT"}}, {"id": 311, "text": "23", "bbox": {"l": 329.40536, "t": 392.47382, "r": 330.98804, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}}, {"id": 312, "text": "October 2012 ", "bbox": {"l": 331.77936, "t": 392.47382, "r": 342.06674, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}}, {"id": 313, "text": "Annual General Meeting", "bbox": {"l": 350.4722, "t": 392.47382, "r": 367.22156, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}}, {"id": 314, "text": "27", "bbox": {"l": 329.40536, "t": 395.0166, "r": 330.99741, "b": 397.27313, "coord_origin": "TOPLEFT"}}, {"id": 315, "text": "February 2013", "bbox": {"l": 331.7934, "t": 395.0166, "r": 342.1416, "b": 397.27313, "coord_origin": "TOPLEFT"}}, {"id": 316, "text": " 1", "bbox": {"l": 342.64841, "t": 395.18298, "r": 342.65811, "b": 396.49857000000003, "coord_origin": "TOPLEFT"}}, {"id": 317, "text": "2013 interim result and interim dividend announced", "bbox": {"l": 350.47177, "t": 395.01474, "r": 386.25897, "b": 397.2713, "coord_origin": "TOPLEFT"}}, {"id": 318, "text": "28", "bbox": {"l": 329.40491, "t": 397.55749999999995, "r": 331.02695, "b": 399.81406, "coord_origin": "TOPLEFT"}}, {"id": 319, "text": "August 2013", "bbox": {"l": 331.83795, "t": 397.55749999999995, "r": 340.75909, "b": 399.81406, "coord_origin": "TOPLEFT"}}, {"id": 320, "text": " 1", "bbox": {"l": 341.26437, "t": 397.7254, "r": 341.27408, "b": 399.04095, "coord_origin": "TOPLEFT"}}, {"id": 321, "text": "2013 full year results and fi nal dividend announced ", "bbox": {"l": 350.47144, "t": 397.55713, "r": 385.93265, "b": 399.81369, "coord_origin": "TOPLEFT"}}, {"id": 322, "text": "1", "bbox": {"l": 329.40536, "t": 400.46155, "r": 329.87708, "b": 401.96588, "coord_origin": "TOPLEFT"}}, {"id": 323, "text": "Indicative dates only, subject to change/Board confi rmation", "bbox": {"l": 330.34882, "t": 400.46155, "r": 358.65204, "b": 401.96588, "coord_origin": "TOPLEFT"}}, {"id": 324, "text": "AGL\u2019s Annual General Meeting will be held at the City Recital Hall, Angel Place, Sydney ", "bbox": {"l": 329.40536, "t": 404.34503, "r": 391.771, "b": 406.60156, "coord_origin": "TOPLEFT"}}, {"id": 325, "text": "commencing at 10.30am on Tuesday 23 October 2012.", "bbox": {"l": 329.40536, "t": 406.37857, "r": 369.65308, "b": 408.63513000000006, "coord_origin": "TOPLEFT"}}, {"id": 326, "text": "Ye s te rd ay", "bbox": {"l": 363.54486, "t": 460.53054999999995, "r": 379.25955, "b": 465.54507, "coord_origin": "TOPLEFT"}}, {"id": 327, "text": "Established in Sydney in 1837, and then ", "bbox": {"l": 363.54486, "t": 466.7157, "r": 391.38229, "b": 468.97223, "coord_origin": "TOPLEFT"}}, {"id": 328, "text": "known as The Australian Gas Light Company, ", "bbox": {"l": 363.54486, "t": 468.74924, "r": 395.01788, "b": 471.00577, "coord_origin": "TOPLEFT"}}, {"id": 329, "text": "the AGL business has an established history ", "bbox": {"l": 363.54486, "t": 470.78281, "r": 394.08322, "b": 473.03934, "coord_origin": "TOPLEFT"}}, {"id": 330, "text": "and reputation for serving the gas and ", "bbox": {"l": 363.54486, "t": 472.81635, "r": 390.60727, "b": 475.07288, "coord_origin": "TOPLEFT"}}, {"id": 331, "text": "electricity needs of Australian households. ", "bbox": {"l": 363.54486, "t": 474.84988, "r": 393.49612, "b": 477.10645, "coord_origin": "TOPLEFT"}}, {"id": 332, "text": "In 1841, when AGL supplied the gas to light ", "bbox": {"l": 363.54486, "t": 476.88345, "r": 394.11481, "b": 479.13998, "coord_origin": "TOPLEFT"}}, {"id": 333, "text": "the fi rst public street lamp, it was reported ", "bbox": {"l": 363.54486, "t": 478.91699, "r": 393.75891, "b": 481.17352, "coord_origin": "TOPLEFT"}}, {"id": 334, "text": "in the Sydney Gazette as a \u201cwonderful ", "bbox": {"l": 363.54486, "t": 480.95053, "r": 390.4975, "b": 483.20709, "coord_origin": "TOPLEFT"}}, {"id": 335, "text": "achievement of scientifi c knowledge, assisted ", "bbox": {"l": 363.54486, "t": 482.9841, "r": 395.70975, "b": 485.24063, "coord_origin": "TOPLEFT"}}, {"id": 336, "text": "by mechanical ingenuity.\u201d Within two years, ", "bbox": {"l": 363.54486, "t": 485.01764, "r": 394.27283, "b": 487.2742, "coord_origin": "TOPLEFT"}}, {"id": 337, "text": "165 gas lamps were lighting the City of Sydney.", "bbox": {"l": 363.54486, "t": 487.05121, "r": 396.65939, "b": 489.30774, "coord_origin": "TOPLEFT"}}, {"id": 338, "text": "Looking back on ", "bbox": {"l": 329.4054, "t": 419.93124, "r": 384.19696, "b": 431.09412, "coord_origin": "TOPLEFT"}}, {"id": 339, "text": "175 years of ", "bbox": {"l": 329.4054, "t": 430.10379, "r": 372.16626, "b": 441.26669, "coord_origin": "TOPLEFT"}}, {"id": 340, "text": "looking forward.", "bbox": {"l": 329.4054, "t": 440.27636999999993, "r": 385.3981, "b": 451.43924, "coord_origin": "TOPLEFT"}}, {"id": 341, "text": "AGL Energy Limited ABN 74 115 061 375", "bbox": {"l": 329.40536, "t": 372.16159, "r": 353.36179, "b": 373.91669, "coord_origin": "TOPLEFT"}}, {"id": 342, "text": "29", "bbox": {"l": 546.20587, "t": 360.90448, "r": 548.23407, "b": 362.82242, "coord_origin": "TOPLEFT"}}, {"id": 343, "text": "signs, signals and road markings", "bbox": {"l": 497.77728, "t": 251.43384000000003, "r": 542.8255, "b": 254.94385, "coord_origin": "TOPLEFT"}}, {"id": 344, "text": "3", "bbox": {"l": 490.30679, "t": 251.47478999999998, "r": 492.09982, "b": 254.98479999999995, "coord_origin": "TOPLEFT"}}, {"id": 345, "text": "In ", "bbox": {"l": 498.15335, "t": 263.88922, "r": 500.05637, "b": 265.92719, "coord_origin": "TOPLEFT"}}, {"id": 346, "text": "chapter 2, you and your vehicle", "bbox": {"l": 500.05637, "t": 263.85717999999997, "r": 524.37036, "b": 265.86310000000003, "coord_origin": "TOPLEFT"}}, {"id": 347, "text": ", you learned about ", "bbox": {"l": 524.37036, "t": 263.88922, "r": 539.89124, "b": 265.92719, "coord_origin": "TOPLEFT"}}, {"id": 348, "text": "some of the controls in your vehicle. This chapter is a handy ", "bbox": {"l": 498.15335, "t": 265.93224999999995, "r": 544.50403, "b": 267.97020999999995, "coord_origin": "TOPLEFT"}}, {"id": 349, "text": "reference section that gives examples of the most common ", "bbox": {"l": 498.15335, "t": 267.97533999999996, "r": 544.01343, "b": 270.01331000000005, "coord_origin": "TOPLEFT"}}, {"id": 350, "text": "signs, signals and road markings that keep traffi c organized ", "bbox": {"l": 498.15335, "t": 270.01831000000004, "r": 544.11987, "b": 272.05634, "coord_origin": "TOPLEFT"}}, {"id": 351, "text": "and flowing smoothly. ", "bbox": {"l": 498.15335, "t": 272.06140000000005, "r": 515.41071, "b": 274.09937, "coord_origin": "TOPLEFT"}}, {"id": 352, "text": "Signs", "bbox": {"l": 498.15335, "t": 277.34619, "r": 505.64642000000003, "b": 280.9357, "coord_origin": "TOPLEFT"}}, {"id": 353, "text": "There are three ways to read signs: by their shape, colour and ", "bbox": {"l": 498.15335, "t": 281.82187, "r": 543.92957, "b": 283.85983, "coord_origin": "TOPLEFT"}}, {"id": 354, "text": "the messages printed on them. Understanding these three ways ", "bbox": {"l": 498.15335, "t": 283.8649, "r": 545.67834, "b": 285.90289, "coord_origin": "TOPLEFT"}}, {"id": 355, "text": "of classifying signs will help you figure out the meaning of signs ", "bbox": {"l": 498.15335, "t": 285.90796, "r": 545.26471, "b": 287.94592, "coord_origin": "TOPLEFT"}}, {"id": 356, "text": "that are new to you. ", "bbox": {"l": 498.15335, "t": 287.95099, "r": 513.31335, "b": 289.98895, "coord_origin": "TOPLEFT"}}, {"id": 357, "text": "Stop", "bbox": {"l": 505.43439, "t": 303.07596, "r": 508.53033000000005, "b": 304.89639, "coord_origin": "TOPLEFT"}}, {"id": 358, "text": "Yield the right-of-way", "bbox": {"l": 527.45502, "t": 303.25354, "r": 541.44678, "b": 305.07397, "coord_origin": "TOPLEFT"}}, {"id": 359, "text": "Shows driving", "bbox": {"l": 501.79385, "t": 321.18973, "r": 510.41632, "b": 323.01016, "coord_origin": "TOPLEFT"}}, {"id": 360, "text": "regulations", "bbox": {"l": 501.79385, "t": 322.87731999999994, "r": 509.04268999999994, "b": 324.69775000000004, "coord_origin": "TOPLEFT"}}, {"id": 361, "text": "Explains lane use", "bbox": {"l": 518.66455, "t": 319.59146, "r": 529.80902, "b": 321.41190000000006, "coord_origin": "TOPLEFT"}}, {"id": 362, "text": "School zone signs ", "bbox": {"l": 534.87561, "t": 318.37616, "r": 546.95142, "b": 320.19659, "coord_origin": "TOPLEFT"}}, {"id": 363, "text": "are fl uorescent ", "bbox": {"l": 534.87561, "t": 320.0637500000001, "r": 545.05762, "b": 321.88419, "coord_origin": "TOPLEFT"}}, {"id": 364, "text": "yellow-green", "bbox": {"l": 534.87561, "t": 321.75134, "r": 543.32263, "b": 323.57178, "coord_origin": "TOPLEFT"}}, {"id": 365, "text": "Tells about motorist ", "bbox": {"l": 499.21862999999996, "t": 338.12772, "r": 512.62451, "b": 339.94815, "coord_origin": "TOPLEFT"}}, {"id": 366, "text": "services", "bbox": {"l": 499.21862999999996, "t": 339.81531000000007, "r": 504.39917, "b": 341.63574, "coord_origin": "TOPLEFT"}}, {"id": 367, "text": "Shows a permitted ", "bbox": {"l": 516.97748, "t": 338.06039, "r": 529.77484, "b": 339.88082999999995, "coord_origin": "TOPLEFT"}}, {"id": 368, "text": "action", "bbox": {"l": 516.97748, "t": 339.74799, "r": 520.96399, "b": 341.56842, "coord_origin": "TOPLEFT"}}, {"id": 369, "text": "Shows an action that ", "bbox": {"l": 534.55847, "t": 337.88281, "r": 548.58453, "b": 339.7032500000001, "coord_origin": "TOPLEFT"}}, {"id": 370, "text": "is not permitted", "bbox": {"l": 534.55847, "t": 339.57040000000006, "r": 545.08862, "b": 341.39084, "coord_origin": "TOPLEFT"}}, {"id": 371, "text": "Warns of hazards ", "bbox": {"l": 483.05853, "t": 356.17416, "r": 494.72577, "b": 357.9946, "coord_origin": "TOPLEFT"}}, {"id": 372, "text": "ahead", "bbox": {"l": 483.05853, "t": 357.86179, "r": 487.07525999999996, "b": 359.68222, "coord_origin": "TOPLEFT"}}, {"id": 373, "text": "Warns of", "bbox": {"l": 499.39645, "t": 356.26297000000005, "r": 504.69171, "b": 358.0834, "coord_origin": "TOPLEFT"}}, {"id": 374, "text": "construction zones", "bbox": {"l": 499.39645, "t": 357.95056, "r": 511.69116, "b": 359.77099999999996, "coord_origin": "TOPLEFT"}}, {"id": 375, "text": "Railway crossing", "bbox": {"l": 516.75891, "t": 356.26297000000005, "r": 527.42938, "b": 358.0834, "coord_origin": "TOPLEFT"}}, {"id": 376, "text": "Shows distance and ", "bbox": {"l": 534.5141, "t": 352.92981, "r": 547.89862, "b": 354.75024, "coord_origin": "TOPLEFT"}}, {"id": 377, "text": "direction", "bbox": {"l": 534.5141, "t": 354.6174, "r": 540.2818, "b": 356.43784, "coord_origin": "TOPLEFT"}}, {"id": 378, "text": "\u2022", "bbox": {"l": 478.37466, "t": 270.14075, "r": 479.14251999999993, "b": 272.17877, "coord_origin": "TOPLEFT"}}, {"id": 379, "text": "Signs", "bbox": {"l": 479.91036999999994, "t": 270.14075, "r": 483.74963, "b": 272.17877, "coord_origin": "TOPLEFT"}}, {"id": 380, "text": "- regulatory signs", "bbox": {"l": 479.97293, "t": 272.84717, "r": 492.31219, "b": 274.34888, "coord_origin": "TOPLEFT"}}, {"id": 381, "text": "- school, ", "bbox": {"l": 479.97293, "t": 275.14513999999997, "r": 486.72598000000005, "b": 276.64679, "coord_origin": "TOPLEFT"}}, {"id": 382, "text": "playground and ", "bbox": {"l": 481.21602999999993, "t": 276.77972, "r": 492.93286000000006, "b": 278.81768999999997, "coord_origin": "TOPLEFT"}}, {"id": 383, "text": "crosswalk signs", "bbox": {"l": 481.21602999999993, "t": 278.82275000000004, "r": 491.82938000000007, "b": 280.86075, "coord_origin": "TOPLEFT"}}, {"id": 384, "text": "- lane use signs", "bbox": {"l": 479.97293, "t": 281.52759, "r": 491.00775000000004, "b": 283.02924, "coord_origin": "TOPLEFT"}}, {"id": 385, "text": "- turn control signs", "bbox": {"l": 479.97293, "t": 283.82556, "r": 493.32748, "b": 285.3272099999999, "coord_origin": "TOPLEFT"}}, {"id": 386, "text": "- parking signs", "bbox": {"l": 479.97293, "t": 286.1235, "r": 490.4915199999999, "b": 287.62518, "coord_origin": "TOPLEFT"}}, {"id": 387, "text": "- reserved lane ", "bbox": {"l": 479.97293, "t": 288.42148, "r": 491.17004000000003, "b": 289.92316, "coord_origin": "TOPLEFT"}}, {"id": 388, "text": "signs", "bbox": {"l": 481.21602999999993, "t": 290.05605999999995, "r": 484.77405000000005, "b": 292.09406, "coord_origin": "TOPLEFT"}}, {"id": 389, "text": "- warning signs", "bbox": {"l": 479.97293, "t": 292.76169000000004, "r": 490.83398, "b": 294.26334, "coord_origin": "TOPLEFT"}}, {"id": 390, "text": "- object markers", "bbox": {"l": 479.97293, "t": 295.05963, "r": 491.62692, "b": 296.56131, "coord_origin": "TOPLEFT"}}, {"id": 391, "text": "- construction ", "bbox": {"l": 479.97293, "t": 297.3576, "r": 490.37341, "b": 298.8592499999999, "coord_origin": "TOPLEFT"}}, {"id": 392, "text": "signs", "bbox": {"l": 481.21602999999993, "t": 298.99219, "r": 484.77405000000005, "b": 301.03015, "coord_origin": "TOPLEFT"}}, {"id": 393, "text": "- information and ", "bbox": {"l": 479.97293, "t": 301.69780999999995, "r": 492.93912, "b": 303.19946, "coord_origin": "TOPLEFT"}}, {"id": 394, "text": "destination signs", "bbox": {"l": 481.21602999999993, "t": 303.3324, "r": 493.00525, "b": 305.37036, "coord_origin": "TOPLEFT"}}, {"id": 395, "text": "- railway signs", "bbox": {"l": 479.97293, "t": 306.0379899999999, "r": 489.99047999999993, "b": 307.53967, "coord_origin": "TOPLEFT"}}, {"id": 396, "text": "\u2022", "bbox": {"l": 478.375, "t": 308.24789, "r": 479.1032400000001, "b": 310.28586, "coord_origin": "TOPLEFT"}}, {"id": 397, "text": "Signals", "bbox": {"l": 479.83151, "t": 308.24789, "r": 484.92925999999994, "b": 310.28586, "coord_origin": "TOPLEFT"}}, {"id": 398, "text": "- lane control ", "bbox": {"l": 479.97293, "t": 310.95358, "r": 490.00091999999995, "b": 312.45526, "coord_origin": "TOPLEFT"}}, {"id": 399, "text": "signals", "bbox": {"l": 481.21602999999993, "t": 312.5881999999999, "r": 485.95331, "b": 314.62616, "coord_origin": "TOPLEFT"}}, {"id": 400, "text": "- traffic lights", "bbox": {"l": 479.97293, "t": 315.29379, "r": 489.29876999999993, "b": 316.79544, "coord_origin": "TOPLEFT"}}, {"id": 401, "text": "\u2022", "bbox": {"l": 478.375, "t": 317.50366, "r": 479.18129999999996, "b": 319.5416599999999, "coord_origin": "TOPLEFT"}}, {"id": 402, "text": "Road markings", "bbox": {"l": 479.98761, "t": 317.50366, "r": 490.46960000000007, "b": 319.5416599999999, "coord_origin": "TOPLEFT"}}, {"id": 403, "text": "- yellow lines", "bbox": {"l": 479.97293, "t": 320.20938, "r": 489.26166000000006, "b": 321.71103, "coord_origin": "TOPLEFT"}}, {"id": 404, "text": "- white lines", "bbox": {"l": 479.97293, "t": 322.50732, "r": 488.59189, "b": 324.009, "coord_origin": "TOPLEFT"}}, {"id": 405, "text": "- reserved lane ", "bbox": {"l": 479.97293, "t": 324.8053, "r": 491.17004000000003, "b": 326.30698, "coord_origin": "TOPLEFT"}}, {"id": 406, "text": "markings", "bbox": {"l": 481.21602999999993, "t": 326.43988, "r": 487.58978, "b": 328.47784, "coord_origin": "TOPLEFT"}}, {"id": 407, "text": "- other markings", "bbox": {"l": 479.97293, "t": 329.14551, "r": 491.75177, "b": 330.64716, "coord_origin": "TOPLEFT"}}, {"id": 408, "text": "in this chapter", "bbox": {"l": 478.15246999999994, "t": 265.07030999999995, "r": 493.75586, "b": 268.06872999999996, "coord_origin": "TOPLEFT"}}, {"id": 409, "text": "Figure 1: Four examples of complex page layouts across dif-", "bbox": {"l": 317.95499, "t": 540.08299, "r": 559.80579, "b": 548.55624, "coord_origin": "TOPLEFT"}}, {"id": 410, "text": "ferent document categories", "bbox": {"l": 317.95499, "t": 551.0419899999999, "r": 428.69907, "b": 559.51524, "coord_origin": "TOPLEFT"}}, {"id": 411, "text": "KEYWORDS", "bbox": {"l": 317.95499, "t": 592.46591, "r": 379.8205, "b": 602.7750100000001, "coord_origin": "TOPLEFT"}}, {"id": 412, "text": "PDF document conversion, layout segmentation, object-detection,", "bbox": {"l": 317.95499, "t": 607.66756, "r": 559.18597, "b": 616.04218, "coord_origin": "TOPLEFT"}}, {"id": 413, "text": "data set, Machine Learning", "bbox": {"l": 317.95499, "t": 618.62656, "r": 416.94403, "b": 627.00117, "coord_origin": "TOPLEFT"}}, {"id": 414, "text": "ACM Reference Format:", "bbox": {"l": 317.65997, "t": 640.05434, "r": 404.65366, "b": 647.58609, "coord_origin": "TOPLEFT"}}, {"id": 415, "text": "Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter", "bbox": {"l": 317.95499, "t": 650.11996, "r": 558.35266, "b": 657.56404, "coord_origin": "TOPLEFT"}}, {"id": 416, "text": "Staar. 2022. DocLayNet: A Large Human-Annotated Dataset for Document-", "bbox": {"l": 317.95499, "t": 660.08296, "r": 559.5495, "b": 667.52703, "coord_origin": "TOPLEFT"}}, {"id": 417, "text": "Layout Analysis. In", "bbox": {"l": 317.95499, "t": 670.04497, "r": 383.30807, "b": 677.48904, "coord_origin": "TOPLEFT"}}, {"id": 418, "text": "Proceedings of the 28th ACM SIGKDD Conference on", "bbox": {"l": 385.798, "t": 670.08482, "r": 558.20032, "b": 677.49701, "coord_origin": "TOPLEFT"}}, {"id": 419, "text": "Knowledge Discovery and Data Mining (KDD \u201922), August 14-18, 2022, Wash-", "bbox": {"l": 317.95499, "t": 680.04781, "r": 559.00092, "b": 687.46001, "coord_origin": "TOPLEFT"}}, {"id": 420, "text": "ington, DC, USA.", "bbox": {"l": 317.95499, "t": 690.01081, "r": 370.11481, "b": 697.423004, "coord_origin": "TOPLEFT"}}, {"id": 421, "text": "ACM, New York, NY, USA, 9 pages. https://doi.org/10.1145/", "bbox": {"l": 371.82999, "t": 689.97096, "r": 558.71655, "b": 697.415031, "coord_origin": "TOPLEFT"}}, {"id": 422, "text": "3534678.3539043", "bbox": {"l": 317.95499, "t": 699.932953, "r": 371.59375, "b": 707.377029, "coord_origin": "TOPLEFT"}}, {"id": 423, "text": "arXiv:2206.01062v1 [cs.CV] 2 Jun 2022", "bbox": {"l": 18.34021, "t": 218.35999000000004, "r": 36.339794, "b": 555.00003, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 12, "label": "section_header", "bbox": {"l": 107.29999999999998, "t": 83.69470000000013, "r": 505.06195, "b": 119.59558000000015, "coord_origin": "TOPLEFT"}, "confidence": 0.8416302800178528, "cells": [{"id": 0, "text": "DocLayNet: A Large Human-Annotated Dataset for", "bbox": {"l": 107.29999999999998, "t": 83.69470000000013, "r": 505.06195, "b": 99.67058999999995, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Document-Layout Analysis", "bbox": {"l": 200.117, "t": 103.6196900000001, "r": 411.88367, "b": 119.59558000000015, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "text", "bbox": {"l": 90.96701, "t": 133.67236000000003, "r": 193.73123, "b": 180.24030000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.8637151718139648, "cells": [{"id": 2, "text": "Birgit Pfitzmann", "bbox": {"l": 102.06001, "t": 133.67236000000003, "r": 182.63805, "b": 144.83856000000003, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "IBM Research", "bbox": {"l": 114.29401000000001, "t": 147.02423, "r": 170.40337, "b": 156.32928000000004, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Rueschlikon, Switzerland", "bbox": {"l": 90.96701, "t": 158.97924999999998, "r": 193.73123, "b": 168.28430000000003, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "bpf@zurich.ibm.com", "bbox": {"l": 100.02301, "t": 170.93524000000002, "r": 184.67522, "b": 180.24030000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 255.11602999999997, "t": 133.67236000000003, "r": 357.88025, "b": 180.24030000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.8612664937973022, "cells": [{"id": 6, "text": "Christoph Auer", "bbox": {"l": 268.62402, "t": 133.67236000000003, "r": 344.59933, "b": 144.83856000000003, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "IBM Research", "bbox": {"l": 278.44302, "t": 147.02423, "r": 334.55237, "b": 156.32928000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Rueschlikon, Switzerland", "bbox": {"l": 255.11602999999997, "t": 158.97924999999998, "r": 357.88025, "b": 168.28430000000003, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "cau@zurich.ibm.com", "bbox": {"l": 263.70404, "t": 170.93524000000002, "r": 349.29272, "b": 180.24030000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "text", "bbox": {"l": 419.26505, "t": 133.67236000000003, "r": 522.0293, "b": 180.24030000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.8760607242584229, "cells": [{"id": 10, "text": "Michele Dolfi", "bbox": {"l": 437.6930500000001, "t": 133.67236000000003, "r": 503.60208, "b": 144.83856000000003, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "IBM Research", "bbox": {"l": 442.59305000000006, "t": 147.02423, "r": 498.7023899999999, "b": 156.32928000000004, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Rueschlikon, Switzerland", "bbox": {"l": 419.26505, "t": 158.97924999999998, "r": 522.0293, "b": 168.28430000000003, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "dol@zurich.ibm.com", "bbox": {"l": 428.56104000000005, "t": 170.93524000000002, "r": 512.73505, "b": 180.24030000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 172.54303, "t": 192.05737, "r": 275.30725, "b": 238.62531, "coord_origin": "TOPLEFT"}, "confidence": 0.8319916129112244, "cells": [{"id": 14, "text": "Ahmed S. Nassar", "bbox": {"l": 182.26804, "t": 192.05737, "r": 265.39255, "b": 203.22357, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "IBM Research", "bbox": {"l": 195.87103, "t": 205.40923999999995, "r": 251.98038999999997, "b": 214.71429, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Rueschlikon, Switzerland", "bbox": {"l": 172.54303, "t": 217.36425999999994, "r": 275.30725, "b": 226.66931, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "ahn@zurich.ibm.com", "bbox": {"l": 180.52803, "t": 229.32025, "r": 267.3222, "b": 238.62531, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 336.69302, "t": 192.05737, "r": 439.45727999999997, "b": 238.62531, "coord_origin": "TOPLEFT"}, "confidence": 0.8027974367141724, "cells": [{"id": 18, "text": "Peter Staar", "bbox": {"l": 361.52802, "t": 192.05737, "r": 414.84821, "b": 203.22357, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "IBM Research", "bbox": {"l": 360.02002, "t": 205.40923999999995, "r": 416.12939, "b": 214.71429, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Rueschlikon, Switzerland", "bbox": {"l": 336.69302, "t": 217.36425999999994, "r": 439.45727999999997, "b": 226.66931, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "taa@zurich.ibm.com", "bbox": {"l": 346.20703, "t": 229.32025, "r": 429.94269, "b": 238.62531, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "section_header", "bbox": {"l": 53.798035, "t": 247.70288000000005, "r": 111.94354, "b": 258.01202, "coord_origin": "TOPLEFT"}, "confidence": 0.8876155018806458, "cells": [{"id": 22, "text": "ABSTRACT", "bbox": {"l": 53.798035, "t": 247.70288000000005, "r": 111.94354, "b": 258.01202, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 53.466999, "t": 262.90454, "r": 295.56018, "b": 534.29318, "coord_origin": "TOPLEFT"}, "confidence": 0.9823057055473328, "cells": [{"id": 23, "text": "Accurate document layout analysis is a key requirement for high-", "bbox": {"l": 53.484001, "t": 262.90454, "r": 295.55591, "b": 271.27917, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "quality PDF document conversion. With the recent availability of", "bbox": {"l": 53.79800000000001, "t": 273.86352999999997, "r": 294.04199, "b": 282.23816, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "public, large ground-truth datasets such as PubLayNet and DocBank,", "bbox": {"l": 53.79800000000001, "t": 284.82254, "r": 295.34586, "b": 293.19717, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "deep-learning models have proven to be very effective at layout", "bbox": {"l": 53.79800000000001, "t": 295.78152, "r": 294.04709, "b": 304.15616000000006, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "detection and segmentation. While these datasets are of adequate", "bbox": {"l": 53.79800000000001, "t": 306.74053999999995, "r": 294.04645, "b": 315.11517, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "size to train such models, they severely lack in layout variability", "bbox": {"l": 53.79800000000001, "t": 317.69952, "r": 294.27573, "b": 326.07416, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "since they are sourced from scientific article repositories such as", "bbox": {"l": 53.79800000000001, "t": 328.65854, "r": 294.04712, "b": 337.03317, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "PubMed and arXiv only. Consequently, the accuracy of the layout", "bbox": {"l": 53.79800000000001, "t": 339.61755, "r": 294.0437, "b": 347.99219, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "segmentation drops significantly when these models are applied", "bbox": {"l": 53.79800000000001, "t": 350.57654, "r": 294.04715, "b": 358.95117, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "on more challenging and diverse layouts. In this paper, we present", "bbox": {"l": 53.79800000000001, "t": 361.53455, "r": 294.04364, "b": 369.90918000000005, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "DocLayNet", "bbox": {"l": 53.79800000000001, "t": 372.53839, "r": 92.863388, "b": 380.87714000000005, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": ", a new, publicly available, document-layout annotation", "bbox": {"l": 92.863998, "t": 372.49353, "r": 294.04361, "b": 380.86816, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "dataset in COCO format. It contains 80863 manually annotated", "bbox": {"l": 53.79800000000001, "t": 383.45255, "r": 294.04718, "b": 391.82718, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "pages from diverse data sources to represent a wide variability in", "bbox": {"l": 53.79800000000001, "t": 394.41153, "r": 294.0437, "b": 402.78616, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "layouts. For each PDF page, the layout annotations provide labelled", "bbox": {"l": 53.79800000000001, "t": 405.37054, "r": 294.04535, "b": 413.74518, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "bounding-boxes with a choice of 11 distinct classes. DocLayNet", "bbox": {"l": 53.79800000000001, "t": 416.32953, "r": 294.04715, "b": 424.70416000000006, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "also provides a subset of double- and triple-annotated pages to", "bbox": {"l": 53.79800000000001, "t": 427.28853999999995, "r": 294.04712, "b": 435.66318, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "determine the inter-annotator agreement. In multiple experiments,", "bbox": {"l": 53.79800000000001, "t": 438.24753, "r": 295.03, "b": 446.62216, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "we provide baseline accuracy scores (in mAP) for a set of popular", "bbox": {"l": 53.466999, "t": 449.20654, "r": 294.21616, "b": 457.58118, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "object detection models. We also demonstrate that these models", "bbox": {"l": 53.79800000000001, "t": 460.16553, "r": 294.04712, "b": 468.54016, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "fall approximately 10% behind the inter-annotator agreement. Fur-", "bbox": {"l": 53.79800000000001, "t": 471.12354, "r": 295.56018, "b": 479.49817, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "thermore, we provide evidence that DocLayNet is of sufficient size.", "bbox": {"l": 53.79800000000001, "t": 482.08255, "r": 295.42783, "b": 490.45718, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Lastly, we compare models trained on PubLayNet, DocBank and", "bbox": {"l": 53.79800000000001, "t": 493.04153, "r": 294.04715, "b": 501.41617, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "DocLayNet, showing that layout predictions of the DocLayNet-", "bbox": {"l": 53.79800000000001, "t": 504.00055, "r": 295.55618, "b": 512.37518, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "trained models are more robust and thus the preferred choice for", "bbox": {"l": 53.79800000000001, "t": 514.95953, "r": 294.21643, "b": 523.33417, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "general-purpose document-layout analysis.", "bbox": {"l": 53.79800000000001, "t": 525.91855, "r": 212.05495, "b": 534.29318, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "section_header", "bbox": {"l": 53.79800000000001, "t": 550.99692, "r": 134.81989, "b": 561.30602, "coord_origin": "TOPLEFT"}, "confidence": 0.9149598479270935, "cells": [{"id": 49, "text": "CCS CONCEPTS", "bbox": {"l": 53.79800000000001, "t": 550.99692, "r": 134.81989, "b": 561.30602, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 53.797989, "t": 566.08299, "r": 297.85294, "b": 596.50114, "coord_origin": "TOPLEFT"}, "confidence": 0.8458839058876038, "cells": [{"id": 50, "text": "\u2022", "bbox": {"l": 53.79800000000001, "t": 566.19957, "r": 56.945206000000006, "b": 574.57419, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Information systems", "bbox": {"l": 58.440002, "t": 566.0830100000001, "r": 142.4462, "b": 574.5562600000001, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "\u2192", "bbox": {"l": 143.938, "t": 566.36096, "r": 153.15099, "b": 574.43073, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Document structure", "bbox": {"l": 154.646, "t": 566.0830100000001, "r": 235.46015999999997, "b": 574.5562600000001, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "; \u2022", "bbox": {"l": 235.45700000000002, "t": 566.19955, "r": 242.17419, "b": 574.57417, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "Applied com-", "bbox": {"l": 243.66899, "t": 566.08299, "r": 297.85294, "b": 574.55624, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "puting", "bbox": {"l": 53.797989, "t": 577.0419899999999, "r": 80.661324, "b": 585.51524, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "\u2192", "bbox": {"l": 83.565987, "t": 577.3199500000001, "r": 92.778961, "b": 585.38971, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Document analysis", "bbox": {"l": 95.68399, "t": 577.0419899999999, "r": 173.91583, "b": 585.51524, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "; \u2022", "bbox": {"l": 173.916, "t": 577.15855, "r": 182.1272, "b": 585.53317, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Computing methodologies", "bbox": {"l": 185.032, "t": 577.0419899999999, "r": 294.0455, "b": 585.51524, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "\u2192", "bbox": {"l": 53.79800399999999, "t": 588.27895, "r": 63.01097899999999, "b": 596.34871, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "Machine learning", "bbox": {"l": 65.253006, "t": 588.00099, "r": 136.80487, "b": 596.47424, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": ";", "bbox": {"l": 136.80501, "t": 588.1175499999999, "r": 138.92108, "b": 596.49217, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "Computer vision", "bbox": {"l": 141.162, "t": 588.00099, "r": 209.60254, "b": 596.47424, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": ";", "bbox": {"l": 209.60201, "t": 588.1175499999999, "r": 211.71808, "b": 596.49217, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "Object detection", "bbox": {"l": 213.96001, "t": 588.16238, "r": 270.45728, "b": 596.50114, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": ";", "bbox": {"l": 270.48001, "t": 588.1175499999999, "r": 272.59607, "b": 596.49217, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 53.79800000000001, "t": 634.39838, "r": 295.11798, "b": 672.79189, "coord_origin": "TOPLEFT"}, "confidence": 0.7107349038124084, "cells": [{"id": 68, "text": "Permission to make digital or hard copies of part or all of this work for personal or", "bbox": {"l": 53.79800000000001, "t": 634.39838, "r": 294.17697, "b": 640.9119000000001, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "classroom use is granted without fee provided that copies are not made or distributed", "bbox": {"l": 53.79800000000001, "t": 642.36838, "r": 294.04443, "b": 648.8819, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "for profit or commercial advantage and that copies bear this notice and the full citation", "bbox": {"l": 53.79800000000001, "t": 650.33838, "r": 294.04498, "b": 656.8519, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "on the first page. Copyrights for third-party components of this work must be honored.", "bbox": {"l": 53.79800000000001, "t": 658.3083799999999, "r": 295.11798, "b": 664.8219, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "For all other uses, contact the owner/author(s).", "bbox": {"l": 53.79800000000001, "t": 666.27837, "r": 187.72285, "b": 672.79189, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 53.79800000000001, "t": 675.08023, "r": 197.86275, "b": 681.56586, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 53.79800000000001, "t": 675.08023, "r": 197.86275, "b": 681.56586, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 53.317001, "t": 683.81236, "r": 186.74652, "b": 690.32589, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "\u00a9 2022 Copyright held by the owner/author(s).", "bbox": {"l": 53.317001, "t": 683.81236, "r": 186.74652, "b": 690.32589, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 53.554001, "t": 691.78336, "r": 157.03125, "b": 698.29689, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "ACM ISBN 978-1-4503-9385-0/22/08.", "bbox": {"l": 53.554001, "t": 691.78336, "r": 157.03125, "b": 698.29689, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 53.79800000000001, "t": 699.753365, "r": 166.94093, "b": 706.266891, "coord_origin": "TOPLEFT"}, "confidence": 0.509588360786438, "cells": [{"id": 76, "text": "https://doi.org/10.1145/3534678.3539043", "bbox": {"l": 53.79800000000001, "t": 699.753365, "r": 166.94093, "b": 706.266891, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "picture", "bbox": {"l": 323.408203125, "t": 250.34873962402344, "r": 553.2952270507812, "b": 525.8507080078125, "coord_origin": "TOPLEFT"}, "confidence": 0.5910208821296692, "cells": [{"id": 77, "text": "13", "bbox": {"l": 327.86951, "t": 351.78085, "r": 330.41248, "b": 353.95465, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "USING THE VERTICAL TUBE -", "bbox": {"l": 327.83005, "t": 331.57268999999997, "r": 351.16092, "b": 333.31171, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "MODELS AY11230/11234", "bbox": {"l": 327.83005, "t": 333.18292, "r": 348.30536, "b": 334.92194, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "1.", "bbox": {"l": 327.83005, "t": 336.40439, "r": 329.05914, "b": 337.92606, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "The vertical tube can be used for", "bbox": {"l": 329.67368, "t": 336.40439, "r": 349.95349, "b": 337.92606, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "instructional viewing or to photograph", "bbox": {"l": 329.11752, "t": 337.83588, "r": 353.57977, "b": 339.35751000000005, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": " the image with a digital camera or a", "bbox": {"l": 327.77121, "t": 339.26736, "r": 352.4306, "b": 340.789, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": " micro TV unit", "bbox": {"l": 328.15176, "t": 340.69882, "r": 337.91086, "b": 342.22049, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "2.", "bbox": {"l": 327.8313, "t": 342.19043000000005, "r": 329.09155, "b": 343.71207, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Loosen the retention screw, then rotate ", "bbox": {"l": 329.72168, "t": 342.19043000000005, "r": 354.9267, "b": 343.71207, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": " the adjustment ring to change the ", "bbox": {"l": 327.8313, "t": 343.62192, "r": 351.66949, "b": 345.14355, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": " length of the vertical tube.", "bbox": {"l": 328.21185, "t": 345.05338, "r": 346.33179, "b": 346.57504, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "3.", "bbox": {"l": 327.83005, "t": 346.84680000000003, "r": 329.12726, "b": 348.36847, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "Make sure that both the images in", "bbox": {"l": 329.77588, "t": 346.84680000000003, "r": 351.18005, "b": 348.36847, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "OPERATION ", "bbox": {"l": 327.25311, "t": 254.94812000000002, "r": 350.07861, "b": 258.86096, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "(", "bbox": {"l": 350.07861, "t": 254.76782000000003, "r": 351.82651, "b": 258.68066, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "cont.", "bbox": {"l": 351.82651, "t": 254.94812000000002, "r": 360.85242, "b": 258.86096, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": ")", "bbox": {"l": 360.85242, "t": 254.76782000000003, "r": 362.60028, "b": 258.68066, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "SELECTING OBJECTIVE ", "bbox": {"l": 326.88037, "t": 263.49492999999995, "r": 345.84351, "b": 265.23395000000005, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "MAGNIFICATION", "bbox": {"l": 326.88037, "t": 265.10515999999996, "r": 340.54153, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "1.", "bbox": {"l": 326.88037, "t": 266.71533, "r": 328.31903, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "There are two objectives. The lower", "bbox": {"l": 329.03836, "t": 266.71533, "r": 354.21472, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": " magnification objective has a greater", "bbox": {"l": 326.88037, "t": 268.32556, "r": 355.19193, "b": 270.06458, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": " depth of field and view.", "bbox": {"l": 326.88037, "t": 269.93579, "r": 345.80057, "b": 271.6748, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "2.", "bbox": {"l": 326.88037, "t": 271.54602, "r": 328.33862, "b": 273.28503, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "In order to observe the specimen", "bbox": {"l": 329.06775, "t": 271.54602, "r": 352.39969, "b": 273.28503, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": " easily use the lower magnification", "bbox": {"l": 326.88037, "t": 273.15619000000004, "r": 352.90042, "b": 274.89526, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": " objective first. Then, by rotating the", "bbox": {"l": 326.88037, "t": 274.76642000000004, "r": 354.59546, "b": 276.50543000000005, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": " case, the magnification can be", "bbox": {"l": 326.88037, "t": 276.37665000000004, "r": 350.81885, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": " changed.", "bbox": {"l": 326.88037, "t": 277.98688000000004, "r": 335.46707, "b": 279.72589000000005, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "CHANGING THE INTERPUPILLARY ", "bbox": {"l": 326.88037, "t": 281.20728, "r": 354.57755, "b": 282.94632, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "DISTANCE", "bbox": {"l": 326.88037, "t": 282.81750000000005, "r": 335.1752, "b": 284.55652, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "1.", "bbox": {"l": 326.88037, "t": 284.4277, "r": 328.34784, "b": 286.16675, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "The distance between the observer's", "bbox": {"l": 329.08157, "t": 284.4277, "r": 354.76245, "b": 286.16675, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": " pupils is the interpupillary distance.", "bbox": {"l": 326.88037, "t": 286.03793, "r": 354.6499, "b": 287.77695, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "2.", "bbox": {"l": 326.88037, "t": 287.64813, "r": 328.25125, "b": 289.38718, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "To adjust the interpupillary distance", "bbox": {"l": 328.93671, "t": 287.64813, "r": 354.29825, "b": 289.38718, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": " rotate the prism caps until both eyes", "bbox": {"l": 326.88181, "t": 289.25836, "r": 355.02075, "b": 290.99738, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": " coincide with the image in the", "bbox": {"l": 326.88181, "t": 290.86855999999995, "r": 350.82028, "b": 292.6076, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": " eyepiece. ", "bbox": {"l": 326.88181, "t": 292.47879, "r": 336.2067, "b": 294.2178, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "FOCUSING", "bbox": {"l": 326.88181, "t": 295.69922, "r": 335.3941, "b": 297.43823, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "1.", "bbox": {"l": 326.88181, "t": 297.30942, "r": 328.34314, "b": 299.04846, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "Remove the lens protective cover.", "bbox": {"l": 329.07379, "t": 297.30942, "r": 353.18555, "b": 299.04846, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "2.", "bbox": {"l": 326.88324, "t": 298.91965, "r": 328.35919, "b": 300.65866, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "Place the specimen on the working", "bbox": {"l": 329.0972, "t": 298.91965, "r": 353.45065, "b": 300.65866, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": " stage.", "bbox": {"l": 326.88324, "t": 300.52985, "r": 333.32825, "b": 302.26889000000006, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "3.", "bbox": {"l": 326.88324, "t": 302.14008000000007, "r": 328.31296, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "Focus the specimen with the left eye", "bbox": {"l": 329.02783, "t": 302.14008000000007, "r": 354.76303, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": " first while turning the focus knob until", "bbox": {"l": 326.88324, "t": 303.75027, "r": 355.96307, "b": 305.48932, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": " the image appears clear and sharp.", "bbox": {"l": 326.88324, "t": 305.3605, "r": 354.46594, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "4.", "bbox": {"l": 326.88324, "t": 306.9707, "r": 328.25488, "b": 308.70975, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "Rotate the right eyepiece ring until the", "bbox": {"l": 328.9407, "t": 306.9707, "r": 356.37335, "b": 308.70975, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": " images in each eyepiece coincide and", "bbox": {"l": 326.88324, "t": 308.58093, "r": 355.38867, "b": 310.31995, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": " are sharp and clear.", "bbox": {"l": 326.88324, "t": 310.19113, "r": 343.17249, "b": 311.93018, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "CHANGING THE BULB", "bbox": {"l": 326.88324, "t": 313.41156, "r": 344.13388, "b": 315.15059999999994, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "1.", "bbox": {"l": 326.88324, "t": 315.02178999999995, "r": 328.37418, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "Disconnect the power cord.", "bbox": {"l": 329.11963, "t": 315.02178999999995, "r": 348.50162, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "2.", "bbox": {"l": 326.88324, "t": 316.63199, "r": 328.34061, "b": 318.37103, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "When the bulb is cool, remove the", "bbox": {"l": 329.06931, "t": 316.63199, "r": 353.11588, "b": 318.37103, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": " oblique illuminator cap and remove", "bbox": {"l": 326.88464, "t": 318.2422199999999, "r": 353.79517, "b": 319.9812299999999, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": " the halogen bulb with cap.", "bbox": {"l": 326.88464, "t": 319.85242000000005, "r": 348.02094, "b": 321.59146, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "3.", "bbox": {"l": 326.88464, "t": 321.46265, "r": 328.37512, "b": 323.20166, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "Replace with a new halogen bulb.", "bbox": {"l": 329.12036, "t": 321.46265, "r": 352.96808, "b": 323.20166, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "4.", "bbox": {"l": 326.88608, "t": 323.07285, "r": 328.36884, "b": 324.81189, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "Open the window in the base plate and", "bbox": {"l": 329.1102, "t": 323.07285, "r": 356.5412, "b": 324.81189, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": " replace the halogen lamp or ", "bbox": {"l": 326.88608, "t": 324.68307000000004, "r": 350.13828, "b": 326.42209, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": " fluorescent lamp of transmitted", "bbox": {"l": 326.88608, "t": 326.29327, "r": 351.59677, "b": 328.03232, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": " illuminator.", "bbox": {"l": 326.88608, "t": 327.9035, "r": 336.89197, "b": 329.64252, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "FOCUSING", "bbox": {"l": 358.42023, "t": 263.49492999999995, "r": 366.93256, "b": 265.23395000000005, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "1.", "bbox": {"l": 358.42023, "t": 265.10515999999996, "r": 359.89841, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "Turn the focusing knob away or toward", "bbox": {"l": 360.63751, "t": 265.10515999999996, "r": 387.98407, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": " you until a clear image is viewed.", "bbox": {"l": 358.42023, "t": 266.71533, "r": 384.58948, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "2.", "bbox": {"l": 358.42166, "t": 268.32556, "r": 359.78549, "b": 270.06458, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "If the image is unclear, adjust the", "bbox": {"l": 360.46741, "t": 268.32556, "r": 384.33441, "b": 270.06458, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": " height of the elevator up or down,", "bbox": {"l": 358.4231, "t": 269.93579, "r": 384.61502, "b": 271.6748, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": " then turn the focusing knob again.", "bbox": {"l": 358.4231, "t": 271.54602, "r": 385.38922, "b": 273.28503, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "ZOOM MAGNIFICATION", "bbox": {"l": 358.4231, "t": 274.76642000000004, "r": 377.35046, "b": 276.50543000000005, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "1.", "bbox": {"l": 358.4231, "t": 276.37665000000004, "r": 359.89429, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "Turn the zoom magnification knob to", "bbox": {"l": 360.62988, "t": 276.37665000000004, "r": 386.37589, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": " the desired magnification and field of", "bbox": {"l": 358.4231, "t": 277.98688000000004, "r": 386.78732, "b": 279.72589000000005, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": " view.", "bbox": {"l": 358.4231, "t": 279.59704999999997, "r": 364.16855, "b": 281.33609, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "2.", "bbox": {"l": 358.4231, "t": 281.20728, "r": 359.86777, "b": 282.94632, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "In most situations, it is recommended", "bbox": {"l": 360.59012, "t": 281.20728, "r": 387.31656, "b": 282.94632, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": " that you focus at the lowest ", "bbox": {"l": 358.4231, "t": 282.81750000000005, "r": 381.56656, "b": 284.55652, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": " magnification, then move to a higher", "bbox": {"l": 358.4231, "t": 284.4277, "r": 386.63403, "b": 286.16675, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": " magnification and re-focus as ", "bbox": {"l": 358.42453, "t": 286.03793, "r": 382.77115, "b": 287.77695, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": " necessary.", "bbox": {"l": 358.42453, "t": 287.64813, "r": 367.98694, "b": 289.38718, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "3.", "bbox": {"l": 358.42453, "t": 289.25836, "r": 359.80386, "b": 290.99738, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "If the image is not clear to both eyes", "bbox": {"l": 360.49353, "t": 289.25836, "r": 386.70093, "b": 290.99738, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": " at the same time, the diopter ring may", "bbox": {"l": 358.42453, "t": 290.86855999999995, "r": 388.03534, "b": 292.6076, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": " need adjustment.", "bbox": {"l": 358.42453, "t": 292.47879, "r": 373.13724, "b": 294.2178, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "DIOPTER RING ADJUSTMENT", "bbox": {"l": 358.42453, "t": 295.69922, "r": 381.74539, "b": 297.43823, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "1.", "bbox": {"l": 358.42453, "t": 297.30942, "r": 359.83682, "b": 299.04846, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "To adjust the eyepiece for viewing with", "bbox": {"l": 360.54297, "t": 297.30942, "r": 388.08289, "b": 299.04846, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": " or without eyeglasses and for ", "bbox": {"l": 358.42453, "t": 298.91965, "r": 382.73251, "b": 300.65866, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": " differences in acuity between the right", "bbox": {"l": 358.42453, "t": 300.52985, "r": 387.72266, "b": 302.26889000000006, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": " and left eyes, follow the following", "bbox": {"l": 358.42453, "t": 302.14008000000007, "r": 384.1991, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": " steps:", "bbox": {"l": 358.42453, "t": 303.75027, "r": 364.88672, "b": 305.48932, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "a.", "bbox": {"l": 358.42453, "t": 305.3605, "r": 359.95078, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "Observe an image through the left", "bbox": {"l": 361.47699, "t": 305.3605, "r": 386.65988, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": " eyepiece and bring a specific point", "bbox": {"l": 358.42453, "t": 306.9707, "r": 386.7634, "b": 308.70975, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": " into focus using the focus knob.", "bbox": {"l": 358.42453, "t": 308.58093, "r": 385.41354, "b": 310.31995, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "b.", "bbox": {"l": 358.42453, "t": 310.19113, "r": 359.93304, "b": 311.93018, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "By turning the diopter ring ", "bbox": {"l": 361.44156, "t": 310.19113, "r": 382.56085, "b": 311.93018, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": " adjustment for the left eyepiece,", "bbox": {"l": 358.42596, "t": 311.80136, "r": 385.4559, "b": 313.54037, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": " bring the same point into sharp", "bbox": {"l": 358.42596, "t": 313.41156, "r": 384.56122, "b": 315.15059999999994, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": " focus.", "bbox": {"l": 358.42596, "t": 315.02178999999995, "r": 366.74371, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": " c.Then bring the same point into", "bbox": {"l": 358.42596, "t": 316.63199, "r": 383.93884, "b": 318.37103, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": " focus through the right eyepiece", "bbox": {"l": 358.42596, "t": 318.2422199999999, "r": 385.69241, "b": 319.9812299999999, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": " by turning the right diopter ring.", "bbox": {"l": 358.42596, "t": 319.85242000000005, "r": 385.94861, "b": 321.59146, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": " d.With more than one viewer, each", "bbox": {"l": 358.42596, "t": 321.46265, "r": 385.54236, "b": 323.20166, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": " viewer should note their own", "bbox": {"l": 358.42596, "t": 323.07285, "r": 382.98718, "b": 324.81189, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": " diopter ring position for the left", "bbox": {"l": 358.42596, "t": 324.68307000000004, "r": 385.06448, "b": 326.42209, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": " and right eyepieces, then before", "bbox": {"l": 358.42596, "t": 326.29327, "r": 385.20682, "b": 328.03232, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": " viewing set the diopter ring", "bbox": {"l": 358.42596, "t": 327.9035, "r": 382.21964, "b": 329.64252, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": " adjustments to that setting.", "bbox": {"l": 358.42596, "t": 329.5137, "r": 382.63382, "b": 331.25275, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "CHANGING THE BULB", "bbox": {"l": 358.42596, "t": 332.73412999999994, "r": 375.67661, "b": 334.47317999999996, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "1.", "bbox": {"l": 358.42596, "t": 334.34436, "r": 359.90311, "b": 336.08337, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "Disconnect the power cord from the", "bbox": {"l": 360.64169, "t": 334.34436, "r": 385.75333, "b": 336.08337, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": " electrical outlet.", "bbox": {"l": 358.42596, "t": 335.95456, "r": 372.01416, "b": 337.6936, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "2.", "bbox": {"l": 358.42596, "t": 337.56479, "r": 359.88327, "b": 339.3038, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "When the bulb is cool, remove the", "bbox": {"l": 360.61191, "t": 337.56479, "r": 384.65726, "b": 339.3038, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": " oblique illuminator cap and remove", "bbox": {"l": 358.42596, "t": 339.17499, "r": 385.33649, "b": 340.9140300000001, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": " the halogen bulb with cap.", "bbox": {"l": 358.42596, "t": 340.78522, "r": 379.57224, "b": 342.52423, "coord_origin": "TOPLEFT"}}, {"id": 201, "text": "3.", "bbox": {"l": 358.4274, "t": 342.39542, "r": 359.91788, "b": 344.13446000000005, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": "Replace with a new halogen bulb.", "bbox": {"l": 360.66312, "t": 342.39542, "r": 384.5108, "b": 344.13446000000005, "coord_origin": "TOPLEFT"}}, {"id": 203, "text": "4.", "bbox": {"l": 358.42883, "t": 344.00565000000006, "r": 359.92792, "b": 345.74466, "coord_origin": "TOPLEFT"}}, {"id": 204, "text": "Open the window in the base plate", "bbox": {"l": 360.67746, "t": 344.00565000000006, "r": 385.41235, "b": 345.74466, "coord_origin": "TOPLEFT"}}, {"id": 205, "text": " and replace the halogen lamp or", "bbox": {"l": 358.42883, "t": 345.61584, "r": 383.2782, "b": 347.35489, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": " fluorescent lamp of transmitted", "bbox": {"l": 358.42883, "t": 347.22607, "r": 383.13953, "b": 348.96509, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": " illuminator.", "bbox": {"l": 358.42883, "t": 348.83627, "r": 368.43472, "b": 350.57532, "coord_origin": "TOPLEFT"}}, {"id": 208, "text": "Model AY11230", "bbox": {"l": 326.59567, "t": 261.14185, "r": 339.11377, "b": 262.88091999999995, "coord_origin": "TOPLEFT"}}, {"id": 209, "text": "Model AY11234", "bbox": {"l": 358.48605, "t": 261.14185, "r": 371.00415, "b": 262.88091999999995, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": "14", "bbox": {"l": 455.43533, "t": 351.77038999999996, "r": 457.97827000000007, "b": 353.94415, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "Objectives", "bbox": {"l": 408.24518, "t": 275.52673000000004, "r": 414.4234, "b": 276.96020999999996, "coord_origin": "TOPLEFT"}}, {"id": 212, "text": "Revolving Turret", "bbox": {"l": 409.39554, "t": 268.98235999999997, "r": 419.06677, "b": 270.41583, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "Coarse ", "bbox": {"l": 441.3895, "t": 279.12627999999995, "r": 445.87192, "b": 280.55975, "coord_origin": "TOPLEFT"}}, {"id": 214, "text": "Adjustment", "bbox": {"l": 441.3895, "t": 280.30609, "r": 448.22338999999994, "b": 281.7395900000001, "coord_origin": "TOPLEFT"}}, {"id": 215, "text": "Knob", "bbox": {"l": 441.3895, "t": 281.48593, "r": 444.40371999999996, "b": 282.91939999999994, "coord_origin": "TOPLEFT"}}, {"id": 216, "text": "MODEL AY11236", "bbox": {"l": 398.79288, "t": 254.94646999999998, "r": 428.91568, "b": 258.85931000000005, "coord_origin": "TOPLEFT"}}, {"id": 217, "text": "MICROSCOPE USAGE", "bbox": {"l": 398.32535, "t": 305.04291, "r": 435.93542, "b": 308.95572000000004, "coord_origin": "TOPLEFT"}}, {"id": 218, "text": "BARSKA Model AY11236 is a powerful fixed power compound ", "bbox": {"l": 398.08594, "t": 310.35892, "r": 453.72171, "b": 312.53271, "coord_origin": "TOPLEFT"}}, {"id": 219, "text": "microscope designed for biological studies such as specimen ", "bbox": {"l": 398.08594, "t": 312.50586, "r": 453.09939999999995, "b": 314.67966, "coord_origin": "TOPLEFT"}}, {"id": 220, "text": "examination. It can also be used for examining bacteria and", "bbox": {"l": 398.08594, "t": 314.6528, "r": 456.65246999999994, "b": 316.8266, "coord_origin": "TOPLEFT"}}, {"id": 221, "text": "for general clinical and medical studies and other scientific uses. ", "bbox": {"l": 398.08594, "t": 316.79977, "r": 456.73859000000004, "b": 318.97354, "coord_origin": "TOPLEFT"}}, {"id": 222, "text": "CONSTRUCTION", "bbox": {"l": 398.62399, "t": 320.42941, "r": 427.77472, "b": 324.34222000000005, "coord_origin": "TOPLEFT"}}, {"id": 223, "text": "BARSKA Model AY11236 is a fixed power compound microscope.", "bbox": {"l": 398.08594, "t": 326.46069000000006, "r": 456.02639999999997, "b": 328.63449, "coord_origin": "TOPLEFT"}}, {"id": 224, "text": "It is constructed with two optical paths at the same angle. It is ", "bbox": {"l": 398.08414, "t": 328.6076699999999, "r": 455.42238999999995, "b": 330.7814599999999, "coord_origin": "TOPLEFT"}}, {"id": 225, "text": "equipped with transmitted illumination. By using this instrument, ", "bbox": {"l": 398.08414, "t": 330.75461, "r": 457.39844, "b": 332.92841, "coord_origin": "TOPLEFT"}}, {"id": 226, "text": "the user can observe specimens at magnification from 40x to ", "bbox": {"l": 398.08414, "t": 332.90155, "r": 453.97745, "b": 335.07535000000007, "coord_origin": "TOPLEFT"}}, {"id": 227, "text": "1000x by selecting the desired objective lens. Coarse and fine ", "bbox": {"l": 398.08414, "t": 335.04852, "r": 454.70708999999994, "b": 337.22232, "coord_origin": "TOPLEFT"}}, {"id": 228, "text": "focus adjustments provide accuracy and image detail. The rotating ", "bbox": {"l": 398.08414, "t": 337.19547, "r": 458.90240000000006, "b": 339.36926, "coord_origin": "TOPLEFT"}}, {"id": 229, "text": "head allows the user to position the eyepieces for maximum ", "bbox": {"l": 398.08594, "t": 339.34241, "r": 453.0672, "b": 341.5162, "coord_origin": "TOPLEFT"}}, {"id": 230, "text": "viewing comfort and easy access to all adjustment knobs.", "bbox": {"l": 398.08594, "t": 341.48938, "r": 449.63113, "b": 343.66318, "coord_origin": "TOPLEFT"}}, {"id": 231, "text": "Model AY11236", "bbox": {"l": 422.10626, "t": 301.24191, "r": 434.62433000000004, "b": 302.98096, "coord_origin": "TOPLEFT"}}, {"id": 232, "text": "Fine ", "bbox": {"l": 442.01610999999997, "t": 283.08649, "r": 444.8817399999999, "b": 284.51996, "coord_origin": "TOPLEFT"}}, {"id": 233, "text": "Adjustment", "bbox": {"l": 442.01610999999997, "t": 284.2663, "r": 448.85001, "b": 285.69980000000004, "coord_origin": "TOPLEFT"}}, {"id": 234, "text": "Knob", "bbox": {"l": 442.01610999999997, "t": 285.44611, "r": 445.03033000000005, "b": 286.87961, "coord_origin": "TOPLEFT"}}, {"id": 235, "text": "Stage", "bbox": {"l": 408.00577, "t": 279.12579000000005, "r": 411.42212, "b": 280.5593, "coord_origin": "TOPLEFT"}}, {"id": 236, "text": "Condenser ", "bbox": {"l": 404.07172, "t": 280.9144299999999, "r": 410.77707, "b": 282.3479, "coord_origin": "TOPLEFT"}}, {"id": 237, "text": "Focusing", "bbox": {"l": 404.07172, "t": 282.09424, "r": 409.2157, "b": 283.52774, "coord_origin": "TOPLEFT"}}, {"id": 238, "text": "Knob", "bbox": {"l": 404.07172, "t": 283.27408, "r": 407.08594, "b": 284.7075500000001, "coord_origin": "TOPLEFT"}}, {"id": 239, "text": "Eyepiece", "bbox": {"l": 441.81281, "t": 262.32178, "r": 447.03702, "b": 263.75525000000005, "coord_origin": "TOPLEFT"}}, {"id": 240, "text": "Stand", "bbox": {"l": 437.34607, "t": 271.13025000000005, "r": 440.80496, "b": 272.56281, "coord_origin": "TOPLEFT"}}, {"id": 241, "text": "Lamp ", "bbox": {"l": 409.7164, "t": 284.40027, "r": 413.3768, "b": 285.83282, "coord_origin": "TOPLEFT"}}, {"id": 242, "text": "On/Off", "bbox": {"l": 409.7164, "t": 285.83163, "r": 413.68201, "b": 287.26416, "coord_origin": "TOPLEFT"}}, {"id": 243, "text": "Switch", "bbox": {"l": 409.7164, "t": 287.263, "r": 413.6337, "b": 288.69553, "coord_origin": "TOPLEFT"}}, {"id": 244, "text": "Lamp ", "bbox": {"l": 434.8712499999999, "t": 296.7153, "r": 438.53164999999996, "b": 298.14783, "coord_origin": "TOPLEFT"}}, {"id": 245, "text": "Power", "bbox": {"l": 439.52039, "t": 292.18307000000004, "r": 443.08768, "b": 293.61560000000003, "coord_origin": "TOPLEFT"}}, {"id": 246, "text": "Cord", "bbox": {"l": 439.52039, "t": 293.61444, "r": 442.29575, "b": 295.04697, "coord_origin": "TOPLEFT"}}, {"id": 247, "text": "Rotating Head", "bbox": {"l": 413.55829, "t": 264.66089, "r": 421.94913, "b": 266.09344, "coord_origin": "TOPLEFT"}}, {"id": 248, "text": "Stage Clip", "bbox": {"l": 441.84316999999993, "t": 286.90573, "r": 447.87585000000007, "b": 288.33826, "coord_origin": "TOPLEFT"}}, {"id": 249, "text": "Adjustment", "bbox": {"l": 441.84316999999993, "t": 288.3371, "r": 448.67252, "b": 289.76962000000003, "coord_origin": "TOPLEFT"}}, {"id": 250, "text": "Interpupillary Slide Adjustment", "bbox": {"l": 407.2403, "t": 259.86645999999996, "r": 425.79089, "b": 261.29895, "coord_origin": "TOPLEFT"}}, {"id": 251, "text": "Circling Minimums", "bbox": {"l": 449.10074000000003, "t": 378.66302, "r": 466.08835000000005, "b": 380.78412, "coord_origin": "TOPLEFT"}}, {"id": 252, "text": "7", "bbox": {"l": 449.10074000000003, "t": 383.2203999999999, "r": 449.64444, "b": 385.34148999999996, "coord_origin": "TOPLEFT"}}, {"id": 253, "text": "K H U H Z D V D F K D Q J H W R W K H 7 ( 5 3 6 F U L W H U L D L Q W K D W D \u1087H F W V F L U F O L Q J D U H D G L P H Q V L R Q E \\ H [ S D Q G L Q J W K H D U H D V W R S U R Y L G H ", "bbox": {"l": 450.18811, "t": 383.2203999999999, "r": 550.77124, "b": 385.34148999999996, "coord_origin": "TOPLEFT"}}, {"id": 254, "text": "improved obstacle protection. To indicate that the new criteria had been applied to a given procedure, a ", "bbox": {"l": 449.10074000000003, "t": 385.75732, "r": 536.14716, "b": 387.87842, "coord_origin": "TOPLEFT"}}, {"id": 255, "text": " is placed on ", "bbox": {"l": 538.31085, "t": 385.75732, "r": 549.49921, "b": 387.87842, "coord_origin": "TOPLEFT"}}, {"id": 256, "text": "the circling line of minimums. The new circling tables and explanatory information is located in the Legend of the TPP.", "bbox": {"l": 449.10074000000003, "t": 388.03601, "r": 547.58185, "b": 390.1571, "coord_origin": "TOPLEFT"}}, {"id": 257, "text": "7", "bbox": {"l": 449.10074000000003, "t": 393.2128000000001, "r": 449.6163, "b": 395.33386, "coord_origin": "TOPLEFT"}}, {"id": 258, "text": "K H D S S U R D F K H V X V L Q J V W D Q G D U G F L U F O L Q J D S S U R D F K D U H D V F D Q E H L G H Q W L \u00bf H G E \\ W K H D E V H Q F H R I W K H ", "bbox": {"l": 450.1319, "t": 393.2128000000001, "r": 529.53082, "b": 395.33386, "coord_origin": "TOPLEFT"}}, {"id": 259, "text": " on the circling line of ", "bbox": {"l": 532.05829, "t": 393.2128000000001, "r": 550.42261, "b": 395.33386, "coord_origin": "TOPLEFT"}}, {"id": 260, "text": "minima.", "bbox": {"l": 449.10074000000003, "t": 395.49149, "r": 455.74692, "b": 397.61255, "coord_origin": "TOPLEFT"}}, {"id": 261, "text": "$ S S O \\ 6 W D Q G D U G & L U F O L Q J $ S S U R D F K 0 D Q H X Y H U L Q J 5 D G L X V 7 D E O H ", "bbox": {"l": 449.95525999999995, "t": 415.59549, "r": 496.2829, "b": 417.50446, "coord_origin": "TOPLEFT"}}, {"id": 262, "text": "$ S S O \\ ( [ S D Q G H G & L U F O L Q J $ S S U R D F K 0 D Q H X Y H U L Q J $ L U V S D F H 5 D G L X V ", "bbox": {"l": 501.13077, "t": 409.25543, "r": 551.16101, "b": 411.1644, "coord_origin": "TOPLEFT"}}, {"id": 263, "text": "Table", "bbox": {"l": 501.13077, "t": 411.30624, "r": 505.2477999999999, "b": 413.21521, "coord_origin": "TOPLEFT"}}, {"id": 264, "text": "AIRPORT SKETCH", "bbox": {"l": 449.10074000000003, "t": 420.18802, "r": 469.35599, "b": 422.73331, "coord_origin": "TOPLEFT"}}, {"id": 265, "text": "The airport sketch is a depiction of the airport with emphasis on runway pattern and related ", "bbox": {"l": 449.10074000000003, "t": 425.08908, "r": 525.93616, "b": 427.21017, "coord_origin": "TOPLEFT"}}, {"id": 266, "text": "information, positioned in either the lower left or lower right corner of the chart to aid pi-", "bbox": {"l": 449.10074000000003, "t": 427.3678, "r": 522.0343, "b": 429.48886, "coord_origin": "TOPLEFT"}}, {"id": 267, "text": "lot recognition of the airport from the air and to provide some information to aid on ground ", "bbox": {"l": 449.10074000000003, "t": 429.64648, "r": 524.67151, "b": 431.76755, "coord_origin": "TOPLEFT"}}, {"id": 268, "text": "navigation of the airport. The runways are drawn to scale and oriented to true north. Runway ", "bbox": {"l": 449.10074000000003, "t": 431.92514000000006, "r": 527.172, "b": 434.04623, "coord_origin": "TOPLEFT"}}, {"id": 269, "text": "dimensions (length and width) are shown for all active runways.", "bbox": {"l": 449.10074000000003, "t": 434.20383, "r": 502.39545, "b": 436.32492, "coord_origin": "TOPLEFT"}}, {"id": 270, "text": "Runway(s) are depicted based on what type and construction of the runway.", "bbox": {"l": 449.10074000000003, "t": 438.7611999999999, "r": 512.92676, "b": 440.88228999999995, "coord_origin": "TOPLEFT"}}, {"id": 271, "text": "Hard Surface", "bbox": {"l": 449.95525999999995, "t": 444.07001, "r": 460.02307, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}, {"id": 272, "text": "Other Than ", "bbox": {"l": 464.89963, "t": 444.07001, "r": 473.98819, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}, {"id": 273, "text": "Hard Surface", "bbox": {"l": 464.89963, "t": 446.12085, "r": 474.96744, "b": 448.02979, "coord_origin": "TOPLEFT"}}, {"id": 274, "text": "Metal Surface", "bbox": {"l": 478.91357, "t": 444.07001, "r": 489.45648, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}, {"id": 275, "text": "Closed Runway", "bbox": {"l": 493.06420999999995, "t": 444.07001, "r": 505.03076, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}, {"id": 276, "text": "Under Construction", "bbox": {"l": 509.5809, "t": 444.07001, "r": 524.30237, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}, {"id": 277, "text": "Stopways, ", "bbox": {"l": 449.95525999999995, "t": 454.81207, "r": 458.31406, "b": 456.72104, "coord_origin": "TOPLEFT"}}, {"id": 278, "text": "Taxiways, Park-", "bbox": {"l": 449.95525999999995, "t": 456.86288, "r": 461.92083999999994, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}}, {"id": 279, "text": "ing Areas", "bbox": {"l": 449.95525999999995, "t": 458.91373, "r": 457.08014, "b": 460.82268999999997, "coord_origin": "TOPLEFT"}}, {"id": 280, "text": "Displaced ", "bbox": {"l": 464.89963, "t": 454.81207, "r": 472.87732, "b": 456.72104, "coord_origin": "TOPLEFT"}}, {"id": 281, "text": "Threshold", "bbox": {"l": 464.89963, "t": 456.86288, "r": 472.49792, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}}, {"id": 282, "text": "Closed", "bbox": {"l": 478.91357, "t": 454.81207, "r": 483.61584, "b": 456.72104, "coord_origin": "TOPLEFT"}}, {"id": 283, "text": "Pavement", "bbox": {"l": 478.91357, "t": 456.86288, "r": 486.60754000000003, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}}, {"id": 284, "text": "Water Runway", "bbox": {"l": 493.06420999999995, "t": 454.81207, "r": 504.20648, "b": 456.72104, "coord_origin": "TOPLEFT"}}, {"id": 285, "text": "Taxiways and aprons are shaded grey. Other runway features that may be shown are runway numbers, runway dimen-", "bbox": {"l": 449.10074000000003, "t": 469.32974, "r": 548.59674, "b": 471.45081, "coord_origin": "TOPLEFT"}}, {"id": 286, "text": "sions, runway slope, arresting gear, and displaced threshold.", "bbox": {"l": 449.10074000000003, "t": 471.60843, "r": 500.08181999999994, "b": 473.72949, "coord_origin": "TOPLEFT"}}, {"id": 287, "text": "2", "bbox": {"l": 449.10074000000003, "t": 476.16577, "r": 449.59933000000007, "b": 478.28687, "coord_origin": "TOPLEFT"}}, {"id": 288, "text": "W K H U L Q I R U P D W L R Q F R Q F H U Q L Q J O L J K W L Q J \u00bf Q D O D S S U R D F K E H D U L Q J V D L U S R U W E H D F R Q R E V W D F O H V F R Q W U R O W R Z H U 1 $ 9 $ , ' V K H O L ", "bbox": {"l": 450.09796, "t": 476.16577, "r": 547.82562, "b": 478.28687, "coord_origin": "TOPLEFT"}}, {"id": 289, "text": "-", "bbox": {"l": 547.82623, "t": 476.16577, "r": 548.45862, "b": 478.28687, "coord_origin": "TOPLEFT"}}, {"id": 290, "text": "pads may also be shown.", "bbox": {"l": 449.10074000000003, "t": 478.44446, "r": 470.52609000000007, "b": 480.56555, "coord_origin": "TOPLEFT"}}, {"id": 291, "text": "$ L U S R U W ( O H Y D W L R Q D Q G 7 R X F K G R Z Q = R Q H ( O H Y D W L R Q ", "bbox": {"l": 449.10074000000003, "t": 483.00183, "r": 493.37906000000004, "b": 485.12292, "coord_origin": "TOPLEFT"}}, {"id": 292, "text": "The airport elevation is shown enclosed within a box in the upper left corner of the sketch box and the touchdown zone ", "bbox": {"l": 449.10074000000003, "t": 487.5592, "r": 549.16168, "b": 489.6803, "coord_origin": "TOPLEFT"}}, {"id": 293, "text": "elevation (TDZE) is shown in the upper right corner of the sketch box. The airport elevation is the highest point of an ", "bbox": {"l": 449.10074000000003, "t": 489.83789, "r": 546.90881, "b": 491.95898, "coord_origin": "TOPLEFT"}}, {"id": 294, "text": "D L U S R U W \u00b6 V X V D E O H U X Q Z D \\ V P H D V X U H G L Q I H H W I U R P P H D Q V H D O H Y H O 7 K H 7 ' = ( L V W K H K L J K H V W H O H Y D W L R Q L Q W K H \u00bf U V W I H H W R I ", "bbox": {"l": 449.10074000000003, "t": 492.11658, "r": 551.80023, "b": 494.23767, "coord_origin": "TOPLEFT"}}, {"id": 295, "text": "the landing surface. Circling only approaches will not show a TDZE.", "bbox": {"l": 449.10074000000003, "t": 494.39526, "r": 505.85068000000007, "b": 496.51636, "coord_origin": "TOPLEFT"}}, {"id": 296, "text": "114", "bbox": {"l": 498.80661000000003, "t": 515.9437, "r": 502.08792, "b": 519.01764, "coord_origin": "TOPLEFT"}}, {"id": 297, "text": "FAA Chart Users\u2019 Guide - Terminal Procedures Publication (TPP) - Terms", "bbox": {"l": 444.56319999999994, "t": 422.84869, "r": 446.25998, "b": 471.87128, "coord_origin": "TOPLEFT"}}, {"id": 298, "text": "AGL 2013 Financial Calendar", "bbox": {"l": 329.40536, "t": 379.37537, "r": 355.13138, "b": 382.13336, "coord_origin": "TOPLEFT"}}, {"id": 299, "text": "22", "bbox": {"l": 329.40536, "t": 382.30273, "r": 330.96848, "b": 384.55927, "coord_origin": "TOPLEFT"}}, {"id": 300, "text": "August 2012 ", "bbox": {"l": 331.75003, "t": 382.30273, "r": 341.12875, "b": 384.55927, "coord_origin": "TOPLEFT"}}, {"id": 301, "text": "2012 full year result and fi nal dividend announced", "bbox": {"l": 350.4722, "t": 382.30273, "r": 384.81079, "b": 384.55927, "coord_origin": "TOPLEFT"}}, {"id": 302, "text": "30", "bbox": {"l": 329.40536, "t": 384.84552, "r": 330.97336, "b": 387.10205, "coord_origin": "TOPLEFT"}}, {"id": 303, "text": "August 2012 ", "bbox": {"l": 331.75735, "t": 384.84552, "r": 341.16534, "b": 387.10205, "coord_origin": "TOPLEFT"}}, {"id": 304, "text": "Ex-dividend trading commences", "bbox": {"l": 350.4722, "t": 384.84552, "r": 372.90613, "b": 387.10205, "coord_origin": "TOPLEFT"}}, {"id": 305, "text": "5", "bbox": {"l": 329.40536, "t": 387.38828, "r": 330.20337, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}}, {"id": 306, "text": "September 2012 ", "bbox": {"l": 331.00137, "t": 387.38828, "r": 342.9715, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}}, {"id": 307, "text": "Record date for 2012 fi nal dividend", "bbox": {"l": 350.4722, "t": 387.38828, "r": 374.88693, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}}, {"id": 308, "text": "27", "bbox": {"l": 329.40536, "t": 389.93103, "r": 331.0173, "b": 392.18762, "coord_origin": "TOPLEFT"}}, {"id": 309, "text": "September 2012 ", "bbox": {"l": 331.82327, "t": 389.93103, "r": 343.91284, "b": 392.18762, "coord_origin": "TOPLEFT"}}, {"id": 310, "text": "Final dividend payable", "bbox": {"l": 350.4722, "t": 389.93103, "r": 365.65988, "b": 392.18762, "coord_origin": "TOPLEFT"}}, {"id": 311, "text": "23", "bbox": {"l": 329.40536, "t": 392.47382, "r": 330.98804, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}}, {"id": 312, "text": "October 2012 ", "bbox": {"l": 331.77936, "t": 392.47382, "r": 342.06674, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}}, {"id": 313, "text": "Annual General Meeting", "bbox": {"l": 350.4722, "t": 392.47382, "r": 367.22156, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}}, {"id": 314, "text": "27", "bbox": {"l": 329.40536, "t": 395.0166, "r": 330.99741, "b": 397.27313, "coord_origin": "TOPLEFT"}}, {"id": 315, "text": "February 2013", "bbox": {"l": 331.7934, "t": 395.0166, "r": 342.1416, "b": 397.27313, "coord_origin": "TOPLEFT"}}, {"id": 316, "text": " 1", "bbox": {"l": 342.64841, "t": 395.18298, "r": 342.65811, "b": 396.49857000000003, "coord_origin": "TOPLEFT"}}, {"id": 317, "text": "2013 interim result and interim dividend announced", "bbox": {"l": 350.47177, "t": 395.01474, "r": 386.25897, "b": 397.2713, "coord_origin": "TOPLEFT"}}, {"id": 318, "text": "28", "bbox": {"l": 329.40491, "t": 397.55749999999995, "r": 331.02695, "b": 399.81406, "coord_origin": "TOPLEFT"}}, {"id": 319, "text": "August 2013", "bbox": {"l": 331.83795, "t": 397.55749999999995, "r": 340.75909, "b": 399.81406, "coord_origin": "TOPLEFT"}}, {"id": 320, "text": " 1", "bbox": {"l": 341.26437, "t": 397.7254, "r": 341.27408, "b": 399.04095, "coord_origin": "TOPLEFT"}}, {"id": 321, "text": "2013 full year results and fi nal dividend announced ", "bbox": {"l": 350.47144, "t": 397.55713, "r": 385.93265, "b": 399.81369, "coord_origin": "TOPLEFT"}}, {"id": 322, "text": "1", "bbox": {"l": 329.40536, "t": 400.46155, "r": 329.87708, "b": 401.96588, "coord_origin": "TOPLEFT"}}, {"id": 323, "text": "Indicative dates only, subject to change/Board confi rmation", "bbox": {"l": 330.34882, "t": 400.46155, "r": 358.65204, "b": 401.96588, "coord_origin": "TOPLEFT"}}, {"id": 324, "text": "AGL\u2019s Annual General Meeting will be held at the City Recital Hall, Angel Place, Sydney ", "bbox": {"l": 329.40536, "t": 404.34503, "r": 391.771, "b": 406.60156, "coord_origin": "TOPLEFT"}}, {"id": 325, "text": "commencing at 10.30am on Tuesday 23 October 2012.", "bbox": {"l": 329.40536, "t": 406.37857, "r": 369.65308, "b": 408.63513000000006, "coord_origin": "TOPLEFT"}}, {"id": 326, "text": "Ye s te rd ay", "bbox": {"l": 363.54486, "t": 460.53054999999995, "r": 379.25955, "b": 465.54507, "coord_origin": "TOPLEFT"}}, {"id": 327, "text": "Established in Sydney in 1837, and then ", "bbox": {"l": 363.54486, "t": 466.7157, "r": 391.38229, "b": 468.97223, "coord_origin": "TOPLEFT"}}, {"id": 328, "text": "known as The Australian Gas Light Company, ", "bbox": {"l": 363.54486, "t": 468.74924, "r": 395.01788, "b": 471.00577, "coord_origin": "TOPLEFT"}}, {"id": 329, "text": "the AGL business has an established history ", "bbox": {"l": 363.54486, "t": 470.78281, "r": 394.08322, "b": 473.03934, "coord_origin": "TOPLEFT"}}, {"id": 330, "text": "and reputation for serving the gas and ", "bbox": {"l": 363.54486, "t": 472.81635, "r": 390.60727, "b": 475.07288, "coord_origin": "TOPLEFT"}}, {"id": 331, "text": "electricity needs of Australian households. ", "bbox": {"l": 363.54486, "t": 474.84988, "r": 393.49612, "b": 477.10645, "coord_origin": "TOPLEFT"}}, {"id": 332, "text": "In 1841, when AGL supplied the gas to light ", "bbox": {"l": 363.54486, "t": 476.88345, "r": 394.11481, "b": 479.13998, "coord_origin": "TOPLEFT"}}, {"id": 333, "text": "the fi rst public street lamp, it was reported ", "bbox": {"l": 363.54486, "t": 478.91699, "r": 393.75891, "b": 481.17352, "coord_origin": "TOPLEFT"}}, {"id": 334, "text": "in the Sydney Gazette as a \u201cwonderful ", "bbox": {"l": 363.54486, "t": 480.95053, "r": 390.4975, "b": 483.20709, "coord_origin": "TOPLEFT"}}, {"id": 335, "text": "achievement of scientifi c knowledge, assisted ", "bbox": {"l": 363.54486, "t": 482.9841, "r": 395.70975, "b": 485.24063, "coord_origin": "TOPLEFT"}}, {"id": 336, "text": "by mechanical ingenuity.\u201d Within two years, ", "bbox": {"l": 363.54486, "t": 485.01764, "r": 394.27283, "b": 487.2742, "coord_origin": "TOPLEFT"}}, {"id": 337, "text": "165 gas lamps were lighting the City of Sydney.", "bbox": {"l": 363.54486, "t": 487.05121, "r": 396.65939, "b": 489.30774, "coord_origin": "TOPLEFT"}}, {"id": 338, "text": "Looking back on ", "bbox": {"l": 329.4054, "t": 419.93124, "r": 384.19696, "b": 431.09412, "coord_origin": "TOPLEFT"}}, {"id": 339, "text": "175 years of ", "bbox": {"l": 329.4054, "t": 430.10379, "r": 372.16626, "b": 441.26669, "coord_origin": "TOPLEFT"}}, {"id": 340, "text": "looking forward.", "bbox": {"l": 329.4054, "t": 440.27636999999993, "r": 385.3981, "b": 451.43924, "coord_origin": "TOPLEFT"}}, {"id": 341, "text": "AGL Energy Limited ABN 74 115 061 375", "bbox": {"l": 329.40536, "t": 372.16159, "r": 353.36179, "b": 373.91669, "coord_origin": "TOPLEFT"}}, {"id": 342, "text": "29", "bbox": {"l": 546.20587, "t": 360.90448, "r": 548.23407, "b": 362.82242, "coord_origin": "TOPLEFT"}}, {"id": 343, "text": "signs, signals and road markings", "bbox": {"l": 497.77728, "t": 251.43384000000003, "r": 542.8255, "b": 254.94385, "coord_origin": "TOPLEFT"}}, {"id": 344, "text": "3", "bbox": {"l": 490.30679, "t": 251.47478999999998, "r": 492.09982, "b": 254.98479999999995, "coord_origin": "TOPLEFT"}}, {"id": 345, "text": "In ", "bbox": {"l": 498.15335, "t": 263.88922, "r": 500.05637, "b": 265.92719, "coord_origin": "TOPLEFT"}}, {"id": 346, "text": "chapter 2, you and your vehicle", "bbox": {"l": 500.05637, "t": 263.85717999999997, "r": 524.37036, "b": 265.86310000000003, "coord_origin": "TOPLEFT"}}, {"id": 347, "text": ", you learned about ", "bbox": {"l": 524.37036, "t": 263.88922, "r": 539.89124, "b": 265.92719, "coord_origin": "TOPLEFT"}}, {"id": 348, "text": "some of the controls in your vehicle. This chapter is a handy ", "bbox": {"l": 498.15335, "t": 265.93224999999995, "r": 544.50403, "b": 267.97020999999995, "coord_origin": "TOPLEFT"}}, {"id": 349, "text": "reference section that gives examples of the most common ", "bbox": {"l": 498.15335, "t": 267.97533999999996, "r": 544.01343, "b": 270.01331000000005, "coord_origin": "TOPLEFT"}}, {"id": 350, "text": "signs, signals and road markings that keep traffi c organized ", "bbox": {"l": 498.15335, "t": 270.01831000000004, "r": 544.11987, "b": 272.05634, "coord_origin": "TOPLEFT"}}, {"id": 351, "text": "and flowing smoothly. ", "bbox": {"l": 498.15335, "t": 272.06140000000005, "r": 515.41071, "b": 274.09937, "coord_origin": "TOPLEFT"}}, {"id": 352, "text": "Signs", "bbox": {"l": 498.15335, "t": 277.34619, "r": 505.64642000000003, "b": 280.9357, "coord_origin": "TOPLEFT"}}, {"id": 353, "text": "There are three ways to read signs: by their shape, colour and ", "bbox": {"l": 498.15335, "t": 281.82187, "r": 543.92957, "b": 283.85983, "coord_origin": "TOPLEFT"}}, {"id": 354, "text": "the messages printed on them. Understanding these three ways ", "bbox": {"l": 498.15335, "t": 283.8649, "r": 545.67834, "b": 285.90289, "coord_origin": "TOPLEFT"}}, {"id": 355, "text": "of classifying signs will help you figure out the meaning of signs ", "bbox": {"l": 498.15335, "t": 285.90796, "r": 545.26471, "b": 287.94592, "coord_origin": "TOPLEFT"}}, {"id": 356, "text": "that are new to you. ", "bbox": {"l": 498.15335, "t": 287.95099, "r": 513.31335, "b": 289.98895, "coord_origin": "TOPLEFT"}}, {"id": 357, "text": "Stop", "bbox": {"l": 505.43439, "t": 303.07596, "r": 508.53033000000005, "b": 304.89639, "coord_origin": "TOPLEFT"}}, {"id": 358, "text": "Yield the right-of-way", "bbox": {"l": 527.45502, "t": 303.25354, "r": 541.44678, "b": 305.07397, "coord_origin": "TOPLEFT"}}, {"id": 359, "text": "Shows driving", "bbox": {"l": 501.79385, "t": 321.18973, "r": 510.41632, "b": 323.01016, "coord_origin": "TOPLEFT"}}, {"id": 360, "text": "regulations", "bbox": {"l": 501.79385, "t": 322.87731999999994, "r": 509.04268999999994, "b": 324.69775000000004, "coord_origin": "TOPLEFT"}}, {"id": 361, "text": "Explains lane use", "bbox": {"l": 518.66455, "t": 319.59146, "r": 529.80902, "b": 321.41190000000006, "coord_origin": "TOPLEFT"}}, {"id": 362, "text": "School zone signs ", "bbox": {"l": 534.87561, "t": 318.37616, "r": 546.95142, "b": 320.19659, "coord_origin": "TOPLEFT"}}, {"id": 363, "text": "are fl uorescent ", "bbox": {"l": 534.87561, "t": 320.0637500000001, "r": 545.05762, "b": 321.88419, "coord_origin": "TOPLEFT"}}, {"id": 364, "text": "yellow-green", "bbox": {"l": 534.87561, "t": 321.75134, "r": 543.32263, "b": 323.57178, "coord_origin": "TOPLEFT"}}, {"id": 365, "text": "Tells about motorist ", "bbox": {"l": 499.21862999999996, "t": 338.12772, "r": 512.62451, "b": 339.94815, "coord_origin": "TOPLEFT"}}, {"id": 366, "text": "services", "bbox": {"l": 499.21862999999996, "t": 339.81531000000007, "r": 504.39917, "b": 341.63574, "coord_origin": "TOPLEFT"}}, {"id": 367, "text": "Shows a permitted ", "bbox": {"l": 516.97748, "t": 338.06039, "r": 529.77484, "b": 339.88082999999995, "coord_origin": "TOPLEFT"}}, {"id": 368, "text": "action", "bbox": {"l": 516.97748, "t": 339.74799, "r": 520.96399, "b": 341.56842, "coord_origin": "TOPLEFT"}}, {"id": 369, "text": "Shows an action that ", "bbox": {"l": 534.55847, "t": 337.88281, "r": 548.58453, "b": 339.7032500000001, "coord_origin": "TOPLEFT"}}, {"id": 370, "text": "is not permitted", "bbox": {"l": 534.55847, "t": 339.57040000000006, "r": 545.08862, "b": 341.39084, "coord_origin": "TOPLEFT"}}, {"id": 371, "text": "Warns of hazards ", "bbox": {"l": 483.05853, "t": 356.17416, "r": 494.72577, "b": 357.9946, "coord_origin": "TOPLEFT"}}, {"id": 372, "text": "ahead", "bbox": {"l": 483.05853, "t": 357.86179, "r": 487.07525999999996, "b": 359.68222, "coord_origin": "TOPLEFT"}}, {"id": 373, "text": "Warns of", "bbox": {"l": 499.39645, "t": 356.26297000000005, "r": 504.69171, "b": 358.0834, "coord_origin": "TOPLEFT"}}, {"id": 374, "text": "construction zones", "bbox": {"l": 499.39645, "t": 357.95056, "r": 511.69116, "b": 359.77099999999996, "coord_origin": "TOPLEFT"}}, {"id": 375, "text": "Railway crossing", "bbox": {"l": 516.75891, "t": 356.26297000000005, "r": 527.42938, "b": 358.0834, "coord_origin": "TOPLEFT"}}, {"id": 376, "text": "Shows distance and ", "bbox": {"l": 534.5141, "t": 352.92981, "r": 547.89862, "b": 354.75024, "coord_origin": "TOPLEFT"}}, {"id": 377, "text": "direction", "bbox": {"l": 534.5141, "t": 354.6174, "r": 540.2818, "b": 356.43784, "coord_origin": "TOPLEFT"}}, {"id": 378, "text": "\u2022", "bbox": {"l": 478.37466, "t": 270.14075, "r": 479.14251999999993, "b": 272.17877, "coord_origin": "TOPLEFT"}}, {"id": 379, "text": "Signs", "bbox": {"l": 479.91036999999994, "t": 270.14075, "r": 483.74963, "b": 272.17877, "coord_origin": "TOPLEFT"}}, {"id": 380, "text": "- regulatory signs", "bbox": {"l": 479.97293, "t": 272.84717, "r": 492.31219, "b": 274.34888, "coord_origin": "TOPLEFT"}}, {"id": 381, "text": "- school, ", "bbox": {"l": 479.97293, "t": 275.14513999999997, "r": 486.72598000000005, "b": 276.64679, "coord_origin": "TOPLEFT"}}, {"id": 382, "text": "playground and ", "bbox": {"l": 481.21602999999993, "t": 276.77972, "r": 492.93286000000006, "b": 278.81768999999997, "coord_origin": "TOPLEFT"}}, {"id": 383, "text": "crosswalk signs", "bbox": {"l": 481.21602999999993, "t": 278.82275000000004, "r": 491.82938000000007, "b": 280.86075, "coord_origin": "TOPLEFT"}}, {"id": 384, "text": "- lane use signs", "bbox": {"l": 479.97293, "t": 281.52759, "r": 491.00775000000004, "b": 283.02924, "coord_origin": "TOPLEFT"}}, {"id": 385, "text": "- turn control signs", "bbox": {"l": 479.97293, "t": 283.82556, "r": 493.32748, "b": 285.3272099999999, "coord_origin": "TOPLEFT"}}, {"id": 386, "text": "- parking signs", "bbox": {"l": 479.97293, "t": 286.1235, "r": 490.4915199999999, "b": 287.62518, "coord_origin": "TOPLEFT"}}, {"id": 387, "text": "- reserved lane ", "bbox": {"l": 479.97293, "t": 288.42148, "r": 491.17004000000003, "b": 289.92316, "coord_origin": "TOPLEFT"}}, {"id": 388, "text": "signs", "bbox": {"l": 481.21602999999993, "t": 290.05605999999995, "r": 484.77405000000005, "b": 292.09406, "coord_origin": "TOPLEFT"}}, {"id": 389, "text": "- warning signs", "bbox": {"l": 479.97293, "t": 292.76169000000004, "r": 490.83398, "b": 294.26334, "coord_origin": "TOPLEFT"}}, {"id": 390, "text": "- object markers", "bbox": {"l": 479.97293, "t": 295.05963, "r": 491.62692, "b": 296.56131, "coord_origin": "TOPLEFT"}}, {"id": 391, "text": "- construction ", "bbox": {"l": 479.97293, "t": 297.3576, "r": 490.37341, "b": 298.8592499999999, "coord_origin": "TOPLEFT"}}, {"id": 392, "text": "signs", "bbox": {"l": 481.21602999999993, "t": 298.99219, "r": 484.77405000000005, "b": 301.03015, "coord_origin": "TOPLEFT"}}, {"id": 393, "text": "- information and ", "bbox": {"l": 479.97293, "t": 301.69780999999995, "r": 492.93912, "b": 303.19946, "coord_origin": "TOPLEFT"}}, {"id": 394, "text": "destination signs", "bbox": {"l": 481.21602999999993, "t": 303.3324, "r": 493.00525, "b": 305.37036, "coord_origin": "TOPLEFT"}}, {"id": 395, "text": "- railway signs", "bbox": {"l": 479.97293, "t": 306.0379899999999, "r": 489.99047999999993, "b": 307.53967, "coord_origin": "TOPLEFT"}}, {"id": 396, "text": "\u2022", "bbox": {"l": 478.375, "t": 308.24789, "r": 479.1032400000001, "b": 310.28586, "coord_origin": "TOPLEFT"}}, {"id": 397, "text": "Signals", "bbox": {"l": 479.83151, "t": 308.24789, "r": 484.92925999999994, "b": 310.28586, "coord_origin": "TOPLEFT"}}, {"id": 398, "text": "- lane control ", "bbox": {"l": 479.97293, "t": 310.95358, "r": 490.00091999999995, "b": 312.45526, "coord_origin": "TOPLEFT"}}, {"id": 399, "text": "signals", "bbox": {"l": 481.21602999999993, "t": 312.5881999999999, "r": 485.95331, "b": 314.62616, "coord_origin": "TOPLEFT"}}, {"id": 400, "text": "- traffic lights", "bbox": {"l": 479.97293, "t": 315.29379, "r": 489.29876999999993, "b": 316.79544, "coord_origin": "TOPLEFT"}}, {"id": 401, "text": "\u2022", "bbox": {"l": 478.375, "t": 317.50366, "r": 479.18129999999996, "b": 319.5416599999999, "coord_origin": "TOPLEFT"}}, {"id": 402, "text": "Road markings", "bbox": {"l": 479.98761, "t": 317.50366, "r": 490.46960000000007, "b": 319.5416599999999, "coord_origin": "TOPLEFT"}}, {"id": 403, "text": "- yellow lines", "bbox": {"l": 479.97293, "t": 320.20938, "r": 489.26166000000006, "b": 321.71103, "coord_origin": "TOPLEFT"}}, {"id": 404, "text": "- white lines", "bbox": {"l": 479.97293, "t": 322.50732, "r": 488.59189, "b": 324.009, "coord_origin": "TOPLEFT"}}, {"id": 405, "text": "- reserved lane ", "bbox": {"l": 479.97293, "t": 324.8053, "r": 491.17004000000003, "b": 326.30698, "coord_origin": "TOPLEFT"}}, {"id": 406, "text": "markings", "bbox": {"l": 481.21602999999993, "t": 326.43988, "r": 487.58978, "b": 328.47784, "coord_origin": "TOPLEFT"}}, {"id": 407, "text": "- other markings", "bbox": {"l": 479.97293, "t": 329.14551, "r": 491.75177, "b": 330.64716, "coord_origin": "TOPLEFT"}}, {"id": 408, "text": "in this chapter", "bbox": {"l": 478.15246999999994, "t": 265.07030999999995, "r": 493.75586, "b": 268.06872999999996, "coord_origin": "TOPLEFT"}}], "children": [{"id": 32, "label": "text", "bbox": {"l": 327.86951, "t": 351.78085, "r": 330.41248, "b": 353.95465, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "13", "bbox": {"l": 327.86951, "t": 351.78085, "r": 330.41248, "b": 353.95465, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 327.83005, "t": 331.57268999999997, "r": 351.16092, "b": 333.31171, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "USING THE VERTICAL TUBE -", "bbox": {"l": 327.83005, "t": 331.57268999999997, "r": 351.16092, "b": 333.31171, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 327.83005, "t": 333.18292, "r": 348.30536, "b": 334.92194, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "MODELS AY11230/11234", "bbox": {"l": 327.83005, "t": 333.18292, "r": 348.30536, "b": 334.92194, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 327.83005, "t": 336.40439, "r": 329.05914, "b": 337.92606, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "1.", "bbox": {"l": 327.83005, "t": 336.40439, "r": 329.05914, "b": 337.92606, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 329.67368, "t": 336.40439, "r": 349.95349, "b": 337.92606, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "The vertical tube can be used for", "bbox": {"l": 329.67368, "t": 336.40439, "r": 349.95349, "b": 337.92606, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 329.11752, "t": 337.83588, "r": 353.57977, "b": 339.35751000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "instructional viewing or to photograph", "bbox": {"l": 329.11752, "t": 337.83588, "r": 353.57977, "b": 339.35751000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 327.77121, "t": 339.26736, "r": 352.4306, "b": 340.789, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": " the image with a digital camera or a", "bbox": {"l": 327.77121, "t": 339.26736, "r": 352.4306, "b": 340.789, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 328.15176, "t": 340.69882, "r": 337.91086, "b": 342.22049, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": " micro TV unit", "bbox": {"l": 328.15176, "t": 340.69882, "r": 337.91086, "b": 342.22049, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 327.8313, "t": 342.19043000000005, "r": 329.09155, "b": 343.71207, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "2.", "bbox": {"l": 327.8313, "t": 342.19043000000005, "r": 329.09155, "b": 343.71207, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 329.72168, "t": 342.19043000000005, "r": 354.9267, "b": 343.71207, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "Loosen the retention screw, then rotate ", "bbox": {"l": 329.72168, "t": 342.19043000000005, "r": 354.9267, "b": 343.71207, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 327.8313, "t": 343.62192, "r": 351.66949, "b": 345.14355, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": " the adjustment ring to change the ", "bbox": {"l": 327.8313, "t": 343.62192, "r": 351.66949, "b": 345.14355, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 328.21185, "t": 345.05338, "r": 346.33179, "b": 346.57504, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": " length of the vertical tube.", "bbox": {"l": 328.21185, "t": 345.05338, "r": 346.33179, "b": 346.57504, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 327.83005, "t": 346.84680000000003, "r": 329.12726, "b": 348.36847, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "3.", "bbox": {"l": 327.83005, "t": 346.84680000000003, "r": 329.12726, "b": 348.36847, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 329.77588, "t": 346.84680000000003, "r": 351.18005, "b": 348.36847, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "Make sure that both the images in", "bbox": {"l": 329.77588, "t": 346.84680000000003, "r": 351.18005, "b": 348.36847, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 327.25311, "t": 254.94812000000002, "r": 350.07861, "b": 258.86096, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "OPERATION ", "bbox": {"l": 327.25311, "t": 254.94812000000002, "r": 350.07861, "b": 258.86096, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 350.07861, "t": 254.76782000000003, "r": 351.82651, "b": 258.68066, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "(", "bbox": {"l": 350.07861, "t": 254.76782000000003, "r": 351.82651, "b": 258.68066, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 351.82651, "t": 254.94812000000002, "r": 360.85242, "b": 258.86096, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "cont.", "bbox": {"l": 351.82651, "t": 254.94812000000002, "r": 360.85242, "b": 258.86096, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 360.85242, "t": 254.76782000000003, "r": 362.60028, "b": 258.68066, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": ")", "bbox": {"l": 360.85242, "t": 254.76782000000003, "r": 362.60028, "b": 258.68066, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 326.88037, "t": 263.49492999999995, "r": 345.84351, "b": 265.23395000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "SELECTING OBJECTIVE ", "bbox": {"l": 326.88037, "t": 263.49492999999995, "r": 345.84351, "b": 265.23395000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 326.88037, "t": 265.10515999999996, "r": 340.54153, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "MAGNIFICATION", "bbox": {"l": 326.88037, "t": 265.10515999999996, "r": 340.54153, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 326.88037, "t": 266.71533, "r": 328.31903, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "1.", "bbox": {"l": 326.88037, "t": 266.71533, "r": 328.31903, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 329.03836, "t": 266.71533, "r": 354.21472, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "There are two objectives. The lower", "bbox": {"l": 329.03836, "t": 266.71533, "r": 354.21472, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 326.88037, "t": 268.32556, "r": 355.19193, "b": 270.06458, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": " magnification objective has a greater", "bbox": {"l": 326.88037, "t": 268.32556, "r": 355.19193, "b": 270.06458, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 326.88037, "t": 269.93579, "r": 345.80057, "b": 271.6748, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": " depth of field and view.", "bbox": {"l": 326.88037, "t": 269.93579, "r": 345.80057, "b": 271.6748, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 326.88037, "t": 271.54602, "r": 328.33862, "b": 273.28503, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "2.", "bbox": {"l": 326.88037, "t": 271.54602, "r": 328.33862, "b": 273.28503, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 329.06775, "t": 271.54602, "r": 352.39969, "b": 273.28503, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "In order to observe the specimen", "bbox": {"l": 329.06775, "t": 271.54602, "r": 352.39969, "b": 273.28503, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 326.88037, "t": 273.15619000000004, "r": 352.90042, "b": 274.89526, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": " easily use the lower magnification", "bbox": {"l": 326.88037, "t": 273.15619000000004, "r": 352.90042, "b": 274.89526, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 326.88037, "t": 274.76642000000004, "r": 354.59546, "b": 276.50543000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": " objective first. Then, by rotating the", "bbox": {"l": 326.88037, "t": 274.76642000000004, "r": 354.59546, "b": 276.50543000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 326.88037, "t": 276.37665000000004, "r": 350.81885, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": " case, the magnification can be", "bbox": {"l": 326.88037, "t": 276.37665000000004, "r": 350.81885, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 326.88037, "t": 277.98688000000004, "r": 335.46707, "b": 279.72589000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": " changed.", "bbox": {"l": 326.88037, "t": 277.98688000000004, "r": 335.46707, "b": 279.72589000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 326.88037, "t": 281.20728, "r": 354.57755, "b": 282.94632, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 107, "text": "CHANGING THE INTERPUPILLARY ", "bbox": {"l": 326.88037, "t": 281.20728, "r": 354.57755, "b": 282.94632, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 326.88037, "t": 282.81750000000005, "r": 335.1752, "b": 284.55652, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 108, "text": "DISTANCE", "bbox": {"l": 326.88037, "t": 282.81750000000005, "r": 335.1752, "b": 284.55652, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 326.88037, "t": 284.4277, "r": 328.34784, "b": 286.16675, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 109, "text": "1.", "bbox": {"l": 326.88037, "t": 284.4277, "r": 328.34784, "b": 286.16675, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 329.08157, "t": 284.4277, "r": 354.76245, "b": 286.16675, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 110, "text": "The distance between the observer's", "bbox": {"l": 329.08157, "t": 284.4277, "r": 354.76245, "b": 286.16675, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 326.88037, "t": 286.03793, "r": 354.6499, "b": 287.77695, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 111, "text": " pupils is the interpupillary distance.", "bbox": {"l": 326.88037, "t": 286.03793, "r": 354.6499, "b": 287.77695, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 326.88037, "t": 287.64813, "r": 328.25125, "b": 289.38718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 112, "text": "2.", "bbox": {"l": 326.88037, "t": 287.64813, "r": 328.25125, "b": 289.38718, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 328.93671, "t": 287.64813, "r": 354.29825, "b": 289.38718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 113, "text": "To adjust the interpupillary distance", "bbox": {"l": 328.93671, "t": 287.64813, "r": 354.29825, "b": 289.38718, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 326.88181, "t": 289.25836, "r": 355.02075, "b": 290.99738, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 114, "text": " rotate the prism caps until both eyes", "bbox": {"l": 326.88181, "t": 289.25836, "r": 355.02075, "b": 290.99738, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 326.88181, "t": 290.86855999999995, "r": 350.82028, "b": 292.6076, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 115, "text": " coincide with the image in the", "bbox": {"l": 326.88181, "t": 290.86855999999995, "r": 350.82028, "b": 292.6076, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 326.88181, "t": 292.47879, "r": 336.2067, "b": 294.2178, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 116, "text": " eyepiece. ", "bbox": {"l": 326.88181, "t": 292.47879, "r": 336.2067, "b": 294.2178, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 326.88181, "t": 295.69922, "r": 335.3941, "b": 297.43823, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 117, "text": "FOCUSING", "bbox": {"l": 326.88181, "t": 295.69922, "r": 335.3941, "b": 297.43823, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 326.88181, "t": 297.30942, "r": 328.34314, "b": 299.04846, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 118, "text": "1.", "bbox": {"l": 326.88181, "t": 297.30942, "r": 328.34314, "b": 299.04846, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 329.07379, "t": 297.30942, "r": 353.18555, "b": 299.04846, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 119, "text": "Remove the lens protective cover.", "bbox": {"l": 329.07379, "t": 297.30942, "r": 353.18555, "b": 299.04846, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 326.88324, "t": 298.91965, "r": 328.35919, "b": 300.65866, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 120, "text": "2.", "bbox": {"l": 326.88324, "t": 298.91965, "r": 328.35919, "b": 300.65866, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 329.0972, "t": 298.91965, "r": 353.45065, "b": 300.65866, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 121, "text": "Place the specimen on the working", "bbox": {"l": 329.0972, "t": 298.91965, "r": 353.45065, "b": 300.65866, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 326.88324, "t": 300.52985, "r": 333.32825, "b": 302.26889000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 122, "text": " stage.", "bbox": {"l": 326.88324, "t": 300.52985, "r": 333.32825, "b": 302.26889000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 326.88324, "t": 302.14008000000007, "r": 328.31296, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 123, "text": "3.", "bbox": {"l": 326.88324, "t": 302.14008000000007, "r": 328.31296, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 329.02783, "t": 302.14008000000007, "r": 354.76303, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 124, "text": "Focus the specimen with the left eye", "bbox": {"l": 329.02783, "t": 302.14008000000007, "r": 354.76303, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 326.88324, "t": 303.75027, "r": 355.96307, "b": 305.48932, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 125, "text": " first while turning the focus knob until", "bbox": {"l": 326.88324, "t": 303.75027, "r": 355.96307, "b": 305.48932, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 326.88324, "t": 305.3605, "r": 354.46594, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 126, "text": " the image appears clear and sharp.", "bbox": {"l": 326.88324, "t": 305.3605, "r": 354.46594, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 326.88324, "t": 306.9707, "r": 328.25488, "b": 308.70975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 127, "text": "4.", "bbox": {"l": 326.88324, "t": 306.9707, "r": 328.25488, "b": 308.70975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 328.9407, "t": 306.9707, "r": 356.37335, "b": 308.70975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 128, "text": "Rotate the right eyepiece ring until the", "bbox": {"l": 328.9407, "t": 306.9707, "r": 356.37335, "b": 308.70975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 326.88324, "t": 308.58093, "r": 355.38867, "b": 310.31995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 129, "text": " images in each eyepiece coincide and", "bbox": {"l": 326.88324, "t": 308.58093, "r": 355.38867, "b": 310.31995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 326.88324, "t": 310.19113, "r": 343.17249, "b": 311.93018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 130, "text": " are sharp and clear.", "bbox": {"l": 326.88324, "t": 310.19113, "r": 343.17249, "b": 311.93018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 326.88324, "t": 313.41156, "r": 344.13388, "b": 315.15059999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 131, "text": "CHANGING THE BULB", "bbox": {"l": 326.88324, "t": 313.41156, "r": 344.13388, "b": 315.15059999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 326.88324, "t": 315.02178999999995, "r": 328.37418, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 132, "text": "1.", "bbox": {"l": 326.88324, "t": 315.02178999999995, "r": 328.37418, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 329.11963, "t": 315.02178999999995, "r": 348.50162, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 133, "text": "Disconnect the power cord.", "bbox": {"l": 329.11963, "t": 315.02178999999995, "r": 348.50162, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 326.88324, "t": 316.63199, "r": 328.34061, "b": 318.37103, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 134, "text": "2.", "bbox": {"l": 326.88324, "t": 316.63199, "r": 328.34061, "b": 318.37103, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 329.06931, "t": 316.63199, "r": 353.11588, "b": 318.37103, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 135, "text": "When the bulb is cool, remove the", "bbox": {"l": 329.06931, "t": 316.63199, "r": 353.11588, "b": 318.37103, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 326.88464, "t": 318.2422199999999, "r": 353.79517, "b": 319.9812299999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 136, "text": " oblique illuminator cap and remove", "bbox": {"l": 326.88464, "t": 318.2422199999999, "r": 353.79517, "b": 319.9812299999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 326.88464, "t": 319.85242000000005, "r": 348.02094, "b": 321.59146, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 137, "text": " the halogen bulb with cap.", "bbox": {"l": 326.88464, "t": 319.85242000000005, "r": 348.02094, "b": 321.59146, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 326.88464, "t": 321.46265, "r": 328.37512, "b": 323.20166, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 138, "text": "3.", "bbox": {"l": 326.88464, "t": 321.46265, "r": 328.37512, "b": 323.20166, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 329.12036, "t": 321.46265, "r": 352.96808, "b": 323.20166, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 139, "text": "Replace with a new halogen bulb.", "bbox": {"l": 329.12036, "t": 321.46265, "r": 352.96808, "b": 323.20166, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 326.88608, "t": 323.07285, "r": 328.36884, "b": 324.81189, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 140, "text": "4.", "bbox": {"l": 326.88608, "t": 323.07285, "r": 328.36884, "b": 324.81189, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 329.1102, "t": 323.07285, "r": 356.5412, "b": 324.81189, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 141, "text": "Open the window in the base plate and", "bbox": {"l": 329.1102, "t": 323.07285, "r": 356.5412, "b": 324.81189, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 326.88608, "t": 324.68307000000004, "r": 350.13828, "b": 326.42209, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 142, "text": " replace the halogen lamp or ", "bbox": {"l": 326.88608, "t": 324.68307000000004, "r": 350.13828, "b": 326.42209, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 326.88608, "t": 326.29327, "r": 351.59677, "b": 328.03232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 143, "text": " fluorescent lamp of transmitted", "bbox": {"l": 326.88608, "t": 326.29327, "r": 351.59677, "b": 328.03232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 326.88608, "t": 327.9035, "r": 336.89197, "b": 329.64252, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 144, "text": " illuminator.", "bbox": {"l": 326.88608, "t": 327.9035, "r": 336.89197, "b": 329.64252, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 358.42023, "t": 263.49492999999995, "r": 366.93256, "b": 265.23395000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 145, "text": "FOCUSING", "bbox": {"l": 358.42023, "t": 263.49492999999995, "r": 366.93256, "b": 265.23395000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 358.42023, "t": 265.10515999999996, "r": 359.89841, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 146, "text": "1.", "bbox": {"l": 358.42023, "t": 265.10515999999996, "r": 359.89841, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 360.63751, "t": 265.10515999999996, "r": 387.98407, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 147, "text": "Turn the focusing knob away or toward", "bbox": {"l": 360.63751, "t": 265.10515999999996, "r": 387.98407, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 358.42023, "t": 266.71533, "r": 384.58948, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 148, "text": " you until a clear image is viewed.", "bbox": {"l": 358.42023, "t": 266.71533, "r": 384.58948, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 358.42166, "t": 268.32556, "r": 359.78549, "b": 270.06458, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 149, "text": "2.", "bbox": {"l": 358.42166, "t": 268.32556, "r": 359.78549, "b": 270.06458, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 360.46741, "t": 268.32556, "r": 384.33441, "b": 270.06458, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 150, "text": "If the image is unclear, adjust the", "bbox": {"l": 360.46741, "t": 268.32556, "r": 384.33441, "b": 270.06458, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 358.4231, "t": 269.93579, "r": 384.61502, "b": 271.6748, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 151, "text": " height of the elevator up or down,", "bbox": {"l": 358.4231, "t": 269.93579, "r": 384.61502, "b": 271.6748, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 358.4231, "t": 271.54602, "r": 385.38922, "b": 273.28503, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 152, "text": " then turn the focusing knob again.", "bbox": {"l": 358.4231, "t": 271.54602, "r": 385.38922, "b": 273.28503, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 358.4231, "t": 274.76642000000004, "r": 377.35046, "b": 276.50543000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 153, "text": "ZOOM MAGNIFICATION", "bbox": {"l": 358.4231, "t": 274.76642000000004, "r": 377.35046, "b": 276.50543000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 358.4231, "t": 276.37665000000004, "r": 359.89429, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 154, "text": "1.", "bbox": {"l": 358.4231, "t": 276.37665000000004, "r": 359.89429, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 360.62988, "t": 276.37665000000004, "r": 386.37589, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 155, "text": "Turn the zoom magnification knob to", "bbox": {"l": 360.62988, "t": 276.37665000000004, "r": 386.37589, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 358.4231, "t": 277.98688000000004, "r": 386.78732, "b": 279.72589000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 156, "text": " the desired magnification and field of", "bbox": {"l": 358.4231, "t": 277.98688000000004, "r": 386.78732, "b": 279.72589000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 358.4231, "t": 279.59704999999997, "r": 364.16855, "b": 281.33609, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 157, "text": " view.", "bbox": {"l": 358.4231, "t": 279.59704999999997, "r": 364.16855, "b": 281.33609, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 358.4231, "t": 281.20728, "r": 359.86777, "b": 282.94632, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 158, "text": "2.", "bbox": {"l": 358.4231, "t": 281.20728, "r": 359.86777, "b": 282.94632, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 114, "label": "text", "bbox": {"l": 360.59012, "t": 281.20728, "r": 387.31656, "b": 282.94632, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 159, "text": "In most situations, it is recommended", "bbox": {"l": 360.59012, "t": 281.20728, "r": 387.31656, "b": 282.94632, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 115, "label": "text", "bbox": {"l": 358.4231, "t": 282.81750000000005, "r": 381.56656, "b": 284.55652, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 160, "text": " that you focus at the lowest ", "bbox": {"l": 358.4231, "t": 282.81750000000005, "r": 381.56656, "b": 284.55652, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 116, "label": "text", "bbox": {"l": 358.4231, "t": 284.4277, "r": 386.63403, "b": 286.16675, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 161, "text": " magnification, then move to a higher", "bbox": {"l": 358.4231, "t": 284.4277, "r": 386.63403, "b": 286.16675, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 117, "label": "text", "bbox": {"l": 358.42453, "t": 286.03793, "r": 382.77115, "b": 287.77695, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 162, "text": " magnification and re-focus as ", "bbox": {"l": 358.42453, "t": 286.03793, "r": 382.77115, "b": 287.77695, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 118, "label": "text", "bbox": {"l": 358.42453, "t": 287.64813, "r": 367.98694, "b": 289.38718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 163, "text": " necessary.", "bbox": {"l": 358.42453, "t": 287.64813, "r": 367.98694, "b": 289.38718, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 119, "label": "text", "bbox": {"l": 358.42453, "t": 289.25836, "r": 359.80386, "b": 290.99738, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 164, "text": "3.", "bbox": {"l": 358.42453, "t": 289.25836, "r": 359.80386, "b": 290.99738, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 120, "label": "text", "bbox": {"l": 360.49353, "t": 289.25836, "r": 386.70093, "b": 290.99738, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 165, "text": "If the image is not clear to both eyes", "bbox": {"l": 360.49353, "t": 289.25836, "r": 386.70093, "b": 290.99738, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 121, "label": "text", "bbox": {"l": 358.42453, "t": 290.86855999999995, "r": 388.03534, "b": 292.6076, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 166, "text": " at the same time, the diopter ring may", "bbox": {"l": 358.42453, "t": 290.86855999999995, "r": 388.03534, "b": 292.6076, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 122, "label": "text", "bbox": {"l": 358.42453, "t": 292.47879, "r": 373.13724, "b": 294.2178, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 167, "text": " need adjustment.", "bbox": {"l": 358.42453, "t": 292.47879, "r": 373.13724, "b": 294.2178, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 123, "label": "text", "bbox": {"l": 358.42453, "t": 295.69922, "r": 381.74539, "b": 297.43823, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 168, "text": "DIOPTER RING ADJUSTMENT", "bbox": {"l": 358.42453, "t": 295.69922, "r": 381.74539, "b": 297.43823, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 124, "label": "text", "bbox": {"l": 358.42453, "t": 297.30942, "r": 359.83682, "b": 299.04846, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 169, "text": "1.", "bbox": {"l": 358.42453, "t": 297.30942, "r": 359.83682, "b": 299.04846, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 125, "label": "text", "bbox": {"l": 360.54297, "t": 297.30942, "r": 388.08289, "b": 299.04846, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 170, "text": "To adjust the eyepiece for viewing with", "bbox": {"l": 360.54297, "t": 297.30942, "r": 388.08289, "b": 299.04846, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 126, "label": "text", "bbox": {"l": 358.42453, "t": 298.91965, "r": 382.73251, "b": 300.65866, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 171, "text": " or without eyeglasses and for ", "bbox": {"l": 358.42453, "t": 298.91965, "r": 382.73251, "b": 300.65866, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 127, "label": "text", "bbox": {"l": 358.42453, "t": 300.52985, "r": 387.72266, "b": 302.26889000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 172, "text": " differences in acuity between the right", "bbox": {"l": 358.42453, "t": 300.52985, "r": 387.72266, "b": 302.26889000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 128, "label": "text", "bbox": {"l": 358.42453, "t": 302.14008000000007, "r": 384.1991, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 173, "text": " and left eyes, follow the following", "bbox": {"l": 358.42453, "t": 302.14008000000007, "r": 384.1991, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 129, "label": "text", "bbox": {"l": 358.42453, "t": 303.75027, "r": 364.88672, "b": 305.48932, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 174, "text": " steps:", "bbox": {"l": 358.42453, "t": 303.75027, "r": 364.88672, "b": 305.48932, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 130, "label": "text", "bbox": {"l": 358.42453, "t": 305.3605, "r": 359.95078, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 175, "text": "a.", "bbox": {"l": 358.42453, "t": 305.3605, "r": 359.95078, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 131, "label": "text", "bbox": {"l": 361.47699, "t": 305.3605, "r": 386.65988, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 176, "text": "Observe an image through the left", "bbox": {"l": 361.47699, "t": 305.3605, "r": 386.65988, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 132, "label": "text", "bbox": {"l": 358.42453, "t": 306.9707, "r": 386.7634, "b": 308.70975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 177, "text": " eyepiece and bring a specific point", "bbox": {"l": 358.42453, "t": 306.9707, "r": 386.7634, "b": 308.70975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 133, "label": "text", "bbox": {"l": 358.42453, "t": 308.58093, "r": 385.41354, "b": 310.31995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 178, "text": " into focus using the focus knob.", "bbox": {"l": 358.42453, "t": 308.58093, "r": 385.41354, "b": 310.31995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 134, "label": "text", "bbox": {"l": 358.42453, "t": 310.19113, "r": 359.93304, "b": 311.93018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 179, "text": "b.", "bbox": {"l": 358.42453, "t": 310.19113, "r": 359.93304, "b": 311.93018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 135, "label": "text", "bbox": {"l": 361.44156, "t": 310.19113, "r": 382.56085, "b": 311.93018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 180, "text": "By turning the diopter ring ", "bbox": {"l": 361.44156, "t": 310.19113, "r": 382.56085, "b": 311.93018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 136, "label": "text", "bbox": {"l": 358.42596, "t": 311.80136, "r": 385.4559, "b": 313.54037, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 181, "text": " adjustment for the left eyepiece,", "bbox": {"l": 358.42596, "t": 311.80136, "r": 385.4559, "b": 313.54037, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 137, "label": "text", "bbox": {"l": 358.42596, "t": 313.41156, "r": 384.56122, "b": 315.15059999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 182, "text": " bring the same point into sharp", "bbox": {"l": 358.42596, "t": 313.41156, "r": 384.56122, "b": 315.15059999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 138, "label": "text", "bbox": {"l": 358.42596, "t": 315.02178999999995, "r": 366.74371, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 183, "text": " focus.", "bbox": {"l": 358.42596, "t": 315.02178999999995, "r": 366.74371, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 139, "label": "text", "bbox": {"l": 358.42596, "t": 316.63199, "r": 383.93884, "b": 318.37103, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 184, "text": " c.Then bring the same point into", "bbox": {"l": 358.42596, "t": 316.63199, "r": 383.93884, "b": 318.37103, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 140, "label": "text", "bbox": {"l": 358.42596, "t": 318.2422199999999, "r": 385.69241, "b": 319.9812299999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 185, "text": " focus through the right eyepiece", "bbox": {"l": 358.42596, "t": 318.2422199999999, "r": 385.69241, "b": 319.9812299999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 141, "label": "text", "bbox": {"l": 358.42596, "t": 319.85242000000005, "r": 385.94861, "b": 321.59146, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 186, "text": " by turning the right diopter ring.", "bbox": {"l": 358.42596, "t": 319.85242000000005, "r": 385.94861, "b": 321.59146, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 142, "label": "text", "bbox": {"l": 358.42596, "t": 321.46265, "r": 385.54236, "b": 323.20166, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 187, "text": " d.With more than one viewer, each", "bbox": {"l": 358.42596, "t": 321.46265, "r": 385.54236, "b": 323.20166, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 143, "label": "text", "bbox": {"l": 358.42596, "t": 323.07285, "r": 382.98718, "b": 324.81189, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 188, "text": " viewer should note their own", "bbox": {"l": 358.42596, "t": 323.07285, "r": 382.98718, "b": 324.81189, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 144, "label": "text", "bbox": {"l": 358.42596, "t": 324.68307000000004, "r": 385.06448, "b": 326.42209, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 189, "text": " diopter ring position for the left", "bbox": {"l": 358.42596, "t": 324.68307000000004, "r": 385.06448, "b": 326.42209, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 145, "label": "text", "bbox": {"l": 358.42596, "t": 326.29327, "r": 385.20682, "b": 328.03232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 190, "text": " and right eyepieces, then before", "bbox": {"l": 358.42596, "t": 326.29327, "r": 385.20682, "b": 328.03232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 146, "label": "text", "bbox": {"l": 358.42596, "t": 327.9035, "r": 382.21964, "b": 329.64252, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 191, "text": " viewing set the diopter ring", "bbox": {"l": 358.42596, "t": 327.9035, "r": 382.21964, "b": 329.64252, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 147, "label": "text", "bbox": {"l": 358.42596, "t": 329.5137, "r": 382.63382, "b": 331.25275, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 192, "text": " adjustments to that setting.", "bbox": {"l": 358.42596, "t": 329.5137, "r": 382.63382, "b": 331.25275, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 148, "label": "text", "bbox": {"l": 358.42596, "t": 332.73412999999994, "r": 375.67661, "b": 334.47317999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 193, "text": "CHANGING THE BULB", "bbox": {"l": 358.42596, "t": 332.73412999999994, "r": 375.67661, "b": 334.47317999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 149, "label": "text", "bbox": {"l": 358.42596, "t": 334.34436, "r": 359.90311, "b": 336.08337, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 194, "text": "1.", "bbox": {"l": 358.42596, "t": 334.34436, "r": 359.90311, "b": 336.08337, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 150, "label": "text", "bbox": {"l": 360.64169, "t": 334.34436, "r": 385.75333, "b": 336.08337, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 195, "text": "Disconnect the power cord from the", "bbox": {"l": 360.64169, "t": 334.34436, "r": 385.75333, "b": 336.08337, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 151, "label": "text", "bbox": {"l": 358.42596, "t": 335.95456, "r": 372.01416, "b": 337.6936, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 196, "text": " electrical outlet.", "bbox": {"l": 358.42596, "t": 335.95456, "r": 372.01416, "b": 337.6936, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 152, "label": "text", "bbox": {"l": 358.42596, "t": 337.56479, "r": 359.88327, "b": 339.3038, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 197, "text": "2.", "bbox": {"l": 358.42596, "t": 337.56479, "r": 359.88327, "b": 339.3038, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 153, "label": "text", "bbox": {"l": 360.61191, "t": 337.56479, "r": 384.65726, "b": 339.3038, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 198, "text": "When the bulb is cool, remove the", "bbox": {"l": 360.61191, "t": 337.56479, "r": 384.65726, "b": 339.3038, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 154, "label": "text", "bbox": {"l": 358.42596, "t": 339.17499, "r": 385.33649, "b": 340.9140300000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 199, "text": " oblique illuminator cap and remove", "bbox": {"l": 358.42596, "t": 339.17499, "r": 385.33649, "b": 340.9140300000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 155, "label": "text", "bbox": {"l": 358.42596, "t": 340.78522, "r": 379.57224, "b": 342.52423, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 200, "text": " the halogen bulb with cap.", "bbox": {"l": 358.42596, "t": 340.78522, "r": 379.57224, "b": 342.52423, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 156, "label": "text", "bbox": {"l": 358.4274, "t": 342.39542, "r": 359.91788, "b": 344.13446000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 201, "text": "3.", "bbox": {"l": 358.4274, "t": 342.39542, "r": 359.91788, "b": 344.13446000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 157, "label": "text", "bbox": {"l": 360.66312, "t": 342.39542, "r": 384.5108, "b": 344.13446000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 202, "text": "Replace with a new halogen bulb.", "bbox": {"l": 360.66312, "t": 342.39542, "r": 384.5108, "b": 344.13446000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 158, "label": "text", "bbox": {"l": 358.42883, "t": 344.00565000000006, "r": 359.92792, "b": 345.74466, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 203, "text": "4.", "bbox": {"l": 358.42883, "t": 344.00565000000006, "r": 359.92792, "b": 345.74466, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 159, "label": "text", "bbox": {"l": 360.67746, "t": 344.00565000000006, "r": 385.41235, "b": 345.74466, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 204, "text": "Open the window in the base plate", "bbox": {"l": 360.67746, "t": 344.00565000000006, "r": 385.41235, "b": 345.74466, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 160, "label": "text", "bbox": {"l": 358.42883, "t": 345.61584, "r": 383.2782, "b": 347.35489, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 205, "text": " and replace the halogen lamp or", "bbox": {"l": 358.42883, "t": 345.61584, "r": 383.2782, "b": 347.35489, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 161, "label": "text", "bbox": {"l": 358.42883, "t": 347.22607, "r": 383.13953, "b": 348.96509, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 206, "text": " fluorescent lamp of transmitted", "bbox": {"l": 358.42883, "t": 347.22607, "r": 383.13953, "b": 348.96509, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 162, "label": "text", "bbox": {"l": 358.42883, "t": 348.83627, "r": 368.43472, "b": 350.57532, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 207, "text": " illuminator.", "bbox": {"l": 358.42883, "t": 348.83627, "r": 368.43472, "b": 350.57532, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 163, "label": "text", "bbox": {"l": 326.59567, "t": 261.14185, "r": 339.11377, "b": 262.88091999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 208, "text": "Model AY11230", "bbox": {"l": 326.59567, "t": 261.14185, "r": 339.11377, "b": 262.88091999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 164, "label": "text", "bbox": {"l": 358.48605, "t": 261.14185, "r": 371.00415, "b": 262.88091999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 209, "text": "Model AY11234", "bbox": {"l": 358.48605, "t": 261.14185, "r": 371.00415, "b": 262.88091999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 165, "label": "text", "bbox": {"l": 455.43533, "t": 351.77038999999996, "r": 457.97827000000007, "b": 353.94415, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 210, "text": "14", "bbox": {"l": 455.43533, "t": 351.77038999999996, "r": 457.97827000000007, "b": 353.94415, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 166, "label": "text", "bbox": {"l": 408.24518, "t": 275.52673000000004, "r": 414.4234, "b": 276.96020999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 211, "text": "Objectives", "bbox": {"l": 408.24518, "t": 275.52673000000004, "r": 414.4234, "b": 276.96020999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 167, "label": "text", "bbox": {"l": 409.39554, "t": 268.98235999999997, "r": 419.06677, "b": 270.41583, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 212, "text": "Revolving Turret", "bbox": {"l": 409.39554, "t": 268.98235999999997, "r": 419.06677, "b": 270.41583, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 168, "label": "text", "bbox": {"l": 441.3895, "t": 279.12627999999995, "r": 445.87192, "b": 280.55975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 213, "text": "Coarse ", "bbox": {"l": 441.3895, "t": 279.12627999999995, "r": 445.87192, "b": 280.55975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 169, "label": "text", "bbox": {"l": 441.3895, "t": 280.30609, "r": 448.22338999999994, "b": 281.7395900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 214, "text": "Adjustment", "bbox": {"l": 441.3895, "t": 280.30609, "r": 448.22338999999994, "b": 281.7395900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 170, "label": "text", "bbox": {"l": 441.3895, "t": 281.48593, "r": 444.40371999999996, "b": 282.91939999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 215, "text": "Knob", "bbox": {"l": 441.3895, "t": 281.48593, "r": 444.40371999999996, "b": 282.91939999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 171, "label": "text", "bbox": {"l": 398.79288, "t": 254.94646999999998, "r": 428.91568, "b": 258.85931000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 216, "text": "MODEL AY11236", "bbox": {"l": 398.79288, "t": 254.94646999999998, "r": 428.91568, "b": 258.85931000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 172, "label": "text", "bbox": {"l": 398.32535, "t": 305.04291, "r": 435.93542, "b": 308.95572000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 217, "text": "MICROSCOPE USAGE", "bbox": {"l": 398.32535, "t": 305.04291, "r": 435.93542, "b": 308.95572000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 173, "label": "text", "bbox": {"l": 398.08594, "t": 310.35892, "r": 453.72171, "b": 312.53271, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 218, "text": "BARSKA Model AY11236 is a powerful fixed power compound ", "bbox": {"l": 398.08594, "t": 310.35892, "r": 453.72171, "b": 312.53271, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 174, "label": "text", "bbox": {"l": 398.08594, "t": 312.50586, "r": 453.09939999999995, "b": 314.67966, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 219, "text": "microscope designed for biological studies such as specimen ", "bbox": {"l": 398.08594, "t": 312.50586, "r": 453.09939999999995, "b": 314.67966, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 175, "label": "text", "bbox": {"l": 398.08594, "t": 314.6528, "r": 456.65246999999994, "b": 316.8266, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 220, "text": "examination. It can also be used for examining bacteria and", "bbox": {"l": 398.08594, "t": 314.6528, "r": 456.65246999999994, "b": 316.8266, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 176, "label": "text", "bbox": {"l": 398.08594, "t": 316.79977, "r": 456.73859000000004, "b": 318.97354, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 221, "text": "for general clinical and medical studies and other scientific uses. ", "bbox": {"l": 398.08594, "t": 316.79977, "r": 456.73859000000004, "b": 318.97354, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 177, "label": "text", "bbox": {"l": 398.62399, "t": 320.42941, "r": 427.77472, "b": 324.34222000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 222, "text": "CONSTRUCTION", "bbox": {"l": 398.62399, "t": 320.42941, "r": 427.77472, "b": 324.34222000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 178, "label": "text", "bbox": {"l": 398.08594, "t": 326.46069000000006, "r": 456.02639999999997, "b": 328.63449, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 223, "text": "BARSKA Model AY11236 is a fixed power compound microscope.", "bbox": {"l": 398.08594, "t": 326.46069000000006, "r": 456.02639999999997, "b": 328.63449, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 179, "label": "text", "bbox": {"l": 398.08414, "t": 328.6076699999999, "r": 455.42238999999995, "b": 330.7814599999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 224, "text": "It is constructed with two optical paths at the same angle. It is ", "bbox": {"l": 398.08414, "t": 328.6076699999999, "r": 455.42238999999995, "b": 330.7814599999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 180, "label": "text", "bbox": {"l": 398.08414, "t": 330.75461, "r": 457.39844, "b": 332.92841, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 225, "text": "equipped with transmitted illumination. By using this instrument, ", "bbox": {"l": 398.08414, "t": 330.75461, "r": 457.39844, "b": 332.92841, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 181, "label": "text", "bbox": {"l": 398.08414, "t": 332.90155, "r": 453.97745, "b": 335.07535000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 226, "text": "the user can observe specimens at magnification from 40x to ", "bbox": {"l": 398.08414, "t": 332.90155, "r": 453.97745, "b": 335.07535000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 182, "label": "text", "bbox": {"l": 398.08414, "t": 335.04852, "r": 454.70708999999994, "b": 337.22232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 227, "text": "1000x by selecting the desired objective lens. Coarse and fine ", "bbox": {"l": 398.08414, "t": 335.04852, "r": 454.70708999999994, "b": 337.22232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 183, "label": "text", "bbox": {"l": 398.08414, "t": 337.19547, "r": 458.90240000000006, "b": 339.36926, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 228, "text": "focus adjustments provide accuracy and image detail. The rotating ", "bbox": {"l": 398.08414, "t": 337.19547, "r": 458.90240000000006, "b": 339.36926, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 184, "label": "text", "bbox": {"l": 398.08594, "t": 339.34241, "r": 453.0672, "b": 341.5162, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 229, "text": "head allows the user to position the eyepieces for maximum ", "bbox": {"l": 398.08594, "t": 339.34241, "r": 453.0672, "b": 341.5162, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 185, "label": "text", "bbox": {"l": 398.08594, "t": 341.48938, "r": 449.63113, "b": 343.66318, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 230, "text": "viewing comfort and easy access to all adjustment knobs.", "bbox": {"l": 398.08594, "t": 341.48938, "r": 449.63113, "b": 343.66318, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 186, "label": "text", "bbox": {"l": 422.10626, "t": 301.24191, "r": 434.62433000000004, "b": 302.98096, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 231, "text": "Model AY11236", "bbox": {"l": 422.10626, "t": 301.24191, "r": 434.62433000000004, "b": 302.98096, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 187, "label": "text", "bbox": {"l": 442.01610999999997, "t": 283.08649, "r": 444.8817399999999, "b": 284.51996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 232, "text": "Fine ", "bbox": {"l": 442.01610999999997, "t": 283.08649, "r": 444.8817399999999, "b": 284.51996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 188, "label": "text", "bbox": {"l": 442.01610999999997, "t": 284.2663, "r": 448.85001, "b": 285.69980000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 233, "text": "Adjustment", "bbox": {"l": 442.01610999999997, "t": 284.2663, "r": 448.85001, "b": 285.69980000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 189, "label": "text", "bbox": {"l": 442.01610999999997, "t": 285.44611, "r": 445.03033000000005, "b": 286.87961, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 234, "text": "Knob", "bbox": {"l": 442.01610999999997, "t": 285.44611, "r": 445.03033000000005, "b": 286.87961, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 190, "label": "text", "bbox": {"l": 408.00577, "t": 279.12579000000005, "r": 411.42212, "b": 280.5593, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 235, "text": "Stage", "bbox": {"l": 408.00577, "t": 279.12579000000005, "r": 411.42212, "b": 280.5593, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 191, "label": "text", "bbox": {"l": 404.07172, "t": 280.9144299999999, "r": 410.77707, "b": 282.3479, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 236, "text": "Condenser ", "bbox": {"l": 404.07172, "t": 280.9144299999999, "r": 410.77707, "b": 282.3479, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 192, "label": "text", "bbox": {"l": 404.07172, "t": 282.09424, "r": 409.2157, "b": 283.52774, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 237, "text": "Focusing", "bbox": {"l": 404.07172, "t": 282.09424, "r": 409.2157, "b": 283.52774, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 193, "label": "text", "bbox": {"l": 404.07172, "t": 283.27408, "r": 407.08594, "b": 284.7075500000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 238, "text": "Knob", "bbox": {"l": 404.07172, "t": 283.27408, "r": 407.08594, "b": 284.7075500000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 194, "label": "text", "bbox": {"l": 441.81281, "t": 262.32178, "r": 447.03702, "b": 263.75525000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 239, "text": "Eyepiece", "bbox": {"l": 441.81281, "t": 262.32178, "r": 447.03702, "b": 263.75525000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 195, "label": "text", "bbox": {"l": 437.34607, "t": 271.13025000000005, "r": 440.80496, "b": 272.56281, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 240, "text": "Stand", "bbox": {"l": 437.34607, "t": 271.13025000000005, "r": 440.80496, "b": 272.56281, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 196, "label": "text", "bbox": {"l": 409.7164, "t": 284.40027, "r": 413.3768, "b": 285.83282, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 241, "text": "Lamp ", "bbox": {"l": 409.7164, "t": 284.40027, "r": 413.3768, "b": 285.83282, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 197, "label": "text", "bbox": {"l": 409.7164, "t": 285.83163, "r": 413.68201, "b": 287.26416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 242, "text": "On/Off", "bbox": {"l": 409.7164, "t": 285.83163, "r": 413.68201, "b": 287.26416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 198, "label": "text", "bbox": {"l": 409.7164, "t": 287.263, "r": 413.6337, "b": 288.69553, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 243, "text": "Switch", "bbox": {"l": 409.7164, "t": 287.263, "r": 413.6337, "b": 288.69553, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 199, "label": "text", "bbox": {"l": 434.8712499999999, "t": 296.7153, "r": 438.53164999999996, "b": 298.14783, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 244, "text": "Lamp ", "bbox": {"l": 434.8712499999999, "t": 296.7153, "r": 438.53164999999996, "b": 298.14783, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 200, "label": "text", "bbox": {"l": 439.52039, "t": 292.18307000000004, "r": 443.08768, "b": 293.61560000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 245, "text": "Power", "bbox": {"l": 439.52039, "t": 292.18307000000004, "r": 443.08768, "b": 293.61560000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 201, "label": "text", "bbox": {"l": 439.52039, "t": 293.61444, "r": 442.29575, "b": 295.04697, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 246, "text": "Cord", "bbox": {"l": 439.52039, "t": 293.61444, "r": 442.29575, "b": 295.04697, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 202, "label": "text", "bbox": {"l": 413.55829, "t": 264.66089, "r": 421.94913, "b": 266.09344, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 247, "text": "Rotating Head", "bbox": {"l": 413.55829, "t": 264.66089, "r": 421.94913, "b": 266.09344, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 203, "label": "text", "bbox": {"l": 441.84316999999993, "t": 286.90573, "r": 447.87585000000007, "b": 288.33826, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 248, "text": "Stage Clip", "bbox": {"l": 441.84316999999993, "t": 286.90573, "r": 447.87585000000007, "b": 288.33826, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 204, "label": "text", "bbox": {"l": 441.84316999999993, "t": 288.3371, "r": 448.67252, "b": 289.76962000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 249, "text": "Adjustment", "bbox": {"l": 441.84316999999993, "t": 288.3371, "r": 448.67252, "b": 289.76962000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 205, "label": "text", "bbox": {"l": 407.2403, "t": 259.86645999999996, "r": 425.79089, "b": 261.29895, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 250, "text": "Interpupillary Slide Adjustment", "bbox": {"l": 407.2403, "t": 259.86645999999996, "r": 425.79089, "b": 261.29895, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 206, "label": "text", "bbox": {"l": 449.10074000000003, "t": 378.66302, "r": 466.08835000000005, "b": 380.78412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 251, "text": "Circling Minimums", "bbox": {"l": 449.10074000000003, "t": 378.66302, "r": 466.08835000000005, "b": 380.78412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 207, "label": "text", "bbox": {"l": 449.10074000000003, "t": 383.2203999999999, "r": 449.64444, "b": 385.34148999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 252, "text": "7", "bbox": {"l": 449.10074000000003, "t": 383.2203999999999, "r": 449.64444, "b": 385.34148999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 208, "label": "text", "bbox": {"l": 450.18811, "t": 383.2203999999999, "r": 550.77124, "b": 385.34148999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 253, "text": "K H U H Z D V D F K D Q J H W R W K H 7 ( 5 3 6 F U L W H U L D L Q W K D W D \u1087H F W V F L U F O L Q J D U H D G L P H Q V L R Q E \\ H [ S D Q G L Q J W K H D U H D V W R S U R Y L G H ", "bbox": {"l": 450.18811, "t": 383.2203999999999, "r": 550.77124, "b": 385.34148999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 209, "label": "text", "bbox": {"l": 449.10074000000003, "t": 385.75732, "r": 536.14716, "b": 387.87842, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 254, "text": "improved obstacle protection. To indicate that the new criteria had been applied to a given procedure, a ", "bbox": {"l": 449.10074000000003, "t": 385.75732, "r": 536.14716, "b": 387.87842, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 210, "label": "text", "bbox": {"l": 538.31085, "t": 385.75732, "r": 549.49921, "b": 387.87842, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 255, "text": " is placed on ", "bbox": {"l": 538.31085, "t": 385.75732, "r": 549.49921, "b": 387.87842, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 211, "label": "text", "bbox": {"l": 449.10074000000003, "t": 388.03601, "r": 547.58185, "b": 390.1571, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 256, "text": "the circling line of minimums. The new circling tables and explanatory information is located in the Legend of the TPP.", "bbox": {"l": 449.10074000000003, "t": 388.03601, "r": 547.58185, "b": 390.1571, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 212, "label": "text", "bbox": {"l": 449.10074000000003, "t": 393.2128000000001, "r": 449.6163, "b": 395.33386, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 257, "text": "7", "bbox": {"l": 449.10074000000003, "t": 393.2128000000001, "r": 449.6163, "b": 395.33386, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 213, "label": "text", "bbox": {"l": 450.1319, "t": 393.2128000000001, "r": 529.53082, "b": 395.33386, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 258, "text": "K H D S S U R D F K H V X V L Q J V W D Q G D U G F L U F O L Q J D S S U R D F K D U H D V F D Q E H L G H Q W L \u00bf H G E \\ W K H D E V H Q F H R I W K H ", "bbox": {"l": 450.1319, "t": 393.2128000000001, "r": 529.53082, "b": 395.33386, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 214, "label": "text", "bbox": {"l": 532.05829, "t": 393.2128000000001, "r": 550.42261, "b": 395.33386, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 259, "text": " on the circling line of ", "bbox": {"l": 532.05829, "t": 393.2128000000001, "r": 550.42261, "b": 395.33386, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 215, "label": "text", "bbox": {"l": 449.10074000000003, "t": 395.49149, "r": 455.74692, "b": 397.61255, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 260, "text": "minima.", "bbox": {"l": 449.10074000000003, "t": 395.49149, "r": 455.74692, "b": 397.61255, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 216, "label": "text", "bbox": {"l": 449.95525999999995, "t": 415.59549, "r": 496.2829, "b": 417.50446, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 261, "text": "$ S S O \\ 6 W D Q G D U G & L U F O L Q J $ S S U R D F K 0 D Q H X Y H U L Q J 5 D G L X V 7 D E O H ", "bbox": {"l": 449.95525999999995, "t": 415.59549, "r": 496.2829, "b": 417.50446, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 217, "label": "text", "bbox": {"l": 501.13077, "t": 409.25543, "r": 551.16101, "b": 411.1644, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 262, "text": "$ S S O \\ ( [ S D Q G H G & L U F O L Q J $ S S U R D F K 0 D Q H X Y H U L Q J $ L U V S D F H 5 D G L X V ", "bbox": {"l": 501.13077, "t": 409.25543, "r": 551.16101, "b": 411.1644, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 218, "label": "text", "bbox": {"l": 501.13077, "t": 411.30624, "r": 505.2477999999999, "b": 413.21521, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 263, "text": "Table", "bbox": {"l": 501.13077, "t": 411.30624, "r": 505.2477999999999, "b": 413.21521, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 219, "label": "text", "bbox": {"l": 449.10074000000003, "t": 420.18802, "r": 469.35599, "b": 422.73331, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 264, "text": "AIRPORT SKETCH", "bbox": {"l": 449.10074000000003, "t": 420.18802, "r": 469.35599, "b": 422.73331, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 220, "label": "text", "bbox": {"l": 449.10074000000003, "t": 425.08908, "r": 525.93616, "b": 427.21017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 265, "text": "The airport sketch is a depiction of the airport with emphasis on runway pattern and related ", "bbox": {"l": 449.10074000000003, "t": 425.08908, "r": 525.93616, "b": 427.21017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 221, "label": "text", "bbox": {"l": 449.10074000000003, "t": 427.3678, "r": 522.0343, "b": 429.48886, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 266, "text": "information, positioned in either the lower left or lower right corner of the chart to aid pi-", "bbox": {"l": 449.10074000000003, "t": 427.3678, "r": 522.0343, "b": 429.48886, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 222, "label": "text", "bbox": {"l": 449.10074000000003, "t": 429.64648, "r": 524.67151, "b": 431.76755, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 267, "text": "lot recognition of the airport from the air and to provide some information to aid on ground ", "bbox": {"l": 449.10074000000003, "t": 429.64648, "r": 524.67151, "b": 431.76755, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 223, "label": "text", "bbox": {"l": 449.10074000000003, "t": 431.92514000000006, "r": 527.172, "b": 434.04623, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 268, "text": "navigation of the airport. The runways are drawn to scale and oriented to true north. Runway ", "bbox": {"l": 449.10074000000003, "t": 431.92514000000006, "r": 527.172, "b": 434.04623, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 224, "label": "text", "bbox": {"l": 449.10074000000003, "t": 434.20383, "r": 502.39545, "b": 436.32492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 269, "text": "dimensions (length and width) are shown for all active runways.", "bbox": {"l": 449.10074000000003, "t": 434.20383, "r": 502.39545, "b": 436.32492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 225, "label": "text", "bbox": {"l": 449.10074000000003, "t": 438.7611999999999, "r": 512.92676, "b": 440.88228999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 270, "text": "Runway(s) are depicted based on what type and construction of the runway.", "bbox": {"l": 449.10074000000003, "t": 438.7611999999999, "r": 512.92676, "b": 440.88228999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 226, "label": "text", "bbox": {"l": 449.95525999999995, "t": 444.07001, "r": 460.02307, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 271, "text": "Hard Surface", "bbox": {"l": 449.95525999999995, "t": 444.07001, "r": 460.02307, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 227, "label": "text", "bbox": {"l": 464.89963, "t": 444.07001, "r": 473.98819, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 272, "text": "Other Than ", "bbox": {"l": 464.89963, "t": 444.07001, "r": 473.98819, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 228, "label": "text", "bbox": {"l": 464.89963, "t": 446.12085, "r": 474.96744, "b": 448.02979, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 273, "text": "Hard Surface", "bbox": {"l": 464.89963, "t": 446.12085, "r": 474.96744, "b": 448.02979, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 229, "label": "text", "bbox": {"l": 478.91357, "t": 444.07001, "r": 489.45648, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 274, "text": "Metal Surface", "bbox": {"l": 478.91357, "t": 444.07001, "r": 489.45648, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 230, "label": "text", "bbox": {"l": 493.06420999999995, "t": 444.07001, "r": 505.03076, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 275, "text": "Closed Runway", "bbox": {"l": 493.06420999999995, "t": 444.07001, "r": 505.03076, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 231, "label": "text", "bbox": {"l": 509.5809, "t": 444.07001, "r": 524.30237, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 276, "text": "Under Construction", "bbox": {"l": 509.5809, "t": 444.07001, "r": 524.30237, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 232, "label": "text", "bbox": {"l": 449.95525999999995, "t": 454.81207, "r": 458.31406, "b": 456.72104, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 277, "text": "Stopways, ", "bbox": {"l": 449.95525999999995, "t": 454.81207, "r": 458.31406, "b": 456.72104, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 233, "label": "text", "bbox": {"l": 449.95525999999995, "t": 456.86288, "r": 461.92083999999994, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 278, "text": "Taxiways, Park-", "bbox": {"l": 449.95525999999995, "t": 456.86288, "r": 461.92083999999994, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 234, "label": "text", "bbox": {"l": 449.95525999999995, "t": 458.91373, "r": 457.08014, "b": 460.82268999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 279, "text": "ing Areas", "bbox": {"l": 449.95525999999995, "t": 458.91373, "r": 457.08014, "b": 460.82268999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 235, "label": "text", "bbox": {"l": 464.89963, "t": 454.81207, "r": 472.87732, "b": 456.72104, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 280, "text": "Displaced ", "bbox": {"l": 464.89963, "t": 454.81207, "r": 472.87732, "b": 456.72104, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 236, "label": "text", "bbox": {"l": 464.89963, "t": 456.86288, "r": 472.49792, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 281, "text": "Threshold", "bbox": {"l": 464.89963, "t": 456.86288, "r": 472.49792, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 237, "label": "text", "bbox": {"l": 478.91357, "t": 454.81207, "r": 483.61584, "b": 456.72104, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 282, "text": "Closed", "bbox": {"l": 478.91357, "t": 454.81207, "r": 483.61584, "b": 456.72104, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 238, "label": "text", "bbox": {"l": 478.91357, "t": 456.86288, "r": 486.60754000000003, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 283, "text": "Pavement", "bbox": {"l": 478.91357, "t": 456.86288, "r": 486.60754000000003, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 239, "label": "text", "bbox": {"l": 493.06420999999995, "t": 454.81207, "r": 504.20648, "b": 456.72104, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 284, "text": "Water Runway", "bbox": {"l": 493.06420999999995, "t": 454.81207, "r": 504.20648, "b": 456.72104, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 240, "label": "text", "bbox": {"l": 449.10074000000003, "t": 469.32974, "r": 548.59674, "b": 471.45081, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 285, "text": "Taxiways and aprons are shaded grey. Other runway features that may be shown are runway numbers, runway dimen-", "bbox": {"l": 449.10074000000003, "t": 469.32974, "r": 548.59674, "b": 471.45081, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 241, "label": "text", "bbox": {"l": 449.10074000000003, "t": 471.60843, "r": 500.08181999999994, "b": 473.72949, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 286, "text": "sions, runway slope, arresting gear, and displaced threshold.", "bbox": {"l": 449.10074000000003, "t": 471.60843, "r": 500.08181999999994, "b": 473.72949, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 242, "label": "text", "bbox": {"l": 449.10074000000003, "t": 476.16577, "r": 449.59933000000007, "b": 478.28687, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 287, "text": "2", "bbox": {"l": 449.10074000000003, "t": 476.16577, "r": 449.59933000000007, "b": 478.28687, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 243, "label": "text", "bbox": {"l": 450.09796, "t": 476.16577, "r": 547.82562, "b": 478.28687, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 288, "text": "W K H U L Q I R U P D W L R Q F R Q F H U Q L Q J O L J K W L Q J \u00bf Q D O D S S U R D F K E H D U L Q J V D L U S R U W E H D F R Q R E V W D F O H V F R Q W U R O W R Z H U 1 $ 9 $ , ' V K H O L ", "bbox": {"l": 450.09796, "t": 476.16577, "r": 547.82562, "b": 478.28687, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 244, "label": "text", "bbox": {"l": 547.82623, "t": 476.16577, "r": 548.45862, "b": 478.28687, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 289, "text": "-", "bbox": {"l": 547.82623, "t": 476.16577, "r": 548.45862, "b": 478.28687, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 245, "label": "text", "bbox": {"l": 449.10074000000003, "t": 478.44446, "r": 470.52609000000007, "b": 480.56555, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 290, "text": "pads may also be shown.", "bbox": {"l": 449.10074000000003, "t": 478.44446, "r": 470.52609000000007, "b": 480.56555, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 246, "label": "text", "bbox": {"l": 449.10074000000003, "t": 483.00183, "r": 493.37906000000004, "b": 485.12292, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 291, "text": "$ L U S R U W ( O H Y D W L R Q D Q G 7 R X F K G R Z Q = R Q H ( O H Y D W L R Q ", "bbox": {"l": 449.10074000000003, "t": 483.00183, "r": 493.37906000000004, "b": 485.12292, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 449.10074000000003, "t": 487.5592, "r": 551.80023, "b": 496.51636, "coord_origin": "TOPLEFT"}, "confidence": 0.5027860403060913, "cells": [{"id": 292, "text": "The airport elevation is shown enclosed within a box in the upper left corner of the sketch box and the touchdown zone ", "bbox": {"l": 449.10074000000003, "t": 487.5592, "r": 549.16168, "b": 489.6803, "coord_origin": "TOPLEFT"}}, {"id": 293, "text": "elevation (TDZE) is shown in the upper right corner of the sketch box. The airport elevation is the highest point of an ", "bbox": {"l": 449.10074000000003, "t": 489.83789, "r": 546.90881, "b": 491.95898, "coord_origin": "TOPLEFT"}}, {"id": 294, "text": "D L U S R U W \u00b6 V X V D E O H U X Q Z D \\ V P H D V X U H G L Q I H H W I U R P P H D Q V H D O H Y H O 7 K H 7 ' = ( L V W K H K L J K H V W H O H Y D W L R Q L Q W K H \u00bf U V W I H H W R I ", "bbox": {"l": 449.10074000000003, "t": 492.11658, "r": 551.80023, "b": 494.23767, "coord_origin": "TOPLEFT"}}, {"id": 295, "text": "the landing surface. Circling only approaches will not show a TDZE.", "bbox": {"l": 449.10074000000003, "t": 494.39526, "r": 505.85068000000007, "b": 496.51636, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 247, "label": "text", "bbox": {"l": 498.80661000000003, "t": 515.9437, "r": 502.08792, "b": 519.01764, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 296, "text": "114", "bbox": {"l": 498.80661000000003, "t": 515.9437, "r": 502.08792, "b": 519.01764, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 248, "label": "text", "bbox": {"l": 444.56319999999994, "t": 422.84869, "r": 446.25998, "b": 471.87128, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 297, "text": "FAA Chart Users\u2019 Guide - Terminal Procedures Publication (TPP) - Terms", "bbox": {"l": 444.56319999999994, "t": 422.84869, "r": 446.25998, "b": 471.87128, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 249, "label": "text", "bbox": {"l": 329.40536, "t": 379.37537, "r": 355.13138, "b": 382.13336, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 298, "text": "AGL 2013 Financial Calendar", "bbox": {"l": 329.40536, "t": 379.37537, "r": 355.13138, "b": 382.13336, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 250, "label": "text", "bbox": {"l": 329.40536, "t": 382.30273, "r": 330.96848, "b": 384.55927, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 299, "text": "22", "bbox": {"l": 329.40536, "t": 382.30273, "r": 330.96848, "b": 384.55927, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 251, "label": "text", "bbox": {"l": 331.75003, "t": 382.30273, "r": 341.12875, "b": 384.55927, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 300, "text": "August 2012 ", "bbox": {"l": 331.75003, "t": 382.30273, "r": 341.12875, "b": 384.55927, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 252, "label": "text", "bbox": {"l": 350.4722, "t": 382.30273, "r": 384.81079, "b": 384.55927, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 301, "text": "2012 full year result and fi nal dividend announced", "bbox": {"l": 350.4722, "t": 382.30273, "r": 384.81079, "b": 384.55927, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 253, "label": "text", "bbox": {"l": 329.40536, "t": 384.84552, "r": 330.97336, "b": 387.10205, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 302, "text": "30", "bbox": {"l": 329.40536, "t": 384.84552, "r": 330.97336, "b": 387.10205, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 254, "label": "text", "bbox": {"l": 331.75735, "t": 384.84552, "r": 341.16534, "b": 387.10205, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 303, "text": "August 2012 ", "bbox": {"l": 331.75735, "t": 384.84552, "r": 341.16534, "b": 387.10205, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 255, "label": "text", "bbox": {"l": 350.4722, "t": 384.84552, "r": 372.90613, "b": 387.10205, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 304, "text": "Ex-dividend trading commences", "bbox": {"l": 350.4722, "t": 384.84552, "r": 372.90613, "b": 387.10205, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 256, "label": "text", "bbox": {"l": 329.40536, "t": 387.38828, "r": 330.20337, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 305, "text": "5", "bbox": {"l": 329.40536, "t": 387.38828, "r": 330.20337, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 257, "label": "text", "bbox": {"l": 331.00137, "t": 387.38828, "r": 342.9715, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 306, "text": "September 2012 ", "bbox": {"l": 331.00137, "t": 387.38828, "r": 342.9715, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 258, "label": "text", "bbox": {"l": 350.4722, "t": 387.38828, "r": 374.88693, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 307, "text": "Record date for 2012 fi nal dividend", "bbox": {"l": 350.4722, "t": 387.38828, "r": 374.88693, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 259, "label": "text", "bbox": {"l": 329.40536, "t": 389.93103, "r": 331.0173, "b": 392.18762, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 308, "text": "27", "bbox": {"l": 329.40536, "t": 389.93103, "r": 331.0173, "b": 392.18762, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 260, "label": "text", "bbox": {"l": 331.82327, "t": 389.93103, "r": 343.91284, "b": 392.18762, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 309, "text": "September 2012 ", "bbox": {"l": 331.82327, "t": 389.93103, "r": 343.91284, "b": 392.18762, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 261, "label": "text", "bbox": {"l": 350.4722, "t": 389.93103, "r": 365.65988, "b": 392.18762, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 310, "text": "Final dividend payable", "bbox": {"l": 350.4722, "t": 389.93103, "r": 365.65988, "b": 392.18762, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 262, "label": "text", "bbox": {"l": 329.40536, "t": 392.47382, "r": 330.98804, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 311, "text": "23", "bbox": {"l": 329.40536, "t": 392.47382, "r": 330.98804, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 263, "label": "text", "bbox": {"l": 331.77936, "t": 392.47382, "r": 342.06674, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 312, "text": "October 2012 ", "bbox": {"l": 331.77936, "t": 392.47382, "r": 342.06674, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 264, "label": "text", "bbox": {"l": 350.4722, "t": 392.47382, "r": 367.22156, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 313, "text": "Annual General Meeting", "bbox": {"l": 350.4722, "t": 392.47382, "r": 367.22156, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 265, "label": "text", "bbox": {"l": 329.40536, "t": 395.0166, "r": 330.99741, "b": 397.27313, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 314, "text": "27", "bbox": {"l": 329.40536, "t": 395.0166, "r": 330.99741, "b": 397.27313, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 266, "label": "text", "bbox": {"l": 331.7934, "t": 395.0166, "r": 342.1416, "b": 397.27313, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 315, "text": "February 2013", "bbox": {"l": 331.7934, "t": 395.0166, "r": 342.1416, "b": 397.27313, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 267, "label": "text", "bbox": {"l": 342.64841, "t": 395.18298, "r": 342.65811, "b": 396.49857000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 316, "text": " 1", "bbox": {"l": 342.64841, "t": 395.18298, "r": 342.65811, "b": 396.49857000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 268, "label": "text", "bbox": {"l": 350.47177, "t": 395.01474, "r": 386.25897, "b": 397.2713, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 317, "text": "2013 interim result and interim dividend announced", "bbox": {"l": 350.47177, "t": 395.01474, "r": 386.25897, "b": 397.2713, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 269, "label": "text", "bbox": {"l": 329.40491, "t": 397.55749999999995, "r": 331.02695, "b": 399.81406, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 318, "text": "28", "bbox": {"l": 329.40491, "t": 397.55749999999995, "r": 331.02695, "b": 399.81406, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 270, "label": "text", "bbox": {"l": 331.83795, "t": 397.55749999999995, "r": 340.75909, "b": 399.81406, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 319, "text": "August 2013", "bbox": {"l": 331.83795, "t": 397.55749999999995, "r": 340.75909, "b": 399.81406, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 271, "label": "text", "bbox": {"l": 341.26437, "t": 397.7254, "r": 341.27408, "b": 399.04095, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 320, "text": " 1", "bbox": {"l": 341.26437, "t": 397.7254, "r": 341.27408, "b": 399.04095, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 272, "label": "text", "bbox": {"l": 350.47144, "t": 397.55713, "r": 385.93265, "b": 399.81369, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 321, "text": "2013 full year results and fi nal dividend announced ", "bbox": {"l": 350.47144, "t": 397.55713, "r": 385.93265, "b": 399.81369, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 273, "label": "text", "bbox": {"l": 329.40536, "t": 400.46155, "r": 329.87708, "b": 401.96588, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 322, "text": "1", "bbox": {"l": 329.40536, "t": 400.46155, "r": 329.87708, "b": 401.96588, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 274, "label": "text", "bbox": {"l": 330.34882, "t": 400.46155, "r": 358.65204, "b": 401.96588, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 323, "text": "Indicative dates only, subject to change/Board confi rmation", "bbox": {"l": 330.34882, "t": 400.46155, "r": 358.65204, "b": 401.96588, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 275, "label": "text", "bbox": {"l": 329.40536, "t": 404.34503, "r": 391.771, "b": 406.60156, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 324, "text": "AGL\u2019s Annual General Meeting will be held at the City Recital Hall, Angel Place, Sydney ", "bbox": {"l": 329.40536, "t": 404.34503, "r": 391.771, "b": 406.60156, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 276, "label": "text", "bbox": {"l": 329.40536, "t": 406.37857, "r": 369.65308, "b": 408.63513000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 325, "text": "commencing at 10.30am on Tuesday 23 October 2012.", "bbox": {"l": 329.40536, "t": 406.37857, "r": 369.65308, "b": 408.63513000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 277, "label": "text", "bbox": {"l": 363.54486, "t": 460.53054999999995, "r": 379.25955, "b": 465.54507, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 326, "text": "Ye s te rd ay", "bbox": {"l": 363.54486, "t": 460.53054999999995, "r": 379.25955, "b": 465.54507, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 278, "label": "text", "bbox": {"l": 363.54486, "t": 466.7157, "r": 391.38229, "b": 468.97223, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 327, "text": "Established in Sydney in 1837, and then ", "bbox": {"l": 363.54486, "t": 466.7157, "r": 391.38229, "b": 468.97223, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 279, "label": "text", "bbox": {"l": 363.54486, "t": 468.74924, "r": 395.01788, "b": 471.00577, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 328, "text": "known as The Australian Gas Light Company, ", "bbox": {"l": 363.54486, "t": 468.74924, "r": 395.01788, "b": 471.00577, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 280, "label": "text", "bbox": {"l": 363.54486, "t": 470.78281, "r": 394.08322, "b": 473.03934, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 329, "text": "the AGL business has an established history ", "bbox": {"l": 363.54486, "t": 470.78281, "r": 394.08322, "b": 473.03934, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 281, "label": "text", "bbox": {"l": 363.54486, "t": 472.81635, "r": 390.60727, "b": 475.07288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 330, "text": "and reputation for serving the gas and ", "bbox": {"l": 363.54486, "t": 472.81635, "r": 390.60727, "b": 475.07288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 282, "label": "text", "bbox": {"l": 363.54486, "t": 474.84988, "r": 393.49612, "b": 477.10645, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 331, "text": "electricity needs of Australian households. ", "bbox": {"l": 363.54486, "t": 474.84988, "r": 393.49612, "b": 477.10645, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 283, "label": "text", "bbox": {"l": 363.54486, "t": 476.88345, "r": 394.11481, "b": 479.13998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 332, "text": "In 1841, when AGL supplied the gas to light ", "bbox": {"l": 363.54486, "t": 476.88345, "r": 394.11481, "b": 479.13998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 284, "label": "text", "bbox": {"l": 363.54486, "t": 478.91699, "r": 393.75891, "b": 481.17352, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 333, "text": "the fi rst public street lamp, it was reported ", "bbox": {"l": 363.54486, "t": 478.91699, "r": 393.75891, "b": 481.17352, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 285, "label": "text", "bbox": {"l": 363.54486, "t": 480.95053, "r": 390.4975, "b": 483.20709, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 334, "text": "in the Sydney Gazette as a \u201cwonderful ", "bbox": {"l": 363.54486, "t": 480.95053, "r": 390.4975, "b": 483.20709, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 286, "label": "text", "bbox": {"l": 363.54486, "t": 482.9841, "r": 395.70975, "b": 485.24063, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 335, "text": "achievement of scientifi c knowledge, assisted ", "bbox": {"l": 363.54486, "t": 482.9841, "r": 395.70975, "b": 485.24063, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 287, "label": "text", "bbox": {"l": 363.54486, "t": 485.01764, "r": 394.27283, "b": 487.2742, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 336, "text": "by mechanical ingenuity.\u201d Within two years, ", "bbox": {"l": 363.54486, "t": 485.01764, "r": 394.27283, "b": 487.2742, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 288, "label": "text", "bbox": {"l": 363.54486, "t": 487.05121, "r": 396.65939, "b": 489.30774, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 337, "text": "165 gas lamps were lighting the City of Sydney.", "bbox": {"l": 363.54486, "t": 487.05121, "r": 396.65939, "b": 489.30774, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 289, "label": "text", "bbox": {"l": 329.4054, "t": 419.93124, "r": 384.19696, "b": 431.09412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 338, "text": "Looking back on ", "bbox": {"l": 329.4054, "t": 419.93124, "r": 384.19696, "b": 431.09412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 290, "label": "text", "bbox": {"l": 329.4054, "t": 430.10379, "r": 372.16626, "b": 441.26669, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 339, "text": "175 years of ", "bbox": {"l": 329.4054, "t": 430.10379, "r": 372.16626, "b": 441.26669, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 291, "label": "text", "bbox": {"l": 329.4054, "t": 440.27636999999993, "r": 385.3981, "b": 451.43924, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 340, "text": "looking forward.", "bbox": {"l": 329.4054, "t": 440.27636999999993, "r": 385.3981, "b": 451.43924, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 292, "label": "text", "bbox": {"l": 329.40536, "t": 372.16159, "r": 353.36179, "b": 373.91669, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 341, "text": "AGL Energy Limited ABN 74 115 061 375", "bbox": {"l": 329.40536, "t": 372.16159, "r": 353.36179, "b": 373.91669, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 293, "label": "text", "bbox": {"l": 546.20587, "t": 360.90448, "r": 548.23407, "b": 362.82242, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 342, "text": "29", "bbox": {"l": 546.20587, "t": 360.90448, "r": 548.23407, "b": 362.82242, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 294, "label": "text", "bbox": {"l": 497.77728, "t": 251.43384000000003, "r": 542.8255, "b": 254.94385, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 343, "text": "signs, signals and road markings", "bbox": {"l": 497.77728, "t": 251.43384000000003, "r": 542.8255, "b": 254.94385, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 295, "label": "text", "bbox": {"l": 490.30679, "t": 251.47478999999998, "r": 492.09982, "b": 254.98479999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 344, "text": "3", "bbox": {"l": 490.30679, "t": 251.47478999999998, "r": 492.09982, "b": 254.98479999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 296, "label": "text", "bbox": {"l": 498.15335, "t": 263.88922, "r": 500.05637, "b": 265.92719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 345, "text": "In ", "bbox": {"l": 498.15335, "t": 263.88922, "r": 500.05637, "b": 265.92719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 297, "label": "text", "bbox": {"l": 500.05637, "t": 263.85717999999997, "r": 524.37036, "b": 265.86310000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 346, "text": "chapter 2, you and your vehicle", "bbox": {"l": 500.05637, "t": 263.85717999999997, "r": 524.37036, "b": 265.86310000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 298, "label": "text", "bbox": {"l": 524.37036, "t": 263.88922, "r": 539.89124, "b": 265.92719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 347, "text": ", you learned about ", "bbox": {"l": 524.37036, "t": 263.88922, "r": 539.89124, "b": 265.92719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 299, "label": "text", "bbox": {"l": 498.15335, "t": 265.93224999999995, "r": 544.50403, "b": 267.97020999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 348, "text": "some of the controls in your vehicle. This chapter is a handy ", "bbox": {"l": 498.15335, "t": 265.93224999999995, "r": 544.50403, "b": 267.97020999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 300, "label": "text", "bbox": {"l": 498.15335, "t": 267.97533999999996, "r": 544.01343, "b": 270.01331000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 349, "text": "reference section that gives examples of the most common ", "bbox": {"l": 498.15335, "t": 267.97533999999996, "r": 544.01343, "b": 270.01331000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 301, "label": "text", "bbox": {"l": 498.15335, "t": 270.01831000000004, "r": 544.11987, "b": 272.05634, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 350, "text": "signs, signals and road markings that keep traffi c organized ", "bbox": {"l": 498.15335, "t": 270.01831000000004, "r": 544.11987, "b": 272.05634, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 302, "label": "text", "bbox": {"l": 498.15335, "t": 272.06140000000005, "r": 515.41071, "b": 274.09937, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 351, "text": "and flowing smoothly. ", "bbox": {"l": 498.15335, "t": 272.06140000000005, "r": 515.41071, "b": 274.09937, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 303, "label": "text", "bbox": {"l": 498.15335, "t": 277.34619, "r": 505.64642000000003, "b": 280.9357, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 352, "text": "Signs", "bbox": {"l": 498.15335, "t": 277.34619, "r": 505.64642000000003, "b": 280.9357, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 304, "label": "text", "bbox": {"l": 498.15335, "t": 281.82187, "r": 543.92957, "b": 283.85983, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 353, "text": "There are three ways to read signs: by their shape, colour and ", "bbox": {"l": 498.15335, "t": 281.82187, "r": 543.92957, "b": 283.85983, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 305, "label": "text", "bbox": {"l": 498.15335, "t": 283.8649, "r": 545.67834, "b": 285.90289, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 354, "text": "the messages printed on them. Understanding these three ways ", "bbox": {"l": 498.15335, "t": 283.8649, "r": 545.67834, "b": 285.90289, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 306, "label": "text", "bbox": {"l": 498.15335, "t": 285.90796, "r": 545.26471, "b": 287.94592, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 355, "text": "of classifying signs will help you figure out the meaning of signs ", "bbox": {"l": 498.15335, "t": 285.90796, "r": 545.26471, "b": 287.94592, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 307, "label": "text", "bbox": {"l": 498.15335, "t": 287.95099, "r": 513.31335, "b": 289.98895, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 356, "text": "that are new to you. ", "bbox": {"l": 498.15335, "t": 287.95099, "r": 513.31335, "b": 289.98895, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 308, "label": "text", "bbox": {"l": 505.43439, "t": 303.07596, "r": 508.53033000000005, "b": 304.89639, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 357, "text": "Stop", "bbox": {"l": 505.43439, "t": 303.07596, "r": 508.53033000000005, "b": 304.89639, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 309, "label": "text", "bbox": {"l": 527.45502, "t": 303.25354, "r": 541.44678, "b": 305.07397, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 358, "text": "Yield the right-of-way", "bbox": {"l": 527.45502, "t": 303.25354, "r": 541.44678, "b": 305.07397, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 310, "label": "text", "bbox": {"l": 501.79385, "t": 321.18973, "r": 510.41632, "b": 323.01016, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 359, "text": "Shows driving", "bbox": {"l": 501.79385, "t": 321.18973, "r": 510.41632, "b": 323.01016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 311, "label": "text", "bbox": {"l": 501.79385, "t": 322.87731999999994, "r": 509.04268999999994, "b": 324.69775000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 360, "text": "regulations", "bbox": {"l": 501.79385, "t": 322.87731999999994, "r": 509.04268999999994, "b": 324.69775000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 312, "label": "text", "bbox": {"l": 518.66455, "t": 319.59146, "r": 529.80902, "b": 321.41190000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 361, "text": "Explains lane use", "bbox": {"l": 518.66455, "t": 319.59146, "r": 529.80902, "b": 321.41190000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 313, "label": "text", "bbox": {"l": 534.87561, "t": 318.37616, "r": 546.95142, "b": 320.19659, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 362, "text": "School zone signs ", "bbox": {"l": 534.87561, "t": 318.37616, "r": 546.95142, "b": 320.19659, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 314, "label": "text", "bbox": {"l": 534.87561, "t": 320.0637500000001, "r": 545.05762, "b": 321.88419, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 363, "text": "are fl uorescent ", "bbox": {"l": 534.87561, "t": 320.0637500000001, "r": 545.05762, "b": 321.88419, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 315, "label": "text", "bbox": {"l": 534.87561, "t": 321.75134, "r": 543.32263, "b": 323.57178, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 364, "text": "yellow-green", "bbox": {"l": 534.87561, "t": 321.75134, "r": 543.32263, "b": 323.57178, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 316, "label": "text", "bbox": {"l": 499.21862999999996, "t": 338.12772, "r": 512.62451, "b": 339.94815, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 365, "text": "Tells about motorist ", "bbox": {"l": 499.21862999999996, "t": 338.12772, "r": 512.62451, "b": 339.94815, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 317, "label": "text", "bbox": {"l": 499.21862999999996, "t": 339.81531000000007, "r": 504.39917, "b": 341.63574, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 366, "text": "services", "bbox": {"l": 499.21862999999996, "t": 339.81531000000007, "r": 504.39917, "b": 341.63574, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 318, "label": "text", "bbox": {"l": 516.97748, "t": 338.06039, "r": 529.77484, "b": 339.88082999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 367, "text": "Shows a permitted ", "bbox": {"l": 516.97748, "t": 338.06039, "r": 529.77484, "b": 339.88082999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 319, "label": "text", "bbox": {"l": 516.97748, "t": 339.74799, "r": 520.96399, "b": 341.56842, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 368, "text": "action", "bbox": {"l": 516.97748, "t": 339.74799, "r": 520.96399, "b": 341.56842, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 320, "label": "text", "bbox": {"l": 534.55847, "t": 337.88281, "r": 548.58453, "b": 339.7032500000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 369, "text": "Shows an action that ", "bbox": {"l": 534.55847, "t": 337.88281, "r": 548.58453, "b": 339.7032500000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 321, "label": "text", "bbox": {"l": 534.55847, "t": 339.57040000000006, "r": 545.08862, "b": 341.39084, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 370, "text": "is not permitted", "bbox": {"l": 534.55847, "t": 339.57040000000006, "r": 545.08862, "b": 341.39084, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 322, "label": "text", "bbox": {"l": 483.05853, "t": 356.17416, "r": 494.72577, "b": 357.9946, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 371, "text": "Warns of hazards ", "bbox": {"l": 483.05853, "t": 356.17416, "r": 494.72577, "b": 357.9946, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 323, "label": "text", "bbox": {"l": 483.05853, "t": 357.86179, "r": 487.07525999999996, "b": 359.68222, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 372, "text": "ahead", "bbox": {"l": 483.05853, "t": 357.86179, "r": 487.07525999999996, "b": 359.68222, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 324, "label": "text", "bbox": {"l": 499.39645, "t": 356.26297000000005, "r": 504.69171, "b": 358.0834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 373, "text": "Warns of", "bbox": {"l": 499.39645, "t": 356.26297000000005, "r": 504.69171, "b": 358.0834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 325, "label": "text", "bbox": {"l": 499.39645, "t": 357.95056, "r": 511.69116, "b": 359.77099999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 374, "text": "construction zones", "bbox": {"l": 499.39645, "t": 357.95056, "r": 511.69116, "b": 359.77099999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 326, "label": "text", "bbox": {"l": 516.75891, "t": 356.26297000000005, "r": 527.42938, "b": 358.0834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 375, "text": "Railway crossing", "bbox": {"l": 516.75891, "t": 356.26297000000005, "r": 527.42938, "b": 358.0834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 327, "label": "text", "bbox": {"l": 534.5141, "t": 352.92981, "r": 547.89862, "b": 354.75024, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 376, "text": "Shows distance and ", "bbox": {"l": 534.5141, "t": 352.92981, "r": 547.89862, "b": 354.75024, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 328, "label": "text", "bbox": {"l": 534.5141, "t": 354.6174, "r": 540.2818, "b": 356.43784, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 377, "text": "direction", "bbox": {"l": 534.5141, "t": 354.6174, "r": 540.2818, "b": 356.43784, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 329, "label": "text", "bbox": {"l": 478.37466, "t": 270.14075, "r": 479.14251999999993, "b": 272.17877, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 378, "text": "\u2022", "bbox": {"l": 478.37466, "t": 270.14075, "r": 479.14251999999993, "b": 272.17877, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 330, "label": "text", "bbox": {"l": 479.91036999999994, "t": 270.14075, "r": 483.74963, "b": 272.17877, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 379, "text": "Signs", "bbox": {"l": 479.91036999999994, "t": 270.14075, "r": 483.74963, "b": 272.17877, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 331, "label": "text", "bbox": {"l": 479.97293, "t": 272.84717, "r": 492.31219, "b": 274.34888, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 380, "text": "- regulatory signs", "bbox": {"l": 479.97293, "t": 272.84717, "r": 492.31219, "b": 274.34888, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 332, "label": "text", "bbox": {"l": 479.97293, "t": 275.14513999999997, "r": 486.72598000000005, "b": 276.64679, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 381, "text": "- school, ", "bbox": {"l": 479.97293, "t": 275.14513999999997, "r": 486.72598000000005, "b": 276.64679, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 333, "label": "text", "bbox": {"l": 481.21602999999993, "t": 276.77972, "r": 492.93286000000006, "b": 278.81768999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 382, "text": "playground and ", "bbox": {"l": 481.21602999999993, "t": 276.77972, "r": 492.93286000000006, "b": 278.81768999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 334, "label": "text", "bbox": {"l": 481.21602999999993, "t": 278.82275000000004, "r": 491.82938000000007, "b": 280.86075, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 383, "text": "crosswalk signs", "bbox": {"l": 481.21602999999993, "t": 278.82275000000004, "r": 491.82938000000007, "b": 280.86075, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 335, "label": "text", "bbox": {"l": 479.97293, "t": 281.52759, "r": 491.00775000000004, "b": 283.02924, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 384, "text": "- lane use signs", "bbox": {"l": 479.97293, "t": 281.52759, "r": 491.00775000000004, "b": 283.02924, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 336, "label": "text", "bbox": {"l": 479.97293, "t": 283.82556, "r": 493.32748, "b": 285.3272099999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 385, "text": "- turn control signs", "bbox": {"l": 479.97293, "t": 283.82556, "r": 493.32748, "b": 285.3272099999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 337, "label": "text", "bbox": {"l": 479.97293, "t": 286.1235, "r": 490.4915199999999, "b": 287.62518, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 386, "text": "- parking signs", "bbox": {"l": 479.97293, "t": 286.1235, "r": 490.4915199999999, "b": 287.62518, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 338, "label": "text", "bbox": {"l": 479.97293, "t": 288.42148, "r": 491.17004000000003, "b": 289.92316, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 387, "text": "- reserved lane ", "bbox": {"l": 479.97293, "t": 288.42148, "r": 491.17004000000003, "b": 289.92316, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 339, "label": "text", "bbox": {"l": 481.21602999999993, "t": 290.05605999999995, "r": 484.77405000000005, "b": 292.09406, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 388, "text": "signs", "bbox": {"l": 481.21602999999993, "t": 290.05605999999995, "r": 484.77405000000005, "b": 292.09406, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 340, "label": "text", "bbox": {"l": 479.97293, "t": 292.76169000000004, "r": 490.83398, "b": 294.26334, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 389, "text": "- warning signs", "bbox": {"l": 479.97293, "t": 292.76169000000004, "r": 490.83398, "b": 294.26334, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 341, "label": "text", "bbox": {"l": 479.97293, "t": 295.05963, "r": 491.62692, "b": 296.56131, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 390, "text": "- object markers", "bbox": {"l": 479.97293, "t": 295.05963, "r": 491.62692, "b": 296.56131, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 342, "label": "text", "bbox": {"l": 479.97293, "t": 297.3576, "r": 490.37341, "b": 298.8592499999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 391, "text": "- construction ", "bbox": {"l": 479.97293, "t": 297.3576, "r": 490.37341, "b": 298.8592499999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 343, "label": "text", "bbox": {"l": 481.21602999999993, "t": 298.99219, "r": 484.77405000000005, "b": 301.03015, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 392, "text": "signs", "bbox": {"l": 481.21602999999993, "t": 298.99219, "r": 484.77405000000005, "b": 301.03015, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 344, "label": "text", "bbox": {"l": 479.97293, "t": 301.69780999999995, "r": 492.93912, "b": 303.19946, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 393, "text": "- information and ", "bbox": {"l": 479.97293, "t": 301.69780999999995, "r": 492.93912, "b": 303.19946, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 345, "label": "text", "bbox": {"l": 481.21602999999993, "t": 303.3324, "r": 493.00525, "b": 305.37036, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 394, "text": "destination signs", "bbox": {"l": 481.21602999999993, "t": 303.3324, "r": 493.00525, "b": 305.37036, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 346, "label": "text", "bbox": {"l": 479.97293, "t": 306.0379899999999, "r": 489.99047999999993, "b": 307.53967, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 395, "text": "- railway signs", "bbox": {"l": 479.97293, "t": 306.0379899999999, "r": 489.99047999999993, "b": 307.53967, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 347, "label": "text", "bbox": {"l": 478.375, "t": 308.24789, "r": 479.1032400000001, "b": 310.28586, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 396, "text": "\u2022", "bbox": {"l": 478.375, "t": 308.24789, "r": 479.1032400000001, "b": 310.28586, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 348, "label": "text", "bbox": {"l": 479.83151, "t": 308.24789, "r": 484.92925999999994, "b": 310.28586, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 397, "text": "Signals", "bbox": {"l": 479.83151, "t": 308.24789, "r": 484.92925999999994, "b": 310.28586, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 349, "label": "text", "bbox": {"l": 479.97293, "t": 310.95358, "r": 490.00091999999995, "b": 312.45526, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 398, "text": "- lane control ", "bbox": {"l": 479.97293, "t": 310.95358, "r": 490.00091999999995, "b": 312.45526, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 350, "label": "text", "bbox": {"l": 481.21602999999993, "t": 312.5881999999999, "r": 485.95331, "b": 314.62616, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 399, "text": "signals", "bbox": {"l": 481.21602999999993, "t": 312.5881999999999, "r": 485.95331, "b": 314.62616, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 351, "label": "text", "bbox": {"l": 479.97293, "t": 315.29379, "r": 489.29876999999993, "b": 316.79544, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 400, "text": "- traffic lights", "bbox": {"l": 479.97293, "t": 315.29379, "r": 489.29876999999993, "b": 316.79544, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 352, "label": "text", "bbox": {"l": 478.375, "t": 317.50366, "r": 479.18129999999996, "b": 319.5416599999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 401, "text": "\u2022", "bbox": {"l": 478.375, "t": 317.50366, "r": 479.18129999999996, "b": 319.5416599999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 353, "label": "text", "bbox": {"l": 479.98761, "t": 317.50366, "r": 490.46960000000007, "b": 319.5416599999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 402, "text": "Road markings", "bbox": {"l": 479.98761, "t": 317.50366, "r": 490.46960000000007, "b": 319.5416599999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 354, "label": "text", "bbox": {"l": 479.97293, "t": 320.20938, "r": 489.26166000000006, "b": 321.71103, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 403, "text": "- yellow lines", "bbox": {"l": 479.97293, "t": 320.20938, "r": 489.26166000000006, "b": 321.71103, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 355, "label": "text", "bbox": {"l": 479.97293, "t": 322.50732, "r": 488.59189, "b": 324.009, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 404, "text": "- white lines", "bbox": {"l": 479.97293, "t": 322.50732, "r": 488.59189, "b": 324.009, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 356, "label": "text", "bbox": {"l": 479.97293, "t": 324.8053, "r": 491.17004000000003, "b": 326.30698, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 405, "text": "- reserved lane ", "bbox": {"l": 479.97293, "t": 324.8053, "r": 491.17004000000003, "b": 326.30698, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 357, "label": "text", "bbox": {"l": 481.21602999999993, "t": 326.43988, "r": 487.58978, "b": 328.47784, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 406, "text": "markings", "bbox": {"l": 481.21602999999993, "t": 326.43988, "r": 487.58978, "b": 328.47784, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 358, "label": "text", "bbox": {"l": 479.97293, "t": 329.14551, "r": 491.75177, "b": 330.64716, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 407, "text": "- other markings", "bbox": {"l": 479.97293, "t": 329.14551, "r": 491.75177, "b": 330.64716, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 359, "label": "text", "bbox": {"l": 478.15246999999994, "t": 265.07030999999995, "r": 493.75586, "b": 268.06872999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 408, "text": "in this chapter", "bbox": {"l": 478.15246999999994, "t": 265.07030999999995, "r": 493.75586, "b": 268.06872999999996, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 16, "label": "caption", "bbox": {"l": 317.95499, "t": 540.08299, "r": 559.80579, "b": 559.51524, "coord_origin": "TOPLEFT"}, "confidence": 0.7793365120887756, "cells": [{"id": 409, "text": "Figure 1: Four examples of complex page layouts across dif-", "bbox": {"l": 317.95499, "t": 540.08299, "r": 559.80579, "b": 548.55624, "coord_origin": "TOPLEFT"}}, {"id": 410, "text": "ferent document categories", "bbox": {"l": 317.95499, "t": 551.0419899999999, "r": 428.69907, "b": 559.51524, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "section_header", "bbox": {"l": 317.95499, "t": 592.46591, "r": 379.8205, "b": 602.7750100000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9208476543426514, "cells": [{"id": 411, "text": "KEYWORDS", "bbox": {"l": 317.95499, "t": 592.46591, "r": 379.8205, "b": 602.7750100000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 317.95499, "t": 607.66756, "r": 559.18597, "b": 627.00117, "coord_origin": "TOPLEFT"}, "confidence": 0.9509093761444092, "cells": [{"id": 412, "text": "PDF document conversion, layout segmentation, object-detection,", "bbox": {"l": 317.95499, "t": 607.66756, "r": 559.18597, "b": 616.04218, "coord_origin": "TOPLEFT"}}, {"id": 413, "text": "data set, Machine Learning", "bbox": {"l": 317.95499, "t": 618.62656, "r": 416.94403, "b": 627.00117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "section_header", "bbox": {"l": 317.65997, "t": 640.05434, "r": 404.65366, "b": 647.58609, "coord_origin": "TOPLEFT"}, "confidence": 0.8721988797187805, "cells": [{"id": 414, "text": "ACM Reference Format:", "bbox": {"l": 317.65997, "t": 640.05434, "r": 404.65366, "b": 647.58609, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 317.95499, "t": 650.11996, "r": 559.5495, "b": 707.377029, "coord_origin": "TOPLEFT"}, "confidence": 0.9455165863037109, "cells": [{"id": 415, "text": "Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter", "bbox": {"l": 317.95499, "t": 650.11996, "r": 558.35266, "b": 657.56404, "coord_origin": "TOPLEFT"}}, {"id": 416, "text": "Staar. 2022. DocLayNet: A Large Human-Annotated Dataset for Document-", "bbox": {"l": 317.95499, "t": 660.08296, "r": 559.5495, "b": 667.52703, "coord_origin": "TOPLEFT"}}, {"id": 417, "text": "Layout Analysis. In", "bbox": {"l": 317.95499, "t": 670.04497, "r": 383.30807, "b": 677.48904, "coord_origin": "TOPLEFT"}}, {"id": 418, "text": "Proceedings of the 28th ACM SIGKDD Conference on", "bbox": {"l": 385.798, "t": 670.08482, "r": 558.20032, "b": 677.49701, "coord_origin": "TOPLEFT"}}, {"id": 419, "text": "Knowledge Discovery and Data Mining (KDD \u201922), August 14-18, 2022, Wash-", "bbox": {"l": 317.95499, "t": 680.04781, "r": 559.00092, "b": 687.46001, "coord_origin": "TOPLEFT"}}, {"id": 420, "text": "ington, DC, USA.", "bbox": {"l": 317.95499, "t": 690.01081, "r": 370.11481, "b": 697.423004, "coord_origin": "TOPLEFT"}}, {"id": 421, "text": "ACM, New York, NY, USA, 9 pages. https://doi.org/10.1145/", "bbox": {"l": 371.82999, "t": 689.97096, "r": 558.71655, "b": 697.415031, "coord_origin": "TOPLEFT"}}, {"id": 422, "text": "3534678.3539043", "bbox": {"l": 317.95499, "t": 699.932953, "r": 371.59375, "b": 707.377029, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "page_header", "bbox": {"l": 18.34021, "t": 218.35999000000004, "r": 36.339794, "b": 555.00003, "coord_origin": "TOPLEFT"}, "confidence": 0.8537883758544922, "cells": [{"id": 423, "text": "arXiv:2206.01062v1 [cs.CV] 2 Jun 2022", "bbox": {"l": 18.34021, "t": 218.35999000000004, "r": 36.339794, "b": 555.00003, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "section_header", "id": 12, "page_no": 0, "cluster": {"id": 12, "label": "section_header", "bbox": {"l": 107.29999999999998, "t": 83.69470000000013, "r": 505.06195, "b": 119.59558000000015, "coord_origin": "TOPLEFT"}, "confidence": 0.8416302800178528, "cells": [{"id": 0, "text": "DocLayNet: A Large Human-Annotated Dataset for", "bbox": {"l": 107.29999999999998, "t": 83.69470000000013, "r": 505.06195, "b": 99.67058999999995, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Document-Layout Analysis", "bbox": {"l": 200.117, "t": 103.6196900000001, "r": 411.88367, "b": 119.59558000000015, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis"}, {"label": "text", "id": 8, "page_no": 0, "cluster": {"id": 8, "label": "text", "bbox": {"l": 90.96701, "t": 133.67236000000003, "r": 193.73123, "b": 180.24030000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.8637151718139648, "cells": [{"id": 2, "text": "Birgit Pfitzmann", "bbox": {"l": 102.06001, "t": 133.67236000000003, "r": 182.63805, "b": 144.83856000000003, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "IBM Research", "bbox": {"l": 114.29401000000001, "t": 147.02423, "r": 170.40337, "b": 156.32928000000004, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Rueschlikon, Switzerland", "bbox": {"l": 90.96701, "t": 158.97924999999998, "r": 193.73123, "b": 168.28430000000003, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "bpf@zurich.ibm.com", "bbox": {"l": 100.02301, "t": 170.93524000000002, "r": 184.67522, "b": 180.24030000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Birgit Pfitzmann IBM Research Rueschlikon, Switzerland bpf@zurich.ibm.com"}, {"label": "text", "id": 9, "page_no": 0, "cluster": {"id": 9, "label": "text", "bbox": {"l": 255.11602999999997, "t": 133.67236000000003, "r": 357.88025, "b": 180.24030000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.8612664937973022, "cells": [{"id": 6, "text": "Christoph Auer", "bbox": {"l": 268.62402, "t": 133.67236000000003, "r": 344.59933, "b": 144.83856000000003, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "IBM Research", "bbox": {"l": 278.44302, "t": 147.02423, "r": 334.55237, "b": 156.32928000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Rueschlikon, Switzerland", "bbox": {"l": 255.11602999999997, "t": 158.97924999999998, "r": 357.88025, "b": 168.28430000000003, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "cau@zurich.ibm.com", "bbox": {"l": 263.70404, "t": 170.93524000000002, "r": 349.29272, "b": 180.24030000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Christoph Auer IBM Research Rueschlikon, Switzerland cau@zurich.ibm.com"}, {"label": "text", "id": 6, "page_no": 0, "cluster": {"id": 6, "label": "text", "bbox": {"l": 419.26505, "t": 133.67236000000003, "r": 522.0293, "b": 180.24030000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.8760607242584229, "cells": [{"id": 10, "text": "Michele Dolfi", "bbox": {"l": 437.6930500000001, "t": 133.67236000000003, "r": 503.60208, "b": 144.83856000000003, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "IBM Research", "bbox": {"l": 442.59305000000006, "t": 147.02423, "r": 498.7023899999999, "b": 156.32928000000004, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Rueschlikon, Switzerland", "bbox": {"l": 419.26505, "t": 158.97924999999998, "r": 522.0293, "b": 168.28430000000003, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "dol@zurich.ibm.com", "bbox": {"l": 428.56104000000005, "t": 170.93524000000002, "r": 512.73505, "b": 180.24030000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Michele Dolfi IBM Research Rueschlikon, Switzerland dol@zurich.ibm.com"}, {"label": "text", "id": 13, "page_no": 0, "cluster": {"id": 13, "label": "text", "bbox": {"l": 172.54303, "t": 192.05737, "r": 275.30725, "b": 238.62531, "coord_origin": "TOPLEFT"}, "confidence": 0.8319916129112244, "cells": [{"id": 14, "text": "Ahmed S. Nassar", "bbox": {"l": 182.26804, "t": 192.05737, "r": 265.39255, "b": 203.22357, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "IBM Research", "bbox": {"l": 195.87103, "t": 205.40923999999995, "r": 251.98038999999997, "b": 214.71429, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Rueschlikon, Switzerland", "bbox": {"l": 172.54303, "t": 217.36425999999994, "r": 275.30725, "b": 226.66931, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "ahn@zurich.ibm.com", "bbox": {"l": 180.52803, "t": 229.32025, "r": 267.3222, "b": 238.62531, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Ahmed S. Nassar IBM Research Rueschlikon, Switzerland ahn@zurich.ibm.com"}, {"label": "text", "id": 15, "page_no": 0, "cluster": {"id": 15, "label": "text", "bbox": {"l": 336.69302, "t": 192.05737, "r": 439.45727999999997, "b": 238.62531, "coord_origin": "TOPLEFT"}, "confidence": 0.8027974367141724, "cells": [{"id": 18, "text": "Peter Staar", "bbox": {"l": 361.52802, "t": 192.05737, "r": 414.84821, "b": 203.22357, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "IBM Research", "bbox": {"l": 360.02002, "t": 205.40923999999995, "r": 416.12939, "b": 214.71429, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Rueschlikon, Switzerland", "bbox": {"l": 336.69302, "t": 217.36425999999994, "r": 439.45727999999997, "b": 226.66931, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "taa@zurich.ibm.com", "bbox": {"l": 346.20703, "t": 229.32025, "r": 429.94269, "b": 238.62531, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Peter Staar IBM Research Rueschlikon, Switzerland taa@zurich.ibm.com"}, {"label": "section_header", "id": 5, "page_no": 0, "cluster": {"id": 5, "label": "section_header", "bbox": {"l": 53.798035, "t": 247.70288000000005, "r": 111.94354, "b": 258.01202, "coord_origin": "TOPLEFT"}, "confidence": 0.8876155018806458, "cells": [{"id": 22, "text": "ABSTRACT", "bbox": {"l": 53.798035, "t": 247.70288000000005, "r": 111.94354, "b": 258.01202, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "ABSTRACT"}, {"label": "text", "id": 0, "page_no": 0, "cluster": {"id": 0, "label": "text", "bbox": {"l": 53.466999, "t": 262.90454, "r": 295.56018, "b": 534.29318, "coord_origin": "TOPLEFT"}, "confidence": 0.9823057055473328, "cells": [{"id": 23, "text": "Accurate document layout analysis is a key requirement for high-", "bbox": {"l": 53.484001, "t": 262.90454, "r": 295.55591, "b": 271.27917, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "quality PDF document conversion. With the recent availability of", "bbox": {"l": 53.79800000000001, "t": 273.86352999999997, "r": 294.04199, "b": 282.23816, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "public, large ground-truth datasets such as PubLayNet and DocBank,", "bbox": {"l": 53.79800000000001, "t": 284.82254, "r": 295.34586, "b": 293.19717, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "deep-learning models have proven to be very effective at layout", "bbox": {"l": 53.79800000000001, "t": 295.78152, "r": 294.04709, "b": 304.15616000000006, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "detection and segmentation. While these datasets are of adequate", "bbox": {"l": 53.79800000000001, "t": 306.74053999999995, "r": 294.04645, "b": 315.11517, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "size to train such models, they severely lack in layout variability", "bbox": {"l": 53.79800000000001, "t": 317.69952, "r": 294.27573, "b": 326.07416, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "since they are sourced from scientific article repositories such as", "bbox": {"l": 53.79800000000001, "t": 328.65854, "r": 294.04712, "b": 337.03317, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "PubMed and arXiv only. Consequently, the accuracy of the layout", "bbox": {"l": 53.79800000000001, "t": 339.61755, "r": 294.0437, "b": 347.99219, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "segmentation drops significantly when these models are applied", "bbox": {"l": 53.79800000000001, "t": 350.57654, "r": 294.04715, "b": 358.95117, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "on more challenging and diverse layouts. In this paper, we present", "bbox": {"l": 53.79800000000001, "t": 361.53455, "r": 294.04364, "b": 369.90918000000005, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "DocLayNet", "bbox": {"l": 53.79800000000001, "t": 372.53839, "r": 92.863388, "b": 380.87714000000005, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": ", a new, publicly available, document-layout annotation", "bbox": {"l": 92.863998, "t": 372.49353, "r": 294.04361, "b": 380.86816, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "dataset in COCO format. It contains 80863 manually annotated", "bbox": {"l": 53.79800000000001, "t": 383.45255, "r": 294.04718, "b": 391.82718, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "pages from diverse data sources to represent a wide variability in", "bbox": {"l": 53.79800000000001, "t": 394.41153, "r": 294.0437, "b": 402.78616, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "layouts. For each PDF page, the layout annotations provide labelled", "bbox": {"l": 53.79800000000001, "t": 405.37054, "r": 294.04535, "b": 413.74518, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "bounding-boxes with a choice of 11 distinct classes. DocLayNet", "bbox": {"l": 53.79800000000001, "t": 416.32953, "r": 294.04715, "b": 424.70416000000006, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "also provides a subset of double- and triple-annotated pages to", "bbox": {"l": 53.79800000000001, "t": 427.28853999999995, "r": 294.04712, "b": 435.66318, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "determine the inter-annotator agreement. In multiple experiments,", "bbox": {"l": 53.79800000000001, "t": 438.24753, "r": 295.03, "b": 446.62216, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "we provide baseline accuracy scores (in mAP) for a set of popular", "bbox": {"l": 53.466999, "t": 449.20654, "r": 294.21616, "b": 457.58118, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "object detection models. We also demonstrate that these models", "bbox": {"l": 53.79800000000001, "t": 460.16553, "r": 294.04712, "b": 468.54016, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "fall approximately 10% behind the inter-annotator agreement. Fur-", "bbox": {"l": 53.79800000000001, "t": 471.12354, "r": 295.56018, "b": 479.49817, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "thermore, we provide evidence that DocLayNet is of sufficient size.", "bbox": {"l": 53.79800000000001, "t": 482.08255, "r": 295.42783, "b": 490.45718, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Lastly, we compare models trained on PubLayNet, DocBank and", "bbox": {"l": 53.79800000000001, "t": 493.04153, "r": 294.04715, "b": 501.41617, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "DocLayNet, showing that layout predictions of the DocLayNet-", "bbox": {"l": 53.79800000000001, "t": 504.00055, "r": 295.55618, "b": 512.37518, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "trained models are more robust and thus the preferred choice for", "bbox": {"l": 53.79800000000001, "t": 514.95953, "r": 294.21643, "b": 523.33417, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "general-purpose document-layout analysis.", "bbox": {"l": 53.79800000000001, "t": 525.91855, "r": 212.05495, "b": 534.29318, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Accurate document layout analysis is a key requirement for highquality PDF document conversion. With the recent availability of public, large ground-truth datasets such as PubLayNet and DocBank, deep-learning models have proven to be very effective at layout detection and segmentation. While these datasets are of adequate size to train such models, they severely lack in layout variability since they are sourced from scientific article repositories such as PubMed and arXiv only. Consequently, the accuracy of the layout segmentation drops significantly when these models are applied on more challenging and diverse layouts. In this paper, we present DocLayNet , a new, publicly available, document-layout annotation dataset in COCO format. It contains 80863 manually annotated pages from diverse data sources to represent a wide variability in layouts. For each PDF page, the layout annotations provide labelled bounding-boxes with a choice of 11 distinct classes. DocLayNet also provides a subset of double- and triple-annotated pages to determine the inter-annotator agreement. In multiple experiments, we provide baseline accuracy scores (in mAP) for a set of popular object detection models. We also demonstrate that these models fall approximately 10% behind the inter-annotator agreement. Furthermore, we provide evidence that DocLayNet is of sufficient size. Lastly, we compare models trained on PubLayNet, DocBank and DocLayNet, showing that layout predictions of the DocLayNettrained models are more robust and thus the preferred choice for general-purpose document-layout analysis."}, {"label": "section_header", "id": 4, "page_no": 0, "cluster": {"id": 4, "label": "section_header", "bbox": {"l": 53.79800000000001, "t": 550.99692, "r": 134.81989, "b": 561.30602, "coord_origin": "TOPLEFT"}, "confidence": 0.9149598479270935, "cells": [{"id": 49, "text": "CCS CONCEPTS", "bbox": {"l": 53.79800000000001, "t": 550.99692, "r": 134.81989, "b": 561.30602, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "CCS CONCEPTS"}, {"label": "text", "id": 11, "page_no": 0, "cluster": {"id": 11, "label": "text", "bbox": {"l": 53.797989, "t": 566.08299, "r": 297.85294, "b": 596.50114, "coord_origin": "TOPLEFT"}, "confidence": 0.8458839058876038, "cells": [{"id": 50, "text": "\u2022", "bbox": {"l": 53.79800000000001, "t": 566.19957, "r": 56.945206000000006, "b": 574.57419, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Information systems", "bbox": {"l": 58.440002, "t": 566.0830100000001, "r": 142.4462, "b": 574.5562600000001, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "\u2192", "bbox": {"l": 143.938, "t": 566.36096, "r": 153.15099, "b": 574.43073, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Document structure", "bbox": {"l": 154.646, "t": 566.0830100000001, "r": 235.46015999999997, "b": 574.5562600000001, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "; \u2022", "bbox": {"l": 235.45700000000002, "t": 566.19955, "r": 242.17419, "b": 574.57417, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "Applied com-", "bbox": {"l": 243.66899, "t": 566.08299, "r": 297.85294, "b": 574.55624, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "puting", "bbox": {"l": 53.797989, "t": 577.0419899999999, "r": 80.661324, "b": 585.51524, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "\u2192", "bbox": {"l": 83.565987, "t": 577.3199500000001, "r": 92.778961, "b": 585.38971, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Document analysis", "bbox": {"l": 95.68399, "t": 577.0419899999999, "r": 173.91583, "b": 585.51524, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "; \u2022", "bbox": {"l": 173.916, "t": 577.15855, "r": 182.1272, "b": 585.53317, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Computing methodologies", "bbox": {"l": 185.032, "t": 577.0419899999999, "r": 294.0455, "b": 585.51524, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "\u2192", "bbox": {"l": 53.79800399999999, "t": 588.27895, "r": 63.01097899999999, "b": 596.34871, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "Machine learning", "bbox": {"l": 65.253006, "t": 588.00099, "r": 136.80487, "b": 596.47424, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": ";", "bbox": {"l": 136.80501, "t": 588.1175499999999, "r": 138.92108, "b": 596.49217, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "Computer vision", "bbox": {"l": 141.162, "t": 588.00099, "r": 209.60254, "b": 596.47424, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": ";", "bbox": {"l": 209.60201, "t": 588.1175499999999, "r": 211.71808, "b": 596.49217, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "Object detection", "bbox": {"l": 213.96001, "t": 588.16238, "r": 270.45728, "b": 596.50114, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": ";", "bbox": {"l": 270.48001, "t": 588.1175499999999, "r": 272.59607, "b": 596.49217, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u2022 Information systems \u2192 Document structure ; \u2022 Applied computing \u2192 Document analysis ; \u2022 Computing methodologies \u2192 Machine learning ; Computer vision ; Object detection ;"}, {"label": "text", "id": 17, "page_no": 0, "cluster": {"id": 17, "label": "text", "bbox": {"l": 53.79800000000001, "t": 634.39838, "r": 295.11798, "b": 672.79189, "coord_origin": "TOPLEFT"}, "confidence": 0.7107349038124084, "cells": [{"id": 68, "text": "Permission to make digital or hard copies of part or all of this work for personal or", "bbox": {"l": 53.79800000000001, "t": 634.39838, "r": 294.17697, "b": 640.9119000000001, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "classroom use is granted without fee provided that copies are not made or distributed", "bbox": {"l": 53.79800000000001, "t": 642.36838, "r": 294.04443, "b": 648.8819, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "for profit or commercial advantage and that copies bear this notice and the full citation", "bbox": {"l": 53.79800000000001, "t": 650.33838, "r": 294.04498, "b": 656.8519, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "on the first page. Copyrights for third-party components of this work must be honored.", "bbox": {"l": 53.79800000000001, "t": 658.3083799999999, "r": 295.11798, "b": 664.8219, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "For all other uses, contact the owner/author(s).", "bbox": {"l": 53.79800000000001, "t": 666.27837, "r": 187.72285, "b": 672.79189, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Permission to make digital or hard copies of part or all of this work for personal or classroom use is granted without fee provided that copies are not made or distributed for profit or commercial advantage and that copies bear this notice and the full citation on the first page. Copyrights for third-party components of this work must be honored. For all other uses, contact the owner/author(s)."}, {"label": "text", "id": 29, "page_no": 0, "cluster": {"id": 29, "label": "text", "bbox": {"l": 53.79800000000001, "t": 675.08023, "r": 197.86275, "b": 681.56586, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 53.79800000000001, "t": 675.08023, "r": 197.86275, "b": 681.56586, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA"}, {"label": "text", "id": 30, "page_no": 0, "cluster": {"id": 30, "label": "text", "bbox": {"l": 53.317001, "t": 683.81236, "r": 186.74652, "b": 690.32589, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "\u00a9 2022 Copyright held by the owner/author(s).", "bbox": {"l": 53.317001, "t": 683.81236, "r": 186.74652, "b": 690.32589, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u00a9 2022 Copyright held by the owner/author(s)."}, {"label": "text", "id": 31, "page_no": 0, "cluster": {"id": 31, "label": "text", "bbox": {"l": 53.554001, "t": 691.78336, "r": 157.03125, "b": 698.29689, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "ACM ISBN 978-1-4503-9385-0/22/08.", "bbox": {"l": 53.554001, "t": 691.78336, "r": 157.03125, "b": 698.29689, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "ACM ISBN 978-1-4503-9385-0/22/08."}, {"label": "text", "id": 27, "page_no": 0, "cluster": {"id": 27, "label": "text", "bbox": {"l": 53.79800000000001, "t": 699.753365, "r": 166.94093, "b": 706.266891, "coord_origin": "TOPLEFT"}, "confidence": 0.509588360786438, "cells": [{"id": 76, "text": "https://doi.org/10.1145/3534678.3539043", "bbox": {"l": 53.79800000000001, "t": 699.753365, "r": 166.94093, "b": 706.266891, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "https://doi.org/10.1145/3534678.3539043"}, {"label": "picture", "id": 20, "page_no": 0, "cluster": {"id": 20, "label": "picture", "bbox": {"l": 323.408203125, "t": 250.34873962402344, "r": 553.2952270507812, "b": 525.8507080078125, "coord_origin": "TOPLEFT"}, "confidence": 0.5910208821296692, "cells": [{"id": 77, "text": "13", "bbox": {"l": 327.86951, "t": 351.78085, "r": 330.41248, "b": 353.95465, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "USING THE VERTICAL TUBE -", "bbox": {"l": 327.83005, "t": 331.57268999999997, "r": 351.16092, "b": 333.31171, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "MODELS AY11230/11234", "bbox": {"l": 327.83005, "t": 333.18292, "r": 348.30536, "b": 334.92194, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "1.", "bbox": {"l": 327.83005, "t": 336.40439, "r": 329.05914, "b": 337.92606, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "The vertical tube can be used for", "bbox": {"l": 329.67368, "t": 336.40439, "r": 349.95349, "b": 337.92606, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "instructional viewing or to photograph", "bbox": {"l": 329.11752, "t": 337.83588, "r": 353.57977, "b": 339.35751000000005, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": " the image with a digital camera or a", "bbox": {"l": 327.77121, "t": 339.26736, "r": 352.4306, "b": 340.789, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": " micro TV unit", "bbox": {"l": 328.15176, "t": 340.69882, "r": 337.91086, "b": 342.22049, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "2.", "bbox": {"l": 327.8313, "t": 342.19043000000005, "r": 329.09155, "b": 343.71207, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Loosen the retention screw, then rotate ", "bbox": {"l": 329.72168, "t": 342.19043000000005, "r": 354.9267, "b": 343.71207, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": " the adjustment ring to change the ", "bbox": {"l": 327.8313, "t": 343.62192, "r": 351.66949, "b": 345.14355, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": " length of the vertical tube.", "bbox": {"l": 328.21185, "t": 345.05338, "r": 346.33179, "b": 346.57504, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "3.", "bbox": {"l": 327.83005, "t": 346.84680000000003, "r": 329.12726, "b": 348.36847, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "Make sure that both the images in", "bbox": {"l": 329.77588, "t": 346.84680000000003, "r": 351.18005, "b": 348.36847, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "OPERATION ", "bbox": {"l": 327.25311, "t": 254.94812000000002, "r": 350.07861, "b": 258.86096, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "(", "bbox": {"l": 350.07861, "t": 254.76782000000003, "r": 351.82651, "b": 258.68066, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "cont.", "bbox": {"l": 351.82651, "t": 254.94812000000002, "r": 360.85242, "b": 258.86096, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": ")", "bbox": {"l": 360.85242, "t": 254.76782000000003, "r": 362.60028, "b": 258.68066, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "SELECTING OBJECTIVE ", "bbox": {"l": 326.88037, "t": 263.49492999999995, "r": 345.84351, "b": 265.23395000000005, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "MAGNIFICATION", "bbox": {"l": 326.88037, "t": 265.10515999999996, "r": 340.54153, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "1.", "bbox": {"l": 326.88037, "t": 266.71533, "r": 328.31903, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "There are two objectives. The lower", "bbox": {"l": 329.03836, "t": 266.71533, "r": 354.21472, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": " magnification objective has a greater", "bbox": {"l": 326.88037, "t": 268.32556, "r": 355.19193, "b": 270.06458, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": " depth of field and view.", "bbox": {"l": 326.88037, "t": 269.93579, "r": 345.80057, "b": 271.6748, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "2.", "bbox": {"l": 326.88037, "t": 271.54602, "r": 328.33862, "b": 273.28503, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "In order to observe the specimen", "bbox": {"l": 329.06775, "t": 271.54602, "r": 352.39969, "b": 273.28503, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": " easily use the lower magnification", "bbox": {"l": 326.88037, "t": 273.15619000000004, "r": 352.90042, "b": 274.89526, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": " objective first. Then, by rotating the", "bbox": {"l": 326.88037, "t": 274.76642000000004, "r": 354.59546, "b": 276.50543000000005, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": " case, the magnification can be", "bbox": {"l": 326.88037, "t": 276.37665000000004, "r": 350.81885, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": " changed.", "bbox": {"l": 326.88037, "t": 277.98688000000004, "r": 335.46707, "b": 279.72589000000005, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "CHANGING THE INTERPUPILLARY ", "bbox": {"l": 326.88037, "t": 281.20728, "r": 354.57755, "b": 282.94632, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "DISTANCE", "bbox": {"l": 326.88037, "t": 282.81750000000005, "r": 335.1752, "b": 284.55652, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "1.", "bbox": {"l": 326.88037, "t": 284.4277, "r": 328.34784, "b": 286.16675, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "The distance between the observer's", "bbox": {"l": 329.08157, "t": 284.4277, "r": 354.76245, "b": 286.16675, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": " pupils is the interpupillary distance.", "bbox": {"l": 326.88037, "t": 286.03793, "r": 354.6499, "b": 287.77695, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "2.", "bbox": {"l": 326.88037, "t": 287.64813, "r": 328.25125, "b": 289.38718, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "To adjust the interpupillary distance", "bbox": {"l": 328.93671, "t": 287.64813, "r": 354.29825, "b": 289.38718, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": " rotate the prism caps until both eyes", "bbox": {"l": 326.88181, "t": 289.25836, "r": 355.02075, "b": 290.99738, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": " coincide with the image in the", "bbox": {"l": 326.88181, "t": 290.86855999999995, "r": 350.82028, "b": 292.6076, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": " eyepiece. ", "bbox": {"l": 326.88181, "t": 292.47879, "r": 336.2067, "b": 294.2178, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "FOCUSING", "bbox": {"l": 326.88181, "t": 295.69922, "r": 335.3941, "b": 297.43823, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "1.", "bbox": {"l": 326.88181, "t": 297.30942, "r": 328.34314, "b": 299.04846, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "Remove the lens protective cover.", "bbox": {"l": 329.07379, "t": 297.30942, "r": 353.18555, "b": 299.04846, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "2.", "bbox": {"l": 326.88324, "t": 298.91965, "r": 328.35919, "b": 300.65866, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "Place the specimen on the working", "bbox": {"l": 329.0972, "t": 298.91965, "r": 353.45065, "b": 300.65866, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": " stage.", "bbox": {"l": 326.88324, "t": 300.52985, "r": 333.32825, "b": 302.26889000000006, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "3.", "bbox": {"l": 326.88324, "t": 302.14008000000007, "r": 328.31296, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "Focus the specimen with the left eye", "bbox": {"l": 329.02783, "t": 302.14008000000007, "r": 354.76303, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": " first while turning the focus knob until", "bbox": {"l": 326.88324, "t": 303.75027, "r": 355.96307, "b": 305.48932, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": " the image appears clear and sharp.", "bbox": {"l": 326.88324, "t": 305.3605, "r": 354.46594, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "4.", "bbox": {"l": 326.88324, "t": 306.9707, "r": 328.25488, "b": 308.70975, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "Rotate the right eyepiece ring until the", "bbox": {"l": 328.9407, "t": 306.9707, "r": 356.37335, "b": 308.70975, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": " images in each eyepiece coincide and", "bbox": {"l": 326.88324, "t": 308.58093, "r": 355.38867, "b": 310.31995, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": " are sharp and clear.", "bbox": {"l": 326.88324, "t": 310.19113, "r": 343.17249, "b": 311.93018, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "CHANGING THE BULB", "bbox": {"l": 326.88324, "t": 313.41156, "r": 344.13388, "b": 315.15059999999994, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "1.", "bbox": {"l": 326.88324, "t": 315.02178999999995, "r": 328.37418, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "Disconnect the power cord.", "bbox": {"l": 329.11963, "t": 315.02178999999995, "r": 348.50162, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "2.", "bbox": {"l": 326.88324, "t": 316.63199, "r": 328.34061, "b": 318.37103, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "When the bulb is cool, remove the", "bbox": {"l": 329.06931, "t": 316.63199, "r": 353.11588, "b": 318.37103, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": " oblique illuminator cap and remove", "bbox": {"l": 326.88464, "t": 318.2422199999999, "r": 353.79517, "b": 319.9812299999999, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": " the halogen bulb with cap.", "bbox": {"l": 326.88464, "t": 319.85242000000005, "r": 348.02094, "b": 321.59146, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "3.", "bbox": {"l": 326.88464, "t": 321.46265, "r": 328.37512, "b": 323.20166, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "Replace with a new halogen bulb.", "bbox": {"l": 329.12036, "t": 321.46265, "r": 352.96808, "b": 323.20166, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "4.", "bbox": {"l": 326.88608, "t": 323.07285, "r": 328.36884, "b": 324.81189, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "Open the window in the base plate and", "bbox": {"l": 329.1102, "t": 323.07285, "r": 356.5412, "b": 324.81189, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": " replace the halogen lamp or ", "bbox": {"l": 326.88608, "t": 324.68307000000004, "r": 350.13828, "b": 326.42209, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": " fluorescent lamp of transmitted", "bbox": {"l": 326.88608, "t": 326.29327, "r": 351.59677, "b": 328.03232, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": " illuminator.", "bbox": {"l": 326.88608, "t": 327.9035, "r": 336.89197, "b": 329.64252, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "FOCUSING", "bbox": {"l": 358.42023, "t": 263.49492999999995, "r": 366.93256, "b": 265.23395000000005, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "1.", "bbox": {"l": 358.42023, "t": 265.10515999999996, "r": 359.89841, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "Turn the focusing knob away or toward", "bbox": {"l": 360.63751, "t": 265.10515999999996, "r": 387.98407, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": " you until a clear image is viewed.", "bbox": {"l": 358.42023, "t": 266.71533, "r": 384.58948, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "2.", "bbox": {"l": 358.42166, "t": 268.32556, "r": 359.78549, "b": 270.06458, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "If the image is unclear, adjust the", "bbox": {"l": 360.46741, "t": 268.32556, "r": 384.33441, "b": 270.06458, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": " height of the elevator up or down,", "bbox": {"l": 358.4231, "t": 269.93579, "r": 384.61502, "b": 271.6748, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": " then turn the focusing knob again.", "bbox": {"l": 358.4231, "t": 271.54602, "r": 385.38922, "b": 273.28503, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "ZOOM MAGNIFICATION", "bbox": {"l": 358.4231, "t": 274.76642000000004, "r": 377.35046, "b": 276.50543000000005, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "1.", "bbox": {"l": 358.4231, "t": 276.37665000000004, "r": 359.89429, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "Turn the zoom magnification knob to", "bbox": {"l": 360.62988, "t": 276.37665000000004, "r": 386.37589, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": " the desired magnification and field of", "bbox": {"l": 358.4231, "t": 277.98688000000004, "r": 386.78732, "b": 279.72589000000005, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": " view.", "bbox": {"l": 358.4231, "t": 279.59704999999997, "r": 364.16855, "b": 281.33609, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "2.", "bbox": {"l": 358.4231, "t": 281.20728, "r": 359.86777, "b": 282.94632, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "In most situations, it is recommended", "bbox": {"l": 360.59012, "t": 281.20728, "r": 387.31656, "b": 282.94632, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": " that you focus at the lowest ", "bbox": {"l": 358.4231, "t": 282.81750000000005, "r": 381.56656, "b": 284.55652, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": " magnification, then move to a higher", "bbox": {"l": 358.4231, "t": 284.4277, "r": 386.63403, "b": 286.16675, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": " magnification and re-focus as ", "bbox": {"l": 358.42453, "t": 286.03793, "r": 382.77115, "b": 287.77695, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": " necessary.", "bbox": {"l": 358.42453, "t": 287.64813, "r": 367.98694, "b": 289.38718, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "3.", "bbox": {"l": 358.42453, "t": 289.25836, "r": 359.80386, "b": 290.99738, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "If the image is not clear to both eyes", "bbox": {"l": 360.49353, "t": 289.25836, "r": 386.70093, "b": 290.99738, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": " at the same time, the diopter ring may", "bbox": {"l": 358.42453, "t": 290.86855999999995, "r": 388.03534, "b": 292.6076, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": " need adjustment.", "bbox": {"l": 358.42453, "t": 292.47879, "r": 373.13724, "b": 294.2178, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "DIOPTER RING ADJUSTMENT", "bbox": {"l": 358.42453, "t": 295.69922, "r": 381.74539, "b": 297.43823, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "1.", "bbox": {"l": 358.42453, "t": 297.30942, "r": 359.83682, "b": 299.04846, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "To adjust the eyepiece for viewing with", "bbox": {"l": 360.54297, "t": 297.30942, "r": 388.08289, "b": 299.04846, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": " or without eyeglasses and for ", "bbox": {"l": 358.42453, "t": 298.91965, "r": 382.73251, "b": 300.65866, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": " differences in acuity between the right", "bbox": {"l": 358.42453, "t": 300.52985, "r": 387.72266, "b": 302.26889000000006, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": " and left eyes, follow the following", "bbox": {"l": 358.42453, "t": 302.14008000000007, "r": 384.1991, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": " steps:", "bbox": {"l": 358.42453, "t": 303.75027, "r": 364.88672, "b": 305.48932, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "a.", "bbox": {"l": 358.42453, "t": 305.3605, "r": 359.95078, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "Observe an image through the left", "bbox": {"l": 361.47699, "t": 305.3605, "r": 386.65988, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": " eyepiece and bring a specific point", "bbox": {"l": 358.42453, "t": 306.9707, "r": 386.7634, "b": 308.70975, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": " into focus using the focus knob.", "bbox": {"l": 358.42453, "t": 308.58093, "r": 385.41354, "b": 310.31995, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "b.", "bbox": {"l": 358.42453, "t": 310.19113, "r": 359.93304, "b": 311.93018, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "By turning the diopter ring ", "bbox": {"l": 361.44156, "t": 310.19113, "r": 382.56085, "b": 311.93018, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": " adjustment for the left eyepiece,", "bbox": {"l": 358.42596, "t": 311.80136, "r": 385.4559, "b": 313.54037, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": " bring the same point into sharp", "bbox": {"l": 358.42596, "t": 313.41156, "r": 384.56122, "b": 315.15059999999994, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": " focus.", "bbox": {"l": 358.42596, "t": 315.02178999999995, "r": 366.74371, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": " c.Then bring the same point into", "bbox": {"l": 358.42596, "t": 316.63199, "r": 383.93884, "b": 318.37103, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": " focus through the right eyepiece", "bbox": {"l": 358.42596, "t": 318.2422199999999, "r": 385.69241, "b": 319.9812299999999, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": " by turning the right diopter ring.", "bbox": {"l": 358.42596, "t": 319.85242000000005, "r": 385.94861, "b": 321.59146, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": " d.With more than one viewer, each", "bbox": {"l": 358.42596, "t": 321.46265, "r": 385.54236, "b": 323.20166, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": " viewer should note their own", "bbox": {"l": 358.42596, "t": 323.07285, "r": 382.98718, "b": 324.81189, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": " diopter ring position for the left", "bbox": {"l": 358.42596, "t": 324.68307000000004, "r": 385.06448, "b": 326.42209, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": " and right eyepieces, then before", "bbox": {"l": 358.42596, "t": 326.29327, "r": 385.20682, "b": 328.03232, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": " viewing set the diopter ring", "bbox": {"l": 358.42596, "t": 327.9035, "r": 382.21964, "b": 329.64252, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": " adjustments to that setting.", "bbox": {"l": 358.42596, "t": 329.5137, "r": 382.63382, "b": 331.25275, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "CHANGING THE BULB", "bbox": {"l": 358.42596, "t": 332.73412999999994, "r": 375.67661, "b": 334.47317999999996, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "1.", "bbox": {"l": 358.42596, "t": 334.34436, "r": 359.90311, "b": 336.08337, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "Disconnect the power cord from the", "bbox": {"l": 360.64169, "t": 334.34436, "r": 385.75333, "b": 336.08337, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": " electrical outlet.", "bbox": {"l": 358.42596, "t": 335.95456, "r": 372.01416, "b": 337.6936, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "2.", "bbox": {"l": 358.42596, "t": 337.56479, "r": 359.88327, "b": 339.3038, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "When the bulb is cool, remove the", "bbox": {"l": 360.61191, "t": 337.56479, "r": 384.65726, "b": 339.3038, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": " oblique illuminator cap and remove", "bbox": {"l": 358.42596, "t": 339.17499, "r": 385.33649, "b": 340.9140300000001, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": " the halogen bulb with cap.", "bbox": {"l": 358.42596, "t": 340.78522, "r": 379.57224, "b": 342.52423, "coord_origin": "TOPLEFT"}}, {"id": 201, "text": "3.", "bbox": {"l": 358.4274, "t": 342.39542, "r": 359.91788, "b": 344.13446000000005, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": "Replace with a new halogen bulb.", "bbox": {"l": 360.66312, "t": 342.39542, "r": 384.5108, "b": 344.13446000000005, "coord_origin": "TOPLEFT"}}, {"id": 203, "text": "4.", "bbox": {"l": 358.42883, "t": 344.00565000000006, "r": 359.92792, "b": 345.74466, "coord_origin": "TOPLEFT"}}, {"id": 204, "text": "Open the window in the base plate", "bbox": {"l": 360.67746, "t": 344.00565000000006, "r": 385.41235, "b": 345.74466, "coord_origin": "TOPLEFT"}}, {"id": 205, "text": " and replace the halogen lamp or", "bbox": {"l": 358.42883, "t": 345.61584, "r": 383.2782, "b": 347.35489, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": " fluorescent lamp of transmitted", "bbox": {"l": 358.42883, "t": 347.22607, "r": 383.13953, "b": 348.96509, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": " illuminator.", "bbox": {"l": 358.42883, "t": 348.83627, "r": 368.43472, "b": 350.57532, "coord_origin": "TOPLEFT"}}, {"id": 208, "text": "Model AY11230", "bbox": {"l": 326.59567, "t": 261.14185, "r": 339.11377, "b": 262.88091999999995, "coord_origin": "TOPLEFT"}}, {"id": 209, "text": "Model AY11234", "bbox": {"l": 358.48605, "t": 261.14185, "r": 371.00415, "b": 262.88091999999995, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": "14", "bbox": {"l": 455.43533, "t": 351.77038999999996, "r": 457.97827000000007, "b": 353.94415, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "Objectives", "bbox": {"l": 408.24518, "t": 275.52673000000004, "r": 414.4234, "b": 276.96020999999996, "coord_origin": "TOPLEFT"}}, {"id": 212, "text": "Revolving Turret", "bbox": {"l": 409.39554, "t": 268.98235999999997, "r": 419.06677, "b": 270.41583, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "Coarse ", "bbox": {"l": 441.3895, "t": 279.12627999999995, "r": 445.87192, "b": 280.55975, "coord_origin": "TOPLEFT"}}, {"id": 214, "text": "Adjustment", "bbox": {"l": 441.3895, "t": 280.30609, "r": 448.22338999999994, "b": 281.7395900000001, "coord_origin": "TOPLEFT"}}, {"id": 215, "text": "Knob", "bbox": {"l": 441.3895, "t": 281.48593, "r": 444.40371999999996, "b": 282.91939999999994, "coord_origin": "TOPLEFT"}}, {"id": 216, "text": "MODEL AY11236", "bbox": {"l": 398.79288, "t": 254.94646999999998, "r": 428.91568, "b": 258.85931000000005, "coord_origin": "TOPLEFT"}}, {"id": 217, "text": "MICROSCOPE USAGE", "bbox": {"l": 398.32535, "t": 305.04291, "r": 435.93542, "b": 308.95572000000004, "coord_origin": "TOPLEFT"}}, {"id": 218, "text": "BARSKA Model AY11236 is a powerful fixed power compound ", "bbox": {"l": 398.08594, "t": 310.35892, "r": 453.72171, "b": 312.53271, "coord_origin": "TOPLEFT"}}, {"id": 219, "text": "microscope designed for biological studies such as specimen ", "bbox": {"l": 398.08594, "t": 312.50586, "r": 453.09939999999995, "b": 314.67966, "coord_origin": "TOPLEFT"}}, {"id": 220, "text": "examination. It can also be used for examining bacteria and", "bbox": {"l": 398.08594, "t": 314.6528, "r": 456.65246999999994, "b": 316.8266, "coord_origin": "TOPLEFT"}}, {"id": 221, "text": "for general clinical and medical studies and other scientific uses. ", "bbox": {"l": 398.08594, "t": 316.79977, "r": 456.73859000000004, "b": 318.97354, "coord_origin": "TOPLEFT"}}, {"id": 222, "text": "CONSTRUCTION", "bbox": {"l": 398.62399, "t": 320.42941, "r": 427.77472, "b": 324.34222000000005, "coord_origin": "TOPLEFT"}}, {"id": 223, "text": "BARSKA Model AY11236 is a fixed power compound microscope.", "bbox": {"l": 398.08594, "t": 326.46069000000006, "r": 456.02639999999997, "b": 328.63449, "coord_origin": "TOPLEFT"}}, {"id": 224, "text": "It is constructed with two optical paths at the same angle. It is ", "bbox": {"l": 398.08414, "t": 328.6076699999999, "r": 455.42238999999995, "b": 330.7814599999999, "coord_origin": "TOPLEFT"}}, {"id": 225, "text": "equipped with transmitted illumination. By using this instrument, ", "bbox": {"l": 398.08414, "t": 330.75461, "r": 457.39844, "b": 332.92841, "coord_origin": "TOPLEFT"}}, {"id": 226, "text": "the user can observe specimens at magnification from 40x to ", "bbox": {"l": 398.08414, "t": 332.90155, "r": 453.97745, "b": 335.07535000000007, "coord_origin": "TOPLEFT"}}, {"id": 227, "text": "1000x by selecting the desired objective lens. Coarse and fine ", "bbox": {"l": 398.08414, "t": 335.04852, "r": 454.70708999999994, "b": 337.22232, "coord_origin": "TOPLEFT"}}, {"id": 228, "text": "focus adjustments provide accuracy and image detail. The rotating ", "bbox": {"l": 398.08414, "t": 337.19547, "r": 458.90240000000006, "b": 339.36926, "coord_origin": "TOPLEFT"}}, {"id": 229, "text": "head allows the user to position the eyepieces for maximum ", "bbox": {"l": 398.08594, "t": 339.34241, "r": 453.0672, "b": 341.5162, "coord_origin": "TOPLEFT"}}, {"id": 230, "text": "viewing comfort and easy access to all adjustment knobs.", "bbox": {"l": 398.08594, "t": 341.48938, "r": 449.63113, "b": 343.66318, "coord_origin": "TOPLEFT"}}, {"id": 231, "text": "Model AY11236", "bbox": {"l": 422.10626, "t": 301.24191, "r": 434.62433000000004, "b": 302.98096, "coord_origin": "TOPLEFT"}}, {"id": 232, "text": "Fine ", "bbox": {"l": 442.01610999999997, "t": 283.08649, "r": 444.8817399999999, "b": 284.51996, "coord_origin": "TOPLEFT"}}, {"id": 233, "text": "Adjustment", "bbox": {"l": 442.01610999999997, "t": 284.2663, "r": 448.85001, "b": 285.69980000000004, "coord_origin": "TOPLEFT"}}, {"id": 234, "text": "Knob", "bbox": {"l": 442.01610999999997, "t": 285.44611, "r": 445.03033000000005, "b": 286.87961, "coord_origin": "TOPLEFT"}}, {"id": 235, "text": "Stage", "bbox": {"l": 408.00577, "t": 279.12579000000005, "r": 411.42212, "b": 280.5593, "coord_origin": "TOPLEFT"}}, {"id": 236, "text": "Condenser ", "bbox": {"l": 404.07172, "t": 280.9144299999999, "r": 410.77707, "b": 282.3479, "coord_origin": "TOPLEFT"}}, {"id": 237, "text": "Focusing", "bbox": {"l": 404.07172, "t": 282.09424, "r": 409.2157, "b": 283.52774, "coord_origin": "TOPLEFT"}}, {"id": 238, "text": "Knob", "bbox": {"l": 404.07172, "t": 283.27408, "r": 407.08594, "b": 284.7075500000001, "coord_origin": "TOPLEFT"}}, {"id": 239, "text": "Eyepiece", "bbox": {"l": 441.81281, "t": 262.32178, "r": 447.03702, "b": 263.75525000000005, "coord_origin": "TOPLEFT"}}, {"id": 240, "text": "Stand", "bbox": {"l": 437.34607, "t": 271.13025000000005, "r": 440.80496, "b": 272.56281, "coord_origin": "TOPLEFT"}}, {"id": 241, "text": "Lamp ", "bbox": {"l": 409.7164, "t": 284.40027, "r": 413.3768, "b": 285.83282, "coord_origin": "TOPLEFT"}}, {"id": 242, "text": "On/Off", "bbox": {"l": 409.7164, "t": 285.83163, "r": 413.68201, "b": 287.26416, "coord_origin": "TOPLEFT"}}, {"id": 243, "text": "Switch", "bbox": {"l": 409.7164, "t": 287.263, "r": 413.6337, "b": 288.69553, "coord_origin": "TOPLEFT"}}, {"id": 244, "text": "Lamp ", "bbox": {"l": 434.8712499999999, "t": 296.7153, "r": 438.53164999999996, "b": 298.14783, "coord_origin": "TOPLEFT"}}, {"id": 245, "text": "Power", "bbox": {"l": 439.52039, "t": 292.18307000000004, "r": 443.08768, "b": 293.61560000000003, "coord_origin": "TOPLEFT"}}, {"id": 246, "text": "Cord", "bbox": {"l": 439.52039, "t": 293.61444, "r": 442.29575, "b": 295.04697, "coord_origin": "TOPLEFT"}}, {"id": 247, "text": "Rotating Head", "bbox": {"l": 413.55829, "t": 264.66089, "r": 421.94913, "b": 266.09344, "coord_origin": "TOPLEFT"}}, {"id": 248, "text": "Stage Clip", "bbox": {"l": 441.84316999999993, "t": 286.90573, "r": 447.87585000000007, "b": 288.33826, "coord_origin": "TOPLEFT"}}, {"id": 249, "text": "Adjustment", "bbox": {"l": 441.84316999999993, "t": 288.3371, "r": 448.67252, "b": 289.76962000000003, "coord_origin": "TOPLEFT"}}, {"id": 250, "text": "Interpupillary Slide Adjustment", "bbox": {"l": 407.2403, "t": 259.86645999999996, "r": 425.79089, "b": 261.29895, "coord_origin": "TOPLEFT"}}, {"id": 251, "text": "Circling Minimums", "bbox": {"l": 449.10074000000003, "t": 378.66302, "r": 466.08835000000005, "b": 380.78412, "coord_origin": "TOPLEFT"}}, {"id": 252, "text": "7", "bbox": {"l": 449.10074000000003, "t": 383.2203999999999, "r": 449.64444, "b": 385.34148999999996, "coord_origin": "TOPLEFT"}}, {"id": 253, "text": "K H U H Z D V D F K D Q J H W R W K H 7 ( 5 3 6 F U L W H U L D L Q W K D W D \u1087H F W V F L U F O L Q J D U H D G L P H Q V L R Q E \\ H [ S D Q G L Q J W K H D U H D V W R S U R Y L G H ", "bbox": {"l": 450.18811, "t": 383.2203999999999, "r": 550.77124, "b": 385.34148999999996, "coord_origin": "TOPLEFT"}}, {"id": 254, "text": "improved obstacle protection. To indicate that the new criteria had been applied to a given procedure, a ", "bbox": {"l": 449.10074000000003, "t": 385.75732, "r": 536.14716, "b": 387.87842, "coord_origin": "TOPLEFT"}}, {"id": 255, "text": " is placed on ", "bbox": {"l": 538.31085, "t": 385.75732, "r": 549.49921, "b": 387.87842, "coord_origin": "TOPLEFT"}}, {"id": 256, "text": "the circling line of minimums. The new circling tables and explanatory information is located in the Legend of the TPP.", "bbox": {"l": 449.10074000000003, "t": 388.03601, "r": 547.58185, "b": 390.1571, "coord_origin": "TOPLEFT"}}, {"id": 257, "text": "7", "bbox": {"l": 449.10074000000003, "t": 393.2128000000001, "r": 449.6163, "b": 395.33386, "coord_origin": "TOPLEFT"}}, {"id": 258, "text": "K H D S S U R D F K H V X V L Q J V W D Q G D U G F L U F O L Q J D S S U R D F K D U H D V F D Q E H L G H Q W L \u00bf H G E \\ W K H D E V H Q F H R I W K H ", "bbox": {"l": 450.1319, "t": 393.2128000000001, "r": 529.53082, "b": 395.33386, "coord_origin": "TOPLEFT"}}, {"id": 259, "text": " on the circling line of ", "bbox": {"l": 532.05829, "t": 393.2128000000001, "r": 550.42261, "b": 395.33386, "coord_origin": "TOPLEFT"}}, {"id": 260, "text": "minima.", "bbox": {"l": 449.10074000000003, "t": 395.49149, "r": 455.74692, "b": 397.61255, "coord_origin": "TOPLEFT"}}, {"id": 261, "text": "$ S S O \\ 6 W D Q G D U G & L U F O L Q J $ S S U R D F K 0 D Q H X Y H U L Q J 5 D G L X V 7 D E O H ", "bbox": {"l": 449.95525999999995, "t": 415.59549, "r": 496.2829, "b": 417.50446, "coord_origin": "TOPLEFT"}}, {"id": 262, "text": "$ S S O \\ ( [ S D Q G H G & L U F O L Q J $ S S U R D F K 0 D Q H X Y H U L Q J $ L U V S D F H 5 D G L X V ", "bbox": {"l": 501.13077, "t": 409.25543, "r": 551.16101, "b": 411.1644, "coord_origin": "TOPLEFT"}}, {"id": 263, "text": "Table", "bbox": {"l": 501.13077, "t": 411.30624, "r": 505.2477999999999, "b": 413.21521, "coord_origin": "TOPLEFT"}}, {"id": 264, "text": "AIRPORT SKETCH", "bbox": {"l": 449.10074000000003, "t": 420.18802, "r": 469.35599, "b": 422.73331, "coord_origin": "TOPLEFT"}}, {"id": 265, "text": "The airport sketch is a depiction of the airport with emphasis on runway pattern and related ", "bbox": {"l": 449.10074000000003, "t": 425.08908, "r": 525.93616, "b": 427.21017, "coord_origin": "TOPLEFT"}}, {"id": 266, "text": "information, positioned in either the lower left or lower right corner of the chart to aid pi-", "bbox": {"l": 449.10074000000003, "t": 427.3678, "r": 522.0343, "b": 429.48886, "coord_origin": "TOPLEFT"}}, {"id": 267, "text": "lot recognition of the airport from the air and to provide some information to aid on ground ", "bbox": {"l": 449.10074000000003, "t": 429.64648, "r": 524.67151, "b": 431.76755, "coord_origin": "TOPLEFT"}}, {"id": 268, "text": "navigation of the airport. The runways are drawn to scale and oriented to true north. Runway ", "bbox": {"l": 449.10074000000003, "t": 431.92514000000006, "r": 527.172, "b": 434.04623, "coord_origin": "TOPLEFT"}}, {"id": 269, "text": "dimensions (length and width) are shown for all active runways.", "bbox": {"l": 449.10074000000003, "t": 434.20383, "r": 502.39545, "b": 436.32492, "coord_origin": "TOPLEFT"}}, {"id": 270, "text": "Runway(s) are depicted based on what type and construction of the runway.", "bbox": {"l": 449.10074000000003, "t": 438.7611999999999, "r": 512.92676, "b": 440.88228999999995, "coord_origin": "TOPLEFT"}}, {"id": 271, "text": "Hard Surface", "bbox": {"l": 449.95525999999995, "t": 444.07001, "r": 460.02307, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}, {"id": 272, "text": "Other Than ", "bbox": {"l": 464.89963, "t": 444.07001, "r": 473.98819, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}, {"id": 273, "text": "Hard Surface", "bbox": {"l": 464.89963, "t": 446.12085, "r": 474.96744, "b": 448.02979, "coord_origin": "TOPLEFT"}}, {"id": 274, "text": "Metal Surface", "bbox": {"l": 478.91357, "t": 444.07001, "r": 489.45648, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}, {"id": 275, "text": "Closed Runway", "bbox": {"l": 493.06420999999995, "t": 444.07001, "r": 505.03076, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}, {"id": 276, "text": "Under Construction", "bbox": {"l": 509.5809, "t": 444.07001, "r": 524.30237, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}, {"id": 277, "text": "Stopways, ", "bbox": {"l": 449.95525999999995, "t": 454.81207, "r": 458.31406, "b": 456.72104, "coord_origin": "TOPLEFT"}}, {"id": 278, "text": "Taxiways, Park-", "bbox": {"l": 449.95525999999995, "t": 456.86288, "r": 461.92083999999994, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}}, {"id": 279, "text": "ing Areas", "bbox": {"l": 449.95525999999995, "t": 458.91373, "r": 457.08014, "b": 460.82268999999997, "coord_origin": "TOPLEFT"}}, {"id": 280, "text": "Displaced ", "bbox": {"l": 464.89963, "t": 454.81207, "r": 472.87732, "b": 456.72104, "coord_origin": "TOPLEFT"}}, {"id": 281, "text": "Threshold", "bbox": {"l": 464.89963, "t": 456.86288, "r": 472.49792, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}}, {"id": 282, "text": "Closed", "bbox": {"l": 478.91357, "t": 454.81207, "r": 483.61584, "b": 456.72104, "coord_origin": "TOPLEFT"}}, {"id": 283, "text": "Pavement", "bbox": {"l": 478.91357, "t": 456.86288, "r": 486.60754000000003, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}}, {"id": 284, "text": "Water Runway", "bbox": {"l": 493.06420999999995, "t": 454.81207, "r": 504.20648, "b": 456.72104, "coord_origin": "TOPLEFT"}}, {"id": 285, "text": "Taxiways and aprons are shaded grey. Other runway features that may be shown are runway numbers, runway dimen-", "bbox": {"l": 449.10074000000003, "t": 469.32974, "r": 548.59674, "b": 471.45081, "coord_origin": "TOPLEFT"}}, {"id": 286, "text": "sions, runway slope, arresting gear, and displaced threshold.", "bbox": {"l": 449.10074000000003, "t": 471.60843, "r": 500.08181999999994, "b": 473.72949, "coord_origin": "TOPLEFT"}}, {"id": 287, "text": "2", "bbox": {"l": 449.10074000000003, "t": 476.16577, "r": 449.59933000000007, "b": 478.28687, "coord_origin": "TOPLEFT"}}, {"id": 288, "text": "W K H U L Q I R U P D W L R Q F R Q F H U Q L Q J O L J K W L Q J \u00bf Q D O D S S U R D F K E H D U L Q J V D L U S R U W E H D F R Q R E V W D F O H V F R Q W U R O W R Z H U 1 $ 9 $ , ' V K H O L ", "bbox": {"l": 450.09796, "t": 476.16577, "r": 547.82562, "b": 478.28687, "coord_origin": "TOPLEFT"}}, {"id": 289, "text": "-", "bbox": {"l": 547.82623, "t": 476.16577, "r": 548.45862, "b": 478.28687, "coord_origin": "TOPLEFT"}}, {"id": 290, "text": "pads may also be shown.", "bbox": {"l": 449.10074000000003, "t": 478.44446, "r": 470.52609000000007, "b": 480.56555, "coord_origin": "TOPLEFT"}}, {"id": 291, "text": "$ L U S R U W ( O H Y D W L R Q D Q G 7 R X F K G R Z Q = R Q H ( O H Y D W L R Q ", "bbox": {"l": 449.10074000000003, "t": 483.00183, "r": 493.37906000000004, "b": 485.12292, "coord_origin": "TOPLEFT"}}, {"id": 292, "text": "The airport elevation is shown enclosed within a box in the upper left corner of the sketch box and the touchdown zone ", "bbox": {"l": 449.10074000000003, "t": 487.5592, "r": 549.16168, "b": 489.6803, "coord_origin": "TOPLEFT"}}, {"id": 293, "text": "elevation (TDZE) is shown in the upper right corner of the sketch box. The airport elevation is the highest point of an ", "bbox": {"l": 449.10074000000003, "t": 489.83789, "r": 546.90881, "b": 491.95898, "coord_origin": "TOPLEFT"}}, {"id": 294, "text": "D L U S R U W \u00b6 V X V D E O H U X Q Z D \\ V P H D V X U H G L Q I H H W I U R P P H D Q V H D O H Y H O 7 K H 7 ' = ( L V W K H K L J K H V W H O H Y D W L R Q L Q W K H \u00bf U V W I H H W R I ", "bbox": {"l": 449.10074000000003, "t": 492.11658, "r": 551.80023, "b": 494.23767, "coord_origin": "TOPLEFT"}}, {"id": 295, "text": "the landing surface. Circling only approaches will not show a TDZE.", "bbox": {"l": 449.10074000000003, "t": 494.39526, "r": 505.85068000000007, "b": 496.51636, "coord_origin": "TOPLEFT"}}, {"id": 296, "text": "114", "bbox": {"l": 498.80661000000003, "t": 515.9437, "r": 502.08792, "b": 519.01764, "coord_origin": "TOPLEFT"}}, {"id": 297, "text": "FAA Chart Users\u2019 Guide - Terminal Procedures Publication (TPP) - Terms", "bbox": {"l": 444.56319999999994, "t": 422.84869, "r": 446.25998, "b": 471.87128, "coord_origin": "TOPLEFT"}}, {"id": 298, "text": "AGL 2013 Financial Calendar", "bbox": {"l": 329.40536, "t": 379.37537, "r": 355.13138, "b": 382.13336, "coord_origin": "TOPLEFT"}}, {"id": 299, "text": "22", "bbox": {"l": 329.40536, "t": 382.30273, "r": 330.96848, "b": 384.55927, "coord_origin": "TOPLEFT"}}, {"id": 300, "text": "August 2012 ", "bbox": {"l": 331.75003, "t": 382.30273, "r": 341.12875, "b": 384.55927, "coord_origin": "TOPLEFT"}}, {"id": 301, "text": "2012 full year result and fi nal dividend announced", "bbox": {"l": 350.4722, "t": 382.30273, "r": 384.81079, "b": 384.55927, "coord_origin": "TOPLEFT"}}, {"id": 302, "text": "30", "bbox": {"l": 329.40536, "t": 384.84552, "r": 330.97336, "b": 387.10205, "coord_origin": "TOPLEFT"}}, {"id": 303, "text": "August 2012 ", "bbox": {"l": 331.75735, "t": 384.84552, "r": 341.16534, "b": 387.10205, "coord_origin": "TOPLEFT"}}, {"id": 304, "text": "Ex-dividend trading commences", "bbox": {"l": 350.4722, "t": 384.84552, "r": 372.90613, "b": 387.10205, "coord_origin": "TOPLEFT"}}, {"id": 305, "text": "5", "bbox": {"l": 329.40536, "t": 387.38828, "r": 330.20337, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}}, {"id": 306, "text": "September 2012 ", "bbox": {"l": 331.00137, "t": 387.38828, "r": 342.9715, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}}, {"id": 307, "text": "Record date for 2012 fi nal dividend", "bbox": {"l": 350.4722, "t": 387.38828, "r": 374.88693, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}}, {"id": 308, "text": "27", "bbox": {"l": 329.40536, "t": 389.93103, "r": 331.0173, "b": 392.18762, "coord_origin": "TOPLEFT"}}, {"id": 309, "text": "September 2012 ", "bbox": {"l": 331.82327, "t": 389.93103, "r": 343.91284, "b": 392.18762, "coord_origin": "TOPLEFT"}}, {"id": 310, "text": "Final dividend payable", "bbox": {"l": 350.4722, "t": 389.93103, "r": 365.65988, "b": 392.18762, "coord_origin": "TOPLEFT"}}, {"id": 311, "text": "23", "bbox": {"l": 329.40536, "t": 392.47382, "r": 330.98804, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}}, {"id": 312, "text": "October 2012 ", "bbox": {"l": 331.77936, "t": 392.47382, "r": 342.06674, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}}, {"id": 313, "text": "Annual General Meeting", "bbox": {"l": 350.4722, "t": 392.47382, "r": 367.22156, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}}, {"id": 314, "text": "27", "bbox": {"l": 329.40536, "t": 395.0166, "r": 330.99741, "b": 397.27313, "coord_origin": "TOPLEFT"}}, {"id": 315, "text": "February 2013", "bbox": {"l": 331.7934, "t": 395.0166, "r": 342.1416, "b": 397.27313, "coord_origin": "TOPLEFT"}}, {"id": 316, "text": " 1", "bbox": {"l": 342.64841, "t": 395.18298, "r": 342.65811, "b": 396.49857000000003, "coord_origin": "TOPLEFT"}}, {"id": 317, "text": "2013 interim result and interim dividend announced", "bbox": {"l": 350.47177, "t": 395.01474, "r": 386.25897, "b": 397.2713, "coord_origin": "TOPLEFT"}}, {"id": 318, "text": "28", "bbox": {"l": 329.40491, "t": 397.55749999999995, "r": 331.02695, "b": 399.81406, "coord_origin": "TOPLEFT"}}, {"id": 319, "text": "August 2013", "bbox": {"l": 331.83795, "t": 397.55749999999995, "r": 340.75909, "b": 399.81406, "coord_origin": "TOPLEFT"}}, {"id": 320, "text": " 1", "bbox": {"l": 341.26437, "t": 397.7254, "r": 341.27408, "b": 399.04095, "coord_origin": "TOPLEFT"}}, {"id": 321, "text": "2013 full year results and fi nal dividend announced ", "bbox": {"l": 350.47144, "t": 397.55713, "r": 385.93265, "b": 399.81369, "coord_origin": "TOPLEFT"}}, {"id": 322, "text": "1", "bbox": {"l": 329.40536, "t": 400.46155, "r": 329.87708, "b": 401.96588, "coord_origin": "TOPLEFT"}}, {"id": 323, "text": "Indicative dates only, subject to change/Board confi rmation", "bbox": {"l": 330.34882, "t": 400.46155, "r": 358.65204, "b": 401.96588, "coord_origin": "TOPLEFT"}}, {"id": 324, "text": "AGL\u2019s Annual General Meeting will be held at the City Recital Hall, Angel Place, Sydney ", "bbox": {"l": 329.40536, "t": 404.34503, "r": 391.771, "b": 406.60156, "coord_origin": "TOPLEFT"}}, {"id": 325, "text": "commencing at 10.30am on Tuesday 23 October 2012.", "bbox": {"l": 329.40536, "t": 406.37857, "r": 369.65308, "b": 408.63513000000006, "coord_origin": "TOPLEFT"}}, {"id": 326, "text": "Ye s te rd ay", "bbox": {"l": 363.54486, "t": 460.53054999999995, "r": 379.25955, "b": 465.54507, "coord_origin": "TOPLEFT"}}, {"id": 327, "text": "Established in Sydney in 1837, and then ", "bbox": {"l": 363.54486, "t": 466.7157, "r": 391.38229, "b": 468.97223, "coord_origin": "TOPLEFT"}}, {"id": 328, "text": "known as The Australian Gas Light Company, ", "bbox": {"l": 363.54486, "t": 468.74924, "r": 395.01788, "b": 471.00577, "coord_origin": "TOPLEFT"}}, {"id": 329, "text": "the AGL business has an established history ", "bbox": {"l": 363.54486, "t": 470.78281, "r": 394.08322, "b": 473.03934, "coord_origin": "TOPLEFT"}}, {"id": 330, "text": "and reputation for serving the gas and ", "bbox": {"l": 363.54486, "t": 472.81635, "r": 390.60727, "b": 475.07288, "coord_origin": "TOPLEFT"}}, {"id": 331, "text": "electricity needs of Australian households. ", "bbox": {"l": 363.54486, "t": 474.84988, "r": 393.49612, "b": 477.10645, "coord_origin": "TOPLEFT"}}, {"id": 332, "text": "In 1841, when AGL supplied the gas to light ", "bbox": {"l": 363.54486, "t": 476.88345, "r": 394.11481, "b": 479.13998, "coord_origin": "TOPLEFT"}}, {"id": 333, "text": "the fi rst public street lamp, it was reported ", "bbox": {"l": 363.54486, "t": 478.91699, "r": 393.75891, "b": 481.17352, "coord_origin": "TOPLEFT"}}, {"id": 334, "text": "in the Sydney Gazette as a \u201cwonderful ", "bbox": {"l": 363.54486, "t": 480.95053, "r": 390.4975, "b": 483.20709, "coord_origin": "TOPLEFT"}}, {"id": 335, "text": "achievement of scientifi c knowledge, assisted ", "bbox": {"l": 363.54486, "t": 482.9841, "r": 395.70975, "b": 485.24063, "coord_origin": "TOPLEFT"}}, {"id": 336, "text": "by mechanical ingenuity.\u201d Within two years, ", "bbox": {"l": 363.54486, "t": 485.01764, "r": 394.27283, "b": 487.2742, "coord_origin": "TOPLEFT"}}, {"id": 337, "text": "165 gas lamps were lighting the City of Sydney.", "bbox": {"l": 363.54486, "t": 487.05121, "r": 396.65939, "b": 489.30774, "coord_origin": "TOPLEFT"}}, {"id": 338, "text": "Looking back on ", "bbox": {"l": 329.4054, "t": 419.93124, "r": 384.19696, "b": 431.09412, "coord_origin": "TOPLEFT"}}, {"id": 339, "text": "175 years of ", "bbox": {"l": 329.4054, "t": 430.10379, "r": 372.16626, "b": 441.26669, "coord_origin": "TOPLEFT"}}, {"id": 340, "text": "looking forward.", "bbox": {"l": 329.4054, "t": 440.27636999999993, "r": 385.3981, "b": 451.43924, "coord_origin": "TOPLEFT"}}, {"id": 341, "text": "AGL Energy Limited ABN 74 115 061 375", "bbox": {"l": 329.40536, "t": 372.16159, "r": 353.36179, "b": 373.91669, "coord_origin": "TOPLEFT"}}, {"id": 342, "text": "29", "bbox": {"l": 546.20587, "t": 360.90448, "r": 548.23407, "b": 362.82242, "coord_origin": "TOPLEFT"}}, {"id": 343, "text": "signs, signals and road markings", "bbox": {"l": 497.77728, "t": 251.43384000000003, "r": 542.8255, "b": 254.94385, "coord_origin": "TOPLEFT"}}, {"id": 344, "text": "3", "bbox": {"l": 490.30679, "t": 251.47478999999998, "r": 492.09982, "b": 254.98479999999995, "coord_origin": "TOPLEFT"}}, {"id": 345, "text": "In ", "bbox": {"l": 498.15335, "t": 263.88922, "r": 500.05637, "b": 265.92719, "coord_origin": "TOPLEFT"}}, {"id": 346, "text": "chapter 2, you and your vehicle", "bbox": {"l": 500.05637, "t": 263.85717999999997, "r": 524.37036, "b": 265.86310000000003, "coord_origin": "TOPLEFT"}}, {"id": 347, "text": ", you learned about ", "bbox": {"l": 524.37036, "t": 263.88922, "r": 539.89124, "b": 265.92719, "coord_origin": "TOPLEFT"}}, {"id": 348, "text": "some of the controls in your vehicle. This chapter is a handy ", "bbox": {"l": 498.15335, "t": 265.93224999999995, "r": 544.50403, "b": 267.97020999999995, "coord_origin": "TOPLEFT"}}, {"id": 349, "text": "reference section that gives examples of the most common ", "bbox": {"l": 498.15335, "t": 267.97533999999996, "r": 544.01343, "b": 270.01331000000005, "coord_origin": "TOPLEFT"}}, {"id": 350, "text": "signs, signals and road markings that keep traffi c organized ", "bbox": {"l": 498.15335, "t": 270.01831000000004, "r": 544.11987, "b": 272.05634, "coord_origin": "TOPLEFT"}}, {"id": 351, "text": "and flowing smoothly. ", "bbox": {"l": 498.15335, "t": 272.06140000000005, "r": 515.41071, "b": 274.09937, "coord_origin": "TOPLEFT"}}, {"id": 352, "text": "Signs", "bbox": {"l": 498.15335, "t": 277.34619, "r": 505.64642000000003, "b": 280.9357, "coord_origin": "TOPLEFT"}}, {"id": 353, "text": "There are three ways to read signs: by their shape, colour and ", "bbox": {"l": 498.15335, "t": 281.82187, "r": 543.92957, "b": 283.85983, "coord_origin": "TOPLEFT"}}, {"id": 354, "text": "the messages printed on them. Understanding these three ways ", "bbox": {"l": 498.15335, "t": 283.8649, "r": 545.67834, "b": 285.90289, "coord_origin": "TOPLEFT"}}, {"id": 355, "text": "of classifying signs will help you figure out the meaning of signs ", "bbox": {"l": 498.15335, "t": 285.90796, "r": 545.26471, "b": 287.94592, "coord_origin": "TOPLEFT"}}, {"id": 356, "text": "that are new to you. ", "bbox": {"l": 498.15335, "t": 287.95099, "r": 513.31335, "b": 289.98895, "coord_origin": "TOPLEFT"}}, {"id": 357, "text": "Stop", "bbox": {"l": 505.43439, "t": 303.07596, "r": 508.53033000000005, "b": 304.89639, "coord_origin": "TOPLEFT"}}, {"id": 358, "text": "Yield the right-of-way", "bbox": {"l": 527.45502, "t": 303.25354, "r": 541.44678, "b": 305.07397, "coord_origin": "TOPLEFT"}}, {"id": 359, "text": "Shows driving", "bbox": {"l": 501.79385, "t": 321.18973, "r": 510.41632, "b": 323.01016, "coord_origin": "TOPLEFT"}}, {"id": 360, "text": "regulations", "bbox": {"l": 501.79385, "t": 322.87731999999994, "r": 509.04268999999994, "b": 324.69775000000004, "coord_origin": "TOPLEFT"}}, {"id": 361, "text": "Explains lane use", "bbox": {"l": 518.66455, "t": 319.59146, "r": 529.80902, "b": 321.41190000000006, "coord_origin": "TOPLEFT"}}, {"id": 362, "text": "School zone signs ", "bbox": {"l": 534.87561, "t": 318.37616, "r": 546.95142, "b": 320.19659, "coord_origin": "TOPLEFT"}}, {"id": 363, "text": "are fl uorescent ", "bbox": {"l": 534.87561, "t": 320.0637500000001, "r": 545.05762, "b": 321.88419, "coord_origin": "TOPLEFT"}}, {"id": 364, "text": "yellow-green", "bbox": {"l": 534.87561, "t": 321.75134, "r": 543.32263, "b": 323.57178, "coord_origin": "TOPLEFT"}}, {"id": 365, "text": "Tells about motorist ", "bbox": {"l": 499.21862999999996, "t": 338.12772, "r": 512.62451, "b": 339.94815, "coord_origin": "TOPLEFT"}}, {"id": 366, "text": "services", "bbox": {"l": 499.21862999999996, "t": 339.81531000000007, "r": 504.39917, "b": 341.63574, "coord_origin": "TOPLEFT"}}, {"id": 367, "text": "Shows a permitted ", "bbox": {"l": 516.97748, "t": 338.06039, "r": 529.77484, "b": 339.88082999999995, "coord_origin": "TOPLEFT"}}, {"id": 368, "text": "action", "bbox": {"l": 516.97748, "t": 339.74799, "r": 520.96399, "b": 341.56842, "coord_origin": "TOPLEFT"}}, {"id": 369, "text": "Shows an action that ", "bbox": {"l": 534.55847, "t": 337.88281, "r": 548.58453, "b": 339.7032500000001, "coord_origin": "TOPLEFT"}}, {"id": 370, "text": "is not permitted", "bbox": {"l": 534.55847, "t": 339.57040000000006, "r": 545.08862, "b": 341.39084, "coord_origin": "TOPLEFT"}}, {"id": 371, "text": "Warns of hazards ", "bbox": {"l": 483.05853, "t": 356.17416, "r": 494.72577, "b": 357.9946, "coord_origin": "TOPLEFT"}}, {"id": 372, "text": "ahead", "bbox": {"l": 483.05853, "t": 357.86179, "r": 487.07525999999996, "b": 359.68222, "coord_origin": "TOPLEFT"}}, {"id": 373, "text": "Warns of", "bbox": {"l": 499.39645, "t": 356.26297000000005, "r": 504.69171, "b": 358.0834, "coord_origin": "TOPLEFT"}}, {"id": 374, "text": "construction zones", "bbox": {"l": 499.39645, "t": 357.95056, "r": 511.69116, "b": 359.77099999999996, "coord_origin": "TOPLEFT"}}, {"id": 375, "text": "Railway crossing", "bbox": {"l": 516.75891, "t": 356.26297000000005, "r": 527.42938, "b": 358.0834, "coord_origin": "TOPLEFT"}}, {"id": 376, "text": "Shows distance and ", "bbox": {"l": 534.5141, "t": 352.92981, "r": 547.89862, "b": 354.75024, "coord_origin": "TOPLEFT"}}, {"id": 377, "text": "direction", "bbox": {"l": 534.5141, "t": 354.6174, "r": 540.2818, "b": 356.43784, "coord_origin": "TOPLEFT"}}, {"id": 378, "text": "\u2022", "bbox": {"l": 478.37466, "t": 270.14075, "r": 479.14251999999993, "b": 272.17877, "coord_origin": "TOPLEFT"}}, {"id": 379, "text": "Signs", "bbox": {"l": 479.91036999999994, "t": 270.14075, "r": 483.74963, "b": 272.17877, "coord_origin": "TOPLEFT"}}, {"id": 380, "text": "- regulatory signs", "bbox": {"l": 479.97293, "t": 272.84717, "r": 492.31219, "b": 274.34888, "coord_origin": "TOPLEFT"}}, {"id": 381, "text": "- school, ", "bbox": {"l": 479.97293, "t": 275.14513999999997, "r": 486.72598000000005, "b": 276.64679, "coord_origin": "TOPLEFT"}}, {"id": 382, "text": "playground and ", "bbox": {"l": 481.21602999999993, "t": 276.77972, "r": 492.93286000000006, "b": 278.81768999999997, "coord_origin": "TOPLEFT"}}, {"id": 383, "text": "crosswalk signs", "bbox": {"l": 481.21602999999993, "t": 278.82275000000004, "r": 491.82938000000007, "b": 280.86075, "coord_origin": "TOPLEFT"}}, {"id": 384, "text": "- lane use signs", "bbox": {"l": 479.97293, "t": 281.52759, "r": 491.00775000000004, "b": 283.02924, "coord_origin": "TOPLEFT"}}, {"id": 385, "text": "- turn control signs", "bbox": {"l": 479.97293, "t": 283.82556, "r": 493.32748, "b": 285.3272099999999, "coord_origin": "TOPLEFT"}}, {"id": 386, "text": "- parking signs", "bbox": {"l": 479.97293, "t": 286.1235, "r": 490.4915199999999, "b": 287.62518, "coord_origin": "TOPLEFT"}}, {"id": 387, "text": "- reserved lane ", "bbox": {"l": 479.97293, "t": 288.42148, "r": 491.17004000000003, "b": 289.92316, "coord_origin": "TOPLEFT"}}, {"id": 388, "text": "signs", "bbox": {"l": 481.21602999999993, "t": 290.05605999999995, "r": 484.77405000000005, "b": 292.09406, "coord_origin": "TOPLEFT"}}, {"id": 389, "text": "- warning signs", "bbox": {"l": 479.97293, "t": 292.76169000000004, "r": 490.83398, "b": 294.26334, "coord_origin": "TOPLEFT"}}, {"id": 390, "text": "- object markers", "bbox": {"l": 479.97293, "t": 295.05963, "r": 491.62692, "b": 296.56131, "coord_origin": "TOPLEFT"}}, {"id": 391, "text": "- construction ", "bbox": {"l": 479.97293, "t": 297.3576, "r": 490.37341, "b": 298.8592499999999, "coord_origin": "TOPLEFT"}}, {"id": 392, "text": "signs", "bbox": {"l": 481.21602999999993, "t": 298.99219, "r": 484.77405000000005, "b": 301.03015, "coord_origin": "TOPLEFT"}}, {"id": 393, "text": "- information and ", "bbox": {"l": 479.97293, "t": 301.69780999999995, "r": 492.93912, "b": 303.19946, "coord_origin": "TOPLEFT"}}, {"id": 394, "text": "destination signs", "bbox": {"l": 481.21602999999993, "t": 303.3324, "r": 493.00525, "b": 305.37036, "coord_origin": "TOPLEFT"}}, {"id": 395, "text": "- railway signs", "bbox": {"l": 479.97293, "t": 306.0379899999999, "r": 489.99047999999993, "b": 307.53967, "coord_origin": "TOPLEFT"}}, {"id": 396, "text": "\u2022", "bbox": {"l": 478.375, "t": 308.24789, "r": 479.1032400000001, "b": 310.28586, "coord_origin": "TOPLEFT"}}, {"id": 397, "text": "Signals", "bbox": {"l": 479.83151, "t": 308.24789, "r": 484.92925999999994, "b": 310.28586, "coord_origin": "TOPLEFT"}}, {"id": 398, "text": "- lane control ", "bbox": {"l": 479.97293, "t": 310.95358, "r": 490.00091999999995, "b": 312.45526, "coord_origin": "TOPLEFT"}}, {"id": 399, "text": "signals", "bbox": {"l": 481.21602999999993, "t": 312.5881999999999, "r": 485.95331, "b": 314.62616, "coord_origin": "TOPLEFT"}}, {"id": 400, "text": "- traffic lights", "bbox": {"l": 479.97293, "t": 315.29379, "r": 489.29876999999993, "b": 316.79544, "coord_origin": "TOPLEFT"}}, {"id": 401, "text": "\u2022", "bbox": {"l": 478.375, "t": 317.50366, "r": 479.18129999999996, "b": 319.5416599999999, "coord_origin": "TOPLEFT"}}, {"id": 402, "text": "Road markings", "bbox": {"l": 479.98761, "t": 317.50366, "r": 490.46960000000007, "b": 319.5416599999999, "coord_origin": "TOPLEFT"}}, {"id": 403, "text": "- yellow lines", "bbox": {"l": 479.97293, "t": 320.20938, "r": 489.26166000000006, "b": 321.71103, "coord_origin": "TOPLEFT"}}, {"id": 404, "text": "- white lines", "bbox": {"l": 479.97293, "t": 322.50732, "r": 488.59189, "b": 324.009, "coord_origin": "TOPLEFT"}}, {"id": 405, "text": "- reserved lane ", "bbox": {"l": 479.97293, "t": 324.8053, "r": 491.17004000000003, "b": 326.30698, "coord_origin": "TOPLEFT"}}, {"id": 406, "text": "markings", "bbox": {"l": 481.21602999999993, "t": 326.43988, "r": 487.58978, "b": 328.47784, "coord_origin": "TOPLEFT"}}, {"id": 407, "text": "- other markings", "bbox": {"l": 479.97293, "t": 329.14551, "r": 491.75177, "b": 330.64716, "coord_origin": "TOPLEFT"}}, {"id": 408, "text": "in this chapter", "bbox": {"l": 478.15246999999994, "t": 265.07030999999995, "r": 493.75586, "b": 268.06872999999996, "coord_origin": "TOPLEFT"}}], "children": [{"id": 32, "label": "text", "bbox": {"l": 327.86951, "t": 351.78085, "r": 330.41248, "b": 353.95465, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "13", "bbox": {"l": 327.86951, "t": 351.78085, "r": 330.41248, "b": 353.95465, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 327.83005, "t": 331.57268999999997, "r": 351.16092, "b": 333.31171, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "USING THE VERTICAL TUBE -", "bbox": {"l": 327.83005, "t": 331.57268999999997, "r": 351.16092, "b": 333.31171, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 327.83005, "t": 333.18292, "r": 348.30536, "b": 334.92194, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "MODELS AY11230/11234", "bbox": {"l": 327.83005, "t": 333.18292, "r": 348.30536, "b": 334.92194, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 327.83005, "t": 336.40439, "r": 329.05914, "b": 337.92606, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "1.", "bbox": {"l": 327.83005, "t": 336.40439, "r": 329.05914, "b": 337.92606, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 329.67368, "t": 336.40439, "r": 349.95349, "b": 337.92606, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "The vertical tube can be used for", "bbox": {"l": 329.67368, "t": 336.40439, "r": 349.95349, "b": 337.92606, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 329.11752, "t": 337.83588, "r": 353.57977, "b": 339.35751000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "instructional viewing or to photograph", "bbox": {"l": 329.11752, "t": 337.83588, "r": 353.57977, "b": 339.35751000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 327.77121, "t": 339.26736, "r": 352.4306, "b": 340.789, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": " the image with a digital camera or a", "bbox": {"l": 327.77121, "t": 339.26736, "r": 352.4306, "b": 340.789, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 328.15176, "t": 340.69882, "r": 337.91086, "b": 342.22049, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": " micro TV unit", "bbox": {"l": 328.15176, "t": 340.69882, "r": 337.91086, "b": 342.22049, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 327.8313, "t": 342.19043000000005, "r": 329.09155, "b": 343.71207, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "2.", "bbox": {"l": 327.8313, "t": 342.19043000000005, "r": 329.09155, "b": 343.71207, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 329.72168, "t": 342.19043000000005, "r": 354.9267, "b": 343.71207, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "Loosen the retention screw, then rotate ", "bbox": {"l": 329.72168, "t": 342.19043000000005, "r": 354.9267, "b": 343.71207, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 327.8313, "t": 343.62192, "r": 351.66949, "b": 345.14355, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": " the adjustment ring to change the ", "bbox": {"l": 327.8313, "t": 343.62192, "r": 351.66949, "b": 345.14355, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 328.21185, "t": 345.05338, "r": 346.33179, "b": 346.57504, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": " length of the vertical tube.", "bbox": {"l": 328.21185, "t": 345.05338, "r": 346.33179, "b": 346.57504, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 327.83005, "t": 346.84680000000003, "r": 329.12726, "b": 348.36847, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "3.", "bbox": {"l": 327.83005, "t": 346.84680000000003, "r": 329.12726, "b": 348.36847, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 329.77588, "t": 346.84680000000003, "r": 351.18005, "b": 348.36847, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "Make sure that both the images in", "bbox": {"l": 329.77588, "t": 346.84680000000003, "r": 351.18005, "b": 348.36847, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 327.25311, "t": 254.94812000000002, "r": 350.07861, "b": 258.86096, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "OPERATION ", "bbox": {"l": 327.25311, "t": 254.94812000000002, "r": 350.07861, "b": 258.86096, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 350.07861, "t": 254.76782000000003, "r": 351.82651, "b": 258.68066, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "(", "bbox": {"l": 350.07861, "t": 254.76782000000003, "r": 351.82651, "b": 258.68066, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 351.82651, "t": 254.94812000000002, "r": 360.85242, "b": 258.86096, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "cont.", "bbox": {"l": 351.82651, "t": 254.94812000000002, "r": 360.85242, "b": 258.86096, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 360.85242, "t": 254.76782000000003, "r": 362.60028, "b": 258.68066, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": ")", "bbox": {"l": 360.85242, "t": 254.76782000000003, "r": 362.60028, "b": 258.68066, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 326.88037, "t": 263.49492999999995, "r": 345.84351, "b": 265.23395000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "SELECTING OBJECTIVE ", "bbox": {"l": 326.88037, "t": 263.49492999999995, "r": 345.84351, "b": 265.23395000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 326.88037, "t": 265.10515999999996, "r": 340.54153, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "MAGNIFICATION", "bbox": {"l": 326.88037, "t": 265.10515999999996, "r": 340.54153, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 326.88037, "t": 266.71533, "r": 328.31903, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "1.", "bbox": {"l": 326.88037, "t": 266.71533, "r": 328.31903, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 329.03836, "t": 266.71533, "r": 354.21472, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "There are two objectives. The lower", "bbox": {"l": 329.03836, "t": 266.71533, "r": 354.21472, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 326.88037, "t": 268.32556, "r": 355.19193, "b": 270.06458, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": " magnification objective has a greater", "bbox": {"l": 326.88037, "t": 268.32556, "r": 355.19193, "b": 270.06458, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 326.88037, "t": 269.93579, "r": 345.80057, "b": 271.6748, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": " depth of field and view.", "bbox": {"l": 326.88037, "t": 269.93579, "r": 345.80057, "b": 271.6748, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 326.88037, "t": 271.54602, "r": 328.33862, "b": 273.28503, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "2.", "bbox": {"l": 326.88037, "t": 271.54602, "r": 328.33862, "b": 273.28503, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 329.06775, "t": 271.54602, "r": 352.39969, "b": 273.28503, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "In order to observe the specimen", "bbox": {"l": 329.06775, "t": 271.54602, "r": 352.39969, "b": 273.28503, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 326.88037, "t": 273.15619000000004, "r": 352.90042, "b": 274.89526, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": " easily use the lower magnification", "bbox": {"l": 326.88037, "t": 273.15619000000004, "r": 352.90042, "b": 274.89526, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 326.88037, "t": 274.76642000000004, "r": 354.59546, "b": 276.50543000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": " objective first. Then, by rotating the", "bbox": {"l": 326.88037, "t": 274.76642000000004, "r": 354.59546, "b": 276.50543000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 326.88037, "t": 276.37665000000004, "r": 350.81885, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": " case, the magnification can be", "bbox": {"l": 326.88037, "t": 276.37665000000004, "r": 350.81885, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 326.88037, "t": 277.98688000000004, "r": 335.46707, "b": 279.72589000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": " changed.", "bbox": {"l": 326.88037, "t": 277.98688000000004, "r": 335.46707, "b": 279.72589000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 326.88037, "t": 281.20728, "r": 354.57755, "b": 282.94632, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 107, "text": "CHANGING THE INTERPUPILLARY ", "bbox": {"l": 326.88037, "t": 281.20728, "r": 354.57755, "b": 282.94632, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 326.88037, "t": 282.81750000000005, "r": 335.1752, "b": 284.55652, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 108, "text": "DISTANCE", "bbox": {"l": 326.88037, "t": 282.81750000000005, "r": 335.1752, "b": 284.55652, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 326.88037, "t": 284.4277, "r": 328.34784, "b": 286.16675, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 109, "text": "1.", "bbox": {"l": 326.88037, "t": 284.4277, "r": 328.34784, "b": 286.16675, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 329.08157, "t": 284.4277, "r": 354.76245, "b": 286.16675, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 110, "text": "The distance between the observer's", "bbox": {"l": 329.08157, "t": 284.4277, "r": 354.76245, "b": 286.16675, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 326.88037, "t": 286.03793, "r": 354.6499, "b": 287.77695, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 111, "text": " pupils is the interpupillary distance.", "bbox": {"l": 326.88037, "t": 286.03793, "r": 354.6499, "b": 287.77695, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 326.88037, "t": 287.64813, "r": 328.25125, "b": 289.38718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 112, "text": "2.", "bbox": {"l": 326.88037, "t": 287.64813, "r": 328.25125, "b": 289.38718, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 328.93671, "t": 287.64813, "r": 354.29825, "b": 289.38718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 113, "text": "To adjust the interpupillary distance", "bbox": {"l": 328.93671, "t": 287.64813, "r": 354.29825, "b": 289.38718, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 326.88181, "t": 289.25836, "r": 355.02075, "b": 290.99738, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 114, "text": " rotate the prism caps until both eyes", "bbox": {"l": 326.88181, "t": 289.25836, "r": 355.02075, "b": 290.99738, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 326.88181, "t": 290.86855999999995, "r": 350.82028, "b": 292.6076, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 115, "text": " coincide with the image in the", "bbox": {"l": 326.88181, "t": 290.86855999999995, "r": 350.82028, "b": 292.6076, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 326.88181, "t": 292.47879, "r": 336.2067, "b": 294.2178, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 116, "text": " eyepiece. ", "bbox": {"l": 326.88181, "t": 292.47879, "r": 336.2067, "b": 294.2178, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 326.88181, "t": 295.69922, "r": 335.3941, "b": 297.43823, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 117, "text": "FOCUSING", "bbox": {"l": 326.88181, "t": 295.69922, "r": 335.3941, "b": 297.43823, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 326.88181, "t": 297.30942, "r": 328.34314, "b": 299.04846, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 118, "text": "1.", "bbox": {"l": 326.88181, "t": 297.30942, "r": 328.34314, "b": 299.04846, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 329.07379, "t": 297.30942, "r": 353.18555, "b": 299.04846, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 119, "text": "Remove the lens protective cover.", "bbox": {"l": 329.07379, "t": 297.30942, "r": 353.18555, "b": 299.04846, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 326.88324, "t": 298.91965, "r": 328.35919, "b": 300.65866, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 120, "text": "2.", "bbox": {"l": 326.88324, "t": 298.91965, "r": 328.35919, "b": 300.65866, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 329.0972, "t": 298.91965, "r": 353.45065, "b": 300.65866, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 121, "text": "Place the specimen on the working", "bbox": {"l": 329.0972, "t": 298.91965, "r": 353.45065, "b": 300.65866, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 326.88324, "t": 300.52985, "r": 333.32825, "b": 302.26889000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 122, "text": " stage.", "bbox": {"l": 326.88324, "t": 300.52985, "r": 333.32825, "b": 302.26889000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 326.88324, "t": 302.14008000000007, "r": 328.31296, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 123, "text": "3.", "bbox": {"l": 326.88324, "t": 302.14008000000007, "r": 328.31296, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 329.02783, "t": 302.14008000000007, "r": 354.76303, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 124, "text": "Focus the specimen with the left eye", "bbox": {"l": 329.02783, "t": 302.14008000000007, "r": 354.76303, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 326.88324, "t": 303.75027, "r": 355.96307, "b": 305.48932, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 125, "text": " first while turning the focus knob until", "bbox": {"l": 326.88324, "t": 303.75027, "r": 355.96307, "b": 305.48932, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 326.88324, "t": 305.3605, "r": 354.46594, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 126, "text": " the image appears clear and sharp.", "bbox": {"l": 326.88324, "t": 305.3605, "r": 354.46594, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 326.88324, "t": 306.9707, "r": 328.25488, "b": 308.70975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 127, "text": "4.", "bbox": {"l": 326.88324, "t": 306.9707, "r": 328.25488, "b": 308.70975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 328.9407, "t": 306.9707, "r": 356.37335, "b": 308.70975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 128, "text": "Rotate the right eyepiece ring until the", "bbox": {"l": 328.9407, "t": 306.9707, "r": 356.37335, "b": 308.70975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 326.88324, "t": 308.58093, "r": 355.38867, "b": 310.31995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 129, "text": " images in each eyepiece coincide and", "bbox": {"l": 326.88324, "t": 308.58093, "r": 355.38867, "b": 310.31995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 326.88324, "t": 310.19113, "r": 343.17249, "b": 311.93018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 130, "text": " are sharp and clear.", "bbox": {"l": 326.88324, "t": 310.19113, "r": 343.17249, "b": 311.93018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 326.88324, "t": 313.41156, "r": 344.13388, "b": 315.15059999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 131, "text": "CHANGING THE BULB", "bbox": {"l": 326.88324, "t": 313.41156, "r": 344.13388, "b": 315.15059999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 326.88324, "t": 315.02178999999995, "r": 328.37418, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 132, "text": "1.", "bbox": {"l": 326.88324, "t": 315.02178999999995, "r": 328.37418, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 329.11963, "t": 315.02178999999995, "r": 348.50162, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 133, "text": "Disconnect the power cord.", "bbox": {"l": 329.11963, "t": 315.02178999999995, "r": 348.50162, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 326.88324, "t": 316.63199, "r": 328.34061, "b": 318.37103, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 134, "text": "2.", "bbox": {"l": 326.88324, "t": 316.63199, "r": 328.34061, "b": 318.37103, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 329.06931, "t": 316.63199, "r": 353.11588, "b": 318.37103, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 135, "text": "When the bulb is cool, remove the", "bbox": {"l": 329.06931, "t": 316.63199, "r": 353.11588, "b": 318.37103, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 326.88464, "t": 318.2422199999999, "r": 353.79517, "b": 319.9812299999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 136, "text": " oblique illuminator cap and remove", "bbox": {"l": 326.88464, "t": 318.2422199999999, "r": 353.79517, "b": 319.9812299999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 326.88464, "t": 319.85242000000005, "r": 348.02094, "b": 321.59146, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 137, "text": " the halogen bulb with cap.", "bbox": {"l": 326.88464, "t": 319.85242000000005, "r": 348.02094, "b": 321.59146, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 326.88464, "t": 321.46265, "r": 328.37512, "b": 323.20166, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 138, "text": "3.", "bbox": {"l": 326.88464, "t": 321.46265, "r": 328.37512, "b": 323.20166, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 329.12036, "t": 321.46265, "r": 352.96808, "b": 323.20166, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 139, "text": "Replace with a new halogen bulb.", "bbox": {"l": 329.12036, "t": 321.46265, "r": 352.96808, "b": 323.20166, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 326.88608, "t": 323.07285, "r": 328.36884, "b": 324.81189, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 140, "text": "4.", "bbox": {"l": 326.88608, "t": 323.07285, "r": 328.36884, "b": 324.81189, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 329.1102, "t": 323.07285, "r": 356.5412, "b": 324.81189, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 141, "text": "Open the window in the base plate and", "bbox": {"l": 329.1102, "t": 323.07285, "r": 356.5412, "b": 324.81189, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 326.88608, "t": 324.68307000000004, "r": 350.13828, "b": 326.42209, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 142, "text": " replace the halogen lamp or ", "bbox": {"l": 326.88608, "t": 324.68307000000004, "r": 350.13828, "b": 326.42209, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 326.88608, "t": 326.29327, "r": 351.59677, "b": 328.03232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 143, "text": " fluorescent lamp of transmitted", "bbox": {"l": 326.88608, "t": 326.29327, "r": 351.59677, "b": 328.03232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 326.88608, "t": 327.9035, "r": 336.89197, "b": 329.64252, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 144, "text": " illuminator.", "bbox": {"l": 326.88608, "t": 327.9035, "r": 336.89197, "b": 329.64252, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 358.42023, "t": 263.49492999999995, "r": 366.93256, "b": 265.23395000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 145, "text": "FOCUSING", "bbox": {"l": 358.42023, "t": 263.49492999999995, "r": 366.93256, "b": 265.23395000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 358.42023, "t": 265.10515999999996, "r": 359.89841, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 146, "text": "1.", "bbox": {"l": 358.42023, "t": 265.10515999999996, "r": 359.89841, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 360.63751, "t": 265.10515999999996, "r": 387.98407, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 147, "text": "Turn the focusing knob away or toward", "bbox": {"l": 360.63751, "t": 265.10515999999996, "r": 387.98407, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 358.42023, "t": 266.71533, "r": 384.58948, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 148, "text": " you until a clear image is viewed.", "bbox": {"l": 358.42023, "t": 266.71533, "r": 384.58948, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 358.42166, "t": 268.32556, "r": 359.78549, "b": 270.06458, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 149, "text": "2.", "bbox": {"l": 358.42166, "t": 268.32556, "r": 359.78549, "b": 270.06458, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 360.46741, "t": 268.32556, "r": 384.33441, "b": 270.06458, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 150, "text": "If the image is unclear, adjust the", "bbox": {"l": 360.46741, "t": 268.32556, "r": 384.33441, "b": 270.06458, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 358.4231, "t": 269.93579, "r": 384.61502, "b": 271.6748, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 151, "text": " height of the elevator up or down,", "bbox": {"l": 358.4231, "t": 269.93579, "r": 384.61502, "b": 271.6748, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 358.4231, "t": 271.54602, "r": 385.38922, "b": 273.28503, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 152, "text": " then turn the focusing knob again.", "bbox": {"l": 358.4231, "t": 271.54602, "r": 385.38922, "b": 273.28503, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 358.4231, "t": 274.76642000000004, "r": 377.35046, "b": 276.50543000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 153, "text": "ZOOM MAGNIFICATION", "bbox": {"l": 358.4231, "t": 274.76642000000004, "r": 377.35046, "b": 276.50543000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 358.4231, "t": 276.37665000000004, "r": 359.89429, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 154, "text": "1.", "bbox": {"l": 358.4231, "t": 276.37665000000004, "r": 359.89429, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 360.62988, "t": 276.37665000000004, "r": 386.37589, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 155, "text": "Turn the zoom magnification knob to", "bbox": {"l": 360.62988, "t": 276.37665000000004, "r": 386.37589, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 358.4231, "t": 277.98688000000004, "r": 386.78732, "b": 279.72589000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 156, "text": " the desired magnification and field of", "bbox": {"l": 358.4231, "t": 277.98688000000004, "r": 386.78732, "b": 279.72589000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 358.4231, "t": 279.59704999999997, "r": 364.16855, "b": 281.33609, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 157, "text": " view.", "bbox": {"l": 358.4231, "t": 279.59704999999997, "r": 364.16855, "b": 281.33609, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 358.4231, "t": 281.20728, "r": 359.86777, "b": 282.94632, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 158, "text": "2.", "bbox": {"l": 358.4231, "t": 281.20728, "r": 359.86777, "b": 282.94632, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 114, "label": "text", "bbox": {"l": 360.59012, "t": 281.20728, "r": 387.31656, "b": 282.94632, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 159, "text": "In most situations, it is recommended", "bbox": {"l": 360.59012, "t": 281.20728, "r": 387.31656, "b": 282.94632, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 115, "label": "text", "bbox": {"l": 358.4231, "t": 282.81750000000005, "r": 381.56656, "b": 284.55652, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 160, "text": " that you focus at the lowest ", "bbox": {"l": 358.4231, "t": 282.81750000000005, "r": 381.56656, "b": 284.55652, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 116, "label": "text", "bbox": {"l": 358.4231, "t": 284.4277, "r": 386.63403, "b": 286.16675, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 161, "text": " magnification, then move to a higher", "bbox": {"l": 358.4231, "t": 284.4277, "r": 386.63403, "b": 286.16675, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 117, "label": "text", "bbox": {"l": 358.42453, "t": 286.03793, "r": 382.77115, "b": 287.77695, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 162, "text": " magnification and re-focus as ", "bbox": {"l": 358.42453, "t": 286.03793, "r": 382.77115, "b": 287.77695, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 118, "label": "text", "bbox": {"l": 358.42453, "t": 287.64813, "r": 367.98694, "b": 289.38718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 163, "text": " necessary.", "bbox": {"l": 358.42453, "t": 287.64813, "r": 367.98694, "b": 289.38718, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 119, "label": "text", "bbox": {"l": 358.42453, "t": 289.25836, "r": 359.80386, "b": 290.99738, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 164, "text": "3.", "bbox": {"l": 358.42453, "t": 289.25836, "r": 359.80386, "b": 290.99738, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 120, "label": "text", "bbox": {"l": 360.49353, "t": 289.25836, "r": 386.70093, "b": 290.99738, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 165, "text": "If the image is not clear to both eyes", "bbox": {"l": 360.49353, "t": 289.25836, "r": 386.70093, "b": 290.99738, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 121, "label": "text", "bbox": {"l": 358.42453, "t": 290.86855999999995, "r": 388.03534, "b": 292.6076, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 166, "text": " at the same time, the diopter ring may", "bbox": {"l": 358.42453, "t": 290.86855999999995, "r": 388.03534, "b": 292.6076, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 122, "label": "text", "bbox": {"l": 358.42453, "t": 292.47879, "r": 373.13724, "b": 294.2178, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 167, "text": " need adjustment.", "bbox": {"l": 358.42453, "t": 292.47879, "r": 373.13724, "b": 294.2178, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 123, "label": "text", "bbox": {"l": 358.42453, "t": 295.69922, "r": 381.74539, "b": 297.43823, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 168, "text": "DIOPTER RING ADJUSTMENT", "bbox": {"l": 358.42453, "t": 295.69922, "r": 381.74539, "b": 297.43823, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 124, "label": "text", "bbox": {"l": 358.42453, "t": 297.30942, "r": 359.83682, "b": 299.04846, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 169, "text": "1.", "bbox": {"l": 358.42453, "t": 297.30942, "r": 359.83682, "b": 299.04846, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 125, "label": "text", "bbox": {"l": 360.54297, "t": 297.30942, "r": 388.08289, "b": 299.04846, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 170, "text": "To adjust the eyepiece for viewing with", "bbox": {"l": 360.54297, "t": 297.30942, "r": 388.08289, "b": 299.04846, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 126, "label": "text", "bbox": {"l": 358.42453, "t": 298.91965, "r": 382.73251, "b": 300.65866, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 171, "text": " or without eyeglasses and for ", "bbox": {"l": 358.42453, "t": 298.91965, "r": 382.73251, "b": 300.65866, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 127, "label": "text", "bbox": {"l": 358.42453, "t": 300.52985, "r": 387.72266, "b": 302.26889000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 172, "text": " differences in acuity between the right", "bbox": {"l": 358.42453, "t": 300.52985, "r": 387.72266, "b": 302.26889000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 128, "label": "text", "bbox": {"l": 358.42453, "t": 302.14008000000007, "r": 384.1991, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 173, "text": " and left eyes, follow the following", "bbox": {"l": 358.42453, "t": 302.14008000000007, "r": 384.1991, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 129, "label": "text", "bbox": {"l": 358.42453, "t": 303.75027, "r": 364.88672, "b": 305.48932, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 174, "text": " steps:", "bbox": {"l": 358.42453, "t": 303.75027, "r": 364.88672, "b": 305.48932, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 130, "label": "text", "bbox": {"l": 358.42453, "t": 305.3605, "r": 359.95078, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 175, "text": "a.", "bbox": {"l": 358.42453, "t": 305.3605, "r": 359.95078, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 131, "label": "text", "bbox": {"l": 361.47699, "t": 305.3605, "r": 386.65988, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 176, "text": "Observe an image through the left", "bbox": {"l": 361.47699, "t": 305.3605, "r": 386.65988, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 132, "label": "text", "bbox": {"l": 358.42453, "t": 306.9707, "r": 386.7634, "b": 308.70975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 177, "text": " eyepiece and bring a specific point", "bbox": {"l": 358.42453, "t": 306.9707, "r": 386.7634, "b": 308.70975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 133, "label": "text", "bbox": {"l": 358.42453, "t": 308.58093, "r": 385.41354, "b": 310.31995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 178, "text": " into focus using the focus knob.", "bbox": {"l": 358.42453, "t": 308.58093, "r": 385.41354, "b": 310.31995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 134, "label": "text", "bbox": {"l": 358.42453, "t": 310.19113, "r": 359.93304, "b": 311.93018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 179, "text": "b.", "bbox": {"l": 358.42453, "t": 310.19113, "r": 359.93304, "b": 311.93018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 135, "label": "text", "bbox": {"l": 361.44156, "t": 310.19113, "r": 382.56085, "b": 311.93018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 180, "text": "By turning the diopter ring ", "bbox": {"l": 361.44156, "t": 310.19113, "r": 382.56085, "b": 311.93018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 136, "label": "text", "bbox": {"l": 358.42596, "t": 311.80136, "r": 385.4559, "b": 313.54037, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 181, "text": " adjustment for the left eyepiece,", "bbox": {"l": 358.42596, "t": 311.80136, "r": 385.4559, "b": 313.54037, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 137, "label": "text", "bbox": {"l": 358.42596, "t": 313.41156, "r": 384.56122, "b": 315.15059999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 182, "text": " bring the same point into sharp", "bbox": {"l": 358.42596, "t": 313.41156, "r": 384.56122, "b": 315.15059999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 138, "label": "text", "bbox": {"l": 358.42596, "t": 315.02178999999995, "r": 366.74371, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 183, "text": " focus.", "bbox": {"l": 358.42596, "t": 315.02178999999995, "r": 366.74371, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 139, "label": "text", "bbox": {"l": 358.42596, "t": 316.63199, "r": 383.93884, "b": 318.37103, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 184, "text": " c.Then bring the same point into", "bbox": {"l": 358.42596, "t": 316.63199, "r": 383.93884, "b": 318.37103, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 140, "label": "text", "bbox": {"l": 358.42596, "t": 318.2422199999999, "r": 385.69241, "b": 319.9812299999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 185, "text": " focus through the right eyepiece", "bbox": {"l": 358.42596, "t": 318.2422199999999, "r": 385.69241, "b": 319.9812299999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 141, "label": "text", "bbox": {"l": 358.42596, "t": 319.85242000000005, "r": 385.94861, "b": 321.59146, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 186, "text": " by turning the right diopter ring.", "bbox": {"l": 358.42596, "t": 319.85242000000005, "r": 385.94861, "b": 321.59146, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 142, "label": "text", "bbox": {"l": 358.42596, "t": 321.46265, "r": 385.54236, "b": 323.20166, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 187, "text": " d.With more than one viewer, each", "bbox": {"l": 358.42596, "t": 321.46265, "r": 385.54236, "b": 323.20166, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 143, "label": "text", "bbox": {"l": 358.42596, "t": 323.07285, "r": 382.98718, "b": 324.81189, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 188, "text": " viewer should note their own", "bbox": {"l": 358.42596, "t": 323.07285, "r": 382.98718, "b": 324.81189, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 144, "label": "text", "bbox": {"l": 358.42596, "t": 324.68307000000004, "r": 385.06448, "b": 326.42209, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 189, "text": " diopter ring position for the left", "bbox": {"l": 358.42596, "t": 324.68307000000004, "r": 385.06448, "b": 326.42209, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 145, "label": "text", "bbox": {"l": 358.42596, "t": 326.29327, "r": 385.20682, "b": 328.03232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 190, "text": " and right eyepieces, then before", "bbox": {"l": 358.42596, "t": 326.29327, "r": 385.20682, "b": 328.03232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 146, "label": "text", "bbox": {"l": 358.42596, "t": 327.9035, "r": 382.21964, "b": 329.64252, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 191, "text": " viewing set the diopter ring", "bbox": {"l": 358.42596, "t": 327.9035, "r": 382.21964, "b": 329.64252, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 147, "label": "text", "bbox": {"l": 358.42596, "t": 329.5137, "r": 382.63382, "b": 331.25275, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 192, "text": " adjustments to that setting.", "bbox": {"l": 358.42596, "t": 329.5137, "r": 382.63382, "b": 331.25275, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 148, "label": "text", "bbox": {"l": 358.42596, "t": 332.73412999999994, "r": 375.67661, "b": 334.47317999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 193, "text": "CHANGING THE BULB", "bbox": {"l": 358.42596, "t": 332.73412999999994, "r": 375.67661, "b": 334.47317999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 149, "label": "text", "bbox": {"l": 358.42596, "t": 334.34436, "r": 359.90311, "b": 336.08337, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 194, "text": "1.", "bbox": {"l": 358.42596, "t": 334.34436, "r": 359.90311, "b": 336.08337, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 150, "label": "text", "bbox": {"l": 360.64169, "t": 334.34436, "r": 385.75333, "b": 336.08337, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 195, "text": "Disconnect the power cord from the", "bbox": {"l": 360.64169, "t": 334.34436, "r": 385.75333, "b": 336.08337, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 151, "label": "text", "bbox": {"l": 358.42596, "t": 335.95456, "r": 372.01416, "b": 337.6936, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 196, "text": " electrical outlet.", "bbox": {"l": 358.42596, "t": 335.95456, "r": 372.01416, "b": 337.6936, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 152, "label": "text", "bbox": {"l": 358.42596, "t": 337.56479, "r": 359.88327, "b": 339.3038, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 197, "text": "2.", "bbox": {"l": 358.42596, "t": 337.56479, "r": 359.88327, "b": 339.3038, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 153, "label": "text", "bbox": {"l": 360.61191, "t": 337.56479, "r": 384.65726, "b": 339.3038, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 198, "text": "When the bulb is cool, remove the", "bbox": {"l": 360.61191, "t": 337.56479, "r": 384.65726, "b": 339.3038, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 154, "label": "text", "bbox": {"l": 358.42596, "t": 339.17499, "r": 385.33649, "b": 340.9140300000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 199, "text": " oblique illuminator cap and remove", "bbox": {"l": 358.42596, "t": 339.17499, "r": 385.33649, "b": 340.9140300000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 155, "label": "text", "bbox": {"l": 358.42596, "t": 340.78522, "r": 379.57224, "b": 342.52423, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 200, "text": " the halogen bulb with cap.", "bbox": {"l": 358.42596, "t": 340.78522, "r": 379.57224, "b": 342.52423, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 156, "label": "text", "bbox": {"l": 358.4274, "t": 342.39542, "r": 359.91788, "b": 344.13446000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 201, "text": "3.", "bbox": {"l": 358.4274, "t": 342.39542, "r": 359.91788, "b": 344.13446000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 157, "label": "text", "bbox": {"l": 360.66312, "t": 342.39542, "r": 384.5108, "b": 344.13446000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 202, "text": "Replace with a new halogen bulb.", "bbox": {"l": 360.66312, "t": 342.39542, "r": 384.5108, "b": 344.13446000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 158, "label": "text", "bbox": {"l": 358.42883, "t": 344.00565000000006, "r": 359.92792, "b": 345.74466, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 203, "text": "4.", "bbox": {"l": 358.42883, "t": 344.00565000000006, "r": 359.92792, "b": 345.74466, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 159, "label": "text", "bbox": {"l": 360.67746, "t": 344.00565000000006, "r": 385.41235, "b": 345.74466, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 204, "text": "Open the window in the base plate", "bbox": {"l": 360.67746, "t": 344.00565000000006, "r": 385.41235, "b": 345.74466, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 160, "label": "text", "bbox": {"l": 358.42883, "t": 345.61584, "r": 383.2782, "b": 347.35489, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 205, "text": " and replace the halogen lamp or", "bbox": {"l": 358.42883, "t": 345.61584, "r": 383.2782, "b": 347.35489, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 161, "label": "text", "bbox": {"l": 358.42883, "t": 347.22607, "r": 383.13953, "b": 348.96509, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 206, "text": " fluorescent lamp of transmitted", "bbox": {"l": 358.42883, "t": 347.22607, "r": 383.13953, "b": 348.96509, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 162, "label": "text", "bbox": {"l": 358.42883, "t": 348.83627, "r": 368.43472, "b": 350.57532, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 207, "text": " illuminator.", "bbox": {"l": 358.42883, "t": 348.83627, "r": 368.43472, "b": 350.57532, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 163, "label": "text", "bbox": {"l": 326.59567, "t": 261.14185, "r": 339.11377, "b": 262.88091999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 208, "text": "Model AY11230", "bbox": {"l": 326.59567, "t": 261.14185, "r": 339.11377, "b": 262.88091999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 164, "label": "text", "bbox": {"l": 358.48605, "t": 261.14185, "r": 371.00415, "b": 262.88091999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 209, "text": "Model AY11234", "bbox": {"l": 358.48605, "t": 261.14185, "r": 371.00415, "b": 262.88091999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 165, "label": "text", "bbox": {"l": 455.43533, "t": 351.77038999999996, "r": 457.97827000000007, "b": 353.94415, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 210, "text": "14", "bbox": {"l": 455.43533, "t": 351.77038999999996, "r": 457.97827000000007, "b": 353.94415, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 166, "label": "text", "bbox": {"l": 408.24518, "t": 275.52673000000004, "r": 414.4234, "b": 276.96020999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 211, "text": "Objectives", "bbox": {"l": 408.24518, "t": 275.52673000000004, "r": 414.4234, "b": 276.96020999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 167, "label": "text", "bbox": {"l": 409.39554, "t": 268.98235999999997, "r": 419.06677, "b": 270.41583, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 212, "text": "Revolving Turret", "bbox": {"l": 409.39554, "t": 268.98235999999997, "r": 419.06677, "b": 270.41583, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 168, "label": "text", "bbox": {"l": 441.3895, "t": 279.12627999999995, "r": 445.87192, "b": 280.55975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 213, "text": "Coarse ", "bbox": {"l": 441.3895, "t": 279.12627999999995, "r": 445.87192, "b": 280.55975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 169, "label": "text", "bbox": {"l": 441.3895, "t": 280.30609, "r": 448.22338999999994, "b": 281.7395900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 214, "text": "Adjustment", "bbox": {"l": 441.3895, "t": 280.30609, "r": 448.22338999999994, "b": 281.7395900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 170, "label": "text", "bbox": {"l": 441.3895, "t": 281.48593, "r": 444.40371999999996, "b": 282.91939999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 215, "text": "Knob", "bbox": {"l": 441.3895, "t": 281.48593, "r": 444.40371999999996, "b": 282.91939999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 171, "label": "text", "bbox": {"l": 398.79288, "t": 254.94646999999998, "r": 428.91568, "b": 258.85931000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 216, "text": "MODEL AY11236", "bbox": {"l": 398.79288, "t": 254.94646999999998, "r": 428.91568, "b": 258.85931000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 172, "label": "text", "bbox": {"l": 398.32535, "t": 305.04291, "r": 435.93542, "b": 308.95572000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 217, "text": "MICROSCOPE USAGE", "bbox": {"l": 398.32535, "t": 305.04291, "r": 435.93542, "b": 308.95572000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 173, "label": "text", "bbox": {"l": 398.08594, "t": 310.35892, "r": 453.72171, "b": 312.53271, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 218, "text": "BARSKA Model AY11236 is a powerful fixed power compound ", "bbox": {"l": 398.08594, "t": 310.35892, "r": 453.72171, "b": 312.53271, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 174, "label": "text", "bbox": {"l": 398.08594, "t": 312.50586, "r": 453.09939999999995, "b": 314.67966, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 219, "text": "microscope designed for biological studies such as specimen ", "bbox": {"l": 398.08594, "t": 312.50586, "r": 453.09939999999995, "b": 314.67966, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 175, "label": "text", "bbox": {"l": 398.08594, "t": 314.6528, "r": 456.65246999999994, "b": 316.8266, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 220, "text": "examination. It can also be used for examining bacteria and", "bbox": {"l": 398.08594, "t": 314.6528, "r": 456.65246999999994, "b": 316.8266, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 176, "label": "text", "bbox": {"l": 398.08594, "t": 316.79977, "r": 456.73859000000004, "b": 318.97354, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 221, "text": "for general clinical and medical studies and other scientific uses. ", "bbox": {"l": 398.08594, "t": 316.79977, "r": 456.73859000000004, "b": 318.97354, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 177, "label": "text", "bbox": {"l": 398.62399, "t": 320.42941, "r": 427.77472, "b": 324.34222000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 222, "text": "CONSTRUCTION", "bbox": {"l": 398.62399, "t": 320.42941, "r": 427.77472, "b": 324.34222000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 178, "label": "text", "bbox": {"l": 398.08594, "t": 326.46069000000006, "r": 456.02639999999997, "b": 328.63449, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 223, "text": "BARSKA Model AY11236 is a fixed power compound microscope.", "bbox": {"l": 398.08594, "t": 326.46069000000006, "r": 456.02639999999997, "b": 328.63449, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 179, "label": "text", "bbox": {"l": 398.08414, "t": 328.6076699999999, "r": 455.42238999999995, "b": 330.7814599999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 224, "text": "It is constructed with two optical paths at the same angle. It is ", "bbox": {"l": 398.08414, "t": 328.6076699999999, "r": 455.42238999999995, "b": 330.7814599999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 180, "label": "text", "bbox": {"l": 398.08414, "t": 330.75461, "r": 457.39844, "b": 332.92841, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 225, "text": "equipped with transmitted illumination. By using this instrument, ", "bbox": {"l": 398.08414, "t": 330.75461, "r": 457.39844, "b": 332.92841, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 181, "label": "text", "bbox": {"l": 398.08414, "t": 332.90155, "r": 453.97745, "b": 335.07535000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 226, "text": "the user can observe specimens at magnification from 40x to ", "bbox": {"l": 398.08414, "t": 332.90155, "r": 453.97745, "b": 335.07535000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 182, "label": "text", "bbox": {"l": 398.08414, "t": 335.04852, "r": 454.70708999999994, "b": 337.22232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 227, "text": "1000x by selecting the desired objective lens. Coarse and fine ", "bbox": {"l": 398.08414, "t": 335.04852, "r": 454.70708999999994, "b": 337.22232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 183, "label": "text", "bbox": {"l": 398.08414, "t": 337.19547, "r": 458.90240000000006, "b": 339.36926, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 228, "text": "focus adjustments provide accuracy and image detail. The rotating ", "bbox": {"l": 398.08414, "t": 337.19547, "r": 458.90240000000006, "b": 339.36926, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 184, "label": "text", "bbox": {"l": 398.08594, "t": 339.34241, "r": 453.0672, "b": 341.5162, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 229, "text": "head allows the user to position the eyepieces for maximum ", "bbox": {"l": 398.08594, "t": 339.34241, "r": 453.0672, "b": 341.5162, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 185, "label": "text", "bbox": {"l": 398.08594, "t": 341.48938, "r": 449.63113, "b": 343.66318, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 230, "text": "viewing comfort and easy access to all adjustment knobs.", "bbox": {"l": 398.08594, "t": 341.48938, "r": 449.63113, "b": 343.66318, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 186, "label": "text", "bbox": {"l": 422.10626, "t": 301.24191, "r": 434.62433000000004, "b": 302.98096, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 231, "text": "Model AY11236", "bbox": {"l": 422.10626, "t": 301.24191, "r": 434.62433000000004, "b": 302.98096, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 187, "label": "text", "bbox": {"l": 442.01610999999997, "t": 283.08649, "r": 444.8817399999999, "b": 284.51996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 232, "text": "Fine ", "bbox": {"l": 442.01610999999997, "t": 283.08649, "r": 444.8817399999999, "b": 284.51996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 188, "label": "text", "bbox": {"l": 442.01610999999997, "t": 284.2663, "r": 448.85001, "b": 285.69980000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 233, "text": "Adjustment", "bbox": {"l": 442.01610999999997, "t": 284.2663, "r": 448.85001, "b": 285.69980000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 189, "label": "text", "bbox": {"l": 442.01610999999997, "t": 285.44611, "r": 445.03033000000005, "b": 286.87961, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 234, "text": "Knob", "bbox": {"l": 442.01610999999997, "t": 285.44611, "r": 445.03033000000005, "b": 286.87961, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 190, "label": "text", "bbox": {"l": 408.00577, "t": 279.12579000000005, "r": 411.42212, "b": 280.5593, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 235, "text": "Stage", "bbox": {"l": 408.00577, "t": 279.12579000000005, "r": 411.42212, "b": 280.5593, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 191, "label": "text", "bbox": {"l": 404.07172, "t": 280.9144299999999, "r": 410.77707, "b": 282.3479, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 236, "text": "Condenser ", "bbox": {"l": 404.07172, "t": 280.9144299999999, "r": 410.77707, "b": 282.3479, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 192, "label": "text", "bbox": {"l": 404.07172, "t": 282.09424, "r": 409.2157, "b": 283.52774, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 237, "text": "Focusing", "bbox": {"l": 404.07172, "t": 282.09424, "r": 409.2157, "b": 283.52774, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 193, "label": "text", "bbox": {"l": 404.07172, "t": 283.27408, "r": 407.08594, "b": 284.7075500000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 238, "text": "Knob", "bbox": {"l": 404.07172, "t": 283.27408, "r": 407.08594, "b": 284.7075500000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 194, "label": "text", "bbox": {"l": 441.81281, "t": 262.32178, "r": 447.03702, "b": 263.75525000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 239, "text": "Eyepiece", "bbox": {"l": 441.81281, "t": 262.32178, "r": 447.03702, "b": 263.75525000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 195, "label": "text", "bbox": {"l": 437.34607, "t": 271.13025000000005, "r": 440.80496, "b": 272.56281, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 240, "text": "Stand", "bbox": {"l": 437.34607, "t": 271.13025000000005, "r": 440.80496, "b": 272.56281, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 196, "label": "text", "bbox": {"l": 409.7164, "t": 284.40027, "r": 413.3768, "b": 285.83282, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 241, "text": "Lamp ", "bbox": {"l": 409.7164, "t": 284.40027, "r": 413.3768, "b": 285.83282, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 197, "label": "text", "bbox": {"l": 409.7164, "t": 285.83163, "r": 413.68201, "b": 287.26416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 242, "text": "On/Off", "bbox": {"l": 409.7164, "t": 285.83163, "r": 413.68201, "b": 287.26416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 198, "label": "text", "bbox": {"l": 409.7164, "t": 287.263, "r": 413.6337, "b": 288.69553, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 243, "text": "Switch", "bbox": {"l": 409.7164, "t": 287.263, "r": 413.6337, "b": 288.69553, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 199, "label": "text", "bbox": {"l": 434.8712499999999, "t": 296.7153, "r": 438.53164999999996, "b": 298.14783, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 244, "text": "Lamp ", "bbox": {"l": 434.8712499999999, "t": 296.7153, "r": 438.53164999999996, "b": 298.14783, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 200, "label": "text", "bbox": {"l": 439.52039, "t": 292.18307000000004, "r": 443.08768, "b": 293.61560000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 245, "text": "Power", "bbox": {"l": 439.52039, "t": 292.18307000000004, "r": 443.08768, "b": 293.61560000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 201, "label": "text", "bbox": {"l": 439.52039, "t": 293.61444, "r": 442.29575, "b": 295.04697, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 246, "text": "Cord", "bbox": {"l": 439.52039, "t": 293.61444, "r": 442.29575, "b": 295.04697, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 202, "label": "text", "bbox": {"l": 413.55829, "t": 264.66089, "r": 421.94913, "b": 266.09344, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 247, "text": "Rotating Head", "bbox": {"l": 413.55829, "t": 264.66089, "r": 421.94913, "b": 266.09344, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 203, "label": "text", "bbox": {"l": 441.84316999999993, "t": 286.90573, "r": 447.87585000000007, "b": 288.33826, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 248, "text": "Stage Clip", "bbox": {"l": 441.84316999999993, "t": 286.90573, "r": 447.87585000000007, "b": 288.33826, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 204, "label": "text", "bbox": {"l": 441.84316999999993, "t": 288.3371, "r": 448.67252, "b": 289.76962000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 249, "text": "Adjustment", "bbox": {"l": 441.84316999999993, "t": 288.3371, "r": 448.67252, "b": 289.76962000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 205, "label": "text", "bbox": {"l": 407.2403, "t": 259.86645999999996, "r": 425.79089, "b": 261.29895, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 250, "text": "Interpupillary Slide Adjustment", "bbox": {"l": 407.2403, "t": 259.86645999999996, "r": 425.79089, "b": 261.29895, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 206, "label": "text", "bbox": {"l": 449.10074000000003, "t": 378.66302, "r": 466.08835000000005, "b": 380.78412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 251, "text": "Circling Minimums", "bbox": {"l": 449.10074000000003, "t": 378.66302, "r": 466.08835000000005, "b": 380.78412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 207, "label": "text", "bbox": {"l": 449.10074000000003, "t": 383.2203999999999, "r": 449.64444, "b": 385.34148999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 252, "text": "7", "bbox": {"l": 449.10074000000003, "t": 383.2203999999999, "r": 449.64444, "b": 385.34148999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 208, "label": "text", "bbox": {"l": 450.18811, "t": 383.2203999999999, "r": 550.77124, "b": 385.34148999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 253, "text": "K H U H Z D V D F K D Q J H W R W K H 7 ( 5 3 6 F U L W H U L D L Q W K D W D \u1087H F W V F L U F O L Q J D U H D G L P H Q V L R Q E \\ H [ S D Q G L Q J W K H D U H D V W R S U R Y L G H ", "bbox": {"l": 450.18811, "t": 383.2203999999999, "r": 550.77124, "b": 385.34148999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 209, "label": "text", "bbox": {"l": 449.10074000000003, "t": 385.75732, "r": 536.14716, "b": 387.87842, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 254, "text": "improved obstacle protection. To indicate that the new criteria had been applied to a given procedure, a ", "bbox": {"l": 449.10074000000003, "t": 385.75732, "r": 536.14716, "b": 387.87842, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 210, "label": "text", "bbox": {"l": 538.31085, "t": 385.75732, "r": 549.49921, "b": 387.87842, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 255, "text": " is placed on ", "bbox": {"l": 538.31085, "t": 385.75732, "r": 549.49921, "b": 387.87842, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 211, "label": "text", "bbox": {"l": 449.10074000000003, "t": 388.03601, "r": 547.58185, "b": 390.1571, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 256, "text": "the circling line of minimums. The new circling tables and explanatory information is located in the Legend of the TPP.", "bbox": {"l": 449.10074000000003, "t": 388.03601, "r": 547.58185, "b": 390.1571, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 212, "label": "text", "bbox": {"l": 449.10074000000003, "t": 393.2128000000001, "r": 449.6163, "b": 395.33386, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 257, "text": "7", "bbox": {"l": 449.10074000000003, "t": 393.2128000000001, "r": 449.6163, "b": 395.33386, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 213, "label": "text", "bbox": {"l": 450.1319, "t": 393.2128000000001, "r": 529.53082, "b": 395.33386, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 258, "text": "K H D S S U R D F K H V X V L Q J V W D Q G D U G F L U F O L Q J D S S U R D F K D U H D V F D Q E H L G H Q W L \u00bf H G E \\ W K H D E V H Q F H R I W K H ", "bbox": {"l": 450.1319, "t": 393.2128000000001, "r": 529.53082, "b": 395.33386, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 214, "label": "text", "bbox": {"l": 532.05829, "t": 393.2128000000001, "r": 550.42261, "b": 395.33386, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 259, "text": " on the circling line of ", "bbox": {"l": 532.05829, "t": 393.2128000000001, "r": 550.42261, "b": 395.33386, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 215, "label": "text", "bbox": {"l": 449.10074000000003, "t": 395.49149, "r": 455.74692, "b": 397.61255, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 260, "text": "minima.", "bbox": {"l": 449.10074000000003, "t": 395.49149, "r": 455.74692, "b": 397.61255, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 216, "label": "text", "bbox": {"l": 449.95525999999995, "t": 415.59549, "r": 496.2829, "b": 417.50446, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 261, "text": "$ S S O \\ 6 W D Q G D U G & L U F O L Q J $ S S U R D F K 0 D Q H X Y H U L Q J 5 D G L X V 7 D E O H ", "bbox": {"l": 449.95525999999995, "t": 415.59549, "r": 496.2829, "b": 417.50446, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 217, "label": "text", "bbox": {"l": 501.13077, "t": 409.25543, "r": 551.16101, "b": 411.1644, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 262, "text": "$ S S O \\ ( [ S D Q G H G & L U F O L Q J $ S S U R D F K 0 D Q H X Y H U L Q J $ L U V S D F H 5 D G L X V ", "bbox": {"l": 501.13077, "t": 409.25543, "r": 551.16101, "b": 411.1644, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 218, "label": "text", "bbox": {"l": 501.13077, "t": 411.30624, "r": 505.2477999999999, "b": 413.21521, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 263, "text": "Table", "bbox": {"l": 501.13077, "t": 411.30624, "r": 505.2477999999999, "b": 413.21521, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 219, "label": "text", "bbox": {"l": 449.10074000000003, "t": 420.18802, "r": 469.35599, "b": 422.73331, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 264, "text": "AIRPORT SKETCH", "bbox": {"l": 449.10074000000003, "t": 420.18802, "r": 469.35599, "b": 422.73331, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 220, "label": "text", "bbox": {"l": 449.10074000000003, "t": 425.08908, "r": 525.93616, "b": 427.21017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 265, "text": "The airport sketch is a depiction of the airport with emphasis on runway pattern and related ", "bbox": {"l": 449.10074000000003, "t": 425.08908, "r": 525.93616, "b": 427.21017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 221, "label": "text", "bbox": {"l": 449.10074000000003, "t": 427.3678, "r": 522.0343, "b": 429.48886, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 266, "text": "information, positioned in either the lower left or lower right corner of the chart to aid pi-", "bbox": {"l": 449.10074000000003, "t": 427.3678, "r": 522.0343, "b": 429.48886, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 222, "label": "text", "bbox": {"l": 449.10074000000003, "t": 429.64648, "r": 524.67151, "b": 431.76755, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 267, "text": "lot recognition of the airport from the air and to provide some information to aid on ground ", "bbox": {"l": 449.10074000000003, "t": 429.64648, "r": 524.67151, "b": 431.76755, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 223, "label": "text", "bbox": {"l": 449.10074000000003, "t": 431.92514000000006, "r": 527.172, "b": 434.04623, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 268, "text": "navigation of the airport. The runways are drawn to scale and oriented to true north. Runway ", "bbox": {"l": 449.10074000000003, "t": 431.92514000000006, "r": 527.172, "b": 434.04623, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 224, "label": "text", "bbox": {"l": 449.10074000000003, "t": 434.20383, "r": 502.39545, "b": 436.32492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 269, "text": "dimensions (length and width) are shown for all active runways.", "bbox": {"l": 449.10074000000003, "t": 434.20383, "r": 502.39545, "b": 436.32492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 225, "label": "text", "bbox": {"l": 449.10074000000003, "t": 438.7611999999999, "r": 512.92676, "b": 440.88228999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 270, "text": "Runway(s) are depicted based on what type and construction of the runway.", "bbox": {"l": 449.10074000000003, "t": 438.7611999999999, "r": 512.92676, "b": 440.88228999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 226, "label": "text", "bbox": {"l": 449.95525999999995, "t": 444.07001, "r": 460.02307, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 271, "text": "Hard Surface", "bbox": {"l": 449.95525999999995, "t": 444.07001, "r": 460.02307, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 227, "label": "text", "bbox": {"l": 464.89963, "t": 444.07001, "r": 473.98819, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 272, "text": "Other Than ", "bbox": {"l": 464.89963, "t": 444.07001, "r": 473.98819, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 228, "label": "text", "bbox": {"l": 464.89963, "t": 446.12085, "r": 474.96744, "b": 448.02979, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 273, "text": "Hard Surface", "bbox": {"l": 464.89963, "t": 446.12085, "r": 474.96744, "b": 448.02979, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 229, "label": "text", "bbox": {"l": 478.91357, "t": 444.07001, "r": 489.45648, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 274, "text": "Metal Surface", "bbox": {"l": 478.91357, "t": 444.07001, "r": 489.45648, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 230, "label": "text", "bbox": {"l": 493.06420999999995, "t": 444.07001, "r": 505.03076, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 275, "text": "Closed Runway", "bbox": {"l": 493.06420999999995, "t": 444.07001, "r": 505.03076, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 231, "label": "text", "bbox": {"l": 509.5809, "t": 444.07001, "r": 524.30237, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 276, "text": "Under Construction", "bbox": {"l": 509.5809, "t": 444.07001, "r": 524.30237, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 232, "label": "text", "bbox": {"l": 449.95525999999995, "t": 454.81207, "r": 458.31406, "b": 456.72104, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 277, "text": "Stopways, ", "bbox": {"l": 449.95525999999995, "t": 454.81207, "r": 458.31406, "b": 456.72104, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 233, "label": "text", "bbox": {"l": 449.95525999999995, "t": 456.86288, "r": 461.92083999999994, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 278, "text": "Taxiways, Park-", "bbox": {"l": 449.95525999999995, "t": 456.86288, "r": 461.92083999999994, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 234, "label": "text", "bbox": {"l": 449.95525999999995, "t": 458.91373, "r": 457.08014, "b": 460.82268999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 279, "text": "ing Areas", "bbox": {"l": 449.95525999999995, "t": 458.91373, "r": 457.08014, "b": 460.82268999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 235, "label": "text", "bbox": {"l": 464.89963, "t": 454.81207, "r": 472.87732, "b": 456.72104, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 280, "text": "Displaced ", "bbox": {"l": 464.89963, "t": 454.81207, "r": 472.87732, "b": 456.72104, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 236, "label": "text", "bbox": {"l": 464.89963, "t": 456.86288, "r": 472.49792, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 281, "text": "Threshold", "bbox": {"l": 464.89963, "t": 456.86288, "r": 472.49792, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 237, "label": "text", "bbox": {"l": 478.91357, "t": 454.81207, "r": 483.61584, "b": 456.72104, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 282, "text": "Closed", "bbox": {"l": 478.91357, "t": 454.81207, "r": 483.61584, "b": 456.72104, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 238, "label": "text", "bbox": {"l": 478.91357, "t": 456.86288, "r": 486.60754000000003, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 283, "text": "Pavement", "bbox": {"l": 478.91357, "t": 456.86288, "r": 486.60754000000003, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 239, "label": "text", "bbox": {"l": 493.06420999999995, "t": 454.81207, "r": 504.20648, "b": 456.72104, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 284, "text": "Water Runway", "bbox": {"l": 493.06420999999995, "t": 454.81207, "r": 504.20648, "b": 456.72104, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 240, "label": "text", "bbox": {"l": 449.10074000000003, "t": 469.32974, "r": 548.59674, "b": 471.45081, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 285, "text": "Taxiways and aprons are shaded grey. Other runway features that may be shown are runway numbers, runway dimen-", "bbox": {"l": 449.10074000000003, "t": 469.32974, "r": 548.59674, "b": 471.45081, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 241, "label": "text", "bbox": {"l": 449.10074000000003, "t": 471.60843, "r": 500.08181999999994, "b": 473.72949, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 286, "text": "sions, runway slope, arresting gear, and displaced threshold.", "bbox": {"l": 449.10074000000003, "t": 471.60843, "r": 500.08181999999994, "b": 473.72949, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 242, "label": "text", "bbox": {"l": 449.10074000000003, "t": 476.16577, "r": 449.59933000000007, "b": 478.28687, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 287, "text": "2", "bbox": {"l": 449.10074000000003, "t": 476.16577, "r": 449.59933000000007, "b": 478.28687, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 243, "label": "text", "bbox": {"l": 450.09796, "t": 476.16577, "r": 547.82562, "b": 478.28687, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 288, "text": "W K H U L Q I R U P D W L R Q F R Q F H U Q L Q J O L J K W L Q J \u00bf Q D O D S S U R D F K E H D U L Q J V D L U S R U W E H D F R Q R E V W D F O H V F R Q W U R O W R Z H U 1 $ 9 $ , ' V K H O L ", "bbox": {"l": 450.09796, "t": 476.16577, "r": 547.82562, "b": 478.28687, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 244, "label": "text", "bbox": {"l": 547.82623, "t": 476.16577, "r": 548.45862, "b": 478.28687, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 289, "text": "-", "bbox": {"l": 547.82623, "t": 476.16577, "r": 548.45862, "b": 478.28687, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 245, "label": "text", "bbox": {"l": 449.10074000000003, "t": 478.44446, "r": 470.52609000000007, "b": 480.56555, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 290, "text": "pads may also be shown.", "bbox": {"l": 449.10074000000003, "t": 478.44446, "r": 470.52609000000007, "b": 480.56555, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 246, "label": "text", "bbox": {"l": 449.10074000000003, "t": 483.00183, "r": 493.37906000000004, "b": 485.12292, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 291, "text": "$ L U S R U W ( O H Y D W L R Q D Q G 7 R X F K G R Z Q = R Q H ( O H Y D W L R Q ", "bbox": {"l": 449.10074000000003, "t": 483.00183, "r": 493.37906000000004, "b": 485.12292, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 449.10074000000003, "t": 487.5592, "r": 551.80023, "b": 496.51636, "coord_origin": "TOPLEFT"}, "confidence": 0.5027860403060913, "cells": [{"id": 292, "text": "The airport elevation is shown enclosed within a box in the upper left corner of the sketch box and the touchdown zone ", "bbox": {"l": 449.10074000000003, "t": 487.5592, "r": 549.16168, "b": 489.6803, "coord_origin": "TOPLEFT"}}, {"id": 293, "text": "elevation (TDZE) is shown in the upper right corner of the sketch box. The airport elevation is the highest point of an ", "bbox": {"l": 449.10074000000003, "t": 489.83789, "r": 546.90881, "b": 491.95898, "coord_origin": "TOPLEFT"}}, {"id": 294, "text": "D L U S R U W \u00b6 V X V D E O H U X Q Z D \\ V P H D V X U H G L Q I H H W I U R P P H D Q V H D O H Y H O 7 K H 7 ' = ( L V W K H K L J K H V W H O H Y D W L R Q L Q W K H \u00bf U V W I H H W R I ", "bbox": {"l": 449.10074000000003, "t": 492.11658, "r": 551.80023, "b": 494.23767, "coord_origin": "TOPLEFT"}}, {"id": 295, "text": "the landing surface. Circling only approaches will not show a TDZE.", "bbox": {"l": 449.10074000000003, "t": 494.39526, "r": 505.85068000000007, "b": 496.51636, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 247, "label": "text", "bbox": {"l": 498.80661000000003, "t": 515.9437, "r": 502.08792, "b": 519.01764, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 296, "text": "114", "bbox": {"l": 498.80661000000003, "t": 515.9437, "r": 502.08792, "b": 519.01764, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 248, "label": "text", "bbox": {"l": 444.56319999999994, "t": 422.84869, "r": 446.25998, "b": 471.87128, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 297, "text": "FAA Chart Users\u2019 Guide - Terminal Procedures Publication (TPP) - Terms", "bbox": {"l": 444.56319999999994, "t": 422.84869, "r": 446.25998, "b": 471.87128, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 249, "label": "text", "bbox": {"l": 329.40536, "t": 379.37537, "r": 355.13138, "b": 382.13336, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 298, "text": "AGL 2013 Financial Calendar", "bbox": {"l": 329.40536, "t": 379.37537, "r": 355.13138, "b": 382.13336, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 250, "label": "text", "bbox": {"l": 329.40536, "t": 382.30273, "r": 330.96848, "b": 384.55927, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 299, "text": "22", "bbox": {"l": 329.40536, "t": 382.30273, "r": 330.96848, "b": 384.55927, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 251, "label": "text", "bbox": {"l": 331.75003, "t": 382.30273, "r": 341.12875, "b": 384.55927, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 300, "text": "August 2012 ", "bbox": {"l": 331.75003, "t": 382.30273, "r": 341.12875, "b": 384.55927, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 252, "label": "text", "bbox": {"l": 350.4722, "t": 382.30273, "r": 384.81079, "b": 384.55927, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 301, "text": "2012 full year result and fi nal dividend announced", "bbox": {"l": 350.4722, "t": 382.30273, "r": 384.81079, "b": 384.55927, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 253, "label": "text", "bbox": {"l": 329.40536, "t": 384.84552, "r": 330.97336, "b": 387.10205, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 302, "text": "30", "bbox": {"l": 329.40536, "t": 384.84552, "r": 330.97336, "b": 387.10205, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 254, "label": "text", "bbox": {"l": 331.75735, "t": 384.84552, "r": 341.16534, "b": 387.10205, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 303, "text": "August 2012 ", "bbox": {"l": 331.75735, "t": 384.84552, "r": 341.16534, "b": 387.10205, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 255, "label": "text", "bbox": {"l": 350.4722, "t": 384.84552, "r": 372.90613, "b": 387.10205, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 304, "text": "Ex-dividend trading commences", "bbox": {"l": 350.4722, "t": 384.84552, "r": 372.90613, "b": 387.10205, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 256, "label": "text", "bbox": {"l": 329.40536, "t": 387.38828, "r": 330.20337, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 305, "text": "5", "bbox": {"l": 329.40536, "t": 387.38828, "r": 330.20337, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 257, "label": "text", "bbox": {"l": 331.00137, "t": 387.38828, "r": 342.9715, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 306, "text": "September 2012 ", "bbox": {"l": 331.00137, "t": 387.38828, "r": 342.9715, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 258, "label": "text", "bbox": {"l": 350.4722, "t": 387.38828, "r": 374.88693, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 307, "text": "Record date for 2012 fi nal dividend", "bbox": {"l": 350.4722, "t": 387.38828, "r": 374.88693, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 259, "label": "text", "bbox": {"l": 329.40536, "t": 389.93103, "r": 331.0173, "b": 392.18762, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 308, "text": "27", "bbox": {"l": 329.40536, "t": 389.93103, "r": 331.0173, "b": 392.18762, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 260, "label": "text", "bbox": {"l": 331.82327, "t": 389.93103, "r": 343.91284, "b": 392.18762, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 309, "text": "September 2012 ", "bbox": {"l": 331.82327, "t": 389.93103, "r": 343.91284, "b": 392.18762, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 261, "label": "text", "bbox": {"l": 350.4722, "t": 389.93103, "r": 365.65988, "b": 392.18762, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 310, "text": "Final dividend payable", "bbox": {"l": 350.4722, "t": 389.93103, "r": 365.65988, "b": 392.18762, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 262, "label": "text", "bbox": {"l": 329.40536, "t": 392.47382, "r": 330.98804, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 311, "text": "23", "bbox": {"l": 329.40536, "t": 392.47382, "r": 330.98804, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 263, "label": "text", "bbox": {"l": 331.77936, "t": 392.47382, "r": 342.06674, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 312, "text": "October 2012 ", "bbox": {"l": 331.77936, "t": 392.47382, "r": 342.06674, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 264, "label": "text", "bbox": {"l": 350.4722, "t": 392.47382, "r": 367.22156, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 313, "text": "Annual General Meeting", "bbox": {"l": 350.4722, "t": 392.47382, "r": 367.22156, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 265, "label": "text", "bbox": {"l": 329.40536, "t": 395.0166, "r": 330.99741, "b": 397.27313, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 314, "text": "27", "bbox": {"l": 329.40536, "t": 395.0166, "r": 330.99741, "b": 397.27313, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 266, "label": "text", "bbox": {"l": 331.7934, "t": 395.0166, "r": 342.1416, "b": 397.27313, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 315, "text": "February 2013", "bbox": {"l": 331.7934, "t": 395.0166, "r": 342.1416, "b": 397.27313, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 267, "label": "text", "bbox": {"l": 342.64841, "t": 395.18298, "r": 342.65811, "b": 396.49857000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 316, "text": " 1", "bbox": {"l": 342.64841, "t": 395.18298, "r": 342.65811, "b": 396.49857000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 268, "label": "text", "bbox": {"l": 350.47177, "t": 395.01474, "r": 386.25897, "b": 397.2713, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 317, "text": "2013 interim result and interim dividend announced", "bbox": {"l": 350.47177, "t": 395.01474, "r": 386.25897, "b": 397.2713, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 269, "label": "text", "bbox": {"l": 329.40491, "t": 397.55749999999995, "r": 331.02695, "b": 399.81406, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 318, "text": "28", "bbox": {"l": 329.40491, "t": 397.55749999999995, "r": 331.02695, "b": 399.81406, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 270, "label": "text", "bbox": {"l": 331.83795, "t": 397.55749999999995, "r": 340.75909, "b": 399.81406, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 319, "text": "August 2013", "bbox": {"l": 331.83795, "t": 397.55749999999995, "r": 340.75909, "b": 399.81406, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 271, "label": "text", "bbox": {"l": 341.26437, "t": 397.7254, "r": 341.27408, "b": 399.04095, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 320, "text": " 1", "bbox": {"l": 341.26437, "t": 397.7254, "r": 341.27408, "b": 399.04095, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 272, "label": "text", "bbox": {"l": 350.47144, "t": 397.55713, "r": 385.93265, "b": 399.81369, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 321, "text": "2013 full year results and fi nal dividend announced ", "bbox": {"l": 350.47144, "t": 397.55713, "r": 385.93265, "b": 399.81369, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 273, "label": "text", "bbox": {"l": 329.40536, "t": 400.46155, "r": 329.87708, "b": 401.96588, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 322, "text": "1", "bbox": {"l": 329.40536, "t": 400.46155, "r": 329.87708, "b": 401.96588, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 274, "label": "text", "bbox": {"l": 330.34882, "t": 400.46155, "r": 358.65204, "b": 401.96588, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 323, "text": "Indicative dates only, subject to change/Board confi rmation", "bbox": {"l": 330.34882, "t": 400.46155, "r": 358.65204, "b": 401.96588, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 275, "label": "text", "bbox": {"l": 329.40536, "t": 404.34503, "r": 391.771, "b": 406.60156, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 324, "text": "AGL\u2019s Annual General Meeting will be held at the City Recital Hall, Angel Place, Sydney ", "bbox": {"l": 329.40536, "t": 404.34503, "r": 391.771, "b": 406.60156, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 276, "label": "text", "bbox": {"l": 329.40536, "t": 406.37857, "r": 369.65308, "b": 408.63513000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 325, "text": "commencing at 10.30am on Tuesday 23 October 2012.", "bbox": {"l": 329.40536, "t": 406.37857, "r": 369.65308, "b": 408.63513000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 277, "label": "text", "bbox": {"l": 363.54486, "t": 460.53054999999995, "r": 379.25955, "b": 465.54507, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 326, "text": "Ye s te rd ay", "bbox": {"l": 363.54486, "t": 460.53054999999995, "r": 379.25955, "b": 465.54507, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 278, "label": "text", "bbox": {"l": 363.54486, "t": 466.7157, "r": 391.38229, "b": 468.97223, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 327, "text": "Established in Sydney in 1837, and then ", "bbox": {"l": 363.54486, "t": 466.7157, "r": 391.38229, "b": 468.97223, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 279, "label": "text", "bbox": {"l": 363.54486, "t": 468.74924, "r": 395.01788, "b": 471.00577, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 328, "text": "known as The Australian Gas Light Company, ", "bbox": {"l": 363.54486, "t": 468.74924, "r": 395.01788, "b": 471.00577, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 280, "label": "text", "bbox": {"l": 363.54486, "t": 470.78281, "r": 394.08322, "b": 473.03934, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 329, "text": "the AGL business has an established history ", "bbox": {"l": 363.54486, "t": 470.78281, "r": 394.08322, "b": 473.03934, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 281, "label": "text", "bbox": {"l": 363.54486, "t": 472.81635, "r": 390.60727, "b": 475.07288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 330, "text": "and reputation for serving the gas and ", "bbox": {"l": 363.54486, "t": 472.81635, "r": 390.60727, "b": 475.07288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 282, "label": "text", "bbox": {"l": 363.54486, "t": 474.84988, "r": 393.49612, "b": 477.10645, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 331, "text": "electricity needs of Australian households. ", "bbox": {"l": 363.54486, "t": 474.84988, "r": 393.49612, "b": 477.10645, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 283, "label": "text", "bbox": {"l": 363.54486, "t": 476.88345, "r": 394.11481, "b": 479.13998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 332, "text": "In 1841, when AGL supplied the gas to light ", "bbox": {"l": 363.54486, "t": 476.88345, "r": 394.11481, "b": 479.13998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 284, "label": "text", "bbox": {"l": 363.54486, "t": 478.91699, "r": 393.75891, "b": 481.17352, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 333, "text": "the fi rst public street lamp, it was reported ", "bbox": {"l": 363.54486, "t": 478.91699, "r": 393.75891, "b": 481.17352, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 285, "label": "text", "bbox": {"l": 363.54486, "t": 480.95053, "r": 390.4975, "b": 483.20709, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 334, "text": "in the Sydney Gazette as a \u201cwonderful ", "bbox": {"l": 363.54486, "t": 480.95053, "r": 390.4975, "b": 483.20709, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 286, "label": "text", "bbox": {"l": 363.54486, "t": 482.9841, "r": 395.70975, "b": 485.24063, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 335, "text": "achievement of scientifi c knowledge, assisted ", "bbox": {"l": 363.54486, "t": 482.9841, "r": 395.70975, "b": 485.24063, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 287, "label": "text", "bbox": {"l": 363.54486, "t": 485.01764, "r": 394.27283, "b": 487.2742, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 336, "text": "by mechanical ingenuity.\u201d Within two years, ", "bbox": {"l": 363.54486, "t": 485.01764, "r": 394.27283, "b": 487.2742, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 288, "label": "text", "bbox": {"l": 363.54486, "t": 487.05121, "r": 396.65939, "b": 489.30774, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 337, "text": "165 gas lamps were lighting the City of Sydney.", "bbox": {"l": 363.54486, "t": 487.05121, "r": 396.65939, "b": 489.30774, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 289, "label": "text", "bbox": {"l": 329.4054, "t": 419.93124, "r": 384.19696, "b": 431.09412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 338, "text": "Looking back on ", "bbox": {"l": 329.4054, "t": 419.93124, "r": 384.19696, "b": 431.09412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 290, "label": "text", "bbox": {"l": 329.4054, "t": 430.10379, "r": 372.16626, "b": 441.26669, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 339, "text": "175 years of ", "bbox": {"l": 329.4054, "t": 430.10379, "r": 372.16626, "b": 441.26669, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 291, "label": "text", "bbox": {"l": 329.4054, "t": 440.27636999999993, "r": 385.3981, "b": 451.43924, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 340, "text": "looking forward.", "bbox": {"l": 329.4054, "t": 440.27636999999993, "r": 385.3981, "b": 451.43924, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 292, "label": "text", "bbox": {"l": 329.40536, "t": 372.16159, "r": 353.36179, "b": 373.91669, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 341, "text": "AGL Energy Limited ABN 74 115 061 375", "bbox": {"l": 329.40536, "t": 372.16159, "r": 353.36179, "b": 373.91669, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 293, "label": "text", "bbox": {"l": 546.20587, "t": 360.90448, "r": 548.23407, "b": 362.82242, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 342, "text": "29", "bbox": {"l": 546.20587, "t": 360.90448, "r": 548.23407, "b": 362.82242, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 294, "label": "text", "bbox": {"l": 497.77728, "t": 251.43384000000003, "r": 542.8255, "b": 254.94385, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 343, "text": "signs, signals and road markings", "bbox": {"l": 497.77728, "t": 251.43384000000003, "r": 542.8255, "b": 254.94385, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 295, "label": "text", "bbox": {"l": 490.30679, "t": 251.47478999999998, "r": 492.09982, "b": 254.98479999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 344, "text": "3", "bbox": {"l": 490.30679, "t": 251.47478999999998, "r": 492.09982, "b": 254.98479999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 296, "label": "text", "bbox": {"l": 498.15335, "t": 263.88922, "r": 500.05637, "b": 265.92719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 345, "text": "In ", "bbox": {"l": 498.15335, "t": 263.88922, "r": 500.05637, "b": 265.92719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 297, "label": "text", "bbox": {"l": 500.05637, "t": 263.85717999999997, "r": 524.37036, "b": 265.86310000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 346, "text": "chapter 2, you and your vehicle", "bbox": {"l": 500.05637, "t": 263.85717999999997, "r": 524.37036, "b": 265.86310000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 298, "label": "text", "bbox": {"l": 524.37036, "t": 263.88922, "r": 539.89124, "b": 265.92719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 347, "text": ", you learned about ", "bbox": {"l": 524.37036, "t": 263.88922, "r": 539.89124, "b": 265.92719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 299, "label": "text", "bbox": {"l": 498.15335, "t": 265.93224999999995, "r": 544.50403, "b": 267.97020999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 348, "text": "some of the controls in your vehicle. This chapter is a handy ", "bbox": {"l": 498.15335, "t": 265.93224999999995, "r": 544.50403, "b": 267.97020999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 300, "label": "text", "bbox": {"l": 498.15335, "t": 267.97533999999996, "r": 544.01343, "b": 270.01331000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 349, "text": "reference section that gives examples of the most common ", "bbox": {"l": 498.15335, "t": 267.97533999999996, "r": 544.01343, "b": 270.01331000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 301, "label": "text", "bbox": {"l": 498.15335, "t": 270.01831000000004, "r": 544.11987, "b": 272.05634, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 350, "text": "signs, signals and road markings that keep traffi c organized ", "bbox": {"l": 498.15335, "t": 270.01831000000004, "r": 544.11987, "b": 272.05634, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 302, "label": "text", "bbox": {"l": 498.15335, "t": 272.06140000000005, "r": 515.41071, "b": 274.09937, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 351, "text": "and flowing smoothly. ", "bbox": {"l": 498.15335, "t": 272.06140000000005, "r": 515.41071, "b": 274.09937, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 303, "label": "text", "bbox": {"l": 498.15335, "t": 277.34619, "r": 505.64642000000003, "b": 280.9357, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 352, "text": "Signs", "bbox": {"l": 498.15335, "t": 277.34619, "r": 505.64642000000003, "b": 280.9357, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 304, "label": "text", "bbox": {"l": 498.15335, "t": 281.82187, "r": 543.92957, "b": 283.85983, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 353, "text": "There are three ways to read signs: by their shape, colour and ", "bbox": {"l": 498.15335, "t": 281.82187, "r": 543.92957, "b": 283.85983, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 305, "label": "text", "bbox": {"l": 498.15335, "t": 283.8649, "r": 545.67834, "b": 285.90289, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 354, "text": "the messages printed on them. Understanding these three ways ", "bbox": {"l": 498.15335, "t": 283.8649, "r": 545.67834, "b": 285.90289, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 306, "label": "text", "bbox": {"l": 498.15335, "t": 285.90796, "r": 545.26471, "b": 287.94592, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 355, "text": "of classifying signs will help you figure out the meaning of signs ", "bbox": {"l": 498.15335, "t": 285.90796, "r": 545.26471, "b": 287.94592, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 307, "label": "text", "bbox": {"l": 498.15335, "t": 287.95099, "r": 513.31335, "b": 289.98895, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 356, "text": "that are new to you. ", "bbox": {"l": 498.15335, "t": 287.95099, "r": 513.31335, "b": 289.98895, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 308, "label": "text", "bbox": {"l": 505.43439, "t": 303.07596, "r": 508.53033000000005, "b": 304.89639, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 357, "text": "Stop", "bbox": {"l": 505.43439, "t": 303.07596, "r": 508.53033000000005, "b": 304.89639, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 309, "label": "text", "bbox": {"l": 527.45502, "t": 303.25354, "r": 541.44678, "b": 305.07397, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 358, "text": "Yield the right-of-way", "bbox": {"l": 527.45502, "t": 303.25354, "r": 541.44678, "b": 305.07397, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 310, "label": "text", "bbox": {"l": 501.79385, "t": 321.18973, "r": 510.41632, "b": 323.01016, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 359, "text": "Shows driving", "bbox": {"l": 501.79385, "t": 321.18973, "r": 510.41632, "b": 323.01016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 311, "label": "text", "bbox": {"l": 501.79385, "t": 322.87731999999994, "r": 509.04268999999994, "b": 324.69775000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 360, "text": "regulations", "bbox": {"l": 501.79385, "t": 322.87731999999994, "r": 509.04268999999994, "b": 324.69775000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 312, "label": "text", "bbox": {"l": 518.66455, "t": 319.59146, "r": 529.80902, "b": 321.41190000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 361, "text": "Explains lane use", "bbox": {"l": 518.66455, "t": 319.59146, "r": 529.80902, "b": 321.41190000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 313, "label": "text", "bbox": {"l": 534.87561, "t": 318.37616, "r": 546.95142, "b": 320.19659, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 362, "text": "School zone signs ", "bbox": {"l": 534.87561, "t": 318.37616, "r": 546.95142, "b": 320.19659, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 314, "label": "text", "bbox": {"l": 534.87561, "t": 320.0637500000001, "r": 545.05762, "b": 321.88419, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 363, "text": "are fl uorescent ", "bbox": {"l": 534.87561, "t": 320.0637500000001, "r": 545.05762, "b": 321.88419, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 315, "label": "text", "bbox": {"l": 534.87561, "t": 321.75134, "r": 543.32263, "b": 323.57178, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 364, "text": "yellow-green", "bbox": {"l": 534.87561, "t": 321.75134, "r": 543.32263, "b": 323.57178, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 316, "label": "text", "bbox": {"l": 499.21862999999996, "t": 338.12772, "r": 512.62451, "b": 339.94815, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 365, "text": "Tells about motorist ", "bbox": {"l": 499.21862999999996, "t": 338.12772, "r": 512.62451, "b": 339.94815, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 317, "label": "text", "bbox": {"l": 499.21862999999996, "t": 339.81531000000007, "r": 504.39917, "b": 341.63574, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 366, "text": "services", "bbox": {"l": 499.21862999999996, "t": 339.81531000000007, "r": 504.39917, "b": 341.63574, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 318, "label": "text", "bbox": {"l": 516.97748, "t": 338.06039, "r": 529.77484, "b": 339.88082999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 367, "text": "Shows a permitted ", "bbox": {"l": 516.97748, "t": 338.06039, "r": 529.77484, "b": 339.88082999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 319, "label": "text", "bbox": {"l": 516.97748, "t": 339.74799, "r": 520.96399, "b": 341.56842, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 368, "text": "action", "bbox": {"l": 516.97748, "t": 339.74799, "r": 520.96399, "b": 341.56842, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 320, "label": "text", "bbox": {"l": 534.55847, "t": 337.88281, "r": 548.58453, "b": 339.7032500000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 369, "text": "Shows an action that ", "bbox": {"l": 534.55847, "t": 337.88281, "r": 548.58453, "b": 339.7032500000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 321, "label": "text", "bbox": {"l": 534.55847, "t": 339.57040000000006, "r": 545.08862, "b": 341.39084, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 370, "text": "is not permitted", "bbox": {"l": 534.55847, "t": 339.57040000000006, "r": 545.08862, "b": 341.39084, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 322, "label": "text", "bbox": {"l": 483.05853, "t": 356.17416, "r": 494.72577, "b": 357.9946, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 371, "text": "Warns of hazards ", "bbox": {"l": 483.05853, "t": 356.17416, "r": 494.72577, "b": 357.9946, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 323, "label": "text", "bbox": {"l": 483.05853, "t": 357.86179, "r": 487.07525999999996, "b": 359.68222, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 372, "text": "ahead", "bbox": {"l": 483.05853, "t": 357.86179, "r": 487.07525999999996, "b": 359.68222, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 324, "label": "text", "bbox": {"l": 499.39645, "t": 356.26297000000005, "r": 504.69171, "b": 358.0834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 373, "text": "Warns of", "bbox": {"l": 499.39645, "t": 356.26297000000005, "r": 504.69171, "b": 358.0834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 325, "label": "text", "bbox": {"l": 499.39645, "t": 357.95056, "r": 511.69116, "b": 359.77099999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 374, "text": "construction zones", "bbox": {"l": 499.39645, "t": 357.95056, "r": 511.69116, "b": 359.77099999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 326, "label": "text", "bbox": {"l": 516.75891, "t": 356.26297000000005, "r": 527.42938, "b": 358.0834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 375, "text": "Railway crossing", "bbox": {"l": 516.75891, "t": 356.26297000000005, "r": 527.42938, "b": 358.0834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 327, "label": "text", "bbox": {"l": 534.5141, "t": 352.92981, "r": 547.89862, "b": 354.75024, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 376, "text": "Shows distance and ", "bbox": {"l": 534.5141, "t": 352.92981, "r": 547.89862, "b": 354.75024, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 328, "label": "text", "bbox": {"l": 534.5141, "t": 354.6174, "r": 540.2818, "b": 356.43784, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 377, "text": "direction", "bbox": {"l": 534.5141, "t": 354.6174, "r": 540.2818, "b": 356.43784, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 329, "label": "text", "bbox": {"l": 478.37466, "t": 270.14075, "r": 479.14251999999993, "b": 272.17877, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 378, "text": "\u2022", "bbox": {"l": 478.37466, "t": 270.14075, "r": 479.14251999999993, "b": 272.17877, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 330, "label": "text", "bbox": {"l": 479.91036999999994, "t": 270.14075, "r": 483.74963, "b": 272.17877, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 379, "text": "Signs", "bbox": {"l": 479.91036999999994, "t": 270.14075, "r": 483.74963, "b": 272.17877, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 331, "label": "text", "bbox": {"l": 479.97293, "t": 272.84717, "r": 492.31219, "b": 274.34888, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 380, "text": "- regulatory signs", "bbox": {"l": 479.97293, "t": 272.84717, "r": 492.31219, "b": 274.34888, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 332, "label": "text", "bbox": {"l": 479.97293, "t": 275.14513999999997, "r": 486.72598000000005, "b": 276.64679, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 381, "text": "- school, ", "bbox": {"l": 479.97293, "t": 275.14513999999997, "r": 486.72598000000005, "b": 276.64679, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 333, "label": "text", "bbox": {"l": 481.21602999999993, "t": 276.77972, "r": 492.93286000000006, "b": 278.81768999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 382, "text": "playground and ", "bbox": {"l": 481.21602999999993, "t": 276.77972, "r": 492.93286000000006, "b": 278.81768999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 334, "label": "text", "bbox": {"l": 481.21602999999993, "t": 278.82275000000004, "r": 491.82938000000007, "b": 280.86075, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 383, "text": "crosswalk signs", "bbox": {"l": 481.21602999999993, "t": 278.82275000000004, "r": 491.82938000000007, "b": 280.86075, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 335, "label": "text", "bbox": {"l": 479.97293, "t": 281.52759, "r": 491.00775000000004, "b": 283.02924, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 384, "text": "- lane use signs", "bbox": {"l": 479.97293, "t": 281.52759, "r": 491.00775000000004, "b": 283.02924, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 336, "label": "text", "bbox": {"l": 479.97293, "t": 283.82556, "r": 493.32748, "b": 285.3272099999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 385, "text": "- turn control signs", "bbox": {"l": 479.97293, "t": 283.82556, "r": 493.32748, "b": 285.3272099999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 337, "label": "text", "bbox": {"l": 479.97293, "t": 286.1235, "r": 490.4915199999999, "b": 287.62518, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 386, "text": "- parking signs", "bbox": {"l": 479.97293, "t": 286.1235, "r": 490.4915199999999, "b": 287.62518, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 338, "label": "text", "bbox": {"l": 479.97293, "t": 288.42148, "r": 491.17004000000003, "b": 289.92316, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 387, "text": "- reserved lane ", "bbox": {"l": 479.97293, "t": 288.42148, "r": 491.17004000000003, "b": 289.92316, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 339, "label": "text", "bbox": {"l": 481.21602999999993, "t": 290.05605999999995, "r": 484.77405000000005, "b": 292.09406, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 388, "text": "signs", "bbox": {"l": 481.21602999999993, "t": 290.05605999999995, "r": 484.77405000000005, "b": 292.09406, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 340, "label": "text", "bbox": {"l": 479.97293, "t": 292.76169000000004, "r": 490.83398, "b": 294.26334, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 389, "text": "- warning signs", "bbox": {"l": 479.97293, "t": 292.76169000000004, "r": 490.83398, "b": 294.26334, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 341, "label": "text", "bbox": {"l": 479.97293, "t": 295.05963, "r": 491.62692, "b": 296.56131, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 390, "text": "- object markers", "bbox": {"l": 479.97293, "t": 295.05963, "r": 491.62692, "b": 296.56131, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 342, "label": "text", "bbox": {"l": 479.97293, "t": 297.3576, "r": 490.37341, "b": 298.8592499999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 391, "text": "- construction ", "bbox": {"l": 479.97293, "t": 297.3576, "r": 490.37341, "b": 298.8592499999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 343, "label": "text", "bbox": {"l": 481.21602999999993, "t": 298.99219, "r": 484.77405000000005, "b": 301.03015, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 392, "text": "signs", "bbox": {"l": 481.21602999999993, "t": 298.99219, "r": 484.77405000000005, "b": 301.03015, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 344, "label": "text", "bbox": {"l": 479.97293, "t": 301.69780999999995, "r": 492.93912, "b": 303.19946, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 393, "text": "- information and ", "bbox": {"l": 479.97293, "t": 301.69780999999995, "r": 492.93912, "b": 303.19946, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 345, "label": "text", "bbox": {"l": 481.21602999999993, "t": 303.3324, "r": 493.00525, "b": 305.37036, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 394, "text": "destination signs", "bbox": {"l": 481.21602999999993, "t": 303.3324, "r": 493.00525, "b": 305.37036, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 346, "label": "text", "bbox": {"l": 479.97293, "t": 306.0379899999999, "r": 489.99047999999993, "b": 307.53967, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 395, "text": "- railway signs", "bbox": {"l": 479.97293, "t": 306.0379899999999, "r": 489.99047999999993, "b": 307.53967, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 347, "label": "text", "bbox": {"l": 478.375, "t": 308.24789, "r": 479.1032400000001, "b": 310.28586, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 396, "text": "\u2022", "bbox": {"l": 478.375, "t": 308.24789, "r": 479.1032400000001, "b": 310.28586, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 348, "label": "text", "bbox": {"l": 479.83151, "t": 308.24789, "r": 484.92925999999994, "b": 310.28586, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 397, "text": "Signals", "bbox": {"l": 479.83151, "t": 308.24789, "r": 484.92925999999994, "b": 310.28586, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 349, "label": "text", "bbox": {"l": 479.97293, "t": 310.95358, "r": 490.00091999999995, "b": 312.45526, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 398, "text": "- lane control ", "bbox": {"l": 479.97293, "t": 310.95358, "r": 490.00091999999995, "b": 312.45526, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 350, "label": "text", "bbox": {"l": 481.21602999999993, "t": 312.5881999999999, "r": 485.95331, "b": 314.62616, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 399, "text": "signals", "bbox": {"l": 481.21602999999993, "t": 312.5881999999999, "r": 485.95331, "b": 314.62616, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 351, "label": "text", "bbox": {"l": 479.97293, "t": 315.29379, "r": 489.29876999999993, "b": 316.79544, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 400, "text": "- traffic lights", "bbox": {"l": 479.97293, "t": 315.29379, "r": 489.29876999999993, "b": 316.79544, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 352, "label": "text", "bbox": {"l": 478.375, "t": 317.50366, "r": 479.18129999999996, "b": 319.5416599999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 401, "text": "\u2022", "bbox": {"l": 478.375, "t": 317.50366, "r": 479.18129999999996, "b": 319.5416599999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 353, "label": "text", "bbox": {"l": 479.98761, "t": 317.50366, "r": 490.46960000000007, "b": 319.5416599999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 402, "text": "Road markings", "bbox": {"l": 479.98761, "t": 317.50366, "r": 490.46960000000007, "b": 319.5416599999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 354, "label": "text", "bbox": {"l": 479.97293, "t": 320.20938, "r": 489.26166000000006, "b": 321.71103, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 403, "text": "- yellow lines", "bbox": {"l": 479.97293, "t": 320.20938, "r": 489.26166000000006, "b": 321.71103, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 355, "label": "text", "bbox": {"l": 479.97293, "t": 322.50732, "r": 488.59189, "b": 324.009, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 404, "text": "- white lines", "bbox": {"l": 479.97293, "t": 322.50732, "r": 488.59189, "b": 324.009, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 356, "label": "text", "bbox": {"l": 479.97293, "t": 324.8053, "r": 491.17004000000003, "b": 326.30698, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 405, "text": "- reserved lane ", "bbox": {"l": 479.97293, "t": 324.8053, "r": 491.17004000000003, "b": 326.30698, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 357, "label": "text", "bbox": {"l": 481.21602999999993, "t": 326.43988, "r": 487.58978, "b": 328.47784, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 406, "text": "markings", "bbox": {"l": 481.21602999999993, "t": 326.43988, "r": 487.58978, "b": 328.47784, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 358, "label": "text", "bbox": {"l": 479.97293, "t": 329.14551, "r": 491.75177, "b": 330.64716, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 407, "text": "- other markings", "bbox": {"l": 479.97293, "t": 329.14551, "r": 491.75177, "b": 330.64716, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 359, "label": "text", "bbox": {"l": 478.15246999999994, "t": 265.07030999999995, "r": 493.75586, "b": 268.06872999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 408, "text": "in this chapter", "bbox": {"l": 478.15246999999994, "t": 265.07030999999995, "r": 493.75586, "b": 268.06872999999996, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "caption", "id": 16, "page_no": 0, "cluster": {"id": 16, "label": "caption", "bbox": {"l": 317.95499, "t": 540.08299, "r": 559.80579, "b": 559.51524, "coord_origin": "TOPLEFT"}, "confidence": 0.7793365120887756, "cells": [{"id": 409, "text": "Figure 1: Four examples of complex page layouts across dif-", "bbox": {"l": 317.95499, "t": 540.08299, "r": 559.80579, "b": 548.55624, "coord_origin": "TOPLEFT"}}, {"id": 410, "text": "ferent document categories", "bbox": {"l": 317.95499, "t": 551.0419899999999, "r": 428.69907, "b": 559.51524, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 1: Four examples of complex page layouts across different document categories"}, {"label": "section_header", "id": 3, "page_no": 0, "cluster": {"id": 3, "label": "section_header", "bbox": {"l": 317.95499, "t": 592.46591, "r": 379.8205, "b": 602.7750100000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9208476543426514, "cells": [{"id": 411, "text": "KEYWORDS", "bbox": {"l": 317.95499, "t": 592.46591, "r": 379.8205, "b": 602.7750100000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "KEYWORDS"}, {"label": "text", "id": 1, "page_no": 0, "cluster": {"id": 1, "label": "text", "bbox": {"l": 317.95499, "t": 607.66756, "r": 559.18597, "b": 627.00117, "coord_origin": "TOPLEFT"}, "confidence": 0.9509093761444092, "cells": [{"id": 412, "text": "PDF document conversion, layout segmentation, object-detection,", "bbox": {"l": 317.95499, "t": 607.66756, "r": 559.18597, "b": 616.04218, "coord_origin": "TOPLEFT"}}, {"id": 413, "text": "data set, Machine Learning", "bbox": {"l": 317.95499, "t": 618.62656, "r": 416.94403, "b": 627.00117, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "PDF document conversion, layout segmentation, object-detection, data set, Machine Learning"}, {"label": "section_header", "id": 7, "page_no": 0, "cluster": {"id": 7, "label": "section_header", "bbox": {"l": 317.65997, "t": 640.05434, "r": 404.65366, "b": 647.58609, "coord_origin": "TOPLEFT"}, "confidence": 0.8721988797187805, "cells": [{"id": 414, "text": "ACM Reference Format:", "bbox": {"l": 317.65997, "t": 640.05434, "r": 404.65366, "b": 647.58609, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "ACM Reference Format:"}, {"label": "text", "id": 2, "page_no": 0, "cluster": {"id": 2, "label": "text", "bbox": {"l": 317.95499, "t": 650.11996, "r": 559.5495, "b": 707.377029, "coord_origin": "TOPLEFT"}, "confidence": 0.9455165863037109, "cells": [{"id": 415, "text": "Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter", "bbox": {"l": 317.95499, "t": 650.11996, "r": 558.35266, "b": 657.56404, "coord_origin": "TOPLEFT"}}, {"id": 416, "text": "Staar. 2022. DocLayNet: A Large Human-Annotated Dataset for Document-", "bbox": {"l": 317.95499, "t": 660.08296, "r": 559.5495, "b": 667.52703, "coord_origin": "TOPLEFT"}}, {"id": 417, "text": "Layout Analysis. In", "bbox": {"l": 317.95499, "t": 670.04497, "r": 383.30807, "b": 677.48904, "coord_origin": "TOPLEFT"}}, {"id": 418, "text": "Proceedings of the 28th ACM SIGKDD Conference on", "bbox": {"l": 385.798, "t": 670.08482, "r": 558.20032, "b": 677.49701, "coord_origin": "TOPLEFT"}}, {"id": 419, "text": "Knowledge Discovery and Data Mining (KDD \u201922), August 14-18, 2022, Wash-", "bbox": {"l": 317.95499, "t": 680.04781, "r": 559.00092, "b": 687.46001, "coord_origin": "TOPLEFT"}}, {"id": 420, "text": "ington, DC, USA.", "bbox": {"l": 317.95499, "t": 690.01081, "r": 370.11481, "b": 697.423004, "coord_origin": "TOPLEFT"}}, {"id": 421, "text": "ACM, New York, NY, USA, 9 pages. https://doi.org/10.1145/", "bbox": {"l": 371.82999, "t": 689.97096, "r": 558.71655, "b": 697.415031, "coord_origin": "TOPLEFT"}}, {"id": 422, "text": "3534678.3539043", "bbox": {"l": 317.95499, "t": 699.932953, "r": 371.59375, "b": 707.377029, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar. 2022. DocLayNet: A Large Human-Annotated Dataset for DocumentLayout Analysis. In Proceedings of the 28th ACM SIGKDD Conference on Knowledge Discovery and Data Mining (KDD \u201922), August 14-18, 2022, Washington, DC, USA. ACM, New York, NY, USA, 9 pages. https://doi.org/10.1145/ 3534678.3539043"}, {"label": "page_header", "id": 10, "page_no": 0, "cluster": {"id": 10, "label": "page_header", "bbox": {"l": 18.34021, "t": 218.35999000000004, "r": 36.339794, "b": 555.00003, "coord_origin": "TOPLEFT"}, "confidence": 0.8537883758544922, "cells": [{"id": 423, "text": "arXiv:2206.01062v1 [cs.CV] 2 Jun 2022", "bbox": {"l": 18.34021, "t": 218.35999000000004, "r": 36.339794, "b": 555.00003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "arXiv:2206.01062v1 [cs.CV] 2 Jun 2022"}], "body": [{"label": "section_header", "id": 12, "page_no": 0, "cluster": {"id": 12, "label": "section_header", "bbox": {"l": 107.29999999999998, "t": 83.69470000000013, "r": 505.06195, "b": 119.59558000000015, "coord_origin": "TOPLEFT"}, "confidence": 0.8416302800178528, "cells": [{"id": 0, "text": "DocLayNet: A Large Human-Annotated Dataset for", "bbox": {"l": 107.29999999999998, "t": 83.69470000000013, "r": 505.06195, "b": 99.67058999999995, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Document-Layout Analysis", "bbox": {"l": 200.117, "t": 103.6196900000001, "r": 411.88367, "b": 119.59558000000015, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis"}, {"label": "text", "id": 8, "page_no": 0, "cluster": {"id": 8, "label": "text", "bbox": {"l": 90.96701, "t": 133.67236000000003, "r": 193.73123, "b": 180.24030000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.8637151718139648, "cells": [{"id": 2, "text": "Birgit Pfitzmann", "bbox": {"l": 102.06001, "t": 133.67236000000003, "r": 182.63805, "b": 144.83856000000003, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "IBM Research", "bbox": {"l": 114.29401000000001, "t": 147.02423, "r": 170.40337, "b": 156.32928000000004, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Rueschlikon, Switzerland", "bbox": {"l": 90.96701, "t": 158.97924999999998, "r": 193.73123, "b": 168.28430000000003, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "bpf@zurich.ibm.com", "bbox": {"l": 100.02301, "t": 170.93524000000002, "r": 184.67522, "b": 180.24030000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Birgit Pfitzmann IBM Research Rueschlikon, Switzerland bpf@zurich.ibm.com"}, {"label": "text", "id": 9, "page_no": 0, "cluster": {"id": 9, "label": "text", "bbox": {"l": 255.11602999999997, "t": 133.67236000000003, "r": 357.88025, "b": 180.24030000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.8612664937973022, "cells": [{"id": 6, "text": "Christoph Auer", "bbox": {"l": 268.62402, "t": 133.67236000000003, "r": 344.59933, "b": 144.83856000000003, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "IBM Research", "bbox": {"l": 278.44302, "t": 147.02423, "r": 334.55237, "b": 156.32928000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Rueschlikon, Switzerland", "bbox": {"l": 255.11602999999997, "t": 158.97924999999998, "r": 357.88025, "b": 168.28430000000003, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "cau@zurich.ibm.com", "bbox": {"l": 263.70404, "t": 170.93524000000002, "r": 349.29272, "b": 180.24030000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Christoph Auer IBM Research Rueschlikon, Switzerland cau@zurich.ibm.com"}, {"label": "text", "id": 6, "page_no": 0, "cluster": {"id": 6, "label": "text", "bbox": {"l": 419.26505, "t": 133.67236000000003, "r": 522.0293, "b": 180.24030000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.8760607242584229, "cells": [{"id": 10, "text": "Michele Dolfi", "bbox": {"l": 437.6930500000001, "t": 133.67236000000003, "r": 503.60208, "b": 144.83856000000003, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "IBM Research", "bbox": {"l": 442.59305000000006, "t": 147.02423, "r": 498.7023899999999, "b": 156.32928000000004, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Rueschlikon, Switzerland", "bbox": {"l": 419.26505, "t": 158.97924999999998, "r": 522.0293, "b": 168.28430000000003, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "dol@zurich.ibm.com", "bbox": {"l": 428.56104000000005, "t": 170.93524000000002, "r": 512.73505, "b": 180.24030000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Michele Dolfi IBM Research Rueschlikon, Switzerland dol@zurich.ibm.com"}, {"label": "text", "id": 13, "page_no": 0, "cluster": {"id": 13, "label": "text", "bbox": {"l": 172.54303, "t": 192.05737, "r": 275.30725, "b": 238.62531, "coord_origin": "TOPLEFT"}, "confidence": 0.8319916129112244, "cells": [{"id": 14, "text": "Ahmed S. Nassar", "bbox": {"l": 182.26804, "t": 192.05737, "r": 265.39255, "b": 203.22357, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "IBM Research", "bbox": {"l": 195.87103, "t": 205.40923999999995, "r": 251.98038999999997, "b": 214.71429, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Rueschlikon, Switzerland", "bbox": {"l": 172.54303, "t": 217.36425999999994, "r": 275.30725, "b": 226.66931, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "ahn@zurich.ibm.com", "bbox": {"l": 180.52803, "t": 229.32025, "r": 267.3222, "b": 238.62531, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Ahmed S. Nassar IBM Research Rueschlikon, Switzerland ahn@zurich.ibm.com"}, {"label": "text", "id": 15, "page_no": 0, "cluster": {"id": 15, "label": "text", "bbox": {"l": 336.69302, "t": 192.05737, "r": 439.45727999999997, "b": 238.62531, "coord_origin": "TOPLEFT"}, "confidence": 0.8027974367141724, "cells": [{"id": 18, "text": "Peter Staar", "bbox": {"l": 361.52802, "t": 192.05737, "r": 414.84821, "b": 203.22357, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "IBM Research", "bbox": {"l": 360.02002, "t": 205.40923999999995, "r": 416.12939, "b": 214.71429, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Rueschlikon, Switzerland", "bbox": {"l": 336.69302, "t": 217.36425999999994, "r": 439.45727999999997, "b": 226.66931, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "taa@zurich.ibm.com", "bbox": {"l": 346.20703, "t": 229.32025, "r": 429.94269, "b": 238.62531, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Peter Staar IBM Research Rueschlikon, Switzerland taa@zurich.ibm.com"}, {"label": "section_header", "id": 5, "page_no": 0, "cluster": {"id": 5, "label": "section_header", "bbox": {"l": 53.798035, "t": 247.70288000000005, "r": 111.94354, "b": 258.01202, "coord_origin": "TOPLEFT"}, "confidence": 0.8876155018806458, "cells": [{"id": 22, "text": "ABSTRACT", "bbox": {"l": 53.798035, "t": 247.70288000000005, "r": 111.94354, "b": 258.01202, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "ABSTRACT"}, {"label": "text", "id": 0, "page_no": 0, "cluster": {"id": 0, "label": "text", "bbox": {"l": 53.466999, "t": 262.90454, "r": 295.56018, "b": 534.29318, "coord_origin": "TOPLEFT"}, "confidence": 0.9823057055473328, "cells": [{"id": 23, "text": "Accurate document layout analysis is a key requirement for high-", "bbox": {"l": 53.484001, "t": 262.90454, "r": 295.55591, "b": 271.27917, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "quality PDF document conversion. With the recent availability of", "bbox": {"l": 53.79800000000001, "t": 273.86352999999997, "r": 294.04199, "b": 282.23816, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "public, large ground-truth datasets such as PubLayNet and DocBank,", "bbox": {"l": 53.79800000000001, "t": 284.82254, "r": 295.34586, "b": 293.19717, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "deep-learning models have proven to be very effective at layout", "bbox": {"l": 53.79800000000001, "t": 295.78152, "r": 294.04709, "b": 304.15616000000006, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "detection and segmentation. While these datasets are of adequate", "bbox": {"l": 53.79800000000001, "t": 306.74053999999995, "r": 294.04645, "b": 315.11517, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "size to train such models, they severely lack in layout variability", "bbox": {"l": 53.79800000000001, "t": 317.69952, "r": 294.27573, "b": 326.07416, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "since they are sourced from scientific article repositories such as", "bbox": {"l": 53.79800000000001, "t": 328.65854, "r": 294.04712, "b": 337.03317, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "PubMed and arXiv only. Consequently, the accuracy of the layout", "bbox": {"l": 53.79800000000001, "t": 339.61755, "r": 294.0437, "b": 347.99219, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "segmentation drops significantly when these models are applied", "bbox": {"l": 53.79800000000001, "t": 350.57654, "r": 294.04715, "b": 358.95117, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "on more challenging and diverse layouts. In this paper, we present", "bbox": {"l": 53.79800000000001, "t": 361.53455, "r": 294.04364, "b": 369.90918000000005, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "DocLayNet", "bbox": {"l": 53.79800000000001, "t": 372.53839, "r": 92.863388, "b": 380.87714000000005, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": ", a new, publicly available, document-layout annotation", "bbox": {"l": 92.863998, "t": 372.49353, "r": 294.04361, "b": 380.86816, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "dataset in COCO format. It contains 80863 manually annotated", "bbox": {"l": 53.79800000000001, "t": 383.45255, "r": 294.04718, "b": 391.82718, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "pages from diverse data sources to represent a wide variability in", "bbox": {"l": 53.79800000000001, "t": 394.41153, "r": 294.0437, "b": 402.78616, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "layouts. For each PDF page, the layout annotations provide labelled", "bbox": {"l": 53.79800000000001, "t": 405.37054, "r": 294.04535, "b": 413.74518, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "bounding-boxes with a choice of 11 distinct classes. DocLayNet", "bbox": {"l": 53.79800000000001, "t": 416.32953, "r": 294.04715, "b": 424.70416000000006, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "also provides a subset of double- and triple-annotated pages to", "bbox": {"l": 53.79800000000001, "t": 427.28853999999995, "r": 294.04712, "b": 435.66318, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "determine the inter-annotator agreement. In multiple experiments,", "bbox": {"l": 53.79800000000001, "t": 438.24753, "r": 295.03, "b": 446.62216, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "we provide baseline accuracy scores (in mAP) for a set of popular", "bbox": {"l": 53.466999, "t": 449.20654, "r": 294.21616, "b": 457.58118, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "object detection models. We also demonstrate that these models", "bbox": {"l": 53.79800000000001, "t": 460.16553, "r": 294.04712, "b": 468.54016, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "fall approximately 10% behind the inter-annotator agreement. Fur-", "bbox": {"l": 53.79800000000001, "t": 471.12354, "r": 295.56018, "b": 479.49817, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "thermore, we provide evidence that DocLayNet is of sufficient size.", "bbox": {"l": 53.79800000000001, "t": 482.08255, "r": 295.42783, "b": 490.45718, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Lastly, we compare models trained on PubLayNet, DocBank and", "bbox": {"l": 53.79800000000001, "t": 493.04153, "r": 294.04715, "b": 501.41617, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "DocLayNet, showing that layout predictions of the DocLayNet-", "bbox": {"l": 53.79800000000001, "t": 504.00055, "r": 295.55618, "b": 512.37518, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "trained models are more robust and thus the preferred choice for", "bbox": {"l": 53.79800000000001, "t": 514.95953, "r": 294.21643, "b": 523.33417, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "general-purpose document-layout analysis.", "bbox": {"l": 53.79800000000001, "t": 525.91855, "r": 212.05495, "b": 534.29318, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Accurate document layout analysis is a key requirement for highquality PDF document conversion. With the recent availability of public, large ground-truth datasets such as PubLayNet and DocBank, deep-learning models have proven to be very effective at layout detection and segmentation. While these datasets are of adequate size to train such models, they severely lack in layout variability since they are sourced from scientific article repositories such as PubMed and arXiv only. Consequently, the accuracy of the layout segmentation drops significantly when these models are applied on more challenging and diverse layouts. In this paper, we present DocLayNet , a new, publicly available, document-layout annotation dataset in COCO format. It contains 80863 manually annotated pages from diverse data sources to represent a wide variability in layouts. For each PDF page, the layout annotations provide labelled bounding-boxes with a choice of 11 distinct classes. DocLayNet also provides a subset of double- and triple-annotated pages to determine the inter-annotator agreement. In multiple experiments, we provide baseline accuracy scores (in mAP) for a set of popular object detection models. We also demonstrate that these models fall approximately 10% behind the inter-annotator agreement. Furthermore, we provide evidence that DocLayNet is of sufficient size. Lastly, we compare models trained on PubLayNet, DocBank and DocLayNet, showing that layout predictions of the DocLayNettrained models are more robust and thus the preferred choice for general-purpose document-layout analysis."}, {"label": "section_header", "id": 4, "page_no": 0, "cluster": {"id": 4, "label": "section_header", "bbox": {"l": 53.79800000000001, "t": 550.99692, "r": 134.81989, "b": 561.30602, "coord_origin": "TOPLEFT"}, "confidence": 0.9149598479270935, "cells": [{"id": 49, "text": "CCS CONCEPTS", "bbox": {"l": 53.79800000000001, "t": 550.99692, "r": 134.81989, "b": 561.30602, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "CCS CONCEPTS"}, {"label": "text", "id": 11, "page_no": 0, "cluster": {"id": 11, "label": "text", "bbox": {"l": 53.797989, "t": 566.08299, "r": 297.85294, "b": 596.50114, "coord_origin": "TOPLEFT"}, "confidence": 0.8458839058876038, "cells": [{"id": 50, "text": "\u2022", "bbox": {"l": 53.79800000000001, "t": 566.19957, "r": 56.945206000000006, "b": 574.57419, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Information systems", "bbox": {"l": 58.440002, "t": 566.0830100000001, "r": 142.4462, "b": 574.5562600000001, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "\u2192", "bbox": {"l": 143.938, "t": 566.36096, "r": 153.15099, "b": 574.43073, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Document structure", "bbox": {"l": 154.646, "t": 566.0830100000001, "r": 235.46015999999997, "b": 574.5562600000001, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "; \u2022", "bbox": {"l": 235.45700000000002, "t": 566.19955, "r": 242.17419, "b": 574.57417, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "Applied com-", "bbox": {"l": 243.66899, "t": 566.08299, "r": 297.85294, "b": 574.55624, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "puting", "bbox": {"l": 53.797989, "t": 577.0419899999999, "r": 80.661324, "b": 585.51524, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "\u2192", "bbox": {"l": 83.565987, "t": 577.3199500000001, "r": 92.778961, "b": 585.38971, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Document analysis", "bbox": {"l": 95.68399, "t": 577.0419899999999, "r": 173.91583, "b": 585.51524, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "; \u2022", "bbox": {"l": 173.916, "t": 577.15855, "r": 182.1272, "b": 585.53317, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Computing methodologies", "bbox": {"l": 185.032, "t": 577.0419899999999, "r": 294.0455, "b": 585.51524, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "\u2192", "bbox": {"l": 53.79800399999999, "t": 588.27895, "r": 63.01097899999999, "b": 596.34871, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "Machine learning", "bbox": {"l": 65.253006, "t": 588.00099, "r": 136.80487, "b": 596.47424, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": ";", "bbox": {"l": 136.80501, "t": 588.1175499999999, "r": 138.92108, "b": 596.49217, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "Computer vision", "bbox": {"l": 141.162, "t": 588.00099, "r": 209.60254, "b": 596.47424, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": ";", "bbox": {"l": 209.60201, "t": 588.1175499999999, "r": 211.71808, "b": 596.49217, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "Object detection", "bbox": {"l": 213.96001, "t": 588.16238, "r": 270.45728, "b": 596.50114, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": ";", "bbox": {"l": 270.48001, "t": 588.1175499999999, "r": 272.59607, "b": 596.49217, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u2022 Information systems \u2192 Document structure ; \u2022 Applied computing \u2192 Document analysis ; \u2022 Computing methodologies \u2192 Machine learning ; Computer vision ; Object detection ;"}, {"label": "text", "id": 17, "page_no": 0, "cluster": {"id": 17, "label": "text", "bbox": {"l": 53.79800000000001, "t": 634.39838, "r": 295.11798, "b": 672.79189, "coord_origin": "TOPLEFT"}, "confidence": 0.7107349038124084, "cells": [{"id": 68, "text": "Permission to make digital or hard copies of part or all of this work for personal or", "bbox": {"l": 53.79800000000001, "t": 634.39838, "r": 294.17697, "b": 640.9119000000001, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "classroom use is granted without fee provided that copies are not made or distributed", "bbox": {"l": 53.79800000000001, "t": 642.36838, "r": 294.04443, "b": 648.8819, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "for profit or commercial advantage and that copies bear this notice and the full citation", "bbox": {"l": 53.79800000000001, "t": 650.33838, "r": 294.04498, "b": 656.8519, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "on the first page. Copyrights for third-party components of this work must be honored.", "bbox": {"l": 53.79800000000001, "t": 658.3083799999999, "r": 295.11798, "b": 664.8219, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "For all other uses, contact the owner/author(s).", "bbox": {"l": 53.79800000000001, "t": 666.27837, "r": 187.72285, "b": 672.79189, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Permission to make digital or hard copies of part or all of this work for personal or classroom use is granted without fee provided that copies are not made or distributed for profit or commercial advantage and that copies bear this notice and the full citation on the first page. Copyrights for third-party components of this work must be honored. For all other uses, contact the owner/author(s)."}, {"label": "text", "id": 29, "page_no": 0, "cluster": {"id": 29, "label": "text", "bbox": {"l": 53.79800000000001, "t": 675.08023, "r": 197.86275, "b": 681.56586, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 53.79800000000001, "t": 675.08023, "r": 197.86275, "b": 681.56586, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA"}, {"label": "text", "id": 30, "page_no": 0, "cluster": {"id": 30, "label": "text", "bbox": {"l": 53.317001, "t": 683.81236, "r": 186.74652, "b": 690.32589, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "\u00a9 2022 Copyright held by the owner/author(s).", "bbox": {"l": 53.317001, "t": 683.81236, "r": 186.74652, "b": 690.32589, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u00a9 2022 Copyright held by the owner/author(s)."}, {"label": "text", "id": 31, "page_no": 0, "cluster": {"id": 31, "label": "text", "bbox": {"l": 53.554001, "t": 691.78336, "r": 157.03125, "b": 698.29689, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "ACM ISBN 978-1-4503-9385-0/22/08.", "bbox": {"l": 53.554001, "t": 691.78336, "r": 157.03125, "b": 698.29689, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "ACM ISBN 978-1-4503-9385-0/22/08."}, {"label": "text", "id": 27, "page_no": 0, "cluster": {"id": 27, "label": "text", "bbox": {"l": 53.79800000000001, "t": 699.753365, "r": 166.94093, "b": 706.266891, "coord_origin": "TOPLEFT"}, "confidence": 0.509588360786438, "cells": [{"id": 76, "text": "https://doi.org/10.1145/3534678.3539043", "bbox": {"l": 53.79800000000001, "t": 699.753365, "r": 166.94093, "b": 706.266891, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "https://doi.org/10.1145/3534678.3539043"}, {"label": "picture", "id": 20, "page_no": 0, "cluster": {"id": 20, "label": "picture", "bbox": {"l": 323.408203125, "t": 250.34873962402344, "r": 553.2952270507812, "b": 525.8507080078125, "coord_origin": "TOPLEFT"}, "confidence": 0.5910208821296692, "cells": [{"id": 77, "text": "13", "bbox": {"l": 327.86951, "t": 351.78085, "r": 330.41248, "b": 353.95465, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "USING THE VERTICAL TUBE -", "bbox": {"l": 327.83005, "t": 331.57268999999997, "r": 351.16092, "b": 333.31171, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "MODELS AY11230/11234", "bbox": {"l": 327.83005, "t": 333.18292, "r": 348.30536, "b": 334.92194, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "1.", "bbox": {"l": 327.83005, "t": 336.40439, "r": 329.05914, "b": 337.92606, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "The vertical tube can be used for", "bbox": {"l": 329.67368, "t": 336.40439, "r": 349.95349, "b": 337.92606, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "instructional viewing or to photograph", "bbox": {"l": 329.11752, "t": 337.83588, "r": 353.57977, "b": 339.35751000000005, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": " the image with a digital camera or a", "bbox": {"l": 327.77121, "t": 339.26736, "r": 352.4306, "b": 340.789, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": " micro TV unit", "bbox": {"l": 328.15176, "t": 340.69882, "r": 337.91086, "b": 342.22049, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "2.", "bbox": {"l": 327.8313, "t": 342.19043000000005, "r": 329.09155, "b": 343.71207, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Loosen the retention screw, then rotate ", "bbox": {"l": 329.72168, "t": 342.19043000000005, "r": 354.9267, "b": 343.71207, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": " the adjustment ring to change the ", "bbox": {"l": 327.8313, "t": 343.62192, "r": 351.66949, "b": 345.14355, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": " length of the vertical tube.", "bbox": {"l": 328.21185, "t": 345.05338, "r": 346.33179, "b": 346.57504, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "3.", "bbox": {"l": 327.83005, "t": 346.84680000000003, "r": 329.12726, "b": 348.36847, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "Make sure that both the images in", "bbox": {"l": 329.77588, "t": 346.84680000000003, "r": 351.18005, "b": 348.36847, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "OPERATION ", "bbox": {"l": 327.25311, "t": 254.94812000000002, "r": 350.07861, "b": 258.86096, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "(", "bbox": {"l": 350.07861, "t": 254.76782000000003, "r": 351.82651, "b": 258.68066, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "cont.", "bbox": {"l": 351.82651, "t": 254.94812000000002, "r": 360.85242, "b": 258.86096, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": ")", "bbox": {"l": 360.85242, "t": 254.76782000000003, "r": 362.60028, "b": 258.68066, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "SELECTING OBJECTIVE ", "bbox": {"l": 326.88037, "t": 263.49492999999995, "r": 345.84351, "b": 265.23395000000005, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "MAGNIFICATION", "bbox": {"l": 326.88037, "t": 265.10515999999996, "r": 340.54153, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "1.", "bbox": {"l": 326.88037, "t": 266.71533, "r": 328.31903, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "There are two objectives. The lower", "bbox": {"l": 329.03836, "t": 266.71533, "r": 354.21472, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": " magnification objective has a greater", "bbox": {"l": 326.88037, "t": 268.32556, "r": 355.19193, "b": 270.06458, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": " depth of field and view.", "bbox": {"l": 326.88037, "t": 269.93579, "r": 345.80057, "b": 271.6748, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "2.", "bbox": {"l": 326.88037, "t": 271.54602, "r": 328.33862, "b": 273.28503, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "In order to observe the specimen", "bbox": {"l": 329.06775, "t": 271.54602, "r": 352.39969, "b": 273.28503, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": " easily use the lower magnification", "bbox": {"l": 326.88037, "t": 273.15619000000004, "r": 352.90042, "b": 274.89526, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": " objective first. Then, by rotating the", "bbox": {"l": 326.88037, "t": 274.76642000000004, "r": 354.59546, "b": 276.50543000000005, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": " case, the magnification can be", "bbox": {"l": 326.88037, "t": 276.37665000000004, "r": 350.81885, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": " changed.", "bbox": {"l": 326.88037, "t": 277.98688000000004, "r": 335.46707, "b": 279.72589000000005, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "CHANGING THE INTERPUPILLARY ", "bbox": {"l": 326.88037, "t": 281.20728, "r": 354.57755, "b": 282.94632, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "DISTANCE", "bbox": {"l": 326.88037, "t": 282.81750000000005, "r": 335.1752, "b": 284.55652, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "1.", "bbox": {"l": 326.88037, "t": 284.4277, "r": 328.34784, "b": 286.16675, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "The distance between the observer's", "bbox": {"l": 329.08157, "t": 284.4277, "r": 354.76245, "b": 286.16675, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": " pupils is the interpupillary distance.", "bbox": {"l": 326.88037, "t": 286.03793, "r": 354.6499, "b": 287.77695, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "2.", "bbox": {"l": 326.88037, "t": 287.64813, "r": 328.25125, "b": 289.38718, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "To adjust the interpupillary distance", "bbox": {"l": 328.93671, "t": 287.64813, "r": 354.29825, "b": 289.38718, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": " rotate the prism caps until both eyes", "bbox": {"l": 326.88181, "t": 289.25836, "r": 355.02075, "b": 290.99738, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": " coincide with the image in the", "bbox": {"l": 326.88181, "t": 290.86855999999995, "r": 350.82028, "b": 292.6076, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": " eyepiece. ", "bbox": {"l": 326.88181, "t": 292.47879, "r": 336.2067, "b": 294.2178, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "FOCUSING", "bbox": {"l": 326.88181, "t": 295.69922, "r": 335.3941, "b": 297.43823, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "1.", "bbox": {"l": 326.88181, "t": 297.30942, "r": 328.34314, "b": 299.04846, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "Remove the lens protective cover.", "bbox": {"l": 329.07379, "t": 297.30942, "r": 353.18555, "b": 299.04846, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "2.", "bbox": {"l": 326.88324, "t": 298.91965, "r": 328.35919, "b": 300.65866, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "Place the specimen on the working", "bbox": {"l": 329.0972, "t": 298.91965, "r": 353.45065, "b": 300.65866, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": " stage.", "bbox": {"l": 326.88324, "t": 300.52985, "r": 333.32825, "b": 302.26889000000006, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "3.", "bbox": {"l": 326.88324, "t": 302.14008000000007, "r": 328.31296, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "Focus the specimen with the left eye", "bbox": {"l": 329.02783, "t": 302.14008000000007, "r": 354.76303, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": " first while turning the focus knob until", "bbox": {"l": 326.88324, "t": 303.75027, "r": 355.96307, "b": 305.48932, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": " the image appears clear and sharp.", "bbox": {"l": 326.88324, "t": 305.3605, "r": 354.46594, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "4.", "bbox": {"l": 326.88324, "t": 306.9707, "r": 328.25488, "b": 308.70975, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "Rotate the right eyepiece ring until the", "bbox": {"l": 328.9407, "t": 306.9707, "r": 356.37335, "b": 308.70975, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": " images in each eyepiece coincide and", "bbox": {"l": 326.88324, "t": 308.58093, "r": 355.38867, "b": 310.31995, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": " are sharp and clear.", "bbox": {"l": 326.88324, "t": 310.19113, "r": 343.17249, "b": 311.93018, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "CHANGING THE BULB", "bbox": {"l": 326.88324, "t": 313.41156, "r": 344.13388, "b": 315.15059999999994, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "1.", "bbox": {"l": 326.88324, "t": 315.02178999999995, "r": 328.37418, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "Disconnect the power cord.", "bbox": {"l": 329.11963, "t": 315.02178999999995, "r": 348.50162, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "2.", "bbox": {"l": 326.88324, "t": 316.63199, "r": 328.34061, "b": 318.37103, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "When the bulb is cool, remove the", "bbox": {"l": 329.06931, "t": 316.63199, "r": 353.11588, "b": 318.37103, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": " oblique illuminator cap and remove", "bbox": {"l": 326.88464, "t": 318.2422199999999, "r": 353.79517, "b": 319.9812299999999, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": " the halogen bulb with cap.", "bbox": {"l": 326.88464, "t": 319.85242000000005, "r": 348.02094, "b": 321.59146, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "3.", "bbox": {"l": 326.88464, "t": 321.46265, "r": 328.37512, "b": 323.20166, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "Replace with a new halogen bulb.", "bbox": {"l": 329.12036, "t": 321.46265, "r": 352.96808, "b": 323.20166, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "4.", "bbox": {"l": 326.88608, "t": 323.07285, "r": 328.36884, "b": 324.81189, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "Open the window in the base plate and", "bbox": {"l": 329.1102, "t": 323.07285, "r": 356.5412, "b": 324.81189, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": " replace the halogen lamp or ", "bbox": {"l": 326.88608, "t": 324.68307000000004, "r": 350.13828, "b": 326.42209, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": " fluorescent lamp of transmitted", "bbox": {"l": 326.88608, "t": 326.29327, "r": 351.59677, "b": 328.03232, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": " illuminator.", "bbox": {"l": 326.88608, "t": 327.9035, "r": 336.89197, "b": 329.64252, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "FOCUSING", "bbox": {"l": 358.42023, "t": 263.49492999999995, "r": 366.93256, "b": 265.23395000000005, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "1.", "bbox": {"l": 358.42023, "t": 265.10515999999996, "r": 359.89841, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "Turn the focusing knob away or toward", "bbox": {"l": 360.63751, "t": 265.10515999999996, "r": 387.98407, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": " you until a clear image is viewed.", "bbox": {"l": 358.42023, "t": 266.71533, "r": 384.58948, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "2.", "bbox": {"l": 358.42166, "t": 268.32556, "r": 359.78549, "b": 270.06458, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "If the image is unclear, adjust the", "bbox": {"l": 360.46741, "t": 268.32556, "r": 384.33441, "b": 270.06458, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": " height of the elevator up or down,", "bbox": {"l": 358.4231, "t": 269.93579, "r": 384.61502, "b": 271.6748, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": " then turn the focusing knob again.", "bbox": {"l": 358.4231, "t": 271.54602, "r": 385.38922, "b": 273.28503, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "ZOOM MAGNIFICATION", "bbox": {"l": 358.4231, "t": 274.76642000000004, "r": 377.35046, "b": 276.50543000000005, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "1.", "bbox": {"l": 358.4231, "t": 276.37665000000004, "r": 359.89429, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "Turn the zoom magnification knob to", "bbox": {"l": 360.62988, "t": 276.37665000000004, "r": 386.37589, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": " the desired magnification and field of", "bbox": {"l": 358.4231, "t": 277.98688000000004, "r": 386.78732, "b": 279.72589000000005, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": " view.", "bbox": {"l": 358.4231, "t": 279.59704999999997, "r": 364.16855, "b": 281.33609, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "2.", "bbox": {"l": 358.4231, "t": 281.20728, "r": 359.86777, "b": 282.94632, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "In most situations, it is recommended", "bbox": {"l": 360.59012, "t": 281.20728, "r": 387.31656, "b": 282.94632, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": " that you focus at the lowest ", "bbox": {"l": 358.4231, "t": 282.81750000000005, "r": 381.56656, "b": 284.55652, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": " magnification, then move to a higher", "bbox": {"l": 358.4231, "t": 284.4277, "r": 386.63403, "b": 286.16675, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": " magnification and re-focus as ", "bbox": {"l": 358.42453, "t": 286.03793, "r": 382.77115, "b": 287.77695, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": " necessary.", "bbox": {"l": 358.42453, "t": 287.64813, "r": 367.98694, "b": 289.38718, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "3.", "bbox": {"l": 358.42453, "t": 289.25836, "r": 359.80386, "b": 290.99738, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "If the image is not clear to both eyes", "bbox": {"l": 360.49353, "t": 289.25836, "r": 386.70093, "b": 290.99738, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": " at the same time, the diopter ring may", "bbox": {"l": 358.42453, "t": 290.86855999999995, "r": 388.03534, "b": 292.6076, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": " need adjustment.", "bbox": {"l": 358.42453, "t": 292.47879, "r": 373.13724, "b": 294.2178, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "DIOPTER RING ADJUSTMENT", "bbox": {"l": 358.42453, "t": 295.69922, "r": 381.74539, "b": 297.43823, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "1.", "bbox": {"l": 358.42453, "t": 297.30942, "r": 359.83682, "b": 299.04846, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "To adjust the eyepiece for viewing with", "bbox": {"l": 360.54297, "t": 297.30942, "r": 388.08289, "b": 299.04846, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": " or without eyeglasses and for ", "bbox": {"l": 358.42453, "t": 298.91965, "r": 382.73251, "b": 300.65866, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": " differences in acuity between the right", "bbox": {"l": 358.42453, "t": 300.52985, "r": 387.72266, "b": 302.26889000000006, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": " and left eyes, follow the following", "bbox": {"l": 358.42453, "t": 302.14008000000007, "r": 384.1991, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": " steps:", "bbox": {"l": 358.42453, "t": 303.75027, "r": 364.88672, "b": 305.48932, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "a.", "bbox": {"l": 358.42453, "t": 305.3605, "r": 359.95078, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "Observe an image through the left", "bbox": {"l": 361.47699, "t": 305.3605, "r": 386.65988, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": " eyepiece and bring a specific point", "bbox": {"l": 358.42453, "t": 306.9707, "r": 386.7634, "b": 308.70975, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": " into focus using the focus knob.", "bbox": {"l": 358.42453, "t": 308.58093, "r": 385.41354, "b": 310.31995, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "b.", "bbox": {"l": 358.42453, "t": 310.19113, "r": 359.93304, "b": 311.93018, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "By turning the diopter ring ", "bbox": {"l": 361.44156, "t": 310.19113, "r": 382.56085, "b": 311.93018, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": " adjustment for the left eyepiece,", "bbox": {"l": 358.42596, "t": 311.80136, "r": 385.4559, "b": 313.54037, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": " bring the same point into sharp", "bbox": {"l": 358.42596, "t": 313.41156, "r": 384.56122, "b": 315.15059999999994, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": " focus.", "bbox": {"l": 358.42596, "t": 315.02178999999995, "r": 366.74371, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": " c.Then bring the same point into", "bbox": {"l": 358.42596, "t": 316.63199, "r": 383.93884, "b": 318.37103, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": " focus through the right eyepiece", "bbox": {"l": 358.42596, "t": 318.2422199999999, "r": 385.69241, "b": 319.9812299999999, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": " by turning the right diopter ring.", "bbox": {"l": 358.42596, "t": 319.85242000000005, "r": 385.94861, "b": 321.59146, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": " d.With more than one viewer, each", "bbox": {"l": 358.42596, "t": 321.46265, "r": 385.54236, "b": 323.20166, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": " viewer should note their own", "bbox": {"l": 358.42596, "t": 323.07285, "r": 382.98718, "b": 324.81189, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": " diopter ring position for the left", "bbox": {"l": 358.42596, "t": 324.68307000000004, "r": 385.06448, "b": 326.42209, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": " and right eyepieces, then before", "bbox": {"l": 358.42596, "t": 326.29327, "r": 385.20682, "b": 328.03232, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": " viewing set the diopter ring", "bbox": {"l": 358.42596, "t": 327.9035, "r": 382.21964, "b": 329.64252, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": " adjustments to that setting.", "bbox": {"l": 358.42596, "t": 329.5137, "r": 382.63382, "b": 331.25275, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "CHANGING THE BULB", "bbox": {"l": 358.42596, "t": 332.73412999999994, "r": 375.67661, "b": 334.47317999999996, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "1.", "bbox": {"l": 358.42596, "t": 334.34436, "r": 359.90311, "b": 336.08337, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "Disconnect the power cord from the", "bbox": {"l": 360.64169, "t": 334.34436, "r": 385.75333, "b": 336.08337, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": " electrical outlet.", "bbox": {"l": 358.42596, "t": 335.95456, "r": 372.01416, "b": 337.6936, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "2.", "bbox": {"l": 358.42596, "t": 337.56479, "r": 359.88327, "b": 339.3038, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "When the bulb is cool, remove the", "bbox": {"l": 360.61191, "t": 337.56479, "r": 384.65726, "b": 339.3038, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": " oblique illuminator cap and remove", "bbox": {"l": 358.42596, "t": 339.17499, "r": 385.33649, "b": 340.9140300000001, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": " the halogen bulb with cap.", "bbox": {"l": 358.42596, "t": 340.78522, "r": 379.57224, "b": 342.52423, "coord_origin": "TOPLEFT"}}, {"id": 201, "text": "3.", "bbox": {"l": 358.4274, "t": 342.39542, "r": 359.91788, "b": 344.13446000000005, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": "Replace with a new halogen bulb.", "bbox": {"l": 360.66312, "t": 342.39542, "r": 384.5108, "b": 344.13446000000005, "coord_origin": "TOPLEFT"}}, {"id": 203, "text": "4.", "bbox": {"l": 358.42883, "t": 344.00565000000006, "r": 359.92792, "b": 345.74466, "coord_origin": "TOPLEFT"}}, {"id": 204, "text": "Open the window in the base plate", "bbox": {"l": 360.67746, "t": 344.00565000000006, "r": 385.41235, "b": 345.74466, "coord_origin": "TOPLEFT"}}, {"id": 205, "text": " and replace the halogen lamp or", "bbox": {"l": 358.42883, "t": 345.61584, "r": 383.2782, "b": 347.35489, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": " fluorescent lamp of transmitted", "bbox": {"l": 358.42883, "t": 347.22607, "r": 383.13953, "b": 348.96509, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": " illuminator.", "bbox": {"l": 358.42883, "t": 348.83627, "r": 368.43472, "b": 350.57532, "coord_origin": "TOPLEFT"}}, {"id": 208, "text": "Model AY11230", "bbox": {"l": 326.59567, "t": 261.14185, "r": 339.11377, "b": 262.88091999999995, "coord_origin": "TOPLEFT"}}, {"id": 209, "text": "Model AY11234", "bbox": {"l": 358.48605, "t": 261.14185, "r": 371.00415, "b": 262.88091999999995, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": "14", "bbox": {"l": 455.43533, "t": 351.77038999999996, "r": 457.97827000000007, "b": 353.94415, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "Objectives", "bbox": {"l": 408.24518, "t": 275.52673000000004, "r": 414.4234, "b": 276.96020999999996, "coord_origin": "TOPLEFT"}}, {"id": 212, "text": "Revolving Turret", "bbox": {"l": 409.39554, "t": 268.98235999999997, "r": 419.06677, "b": 270.41583, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "Coarse ", "bbox": {"l": 441.3895, "t": 279.12627999999995, "r": 445.87192, "b": 280.55975, "coord_origin": "TOPLEFT"}}, {"id": 214, "text": "Adjustment", "bbox": {"l": 441.3895, "t": 280.30609, "r": 448.22338999999994, "b": 281.7395900000001, "coord_origin": "TOPLEFT"}}, {"id": 215, "text": "Knob", "bbox": {"l": 441.3895, "t": 281.48593, "r": 444.40371999999996, "b": 282.91939999999994, "coord_origin": "TOPLEFT"}}, {"id": 216, "text": "MODEL AY11236", "bbox": {"l": 398.79288, "t": 254.94646999999998, "r": 428.91568, "b": 258.85931000000005, "coord_origin": "TOPLEFT"}}, {"id": 217, "text": "MICROSCOPE USAGE", "bbox": {"l": 398.32535, "t": 305.04291, "r": 435.93542, "b": 308.95572000000004, "coord_origin": "TOPLEFT"}}, {"id": 218, "text": "BARSKA Model AY11236 is a powerful fixed power compound ", "bbox": {"l": 398.08594, "t": 310.35892, "r": 453.72171, "b": 312.53271, "coord_origin": "TOPLEFT"}}, {"id": 219, "text": "microscope designed for biological studies such as specimen ", "bbox": {"l": 398.08594, "t": 312.50586, "r": 453.09939999999995, "b": 314.67966, "coord_origin": "TOPLEFT"}}, {"id": 220, "text": "examination. It can also be used for examining bacteria and", "bbox": {"l": 398.08594, "t": 314.6528, "r": 456.65246999999994, "b": 316.8266, "coord_origin": "TOPLEFT"}}, {"id": 221, "text": "for general clinical and medical studies and other scientific uses. ", "bbox": {"l": 398.08594, "t": 316.79977, "r": 456.73859000000004, "b": 318.97354, "coord_origin": "TOPLEFT"}}, {"id": 222, "text": "CONSTRUCTION", "bbox": {"l": 398.62399, "t": 320.42941, "r": 427.77472, "b": 324.34222000000005, "coord_origin": "TOPLEFT"}}, {"id": 223, "text": "BARSKA Model AY11236 is a fixed power compound microscope.", "bbox": {"l": 398.08594, "t": 326.46069000000006, "r": 456.02639999999997, "b": 328.63449, "coord_origin": "TOPLEFT"}}, {"id": 224, "text": "It is constructed with two optical paths at the same angle. It is ", "bbox": {"l": 398.08414, "t": 328.6076699999999, "r": 455.42238999999995, "b": 330.7814599999999, "coord_origin": "TOPLEFT"}}, {"id": 225, "text": "equipped with transmitted illumination. By using this instrument, ", "bbox": {"l": 398.08414, "t": 330.75461, "r": 457.39844, "b": 332.92841, "coord_origin": "TOPLEFT"}}, {"id": 226, "text": "the user can observe specimens at magnification from 40x to ", "bbox": {"l": 398.08414, "t": 332.90155, "r": 453.97745, "b": 335.07535000000007, "coord_origin": "TOPLEFT"}}, {"id": 227, "text": "1000x by selecting the desired objective lens. Coarse and fine ", "bbox": {"l": 398.08414, "t": 335.04852, "r": 454.70708999999994, "b": 337.22232, "coord_origin": "TOPLEFT"}}, {"id": 228, "text": "focus adjustments provide accuracy and image detail. The rotating ", "bbox": {"l": 398.08414, "t": 337.19547, "r": 458.90240000000006, "b": 339.36926, "coord_origin": "TOPLEFT"}}, {"id": 229, "text": "head allows the user to position the eyepieces for maximum ", "bbox": {"l": 398.08594, "t": 339.34241, "r": 453.0672, "b": 341.5162, "coord_origin": "TOPLEFT"}}, {"id": 230, "text": "viewing comfort and easy access to all adjustment knobs.", "bbox": {"l": 398.08594, "t": 341.48938, "r": 449.63113, "b": 343.66318, "coord_origin": "TOPLEFT"}}, {"id": 231, "text": "Model AY11236", "bbox": {"l": 422.10626, "t": 301.24191, "r": 434.62433000000004, "b": 302.98096, "coord_origin": "TOPLEFT"}}, {"id": 232, "text": "Fine ", "bbox": {"l": 442.01610999999997, "t": 283.08649, "r": 444.8817399999999, "b": 284.51996, "coord_origin": "TOPLEFT"}}, {"id": 233, "text": "Adjustment", "bbox": {"l": 442.01610999999997, "t": 284.2663, "r": 448.85001, "b": 285.69980000000004, "coord_origin": "TOPLEFT"}}, {"id": 234, "text": "Knob", "bbox": {"l": 442.01610999999997, "t": 285.44611, "r": 445.03033000000005, "b": 286.87961, "coord_origin": "TOPLEFT"}}, {"id": 235, "text": "Stage", "bbox": {"l": 408.00577, "t": 279.12579000000005, "r": 411.42212, "b": 280.5593, "coord_origin": "TOPLEFT"}}, {"id": 236, "text": "Condenser ", "bbox": {"l": 404.07172, "t": 280.9144299999999, "r": 410.77707, "b": 282.3479, "coord_origin": "TOPLEFT"}}, {"id": 237, "text": "Focusing", "bbox": {"l": 404.07172, "t": 282.09424, "r": 409.2157, "b": 283.52774, "coord_origin": "TOPLEFT"}}, {"id": 238, "text": "Knob", "bbox": {"l": 404.07172, "t": 283.27408, "r": 407.08594, "b": 284.7075500000001, "coord_origin": "TOPLEFT"}}, {"id": 239, "text": "Eyepiece", "bbox": {"l": 441.81281, "t": 262.32178, "r": 447.03702, "b": 263.75525000000005, "coord_origin": "TOPLEFT"}}, {"id": 240, "text": "Stand", "bbox": {"l": 437.34607, "t": 271.13025000000005, "r": 440.80496, "b": 272.56281, "coord_origin": "TOPLEFT"}}, {"id": 241, "text": "Lamp ", "bbox": {"l": 409.7164, "t": 284.40027, "r": 413.3768, "b": 285.83282, "coord_origin": "TOPLEFT"}}, {"id": 242, "text": "On/Off", "bbox": {"l": 409.7164, "t": 285.83163, "r": 413.68201, "b": 287.26416, "coord_origin": "TOPLEFT"}}, {"id": 243, "text": "Switch", "bbox": {"l": 409.7164, "t": 287.263, "r": 413.6337, "b": 288.69553, "coord_origin": "TOPLEFT"}}, {"id": 244, "text": "Lamp ", "bbox": {"l": 434.8712499999999, "t": 296.7153, "r": 438.53164999999996, "b": 298.14783, "coord_origin": "TOPLEFT"}}, {"id": 245, "text": "Power", "bbox": {"l": 439.52039, "t": 292.18307000000004, "r": 443.08768, "b": 293.61560000000003, "coord_origin": "TOPLEFT"}}, {"id": 246, "text": "Cord", "bbox": {"l": 439.52039, "t": 293.61444, "r": 442.29575, "b": 295.04697, "coord_origin": "TOPLEFT"}}, {"id": 247, "text": "Rotating Head", "bbox": {"l": 413.55829, "t": 264.66089, "r": 421.94913, "b": 266.09344, "coord_origin": "TOPLEFT"}}, {"id": 248, "text": "Stage Clip", "bbox": {"l": 441.84316999999993, "t": 286.90573, "r": 447.87585000000007, "b": 288.33826, "coord_origin": "TOPLEFT"}}, {"id": 249, "text": "Adjustment", "bbox": {"l": 441.84316999999993, "t": 288.3371, "r": 448.67252, "b": 289.76962000000003, "coord_origin": "TOPLEFT"}}, {"id": 250, "text": "Interpupillary Slide Adjustment", "bbox": {"l": 407.2403, "t": 259.86645999999996, "r": 425.79089, "b": 261.29895, "coord_origin": "TOPLEFT"}}, {"id": 251, "text": "Circling Minimums", "bbox": {"l": 449.10074000000003, "t": 378.66302, "r": 466.08835000000005, "b": 380.78412, "coord_origin": "TOPLEFT"}}, {"id": 252, "text": "7", "bbox": {"l": 449.10074000000003, "t": 383.2203999999999, "r": 449.64444, "b": 385.34148999999996, "coord_origin": "TOPLEFT"}}, {"id": 253, "text": "K H U H Z D V D F K D Q J H W R W K H 7 ( 5 3 6 F U L W H U L D L Q W K D W D \u1087H F W V F L U F O L Q J D U H D G L P H Q V L R Q E \\ H [ S D Q G L Q J W K H D U H D V W R S U R Y L G H ", "bbox": {"l": 450.18811, "t": 383.2203999999999, "r": 550.77124, "b": 385.34148999999996, "coord_origin": "TOPLEFT"}}, {"id": 254, "text": "improved obstacle protection. To indicate that the new criteria had been applied to a given procedure, a ", "bbox": {"l": 449.10074000000003, "t": 385.75732, "r": 536.14716, "b": 387.87842, "coord_origin": "TOPLEFT"}}, {"id": 255, "text": " is placed on ", "bbox": {"l": 538.31085, "t": 385.75732, "r": 549.49921, "b": 387.87842, "coord_origin": "TOPLEFT"}}, {"id": 256, "text": "the circling line of minimums. The new circling tables and explanatory information is located in the Legend of the TPP.", "bbox": {"l": 449.10074000000003, "t": 388.03601, "r": 547.58185, "b": 390.1571, "coord_origin": "TOPLEFT"}}, {"id": 257, "text": "7", "bbox": {"l": 449.10074000000003, "t": 393.2128000000001, "r": 449.6163, "b": 395.33386, "coord_origin": "TOPLEFT"}}, {"id": 258, "text": "K H D S S U R D F K H V X V L Q J V W D Q G D U G F L U F O L Q J D S S U R D F K D U H D V F D Q E H L G H Q W L \u00bf H G E \\ W K H D E V H Q F H R I W K H ", "bbox": {"l": 450.1319, "t": 393.2128000000001, "r": 529.53082, "b": 395.33386, "coord_origin": "TOPLEFT"}}, {"id": 259, "text": " on the circling line of ", "bbox": {"l": 532.05829, "t": 393.2128000000001, "r": 550.42261, "b": 395.33386, "coord_origin": "TOPLEFT"}}, {"id": 260, "text": "minima.", "bbox": {"l": 449.10074000000003, "t": 395.49149, "r": 455.74692, "b": 397.61255, "coord_origin": "TOPLEFT"}}, {"id": 261, "text": "$ S S O \\ 6 W D Q G D U G & L U F O L Q J $ S S U R D F K 0 D Q H X Y H U L Q J 5 D G L X V 7 D E O H ", "bbox": {"l": 449.95525999999995, "t": 415.59549, "r": 496.2829, "b": 417.50446, "coord_origin": "TOPLEFT"}}, {"id": 262, "text": "$ S S O \\ ( [ S D Q G H G & L U F O L Q J $ S S U R D F K 0 D Q H X Y H U L Q J $ L U V S D F H 5 D G L X V ", "bbox": {"l": 501.13077, "t": 409.25543, "r": 551.16101, "b": 411.1644, "coord_origin": "TOPLEFT"}}, {"id": 263, "text": "Table", "bbox": {"l": 501.13077, "t": 411.30624, "r": 505.2477999999999, "b": 413.21521, "coord_origin": "TOPLEFT"}}, {"id": 264, "text": "AIRPORT SKETCH", "bbox": {"l": 449.10074000000003, "t": 420.18802, "r": 469.35599, "b": 422.73331, "coord_origin": "TOPLEFT"}}, {"id": 265, "text": "The airport sketch is a depiction of the airport with emphasis on runway pattern and related ", "bbox": {"l": 449.10074000000003, "t": 425.08908, "r": 525.93616, "b": 427.21017, "coord_origin": "TOPLEFT"}}, {"id": 266, "text": "information, positioned in either the lower left or lower right corner of the chart to aid pi-", "bbox": {"l": 449.10074000000003, "t": 427.3678, "r": 522.0343, "b": 429.48886, "coord_origin": "TOPLEFT"}}, {"id": 267, "text": "lot recognition of the airport from the air and to provide some information to aid on ground ", "bbox": {"l": 449.10074000000003, "t": 429.64648, "r": 524.67151, "b": 431.76755, "coord_origin": "TOPLEFT"}}, {"id": 268, "text": "navigation of the airport. The runways are drawn to scale and oriented to true north. Runway ", "bbox": {"l": 449.10074000000003, "t": 431.92514000000006, "r": 527.172, "b": 434.04623, "coord_origin": "TOPLEFT"}}, {"id": 269, "text": "dimensions (length and width) are shown for all active runways.", "bbox": {"l": 449.10074000000003, "t": 434.20383, "r": 502.39545, "b": 436.32492, "coord_origin": "TOPLEFT"}}, {"id": 270, "text": "Runway(s) are depicted based on what type and construction of the runway.", "bbox": {"l": 449.10074000000003, "t": 438.7611999999999, "r": 512.92676, "b": 440.88228999999995, "coord_origin": "TOPLEFT"}}, {"id": 271, "text": "Hard Surface", "bbox": {"l": 449.95525999999995, "t": 444.07001, "r": 460.02307, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}, {"id": 272, "text": "Other Than ", "bbox": {"l": 464.89963, "t": 444.07001, "r": 473.98819, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}, {"id": 273, "text": "Hard Surface", "bbox": {"l": 464.89963, "t": 446.12085, "r": 474.96744, "b": 448.02979, "coord_origin": "TOPLEFT"}}, {"id": 274, "text": "Metal Surface", "bbox": {"l": 478.91357, "t": 444.07001, "r": 489.45648, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}, {"id": 275, "text": "Closed Runway", "bbox": {"l": 493.06420999999995, "t": 444.07001, "r": 505.03076, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}, {"id": 276, "text": "Under Construction", "bbox": {"l": 509.5809, "t": 444.07001, "r": 524.30237, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}, {"id": 277, "text": "Stopways, ", "bbox": {"l": 449.95525999999995, "t": 454.81207, "r": 458.31406, "b": 456.72104, "coord_origin": "TOPLEFT"}}, {"id": 278, "text": "Taxiways, Park-", "bbox": {"l": 449.95525999999995, "t": 456.86288, "r": 461.92083999999994, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}}, {"id": 279, "text": "ing Areas", "bbox": {"l": 449.95525999999995, "t": 458.91373, "r": 457.08014, "b": 460.82268999999997, "coord_origin": "TOPLEFT"}}, {"id": 280, "text": "Displaced ", "bbox": {"l": 464.89963, "t": 454.81207, "r": 472.87732, "b": 456.72104, "coord_origin": "TOPLEFT"}}, {"id": 281, "text": "Threshold", "bbox": {"l": 464.89963, "t": 456.86288, "r": 472.49792, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}}, {"id": 282, "text": "Closed", "bbox": {"l": 478.91357, "t": 454.81207, "r": 483.61584, "b": 456.72104, "coord_origin": "TOPLEFT"}}, {"id": 283, "text": "Pavement", "bbox": {"l": 478.91357, "t": 456.86288, "r": 486.60754000000003, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}}, {"id": 284, "text": "Water Runway", "bbox": {"l": 493.06420999999995, "t": 454.81207, "r": 504.20648, "b": 456.72104, "coord_origin": "TOPLEFT"}}, {"id": 285, "text": "Taxiways and aprons are shaded grey. Other runway features that may be shown are runway numbers, runway dimen-", "bbox": {"l": 449.10074000000003, "t": 469.32974, "r": 548.59674, "b": 471.45081, "coord_origin": "TOPLEFT"}}, {"id": 286, "text": "sions, runway slope, arresting gear, and displaced threshold.", "bbox": {"l": 449.10074000000003, "t": 471.60843, "r": 500.08181999999994, "b": 473.72949, "coord_origin": "TOPLEFT"}}, {"id": 287, "text": "2", "bbox": {"l": 449.10074000000003, "t": 476.16577, "r": 449.59933000000007, "b": 478.28687, "coord_origin": "TOPLEFT"}}, {"id": 288, "text": "W K H U L Q I R U P D W L R Q F R Q F H U Q L Q J O L J K W L Q J \u00bf Q D O D S S U R D F K E H D U L Q J V D L U S R U W E H D F R Q R E V W D F O H V F R Q W U R O W R Z H U 1 $ 9 $ , ' V K H O L ", "bbox": {"l": 450.09796, "t": 476.16577, "r": 547.82562, "b": 478.28687, "coord_origin": "TOPLEFT"}}, {"id": 289, "text": "-", "bbox": {"l": 547.82623, "t": 476.16577, "r": 548.45862, "b": 478.28687, "coord_origin": "TOPLEFT"}}, {"id": 290, "text": "pads may also be shown.", "bbox": {"l": 449.10074000000003, "t": 478.44446, "r": 470.52609000000007, "b": 480.56555, "coord_origin": "TOPLEFT"}}, {"id": 291, "text": "$ L U S R U W ( O H Y D W L R Q D Q G 7 R X F K G R Z Q = R Q H ( O H Y D W L R Q ", "bbox": {"l": 449.10074000000003, "t": 483.00183, "r": 493.37906000000004, "b": 485.12292, "coord_origin": "TOPLEFT"}}, {"id": 292, "text": "The airport elevation is shown enclosed within a box in the upper left corner of the sketch box and the touchdown zone ", "bbox": {"l": 449.10074000000003, "t": 487.5592, "r": 549.16168, "b": 489.6803, "coord_origin": "TOPLEFT"}}, {"id": 293, "text": "elevation (TDZE) is shown in the upper right corner of the sketch box. The airport elevation is the highest point of an ", "bbox": {"l": 449.10074000000003, "t": 489.83789, "r": 546.90881, "b": 491.95898, "coord_origin": "TOPLEFT"}}, {"id": 294, "text": "D L U S R U W \u00b6 V X V D E O H U X Q Z D \\ V P H D V X U H G L Q I H H W I U R P P H D Q V H D O H Y H O 7 K H 7 ' = ( L V W K H K L J K H V W H O H Y D W L R Q L Q W K H \u00bf U V W I H H W R I ", "bbox": {"l": 449.10074000000003, "t": 492.11658, "r": 551.80023, "b": 494.23767, "coord_origin": "TOPLEFT"}}, {"id": 295, "text": "the landing surface. Circling only approaches will not show a TDZE.", "bbox": {"l": 449.10074000000003, "t": 494.39526, "r": 505.85068000000007, "b": 496.51636, "coord_origin": "TOPLEFT"}}, {"id": 296, "text": "114", "bbox": {"l": 498.80661000000003, "t": 515.9437, "r": 502.08792, "b": 519.01764, "coord_origin": "TOPLEFT"}}, {"id": 297, "text": "FAA Chart Users\u2019 Guide - Terminal Procedures Publication (TPP) - Terms", "bbox": {"l": 444.56319999999994, "t": 422.84869, "r": 446.25998, "b": 471.87128, "coord_origin": "TOPLEFT"}}, {"id": 298, "text": "AGL 2013 Financial Calendar", "bbox": {"l": 329.40536, "t": 379.37537, "r": 355.13138, "b": 382.13336, "coord_origin": "TOPLEFT"}}, {"id": 299, "text": "22", "bbox": {"l": 329.40536, "t": 382.30273, "r": 330.96848, "b": 384.55927, "coord_origin": "TOPLEFT"}}, {"id": 300, "text": "August 2012 ", "bbox": {"l": 331.75003, "t": 382.30273, "r": 341.12875, "b": 384.55927, "coord_origin": "TOPLEFT"}}, {"id": 301, "text": "2012 full year result and fi nal dividend announced", "bbox": {"l": 350.4722, "t": 382.30273, "r": 384.81079, "b": 384.55927, "coord_origin": "TOPLEFT"}}, {"id": 302, "text": "30", "bbox": {"l": 329.40536, "t": 384.84552, "r": 330.97336, "b": 387.10205, "coord_origin": "TOPLEFT"}}, {"id": 303, "text": "August 2012 ", "bbox": {"l": 331.75735, "t": 384.84552, "r": 341.16534, "b": 387.10205, "coord_origin": "TOPLEFT"}}, {"id": 304, "text": "Ex-dividend trading commences", "bbox": {"l": 350.4722, "t": 384.84552, "r": 372.90613, "b": 387.10205, "coord_origin": "TOPLEFT"}}, {"id": 305, "text": "5", "bbox": {"l": 329.40536, "t": 387.38828, "r": 330.20337, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}}, {"id": 306, "text": "September 2012 ", "bbox": {"l": 331.00137, "t": 387.38828, "r": 342.9715, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}}, {"id": 307, "text": "Record date for 2012 fi nal dividend", "bbox": {"l": 350.4722, "t": 387.38828, "r": 374.88693, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}}, {"id": 308, "text": "27", "bbox": {"l": 329.40536, "t": 389.93103, "r": 331.0173, "b": 392.18762, "coord_origin": "TOPLEFT"}}, {"id": 309, "text": "September 2012 ", "bbox": {"l": 331.82327, "t": 389.93103, "r": 343.91284, "b": 392.18762, "coord_origin": "TOPLEFT"}}, {"id": 310, "text": "Final dividend payable", "bbox": {"l": 350.4722, "t": 389.93103, "r": 365.65988, "b": 392.18762, "coord_origin": "TOPLEFT"}}, {"id": 311, "text": "23", "bbox": {"l": 329.40536, "t": 392.47382, "r": 330.98804, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}}, {"id": 312, "text": "October 2012 ", "bbox": {"l": 331.77936, "t": 392.47382, "r": 342.06674, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}}, {"id": 313, "text": "Annual General Meeting", "bbox": {"l": 350.4722, "t": 392.47382, "r": 367.22156, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}}, {"id": 314, "text": "27", "bbox": {"l": 329.40536, "t": 395.0166, "r": 330.99741, "b": 397.27313, "coord_origin": "TOPLEFT"}}, {"id": 315, "text": "February 2013", "bbox": {"l": 331.7934, "t": 395.0166, "r": 342.1416, "b": 397.27313, "coord_origin": "TOPLEFT"}}, {"id": 316, "text": " 1", "bbox": {"l": 342.64841, "t": 395.18298, "r": 342.65811, "b": 396.49857000000003, "coord_origin": "TOPLEFT"}}, {"id": 317, "text": "2013 interim result and interim dividend announced", "bbox": {"l": 350.47177, "t": 395.01474, "r": 386.25897, "b": 397.2713, "coord_origin": "TOPLEFT"}}, {"id": 318, "text": "28", "bbox": {"l": 329.40491, "t": 397.55749999999995, "r": 331.02695, "b": 399.81406, "coord_origin": "TOPLEFT"}}, {"id": 319, "text": "August 2013", "bbox": {"l": 331.83795, "t": 397.55749999999995, "r": 340.75909, "b": 399.81406, "coord_origin": "TOPLEFT"}}, {"id": 320, "text": " 1", "bbox": {"l": 341.26437, "t": 397.7254, "r": 341.27408, "b": 399.04095, "coord_origin": "TOPLEFT"}}, {"id": 321, "text": "2013 full year results and fi nal dividend announced ", "bbox": {"l": 350.47144, "t": 397.55713, "r": 385.93265, "b": 399.81369, "coord_origin": "TOPLEFT"}}, {"id": 322, "text": "1", "bbox": {"l": 329.40536, "t": 400.46155, "r": 329.87708, "b": 401.96588, "coord_origin": "TOPLEFT"}}, {"id": 323, "text": "Indicative dates only, subject to change/Board confi rmation", "bbox": {"l": 330.34882, "t": 400.46155, "r": 358.65204, "b": 401.96588, "coord_origin": "TOPLEFT"}}, {"id": 324, "text": "AGL\u2019s Annual General Meeting will be held at the City Recital Hall, Angel Place, Sydney ", "bbox": {"l": 329.40536, "t": 404.34503, "r": 391.771, "b": 406.60156, "coord_origin": "TOPLEFT"}}, {"id": 325, "text": "commencing at 10.30am on Tuesday 23 October 2012.", "bbox": {"l": 329.40536, "t": 406.37857, "r": 369.65308, "b": 408.63513000000006, "coord_origin": "TOPLEFT"}}, {"id": 326, "text": "Ye s te rd ay", "bbox": {"l": 363.54486, "t": 460.53054999999995, "r": 379.25955, "b": 465.54507, "coord_origin": "TOPLEFT"}}, {"id": 327, "text": "Established in Sydney in 1837, and then ", "bbox": {"l": 363.54486, "t": 466.7157, "r": 391.38229, "b": 468.97223, "coord_origin": "TOPLEFT"}}, {"id": 328, "text": "known as The Australian Gas Light Company, ", "bbox": {"l": 363.54486, "t": 468.74924, "r": 395.01788, "b": 471.00577, "coord_origin": "TOPLEFT"}}, {"id": 329, "text": "the AGL business has an established history ", "bbox": {"l": 363.54486, "t": 470.78281, "r": 394.08322, "b": 473.03934, "coord_origin": "TOPLEFT"}}, {"id": 330, "text": "and reputation for serving the gas and ", "bbox": {"l": 363.54486, "t": 472.81635, "r": 390.60727, "b": 475.07288, "coord_origin": "TOPLEFT"}}, {"id": 331, "text": "electricity needs of Australian households. ", "bbox": {"l": 363.54486, "t": 474.84988, "r": 393.49612, "b": 477.10645, "coord_origin": "TOPLEFT"}}, {"id": 332, "text": "In 1841, when AGL supplied the gas to light ", "bbox": {"l": 363.54486, "t": 476.88345, "r": 394.11481, "b": 479.13998, "coord_origin": "TOPLEFT"}}, {"id": 333, "text": "the fi rst public street lamp, it was reported ", "bbox": {"l": 363.54486, "t": 478.91699, "r": 393.75891, "b": 481.17352, "coord_origin": "TOPLEFT"}}, {"id": 334, "text": "in the Sydney Gazette as a \u201cwonderful ", "bbox": {"l": 363.54486, "t": 480.95053, "r": 390.4975, "b": 483.20709, "coord_origin": "TOPLEFT"}}, {"id": 335, "text": "achievement of scientifi c knowledge, assisted ", "bbox": {"l": 363.54486, "t": 482.9841, "r": 395.70975, "b": 485.24063, "coord_origin": "TOPLEFT"}}, {"id": 336, "text": "by mechanical ingenuity.\u201d Within two years, ", "bbox": {"l": 363.54486, "t": 485.01764, "r": 394.27283, "b": 487.2742, "coord_origin": "TOPLEFT"}}, {"id": 337, "text": "165 gas lamps were lighting the City of Sydney.", "bbox": {"l": 363.54486, "t": 487.05121, "r": 396.65939, "b": 489.30774, "coord_origin": "TOPLEFT"}}, {"id": 338, "text": "Looking back on ", "bbox": {"l": 329.4054, "t": 419.93124, "r": 384.19696, "b": 431.09412, "coord_origin": "TOPLEFT"}}, {"id": 339, "text": "175 years of ", "bbox": {"l": 329.4054, "t": 430.10379, "r": 372.16626, "b": 441.26669, "coord_origin": "TOPLEFT"}}, {"id": 340, "text": "looking forward.", "bbox": {"l": 329.4054, "t": 440.27636999999993, "r": 385.3981, "b": 451.43924, "coord_origin": "TOPLEFT"}}, {"id": 341, "text": "AGL Energy Limited ABN 74 115 061 375", "bbox": {"l": 329.40536, "t": 372.16159, "r": 353.36179, "b": 373.91669, "coord_origin": "TOPLEFT"}}, {"id": 342, "text": "29", "bbox": {"l": 546.20587, "t": 360.90448, "r": 548.23407, "b": 362.82242, "coord_origin": "TOPLEFT"}}, {"id": 343, "text": "signs, signals and road markings", "bbox": {"l": 497.77728, "t": 251.43384000000003, "r": 542.8255, "b": 254.94385, "coord_origin": "TOPLEFT"}}, {"id": 344, "text": "3", "bbox": {"l": 490.30679, "t": 251.47478999999998, "r": 492.09982, "b": 254.98479999999995, "coord_origin": "TOPLEFT"}}, {"id": 345, "text": "In ", "bbox": {"l": 498.15335, "t": 263.88922, "r": 500.05637, "b": 265.92719, "coord_origin": "TOPLEFT"}}, {"id": 346, "text": "chapter 2, you and your vehicle", "bbox": {"l": 500.05637, "t": 263.85717999999997, "r": 524.37036, "b": 265.86310000000003, "coord_origin": "TOPLEFT"}}, {"id": 347, "text": ", you learned about ", "bbox": {"l": 524.37036, "t": 263.88922, "r": 539.89124, "b": 265.92719, "coord_origin": "TOPLEFT"}}, {"id": 348, "text": "some of the controls in your vehicle. This chapter is a handy ", "bbox": {"l": 498.15335, "t": 265.93224999999995, "r": 544.50403, "b": 267.97020999999995, "coord_origin": "TOPLEFT"}}, {"id": 349, "text": "reference section that gives examples of the most common ", "bbox": {"l": 498.15335, "t": 267.97533999999996, "r": 544.01343, "b": 270.01331000000005, "coord_origin": "TOPLEFT"}}, {"id": 350, "text": "signs, signals and road markings that keep traffi c organized ", "bbox": {"l": 498.15335, "t": 270.01831000000004, "r": 544.11987, "b": 272.05634, "coord_origin": "TOPLEFT"}}, {"id": 351, "text": "and flowing smoothly. ", "bbox": {"l": 498.15335, "t": 272.06140000000005, "r": 515.41071, "b": 274.09937, "coord_origin": "TOPLEFT"}}, {"id": 352, "text": "Signs", "bbox": {"l": 498.15335, "t": 277.34619, "r": 505.64642000000003, "b": 280.9357, "coord_origin": "TOPLEFT"}}, {"id": 353, "text": "There are three ways to read signs: by their shape, colour and ", "bbox": {"l": 498.15335, "t": 281.82187, "r": 543.92957, "b": 283.85983, "coord_origin": "TOPLEFT"}}, {"id": 354, "text": "the messages printed on them. Understanding these three ways ", "bbox": {"l": 498.15335, "t": 283.8649, "r": 545.67834, "b": 285.90289, "coord_origin": "TOPLEFT"}}, {"id": 355, "text": "of classifying signs will help you figure out the meaning of signs ", "bbox": {"l": 498.15335, "t": 285.90796, "r": 545.26471, "b": 287.94592, "coord_origin": "TOPLEFT"}}, {"id": 356, "text": "that are new to you. ", "bbox": {"l": 498.15335, "t": 287.95099, "r": 513.31335, "b": 289.98895, "coord_origin": "TOPLEFT"}}, {"id": 357, "text": "Stop", "bbox": {"l": 505.43439, "t": 303.07596, "r": 508.53033000000005, "b": 304.89639, "coord_origin": "TOPLEFT"}}, {"id": 358, "text": "Yield the right-of-way", "bbox": {"l": 527.45502, "t": 303.25354, "r": 541.44678, "b": 305.07397, "coord_origin": "TOPLEFT"}}, {"id": 359, "text": "Shows driving", "bbox": {"l": 501.79385, "t": 321.18973, "r": 510.41632, "b": 323.01016, "coord_origin": "TOPLEFT"}}, {"id": 360, "text": "regulations", "bbox": {"l": 501.79385, "t": 322.87731999999994, "r": 509.04268999999994, "b": 324.69775000000004, "coord_origin": "TOPLEFT"}}, {"id": 361, "text": "Explains lane use", "bbox": {"l": 518.66455, "t": 319.59146, "r": 529.80902, "b": 321.41190000000006, "coord_origin": "TOPLEFT"}}, {"id": 362, "text": "School zone signs ", "bbox": {"l": 534.87561, "t": 318.37616, "r": 546.95142, "b": 320.19659, "coord_origin": "TOPLEFT"}}, {"id": 363, "text": "are fl uorescent ", "bbox": {"l": 534.87561, "t": 320.0637500000001, "r": 545.05762, "b": 321.88419, "coord_origin": "TOPLEFT"}}, {"id": 364, "text": "yellow-green", "bbox": {"l": 534.87561, "t": 321.75134, "r": 543.32263, "b": 323.57178, "coord_origin": "TOPLEFT"}}, {"id": 365, "text": "Tells about motorist ", "bbox": {"l": 499.21862999999996, "t": 338.12772, "r": 512.62451, "b": 339.94815, "coord_origin": "TOPLEFT"}}, {"id": 366, "text": "services", "bbox": {"l": 499.21862999999996, "t": 339.81531000000007, "r": 504.39917, "b": 341.63574, "coord_origin": "TOPLEFT"}}, {"id": 367, "text": "Shows a permitted ", "bbox": {"l": 516.97748, "t": 338.06039, "r": 529.77484, "b": 339.88082999999995, "coord_origin": "TOPLEFT"}}, {"id": 368, "text": "action", "bbox": {"l": 516.97748, "t": 339.74799, "r": 520.96399, "b": 341.56842, "coord_origin": "TOPLEFT"}}, {"id": 369, "text": "Shows an action that ", "bbox": {"l": 534.55847, "t": 337.88281, "r": 548.58453, "b": 339.7032500000001, "coord_origin": "TOPLEFT"}}, {"id": 370, "text": "is not permitted", "bbox": {"l": 534.55847, "t": 339.57040000000006, "r": 545.08862, "b": 341.39084, "coord_origin": "TOPLEFT"}}, {"id": 371, "text": "Warns of hazards ", "bbox": {"l": 483.05853, "t": 356.17416, "r": 494.72577, "b": 357.9946, "coord_origin": "TOPLEFT"}}, {"id": 372, "text": "ahead", "bbox": {"l": 483.05853, "t": 357.86179, "r": 487.07525999999996, "b": 359.68222, "coord_origin": "TOPLEFT"}}, {"id": 373, "text": "Warns of", "bbox": {"l": 499.39645, "t": 356.26297000000005, "r": 504.69171, "b": 358.0834, "coord_origin": "TOPLEFT"}}, {"id": 374, "text": "construction zones", "bbox": {"l": 499.39645, "t": 357.95056, "r": 511.69116, "b": 359.77099999999996, "coord_origin": "TOPLEFT"}}, {"id": 375, "text": "Railway crossing", "bbox": {"l": 516.75891, "t": 356.26297000000005, "r": 527.42938, "b": 358.0834, "coord_origin": "TOPLEFT"}}, {"id": 376, "text": "Shows distance and ", "bbox": {"l": 534.5141, "t": 352.92981, "r": 547.89862, "b": 354.75024, "coord_origin": "TOPLEFT"}}, {"id": 377, "text": "direction", "bbox": {"l": 534.5141, "t": 354.6174, "r": 540.2818, "b": 356.43784, "coord_origin": "TOPLEFT"}}, {"id": 378, "text": "\u2022", "bbox": {"l": 478.37466, "t": 270.14075, "r": 479.14251999999993, "b": 272.17877, "coord_origin": "TOPLEFT"}}, {"id": 379, "text": "Signs", "bbox": {"l": 479.91036999999994, "t": 270.14075, "r": 483.74963, "b": 272.17877, "coord_origin": "TOPLEFT"}}, {"id": 380, "text": "- regulatory signs", "bbox": {"l": 479.97293, "t": 272.84717, "r": 492.31219, "b": 274.34888, "coord_origin": "TOPLEFT"}}, {"id": 381, "text": "- school, ", "bbox": {"l": 479.97293, "t": 275.14513999999997, "r": 486.72598000000005, "b": 276.64679, "coord_origin": "TOPLEFT"}}, {"id": 382, "text": "playground and ", "bbox": {"l": 481.21602999999993, "t": 276.77972, "r": 492.93286000000006, "b": 278.81768999999997, "coord_origin": "TOPLEFT"}}, {"id": 383, "text": "crosswalk signs", "bbox": {"l": 481.21602999999993, "t": 278.82275000000004, "r": 491.82938000000007, "b": 280.86075, "coord_origin": "TOPLEFT"}}, {"id": 384, "text": "- lane use signs", "bbox": {"l": 479.97293, "t": 281.52759, "r": 491.00775000000004, "b": 283.02924, "coord_origin": "TOPLEFT"}}, {"id": 385, "text": "- turn control signs", "bbox": {"l": 479.97293, "t": 283.82556, "r": 493.32748, "b": 285.3272099999999, "coord_origin": "TOPLEFT"}}, {"id": 386, "text": "- parking signs", "bbox": {"l": 479.97293, "t": 286.1235, "r": 490.4915199999999, "b": 287.62518, "coord_origin": "TOPLEFT"}}, {"id": 387, "text": "- reserved lane ", "bbox": {"l": 479.97293, "t": 288.42148, "r": 491.17004000000003, "b": 289.92316, "coord_origin": "TOPLEFT"}}, {"id": 388, "text": "signs", "bbox": {"l": 481.21602999999993, "t": 290.05605999999995, "r": 484.77405000000005, "b": 292.09406, "coord_origin": "TOPLEFT"}}, {"id": 389, "text": "- warning signs", "bbox": {"l": 479.97293, "t": 292.76169000000004, "r": 490.83398, "b": 294.26334, "coord_origin": "TOPLEFT"}}, {"id": 390, "text": "- object markers", "bbox": {"l": 479.97293, "t": 295.05963, "r": 491.62692, "b": 296.56131, "coord_origin": "TOPLEFT"}}, {"id": 391, "text": "- construction ", "bbox": {"l": 479.97293, "t": 297.3576, "r": 490.37341, "b": 298.8592499999999, "coord_origin": "TOPLEFT"}}, {"id": 392, "text": "signs", "bbox": {"l": 481.21602999999993, "t": 298.99219, "r": 484.77405000000005, "b": 301.03015, "coord_origin": "TOPLEFT"}}, {"id": 393, "text": "- information and ", "bbox": {"l": 479.97293, "t": 301.69780999999995, "r": 492.93912, "b": 303.19946, "coord_origin": "TOPLEFT"}}, {"id": 394, "text": "destination signs", "bbox": {"l": 481.21602999999993, "t": 303.3324, "r": 493.00525, "b": 305.37036, "coord_origin": "TOPLEFT"}}, {"id": 395, "text": "- railway signs", "bbox": {"l": 479.97293, "t": 306.0379899999999, "r": 489.99047999999993, "b": 307.53967, "coord_origin": "TOPLEFT"}}, {"id": 396, "text": "\u2022", "bbox": {"l": 478.375, "t": 308.24789, "r": 479.1032400000001, "b": 310.28586, "coord_origin": "TOPLEFT"}}, {"id": 397, "text": "Signals", "bbox": {"l": 479.83151, "t": 308.24789, "r": 484.92925999999994, "b": 310.28586, "coord_origin": "TOPLEFT"}}, {"id": 398, "text": "- lane control ", "bbox": {"l": 479.97293, "t": 310.95358, "r": 490.00091999999995, "b": 312.45526, "coord_origin": "TOPLEFT"}}, {"id": 399, "text": "signals", "bbox": {"l": 481.21602999999993, "t": 312.5881999999999, "r": 485.95331, "b": 314.62616, "coord_origin": "TOPLEFT"}}, {"id": 400, "text": "- traffic lights", "bbox": {"l": 479.97293, "t": 315.29379, "r": 489.29876999999993, "b": 316.79544, "coord_origin": "TOPLEFT"}}, {"id": 401, "text": "\u2022", "bbox": {"l": 478.375, "t": 317.50366, "r": 479.18129999999996, "b": 319.5416599999999, "coord_origin": "TOPLEFT"}}, {"id": 402, "text": "Road markings", "bbox": {"l": 479.98761, "t": 317.50366, "r": 490.46960000000007, "b": 319.5416599999999, "coord_origin": "TOPLEFT"}}, {"id": 403, "text": "- yellow lines", "bbox": {"l": 479.97293, "t": 320.20938, "r": 489.26166000000006, "b": 321.71103, "coord_origin": "TOPLEFT"}}, {"id": 404, "text": "- white lines", "bbox": {"l": 479.97293, "t": 322.50732, "r": 488.59189, "b": 324.009, "coord_origin": "TOPLEFT"}}, {"id": 405, "text": "- reserved lane ", "bbox": {"l": 479.97293, "t": 324.8053, "r": 491.17004000000003, "b": 326.30698, "coord_origin": "TOPLEFT"}}, {"id": 406, "text": "markings", "bbox": {"l": 481.21602999999993, "t": 326.43988, "r": 487.58978, "b": 328.47784, "coord_origin": "TOPLEFT"}}, {"id": 407, "text": "- other markings", "bbox": {"l": 479.97293, "t": 329.14551, "r": 491.75177, "b": 330.64716, "coord_origin": "TOPLEFT"}}, {"id": 408, "text": "in this chapter", "bbox": {"l": 478.15246999999994, "t": 265.07030999999995, "r": 493.75586, "b": 268.06872999999996, "coord_origin": "TOPLEFT"}}], "children": [{"id": 32, "label": "text", "bbox": {"l": 327.86951, "t": 351.78085, "r": 330.41248, "b": 353.95465, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "13", "bbox": {"l": 327.86951, "t": 351.78085, "r": 330.41248, "b": 353.95465, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 327.83005, "t": 331.57268999999997, "r": 351.16092, "b": 333.31171, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "USING THE VERTICAL TUBE -", "bbox": {"l": 327.83005, "t": 331.57268999999997, "r": 351.16092, "b": 333.31171, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 327.83005, "t": 333.18292, "r": 348.30536, "b": 334.92194, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "MODELS AY11230/11234", "bbox": {"l": 327.83005, "t": 333.18292, "r": 348.30536, "b": 334.92194, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 327.83005, "t": 336.40439, "r": 329.05914, "b": 337.92606, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "1.", "bbox": {"l": 327.83005, "t": 336.40439, "r": 329.05914, "b": 337.92606, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 329.67368, "t": 336.40439, "r": 349.95349, "b": 337.92606, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "The vertical tube can be used for", "bbox": {"l": 329.67368, "t": 336.40439, "r": 349.95349, "b": 337.92606, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 329.11752, "t": 337.83588, "r": 353.57977, "b": 339.35751000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "instructional viewing or to photograph", "bbox": {"l": 329.11752, "t": 337.83588, "r": 353.57977, "b": 339.35751000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 327.77121, "t": 339.26736, "r": 352.4306, "b": 340.789, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": " the image with a digital camera or a", "bbox": {"l": 327.77121, "t": 339.26736, "r": 352.4306, "b": 340.789, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 328.15176, "t": 340.69882, "r": 337.91086, "b": 342.22049, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": " micro TV unit", "bbox": {"l": 328.15176, "t": 340.69882, "r": 337.91086, "b": 342.22049, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 327.8313, "t": 342.19043000000005, "r": 329.09155, "b": 343.71207, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "2.", "bbox": {"l": 327.8313, "t": 342.19043000000005, "r": 329.09155, "b": 343.71207, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 329.72168, "t": 342.19043000000005, "r": 354.9267, "b": 343.71207, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "Loosen the retention screw, then rotate ", "bbox": {"l": 329.72168, "t": 342.19043000000005, "r": 354.9267, "b": 343.71207, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 327.8313, "t": 343.62192, "r": 351.66949, "b": 345.14355, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": " the adjustment ring to change the ", "bbox": {"l": 327.8313, "t": 343.62192, "r": 351.66949, "b": 345.14355, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 328.21185, "t": 345.05338, "r": 346.33179, "b": 346.57504, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": " length of the vertical tube.", "bbox": {"l": 328.21185, "t": 345.05338, "r": 346.33179, "b": 346.57504, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 327.83005, "t": 346.84680000000003, "r": 329.12726, "b": 348.36847, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "3.", "bbox": {"l": 327.83005, "t": 346.84680000000003, "r": 329.12726, "b": 348.36847, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 329.77588, "t": 346.84680000000003, "r": 351.18005, "b": 348.36847, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "Make sure that both the images in", "bbox": {"l": 329.77588, "t": 346.84680000000003, "r": 351.18005, "b": 348.36847, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 327.25311, "t": 254.94812000000002, "r": 350.07861, "b": 258.86096, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "OPERATION ", "bbox": {"l": 327.25311, "t": 254.94812000000002, "r": 350.07861, "b": 258.86096, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 350.07861, "t": 254.76782000000003, "r": 351.82651, "b": 258.68066, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "(", "bbox": {"l": 350.07861, "t": 254.76782000000003, "r": 351.82651, "b": 258.68066, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 351.82651, "t": 254.94812000000002, "r": 360.85242, "b": 258.86096, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "cont.", "bbox": {"l": 351.82651, "t": 254.94812000000002, "r": 360.85242, "b": 258.86096, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 360.85242, "t": 254.76782000000003, "r": 362.60028, "b": 258.68066, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": ")", "bbox": {"l": 360.85242, "t": 254.76782000000003, "r": 362.60028, "b": 258.68066, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 326.88037, "t": 263.49492999999995, "r": 345.84351, "b": 265.23395000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "SELECTING OBJECTIVE ", "bbox": {"l": 326.88037, "t": 263.49492999999995, "r": 345.84351, "b": 265.23395000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 326.88037, "t": 265.10515999999996, "r": 340.54153, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "MAGNIFICATION", "bbox": {"l": 326.88037, "t": 265.10515999999996, "r": 340.54153, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 326.88037, "t": 266.71533, "r": 328.31903, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "1.", "bbox": {"l": 326.88037, "t": 266.71533, "r": 328.31903, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 329.03836, "t": 266.71533, "r": 354.21472, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "There are two objectives. The lower", "bbox": {"l": 329.03836, "t": 266.71533, "r": 354.21472, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 326.88037, "t": 268.32556, "r": 355.19193, "b": 270.06458, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": " magnification objective has a greater", "bbox": {"l": 326.88037, "t": 268.32556, "r": 355.19193, "b": 270.06458, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 326.88037, "t": 269.93579, "r": 345.80057, "b": 271.6748, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": " depth of field and view.", "bbox": {"l": 326.88037, "t": 269.93579, "r": 345.80057, "b": 271.6748, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 326.88037, "t": 271.54602, "r": 328.33862, "b": 273.28503, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "2.", "bbox": {"l": 326.88037, "t": 271.54602, "r": 328.33862, "b": 273.28503, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 329.06775, "t": 271.54602, "r": 352.39969, "b": 273.28503, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "In order to observe the specimen", "bbox": {"l": 329.06775, "t": 271.54602, "r": 352.39969, "b": 273.28503, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 326.88037, "t": 273.15619000000004, "r": 352.90042, "b": 274.89526, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": " easily use the lower magnification", "bbox": {"l": 326.88037, "t": 273.15619000000004, "r": 352.90042, "b": 274.89526, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 326.88037, "t": 274.76642000000004, "r": 354.59546, "b": 276.50543000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": " objective first. Then, by rotating the", "bbox": {"l": 326.88037, "t": 274.76642000000004, "r": 354.59546, "b": 276.50543000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 326.88037, "t": 276.37665000000004, "r": 350.81885, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": " case, the magnification can be", "bbox": {"l": 326.88037, "t": 276.37665000000004, "r": 350.81885, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 326.88037, "t": 277.98688000000004, "r": 335.46707, "b": 279.72589000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": " changed.", "bbox": {"l": 326.88037, "t": 277.98688000000004, "r": 335.46707, "b": 279.72589000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 326.88037, "t": 281.20728, "r": 354.57755, "b": 282.94632, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 107, "text": "CHANGING THE INTERPUPILLARY ", "bbox": {"l": 326.88037, "t": 281.20728, "r": 354.57755, "b": 282.94632, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 326.88037, "t": 282.81750000000005, "r": 335.1752, "b": 284.55652, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 108, "text": "DISTANCE", "bbox": {"l": 326.88037, "t": 282.81750000000005, "r": 335.1752, "b": 284.55652, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 326.88037, "t": 284.4277, "r": 328.34784, "b": 286.16675, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 109, "text": "1.", "bbox": {"l": 326.88037, "t": 284.4277, "r": 328.34784, "b": 286.16675, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 329.08157, "t": 284.4277, "r": 354.76245, "b": 286.16675, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 110, "text": "The distance between the observer's", "bbox": {"l": 329.08157, "t": 284.4277, "r": 354.76245, "b": 286.16675, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 326.88037, "t": 286.03793, "r": 354.6499, "b": 287.77695, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 111, "text": " pupils is the interpupillary distance.", "bbox": {"l": 326.88037, "t": 286.03793, "r": 354.6499, "b": 287.77695, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 326.88037, "t": 287.64813, "r": 328.25125, "b": 289.38718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 112, "text": "2.", "bbox": {"l": 326.88037, "t": 287.64813, "r": 328.25125, "b": 289.38718, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 328.93671, "t": 287.64813, "r": 354.29825, "b": 289.38718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 113, "text": "To adjust the interpupillary distance", "bbox": {"l": 328.93671, "t": 287.64813, "r": 354.29825, "b": 289.38718, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 326.88181, "t": 289.25836, "r": 355.02075, "b": 290.99738, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 114, "text": " rotate the prism caps until both eyes", "bbox": {"l": 326.88181, "t": 289.25836, "r": 355.02075, "b": 290.99738, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 326.88181, "t": 290.86855999999995, "r": 350.82028, "b": 292.6076, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 115, "text": " coincide with the image in the", "bbox": {"l": 326.88181, "t": 290.86855999999995, "r": 350.82028, "b": 292.6076, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 326.88181, "t": 292.47879, "r": 336.2067, "b": 294.2178, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 116, "text": " eyepiece. ", "bbox": {"l": 326.88181, "t": 292.47879, "r": 336.2067, "b": 294.2178, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 326.88181, "t": 295.69922, "r": 335.3941, "b": 297.43823, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 117, "text": "FOCUSING", "bbox": {"l": 326.88181, "t": 295.69922, "r": 335.3941, "b": 297.43823, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 326.88181, "t": 297.30942, "r": 328.34314, "b": 299.04846, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 118, "text": "1.", "bbox": {"l": 326.88181, "t": 297.30942, "r": 328.34314, "b": 299.04846, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 329.07379, "t": 297.30942, "r": 353.18555, "b": 299.04846, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 119, "text": "Remove the lens protective cover.", "bbox": {"l": 329.07379, "t": 297.30942, "r": 353.18555, "b": 299.04846, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 326.88324, "t": 298.91965, "r": 328.35919, "b": 300.65866, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 120, "text": "2.", "bbox": {"l": 326.88324, "t": 298.91965, "r": 328.35919, "b": 300.65866, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 329.0972, "t": 298.91965, "r": 353.45065, "b": 300.65866, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 121, "text": "Place the specimen on the working", "bbox": {"l": 329.0972, "t": 298.91965, "r": 353.45065, "b": 300.65866, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 326.88324, "t": 300.52985, "r": 333.32825, "b": 302.26889000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 122, "text": " stage.", "bbox": {"l": 326.88324, "t": 300.52985, "r": 333.32825, "b": 302.26889000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 326.88324, "t": 302.14008000000007, "r": 328.31296, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 123, "text": "3.", "bbox": {"l": 326.88324, "t": 302.14008000000007, "r": 328.31296, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 329.02783, "t": 302.14008000000007, "r": 354.76303, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 124, "text": "Focus the specimen with the left eye", "bbox": {"l": 329.02783, "t": 302.14008000000007, "r": 354.76303, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 326.88324, "t": 303.75027, "r": 355.96307, "b": 305.48932, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 125, "text": " first while turning the focus knob until", "bbox": {"l": 326.88324, "t": 303.75027, "r": 355.96307, "b": 305.48932, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 326.88324, "t": 305.3605, "r": 354.46594, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 126, "text": " the image appears clear and sharp.", "bbox": {"l": 326.88324, "t": 305.3605, "r": 354.46594, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 326.88324, "t": 306.9707, "r": 328.25488, "b": 308.70975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 127, "text": "4.", "bbox": {"l": 326.88324, "t": 306.9707, "r": 328.25488, "b": 308.70975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 328.9407, "t": 306.9707, "r": 356.37335, "b": 308.70975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 128, "text": "Rotate the right eyepiece ring until the", "bbox": {"l": 328.9407, "t": 306.9707, "r": 356.37335, "b": 308.70975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 326.88324, "t": 308.58093, "r": 355.38867, "b": 310.31995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 129, "text": " images in each eyepiece coincide and", "bbox": {"l": 326.88324, "t": 308.58093, "r": 355.38867, "b": 310.31995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 326.88324, "t": 310.19113, "r": 343.17249, "b": 311.93018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 130, "text": " are sharp and clear.", "bbox": {"l": 326.88324, "t": 310.19113, "r": 343.17249, "b": 311.93018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 326.88324, "t": 313.41156, "r": 344.13388, "b": 315.15059999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 131, "text": "CHANGING THE BULB", "bbox": {"l": 326.88324, "t": 313.41156, "r": 344.13388, "b": 315.15059999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 326.88324, "t": 315.02178999999995, "r": 328.37418, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 132, "text": "1.", "bbox": {"l": 326.88324, "t": 315.02178999999995, "r": 328.37418, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 329.11963, "t": 315.02178999999995, "r": 348.50162, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 133, "text": "Disconnect the power cord.", "bbox": {"l": 329.11963, "t": 315.02178999999995, "r": 348.50162, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 326.88324, "t": 316.63199, "r": 328.34061, "b": 318.37103, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 134, "text": "2.", "bbox": {"l": 326.88324, "t": 316.63199, "r": 328.34061, "b": 318.37103, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 329.06931, "t": 316.63199, "r": 353.11588, "b": 318.37103, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 135, "text": "When the bulb is cool, remove the", "bbox": {"l": 329.06931, "t": 316.63199, "r": 353.11588, "b": 318.37103, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 326.88464, "t": 318.2422199999999, "r": 353.79517, "b": 319.9812299999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 136, "text": " oblique illuminator cap and remove", "bbox": {"l": 326.88464, "t": 318.2422199999999, "r": 353.79517, "b": 319.9812299999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 326.88464, "t": 319.85242000000005, "r": 348.02094, "b": 321.59146, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 137, "text": " the halogen bulb with cap.", "bbox": {"l": 326.88464, "t": 319.85242000000005, "r": 348.02094, "b": 321.59146, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 326.88464, "t": 321.46265, "r": 328.37512, "b": 323.20166, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 138, "text": "3.", "bbox": {"l": 326.88464, "t": 321.46265, "r": 328.37512, "b": 323.20166, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 329.12036, "t": 321.46265, "r": 352.96808, "b": 323.20166, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 139, "text": "Replace with a new halogen bulb.", "bbox": {"l": 329.12036, "t": 321.46265, "r": 352.96808, "b": 323.20166, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 326.88608, "t": 323.07285, "r": 328.36884, "b": 324.81189, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 140, "text": "4.", "bbox": {"l": 326.88608, "t": 323.07285, "r": 328.36884, "b": 324.81189, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 329.1102, "t": 323.07285, "r": 356.5412, "b": 324.81189, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 141, "text": "Open the window in the base plate and", "bbox": {"l": 329.1102, "t": 323.07285, "r": 356.5412, "b": 324.81189, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 326.88608, "t": 324.68307000000004, "r": 350.13828, "b": 326.42209, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 142, "text": " replace the halogen lamp or ", "bbox": {"l": 326.88608, "t": 324.68307000000004, "r": 350.13828, "b": 326.42209, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 326.88608, "t": 326.29327, "r": 351.59677, "b": 328.03232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 143, "text": " fluorescent lamp of transmitted", "bbox": {"l": 326.88608, "t": 326.29327, "r": 351.59677, "b": 328.03232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 326.88608, "t": 327.9035, "r": 336.89197, "b": 329.64252, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 144, "text": " illuminator.", "bbox": {"l": 326.88608, "t": 327.9035, "r": 336.89197, "b": 329.64252, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 358.42023, "t": 263.49492999999995, "r": 366.93256, "b": 265.23395000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 145, "text": "FOCUSING", "bbox": {"l": 358.42023, "t": 263.49492999999995, "r": 366.93256, "b": 265.23395000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 358.42023, "t": 265.10515999999996, "r": 359.89841, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 146, "text": "1.", "bbox": {"l": 358.42023, "t": 265.10515999999996, "r": 359.89841, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 360.63751, "t": 265.10515999999996, "r": 387.98407, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 147, "text": "Turn the focusing knob away or toward", "bbox": {"l": 360.63751, "t": 265.10515999999996, "r": 387.98407, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 358.42023, "t": 266.71533, "r": 384.58948, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 148, "text": " you until a clear image is viewed.", "bbox": {"l": 358.42023, "t": 266.71533, "r": 384.58948, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 358.42166, "t": 268.32556, "r": 359.78549, "b": 270.06458, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 149, "text": "2.", "bbox": {"l": 358.42166, "t": 268.32556, "r": 359.78549, "b": 270.06458, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 360.46741, "t": 268.32556, "r": 384.33441, "b": 270.06458, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 150, "text": "If the image is unclear, adjust the", "bbox": {"l": 360.46741, "t": 268.32556, "r": 384.33441, "b": 270.06458, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 358.4231, "t": 269.93579, "r": 384.61502, "b": 271.6748, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 151, "text": " height of the elevator up or down,", "bbox": {"l": 358.4231, "t": 269.93579, "r": 384.61502, "b": 271.6748, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 358.4231, "t": 271.54602, "r": 385.38922, "b": 273.28503, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 152, "text": " then turn the focusing knob again.", "bbox": {"l": 358.4231, "t": 271.54602, "r": 385.38922, "b": 273.28503, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 358.4231, "t": 274.76642000000004, "r": 377.35046, "b": 276.50543000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 153, "text": "ZOOM MAGNIFICATION", "bbox": {"l": 358.4231, "t": 274.76642000000004, "r": 377.35046, "b": 276.50543000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 358.4231, "t": 276.37665000000004, "r": 359.89429, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 154, "text": "1.", "bbox": {"l": 358.4231, "t": 276.37665000000004, "r": 359.89429, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 360.62988, "t": 276.37665000000004, "r": 386.37589, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 155, "text": "Turn the zoom magnification knob to", "bbox": {"l": 360.62988, "t": 276.37665000000004, "r": 386.37589, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 358.4231, "t": 277.98688000000004, "r": 386.78732, "b": 279.72589000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 156, "text": " the desired magnification and field of", "bbox": {"l": 358.4231, "t": 277.98688000000004, "r": 386.78732, "b": 279.72589000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 358.4231, "t": 279.59704999999997, "r": 364.16855, "b": 281.33609, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 157, "text": " view.", "bbox": {"l": 358.4231, "t": 279.59704999999997, "r": 364.16855, "b": 281.33609, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 358.4231, "t": 281.20728, "r": 359.86777, "b": 282.94632, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 158, "text": "2.", "bbox": {"l": 358.4231, "t": 281.20728, "r": 359.86777, "b": 282.94632, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 114, "label": "text", "bbox": {"l": 360.59012, "t": 281.20728, "r": 387.31656, "b": 282.94632, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 159, "text": "In most situations, it is recommended", "bbox": {"l": 360.59012, "t": 281.20728, "r": 387.31656, "b": 282.94632, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 115, "label": "text", "bbox": {"l": 358.4231, "t": 282.81750000000005, "r": 381.56656, "b": 284.55652, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 160, "text": " that you focus at the lowest ", "bbox": {"l": 358.4231, "t": 282.81750000000005, "r": 381.56656, "b": 284.55652, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 116, "label": "text", "bbox": {"l": 358.4231, "t": 284.4277, "r": 386.63403, "b": 286.16675, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 161, "text": " magnification, then move to a higher", "bbox": {"l": 358.4231, "t": 284.4277, "r": 386.63403, "b": 286.16675, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 117, "label": "text", "bbox": {"l": 358.42453, "t": 286.03793, "r": 382.77115, "b": 287.77695, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 162, "text": " magnification and re-focus as ", "bbox": {"l": 358.42453, "t": 286.03793, "r": 382.77115, "b": 287.77695, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 118, "label": "text", "bbox": {"l": 358.42453, "t": 287.64813, "r": 367.98694, "b": 289.38718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 163, "text": " necessary.", "bbox": {"l": 358.42453, "t": 287.64813, "r": 367.98694, "b": 289.38718, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 119, "label": "text", "bbox": {"l": 358.42453, "t": 289.25836, "r": 359.80386, "b": 290.99738, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 164, "text": "3.", "bbox": {"l": 358.42453, "t": 289.25836, "r": 359.80386, "b": 290.99738, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 120, "label": "text", "bbox": {"l": 360.49353, "t": 289.25836, "r": 386.70093, "b": 290.99738, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 165, "text": "If the image is not clear to both eyes", "bbox": {"l": 360.49353, "t": 289.25836, "r": 386.70093, "b": 290.99738, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 121, "label": "text", "bbox": {"l": 358.42453, "t": 290.86855999999995, "r": 388.03534, "b": 292.6076, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 166, "text": " at the same time, the diopter ring may", "bbox": {"l": 358.42453, "t": 290.86855999999995, "r": 388.03534, "b": 292.6076, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 122, "label": "text", "bbox": {"l": 358.42453, "t": 292.47879, "r": 373.13724, "b": 294.2178, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 167, "text": " need adjustment.", "bbox": {"l": 358.42453, "t": 292.47879, "r": 373.13724, "b": 294.2178, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 123, "label": "text", "bbox": {"l": 358.42453, "t": 295.69922, "r": 381.74539, "b": 297.43823, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 168, "text": "DIOPTER RING ADJUSTMENT", "bbox": {"l": 358.42453, "t": 295.69922, "r": 381.74539, "b": 297.43823, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 124, "label": "text", "bbox": {"l": 358.42453, "t": 297.30942, "r": 359.83682, "b": 299.04846, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 169, "text": "1.", "bbox": {"l": 358.42453, "t": 297.30942, "r": 359.83682, "b": 299.04846, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 125, "label": "text", "bbox": {"l": 360.54297, "t": 297.30942, "r": 388.08289, "b": 299.04846, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 170, "text": "To adjust the eyepiece for viewing with", "bbox": {"l": 360.54297, "t": 297.30942, "r": 388.08289, "b": 299.04846, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 126, "label": "text", "bbox": {"l": 358.42453, "t": 298.91965, "r": 382.73251, "b": 300.65866, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 171, "text": " or without eyeglasses and for ", "bbox": {"l": 358.42453, "t": 298.91965, "r": 382.73251, "b": 300.65866, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 127, "label": "text", "bbox": {"l": 358.42453, "t": 300.52985, "r": 387.72266, "b": 302.26889000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 172, "text": " differences in acuity between the right", "bbox": {"l": 358.42453, "t": 300.52985, "r": 387.72266, "b": 302.26889000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 128, "label": "text", "bbox": {"l": 358.42453, "t": 302.14008000000007, "r": 384.1991, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 173, "text": " and left eyes, follow the following", "bbox": {"l": 358.42453, "t": 302.14008000000007, "r": 384.1991, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 129, "label": "text", "bbox": {"l": 358.42453, "t": 303.75027, "r": 364.88672, "b": 305.48932, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 174, "text": " steps:", "bbox": {"l": 358.42453, "t": 303.75027, "r": 364.88672, "b": 305.48932, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 130, "label": "text", "bbox": {"l": 358.42453, "t": 305.3605, "r": 359.95078, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 175, "text": "a.", "bbox": {"l": 358.42453, "t": 305.3605, "r": 359.95078, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 131, "label": "text", "bbox": {"l": 361.47699, "t": 305.3605, "r": 386.65988, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 176, "text": "Observe an image through the left", "bbox": {"l": 361.47699, "t": 305.3605, "r": 386.65988, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 132, "label": "text", "bbox": {"l": 358.42453, "t": 306.9707, "r": 386.7634, "b": 308.70975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 177, "text": " eyepiece and bring a specific point", "bbox": {"l": 358.42453, "t": 306.9707, "r": 386.7634, "b": 308.70975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 133, "label": "text", "bbox": {"l": 358.42453, "t": 308.58093, "r": 385.41354, "b": 310.31995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 178, "text": " into focus using the focus knob.", "bbox": {"l": 358.42453, "t": 308.58093, "r": 385.41354, "b": 310.31995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 134, "label": "text", "bbox": {"l": 358.42453, "t": 310.19113, "r": 359.93304, "b": 311.93018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 179, "text": "b.", "bbox": {"l": 358.42453, "t": 310.19113, "r": 359.93304, "b": 311.93018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 135, "label": "text", "bbox": {"l": 361.44156, "t": 310.19113, "r": 382.56085, "b": 311.93018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 180, "text": "By turning the diopter ring ", "bbox": {"l": 361.44156, "t": 310.19113, "r": 382.56085, "b": 311.93018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 136, "label": "text", "bbox": {"l": 358.42596, "t": 311.80136, "r": 385.4559, "b": 313.54037, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 181, "text": " adjustment for the left eyepiece,", "bbox": {"l": 358.42596, "t": 311.80136, "r": 385.4559, "b": 313.54037, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 137, "label": "text", "bbox": {"l": 358.42596, "t": 313.41156, "r": 384.56122, "b": 315.15059999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 182, "text": " bring the same point into sharp", "bbox": {"l": 358.42596, "t": 313.41156, "r": 384.56122, "b": 315.15059999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 138, "label": "text", "bbox": {"l": 358.42596, "t": 315.02178999999995, "r": 366.74371, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 183, "text": " focus.", "bbox": {"l": 358.42596, "t": 315.02178999999995, "r": 366.74371, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 139, "label": "text", "bbox": {"l": 358.42596, "t": 316.63199, "r": 383.93884, "b": 318.37103, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 184, "text": " c.Then bring the same point into", "bbox": {"l": 358.42596, "t": 316.63199, "r": 383.93884, "b": 318.37103, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 140, "label": "text", "bbox": {"l": 358.42596, "t": 318.2422199999999, "r": 385.69241, "b": 319.9812299999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 185, "text": " focus through the right eyepiece", "bbox": {"l": 358.42596, "t": 318.2422199999999, "r": 385.69241, "b": 319.9812299999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 141, "label": "text", "bbox": {"l": 358.42596, "t": 319.85242000000005, "r": 385.94861, "b": 321.59146, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 186, "text": " by turning the right diopter ring.", "bbox": {"l": 358.42596, "t": 319.85242000000005, "r": 385.94861, "b": 321.59146, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 142, "label": "text", "bbox": {"l": 358.42596, "t": 321.46265, "r": 385.54236, "b": 323.20166, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 187, "text": " d.With more than one viewer, each", "bbox": {"l": 358.42596, "t": 321.46265, "r": 385.54236, "b": 323.20166, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 143, "label": "text", "bbox": {"l": 358.42596, "t": 323.07285, "r": 382.98718, "b": 324.81189, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 188, "text": " viewer should note their own", "bbox": {"l": 358.42596, "t": 323.07285, "r": 382.98718, "b": 324.81189, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 144, "label": "text", "bbox": {"l": 358.42596, "t": 324.68307000000004, "r": 385.06448, "b": 326.42209, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 189, "text": " diopter ring position for the left", "bbox": {"l": 358.42596, "t": 324.68307000000004, "r": 385.06448, "b": 326.42209, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 145, "label": "text", "bbox": {"l": 358.42596, "t": 326.29327, "r": 385.20682, "b": 328.03232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 190, "text": " and right eyepieces, then before", "bbox": {"l": 358.42596, "t": 326.29327, "r": 385.20682, "b": 328.03232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 146, "label": "text", "bbox": {"l": 358.42596, "t": 327.9035, "r": 382.21964, "b": 329.64252, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 191, "text": " viewing set the diopter ring", "bbox": {"l": 358.42596, "t": 327.9035, "r": 382.21964, "b": 329.64252, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 147, "label": "text", "bbox": {"l": 358.42596, "t": 329.5137, "r": 382.63382, "b": 331.25275, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 192, "text": " adjustments to that setting.", "bbox": {"l": 358.42596, "t": 329.5137, "r": 382.63382, "b": 331.25275, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 148, "label": "text", "bbox": {"l": 358.42596, "t": 332.73412999999994, "r": 375.67661, "b": 334.47317999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 193, "text": "CHANGING THE BULB", "bbox": {"l": 358.42596, "t": 332.73412999999994, "r": 375.67661, "b": 334.47317999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 149, "label": "text", "bbox": {"l": 358.42596, "t": 334.34436, "r": 359.90311, "b": 336.08337, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 194, "text": "1.", "bbox": {"l": 358.42596, "t": 334.34436, "r": 359.90311, "b": 336.08337, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 150, "label": "text", "bbox": {"l": 360.64169, "t": 334.34436, "r": 385.75333, "b": 336.08337, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 195, "text": "Disconnect the power cord from the", "bbox": {"l": 360.64169, "t": 334.34436, "r": 385.75333, "b": 336.08337, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 151, "label": "text", "bbox": {"l": 358.42596, "t": 335.95456, "r": 372.01416, "b": 337.6936, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 196, "text": " electrical outlet.", "bbox": {"l": 358.42596, "t": 335.95456, "r": 372.01416, "b": 337.6936, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 152, "label": "text", "bbox": {"l": 358.42596, "t": 337.56479, "r": 359.88327, "b": 339.3038, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 197, "text": "2.", "bbox": {"l": 358.42596, "t": 337.56479, "r": 359.88327, "b": 339.3038, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 153, "label": "text", "bbox": {"l": 360.61191, "t": 337.56479, "r": 384.65726, "b": 339.3038, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 198, "text": "When the bulb is cool, remove the", "bbox": {"l": 360.61191, "t": 337.56479, "r": 384.65726, "b": 339.3038, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 154, "label": "text", "bbox": {"l": 358.42596, "t": 339.17499, "r": 385.33649, "b": 340.9140300000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 199, "text": " oblique illuminator cap and remove", "bbox": {"l": 358.42596, "t": 339.17499, "r": 385.33649, "b": 340.9140300000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 155, "label": "text", "bbox": {"l": 358.42596, "t": 340.78522, "r": 379.57224, "b": 342.52423, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 200, "text": " the halogen bulb with cap.", "bbox": {"l": 358.42596, "t": 340.78522, "r": 379.57224, "b": 342.52423, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 156, "label": "text", "bbox": {"l": 358.4274, "t": 342.39542, "r": 359.91788, "b": 344.13446000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 201, "text": "3.", "bbox": {"l": 358.4274, "t": 342.39542, "r": 359.91788, "b": 344.13446000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 157, "label": "text", "bbox": {"l": 360.66312, "t": 342.39542, "r": 384.5108, "b": 344.13446000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 202, "text": "Replace with a new halogen bulb.", "bbox": {"l": 360.66312, "t": 342.39542, "r": 384.5108, "b": 344.13446000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 158, "label": "text", "bbox": {"l": 358.42883, "t": 344.00565000000006, "r": 359.92792, "b": 345.74466, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 203, "text": "4.", "bbox": {"l": 358.42883, "t": 344.00565000000006, "r": 359.92792, "b": 345.74466, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 159, "label": "text", "bbox": {"l": 360.67746, "t": 344.00565000000006, "r": 385.41235, "b": 345.74466, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 204, "text": "Open the window in the base plate", "bbox": {"l": 360.67746, "t": 344.00565000000006, "r": 385.41235, "b": 345.74466, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 160, "label": "text", "bbox": {"l": 358.42883, "t": 345.61584, "r": 383.2782, "b": 347.35489, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 205, "text": " and replace the halogen lamp or", "bbox": {"l": 358.42883, "t": 345.61584, "r": 383.2782, "b": 347.35489, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 161, "label": "text", "bbox": {"l": 358.42883, "t": 347.22607, "r": 383.13953, "b": 348.96509, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 206, "text": " fluorescent lamp of transmitted", "bbox": {"l": 358.42883, "t": 347.22607, "r": 383.13953, "b": 348.96509, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 162, "label": "text", "bbox": {"l": 358.42883, "t": 348.83627, "r": 368.43472, "b": 350.57532, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 207, "text": " illuminator.", "bbox": {"l": 358.42883, "t": 348.83627, "r": 368.43472, "b": 350.57532, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 163, "label": "text", "bbox": {"l": 326.59567, "t": 261.14185, "r": 339.11377, "b": 262.88091999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 208, "text": "Model AY11230", "bbox": {"l": 326.59567, "t": 261.14185, "r": 339.11377, "b": 262.88091999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 164, "label": "text", "bbox": {"l": 358.48605, "t": 261.14185, "r": 371.00415, "b": 262.88091999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 209, "text": "Model AY11234", "bbox": {"l": 358.48605, "t": 261.14185, "r": 371.00415, "b": 262.88091999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 165, "label": "text", "bbox": {"l": 455.43533, "t": 351.77038999999996, "r": 457.97827000000007, "b": 353.94415, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 210, "text": "14", "bbox": {"l": 455.43533, "t": 351.77038999999996, "r": 457.97827000000007, "b": 353.94415, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 166, "label": "text", "bbox": {"l": 408.24518, "t": 275.52673000000004, "r": 414.4234, "b": 276.96020999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 211, "text": "Objectives", "bbox": {"l": 408.24518, "t": 275.52673000000004, "r": 414.4234, "b": 276.96020999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 167, "label": "text", "bbox": {"l": 409.39554, "t": 268.98235999999997, "r": 419.06677, "b": 270.41583, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 212, "text": "Revolving Turret", "bbox": {"l": 409.39554, "t": 268.98235999999997, "r": 419.06677, "b": 270.41583, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 168, "label": "text", "bbox": {"l": 441.3895, "t": 279.12627999999995, "r": 445.87192, "b": 280.55975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 213, "text": "Coarse ", "bbox": {"l": 441.3895, "t": 279.12627999999995, "r": 445.87192, "b": 280.55975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 169, "label": "text", "bbox": {"l": 441.3895, "t": 280.30609, "r": 448.22338999999994, "b": 281.7395900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 214, "text": "Adjustment", "bbox": {"l": 441.3895, "t": 280.30609, "r": 448.22338999999994, "b": 281.7395900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 170, "label": "text", "bbox": {"l": 441.3895, "t": 281.48593, "r": 444.40371999999996, "b": 282.91939999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 215, "text": "Knob", "bbox": {"l": 441.3895, "t": 281.48593, "r": 444.40371999999996, "b": 282.91939999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 171, "label": "text", "bbox": {"l": 398.79288, "t": 254.94646999999998, "r": 428.91568, "b": 258.85931000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 216, "text": "MODEL AY11236", "bbox": {"l": 398.79288, "t": 254.94646999999998, "r": 428.91568, "b": 258.85931000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 172, "label": "text", "bbox": {"l": 398.32535, "t": 305.04291, "r": 435.93542, "b": 308.95572000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 217, "text": "MICROSCOPE USAGE", "bbox": {"l": 398.32535, "t": 305.04291, "r": 435.93542, "b": 308.95572000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 173, "label": "text", "bbox": {"l": 398.08594, "t": 310.35892, "r": 453.72171, "b": 312.53271, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 218, "text": "BARSKA Model AY11236 is a powerful fixed power compound ", "bbox": {"l": 398.08594, "t": 310.35892, "r": 453.72171, "b": 312.53271, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 174, "label": "text", "bbox": {"l": 398.08594, "t": 312.50586, "r": 453.09939999999995, "b": 314.67966, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 219, "text": "microscope designed for biological studies such as specimen ", "bbox": {"l": 398.08594, "t": 312.50586, "r": 453.09939999999995, "b": 314.67966, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 175, "label": "text", "bbox": {"l": 398.08594, "t": 314.6528, "r": 456.65246999999994, "b": 316.8266, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 220, "text": "examination. It can also be used for examining bacteria and", "bbox": {"l": 398.08594, "t": 314.6528, "r": 456.65246999999994, "b": 316.8266, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 176, "label": "text", "bbox": {"l": 398.08594, "t": 316.79977, "r": 456.73859000000004, "b": 318.97354, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 221, "text": "for general clinical and medical studies and other scientific uses. ", "bbox": {"l": 398.08594, "t": 316.79977, "r": 456.73859000000004, "b": 318.97354, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 177, "label": "text", "bbox": {"l": 398.62399, "t": 320.42941, "r": 427.77472, "b": 324.34222000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 222, "text": "CONSTRUCTION", "bbox": {"l": 398.62399, "t": 320.42941, "r": 427.77472, "b": 324.34222000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 178, "label": "text", "bbox": {"l": 398.08594, "t": 326.46069000000006, "r": 456.02639999999997, "b": 328.63449, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 223, "text": "BARSKA Model AY11236 is a fixed power compound microscope.", "bbox": {"l": 398.08594, "t": 326.46069000000006, "r": 456.02639999999997, "b": 328.63449, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 179, "label": "text", "bbox": {"l": 398.08414, "t": 328.6076699999999, "r": 455.42238999999995, "b": 330.7814599999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 224, "text": "It is constructed with two optical paths at the same angle. It is ", "bbox": {"l": 398.08414, "t": 328.6076699999999, "r": 455.42238999999995, "b": 330.7814599999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 180, "label": "text", "bbox": {"l": 398.08414, "t": 330.75461, "r": 457.39844, "b": 332.92841, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 225, "text": "equipped with transmitted illumination. By using this instrument, ", "bbox": {"l": 398.08414, "t": 330.75461, "r": 457.39844, "b": 332.92841, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 181, "label": "text", "bbox": {"l": 398.08414, "t": 332.90155, "r": 453.97745, "b": 335.07535000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 226, "text": "the user can observe specimens at magnification from 40x to ", "bbox": {"l": 398.08414, "t": 332.90155, "r": 453.97745, "b": 335.07535000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 182, "label": "text", "bbox": {"l": 398.08414, "t": 335.04852, "r": 454.70708999999994, "b": 337.22232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 227, "text": "1000x by selecting the desired objective lens. Coarse and fine ", "bbox": {"l": 398.08414, "t": 335.04852, "r": 454.70708999999994, "b": 337.22232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 183, "label": "text", "bbox": {"l": 398.08414, "t": 337.19547, "r": 458.90240000000006, "b": 339.36926, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 228, "text": "focus adjustments provide accuracy and image detail. The rotating ", "bbox": {"l": 398.08414, "t": 337.19547, "r": 458.90240000000006, "b": 339.36926, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 184, "label": "text", "bbox": {"l": 398.08594, "t": 339.34241, "r": 453.0672, "b": 341.5162, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 229, "text": "head allows the user to position the eyepieces for maximum ", "bbox": {"l": 398.08594, "t": 339.34241, "r": 453.0672, "b": 341.5162, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 185, "label": "text", "bbox": {"l": 398.08594, "t": 341.48938, "r": 449.63113, "b": 343.66318, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 230, "text": "viewing comfort and easy access to all adjustment knobs.", "bbox": {"l": 398.08594, "t": 341.48938, "r": 449.63113, "b": 343.66318, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 186, "label": "text", "bbox": {"l": 422.10626, "t": 301.24191, "r": 434.62433000000004, "b": 302.98096, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 231, "text": "Model AY11236", "bbox": {"l": 422.10626, "t": 301.24191, "r": 434.62433000000004, "b": 302.98096, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 187, "label": "text", "bbox": {"l": 442.01610999999997, "t": 283.08649, "r": 444.8817399999999, "b": 284.51996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 232, "text": "Fine ", "bbox": {"l": 442.01610999999997, "t": 283.08649, "r": 444.8817399999999, "b": 284.51996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 188, "label": "text", "bbox": {"l": 442.01610999999997, "t": 284.2663, "r": 448.85001, "b": 285.69980000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 233, "text": "Adjustment", "bbox": {"l": 442.01610999999997, "t": 284.2663, "r": 448.85001, "b": 285.69980000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 189, "label": "text", "bbox": {"l": 442.01610999999997, "t": 285.44611, "r": 445.03033000000005, "b": 286.87961, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 234, "text": "Knob", "bbox": {"l": 442.01610999999997, "t": 285.44611, "r": 445.03033000000005, "b": 286.87961, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 190, "label": "text", "bbox": {"l": 408.00577, "t": 279.12579000000005, "r": 411.42212, "b": 280.5593, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 235, "text": "Stage", "bbox": {"l": 408.00577, "t": 279.12579000000005, "r": 411.42212, "b": 280.5593, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 191, "label": "text", "bbox": {"l": 404.07172, "t": 280.9144299999999, "r": 410.77707, "b": 282.3479, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 236, "text": "Condenser ", "bbox": {"l": 404.07172, "t": 280.9144299999999, "r": 410.77707, "b": 282.3479, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 192, "label": "text", "bbox": {"l": 404.07172, "t": 282.09424, "r": 409.2157, "b": 283.52774, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 237, "text": "Focusing", "bbox": {"l": 404.07172, "t": 282.09424, "r": 409.2157, "b": 283.52774, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 193, "label": "text", "bbox": {"l": 404.07172, "t": 283.27408, "r": 407.08594, "b": 284.7075500000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 238, "text": "Knob", "bbox": {"l": 404.07172, "t": 283.27408, "r": 407.08594, "b": 284.7075500000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 194, "label": "text", "bbox": {"l": 441.81281, "t": 262.32178, "r": 447.03702, "b": 263.75525000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 239, "text": "Eyepiece", "bbox": {"l": 441.81281, "t": 262.32178, "r": 447.03702, "b": 263.75525000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 195, "label": "text", "bbox": {"l": 437.34607, "t": 271.13025000000005, "r": 440.80496, "b": 272.56281, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 240, "text": "Stand", "bbox": {"l": 437.34607, "t": 271.13025000000005, "r": 440.80496, "b": 272.56281, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 196, "label": "text", "bbox": {"l": 409.7164, "t": 284.40027, "r": 413.3768, "b": 285.83282, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 241, "text": "Lamp ", "bbox": {"l": 409.7164, "t": 284.40027, "r": 413.3768, "b": 285.83282, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 197, "label": "text", "bbox": {"l": 409.7164, "t": 285.83163, "r": 413.68201, "b": 287.26416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 242, "text": "On/Off", "bbox": {"l": 409.7164, "t": 285.83163, "r": 413.68201, "b": 287.26416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 198, "label": "text", "bbox": {"l": 409.7164, "t": 287.263, "r": 413.6337, "b": 288.69553, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 243, "text": "Switch", "bbox": {"l": 409.7164, "t": 287.263, "r": 413.6337, "b": 288.69553, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 199, "label": "text", "bbox": {"l": 434.8712499999999, "t": 296.7153, "r": 438.53164999999996, "b": 298.14783, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 244, "text": "Lamp ", "bbox": {"l": 434.8712499999999, "t": 296.7153, "r": 438.53164999999996, "b": 298.14783, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 200, "label": "text", "bbox": {"l": 439.52039, "t": 292.18307000000004, "r": 443.08768, "b": 293.61560000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 245, "text": "Power", "bbox": {"l": 439.52039, "t": 292.18307000000004, "r": 443.08768, "b": 293.61560000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 201, "label": "text", "bbox": {"l": 439.52039, "t": 293.61444, "r": 442.29575, "b": 295.04697, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 246, "text": "Cord", "bbox": {"l": 439.52039, "t": 293.61444, "r": 442.29575, "b": 295.04697, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 202, "label": "text", "bbox": {"l": 413.55829, "t": 264.66089, "r": 421.94913, "b": 266.09344, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 247, "text": "Rotating Head", "bbox": {"l": 413.55829, "t": 264.66089, "r": 421.94913, "b": 266.09344, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 203, "label": "text", "bbox": {"l": 441.84316999999993, "t": 286.90573, "r": 447.87585000000007, "b": 288.33826, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 248, "text": "Stage Clip", "bbox": {"l": 441.84316999999993, "t": 286.90573, "r": 447.87585000000007, "b": 288.33826, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 204, "label": "text", "bbox": {"l": 441.84316999999993, "t": 288.3371, "r": 448.67252, "b": 289.76962000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 249, "text": "Adjustment", "bbox": {"l": 441.84316999999993, "t": 288.3371, "r": 448.67252, "b": 289.76962000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 205, "label": "text", "bbox": {"l": 407.2403, "t": 259.86645999999996, "r": 425.79089, "b": 261.29895, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 250, "text": "Interpupillary Slide Adjustment", "bbox": {"l": 407.2403, "t": 259.86645999999996, "r": 425.79089, "b": 261.29895, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 206, "label": "text", "bbox": {"l": 449.10074000000003, "t": 378.66302, "r": 466.08835000000005, "b": 380.78412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 251, "text": "Circling Minimums", "bbox": {"l": 449.10074000000003, "t": 378.66302, "r": 466.08835000000005, "b": 380.78412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 207, "label": "text", "bbox": {"l": 449.10074000000003, "t": 383.2203999999999, "r": 449.64444, "b": 385.34148999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 252, "text": "7", "bbox": {"l": 449.10074000000003, "t": 383.2203999999999, "r": 449.64444, "b": 385.34148999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 208, "label": "text", "bbox": {"l": 450.18811, "t": 383.2203999999999, "r": 550.77124, "b": 385.34148999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 253, "text": "K H U H Z D V D F K D Q J H W R W K H 7 ( 5 3 6 F U L W H U L D L Q W K D W D \u1087H F W V F L U F O L Q J D U H D G L P H Q V L R Q E \\ H [ S D Q G L Q J W K H D U H D V W R S U R Y L G H ", "bbox": {"l": 450.18811, "t": 383.2203999999999, "r": 550.77124, "b": 385.34148999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 209, "label": "text", "bbox": {"l": 449.10074000000003, "t": 385.75732, "r": 536.14716, "b": 387.87842, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 254, "text": "improved obstacle protection. To indicate that the new criteria had been applied to a given procedure, a ", "bbox": {"l": 449.10074000000003, "t": 385.75732, "r": 536.14716, "b": 387.87842, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 210, "label": "text", "bbox": {"l": 538.31085, "t": 385.75732, "r": 549.49921, "b": 387.87842, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 255, "text": " is placed on ", "bbox": {"l": 538.31085, "t": 385.75732, "r": 549.49921, "b": 387.87842, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 211, "label": "text", "bbox": {"l": 449.10074000000003, "t": 388.03601, "r": 547.58185, "b": 390.1571, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 256, "text": "the circling line of minimums. The new circling tables and explanatory information is located in the Legend of the TPP.", "bbox": {"l": 449.10074000000003, "t": 388.03601, "r": 547.58185, "b": 390.1571, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 212, "label": "text", "bbox": {"l": 449.10074000000003, "t": 393.2128000000001, "r": 449.6163, "b": 395.33386, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 257, "text": "7", "bbox": {"l": 449.10074000000003, "t": 393.2128000000001, "r": 449.6163, "b": 395.33386, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 213, "label": "text", "bbox": {"l": 450.1319, "t": 393.2128000000001, "r": 529.53082, "b": 395.33386, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 258, "text": "K H D S S U R D F K H V X V L Q J V W D Q G D U G F L U F O L Q J D S S U R D F K D U H D V F D Q E H L G H Q W L \u00bf H G E \\ W K H D E V H Q F H R I W K H ", "bbox": {"l": 450.1319, "t": 393.2128000000001, "r": 529.53082, "b": 395.33386, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 214, "label": "text", "bbox": {"l": 532.05829, "t": 393.2128000000001, "r": 550.42261, "b": 395.33386, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 259, "text": " on the circling line of ", "bbox": {"l": 532.05829, "t": 393.2128000000001, "r": 550.42261, "b": 395.33386, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 215, "label": "text", "bbox": {"l": 449.10074000000003, "t": 395.49149, "r": 455.74692, "b": 397.61255, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 260, "text": "minima.", "bbox": {"l": 449.10074000000003, "t": 395.49149, "r": 455.74692, "b": 397.61255, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 216, "label": "text", "bbox": {"l": 449.95525999999995, "t": 415.59549, "r": 496.2829, "b": 417.50446, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 261, "text": "$ S S O \\ 6 W D Q G D U G & L U F O L Q J $ S S U R D F K 0 D Q H X Y H U L Q J 5 D G L X V 7 D E O H ", "bbox": {"l": 449.95525999999995, "t": 415.59549, "r": 496.2829, "b": 417.50446, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 217, "label": "text", "bbox": {"l": 501.13077, "t": 409.25543, "r": 551.16101, "b": 411.1644, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 262, "text": "$ S S O \\ ( [ S D Q G H G & L U F O L Q J $ S S U R D F K 0 D Q H X Y H U L Q J $ L U V S D F H 5 D G L X V ", "bbox": {"l": 501.13077, "t": 409.25543, "r": 551.16101, "b": 411.1644, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 218, "label": "text", "bbox": {"l": 501.13077, "t": 411.30624, "r": 505.2477999999999, "b": 413.21521, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 263, "text": "Table", "bbox": {"l": 501.13077, "t": 411.30624, "r": 505.2477999999999, "b": 413.21521, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 219, "label": "text", "bbox": {"l": 449.10074000000003, "t": 420.18802, "r": 469.35599, "b": 422.73331, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 264, "text": "AIRPORT SKETCH", "bbox": {"l": 449.10074000000003, "t": 420.18802, "r": 469.35599, "b": 422.73331, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 220, "label": "text", "bbox": {"l": 449.10074000000003, "t": 425.08908, "r": 525.93616, "b": 427.21017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 265, "text": "The airport sketch is a depiction of the airport with emphasis on runway pattern and related ", "bbox": {"l": 449.10074000000003, "t": 425.08908, "r": 525.93616, "b": 427.21017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 221, "label": "text", "bbox": {"l": 449.10074000000003, "t": 427.3678, "r": 522.0343, "b": 429.48886, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 266, "text": "information, positioned in either the lower left or lower right corner of the chart to aid pi-", "bbox": {"l": 449.10074000000003, "t": 427.3678, "r": 522.0343, "b": 429.48886, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 222, "label": "text", "bbox": {"l": 449.10074000000003, "t": 429.64648, "r": 524.67151, "b": 431.76755, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 267, "text": "lot recognition of the airport from the air and to provide some information to aid on ground ", "bbox": {"l": 449.10074000000003, "t": 429.64648, "r": 524.67151, "b": 431.76755, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 223, "label": "text", "bbox": {"l": 449.10074000000003, "t": 431.92514000000006, "r": 527.172, "b": 434.04623, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 268, "text": "navigation of the airport. The runways are drawn to scale and oriented to true north. Runway ", "bbox": {"l": 449.10074000000003, "t": 431.92514000000006, "r": 527.172, "b": 434.04623, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 224, "label": "text", "bbox": {"l": 449.10074000000003, "t": 434.20383, "r": 502.39545, "b": 436.32492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 269, "text": "dimensions (length and width) are shown for all active runways.", "bbox": {"l": 449.10074000000003, "t": 434.20383, "r": 502.39545, "b": 436.32492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 225, "label": "text", "bbox": {"l": 449.10074000000003, "t": 438.7611999999999, "r": 512.92676, "b": 440.88228999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 270, "text": "Runway(s) are depicted based on what type and construction of the runway.", "bbox": {"l": 449.10074000000003, "t": 438.7611999999999, "r": 512.92676, "b": 440.88228999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 226, "label": "text", "bbox": {"l": 449.95525999999995, "t": 444.07001, "r": 460.02307, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 271, "text": "Hard Surface", "bbox": {"l": 449.95525999999995, "t": 444.07001, "r": 460.02307, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 227, "label": "text", "bbox": {"l": 464.89963, "t": 444.07001, "r": 473.98819, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 272, "text": "Other Than ", "bbox": {"l": 464.89963, "t": 444.07001, "r": 473.98819, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 228, "label": "text", "bbox": {"l": 464.89963, "t": 446.12085, "r": 474.96744, "b": 448.02979, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 273, "text": "Hard Surface", "bbox": {"l": 464.89963, "t": 446.12085, "r": 474.96744, "b": 448.02979, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 229, "label": "text", "bbox": {"l": 478.91357, "t": 444.07001, "r": 489.45648, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 274, "text": "Metal Surface", "bbox": {"l": 478.91357, "t": 444.07001, "r": 489.45648, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 230, "label": "text", "bbox": {"l": 493.06420999999995, "t": 444.07001, "r": 505.03076, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 275, "text": "Closed Runway", "bbox": {"l": 493.06420999999995, "t": 444.07001, "r": 505.03076, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 231, "label": "text", "bbox": {"l": 509.5809, "t": 444.07001, "r": 524.30237, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 276, "text": "Under Construction", "bbox": {"l": 509.5809, "t": 444.07001, "r": 524.30237, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 232, "label": "text", "bbox": {"l": 449.95525999999995, "t": 454.81207, "r": 458.31406, "b": 456.72104, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 277, "text": "Stopways, ", "bbox": {"l": 449.95525999999995, "t": 454.81207, "r": 458.31406, "b": 456.72104, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 233, "label": "text", "bbox": {"l": 449.95525999999995, "t": 456.86288, "r": 461.92083999999994, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 278, "text": "Taxiways, Park-", "bbox": {"l": 449.95525999999995, "t": 456.86288, "r": 461.92083999999994, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 234, "label": "text", "bbox": {"l": 449.95525999999995, "t": 458.91373, "r": 457.08014, "b": 460.82268999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 279, "text": "ing Areas", "bbox": {"l": 449.95525999999995, "t": 458.91373, "r": 457.08014, "b": 460.82268999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 235, "label": "text", "bbox": {"l": 464.89963, "t": 454.81207, "r": 472.87732, "b": 456.72104, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 280, "text": "Displaced ", "bbox": {"l": 464.89963, "t": 454.81207, "r": 472.87732, "b": 456.72104, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 236, "label": "text", "bbox": {"l": 464.89963, "t": 456.86288, "r": 472.49792, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 281, "text": "Threshold", "bbox": {"l": 464.89963, "t": 456.86288, "r": 472.49792, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 237, "label": "text", "bbox": {"l": 478.91357, "t": 454.81207, "r": 483.61584, "b": 456.72104, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 282, "text": "Closed", "bbox": {"l": 478.91357, "t": 454.81207, "r": 483.61584, "b": 456.72104, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 238, "label": "text", "bbox": {"l": 478.91357, "t": 456.86288, "r": 486.60754000000003, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 283, "text": "Pavement", "bbox": {"l": 478.91357, "t": 456.86288, "r": 486.60754000000003, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 239, "label": "text", "bbox": {"l": 493.06420999999995, "t": 454.81207, "r": 504.20648, "b": 456.72104, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 284, "text": "Water Runway", "bbox": {"l": 493.06420999999995, "t": 454.81207, "r": 504.20648, "b": 456.72104, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 240, "label": "text", "bbox": {"l": 449.10074000000003, "t": 469.32974, "r": 548.59674, "b": 471.45081, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 285, "text": "Taxiways and aprons are shaded grey. Other runway features that may be shown are runway numbers, runway dimen-", "bbox": {"l": 449.10074000000003, "t": 469.32974, "r": 548.59674, "b": 471.45081, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 241, "label": "text", "bbox": {"l": 449.10074000000003, "t": 471.60843, "r": 500.08181999999994, "b": 473.72949, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 286, "text": "sions, runway slope, arresting gear, and displaced threshold.", "bbox": {"l": 449.10074000000003, "t": 471.60843, "r": 500.08181999999994, "b": 473.72949, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 242, "label": "text", "bbox": {"l": 449.10074000000003, "t": 476.16577, "r": 449.59933000000007, "b": 478.28687, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 287, "text": "2", "bbox": {"l": 449.10074000000003, "t": 476.16577, "r": 449.59933000000007, "b": 478.28687, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 243, "label": "text", "bbox": {"l": 450.09796, "t": 476.16577, "r": 547.82562, "b": 478.28687, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 288, "text": "W K H U L Q I R U P D W L R Q F R Q F H U Q L Q J O L J K W L Q J \u00bf Q D O D S S U R D F K E H D U L Q J V D L U S R U W E H D F R Q R E V W D F O H V F R Q W U R O W R Z H U 1 $ 9 $ , ' V K H O L ", "bbox": {"l": 450.09796, "t": 476.16577, "r": 547.82562, "b": 478.28687, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 244, "label": "text", "bbox": {"l": 547.82623, "t": 476.16577, "r": 548.45862, "b": 478.28687, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 289, "text": "-", "bbox": {"l": 547.82623, "t": 476.16577, "r": 548.45862, "b": 478.28687, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 245, "label": "text", "bbox": {"l": 449.10074000000003, "t": 478.44446, "r": 470.52609000000007, "b": 480.56555, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 290, "text": "pads may also be shown.", "bbox": {"l": 449.10074000000003, "t": 478.44446, "r": 470.52609000000007, "b": 480.56555, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 246, "label": "text", "bbox": {"l": 449.10074000000003, "t": 483.00183, "r": 493.37906000000004, "b": 485.12292, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 291, "text": "$ L U S R U W ( O H Y D W L R Q D Q G 7 R X F K G R Z Q = R Q H ( O H Y D W L R Q ", "bbox": {"l": 449.10074000000003, "t": 483.00183, "r": 493.37906000000004, "b": 485.12292, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 449.10074000000003, "t": 487.5592, "r": 551.80023, "b": 496.51636, "coord_origin": "TOPLEFT"}, "confidence": 0.5027860403060913, "cells": [{"id": 292, "text": "The airport elevation is shown enclosed within a box in the upper left corner of the sketch box and the touchdown zone ", "bbox": {"l": 449.10074000000003, "t": 487.5592, "r": 549.16168, "b": 489.6803, "coord_origin": "TOPLEFT"}}, {"id": 293, "text": "elevation (TDZE) is shown in the upper right corner of the sketch box. The airport elevation is the highest point of an ", "bbox": {"l": 449.10074000000003, "t": 489.83789, "r": 546.90881, "b": 491.95898, "coord_origin": "TOPLEFT"}}, {"id": 294, "text": "D L U S R U W \u00b6 V X V D E O H U X Q Z D \\ V P H D V X U H G L Q I H H W I U R P P H D Q V H D O H Y H O 7 K H 7 ' = ( L V W K H K L J K H V W H O H Y D W L R Q L Q W K H \u00bf U V W I H H W R I ", "bbox": {"l": 449.10074000000003, "t": 492.11658, "r": 551.80023, "b": 494.23767, "coord_origin": "TOPLEFT"}}, {"id": 295, "text": "the landing surface. Circling only approaches will not show a TDZE.", "bbox": {"l": 449.10074000000003, "t": 494.39526, "r": 505.85068000000007, "b": 496.51636, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 247, "label": "text", "bbox": {"l": 498.80661000000003, "t": 515.9437, "r": 502.08792, "b": 519.01764, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 296, "text": "114", "bbox": {"l": 498.80661000000003, "t": 515.9437, "r": 502.08792, "b": 519.01764, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 248, "label": "text", "bbox": {"l": 444.56319999999994, "t": 422.84869, "r": 446.25998, "b": 471.87128, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 297, "text": "FAA Chart Users\u2019 Guide - Terminal Procedures Publication (TPP) - Terms", "bbox": {"l": 444.56319999999994, "t": 422.84869, "r": 446.25998, "b": 471.87128, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 249, "label": "text", "bbox": {"l": 329.40536, "t": 379.37537, "r": 355.13138, "b": 382.13336, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 298, "text": "AGL 2013 Financial Calendar", "bbox": {"l": 329.40536, "t": 379.37537, "r": 355.13138, "b": 382.13336, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 250, "label": "text", "bbox": {"l": 329.40536, "t": 382.30273, "r": 330.96848, "b": 384.55927, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 299, "text": "22", "bbox": {"l": 329.40536, "t": 382.30273, "r": 330.96848, "b": 384.55927, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 251, "label": "text", "bbox": {"l": 331.75003, "t": 382.30273, "r": 341.12875, "b": 384.55927, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 300, "text": "August 2012 ", "bbox": {"l": 331.75003, "t": 382.30273, "r": 341.12875, "b": 384.55927, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 252, "label": "text", "bbox": {"l": 350.4722, "t": 382.30273, "r": 384.81079, "b": 384.55927, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 301, "text": "2012 full year result and fi nal dividend announced", "bbox": {"l": 350.4722, "t": 382.30273, "r": 384.81079, "b": 384.55927, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 253, "label": "text", "bbox": {"l": 329.40536, "t": 384.84552, "r": 330.97336, "b": 387.10205, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 302, "text": "30", "bbox": {"l": 329.40536, "t": 384.84552, "r": 330.97336, "b": 387.10205, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 254, "label": "text", "bbox": {"l": 331.75735, "t": 384.84552, "r": 341.16534, "b": 387.10205, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 303, "text": "August 2012 ", "bbox": {"l": 331.75735, "t": 384.84552, "r": 341.16534, "b": 387.10205, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 255, "label": "text", "bbox": {"l": 350.4722, "t": 384.84552, "r": 372.90613, "b": 387.10205, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 304, "text": "Ex-dividend trading commences", "bbox": {"l": 350.4722, "t": 384.84552, "r": 372.90613, "b": 387.10205, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 256, "label": "text", "bbox": {"l": 329.40536, "t": 387.38828, "r": 330.20337, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 305, "text": "5", "bbox": {"l": 329.40536, "t": 387.38828, "r": 330.20337, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 257, "label": "text", "bbox": {"l": 331.00137, "t": 387.38828, "r": 342.9715, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 306, "text": "September 2012 ", "bbox": {"l": 331.00137, "t": 387.38828, "r": 342.9715, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 258, "label": "text", "bbox": {"l": 350.4722, "t": 387.38828, "r": 374.88693, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 307, "text": "Record date for 2012 fi nal dividend", "bbox": {"l": 350.4722, "t": 387.38828, "r": 374.88693, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 259, "label": "text", "bbox": {"l": 329.40536, "t": 389.93103, "r": 331.0173, "b": 392.18762, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 308, "text": "27", "bbox": {"l": 329.40536, "t": 389.93103, "r": 331.0173, "b": 392.18762, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 260, "label": "text", "bbox": {"l": 331.82327, "t": 389.93103, "r": 343.91284, "b": 392.18762, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 309, "text": "September 2012 ", "bbox": {"l": 331.82327, "t": 389.93103, "r": 343.91284, "b": 392.18762, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 261, "label": "text", "bbox": {"l": 350.4722, "t": 389.93103, "r": 365.65988, "b": 392.18762, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 310, "text": "Final dividend payable", "bbox": {"l": 350.4722, "t": 389.93103, "r": 365.65988, "b": 392.18762, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 262, "label": "text", "bbox": {"l": 329.40536, "t": 392.47382, "r": 330.98804, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 311, "text": "23", "bbox": {"l": 329.40536, "t": 392.47382, "r": 330.98804, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 263, "label": "text", "bbox": {"l": 331.77936, "t": 392.47382, "r": 342.06674, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 312, "text": "October 2012 ", "bbox": {"l": 331.77936, "t": 392.47382, "r": 342.06674, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 264, "label": "text", "bbox": {"l": 350.4722, "t": 392.47382, "r": 367.22156, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 313, "text": "Annual General Meeting", "bbox": {"l": 350.4722, "t": 392.47382, "r": 367.22156, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 265, "label": "text", "bbox": {"l": 329.40536, "t": 395.0166, "r": 330.99741, "b": 397.27313, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 314, "text": "27", "bbox": {"l": 329.40536, "t": 395.0166, "r": 330.99741, "b": 397.27313, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 266, "label": "text", "bbox": {"l": 331.7934, "t": 395.0166, "r": 342.1416, "b": 397.27313, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 315, "text": "February 2013", "bbox": {"l": 331.7934, "t": 395.0166, "r": 342.1416, "b": 397.27313, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 267, "label": "text", "bbox": {"l": 342.64841, "t": 395.18298, "r": 342.65811, "b": 396.49857000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 316, "text": " 1", "bbox": {"l": 342.64841, "t": 395.18298, "r": 342.65811, "b": 396.49857000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 268, "label": "text", "bbox": {"l": 350.47177, "t": 395.01474, "r": 386.25897, "b": 397.2713, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 317, "text": "2013 interim result and interim dividend announced", "bbox": {"l": 350.47177, "t": 395.01474, "r": 386.25897, "b": 397.2713, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 269, "label": "text", "bbox": {"l": 329.40491, "t": 397.55749999999995, "r": 331.02695, "b": 399.81406, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 318, "text": "28", "bbox": {"l": 329.40491, "t": 397.55749999999995, "r": 331.02695, "b": 399.81406, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 270, "label": "text", "bbox": {"l": 331.83795, "t": 397.55749999999995, "r": 340.75909, "b": 399.81406, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 319, "text": "August 2013", "bbox": {"l": 331.83795, "t": 397.55749999999995, "r": 340.75909, "b": 399.81406, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 271, "label": "text", "bbox": {"l": 341.26437, "t": 397.7254, "r": 341.27408, "b": 399.04095, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 320, "text": " 1", "bbox": {"l": 341.26437, "t": 397.7254, "r": 341.27408, "b": 399.04095, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 272, "label": "text", "bbox": {"l": 350.47144, "t": 397.55713, "r": 385.93265, "b": 399.81369, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 321, "text": "2013 full year results and fi nal dividend announced ", "bbox": {"l": 350.47144, "t": 397.55713, "r": 385.93265, "b": 399.81369, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 273, "label": "text", "bbox": {"l": 329.40536, "t": 400.46155, "r": 329.87708, "b": 401.96588, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 322, "text": "1", "bbox": {"l": 329.40536, "t": 400.46155, "r": 329.87708, "b": 401.96588, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 274, "label": "text", "bbox": {"l": 330.34882, "t": 400.46155, "r": 358.65204, "b": 401.96588, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 323, "text": "Indicative dates only, subject to change/Board confi rmation", "bbox": {"l": 330.34882, "t": 400.46155, "r": 358.65204, "b": 401.96588, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 275, "label": "text", "bbox": {"l": 329.40536, "t": 404.34503, "r": 391.771, "b": 406.60156, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 324, "text": "AGL\u2019s Annual General Meeting will be held at the City Recital Hall, Angel Place, Sydney ", "bbox": {"l": 329.40536, "t": 404.34503, "r": 391.771, "b": 406.60156, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 276, "label": "text", "bbox": {"l": 329.40536, "t": 406.37857, "r": 369.65308, "b": 408.63513000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 325, "text": "commencing at 10.30am on Tuesday 23 October 2012.", "bbox": {"l": 329.40536, "t": 406.37857, "r": 369.65308, "b": 408.63513000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 277, "label": "text", "bbox": {"l": 363.54486, "t": 460.53054999999995, "r": 379.25955, "b": 465.54507, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 326, "text": "Ye s te rd ay", "bbox": {"l": 363.54486, "t": 460.53054999999995, "r": 379.25955, "b": 465.54507, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 278, "label": "text", "bbox": {"l": 363.54486, "t": 466.7157, "r": 391.38229, "b": 468.97223, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 327, "text": "Established in Sydney in 1837, and then ", "bbox": {"l": 363.54486, "t": 466.7157, "r": 391.38229, "b": 468.97223, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 279, "label": "text", "bbox": {"l": 363.54486, "t": 468.74924, "r": 395.01788, "b": 471.00577, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 328, "text": "known as The Australian Gas Light Company, ", "bbox": {"l": 363.54486, "t": 468.74924, "r": 395.01788, "b": 471.00577, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 280, "label": "text", "bbox": {"l": 363.54486, "t": 470.78281, "r": 394.08322, "b": 473.03934, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 329, "text": "the AGL business has an established history ", "bbox": {"l": 363.54486, "t": 470.78281, "r": 394.08322, "b": 473.03934, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 281, "label": "text", "bbox": {"l": 363.54486, "t": 472.81635, "r": 390.60727, "b": 475.07288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 330, "text": "and reputation for serving the gas and ", "bbox": {"l": 363.54486, "t": 472.81635, "r": 390.60727, "b": 475.07288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 282, "label": "text", "bbox": {"l": 363.54486, "t": 474.84988, "r": 393.49612, "b": 477.10645, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 331, "text": "electricity needs of Australian households. ", "bbox": {"l": 363.54486, "t": 474.84988, "r": 393.49612, "b": 477.10645, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 283, "label": "text", "bbox": {"l": 363.54486, "t": 476.88345, "r": 394.11481, "b": 479.13998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 332, "text": "In 1841, when AGL supplied the gas to light ", "bbox": {"l": 363.54486, "t": 476.88345, "r": 394.11481, "b": 479.13998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 284, "label": "text", "bbox": {"l": 363.54486, "t": 478.91699, "r": 393.75891, "b": 481.17352, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 333, "text": "the fi rst public street lamp, it was reported ", "bbox": {"l": 363.54486, "t": 478.91699, "r": 393.75891, "b": 481.17352, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 285, "label": "text", "bbox": {"l": 363.54486, "t": 480.95053, "r": 390.4975, "b": 483.20709, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 334, "text": "in the Sydney Gazette as a \u201cwonderful ", "bbox": {"l": 363.54486, "t": 480.95053, "r": 390.4975, "b": 483.20709, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 286, "label": "text", "bbox": {"l": 363.54486, "t": 482.9841, "r": 395.70975, "b": 485.24063, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 335, "text": "achievement of scientifi c knowledge, assisted ", "bbox": {"l": 363.54486, "t": 482.9841, "r": 395.70975, "b": 485.24063, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 287, "label": "text", "bbox": {"l": 363.54486, "t": 485.01764, "r": 394.27283, "b": 487.2742, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 336, "text": "by mechanical ingenuity.\u201d Within two years, ", "bbox": {"l": 363.54486, "t": 485.01764, "r": 394.27283, "b": 487.2742, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 288, "label": "text", "bbox": {"l": 363.54486, "t": 487.05121, "r": 396.65939, "b": 489.30774, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 337, "text": "165 gas lamps were lighting the City of Sydney.", "bbox": {"l": 363.54486, "t": 487.05121, "r": 396.65939, "b": 489.30774, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 289, "label": "text", "bbox": {"l": 329.4054, "t": 419.93124, "r": 384.19696, "b": 431.09412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 338, "text": "Looking back on ", "bbox": {"l": 329.4054, "t": 419.93124, "r": 384.19696, "b": 431.09412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 290, "label": "text", "bbox": {"l": 329.4054, "t": 430.10379, "r": 372.16626, "b": 441.26669, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 339, "text": "175 years of ", "bbox": {"l": 329.4054, "t": 430.10379, "r": 372.16626, "b": 441.26669, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 291, "label": "text", "bbox": {"l": 329.4054, "t": 440.27636999999993, "r": 385.3981, "b": 451.43924, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 340, "text": "looking forward.", "bbox": {"l": 329.4054, "t": 440.27636999999993, "r": 385.3981, "b": 451.43924, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 292, "label": "text", "bbox": {"l": 329.40536, "t": 372.16159, "r": 353.36179, "b": 373.91669, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 341, "text": "AGL Energy Limited ABN 74 115 061 375", "bbox": {"l": 329.40536, "t": 372.16159, "r": 353.36179, "b": 373.91669, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 293, "label": "text", "bbox": {"l": 546.20587, "t": 360.90448, "r": 548.23407, "b": 362.82242, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 342, "text": "29", "bbox": {"l": 546.20587, "t": 360.90448, "r": 548.23407, "b": 362.82242, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 294, "label": "text", "bbox": {"l": 497.77728, "t": 251.43384000000003, "r": 542.8255, "b": 254.94385, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 343, "text": "signs, signals and road markings", "bbox": {"l": 497.77728, "t": 251.43384000000003, "r": 542.8255, "b": 254.94385, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 295, "label": "text", "bbox": {"l": 490.30679, "t": 251.47478999999998, "r": 492.09982, "b": 254.98479999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 344, "text": "3", "bbox": {"l": 490.30679, "t": 251.47478999999998, "r": 492.09982, "b": 254.98479999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 296, "label": "text", "bbox": {"l": 498.15335, "t": 263.88922, "r": 500.05637, "b": 265.92719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 345, "text": "In ", "bbox": {"l": 498.15335, "t": 263.88922, "r": 500.05637, "b": 265.92719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 297, "label": "text", "bbox": {"l": 500.05637, "t": 263.85717999999997, "r": 524.37036, "b": 265.86310000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 346, "text": "chapter 2, you and your vehicle", "bbox": {"l": 500.05637, "t": 263.85717999999997, "r": 524.37036, "b": 265.86310000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 298, "label": "text", "bbox": {"l": 524.37036, "t": 263.88922, "r": 539.89124, "b": 265.92719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 347, "text": ", you learned about ", "bbox": {"l": 524.37036, "t": 263.88922, "r": 539.89124, "b": 265.92719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 299, "label": "text", "bbox": {"l": 498.15335, "t": 265.93224999999995, "r": 544.50403, "b": 267.97020999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 348, "text": "some of the controls in your vehicle. This chapter is a handy ", "bbox": {"l": 498.15335, "t": 265.93224999999995, "r": 544.50403, "b": 267.97020999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 300, "label": "text", "bbox": {"l": 498.15335, "t": 267.97533999999996, "r": 544.01343, "b": 270.01331000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 349, "text": "reference section that gives examples of the most common ", "bbox": {"l": 498.15335, "t": 267.97533999999996, "r": 544.01343, "b": 270.01331000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 301, "label": "text", "bbox": {"l": 498.15335, "t": 270.01831000000004, "r": 544.11987, "b": 272.05634, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 350, "text": "signs, signals and road markings that keep traffi c organized ", "bbox": {"l": 498.15335, "t": 270.01831000000004, "r": 544.11987, "b": 272.05634, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 302, "label": "text", "bbox": {"l": 498.15335, "t": 272.06140000000005, "r": 515.41071, "b": 274.09937, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 351, "text": "and flowing smoothly. ", "bbox": {"l": 498.15335, "t": 272.06140000000005, "r": 515.41071, "b": 274.09937, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 303, "label": "text", "bbox": {"l": 498.15335, "t": 277.34619, "r": 505.64642000000003, "b": 280.9357, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 352, "text": "Signs", "bbox": {"l": 498.15335, "t": 277.34619, "r": 505.64642000000003, "b": 280.9357, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 304, "label": "text", "bbox": {"l": 498.15335, "t": 281.82187, "r": 543.92957, "b": 283.85983, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 353, "text": "There are three ways to read signs: by their shape, colour and ", "bbox": {"l": 498.15335, "t": 281.82187, "r": 543.92957, "b": 283.85983, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 305, "label": "text", "bbox": {"l": 498.15335, "t": 283.8649, "r": 545.67834, "b": 285.90289, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 354, "text": "the messages printed on them. Understanding these three ways ", "bbox": {"l": 498.15335, "t": 283.8649, "r": 545.67834, "b": 285.90289, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 306, "label": "text", "bbox": {"l": 498.15335, "t": 285.90796, "r": 545.26471, "b": 287.94592, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 355, "text": "of classifying signs will help you figure out the meaning of signs ", "bbox": {"l": 498.15335, "t": 285.90796, "r": 545.26471, "b": 287.94592, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 307, "label": "text", "bbox": {"l": 498.15335, "t": 287.95099, "r": 513.31335, "b": 289.98895, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 356, "text": "that are new to you. ", "bbox": {"l": 498.15335, "t": 287.95099, "r": 513.31335, "b": 289.98895, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 308, "label": "text", "bbox": {"l": 505.43439, "t": 303.07596, "r": 508.53033000000005, "b": 304.89639, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 357, "text": "Stop", "bbox": {"l": 505.43439, "t": 303.07596, "r": 508.53033000000005, "b": 304.89639, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 309, "label": "text", "bbox": {"l": 527.45502, "t": 303.25354, "r": 541.44678, "b": 305.07397, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 358, "text": "Yield the right-of-way", "bbox": {"l": 527.45502, "t": 303.25354, "r": 541.44678, "b": 305.07397, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 310, "label": "text", "bbox": {"l": 501.79385, "t": 321.18973, "r": 510.41632, "b": 323.01016, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 359, "text": "Shows driving", "bbox": {"l": 501.79385, "t": 321.18973, "r": 510.41632, "b": 323.01016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 311, "label": "text", "bbox": {"l": 501.79385, "t": 322.87731999999994, "r": 509.04268999999994, "b": 324.69775000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 360, "text": "regulations", "bbox": {"l": 501.79385, "t": 322.87731999999994, "r": 509.04268999999994, "b": 324.69775000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 312, "label": "text", "bbox": {"l": 518.66455, "t": 319.59146, "r": 529.80902, "b": 321.41190000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 361, "text": "Explains lane use", "bbox": {"l": 518.66455, "t": 319.59146, "r": 529.80902, "b": 321.41190000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 313, "label": "text", "bbox": {"l": 534.87561, "t": 318.37616, "r": 546.95142, "b": 320.19659, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 362, "text": "School zone signs ", "bbox": {"l": 534.87561, "t": 318.37616, "r": 546.95142, "b": 320.19659, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 314, "label": "text", "bbox": {"l": 534.87561, "t": 320.0637500000001, "r": 545.05762, "b": 321.88419, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 363, "text": "are fl uorescent ", "bbox": {"l": 534.87561, "t": 320.0637500000001, "r": 545.05762, "b": 321.88419, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 315, "label": "text", "bbox": {"l": 534.87561, "t": 321.75134, "r": 543.32263, "b": 323.57178, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 364, "text": "yellow-green", "bbox": {"l": 534.87561, "t": 321.75134, "r": 543.32263, "b": 323.57178, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 316, "label": "text", "bbox": {"l": 499.21862999999996, "t": 338.12772, "r": 512.62451, "b": 339.94815, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 365, "text": "Tells about motorist ", "bbox": {"l": 499.21862999999996, "t": 338.12772, "r": 512.62451, "b": 339.94815, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 317, "label": "text", "bbox": {"l": 499.21862999999996, "t": 339.81531000000007, "r": 504.39917, "b": 341.63574, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 366, "text": "services", "bbox": {"l": 499.21862999999996, "t": 339.81531000000007, "r": 504.39917, "b": 341.63574, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 318, "label": "text", "bbox": {"l": 516.97748, "t": 338.06039, "r": 529.77484, "b": 339.88082999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 367, "text": "Shows a permitted ", "bbox": {"l": 516.97748, "t": 338.06039, "r": 529.77484, "b": 339.88082999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 319, "label": "text", "bbox": {"l": 516.97748, "t": 339.74799, "r": 520.96399, "b": 341.56842, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 368, "text": "action", "bbox": {"l": 516.97748, "t": 339.74799, "r": 520.96399, "b": 341.56842, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 320, "label": "text", "bbox": {"l": 534.55847, "t": 337.88281, "r": 548.58453, "b": 339.7032500000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 369, "text": "Shows an action that ", "bbox": {"l": 534.55847, "t": 337.88281, "r": 548.58453, "b": 339.7032500000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 321, "label": "text", "bbox": {"l": 534.55847, "t": 339.57040000000006, "r": 545.08862, "b": 341.39084, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 370, "text": "is not permitted", "bbox": {"l": 534.55847, "t": 339.57040000000006, "r": 545.08862, "b": 341.39084, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 322, "label": "text", "bbox": {"l": 483.05853, "t": 356.17416, "r": 494.72577, "b": 357.9946, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 371, "text": "Warns of hazards ", "bbox": {"l": 483.05853, "t": 356.17416, "r": 494.72577, "b": 357.9946, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 323, "label": "text", "bbox": {"l": 483.05853, "t": 357.86179, "r": 487.07525999999996, "b": 359.68222, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 372, "text": "ahead", "bbox": {"l": 483.05853, "t": 357.86179, "r": 487.07525999999996, "b": 359.68222, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 324, "label": "text", "bbox": {"l": 499.39645, "t": 356.26297000000005, "r": 504.69171, "b": 358.0834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 373, "text": "Warns of", "bbox": {"l": 499.39645, "t": 356.26297000000005, "r": 504.69171, "b": 358.0834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 325, "label": "text", "bbox": {"l": 499.39645, "t": 357.95056, "r": 511.69116, "b": 359.77099999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 374, "text": "construction zones", "bbox": {"l": 499.39645, "t": 357.95056, "r": 511.69116, "b": 359.77099999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 326, "label": "text", "bbox": {"l": 516.75891, "t": 356.26297000000005, "r": 527.42938, "b": 358.0834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 375, "text": "Railway crossing", "bbox": {"l": 516.75891, "t": 356.26297000000005, "r": 527.42938, "b": 358.0834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 327, "label": "text", "bbox": {"l": 534.5141, "t": 352.92981, "r": 547.89862, "b": 354.75024, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 376, "text": "Shows distance and ", "bbox": {"l": 534.5141, "t": 352.92981, "r": 547.89862, "b": 354.75024, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 328, "label": "text", "bbox": {"l": 534.5141, "t": 354.6174, "r": 540.2818, "b": 356.43784, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 377, "text": "direction", "bbox": {"l": 534.5141, "t": 354.6174, "r": 540.2818, "b": 356.43784, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 329, "label": "text", "bbox": {"l": 478.37466, "t": 270.14075, "r": 479.14251999999993, "b": 272.17877, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 378, "text": "\u2022", "bbox": {"l": 478.37466, "t": 270.14075, "r": 479.14251999999993, "b": 272.17877, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 330, "label": "text", "bbox": {"l": 479.91036999999994, "t": 270.14075, "r": 483.74963, "b": 272.17877, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 379, "text": "Signs", "bbox": {"l": 479.91036999999994, "t": 270.14075, "r": 483.74963, "b": 272.17877, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 331, "label": "text", "bbox": {"l": 479.97293, "t": 272.84717, "r": 492.31219, "b": 274.34888, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 380, "text": "- regulatory signs", "bbox": {"l": 479.97293, "t": 272.84717, "r": 492.31219, "b": 274.34888, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 332, "label": "text", "bbox": {"l": 479.97293, "t": 275.14513999999997, "r": 486.72598000000005, "b": 276.64679, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 381, "text": "- school, ", "bbox": {"l": 479.97293, "t": 275.14513999999997, "r": 486.72598000000005, "b": 276.64679, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 333, "label": "text", "bbox": {"l": 481.21602999999993, "t": 276.77972, "r": 492.93286000000006, "b": 278.81768999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 382, "text": "playground and ", "bbox": {"l": 481.21602999999993, "t": 276.77972, "r": 492.93286000000006, "b": 278.81768999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 334, "label": "text", "bbox": {"l": 481.21602999999993, "t": 278.82275000000004, "r": 491.82938000000007, "b": 280.86075, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 383, "text": "crosswalk signs", "bbox": {"l": 481.21602999999993, "t": 278.82275000000004, "r": 491.82938000000007, "b": 280.86075, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 335, "label": "text", "bbox": {"l": 479.97293, "t": 281.52759, "r": 491.00775000000004, "b": 283.02924, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 384, "text": "- lane use signs", "bbox": {"l": 479.97293, "t": 281.52759, "r": 491.00775000000004, "b": 283.02924, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 336, "label": "text", "bbox": {"l": 479.97293, "t": 283.82556, "r": 493.32748, "b": 285.3272099999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 385, "text": "- turn control signs", "bbox": {"l": 479.97293, "t": 283.82556, "r": 493.32748, "b": 285.3272099999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 337, "label": "text", "bbox": {"l": 479.97293, "t": 286.1235, "r": 490.4915199999999, "b": 287.62518, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 386, "text": "- parking signs", "bbox": {"l": 479.97293, "t": 286.1235, "r": 490.4915199999999, "b": 287.62518, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 338, "label": "text", "bbox": {"l": 479.97293, "t": 288.42148, "r": 491.17004000000003, "b": 289.92316, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 387, "text": "- reserved lane ", "bbox": {"l": 479.97293, "t": 288.42148, "r": 491.17004000000003, "b": 289.92316, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 339, "label": "text", "bbox": {"l": 481.21602999999993, "t": 290.05605999999995, "r": 484.77405000000005, "b": 292.09406, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 388, "text": "signs", "bbox": {"l": 481.21602999999993, "t": 290.05605999999995, "r": 484.77405000000005, "b": 292.09406, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 340, "label": "text", "bbox": {"l": 479.97293, "t": 292.76169000000004, "r": 490.83398, "b": 294.26334, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 389, "text": "- warning signs", "bbox": {"l": 479.97293, "t": 292.76169000000004, "r": 490.83398, "b": 294.26334, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 341, "label": "text", "bbox": {"l": 479.97293, "t": 295.05963, "r": 491.62692, "b": 296.56131, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 390, "text": "- object markers", "bbox": {"l": 479.97293, "t": 295.05963, "r": 491.62692, "b": 296.56131, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 342, "label": "text", "bbox": {"l": 479.97293, "t": 297.3576, "r": 490.37341, "b": 298.8592499999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 391, "text": "- construction ", "bbox": {"l": 479.97293, "t": 297.3576, "r": 490.37341, "b": 298.8592499999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 343, "label": "text", "bbox": {"l": 481.21602999999993, "t": 298.99219, "r": 484.77405000000005, "b": 301.03015, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 392, "text": "signs", "bbox": {"l": 481.21602999999993, "t": 298.99219, "r": 484.77405000000005, "b": 301.03015, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 344, "label": "text", "bbox": {"l": 479.97293, "t": 301.69780999999995, "r": 492.93912, "b": 303.19946, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 393, "text": "- information and ", "bbox": {"l": 479.97293, "t": 301.69780999999995, "r": 492.93912, "b": 303.19946, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 345, "label": "text", "bbox": {"l": 481.21602999999993, "t": 303.3324, "r": 493.00525, "b": 305.37036, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 394, "text": "destination signs", "bbox": {"l": 481.21602999999993, "t": 303.3324, "r": 493.00525, "b": 305.37036, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 346, "label": "text", "bbox": {"l": 479.97293, "t": 306.0379899999999, "r": 489.99047999999993, "b": 307.53967, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 395, "text": "- railway signs", "bbox": {"l": 479.97293, "t": 306.0379899999999, "r": 489.99047999999993, "b": 307.53967, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 347, "label": "text", "bbox": {"l": 478.375, "t": 308.24789, "r": 479.1032400000001, "b": 310.28586, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 396, "text": "\u2022", "bbox": {"l": 478.375, "t": 308.24789, "r": 479.1032400000001, "b": 310.28586, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 348, "label": "text", "bbox": {"l": 479.83151, "t": 308.24789, "r": 484.92925999999994, "b": 310.28586, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 397, "text": "Signals", "bbox": {"l": 479.83151, "t": 308.24789, "r": 484.92925999999994, "b": 310.28586, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 349, "label": "text", "bbox": {"l": 479.97293, "t": 310.95358, "r": 490.00091999999995, "b": 312.45526, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 398, "text": "- lane control ", "bbox": {"l": 479.97293, "t": 310.95358, "r": 490.00091999999995, "b": 312.45526, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 350, "label": "text", "bbox": {"l": 481.21602999999993, "t": 312.5881999999999, "r": 485.95331, "b": 314.62616, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 399, "text": "signals", "bbox": {"l": 481.21602999999993, "t": 312.5881999999999, "r": 485.95331, "b": 314.62616, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 351, "label": "text", "bbox": {"l": 479.97293, "t": 315.29379, "r": 489.29876999999993, "b": 316.79544, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 400, "text": "- traffic lights", "bbox": {"l": 479.97293, "t": 315.29379, "r": 489.29876999999993, "b": 316.79544, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 352, "label": "text", "bbox": {"l": 478.375, "t": 317.50366, "r": 479.18129999999996, "b": 319.5416599999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 401, "text": "\u2022", "bbox": {"l": 478.375, "t": 317.50366, "r": 479.18129999999996, "b": 319.5416599999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 353, "label": "text", "bbox": {"l": 479.98761, "t": 317.50366, "r": 490.46960000000007, "b": 319.5416599999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 402, "text": "Road markings", "bbox": {"l": 479.98761, "t": 317.50366, "r": 490.46960000000007, "b": 319.5416599999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 354, "label": "text", "bbox": {"l": 479.97293, "t": 320.20938, "r": 489.26166000000006, "b": 321.71103, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 403, "text": "- yellow lines", "bbox": {"l": 479.97293, "t": 320.20938, "r": 489.26166000000006, "b": 321.71103, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 355, "label": "text", "bbox": {"l": 479.97293, "t": 322.50732, "r": 488.59189, "b": 324.009, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 404, "text": "- white lines", "bbox": {"l": 479.97293, "t": 322.50732, "r": 488.59189, "b": 324.009, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 356, "label": "text", "bbox": {"l": 479.97293, "t": 324.8053, "r": 491.17004000000003, "b": 326.30698, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 405, "text": "- reserved lane ", "bbox": {"l": 479.97293, "t": 324.8053, "r": 491.17004000000003, "b": 326.30698, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 357, "label": "text", "bbox": {"l": 481.21602999999993, "t": 326.43988, "r": 487.58978, "b": 328.47784, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 406, "text": "markings", "bbox": {"l": 481.21602999999993, "t": 326.43988, "r": 487.58978, "b": 328.47784, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 358, "label": "text", "bbox": {"l": 479.97293, "t": 329.14551, "r": 491.75177, "b": 330.64716, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 407, "text": "- other markings", "bbox": {"l": 479.97293, "t": 329.14551, "r": 491.75177, "b": 330.64716, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 359, "label": "text", "bbox": {"l": 478.15246999999994, "t": 265.07030999999995, "r": 493.75586, "b": 268.06872999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 408, "text": "in this chapter", "bbox": {"l": 478.15246999999994, "t": 265.07030999999995, "r": 493.75586, "b": 268.06872999999996, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "caption", "id": 16, "page_no": 0, "cluster": {"id": 16, "label": "caption", "bbox": {"l": 317.95499, "t": 540.08299, "r": 559.80579, "b": 559.51524, "coord_origin": "TOPLEFT"}, "confidence": 0.7793365120887756, "cells": [{"id": 409, "text": "Figure 1: Four examples of complex page layouts across dif-", "bbox": {"l": 317.95499, "t": 540.08299, "r": 559.80579, "b": 548.55624, "coord_origin": "TOPLEFT"}}, {"id": 410, "text": "ferent document categories", "bbox": {"l": 317.95499, "t": 551.0419899999999, "r": 428.69907, "b": 559.51524, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 1: Four examples of complex page layouts across different document categories"}, {"label": "section_header", "id": 3, "page_no": 0, "cluster": {"id": 3, "label": "section_header", "bbox": {"l": 317.95499, "t": 592.46591, "r": 379.8205, "b": 602.7750100000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9208476543426514, "cells": [{"id": 411, "text": "KEYWORDS", "bbox": {"l": 317.95499, "t": 592.46591, "r": 379.8205, "b": 602.7750100000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "KEYWORDS"}, {"label": "text", "id": 1, "page_no": 0, "cluster": {"id": 1, "label": "text", "bbox": {"l": 317.95499, "t": 607.66756, "r": 559.18597, "b": 627.00117, "coord_origin": "TOPLEFT"}, "confidence": 0.9509093761444092, "cells": [{"id": 412, "text": "PDF document conversion, layout segmentation, object-detection,", "bbox": {"l": 317.95499, "t": 607.66756, "r": 559.18597, "b": 616.04218, "coord_origin": "TOPLEFT"}}, {"id": 413, "text": "data set, Machine Learning", "bbox": {"l": 317.95499, "t": 618.62656, "r": 416.94403, "b": 627.00117, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "PDF document conversion, layout segmentation, object-detection, data set, Machine Learning"}, {"label": "section_header", "id": 7, "page_no": 0, "cluster": {"id": 7, "label": "section_header", "bbox": {"l": 317.65997, "t": 640.05434, "r": 404.65366, "b": 647.58609, "coord_origin": "TOPLEFT"}, "confidence": 0.8721988797187805, "cells": [{"id": 414, "text": "ACM Reference Format:", "bbox": {"l": 317.65997, "t": 640.05434, "r": 404.65366, "b": 647.58609, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "ACM Reference Format:"}, {"label": "text", "id": 2, "page_no": 0, "cluster": {"id": 2, "label": "text", "bbox": {"l": 317.95499, "t": 650.11996, "r": 559.5495, "b": 707.377029, "coord_origin": "TOPLEFT"}, "confidence": 0.9455165863037109, "cells": [{"id": 415, "text": "Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter", "bbox": {"l": 317.95499, "t": 650.11996, "r": 558.35266, "b": 657.56404, "coord_origin": "TOPLEFT"}}, {"id": 416, "text": "Staar. 2022. DocLayNet: A Large Human-Annotated Dataset for Document-", "bbox": {"l": 317.95499, "t": 660.08296, "r": 559.5495, "b": 667.52703, "coord_origin": "TOPLEFT"}}, {"id": 417, "text": "Layout Analysis. In", "bbox": {"l": 317.95499, "t": 670.04497, "r": 383.30807, "b": 677.48904, "coord_origin": "TOPLEFT"}}, {"id": 418, "text": "Proceedings of the 28th ACM SIGKDD Conference on", "bbox": {"l": 385.798, "t": 670.08482, "r": 558.20032, "b": 677.49701, "coord_origin": "TOPLEFT"}}, {"id": 419, "text": "Knowledge Discovery and Data Mining (KDD \u201922), August 14-18, 2022, Wash-", "bbox": {"l": 317.95499, "t": 680.04781, "r": 559.00092, "b": 687.46001, "coord_origin": "TOPLEFT"}}, {"id": 420, "text": "ington, DC, USA.", "bbox": {"l": 317.95499, "t": 690.01081, "r": 370.11481, "b": 697.423004, "coord_origin": "TOPLEFT"}}, {"id": 421, "text": "ACM, New York, NY, USA, 9 pages. https://doi.org/10.1145/", "bbox": {"l": 371.82999, "t": 689.97096, "r": 558.71655, "b": 697.415031, "coord_origin": "TOPLEFT"}}, {"id": 422, "text": "3534678.3539043", "bbox": {"l": 317.95499, "t": 699.932953, "r": 371.59375, "b": 707.377029, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar. 2022. DocLayNet: A Large Human-Annotated Dataset for DocumentLayout Analysis. In Proceedings of the 28th ACM SIGKDD Conference on Knowledge Discovery and Data Mining (KDD \u201922), August 14-18, 2022, Washington, DC, USA. ACM, New York, NY, USA, 9 pages. https://doi.org/10.1145/ 3534678.3539043"}], "headers": [{"label": "page_header", "id": 10, "page_no": 0, "cluster": {"id": 10, "label": "page_header", "bbox": {"l": 18.34021, "t": 218.35999000000004, "r": 36.339794, "b": 555.00003, "coord_origin": "TOPLEFT"}, "confidence": 0.8537883758544922, "cells": [{"id": 423, "text": "arXiv:2206.01062v1 [cs.CV] 2 Jun 2022", "bbox": {"l": 18.34021, "t": 218.35999000000004, "r": 36.339794, "b": 555.00003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "arXiv:2206.01062v1 [cs.CV] 2 Jun 2022"}]}}, {"page_no": 1, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 246.24382, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar", "bbox": {"l": 253.13897999999998, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "1", "bbox": {"l": 53.79800000000001, "t": 85.85986000000003, "r": 59.427395, "b": 96.16900999999996, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "INTRODUCTION", "bbox": {"l": 70.379532, "t": 85.85986000000003, "r": 156.52899, "b": 96.16900999999996, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Despite the substantial improvements achieved with machine-learning", "bbox": {"l": 53.79800000000001, "t": 110.98352, "r": 303.01697, "b": 119.35815000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "(ML) approaches and deep neural networks in recent years, docu-", "bbox": {"l": 53.528999, "t": 121.94256999999993, "r": 295.55695, "b": 130.31719999999996, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "ment conversion remains a challenging problem, as demonstrated", "bbox": {"l": 53.79800000000001, "t": 132.90155000000004, "r": 294.04642, "b": 141.27617999999995, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "by the numerous public competitions held on this topic [1-4]. The", "bbox": {"l": 53.79800000000001, "t": 143.85956, "r": 294.04733, "b": 152.23419, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "challenge originates from the huge variability in PDF documents", "bbox": {"l": 53.79800000000001, "t": 154.81853999999998, "r": 294.04349, "b": 163.19317999999998, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "regarding layout, language and formats (scanned, programmatic", "bbox": {"l": 53.79800000000001, "t": 165.77752999999996, "r": 294.04718, "b": 174.15215999999998, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "or a combination of both). Engineering a single ML model that can", "bbox": {"l": 53.79800000000001, "t": 176.73650999999995, "r": 294.04919, "b": 185.11114999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "be applied on all types of documents and provides high-quality", "bbox": {"l": 53.79800000000001, "t": 187.69556, "r": 294.27573, "b": 196.07019000000003, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "layout segmentation remains to this day extremely challenging [5].", "bbox": {"l": 53.79800000000001, "t": 198.65454, "r": 295.42569, "b": 207.02917000000002, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "To highlight the variability in document layouts, we show a few", "bbox": {"l": 53.528999, "t": 209.61352999999997, "r": 294.37256, "b": 217.98816, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "example documents from the DocLayNet dataset in Figure 1.", "bbox": {"l": 53.79800000000001, "t": 220.57250999999997, "r": 275.48334, "b": 228.94714, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "A key problem in the process of document conversion is to under-", "bbox": {"l": 63.76100199999999, "t": 231.53156, "r": 295.564, "b": 239.90619000000004, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "stand the structure of a single document page, i.e. which segments", "bbox": {"l": 53.79800000000001, "t": 242.49054, "r": 294.04868, "b": 250.86517000000003, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "of text should be grouped together in a unit. To train models for this", "bbox": {"l": 53.79800000000001, "t": 253.44854999999995, "r": 294.04532, "b": 261.82318, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "task, there are currently two large datasets available to the com-", "bbox": {"l": 53.79800000000001, "t": 264.40752999999995, "r": 295.55618, "b": 272.78216999999995, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "munity, PubLayNet [6] and DocBank [7]. They were introduced", "bbox": {"l": 53.79800000000001, "t": 275.36658, "r": 294.04059, "b": 283.74118, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "in 2019 and 2020 respectively and significantly accelerated the im-", "bbox": {"l": 53.79800000000001, "t": 286.32552999999996, "r": 295.55783, "b": 294.70016, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "plementation of layout detection and segmentation models due to", "bbox": {"l": 53.79800000000001, "t": 297.28455, "r": 294.04538, "b": 305.65918000000005, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "their sizes of 300K and 500K ground-truth pages. These sizes were", "bbox": {"l": 53.79800000000001, "t": 308.24353, "r": 294.043, "b": 316.61816, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "achieved by leveraging an automation approach. The benefit of au-", "bbox": {"l": 53.79800000000001, "t": 319.20255, "r": 295.56412, "b": 327.57718, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "tomated ground-truth generation is obvious: one can generate large", "bbox": {"l": 53.79800000000001, "t": 330.16153, "r": 294.04532, "b": 338.53616, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "ground-truth datasets at virtually no cost. However, the automation", "bbox": {"l": 53.79800000000001, "t": 341.12054, "r": 294.04538, "b": 349.49518, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "introduces a constraint on the variability in the dataset, because", "bbox": {"l": 53.79800000000001, "t": 352.07953, "r": 294.04712, "b": 360.45416000000006, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "corresponding structured source data must be available. PubLayNet", "bbox": {"l": 53.79800000000001, "t": 363.03853999999995, "r": 294.04538, "b": 371.41318, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "and DocBank were both generated from scientific document repos-", "bbox": {"l": 53.79800000000001, "t": 373.99655, "r": 295.55643, "b": 382.37119, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "itories (PubMed and arXiv), which provide XML or L", "bbox": {"l": 53.79800000000001, "t": 384.95554, "r": 246.75909, "b": 393.33017, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "A", "bbox": {"l": 243.53101000000004, "t": 385.03183000000007, "r": 248.58553000000003, "b": 391.82455, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "T", "bbox": {"l": 247.24099999999999, "t": 384.95554, "r": 252.58859, "b": 393.33017, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "E", "bbox": {"l": 251.09398999999996, "t": 386.87954999999994, "r": 256.08829, "b": 395.25418, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "X", "bbox": {"l": 254.967, "t": 384.95554, "r": 261.33725, "b": 393.33017, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "sources.", "bbox": {"l": 263.75021, "t": 384.95554, "r": 295.42773, "b": 393.33017, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "Those scientific documents present a limited variability in their", "bbox": {"l": 53.528999, "t": 395.91455, "r": 294.21713, "b": 404.28918, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "layouts, because they are typeset in uniform templates provided by", "bbox": {"l": 53.79800000000001, "t": 406.87354, "r": 294.27386, "b": 415.24817, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "the publishers. Obviously, documents such as technical manuals,", "bbox": {"l": 53.79800000000001, "t": 417.8325500000001, "r": 295.03488, "b": 426.20717999999994, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "annual company reports, legal text, government tenders, etc. have", "bbox": {"l": 53.79800000000001, "t": 428.79153, "r": 294.04691, "b": 437.16617, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "very different and partially unique layouts. As a consequence, the", "bbox": {"l": 53.57400100000001, "t": 439.75055, "r": 294.04865, "b": 448.12518, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "layout predictions obtained from models trained on PubLayNet or", "bbox": {"l": 53.79800000000001, "t": 450.7095299999999, "r": 294.21643, "b": 459.08417, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "DocBank is very reasonable when applied on scientific documents.", "bbox": {"l": 53.79800000000001, "t": 461.66855, "r": 295.42181, "b": 470.04318, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "However, for more", "bbox": {"l": 53.79800000000001, "t": 472.62753, "r": 125.52795, "b": 481.00217, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "artistic", "bbox": {"l": 128.608, "t": 472.67239, "r": 153.7679, "b": 481.01114, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "or", "bbox": {"l": 157.15199, "t": 472.62753, "r": 165.16365, "b": 481.00217, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "free-style", "bbox": {"l": 168.248, "t": 472.67239, "r": 201.49272, "b": 481.01114, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "layouts, we see sub-par", "bbox": {"l": 204.78799, "t": 472.62753, "r": 294.21494, "b": 481.00217, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "prediction quality from these models, which we demonstrate in", "bbox": {"l": 53.79800000000001, "t": 483.58554, "r": 294.04715, "b": 491.96017, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Section 5.", "bbox": {"l": 53.79800000000001, "t": 494.54453, "r": 89.080788, "b": 502.91916, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "In this paper, we present the DocLayNet dataset. It provides page-", "bbox": {"l": 63.76100199999999, "t": 505.50354, "r": 295.56396, "b": 513.87817, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "by-page layout annotation ground-truth using bounding-boxes for", "bbox": {"l": 53.79800000000001, "t": 516.46252, "r": 294.21271, "b": 524.83716, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "11", "bbox": {"l": 53.591999, "t": 527.42154, "r": 61.92275599999999, "b": 535.7961700000001, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "distinct class labels on 80863 unique document pages, of which", "bbox": {"l": 64.162201, "t": 527.42154, "r": 294.04626, "b": 535.7961700000001, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "a fraction carry double- or triple-annotations. DocLayNet is similar", "bbox": {"l": 53.79800000000001, "t": 538.38055, "r": 294.21228, "b": 546.75517, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "in spirit to PubLayNet and DocBank and will likewise be made", "bbox": {"l": 53.79800000000001, "t": 549.33955, "r": 294.04709, "b": 557.71417, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "available to the public", "bbox": {"l": 53.79800000000001, "t": 560.29855, "r": 134.28951, "b": 568.67317, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "1", "bbox": {"l": 134.29201, "t": 558.23083, "r": 137.67381, "b": 565.0235299999999, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "in order to stimulate the document-layout", "bbox": {"l": 140.418, "t": 560.29855, "r": 294.047, "b": 568.67317, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "analysis community. It distinguishes itself in the following aspects:", "bbox": {"l": 53.79800000000001, "t": 571.25755, "r": 295.10538, "b": 579.63217, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "(1)", "bbox": {"l": 64.708, "t": 584.58156, "r": 74.221352, "b": 592.95618, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Human Annotation", "bbox": {"l": 78.207001, "t": 584.62639, "r": 146.39589, "b": 592.96515, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": ": In contrast to PubLayNet and DocBank,", "bbox": {"l": 146.41701, "t": 584.58156, "r": 295.03036, "b": 592.95618, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "we relied on human annotation instead of automation ap-", "bbox": {"l": 77.875, "t": 595.54056, "r": 295.56165, "b": 603.91518, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "proaches to generate the data set.", "bbox": {"l": 78.207001, "t": 606.49956, "r": 200.6432, "b": 614.87418, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "(2)", "bbox": {"l": 64.708, "t": 617.45856, "r": 74.221352, "b": 625.8331800000001, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "Large Layout Variability", "bbox": {"l": 78.207001, "t": 617.50339, "r": 167.91745, "b": 625.84215, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": ": We include diverse and complex", "bbox": {"l": 168.33501, "t": 617.45856, "r": 294.26254, "b": 625.8331800000001, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "layouts from a large variety of public sources.", "bbox": {"l": 78.207001, "t": 628.41655, "r": 245.45726000000002, "b": 636.79117, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "(3)", "bbox": {"l": 64.708, "t": 639.37555, "r": 74.221352, "b": 647.75017, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "Detailed Label Set", "bbox": {"l": 78.207001, "t": 639.42038, "r": 143.51663, "b": 647.75914, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": ": We define 11 class labels to distinguish", "bbox": {"l": 144.02, "t": 639.37555, "r": 294.04648, "b": 647.75017, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "layout features in high detail. PubLayNet provides 5 labels;", "bbox": {"l": 78.207001, "t": 650.33455, "r": 294.68381, "b": 658.70917, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "DocBank provides 13, although not a superset of ours.", "bbox": {"l": 78.207001, "t": 661.29355, "r": 276.33752, "b": 669.66817, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "(4)", "bbox": {"l": 64.708, "t": 672.25256, "r": 74.221352, "b": 680.62717, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "Redundant Annotations", "bbox": {"l": 78.207001, "t": 672.29739, "r": 163.78357, "b": 680.63614, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": ": A fraction of the pages in the Do-", "bbox": {"l": 163.994, "t": 672.25256, "r": 295.56439, "b": 680.62717, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "cLayNet data set carry more than one human annotation.", "bbox": {"l": 78.207001, "t": 683.21156, "r": 295.42719, "b": 691.58617, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "$^{1}$https://developer.ibm.com/exchanges/data/all/doclaynet", "bbox": {"l": 53.672001, "t": 702.226364, "r": 216.02750000000003, "b": 708.739891, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "This enables experimentation with annotation uncertainty", "bbox": {"l": 342.095, "t": 87.36352999999997, "r": 558.43201, "b": 95.73816, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "and quality control analysis.", "bbox": {"l": 342.36401, "t": 98.32250999999997, "r": 445.83629999999994, "b": 106.69713999999999, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "(5)", "bbox": {"l": 328.86502, "t": 109.28148999999996, "r": 338.37836, "b": 117.65612999999996, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Pre-defined Train-, Test- & Validation-set", "bbox": {"l": 342.36401, "t": 109.32641999999998, "r": 487.25296, "b": 117.66516000000001, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": ": Like DocBank, we", "bbox": {"l": 487.75900000000007, "t": 109.28156000000001, "r": 558.20294, "b": 117.65618999999992, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "provide fixed train-, test- & validation-sets to ensure propor-", "bbox": {"l": 342.36401, "t": 120.24054000000001, "r": 559.72101, "b": 128.61517000000003, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "tional representation of the class-labels. Further, we prevent", "bbox": {"l": 342.36401, "t": 131.19854999999995, "r": 558.20117, "b": 139.57317999999998, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "leakage of unique layouts across sets, which has a large effect", "bbox": {"l": 342.36401, "t": 142.15752999999995, "r": 558.20087, "b": 150.53216999999995, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "on model accuracy scores.", "bbox": {"l": 342.36401, "t": 153.11652000000004, "r": 438.0624399999999, "b": 161.49114999999995, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "All aspects outlined above are detailed in Section 3. In Section 4,", "bbox": {"l": 327.918, "t": 167.97551999999996, "r": 559.19031, "b": 176.35015999999996, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "we will elaborate on how we designed and executed this large-scale", "bbox": {"l": 317.62299, "t": 178.93451000000005, "r": 558.20422, "b": 187.30913999999996, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "human annotation campaign. We will also share key insights and", "bbox": {"l": 317.95499, "t": 189.89355, "r": 558.19763, "b": 198.26819, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "lessons learned that might prove helpful for other parties planning", "bbox": {"l": 317.95499, "t": 200.85253999999998, "r": 558.20612, "b": 209.22717, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "to set up annotation campaigns.", "bbox": {"l": 317.95499, "t": 211.81151999999997, "r": 434.94861, "b": 220.18615999999997, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "In Section 5, we will present baseline accuracy numbers for a", "bbox": {"l": 327.918, "t": 222.77057000000002, "r": 558.19836, "b": 231.14520000000005, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "variety of object detection methods (Faster R-CNN, Mask R-CNN", "bbox": {"l": 317.73099, "t": 233.72955000000002, "r": 558.1991, "b": 242.10419000000002, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "and YOLOv5) trained on DocLayNet. We further show how the", "bbox": {"l": 317.95499, "t": 244.68854, "r": 558.20416, "b": 253.06317, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "model performance is impacted by varying the DocLayNet dataset", "bbox": {"l": 317.95499, "t": 255.64752, "r": 558.20563, "b": 264.02216, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "size, reducing the label set and modifying the train/test-split. Last", "bbox": {"l": 317.95499, "t": 266.60553000000004, "r": 558.19861, "b": 274.98015999999996, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "but not least, we compare the performance of models trained on", "bbox": {"l": 317.95499, "t": 277.56458, "r": 558.20416, "b": 285.93918, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "PubLayNet, DocBank and DocLayNet and demonstrate that a model", "bbox": {"l": 317.95499, "t": 288.52353, "r": 558.20239, "b": 296.89816, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "trained on DocLayNet provides overall more robust layout recovery.", "bbox": {"l": 317.95499, "t": 299.48254, "r": 559.58197, "b": 307.85718, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "2", "bbox": {"l": 317.95499, "t": 321.20889, "r": 323.10388, "b": 331.51797, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "RELATED WORK", "bbox": {"l": 333.12115, "t": 321.20889, "r": 421.74411, "b": 331.51797, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "While early approaches in document-layout analysis used rule-", "bbox": {"l": 317.52499, "t": 346.3325500000001, "r": 559.71301, "b": 354.70717999999994, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "based algorithms and heuristics [8], the problem is lately addressed", "bbox": {"l": 317.95499, "t": 357.29153, "r": 558.20276, "b": 365.66617, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "with deep learning methods. The most common approach is to lever-", "bbox": {"l": 317.62299, "t": 368.25055, "r": 559.71564, "b": 376.62518, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "age object detection models [9-15]. In the last decade, the accuracy", "bbox": {"l": 317.95499, "t": 379.2095299999999, "r": 558.43365, "b": 387.58417, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "and speed of these models has increased dramatically. Furthermore,", "bbox": {"l": 317.95499, "t": 390.16855000000004, "r": 559.18658, "b": 398.54318, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "most state-of-the-art object detection methods can be trained and", "bbox": {"l": 317.95499, "t": 401.12753, "r": 558.20502, "b": 409.50217, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "applied with very little work, thanks to a standardisation effort", "bbox": {"l": 317.95499, "t": 412.08655, "r": 558.20422, "b": 420.46118, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "of the ground-truth data format [16] and common deep-learning", "bbox": {"l": 317.95499, "t": 423.04553, "r": 558.20477, "b": 431.4201699999999, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "frameworks [17]. Reference data sets such as PubLayNet [6] and", "bbox": {"l": 317.95499, "t": 434.00354, "r": 558.19952, "b": 442.37817, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "DocBank provide their data in the commonly accepted COCO for-", "bbox": {"l": 317.95499, "t": 444.96252, "r": 559.71613, "b": 453.33716, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "mat [16].", "bbox": {"l": 317.95499, "t": 455.92154, "r": 350.90652, "b": 464.29617, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "Lately, new types of ML models for document-layout analysis", "bbox": {"l": 327.918, "t": 466.88052, "r": 558.19824, "b": 475.25516, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "have emerged in the community [18-21]. These models do not", "bbox": {"l": 317.95499, "t": 477.83954, "r": 558.20551, "b": 486.21417, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "approach the problem of layout analysis purely based on an image", "bbox": {"l": 317.95499, "t": 488.79855, "r": 558.20575, "b": 497.17319, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "representation of the page, as computer vision methods do. Instead,", "bbox": {"l": 317.95499, "t": 499.75754, "r": 559.18646, "b": 508.13217, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "they combine the text tokens and image representation of a page", "bbox": {"l": 317.95499, "t": 510.71655, "r": 558.2002, "b": 519.09119, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "in order to obtain a segmentation. While the reported accuracies", "bbox": {"l": 317.95499, "t": 521.67554, "r": 558.20618, "b": 530.05017, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "appear to be promising, a broadly accepted data format which links", "bbox": {"l": 317.95499, "t": 532.63455, "r": 558.20239, "b": 541.00917, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "geometric and textual features has yet to establish.", "bbox": {"l": 317.95499, "t": 543.59355, "r": 503.32648, "b": 551.96817, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "3", "bbox": {"l": 317.95499, "t": 565.3199, "r": 322.97391, "b": 575.629, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "THE DOCLAYNET DATASET", "bbox": {"l": 332.73831, "t": 565.3199, "r": 477.45688, "b": 575.629, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "DocLayNet contains 80863 PDF pages. Among these, 7059 carry two", "bbox": {"l": 317.95499, "t": 590.4435599999999, "r": 558.20233, "b": 598.81818, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "instances of human annotations, and 1591 carry three. This amounts", "bbox": {"l": 317.95499, "t": 601.40256, "r": 558.20239, "b": 609.77718, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "to 91104 total annotation instances. The annotations provide lay-", "bbox": {"l": 317.95499, "t": 612.36055, "r": 559.7132, "b": 620.73517, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "out information in the shape of labeled, rectangular bounding-", "bbox": {"l": 317.95499, "t": 623.3195499999999, "r": 559.71313, "b": 631.69417, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "boxes. We define 11 distinct labels for layout features, namely", "bbox": {"l": 317.95499, "t": 634.27855, "r": 539.92047, "b": 642.65317, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "Cap-", "bbox": {"l": 542.15802, "t": 634.32338, "r": 559.09888, "b": 642.66214, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "tion", "bbox": {"l": 317.95499, "t": 645.28238, "r": 331.86273, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": ",", "bbox": {"l": 331.86301, "t": 645.23755, "r": 333.83957, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "Footnote", "bbox": {"l": 336.064, "t": 645.28238, "r": 366.05368, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": ",", "bbox": {"l": 366.05301, "t": 645.23755, "r": 368.02957, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "Formula", "bbox": {"l": 370.254, "t": 645.28238, "r": 400.05502, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": ",", "bbox": {"l": 400.05499, "t": 645.23755, "r": 402.03156, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "List-item", "bbox": {"l": 404.25601, "t": 645.28238, "r": 436.19531, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": ",", "bbox": {"l": 436.19501, "t": 645.23755, "r": 438.17157, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "Page-footer", "bbox": {"l": 440.396, "t": 645.28238, "r": 480.60988999999995, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": ",", "bbox": {"l": 480.60999, "t": 645.23755, "r": 482.58655000000005, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "Page-header", "bbox": {"l": 484.811, "t": 645.28238, "r": 528.37604, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": ",", "bbox": {"l": 528.375, "t": 645.23755, "r": 530.35156, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "Picture", "bbox": {"l": 532.57599, "t": 645.28238, "r": 557.211, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": ",", "bbox": {"l": 557.211, "t": 645.23755, "r": 559.18756, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "Section-header", "bbox": {"l": 317.95499, "t": 656.2413799999999, "r": 368.78821, "b": 664.58013, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": ",", "bbox": {"l": 368.789, "t": 656.19655, "r": 370.72217, "b": 664.5711699999999, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "Table", "bbox": {"l": 372.89999, "t": 656.2413799999999, "r": 391.57254, "b": 664.58013, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": ",", "bbox": {"l": 391.573, "t": 656.19655, "r": 393.50616, "b": 664.5711699999999, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "Text", "bbox": {"l": 395.68399, "t": 656.2413799999999, "r": 410.23538, "b": 664.58013, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": ", and", "bbox": {"l": 410.23099, "t": 656.19655, "r": 427.5679, "b": 664.5711699999999, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "Title", "bbox": {"l": 429.74399, "t": 656.2413799999999, "r": 445.50800000000004, "b": 664.58013, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": ". Our reasoning for picking this", "bbox": {"l": 445.50800000000004, "t": 656.19655, "r": 558.20227, "b": 664.5711699999999, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "particular label set is detailed in Section 4.", "bbox": {"l": 317.95499, "t": 667.15556, "r": 472.22198, "b": 675.53017, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "In addition to open intellectual property constraints for the", "bbox": {"l": 327.918, "t": 678.11456, "r": 558.19843, "b": 686.4891700000001, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "source documents, we required that the documents in DocLayNet", "bbox": {"l": 317.95499, "t": 689.07355, "r": 558.19867, "b": 697.448174, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "adhere to a few conditions. Firstly, we kept scanned documents", "bbox": {"l": 317.95499, "t": 700.032555, "r": 558.2041, "b": 708.4071730000001, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 19, "label": "page_header", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.7682238221168518, "cells": [{"id": 0, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 246.24382, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar", "bbox": {"l": 253.13897999999998, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "section_header", "bbox": {"l": 53.79800000000001, "t": 85.85986000000003, "r": 156.52899, "b": 96.16900999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9367801547050476, "cells": [{"id": 2, "text": "1", "bbox": {"l": 53.79800000000001, "t": 85.85986000000003, "r": 59.427395, "b": 96.16900999999996, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "INTRODUCTION", "bbox": {"l": 70.379532, "t": 85.85986000000003, "r": 156.52899, "b": 96.16900999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "text", "bbox": {"l": 53.528999, "t": 110.98352, "r": 303.01697, "b": 228.94714, "coord_origin": "TOPLEFT"}, "confidence": 0.9802607893943787, "cells": [{"id": 4, "text": "Despite the substantial improvements achieved with machine-learning", "bbox": {"l": 53.79800000000001, "t": 110.98352, "r": 303.01697, "b": 119.35815000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "(ML) approaches and deep neural networks in recent years, docu-", "bbox": {"l": 53.528999, "t": 121.94256999999993, "r": 295.55695, "b": 130.31719999999996, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "ment conversion remains a challenging problem, as demonstrated", "bbox": {"l": 53.79800000000001, "t": 132.90155000000004, "r": 294.04642, "b": 141.27617999999995, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "by the numerous public competitions held on this topic [1-4]. The", "bbox": {"l": 53.79800000000001, "t": 143.85956, "r": 294.04733, "b": 152.23419, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "challenge originates from the huge variability in PDF documents", "bbox": {"l": 53.79800000000001, "t": 154.81853999999998, "r": 294.04349, "b": 163.19317999999998, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "regarding layout, language and formats (scanned, programmatic", "bbox": {"l": 53.79800000000001, "t": 165.77752999999996, "r": 294.04718, "b": 174.15215999999998, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "or a combination of both). Engineering a single ML model that can", "bbox": {"l": 53.79800000000001, "t": 176.73650999999995, "r": 294.04919, "b": 185.11114999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "be applied on all types of documents and provides high-quality", "bbox": {"l": 53.79800000000001, "t": 187.69556, "r": 294.27573, "b": 196.07019000000003, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "layout segmentation remains to this day extremely challenging [5].", "bbox": {"l": 53.79800000000001, "t": 198.65454, "r": 295.42569, "b": 207.02917000000002, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "To highlight the variability in document layouts, we show a few", "bbox": {"l": 53.528999, "t": 209.61352999999997, "r": 294.37256, "b": 217.98816, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "example documents from the DocLayNet dataset in Figure 1.", "bbox": {"l": 53.79800000000001, "t": 220.57250999999997, "r": 275.48334, "b": 228.94714, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "text", "bbox": {"l": 53.528999, "t": 231.53156, "r": 295.56412, "b": 502.91916, "coord_origin": "TOPLEFT"}, "confidence": 0.9793015718460083, "cells": [{"id": 15, "text": "A key problem in the process of document conversion is to under-", "bbox": {"l": 63.76100199999999, "t": 231.53156, "r": 295.564, "b": 239.90619000000004, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "stand the structure of a single document page, i.e. which segments", "bbox": {"l": 53.79800000000001, "t": 242.49054, "r": 294.04868, "b": 250.86517000000003, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "of text should be grouped together in a unit. To train models for this", "bbox": {"l": 53.79800000000001, "t": 253.44854999999995, "r": 294.04532, "b": 261.82318, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "task, there are currently two large datasets available to the com-", "bbox": {"l": 53.79800000000001, "t": 264.40752999999995, "r": 295.55618, "b": 272.78216999999995, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "munity, PubLayNet [6] and DocBank [7]. They were introduced", "bbox": {"l": 53.79800000000001, "t": 275.36658, "r": 294.04059, "b": 283.74118, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "in 2019 and 2020 respectively and significantly accelerated the im-", "bbox": {"l": 53.79800000000001, "t": 286.32552999999996, "r": 295.55783, "b": 294.70016, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "plementation of layout detection and segmentation models due to", "bbox": {"l": 53.79800000000001, "t": 297.28455, "r": 294.04538, "b": 305.65918000000005, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "their sizes of 300K and 500K ground-truth pages. These sizes were", "bbox": {"l": 53.79800000000001, "t": 308.24353, "r": 294.043, "b": 316.61816, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "achieved by leveraging an automation approach. The benefit of au-", "bbox": {"l": 53.79800000000001, "t": 319.20255, "r": 295.56412, "b": 327.57718, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "tomated ground-truth generation is obvious: one can generate large", "bbox": {"l": 53.79800000000001, "t": 330.16153, "r": 294.04532, "b": 338.53616, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "ground-truth datasets at virtually no cost. However, the automation", "bbox": {"l": 53.79800000000001, "t": 341.12054, "r": 294.04538, "b": 349.49518, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "introduces a constraint on the variability in the dataset, because", "bbox": {"l": 53.79800000000001, "t": 352.07953, "r": 294.04712, "b": 360.45416000000006, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "corresponding structured source data must be available. PubLayNet", "bbox": {"l": 53.79800000000001, "t": 363.03853999999995, "r": 294.04538, "b": 371.41318, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "and DocBank were both generated from scientific document repos-", "bbox": {"l": 53.79800000000001, "t": 373.99655, "r": 295.55643, "b": 382.37119, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "itories (PubMed and arXiv), which provide XML or L", "bbox": {"l": 53.79800000000001, "t": 384.95554, "r": 246.75909, "b": 393.33017, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "A", "bbox": {"l": 243.53101000000004, "t": 385.03183000000007, "r": 248.58553000000003, "b": 391.82455, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "T", "bbox": {"l": 247.24099999999999, "t": 384.95554, "r": 252.58859, "b": 393.33017, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "E", "bbox": {"l": 251.09398999999996, "t": 386.87954999999994, "r": 256.08829, "b": 395.25418, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "X", "bbox": {"l": 254.967, "t": 384.95554, "r": 261.33725, "b": 393.33017, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "sources.", "bbox": {"l": 263.75021, "t": 384.95554, "r": 295.42773, "b": 393.33017, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "Those scientific documents present a limited variability in their", "bbox": {"l": 53.528999, "t": 395.91455, "r": 294.21713, "b": 404.28918, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "layouts, because they are typeset in uniform templates provided by", "bbox": {"l": 53.79800000000001, "t": 406.87354, "r": 294.27386, "b": 415.24817, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "the publishers. Obviously, documents such as technical manuals,", "bbox": {"l": 53.79800000000001, "t": 417.8325500000001, "r": 295.03488, "b": 426.20717999999994, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "annual company reports, legal text, government tenders, etc. have", "bbox": {"l": 53.79800000000001, "t": 428.79153, "r": 294.04691, "b": 437.16617, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "very different and partially unique layouts. As a consequence, the", "bbox": {"l": 53.57400100000001, "t": 439.75055, "r": 294.04865, "b": 448.12518, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "layout predictions obtained from models trained on PubLayNet or", "bbox": {"l": 53.79800000000001, "t": 450.7095299999999, "r": 294.21643, "b": 459.08417, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "DocBank is very reasonable when applied on scientific documents.", "bbox": {"l": 53.79800000000001, "t": 461.66855, "r": 295.42181, "b": 470.04318, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "However, for more", "bbox": {"l": 53.79800000000001, "t": 472.62753, "r": 125.52795, "b": 481.00217, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "artistic", "bbox": {"l": 128.608, "t": 472.67239, "r": 153.7679, "b": 481.01114, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "or", "bbox": {"l": 157.15199, "t": 472.62753, "r": 165.16365, "b": 481.00217, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "free-style", "bbox": {"l": 168.248, "t": 472.67239, "r": 201.49272, "b": 481.01114, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "layouts, we see sub-par", "bbox": {"l": 204.78799, "t": 472.62753, "r": 294.21494, "b": 481.00217, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "prediction quality from these models, which we demonstrate in", "bbox": {"l": 53.79800000000001, "t": 483.58554, "r": 294.04715, "b": 491.96017, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Section 5.", "bbox": {"l": 53.79800000000001, "t": 494.54453, "r": 89.080788, "b": 502.91916, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "text", "bbox": {"l": 53.591999, "t": 505.50354, "r": 295.56396, "b": 579.63217, "coord_origin": "TOPLEFT"}, "confidence": 0.9795253276824951, "cells": [{"id": 49, "text": "In this paper, we present the DocLayNet dataset. It provides page-", "bbox": {"l": 63.76100199999999, "t": 505.50354, "r": 295.56396, "b": 513.87817, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "by-page layout annotation ground-truth using bounding-boxes for", "bbox": {"l": 53.79800000000001, "t": 516.46252, "r": 294.21271, "b": 524.83716, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "11", "bbox": {"l": 53.591999, "t": 527.42154, "r": 61.92275599999999, "b": 535.7961700000001, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "distinct class labels on 80863 unique document pages, of which", "bbox": {"l": 64.162201, "t": 527.42154, "r": 294.04626, "b": 535.7961700000001, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "a fraction carry double- or triple-annotations. DocLayNet is similar", "bbox": {"l": 53.79800000000001, "t": 538.38055, "r": 294.21228, "b": 546.75517, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "in spirit to PubLayNet and DocBank and will likewise be made", "bbox": {"l": 53.79800000000001, "t": 549.33955, "r": 294.04709, "b": 557.71417, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "available to the public", "bbox": {"l": 53.79800000000001, "t": 560.29855, "r": 134.28951, "b": 568.67317, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "1", "bbox": {"l": 134.29201, "t": 558.23083, "r": 137.67381, "b": 565.0235299999999, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "in order to stimulate the document-layout", "bbox": {"l": 140.418, "t": 560.29855, "r": 294.047, "b": 568.67317, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "analysis community. It distinguishes itself in the following aspects:", "bbox": {"l": 53.79800000000001, "t": 571.25755, "r": 295.10538, "b": 579.63217, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "list_item", "bbox": {"l": 64.708, "t": 584.58156, "r": 295.56165, "b": 614.87418, "coord_origin": "TOPLEFT"}, "confidence": 0.9687220454216003, "cells": [{"id": 59, "text": "(1)", "bbox": {"l": 64.708, "t": 584.58156, "r": 74.221352, "b": 592.95618, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Human Annotation", "bbox": {"l": 78.207001, "t": 584.62639, "r": 146.39589, "b": 592.96515, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": ": In contrast to PubLayNet and DocBank,", "bbox": {"l": 146.41701, "t": 584.58156, "r": 295.03036, "b": 592.95618, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "we relied on human annotation instead of automation ap-", "bbox": {"l": 77.875, "t": 595.54056, "r": 295.56165, "b": 603.91518, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "proaches to generate the data set.", "bbox": {"l": 78.207001, "t": 606.49956, "r": 200.6432, "b": 614.87418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "list_item", "bbox": {"l": 64.708, "t": 617.45856, "r": 294.26254, "b": 636.79117, "coord_origin": "TOPLEFT"}, "confidence": 0.9594229459762573, "cells": [{"id": 64, "text": "(2)", "bbox": {"l": 64.708, "t": 617.45856, "r": 74.221352, "b": 625.8331800000001, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "Large Layout Variability", "bbox": {"l": 78.207001, "t": 617.50339, "r": 167.91745, "b": 625.84215, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": ": We include diverse and complex", "bbox": {"l": 168.33501, "t": 617.45856, "r": 294.26254, "b": 625.8331800000001, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "layouts from a large variety of public sources.", "bbox": {"l": 78.207001, "t": 628.41655, "r": 245.45726000000002, "b": 636.79117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "list_item", "bbox": {"l": 64.708, "t": 639.37555, "r": 294.68381, "b": 669.66817, "coord_origin": "TOPLEFT"}, "confidence": 0.9615103006362915, "cells": [{"id": 68, "text": "(3)", "bbox": {"l": 64.708, "t": 639.37555, "r": 74.221352, "b": 647.75017, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "Detailed Label Set", "bbox": {"l": 78.207001, "t": 639.42038, "r": 143.51663, "b": 647.75914, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": ": We define 11 class labels to distinguish", "bbox": {"l": 144.02, "t": 639.37555, "r": 294.04648, "b": 647.75017, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "layout features in high detail. PubLayNet provides 5 labels;", "bbox": {"l": 78.207001, "t": 650.33455, "r": 294.68381, "b": 658.70917, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "DocBank provides 13, although not a superset of ours.", "bbox": {"l": 78.207001, "t": 661.29355, "r": 276.33752, "b": 669.66817, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "list_item", "bbox": {"l": 64.708, "t": 672.25256, "r": 295.56439, "b": 691.58617, "coord_origin": "TOPLEFT"}, "confidence": 0.9447500109672546, "cells": [{"id": 73, "text": "(4)", "bbox": {"l": 64.708, "t": 672.25256, "r": 74.221352, "b": 680.62717, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "Redundant Annotations", "bbox": {"l": 78.207001, "t": 672.29739, "r": 163.78357, "b": 680.63614, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": ": A fraction of the pages in the Do-", "bbox": {"l": 163.994, "t": 672.25256, "r": 295.56439, "b": 680.62717, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "cLayNet data set carry more than one human annotation.", "bbox": {"l": 78.207001, "t": 683.21156, "r": 295.42719, "b": 691.58617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "footnote", "bbox": {"l": 53.672001, "t": 702.226364, "r": 216.02750000000003, "b": 708.739891, "coord_origin": "TOPLEFT"}, "confidence": 0.8584771752357483, "cells": [{"id": 77, "text": "$^{1}$https://developer.ibm.com/exchanges/data/all/doclaynet", "bbox": {"l": 53.672001, "t": 702.226364, "r": 216.02750000000003, "b": 708.739891, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 342.095, "t": 87.36352999999997, "r": 558.43201, "b": 106.69713999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.7997146844863892, "cells": [{"id": 78, "text": "This enables experimentation with annotation uncertainty", "bbox": {"l": 342.095, "t": 87.36352999999997, "r": 558.43201, "b": 95.73816, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "and quality control analysis.", "bbox": {"l": 342.36401, "t": 98.32250999999997, "r": 445.83629999999994, "b": 106.69713999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "list_item", "bbox": {"l": 328.86502, "t": 109.28148999999996, "r": 559.72101, "b": 161.49114999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9563499093055725, "cells": [{"id": 80, "text": "(5)", "bbox": {"l": 328.86502, "t": 109.28148999999996, "r": 338.37836, "b": 117.65612999999996, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Pre-defined Train-, Test- & Validation-set", "bbox": {"l": 342.36401, "t": 109.32641999999998, "r": 487.25296, "b": 117.66516000000001, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": ": Like DocBank, we", "bbox": {"l": 487.75900000000007, "t": 109.28156000000001, "r": 558.20294, "b": 117.65618999999992, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "provide fixed train-, test- & validation-sets to ensure propor-", "bbox": {"l": 342.36401, "t": 120.24054000000001, "r": 559.72101, "b": 128.61517000000003, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "tional representation of the class-labels. Further, we prevent", "bbox": {"l": 342.36401, "t": 131.19854999999995, "r": 558.20117, "b": 139.57317999999998, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "leakage of unique layouts across sets, which has a large effect", "bbox": {"l": 342.36401, "t": 142.15752999999995, "r": 558.20087, "b": 150.53216999999995, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "on model accuracy scores.", "bbox": {"l": 342.36401, "t": 153.11652000000004, "r": 438.0624399999999, "b": 161.49114999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "text", "bbox": {"l": 317.62299, "t": 167.97551999999996, "r": 559.19031, "b": 220.18615999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9813903570175171, "cells": [{"id": 87, "text": "All aspects outlined above are detailed in Section 3. In Section 4,", "bbox": {"l": 327.918, "t": 167.97551999999996, "r": 559.19031, "b": 176.35015999999996, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "we will elaborate on how we designed and executed this large-scale", "bbox": {"l": 317.62299, "t": 178.93451000000005, "r": 558.20422, "b": 187.30913999999996, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "human annotation campaign. We will also share key insights and", "bbox": {"l": 317.95499, "t": 189.89355, "r": 558.19763, "b": 198.26819, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "lessons learned that might prove helpful for other parties planning", "bbox": {"l": 317.95499, "t": 200.85253999999998, "r": 558.20612, "b": 209.22717, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "to set up annotation campaigns.", "bbox": {"l": 317.95499, "t": 211.81151999999997, "r": 434.94861, "b": 220.18615999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 317.73099, "t": 222.77057000000002, "r": 559.58197, "b": 307.85718, "coord_origin": "TOPLEFT"}, "confidence": 0.9844217300415039, "cells": [{"id": 92, "text": "In Section 5, we will present baseline accuracy numbers for a", "bbox": {"l": 327.918, "t": 222.77057000000002, "r": 558.19836, "b": 231.14520000000005, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "variety of object detection methods (Faster R-CNN, Mask R-CNN", "bbox": {"l": 317.73099, "t": 233.72955000000002, "r": 558.1991, "b": 242.10419000000002, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "and YOLOv5) trained on DocLayNet. We further show how the", "bbox": {"l": 317.95499, "t": 244.68854, "r": 558.20416, "b": 253.06317, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "model performance is impacted by varying the DocLayNet dataset", "bbox": {"l": 317.95499, "t": 255.64752, "r": 558.20563, "b": 264.02216, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "size, reducing the label set and modifying the train/test-split. Last", "bbox": {"l": 317.95499, "t": 266.60553000000004, "r": 558.19861, "b": 274.98015999999996, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "but not least, we compare the performance of models trained on", "bbox": {"l": 317.95499, "t": 277.56458, "r": 558.20416, "b": 285.93918, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "PubLayNet, DocBank and DocLayNet and demonstrate that a model", "bbox": {"l": 317.95499, "t": 288.52353, "r": 558.20239, "b": 296.89816, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "trained on DocLayNet provides overall more robust layout recovery.", "bbox": {"l": 317.95499, "t": 299.48254, "r": 559.58197, "b": 307.85718, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "section_header", "bbox": {"l": 317.95499, "t": 321.20889, "r": 421.74411, "b": 331.51797, "coord_origin": "TOPLEFT"}, "confidence": 0.9347459077835083, "cells": [{"id": 100, "text": "2", "bbox": {"l": 317.95499, "t": 321.20889, "r": 323.10388, "b": 331.51797, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "RELATED WORK", "bbox": {"l": 333.12115, "t": 321.20889, "r": 421.74411, "b": 331.51797, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 317.52499, "t": 346.3325500000001, "r": 559.71613, "b": 464.29617, "coord_origin": "TOPLEFT"}, "confidence": 0.9860377907752991, "cells": [{"id": 102, "text": "While early approaches in document-layout analysis used rule-", "bbox": {"l": 317.52499, "t": 346.3325500000001, "r": 559.71301, "b": 354.70717999999994, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "based algorithms and heuristics [8], the problem is lately addressed", "bbox": {"l": 317.95499, "t": 357.29153, "r": 558.20276, "b": 365.66617, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "with deep learning methods. The most common approach is to lever-", "bbox": {"l": 317.62299, "t": 368.25055, "r": 559.71564, "b": 376.62518, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "age object detection models [9-15]. In the last decade, the accuracy", "bbox": {"l": 317.95499, "t": 379.2095299999999, "r": 558.43365, "b": 387.58417, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "and speed of these models has increased dramatically. Furthermore,", "bbox": {"l": 317.95499, "t": 390.16855000000004, "r": 559.18658, "b": 398.54318, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "most state-of-the-art object detection methods can be trained and", "bbox": {"l": 317.95499, "t": 401.12753, "r": 558.20502, "b": 409.50217, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "applied with very little work, thanks to a standardisation effort", "bbox": {"l": 317.95499, "t": 412.08655, "r": 558.20422, "b": 420.46118, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "of the ground-truth data format [16] and common deep-learning", "bbox": {"l": 317.95499, "t": 423.04553, "r": 558.20477, "b": 431.4201699999999, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "frameworks [17]. Reference data sets such as PubLayNet [6] and", "bbox": {"l": 317.95499, "t": 434.00354, "r": 558.19952, "b": 442.37817, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "DocBank provide their data in the commonly accepted COCO for-", "bbox": {"l": 317.95499, "t": 444.96252, "r": 559.71613, "b": 453.33716, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "mat [16].", "bbox": {"l": 317.95499, "t": 455.92154, "r": 350.90652, "b": 464.29617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 317.95499, "t": 466.88052, "r": 559.18646, "b": 551.96817, "coord_origin": "TOPLEFT"}, "confidence": 0.9861046671867371, "cells": [{"id": 113, "text": "Lately, new types of ML models for document-layout analysis", "bbox": {"l": 327.918, "t": 466.88052, "r": 558.19824, "b": 475.25516, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "have emerged in the community [18-21]. These models do not", "bbox": {"l": 317.95499, "t": 477.83954, "r": 558.20551, "b": 486.21417, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "approach the problem of layout analysis purely based on an image", "bbox": {"l": 317.95499, "t": 488.79855, "r": 558.20575, "b": 497.17319, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "representation of the page, as computer vision methods do. Instead,", "bbox": {"l": 317.95499, "t": 499.75754, "r": 559.18646, "b": 508.13217, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "they combine the text tokens and image representation of a page", "bbox": {"l": 317.95499, "t": 510.71655, "r": 558.2002, "b": 519.09119, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "in order to obtain a segmentation. While the reported accuracies", "bbox": {"l": 317.95499, "t": 521.67554, "r": 558.20618, "b": 530.05017, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "appear to be promising, a broadly accepted data format which links", "bbox": {"l": 317.95499, "t": 532.63455, "r": 558.20239, "b": 541.00917, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "geometric and textual features has yet to establish.", "bbox": {"l": 317.95499, "t": 543.59355, "r": 503.32648, "b": 551.96817, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "section_header", "bbox": {"l": 317.95499, "t": 565.3199, "r": 477.45688, "b": 575.629, "coord_origin": "TOPLEFT"}, "confidence": 0.9331073760986328, "cells": [{"id": 121, "text": "3", "bbox": {"l": 317.95499, "t": 565.3199, "r": 322.97391, "b": 575.629, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "THE DOCLAYNET DATASET", "bbox": {"l": 332.73831, "t": 565.3199, "r": 477.45688, "b": 575.629, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 317.95499, "t": 590.4435599999999, "r": 559.7132, "b": 675.53017, "coord_origin": "TOPLEFT"}, "confidence": 0.9852981567382812, "cells": [{"id": 123, "text": "DocLayNet contains 80863 PDF pages. Among these, 7059 carry two", "bbox": {"l": 317.95499, "t": 590.4435599999999, "r": 558.20233, "b": 598.81818, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "instances of human annotations, and 1591 carry three. This amounts", "bbox": {"l": 317.95499, "t": 601.40256, "r": 558.20239, "b": 609.77718, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "to 91104 total annotation instances. The annotations provide lay-", "bbox": {"l": 317.95499, "t": 612.36055, "r": 559.7132, "b": 620.73517, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "out information in the shape of labeled, rectangular bounding-", "bbox": {"l": 317.95499, "t": 623.3195499999999, "r": 559.71313, "b": 631.69417, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "boxes. We define 11 distinct labels for layout features, namely", "bbox": {"l": 317.95499, "t": 634.27855, "r": 539.92047, "b": 642.65317, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "Cap-", "bbox": {"l": 542.15802, "t": 634.32338, "r": 559.09888, "b": 642.66214, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "tion", "bbox": {"l": 317.95499, "t": 645.28238, "r": 331.86273, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": ",", "bbox": {"l": 331.86301, "t": 645.23755, "r": 333.83957, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "Footnote", "bbox": {"l": 336.064, "t": 645.28238, "r": 366.05368, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": ",", "bbox": {"l": 366.05301, "t": 645.23755, "r": 368.02957, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "Formula", "bbox": {"l": 370.254, "t": 645.28238, "r": 400.05502, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": ",", "bbox": {"l": 400.05499, "t": 645.23755, "r": 402.03156, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "List-item", "bbox": {"l": 404.25601, "t": 645.28238, "r": 436.19531, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": ",", "bbox": {"l": 436.19501, "t": 645.23755, "r": 438.17157, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "Page-footer", "bbox": {"l": 440.396, "t": 645.28238, "r": 480.60988999999995, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": ",", "bbox": {"l": 480.60999, "t": 645.23755, "r": 482.58655000000005, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "Page-header", "bbox": {"l": 484.811, "t": 645.28238, "r": 528.37604, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": ",", "bbox": {"l": 528.375, "t": 645.23755, "r": 530.35156, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "Picture", "bbox": {"l": 532.57599, "t": 645.28238, "r": 557.211, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": ",", "bbox": {"l": 557.211, "t": 645.23755, "r": 559.18756, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "Section-header", "bbox": {"l": 317.95499, "t": 656.2413799999999, "r": 368.78821, "b": 664.58013, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": ",", "bbox": {"l": 368.789, "t": 656.19655, "r": 370.72217, "b": 664.5711699999999, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "Table", "bbox": {"l": 372.89999, "t": 656.2413799999999, "r": 391.57254, "b": 664.58013, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": ",", "bbox": {"l": 391.573, "t": 656.19655, "r": 393.50616, "b": 664.5711699999999, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "Text", "bbox": {"l": 395.68399, "t": 656.2413799999999, "r": 410.23538, "b": 664.58013, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": ", and", "bbox": {"l": 410.23099, "t": 656.19655, "r": 427.5679, "b": 664.5711699999999, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "Title", "bbox": {"l": 429.74399, "t": 656.2413799999999, "r": 445.50800000000004, "b": 664.58013, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": ". Our reasoning for picking this", "bbox": {"l": 445.50800000000004, "t": 656.19655, "r": 558.20227, "b": 664.5711699999999, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "particular label set is detailed in Section 4.", "bbox": {"l": 317.95499, "t": 667.15556, "r": 472.22198, "b": 675.53017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "text", "bbox": {"l": 317.95499, "t": 678.11456, "r": 558.2041, "b": 708.4071730000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9749757051467896, "cells": [{"id": 152, "text": "In addition to open intellectual property constraints for the", "bbox": {"l": 327.918, "t": 678.11456, "r": 558.19843, "b": 686.4891700000001, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "source documents, we required that the documents in DocLayNet", "bbox": {"l": 317.95499, "t": 689.07355, "r": 558.19867, "b": 697.448174, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "adhere to a few conditions. Firstly, we kept scanned documents", "bbox": {"l": 317.95499, "t": 700.032555, "r": 558.2041, "b": 708.4071730000001, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_header", "id": 19, "page_no": 1, "cluster": {"id": 19, "label": "page_header", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.7682238221168518, "cells": [{"id": 0, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 246.24382, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar", "bbox": {"l": 253.13897999999998, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar"}, {"label": "section_header", "id": 14, "page_no": 1, "cluster": {"id": 14, "label": "section_header", "bbox": {"l": 53.79800000000001, "t": 85.85986000000003, "r": 156.52899, "b": 96.16900999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9367801547050476, "cells": [{"id": 2, "text": "1", "bbox": {"l": 53.79800000000001, "t": 85.85986000000003, "r": 59.427395, "b": 96.16900999999996, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "INTRODUCTION", "bbox": {"l": 70.379532, "t": 85.85986000000003, "r": 156.52899, "b": 96.16900999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1 INTRODUCTION"}, {"label": "text", "id": 5, "page_no": 1, "cluster": {"id": 5, "label": "text", "bbox": {"l": 53.528999, "t": 110.98352, "r": 303.01697, "b": 228.94714, "coord_origin": "TOPLEFT"}, "confidence": 0.9802607893943787, "cells": [{"id": 4, "text": "Despite the substantial improvements achieved with machine-learning", "bbox": {"l": 53.79800000000001, "t": 110.98352, "r": 303.01697, "b": 119.35815000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "(ML) approaches and deep neural networks in recent years, docu-", "bbox": {"l": 53.528999, "t": 121.94256999999993, "r": 295.55695, "b": 130.31719999999996, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "ment conversion remains a challenging problem, as demonstrated", "bbox": {"l": 53.79800000000001, "t": 132.90155000000004, "r": 294.04642, "b": 141.27617999999995, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "by the numerous public competitions held on this topic [1-4]. The", "bbox": {"l": 53.79800000000001, "t": 143.85956, "r": 294.04733, "b": 152.23419, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "challenge originates from the huge variability in PDF documents", "bbox": {"l": 53.79800000000001, "t": 154.81853999999998, "r": 294.04349, "b": 163.19317999999998, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "regarding layout, language and formats (scanned, programmatic", "bbox": {"l": 53.79800000000001, "t": 165.77752999999996, "r": 294.04718, "b": 174.15215999999998, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "or a combination of both). Engineering a single ML model that can", "bbox": {"l": 53.79800000000001, "t": 176.73650999999995, "r": 294.04919, "b": 185.11114999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "be applied on all types of documents and provides high-quality", "bbox": {"l": 53.79800000000001, "t": 187.69556, "r": 294.27573, "b": 196.07019000000003, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "layout segmentation remains to this day extremely challenging [5].", "bbox": {"l": 53.79800000000001, "t": 198.65454, "r": 295.42569, "b": 207.02917000000002, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "To highlight the variability in document layouts, we show a few", "bbox": {"l": 53.528999, "t": 209.61352999999997, "r": 294.37256, "b": 217.98816, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "example documents from the DocLayNet dataset in Figure 1.", "bbox": {"l": 53.79800000000001, "t": 220.57250999999997, "r": 275.48334, "b": 228.94714, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Despite the substantial improvements achieved with machine-learning (ML) approaches and deep neural networks in recent years, document conversion remains a challenging problem, as demonstrated by the numerous public competitions held on this topic [1-4]. The challenge originates from the huge variability in PDF documents regarding layout, language and formats (scanned, programmatic or a combination of both). Engineering a single ML model that can be applied on all types of documents and provides high-quality layout segmentation remains to this day extremely challenging [5]. To highlight the variability in document layouts, we show a few example documents from the DocLayNet dataset in Figure 1."}, {"label": "text", "id": 7, "page_no": 1, "cluster": {"id": 7, "label": "text", "bbox": {"l": 53.528999, "t": 231.53156, "r": 295.56412, "b": 502.91916, "coord_origin": "TOPLEFT"}, "confidence": 0.9793015718460083, "cells": [{"id": 15, "text": "A key problem in the process of document conversion is to under-", "bbox": {"l": 63.76100199999999, "t": 231.53156, "r": 295.564, "b": 239.90619000000004, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "stand the structure of a single document page, i.e. which segments", "bbox": {"l": 53.79800000000001, "t": 242.49054, "r": 294.04868, "b": 250.86517000000003, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "of text should be grouped together in a unit. To train models for this", "bbox": {"l": 53.79800000000001, "t": 253.44854999999995, "r": 294.04532, "b": 261.82318, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "task, there are currently two large datasets available to the com-", "bbox": {"l": 53.79800000000001, "t": 264.40752999999995, "r": 295.55618, "b": 272.78216999999995, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "munity, PubLayNet [6] and DocBank [7]. They were introduced", "bbox": {"l": 53.79800000000001, "t": 275.36658, "r": 294.04059, "b": 283.74118, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "in 2019 and 2020 respectively and significantly accelerated the im-", "bbox": {"l": 53.79800000000001, "t": 286.32552999999996, "r": 295.55783, "b": 294.70016, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "plementation of layout detection and segmentation models due to", "bbox": {"l": 53.79800000000001, "t": 297.28455, "r": 294.04538, "b": 305.65918000000005, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "their sizes of 300K and 500K ground-truth pages. These sizes were", "bbox": {"l": 53.79800000000001, "t": 308.24353, "r": 294.043, "b": 316.61816, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "achieved by leveraging an automation approach. The benefit of au-", "bbox": {"l": 53.79800000000001, "t": 319.20255, "r": 295.56412, "b": 327.57718, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "tomated ground-truth generation is obvious: one can generate large", "bbox": {"l": 53.79800000000001, "t": 330.16153, "r": 294.04532, "b": 338.53616, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "ground-truth datasets at virtually no cost. However, the automation", "bbox": {"l": 53.79800000000001, "t": 341.12054, "r": 294.04538, "b": 349.49518, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "introduces a constraint on the variability in the dataset, because", "bbox": {"l": 53.79800000000001, "t": 352.07953, "r": 294.04712, "b": 360.45416000000006, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "corresponding structured source data must be available. PubLayNet", "bbox": {"l": 53.79800000000001, "t": 363.03853999999995, "r": 294.04538, "b": 371.41318, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "and DocBank were both generated from scientific document repos-", "bbox": {"l": 53.79800000000001, "t": 373.99655, "r": 295.55643, "b": 382.37119, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "itories (PubMed and arXiv), which provide XML or L", "bbox": {"l": 53.79800000000001, "t": 384.95554, "r": 246.75909, "b": 393.33017, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "A", "bbox": {"l": 243.53101000000004, "t": 385.03183000000007, "r": 248.58553000000003, "b": 391.82455, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "T", "bbox": {"l": 247.24099999999999, "t": 384.95554, "r": 252.58859, "b": 393.33017, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "E", "bbox": {"l": 251.09398999999996, "t": 386.87954999999994, "r": 256.08829, "b": 395.25418, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "X", "bbox": {"l": 254.967, "t": 384.95554, "r": 261.33725, "b": 393.33017, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "sources.", "bbox": {"l": 263.75021, "t": 384.95554, "r": 295.42773, "b": 393.33017, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "Those scientific documents present a limited variability in their", "bbox": {"l": 53.528999, "t": 395.91455, "r": 294.21713, "b": 404.28918, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "layouts, because they are typeset in uniform templates provided by", "bbox": {"l": 53.79800000000001, "t": 406.87354, "r": 294.27386, "b": 415.24817, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "the publishers. Obviously, documents such as technical manuals,", "bbox": {"l": 53.79800000000001, "t": 417.8325500000001, "r": 295.03488, "b": 426.20717999999994, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "annual company reports, legal text, government tenders, etc. have", "bbox": {"l": 53.79800000000001, "t": 428.79153, "r": 294.04691, "b": 437.16617, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "very different and partially unique layouts. As a consequence, the", "bbox": {"l": 53.57400100000001, "t": 439.75055, "r": 294.04865, "b": 448.12518, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "layout predictions obtained from models trained on PubLayNet or", "bbox": {"l": 53.79800000000001, "t": 450.7095299999999, "r": 294.21643, "b": 459.08417, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "DocBank is very reasonable when applied on scientific documents.", "bbox": {"l": 53.79800000000001, "t": 461.66855, "r": 295.42181, "b": 470.04318, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "However, for more", "bbox": {"l": 53.79800000000001, "t": 472.62753, "r": 125.52795, "b": 481.00217, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "artistic", "bbox": {"l": 128.608, "t": 472.67239, "r": 153.7679, "b": 481.01114, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "or", "bbox": {"l": 157.15199, "t": 472.62753, "r": 165.16365, "b": 481.00217, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "free-style", "bbox": {"l": 168.248, "t": 472.67239, "r": 201.49272, "b": 481.01114, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "layouts, we see sub-par", "bbox": {"l": 204.78799, "t": 472.62753, "r": 294.21494, "b": 481.00217, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "prediction quality from these models, which we demonstrate in", "bbox": {"l": 53.79800000000001, "t": 483.58554, "r": 294.04715, "b": 491.96017, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Section 5.", "bbox": {"l": 53.79800000000001, "t": 494.54453, "r": 89.080788, "b": 502.91916, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "A key problem in the process of document conversion is to understand the structure of a single document page, i.e. which segments of text should be grouped together in a unit. To train models for this task, there are currently two large datasets available to the community, PubLayNet [6] and DocBank [7]. They were introduced in 2019 and 2020 respectively and significantly accelerated the implementation of layout detection and segmentation models due to their sizes of 300K and 500K ground-truth pages. These sizes were achieved by leveraging an automation approach. The benefit of automated ground-truth generation is obvious: one can generate large ground-truth datasets at virtually no cost. However, the automation introduces a constraint on the variability in the dataset, because corresponding structured source data must be available. PubLayNet and DocBank were both generated from scientific document repositories (PubMed and arXiv), which provide XML or L A T E X sources. Those scientific documents present a limited variability in their layouts, because they are typeset in uniform templates provided by the publishers. Obviously, documents such as technical manuals, annual company reports, legal text, government tenders, etc. have very different and partially unique layouts. As a consequence, the layout predictions obtained from models trained on PubLayNet or DocBank is very reasonable when applied on scientific documents. However, for more artistic or free-style layouts, we see sub-par prediction quality from these models, which we demonstrate in Section 5."}, {"label": "text", "id": 6, "page_no": 1, "cluster": {"id": 6, "label": "text", "bbox": {"l": 53.591999, "t": 505.50354, "r": 295.56396, "b": 579.63217, "coord_origin": "TOPLEFT"}, "confidence": 0.9795253276824951, "cells": [{"id": 49, "text": "In this paper, we present the DocLayNet dataset. It provides page-", "bbox": {"l": 63.76100199999999, "t": 505.50354, "r": 295.56396, "b": 513.87817, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "by-page layout annotation ground-truth using bounding-boxes for", "bbox": {"l": 53.79800000000001, "t": 516.46252, "r": 294.21271, "b": 524.83716, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "11", "bbox": {"l": 53.591999, "t": 527.42154, "r": 61.92275599999999, "b": 535.7961700000001, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "distinct class labels on 80863 unique document pages, of which", "bbox": {"l": 64.162201, "t": 527.42154, "r": 294.04626, "b": 535.7961700000001, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "a fraction carry double- or triple-annotations. DocLayNet is similar", "bbox": {"l": 53.79800000000001, "t": 538.38055, "r": 294.21228, "b": 546.75517, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "in spirit to PubLayNet and DocBank and will likewise be made", "bbox": {"l": 53.79800000000001, "t": 549.33955, "r": 294.04709, "b": 557.71417, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "available to the public", "bbox": {"l": 53.79800000000001, "t": 560.29855, "r": 134.28951, "b": 568.67317, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "1", "bbox": {"l": 134.29201, "t": 558.23083, "r": 137.67381, "b": 565.0235299999999, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "in order to stimulate the document-layout", "bbox": {"l": 140.418, "t": 560.29855, "r": 294.047, "b": 568.67317, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "analysis community. It distinguishes itself in the following aspects:", "bbox": {"l": 53.79800000000001, "t": 571.25755, "r": 295.10538, "b": 579.63217, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In this paper, we present the DocLayNet dataset. It provides pageby-page layout annotation ground-truth using bounding-boxes for 11 distinct class labels on 80863 unique document pages, of which a fraction carry double- or triple-annotations. DocLayNet is similar in spirit to PubLayNet and DocBank and will likewise be made available to the public 1 in order to stimulate the document-layout analysis community. It distinguishes itself in the following aspects:"}, {"label": "list_item", "id": 9, "page_no": 1, "cluster": {"id": 9, "label": "list_item", "bbox": {"l": 64.708, "t": 584.58156, "r": 295.56165, "b": 614.87418, "coord_origin": "TOPLEFT"}, "confidence": 0.9687220454216003, "cells": [{"id": 59, "text": "(1)", "bbox": {"l": 64.708, "t": 584.58156, "r": 74.221352, "b": 592.95618, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Human Annotation", "bbox": {"l": 78.207001, "t": 584.62639, "r": 146.39589, "b": 592.96515, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": ": In contrast to PubLayNet and DocBank,", "bbox": {"l": 146.41701, "t": 584.58156, "r": 295.03036, "b": 592.95618, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "we relied on human annotation instead of automation ap-", "bbox": {"l": 77.875, "t": 595.54056, "r": 295.56165, "b": 603.91518, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "proaches to generate the data set.", "bbox": {"l": 78.207001, "t": 606.49956, "r": 200.6432, "b": 614.87418, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "(1) Human Annotation : In contrast to PubLayNet and DocBank, we relied on human annotation instead of automation approaches to generate the data set."}, {"label": "list_item", "id": 11, "page_no": 1, "cluster": {"id": 11, "label": "list_item", "bbox": {"l": 64.708, "t": 617.45856, "r": 294.26254, "b": 636.79117, "coord_origin": "TOPLEFT"}, "confidence": 0.9594229459762573, "cells": [{"id": 64, "text": "(2)", "bbox": {"l": 64.708, "t": 617.45856, "r": 74.221352, "b": 625.8331800000001, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "Large Layout Variability", "bbox": {"l": 78.207001, "t": 617.50339, "r": 167.91745, "b": 625.84215, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": ": We include diverse and complex", "bbox": {"l": 168.33501, "t": 617.45856, "r": 294.26254, "b": 625.8331800000001, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "layouts from a large variety of public sources.", "bbox": {"l": 78.207001, "t": 628.41655, "r": 245.45726000000002, "b": 636.79117, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "(2) Large Layout Variability : We include diverse and complex layouts from a large variety of public sources."}, {"label": "list_item", "id": 10, "page_no": 1, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 64.708, "t": 639.37555, "r": 294.68381, "b": 669.66817, "coord_origin": "TOPLEFT"}, "confidence": 0.9615103006362915, "cells": [{"id": 68, "text": "(3)", "bbox": {"l": 64.708, "t": 639.37555, "r": 74.221352, "b": 647.75017, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "Detailed Label Set", "bbox": {"l": 78.207001, "t": 639.42038, "r": 143.51663, "b": 647.75914, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": ": We define 11 class labels to distinguish", "bbox": {"l": 144.02, "t": 639.37555, "r": 294.04648, "b": 647.75017, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "layout features in high detail. PubLayNet provides 5 labels;", "bbox": {"l": 78.207001, "t": 650.33455, "r": 294.68381, "b": 658.70917, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "DocBank provides 13, although not a superset of ours.", "bbox": {"l": 78.207001, "t": 661.29355, "r": 276.33752, "b": 669.66817, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "(3) Detailed Label Set : We define 11 class labels to distinguish layout features in high detail. PubLayNet provides 5 labels; DocBank provides 13, although not a superset of ours."}, {"label": "list_item", "id": 13, "page_no": 1, "cluster": {"id": 13, "label": "list_item", "bbox": {"l": 64.708, "t": 672.25256, "r": 295.56439, "b": 691.58617, "coord_origin": "TOPLEFT"}, "confidence": 0.9447500109672546, "cells": [{"id": 73, "text": "(4)", "bbox": {"l": 64.708, "t": 672.25256, "r": 74.221352, "b": 680.62717, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "Redundant Annotations", "bbox": {"l": 78.207001, "t": 672.29739, "r": 163.78357, "b": 680.63614, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": ": A fraction of the pages in the Do-", "bbox": {"l": 163.994, "t": 672.25256, "r": 295.56439, "b": 680.62717, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "cLayNet data set carry more than one human annotation.", "bbox": {"l": 78.207001, "t": 683.21156, "r": 295.42719, "b": 691.58617, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "(4) Redundant Annotations : A fraction of the pages in the DocLayNet data set carry more than one human annotation."}, {"label": "footnote", "id": 17, "page_no": 1, "cluster": {"id": 17, "label": "footnote", "bbox": {"l": 53.672001, "t": 702.226364, "r": 216.02750000000003, "b": 708.739891, "coord_origin": "TOPLEFT"}, "confidence": 0.8584771752357483, "cells": [{"id": 77, "text": "$^{1}$https://developer.ibm.com/exchanges/data/all/doclaynet", "bbox": {"l": 53.672001, "t": 702.226364, "r": 216.02750000000003, "b": 708.739891, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "$^{1}$https://developer.ibm.com/exchanges/data/all/doclaynet"}, {"label": "text", "id": 18, "page_no": 1, "cluster": {"id": 18, "label": "text", "bbox": {"l": 342.095, "t": 87.36352999999997, "r": 558.43201, "b": 106.69713999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.7997146844863892, "cells": [{"id": 78, "text": "This enables experimentation with annotation uncertainty", "bbox": {"l": 342.095, "t": 87.36352999999997, "r": 558.43201, "b": 95.73816, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "and quality control analysis.", "bbox": {"l": 342.36401, "t": 98.32250999999997, "r": 445.83629999999994, "b": 106.69713999999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "This enables experimentation with annotation uncertainty and quality control analysis."}, {"label": "list_item", "id": 12, "page_no": 1, "cluster": {"id": 12, "label": "list_item", "bbox": {"l": 328.86502, "t": 109.28148999999996, "r": 559.72101, "b": 161.49114999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9563499093055725, "cells": [{"id": 80, "text": "(5)", "bbox": {"l": 328.86502, "t": 109.28148999999996, "r": 338.37836, "b": 117.65612999999996, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Pre-defined Train-, Test- & Validation-set", "bbox": {"l": 342.36401, "t": 109.32641999999998, "r": 487.25296, "b": 117.66516000000001, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": ": Like DocBank, we", "bbox": {"l": 487.75900000000007, "t": 109.28156000000001, "r": 558.20294, "b": 117.65618999999992, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "provide fixed train-, test- & validation-sets to ensure propor-", "bbox": {"l": 342.36401, "t": 120.24054000000001, "r": 559.72101, "b": 128.61517000000003, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "tional representation of the class-labels. Further, we prevent", "bbox": {"l": 342.36401, "t": 131.19854999999995, "r": 558.20117, "b": 139.57317999999998, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "leakage of unique layouts across sets, which has a large effect", "bbox": {"l": 342.36401, "t": 142.15752999999995, "r": 558.20087, "b": 150.53216999999995, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "on model accuracy scores.", "bbox": {"l": 342.36401, "t": 153.11652000000004, "r": 438.0624399999999, "b": 161.49114999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "(5) Pre-defined Train-, Test- & Validation-set : Like DocBank, we provide fixed train-, test- & validation-sets to ensure proportional representation of the class-labels. Further, we prevent leakage of unique layouts across sets, which has a large effect on model accuracy scores."}, {"label": "text", "id": 4, "page_no": 1, "cluster": {"id": 4, "label": "text", "bbox": {"l": 317.62299, "t": 167.97551999999996, "r": 559.19031, "b": 220.18615999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9813903570175171, "cells": [{"id": 87, "text": "All aspects outlined above are detailed in Section 3. In Section 4,", "bbox": {"l": 327.918, "t": 167.97551999999996, "r": 559.19031, "b": 176.35015999999996, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "we will elaborate on how we designed and executed this large-scale", "bbox": {"l": 317.62299, "t": 178.93451000000005, "r": 558.20422, "b": 187.30913999999996, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "human annotation campaign. We will also share key insights and", "bbox": {"l": 317.95499, "t": 189.89355, "r": 558.19763, "b": 198.26819, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "lessons learned that might prove helpful for other parties planning", "bbox": {"l": 317.95499, "t": 200.85253999999998, "r": 558.20612, "b": 209.22717, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "to set up annotation campaigns.", "bbox": {"l": 317.95499, "t": 211.81151999999997, "r": 434.94861, "b": 220.18615999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "All aspects outlined above are detailed in Section 3. In Section 4, we will elaborate on how we designed and executed this large-scale human annotation campaign. We will also share key insights and lessons learned that might prove helpful for other parties planning to set up annotation campaigns."}, {"label": "text", "id": 3, "page_no": 1, "cluster": {"id": 3, "label": "text", "bbox": {"l": 317.73099, "t": 222.77057000000002, "r": 559.58197, "b": 307.85718, "coord_origin": "TOPLEFT"}, "confidence": 0.9844217300415039, "cells": [{"id": 92, "text": "In Section 5, we will present baseline accuracy numbers for a", "bbox": {"l": 327.918, "t": 222.77057000000002, "r": 558.19836, "b": 231.14520000000005, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "variety of object detection methods (Faster R-CNN, Mask R-CNN", "bbox": {"l": 317.73099, "t": 233.72955000000002, "r": 558.1991, "b": 242.10419000000002, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "and YOLOv5) trained on DocLayNet. We further show how the", "bbox": {"l": 317.95499, "t": 244.68854, "r": 558.20416, "b": 253.06317, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "model performance is impacted by varying the DocLayNet dataset", "bbox": {"l": 317.95499, "t": 255.64752, "r": 558.20563, "b": 264.02216, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "size, reducing the label set and modifying the train/test-split. Last", "bbox": {"l": 317.95499, "t": 266.60553000000004, "r": 558.19861, "b": 274.98015999999996, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "but not least, we compare the performance of models trained on", "bbox": {"l": 317.95499, "t": 277.56458, "r": 558.20416, "b": 285.93918, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "PubLayNet, DocBank and DocLayNet and demonstrate that a model", "bbox": {"l": 317.95499, "t": 288.52353, "r": 558.20239, "b": 296.89816, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "trained on DocLayNet provides overall more robust layout recovery.", "bbox": {"l": 317.95499, "t": 299.48254, "r": 559.58197, "b": 307.85718, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In Section 5, we will present baseline accuracy numbers for a variety of object detection methods (Faster R-CNN, Mask R-CNN and YOLOv5) trained on DocLayNet. We further show how the model performance is impacted by varying the DocLayNet dataset size, reducing the label set and modifying the train/test-split. Last but not least, we compare the performance of models trained on PubLayNet, DocBank and DocLayNet and demonstrate that a model trained on DocLayNet provides overall more robust layout recovery."}, {"label": "section_header", "id": 15, "page_no": 1, "cluster": {"id": 15, "label": "section_header", "bbox": {"l": 317.95499, "t": 321.20889, "r": 421.74411, "b": 331.51797, "coord_origin": "TOPLEFT"}, "confidence": 0.9347459077835083, "cells": [{"id": 100, "text": "2", "bbox": {"l": 317.95499, "t": 321.20889, "r": 323.10388, "b": 331.51797, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "RELATED WORK", "bbox": {"l": 333.12115, "t": 321.20889, "r": 421.74411, "b": 331.51797, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2 RELATED WORK"}, {"label": "text", "id": 1, "page_no": 1, "cluster": {"id": 1, "label": "text", "bbox": {"l": 317.52499, "t": 346.3325500000001, "r": 559.71613, "b": 464.29617, "coord_origin": "TOPLEFT"}, "confidence": 0.9860377907752991, "cells": [{"id": 102, "text": "While early approaches in document-layout analysis used rule-", "bbox": {"l": 317.52499, "t": 346.3325500000001, "r": 559.71301, "b": 354.70717999999994, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "based algorithms and heuristics [8], the problem is lately addressed", "bbox": {"l": 317.95499, "t": 357.29153, "r": 558.20276, "b": 365.66617, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "with deep learning methods. The most common approach is to lever-", "bbox": {"l": 317.62299, "t": 368.25055, "r": 559.71564, "b": 376.62518, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "age object detection models [9-15]. In the last decade, the accuracy", "bbox": {"l": 317.95499, "t": 379.2095299999999, "r": 558.43365, "b": 387.58417, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "and speed of these models has increased dramatically. Furthermore,", "bbox": {"l": 317.95499, "t": 390.16855000000004, "r": 559.18658, "b": 398.54318, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "most state-of-the-art object detection methods can be trained and", "bbox": {"l": 317.95499, "t": 401.12753, "r": 558.20502, "b": 409.50217, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "applied with very little work, thanks to a standardisation effort", "bbox": {"l": 317.95499, "t": 412.08655, "r": 558.20422, "b": 420.46118, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "of the ground-truth data format [16] and common deep-learning", "bbox": {"l": 317.95499, "t": 423.04553, "r": 558.20477, "b": 431.4201699999999, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "frameworks [17]. Reference data sets such as PubLayNet [6] and", "bbox": {"l": 317.95499, "t": 434.00354, "r": 558.19952, "b": 442.37817, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "DocBank provide their data in the commonly accepted COCO for-", "bbox": {"l": 317.95499, "t": 444.96252, "r": 559.71613, "b": 453.33716, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "mat [16].", "bbox": {"l": 317.95499, "t": 455.92154, "r": 350.90652, "b": 464.29617, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "While early approaches in document-layout analysis used rulebased algorithms and heuristics [8], the problem is lately addressed with deep learning methods. The most common approach is to leverage object detection models [9-15]. In the last decade, the accuracy and speed of these models has increased dramatically. Furthermore, most state-of-the-art object detection methods can be trained and applied with very little work, thanks to a standardisation effort of the ground-truth data format [16] and common deep-learning frameworks [17]. Reference data sets such as PubLayNet [6] and DocBank provide their data in the commonly accepted COCO format [16]."}, {"label": "text", "id": 0, "page_no": 1, "cluster": {"id": 0, "label": "text", "bbox": {"l": 317.95499, "t": 466.88052, "r": 559.18646, "b": 551.96817, "coord_origin": "TOPLEFT"}, "confidence": 0.9861046671867371, "cells": [{"id": 113, "text": "Lately, new types of ML models for document-layout analysis", "bbox": {"l": 327.918, "t": 466.88052, "r": 558.19824, "b": 475.25516, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "have emerged in the community [18-21]. These models do not", "bbox": {"l": 317.95499, "t": 477.83954, "r": 558.20551, "b": 486.21417, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "approach the problem of layout analysis purely based on an image", "bbox": {"l": 317.95499, "t": 488.79855, "r": 558.20575, "b": 497.17319, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "representation of the page, as computer vision methods do. Instead,", "bbox": {"l": 317.95499, "t": 499.75754, "r": 559.18646, "b": 508.13217, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "they combine the text tokens and image representation of a page", "bbox": {"l": 317.95499, "t": 510.71655, "r": 558.2002, "b": 519.09119, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "in order to obtain a segmentation. While the reported accuracies", "bbox": {"l": 317.95499, "t": 521.67554, "r": 558.20618, "b": 530.05017, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "appear to be promising, a broadly accepted data format which links", "bbox": {"l": 317.95499, "t": 532.63455, "r": 558.20239, "b": 541.00917, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "geometric and textual features has yet to establish.", "bbox": {"l": 317.95499, "t": 543.59355, "r": 503.32648, "b": 551.96817, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Lately, new types of ML models for document-layout analysis have emerged in the community [18-21]. These models do not approach the problem of layout analysis purely based on an image representation of the page, as computer vision methods do. Instead, they combine the text tokens and image representation of a page in order to obtain a segmentation. While the reported accuracies appear to be promising, a broadly accepted data format which links geometric and textual features has yet to establish."}, {"label": "section_header", "id": 16, "page_no": 1, "cluster": {"id": 16, "label": "section_header", "bbox": {"l": 317.95499, "t": 565.3199, "r": 477.45688, "b": 575.629, "coord_origin": "TOPLEFT"}, "confidence": 0.9331073760986328, "cells": [{"id": 121, "text": "3", "bbox": {"l": 317.95499, "t": 565.3199, "r": 322.97391, "b": 575.629, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "THE DOCLAYNET DATASET", "bbox": {"l": 332.73831, "t": 565.3199, "r": 477.45688, "b": 575.629, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3 THE DOCLAYNET DATASET"}, {"label": "text", "id": 2, "page_no": 1, "cluster": {"id": 2, "label": "text", "bbox": {"l": 317.95499, "t": 590.4435599999999, "r": 559.7132, "b": 675.53017, "coord_origin": "TOPLEFT"}, "confidence": 0.9852981567382812, "cells": [{"id": 123, "text": "DocLayNet contains 80863 PDF pages. Among these, 7059 carry two", "bbox": {"l": 317.95499, "t": 590.4435599999999, "r": 558.20233, "b": 598.81818, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "instances of human annotations, and 1591 carry three. This amounts", "bbox": {"l": 317.95499, "t": 601.40256, "r": 558.20239, "b": 609.77718, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "to 91104 total annotation instances. The annotations provide lay-", "bbox": {"l": 317.95499, "t": 612.36055, "r": 559.7132, "b": 620.73517, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "out information in the shape of labeled, rectangular bounding-", "bbox": {"l": 317.95499, "t": 623.3195499999999, "r": 559.71313, "b": 631.69417, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "boxes. We define 11 distinct labels for layout features, namely", "bbox": {"l": 317.95499, "t": 634.27855, "r": 539.92047, "b": 642.65317, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "Cap-", "bbox": {"l": 542.15802, "t": 634.32338, "r": 559.09888, "b": 642.66214, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "tion", "bbox": {"l": 317.95499, "t": 645.28238, "r": 331.86273, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": ",", "bbox": {"l": 331.86301, "t": 645.23755, "r": 333.83957, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "Footnote", "bbox": {"l": 336.064, "t": 645.28238, "r": 366.05368, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": ",", "bbox": {"l": 366.05301, "t": 645.23755, "r": 368.02957, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "Formula", "bbox": {"l": 370.254, "t": 645.28238, "r": 400.05502, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": ",", "bbox": {"l": 400.05499, "t": 645.23755, "r": 402.03156, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "List-item", "bbox": {"l": 404.25601, "t": 645.28238, "r": 436.19531, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": ",", "bbox": {"l": 436.19501, "t": 645.23755, "r": 438.17157, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "Page-footer", "bbox": {"l": 440.396, "t": 645.28238, "r": 480.60988999999995, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": ",", "bbox": {"l": 480.60999, "t": 645.23755, "r": 482.58655000000005, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "Page-header", "bbox": {"l": 484.811, "t": 645.28238, "r": 528.37604, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": ",", "bbox": {"l": 528.375, "t": 645.23755, "r": 530.35156, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "Picture", "bbox": {"l": 532.57599, "t": 645.28238, "r": 557.211, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": ",", "bbox": {"l": 557.211, "t": 645.23755, "r": 559.18756, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "Section-header", "bbox": {"l": 317.95499, "t": 656.2413799999999, "r": 368.78821, "b": 664.58013, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": ",", "bbox": {"l": 368.789, "t": 656.19655, "r": 370.72217, "b": 664.5711699999999, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "Table", "bbox": {"l": 372.89999, "t": 656.2413799999999, "r": 391.57254, "b": 664.58013, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": ",", "bbox": {"l": 391.573, "t": 656.19655, "r": 393.50616, "b": 664.5711699999999, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "Text", "bbox": {"l": 395.68399, "t": 656.2413799999999, "r": 410.23538, "b": 664.58013, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": ", and", "bbox": {"l": 410.23099, "t": 656.19655, "r": 427.5679, "b": 664.5711699999999, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "Title", "bbox": {"l": 429.74399, "t": 656.2413799999999, "r": 445.50800000000004, "b": 664.58013, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": ". Our reasoning for picking this", "bbox": {"l": 445.50800000000004, "t": 656.19655, "r": 558.20227, "b": 664.5711699999999, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "particular label set is detailed in Section 4.", "bbox": {"l": 317.95499, "t": 667.15556, "r": 472.22198, "b": 675.53017, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "DocLayNet contains 80863 PDF pages. Among these, 7059 carry two instances of human annotations, and 1591 carry three. This amounts to 91104 total annotation instances. The annotations provide layout information in the shape of labeled, rectangular boundingboxes. We define 11 distinct labels for layout features, namely Caption , Footnote , Formula , List-item , Page-footer , Page-header , Picture , Section-header , Table , Text , and Title . Our reasoning for picking this particular label set is detailed in Section 4."}, {"label": "text", "id": 8, "page_no": 1, "cluster": {"id": 8, "label": "text", "bbox": {"l": 317.95499, "t": 678.11456, "r": 558.2041, "b": 708.4071730000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9749757051467896, "cells": [{"id": 152, "text": "In addition to open intellectual property constraints for the", "bbox": {"l": 327.918, "t": 678.11456, "r": 558.19843, "b": 686.4891700000001, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "source documents, we required that the documents in DocLayNet", "bbox": {"l": 317.95499, "t": 689.07355, "r": 558.19867, "b": 697.448174, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "adhere to a few conditions. Firstly, we kept scanned documents", "bbox": {"l": 317.95499, "t": 700.032555, "r": 558.2041, "b": 708.4071730000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In addition to open intellectual property constraints for the source documents, we required that the documents in DocLayNet adhere to a few conditions. Firstly, we kept scanned documents"}], "body": [{"label": "section_header", "id": 14, "page_no": 1, "cluster": {"id": 14, "label": "section_header", "bbox": {"l": 53.79800000000001, "t": 85.85986000000003, "r": 156.52899, "b": 96.16900999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9367801547050476, "cells": [{"id": 2, "text": "1", "bbox": {"l": 53.79800000000001, "t": 85.85986000000003, "r": 59.427395, "b": 96.16900999999996, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "INTRODUCTION", "bbox": {"l": 70.379532, "t": 85.85986000000003, "r": 156.52899, "b": 96.16900999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1 INTRODUCTION"}, {"label": "text", "id": 5, "page_no": 1, "cluster": {"id": 5, "label": "text", "bbox": {"l": 53.528999, "t": 110.98352, "r": 303.01697, "b": 228.94714, "coord_origin": "TOPLEFT"}, "confidence": 0.9802607893943787, "cells": [{"id": 4, "text": "Despite the substantial improvements achieved with machine-learning", "bbox": {"l": 53.79800000000001, "t": 110.98352, "r": 303.01697, "b": 119.35815000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "(ML) approaches and deep neural networks in recent years, docu-", "bbox": {"l": 53.528999, "t": 121.94256999999993, "r": 295.55695, "b": 130.31719999999996, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "ment conversion remains a challenging problem, as demonstrated", "bbox": {"l": 53.79800000000001, "t": 132.90155000000004, "r": 294.04642, "b": 141.27617999999995, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "by the numerous public competitions held on this topic [1-4]. The", "bbox": {"l": 53.79800000000001, "t": 143.85956, "r": 294.04733, "b": 152.23419, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "challenge originates from the huge variability in PDF documents", "bbox": {"l": 53.79800000000001, "t": 154.81853999999998, "r": 294.04349, "b": 163.19317999999998, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "regarding layout, language and formats (scanned, programmatic", "bbox": {"l": 53.79800000000001, "t": 165.77752999999996, "r": 294.04718, "b": 174.15215999999998, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "or a combination of both). Engineering a single ML model that can", "bbox": {"l": 53.79800000000001, "t": 176.73650999999995, "r": 294.04919, "b": 185.11114999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "be applied on all types of documents and provides high-quality", "bbox": {"l": 53.79800000000001, "t": 187.69556, "r": 294.27573, "b": 196.07019000000003, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "layout segmentation remains to this day extremely challenging [5].", "bbox": {"l": 53.79800000000001, "t": 198.65454, "r": 295.42569, "b": 207.02917000000002, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "To highlight the variability in document layouts, we show a few", "bbox": {"l": 53.528999, "t": 209.61352999999997, "r": 294.37256, "b": 217.98816, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "example documents from the DocLayNet dataset in Figure 1.", "bbox": {"l": 53.79800000000001, "t": 220.57250999999997, "r": 275.48334, "b": 228.94714, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Despite the substantial improvements achieved with machine-learning (ML) approaches and deep neural networks in recent years, document conversion remains a challenging problem, as demonstrated by the numerous public competitions held on this topic [1-4]. The challenge originates from the huge variability in PDF documents regarding layout, language and formats (scanned, programmatic or a combination of both). Engineering a single ML model that can be applied on all types of documents and provides high-quality layout segmentation remains to this day extremely challenging [5]. To highlight the variability in document layouts, we show a few example documents from the DocLayNet dataset in Figure 1."}, {"label": "text", "id": 7, "page_no": 1, "cluster": {"id": 7, "label": "text", "bbox": {"l": 53.528999, "t": 231.53156, "r": 295.56412, "b": 502.91916, "coord_origin": "TOPLEFT"}, "confidence": 0.9793015718460083, "cells": [{"id": 15, "text": "A key problem in the process of document conversion is to under-", "bbox": {"l": 63.76100199999999, "t": 231.53156, "r": 295.564, "b": 239.90619000000004, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "stand the structure of a single document page, i.e. which segments", "bbox": {"l": 53.79800000000001, "t": 242.49054, "r": 294.04868, "b": 250.86517000000003, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "of text should be grouped together in a unit. To train models for this", "bbox": {"l": 53.79800000000001, "t": 253.44854999999995, "r": 294.04532, "b": 261.82318, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "task, there are currently two large datasets available to the com-", "bbox": {"l": 53.79800000000001, "t": 264.40752999999995, "r": 295.55618, "b": 272.78216999999995, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "munity, PubLayNet [6] and DocBank [7]. They were introduced", "bbox": {"l": 53.79800000000001, "t": 275.36658, "r": 294.04059, "b": 283.74118, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "in 2019 and 2020 respectively and significantly accelerated the im-", "bbox": {"l": 53.79800000000001, "t": 286.32552999999996, "r": 295.55783, "b": 294.70016, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "plementation of layout detection and segmentation models due to", "bbox": {"l": 53.79800000000001, "t": 297.28455, "r": 294.04538, "b": 305.65918000000005, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "their sizes of 300K and 500K ground-truth pages. These sizes were", "bbox": {"l": 53.79800000000001, "t": 308.24353, "r": 294.043, "b": 316.61816, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "achieved by leveraging an automation approach. The benefit of au-", "bbox": {"l": 53.79800000000001, "t": 319.20255, "r": 295.56412, "b": 327.57718, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "tomated ground-truth generation is obvious: one can generate large", "bbox": {"l": 53.79800000000001, "t": 330.16153, "r": 294.04532, "b": 338.53616, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "ground-truth datasets at virtually no cost. However, the automation", "bbox": {"l": 53.79800000000001, "t": 341.12054, "r": 294.04538, "b": 349.49518, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "introduces a constraint on the variability in the dataset, because", "bbox": {"l": 53.79800000000001, "t": 352.07953, "r": 294.04712, "b": 360.45416000000006, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "corresponding structured source data must be available. PubLayNet", "bbox": {"l": 53.79800000000001, "t": 363.03853999999995, "r": 294.04538, "b": 371.41318, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "and DocBank were both generated from scientific document repos-", "bbox": {"l": 53.79800000000001, "t": 373.99655, "r": 295.55643, "b": 382.37119, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "itories (PubMed and arXiv), which provide XML or L", "bbox": {"l": 53.79800000000001, "t": 384.95554, "r": 246.75909, "b": 393.33017, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "A", "bbox": {"l": 243.53101000000004, "t": 385.03183000000007, "r": 248.58553000000003, "b": 391.82455, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "T", "bbox": {"l": 247.24099999999999, "t": 384.95554, "r": 252.58859, "b": 393.33017, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "E", "bbox": {"l": 251.09398999999996, "t": 386.87954999999994, "r": 256.08829, "b": 395.25418, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "X", "bbox": {"l": 254.967, "t": 384.95554, "r": 261.33725, "b": 393.33017, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "sources.", "bbox": {"l": 263.75021, "t": 384.95554, "r": 295.42773, "b": 393.33017, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "Those scientific documents present a limited variability in their", "bbox": {"l": 53.528999, "t": 395.91455, "r": 294.21713, "b": 404.28918, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "layouts, because they are typeset in uniform templates provided by", "bbox": {"l": 53.79800000000001, "t": 406.87354, "r": 294.27386, "b": 415.24817, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "the publishers. Obviously, documents such as technical manuals,", "bbox": {"l": 53.79800000000001, "t": 417.8325500000001, "r": 295.03488, "b": 426.20717999999994, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "annual company reports, legal text, government tenders, etc. have", "bbox": {"l": 53.79800000000001, "t": 428.79153, "r": 294.04691, "b": 437.16617, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "very different and partially unique layouts. As a consequence, the", "bbox": {"l": 53.57400100000001, "t": 439.75055, "r": 294.04865, "b": 448.12518, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "layout predictions obtained from models trained on PubLayNet or", "bbox": {"l": 53.79800000000001, "t": 450.7095299999999, "r": 294.21643, "b": 459.08417, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "DocBank is very reasonable when applied on scientific documents.", "bbox": {"l": 53.79800000000001, "t": 461.66855, "r": 295.42181, "b": 470.04318, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "However, for more", "bbox": {"l": 53.79800000000001, "t": 472.62753, "r": 125.52795, "b": 481.00217, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "artistic", "bbox": {"l": 128.608, "t": 472.67239, "r": 153.7679, "b": 481.01114, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "or", "bbox": {"l": 157.15199, "t": 472.62753, "r": 165.16365, "b": 481.00217, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "free-style", "bbox": {"l": 168.248, "t": 472.67239, "r": 201.49272, "b": 481.01114, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "layouts, we see sub-par", "bbox": {"l": 204.78799, "t": 472.62753, "r": 294.21494, "b": 481.00217, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "prediction quality from these models, which we demonstrate in", "bbox": {"l": 53.79800000000001, "t": 483.58554, "r": 294.04715, "b": 491.96017, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Section 5.", "bbox": {"l": 53.79800000000001, "t": 494.54453, "r": 89.080788, "b": 502.91916, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "A key problem in the process of document conversion is to understand the structure of a single document page, i.e. which segments of text should be grouped together in a unit. To train models for this task, there are currently two large datasets available to the community, PubLayNet [6] and DocBank [7]. They were introduced in 2019 and 2020 respectively and significantly accelerated the implementation of layout detection and segmentation models due to their sizes of 300K and 500K ground-truth pages. These sizes were achieved by leveraging an automation approach. The benefit of automated ground-truth generation is obvious: one can generate large ground-truth datasets at virtually no cost. However, the automation introduces a constraint on the variability in the dataset, because corresponding structured source data must be available. PubLayNet and DocBank were both generated from scientific document repositories (PubMed and arXiv), which provide XML or L A T E X sources. Those scientific documents present a limited variability in their layouts, because they are typeset in uniform templates provided by the publishers. Obviously, documents such as technical manuals, annual company reports, legal text, government tenders, etc. have very different and partially unique layouts. As a consequence, the layout predictions obtained from models trained on PubLayNet or DocBank is very reasonable when applied on scientific documents. However, for more artistic or free-style layouts, we see sub-par prediction quality from these models, which we demonstrate in Section 5."}, {"label": "text", "id": 6, "page_no": 1, "cluster": {"id": 6, "label": "text", "bbox": {"l": 53.591999, "t": 505.50354, "r": 295.56396, "b": 579.63217, "coord_origin": "TOPLEFT"}, "confidence": 0.9795253276824951, "cells": [{"id": 49, "text": "In this paper, we present the DocLayNet dataset. It provides page-", "bbox": {"l": 63.76100199999999, "t": 505.50354, "r": 295.56396, "b": 513.87817, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "by-page layout annotation ground-truth using bounding-boxes for", "bbox": {"l": 53.79800000000001, "t": 516.46252, "r": 294.21271, "b": 524.83716, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "11", "bbox": {"l": 53.591999, "t": 527.42154, "r": 61.92275599999999, "b": 535.7961700000001, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "distinct class labels on 80863 unique document pages, of which", "bbox": {"l": 64.162201, "t": 527.42154, "r": 294.04626, "b": 535.7961700000001, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "a fraction carry double- or triple-annotations. DocLayNet is similar", "bbox": {"l": 53.79800000000001, "t": 538.38055, "r": 294.21228, "b": 546.75517, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "in spirit to PubLayNet and DocBank and will likewise be made", "bbox": {"l": 53.79800000000001, "t": 549.33955, "r": 294.04709, "b": 557.71417, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "available to the public", "bbox": {"l": 53.79800000000001, "t": 560.29855, "r": 134.28951, "b": 568.67317, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "1", "bbox": {"l": 134.29201, "t": 558.23083, "r": 137.67381, "b": 565.0235299999999, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "in order to stimulate the document-layout", "bbox": {"l": 140.418, "t": 560.29855, "r": 294.047, "b": 568.67317, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "analysis community. It distinguishes itself in the following aspects:", "bbox": {"l": 53.79800000000001, "t": 571.25755, "r": 295.10538, "b": 579.63217, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In this paper, we present the DocLayNet dataset. It provides pageby-page layout annotation ground-truth using bounding-boxes for 11 distinct class labels on 80863 unique document pages, of which a fraction carry double- or triple-annotations. DocLayNet is similar in spirit to PubLayNet and DocBank and will likewise be made available to the public 1 in order to stimulate the document-layout analysis community. It distinguishes itself in the following aspects:"}, {"label": "list_item", "id": 9, "page_no": 1, "cluster": {"id": 9, "label": "list_item", "bbox": {"l": 64.708, "t": 584.58156, "r": 295.56165, "b": 614.87418, "coord_origin": "TOPLEFT"}, "confidence": 0.9687220454216003, "cells": [{"id": 59, "text": "(1)", "bbox": {"l": 64.708, "t": 584.58156, "r": 74.221352, "b": 592.95618, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Human Annotation", "bbox": {"l": 78.207001, "t": 584.62639, "r": 146.39589, "b": 592.96515, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": ": In contrast to PubLayNet and DocBank,", "bbox": {"l": 146.41701, "t": 584.58156, "r": 295.03036, "b": 592.95618, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "we relied on human annotation instead of automation ap-", "bbox": {"l": 77.875, "t": 595.54056, "r": 295.56165, "b": 603.91518, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "proaches to generate the data set.", "bbox": {"l": 78.207001, "t": 606.49956, "r": 200.6432, "b": 614.87418, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "(1) Human Annotation : In contrast to PubLayNet and DocBank, we relied on human annotation instead of automation approaches to generate the data set."}, {"label": "list_item", "id": 11, "page_no": 1, "cluster": {"id": 11, "label": "list_item", "bbox": {"l": 64.708, "t": 617.45856, "r": 294.26254, "b": 636.79117, "coord_origin": "TOPLEFT"}, "confidence": 0.9594229459762573, "cells": [{"id": 64, "text": "(2)", "bbox": {"l": 64.708, "t": 617.45856, "r": 74.221352, "b": 625.8331800000001, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "Large Layout Variability", "bbox": {"l": 78.207001, "t": 617.50339, "r": 167.91745, "b": 625.84215, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": ": We include diverse and complex", "bbox": {"l": 168.33501, "t": 617.45856, "r": 294.26254, "b": 625.8331800000001, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "layouts from a large variety of public sources.", "bbox": {"l": 78.207001, "t": 628.41655, "r": 245.45726000000002, "b": 636.79117, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "(2) Large Layout Variability : We include diverse and complex layouts from a large variety of public sources."}, {"label": "list_item", "id": 10, "page_no": 1, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 64.708, "t": 639.37555, "r": 294.68381, "b": 669.66817, "coord_origin": "TOPLEFT"}, "confidence": 0.9615103006362915, "cells": [{"id": 68, "text": "(3)", "bbox": {"l": 64.708, "t": 639.37555, "r": 74.221352, "b": 647.75017, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "Detailed Label Set", "bbox": {"l": 78.207001, "t": 639.42038, "r": 143.51663, "b": 647.75914, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": ": We define 11 class labels to distinguish", "bbox": {"l": 144.02, "t": 639.37555, "r": 294.04648, "b": 647.75017, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "layout features in high detail. PubLayNet provides 5 labels;", "bbox": {"l": 78.207001, "t": 650.33455, "r": 294.68381, "b": 658.70917, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "DocBank provides 13, although not a superset of ours.", "bbox": {"l": 78.207001, "t": 661.29355, "r": 276.33752, "b": 669.66817, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "(3) Detailed Label Set : We define 11 class labels to distinguish layout features in high detail. PubLayNet provides 5 labels; DocBank provides 13, although not a superset of ours."}, {"label": "list_item", "id": 13, "page_no": 1, "cluster": {"id": 13, "label": "list_item", "bbox": {"l": 64.708, "t": 672.25256, "r": 295.56439, "b": 691.58617, "coord_origin": "TOPLEFT"}, "confidence": 0.9447500109672546, "cells": [{"id": 73, "text": "(4)", "bbox": {"l": 64.708, "t": 672.25256, "r": 74.221352, "b": 680.62717, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "Redundant Annotations", "bbox": {"l": 78.207001, "t": 672.29739, "r": 163.78357, "b": 680.63614, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": ": A fraction of the pages in the Do-", "bbox": {"l": 163.994, "t": 672.25256, "r": 295.56439, "b": 680.62717, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "cLayNet data set carry more than one human annotation.", "bbox": {"l": 78.207001, "t": 683.21156, "r": 295.42719, "b": 691.58617, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "(4) Redundant Annotations : A fraction of the pages in the DocLayNet data set carry more than one human annotation."}, {"label": "footnote", "id": 17, "page_no": 1, "cluster": {"id": 17, "label": "footnote", "bbox": {"l": 53.672001, "t": 702.226364, "r": 216.02750000000003, "b": 708.739891, "coord_origin": "TOPLEFT"}, "confidence": 0.8584771752357483, "cells": [{"id": 77, "text": "$^{1}$https://developer.ibm.com/exchanges/data/all/doclaynet", "bbox": {"l": 53.672001, "t": 702.226364, "r": 216.02750000000003, "b": 708.739891, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "$^{1}$https://developer.ibm.com/exchanges/data/all/doclaynet"}, {"label": "text", "id": 18, "page_no": 1, "cluster": {"id": 18, "label": "text", "bbox": {"l": 342.095, "t": 87.36352999999997, "r": 558.43201, "b": 106.69713999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.7997146844863892, "cells": [{"id": 78, "text": "This enables experimentation with annotation uncertainty", "bbox": {"l": 342.095, "t": 87.36352999999997, "r": 558.43201, "b": 95.73816, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "and quality control analysis.", "bbox": {"l": 342.36401, "t": 98.32250999999997, "r": 445.83629999999994, "b": 106.69713999999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "This enables experimentation with annotation uncertainty and quality control analysis."}, {"label": "list_item", "id": 12, "page_no": 1, "cluster": {"id": 12, "label": "list_item", "bbox": {"l": 328.86502, "t": 109.28148999999996, "r": 559.72101, "b": 161.49114999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9563499093055725, "cells": [{"id": 80, "text": "(5)", "bbox": {"l": 328.86502, "t": 109.28148999999996, "r": 338.37836, "b": 117.65612999999996, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Pre-defined Train-, Test- & Validation-set", "bbox": {"l": 342.36401, "t": 109.32641999999998, "r": 487.25296, "b": 117.66516000000001, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": ": Like DocBank, we", "bbox": {"l": 487.75900000000007, "t": 109.28156000000001, "r": 558.20294, "b": 117.65618999999992, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "provide fixed train-, test- & validation-sets to ensure propor-", "bbox": {"l": 342.36401, "t": 120.24054000000001, "r": 559.72101, "b": 128.61517000000003, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "tional representation of the class-labels. Further, we prevent", "bbox": {"l": 342.36401, "t": 131.19854999999995, "r": 558.20117, "b": 139.57317999999998, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "leakage of unique layouts across sets, which has a large effect", "bbox": {"l": 342.36401, "t": 142.15752999999995, "r": 558.20087, "b": 150.53216999999995, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "on model accuracy scores.", "bbox": {"l": 342.36401, "t": 153.11652000000004, "r": 438.0624399999999, "b": 161.49114999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "(5) Pre-defined Train-, Test- & Validation-set : Like DocBank, we provide fixed train-, test- & validation-sets to ensure proportional representation of the class-labels. Further, we prevent leakage of unique layouts across sets, which has a large effect on model accuracy scores."}, {"label": "text", "id": 4, "page_no": 1, "cluster": {"id": 4, "label": "text", "bbox": {"l": 317.62299, "t": 167.97551999999996, "r": 559.19031, "b": 220.18615999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9813903570175171, "cells": [{"id": 87, "text": "All aspects outlined above are detailed in Section 3. In Section 4,", "bbox": {"l": 327.918, "t": 167.97551999999996, "r": 559.19031, "b": 176.35015999999996, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "we will elaborate on how we designed and executed this large-scale", "bbox": {"l": 317.62299, "t": 178.93451000000005, "r": 558.20422, "b": 187.30913999999996, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "human annotation campaign. We will also share key insights and", "bbox": {"l": 317.95499, "t": 189.89355, "r": 558.19763, "b": 198.26819, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "lessons learned that might prove helpful for other parties planning", "bbox": {"l": 317.95499, "t": 200.85253999999998, "r": 558.20612, "b": 209.22717, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "to set up annotation campaigns.", "bbox": {"l": 317.95499, "t": 211.81151999999997, "r": 434.94861, "b": 220.18615999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "All aspects outlined above are detailed in Section 3. In Section 4, we will elaborate on how we designed and executed this large-scale human annotation campaign. We will also share key insights and lessons learned that might prove helpful for other parties planning to set up annotation campaigns."}, {"label": "text", "id": 3, "page_no": 1, "cluster": {"id": 3, "label": "text", "bbox": {"l": 317.73099, "t": 222.77057000000002, "r": 559.58197, "b": 307.85718, "coord_origin": "TOPLEFT"}, "confidence": 0.9844217300415039, "cells": [{"id": 92, "text": "In Section 5, we will present baseline accuracy numbers for a", "bbox": {"l": 327.918, "t": 222.77057000000002, "r": 558.19836, "b": 231.14520000000005, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "variety of object detection methods (Faster R-CNN, Mask R-CNN", "bbox": {"l": 317.73099, "t": 233.72955000000002, "r": 558.1991, "b": 242.10419000000002, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "and YOLOv5) trained on DocLayNet. We further show how the", "bbox": {"l": 317.95499, "t": 244.68854, "r": 558.20416, "b": 253.06317, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "model performance is impacted by varying the DocLayNet dataset", "bbox": {"l": 317.95499, "t": 255.64752, "r": 558.20563, "b": 264.02216, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "size, reducing the label set and modifying the train/test-split. Last", "bbox": {"l": 317.95499, "t": 266.60553000000004, "r": 558.19861, "b": 274.98015999999996, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "but not least, we compare the performance of models trained on", "bbox": {"l": 317.95499, "t": 277.56458, "r": 558.20416, "b": 285.93918, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "PubLayNet, DocBank and DocLayNet and demonstrate that a model", "bbox": {"l": 317.95499, "t": 288.52353, "r": 558.20239, "b": 296.89816, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "trained on DocLayNet provides overall more robust layout recovery.", "bbox": {"l": 317.95499, "t": 299.48254, "r": 559.58197, "b": 307.85718, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In Section 5, we will present baseline accuracy numbers for a variety of object detection methods (Faster R-CNN, Mask R-CNN and YOLOv5) trained on DocLayNet. We further show how the model performance is impacted by varying the DocLayNet dataset size, reducing the label set and modifying the train/test-split. Last but not least, we compare the performance of models trained on PubLayNet, DocBank and DocLayNet and demonstrate that a model trained on DocLayNet provides overall more robust layout recovery."}, {"label": "section_header", "id": 15, "page_no": 1, "cluster": {"id": 15, "label": "section_header", "bbox": {"l": 317.95499, "t": 321.20889, "r": 421.74411, "b": 331.51797, "coord_origin": "TOPLEFT"}, "confidence": 0.9347459077835083, "cells": [{"id": 100, "text": "2", "bbox": {"l": 317.95499, "t": 321.20889, "r": 323.10388, "b": 331.51797, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "RELATED WORK", "bbox": {"l": 333.12115, "t": 321.20889, "r": 421.74411, "b": 331.51797, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2 RELATED WORK"}, {"label": "text", "id": 1, "page_no": 1, "cluster": {"id": 1, "label": "text", "bbox": {"l": 317.52499, "t": 346.3325500000001, "r": 559.71613, "b": 464.29617, "coord_origin": "TOPLEFT"}, "confidence": 0.9860377907752991, "cells": [{"id": 102, "text": "While early approaches in document-layout analysis used rule-", "bbox": {"l": 317.52499, "t": 346.3325500000001, "r": 559.71301, "b": 354.70717999999994, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "based algorithms and heuristics [8], the problem is lately addressed", "bbox": {"l": 317.95499, "t": 357.29153, "r": 558.20276, "b": 365.66617, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "with deep learning methods. The most common approach is to lever-", "bbox": {"l": 317.62299, "t": 368.25055, "r": 559.71564, "b": 376.62518, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "age object detection models [9-15]. In the last decade, the accuracy", "bbox": {"l": 317.95499, "t": 379.2095299999999, "r": 558.43365, "b": 387.58417, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "and speed of these models has increased dramatically. Furthermore,", "bbox": {"l": 317.95499, "t": 390.16855000000004, "r": 559.18658, "b": 398.54318, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "most state-of-the-art object detection methods can be trained and", "bbox": {"l": 317.95499, "t": 401.12753, "r": 558.20502, "b": 409.50217, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "applied with very little work, thanks to a standardisation effort", "bbox": {"l": 317.95499, "t": 412.08655, "r": 558.20422, "b": 420.46118, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "of the ground-truth data format [16] and common deep-learning", "bbox": {"l": 317.95499, "t": 423.04553, "r": 558.20477, "b": 431.4201699999999, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "frameworks [17]. Reference data sets such as PubLayNet [6] and", "bbox": {"l": 317.95499, "t": 434.00354, "r": 558.19952, "b": 442.37817, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "DocBank provide their data in the commonly accepted COCO for-", "bbox": {"l": 317.95499, "t": 444.96252, "r": 559.71613, "b": 453.33716, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "mat [16].", "bbox": {"l": 317.95499, "t": 455.92154, "r": 350.90652, "b": 464.29617, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "While early approaches in document-layout analysis used rulebased algorithms and heuristics [8], the problem is lately addressed with deep learning methods. The most common approach is to leverage object detection models [9-15]. In the last decade, the accuracy and speed of these models has increased dramatically. Furthermore, most state-of-the-art object detection methods can be trained and applied with very little work, thanks to a standardisation effort of the ground-truth data format [16] and common deep-learning frameworks [17]. Reference data sets such as PubLayNet [6] and DocBank provide their data in the commonly accepted COCO format [16]."}, {"label": "text", "id": 0, "page_no": 1, "cluster": {"id": 0, "label": "text", "bbox": {"l": 317.95499, "t": 466.88052, "r": 559.18646, "b": 551.96817, "coord_origin": "TOPLEFT"}, "confidence": 0.9861046671867371, "cells": [{"id": 113, "text": "Lately, new types of ML models for document-layout analysis", "bbox": {"l": 327.918, "t": 466.88052, "r": 558.19824, "b": 475.25516, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "have emerged in the community [18-21]. These models do not", "bbox": {"l": 317.95499, "t": 477.83954, "r": 558.20551, "b": 486.21417, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "approach the problem of layout analysis purely based on an image", "bbox": {"l": 317.95499, "t": 488.79855, "r": 558.20575, "b": 497.17319, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "representation of the page, as computer vision methods do. Instead,", "bbox": {"l": 317.95499, "t": 499.75754, "r": 559.18646, "b": 508.13217, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "they combine the text tokens and image representation of a page", "bbox": {"l": 317.95499, "t": 510.71655, "r": 558.2002, "b": 519.09119, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "in order to obtain a segmentation. While the reported accuracies", "bbox": {"l": 317.95499, "t": 521.67554, "r": 558.20618, "b": 530.05017, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "appear to be promising, a broadly accepted data format which links", "bbox": {"l": 317.95499, "t": 532.63455, "r": 558.20239, "b": 541.00917, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "geometric and textual features has yet to establish.", "bbox": {"l": 317.95499, "t": 543.59355, "r": 503.32648, "b": 551.96817, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Lately, new types of ML models for document-layout analysis have emerged in the community [18-21]. These models do not approach the problem of layout analysis purely based on an image representation of the page, as computer vision methods do. Instead, they combine the text tokens and image representation of a page in order to obtain a segmentation. While the reported accuracies appear to be promising, a broadly accepted data format which links geometric and textual features has yet to establish."}, {"label": "section_header", "id": 16, "page_no": 1, "cluster": {"id": 16, "label": "section_header", "bbox": {"l": 317.95499, "t": 565.3199, "r": 477.45688, "b": 575.629, "coord_origin": "TOPLEFT"}, "confidence": 0.9331073760986328, "cells": [{"id": 121, "text": "3", "bbox": {"l": 317.95499, "t": 565.3199, "r": 322.97391, "b": 575.629, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "THE DOCLAYNET DATASET", "bbox": {"l": 332.73831, "t": 565.3199, "r": 477.45688, "b": 575.629, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3 THE DOCLAYNET DATASET"}, {"label": "text", "id": 2, "page_no": 1, "cluster": {"id": 2, "label": "text", "bbox": {"l": 317.95499, "t": 590.4435599999999, "r": 559.7132, "b": 675.53017, "coord_origin": "TOPLEFT"}, "confidence": 0.9852981567382812, "cells": [{"id": 123, "text": "DocLayNet contains 80863 PDF pages. Among these, 7059 carry two", "bbox": {"l": 317.95499, "t": 590.4435599999999, "r": 558.20233, "b": 598.81818, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "instances of human annotations, and 1591 carry three. This amounts", "bbox": {"l": 317.95499, "t": 601.40256, "r": 558.20239, "b": 609.77718, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "to 91104 total annotation instances. The annotations provide lay-", "bbox": {"l": 317.95499, "t": 612.36055, "r": 559.7132, "b": 620.73517, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "out information in the shape of labeled, rectangular bounding-", "bbox": {"l": 317.95499, "t": 623.3195499999999, "r": 559.71313, "b": 631.69417, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "boxes. We define 11 distinct labels for layout features, namely", "bbox": {"l": 317.95499, "t": 634.27855, "r": 539.92047, "b": 642.65317, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "Cap-", "bbox": {"l": 542.15802, "t": 634.32338, "r": 559.09888, "b": 642.66214, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "tion", "bbox": {"l": 317.95499, "t": 645.28238, "r": 331.86273, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": ",", "bbox": {"l": 331.86301, "t": 645.23755, "r": 333.83957, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "Footnote", "bbox": {"l": 336.064, "t": 645.28238, "r": 366.05368, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": ",", "bbox": {"l": 366.05301, "t": 645.23755, "r": 368.02957, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "Formula", "bbox": {"l": 370.254, "t": 645.28238, "r": 400.05502, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": ",", "bbox": {"l": 400.05499, "t": 645.23755, "r": 402.03156, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "List-item", "bbox": {"l": 404.25601, "t": 645.28238, "r": 436.19531, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": ",", "bbox": {"l": 436.19501, "t": 645.23755, "r": 438.17157, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "Page-footer", "bbox": {"l": 440.396, "t": 645.28238, "r": 480.60988999999995, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": ",", "bbox": {"l": 480.60999, "t": 645.23755, "r": 482.58655000000005, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "Page-header", "bbox": {"l": 484.811, "t": 645.28238, "r": 528.37604, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": ",", "bbox": {"l": 528.375, "t": 645.23755, "r": 530.35156, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "Picture", "bbox": {"l": 532.57599, "t": 645.28238, "r": 557.211, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": ",", "bbox": {"l": 557.211, "t": 645.23755, "r": 559.18756, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "Section-header", "bbox": {"l": 317.95499, "t": 656.2413799999999, "r": 368.78821, "b": 664.58013, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": ",", "bbox": {"l": 368.789, "t": 656.19655, "r": 370.72217, "b": 664.5711699999999, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "Table", "bbox": {"l": 372.89999, "t": 656.2413799999999, "r": 391.57254, "b": 664.58013, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": ",", "bbox": {"l": 391.573, "t": 656.19655, "r": 393.50616, "b": 664.5711699999999, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "Text", "bbox": {"l": 395.68399, "t": 656.2413799999999, "r": 410.23538, "b": 664.58013, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": ", and", "bbox": {"l": 410.23099, "t": 656.19655, "r": 427.5679, "b": 664.5711699999999, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "Title", "bbox": {"l": 429.74399, "t": 656.2413799999999, "r": 445.50800000000004, "b": 664.58013, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": ". Our reasoning for picking this", "bbox": {"l": 445.50800000000004, "t": 656.19655, "r": 558.20227, "b": 664.5711699999999, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "particular label set is detailed in Section 4.", "bbox": {"l": 317.95499, "t": 667.15556, "r": 472.22198, "b": 675.53017, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "DocLayNet contains 80863 PDF pages. Among these, 7059 carry two instances of human annotations, and 1591 carry three. This amounts to 91104 total annotation instances. The annotations provide layout information in the shape of labeled, rectangular boundingboxes. We define 11 distinct labels for layout features, namely Caption , Footnote , Formula , List-item , Page-footer , Page-header , Picture , Section-header , Table , Text , and Title . Our reasoning for picking this particular label set is detailed in Section 4."}, {"label": "text", "id": 8, "page_no": 1, "cluster": {"id": 8, "label": "text", "bbox": {"l": 317.95499, "t": 678.11456, "r": 558.2041, "b": 708.4071730000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9749757051467896, "cells": [{"id": 152, "text": "In addition to open intellectual property constraints for the", "bbox": {"l": 327.918, "t": 678.11456, "r": 558.19843, "b": 686.4891700000001, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "source documents, we required that the documents in DocLayNet", "bbox": {"l": 317.95499, "t": 689.07355, "r": 558.19867, "b": 697.448174, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "adhere to a few conditions. Firstly, we kept scanned documents", "bbox": {"l": 317.95499, "t": 700.032555, "r": 558.2041, "b": 708.4071730000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In addition to open intellectual property constraints for the source documents, we required that the documents in DocLayNet adhere to a few conditions. Firstly, we kept scanned documents"}], "headers": [{"label": "page_header", "id": 19, "page_no": 1, "cluster": {"id": 19, "label": "page_header", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.7682238221168518, "cells": [{"id": 0, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 246.24382, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar", "bbox": {"l": 253.13897999999998, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar"}]}}, {"page_no": 2, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Patents", "bbox": {"l": 237.11293, "t": 133.08716000000004, "r": 262.97623, "b": 141.61419999999998, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "8%", "bbox": {"l": 202.87892, "t": 140.46178999999995, "r": 213.89999, "b": 148.98883, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Scientific", "bbox": {"l": 207.13306, "t": 93.1576500000001, "r": 237.64882999999998, "b": 101.68469000000005, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "17%", "bbox": {"l": 184.40349, "t": 118.68206999999995, "r": 199.66519, "b": 127.20911000000001, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Financial", "bbox": {"l": 88.288223, "t": 114.35473999999988, "r": 118.80401, "b": 122.88176999999985, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "32%", "bbox": {"l": 136.24422, "t": 130.24408000000005, "r": 151.50592, "b": 138.77112, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Tenders", "bbox": {"l": 93.973373, "t": 187.65765, "r": 121.11515, "b": 196.18469000000005, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "6%", "bbox": {"l": 139.6235, "t": 170.22748, "r": 150.64458, "b": 178.75451999999996, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Laws", "bbox": {"l": 139.88339, "t": 212.50036999999998, "r": 157.68491, "b": 221.02739999999994, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "16%", "bbox": {"l": 157.43983, "t": 183.77808000000005, "r": 172.70154, "b": 192.30511, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Manuals", "bbox": {"l": 225.47252, "t": 189.29656999999997, "r": 254.29510000000002, "b": 197.82361000000003, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "21%", "bbox": {"l": 194.40683, "t": 171.12145999999996, "r": 209.66853, "b": 179.6485, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Figure 2: Distribution of DocLayNet pages across document", "bbox": {"l": 53.79800000000001, "t": 236.11499000000003, "r": 294.04373, "b": 244.58826, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "categories.", "bbox": {"l": 53.79800000000001, "t": 247.07397000000003, "r": 96.756027, "b": 255.54724, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "to a minimum, since they introduce difficulties in annotation (see", "bbox": {"l": 53.79800000000001, "t": 281.8035300000001, "r": 294.04605, "b": 290.17815999999993, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "Section 4). As a second condition, we focussed on medium to large", "bbox": {"l": 53.79800000000001, "t": 292.76254, "r": 294.04868, "b": 301.13718, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "documents (", "bbox": {"l": 53.79800000000001, "t": 303.72153, "r": 98.881348, "b": 312.09616, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": ">", "bbox": {"l": 99.070999, "t": 306.07971, "r": 104.77363, "b": 310.08768, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "10", "bbox": {"l": 107.46399999999998, "t": 303.72153, "r": 115.83373999999999, "b": 312.09616, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "pages) with technical content, dense in complex", "bbox": {"l": 118.08366, "t": 303.72153, "r": 294.26233, "b": 312.09616, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "tables, figures, plots and captions. Such documents carry a lot of", "bbox": {"l": 53.79800000000001, "t": 314.68054, "r": 294.04715, "b": 323.05518, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "information value, but are often hard to analyse with high accuracy", "bbox": {"l": 53.79800000000001, "t": 325.63855, "r": 294.27383, "b": 334.01318, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "due to their challenging layouts. Counterexamples of documents", "bbox": {"l": 53.79800000000001, "t": 336.59753, "r": 294.0416, "b": 344.97217, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "not included in the dataset are receipts, invoices, hand-written", "bbox": {"l": 53.79800000000001, "t": 347.5565500000001, "r": 294.04712, "b": 355.9311799999999, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "documents or photographs showing \u201ctext in the wild\".", "bbox": {"l": 53.79800000000001, "t": 358.51553, "r": 251.73131, "b": 366.89017, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "The pages in DocLayNet can be grouped into six distinct cate-", "bbox": {"l": 63.76100199999999, "t": 369.47455, "r": 295.55945, "b": 377.84918, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "gories, namely", "bbox": {"l": 53.79800000000001, "t": 380.43353, "r": 105.90533, "b": 388.80816999999996, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Financial Reports", "bbox": {"l": 107.754, "t": 380.47838999999993, "r": 167.4973, "b": 388.81714, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": ",", "bbox": {"l": 167.496, "t": 380.43353, "r": 169.42915, "b": 388.80816999999996, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Manuals", "bbox": {"l": 171.28101, "t": 380.47838999999993, "r": 201.45581, "b": 388.81714, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": ",", "bbox": {"l": 201.455, "t": 380.43353, "r": 203.38815, "b": 388.80816999999996, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "Scientific Articles", "bbox": {"l": 205.24001, "t": 380.47838999999993, "r": 264.55273, "b": 388.81714, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": ",", "bbox": {"l": 264.54901, "t": 380.43353, "r": 266.48218, "b": 388.80816999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "Laws &", "bbox": {"l": 268.33401, "t": 380.47838999999993, "r": 294.36133, "b": 388.81714, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Regulations", "bbox": {"l": 53.79800000000001, "t": 391.43741000000006, "r": 94.899666, "b": 399.77615, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": ",", "bbox": {"l": 94.900002, "t": 391.39255, "r": 96.862747, "b": 399.76718, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "Patents", "bbox": {"l": 99.109001, "t": 391.43741000000006, "r": 124.72282, "b": 399.77615, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "and", "bbox": {"l": 127.17899999999999, "t": 391.39255, "r": 140.60596, "b": 399.76718, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "Government Tenders", "bbox": {"l": 142.853, "t": 391.43741000000006, "r": 215.15340000000003, "b": 399.77615, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": ". Each document cate-", "bbox": {"l": 215.15601000000004, "t": 391.39255, "r": 295.55716, "b": 399.76718, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "gory was sourced from various repositories. For example, Financial", "bbox": {"l": 53.79800000000001, "t": 402.3515300000001, "r": 294.04535, "b": 410.72617, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Reports contain both", "bbox": {"l": 53.79800000000001, "t": 413.31055, "r": 132.19516, "b": 421.68518000000006, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "free-style", "bbox": {"l": 134.528, "t": 413.35541, "r": 167.77272, "b": 421.69415, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "format annual reports", "bbox": {"l": 170.314, "t": 413.31055, "r": 252.36031, "b": 421.68518000000006, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "2", "bbox": {"l": 252.356, "t": 411.24283, "r": 255.73781, "b": 418.03555, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "which ex-", "bbox": {"l": 258.56601, "t": 413.31055, "r": 295.56046, "b": 421.68518000000006, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "pose company-specific, artistic layouts as well as the more formal", "bbox": {"l": 53.79800000000001, "t": 424.26953, "r": 294.04376, "b": 432.6441699999999, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "SEC filings. The two largest categories (", "bbox": {"l": 53.79800000000001, "t": 435.22754000000003, "r": 197.59023, "b": 443.60217, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Financial Reports", "bbox": {"l": 197.591, "t": 435.27240000000006, "r": 258.02774, "b": 443.61115, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "and", "bbox": {"l": 260.48901, "t": 435.22754000000003, "r": 273.78104, "b": 443.60217, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Man-", "bbox": {"l": 276.03201, "t": 435.27240000000006, "r": 294.94113, "b": 443.61115, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "uals", "bbox": {"l": 53.79800000000001, "t": 446.23138, "r": 68.085777, "b": 454.57013, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": ") contain a large amount of free-style layouts in order to obtain", "bbox": {"l": 68.296997, "t": 446.18652, "r": 294.04565, "b": 454.56116, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "maximum variability. In the other four categories, we boosted the", "bbox": {"l": 53.79800000000001, "t": 457.14554, "r": 294.04163, "b": 465.52017, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "variability by mixing documents from independent providers, such", "bbox": {"l": 53.57400100000001, "t": 468.10455, "r": 294.04889, "b": 476.47919, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "as different government websites or publishers. In Figure 2, we", "bbox": {"l": 53.79800000000001, "t": 479.06354, "r": 294.04715, "b": 487.43817, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "show the document categories contained in DocLayNet with their", "bbox": {"l": 53.79800000000001, "t": 490.02255, "r": 294.21643, "b": 498.39719, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "respective sizes.", "bbox": {"l": 53.79800000000001, "t": 500.98154, "r": 112.2948, "b": 509.35617, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "We did not control the document selection with regard to lan-", "bbox": {"l": 63.76100199999999, "t": 511.94055, "r": 295.55954, "b": 520.31519, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "guage. The vast majority of documents contained in DocLayNet", "bbox": {"l": 53.79800000000001, "t": 522.89954, "r": 294.04718, "b": 531.27417, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "(close to 95%) are published in English language. However, Do-", "bbox": {"l": 53.528999, "t": 533.8585499999999, "r": 295.56155, "b": 542.23317, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "cLayNet also contains a number of documents in other languages", "bbox": {"l": 53.79800000000001, "t": 544.81755, "r": 294.04144, "b": 553.19217, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "such as German (2.5%), French (1.0%) and Japanese (1.0%). While", "bbox": {"l": 53.79800000000001, "t": 555.77556, "r": 294.04709, "b": 564.15018, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "the document language has negligible impact on the performance", "bbox": {"l": 53.79800000000001, "t": 566.73456, "r": 294.04163, "b": 575.10918, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "of computer vision methods such as object detection and segmenta-", "bbox": {"l": 53.79800000000001, "t": 577.6935599999999, "r": 295.5567, "b": 586.06818, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "tion models, it might prove challenging for layout analysis methods", "bbox": {"l": 53.79800000000001, "t": 588.65256, "r": 294.04541, "b": 597.02718, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "which exploit textual features.", "bbox": {"l": 53.466999, "t": 599.61156, "r": 164.39928, "b": 607.98618, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "To ensure that future benchmarks in the document-layout analy-", "bbox": {"l": 63.76100199999999, "t": 610.57056, "r": 295.56396, "b": 618.9451799999999, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "sis community can be easily compared, we have split up DocLayNet", "bbox": {"l": 53.79800000000001, "t": 621.52956, "r": 294.04532, "b": 629.90417, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "into pre-defined train-, test- and validation-sets. In this way, we can", "bbox": {"l": 53.79800000000001, "t": 632.48856, "r": 294.04538, "b": 640.86317, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "avoid spurious variations in the evaluation scores due to random", "bbox": {"l": 53.79800000000001, "t": 643.4475600000001, "r": 294.04315, "b": 651.82217, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "splitting in train-, test- and validation-sets. We also ensured that", "bbox": {"l": 53.79800000000001, "t": 654.40656, "r": 294.04712, "b": 662.78117, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "less frequent labels are represented in train and test sets in equal", "bbox": {"l": 53.79800000000001, "t": 665.36456, "r": 294.04333, "b": 673.7391700000001, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "proportions.", "bbox": {"l": 53.79800000000001, "t": 676.32355, "r": 98.916931, "b": 684.69817, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "$^{2}$e.g. AAPL from https://www.annualreports.com/", "bbox": {"l": 53.79800000000001, "t": 701.6563639999999, "r": 195.78998, "b": 708.169891, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "Table 1 shows the overall frequency and distribution of the labels", "bbox": {"l": 327.918, "t": 87.36352999999997, "r": 558.20093, "b": 95.73816, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "among the different sets. Importantly, we ensure that subsets are", "bbox": {"l": 317.95499, "t": 98.32250999999997, "r": 558.20013, "b": 106.69713999999999, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "only split on full-document boundaries. This avoids that pages of", "bbox": {"l": 317.95499, "t": 109.28156000000001, "r": 558.20056, "b": 117.65618999999992, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "the same document are spread over train, test and validation set,", "bbox": {"l": 317.95499, "t": 120.24054000000001, "r": 559.19183, "b": 128.61517000000003, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "which can give an undesired evaluation advantage to models and", "bbox": {"l": 317.62299, "t": 131.19854999999995, "r": 558.20349, "b": 139.57317999999998, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "lead to overestimation of their prediction accuracy. We will show", "bbox": {"l": 317.95499, "t": 142.15752999999995, "r": 558.52936, "b": 150.53216999999995, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "the impact of this decision in Section 5.", "bbox": {"l": 317.95499, "t": 153.11652000000004, "r": 461.6416, "b": 161.49114999999995, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "In order to accommodate the different types of models currently", "bbox": {"l": 327.918, "t": 164.07556, "r": 558.43811, "b": 172.4502, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "in use by the community, we provide DocLayNet in an", "bbox": {"l": 317.95499, "t": 175.03454999999997, "r": 516.8219, "b": 183.40918, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "augmented", "bbox": {"l": 519.07501, "t": 175.07941000000005, "r": 558.20135, "b": 183.41814999999997, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "COCO format [16]. This entails the standard COCO ground-truth", "bbox": {"l": 317.95499, "t": 185.99352999999996, "r": 558.20325, "b": 194.36816, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "file (in JSON format) with the associated page images (in PNG", "bbox": {"l": 317.95499, "t": 196.95250999999996, "r": 558.20404, "b": 205.32714999999996, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "format, 1025", "bbox": {"l": 317.95499, "t": 207.91156, "r": 364.28769, "b": 216.28619000000003, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "\u00d7", "bbox": {"l": 364.28699, "t": 207.85779000000002, "r": 369.98962, "b": 215.55993999999998, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "1025 pixels). Furthermore, custom fields have been", "bbox": {"l": 369.98999, "t": 207.91156, "r": 558.20526, "b": 216.28619000000003, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "added to each COCO record to specify document category, original", "bbox": {"l": 317.95499, "t": 218.87054, "r": 558.20251, "b": 227.24518, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "document filename and page number. In addition, we also provide", "bbox": {"l": 317.95499, "t": 229.82952999999998, "r": 558.203, "b": 238.20416, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "the original PDF pages, as well as sidecar files containing parsed", "bbox": {"l": 317.95499, "t": 240.78754000000004, "r": 558.20404, "b": 249.16216999999995, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "PDF text and text-cell coordinates (in JSON). All additional files are", "bbox": {"l": 317.95499, "t": 251.74652000000003, "r": 558.20227, "b": 260.12114999999994, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "linked to the primary page images by their matching filenames.", "bbox": {"l": 317.95499, "t": 262.70556999999997, "r": 550.36414, "b": 271.0802, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "Despite being cost-intense and far less scalable than automation,", "bbox": {"l": 327.918, "t": 273.66454999999996, "r": 559.18488, "b": 282.03918, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "human annotation has several benefits over automated ground-", "bbox": {"l": 317.95499, "t": 284.62354, "r": 559.7132, "b": 292.99817, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "truth generation. The first and most obvious reason to leverage", "bbox": {"l": 317.95499, "t": 295.5825500000001, "r": 558.20416, "b": 303.95717999999994, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "human annotations is the freedom to annotate any type of doc-", "bbox": {"l": 317.95499, "t": 306.54153, "r": 559.71326, "b": 314.91617, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "ument without requiring a programmatic source. For most PDF", "bbox": {"l": 317.95499, "t": 317.50055, "r": 558.41443, "b": 325.87518, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "documents, the original source document is not available. The lat-", "bbox": {"l": 317.95499, "t": 328.4595299999999, "r": 559.71545, "b": 336.83417, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "ter is not a hard constraint with human annotation, but it is for", "bbox": {"l": 317.95499, "t": 339.41855000000004, "r": 558.36865, "b": 347.79318, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "automated methods. A second reason to use human annotations is", "bbox": {"l": 317.95499, "t": 350.37753, "r": 558.20062, "b": 358.75217, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "that the latter usually provide a more natural interpretation of the", "bbox": {"l": 317.95499, "t": 361.33554, "r": 558.20184, "b": 369.71017, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "page layout. The human-interpreted layout can significantly devi-", "bbox": {"l": 317.95499, "t": 372.29453, "r": 559.71442, "b": 380.66916, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "ate from the programmatic layout used in typesetting. For example,", "bbox": {"l": 317.95499, "t": 383.25354, "r": 559.1864, "b": 391.62817, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "\u201cinvisible\u201d tables might be used solely for aligning text paragraphs", "bbox": {"l": 316.94199, "t": 394.21252, "r": 558.20111, "b": 402.58716, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "on columns. Such typesetting tricks might be interpreted by au-", "bbox": {"l": 317.95499, "t": 405.17154, "r": 559.7132, "b": 413.54617, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "tomated methods incorrectly as an actual table, while the human", "bbox": {"l": 317.95499, "t": 416.13052, "r": 558.20013, "b": 424.50515999999993, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "annotation will interpret it correctly as", "bbox": {"l": 317.95499, "t": 427.08953999999994, "r": 464.50613, "b": 435.46417, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "Text", "bbox": {"l": 466.98199000000005, "t": 427.13439999999997, "r": 482.14560000000006, "b": 435.47313999999994, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "or other styles. The", "bbox": {"l": 485.13199000000003, "t": 427.08953999999994, "r": 558.19727, "b": 435.46417, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "same applies to multi-line text elements, when authors decided to", "bbox": {"l": 317.95499, "t": 438.04855, "r": 558.20221, "b": 446.4231899999999, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "space them as \u201cinvisible\u201d list elements without bullet symbols. A", "bbox": {"l": 317.95499, "t": 449.00754, "r": 558.51501, "b": 457.38217, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "third reason to gather ground-truth through human annotation is", "bbox": {"l": 317.95499, "t": 459.96655000000004, "r": 558.19855, "b": 468.34119, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "to estimate a \u201cnatural\u201d upper bound on the segmentation accuracy.", "bbox": {"l": 317.95499, "t": 470.92453, "r": 559.58215, "b": 479.29916, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "As we will show in Section 4, certain documents featuring complex", "bbox": {"l": 317.64099, "t": 481.88354, "r": 558.41559, "b": 490.25818, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "layouts can have different but equally acceptable layout interpre-", "bbox": {"l": 317.95499, "t": 492.84253, "r": 559.72156, "b": 501.21716, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "tations. This natural upper bound for segmentation accuracy can", "bbox": {"l": 317.95499, "t": 503.80154, "r": 558.19928, "b": 512.1761799999999, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "be found by annotating the same pages multiple times by different", "bbox": {"l": 317.95499, "t": 514.76053, "r": 558.20581, "b": 523.13516, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "people and evaluating the inter-annotator agreement. Such a base-", "bbox": {"l": 317.95499, "t": 525.71954, "r": 559.71729, "b": 534.09418, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "line consistency evaluation is very useful to define expectations", "bbox": {"l": 317.95499, "t": 536.6785600000001, "r": 558.20404, "b": 545.05318, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "for a good target accuracy in trained deep neural network models", "bbox": {"l": 317.95499, "t": 547.63756, "r": 558.20074, "b": 556.01218, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "and avoid overfitting (see Table 1). On the flip side, achieving high", "bbox": {"l": 317.95499, "t": 558.59656, "r": 558.20062, "b": 566.97118, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "annotation consistency proved to be a key challenge in human", "bbox": {"l": 317.95499, "t": 569.55556, "r": 558.20416, "b": 577.9301800000001, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "annotation, as we outline in Section 4.", "bbox": {"l": 317.95499, "t": 580.51456, "r": 457.62469, "b": 588.88918, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "4", "bbox": {"l": 317.95499, "t": 606.84991, "r": 323.56226, "b": 617.15901, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "ANNOTATION CAMPAIGN", "bbox": {"l": 334.47134, "t": 606.84991, "r": 470.21326, "b": 617.15901, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "The annotation campaign was carried out in four phases. In phase", "bbox": {"l": 317.686, "t": 631.97356, "r": 558.20148, "b": 640.34818, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "one, we identified and prepared the data sources for annotation.", "bbox": {"l": 317.95499, "t": 642.93256, "r": 559.58521, "b": 651.30717, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "In phase two, we determined the class labels and how annotations", "bbox": {"l": 317.95499, "t": 653.89156, "r": 558.20007, "b": 662.26617, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "should be done on the documents in order to obtain maximum con-", "bbox": {"l": 317.95499, "t": 664.85056, "r": 559.71375, "b": 673.22517, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "sistency. The latter was guided by a detailed requirement analysis", "bbox": {"l": 317.95499, "t": 675.80956, "r": 558.20233, "b": 684.18417, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "and exhaustive experiments. In phase three, we trained the annota-", "bbox": {"l": 317.95499, "t": 686.76855, "r": 559.71381, "b": 695.143173, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "tion staff and performed exams for quality assurance. In phase four,", "bbox": {"l": 317.95499, "t": 697.7275539999999, "r": 559.1864, "b": 706.102173, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 13, "label": "page_header", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.8919971585273743, "cells": [{"id": 0, "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "page_header", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.9104517102241516, "cells": [{"id": 1, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "picture", "bbox": {"l": 88.33030700683594, "t": 92.88652038574219, "r": 263.7049560546875, "b": 220.56826782226562, "coord_origin": "TOPLEFT"}, "confidence": 0.9698190689086914, "cells": [{"id": 2, "text": "Patents", "bbox": {"l": 237.11293, "t": 133.08716000000004, "r": 262.97623, "b": 141.61419999999998, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "8%", "bbox": {"l": 202.87892, "t": 140.46178999999995, "r": 213.89999, "b": 148.98883, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Scientific", "bbox": {"l": 207.13306, "t": 93.1576500000001, "r": 237.64882999999998, "b": 101.68469000000005, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "17%", "bbox": {"l": 184.40349, "t": 118.68206999999995, "r": 199.66519, "b": 127.20911000000001, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Financial", "bbox": {"l": 88.288223, "t": 114.35473999999988, "r": 118.80401, "b": 122.88176999999985, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "32%", "bbox": {"l": 136.24422, "t": 130.24408000000005, "r": 151.50592, "b": 138.77112, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Tenders", "bbox": {"l": 93.973373, "t": 187.65765, "r": 121.11515, "b": 196.18469000000005, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "6%", "bbox": {"l": 139.6235, "t": 170.22748, "r": 150.64458, "b": 178.75451999999996, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Laws", "bbox": {"l": 139.88339, "t": 212.50036999999998, "r": 157.68491, "b": 221.02739999999994, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "16%", "bbox": {"l": 157.43983, "t": 183.77808000000005, "r": 172.70154, "b": 192.30511, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Manuals", "bbox": {"l": 225.47252, "t": 189.29656999999997, "r": 254.29510000000002, "b": 197.82361000000003, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "21%", "bbox": {"l": 194.40683, "t": 171.12145999999996, "r": 209.66853, "b": 179.6485, "coord_origin": "TOPLEFT"}}], "children": [{"id": 14, "label": "text", "bbox": {"l": 237.11293, "t": 133.08716000000004, "r": 262.97623, "b": 141.61419999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 2, "text": "Patents", "bbox": {"l": 237.11293, "t": 133.08716000000004, "r": 262.97623, "b": 141.61419999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 202.87892, "t": 140.46178999999995, "r": 213.89999, "b": 148.98883, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 3, "text": "8%", "bbox": {"l": 202.87892, "t": 140.46178999999995, "r": 213.89999, "b": 148.98883, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 207.13306, "t": 93.1576500000001, "r": 237.64882999999998, "b": 101.68469000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 4, "text": "Scientific", "bbox": {"l": 207.13306, "t": 93.1576500000001, "r": 237.64882999999998, "b": 101.68469000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 184.40349, "t": 118.68206999999995, "r": 199.66519, "b": 127.20911000000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 5, "text": "17%", "bbox": {"l": 184.40349, "t": 118.68206999999995, "r": 199.66519, "b": 127.20911000000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 88.288223, "t": 114.35473999999988, "r": 118.80401, "b": 122.88176999999985, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": "Financial", "bbox": {"l": 88.288223, "t": 114.35473999999988, "r": 118.80401, "b": 122.88176999999985, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 136.24422, "t": 130.24408000000005, "r": 151.50592, "b": 138.77112, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "32%", "bbox": {"l": 136.24422, "t": 130.24408000000005, "r": 151.50592, "b": 138.77112, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 93.973373, "t": 187.65765, "r": 121.11515, "b": 196.18469000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "Tenders", "bbox": {"l": 93.973373, "t": 187.65765, "r": 121.11515, "b": 196.18469000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 139.6235, "t": 170.22748, "r": 150.64458, "b": 178.75451999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "6%", "bbox": {"l": 139.6235, "t": 170.22748, "r": 150.64458, "b": 178.75451999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 139.88339, "t": 212.50036999999998, "r": 157.68491, "b": 221.02739999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "Laws", "bbox": {"l": 139.88339, "t": 212.50036999999998, "r": 157.68491, "b": 221.02739999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 157.43983, "t": 183.77808000000005, "r": 172.70154, "b": 192.30511, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "16%", "bbox": {"l": 157.43983, "t": 183.77808000000005, "r": 172.70154, "b": 192.30511, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 225.47252, "t": 189.29656999999997, "r": 254.29510000000002, "b": 197.82361000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "Manuals", "bbox": {"l": 225.47252, "t": 189.29656999999997, "r": 254.29510000000002, "b": 197.82361000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 194.40683, "t": 171.12145999999996, "r": 209.66853, "b": 179.6485, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "21%", "bbox": {"l": 194.40683, "t": 171.12145999999996, "r": 209.66853, "b": 179.6485, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 9, "label": "caption", "bbox": {"l": 53.79800000000001, "t": 236.11499000000003, "r": 294.04373, "b": 255.54724, "coord_origin": "TOPLEFT"}, "confidence": 0.9425410628318787, "cells": [{"id": 14, "text": "Figure 2: Distribution of DocLayNet pages across document", "bbox": {"l": 53.79800000000001, "t": 236.11499000000003, "r": 294.04373, "b": 244.58826, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "categories.", "bbox": {"l": 53.79800000000001, "t": 247.07397000000003, "r": 96.756027, "b": 255.54724, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "text", "bbox": {"l": 53.79800000000001, "t": 281.8035300000001, "r": 294.27383, "b": 366.89017, "coord_origin": "TOPLEFT"}, "confidence": 0.9866552352905273, "cells": [{"id": 16, "text": "to a minimum, since they introduce difficulties in annotation (see", "bbox": {"l": 53.79800000000001, "t": 281.8035300000001, "r": 294.04605, "b": 290.17815999999993, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "Section 4). As a second condition, we focussed on medium to large", "bbox": {"l": 53.79800000000001, "t": 292.76254, "r": 294.04868, "b": 301.13718, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "documents (", "bbox": {"l": 53.79800000000001, "t": 303.72153, "r": 98.881348, "b": 312.09616, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": ">", "bbox": {"l": 99.070999, "t": 306.07971, "r": 104.77363, "b": 310.08768, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "10", "bbox": {"l": 107.46399999999998, "t": 303.72153, "r": 115.83373999999999, "b": 312.09616, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "pages) with technical content, dense in complex", "bbox": {"l": 118.08366, "t": 303.72153, "r": 294.26233, "b": 312.09616, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "tables, figures, plots and captions. Such documents carry a lot of", "bbox": {"l": 53.79800000000001, "t": 314.68054, "r": 294.04715, "b": 323.05518, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "information value, but are often hard to analyse with high accuracy", "bbox": {"l": 53.79800000000001, "t": 325.63855, "r": 294.27383, "b": 334.01318, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "due to their challenging layouts. Counterexamples of documents", "bbox": {"l": 53.79800000000001, "t": 336.59753, "r": 294.0416, "b": 344.97217, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "not included in the dataset are receipts, invoices, hand-written", "bbox": {"l": 53.79800000000001, "t": 347.5565500000001, "r": 294.04712, "b": 355.9311799999999, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "documents or photographs showing \u201ctext in the wild\".", "bbox": {"l": 53.79800000000001, "t": 358.51553, "r": 251.73131, "b": 366.89017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 53.57400100000001, "t": 369.47455, "r": 295.56046, "b": 509.35617, "coord_origin": "TOPLEFT"}, "confidence": 0.987700879573822, "cells": [{"id": 27, "text": "The pages in DocLayNet can be grouped into six distinct cate-", "bbox": {"l": 63.76100199999999, "t": 369.47455, "r": 295.55945, "b": 377.84918, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "gories, namely", "bbox": {"l": 53.79800000000001, "t": 380.43353, "r": 105.90533, "b": 388.80816999999996, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Financial Reports", "bbox": {"l": 107.754, "t": 380.47838999999993, "r": 167.4973, "b": 388.81714, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": ",", "bbox": {"l": 167.496, "t": 380.43353, "r": 169.42915, "b": 388.80816999999996, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Manuals", "bbox": {"l": 171.28101, "t": 380.47838999999993, "r": 201.45581, "b": 388.81714, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": ",", "bbox": {"l": 201.455, "t": 380.43353, "r": 203.38815, "b": 388.80816999999996, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "Scientific Articles", "bbox": {"l": 205.24001, "t": 380.47838999999993, "r": 264.55273, "b": 388.81714, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": ",", "bbox": {"l": 264.54901, "t": 380.43353, "r": 266.48218, "b": 388.80816999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "Laws &", "bbox": {"l": 268.33401, "t": 380.47838999999993, "r": 294.36133, "b": 388.81714, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Regulations", "bbox": {"l": 53.79800000000001, "t": 391.43741000000006, "r": 94.899666, "b": 399.77615, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": ",", "bbox": {"l": 94.900002, "t": 391.39255, "r": 96.862747, "b": 399.76718, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "Patents", "bbox": {"l": 99.109001, "t": 391.43741000000006, "r": 124.72282, "b": 399.77615, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "and", "bbox": {"l": 127.17899999999999, "t": 391.39255, "r": 140.60596, "b": 399.76718, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "Government Tenders", "bbox": {"l": 142.853, "t": 391.43741000000006, "r": 215.15340000000003, "b": 399.77615, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": ". Each document cate-", "bbox": {"l": 215.15601000000004, "t": 391.39255, "r": 295.55716, "b": 399.76718, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "gory was sourced from various repositories. For example, Financial", "bbox": {"l": 53.79800000000001, "t": 402.3515300000001, "r": 294.04535, "b": 410.72617, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Reports contain both", "bbox": {"l": 53.79800000000001, "t": 413.31055, "r": 132.19516, "b": 421.68518000000006, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "free-style", "bbox": {"l": 134.528, "t": 413.35541, "r": 167.77272, "b": 421.69415, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "format annual reports", "bbox": {"l": 170.314, "t": 413.31055, "r": 252.36031, "b": 421.68518000000006, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "2", "bbox": {"l": 252.356, "t": 411.24283, "r": 255.73781, "b": 418.03555, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "which ex-", "bbox": {"l": 258.56601, "t": 413.31055, "r": 295.56046, "b": 421.68518000000006, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "pose company-specific, artistic layouts as well as the more formal", "bbox": {"l": 53.79800000000001, "t": 424.26953, "r": 294.04376, "b": 432.6441699999999, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "SEC filings. The two largest categories (", "bbox": {"l": 53.79800000000001, "t": 435.22754000000003, "r": 197.59023, "b": 443.60217, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Financial Reports", "bbox": {"l": 197.591, "t": 435.27240000000006, "r": 258.02774, "b": 443.61115, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "and", "bbox": {"l": 260.48901, "t": 435.22754000000003, "r": 273.78104, "b": 443.60217, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Man-", "bbox": {"l": 276.03201, "t": 435.27240000000006, "r": 294.94113, "b": 443.61115, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "uals", "bbox": {"l": 53.79800000000001, "t": 446.23138, "r": 68.085777, "b": 454.57013, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": ") contain a large amount of free-style layouts in order to obtain", "bbox": {"l": 68.296997, "t": 446.18652, "r": 294.04565, "b": 454.56116, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "maximum variability. In the other four categories, we boosted the", "bbox": {"l": 53.79800000000001, "t": 457.14554, "r": 294.04163, "b": 465.52017, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "variability by mixing documents from independent providers, such", "bbox": {"l": 53.57400100000001, "t": 468.10455, "r": 294.04889, "b": 476.47919, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "as different government websites or publishers. In Figure 2, we", "bbox": {"l": 53.79800000000001, "t": 479.06354, "r": 294.04715, "b": 487.43817, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "show the document categories contained in DocLayNet with their", "bbox": {"l": 53.79800000000001, "t": 490.02255, "r": 294.21643, "b": 498.39719, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "respective sizes.", "bbox": {"l": 53.79800000000001, "t": 500.98154, "r": 112.2948, "b": 509.35617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 53.466999, "t": 511.94055, "r": 295.56155, "b": 607.98618, "coord_origin": "TOPLEFT"}, "confidence": 0.9877581000328064, "cells": [{"id": 60, "text": "We did not control the document selection with regard to lan-", "bbox": {"l": 63.76100199999999, "t": 511.94055, "r": 295.55954, "b": 520.31519, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "guage. The vast majority of documents contained in DocLayNet", "bbox": {"l": 53.79800000000001, "t": 522.89954, "r": 294.04718, "b": 531.27417, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "(close to 95%) are published in English language. However, Do-", "bbox": {"l": 53.528999, "t": 533.8585499999999, "r": 295.56155, "b": 542.23317, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "cLayNet also contains a number of documents in other languages", "bbox": {"l": 53.79800000000001, "t": 544.81755, "r": 294.04144, "b": 553.19217, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "such as German (2.5%), French (1.0%) and Japanese (1.0%). While", "bbox": {"l": 53.79800000000001, "t": 555.77556, "r": 294.04709, "b": 564.15018, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "the document language has negligible impact on the performance", "bbox": {"l": 53.79800000000001, "t": 566.73456, "r": 294.04163, "b": 575.10918, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "of computer vision methods such as object detection and segmenta-", "bbox": {"l": 53.79800000000001, "t": 577.6935599999999, "r": 295.5567, "b": 586.06818, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "tion models, it might prove challenging for layout analysis methods", "bbox": {"l": 53.79800000000001, "t": 588.65256, "r": 294.04541, "b": 597.02718, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "which exploit textual features.", "bbox": {"l": 53.466999, "t": 599.61156, "r": 164.39928, "b": 607.98618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 53.79800000000001, "t": 610.57056, "r": 295.56396, "b": 684.69817, "coord_origin": "TOPLEFT"}, "confidence": 0.9880735278129578, "cells": [{"id": 69, "text": "To ensure that future benchmarks in the document-layout analy-", "bbox": {"l": 63.76100199999999, "t": 610.57056, "r": 295.56396, "b": 618.9451799999999, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "sis community can be easily compared, we have split up DocLayNet", "bbox": {"l": 53.79800000000001, "t": 621.52956, "r": 294.04532, "b": 629.90417, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "into pre-defined train-, test- and validation-sets. In this way, we can", "bbox": {"l": 53.79800000000001, "t": 632.48856, "r": 294.04538, "b": 640.86317, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "avoid spurious variations in the evaluation scores due to random", "bbox": {"l": 53.79800000000001, "t": 643.4475600000001, "r": 294.04315, "b": 651.82217, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "splitting in train-, test- and validation-sets. We also ensured that", "bbox": {"l": 53.79800000000001, "t": 654.40656, "r": 294.04712, "b": 662.78117, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "less frequent labels are represented in train and test sets in equal", "bbox": {"l": 53.79800000000001, "t": 665.36456, "r": 294.04333, "b": 673.7391700000001, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "proportions.", "bbox": {"l": 53.79800000000001, "t": 676.32355, "r": 98.916931, "b": 684.69817, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "footnote", "bbox": {"l": 53.79800000000001, "t": 701.6563639999999, "r": 195.78998, "b": 708.169891, "coord_origin": "TOPLEFT"}, "confidence": 0.9048352241516113, "cells": [{"id": 76, "text": "$^{2}$e.g. AAPL from https://www.annualreports.com/", "bbox": {"l": 53.79800000000001, "t": 701.6563639999999, "r": 195.78998, "b": 708.169891, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 317.62299, "t": 87.36352999999997, "r": 559.19183, "b": 161.49114999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.986920952796936, "cells": [{"id": 77, "text": "Table 1 shows the overall frequency and distribution of the labels", "bbox": {"l": 327.918, "t": 87.36352999999997, "r": 558.20093, "b": 95.73816, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "among the different sets. Importantly, we ensure that subsets are", "bbox": {"l": 317.95499, "t": 98.32250999999997, "r": 558.20013, "b": 106.69713999999999, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "only split on full-document boundaries. This avoids that pages of", "bbox": {"l": 317.95499, "t": 109.28156000000001, "r": 558.20056, "b": 117.65618999999992, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "the same document are spread over train, test and validation set,", "bbox": {"l": 317.95499, "t": 120.24054000000001, "r": 559.19183, "b": 128.61517000000003, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "which can give an undesired evaluation advantage to models and", "bbox": {"l": 317.62299, "t": 131.19854999999995, "r": 558.20349, "b": 139.57317999999998, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "lead to overestimation of their prediction accuracy. We will show", "bbox": {"l": 317.95499, "t": 142.15752999999995, "r": 558.52936, "b": 150.53216999999995, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "the impact of this decision in Section 5.", "bbox": {"l": 317.95499, "t": 153.11652000000004, "r": 461.6416, "b": 161.49114999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "text", "bbox": {"l": 317.95499, "t": 164.07556, "r": 558.43811, "b": 271.0802, "coord_origin": "TOPLEFT"}, "confidence": 0.9860605001449585, "cells": [{"id": 84, "text": "In order to accommodate the different types of models currently", "bbox": {"l": 327.918, "t": 164.07556, "r": 558.43811, "b": 172.4502, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "in use by the community, we provide DocLayNet in an", "bbox": {"l": 317.95499, "t": 175.03454999999997, "r": 516.8219, "b": 183.40918, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "augmented", "bbox": {"l": 519.07501, "t": 175.07941000000005, "r": 558.20135, "b": 183.41814999999997, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "COCO format [16]. This entails the standard COCO ground-truth", "bbox": {"l": 317.95499, "t": 185.99352999999996, "r": 558.20325, "b": 194.36816, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "file (in JSON format) with the associated page images (in PNG", "bbox": {"l": 317.95499, "t": 196.95250999999996, "r": 558.20404, "b": 205.32714999999996, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "format, 1025", "bbox": {"l": 317.95499, "t": 207.91156, "r": 364.28769, "b": 216.28619000000003, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "\u00d7", "bbox": {"l": 364.28699, "t": 207.85779000000002, "r": 369.98962, "b": 215.55993999999998, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "1025 pixels). Furthermore, custom fields have been", "bbox": {"l": 369.98999, "t": 207.91156, "r": 558.20526, "b": 216.28619000000003, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "added to each COCO record to specify document category, original", "bbox": {"l": 317.95499, "t": 218.87054, "r": 558.20251, "b": 227.24518, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "document filename and page number. In addition, we also provide", "bbox": {"l": 317.95499, "t": 229.82952999999998, "r": 558.203, "b": 238.20416, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "the original PDF pages, as well as sidecar files containing parsed", "bbox": {"l": 317.95499, "t": 240.78754000000004, "r": 558.20404, "b": 249.16216999999995, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "PDF text and text-cell coordinates (in JSON). All additional files are", "bbox": {"l": 317.95499, "t": 251.74652000000003, "r": 558.20227, "b": 260.12114999999994, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "linked to the primary page images by their matching filenames.", "bbox": {"l": 317.95499, "t": 262.70556999999997, "r": 550.36414, "b": 271.0802, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "text", "bbox": {"l": 316.94199, "t": 273.66454999999996, "r": 559.72156, "b": 588.88918, "coord_origin": "TOPLEFT"}, "confidence": 0.9853296875953674, "cells": [{"id": 97, "text": "Despite being cost-intense and far less scalable than automation,", "bbox": {"l": 327.918, "t": 273.66454999999996, "r": 559.18488, "b": 282.03918, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "human annotation has several benefits over automated ground-", "bbox": {"l": 317.95499, "t": 284.62354, "r": 559.7132, "b": 292.99817, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "truth generation. The first and most obvious reason to leverage", "bbox": {"l": 317.95499, "t": 295.5825500000001, "r": 558.20416, "b": 303.95717999999994, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "human annotations is the freedom to annotate any type of doc-", "bbox": {"l": 317.95499, "t": 306.54153, "r": 559.71326, "b": 314.91617, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "ument without requiring a programmatic source. For most PDF", "bbox": {"l": 317.95499, "t": 317.50055, "r": 558.41443, "b": 325.87518, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "documents, the original source document is not available. The lat-", "bbox": {"l": 317.95499, "t": 328.4595299999999, "r": 559.71545, "b": 336.83417, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "ter is not a hard constraint with human annotation, but it is for", "bbox": {"l": 317.95499, "t": 339.41855000000004, "r": 558.36865, "b": 347.79318, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "automated methods. A second reason to use human annotations is", "bbox": {"l": 317.95499, "t": 350.37753, "r": 558.20062, "b": 358.75217, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "that the latter usually provide a more natural interpretation of the", "bbox": {"l": 317.95499, "t": 361.33554, "r": 558.20184, "b": 369.71017, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "page layout. The human-interpreted layout can significantly devi-", "bbox": {"l": 317.95499, "t": 372.29453, "r": 559.71442, "b": 380.66916, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "ate from the programmatic layout used in typesetting. For example,", "bbox": {"l": 317.95499, "t": 383.25354, "r": 559.1864, "b": 391.62817, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "\u201cinvisible\u201d tables might be used solely for aligning text paragraphs", "bbox": {"l": 316.94199, "t": 394.21252, "r": 558.20111, "b": 402.58716, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "on columns. Such typesetting tricks might be interpreted by au-", "bbox": {"l": 317.95499, "t": 405.17154, "r": 559.7132, "b": 413.54617, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "tomated methods incorrectly as an actual table, while the human", "bbox": {"l": 317.95499, "t": 416.13052, "r": 558.20013, "b": 424.50515999999993, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "annotation will interpret it correctly as", "bbox": {"l": 317.95499, "t": 427.08953999999994, "r": 464.50613, "b": 435.46417, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "Text", "bbox": {"l": 466.98199000000005, "t": 427.13439999999997, "r": 482.14560000000006, "b": 435.47313999999994, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "or other styles. The", "bbox": {"l": 485.13199000000003, "t": 427.08953999999994, "r": 558.19727, "b": 435.46417, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "same applies to multi-line text elements, when authors decided to", "bbox": {"l": 317.95499, "t": 438.04855, "r": 558.20221, "b": 446.4231899999999, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "space them as \u201cinvisible\u201d list elements without bullet symbols. A", "bbox": {"l": 317.95499, "t": 449.00754, "r": 558.51501, "b": 457.38217, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "third reason to gather ground-truth through human annotation is", "bbox": {"l": 317.95499, "t": 459.96655000000004, "r": 558.19855, "b": 468.34119, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "to estimate a \u201cnatural\u201d upper bound on the segmentation accuracy.", "bbox": {"l": 317.95499, "t": 470.92453, "r": 559.58215, "b": 479.29916, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "As we will show in Section 4, certain documents featuring complex", "bbox": {"l": 317.64099, "t": 481.88354, "r": 558.41559, "b": 490.25818, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "layouts can have different but equally acceptable layout interpre-", "bbox": {"l": 317.95499, "t": 492.84253, "r": 559.72156, "b": 501.21716, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "tations. This natural upper bound for segmentation accuracy can", "bbox": {"l": 317.95499, "t": 503.80154, "r": 558.19928, "b": 512.1761799999999, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "be found by annotating the same pages multiple times by different", "bbox": {"l": 317.95499, "t": 514.76053, "r": 558.20581, "b": 523.13516, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "people and evaluating the inter-annotator agreement. Such a base-", "bbox": {"l": 317.95499, "t": 525.71954, "r": 559.71729, "b": 534.09418, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "line consistency evaluation is very useful to define expectations", "bbox": {"l": 317.95499, "t": 536.6785600000001, "r": 558.20404, "b": 545.05318, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "for a good target accuracy in trained deep neural network models", "bbox": {"l": 317.95499, "t": 547.63756, "r": 558.20074, "b": 556.01218, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "and avoid overfitting (see Table 1). On the flip side, achieving high", "bbox": {"l": 317.95499, "t": 558.59656, "r": 558.20062, "b": 566.97118, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "annotation consistency proved to be a key challenge in human", "bbox": {"l": 317.95499, "t": 569.55556, "r": 558.20416, "b": 577.9301800000001, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "annotation, as we outline in Section 4.", "bbox": {"l": 317.95499, "t": 580.51456, "r": 457.62469, "b": 588.88918, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "section_header", "bbox": {"l": 317.95499, "t": 606.84991, "r": 470.21326, "b": 617.15901, "coord_origin": "TOPLEFT"}, "confidence": 0.9422592520713806, "cells": [{"id": 128, "text": "4", "bbox": {"l": 317.95499, "t": 606.84991, "r": 323.56226, "b": 617.15901, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "ANNOTATION CAMPAIGN", "bbox": {"l": 334.47134, "t": 606.84991, "r": 470.21326, "b": 617.15901, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "text", "bbox": {"l": 317.686, "t": 631.97356, "r": 559.71381, "b": 706.102173, "coord_origin": "TOPLEFT"}, "confidence": 0.9863831996917725, "cells": [{"id": 130, "text": "The annotation campaign was carried out in four phases. In phase", "bbox": {"l": 317.686, "t": 631.97356, "r": 558.20148, "b": 640.34818, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "one, we identified and prepared the data sources for annotation.", "bbox": {"l": 317.95499, "t": 642.93256, "r": 559.58521, "b": 651.30717, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "In phase two, we determined the class labels and how annotations", "bbox": {"l": 317.95499, "t": 653.89156, "r": 558.20007, "b": 662.26617, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "should be done on the documents in order to obtain maximum con-", "bbox": {"l": 317.95499, "t": 664.85056, "r": 559.71375, "b": 673.22517, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "sistency. The latter was guided by a detailed requirement analysis", "bbox": {"l": 317.95499, "t": 675.80956, "r": 558.20233, "b": 684.18417, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "and exhaustive experiments. In phase three, we trained the annota-", "bbox": {"l": 317.95499, "t": 686.76855, "r": 559.71381, "b": 695.143173, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "tion staff and performed exams for quality assurance. In phase four,", "bbox": {"l": 317.95499, "t": 697.7275539999999, "r": 559.1864, "b": 706.102173, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_header", "id": 13, "page_no": 2, "cluster": {"id": 13, "label": "page_header", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.8919971585273743, "cells": [{"id": 0, "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis"}, {"label": "page_header", "id": 11, "page_no": 2, "cluster": {"id": 11, "label": "page_header", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.9104517102241516, "cells": [{"id": 1, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA"}, {"label": "picture", "id": 8, "page_no": 2, "cluster": {"id": 8, "label": "picture", "bbox": {"l": 88.33030700683594, "t": 92.88652038574219, "r": 263.7049560546875, "b": 220.56826782226562, "coord_origin": "TOPLEFT"}, "confidence": 0.9698190689086914, "cells": [{"id": 2, "text": "Patents", "bbox": {"l": 237.11293, "t": 133.08716000000004, "r": 262.97623, "b": 141.61419999999998, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "8%", "bbox": {"l": 202.87892, "t": 140.46178999999995, "r": 213.89999, "b": 148.98883, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Scientific", "bbox": {"l": 207.13306, "t": 93.1576500000001, "r": 237.64882999999998, "b": 101.68469000000005, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "17%", "bbox": {"l": 184.40349, "t": 118.68206999999995, "r": 199.66519, "b": 127.20911000000001, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Financial", "bbox": {"l": 88.288223, "t": 114.35473999999988, "r": 118.80401, "b": 122.88176999999985, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "32%", "bbox": {"l": 136.24422, "t": 130.24408000000005, "r": 151.50592, "b": 138.77112, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Tenders", "bbox": {"l": 93.973373, "t": 187.65765, "r": 121.11515, "b": 196.18469000000005, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "6%", "bbox": {"l": 139.6235, "t": 170.22748, "r": 150.64458, "b": 178.75451999999996, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Laws", "bbox": {"l": 139.88339, "t": 212.50036999999998, "r": 157.68491, "b": 221.02739999999994, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "16%", "bbox": {"l": 157.43983, "t": 183.77808000000005, "r": 172.70154, "b": 192.30511, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Manuals", "bbox": {"l": 225.47252, "t": 189.29656999999997, "r": 254.29510000000002, "b": 197.82361000000003, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "21%", "bbox": {"l": 194.40683, "t": 171.12145999999996, "r": 209.66853, "b": 179.6485, "coord_origin": "TOPLEFT"}}], "children": [{"id": 14, "label": "text", "bbox": {"l": 237.11293, "t": 133.08716000000004, "r": 262.97623, "b": 141.61419999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 2, "text": "Patents", "bbox": {"l": 237.11293, "t": 133.08716000000004, "r": 262.97623, "b": 141.61419999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 202.87892, "t": 140.46178999999995, "r": 213.89999, "b": 148.98883, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 3, "text": "8%", "bbox": {"l": 202.87892, "t": 140.46178999999995, "r": 213.89999, "b": 148.98883, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 207.13306, "t": 93.1576500000001, "r": 237.64882999999998, "b": 101.68469000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 4, "text": "Scientific", "bbox": {"l": 207.13306, "t": 93.1576500000001, "r": 237.64882999999998, "b": 101.68469000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 184.40349, "t": 118.68206999999995, "r": 199.66519, "b": 127.20911000000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 5, "text": "17%", "bbox": {"l": 184.40349, "t": 118.68206999999995, "r": 199.66519, "b": 127.20911000000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 88.288223, "t": 114.35473999999988, "r": 118.80401, "b": 122.88176999999985, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": "Financial", "bbox": {"l": 88.288223, "t": 114.35473999999988, "r": 118.80401, "b": 122.88176999999985, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 136.24422, "t": 130.24408000000005, "r": 151.50592, "b": 138.77112, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "32%", "bbox": {"l": 136.24422, "t": 130.24408000000005, "r": 151.50592, "b": 138.77112, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 93.973373, "t": 187.65765, "r": 121.11515, "b": 196.18469000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "Tenders", "bbox": {"l": 93.973373, "t": 187.65765, "r": 121.11515, "b": 196.18469000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 139.6235, "t": 170.22748, "r": 150.64458, "b": 178.75451999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "6%", "bbox": {"l": 139.6235, "t": 170.22748, "r": 150.64458, "b": 178.75451999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 139.88339, "t": 212.50036999999998, "r": 157.68491, "b": 221.02739999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "Laws", "bbox": {"l": 139.88339, "t": 212.50036999999998, "r": 157.68491, "b": 221.02739999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 157.43983, "t": 183.77808000000005, "r": 172.70154, "b": 192.30511, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "16%", "bbox": {"l": 157.43983, "t": 183.77808000000005, "r": 172.70154, "b": 192.30511, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 225.47252, "t": 189.29656999999997, "r": 254.29510000000002, "b": 197.82361000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "Manuals", "bbox": {"l": 225.47252, "t": 189.29656999999997, "r": 254.29510000000002, "b": 197.82361000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 194.40683, "t": 171.12145999999996, "r": 209.66853, "b": 179.6485, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "21%", "bbox": {"l": 194.40683, "t": 171.12145999999996, "r": 209.66853, "b": 179.6485, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "caption", "id": 9, "page_no": 2, "cluster": {"id": 9, "label": "caption", "bbox": {"l": 53.79800000000001, "t": 236.11499000000003, "r": 294.04373, "b": 255.54724, "coord_origin": "TOPLEFT"}, "confidence": 0.9425410628318787, "cells": [{"id": 14, "text": "Figure 2: Distribution of DocLayNet pages across document", "bbox": {"l": 53.79800000000001, "t": 236.11499000000003, "r": 294.04373, "b": 244.58826, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "categories.", "bbox": {"l": 53.79800000000001, "t": 247.07397000000003, "r": 96.756027, "b": 255.54724, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 2: Distribution of DocLayNet pages across document categories."}, {"label": "text", "id": 4, "page_no": 2, "cluster": {"id": 4, "label": "text", "bbox": {"l": 53.79800000000001, "t": 281.8035300000001, "r": 294.27383, "b": 366.89017, "coord_origin": "TOPLEFT"}, "confidence": 0.9866552352905273, "cells": [{"id": 16, "text": "to a minimum, since they introduce difficulties in annotation (see", "bbox": {"l": 53.79800000000001, "t": 281.8035300000001, "r": 294.04605, "b": 290.17815999999993, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "Section 4). As a second condition, we focussed on medium to large", "bbox": {"l": 53.79800000000001, "t": 292.76254, "r": 294.04868, "b": 301.13718, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "documents (", "bbox": {"l": 53.79800000000001, "t": 303.72153, "r": 98.881348, "b": 312.09616, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": ">", "bbox": {"l": 99.070999, "t": 306.07971, "r": 104.77363, "b": 310.08768, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "10", "bbox": {"l": 107.46399999999998, "t": 303.72153, "r": 115.83373999999999, "b": 312.09616, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "pages) with technical content, dense in complex", "bbox": {"l": 118.08366, "t": 303.72153, "r": 294.26233, "b": 312.09616, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "tables, figures, plots and captions. Such documents carry a lot of", "bbox": {"l": 53.79800000000001, "t": 314.68054, "r": 294.04715, "b": 323.05518, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "information value, but are often hard to analyse with high accuracy", "bbox": {"l": 53.79800000000001, "t": 325.63855, "r": 294.27383, "b": 334.01318, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "due to their challenging layouts. Counterexamples of documents", "bbox": {"l": 53.79800000000001, "t": 336.59753, "r": 294.0416, "b": 344.97217, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "not included in the dataset are receipts, invoices, hand-written", "bbox": {"l": 53.79800000000001, "t": 347.5565500000001, "r": 294.04712, "b": 355.9311799999999, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "documents or photographs showing \u201ctext in the wild\".", "bbox": {"l": 53.79800000000001, "t": 358.51553, "r": 251.73131, "b": 366.89017, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "to a minimum, since they introduce difficulties in annotation (see Section 4). As a second condition, we focussed on medium to large documents ( > 10 pages) with technical content, dense in complex tables, figures, plots and captions. Such documents carry a lot of information value, but are often hard to analyse with high accuracy due to their challenging layouts. Counterexamples of documents not included in the dataset are receipts, invoices, hand-written documents or photographs showing \u201ctext in the wild\"."}, {"label": "text", "id": 2, "page_no": 2, "cluster": {"id": 2, "label": "text", "bbox": {"l": 53.57400100000001, "t": 369.47455, "r": 295.56046, "b": 509.35617, "coord_origin": "TOPLEFT"}, "confidence": 0.987700879573822, "cells": [{"id": 27, "text": "The pages in DocLayNet can be grouped into six distinct cate-", "bbox": {"l": 63.76100199999999, "t": 369.47455, "r": 295.55945, "b": 377.84918, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "gories, namely", "bbox": {"l": 53.79800000000001, "t": 380.43353, "r": 105.90533, "b": 388.80816999999996, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Financial Reports", "bbox": {"l": 107.754, "t": 380.47838999999993, "r": 167.4973, "b": 388.81714, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": ",", "bbox": {"l": 167.496, "t": 380.43353, "r": 169.42915, "b": 388.80816999999996, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Manuals", "bbox": {"l": 171.28101, "t": 380.47838999999993, "r": 201.45581, "b": 388.81714, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": ",", "bbox": {"l": 201.455, "t": 380.43353, "r": 203.38815, "b": 388.80816999999996, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "Scientific Articles", "bbox": {"l": 205.24001, "t": 380.47838999999993, "r": 264.55273, "b": 388.81714, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": ",", "bbox": {"l": 264.54901, "t": 380.43353, "r": 266.48218, "b": 388.80816999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "Laws &", "bbox": {"l": 268.33401, "t": 380.47838999999993, "r": 294.36133, "b": 388.81714, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Regulations", "bbox": {"l": 53.79800000000001, "t": 391.43741000000006, "r": 94.899666, "b": 399.77615, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": ",", "bbox": {"l": 94.900002, "t": 391.39255, "r": 96.862747, "b": 399.76718, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "Patents", "bbox": {"l": 99.109001, "t": 391.43741000000006, "r": 124.72282, "b": 399.77615, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "and", "bbox": {"l": 127.17899999999999, "t": 391.39255, "r": 140.60596, "b": 399.76718, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "Government Tenders", "bbox": {"l": 142.853, "t": 391.43741000000006, "r": 215.15340000000003, "b": 399.77615, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": ". Each document cate-", "bbox": {"l": 215.15601000000004, "t": 391.39255, "r": 295.55716, "b": 399.76718, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "gory was sourced from various repositories. For example, Financial", "bbox": {"l": 53.79800000000001, "t": 402.3515300000001, "r": 294.04535, "b": 410.72617, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Reports contain both", "bbox": {"l": 53.79800000000001, "t": 413.31055, "r": 132.19516, "b": 421.68518000000006, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "free-style", "bbox": {"l": 134.528, "t": 413.35541, "r": 167.77272, "b": 421.69415, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "format annual reports", "bbox": {"l": 170.314, "t": 413.31055, "r": 252.36031, "b": 421.68518000000006, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "2", "bbox": {"l": 252.356, "t": 411.24283, "r": 255.73781, "b": 418.03555, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "which ex-", "bbox": {"l": 258.56601, "t": 413.31055, "r": 295.56046, "b": 421.68518000000006, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "pose company-specific, artistic layouts as well as the more formal", "bbox": {"l": 53.79800000000001, "t": 424.26953, "r": 294.04376, "b": 432.6441699999999, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "SEC filings. The two largest categories (", "bbox": {"l": 53.79800000000001, "t": 435.22754000000003, "r": 197.59023, "b": 443.60217, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Financial Reports", "bbox": {"l": 197.591, "t": 435.27240000000006, "r": 258.02774, "b": 443.61115, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "and", "bbox": {"l": 260.48901, "t": 435.22754000000003, "r": 273.78104, "b": 443.60217, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Man-", "bbox": {"l": 276.03201, "t": 435.27240000000006, "r": 294.94113, "b": 443.61115, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "uals", "bbox": {"l": 53.79800000000001, "t": 446.23138, "r": 68.085777, "b": 454.57013, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": ") contain a large amount of free-style layouts in order to obtain", "bbox": {"l": 68.296997, "t": 446.18652, "r": 294.04565, "b": 454.56116, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "maximum variability. In the other four categories, we boosted the", "bbox": {"l": 53.79800000000001, "t": 457.14554, "r": 294.04163, "b": 465.52017, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "variability by mixing documents from independent providers, such", "bbox": {"l": 53.57400100000001, "t": 468.10455, "r": 294.04889, "b": 476.47919, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "as different government websites or publishers. In Figure 2, we", "bbox": {"l": 53.79800000000001, "t": 479.06354, "r": 294.04715, "b": 487.43817, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "show the document categories contained in DocLayNet with their", "bbox": {"l": 53.79800000000001, "t": 490.02255, "r": 294.21643, "b": 498.39719, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "respective sizes.", "bbox": {"l": 53.79800000000001, "t": 500.98154, "r": 112.2948, "b": 509.35617, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The pages in DocLayNet can be grouped into six distinct categories, namely Financial Reports , Manuals , Scientific Articles , Laws & Regulations , Patents and Government Tenders . Each document category was sourced from various repositories. For example, Financial Reports contain both free-style format annual reports 2 which expose company-specific, artistic layouts as well as the more formal SEC filings. The two largest categories ( Financial Reports and Manuals ) contain a large amount of free-style layouts in order to obtain maximum variability. In the other four categories, we boosted the variability by mixing documents from independent providers, such as different government websites or publishers. In Figure 2, we show the document categories contained in DocLayNet with their respective sizes."}, {"label": "text", "id": 1, "page_no": 2, "cluster": {"id": 1, "label": "text", "bbox": {"l": 53.466999, "t": 511.94055, "r": 295.56155, "b": 607.98618, "coord_origin": "TOPLEFT"}, "confidence": 0.9877581000328064, "cells": [{"id": 60, "text": "We did not control the document selection with regard to lan-", "bbox": {"l": 63.76100199999999, "t": 511.94055, "r": 295.55954, "b": 520.31519, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "guage. The vast majority of documents contained in DocLayNet", "bbox": {"l": 53.79800000000001, "t": 522.89954, "r": 294.04718, "b": 531.27417, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "(close to 95%) are published in English language. However, Do-", "bbox": {"l": 53.528999, "t": 533.8585499999999, "r": 295.56155, "b": 542.23317, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "cLayNet also contains a number of documents in other languages", "bbox": {"l": 53.79800000000001, "t": 544.81755, "r": 294.04144, "b": 553.19217, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "such as German (2.5%), French (1.0%) and Japanese (1.0%). While", "bbox": {"l": 53.79800000000001, "t": 555.77556, "r": 294.04709, "b": 564.15018, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "the document language has negligible impact on the performance", "bbox": {"l": 53.79800000000001, "t": 566.73456, "r": 294.04163, "b": 575.10918, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "of computer vision methods such as object detection and segmenta-", "bbox": {"l": 53.79800000000001, "t": 577.6935599999999, "r": 295.5567, "b": 586.06818, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "tion models, it might prove challenging for layout analysis methods", "bbox": {"l": 53.79800000000001, "t": 588.65256, "r": 294.04541, "b": 597.02718, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "which exploit textual features.", "bbox": {"l": 53.466999, "t": 599.61156, "r": 164.39928, "b": 607.98618, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "We did not control the document selection with regard to language. The vast majority of documents contained in DocLayNet (close to 95%) are published in English language. However, DocLayNet also contains a number of documents in other languages such as German (2.5%), French (1.0%) and Japanese (1.0%). While the document language has negligible impact on the performance of computer vision methods such as object detection and segmentation models, it might prove challenging for layout analysis methods which exploit textual features."}, {"label": "text", "id": 0, "page_no": 2, "cluster": {"id": 0, "label": "text", "bbox": {"l": 53.79800000000001, "t": 610.57056, "r": 295.56396, "b": 684.69817, "coord_origin": "TOPLEFT"}, "confidence": 0.9880735278129578, "cells": [{"id": 69, "text": "To ensure that future benchmarks in the document-layout analy-", "bbox": {"l": 63.76100199999999, "t": 610.57056, "r": 295.56396, "b": 618.9451799999999, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "sis community can be easily compared, we have split up DocLayNet", "bbox": {"l": 53.79800000000001, "t": 621.52956, "r": 294.04532, "b": 629.90417, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "into pre-defined train-, test- and validation-sets. In this way, we can", "bbox": {"l": 53.79800000000001, "t": 632.48856, "r": 294.04538, "b": 640.86317, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "avoid spurious variations in the evaluation scores due to random", "bbox": {"l": 53.79800000000001, "t": 643.4475600000001, "r": 294.04315, "b": 651.82217, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "splitting in train-, test- and validation-sets. We also ensured that", "bbox": {"l": 53.79800000000001, "t": 654.40656, "r": 294.04712, "b": 662.78117, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "less frequent labels are represented in train and test sets in equal", "bbox": {"l": 53.79800000000001, "t": 665.36456, "r": 294.04333, "b": 673.7391700000001, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "proportions.", "bbox": {"l": 53.79800000000001, "t": 676.32355, "r": 98.916931, "b": 684.69817, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "To ensure that future benchmarks in the document-layout analysis community can be easily compared, we have split up DocLayNet into pre-defined train-, test- and validation-sets. In this way, we can avoid spurious variations in the evaluation scores due to random splitting in train-, test- and validation-sets. We also ensured that less frequent labels are represented in train and test sets in equal proportions."}, {"label": "footnote", "id": 12, "page_no": 2, "cluster": {"id": 12, "label": "footnote", "bbox": {"l": 53.79800000000001, "t": 701.6563639999999, "r": 195.78998, "b": 708.169891, "coord_origin": "TOPLEFT"}, "confidence": 0.9048352241516113, "cells": [{"id": 76, "text": "$^{2}$e.g. AAPL from https://www.annualreports.com/", "bbox": {"l": 53.79800000000001, "t": 701.6563639999999, "r": 195.78998, "b": 708.169891, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "$^{2}$e.g. AAPL from https://www.annualreports.com/"}, {"label": "text", "id": 3, "page_no": 2, "cluster": {"id": 3, "label": "text", "bbox": {"l": 317.62299, "t": 87.36352999999997, "r": 559.19183, "b": 161.49114999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.986920952796936, "cells": [{"id": 77, "text": "Table 1 shows the overall frequency and distribution of the labels", "bbox": {"l": 327.918, "t": 87.36352999999997, "r": 558.20093, "b": 95.73816, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "among the different sets. Importantly, we ensure that subsets are", "bbox": {"l": 317.95499, "t": 98.32250999999997, "r": 558.20013, "b": 106.69713999999999, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "only split on full-document boundaries. This avoids that pages of", "bbox": {"l": 317.95499, "t": 109.28156000000001, "r": 558.20056, "b": 117.65618999999992, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "the same document are spread over train, test and validation set,", "bbox": {"l": 317.95499, "t": 120.24054000000001, "r": 559.19183, "b": 128.61517000000003, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "which can give an undesired evaluation advantage to models and", "bbox": {"l": 317.62299, "t": 131.19854999999995, "r": 558.20349, "b": 139.57317999999998, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "lead to overestimation of their prediction accuracy. We will show", "bbox": {"l": 317.95499, "t": 142.15752999999995, "r": 558.52936, "b": 150.53216999999995, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "the impact of this decision in Section 5.", "bbox": {"l": 317.95499, "t": 153.11652000000004, "r": 461.6416, "b": 161.49114999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 1 shows the overall frequency and distribution of the labels among the different sets. Importantly, we ensure that subsets are only split on full-document boundaries. This avoids that pages of the same document are spread over train, test and validation set, which can give an undesired evaluation advantage to models and lead to overestimation of their prediction accuracy. We will show the impact of this decision in Section 5."}, {"label": "text", "id": 6, "page_no": 2, "cluster": {"id": 6, "label": "text", "bbox": {"l": 317.95499, "t": 164.07556, "r": 558.43811, "b": 271.0802, "coord_origin": "TOPLEFT"}, "confidence": 0.9860605001449585, "cells": [{"id": 84, "text": "In order to accommodate the different types of models currently", "bbox": {"l": 327.918, "t": 164.07556, "r": 558.43811, "b": 172.4502, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "in use by the community, we provide DocLayNet in an", "bbox": {"l": 317.95499, "t": 175.03454999999997, "r": 516.8219, "b": 183.40918, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "augmented", "bbox": {"l": 519.07501, "t": 175.07941000000005, "r": 558.20135, "b": 183.41814999999997, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "COCO format [16]. This entails the standard COCO ground-truth", "bbox": {"l": 317.95499, "t": 185.99352999999996, "r": 558.20325, "b": 194.36816, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "file (in JSON format) with the associated page images (in PNG", "bbox": {"l": 317.95499, "t": 196.95250999999996, "r": 558.20404, "b": 205.32714999999996, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "format, 1025", "bbox": {"l": 317.95499, "t": 207.91156, "r": 364.28769, "b": 216.28619000000003, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "\u00d7", "bbox": {"l": 364.28699, "t": 207.85779000000002, "r": 369.98962, "b": 215.55993999999998, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "1025 pixels). Furthermore, custom fields have been", "bbox": {"l": 369.98999, "t": 207.91156, "r": 558.20526, "b": 216.28619000000003, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "added to each COCO record to specify document category, original", "bbox": {"l": 317.95499, "t": 218.87054, "r": 558.20251, "b": 227.24518, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "document filename and page number. In addition, we also provide", "bbox": {"l": 317.95499, "t": 229.82952999999998, "r": 558.203, "b": 238.20416, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "the original PDF pages, as well as sidecar files containing parsed", "bbox": {"l": 317.95499, "t": 240.78754000000004, "r": 558.20404, "b": 249.16216999999995, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "PDF text and text-cell coordinates (in JSON). All additional files are", "bbox": {"l": 317.95499, "t": 251.74652000000003, "r": 558.20227, "b": 260.12114999999994, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "linked to the primary page images by their matching filenames.", "bbox": {"l": 317.95499, "t": 262.70556999999997, "r": 550.36414, "b": 271.0802, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In order to accommodate the different types of models currently in use by the community, we provide DocLayNet in an augmented COCO format [16]. This entails the standard COCO ground-truth file (in JSON format) with the associated page images (in PNG format, 1025 \u00d7 1025 pixels). Furthermore, custom fields have been added to each COCO record to specify document category, original document filename and page number. In addition, we also provide the original PDF pages, as well as sidecar files containing parsed PDF text and text-cell coordinates (in JSON). All additional files are linked to the primary page images by their matching filenames."}, {"label": "text", "id": 7, "page_no": 2, "cluster": {"id": 7, "label": "text", "bbox": {"l": 316.94199, "t": 273.66454999999996, "r": 559.72156, "b": 588.88918, "coord_origin": "TOPLEFT"}, "confidence": 0.9853296875953674, "cells": [{"id": 97, "text": "Despite being cost-intense and far less scalable than automation,", "bbox": {"l": 327.918, "t": 273.66454999999996, "r": 559.18488, "b": 282.03918, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "human annotation has several benefits over automated ground-", "bbox": {"l": 317.95499, "t": 284.62354, "r": 559.7132, "b": 292.99817, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "truth generation. The first and most obvious reason to leverage", "bbox": {"l": 317.95499, "t": 295.5825500000001, "r": 558.20416, "b": 303.95717999999994, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "human annotations is the freedom to annotate any type of doc-", "bbox": {"l": 317.95499, "t": 306.54153, "r": 559.71326, "b": 314.91617, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "ument without requiring a programmatic source. For most PDF", "bbox": {"l": 317.95499, "t": 317.50055, "r": 558.41443, "b": 325.87518, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "documents, the original source document is not available. The lat-", "bbox": {"l": 317.95499, "t": 328.4595299999999, "r": 559.71545, "b": 336.83417, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "ter is not a hard constraint with human annotation, but it is for", "bbox": {"l": 317.95499, "t": 339.41855000000004, "r": 558.36865, "b": 347.79318, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "automated methods. A second reason to use human annotations is", "bbox": {"l": 317.95499, "t": 350.37753, "r": 558.20062, "b": 358.75217, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "that the latter usually provide a more natural interpretation of the", "bbox": {"l": 317.95499, "t": 361.33554, "r": 558.20184, "b": 369.71017, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "page layout. The human-interpreted layout can significantly devi-", "bbox": {"l": 317.95499, "t": 372.29453, "r": 559.71442, "b": 380.66916, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "ate from the programmatic layout used in typesetting. For example,", "bbox": {"l": 317.95499, "t": 383.25354, "r": 559.1864, "b": 391.62817, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "\u201cinvisible\u201d tables might be used solely for aligning text paragraphs", "bbox": {"l": 316.94199, "t": 394.21252, "r": 558.20111, "b": 402.58716, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "on columns. Such typesetting tricks might be interpreted by au-", "bbox": {"l": 317.95499, "t": 405.17154, "r": 559.7132, "b": 413.54617, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "tomated methods incorrectly as an actual table, while the human", "bbox": {"l": 317.95499, "t": 416.13052, "r": 558.20013, "b": 424.50515999999993, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "annotation will interpret it correctly as", "bbox": {"l": 317.95499, "t": 427.08953999999994, "r": 464.50613, "b": 435.46417, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "Text", "bbox": {"l": 466.98199000000005, "t": 427.13439999999997, "r": 482.14560000000006, "b": 435.47313999999994, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "or other styles. The", "bbox": {"l": 485.13199000000003, "t": 427.08953999999994, "r": 558.19727, "b": 435.46417, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "same applies to multi-line text elements, when authors decided to", "bbox": {"l": 317.95499, "t": 438.04855, "r": 558.20221, "b": 446.4231899999999, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "space them as \u201cinvisible\u201d list elements without bullet symbols. A", "bbox": {"l": 317.95499, "t": 449.00754, "r": 558.51501, "b": 457.38217, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "third reason to gather ground-truth through human annotation is", "bbox": {"l": 317.95499, "t": 459.96655000000004, "r": 558.19855, "b": 468.34119, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "to estimate a \u201cnatural\u201d upper bound on the segmentation accuracy.", "bbox": {"l": 317.95499, "t": 470.92453, "r": 559.58215, "b": 479.29916, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "As we will show in Section 4, certain documents featuring complex", "bbox": {"l": 317.64099, "t": 481.88354, "r": 558.41559, "b": 490.25818, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "layouts can have different but equally acceptable layout interpre-", "bbox": {"l": 317.95499, "t": 492.84253, "r": 559.72156, "b": 501.21716, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "tations. This natural upper bound for segmentation accuracy can", "bbox": {"l": 317.95499, "t": 503.80154, "r": 558.19928, "b": 512.1761799999999, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "be found by annotating the same pages multiple times by different", "bbox": {"l": 317.95499, "t": 514.76053, "r": 558.20581, "b": 523.13516, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "people and evaluating the inter-annotator agreement. Such a base-", "bbox": {"l": 317.95499, "t": 525.71954, "r": 559.71729, "b": 534.09418, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "line consistency evaluation is very useful to define expectations", "bbox": {"l": 317.95499, "t": 536.6785600000001, "r": 558.20404, "b": 545.05318, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "for a good target accuracy in trained deep neural network models", "bbox": {"l": 317.95499, "t": 547.63756, "r": 558.20074, "b": 556.01218, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "and avoid overfitting (see Table 1). On the flip side, achieving high", "bbox": {"l": 317.95499, "t": 558.59656, "r": 558.20062, "b": 566.97118, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "annotation consistency proved to be a key challenge in human", "bbox": {"l": 317.95499, "t": 569.55556, "r": 558.20416, "b": 577.9301800000001, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "annotation, as we outline in Section 4.", "bbox": {"l": 317.95499, "t": 580.51456, "r": 457.62469, "b": 588.88918, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Despite being cost-intense and far less scalable than automation, human annotation has several benefits over automated groundtruth generation. The first and most obvious reason to leverage human annotations is the freedom to annotate any type of document without requiring a programmatic source. For most PDF documents, the original source document is not available. The latter is not a hard constraint with human annotation, but it is for automated methods. A second reason to use human annotations is that the latter usually provide a more natural interpretation of the page layout. The human-interpreted layout can significantly deviate from the programmatic layout used in typesetting. For example, \u201cinvisible\u201d tables might be used solely for aligning text paragraphs on columns. Such typesetting tricks might be interpreted by automated methods incorrectly as an actual table, while the human annotation will interpret it correctly as Text or other styles. The same applies to multi-line text elements, when authors decided to space them as \u201cinvisible\u201d list elements without bullet symbols. A third reason to gather ground-truth through human annotation is to estimate a \u201cnatural\u201d upper bound on the segmentation accuracy. As we will show in Section 4, certain documents featuring complex layouts can have different but equally acceptable layout interpretations. This natural upper bound for segmentation accuracy can be found by annotating the same pages multiple times by different people and evaluating the inter-annotator agreement. Such a baseline consistency evaluation is very useful to define expectations for a good target accuracy in trained deep neural network models and avoid overfitting (see Table 1). On the flip side, achieving high annotation consistency proved to be a key challenge in human annotation, as we outline in Section 4."}, {"label": "section_header", "id": 10, "page_no": 2, "cluster": {"id": 10, "label": "section_header", "bbox": {"l": 317.95499, "t": 606.84991, "r": 470.21326, "b": 617.15901, "coord_origin": "TOPLEFT"}, "confidence": 0.9422592520713806, "cells": [{"id": 128, "text": "4", "bbox": {"l": 317.95499, "t": 606.84991, "r": 323.56226, "b": 617.15901, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "ANNOTATION CAMPAIGN", "bbox": {"l": 334.47134, "t": 606.84991, "r": 470.21326, "b": 617.15901, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4 ANNOTATION CAMPAIGN"}, {"label": "text", "id": 5, "page_no": 2, "cluster": {"id": 5, "label": "text", "bbox": {"l": 317.686, "t": 631.97356, "r": 559.71381, "b": 706.102173, "coord_origin": "TOPLEFT"}, "confidence": 0.9863831996917725, "cells": [{"id": 130, "text": "The annotation campaign was carried out in four phases. In phase", "bbox": {"l": 317.686, "t": 631.97356, "r": 558.20148, "b": 640.34818, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "one, we identified and prepared the data sources for annotation.", "bbox": {"l": 317.95499, "t": 642.93256, "r": 559.58521, "b": 651.30717, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "In phase two, we determined the class labels and how annotations", "bbox": {"l": 317.95499, "t": 653.89156, "r": 558.20007, "b": 662.26617, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "should be done on the documents in order to obtain maximum con-", "bbox": {"l": 317.95499, "t": 664.85056, "r": 559.71375, "b": 673.22517, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "sistency. The latter was guided by a detailed requirement analysis", "bbox": {"l": 317.95499, "t": 675.80956, "r": 558.20233, "b": 684.18417, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "and exhaustive experiments. In phase three, we trained the annota-", "bbox": {"l": 317.95499, "t": 686.76855, "r": 559.71381, "b": 695.143173, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "tion staff and performed exams for quality assurance. In phase four,", "bbox": {"l": 317.95499, "t": 697.7275539999999, "r": 559.1864, "b": 706.102173, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The annotation campaign was carried out in four phases. In phase one, we identified and prepared the data sources for annotation. In phase two, we determined the class labels and how annotations should be done on the documents in order to obtain maximum consistency. The latter was guided by a detailed requirement analysis and exhaustive experiments. In phase three, we trained the annotation staff and performed exams for quality assurance. In phase four,"}], "body": [{"label": "picture", "id": 8, "page_no": 2, "cluster": {"id": 8, "label": "picture", "bbox": {"l": 88.33030700683594, "t": 92.88652038574219, "r": 263.7049560546875, "b": 220.56826782226562, "coord_origin": "TOPLEFT"}, "confidence": 0.9698190689086914, "cells": [{"id": 2, "text": "Patents", "bbox": {"l": 237.11293, "t": 133.08716000000004, "r": 262.97623, "b": 141.61419999999998, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "8%", "bbox": {"l": 202.87892, "t": 140.46178999999995, "r": 213.89999, "b": 148.98883, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Scientific", "bbox": {"l": 207.13306, "t": 93.1576500000001, "r": 237.64882999999998, "b": 101.68469000000005, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "17%", "bbox": {"l": 184.40349, "t": 118.68206999999995, "r": 199.66519, "b": 127.20911000000001, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Financial", "bbox": {"l": 88.288223, "t": 114.35473999999988, "r": 118.80401, "b": 122.88176999999985, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "32%", "bbox": {"l": 136.24422, "t": 130.24408000000005, "r": 151.50592, "b": 138.77112, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Tenders", "bbox": {"l": 93.973373, "t": 187.65765, "r": 121.11515, "b": 196.18469000000005, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "6%", "bbox": {"l": 139.6235, "t": 170.22748, "r": 150.64458, "b": 178.75451999999996, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Laws", "bbox": {"l": 139.88339, "t": 212.50036999999998, "r": 157.68491, "b": 221.02739999999994, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "16%", "bbox": {"l": 157.43983, "t": 183.77808000000005, "r": 172.70154, "b": 192.30511, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Manuals", "bbox": {"l": 225.47252, "t": 189.29656999999997, "r": 254.29510000000002, "b": 197.82361000000003, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "21%", "bbox": {"l": 194.40683, "t": 171.12145999999996, "r": 209.66853, "b": 179.6485, "coord_origin": "TOPLEFT"}}], "children": [{"id": 14, "label": "text", "bbox": {"l": 237.11293, "t": 133.08716000000004, "r": 262.97623, "b": 141.61419999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 2, "text": "Patents", "bbox": {"l": 237.11293, "t": 133.08716000000004, "r": 262.97623, "b": 141.61419999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 202.87892, "t": 140.46178999999995, "r": 213.89999, "b": 148.98883, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 3, "text": "8%", "bbox": {"l": 202.87892, "t": 140.46178999999995, "r": 213.89999, "b": 148.98883, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 207.13306, "t": 93.1576500000001, "r": 237.64882999999998, "b": 101.68469000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 4, "text": "Scientific", "bbox": {"l": 207.13306, "t": 93.1576500000001, "r": 237.64882999999998, "b": 101.68469000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 184.40349, "t": 118.68206999999995, "r": 199.66519, "b": 127.20911000000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 5, "text": "17%", "bbox": {"l": 184.40349, "t": 118.68206999999995, "r": 199.66519, "b": 127.20911000000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 88.288223, "t": 114.35473999999988, "r": 118.80401, "b": 122.88176999999985, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": "Financial", "bbox": {"l": 88.288223, "t": 114.35473999999988, "r": 118.80401, "b": 122.88176999999985, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 136.24422, "t": 130.24408000000005, "r": 151.50592, "b": 138.77112, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "32%", "bbox": {"l": 136.24422, "t": 130.24408000000005, "r": 151.50592, "b": 138.77112, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 93.973373, "t": 187.65765, "r": 121.11515, "b": 196.18469000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "Tenders", "bbox": {"l": 93.973373, "t": 187.65765, "r": 121.11515, "b": 196.18469000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 139.6235, "t": 170.22748, "r": 150.64458, "b": 178.75451999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "6%", "bbox": {"l": 139.6235, "t": 170.22748, "r": 150.64458, "b": 178.75451999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 139.88339, "t": 212.50036999999998, "r": 157.68491, "b": 221.02739999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "Laws", "bbox": {"l": 139.88339, "t": 212.50036999999998, "r": 157.68491, "b": 221.02739999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 157.43983, "t": 183.77808000000005, "r": 172.70154, "b": 192.30511, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "16%", "bbox": {"l": 157.43983, "t": 183.77808000000005, "r": 172.70154, "b": 192.30511, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 225.47252, "t": 189.29656999999997, "r": 254.29510000000002, "b": 197.82361000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "Manuals", "bbox": {"l": 225.47252, "t": 189.29656999999997, "r": 254.29510000000002, "b": 197.82361000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 194.40683, "t": 171.12145999999996, "r": 209.66853, "b": 179.6485, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "21%", "bbox": {"l": 194.40683, "t": 171.12145999999996, "r": 209.66853, "b": 179.6485, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "caption", "id": 9, "page_no": 2, "cluster": {"id": 9, "label": "caption", "bbox": {"l": 53.79800000000001, "t": 236.11499000000003, "r": 294.04373, "b": 255.54724, "coord_origin": "TOPLEFT"}, "confidence": 0.9425410628318787, "cells": [{"id": 14, "text": "Figure 2: Distribution of DocLayNet pages across document", "bbox": {"l": 53.79800000000001, "t": 236.11499000000003, "r": 294.04373, "b": 244.58826, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "categories.", "bbox": {"l": 53.79800000000001, "t": 247.07397000000003, "r": 96.756027, "b": 255.54724, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 2: Distribution of DocLayNet pages across document categories."}, {"label": "text", "id": 4, "page_no": 2, "cluster": {"id": 4, "label": "text", "bbox": {"l": 53.79800000000001, "t": 281.8035300000001, "r": 294.27383, "b": 366.89017, "coord_origin": "TOPLEFT"}, "confidence": 0.9866552352905273, "cells": [{"id": 16, "text": "to a minimum, since they introduce difficulties in annotation (see", "bbox": {"l": 53.79800000000001, "t": 281.8035300000001, "r": 294.04605, "b": 290.17815999999993, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "Section 4). As a second condition, we focussed on medium to large", "bbox": {"l": 53.79800000000001, "t": 292.76254, "r": 294.04868, "b": 301.13718, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "documents (", "bbox": {"l": 53.79800000000001, "t": 303.72153, "r": 98.881348, "b": 312.09616, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": ">", "bbox": {"l": 99.070999, "t": 306.07971, "r": 104.77363, "b": 310.08768, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "10", "bbox": {"l": 107.46399999999998, "t": 303.72153, "r": 115.83373999999999, "b": 312.09616, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "pages) with technical content, dense in complex", "bbox": {"l": 118.08366, "t": 303.72153, "r": 294.26233, "b": 312.09616, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "tables, figures, plots and captions. Such documents carry a lot of", "bbox": {"l": 53.79800000000001, "t": 314.68054, "r": 294.04715, "b": 323.05518, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "information value, but are often hard to analyse with high accuracy", "bbox": {"l": 53.79800000000001, "t": 325.63855, "r": 294.27383, "b": 334.01318, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "due to their challenging layouts. Counterexamples of documents", "bbox": {"l": 53.79800000000001, "t": 336.59753, "r": 294.0416, "b": 344.97217, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "not included in the dataset are receipts, invoices, hand-written", "bbox": {"l": 53.79800000000001, "t": 347.5565500000001, "r": 294.04712, "b": 355.9311799999999, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "documents or photographs showing \u201ctext in the wild\".", "bbox": {"l": 53.79800000000001, "t": 358.51553, "r": 251.73131, "b": 366.89017, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "to a minimum, since they introduce difficulties in annotation (see Section 4). As a second condition, we focussed on medium to large documents ( > 10 pages) with technical content, dense in complex tables, figures, plots and captions. Such documents carry a lot of information value, but are often hard to analyse with high accuracy due to their challenging layouts. Counterexamples of documents not included in the dataset are receipts, invoices, hand-written documents or photographs showing \u201ctext in the wild\"."}, {"label": "text", "id": 2, "page_no": 2, "cluster": {"id": 2, "label": "text", "bbox": {"l": 53.57400100000001, "t": 369.47455, "r": 295.56046, "b": 509.35617, "coord_origin": "TOPLEFT"}, "confidence": 0.987700879573822, "cells": [{"id": 27, "text": "The pages in DocLayNet can be grouped into six distinct cate-", "bbox": {"l": 63.76100199999999, "t": 369.47455, "r": 295.55945, "b": 377.84918, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "gories, namely", "bbox": {"l": 53.79800000000001, "t": 380.43353, "r": 105.90533, "b": 388.80816999999996, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Financial Reports", "bbox": {"l": 107.754, "t": 380.47838999999993, "r": 167.4973, "b": 388.81714, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": ",", "bbox": {"l": 167.496, "t": 380.43353, "r": 169.42915, "b": 388.80816999999996, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Manuals", "bbox": {"l": 171.28101, "t": 380.47838999999993, "r": 201.45581, "b": 388.81714, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": ",", "bbox": {"l": 201.455, "t": 380.43353, "r": 203.38815, "b": 388.80816999999996, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "Scientific Articles", "bbox": {"l": 205.24001, "t": 380.47838999999993, "r": 264.55273, "b": 388.81714, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": ",", "bbox": {"l": 264.54901, "t": 380.43353, "r": 266.48218, "b": 388.80816999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "Laws &", "bbox": {"l": 268.33401, "t": 380.47838999999993, "r": 294.36133, "b": 388.81714, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Regulations", "bbox": {"l": 53.79800000000001, "t": 391.43741000000006, "r": 94.899666, "b": 399.77615, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": ",", "bbox": {"l": 94.900002, "t": 391.39255, "r": 96.862747, "b": 399.76718, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "Patents", "bbox": {"l": 99.109001, "t": 391.43741000000006, "r": 124.72282, "b": 399.77615, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "and", "bbox": {"l": 127.17899999999999, "t": 391.39255, "r": 140.60596, "b": 399.76718, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "Government Tenders", "bbox": {"l": 142.853, "t": 391.43741000000006, "r": 215.15340000000003, "b": 399.77615, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": ". Each document cate-", "bbox": {"l": 215.15601000000004, "t": 391.39255, "r": 295.55716, "b": 399.76718, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "gory was sourced from various repositories. For example, Financial", "bbox": {"l": 53.79800000000001, "t": 402.3515300000001, "r": 294.04535, "b": 410.72617, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Reports contain both", "bbox": {"l": 53.79800000000001, "t": 413.31055, "r": 132.19516, "b": 421.68518000000006, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "free-style", "bbox": {"l": 134.528, "t": 413.35541, "r": 167.77272, "b": 421.69415, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "format annual reports", "bbox": {"l": 170.314, "t": 413.31055, "r": 252.36031, "b": 421.68518000000006, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "2", "bbox": {"l": 252.356, "t": 411.24283, "r": 255.73781, "b": 418.03555, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "which ex-", "bbox": {"l": 258.56601, "t": 413.31055, "r": 295.56046, "b": 421.68518000000006, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "pose company-specific, artistic layouts as well as the more formal", "bbox": {"l": 53.79800000000001, "t": 424.26953, "r": 294.04376, "b": 432.6441699999999, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "SEC filings. The two largest categories (", "bbox": {"l": 53.79800000000001, "t": 435.22754000000003, "r": 197.59023, "b": 443.60217, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Financial Reports", "bbox": {"l": 197.591, "t": 435.27240000000006, "r": 258.02774, "b": 443.61115, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "and", "bbox": {"l": 260.48901, "t": 435.22754000000003, "r": 273.78104, "b": 443.60217, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Man-", "bbox": {"l": 276.03201, "t": 435.27240000000006, "r": 294.94113, "b": 443.61115, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "uals", "bbox": {"l": 53.79800000000001, "t": 446.23138, "r": 68.085777, "b": 454.57013, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": ") contain a large amount of free-style layouts in order to obtain", "bbox": {"l": 68.296997, "t": 446.18652, "r": 294.04565, "b": 454.56116, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "maximum variability. In the other four categories, we boosted the", "bbox": {"l": 53.79800000000001, "t": 457.14554, "r": 294.04163, "b": 465.52017, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "variability by mixing documents from independent providers, such", "bbox": {"l": 53.57400100000001, "t": 468.10455, "r": 294.04889, "b": 476.47919, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "as different government websites or publishers. In Figure 2, we", "bbox": {"l": 53.79800000000001, "t": 479.06354, "r": 294.04715, "b": 487.43817, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "show the document categories contained in DocLayNet with their", "bbox": {"l": 53.79800000000001, "t": 490.02255, "r": 294.21643, "b": 498.39719, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "respective sizes.", "bbox": {"l": 53.79800000000001, "t": 500.98154, "r": 112.2948, "b": 509.35617, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The pages in DocLayNet can be grouped into six distinct categories, namely Financial Reports , Manuals , Scientific Articles , Laws & Regulations , Patents and Government Tenders . Each document category was sourced from various repositories. For example, Financial Reports contain both free-style format annual reports 2 which expose company-specific, artistic layouts as well as the more formal SEC filings. The two largest categories ( Financial Reports and Manuals ) contain a large amount of free-style layouts in order to obtain maximum variability. In the other four categories, we boosted the variability by mixing documents from independent providers, such as different government websites or publishers. In Figure 2, we show the document categories contained in DocLayNet with their respective sizes."}, {"label": "text", "id": 1, "page_no": 2, "cluster": {"id": 1, "label": "text", "bbox": {"l": 53.466999, "t": 511.94055, "r": 295.56155, "b": 607.98618, "coord_origin": "TOPLEFT"}, "confidence": 0.9877581000328064, "cells": [{"id": 60, "text": "We did not control the document selection with regard to lan-", "bbox": {"l": 63.76100199999999, "t": 511.94055, "r": 295.55954, "b": 520.31519, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "guage. The vast majority of documents contained in DocLayNet", "bbox": {"l": 53.79800000000001, "t": 522.89954, "r": 294.04718, "b": 531.27417, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "(close to 95%) are published in English language. However, Do-", "bbox": {"l": 53.528999, "t": 533.8585499999999, "r": 295.56155, "b": 542.23317, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "cLayNet also contains a number of documents in other languages", "bbox": {"l": 53.79800000000001, "t": 544.81755, "r": 294.04144, "b": 553.19217, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "such as German (2.5%), French (1.0%) and Japanese (1.0%). While", "bbox": {"l": 53.79800000000001, "t": 555.77556, "r": 294.04709, "b": 564.15018, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "the document language has negligible impact on the performance", "bbox": {"l": 53.79800000000001, "t": 566.73456, "r": 294.04163, "b": 575.10918, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "of computer vision methods such as object detection and segmenta-", "bbox": {"l": 53.79800000000001, "t": 577.6935599999999, "r": 295.5567, "b": 586.06818, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "tion models, it might prove challenging for layout analysis methods", "bbox": {"l": 53.79800000000001, "t": 588.65256, "r": 294.04541, "b": 597.02718, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "which exploit textual features.", "bbox": {"l": 53.466999, "t": 599.61156, "r": 164.39928, "b": 607.98618, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "We did not control the document selection with regard to language. The vast majority of documents contained in DocLayNet (close to 95%) are published in English language. However, DocLayNet also contains a number of documents in other languages such as German (2.5%), French (1.0%) and Japanese (1.0%). While the document language has negligible impact on the performance of computer vision methods such as object detection and segmentation models, it might prove challenging for layout analysis methods which exploit textual features."}, {"label": "text", "id": 0, "page_no": 2, "cluster": {"id": 0, "label": "text", "bbox": {"l": 53.79800000000001, "t": 610.57056, "r": 295.56396, "b": 684.69817, "coord_origin": "TOPLEFT"}, "confidence": 0.9880735278129578, "cells": [{"id": 69, "text": "To ensure that future benchmarks in the document-layout analy-", "bbox": {"l": 63.76100199999999, "t": 610.57056, "r": 295.56396, "b": 618.9451799999999, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "sis community can be easily compared, we have split up DocLayNet", "bbox": {"l": 53.79800000000001, "t": 621.52956, "r": 294.04532, "b": 629.90417, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "into pre-defined train-, test- and validation-sets. In this way, we can", "bbox": {"l": 53.79800000000001, "t": 632.48856, "r": 294.04538, "b": 640.86317, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "avoid spurious variations in the evaluation scores due to random", "bbox": {"l": 53.79800000000001, "t": 643.4475600000001, "r": 294.04315, "b": 651.82217, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "splitting in train-, test- and validation-sets. We also ensured that", "bbox": {"l": 53.79800000000001, "t": 654.40656, "r": 294.04712, "b": 662.78117, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "less frequent labels are represented in train and test sets in equal", "bbox": {"l": 53.79800000000001, "t": 665.36456, "r": 294.04333, "b": 673.7391700000001, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "proportions.", "bbox": {"l": 53.79800000000001, "t": 676.32355, "r": 98.916931, "b": 684.69817, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "To ensure that future benchmarks in the document-layout analysis community can be easily compared, we have split up DocLayNet into pre-defined train-, test- and validation-sets. In this way, we can avoid spurious variations in the evaluation scores due to random splitting in train-, test- and validation-sets. We also ensured that less frequent labels are represented in train and test sets in equal proportions."}, {"label": "footnote", "id": 12, "page_no": 2, "cluster": {"id": 12, "label": "footnote", "bbox": {"l": 53.79800000000001, "t": 701.6563639999999, "r": 195.78998, "b": 708.169891, "coord_origin": "TOPLEFT"}, "confidence": 0.9048352241516113, "cells": [{"id": 76, "text": "$^{2}$e.g. AAPL from https://www.annualreports.com/", "bbox": {"l": 53.79800000000001, "t": 701.6563639999999, "r": 195.78998, "b": 708.169891, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "$^{2}$e.g. AAPL from https://www.annualreports.com/"}, {"label": "text", "id": 3, "page_no": 2, "cluster": {"id": 3, "label": "text", "bbox": {"l": 317.62299, "t": 87.36352999999997, "r": 559.19183, "b": 161.49114999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.986920952796936, "cells": [{"id": 77, "text": "Table 1 shows the overall frequency and distribution of the labels", "bbox": {"l": 327.918, "t": 87.36352999999997, "r": 558.20093, "b": 95.73816, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "among the different sets. Importantly, we ensure that subsets are", "bbox": {"l": 317.95499, "t": 98.32250999999997, "r": 558.20013, "b": 106.69713999999999, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "only split on full-document boundaries. This avoids that pages of", "bbox": {"l": 317.95499, "t": 109.28156000000001, "r": 558.20056, "b": 117.65618999999992, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "the same document are spread over train, test and validation set,", "bbox": {"l": 317.95499, "t": 120.24054000000001, "r": 559.19183, "b": 128.61517000000003, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "which can give an undesired evaluation advantage to models and", "bbox": {"l": 317.62299, "t": 131.19854999999995, "r": 558.20349, "b": 139.57317999999998, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "lead to overestimation of their prediction accuracy. We will show", "bbox": {"l": 317.95499, "t": 142.15752999999995, "r": 558.52936, "b": 150.53216999999995, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "the impact of this decision in Section 5.", "bbox": {"l": 317.95499, "t": 153.11652000000004, "r": 461.6416, "b": 161.49114999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 1 shows the overall frequency and distribution of the labels among the different sets. Importantly, we ensure that subsets are only split on full-document boundaries. This avoids that pages of the same document are spread over train, test and validation set, which can give an undesired evaluation advantage to models and lead to overestimation of their prediction accuracy. We will show the impact of this decision in Section 5."}, {"label": "text", "id": 6, "page_no": 2, "cluster": {"id": 6, "label": "text", "bbox": {"l": 317.95499, "t": 164.07556, "r": 558.43811, "b": 271.0802, "coord_origin": "TOPLEFT"}, "confidence": 0.9860605001449585, "cells": [{"id": 84, "text": "In order to accommodate the different types of models currently", "bbox": {"l": 327.918, "t": 164.07556, "r": 558.43811, "b": 172.4502, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "in use by the community, we provide DocLayNet in an", "bbox": {"l": 317.95499, "t": 175.03454999999997, "r": 516.8219, "b": 183.40918, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "augmented", "bbox": {"l": 519.07501, "t": 175.07941000000005, "r": 558.20135, "b": 183.41814999999997, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "COCO format [16]. This entails the standard COCO ground-truth", "bbox": {"l": 317.95499, "t": 185.99352999999996, "r": 558.20325, "b": 194.36816, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "file (in JSON format) with the associated page images (in PNG", "bbox": {"l": 317.95499, "t": 196.95250999999996, "r": 558.20404, "b": 205.32714999999996, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "format, 1025", "bbox": {"l": 317.95499, "t": 207.91156, "r": 364.28769, "b": 216.28619000000003, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "\u00d7", "bbox": {"l": 364.28699, "t": 207.85779000000002, "r": 369.98962, "b": 215.55993999999998, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "1025 pixels). Furthermore, custom fields have been", "bbox": {"l": 369.98999, "t": 207.91156, "r": 558.20526, "b": 216.28619000000003, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "added to each COCO record to specify document category, original", "bbox": {"l": 317.95499, "t": 218.87054, "r": 558.20251, "b": 227.24518, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "document filename and page number. In addition, we also provide", "bbox": {"l": 317.95499, "t": 229.82952999999998, "r": 558.203, "b": 238.20416, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "the original PDF pages, as well as sidecar files containing parsed", "bbox": {"l": 317.95499, "t": 240.78754000000004, "r": 558.20404, "b": 249.16216999999995, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "PDF text and text-cell coordinates (in JSON). All additional files are", "bbox": {"l": 317.95499, "t": 251.74652000000003, "r": 558.20227, "b": 260.12114999999994, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "linked to the primary page images by their matching filenames.", "bbox": {"l": 317.95499, "t": 262.70556999999997, "r": 550.36414, "b": 271.0802, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In order to accommodate the different types of models currently in use by the community, we provide DocLayNet in an augmented COCO format [16]. This entails the standard COCO ground-truth file (in JSON format) with the associated page images (in PNG format, 1025 \u00d7 1025 pixels). Furthermore, custom fields have been added to each COCO record to specify document category, original document filename and page number. In addition, we also provide the original PDF pages, as well as sidecar files containing parsed PDF text and text-cell coordinates (in JSON). All additional files are linked to the primary page images by their matching filenames."}, {"label": "text", "id": 7, "page_no": 2, "cluster": {"id": 7, "label": "text", "bbox": {"l": 316.94199, "t": 273.66454999999996, "r": 559.72156, "b": 588.88918, "coord_origin": "TOPLEFT"}, "confidence": 0.9853296875953674, "cells": [{"id": 97, "text": "Despite being cost-intense and far less scalable than automation,", "bbox": {"l": 327.918, "t": 273.66454999999996, "r": 559.18488, "b": 282.03918, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "human annotation has several benefits over automated ground-", "bbox": {"l": 317.95499, "t": 284.62354, "r": 559.7132, "b": 292.99817, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "truth generation. The first and most obvious reason to leverage", "bbox": {"l": 317.95499, "t": 295.5825500000001, "r": 558.20416, "b": 303.95717999999994, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "human annotations is the freedom to annotate any type of doc-", "bbox": {"l": 317.95499, "t": 306.54153, "r": 559.71326, "b": 314.91617, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "ument without requiring a programmatic source. For most PDF", "bbox": {"l": 317.95499, "t": 317.50055, "r": 558.41443, "b": 325.87518, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "documents, the original source document is not available. The lat-", "bbox": {"l": 317.95499, "t": 328.4595299999999, "r": 559.71545, "b": 336.83417, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "ter is not a hard constraint with human annotation, but it is for", "bbox": {"l": 317.95499, "t": 339.41855000000004, "r": 558.36865, "b": 347.79318, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "automated methods. A second reason to use human annotations is", "bbox": {"l": 317.95499, "t": 350.37753, "r": 558.20062, "b": 358.75217, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "that the latter usually provide a more natural interpretation of the", "bbox": {"l": 317.95499, "t": 361.33554, "r": 558.20184, "b": 369.71017, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "page layout. The human-interpreted layout can significantly devi-", "bbox": {"l": 317.95499, "t": 372.29453, "r": 559.71442, "b": 380.66916, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "ate from the programmatic layout used in typesetting. For example,", "bbox": {"l": 317.95499, "t": 383.25354, "r": 559.1864, "b": 391.62817, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "\u201cinvisible\u201d tables might be used solely for aligning text paragraphs", "bbox": {"l": 316.94199, "t": 394.21252, "r": 558.20111, "b": 402.58716, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "on columns. Such typesetting tricks might be interpreted by au-", "bbox": {"l": 317.95499, "t": 405.17154, "r": 559.7132, "b": 413.54617, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "tomated methods incorrectly as an actual table, while the human", "bbox": {"l": 317.95499, "t": 416.13052, "r": 558.20013, "b": 424.50515999999993, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "annotation will interpret it correctly as", "bbox": {"l": 317.95499, "t": 427.08953999999994, "r": 464.50613, "b": 435.46417, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "Text", "bbox": {"l": 466.98199000000005, "t": 427.13439999999997, "r": 482.14560000000006, "b": 435.47313999999994, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "or other styles. The", "bbox": {"l": 485.13199000000003, "t": 427.08953999999994, "r": 558.19727, "b": 435.46417, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "same applies to multi-line text elements, when authors decided to", "bbox": {"l": 317.95499, "t": 438.04855, "r": 558.20221, "b": 446.4231899999999, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "space them as \u201cinvisible\u201d list elements without bullet symbols. A", "bbox": {"l": 317.95499, "t": 449.00754, "r": 558.51501, "b": 457.38217, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "third reason to gather ground-truth through human annotation is", "bbox": {"l": 317.95499, "t": 459.96655000000004, "r": 558.19855, "b": 468.34119, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "to estimate a \u201cnatural\u201d upper bound on the segmentation accuracy.", "bbox": {"l": 317.95499, "t": 470.92453, "r": 559.58215, "b": 479.29916, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "As we will show in Section 4, certain documents featuring complex", "bbox": {"l": 317.64099, "t": 481.88354, "r": 558.41559, "b": 490.25818, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "layouts can have different but equally acceptable layout interpre-", "bbox": {"l": 317.95499, "t": 492.84253, "r": 559.72156, "b": 501.21716, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "tations. This natural upper bound for segmentation accuracy can", "bbox": {"l": 317.95499, "t": 503.80154, "r": 558.19928, "b": 512.1761799999999, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "be found by annotating the same pages multiple times by different", "bbox": {"l": 317.95499, "t": 514.76053, "r": 558.20581, "b": 523.13516, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "people and evaluating the inter-annotator agreement. Such a base-", "bbox": {"l": 317.95499, "t": 525.71954, "r": 559.71729, "b": 534.09418, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "line consistency evaluation is very useful to define expectations", "bbox": {"l": 317.95499, "t": 536.6785600000001, "r": 558.20404, "b": 545.05318, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "for a good target accuracy in trained deep neural network models", "bbox": {"l": 317.95499, "t": 547.63756, "r": 558.20074, "b": 556.01218, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "and avoid overfitting (see Table 1). On the flip side, achieving high", "bbox": {"l": 317.95499, "t": 558.59656, "r": 558.20062, "b": 566.97118, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "annotation consistency proved to be a key challenge in human", "bbox": {"l": 317.95499, "t": 569.55556, "r": 558.20416, "b": 577.9301800000001, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "annotation, as we outline in Section 4.", "bbox": {"l": 317.95499, "t": 580.51456, "r": 457.62469, "b": 588.88918, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Despite being cost-intense and far less scalable than automation, human annotation has several benefits over automated groundtruth generation. The first and most obvious reason to leverage human annotations is the freedom to annotate any type of document without requiring a programmatic source. For most PDF documents, the original source document is not available. The latter is not a hard constraint with human annotation, but it is for automated methods. A second reason to use human annotations is that the latter usually provide a more natural interpretation of the page layout. The human-interpreted layout can significantly deviate from the programmatic layout used in typesetting. For example, \u201cinvisible\u201d tables might be used solely for aligning text paragraphs on columns. Such typesetting tricks might be interpreted by automated methods incorrectly as an actual table, while the human annotation will interpret it correctly as Text or other styles. The same applies to multi-line text elements, when authors decided to space them as \u201cinvisible\u201d list elements without bullet symbols. A third reason to gather ground-truth through human annotation is to estimate a \u201cnatural\u201d upper bound on the segmentation accuracy. As we will show in Section 4, certain documents featuring complex layouts can have different but equally acceptable layout interpretations. This natural upper bound for segmentation accuracy can be found by annotating the same pages multiple times by different people and evaluating the inter-annotator agreement. Such a baseline consistency evaluation is very useful to define expectations for a good target accuracy in trained deep neural network models and avoid overfitting (see Table 1). On the flip side, achieving high annotation consistency proved to be a key challenge in human annotation, as we outline in Section 4."}, {"label": "section_header", "id": 10, "page_no": 2, "cluster": {"id": 10, "label": "section_header", "bbox": {"l": 317.95499, "t": 606.84991, "r": 470.21326, "b": 617.15901, "coord_origin": "TOPLEFT"}, "confidence": 0.9422592520713806, "cells": [{"id": 128, "text": "4", "bbox": {"l": 317.95499, "t": 606.84991, "r": 323.56226, "b": 617.15901, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "ANNOTATION CAMPAIGN", "bbox": {"l": 334.47134, "t": 606.84991, "r": 470.21326, "b": 617.15901, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4 ANNOTATION CAMPAIGN"}, {"label": "text", "id": 5, "page_no": 2, "cluster": {"id": 5, "label": "text", "bbox": {"l": 317.686, "t": 631.97356, "r": 559.71381, "b": 706.102173, "coord_origin": "TOPLEFT"}, "confidence": 0.9863831996917725, "cells": [{"id": 130, "text": "The annotation campaign was carried out in four phases. In phase", "bbox": {"l": 317.686, "t": 631.97356, "r": 558.20148, "b": 640.34818, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "one, we identified and prepared the data sources for annotation.", "bbox": {"l": 317.95499, "t": 642.93256, "r": 559.58521, "b": 651.30717, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "In phase two, we determined the class labels and how annotations", "bbox": {"l": 317.95499, "t": 653.89156, "r": 558.20007, "b": 662.26617, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "should be done on the documents in order to obtain maximum con-", "bbox": {"l": 317.95499, "t": 664.85056, "r": 559.71375, "b": 673.22517, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "sistency. The latter was guided by a detailed requirement analysis", "bbox": {"l": 317.95499, "t": 675.80956, "r": 558.20233, "b": 684.18417, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "and exhaustive experiments. In phase three, we trained the annota-", "bbox": {"l": 317.95499, "t": 686.76855, "r": 559.71381, "b": 695.143173, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "tion staff and performed exams for quality assurance. In phase four,", "bbox": {"l": 317.95499, "t": 697.7275539999999, "r": 559.1864, "b": 706.102173, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The annotation campaign was carried out in four phases. In phase one, we identified and prepared the data sources for annotation. In phase two, we determined the class labels and how annotations should be done on the documents in order to obtain maximum consistency. The latter was guided by a detailed requirement analysis and exhaustive experiments. In phase three, we trained the annotation staff and performed exams for quality assurance. In phase four,"}], "headers": [{"label": "page_header", "id": 13, "page_no": 2, "cluster": {"id": 13, "label": "page_header", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.8919971585273743, "cells": [{"id": 0, "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis"}, {"label": "page_header", "id": 11, "page_no": 2, "cluster": {"id": 11, "label": "page_header", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.9104517102241516, "cells": [{"id": 1, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA"}]}}, {"page_no": 3, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 246.24382, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar", "bbox": {"l": 253.13897999999998, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Table 1: DocLayNet dataset overview. Along with the frequency of each class label, we present the relative occurrence (as %", "bbox": {"l": 53.501999, "t": 84.95495999999991, "r": 558.48969, "b": 93.42822000000001, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "of row \u201cTotal\u201d) in the train, test and validation sets. The inter-annotator agreement is computed as the mAP@0.5-0.95 metric", "bbox": {"l": 53.79800000000001, "t": 95.91394000000003, "r": 558.20294, "b": 104.3872100000001, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "between pairwise annotations from the triple-annotated pages, from which we obtain accuracy ranges.", "bbox": {"l": 53.79800000000001, "t": 106.87292000000002, "r": 469.84805000000006, "b": 115.34618999999998, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "% of Total", "bbox": {"l": 233.94400000000002, "t": 140.22351000000003, "r": 270.04272, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "triple inter-annotator mAP @ 0.5-0.95 (%)", "bbox": {"l": 329.04999, "t": 140.22351000000003, "r": 483.3976400000001, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "class label", "bbox": {"l": 104.825, "t": 151.18255999999997, "r": 141.71277, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Count", "bbox": {"l": 175.94701, "t": 151.18255999999997, "r": 198.71269, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Train", "bbox": {"l": 213.795, "t": 151.18255999999997, "r": 233.69144, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Test", "bbox": {"l": 249.37367, "t": 151.18255999999997, "r": 264.5, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Val", "bbox": {"l": 283.53568, "t": 151.18255999999997, "r": 295.30856, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "All", "bbox": {"l": 314.01501, "t": 151.18255999999997, "r": 324.98093, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Fin", "bbox": {"l": 343.01236, "t": 151.18255999999997, "r": 354.65076, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Man", "bbox": {"l": 367.84033, "t": 151.18255999999997, "r": 384.32059, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Sci", "bbox": {"l": 407.54358, "t": 151.18255999999997, "r": 418.15979, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Law", "bbox": {"l": 432.29979999999995, "t": 151.18255999999997, "r": 447.82962, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "Pat", "bbox": {"l": 465.72656, "t": 151.18255999999997, "r": 477.50842, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Ten", "bbox": {"l": 493.52240000000006, "t": 151.18255999999997, "r": 507.17822, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Caption", "bbox": {"l": 104.825, "t": 162.53954999999996, "r": 134.01064, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "22524", "bbox": {"l": 177.866, "t": 162.53954999999996, "r": 198.71288, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "2.04", "bbox": {"l": 219.211, "t": 162.53954999999996, "r": 233.69174000000004, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "1.77", "bbox": {"l": 250.01956, "t": 162.53954999999996, "r": 264.50031, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "2.32", "bbox": {"l": 280.82812, "t": 162.53954999999996, "r": 295.30887, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "84-89", "bbox": {"l": 305.27301, "t": 162.53954999999996, "r": 324.98117, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "40-61", "bbox": {"l": 334.94284, "t": 162.53954999999996, "r": 354.651, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "86-92", "bbox": {"l": 364.61267, "t": 162.53954999999996, "r": 384.32083, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "94-99", "bbox": {"l": 398.45187, "t": 162.53954999999996, "r": 418.16003, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "95-99", "bbox": {"l": 428.1217, "t": 162.53954999999996, "r": 447.82986, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "69-78", "bbox": {"l": 457.80051, "t": 162.53954999999996, "r": 477.50867, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "n/a", "bbox": {"l": 495.32489, "t": 162.53954999999996, "r": 507.17846999999995, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Footnote", "bbox": {"l": 104.825, "t": 173.49854000000005, "r": 137.3282, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "6318", "bbox": {"l": 182.035, "t": 173.49854000000005, "r": 198.71251, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "0.60", "bbox": {"l": 219.211, "t": 173.49854000000005, "r": 233.69174000000004, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "0.31", "bbox": {"l": 250.01956, "t": 173.49854000000005, "r": 264.50031, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "0.58", "bbox": {"l": 280.82812, "t": 173.49854000000005, "r": 295.30887, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "83-91", "bbox": {"l": 305.27301, "t": 173.49854000000005, "r": 324.98117, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "n/a", "bbox": {"l": 342.79739, "t": 173.49854000000005, "r": 354.65097, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "100", "bbox": {"l": 371.81265, "t": 173.49854000000005, "r": 384.32077, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "62-88", "bbox": {"l": 398.45181, "t": 173.49854000000005, "r": 418.15997, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "85-94", "bbox": {"l": 428.12164, "t": 173.49854000000005, "r": 447.8298, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "n/a", "bbox": {"l": 465.655, "t": 173.49854000000005, "r": 477.50857999999994, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "82-97", "bbox": {"l": 487.47025, "t": 173.49854000000005, "r": 507.17841, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Formula", "bbox": {"l": 104.825, "t": 184.45752000000005, "r": 135.33766, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "25027", "bbox": {"l": 177.866, "t": 184.45752000000005, "r": 198.71288, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "2.25", "bbox": {"l": 219.211, "t": 184.45752000000005, "r": 233.69174000000004, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "1.90", "bbox": {"l": 250.01956, "t": 184.45752000000005, "r": 264.50031, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "2.96", "bbox": {"l": 280.82812, "t": 184.45752000000005, "r": 295.30887, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "83-85", "bbox": {"l": 305.27301, "t": 184.45752000000005, "r": 324.98117, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "n/a", "bbox": {"l": 342.79739, "t": 184.45752000000005, "r": 354.65097, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "n/a", "bbox": {"l": 372.46719, "t": 184.45752000000005, "r": 384.32077, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "84-87", "bbox": {"l": 398.45181, "t": 184.45752000000005, "r": 418.15997, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "86-96", "bbox": {"l": 428.12164, "t": 184.45752000000005, "r": 447.8298, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "n/a", "bbox": {"l": 465.655, "t": 184.45752000000005, "r": 477.50857999999994, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "n/a", "bbox": {"l": 495.3248, "t": 184.45752000000005, "r": 507.17838000000006, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "List-item", "bbox": {"l": 104.825, "t": 195.41656, "r": 137.70479, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "185660", "bbox": {"l": 173.69701, "t": 195.41656, "r": 198.71326, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "17.19", "bbox": {"l": 215.04201, "t": 195.41656, "r": 233.69212, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "13.34", "bbox": {"l": 245.85056, "t": 195.41656, "r": 264.50067, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "15.82", "bbox": {"l": 276.65912, "t": 195.41656, "r": 295.30923, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "87-88", "bbox": {"l": 305.27301, "t": 195.41656, "r": 324.98117, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "74-83", "bbox": {"l": 334.94284, "t": 195.41656, "r": 354.651, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "90-92", "bbox": {"l": 364.61267, "t": 195.41656, "r": 384.32083, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "97-97", "bbox": {"l": 398.45187, "t": 195.41656, "r": 418.16003, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "81-85", "bbox": {"l": 428.1217, "t": 195.41656, "r": 447.82986, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "75-88", "bbox": {"l": 457.80051, "t": 195.41656, "r": 477.50867, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "93-95", "bbox": {"l": 487.47034, "t": 195.41656, "r": 507.17849999999993, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "Page-footer", "bbox": {"l": 104.825, "t": 206.37554999999998, "r": 147.35262, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "70878", "bbox": {"l": 177.866, "t": 206.37554999999998, "r": 198.71288, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "6.51", "bbox": {"l": 219.211, "t": 206.37554999999998, "r": 233.69174000000004, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "5.58", "bbox": {"l": 250.01956, "t": 206.37554999999998, "r": 264.50031, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "6.00", "bbox": {"l": 280.82812, "t": 206.37554999999998, "r": 295.30887, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "93-94", "bbox": {"l": 305.27301, "t": 206.37554999999998, "r": 324.98117, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "88-90", "bbox": {"l": 334.94284, "t": 206.37554999999998, "r": 354.651, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "95-96", "bbox": {"l": 364.61267, "t": 206.37554999999998, "r": 384.32083, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "100", "bbox": {"l": 405.65189, "t": 206.37554999999998, "r": 418.16, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "92-97", "bbox": {"l": 428.12167, "t": 206.37554999999998, "r": 447.82983, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "100", "bbox": {"l": 465.00049, "t": 206.37554999999998, "r": 477.5086099999999, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "96-98", "bbox": {"l": 487.47028, "t": 206.37554999999998, "r": 507.17843999999997, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "Page-header", "bbox": {"l": 104.825, "t": 217.33452999999997, "r": 150.10532, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "58022", "bbox": {"l": 177.866, "t": 217.33452999999997, "r": 198.71288, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "5.10", "bbox": {"l": 219.211, "t": 217.33452999999997, "r": 233.69174000000004, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "6.70", "bbox": {"l": 250.01956, "t": 217.33452999999997, "r": 264.50031, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "5.06", "bbox": {"l": 280.82812, "t": 217.33452999999997, "r": 295.30887, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "85-89", "bbox": {"l": 305.27301, "t": 217.33452999999997, "r": 324.98117, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "66-76", "bbox": {"l": 334.94284, "t": 217.33452999999997, "r": 354.651, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "90-94", "bbox": {"l": 364.61267, "t": 217.33452999999997, "r": 384.32083, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "98-100", "bbox": {"l": 394.2825, "t": 217.33452999999997, "r": 418.16003, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "91-92", "bbox": {"l": 428.1217, "t": 217.33452999999997, "r": 447.82986, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "97-99", "bbox": {"l": 457.80051, "t": 217.33452999999997, "r": 477.50867, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "81-86", "bbox": {"l": 487.47034, "t": 217.33452999999997, "r": 507.17849999999993, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "Picture", "bbox": {"l": 104.825, "t": 228.29351999999994, "r": 130.80963, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "45976", "bbox": {"l": 177.866, "t": 228.29351999999994, "r": 198.71288, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "4.21", "bbox": {"l": 219.211, "t": 228.29351999999994, "r": 233.69174000000004, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "2.78", "bbox": {"l": 250.01956, "t": 228.29351999999994, "r": 264.50031, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "5.31", "bbox": {"l": 280.82812, "t": 228.29351999999994, "r": 295.30887, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "69-71", "bbox": {"l": 305.27301, "t": 228.29351999999994, "r": 324.98117, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "56-59", "bbox": {"l": 334.94284, "t": 228.29351999999994, "r": 354.651, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "82-86", "bbox": {"l": 364.61267, "t": 228.29351999999994, "r": 384.32083, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "69-82", "bbox": {"l": 398.45187, "t": 228.29351999999994, "r": 418.16003, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "80-95", "bbox": {"l": 428.1217, "t": 228.29351999999994, "r": 447.82986, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "66-71", "bbox": {"l": 457.80051, "t": 228.29351999999994, "r": 477.50867, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "59-76", "bbox": {"l": 487.47034, "t": 228.29351999999994, "r": 507.17849999999993, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "Section-header", "bbox": {"l": 104.825, "t": 239.25256000000002, "r": 159.56487, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "142884", "bbox": {"l": 173.69701, "t": 239.25256000000002, "r": 198.71326, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "12.60", "bbox": {"l": 215.04201, "t": 239.25256000000002, "r": 233.69212, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "15.77", "bbox": {"l": 245.85056, "t": 239.25256000000002, "r": 264.50067, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "12.85", "bbox": {"l": 276.65912, "t": 239.25256000000002, "r": 295.30923, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "83-84", "bbox": {"l": 305.27301, "t": 239.25256000000002, "r": 324.98117, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "76-81", "bbox": {"l": 334.94284, "t": 239.25256000000002, "r": 354.651, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "90-92", "bbox": {"l": 364.61267, "t": 239.25256000000002, "r": 384.32083, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "94-95", "bbox": {"l": 398.45187, "t": 239.25256000000002, "r": 418.16003, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "87-94", "bbox": {"l": 428.1217, "t": 239.25256000000002, "r": 447.82986, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "69-73", "bbox": {"l": 457.80051, "t": 239.25256000000002, "r": 477.50867, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "78-86", "bbox": {"l": 487.47034, "t": 239.25256000000002, "r": 507.17849999999993, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "Table", "bbox": {"l": 104.825, "t": 250.21155, "r": 124.63177, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "34733", "bbox": {"l": 177.866, "t": 250.21155, "r": 198.71288, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "3.20", "bbox": {"l": 219.211, "t": 250.21155, "r": 233.69174000000004, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "2.27", "bbox": {"l": 250.01956, "t": 250.21155, "r": 264.50031, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "3.60", "bbox": {"l": 280.82812, "t": 250.21155, "r": 295.30887, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "77-81", "bbox": {"l": 305.27301, "t": 250.21155, "r": 324.98117, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "75-80", "bbox": {"l": 334.94284, "t": 250.21155, "r": 354.651, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "83-86", "bbox": {"l": 364.61267, "t": 250.21155, "r": 384.32083, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "98-99", "bbox": {"l": 398.45187, "t": 250.21155, "r": 418.16003, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "58-80", "bbox": {"l": 428.1217, "t": 250.21155, "r": 447.82986, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "79-84", "bbox": {"l": 457.80051, "t": 250.21155, "r": 477.50867, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "70-85", "bbox": {"l": 487.47034, "t": 250.21155, "r": 507.17849999999993, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "Text", "bbox": {"l": 104.825, "t": 261.16956000000005, "r": 120.78519, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "510377", "bbox": {"l": 173.69701, "t": 261.16956000000005, "r": 198.71326, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "45.82", "bbox": {"l": 215.04201, "t": 261.16956000000005, "r": 233.69212, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "49.28", "bbox": {"l": 245.85056, "t": 261.16956000000005, "r": 264.50067, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "45.00", "bbox": {"l": 276.65912, "t": 261.16956000000005, "r": 295.30923, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "84-86", "bbox": {"l": 305.27301, "t": 261.16956000000005, "r": 324.98117, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "81-86", "bbox": {"l": 334.94284, "t": 261.16956000000005, "r": 354.651, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "88-93", "bbox": {"l": 364.61267, "t": 261.16956000000005, "r": 384.32083, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "89-93", "bbox": {"l": 398.45187, "t": 261.16956000000005, "r": 418.16003, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "87-92", "bbox": {"l": 428.1217, "t": 261.16956000000005, "r": 447.82986, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "71-79", "bbox": {"l": 457.80051, "t": 261.16956000000005, "r": 477.50867, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "87-95", "bbox": {"l": 487.47034, "t": 261.16956000000005, "r": 507.17849999999993, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "Title", "bbox": {"l": 104.825, "t": 272.12854000000004, "r": 121.81633, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "5071", "bbox": {"l": 182.035, "t": 272.12854000000004, "r": 198.71251, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "0.47", "bbox": {"l": 219.211, "t": 272.12854000000004, "r": 233.69174000000004, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "0.30", "bbox": {"l": 250.01956, "t": 272.12854000000004, "r": 264.50031, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "0.50", "bbox": {"l": 280.82812, "t": 272.12854000000004, "r": 295.30887, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "60-72", "bbox": {"l": 305.27301, "t": 272.12854000000004, "r": 324.98117, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "24-63", "bbox": {"l": 334.94284, "t": 272.12854000000004, "r": 354.651, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "50-63", "bbox": {"l": 364.61267, "t": 272.12854000000004, "r": 384.32083, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "94-100", "bbox": {"l": 394.2825, "t": 272.12854000000004, "r": 418.16003, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "82-96", "bbox": {"l": 428.1217, "t": 272.12854000000004, "r": 447.82986, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "68-79", "bbox": {"l": 457.80051, "t": 272.12854000000004, "r": 477.50867, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "24-56", "bbox": {"l": 487.47034, "t": 272.12854000000004, "r": 507.17849999999993, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "Total", "bbox": {"l": 104.825, "t": 283.48654, "r": 123.43028, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "1107470", "bbox": {"l": 169.52699, "t": 283.48654, "r": 198.71263, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "941123", "bbox": {"l": 208.675, "t": 283.48654, "r": 233.69124999999997, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "99816", "bbox": {"l": 243.65291999999997, "t": 283.48654, "r": 264.49982, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "66531", "bbox": {"l": 274.46149, "t": 283.48654, "r": 295.30838, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "82-83", "bbox": {"l": 305.27301, "t": 283.48654, "r": 324.98117, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "71-74", "bbox": {"l": 334.94284, "t": 283.48654, "r": 354.651, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "79-81", "bbox": {"l": 364.61267, "t": 283.48654, "r": 384.32083, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "89-94", "bbox": {"l": 398.45187, "t": 283.48654, "r": 418.16003, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "86-91", "bbox": {"l": 428.1217, "t": 283.48654, "r": 447.82986, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "71-76", "bbox": {"l": 457.80051, "t": 283.48654, "r": 477.50867, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "68-85", "bbox": {"l": 487.47034, "t": 283.48654, "r": 507.17849999999993, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "Figure 3: Corpus Conversion Service annotation user inter-", "bbox": {"l": 53.79800000000001, "t": 554.00999, "r": 295.64871, "b": 562.48325, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "face. The PDF page is shown in the background, with over-", "bbox": {"l": 53.79800000000001, "t": 564.96899, "r": 295.64874, "b": 573.44225, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "laid text-cells (in darker shades). The annotation boxes can", "bbox": {"l": 53.79800000000001, "t": 575.92799, "r": 294.04376, "b": 584.40125, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "be drawn by dragging a rectangle over each segment with", "bbox": {"l": 53.79800000000001, "t": 586.88699, "r": 294.04373, "b": 595.36024, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "the respective label from the palette on the right.", "bbox": {"l": 53.79800000000001, "t": 597.84599, "r": 252.78931000000003, "b": 606.31924, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "we distributed the annotation workload and performed continuous", "bbox": {"l": 53.466999, "t": 634.29155, "r": 294.04745, "b": 642.66617, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "quality controls. Phase one and two required a small team of experts", "bbox": {"l": 53.79800000000001, "t": 645.25055, "r": 294.04535, "b": 653.62517, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "only. For phases three and four, a group of 40 dedicated annotators", "bbox": {"l": 53.79800000000001, "t": 656.20955, "r": 294.04422, "b": 664.58417, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "were assembled and supervised.", "bbox": {"l": 53.466999, "t": 667.16856, "r": 170.58611, "b": 675.54317, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "Phase 1: Data selection and preparation.", "bbox": {"l": 63.76099800000001, "t": 678.01099, "r": 226.72533000000004, "b": 686.48424, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "Our inclusion cri-", "bbox": {"l": 229.06900000000002, "t": 678.12756, "r": 295.55844, "b": 686.50217, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "teria for documents were described in Section 3. A large effort went", "bbox": {"l": 53.79800000000001, "t": 689.08656, "r": 294.04538, "b": 697.461174, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "into ensuring that all documents are free to use. The data sources", "bbox": {"l": 53.79800000000001, "t": 700.045555, "r": 294.04642, "b": 708.420174, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "include publication repositories such as arXiv$^{3}$, government offices,", "bbox": {"l": 317.95499, "t": 312.07953, "r": 559.18536, "b": 320.45416000000006, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "company websites as well as data directory services for financial", "bbox": {"l": 317.95499, "t": 323.03754, "r": 558.19843, "b": 331.41217, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "reports and patents. Scanned documents were excluded wherever", "bbox": {"l": 317.95499, "t": 333.99655, "r": 558.36963, "b": 342.37119, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "possible because they can be rotated or skewed. This would not", "bbox": {"l": 317.95499, "t": 344.95554, "r": 558.2041, "b": 353.33017, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "allow us to perform annotation with rectangular bounding-boxes", "bbox": {"l": 317.95499, "t": 355.91455, "r": 558.20294, "b": 364.28918, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "and therefore complicate the annotation process.", "bbox": {"l": 317.95499, "t": 366.87354, "r": 496.71826, "b": 375.24817, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "Preparation work included uploading and parsing the sourced", "bbox": {"l": 327.918, "t": 377.8325500000001, "r": 558.20618, "b": 386.20717999999994, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "PDF documents in the Corpus Conversion Service (CCS) [22], a", "bbox": {"l": 317.95499, "t": 388.79153, "r": 558.2019, "b": 397.16617, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "cloud-native platform which provides a visual annotation interface", "bbox": {"l": 317.95499, "t": 399.75055, "r": 558.20233, "b": 408.12518, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": "and allows for dataset inspection and analysis. The annotation in-", "bbox": {"l": 317.95499, "t": 410.7095299999999, "r": 559.71277, "b": 419.08417, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "terface of CCS is shown in Figure 3. The desired balance of pages", "bbox": {"l": 317.95499, "t": 421.66855000000004, "r": 558.20062, "b": 430.04318, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "between the different document categories was achieved by se-", "bbox": {"l": 317.95499, "t": 432.62753, "r": 559.71307, "b": 441.00217, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": "lective subsampling of pages with certain desired properties. For", "bbox": {"l": 317.95499, "t": 443.58554, "r": 558.36877, "b": 451.96017, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "example, we made sure to include the title page of each document", "bbox": {"l": 317.95499, "t": 454.54453, "r": 558.20428, "b": 462.91916, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "and bias the remaining page selection to those with figures or", "bbox": {"l": 317.95499, "t": 465.50354, "r": 558.36877, "b": 473.87817, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "tables. The latter was achieved by leveraging pre-trained object", "bbox": {"l": 317.95499, "t": 476.46252, "r": 558.20428, "b": 484.83716, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": "detection models from PubLayNet, which helped us estimate how", "bbox": {"l": 317.95499, "t": 487.42154, "r": 558.5307, "b": 495.79617, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "many figures and tables a given page contains.", "bbox": {"l": 317.95499, "t": 498.38052, "r": 488.46914999999996, "b": 506.75516, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "Phase 2: Label selection and guideline.", "bbox": {"l": 327.918, "t": 509.22299, "r": 482.41809, "b": 517.69623, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "We reviewed the col-", "bbox": {"l": 484.474, "t": 509.33954, "r": 559.71765, "b": 517.71417, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "lected documents and identified the most common structural fea-", "bbox": {"l": 317.95499, "t": 520.29855, "r": 559.71619, "b": 528.67319, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "tures they exhibit. This was achieved by identifying recurrent layout", "bbox": {"l": 317.95499, "t": 531.2575400000001, "r": 558.20239, "b": 539.63217, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "elements and lead us to the definition of 11 distinct class labels.", "bbox": {"l": 317.95499, "t": 542.21655, "r": 559.58502, "b": 550.59117, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "These 11 class labels are", "bbox": {"l": 317.686, "t": 553.17456, "r": 404.14197, "b": 561.54918, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "Caption", "bbox": {"l": 406.26599, "t": 553.21939, "r": 433.84860000000003, "b": 561.5581500000001, "coord_origin": "TOPLEFT"}}, {"id": 201, "text": ",", "bbox": {"l": 433.84799, "t": 553.17456, "r": 435.78115999999994, "b": 561.54918, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": "Footnote", "bbox": {"l": 437.9079899999999, "t": 553.21939, "r": 467.23926, "b": 561.5581500000001, "coord_origin": "TOPLEFT"}}, {"id": 203, "text": ",", "bbox": {"l": 467.23999, "t": 553.17456, "r": 469.17316000000005, "b": 561.54918, "coord_origin": "TOPLEFT"}}, {"id": 204, "text": "Formula", "bbox": {"l": 471.29900999999995, "t": 553.21939, "r": 500.44574000000006, "b": 561.5581500000001, "coord_origin": "TOPLEFT"}}, {"id": 205, "text": ",", "bbox": {"l": 500.44601000000006, "t": 553.17456, "r": 502.37918, "b": 561.54918, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": "List-item", "bbox": {"l": 504.505, "t": 553.21939, "r": 535.74304, "b": 561.5581500000001, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": ",", "bbox": {"l": 535.74298, "t": 553.17456, "r": 537.67615, "b": 561.54918, "coord_origin": "TOPLEFT"}}, {"id": 208, "text": "Page-", "bbox": {"l": 539.802, "t": 553.21939, "r": 559.09839, "b": 561.5581500000001, "coord_origin": "TOPLEFT"}}, {"id": 209, "text": "footer", "bbox": {"l": 317.95499, "t": 564.17839, "r": 338.80725, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": ",", "bbox": {"l": 338.806, "t": 564.13356, "r": 340.81805, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "Page-header", "bbox": {"l": 343.61401, "t": 564.17839, "r": 387.96164, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 212, "text": ",", "bbox": {"l": 387.961, "t": 564.13356, "r": 389.97305, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "Picture", "bbox": {"l": 392.76901, "t": 564.17839, "r": 417.84662, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 214, "text": ",", "bbox": {"l": 417.84799, "t": 564.13356, "r": 419.86005, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 215, "text": "Section-header", "bbox": {"l": 422.655, "t": 564.17839, "r": 475.56305, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 216, "text": ",", "bbox": {"l": 475.56201, "t": 564.13356, "r": 477.57407, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 217, "text": "Table", "bbox": {"l": 480.36899, "t": 564.17839, "r": 499.82196, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 218, "text": ",", "bbox": {"l": 499.8219900000001, "t": 564.13356, "r": 501.83405, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 219, "text": "Text", "bbox": {"l": 504.6290000000001, "t": 564.17839, "r": 519.7926, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 220, "text": ", and", "bbox": {"l": 519.79602, "t": 564.13356, "r": 538.37103, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 221, "text": "Title", "bbox": {"l": 541.16302, "t": 564.17839, "r": 557.57043, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 222, "text": ".", "bbox": {"l": 557.57098, "t": 564.13356, "r": 559.58307, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 223, "text": "Critical factors that were considered for the choice of these class", "bbox": {"l": 317.95499, "t": 575.09256, "r": 558.20416, "b": 583.46718, "coord_origin": "TOPLEFT"}}, {"id": 224, "text": "labels were (1) the overall occurrence of the label, (2) the specificity", "bbox": {"l": 317.95499, "t": 586.05156, "r": 558.43091, "b": 594.4261799999999, "coord_origin": "TOPLEFT"}}, {"id": 225, "text": "of the label, (3) recognisability on a single page (i.e. no need for", "bbox": {"l": 317.95499, "t": 597.0105599999999, "r": 558.36871, "b": 605.38518, "coord_origin": "TOPLEFT"}}, {"id": 226, "text": "context from previous or next page) and (4) overall coverage of the", "bbox": {"l": 317.95499, "t": 607.96956, "r": 558.20105, "b": 616.3441799999999, "coord_origin": "TOPLEFT"}}, {"id": 227, "text": "page. Specificity ensures that the choice of label is not ambiguous,", "bbox": {"l": 317.95499, "t": 618.9285600000001, "r": 559.18665, "b": 627.30318, "coord_origin": "TOPLEFT"}}, {"id": 228, "text": "while coverage ensures that all meaningful items on a page can", "bbox": {"l": 317.62299, "t": 629.88756, "r": 558.20142, "b": 638.26218, "coord_origin": "TOPLEFT"}}, {"id": 229, "text": "be annotated. We refrained from class labels that are very specific", "bbox": {"l": 317.95499, "t": 640.84656, "r": 558.20227, "b": 649.22118, "coord_origin": "TOPLEFT"}}, {"id": 230, "text": "to a document category, such as", "bbox": {"l": 317.95499, "t": 651.80556, "r": 436.90649, "b": 660.1801800000001, "coord_origin": "TOPLEFT"}}, {"id": 231, "text": "Abstract", "bbox": {"l": 439.13800000000003, "t": 651.8503900000001, "r": 469.69134999999994, "b": 660.18915, "coord_origin": "TOPLEFT"}}, {"id": 232, "text": "in the", "bbox": {"l": 472.42898999999994, "t": 651.80556, "r": 493.97348, "b": 660.1801800000001, "coord_origin": "TOPLEFT"}}, {"id": 233, "text": "Scientific Articles", "bbox": {"l": 496.207, "t": 651.8503900000001, "r": 558.20001, "b": 660.18915, "coord_origin": "TOPLEFT"}}, {"id": 234, "text": "category. We also avoided class labels that are tightly linked to the", "bbox": {"l": 317.95499, "t": 662.76456, "r": 558.20557, "b": 671.13918, "coord_origin": "TOPLEFT"}}, {"id": 235, "text": "semantics of the text. Labels such as", "bbox": {"l": 317.95499, "t": 673.7225599999999, "r": 447.65221999999994, "b": 682.09718, "coord_origin": "TOPLEFT"}}, {"id": 236, "text": "Author", "bbox": {"l": 449.85999, "t": 673.76739, "r": 474.31439, "b": 682.10614, "coord_origin": "TOPLEFT"}}, {"id": 237, "text": "and", "bbox": {"l": 477.172, "t": 673.7225599999999, "r": 490.39655, "b": 682.09718, "coord_origin": "TOPLEFT"}}, {"id": 238, "text": "Affiliation", "bbox": {"l": 492.60599, "t": 673.76739, "r": 528.29907, "b": 682.10614, "coord_origin": "TOPLEFT"}}, {"id": 239, "text": ", as seen", "bbox": {"l": 528.29901, "t": 673.7225599999999, "r": 558.20148, "b": 682.09718, "coord_origin": "TOPLEFT"}}, {"id": 240, "text": "in DocBank, are often only distinguishable by discriminating on", "bbox": {"l": 317.95499, "t": 684.68156, "r": 558.2041, "b": 693.0561749999999, "coord_origin": "TOPLEFT"}}, {"id": 241, "text": "$^{3}$https://arxiv.org/", "bbox": {"l": 317.95499, "t": 702.353363, "r": 369.2457, "b": 708.86689, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 10, "label": "page_header", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.7625049948692322, "cells": [{"id": 0, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 246.24382, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar", "bbox": {"l": 253.13897999999998, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "caption", "bbox": {"l": 53.501999, "t": 84.95495999999991, "r": 558.48969, "b": 115.34618999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.8906616568565369, "cells": [{"id": 2, "text": "Table 1: DocLayNet dataset overview. Along with the frequency of each class label, we present the relative occurrence (as %", "bbox": {"l": 53.501999, "t": 84.95495999999991, "r": 558.48969, "b": 93.42822000000001, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "of row \u201cTotal\u201d) in the train, test and validation sets. The inter-annotator agreement is computed as the mAP@0.5-0.95 metric", "bbox": {"l": 53.79800000000001, "t": 95.91394000000003, "r": 558.20294, "b": 104.3872100000001, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "between pairwise annotations from the triple-annotated pages, from which we obtain accuracy ranges.", "bbox": {"l": 53.79800000000001, "t": 106.87292000000002, "r": 469.84805000000006, "b": 115.34618999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "table", "bbox": {"l": 98.93103790283203, "t": 137.47547912597656, "r": 512.579833984375, "b": 294.08148193359375, "coord_origin": "TOPLEFT"}, "confidence": 0.9860090613365173, "cells": [{"id": 5, "text": "% of Total", "bbox": {"l": 233.94400000000002, "t": 140.22351000000003, "r": 270.04272, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "triple inter-annotator mAP @ 0.5-0.95 (%)", "bbox": {"l": 329.04999, "t": 140.22351000000003, "r": 483.3976400000001, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "class label", "bbox": {"l": 104.825, "t": 151.18255999999997, "r": 141.71277, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Count", "bbox": {"l": 175.94701, "t": 151.18255999999997, "r": 198.71269, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Train", "bbox": {"l": 213.795, "t": 151.18255999999997, "r": 233.69144, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Test", "bbox": {"l": 249.37367, "t": 151.18255999999997, "r": 264.5, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Val", "bbox": {"l": 283.53568, "t": 151.18255999999997, "r": 295.30856, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "All", "bbox": {"l": 314.01501, "t": 151.18255999999997, "r": 324.98093, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Fin", "bbox": {"l": 343.01236, "t": 151.18255999999997, "r": 354.65076, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Man", "bbox": {"l": 367.84033, "t": 151.18255999999997, "r": 384.32059, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Sci", "bbox": {"l": 407.54358, "t": 151.18255999999997, "r": 418.15979, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Law", "bbox": {"l": 432.29979999999995, "t": 151.18255999999997, "r": 447.82962, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "Pat", "bbox": {"l": 465.72656, "t": 151.18255999999997, "r": 477.50842, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Ten", "bbox": {"l": 493.52240000000006, "t": 151.18255999999997, "r": 507.17822, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Caption", "bbox": {"l": 104.825, "t": 162.53954999999996, "r": 134.01064, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "22524", "bbox": {"l": 177.866, "t": 162.53954999999996, "r": 198.71288, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "2.04", "bbox": {"l": 219.211, "t": 162.53954999999996, "r": 233.69174000000004, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "1.77", "bbox": {"l": 250.01956, "t": 162.53954999999996, "r": 264.50031, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "2.32", "bbox": {"l": 280.82812, "t": 162.53954999999996, "r": 295.30887, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "84-89", "bbox": {"l": 305.27301, "t": 162.53954999999996, "r": 324.98117, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "40-61", "bbox": {"l": 334.94284, "t": 162.53954999999996, "r": 354.651, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "86-92", "bbox": {"l": 364.61267, "t": 162.53954999999996, "r": 384.32083, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "94-99", "bbox": {"l": 398.45187, "t": 162.53954999999996, "r": 418.16003, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "95-99", "bbox": {"l": 428.1217, "t": 162.53954999999996, "r": 447.82986, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "69-78", "bbox": {"l": 457.80051, "t": 162.53954999999996, "r": 477.50867, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "n/a", "bbox": {"l": 495.32489, "t": 162.53954999999996, "r": 507.17846999999995, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Footnote", "bbox": {"l": 104.825, "t": 173.49854000000005, "r": 137.3282, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "6318", "bbox": {"l": 182.035, "t": 173.49854000000005, "r": 198.71251, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "0.60", "bbox": {"l": 219.211, "t": 173.49854000000005, "r": 233.69174000000004, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "0.31", "bbox": {"l": 250.01956, "t": 173.49854000000005, "r": 264.50031, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "0.58", "bbox": {"l": 280.82812, "t": 173.49854000000005, "r": 295.30887, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "83-91", "bbox": {"l": 305.27301, "t": 173.49854000000005, "r": 324.98117, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "n/a", "bbox": {"l": 342.79739, "t": 173.49854000000005, "r": 354.65097, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "100", "bbox": {"l": 371.81265, "t": 173.49854000000005, "r": 384.32077, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "62-88", "bbox": {"l": 398.45181, "t": 173.49854000000005, "r": 418.15997, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "85-94", "bbox": {"l": 428.12164, "t": 173.49854000000005, "r": 447.8298, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "n/a", "bbox": {"l": 465.655, "t": 173.49854000000005, "r": 477.50857999999994, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "82-97", "bbox": {"l": 487.47025, "t": 173.49854000000005, "r": 507.17841, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Formula", "bbox": {"l": 104.825, "t": 184.45752000000005, "r": 135.33766, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "25027", "bbox": {"l": 177.866, "t": 184.45752000000005, "r": 198.71288, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "2.25", "bbox": {"l": 219.211, "t": 184.45752000000005, "r": 233.69174000000004, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "1.90", "bbox": {"l": 250.01956, "t": 184.45752000000005, "r": 264.50031, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "2.96", "bbox": {"l": 280.82812, "t": 184.45752000000005, "r": 295.30887, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "83-85", "bbox": {"l": 305.27301, "t": 184.45752000000005, "r": 324.98117, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "n/a", "bbox": {"l": 342.79739, "t": 184.45752000000005, "r": 354.65097, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "n/a", "bbox": {"l": 372.46719, "t": 184.45752000000005, "r": 384.32077, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "84-87", "bbox": {"l": 398.45181, "t": 184.45752000000005, "r": 418.15997, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "86-96", "bbox": {"l": 428.12164, "t": 184.45752000000005, "r": 447.8298, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "n/a", "bbox": {"l": 465.655, "t": 184.45752000000005, "r": 477.50857999999994, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "n/a", "bbox": {"l": 495.3248, "t": 184.45752000000005, "r": 507.17838000000006, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "List-item", "bbox": {"l": 104.825, "t": 195.41656, "r": 137.70479, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "185660", "bbox": {"l": 173.69701, "t": 195.41656, "r": 198.71326, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "17.19", "bbox": {"l": 215.04201, "t": 195.41656, "r": 233.69212, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "13.34", "bbox": {"l": 245.85056, "t": 195.41656, "r": 264.50067, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "15.82", "bbox": {"l": 276.65912, "t": 195.41656, "r": 295.30923, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "87-88", "bbox": {"l": 305.27301, "t": 195.41656, "r": 324.98117, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "74-83", "bbox": {"l": 334.94284, "t": 195.41656, "r": 354.651, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "90-92", "bbox": {"l": 364.61267, "t": 195.41656, "r": 384.32083, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "97-97", "bbox": {"l": 398.45187, "t": 195.41656, "r": 418.16003, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "81-85", "bbox": {"l": 428.1217, "t": 195.41656, "r": 447.82986, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "75-88", "bbox": {"l": 457.80051, "t": 195.41656, "r": 477.50867, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "93-95", "bbox": {"l": 487.47034, "t": 195.41656, "r": 507.17849999999993, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "Page-footer", "bbox": {"l": 104.825, "t": 206.37554999999998, "r": 147.35262, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "70878", "bbox": {"l": 177.866, "t": 206.37554999999998, "r": 198.71288, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "6.51", "bbox": {"l": 219.211, "t": 206.37554999999998, "r": 233.69174000000004, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "5.58", "bbox": {"l": 250.01956, "t": 206.37554999999998, "r": 264.50031, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "6.00", "bbox": {"l": 280.82812, "t": 206.37554999999998, "r": 295.30887, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "93-94", "bbox": {"l": 305.27301, "t": 206.37554999999998, "r": 324.98117, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "88-90", "bbox": {"l": 334.94284, "t": 206.37554999999998, "r": 354.651, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "95-96", "bbox": {"l": 364.61267, "t": 206.37554999999998, "r": 384.32083, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "100", "bbox": {"l": 405.65189, "t": 206.37554999999998, "r": 418.16, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "92-97", "bbox": {"l": 428.12167, "t": 206.37554999999998, "r": 447.82983, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "100", "bbox": {"l": 465.00049, "t": 206.37554999999998, "r": 477.5086099999999, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "96-98", "bbox": {"l": 487.47028, "t": 206.37554999999998, "r": 507.17843999999997, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "Page-header", "bbox": {"l": 104.825, "t": 217.33452999999997, "r": 150.10532, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "58022", "bbox": {"l": 177.866, "t": 217.33452999999997, "r": 198.71288, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "5.10", "bbox": {"l": 219.211, "t": 217.33452999999997, "r": 233.69174000000004, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "6.70", "bbox": {"l": 250.01956, "t": 217.33452999999997, "r": 264.50031, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "5.06", "bbox": {"l": 280.82812, "t": 217.33452999999997, "r": 295.30887, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "85-89", "bbox": {"l": 305.27301, "t": 217.33452999999997, "r": 324.98117, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "66-76", "bbox": {"l": 334.94284, "t": 217.33452999999997, "r": 354.651, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "90-94", "bbox": {"l": 364.61267, "t": 217.33452999999997, "r": 384.32083, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "98-100", "bbox": {"l": 394.2825, "t": 217.33452999999997, "r": 418.16003, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "91-92", "bbox": {"l": 428.1217, "t": 217.33452999999997, "r": 447.82986, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "97-99", "bbox": {"l": 457.80051, "t": 217.33452999999997, "r": 477.50867, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "81-86", "bbox": {"l": 487.47034, "t": 217.33452999999997, "r": 507.17849999999993, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "Picture", "bbox": {"l": 104.825, "t": 228.29351999999994, "r": 130.80963, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "45976", "bbox": {"l": 177.866, "t": 228.29351999999994, "r": 198.71288, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "4.21", "bbox": {"l": 219.211, "t": 228.29351999999994, "r": 233.69174000000004, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "2.78", "bbox": {"l": 250.01956, "t": 228.29351999999994, "r": 264.50031, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "5.31", "bbox": {"l": 280.82812, "t": 228.29351999999994, "r": 295.30887, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "69-71", "bbox": {"l": 305.27301, "t": 228.29351999999994, "r": 324.98117, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "56-59", "bbox": {"l": 334.94284, "t": 228.29351999999994, "r": 354.651, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "82-86", "bbox": {"l": 364.61267, "t": 228.29351999999994, "r": 384.32083, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "69-82", "bbox": {"l": 398.45187, "t": 228.29351999999994, "r": 418.16003, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "80-95", "bbox": {"l": 428.1217, "t": 228.29351999999994, "r": 447.82986, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "66-71", "bbox": {"l": 457.80051, "t": 228.29351999999994, "r": 477.50867, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "59-76", "bbox": {"l": 487.47034, "t": 228.29351999999994, "r": 507.17849999999993, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "Section-header", "bbox": {"l": 104.825, "t": 239.25256000000002, "r": 159.56487, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "142884", "bbox": {"l": 173.69701, "t": 239.25256000000002, "r": 198.71326, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "12.60", "bbox": {"l": 215.04201, "t": 239.25256000000002, "r": 233.69212, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "15.77", "bbox": {"l": 245.85056, "t": 239.25256000000002, "r": 264.50067, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "12.85", "bbox": {"l": 276.65912, "t": 239.25256000000002, "r": 295.30923, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "83-84", "bbox": {"l": 305.27301, "t": 239.25256000000002, "r": 324.98117, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "76-81", "bbox": {"l": 334.94284, "t": 239.25256000000002, "r": 354.651, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "90-92", "bbox": {"l": 364.61267, "t": 239.25256000000002, "r": 384.32083, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "94-95", "bbox": {"l": 398.45187, "t": 239.25256000000002, "r": 418.16003, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "87-94", "bbox": {"l": 428.1217, "t": 239.25256000000002, "r": 447.82986, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "69-73", "bbox": {"l": 457.80051, "t": 239.25256000000002, "r": 477.50867, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "78-86", "bbox": {"l": 487.47034, "t": 239.25256000000002, "r": 507.17849999999993, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "Table", "bbox": {"l": 104.825, "t": 250.21155, "r": 124.63177, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "34733", "bbox": {"l": 177.866, "t": 250.21155, "r": 198.71288, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "3.20", "bbox": {"l": 219.211, "t": 250.21155, "r": 233.69174000000004, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "2.27", "bbox": {"l": 250.01956, "t": 250.21155, "r": 264.50031, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "3.60", "bbox": {"l": 280.82812, "t": 250.21155, "r": 295.30887, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "77-81", "bbox": {"l": 305.27301, "t": 250.21155, "r": 324.98117, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "75-80", "bbox": {"l": 334.94284, "t": 250.21155, "r": 354.651, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "83-86", "bbox": {"l": 364.61267, "t": 250.21155, "r": 384.32083, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "98-99", "bbox": {"l": 398.45187, "t": 250.21155, "r": 418.16003, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "58-80", "bbox": {"l": 428.1217, "t": 250.21155, "r": 447.82986, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "79-84", "bbox": {"l": 457.80051, "t": 250.21155, "r": 477.50867, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "70-85", "bbox": {"l": 487.47034, "t": 250.21155, "r": 507.17849999999993, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "Text", "bbox": {"l": 104.825, "t": 261.16956000000005, "r": 120.78519, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "510377", "bbox": {"l": 173.69701, "t": 261.16956000000005, "r": 198.71326, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "45.82", "bbox": {"l": 215.04201, "t": 261.16956000000005, "r": 233.69212, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "49.28", "bbox": {"l": 245.85056, "t": 261.16956000000005, "r": 264.50067, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "45.00", "bbox": {"l": 276.65912, "t": 261.16956000000005, "r": 295.30923, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "84-86", "bbox": {"l": 305.27301, "t": 261.16956000000005, "r": 324.98117, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "81-86", "bbox": {"l": 334.94284, "t": 261.16956000000005, "r": 354.651, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "88-93", "bbox": {"l": 364.61267, "t": 261.16956000000005, "r": 384.32083, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "89-93", "bbox": {"l": 398.45187, "t": 261.16956000000005, "r": 418.16003, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "87-92", "bbox": {"l": 428.1217, "t": 261.16956000000005, "r": 447.82986, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "71-79", "bbox": {"l": 457.80051, "t": 261.16956000000005, "r": 477.50867, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "87-95", "bbox": {"l": 487.47034, "t": 261.16956000000005, "r": 507.17849999999993, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "Title", "bbox": {"l": 104.825, "t": 272.12854000000004, "r": 121.81633, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "5071", "bbox": {"l": 182.035, "t": 272.12854000000004, "r": 198.71251, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "0.47", "bbox": {"l": 219.211, "t": 272.12854000000004, "r": 233.69174000000004, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "0.30", "bbox": {"l": 250.01956, "t": 272.12854000000004, "r": 264.50031, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "0.50", "bbox": {"l": 280.82812, "t": 272.12854000000004, "r": 295.30887, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "60-72", "bbox": {"l": 305.27301, "t": 272.12854000000004, "r": 324.98117, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "24-63", "bbox": {"l": 334.94284, "t": 272.12854000000004, "r": 354.651, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "50-63", "bbox": {"l": 364.61267, "t": 272.12854000000004, "r": 384.32083, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "94-100", "bbox": {"l": 394.2825, "t": 272.12854000000004, "r": 418.16003, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "82-96", "bbox": {"l": 428.1217, "t": 272.12854000000004, "r": 447.82986, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "68-79", "bbox": {"l": 457.80051, "t": 272.12854000000004, "r": 477.50867, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "24-56", "bbox": {"l": 487.47034, "t": 272.12854000000004, "r": 507.17849999999993, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "Total", "bbox": {"l": 104.825, "t": 283.48654, "r": 123.43028, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "1107470", "bbox": {"l": 169.52699, "t": 283.48654, "r": 198.71263, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "941123", "bbox": {"l": 208.675, "t": 283.48654, "r": 233.69124999999997, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "99816", "bbox": {"l": 243.65291999999997, "t": 283.48654, "r": 264.49982, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "66531", "bbox": {"l": 274.46149, "t": 283.48654, "r": 295.30838, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "82-83", "bbox": {"l": 305.27301, "t": 283.48654, "r": 324.98117, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "71-74", "bbox": {"l": 334.94284, "t": 283.48654, "r": 354.651, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "79-81", "bbox": {"l": 364.61267, "t": 283.48654, "r": 384.32083, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "89-94", "bbox": {"l": 398.45187, "t": 283.48654, "r": 418.16003, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "86-91", "bbox": {"l": 428.1217, "t": 283.48654, "r": 447.82986, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "71-76", "bbox": {"l": 457.80051, "t": 283.48654, "r": 477.50867, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "68-85", "bbox": {"l": 487.47034, "t": 283.48654, "r": 507.17849999999993, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": [{"id": 11, "label": "text", "bbox": {"l": 233.94400000000002, "t": 140.22351000000003, "r": 270.04272, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 5, "text": "% of Total", "bbox": {"l": 233.94400000000002, "t": 140.22351000000003, "r": 270.04272, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 329.04999, "t": 140.22351000000003, "r": 483.3976400000001, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": "triple inter-annotator mAP @ 0.5-0.95 (%)", "bbox": {"l": 329.04999, "t": 140.22351000000003, "r": 483.3976400000001, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 104.825, "t": 151.18255999999997, "r": 141.71277, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "class label", "bbox": {"l": 104.825, "t": 151.18255999999997, "r": 141.71277, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 175.94701, "t": 151.18255999999997, "r": 198.71269, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "Count", "bbox": {"l": 175.94701, "t": 151.18255999999997, "r": 198.71269, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 213.795, "t": 151.18255999999997, "r": 233.69144, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "Train", "bbox": {"l": 213.795, "t": 151.18255999999997, "r": 233.69144, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 249.37367, "t": 151.18255999999997, "r": 264.5, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "Test", "bbox": {"l": 249.37367, "t": 151.18255999999997, "r": 264.5, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 283.53568, "t": 151.18255999999997, "r": 295.30856, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "Val", "bbox": {"l": 283.53568, "t": 151.18255999999997, "r": 295.30856, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 314.01501, "t": 151.18255999999997, "r": 324.98093, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "All", "bbox": {"l": 314.01501, "t": 151.18255999999997, "r": 324.98093, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 343.01236, "t": 151.18255999999997, "r": 354.65076, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "Fin", "bbox": {"l": 343.01236, "t": 151.18255999999997, "r": 354.65076, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 367.84033, "t": 151.18255999999997, "r": 384.32059, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "Man", "bbox": {"l": 367.84033, "t": 151.18255999999997, "r": 384.32059, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 407.54358, "t": 151.18255999999997, "r": 418.15979, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "Sci", "bbox": {"l": 407.54358, "t": 151.18255999999997, "r": 418.15979, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 432.29979999999995, "t": 151.18255999999997, "r": 447.82962, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "Law", "bbox": {"l": 432.29979999999995, "t": 151.18255999999997, "r": 447.82962, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 465.72656, "t": 151.18255999999997, "r": 477.50842, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "Pat", "bbox": {"l": 465.72656, "t": 151.18255999999997, "r": 477.50842, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 493.52240000000006, "t": 151.18255999999997, "r": 507.17822, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "Ten", "bbox": {"l": 493.52240000000006, "t": 151.18255999999997, "r": 507.17822, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 104.825, "t": 162.53954999999996, "r": 134.01064, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "Caption", "bbox": {"l": 104.825, "t": 162.53954999999996, "r": 134.01064, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 177.866, "t": 162.53954999999996, "r": 198.71288, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "22524", "bbox": {"l": 177.866, "t": 162.53954999999996, "r": 198.71288, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 219.211, "t": 162.53954999999996, "r": 233.69174000000004, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "2.04", "bbox": {"l": 219.211, "t": 162.53954999999996, "r": 233.69174000000004, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 250.01956, "t": 162.53954999999996, "r": 264.50031, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "1.77", "bbox": {"l": 250.01956, "t": 162.53954999999996, "r": 264.50031, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 280.82812, "t": 162.53954999999996, "r": 295.30887, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "2.32", "bbox": {"l": 280.82812, "t": 162.53954999999996, "r": 295.30887, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 305.27301, "t": 162.53954999999996, "r": 324.98117, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "84-89", "bbox": {"l": 305.27301, "t": 162.53954999999996, "r": 324.98117, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 334.94284, "t": 162.53954999999996, "r": 354.651, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "40-61", "bbox": {"l": 334.94284, "t": 162.53954999999996, "r": 354.651, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 364.61267, "t": 162.53954999999996, "r": 384.32083, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "86-92", "bbox": {"l": 364.61267, "t": 162.53954999999996, "r": 384.32083, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 398.45187, "t": 162.53954999999996, "r": 418.16003, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "94-99", "bbox": {"l": 398.45187, "t": 162.53954999999996, "r": 418.16003, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 428.1217, "t": 162.53954999999996, "r": 447.82986, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "95-99", "bbox": {"l": 428.1217, "t": 162.53954999999996, "r": 447.82986, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 457.80051, "t": 162.53954999999996, "r": 477.50867, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "69-78", "bbox": {"l": 457.80051, "t": 162.53954999999996, "r": 477.50867, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 495.32489, "t": 162.53954999999996, "r": 507.17846999999995, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "n/a", "bbox": {"l": 495.32489, "t": 162.53954999999996, "r": 507.17846999999995, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 104.825, "t": 173.49854000000005, "r": 137.3282, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "Footnote", "bbox": {"l": 104.825, "t": 173.49854000000005, "r": 137.3282, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 182.035, "t": 173.49854000000005, "r": 198.71251, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "6318", "bbox": {"l": 182.035, "t": 173.49854000000005, "r": 198.71251, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 219.211, "t": 173.49854000000005, "r": 233.69174000000004, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "0.60", "bbox": {"l": 219.211, "t": 173.49854000000005, "r": 233.69174000000004, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 250.01956, "t": 173.49854000000005, "r": 264.50031, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "0.31", "bbox": {"l": 250.01956, "t": 173.49854000000005, "r": 264.50031, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 280.82812, "t": 173.49854000000005, "r": 295.30887, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "0.58", "bbox": {"l": 280.82812, "t": 173.49854000000005, "r": 295.30887, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 305.27301, "t": 173.49854000000005, "r": 324.98117, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "83-91", "bbox": {"l": 305.27301, "t": 173.49854000000005, "r": 324.98117, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 342.79739, "t": 173.49854000000005, "r": 354.65097, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "n/a", "bbox": {"l": 342.79739, "t": 173.49854000000005, "r": 354.65097, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 371.81265, "t": 173.49854000000005, "r": 384.32077, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "100", "bbox": {"l": 371.81265, "t": 173.49854000000005, "r": 384.32077, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 398.45181, "t": 173.49854000000005, "r": 418.15997, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "62-88", "bbox": {"l": 398.45181, "t": 173.49854000000005, "r": 418.15997, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 428.12164, "t": 173.49854000000005, "r": 447.8298, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "85-94", "bbox": {"l": 428.12164, "t": 173.49854000000005, "r": 447.8298, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 465.655, "t": 173.49854000000005, "r": 477.50857999999994, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "n/a", "bbox": {"l": 465.655, "t": 173.49854000000005, "r": 477.50857999999994, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 487.47025, "t": 173.49854000000005, "r": 507.17841, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "82-97", "bbox": {"l": 487.47025, "t": 173.49854000000005, "r": 507.17841, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 104.825, "t": 184.45752000000005, "r": 135.33766, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "Formula", "bbox": {"l": 104.825, "t": 184.45752000000005, "r": 135.33766, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 177.866, "t": 184.45752000000005, "r": 198.71288, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "25027", "bbox": {"l": 177.866, "t": 184.45752000000005, "r": 198.71288, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 219.211, "t": 184.45752000000005, "r": 233.69174000000004, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "2.25", "bbox": {"l": 219.211, "t": 184.45752000000005, "r": 233.69174000000004, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 250.01956, "t": 184.45752000000005, "r": 264.50031, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "1.90", "bbox": {"l": 250.01956, "t": 184.45752000000005, "r": 264.50031, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 280.82812, "t": 184.45752000000005, "r": 295.30887, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "2.96", "bbox": {"l": 280.82812, "t": 184.45752000000005, "r": 295.30887, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 305.27301, "t": 184.45752000000005, "r": 324.98117, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "83-85", "bbox": {"l": 305.27301, "t": 184.45752000000005, "r": 324.98117, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 342.79739, "t": 184.45752000000005, "r": 354.65097, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "n/a", "bbox": {"l": 342.79739, "t": 184.45752000000005, "r": 354.65097, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 372.46719, "t": 184.45752000000005, "r": 384.32077, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "n/a", "bbox": {"l": 372.46719, "t": 184.45752000000005, "r": 384.32077, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 398.45181, "t": 184.45752000000005, "r": 418.15997, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "84-87", "bbox": {"l": 398.45181, "t": 184.45752000000005, "r": 418.15997, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 428.12164, "t": 184.45752000000005, "r": 447.8298, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "86-96", "bbox": {"l": 428.12164, "t": 184.45752000000005, "r": 447.8298, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 465.655, "t": 184.45752000000005, "r": 477.50857999999994, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "n/a", "bbox": {"l": 465.655, "t": 184.45752000000005, "r": 477.50857999999994, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 495.3248, "t": 184.45752000000005, "r": 507.17838000000006, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "n/a", "bbox": {"l": 495.3248, "t": 184.45752000000005, "r": 507.17838000000006, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 104.825, "t": 195.41656, "r": 137.70479, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "List-item", "bbox": {"l": 104.825, "t": 195.41656, "r": 137.70479, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 173.69701, "t": 195.41656, "r": 198.71326, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "185660", "bbox": {"l": 173.69701, "t": 195.41656, "r": 198.71326, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 215.04201, "t": 195.41656, "r": 233.69212, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "17.19", "bbox": {"l": 215.04201, "t": 195.41656, "r": 233.69212, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 245.85056, "t": 195.41656, "r": 264.50067, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "13.34", "bbox": {"l": 245.85056, "t": 195.41656, "r": 264.50067, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 276.65912, "t": 195.41656, "r": 295.30923, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "15.82", "bbox": {"l": 276.65912, "t": 195.41656, "r": 295.30923, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 305.27301, "t": 195.41656, "r": 324.98117, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "87-88", "bbox": {"l": 305.27301, "t": 195.41656, "r": 324.98117, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 334.94284, "t": 195.41656, "r": 354.651, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "74-83", "bbox": {"l": 334.94284, "t": 195.41656, "r": 354.651, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 364.61267, "t": 195.41656, "r": 384.32083, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "90-92", "bbox": {"l": 364.61267, "t": 195.41656, "r": 384.32083, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 398.45187, "t": 195.41656, "r": 418.16003, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "97-97", "bbox": {"l": 398.45187, "t": 195.41656, "r": 418.16003, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 428.1217, "t": 195.41656, "r": 447.82986, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "81-85", "bbox": {"l": 428.1217, "t": 195.41656, "r": 447.82986, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 457.80051, "t": 195.41656, "r": 477.50867, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "75-88", "bbox": {"l": 457.80051, "t": 195.41656, "r": 477.50867, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 487.47034, "t": 195.41656, "r": 507.17849999999993, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "93-95", "bbox": {"l": 487.47034, "t": 195.41656, "r": 507.17849999999993, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 104.825, "t": 206.37554999999998, "r": 147.35262, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "Page-footer", "bbox": {"l": 104.825, "t": 206.37554999999998, "r": 147.35262, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 177.866, "t": 206.37554999999998, "r": 198.71288, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "70878", "bbox": {"l": 177.866, "t": 206.37554999999998, "r": 198.71288, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 219.211, "t": 206.37554999999998, "r": 233.69174000000004, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "6.51", "bbox": {"l": 219.211, "t": 206.37554999999998, "r": 233.69174000000004, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 250.01956, "t": 206.37554999999998, "r": 264.50031, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "5.58", "bbox": {"l": 250.01956, "t": 206.37554999999998, "r": 264.50031, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 280.82812, "t": 206.37554999999998, "r": 295.30887, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "6.00", "bbox": {"l": 280.82812, "t": 206.37554999999998, "r": 295.30887, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 305.27301, "t": 206.37554999999998, "r": 324.98117, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "93-94", "bbox": {"l": 305.27301, "t": 206.37554999999998, "r": 324.98117, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 334.94284, "t": 206.37554999999998, "r": 354.651, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "88-90", "bbox": {"l": 334.94284, "t": 206.37554999999998, "r": 354.651, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 364.61267, "t": 206.37554999999998, "r": 384.32083, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "95-96", "bbox": {"l": 364.61267, "t": 206.37554999999998, "r": 384.32083, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 405.65189, "t": 206.37554999999998, "r": 418.16, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "100", "bbox": {"l": 405.65189, "t": 206.37554999999998, "r": 418.16, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 428.12167, "t": 206.37554999999998, "r": 447.82983, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "92-97", "bbox": {"l": 428.12167, "t": 206.37554999999998, "r": 447.82983, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 465.00049, "t": 206.37554999999998, "r": 477.5086099999999, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "100", "bbox": {"l": 465.00049, "t": 206.37554999999998, "r": 477.5086099999999, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 487.47028, "t": 206.37554999999998, "r": 507.17843999999997, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "96-98", "bbox": {"l": 487.47028, "t": 206.37554999999998, "r": 507.17843999999997, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 104.825, "t": 217.33452999999997, "r": 150.10532, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "Page-header", "bbox": {"l": 104.825, "t": 217.33452999999997, "r": 150.10532, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 177.866, "t": 217.33452999999997, "r": 198.71288, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "58022", "bbox": {"l": 177.866, "t": 217.33452999999997, "r": 198.71288, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 219.211, "t": 217.33452999999997, "r": 233.69174000000004, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "5.10", "bbox": {"l": 219.211, "t": 217.33452999999997, "r": 233.69174000000004, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 250.01956, "t": 217.33452999999997, "r": 264.50031, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "6.70", "bbox": {"l": 250.01956, "t": 217.33452999999997, "r": 264.50031, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 280.82812, "t": 217.33452999999997, "r": 295.30887, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "5.06", "bbox": {"l": 280.82812, "t": 217.33452999999997, "r": 295.30887, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 305.27301, "t": 217.33452999999997, "r": 324.98117, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "85-89", "bbox": {"l": 305.27301, "t": 217.33452999999997, "r": 324.98117, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 334.94284, "t": 217.33452999999997, "r": 354.651, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "66-76", "bbox": {"l": 334.94284, "t": 217.33452999999997, "r": 354.651, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 364.61267, "t": 217.33452999999997, "r": 384.32083, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "90-94", "bbox": {"l": 364.61267, "t": 217.33452999999997, "r": 384.32083, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 394.2825, "t": 217.33452999999997, "r": 418.16003, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "98-100", "bbox": {"l": 394.2825, "t": 217.33452999999997, "r": 418.16003, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 428.1217, "t": 217.33452999999997, "r": 447.82986, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "91-92", "bbox": {"l": 428.1217, "t": 217.33452999999997, "r": 447.82986, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 457.80051, "t": 217.33452999999997, "r": 477.50867, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "97-99", "bbox": {"l": 457.80051, "t": 217.33452999999997, "r": 477.50867, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 487.47034, "t": 217.33452999999997, "r": 507.17849999999993, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "81-86", "bbox": {"l": 487.47034, "t": 217.33452999999997, "r": 507.17849999999993, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 104.825, "t": 228.29351999999994, "r": 130.80963, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "Picture", "bbox": {"l": 104.825, "t": 228.29351999999994, "r": 130.80963, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 177.866, "t": 228.29351999999994, "r": 198.71288, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "45976", "bbox": {"l": 177.866, "t": 228.29351999999994, "r": 198.71288, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 219.211, "t": 228.29351999999994, "r": 233.69174000000004, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "4.21", "bbox": {"l": 219.211, "t": 228.29351999999994, "r": 233.69174000000004, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 250.01956, "t": 228.29351999999994, "r": 264.50031, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "2.78", "bbox": {"l": 250.01956, "t": 228.29351999999994, "r": 264.50031, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 280.82812, "t": 228.29351999999994, "r": 295.30887, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "5.31", "bbox": {"l": 280.82812, "t": 228.29351999999994, "r": 295.30887, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 305.27301, "t": 228.29351999999994, "r": 324.98117, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "69-71", "bbox": {"l": 305.27301, "t": 228.29351999999994, "r": 324.98117, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 334.94284, "t": 228.29351999999994, "r": 354.651, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "56-59", "bbox": {"l": 334.94284, "t": 228.29351999999994, "r": 354.651, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 364.61267, "t": 228.29351999999994, "r": 384.32083, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "82-86", "bbox": {"l": 364.61267, "t": 228.29351999999994, "r": 384.32083, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 398.45187, "t": 228.29351999999994, "r": 418.16003, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "69-82", "bbox": {"l": 398.45187, "t": 228.29351999999994, "r": 418.16003, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 428.1217, "t": 228.29351999999994, "r": 447.82986, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "80-95", "bbox": {"l": 428.1217, "t": 228.29351999999994, "r": 447.82986, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 457.80051, "t": 228.29351999999994, "r": 477.50867, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "66-71", "bbox": {"l": 457.80051, "t": 228.29351999999994, "r": 477.50867, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 487.47034, "t": 228.29351999999994, "r": 507.17849999999993, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "59-76", "bbox": {"l": 487.47034, "t": 228.29351999999994, "r": 507.17849999999993, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 104.825, "t": 239.25256000000002, "r": 159.56487, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": "Section-header", "bbox": {"l": 104.825, "t": 239.25256000000002, "r": 159.56487, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 173.69701, "t": 239.25256000000002, "r": 198.71326, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "142884", "bbox": {"l": 173.69701, "t": 239.25256000000002, "r": 198.71326, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 215.04201, "t": 239.25256000000002, "r": 233.69212, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "12.60", "bbox": {"l": 215.04201, "t": 239.25256000000002, "r": 233.69212, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 245.85056, "t": 239.25256000000002, "r": 264.50067, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": "15.77", "bbox": {"l": 245.85056, "t": 239.25256000000002, "r": 264.50067, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 276.65912, "t": 239.25256000000002, "r": 295.30923, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 107, "text": "12.85", "bbox": {"l": 276.65912, "t": 239.25256000000002, "r": 295.30923, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 114, "label": "text", "bbox": {"l": 305.27301, "t": 239.25256000000002, "r": 324.98117, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 108, "text": "83-84", "bbox": {"l": 305.27301, "t": 239.25256000000002, "r": 324.98117, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 115, "label": "text", "bbox": {"l": 334.94284, "t": 239.25256000000002, "r": 354.651, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 109, "text": "76-81", "bbox": {"l": 334.94284, "t": 239.25256000000002, "r": 354.651, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 116, "label": "text", "bbox": {"l": 364.61267, "t": 239.25256000000002, "r": 384.32083, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 110, "text": "90-92", "bbox": {"l": 364.61267, "t": 239.25256000000002, "r": 384.32083, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 117, "label": "text", "bbox": {"l": 398.45187, "t": 239.25256000000002, "r": 418.16003, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 111, "text": "94-95", "bbox": {"l": 398.45187, "t": 239.25256000000002, "r": 418.16003, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 118, "label": "text", "bbox": {"l": 428.1217, "t": 239.25256000000002, "r": 447.82986, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 112, "text": "87-94", "bbox": {"l": 428.1217, "t": 239.25256000000002, "r": 447.82986, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 119, "label": "text", "bbox": {"l": 457.80051, "t": 239.25256000000002, "r": 477.50867, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 113, "text": "69-73", "bbox": {"l": 457.80051, "t": 239.25256000000002, "r": 477.50867, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 120, "label": "text", "bbox": {"l": 487.47034, "t": 239.25256000000002, "r": 507.17849999999993, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 114, "text": "78-86", "bbox": {"l": 487.47034, "t": 239.25256000000002, "r": 507.17849999999993, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 121, "label": "text", "bbox": {"l": 104.825, "t": 250.21155, "r": 124.63177, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 115, "text": "Table", "bbox": {"l": 104.825, "t": 250.21155, "r": 124.63177, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 122, "label": "text", "bbox": {"l": 177.866, "t": 250.21155, "r": 198.71288, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 116, "text": "34733", "bbox": {"l": 177.866, "t": 250.21155, "r": 198.71288, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 123, "label": "text", "bbox": {"l": 219.211, "t": 250.21155, "r": 233.69174000000004, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 117, "text": "3.20", "bbox": {"l": 219.211, "t": 250.21155, "r": 233.69174000000004, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 124, "label": "text", "bbox": {"l": 250.01956, "t": 250.21155, "r": 264.50031, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 118, "text": "2.27", "bbox": {"l": 250.01956, "t": 250.21155, "r": 264.50031, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 125, "label": "text", "bbox": {"l": 280.82812, "t": 250.21155, "r": 295.30887, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 119, "text": "3.60", "bbox": {"l": 280.82812, "t": 250.21155, "r": 295.30887, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 126, "label": "text", "bbox": {"l": 305.27301, "t": 250.21155, "r": 324.98117, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 120, "text": "77-81", "bbox": {"l": 305.27301, "t": 250.21155, "r": 324.98117, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 127, "label": "text", "bbox": {"l": 334.94284, "t": 250.21155, "r": 354.651, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 121, "text": "75-80", "bbox": {"l": 334.94284, "t": 250.21155, "r": 354.651, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 128, "label": "text", "bbox": {"l": 364.61267, "t": 250.21155, "r": 384.32083, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 122, "text": "83-86", "bbox": {"l": 364.61267, "t": 250.21155, "r": 384.32083, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 129, "label": "text", "bbox": {"l": 398.45187, "t": 250.21155, "r": 418.16003, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 123, "text": "98-99", "bbox": {"l": 398.45187, "t": 250.21155, "r": 418.16003, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 130, "label": "text", "bbox": {"l": 428.1217, "t": 250.21155, "r": 447.82986, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 124, "text": "58-80", "bbox": {"l": 428.1217, "t": 250.21155, "r": 447.82986, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 131, "label": "text", "bbox": {"l": 457.80051, "t": 250.21155, "r": 477.50867, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 125, "text": "79-84", "bbox": {"l": 457.80051, "t": 250.21155, "r": 477.50867, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 132, "label": "text", "bbox": {"l": 487.47034, "t": 250.21155, "r": 507.17849999999993, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 126, "text": "70-85", "bbox": {"l": 487.47034, "t": 250.21155, "r": 507.17849999999993, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 133, "label": "text", "bbox": {"l": 104.825, "t": 261.16956000000005, "r": 120.78519, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 127, "text": "Text", "bbox": {"l": 104.825, "t": 261.16956000000005, "r": 120.78519, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 134, "label": "text", "bbox": {"l": 173.69701, "t": 261.16956000000005, "r": 198.71326, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 128, "text": "510377", "bbox": {"l": 173.69701, "t": 261.16956000000005, "r": 198.71326, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 135, "label": "text", "bbox": {"l": 215.04201, "t": 261.16956000000005, "r": 233.69212, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 129, "text": "45.82", "bbox": {"l": 215.04201, "t": 261.16956000000005, "r": 233.69212, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 136, "label": "text", "bbox": {"l": 245.85056, "t": 261.16956000000005, "r": 264.50067, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 130, "text": "49.28", "bbox": {"l": 245.85056, "t": 261.16956000000005, "r": 264.50067, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 137, "label": "text", "bbox": {"l": 276.65912, "t": 261.16956000000005, "r": 295.30923, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 131, "text": "45.00", "bbox": {"l": 276.65912, "t": 261.16956000000005, "r": 295.30923, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 138, "label": "text", "bbox": {"l": 305.27301, "t": 261.16956000000005, "r": 324.98117, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 132, "text": "84-86", "bbox": {"l": 305.27301, "t": 261.16956000000005, "r": 324.98117, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 139, "label": "text", "bbox": {"l": 334.94284, "t": 261.16956000000005, "r": 354.651, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 133, "text": "81-86", "bbox": {"l": 334.94284, "t": 261.16956000000005, "r": 354.651, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 140, "label": "text", "bbox": {"l": 364.61267, "t": 261.16956000000005, "r": 384.32083, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 134, "text": "88-93", "bbox": {"l": 364.61267, "t": 261.16956000000005, "r": 384.32083, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 141, "label": "text", "bbox": {"l": 398.45187, "t": 261.16956000000005, "r": 418.16003, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 135, "text": "89-93", "bbox": {"l": 398.45187, "t": 261.16956000000005, "r": 418.16003, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 142, "label": "text", "bbox": {"l": 428.1217, "t": 261.16956000000005, "r": 447.82986, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 136, "text": "87-92", "bbox": {"l": 428.1217, "t": 261.16956000000005, "r": 447.82986, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 143, "label": "text", "bbox": {"l": 457.80051, "t": 261.16956000000005, "r": 477.50867, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 137, "text": "71-79", "bbox": {"l": 457.80051, "t": 261.16956000000005, "r": 477.50867, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 144, "label": "text", "bbox": {"l": 487.47034, "t": 261.16956000000005, "r": 507.17849999999993, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 138, "text": "87-95", "bbox": {"l": 487.47034, "t": 261.16956000000005, "r": 507.17849999999993, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 145, "label": "text", "bbox": {"l": 104.825, "t": 272.12854000000004, "r": 121.81633, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 139, "text": "Title", "bbox": {"l": 104.825, "t": 272.12854000000004, "r": 121.81633, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 146, "label": "text", "bbox": {"l": 182.035, "t": 272.12854000000004, "r": 198.71251, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 140, "text": "5071", "bbox": {"l": 182.035, "t": 272.12854000000004, "r": 198.71251, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 147, "label": "text", "bbox": {"l": 219.211, "t": 272.12854000000004, "r": 233.69174000000004, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 141, "text": "0.47", "bbox": {"l": 219.211, "t": 272.12854000000004, "r": 233.69174000000004, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 148, "label": "text", "bbox": {"l": 250.01956, "t": 272.12854000000004, "r": 264.50031, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 142, "text": "0.30", "bbox": {"l": 250.01956, "t": 272.12854000000004, "r": 264.50031, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 149, "label": "text", "bbox": {"l": 280.82812, "t": 272.12854000000004, "r": 295.30887, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 143, "text": "0.50", "bbox": {"l": 280.82812, "t": 272.12854000000004, "r": 295.30887, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 150, "label": "text", "bbox": {"l": 305.27301, "t": 272.12854000000004, "r": 324.98117, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 144, "text": "60-72", "bbox": {"l": 305.27301, "t": 272.12854000000004, "r": 324.98117, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 151, "label": "text", "bbox": {"l": 334.94284, "t": 272.12854000000004, "r": 354.651, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 145, "text": "24-63", "bbox": {"l": 334.94284, "t": 272.12854000000004, "r": 354.651, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 152, "label": "text", "bbox": {"l": 364.61267, "t": 272.12854000000004, "r": 384.32083, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 146, "text": "50-63", "bbox": {"l": 364.61267, "t": 272.12854000000004, "r": 384.32083, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 153, "label": "text", "bbox": {"l": 394.2825, "t": 272.12854000000004, "r": 418.16003, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 147, "text": "94-100", "bbox": {"l": 394.2825, "t": 272.12854000000004, "r": 418.16003, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 154, "label": "text", "bbox": {"l": 428.1217, "t": 272.12854000000004, "r": 447.82986, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 148, "text": "82-96", "bbox": {"l": 428.1217, "t": 272.12854000000004, "r": 447.82986, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 155, "label": "text", "bbox": {"l": 457.80051, "t": 272.12854000000004, "r": 477.50867, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 149, "text": "68-79", "bbox": {"l": 457.80051, "t": 272.12854000000004, "r": 477.50867, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 156, "label": "text", "bbox": {"l": 487.47034, "t": 272.12854000000004, "r": 507.17849999999993, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 150, "text": "24-56", "bbox": {"l": 487.47034, "t": 272.12854000000004, "r": 507.17849999999993, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 157, "label": "text", "bbox": {"l": 104.825, "t": 283.48654, "r": 123.43028, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 151, "text": "Total", "bbox": {"l": 104.825, "t": 283.48654, "r": 123.43028, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 158, "label": "text", "bbox": {"l": 169.52699, "t": 283.48654, "r": 198.71263, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 152, "text": "1107470", "bbox": {"l": 169.52699, "t": 283.48654, "r": 198.71263, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 159, "label": "text", "bbox": {"l": 208.675, "t": 283.48654, "r": 233.69124999999997, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 153, "text": "941123", "bbox": {"l": 208.675, "t": 283.48654, "r": 233.69124999999997, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 160, "label": "text", "bbox": {"l": 243.65291999999997, "t": 283.48654, "r": 264.49982, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 154, "text": "99816", "bbox": {"l": 243.65291999999997, "t": 283.48654, "r": 264.49982, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 161, "label": "text", "bbox": {"l": 274.46149, "t": 283.48654, "r": 295.30838, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 155, "text": "66531", "bbox": {"l": 274.46149, "t": 283.48654, "r": 295.30838, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 162, "label": "text", "bbox": {"l": 305.27301, "t": 283.48654, "r": 324.98117, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 156, "text": "82-83", "bbox": {"l": 305.27301, "t": 283.48654, "r": 324.98117, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 163, "label": "text", "bbox": {"l": 334.94284, "t": 283.48654, "r": 354.651, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 157, "text": "71-74", "bbox": {"l": 334.94284, "t": 283.48654, "r": 354.651, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 164, "label": "text", "bbox": {"l": 364.61267, "t": 283.48654, "r": 384.32083, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 158, "text": "79-81", "bbox": {"l": 364.61267, "t": 283.48654, "r": 384.32083, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 165, "label": "text", "bbox": {"l": 398.45187, "t": 283.48654, "r": 418.16003, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 159, "text": "89-94", "bbox": {"l": 398.45187, "t": 283.48654, "r": 418.16003, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 166, "label": "text", "bbox": {"l": 428.1217, "t": 283.48654, "r": 447.82986, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 160, "text": "86-91", "bbox": {"l": 428.1217, "t": 283.48654, "r": 447.82986, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 167, "label": "text", "bbox": {"l": 457.80051, "t": 283.48654, "r": 477.50867, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 161, "text": "71-76", "bbox": {"l": 457.80051, "t": 283.48654, "r": 477.50867, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 168, "label": "text", "bbox": {"l": 487.47034, "t": 283.48654, "r": 507.17849999999993, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 162, "text": "68-85", "bbox": {"l": 487.47034, "t": 283.48654, "r": 507.17849999999993, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 9, "label": "caption", "bbox": {"l": 53.79800000000001, "t": 554.00999, "r": 295.64874, "b": 606.31924, "coord_origin": "TOPLEFT"}, "confidence": 0.810490071773529, "cells": [{"id": 163, "text": "Figure 3: Corpus Conversion Service annotation user inter-", "bbox": {"l": 53.79800000000001, "t": 554.00999, "r": 295.64871, "b": 562.48325, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "face. The PDF page is shown in the background, with over-", "bbox": {"l": 53.79800000000001, "t": 564.96899, "r": 295.64874, "b": 573.44225, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "laid text-cells (in darker shades). The annotation boxes can", "bbox": {"l": 53.79800000000001, "t": 575.92799, "r": 294.04376, "b": 584.40125, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "be drawn by dragging a rectangle over each segment with", "bbox": {"l": 53.79800000000001, "t": 586.88699, "r": 294.04373, "b": 595.36024, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "the respective label from the palette on the right.", "bbox": {"l": 53.79800000000001, "t": 597.84599, "r": 252.78931000000003, "b": 606.31924, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "text", "bbox": {"l": 53.466999, "t": 634.29155, "r": 294.04745, "b": 675.54317, "coord_origin": "TOPLEFT"}, "confidence": 0.980393648147583, "cells": [{"id": 168, "text": "we distributed the annotation workload and performed continuous", "bbox": {"l": 53.466999, "t": 634.29155, "r": 294.04745, "b": 642.66617, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "quality controls. Phase one and two required a small team of experts", "bbox": {"l": 53.79800000000001, "t": 645.25055, "r": 294.04535, "b": 653.62517, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "only. For phases three and four, a group of 40 dedicated annotators", "bbox": {"l": 53.79800000000001, "t": 656.20955, "r": 294.04422, "b": 664.58417, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "were assembled and supervised.", "bbox": {"l": 53.466999, "t": 667.16856, "r": 170.58611, "b": 675.54317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "text", "bbox": {"l": 53.79800000000001, "t": 678.01099, "r": 295.55844, "b": 708.420174, "coord_origin": "TOPLEFT"}, "confidence": 0.9748398661613464, "cells": [{"id": 172, "text": "Phase 1: Data selection and preparation.", "bbox": {"l": 63.76099800000001, "t": 678.01099, "r": 226.72533000000004, "b": 686.48424, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "Our inclusion cri-", "bbox": {"l": 229.06900000000002, "t": 678.12756, "r": 295.55844, "b": 686.50217, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "teria for documents were described in Section 3. A large effort went", "bbox": {"l": 53.79800000000001, "t": 689.08656, "r": 294.04538, "b": 697.461174, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "into ensuring that all documents are free to use. The data sources", "bbox": {"l": 53.79800000000001, "t": 700.045555, "r": 294.04642, "b": 708.420174, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "text", "bbox": {"l": 317.95499, "t": 312.07953, "r": 559.18536, "b": 375.24817, "coord_origin": "TOPLEFT"}, "confidence": 0.9818483591079712, "cells": [{"id": 176, "text": "include publication repositories such as arXiv$^{3}$, government offices,", "bbox": {"l": 317.95499, "t": 312.07953, "r": 559.18536, "b": 320.45416000000006, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "company websites as well as data directory services for financial", "bbox": {"l": 317.95499, "t": 323.03754, "r": 558.19843, "b": 331.41217, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "reports and patents. Scanned documents were excluded wherever", "bbox": {"l": 317.95499, "t": 333.99655, "r": 558.36963, "b": 342.37119, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "possible because they can be rotated or skewed. This would not", "bbox": {"l": 317.95499, "t": 344.95554, "r": 558.2041, "b": 353.33017, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "allow us to perform annotation with rectangular bounding-boxes", "bbox": {"l": 317.95499, "t": 355.91455, "r": 558.20294, "b": 364.28918, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "and therefore complicate the annotation process.", "bbox": {"l": 317.95499, "t": 366.87354, "r": 496.71826, "b": 375.24817, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 317.95499, "t": 377.8325500000001, "r": 559.71307, "b": 506.75516, "coord_origin": "TOPLEFT"}, "confidence": 0.9866719841957092, "cells": [{"id": 182, "text": "Preparation work included uploading and parsing the sourced", "bbox": {"l": 327.918, "t": 377.8325500000001, "r": 558.20618, "b": 386.20717999999994, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "PDF documents in the Corpus Conversion Service (CCS) [22], a", "bbox": {"l": 317.95499, "t": 388.79153, "r": 558.2019, "b": 397.16617, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "cloud-native platform which provides a visual annotation interface", "bbox": {"l": 317.95499, "t": 399.75055, "r": 558.20233, "b": 408.12518, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": "and allows for dataset inspection and analysis. The annotation in-", "bbox": {"l": 317.95499, "t": 410.7095299999999, "r": 559.71277, "b": 419.08417, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "terface of CCS is shown in Figure 3. The desired balance of pages", "bbox": {"l": 317.95499, "t": 421.66855000000004, "r": 558.20062, "b": 430.04318, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "between the different document categories was achieved by se-", "bbox": {"l": 317.95499, "t": 432.62753, "r": 559.71307, "b": 441.00217, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": "lective subsampling of pages with certain desired properties. For", "bbox": {"l": 317.95499, "t": 443.58554, "r": 558.36877, "b": 451.96017, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "example, we made sure to include the title page of each document", "bbox": {"l": 317.95499, "t": 454.54453, "r": 558.20428, "b": 462.91916, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "and bias the remaining page selection to those with figures or", "bbox": {"l": 317.95499, "t": 465.50354, "r": 558.36877, "b": 473.87817, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "tables. The latter was achieved by leveraging pre-trained object", "bbox": {"l": 317.95499, "t": 476.46252, "r": 558.20428, "b": 484.83716, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": "detection models from PubLayNet, which helped us estimate how", "bbox": {"l": 317.95499, "t": 487.42154, "r": 558.5307, "b": 495.79617, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "many figures and tables a given page contains.", "bbox": {"l": 317.95499, "t": 498.38052, "r": 488.46914999999996, "b": 506.75516, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 317.62299, "t": 509.22299, "r": 559.71765, "b": 693.0561749999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9847556948661804, "cells": [{"id": 194, "text": "Phase 2: Label selection and guideline.", "bbox": {"l": 327.918, "t": 509.22299, "r": 482.41809, "b": 517.69623, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "We reviewed the col-", "bbox": {"l": 484.474, "t": 509.33954, "r": 559.71765, "b": 517.71417, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "lected documents and identified the most common structural fea-", "bbox": {"l": 317.95499, "t": 520.29855, "r": 559.71619, "b": 528.67319, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "tures they exhibit. This was achieved by identifying recurrent layout", "bbox": {"l": 317.95499, "t": 531.2575400000001, "r": 558.20239, "b": 539.63217, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "elements and lead us to the definition of 11 distinct class labels.", "bbox": {"l": 317.95499, "t": 542.21655, "r": 559.58502, "b": 550.59117, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "These 11 class labels are", "bbox": {"l": 317.686, "t": 553.17456, "r": 404.14197, "b": 561.54918, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "Caption", "bbox": {"l": 406.26599, "t": 553.21939, "r": 433.84860000000003, "b": 561.5581500000001, "coord_origin": "TOPLEFT"}}, {"id": 201, "text": ",", "bbox": {"l": 433.84799, "t": 553.17456, "r": 435.78115999999994, "b": 561.54918, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": "Footnote", "bbox": {"l": 437.9079899999999, "t": 553.21939, "r": 467.23926, "b": 561.5581500000001, "coord_origin": "TOPLEFT"}}, {"id": 203, "text": ",", "bbox": {"l": 467.23999, "t": 553.17456, "r": 469.17316000000005, "b": 561.54918, "coord_origin": "TOPLEFT"}}, {"id": 204, "text": "Formula", "bbox": {"l": 471.29900999999995, "t": 553.21939, "r": 500.44574000000006, "b": 561.5581500000001, "coord_origin": "TOPLEFT"}}, {"id": 205, "text": ",", "bbox": {"l": 500.44601000000006, "t": 553.17456, "r": 502.37918, "b": 561.54918, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": "List-item", "bbox": {"l": 504.505, "t": 553.21939, "r": 535.74304, "b": 561.5581500000001, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": ",", "bbox": {"l": 535.74298, "t": 553.17456, "r": 537.67615, "b": 561.54918, "coord_origin": "TOPLEFT"}}, {"id": 208, "text": "Page-", "bbox": {"l": 539.802, "t": 553.21939, "r": 559.09839, "b": 561.5581500000001, "coord_origin": "TOPLEFT"}}, {"id": 209, "text": "footer", "bbox": {"l": 317.95499, "t": 564.17839, "r": 338.80725, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": ",", "bbox": {"l": 338.806, "t": 564.13356, "r": 340.81805, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "Page-header", "bbox": {"l": 343.61401, "t": 564.17839, "r": 387.96164, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 212, "text": ",", "bbox": {"l": 387.961, "t": 564.13356, "r": 389.97305, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "Picture", "bbox": {"l": 392.76901, "t": 564.17839, "r": 417.84662, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 214, "text": ",", "bbox": {"l": 417.84799, "t": 564.13356, "r": 419.86005, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 215, "text": "Section-header", "bbox": {"l": 422.655, "t": 564.17839, "r": 475.56305, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 216, "text": ",", "bbox": {"l": 475.56201, "t": 564.13356, "r": 477.57407, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 217, "text": "Table", "bbox": {"l": 480.36899, "t": 564.17839, "r": 499.82196, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 218, "text": ",", "bbox": {"l": 499.8219900000001, "t": 564.13356, "r": 501.83405, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 219, "text": "Text", "bbox": {"l": 504.6290000000001, "t": 564.17839, "r": 519.7926, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 220, "text": ", and", "bbox": {"l": 519.79602, "t": 564.13356, "r": 538.37103, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 221, "text": "Title", "bbox": {"l": 541.16302, "t": 564.17839, "r": 557.57043, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 222, "text": ".", "bbox": {"l": 557.57098, "t": 564.13356, "r": 559.58307, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 223, "text": "Critical factors that were considered for the choice of these class", "bbox": {"l": 317.95499, "t": 575.09256, "r": 558.20416, "b": 583.46718, "coord_origin": "TOPLEFT"}}, {"id": 224, "text": "labels were (1) the overall occurrence of the label, (2) the specificity", "bbox": {"l": 317.95499, "t": 586.05156, "r": 558.43091, "b": 594.4261799999999, "coord_origin": "TOPLEFT"}}, {"id": 225, "text": "of the label, (3) recognisability on a single page (i.e. no need for", "bbox": {"l": 317.95499, "t": 597.0105599999999, "r": 558.36871, "b": 605.38518, "coord_origin": "TOPLEFT"}}, {"id": 226, "text": "context from previous or next page) and (4) overall coverage of the", "bbox": {"l": 317.95499, "t": 607.96956, "r": 558.20105, "b": 616.3441799999999, "coord_origin": "TOPLEFT"}}, {"id": 227, "text": "page. Specificity ensures that the choice of label is not ambiguous,", "bbox": {"l": 317.95499, "t": 618.9285600000001, "r": 559.18665, "b": 627.30318, "coord_origin": "TOPLEFT"}}, {"id": 228, "text": "while coverage ensures that all meaningful items on a page can", "bbox": {"l": 317.62299, "t": 629.88756, "r": 558.20142, "b": 638.26218, "coord_origin": "TOPLEFT"}}, {"id": 229, "text": "be annotated. We refrained from class labels that are very specific", "bbox": {"l": 317.95499, "t": 640.84656, "r": 558.20227, "b": 649.22118, "coord_origin": "TOPLEFT"}}, {"id": 230, "text": "to a document category, such as", "bbox": {"l": 317.95499, "t": 651.80556, "r": 436.90649, "b": 660.1801800000001, "coord_origin": "TOPLEFT"}}, {"id": 231, "text": "Abstract", "bbox": {"l": 439.13800000000003, "t": 651.8503900000001, "r": 469.69134999999994, "b": 660.18915, "coord_origin": "TOPLEFT"}}, {"id": 232, "text": "in the", "bbox": {"l": 472.42898999999994, "t": 651.80556, "r": 493.97348, "b": 660.1801800000001, "coord_origin": "TOPLEFT"}}, {"id": 233, "text": "Scientific Articles", "bbox": {"l": 496.207, "t": 651.8503900000001, "r": 558.20001, "b": 660.18915, "coord_origin": "TOPLEFT"}}, {"id": 234, "text": "category. We also avoided class labels that are tightly linked to the", "bbox": {"l": 317.95499, "t": 662.76456, "r": 558.20557, "b": 671.13918, "coord_origin": "TOPLEFT"}}, {"id": 235, "text": "semantics of the text. Labels such as", "bbox": {"l": 317.95499, "t": 673.7225599999999, "r": 447.65221999999994, "b": 682.09718, "coord_origin": "TOPLEFT"}}, {"id": 236, "text": "Author", "bbox": {"l": 449.85999, "t": 673.76739, "r": 474.31439, "b": 682.10614, "coord_origin": "TOPLEFT"}}, {"id": 237, "text": "and", "bbox": {"l": 477.172, "t": 673.7225599999999, "r": 490.39655, "b": 682.09718, "coord_origin": "TOPLEFT"}}, {"id": 238, "text": "Affiliation", "bbox": {"l": 492.60599, "t": 673.76739, "r": 528.29907, "b": 682.10614, "coord_origin": "TOPLEFT"}}, {"id": 239, "text": ", as seen", "bbox": {"l": 528.29901, "t": 673.7225599999999, "r": 558.20148, "b": 682.09718, "coord_origin": "TOPLEFT"}}, {"id": 240, "text": "in DocBank, are often only distinguishable by discriminating on", "bbox": {"l": 317.95499, "t": 684.68156, "r": 558.2041, "b": 693.0561749999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "footnote", "bbox": {"l": 317.95499, "t": 702.353363, "r": 369.2457, "b": 708.86689, "coord_origin": "TOPLEFT"}, "confidence": 0.9080352783203125, "cells": [{"id": 241, "text": "$^{3}$https://arxiv.org/", "bbox": {"l": 317.95499, "t": 702.353363, "r": 369.2457, "b": 708.86689, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "picture", "bbox": {"l": 53.05912780761719, "t": 310.7912902832031, "r": 295.8506164550781, "b": 540.864013671875, "coord_origin": "TOPLEFT"}, "confidence": 0.9847871661186218, "cells": [], "children": []}]}, "tablestructure": {"table_map": {"1": {"label": "table", "id": 1, "page_no": 3, "cluster": {"id": 1, "label": "table", "bbox": {"l": 98.93103790283203, "t": 137.47547912597656, "r": 512.579833984375, "b": 294.08148193359375, "coord_origin": "TOPLEFT"}, "confidence": 0.9860090613365173, "cells": [{"id": 5, "text": "% of Total", "bbox": {"l": 233.94400000000002, "t": 140.22351000000003, "r": 270.04272, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "triple inter-annotator mAP @ 0.5-0.95 (%)", "bbox": {"l": 329.04999, "t": 140.22351000000003, "r": 483.3976400000001, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "class label", "bbox": {"l": 104.825, "t": 151.18255999999997, "r": 141.71277, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Count", "bbox": {"l": 175.94701, "t": 151.18255999999997, "r": 198.71269, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Train", "bbox": {"l": 213.795, "t": 151.18255999999997, "r": 233.69144, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Test", "bbox": {"l": 249.37367, "t": 151.18255999999997, "r": 264.5, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Val", "bbox": {"l": 283.53568, "t": 151.18255999999997, "r": 295.30856, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "All", "bbox": {"l": 314.01501, "t": 151.18255999999997, "r": 324.98093, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Fin", "bbox": {"l": 343.01236, "t": 151.18255999999997, "r": 354.65076, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Man", "bbox": {"l": 367.84033, "t": 151.18255999999997, "r": 384.32059, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Sci", "bbox": {"l": 407.54358, "t": 151.18255999999997, "r": 418.15979, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Law", "bbox": {"l": 432.29979999999995, "t": 151.18255999999997, "r": 447.82962, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "Pat", "bbox": {"l": 465.72656, "t": 151.18255999999997, "r": 477.50842, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Ten", "bbox": {"l": 493.52240000000006, "t": 151.18255999999997, "r": 507.17822, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Caption", "bbox": {"l": 104.825, "t": 162.53954999999996, "r": 134.01064, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "22524", "bbox": {"l": 177.866, "t": 162.53954999999996, "r": 198.71288, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "2.04", "bbox": {"l": 219.211, "t": 162.53954999999996, "r": 233.69174000000004, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "1.77", "bbox": {"l": 250.01956, "t": 162.53954999999996, "r": 264.50031, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "2.32", "bbox": {"l": 280.82812, "t": 162.53954999999996, "r": 295.30887, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "84-89", "bbox": {"l": 305.27301, "t": 162.53954999999996, "r": 324.98117, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "40-61", "bbox": {"l": 334.94284, "t": 162.53954999999996, "r": 354.651, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "86-92", "bbox": {"l": 364.61267, "t": 162.53954999999996, "r": 384.32083, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "94-99", "bbox": {"l": 398.45187, "t": 162.53954999999996, "r": 418.16003, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "95-99", "bbox": {"l": 428.1217, "t": 162.53954999999996, "r": 447.82986, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "69-78", "bbox": {"l": 457.80051, "t": 162.53954999999996, "r": 477.50867, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "n/a", "bbox": {"l": 495.32489, "t": 162.53954999999996, "r": 507.17846999999995, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Footnote", "bbox": {"l": 104.825, "t": 173.49854000000005, "r": 137.3282, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "6318", "bbox": {"l": 182.035, "t": 173.49854000000005, "r": 198.71251, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "0.60", "bbox": {"l": 219.211, "t": 173.49854000000005, "r": 233.69174000000004, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "0.31", "bbox": {"l": 250.01956, "t": 173.49854000000005, "r": 264.50031, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "0.58", "bbox": {"l": 280.82812, "t": 173.49854000000005, "r": 295.30887, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "83-91", "bbox": {"l": 305.27301, "t": 173.49854000000005, "r": 324.98117, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "n/a", "bbox": {"l": 342.79739, "t": 173.49854000000005, "r": 354.65097, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "100", "bbox": {"l": 371.81265, "t": 173.49854000000005, "r": 384.32077, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "62-88", "bbox": {"l": 398.45181, "t": 173.49854000000005, "r": 418.15997, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "85-94", "bbox": {"l": 428.12164, "t": 173.49854000000005, "r": 447.8298, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "n/a", "bbox": {"l": 465.655, "t": 173.49854000000005, "r": 477.50857999999994, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "82-97", "bbox": {"l": 487.47025, "t": 173.49854000000005, "r": 507.17841, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Formula", "bbox": {"l": 104.825, "t": 184.45752000000005, "r": 135.33766, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "25027", "bbox": {"l": 177.866, "t": 184.45752000000005, "r": 198.71288, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "2.25", "bbox": {"l": 219.211, "t": 184.45752000000005, "r": 233.69174000000004, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "1.90", "bbox": {"l": 250.01956, "t": 184.45752000000005, "r": 264.50031, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "2.96", "bbox": {"l": 280.82812, "t": 184.45752000000005, "r": 295.30887, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "83-85", "bbox": {"l": 305.27301, "t": 184.45752000000005, "r": 324.98117, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "n/a", "bbox": {"l": 342.79739, "t": 184.45752000000005, "r": 354.65097, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "n/a", "bbox": {"l": 372.46719, "t": 184.45752000000005, "r": 384.32077, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "84-87", "bbox": {"l": 398.45181, "t": 184.45752000000005, "r": 418.15997, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "86-96", "bbox": {"l": 428.12164, "t": 184.45752000000005, "r": 447.8298, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "n/a", "bbox": {"l": 465.655, "t": 184.45752000000005, "r": 477.50857999999994, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "n/a", "bbox": {"l": 495.3248, "t": 184.45752000000005, "r": 507.17838000000006, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "List-item", "bbox": {"l": 104.825, "t": 195.41656, "r": 137.70479, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "185660", "bbox": {"l": 173.69701, "t": 195.41656, "r": 198.71326, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "17.19", "bbox": {"l": 215.04201, "t": 195.41656, "r": 233.69212, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "13.34", "bbox": {"l": 245.85056, "t": 195.41656, "r": 264.50067, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "15.82", "bbox": {"l": 276.65912, "t": 195.41656, "r": 295.30923, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "87-88", "bbox": {"l": 305.27301, "t": 195.41656, "r": 324.98117, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "74-83", "bbox": {"l": 334.94284, "t": 195.41656, "r": 354.651, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "90-92", "bbox": {"l": 364.61267, "t": 195.41656, "r": 384.32083, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "97-97", "bbox": {"l": 398.45187, "t": 195.41656, "r": 418.16003, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "81-85", "bbox": {"l": 428.1217, "t": 195.41656, "r": 447.82986, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "75-88", "bbox": {"l": 457.80051, "t": 195.41656, "r": 477.50867, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "93-95", "bbox": {"l": 487.47034, "t": 195.41656, "r": 507.17849999999993, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "Page-footer", "bbox": {"l": 104.825, "t": 206.37554999999998, "r": 147.35262, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "70878", "bbox": {"l": 177.866, "t": 206.37554999999998, "r": 198.71288, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "6.51", "bbox": {"l": 219.211, "t": 206.37554999999998, "r": 233.69174000000004, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "5.58", "bbox": {"l": 250.01956, "t": 206.37554999999998, "r": 264.50031, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "6.00", "bbox": {"l": 280.82812, "t": 206.37554999999998, "r": 295.30887, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "93-94", "bbox": {"l": 305.27301, "t": 206.37554999999998, "r": 324.98117, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "88-90", "bbox": {"l": 334.94284, "t": 206.37554999999998, "r": 354.651, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "95-96", "bbox": {"l": 364.61267, "t": 206.37554999999998, "r": 384.32083, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "100", "bbox": {"l": 405.65189, "t": 206.37554999999998, "r": 418.16, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "92-97", "bbox": {"l": 428.12167, "t": 206.37554999999998, "r": 447.82983, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "100", "bbox": {"l": 465.00049, "t": 206.37554999999998, "r": 477.5086099999999, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "96-98", "bbox": {"l": 487.47028, "t": 206.37554999999998, "r": 507.17843999999997, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "Page-header", "bbox": {"l": 104.825, "t": 217.33452999999997, "r": 150.10532, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "58022", "bbox": {"l": 177.866, "t": 217.33452999999997, "r": 198.71288, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "5.10", "bbox": {"l": 219.211, "t": 217.33452999999997, "r": 233.69174000000004, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "6.70", "bbox": {"l": 250.01956, "t": 217.33452999999997, "r": 264.50031, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "5.06", "bbox": {"l": 280.82812, "t": 217.33452999999997, "r": 295.30887, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "85-89", "bbox": {"l": 305.27301, "t": 217.33452999999997, "r": 324.98117, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "66-76", "bbox": {"l": 334.94284, "t": 217.33452999999997, "r": 354.651, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "90-94", "bbox": {"l": 364.61267, "t": 217.33452999999997, "r": 384.32083, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "98-100", "bbox": {"l": 394.2825, "t": 217.33452999999997, "r": 418.16003, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "91-92", "bbox": {"l": 428.1217, "t": 217.33452999999997, "r": 447.82986, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "97-99", "bbox": {"l": 457.80051, "t": 217.33452999999997, "r": 477.50867, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "81-86", "bbox": {"l": 487.47034, "t": 217.33452999999997, "r": 507.17849999999993, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "Picture", "bbox": {"l": 104.825, "t": 228.29351999999994, "r": 130.80963, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "45976", "bbox": {"l": 177.866, "t": 228.29351999999994, "r": 198.71288, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "4.21", "bbox": {"l": 219.211, "t": 228.29351999999994, "r": 233.69174000000004, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "2.78", "bbox": {"l": 250.01956, "t": 228.29351999999994, "r": 264.50031, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "5.31", "bbox": {"l": 280.82812, "t": 228.29351999999994, "r": 295.30887, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "69-71", "bbox": {"l": 305.27301, "t": 228.29351999999994, "r": 324.98117, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "56-59", "bbox": {"l": 334.94284, "t": 228.29351999999994, "r": 354.651, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "82-86", "bbox": {"l": 364.61267, "t": 228.29351999999994, "r": 384.32083, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "69-82", "bbox": {"l": 398.45187, "t": 228.29351999999994, "r": 418.16003, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "80-95", "bbox": {"l": 428.1217, "t": 228.29351999999994, "r": 447.82986, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "66-71", "bbox": {"l": 457.80051, "t": 228.29351999999994, "r": 477.50867, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "59-76", "bbox": {"l": 487.47034, "t": 228.29351999999994, "r": 507.17849999999993, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "Section-header", "bbox": {"l": 104.825, "t": 239.25256000000002, "r": 159.56487, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "142884", "bbox": {"l": 173.69701, "t": 239.25256000000002, "r": 198.71326, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "12.60", "bbox": {"l": 215.04201, "t": 239.25256000000002, "r": 233.69212, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "15.77", "bbox": {"l": 245.85056, "t": 239.25256000000002, "r": 264.50067, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "12.85", "bbox": {"l": 276.65912, "t": 239.25256000000002, "r": 295.30923, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "83-84", "bbox": {"l": 305.27301, "t": 239.25256000000002, "r": 324.98117, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "76-81", "bbox": {"l": 334.94284, "t": 239.25256000000002, "r": 354.651, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "90-92", "bbox": {"l": 364.61267, "t": 239.25256000000002, "r": 384.32083, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "94-95", "bbox": {"l": 398.45187, "t": 239.25256000000002, "r": 418.16003, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "87-94", "bbox": {"l": 428.1217, "t": 239.25256000000002, "r": 447.82986, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "69-73", "bbox": {"l": 457.80051, "t": 239.25256000000002, "r": 477.50867, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "78-86", "bbox": {"l": 487.47034, "t": 239.25256000000002, "r": 507.17849999999993, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "Table", "bbox": {"l": 104.825, "t": 250.21155, "r": 124.63177, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "34733", "bbox": {"l": 177.866, "t": 250.21155, "r": 198.71288, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "3.20", "bbox": {"l": 219.211, "t": 250.21155, "r": 233.69174000000004, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "2.27", "bbox": {"l": 250.01956, "t": 250.21155, "r": 264.50031, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "3.60", "bbox": {"l": 280.82812, "t": 250.21155, "r": 295.30887, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "77-81", "bbox": {"l": 305.27301, "t": 250.21155, "r": 324.98117, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "75-80", "bbox": {"l": 334.94284, "t": 250.21155, "r": 354.651, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "83-86", "bbox": {"l": 364.61267, "t": 250.21155, "r": 384.32083, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "98-99", "bbox": {"l": 398.45187, "t": 250.21155, "r": 418.16003, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "58-80", "bbox": {"l": 428.1217, "t": 250.21155, "r": 447.82986, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "79-84", "bbox": {"l": 457.80051, "t": 250.21155, "r": 477.50867, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "70-85", "bbox": {"l": 487.47034, "t": 250.21155, "r": 507.17849999999993, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "Text", "bbox": {"l": 104.825, "t": 261.16956000000005, "r": 120.78519, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "510377", "bbox": {"l": 173.69701, "t": 261.16956000000005, "r": 198.71326, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "45.82", "bbox": {"l": 215.04201, "t": 261.16956000000005, "r": 233.69212, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "49.28", "bbox": {"l": 245.85056, "t": 261.16956000000005, "r": 264.50067, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "45.00", "bbox": {"l": 276.65912, "t": 261.16956000000005, "r": 295.30923, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "84-86", "bbox": {"l": 305.27301, "t": 261.16956000000005, "r": 324.98117, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "81-86", "bbox": {"l": 334.94284, "t": 261.16956000000005, "r": 354.651, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "88-93", "bbox": {"l": 364.61267, "t": 261.16956000000005, "r": 384.32083, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "89-93", "bbox": {"l": 398.45187, "t": 261.16956000000005, "r": 418.16003, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "87-92", "bbox": {"l": 428.1217, "t": 261.16956000000005, "r": 447.82986, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "71-79", "bbox": {"l": 457.80051, "t": 261.16956000000005, "r": 477.50867, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "87-95", "bbox": {"l": 487.47034, "t": 261.16956000000005, "r": 507.17849999999993, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "Title", "bbox": {"l": 104.825, "t": 272.12854000000004, "r": 121.81633, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "5071", "bbox": {"l": 182.035, "t": 272.12854000000004, "r": 198.71251, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "0.47", "bbox": {"l": 219.211, "t": 272.12854000000004, "r": 233.69174000000004, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "0.30", "bbox": {"l": 250.01956, "t": 272.12854000000004, "r": 264.50031, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "0.50", "bbox": {"l": 280.82812, "t": 272.12854000000004, "r": 295.30887, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "60-72", "bbox": {"l": 305.27301, "t": 272.12854000000004, "r": 324.98117, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "24-63", "bbox": {"l": 334.94284, "t": 272.12854000000004, "r": 354.651, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "50-63", "bbox": {"l": 364.61267, "t": 272.12854000000004, "r": 384.32083, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "94-100", "bbox": {"l": 394.2825, "t": 272.12854000000004, "r": 418.16003, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "82-96", "bbox": {"l": 428.1217, "t": 272.12854000000004, "r": 447.82986, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "68-79", "bbox": {"l": 457.80051, "t": 272.12854000000004, "r": 477.50867, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "24-56", "bbox": {"l": 487.47034, "t": 272.12854000000004, "r": 507.17849999999993, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "Total", "bbox": {"l": 104.825, "t": 283.48654, "r": 123.43028, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "1107470", "bbox": {"l": 169.52699, "t": 283.48654, "r": 198.71263, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "941123", "bbox": {"l": 208.675, "t": 283.48654, "r": 233.69124999999997, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "99816", "bbox": {"l": 243.65291999999997, "t": 283.48654, "r": 264.49982, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "66531", "bbox": {"l": 274.46149, "t": 283.48654, "r": 295.30838, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "82-83", "bbox": {"l": 305.27301, "t": 283.48654, "r": 324.98117, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "71-74", "bbox": {"l": 334.94284, "t": 283.48654, "r": 354.651, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "79-81", "bbox": {"l": 364.61267, "t": 283.48654, "r": 384.32083, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "89-94", "bbox": {"l": 398.45187, "t": 283.48654, "r": 418.16003, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "86-91", "bbox": {"l": 428.1217, "t": 283.48654, "r": 447.82986, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "71-76", "bbox": {"l": 457.80051, "t": 283.48654, "r": 477.50867, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "68-85", "bbox": {"l": 487.47034, "t": 283.48654, "r": 507.17849999999993, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": [{"id": 11, "label": "text", "bbox": {"l": 233.94400000000002, "t": 140.22351000000003, "r": 270.04272, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 5, "text": "% of Total", "bbox": {"l": 233.94400000000002, "t": 140.22351000000003, "r": 270.04272, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 329.04999, "t": 140.22351000000003, "r": 483.3976400000001, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": "triple inter-annotator mAP @ 0.5-0.95 (%)", "bbox": {"l": 329.04999, "t": 140.22351000000003, "r": 483.3976400000001, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 104.825, "t": 151.18255999999997, "r": 141.71277, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "class label", "bbox": {"l": 104.825, "t": 151.18255999999997, "r": 141.71277, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 175.94701, "t": 151.18255999999997, "r": 198.71269, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "Count", "bbox": {"l": 175.94701, "t": 151.18255999999997, "r": 198.71269, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 213.795, "t": 151.18255999999997, "r": 233.69144, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "Train", "bbox": {"l": 213.795, "t": 151.18255999999997, "r": 233.69144, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 249.37367, "t": 151.18255999999997, "r": 264.5, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "Test", "bbox": {"l": 249.37367, "t": 151.18255999999997, "r": 264.5, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 283.53568, "t": 151.18255999999997, "r": 295.30856, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "Val", "bbox": {"l": 283.53568, "t": 151.18255999999997, "r": 295.30856, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 314.01501, "t": 151.18255999999997, "r": 324.98093, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "All", "bbox": {"l": 314.01501, "t": 151.18255999999997, "r": 324.98093, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 343.01236, "t": 151.18255999999997, "r": 354.65076, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "Fin", "bbox": {"l": 343.01236, "t": 151.18255999999997, "r": 354.65076, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 367.84033, "t": 151.18255999999997, "r": 384.32059, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "Man", "bbox": {"l": 367.84033, "t": 151.18255999999997, "r": 384.32059, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 407.54358, "t": 151.18255999999997, "r": 418.15979, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "Sci", "bbox": {"l": 407.54358, "t": 151.18255999999997, "r": 418.15979, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 432.29979999999995, "t": 151.18255999999997, "r": 447.82962, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "Law", "bbox": {"l": 432.29979999999995, "t": 151.18255999999997, "r": 447.82962, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 465.72656, "t": 151.18255999999997, "r": 477.50842, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "Pat", "bbox": {"l": 465.72656, "t": 151.18255999999997, "r": 477.50842, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 493.52240000000006, "t": 151.18255999999997, "r": 507.17822, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "Ten", "bbox": {"l": 493.52240000000006, "t": 151.18255999999997, "r": 507.17822, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 104.825, "t": 162.53954999999996, "r": 134.01064, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "Caption", "bbox": {"l": 104.825, "t": 162.53954999999996, "r": 134.01064, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 177.866, "t": 162.53954999999996, "r": 198.71288, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "22524", "bbox": {"l": 177.866, "t": 162.53954999999996, "r": 198.71288, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 219.211, "t": 162.53954999999996, "r": 233.69174000000004, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "2.04", "bbox": {"l": 219.211, "t": 162.53954999999996, "r": 233.69174000000004, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 250.01956, "t": 162.53954999999996, "r": 264.50031, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "1.77", "bbox": {"l": 250.01956, "t": 162.53954999999996, "r": 264.50031, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 280.82812, "t": 162.53954999999996, "r": 295.30887, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "2.32", "bbox": {"l": 280.82812, "t": 162.53954999999996, "r": 295.30887, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 305.27301, "t": 162.53954999999996, "r": 324.98117, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "84-89", "bbox": {"l": 305.27301, "t": 162.53954999999996, "r": 324.98117, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 334.94284, "t": 162.53954999999996, "r": 354.651, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "40-61", "bbox": {"l": 334.94284, "t": 162.53954999999996, "r": 354.651, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 364.61267, "t": 162.53954999999996, "r": 384.32083, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "86-92", "bbox": {"l": 364.61267, "t": 162.53954999999996, "r": 384.32083, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 398.45187, "t": 162.53954999999996, "r": 418.16003, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "94-99", "bbox": {"l": 398.45187, "t": 162.53954999999996, "r": 418.16003, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 428.1217, "t": 162.53954999999996, "r": 447.82986, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "95-99", "bbox": {"l": 428.1217, "t": 162.53954999999996, "r": 447.82986, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 457.80051, "t": 162.53954999999996, "r": 477.50867, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "69-78", "bbox": {"l": 457.80051, "t": 162.53954999999996, "r": 477.50867, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 495.32489, "t": 162.53954999999996, "r": 507.17846999999995, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "n/a", "bbox": {"l": 495.32489, "t": 162.53954999999996, "r": 507.17846999999995, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 104.825, "t": 173.49854000000005, "r": 137.3282, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "Footnote", "bbox": {"l": 104.825, "t": 173.49854000000005, "r": 137.3282, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 182.035, "t": 173.49854000000005, "r": 198.71251, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "6318", "bbox": {"l": 182.035, "t": 173.49854000000005, "r": 198.71251, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 219.211, "t": 173.49854000000005, "r": 233.69174000000004, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "0.60", "bbox": {"l": 219.211, "t": 173.49854000000005, "r": 233.69174000000004, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 250.01956, "t": 173.49854000000005, "r": 264.50031, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "0.31", "bbox": {"l": 250.01956, "t": 173.49854000000005, "r": 264.50031, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 280.82812, "t": 173.49854000000005, "r": 295.30887, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "0.58", "bbox": {"l": 280.82812, "t": 173.49854000000005, "r": 295.30887, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 305.27301, "t": 173.49854000000005, "r": 324.98117, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "83-91", "bbox": {"l": 305.27301, "t": 173.49854000000005, "r": 324.98117, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 342.79739, "t": 173.49854000000005, "r": 354.65097, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "n/a", "bbox": {"l": 342.79739, "t": 173.49854000000005, "r": 354.65097, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 371.81265, "t": 173.49854000000005, "r": 384.32077, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "100", "bbox": {"l": 371.81265, "t": 173.49854000000005, "r": 384.32077, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 398.45181, "t": 173.49854000000005, "r": 418.15997, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "62-88", "bbox": {"l": 398.45181, "t": 173.49854000000005, "r": 418.15997, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 428.12164, "t": 173.49854000000005, "r": 447.8298, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "85-94", "bbox": {"l": 428.12164, "t": 173.49854000000005, "r": 447.8298, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 465.655, "t": 173.49854000000005, "r": 477.50857999999994, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "n/a", "bbox": {"l": 465.655, "t": 173.49854000000005, "r": 477.50857999999994, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 487.47025, "t": 173.49854000000005, "r": 507.17841, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "82-97", "bbox": {"l": 487.47025, "t": 173.49854000000005, "r": 507.17841, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 104.825, "t": 184.45752000000005, "r": 135.33766, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "Formula", "bbox": {"l": 104.825, "t": 184.45752000000005, "r": 135.33766, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 177.866, "t": 184.45752000000005, "r": 198.71288, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "25027", "bbox": {"l": 177.866, "t": 184.45752000000005, "r": 198.71288, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 219.211, "t": 184.45752000000005, "r": 233.69174000000004, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "2.25", "bbox": {"l": 219.211, "t": 184.45752000000005, "r": 233.69174000000004, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 250.01956, "t": 184.45752000000005, "r": 264.50031, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "1.90", "bbox": {"l": 250.01956, "t": 184.45752000000005, "r": 264.50031, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 280.82812, "t": 184.45752000000005, "r": 295.30887, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "2.96", "bbox": {"l": 280.82812, "t": 184.45752000000005, "r": 295.30887, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 305.27301, "t": 184.45752000000005, "r": 324.98117, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "83-85", "bbox": {"l": 305.27301, "t": 184.45752000000005, "r": 324.98117, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 342.79739, "t": 184.45752000000005, "r": 354.65097, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "n/a", "bbox": {"l": 342.79739, "t": 184.45752000000005, "r": 354.65097, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 372.46719, "t": 184.45752000000005, "r": 384.32077, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "n/a", "bbox": {"l": 372.46719, "t": 184.45752000000005, "r": 384.32077, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 398.45181, "t": 184.45752000000005, "r": 418.15997, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "84-87", "bbox": {"l": 398.45181, "t": 184.45752000000005, "r": 418.15997, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 428.12164, "t": 184.45752000000005, "r": 447.8298, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "86-96", "bbox": {"l": 428.12164, "t": 184.45752000000005, "r": 447.8298, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 465.655, "t": 184.45752000000005, "r": 477.50857999999994, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "n/a", "bbox": {"l": 465.655, "t": 184.45752000000005, "r": 477.50857999999994, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 495.3248, "t": 184.45752000000005, "r": 507.17838000000006, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "n/a", "bbox": {"l": 495.3248, "t": 184.45752000000005, "r": 507.17838000000006, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 104.825, "t": 195.41656, "r": 137.70479, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "List-item", "bbox": {"l": 104.825, "t": 195.41656, "r": 137.70479, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 173.69701, "t": 195.41656, "r": 198.71326, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "185660", "bbox": {"l": 173.69701, "t": 195.41656, "r": 198.71326, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 215.04201, "t": 195.41656, "r": 233.69212, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "17.19", "bbox": {"l": 215.04201, "t": 195.41656, "r": 233.69212, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 245.85056, "t": 195.41656, "r": 264.50067, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "13.34", "bbox": {"l": 245.85056, "t": 195.41656, "r": 264.50067, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 276.65912, "t": 195.41656, "r": 295.30923, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "15.82", "bbox": {"l": 276.65912, "t": 195.41656, "r": 295.30923, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 305.27301, "t": 195.41656, "r": 324.98117, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "87-88", "bbox": {"l": 305.27301, "t": 195.41656, "r": 324.98117, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 334.94284, "t": 195.41656, "r": 354.651, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "74-83", "bbox": {"l": 334.94284, "t": 195.41656, "r": 354.651, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 364.61267, "t": 195.41656, "r": 384.32083, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "90-92", "bbox": {"l": 364.61267, "t": 195.41656, "r": 384.32083, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 398.45187, "t": 195.41656, "r": 418.16003, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "97-97", "bbox": {"l": 398.45187, "t": 195.41656, "r": 418.16003, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 428.1217, "t": 195.41656, "r": 447.82986, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "81-85", "bbox": {"l": 428.1217, "t": 195.41656, "r": 447.82986, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 457.80051, "t": 195.41656, "r": 477.50867, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "75-88", "bbox": {"l": 457.80051, "t": 195.41656, "r": 477.50867, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 487.47034, "t": 195.41656, "r": 507.17849999999993, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "93-95", "bbox": {"l": 487.47034, "t": 195.41656, "r": 507.17849999999993, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 104.825, "t": 206.37554999999998, "r": 147.35262, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "Page-footer", "bbox": {"l": 104.825, "t": 206.37554999999998, "r": 147.35262, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 177.866, "t": 206.37554999999998, "r": 198.71288, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "70878", "bbox": {"l": 177.866, "t": 206.37554999999998, "r": 198.71288, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 219.211, "t": 206.37554999999998, "r": 233.69174000000004, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "6.51", "bbox": {"l": 219.211, "t": 206.37554999999998, "r": 233.69174000000004, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 250.01956, "t": 206.37554999999998, "r": 264.50031, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "5.58", "bbox": {"l": 250.01956, "t": 206.37554999999998, "r": 264.50031, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 280.82812, "t": 206.37554999999998, "r": 295.30887, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "6.00", "bbox": {"l": 280.82812, "t": 206.37554999999998, "r": 295.30887, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 305.27301, "t": 206.37554999999998, "r": 324.98117, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "93-94", "bbox": {"l": 305.27301, "t": 206.37554999999998, "r": 324.98117, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 334.94284, "t": 206.37554999999998, "r": 354.651, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "88-90", "bbox": {"l": 334.94284, "t": 206.37554999999998, "r": 354.651, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 364.61267, "t": 206.37554999999998, "r": 384.32083, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "95-96", "bbox": {"l": 364.61267, "t": 206.37554999999998, "r": 384.32083, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 405.65189, "t": 206.37554999999998, "r": 418.16, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "100", "bbox": {"l": 405.65189, "t": 206.37554999999998, "r": 418.16, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 428.12167, "t": 206.37554999999998, "r": 447.82983, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "92-97", "bbox": {"l": 428.12167, "t": 206.37554999999998, "r": 447.82983, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 465.00049, "t": 206.37554999999998, "r": 477.5086099999999, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "100", "bbox": {"l": 465.00049, "t": 206.37554999999998, "r": 477.5086099999999, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 487.47028, "t": 206.37554999999998, "r": 507.17843999999997, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "96-98", "bbox": {"l": 487.47028, "t": 206.37554999999998, "r": 507.17843999999997, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 104.825, "t": 217.33452999999997, "r": 150.10532, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "Page-header", "bbox": {"l": 104.825, "t": 217.33452999999997, "r": 150.10532, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 177.866, "t": 217.33452999999997, "r": 198.71288, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "58022", "bbox": {"l": 177.866, "t": 217.33452999999997, "r": 198.71288, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 219.211, "t": 217.33452999999997, "r": 233.69174000000004, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "5.10", "bbox": {"l": 219.211, "t": 217.33452999999997, "r": 233.69174000000004, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 250.01956, "t": 217.33452999999997, "r": 264.50031, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "6.70", "bbox": {"l": 250.01956, "t": 217.33452999999997, "r": 264.50031, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 280.82812, "t": 217.33452999999997, "r": 295.30887, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "5.06", "bbox": {"l": 280.82812, "t": 217.33452999999997, "r": 295.30887, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 305.27301, "t": 217.33452999999997, "r": 324.98117, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "85-89", "bbox": {"l": 305.27301, "t": 217.33452999999997, "r": 324.98117, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 334.94284, "t": 217.33452999999997, "r": 354.651, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "66-76", "bbox": {"l": 334.94284, "t": 217.33452999999997, "r": 354.651, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 364.61267, "t": 217.33452999999997, "r": 384.32083, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "90-94", "bbox": {"l": 364.61267, "t": 217.33452999999997, "r": 384.32083, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 394.2825, "t": 217.33452999999997, "r": 418.16003, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "98-100", "bbox": {"l": 394.2825, "t": 217.33452999999997, "r": 418.16003, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 428.1217, "t": 217.33452999999997, "r": 447.82986, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "91-92", "bbox": {"l": 428.1217, "t": 217.33452999999997, "r": 447.82986, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 457.80051, "t": 217.33452999999997, "r": 477.50867, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "97-99", "bbox": {"l": 457.80051, "t": 217.33452999999997, "r": 477.50867, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 487.47034, "t": 217.33452999999997, "r": 507.17849999999993, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "81-86", "bbox": {"l": 487.47034, "t": 217.33452999999997, "r": 507.17849999999993, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 104.825, "t": 228.29351999999994, "r": 130.80963, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "Picture", "bbox": {"l": 104.825, "t": 228.29351999999994, "r": 130.80963, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 177.866, "t": 228.29351999999994, "r": 198.71288, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "45976", "bbox": {"l": 177.866, "t": 228.29351999999994, "r": 198.71288, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 219.211, "t": 228.29351999999994, "r": 233.69174000000004, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "4.21", "bbox": {"l": 219.211, "t": 228.29351999999994, "r": 233.69174000000004, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 250.01956, "t": 228.29351999999994, "r": 264.50031, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "2.78", "bbox": {"l": 250.01956, "t": 228.29351999999994, "r": 264.50031, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 280.82812, "t": 228.29351999999994, "r": 295.30887, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "5.31", "bbox": {"l": 280.82812, "t": 228.29351999999994, "r": 295.30887, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 305.27301, "t": 228.29351999999994, "r": 324.98117, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "69-71", "bbox": {"l": 305.27301, "t": 228.29351999999994, "r": 324.98117, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 334.94284, "t": 228.29351999999994, "r": 354.651, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "56-59", "bbox": {"l": 334.94284, "t": 228.29351999999994, "r": 354.651, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 364.61267, "t": 228.29351999999994, "r": 384.32083, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "82-86", "bbox": {"l": 364.61267, "t": 228.29351999999994, "r": 384.32083, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 398.45187, "t": 228.29351999999994, "r": 418.16003, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "69-82", "bbox": {"l": 398.45187, "t": 228.29351999999994, "r": 418.16003, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 428.1217, "t": 228.29351999999994, "r": 447.82986, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "80-95", "bbox": {"l": 428.1217, "t": 228.29351999999994, "r": 447.82986, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 457.80051, "t": 228.29351999999994, "r": 477.50867, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "66-71", "bbox": {"l": 457.80051, "t": 228.29351999999994, "r": 477.50867, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 487.47034, "t": 228.29351999999994, "r": 507.17849999999993, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "59-76", "bbox": {"l": 487.47034, "t": 228.29351999999994, "r": 507.17849999999993, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 104.825, "t": 239.25256000000002, "r": 159.56487, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": "Section-header", "bbox": {"l": 104.825, "t": 239.25256000000002, "r": 159.56487, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 173.69701, "t": 239.25256000000002, "r": 198.71326, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "142884", "bbox": {"l": 173.69701, "t": 239.25256000000002, "r": 198.71326, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 215.04201, "t": 239.25256000000002, "r": 233.69212, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "12.60", "bbox": {"l": 215.04201, "t": 239.25256000000002, "r": 233.69212, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 245.85056, "t": 239.25256000000002, "r": 264.50067, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": "15.77", "bbox": {"l": 245.85056, "t": 239.25256000000002, "r": 264.50067, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 276.65912, "t": 239.25256000000002, "r": 295.30923, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 107, "text": "12.85", "bbox": {"l": 276.65912, "t": 239.25256000000002, "r": 295.30923, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 114, "label": "text", "bbox": {"l": 305.27301, "t": 239.25256000000002, "r": 324.98117, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 108, "text": "83-84", "bbox": {"l": 305.27301, "t": 239.25256000000002, "r": 324.98117, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 115, "label": "text", "bbox": {"l": 334.94284, "t": 239.25256000000002, "r": 354.651, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 109, "text": "76-81", "bbox": {"l": 334.94284, "t": 239.25256000000002, "r": 354.651, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 116, "label": "text", "bbox": {"l": 364.61267, "t": 239.25256000000002, "r": 384.32083, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 110, "text": "90-92", "bbox": {"l": 364.61267, "t": 239.25256000000002, "r": 384.32083, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 117, "label": "text", "bbox": {"l": 398.45187, "t": 239.25256000000002, "r": 418.16003, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 111, "text": "94-95", "bbox": {"l": 398.45187, "t": 239.25256000000002, "r": 418.16003, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 118, "label": "text", "bbox": {"l": 428.1217, "t": 239.25256000000002, "r": 447.82986, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 112, "text": "87-94", "bbox": {"l": 428.1217, "t": 239.25256000000002, "r": 447.82986, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 119, "label": "text", "bbox": {"l": 457.80051, "t": 239.25256000000002, "r": 477.50867, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 113, "text": "69-73", "bbox": {"l": 457.80051, "t": 239.25256000000002, "r": 477.50867, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 120, "label": "text", "bbox": {"l": 487.47034, "t": 239.25256000000002, "r": 507.17849999999993, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 114, "text": "78-86", "bbox": {"l": 487.47034, "t": 239.25256000000002, "r": 507.17849999999993, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 121, "label": "text", "bbox": {"l": 104.825, "t": 250.21155, "r": 124.63177, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 115, "text": "Table", "bbox": {"l": 104.825, "t": 250.21155, "r": 124.63177, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 122, "label": "text", "bbox": {"l": 177.866, "t": 250.21155, "r": 198.71288, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 116, "text": "34733", "bbox": {"l": 177.866, "t": 250.21155, "r": 198.71288, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 123, "label": "text", "bbox": {"l": 219.211, "t": 250.21155, "r": 233.69174000000004, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 117, "text": "3.20", "bbox": {"l": 219.211, "t": 250.21155, "r": 233.69174000000004, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 124, "label": "text", "bbox": {"l": 250.01956, "t": 250.21155, "r": 264.50031, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 118, "text": "2.27", "bbox": {"l": 250.01956, "t": 250.21155, "r": 264.50031, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 125, "label": "text", "bbox": {"l": 280.82812, "t": 250.21155, "r": 295.30887, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 119, "text": "3.60", "bbox": {"l": 280.82812, "t": 250.21155, "r": 295.30887, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 126, "label": "text", "bbox": {"l": 305.27301, "t": 250.21155, "r": 324.98117, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 120, "text": "77-81", "bbox": {"l": 305.27301, "t": 250.21155, "r": 324.98117, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 127, "label": "text", "bbox": {"l": 334.94284, "t": 250.21155, "r": 354.651, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 121, "text": "75-80", "bbox": {"l": 334.94284, "t": 250.21155, "r": 354.651, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 128, "label": "text", "bbox": {"l": 364.61267, "t": 250.21155, "r": 384.32083, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 122, "text": "83-86", "bbox": {"l": 364.61267, "t": 250.21155, "r": 384.32083, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 129, "label": "text", "bbox": {"l": 398.45187, "t": 250.21155, "r": 418.16003, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 123, "text": "98-99", "bbox": {"l": 398.45187, "t": 250.21155, "r": 418.16003, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 130, "label": "text", "bbox": {"l": 428.1217, "t": 250.21155, "r": 447.82986, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 124, "text": "58-80", "bbox": {"l": 428.1217, "t": 250.21155, "r": 447.82986, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 131, "label": "text", "bbox": {"l": 457.80051, "t": 250.21155, "r": 477.50867, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 125, "text": "79-84", "bbox": {"l": 457.80051, "t": 250.21155, "r": 477.50867, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 132, "label": "text", "bbox": {"l": 487.47034, "t": 250.21155, "r": 507.17849999999993, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 126, "text": "70-85", "bbox": {"l": 487.47034, "t": 250.21155, "r": 507.17849999999993, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 133, "label": "text", "bbox": {"l": 104.825, "t": 261.16956000000005, "r": 120.78519, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 127, "text": "Text", "bbox": {"l": 104.825, "t": 261.16956000000005, "r": 120.78519, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 134, "label": "text", "bbox": {"l": 173.69701, "t": 261.16956000000005, "r": 198.71326, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 128, "text": "510377", "bbox": {"l": 173.69701, "t": 261.16956000000005, "r": 198.71326, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 135, "label": "text", "bbox": {"l": 215.04201, "t": 261.16956000000005, "r": 233.69212, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 129, "text": "45.82", "bbox": {"l": 215.04201, "t": 261.16956000000005, "r": 233.69212, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 136, "label": "text", "bbox": {"l": 245.85056, "t": 261.16956000000005, "r": 264.50067, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 130, "text": "49.28", "bbox": {"l": 245.85056, "t": 261.16956000000005, "r": 264.50067, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 137, "label": "text", "bbox": {"l": 276.65912, "t": 261.16956000000005, "r": 295.30923, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 131, "text": "45.00", "bbox": {"l": 276.65912, "t": 261.16956000000005, "r": 295.30923, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 138, "label": "text", "bbox": {"l": 305.27301, "t": 261.16956000000005, "r": 324.98117, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 132, "text": "84-86", "bbox": {"l": 305.27301, "t": 261.16956000000005, "r": 324.98117, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 139, "label": "text", "bbox": {"l": 334.94284, "t": 261.16956000000005, "r": 354.651, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 133, "text": "81-86", "bbox": {"l": 334.94284, "t": 261.16956000000005, "r": 354.651, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 140, "label": "text", "bbox": {"l": 364.61267, "t": 261.16956000000005, "r": 384.32083, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 134, "text": "88-93", "bbox": {"l": 364.61267, "t": 261.16956000000005, "r": 384.32083, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 141, "label": "text", "bbox": {"l": 398.45187, "t": 261.16956000000005, "r": 418.16003, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 135, "text": "89-93", "bbox": {"l": 398.45187, "t": 261.16956000000005, "r": 418.16003, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 142, "label": "text", "bbox": {"l": 428.1217, "t": 261.16956000000005, "r": 447.82986, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 136, "text": "87-92", "bbox": {"l": 428.1217, "t": 261.16956000000005, "r": 447.82986, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 143, "label": "text", "bbox": {"l": 457.80051, "t": 261.16956000000005, "r": 477.50867, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 137, "text": "71-79", "bbox": {"l": 457.80051, "t": 261.16956000000005, "r": 477.50867, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 144, "label": "text", "bbox": {"l": 487.47034, "t": 261.16956000000005, "r": 507.17849999999993, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 138, "text": "87-95", "bbox": {"l": 487.47034, "t": 261.16956000000005, "r": 507.17849999999993, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 145, "label": "text", "bbox": {"l": 104.825, "t": 272.12854000000004, "r": 121.81633, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 139, "text": "Title", "bbox": {"l": 104.825, "t": 272.12854000000004, "r": 121.81633, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 146, "label": "text", "bbox": {"l": 182.035, "t": 272.12854000000004, "r": 198.71251, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 140, "text": "5071", "bbox": {"l": 182.035, "t": 272.12854000000004, "r": 198.71251, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 147, "label": "text", "bbox": {"l": 219.211, "t": 272.12854000000004, "r": 233.69174000000004, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 141, "text": "0.47", "bbox": {"l": 219.211, "t": 272.12854000000004, "r": 233.69174000000004, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 148, "label": "text", "bbox": {"l": 250.01956, "t": 272.12854000000004, "r": 264.50031, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 142, "text": "0.30", "bbox": {"l": 250.01956, "t": 272.12854000000004, "r": 264.50031, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 149, "label": "text", "bbox": {"l": 280.82812, "t": 272.12854000000004, "r": 295.30887, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 143, "text": "0.50", "bbox": {"l": 280.82812, "t": 272.12854000000004, "r": 295.30887, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 150, "label": "text", "bbox": {"l": 305.27301, "t": 272.12854000000004, "r": 324.98117, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 144, "text": "60-72", "bbox": {"l": 305.27301, "t": 272.12854000000004, "r": 324.98117, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 151, "label": "text", "bbox": {"l": 334.94284, "t": 272.12854000000004, "r": 354.651, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 145, "text": "24-63", "bbox": {"l": 334.94284, "t": 272.12854000000004, "r": 354.651, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 152, "label": "text", "bbox": {"l": 364.61267, "t": 272.12854000000004, "r": 384.32083, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 146, "text": "50-63", "bbox": {"l": 364.61267, "t": 272.12854000000004, "r": 384.32083, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 153, "label": "text", "bbox": {"l": 394.2825, "t": 272.12854000000004, "r": 418.16003, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 147, "text": "94-100", "bbox": {"l": 394.2825, "t": 272.12854000000004, "r": 418.16003, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 154, "label": "text", "bbox": {"l": 428.1217, "t": 272.12854000000004, "r": 447.82986, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 148, "text": "82-96", "bbox": {"l": 428.1217, "t": 272.12854000000004, "r": 447.82986, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 155, "label": "text", "bbox": {"l": 457.80051, "t": 272.12854000000004, "r": 477.50867, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 149, "text": "68-79", "bbox": {"l": 457.80051, "t": 272.12854000000004, "r": 477.50867, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 156, "label": "text", "bbox": {"l": 487.47034, "t": 272.12854000000004, "r": 507.17849999999993, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 150, "text": "24-56", "bbox": {"l": 487.47034, "t": 272.12854000000004, "r": 507.17849999999993, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 157, "label": "text", "bbox": {"l": 104.825, "t": 283.48654, "r": 123.43028, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 151, "text": "Total", "bbox": {"l": 104.825, "t": 283.48654, "r": 123.43028, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 158, "label": "text", "bbox": {"l": 169.52699, "t": 283.48654, "r": 198.71263, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 152, "text": "1107470", "bbox": {"l": 169.52699, "t": 283.48654, "r": 198.71263, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 159, "label": "text", "bbox": {"l": 208.675, "t": 283.48654, "r": 233.69124999999997, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 153, "text": "941123", "bbox": {"l": 208.675, "t": 283.48654, "r": 233.69124999999997, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 160, "label": "text", "bbox": {"l": 243.65291999999997, "t": 283.48654, "r": 264.49982, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 154, "text": "99816", "bbox": {"l": 243.65291999999997, "t": 283.48654, "r": 264.49982, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 161, "label": "text", "bbox": {"l": 274.46149, "t": 283.48654, "r": 295.30838, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 155, "text": "66531", "bbox": {"l": 274.46149, "t": 283.48654, "r": 295.30838, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 162, "label": "text", "bbox": {"l": 305.27301, "t": 283.48654, "r": 324.98117, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 156, "text": "82-83", "bbox": {"l": 305.27301, "t": 283.48654, "r": 324.98117, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 163, "label": "text", "bbox": {"l": 334.94284, "t": 283.48654, "r": 354.651, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 157, "text": "71-74", "bbox": {"l": 334.94284, "t": 283.48654, "r": 354.651, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 164, "label": "text", "bbox": {"l": 364.61267, "t": 283.48654, "r": 384.32083, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 158, "text": "79-81", "bbox": {"l": 364.61267, "t": 283.48654, "r": 384.32083, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 165, "label": "text", "bbox": {"l": 398.45187, "t": 283.48654, "r": 418.16003, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 159, "text": "89-94", "bbox": {"l": 398.45187, "t": 283.48654, "r": 418.16003, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 166, "label": "text", "bbox": {"l": 428.1217, "t": 283.48654, "r": 447.82986, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 160, "text": "86-91", "bbox": {"l": 428.1217, "t": 283.48654, "r": 447.82986, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 167, "label": "text", "bbox": {"l": 457.80051, "t": 283.48654, "r": 477.50867, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 161, "text": "71-76", "bbox": {"l": 457.80051, "t": 283.48654, "r": 477.50867, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 168, "label": "text", "bbox": {"l": 487.47034, "t": 283.48654, "r": 507.17849999999993, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 162, "text": "68-85", "bbox": {"l": 487.47034, "t": 283.48654, "r": 507.17849999999993, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "lcel", "lcel", "lcel", "ched", "lcel", "lcel", "lcel", "lcel", "lcel", "nl", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 14, "num_cols": 12, "table_cells": [{"bbox": {"l": 233.94400000000002, "t": 140.22351000000003, "r": 270.04272, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 4, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 6, "text": "% of Total", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 329.04999, "t": 140.22351000000003, "r": 483.3976400000001, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 6, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 6, "end_col_offset_idx": 12, "text": "triple inter-annotator mAP @ 0.5-0.95 (%)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 151.18255999999997, "r": 141.71277, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "class label", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 175.94701, "t": 151.18255999999997, "r": 198.71269, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Count", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 213.795, "t": 151.18255999999997, "r": 233.69144, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Train", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 249.37367, "t": 151.18255999999997, "r": 264.5, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Test", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 283.53568, "t": 151.18255999999997, "r": 295.30856, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Val", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 314.01501, "t": 151.18255999999997, "r": 324.98093, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "All", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 343.01236, "t": 151.18255999999997, "r": 354.65076, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "Fin", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 367.84033, "t": 151.18255999999997, "r": 384.32059, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "Man", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 407.54358, "t": 151.18255999999997, "r": 418.15979, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "Sci", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 432.29979999999995, "t": 151.18255999999997, "r": 447.82962, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "Law", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 465.72656, "t": 151.18255999999997, "r": 477.50842, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "Pat", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 493.52240000000006, "t": 151.18255999999997, "r": 507.17822, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "Ten", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 162.53954999999996, "r": 134.01064, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Caption", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 177.866, "t": 162.53954999999996, "r": 198.71288, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "22524", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 162.53954999999996, "r": 233.69174000000004, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "2.04", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 162.53954999999996, "r": 264.50031, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "1.77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 162.53954999999996, "r": 295.30887, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "2.32", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 162.53954999999996, "r": 324.98117, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "84-89", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 162.53954999999996, "r": 354.651, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "40-61", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 162.53954999999996, "r": 384.32083, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "86-92", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45187, "t": 162.53954999999996, "r": 418.16003, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "94-99", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 162.53954999999996, "r": 447.82986, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "95-99", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 162.53954999999996, "r": 477.50867, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "69-78", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 495.32489, "t": 162.53954999999996, "r": 507.17846999999995, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 173.49854000000005, "r": 137.3282, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Footnote", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 182.035, "t": 173.49854000000005, "r": 198.71251, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "6318", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 173.49854000000005, "r": 233.69174000000004, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.60", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 173.49854000000005, "r": 264.50031, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.31", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 173.49854000000005, "r": 295.30887, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.58", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 173.49854000000005, "r": 324.98117, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "83-91", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 342.79739, "t": 173.49854000000005, "r": 354.65097, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 371.81265, "t": 173.49854000000005, "r": 384.32077, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "100", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45181, "t": 173.49854000000005, "r": 418.15997, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "62-88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.12164, "t": 173.49854000000005, "r": 447.8298, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "85-94", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 465.655, "t": 173.49854000000005, "r": 477.50857999999994, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47025, "t": 173.49854000000005, "r": 507.17841, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "82-97", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 184.45752000000005, "r": 135.33766, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Formula", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 177.866, "t": 184.45752000000005, "r": 198.71288, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "25027", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 184.45752000000005, "r": 233.69174000000004, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "2.25", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 184.45752000000005, "r": 264.50031, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "1.90", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 184.45752000000005, "r": 295.30887, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "2.96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 184.45752000000005, "r": 324.98117, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "83-85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 342.79739, "t": 184.45752000000005, "r": 354.65097, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 372.46719, "t": 184.45752000000005, "r": 384.32077, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45181, "t": 184.45752000000005, "r": 418.15997, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "84-87", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.12164, "t": 184.45752000000005, "r": 447.8298, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "86-96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 465.655, "t": 184.45752000000005, "r": 477.50857999999994, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 495.3248, "t": 184.45752000000005, "r": 507.17838000000006, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 195.41656, "r": 137.70479, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "List-item", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 173.69701, "t": 195.41656, "r": 198.71326, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "185660", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 215.04201, "t": 195.41656, "r": 233.69212, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "17.19", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.85056, "t": 195.41656, "r": 264.50067, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "13.34", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 276.65912, "t": 195.41656, "r": 295.30923, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "15.82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 195.41656, "r": 324.98117, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "87-88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 195.41656, "r": 354.651, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "74-83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 195.41656, "r": 384.32083, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "90-92", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45187, "t": 195.41656, "r": 418.16003, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "97-97", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 195.41656, "r": 447.82986, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "81-85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 195.41656, "r": 477.50867, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "75-88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 195.41656, "r": 507.17849999999993, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "93-95", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 206.37554999999998, "r": 147.35262, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-footer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 177.866, "t": 206.37554999999998, "r": 198.71288, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "70878", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 206.37554999999998, "r": 233.69174000000004, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "6.51", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 206.37554999999998, "r": 264.50031, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "5.58", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 206.37554999999998, "r": 295.30887, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "6.00", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 206.37554999999998, "r": 324.98117, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "93-94", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 206.37554999999998, "r": 354.651, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "88-90", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 206.37554999999998, "r": 384.32083, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "95-96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 405.65189, "t": 206.37554999999998, "r": 418.16, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "100", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.12167, "t": 206.37554999999998, "r": 447.82983, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "92-97", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 465.00049, "t": 206.37554999999998, "r": 477.5086099999999, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "100", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47028, "t": 206.37554999999998, "r": 507.17843999999997, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "96-98", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 217.33452999999997, "r": 150.10532, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 177.866, "t": 217.33452999999997, "r": 198.71288, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "58022", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 217.33452999999997, "r": 233.69174000000004, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "5.10", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 217.33452999999997, "r": 264.50031, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "6.70", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 217.33452999999997, "r": 295.30887, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "5.06", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 217.33452999999997, "r": 324.98117, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "85-89", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 217.33452999999997, "r": 354.651, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "66-76", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 217.33452999999997, "r": 384.32083, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "90-94", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.2825, "t": 217.33452999999997, "r": 418.16003, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "98-100", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 217.33452999999997, "r": 447.82986, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "91-92", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 217.33452999999997, "r": 477.50867, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "97-99", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 217.33452999999997, "r": 507.17849999999993, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "81-86", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 228.29351999999994, "r": 130.80963, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Picture", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 177.866, "t": 228.29351999999994, "r": 198.71288, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "45976", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 228.29351999999994, "r": 233.69174000000004, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "4.21", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 228.29351999999994, "r": 264.50031, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "2.78", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 228.29351999999994, "r": 295.30887, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "5.31", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 228.29351999999994, "r": 324.98117, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "69-71", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 228.29351999999994, "r": 354.651, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "56-59", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 228.29351999999994, "r": 384.32083, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "82-86", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45187, "t": 228.29351999999994, "r": 418.16003, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "69-82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 228.29351999999994, "r": 447.82986, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "80-95", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 228.29351999999994, "r": 477.50867, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "66-71", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 228.29351999999994, "r": 507.17849999999993, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "59-76", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 239.25256000000002, "r": 159.56487, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Section-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 173.69701, "t": 239.25256000000002, "r": 198.71326, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "142884", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 215.04201, "t": 239.25256000000002, "r": 233.69212, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "12.60", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.85056, "t": 239.25256000000002, "r": 264.50067, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "15.77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 276.65912, "t": 239.25256000000002, "r": 295.30923, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "12.85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 239.25256000000002, "r": 324.98117, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "83-84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 239.25256000000002, "r": 354.651, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "76-81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 239.25256000000002, "r": 384.32083, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "90-92", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45187, "t": 239.25256000000002, "r": 418.16003, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "94-95", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 239.25256000000002, "r": 447.82986, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "87-94", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 239.25256000000002, "r": 477.50867, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "69-73", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 239.25256000000002, "r": 507.17849999999993, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "78-86", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 250.21155, "r": 124.63177, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 177.866, "t": 250.21155, "r": 198.71288, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "34733", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 250.21155, "r": 233.69174000000004, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "3.20", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 250.21155, "r": 264.50031, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "2.27", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 250.21155, "r": 295.30887, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "3.60", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 250.21155, "r": 324.98117, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "77-81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 250.21155, "r": 354.651, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "75-80", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 250.21155, "r": 384.32083, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "83-86", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45187, "t": 250.21155, "r": 418.16003, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "98-99", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 250.21155, "r": 447.82986, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "58-80", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 250.21155, "r": 477.50867, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "79-84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 250.21155, "r": 507.17849999999993, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "70-85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 261.16956000000005, "r": 120.78519, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Text", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 173.69701, "t": 261.16956000000005, "r": 198.71326, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "510377", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 215.04201, "t": 261.16956000000005, "r": 233.69212, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "45.82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.85056, "t": 261.16956000000005, "r": 264.50067, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "49.28", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 276.65912, "t": 261.16956000000005, "r": 295.30923, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "45.00", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 261.16956000000005, "r": 324.98117, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "84-86", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 261.16956000000005, "r": 354.651, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "81-86", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 261.16956000000005, "r": 384.32083, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "88-93", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45187, "t": 261.16956000000005, "r": 418.16003, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "89-93", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 261.16956000000005, "r": 447.82986, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "87-92", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 261.16956000000005, "r": 477.50867, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "71-79", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 261.16956000000005, "r": 507.17849999999993, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "87-95", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 272.12854000000004, "r": 121.81633, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Title", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 182.035, "t": 272.12854000000004, "r": 198.71251, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "5071", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 272.12854000000004, "r": 233.69174000000004, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.47", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 272.12854000000004, "r": 264.50031, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.30", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 272.12854000000004, "r": 295.30887, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.50", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 272.12854000000004, "r": 324.98117, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "60-72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 272.12854000000004, "r": 354.651, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "24-63", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 272.12854000000004, "r": 384.32083, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "50-63", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.2825, "t": 272.12854000000004, "r": 418.16003, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "94-100", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 272.12854000000004, "r": 447.82986, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "82-96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 272.12854000000004, "r": 477.50867, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "68-79", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 272.12854000000004, "r": 507.17849999999993, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "24-56", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 283.48654, "r": 123.43028, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Total", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 169.52699, "t": 283.48654, "r": 198.71263, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "1107470", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 208.675, "t": 283.48654, "r": 233.69124999999997, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "941123", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 243.65291999999997, "t": 283.48654, "r": 264.49982, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "99816", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 274.46149, "t": 283.48654, "r": 295.30838, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "66531", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 283.48654, "r": 324.98117, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "82-83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 283.48654, "r": 354.651, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "71-74", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 283.48654, "r": 384.32083, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "79-81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45187, "t": 283.48654, "r": 418.16003, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "89-94", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 283.48654, "r": 447.82986, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "86-91", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 283.48654, "r": 477.50867, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "71-76", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 283.48654, "r": 507.17849999999993, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "68-85", "column_header": false, "row_header": false, "row_section": false}]}}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_header", "id": 10, "page_no": 3, "cluster": {"id": 10, "label": "page_header", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.7625049948692322, "cells": [{"id": 0, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 246.24382, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar", "bbox": {"l": 253.13897999999998, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar"}, {"label": "caption", "id": 8, "page_no": 3, "cluster": {"id": 8, "label": "caption", "bbox": {"l": 53.501999, "t": 84.95495999999991, "r": 558.48969, "b": 115.34618999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.8906616568565369, "cells": [{"id": 2, "text": "Table 1: DocLayNet dataset overview. Along with the frequency of each class label, we present the relative occurrence (as %", "bbox": {"l": 53.501999, "t": 84.95495999999991, "r": 558.48969, "b": 93.42822000000001, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "of row \u201cTotal\u201d) in the train, test and validation sets. The inter-annotator agreement is computed as the mAP@0.5-0.95 metric", "bbox": {"l": 53.79800000000001, "t": 95.91394000000003, "r": 558.20294, "b": 104.3872100000001, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "between pairwise annotations from the triple-annotated pages, from which we obtain accuracy ranges.", "bbox": {"l": 53.79800000000001, "t": 106.87292000000002, "r": 469.84805000000006, "b": 115.34618999999998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 1: DocLayNet dataset overview. Along with the frequency of each class label, we present the relative occurrence (as % of row \u201cTotal\u201d) in the train, test and validation sets. The inter-annotator agreement is computed as the mAP@0.5-0.95 metric between pairwise annotations from the triple-annotated pages, from which we obtain accuracy ranges."}, {"label": "table", "id": 1, "page_no": 3, "cluster": {"id": 1, "label": "table", "bbox": {"l": 98.93103790283203, "t": 137.47547912597656, "r": 512.579833984375, "b": 294.08148193359375, "coord_origin": "TOPLEFT"}, "confidence": 0.9860090613365173, "cells": [{"id": 5, "text": "% of Total", "bbox": {"l": 233.94400000000002, "t": 140.22351000000003, "r": 270.04272, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "triple inter-annotator mAP @ 0.5-0.95 (%)", "bbox": {"l": 329.04999, "t": 140.22351000000003, "r": 483.3976400000001, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "class label", "bbox": {"l": 104.825, "t": 151.18255999999997, "r": 141.71277, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Count", "bbox": {"l": 175.94701, "t": 151.18255999999997, "r": 198.71269, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Train", "bbox": {"l": 213.795, "t": 151.18255999999997, "r": 233.69144, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Test", "bbox": {"l": 249.37367, "t": 151.18255999999997, "r": 264.5, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Val", "bbox": {"l": 283.53568, "t": 151.18255999999997, "r": 295.30856, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "All", "bbox": {"l": 314.01501, "t": 151.18255999999997, "r": 324.98093, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Fin", "bbox": {"l": 343.01236, "t": 151.18255999999997, "r": 354.65076, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Man", "bbox": {"l": 367.84033, "t": 151.18255999999997, "r": 384.32059, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Sci", "bbox": {"l": 407.54358, "t": 151.18255999999997, "r": 418.15979, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Law", "bbox": {"l": 432.29979999999995, "t": 151.18255999999997, "r": 447.82962, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "Pat", "bbox": {"l": 465.72656, "t": 151.18255999999997, "r": 477.50842, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Ten", "bbox": {"l": 493.52240000000006, "t": 151.18255999999997, "r": 507.17822, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Caption", "bbox": {"l": 104.825, "t": 162.53954999999996, "r": 134.01064, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "22524", "bbox": {"l": 177.866, "t": 162.53954999999996, "r": 198.71288, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "2.04", "bbox": {"l": 219.211, "t": 162.53954999999996, "r": 233.69174000000004, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "1.77", "bbox": {"l": 250.01956, "t": 162.53954999999996, "r": 264.50031, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "2.32", "bbox": {"l": 280.82812, "t": 162.53954999999996, "r": 295.30887, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "84-89", "bbox": {"l": 305.27301, "t": 162.53954999999996, "r": 324.98117, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "40-61", "bbox": {"l": 334.94284, "t": 162.53954999999996, "r": 354.651, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "86-92", "bbox": {"l": 364.61267, "t": 162.53954999999996, "r": 384.32083, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "94-99", "bbox": {"l": 398.45187, "t": 162.53954999999996, "r": 418.16003, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "95-99", "bbox": {"l": 428.1217, "t": 162.53954999999996, "r": 447.82986, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "69-78", "bbox": {"l": 457.80051, "t": 162.53954999999996, "r": 477.50867, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "n/a", "bbox": {"l": 495.32489, "t": 162.53954999999996, "r": 507.17846999999995, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Footnote", "bbox": {"l": 104.825, "t": 173.49854000000005, "r": 137.3282, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "6318", "bbox": {"l": 182.035, "t": 173.49854000000005, "r": 198.71251, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "0.60", "bbox": {"l": 219.211, "t": 173.49854000000005, "r": 233.69174000000004, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "0.31", "bbox": {"l": 250.01956, "t": 173.49854000000005, "r": 264.50031, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "0.58", "bbox": {"l": 280.82812, "t": 173.49854000000005, "r": 295.30887, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "83-91", "bbox": {"l": 305.27301, "t": 173.49854000000005, "r": 324.98117, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "n/a", "bbox": {"l": 342.79739, "t": 173.49854000000005, "r": 354.65097, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "100", "bbox": {"l": 371.81265, "t": 173.49854000000005, "r": 384.32077, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "62-88", "bbox": {"l": 398.45181, "t": 173.49854000000005, "r": 418.15997, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "85-94", "bbox": {"l": 428.12164, "t": 173.49854000000005, "r": 447.8298, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "n/a", "bbox": {"l": 465.655, "t": 173.49854000000005, "r": 477.50857999999994, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "82-97", "bbox": {"l": 487.47025, "t": 173.49854000000005, "r": 507.17841, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Formula", "bbox": {"l": 104.825, "t": 184.45752000000005, "r": 135.33766, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "25027", "bbox": {"l": 177.866, "t": 184.45752000000005, "r": 198.71288, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "2.25", "bbox": {"l": 219.211, "t": 184.45752000000005, "r": 233.69174000000004, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "1.90", "bbox": {"l": 250.01956, "t": 184.45752000000005, "r": 264.50031, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "2.96", "bbox": {"l": 280.82812, "t": 184.45752000000005, "r": 295.30887, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "83-85", "bbox": {"l": 305.27301, "t": 184.45752000000005, "r": 324.98117, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "n/a", "bbox": {"l": 342.79739, "t": 184.45752000000005, "r": 354.65097, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "n/a", "bbox": {"l": 372.46719, "t": 184.45752000000005, "r": 384.32077, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "84-87", "bbox": {"l": 398.45181, "t": 184.45752000000005, "r": 418.15997, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "86-96", "bbox": {"l": 428.12164, "t": 184.45752000000005, "r": 447.8298, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "n/a", "bbox": {"l": 465.655, "t": 184.45752000000005, "r": 477.50857999999994, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "n/a", "bbox": {"l": 495.3248, "t": 184.45752000000005, "r": 507.17838000000006, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "List-item", "bbox": {"l": 104.825, "t": 195.41656, "r": 137.70479, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "185660", "bbox": {"l": 173.69701, "t": 195.41656, "r": 198.71326, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "17.19", "bbox": {"l": 215.04201, "t": 195.41656, "r": 233.69212, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "13.34", "bbox": {"l": 245.85056, "t": 195.41656, "r": 264.50067, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "15.82", "bbox": {"l": 276.65912, "t": 195.41656, "r": 295.30923, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "87-88", "bbox": {"l": 305.27301, "t": 195.41656, "r": 324.98117, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "74-83", "bbox": {"l": 334.94284, "t": 195.41656, "r": 354.651, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "90-92", "bbox": {"l": 364.61267, "t": 195.41656, "r": 384.32083, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "97-97", "bbox": {"l": 398.45187, "t": 195.41656, "r": 418.16003, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "81-85", "bbox": {"l": 428.1217, "t": 195.41656, "r": 447.82986, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "75-88", "bbox": {"l": 457.80051, "t": 195.41656, "r": 477.50867, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "93-95", "bbox": {"l": 487.47034, "t": 195.41656, "r": 507.17849999999993, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "Page-footer", "bbox": {"l": 104.825, "t": 206.37554999999998, "r": 147.35262, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "70878", "bbox": {"l": 177.866, "t": 206.37554999999998, "r": 198.71288, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "6.51", "bbox": {"l": 219.211, "t": 206.37554999999998, "r": 233.69174000000004, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "5.58", "bbox": {"l": 250.01956, "t": 206.37554999999998, "r": 264.50031, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "6.00", "bbox": {"l": 280.82812, "t": 206.37554999999998, "r": 295.30887, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "93-94", "bbox": {"l": 305.27301, "t": 206.37554999999998, "r": 324.98117, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "88-90", "bbox": {"l": 334.94284, "t": 206.37554999999998, "r": 354.651, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "95-96", "bbox": {"l": 364.61267, "t": 206.37554999999998, "r": 384.32083, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "100", "bbox": {"l": 405.65189, "t": 206.37554999999998, "r": 418.16, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "92-97", "bbox": {"l": 428.12167, "t": 206.37554999999998, "r": 447.82983, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "100", "bbox": {"l": 465.00049, "t": 206.37554999999998, "r": 477.5086099999999, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "96-98", "bbox": {"l": 487.47028, "t": 206.37554999999998, "r": 507.17843999999997, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "Page-header", "bbox": {"l": 104.825, "t": 217.33452999999997, "r": 150.10532, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "58022", "bbox": {"l": 177.866, "t": 217.33452999999997, "r": 198.71288, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "5.10", "bbox": {"l": 219.211, "t": 217.33452999999997, "r": 233.69174000000004, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "6.70", "bbox": {"l": 250.01956, "t": 217.33452999999997, "r": 264.50031, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "5.06", "bbox": {"l": 280.82812, "t": 217.33452999999997, "r": 295.30887, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "85-89", "bbox": {"l": 305.27301, "t": 217.33452999999997, "r": 324.98117, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "66-76", "bbox": {"l": 334.94284, "t": 217.33452999999997, "r": 354.651, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "90-94", "bbox": {"l": 364.61267, "t": 217.33452999999997, "r": 384.32083, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "98-100", "bbox": {"l": 394.2825, "t": 217.33452999999997, "r": 418.16003, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "91-92", "bbox": {"l": 428.1217, "t": 217.33452999999997, "r": 447.82986, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "97-99", "bbox": {"l": 457.80051, "t": 217.33452999999997, "r": 477.50867, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "81-86", "bbox": {"l": 487.47034, "t": 217.33452999999997, "r": 507.17849999999993, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "Picture", "bbox": {"l": 104.825, "t": 228.29351999999994, "r": 130.80963, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "45976", "bbox": {"l": 177.866, "t": 228.29351999999994, "r": 198.71288, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "4.21", "bbox": {"l": 219.211, "t": 228.29351999999994, "r": 233.69174000000004, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "2.78", "bbox": {"l": 250.01956, "t": 228.29351999999994, "r": 264.50031, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "5.31", "bbox": {"l": 280.82812, "t": 228.29351999999994, "r": 295.30887, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "69-71", "bbox": {"l": 305.27301, "t": 228.29351999999994, "r": 324.98117, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "56-59", "bbox": {"l": 334.94284, "t": 228.29351999999994, "r": 354.651, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "82-86", "bbox": {"l": 364.61267, "t": 228.29351999999994, "r": 384.32083, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "69-82", "bbox": {"l": 398.45187, "t": 228.29351999999994, "r": 418.16003, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "80-95", "bbox": {"l": 428.1217, "t": 228.29351999999994, "r": 447.82986, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "66-71", "bbox": {"l": 457.80051, "t": 228.29351999999994, "r": 477.50867, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "59-76", "bbox": {"l": 487.47034, "t": 228.29351999999994, "r": 507.17849999999993, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "Section-header", "bbox": {"l": 104.825, "t": 239.25256000000002, "r": 159.56487, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "142884", "bbox": {"l": 173.69701, "t": 239.25256000000002, "r": 198.71326, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "12.60", "bbox": {"l": 215.04201, "t": 239.25256000000002, "r": 233.69212, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "15.77", "bbox": {"l": 245.85056, "t": 239.25256000000002, "r": 264.50067, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "12.85", "bbox": {"l": 276.65912, "t": 239.25256000000002, "r": 295.30923, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "83-84", "bbox": {"l": 305.27301, "t": 239.25256000000002, "r": 324.98117, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "76-81", "bbox": {"l": 334.94284, "t": 239.25256000000002, "r": 354.651, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "90-92", "bbox": {"l": 364.61267, "t": 239.25256000000002, "r": 384.32083, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "94-95", "bbox": {"l": 398.45187, "t": 239.25256000000002, "r": 418.16003, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "87-94", "bbox": {"l": 428.1217, "t": 239.25256000000002, "r": 447.82986, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "69-73", "bbox": {"l": 457.80051, "t": 239.25256000000002, "r": 477.50867, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "78-86", "bbox": {"l": 487.47034, "t": 239.25256000000002, "r": 507.17849999999993, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "Table", "bbox": {"l": 104.825, "t": 250.21155, "r": 124.63177, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "34733", "bbox": {"l": 177.866, "t": 250.21155, "r": 198.71288, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "3.20", "bbox": {"l": 219.211, "t": 250.21155, "r": 233.69174000000004, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "2.27", "bbox": {"l": 250.01956, "t": 250.21155, "r": 264.50031, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "3.60", "bbox": {"l": 280.82812, "t": 250.21155, "r": 295.30887, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "77-81", "bbox": {"l": 305.27301, "t": 250.21155, "r": 324.98117, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "75-80", "bbox": {"l": 334.94284, "t": 250.21155, "r": 354.651, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "83-86", "bbox": {"l": 364.61267, "t": 250.21155, "r": 384.32083, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "98-99", "bbox": {"l": 398.45187, "t": 250.21155, "r": 418.16003, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "58-80", "bbox": {"l": 428.1217, "t": 250.21155, "r": 447.82986, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "79-84", "bbox": {"l": 457.80051, "t": 250.21155, "r": 477.50867, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "70-85", "bbox": {"l": 487.47034, "t": 250.21155, "r": 507.17849999999993, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "Text", "bbox": {"l": 104.825, "t": 261.16956000000005, "r": 120.78519, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "510377", "bbox": {"l": 173.69701, "t": 261.16956000000005, "r": 198.71326, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "45.82", "bbox": {"l": 215.04201, "t": 261.16956000000005, "r": 233.69212, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "49.28", "bbox": {"l": 245.85056, "t": 261.16956000000005, "r": 264.50067, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "45.00", "bbox": {"l": 276.65912, "t": 261.16956000000005, "r": 295.30923, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "84-86", "bbox": {"l": 305.27301, "t": 261.16956000000005, "r": 324.98117, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "81-86", "bbox": {"l": 334.94284, "t": 261.16956000000005, "r": 354.651, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "88-93", "bbox": {"l": 364.61267, "t": 261.16956000000005, "r": 384.32083, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "89-93", "bbox": {"l": 398.45187, "t": 261.16956000000005, "r": 418.16003, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "87-92", "bbox": {"l": 428.1217, "t": 261.16956000000005, "r": 447.82986, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "71-79", "bbox": {"l": 457.80051, "t": 261.16956000000005, "r": 477.50867, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "87-95", "bbox": {"l": 487.47034, "t": 261.16956000000005, "r": 507.17849999999993, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "Title", "bbox": {"l": 104.825, "t": 272.12854000000004, "r": 121.81633, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "5071", "bbox": {"l": 182.035, "t": 272.12854000000004, "r": 198.71251, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "0.47", "bbox": {"l": 219.211, "t": 272.12854000000004, "r": 233.69174000000004, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "0.30", "bbox": {"l": 250.01956, "t": 272.12854000000004, "r": 264.50031, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "0.50", "bbox": {"l": 280.82812, "t": 272.12854000000004, "r": 295.30887, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "60-72", "bbox": {"l": 305.27301, "t": 272.12854000000004, "r": 324.98117, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "24-63", "bbox": {"l": 334.94284, "t": 272.12854000000004, "r": 354.651, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "50-63", "bbox": {"l": 364.61267, "t": 272.12854000000004, "r": 384.32083, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "94-100", "bbox": {"l": 394.2825, "t": 272.12854000000004, "r": 418.16003, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "82-96", "bbox": {"l": 428.1217, "t": 272.12854000000004, "r": 447.82986, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "68-79", "bbox": {"l": 457.80051, "t": 272.12854000000004, "r": 477.50867, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "24-56", "bbox": {"l": 487.47034, "t": 272.12854000000004, "r": 507.17849999999993, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "Total", "bbox": {"l": 104.825, "t": 283.48654, "r": 123.43028, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "1107470", "bbox": {"l": 169.52699, "t": 283.48654, "r": 198.71263, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "941123", "bbox": {"l": 208.675, "t": 283.48654, "r": 233.69124999999997, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "99816", "bbox": {"l": 243.65291999999997, "t": 283.48654, "r": 264.49982, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "66531", "bbox": {"l": 274.46149, "t": 283.48654, "r": 295.30838, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "82-83", "bbox": {"l": 305.27301, "t": 283.48654, "r": 324.98117, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "71-74", "bbox": {"l": 334.94284, "t": 283.48654, "r": 354.651, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "79-81", "bbox": {"l": 364.61267, "t": 283.48654, "r": 384.32083, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "89-94", "bbox": {"l": 398.45187, "t": 283.48654, "r": 418.16003, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "86-91", "bbox": {"l": 428.1217, "t": 283.48654, "r": 447.82986, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "71-76", "bbox": {"l": 457.80051, "t": 283.48654, "r": 477.50867, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "68-85", "bbox": {"l": 487.47034, "t": 283.48654, "r": 507.17849999999993, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": [{"id": 11, "label": "text", "bbox": {"l": 233.94400000000002, "t": 140.22351000000003, "r": 270.04272, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 5, "text": "% of Total", "bbox": {"l": 233.94400000000002, "t": 140.22351000000003, "r": 270.04272, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 329.04999, "t": 140.22351000000003, "r": 483.3976400000001, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": "triple inter-annotator mAP @ 0.5-0.95 (%)", "bbox": {"l": 329.04999, "t": 140.22351000000003, "r": 483.3976400000001, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 104.825, "t": 151.18255999999997, "r": 141.71277, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "class label", "bbox": {"l": 104.825, "t": 151.18255999999997, "r": 141.71277, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 175.94701, "t": 151.18255999999997, "r": 198.71269, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "Count", "bbox": {"l": 175.94701, "t": 151.18255999999997, "r": 198.71269, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 213.795, "t": 151.18255999999997, "r": 233.69144, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "Train", "bbox": {"l": 213.795, "t": 151.18255999999997, "r": 233.69144, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 249.37367, "t": 151.18255999999997, "r": 264.5, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "Test", "bbox": {"l": 249.37367, "t": 151.18255999999997, "r": 264.5, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 283.53568, "t": 151.18255999999997, "r": 295.30856, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "Val", "bbox": {"l": 283.53568, "t": 151.18255999999997, "r": 295.30856, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 314.01501, "t": 151.18255999999997, "r": 324.98093, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "All", "bbox": {"l": 314.01501, "t": 151.18255999999997, "r": 324.98093, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 343.01236, "t": 151.18255999999997, "r": 354.65076, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "Fin", "bbox": {"l": 343.01236, "t": 151.18255999999997, "r": 354.65076, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 367.84033, "t": 151.18255999999997, "r": 384.32059, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "Man", "bbox": {"l": 367.84033, "t": 151.18255999999997, "r": 384.32059, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 407.54358, "t": 151.18255999999997, "r": 418.15979, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "Sci", "bbox": {"l": 407.54358, "t": 151.18255999999997, "r": 418.15979, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 432.29979999999995, "t": 151.18255999999997, "r": 447.82962, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "Law", "bbox": {"l": 432.29979999999995, "t": 151.18255999999997, "r": 447.82962, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 465.72656, "t": 151.18255999999997, "r": 477.50842, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "Pat", "bbox": {"l": 465.72656, "t": 151.18255999999997, "r": 477.50842, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 493.52240000000006, "t": 151.18255999999997, "r": 507.17822, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "Ten", "bbox": {"l": 493.52240000000006, "t": 151.18255999999997, "r": 507.17822, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 104.825, "t": 162.53954999999996, "r": 134.01064, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "Caption", "bbox": {"l": 104.825, "t": 162.53954999999996, "r": 134.01064, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 177.866, "t": 162.53954999999996, "r": 198.71288, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "22524", "bbox": {"l": 177.866, "t": 162.53954999999996, "r": 198.71288, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 219.211, "t": 162.53954999999996, "r": 233.69174000000004, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "2.04", "bbox": {"l": 219.211, "t": 162.53954999999996, "r": 233.69174000000004, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 250.01956, "t": 162.53954999999996, "r": 264.50031, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "1.77", "bbox": {"l": 250.01956, "t": 162.53954999999996, "r": 264.50031, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 280.82812, "t": 162.53954999999996, "r": 295.30887, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "2.32", "bbox": {"l": 280.82812, "t": 162.53954999999996, "r": 295.30887, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 305.27301, "t": 162.53954999999996, "r": 324.98117, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "84-89", "bbox": {"l": 305.27301, "t": 162.53954999999996, "r": 324.98117, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 334.94284, "t": 162.53954999999996, "r": 354.651, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "40-61", "bbox": {"l": 334.94284, "t": 162.53954999999996, "r": 354.651, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 364.61267, "t": 162.53954999999996, "r": 384.32083, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "86-92", "bbox": {"l": 364.61267, "t": 162.53954999999996, "r": 384.32083, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 398.45187, "t": 162.53954999999996, "r": 418.16003, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "94-99", "bbox": {"l": 398.45187, "t": 162.53954999999996, "r": 418.16003, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 428.1217, "t": 162.53954999999996, "r": 447.82986, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "95-99", "bbox": {"l": 428.1217, "t": 162.53954999999996, "r": 447.82986, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 457.80051, "t": 162.53954999999996, "r": 477.50867, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "69-78", "bbox": {"l": 457.80051, "t": 162.53954999999996, "r": 477.50867, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 495.32489, "t": 162.53954999999996, "r": 507.17846999999995, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "n/a", "bbox": {"l": 495.32489, "t": 162.53954999999996, "r": 507.17846999999995, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 104.825, "t": 173.49854000000005, "r": 137.3282, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "Footnote", "bbox": {"l": 104.825, "t": 173.49854000000005, "r": 137.3282, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 182.035, "t": 173.49854000000005, "r": 198.71251, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "6318", "bbox": {"l": 182.035, "t": 173.49854000000005, "r": 198.71251, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 219.211, "t": 173.49854000000005, "r": 233.69174000000004, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "0.60", "bbox": {"l": 219.211, "t": 173.49854000000005, "r": 233.69174000000004, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 250.01956, "t": 173.49854000000005, "r": 264.50031, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "0.31", "bbox": {"l": 250.01956, "t": 173.49854000000005, "r": 264.50031, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 280.82812, "t": 173.49854000000005, "r": 295.30887, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "0.58", "bbox": {"l": 280.82812, "t": 173.49854000000005, "r": 295.30887, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 305.27301, "t": 173.49854000000005, "r": 324.98117, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "83-91", "bbox": {"l": 305.27301, "t": 173.49854000000005, "r": 324.98117, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 342.79739, "t": 173.49854000000005, "r": 354.65097, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "n/a", "bbox": {"l": 342.79739, "t": 173.49854000000005, "r": 354.65097, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 371.81265, "t": 173.49854000000005, "r": 384.32077, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "100", "bbox": {"l": 371.81265, "t": 173.49854000000005, "r": 384.32077, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 398.45181, "t": 173.49854000000005, "r": 418.15997, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "62-88", "bbox": {"l": 398.45181, "t": 173.49854000000005, "r": 418.15997, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 428.12164, "t": 173.49854000000005, "r": 447.8298, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "85-94", "bbox": {"l": 428.12164, "t": 173.49854000000005, "r": 447.8298, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 465.655, "t": 173.49854000000005, "r": 477.50857999999994, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "n/a", "bbox": {"l": 465.655, "t": 173.49854000000005, "r": 477.50857999999994, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 487.47025, "t": 173.49854000000005, "r": 507.17841, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "82-97", "bbox": {"l": 487.47025, "t": 173.49854000000005, "r": 507.17841, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 104.825, "t": 184.45752000000005, "r": 135.33766, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "Formula", "bbox": {"l": 104.825, "t": 184.45752000000005, "r": 135.33766, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 177.866, "t": 184.45752000000005, "r": 198.71288, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "25027", "bbox": {"l": 177.866, "t": 184.45752000000005, "r": 198.71288, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 219.211, "t": 184.45752000000005, "r": 233.69174000000004, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "2.25", "bbox": {"l": 219.211, "t": 184.45752000000005, "r": 233.69174000000004, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 250.01956, "t": 184.45752000000005, "r": 264.50031, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "1.90", "bbox": {"l": 250.01956, "t": 184.45752000000005, "r": 264.50031, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 280.82812, "t": 184.45752000000005, "r": 295.30887, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "2.96", "bbox": {"l": 280.82812, "t": 184.45752000000005, "r": 295.30887, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 305.27301, "t": 184.45752000000005, "r": 324.98117, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "83-85", "bbox": {"l": 305.27301, "t": 184.45752000000005, "r": 324.98117, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 342.79739, "t": 184.45752000000005, "r": 354.65097, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "n/a", "bbox": {"l": 342.79739, "t": 184.45752000000005, "r": 354.65097, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 372.46719, "t": 184.45752000000005, "r": 384.32077, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "n/a", "bbox": {"l": 372.46719, "t": 184.45752000000005, "r": 384.32077, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 398.45181, "t": 184.45752000000005, "r": 418.15997, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "84-87", "bbox": {"l": 398.45181, "t": 184.45752000000005, "r": 418.15997, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 428.12164, "t": 184.45752000000005, "r": 447.8298, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "86-96", "bbox": {"l": 428.12164, "t": 184.45752000000005, "r": 447.8298, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 465.655, "t": 184.45752000000005, "r": 477.50857999999994, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "n/a", "bbox": {"l": 465.655, "t": 184.45752000000005, "r": 477.50857999999994, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 495.3248, "t": 184.45752000000005, "r": 507.17838000000006, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "n/a", "bbox": {"l": 495.3248, "t": 184.45752000000005, "r": 507.17838000000006, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 104.825, "t": 195.41656, "r": 137.70479, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "List-item", "bbox": {"l": 104.825, "t": 195.41656, "r": 137.70479, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 173.69701, "t": 195.41656, "r": 198.71326, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "185660", "bbox": {"l": 173.69701, "t": 195.41656, "r": 198.71326, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 215.04201, "t": 195.41656, "r": 233.69212, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "17.19", "bbox": {"l": 215.04201, "t": 195.41656, "r": 233.69212, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 245.85056, "t": 195.41656, "r": 264.50067, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "13.34", "bbox": {"l": 245.85056, "t": 195.41656, "r": 264.50067, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 276.65912, "t": 195.41656, "r": 295.30923, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "15.82", "bbox": {"l": 276.65912, "t": 195.41656, "r": 295.30923, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 305.27301, "t": 195.41656, "r": 324.98117, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "87-88", "bbox": {"l": 305.27301, "t": 195.41656, "r": 324.98117, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 334.94284, "t": 195.41656, "r": 354.651, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "74-83", "bbox": {"l": 334.94284, "t": 195.41656, "r": 354.651, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 364.61267, "t": 195.41656, "r": 384.32083, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "90-92", "bbox": {"l": 364.61267, "t": 195.41656, "r": 384.32083, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 398.45187, "t": 195.41656, "r": 418.16003, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "97-97", "bbox": {"l": 398.45187, "t": 195.41656, "r": 418.16003, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 428.1217, "t": 195.41656, "r": 447.82986, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "81-85", "bbox": {"l": 428.1217, "t": 195.41656, "r": 447.82986, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 457.80051, "t": 195.41656, "r": 477.50867, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "75-88", "bbox": {"l": 457.80051, "t": 195.41656, "r": 477.50867, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 487.47034, "t": 195.41656, "r": 507.17849999999993, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "93-95", "bbox": {"l": 487.47034, "t": 195.41656, "r": 507.17849999999993, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 104.825, "t": 206.37554999999998, "r": 147.35262, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "Page-footer", "bbox": {"l": 104.825, "t": 206.37554999999998, "r": 147.35262, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 177.866, "t": 206.37554999999998, "r": 198.71288, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "70878", "bbox": {"l": 177.866, "t": 206.37554999999998, "r": 198.71288, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 219.211, "t": 206.37554999999998, "r": 233.69174000000004, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "6.51", "bbox": {"l": 219.211, "t": 206.37554999999998, "r": 233.69174000000004, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 250.01956, "t": 206.37554999999998, "r": 264.50031, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "5.58", "bbox": {"l": 250.01956, "t": 206.37554999999998, "r": 264.50031, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 280.82812, "t": 206.37554999999998, "r": 295.30887, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "6.00", "bbox": {"l": 280.82812, "t": 206.37554999999998, "r": 295.30887, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 305.27301, "t": 206.37554999999998, "r": 324.98117, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "93-94", "bbox": {"l": 305.27301, "t": 206.37554999999998, "r": 324.98117, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 334.94284, "t": 206.37554999999998, "r": 354.651, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "88-90", "bbox": {"l": 334.94284, "t": 206.37554999999998, "r": 354.651, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 364.61267, "t": 206.37554999999998, "r": 384.32083, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "95-96", "bbox": {"l": 364.61267, "t": 206.37554999999998, "r": 384.32083, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 405.65189, "t": 206.37554999999998, "r": 418.16, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "100", "bbox": {"l": 405.65189, "t": 206.37554999999998, "r": 418.16, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 428.12167, "t": 206.37554999999998, "r": 447.82983, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "92-97", "bbox": {"l": 428.12167, "t": 206.37554999999998, "r": 447.82983, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 465.00049, "t": 206.37554999999998, "r": 477.5086099999999, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "100", "bbox": {"l": 465.00049, "t": 206.37554999999998, "r": 477.5086099999999, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 487.47028, "t": 206.37554999999998, "r": 507.17843999999997, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "96-98", "bbox": {"l": 487.47028, "t": 206.37554999999998, "r": 507.17843999999997, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 104.825, "t": 217.33452999999997, "r": 150.10532, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "Page-header", "bbox": {"l": 104.825, "t": 217.33452999999997, "r": 150.10532, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 177.866, "t": 217.33452999999997, "r": 198.71288, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "58022", "bbox": {"l": 177.866, "t": 217.33452999999997, "r": 198.71288, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 219.211, "t": 217.33452999999997, "r": 233.69174000000004, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "5.10", "bbox": {"l": 219.211, "t": 217.33452999999997, "r": 233.69174000000004, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 250.01956, "t": 217.33452999999997, "r": 264.50031, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "6.70", "bbox": {"l": 250.01956, "t": 217.33452999999997, "r": 264.50031, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 280.82812, "t": 217.33452999999997, "r": 295.30887, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "5.06", "bbox": {"l": 280.82812, "t": 217.33452999999997, "r": 295.30887, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 305.27301, "t": 217.33452999999997, "r": 324.98117, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "85-89", "bbox": {"l": 305.27301, "t": 217.33452999999997, "r": 324.98117, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 334.94284, "t": 217.33452999999997, "r": 354.651, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "66-76", "bbox": {"l": 334.94284, "t": 217.33452999999997, "r": 354.651, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 364.61267, "t": 217.33452999999997, "r": 384.32083, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "90-94", "bbox": {"l": 364.61267, "t": 217.33452999999997, "r": 384.32083, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 394.2825, "t": 217.33452999999997, "r": 418.16003, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "98-100", "bbox": {"l": 394.2825, "t": 217.33452999999997, "r": 418.16003, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 428.1217, "t": 217.33452999999997, "r": 447.82986, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "91-92", "bbox": {"l": 428.1217, "t": 217.33452999999997, "r": 447.82986, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 457.80051, "t": 217.33452999999997, "r": 477.50867, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "97-99", "bbox": {"l": 457.80051, "t": 217.33452999999997, "r": 477.50867, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 487.47034, "t": 217.33452999999997, "r": 507.17849999999993, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "81-86", "bbox": {"l": 487.47034, "t": 217.33452999999997, "r": 507.17849999999993, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 104.825, "t": 228.29351999999994, "r": 130.80963, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "Picture", "bbox": {"l": 104.825, "t": 228.29351999999994, "r": 130.80963, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 177.866, "t": 228.29351999999994, "r": 198.71288, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "45976", "bbox": {"l": 177.866, "t": 228.29351999999994, "r": 198.71288, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 219.211, "t": 228.29351999999994, "r": 233.69174000000004, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "4.21", "bbox": {"l": 219.211, "t": 228.29351999999994, "r": 233.69174000000004, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 250.01956, "t": 228.29351999999994, "r": 264.50031, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "2.78", "bbox": {"l": 250.01956, "t": 228.29351999999994, "r": 264.50031, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 280.82812, "t": 228.29351999999994, "r": 295.30887, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "5.31", "bbox": {"l": 280.82812, "t": 228.29351999999994, "r": 295.30887, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 305.27301, "t": 228.29351999999994, "r": 324.98117, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "69-71", "bbox": {"l": 305.27301, "t": 228.29351999999994, "r": 324.98117, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 334.94284, "t": 228.29351999999994, "r": 354.651, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "56-59", "bbox": {"l": 334.94284, "t": 228.29351999999994, "r": 354.651, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 364.61267, "t": 228.29351999999994, "r": 384.32083, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "82-86", "bbox": {"l": 364.61267, "t": 228.29351999999994, "r": 384.32083, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 398.45187, "t": 228.29351999999994, "r": 418.16003, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "69-82", "bbox": {"l": 398.45187, "t": 228.29351999999994, "r": 418.16003, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 428.1217, "t": 228.29351999999994, "r": 447.82986, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "80-95", "bbox": {"l": 428.1217, "t": 228.29351999999994, "r": 447.82986, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 457.80051, "t": 228.29351999999994, "r": 477.50867, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "66-71", "bbox": {"l": 457.80051, "t": 228.29351999999994, "r": 477.50867, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 487.47034, "t": 228.29351999999994, "r": 507.17849999999993, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "59-76", "bbox": {"l": 487.47034, "t": 228.29351999999994, "r": 507.17849999999993, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 104.825, "t": 239.25256000000002, "r": 159.56487, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": "Section-header", "bbox": {"l": 104.825, "t": 239.25256000000002, "r": 159.56487, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 173.69701, "t": 239.25256000000002, "r": 198.71326, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "142884", "bbox": {"l": 173.69701, "t": 239.25256000000002, "r": 198.71326, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 215.04201, "t": 239.25256000000002, "r": 233.69212, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "12.60", "bbox": {"l": 215.04201, "t": 239.25256000000002, "r": 233.69212, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 245.85056, "t": 239.25256000000002, "r": 264.50067, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": "15.77", "bbox": {"l": 245.85056, "t": 239.25256000000002, "r": 264.50067, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 276.65912, "t": 239.25256000000002, "r": 295.30923, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 107, "text": "12.85", "bbox": {"l": 276.65912, "t": 239.25256000000002, "r": 295.30923, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 114, "label": "text", "bbox": {"l": 305.27301, "t": 239.25256000000002, "r": 324.98117, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 108, "text": "83-84", "bbox": {"l": 305.27301, "t": 239.25256000000002, "r": 324.98117, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 115, "label": "text", "bbox": {"l": 334.94284, "t": 239.25256000000002, "r": 354.651, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 109, "text": "76-81", "bbox": {"l": 334.94284, "t": 239.25256000000002, "r": 354.651, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 116, "label": "text", "bbox": {"l": 364.61267, "t": 239.25256000000002, "r": 384.32083, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 110, "text": "90-92", "bbox": {"l": 364.61267, "t": 239.25256000000002, "r": 384.32083, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 117, "label": "text", "bbox": {"l": 398.45187, "t": 239.25256000000002, "r": 418.16003, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 111, "text": "94-95", "bbox": {"l": 398.45187, "t": 239.25256000000002, "r": 418.16003, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 118, "label": "text", "bbox": {"l": 428.1217, "t": 239.25256000000002, "r": 447.82986, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 112, "text": "87-94", "bbox": {"l": 428.1217, "t": 239.25256000000002, "r": 447.82986, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 119, "label": "text", "bbox": {"l": 457.80051, "t": 239.25256000000002, "r": 477.50867, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 113, "text": "69-73", "bbox": {"l": 457.80051, "t": 239.25256000000002, "r": 477.50867, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 120, "label": "text", "bbox": {"l": 487.47034, "t": 239.25256000000002, "r": 507.17849999999993, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 114, "text": "78-86", "bbox": {"l": 487.47034, "t": 239.25256000000002, "r": 507.17849999999993, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 121, "label": "text", "bbox": {"l": 104.825, "t": 250.21155, "r": 124.63177, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 115, "text": "Table", "bbox": {"l": 104.825, "t": 250.21155, "r": 124.63177, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 122, "label": "text", "bbox": {"l": 177.866, "t": 250.21155, "r": 198.71288, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 116, "text": "34733", "bbox": {"l": 177.866, "t": 250.21155, "r": 198.71288, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 123, "label": "text", "bbox": {"l": 219.211, "t": 250.21155, "r": 233.69174000000004, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 117, "text": "3.20", "bbox": {"l": 219.211, "t": 250.21155, "r": 233.69174000000004, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 124, "label": "text", "bbox": {"l": 250.01956, "t": 250.21155, "r": 264.50031, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 118, "text": "2.27", "bbox": {"l": 250.01956, "t": 250.21155, "r": 264.50031, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 125, "label": "text", "bbox": {"l": 280.82812, "t": 250.21155, "r": 295.30887, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 119, "text": "3.60", "bbox": {"l": 280.82812, "t": 250.21155, "r": 295.30887, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 126, "label": "text", "bbox": {"l": 305.27301, "t": 250.21155, "r": 324.98117, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 120, "text": "77-81", "bbox": {"l": 305.27301, "t": 250.21155, "r": 324.98117, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 127, "label": "text", "bbox": {"l": 334.94284, "t": 250.21155, "r": 354.651, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 121, "text": "75-80", "bbox": {"l": 334.94284, "t": 250.21155, "r": 354.651, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 128, "label": "text", "bbox": {"l": 364.61267, "t": 250.21155, "r": 384.32083, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 122, "text": "83-86", "bbox": {"l": 364.61267, "t": 250.21155, "r": 384.32083, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 129, "label": "text", "bbox": {"l": 398.45187, "t": 250.21155, "r": 418.16003, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 123, "text": "98-99", "bbox": {"l": 398.45187, "t": 250.21155, "r": 418.16003, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 130, "label": "text", "bbox": {"l": 428.1217, "t": 250.21155, "r": 447.82986, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 124, "text": "58-80", "bbox": {"l": 428.1217, "t": 250.21155, "r": 447.82986, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 131, "label": "text", "bbox": {"l": 457.80051, "t": 250.21155, "r": 477.50867, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 125, "text": "79-84", "bbox": {"l": 457.80051, "t": 250.21155, "r": 477.50867, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 132, "label": "text", "bbox": {"l": 487.47034, "t": 250.21155, "r": 507.17849999999993, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 126, "text": "70-85", "bbox": {"l": 487.47034, "t": 250.21155, "r": 507.17849999999993, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 133, "label": "text", "bbox": {"l": 104.825, "t": 261.16956000000005, "r": 120.78519, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 127, "text": "Text", "bbox": {"l": 104.825, "t": 261.16956000000005, "r": 120.78519, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 134, "label": "text", "bbox": {"l": 173.69701, "t": 261.16956000000005, "r": 198.71326, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 128, "text": "510377", "bbox": {"l": 173.69701, "t": 261.16956000000005, "r": 198.71326, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 135, "label": "text", "bbox": {"l": 215.04201, "t": 261.16956000000005, "r": 233.69212, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 129, "text": "45.82", "bbox": {"l": 215.04201, "t": 261.16956000000005, "r": 233.69212, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 136, "label": "text", "bbox": {"l": 245.85056, "t": 261.16956000000005, "r": 264.50067, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 130, "text": "49.28", "bbox": {"l": 245.85056, "t": 261.16956000000005, "r": 264.50067, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 137, "label": "text", "bbox": {"l": 276.65912, "t": 261.16956000000005, "r": 295.30923, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 131, "text": "45.00", "bbox": {"l": 276.65912, "t": 261.16956000000005, "r": 295.30923, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 138, "label": "text", "bbox": {"l": 305.27301, "t": 261.16956000000005, "r": 324.98117, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 132, "text": "84-86", "bbox": {"l": 305.27301, "t": 261.16956000000005, "r": 324.98117, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 139, "label": "text", "bbox": {"l": 334.94284, "t": 261.16956000000005, "r": 354.651, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 133, "text": "81-86", "bbox": {"l": 334.94284, "t": 261.16956000000005, "r": 354.651, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 140, "label": "text", "bbox": {"l": 364.61267, "t": 261.16956000000005, "r": 384.32083, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 134, "text": "88-93", "bbox": {"l": 364.61267, "t": 261.16956000000005, "r": 384.32083, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 141, "label": "text", "bbox": {"l": 398.45187, "t": 261.16956000000005, "r": 418.16003, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 135, "text": "89-93", "bbox": {"l": 398.45187, "t": 261.16956000000005, "r": 418.16003, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 142, "label": "text", "bbox": {"l": 428.1217, "t": 261.16956000000005, "r": 447.82986, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 136, "text": "87-92", "bbox": {"l": 428.1217, "t": 261.16956000000005, "r": 447.82986, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 143, "label": "text", "bbox": {"l": 457.80051, "t": 261.16956000000005, "r": 477.50867, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 137, "text": "71-79", "bbox": {"l": 457.80051, "t": 261.16956000000005, "r": 477.50867, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 144, "label": "text", "bbox": {"l": 487.47034, "t": 261.16956000000005, "r": 507.17849999999993, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 138, "text": "87-95", "bbox": {"l": 487.47034, "t": 261.16956000000005, "r": 507.17849999999993, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 145, "label": "text", "bbox": {"l": 104.825, "t": 272.12854000000004, "r": 121.81633, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 139, "text": "Title", "bbox": {"l": 104.825, "t": 272.12854000000004, "r": 121.81633, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 146, "label": "text", "bbox": {"l": 182.035, "t": 272.12854000000004, "r": 198.71251, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 140, "text": "5071", "bbox": {"l": 182.035, "t": 272.12854000000004, "r": 198.71251, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 147, "label": "text", "bbox": {"l": 219.211, "t": 272.12854000000004, "r": 233.69174000000004, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 141, "text": "0.47", "bbox": {"l": 219.211, "t": 272.12854000000004, "r": 233.69174000000004, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 148, "label": "text", "bbox": {"l": 250.01956, "t": 272.12854000000004, "r": 264.50031, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 142, "text": "0.30", "bbox": {"l": 250.01956, "t": 272.12854000000004, "r": 264.50031, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 149, "label": "text", "bbox": {"l": 280.82812, "t": 272.12854000000004, "r": 295.30887, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 143, "text": "0.50", "bbox": {"l": 280.82812, "t": 272.12854000000004, "r": 295.30887, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 150, "label": "text", "bbox": {"l": 305.27301, "t": 272.12854000000004, "r": 324.98117, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 144, "text": "60-72", "bbox": {"l": 305.27301, "t": 272.12854000000004, "r": 324.98117, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 151, "label": "text", "bbox": {"l": 334.94284, "t": 272.12854000000004, "r": 354.651, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 145, "text": "24-63", "bbox": {"l": 334.94284, "t": 272.12854000000004, "r": 354.651, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 152, "label": "text", "bbox": {"l": 364.61267, "t": 272.12854000000004, "r": 384.32083, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 146, "text": "50-63", "bbox": {"l": 364.61267, "t": 272.12854000000004, "r": 384.32083, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 153, "label": "text", "bbox": {"l": 394.2825, "t": 272.12854000000004, "r": 418.16003, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 147, "text": "94-100", "bbox": {"l": 394.2825, "t": 272.12854000000004, "r": 418.16003, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 154, "label": "text", "bbox": {"l": 428.1217, "t": 272.12854000000004, "r": 447.82986, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 148, "text": "82-96", "bbox": {"l": 428.1217, "t": 272.12854000000004, "r": 447.82986, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 155, "label": "text", "bbox": {"l": 457.80051, "t": 272.12854000000004, "r": 477.50867, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 149, "text": "68-79", "bbox": {"l": 457.80051, "t": 272.12854000000004, "r": 477.50867, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 156, "label": "text", "bbox": {"l": 487.47034, "t": 272.12854000000004, "r": 507.17849999999993, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 150, "text": "24-56", "bbox": {"l": 487.47034, "t": 272.12854000000004, "r": 507.17849999999993, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 157, "label": "text", "bbox": {"l": 104.825, "t": 283.48654, "r": 123.43028, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 151, "text": "Total", "bbox": {"l": 104.825, "t": 283.48654, "r": 123.43028, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 158, "label": "text", "bbox": {"l": 169.52699, "t": 283.48654, "r": 198.71263, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 152, "text": "1107470", "bbox": {"l": 169.52699, "t": 283.48654, "r": 198.71263, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 159, "label": "text", "bbox": {"l": 208.675, "t": 283.48654, "r": 233.69124999999997, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 153, "text": "941123", "bbox": {"l": 208.675, "t": 283.48654, "r": 233.69124999999997, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 160, "label": "text", "bbox": {"l": 243.65291999999997, "t": 283.48654, "r": 264.49982, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 154, "text": "99816", "bbox": {"l": 243.65291999999997, "t": 283.48654, "r": 264.49982, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 161, "label": "text", "bbox": {"l": 274.46149, "t": 283.48654, "r": 295.30838, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 155, "text": "66531", "bbox": {"l": 274.46149, "t": 283.48654, "r": 295.30838, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 162, "label": "text", "bbox": {"l": 305.27301, "t": 283.48654, "r": 324.98117, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 156, "text": "82-83", "bbox": {"l": 305.27301, "t": 283.48654, "r": 324.98117, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 163, "label": "text", "bbox": {"l": 334.94284, "t": 283.48654, "r": 354.651, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 157, "text": "71-74", "bbox": {"l": 334.94284, "t": 283.48654, "r": 354.651, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 164, "label": "text", "bbox": {"l": 364.61267, "t": 283.48654, "r": 384.32083, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 158, "text": "79-81", "bbox": {"l": 364.61267, "t": 283.48654, "r": 384.32083, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 165, "label": "text", "bbox": {"l": 398.45187, "t": 283.48654, "r": 418.16003, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 159, "text": "89-94", "bbox": {"l": 398.45187, "t": 283.48654, "r": 418.16003, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 166, "label": "text", "bbox": {"l": 428.1217, "t": 283.48654, "r": 447.82986, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 160, "text": "86-91", "bbox": {"l": 428.1217, "t": 283.48654, "r": 447.82986, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 167, "label": "text", "bbox": {"l": 457.80051, "t": 283.48654, "r": 477.50867, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 161, "text": "71-76", "bbox": {"l": 457.80051, "t": 283.48654, "r": 477.50867, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 168, "label": "text", "bbox": {"l": 487.47034, "t": 283.48654, "r": 507.17849999999993, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 162, "text": "68-85", "bbox": {"l": 487.47034, "t": 283.48654, "r": 507.17849999999993, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "lcel", "lcel", "lcel", "ched", "lcel", "lcel", "lcel", "lcel", "lcel", "nl", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 14, "num_cols": 12, "table_cells": [{"bbox": {"l": 233.94400000000002, "t": 140.22351000000003, "r": 270.04272, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 4, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 6, "text": "% of Total", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 329.04999, "t": 140.22351000000003, "r": 483.3976400000001, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 6, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 6, "end_col_offset_idx": 12, "text": "triple inter-annotator mAP @ 0.5-0.95 (%)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 151.18255999999997, "r": 141.71277, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "class label", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 175.94701, "t": 151.18255999999997, "r": 198.71269, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Count", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 213.795, "t": 151.18255999999997, "r": 233.69144, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Train", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 249.37367, "t": 151.18255999999997, "r": 264.5, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Test", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 283.53568, "t": 151.18255999999997, "r": 295.30856, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Val", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 314.01501, "t": 151.18255999999997, "r": 324.98093, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "All", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 343.01236, "t": 151.18255999999997, "r": 354.65076, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "Fin", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 367.84033, "t": 151.18255999999997, "r": 384.32059, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "Man", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 407.54358, "t": 151.18255999999997, "r": 418.15979, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "Sci", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 432.29979999999995, "t": 151.18255999999997, "r": 447.82962, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "Law", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 465.72656, "t": 151.18255999999997, "r": 477.50842, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "Pat", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 493.52240000000006, "t": 151.18255999999997, "r": 507.17822, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "Ten", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 162.53954999999996, "r": 134.01064, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Caption", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 177.866, "t": 162.53954999999996, "r": 198.71288, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "22524", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 162.53954999999996, "r": 233.69174000000004, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "2.04", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 162.53954999999996, "r": 264.50031, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "1.77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 162.53954999999996, "r": 295.30887, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "2.32", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 162.53954999999996, "r": 324.98117, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "84-89", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 162.53954999999996, "r": 354.651, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "40-61", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 162.53954999999996, "r": 384.32083, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "86-92", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45187, "t": 162.53954999999996, "r": 418.16003, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "94-99", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 162.53954999999996, "r": 447.82986, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "95-99", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 162.53954999999996, "r": 477.50867, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "69-78", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 495.32489, "t": 162.53954999999996, "r": 507.17846999999995, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 173.49854000000005, "r": 137.3282, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Footnote", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 182.035, "t": 173.49854000000005, "r": 198.71251, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "6318", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 173.49854000000005, "r": 233.69174000000004, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.60", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 173.49854000000005, "r": 264.50031, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.31", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 173.49854000000005, "r": 295.30887, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.58", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 173.49854000000005, "r": 324.98117, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "83-91", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 342.79739, "t": 173.49854000000005, "r": 354.65097, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 371.81265, "t": 173.49854000000005, "r": 384.32077, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "100", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45181, "t": 173.49854000000005, "r": 418.15997, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "62-88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.12164, "t": 173.49854000000005, "r": 447.8298, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "85-94", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 465.655, "t": 173.49854000000005, "r": 477.50857999999994, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47025, "t": 173.49854000000005, "r": 507.17841, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "82-97", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 184.45752000000005, "r": 135.33766, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Formula", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 177.866, "t": 184.45752000000005, "r": 198.71288, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "25027", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 184.45752000000005, "r": 233.69174000000004, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "2.25", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 184.45752000000005, "r": 264.50031, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "1.90", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 184.45752000000005, "r": 295.30887, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "2.96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 184.45752000000005, "r": 324.98117, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "83-85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 342.79739, "t": 184.45752000000005, "r": 354.65097, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 372.46719, "t": 184.45752000000005, "r": 384.32077, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45181, "t": 184.45752000000005, "r": 418.15997, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "84-87", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.12164, "t": 184.45752000000005, "r": 447.8298, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "86-96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 465.655, "t": 184.45752000000005, "r": 477.50857999999994, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 495.3248, "t": 184.45752000000005, "r": 507.17838000000006, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 195.41656, "r": 137.70479, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "List-item", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 173.69701, "t": 195.41656, "r": 198.71326, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "185660", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 215.04201, "t": 195.41656, "r": 233.69212, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "17.19", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.85056, "t": 195.41656, "r": 264.50067, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "13.34", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 276.65912, "t": 195.41656, "r": 295.30923, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "15.82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 195.41656, "r": 324.98117, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "87-88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 195.41656, "r": 354.651, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "74-83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 195.41656, "r": 384.32083, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "90-92", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45187, "t": 195.41656, "r": 418.16003, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "97-97", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 195.41656, "r": 447.82986, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "81-85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 195.41656, "r": 477.50867, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "75-88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 195.41656, "r": 507.17849999999993, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "93-95", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 206.37554999999998, "r": 147.35262, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-footer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 177.866, "t": 206.37554999999998, "r": 198.71288, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "70878", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 206.37554999999998, "r": 233.69174000000004, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "6.51", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 206.37554999999998, "r": 264.50031, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "5.58", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 206.37554999999998, "r": 295.30887, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "6.00", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 206.37554999999998, "r": 324.98117, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "93-94", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 206.37554999999998, "r": 354.651, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "88-90", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 206.37554999999998, "r": 384.32083, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "95-96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 405.65189, "t": 206.37554999999998, "r": 418.16, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "100", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.12167, "t": 206.37554999999998, "r": 447.82983, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "92-97", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 465.00049, "t": 206.37554999999998, "r": 477.5086099999999, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "100", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47028, "t": 206.37554999999998, "r": 507.17843999999997, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "96-98", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 217.33452999999997, "r": 150.10532, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 177.866, "t": 217.33452999999997, "r": 198.71288, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "58022", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 217.33452999999997, "r": 233.69174000000004, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "5.10", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 217.33452999999997, "r": 264.50031, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "6.70", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 217.33452999999997, "r": 295.30887, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "5.06", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 217.33452999999997, "r": 324.98117, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "85-89", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 217.33452999999997, "r": 354.651, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "66-76", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 217.33452999999997, "r": 384.32083, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "90-94", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.2825, "t": 217.33452999999997, "r": 418.16003, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "98-100", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 217.33452999999997, "r": 447.82986, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "91-92", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 217.33452999999997, "r": 477.50867, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "97-99", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 217.33452999999997, "r": 507.17849999999993, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "81-86", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 228.29351999999994, "r": 130.80963, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Picture", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 177.866, "t": 228.29351999999994, "r": 198.71288, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "45976", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 228.29351999999994, "r": 233.69174000000004, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "4.21", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 228.29351999999994, "r": 264.50031, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "2.78", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 228.29351999999994, "r": 295.30887, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "5.31", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 228.29351999999994, "r": 324.98117, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "69-71", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 228.29351999999994, "r": 354.651, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "56-59", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 228.29351999999994, "r": 384.32083, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "82-86", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45187, "t": 228.29351999999994, "r": 418.16003, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "69-82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 228.29351999999994, "r": 447.82986, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "80-95", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 228.29351999999994, "r": 477.50867, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "66-71", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 228.29351999999994, "r": 507.17849999999993, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "59-76", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 239.25256000000002, "r": 159.56487, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Section-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 173.69701, "t": 239.25256000000002, "r": 198.71326, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "142884", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 215.04201, "t": 239.25256000000002, "r": 233.69212, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "12.60", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.85056, "t": 239.25256000000002, "r": 264.50067, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "15.77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 276.65912, "t": 239.25256000000002, "r": 295.30923, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "12.85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 239.25256000000002, "r": 324.98117, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "83-84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 239.25256000000002, "r": 354.651, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "76-81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 239.25256000000002, "r": 384.32083, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "90-92", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45187, "t": 239.25256000000002, "r": 418.16003, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "94-95", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 239.25256000000002, "r": 447.82986, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "87-94", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 239.25256000000002, "r": 477.50867, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "69-73", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 239.25256000000002, "r": 507.17849999999993, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "78-86", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 250.21155, "r": 124.63177, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 177.866, "t": 250.21155, "r": 198.71288, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "34733", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 250.21155, "r": 233.69174000000004, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "3.20", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 250.21155, "r": 264.50031, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "2.27", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 250.21155, "r": 295.30887, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "3.60", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 250.21155, "r": 324.98117, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "77-81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 250.21155, "r": 354.651, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "75-80", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 250.21155, "r": 384.32083, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "83-86", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45187, "t": 250.21155, "r": 418.16003, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "98-99", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 250.21155, "r": 447.82986, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "58-80", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 250.21155, "r": 477.50867, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "79-84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 250.21155, "r": 507.17849999999993, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "70-85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 261.16956000000005, "r": 120.78519, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Text", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 173.69701, "t": 261.16956000000005, "r": 198.71326, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "510377", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 215.04201, "t": 261.16956000000005, "r": 233.69212, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "45.82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.85056, "t": 261.16956000000005, "r": 264.50067, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "49.28", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 276.65912, "t": 261.16956000000005, "r": 295.30923, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "45.00", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 261.16956000000005, "r": 324.98117, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "84-86", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 261.16956000000005, "r": 354.651, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "81-86", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 261.16956000000005, "r": 384.32083, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "88-93", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45187, "t": 261.16956000000005, "r": 418.16003, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "89-93", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 261.16956000000005, "r": 447.82986, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "87-92", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 261.16956000000005, "r": 477.50867, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "71-79", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 261.16956000000005, "r": 507.17849999999993, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "87-95", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 272.12854000000004, "r": 121.81633, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Title", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 182.035, "t": 272.12854000000004, "r": 198.71251, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "5071", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 272.12854000000004, "r": 233.69174000000004, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.47", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 272.12854000000004, "r": 264.50031, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.30", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 272.12854000000004, "r": 295.30887, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.50", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 272.12854000000004, "r": 324.98117, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "60-72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 272.12854000000004, "r": 354.651, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "24-63", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 272.12854000000004, "r": 384.32083, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "50-63", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.2825, "t": 272.12854000000004, "r": 418.16003, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "94-100", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 272.12854000000004, "r": 447.82986, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "82-96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 272.12854000000004, "r": 477.50867, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "68-79", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 272.12854000000004, "r": 507.17849999999993, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "24-56", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 283.48654, "r": 123.43028, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Total", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 169.52699, "t": 283.48654, "r": 198.71263, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "1107470", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 208.675, "t": 283.48654, "r": 233.69124999999997, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "941123", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 243.65291999999997, "t": 283.48654, "r": 264.49982, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "99816", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 274.46149, "t": 283.48654, "r": 295.30838, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "66531", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 283.48654, "r": 324.98117, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "82-83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 283.48654, "r": 354.651, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "71-74", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 283.48654, "r": 384.32083, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "79-81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45187, "t": 283.48654, "r": 418.16003, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "89-94", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 283.48654, "r": 447.82986, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "86-91", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 283.48654, "r": 477.50867, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "71-76", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 283.48654, "r": 507.17849999999993, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "68-85", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "caption", "id": 9, "page_no": 3, "cluster": {"id": 9, "label": "caption", "bbox": {"l": 53.79800000000001, "t": 554.00999, "r": 295.64874, "b": 606.31924, "coord_origin": "TOPLEFT"}, "confidence": 0.810490071773529, "cells": [{"id": 163, "text": "Figure 3: Corpus Conversion Service annotation user inter-", "bbox": {"l": 53.79800000000001, "t": 554.00999, "r": 295.64871, "b": 562.48325, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "face. The PDF page is shown in the background, with over-", "bbox": {"l": 53.79800000000001, "t": 564.96899, "r": 295.64874, "b": 573.44225, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "laid text-cells (in darker shades). The annotation boxes can", "bbox": {"l": 53.79800000000001, "t": 575.92799, "r": 294.04376, "b": 584.40125, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "be drawn by dragging a rectangle over each segment with", "bbox": {"l": 53.79800000000001, "t": 586.88699, "r": 294.04373, "b": 595.36024, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "the respective label from the palette on the right.", "bbox": {"l": 53.79800000000001, "t": 597.84599, "r": 252.78931000000003, "b": 606.31924, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 3: Corpus Conversion Service annotation user interface. The PDF page is shown in the background, with overlaid text-cells (in darker shades). The annotation boxes can be drawn by dragging a rectangle over each segment with the respective label from the palette on the right."}, {"label": "text", "id": 5, "page_no": 3, "cluster": {"id": 5, "label": "text", "bbox": {"l": 53.466999, "t": 634.29155, "r": 294.04745, "b": 675.54317, "coord_origin": "TOPLEFT"}, "confidence": 0.980393648147583, "cells": [{"id": 168, "text": "we distributed the annotation workload and performed continuous", "bbox": {"l": 53.466999, "t": 634.29155, "r": 294.04745, "b": 642.66617, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "quality controls. Phase one and two required a small team of experts", "bbox": {"l": 53.79800000000001, "t": 645.25055, "r": 294.04535, "b": 653.62517, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "only. For phases three and four, a group of 40 dedicated annotators", "bbox": {"l": 53.79800000000001, "t": 656.20955, "r": 294.04422, "b": 664.58417, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "were assembled and supervised.", "bbox": {"l": 53.466999, "t": 667.16856, "r": 170.58611, "b": 675.54317, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "we distributed the annotation workload and performed continuous quality controls. Phase one and two required a small team of experts only. For phases three and four, a group of 40 dedicated annotators were assembled and supervised."}, {"label": "text", "id": 6, "page_no": 3, "cluster": {"id": 6, "label": "text", "bbox": {"l": 53.79800000000001, "t": 678.01099, "r": 295.55844, "b": 708.420174, "coord_origin": "TOPLEFT"}, "confidence": 0.9748398661613464, "cells": [{"id": 172, "text": "Phase 1: Data selection and preparation.", "bbox": {"l": 63.76099800000001, "t": 678.01099, "r": 226.72533000000004, "b": 686.48424, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "Our inclusion cri-", "bbox": {"l": 229.06900000000002, "t": 678.12756, "r": 295.55844, "b": 686.50217, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "teria for documents were described in Section 3. A large effort went", "bbox": {"l": 53.79800000000001, "t": 689.08656, "r": 294.04538, "b": 697.461174, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "into ensuring that all documents are free to use. The data sources", "bbox": {"l": 53.79800000000001, "t": 700.045555, "r": 294.04642, "b": 708.420174, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Phase 1: Data selection and preparation. Our inclusion criteria for documents were described in Section 3. A large effort went into ensuring that all documents are free to use. The data sources"}, {"label": "text", "id": 4, "page_no": 3, "cluster": {"id": 4, "label": "text", "bbox": {"l": 317.95499, "t": 312.07953, "r": 559.18536, "b": 375.24817, "coord_origin": "TOPLEFT"}, "confidence": 0.9818483591079712, "cells": [{"id": 176, "text": "include publication repositories such as arXiv$^{3}$, government offices,", "bbox": {"l": 317.95499, "t": 312.07953, "r": 559.18536, "b": 320.45416000000006, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "company websites as well as data directory services for financial", "bbox": {"l": 317.95499, "t": 323.03754, "r": 558.19843, "b": 331.41217, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "reports and patents. Scanned documents were excluded wherever", "bbox": {"l": 317.95499, "t": 333.99655, "r": 558.36963, "b": 342.37119, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "possible because they can be rotated or skewed. This would not", "bbox": {"l": 317.95499, "t": 344.95554, "r": 558.2041, "b": 353.33017, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "allow us to perform annotation with rectangular bounding-boxes", "bbox": {"l": 317.95499, "t": 355.91455, "r": 558.20294, "b": 364.28918, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "and therefore complicate the annotation process.", "bbox": {"l": 317.95499, "t": 366.87354, "r": 496.71826, "b": 375.24817, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "include publication repositories such as arXiv$^{3}$, government offices, company websites as well as data directory services for financial reports and patents. Scanned documents were excluded wherever possible because they can be rotated or skewed. This would not allow us to perform annotation with rectangular bounding-boxes and therefore complicate the annotation process."}, {"label": "text", "id": 0, "page_no": 3, "cluster": {"id": 0, "label": "text", "bbox": {"l": 317.95499, "t": 377.8325500000001, "r": 559.71307, "b": 506.75516, "coord_origin": "TOPLEFT"}, "confidence": 0.9866719841957092, "cells": [{"id": 182, "text": "Preparation work included uploading and parsing the sourced", "bbox": {"l": 327.918, "t": 377.8325500000001, "r": 558.20618, "b": 386.20717999999994, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "PDF documents in the Corpus Conversion Service (CCS) [22], a", "bbox": {"l": 317.95499, "t": 388.79153, "r": 558.2019, "b": 397.16617, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "cloud-native platform which provides a visual annotation interface", "bbox": {"l": 317.95499, "t": 399.75055, "r": 558.20233, "b": 408.12518, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": "and allows for dataset inspection and analysis. The annotation in-", "bbox": {"l": 317.95499, "t": 410.7095299999999, "r": 559.71277, "b": 419.08417, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "terface of CCS is shown in Figure 3. The desired balance of pages", "bbox": {"l": 317.95499, "t": 421.66855000000004, "r": 558.20062, "b": 430.04318, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "between the different document categories was achieved by se-", "bbox": {"l": 317.95499, "t": 432.62753, "r": 559.71307, "b": 441.00217, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": "lective subsampling of pages with certain desired properties. For", "bbox": {"l": 317.95499, "t": 443.58554, "r": 558.36877, "b": 451.96017, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "example, we made sure to include the title page of each document", "bbox": {"l": 317.95499, "t": 454.54453, "r": 558.20428, "b": 462.91916, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "and bias the remaining page selection to those with figures or", "bbox": {"l": 317.95499, "t": 465.50354, "r": 558.36877, "b": 473.87817, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "tables. The latter was achieved by leveraging pre-trained object", "bbox": {"l": 317.95499, "t": 476.46252, "r": 558.20428, "b": 484.83716, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": "detection models from PubLayNet, which helped us estimate how", "bbox": {"l": 317.95499, "t": 487.42154, "r": 558.5307, "b": 495.79617, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "many figures and tables a given page contains.", "bbox": {"l": 317.95499, "t": 498.38052, "r": 488.46914999999996, "b": 506.75516, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Preparation work included uploading and parsing the sourced PDF documents in the Corpus Conversion Service (CCS) [22], a cloud-native platform which provides a visual annotation interface and allows for dataset inspection and analysis. The annotation interface of CCS is shown in Figure 3. The desired balance of pages between the different document categories was achieved by selective subsampling of pages with certain desired properties. For example, we made sure to include the title page of each document and bias the remaining page selection to those with figures or tables. The latter was achieved by leveraging pre-trained object detection models from PubLayNet, which helped us estimate how many figures and tables a given page contains."}, {"label": "text", "id": 3, "page_no": 3, "cluster": {"id": 3, "label": "text", "bbox": {"l": 317.62299, "t": 509.22299, "r": 559.71765, "b": 693.0561749999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9847556948661804, "cells": [{"id": 194, "text": "Phase 2: Label selection and guideline.", "bbox": {"l": 327.918, "t": 509.22299, "r": 482.41809, "b": 517.69623, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "We reviewed the col-", "bbox": {"l": 484.474, "t": 509.33954, "r": 559.71765, "b": 517.71417, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "lected documents and identified the most common structural fea-", "bbox": {"l": 317.95499, "t": 520.29855, "r": 559.71619, "b": 528.67319, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "tures they exhibit. This was achieved by identifying recurrent layout", "bbox": {"l": 317.95499, "t": 531.2575400000001, "r": 558.20239, "b": 539.63217, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "elements and lead us to the definition of 11 distinct class labels.", "bbox": {"l": 317.95499, "t": 542.21655, "r": 559.58502, "b": 550.59117, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "These 11 class labels are", "bbox": {"l": 317.686, "t": 553.17456, "r": 404.14197, "b": 561.54918, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "Caption", "bbox": {"l": 406.26599, "t": 553.21939, "r": 433.84860000000003, "b": 561.5581500000001, "coord_origin": "TOPLEFT"}}, {"id": 201, "text": ",", "bbox": {"l": 433.84799, "t": 553.17456, "r": 435.78115999999994, "b": 561.54918, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": "Footnote", "bbox": {"l": 437.9079899999999, "t": 553.21939, "r": 467.23926, "b": 561.5581500000001, "coord_origin": "TOPLEFT"}}, {"id": 203, "text": ",", "bbox": {"l": 467.23999, "t": 553.17456, "r": 469.17316000000005, "b": 561.54918, "coord_origin": "TOPLEFT"}}, {"id": 204, "text": "Formula", "bbox": {"l": 471.29900999999995, "t": 553.21939, "r": 500.44574000000006, "b": 561.5581500000001, "coord_origin": "TOPLEFT"}}, {"id": 205, "text": ",", "bbox": {"l": 500.44601000000006, "t": 553.17456, "r": 502.37918, "b": 561.54918, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": "List-item", "bbox": {"l": 504.505, "t": 553.21939, "r": 535.74304, "b": 561.5581500000001, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": ",", "bbox": {"l": 535.74298, "t": 553.17456, "r": 537.67615, "b": 561.54918, "coord_origin": "TOPLEFT"}}, {"id": 208, "text": "Page-", "bbox": {"l": 539.802, "t": 553.21939, "r": 559.09839, "b": 561.5581500000001, "coord_origin": "TOPLEFT"}}, {"id": 209, "text": "footer", "bbox": {"l": 317.95499, "t": 564.17839, "r": 338.80725, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": ",", "bbox": {"l": 338.806, "t": 564.13356, "r": 340.81805, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "Page-header", "bbox": {"l": 343.61401, "t": 564.17839, "r": 387.96164, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 212, "text": ",", "bbox": {"l": 387.961, "t": 564.13356, "r": 389.97305, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "Picture", "bbox": {"l": 392.76901, "t": 564.17839, "r": 417.84662, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 214, "text": ",", "bbox": {"l": 417.84799, "t": 564.13356, "r": 419.86005, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 215, "text": "Section-header", "bbox": {"l": 422.655, "t": 564.17839, "r": 475.56305, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 216, "text": ",", "bbox": {"l": 475.56201, "t": 564.13356, "r": 477.57407, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 217, "text": "Table", "bbox": {"l": 480.36899, "t": 564.17839, "r": 499.82196, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 218, "text": ",", "bbox": {"l": 499.8219900000001, "t": 564.13356, "r": 501.83405, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 219, "text": "Text", "bbox": {"l": 504.6290000000001, "t": 564.17839, "r": 519.7926, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 220, "text": ", and", "bbox": {"l": 519.79602, "t": 564.13356, "r": 538.37103, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 221, "text": "Title", "bbox": {"l": 541.16302, "t": 564.17839, "r": 557.57043, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 222, "text": ".", "bbox": {"l": 557.57098, "t": 564.13356, "r": 559.58307, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 223, "text": "Critical factors that were considered for the choice of these class", "bbox": {"l": 317.95499, "t": 575.09256, "r": 558.20416, "b": 583.46718, "coord_origin": "TOPLEFT"}}, {"id": 224, "text": "labels were (1) the overall occurrence of the label, (2) the specificity", "bbox": {"l": 317.95499, "t": 586.05156, "r": 558.43091, "b": 594.4261799999999, "coord_origin": "TOPLEFT"}}, {"id": 225, "text": "of the label, (3) recognisability on a single page (i.e. no need for", "bbox": {"l": 317.95499, "t": 597.0105599999999, "r": 558.36871, "b": 605.38518, "coord_origin": "TOPLEFT"}}, {"id": 226, "text": "context from previous or next page) and (4) overall coverage of the", "bbox": {"l": 317.95499, "t": 607.96956, "r": 558.20105, "b": 616.3441799999999, "coord_origin": "TOPLEFT"}}, {"id": 227, "text": "page. Specificity ensures that the choice of label is not ambiguous,", "bbox": {"l": 317.95499, "t": 618.9285600000001, "r": 559.18665, "b": 627.30318, "coord_origin": "TOPLEFT"}}, {"id": 228, "text": "while coverage ensures that all meaningful items on a page can", "bbox": {"l": 317.62299, "t": 629.88756, "r": 558.20142, "b": 638.26218, "coord_origin": "TOPLEFT"}}, {"id": 229, "text": "be annotated. We refrained from class labels that are very specific", "bbox": {"l": 317.95499, "t": 640.84656, "r": 558.20227, "b": 649.22118, "coord_origin": "TOPLEFT"}}, {"id": 230, "text": "to a document category, such as", "bbox": {"l": 317.95499, "t": 651.80556, "r": 436.90649, "b": 660.1801800000001, "coord_origin": "TOPLEFT"}}, {"id": 231, "text": "Abstract", "bbox": {"l": 439.13800000000003, "t": 651.8503900000001, "r": 469.69134999999994, "b": 660.18915, "coord_origin": "TOPLEFT"}}, {"id": 232, "text": "in the", "bbox": {"l": 472.42898999999994, "t": 651.80556, "r": 493.97348, "b": 660.1801800000001, "coord_origin": "TOPLEFT"}}, {"id": 233, "text": "Scientific Articles", "bbox": {"l": 496.207, "t": 651.8503900000001, "r": 558.20001, "b": 660.18915, "coord_origin": "TOPLEFT"}}, {"id": 234, "text": "category. We also avoided class labels that are tightly linked to the", "bbox": {"l": 317.95499, "t": 662.76456, "r": 558.20557, "b": 671.13918, "coord_origin": "TOPLEFT"}}, {"id": 235, "text": "semantics of the text. Labels such as", "bbox": {"l": 317.95499, "t": 673.7225599999999, "r": 447.65221999999994, "b": 682.09718, "coord_origin": "TOPLEFT"}}, {"id": 236, "text": "Author", "bbox": {"l": 449.85999, "t": 673.76739, "r": 474.31439, "b": 682.10614, "coord_origin": "TOPLEFT"}}, {"id": 237, "text": "and", "bbox": {"l": 477.172, "t": 673.7225599999999, "r": 490.39655, "b": 682.09718, "coord_origin": "TOPLEFT"}}, {"id": 238, "text": "Affiliation", "bbox": {"l": 492.60599, "t": 673.76739, "r": 528.29907, "b": 682.10614, "coord_origin": "TOPLEFT"}}, {"id": 239, "text": ", as seen", "bbox": {"l": 528.29901, "t": 673.7225599999999, "r": 558.20148, "b": 682.09718, "coord_origin": "TOPLEFT"}}, {"id": 240, "text": "in DocBank, are often only distinguishable by discriminating on", "bbox": {"l": 317.95499, "t": 684.68156, "r": 558.2041, "b": 693.0561749999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Phase 2: Label selection and guideline. We reviewed the collected documents and identified the most common structural features they exhibit. This was achieved by identifying recurrent layout elements and lead us to the definition of 11 distinct class labels. These 11 class labels are Caption , Footnote , Formula , List-item , Pagefooter , Page-header , Picture , Section-header , Table , Text , and Title . Critical factors that were considered for the choice of these class labels were (1) the overall occurrence of the label, (2) the specificity of the label, (3) recognisability on a single page (i.e. no need for context from previous or next page) and (4) overall coverage of the page. Specificity ensures that the choice of label is not ambiguous, while coverage ensures that all meaningful items on a page can be annotated. We refrained from class labels that are very specific to a document category, such as Abstract in the Scientific Articles category. We also avoided class labels that are tightly linked to the semantics of the text. Labels such as Author and Affiliation , as seen in DocBank, are often only distinguishable by discriminating on"}, {"label": "footnote", "id": 7, "page_no": 3, "cluster": {"id": 7, "label": "footnote", "bbox": {"l": 317.95499, "t": 702.353363, "r": 369.2457, "b": 708.86689, "coord_origin": "TOPLEFT"}, "confidence": 0.9080352783203125, "cells": [{"id": 241, "text": "$^{3}$https://arxiv.org/", "bbox": {"l": 317.95499, "t": 702.353363, "r": 369.2457, "b": 708.86689, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "$^{3}$https://arxiv.org/"}, {"label": "picture", "id": 2, "page_no": 3, "cluster": {"id": 2, "label": "picture", "bbox": {"l": 53.05912780761719, "t": 310.7912902832031, "r": 295.8506164550781, "b": 540.864013671875, "coord_origin": "TOPLEFT"}, "confidence": 0.9847871661186218, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "body": [{"label": "caption", "id": 8, "page_no": 3, "cluster": {"id": 8, "label": "caption", "bbox": {"l": 53.501999, "t": 84.95495999999991, "r": 558.48969, "b": 115.34618999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.8906616568565369, "cells": [{"id": 2, "text": "Table 1: DocLayNet dataset overview. Along with the frequency of each class label, we present the relative occurrence (as %", "bbox": {"l": 53.501999, "t": 84.95495999999991, "r": 558.48969, "b": 93.42822000000001, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "of row \u201cTotal\u201d) in the train, test and validation sets. The inter-annotator agreement is computed as the mAP@0.5-0.95 metric", "bbox": {"l": 53.79800000000001, "t": 95.91394000000003, "r": 558.20294, "b": 104.3872100000001, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "between pairwise annotations from the triple-annotated pages, from which we obtain accuracy ranges.", "bbox": {"l": 53.79800000000001, "t": 106.87292000000002, "r": 469.84805000000006, "b": 115.34618999999998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 1: DocLayNet dataset overview. Along with the frequency of each class label, we present the relative occurrence (as % of row \u201cTotal\u201d) in the train, test and validation sets. The inter-annotator agreement is computed as the mAP@0.5-0.95 metric between pairwise annotations from the triple-annotated pages, from which we obtain accuracy ranges."}, {"label": "table", "id": 1, "page_no": 3, "cluster": {"id": 1, "label": "table", "bbox": {"l": 98.93103790283203, "t": 137.47547912597656, "r": 512.579833984375, "b": 294.08148193359375, "coord_origin": "TOPLEFT"}, "confidence": 0.9860090613365173, "cells": [{"id": 5, "text": "% of Total", "bbox": {"l": 233.94400000000002, "t": 140.22351000000003, "r": 270.04272, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "triple inter-annotator mAP @ 0.5-0.95 (%)", "bbox": {"l": 329.04999, "t": 140.22351000000003, "r": 483.3976400000001, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "class label", "bbox": {"l": 104.825, "t": 151.18255999999997, "r": 141.71277, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Count", "bbox": {"l": 175.94701, "t": 151.18255999999997, "r": 198.71269, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Train", "bbox": {"l": 213.795, "t": 151.18255999999997, "r": 233.69144, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Test", "bbox": {"l": 249.37367, "t": 151.18255999999997, "r": 264.5, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Val", "bbox": {"l": 283.53568, "t": 151.18255999999997, "r": 295.30856, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "All", "bbox": {"l": 314.01501, "t": 151.18255999999997, "r": 324.98093, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Fin", "bbox": {"l": 343.01236, "t": 151.18255999999997, "r": 354.65076, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Man", "bbox": {"l": 367.84033, "t": 151.18255999999997, "r": 384.32059, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Sci", "bbox": {"l": 407.54358, "t": 151.18255999999997, "r": 418.15979, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Law", "bbox": {"l": 432.29979999999995, "t": 151.18255999999997, "r": 447.82962, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "Pat", "bbox": {"l": 465.72656, "t": 151.18255999999997, "r": 477.50842, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Ten", "bbox": {"l": 493.52240000000006, "t": 151.18255999999997, "r": 507.17822, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Caption", "bbox": {"l": 104.825, "t": 162.53954999999996, "r": 134.01064, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "22524", "bbox": {"l": 177.866, "t": 162.53954999999996, "r": 198.71288, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "2.04", "bbox": {"l": 219.211, "t": 162.53954999999996, "r": 233.69174000000004, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "1.77", "bbox": {"l": 250.01956, "t": 162.53954999999996, "r": 264.50031, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "2.32", "bbox": {"l": 280.82812, "t": 162.53954999999996, "r": 295.30887, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "84-89", "bbox": {"l": 305.27301, "t": 162.53954999999996, "r": 324.98117, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "40-61", "bbox": {"l": 334.94284, "t": 162.53954999999996, "r": 354.651, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "86-92", "bbox": {"l": 364.61267, "t": 162.53954999999996, "r": 384.32083, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "94-99", "bbox": {"l": 398.45187, "t": 162.53954999999996, "r": 418.16003, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "95-99", "bbox": {"l": 428.1217, "t": 162.53954999999996, "r": 447.82986, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "69-78", "bbox": {"l": 457.80051, "t": 162.53954999999996, "r": 477.50867, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "n/a", "bbox": {"l": 495.32489, "t": 162.53954999999996, "r": 507.17846999999995, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Footnote", "bbox": {"l": 104.825, "t": 173.49854000000005, "r": 137.3282, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "6318", "bbox": {"l": 182.035, "t": 173.49854000000005, "r": 198.71251, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "0.60", "bbox": {"l": 219.211, "t": 173.49854000000005, "r": 233.69174000000004, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "0.31", "bbox": {"l": 250.01956, "t": 173.49854000000005, "r": 264.50031, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "0.58", "bbox": {"l": 280.82812, "t": 173.49854000000005, "r": 295.30887, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "83-91", "bbox": {"l": 305.27301, "t": 173.49854000000005, "r": 324.98117, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "n/a", "bbox": {"l": 342.79739, "t": 173.49854000000005, "r": 354.65097, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "100", "bbox": {"l": 371.81265, "t": 173.49854000000005, "r": 384.32077, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "62-88", "bbox": {"l": 398.45181, "t": 173.49854000000005, "r": 418.15997, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "85-94", "bbox": {"l": 428.12164, "t": 173.49854000000005, "r": 447.8298, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "n/a", "bbox": {"l": 465.655, "t": 173.49854000000005, "r": 477.50857999999994, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "82-97", "bbox": {"l": 487.47025, "t": 173.49854000000005, "r": 507.17841, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Formula", "bbox": {"l": 104.825, "t": 184.45752000000005, "r": 135.33766, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "25027", "bbox": {"l": 177.866, "t": 184.45752000000005, "r": 198.71288, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "2.25", "bbox": {"l": 219.211, "t": 184.45752000000005, "r": 233.69174000000004, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "1.90", "bbox": {"l": 250.01956, "t": 184.45752000000005, "r": 264.50031, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "2.96", "bbox": {"l": 280.82812, "t": 184.45752000000005, "r": 295.30887, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "83-85", "bbox": {"l": 305.27301, "t": 184.45752000000005, "r": 324.98117, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "n/a", "bbox": {"l": 342.79739, "t": 184.45752000000005, "r": 354.65097, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "n/a", "bbox": {"l": 372.46719, "t": 184.45752000000005, "r": 384.32077, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "84-87", "bbox": {"l": 398.45181, "t": 184.45752000000005, "r": 418.15997, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "86-96", "bbox": {"l": 428.12164, "t": 184.45752000000005, "r": 447.8298, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "n/a", "bbox": {"l": 465.655, "t": 184.45752000000005, "r": 477.50857999999994, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "n/a", "bbox": {"l": 495.3248, "t": 184.45752000000005, "r": 507.17838000000006, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "List-item", "bbox": {"l": 104.825, "t": 195.41656, "r": 137.70479, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "185660", "bbox": {"l": 173.69701, "t": 195.41656, "r": 198.71326, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "17.19", "bbox": {"l": 215.04201, "t": 195.41656, "r": 233.69212, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "13.34", "bbox": {"l": 245.85056, "t": 195.41656, "r": 264.50067, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "15.82", "bbox": {"l": 276.65912, "t": 195.41656, "r": 295.30923, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "87-88", "bbox": {"l": 305.27301, "t": 195.41656, "r": 324.98117, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "74-83", "bbox": {"l": 334.94284, "t": 195.41656, "r": 354.651, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "90-92", "bbox": {"l": 364.61267, "t": 195.41656, "r": 384.32083, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "97-97", "bbox": {"l": 398.45187, "t": 195.41656, "r": 418.16003, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "81-85", "bbox": {"l": 428.1217, "t": 195.41656, "r": 447.82986, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "75-88", "bbox": {"l": 457.80051, "t": 195.41656, "r": 477.50867, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "93-95", "bbox": {"l": 487.47034, "t": 195.41656, "r": 507.17849999999993, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "Page-footer", "bbox": {"l": 104.825, "t": 206.37554999999998, "r": 147.35262, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "70878", "bbox": {"l": 177.866, "t": 206.37554999999998, "r": 198.71288, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "6.51", "bbox": {"l": 219.211, "t": 206.37554999999998, "r": 233.69174000000004, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "5.58", "bbox": {"l": 250.01956, "t": 206.37554999999998, "r": 264.50031, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "6.00", "bbox": {"l": 280.82812, "t": 206.37554999999998, "r": 295.30887, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "93-94", "bbox": {"l": 305.27301, "t": 206.37554999999998, "r": 324.98117, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "88-90", "bbox": {"l": 334.94284, "t": 206.37554999999998, "r": 354.651, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "95-96", "bbox": {"l": 364.61267, "t": 206.37554999999998, "r": 384.32083, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "100", "bbox": {"l": 405.65189, "t": 206.37554999999998, "r": 418.16, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "92-97", "bbox": {"l": 428.12167, "t": 206.37554999999998, "r": 447.82983, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "100", "bbox": {"l": 465.00049, "t": 206.37554999999998, "r": 477.5086099999999, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "96-98", "bbox": {"l": 487.47028, "t": 206.37554999999998, "r": 507.17843999999997, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "Page-header", "bbox": {"l": 104.825, "t": 217.33452999999997, "r": 150.10532, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "58022", "bbox": {"l": 177.866, "t": 217.33452999999997, "r": 198.71288, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "5.10", "bbox": {"l": 219.211, "t": 217.33452999999997, "r": 233.69174000000004, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "6.70", "bbox": {"l": 250.01956, "t": 217.33452999999997, "r": 264.50031, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "5.06", "bbox": {"l": 280.82812, "t": 217.33452999999997, "r": 295.30887, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "85-89", "bbox": {"l": 305.27301, "t": 217.33452999999997, "r": 324.98117, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "66-76", "bbox": {"l": 334.94284, "t": 217.33452999999997, "r": 354.651, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "90-94", "bbox": {"l": 364.61267, "t": 217.33452999999997, "r": 384.32083, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "98-100", "bbox": {"l": 394.2825, "t": 217.33452999999997, "r": 418.16003, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "91-92", "bbox": {"l": 428.1217, "t": 217.33452999999997, "r": 447.82986, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "97-99", "bbox": {"l": 457.80051, "t": 217.33452999999997, "r": 477.50867, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "81-86", "bbox": {"l": 487.47034, "t": 217.33452999999997, "r": 507.17849999999993, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "Picture", "bbox": {"l": 104.825, "t": 228.29351999999994, "r": 130.80963, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "45976", "bbox": {"l": 177.866, "t": 228.29351999999994, "r": 198.71288, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "4.21", "bbox": {"l": 219.211, "t": 228.29351999999994, "r": 233.69174000000004, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "2.78", "bbox": {"l": 250.01956, "t": 228.29351999999994, "r": 264.50031, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "5.31", "bbox": {"l": 280.82812, "t": 228.29351999999994, "r": 295.30887, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "69-71", "bbox": {"l": 305.27301, "t": 228.29351999999994, "r": 324.98117, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "56-59", "bbox": {"l": 334.94284, "t": 228.29351999999994, "r": 354.651, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "82-86", "bbox": {"l": 364.61267, "t": 228.29351999999994, "r": 384.32083, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "69-82", "bbox": {"l": 398.45187, "t": 228.29351999999994, "r": 418.16003, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "80-95", "bbox": {"l": 428.1217, "t": 228.29351999999994, "r": 447.82986, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "66-71", "bbox": {"l": 457.80051, "t": 228.29351999999994, "r": 477.50867, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "59-76", "bbox": {"l": 487.47034, "t": 228.29351999999994, "r": 507.17849999999993, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "Section-header", "bbox": {"l": 104.825, "t": 239.25256000000002, "r": 159.56487, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "142884", "bbox": {"l": 173.69701, "t": 239.25256000000002, "r": 198.71326, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "12.60", "bbox": {"l": 215.04201, "t": 239.25256000000002, "r": 233.69212, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "15.77", "bbox": {"l": 245.85056, "t": 239.25256000000002, "r": 264.50067, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "12.85", "bbox": {"l": 276.65912, "t": 239.25256000000002, "r": 295.30923, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "83-84", "bbox": {"l": 305.27301, "t": 239.25256000000002, "r": 324.98117, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "76-81", "bbox": {"l": 334.94284, "t": 239.25256000000002, "r": 354.651, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "90-92", "bbox": {"l": 364.61267, "t": 239.25256000000002, "r": 384.32083, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "94-95", "bbox": {"l": 398.45187, "t": 239.25256000000002, "r": 418.16003, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "87-94", "bbox": {"l": 428.1217, "t": 239.25256000000002, "r": 447.82986, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "69-73", "bbox": {"l": 457.80051, "t": 239.25256000000002, "r": 477.50867, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "78-86", "bbox": {"l": 487.47034, "t": 239.25256000000002, "r": 507.17849999999993, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "Table", "bbox": {"l": 104.825, "t": 250.21155, "r": 124.63177, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "34733", "bbox": {"l": 177.866, "t": 250.21155, "r": 198.71288, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "3.20", "bbox": {"l": 219.211, "t": 250.21155, "r": 233.69174000000004, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "2.27", "bbox": {"l": 250.01956, "t": 250.21155, "r": 264.50031, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "3.60", "bbox": {"l": 280.82812, "t": 250.21155, "r": 295.30887, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "77-81", "bbox": {"l": 305.27301, "t": 250.21155, "r": 324.98117, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "75-80", "bbox": {"l": 334.94284, "t": 250.21155, "r": 354.651, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "83-86", "bbox": {"l": 364.61267, "t": 250.21155, "r": 384.32083, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "98-99", "bbox": {"l": 398.45187, "t": 250.21155, "r": 418.16003, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "58-80", "bbox": {"l": 428.1217, "t": 250.21155, "r": 447.82986, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "79-84", "bbox": {"l": 457.80051, "t": 250.21155, "r": 477.50867, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "70-85", "bbox": {"l": 487.47034, "t": 250.21155, "r": 507.17849999999993, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "Text", "bbox": {"l": 104.825, "t": 261.16956000000005, "r": 120.78519, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "510377", "bbox": {"l": 173.69701, "t": 261.16956000000005, "r": 198.71326, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "45.82", "bbox": {"l": 215.04201, "t": 261.16956000000005, "r": 233.69212, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "49.28", "bbox": {"l": 245.85056, "t": 261.16956000000005, "r": 264.50067, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "45.00", "bbox": {"l": 276.65912, "t": 261.16956000000005, "r": 295.30923, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "84-86", "bbox": {"l": 305.27301, "t": 261.16956000000005, "r": 324.98117, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "81-86", "bbox": {"l": 334.94284, "t": 261.16956000000005, "r": 354.651, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "88-93", "bbox": {"l": 364.61267, "t": 261.16956000000005, "r": 384.32083, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "89-93", "bbox": {"l": 398.45187, "t": 261.16956000000005, "r": 418.16003, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "87-92", "bbox": {"l": 428.1217, "t": 261.16956000000005, "r": 447.82986, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "71-79", "bbox": {"l": 457.80051, "t": 261.16956000000005, "r": 477.50867, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "87-95", "bbox": {"l": 487.47034, "t": 261.16956000000005, "r": 507.17849999999993, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "Title", "bbox": {"l": 104.825, "t": 272.12854000000004, "r": 121.81633, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "5071", "bbox": {"l": 182.035, "t": 272.12854000000004, "r": 198.71251, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "0.47", "bbox": {"l": 219.211, "t": 272.12854000000004, "r": 233.69174000000004, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "0.30", "bbox": {"l": 250.01956, "t": 272.12854000000004, "r": 264.50031, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "0.50", "bbox": {"l": 280.82812, "t": 272.12854000000004, "r": 295.30887, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "60-72", "bbox": {"l": 305.27301, "t": 272.12854000000004, "r": 324.98117, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "24-63", "bbox": {"l": 334.94284, "t": 272.12854000000004, "r": 354.651, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "50-63", "bbox": {"l": 364.61267, "t": 272.12854000000004, "r": 384.32083, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "94-100", "bbox": {"l": 394.2825, "t": 272.12854000000004, "r": 418.16003, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "82-96", "bbox": {"l": 428.1217, "t": 272.12854000000004, "r": 447.82986, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "68-79", "bbox": {"l": 457.80051, "t": 272.12854000000004, "r": 477.50867, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "24-56", "bbox": {"l": 487.47034, "t": 272.12854000000004, "r": 507.17849999999993, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "Total", "bbox": {"l": 104.825, "t": 283.48654, "r": 123.43028, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "1107470", "bbox": {"l": 169.52699, "t": 283.48654, "r": 198.71263, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "941123", "bbox": {"l": 208.675, "t": 283.48654, "r": 233.69124999999997, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "99816", "bbox": {"l": 243.65291999999997, "t": 283.48654, "r": 264.49982, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "66531", "bbox": {"l": 274.46149, "t": 283.48654, "r": 295.30838, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "82-83", "bbox": {"l": 305.27301, "t": 283.48654, "r": 324.98117, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "71-74", "bbox": {"l": 334.94284, "t": 283.48654, "r": 354.651, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "79-81", "bbox": {"l": 364.61267, "t": 283.48654, "r": 384.32083, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "89-94", "bbox": {"l": 398.45187, "t": 283.48654, "r": 418.16003, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "86-91", "bbox": {"l": 428.1217, "t": 283.48654, "r": 447.82986, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "71-76", "bbox": {"l": 457.80051, "t": 283.48654, "r": 477.50867, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "68-85", "bbox": {"l": 487.47034, "t": 283.48654, "r": 507.17849999999993, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": [{"id": 11, "label": "text", "bbox": {"l": 233.94400000000002, "t": 140.22351000000003, "r": 270.04272, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 5, "text": "% of Total", "bbox": {"l": 233.94400000000002, "t": 140.22351000000003, "r": 270.04272, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 329.04999, "t": 140.22351000000003, "r": 483.3976400000001, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": "triple inter-annotator mAP @ 0.5-0.95 (%)", "bbox": {"l": 329.04999, "t": 140.22351000000003, "r": 483.3976400000001, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 104.825, "t": 151.18255999999997, "r": 141.71277, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "class label", "bbox": {"l": 104.825, "t": 151.18255999999997, "r": 141.71277, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 175.94701, "t": 151.18255999999997, "r": 198.71269, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "Count", "bbox": {"l": 175.94701, "t": 151.18255999999997, "r": 198.71269, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 213.795, "t": 151.18255999999997, "r": 233.69144, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "Train", "bbox": {"l": 213.795, "t": 151.18255999999997, "r": 233.69144, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 249.37367, "t": 151.18255999999997, "r": 264.5, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "Test", "bbox": {"l": 249.37367, "t": 151.18255999999997, "r": 264.5, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 283.53568, "t": 151.18255999999997, "r": 295.30856, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "Val", "bbox": {"l": 283.53568, "t": 151.18255999999997, "r": 295.30856, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 314.01501, "t": 151.18255999999997, "r": 324.98093, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "All", "bbox": {"l": 314.01501, "t": 151.18255999999997, "r": 324.98093, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 343.01236, "t": 151.18255999999997, "r": 354.65076, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "Fin", "bbox": {"l": 343.01236, "t": 151.18255999999997, "r": 354.65076, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 367.84033, "t": 151.18255999999997, "r": 384.32059, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "Man", "bbox": {"l": 367.84033, "t": 151.18255999999997, "r": 384.32059, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 407.54358, "t": 151.18255999999997, "r": 418.15979, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "Sci", "bbox": {"l": 407.54358, "t": 151.18255999999997, "r": 418.15979, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 432.29979999999995, "t": 151.18255999999997, "r": 447.82962, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "Law", "bbox": {"l": 432.29979999999995, "t": 151.18255999999997, "r": 447.82962, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 465.72656, "t": 151.18255999999997, "r": 477.50842, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "Pat", "bbox": {"l": 465.72656, "t": 151.18255999999997, "r": 477.50842, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 493.52240000000006, "t": 151.18255999999997, "r": 507.17822, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "Ten", "bbox": {"l": 493.52240000000006, "t": 151.18255999999997, "r": 507.17822, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 104.825, "t": 162.53954999999996, "r": 134.01064, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "Caption", "bbox": {"l": 104.825, "t": 162.53954999999996, "r": 134.01064, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 177.866, "t": 162.53954999999996, "r": 198.71288, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "22524", "bbox": {"l": 177.866, "t": 162.53954999999996, "r": 198.71288, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 219.211, "t": 162.53954999999996, "r": 233.69174000000004, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "2.04", "bbox": {"l": 219.211, "t": 162.53954999999996, "r": 233.69174000000004, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 250.01956, "t": 162.53954999999996, "r": 264.50031, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "1.77", "bbox": {"l": 250.01956, "t": 162.53954999999996, "r": 264.50031, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 280.82812, "t": 162.53954999999996, "r": 295.30887, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "2.32", "bbox": {"l": 280.82812, "t": 162.53954999999996, "r": 295.30887, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 305.27301, "t": 162.53954999999996, "r": 324.98117, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "84-89", "bbox": {"l": 305.27301, "t": 162.53954999999996, "r": 324.98117, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 334.94284, "t": 162.53954999999996, "r": 354.651, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "40-61", "bbox": {"l": 334.94284, "t": 162.53954999999996, "r": 354.651, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 364.61267, "t": 162.53954999999996, "r": 384.32083, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "86-92", "bbox": {"l": 364.61267, "t": 162.53954999999996, "r": 384.32083, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 398.45187, "t": 162.53954999999996, "r": 418.16003, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "94-99", "bbox": {"l": 398.45187, "t": 162.53954999999996, "r": 418.16003, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 428.1217, "t": 162.53954999999996, "r": 447.82986, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "95-99", "bbox": {"l": 428.1217, "t": 162.53954999999996, "r": 447.82986, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 457.80051, "t": 162.53954999999996, "r": 477.50867, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "69-78", "bbox": {"l": 457.80051, "t": 162.53954999999996, "r": 477.50867, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 495.32489, "t": 162.53954999999996, "r": 507.17846999999995, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "n/a", "bbox": {"l": 495.32489, "t": 162.53954999999996, "r": 507.17846999999995, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 104.825, "t": 173.49854000000005, "r": 137.3282, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "Footnote", "bbox": {"l": 104.825, "t": 173.49854000000005, "r": 137.3282, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 182.035, "t": 173.49854000000005, "r": 198.71251, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "6318", "bbox": {"l": 182.035, "t": 173.49854000000005, "r": 198.71251, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 219.211, "t": 173.49854000000005, "r": 233.69174000000004, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "0.60", "bbox": {"l": 219.211, "t": 173.49854000000005, "r": 233.69174000000004, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 250.01956, "t": 173.49854000000005, "r": 264.50031, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "0.31", "bbox": {"l": 250.01956, "t": 173.49854000000005, "r": 264.50031, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 280.82812, "t": 173.49854000000005, "r": 295.30887, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "0.58", "bbox": {"l": 280.82812, "t": 173.49854000000005, "r": 295.30887, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 305.27301, "t": 173.49854000000005, "r": 324.98117, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "83-91", "bbox": {"l": 305.27301, "t": 173.49854000000005, "r": 324.98117, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 342.79739, "t": 173.49854000000005, "r": 354.65097, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "n/a", "bbox": {"l": 342.79739, "t": 173.49854000000005, "r": 354.65097, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 371.81265, "t": 173.49854000000005, "r": 384.32077, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "100", "bbox": {"l": 371.81265, "t": 173.49854000000005, "r": 384.32077, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 398.45181, "t": 173.49854000000005, "r": 418.15997, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "62-88", "bbox": {"l": 398.45181, "t": 173.49854000000005, "r": 418.15997, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 428.12164, "t": 173.49854000000005, "r": 447.8298, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "85-94", "bbox": {"l": 428.12164, "t": 173.49854000000005, "r": 447.8298, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 465.655, "t": 173.49854000000005, "r": 477.50857999999994, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "n/a", "bbox": {"l": 465.655, "t": 173.49854000000005, "r": 477.50857999999994, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 487.47025, "t": 173.49854000000005, "r": 507.17841, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "82-97", "bbox": {"l": 487.47025, "t": 173.49854000000005, "r": 507.17841, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 104.825, "t": 184.45752000000005, "r": 135.33766, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "Formula", "bbox": {"l": 104.825, "t": 184.45752000000005, "r": 135.33766, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 177.866, "t": 184.45752000000005, "r": 198.71288, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "25027", "bbox": {"l": 177.866, "t": 184.45752000000005, "r": 198.71288, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 219.211, "t": 184.45752000000005, "r": 233.69174000000004, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "2.25", "bbox": {"l": 219.211, "t": 184.45752000000005, "r": 233.69174000000004, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 250.01956, "t": 184.45752000000005, "r": 264.50031, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "1.90", "bbox": {"l": 250.01956, "t": 184.45752000000005, "r": 264.50031, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 280.82812, "t": 184.45752000000005, "r": 295.30887, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "2.96", "bbox": {"l": 280.82812, "t": 184.45752000000005, "r": 295.30887, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 305.27301, "t": 184.45752000000005, "r": 324.98117, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "83-85", "bbox": {"l": 305.27301, "t": 184.45752000000005, "r": 324.98117, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 342.79739, "t": 184.45752000000005, "r": 354.65097, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "n/a", "bbox": {"l": 342.79739, "t": 184.45752000000005, "r": 354.65097, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 372.46719, "t": 184.45752000000005, "r": 384.32077, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "n/a", "bbox": {"l": 372.46719, "t": 184.45752000000005, "r": 384.32077, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 398.45181, "t": 184.45752000000005, "r": 418.15997, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "84-87", "bbox": {"l": 398.45181, "t": 184.45752000000005, "r": 418.15997, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 428.12164, "t": 184.45752000000005, "r": 447.8298, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "86-96", "bbox": {"l": 428.12164, "t": 184.45752000000005, "r": 447.8298, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 465.655, "t": 184.45752000000005, "r": 477.50857999999994, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "n/a", "bbox": {"l": 465.655, "t": 184.45752000000005, "r": 477.50857999999994, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 495.3248, "t": 184.45752000000005, "r": 507.17838000000006, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "n/a", "bbox": {"l": 495.3248, "t": 184.45752000000005, "r": 507.17838000000006, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 104.825, "t": 195.41656, "r": 137.70479, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "List-item", "bbox": {"l": 104.825, "t": 195.41656, "r": 137.70479, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 173.69701, "t": 195.41656, "r": 198.71326, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "185660", "bbox": {"l": 173.69701, "t": 195.41656, "r": 198.71326, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 215.04201, "t": 195.41656, "r": 233.69212, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "17.19", "bbox": {"l": 215.04201, "t": 195.41656, "r": 233.69212, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 245.85056, "t": 195.41656, "r": 264.50067, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "13.34", "bbox": {"l": 245.85056, "t": 195.41656, "r": 264.50067, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 276.65912, "t": 195.41656, "r": 295.30923, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "15.82", "bbox": {"l": 276.65912, "t": 195.41656, "r": 295.30923, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 305.27301, "t": 195.41656, "r": 324.98117, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "87-88", "bbox": {"l": 305.27301, "t": 195.41656, "r": 324.98117, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 334.94284, "t": 195.41656, "r": 354.651, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "74-83", "bbox": {"l": 334.94284, "t": 195.41656, "r": 354.651, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 364.61267, "t": 195.41656, "r": 384.32083, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "90-92", "bbox": {"l": 364.61267, "t": 195.41656, "r": 384.32083, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 398.45187, "t": 195.41656, "r": 418.16003, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "97-97", "bbox": {"l": 398.45187, "t": 195.41656, "r": 418.16003, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 428.1217, "t": 195.41656, "r": 447.82986, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "81-85", "bbox": {"l": 428.1217, "t": 195.41656, "r": 447.82986, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 457.80051, "t": 195.41656, "r": 477.50867, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "75-88", "bbox": {"l": 457.80051, "t": 195.41656, "r": 477.50867, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 487.47034, "t": 195.41656, "r": 507.17849999999993, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "93-95", "bbox": {"l": 487.47034, "t": 195.41656, "r": 507.17849999999993, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 104.825, "t": 206.37554999999998, "r": 147.35262, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "Page-footer", "bbox": {"l": 104.825, "t": 206.37554999999998, "r": 147.35262, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 177.866, "t": 206.37554999999998, "r": 198.71288, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "70878", "bbox": {"l": 177.866, "t": 206.37554999999998, "r": 198.71288, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 219.211, "t": 206.37554999999998, "r": 233.69174000000004, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "6.51", "bbox": {"l": 219.211, "t": 206.37554999999998, "r": 233.69174000000004, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 250.01956, "t": 206.37554999999998, "r": 264.50031, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "5.58", "bbox": {"l": 250.01956, "t": 206.37554999999998, "r": 264.50031, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 280.82812, "t": 206.37554999999998, "r": 295.30887, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "6.00", "bbox": {"l": 280.82812, "t": 206.37554999999998, "r": 295.30887, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 305.27301, "t": 206.37554999999998, "r": 324.98117, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "93-94", "bbox": {"l": 305.27301, "t": 206.37554999999998, "r": 324.98117, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 334.94284, "t": 206.37554999999998, "r": 354.651, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "88-90", "bbox": {"l": 334.94284, "t": 206.37554999999998, "r": 354.651, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 364.61267, "t": 206.37554999999998, "r": 384.32083, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "95-96", "bbox": {"l": 364.61267, "t": 206.37554999999998, "r": 384.32083, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 405.65189, "t": 206.37554999999998, "r": 418.16, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "100", "bbox": {"l": 405.65189, "t": 206.37554999999998, "r": 418.16, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 428.12167, "t": 206.37554999999998, "r": 447.82983, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "92-97", "bbox": {"l": 428.12167, "t": 206.37554999999998, "r": 447.82983, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 465.00049, "t": 206.37554999999998, "r": 477.5086099999999, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "100", "bbox": {"l": 465.00049, "t": 206.37554999999998, "r": 477.5086099999999, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 487.47028, "t": 206.37554999999998, "r": 507.17843999999997, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "96-98", "bbox": {"l": 487.47028, "t": 206.37554999999998, "r": 507.17843999999997, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 104.825, "t": 217.33452999999997, "r": 150.10532, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "Page-header", "bbox": {"l": 104.825, "t": 217.33452999999997, "r": 150.10532, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 177.866, "t": 217.33452999999997, "r": 198.71288, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "58022", "bbox": {"l": 177.866, "t": 217.33452999999997, "r": 198.71288, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 219.211, "t": 217.33452999999997, "r": 233.69174000000004, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "5.10", "bbox": {"l": 219.211, "t": 217.33452999999997, "r": 233.69174000000004, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 250.01956, "t": 217.33452999999997, "r": 264.50031, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "6.70", "bbox": {"l": 250.01956, "t": 217.33452999999997, "r": 264.50031, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 280.82812, "t": 217.33452999999997, "r": 295.30887, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "5.06", "bbox": {"l": 280.82812, "t": 217.33452999999997, "r": 295.30887, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 305.27301, "t": 217.33452999999997, "r": 324.98117, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "85-89", "bbox": {"l": 305.27301, "t": 217.33452999999997, "r": 324.98117, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 334.94284, "t": 217.33452999999997, "r": 354.651, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "66-76", "bbox": {"l": 334.94284, "t": 217.33452999999997, "r": 354.651, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 364.61267, "t": 217.33452999999997, "r": 384.32083, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "90-94", "bbox": {"l": 364.61267, "t": 217.33452999999997, "r": 384.32083, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 394.2825, "t": 217.33452999999997, "r": 418.16003, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "98-100", "bbox": {"l": 394.2825, "t": 217.33452999999997, "r": 418.16003, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 428.1217, "t": 217.33452999999997, "r": 447.82986, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "91-92", "bbox": {"l": 428.1217, "t": 217.33452999999997, "r": 447.82986, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 457.80051, "t": 217.33452999999997, "r": 477.50867, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "97-99", "bbox": {"l": 457.80051, "t": 217.33452999999997, "r": 477.50867, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 487.47034, "t": 217.33452999999997, "r": 507.17849999999993, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "81-86", "bbox": {"l": 487.47034, "t": 217.33452999999997, "r": 507.17849999999993, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 104.825, "t": 228.29351999999994, "r": 130.80963, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "Picture", "bbox": {"l": 104.825, "t": 228.29351999999994, "r": 130.80963, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 177.866, "t": 228.29351999999994, "r": 198.71288, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "45976", "bbox": {"l": 177.866, "t": 228.29351999999994, "r": 198.71288, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 219.211, "t": 228.29351999999994, "r": 233.69174000000004, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "4.21", "bbox": {"l": 219.211, "t": 228.29351999999994, "r": 233.69174000000004, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 250.01956, "t": 228.29351999999994, "r": 264.50031, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "2.78", "bbox": {"l": 250.01956, "t": 228.29351999999994, "r": 264.50031, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 280.82812, "t": 228.29351999999994, "r": 295.30887, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "5.31", "bbox": {"l": 280.82812, "t": 228.29351999999994, "r": 295.30887, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 305.27301, "t": 228.29351999999994, "r": 324.98117, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "69-71", "bbox": {"l": 305.27301, "t": 228.29351999999994, "r": 324.98117, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 334.94284, "t": 228.29351999999994, "r": 354.651, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "56-59", "bbox": {"l": 334.94284, "t": 228.29351999999994, "r": 354.651, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 364.61267, "t": 228.29351999999994, "r": 384.32083, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "82-86", "bbox": {"l": 364.61267, "t": 228.29351999999994, "r": 384.32083, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 398.45187, "t": 228.29351999999994, "r": 418.16003, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "69-82", "bbox": {"l": 398.45187, "t": 228.29351999999994, "r": 418.16003, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 428.1217, "t": 228.29351999999994, "r": 447.82986, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "80-95", "bbox": {"l": 428.1217, "t": 228.29351999999994, "r": 447.82986, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 457.80051, "t": 228.29351999999994, "r": 477.50867, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "66-71", "bbox": {"l": 457.80051, "t": 228.29351999999994, "r": 477.50867, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 487.47034, "t": 228.29351999999994, "r": 507.17849999999993, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "59-76", "bbox": {"l": 487.47034, "t": 228.29351999999994, "r": 507.17849999999993, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 104.825, "t": 239.25256000000002, "r": 159.56487, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": "Section-header", "bbox": {"l": 104.825, "t": 239.25256000000002, "r": 159.56487, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 173.69701, "t": 239.25256000000002, "r": 198.71326, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "142884", "bbox": {"l": 173.69701, "t": 239.25256000000002, "r": 198.71326, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 215.04201, "t": 239.25256000000002, "r": 233.69212, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "12.60", "bbox": {"l": 215.04201, "t": 239.25256000000002, "r": 233.69212, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 245.85056, "t": 239.25256000000002, "r": 264.50067, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": "15.77", "bbox": {"l": 245.85056, "t": 239.25256000000002, "r": 264.50067, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 276.65912, "t": 239.25256000000002, "r": 295.30923, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 107, "text": "12.85", "bbox": {"l": 276.65912, "t": 239.25256000000002, "r": 295.30923, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 114, "label": "text", "bbox": {"l": 305.27301, "t": 239.25256000000002, "r": 324.98117, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 108, "text": "83-84", "bbox": {"l": 305.27301, "t": 239.25256000000002, "r": 324.98117, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 115, "label": "text", "bbox": {"l": 334.94284, "t": 239.25256000000002, "r": 354.651, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 109, "text": "76-81", "bbox": {"l": 334.94284, "t": 239.25256000000002, "r": 354.651, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 116, "label": "text", "bbox": {"l": 364.61267, "t": 239.25256000000002, "r": 384.32083, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 110, "text": "90-92", "bbox": {"l": 364.61267, "t": 239.25256000000002, "r": 384.32083, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 117, "label": "text", "bbox": {"l": 398.45187, "t": 239.25256000000002, "r": 418.16003, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 111, "text": "94-95", "bbox": {"l": 398.45187, "t": 239.25256000000002, "r": 418.16003, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 118, "label": "text", "bbox": {"l": 428.1217, "t": 239.25256000000002, "r": 447.82986, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 112, "text": "87-94", "bbox": {"l": 428.1217, "t": 239.25256000000002, "r": 447.82986, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 119, "label": "text", "bbox": {"l": 457.80051, "t": 239.25256000000002, "r": 477.50867, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 113, "text": "69-73", "bbox": {"l": 457.80051, "t": 239.25256000000002, "r": 477.50867, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 120, "label": "text", "bbox": {"l": 487.47034, "t": 239.25256000000002, "r": 507.17849999999993, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 114, "text": "78-86", "bbox": {"l": 487.47034, "t": 239.25256000000002, "r": 507.17849999999993, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 121, "label": "text", "bbox": {"l": 104.825, "t": 250.21155, "r": 124.63177, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 115, "text": "Table", "bbox": {"l": 104.825, "t": 250.21155, "r": 124.63177, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 122, "label": "text", "bbox": {"l": 177.866, "t": 250.21155, "r": 198.71288, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 116, "text": "34733", "bbox": {"l": 177.866, "t": 250.21155, "r": 198.71288, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 123, "label": "text", "bbox": {"l": 219.211, "t": 250.21155, "r": 233.69174000000004, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 117, "text": "3.20", "bbox": {"l": 219.211, "t": 250.21155, "r": 233.69174000000004, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 124, "label": "text", "bbox": {"l": 250.01956, "t": 250.21155, "r": 264.50031, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 118, "text": "2.27", "bbox": {"l": 250.01956, "t": 250.21155, "r": 264.50031, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 125, "label": "text", "bbox": {"l": 280.82812, "t": 250.21155, "r": 295.30887, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 119, "text": "3.60", "bbox": {"l": 280.82812, "t": 250.21155, "r": 295.30887, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 126, "label": "text", "bbox": {"l": 305.27301, "t": 250.21155, "r": 324.98117, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 120, "text": "77-81", "bbox": {"l": 305.27301, "t": 250.21155, "r": 324.98117, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 127, "label": "text", "bbox": {"l": 334.94284, "t": 250.21155, "r": 354.651, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 121, "text": "75-80", "bbox": {"l": 334.94284, "t": 250.21155, "r": 354.651, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 128, "label": "text", "bbox": {"l": 364.61267, "t": 250.21155, "r": 384.32083, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 122, "text": "83-86", "bbox": {"l": 364.61267, "t": 250.21155, "r": 384.32083, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 129, "label": "text", "bbox": {"l": 398.45187, "t": 250.21155, "r": 418.16003, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 123, "text": "98-99", "bbox": {"l": 398.45187, "t": 250.21155, "r": 418.16003, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 130, "label": "text", "bbox": {"l": 428.1217, "t": 250.21155, "r": 447.82986, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 124, "text": "58-80", "bbox": {"l": 428.1217, "t": 250.21155, "r": 447.82986, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 131, "label": "text", "bbox": {"l": 457.80051, "t": 250.21155, "r": 477.50867, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 125, "text": "79-84", "bbox": {"l": 457.80051, "t": 250.21155, "r": 477.50867, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 132, "label": "text", "bbox": {"l": 487.47034, "t": 250.21155, "r": 507.17849999999993, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 126, "text": "70-85", "bbox": {"l": 487.47034, "t": 250.21155, "r": 507.17849999999993, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 133, "label": "text", "bbox": {"l": 104.825, "t": 261.16956000000005, "r": 120.78519, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 127, "text": "Text", "bbox": {"l": 104.825, "t": 261.16956000000005, "r": 120.78519, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 134, "label": "text", "bbox": {"l": 173.69701, "t": 261.16956000000005, "r": 198.71326, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 128, "text": "510377", "bbox": {"l": 173.69701, "t": 261.16956000000005, "r": 198.71326, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 135, "label": "text", "bbox": {"l": 215.04201, "t": 261.16956000000005, "r": 233.69212, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 129, "text": "45.82", "bbox": {"l": 215.04201, "t": 261.16956000000005, "r": 233.69212, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 136, "label": "text", "bbox": {"l": 245.85056, "t": 261.16956000000005, "r": 264.50067, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 130, "text": "49.28", "bbox": {"l": 245.85056, "t": 261.16956000000005, "r": 264.50067, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 137, "label": "text", "bbox": {"l": 276.65912, "t": 261.16956000000005, "r": 295.30923, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 131, "text": "45.00", "bbox": {"l": 276.65912, "t": 261.16956000000005, "r": 295.30923, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 138, "label": "text", "bbox": {"l": 305.27301, "t": 261.16956000000005, "r": 324.98117, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 132, "text": "84-86", "bbox": {"l": 305.27301, "t": 261.16956000000005, "r": 324.98117, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 139, "label": "text", "bbox": {"l": 334.94284, "t": 261.16956000000005, "r": 354.651, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 133, "text": "81-86", "bbox": {"l": 334.94284, "t": 261.16956000000005, "r": 354.651, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 140, "label": "text", "bbox": {"l": 364.61267, "t": 261.16956000000005, "r": 384.32083, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 134, "text": "88-93", "bbox": {"l": 364.61267, "t": 261.16956000000005, "r": 384.32083, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 141, "label": "text", "bbox": {"l": 398.45187, "t": 261.16956000000005, "r": 418.16003, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 135, "text": "89-93", "bbox": {"l": 398.45187, "t": 261.16956000000005, "r": 418.16003, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 142, "label": "text", "bbox": {"l": 428.1217, "t": 261.16956000000005, "r": 447.82986, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 136, "text": "87-92", "bbox": {"l": 428.1217, "t": 261.16956000000005, "r": 447.82986, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 143, "label": "text", "bbox": {"l": 457.80051, "t": 261.16956000000005, "r": 477.50867, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 137, "text": "71-79", "bbox": {"l": 457.80051, "t": 261.16956000000005, "r": 477.50867, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 144, "label": "text", "bbox": {"l": 487.47034, "t": 261.16956000000005, "r": 507.17849999999993, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 138, "text": "87-95", "bbox": {"l": 487.47034, "t": 261.16956000000005, "r": 507.17849999999993, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 145, "label": "text", "bbox": {"l": 104.825, "t": 272.12854000000004, "r": 121.81633, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 139, "text": "Title", "bbox": {"l": 104.825, "t": 272.12854000000004, "r": 121.81633, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 146, "label": "text", "bbox": {"l": 182.035, "t": 272.12854000000004, "r": 198.71251, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 140, "text": "5071", "bbox": {"l": 182.035, "t": 272.12854000000004, "r": 198.71251, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 147, "label": "text", "bbox": {"l": 219.211, "t": 272.12854000000004, "r": 233.69174000000004, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 141, "text": "0.47", "bbox": {"l": 219.211, "t": 272.12854000000004, "r": 233.69174000000004, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 148, "label": "text", "bbox": {"l": 250.01956, "t": 272.12854000000004, "r": 264.50031, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 142, "text": "0.30", "bbox": {"l": 250.01956, "t": 272.12854000000004, "r": 264.50031, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 149, "label": "text", "bbox": {"l": 280.82812, "t": 272.12854000000004, "r": 295.30887, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 143, "text": "0.50", "bbox": {"l": 280.82812, "t": 272.12854000000004, "r": 295.30887, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 150, "label": "text", "bbox": {"l": 305.27301, "t": 272.12854000000004, "r": 324.98117, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 144, "text": "60-72", "bbox": {"l": 305.27301, "t": 272.12854000000004, "r": 324.98117, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 151, "label": "text", "bbox": {"l": 334.94284, "t": 272.12854000000004, "r": 354.651, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 145, "text": "24-63", "bbox": {"l": 334.94284, "t": 272.12854000000004, "r": 354.651, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 152, "label": "text", "bbox": {"l": 364.61267, "t": 272.12854000000004, "r": 384.32083, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 146, "text": "50-63", "bbox": {"l": 364.61267, "t": 272.12854000000004, "r": 384.32083, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 153, "label": "text", "bbox": {"l": 394.2825, "t": 272.12854000000004, "r": 418.16003, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 147, "text": "94-100", "bbox": {"l": 394.2825, "t": 272.12854000000004, "r": 418.16003, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 154, "label": "text", "bbox": {"l": 428.1217, "t": 272.12854000000004, "r": 447.82986, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 148, "text": "82-96", "bbox": {"l": 428.1217, "t": 272.12854000000004, "r": 447.82986, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 155, "label": "text", "bbox": {"l": 457.80051, "t": 272.12854000000004, "r": 477.50867, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 149, "text": "68-79", "bbox": {"l": 457.80051, "t": 272.12854000000004, "r": 477.50867, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 156, "label": "text", "bbox": {"l": 487.47034, "t": 272.12854000000004, "r": 507.17849999999993, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 150, "text": "24-56", "bbox": {"l": 487.47034, "t": 272.12854000000004, "r": 507.17849999999993, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 157, "label": "text", "bbox": {"l": 104.825, "t": 283.48654, "r": 123.43028, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 151, "text": "Total", "bbox": {"l": 104.825, "t": 283.48654, "r": 123.43028, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 158, "label": "text", "bbox": {"l": 169.52699, "t": 283.48654, "r": 198.71263, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 152, "text": "1107470", "bbox": {"l": 169.52699, "t": 283.48654, "r": 198.71263, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 159, "label": "text", "bbox": {"l": 208.675, "t": 283.48654, "r": 233.69124999999997, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 153, "text": "941123", "bbox": {"l": 208.675, "t": 283.48654, "r": 233.69124999999997, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 160, "label": "text", "bbox": {"l": 243.65291999999997, "t": 283.48654, "r": 264.49982, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 154, "text": "99816", "bbox": {"l": 243.65291999999997, "t": 283.48654, "r": 264.49982, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 161, "label": "text", "bbox": {"l": 274.46149, "t": 283.48654, "r": 295.30838, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 155, "text": "66531", "bbox": {"l": 274.46149, "t": 283.48654, "r": 295.30838, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 162, "label": "text", "bbox": {"l": 305.27301, "t": 283.48654, "r": 324.98117, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 156, "text": "82-83", "bbox": {"l": 305.27301, "t": 283.48654, "r": 324.98117, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 163, "label": "text", "bbox": {"l": 334.94284, "t": 283.48654, "r": 354.651, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 157, "text": "71-74", "bbox": {"l": 334.94284, "t": 283.48654, "r": 354.651, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 164, "label": "text", "bbox": {"l": 364.61267, "t": 283.48654, "r": 384.32083, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 158, "text": "79-81", "bbox": {"l": 364.61267, "t": 283.48654, "r": 384.32083, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 165, "label": "text", "bbox": {"l": 398.45187, "t": 283.48654, "r": 418.16003, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 159, "text": "89-94", "bbox": {"l": 398.45187, "t": 283.48654, "r": 418.16003, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 166, "label": "text", "bbox": {"l": 428.1217, "t": 283.48654, "r": 447.82986, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 160, "text": "86-91", "bbox": {"l": 428.1217, "t": 283.48654, "r": 447.82986, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 167, "label": "text", "bbox": {"l": 457.80051, "t": 283.48654, "r": 477.50867, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 161, "text": "71-76", "bbox": {"l": 457.80051, "t": 283.48654, "r": 477.50867, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 168, "label": "text", "bbox": {"l": 487.47034, "t": 283.48654, "r": 507.17849999999993, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 162, "text": "68-85", "bbox": {"l": 487.47034, "t": 283.48654, "r": 507.17849999999993, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "lcel", "lcel", "lcel", "ched", "lcel", "lcel", "lcel", "lcel", "lcel", "nl", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 14, "num_cols": 12, "table_cells": [{"bbox": {"l": 233.94400000000002, "t": 140.22351000000003, "r": 270.04272, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 4, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 6, "text": "% of Total", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 329.04999, "t": 140.22351000000003, "r": 483.3976400000001, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 6, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 6, "end_col_offset_idx": 12, "text": "triple inter-annotator mAP @ 0.5-0.95 (%)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 151.18255999999997, "r": 141.71277, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "class label", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 175.94701, "t": 151.18255999999997, "r": 198.71269, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Count", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 213.795, "t": 151.18255999999997, "r": 233.69144, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Train", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 249.37367, "t": 151.18255999999997, "r": 264.5, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Test", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 283.53568, "t": 151.18255999999997, "r": 295.30856, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Val", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 314.01501, "t": 151.18255999999997, "r": 324.98093, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "All", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 343.01236, "t": 151.18255999999997, "r": 354.65076, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "Fin", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 367.84033, "t": 151.18255999999997, "r": 384.32059, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "Man", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 407.54358, "t": 151.18255999999997, "r": 418.15979, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "Sci", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 432.29979999999995, "t": 151.18255999999997, "r": 447.82962, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "Law", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 465.72656, "t": 151.18255999999997, "r": 477.50842, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "Pat", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 493.52240000000006, "t": 151.18255999999997, "r": 507.17822, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "Ten", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 162.53954999999996, "r": 134.01064, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Caption", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 177.866, "t": 162.53954999999996, "r": 198.71288, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "22524", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 162.53954999999996, "r": 233.69174000000004, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "2.04", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 162.53954999999996, "r": 264.50031, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "1.77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 162.53954999999996, "r": 295.30887, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "2.32", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 162.53954999999996, "r": 324.98117, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "84-89", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 162.53954999999996, "r": 354.651, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "40-61", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 162.53954999999996, "r": 384.32083, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "86-92", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45187, "t": 162.53954999999996, "r": 418.16003, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "94-99", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 162.53954999999996, "r": 447.82986, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "95-99", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 162.53954999999996, "r": 477.50867, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "69-78", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 495.32489, "t": 162.53954999999996, "r": 507.17846999999995, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 173.49854000000005, "r": 137.3282, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Footnote", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 182.035, "t": 173.49854000000005, "r": 198.71251, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "6318", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 173.49854000000005, "r": 233.69174000000004, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.60", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 173.49854000000005, "r": 264.50031, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.31", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 173.49854000000005, "r": 295.30887, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.58", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 173.49854000000005, "r": 324.98117, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "83-91", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 342.79739, "t": 173.49854000000005, "r": 354.65097, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 371.81265, "t": 173.49854000000005, "r": 384.32077, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "100", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45181, "t": 173.49854000000005, "r": 418.15997, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "62-88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.12164, "t": 173.49854000000005, "r": 447.8298, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "85-94", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 465.655, "t": 173.49854000000005, "r": 477.50857999999994, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47025, "t": 173.49854000000005, "r": 507.17841, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "82-97", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 184.45752000000005, "r": 135.33766, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Formula", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 177.866, "t": 184.45752000000005, "r": 198.71288, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "25027", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 184.45752000000005, "r": 233.69174000000004, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "2.25", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 184.45752000000005, "r": 264.50031, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "1.90", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 184.45752000000005, "r": 295.30887, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "2.96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 184.45752000000005, "r": 324.98117, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "83-85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 342.79739, "t": 184.45752000000005, "r": 354.65097, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 372.46719, "t": 184.45752000000005, "r": 384.32077, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45181, "t": 184.45752000000005, "r": 418.15997, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "84-87", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.12164, "t": 184.45752000000005, "r": 447.8298, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "86-96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 465.655, "t": 184.45752000000005, "r": 477.50857999999994, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 495.3248, "t": 184.45752000000005, "r": 507.17838000000006, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 195.41656, "r": 137.70479, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "List-item", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 173.69701, "t": 195.41656, "r": 198.71326, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "185660", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 215.04201, "t": 195.41656, "r": 233.69212, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "17.19", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.85056, "t": 195.41656, "r": 264.50067, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "13.34", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 276.65912, "t": 195.41656, "r": 295.30923, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "15.82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 195.41656, "r": 324.98117, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "87-88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 195.41656, "r": 354.651, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "74-83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 195.41656, "r": 384.32083, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "90-92", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45187, "t": 195.41656, "r": 418.16003, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "97-97", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 195.41656, "r": 447.82986, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "81-85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 195.41656, "r": 477.50867, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "75-88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 195.41656, "r": 507.17849999999993, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "93-95", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 206.37554999999998, "r": 147.35262, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-footer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 177.866, "t": 206.37554999999998, "r": 198.71288, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "70878", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 206.37554999999998, "r": 233.69174000000004, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "6.51", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 206.37554999999998, "r": 264.50031, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "5.58", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 206.37554999999998, "r": 295.30887, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "6.00", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 206.37554999999998, "r": 324.98117, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "93-94", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 206.37554999999998, "r": 354.651, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "88-90", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 206.37554999999998, "r": 384.32083, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "95-96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 405.65189, "t": 206.37554999999998, "r": 418.16, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "100", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.12167, "t": 206.37554999999998, "r": 447.82983, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "92-97", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 465.00049, "t": 206.37554999999998, "r": 477.5086099999999, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "100", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47028, "t": 206.37554999999998, "r": 507.17843999999997, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "96-98", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 217.33452999999997, "r": 150.10532, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 177.866, "t": 217.33452999999997, "r": 198.71288, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "58022", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 217.33452999999997, "r": 233.69174000000004, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "5.10", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 217.33452999999997, "r": 264.50031, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "6.70", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 217.33452999999997, "r": 295.30887, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "5.06", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 217.33452999999997, "r": 324.98117, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "85-89", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 217.33452999999997, "r": 354.651, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "66-76", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 217.33452999999997, "r": 384.32083, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "90-94", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.2825, "t": 217.33452999999997, "r": 418.16003, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "98-100", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 217.33452999999997, "r": 447.82986, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "91-92", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 217.33452999999997, "r": 477.50867, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "97-99", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 217.33452999999997, "r": 507.17849999999993, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "81-86", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 228.29351999999994, "r": 130.80963, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Picture", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 177.866, "t": 228.29351999999994, "r": 198.71288, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "45976", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 228.29351999999994, "r": 233.69174000000004, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "4.21", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 228.29351999999994, "r": 264.50031, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "2.78", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 228.29351999999994, "r": 295.30887, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "5.31", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 228.29351999999994, "r": 324.98117, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "69-71", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 228.29351999999994, "r": 354.651, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "56-59", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 228.29351999999994, "r": 384.32083, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "82-86", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45187, "t": 228.29351999999994, "r": 418.16003, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "69-82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 228.29351999999994, "r": 447.82986, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "80-95", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 228.29351999999994, "r": 477.50867, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "66-71", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 228.29351999999994, "r": 507.17849999999993, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "59-76", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 239.25256000000002, "r": 159.56487, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Section-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 173.69701, "t": 239.25256000000002, "r": 198.71326, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "142884", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 215.04201, "t": 239.25256000000002, "r": 233.69212, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "12.60", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.85056, "t": 239.25256000000002, "r": 264.50067, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "15.77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 276.65912, "t": 239.25256000000002, "r": 295.30923, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "12.85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 239.25256000000002, "r": 324.98117, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "83-84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 239.25256000000002, "r": 354.651, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "76-81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 239.25256000000002, "r": 384.32083, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "90-92", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45187, "t": 239.25256000000002, "r": 418.16003, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "94-95", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 239.25256000000002, "r": 447.82986, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "87-94", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 239.25256000000002, "r": 477.50867, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "69-73", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 239.25256000000002, "r": 507.17849999999993, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "78-86", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 250.21155, "r": 124.63177, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 177.866, "t": 250.21155, "r": 198.71288, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "34733", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 250.21155, "r": 233.69174000000004, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "3.20", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 250.21155, "r": 264.50031, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "2.27", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 250.21155, "r": 295.30887, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "3.60", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 250.21155, "r": 324.98117, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "77-81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 250.21155, "r": 354.651, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "75-80", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 250.21155, "r": 384.32083, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "83-86", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45187, "t": 250.21155, "r": 418.16003, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "98-99", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 250.21155, "r": 447.82986, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "58-80", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 250.21155, "r": 477.50867, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "79-84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 250.21155, "r": 507.17849999999993, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "70-85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 261.16956000000005, "r": 120.78519, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Text", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 173.69701, "t": 261.16956000000005, "r": 198.71326, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "510377", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 215.04201, "t": 261.16956000000005, "r": 233.69212, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "45.82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.85056, "t": 261.16956000000005, "r": 264.50067, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "49.28", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 276.65912, "t": 261.16956000000005, "r": 295.30923, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "45.00", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 261.16956000000005, "r": 324.98117, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "84-86", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 261.16956000000005, "r": 354.651, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "81-86", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 261.16956000000005, "r": 384.32083, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "88-93", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45187, "t": 261.16956000000005, "r": 418.16003, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "89-93", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 261.16956000000005, "r": 447.82986, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "87-92", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 261.16956000000005, "r": 477.50867, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "71-79", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 261.16956000000005, "r": 507.17849999999993, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "87-95", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 272.12854000000004, "r": 121.81633, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Title", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 182.035, "t": 272.12854000000004, "r": 198.71251, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "5071", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 272.12854000000004, "r": 233.69174000000004, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.47", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 272.12854000000004, "r": 264.50031, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.30", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 272.12854000000004, "r": 295.30887, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.50", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 272.12854000000004, "r": 324.98117, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "60-72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 272.12854000000004, "r": 354.651, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "24-63", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 272.12854000000004, "r": 384.32083, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "50-63", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.2825, "t": 272.12854000000004, "r": 418.16003, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "94-100", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 272.12854000000004, "r": 447.82986, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "82-96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 272.12854000000004, "r": 477.50867, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "68-79", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 272.12854000000004, "r": 507.17849999999993, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "24-56", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 283.48654, "r": 123.43028, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Total", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 169.52699, "t": 283.48654, "r": 198.71263, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "1107470", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 208.675, "t": 283.48654, "r": 233.69124999999997, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "941123", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 243.65291999999997, "t": 283.48654, "r": 264.49982, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "99816", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 274.46149, "t": 283.48654, "r": 295.30838, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "66531", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 283.48654, "r": 324.98117, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "82-83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 283.48654, "r": 354.651, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "71-74", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 283.48654, "r": 384.32083, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "79-81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45187, "t": 283.48654, "r": 418.16003, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "89-94", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 283.48654, "r": 447.82986, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "86-91", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 283.48654, "r": 477.50867, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "71-76", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 283.48654, "r": 507.17849999999993, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "68-85", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "caption", "id": 9, "page_no": 3, "cluster": {"id": 9, "label": "caption", "bbox": {"l": 53.79800000000001, "t": 554.00999, "r": 295.64874, "b": 606.31924, "coord_origin": "TOPLEFT"}, "confidence": 0.810490071773529, "cells": [{"id": 163, "text": "Figure 3: Corpus Conversion Service annotation user inter-", "bbox": {"l": 53.79800000000001, "t": 554.00999, "r": 295.64871, "b": 562.48325, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "face. The PDF page is shown in the background, with over-", "bbox": {"l": 53.79800000000001, "t": 564.96899, "r": 295.64874, "b": 573.44225, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "laid text-cells (in darker shades). The annotation boxes can", "bbox": {"l": 53.79800000000001, "t": 575.92799, "r": 294.04376, "b": 584.40125, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "be drawn by dragging a rectangle over each segment with", "bbox": {"l": 53.79800000000001, "t": 586.88699, "r": 294.04373, "b": 595.36024, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "the respective label from the palette on the right.", "bbox": {"l": 53.79800000000001, "t": 597.84599, "r": 252.78931000000003, "b": 606.31924, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 3: Corpus Conversion Service annotation user interface. The PDF page is shown in the background, with overlaid text-cells (in darker shades). The annotation boxes can be drawn by dragging a rectangle over each segment with the respective label from the palette on the right."}, {"label": "text", "id": 5, "page_no": 3, "cluster": {"id": 5, "label": "text", "bbox": {"l": 53.466999, "t": 634.29155, "r": 294.04745, "b": 675.54317, "coord_origin": "TOPLEFT"}, "confidence": 0.980393648147583, "cells": [{"id": 168, "text": "we distributed the annotation workload and performed continuous", "bbox": {"l": 53.466999, "t": 634.29155, "r": 294.04745, "b": 642.66617, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "quality controls. Phase one and two required a small team of experts", "bbox": {"l": 53.79800000000001, "t": 645.25055, "r": 294.04535, "b": 653.62517, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "only. For phases three and four, a group of 40 dedicated annotators", "bbox": {"l": 53.79800000000001, "t": 656.20955, "r": 294.04422, "b": 664.58417, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "were assembled and supervised.", "bbox": {"l": 53.466999, "t": 667.16856, "r": 170.58611, "b": 675.54317, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "we distributed the annotation workload and performed continuous quality controls. Phase one and two required a small team of experts only. For phases three and four, a group of 40 dedicated annotators were assembled and supervised."}, {"label": "text", "id": 6, "page_no": 3, "cluster": {"id": 6, "label": "text", "bbox": {"l": 53.79800000000001, "t": 678.01099, "r": 295.55844, "b": 708.420174, "coord_origin": "TOPLEFT"}, "confidence": 0.9748398661613464, "cells": [{"id": 172, "text": "Phase 1: Data selection and preparation.", "bbox": {"l": 63.76099800000001, "t": 678.01099, "r": 226.72533000000004, "b": 686.48424, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "Our inclusion cri-", "bbox": {"l": 229.06900000000002, "t": 678.12756, "r": 295.55844, "b": 686.50217, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "teria for documents were described in Section 3. A large effort went", "bbox": {"l": 53.79800000000001, "t": 689.08656, "r": 294.04538, "b": 697.461174, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "into ensuring that all documents are free to use. The data sources", "bbox": {"l": 53.79800000000001, "t": 700.045555, "r": 294.04642, "b": 708.420174, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Phase 1: Data selection and preparation. Our inclusion criteria for documents were described in Section 3. A large effort went into ensuring that all documents are free to use. The data sources"}, {"label": "text", "id": 4, "page_no": 3, "cluster": {"id": 4, "label": "text", "bbox": {"l": 317.95499, "t": 312.07953, "r": 559.18536, "b": 375.24817, "coord_origin": "TOPLEFT"}, "confidence": 0.9818483591079712, "cells": [{"id": 176, "text": "include publication repositories such as arXiv$^{3}$, government offices,", "bbox": {"l": 317.95499, "t": 312.07953, "r": 559.18536, "b": 320.45416000000006, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "company websites as well as data directory services for financial", "bbox": {"l": 317.95499, "t": 323.03754, "r": 558.19843, "b": 331.41217, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "reports and patents. Scanned documents were excluded wherever", "bbox": {"l": 317.95499, "t": 333.99655, "r": 558.36963, "b": 342.37119, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "possible because they can be rotated or skewed. This would not", "bbox": {"l": 317.95499, "t": 344.95554, "r": 558.2041, "b": 353.33017, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "allow us to perform annotation with rectangular bounding-boxes", "bbox": {"l": 317.95499, "t": 355.91455, "r": 558.20294, "b": 364.28918, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "and therefore complicate the annotation process.", "bbox": {"l": 317.95499, "t": 366.87354, "r": 496.71826, "b": 375.24817, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "include publication repositories such as arXiv$^{3}$, government offices, company websites as well as data directory services for financial reports and patents. Scanned documents were excluded wherever possible because they can be rotated or skewed. This would not allow us to perform annotation with rectangular bounding-boxes and therefore complicate the annotation process."}, {"label": "text", "id": 0, "page_no": 3, "cluster": {"id": 0, "label": "text", "bbox": {"l": 317.95499, "t": 377.8325500000001, "r": 559.71307, "b": 506.75516, "coord_origin": "TOPLEFT"}, "confidence": 0.9866719841957092, "cells": [{"id": 182, "text": "Preparation work included uploading and parsing the sourced", "bbox": {"l": 327.918, "t": 377.8325500000001, "r": 558.20618, "b": 386.20717999999994, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "PDF documents in the Corpus Conversion Service (CCS) [22], a", "bbox": {"l": 317.95499, "t": 388.79153, "r": 558.2019, "b": 397.16617, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "cloud-native platform which provides a visual annotation interface", "bbox": {"l": 317.95499, "t": 399.75055, "r": 558.20233, "b": 408.12518, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": "and allows for dataset inspection and analysis. The annotation in-", "bbox": {"l": 317.95499, "t": 410.7095299999999, "r": 559.71277, "b": 419.08417, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "terface of CCS is shown in Figure 3. The desired balance of pages", "bbox": {"l": 317.95499, "t": 421.66855000000004, "r": 558.20062, "b": 430.04318, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "between the different document categories was achieved by se-", "bbox": {"l": 317.95499, "t": 432.62753, "r": 559.71307, "b": 441.00217, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": "lective subsampling of pages with certain desired properties. For", "bbox": {"l": 317.95499, "t": 443.58554, "r": 558.36877, "b": 451.96017, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "example, we made sure to include the title page of each document", "bbox": {"l": 317.95499, "t": 454.54453, "r": 558.20428, "b": 462.91916, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "and bias the remaining page selection to those with figures or", "bbox": {"l": 317.95499, "t": 465.50354, "r": 558.36877, "b": 473.87817, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "tables. The latter was achieved by leveraging pre-trained object", "bbox": {"l": 317.95499, "t": 476.46252, "r": 558.20428, "b": 484.83716, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": "detection models from PubLayNet, which helped us estimate how", "bbox": {"l": 317.95499, "t": 487.42154, "r": 558.5307, "b": 495.79617, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "many figures and tables a given page contains.", "bbox": {"l": 317.95499, "t": 498.38052, "r": 488.46914999999996, "b": 506.75516, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Preparation work included uploading and parsing the sourced PDF documents in the Corpus Conversion Service (CCS) [22], a cloud-native platform which provides a visual annotation interface and allows for dataset inspection and analysis. The annotation interface of CCS is shown in Figure 3. The desired balance of pages between the different document categories was achieved by selective subsampling of pages with certain desired properties. For example, we made sure to include the title page of each document and bias the remaining page selection to those with figures or tables. The latter was achieved by leveraging pre-trained object detection models from PubLayNet, which helped us estimate how many figures and tables a given page contains."}, {"label": "text", "id": 3, "page_no": 3, "cluster": {"id": 3, "label": "text", "bbox": {"l": 317.62299, "t": 509.22299, "r": 559.71765, "b": 693.0561749999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9847556948661804, "cells": [{"id": 194, "text": "Phase 2: Label selection and guideline.", "bbox": {"l": 327.918, "t": 509.22299, "r": 482.41809, "b": 517.69623, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "We reviewed the col-", "bbox": {"l": 484.474, "t": 509.33954, "r": 559.71765, "b": 517.71417, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "lected documents and identified the most common structural fea-", "bbox": {"l": 317.95499, "t": 520.29855, "r": 559.71619, "b": 528.67319, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "tures they exhibit. This was achieved by identifying recurrent layout", "bbox": {"l": 317.95499, "t": 531.2575400000001, "r": 558.20239, "b": 539.63217, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "elements and lead us to the definition of 11 distinct class labels.", "bbox": {"l": 317.95499, "t": 542.21655, "r": 559.58502, "b": 550.59117, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "These 11 class labels are", "bbox": {"l": 317.686, "t": 553.17456, "r": 404.14197, "b": 561.54918, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "Caption", "bbox": {"l": 406.26599, "t": 553.21939, "r": 433.84860000000003, "b": 561.5581500000001, "coord_origin": "TOPLEFT"}}, {"id": 201, "text": ",", "bbox": {"l": 433.84799, "t": 553.17456, "r": 435.78115999999994, "b": 561.54918, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": "Footnote", "bbox": {"l": 437.9079899999999, "t": 553.21939, "r": 467.23926, "b": 561.5581500000001, "coord_origin": "TOPLEFT"}}, {"id": 203, "text": ",", "bbox": {"l": 467.23999, "t": 553.17456, "r": 469.17316000000005, "b": 561.54918, "coord_origin": "TOPLEFT"}}, {"id": 204, "text": "Formula", "bbox": {"l": 471.29900999999995, "t": 553.21939, "r": 500.44574000000006, "b": 561.5581500000001, "coord_origin": "TOPLEFT"}}, {"id": 205, "text": ",", "bbox": {"l": 500.44601000000006, "t": 553.17456, "r": 502.37918, "b": 561.54918, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": "List-item", "bbox": {"l": 504.505, "t": 553.21939, "r": 535.74304, "b": 561.5581500000001, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": ",", "bbox": {"l": 535.74298, "t": 553.17456, "r": 537.67615, "b": 561.54918, "coord_origin": "TOPLEFT"}}, {"id": 208, "text": "Page-", "bbox": {"l": 539.802, "t": 553.21939, "r": 559.09839, "b": 561.5581500000001, "coord_origin": "TOPLEFT"}}, {"id": 209, "text": "footer", "bbox": {"l": 317.95499, "t": 564.17839, "r": 338.80725, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": ",", "bbox": {"l": 338.806, "t": 564.13356, "r": 340.81805, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "Page-header", "bbox": {"l": 343.61401, "t": 564.17839, "r": 387.96164, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 212, "text": ",", "bbox": {"l": 387.961, "t": 564.13356, "r": 389.97305, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "Picture", "bbox": {"l": 392.76901, "t": 564.17839, "r": 417.84662, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 214, "text": ",", "bbox": {"l": 417.84799, "t": 564.13356, "r": 419.86005, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 215, "text": "Section-header", "bbox": {"l": 422.655, "t": 564.17839, "r": 475.56305, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 216, "text": ",", "bbox": {"l": 475.56201, "t": 564.13356, "r": 477.57407, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 217, "text": "Table", "bbox": {"l": 480.36899, "t": 564.17839, "r": 499.82196, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 218, "text": ",", "bbox": {"l": 499.8219900000001, "t": 564.13356, "r": 501.83405, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 219, "text": "Text", "bbox": {"l": 504.6290000000001, "t": 564.17839, "r": 519.7926, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 220, "text": ", and", "bbox": {"l": 519.79602, "t": 564.13356, "r": 538.37103, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 221, "text": "Title", "bbox": {"l": 541.16302, "t": 564.17839, "r": 557.57043, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 222, "text": ".", "bbox": {"l": 557.57098, "t": 564.13356, "r": 559.58307, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 223, "text": "Critical factors that were considered for the choice of these class", "bbox": {"l": 317.95499, "t": 575.09256, "r": 558.20416, "b": 583.46718, "coord_origin": "TOPLEFT"}}, {"id": 224, "text": "labels were (1) the overall occurrence of the label, (2) the specificity", "bbox": {"l": 317.95499, "t": 586.05156, "r": 558.43091, "b": 594.4261799999999, "coord_origin": "TOPLEFT"}}, {"id": 225, "text": "of the label, (3) recognisability on a single page (i.e. no need for", "bbox": {"l": 317.95499, "t": 597.0105599999999, "r": 558.36871, "b": 605.38518, "coord_origin": "TOPLEFT"}}, {"id": 226, "text": "context from previous or next page) and (4) overall coverage of the", "bbox": {"l": 317.95499, "t": 607.96956, "r": 558.20105, "b": 616.3441799999999, "coord_origin": "TOPLEFT"}}, {"id": 227, "text": "page. Specificity ensures that the choice of label is not ambiguous,", "bbox": {"l": 317.95499, "t": 618.9285600000001, "r": 559.18665, "b": 627.30318, "coord_origin": "TOPLEFT"}}, {"id": 228, "text": "while coverage ensures that all meaningful items on a page can", "bbox": {"l": 317.62299, "t": 629.88756, "r": 558.20142, "b": 638.26218, "coord_origin": "TOPLEFT"}}, {"id": 229, "text": "be annotated. We refrained from class labels that are very specific", "bbox": {"l": 317.95499, "t": 640.84656, "r": 558.20227, "b": 649.22118, "coord_origin": "TOPLEFT"}}, {"id": 230, "text": "to a document category, such as", "bbox": {"l": 317.95499, "t": 651.80556, "r": 436.90649, "b": 660.1801800000001, "coord_origin": "TOPLEFT"}}, {"id": 231, "text": "Abstract", "bbox": {"l": 439.13800000000003, "t": 651.8503900000001, "r": 469.69134999999994, "b": 660.18915, "coord_origin": "TOPLEFT"}}, {"id": 232, "text": "in the", "bbox": {"l": 472.42898999999994, "t": 651.80556, "r": 493.97348, "b": 660.1801800000001, "coord_origin": "TOPLEFT"}}, {"id": 233, "text": "Scientific Articles", "bbox": {"l": 496.207, "t": 651.8503900000001, "r": 558.20001, "b": 660.18915, "coord_origin": "TOPLEFT"}}, {"id": 234, "text": "category. We also avoided class labels that are tightly linked to the", "bbox": {"l": 317.95499, "t": 662.76456, "r": 558.20557, "b": 671.13918, "coord_origin": "TOPLEFT"}}, {"id": 235, "text": "semantics of the text. Labels such as", "bbox": {"l": 317.95499, "t": 673.7225599999999, "r": 447.65221999999994, "b": 682.09718, "coord_origin": "TOPLEFT"}}, {"id": 236, "text": "Author", "bbox": {"l": 449.85999, "t": 673.76739, "r": 474.31439, "b": 682.10614, "coord_origin": "TOPLEFT"}}, {"id": 237, "text": "and", "bbox": {"l": 477.172, "t": 673.7225599999999, "r": 490.39655, "b": 682.09718, "coord_origin": "TOPLEFT"}}, {"id": 238, "text": "Affiliation", "bbox": {"l": 492.60599, "t": 673.76739, "r": 528.29907, "b": 682.10614, "coord_origin": "TOPLEFT"}}, {"id": 239, "text": ", as seen", "bbox": {"l": 528.29901, "t": 673.7225599999999, "r": 558.20148, "b": 682.09718, "coord_origin": "TOPLEFT"}}, {"id": 240, "text": "in DocBank, are often only distinguishable by discriminating on", "bbox": {"l": 317.95499, "t": 684.68156, "r": 558.2041, "b": 693.0561749999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Phase 2: Label selection and guideline. We reviewed the collected documents and identified the most common structural features they exhibit. This was achieved by identifying recurrent layout elements and lead us to the definition of 11 distinct class labels. These 11 class labels are Caption , Footnote , Formula , List-item , Pagefooter , Page-header , Picture , Section-header , Table , Text , and Title . Critical factors that were considered for the choice of these class labels were (1) the overall occurrence of the label, (2) the specificity of the label, (3) recognisability on a single page (i.e. no need for context from previous or next page) and (4) overall coverage of the page. Specificity ensures that the choice of label is not ambiguous, while coverage ensures that all meaningful items on a page can be annotated. We refrained from class labels that are very specific to a document category, such as Abstract in the Scientific Articles category. We also avoided class labels that are tightly linked to the semantics of the text. Labels such as Author and Affiliation , as seen in DocBank, are often only distinguishable by discriminating on"}, {"label": "footnote", "id": 7, "page_no": 3, "cluster": {"id": 7, "label": "footnote", "bbox": {"l": 317.95499, "t": 702.353363, "r": 369.2457, "b": 708.86689, "coord_origin": "TOPLEFT"}, "confidence": 0.9080352783203125, "cells": [{"id": 241, "text": "$^{3}$https://arxiv.org/", "bbox": {"l": 317.95499, "t": 702.353363, "r": 369.2457, "b": 708.86689, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "$^{3}$https://arxiv.org/"}, {"label": "picture", "id": 2, "page_no": 3, "cluster": {"id": 2, "label": "picture", "bbox": {"l": 53.05912780761719, "t": 310.7912902832031, "r": 295.8506164550781, "b": 540.864013671875, "coord_origin": "TOPLEFT"}, "confidence": 0.9847871661186218, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "headers": [{"label": "page_header", "id": 10, "page_no": 3, "cluster": {"id": 10, "label": "page_header", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.7625049948692322, "cells": [{"id": 0, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 246.24382, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar", "bbox": {"l": 253.13897999999998, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar"}]}}, {"page_no": 4, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "the textual content of an element, which goes beyond visual layout", "bbox": {"l": 53.79800000000001, "t": 87.36352999999997, "r": 294.04541, "b": 95.73816, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "recognition, in particular outside the", "bbox": {"l": 53.79800000000001, "t": 98.32250999999997, "r": 188.1326, "b": 106.69713999999999, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Scientific Articles", "bbox": {"l": 190.37401, "t": 98.36737000000005, "r": 251.25586999999996, "b": 106.70612000000006, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "category.", "bbox": {"l": 253.70801, "t": 98.32250999999997, "r": 287.01816, "b": 106.69713999999999, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "At first sight, the task of visual document-layout interpretation", "bbox": {"l": 63.76100199999999, "t": 109.28156000000001, "r": 294.04257, "b": 117.65618999999992, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "appears intuitive enough to obtain plausible annotations in most", "bbox": {"l": 53.79800000000001, "t": 120.24054000000001, "r": 294.04266, "b": 128.61517000000003, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "cases. However, during early trial-runs in the core team, we ob-", "bbox": {"l": 53.79800000000001, "t": 131.19854999999995, "r": 295.55615, "b": 139.57317999999998, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "served many cases in which annotators use different annotation", "bbox": {"l": 53.79800000000001, "t": 142.15752999999995, "r": 294.04715, "b": 150.53216999999995, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "styles, especially for documents with challenging layouts. For ex-", "bbox": {"l": 53.79800000000001, "t": 153.11652000000004, "r": 295.55923, "b": 161.49114999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "ample, if a figure is presented with subfigures, one annotator might", "bbox": {"l": 53.79800000000001, "t": 164.07556, "r": 294.04535, "b": 172.4502, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "draw a single figure bounding-box, while another might annotate", "bbox": {"l": 53.79800000000001, "t": 175.03454999999997, "r": 294.04803, "b": 183.40918, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "each subfigure separately. The same applies for lists, where one", "bbox": {"l": 53.79800000000001, "t": 185.99352999999996, "r": 294.04709, "b": 194.36816, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "might annotate all list items in one block or each list item sep-", "bbox": {"l": 53.79800000000001, "t": 196.95250999999996, "r": 295.55612, "b": 205.32714999999996, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "arately. In essence, we observed that challenging layouts would", "bbox": {"l": 53.79800000000001, "t": 207.91156, "r": 294.04712, "b": 216.28619000000003, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "be annotated in different but plausible ways. To illustrate this, we", "bbox": {"l": 53.79800000000001, "t": 218.87054, "r": 294.04495, "b": 227.24518, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "show in Figure 4 multiple examples of plausible but inconsistent", "bbox": {"l": 53.79800000000001, "t": 229.82952999999998, "r": 294.04712, "b": 238.20416, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "annotations on the same pages.", "bbox": {"l": 53.79800000000001, "t": 240.78754000000004, "r": 168.61276, "b": 249.16216999999995, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Obviously, this inconsistency in annotations is not desirable for", "bbox": {"l": 63.76100199999999, "t": 251.74652000000003, "r": 294.21884, "b": 260.12114999999994, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "datasets which are intended to be used for model training. To min-", "bbox": {"l": 53.79800000000001, "t": 262.70556999999997, "r": 295.56006, "b": 271.0802, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "imise these inconsistencies, we created a detailed annotation guide-", "bbox": {"l": 53.79800000000001, "t": 273.66454999999996, "r": 295.55676, "b": 282.03918, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "line. While perfect consistency across 40 annotation staff members", "bbox": {"l": 53.79800000000001, "t": 284.62354, "r": 294.04922, "b": 292.99817, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "is clearly not possible to achieve, we saw a huge improvement in", "bbox": {"l": 53.79800000000001, "t": 295.5825500000001, "r": 294.04343, "b": 303.95717999999994, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "annotation consistency after the introduction of our annotation", "bbox": {"l": 53.79800000000001, "t": 306.54153, "r": 294.04712, "b": 314.91617, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "guideline. A few selected, non-trivial highlights of the guideline", "bbox": {"l": 53.79800000000001, "t": 317.50055, "r": 294.04718, "b": 325.87518, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "are:", "bbox": {"l": 53.79800000000001, "t": 328.4595299999999, "r": 67.28347, "b": 336.83417, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "(1)", "bbox": {"l": 64.708, "t": 348.51254, "r": 74.626793, "b": 356.88718, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Every list-item is an individual object instance with class", "bbox": {"l": 76.963936, "t": 348.51254, "r": 294.0462, "b": 356.88718, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "label", "bbox": {"l": 78.207001, "t": 359.47153, "r": 95.730484, "b": 367.84616, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "List-item", "bbox": {"l": 97.976997, "t": 359.51639, "r": 130.17131, "b": 367.85513, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": ". This definition is different from PubLayNet", "bbox": {"l": 130.17101, "t": 359.47153, "r": 294.04053, "b": 367.84616, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "and DocBank, where all list-items are grouped together into", "bbox": {"l": 78.207001, "t": 370.43054, "r": 294.04385, "b": 378.80518, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "one", "bbox": {"l": 78.207001, "t": 381.38953000000004, "r": 91.593834, "b": 389.76416, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "List", "bbox": {"l": 93.834999, "t": 381.43439000000006, "r": 106.88111, "b": 389.77313, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "object.", "bbox": {"l": 109.629, "t": 381.38953000000004, "r": 133.72173, "b": 389.76416, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "(2)", "bbox": {"l": 64.707993, "t": 392.34851, "r": 75.097656, "b": 400.72313999999994, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "A", "bbox": {"l": 77.545731, "t": 392.34851, "r": 84.351402, "b": 400.72313999999994, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "List-item", "bbox": {"l": 86.584, "t": 392.39339999999993, "r": 118.01329000000001, "b": 400.73215, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "is a paragraph with hanging indentation. Single-", "bbox": {"l": 120.26899999999999, "t": 392.34854, "r": 295.55695, "b": 400.72317999999996, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "line elements can qualify as", "bbox": {"l": 78.207001, "t": 403.30753, "r": 181.80978, "b": 411.68216, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "List-item", "bbox": {"l": 184.175, "t": 403.35239, "r": 216.68806000000004, "b": 411.69113, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "if the neighbour ele-", "bbox": {"l": 219.078, "t": 403.30753, "r": 295.56372, "b": 411.68216, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "ments expose hanging indentation. Bullet or enumeration", "bbox": {"l": 78.207001, "t": 414.2665400000001, "r": 294.04617, "b": 422.64116999999993, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "symbols are not a requirement.", "bbox": {"l": 78.207001, "t": 425.22552, "r": 192.00853, "b": 433.60016, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "(3)", "bbox": {"l": 64.708, "t": 436.18451000000005, "r": 74.483009, "b": 444.55914, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "For every", "bbox": {"l": 76.786255, "t": 436.18451000000005, "r": 112.61566, "b": 444.55914, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "Caption", "bbox": {"l": 114.861, "t": 436.2294, "r": 142.61249, "b": 444.56815000000006, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": ", there must be exactly one corresponding", "bbox": {"l": 142.612, "t": 436.18454, "r": 294.04724, "b": 444.55917, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "Picture", "bbox": {"l": 78.207001, "t": 447.18839, "r": 102.79287, "b": 455.52713, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "or", "bbox": {"l": 105.245, "t": 447.14352, "r": 113.09956999999999, "b": 455.51815999999997, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Table", "bbox": {"l": 115.341, "t": 447.18839, "r": 134.40356, "b": 455.52713, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": ".", "bbox": {"l": 134.403, "t": 447.14352, "r": 136.37561, "b": 455.51815999999997, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "(4)", "bbox": {"l": 64.708, "t": 458.1015300000001, "r": 74.220215, "b": 466.47617, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "Connected sub-pictures are grouped together in one", "bbox": {"l": 76.461555, "t": 458.1015300000001, "r": 267.46786, "b": 466.47617, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "Picture", "bbox": {"l": 269.70599, "t": 458.14639, "r": 294.04599, "b": 466.48514, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "object.", "bbox": {"l": 78.207001, "t": 469.06055, "r": 102.29972, "b": 477.43518, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "(5)", "bbox": {"l": 64.708, "t": 480.01953, "r": 74.345383, "b": 488.39417, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Formula numbers are included in a", "bbox": {"l": 76.616203, "t": 480.01953, "r": 206.13503, "b": 488.39417, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Formula", "bbox": {"l": 208.38, "t": 480.06439, "r": 238.12155, "b": 488.40314, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "object.", "bbox": {"l": 240.41300999999999, "t": 480.01953, "r": 264.50571, "b": 488.39417, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "(6)", "bbox": {"l": 64.708008, "t": 490.97852, "r": 74.564522, "b": 499.35315, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "Emphasised text (e.g. in italic or bold) at the beginning of", "bbox": {"l": 76.886978, "t": 490.97852, "r": 294.04617, "b": 499.35315, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "a paragraph is not considered a", "bbox": {"l": 78.207001, "t": 501.93753, "r": 200.34819, "b": 510.31216, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "Section-header", "bbox": {"l": 203.66701, "t": 501.98239, "r": 256.57504, "b": 510.32114, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": ", unless it", "bbox": {"l": 256.57401, "t": 501.93753, "r": 294.04401, "b": 510.31216, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "appears exclusively on its own line.", "bbox": {"l": 78.207001, "t": 512.8965499999999, "r": 208.13017, "b": 521.27118, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "The complete annotation guideline is over 100 pages long and a", "bbox": {"l": 53.528999, "t": 532.9505300000001, "r": 294.04337, "b": 541.32516, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "detailed description is obviously out of scope for this paper. Never-", "bbox": {"l": 53.79800000000001, "t": 543.90855, "r": 295.56253, "b": 552.28317, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "theless, it will be made publicly available alongside with DocLayNet", "bbox": {"l": 53.79800000000001, "t": 554.8675499999999, "r": 294.04538, "b": 563.24217, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "for future reference.", "bbox": {"l": 53.79800000000001, "t": 565.82655, "r": 127.2418, "b": 574.20117, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Phase 3: Training.", "bbox": {"l": 63.76100199999999, "t": 576.66899, "r": 136.7744, "b": 585.14224, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "After a first trial with a small group of peo-", "bbox": {"l": 139.008, "t": 576.7855500000001, "r": 295.56226, "b": 585.16017, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "ple, we realised that providing the annotation guideline and a set of", "bbox": {"l": 53.79800000000001, "t": 587.74455, "r": 294.04532, "b": 596.1191699999999, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "random practice pages did not yield the desired quality level for lay-", "bbox": {"l": 53.79800000000001, "t": 598.70355, "r": 295.55676, "b": 607.07817, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "out annotation. Therefore we prepared a subset of pages with two", "bbox": {"l": 53.79800000000001, "t": 609.66255, "r": 294.04605, "b": 618.0371700000001, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "different complexity levels, each with a practice and an exam part.", "bbox": {"l": 53.79800000000001, "t": 620.6215500000001, "r": 295.42377, "b": 628.99617, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "974 pages were reference-annotated by one proficient core team", "bbox": {"l": 53.79800000000001, "t": 631.58055, "r": 294.04712, "b": 639.95517, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "member. Annotation staff were then given the task to annotate the", "bbox": {"l": 53.79800000000001, "t": 642.53955, "r": 294.04922, "b": 650.91417, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "same subsets (blinded from the reference). By comparing the an-", "bbox": {"l": 53.79800000000001, "t": 653.49855, "r": 295.55618, "b": 661.87317, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "notations of each staff member with the reference annotations, we", "bbox": {"l": 53.79800000000001, "t": 664.45655, "r": 294.04874, "b": 672.83117, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "could quantify how closely their annotations matched the reference.", "bbox": {"l": 53.79800000000001, "t": 675.4155499999999, "r": 295.42496, "b": 683.79017, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "Only after passing two exam levels with high annotation quality,", "bbox": {"l": 53.79800000000001, "t": 686.37456, "r": 295.0274, "b": 694.749176, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "staff were admitted into the production phase. Practice iterations", "bbox": {"l": 53.79800000000001, "t": 697.333557, "r": 294.04114, "b": 705.708176, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "1ef23f5e6d7f10d393f9947e8208285dce9ae87250ac483ac4b4a59d51b4e037", "bbox": {"l": 340.00214, "t": 179.79296999999997, "r": 416.20551, "b": 181.90972999999997, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "Compliant with guidelines", "bbox": {"l": 339.38269, "t": 85.19066999999995, "r": 417.83722, "b": 92.28399999999999, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Plausible but invalid alternative", "bbox": {"l": 451.42834, "t": 85.19066999999995, "r": 546.22913, "b": 92.28399999999999, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Borderline case: Two guideline-compliant alternatives", "bbox": {"l": 350.33701, "t": 364.85706, "r": 513.48035, "b": 371.95035000000007, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "03c31a2ee1ed1b583c28957f475ee545d144e1b5a264dc4dd068c8d2f6a64860", "bbox": {"l": 340.00201, "t": 245.07385, "r": 416.20538, "b": 247.19061, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "1a5cd524f1844c1260c8e8c073e1f442423c264583212b0d0b6626fc780e6ed4", "bbox": {"l": 340.00201, "t": 359.12488, "r": 416.20538, "b": 361.24167, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "05237a14f2524e3f53c8454b074409d05078038a6a36b770fcc8ec7e540deae0", "bbox": {"l": 400.12842, "t": 458.44327000000004, "r": 476.33178999999996, "b": 460.5600600000001, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "A", "bbox": {"l": 322.19424, "t": 98.34105999999997, "r": 326.01498, "b": 104.25214000000005, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "B", "bbox": {"l": 322.19424, "t": 186.99103000000002, "r": 326.01498, "b": 192.90204000000006, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "C", "bbox": {"l": 322.19424, "t": 253.54192999999998, "r": 326.01498, "b": 259.453, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "D", "bbox": {"l": 322.19424, "t": 367.08495999999997, "r": 326.01498, "b": 372.996, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "Figure 4: Examples of plausible annotation alternatives for", "bbox": {"l": 317.95499, "t": 473.49399, "r": 558.3891, "b": 481.96722, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "the same page. Criteria in our annotation guideline can re-", "bbox": {"l": 317.95499, "t": 484.45297, "r": 559.80579, "b": 492.92621, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "solve cases A to C, while the case D remains ambiguous.", "bbox": {"l": 317.95499, "t": 495.41196, "r": 544.14148, "b": 503.88519, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "were carried out over a timeframe of 12 weeks, after which 8 of the", "bbox": {"l": 317.62299, "t": 525.49753, "r": 558.20435, "b": 533.87216, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "40", "bbox": {"l": 317.74899, "t": 536.45656, "r": 326.07019, "b": 544.83118, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "initially allocated annotators did not pass the bar.", "bbox": {"l": 328.3071, "t": 536.45656, "r": 509.11896, "b": 544.83118, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "Phase 4: Production annotation.", "bbox": {"l": 327.918, "t": 547.299, "r": 456.80109000000004, "b": 555.77225, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "The previously selected 80K", "bbox": {"l": 458.7120100000001, "t": 547.41556, "r": 558.48926, "b": 555.79018, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "pages were annotated with the defined 11 class labels by 32 annota-", "bbox": {"l": 317.95499, "t": 558.37456, "r": 559.71368, "b": 566.74918, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "tors. This production phase took around three months to complete.", "bbox": {"l": 317.95499, "t": 569.33356, "r": 559.58124, "b": 577.7081800000001, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "All annotations were created online through CCS, which visualises", "bbox": {"l": 317.64099, "t": 580.29256, "r": 558.20386, "b": 588.66718, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "the programmatic PDF text-cells as an overlay on the page. The page", "bbox": {"l": 317.95499, "t": 591.25156, "r": 558.20221, "b": 599.62617, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "annotation are obtained by drawing rectangular bounding-boxes,", "bbox": {"l": 317.95499, "t": 602.20955, "r": 559.18457, "b": 610.58417, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "as shown in Figure 3. With regard to the annotation practices, we", "bbox": {"l": 317.95499, "t": 613.16855, "r": 558.20197, "b": 621.54317, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "implemented a few constraints and capabilities on the tooling level.", "bbox": {"l": 317.95499, "t": 624.12755, "r": 559.58197, "b": 632.50217, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "First, we only allow non-overlapping, vertically oriented, rectangu-", "bbox": {"l": 317.95499, "t": 635.08655, "r": 559.71411, "b": 643.46117, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "lar boxes. For the large majority of documents, this constraint was", "bbox": {"l": 317.95499, "t": 646.04555, "r": 558.20557, "b": 654.42017, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "sufficient and it speeds up the annotation considerably in compar-", "bbox": {"l": 317.95499, "t": 657.00455, "r": 559.7149, "b": 665.3791699999999, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "ison with arbitrary segmentation shapes. Second, annotator staff", "bbox": {"l": 317.95499, "t": 667.9635499999999, "r": 558.19849, "b": 676.33817, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "were not able to see each other\u2019s annotations. This was enforced by", "bbox": {"l": 317.62299, "t": 678.92255, "r": 558.43268, "b": 687.29717, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "design to avoid any bias in the annotation, which could skew the", "bbox": {"l": 317.95499, "t": 689.8815500000001, "r": 558.19806, "b": 698.256172, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "numbers of the inter-annotator agreement (see Table 1). We wanted", "bbox": {"l": 317.95499, "t": 700.840553, "r": 558.20227, "b": 709.2151719999999, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 13, "label": "page_header", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.8877827525138855, "cells": [{"id": 0, "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "page_header", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.8534670472145081, "cells": [{"id": 1, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 53.79800000000001, "t": 87.36352999999997, "r": 294.04541, "b": 106.70612000000006, "coord_origin": "TOPLEFT"}, "confidence": 0.9022762179374695, "cells": [{"id": 2, "text": "the textual content of an element, which goes beyond visual layout", "bbox": {"l": 53.79800000000001, "t": 87.36352999999997, "r": 294.04541, "b": 95.73816, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "recognition, in particular outside the", "bbox": {"l": 53.79800000000001, "t": 98.32250999999997, "r": 188.1326, "b": 106.69713999999999, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Scientific Articles", "bbox": {"l": 190.37401, "t": 98.36737000000005, "r": 251.25586999999996, "b": 106.70612000000006, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "category.", "bbox": {"l": 253.70801, "t": 98.32250999999997, "r": 287.01816, "b": 106.69713999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "text", "bbox": {"l": 53.79800000000001, "t": 109.28156000000001, "r": 295.55923, "b": 249.16216999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9711344838142395, "cells": [{"id": 6, "text": "At first sight, the task of visual document-layout interpretation", "bbox": {"l": 63.76100199999999, "t": 109.28156000000001, "r": 294.04257, "b": 117.65618999999992, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "appears intuitive enough to obtain plausible annotations in most", "bbox": {"l": 53.79800000000001, "t": 120.24054000000001, "r": 294.04266, "b": 128.61517000000003, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "cases. However, during early trial-runs in the core team, we ob-", "bbox": {"l": 53.79800000000001, "t": 131.19854999999995, "r": 295.55615, "b": 139.57317999999998, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "served many cases in which annotators use different annotation", "bbox": {"l": 53.79800000000001, "t": 142.15752999999995, "r": 294.04715, "b": 150.53216999999995, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "styles, especially for documents with challenging layouts. For ex-", "bbox": {"l": 53.79800000000001, "t": 153.11652000000004, "r": 295.55923, "b": 161.49114999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "ample, if a figure is presented with subfigures, one annotator might", "bbox": {"l": 53.79800000000001, "t": 164.07556, "r": 294.04535, "b": 172.4502, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "draw a single figure bounding-box, while another might annotate", "bbox": {"l": 53.79800000000001, "t": 175.03454999999997, "r": 294.04803, "b": 183.40918, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "each subfigure separately. The same applies for lists, where one", "bbox": {"l": 53.79800000000001, "t": 185.99352999999996, "r": 294.04709, "b": 194.36816, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "might annotate all list items in one block or each list item sep-", "bbox": {"l": 53.79800000000001, "t": 196.95250999999996, "r": 295.55612, "b": 205.32714999999996, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "arately. In essence, we observed that challenging layouts would", "bbox": {"l": 53.79800000000001, "t": 207.91156, "r": 294.04712, "b": 216.28619000000003, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "be annotated in different but plausible ways. To illustrate this, we", "bbox": {"l": 53.79800000000001, "t": 218.87054, "r": 294.04495, "b": 227.24518, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "show in Figure 4 multiple examples of plausible but inconsistent", "bbox": {"l": 53.79800000000001, "t": 229.82952999999998, "r": 294.04712, "b": 238.20416, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "annotations on the same pages.", "bbox": {"l": 53.79800000000001, "t": 240.78754000000004, "r": 168.61276, "b": 249.16216999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 53.79800000000001, "t": 251.74652000000003, "r": 295.56006, "b": 336.83417, "coord_origin": "TOPLEFT"}, "confidence": 0.985905110836029, "cells": [{"id": 19, "text": "Obviously, this inconsistency in annotations is not desirable for", "bbox": {"l": 63.76100199999999, "t": 251.74652000000003, "r": 294.21884, "b": 260.12114999999994, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "datasets which are intended to be used for model training. To min-", "bbox": {"l": 53.79800000000001, "t": 262.70556999999997, "r": 295.56006, "b": 271.0802, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "imise these inconsistencies, we created a detailed annotation guide-", "bbox": {"l": 53.79800000000001, "t": 273.66454999999996, "r": 295.55676, "b": 282.03918, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "line. While perfect consistency across 40 annotation staff members", "bbox": {"l": 53.79800000000001, "t": 284.62354, "r": 294.04922, "b": 292.99817, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "is clearly not possible to achieve, we saw a huge improvement in", "bbox": {"l": 53.79800000000001, "t": 295.5825500000001, "r": 294.04343, "b": 303.95717999999994, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "annotation consistency after the introduction of our annotation", "bbox": {"l": 53.79800000000001, "t": 306.54153, "r": 294.04712, "b": 314.91617, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "guideline. A few selected, non-trivial highlights of the guideline", "bbox": {"l": 53.79800000000001, "t": 317.50055, "r": 294.04718, "b": 325.87518, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "are:", "bbox": {"l": 53.79800000000001, "t": 328.4595299999999, "r": 67.28347, "b": 336.83417, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "list_item", "bbox": {"l": 64.708, "t": 348.51254, "r": 294.0462, "b": 389.77313, "coord_origin": "TOPLEFT"}, "confidence": 0.9691526293754578, "cells": [{"id": 27, "text": "(1)", "bbox": {"l": 64.708, "t": 348.51254, "r": 74.626793, "b": 356.88718, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Every list-item is an individual object instance with class", "bbox": {"l": 76.963936, "t": 348.51254, "r": 294.0462, "b": 356.88718, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "label", "bbox": {"l": 78.207001, "t": 359.47153, "r": 95.730484, "b": 367.84616, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "List-item", "bbox": {"l": 97.976997, "t": 359.51639, "r": 130.17131, "b": 367.85513, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": ". This definition is different from PubLayNet", "bbox": {"l": 130.17101, "t": 359.47153, "r": 294.04053, "b": 367.84616, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "and DocBank, where all list-items are grouped together into", "bbox": {"l": 78.207001, "t": 370.43054, "r": 294.04385, "b": 378.80518, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "one", "bbox": {"l": 78.207001, "t": 381.38953000000004, "r": 91.593834, "b": 389.76416, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "List", "bbox": {"l": 93.834999, "t": 381.43439000000006, "r": 106.88111, "b": 389.77313, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "object.", "bbox": {"l": 109.629, "t": 381.38953000000004, "r": 133.72173, "b": 389.76416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "list_item", "bbox": {"l": 64.707993, "t": 392.34851, "r": 295.56372, "b": 433.60016, "coord_origin": "TOPLEFT"}, "confidence": 0.9591284990310669, "cells": [{"id": 36, "text": "(2)", "bbox": {"l": 64.707993, "t": 392.34851, "r": 75.097656, "b": 400.72313999999994, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "A", "bbox": {"l": 77.545731, "t": 392.34851, "r": 84.351402, "b": 400.72313999999994, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "List-item", "bbox": {"l": 86.584, "t": 392.39339999999993, "r": 118.01329000000001, "b": 400.73215, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "is a paragraph with hanging indentation. Single-", "bbox": {"l": 120.26899999999999, "t": 392.34854, "r": 295.55695, "b": 400.72317999999996, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "line elements can qualify as", "bbox": {"l": 78.207001, "t": 403.30753, "r": 181.80978, "b": 411.68216, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "List-item", "bbox": {"l": 184.175, "t": 403.35239, "r": 216.68806000000004, "b": 411.69113, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "if the neighbour ele-", "bbox": {"l": 219.078, "t": 403.30753, "r": 295.56372, "b": 411.68216, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "ments expose hanging indentation. Bullet or enumeration", "bbox": {"l": 78.207001, "t": 414.2665400000001, "r": 294.04617, "b": 422.64116999999993, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "symbols are not a requirement.", "bbox": {"l": 78.207001, "t": 425.22552, "r": 192.00853, "b": 433.60016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "list_item", "bbox": {"l": 64.708, "t": 436.18451000000005, "r": 294.04724, "b": 455.52713, "coord_origin": "TOPLEFT"}, "confidence": 0.9413429498672485, "cells": [{"id": 45, "text": "(3)", "bbox": {"l": 64.708, "t": 436.18451000000005, "r": 74.483009, "b": 444.55914, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "For every", "bbox": {"l": 76.786255, "t": 436.18451000000005, "r": 112.61566, "b": 444.55914, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "Caption", "bbox": {"l": 114.861, "t": 436.2294, "r": 142.61249, "b": 444.56815000000006, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": ", there must be exactly one corresponding", "bbox": {"l": 142.612, "t": 436.18454, "r": 294.04724, "b": 444.55917, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "Picture", "bbox": {"l": 78.207001, "t": 447.18839, "r": 102.79287, "b": 455.52713, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "or", "bbox": {"l": 105.245, "t": 447.14352, "r": 113.09956999999999, "b": 455.51815999999997, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Table", "bbox": {"l": 115.341, "t": 447.18839, "r": 134.40356, "b": 455.52713, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": ".", "bbox": {"l": 134.403, "t": 447.14352, "r": 136.37561, "b": 455.51815999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "list_item", "bbox": {"l": 64.708, "t": 458.1015300000001, "r": 294.04599, "b": 477.43518, "coord_origin": "TOPLEFT"}, "confidence": 0.9426738023757935, "cells": [{"id": 53, "text": "(4)", "bbox": {"l": 64.708, "t": 458.1015300000001, "r": 74.220215, "b": 466.47617, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "Connected sub-pictures are grouped together in one", "bbox": {"l": 76.461555, "t": 458.1015300000001, "r": 267.46786, "b": 466.47617, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "Picture", "bbox": {"l": 269.70599, "t": 458.14639, "r": 294.04599, "b": 466.48514, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "object.", "bbox": {"l": 78.207001, "t": 469.06055, "r": 102.29972, "b": 477.43518, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "list_item", "bbox": {"l": 64.708, "t": 480.01953, "r": 264.50571, "b": 488.40314, "coord_origin": "TOPLEFT"}, "confidence": 0.9147457480430603, "cells": [{"id": 57, "text": "(5)", "bbox": {"l": 64.708, "t": 480.01953, "r": 74.345383, "b": 488.39417, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Formula numbers are included in a", "bbox": {"l": 76.616203, "t": 480.01953, "r": 206.13503, "b": 488.39417, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Formula", "bbox": {"l": 208.38, "t": 480.06439, "r": 238.12155, "b": 488.40314, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "object.", "bbox": {"l": 240.41300999999999, "t": 480.01953, "r": 264.50571, "b": 488.39417, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "list_item", "bbox": {"l": 64.708008, "t": 490.97852, "r": 294.04617, "b": 521.27118, "coord_origin": "TOPLEFT"}, "confidence": 0.9544308185577393, "cells": [{"id": 61, "text": "(6)", "bbox": {"l": 64.708008, "t": 490.97852, "r": 74.564522, "b": 499.35315, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "Emphasised text (e.g. in italic or bold) at the beginning of", "bbox": {"l": 76.886978, "t": 490.97852, "r": 294.04617, "b": 499.35315, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "a paragraph is not considered a", "bbox": {"l": 78.207001, "t": 501.93753, "r": 200.34819, "b": 510.31216, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "Section-header", "bbox": {"l": 203.66701, "t": 501.98239, "r": 256.57504, "b": 510.32114, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": ", unless it", "bbox": {"l": 256.57401, "t": 501.93753, "r": 294.04401, "b": 510.31216, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "appears exclusively on its own line.", "bbox": {"l": 78.207001, "t": 512.8965499999999, "r": 208.13017, "b": 521.27118, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 53.528999, "t": 532.9505300000001, "r": 295.56253, "b": 574.20117, "coord_origin": "TOPLEFT"}, "confidence": 0.9811431169509888, "cells": [{"id": 67, "text": "The complete annotation guideline is over 100 pages long and a", "bbox": {"l": 53.528999, "t": 532.9505300000001, "r": 294.04337, "b": 541.32516, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "detailed description is obviously out of scope for this paper. Never-", "bbox": {"l": 53.79800000000001, "t": 543.90855, "r": 295.56253, "b": 552.28317, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "theless, it will be made publicly available alongside with DocLayNet", "bbox": {"l": 53.79800000000001, "t": 554.8675499999999, "r": 294.04538, "b": 563.24217, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "for future reference.", "bbox": {"l": 53.79800000000001, "t": 565.82655, "r": 127.2418, "b": 574.20117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 53.79800000000001, "t": 576.66899, "r": 295.56226, "b": 705.708176, "coord_origin": "TOPLEFT"}, "confidence": 0.9864389896392822, "cells": [{"id": 71, "text": "Phase 3: Training.", "bbox": {"l": 63.76100199999999, "t": 576.66899, "r": 136.7744, "b": 585.14224, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "After a first trial with a small group of peo-", "bbox": {"l": 139.008, "t": 576.7855500000001, "r": 295.56226, "b": 585.16017, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "ple, we realised that providing the annotation guideline and a set of", "bbox": {"l": 53.79800000000001, "t": 587.74455, "r": 294.04532, "b": 596.1191699999999, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "random practice pages did not yield the desired quality level for lay-", "bbox": {"l": 53.79800000000001, "t": 598.70355, "r": 295.55676, "b": 607.07817, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "out annotation. Therefore we prepared a subset of pages with two", "bbox": {"l": 53.79800000000001, "t": 609.66255, "r": 294.04605, "b": 618.0371700000001, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "different complexity levels, each with a practice and an exam part.", "bbox": {"l": 53.79800000000001, "t": 620.6215500000001, "r": 295.42377, "b": 628.99617, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "974 pages were reference-annotated by one proficient core team", "bbox": {"l": 53.79800000000001, "t": 631.58055, "r": 294.04712, "b": 639.95517, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "member. Annotation staff were then given the task to annotate the", "bbox": {"l": 53.79800000000001, "t": 642.53955, "r": 294.04922, "b": 650.91417, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "same subsets (blinded from the reference). By comparing the an-", "bbox": {"l": 53.79800000000001, "t": 653.49855, "r": 295.55618, "b": 661.87317, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "notations of each staff member with the reference annotations, we", "bbox": {"l": 53.79800000000001, "t": 664.45655, "r": 294.04874, "b": 672.83117, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "could quantify how closely their annotations matched the reference.", "bbox": {"l": 53.79800000000001, "t": 675.4155499999999, "r": 295.42496, "b": 683.79017, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "Only after passing two exam levels with high annotation quality,", "bbox": {"l": 53.79800000000001, "t": 686.37456, "r": 295.0274, "b": 694.749176, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "staff were admitted into the production phase. Practice iterations", "bbox": {"l": 53.79800000000001, "t": 697.333557, "r": 294.04114, "b": 705.708176, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "picture", "bbox": {"l": 315.960205078125, "t": 85.33881378173828, "r": 559.396484375, "b": 459.68084716796875, "coord_origin": "TOPLEFT"}, "confidence": 0.7264115214347839, "cells": [{"id": 84, "text": "1ef23f5e6d7f10d393f9947e8208285dce9ae87250ac483ac4b4a59d51b4e037", "bbox": {"l": 340.00214, "t": 179.79296999999997, "r": 416.20551, "b": 181.90972999999997, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "Compliant with guidelines", "bbox": {"l": 339.38269, "t": 85.19066999999995, "r": 417.83722, "b": 92.28399999999999, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Plausible but invalid alternative", "bbox": {"l": 451.42834, "t": 85.19066999999995, "r": 546.22913, "b": 92.28399999999999, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Borderline case: Two guideline-compliant alternatives", "bbox": {"l": 350.33701, "t": 364.85706, "r": 513.48035, "b": 371.95035000000007, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "03c31a2ee1ed1b583c28957f475ee545d144e1b5a264dc4dd068c8d2f6a64860", "bbox": {"l": 340.00201, "t": 245.07385, "r": 416.20538, "b": 247.19061, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "1a5cd524f1844c1260c8e8c073e1f442423c264583212b0d0b6626fc780e6ed4", "bbox": {"l": 340.00201, "t": 359.12488, "r": 416.20538, "b": 361.24167, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "A", "bbox": {"l": 322.19424, "t": 98.34105999999997, "r": 326.01498, "b": 104.25214000000005, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "B", "bbox": {"l": 322.19424, "t": 186.99103000000002, "r": 326.01498, "b": 192.90204000000006, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "C", "bbox": {"l": 322.19424, "t": 253.54192999999998, "r": 326.01498, "b": 259.453, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "D", "bbox": {"l": 322.19424, "t": 367.08495999999997, "r": 326.01498, "b": 372.996, "coord_origin": "TOPLEFT"}}], "children": [{"id": 16, "label": "text", "bbox": {"l": 340.00214, "t": 179.79296999999997, "r": 416.20551, "b": 181.90972999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "1ef23f5e6d7f10d393f9947e8208285dce9ae87250ac483ac4b4a59d51b4e037", "bbox": {"l": 340.00214, "t": 179.79296999999997, "r": 416.20551, "b": 181.90972999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 339.38269, "t": 85.19066999999995, "r": 417.83722, "b": 92.28399999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "Compliant with guidelines", "bbox": {"l": 339.38269, "t": 85.19066999999995, "r": 417.83722, "b": 92.28399999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 451.42834, "t": 85.19066999999995, "r": 546.22913, "b": 92.28399999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "Plausible but invalid alternative", "bbox": {"l": 451.42834, "t": 85.19066999999995, "r": 546.22913, "b": 92.28399999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 350.33701, "t": 364.85706, "r": 513.48035, "b": 371.95035000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "Borderline case: Two guideline-compliant alternatives", "bbox": {"l": 350.33701, "t": 364.85706, "r": 513.48035, "b": 371.95035000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 340.00201, "t": 245.07385, "r": 416.20538, "b": 247.19061, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "03c31a2ee1ed1b583c28957f475ee545d144e1b5a264dc4dd068c8d2f6a64860", "bbox": {"l": 340.00201, "t": 245.07385, "r": 416.20538, "b": 247.19061, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 340.00201, "t": 359.12488, "r": 416.20538, "b": 361.24167, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "1a5cd524f1844c1260c8e8c073e1f442423c264583212b0d0b6626fc780e6ed4", "bbox": {"l": 340.00201, "t": 359.12488, "r": 416.20538, "b": 361.24167, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 322.19424, "t": 98.34105999999997, "r": 326.01498, "b": 104.25214000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "A", "bbox": {"l": 322.19424, "t": 98.34105999999997, "r": 326.01498, "b": 104.25214000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 322.19424, "t": 186.99103000000002, "r": 326.01498, "b": 192.90204000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "B", "bbox": {"l": 322.19424, "t": 186.99103000000002, "r": 326.01498, "b": 192.90204000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 322.19424, "t": 253.54192999999998, "r": 326.01498, "b": 259.453, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "C", "bbox": {"l": 322.19424, "t": 253.54192999999998, "r": 326.01498, "b": 259.453, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 322.19424, "t": 367.08495999999997, "r": 326.01498, "b": 372.996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "D", "bbox": {"l": 322.19424, "t": 367.08495999999997, "r": 326.01498, "b": 372.996, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 22, "label": "text", "bbox": {"l": 400.12842, "t": 458.44327000000004, "r": 476.33178999999996, "b": 460.5600600000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "05237a14f2524e3f53c8454b074409d05078038a6a36b770fcc8ec7e540deae0", "bbox": {"l": 400.12842, "t": 458.44327000000004, "r": 476.33178999999996, "b": 460.5600600000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "caption", "bbox": {"l": 317.95499, "t": 473.49399, "r": 559.80579, "b": 503.88519, "coord_origin": "TOPLEFT"}, "confidence": 0.8873711824417114, "cells": [{"id": 95, "text": "Figure 4: Examples of plausible annotation alternatives for", "bbox": {"l": 317.95499, "t": 473.49399, "r": 558.3891, "b": 481.96722, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "the same page. Criteria in our annotation guideline can re-", "bbox": {"l": 317.95499, "t": 484.45297, "r": 559.80579, "b": 492.92621, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "solve cases A to C, while the case D remains ambiguous.", "bbox": {"l": 317.95499, "t": 495.41196, "r": 544.14148, "b": 503.88519, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "text", "bbox": {"l": 317.62299, "t": 525.49753, "r": 558.20435, "b": 544.83118, "coord_origin": "TOPLEFT"}, "confidence": 0.9611718654632568, "cells": [{"id": 98, "text": "were carried out over a timeframe of 12 weeks, after which 8 of the", "bbox": {"l": 317.62299, "t": 525.49753, "r": 558.20435, "b": 533.87216, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "40", "bbox": {"l": 317.74899, "t": 536.45656, "r": 326.07019, "b": 544.83118, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "initially allocated annotators did not pass the bar.", "bbox": {"l": 328.3071, "t": 536.45656, "r": 509.11896, "b": 544.83118, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 317.62299, "t": 547.299, "r": 559.7149, "b": 709.2151719999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9829543232917786, "cells": [{"id": 101, "text": "Phase 4: Production annotation.", "bbox": {"l": 327.918, "t": 547.299, "r": 456.80109000000004, "b": 555.77225, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "The previously selected 80K", "bbox": {"l": 458.7120100000001, "t": 547.41556, "r": 558.48926, "b": 555.79018, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "pages were annotated with the defined 11 class labels by 32 annota-", "bbox": {"l": 317.95499, "t": 558.37456, "r": 559.71368, "b": 566.74918, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "tors. This production phase took around three months to complete.", "bbox": {"l": 317.95499, "t": 569.33356, "r": 559.58124, "b": 577.7081800000001, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "All annotations were created online through CCS, which visualises", "bbox": {"l": 317.64099, "t": 580.29256, "r": 558.20386, "b": 588.66718, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "the programmatic PDF text-cells as an overlay on the page. The page", "bbox": {"l": 317.95499, "t": 591.25156, "r": 558.20221, "b": 599.62617, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "annotation are obtained by drawing rectangular bounding-boxes,", "bbox": {"l": 317.95499, "t": 602.20955, "r": 559.18457, "b": 610.58417, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "as shown in Figure 3. With regard to the annotation practices, we", "bbox": {"l": 317.95499, "t": 613.16855, "r": 558.20197, "b": 621.54317, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "implemented a few constraints and capabilities on the tooling level.", "bbox": {"l": 317.95499, "t": 624.12755, "r": 559.58197, "b": 632.50217, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "First, we only allow non-overlapping, vertically oriented, rectangu-", "bbox": {"l": 317.95499, "t": 635.08655, "r": 559.71411, "b": 643.46117, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "lar boxes. For the large majority of documents, this constraint was", "bbox": {"l": 317.95499, "t": 646.04555, "r": 558.20557, "b": 654.42017, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "sufficient and it speeds up the annotation considerably in compar-", "bbox": {"l": 317.95499, "t": 657.00455, "r": 559.7149, "b": 665.3791699999999, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "ison with arbitrary segmentation shapes. Second, annotator staff", "bbox": {"l": 317.95499, "t": 667.9635499999999, "r": 558.19849, "b": 676.33817, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "were not able to see each other\u2019s annotations. This was enforced by", "bbox": {"l": 317.62299, "t": 678.92255, "r": 558.43268, "b": 687.29717, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "design to avoid any bias in the annotation, which could skew the", "bbox": {"l": 317.95499, "t": 689.8815500000001, "r": 558.19806, "b": 698.256172, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "numbers of the inter-annotator agreement (see Table 1). We wanted", "bbox": {"l": 317.95499, "t": 700.840553, "r": 558.20227, "b": 709.2151719999999, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_header", "id": 13, "page_no": 4, "cluster": {"id": 13, "label": "page_header", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.8877827525138855, "cells": [{"id": 0, "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis"}, {"label": "page_header", "id": 15, "page_no": 4, "cluster": {"id": 15, "label": "page_header", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.8534670472145081, "cells": [{"id": 1, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA"}, {"label": "text", "id": 12, "page_no": 4, "cluster": {"id": 12, "label": "text", "bbox": {"l": 53.79800000000001, "t": 87.36352999999997, "r": 294.04541, "b": 106.70612000000006, "coord_origin": "TOPLEFT"}, "confidence": 0.9022762179374695, "cells": [{"id": 2, "text": "the textual content of an element, which goes beyond visual layout", "bbox": {"l": 53.79800000000001, "t": 87.36352999999997, "r": 294.04541, "b": 95.73816, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "recognition, in particular outside the", "bbox": {"l": 53.79800000000001, "t": 98.32250999999997, "r": 188.1326, "b": 106.69713999999999, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Scientific Articles", "bbox": {"l": 190.37401, "t": 98.36737000000005, "r": 251.25586999999996, "b": 106.70612000000006, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "category.", "bbox": {"l": 253.70801, "t": 98.32250999999997, "r": 287.01816, "b": 106.69713999999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "the textual content of an element, which goes beyond visual layout recognition, in particular outside the Scientific Articles category."}, {"label": "text", "id": 4, "page_no": 4, "cluster": {"id": 4, "label": "text", "bbox": {"l": 53.79800000000001, "t": 109.28156000000001, "r": 295.55923, "b": 249.16216999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9711344838142395, "cells": [{"id": 6, "text": "At first sight, the task of visual document-layout interpretation", "bbox": {"l": 63.76100199999999, "t": 109.28156000000001, "r": 294.04257, "b": 117.65618999999992, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "appears intuitive enough to obtain plausible annotations in most", "bbox": {"l": 53.79800000000001, "t": 120.24054000000001, "r": 294.04266, "b": 128.61517000000003, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "cases. However, during early trial-runs in the core team, we ob-", "bbox": {"l": 53.79800000000001, "t": 131.19854999999995, "r": 295.55615, "b": 139.57317999999998, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "served many cases in which annotators use different annotation", "bbox": {"l": 53.79800000000001, "t": 142.15752999999995, "r": 294.04715, "b": 150.53216999999995, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "styles, especially for documents with challenging layouts. For ex-", "bbox": {"l": 53.79800000000001, "t": 153.11652000000004, "r": 295.55923, "b": 161.49114999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "ample, if a figure is presented with subfigures, one annotator might", "bbox": {"l": 53.79800000000001, "t": 164.07556, "r": 294.04535, "b": 172.4502, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "draw a single figure bounding-box, while another might annotate", "bbox": {"l": 53.79800000000001, "t": 175.03454999999997, "r": 294.04803, "b": 183.40918, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "each subfigure separately. The same applies for lists, where one", "bbox": {"l": 53.79800000000001, "t": 185.99352999999996, "r": 294.04709, "b": 194.36816, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "might annotate all list items in one block or each list item sep-", "bbox": {"l": 53.79800000000001, "t": 196.95250999999996, "r": 295.55612, "b": 205.32714999999996, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "arately. In essence, we observed that challenging layouts would", "bbox": {"l": 53.79800000000001, "t": 207.91156, "r": 294.04712, "b": 216.28619000000003, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "be annotated in different but plausible ways. To illustrate this, we", "bbox": {"l": 53.79800000000001, "t": 218.87054, "r": 294.04495, "b": 227.24518, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "show in Figure 4 multiple examples of plausible but inconsistent", "bbox": {"l": 53.79800000000001, "t": 229.82952999999998, "r": 294.04712, "b": 238.20416, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "annotations on the same pages.", "bbox": {"l": 53.79800000000001, "t": 240.78754000000004, "r": 168.61276, "b": 249.16216999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "At first sight, the task of visual document-layout interpretation appears intuitive enough to obtain plausible annotations in most cases. However, during early trial-runs in the core team, we observed many cases in which annotators use different annotation styles, especially for documents with challenging layouts. For example, if a figure is presented with subfigures, one annotator might draw a single figure bounding-box, while another might annotate each subfigure separately. The same applies for lists, where one might annotate all list items in one block or each list item separately. In essence, we observed that challenging layouts would be annotated in different but plausible ways. To illustrate this, we show in Figure 4 multiple examples of plausible but inconsistent annotations on the same pages."}, {"label": "text", "id": 1, "page_no": 4, "cluster": {"id": 1, "label": "text", "bbox": {"l": 53.79800000000001, "t": 251.74652000000003, "r": 295.56006, "b": 336.83417, "coord_origin": "TOPLEFT"}, "confidence": 0.985905110836029, "cells": [{"id": 19, "text": "Obviously, this inconsistency in annotations is not desirable for", "bbox": {"l": 63.76100199999999, "t": 251.74652000000003, "r": 294.21884, "b": 260.12114999999994, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "datasets which are intended to be used for model training. To min-", "bbox": {"l": 53.79800000000001, "t": 262.70556999999997, "r": 295.56006, "b": 271.0802, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "imise these inconsistencies, we created a detailed annotation guide-", "bbox": {"l": 53.79800000000001, "t": 273.66454999999996, "r": 295.55676, "b": 282.03918, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "line. While perfect consistency across 40 annotation staff members", "bbox": {"l": 53.79800000000001, "t": 284.62354, "r": 294.04922, "b": 292.99817, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "is clearly not possible to achieve, we saw a huge improvement in", "bbox": {"l": 53.79800000000001, "t": 295.5825500000001, "r": 294.04343, "b": 303.95717999999994, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "annotation consistency after the introduction of our annotation", "bbox": {"l": 53.79800000000001, "t": 306.54153, "r": 294.04712, "b": 314.91617, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "guideline. A few selected, non-trivial highlights of the guideline", "bbox": {"l": 53.79800000000001, "t": 317.50055, "r": 294.04718, "b": 325.87518, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "are:", "bbox": {"l": 53.79800000000001, "t": 328.4595299999999, "r": 67.28347, "b": 336.83417, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Obviously, this inconsistency in annotations is not desirable for datasets which are intended to be used for model training. To minimise these inconsistencies, we created a detailed annotation guideline. While perfect consistency across 40 annotation staff members is clearly not possible to achieve, we saw a huge improvement in annotation consistency after the introduction of our annotation guideline. A few selected, non-trivial highlights of the guideline are:"}, {"label": "list_item", "id": 5, "page_no": 4, "cluster": {"id": 5, "label": "list_item", "bbox": {"l": 64.708, "t": 348.51254, "r": 294.0462, "b": 389.77313, "coord_origin": "TOPLEFT"}, "confidence": 0.9691526293754578, "cells": [{"id": 27, "text": "(1)", "bbox": {"l": 64.708, "t": 348.51254, "r": 74.626793, "b": 356.88718, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Every list-item is an individual object instance with class", "bbox": {"l": 76.963936, "t": 348.51254, "r": 294.0462, "b": 356.88718, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "label", "bbox": {"l": 78.207001, "t": 359.47153, "r": 95.730484, "b": 367.84616, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "List-item", "bbox": {"l": 97.976997, "t": 359.51639, "r": 130.17131, "b": 367.85513, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": ". This definition is different from PubLayNet", "bbox": {"l": 130.17101, "t": 359.47153, "r": 294.04053, "b": 367.84616, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "and DocBank, where all list-items are grouped together into", "bbox": {"l": 78.207001, "t": 370.43054, "r": 294.04385, "b": 378.80518, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "one", "bbox": {"l": 78.207001, "t": 381.38953000000004, "r": 91.593834, "b": 389.76416, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "List", "bbox": {"l": 93.834999, "t": 381.43439000000006, "r": 106.88111, "b": 389.77313, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "object.", "bbox": {"l": 109.629, "t": 381.38953000000004, "r": 133.72173, "b": 389.76416, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "(1) Every list-item is an individual object instance with class label List-item . This definition is different from PubLayNet and DocBank, where all list-items are grouped together into one List object."}, {"label": "list_item", "id": 7, "page_no": 4, "cluster": {"id": 7, "label": "list_item", "bbox": {"l": 64.707993, "t": 392.34851, "r": 295.56372, "b": 433.60016, "coord_origin": "TOPLEFT"}, "confidence": 0.9591284990310669, "cells": [{"id": 36, "text": "(2)", "bbox": {"l": 64.707993, "t": 392.34851, "r": 75.097656, "b": 400.72313999999994, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "A", "bbox": {"l": 77.545731, "t": 392.34851, "r": 84.351402, "b": 400.72313999999994, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "List-item", "bbox": {"l": 86.584, "t": 392.39339999999993, "r": 118.01329000000001, "b": 400.73215, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "is a paragraph with hanging indentation. Single-", "bbox": {"l": 120.26899999999999, "t": 392.34854, "r": 295.55695, "b": 400.72317999999996, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "line elements can qualify as", "bbox": {"l": 78.207001, "t": 403.30753, "r": 181.80978, "b": 411.68216, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "List-item", "bbox": {"l": 184.175, "t": 403.35239, "r": 216.68806000000004, "b": 411.69113, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "if the neighbour ele-", "bbox": {"l": 219.078, "t": 403.30753, "r": 295.56372, "b": 411.68216, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "ments expose hanging indentation. Bullet or enumeration", "bbox": {"l": 78.207001, "t": 414.2665400000001, "r": 294.04617, "b": 422.64116999999993, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "symbols are not a requirement.", "bbox": {"l": 78.207001, "t": 425.22552, "r": 192.00853, "b": 433.60016, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "(2) A List-item is a paragraph with hanging indentation. Singleline elements can qualify as List-item if the neighbour elements expose hanging indentation. Bullet or enumeration symbols are not a requirement."}, {"label": "list_item", "id": 10, "page_no": 4, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 64.708, "t": 436.18451000000005, "r": 294.04724, "b": 455.52713, "coord_origin": "TOPLEFT"}, "confidence": 0.9413429498672485, "cells": [{"id": 45, "text": "(3)", "bbox": {"l": 64.708, "t": 436.18451000000005, "r": 74.483009, "b": 444.55914, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "For every", "bbox": {"l": 76.786255, "t": 436.18451000000005, "r": 112.61566, "b": 444.55914, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "Caption", "bbox": {"l": 114.861, "t": 436.2294, "r": 142.61249, "b": 444.56815000000006, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": ", there must be exactly one corresponding", "bbox": {"l": 142.612, "t": 436.18454, "r": 294.04724, "b": 444.55917, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "Picture", "bbox": {"l": 78.207001, "t": 447.18839, "r": 102.79287, "b": 455.52713, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "or", "bbox": {"l": 105.245, "t": 447.14352, "r": 113.09956999999999, "b": 455.51815999999997, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Table", "bbox": {"l": 115.341, "t": 447.18839, "r": 134.40356, "b": 455.52713, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": ".", "bbox": {"l": 134.403, "t": 447.14352, "r": 136.37561, "b": 455.51815999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "(3) For every Caption , there must be exactly one corresponding Picture or Table ."}, {"label": "list_item", "id": 9, "page_no": 4, "cluster": {"id": 9, "label": "list_item", "bbox": {"l": 64.708, "t": 458.1015300000001, "r": 294.04599, "b": 477.43518, "coord_origin": "TOPLEFT"}, "confidence": 0.9426738023757935, "cells": [{"id": 53, "text": "(4)", "bbox": {"l": 64.708, "t": 458.1015300000001, "r": 74.220215, "b": 466.47617, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "Connected sub-pictures are grouped together in one", "bbox": {"l": 76.461555, "t": 458.1015300000001, "r": 267.46786, "b": 466.47617, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "Picture", "bbox": {"l": 269.70599, "t": 458.14639, "r": 294.04599, "b": 466.48514, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "object.", "bbox": {"l": 78.207001, "t": 469.06055, "r": 102.29972, "b": 477.43518, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "(4) Connected sub-pictures are grouped together in one Picture object."}, {"label": "list_item", "id": 11, "page_no": 4, "cluster": {"id": 11, "label": "list_item", "bbox": {"l": 64.708, "t": 480.01953, "r": 264.50571, "b": 488.40314, "coord_origin": "TOPLEFT"}, "confidence": 0.9147457480430603, "cells": [{"id": 57, "text": "(5)", "bbox": {"l": 64.708, "t": 480.01953, "r": 74.345383, "b": 488.39417, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Formula numbers are included in a", "bbox": {"l": 76.616203, "t": 480.01953, "r": 206.13503, "b": 488.39417, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Formula", "bbox": {"l": 208.38, "t": 480.06439, "r": 238.12155, "b": 488.40314, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "object.", "bbox": {"l": 240.41300999999999, "t": 480.01953, "r": 264.50571, "b": 488.39417, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "(5) Formula numbers are included in a Formula object."}, {"label": "list_item", "id": 8, "page_no": 4, "cluster": {"id": 8, "label": "list_item", "bbox": {"l": 64.708008, "t": 490.97852, "r": 294.04617, "b": 521.27118, "coord_origin": "TOPLEFT"}, "confidence": 0.9544308185577393, "cells": [{"id": 61, "text": "(6)", "bbox": {"l": 64.708008, "t": 490.97852, "r": 74.564522, "b": 499.35315, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "Emphasised text (e.g. in italic or bold) at the beginning of", "bbox": {"l": 76.886978, "t": 490.97852, "r": 294.04617, "b": 499.35315, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "a paragraph is not considered a", "bbox": {"l": 78.207001, "t": 501.93753, "r": 200.34819, "b": 510.31216, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "Section-header", "bbox": {"l": 203.66701, "t": 501.98239, "r": 256.57504, "b": 510.32114, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": ", unless it", "bbox": {"l": 256.57401, "t": 501.93753, "r": 294.04401, "b": 510.31216, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "appears exclusively on its own line.", "bbox": {"l": 78.207001, "t": 512.8965499999999, "r": 208.13017, "b": 521.27118, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "(6) Emphasised text (e.g. in italic or bold) at the beginning of a paragraph is not considered a Section-header , unless it appears exclusively on its own line."}, {"label": "text", "id": 3, "page_no": 4, "cluster": {"id": 3, "label": "text", "bbox": {"l": 53.528999, "t": 532.9505300000001, "r": 295.56253, "b": 574.20117, "coord_origin": "TOPLEFT"}, "confidence": 0.9811431169509888, "cells": [{"id": 67, "text": "The complete annotation guideline is over 100 pages long and a", "bbox": {"l": 53.528999, "t": 532.9505300000001, "r": 294.04337, "b": 541.32516, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "detailed description is obviously out of scope for this paper. Never-", "bbox": {"l": 53.79800000000001, "t": 543.90855, "r": 295.56253, "b": 552.28317, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "theless, it will be made publicly available alongside with DocLayNet", "bbox": {"l": 53.79800000000001, "t": 554.8675499999999, "r": 294.04538, "b": 563.24217, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "for future reference.", "bbox": {"l": 53.79800000000001, "t": 565.82655, "r": 127.2418, "b": 574.20117, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The complete annotation guideline is over 100 pages long and a detailed description is obviously out of scope for this paper. Nevertheless, it will be made publicly available alongside with DocLayNet for future reference."}, {"label": "text", "id": 0, "page_no": 4, "cluster": {"id": 0, "label": "text", "bbox": {"l": 53.79800000000001, "t": 576.66899, "r": 295.56226, "b": 705.708176, "coord_origin": "TOPLEFT"}, "confidence": 0.9864389896392822, "cells": [{"id": 71, "text": "Phase 3: Training.", "bbox": {"l": 63.76100199999999, "t": 576.66899, "r": 136.7744, "b": 585.14224, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "After a first trial with a small group of peo-", "bbox": {"l": 139.008, "t": 576.7855500000001, "r": 295.56226, "b": 585.16017, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "ple, we realised that providing the annotation guideline and a set of", "bbox": {"l": 53.79800000000001, "t": 587.74455, "r": 294.04532, "b": 596.1191699999999, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "random practice pages did not yield the desired quality level for lay-", "bbox": {"l": 53.79800000000001, "t": 598.70355, "r": 295.55676, "b": 607.07817, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "out annotation. Therefore we prepared a subset of pages with two", "bbox": {"l": 53.79800000000001, "t": 609.66255, "r": 294.04605, "b": 618.0371700000001, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "different complexity levels, each with a practice and an exam part.", "bbox": {"l": 53.79800000000001, "t": 620.6215500000001, "r": 295.42377, "b": 628.99617, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "974 pages were reference-annotated by one proficient core team", "bbox": {"l": 53.79800000000001, "t": 631.58055, "r": 294.04712, "b": 639.95517, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "member. Annotation staff were then given the task to annotate the", "bbox": {"l": 53.79800000000001, "t": 642.53955, "r": 294.04922, "b": 650.91417, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "same subsets (blinded from the reference). By comparing the an-", "bbox": {"l": 53.79800000000001, "t": 653.49855, "r": 295.55618, "b": 661.87317, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "notations of each staff member with the reference annotations, we", "bbox": {"l": 53.79800000000001, "t": 664.45655, "r": 294.04874, "b": 672.83117, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "could quantify how closely their annotations matched the reference.", "bbox": {"l": 53.79800000000001, "t": 675.4155499999999, "r": 295.42496, "b": 683.79017, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "Only after passing two exam levels with high annotation quality,", "bbox": {"l": 53.79800000000001, "t": 686.37456, "r": 295.0274, "b": 694.749176, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "staff were admitted into the production phase. Practice iterations", "bbox": {"l": 53.79800000000001, "t": 697.333557, "r": 294.04114, "b": 705.708176, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Phase 3: Training. After a first trial with a small group of people, we realised that providing the annotation guideline and a set of random practice pages did not yield the desired quality level for layout annotation. Therefore we prepared a subset of pages with two different complexity levels, each with a practice and an exam part. 974 pages were reference-annotated by one proficient core team member. Annotation staff were then given the task to annotate the same subsets (blinded from the reference). By comparing the annotations of each staff member with the reference annotations, we could quantify how closely their annotations matched the reference. Only after passing two exam levels with high annotation quality, staff were admitted into the production phase. Practice iterations"}, {"label": "picture", "id": 16, "page_no": 4, "cluster": {"id": 16, "label": "picture", "bbox": {"l": 315.960205078125, "t": 85.33881378173828, "r": 559.396484375, "b": 459.68084716796875, "coord_origin": "TOPLEFT"}, "confidence": 0.7264115214347839, "cells": [{"id": 84, "text": "1ef23f5e6d7f10d393f9947e8208285dce9ae87250ac483ac4b4a59d51b4e037", "bbox": {"l": 340.00214, "t": 179.79296999999997, "r": 416.20551, "b": 181.90972999999997, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "Compliant with guidelines", "bbox": {"l": 339.38269, "t": 85.19066999999995, "r": 417.83722, "b": 92.28399999999999, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Plausible but invalid alternative", "bbox": {"l": 451.42834, "t": 85.19066999999995, "r": 546.22913, "b": 92.28399999999999, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Borderline case: Two guideline-compliant alternatives", "bbox": {"l": 350.33701, "t": 364.85706, "r": 513.48035, "b": 371.95035000000007, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "03c31a2ee1ed1b583c28957f475ee545d144e1b5a264dc4dd068c8d2f6a64860", "bbox": {"l": 340.00201, "t": 245.07385, "r": 416.20538, "b": 247.19061, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "1a5cd524f1844c1260c8e8c073e1f442423c264583212b0d0b6626fc780e6ed4", "bbox": {"l": 340.00201, "t": 359.12488, "r": 416.20538, "b": 361.24167, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "A", "bbox": {"l": 322.19424, "t": 98.34105999999997, "r": 326.01498, "b": 104.25214000000005, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "B", "bbox": {"l": 322.19424, "t": 186.99103000000002, "r": 326.01498, "b": 192.90204000000006, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "C", "bbox": {"l": 322.19424, "t": 253.54192999999998, "r": 326.01498, "b": 259.453, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "D", "bbox": {"l": 322.19424, "t": 367.08495999999997, "r": 326.01498, "b": 372.996, "coord_origin": "TOPLEFT"}}], "children": [{"id": 16, "label": "text", "bbox": {"l": 340.00214, "t": 179.79296999999997, "r": 416.20551, "b": 181.90972999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "1ef23f5e6d7f10d393f9947e8208285dce9ae87250ac483ac4b4a59d51b4e037", "bbox": {"l": 340.00214, "t": 179.79296999999997, "r": 416.20551, "b": 181.90972999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 339.38269, "t": 85.19066999999995, "r": 417.83722, "b": 92.28399999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "Compliant with guidelines", "bbox": {"l": 339.38269, "t": 85.19066999999995, "r": 417.83722, "b": 92.28399999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 451.42834, "t": 85.19066999999995, "r": 546.22913, "b": 92.28399999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "Plausible but invalid alternative", "bbox": {"l": 451.42834, "t": 85.19066999999995, "r": 546.22913, "b": 92.28399999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 350.33701, "t": 364.85706, "r": 513.48035, "b": 371.95035000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "Borderline case: Two guideline-compliant alternatives", "bbox": {"l": 350.33701, "t": 364.85706, "r": 513.48035, "b": 371.95035000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 340.00201, "t": 245.07385, "r": 416.20538, "b": 247.19061, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "03c31a2ee1ed1b583c28957f475ee545d144e1b5a264dc4dd068c8d2f6a64860", "bbox": {"l": 340.00201, "t": 245.07385, "r": 416.20538, "b": 247.19061, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 340.00201, "t": 359.12488, "r": 416.20538, "b": 361.24167, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "1a5cd524f1844c1260c8e8c073e1f442423c264583212b0d0b6626fc780e6ed4", "bbox": {"l": 340.00201, "t": 359.12488, "r": 416.20538, "b": 361.24167, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 322.19424, "t": 98.34105999999997, "r": 326.01498, "b": 104.25214000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "A", "bbox": {"l": 322.19424, "t": 98.34105999999997, "r": 326.01498, "b": 104.25214000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 322.19424, "t": 186.99103000000002, "r": 326.01498, "b": 192.90204000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "B", "bbox": {"l": 322.19424, "t": 186.99103000000002, "r": 326.01498, "b": 192.90204000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 322.19424, "t": 253.54192999999998, "r": 326.01498, "b": 259.453, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "C", "bbox": {"l": 322.19424, "t": 253.54192999999998, "r": 326.01498, "b": 259.453, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 322.19424, "t": 367.08495999999997, "r": 326.01498, "b": 372.996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "D", "bbox": {"l": 322.19424, "t": 367.08495999999997, "r": 326.01498, "b": 372.996, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "text", "id": 22, "page_no": 4, "cluster": {"id": 22, "label": "text", "bbox": {"l": 400.12842, "t": 458.44327000000004, "r": 476.33178999999996, "b": 460.5600600000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "05237a14f2524e3f53c8454b074409d05078038a6a36b770fcc8ec7e540deae0", "bbox": {"l": 400.12842, "t": 458.44327000000004, "r": 476.33178999999996, "b": 460.5600600000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "05237a14f2524e3f53c8454b074409d05078038a6a36b770fcc8ec7e540deae0"}, {"label": "caption", "id": 14, "page_no": 4, "cluster": {"id": 14, "label": "caption", "bbox": {"l": 317.95499, "t": 473.49399, "r": 559.80579, "b": 503.88519, "coord_origin": "TOPLEFT"}, "confidence": 0.8873711824417114, "cells": [{"id": 95, "text": "Figure 4: Examples of plausible annotation alternatives for", "bbox": {"l": 317.95499, "t": 473.49399, "r": 558.3891, "b": 481.96722, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "the same page. Criteria in our annotation guideline can re-", "bbox": {"l": 317.95499, "t": 484.45297, "r": 559.80579, "b": 492.92621, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "solve cases A to C, while the case D remains ambiguous.", "bbox": {"l": 317.95499, "t": 495.41196, "r": 544.14148, "b": 503.88519, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 4: Examples of plausible annotation alternatives for the same page. Criteria in our annotation guideline can resolve cases A to C, while the case D remains ambiguous."}, {"label": "text", "id": 6, "page_no": 4, "cluster": {"id": 6, "label": "text", "bbox": {"l": 317.62299, "t": 525.49753, "r": 558.20435, "b": 544.83118, "coord_origin": "TOPLEFT"}, "confidence": 0.9611718654632568, "cells": [{"id": 98, "text": "were carried out over a timeframe of 12 weeks, after which 8 of the", "bbox": {"l": 317.62299, "t": 525.49753, "r": 558.20435, "b": 533.87216, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "40", "bbox": {"l": 317.74899, "t": 536.45656, "r": 326.07019, "b": 544.83118, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "initially allocated annotators did not pass the bar.", "bbox": {"l": 328.3071, "t": 536.45656, "r": 509.11896, "b": 544.83118, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "were carried out over a timeframe of 12 weeks, after which 8 of the 40 initially allocated annotators did not pass the bar."}, {"label": "text", "id": 2, "page_no": 4, "cluster": {"id": 2, "label": "text", "bbox": {"l": 317.62299, "t": 547.299, "r": 559.7149, "b": 709.2151719999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9829543232917786, "cells": [{"id": 101, "text": "Phase 4: Production annotation.", "bbox": {"l": 327.918, "t": 547.299, "r": 456.80109000000004, "b": 555.77225, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "The previously selected 80K", "bbox": {"l": 458.7120100000001, "t": 547.41556, "r": 558.48926, "b": 555.79018, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "pages were annotated with the defined 11 class labels by 32 annota-", "bbox": {"l": 317.95499, "t": 558.37456, "r": 559.71368, "b": 566.74918, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "tors. This production phase took around three months to complete.", "bbox": {"l": 317.95499, "t": 569.33356, "r": 559.58124, "b": 577.7081800000001, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "All annotations were created online through CCS, which visualises", "bbox": {"l": 317.64099, "t": 580.29256, "r": 558.20386, "b": 588.66718, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "the programmatic PDF text-cells as an overlay on the page. The page", "bbox": {"l": 317.95499, "t": 591.25156, "r": 558.20221, "b": 599.62617, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "annotation are obtained by drawing rectangular bounding-boxes,", "bbox": {"l": 317.95499, "t": 602.20955, "r": 559.18457, "b": 610.58417, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "as shown in Figure 3. With regard to the annotation practices, we", "bbox": {"l": 317.95499, "t": 613.16855, "r": 558.20197, "b": 621.54317, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "implemented a few constraints and capabilities on the tooling level.", "bbox": {"l": 317.95499, "t": 624.12755, "r": 559.58197, "b": 632.50217, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "First, we only allow non-overlapping, vertically oriented, rectangu-", "bbox": {"l": 317.95499, "t": 635.08655, "r": 559.71411, "b": 643.46117, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "lar boxes. For the large majority of documents, this constraint was", "bbox": {"l": 317.95499, "t": 646.04555, "r": 558.20557, "b": 654.42017, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "sufficient and it speeds up the annotation considerably in compar-", "bbox": {"l": 317.95499, "t": 657.00455, "r": 559.7149, "b": 665.3791699999999, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "ison with arbitrary segmentation shapes. Second, annotator staff", "bbox": {"l": 317.95499, "t": 667.9635499999999, "r": 558.19849, "b": 676.33817, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "were not able to see each other\u2019s annotations. This was enforced by", "bbox": {"l": 317.62299, "t": 678.92255, "r": 558.43268, "b": 687.29717, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "design to avoid any bias in the annotation, which could skew the", "bbox": {"l": 317.95499, "t": 689.8815500000001, "r": 558.19806, "b": 698.256172, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "numbers of the inter-annotator agreement (see Table 1). We wanted", "bbox": {"l": 317.95499, "t": 700.840553, "r": 558.20227, "b": 709.2151719999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Phase 4: Production annotation. The previously selected 80K pages were annotated with the defined 11 class labels by 32 annotators. This production phase took around three months to complete. All annotations were created online through CCS, which visualises the programmatic PDF text-cells as an overlay on the page. The page annotation are obtained by drawing rectangular bounding-boxes, as shown in Figure 3. With regard to the annotation practices, we implemented a few constraints and capabilities on the tooling level. First, we only allow non-overlapping, vertically oriented, rectangular boxes. For the large majority of documents, this constraint was sufficient and it speeds up the annotation considerably in comparison with arbitrary segmentation shapes. Second, annotator staff were not able to see each other\u2019s annotations. This was enforced by design to avoid any bias in the annotation, which could skew the numbers of the inter-annotator agreement (see Table 1). We wanted"}], "body": [{"label": "text", "id": 12, "page_no": 4, "cluster": {"id": 12, "label": "text", "bbox": {"l": 53.79800000000001, "t": 87.36352999999997, "r": 294.04541, "b": 106.70612000000006, "coord_origin": "TOPLEFT"}, "confidence": 0.9022762179374695, "cells": [{"id": 2, "text": "the textual content of an element, which goes beyond visual layout", "bbox": {"l": 53.79800000000001, "t": 87.36352999999997, "r": 294.04541, "b": 95.73816, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "recognition, in particular outside the", "bbox": {"l": 53.79800000000001, "t": 98.32250999999997, "r": 188.1326, "b": 106.69713999999999, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Scientific Articles", "bbox": {"l": 190.37401, "t": 98.36737000000005, "r": 251.25586999999996, "b": 106.70612000000006, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "category.", "bbox": {"l": 253.70801, "t": 98.32250999999997, "r": 287.01816, "b": 106.69713999999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "the textual content of an element, which goes beyond visual layout recognition, in particular outside the Scientific Articles category."}, {"label": "text", "id": 4, "page_no": 4, "cluster": {"id": 4, "label": "text", "bbox": {"l": 53.79800000000001, "t": 109.28156000000001, "r": 295.55923, "b": 249.16216999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9711344838142395, "cells": [{"id": 6, "text": "At first sight, the task of visual document-layout interpretation", "bbox": {"l": 63.76100199999999, "t": 109.28156000000001, "r": 294.04257, "b": 117.65618999999992, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "appears intuitive enough to obtain plausible annotations in most", "bbox": {"l": 53.79800000000001, "t": 120.24054000000001, "r": 294.04266, "b": 128.61517000000003, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "cases. However, during early trial-runs in the core team, we ob-", "bbox": {"l": 53.79800000000001, "t": 131.19854999999995, "r": 295.55615, "b": 139.57317999999998, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "served many cases in which annotators use different annotation", "bbox": {"l": 53.79800000000001, "t": 142.15752999999995, "r": 294.04715, "b": 150.53216999999995, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "styles, especially for documents with challenging layouts. For ex-", "bbox": {"l": 53.79800000000001, "t": 153.11652000000004, "r": 295.55923, "b": 161.49114999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "ample, if a figure is presented with subfigures, one annotator might", "bbox": {"l": 53.79800000000001, "t": 164.07556, "r": 294.04535, "b": 172.4502, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "draw a single figure bounding-box, while another might annotate", "bbox": {"l": 53.79800000000001, "t": 175.03454999999997, "r": 294.04803, "b": 183.40918, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "each subfigure separately. The same applies for lists, where one", "bbox": {"l": 53.79800000000001, "t": 185.99352999999996, "r": 294.04709, "b": 194.36816, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "might annotate all list items in one block or each list item sep-", "bbox": {"l": 53.79800000000001, "t": 196.95250999999996, "r": 295.55612, "b": 205.32714999999996, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "arately. In essence, we observed that challenging layouts would", "bbox": {"l": 53.79800000000001, "t": 207.91156, "r": 294.04712, "b": 216.28619000000003, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "be annotated in different but plausible ways. To illustrate this, we", "bbox": {"l": 53.79800000000001, "t": 218.87054, "r": 294.04495, "b": 227.24518, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "show in Figure 4 multiple examples of plausible but inconsistent", "bbox": {"l": 53.79800000000001, "t": 229.82952999999998, "r": 294.04712, "b": 238.20416, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "annotations on the same pages.", "bbox": {"l": 53.79800000000001, "t": 240.78754000000004, "r": 168.61276, "b": 249.16216999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "At first sight, the task of visual document-layout interpretation appears intuitive enough to obtain plausible annotations in most cases. However, during early trial-runs in the core team, we observed many cases in which annotators use different annotation styles, especially for documents with challenging layouts. For example, if a figure is presented with subfigures, one annotator might draw a single figure bounding-box, while another might annotate each subfigure separately. The same applies for lists, where one might annotate all list items in one block or each list item separately. In essence, we observed that challenging layouts would be annotated in different but plausible ways. To illustrate this, we show in Figure 4 multiple examples of plausible but inconsistent annotations on the same pages."}, {"label": "text", "id": 1, "page_no": 4, "cluster": {"id": 1, "label": "text", "bbox": {"l": 53.79800000000001, "t": 251.74652000000003, "r": 295.56006, "b": 336.83417, "coord_origin": "TOPLEFT"}, "confidence": 0.985905110836029, "cells": [{"id": 19, "text": "Obviously, this inconsistency in annotations is not desirable for", "bbox": {"l": 63.76100199999999, "t": 251.74652000000003, "r": 294.21884, "b": 260.12114999999994, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "datasets which are intended to be used for model training. To min-", "bbox": {"l": 53.79800000000001, "t": 262.70556999999997, "r": 295.56006, "b": 271.0802, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "imise these inconsistencies, we created a detailed annotation guide-", "bbox": {"l": 53.79800000000001, "t": 273.66454999999996, "r": 295.55676, "b": 282.03918, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "line. While perfect consistency across 40 annotation staff members", "bbox": {"l": 53.79800000000001, "t": 284.62354, "r": 294.04922, "b": 292.99817, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "is clearly not possible to achieve, we saw a huge improvement in", "bbox": {"l": 53.79800000000001, "t": 295.5825500000001, "r": 294.04343, "b": 303.95717999999994, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "annotation consistency after the introduction of our annotation", "bbox": {"l": 53.79800000000001, "t": 306.54153, "r": 294.04712, "b": 314.91617, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "guideline. A few selected, non-trivial highlights of the guideline", "bbox": {"l": 53.79800000000001, "t": 317.50055, "r": 294.04718, "b": 325.87518, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "are:", "bbox": {"l": 53.79800000000001, "t": 328.4595299999999, "r": 67.28347, "b": 336.83417, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Obviously, this inconsistency in annotations is not desirable for datasets which are intended to be used for model training. To minimise these inconsistencies, we created a detailed annotation guideline. While perfect consistency across 40 annotation staff members is clearly not possible to achieve, we saw a huge improvement in annotation consistency after the introduction of our annotation guideline. A few selected, non-trivial highlights of the guideline are:"}, {"label": "list_item", "id": 5, "page_no": 4, "cluster": {"id": 5, "label": "list_item", "bbox": {"l": 64.708, "t": 348.51254, "r": 294.0462, "b": 389.77313, "coord_origin": "TOPLEFT"}, "confidence": 0.9691526293754578, "cells": [{"id": 27, "text": "(1)", "bbox": {"l": 64.708, "t": 348.51254, "r": 74.626793, "b": 356.88718, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Every list-item is an individual object instance with class", "bbox": {"l": 76.963936, "t": 348.51254, "r": 294.0462, "b": 356.88718, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "label", "bbox": {"l": 78.207001, "t": 359.47153, "r": 95.730484, "b": 367.84616, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "List-item", "bbox": {"l": 97.976997, "t": 359.51639, "r": 130.17131, "b": 367.85513, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": ". This definition is different from PubLayNet", "bbox": {"l": 130.17101, "t": 359.47153, "r": 294.04053, "b": 367.84616, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "and DocBank, where all list-items are grouped together into", "bbox": {"l": 78.207001, "t": 370.43054, "r": 294.04385, "b": 378.80518, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "one", "bbox": {"l": 78.207001, "t": 381.38953000000004, "r": 91.593834, "b": 389.76416, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "List", "bbox": {"l": 93.834999, "t": 381.43439000000006, "r": 106.88111, "b": 389.77313, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "object.", "bbox": {"l": 109.629, "t": 381.38953000000004, "r": 133.72173, "b": 389.76416, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "(1) Every list-item is an individual object instance with class label List-item . This definition is different from PubLayNet and DocBank, where all list-items are grouped together into one List object."}, {"label": "list_item", "id": 7, "page_no": 4, "cluster": {"id": 7, "label": "list_item", "bbox": {"l": 64.707993, "t": 392.34851, "r": 295.56372, "b": 433.60016, "coord_origin": "TOPLEFT"}, "confidence": 0.9591284990310669, "cells": [{"id": 36, "text": "(2)", "bbox": {"l": 64.707993, "t": 392.34851, "r": 75.097656, "b": 400.72313999999994, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "A", "bbox": {"l": 77.545731, "t": 392.34851, "r": 84.351402, "b": 400.72313999999994, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "List-item", "bbox": {"l": 86.584, "t": 392.39339999999993, "r": 118.01329000000001, "b": 400.73215, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "is a paragraph with hanging indentation. Single-", "bbox": {"l": 120.26899999999999, "t": 392.34854, "r": 295.55695, "b": 400.72317999999996, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "line elements can qualify as", "bbox": {"l": 78.207001, "t": 403.30753, "r": 181.80978, "b": 411.68216, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "List-item", "bbox": {"l": 184.175, "t": 403.35239, "r": 216.68806000000004, "b": 411.69113, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "if the neighbour ele-", "bbox": {"l": 219.078, "t": 403.30753, "r": 295.56372, "b": 411.68216, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "ments expose hanging indentation. Bullet or enumeration", "bbox": {"l": 78.207001, "t": 414.2665400000001, "r": 294.04617, "b": 422.64116999999993, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "symbols are not a requirement.", "bbox": {"l": 78.207001, "t": 425.22552, "r": 192.00853, "b": 433.60016, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "(2) A List-item is a paragraph with hanging indentation. Singleline elements can qualify as List-item if the neighbour elements expose hanging indentation. Bullet or enumeration symbols are not a requirement."}, {"label": "list_item", "id": 10, "page_no": 4, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 64.708, "t": 436.18451000000005, "r": 294.04724, "b": 455.52713, "coord_origin": "TOPLEFT"}, "confidence": 0.9413429498672485, "cells": [{"id": 45, "text": "(3)", "bbox": {"l": 64.708, "t": 436.18451000000005, "r": 74.483009, "b": 444.55914, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "For every", "bbox": {"l": 76.786255, "t": 436.18451000000005, "r": 112.61566, "b": 444.55914, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "Caption", "bbox": {"l": 114.861, "t": 436.2294, "r": 142.61249, "b": 444.56815000000006, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": ", there must be exactly one corresponding", "bbox": {"l": 142.612, "t": 436.18454, "r": 294.04724, "b": 444.55917, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "Picture", "bbox": {"l": 78.207001, "t": 447.18839, "r": 102.79287, "b": 455.52713, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "or", "bbox": {"l": 105.245, "t": 447.14352, "r": 113.09956999999999, "b": 455.51815999999997, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Table", "bbox": {"l": 115.341, "t": 447.18839, "r": 134.40356, "b": 455.52713, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": ".", "bbox": {"l": 134.403, "t": 447.14352, "r": 136.37561, "b": 455.51815999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "(3) For every Caption , there must be exactly one corresponding Picture or Table ."}, {"label": "list_item", "id": 9, "page_no": 4, "cluster": {"id": 9, "label": "list_item", "bbox": {"l": 64.708, "t": 458.1015300000001, "r": 294.04599, "b": 477.43518, "coord_origin": "TOPLEFT"}, "confidence": 0.9426738023757935, "cells": [{"id": 53, "text": "(4)", "bbox": {"l": 64.708, "t": 458.1015300000001, "r": 74.220215, "b": 466.47617, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "Connected sub-pictures are grouped together in one", "bbox": {"l": 76.461555, "t": 458.1015300000001, "r": 267.46786, "b": 466.47617, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "Picture", "bbox": {"l": 269.70599, "t": 458.14639, "r": 294.04599, "b": 466.48514, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "object.", "bbox": {"l": 78.207001, "t": 469.06055, "r": 102.29972, "b": 477.43518, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "(4) Connected sub-pictures are grouped together in one Picture object."}, {"label": "list_item", "id": 11, "page_no": 4, "cluster": {"id": 11, "label": "list_item", "bbox": {"l": 64.708, "t": 480.01953, "r": 264.50571, "b": 488.40314, "coord_origin": "TOPLEFT"}, "confidence": 0.9147457480430603, "cells": [{"id": 57, "text": "(5)", "bbox": {"l": 64.708, "t": 480.01953, "r": 74.345383, "b": 488.39417, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Formula numbers are included in a", "bbox": {"l": 76.616203, "t": 480.01953, "r": 206.13503, "b": 488.39417, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Formula", "bbox": {"l": 208.38, "t": 480.06439, "r": 238.12155, "b": 488.40314, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "object.", "bbox": {"l": 240.41300999999999, "t": 480.01953, "r": 264.50571, "b": 488.39417, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "(5) Formula numbers are included in a Formula object."}, {"label": "list_item", "id": 8, "page_no": 4, "cluster": {"id": 8, "label": "list_item", "bbox": {"l": 64.708008, "t": 490.97852, "r": 294.04617, "b": 521.27118, "coord_origin": "TOPLEFT"}, "confidence": 0.9544308185577393, "cells": [{"id": 61, "text": "(6)", "bbox": {"l": 64.708008, "t": 490.97852, "r": 74.564522, "b": 499.35315, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "Emphasised text (e.g. in italic or bold) at the beginning of", "bbox": {"l": 76.886978, "t": 490.97852, "r": 294.04617, "b": 499.35315, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "a paragraph is not considered a", "bbox": {"l": 78.207001, "t": 501.93753, "r": 200.34819, "b": 510.31216, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "Section-header", "bbox": {"l": 203.66701, "t": 501.98239, "r": 256.57504, "b": 510.32114, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": ", unless it", "bbox": {"l": 256.57401, "t": 501.93753, "r": 294.04401, "b": 510.31216, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "appears exclusively on its own line.", "bbox": {"l": 78.207001, "t": 512.8965499999999, "r": 208.13017, "b": 521.27118, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "(6) Emphasised text (e.g. in italic or bold) at the beginning of a paragraph is not considered a Section-header , unless it appears exclusively on its own line."}, {"label": "text", "id": 3, "page_no": 4, "cluster": {"id": 3, "label": "text", "bbox": {"l": 53.528999, "t": 532.9505300000001, "r": 295.56253, "b": 574.20117, "coord_origin": "TOPLEFT"}, "confidence": 0.9811431169509888, "cells": [{"id": 67, "text": "The complete annotation guideline is over 100 pages long and a", "bbox": {"l": 53.528999, "t": 532.9505300000001, "r": 294.04337, "b": 541.32516, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "detailed description is obviously out of scope for this paper. Never-", "bbox": {"l": 53.79800000000001, "t": 543.90855, "r": 295.56253, "b": 552.28317, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "theless, it will be made publicly available alongside with DocLayNet", "bbox": {"l": 53.79800000000001, "t": 554.8675499999999, "r": 294.04538, "b": 563.24217, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "for future reference.", "bbox": {"l": 53.79800000000001, "t": 565.82655, "r": 127.2418, "b": 574.20117, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The complete annotation guideline is over 100 pages long and a detailed description is obviously out of scope for this paper. Nevertheless, it will be made publicly available alongside with DocLayNet for future reference."}, {"label": "text", "id": 0, "page_no": 4, "cluster": {"id": 0, "label": "text", "bbox": {"l": 53.79800000000001, "t": 576.66899, "r": 295.56226, "b": 705.708176, "coord_origin": "TOPLEFT"}, "confidence": 0.9864389896392822, "cells": [{"id": 71, "text": "Phase 3: Training.", "bbox": {"l": 63.76100199999999, "t": 576.66899, "r": 136.7744, "b": 585.14224, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "After a first trial with a small group of peo-", "bbox": {"l": 139.008, "t": 576.7855500000001, "r": 295.56226, "b": 585.16017, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "ple, we realised that providing the annotation guideline and a set of", "bbox": {"l": 53.79800000000001, "t": 587.74455, "r": 294.04532, "b": 596.1191699999999, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "random practice pages did not yield the desired quality level for lay-", "bbox": {"l": 53.79800000000001, "t": 598.70355, "r": 295.55676, "b": 607.07817, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "out annotation. Therefore we prepared a subset of pages with two", "bbox": {"l": 53.79800000000001, "t": 609.66255, "r": 294.04605, "b": 618.0371700000001, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "different complexity levels, each with a practice and an exam part.", "bbox": {"l": 53.79800000000001, "t": 620.6215500000001, "r": 295.42377, "b": 628.99617, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "974 pages were reference-annotated by one proficient core team", "bbox": {"l": 53.79800000000001, "t": 631.58055, "r": 294.04712, "b": 639.95517, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "member. Annotation staff were then given the task to annotate the", "bbox": {"l": 53.79800000000001, "t": 642.53955, "r": 294.04922, "b": 650.91417, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "same subsets (blinded from the reference). By comparing the an-", "bbox": {"l": 53.79800000000001, "t": 653.49855, "r": 295.55618, "b": 661.87317, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "notations of each staff member with the reference annotations, we", "bbox": {"l": 53.79800000000001, "t": 664.45655, "r": 294.04874, "b": 672.83117, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "could quantify how closely their annotations matched the reference.", "bbox": {"l": 53.79800000000001, "t": 675.4155499999999, "r": 295.42496, "b": 683.79017, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "Only after passing two exam levels with high annotation quality,", "bbox": {"l": 53.79800000000001, "t": 686.37456, "r": 295.0274, "b": 694.749176, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "staff were admitted into the production phase. Practice iterations", "bbox": {"l": 53.79800000000001, "t": 697.333557, "r": 294.04114, "b": 705.708176, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Phase 3: Training. After a first trial with a small group of people, we realised that providing the annotation guideline and a set of random practice pages did not yield the desired quality level for layout annotation. Therefore we prepared a subset of pages with two different complexity levels, each with a practice and an exam part. 974 pages were reference-annotated by one proficient core team member. Annotation staff were then given the task to annotate the same subsets (blinded from the reference). By comparing the annotations of each staff member with the reference annotations, we could quantify how closely their annotations matched the reference. Only after passing two exam levels with high annotation quality, staff were admitted into the production phase. Practice iterations"}, {"label": "picture", "id": 16, "page_no": 4, "cluster": {"id": 16, "label": "picture", "bbox": {"l": 315.960205078125, "t": 85.33881378173828, "r": 559.396484375, "b": 459.68084716796875, "coord_origin": "TOPLEFT"}, "confidence": 0.7264115214347839, "cells": [{"id": 84, "text": "1ef23f5e6d7f10d393f9947e8208285dce9ae87250ac483ac4b4a59d51b4e037", "bbox": {"l": 340.00214, "t": 179.79296999999997, "r": 416.20551, "b": 181.90972999999997, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "Compliant with guidelines", "bbox": {"l": 339.38269, "t": 85.19066999999995, "r": 417.83722, "b": 92.28399999999999, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Plausible but invalid alternative", "bbox": {"l": 451.42834, "t": 85.19066999999995, "r": 546.22913, "b": 92.28399999999999, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Borderline case: Two guideline-compliant alternatives", "bbox": {"l": 350.33701, "t": 364.85706, "r": 513.48035, "b": 371.95035000000007, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "03c31a2ee1ed1b583c28957f475ee545d144e1b5a264dc4dd068c8d2f6a64860", "bbox": {"l": 340.00201, "t": 245.07385, "r": 416.20538, "b": 247.19061, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "1a5cd524f1844c1260c8e8c073e1f442423c264583212b0d0b6626fc780e6ed4", "bbox": {"l": 340.00201, "t": 359.12488, "r": 416.20538, "b": 361.24167, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "A", "bbox": {"l": 322.19424, "t": 98.34105999999997, "r": 326.01498, "b": 104.25214000000005, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "B", "bbox": {"l": 322.19424, "t": 186.99103000000002, "r": 326.01498, "b": 192.90204000000006, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "C", "bbox": {"l": 322.19424, "t": 253.54192999999998, "r": 326.01498, "b": 259.453, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "D", "bbox": {"l": 322.19424, "t": 367.08495999999997, "r": 326.01498, "b": 372.996, "coord_origin": "TOPLEFT"}}], "children": [{"id": 16, "label": "text", "bbox": {"l": 340.00214, "t": 179.79296999999997, "r": 416.20551, "b": 181.90972999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "1ef23f5e6d7f10d393f9947e8208285dce9ae87250ac483ac4b4a59d51b4e037", "bbox": {"l": 340.00214, "t": 179.79296999999997, "r": 416.20551, "b": 181.90972999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 339.38269, "t": 85.19066999999995, "r": 417.83722, "b": 92.28399999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "Compliant with guidelines", "bbox": {"l": 339.38269, "t": 85.19066999999995, "r": 417.83722, "b": 92.28399999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 451.42834, "t": 85.19066999999995, "r": 546.22913, "b": 92.28399999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "Plausible but invalid alternative", "bbox": {"l": 451.42834, "t": 85.19066999999995, "r": 546.22913, "b": 92.28399999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 350.33701, "t": 364.85706, "r": 513.48035, "b": 371.95035000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "Borderline case: Two guideline-compliant alternatives", "bbox": {"l": 350.33701, "t": 364.85706, "r": 513.48035, "b": 371.95035000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 340.00201, "t": 245.07385, "r": 416.20538, "b": 247.19061, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "03c31a2ee1ed1b583c28957f475ee545d144e1b5a264dc4dd068c8d2f6a64860", "bbox": {"l": 340.00201, "t": 245.07385, "r": 416.20538, "b": 247.19061, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 340.00201, "t": 359.12488, "r": 416.20538, "b": 361.24167, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "1a5cd524f1844c1260c8e8c073e1f442423c264583212b0d0b6626fc780e6ed4", "bbox": {"l": 340.00201, "t": 359.12488, "r": 416.20538, "b": 361.24167, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 322.19424, "t": 98.34105999999997, "r": 326.01498, "b": 104.25214000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "A", "bbox": {"l": 322.19424, "t": 98.34105999999997, "r": 326.01498, "b": 104.25214000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 322.19424, "t": 186.99103000000002, "r": 326.01498, "b": 192.90204000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "B", "bbox": {"l": 322.19424, "t": 186.99103000000002, "r": 326.01498, "b": 192.90204000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 322.19424, "t": 253.54192999999998, "r": 326.01498, "b": 259.453, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "C", "bbox": {"l": 322.19424, "t": 253.54192999999998, "r": 326.01498, "b": 259.453, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 322.19424, "t": 367.08495999999997, "r": 326.01498, "b": 372.996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "D", "bbox": {"l": 322.19424, "t": 367.08495999999997, "r": 326.01498, "b": 372.996, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "text", "id": 22, "page_no": 4, "cluster": {"id": 22, "label": "text", "bbox": {"l": 400.12842, "t": 458.44327000000004, "r": 476.33178999999996, "b": 460.5600600000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "05237a14f2524e3f53c8454b074409d05078038a6a36b770fcc8ec7e540deae0", "bbox": {"l": 400.12842, "t": 458.44327000000004, "r": 476.33178999999996, "b": 460.5600600000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "05237a14f2524e3f53c8454b074409d05078038a6a36b770fcc8ec7e540deae0"}, {"label": "caption", "id": 14, "page_no": 4, "cluster": {"id": 14, "label": "caption", "bbox": {"l": 317.95499, "t": 473.49399, "r": 559.80579, "b": 503.88519, "coord_origin": "TOPLEFT"}, "confidence": 0.8873711824417114, "cells": [{"id": 95, "text": "Figure 4: Examples of plausible annotation alternatives for", "bbox": {"l": 317.95499, "t": 473.49399, "r": 558.3891, "b": 481.96722, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "the same page. Criteria in our annotation guideline can re-", "bbox": {"l": 317.95499, "t": 484.45297, "r": 559.80579, "b": 492.92621, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "solve cases A to C, while the case D remains ambiguous.", "bbox": {"l": 317.95499, "t": 495.41196, "r": 544.14148, "b": 503.88519, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 4: Examples of plausible annotation alternatives for the same page. Criteria in our annotation guideline can resolve cases A to C, while the case D remains ambiguous."}, {"label": "text", "id": 6, "page_no": 4, "cluster": {"id": 6, "label": "text", "bbox": {"l": 317.62299, "t": 525.49753, "r": 558.20435, "b": 544.83118, "coord_origin": "TOPLEFT"}, "confidence": 0.9611718654632568, "cells": [{"id": 98, "text": "were carried out over a timeframe of 12 weeks, after which 8 of the", "bbox": {"l": 317.62299, "t": 525.49753, "r": 558.20435, "b": 533.87216, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "40", "bbox": {"l": 317.74899, "t": 536.45656, "r": 326.07019, "b": 544.83118, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "initially allocated annotators did not pass the bar.", "bbox": {"l": 328.3071, "t": 536.45656, "r": 509.11896, "b": 544.83118, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "were carried out over a timeframe of 12 weeks, after which 8 of the 40 initially allocated annotators did not pass the bar."}, {"label": "text", "id": 2, "page_no": 4, "cluster": {"id": 2, "label": "text", "bbox": {"l": 317.62299, "t": 547.299, "r": 559.7149, "b": 709.2151719999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9829543232917786, "cells": [{"id": 101, "text": "Phase 4: Production annotation.", "bbox": {"l": 327.918, "t": 547.299, "r": 456.80109000000004, "b": 555.77225, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "The previously selected 80K", "bbox": {"l": 458.7120100000001, "t": 547.41556, "r": 558.48926, "b": 555.79018, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "pages were annotated with the defined 11 class labels by 32 annota-", "bbox": {"l": 317.95499, "t": 558.37456, "r": 559.71368, "b": 566.74918, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "tors. This production phase took around three months to complete.", "bbox": {"l": 317.95499, "t": 569.33356, "r": 559.58124, "b": 577.7081800000001, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "All annotations were created online through CCS, which visualises", "bbox": {"l": 317.64099, "t": 580.29256, "r": 558.20386, "b": 588.66718, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "the programmatic PDF text-cells as an overlay on the page. The page", "bbox": {"l": 317.95499, "t": 591.25156, "r": 558.20221, "b": 599.62617, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "annotation are obtained by drawing rectangular bounding-boxes,", "bbox": {"l": 317.95499, "t": 602.20955, "r": 559.18457, "b": 610.58417, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "as shown in Figure 3. With regard to the annotation practices, we", "bbox": {"l": 317.95499, "t": 613.16855, "r": 558.20197, "b": 621.54317, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "implemented a few constraints and capabilities on the tooling level.", "bbox": {"l": 317.95499, "t": 624.12755, "r": 559.58197, "b": 632.50217, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "First, we only allow non-overlapping, vertically oriented, rectangu-", "bbox": {"l": 317.95499, "t": 635.08655, "r": 559.71411, "b": 643.46117, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "lar boxes. For the large majority of documents, this constraint was", "bbox": {"l": 317.95499, "t": 646.04555, "r": 558.20557, "b": 654.42017, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "sufficient and it speeds up the annotation considerably in compar-", "bbox": {"l": 317.95499, "t": 657.00455, "r": 559.7149, "b": 665.3791699999999, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "ison with arbitrary segmentation shapes. Second, annotator staff", "bbox": {"l": 317.95499, "t": 667.9635499999999, "r": 558.19849, "b": 676.33817, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "were not able to see each other\u2019s annotations. This was enforced by", "bbox": {"l": 317.62299, "t": 678.92255, "r": 558.43268, "b": 687.29717, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "design to avoid any bias in the annotation, which could skew the", "bbox": {"l": 317.95499, "t": 689.8815500000001, "r": 558.19806, "b": 698.256172, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "numbers of the inter-annotator agreement (see Table 1). We wanted", "bbox": {"l": 317.95499, "t": 700.840553, "r": 558.20227, "b": 709.2151719999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Phase 4: Production annotation. The previously selected 80K pages were annotated with the defined 11 class labels by 32 annotators. This production phase took around three months to complete. All annotations were created online through CCS, which visualises the programmatic PDF text-cells as an overlay on the page. The page annotation are obtained by drawing rectangular bounding-boxes, as shown in Figure 3. With regard to the annotation practices, we implemented a few constraints and capabilities on the tooling level. First, we only allow non-overlapping, vertically oriented, rectangular boxes. For the large majority of documents, this constraint was sufficient and it speeds up the annotation considerably in comparison with arbitrary segmentation shapes. Second, annotator staff were not able to see each other\u2019s annotations. This was enforced by design to avoid any bias in the annotation, which could skew the numbers of the inter-annotator agreement (see Table 1). We wanted"}], "headers": [{"label": "page_header", "id": 13, "page_no": 4, "cluster": {"id": 13, "label": "page_header", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.8877827525138855, "cells": [{"id": 0, "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis"}, {"label": "page_header", "id": 15, "page_no": 4, "cluster": {"id": 15, "label": "page_header", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.8534670472145081, "cells": [{"id": 1, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA"}]}}, {"page_no": 5, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 246.24382, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar", "bbox": {"l": 253.13897999999998, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Table 2: Prediction performance (mAP@0.5-0.95) of object", "bbox": {"l": 53.501999, "t": 86.87292000000002, "r": 294.04361, "b": 95.34618999999998, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "detection networks on DocLayNet test set. The MRCNN", "bbox": {"l": 53.79800000000001, "t": 97.83191, "r": 294.04373, "b": 106.30517999999995, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "(Mask R-CNN) and FRCNN (Faster R-CNN) models with", "bbox": {"l": 53.52, "t": 108.79088999999999, "r": 294.0437, "b": 117.26415999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "ResNet-50 or ResNet-101 backbone were trained based on", "bbox": {"l": 53.79800000000001, "t": 119.74987999999996, "r": 294.04373, "b": 128.22313999999994, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "the network architectures from the", "bbox": {"l": 53.79800000000001, "t": 130.70885999999996, "r": 202.43402, "b": 139.18213000000003, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "detectron2", "bbox": {"l": 206.08501, "t": 130.71783000000005, "r": 247.14215000000002, "b": 139.20905000000005, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "model zoo", "bbox": {"l": 250.95001, "t": 130.70885999999996, "r": 294.04254, "b": 139.18213000000003, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "(Mask R-CNN R50, R101-FPN 3x, Faster R-CNN R101-FPN", "bbox": {"l": 53.52002, "t": 141.66785000000004, "r": 294.04367, "b": 150.14111000000003, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "3x), with default configurations. The YOLO implementation", "bbox": {"l": 53.798019, "t": 152.62683000000004, "r": 294.04373, "b": 161.1001, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "utilized was YOLOv5x6 [13]. All models were initialised us-", "bbox": {"l": 53.798019, "t": 163.58582, "r": 295.64874, "b": 172.05908, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "ing pre-trained weights from the COCO 2017 dataset.", "bbox": {"l": 53.798019, "t": 174.54381999999998, "r": 268.62399, "b": 183.01709000000005, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "human", "bbox": {"l": 132.36501, "t": 197.97351000000003, "r": 157.99098, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "MRCNN", "bbox": {"l": 173.505, "t": 197.97351000000003, "r": 204.61841, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "FRCNN", "bbox": {"l": 220.13028, "t": 197.97351000000003, "r": 248.06958, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "YOLO", "bbox": {"l": 258.03125, "t": 197.97351000000003, "r": 280.17825, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "R50", "bbox": {"l": 168.39301, "t": 208.93255999999997, "r": 181.99504, "b": 217.30719, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "R101", "bbox": {"l": 192.39606, "t": 208.93255999999997, "r": 210.16747, "b": 217.30719, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "R101", "bbox": {"l": 225.21309, "t": 208.93255999999997, "r": 242.9845, "b": 217.30719, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "v5x6", "bbox": {"l": 260.51379, "t": 208.93255999999997, "r": 277.70239, "b": 217.30719, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Caption", "bbox": {"l": 67.663002, "t": 220.28954999999996, "r": 96.848633, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "84-89", "bbox": {"l": 135.32401, "t": 220.28954999999996, "r": 155.03215, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "68.4", "bbox": {"l": 167.95399, "t": 220.28954999999996, "r": 182.43472, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "71.5", "bbox": {"l": 194.0462, "t": 220.28954999999996, "r": 208.52695, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "70.1", "bbox": {"l": 226.86324000000002, "t": 220.28954999999996, "r": 241.34396, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "77.7", "bbox": {"l": 261.86804, "t": 220.28954999999996, "r": 276.34879, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Footnote", "bbox": {"l": 67.663002, "t": 231.24854000000005, "r": 100.1662, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "83-91", "bbox": {"l": 135.32401, "t": 231.24854000000005, "r": 155.03215, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "70.9", "bbox": {"l": 167.95399, "t": 231.24854000000005, "r": 182.43472, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "71.8", "bbox": {"l": 194.0462, "t": 231.24854000000005, "r": 208.52695, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "73.7", "bbox": {"l": 226.86324000000002, "t": 231.24854000000005, "r": 241.34396, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "77.2", "bbox": {"l": 261.86804, "t": 231.24854000000005, "r": 276.34879, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "Formula", "bbox": {"l": 67.663002, "t": 242.20752000000005, "r": 98.175659, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "83-85", "bbox": {"l": 135.32401, "t": 242.20752000000005, "r": 155.03215, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "60.1", "bbox": {"l": 167.95399, "t": 242.20752000000005, "r": 182.43472, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "63.4", "bbox": {"l": 194.0462, "t": 242.20752000000005, "r": 208.52695, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "63.5", "bbox": {"l": 226.86324000000002, "t": 242.20752000000005, "r": 241.34396, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "66.2", "bbox": {"l": 261.86804, "t": 242.20752000000005, "r": 276.34879, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "List-item", "bbox": {"l": 67.663002, "t": 253.16656, "r": 100.54279, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "87-88", "bbox": {"l": 135.32401, "t": 253.16656, "r": 155.03215, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "81.2", "bbox": {"l": 167.95399, "t": 253.16656, "r": 182.43472, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "80.8", "bbox": {"l": 194.0462, "t": 253.16656, "r": 208.52695, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "81.0", "bbox": {"l": 226.86324000000002, "t": 253.16656, "r": 241.34396, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "86.2", "bbox": {"l": 261.86804, "t": 253.16656, "r": 276.34879, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Page-footer", "bbox": {"l": 67.663002, "t": 264.12555, "r": 110.19064, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "93-94", "bbox": {"l": 135.32401, "t": 264.12555, "r": 155.03215, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "61.6", "bbox": {"l": 167.95399, "t": 264.12555, "r": 182.43472, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "59.3", "bbox": {"l": 194.0462, "t": 264.12555, "r": 208.52695, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "58.9", "bbox": {"l": 226.86324000000002, "t": 264.12555, "r": 241.34396, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "61.1", "bbox": {"l": 261.86804, "t": 264.12555, "r": 276.34879, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Page-header", "bbox": {"l": 67.663002, "t": 275.08453, "r": 112.94331999999999, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "85-89", "bbox": {"l": 135.32401, "t": 275.08453, "r": 155.03215, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "71.9", "bbox": {"l": 167.95399, "t": 275.08453, "r": 182.43472, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "70.0", "bbox": {"l": 194.0462, "t": 275.08453, "r": 208.52695, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "72.0", "bbox": {"l": 226.86324000000002, "t": 275.08453, "r": 241.34396, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "67.9", "bbox": {"l": 261.86804, "t": 275.08453, "r": 276.34879, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Picture", "bbox": {"l": 67.663002, "t": 286.04355000000004, "r": 93.647629, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "69-71", "bbox": {"l": 135.32401, "t": 286.04355000000004, "r": 155.03215, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "71.7", "bbox": {"l": 167.95399, "t": 286.04355000000004, "r": 182.43472, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "72.7", "bbox": {"l": 194.0462, "t": 286.04355000000004, "r": 208.52695, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "72.0", "bbox": {"l": 226.86324000000002, "t": 286.04355000000004, "r": 241.34396, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "77.1", "bbox": {"l": 261.86804, "t": 286.04355000000004, "r": 276.34879, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "Section-header", "bbox": {"l": 67.663002, "t": 297.00253, "r": 122.40287999999998, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "83-84", "bbox": {"l": 135.32401, "t": 297.00253, "r": 155.03215, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "67.6", "bbox": {"l": 167.95399, "t": 297.00253, "r": 182.43472, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "69.3", "bbox": {"l": 194.0462, "t": 297.00253, "r": 208.52695, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "68.4", "bbox": {"l": 226.86324000000002, "t": 297.00253, "r": 241.34396, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "74.6", "bbox": {"l": 261.86804, "t": 297.00253, "r": 276.34879, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "Table", "bbox": {"l": 67.663002, "t": 307.96155, "r": 87.46978, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "77-81", "bbox": {"l": 135.32401, "t": 307.96155, "r": 155.03215, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "82.2", "bbox": {"l": 167.95399, "t": 307.96155, "r": 182.43472, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "82.9", "bbox": {"l": 194.0462, "t": 307.96155, "r": 208.52695, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "82.2", "bbox": {"l": 226.86324000000002, "t": 307.96155, "r": 241.34396, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "86.3", "bbox": {"l": 261.86804, "t": 307.96155, "r": 276.34879, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "Text", "bbox": {"l": 67.663002, "t": 318.91953, "r": 83.623199, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "84-86", "bbox": {"l": 135.32401, "t": 318.91953, "r": 155.03215, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "84.6", "bbox": {"l": 167.95399, "t": 318.91953, "r": 182.43472, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "85.8", "bbox": {"l": 194.0462, "t": 318.91953, "r": 208.52695, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "85.4", "bbox": {"l": 226.86324000000002, "t": 318.91953, "r": 241.34396, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "88.1", "bbox": {"l": 261.86804, "t": 318.91953, "r": 276.34879, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Title", "bbox": {"l": 67.663002, "t": 329.87854, "r": 84.654327, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "60-72", "bbox": {"l": 135.32401, "t": 329.87854, "r": 155.03215, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "76.7", "bbox": {"l": 167.95399, "t": 329.87854, "r": 182.43472, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "80.4", "bbox": {"l": 194.0462, "t": 329.87854, "r": 208.52695, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "79.9", "bbox": {"l": 226.86324000000002, "t": 329.87854, "r": 241.34396, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "82.7", "bbox": {"l": 261.86804, "t": 329.87854, "r": 276.34879, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "All", "bbox": {"l": 67.663002, "t": 341.23654, "r": 78.628906, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "82-83", "bbox": {"l": 135.32401, "t": 341.23654, "r": 155.03215, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "72.4", "bbox": {"l": 167.95399, "t": 341.23654, "r": 182.43472, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "73.5", "bbox": {"l": 194.0462, "t": 341.23654, "r": 208.52695, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "73.4", "bbox": {"l": 226.86324000000002, "t": 341.23654, "r": 241.34396, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "76.8", "bbox": {"l": 261.86804, "t": 341.23654, "r": 276.34879, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "to avoid this at any cost in order to have clear, unbiased baseline", "bbox": {"l": 53.79800000000001, "t": 370.92755, "r": 294.04712, "b": 379.30219000000005, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "numbers for human document-layout annotation. Third, we in-", "bbox": {"l": 53.79800000000001, "t": 381.88654, "r": 295.55612, "b": 390.26117, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "troduced the feature of", "bbox": {"l": 53.79800000000001, "t": 392.84555, "r": 140.3623, "b": 401.22017999999997, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "snapping", "bbox": {"l": 142.99001, "t": 392.89041, "r": 175.9695, "b": 401.2291599999999, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "boxes around text segments to", "bbox": {"l": 178.951, "t": 392.84555, "r": 294.04083, "b": 401.22017999999997, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "obtain a pixel-accurate annotation and again reduce time and effort.", "bbox": {"l": 53.79800000000001, "t": 403.80453, "r": 295.42493, "b": 412.17917, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "The CCS annotation tool automatically shrinks every user-drawn", "bbox": {"l": 53.528999, "t": 414.76355, "r": 294.04251, "b": 423.13818, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "box to the minimum bounding-box around the enclosed text-cells", "bbox": {"l": 53.79800000000001, "t": 425.72253, "r": 294.04807, "b": 434.09717, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "for all purely text-based segments, which excludes only", "bbox": {"l": 53.79800000000001, "t": 436.6815500000001, "r": 256.80627, "b": 445.0561799999999, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "Table", "bbox": {"l": 259.04199, "t": 436.72641, "r": 278.10455, "b": 445.06516, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "and", "bbox": {"l": 280.54999, "t": 436.6815500000001, "r": 294.04443, "b": 445.0561799999999, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "Picture", "bbox": {"l": 53.79800000000001, "t": 447.68539, "r": 78.875587, "b": 456.02413999999993, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": ". For the latter, we instructed annotation staff to minimise", "bbox": {"l": 78.876999, "t": 447.64053, "r": 294.04852, "b": 456.01517, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "inclusion of surrounding whitespace while including all graphical", "bbox": {"l": 53.79800000000001, "t": 458.59955, "r": 294.04645, "b": 466.97418, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "lines. A downside of snapping boxes to enclosed text cells is that", "bbox": {"l": 53.79800000000001, "t": 469.55853, "r": 294.0416, "b": 477.93317, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "some wrongly parsed PDF pages cannot be annotated correctly and", "bbox": {"l": 53.79800000000001, "t": 480.51654, "r": 294.04538, "b": 488.89117, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "need to be skipped. Fourth, we established a way to flag pages as", "bbox": {"l": 53.79800000000001, "t": 491.47552, "r": 294.04312, "b": 499.85016, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "rejected", "bbox": {"l": 53.79800000000001, "t": 502.4794, "r": 80.597939, "b": 510.81815, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "for cases where no valid annotation according to the label", "bbox": {"l": 83.366997, "t": 502.43454, "r": 294.04483, "b": 510.80917, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "guidelines could be achieved. Example cases for this would be PDF", "bbox": {"l": 53.79800000000001, "t": 513.3935200000001, "r": 294.25833, "b": 521.7681600000001, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "pages that render incorrectly or contain layouts that are impossible", "bbox": {"l": 53.79800000000001, "t": 524.35254, "r": 294.04535, "b": 532.72717, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "to capture with non-overlapping rectangles. Such rejected pages are", "bbox": {"l": 53.79800000000001, "t": 535.31155, "r": 294.04535, "b": 543.68617, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "not contained in the final dataset. With all these measures in place,", "bbox": {"l": 53.79800000000001, "t": 546.27055, "r": 295.02759, "b": 554.64517, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "experienced annotation staff managed to annotate a single page in", "bbox": {"l": 53.79800000000001, "t": 557.22955, "r": 294.0488, "b": 565.6041700000001, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "a typical timeframe of 20s to 60s, depending on its complexity.", "bbox": {"l": 53.79800000000001, "t": 568.18855, "r": 281.80457, "b": 576.56317, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "5", "bbox": {"l": 53.79800000000001, "t": 588.12991, "r": 59.405277, "b": 598.43901, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "EXPERIMENTS", "bbox": {"l": 70.314377, "t": 588.12991, "r": 147.48535, "b": 598.43901, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "The primary goal of DocLayNet is to obtain high-quality ML models", "bbox": {"l": 53.528999, "t": 613.25356, "r": 294.04871, "b": 621.6281700000001, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "capable of accurate document-layout analysis on a wide variety", "bbox": {"l": 53.79800000000001, "t": 624.21255, "r": 294.27576, "b": 632.58717, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "of challenging layouts. As discussed in Section 2, object detection", "bbox": {"l": 53.79800000000001, "t": 635.17155, "r": 294.04144, "b": 643.54617, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "models are currently the easiest to use, due to the standardisation", "bbox": {"l": 53.79800000000001, "t": 646.13055, "r": 294.04163, "b": 654.50517, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "of ground-truth data in COCO format [16] and the availability of", "bbox": {"l": 53.79800000000001, "t": 657.0885499999999, "r": 294.0412, "b": 665.46317, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "general frameworks such as", "bbox": {"l": 53.79800000000001, "t": 668.04755, "r": 155.01054, "b": 676.42217, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "detectron2", "bbox": {"l": 157.23599, "t": 668.09238, "r": 193.26666, "b": 676.43114, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "[17]. Furthermore, baseline", "bbox": {"l": 195.867, "t": 668.04755, "r": 294.0473, "b": 676.42217, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "numbers in PubLayNet and DocBank were obtained using standard", "bbox": {"l": 53.79800000000001, "t": 679.0065500000001, "r": 294.04538, "b": 687.38117, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "object detection models such as Mask R-CNN and Faster R-CNN.", "bbox": {"l": 53.79800000000001, "t": 689.96555, "r": 295.4281, "b": 698.3401719999999, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "As such, we will relate to these object detection methods in this", "bbox": {"l": 53.484001, "t": 700.9245530000001, "r": 294.04413, "b": 709.299171, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "0", "bbox": {"l": 349.16577, "t": 246.68017999999995, "r": 352.48175, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "20", "bbox": {"l": 385.93698, "t": 246.68017999999995, "r": 392.56894, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "40", "bbox": {"l": 424.366, "t": 246.68017999999995, "r": 430.99796, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "60", "bbox": {"l": 462.79504000000003, "t": 246.68017999999995, "r": 469.427, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "80", "bbox": {"l": 501.22406, "t": 246.68017999999995, "r": 507.85602, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "100", "bbox": {"l": 537.99524, "t": 246.68017999999995, "r": 547.94318, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "% of DocLayNet training set", "bbox": {"l": 410.28143, "t": 253.80840999999998, "r": 483.47278000000006, "b": 259.88251, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "50", "bbox": {"l": 330.93539, "t": 218.38464, "r": 337.56735, "b": 224.45874000000003, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "55", "bbox": {"l": 330.93539, "t": 192.08660999999995, "r": 337.56735, "b": 198.16071, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "60", "bbox": {"l": 330.93539, "t": 165.78864, "r": 337.56735, "b": 171.86273000000006, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "65", "bbox": {"l": 330.93539, "t": 139.49059999999997, "r": 337.56735, "b": 145.56470000000002, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "70", "bbox": {"l": 330.93539, "t": 113.19263000000001, "r": 337.56735, "b": 119.26671999999996, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "mAP 0.50:0.95", "bbox": {"l": 322.92276, "t": 148.37689, "r": 328.99686, "b": 186.79218000000003, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "10", "bbox": {"l": 470.97235, "t": 235.36676, "r": 477.6055, "b": 241.44086000000004, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "1", "bbox": {"l": 477.65662, "t": 234.82390999999996, "r": 479.97778000000005, "b": 239.07581000000005, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "10", "bbox": {"l": 531.55127, "t": 235.41234999999995, "r": 538.18445, "b": 241.48645, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "2", "bbox": {"l": 538.23553, "t": 234.86951, "r": 540.5567, "b": 239.1214, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "50", "bbox": {"l": 404.91125, "t": 216.00005999999996, "r": 411.54321, "b": 222.07416, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "55", "bbox": {"l": 404.91125, "t": 200.22125000000005, "r": 411.54321, "b": 206.29534999999998, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "60", "bbox": {"l": 404.91125, "t": 184.44244000000003, "r": 411.54321, "b": 190.51653999999996, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "65", "bbox": {"l": 404.91125, "t": 168.66364, "r": 411.54321, "b": 174.73773000000006, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "70", "bbox": {"l": 404.91125, "t": 152.88489000000004, "r": 411.54321, "b": 158.95898, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "Figure 5: Prediction performance (mAP@0.5-0.95) of a Mask", "bbox": {"l": 317.95499, "t": 279.01599, "r": 558.47876, "b": 287.48923, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "R-CNN network with ResNet50 backbone trained on increas-", "bbox": {"l": 317.95499, "t": 289.97501, "r": 559.80579, "b": 298.44824, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "ing fractions of the DocLayNet dataset. The learning curve", "bbox": {"l": 317.95499, "t": 300.93399, "r": 558.20068, "b": 309.40723, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "flattens around the 80% mark, indicating that increasing the", "bbox": {"l": 317.95499, "t": 311.89297, "r": 558.20062, "b": 320.36620999999997, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "size of the DocLayNet dataset with similar data will not yield", "bbox": {"l": 317.95499, "t": 322.85196, "r": 558.20074, "b": 331.3252, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "significantly better predictions.", "bbox": {"l": 317.95499, "t": 333.81094, "r": 445.24207, "b": 342.28418000000005, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "paper and leave the detailed evaluation of more recent methods", "bbox": {"l": 317.95499, "t": 384.01154, "r": 558.20416, "b": 392.38617, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "mentioned in Section 2 for future work.", "bbox": {"l": 317.95499, "t": 394.97055, "r": 463.04938, "b": 403.34517999999997, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "In this section, we will present several aspects related to the", "bbox": {"l": 327.918, "t": 405.92953, "r": 558.19836, "b": 414.30417, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "performance of object detection models on DocLayNet. Similarly", "bbox": {"l": 317.95499, "t": 416.88855, "r": 558.4364, "b": 425.26318, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "as in PubLayNet, we will evaluate the quality of their predictions", "bbox": {"l": 317.95499, "t": 427.84653, "r": 558.20563, "b": 436.22116, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "using mean average precision (mAP) with 10 overlaps that range", "bbox": {"l": 317.95499, "t": 438.80554, "r": 558.20044, "b": 447.18018, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "from 0.5 to 0.95 in steps of 0.05 (mAP@0.5-0.95). These scores are", "bbox": {"l": 317.95499, "t": 449.76453000000004, "r": 558.19891, "b": 458.13916, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "computed by leveraging the evaluation code provided by the COCO", "bbox": {"l": 317.95499, "t": 460.72354, "r": 558.20239, "b": 469.09818, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "API [16].", "bbox": {"l": 317.64099, "t": 471.68253, "r": 350.32352, "b": 480.05716, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "Baselines for Object Detection", "bbox": {"l": 317.95499, "t": 496.8219, "r": 466.8532400000001, "b": 507.13098, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "In Table 2, we present baseline experiments (given in mAP) on Mask", "bbox": {"l": 317.95499, "t": 512.02454, "r": 558.43085, "b": 520.39917, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "R-CNN [12], Faster R-CNN [11], and YOLOv5 [13]. Both training", "bbox": {"l": 317.95499, "t": 522.9835499999999, "r": 558.20117, "b": 531.35818, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "and evaluation were performed on RGB images with dimensions of", "bbox": {"l": 317.95499, "t": 533.94254, "r": 558.20233, "b": 542.31717, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "1025", "bbox": {"l": 317.74899, "t": 544.90155, "r": 334.09296, "b": 553.27617, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "\u00d7", "bbox": {"l": 334.81201, "t": 544.84775, "r": 340.51465, "b": 552.5499, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "1025 pixels. For training, we only used one annotation in case", "bbox": {"l": 341.233, "t": 544.90155, "r": 558.20117, "b": 553.27617, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "of redundantly annotated pages. As one can observe, the variation", "bbox": {"l": 317.95499, "t": 555.85956, "r": 558.20392, "b": 564.23418, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "in mAP between the models is rather low, but overall between 6", "bbox": {"l": 317.95499, "t": 566.8185599999999, "r": 558.2041, "b": 575.19318, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "and 10% lower than the mAP computed from the pairwise human", "bbox": {"l": 317.95499, "t": 577.77756, "r": 558.2052, "b": 586.15218, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "annotations on triple-annotated pages. This gives a good indication", "bbox": {"l": 317.95499, "t": 588.73656, "r": 558.20233, "b": 597.11118, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "that the DocLayNet dataset poses a worthwhile challenge for the", "bbox": {"l": 317.95499, "t": 599.69556, "r": 558.1983, "b": 608.0701799999999, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "research community to close the gap between human recognition", "bbox": {"l": 317.95499, "t": 610.65456, "r": 558.20502, "b": 619.02917, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "and ML approaches. It is interesting to see that Mask R-CNN and", "bbox": {"l": 317.95499, "t": 621.61356, "r": 558.20337, "b": 629.98817, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "Faster R-CNN produce very comparable mAP scores, indicating", "bbox": {"l": 317.95499, "t": 632.5725600000001, "r": 558.2041, "b": 640.94717, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "that pixel-based image segmentation derived from bounding-boxes", "bbox": {"l": 317.95499, "t": 643.53156, "r": 558.20245, "b": 651.90617, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "does not help to obtain better predictions. On the other hand, the", "bbox": {"l": 317.95499, "t": 654.49055, "r": 558.19757, "b": 662.86517, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": "more recent Yolov5x model does very well and even out-performs", "bbox": {"l": 317.95499, "t": 665.44855, "r": 558.20404, "b": 673.82317, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "humans on selected labels such as", "bbox": {"l": 317.95499, "t": 676.40755, "r": 444.54102, "b": 684.78217, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "Text", "bbox": {"l": 446.78900000000004, "t": 676.45238, "r": 461.95261000000005, "b": 684.79114, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": ",", "bbox": {"l": 461.95599000000004, "t": 676.40755, "r": 463.96805000000006, "b": 684.78217, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "Table", "bbox": {"l": 466.2170100000001, "t": 676.45238, "r": 485.66998000000007, "b": 684.79114, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "and", "bbox": {"l": 488.1290000000001, "t": 676.40755, "r": 501.89330999999993, "b": 684.78217, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "Picture", "bbox": {"l": 504.142, "t": 676.45238, "r": 529.21954, "b": 684.79114, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": ". This is", "bbox": {"l": 529.22101, "t": 676.40755, "r": 558.20392, "b": 684.78217, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "not entirely surprising, as", "bbox": {"l": 317.95499, "t": 687.36655, "r": 410.81366, "b": 695.741173, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "Text", "bbox": {"l": 413.05301, "t": 687.41138, "r": 427.67865, "b": 695.750137, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": ",", "bbox": {"l": 427.67801, "t": 687.36655, "r": 429.62103, "b": 695.741173, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "Table", "bbox": {"l": 431.86099, "t": 687.41138, "r": 450.62881000000004, "b": 695.750137, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "and", "bbox": {"l": 453.082, "t": 687.36655, "r": 466.37402, "b": 695.741173, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "Picture", "bbox": {"l": 468.61499, "t": 687.41138, "r": 492.83208999999994, "b": 695.750137, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "are abundant and", "bbox": {"l": 495.28201, "t": 687.36655, "r": 558.2005, "b": 695.741173, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "the most visually distinctive in a document.", "bbox": {"l": 317.95499, "t": 698.325554, "r": 477.53903, "b": 706.700172, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 11, "label": "page_header", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.8662876486778259, "cells": [{"id": 0, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 246.24382, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar", "bbox": {"l": 253.13897999999998, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "text", "bbox": {"l": 53.501999, "t": 86.87292000000002, "r": 295.64874, "b": 183.01709000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9782760143280029, "cells": [{"id": 2, "text": "Table 2: Prediction performance (mAP@0.5-0.95) of object", "bbox": {"l": 53.501999, "t": 86.87292000000002, "r": 294.04361, "b": 95.34618999999998, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "detection networks on DocLayNet test set. The MRCNN", "bbox": {"l": 53.79800000000001, "t": 97.83191, "r": 294.04373, "b": 106.30517999999995, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "(Mask R-CNN) and FRCNN (Faster R-CNN) models with", "bbox": {"l": 53.52, "t": 108.79088999999999, "r": 294.0437, "b": 117.26415999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "ResNet-50 or ResNet-101 backbone were trained based on", "bbox": {"l": 53.79800000000001, "t": 119.74987999999996, "r": 294.04373, "b": 128.22313999999994, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "the network architectures from the", "bbox": {"l": 53.79800000000001, "t": 130.70885999999996, "r": 202.43402, "b": 139.18213000000003, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "detectron2", "bbox": {"l": 206.08501, "t": 130.71783000000005, "r": 247.14215000000002, "b": 139.20905000000005, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "model zoo", "bbox": {"l": 250.95001, "t": 130.70885999999996, "r": 294.04254, "b": 139.18213000000003, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "(Mask R-CNN R50, R101-FPN 3x, Faster R-CNN R101-FPN", "bbox": {"l": 53.52002, "t": 141.66785000000004, "r": 294.04367, "b": 150.14111000000003, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "3x), with default configurations. The YOLO implementation", "bbox": {"l": 53.798019, "t": 152.62683000000004, "r": 294.04373, "b": 161.1001, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "utilized was YOLOv5x6 [13]. All models were initialised us-", "bbox": {"l": 53.798019, "t": 163.58582, "r": 295.64874, "b": 172.05908, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "ing pre-trained weights from the COCO 2017 dataset.", "bbox": {"l": 53.798019, "t": 174.54381999999998, "r": 268.62399, "b": 183.01709000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "table", "bbox": {"l": 62.02753829956055, "t": 195.68006896972656, "r": 285.78955078125, "b": 351.6618957519531, "coord_origin": "TOPLEFT"}, "confidence": 0.9883638620376587, "cells": [{"id": 13, "text": "human", "bbox": {"l": 132.36501, "t": 197.97351000000003, "r": 157.99098, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "MRCNN", "bbox": {"l": 173.505, "t": 197.97351000000003, "r": 204.61841, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "FRCNN", "bbox": {"l": 220.13028, "t": 197.97351000000003, "r": 248.06958, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "YOLO", "bbox": {"l": 258.03125, "t": 197.97351000000003, "r": 280.17825, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "R50", "bbox": {"l": 168.39301, "t": 208.93255999999997, "r": 181.99504, "b": 217.30719, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "R101", "bbox": {"l": 192.39606, "t": 208.93255999999997, "r": 210.16747, "b": 217.30719, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "R101", "bbox": {"l": 225.21309, "t": 208.93255999999997, "r": 242.9845, "b": 217.30719, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "v5x6", "bbox": {"l": 260.51379, "t": 208.93255999999997, "r": 277.70239, "b": 217.30719, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Caption", "bbox": {"l": 67.663002, "t": 220.28954999999996, "r": 96.848633, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "84-89", "bbox": {"l": 135.32401, "t": 220.28954999999996, "r": 155.03215, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "68.4", "bbox": {"l": 167.95399, "t": 220.28954999999996, "r": 182.43472, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "71.5", "bbox": {"l": 194.0462, "t": 220.28954999999996, "r": 208.52695, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "70.1", "bbox": {"l": 226.86324000000002, "t": 220.28954999999996, "r": 241.34396, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "77.7", "bbox": {"l": 261.86804, "t": 220.28954999999996, "r": 276.34879, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Footnote", "bbox": {"l": 67.663002, "t": 231.24854000000005, "r": 100.1662, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "83-91", "bbox": {"l": 135.32401, "t": 231.24854000000005, "r": 155.03215, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "70.9", "bbox": {"l": 167.95399, "t": 231.24854000000005, "r": 182.43472, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "71.8", "bbox": {"l": 194.0462, "t": 231.24854000000005, "r": 208.52695, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "73.7", "bbox": {"l": 226.86324000000002, "t": 231.24854000000005, "r": 241.34396, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "77.2", "bbox": {"l": 261.86804, "t": 231.24854000000005, "r": 276.34879, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "Formula", "bbox": {"l": 67.663002, "t": 242.20752000000005, "r": 98.175659, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "83-85", "bbox": {"l": 135.32401, "t": 242.20752000000005, "r": 155.03215, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "60.1", "bbox": {"l": 167.95399, "t": 242.20752000000005, "r": 182.43472, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "63.4", "bbox": {"l": 194.0462, "t": 242.20752000000005, "r": 208.52695, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "63.5", "bbox": {"l": 226.86324000000002, "t": 242.20752000000005, "r": 241.34396, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "66.2", "bbox": {"l": 261.86804, "t": 242.20752000000005, "r": 276.34879, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "List-item", "bbox": {"l": 67.663002, "t": 253.16656, "r": 100.54279, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "87-88", "bbox": {"l": 135.32401, "t": 253.16656, "r": 155.03215, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "81.2", "bbox": {"l": 167.95399, "t": 253.16656, "r": 182.43472, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "80.8", "bbox": {"l": 194.0462, "t": 253.16656, "r": 208.52695, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "81.0", "bbox": {"l": 226.86324000000002, "t": 253.16656, "r": 241.34396, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "86.2", "bbox": {"l": 261.86804, "t": 253.16656, "r": 276.34879, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Page-footer", "bbox": {"l": 67.663002, "t": 264.12555, "r": 110.19064, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "93-94", "bbox": {"l": 135.32401, "t": 264.12555, "r": 155.03215, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "61.6", "bbox": {"l": 167.95399, "t": 264.12555, "r": 182.43472, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "59.3", "bbox": {"l": 194.0462, "t": 264.12555, "r": 208.52695, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "58.9", "bbox": {"l": 226.86324000000002, "t": 264.12555, "r": 241.34396, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "61.1", "bbox": {"l": 261.86804, "t": 264.12555, "r": 276.34879, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Page-header", "bbox": {"l": 67.663002, "t": 275.08453, "r": 112.94331999999999, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "85-89", "bbox": {"l": 135.32401, "t": 275.08453, "r": 155.03215, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "71.9", "bbox": {"l": 167.95399, "t": 275.08453, "r": 182.43472, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "70.0", "bbox": {"l": 194.0462, "t": 275.08453, "r": 208.52695, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "72.0", "bbox": {"l": 226.86324000000002, "t": 275.08453, "r": 241.34396, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "67.9", "bbox": {"l": 261.86804, "t": 275.08453, "r": 276.34879, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Picture", "bbox": {"l": 67.663002, "t": 286.04355000000004, "r": 93.647629, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "69-71", "bbox": {"l": 135.32401, "t": 286.04355000000004, "r": 155.03215, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "71.7", "bbox": {"l": 167.95399, "t": 286.04355000000004, "r": 182.43472, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "72.7", "bbox": {"l": 194.0462, "t": 286.04355000000004, "r": 208.52695, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "72.0", "bbox": {"l": 226.86324000000002, "t": 286.04355000000004, "r": 241.34396, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "77.1", "bbox": {"l": 261.86804, "t": 286.04355000000004, "r": 276.34879, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "Section-header", "bbox": {"l": 67.663002, "t": 297.00253, "r": 122.40287999999998, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "83-84", "bbox": {"l": 135.32401, "t": 297.00253, "r": 155.03215, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "67.6", "bbox": {"l": 167.95399, "t": 297.00253, "r": 182.43472, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "69.3", "bbox": {"l": 194.0462, "t": 297.00253, "r": 208.52695, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "68.4", "bbox": {"l": 226.86324000000002, "t": 297.00253, "r": 241.34396, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "74.6", "bbox": {"l": 261.86804, "t": 297.00253, "r": 276.34879, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "Table", "bbox": {"l": 67.663002, "t": 307.96155, "r": 87.46978, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "77-81", "bbox": {"l": 135.32401, "t": 307.96155, "r": 155.03215, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "82.2", "bbox": {"l": 167.95399, "t": 307.96155, "r": 182.43472, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "82.9", "bbox": {"l": 194.0462, "t": 307.96155, "r": 208.52695, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "82.2", "bbox": {"l": 226.86324000000002, "t": 307.96155, "r": 241.34396, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "86.3", "bbox": {"l": 261.86804, "t": 307.96155, "r": 276.34879, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "Text", "bbox": {"l": 67.663002, "t": 318.91953, "r": 83.623199, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "84-86", "bbox": {"l": 135.32401, "t": 318.91953, "r": 155.03215, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "84.6", "bbox": {"l": 167.95399, "t": 318.91953, "r": 182.43472, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "85.8", "bbox": {"l": 194.0462, "t": 318.91953, "r": 208.52695, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "85.4", "bbox": {"l": 226.86324000000002, "t": 318.91953, "r": 241.34396, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "88.1", "bbox": {"l": 261.86804, "t": 318.91953, "r": 276.34879, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Title", "bbox": {"l": 67.663002, "t": 329.87854, "r": 84.654327, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "60-72", "bbox": {"l": 135.32401, "t": 329.87854, "r": 155.03215, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "76.7", "bbox": {"l": 167.95399, "t": 329.87854, "r": 182.43472, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "80.4", "bbox": {"l": 194.0462, "t": 329.87854, "r": 208.52695, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "79.9", "bbox": {"l": 226.86324000000002, "t": 329.87854, "r": 241.34396, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "82.7", "bbox": {"l": 261.86804, "t": 329.87854, "r": 276.34879, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "All", "bbox": {"l": 67.663002, "t": 341.23654, "r": 78.628906, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "82-83", "bbox": {"l": 135.32401, "t": 341.23654, "r": 155.03215, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "72.4", "bbox": {"l": 167.95399, "t": 341.23654, "r": 182.43472, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "73.5", "bbox": {"l": 194.0462, "t": 341.23654, "r": 208.52695, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "73.4", "bbox": {"l": 226.86324000000002, "t": 341.23654, "r": 241.34396, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "76.8", "bbox": {"l": 261.86804, "t": 341.23654, "r": 276.34879, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": [{"id": 12, "label": "text", "bbox": {"l": 132.36501, "t": 197.97351000000003, "r": 157.99098, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "human", "bbox": {"l": 132.36501, "t": 197.97351000000003, "r": 157.99098, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 173.505, "t": 197.97351000000003, "r": 204.61841, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "MRCNN", "bbox": {"l": 173.505, "t": 197.97351000000003, "r": 204.61841, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 220.13028, "t": 197.97351000000003, "r": 248.06958, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "FRCNN", "bbox": {"l": 220.13028, "t": 197.97351000000003, "r": 248.06958, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 258.03125, "t": 197.97351000000003, "r": 280.17825, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "YOLO", "bbox": {"l": 258.03125, "t": 197.97351000000003, "r": 280.17825, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 168.39301, "t": 208.93255999999997, "r": 181.99504, "b": 217.30719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "R50", "bbox": {"l": 168.39301, "t": 208.93255999999997, "r": 181.99504, "b": 217.30719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 192.39606, "t": 208.93255999999997, "r": 210.16747, "b": 217.30719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "R101", "bbox": {"l": 192.39606, "t": 208.93255999999997, "r": 210.16747, "b": 217.30719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 225.21309, "t": 208.93255999999997, "r": 242.9845, "b": 217.30719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "R101", "bbox": {"l": 225.21309, "t": 208.93255999999997, "r": 242.9845, "b": 217.30719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 260.51379, "t": 208.93255999999997, "r": 277.70239, "b": 217.30719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "v5x6", "bbox": {"l": 260.51379, "t": 208.93255999999997, "r": 277.70239, "b": 217.30719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 67.663002, "t": 220.28954999999996, "r": 96.848633, "b": 228.66418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "Caption", "bbox": {"l": 67.663002, "t": 220.28954999999996, "r": 96.848633, "b": 228.66418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 135.32401, "t": 220.28954999999996, "r": 155.03215, "b": 228.66418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "84-89", "bbox": {"l": 135.32401, "t": 220.28954999999996, "r": 155.03215, "b": 228.66418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 167.95399, "t": 220.28954999999996, "r": 182.43472, "b": 228.66418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "68.4", "bbox": {"l": 167.95399, "t": 220.28954999999996, "r": 182.43472, "b": 228.66418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 194.0462, "t": 220.28954999999996, "r": 208.52695, "b": 228.66418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "71.5", "bbox": {"l": 194.0462, "t": 220.28954999999996, "r": 208.52695, "b": 228.66418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 226.86324000000002, "t": 220.28954999999996, "r": 241.34396, "b": 228.66418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "70.1", "bbox": {"l": 226.86324000000002, "t": 220.28954999999996, "r": 241.34396, "b": 228.66418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 261.86804, "t": 220.28954999999996, "r": 276.34879, "b": 228.66418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "77.7", "bbox": {"l": 261.86804, "t": 220.28954999999996, "r": 276.34879, "b": 228.66418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 67.663002, "t": 231.24854000000005, "r": 100.1662, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "Footnote", "bbox": {"l": 67.663002, "t": 231.24854000000005, "r": 100.1662, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 135.32401, "t": 231.24854000000005, "r": 155.03215, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "83-91", "bbox": {"l": 135.32401, "t": 231.24854000000005, "r": 155.03215, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 167.95399, "t": 231.24854000000005, "r": 182.43472, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "70.9", "bbox": {"l": 167.95399, "t": 231.24854000000005, "r": 182.43472, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 194.0462, "t": 231.24854000000005, "r": 208.52695, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "71.8", "bbox": {"l": 194.0462, "t": 231.24854000000005, "r": 208.52695, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 226.86324000000002, "t": 231.24854000000005, "r": 241.34396, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "73.7", "bbox": {"l": 226.86324000000002, "t": 231.24854000000005, "r": 241.34396, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 261.86804, "t": 231.24854000000005, "r": 276.34879, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "77.2", "bbox": {"l": 261.86804, "t": 231.24854000000005, "r": 276.34879, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 67.663002, "t": 242.20752000000005, "r": 98.175659, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "Formula", "bbox": {"l": 67.663002, "t": 242.20752000000005, "r": 98.175659, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 135.32401, "t": 242.20752000000005, "r": 155.03215, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "83-85", "bbox": {"l": 135.32401, "t": 242.20752000000005, "r": 155.03215, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 167.95399, "t": 242.20752000000005, "r": 182.43472, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "60.1", "bbox": {"l": 167.95399, "t": 242.20752000000005, "r": 182.43472, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 194.0462, "t": 242.20752000000005, "r": 208.52695, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "63.4", "bbox": {"l": 194.0462, "t": 242.20752000000005, "r": 208.52695, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 226.86324000000002, "t": 242.20752000000005, "r": 241.34396, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "63.5", "bbox": {"l": 226.86324000000002, "t": 242.20752000000005, "r": 241.34396, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 261.86804, "t": 242.20752000000005, "r": 276.34879, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "66.2", "bbox": {"l": 261.86804, "t": 242.20752000000005, "r": 276.34879, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 67.663002, "t": 253.16656, "r": 100.54279, "b": 261.5412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "List-item", "bbox": {"l": 67.663002, "t": 253.16656, "r": 100.54279, "b": 261.5412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 135.32401, "t": 253.16656, "r": 155.03215, "b": 261.5412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "87-88", "bbox": {"l": 135.32401, "t": 253.16656, "r": 155.03215, "b": 261.5412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 167.95399, "t": 253.16656, "r": 182.43472, "b": 261.5412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "81.2", "bbox": {"l": 167.95399, "t": 253.16656, "r": 182.43472, "b": 261.5412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 194.0462, "t": 253.16656, "r": 208.52695, "b": 261.5412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "80.8", "bbox": {"l": 194.0462, "t": 253.16656, "r": 208.52695, "b": 261.5412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 226.86324000000002, "t": 253.16656, "r": 241.34396, "b": 261.5412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "81.0", "bbox": {"l": 226.86324000000002, "t": 253.16656, "r": 241.34396, "b": 261.5412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 261.86804, "t": 253.16656, "r": 276.34879, "b": 261.5412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "86.2", "bbox": {"l": 261.86804, "t": 253.16656, "r": 276.34879, "b": 261.5412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 67.663002, "t": 264.12555, "r": 110.19064, "b": 272.50018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "Page-footer", "bbox": {"l": 67.663002, "t": 264.12555, "r": 110.19064, "b": 272.50018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 135.32401, "t": 264.12555, "r": 155.03215, "b": 272.50018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "93-94", "bbox": {"l": 135.32401, "t": 264.12555, "r": 155.03215, "b": 272.50018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 167.95399, "t": 264.12555, "r": 182.43472, "b": 272.50018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "61.6", "bbox": {"l": 167.95399, "t": 264.12555, "r": 182.43472, "b": 272.50018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 194.0462, "t": 264.12555, "r": 208.52695, "b": 272.50018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "59.3", "bbox": {"l": 194.0462, "t": 264.12555, "r": 208.52695, "b": 272.50018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 226.86324000000002, "t": 264.12555, "r": 241.34396, "b": 272.50018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "58.9", "bbox": {"l": 226.86324000000002, "t": 264.12555, "r": 241.34396, "b": 272.50018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 261.86804, "t": 264.12555, "r": 276.34879, "b": 272.50018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "61.1", "bbox": {"l": 261.86804, "t": 264.12555, "r": 276.34879, "b": 272.50018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 67.663002, "t": 275.08453, "r": 112.94331999999999, "b": 283.45917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "Page-header", "bbox": {"l": 67.663002, "t": 275.08453, "r": 112.94331999999999, "b": 283.45917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 135.32401, "t": 275.08453, "r": 155.03215, "b": 283.45917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "85-89", "bbox": {"l": 135.32401, "t": 275.08453, "r": 155.03215, "b": 283.45917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 167.95399, "t": 275.08453, "r": 182.43472, "b": 283.45917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "71.9", "bbox": {"l": 167.95399, "t": 275.08453, "r": 182.43472, "b": 283.45917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 194.0462, "t": 275.08453, "r": 208.52695, "b": 283.45917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "70.0", "bbox": {"l": 194.0462, "t": 275.08453, "r": 208.52695, "b": 283.45917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 226.86324000000002, "t": 275.08453, "r": 241.34396, "b": 283.45917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "72.0", "bbox": {"l": 226.86324000000002, "t": 275.08453, "r": 241.34396, "b": 283.45917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 261.86804, "t": 275.08453, "r": 276.34879, "b": 283.45917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "67.9", "bbox": {"l": 261.86804, "t": 275.08453, "r": 276.34879, "b": 283.45917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 67.663002, "t": 286.04355000000004, "r": 93.647629, "b": 294.41818, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "Picture", "bbox": {"l": 67.663002, "t": 286.04355000000004, "r": 93.647629, "b": 294.41818, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 135.32401, "t": 286.04355000000004, "r": 155.03215, "b": 294.41818, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "69-71", "bbox": {"l": 135.32401, "t": 286.04355000000004, "r": 155.03215, "b": 294.41818, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 167.95399, "t": 286.04355000000004, "r": 182.43472, "b": 294.41818, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "71.7", "bbox": {"l": 167.95399, "t": 286.04355000000004, "r": 182.43472, "b": 294.41818, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 194.0462, "t": 286.04355000000004, "r": 208.52695, "b": 294.41818, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "72.7", "bbox": {"l": 194.0462, "t": 286.04355000000004, "r": 208.52695, "b": 294.41818, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 226.86324000000002, "t": 286.04355000000004, "r": 241.34396, "b": 294.41818, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "72.0", "bbox": {"l": 226.86324000000002, "t": 286.04355000000004, "r": 241.34396, "b": 294.41818, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 261.86804, "t": 286.04355000000004, "r": 276.34879, "b": 294.41818, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "77.1", "bbox": {"l": 261.86804, "t": 286.04355000000004, "r": 276.34879, "b": 294.41818, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 67.663002, "t": 297.00253, "r": 122.40287999999998, "b": 305.37717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "Section-header", "bbox": {"l": 67.663002, "t": 297.00253, "r": 122.40287999999998, "b": 305.37717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 135.32401, "t": 297.00253, "r": 155.03215, "b": 305.37717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "83-84", "bbox": {"l": 135.32401, "t": 297.00253, "r": 155.03215, "b": 305.37717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 167.95399, "t": 297.00253, "r": 182.43472, "b": 305.37717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "67.6", "bbox": {"l": 167.95399, "t": 297.00253, "r": 182.43472, "b": 305.37717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 194.0462, "t": 297.00253, "r": 208.52695, "b": 305.37717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "69.3", "bbox": {"l": 194.0462, "t": 297.00253, "r": 208.52695, "b": 305.37717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 226.86324000000002, "t": 297.00253, "r": 241.34396, "b": 305.37717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "68.4", "bbox": {"l": 226.86324000000002, "t": 297.00253, "r": 241.34396, "b": 305.37717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 261.86804, "t": 297.00253, "r": 276.34879, "b": 305.37717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "74.6", "bbox": {"l": 261.86804, "t": 297.00253, "r": 276.34879, "b": 305.37717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 67.663002, "t": 307.96155, "r": 87.46978, "b": 316.33618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "Table", "bbox": {"l": 67.663002, "t": 307.96155, "r": 87.46978, "b": 316.33618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 135.32401, "t": 307.96155, "r": 155.03215, "b": 316.33618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "77-81", "bbox": {"l": 135.32401, "t": 307.96155, "r": 155.03215, "b": 316.33618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 167.95399, "t": 307.96155, "r": 182.43472, "b": 316.33618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "82.2", "bbox": {"l": 167.95399, "t": 307.96155, "r": 182.43472, "b": 316.33618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 194.0462, "t": 307.96155, "r": 208.52695, "b": 316.33618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "82.9", "bbox": {"l": 194.0462, "t": 307.96155, "r": 208.52695, "b": 316.33618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 226.86324000000002, "t": 307.96155, "r": 241.34396, "b": 316.33618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "82.2", "bbox": {"l": 226.86324000000002, "t": 307.96155, "r": 241.34396, "b": 316.33618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 261.86804, "t": 307.96155, "r": 276.34879, "b": 316.33618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "86.3", "bbox": {"l": 261.86804, "t": 307.96155, "r": 276.34879, "b": 316.33618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 67.663002, "t": 318.91953, "r": 83.623199, "b": 327.29416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "Text", "bbox": {"l": 67.663002, "t": 318.91953, "r": 83.623199, "b": 327.29416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 135.32401, "t": 318.91953, "r": 155.03215, "b": 327.29416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "84-86", "bbox": {"l": 135.32401, "t": 318.91953, "r": 155.03215, "b": 327.29416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 167.95399, "t": 318.91953, "r": 182.43472, "b": 327.29416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "84.6", "bbox": {"l": 167.95399, "t": 318.91953, "r": 182.43472, "b": 327.29416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 194.0462, "t": 318.91953, "r": 208.52695, "b": 327.29416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "85.8", "bbox": {"l": 194.0462, "t": 318.91953, "r": 208.52695, "b": 327.29416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 226.86324000000002, "t": 318.91953, "r": 241.34396, "b": 327.29416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "85.4", "bbox": {"l": 226.86324000000002, "t": 318.91953, "r": 241.34396, "b": 327.29416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 261.86804, "t": 318.91953, "r": 276.34879, "b": 327.29416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "88.1", "bbox": {"l": 261.86804, "t": 318.91953, "r": 276.34879, "b": 327.29416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 67.663002, "t": 329.87854, "r": 84.654327, "b": 338.25317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "Title", "bbox": {"l": 67.663002, "t": 329.87854, "r": 84.654327, "b": 338.25317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 135.32401, "t": 329.87854, "r": 155.03215, "b": 338.25317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "60-72", "bbox": {"l": 135.32401, "t": 329.87854, "r": 155.03215, "b": 338.25317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 167.95399, "t": 329.87854, "r": 182.43472, "b": 338.25317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "76.7", "bbox": {"l": 167.95399, "t": 329.87854, "r": 182.43472, "b": 338.25317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 194.0462, "t": 329.87854, "r": 208.52695, "b": 338.25317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "80.4", "bbox": {"l": 194.0462, "t": 329.87854, "r": 208.52695, "b": 338.25317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 226.86324000000002, "t": 329.87854, "r": 241.34396, "b": 338.25317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "79.9", "bbox": {"l": 226.86324000000002, "t": 329.87854, "r": 241.34396, "b": 338.25317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 261.86804, "t": 329.87854, "r": 276.34879, "b": 338.25317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "82.7", "bbox": {"l": 261.86804, "t": 329.87854, "r": 276.34879, "b": 338.25317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 67.663002, "t": 341.23654, "r": 78.628906, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "All", "bbox": {"l": 67.663002, "t": 341.23654, "r": 78.628906, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 135.32401, "t": 341.23654, "r": 155.03215, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "82-83", "bbox": {"l": 135.32401, "t": 341.23654, "r": 155.03215, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 167.95399, "t": 341.23654, "r": 182.43472, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "72.4", "bbox": {"l": 167.95399, "t": 341.23654, "r": 182.43472, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 194.0462, "t": 341.23654, "r": 208.52695, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "73.5", "bbox": {"l": 194.0462, "t": 341.23654, "r": 208.52695, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 226.86324000000002, "t": 341.23654, "r": 241.34396, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "73.4", "bbox": {"l": 226.86324000000002, "t": 341.23654, "r": 241.34396, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 261.86804, "t": 341.23654, "r": 276.34879, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "76.8", "bbox": {"l": 261.86804, "t": 341.23654, "r": 276.34879, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 4, "label": "text", "bbox": {"l": 53.528999, "t": 370.92755, "r": 295.55612, "b": 576.56317, "coord_origin": "TOPLEFT"}, "confidence": 0.9866557121276855, "cells": [{"id": 93, "text": "to avoid this at any cost in order to have clear, unbiased baseline", "bbox": {"l": 53.79800000000001, "t": 370.92755, "r": 294.04712, "b": 379.30219000000005, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "numbers for human document-layout annotation. Third, we in-", "bbox": {"l": 53.79800000000001, "t": 381.88654, "r": 295.55612, "b": 390.26117, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "troduced the feature of", "bbox": {"l": 53.79800000000001, "t": 392.84555, "r": 140.3623, "b": 401.22017999999997, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "snapping", "bbox": {"l": 142.99001, "t": 392.89041, "r": 175.9695, "b": 401.2291599999999, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "boxes around text segments to", "bbox": {"l": 178.951, "t": 392.84555, "r": 294.04083, "b": 401.22017999999997, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "obtain a pixel-accurate annotation and again reduce time and effort.", "bbox": {"l": 53.79800000000001, "t": 403.80453, "r": 295.42493, "b": 412.17917, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "The CCS annotation tool automatically shrinks every user-drawn", "bbox": {"l": 53.528999, "t": 414.76355, "r": 294.04251, "b": 423.13818, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "box to the minimum bounding-box around the enclosed text-cells", "bbox": {"l": 53.79800000000001, "t": 425.72253, "r": 294.04807, "b": 434.09717, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "for all purely text-based segments, which excludes only", "bbox": {"l": 53.79800000000001, "t": 436.6815500000001, "r": 256.80627, "b": 445.0561799999999, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "Table", "bbox": {"l": 259.04199, "t": 436.72641, "r": 278.10455, "b": 445.06516, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "and", "bbox": {"l": 280.54999, "t": 436.6815500000001, "r": 294.04443, "b": 445.0561799999999, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "Picture", "bbox": {"l": 53.79800000000001, "t": 447.68539, "r": 78.875587, "b": 456.02413999999993, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": ". For the latter, we instructed annotation staff to minimise", "bbox": {"l": 78.876999, "t": 447.64053, "r": 294.04852, "b": 456.01517, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "inclusion of surrounding whitespace while including all graphical", "bbox": {"l": 53.79800000000001, "t": 458.59955, "r": 294.04645, "b": 466.97418, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "lines. A downside of snapping boxes to enclosed text cells is that", "bbox": {"l": 53.79800000000001, "t": 469.55853, "r": 294.0416, "b": 477.93317, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "some wrongly parsed PDF pages cannot be annotated correctly and", "bbox": {"l": 53.79800000000001, "t": 480.51654, "r": 294.04538, "b": 488.89117, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "need to be skipped. Fourth, we established a way to flag pages as", "bbox": {"l": 53.79800000000001, "t": 491.47552, "r": 294.04312, "b": 499.85016, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "rejected", "bbox": {"l": 53.79800000000001, "t": 502.4794, "r": 80.597939, "b": 510.81815, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "for cases where no valid annotation according to the label", "bbox": {"l": 83.366997, "t": 502.43454, "r": 294.04483, "b": 510.80917, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "guidelines could be achieved. Example cases for this would be PDF", "bbox": {"l": 53.79800000000001, "t": 513.3935200000001, "r": 294.25833, "b": 521.7681600000001, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "pages that render incorrectly or contain layouts that are impossible", "bbox": {"l": 53.79800000000001, "t": 524.35254, "r": 294.04535, "b": 532.72717, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "to capture with non-overlapping rectangles. Such rejected pages are", "bbox": {"l": 53.79800000000001, "t": 535.31155, "r": 294.04535, "b": 543.68617, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "not contained in the final dataset. With all these measures in place,", "bbox": {"l": 53.79800000000001, "t": 546.27055, "r": 295.02759, "b": 554.64517, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "experienced annotation staff managed to annotate a single page in", "bbox": {"l": 53.79800000000001, "t": 557.22955, "r": 294.0488, "b": 565.6041700000001, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "a typical timeframe of 20s to 60s, depending on its complexity.", "bbox": {"l": 53.79800000000001, "t": 568.18855, "r": 281.80457, "b": 576.56317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "section_header", "bbox": {"l": 53.79800000000001, "t": 588.12991, "r": 147.48535, "b": 598.43901, "coord_origin": "TOPLEFT"}, "confidence": 0.9419495463371277, "cells": [{"id": 118, "text": "5", "bbox": {"l": 53.79800000000001, "t": 588.12991, "r": 59.405277, "b": 598.43901, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "EXPERIMENTS", "bbox": {"l": 70.314377, "t": 588.12991, "r": 147.48535, "b": 598.43901, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 53.484001, "t": 613.25356, "r": 295.4281, "b": 709.299171, "coord_origin": "TOPLEFT"}, "confidence": 0.987605094909668, "cells": [{"id": 120, "text": "The primary goal of DocLayNet is to obtain high-quality ML models", "bbox": {"l": 53.528999, "t": 613.25356, "r": 294.04871, "b": 621.6281700000001, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "capable of accurate document-layout analysis on a wide variety", "bbox": {"l": 53.79800000000001, "t": 624.21255, "r": 294.27576, "b": 632.58717, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "of challenging layouts. As discussed in Section 2, object detection", "bbox": {"l": 53.79800000000001, "t": 635.17155, "r": 294.04144, "b": 643.54617, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "models are currently the easiest to use, due to the standardisation", "bbox": {"l": 53.79800000000001, "t": 646.13055, "r": 294.04163, "b": 654.50517, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "of ground-truth data in COCO format [16] and the availability of", "bbox": {"l": 53.79800000000001, "t": 657.0885499999999, "r": 294.0412, "b": 665.46317, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "general frameworks such as", "bbox": {"l": 53.79800000000001, "t": 668.04755, "r": 155.01054, "b": 676.42217, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "detectron2", "bbox": {"l": 157.23599, "t": 668.09238, "r": 193.26666, "b": 676.43114, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "[17]. Furthermore, baseline", "bbox": {"l": 195.867, "t": 668.04755, "r": 294.0473, "b": 676.42217, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "numbers in PubLayNet and DocBank were obtained using standard", "bbox": {"l": 53.79800000000001, "t": 679.0065500000001, "r": 294.04538, "b": 687.38117, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "object detection models such as Mask R-CNN and Faster R-CNN.", "bbox": {"l": 53.79800000000001, "t": 689.96555, "r": 295.4281, "b": 698.3401719999999, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "As such, we will relate to these object detection methods in this", "bbox": {"l": 53.484001, "t": 700.9245530000001, "r": 294.04413, "b": 709.299171, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "picture", "bbox": {"l": 323.48431396484375, "t": 89.88603210449219, "r": 553.5411376953125, "b": 260.0107727050781, "coord_origin": "TOPLEFT"}, "confidence": 0.9782691597938538, "cells": [{"id": 131, "text": "0", "bbox": {"l": 349.16577, "t": 246.68017999999995, "r": 352.48175, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "20", "bbox": {"l": 385.93698, "t": 246.68017999999995, "r": 392.56894, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "40", "bbox": {"l": 424.366, "t": 246.68017999999995, "r": 430.99796, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "60", "bbox": {"l": 462.79504000000003, "t": 246.68017999999995, "r": 469.427, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "80", "bbox": {"l": 501.22406, "t": 246.68017999999995, "r": 507.85602, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "100", "bbox": {"l": 537.99524, "t": 246.68017999999995, "r": 547.94318, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "% of DocLayNet training set", "bbox": {"l": 410.28143, "t": 253.80840999999998, "r": 483.47278000000006, "b": 259.88251, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "50", "bbox": {"l": 330.93539, "t": 218.38464, "r": 337.56735, "b": 224.45874000000003, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "55", "bbox": {"l": 330.93539, "t": 192.08660999999995, "r": 337.56735, "b": 198.16071, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "60", "bbox": {"l": 330.93539, "t": 165.78864, "r": 337.56735, "b": 171.86273000000006, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "65", "bbox": {"l": 330.93539, "t": 139.49059999999997, "r": 337.56735, "b": 145.56470000000002, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "70", "bbox": {"l": 330.93539, "t": 113.19263000000001, "r": 337.56735, "b": 119.26671999999996, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "mAP 0.50:0.95", "bbox": {"l": 322.92276, "t": 148.37689, "r": 328.99686, "b": 186.79218000000003, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "10", "bbox": {"l": 470.97235, "t": 235.36676, "r": 477.6055, "b": 241.44086000000004, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "1", "bbox": {"l": 477.65662, "t": 234.82390999999996, "r": 479.97778000000005, "b": 239.07581000000005, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "10", "bbox": {"l": 531.55127, "t": 235.41234999999995, "r": 538.18445, "b": 241.48645, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "2", "bbox": {"l": 538.23553, "t": 234.86951, "r": 540.5567, "b": 239.1214, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "50", "bbox": {"l": 404.91125, "t": 216.00005999999996, "r": 411.54321, "b": 222.07416, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "55", "bbox": {"l": 404.91125, "t": 200.22125000000005, "r": 411.54321, "b": 206.29534999999998, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "60", "bbox": {"l": 404.91125, "t": 184.44244000000003, "r": 411.54321, "b": 190.51653999999996, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "65", "bbox": {"l": 404.91125, "t": 168.66364, "r": 411.54321, "b": 174.73773000000006, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "70", "bbox": {"l": 404.91125, "t": 152.88489000000004, "r": 411.54321, "b": 158.95898, "coord_origin": "TOPLEFT"}}], "children": [{"id": 92, "label": "text", "bbox": {"l": 349.16577, "t": 246.68017999999995, "r": 352.48175, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 131, "text": "0", "bbox": {"l": 349.16577, "t": 246.68017999999995, "r": 352.48175, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 385.93698, "t": 246.68017999999995, "r": 392.56894, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 132, "text": "20", "bbox": {"l": 385.93698, "t": 246.68017999999995, "r": 392.56894, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 424.366, "t": 246.68017999999995, "r": 430.99796, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 133, "text": "40", "bbox": {"l": 424.366, "t": 246.68017999999995, "r": 430.99796, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 462.79504000000003, "t": 246.68017999999995, "r": 469.427, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 134, "text": "60", "bbox": {"l": 462.79504000000003, "t": 246.68017999999995, "r": 469.427, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 501.22406, "t": 246.68017999999995, "r": 507.85602, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 135, "text": "80", "bbox": {"l": 501.22406, "t": 246.68017999999995, "r": 507.85602, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 537.99524, "t": 246.68017999999995, "r": 547.94318, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 136, "text": "100", "bbox": {"l": 537.99524, "t": 246.68017999999995, "r": 547.94318, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 410.28143, "t": 253.80840999999998, "r": 483.47278000000006, "b": 259.88251, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 137, "text": "% of DocLayNet training set", "bbox": {"l": 410.28143, "t": 253.80840999999998, "r": 483.47278000000006, "b": 259.88251, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 330.93539, "t": 218.38464, "r": 337.56735, "b": 224.45874000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 138, "text": "50", "bbox": {"l": 330.93539, "t": 218.38464, "r": 337.56735, "b": 224.45874000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 330.93539, "t": 192.08660999999995, "r": 337.56735, "b": 198.16071, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 139, "text": "55", "bbox": {"l": 330.93539, "t": 192.08660999999995, "r": 337.56735, "b": 198.16071, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 330.93539, "t": 165.78864, "r": 337.56735, "b": 171.86273000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 140, "text": "60", "bbox": {"l": 330.93539, "t": 165.78864, "r": 337.56735, "b": 171.86273000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 330.93539, "t": 139.49059999999997, "r": 337.56735, "b": 145.56470000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 141, "text": "65", "bbox": {"l": 330.93539, "t": 139.49059999999997, "r": 337.56735, "b": 145.56470000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 330.93539, "t": 113.19263000000001, "r": 337.56735, "b": 119.26671999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 142, "text": "70", "bbox": {"l": 330.93539, "t": 113.19263000000001, "r": 337.56735, "b": 119.26671999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 322.92276, "t": 148.37689, "r": 328.99686, "b": 186.79218000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 143, "text": "mAP 0.50:0.95", "bbox": {"l": 322.92276, "t": 148.37689, "r": 328.99686, "b": 186.79218000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 470.97235, "t": 235.36676, "r": 477.6055, "b": 241.44086000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 144, "text": "10", "bbox": {"l": 470.97235, "t": 235.36676, "r": 477.6055, "b": 241.44086000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 477.65662, "t": 234.82390999999996, "r": 479.97778000000005, "b": 239.07581000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 145, "text": "1", "bbox": {"l": 477.65662, "t": 234.82390999999996, "r": 479.97778000000005, "b": 239.07581000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 531.55127, "t": 235.41234999999995, "r": 538.18445, "b": 241.48645, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 146, "text": "10", "bbox": {"l": 531.55127, "t": 235.41234999999995, "r": 538.18445, "b": 241.48645, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 538.23553, "t": 234.86951, "r": 540.5567, "b": 239.1214, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 147, "text": "2", "bbox": {"l": 538.23553, "t": 234.86951, "r": 540.5567, "b": 239.1214, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 404.91125, "t": 216.00005999999996, "r": 411.54321, "b": 222.07416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 148, "text": "50", "bbox": {"l": 404.91125, "t": 216.00005999999996, "r": 411.54321, "b": 222.07416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 404.91125, "t": 200.22125000000005, "r": 411.54321, "b": 206.29534999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 149, "text": "55", "bbox": {"l": 404.91125, "t": 200.22125000000005, "r": 411.54321, "b": 206.29534999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 404.91125, "t": 184.44244000000003, "r": 411.54321, "b": 190.51653999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 150, "text": "60", "bbox": {"l": 404.91125, "t": 184.44244000000003, "r": 411.54321, "b": 190.51653999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 404.91125, "t": 168.66364, "r": 411.54321, "b": 174.73773000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 151, "text": "65", "bbox": {"l": 404.91125, "t": 168.66364, "r": 411.54321, "b": 174.73773000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 404.91125, "t": 152.88489000000004, "r": 411.54321, "b": 158.95898, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 152, "text": "70", "bbox": {"l": 404.91125, "t": 152.88489000000004, "r": 411.54321, "b": 158.95898, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 7, "label": "caption", "bbox": {"l": 317.95499, "t": 279.01599, "r": 559.80579, "b": 342.28418000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9639935493469238, "cells": [{"id": 153, "text": "Figure 5: Prediction performance (mAP@0.5-0.95) of a Mask", "bbox": {"l": 317.95499, "t": 279.01599, "r": 558.47876, "b": 287.48923, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "R-CNN network with ResNet50 backbone trained on increas-", "bbox": {"l": 317.95499, "t": 289.97501, "r": 559.80579, "b": 298.44824, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "ing fractions of the DocLayNet dataset. The learning curve", "bbox": {"l": 317.95499, "t": 300.93399, "r": 558.20068, "b": 309.40723, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "flattens around the 80% mark, indicating that increasing the", "bbox": {"l": 317.95499, "t": 311.89297, "r": 558.20062, "b": 320.36620999999997, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "size of the DocLayNet dataset with similar data will not yield", "bbox": {"l": 317.95499, "t": 322.85196, "r": 558.20074, "b": 331.3252, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "significantly better predictions.", "bbox": {"l": 317.95499, "t": 333.81094, "r": 445.24207, "b": 342.28418000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "text", "bbox": {"l": 317.95499, "t": 384.01154, "r": 558.20416, "b": 403.34517999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9594221711158752, "cells": [{"id": 159, "text": "paper and leave the detailed evaluation of more recent methods", "bbox": {"l": 317.95499, "t": 384.01154, "r": 558.20416, "b": 392.38617, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "mentioned in Section 2 for future work.", "bbox": {"l": 317.95499, "t": 394.97055, "r": 463.04938, "b": 403.34517999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 317.64099, "t": 405.92953, "r": 558.4364, "b": 480.05716, "coord_origin": "TOPLEFT"}, "confidence": 0.9872915148735046, "cells": [{"id": 161, "text": "In this section, we will present several aspects related to the", "bbox": {"l": 327.918, "t": 405.92953, "r": 558.19836, "b": 414.30417, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "performance of object detection models on DocLayNet. Similarly", "bbox": {"l": 317.95499, "t": 416.88855, "r": 558.4364, "b": 425.26318, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "as in PubLayNet, we will evaluate the quality of their predictions", "bbox": {"l": 317.95499, "t": 427.84653, "r": 558.20563, "b": 436.22116, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "using mean average precision (mAP) with 10 overlaps that range", "bbox": {"l": 317.95499, "t": 438.80554, "r": 558.20044, "b": 447.18018, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "from 0.5 to 0.95 in steps of 0.05 (mAP@0.5-0.95). These scores are", "bbox": {"l": 317.95499, "t": 449.76453000000004, "r": 558.19891, "b": 458.13916, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "computed by leveraging the evaluation code provided by the COCO", "bbox": {"l": 317.95499, "t": 460.72354, "r": 558.20239, "b": 469.09818, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "API [16].", "bbox": {"l": 317.64099, "t": 471.68253, "r": 350.32352, "b": 480.05716, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "section_header", "bbox": {"l": 317.95499, "t": 496.8219, "r": 466.8532400000001, "b": 507.13098, "coord_origin": "TOPLEFT"}, "confidence": 0.9579005241394043, "cells": [{"id": 168, "text": "Baselines for Object Detection", "bbox": {"l": 317.95499, "t": 496.8219, "r": 466.8532400000001, "b": 507.13098, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 317.74899, "t": 512.02454, "r": 558.43085, "b": 706.700172, "coord_origin": "TOPLEFT"}, "confidence": 0.987722635269165, "cells": [{"id": 169, "text": "In Table 2, we present baseline experiments (given in mAP) on Mask", "bbox": {"l": 317.95499, "t": 512.02454, "r": 558.43085, "b": 520.39917, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "R-CNN [12], Faster R-CNN [11], and YOLOv5 [13]. Both training", "bbox": {"l": 317.95499, "t": 522.9835499999999, "r": 558.20117, "b": 531.35818, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "and evaluation were performed on RGB images with dimensions of", "bbox": {"l": 317.95499, "t": 533.94254, "r": 558.20233, "b": 542.31717, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "1025", "bbox": {"l": 317.74899, "t": 544.90155, "r": 334.09296, "b": 553.27617, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "\u00d7", "bbox": {"l": 334.81201, "t": 544.84775, "r": 340.51465, "b": 552.5499, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "1025 pixels. For training, we only used one annotation in case", "bbox": {"l": 341.233, "t": 544.90155, "r": 558.20117, "b": 553.27617, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "of redundantly annotated pages. As one can observe, the variation", "bbox": {"l": 317.95499, "t": 555.85956, "r": 558.20392, "b": 564.23418, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "in mAP between the models is rather low, but overall between 6", "bbox": {"l": 317.95499, "t": 566.8185599999999, "r": 558.2041, "b": 575.19318, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "and 10% lower than the mAP computed from the pairwise human", "bbox": {"l": 317.95499, "t": 577.77756, "r": 558.2052, "b": 586.15218, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "annotations on triple-annotated pages. This gives a good indication", "bbox": {"l": 317.95499, "t": 588.73656, "r": 558.20233, "b": 597.11118, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "that the DocLayNet dataset poses a worthwhile challenge for the", "bbox": {"l": 317.95499, "t": 599.69556, "r": 558.1983, "b": 608.0701799999999, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "research community to close the gap between human recognition", "bbox": {"l": 317.95499, "t": 610.65456, "r": 558.20502, "b": 619.02917, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "and ML approaches. It is interesting to see that Mask R-CNN and", "bbox": {"l": 317.95499, "t": 621.61356, "r": 558.20337, "b": 629.98817, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "Faster R-CNN produce very comparable mAP scores, indicating", "bbox": {"l": 317.95499, "t": 632.5725600000001, "r": 558.2041, "b": 640.94717, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "that pixel-based image segmentation derived from bounding-boxes", "bbox": {"l": 317.95499, "t": 643.53156, "r": 558.20245, "b": 651.90617, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "does not help to obtain better predictions. On the other hand, the", "bbox": {"l": 317.95499, "t": 654.49055, "r": 558.19757, "b": 662.86517, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": "more recent Yolov5x model does very well and even out-performs", "bbox": {"l": 317.95499, "t": 665.44855, "r": 558.20404, "b": 673.82317, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "humans on selected labels such as", "bbox": {"l": 317.95499, "t": 676.40755, "r": 444.54102, "b": 684.78217, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "Text", "bbox": {"l": 446.78900000000004, "t": 676.45238, "r": 461.95261000000005, "b": 684.79114, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": ",", "bbox": {"l": 461.95599000000004, "t": 676.40755, "r": 463.96805000000006, "b": 684.78217, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "Table", "bbox": {"l": 466.2170100000001, "t": 676.45238, "r": 485.66998000000007, "b": 684.79114, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "and", "bbox": {"l": 488.1290000000001, "t": 676.40755, "r": 501.89330999999993, "b": 684.78217, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "Picture", "bbox": {"l": 504.142, "t": 676.45238, "r": 529.21954, "b": 684.79114, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": ". This is", "bbox": {"l": 529.22101, "t": 676.40755, "r": 558.20392, "b": 684.78217, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "not entirely surprising, as", "bbox": {"l": 317.95499, "t": 687.36655, "r": 410.81366, "b": 695.741173, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "Text", "bbox": {"l": 413.05301, "t": 687.41138, "r": 427.67865, "b": 695.750137, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": ",", "bbox": {"l": 427.67801, "t": 687.36655, "r": 429.62103, "b": 695.741173, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "Table", "bbox": {"l": 431.86099, "t": 687.41138, "r": 450.62881000000004, "b": 695.750137, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "and", "bbox": {"l": 453.082, "t": 687.36655, "r": 466.37402, "b": 695.741173, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "Picture", "bbox": {"l": 468.61499, "t": 687.41138, "r": 492.83208999999994, "b": 695.750137, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "are abundant and", "bbox": {"l": 495.28201, "t": 687.36655, "r": 558.2005, "b": 695.741173, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "the most visually distinctive in a document.", "bbox": {"l": 317.95499, "t": 698.325554, "r": 477.53903, "b": 706.700172, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {"0": {"label": "table", "id": 0, "page_no": 5, "cluster": {"id": 0, "label": "table", "bbox": {"l": 62.02753829956055, "t": 195.68006896972656, "r": 285.78955078125, "b": 351.6618957519531, "coord_origin": "TOPLEFT"}, "confidence": 0.9883638620376587, "cells": [{"id": 13, "text": "human", "bbox": {"l": 132.36501, "t": 197.97351000000003, "r": 157.99098, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "MRCNN", "bbox": {"l": 173.505, "t": 197.97351000000003, "r": 204.61841, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "FRCNN", "bbox": {"l": 220.13028, "t": 197.97351000000003, "r": 248.06958, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "YOLO", "bbox": {"l": 258.03125, "t": 197.97351000000003, "r": 280.17825, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "R50", "bbox": {"l": 168.39301, "t": 208.93255999999997, "r": 181.99504, "b": 217.30719, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "R101", "bbox": {"l": 192.39606, "t": 208.93255999999997, "r": 210.16747, "b": 217.30719, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "R101", "bbox": {"l": 225.21309, "t": 208.93255999999997, "r": 242.9845, "b": 217.30719, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "v5x6", "bbox": {"l": 260.51379, "t": 208.93255999999997, "r": 277.70239, "b": 217.30719, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Caption", "bbox": {"l": 67.663002, "t": 220.28954999999996, "r": 96.848633, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "84-89", "bbox": {"l": 135.32401, "t": 220.28954999999996, "r": 155.03215, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "68.4", "bbox": {"l": 167.95399, "t": 220.28954999999996, "r": 182.43472, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "71.5", "bbox": {"l": 194.0462, "t": 220.28954999999996, "r": 208.52695, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "70.1", "bbox": {"l": 226.86324000000002, "t": 220.28954999999996, "r": 241.34396, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "77.7", "bbox": {"l": 261.86804, "t": 220.28954999999996, "r": 276.34879, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Footnote", "bbox": {"l": 67.663002, "t": 231.24854000000005, "r": 100.1662, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "83-91", "bbox": {"l": 135.32401, "t": 231.24854000000005, "r": 155.03215, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "70.9", "bbox": {"l": 167.95399, "t": 231.24854000000005, "r": 182.43472, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "71.8", "bbox": {"l": 194.0462, "t": 231.24854000000005, "r": 208.52695, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "73.7", "bbox": {"l": 226.86324000000002, "t": 231.24854000000005, "r": 241.34396, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "77.2", "bbox": {"l": 261.86804, "t": 231.24854000000005, "r": 276.34879, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "Formula", "bbox": {"l": 67.663002, "t": 242.20752000000005, "r": 98.175659, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "83-85", "bbox": {"l": 135.32401, "t": 242.20752000000005, "r": 155.03215, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "60.1", "bbox": {"l": 167.95399, "t": 242.20752000000005, "r": 182.43472, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "63.4", "bbox": {"l": 194.0462, "t": 242.20752000000005, "r": 208.52695, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "63.5", "bbox": {"l": 226.86324000000002, "t": 242.20752000000005, "r": 241.34396, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "66.2", "bbox": {"l": 261.86804, "t": 242.20752000000005, "r": 276.34879, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "List-item", "bbox": {"l": 67.663002, "t": 253.16656, "r": 100.54279, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "87-88", "bbox": {"l": 135.32401, "t": 253.16656, "r": 155.03215, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "81.2", "bbox": {"l": 167.95399, "t": 253.16656, "r": 182.43472, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "80.8", "bbox": {"l": 194.0462, "t": 253.16656, "r": 208.52695, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "81.0", "bbox": {"l": 226.86324000000002, "t": 253.16656, "r": 241.34396, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "86.2", "bbox": {"l": 261.86804, "t": 253.16656, "r": 276.34879, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Page-footer", "bbox": {"l": 67.663002, "t": 264.12555, "r": 110.19064, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "93-94", "bbox": {"l": 135.32401, "t": 264.12555, "r": 155.03215, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "61.6", "bbox": {"l": 167.95399, "t": 264.12555, "r": 182.43472, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "59.3", "bbox": {"l": 194.0462, "t": 264.12555, "r": 208.52695, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "58.9", "bbox": {"l": 226.86324000000002, "t": 264.12555, "r": 241.34396, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "61.1", "bbox": {"l": 261.86804, "t": 264.12555, "r": 276.34879, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Page-header", "bbox": {"l": 67.663002, "t": 275.08453, "r": 112.94331999999999, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "85-89", "bbox": {"l": 135.32401, "t": 275.08453, "r": 155.03215, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "71.9", "bbox": {"l": 167.95399, "t": 275.08453, "r": 182.43472, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "70.0", "bbox": {"l": 194.0462, "t": 275.08453, "r": 208.52695, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "72.0", "bbox": {"l": 226.86324000000002, "t": 275.08453, "r": 241.34396, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "67.9", "bbox": {"l": 261.86804, "t": 275.08453, "r": 276.34879, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Picture", "bbox": {"l": 67.663002, "t": 286.04355000000004, "r": 93.647629, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "69-71", "bbox": {"l": 135.32401, "t": 286.04355000000004, "r": 155.03215, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "71.7", "bbox": {"l": 167.95399, "t": 286.04355000000004, "r": 182.43472, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "72.7", "bbox": {"l": 194.0462, "t": 286.04355000000004, "r": 208.52695, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "72.0", "bbox": {"l": 226.86324000000002, "t": 286.04355000000004, "r": 241.34396, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "77.1", "bbox": {"l": 261.86804, "t": 286.04355000000004, "r": 276.34879, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "Section-header", "bbox": {"l": 67.663002, "t": 297.00253, "r": 122.40287999999998, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "83-84", "bbox": {"l": 135.32401, "t": 297.00253, "r": 155.03215, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "67.6", "bbox": {"l": 167.95399, "t": 297.00253, "r": 182.43472, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "69.3", "bbox": {"l": 194.0462, "t": 297.00253, "r": 208.52695, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "68.4", "bbox": {"l": 226.86324000000002, "t": 297.00253, "r": 241.34396, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "74.6", "bbox": {"l": 261.86804, "t": 297.00253, "r": 276.34879, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "Table", "bbox": {"l": 67.663002, "t": 307.96155, "r": 87.46978, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "77-81", "bbox": {"l": 135.32401, "t": 307.96155, "r": 155.03215, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "82.2", "bbox": {"l": 167.95399, "t": 307.96155, "r": 182.43472, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "82.9", "bbox": {"l": 194.0462, "t": 307.96155, "r": 208.52695, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "82.2", "bbox": {"l": 226.86324000000002, "t": 307.96155, "r": 241.34396, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "86.3", "bbox": {"l": 261.86804, "t": 307.96155, "r": 276.34879, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "Text", "bbox": {"l": 67.663002, "t": 318.91953, "r": 83.623199, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "84-86", "bbox": {"l": 135.32401, "t": 318.91953, "r": 155.03215, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "84.6", "bbox": {"l": 167.95399, "t": 318.91953, "r": 182.43472, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "85.8", "bbox": {"l": 194.0462, "t": 318.91953, "r": 208.52695, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "85.4", "bbox": {"l": 226.86324000000002, "t": 318.91953, "r": 241.34396, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "88.1", "bbox": {"l": 261.86804, "t": 318.91953, "r": 276.34879, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Title", "bbox": {"l": 67.663002, "t": 329.87854, "r": 84.654327, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "60-72", "bbox": {"l": 135.32401, "t": 329.87854, "r": 155.03215, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "76.7", "bbox": {"l": 167.95399, "t": 329.87854, "r": 182.43472, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "80.4", "bbox": {"l": 194.0462, "t": 329.87854, "r": 208.52695, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "79.9", "bbox": {"l": 226.86324000000002, "t": 329.87854, "r": 241.34396, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "82.7", "bbox": {"l": 261.86804, "t": 329.87854, "r": 276.34879, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "All", "bbox": {"l": 67.663002, "t": 341.23654, "r": 78.628906, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "82-83", "bbox": {"l": 135.32401, "t": 341.23654, "r": 155.03215, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "72.4", "bbox": {"l": 167.95399, "t": 341.23654, "r": 182.43472, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "73.5", "bbox": {"l": 194.0462, "t": 341.23654, "r": 208.52695, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "73.4", "bbox": {"l": 226.86324000000002, "t": 341.23654, "r": 241.34396, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "76.8", "bbox": {"l": 261.86804, "t": 341.23654, "r": 276.34879, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": [{"id": 12, "label": "text", "bbox": {"l": 132.36501, "t": 197.97351000000003, "r": 157.99098, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "human", "bbox": {"l": 132.36501, "t": 197.97351000000003, "r": 157.99098, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 173.505, "t": 197.97351000000003, "r": 204.61841, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "MRCNN", "bbox": {"l": 173.505, "t": 197.97351000000003, "r": 204.61841, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 220.13028, "t": 197.97351000000003, "r": 248.06958, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "FRCNN", "bbox": {"l": 220.13028, "t": 197.97351000000003, "r": 248.06958, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 258.03125, "t": 197.97351000000003, "r": 280.17825, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "YOLO", "bbox": {"l": 258.03125, "t": 197.97351000000003, "r": 280.17825, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 168.39301, "t": 208.93255999999997, "r": 181.99504, "b": 217.30719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "R50", "bbox": {"l": 168.39301, "t": 208.93255999999997, "r": 181.99504, "b": 217.30719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 192.39606, "t": 208.93255999999997, "r": 210.16747, "b": 217.30719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "R101", "bbox": {"l": 192.39606, "t": 208.93255999999997, "r": 210.16747, "b": 217.30719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 225.21309, "t": 208.93255999999997, "r": 242.9845, "b": 217.30719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "R101", "bbox": {"l": 225.21309, "t": 208.93255999999997, "r": 242.9845, "b": 217.30719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 260.51379, "t": 208.93255999999997, "r": 277.70239, "b": 217.30719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "v5x6", "bbox": {"l": 260.51379, "t": 208.93255999999997, "r": 277.70239, "b": 217.30719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 67.663002, "t": 220.28954999999996, "r": 96.848633, "b": 228.66418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "Caption", "bbox": {"l": 67.663002, "t": 220.28954999999996, "r": 96.848633, "b": 228.66418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 135.32401, "t": 220.28954999999996, "r": 155.03215, "b": 228.66418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "84-89", "bbox": {"l": 135.32401, "t": 220.28954999999996, "r": 155.03215, "b": 228.66418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 167.95399, "t": 220.28954999999996, "r": 182.43472, "b": 228.66418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "68.4", "bbox": {"l": 167.95399, "t": 220.28954999999996, "r": 182.43472, "b": 228.66418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 194.0462, "t": 220.28954999999996, "r": 208.52695, "b": 228.66418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "71.5", "bbox": {"l": 194.0462, "t": 220.28954999999996, "r": 208.52695, "b": 228.66418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 226.86324000000002, "t": 220.28954999999996, "r": 241.34396, "b": 228.66418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "70.1", "bbox": {"l": 226.86324000000002, "t": 220.28954999999996, "r": 241.34396, "b": 228.66418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 261.86804, "t": 220.28954999999996, "r": 276.34879, "b": 228.66418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "77.7", "bbox": {"l": 261.86804, "t": 220.28954999999996, "r": 276.34879, "b": 228.66418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 67.663002, "t": 231.24854000000005, "r": 100.1662, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "Footnote", "bbox": {"l": 67.663002, "t": 231.24854000000005, "r": 100.1662, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 135.32401, "t": 231.24854000000005, "r": 155.03215, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "83-91", "bbox": {"l": 135.32401, "t": 231.24854000000005, "r": 155.03215, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 167.95399, "t": 231.24854000000005, "r": 182.43472, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "70.9", "bbox": {"l": 167.95399, "t": 231.24854000000005, "r": 182.43472, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 194.0462, "t": 231.24854000000005, "r": 208.52695, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "71.8", "bbox": {"l": 194.0462, "t": 231.24854000000005, "r": 208.52695, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 226.86324000000002, "t": 231.24854000000005, "r": 241.34396, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "73.7", "bbox": {"l": 226.86324000000002, "t": 231.24854000000005, "r": 241.34396, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 261.86804, "t": 231.24854000000005, "r": 276.34879, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "77.2", "bbox": {"l": 261.86804, "t": 231.24854000000005, "r": 276.34879, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 67.663002, "t": 242.20752000000005, "r": 98.175659, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "Formula", "bbox": {"l": 67.663002, "t": 242.20752000000005, "r": 98.175659, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 135.32401, "t": 242.20752000000005, "r": 155.03215, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "83-85", "bbox": {"l": 135.32401, "t": 242.20752000000005, "r": 155.03215, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 167.95399, "t": 242.20752000000005, "r": 182.43472, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "60.1", "bbox": {"l": 167.95399, "t": 242.20752000000005, "r": 182.43472, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 194.0462, "t": 242.20752000000005, "r": 208.52695, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "63.4", "bbox": {"l": 194.0462, "t": 242.20752000000005, "r": 208.52695, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 226.86324000000002, "t": 242.20752000000005, "r": 241.34396, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "63.5", "bbox": {"l": 226.86324000000002, "t": 242.20752000000005, "r": 241.34396, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 261.86804, "t": 242.20752000000005, "r": 276.34879, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "66.2", "bbox": {"l": 261.86804, "t": 242.20752000000005, "r": 276.34879, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 67.663002, "t": 253.16656, "r": 100.54279, "b": 261.5412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "List-item", "bbox": {"l": 67.663002, "t": 253.16656, "r": 100.54279, "b": 261.5412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 135.32401, "t": 253.16656, "r": 155.03215, "b": 261.5412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "87-88", "bbox": {"l": 135.32401, "t": 253.16656, "r": 155.03215, "b": 261.5412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 167.95399, "t": 253.16656, "r": 182.43472, "b": 261.5412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "81.2", "bbox": {"l": 167.95399, "t": 253.16656, "r": 182.43472, "b": 261.5412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 194.0462, "t": 253.16656, "r": 208.52695, "b": 261.5412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "80.8", "bbox": {"l": 194.0462, "t": 253.16656, "r": 208.52695, "b": 261.5412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 226.86324000000002, "t": 253.16656, "r": 241.34396, "b": 261.5412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "81.0", "bbox": {"l": 226.86324000000002, "t": 253.16656, "r": 241.34396, "b": 261.5412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 261.86804, "t": 253.16656, "r": 276.34879, "b": 261.5412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "86.2", "bbox": {"l": 261.86804, "t": 253.16656, "r": 276.34879, "b": 261.5412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 67.663002, "t": 264.12555, "r": 110.19064, "b": 272.50018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "Page-footer", "bbox": {"l": 67.663002, "t": 264.12555, "r": 110.19064, "b": 272.50018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 135.32401, "t": 264.12555, "r": 155.03215, "b": 272.50018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "93-94", "bbox": {"l": 135.32401, "t": 264.12555, "r": 155.03215, "b": 272.50018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 167.95399, "t": 264.12555, "r": 182.43472, "b": 272.50018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "61.6", "bbox": {"l": 167.95399, "t": 264.12555, "r": 182.43472, "b": 272.50018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 194.0462, "t": 264.12555, "r": 208.52695, "b": 272.50018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "59.3", "bbox": {"l": 194.0462, "t": 264.12555, "r": 208.52695, "b": 272.50018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 226.86324000000002, "t": 264.12555, "r": 241.34396, "b": 272.50018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "58.9", "bbox": {"l": 226.86324000000002, "t": 264.12555, "r": 241.34396, "b": 272.50018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 261.86804, "t": 264.12555, "r": 276.34879, "b": 272.50018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "61.1", "bbox": {"l": 261.86804, "t": 264.12555, "r": 276.34879, "b": 272.50018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 67.663002, "t": 275.08453, "r": 112.94331999999999, "b": 283.45917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "Page-header", "bbox": {"l": 67.663002, "t": 275.08453, "r": 112.94331999999999, "b": 283.45917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 135.32401, "t": 275.08453, "r": 155.03215, "b": 283.45917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "85-89", "bbox": {"l": 135.32401, "t": 275.08453, "r": 155.03215, "b": 283.45917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 167.95399, "t": 275.08453, "r": 182.43472, "b": 283.45917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "71.9", "bbox": {"l": 167.95399, "t": 275.08453, "r": 182.43472, "b": 283.45917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 194.0462, "t": 275.08453, "r": 208.52695, "b": 283.45917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "70.0", "bbox": {"l": 194.0462, "t": 275.08453, "r": 208.52695, "b": 283.45917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 226.86324000000002, "t": 275.08453, "r": 241.34396, "b": 283.45917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "72.0", "bbox": {"l": 226.86324000000002, "t": 275.08453, "r": 241.34396, "b": 283.45917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 261.86804, "t": 275.08453, "r": 276.34879, "b": 283.45917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "67.9", "bbox": {"l": 261.86804, "t": 275.08453, "r": 276.34879, "b": 283.45917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 67.663002, "t": 286.04355000000004, "r": 93.647629, "b": 294.41818, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "Picture", "bbox": {"l": 67.663002, "t": 286.04355000000004, "r": 93.647629, "b": 294.41818, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 135.32401, "t": 286.04355000000004, "r": 155.03215, "b": 294.41818, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "69-71", "bbox": {"l": 135.32401, "t": 286.04355000000004, "r": 155.03215, "b": 294.41818, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 167.95399, "t": 286.04355000000004, "r": 182.43472, "b": 294.41818, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "71.7", "bbox": {"l": 167.95399, "t": 286.04355000000004, "r": 182.43472, "b": 294.41818, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 194.0462, "t": 286.04355000000004, "r": 208.52695, "b": 294.41818, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "72.7", "bbox": {"l": 194.0462, "t": 286.04355000000004, "r": 208.52695, "b": 294.41818, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 226.86324000000002, "t": 286.04355000000004, "r": 241.34396, "b": 294.41818, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "72.0", "bbox": {"l": 226.86324000000002, "t": 286.04355000000004, "r": 241.34396, "b": 294.41818, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 261.86804, "t": 286.04355000000004, "r": 276.34879, "b": 294.41818, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "77.1", "bbox": {"l": 261.86804, "t": 286.04355000000004, "r": 276.34879, "b": 294.41818, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 67.663002, "t": 297.00253, "r": 122.40287999999998, "b": 305.37717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "Section-header", "bbox": {"l": 67.663002, "t": 297.00253, "r": 122.40287999999998, "b": 305.37717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 135.32401, "t": 297.00253, "r": 155.03215, "b": 305.37717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "83-84", "bbox": {"l": 135.32401, "t": 297.00253, "r": 155.03215, "b": 305.37717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 167.95399, "t": 297.00253, "r": 182.43472, "b": 305.37717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "67.6", "bbox": {"l": 167.95399, "t": 297.00253, "r": 182.43472, "b": 305.37717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 194.0462, "t": 297.00253, "r": 208.52695, "b": 305.37717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "69.3", "bbox": {"l": 194.0462, "t": 297.00253, "r": 208.52695, "b": 305.37717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 226.86324000000002, "t": 297.00253, "r": 241.34396, "b": 305.37717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "68.4", "bbox": {"l": 226.86324000000002, "t": 297.00253, "r": 241.34396, "b": 305.37717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 261.86804, "t": 297.00253, "r": 276.34879, "b": 305.37717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "74.6", "bbox": {"l": 261.86804, "t": 297.00253, "r": 276.34879, "b": 305.37717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 67.663002, "t": 307.96155, "r": 87.46978, "b": 316.33618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "Table", "bbox": {"l": 67.663002, "t": 307.96155, "r": 87.46978, "b": 316.33618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 135.32401, "t": 307.96155, "r": 155.03215, "b": 316.33618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "77-81", "bbox": {"l": 135.32401, "t": 307.96155, "r": 155.03215, "b": 316.33618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 167.95399, "t": 307.96155, "r": 182.43472, "b": 316.33618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "82.2", "bbox": {"l": 167.95399, "t": 307.96155, "r": 182.43472, "b": 316.33618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 194.0462, "t": 307.96155, "r": 208.52695, "b": 316.33618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "82.9", "bbox": {"l": 194.0462, "t": 307.96155, "r": 208.52695, "b": 316.33618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 226.86324000000002, "t": 307.96155, "r": 241.34396, "b": 316.33618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "82.2", "bbox": {"l": 226.86324000000002, "t": 307.96155, "r": 241.34396, "b": 316.33618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 261.86804, "t": 307.96155, "r": 276.34879, "b": 316.33618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "86.3", "bbox": {"l": 261.86804, "t": 307.96155, "r": 276.34879, "b": 316.33618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 67.663002, "t": 318.91953, "r": 83.623199, "b": 327.29416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "Text", "bbox": {"l": 67.663002, "t": 318.91953, "r": 83.623199, "b": 327.29416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 135.32401, "t": 318.91953, "r": 155.03215, "b": 327.29416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "84-86", "bbox": {"l": 135.32401, "t": 318.91953, "r": 155.03215, "b": 327.29416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 167.95399, "t": 318.91953, "r": 182.43472, "b": 327.29416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "84.6", "bbox": {"l": 167.95399, "t": 318.91953, "r": 182.43472, "b": 327.29416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 194.0462, "t": 318.91953, "r": 208.52695, "b": 327.29416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "85.8", "bbox": {"l": 194.0462, "t": 318.91953, "r": 208.52695, "b": 327.29416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 226.86324000000002, "t": 318.91953, "r": 241.34396, "b": 327.29416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "85.4", "bbox": {"l": 226.86324000000002, "t": 318.91953, "r": 241.34396, "b": 327.29416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 261.86804, "t": 318.91953, "r": 276.34879, "b": 327.29416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "88.1", "bbox": {"l": 261.86804, "t": 318.91953, "r": 276.34879, "b": 327.29416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 67.663002, "t": 329.87854, "r": 84.654327, "b": 338.25317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "Title", "bbox": {"l": 67.663002, "t": 329.87854, "r": 84.654327, "b": 338.25317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 135.32401, "t": 329.87854, "r": 155.03215, "b": 338.25317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "60-72", "bbox": {"l": 135.32401, "t": 329.87854, "r": 155.03215, "b": 338.25317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 167.95399, "t": 329.87854, "r": 182.43472, "b": 338.25317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "76.7", "bbox": {"l": 167.95399, "t": 329.87854, "r": 182.43472, "b": 338.25317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 194.0462, "t": 329.87854, "r": 208.52695, "b": 338.25317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "80.4", "bbox": {"l": 194.0462, "t": 329.87854, "r": 208.52695, "b": 338.25317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 226.86324000000002, "t": 329.87854, "r": 241.34396, "b": 338.25317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "79.9", "bbox": {"l": 226.86324000000002, "t": 329.87854, "r": 241.34396, "b": 338.25317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 261.86804, "t": 329.87854, "r": 276.34879, "b": 338.25317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "82.7", "bbox": {"l": 261.86804, "t": 329.87854, "r": 276.34879, "b": 338.25317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 67.663002, "t": 341.23654, "r": 78.628906, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "All", "bbox": {"l": 67.663002, "t": 341.23654, "r": 78.628906, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 135.32401, "t": 341.23654, "r": 155.03215, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "82-83", "bbox": {"l": 135.32401, "t": 341.23654, "r": 155.03215, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 167.95399, "t": 341.23654, "r": 182.43472, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "72.4", "bbox": {"l": 167.95399, "t": 341.23654, "r": 182.43472, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 194.0462, "t": 341.23654, "r": 208.52695, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "73.5", "bbox": {"l": 194.0462, "t": 341.23654, "r": 208.52695, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 226.86324000000002, "t": 341.23654, "r": 241.34396, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "73.4", "bbox": {"l": 226.86324000000002, "t": 341.23654, "r": 241.34396, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 261.86804, "t": 341.23654, "r": 276.34879, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "76.8", "bbox": {"l": 261.86804, "t": 341.23654, "r": 276.34879, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ecel", "ched", "ched", "lcel", "ched", "ched", "nl", "ecel", "ucel", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 14, "num_cols": 6, "table_cells": [{"bbox": {"l": 132.36501, "t": 197.97351000000003, "r": 157.99098, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "human", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 173.505, "t": 197.97351000000003, "r": 204.61841, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 4, "text": "MRCNN", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 220.13028, "t": 197.97351000000003, "r": 248.06958, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "FRCNN", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 258.03125, "t": 197.97351000000003, "r": 280.17825, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "YOLO", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 168.39301, "t": 208.93255999999997, "r": 181.99504, "b": 217.30719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "R50", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 192.39606, "t": 208.93255999999997, "r": 210.16747, "b": 217.30719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "R101", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 225.21309, "t": 208.93255999999997, "r": 242.9845, "b": 217.30719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "R101", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 260.51379, "t": 208.93255999999997, "r": 277.70239, "b": 217.30719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "v5x6", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 220.28954999999996, "r": 96.848633, "b": 228.66418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Caption", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 220.28954999999996, "r": 155.03215, "b": 228.66418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "84-89", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 220.28954999999996, "r": 182.43472, "b": 228.66418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "68.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 220.28954999999996, "r": 208.52695, "b": 228.66418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "71.5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 220.28954999999996, "r": 241.34396, "b": 228.66418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "70.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 220.28954999999996, "r": 276.34879, "b": 228.66418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "77.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 231.24854000000005, "r": 100.1662, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Footnote", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 231.24854000000005, "r": 155.03215, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "83-91", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 231.24854000000005, "r": 182.43472, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "70.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 231.24854000000005, "r": 208.52695, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "71.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 231.24854000000005, "r": 241.34396, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "73.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 231.24854000000005, "r": 276.34879, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "77.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 242.20752000000005, "r": 98.175659, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Formula", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 242.20752000000005, "r": 155.03215, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "83-85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 242.20752000000005, "r": 182.43472, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "60.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 242.20752000000005, "r": 208.52695, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "63.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 242.20752000000005, "r": 241.34396, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "63.5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 242.20752000000005, "r": 276.34879, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "66.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 253.16656, "r": 100.54279, "b": 261.5412, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "List-item", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 253.16656, "r": 155.03215, "b": 261.5412, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "87-88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 253.16656, "r": 182.43472, "b": 261.5412, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "81.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 253.16656, "r": 208.52695, "b": 261.5412, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "80.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 253.16656, "r": 241.34396, "b": 261.5412, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "81.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 253.16656, "r": 276.34879, "b": 261.5412, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "86.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 264.12555, "r": 110.19064, "b": 272.50018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-footer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 264.12555, "r": 155.03215, "b": 272.50018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "93-94", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 264.12555, "r": 182.43472, "b": 272.50018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "61.6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 264.12555, "r": 208.52695, "b": 272.50018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "59.3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 264.12555, "r": 241.34396, "b": 272.50018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "58.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 264.12555, "r": 276.34879, "b": 272.50018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "61.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 275.08453, "r": 112.94331999999999, "b": 283.45917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 275.08453, "r": 155.03215, "b": 283.45917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "85-89", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 275.08453, "r": 182.43472, "b": 283.45917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "71.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 275.08453, "r": 208.52695, "b": 283.45917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "70.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 275.08453, "r": 241.34396, "b": 283.45917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "72.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 275.08453, "r": 276.34879, "b": 283.45917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "67.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 286.04355000000004, "r": 93.647629, "b": 294.41818, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Picture", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 286.04355000000004, "r": 155.03215, "b": 294.41818, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "69-71", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 286.04355000000004, "r": 182.43472, "b": 294.41818, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "71.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 286.04355000000004, "r": 208.52695, "b": 294.41818, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "72.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 286.04355000000004, "r": 241.34396, "b": 294.41818, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "72.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 286.04355000000004, "r": 276.34879, "b": 294.41818, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "77.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 297.00253, "r": 122.40287999999998, "b": 305.37717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Section-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 297.00253, "r": 155.03215, "b": 305.37717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "83-84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 297.00253, "r": 182.43472, "b": 305.37717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "67.6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 297.00253, "r": 208.52695, "b": 305.37717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "69.3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 297.00253, "r": 241.34396, "b": 305.37717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "68.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 297.00253, "r": 276.34879, "b": 305.37717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "74.6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 307.96155, "r": 87.46978, "b": 316.33618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 307.96155, "r": 155.03215, "b": 316.33618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "77-81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 307.96155, "r": 182.43472, "b": 316.33618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "82.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 307.96155, "r": 208.52695, "b": 316.33618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "82.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 307.96155, "r": 241.34396, "b": 316.33618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "82.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 307.96155, "r": 276.34879, "b": 316.33618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "86.3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 318.91953, "r": 83.623199, "b": 327.29416, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Text", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 318.91953, "r": 155.03215, "b": 327.29416, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "84-86", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 318.91953, "r": 182.43472, "b": 327.29416, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "84.6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 318.91953, "r": 208.52695, "b": 327.29416, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "85.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 318.91953, "r": 241.34396, "b": 327.29416, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "85.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 318.91953, "r": 276.34879, "b": 327.29416, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "88.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 329.87854, "r": 84.654327, "b": 338.25317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Title", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 329.87854, "r": 155.03215, "b": 338.25317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "60-72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 329.87854, "r": 182.43472, "b": 338.25317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "76.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 329.87854, "r": 208.52695, "b": 338.25317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "80.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 329.87854, "r": 241.34396, "b": 338.25317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "79.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 329.87854, "r": 276.34879, "b": 338.25317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "82.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 341.23654, "r": 78.628906, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "All", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 341.23654, "r": 155.03215, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "82-83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 341.23654, "r": 182.43472, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "72.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 341.23654, "r": 208.52695, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "73.5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 341.23654, "r": 241.34396, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "73.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 341.23654, "r": 276.34879, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "76.8", "column_header": false, "row_header": false, "row_section": false}]}}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_header", "id": 11, "page_no": 5, "cluster": {"id": 11, "label": "page_header", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.8662876486778259, "cells": [{"id": 0, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 246.24382, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar", "bbox": {"l": 253.13897999999998, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar"}, {"label": "text", "id": 5, "page_no": 5, "cluster": {"id": 5, "label": "text", "bbox": {"l": 53.501999, "t": 86.87292000000002, "r": 295.64874, "b": 183.01709000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9782760143280029, "cells": [{"id": 2, "text": "Table 2: Prediction performance (mAP@0.5-0.95) of object", "bbox": {"l": 53.501999, "t": 86.87292000000002, "r": 294.04361, "b": 95.34618999999998, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "detection networks on DocLayNet test set. The MRCNN", "bbox": {"l": 53.79800000000001, "t": 97.83191, "r": 294.04373, "b": 106.30517999999995, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "(Mask R-CNN) and FRCNN (Faster R-CNN) models with", "bbox": {"l": 53.52, "t": 108.79088999999999, "r": 294.0437, "b": 117.26415999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "ResNet-50 or ResNet-101 backbone were trained based on", "bbox": {"l": 53.79800000000001, "t": 119.74987999999996, "r": 294.04373, "b": 128.22313999999994, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "the network architectures from the", "bbox": {"l": 53.79800000000001, "t": 130.70885999999996, "r": 202.43402, "b": 139.18213000000003, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "detectron2", "bbox": {"l": 206.08501, "t": 130.71783000000005, "r": 247.14215000000002, "b": 139.20905000000005, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "model zoo", "bbox": {"l": 250.95001, "t": 130.70885999999996, "r": 294.04254, "b": 139.18213000000003, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "(Mask R-CNN R50, R101-FPN 3x, Faster R-CNN R101-FPN", "bbox": {"l": 53.52002, "t": 141.66785000000004, "r": 294.04367, "b": 150.14111000000003, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "3x), with default configurations. The YOLO implementation", "bbox": {"l": 53.798019, "t": 152.62683000000004, "r": 294.04373, "b": 161.1001, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "utilized was YOLOv5x6 [13]. All models were initialised us-", "bbox": {"l": 53.798019, "t": 163.58582, "r": 295.64874, "b": 172.05908, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "ing pre-trained weights from the COCO 2017 dataset.", "bbox": {"l": 53.798019, "t": 174.54381999999998, "r": 268.62399, "b": 183.01709000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 2: Prediction performance (mAP@0.5-0.95) of object detection networks on DocLayNet test set. The MRCNN (Mask R-CNN) and FRCNN (Faster R-CNN) models with ResNet-50 or ResNet-101 backbone were trained based on the network architectures from the detectron2 model zoo (Mask R-CNN R50, R101-FPN 3x, Faster R-CNN R101-FPN 3x), with default configurations. The YOLO implementation utilized was YOLOv5x6 [13]. All models were initialised using pre-trained weights from the COCO 2017 dataset."}, {"label": "table", "id": 0, "page_no": 5, "cluster": {"id": 0, "label": "table", "bbox": {"l": 62.02753829956055, "t": 195.68006896972656, "r": 285.78955078125, "b": 351.6618957519531, "coord_origin": "TOPLEFT"}, "confidence": 0.9883638620376587, "cells": [{"id": 13, "text": "human", "bbox": {"l": 132.36501, "t": 197.97351000000003, "r": 157.99098, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "MRCNN", "bbox": {"l": 173.505, "t": 197.97351000000003, "r": 204.61841, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "FRCNN", "bbox": {"l": 220.13028, "t": 197.97351000000003, "r": 248.06958, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "YOLO", "bbox": {"l": 258.03125, "t": 197.97351000000003, "r": 280.17825, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "R50", "bbox": {"l": 168.39301, "t": 208.93255999999997, "r": 181.99504, "b": 217.30719, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "R101", "bbox": {"l": 192.39606, "t": 208.93255999999997, "r": 210.16747, "b": 217.30719, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "R101", "bbox": {"l": 225.21309, "t": 208.93255999999997, "r": 242.9845, "b": 217.30719, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "v5x6", "bbox": {"l": 260.51379, "t": 208.93255999999997, "r": 277.70239, "b": 217.30719, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Caption", "bbox": {"l": 67.663002, "t": 220.28954999999996, "r": 96.848633, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "84-89", "bbox": {"l": 135.32401, "t": 220.28954999999996, "r": 155.03215, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "68.4", "bbox": {"l": 167.95399, "t": 220.28954999999996, "r": 182.43472, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "71.5", "bbox": {"l": 194.0462, "t": 220.28954999999996, "r": 208.52695, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "70.1", "bbox": {"l": 226.86324000000002, "t": 220.28954999999996, "r": 241.34396, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "77.7", "bbox": {"l": 261.86804, "t": 220.28954999999996, "r": 276.34879, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Footnote", "bbox": {"l": 67.663002, "t": 231.24854000000005, "r": 100.1662, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "83-91", "bbox": {"l": 135.32401, "t": 231.24854000000005, "r": 155.03215, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "70.9", "bbox": {"l": 167.95399, "t": 231.24854000000005, "r": 182.43472, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "71.8", "bbox": {"l": 194.0462, "t": 231.24854000000005, "r": 208.52695, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "73.7", "bbox": {"l": 226.86324000000002, "t": 231.24854000000005, "r": 241.34396, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "77.2", "bbox": {"l": 261.86804, "t": 231.24854000000005, "r": 276.34879, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "Formula", "bbox": {"l": 67.663002, "t": 242.20752000000005, "r": 98.175659, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "83-85", "bbox": {"l": 135.32401, "t": 242.20752000000005, "r": 155.03215, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "60.1", "bbox": {"l": 167.95399, "t": 242.20752000000005, "r": 182.43472, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "63.4", "bbox": {"l": 194.0462, "t": 242.20752000000005, "r": 208.52695, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "63.5", "bbox": {"l": 226.86324000000002, "t": 242.20752000000005, "r": 241.34396, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "66.2", "bbox": {"l": 261.86804, "t": 242.20752000000005, "r": 276.34879, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "List-item", "bbox": {"l": 67.663002, "t": 253.16656, "r": 100.54279, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "87-88", "bbox": {"l": 135.32401, "t": 253.16656, "r": 155.03215, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "81.2", "bbox": {"l": 167.95399, "t": 253.16656, "r": 182.43472, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "80.8", "bbox": {"l": 194.0462, "t": 253.16656, "r": 208.52695, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "81.0", "bbox": {"l": 226.86324000000002, "t": 253.16656, "r": 241.34396, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "86.2", "bbox": {"l": 261.86804, "t": 253.16656, "r": 276.34879, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Page-footer", "bbox": {"l": 67.663002, "t": 264.12555, "r": 110.19064, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "93-94", "bbox": {"l": 135.32401, "t": 264.12555, "r": 155.03215, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "61.6", "bbox": {"l": 167.95399, "t": 264.12555, "r": 182.43472, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "59.3", "bbox": {"l": 194.0462, "t": 264.12555, "r": 208.52695, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "58.9", "bbox": {"l": 226.86324000000002, "t": 264.12555, "r": 241.34396, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "61.1", "bbox": {"l": 261.86804, "t": 264.12555, "r": 276.34879, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Page-header", "bbox": {"l": 67.663002, "t": 275.08453, "r": 112.94331999999999, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "85-89", "bbox": {"l": 135.32401, "t": 275.08453, "r": 155.03215, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "71.9", "bbox": {"l": 167.95399, "t": 275.08453, "r": 182.43472, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "70.0", "bbox": {"l": 194.0462, "t": 275.08453, "r": 208.52695, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "72.0", "bbox": {"l": 226.86324000000002, "t": 275.08453, "r": 241.34396, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "67.9", "bbox": {"l": 261.86804, "t": 275.08453, "r": 276.34879, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Picture", "bbox": {"l": 67.663002, "t": 286.04355000000004, "r": 93.647629, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "69-71", "bbox": {"l": 135.32401, "t": 286.04355000000004, "r": 155.03215, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "71.7", "bbox": {"l": 167.95399, "t": 286.04355000000004, "r": 182.43472, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "72.7", "bbox": {"l": 194.0462, "t": 286.04355000000004, "r": 208.52695, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "72.0", "bbox": {"l": 226.86324000000002, "t": 286.04355000000004, "r": 241.34396, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "77.1", "bbox": {"l": 261.86804, "t": 286.04355000000004, "r": 276.34879, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "Section-header", "bbox": {"l": 67.663002, "t": 297.00253, "r": 122.40287999999998, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "83-84", "bbox": {"l": 135.32401, "t": 297.00253, "r": 155.03215, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "67.6", "bbox": {"l": 167.95399, "t": 297.00253, "r": 182.43472, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "69.3", "bbox": {"l": 194.0462, "t": 297.00253, "r": 208.52695, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "68.4", "bbox": {"l": 226.86324000000002, "t": 297.00253, "r": 241.34396, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "74.6", "bbox": {"l": 261.86804, "t": 297.00253, "r": 276.34879, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "Table", "bbox": {"l": 67.663002, "t": 307.96155, "r": 87.46978, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "77-81", "bbox": {"l": 135.32401, "t": 307.96155, "r": 155.03215, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "82.2", "bbox": {"l": 167.95399, "t": 307.96155, "r": 182.43472, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "82.9", "bbox": {"l": 194.0462, "t": 307.96155, "r": 208.52695, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "82.2", "bbox": {"l": 226.86324000000002, "t": 307.96155, "r": 241.34396, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "86.3", "bbox": {"l": 261.86804, "t": 307.96155, "r": 276.34879, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "Text", "bbox": {"l": 67.663002, "t": 318.91953, "r": 83.623199, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "84-86", "bbox": {"l": 135.32401, "t": 318.91953, "r": 155.03215, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "84.6", "bbox": {"l": 167.95399, "t": 318.91953, "r": 182.43472, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "85.8", "bbox": {"l": 194.0462, "t": 318.91953, "r": 208.52695, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "85.4", "bbox": {"l": 226.86324000000002, "t": 318.91953, "r": 241.34396, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "88.1", "bbox": {"l": 261.86804, "t": 318.91953, "r": 276.34879, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Title", "bbox": {"l": 67.663002, "t": 329.87854, "r": 84.654327, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "60-72", "bbox": {"l": 135.32401, "t": 329.87854, "r": 155.03215, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "76.7", "bbox": {"l": 167.95399, "t": 329.87854, "r": 182.43472, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "80.4", "bbox": {"l": 194.0462, "t": 329.87854, "r": 208.52695, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "79.9", "bbox": {"l": 226.86324000000002, "t": 329.87854, "r": 241.34396, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "82.7", "bbox": {"l": 261.86804, "t": 329.87854, "r": 276.34879, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "All", "bbox": {"l": 67.663002, "t": 341.23654, "r": 78.628906, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "82-83", "bbox": {"l": 135.32401, "t": 341.23654, "r": 155.03215, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "72.4", "bbox": {"l": 167.95399, "t": 341.23654, "r": 182.43472, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "73.5", "bbox": {"l": 194.0462, "t": 341.23654, "r": 208.52695, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "73.4", "bbox": {"l": 226.86324000000002, "t": 341.23654, "r": 241.34396, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "76.8", "bbox": {"l": 261.86804, "t": 341.23654, "r": 276.34879, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": [{"id": 12, "label": "text", "bbox": {"l": 132.36501, "t": 197.97351000000003, "r": 157.99098, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "human", "bbox": {"l": 132.36501, "t": 197.97351000000003, "r": 157.99098, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 173.505, "t": 197.97351000000003, "r": 204.61841, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "MRCNN", "bbox": {"l": 173.505, "t": 197.97351000000003, "r": 204.61841, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 220.13028, "t": 197.97351000000003, "r": 248.06958, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "FRCNN", "bbox": {"l": 220.13028, "t": 197.97351000000003, "r": 248.06958, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 258.03125, "t": 197.97351000000003, "r": 280.17825, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "YOLO", "bbox": {"l": 258.03125, "t": 197.97351000000003, "r": 280.17825, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 168.39301, "t": 208.93255999999997, "r": 181.99504, "b": 217.30719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "R50", "bbox": {"l": 168.39301, "t": 208.93255999999997, "r": 181.99504, "b": 217.30719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 192.39606, "t": 208.93255999999997, "r": 210.16747, "b": 217.30719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "R101", "bbox": {"l": 192.39606, "t": 208.93255999999997, "r": 210.16747, "b": 217.30719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 225.21309, "t": 208.93255999999997, "r": 242.9845, "b": 217.30719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "R101", "bbox": {"l": 225.21309, "t": 208.93255999999997, "r": 242.9845, "b": 217.30719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 260.51379, "t": 208.93255999999997, "r": 277.70239, "b": 217.30719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "v5x6", "bbox": {"l": 260.51379, "t": 208.93255999999997, "r": 277.70239, "b": 217.30719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 67.663002, "t": 220.28954999999996, "r": 96.848633, "b": 228.66418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "Caption", "bbox": {"l": 67.663002, "t": 220.28954999999996, "r": 96.848633, "b": 228.66418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 135.32401, "t": 220.28954999999996, "r": 155.03215, "b": 228.66418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "84-89", "bbox": {"l": 135.32401, "t": 220.28954999999996, "r": 155.03215, "b": 228.66418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 167.95399, "t": 220.28954999999996, "r": 182.43472, "b": 228.66418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "68.4", "bbox": {"l": 167.95399, "t": 220.28954999999996, "r": 182.43472, "b": 228.66418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 194.0462, "t": 220.28954999999996, "r": 208.52695, "b": 228.66418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "71.5", "bbox": {"l": 194.0462, "t": 220.28954999999996, "r": 208.52695, "b": 228.66418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 226.86324000000002, "t": 220.28954999999996, "r": 241.34396, "b": 228.66418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "70.1", "bbox": {"l": 226.86324000000002, "t": 220.28954999999996, "r": 241.34396, "b": 228.66418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 261.86804, "t": 220.28954999999996, "r": 276.34879, "b": 228.66418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "77.7", "bbox": {"l": 261.86804, "t": 220.28954999999996, "r": 276.34879, "b": 228.66418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 67.663002, "t": 231.24854000000005, "r": 100.1662, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "Footnote", "bbox": {"l": 67.663002, "t": 231.24854000000005, "r": 100.1662, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 135.32401, "t": 231.24854000000005, "r": 155.03215, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "83-91", "bbox": {"l": 135.32401, "t": 231.24854000000005, "r": 155.03215, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 167.95399, "t": 231.24854000000005, "r": 182.43472, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "70.9", "bbox": {"l": 167.95399, "t": 231.24854000000005, "r": 182.43472, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 194.0462, "t": 231.24854000000005, "r": 208.52695, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "71.8", "bbox": {"l": 194.0462, "t": 231.24854000000005, "r": 208.52695, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 226.86324000000002, "t": 231.24854000000005, "r": 241.34396, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "73.7", "bbox": {"l": 226.86324000000002, "t": 231.24854000000005, "r": 241.34396, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 261.86804, "t": 231.24854000000005, "r": 276.34879, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "77.2", "bbox": {"l": 261.86804, "t": 231.24854000000005, "r": 276.34879, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 67.663002, "t": 242.20752000000005, "r": 98.175659, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "Formula", "bbox": {"l": 67.663002, "t": 242.20752000000005, "r": 98.175659, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 135.32401, "t": 242.20752000000005, "r": 155.03215, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "83-85", "bbox": {"l": 135.32401, "t": 242.20752000000005, "r": 155.03215, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 167.95399, "t": 242.20752000000005, "r": 182.43472, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "60.1", "bbox": {"l": 167.95399, "t": 242.20752000000005, "r": 182.43472, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 194.0462, "t": 242.20752000000005, "r": 208.52695, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "63.4", "bbox": {"l": 194.0462, "t": 242.20752000000005, "r": 208.52695, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 226.86324000000002, "t": 242.20752000000005, "r": 241.34396, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "63.5", "bbox": {"l": 226.86324000000002, "t": 242.20752000000005, "r": 241.34396, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 261.86804, "t": 242.20752000000005, "r": 276.34879, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "66.2", "bbox": {"l": 261.86804, "t": 242.20752000000005, "r": 276.34879, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 67.663002, "t": 253.16656, "r": 100.54279, "b": 261.5412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "List-item", "bbox": {"l": 67.663002, "t": 253.16656, "r": 100.54279, "b": 261.5412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 135.32401, "t": 253.16656, "r": 155.03215, "b": 261.5412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "87-88", "bbox": {"l": 135.32401, "t": 253.16656, "r": 155.03215, "b": 261.5412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 167.95399, "t": 253.16656, "r": 182.43472, "b": 261.5412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "81.2", "bbox": {"l": 167.95399, "t": 253.16656, "r": 182.43472, "b": 261.5412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 194.0462, "t": 253.16656, "r": 208.52695, "b": 261.5412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "80.8", "bbox": {"l": 194.0462, "t": 253.16656, "r": 208.52695, "b": 261.5412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 226.86324000000002, "t": 253.16656, "r": 241.34396, "b": 261.5412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "81.0", "bbox": {"l": 226.86324000000002, "t": 253.16656, "r": 241.34396, "b": 261.5412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 261.86804, "t": 253.16656, "r": 276.34879, "b": 261.5412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "86.2", "bbox": {"l": 261.86804, "t": 253.16656, "r": 276.34879, "b": 261.5412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 67.663002, "t": 264.12555, "r": 110.19064, "b": 272.50018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "Page-footer", "bbox": {"l": 67.663002, "t": 264.12555, "r": 110.19064, "b": 272.50018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 135.32401, "t": 264.12555, "r": 155.03215, "b": 272.50018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "93-94", "bbox": {"l": 135.32401, "t": 264.12555, "r": 155.03215, "b": 272.50018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 167.95399, "t": 264.12555, "r": 182.43472, "b": 272.50018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "61.6", "bbox": {"l": 167.95399, "t": 264.12555, "r": 182.43472, "b": 272.50018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 194.0462, "t": 264.12555, "r": 208.52695, "b": 272.50018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "59.3", "bbox": {"l": 194.0462, "t": 264.12555, "r": 208.52695, "b": 272.50018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 226.86324000000002, "t": 264.12555, "r": 241.34396, "b": 272.50018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "58.9", "bbox": {"l": 226.86324000000002, "t": 264.12555, "r": 241.34396, "b": 272.50018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 261.86804, "t": 264.12555, "r": 276.34879, "b": 272.50018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "61.1", "bbox": {"l": 261.86804, "t": 264.12555, "r": 276.34879, "b": 272.50018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 67.663002, "t": 275.08453, "r": 112.94331999999999, "b": 283.45917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "Page-header", "bbox": {"l": 67.663002, "t": 275.08453, "r": 112.94331999999999, "b": 283.45917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 135.32401, "t": 275.08453, "r": 155.03215, "b": 283.45917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "85-89", "bbox": {"l": 135.32401, "t": 275.08453, "r": 155.03215, "b": 283.45917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 167.95399, "t": 275.08453, "r": 182.43472, "b": 283.45917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "71.9", "bbox": {"l": 167.95399, "t": 275.08453, "r": 182.43472, "b": 283.45917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 194.0462, "t": 275.08453, "r": 208.52695, "b": 283.45917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "70.0", "bbox": {"l": 194.0462, "t": 275.08453, "r": 208.52695, "b": 283.45917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 226.86324000000002, "t": 275.08453, "r": 241.34396, "b": 283.45917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "72.0", "bbox": {"l": 226.86324000000002, "t": 275.08453, "r": 241.34396, "b": 283.45917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 261.86804, "t": 275.08453, "r": 276.34879, "b": 283.45917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "67.9", "bbox": {"l": 261.86804, "t": 275.08453, "r": 276.34879, "b": 283.45917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 67.663002, "t": 286.04355000000004, "r": 93.647629, "b": 294.41818, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "Picture", "bbox": {"l": 67.663002, "t": 286.04355000000004, "r": 93.647629, "b": 294.41818, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 135.32401, "t": 286.04355000000004, "r": 155.03215, "b": 294.41818, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "69-71", "bbox": {"l": 135.32401, "t": 286.04355000000004, "r": 155.03215, "b": 294.41818, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 167.95399, "t": 286.04355000000004, "r": 182.43472, "b": 294.41818, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "71.7", "bbox": {"l": 167.95399, "t": 286.04355000000004, "r": 182.43472, "b": 294.41818, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 194.0462, "t": 286.04355000000004, "r": 208.52695, "b": 294.41818, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "72.7", "bbox": {"l": 194.0462, "t": 286.04355000000004, "r": 208.52695, "b": 294.41818, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 226.86324000000002, "t": 286.04355000000004, "r": 241.34396, "b": 294.41818, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "72.0", "bbox": {"l": 226.86324000000002, "t": 286.04355000000004, "r": 241.34396, "b": 294.41818, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 261.86804, "t": 286.04355000000004, "r": 276.34879, "b": 294.41818, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "77.1", "bbox": {"l": 261.86804, "t": 286.04355000000004, "r": 276.34879, "b": 294.41818, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 67.663002, "t": 297.00253, "r": 122.40287999999998, "b": 305.37717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "Section-header", "bbox": {"l": 67.663002, "t": 297.00253, "r": 122.40287999999998, "b": 305.37717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 135.32401, "t": 297.00253, "r": 155.03215, "b": 305.37717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "83-84", "bbox": {"l": 135.32401, "t": 297.00253, "r": 155.03215, "b": 305.37717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 167.95399, "t": 297.00253, "r": 182.43472, "b": 305.37717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "67.6", "bbox": {"l": 167.95399, "t": 297.00253, "r": 182.43472, "b": 305.37717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 194.0462, "t": 297.00253, "r": 208.52695, "b": 305.37717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "69.3", "bbox": {"l": 194.0462, "t": 297.00253, "r": 208.52695, "b": 305.37717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 226.86324000000002, "t": 297.00253, "r": 241.34396, "b": 305.37717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "68.4", "bbox": {"l": 226.86324000000002, "t": 297.00253, "r": 241.34396, "b": 305.37717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 261.86804, "t": 297.00253, "r": 276.34879, "b": 305.37717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "74.6", "bbox": {"l": 261.86804, "t": 297.00253, "r": 276.34879, "b": 305.37717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 67.663002, "t": 307.96155, "r": 87.46978, "b": 316.33618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "Table", "bbox": {"l": 67.663002, "t": 307.96155, "r": 87.46978, "b": 316.33618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 135.32401, "t": 307.96155, "r": 155.03215, "b": 316.33618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "77-81", "bbox": {"l": 135.32401, "t": 307.96155, "r": 155.03215, "b": 316.33618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 167.95399, "t": 307.96155, "r": 182.43472, "b": 316.33618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "82.2", "bbox": {"l": 167.95399, "t": 307.96155, "r": 182.43472, "b": 316.33618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 194.0462, "t": 307.96155, "r": 208.52695, "b": 316.33618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "82.9", "bbox": {"l": 194.0462, "t": 307.96155, "r": 208.52695, "b": 316.33618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 226.86324000000002, "t": 307.96155, "r": 241.34396, "b": 316.33618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "82.2", "bbox": {"l": 226.86324000000002, "t": 307.96155, "r": 241.34396, "b": 316.33618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 261.86804, "t": 307.96155, "r": 276.34879, "b": 316.33618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "86.3", "bbox": {"l": 261.86804, "t": 307.96155, "r": 276.34879, "b": 316.33618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 67.663002, "t": 318.91953, "r": 83.623199, "b": 327.29416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "Text", "bbox": {"l": 67.663002, "t": 318.91953, "r": 83.623199, "b": 327.29416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 135.32401, "t": 318.91953, "r": 155.03215, "b": 327.29416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "84-86", "bbox": {"l": 135.32401, "t": 318.91953, "r": 155.03215, "b": 327.29416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 167.95399, "t": 318.91953, "r": 182.43472, "b": 327.29416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "84.6", "bbox": {"l": 167.95399, "t": 318.91953, "r": 182.43472, "b": 327.29416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 194.0462, "t": 318.91953, "r": 208.52695, "b": 327.29416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "85.8", "bbox": {"l": 194.0462, "t": 318.91953, "r": 208.52695, "b": 327.29416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 226.86324000000002, "t": 318.91953, "r": 241.34396, "b": 327.29416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "85.4", "bbox": {"l": 226.86324000000002, "t": 318.91953, "r": 241.34396, "b": 327.29416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 261.86804, "t": 318.91953, "r": 276.34879, "b": 327.29416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "88.1", "bbox": {"l": 261.86804, "t": 318.91953, "r": 276.34879, "b": 327.29416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 67.663002, "t": 329.87854, "r": 84.654327, "b": 338.25317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "Title", "bbox": {"l": 67.663002, "t": 329.87854, "r": 84.654327, "b": 338.25317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 135.32401, "t": 329.87854, "r": 155.03215, "b": 338.25317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "60-72", "bbox": {"l": 135.32401, "t": 329.87854, "r": 155.03215, "b": 338.25317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 167.95399, "t": 329.87854, "r": 182.43472, "b": 338.25317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "76.7", "bbox": {"l": 167.95399, "t": 329.87854, "r": 182.43472, "b": 338.25317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 194.0462, "t": 329.87854, "r": 208.52695, "b": 338.25317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "80.4", "bbox": {"l": 194.0462, "t": 329.87854, "r": 208.52695, "b": 338.25317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 226.86324000000002, "t": 329.87854, "r": 241.34396, "b": 338.25317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "79.9", "bbox": {"l": 226.86324000000002, "t": 329.87854, "r": 241.34396, "b": 338.25317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 261.86804, "t": 329.87854, "r": 276.34879, "b": 338.25317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "82.7", "bbox": {"l": 261.86804, "t": 329.87854, "r": 276.34879, "b": 338.25317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 67.663002, "t": 341.23654, "r": 78.628906, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "All", "bbox": {"l": 67.663002, "t": 341.23654, "r": 78.628906, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 135.32401, "t": 341.23654, "r": 155.03215, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "82-83", "bbox": {"l": 135.32401, "t": 341.23654, "r": 155.03215, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 167.95399, "t": 341.23654, "r": 182.43472, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "72.4", "bbox": {"l": 167.95399, "t": 341.23654, "r": 182.43472, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 194.0462, "t": 341.23654, "r": 208.52695, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "73.5", "bbox": {"l": 194.0462, "t": 341.23654, "r": 208.52695, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 226.86324000000002, "t": 341.23654, "r": 241.34396, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "73.4", "bbox": {"l": 226.86324000000002, "t": 341.23654, "r": 241.34396, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 261.86804, "t": 341.23654, "r": 276.34879, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "76.8", "bbox": {"l": 261.86804, "t": 341.23654, "r": 276.34879, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ecel", "ched", "ched", "lcel", "ched", "ched", "nl", "ecel", "ucel", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 14, "num_cols": 6, "table_cells": [{"bbox": {"l": 132.36501, "t": 197.97351000000003, "r": 157.99098, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "human", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 173.505, "t": 197.97351000000003, "r": 204.61841, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 4, "text": "MRCNN", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 220.13028, "t": 197.97351000000003, "r": 248.06958, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "FRCNN", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 258.03125, "t": 197.97351000000003, "r": 280.17825, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "YOLO", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 168.39301, "t": 208.93255999999997, "r": 181.99504, "b": 217.30719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "R50", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 192.39606, "t": 208.93255999999997, "r": 210.16747, "b": 217.30719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "R101", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 225.21309, "t": 208.93255999999997, "r": 242.9845, "b": 217.30719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "R101", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 260.51379, "t": 208.93255999999997, "r": 277.70239, "b": 217.30719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "v5x6", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 220.28954999999996, "r": 96.848633, "b": 228.66418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Caption", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 220.28954999999996, "r": 155.03215, "b": 228.66418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "84-89", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 220.28954999999996, "r": 182.43472, "b": 228.66418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "68.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 220.28954999999996, "r": 208.52695, "b": 228.66418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "71.5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 220.28954999999996, "r": 241.34396, "b": 228.66418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "70.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 220.28954999999996, "r": 276.34879, "b": 228.66418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "77.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 231.24854000000005, "r": 100.1662, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Footnote", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 231.24854000000005, "r": 155.03215, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "83-91", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 231.24854000000005, "r": 182.43472, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "70.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 231.24854000000005, "r": 208.52695, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "71.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 231.24854000000005, "r": 241.34396, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "73.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 231.24854000000005, "r": 276.34879, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "77.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 242.20752000000005, "r": 98.175659, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Formula", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 242.20752000000005, "r": 155.03215, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "83-85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 242.20752000000005, "r": 182.43472, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "60.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 242.20752000000005, "r": 208.52695, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "63.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 242.20752000000005, "r": 241.34396, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "63.5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 242.20752000000005, "r": 276.34879, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "66.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 253.16656, "r": 100.54279, "b": 261.5412, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "List-item", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 253.16656, "r": 155.03215, "b": 261.5412, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "87-88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 253.16656, "r": 182.43472, "b": 261.5412, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "81.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 253.16656, "r": 208.52695, "b": 261.5412, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "80.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 253.16656, "r": 241.34396, "b": 261.5412, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "81.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 253.16656, "r": 276.34879, "b": 261.5412, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "86.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 264.12555, "r": 110.19064, "b": 272.50018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-footer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 264.12555, "r": 155.03215, "b": 272.50018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "93-94", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 264.12555, "r": 182.43472, "b": 272.50018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "61.6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 264.12555, "r": 208.52695, "b": 272.50018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "59.3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 264.12555, "r": 241.34396, "b": 272.50018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "58.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 264.12555, "r": 276.34879, "b": 272.50018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "61.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 275.08453, "r": 112.94331999999999, "b": 283.45917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 275.08453, "r": 155.03215, "b": 283.45917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "85-89", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 275.08453, "r": 182.43472, "b": 283.45917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "71.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 275.08453, "r": 208.52695, "b": 283.45917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "70.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 275.08453, "r": 241.34396, "b": 283.45917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "72.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 275.08453, "r": 276.34879, "b": 283.45917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "67.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 286.04355000000004, "r": 93.647629, "b": 294.41818, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Picture", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 286.04355000000004, "r": 155.03215, "b": 294.41818, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "69-71", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 286.04355000000004, "r": 182.43472, "b": 294.41818, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "71.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 286.04355000000004, "r": 208.52695, "b": 294.41818, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "72.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 286.04355000000004, "r": 241.34396, "b": 294.41818, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "72.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 286.04355000000004, "r": 276.34879, "b": 294.41818, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "77.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 297.00253, "r": 122.40287999999998, "b": 305.37717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Section-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 297.00253, "r": 155.03215, "b": 305.37717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "83-84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 297.00253, "r": 182.43472, "b": 305.37717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "67.6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 297.00253, "r": 208.52695, "b": 305.37717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "69.3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 297.00253, "r": 241.34396, "b": 305.37717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "68.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 297.00253, "r": 276.34879, "b": 305.37717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "74.6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 307.96155, "r": 87.46978, "b": 316.33618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 307.96155, "r": 155.03215, "b": 316.33618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "77-81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 307.96155, "r": 182.43472, "b": 316.33618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "82.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 307.96155, "r": 208.52695, "b": 316.33618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "82.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 307.96155, "r": 241.34396, "b": 316.33618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "82.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 307.96155, "r": 276.34879, "b": 316.33618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "86.3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 318.91953, "r": 83.623199, "b": 327.29416, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Text", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 318.91953, "r": 155.03215, "b": 327.29416, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "84-86", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 318.91953, "r": 182.43472, "b": 327.29416, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "84.6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 318.91953, "r": 208.52695, "b": 327.29416, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "85.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 318.91953, "r": 241.34396, "b": 327.29416, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "85.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 318.91953, "r": 276.34879, "b": 327.29416, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "88.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 329.87854, "r": 84.654327, "b": 338.25317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Title", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 329.87854, "r": 155.03215, "b": 338.25317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "60-72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 329.87854, "r": 182.43472, "b": 338.25317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "76.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 329.87854, "r": 208.52695, "b": 338.25317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "80.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 329.87854, "r": 241.34396, "b": 338.25317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "79.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 329.87854, "r": 276.34879, "b": 338.25317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "82.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 341.23654, "r": 78.628906, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "All", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 341.23654, "r": 155.03215, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "82-83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 341.23654, "r": 182.43472, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "72.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 341.23654, "r": 208.52695, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "73.5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 341.23654, "r": 241.34396, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "73.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 341.23654, "r": 276.34879, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "76.8", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "text", "id": 4, "page_no": 5, "cluster": {"id": 4, "label": "text", "bbox": {"l": 53.528999, "t": 370.92755, "r": 295.55612, "b": 576.56317, "coord_origin": "TOPLEFT"}, "confidence": 0.9866557121276855, "cells": [{"id": 93, "text": "to avoid this at any cost in order to have clear, unbiased baseline", "bbox": {"l": 53.79800000000001, "t": 370.92755, "r": 294.04712, "b": 379.30219000000005, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "numbers for human document-layout annotation. Third, we in-", "bbox": {"l": 53.79800000000001, "t": 381.88654, "r": 295.55612, "b": 390.26117, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "troduced the feature of", "bbox": {"l": 53.79800000000001, "t": 392.84555, "r": 140.3623, "b": 401.22017999999997, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "snapping", "bbox": {"l": 142.99001, "t": 392.89041, "r": 175.9695, "b": 401.2291599999999, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "boxes around text segments to", "bbox": {"l": 178.951, "t": 392.84555, "r": 294.04083, "b": 401.22017999999997, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "obtain a pixel-accurate annotation and again reduce time and effort.", "bbox": {"l": 53.79800000000001, "t": 403.80453, "r": 295.42493, "b": 412.17917, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "The CCS annotation tool automatically shrinks every user-drawn", "bbox": {"l": 53.528999, "t": 414.76355, "r": 294.04251, "b": 423.13818, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "box to the minimum bounding-box around the enclosed text-cells", "bbox": {"l": 53.79800000000001, "t": 425.72253, "r": 294.04807, "b": 434.09717, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "for all purely text-based segments, which excludes only", "bbox": {"l": 53.79800000000001, "t": 436.6815500000001, "r": 256.80627, "b": 445.0561799999999, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "Table", "bbox": {"l": 259.04199, "t": 436.72641, "r": 278.10455, "b": 445.06516, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "and", "bbox": {"l": 280.54999, "t": 436.6815500000001, "r": 294.04443, "b": 445.0561799999999, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "Picture", "bbox": {"l": 53.79800000000001, "t": 447.68539, "r": 78.875587, "b": 456.02413999999993, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": ". For the latter, we instructed annotation staff to minimise", "bbox": {"l": 78.876999, "t": 447.64053, "r": 294.04852, "b": 456.01517, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "inclusion of surrounding whitespace while including all graphical", "bbox": {"l": 53.79800000000001, "t": 458.59955, "r": 294.04645, "b": 466.97418, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "lines. A downside of snapping boxes to enclosed text cells is that", "bbox": {"l": 53.79800000000001, "t": 469.55853, "r": 294.0416, "b": 477.93317, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "some wrongly parsed PDF pages cannot be annotated correctly and", "bbox": {"l": 53.79800000000001, "t": 480.51654, "r": 294.04538, "b": 488.89117, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "need to be skipped. Fourth, we established a way to flag pages as", "bbox": {"l": 53.79800000000001, "t": 491.47552, "r": 294.04312, "b": 499.85016, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "rejected", "bbox": {"l": 53.79800000000001, "t": 502.4794, "r": 80.597939, "b": 510.81815, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "for cases where no valid annotation according to the label", "bbox": {"l": 83.366997, "t": 502.43454, "r": 294.04483, "b": 510.80917, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "guidelines could be achieved. Example cases for this would be PDF", "bbox": {"l": 53.79800000000001, "t": 513.3935200000001, "r": 294.25833, "b": 521.7681600000001, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "pages that render incorrectly or contain layouts that are impossible", "bbox": {"l": 53.79800000000001, "t": 524.35254, "r": 294.04535, "b": 532.72717, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "to capture with non-overlapping rectangles. Such rejected pages are", "bbox": {"l": 53.79800000000001, "t": 535.31155, "r": 294.04535, "b": 543.68617, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "not contained in the final dataset. With all these measures in place,", "bbox": {"l": 53.79800000000001, "t": 546.27055, "r": 295.02759, "b": 554.64517, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "experienced annotation staff managed to annotate a single page in", "bbox": {"l": 53.79800000000001, "t": 557.22955, "r": 294.0488, "b": 565.6041700000001, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "a typical timeframe of 20s to 60s, depending on its complexity.", "bbox": {"l": 53.79800000000001, "t": 568.18855, "r": 281.80457, "b": 576.56317, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "to avoid this at any cost in order to have clear, unbiased baseline numbers for human document-layout annotation. Third, we introduced the feature of snapping boxes around text segments to obtain a pixel-accurate annotation and again reduce time and effort. The CCS annotation tool automatically shrinks every user-drawn box to the minimum bounding-box around the enclosed text-cells for all purely text-based segments, which excludes only Table and Picture . For the latter, we instructed annotation staff to minimise inclusion of surrounding whitespace while including all graphical lines. A downside of snapping boxes to enclosed text cells is that some wrongly parsed PDF pages cannot be annotated correctly and need to be skipped. Fourth, we established a way to flag pages as rejected for cases where no valid annotation according to the label guidelines could be achieved. Example cases for this would be PDF pages that render incorrectly or contain layouts that are impossible to capture with non-overlapping rectangles. Such rejected pages are not contained in the final dataset. With all these measures in place, experienced annotation staff managed to annotate a single page in a typical timeframe of 20s to 60s, depending on its complexity."}, {"label": "section_header", "id": 10, "page_no": 5, "cluster": {"id": 10, "label": "section_header", "bbox": {"l": 53.79800000000001, "t": 588.12991, "r": 147.48535, "b": 598.43901, "coord_origin": "TOPLEFT"}, "confidence": 0.9419495463371277, "cells": [{"id": 118, "text": "5", "bbox": {"l": 53.79800000000001, "t": 588.12991, "r": 59.405277, "b": 598.43901, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "EXPERIMENTS", "bbox": {"l": 70.314377, "t": 588.12991, "r": 147.48535, "b": 598.43901, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5 EXPERIMENTS"}, {"label": "text", "id": 2, "page_no": 5, "cluster": {"id": 2, "label": "text", "bbox": {"l": 53.484001, "t": 613.25356, "r": 295.4281, "b": 709.299171, "coord_origin": "TOPLEFT"}, "confidence": 0.987605094909668, "cells": [{"id": 120, "text": "The primary goal of DocLayNet is to obtain high-quality ML models", "bbox": {"l": 53.528999, "t": 613.25356, "r": 294.04871, "b": 621.6281700000001, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "capable of accurate document-layout analysis on a wide variety", "bbox": {"l": 53.79800000000001, "t": 624.21255, "r": 294.27576, "b": 632.58717, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "of challenging layouts. As discussed in Section 2, object detection", "bbox": {"l": 53.79800000000001, "t": 635.17155, "r": 294.04144, "b": 643.54617, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "models are currently the easiest to use, due to the standardisation", "bbox": {"l": 53.79800000000001, "t": 646.13055, "r": 294.04163, "b": 654.50517, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "of ground-truth data in COCO format [16] and the availability of", "bbox": {"l": 53.79800000000001, "t": 657.0885499999999, "r": 294.0412, "b": 665.46317, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "general frameworks such as", "bbox": {"l": 53.79800000000001, "t": 668.04755, "r": 155.01054, "b": 676.42217, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "detectron2", "bbox": {"l": 157.23599, "t": 668.09238, "r": 193.26666, "b": 676.43114, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "[17]. Furthermore, baseline", "bbox": {"l": 195.867, "t": 668.04755, "r": 294.0473, "b": 676.42217, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "numbers in PubLayNet and DocBank were obtained using standard", "bbox": {"l": 53.79800000000001, "t": 679.0065500000001, "r": 294.04538, "b": 687.38117, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "object detection models such as Mask R-CNN and Faster R-CNN.", "bbox": {"l": 53.79800000000001, "t": 689.96555, "r": 295.4281, "b": 698.3401719999999, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "As such, we will relate to these object detection methods in this", "bbox": {"l": 53.484001, "t": 700.9245530000001, "r": 294.04413, "b": 709.299171, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The primary goal of DocLayNet is to obtain high-quality ML models capable of accurate document-layout analysis on a wide variety of challenging layouts. As discussed in Section 2, object detection models are currently the easiest to use, due to the standardisation of ground-truth data in COCO format [16] and the availability of general frameworks such as detectron2 [17]. Furthermore, baseline numbers in PubLayNet and DocBank were obtained using standard object detection models such as Mask R-CNN and Faster R-CNN. As such, we will relate to these object detection methods in this"}, {"label": "picture", "id": 6, "page_no": 5, "cluster": {"id": 6, "label": "picture", "bbox": {"l": 323.48431396484375, "t": 89.88603210449219, "r": 553.5411376953125, "b": 260.0107727050781, "coord_origin": "TOPLEFT"}, "confidence": 0.9782691597938538, "cells": [{"id": 131, "text": "0", "bbox": {"l": 349.16577, "t": 246.68017999999995, "r": 352.48175, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "20", "bbox": {"l": 385.93698, "t": 246.68017999999995, "r": 392.56894, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "40", "bbox": {"l": 424.366, "t": 246.68017999999995, "r": 430.99796, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "60", "bbox": {"l": 462.79504000000003, "t": 246.68017999999995, "r": 469.427, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "80", "bbox": {"l": 501.22406, "t": 246.68017999999995, "r": 507.85602, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "100", "bbox": {"l": 537.99524, "t": 246.68017999999995, "r": 547.94318, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "% of DocLayNet training set", "bbox": {"l": 410.28143, "t": 253.80840999999998, "r": 483.47278000000006, "b": 259.88251, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "50", "bbox": {"l": 330.93539, "t": 218.38464, "r": 337.56735, "b": 224.45874000000003, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "55", "bbox": {"l": 330.93539, "t": 192.08660999999995, "r": 337.56735, "b": 198.16071, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "60", "bbox": {"l": 330.93539, "t": 165.78864, "r": 337.56735, "b": 171.86273000000006, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "65", "bbox": {"l": 330.93539, "t": 139.49059999999997, "r": 337.56735, "b": 145.56470000000002, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "70", "bbox": {"l": 330.93539, "t": 113.19263000000001, "r": 337.56735, "b": 119.26671999999996, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "mAP 0.50:0.95", "bbox": {"l": 322.92276, "t": 148.37689, "r": 328.99686, "b": 186.79218000000003, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "10", "bbox": {"l": 470.97235, "t": 235.36676, "r": 477.6055, "b": 241.44086000000004, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "1", "bbox": {"l": 477.65662, "t": 234.82390999999996, "r": 479.97778000000005, "b": 239.07581000000005, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "10", "bbox": {"l": 531.55127, "t": 235.41234999999995, "r": 538.18445, "b": 241.48645, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "2", "bbox": {"l": 538.23553, "t": 234.86951, "r": 540.5567, "b": 239.1214, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "50", "bbox": {"l": 404.91125, "t": 216.00005999999996, "r": 411.54321, "b": 222.07416, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "55", "bbox": {"l": 404.91125, "t": 200.22125000000005, "r": 411.54321, "b": 206.29534999999998, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "60", "bbox": {"l": 404.91125, "t": 184.44244000000003, "r": 411.54321, "b": 190.51653999999996, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "65", "bbox": {"l": 404.91125, "t": 168.66364, "r": 411.54321, "b": 174.73773000000006, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "70", "bbox": {"l": 404.91125, "t": 152.88489000000004, "r": 411.54321, "b": 158.95898, "coord_origin": "TOPLEFT"}}], "children": [{"id": 92, "label": "text", "bbox": {"l": 349.16577, "t": 246.68017999999995, "r": 352.48175, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 131, "text": "0", "bbox": {"l": 349.16577, "t": 246.68017999999995, "r": 352.48175, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 385.93698, "t": 246.68017999999995, "r": 392.56894, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 132, "text": "20", "bbox": {"l": 385.93698, "t": 246.68017999999995, "r": 392.56894, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 424.366, "t": 246.68017999999995, "r": 430.99796, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 133, "text": "40", "bbox": {"l": 424.366, "t": 246.68017999999995, "r": 430.99796, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 462.79504000000003, "t": 246.68017999999995, "r": 469.427, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 134, "text": "60", "bbox": {"l": 462.79504000000003, "t": 246.68017999999995, "r": 469.427, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 501.22406, "t": 246.68017999999995, "r": 507.85602, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 135, "text": "80", "bbox": {"l": 501.22406, "t": 246.68017999999995, "r": 507.85602, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 537.99524, "t": 246.68017999999995, "r": 547.94318, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 136, "text": "100", "bbox": {"l": 537.99524, "t": 246.68017999999995, "r": 547.94318, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 410.28143, "t": 253.80840999999998, "r": 483.47278000000006, "b": 259.88251, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 137, "text": "% of DocLayNet training set", "bbox": {"l": 410.28143, "t": 253.80840999999998, "r": 483.47278000000006, "b": 259.88251, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 330.93539, "t": 218.38464, "r": 337.56735, "b": 224.45874000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 138, "text": "50", "bbox": {"l": 330.93539, "t": 218.38464, "r": 337.56735, "b": 224.45874000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 330.93539, "t": 192.08660999999995, "r": 337.56735, "b": 198.16071, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 139, "text": "55", "bbox": {"l": 330.93539, "t": 192.08660999999995, "r": 337.56735, "b": 198.16071, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 330.93539, "t": 165.78864, "r": 337.56735, "b": 171.86273000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 140, "text": "60", "bbox": {"l": 330.93539, "t": 165.78864, "r": 337.56735, "b": 171.86273000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 330.93539, "t": 139.49059999999997, "r": 337.56735, "b": 145.56470000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 141, "text": "65", "bbox": {"l": 330.93539, "t": 139.49059999999997, "r": 337.56735, "b": 145.56470000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 330.93539, "t": 113.19263000000001, "r": 337.56735, "b": 119.26671999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 142, "text": "70", "bbox": {"l": 330.93539, "t": 113.19263000000001, "r": 337.56735, "b": 119.26671999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 322.92276, "t": 148.37689, "r": 328.99686, "b": 186.79218000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 143, "text": "mAP 0.50:0.95", "bbox": {"l": 322.92276, "t": 148.37689, "r": 328.99686, "b": 186.79218000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 470.97235, "t": 235.36676, "r": 477.6055, "b": 241.44086000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 144, "text": "10", "bbox": {"l": 470.97235, "t": 235.36676, "r": 477.6055, "b": 241.44086000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 477.65662, "t": 234.82390999999996, "r": 479.97778000000005, "b": 239.07581000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 145, "text": "1", "bbox": {"l": 477.65662, "t": 234.82390999999996, "r": 479.97778000000005, "b": 239.07581000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 531.55127, "t": 235.41234999999995, "r": 538.18445, "b": 241.48645, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 146, "text": "10", "bbox": {"l": 531.55127, "t": 235.41234999999995, "r": 538.18445, "b": 241.48645, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 538.23553, "t": 234.86951, "r": 540.5567, "b": 239.1214, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 147, "text": "2", "bbox": {"l": 538.23553, "t": 234.86951, "r": 540.5567, "b": 239.1214, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 404.91125, "t": 216.00005999999996, "r": 411.54321, "b": 222.07416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 148, "text": "50", "bbox": {"l": 404.91125, "t": 216.00005999999996, "r": 411.54321, "b": 222.07416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 404.91125, "t": 200.22125000000005, "r": 411.54321, "b": 206.29534999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 149, "text": "55", "bbox": {"l": 404.91125, "t": 200.22125000000005, "r": 411.54321, "b": 206.29534999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 404.91125, "t": 184.44244000000003, "r": 411.54321, "b": 190.51653999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 150, "text": "60", "bbox": {"l": 404.91125, "t": 184.44244000000003, "r": 411.54321, "b": 190.51653999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 404.91125, "t": 168.66364, "r": 411.54321, "b": 174.73773000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 151, "text": "65", "bbox": {"l": 404.91125, "t": 168.66364, "r": 411.54321, "b": 174.73773000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 404.91125, "t": 152.88489000000004, "r": 411.54321, "b": 158.95898, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 152, "text": "70", "bbox": {"l": 404.91125, "t": 152.88489000000004, "r": 411.54321, "b": 158.95898, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "caption", "id": 7, "page_no": 5, "cluster": {"id": 7, "label": "caption", "bbox": {"l": 317.95499, "t": 279.01599, "r": 559.80579, "b": 342.28418000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9639935493469238, "cells": [{"id": 153, "text": "Figure 5: Prediction performance (mAP@0.5-0.95) of a Mask", "bbox": {"l": 317.95499, "t": 279.01599, "r": 558.47876, "b": 287.48923, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "R-CNN network with ResNet50 backbone trained on increas-", "bbox": {"l": 317.95499, "t": 289.97501, "r": 559.80579, "b": 298.44824, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "ing fractions of the DocLayNet dataset. The learning curve", "bbox": {"l": 317.95499, "t": 300.93399, "r": 558.20068, "b": 309.40723, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "flattens around the 80% mark, indicating that increasing the", "bbox": {"l": 317.95499, "t": 311.89297, "r": 558.20062, "b": 320.36620999999997, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "size of the DocLayNet dataset with similar data will not yield", "bbox": {"l": 317.95499, "t": 322.85196, "r": 558.20074, "b": 331.3252, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "significantly better predictions.", "bbox": {"l": 317.95499, "t": 333.81094, "r": 445.24207, "b": 342.28418000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 5: Prediction performance (mAP@0.5-0.95) of a Mask R-CNN network with ResNet50 backbone trained on increasing fractions of the DocLayNet dataset. The learning curve flattens around the 80% mark, indicating that increasing the size of the DocLayNet dataset with similar data will not yield significantly better predictions."}, {"label": "text", "id": 8, "page_no": 5, "cluster": {"id": 8, "label": "text", "bbox": {"l": 317.95499, "t": 384.01154, "r": 558.20416, "b": 403.34517999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9594221711158752, "cells": [{"id": 159, "text": "paper and leave the detailed evaluation of more recent methods", "bbox": {"l": 317.95499, "t": 384.01154, "r": 558.20416, "b": 392.38617, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "mentioned in Section 2 for future work.", "bbox": {"l": 317.95499, "t": 394.97055, "r": 463.04938, "b": 403.34517999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "paper and leave the detailed evaluation of more recent methods mentioned in Section 2 for future work."}, {"label": "text", "id": 3, "page_no": 5, "cluster": {"id": 3, "label": "text", "bbox": {"l": 317.64099, "t": 405.92953, "r": 558.4364, "b": 480.05716, "coord_origin": "TOPLEFT"}, "confidence": 0.9872915148735046, "cells": [{"id": 161, "text": "In this section, we will present several aspects related to the", "bbox": {"l": 327.918, "t": 405.92953, "r": 558.19836, "b": 414.30417, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "performance of object detection models on DocLayNet. Similarly", "bbox": {"l": 317.95499, "t": 416.88855, "r": 558.4364, "b": 425.26318, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "as in PubLayNet, we will evaluate the quality of their predictions", "bbox": {"l": 317.95499, "t": 427.84653, "r": 558.20563, "b": 436.22116, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "using mean average precision (mAP) with 10 overlaps that range", "bbox": {"l": 317.95499, "t": 438.80554, "r": 558.20044, "b": 447.18018, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "from 0.5 to 0.95 in steps of 0.05 (mAP@0.5-0.95). These scores are", "bbox": {"l": 317.95499, "t": 449.76453000000004, "r": 558.19891, "b": 458.13916, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "computed by leveraging the evaluation code provided by the COCO", "bbox": {"l": 317.95499, "t": 460.72354, "r": 558.20239, "b": 469.09818, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "API [16].", "bbox": {"l": 317.64099, "t": 471.68253, "r": 350.32352, "b": 480.05716, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In this section, we will present several aspects related to the performance of object detection models on DocLayNet. Similarly as in PubLayNet, we will evaluate the quality of their predictions using mean average precision (mAP) with 10 overlaps that range from 0.5 to 0.95 in steps of 0.05 (mAP@0.5-0.95). These scores are computed by leveraging the evaluation code provided by the COCO API [16]."}, {"label": "section_header", "id": 9, "page_no": 5, "cluster": {"id": 9, "label": "section_header", "bbox": {"l": 317.95499, "t": 496.8219, "r": 466.8532400000001, "b": 507.13098, "coord_origin": "TOPLEFT"}, "confidence": 0.9579005241394043, "cells": [{"id": 168, "text": "Baselines for Object Detection", "bbox": {"l": 317.95499, "t": 496.8219, "r": 466.8532400000001, "b": 507.13098, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Baselines for Object Detection"}, {"label": "text", "id": 1, "page_no": 5, "cluster": {"id": 1, "label": "text", "bbox": {"l": 317.74899, "t": 512.02454, "r": 558.43085, "b": 706.700172, "coord_origin": "TOPLEFT"}, "confidence": 0.987722635269165, "cells": [{"id": 169, "text": "In Table 2, we present baseline experiments (given in mAP) on Mask", "bbox": {"l": 317.95499, "t": 512.02454, "r": 558.43085, "b": 520.39917, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "R-CNN [12], Faster R-CNN [11], and YOLOv5 [13]. Both training", "bbox": {"l": 317.95499, "t": 522.9835499999999, "r": 558.20117, "b": 531.35818, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "and evaluation were performed on RGB images with dimensions of", "bbox": {"l": 317.95499, "t": 533.94254, "r": 558.20233, "b": 542.31717, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "1025", "bbox": {"l": 317.74899, "t": 544.90155, "r": 334.09296, "b": 553.27617, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "\u00d7", "bbox": {"l": 334.81201, "t": 544.84775, "r": 340.51465, "b": 552.5499, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "1025 pixels. For training, we only used one annotation in case", "bbox": {"l": 341.233, "t": 544.90155, "r": 558.20117, "b": 553.27617, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "of redundantly annotated pages. As one can observe, the variation", "bbox": {"l": 317.95499, "t": 555.85956, "r": 558.20392, "b": 564.23418, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "in mAP between the models is rather low, but overall between 6", "bbox": {"l": 317.95499, "t": 566.8185599999999, "r": 558.2041, "b": 575.19318, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "and 10% lower than the mAP computed from the pairwise human", "bbox": {"l": 317.95499, "t": 577.77756, "r": 558.2052, "b": 586.15218, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "annotations on triple-annotated pages. This gives a good indication", "bbox": {"l": 317.95499, "t": 588.73656, "r": 558.20233, "b": 597.11118, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "that the DocLayNet dataset poses a worthwhile challenge for the", "bbox": {"l": 317.95499, "t": 599.69556, "r": 558.1983, "b": 608.0701799999999, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "research community to close the gap between human recognition", "bbox": {"l": 317.95499, "t": 610.65456, "r": 558.20502, "b": 619.02917, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "and ML approaches. It is interesting to see that Mask R-CNN and", "bbox": {"l": 317.95499, "t": 621.61356, "r": 558.20337, "b": 629.98817, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "Faster R-CNN produce very comparable mAP scores, indicating", "bbox": {"l": 317.95499, "t": 632.5725600000001, "r": 558.2041, "b": 640.94717, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "that pixel-based image segmentation derived from bounding-boxes", "bbox": {"l": 317.95499, "t": 643.53156, "r": 558.20245, "b": 651.90617, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "does not help to obtain better predictions. On the other hand, the", "bbox": {"l": 317.95499, "t": 654.49055, "r": 558.19757, "b": 662.86517, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": "more recent Yolov5x model does very well and even out-performs", "bbox": {"l": 317.95499, "t": 665.44855, "r": 558.20404, "b": 673.82317, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "humans on selected labels such as", "bbox": {"l": 317.95499, "t": 676.40755, "r": 444.54102, "b": 684.78217, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "Text", "bbox": {"l": 446.78900000000004, "t": 676.45238, "r": 461.95261000000005, "b": 684.79114, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": ",", "bbox": {"l": 461.95599000000004, "t": 676.40755, "r": 463.96805000000006, "b": 684.78217, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "Table", "bbox": {"l": 466.2170100000001, "t": 676.45238, "r": 485.66998000000007, "b": 684.79114, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "and", "bbox": {"l": 488.1290000000001, "t": 676.40755, "r": 501.89330999999993, "b": 684.78217, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "Picture", "bbox": {"l": 504.142, "t": 676.45238, "r": 529.21954, "b": 684.79114, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": ". This is", "bbox": {"l": 529.22101, "t": 676.40755, "r": 558.20392, "b": 684.78217, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "not entirely surprising, as", "bbox": {"l": 317.95499, "t": 687.36655, "r": 410.81366, "b": 695.741173, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "Text", "bbox": {"l": 413.05301, "t": 687.41138, "r": 427.67865, "b": 695.750137, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": ",", "bbox": {"l": 427.67801, "t": 687.36655, "r": 429.62103, "b": 695.741173, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "Table", "bbox": {"l": 431.86099, "t": 687.41138, "r": 450.62881000000004, "b": 695.750137, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "and", "bbox": {"l": 453.082, "t": 687.36655, "r": 466.37402, "b": 695.741173, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "Picture", "bbox": {"l": 468.61499, "t": 687.41138, "r": 492.83208999999994, "b": 695.750137, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "are abundant and", "bbox": {"l": 495.28201, "t": 687.36655, "r": 558.2005, "b": 695.741173, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "the most visually distinctive in a document.", "bbox": {"l": 317.95499, "t": 698.325554, "r": 477.53903, "b": 706.700172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In Table 2, we present baseline experiments (given in mAP) on Mask R-CNN [12], Faster R-CNN [11], and YOLOv5 [13]. Both training and evaluation were performed on RGB images with dimensions of 1025 \u00d7 1025 pixels. For training, we only used one annotation in case of redundantly annotated pages. As one can observe, the variation in mAP between the models is rather low, but overall between 6 and 10% lower than the mAP computed from the pairwise human annotations on triple-annotated pages. This gives a good indication that the DocLayNet dataset poses a worthwhile challenge for the research community to close the gap between human recognition and ML approaches. It is interesting to see that Mask R-CNN and Faster R-CNN produce very comparable mAP scores, indicating that pixel-based image segmentation derived from bounding-boxes does not help to obtain better predictions. On the other hand, the more recent Yolov5x model does very well and even out-performs humans on selected labels such as Text , Table and Picture . This is not entirely surprising, as Text , Table and Picture are abundant and the most visually distinctive in a document."}], "body": [{"label": "text", "id": 5, "page_no": 5, "cluster": {"id": 5, "label": "text", "bbox": {"l": 53.501999, "t": 86.87292000000002, "r": 295.64874, "b": 183.01709000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9782760143280029, "cells": [{"id": 2, "text": "Table 2: Prediction performance (mAP@0.5-0.95) of object", "bbox": {"l": 53.501999, "t": 86.87292000000002, "r": 294.04361, "b": 95.34618999999998, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "detection networks on DocLayNet test set. The MRCNN", "bbox": {"l": 53.79800000000001, "t": 97.83191, "r": 294.04373, "b": 106.30517999999995, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "(Mask R-CNN) and FRCNN (Faster R-CNN) models with", "bbox": {"l": 53.52, "t": 108.79088999999999, "r": 294.0437, "b": 117.26415999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "ResNet-50 or ResNet-101 backbone were trained based on", "bbox": {"l": 53.79800000000001, "t": 119.74987999999996, "r": 294.04373, "b": 128.22313999999994, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "the network architectures from the", "bbox": {"l": 53.79800000000001, "t": 130.70885999999996, "r": 202.43402, "b": 139.18213000000003, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "detectron2", "bbox": {"l": 206.08501, "t": 130.71783000000005, "r": 247.14215000000002, "b": 139.20905000000005, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "model zoo", "bbox": {"l": 250.95001, "t": 130.70885999999996, "r": 294.04254, "b": 139.18213000000003, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "(Mask R-CNN R50, R101-FPN 3x, Faster R-CNN R101-FPN", "bbox": {"l": 53.52002, "t": 141.66785000000004, "r": 294.04367, "b": 150.14111000000003, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "3x), with default configurations. The YOLO implementation", "bbox": {"l": 53.798019, "t": 152.62683000000004, "r": 294.04373, "b": 161.1001, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "utilized was YOLOv5x6 [13]. All models were initialised us-", "bbox": {"l": 53.798019, "t": 163.58582, "r": 295.64874, "b": 172.05908, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "ing pre-trained weights from the COCO 2017 dataset.", "bbox": {"l": 53.798019, "t": 174.54381999999998, "r": 268.62399, "b": 183.01709000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 2: Prediction performance (mAP@0.5-0.95) of object detection networks on DocLayNet test set. The MRCNN (Mask R-CNN) and FRCNN (Faster R-CNN) models with ResNet-50 or ResNet-101 backbone were trained based on the network architectures from the detectron2 model zoo (Mask R-CNN R50, R101-FPN 3x, Faster R-CNN R101-FPN 3x), with default configurations. The YOLO implementation utilized was YOLOv5x6 [13]. All models were initialised using pre-trained weights from the COCO 2017 dataset."}, {"label": "table", "id": 0, "page_no": 5, "cluster": {"id": 0, "label": "table", "bbox": {"l": 62.02753829956055, "t": 195.68006896972656, "r": 285.78955078125, "b": 351.6618957519531, "coord_origin": "TOPLEFT"}, "confidence": 0.9883638620376587, "cells": [{"id": 13, "text": "human", "bbox": {"l": 132.36501, "t": 197.97351000000003, "r": 157.99098, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "MRCNN", "bbox": {"l": 173.505, "t": 197.97351000000003, "r": 204.61841, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "FRCNN", "bbox": {"l": 220.13028, "t": 197.97351000000003, "r": 248.06958, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "YOLO", "bbox": {"l": 258.03125, "t": 197.97351000000003, "r": 280.17825, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "R50", "bbox": {"l": 168.39301, "t": 208.93255999999997, "r": 181.99504, "b": 217.30719, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "R101", "bbox": {"l": 192.39606, "t": 208.93255999999997, "r": 210.16747, "b": 217.30719, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "R101", "bbox": {"l": 225.21309, "t": 208.93255999999997, "r": 242.9845, "b": 217.30719, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "v5x6", "bbox": {"l": 260.51379, "t": 208.93255999999997, "r": 277.70239, "b": 217.30719, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Caption", "bbox": {"l": 67.663002, "t": 220.28954999999996, "r": 96.848633, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "84-89", "bbox": {"l": 135.32401, "t": 220.28954999999996, "r": 155.03215, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "68.4", "bbox": {"l": 167.95399, "t": 220.28954999999996, "r": 182.43472, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "71.5", "bbox": {"l": 194.0462, "t": 220.28954999999996, "r": 208.52695, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "70.1", "bbox": {"l": 226.86324000000002, "t": 220.28954999999996, "r": 241.34396, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "77.7", "bbox": {"l": 261.86804, "t": 220.28954999999996, "r": 276.34879, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Footnote", "bbox": {"l": 67.663002, "t": 231.24854000000005, "r": 100.1662, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "83-91", "bbox": {"l": 135.32401, "t": 231.24854000000005, "r": 155.03215, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "70.9", "bbox": {"l": 167.95399, "t": 231.24854000000005, "r": 182.43472, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "71.8", "bbox": {"l": 194.0462, "t": 231.24854000000005, "r": 208.52695, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "73.7", "bbox": {"l": 226.86324000000002, "t": 231.24854000000005, "r": 241.34396, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "77.2", "bbox": {"l": 261.86804, "t": 231.24854000000005, "r": 276.34879, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "Formula", "bbox": {"l": 67.663002, "t": 242.20752000000005, "r": 98.175659, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "83-85", "bbox": {"l": 135.32401, "t": 242.20752000000005, "r": 155.03215, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "60.1", "bbox": {"l": 167.95399, "t": 242.20752000000005, "r": 182.43472, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "63.4", "bbox": {"l": 194.0462, "t": 242.20752000000005, "r": 208.52695, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "63.5", "bbox": {"l": 226.86324000000002, "t": 242.20752000000005, "r": 241.34396, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "66.2", "bbox": {"l": 261.86804, "t": 242.20752000000005, "r": 276.34879, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "List-item", "bbox": {"l": 67.663002, "t": 253.16656, "r": 100.54279, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "87-88", "bbox": {"l": 135.32401, "t": 253.16656, "r": 155.03215, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "81.2", "bbox": {"l": 167.95399, "t": 253.16656, "r": 182.43472, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "80.8", "bbox": {"l": 194.0462, "t": 253.16656, "r": 208.52695, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "81.0", "bbox": {"l": 226.86324000000002, "t": 253.16656, "r": 241.34396, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "86.2", "bbox": {"l": 261.86804, "t": 253.16656, "r": 276.34879, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Page-footer", "bbox": {"l": 67.663002, "t": 264.12555, "r": 110.19064, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "93-94", "bbox": {"l": 135.32401, "t": 264.12555, "r": 155.03215, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "61.6", "bbox": {"l": 167.95399, "t": 264.12555, "r": 182.43472, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "59.3", "bbox": {"l": 194.0462, "t": 264.12555, "r": 208.52695, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "58.9", "bbox": {"l": 226.86324000000002, "t": 264.12555, "r": 241.34396, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "61.1", "bbox": {"l": 261.86804, "t": 264.12555, "r": 276.34879, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Page-header", "bbox": {"l": 67.663002, "t": 275.08453, "r": 112.94331999999999, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "85-89", "bbox": {"l": 135.32401, "t": 275.08453, "r": 155.03215, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "71.9", "bbox": {"l": 167.95399, "t": 275.08453, "r": 182.43472, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "70.0", "bbox": {"l": 194.0462, "t": 275.08453, "r": 208.52695, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "72.0", "bbox": {"l": 226.86324000000002, "t": 275.08453, "r": 241.34396, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "67.9", "bbox": {"l": 261.86804, "t": 275.08453, "r": 276.34879, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Picture", "bbox": {"l": 67.663002, "t": 286.04355000000004, "r": 93.647629, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "69-71", "bbox": {"l": 135.32401, "t": 286.04355000000004, "r": 155.03215, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "71.7", "bbox": {"l": 167.95399, "t": 286.04355000000004, "r": 182.43472, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "72.7", "bbox": {"l": 194.0462, "t": 286.04355000000004, "r": 208.52695, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "72.0", "bbox": {"l": 226.86324000000002, "t": 286.04355000000004, "r": 241.34396, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "77.1", "bbox": {"l": 261.86804, "t": 286.04355000000004, "r": 276.34879, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "Section-header", "bbox": {"l": 67.663002, "t": 297.00253, "r": 122.40287999999998, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "83-84", "bbox": {"l": 135.32401, "t": 297.00253, "r": 155.03215, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "67.6", "bbox": {"l": 167.95399, "t": 297.00253, "r": 182.43472, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "69.3", "bbox": {"l": 194.0462, "t": 297.00253, "r": 208.52695, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "68.4", "bbox": {"l": 226.86324000000002, "t": 297.00253, "r": 241.34396, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "74.6", "bbox": {"l": 261.86804, "t": 297.00253, "r": 276.34879, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "Table", "bbox": {"l": 67.663002, "t": 307.96155, "r": 87.46978, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "77-81", "bbox": {"l": 135.32401, "t": 307.96155, "r": 155.03215, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "82.2", "bbox": {"l": 167.95399, "t": 307.96155, "r": 182.43472, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "82.9", "bbox": {"l": 194.0462, "t": 307.96155, "r": 208.52695, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "82.2", "bbox": {"l": 226.86324000000002, "t": 307.96155, "r": 241.34396, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "86.3", "bbox": {"l": 261.86804, "t": 307.96155, "r": 276.34879, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "Text", "bbox": {"l": 67.663002, "t": 318.91953, "r": 83.623199, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "84-86", "bbox": {"l": 135.32401, "t": 318.91953, "r": 155.03215, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "84.6", "bbox": {"l": 167.95399, "t": 318.91953, "r": 182.43472, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "85.8", "bbox": {"l": 194.0462, "t": 318.91953, "r": 208.52695, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "85.4", "bbox": {"l": 226.86324000000002, "t": 318.91953, "r": 241.34396, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "88.1", "bbox": {"l": 261.86804, "t": 318.91953, "r": 276.34879, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Title", "bbox": {"l": 67.663002, "t": 329.87854, "r": 84.654327, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "60-72", "bbox": {"l": 135.32401, "t": 329.87854, "r": 155.03215, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "76.7", "bbox": {"l": 167.95399, "t": 329.87854, "r": 182.43472, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "80.4", "bbox": {"l": 194.0462, "t": 329.87854, "r": 208.52695, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "79.9", "bbox": {"l": 226.86324000000002, "t": 329.87854, "r": 241.34396, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "82.7", "bbox": {"l": 261.86804, "t": 329.87854, "r": 276.34879, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "All", "bbox": {"l": 67.663002, "t": 341.23654, "r": 78.628906, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "82-83", "bbox": {"l": 135.32401, "t": 341.23654, "r": 155.03215, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "72.4", "bbox": {"l": 167.95399, "t": 341.23654, "r": 182.43472, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "73.5", "bbox": {"l": 194.0462, "t": 341.23654, "r": 208.52695, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "73.4", "bbox": {"l": 226.86324000000002, "t": 341.23654, "r": 241.34396, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "76.8", "bbox": {"l": 261.86804, "t": 341.23654, "r": 276.34879, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": [{"id": 12, "label": "text", "bbox": {"l": 132.36501, "t": 197.97351000000003, "r": 157.99098, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "human", "bbox": {"l": 132.36501, "t": 197.97351000000003, "r": 157.99098, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 173.505, "t": 197.97351000000003, "r": 204.61841, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "MRCNN", "bbox": {"l": 173.505, "t": 197.97351000000003, "r": 204.61841, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 220.13028, "t": 197.97351000000003, "r": 248.06958, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "FRCNN", "bbox": {"l": 220.13028, "t": 197.97351000000003, "r": 248.06958, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 258.03125, "t": 197.97351000000003, "r": 280.17825, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "YOLO", "bbox": {"l": 258.03125, "t": 197.97351000000003, "r": 280.17825, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 168.39301, "t": 208.93255999999997, "r": 181.99504, "b": 217.30719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "R50", "bbox": {"l": 168.39301, "t": 208.93255999999997, "r": 181.99504, "b": 217.30719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 192.39606, "t": 208.93255999999997, "r": 210.16747, "b": 217.30719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "R101", "bbox": {"l": 192.39606, "t": 208.93255999999997, "r": 210.16747, "b": 217.30719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 225.21309, "t": 208.93255999999997, "r": 242.9845, "b": 217.30719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "R101", "bbox": {"l": 225.21309, "t": 208.93255999999997, "r": 242.9845, "b": 217.30719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 260.51379, "t": 208.93255999999997, "r": 277.70239, "b": 217.30719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "v5x6", "bbox": {"l": 260.51379, "t": 208.93255999999997, "r": 277.70239, "b": 217.30719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 67.663002, "t": 220.28954999999996, "r": 96.848633, "b": 228.66418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "Caption", "bbox": {"l": 67.663002, "t": 220.28954999999996, "r": 96.848633, "b": 228.66418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 135.32401, "t": 220.28954999999996, "r": 155.03215, "b": 228.66418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "84-89", "bbox": {"l": 135.32401, "t": 220.28954999999996, "r": 155.03215, "b": 228.66418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 167.95399, "t": 220.28954999999996, "r": 182.43472, "b": 228.66418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "68.4", "bbox": {"l": 167.95399, "t": 220.28954999999996, "r": 182.43472, "b": 228.66418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 194.0462, "t": 220.28954999999996, "r": 208.52695, "b": 228.66418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "71.5", "bbox": {"l": 194.0462, "t": 220.28954999999996, "r": 208.52695, "b": 228.66418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 226.86324000000002, "t": 220.28954999999996, "r": 241.34396, "b": 228.66418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "70.1", "bbox": {"l": 226.86324000000002, "t": 220.28954999999996, "r": 241.34396, "b": 228.66418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 261.86804, "t": 220.28954999999996, "r": 276.34879, "b": 228.66418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "77.7", "bbox": {"l": 261.86804, "t": 220.28954999999996, "r": 276.34879, "b": 228.66418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 67.663002, "t": 231.24854000000005, "r": 100.1662, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "Footnote", "bbox": {"l": 67.663002, "t": 231.24854000000005, "r": 100.1662, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 135.32401, "t": 231.24854000000005, "r": 155.03215, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "83-91", "bbox": {"l": 135.32401, "t": 231.24854000000005, "r": 155.03215, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 167.95399, "t": 231.24854000000005, "r": 182.43472, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "70.9", "bbox": {"l": 167.95399, "t": 231.24854000000005, "r": 182.43472, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 194.0462, "t": 231.24854000000005, "r": 208.52695, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "71.8", "bbox": {"l": 194.0462, "t": 231.24854000000005, "r": 208.52695, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 226.86324000000002, "t": 231.24854000000005, "r": 241.34396, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "73.7", "bbox": {"l": 226.86324000000002, "t": 231.24854000000005, "r": 241.34396, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 261.86804, "t": 231.24854000000005, "r": 276.34879, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "77.2", "bbox": {"l": 261.86804, "t": 231.24854000000005, "r": 276.34879, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 67.663002, "t": 242.20752000000005, "r": 98.175659, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "Formula", "bbox": {"l": 67.663002, "t": 242.20752000000005, "r": 98.175659, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 135.32401, "t": 242.20752000000005, "r": 155.03215, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "83-85", "bbox": {"l": 135.32401, "t": 242.20752000000005, "r": 155.03215, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 167.95399, "t": 242.20752000000005, "r": 182.43472, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "60.1", "bbox": {"l": 167.95399, "t": 242.20752000000005, "r": 182.43472, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 194.0462, "t": 242.20752000000005, "r": 208.52695, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "63.4", "bbox": {"l": 194.0462, "t": 242.20752000000005, "r": 208.52695, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 226.86324000000002, "t": 242.20752000000005, "r": 241.34396, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "63.5", "bbox": {"l": 226.86324000000002, "t": 242.20752000000005, "r": 241.34396, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 261.86804, "t": 242.20752000000005, "r": 276.34879, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "66.2", "bbox": {"l": 261.86804, "t": 242.20752000000005, "r": 276.34879, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 67.663002, "t": 253.16656, "r": 100.54279, "b": 261.5412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "List-item", "bbox": {"l": 67.663002, "t": 253.16656, "r": 100.54279, "b": 261.5412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 135.32401, "t": 253.16656, "r": 155.03215, "b": 261.5412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "87-88", "bbox": {"l": 135.32401, "t": 253.16656, "r": 155.03215, "b": 261.5412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 167.95399, "t": 253.16656, "r": 182.43472, "b": 261.5412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "81.2", "bbox": {"l": 167.95399, "t": 253.16656, "r": 182.43472, "b": 261.5412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 194.0462, "t": 253.16656, "r": 208.52695, "b": 261.5412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "80.8", "bbox": {"l": 194.0462, "t": 253.16656, "r": 208.52695, "b": 261.5412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 226.86324000000002, "t": 253.16656, "r": 241.34396, "b": 261.5412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "81.0", "bbox": {"l": 226.86324000000002, "t": 253.16656, "r": 241.34396, "b": 261.5412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 261.86804, "t": 253.16656, "r": 276.34879, "b": 261.5412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "86.2", "bbox": {"l": 261.86804, "t": 253.16656, "r": 276.34879, "b": 261.5412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 67.663002, "t": 264.12555, "r": 110.19064, "b": 272.50018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "Page-footer", "bbox": {"l": 67.663002, "t": 264.12555, "r": 110.19064, "b": 272.50018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 135.32401, "t": 264.12555, "r": 155.03215, "b": 272.50018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "93-94", "bbox": {"l": 135.32401, "t": 264.12555, "r": 155.03215, "b": 272.50018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 167.95399, "t": 264.12555, "r": 182.43472, "b": 272.50018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "61.6", "bbox": {"l": 167.95399, "t": 264.12555, "r": 182.43472, "b": 272.50018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 194.0462, "t": 264.12555, "r": 208.52695, "b": 272.50018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "59.3", "bbox": {"l": 194.0462, "t": 264.12555, "r": 208.52695, "b": 272.50018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 226.86324000000002, "t": 264.12555, "r": 241.34396, "b": 272.50018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "58.9", "bbox": {"l": 226.86324000000002, "t": 264.12555, "r": 241.34396, "b": 272.50018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 261.86804, "t": 264.12555, "r": 276.34879, "b": 272.50018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "61.1", "bbox": {"l": 261.86804, "t": 264.12555, "r": 276.34879, "b": 272.50018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 67.663002, "t": 275.08453, "r": 112.94331999999999, "b": 283.45917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "Page-header", "bbox": {"l": 67.663002, "t": 275.08453, "r": 112.94331999999999, "b": 283.45917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 135.32401, "t": 275.08453, "r": 155.03215, "b": 283.45917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "85-89", "bbox": {"l": 135.32401, "t": 275.08453, "r": 155.03215, "b": 283.45917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 167.95399, "t": 275.08453, "r": 182.43472, "b": 283.45917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "71.9", "bbox": {"l": 167.95399, "t": 275.08453, "r": 182.43472, "b": 283.45917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 194.0462, "t": 275.08453, "r": 208.52695, "b": 283.45917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "70.0", "bbox": {"l": 194.0462, "t": 275.08453, "r": 208.52695, "b": 283.45917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 226.86324000000002, "t": 275.08453, "r": 241.34396, "b": 283.45917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "72.0", "bbox": {"l": 226.86324000000002, "t": 275.08453, "r": 241.34396, "b": 283.45917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 261.86804, "t": 275.08453, "r": 276.34879, "b": 283.45917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "67.9", "bbox": {"l": 261.86804, "t": 275.08453, "r": 276.34879, "b": 283.45917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 67.663002, "t": 286.04355000000004, "r": 93.647629, "b": 294.41818, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "Picture", "bbox": {"l": 67.663002, "t": 286.04355000000004, "r": 93.647629, "b": 294.41818, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 135.32401, "t": 286.04355000000004, "r": 155.03215, "b": 294.41818, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "69-71", "bbox": {"l": 135.32401, "t": 286.04355000000004, "r": 155.03215, "b": 294.41818, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 167.95399, "t": 286.04355000000004, "r": 182.43472, "b": 294.41818, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "71.7", "bbox": {"l": 167.95399, "t": 286.04355000000004, "r": 182.43472, "b": 294.41818, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 194.0462, "t": 286.04355000000004, "r": 208.52695, "b": 294.41818, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "72.7", "bbox": {"l": 194.0462, "t": 286.04355000000004, "r": 208.52695, "b": 294.41818, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 226.86324000000002, "t": 286.04355000000004, "r": 241.34396, "b": 294.41818, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "72.0", "bbox": {"l": 226.86324000000002, "t": 286.04355000000004, "r": 241.34396, "b": 294.41818, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 261.86804, "t": 286.04355000000004, "r": 276.34879, "b": 294.41818, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "77.1", "bbox": {"l": 261.86804, "t": 286.04355000000004, "r": 276.34879, "b": 294.41818, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 67.663002, "t": 297.00253, "r": 122.40287999999998, "b": 305.37717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "Section-header", "bbox": {"l": 67.663002, "t": 297.00253, "r": 122.40287999999998, "b": 305.37717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 135.32401, "t": 297.00253, "r": 155.03215, "b": 305.37717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "83-84", "bbox": {"l": 135.32401, "t": 297.00253, "r": 155.03215, "b": 305.37717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 167.95399, "t": 297.00253, "r": 182.43472, "b": 305.37717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "67.6", "bbox": {"l": 167.95399, "t": 297.00253, "r": 182.43472, "b": 305.37717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 194.0462, "t": 297.00253, "r": 208.52695, "b": 305.37717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "69.3", "bbox": {"l": 194.0462, "t": 297.00253, "r": 208.52695, "b": 305.37717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 226.86324000000002, "t": 297.00253, "r": 241.34396, "b": 305.37717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "68.4", "bbox": {"l": 226.86324000000002, "t": 297.00253, "r": 241.34396, "b": 305.37717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 261.86804, "t": 297.00253, "r": 276.34879, "b": 305.37717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "74.6", "bbox": {"l": 261.86804, "t": 297.00253, "r": 276.34879, "b": 305.37717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 67.663002, "t": 307.96155, "r": 87.46978, "b": 316.33618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "Table", "bbox": {"l": 67.663002, "t": 307.96155, "r": 87.46978, "b": 316.33618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 135.32401, "t": 307.96155, "r": 155.03215, "b": 316.33618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "77-81", "bbox": {"l": 135.32401, "t": 307.96155, "r": 155.03215, "b": 316.33618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 167.95399, "t": 307.96155, "r": 182.43472, "b": 316.33618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "82.2", "bbox": {"l": 167.95399, "t": 307.96155, "r": 182.43472, "b": 316.33618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 194.0462, "t": 307.96155, "r": 208.52695, "b": 316.33618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "82.9", "bbox": {"l": 194.0462, "t": 307.96155, "r": 208.52695, "b": 316.33618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 226.86324000000002, "t": 307.96155, "r": 241.34396, "b": 316.33618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "82.2", "bbox": {"l": 226.86324000000002, "t": 307.96155, "r": 241.34396, "b": 316.33618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 261.86804, "t": 307.96155, "r": 276.34879, "b": 316.33618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "86.3", "bbox": {"l": 261.86804, "t": 307.96155, "r": 276.34879, "b": 316.33618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 67.663002, "t": 318.91953, "r": 83.623199, "b": 327.29416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "Text", "bbox": {"l": 67.663002, "t": 318.91953, "r": 83.623199, "b": 327.29416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 135.32401, "t": 318.91953, "r": 155.03215, "b": 327.29416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "84-86", "bbox": {"l": 135.32401, "t": 318.91953, "r": 155.03215, "b": 327.29416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 167.95399, "t": 318.91953, "r": 182.43472, "b": 327.29416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "84.6", "bbox": {"l": 167.95399, "t": 318.91953, "r": 182.43472, "b": 327.29416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 194.0462, "t": 318.91953, "r": 208.52695, "b": 327.29416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "85.8", "bbox": {"l": 194.0462, "t": 318.91953, "r": 208.52695, "b": 327.29416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 226.86324000000002, "t": 318.91953, "r": 241.34396, "b": 327.29416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "85.4", "bbox": {"l": 226.86324000000002, "t": 318.91953, "r": 241.34396, "b": 327.29416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 261.86804, "t": 318.91953, "r": 276.34879, "b": 327.29416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "88.1", "bbox": {"l": 261.86804, "t": 318.91953, "r": 276.34879, "b": 327.29416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 67.663002, "t": 329.87854, "r": 84.654327, "b": 338.25317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "Title", "bbox": {"l": 67.663002, "t": 329.87854, "r": 84.654327, "b": 338.25317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 135.32401, "t": 329.87854, "r": 155.03215, "b": 338.25317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "60-72", "bbox": {"l": 135.32401, "t": 329.87854, "r": 155.03215, "b": 338.25317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 167.95399, "t": 329.87854, "r": 182.43472, "b": 338.25317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "76.7", "bbox": {"l": 167.95399, "t": 329.87854, "r": 182.43472, "b": 338.25317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 194.0462, "t": 329.87854, "r": 208.52695, "b": 338.25317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "80.4", "bbox": {"l": 194.0462, "t": 329.87854, "r": 208.52695, "b": 338.25317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 226.86324000000002, "t": 329.87854, "r": 241.34396, "b": 338.25317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "79.9", "bbox": {"l": 226.86324000000002, "t": 329.87854, "r": 241.34396, "b": 338.25317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 261.86804, "t": 329.87854, "r": 276.34879, "b": 338.25317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "82.7", "bbox": {"l": 261.86804, "t": 329.87854, "r": 276.34879, "b": 338.25317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 67.663002, "t": 341.23654, "r": 78.628906, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "All", "bbox": {"l": 67.663002, "t": 341.23654, "r": 78.628906, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 135.32401, "t": 341.23654, "r": 155.03215, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "82-83", "bbox": {"l": 135.32401, "t": 341.23654, "r": 155.03215, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 167.95399, "t": 341.23654, "r": 182.43472, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "72.4", "bbox": {"l": 167.95399, "t": 341.23654, "r": 182.43472, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 194.0462, "t": 341.23654, "r": 208.52695, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "73.5", "bbox": {"l": 194.0462, "t": 341.23654, "r": 208.52695, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 226.86324000000002, "t": 341.23654, "r": 241.34396, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "73.4", "bbox": {"l": 226.86324000000002, "t": 341.23654, "r": 241.34396, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 261.86804, "t": 341.23654, "r": 276.34879, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "76.8", "bbox": {"l": 261.86804, "t": 341.23654, "r": 276.34879, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ecel", "ched", "ched", "lcel", "ched", "ched", "nl", "ecel", "ucel", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 14, "num_cols": 6, "table_cells": [{"bbox": {"l": 132.36501, "t": 197.97351000000003, "r": 157.99098, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "human", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 173.505, "t": 197.97351000000003, "r": 204.61841, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 4, "text": "MRCNN", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 220.13028, "t": 197.97351000000003, "r": 248.06958, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "FRCNN", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 258.03125, "t": 197.97351000000003, "r": 280.17825, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "YOLO", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 168.39301, "t": 208.93255999999997, "r": 181.99504, "b": 217.30719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "R50", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 192.39606, "t": 208.93255999999997, "r": 210.16747, "b": 217.30719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "R101", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 225.21309, "t": 208.93255999999997, "r": 242.9845, "b": 217.30719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "R101", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 260.51379, "t": 208.93255999999997, "r": 277.70239, "b": 217.30719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "v5x6", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 220.28954999999996, "r": 96.848633, "b": 228.66418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Caption", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 220.28954999999996, "r": 155.03215, "b": 228.66418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "84-89", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 220.28954999999996, "r": 182.43472, "b": 228.66418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "68.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 220.28954999999996, "r": 208.52695, "b": 228.66418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "71.5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 220.28954999999996, "r": 241.34396, "b": 228.66418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "70.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 220.28954999999996, "r": 276.34879, "b": 228.66418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "77.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 231.24854000000005, "r": 100.1662, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Footnote", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 231.24854000000005, "r": 155.03215, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "83-91", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 231.24854000000005, "r": 182.43472, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "70.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 231.24854000000005, "r": 208.52695, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "71.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 231.24854000000005, "r": 241.34396, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "73.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 231.24854000000005, "r": 276.34879, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "77.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 242.20752000000005, "r": 98.175659, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Formula", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 242.20752000000005, "r": 155.03215, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "83-85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 242.20752000000005, "r": 182.43472, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "60.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 242.20752000000005, "r": 208.52695, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "63.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 242.20752000000005, "r": 241.34396, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "63.5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 242.20752000000005, "r": 276.34879, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "66.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 253.16656, "r": 100.54279, "b": 261.5412, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "List-item", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 253.16656, "r": 155.03215, "b": 261.5412, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "87-88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 253.16656, "r": 182.43472, "b": 261.5412, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "81.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 253.16656, "r": 208.52695, "b": 261.5412, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "80.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 253.16656, "r": 241.34396, "b": 261.5412, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "81.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 253.16656, "r": 276.34879, "b": 261.5412, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "86.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 264.12555, "r": 110.19064, "b": 272.50018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-footer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 264.12555, "r": 155.03215, "b": 272.50018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "93-94", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 264.12555, "r": 182.43472, "b": 272.50018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "61.6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 264.12555, "r": 208.52695, "b": 272.50018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "59.3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 264.12555, "r": 241.34396, "b": 272.50018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "58.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 264.12555, "r": 276.34879, "b": 272.50018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "61.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 275.08453, "r": 112.94331999999999, "b": 283.45917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 275.08453, "r": 155.03215, "b": 283.45917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "85-89", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 275.08453, "r": 182.43472, "b": 283.45917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "71.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 275.08453, "r": 208.52695, "b": 283.45917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "70.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 275.08453, "r": 241.34396, "b": 283.45917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "72.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 275.08453, "r": 276.34879, "b": 283.45917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "67.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 286.04355000000004, "r": 93.647629, "b": 294.41818, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Picture", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 286.04355000000004, "r": 155.03215, "b": 294.41818, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "69-71", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 286.04355000000004, "r": 182.43472, "b": 294.41818, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "71.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 286.04355000000004, "r": 208.52695, "b": 294.41818, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "72.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 286.04355000000004, "r": 241.34396, "b": 294.41818, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "72.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 286.04355000000004, "r": 276.34879, "b": 294.41818, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "77.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 297.00253, "r": 122.40287999999998, "b": 305.37717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Section-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 297.00253, "r": 155.03215, "b": 305.37717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "83-84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 297.00253, "r": 182.43472, "b": 305.37717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "67.6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 297.00253, "r": 208.52695, "b": 305.37717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "69.3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 297.00253, "r": 241.34396, "b": 305.37717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "68.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 297.00253, "r": 276.34879, "b": 305.37717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "74.6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 307.96155, "r": 87.46978, "b": 316.33618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 307.96155, "r": 155.03215, "b": 316.33618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "77-81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 307.96155, "r": 182.43472, "b": 316.33618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "82.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 307.96155, "r": 208.52695, "b": 316.33618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "82.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 307.96155, "r": 241.34396, "b": 316.33618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "82.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 307.96155, "r": 276.34879, "b": 316.33618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "86.3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 318.91953, "r": 83.623199, "b": 327.29416, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Text", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 318.91953, "r": 155.03215, "b": 327.29416, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "84-86", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 318.91953, "r": 182.43472, "b": 327.29416, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "84.6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 318.91953, "r": 208.52695, "b": 327.29416, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "85.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 318.91953, "r": 241.34396, "b": 327.29416, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "85.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 318.91953, "r": 276.34879, "b": 327.29416, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "88.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 329.87854, "r": 84.654327, "b": 338.25317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Title", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 329.87854, "r": 155.03215, "b": 338.25317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "60-72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 329.87854, "r": 182.43472, "b": 338.25317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "76.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 329.87854, "r": 208.52695, "b": 338.25317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "80.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 329.87854, "r": 241.34396, "b": 338.25317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "79.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 329.87854, "r": 276.34879, "b": 338.25317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "82.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 341.23654, "r": 78.628906, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "All", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 341.23654, "r": 155.03215, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "82-83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 341.23654, "r": 182.43472, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "72.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 341.23654, "r": 208.52695, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "73.5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 341.23654, "r": 241.34396, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "73.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 341.23654, "r": 276.34879, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "76.8", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "text", "id": 4, "page_no": 5, "cluster": {"id": 4, "label": "text", "bbox": {"l": 53.528999, "t": 370.92755, "r": 295.55612, "b": 576.56317, "coord_origin": "TOPLEFT"}, "confidence": 0.9866557121276855, "cells": [{"id": 93, "text": "to avoid this at any cost in order to have clear, unbiased baseline", "bbox": {"l": 53.79800000000001, "t": 370.92755, "r": 294.04712, "b": 379.30219000000005, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "numbers for human document-layout annotation. Third, we in-", "bbox": {"l": 53.79800000000001, "t": 381.88654, "r": 295.55612, "b": 390.26117, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "troduced the feature of", "bbox": {"l": 53.79800000000001, "t": 392.84555, "r": 140.3623, "b": 401.22017999999997, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "snapping", "bbox": {"l": 142.99001, "t": 392.89041, "r": 175.9695, "b": 401.2291599999999, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "boxes around text segments to", "bbox": {"l": 178.951, "t": 392.84555, "r": 294.04083, "b": 401.22017999999997, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "obtain a pixel-accurate annotation and again reduce time and effort.", "bbox": {"l": 53.79800000000001, "t": 403.80453, "r": 295.42493, "b": 412.17917, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "The CCS annotation tool automatically shrinks every user-drawn", "bbox": {"l": 53.528999, "t": 414.76355, "r": 294.04251, "b": 423.13818, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "box to the minimum bounding-box around the enclosed text-cells", "bbox": {"l": 53.79800000000001, "t": 425.72253, "r": 294.04807, "b": 434.09717, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "for all purely text-based segments, which excludes only", "bbox": {"l": 53.79800000000001, "t": 436.6815500000001, "r": 256.80627, "b": 445.0561799999999, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "Table", "bbox": {"l": 259.04199, "t": 436.72641, "r": 278.10455, "b": 445.06516, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "and", "bbox": {"l": 280.54999, "t": 436.6815500000001, "r": 294.04443, "b": 445.0561799999999, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "Picture", "bbox": {"l": 53.79800000000001, "t": 447.68539, "r": 78.875587, "b": 456.02413999999993, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": ". For the latter, we instructed annotation staff to minimise", "bbox": {"l": 78.876999, "t": 447.64053, "r": 294.04852, "b": 456.01517, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "inclusion of surrounding whitespace while including all graphical", "bbox": {"l": 53.79800000000001, "t": 458.59955, "r": 294.04645, "b": 466.97418, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "lines. A downside of snapping boxes to enclosed text cells is that", "bbox": {"l": 53.79800000000001, "t": 469.55853, "r": 294.0416, "b": 477.93317, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "some wrongly parsed PDF pages cannot be annotated correctly and", "bbox": {"l": 53.79800000000001, "t": 480.51654, "r": 294.04538, "b": 488.89117, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "need to be skipped. Fourth, we established a way to flag pages as", "bbox": {"l": 53.79800000000001, "t": 491.47552, "r": 294.04312, "b": 499.85016, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "rejected", "bbox": {"l": 53.79800000000001, "t": 502.4794, "r": 80.597939, "b": 510.81815, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "for cases where no valid annotation according to the label", "bbox": {"l": 83.366997, "t": 502.43454, "r": 294.04483, "b": 510.80917, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "guidelines could be achieved. Example cases for this would be PDF", "bbox": {"l": 53.79800000000001, "t": 513.3935200000001, "r": 294.25833, "b": 521.7681600000001, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "pages that render incorrectly or contain layouts that are impossible", "bbox": {"l": 53.79800000000001, "t": 524.35254, "r": 294.04535, "b": 532.72717, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "to capture with non-overlapping rectangles. Such rejected pages are", "bbox": {"l": 53.79800000000001, "t": 535.31155, "r": 294.04535, "b": 543.68617, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "not contained in the final dataset. With all these measures in place,", "bbox": {"l": 53.79800000000001, "t": 546.27055, "r": 295.02759, "b": 554.64517, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "experienced annotation staff managed to annotate a single page in", "bbox": {"l": 53.79800000000001, "t": 557.22955, "r": 294.0488, "b": 565.6041700000001, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "a typical timeframe of 20s to 60s, depending on its complexity.", "bbox": {"l": 53.79800000000001, "t": 568.18855, "r": 281.80457, "b": 576.56317, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "to avoid this at any cost in order to have clear, unbiased baseline numbers for human document-layout annotation. Third, we introduced the feature of snapping boxes around text segments to obtain a pixel-accurate annotation and again reduce time and effort. The CCS annotation tool automatically shrinks every user-drawn box to the minimum bounding-box around the enclosed text-cells for all purely text-based segments, which excludes only Table and Picture . For the latter, we instructed annotation staff to minimise inclusion of surrounding whitespace while including all graphical lines. A downside of snapping boxes to enclosed text cells is that some wrongly parsed PDF pages cannot be annotated correctly and need to be skipped. Fourth, we established a way to flag pages as rejected for cases where no valid annotation according to the label guidelines could be achieved. Example cases for this would be PDF pages that render incorrectly or contain layouts that are impossible to capture with non-overlapping rectangles. Such rejected pages are not contained in the final dataset. With all these measures in place, experienced annotation staff managed to annotate a single page in a typical timeframe of 20s to 60s, depending on its complexity."}, {"label": "section_header", "id": 10, "page_no": 5, "cluster": {"id": 10, "label": "section_header", "bbox": {"l": 53.79800000000001, "t": 588.12991, "r": 147.48535, "b": 598.43901, "coord_origin": "TOPLEFT"}, "confidence": 0.9419495463371277, "cells": [{"id": 118, "text": "5", "bbox": {"l": 53.79800000000001, "t": 588.12991, "r": 59.405277, "b": 598.43901, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "EXPERIMENTS", "bbox": {"l": 70.314377, "t": 588.12991, "r": 147.48535, "b": 598.43901, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5 EXPERIMENTS"}, {"label": "text", "id": 2, "page_no": 5, "cluster": {"id": 2, "label": "text", "bbox": {"l": 53.484001, "t": 613.25356, "r": 295.4281, "b": 709.299171, "coord_origin": "TOPLEFT"}, "confidence": 0.987605094909668, "cells": [{"id": 120, "text": "The primary goal of DocLayNet is to obtain high-quality ML models", "bbox": {"l": 53.528999, "t": 613.25356, "r": 294.04871, "b": 621.6281700000001, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "capable of accurate document-layout analysis on a wide variety", "bbox": {"l": 53.79800000000001, "t": 624.21255, "r": 294.27576, "b": 632.58717, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "of challenging layouts. As discussed in Section 2, object detection", "bbox": {"l": 53.79800000000001, "t": 635.17155, "r": 294.04144, "b": 643.54617, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "models are currently the easiest to use, due to the standardisation", "bbox": {"l": 53.79800000000001, "t": 646.13055, "r": 294.04163, "b": 654.50517, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "of ground-truth data in COCO format [16] and the availability of", "bbox": {"l": 53.79800000000001, "t": 657.0885499999999, "r": 294.0412, "b": 665.46317, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "general frameworks such as", "bbox": {"l": 53.79800000000001, "t": 668.04755, "r": 155.01054, "b": 676.42217, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "detectron2", "bbox": {"l": 157.23599, "t": 668.09238, "r": 193.26666, "b": 676.43114, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "[17]. Furthermore, baseline", "bbox": {"l": 195.867, "t": 668.04755, "r": 294.0473, "b": 676.42217, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "numbers in PubLayNet and DocBank were obtained using standard", "bbox": {"l": 53.79800000000001, "t": 679.0065500000001, "r": 294.04538, "b": 687.38117, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "object detection models such as Mask R-CNN and Faster R-CNN.", "bbox": {"l": 53.79800000000001, "t": 689.96555, "r": 295.4281, "b": 698.3401719999999, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "As such, we will relate to these object detection methods in this", "bbox": {"l": 53.484001, "t": 700.9245530000001, "r": 294.04413, "b": 709.299171, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The primary goal of DocLayNet is to obtain high-quality ML models capable of accurate document-layout analysis on a wide variety of challenging layouts. As discussed in Section 2, object detection models are currently the easiest to use, due to the standardisation of ground-truth data in COCO format [16] and the availability of general frameworks such as detectron2 [17]. Furthermore, baseline numbers in PubLayNet and DocBank were obtained using standard object detection models such as Mask R-CNN and Faster R-CNN. As such, we will relate to these object detection methods in this"}, {"label": "picture", "id": 6, "page_no": 5, "cluster": {"id": 6, "label": "picture", "bbox": {"l": 323.48431396484375, "t": 89.88603210449219, "r": 553.5411376953125, "b": 260.0107727050781, "coord_origin": "TOPLEFT"}, "confidence": 0.9782691597938538, "cells": [{"id": 131, "text": "0", "bbox": {"l": 349.16577, "t": 246.68017999999995, "r": 352.48175, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "20", "bbox": {"l": 385.93698, "t": 246.68017999999995, "r": 392.56894, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "40", "bbox": {"l": 424.366, "t": 246.68017999999995, "r": 430.99796, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "60", "bbox": {"l": 462.79504000000003, "t": 246.68017999999995, "r": 469.427, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "80", "bbox": {"l": 501.22406, "t": 246.68017999999995, "r": 507.85602, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "100", "bbox": {"l": 537.99524, "t": 246.68017999999995, "r": 547.94318, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "% of DocLayNet training set", "bbox": {"l": 410.28143, "t": 253.80840999999998, "r": 483.47278000000006, "b": 259.88251, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "50", "bbox": {"l": 330.93539, "t": 218.38464, "r": 337.56735, "b": 224.45874000000003, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "55", "bbox": {"l": 330.93539, "t": 192.08660999999995, "r": 337.56735, "b": 198.16071, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "60", "bbox": {"l": 330.93539, "t": 165.78864, "r": 337.56735, "b": 171.86273000000006, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "65", "bbox": {"l": 330.93539, "t": 139.49059999999997, "r": 337.56735, "b": 145.56470000000002, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "70", "bbox": {"l": 330.93539, "t": 113.19263000000001, "r": 337.56735, "b": 119.26671999999996, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "mAP 0.50:0.95", "bbox": {"l": 322.92276, "t": 148.37689, "r": 328.99686, "b": 186.79218000000003, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "10", "bbox": {"l": 470.97235, "t": 235.36676, "r": 477.6055, "b": 241.44086000000004, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "1", "bbox": {"l": 477.65662, "t": 234.82390999999996, "r": 479.97778000000005, "b": 239.07581000000005, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "10", "bbox": {"l": 531.55127, "t": 235.41234999999995, "r": 538.18445, "b": 241.48645, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "2", "bbox": {"l": 538.23553, "t": 234.86951, "r": 540.5567, "b": 239.1214, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "50", "bbox": {"l": 404.91125, "t": 216.00005999999996, "r": 411.54321, "b": 222.07416, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "55", "bbox": {"l": 404.91125, "t": 200.22125000000005, "r": 411.54321, "b": 206.29534999999998, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "60", "bbox": {"l": 404.91125, "t": 184.44244000000003, "r": 411.54321, "b": 190.51653999999996, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "65", "bbox": {"l": 404.91125, "t": 168.66364, "r": 411.54321, "b": 174.73773000000006, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "70", "bbox": {"l": 404.91125, "t": 152.88489000000004, "r": 411.54321, "b": 158.95898, "coord_origin": "TOPLEFT"}}], "children": [{"id": 92, "label": "text", "bbox": {"l": 349.16577, "t": 246.68017999999995, "r": 352.48175, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 131, "text": "0", "bbox": {"l": 349.16577, "t": 246.68017999999995, "r": 352.48175, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 385.93698, "t": 246.68017999999995, "r": 392.56894, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 132, "text": "20", "bbox": {"l": 385.93698, "t": 246.68017999999995, "r": 392.56894, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 424.366, "t": 246.68017999999995, "r": 430.99796, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 133, "text": "40", "bbox": {"l": 424.366, "t": 246.68017999999995, "r": 430.99796, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 462.79504000000003, "t": 246.68017999999995, "r": 469.427, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 134, "text": "60", "bbox": {"l": 462.79504000000003, "t": 246.68017999999995, "r": 469.427, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 501.22406, "t": 246.68017999999995, "r": 507.85602, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 135, "text": "80", "bbox": {"l": 501.22406, "t": 246.68017999999995, "r": 507.85602, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 537.99524, "t": 246.68017999999995, "r": 547.94318, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 136, "text": "100", "bbox": {"l": 537.99524, "t": 246.68017999999995, "r": 547.94318, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 410.28143, "t": 253.80840999999998, "r": 483.47278000000006, "b": 259.88251, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 137, "text": "% of DocLayNet training set", "bbox": {"l": 410.28143, "t": 253.80840999999998, "r": 483.47278000000006, "b": 259.88251, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 330.93539, "t": 218.38464, "r": 337.56735, "b": 224.45874000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 138, "text": "50", "bbox": {"l": 330.93539, "t": 218.38464, "r": 337.56735, "b": 224.45874000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 330.93539, "t": 192.08660999999995, "r": 337.56735, "b": 198.16071, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 139, "text": "55", "bbox": {"l": 330.93539, "t": 192.08660999999995, "r": 337.56735, "b": 198.16071, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 330.93539, "t": 165.78864, "r": 337.56735, "b": 171.86273000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 140, "text": "60", "bbox": {"l": 330.93539, "t": 165.78864, "r": 337.56735, "b": 171.86273000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 330.93539, "t": 139.49059999999997, "r": 337.56735, "b": 145.56470000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 141, "text": "65", "bbox": {"l": 330.93539, "t": 139.49059999999997, "r": 337.56735, "b": 145.56470000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 330.93539, "t": 113.19263000000001, "r": 337.56735, "b": 119.26671999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 142, "text": "70", "bbox": {"l": 330.93539, "t": 113.19263000000001, "r": 337.56735, "b": 119.26671999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 322.92276, "t": 148.37689, "r": 328.99686, "b": 186.79218000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 143, "text": "mAP 0.50:0.95", "bbox": {"l": 322.92276, "t": 148.37689, "r": 328.99686, "b": 186.79218000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 470.97235, "t": 235.36676, "r": 477.6055, "b": 241.44086000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 144, "text": "10", "bbox": {"l": 470.97235, "t": 235.36676, "r": 477.6055, "b": 241.44086000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 477.65662, "t": 234.82390999999996, "r": 479.97778000000005, "b": 239.07581000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 145, "text": "1", "bbox": {"l": 477.65662, "t": 234.82390999999996, "r": 479.97778000000005, "b": 239.07581000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 531.55127, "t": 235.41234999999995, "r": 538.18445, "b": 241.48645, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 146, "text": "10", "bbox": {"l": 531.55127, "t": 235.41234999999995, "r": 538.18445, "b": 241.48645, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 538.23553, "t": 234.86951, "r": 540.5567, "b": 239.1214, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 147, "text": "2", "bbox": {"l": 538.23553, "t": 234.86951, "r": 540.5567, "b": 239.1214, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 404.91125, "t": 216.00005999999996, "r": 411.54321, "b": 222.07416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 148, "text": "50", "bbox": {"l": 404.91125, "t": 216.00005999999996, "r": 411.54321, "b": 222.07416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 404.91125, "t": 200.22125000000005, "r": 411.54321, "b": 206.29534999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 149, "text": "55", "bbox": {"l": 404.91125, "t": 200.22125000000005, "r": 411.54321, "b": 206.29534999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 404.91125, "t": 184.44244000000003, "r": 411.54321, "b": 190.51653999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 150, "text": "60", "bbox": {"l": 404.91125, "t": 184.44244000000003, "r": 411.54321, "b": 190.51653999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 404.91125, "t": 168.66364, "r": 411.54321, "b": 174.73773000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 151, "text": "65", "bbox": {"l": 404.91125, "t": 168.66364, "r": 411.54321, "b": 174.73773000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 404.91125, "t": 152.88489000000004, "r": 411.54321, "b": 158.95898, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 152, "text": "70", "bbox": {"l": 404.91125, "t": 152.88489000000004, "r": 411.54321, "b": 158.95898, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "caption", "id": 7, "page_no": 5, "cluster": {"id": 7, "label": "caption", "bbox": {"l": 317.95499, "t": 279.01599, "r": 559.80579, "b": 342.28418000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9639935493469238, "cells": [{"id": 153, "text": "Figure 5: Prediction performance (mAP@0.5-0.95) of a Mask", "bbox": {"l": 317.95499, "t": 279.01599, "r": 558.47876, "b": 287.48923, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "R-CNN network with ResNet50 backbone trained on increas-", "bbox": {"l": 317.95499, "t": 289.97501, "r": 559.80579, "b": 298.44824, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "ing fractions of the DocLayNet dataset. The learning curve", "bbox": {"l": 317.95499, "t": 300.93399, "r": 558.20068, "b": 309.40723, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "flattens around the 80% mark, indicating that increasing the", "bbox": {"l": 317.95499, "t": 311.89297, "r": 558.20062, "b": 320.36620999999997, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "size of the DocLayNet dataset with similar data will not yield", "bbox": {"l": 317.95499, "t": 322.85196, "r": 558.20074, "b": 331.3252, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "significantly better predictions.", "bbox": {"l": 317.95499, "t": 333.81094, "r": 445.24207, "b": 342.28418000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 5: Prediction performance (mAP@0.5-0.95) of a Mask R-CNN network with ResNet50 backbone trained on increasing fractions of the DocLayNet dataset. The learning curve flattens around the 80% mark, indicating that increasing the size of the DocLayNet dataset with similar data will not yield significantly better predictions."}, {"label": "text", "id": 8, "page_no": 5, "cluster": {"id": 8, "label": "text", "bbox": {"l": 317.95499, "t": 384.01154, "r": 558.20416, "b": 403.34517999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9594221711158752, "cells": [{"id": 159, "text": "paper and leave the detailed evaluation of more recent methods", "bbox": {"l": 317.95499, "t": 384.01154, "r": 558.20416, "b": 392.38617, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "mentioned in Section 2 for future work.", "bbox": {"l": 317.95499, "t": 394.97055, "r": 463.04938, "b": 403.34517999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "paper and leave the detailed evaluation of more recent methods mentioned in Section 2 for future work."}, {"label": "text", "id": 3, "page_no": 5, "cluster": {"id": 3, "label": "text", "bbox": {"l": 317.64099, "t": 405.92953, "r": 558.4364, "b": 480.05716, "coord_origin": "TOPLEFT"}, "confidence": 0.9872915148735046, "cells": [{"id": 161, "text": "In this section, we will present several aspects related to the", "bbox": {"l": 327.918, "t": 405.92953, "r": 558.19836, "b": 414.30417, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "performance of object detection models on DocLayNet. Similarly", "bbox": {"l": 317.95499, "t": 416.88855, "r": 558.4364, "b": 425.26318, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "as in PubLayNet, we will evaluate the quality of their predictions", "bbox": {"l": 317.95499, "t": 427.84653, "r": 558.20563, "b": 436.22116, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "using mean average precision (mAP) with 10 overlaps that range", "bbox": {"l": 317.95499, "t": 438.80554, "r": 558.20044, "b": 447.18018, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "from 0.5 to 0.95 in steps of 0.05 (mAP@0.5-0.95). These scores are", "bbox": {"l": 317.95499, "t": 449.76453000000004, "r": 558.19891, "b": 458.13916, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "computed by leveraging the evaluation code provided by the COCO", "bbox": {"l": 317.95499, "t": 460.72354, "r": 558.20239, "b": 469.09818, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "API [16].", "bbox": {"l": 317.64099, "t": 471.68253, "r": 350.32352, "b": 480.05716, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In this section, we will present several aspects related to the performance of object detection models on DocLayNet. Similarly as in PubLayNet, we will evaluate the quality of their predictions using mean average precision (mAP) with 10 overlaps that range from 0.5 to 0.95 in steps of 0.05 (mAP@0.5-0.95). These scores are computed by leveraging the evaluation code provided by the COCO API [16]."}, {"label": "section_header", "id": 9, "page_no": 5, "cluster": {"id": 9, "label": "section_header", "bbox": {"l": 317.95499, "t": 496.8219, "r": 466.8532400000001, "b": 507.13098, "coord_origin": "TOPLEFT"}, "confidence": 0.9579005241394043, "cells": [{"id": 168, "text": "Baselines for Object Detection", "bbox": {"l": 317.95499, "t": 496.8219, "r": 466.8532400000001, "b": 507.13098, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Baselines for Object Detection"}, {"label": "text", "id": 1, "page_no": 5, "cluster": {"id": 1, "label": "text", "bbox": {"l": 317.74899, "t": 512.02454, "r": 558.43085, "b": 706.700172, "coord_origin": "TOPLEFT"}, "confidence": 0.987722635269165, "cells": [{"id": 169, "text": "In Table 2, we present baseline experiments (given in mAP) on Mask", "bbox": {"l": 317.95499, "t": 512.02454, "r": 558.43085, "b": 520.39917, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "R-CNN [12], Faster R-CNN [11], and YOLOv5 [13]. Both training", "bbox": {"l": 317.95499, "t": 522.9835499999999, "r": 558.20117, "b": 531.35818, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "and evaluation were performed on RGB images with dimensions of", "bbox": {"l": 317.95499, "t": 533.94254, "r": 558.20233, "b": 542.31717, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "1025", "bbox": {"l": 317.74899, "t": 544.90155, "r": 334.09296, "b": 553.27617, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "\u00d7", "bbox": {"l": 334.81201, "t": 544.84775, "r": 340.51465, "b": 552.5499, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "1025 pixels. For training, we only used one annotation in case", "bbox": {"l": 341.233, "t": 544.90155, "r": 558.20117, "b": 553.27617, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "of redundantly annotated pages. As one can observe, the variation", "bbox": {"l": 317.95499, "t": 555.85956, "r": 558.20392, "b": 564.23418, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "in mAP between the models is rather low, but overall between 6", "bbox": {"l": 317.95499, "t": 566.8185599999999, "r": 558.2041, "b": 575.19318, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "and 10% lower than the mAP computed from the pairwise human", "bbox": {"l": 317.95499, "t": 577.77756, "r": 558.2052, "b": 586.15218, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "annotations on triple-annotated pages. This gives a good indication", "bbox": {"l": 317.95499, "t": 588.73656, "r": 558.20233, "b": 597.11118, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "that the DocLayNet dataset poses a worthwhile challenge for the", "bbox": {"l": 317.95499, "t": 599.69556, "r": 558.1983, "b": 608.0701799999999, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "research community to close the gap between human recognition", "bbox": {"l": 317.95499, "t": 610.65456, "r": 558.20502, "b": 619.02917, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "and ML approaches. It is interesting to see that Mask R-CNN and", "bbox": {"l": 317.95499, "t": 621.61356, "r": 558.20337, "b": 629.98817, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "Faster R-CNN produce very comparable mAP scores, indicating", "bbox": {"l": 317.95499, "t": 632.5725600000001, "r": 558.2041, "b": 640.94717, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "that pixel-based image segmentation derived from bounding-boxes", "bbox": {"l": 317.95499, "t": 643.53156, "r": 558.20245, "b": 651.90617, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "does not help to obtain better predictions. On the other hand, the", "bbox": {"l": 317.95499, "t": 654.49055, "r": 558.19757, "b": 662.86517, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": "more recent Yolov5x model does very well and even out-performs", "bbox": {"l": 317.95499, "t": 665.44855, "r": 558.20404, "b": 673.82317, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "humans on selected labels such as", "bbox": {"l": 317.95499, "t": 676.40755, "r": 444.54102, "b": 684.78217, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "Text", "bbox": {"l": 446.78900000000004, "t": 676.45238, "r": 461.95261000000005, "b": 684.79114, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": ",", "bbox": {"l": 461.95599000000004, "t": 676.40755, "r": 463.96805000000006, "b": 684.78217, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "Table", "bbox": {"l": 466.2170100000001, "t": 676.45238, "r": 485.66998000000007, "b": 684.79114, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "and", "bbox": {"l": 488.1290000000001, "t": 676.40755, "r": 501.89330999999993, "b": 684.78217, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "Picture", "bbox": {"l": 504.142, "t": 676.45238, "r": 529.21954, "b": 684.79114, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": ". This is", "bbox": {"l": 529.22101, "t": 676.40755, "r": 558.20392, "b": 684.78217, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "not entirely surprising, as", "bbox": {"l": 317.95499, "t": 687.36655, "r": 410.81366, "b": 695.741173, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "Text", "bbox": {"l": 413.05301, "t": 687.41138, "r": 427.67865, "b": 695.750137, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": ",", "bbox": {"l": 427.67801, "t": 687.36655, "r": 429.62103, "b": 695.741173, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "Table", "bbox": {"l": 431.86099, "t": 687.41138, "r": 450.62881000000004, "b": 695.750137, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "and", "bbox": {"l": 453.082, "t": 687.36655, "r": 466.37402, "b": 695.741173, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "Picture", "bbox": {"l": 468.61499, "t": 687.41138, "r": 492.83208999999994, "b": 695.750137, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "are abundant and", "bbox": {"l": 495.28201, "t": 687.36655, "r": 558.2005, "b": 695.741173, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "the most visually distinctive in a document.", "bbox": {"l": 317.95499, "t": 698.325554, "r": 477.53903, "b": 706.700172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In Table 2, we present baseline experiments (given in mAP) on Mask R-CNN [12], Faster R-CNN [11], and YOLOv5 [13]. Both training and evaluation were performed on RGB images with dimensions of 1025 \u00d7 1025 pixels. For training, we only used one annotation in case of redundantly annotated pages. As one can observe, the variation in mAP between the models is rather low, but overall between 6 and 10% lower than the mAP computed from the pairwise human annotations on triple-annotated pages. This gives a good indication that the DocLayNet dataset poses a worthwhile challenge for the research community to close the gap between human recognition and ML approaches. It is interesting to see that Mask R-CNN and Faster R-CNN produce very comparable mAP scores, indicating that pixel-based image segmentation derived from bounding-boxes does not help to obtain better predictions. On the other hand, the more recent Yolov5x model does very well and even out-performs humans on selected labels such as Text , Table and Picture . This is not entirely surprising, as Text , Table and Picture are abundant and the most visually distinctive in a document."}], "headers": [{"label": "page_header", "id": 11, "page_no": 5, "cluster": {"id": 11, "label": "page_header", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.8662876486778259, "cells": [{"id": 0, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 246.24382, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar", "bbox": {"l": 253.13897999999998, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar"}]}}, {"page_no": 6, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Table 3: Performance of a Mask R-CNN R50 network in", "bbox": {"l": 53.501999, "t": 86.87292000000002, "r": 294.0437, "b": 95.34618999999998, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "mAP@0.5-0.95 scores trained on DocLayNet with different", "bbox": {"l": 53.79800000000001, "t": 97.83191, "r": 294.04376, "b": 106.30517999999995, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "class label sets. The reduced label sets were obtained by ei-", "bbox": {"l": 53.79800000000001, "t": 108.79088999999999, "r": 295.64865, "b": 117.26415999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "ther down-mapping or dropping labels.", "bbox": {"l": 53.79800000000001, "t": 119.74987999999996, "r": 213.23856, "b": 128.22313999999994, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Class-count", "bbox": {"l": 86.372002, "t": 153.10051999999996, "r": 129.46452, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "11", "bbox": {"l": 151.07401, "t": 153.10051999999996, "r": 159.41275, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "6", "bbox": {"l": 179.31816, "t": 153.10051999999996, "r": 183.48753, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "5", "bbox": {"l": 213.33669, "t": 153.10051999999996, "r": 217.50606, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "4", "bbox": {"l": 247.35521, "t": 153.10051999999996, "r": 251.52458, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Caption", "bbox": {"l": 86.372002, "t": 164.45752000000005, "r": 115.55763, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "68", "bbox": {"l": 151.07401, "t": 164.45752000000005, "r": 159.41275, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Text", "bbox": {"l": 173.42723, "t": 164.45752000000005, "r": 189.38742, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Text", "bbox": {"l": 207.44576, "t": 164.45752000000005, "r": 223.40594000000002, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Text", "bbox": {"l": 241.46428, "t": 164.45752000000005, "r": 257.42447, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Footnote", "bbox": {"l": 86.372002, "t": 175.41656, "r": 118.8752, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "71", "bbox": {"l": 151.07401, "t": 175.41656, "r": 159.41275, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Text", "bbox": {"l": 173.42723, "t": 175.41656, "r": 189.38742, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Text", "bbox": {"l": 207.44576, "t": 175.41656, "r": 223.40594000000002, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Text", "bbox": {"l": 241.46428, "t": 175.41656, "r": 257.42447, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Formula", "bbox": {"l": 86.372002, "t": 186.37554999999998, "r": 116.88466, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "60", "bbox": {"l": 151.07401, "t": 186.37554999999998, "r": 159.41275, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Text", "bbox": {"l": 173.42723, "t": 186.37554999999998, "r": 189.38742, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "Text", "bbox": {"l": 207.44576, "t": 186.37554999999998, "r": 223.40594000000002, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "Text", "bbox": {"l": 241.46428, "t": 186.37554999999998, "r": 257.42447, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "List-item", "bbox": {"l": 86.372002, "t": 197.33452999999997, "r": 119.25179, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "81", "bbox": {"l": 151.07401, "t": 197.33452999999997, "r": 159.41275, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Text", "bbox": {"l": 173.42723, "t": 197.33452999999997, "r": 189.38742, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "82", "bbox": {"l": 211.25647, "t": 197.33452999999997, "r": 219.59521, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Text", "bbox": {"l": 241.46426, "t": 197.33452999999997, "r": 257.42447, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Page-footer", "bbox": {"l": 86.372002, "t": 208.29351999999994, "r": 128.89964, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "62", "bbox": {"l": 151.07401, "t": 208.29351999999994, "r": 159.41275, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "62", "bbox": {"l": 177.23795, "t": 208.29351999999994, "r": 185.57669, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "-", "bbox": {"l": 213.91052, "t": 208.29351999999994, "r": 216.94116, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "-", "bbox": {"l": 247.92905000000002, "t": 208.29351999999994, "r": 250.95969, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Page-header", "bbox": {"l": 86.372002, "t": 219.25256000000002, "r": 131.65231, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "72", "bbox": {"l": 151.07401, "t": 219.25256000000002, "r": 159.41275, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "68", "bbox": {"l": 177.23795, "t": 219.25256000000002, "r": 185.57669, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "-", "bbox": {"l": 213.91052, "t": 219.25256000000002, "r": 216.94116, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "-", "bbox": {"l": 247.92905000000002, "t": 219.25256000000002, "r": 250.95969, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Picture", "bbox": {"l": 86.372002, "t": 230.21155, "r": 112.35663, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "72", "bbox": {"l": 151.07401, "t": 230.21155, "r": 159.41275, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "72", "bbox": {"l": 177.23795, "t": 230.21155, "r": 185.57669, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "72", "bbox": {"l": 211.25645, "t": 230.21155, "r": 219.5952, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "72", "bbox": {"l": 245.27496, "t": 230.21155, "r": 253.61371, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "Section-header", "bbox": {"l": 86.372002, "t": 241.16956000000005, "r": 141.11188, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "68", "bbox": {"l": 151.07401, "t": 241.16956000000005, "r": 159.41275, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "67", "bbox": {"l": 177.23795, "t": 241.16956000000005, "r": 185.57669, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "69", "bbox": {"l": 211.25645, "t": 241.16956000000005, "r": 219.5952, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "68", "bbox": {"l": 245.27496, "t": 241.16956000000005, "r": 253.61371, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Table", "bbox": {"l": 86.372002, "t": 252.12854000000004, "r": 106.17878, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "82", "bbox": {"l": 151.07401, "t": 252.12854000000004, "r": 159.41275, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "83", "bbox": {"l": 177.23795, "t": 252.12854000000004, "r": 185.57669, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "82", "bbox": {"l": 211.25645, "t": 252.12854000000004, "r": 219.5952, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "82", "bbox": {"l": 245.27496, "t": 252.12854000000004, "r": 253.61371, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Text", "bbox": {"l": 86.372002, "t": 263.08752000000004, "r": 102.3322, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "85", "bbox": {"l": 151.07401, "t": 263.08752000000004, "r": 159.41275, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "84", "bbox": {"l": 177.23795, "t": 263.08752000000004, "r": 185.57669, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "84", "bbox": {"l": 211.25645, "t": 263.08752000000004, "r": 219.5952, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "84", "bbox": {"l": 245.27496, "t": 263.08752000000004, "r": 253.61371, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "Title", "bbox": {"l": 86.372002, "t": 274.04657, "r": 103.36333, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "77", "bbox": {"l": 151.07401, "t": 274.04657, "r": 159.41275, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "Sec.-h.", "bbox": {"l": 169.37442, "t": 274.04657, "r": 193.43127, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "Sec.-h.", "bbox": {"l": 203.39294, "t": 274.04657, "r": 227.4498, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "Sec.-h.", "bbox": {"l": 237.41147, "t": 274.04657, "r": 261.46832, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "Overall", "bbox": {"l": 86.372002, "t": 285.40454, "r": 113.31602000000001, "b": 293.77917, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "72", "bbox": {"l": 151.07401, "t": 285.40454, "r": 159.41275, "b": 293.77917, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "73", "bbox": {"l": 177.23795, "t": 285.40454, "r": 185.57669, "b": 293.77917, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "78", "bbox": {"l": 211.25645, "t": 285.40454, "r": 219.5952, "b": 293.77917, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "77", "bbox": {"l": 245.27496, "t": 285.40454, "r": 253.61371, "b": 293.77917, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Learning Curve", "bbox": {"l": 53.79800000000001, "t": 319.56992, "r": 131.05624, "b": 329.879, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "One of the fundamental questions related to any dataset is if it is", "bbox": {"l": 53.79800000000001, "t": 334.77155, "r": 294.04153, "b": 343.14618, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "\u201clarge enough\u201d. To answer this question for DocLayNet, we per-", "bbox": {"l": 52.785, "t": 345.73053, "r": 295.55835, "b": 354.10516000000007, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "formed a data ablation study in which we evaluated a Mask R-CNN", "bbox": {"l": 53.79800000000001, "t": 356.6895400000001, "r": 294.04535, "b": 365.06418, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "model trained on increasing fractions of the DocLayNet dataset.", "bbox": {"l": 53.79800000000001, "t": 367.64853, "r": 295.4281, "b": 376.02316, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "As can be seen in Figure 5, the mAP score rises sharply in the be-", "bbox": {"l": 53.484001, "t": 378.60754, "r": 295.55667, "b": 386.98218, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "ginning and eventually levels out. To estimate the error-bar on the", "bbox": {"l": 53.79800000000001, "t": 389.56653, "r": 294.04865, "b": 397.94116, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "metrics, we ran the training five times on the entire data-set. This", "bbox": {"l": 53.79800000000001, "t": 400.52554000000003, "r": 294.04376, "b": 408.90018, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "resulted in a 1% error-bar, depicted by the shaded area in Figure 5.", "bbox": {"l": 53.79800000000001, "t": 411.48456, "r": 295.42459, "b": 419.85919, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "In the inset of Figure 5, we show the exact same data-points, but", "bbox": {"l": 53.79800000000001, "t": 422.44354, "r": 294.04709, "b": 430.81818, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "with a logarithmic scale on the x-axis. As is expected, the mAP", "bbox": {"l": 53.466999, "t": 433.40253000000007, "r": 294.04535, "b": 441.7771599999999, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "score increases linearly as a function of the data-size in the inset.", "bbox": {"l": 53.79800000000001, "t": 444.36053000000004, "r": 295.42902, "b": 452.73517, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "The curve ultimately flattens out between the 80% and 100% mark,", "bbox": {"l": 53.528999, "t": 455.31955, "r": 295.03122, "b": 463.69418, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "with the 80% mark falling within the error-bars of the 100% mark.", "bbox": {"l": 53.466999, "t": 466.27853, "r": 295.42154, "b": 474.65317, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "This provides a good indication that the model would not improve", "bbox": {"l": 53.528999, "t": 477.23755, "r": 294.04553, "b": 485.61218, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "significantly by yet increasing the data size. Rather, it would prob-", "bbox": {"l": 53.79800000000001, "t": 488.19653, "r": 295.55646, "b": 496.57117, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "ably benefit more from improved data consistency (as discussed", "bbox": {"l": 53.79800000000001, "t": 499.15555, "r": 294.04715, "b": 507.53018, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "in Section 3), data augmentation methods [23], or the addition of", "bbox": {"l": 53.79800000000001, "t": 510.11453, "r": 294.04245, "b": 518.4891700000001, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "more document categories and styles.", "bbox": {"l": 53.79800000000001, "t": 521.0735500000001, "r": 191.47707, "b": 529.44818, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "Impact of Class Labels", "bbox": {"l": 53.79800000000001, "t": 542.50992, "r": 164.32898, "b": 552.81902, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "The choice and number of labels can have a significant effect on", "bbox": {"l": 53.528999, "t": 557.71155, "r": 294.04333, "b": 566.08617, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "the overall model performance. Since PubLayNet, DocBank and", "bbox": {"l": 53.79800000000001, "t": 568.6705499999999, "r": 294.04712, "b": 577.04517, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "DocLayNet all have different label sets, it is of particular interest to", "bbox": {"l": 53.79800000000001, "t": 579.62955, "r": 294.04538, "b": 588.0041699999999, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "understand and quantify this influence of the label set on the model", "bbox": {"l": 53.79800000000001, "t": 590.5885499999999, "r": 294.04535, "b": 598.96317, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "performance. We investigate this by either down-mapping labels", "bbox": {"l": 53.79800000000001, "t": 601.54755, "r": 294.04266, "b": 609.92216, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "into more common ones (e.g.", "bbox": {"l": 53.79800000000001, "t": 612.50656, "r": 163.59247, "b": 620.88118, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "Caption", "bbox": {"l": 166.26401, "t": 612.55139, "r": 194.97244, "b": 620.89015, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "\u2192", "bbox": {"l": 194.994, "t": 612.45276, "r": 204.1756, "b": 620.15491, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "Text", "bbox": {"l": 204.17599, "t": 612.55139, "r": 219.33961000000002, "b": 620.89015, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": ") or excluding them", "bbox": {"l": 219.849, "t": 612.50656, "r": 294.04828, "b": 620.88118, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "from the annotations entirely. Furthermore, it must be stressed", "bbox": {"l": 53.79800000000001, "t": 623.46556, "r": 294.04709, "b": 631.84018, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "that all mappings and exclusions were performed on the data be-", "bbox": {"l": 53.79800000000001, "t": 634.42355, "r": 295.55679, "b": 642.79817, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "fore model training. In Table 3, we present the mAP scores for a", "bbox": {"l": 53.79800000000001, "t": 645.38255, "r": 294.04715, "b": 653.75717, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "Mask R-CNN R50 network on different label sets. Where a label", "bbox": {"l": 53.79800000000001, "t": 656.34155, "r": 294.04715, "b": 664.71617, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "is down-mapped, we show its corresponding label, otherwise it", "bbox": {"l": 53.79800000000001, "t": 667.30055, "r": 294.04712, "b": 675.67517, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "was excluded. We present three different label sets, with 6, 5 and 4", "bbox": {"l": 53.466999, "t": 678.25955, "r": 294.25174, "b": 686.63417, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "different labels respectively. The set of 5 labels contains the same", "bbox": {"l": 53.79800000000001, "t": 689.21855, "r": 294.04639, "b": 697.59317, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "labels as PubLayNet. However, due to the different definition of", "bbox": {"l": 53.79800000000001, "t": 700.177551, "r": 294.04712, "b": 708.55217, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "Table 4: Performance of a Mask R-CNN R50 network with", "bbox": {"l": 317.659, "t": 86.87298999999996, "r": 558.20068, "b": 95.34625000000017, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "document-wise and page-wise split for different label sets.", "bbox": {"l": 317.95499, "t": 97.83196999999996, "r": 559.73401, "b": 106.30524000000003, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "Naive page-wise split will result in", "bbox": {"l": 317.95499, "t": 108.79094999999995, "r": 467.72089, "b": 117.26422000000014, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "GLYPH<tildelow>", "bbox": {"l": 471.90900000000005, "t": 107.12798999999995, "r": 477.53900000000004, "b": 115.19768999999997, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "10% point improve-", "bbox": {"l": 477.54001000000005, "t": 108.79094999999995, "r": 559.80682, "b": 117.26422000000014, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "ment.", "bbox": {"l": 317.95502, "t": 119.74993999999992, "r": 341.37524, "b": 128.22321, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "Class-count", "bbox": {"l": 358.63901, "t": 153.10051999999996, "r": 401.73154, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "11", "bbox": {"l": 440.22501, "t": 153.10051999999996, "r": 448.56375, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "5", "bbox": {"l": 494.38, "t": 153.10051999999996, "r": 498.54938, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "Split", "bbox": {"l": 358.63901, "t": 164.05951000000005, "r": 375.27167, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "Doc", "bbox": {"l": 423.341, "t": 164.05951000000005, "r": 438.0459, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "Page", "bbox": {"l": 448.00757, "t": 164.05951000000005, "r": 465.4472, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "Doc", "bbox": {"l": 475.41101, "t": 164.05951000000005, "r": 490.11591, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Page", "bbox": {"l": 500.07757999999995, "t": 164.05951000000005, "r": 517.51721, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "Caption", "bbox": {"l": 358.63901, "t": 175.41656, "r": 387.82465, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "68", "bbox": {"l": 426.52399, "t": 175.41656, "r": 434.86273, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "83", "bbox": {"l": 452.56240999999994, "t": 175.41656, "r": 460.90115000000003, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "Footnote", "bbox": {"l": 358.63901, "t": 186.37554999999998, "r": 391.14221, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "71", "bbox": {"l": 426.52399, "t": 186.37554999999998, "r": 434.86273, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "84", "bbox": {"l": 452.56240999999994, "t": 186.37554999999998, "r": 460.90115000000003, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "Formula", "bbox": {"l": 358.63901, "t": 197.33452999999997, "r": 389.15167, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "60", "bbox": {"l": 426.52399, "t": 197.33452999999997, "r": 434.86273, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "66", "bbox": {"l": 452.56240999999994, "t": 197.33452999999997, "r": 460.90115000000003, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "List-item", "bbox": {"l": 358.63901, "t": 208.29351999999994, "r": 391.5188, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "81", "bbox": {"l": 426.52399, "t": 208.29351999999994, "r": 434.86273, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "88", "bbox": {"l": 452.56240999999994, "t": 208.29351999999994, "r": 460.90115000000003, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "82", "bbox": {"l": 478.59399, "t": 208.29351999999994, "r": 486.93274, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "88", "bbox": {"l": 504.6324200000001, "t": 208.29351999999994, "r": 512.97119, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "Page-footer", "bbox": {"l": 358.63901, "t": 219.25256000000002, "r": 401.16666, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "62", "bbox": {"l": 426.52399, "t": 219.25256000000002, "r": 434.86273, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "89", "bbox": {"l": 452.56240999999994, "t": 219.25256000000002, "r": 460.90115000000003, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "Page-header", "bbox": {"l": 358.63901, "t": 230.21155, "r": 403.91931, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "72", "bbox": {"l": 426.52399, "t": 230.21155, "r": 434.86273, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "90", "bbox": {"l": 452.56240999999994, "t": 230.21155, "r": 460.90115000000003, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "Picture", "bbox": {"l": 358.63901, "t": 241.16956000000005, "r": 384.62366, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "72", "bbox": {"l": 426.52399, "t": 241.16956000000005, "r": 434.86273, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "82", "bbox": {"l": 452.56240999999994, "t": 241.16956000000005, "r": 460.90115000000003, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "72", "bbox": {"l": 478.59399, "t": 241.16956000000005, "r": 486.93274, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "82", "bbox": {"l": 504.6324200000001, "t": 241.16956000000005, "r": 512.97119, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "Section-header", "bbox": {"l": 358.63901, "t": 252.12854000000004, "r": 413.37891, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "68", "bbox": {"l": 426.52399, "t": 252.12854000000004, "r": 434.86273, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "83", "bbox": {"l": 452.56240999999994, "t": 252.12854000000004, "r": 460.90115000000003, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "69", "bbox": {"l": 478.59399, "t": 252.12854000000004, "r": 486.93274, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "83", "bbox": {"l": 504.6324200000001, "t": 252.12854000000004, "r": 512.97119, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "Table", "bbox": {"l": 358.63901, "t": 263.08752000000004, "r": 378.44577, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "82", "bbox": {"l": 426.52399, "t": 263.08752000000004, "r": 434.86273, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "89", "bbox": {"l": 452.56240999999994, "t": 263.08752000000004, "r": 460.90115000000003, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "82", "bbox": {"l": 478.59399, "t": 263.08752000000004, "r": 486.93274, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "90", "bbox": {"l": 504.6324200000001, "t": 263.08752000000004, "r": 512.97119, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "Text", "bbox": {"l": 358.63901, "t": 274.04657, "r": 374.59921, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "85", "bbox": {"l": 426.52399, "t": 274.04657, "r": 434.86273, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "91", "bbox": {"l": 452.56240999999994, "t": 274.04657, "r": 460.90115000000003, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "84", "bbox": {"l": 478.59399, "t": 274.04657, "r": 486.93274, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "90", "bbox": {"l": 504.6324200000001, "t": 274.04657, "r": 512.97119, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "Title", "bbox": {"l": 358.63901, "t": 285.00552, "r": 375.63034, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "77", "bbox": {"l": 426.52399, "t": 285.00552, "r": 434.86273, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "81", "bbox": {"l": 452.56240999999994, "t": 285.00552, "r": 460.90115000000003, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "All", "bbox": {"l": 358.63901, "t": 296.36255, "r": 369.60492, "b": 304.73718, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "72", "bbox": {"l": 426.52399, "t": 296.36255, "r": 434.86273, "b": 304.73718, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "84", "bbox": {"l": 452.56240999999994, "t": 296.36255, "r": 460.90115000000003, "b": 304.73718, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "78", "bbox": {"l": 478.59399, "t": 296.36255, "r": 486.93274, "b": 304.73718, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "87", "bbox": {"l": 504.6324200000001, "t": 296.36255, "r": 512.97119, "b": 304.73718, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "lists in PubLayNet (grouped list-items) versus DocLayNet (separate", "bbox": {"l": 317.95499, "t": 331.40353, "r": 558.20233, "b": 339.77817, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "list-items), the label set of size 4 is the closest to PubLayNet, in the", "bbox": {"l": 317.95499, "t": 342.36255, "r": 558.2005, "b": 350.73718, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "assumption that the", "bbox": {"l": 317.95499, "t": 353.32153, "r": 393.16028, "b": 361.69617000000005, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "List", "bbox": {"l": 395.84201, "t": 353.36639, "r": 409.14905, "b": 361.70514, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "is down-mapped to", "bbox": {"l": 412.33301, "t": 353.32153, "r": 485.02324999999996, "b": 361.69617000000005, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "Text", "bbox": {"l": 487.70401, "t": 353.36639, "r": 502.86761, "b": 361.70514, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "in PubLayNet.", "bbox": {"l": 506.05499, "t": 353.32153, "r": 559.58496, "b": 361.69617000000005, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "The results in Table 3 show that the prediction accuracy on the", "bbox": {"l": 317.686, "t": 364.28054999999995, "r": 558.2002, "b": 372.65518, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "remaining class labels does not change significantly when other", "bbox": {"l": 317.95499, "t": 375.23853, "r": 558.36877, "b": 383.61316, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "classes are merged into them. The overall macro-average improves", "bbox": {"l": 317.95499, "t": 386.19754, "r": 558.19958, "b": 394.57217, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "by around 5%, in particular when", "bbox": {"l": 317.95499, "t": 397.15652, "r": 439.49454, "b": 405.53116000000006, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "Page-footer", "bbox": {"l": 441.728, "t": 397.20139, "r": 481.8616, "b": 405.54013, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "and", "bbox": {"l": 484.74298, "t": 397.15652, "r": 498.23743, "b": 405.53116000000006, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "Page-header", "bbox": {"l": 500.47299, "t": 397.20139, "r": 543.95105, "b": 405.54013, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": "are", "bbox": {"l": 546.83197, "t": 397.15652, "r": 558.20142, "b": 405.53116000000006, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "excluded.", "bbox": {"l": 317.95496, "t": 408.11553999999995, "r": 352.37698, "b": 416.49017, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "Impact of Document Split in Train and Test Set", "bbox": {"l": 317.95496, "t": 429.3949, "r": 549.8606, "b": 439.70398, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": "Many documents in DocLayNet have a unique styling. In order", "bbox": {"l": 317.95499, "t": 444.59653, "r": 558.36884, "b": 452.97116, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "to avoid overfitting on a particular style, we have split the train-,", "bbox": {"l": 317.95499, "t": 455.55554, "r": 559.19189, "b": 463.93018, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "test- and validation-sets of DocLayNet on document boundaries, i.e.", "bbox": {"l": 317.95499, "t": 466.51453, "r": 559.58185, "b": 474.88916, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "every document contributes pages to only one set. To the best of", "bbox": {"l": 317.95499, "t": 477.47354, "r": 558.20605, "b": 485.84818, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": "our knowledge, this was not considered in PubLayNet or DocBank.", "bbox": {"l": 317.95499, "t": 488.43253, "r": 559.58203, "b": 496.80716, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "To quantify how this affects model performance, we trained and", "bbox": {"l": 317.686, "t": 499.39154, "r": 558.20032, "b": 507.76617, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "evaluated a Mask R-CNN R50 model on a modified dataset version.", "bbox": {"l": 317.95499, "t": 510.35052, "r": 559.5849, "b": 518.72516, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "Here, the train-, test- and validation-sets were obtained by a ran-", "bbox": {"l": 317.95499, "t": 521.30954, "r": 559.71381, "b": 529.68417, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "domised draw over the individual pages. As can be seen in Table 4,", "bbox": {"l": 317.95499, "t": 532.26855, "r": 559.18707, "b": 540.64317, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "the difference in model performance is surprisingly large: page-", "bbox": {"l": 317.95499, "t": 543.22655, "r": 559.71313, "b": 551.60117, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "wise splitting gains", "bbox": {"l": 317.62299, "t": 554.18555, "r": 388.35168, "b": 562.56017, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "\u02dc", "bbox": {"l": 391.36499, "t": 552.50055, "r": 393.98318, "b": 560.87517, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "10% in mAP over the document-wise splitting.", "bbox": {"l": 390.59, "t": 554.18555, "r": 559.58191, "b": 562.56017, "coord_origin": "TOPLEFT"}}, {"id": 201, "text": "Thus, random page-wise splitting of DocLayNet can easily lead", "bbox": {"l": 317.686, "t": 565.14455, "r": 558.20032, "b": 573.51917, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": "to accidental overestimation of model performance and should be", "bbox": {"l": 317.95499, "t": 576.10356, "r": 558.20508, "b": 584.4781800000001, "coord_origin": "TOPLEFT"}}, {"id": 203, "text": "avoided.", "bbox": {"l": 317.95499, "t": 587.06256, "r": 348.50354, "b": 595.43718, "coord_origin": "TOPLEFT"}}, {"id": 204, "text": "Dataset Comparison", "bbox": {"l": 317.95499, "t": 608.34192, "r": 418.54776, "b": 618.65102, "coord_origin": "TOPLEFT"}}, {"id": 205, "text": "Throughout this paper, we claim that DocLayNet\u2019s wider variety of", "bbox": {"l": 317.686, "t": 623.54355, "r": 558.20575, "b": 631.91817, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": "document layouts leads to more robust layout detection models. In", "bbox": {"l": 317.95499, "t": 634.50255, "r": 558.20624, "b": 642.87717, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": "Table 5, we provide evidence for that. We trained models on each", "bbox": {"l": 317.686, "t": 645.46155, "r": 558.20319, "b": 653.83617, "coord_origin": "TOPLEFT"}}, {"id": 208, "text": "of the available datasets (PubLayNet, DocBank and DocLayNet)", "bbox": {"l": 317.95499, "t": 656.42055, "r": 558.74377, "b": 664.79517, "coord_origin": "TOPLEFT"}}, {"id": 209, "text": "and evaluated them on the test sets of the other datasets. Due to", "bbox": {"l": 317.95499, "t": 667.37955, "r": 558.20398, "b": 675.7541699999999, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": "the different label sets and annotation styles, a direct comparison", "bbox": {"l": 317.95499, "t": 678.3385499999999, "r": 558.20062, "b": 686.71317, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "is not possible. Hence, we focussed on the common labels among", "bbox": {"l": 317.95499, "t": 689.29755, "r": 558.20343, "b": 697.672173, "coord_origin": "TOPLEFT"}}, {"id": 212, "text": "the datasets. Between PubLayNet and DocLayNet, these are", "bbox": {"l": 317.95499, "t": 700.256554, "r": 531.07666, "b": 708.631172, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "Picture", "bbox": {"l": 533.16199, "t": 700.301384, "r": 557.2561, "b": 708.640137, "coord_origin": "TOPLEFT"}}, {"id": 214, "text": ",", "bbox": {"l": 557.255, "t": 700.256554, "r": 559.18817, "b": 708.631172, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 12, "label": "page_header", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.9316118955612183, "cells": [{"id": 0, "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "page_header", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.9318180084228516, "cells": [{"id": 1, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 53.501999, "t": 86.87292000000002, "r": 295.64865, "b": 128.22313999999994, "coord_origin": "TOPLEFT"}, "confidence": 0.8296934366226196, "cells": [{"id": 2, "text": "Table 3: Performance of a Mask R-CNN R50 network in", "bbox": {"l": 53.501999, "t": 86.87292000000002, "r": 294.0437, "b": 95.34618999999998, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "mAP@0.5-0.95 scores trained on DocLayNet with different", "bbox": {"l": 53.79800000000001, "t": 97.83191, "r": 294.04376, "b": 106.30517999999995, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "class label sets. The reduced label sets were obtained by ei-", "bbox": {"l": 53.79800000000001, "t": 108.79088999999999, "r": 295.64865, "b": 117.26415999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "ther down-mapping or dropping labels.", "bbox": {"l": 53.79800000000001, "t": 119.74987999999996, "r": 213.23856, "b": 128.22313999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "table", "bbox": {"l": 80.35525512695312, "t": 150.93629455566406, "r": 267.0082092285156, "b": 295.4454650878906, "coord_origin": "TOPLEFT"}, "confidence": 0.9869412779808044, "cells": [{"id": 6, "text": "Class-count", "bbox": {"l": 86.372002, "t": 153.10051999999996, "r": 129.46452, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "11", "bbox": {"l": 151.07401, "t": 153.10051999999996, "r": 159.41275, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "6", "bbox": {"l": 179.31816, "t": 153.10051999999996, "r": 183.48753, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "5", "bbox": {"l": 213.33669, "t": 153.10051999999996, "r": 217.50606, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "4", "bbox": {"l": 247.35521, "t": 153.10051999999996, "r": 251.52458, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Caption", "bbox": {"l": 86.372002, "t": 164.45752000000005, "r": 115.55763, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "68", "bbox": {"l": 151.07401, "t": 164.45752000000005, "r": 159.41275, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Text", "bbox": {"l": 173.42723, "t": 164.45752000000005, "r": 189.38742, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Text", "bbox": {"l": 207.44576, "t": 164.45752000000005, "r": 223.40594000000002, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Text", "bbox": {"l": 241.46428, "t": 164.45752000000005, "r": 257.42447, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Footnote", "bbox": {"l": 86.372002, "t": 175.41656, "r": 118.8752, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "71", "bbox": {"l": 151.07401, "t": 175.41656, "r": 159.41275, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Text", "bbox": {"l": 173.42723, "t": 175.41656, "r": 189.38742, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Text", "bbox": {"l": 207.44576, "t": 175.41656, "r": 223.40594000000002, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Text", "bbox": {"l": 241.46428, "t": 175.41656, "r": 257.42447, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Formula", "bbox": {"l": 86.372002, "t": 186.37554999999998, "r": 116.88466, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "60", "bbox": {"l": 151.07401, "t": 186.37554999999998, "r": 159.41275, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Text", "bbox": {"l": 173.42723, "t": 186.37554999999998, "r": 189.38742, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "Text", "bbox": {"l": 207.44576, "t": 186.37554999999998, "r": 223.40594000000002, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "Text", "bbox": {"l": 241.46428, "t": 186.37554999999998, "r": 257.42447, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "List-item", "bbox": {"l": 86.372002, "t": 197.33452999999997, "r": 119.25179, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "81", "bbox": {"l": 151.07401, "t": 197.33452999999997, "r": 159.41275, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Text", "bbox": {"l": 173.42723, "t": 197.33452999999997, "r": 189.38742, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "82", "bbox": {"l": 211.25647, "t": 197.33452999999997, "r": 219.59521, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Text", "bbox": {"l": 241.46426, "t": 197.33452999999997, "r": 257.42447, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Page-footer", "bbox": {"l": 86.372002, "t": 208.29351999999994, "r": 128.89964, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "62", "bbox": {"l": 151.07401, "t": 208.29351999999994, "r": 159.41275, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "62", "bbox": {"l": 177.23795, "t": 208.29351999999994, "r": 185.57669, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "-", "bbox": {"l": 213.91052, "t": 208.29351999999994, "r": 216.94116, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "-", "bbox": {"l": 247.92905000000002, "t": 208.29351999999994, "r": 250.95969, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Page-header", "bbox": {"l": 86.372002, "t": 219.25256000000002, "r": 131.65231, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "72", "bbox": {"l": 151.07401, "t": 219.25256000000002, "r": 159.41275, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "68", "bbox": {"l": 177.23795, "t": 219.25256000000002, "r": 185.57669, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "-", "bbox": {"l": 213.91052, "t": 219.25256000000002, "r": 216.94116, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "-", "bbox": {"l": 247.92905000000002, "t": 219.25256000000002, "r": 250.95969, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Picture", "bbox": {"l": 86.372002, "t": 230.21155, "r": 112.35663, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "72", "bbox": {"l": 151.07401, "t": 230.21155, "r": 159.41275, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "72", "bbox": {"l": 177.23795, "t": 230.21155, "r": 185.57669, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "72", "bbox": {"l": 211.25645, "t": 230.21155, "r": 219.5952, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "72", "bbox": {"l": 245.27496, "t": 230.21155, "r": 253.61371, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "Section-header", "bbox": {"l": 86.372002, "t": 241.16956000000005, "r": 141.11188, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "68", "bbox": {"l": 151.07401, "t": 241.16956000000005, "r": 159.41275, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "67", "bbox": {"l": 177.23795, "t": 241.16956000000005, "r": 185.57669, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "69", "bbox": {"l": 211.25645, "t": 241.16956000000005, "r": 219.5952, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "68", "bbox": {"l": 245.27496, "t": 241.16956000000005, "r": 253.61371, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Table", "bbox": {"l": 86.372002, "t": 252.12854000000004, "r": 106.17878, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "82", "bbox": {"l": 151.07401, "t": 252.12854000000004, "r": 159.41275, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "83", "bbox": {"l": 177.23795, "t": 252.12854000000004, "r": 185.57669, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "82", "bbox": {"l": 211.25645, "t": 252.12854000000004, "r": 219.5952, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "82", "bbox": {"l": 245.27496, "t": 252.12854000000004, "r": 253.61371, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Text", "bbox": {"l": 86.372002, "t": 263.08752000000004, "r": 102.3322, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "85", "bbox": {"l": 151.07401, "t": 263.08752000000004, "r": 159.41275, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "84", "bbox": {"l": 177.23795, "t": 263.08752000000004, "r": 185.57669, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "84", "bbox": {"l": 211.25645, "t": 263.08752000000004, "r": 219.5952, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "84", "bbox": {"l": 245.27496, "t": 263.08752000000004, "r": 253.61371, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "Title", "bbox": {"l": 86.372002, "t": 274.04657, "r": 103.36333, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "77", "bbox": {"l": 151.07401, "t": 274.04657, "r": 159.41275, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "Sec.-h.", "bbox": {"l": 169.37442, "t": 274.04657, "r": 193.43127, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "Sec.-h.", "bbox": {"l": 203.39294, "t": 274.04657, "r": 227.4498, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "Sec.-h.", "bbox": {"l": 237.41147, "t": 274.04657, "r": 261.46832, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "Overall", "bbox": {"l": 86.372002, "t": 285.40454, "r": 113.31602000000001, "b": 293.77917, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "72", "bbox": {"l": 151.07401, "t": 285.40454, "r": 159.41275, "b": 293.77917, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "73", "bbox": {"l": 177.23795, "t": 285.40454, "r": 185.57669, "b": 293.77917, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "78", "bbox": {"l": 211.25645, "t": 285.40454, "r": 219.5952, "b": 293.77917, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "77", "bbox": {"l": 245.27496, "t": 285.40454, "r": 253.61371, "b": 293.77917, "coord_origin": "TOPLEFT"}}], "children": [{"id": 15, "label": "text", "bbox": {"l": 86.372002, "t": 153.10051999999996, "r": 129.46452, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": "Class-count", "bbox": {"l": 86.372002, "t": 153.10051999999996, "r": 129.46452, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 151.07401, "t": 153.10051999999996, "r": 159.41275, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "11", "bbox": {"l": 151.07401, "t": 153.10051999999996, "r": 159.41275, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 179.31816, "t": 153.10051999999996, "r": 183.48753, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "6", "bbox": {"l": 179.31816, "t": 153.10051999999996, "r": 183.48753, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 213.33669, "t": 153.10051999999996, "r": 217.50606, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "5", "bbox": {"l": 213.33669, "t": 153.10051999999996, "r": 217.50606, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 247.35521, "t": 153.10051999999996, "r": 251.52458, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "4", "bbox": {"l": 247.35521, "t": 153.10051999999996, "r": 251.52458, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 86.372002, "t": 164.45752000000005, "r": 115.55763, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "Caption", "bbox": {"l": 86.372002, "t": 164.45752000000005, "r": 115.55763, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 151.07401, "t": 164.45752000000005, "r": 159.41275, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "68", "bbox": {"l": 151.07401, "t": 164.45752000000005, "r": 159.41275, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 173.42723, "t": 164.45752000000005, "r": 189.38742, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "Text", "bbox": {"l": 173.42723, "t": 164.45752000000005, "r": 189.38742, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 207.44576, "t": 164.45752000000005, "r": 223.40594000000002, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "Text", "bbox": {"l": 207.44576, "t": 164.45752000000005, "r": 223.40594000000002, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 241.46428, "t": 164.45752000000005, "r": 257.42447, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "Text", "bbox": {"l": 241.46428, "t": 164.45752000000005, "r": 257.42447, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 86.372002, "t": 175.41656, "r": 118.8752, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "Footnote", "bbox": {"l": 86.372002, "t": 175.41656, "r": 118.8752, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 151.07401, "t": 175.41656, "r": 159.41275, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "71", "bbox": {"l": 151.07401, "t": 175.41656, "r": 159.41275, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 173.42723, "t": 175.41656, "r": 189.38742, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "Text", "bbox": {"l": 173.42723, "t": 175.41656, "r": 189.38742, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 207.44576, "t": 175.41656, "r": 223.40594000000002, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "Text", "bbox": {"l": 207.44576, "t": 175.41656, "r": 223.40594000000002, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 241.46428, "t": 175.41656, "r": 257.42447, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "Text", "bbox": {"l": 241.46428, "t": 175.41656, "r": 257.42447, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 86.372002, "t": 186.37554999999998, "r": 116.88466, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "Formula", "bbox": {"l": 86.372002, "t": 186.37554999999998, "r": 116.88466, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 151.07401, "t": 186.37554999999998, "r": 159.41275, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "60", "bbox": {"l": 151.07401, "t": 186.37554999999998, "r": 159.41275, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 173.42723, "t": 186.37554999999998, "r": 189.38742, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "Text", "bbox": {"l": 173.42723, "t": 186.37554999999998, "r": 189.38742, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 207.44576, "t": 186.37554999999998, "r": 223.40594000000002, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "Text", "bbox": {"l": 207.44576, "t": 186.37554999999998, "r": 223.40594000000002, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 241.46428, "t": 186.37554999999998, "r": 257.42447, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "Text", "bbox": {"l": 241.46428, "t": 186.37554999999998, "r": 257.42447, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 86.372002, "t": 197.33452999999997, "r": 119.25179, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "List-item", "bbox": {"l": 86.372002, "t": 197.33452999999997, "r": 119.25179, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 151.07401, "t": 197.33452999999997, "r": 159.41275, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "81", "bbox": {"l": 151.07401, "t": 197.33452999999997, "r": 159.41275, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 173.42723, "t": 197.33452999999997, "r": 189.38742, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "Text", "bbox": {"l": 173.42723, "t": 197.33452999999997, "r": 189.38742, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 211.25647, "t": 197.33452999999997, "r": 219.59521, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "82", "bbox": {"l": 211.25647, "t": 197.33452999999997, "r": 219.59521, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 241.46426, "t": 197.33452999999997, "r": 257.42447, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "Text", "bbox": {"l": 241.46426, "t": 197.33452999999997, "r": 257.42447, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 86.372002, "t": 208.29351999999994, "r": 128.89964, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "Page-footer", "bbox": {"l": 86.372002, "t": 208.29351999999994, "r": 128.89964, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 151.07401, "t": 208.29351999999994, "r": 159.41275, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "62", "bbox": {"l": 151.07401, "t": 208.29351999999994, "r": 159.41275, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 177.23795, "t": 208.29351999999994, "r": 185.57669, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "62", "bbox": {"l": 177.23795, "t": 208.29351999999994, "r": 185.57669, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 213.91052, "t": 208.29351999999994, "r": 216.94116, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "-", "bbox": {"l": 213.91052, "t": 208.29351999999994, "r": 216.94116, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 247.92905000000002, "t": 208.29351999999994, "r": 250.95969, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "-", "bbox": {"l": 247.92905000000002, "t": 208.29351999999994, "r": 250.95969, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 86.372002, "t": 219.25256000000002, "r": 131.65231, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "Page-header", "bbox": {"l": 86.372002, "t": 219.25256000000002, "r": 131.65231, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 151.07401, "t": 219.25256000000002, "r": 159.41275, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "72", "bbox": {"l": 151.07401, "t": 219.25256000000002, "r": 159.41275, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 177.23795, "t": 219.25256000000002, "r": 185.57669, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "68", "bbox": {"l": 177.23795, "t": 219.25256000000002, "r": 185.57669, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 213.91052, "t": 219.25256000000002, "r": 216.94116, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "-", "bbox": {"l": 213.91052, "t": 219.25256000000002, "r": 216.94116, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 247.92905000000002, "t": 219.25256000000002, "r": 250.95969, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "-", "bbox": {"l": 247.92905000000002, "t": 219.25256000000002, "r": 250.95969, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 86.372002, "t": 230.21155, "r": 112.35663, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "Picture", "bbox": {"l": 86.372002, "t": 230.21155, "r": 112.35663, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 151.07401, "t": 230.21155, "r": 159.41275, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "72", "bbox": {"l": 151.07401, "t": 230.21155, "r": 159.41275, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 177.23795, "t": 230.21155, "r": 185.57669, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "72", "bbox": {"l": 177.23795, "t": 230.21155, "r": 185.57669, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 211.25645, "t": 230.21155, "r": 219.5952, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "72", "bbox": {"l": 211.25645, "t": 230.21155, "r": 219.5952, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 245.27496, "t": 230.21155, "r": 253.61371, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "72", "bbox": {"l": 245.27496, "t": 230.21155, "r": 253.61371, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 86.372002, "t": 241.16956000000005, "r": 141.11188, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "Section-header", "bbox": {"l": 86.372002, "t": 241.16956000000005, "r": 141.11188, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 151.07401, "t": 241.16956000000005, "r": 159.41275, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "68", "bbox": {"l": 151.07401, "t": 241.16956000000005, "r": 159.41275, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 177.23795, "t": 241.16956000000005, "r": 185.57669, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "67", "bbox": {"l": 177.23795, "t": 241.16956000000005, "r": 185.57669, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 211.25645, "t": 241.16956000000005, "r": 219.5952, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "69", "bbox": {"l": 211.25645, "t": 241.16956000000005, "r": 219.5952, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 245.27496, "t": 241.16956000000005, "r": 253.61371, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "68", "bbox": {"l": 245.27496, "t": 241.16956000000005, "r": 253.61371, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 86.372002, "t": 252.12854000000004, "r": 106.17878, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "Table", "bbox": {"l": 86.372002, "t": 252.12854000000004, "r": 106.17878, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 151.07401, "t": 252.12854000000004, "r": 159.41275, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "82", "bbox": {"l": 151.07401, "t": 252.12854000000004, "r": 159.41275, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 177.23795, "t": 252.12854000000004, "r": 185.57669, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "83", "bbox": {"l": 177.23795, "t": 252.12854000000004, "r": 185.57669, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 211.25645, "t": 252.12854000000004, "r": 219.5952, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "82", "bbox": {"l": 211.25645, "t": 252.12854000000004, "r": 219.5952, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 245.27496, "t": 252.12854000000004, "r": 253.61371, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "82", "bbox": {"l": 245.27496, "t": 252.12854000000004, "r": 253.61371, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 86.372002, "t": 263.08752000000004, "r": 102.3322, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "Text", "bbox": {"l": 86.372002, "t": 263.08752000000004, "r": 102.3322, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 151.07401, "t": 263.08752000000004, "r": 159.41275, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "85", "bbox": {"l": 151.07401, "t": 263.08752000000004, "r": 159.41275, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 177.23795, "t": 263.08752000000004, "r": 185.57669, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "84", "bbox": {"l": 177.23795, "t": 263.08752000000004, "r": 185.57669, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 211.25645, "t": 263.08752000000004, "r": 219.5952, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "84", "bbox": {"l": 211.25645, "t": 263.08752000000004, "r": 219.5952, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 245.27496, "t": 263.08752000000004, "r": 253.61371, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "84", "bbox": {"l": 245.27496, "t": 263.08752000000004, "r": 253.61371, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 86.372002, "t": 274.04657, "r": 103.36333, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "Title", "bbox": {"l": 86.372002, "t": 274.04657, "r": 103.36333, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 151.07401, "t": 274.04657, "r": 159.41275, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "77", "bbox": {"l": 151.07401, "t": 274.04657, "r": 159.41275, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 169.37442, "t": 274.04657, "r": 193.43127, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "Sec.-h.", "bbox": {"l": 169.37442, "t": 274.04657, "r": 193.43127, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 203.39294, "t": 274.04657, "r": 227.4498, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "Sec.-h.", "bbox": {"l": 203.39294, "t": 274.04657, "r": 227.4498, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 237.41147, "t": 274.04657, "r": 261.46832, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "Sec.-h.", "bbox": {"l": 237.41147, "t": 274.04657, "r": 261.46832, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 86.372002, "t": 285.40454, "r": 113.31602000000001, "b": 293.77917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "Overall", "bbox": {"l": 86.372002, "t": 285.40454, "r": 113.31602000000001, "b": 293.77917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 151.07401, "t": 285.40454, "r": 159.41275, "b": 293.77917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "72", "bbox": {"l": 151.07401, "t": 285.40454, "r": 159.41275, "b": 293.77917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 177.23795, "t": 285.40454, "r": 185.57669, "b": 293.77917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "73", "bbox": {"l": 177.23795, "t": 285.40454, "r": 185.57669, "b": 293.77917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 211.25645, "t": 285.40454, "r": 219.5952, "b": 293.77917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "78", "bbox": {"l": 211.25645, "t": 285.40454, "r": 219.5952, "b": 293.77917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 245.27496, "t": 285.40454, "r": 253.61371, "b": 293.77917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "77", "bbox": {"l": 245.27496, "t": 285.40454, "r": 253.61371, "b": 293.77917, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 10, "label": "section_header", "bbox": {"l": 53.79800000000001, "t": 319.56992, "r": 131.05624, "b": 329.879, "coord_origin": "TOPLEFT"}, "confidence": 0.9555686116218567, "cells": [{"id": 71, "text": "Learning Curve", "bbox": {"l": 53.79800000000001, "t": 319.56992, "r": 131.05624, "b": 329.879, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "text", "bbox": {"l": 52.785, "t": 334.77155, "r": 295.55835, "b": 529.44818, "coord_origin": "TOPLEFT"}, "confidence": 0.9857739210128784, "cells": [{"id": 72, "text": "One of the fundamental questions related to any dataset is if it is", "bbox": {"l": 53.79800000000001, "t": 334.77155, "r": 294.04153, "b": 343.14618, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "\u201clarge enough\u201d. To answer this question for DocLayNet, we per-", "bbox": {"l": 52.785, "t": 345.73053, "r": 295.55835, "b": 354.10516000000007, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "formed a data ablation study in which we evaluated a Mask R-CNN", "bbox": {"l": 53.79800000000001, "t": 356.6895400000001, "r": 294.04535, "b": 365.06418, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "model trained on increasing fractions of the DocLayNet dataset.", "bbox": {"l": 53.79800000000001, "t": 367.64853, "r": 295.4281, "b": 376.02316, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "As can be seen in Figure 5, the mAP score rises sharply in the be-", "bbox": {"l": 53.484001, "t": 378.60754, "r": 295.55667, "b": 386.98218, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "ginning and eventually levels out. To estimate the error-bar on the", "bbox": {"l": 53.79800000000001, "t": 389.56653, "r": 294.04865, "b": 397.94116, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "metrics, we ran the training five times on the entire data-set. This", "bbox": {"l": 53.79800000000001, "t": 400.52554000000003, "r": 294.04376, "b": 408.90018, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "resulted in a 1% error-bar, depicted by the shaded area in Figure 5.", "bbox": {"l": 53.79800000000001, "t": 411.48456, "r": 295.42459, "b": 419.85919, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "In the inset of Figure 5, we show the exact same data-points, but", "bbox": {"l": 53.79800000000001, "t": 422.44354, "r": 294.04709, "b": 430.81818, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "with a logarithmic scale on the x-axis. As is expected, the mAP", "bbox": {"l": 53.466999, "t": 433.40253000000007, "r": 294.04535, "b": 441.7771599999999, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "score increases linearly as a function of the data-size in the inset.", "bbox": {"l": 53.79800000000001, "t": 444.36053000000004, "r": 295.42902, "b": 452.73517, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "The curve ultimately flattens out between the 80% and 100% mark,", "bbox": {"l": 53.528999, "t": 455.31955, "r": 295.03122, "b": 463.69418, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "with the 80% mark falling within the error-bars of the 100% mark.", "bbox": {"l": 53.466999, "t": 466.27853, "r": 295.42154, "b": 474.65317, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "This provides a good indication that the model would not improve", "bbox": {"l": 53.528999, "t": 477.23755, "r": 294.04553, "b": 485.61218, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "significantly by yet increasing the data size. Rather, it would prob-", "bbox": {"l": 53.79800000000001, "t": 488.19653, "r": 295.55646, "b": 496.57117, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "ably benefit more from improved data consistency (as discussed", "bbox": {"l": 53.79800000000001, "t": 499.15555, "r": 294.04715, "b": 507.53018, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "in Section 3), data augmentation methods [23], or the addition of", "bbox": {"l": 53.79800000000001, "t": 510.11453, "r": 294.04245, "b": 518.4891700000001, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "more document categories and styles.", "bbox": {"l": 53.79800000000001, "t": 521.0735500000001, "r": 191.47707, "b": 529.44818, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "section_header", "bbox": {"l": 53.79800000000001, "t": 542.50992, "r": 164.32898, "b": 552.81902, "coord_origin": "TOPLEFT"}, "confidence": 0.9572026133537292, "cells": [{"id": 90, "text": "Impact of Class Labels", "bbox": {"l": 53.79800000000001, "t": 542.50992, "r": 164.32898, "b": 552.81902, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 53.466999, "t": 557.71155, "r": 295.55679, "b": 708.55217, "coord_origin": "TOPLEFT"}, "confidence": 0.9876301884651184, "cells": [{"id": 91, "text": "The choice and number of labels can have a significant effect on", "bbox": {"l": 53.528999, "t": 557.71155, "r": 294.04333, "b": 566.08617, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "the overall model performance. Since PubLayNet, DocBank and", "bbox": {"l": 53.79800000000001, "t": 568.6705499999999, "r": 294.04712, "b": 577.04517, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "DocLayNet all have different label sets, it is of particular interest to", "bbox": {"l": 53.79800000000001, "t": 579.62955, "r": 294.04538, "b": 588.0041699999999, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "understand and quantify this influence of the label set on the model", "bbox": {"l": 53.79800000000001, "t": 590.5885499999999, "r": 294.04535, "b": 598.96317, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "performance. We investigate this by either down-mapping labels", "bbox": {"l": 53.79800000000001, "t": 601.54755, "r": 294.04266, "b": 609.92216, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "into more common ones (e.g.", "bbox": {"l": 53.79800000000001, "t": 612.50656, "r": 163.59247, "b": 620.88118, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "Caption", "bbox": {"l": 166.26401, "t": 612.55139, "r": 194.97244, "b": 620.89015, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "\u2192", "bbox": {"l": 194.994, "t": 612.45276, "r": 204.1756, "b": 620.15491, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "Text", "bbox": {"l": 204.17599, "t": 612.55139, "r": 219.33961000000002, "b": 620.89015, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": ") or excluding them", "bbox": {"l": 219.849, "t": 612.50656, "r": 294.04828, "b": 620.88118, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "from the annotations entirely. Furthermore, it must be stressed", "bbox": {"l": 53.79800000000001, "t": 623.46556, "r": 294.04709, "b": 631.84018, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "that all mappings and exclusions were performed on the data be-", "bbox": {"l": 53.79800000000001, "t": 634.42355, "r": 295.55679, "b": 642.79817, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "fore model training. In Table 3, we present the mAP scores for a", "bbox": {"l": 53.79800000000001, "t": 645.38255, "r": 294.04715, "b": 653.75717, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "Mask R-CNN R50 network on different label sets. Where a label", "bbox": {"l": 53.79800000000001, "t": 656.34155, "r": 294.04715, "b": 664.71617, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "is down-mapped, we show its corresponding label, otherwise it", "bbox": {"l": 53.79800000000001, "t": 667.30055, "r": 294.04712, "b": 675.67517, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "was excluded. We present three different label sets, with 6, 5 and 4", "bbox": {"l": 53.466999, "t": 678.25955, "r": 294.25174, "b": 686.63417, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "different labels respectively. The set of 5 labels contains the same", "bbox": {"l": 53.79800000000001, "t": 689.21855, "r": 294.04639, "b": 697.59317, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "labels as PubLayNet. However, due to the different definition of", "bbox": {"l": 53.79800000000001, "t": 700.177551, "r": 294.04712, "b": 708.55217, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 317.659, "t": 86.87298999999996, "r": 559.80682, "b": 128.22321, "coord_origin": "TOPLEFT"}, "confidence": 0.8736215829849243, "cells": [{"id": 109, "text": "Table 4: Performance of a Mask R-CNN R50 network with", "bbox": {"l": 317.659, "t": 86.87298999999996, "r": 558.20068, "b": 95.34625000000017, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "document-wise and page-wise split for different label sets.", "bbox": {"l": 317.95499, "t": 97.83196999999996, "r": 559.73401, "b": 106.30524000000003, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "Naive page-wise split will result in", "bbox": {"l": 317.95499, "t": 108.79094999999995, "r": 467.72089, "b": 117.26422000000014, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "GLYPH<tildelow>", "bbox": {"l": 471.90900000000005, "t": 107.12798999999995, "r": 477.53900000000004, "b": 115.19768999999997, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "10% point improve-", "bbox": {"l": 477.54001000000005, "t": 108.79094999999995, "r": 559.80682, "b": 117.26422000000014, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "ment.", "bbox": {"l": 317.95502, "t": 119.74993999999992, "r": 341.37524, "b": 128.22321, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "table", "bbox": {"l": 352.97747802734375, "t": 150.791259765625, "r": 522.9158935546875, "b": 306.2658386230469, "coord_origin": "TOPLEFT"}, "confidence": 0.9879696369171143, "cells": [{"id": 115, "text": "Class-count", "bbox": {"l": 358.63901, "t": 153.10051999999996, "r": 401.73154, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "11", "bbox": {"l": 440.22501, "t": 153.10051999999996, "r": 448.56375, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "5", "bbox": {"l": 494.38, "t": 153.10051999999996, "r": 498.54938, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "Split", "bbox": {"l": 358.63901, "t": 164.05951000000005, "r": 375.27167, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "Doc", "bbox": {"l": 423.341, "t": 164.05951000000005, "r": 438.0459, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "Page", "bbox": {"l": 448.00757, "t": 164.05951000000005, "r": 465.4472, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "Doc", "bbox": {"l": 475.41101, "t": 164.05951000000005, "r": 490.11591, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Page", "bbox": {"l": 500.07757999999995, "t": 164.05951000000005, "r": 517.51721, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "Caption", "bbox": {"l": 358.63901, "t": 175.41656, "r": 387.82465, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "68", "bbox": {"l": 426.52399, "t": 175.41656, "r": 434.86273, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "83", "bbox": {"l": 452.56240999999994, "t": 175.41656, "r": 460.90115000000003, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "Footnote", "bbox": {"l": 358.63901, "t": 186.37554999999998, "r": 391.14221, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "71", "bbox": {"l": 426.52399, "t": 186.37554999999998, "r": 434.86273, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "84", "bbox": {"l": 452.56240999999994, "t": 186.37554999999998, "r": 460.90115000000003, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "Formula", "bbox": {"l": 358.63901, "t": 197.33452999999997, "r": 389.15167, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "60", "bbox": {"l": 426.52399, "t": 197.33452999999997, "r": 434.86273, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "66", "bbox": {"l": 452.56240999999994, "t": 197.33452999999997, "r": 460.90115000000003, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "List-item", "bbox": {"l": 358.63901, "t": 208.29351999999994, "r": 391.5188, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "81", "bbox": {"l": 426.52399, "t": 208.29351999999994, "r": 434.86273, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "88", "bbox": {"l": 452.56240999999994, "t": 208.29351999999994, "r": 460.90115000000003, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "82", "bbox": {"l": 478.59399, "t": 208.29351999999994, "r": 486.93274, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "88", "bbox": {"l": 504.6324200000001, "t": 208.29351999999994, "r": 512.97119, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "Page-footer", "bbox": {"l": 358.63901, "t": 219.25256000000002, "r": 401.16666, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "62", "bbox": {"l": 426.52399, "t": 219.25256000000002, "r": 434.86273, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "89", "bbox": {"l": 452.56240999999994, "t": 219.25256000000002, "r": 460.90115000000003, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "Page-header", "bbox": {"l": 358.63901, "t": 230.21155, "r": 403.91931, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "72", "bbox": {"l": 426.52399, "t": 230.21155, "r": 434.86273, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "90", "bbox": {"l": 452.56240999999994, "t": 230.21155, "r": 460.90115000000003, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "Picture", "bbox": {"l": 358.63901, "t": 241.16956000000005, "r": 384.62366, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "72", "bbox": {"l": 426.52399, "t": 241.16956000000005, "r": 434.86273, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "82", "bbox": {"l": 452.56240999999994, "t": 241.16956000000005, "r": 460.90115000000003, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "72", "bbox": {"l": 478.59399, "t": 241.16956000000005, "r": 486.93274, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "82", "bbox": {"l": 504.6324200000001, "t": 241.16956000000005, "r": 512.97119, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "Section-header", "bbox": {"l": 358.63901, "t": 252.12854000000004, "r": 413.37891, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "68", "bbox": {"l": 426.52399, "t": 252.12854000000004, "r": 434.86273, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "83", "bbox": {"l": 452.56240999999994, "t": 252.12854000000004, "r": 460.90115000000003, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "69", "bbox": {"l": 478.59399, "t": 252.12854000000004, "r": 486.93274, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "83", "bbox": {"l": 504.6324200000001, "t": 252.12854000000004, "r": 512.97119, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "Table", "bbox": {"l": 358.63901, "t": 263.08752000000004, "r": 378.44577, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "82", "bbox": {"l": 426.52399, "t": 263.08752000000004, "r": 434.86273, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "89", "bbox": {"l": 452.56240999999994, "t": 263.08752000000004, "r": 460.90115000000003, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "82", "bbox": {"l": 478.59399, "t": 263.08752000000004, "r": 486.93274, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "90", "bbox": {"l": 504.6324200000001, "t": 263.08752000000004, "r": 512.97119, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "Text", "bbox": {"l": 358.63901, "t": 274.04657, "r": 374.59921, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "85", "bbox": {"l": 426.52399, "t": 274.04657, "r": 434.86273, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "91", "bbox": {"l": 452.56240999999994, "t": 274.04657, "r": 460.90115000000003, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "84", "bbox": {"l": 478.59399, "t": 274.04657, "r": 486.93274, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "90", "bbox": {"l": 504.6324200000001, "t": 274.04657, "r": 512.97119, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "Title", "bbox": {"l": 358.63901, "t": 285.00552, "r": 375.63034, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "77", "bbox": {"l": 426.52399, "t": 285.00552, "r": 434.86273, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "81", "bbox": {"l": 452.56240999999994, "t": 285.00552, "r": 460.90115000000003, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "All", "bbox": {"l": 358.63901, "t": 296.36255, "r": 369.60492, "b": 304.73718, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "72", "bbox": {"l": 426.52399, "t": 296.36255, "r": 434.86273, "b": 304.73718, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "84", "bbox": {"l": 452.56240999999994, "t": 296.36255, "r": 460.90115000000003, "b": 304.73718, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "78", "bbox": {"l": 478.59399, "t": 296.36255, "r": 486.93274, "b": 304.73718, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "87", "bbox": {"l": 504.6324200000001, "t": 296.36255, "r": 512.97119, "b": 304.73718, "coord_origin": "TOPLEFT"}}], "children": [{"id": 80, "label": "text", "bbox": {"l": 358.63901, "t": 153.10051999999996, "r": 401.73154, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 115, "text": "Class-count", "bbox": {"l": 358.63901, "t": 153.10051999999996, "r": 401.73154, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 440.22501, "t": 153.10051999999996, "r": 448.56375, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 116, "text": "11", "bbox": {"l": 440.22501, "t": 153.10051999999996, "r": 448.56375, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 494.38, "t": 153.10051999999996, "r": 498.54938, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 117, "text": "5", "bbox": {"l": 494.38, "t": 153.10051999999996, "r": 498.54938, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 358.63901, "t": 164.05951000000005, "r": 375.27167, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 118, "text": "Split", "bbox": {"l": 358.63901, "t": 164.05951000000005, "r": 375.27167, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 423.341, "t": 164.05951000000005, "r": 438.0459, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 119, "text": "Doc", "bbox": {"l": 423.341, "t": 164.05951000000005, "r": 438.0459, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 448.00757, "t": 164.05951000000005, "r": 465.4472, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 120, "text": "Page", "bbox": {"l": 448.00757, "t": 164.05951000000005, "r": 465.4472, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 475.41101, "t": 164.05951000000005, "r": 490.11591, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 121, "text": "Doc", "bbox": {"l": 475.41101, "t": 164.05951000000005, "r": 490.11591, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 500.07757999999995, "t": 164.05951000000005, "r": 517.51721, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 122, "text": "Page", "bbox": {"l": 500.07757999999995, "t": 164.05951000000005, "r": 517.51721, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 358.63901, "t": 175.41656, "r": 387.82465, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 123, "text": "Caption", "bbox": {"l": 358.63901, "t": 175.41656, "r": 387.82465, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 426.52399, "t": 175.41656, "r": 434.86273, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 124, "text": "68", "bbox": {"l": 426.52399, "t": 175.41656, "r": 434.86273, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 452.56240999999994, "t": 175.41656, "r": 460.90115000000003, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 125, "text": "83", "bbox": {"l": 452.56240999999994, "t": 175.41656, "r": 460.90115000000003, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 358.63901, "t": 186.37554999999998, "r": 391.14221, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 126, "text": "Footnote", "bbox": {"l": 358.63901, "t": 186.37554999999998, "r": 391.14221, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 426.52399, "t": 186.37554999999998, "r": 434.86273, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 127, "text": "71", "bbox": {"l": 426.52399, "t": 186.37554999999998, "r": 434.86273, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 452.56240999999994, "t": 186.37554999999998, "r": 460.90115000000003, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 128, "text": "84", "bbox": {"l": 452.56240999999994, "t": 186.37554999999998, "r": 460.90115000000003, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 358.63901, "t": 197.33452999999997, "r": 389.15167, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 129, "text": "Formula", "bbox": {"l": 358.63901, "t": 197.33452999999997, "r": 389.15167, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 426.52399, "t": 197.33452999999997, "r": 434.86273, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 130, "text": "60", "bbox": {"l": 426.52399, "t": 197.33452999999997, "r": 434.86273, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 452.56240999999994, "t": 197.33452999999997, "r": 460.90115000000003, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 131, "text": "66", "bbox": {"l": 452.56240999999994, "t": 197.33452999999997, "r": 460.90115000000003, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 358.63901, "t": 208.29351999999994, "r": 391.5188, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 132, "text": "List-item", "bbox": {"l": 358.63901, "t": 208.29351999999994, "r": 391.5188, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 426.52399, "t": 208.29351999999994, "r": 434.86273, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 133, "text": "81", "bbox": {"l": 426.52399, "t": 208.29351999999994, "r": 434.86273, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 452.56240999999994, "t": 208.29351999999994, "r": 460.90115000000003, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 134, "text": "88", "bbox": {"l": 452.56240999999994, "t": 208.29351999999994, "r": 460.90115000000003, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 478.59399, "t": 208.29351999999994, "r": 486.93274, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 135, "text": "82", "bbox": {"l": 478.59399, "t": 208.29351999999994, "r": 486.93274, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 504.6324200000001, "t": 208.29351999999994, "r": 512.97119, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 136, "text": "88", "bbox": {"l": 504.6324200000001, "t": 208.29351999999994, "r": 512.97119, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 358.63901, "t": 219.25256000000002, "r": 401.16666, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 137, "text": "Page-footer", "bbox": {"l": 358.63901, "t": 219.25256000000002, "r": 401.16666, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 426.52399, "t": 219.25256000000002, "r": 434.86273, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 138, "text": "62", "bbox": {"l": 426.52399, "t": 219.25256000000002, "r": 434.86273, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 452.56240999999994, "t": 219.25256000000002, "r": 460.90115000000003, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 139, "text": "89", "bbox": {"l": 452.56240999999994, "t": 219.25256000000002, "r": 460.90115000000003, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 358.63901, "t": 230.21155, "r": 403.91931, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 140, "text": "Page-header", "bbox": {"l": 358.63901, "t": 230.21155, "r": 403.91931, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 426.52399, "t": 230.21155, "r": 434.86273, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 141, "text": "72", "bbox": {"l": 426.52399, "t": 230.21155, "r": 434.86273, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 452.56240999999994, "t": 230.21155, "r": 460.90115000000003, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 142, "text": "90", "bbox": {"l": 452.56240999999994, "t": 230.21155, "r": 460.90115000000003, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 358.63901, "t": 241.16956000000005, "r": 384.62366, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 143, "text": "Picture", "bbox": {"l": 358.63901, "t": 241.16956000000005, "r": 384.62366, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 426.52399, "t": 241.16956000000005, "r": 434.86273, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 144, "text": "72", "bbox": {"l": 426.52399, "t": 241.16956000000005, "r": 434.86273, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 452.56240999999994, "t": 241.16956000000005, "r": 460.90115000000003, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 145, "text": "82", "bbox": {"l": 452.56240999999994, "t": 241.16956000000005, "r": 460.90115000000003, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 478.59399, "t": 241.16956000000005, "r": 486.93274, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 146, "text": "72", "bbox": {"l": 478.59399, "t": 241.16956000000005, "r": 486.93274, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 504.6324200000001, "t": 241.16956000000005, "r": 512.97119, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 147, "text": "82", "bbox": {"l": 504.6324200000001, "t": 241.16956000000005, "r": 512.97119, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 358.63901, "t": 252.12854000000004, "r": 413.37891, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 148, "text": "Section-header", "bbox": {"l": 358.63901, "t": 252.12854000000004, "r": 413.37891, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 114, "label": "text", "bbox": {"l": 426.52399, "t": 252.12854000000004, "r": 434.86273, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 149, "text": "68", "bbox": {"l": 426.52399, "t": 252.12854000000004, "r": 434.86273, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 115, "label": "text", "bbox": {"l": 452.56240999999994, "t": 252.12854000000004, "r": 460.90115000000003, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 150, "text": "83", "bbox": {"l": 452.56240999999994, "t": 252.12854000000004, "r": 460.90115000000003, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 116, "label": "text", "bbox": {"l": 478.59399, "t": 252.12854000000004, "r": 486.93274, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 151, "text": "69", "bbox": {"l": 478.59399, "t": 252.12854000000004, "r": 486.93274, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 117, "label": "text", "bbox": {"l": 504.6324200000001, "t": 252.12854000000004, "r": 512.97119, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 152, "text": "83", "bbox": {"l": 504.6324200000001, "t": 252.12854000000004, "r": 512.97119, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 118, "label": "text", "bbox": {"l": 358.63901, "t": 263.08752000000004, "r": 378.44577, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 153, "text": "Table", "bbox": {"l": 358.63901, "t": 263.08752000000004, "r": 378.44577, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 119, "label": "text", "bbox": {"l": 426.52399, "t": 263.08752000000004, "r": 434.86273, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 154, "text": "82", "bbox": {"l": 426.52399, "t": 263.08752000000004, "r": 434.86273, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 120, "label": "text", "bbox": {"l": 452.56240999999994, "t": 263.08752000000004, "r": 460.90115000000003, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 155, "text": "89", "bbox": {"l": 452.56240999999994, "t": 263.08752000000004, "r": 460.90115000000003, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 121, "label": "text", "bbox": {"l": 478.59399, "t": 263.08752000000004, "r": 486.93274, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 156, "text": "82", "bbox": {"l": 478.59399, "t": 263.08752000000004, "r": 486.93274, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 122, "label": "text", "bbox": {"l": 504.6324200000001, "t": 263.08752000000004, "r": 512.97119, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 157, "text": "90", "bbox": {"l": 504.6324200000001, "t": 263.08752000000004, "r": 512.97119, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 123, "label": "text", "bbox": {"l": 358.63901, "t": 274.04657, "r": 374.59921, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 158, "text": "Text", "bbox": {"l": 358.63901, "t": 274.04657, "r": 374.59921, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 124, "label": "text", "bbox": {"l": 426.52399, "t": 274.04657, "r": 434.86273, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 159, "text": "85", "bbox": {"l": 426.52399, "t": 274.04657, "r": 434.86273, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 125, "label": "text", "bbox": {"l": 452.56240999999994, "t": 274.04657, "r": 460.90115000000003, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 160, "text": "91", "bbox": {"l": 452.56240999999994, "t": 274.04657, "r": 460.90115000000003, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 126, "label": "text", "bbox": {"l": 478.59399, "t": 274.04657, "r": 486.93274, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 161, "text": "84", "bbox": {"l": 478.59399, "t": 274.04657, "r": 486.93274, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 127, "label": "text", "bbox": {"l": 504.6324200000001, "t": 274.04657, "r": 512.97119, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 162, "text": "90", "bbox": {"l": 504.6324200000001, "t": 274.04657, "r": 512.97119, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 128, "label": "text", "bbox": {"l": 358.63901, "t": 285.00552, "r": 375.63034, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 163, "text": "Title", "bbox": {"l": 358.63901, "t": 285.00552, "r": 375.63034, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 129, "label": "text", "bbox": {"l": 426.52399, "t": 285.00552, "r": 434.86273, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 164, "text": "77", "bbox": {"l": 426.52399, "t": 285.00552, "r": 434.86273, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 130, "label": "text", "bbox": {"l": 452.56240999999994, "t": 285.00552, "r": 460.90115000000003, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 165, "text": "81", "bbox": {"l": 452.56240999999994, "t": 285.00552, "r": 460.90115000000003, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 131, "label": "text", "bbox": {"l": 358.63901, "t": 296.36255, "r": 369.60492, "b": 304.73718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 166, "text": "All", "bbox": {"l": 358.63901, "t": 296.36255, "r": 369.60492, "b": 304.73718, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 132, "label": "text", "bbox": {"l": 426.52399, "t": 296.36255, "r": 434.86273, "b": 304.73718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 167, "text": "72", "bbox": {"l": 426.52399, "t": 296.36255, "r": 434.86273, "b": 304.73718, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 133, "label": "text", "bbox": {"l": 452.56240999999994, "t": 296.36255, "r": 460.90115000000003, "b": 304.73718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 168, "text": "84", "bbox": {"l": 452.56240999999994, "t": 296.36255, "r": 460.90115000000003, "b": 304.73718, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 134, "label": "text", "bbox": {"l": 478.59399, "t": 296.36255, "r": 486.93274, "b": 304.73718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 169, "text": "78", "bbox": {"l": 478.59399, "t": 296.36255, "r": 486.93274, "b": 304.73718, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 135, "label": "text", "bbox": {"l": 504.6324200000001, "t": 296.36255, "r": 512.97119, "b": 304.73718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 170, "text": "87", "bbox": {"l": 504.6324200000001, "t": 296.36255, "r": 512.97119, "b": 304.73718, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 6, "label": "text", "bbox": {"l": 317.686, "t": 331.40353, "r": 559.58496, "b": 416.49017, "coord_origin": "TOPLEFT"}, "confidence": 0.9740146994590759, "cells": [{"id": 171, "text": "lists in PubLayNet (grouped list-items) versus DocLayNet (separate", "bbox": {"l": 317.95499, "t": 331.40353, "r": 558.20233, "b": 339.77817, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "list-items), the label set of size 4 is the closest to PubLayNet, in the", "bbox": {"l": 317.95499, "t": 342.36255, "r": 558.2005, "b": 350.73718, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "assumption that the", "bbox": {"l": 317.95499, "t": 353.32153, "r": 393.16028, "b": 361.69617000000005, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "List", "bbox": {"l": 395.84201, "t": 353.36639, "r": 409.14905, "b": 361.70514, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "is down-mapped to", "bbox": {"l": 412.33301, "t": 353.32153, "r": 485.02324999999996, "b": 361.69617000000005, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "Text", "bbox": {"l": 487.70401, "t": 353.36639, "r": 502.86761, "b": 361.70514, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "in PubLayNet.", "bbox": {"l": 506.05499, "t": 353.32153, "r": 559.58496, "b": 361.69617000000005, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "The results in Table 3 show that the prediction accuracy on the", "bbox": {"l": 317.686, "t": 364.28054999999995, "r": 558.2002, "b": 372.65518, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "remaining class labels does not change significantly when other", "bbox": {"l": 317.95499, "t": 375.23853, "r": 558.36877, "b": 383.61316, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "classes are merged into them. The overall macro-average improves", "bbox": {"l": 317.95499, "t": 386.19754, "r": 558.19958, "b": 394.57217, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "by around 5%, in particular when", "bbox": {"l": 317.95499, "t": 397.15652, "r": 439.49454, "b": 405.53116000000006, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "Page-footer", "bbox": {"l": 441.728, "t": 397.20139, "r": 481.8616, "b": 405.54013, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "and", "bbox": {"l": 484.74298, "t": 397.15652, "r": 498.23743, "b": 405.53116000000006, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "Page-header", "bbox": {"l": 500.47299, "t": 397.20139, "r": 543.95105, "b": 405.54013, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": "are", "bbox": {"l": 546.83197, "t": 397.15652, "r": 558.20142, "b": 405.53116000000006, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "excluded.", "bbox": {"l": 317.95496, "t": 408.11553999999995, "r": 352.37698, "b": 416.49017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "section_header", "bbox": {"l": 317.95496, "t": 429.3949, "r": 549.8606, "b": 439.70398, "coord_origin": "TOPLEFT"}, "confidence": 0.9562516808509827, "cells": [{"id": 187, "text": "Impact of Document Split in Train and Test Set", "bbox": {"l": 317.95496, "t": 429.3949, "r": 549.8606, "b": 439.70398, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 317.62299, "t": 444.59653, "r": 559.71381, "b": 595.43718, "coord_origin": "TOPLEFT"}, "confidence": 0.9869834184646606, "cells": [{"id": 188, "text": "Many documents in DocLayNet have a unique styling. In order", "bbox": {"l": 317.95499, "t": 444.59653, "r": 558.36884, "b": 452.97116, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "to avoid overfitting on a particular style, we have split the train-,", "bbox": {"l": 317.95499, "t": 455.55554, "r": 559.19189, "b": 463.93018, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "test- and validation-sets of DocLayNet on document boundaries, i.e.", "bbox": {"l": 317.95499, "t": 466.51453, "r": 559.58185, "b": 474.88916, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "every document contributes pages to only one set. To the best of", "bbox": {"l": 317.95499, "t": 477.47354, "r": 558.20605, "b": 485.84818, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": "our knowledge, this was not considered in PubLayNet or DocBank.", "bbox": {"l": 317.95499, "t": 488.43253, "r": 559.58203, "b": 496.80716, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "To quantify how this affects model performance, we trained and", "bbox": {"l": 317.686, "t": 499.39154, "r": 558.20032, "b": 507.76617, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "evaluated a Mask R-CNN R50 model on a modified dataset version.", "bbox": {"l": 317.95499, "t": 510.35052, "r": 559.5849, "b": 518.72516, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "Here, the train-, test- and validation-sets were obtained by a ran-", "bbox": {"l": 317.95499, "t": 521.30954, "r": 559.71381, "b": 529.68417, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "domised draw over the individual pages. As can be seen in Table 4,", "bbox": {"l": 317.95499, "t": 532.26855, "r": 559.18707, "b": 540.64317, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "the difference in model performance is surprisingly large: page-", "bbox": {"l": 317.95499, "t": 543.22655, "r": 559.71313, "b": 551.60117, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "wise splitting gains", "bbox": {"l": 317.62299, "t": 554.18555, "r": 388.35168, "b": 562.56017, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "\u02dc", "bbox": {"l": 391.36499, "t": 552.50055, "r": 393.98318, "b": 560.87517, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "10% in mAP over the document-wise splitting.", "bbox": {"l": 390.59, "t": 554.18555, "r": 559.58191, "b": 562.56017, "coord_origin": "TOPLEFT"}}, {"id": 201, "text": "Thus, random page-wise splitting of DocLayNet can easily lead", "bbox": {"l": 317.686, "t": 565.14455, "r": 558.20032, "b": 573.51917, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": "to accidental overestimation of model performance and should be", "bbox": {"l": 317.95499, "t": 576.10356, "r": 558.20508, "b": 584.4781800000001, "coord_origin": "TOPLEFT"}}, {"id": 203, "text": "avoided.", "bbox": {"l": 317.95499, "t": 587.06256, "r": 348.50354, "b": 595.43718, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "section_header", "bbox": {"l": 317.95499, "t": 608.34192, "r": 418.54776, "b": 618.65102, "coord_origin": "TOPLEFT"}, "confidence": 0.9589217305183411, "cells": [{"id": 204, "text": "Dataset Comparison", "bbox": {"l": 317.95499, "t": 608.34192, "r": 418.54776, "b": 618.65102, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 317.686, "t": 623.54355, "r": 559.18817, "b": 708.640137, "coord_origin": "TOPLEFT"}, "confidence": 0.9872549772262573, "cells": [{"id": 205, "text": "Throughout this paper, we claim that DocLayNet\u2019s wider variety of", "bbox": {"l": 317.686, "t": 623.54355, "r": 558.20575, "b": 631.91817, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": "document layouts leads to more robust layout detection models. In", "bbox": {"l": 317.95499, "t": 634.50255, "r": 558.20624, "b": 642.87717, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": "Table 5, we provide evidence for that. We trained models on each", "bbox": {"l": 317.686, "t": 645.46155, "r": 558.20319, "b": 653.83617, "coord_origin": "TOPLEFT"}}, {"id": 208, "text": "of the available datasets (PubLayNet, DocBank and DocLayNet)", "bbox": {"l": 317.95499, "t": 656.42055, "r": 558.74377, "b": 664.79517, "coord_origin": "TOPLEFT"}}, {"id": 209, "text": "and evaluated them on the test sets of the other datasets. Due to", "bbox": {"l": 317.95499, "t": 667.37955, "r": 558.20398, "b": 675.7541699999999, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": "the different label sets and annotation styles, a direct comparison", "bbox": {"l": 317.95499, "t": 678.3385499999999, "r": 558.20062, "b": 686.71317, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "is not possible. Hence, we focussed on the common labels among", "bbox": {"l": 317.95499, "t": 689.29755, "r": 558.20343, "b": 697.672173, "coord_origin": "TOPLEFT"}}, {"id": 212, "text": "the datasets. Between PubLayNet and DocLayNet, these are", "bbox": {"l": 317.95499, "t": 700.256554, "r": 531.07666, "b": 708.631172, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "Picture", "bbox": {"l": 533.16199, "t": 700.301384, "r": 557.2561, "b": 708.640137, "coord_origin": "TOPLEFT"}}, {"id": 214, "text": ",", "bbox": {"l": 557.255, "t": 700.256554, "r": 559.18817, "b": 708.631172, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {"4": {"label": "table", "id": 4, "page_no": 6, "cluster": {"id": 4, "label": "table", "bbox": {"l": 80.35525512695312, "t": 150.93629455566406, "r": 267.0082092285156, "b": 295.4454650878906, "coord_origin": "TOPLEFT"}, "confidence": 0.9869412779808044, "cells": [{"id": 6, "text": "Class-count", "bbox": {"l": 86.372002, "t": 153.10051999999996, "r": 129.46452, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "11", "bbox": {"l": 151.07401, "t": 153.10051999999996, "r": 159.41275, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "6", "bbox": {"l": 179.31816, "t": 153.10051999999996, "r": 183.48753, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "5", "bbox": {"l": 213.33669, "t": 153.10051999999996, "r": 217.50606, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "4", "bbox": {"l": 247.35521, "t": 153.10051999999996, "r": 251.52458, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Caption", "bbox": {"l": 86.372002, "t": 164.45752000000005, "r": 115.55763, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "68", "bbox": {"l": 151.07401, "t": 164.45752000000005, "r": 159.41275, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Text", "bbox": {"l": 173.42723, "t": 164.45752000000005, "r": 189.38742, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Text", "bbox": {"l": 207.44576, "t": 164.45752000000005, "r": 223.40594000000002, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Text", "bbox": {"l": 241.46428, "t": 164.45752000000005, "r": 257.42447, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Footnote", "bbox": {"l": 86.372002, "t": 175.41656, "r": 118.8752, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "71", "bbox": {"l": 151.07401, "t": 175.41656, "r": 159.41275, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Text", "bbox": {"l": 173.42723, "t": 175.41656, "r": 189.38742, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Text", "bbox": {"l": 207.44576, "t": 175.41656, "r": 223.40594000000002, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Text", "bbox": {"l": 241.46428, "t": 175.41656, "r": 257.42447, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Formula", "bbox": {"l": 86.372002, "t": 186.37554999999998, "r": 116.88466, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "60", "bbox": {"l": 151.07401, "t": 186.37554999999998, "r": 159.41275, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Text", "bbox": {"l": 173.42723, "t": 186.37554999999998, "r": 189.38742, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "Text", "bbox": {"l": 207.44576, "t": 186.37554999999998, "r": 223.40594000000002, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "Text", "bbox": {"l": 241.46428, "t": 186.37554999999998, "r": 257.42447, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "List-item", "bbox": {"l": 86.372002, "t": 197.33452999999997, "r": 119.25179, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "81", "bbox": {"l": 151.07401, "t": 197.33452999999997, "r": 159.41275, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Text", "bbox": {"l": 173.42723, "t": 197.33452999999997, "r": 189.38742, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "82", "bbox": {"l": 211.25647, "t": 197.33452999999997, "r": 219.59521, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Text", "bbox": {"l": 241.46426, "t": 197.33452999999997, "r": 257.42447, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Page-footer", "bbox": {"l": 86.372002, "t": 208.29351999999994, "r": 128.89964, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "62", "bbox": {"l": 151.07401, "t": 208.29351999999994, "r": 159.41275, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "62", "bbox": {"l": 177.23795, "t": 208.29351999999994, "r": 185.57669, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "-", "bbox": {"l": 213.91052, "t": 208.29351999999994, "r": 216.94116, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "-", "bbox": {"l": 247.92905000000002, "t": 208.29351999999994, "r": 250.95969, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Page-header", "bbox": {"l": 86.372002, "t": 219.25256000000002, "r": 131.65231, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "72", "bbox": {"l": 151.07401, "t": 219.25256000000002, "r": 159.41275, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "68", "bbox": {"l": 177.23795, "t": 219.25256000000002, "r": 185.57669, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "-", "bbox": {"l": 213.91052, "t": 219.25256000000002, "r": 216.94116, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "-", "bbox": {"l": 247.92905000000002, "t": 219.25256000000002, "r": 250.95969, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Picture", "bbox": {"l": 86.372002, "t": 230.21155, "r": 112.35663, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "72", "bbox": {"l": 151.07401, "t": 230.21155, "r": 159.41275, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "72", "bbox": {"l": 177.23795, "t": 230.21155, "r": 185.57669, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "72", "bbox": {"l": 211.25645, "t": 230.21155, "r": 219.5952, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "72", "bbox": {"l": 245.27496, "t": 230.21155, "r": 253.61371, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "Section-header", "bbox": {"l": 86.372002, "t": 241.16956000000005, "r": 141.11188, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "68", "bbox": {"l": 151.07401, "t": 241.16956000000005, "r": 159.41275, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "67", "bbox": {"l": 177.23795, "t": 241.16956000000005, "r": 185.57669, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "69", "bbox": {"l": 211.25645, "t": 241.16956000000005, "r": 219.5952, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "68", "bbox": {"l": 245.27496, "t": 241.16956000000005, "r": 253.61371, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Table", "bbox": {"l": 86.372002, "t": 252.12854000000004, "r": 106.17878, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "82", "bbox": {"l": 151.07401, "t": 252.12854000000004, "r": 159.41275, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "83", "bbox": {"l": 177.23795, "t": 252.12854000000004, "r": 185.57669, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "82", "bbox": {"l": 211.25645, "t": 252.12854000000004, "r": 219.5952, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "82", "bbox": {"l": 245.27496, "t": 252.12854000000004, "r": 253.61371, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Text", "bbox": {"l": 86.372002, "t": 263.08752000000004, "r": 102.3322, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "85", "bbox": {"l": 151.07401, "t": 263.08752000000004, "r": 159.41275, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "84", "bbox": {"l": 177.23795, "t": 263.08752000000004, "r": 185.57669, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "84", "bbox": {"l": 211.25645, "t": 263.08752000000004, "r": 219.5952, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "84", "bbox": {"l": 245.27496, "t": 263.08752000000004, "r": 253.61371, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "Title", "bbox": {"l": 86.372002, "t": 274.04657, "r": 103.36333, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "77", "bbox": {"l": 151.07401, "t": 274.04657, "r": 159.41275, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "Sec.-h.", "bbox": {"l": 169.37442, "t": 274.04657, "r": 193.43127, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "Sec.-h.", "bbox": {"l": 203.39294, "t": 274.04657, "r": 227.4498, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "Sec.-h.", "bbox": {"l": 237.41147, "t": 274.04657, "r": 261.46832, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "Overall", "bbox": {"l": 86.372002, "t": 285.40454, "r": 113.31602000000001, "b": 293.77917, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "72", "bbox": {"l": 151.07401, "t": 285.40454, "r": 159.41275, "b": 293.77917, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "73", "bbox": {"l": 177.23795, "t": 285.40454, "r": 185.57669, "b": 293.77917, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "78", "bbox": {"l": 211.25645, "t": 285.40454, "r": 219.5952, "b": 293.77917, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "77", "bbox": {"l": 245.27496, "t": 285.40454, "r": 253.61371, "b": 293.77917, "coord_origin": "TOPLEFT"}}], "children": [{"id": 15, "label": "text", "bbox": {"l": 86.372002, "t": 153.10051999999996, "r": 129.46452, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": "Class-count", "bbox": {"l": 86.372002, "t": 153.10051999999996, "r": 129.46452, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 151.07401, "t": 153.10051999999996, "r": 159.41275, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "11", "bbox": {"l": 151.07401, "t": 153.10051999999996, "r": 159.41275, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 179.31816, "t": 153.10051999999996, "r": 183.48753, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "6", "bbox": {"l": 179.31816, "t": 153.10051999999996, "r": 183.48753, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 213.33669, "t": 153.10051999999996, "r": 217.50606, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "5", "bbox": {"l": 213.33669, "t": 153.10051999999996, "r": 217.50606, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 247.35521, "t": 153.10051999999996, "r": 251.52458, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "4", "bbox": {"l": 247.35521, "t": 153.10051999999996, "r": 251.52458, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 86.372002, "t": 164.45752000000005, "r": 115.55763, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "Caption", "bbox": {"l": 86.372002, "t": 164.45752000000005, "r": 115.55763, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 151.07401, "t": 164.45752000000005, "r": 159.41275, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "68", "bbox": {"l": 151.07401, "t": 164.45752000000005, "r": 159.41275, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 173.42723, "t": 164.45752000000005, "r": 189.38742, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "Text", "bbox": {"l": 173.42723, "t": 164.45752000000005, "r": 189.38742, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 207.44576, "t": 164.45752000000005, "r": 223.40594000000002, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "Text", "bbox": {"l": 207.44576, "t": 164.45752000000005, "r": 223.40594000000002, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 241.46428, "t": 164.45752000000005, "r": 257.42447, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "Text", "bbox": {"l": 241.46428, "t": 164.45752000000005, "r": 257.42447, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 86.372002, "t": 175.41656, "r": 118.8752, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "Footnote", "bbox": {"l": 86.372002, "t": 175.41656, "r": 118.8752, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 151.07401, "t": 175.41656, "r": 159.41275, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "71", "bbox": {"l": 151.07401, "t": 175.41656, "r": 159.41275, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 173.42723, "t": 175.41656, "r": 189.38742, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "Text", "bbox": {"l": 173.42723, "t": 175.41656, "r": 189.38742, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 207.44576, "t": 175.41656, "r": 223.40594000000002, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "Text", "bbox": {"l": 207.44576, "t": 175.41656, "r": 223.40594000000002, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 241.46428, "t": 175.41656, "r": 257.42447, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "Text", "bbox": {"l": 241.46428, "t": 175.41656, "r": 257.42447, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 86.372002, "t": 186.37554999999998, "r": 116.88466, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "Formula", "bbox": {"l": 86.372002, "t": 186.37554999999998, "r": 116.88466, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 151.07401, "t": 186.37554999999998, "r": 159.41275, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "60", "bbox": {"l": 151.07401, "t": 186.37554999999998, "r": 159.41275, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 173.42723, "t": 186.37554999999998, "r": 189.38742, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "Text", "bbox": {"l": 173.42723, "t": 186.37554999999998, "r": 189.38742, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 207.44576, "t": 186.37554999999998, "r": 223.40594000000002, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "Text", "bbox": {"l": 207.44576, "t": 186.37554999999998, "r": 223.40594000000002, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 241.46428, "t": 186.37554999999998, "r": 257.42447, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "Text", "bbox": {"l": 241.46428, "t": 186.37554999999998, "r": 257.42447, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 86.372002, "t": 197.33452999999997, "r": 119.25179, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "List-item", "bbox": {"l": 86.372002, "t": 197.33452999999997, "r": 119.25179, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 151.07401, "t": 197.33452999999997, "r": 159.41275, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "81", "bbox": {"l": 151.07401, "t": 197.33452999999997, "r": 159.41275, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 173.42723, "t": 197.33452999999997, "r": 189.38742, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "Text", "bbox": {"l": 173.42723, "t": 197.33452999999997, "r": 189.38742, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 211.25647, "t": 197.33452999999997, "r": 219.59521, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "82", "bbox": {"l": 211.25647, "t": 197.33452999999997, "r": 219.59521, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 241.46426, "t": 197.33452999999997, "r": 257.42447, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "Text", "bbox": {"l": 241.46426, "t": 197.33452999999997, "r": 257.42447, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 86.372002, "t": 208.29351999999994, "r": 128.89964, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "Page-footer", "bbox": {"l": 86.372002, "t": 208.29351999999994, "r": 128.89964, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 151.07401, "t": 208.29351999999994, "r": 159.41275, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "62", "bbox": {"l": 151.07401, "t": 208.29351999999994, "r": 159.41275, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 177.23795, "t": 208.29351999999994, "r": 185.57669, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "62", "bbox": {"l": 177.23795, "t": 208.29351999999994, "r": 185.57669, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 213.91052, "t": 208.29351999999994, "r": 216.94116, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "-", "bbox": {"l": 213.91052, "t": 208.29351999999994, "r": 216.94116, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 247.92905000000002, "t": 208.29351999999994, "r": 250.95969, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "-", "bbox": {"l": 247.92905000000002, "t": 208.29351999999994, "r": 250.95969, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 86.372002, "t": 219.25256000000002, "r": 131.65231, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "Page-header", "bbox": {"l": 86.372002, "t": 219.25256000000002, "r": 131.65231, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 151.07401, "t": 219.25256000000002, "r": 159.41275, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "72", "bbox": {"l": 151.07401, "t": 219.25256000000002, "r": 159.41275, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 177.23795, "t": 219.25256000000002, "r": 185.57669, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "68", "bbox": {"l": 177.23795, "t": 219.25256000000002, "r": 185.57669, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 213.91052, "t": 219.25256000000002, "r": 216.94116, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "-", "bbox": {"l": 213.91052, "t": 219.25256000000002, "r": 216.94116, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 247.92905000000002, "t": 219.25256000000002, "r": 250.95969, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "-", "bbox": {"l": 247.92905000000002, "t": 219.25256000000002, "r": 250.95969, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 86.372002, "t": 230.21155, "r": 112.35663, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "Picture", "bbox": {"l": 86.372002, "t": 230.21155, "r": 112.35663, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 151.07401, "t": 230.21155, "r": 159.41275, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "72", "bbox": {"l": 151.07401, "t": 230.21155, "r": 159.41275, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 177.23795, "t": 230.21155, "r": 185.57669, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "72", "bbox": {"l": 177.23795, "t": 230.21155, "r": 185.57669, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 211.25645, "t": 230.21155, "r": 219.5952, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "72", "bbox": {"l": 211.25645, "t": 230.21155, "r": 219.5952, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 245.27496, "t": 230.21155, "r": 253.61371, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "72", "bbox": {"l": 245.27496, "t": 230.21155, "r": 253.61371, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 86.372002, "t": 241.16956000000005, "r": 141.11188, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "Section-header", "bbox": {"l": 86.372002, "t": 241.16956000000005, "r": 141.11188, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 151.07401, "t": 241.16956000000005, "r": 159.41275, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "68", "bbox": {"l": 151.07401, "t": 241.16956000000005, "r": 159.41275, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 177.23795, "t": 241.16956000000005, "r": 185.57669, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "67", "bbox": {"l": 177.23795, "t": 241.16956000000005, "r": 185.57669, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 211.25645, "t": 241.16956000000005, "r": 219.5952, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "69", "bbox": {"l": 211.25645, "t": 241.16956000000005, "r": 219.5952, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 245.27496, "t": 241.16956000000005, "r": 253.61371, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "68", "bbox": {"l": 245.27496, "t": 241.16956000000005, "r": 253.61371, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 86.372002, "t": 252.12854000000004, "r": 106.17878, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "Table", "bbox": {"l": 86.372002, "t": 252.12854000000004, "r": 106.17878, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 151.07401, "t": 252.12854000000004, "r": 159.41275, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "82", "bbox": {"l": 151.07401, "t": 252.12854000000004, "r": 159.41275, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 177.23795, "t": 252.12854000000004, "r": 185.57669, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "83", "bbox": {"l": 177.23795, "t": 252.12854000000004, "r": 185.57669, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 211.25645, "t": 252.12854000000004, "r": 219.5952, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "82", "bbox": {"l": 211.25645, "t": 252.12854000000004, "r": 219.5952, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 245.27496, "t": 252.12854000000004, "r": 253.61371, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "82", "bbox": {"l": 245.27496, "t": 252.12854000000004, "r": 253.61371, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 86.372002, "t": 263.08752000000004, "r": 102.3322, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "Text", "bbox": {"l": 86.372002, "t": 263.08752000000004, "r": 102.3322, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 151.07401, "t": 263.08752000000004, "r": 159.41275, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "85", "bbox": {"l": 151.07401, "t": 263.08752000000004, "r": 159.41275, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 177.23795, "t": 263.08752000000004, "r": 185.57669, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "84", "bbox": {"l": 177.23795, "t": 263.08752000000004, "r": 185.57669, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 211.25645, "t": 263.08752000000004, "r": 219.5952, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "84", "bbox": {"l": 211.25645, "t": 263.08752000000004, "r": 219.5952, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 245.27496, "t": 263.08752000000004, "r": 253.61371, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "84", "bbox": {"l": 245.27496, "t": 263.08752000000004, "r": 253.61371, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 86.372002, "t": 274.04657, "r": 103.36333, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "Title", "bbox": {"l": 86.372002, "t": 274.04657, "r": 103.36333, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 151.07401, "t": 274.04657, "r": 159.41275, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "77", "bbox": {"l": 151.07401, "t": 274.04657, "r": 159.41275, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 169.37442, "t": 274.04657, "r": 193.43127, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "Sec.-h.", "bbox": {"l": 169.37442, "t": 274.04657, "r": 193.43127, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 203.39294, "t": 274.04657, "r": 227.4498, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "Sec.-h.", "bbox": {"l": 203.39294, "t": 274.04657, "r": 227.4498, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 237.41147, "t": 274.04657, "r": 261.46832, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "Sec.-h.", "bbox": {"l": 237.41147, "t": 274.04657, "r": 261.46832, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 86.372002, "t": 285.40454, "r": 113.31602000000001, "b": 293.77917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "Overall", "bbox": {"l": 86.372002, "t": 285.40454, "r": 113.31602000000001, "b": 293.77917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 151.07401, "t": 285.40454, "r": 159.41275, "b": 293.77917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "72", "bbox": {"l": 151.07401, "t": 285.40454, "r": 159.41275, "b": 293.77917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 177.23795, "t": 285.40454, "r": 185.57669, "b": 293.77917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "73", "bbox": {"l": 177.23795, "t": 285.40454, "r": 185.57669, "b": 293.77917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 211.25645, "t": 285.40454, "r": 219.5952, "b": 293.77917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "78", "bbox": {"l": 211.25645, "t": 285.40454, "r": 219.5952, "b": 293.77917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 245.27496, "t": 285.40454, "r": 253.61371, "b": 293.77917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "77", "bbox": {"l": 245.27496, "t": 285.40454, "r": 253.61371, "b": 293.77917, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 13, "num_cols": 5, "table_cells": [{"bbox": {"l": 86.372002, "t": 153.10051999999996, "r": 129.46452, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Class-count", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 151.07401, "t": 153.10051999999996, "r": 159.41275, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "11", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 179.31816, "t": 153.10051999999996, "r": 183.48753, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "6", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 213.33669, "t": 153.10051999999996, "r": 217.50606, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "5", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 247.35521, "t": 153.10051999999996, "r": 251.52458, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "4", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 164.45752000000005, "r": 115.55763, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Caption", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 164.45752000000005, "r": 159.41275, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 173.42723, "t": 164.45752000000005, "r": 189.38742, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 207.44576, "t": 164.45752000000005, "r": 223.40594000000002, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 241.46428, "t": 164.45752000000005, "r": 257.42447, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 175.41656, "r": 118.8752, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Footnote", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 175.41656, "r": 159.41275, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "71", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 173.42723, "t": 175.41656, "r": 189.38742, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 207.44576, "t": 175.41656, "r": 223.40594000000002, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 241.46428, "t": 175.41656, "r": 257.42447, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 186.37554999999998, "r": 116.88466, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Formula", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 186.37554999999998, "r": 159.41275, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "60", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 173.42723, "t": 186.37554999999998, "r": 189.38742, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 207.44576, "t": 186.37554999999998, "r": 223.40594000000002, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 241.46428, "t": 186.37554999999998, "r": 257.42447, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 197.33452999999997, "r": 119.25179, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "List-item", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 197.33452999999997, "r": 159.41275, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 173.42723, "t": 197.33452999999997, "r": 189.38742, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 211.25647, "t": 197.33452999999997, "r": 219.59521, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 241.46426, "t": 197.33452999999997, "r": 257.42447, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 208.29351999999994, "r": 128.89964, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-footer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 208.29351999999994, "r": 159.41275, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "62", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23795, "t": 208.29351999999994, "r": 185.57669, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "62", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 213.91052, "t": 208.29351999999994, "r": 216.94116, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 247.92905000000002, "t": 208.29351999999994, "r": 250.95969, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 219.25256000000002, "r": 131.65231, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 219.25256000000002, "r": 159.41275, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23795, "t": 219.25256000000002, "r": 185.57669, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 213.91052, "t": 219.25256000000002, "r": 216.94116, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 247.92905000000002, "t": 219.25256000000002, "r": 250.95969, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 230.21155, "r": 112.35663, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Picture", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 230.21155, "r": 159.41275, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23795, "t": 230.21155, "r": 185.57669, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 211.25645, "t": 230.21155, "r": 219.5952, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.27496, "t": 230.21155, "r": 253.61371, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 241.16956000000005, "r": 141.11188, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Section-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 241.16956000000005, "r": 159.41275, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23795, "t": 241.16956000000005, "r": 185.57669, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "67", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 211.25645, "t": 241.16956000000005, "r": 219.5952, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "69", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.27496, "t": 241.16956000000005, "r": 253.61371, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 252.12854000000004, "r": 106.17878, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 252.12854000000004, "r": 159.41275, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23795, "t": 252.12854000000004, "r": 185.57669, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 211.25645, "t": 252.12854000000004, "r": 219.5952, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.27496, "t": 252.12854000000004, "r": 253.61371, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 263.08752000000004, "r": 102.3322, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Text", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 263.08752000000004, "r": 159.41275, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23795, "t": 263.08752000000004, "r": 185.57669, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 211.25645, "t": 263.08752000000004, "r": 219.5952, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.27496, "t": 263.08752000000004, "r": 253.61371, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 274.04657, "r": 103.36333, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Title", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 274.04657, "r": 159.41275, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 169.37442, "t": 274.04657, "r": 193.43127, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Sec.-h.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 203.39294, "t": 274.04657, "r": 227.4498, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Sec.-h.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 237.41147, "t": 274.04657, "r": 261.46832, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Sec.-h.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 285.40454, "r": 113.31602000000001, "b": 293.77917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Overall", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 285.40454, "r": 159.41275, "b": 293.77917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23795, "t": 285.40454, "r": 185.57669, "b": 293.77917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "73", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 211.25645, "t": 285.40454, "r": 219.5952, "b": 293.77917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "78", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.27496, "t": 285.40454, "r": 253.61371, "b": 293.77917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "77", "column_header": false, "row_header": false, "row_section": false}]}, "0": {"label": "table", "id": 0, "page_no": 6, "cluster": {"id": 0, "label": "table", "bbox": {"l": 352.97747802734375, "t": 150.791259765625, "r": 522.9158935546875, "b": 306.2658386230469, "coord_origin": "TOPLEFT"}, "confidence": 0.9879696369171143, "cells": [{"id": 115, "text": "Class-count", "bbox": {"l": 358.63901, "t": 153.10051999999996, "r": 401.73154, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "11", "bbox": {"l": 440.22501, "t": 153.10051999999996, "r": 448.56375, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "5", "bbox": {"l": 494.38, "t": 153.10051999999996, "r": 498.54938, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "Split", "bbox": {"l": 358.63901, "t": 164.05951000000005, "r": 375.27167, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "Doc", "bbox": {"l": 423.341, "t": 164.05951000000005, "r": 438.0459, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "Page", "bbox": {"l": 448.00757, "t": 164.05951000000005, "r": 465.4472, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "Doc", "bbox": {"l": 475.41101, "t": 164.05951000000005, "r": 490.11591, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Page", "bbox": {"l": 500.07757999999995, "t": 164.05951000000005, "r": 517.51721, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "Caption", "bbox": {"l": 358.63901, "t": 175.41656, "r": 387.82465, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "68", "bbox": {"l": 426.52399, "t": 175.41656, "r": 434.86273, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "83", "bbox": {"l": 452.56240999999994, "t": 175.41656, "r": 460.90115000000003, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "Footnote", "bbox": {"l": 358.63901, "t": 186.37554999999998, "r": 391.14221, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "71", "bbox": {"l": 426.52399, "t": 186.37554999999998, "r": 434.86273, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "84", "bbox": {"l": 452.56240999999994, "t": 186.37554999999998, "r": 460.90115000000003, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "Formula", "bbox": {"l": 358.63901, "t": 197.33452999999997, "r": 389.15167, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "60", "bbox": {"l": 426.52399, "t": 197.33452999999997, "r": 434.86273, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "66", "bbox": {"l": 452.56240999999994, "t": 197.33452999999997, "r": 460.90115000000003, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "List-item", "bbox": {"l": 358.63901, "t": 208.29351999999994, "r": 391.5188, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "81", "bbox": {"l": 426.52399, "t": 208.29351999999994, "r": 434.86273, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "88", "bbox": {"l": 452.56240999999994, "t": 208.29351999999994, "r": 460.90115000000003, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "82", "bbox": {"l": 478.59399, "t": 208.29351999999994, "r": 486.93274, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "88", "bbox": {"l": 504.6324200000001, "t": 208.29351999999994, "r": 512.97119, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "Page-footer", "bbox": {"l": 358.63901, "t": 219.25256000000002, "r": 401.16666, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "62", "bbox": {"l": 426.52399, "t": 219.25256000000002, "r": 434.86273, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "89", "bbox": {"l": 452.56240999999994, "t": 219.25256000000002, "r": 460.90115000000003, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "Page-header", "bbox": {"l": 358.63901, "t": 230.21155, "r": 403.91931, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "72", "bbox": {"l": 426.52399, "t": 230.21155, "r": 434.86273, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "90", "bbox": {"l": 452.56240999999994, "t": 230.21155, "r": 460.90115000000003, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "Picture", "bbox": {"l": 358.63901, "t": 241.16956000000005, "r": 384.62366, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "72", "bbox": {"l": 426.52399, "t": 241.16956000000005, "r": 434.86273, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "82", "bbox": {"l": 452.56240999999994, "t": 241.16956000000005, "r": 460.90115000000003, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "72", "bbox": {"l": 478.59399, "t": 241.16956000000005, "r": 486.93274, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "82", "bbox": {"l": 504.6324200000001, "t": 241.16956000000005, "r": 512.97119, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "Section-header", "bbox": {"l": 358.63901, "t": 252.12854000000004, "r": 413.37891, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "68", "bbox": {"l": 426.52399, "t": 252.12854000000004, "r": 434.86273, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "83", "bbox": {"l": 452.56240999999994, "t": 252.12854000000004, "r": 460.90115000000003, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "69", "bbox": {"l": 478.59399, "t": 252.12854000000004, "r": 486.93274, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "83", "bbox": {"l": 504.6324200000001, "t": 252.12854000000004, "r": 512.97119, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "Table", "bbox": {"l": 358.63901, "t": 263.08752000000004, "r": 378.44577, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "82", "bbox": {"l": 426.52399, "t": 263.08752000000004, "r": 434.86273, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "89", "bbox": {"l": 452.56240999999994, "t": 263.08752000000004, "r": 460.90115000000003, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "82", "bbox": {"l": 478.59399, "t": 263.08752000000004, "r": 486.93274, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "90", "bbox": {"l": 504.6324200000001, "t": 263.08752000000004, "r": 512.97119, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "Text", "bbox": {"l": 358.63901, "t": 274.04657, "r": 374.59921, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "85", "bbox": {"l": 426.52399, "t": 274.04657, "r": 434.86273, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "91", "bbox": {"l": 452.56240999999994, "t": 274.04657, "r": 460.90115000000003, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "84", "bbox": {"l": 478.59399, "t": 274.04657, "r": 486.93274, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "90", "bbox": {"l": 504.6324200000001, "t": 274.04657, "r": 512.97119, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "Title", "bbox": {"l": 358.63901, "t": 285.00552, "r": 375.63034, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "77", "bbox": {"l": 426.52399, "t": 285.00552, "r": 434.86273, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "81", "bbox": {"l": 452.56240999999994, "t": 285.00552, "r": 460.90115000000003, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "All", "bbox": {"l": 358.63901, "t": 296.36255, "r": 369.60492, "b": 304.73718, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "72", "bbox": {"l": 426.52399, "t": 296.36255, "r": 434.86273, "b": 304.73718, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "84", "bbox": {"l": 452.56240999999994, "t": 296.36255, "r": 460.90115000000003, "b": 304.73718, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "78", "bbox": {"l": 478.59399, "t": 296.36255, "r": 486.93274, "b": 304.73718, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "87", "bbox": {"l": 504.6324200000001, "t": 296.36255, "r": 512.97119, "b": 304.73718, "coord_origin": "TOPLEFT"}}], "children": [{"id": 80, "label": "text", "bbox": {"l": 358.63901, "t": 153.10051999999996, "r": 401.73154, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 115, "text": "Class-count", "bbox": {"l": 358.63901, "t": 153.10051999999996, "r": 401.73154, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 440.22501, "t": 153.10051999999996, "r": 448.56375, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 116, "text": "11", "bbox": {"l": 440.22501, "t": 153.10051999999996, "r": 448.56375, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 494.38, "t": 153.10051999999996, "r": 498.54938, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 117, "text": "5", "bbox": {"l": 494.38, "t": 153.10051999999996, "r": 498.54938, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 358.63901, "t": 164.05951000000005, "r": 375.27167, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 118, "text": "Split", "bbox": {"l": 358.63901, "t": 164.05951000000005, "r": 375.27167, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 423.341, "t": 164.05951000000005, "r": 438.0459, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 119, "text": "Doc", "bbox": {"l": 423.341, "t": 164.05951000000005, "r": 438.0459, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 448.00757, "t": 164.05951000000005, "r": 465.4472, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 120, "text": "Page", "bbox": {"l": 448.00757, "t": 164.05951000000005, "r": 465.4472, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 475.41101, "t": 164.05951000000005, "r": 490.11591, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 121, "text": "Doc", "bbox": {"l": 475.41101, "t": 164.05951000000005, "r": 490.11591, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 500.07757999999995, "t": 164.05951000000005, "r": 517.51721, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 122, "text": "Page", "bbox": {"l": 500.07757999999995, "t": 164.05951000000005, "r": 517.51721, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 358.63901, "t": 175.41656, "r": 387.82465, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 123, "text": "Caption", "bbox": {"l": 358.63901, "t": 175.41656, "r": 387.82465, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 426.52399, "t": 175.41656, "r": 434.86273, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 124, "text": "68", "bbox": {"l": 426.52399, "t": 175.41656, "r": 434.86273, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 452.56240999999994, "t": 175.41656, "r": 460.90115000000003, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 125, "text": "83", "bbox": {"l": 452.56240999999994, "t": 175.41656, "r": 460.90115000000003, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 358.63901, "t": 186.37554999999998, "r": 391.14221, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 126, "text": "Footnote", "bbox": {"l": 358.63901, "t": 186.37554999999998, "r": 391.14221, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 426.52399, "t": 186.37554999999998, "r": 434.86273, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 127, "text": "71", "bbox": {"l": 426.52399, "t": 186.37554999999998, "r": 434.86273, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 452.56240999999994, "t": 186.37554999999998, "r": 460.90115000000003, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 128, "text": "84", "bbox": {"l": 452.56240999999994, "t": 186.37554999999998, "r": 460.90115000000003, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 358.63901, "t": 197.33452999999997, "r": 389.15167, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 129, "text": "Formula", "bbox": {"l": 358.63901, "t": 197.33452999999997, "r": 389.15167, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 426.52399, "t": 197.33452999999997, "r": 434.86273, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 130, "text": "60", "bbox": {"l": 426.52399, "t": 197.33452999999997, "r": 434.86273, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 452.56240999999994, "t": 197.33452999999997, "r": 460.90115000000003, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 131, "text": "66", "bbox": {"l": 452.56240999999994, "t": 197.33452999999997, "r": 460.90115000000003, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 358.63901, "t": 208.29351999999994, "r": 391.5188, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 132, "text": "List-item", "bbox": {"l": 358.63901, "t": 208.29351999999994, "r": 391.5188, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 426.52399, "t": 208.29351999999994, "r": 434.86273, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 133, "text": "81", "bbox": {"l": 426.52399, "t": 208.29351999999994, "r": 434.86273, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 452.56240999999994, "t": 208.29351999999994, "r": 460.90115000000003, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 134, "text": "88", "bbox": {"l": 452.56240999999994, "t": 208.29351999999994, "r": 460.90115000000003, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 478.59399, "t": 208.29351999999994, "r": 486.93274, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 135, "text": "82", "bbox": {"l": 478.59399, "t": 208.29351999999994, "r": 486.93274, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 504.6324200000001, "t": 208.29351999999994, "r": 512.97119, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 136, "text": "88", "bbox": {"l": 504.6324200000001, "t": 208.29351999999994, "r": 512.97119, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 358.63901, "t": 219.25256000000002, "r": 401.16666, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 137, "text": "Page-footer", "bbox": {"l": 358.63901, "t": 219.25256000000002, "r": 401.16666, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 426.52399, "t": 219.25256000000002, "r": 434.86273, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 138, "text": "62", "bbox": {"l": 426.52399, "t": 219.25256000000002, "r": 434.86273, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 452.56240999999994, "t": 219.25256000000002, "r": 460.90115000000003, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 139, "text": "89", "bbox": {"l": 452.56240999999994, "t": 219.25256000000002, "r": 460.90115000000003, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 358.63901, "t": 230.21155, "r": 403.91931, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 140, "text": "Page-header", "bbox": {"l": 358.63901, "t": 230.21155, "r": 403.91931, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 426.52399, "t": 230.21155, "r": 434.86273, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 141, "text": "72", "bbox": {"l": 426.52399, "t": 230.21155, "r": 434.86273, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 452.56240999999994, "t": 230.21155, "r": 460.90115000000003, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 142, "text": "90", "bbox": {"l": 452.56240999999994, "t": 230.21155, "r": 460.90115000000003, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 358.63901, "t": 241.16956000000005, "r": 384.62366, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 143, "text": "Picture", "bbox": {"l": 358.63901, "t": 241.16956000000005, "r": 384.62366, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 426.52399, "t": 241.16956000000005, "r": 434.86273, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 144, "text": "72", "bbox": {"l": 426.52399, "t": 241.16956000000005, "r": 434.86273, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 452.56240999999994, "t": 241.16956000000005, "r": 460.90115000000003, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 145, "text": "82", "bbox": {"l": 452.56240999999994, "t": 241.16956000000005, "r": 460.90115000000003, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 478.59399, "t": 241.16956000000005, "r": 486.93274, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 146, "text": "72", "bbox": {"l": 478.59399, "t": 241.16956000000005, "r": 486.93274, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 504.6324200000001, "t": 241.16956000000005, "r": 512.97119, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 147, "text": "82", "bbox": {"l": 504.6324200000001, "t": 241.16956000000005, "r": 512.97119, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 358.63901, "t": 252.12854000000004, "r": 413.37891, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 148, "text": "Section-header", "bbox": {"l": 358.63901, "t": 252.12854000000004, "r": 413.37891, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 114, "label": "text", "bbox": {"l": 426.52399, "t": 252.12854000000004, "r": 434.86273, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 149, "text": "68", "bbox": {"l": 426.52399, "t": 252.12854000000004, "r": 434.86273, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 115, "label": "text", "bbox": {"l": 452.56240999999994, "t": 252.12854000000004, "r": 460.90115000000003, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 150, "text": "83", "bbox": {"l": 452.56240999999994, "t": 252.12854000000004, "r": 460.90115000000003, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 116, "label": "text", "bbox": {"l": 478.59399, "t": 252.12854000000004, "r": 486.93274, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 151, "text": "69", "bbox": {"l": 478.59399, "t": 252.12854000000004, "r": 486.93274, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 117, "label": "text", "bbox": {"l": 504.6324200000001, "t": 252.12854000000004, "r": 512.97119, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 152, "text": "83", "bbox": {"l": 504.6324200000001, "t": 252.12854000000004, "r": 512.97119, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 118, "label": "text", "bbox": {"l": 358.63901, "t": 263.08752000000004, "r": 378.44577, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 153, "text": "Table", "bbox": {"l": 358.63901, "t": 263.08752000000004, "r": 378.44577, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 119, "label": "text", "bbox": {"l": 426.52399, "t": 263.08752000000004, "r": 434.86273, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 154, "text": "82", "bbox": {"l": 426.52399, "t": 263.08752000000004, "r": 434.86273, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 120, "label": "text", "bbox": {"l": 452.56240999999994, "t": 263.08752000000004, "r": 460.90115000000003, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 155, "text": "89", "bbox": {"l": 452.56240999999994, "t": 263.08752000000004, "r": 460.90115000000003, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 121, "label": "text", "bbox": {"l": 478.59399, "t": 263.08752000000004, "r": 486.93274, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 156, "text": "82", "bbox": {"l": 478.59399, "t": 263.08752000000004, "r": 486.93274, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 122, "label": "text", "bbox": {"l": 504.6324200000001, "t": 263.08752000000004, "r": 512.97119, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 157, "text": "90", "bbox": {"l": 504.6324200000001, "t": 263.08752000000004, "r": 512.97119, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 123, "label": "text", "bbox": {"l": 358.63901, "t": 274.04657, "r": 374.59921, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 158, "text": "Text", "bbox": {"l": 358.63901, "t": 274.04657, "r": 374.59921, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 124, "label": "text", "bbox": {"l": 426.52399, "t": 274.04657, "r": 434.86273, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 159, "text": "85", "bbox": {"l": 426.52399, "t": 274.04657, "r": 434.86273, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 125, "label": "text", "bbox": {"l": 452.56240999999994, "t": 274.04657, "r": 460.90115000000003, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 160, "text": "91", "bbox": {"l": 452.56240999999994, "t": 274.04657, "r": 460.90115000000003, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 126, "label": "text", "bbox": {"l": 478.59399, "t": 274.04657, "r": 486.93274, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 161, "text": "84", "bbox": {"l": 478.59399, "t": 274.04657, "r": 486.93274, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 127, "label": "text", "bbox": {"l": 504.6324200000001, "t": 274.04657, "r": 512.97119, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 162, "text": "90", "bbox": {"l": 504.6324200000001, "t": 274.04657, "r": 512.97119, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 128, "label": "text", "bbox": {"l": 358.63901, "t": 285.00552, "r": 375.63034, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 163, "text": "Title", "bbox": {"l": 358.63901, "t": 285.00552, "r": 375.63034, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 129, "label": "text", "bbox": {"l": 426.52399, "t": 285.00552, "r": 434.86273, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 164, "text": "77", "bbox": {"l": 426.52399, "t": 285.00552, "r": 434.86273, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 130, "label": "text", "bbox": {"l": 452.56240999999994, "t": 285.00552, "r": 460.90115000000003, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 165, "text": "81", "bbox": {"l": 452.56240999999994, "t": 285.00552, "r": 460.90115000000003, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 131, "label": "text", "bbox": {"l": 358.63901, "t": 296.36255, "r": 369.60492, "b": 304.73718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 166, "text": "All", "bbox": {"l": 358.63901, "t": 296.36255, "r": 369.60492, "b": 304.73718, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 132, "label": "text", "bbox": {"l": 426.52399, "t": 296.36255, "r": 434.86273, "b": 304.73718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 167, "text": "72", "bbox": {"l": 426.52399, "t": 296.36255, "r": 434.86273, "b": 304.73718, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 133, "label": "text", "bbox": {"l": 452.56240999999994, "t": 296.36255, "r": 460.90115000000003, "b": 304.73718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 168, "text": "84", "bbox": {"l": 452.56240999999994, "t": 296.36255, "r": 460.90115000000003, "b": 304.73718, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 134, "label": "text", "bbox": {"l": 478.59399, "t": 296.36255, "r": 486.93274, "b": 304.73718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 169, "text": "78", "bbox": {"l": 478.59399, "t": 296.36255, "r": 486.93274, "b": 304.73718, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 135, "label": "text", "bbox": {"l": 504.6324200000001, "t": 296.36255, "r": 512.97119, "b": 304.73718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 170, "text": "87", "bbox": {"l": 504.6324200000001, "t": 296.36255, "r": 512.97119, "b": 304.73718, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["fcel", "ched", "lcel", "ched", "lcel", "nl", "fcel", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 14, "num_cols": 5, "table_cells": [{"bbox": {"l": 358.63901, "t": 153.10051999999996, "r": 401.73154, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Class-count", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.22501, "t": 153.10051999999996, "r": 448.56375, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 3, "text": "11", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 494.38, "t": 153.10051999999996, "r": 498.54938, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 5, "text": "5", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 164.05951000000005, "r": 375.27167, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Split", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 423.341, "t": 164.05951000000005, "r": 438.0459, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Doc", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 448.00757, "t": 164.05951000000005, "r": 465.4472, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Page", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 475.41101, "t": 164.05951000000005, "r": 490.11591, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Doc", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 500.07757999999995, "t": 164.05951000000005, "r": 517.51721, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Page", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 175.41656, "r": 387.82465, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Caption", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 175.41656, "r": 434.86273, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 175.41656, "r": 460.90115000000003, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 186.37554999999998, "r": 391.14221, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Footnote", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 186.37554999999998, "r": 434.86273, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "71", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 186.37554999999998, "r": 460.90115000000003, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 197.33452999999997, "r": 389.15167, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Formula", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 197.33452999999997, "r": 434.86273, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "60", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 197.33452999999997, "r": 460.90115000000003, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "66", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 208.29351999999994, "r": 391.5188, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "List-item", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 208.29351999999994, "r": 434.86273, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 208.29351999999994, "r": 460.90115000000003, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 478.59399, "t": 208.29351999999994, "r": 486.93274, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 504.6324200000001, "t": 208.29351999999994, "r": 512.97119, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 219.25256000000002, "r": 401.16666, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-footer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 219.25256000000002, "r": 434.86273, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "62", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 219.25256000000002, "r": 460.90115000000003, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "89", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 230.21155, "r": 403.91931, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 230.21155, "r": 434.86273, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 230.21155, "r": 460.90115000000003, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "90", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 241.16956000000005, "r": 384.62366, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Picture", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 241.16956000000005, "r": 434.86273, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 241.16956000000005, "r": 460.90115000000003, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 478.59399, "t": 241.16956000000005, "r": 486.93274, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 504.6324200000001, "t": 241.16956000000005, "r": 512.97119, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 252.12854000000004, "r": 413.37891, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Section-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 252.12854000000004, "r": 434.86273, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 252.12854000000004, "r": 460.90115000000003, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 478.59399, "t": 252.12854000000004, "r": 486.93274, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "69", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 504.6324200000001, "t": 252.12854000000004, "r": 512.97119, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 263.08752000000004, "r": 378.44577, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 263.08752000000004, "r": 434.86273, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 263.08752000000004, "r": 460.90115000000003, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "89", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 478.59399, "t": 263.08752000000004, "r": 486.93274, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 504.6324200000001, "t": 263.08752000000004, "r": 512.97119, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "90", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 274.04657, "r": 374.59921, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Text", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 274.04657, "r": 434.86273, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 274.04657, "r": 460.90115000000003, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "91", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 478.59399, "t": 274.04657, "r": 486.93274, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 504.6324200000001, "t": 274.04657, "r": 512.97119, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "90", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 285.00552, "r": 375.63034, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Title", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 285.00552, "r": 434.86273, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 285.00552, "r": 460.90115000000003, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 296.36255, "r": 369.60492, "b": 304.73718, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "All", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 296.36255, "r": 434.86273, "b": 304.73718, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 296.36255, "r": 460.90115000000003, "b": 304.73718, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 478.59399, "t": 296.36255, "r": 486.93274, "b": 304.73718, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "78", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 504.6324200000001, "t": 296.36255, "r": 512.97119, "b": 304.73718, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "87", "column_header": false, "row_header": false, "row_section": false}]}}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_header", "id": 12, "page_no": 6, "cluster": {"id": 12, "label": "page_header", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.9316118955612183, "cells": [{"id": 0, "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis"}, {"label": "page_header", "id": 11, "page_no": 6, "cluster": {"id": 11, "label": "page_header", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.9318180084228516, "cells": [{"id": 1, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA"}, {"label": "text", "id": 14, "page_no": 6, "cluster": {"id": 14, "label": "text", "bbox": {"l": 53.501999, "t": 86.87292000000002, "r": 295.64865, "b": 128.22313999999994, "coord_origin": "TOPLEFT"}, "confidence": 0.8296934366226196, "cells": [{"id": 2, "text": "Table 3: Performance of a Mask R-CNN R50 network in", "bbox": {"l": 53.501999, "t": 86.87292000000002, "r": 294.0437, "b": 95.34618999999998, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "mAP@0.5-0.95 scores trained on DocLayNet with different", "bbox": {"l": 53.79800000000001, "t": 97.83191, "r": 294.04376, "b": 106.30517999999995, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "class label sets. The reduced label sets were obtained by ei-", "bbox": {"l": 53.79800000000001, "t": 108.79088999999999, "r": 295.64865, "b": 117.26415999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "ther down-mapping or dropping labels.", "bbox": {"l": 53.79800000000001, "t": 119.74987999999996, "r": 213.23856, "b": 128.22313999999994, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 3: Performance of a Mask R-CNN R50 network in mAP@0.5-0.95 scores trained on DocLayNet with different class label sets. The reduced label sets were obtained by either down-mapping or dropping labels."}, {"label": "table", "id": 4, "page_no": 6, "cluster": {"id": 4, "label": "table", "bbox": {"l": 80.35525512695312, "t": 150.93629455566406, "r": 267.0082092285156, "b": 295.4454650878906, "coord_origin": "TOPLEFT"}, "confidence": 0.9869412779808044, "cells": [{"id": 6, "text": "Class-count", "bbox": {"l": 86.372002, "t": 153.10051999999996, "r": 129.46452, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "11", "bbox": {"l": 151.07401, "t": 153.10051999999996, "r": 159.41275, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "6", "bbox": {"l": 179.31816, "t": 153.10051999999996, "r": 183.48753, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "5", "bbox": {"l": 213.33669, "t": 153.10051999999996, "r": 217.50606, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "4", "bbox": {"l": 247.35521, "t": 153.10051999999996, "r": 251.52458, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Caption", "bbox": {"l": 86.372002, "t": 164.45752000000005, "r": 115.55763, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "68", "bbox": {"l": 151.07401, "t": 164.45752000000005, "r": 159.41275, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Text", "bbox": {"l": 173.42723, "t": 164.45752000000005, "r": 189.38742, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Text", "bbox": {"l": 207.44576, "t": 164.45752000000005, "r": 223.40594000000002, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Text", "bbox": {"l": 241.46428, "t": 164.45752000000005, "r": 257.42447, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Footnote", "bbox": {"l": 86.372002, "t": 175.41656, "r": 118.8752, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "71", "bbox": {"l": 151.07401, "t": 175.41656, "r": 159.41275, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Text", "bbox": {"l": 173.42723, "t": 175.41656, "r": 189.38742, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Text", "bbox": {"l": 207.44576, "t": 175.41656, "r": 223.40594000000002, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Text", "bbox": {"l": 241.46428, "t": 175.41656, "r": 257.42447, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Formula", "bbox": {"l": 86.372002, "t": 186.37554999999998, "r": 116.88466, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "60", "bbox": {"l": 151.07401, "t": 186.37554999999998, "r": 159.41275, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Text", "bbox": {"l": 173.42723, "t": 186.37554999999998, "r": 189.38742, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "Text", "bbox": {"l": 207.44576, "t": 186.37554999999998, "r": 223.40594000000002, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "Text", "bbox": {"l": 241.46428, "t": 186.37554999999998, "r": 257.42447, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "List-item", "bbox": {"l": 86.372002, "t": 197.33452999999997, "r": 119.25179, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "81", "bbox": {"l": 151.07401, "t": 197.33452999999997, "r": 159.41275, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Text", "bbox": {"l": 173.42723, "t": 197.33452999999997, "r": 189.38742, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "82", "bbox": {"l": 211.25647, "t": 197.33452999999997, "r": 219.59521, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Text", "bbox": {"l": 241.46426, "t": 197.33452999999997, "r": 257.42447, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Page-footer", "bbox": {"l": 86.372002, "t": 208.29351999999994, "r": 128.89964, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "62", "bbox": {"l": 151.07401, "t": 208.29351999999994, "r": 159.41275, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "62", "bbox": {"l": 177.23795, "t": 208.29351999999994, "r": 185.57669, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "-", "bbox": {"l": 213.91052, "t": 208.29351999999994, "r": 216.94116, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "-", "bbox": {"l": 247.92905000000002, "t": 208.29351999999994, "r": 250.95969, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Page-header", "bbox": {"l": 86.372002, "t": 219.25256000000002, "r": 131.65231, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "72", "bbox": {"l": 151.07401, "t": 219.25256000000002, "r": 159.41275, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "68", "bbox": {"l": 177.23795, "t": 219.25256000000002, "r": 185.57669, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "-", "bbox": {"l": 213.91052, "t": 219.25256000000002, "r": 216.94116, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "-", "bbox": {"l": 247.92905000000002, "t": 219.25256000000002, "r": 250.95969, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Picture", "bbox": {"l": 86.372002, "t": 230.21155, "r": 112.35663, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "72", "bbox": {"l": 151.07401, "t": 230.21155, "r": 159.41275, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "72", "bbox": {"l": 177.23795, "t": 230.21155, "r": 185.57669, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "72", "bbox": {"l": 211.25645, "t": 230.21155, "r": 219.5952, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "72", "bbox": {"l": 245.27496, "t": 230.21155, "r": 253.61371, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "Section-header", "bbox": {"l": 86.372002, "t": 241.16956000000005, "r": 141.11188, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "68", "bbox": {"l": 151.07401, "t": 241.16956000000005, "r": 159.41275, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "67", "bbox": {"l": 177.23795, "t": 241.16956000000005, "r": 185.57669, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "69", "bbox": {"l": 211.25645, "t": 241.16956000000005, "r": 219.5952, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "68", "bbox": {"l": 245.27496, "t": 241.16956000000005, "r": 253.61371, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Table", "bbox": {"l": 86.372002, "t": 252.12854000000004, "r": 106.17878, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "82", "bbox": {"l": 151.07401, "t": 252.12854000000004, "r": 159.41275, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "83", "bbox": {"l": 177.23795, "t": 252.12854000000004, "r": 185.57669, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "82", "bbox": {"l": 211.25645, "t": 252.12854000000004, "r": 219.5952, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "82", "bbox": {"l": 245.27496, "t": 252.12854000000004, "r": 253.61371, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Text", "bbox": {"l": 86.372002, "t": 263.08752000000004, "r": 102.3322, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "85", "bbox": {"l": 151.07401, "t": 263.08752000000004, "r": 159.41275, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "84", "bbox": {"l": 177.23795, "t": 263.08752000000004, "r": 185.57669, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "84", "bbox": {"l": 211.25645, "t": 263.08752000000004, "r": 219.5952, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "84", "bbox": {"l": 245.27496, "t": 263.08752000000004, "r": 253.61371, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "Title", "bbox": {"l": 86.372002, "t": 274.04657, "r": 103.36333, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "77", "bbox": {"l": 151.07401, "t": 274.04657, "r": 159.41275, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "Sec.-h.", "bbox": {"l": 169.37442, "t": 274.04657, "r": 193.43127, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "Sec.-h.", "bbox": {"l": 203.39294, "t": 274.04657, "r": 227.4498, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "Sec.-h.", "bbox": {"l": 237.41147, "t": 274.04657, "r": 261.46832, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "Overall", "bbox": {"l": 86.372002, "t": 285.40454, "r": 113.31602000000001, "b": 293.77917, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "72", "bbox": {"l": 151.07401, "t": 285.40454, "r": 159.41275, "b": 293.77917, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "73", "bbox": {"l": 177.23795, "t": 285.40454, "r": 185.57669, "b": 293.77917, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "78", "bbox": {"l": 211.25645, "t": 285.40454, "r": 219.5952, "b": 293.77917, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "77", "bbox": {"l": 245.27496, "t": 285.40454, "r": 253.61371, "b": 293.77917, "coord_origin": "TOPLEFT"}}], "children": [{"id": 15, "label": "text", "bbox": {"l": 86.372002, "t": 153.10051999999996, "r": 129.46452, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": "Class-count", "bbox": {"l": 86.372002, "t": 153.10051999999996, "r": 129.46452, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 151.07401, "t": 153.10051999999996, "r": 159.41275, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "11", "bbox": {"l": 151.07401, "t": 153.10051999999996, "r": 159.41275, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 179.31816, "t": 153.10051999999996, "r": 183.48753, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "6", "bbox": {"l": 179.31816, "t": 153.10051999999996, "r": 183.48753, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 213.33669, "t": 153.10051999999996, "r": 217.50606, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "5", "bbox": {"l": 213.33669, "t": 153.10051999999996, "r": 217.50606, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 247.35521, "t": 153.10051999999996, "r": 251.52458, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "4", "bbox": {"l": 247.35521, "t": 153.10051999999996, "r": 251.52458, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 86.372002, "t": 164.45752000000005, "r": 115.55763, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "Caption", "bbox": {"l": 86.372002, "t": 164.45752000000005, "r": 115.55763, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 151.07401, "t": 164.45752000000005, "r": 159.41275, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "68", "bbox": {"l": 151.07401, "t": 164.45752000000005, "r": 159.41275, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 173.42723, "t": 164.45752000000005, "r": 189.38742, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "Text", "bbox": {"l": 173.42723, "t": 164.45752000000005, "r": 189.38742, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 207.44576, "t": 164.45752000000005, "r": 223.40594000000002, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "Text", "bbox": {"l": 207.44576, "t": 164.45752000000005, "r": 223.40594000000002, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 241.46428, "t": 164.45752000000005, "r": 257.42447, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "Text", "bbox": {"l": 241.46428, "t": 164.45752000000005, "r": 257.42447, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 86.372002, "t": 175.41656, "r": 118.8752, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "Footnote", "bbox": {"l": 86.372002, "t": 175.41656, "r": 118.8752, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 151.07401, "t": 175.41656, "r": 159.41275, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "71", "bbox": {"l": 151.07401, "t": 175.41656, "r": 159.41275, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 173.42723, "t": 175.41656, "r": 189.38742, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "Text", "bbox": {"l": 173.42723, "t": 175.41656, "r": 189.38742, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 207.44576, "t": 175.41656, "r": 223.40594000000002, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "Text", "bbox": {"l": 207.44576, "t": 175.41656, "r": 223.40594000000002, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 241.46428, "t": 175.41656, "r": 257.42447, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "Text", "bbox": {"l": 241.46428, "t": 175.41656, "r": 257.42447, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 86.372002, "t": 186.37554999999998, "r": 116.88466, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "Formula", "bbox": {"l": 86.372002, "t": 186.37554999999998, "r": 116.88466, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 151.07401, "t": 186.37554999999998, "r": 159.41275, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "60", "bbox": {"l": 151.07401, "t": 186.37554999999998, "r": 159.41275, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 173.42723, "t": 186.37554999999998, "r": 189.38742, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "Text", "bbox": {"l": 173.42723, "t": 186.37554999999998, "r": 189.38742, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 207.44576, "t": 186.37554999999998, "r": 223.40594000000002, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "Text", "bbox": {"l": 207.44576, "t": 186.37554999999998, "r": 223.40594000000002, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 241.46428, "t": 186.37554999999998, "r": 257.42447, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "Text", "bbox": {"l": 241.46428, "t": 186.37554999999998, "r": 257.42447, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 86.372002, "t": 197.33452999999997, "r": 119.25179, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "List-item", "bbox": {"l": 86.372002, "t": 197.33452999999997, "r": 119.25179, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 151.07401, "t": 197.33452999999997, "r": 159.41275, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "81", "bbox": {"l": 151.07401, "t": 197.33452999999997, "r": 159.41275, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 173.42723, "t": 197.33452999999997, "r": 189.38742, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "Text", "bbox": {"l": 173.42723, "t": 197.33452999999997, "r": 189.38742, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 211.25647, "t": 197.33452999999997, "r": 219.59521, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "82", "bbox": {"l": 211.25647, "t": 197.33452999999997, "r": 219.59521, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 241.46426, "t": 197.33452999999997, "r": 257.42447, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "Text", "bbox": {"l": 241.46426, "t": 197.33452999999997, "r": 257.42447, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 86.372002, "t": 208.29351999999994, "r": 128.89964, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "Page-footer", "bbox": {"l": 86.372002, "t": 208.29351999999994, "r": 128.89964, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 151.07401, "t": 208.29351999999994, "r": 159.41275, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "62", "bbox": {"l": 151.07401, "t": 208.29351999999994, "r": 159.41275, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 177.23795, "t": 208.29351999999994, "r": 185.57669, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "62", "bbox": {"l": 177.23795, "t": 208.29351999999994, "r": 185.57669, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 213.91052, "t": 208.29351999999994, "r": 216.94116, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "-", "bbox": {"l": 213.91052, "t": 208.29351999999994, "r": 216.94116, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 247.92905000000002, "t": 208.29351999999994, "r": 250.95969, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "-", "bbox": {"l": 247.92905000000002, "t": 208.29351999999994, "r": 250.95969, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 86.372002, "t": 219.25256000000002, "r": 131.65231, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "Page-header", "bbox": {"l": 86.372002, "t": 219.25256000000002, "r": 131.65231, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 151.07401, "t": 219.25256000000002, "r": 159.41275, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "72", "bbox": {"l": 151.07401, "t": 219.25256000000002, "r": 159.41275, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 177.23795, "t": 219.25256000000002, "r": 185.57669, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "68", "bbox": {"l": 177.23795, "t": 219.25256000000002, "r": 185.57669, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 213.91052, "t": 219.25256000000002, "r": 216.94116, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "-", "bbox": {"l": 213.91052, "t": 219.25256000000002, "r": 216.94116, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 247.92905000000002, "t": 219.25256000000002, "r": 250.95969, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "-", "bbox": {"l": 247.92905000000002, "t": 219.25256000000002, "r": 250.95969, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 86.372002, "t": 230.21155, "r": 112.35663, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "Picture", "bbox": {"l": 86.372002, "t": 230.21155, "r": 112.35663, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 151.07401, "t": 230.21155, "r": 159.41275, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "72", "bbox": {"l": 151.07401, "t": 230.21155, "r": 159.41275, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 177.23795, "t": 230.21155, "r": 185.57669, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "72", "bbox": {"l": 177.23795, "t": 230.21155, "r": 185.57669, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 211.25645, "t": 230.21155, "r": 219.5952, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "72", "bbox": {"l": 211.25645, "t": 230.21155, "r": 219.5952, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 245.27496, "t": 230.21155, "r": 253.61371, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "72", "bbox": {"l": 245.27496, "t": 230.21155, "r": 253.61371, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 86.372002, "t": 241.16956000000005, "r": 141.11188, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "Section-header", "bbox": {"l": 86.372002, "t": 241.16956000000005, "r": 141.11188, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 151.07401, "t": 241.16956000000005, "r": 159.41275, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "68", "bbox": {"l": 151.07401, "t": 241.16956000000005, "r": 159.41275, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 177.23795, "t": 241.16956000000005, "r": 185.57669, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "67", "bbox": {"l": 177.23795, "t": 241.16956000000005, "r": 185.57669, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 211.25645, "t": 241.16956000000005, "r": 219.5952, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "69", "bbox": {"l": 211.25645, "t": 241.16956000000005, "r": 219.5952, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 245.27496, "t": 241.16956000000005, "r": 253.61371, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "68", "bbox": {"l": 245.27496, "t": 241.16956000000005, "r": 253.61371, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 86.372002, "t": 252.12854000000004, "r": 106.17878, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "Table", "bbox": {"l": 86.372002, "t": 252.12854000000004, "r": 106.17878, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 151.07401, "t": 252.12854000000004, "r": 159.41275, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "82", "bbox": {"l": 151.07401, "t": 252.12854000000004, "r": 159.41275, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 177.23795, "t": 252.12854000000004, "r": 185.57669, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "83", "bbox": {"l": 177.23795, "t": 252.12854000000004, "r": 185.57669, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 211.25645, "t": 252.12854000000004, "r": 219.5952, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "82", "bbox": {"l": 211.25645, "t": 252.12854000000004, "r": 219.5952, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 245.27496, "t": 252.12854000000004, "r": 253.61371, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "82", "bbox": {"l": 245.27496, "t": 252.12854000000004, "r": 253.61371, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 86.372002, "t": 263.08752000000004, "r": 102.3322, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "Text", "bbox": {"l": 86.372002, "t": 263.08752000000004, "r": 102.3322, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 151.07401, "t": 263.08752000000004, "r": 159.41275, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "85", "bbox": {"l": 151.07401, "t": 263.08752000000004, "r": 159.41275, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 177.23795, "t": 263.08752000000004, "r": 185.57669, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "84", "bbox": {"l": 177.23795, "t": 263.08752000000004, "r": 185.57669, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 211.25645, "t": 263.08752000000004, "r": 219.5952, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "84", "bbox": {"l": 211.25645, "t": 263.08752000000004, "r": 219.5952, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 245.27496, "t": 263.08752000000004, "r": 253.61371, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "84", "bbox": {"l": 245.27496, "t": 263.08752000000004, "r": 253.61371, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 86.372002, "t": 274.04657, "r": 103.36333, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "Title", "bbox": {"l": 86.372002, "t": 274.04657, "r": 103.36333, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 151.07401, "t": 274.04657, "r": 159.41275, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "77", "bbox": {"l": 151.07401, "t": 274.04657, "r": 159.41275, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 169.37442, "t": 274.04657, "r": 193.43127, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "Sec.-h.", "bbox": {"l": 169.37442, "t": 274.04657, "r": 193.43127, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 203.39294, "t": 274.04657, "r": 227.4498, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "Sec.-h.", "bbox": {"l": 203.39294, "t": 274.04657, "r": 227.4498, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 237.41147, "t": 274.04657, "r": 261.46832, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "Sec.-h.", "bbox": {"l": 237.41147, "t": 274.04657, "r": 261.46832, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 86.372002, "t": 285.40454, "r": 113.31602000000001, "b": 293.77917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "Overall", "bbox": {"l": 86.372002, "t": 285.40454, "r": 113.31602000000001, "b": 293.77917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 151.07401, "t": 285.40454, "r": 159.41275, "b": 293.77917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "72", "bbox": {"l": 151.07401, "t": 285.40454, "r": 159.41275, "b": 293.77917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 177.23795, "t": 285.40454, "r": 185.57669, "b": 293.77917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "73", "bbox": {"l": 177.23795, "t": 285.40454, "r": 185.57669, "b": 293.77917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 211.25645, "t": 285.40454, "r": 219.5952, "b": 293.77917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "78", "bbox": {"l": 211.25645, "t": 285.40454, "r": 219.5952, "b": 293.77917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 245.27496, "t": 285.40454, "r": 253.61371, "b": 293.77917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "77", "bbox": {"l": 245.27496, "t": 285.40454, "r": 253.61371, "b": 293.77917, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 13, "num_cols": 5, "table_cells": [{"bbox": {"l": 86.372002, "t": 153.10051999999996, "r": 129.46452, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Class-count", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 151.07401, "t": 153.10051999999996, "r": 159.41275, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "11", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 179.31816, "t": 153.10051999999996, "r": 183.48753, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "6", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 213.33669, "t": 153.10051999999996, "r": 217.50606, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "5", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 247.35521, "t": 153.10051999999996, "r": 251.52458, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "4", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 164.45752000000005, "r": 115.55763, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Caption", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 164.45752000000005, "r": 159.41275, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 173.42723, "t": 164.45752000000005, "r": 189.38742, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 207.44576, "t": 164.45752000000005, "r": 223.40594000000002, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 241.46428, "t": 164.45752000000005, "r": 257.42447, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 175.41656, "r": 118.8752, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Footnote", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 175.41656, "r": 159.41275, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "71", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 173.42723, "t": 175.41656, "r": 189.38742, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 207.44576, "t": 175.41656, "r": 223.40594000000002, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 241.46428, "t": 175.41656, "r": 257.42447, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 186.37554999999998, "r": 116.88466, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Formula", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 186.37554999999998, "r": 159.41275, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "60", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 173.42723, "t": 186.37554999999998, "r": 189.38742, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 207.44576, "t": 186.37554999999998, "r": 223.40594000000002, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 241.46428, "t": 186.37554999999998, "r": 257.42447, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 197.33452999999997, "r": 119.25179, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "List-item", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 197.33452999999997, "r": 159.41275, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 173.42723, "t": 197.33452999999997, "r": 189.38742, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 211.25647, "t": 197.33452999999997, "r": 219.59521, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 241.46426, "t": 197.33452999999997, "r": 257.42447, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 208.29351999999994, "r": 128.89964, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-footer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 208.29351999999994, "r": 159.41275, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "62", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23795, "t": 208.29351999999994, "r": 185.57669, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "62", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 213.91052, "t": 208.29351999999994, "r": 216.94116, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 247.92905000000002, "t": 208.29351999999994, "r": 250.95969, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 219.25256000000002, "r": 131.65231, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 219.25256000000002, "r": 159.41275, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23795, "t": 219.25256000000002, "r": 185.57669, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 213.91052, "t": 219.25256000000002, "r": 216.94116, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 247.92905000000002, "t": 219.25256000000002, "r": 250.95969, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 230.21155, "r": 112.35663, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Picture", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 230.21155, "r": 159.41275, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23795, "t": 230.21155, "r": 185.57669, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 211.25645, "t": 230.21155, "r": 219.5952, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.27496, "t": 230.21155, "r": 253.61371, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 241.16956000000005, "r": 141.11188, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Section-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 241.16956000000005, "r": 159.41275, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23795, "t": 241.16956000000005, "r": 185.57669, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "67", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 211.25645, "t": 241.16956000000005, "r": 219.5952, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "69", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.27496, "t": 241.16956000000005, "r": 253.61371, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 252.12854000000004, "r": 106.17878, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 252.12854000000004, "r": 159.41275, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23795, "t": 252.12854000000004, "r": 185.57669, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 211.25645, "t": 252.12854000000004, "r": 219.5952, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.27496, "t": 252.12854000000004, "r": 253.61371, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 263.08752000000004, "r": 102.3322, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Text", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 263.08752000000004, "r": 159.41275, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23795, "t": 263.08752000000004, "r": 185.57669, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 211.25645, "t": 263.08752000000004, "r": 219.5952, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.27496, "t": 263.08752000000004, "r": 253.61371, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 274.04657, "r": 103.36333, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Title", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 274.04657, "r": 159.41275, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 169.37442, "t": 274.04657, "r": 193.43127, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Sec.-h.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 203.39294, "t": 274.04657, "r": 227.4498, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Sec.-h.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 237.41147, "t": 274.04657, "r": 261.46832, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Sec.-h.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 285.40454, "r": 113.31602000000001, "b": 293.77917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Overall", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 285.40454, "r": 159.41275, "b": 293.77917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23795, "t": 285.40454, "r": 185.57669, "b": 293.77917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "73", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 211.25645, "t": 285.40454, "r": 219.5952, "b": 293.77917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "78", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.27496, "t": 285.40454, "r": 253.61371, "b": 293.77917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "77", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "section_header", "id": 10, "page_no": 6, "cluster": {"id": 10, "label": "section_header", "bbox": {"l": 53.79800000000001, "t": 319.56992, "r": 131.05624, "b": 329.879, "coord_origin": "TOPLEFT"}, "confidence": 0.9555686116218567, "cells": [{"id": 71, "text": "Learning Curve", "bbox": {"l": 53.79800000000001, "t": 319.56992, "r": 131.05624, "b": 329.879, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Learning Curve"}, {"label": "text", "id": 5, "page_no": 6, "cluster": {"id": 5, "label": "text", "bbox": {"l": 52.785, "t": 334.77155, "r": 295.55835, "b": 529.44818, "coord_origin": "TOPLEFT"}, "confidence": 0.9857739210128784, "cells": [{"id": 72, "text": "One of the fundamental questions related to any dataset is if it is", "bbox": {"l": 53.79800000000001, "t": 334.77155, "r": 294.04153, "b": 343.14618, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "\u201clarge enough\u201d. To answer this question for DocLayNet, we per-", "bbox": {"l": 52.785, "t": 345.73053, "r": 295.55835, "b": 354.10516000000007, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "formed a data ablation study in which we evaluated a Mask R-CNN", "bbox": {"l": 53.79800000000001, "t": 356.6895400000001, "r": 294.04535, "b": 365.06418, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "model trained on increasing fractions of the DocLayNet dataset.", "bbox": {"l": 53.79800000000001, "t": 367.64853, "r": 295.4281, "b": 376.02316, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "As can be seen in Figure 5, the mAP score rises sharply in the be-", "bbox": {"l": 53.484001, "t": 378.60754, "r": 295.55667, "b": 386.98218, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "ginning and eventually levels out. To estimate the error-bar on the", "bbox": {"l": 53.79800000000001, "t": 389.56653, "r": 294.04865, "b": 397.94116, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "metrics, we ran the training five times on the entire data-set. This", "bbox": {"l": 53.79800000000001, "t": 400.52554000000003, "r": 294.04376, "b": 408.90018, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "resulted in a 1% error-bar, depicted by the shaded area in Figure 5.", "bbox": {"l": 53.79800000000001, "t": 411.48456, "r": 295.42459, "b": 419.85919, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "In the inset of Figure 5, we show the exact same data-points, but", "bbox": {"l": 53.79800000000001, "t": 422.44354, "r": 294.04709, "b": 430.81818, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "with a logarithmic scale on the x-axis. As is expected, the mAP", "bbox": {"l": 53.466999, "t": 433.40253000000007, "r": 294.04535, "b": 441.7771599999999, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "score increases linearly as a function of the data-size in the inset.", "bbox": {"l": 53.79800000000001, "t": 444.36053000000004, "r": 295.42902, "b": 452.73517, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "The curve ultimately flattens out between the 80% and 100% mark,", "bbox": {"l": 53.528999, "t": 455.31955, "r": 295.03122, "b": 463.69418, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "with the 80% mark falling within the error-bars of the 100% mark.", "bbox": {"l": 53.466999, "t": 466.27853, "r": 295.42154, "b": 474.65317, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "This provides a good indication that the model would not improve", "bbox": {"l": 53.528999, "t": 477.23755, "r": 294.04553, "b": 485.61218, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "significantly by yet increasing the data size. Rather, it would prob-", "bbox": {"l": 53.79800000000001, "t": 488.19653, "r": 295.55646, "b": 496.57117, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "ably benefit more from improved data consistency (as discussed", "bbox": {"l": 53.79800000000001, "t": 499.15555, "r": 294.04715, "b": 507.53018, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "in Section 3), data augmentation methods [23], or the addition of", "bbox": {"l": 53.79800000000001, "t": 510.11453, "r": 294.04245, "b": 518.4891700000001, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "more document categories and styles.", "bbox": {"l": 53.79800000000001, "t": 521.0735500000001, "r": 191.47707, "b": 529.44818, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "One of the fundamental questions related to any dataset is if it is \u201clarge enough\u201d. To answer this question for DocLayNet, we performed a data ablation study in which we evaluated a Mask R-CNN model trained on increasing fractions of the DocLayNet dataset. As can be seen in Figure 5, the mAP score rises sharply in the beginning and eventually levels out. To estimate the error-bar on the metrics, we ran the training five times on the entire data-set. This resulted in a 1% error-bar, depicted by the shaded area in Figure 5. In the inset of Figure 5, we show the exact same data-points, but with a logarithmic scale on the x-axis. As is expected, the mAP score increases linearly as a function of the data-size in the inset. The curve ultimately flattens out between the 80% and 100% mark, with the 80% mark falling within the error-bars of the 100% mark. This provides a good indication that the model would not improve significantly by yet increasing the data size. Rather, it would probably benefit more from improved data consistency (as discussed in Section 3), data augmentation methods [23], or the addition of more document categories and styles."}, {"label": "section_header", "id": 8, "page_no": 6, "cluster": {"id": 8, "label": "section_header", "bbox": {"l": 53.79800000000001, "t": 542.50992, "r": 164.32898, "b": 552.81902, "coord_origin": "TOPLEFT"}, "confidence": 0.9572026133537292, "cells": [{"id": 90, "text": "Impact of Class Labels", "bbox": {"l": 53.79800000000001, "t": 542.50992, "r": 164.32898, "b": 552.81902, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Impact of Class Labels"}, {"label": "text", "id": 1, "page_no": 6, "cluster": {"id": 1, "label": "text", "bbox": {"l": 53.466999, "t": 557.71155, "r": 295.55679, "b": 708.55217, "coord_origin": "TOPLEFT"}, "confidence": 0.9876301884651184, "cells": [{"id": 91, "text": "The choice and number of labels can have a significant effect on", "bbox": {"l": 53.528999, "t": 557.71155, "r": 294.04333, "b": 566.08617, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "the overall model performance. Since PubLayNet, DocBank and", "bbox": {"l": 53.79800000000001, "t": 568.6705499999999, "r": 294.04712, "b": 577.04517, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "DocLayNet all have different label sets, it is of particular interest to", "bbox": {"l": 53.79800000000001, "t": 579.62955, "r": 294.04538, "b": 588.0041699999999, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "understand and quantify this influence of the label set on the model", "bbox": {"l": 53.79800000000001, "t": 590.5885499999999, "r": 294.04535, "b": 598.96317, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "performance. We investigate this by either down-mapping labels", "bbox": {"l": 53.79800000000001, "t": 601.54755, "r": 294.04266, "b": 609.92216, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "into more common ones (e.g.", "bbox": {"l": 53.79800000000001, "t": 612.50656, "r": 163.59247, "b": 620.88118, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "Caption", "bbox": {"l": 166.26401, "t": 612.55139, "r": 194.97244, "b": 620.89015, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "\u2192", "bbox": {"l": 194.994, "t": 612.45276, "r": 204.1756, "b": 620.15491, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "Text", "bbox": {"l": 204.17599, "t": 612.55139, "r": 219.33961000000002, "b": 620.89015, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": ") or excluding them", "bbox": {"l": 219.849, "t": 612.50656, "r": 294.04828, "b": 620.88118, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "from the annotations entirely. Furthermore, it must be stressed", "bbox": {"l": 53.79800000000001, "t": 623.46556, "r": 294.04709, "b": 631.84018, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "that all mappings and exclusions were performed on the data be-", "bbox": {"l": 53.79800000000001, "t": 634.42355, "r": 295.55679, "b": 642.79817, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "fore model training. In Table 3, we present the mAP scores for a", "bbox": {"l": 53.79800000000001, "t": 645.38255, "r": 294.04715, "b": 653.75717, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "Mask R-CNN R50 network on different label sets. Where a label", "bbox": {"l": 53.79800000000001, "t": 656.34155, "r": 294.04715, "b": 664.71617, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "is down-mapped, we show its corresponding label, otherwise it", "bbox": {"l": 53.79800000000001, "t": 667.30055, "r": 294.04712, "b": 675.67517, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "was excluded. We present three different label sets, with 6, 5 and 4", "bbox": {"l": 53.466999, "t": 678.25955, "r": 294.25174, "b": 686.63417, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "different labels respectively. The set of 5 labels contains the same", "bbox": {"l": 53.79800000000001, "t": 689.21855, "r": 294.04639, "b": 697.59317, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "labels as PubLayNet. However, due to the different definition of", "bbox": {"l": 53.79800000000001, "t": 700.177551, "r": 294.04712, "b": 708.55217, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The choice and number of labels can have a significant effect on the overall model performance. Since PubLayNet, DocBank and DocLayNet all have different label sets, it is of particular interest to understand and quantify this influence of the label set on the model performance. We investigate this by either down-mapping labels into more common ones (e.g. Caption \u2192 Text ) or excluding them from the annotations entirely. Furthermore, it must be stressed that all mappings and exclusions were performed on the data before model training. In Table 3, we present the mAP scores for a Mask R-CNN R50 network on different label sets. Where a label is down-mapped, we show its corresponding label, otherwise it was excluded. We present three different label sets, with 6, 5 and 4 different labels respectively. The set of 5 labels contains the same labels as PubLayNet. However, due to the different definition of"}, {"label": "text", "id": 13, "page_no": 6, "cluster": {"id": 13, "label": "text", "bbox": {"l": 317.659, "t": 86.87298999999996, "r": 559.80682, "b": 128.22321, "coord_origin": "TOPLEFT"}, "confidence": 0.8736215829849243, "cells": [{"id": 109, "text": "Table 4: Performance of a Mask R-CNN R50 network with", "bbox": {"l": 317.659, "t": 86.87298999999996, "r": 558.20068, "b": 95.34625000000017, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "document-wise and page-wise split for different label sets.", "bbox": {"l": 317.95499, "t": 97.83196999999996, "r": 559.73401, "b": 106.30524000000003, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "Naive page-wise split will result in", "bbox": {"l": 317.95499, "t": 108.79094999999995, "r": 467.72089, "b": 117.26422000000014, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "GLYPH<tildelow>", "bbox": {"l": 471.90900000000005, "t": 107.12798999999995, "r": 477.53900000000004, "b": 115.19768999999997, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "10% point improve-", "bbox": {"l": 477.54001000000005, "t": 108.79094999999995, "r": 559.80682, "b": 117.26422000000014, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "ment.", "bbox": {"l": 317.95502, "t": 119.74993999999992, "r": 341.37524, "b": 128.22321, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 4: Performance of a Mask R-CNN R50 network with document-wise and page-wise split for different label sets. Naive page-wise split will result in GLYPH<tildelow> 10% point improvement."}, {"label": "table", "id": 0, "page_no": 6, "cluster": {"id": 0, "label": "table", "bbox": {"l": 352.97747802734375, "t": 150.791259765625, "r": 522.9158935546875, "b": 306.2658386230469, "coord_origin": "TOPLEFT"}, "confidence": 0.9879696369171143, "cells": [{"id": 115, "text": "Class-count", "bbox": {"l": 358.63901, "t": 153.10051999999996, "r": 401.73154, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "11", "bbox": {"l": 440.22501, "t": 153.10051999999996, "r": 448.56375, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "5", "bbox": {"l": 494.38, "t": 153.10051999999996, "r": 498.54938, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "Split", "bbox": {"l": 358.63901, "t": 164.05951000000005, "r": 375.27167, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "Doc", "bbox": {"l": 423.341, "t": 164.05951000000005, "r": 438.0459, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "Page", "bbox": {"l": 448.00757, "t": 164.05951000000005, "r": 465.4472, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "Doc", "bbox": {"l": 475.41101, "t": 164.05951000000005, "r": 490.11591, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Page", "bbox": {"l": 500.07757999999995, "t": 164.05951000000005, "r": 517.51721, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "Caption", "bbox": {"l": 358.63901, "t": 175.41656, "r": 387.82465, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "68", "bbox": {"l": 426.52399, "t": 175.41656, "r": 434.86273, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "83", "bbox": {"l": 452.56240999999994, "t": 175.41656, "r": 460.90115000000003, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "Footnote", "bbox": {"l": 358.63901, "t": 186.37554999999998, "r": 391.14221, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "71", "bbox": {"l": 426.52399, "t": 186.37554999999998, "r": 434.86273, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "84", "bbox": {"l": 452.56240999999994, "t": 186.37554999999998, "r": 460.90115000000003, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "Formula", "bbox": {"l": 358.63901, "t": 197.33452999999997, "r": 389.15167, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "60", "bbox": {"l": 426.52399, "t": 197.33452999999997, "r": 434.86273, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "66", "bbox": {"l": 452.56240999999994, "t": 197.33452999999997, "r": 460.90115000000003, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "List-item", "bbox": {"l": 358.63901, "t": 208.29351999999994, "r": 391.5188, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "81", "bbox": {"l": 426.52399, "t": 208.29351999999994, "r": 434.86273, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "88", "bbox": {"l": 452.56240999999994, "t": 208.29351999999994, "r": 460.90115000000003, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "82", "bbox": {"l": 478.59399, "t": 208.29351999999994, "r": 486.93274, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "88", "bbox": {"l": 504.6324200000001, "t": 208.29351999999994, "r": 512.97119, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "Page-footer", "bbox": {"l": 358.63901, "t": 219.25256000000002, "r": 401.16666, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "62", "bbox": {"l": 426.52399, "t": 219.25256000000002, "r": 434.86273, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "89", "bbox": {"l": 452.56240999999994, "t": 219.25256000000002, "r": 460.90115000000003, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "Page-header", "bbox": {"l": 358.63901, "t": 230.21155, "r": 403.91931, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "72", "bbox": {"l": 426.52399, "t": 230.21155, "r": 434.86273, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "90", "bbox": {"l": 452.56240999999994, "t": 230.21155, "r": 460.90115000000003, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "Picture", "bbox": {"l": 358.63901, "t": 241.16956000000005, "r": 384.62366, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "72", "bbox": {"l": 426.52399, "t": 241.16956000000005, "r": 434.86273, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "82", "bbox": {"l": 452.56240999999994, "t": 241.16956000000005, "r": 460.90115000000003, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "72", "bbox": {"l": 478.59399, "t": 241.16956000000005, "r": 486.93274, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "82", "bbox": {"l": 504.6324200000001, "t": 241.16956000000005, "r": 512.97119, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "Section-header", "bbox": {"l": 358.63901, "t": 252.12854000000004, "r": 413.37891, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "68", "bbox": {"l": 426.52399, "t": 252.12854000000004, "r": 434.86273, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "83", "bbox": {"l": 452.56240999999994, "t": 252.12854000000004, "r": 460.90115000000003, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "69", "bbox": {"l": 478.59399, "t": 252.12854000000004, "r": 486.93274, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "83", "bbox": {"l": 504.6324200000001, "t": 252.12854000000004, "r": 512.97119, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "Table", "bbox": {"l": 358.63901, "t": 263.08752000000004, "r": 378.44577, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "82", "bbox": {"l": 426.52399, "t": 263.08752000000004, "r": 434.86273, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "89", "bbox": {"l": 452.56240999999994, "t": 263.08752000000004, "r": 460.90115000000003, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "82", "bbox": {"l": 478.59399, "t": 263.08752000000004, "r": 486.93274, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "90", "bbox": {"l": 504.6324200000001, "t": 263.08752000000004, "r": 512.97119, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "Text", "bbox": {"l": 358.63901, "t": 274.04657, "r": 374.59921, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "85", "bbox": {"l": 426.52399, "t": 274.04657, "r": 434.86273, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "91", "bbox": {"l": 452.56240999999994, "t": 274.04657, "r": 460.90115000000003, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "84", "bbox": {"l": 478.59399, "t": 274.04657, "r": 486.93274, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "90", "bbox": {"l": 504.6324200000001, "t": 274.04657, "r": 512.97119, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "Title", "bbox": {"l": 358.63901, "t": 285.00552, "r": 375.63034, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "77", "bbox": {"l": 426.52399, "t": 285.00552, "r": 434.86273, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "81", "bbox": {"l": 452.56240999999994, "t": 285.00552, "r": 460.90115000000003, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "All", "bbox": {"l": 358.63901, "t": 296.36255, "r": 369.60492, "b": 304.73718, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "72", "bbox": {"l": 426.52399, "t": 296.36255, "r": 434.86273, "b": 304.73718, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "84", "bbox": {"l": 452.56240999999994, "t": 296.36255, "r": 460.90115000000003, "b": 304.73718, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "78", "bbox": {"l": 478.59399, "t": 296.36255, "r": 486.93274, "b": 304.73718, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "87", "bbox": {"l": 504.6324200000001, "t": 296.36255, "r": 512.97119, "b": 304.73718, "coord_origin": "TOPLEFT"}}], "children": [{"id": 80, "label": "text", "bbox": {"l": 358.63901, "t": 153.10051999999996, "r": 401.73154, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 115, "text": "Class-count", "bbox": {"l": 358.63901, "t": 153.10051999999996, "r": 401.73154, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 440.22501, "t": 153.10051999999996, "r": 448.56375, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 116, "text": "11", "bbox": {"l": 440.22501, "t": 153.10051999999996, "r": 448.56375, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 494.38, "t": 153.10051999999996, "r": 498.54938, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 117, "text": "5", "bbox": {"l": 494.38, "t": 153.10051999999996, "r": 498.54938, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 358.63901, "t": 164.05951000000005, "r": 375.27167, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 118, "text": "Split", "bbox": {"l": 358.63901, "t": 164.05951000000005, "r": 375.27167, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 423.341, "t": 164.05951000000005, "r": 438.0459, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 119, "text": "Doc", "bbox": {"l": 423.341, "t": 164.05951000000005, "r": 438.0459, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 448.00757, "t": 164.05951000000005, "r": 465.4472, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 120, "text": "Page", "bbox": {"l": 448.00757, "t": 164.05951000000005, "r": 465.4472, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 475.41101, "t": 164.05951000000005, "r": 490.11591, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 121, "text": "Doc", "bbox": {"l": 475.41101, "t": 164.05951000000005, "r": 490.11591, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 500.07757999999995, "t": 164.05951000000005, "r": 517.51721, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 122, "text": "Page", "bbox": {"l": 500.07757999999995, "t": 164.05951000000005, "r": 517.51721, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 358.63901, "t": 175.41656, "r": 387.82465, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 123, "text": "Caption", "bbox": {"l": 358.63901, "t": 175.41656, "r": 387.82465, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 426.52399, "t": 175.41656, "r": 434.86273, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 124, "text": "68", "bbox": {"l": 426.52399, "t": 175.41656, "r": 434.86273, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 452.56240999999994, "t": 175.41656, "r": 460.90115000000003, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 125, "text": "83", "bbox": {"l": 452.56240999999994, "t": 175.41656, "r": 460.90115000000003, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 358.63901, "t": 186.37554999999998, "r": 391.14221, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 126, "text": "Footnote", "bbox": {"l": 358.63901, "t": 186.37554999999998, "r": 391.14221, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 426.52399, "t": 186.37554999999998, "r": 434.86273, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 127, "text": "71", "bbox": {"l": 426.52399, "t": 186.37554999999998, "r": 434.86273, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 452.56240999999994, "t": 186.37554999999998, "r": 460.90115000000003, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 128, "text": "84", "bbox": {"l": 452.56240999999994, "t": 186.37554999999998, "r": 460.90115000000003, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 358.63901, "t": 197.33452999999997, "r": 389.15167, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 129, "text": "Formula", "bbox": {"l": 358.63901, "t": 197.33452999999997, "r": 389.15167, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 426.52399, "t": 197.33452999999997, "r": 434.86273, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 130, "text": "60", "bbox": {"l": 426.52399, "t": 197.33452999999997, "r": 434.86273, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 452.56240999999994, "t": 197.33452999999997, "r": 460.90115000000003, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 131, "text": "66", "bbox": {"l": 452.56240999999994, "t": 197.33452999999997, "r": 460.90115000000003, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 358.63901, "t": 208.29351999999994, "r": 391.5188, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 132, "text": "List-item", "bbox": {"l": 358.63901, "t": 208.29351999999994, "r": 391.5188, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 426.52399, "t": 208.29351999999994, "r": 434.86273, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 133, "text": "81", "bbox": {"l": 426.52399, "t": 208.29351999999994, "r": 434.86273, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 452.56240999999994, "t": 208.29351999999994, "r": 460.90115000000003, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 134, "text": "88", "bbox": {"l": 452.56240999999994, "t": 208.29351999999994, "r": 460.90115000000003, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 478.59399, "t": 208.29351999999994, "r": 486.93274, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 135, "text": "82", "bbox": {"l": 478.59399, "t": 208.29351999999994, "r": 486.93274, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 504.6324200000001, "t": 208.29351999999994, "r": 512.97119, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 136, "text": "88", "bbox": {"l": 504.6324200000001, "t": 208.29351999999994, "r": 512.97119, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 358.63901, "t": 219.25256000000002, "r": 401.16666, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 137, "text": "Page-footer", "bbox": {"l": 358.63901, "t": 219.25256000000002, "r": 401.16666, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 426.52399, "t": 219.25256000000002, "r": 434.86273, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 138, "text": "62", "bbox": {"l": 426.52399, "t": 219.25256000000002, "r": 434.86273, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 452.56240999999994, "t": 219.25256000000002, "r": 460.90115000000003, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 139, "text": "89", "bbox": {"l": 452.56240999999994, "t": 219.25256000000002, "r": 460.90115000000003, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 358.63901, "t": 230.21155, "r": 403.91931, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 140, "text": "Page-header", "bbox": {"l": 358.63901, "t": 230.21155, "r": 403.91931, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 426.52399, "t": 230.21155, "r": 434.86273, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 141, "text": "72", "bbox": {"l": 426.52399, "t": 230.21155, "r": 434.86273, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 452.56240999999994, "t": 230.21155, "r": 460.90115000000003, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 142, "text": "90", "bbox": {"l": 452.56240999999994, "t": 230.21155, "r": 460.90115000000003, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 358.63901, "t": 241.16956000000005, "r": 384.62366, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 143, "text": "Picture", "bbox": {"l": 358.63901, "t": 241.16956000000005, "r": 384.62366, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 426.52399, "t": 241.16956000000005, "r": 434.86273, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 144, "text": "72", "bbox": {"l": 426.52399, "t": 241.16956000000005, "r": 434.86273, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 452.56240999999994, "t": 241.16956000000005, "r": 460.90115000000003, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 145, "text": "82", "bbox": {"l": 452.56240999999994, "t": 241.16956000000005, "r": 460.90115000000003, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 478.59399, "t": 241.16956000000005, "r": 486.93274, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 146, "text": "72", "bbox": {"l": 478.59399, "t": 241.16956000000005, "r": 486.93274, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 504.6324200000001, "t": 241.16956000000005, "r": 512.97119, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 147, "text": "82", "bbox": {"l": 504.6324200000001, "t": 241.16956000000005, "r": 512.97119, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 358.63901, "t": 252.12854000000004, "r": 413.37891, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 148, "text": "Section-header", "bbox": {"l": 358.63901, "t": 252.12854000000004, "r": 413.37891, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 114, "label": "text", "bbox": {"l": 426.52399, "t": 252.12854000000004, "r": 434.86273, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 149, "text": "68", "bbox": {"l": 426.52399, "t": 252.12854000000004, "r": 434.86273, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 115, "label": "text", "bbox": {"l": 452.56240999999994, "t": 252.12854000000004, "r": 460.90115000000003, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 150, "text": "83", "bbox": {"l": 452.56240999999994, "t": 252.12854000000004, "r": 460.90115000000003, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 116, "label": "text", "bbox": {"l": 478.59399, "t": 252.12854000000004, "r": 486.93274, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 151, "text": "69", "bbox": {"l": 478.59399, "t": 252.12854000000004, "r": 486.93274, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 117, "label": "text", "bbox": {"l": 504.6324200000001, "t": 252.12854000000004, "r": 512.97119, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 152, "text": "83", "bbox": {"l": 504.6324200000001, "t": 252.12854000000004, "r": 512.97119, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 118, "label": "text", "bbox": {"l": 358.63901, "t": 263.08752000000004, "r": 378.44577, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 153, "text": "Table", "bbox": {"l": 358.63901, "t": 263.08752000000004, "r": 378.44577, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 119, "label": "text", "bbox": {"l": 426.52399, "t": 263.08752000000004, "r": 434.86273, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 154, "text": "82", "bbox": {"l": 426.52399, "t": 263.08752000000004, "r": 434.86273, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 120, "label": "text", "bbox": {"l": 452.56240999999994, "t": 263.08752000000004, "r": 460.90115000000003, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 155, "text": "89", "bbox": {"l": 452.56240999999994, "t": 263.08752000000004, "r": 460.90115000000003, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 121, "label": "text", "bbox": {"l": 478.59399, "t": 263.08752000000004, "r": 486.93274, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 156, "text": "82", "bbox": {"l": 478.59399, "t": 263.08752000000004, "r": 486.93274, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 122, "label": "text", "bbox": {"l": 504.6324200000001, "t": 263.08752000000004, "r": 512.97119, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 157, "text": "90", "bbox": {"l": 504.6324200000001, "t": 263.08752000000004, "r": 512.97119, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 123, "label": "text", "bbox": {"l": 358.63901, "t": 274.04657, "r": 374.59921, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 158, "text": "Text", "bbox": {"l": 358.63901, "t": 274.04657, "r": 374.59921, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 124, "label": "text", "bbox": {"l": 426.52399, "t": 274.04657, "r": 434.86273, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 159, "text": "85", "bbox": {"l": 426.52399, "t": 274.04657, "r": 434.86273, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 125, "label": "text", "bbox": {"l": 452.56240999999994, "t": 274.04657, "r": 460.90115000000003, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 160, "text": "91", "bbox": {"l": 452.56240999999994, "t": 274.04657, "r": 460.90115000000003, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 126, "label": "text", "bbox": {"l": 478.59399, "t": 274.04657, "r": 486.93274, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 161, "text": "84", "bbox": {"l": 478.59399, "t": 274.04657, "r": 486.93274, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 127, "label": "text", "bbox": {"l": 504.6324200000001, "t": 274.04657, "r": 512.97119, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 162, "text": "90", "bbox": {"l": 504.6324200000001, "t": 274.04657, "r": 512.97119, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 128, "label": "text", "bbox": {"l": 358.63901, "t": 285.00552, "r": 375.63034, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 163, "text": "Title", "bbox": {"l": 358.63901, "t": 285.00552, "r": 375.63034, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 129, "label": "text", "bbox": {"l": 426.52399, "t": 285.00552, "r": 434.86273, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 164, "text": "77", "bbox": {"l": 426.52399, "t": 285.00552, "r": 434.86273, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 130, "label": "text", "bbox": {"l": 452.56240999999994, "t": 285.00552, "r": 460.90115000000003, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 165, "text": "81", "bbox": {"l": 452.56240999999994, "t": 285.00552, "r": 460.90115000000003, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 131, "label": "text", "bbox": {"l": 358.63901, "t": 296.36255, "r": 369.60492, "b": 304.73718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 166, "text": "All", "bbox": {"l": 358.63901, "t": 296.36255, "r": 369.60492, "b": 304.73718, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 132, "label": "text", "bbox": {"l": 426.52399, "t": 296.36255, "r": 434.86273, "b": 304.73718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 167, "text": "72", "bbox": {"l": 426.52399, "t": 296.36255, "r": 434.86273, "b": 304.73718, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 133, "label": "text", "bbox": {"l": 452.56240999999994, "t": 296.36255, "r": 460.90115000000003, "b": 304.73718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 168, "text": "84", "bbox": {"l": 452.56240999999994, "t": 296.36255, "r": 460.90115000000003, "b": 304.73718, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 134, "label": "text", "bbox": {"l": 478.59399, "t": 296.36255, "r": 486.93274, "b": 304.73718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 169, "text": "78", "bbox": {"l": 478.59399, "t": 296.36255, "r": 486.93274, "b": 304.73718, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 135, "label": "text", "bbox": {"l": 504.6324200000001, "t": 296.36255, "r": 512.97119, "b": 304.73718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 170, "text": "87", "bbox": {"l": 504.6324200000001, "t": 296.36255, "r": 512.97119, "b": 304.73718, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["fcel", "ched", "lcel", "ched", "lcel", "nl", "fcel", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 14, "num_cols": 5, "table_cells": [{"bbox": {"l": 358.63901, "t": 153.10051999999996, "r": 401.73154, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Class-count", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.22501, "t": 153.10051999999996, "r": 448.56375, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 3, "text": "11", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 494.38, "t": 153.10051999999996, "r": 498.54938, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 5, "text": "5", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 164.05951000000005, "r": 375.27167, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Split", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 423.341, "t": 164.05951000000005, "r": 438.0459, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Doc", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 448.00757, "t": 164.05951000000005, "r": 465.4472, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Page", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 475.41101, "t": 164.05951000000005, "r": 490.11591, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Doc", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 500.07757999999995, "t": 164.05951000000005, "r": 517.51721, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Page", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 175.41656, "r": 387.82465, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Caption", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 175.41656, "r": 434.86273, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 175.41656, "r": 460.90115000000003, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 186.37554999999998, "r": 391.14221, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Footnote", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 186.37554999999998, "r": 434.86273, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "71", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 186.37554999999998, "r": 460.90115000000003, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 197.33452999999997, "r": 389.15167, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Formula", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 197.33452999999997, "r": 434.86273, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "60", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 197.33452999999997, "r": 460.90115000000003, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "66", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 208.29351999999994, "r": 391.5188, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "List-item", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 208.29351999999994, "r": 434.86273, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 208.29351999999994, "r": 460.90115000000003, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 478.59399, "t": 208.29351999999994, "r": 486.93274, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 504.6324200000001, "t": 208.29351999999994, "r": 512.97119, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 219.25256000000002, "r": 401.16666, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-footer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 219.25256000000002, "r": 434.86273, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "62", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 219.25256000000002, "r": 460.90115000000003, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "89", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 230.21155, "r": 403.91931, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 230.21155, "r": 434.86273, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 230.21155, "r": 460.90115000000003, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "90", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 241.16956000000005, "r": 384.62366, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Picture", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 241.16956000000005, "r": 434.86273, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 241.16956000000005, "r": 460.90115000000003, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 478.59399, "t": 241.16956000000005, "r": 486.93274, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 504.6324200000001, "t": 241.16956000000005, "r": 512.97119, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 252.12854000000004, "r": 413.37891, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Section-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 252.12854000000004, "r": 434.86273, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 252.12854000000004, "r": 460.90115000000003, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 478.59399, "t": 252.12854000000004, "r": 486.93274, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "69", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 504.6324200000001, "t": 252.12854000000004, "r": 512.97119, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 263.08752000000004, "r": 378.44577, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 263.08752000000004, "r": 434.86273, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 263.08752000000004, "r": 460.90115000000003, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "89", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 478.59399, "t": 263.08752000000004, "r": 486.93274, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 504.6324200000001, "t": 263.08752000000004, "r": 512.97119, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "90", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 274.04657, "r": 374.59921, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Text", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 274.04657, "r": 434.86273, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 274.04657, "r": 460.90115000000003, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "91", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 478.59399, "t": 274.04657, "r": 486.93274, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 504.6324200000001, "t": 274.04657, "r": 512.97119, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "90", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 285.00552, "r": 375.63034, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Title", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 285.00552, "r": 434.86273, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 285.00552, "r": 460.90115000000003, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 296.36255, "r": 369.60492, "b": 304.73718, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "All", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 296.36255, "r": 434.86273, "b": 304.73718, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 296.36255, "r": 460.90115000000003, "b": 304.73718, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 478.59399, "t": 296.36255, "r": 486.93274, "b": 304.73718, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "78", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 504.6324200000001, "t": 296.36255, "r": 512.97119, "b": 304.73718, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "87", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "text", "id": 6, "page_no": 6, "cluster": {"id": 6, "label": "text", "bbox": {"l": 317.686, "t": 331.40353, "r": 559.58496, "b": 416.49017, "coord_origin": "TOPLEFT"}, "confidence": 0.9740146994590759, "cells": [{"id": 171, "text": "lists in PubLayNet (grouped list-items) versus DocLayNet (separate", "bbox": {"l": 317.95499, "t": 331.40353, "r": 558.20233, "b": 339.77817, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "list-items), the label set of size 4 is the closest to PubLayNet, in the", "bbox": {"l": 317.95499, "t": 342.36255, "r": 558.2005, "b": 350.73718, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "assumption that the", "bbox": {"l": 317.95499, "t": 353.32153, "r": 393.16028, "b": 361.69617000000005, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "List", "bbox": {"l": 395.84201, "t": 353.36639, "r": 409.14905, "b": 361.70514, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "is down-mapped to", "bbox": {"l": 412.33301, "t": 353.32153, "r": 485.02324999999996, "b": 361.69617000000005, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "Text", "bbox": {"l": 487.70401, "t": 353.36639, "r": 502.86761, "b": 361.70514, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "in PubLayNet.", "bbox": {"l": 506.05499, "t": 353.32153, "r": 559.58496, "b": 361.69617000000005, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "The results in Table 3 show that the prediction accuracy on the", "bbox": {"l": 317.686, "t": 364.28054999999995, "r": 558.2002, "b": 372.65518, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "remaining class labels does not change significantly when other", "bbox": {"l": 317.95499, "t": 375.23853, "r": 558.36877, "b": 383.61316, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "classes are merged into them. The overall macro-average improves", "bbox": {"l": 317.95499, "t": 386.19754, "r": 558.19958, "b": 394.57217, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "by around 5%, in particular when", "bbox": {"l": 317.95499, "t": 397.15652, "r": 439.49454, "b": 405.53116000000006, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "Page-footer", "bbox": {"l": 441.728, "t": 397.20139, "r": 481.8616, "b": 405.54013, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "and", "bbox": {"l": 484.74298, "t": 397.15652, "r": 498.23743, "b": 405.53116000000006, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "Page-header", "bbox": {"l": 500.47299, "t": 397.20139, "r": 543.95105, "b": 405.54013, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": "are", "bbox": {"l": 546.83197, "t": 397.15652, "r": 558.20142, "b": 405.53116000000006, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "excluded.", "bbox": {"l": 317.95496, "t": 408.11553999999995, "r": 352.37698, "b": 416.49017, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "lists in PubLayNet (grouped list-items) versus DocLayNet (separate list-items), the label set of size 4 is the closest to PubLayNet, in the assumption that the List is down-mapped to Text in PubLayNet. The results in Table 3 show that the prediction accuracy on the remaining class labels does not change significantly when other classes are merged into them. The overall macro-average improves by around 5%, in particular when Page-footer and Page-header are excluded."}, {"label": "section_header", "id": 9, "page_no": 6, "cluster": {"id": 9, "label": "section_header", "bbox": {"l": 317.95496, "t": 429.3949, "r": 549.8606, "b": 439.70398, "coord_origin": "TOPLEFT"}, "confidence": 0.9562516808509827, "cells": [{"id": 187, "text": "Impact of Document Split in Train and Test Set", "bbox": {"l": 317.95496, "t": 429.3949, "r": 549.8606, "b": 439.70398, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Impact of Document Split in Train and Test Set"}, {"label": "text", "id": 3, "page_no": 6, "cluster": {"id": 3, "label": "text", "bbox": {"l": 317.62299, "t": 444.59653, "r": 559.71381, "b": 595.43718, "coord_origin": "TOPLEFT"}, "confidence": 0.9869834184646606, "cells": [{"id": 188, "text": "Many documents in DocLayNet have a unique styling. In order", "bbox": {"l": 317.95499, "t": 444.59653, "r": 558.36884, "b": 452.97116, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "to avoid overfitting on a particular style, we have split the train-,", "bbox": {"l": 317.95499, "t": 455.55554, "r": 559.19189, "b": 463.93018, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "test- and validation-sets of DocLayNet on document boundaries, i.e.", "bbox": {"l": 317.95499, "t": 466.51453, "r": 559.58185, "b": 474.88916, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "every document contributes pages to only one set. To the best of", "bbox": {"l": 317.95499, "t": 477.47354, "r": 558.20605, "b": 485.84818, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": "our knowledge, this was not considered in PubLayNet or DocBank.", "bbox": {"l": 317.95499, "t": 488.43253, "r": 559.58203, "b": 496.80716, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "To quantify how this affects model performance, we trained and", "bbox": {"l": 317.686, "t": 499.39154, "r": 558.20032, "b": 507.76617, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "evaluated a Mask R-CNN R50 model on a modified dataset version.", "bbox": {"l": 317.95499, "t": 510.35052, "r": 559.5849, "b": 518.72516, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "Here, the train-, test- and validation-sets were obtained by a ran-", "bbox": {"l": 317.95499, "t": 521.30954, "r": 559.71381, "b": 529.68417, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "domised draw over the individual pages. As can be seen in Table 4,", "bbox": {"l": 317.95499, "t": 532.26855, "r": 559.18707, "b": 540.64317, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "the difference in model performance is surprisingly large: page-", "bbox": {"l": 317.95499, "t": 543.22655, "r": 559.71313, "b": 551.60117, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "wise splitting gains", "bbox": {"l": 317.62299, "t": 554.18555, "r": 388.35168, "b": 562.56017, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "\u02dc", "bbox": {"l": 391.36499, "t": 552.50055, "r": 393.98318, "b": 560.87517, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "10% in mAP over the document-wise splitting.", "bbox": {"l": 390.59, "t": 554.18555, "r": 559.58191, "b": 562.56017, "coord_origin": "TOPLEFT"}}, {"id": 201, "text": "Thus, random page-wise splitting of DocLayNet can easily lead", "bbox": {"l": 317.686, "t": 565.14455, "r": 558.20032, "b": 573.51917, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": "to accidental overestimation of model performance and should be", "bbox": {"l": 317.95499, "t": 576.10356, "r": 558.20508, "b": 584.4781800000001, "coord_origin": "TOPLEFT"}}, {"id": 203, "text": "avoided.", "bbox": {"l": 317.95499, "t": 587.06256, "r": 348.50354, "b": 595.43718, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Many documents in DocLayNet have a unique styling. In order to avoid overfitting on a particular style, we have split the train-, test- and validation-sets of DocLayNet on document boundaries, i.e. every document contributes pages to only one set. To the best of our knowledge, this was not considered in PubLayNet or DocBank. To quantify how this affects model performance, we trained and evaluated a Mask R-CNN R50 model on a modified dataset version. Here, the train-, test- and validation-sets were obtained by a randomised draw over the individual pages. As can be seen in Table 4, the difference in model performance is surprisingly large: pagewise splitting gains \u02dc 10% in mAP over the document-wise splitting. Thus, random page-wise splitting of DocLayNet can easily lead to accidental overestimation of model performance and should be avoided."}, {"label": "section_header", "id": 7, "page_no": 6, "cluster": {"id": 7, "label": "section_header", "bbox": {"l": 317.95499, "t": 608.34192, "r": 418.54776, "b": 618.65102, "coord_origin": "TOPLEFT"}, "confidence": 0.9589217305183411, "cells": [{"id": 204, "text": "Dataset Comparison", "bbox": {"l": 317.95499, "t": 608.34192, "r": 418.54776, "b": 618.65102, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Dataset Comparison"}, {"label": "text", "id": 2, "page_no": 6, "cluster": {"id": 2, "label": "text", "bbox": {"l": 317.686, "t": 623.54355, "r": 559.18817, "b": 708.640137, "coord_origin": "TOPLEFT"}, "confidence": 0.9872549772262573, "cells": [{"id": 205, "text": "Throughout this paper, we claim that DocLayNet\u2019s wider variety of", "bbox": {"l": 317.686, "t": 623.54355, "r": 558.20575, "b": 631.91817, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": "document layouts leads to more robust layout detection models. In", "bbox": {"l": 317.95499, "t": 634.50255, "r": 558.20624, "b": 642.87717, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": "Table 5, we provide evidence for that. We trained models on each", "bbox": {"l": 317.686, "t": 645.46155, "r": 558.20319, "b": 653.83617, "coord_origin": "TOPLEFT"}}, {"id": 208, "text": "of the available datasets (PubLayNet, DocBank and DocLayNet)", "bbox": {"l": 317.95499, "t": 656.42055, "r": 558.74377, "b": 664.79517, "coord_origin": "TOPLEFT"}}, {"id": 209, "text": "and evaluated them on the test sets of the other datasets. Due to", "bbox": {"l": 317.95499, "t": 667.37955, "r": 558.20398, "b": 675.7541699999999, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": "the different label sets and annotation styles, a direct comparison", "bbox": {"l": 317.95499, "t": 678.3385499999999, "r": 558.20062, "b": 686.71317, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "is not possible. Hence, we focussed on the common labels among", "bbox": {"l": 317.95499, "t": 689.29755, "r": 558.20343, "b": 697.672173, "coord_origin": "TOPLEFT"}}, {"id": 212, "text": "the datasets. Between PubLayNet and DocLayNet, these are", "bbox": {"l": 317.95499, "t": 700.256554, "r": 531.07666, "b": 708.631172, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "Picture", "bbox": {"l": 533.16199, "t": 700.301384, "r": 557.2561, "b": 708.640137, "coord_origin": "TOPLEFT"}}, {"id": 214, "text": ",", "bbox": {"l": 557.255, "t": 700.256554, "r": 559.18817, "b": 708.631172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Throughout this paper, we claim that DocLayNet\u2019s wider variety of document layouts leads to more robust layout detection models. In Table 5, we provide evidence for that. We trained models on each of the available datasets (PubLayNet, DocBank and DocLayNet) and evaluated them on the test sets of the other datasets. Due to the different label sets and annotation styles, a direct comparison is not possible. Hence, we focussed on the common labels among the datasets. Between PubLayNet and DocLayNet, these are Picture ,"}], "body": [{"label": "text", "id": 14, "page_no": 6, "cluster": {"id": 14, "label": "text", "bbox": {"l": 53.501999, "t": 86.87292000000002, "r": 295.64865, "b": 128.22313999999994, "coord_origin": "TOPLEFT"}, "confidence": 0.8296934366226196, "cells": [{"id": 2, "text": "Table 3: Performance of a Mask R-CNN R50 network in", "bbox": {"l": 53.501999, "t": 86.87292000000002, "r": 294.0437, "b": 95.34618999999998, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "mAP@0.5-0.95 scores trained on DocLayNet with different", "bbox": {"l": 53.79800000000001, "t": 97.83191, "r": 294.04376, "b": 106.30517999999995, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "class label sets. The reduced label sets were obtained by ei-", "bbox": {"l": 53.79800000000001, "t": 108.79088999999999, "r": 295.64865, "b": 117.26415999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "ther down-mapping or dropping labels.", "bbox": {"l": 53.79800000000001, "t": 119.74987999999996, "r": 213.23856, "b": 128.22313999999994, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 3: Performance of a Mask R-CNN R50 network in mAP@0.5-0.95 scores trained on DocLayNet with different class label sets. The reduced label sets were obtained by either down-mapping or dropping labels."}, {"label": "table", "id": 4, "page_no": 6, "cluster": {"id": 4, "label": "table", "bbox": {"l": 80.35525512695312, "t": 150.93629455566406, "r": 267.0082092285156, "b": 295.4454650878906, "coord_origin": "TOPLEFT"}, "confidence": 0.9869412779808044, "cells": [{"id": 6, "text": "Class-count", "bbox": {"l": 86.372002, "t": 153.10051999999996, "r": 129.46452, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "11", "bbox": {"l": 151.07401, "t": 153.10051999999996, "r": 159.41275, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "6", "bbox": {"l": 179.31816, "t": 153.10051999999996, "r": 183.48753, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "5", "bbox": {"l": 213.33669, "t": 153.10051999999996, "r": 217.50606, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "4", "bbox": {"l": 247.35521, "t": 153.10051999999996, "r": 251.52458, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Caption", "bbox": {"l": 86.372002, "t": 164.45752000000005, "r": 115.55763, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "68", "bbox": {"l": 151.07401, "t": 164.45752000000005, "r": 159.41275, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Text", "bbox": {"l": 173.42723, "t": 164.45752000000005, "r": 189.38742, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Text", "bbox": {"l": 207.44576, "t": 164.45752000000005, "r": 223.40594000000002, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Text", "bbox": {"l": 241.46428, "t": 164.45752000000005, "r": 257.42447, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Footnote", "bbox": {"l": 86.372002, "t": 175.41656, "r": 118.8752, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "71", "bbox": {"l": 151.07401, "t": 175.41656, "r": 159.41275, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Text", "bbox": {"l": 173.42723, "t": 175.41656, "r": 189.38742, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Text", "bbox": {"l": 207.44576, "t": 175.41656, "r": 223.40594000000002, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Text", "bbox": {"l": 241.46428, "t": 175.41656, "r": 257.42447, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Formula", "bbox": {"l": 86.372002, "t": 186.37554999999998, "r": 116.88466, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "60", "bbox": {"l": 151.07401, "t": 186.37554999999998, "r": 159.41275, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Text", "bbox": {"l": 173.42723, "t": 186.37554999999998, "r": 189.38742, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "Text", "bbox": {"l": 207.44576, "t": 186.37554999999998, "r": 223.40594000000002, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "Text", "bbox": {"l": 241.46428, "t": 186.37554999999998, "r": 257.42447, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "List-item", "bbox": {"l": 86.372002, "t": 197.33452999999997, "r": 119.25179, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "81", "bbox": {"l": 151.07401, "t": 197.33452999999997, "r": 159.41275, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Text", "bbox": {"l": 173.42723, "t": 197.33452999999997, "r": 189.38742, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "82", "bbox": {"l": 211.25647, "t": 197.33452999999997, "r": 219.59521, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Text", "bbox": {"l": 241.46426, "t": 197.33452999999997, "r": 257.42447, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Page-footer", "bbox": {"l": 86.372002, "t": 208.29351999999994, "r": 128.89964, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "62", "bbox": {"l": 151.07401, "t": 208.29351999999994, "r": 159.41275, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "62", "bbox": {"l": 177.23795, "t": 208.29351999999994, "r": 185.57669, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "-", "bbox": {"l": 213.91052, "t": 208.29351999999994, "r": 216.94116, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "-", "bbox": {"l": 247.92905000000002, "t": 208.29351999999994, "r": 250.95969, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Page-header", "bbox": {"l": 86.372002, "t": 219.25256000000002, "r": 131.65231, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "72", "bbox": {"l": 151.07401, "t": 219.25256000000002, "r": 159.41275, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "68", "bbox": {"l": 177.23795, "t": 219.25256000000002, "r": 185.57669, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "-", "bbox": {"l": 213.91052, "t": 219.25256000000002, "r": 216.94116, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "-", "bbox": {"l": 247.92905000000002, "t": 219.25256000000002, "r": 250.95969, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Picture", "bbox": {"l": 86.372002, "t": 230.21155, "r": 112.35663, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "72", "bbox": {"l": 151.07401, "t": 230.21155, "r": 159.41275, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "72", "bbox": {"l": 177.23795, "t": 230.21155, "r": 185.57669, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "72", "bbox": {"l": 211.25645, "t": 230.21155, "r": 219.5952, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "72", "bbox": {"l": 245.27496, "t": 230.21155, "r": 253.61371, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "Section-header", "bbox": {"l": 86.372002, "t": 241.16956000000005, "r": 141.11188, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "68", "bbox": {"l": 151.07401, "t": 241.16956000000005, "r": 159.41275, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "67", "bbox": {"l": 177.23795, "t": 241.16956000000005, "r": 185.57669, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "69", "bbox": {"l": 211.25645, "t": 241.16956000000005, "r": 219.5952, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "68", "bbox": {"l": 245.27496, "t": 241.16956000000005, "r": 253.61371, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Table", "bbox": {"l": 86.372002, "t": 252.12854000000004, "r": 106.17878, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "82", "bbox": {"l": 151.07401, "t": 252.12854000000004, "r": 159.41275, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "83", "bbox": {"l": 177.23795, "t": 252.12854000000004, "r": 185.57669, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "82", "bbox": {"l": 211.25645, "t": 252.12854000000004, "r": 219.5952, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "82", "bbox": {"l": 245.27496, "t": 252.12854000000004, "r": 253.61371, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Text", "bbox": {"l": 86.372002, "t": 263.08752000000004, "r": 102.3322, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "85", "bbox": {"l": 151.07401, "t": 263.08752000000004, "r": 159.41275, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "84", "bbox": {"l": 177.23795, "t": 263.08752000000004, "r": 185.57669, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "84", "bbox": {"l": 211.25645, "t": 263.08752000000004, "r": 219.5952, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "84", "bbox": {"l": 245.27496, "t": 263.08752000000004, "r": 253.61371, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "Title", "bbox": {"l": 86.372002, "t": 274.04657, "r": 103.36333, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "77", "bbox": {"l": 151.07401, "t": 274.04657, "r": 159.41275, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "Sec.-h.", "bbox": {"l": 169.37442, "t": 274.04657, "r": 193.43127, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "Sec.-h.", "bbox": {"l": 203.39294, "t": 274.04657, "r": 227.4498, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "Sec.-h.", "bbox": {"l": 237.41147, "t": 274.04657, "r": 261.46832, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "Overall", "bbox": {"l": 86.372002, "t": 285.40454, "r": 113.31602000000001, "b": 293.77917, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "72", "bbox": {"l": 151.07401, "t": 285.40454, "r": 159.41275, "b": 293.77917, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "73", "bbox": {"l": 177.23795, "t": 285.40454, "r": 185.57669, "b": 293.77917, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "78", "bbox": {"l": 211.25645, "t": 285.40454, "r": 219.5952, "b": 293.77917, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "77", "bbox": {"l": 245.27496, "t": 285.40454, "r": 253.61371, "b": 293.77917, "coord_origin": "TOPLEFT"}}], "children": [{"id": 15, "label": "text", "bbox": {"l": 86.372002, "t": 153.10051999999996, "r": 129.46452, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": "Class-count", "bbox": {"l": 86.372002, "t": 153.10051999999996, "r": 129.46452, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 151.07401, "t": 153.10051999999996, "r": 159.41275, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "11", "bbox": {"l": 151.07401, "t": 153.10051999999996, "r": 159.41275, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 179.31816, "t": 153.10051999999996, "r": 183.48753, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "6", "bbox": {"l": 179.31816, "t": 153.10051999999996, "r": 183.48753, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 213.33669, "t": 153.10051999999996, "r": 217.50606, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "5", "bbox": {"l": 213.33669, "t": 153.10051999999996, "r": 217.50606, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 247.35521, "t": 153.10051999999996, "r": 251.52458, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "4", "bbox": {"l": 247.35521, "t": 153.10051999999996, "r": 251.52458, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 86.372002, "t": 164.45752000000005, "r": 115.55763, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "Caption", "bbox": {"l": 86.372002, "t": 164.45752000000005, "r": 115.55763, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 151.07401, "t": 164.45752000000005, "r": 159.41275, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "68", "bbox": {"l": 151.07401, "t": 164.45752000000005, "r": 159.41275, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 173.42723, "t": 164.45752000000005, "r": 189.38742, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "Text", "bbox": {"l": 173.42723, "t": 164.45752000000005, "r": 189.38742, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 207.44576, "t": 164.45752000000005, "r": 223.40594000000002, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "Text", "bbox": {"l": 207.44576, "t": 164.45752000000005, "r": 223.40594000000002, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 241.46428, "t": 164.45752000000005, "r": 257.42447, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "Text", "bbox": {"l": 241.46428, "t": 164.45752000000005, "r": 257.42447, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 86.372002, "t": 175.41656, "r": 118.8752, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "Footnote", "bbox": {"l": 86.372002, "t": 175.41656, "r": 118.8752, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 151.07401, "t": 175.41656, "r": 159.41275, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "71", "bbox": {"l": 151.07401, "t": 175.41656, "r": 159.41275, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 173.42723, "t": 175.41656, "r": 189.38742, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "Text", "bbox": {"l": 173.42723, "t": 175.41656, "r": 189.38742, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 207.44576, "t": 175.41656, "r": 223.40594000000002, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "Text", "bbox": {"l": 207.44576, "t": 175.41656, "r": 223.40594000000002, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 241.46428, "t": 175.41656, "r": 257.42447, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "Text", "bbox": {"l": 241.46428, "t": 175.41656, "r": 257.42447, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 86.372002, "t": 186.37554999999998, "r": 116.88466, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "Formula", "bbox": {"l": 86.372002, "t": 186.37554999999998, "r": 116.88466, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 151.07401, "t": 186.37554999999998, "r": 159.41275, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "60", "bbox": {"l": 151.07401, "t": 186.37554999999998, "r": 159.41275, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 173.42723, "t": 186.37554999999998, "r": 189.38742, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "Text", "bbox": {"l": 173.42723, "t": 186.37554999999998, "r": 189.38742, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 207.44576, "t": 186.37554999999998, "r": 223.40594000000002, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "Text", "bbox": {"l": 207.44576, "t": 186.37554999999998, "r": 223.40594000000002, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 241.46428, "t": 186.37554999999998, "r": 257.42447, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "Text", "bbox": {"l": 241.46428, "t": 186.37554999999998, "r": 257.42447, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 86.372002, "t": 197.33452999999997, "r": 119.25179, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "List-item", "bbox": {"l": 86.372002, "t": 197.33452999999997, "r": 119.25179, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 151.07401, "t": 197.33452999999997, "r": 159.41275, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "81", "bbox": {"l": 151.07401, "t": 197.33452999999997, "r": 159.41275, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 173.42723, "t": 197.33452999999997, "r": 189.38742, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "Text", "bbox": {"l": 173.42723, "t": 197.33452999999997, "r": 189.38742, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 211.25647, "t": 197.33452999999997, "r": 219.59521, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "82", "bbox": {"l": 211.25647, "t": 197.33452999999997, "r": 219.59521, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 241.46426, "t": 197.33452999999997, "r": 257.42447, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "Text", "bbox": {"l": 241.46426, "t": 197.33452999999997, "r": 257.42447, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 86.372002, "t": 208.29351999999994, "r": 128.89964, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "Page-footer", "bbox": {"l": 86.372002, "t": 208.29351999999994, "r": 128.89964, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 151.07401, "t": 208.29351999999994, "r": 159.41275, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "62", "bbox": {"l": 151.07401, "t": 208.29351999999994, "r": 159.41275, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 177.23795, "t": 208.29351999999994, "r": 185.57669, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "62", "bbox": {"l": 177.23795, "t": 208.29351999999994, "r": 185.57669, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 213.91052, "t": 208.29351999999994, "r": 216.94116, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "-", "bbox": {"l": 213.91052, "t": 208.29351999999994, "r": 216.94116, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 247.92905000000002, "t": 208.29351999999994, "r": 250.95969, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "-", "bbox": {"l": 247.92905000000002, "t": 208.29351999999994, "r": 250.95969, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 86.372002, "t": 219.25256000000002, "r": 131.65231, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "Page-header", "bbox": {"l": 86.372002, "t": 219.25256000000002, "r": 131.65231, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 151.07401, "t": 219.25256000000002, "r": 159.41275, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "72", "bbox": {"l": 151.07401, "t": 219.25256000000002, "r": 159.41275, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 177.23795, "t": 219.25256000000002, "r": 185.57669, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "68", "bbox": {"l": 177.23795, "t": 219.25256000000002, "r": 185.57669, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 213.91052, "t": 219.25256000000002, "r": 216.94116, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "-", "bbox": {"l": 213.91052, "t": 219.25256000000002, "r": 216.94116, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 247.92905000000002, "t": 219.25256000000002, "r": 250.95969, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "-", "bbox": {"l": 247.92905000000002, "t": 219.25256000000002, "r": 250.95969, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 86.372002, "t": 230.21155, "r": 112.35663, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "Picture", "bbox": {"l": 86.372002, "t": 230.21155, "r": 112.35663, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 151.07401, "t": 230.21155, "r": 159.41275, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "72", "bbox": {"l": 151.07401, "t": 230.21155, "r": 159.41275, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 177.23795, "t": 230.21155, "r": 185.57669, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "72", "bbox": {"l": 177.23795, "t": 230.21155, "r": 185.57669, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 211.25645, "t": 230.21155, "r": 219.5952, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "72", "bbox": {"l": 211.25645, "t": 230.21155, "r": 219.5952, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 245.27496, "t": 230.21155, "r": 253.61371, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "72", "bbox": {"l": 245.27496, "t": 230.21155, "r": 253.61371, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 86.372002, "t": 241.16956000000005, "r": 141.11188, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "Section-header", "bbox": {"l": 86.372002, "t": 241.16956000000005, "r": 141.11188, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 151.07401, "t": 241.16956000000005, "r": 159.41275, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "68", "bbox": {"l": 151.07401, "t": 241.16956000000005, "r": 159.41275, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 177.23795, "t": 241.16956000000005, "r": 185.57669, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "67", "bbox": {"l": 177.23795, "t": 241.16956000000005, "r": 185.57669, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 211.25645, "t": 241.16956000000005, "r": 219.5952, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "69", "bbox": {"l": 211.25645, "t": 241.16956000000005, "r": 219.5952, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 245.27496, "t": 241.16956000000005, "r": 253.61371, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "68", "bbox": {"l": 245.27496, "t": 241.16956000000005, "r": 253.61371, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 86.372002, "t": 252.12854000000004, "r": 106.17878, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "Table", "bbox": {"l": 86.372002, "t": 252.12854000000004, "r": 106.17878, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 151.07401, "t": 252.12854000000004, "r": 159.41275, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "82", "bbox": {"l": 151.07401, "t": 252.12854000000004, "r": 159.41275, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 177.23795, "t": 252.12854000000004, "r": 185.57669, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "83", "bbox": {"l": 177.23795, "t": 252.12854000000004, "r": 185.57669, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 211.25645, "t": 252.12854000000004, "r": 219.5952, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "82", "bbox": {"l": 211.25645, "t": 252.12854000000004, "r": 219.5952, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 245.27496, "t": 252.12854000000004, "r": 253.61371, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "82", "bbox": {"l": 245.27496, "t": 252.12854000000004, "r": 253.61371, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 86.372002, "t": 263.08752000000004, "r": 102.3322, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "Text", "bbox": {"l": 86.372002, "t": 263.08752000000004, "r": 102.3322, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 151.07401, "t": 263.08752000000004, "r": 159.41275, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "85", "bbox": {"l": 151.07401, "t": 263.08752000000004, "r": 159.41275, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 177.23795, "t": 263.08752000000004, "r": 185.57669, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "84", "bbox": {"l": 177.23795, "t": 263.08752000000004, "r": 185.57669, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 211.25645, "t": 263.08752000000004, "r": 219.5952, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "84", "bbox": {"l": 211.25645, "t": 263.08752000000004, "r": 219.5952, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 245.27496, "t": 263.08752000000004, "r": 253.61371, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "84", "bbox": {"l": 245.27496, "t": 263.08752000000004, "r": 253.61371, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 86.372002, "t": 274.04657, "r": 103.36333, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "Title", "bbox": {"l": 86.372002, "t": 274.04657, "r": 103.36333, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 151.07401, "t": 274.04657, "r": 159.41275, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "77", "bbox": {"l": 151.07401, "t": 274.04657, "r": 159.41275, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 169.37442, "t": 274.04657, "r": 193.43127, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "Sec.-h.", "bbox": {"l": 169.37442, "t": 274.04657, "r": 193.43127, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 203.39294, "t": 274.04657, "r": 227.4498, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "Sec.-h.", "bbox": {"l": 203.39294, "t": 274.04657, "r": 227.4498, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 237.41147, "t": 274.04657, "r": 261.46832, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "Sec.-h.", "bbox": {"l": 237.41147, "t": 274.04657, "r": 261.46832, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 86.372002, "t": 285.40454, "r": 113.31602000000001, "b": 293.77917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "Overall", "bbox": {"l": 86.372002, "t": 285.40454, "r": 113.31602000000001, "b": 293.77917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 151.07401, "t": 285.40454, "r": 159.41275, "b": 293.77917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "72", "bbox": {"l": 151.07401, "t": 285.40454, "r": 159.41275, "b": 293.77917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 177.23795, "t": 285.40454, "r": 185.57669, "b": 293.77917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "73", "bbox": {"l": 177.23795, "t": 285.40454, "r": 185.57669, "b": 293.77917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 211.25645, "t": 285.40454, "r": 219.5952, "b": 293.77917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "78", "bbox": {"l": 211.25645, "t": 285.40454, "r": 219.5952, "b": 293.77917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 245.27496, "t": 285.40454, "r": 253.61371, "b": 293.77917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "77", "bbox": {"l": 245.27496, "t": 285.40454, "r": 253.61371, "b": 293.77917, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 13, "num_cols": 5, "table_cells": [{"bbox": {"l": 86.372002, "t": 153.10051999999996, "r": 129.46452, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Class-count", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 151.07401, "t": 153.10051999999996, "r": 159.41275, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "11", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 179.31816, "t": 153.10051999999996, "r": 183.48753, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "6", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 213.33669, "t": 153.10051999999996, "r": 217.50606, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "5", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 247.35521, "t": 153.10051999999996, "r": 251.52458, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "4", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 164.45752000000005, "r": 115.55763, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Caption", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 164.45752000000005, "r": 159.41275, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 173.42723, "t": 164.45752000000005, "r": 189.38742, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 207.44576, "t": 164.45752000000005, "r": 223.40594000000002, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 241.46428, "t": 164.45752000000005, "r": 257.42447, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 175.41656, "r": 118.8752, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Footnote", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 175.41656, "r": 159.41275, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "71", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 173.42723, "t": 175.41656, "r": 189.38742, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 207.44576, "t": 175.41656, "r": 223.40594000000002, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 241.46428, "t": 175.41656, "r": 257.42447, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 186.37554999999998, "r": 116.88466, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Formula", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 186.37554999999998, "r": 159.41275, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "60", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 173.42723, "t": 186.37554999999998, "r": 189.38742, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 207.44576, "t": 186.37554999999998, "r": 223.40594000000002, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 241.46428, "t": 186.37554999999998, "r": 257.42447, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 197.33452999999997, "r": 119.25179, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "List-item", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 197.33452999999997, "r": 159.41275, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 173.42723, "t": 197.33452999999997, "r": 189.38742, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 211.25647, "t": 197.33452999999997, "r": 219.59521, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 241.46426, "t": 197.33452999999997, "r": 257.42447, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 208.29351999999994, "r": 128.89964, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-footer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 208.29351999999994, "r": 159.41275, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "62", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23795, "t": 208.29351999999994, "r": 185.57669, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "62", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 213.91052, "t": 208.29351999999994, "r": 216.94116, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 247.92905000000002, "t": 208.29351999999994, "r": 250.95969, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 219.25256000000002, "r": 131.65231, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 219.25256000000002, "r": 159.41275, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23795, "t": 219.25256000000002, "r": 185.57669, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 213.91052, "t": 219.25256000000002, "r": 216.94116, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 247.92905000000002, "t": 219.25256000000002, "r": 250.95969, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 230.21155, "r": 112.35663, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Picture", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 230.21155, "r": 159.41275, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23795, "t": 230.21155, "r": 185.57669, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 211.25645, "t": 230.21155, "r": 219.5952, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.27496, "t": 230.21155, "r": 253.61371, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 241.16956000000005, "r": 141.11188, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Section-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 241.16956000000005, "r": 159.41275, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23795, "t": 241.16956000000005, "r": 185.57669, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "67", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 211.25645, "t": 241.16956000000005, "r": 219.5952, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "69", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.27496, "t": 241.16956000000005, "r": 253.61371, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 252.12854000000004, "r": 106.17878, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 252.12854000000004, "r": 159.41275, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23795, "t": 252.12854000000004, "r": 185.57669, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 211.25645, "t": 252.12854000000004, "r": 219.5952, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.27496, "t": 252.12854000000004, "r": 253.61371, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 263.08752000000004, "r": 102.3322, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Text", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 263.08752000000004, "r": 159.41275, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23795, "t": 263.08752000000004, "r": 185.57669, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 211.25645, "t": 263.08752000000004, "r": 219.5952, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.27496, "t": 263.08752000000004, "r": 253.61371, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 274.04657, "r": 103.36333, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Title", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 274.04657, "r": 159.41275, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 169.37442, "t": 274.04657, "r": 193.43127, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Sec.-h.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 203.39294, "t": 274.04657, "r": 227.4498, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Sec.-h.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 237.41147, "t": 274.04657, "r": 261.46832, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Sec.-h.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 285.40454, "r": 113.31602000000001, "b": 293.77917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Overall", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 285.40454, "r": 159.41275, "b": 293.77917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23795, "t": 285.40454, "r": 185.57669, "b": 293.77917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "73", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 211.25645, "t": 285.40454, "r": 219.5952, "b": 293.77917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "78", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.27496, "t": 285.40454, "r": 253.61371, "b": 293.77917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "77", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "section_header", "id": 10, "page_no": 6, "cluster": {"id": 10, "label": "section_header", "bbox": {"l": 53.79800000000001, "t": 319.56992, "r": 131.05624, "b": 329.879, "coord_origin": "TOPLEFT"}, "confidence": 0.9555686116218567, "cells": [{"id": 71, "text": "Learning Curve", "bbox": {"l": 53.79800000000001, "t": 319.56992, "r": 131.05624, "b": 329.879, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Learning Curve"}, {"label": "text", "id": 5, "page_no": 6, "cluster": {"id": 5, "label": "text", "bbox": {"l": 52.785, "t": 334.77155, "r": 295.55835, "b": 529.44818, "coord_origin": "TOPLEFT"}, "confidence": 0.9857739210128784, "cells": [{"id": 72, "text": "One of the fundamental questions related to any dataset is if it is", "bbox": {"l": 53.79800000000001, "t": 334.77155, "r": 294.04153, "b": 343.14618, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "\u201clarge enough\u201d. To answer this question for DocLayNet, we per-", "bbox": {"l": 52.785, "t": 345.73053, "r": 295.55835, "b": 354.10516000000007, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "formed a data ablation study in which we evaluated a Mask R-CNN", "bbox": {"l": 53.79800000000001, "t": 356.6895400000001, "r": 294.04535, "b": 365.06418, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "model trained on increasing fractions of the DocLayNet dataset.", "bbox": {"l": 53.79800000000001, "t": 367.64853, "r": 295.4281, "b": 376.02316, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "As can be seen in Figure 5, the mAP score rises sharply in the be-", "bbox": {"l": 53.484001, "t": 378.60754, "r": 295.55667, "b": 386.98218, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "ginning and eventually levels out. To estimate the error-bar on the", "bbox": {"l": 53.79800000000001, "t": 389.56653, "r": 294.04865, "b": 397.94116, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "metrics, we ran the training five times on the entire data-set. This", "bbox": {"l": 53.79800000000001, "t": 400.52554000000003, "r": 294.04376, "b": 408.90018, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "resulted in a 1% error-bar, depicted by the shaded area in Figure 5.", "bbox": {"l": 53.79800000000001, "t": 411.48456, "r": 295.42459, "b": 419.85919, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "In the inset of Figure 5, we show the exact same data-points, but", "bbox": {"l": 53.79800000000001, "t": 422.44354, "r": 294.04709, "b": 430.81818, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "with a logarithmic scale on the x-axis. As is expected, the mAP", "bbox": {"l": 53.466999, "t": 433.40253000000007, "r": 294.04535, "b": 441.7771599999999, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "score increases linearly as a function of the data-size in the inset.", "bbox": {"l": 53.79800000000001, "t": 444.36053000000004, "r": 295.42902, "b": 452.73517, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "The curve ultimately flattens out between the 80% and 100% mark,", "bbox": {"l": 53.528999, "t": 455.31955, "r": 295.03122, "b": 463.69418, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "with the 80% mark falling within the error-bars of the 100% mark.", "bbox": {"l": 53.466999, "t": 466.27853, "r": 295.42154, "b": 474.65317, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "This provides a good indication that the model would not improve", "bbox": {"l": 53.528999, "t": 477.23755, "r": 294.04553, "b": 485.61218, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "significantly by yet increasing the data size. Rather, it would prob-", "bbox": {"l": 53.79800000000001, "t": 488.19653, "r": 295.55646, "b": 496.57117, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "ably benefit more from improved data consistency (as discussed", "bbox": {"l": 53.79800000000001, "t": 499.15555, "r": 294.04715, "b": 507.53018, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "in Section 3), data augmentation methods [23], or the addition of", "bbox": {"l": 53.79800000000001, "t": 510.11453, "r": 294.04245, "b": 518.4891700000001, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "more document categories and styles.", "bbox": {"l": 53.79800000000001, "t": 521.0735500000001, "r": 191.47707, "b": 529.44818, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "One of the fundamental questions related to any dataset is if it is \u201clarge enough\u201d. To answer this question for DocLayNet, we performed a data ablation study in which we evaluated a Mask R-CNN model trained on increasing fractions of the DocLayNet dataset. As can be seen in Figure 5, the mAP score rises sharply in the beginning and eventually levels out. To estimate the error-bar on the metrics, we ran the training five times on the entire data-set. This resulted in a 1% error-bar, depicted by the shaded area in Figure 5. In the inset of Figure 5, we show the exact same data-points, but with a logarithmic scale on the x-axis. As is expected, the mAP score increases linearly as a function of the data-size in the inset. The curve ultimately flattens out between the 80% and 100% mark, with the 80% mark falling within the error-bars of the 100% mark. This provides a good indication that the model would not improve significantly by yet increasing the data size. Rather, it would probably benefit more from improved data consistency (as discussed in Section 3), data augmentation methods [23], or the addition of more document categories and styles."}, {"label": "section_header", "id": 8, "page_no": 6, "cluster": {"id": 8, "label": "section_header", "bbox": {"l": 53.79800000000001, "t": 542.50992, "r": 164.32898, "b": 552.81902, "coord_origin": "TOPLEFT"}, "confidence": 0.9572026133537292, "cells": [{"id": 90, "text": "Impact of Class Labels", "bbox": {"l": 53.79800000000001, "t": 542.50992, "r": 164.32898, "b": 552.81902, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Impact of Class Labels"}, {"label": "text", "id": 1, "page_no": 6, "cluster": {"id": 1, "label": "text", "bbox": {"l": 53.466999, "t": 557.71155, "r": 295.55679, "b": 708.55217, "coord_origin": "TOPLEFT"}, "confidence": 0.9876301884651184, "cells": [{"id": 91, "text": "The choice and number of labels can have a significant effect on", "bbox": {"l": 53.528999, "t": 557.71155, "r": 294.04333, "b": 566.08617, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "the overall model performance. Since PubLayNet, DocBank and", "bbox": {"l": 53.79800000000001, "t": 568.6705499999999, "r": 294.04712, "b": 577.04517, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "DocLayNet all have different label sets, it is of particular interest to", "bbox": {"l": 53.79800000000001, "t": 579.62955, "r": 294.04538, "b": 588.0041699999999, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "understand and quantify this influence of the label set on the model", "bbox": {"l": 53.79800000000001, "t": 590.5885499999999, "r": 294.04535, "b": 598.96317, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "performance. We investigate this by either down-mapping labels", "bbox": {"l": 53.79800000000001, "t": 601.54755, "r": 294.04266, "b": 609.92216, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "into more common ones (e.g.", "bbox": {"l": 53.79800000000001, "t": 612.50656, "r": 163.59247, "b": 620.88118, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "Caption", "bbox": {"l": 166.26401, "t": 612.55139, "r": 194.97244, "b": 620.89015, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "\u2192", "bbox": {"l": 194.994, "t": 612.45276, "r": 204.1756, "b": 620.15491, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "Text", "bbox": {"l": 204.17599, "t": 612.55139, "r": 219.33961000000002, "b": 620.89015, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": ") or excluding them", "bbox": {"l": 219.849, "t": 612.50656, "r": 294.04828, "b": 620.88118, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "from the annotations entirely. Furthermore, it must be stressed", "bbox": {"l": 53.79800000000001, "t": 623.46556, "r": 294.04709, "b": 631.84018, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "that all mappings and exclusions were performed on the data be-", "bbox": {"l": 53.79800000000001, "t": 634.42355, "r": 295.55679, "b": 642.79817, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "fore model training. In Table 3, we present the mAP scores for a", "bbox": {"l": 53.79800000000001, "t": 645.38255, "r": 294.04715, "b": 653.75717, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "Mask R-CNN R50 network on different label sets. Where a label", "bbox": {"l": 53.79800000000001, "t": 656.34155, "r": 294.04715, "b": 664.71617, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "is down-mapped, we show its corresponding label, otherwise it", "bbox": {"l": 53.79800000000001, "t": 667.30055, "r": 294.04712, "b": 675.67517, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "was excluded. We present three different label sets, with 6, 5 and 4", "bbox": {"l": 53.466999, "t": 678.25955, "r": 294.25174, "b": 686.63417, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "different labels respectively. The set of 5 labels contains the same", "bbox": {"l": 53.79800000000001, "t": 689.21855, "r": 294.04639, "b": 697.59317, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "labels as PubLayNet. However, due to the different definition of", "bbox": {"l": 53.79800000000001, "t": 700.177551, "r": 294.04712, "b": 708.55217, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The choice and number of labels can have a significant effect on the overall model performance. Since PubLayNet, DocBank and DocLayNet all have different label sets, it is of particular interest to understand and quantify this influence of the label set on the model performance. We investigate this by either down-mapping labels into more common ones (e.g. Caption \u2192 Text ) or excluding them from the annotations entirely. Furthermore, it must be stressed that all mappings and exclusions were performed on the data before model training. In Table 3, we present the mAP scores for a Mask R-CNN R50 network on different label sets. Where a label is down-mapped, we show its corresponding label, otherwise it was excluded. We present three different label sets, with 6, 5 and 4 different labels respectively. The set of 5 labels contains the same labels as PubLayNet. However, due to the different definition of"}, {"label": "text", "id": 13, "page_no": 6, "cluster": {"id": 13, "label": "text", "bbox": {"l": 317.659, "t": 86.87298999999996, "r": 559.80682, "b": 128.22321, "coord_origin": "TOPLEFT"}, "confidence": 0.8736215829849243, "cells": [{"id": 109, "text": "Table 4: Performance of a Mask R-CNN R50 network with", "bbox": {"l": 317.659, "t": 86.87298999999996, "r": 558.20068, "b": 95.34625000000017, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "document-wise and page-wise split for different label sets.", "bbox": {"l": 317.95499, "t": 97.83196999999996, "r": 559.73401, "b": 106.30524000000003, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "Naive page-wise split will result in", "bbox": {"l": 317.95499, "t": 108.79094999999995, "r": 467.72089, "b": 117.26422000000014, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "GLYPH<tildelow>", "bbox": {"l": 471.90900000000005, "t": 107.12798999999995, "r": 477.53900000000004, "b": 115.19768999999997, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "10% point improve-", "bbox": {"l": 477.54001000000005, "t": 108.79094999999995, "r": 559.80682, "b": 117.26422000000014, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "ment.", "bbox": {"l": 317.95502, "t": 119.74993999999992, "r": 341.37524, "b": 128.22321, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 4: Performance of a Mask R-CNN R50 network with document-wise and page-wise split for different label sets. Naive page-wise split will result in GLYPH<tildelow> 10% point improvement."}, {"label": "table", "id": 0, "page_no": 6, "cluster": {"id": 0, "label": "table", "bbox": {"l": 352.97747802734375, "t": 150.791259765625, "r": 522.9158935546875, "b": 306.2658386230469, "coord_origin": "TOPLEFT"}, "confidence": 0.9879696369171143, "cells": [{"id": 115, "text": "Class-count", "bbox": {"l": 358.63901, "t": 153.10051999999996, "r": 401.73154, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "11", "bbox": {"l": 440.22501, "t": 153.10051999999996, "r": 448.56375, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "5", "bbox": {"l": 494.38, "t": 153.10051999999996, "r": 498.54938, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "Split", "bbox": {"l": 358.63901, "t": 164.05951000000005, "r": 375.27167, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "Doc", "bbox": {"l": 423.341, "t": 164.05951000000005, "r": 438.0459, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "Page", "bbox": {"l": 448.00757, "t": 164.05951000000005, "r": 465.4472, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "Doc", "bbox": {"l": 475.41101, "t": 164.05951000000005, "r": 490.11591, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Page", "bbox": {"l": 500.07757999999995, "t": 164.05951000000005, "r": 517.51721, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "Caption", "bbox": {"l": 358.63901, "t": 175.41656, "r": 387.82465, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "68", "bbox": {"l": 426.52399, "t": 175.41656, "r": 434.86273, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "83", "bbox": {"l": 452.56240999999994, "t": 175.41656, "r": 460.90115000000003, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "Footnote", "bbox": {"l": 358.63901, "t": 186.37554999999998, "r": 391.14221, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "71", "bbox": {"l": 426.52399, "t": 186.37554999999998, "r": 434.86273, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "84", "bbox": {"l": 452.56240999999994, "t": 186.37554999999998, "r": 460.90115000000003, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "Formula", "bbox": {"l": 358.63901, "t": 197.33452999999997, "r": 389.15167, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "60", "bbox": {"l": 426.52399, "t": 197.33452999999997, "r": 434.86273, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "66", "bbox": {"l": 452.56240999999994, "t": 197.33452999999997, "r": 460.90115000000003, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "List-item", "bbox": {"l": 358.63901, "t": 208.29351999999994, "r": 391.5188, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "81", "bbox": {"l": 426.52399, "t": 208.29351999999994, "r": 434.86273, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "88", "bbox": {"l": 452.56240999999994, "t": 208.29351999999994, "r": 460.90115000000003, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "82", "bbox": {"l": 478.59399, "t": 208.29351999999994, "r": 486.93274, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "88", "bbox": {"l": 504.6324200000001, "t": 208.29351999999994, "r": 512.97119, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "Page-footer", "bbox": {"l": 358.63901, "t": 219.25256000000002, "r": 401.16666, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "62", "bbox": {"l": 426.52399, "t": 219.25256000000002, "r": 434.86273, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "89", "bbox": {"l": 452.56240999999994, "t": 219.25256000000002, "r": 460.90115000000003, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "Page-header", "bbox": {"l": 358.63901, "t": 230.21155, "r": 403.91931, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "72", "bbox": {"l": 426.52399, "t": 230.21155, "r": 434.86273, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "90", "bbox": {"l": 452.56240999999994, "t": 230.21155, "r": 460.90115000000003, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "Picture", "bbox": {"l": 358.63901, "t": 241.16956000000005, "r": 384.62366, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "72", "bbox": {"l": 426.52399, "t": 241.16956000000005, "r": 434.86273, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "82", "bbox": {"l": 452.56240999999994, "t": 241.16956000000005, "r": 460.90115000000003, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "72", "bbox": {"l": 478.59399, "t": 241.16956000000005, "r": 486.93274, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "82", "bbox": {"l": 504.6324200000001, "t": 241.16956000000005, "r": 512.97119, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "Section-header", "bbox": {"l": 358.63901, "t": 252.12854000000004, "r": 413.37891, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "68", "bbox": {"l": 426.52399, "t": 252.12854000000004, "r": 434.86273, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "83", "bbox": {"l": 452.56240999999994, "t": 252.12854000000004, "r": 460.90115000000003, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "69", "bbox": {"l": 478.59399, "t": 252.12854000000004, "r": 486.93274, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "83", "bbox": {"l": 504.6324200000001, "t": 252.12854000000004, "r": 512.97119, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "Table", "bbox": {"l": 358.63901, "t": 263.08752000000004, "r": 378.44577, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "82", "bbox": {"l": 426.52399, "t": 263.08752000000004, "r": 434.86273, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "89", "bbox": {"l": 452.56240999999994, "t": 263.08752000000004, "r": 460.90115000000003, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "82", "bbox": {"l": 478.59399, "t": 263.08752000000004, "r": 486.93274, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "90", "bbox": {"l": 504.6324200000001, "t": 263.08752000000004, "r": 512.97119, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "Text", "bbox": {"l": 358.63901, "t": 274.04657, "r": 374.59921, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "85", "bbox": {"l": 426.52399, "t": 274.04657, "r": 434.86273, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "91", "bbox": {"l": 452.56240999999994, "t": 274.04657, "r": 460.90115000000003, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "84", "bbox": {"l": 478.59399, "t": 274.04657, "r": 486.93274, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "90", "bbox": {"l": 504.6324200000001, "t": 274.04657, "r": 512.97119, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "Title", "bbox": {"l": 358.63901, "t": 285.00552, "r": 375.63034, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "77", "bbox": {"l": 426.52399, "t": 285.00552, "r": 434.86273, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "81", "bbox": {"l": 452.56240999999994, "t": 285.00552, "r": 460.90115000000003, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "All", "bbox": {"l": 358.63901, "t": 296.36255, "r": 369.60492, "b": 304.73718, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "72", "bbox": {"l": 426.52399, "t": 296.36255, "r": 434.86273, "b": 304.73718, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "84", "bbox": {"l": 452.56240999999994, "t": 296.36255, "r": 460.90115000000003, "b": 304.73718, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "78", "bbox": {"l": 478.59399, "t": 296.36255, "r": 486.93274, "b": 304.73718, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "87", "bbox": {"l": 504.6324200000001, "t": 296.36255, "r": 512.97119, "b": 304.73718, "coord_origin": "TOPLEFT"}}], "children": [{"id": 80, "label": "text", "bbox": {"l": 358.63901, "t": 153.10051999999996, "r": 401.73154, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 115, "text": "Class-count", "bbox": {"l": 358.63901, "t": 153.10051999999996, "r": 401.73154, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 440.22501, "t": 153.10051999999996, "r": 448.56375, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 116, "text": "11", "bbox": {"l": 440.22501, "t": 153.10051999999996, "r": 448.56375, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 494.38, "t": 153.10051999999996, "r": 498.54938, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 117, "text": "5", "bbox": {"l": 494.38, "t": 153.10051999999996, "r": 498.54938, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 358.63901, "t": 164.05951000000005, "r": 375.27167, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 118, "text": "Split", "bbox": {"l": 358.63901, "t": 164.05951000000005, "r": 375.27167, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 423.341, "t": 164.05951000000005, "r": 438.0459, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 119, "text": "Doc", "bbox": {"l": 423.341, "t": 164.05951000000005, "r": 438.0459, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 448.00757, "t": 164.05951000000005, "r": 465.4472, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 120, "text": "Page", "bbox": {"l": 448.00757, "t": 164.05951000000005, "r": 465.4472, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 475.41101, "t": 164.05951000000005, "r": 490.11591, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 121, "text": "Doc", "bbox": {"l": 475.41101, "t": 164.05951000000005, "r": 490.11591, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 500.07757999999995, "t": 164.05951000000005, "r": 517.51721, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 122, "text": "Page", "bbox": {"l": 500.07757999999995, "t": 164.05951000000005, "r": 517.51721, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 358.63901, "t": 175.41656, "r": 387.82465, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 123, "text": "Caption", "bbox": {"l": 358.63901, "t": 175.41656, "r": 387.82465, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 426.52399, "t": 175.41656, "r": 434.86273, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 124, "text": "68", "bbox": {"l": 426.52399, "t": 175.41656, "r": 434.86273, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 452.56240999999994, "t": 175.41656, "r": 460.90115000000003, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 125, "text": "83", "bbox": {"l": 452.56240999999994, "t": 175.41656, "r": 460.90115000000003, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 358.63901, "t": 186.37554999999998, "r": 391.14221, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 126, "text": "Footnote", "bbox": {"l": 358.63901, "t": 186.37554999999998, "r": 391.14221, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 426.52399, "t": 186.37554999999998, "r": 434.86273, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 127, "text": "71", "bbox": {"l": 426.52399, "t": 186.37554999999998, "r": 434.86273, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 452.56240999999994, "t": 186.37554999999998, "r": 460.90115000000003, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 128, "text": "84", "bbox": {"l": 452.56240999999994, "t": 186.37554999999998, "r": 460.90115000000003, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 358.63901, "t": 197.33452999999997, "r": 389.15167, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 129, "text": "Formula", "bbox": {"l": 358.63901, "t": 197.33452999999997, "r": 389.15167, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 426.52399, "t": 197.33452999999997, "r": 434.86273, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 130, "text": "60", "bbox": {"l": 426.52399, "t": 197.33452999999997, "r": 434.86273, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 452.56240999999994, "t": 197.33452999999997, "r": 460.90115000000003, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 131, "text": "66", "bbox": {"l": 452.56240999999994, "t": 197.33452999999997, "r": 460.90115000000003, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 358.63901, "t": 208.29351999999994, "r": 391.5188, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 132, "text": "List-item", "bbox": {"l": 358.63901, "t": 208.29351999999994, "r": 391.5188, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 426.52399, "t": 208.29351999999994, "r": 434.86273, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 133, "text": "81", "bbox": {"l": 426.52399, "t": 208.29351999999994, "r": 434.86273, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 452.56240999999994, "t": 208.29351999999994, "r": 460.90115000000003, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 134, "text": "88", "bbox": {"l": 452.56240999999994, "t": 208.29351999999994, "r": 460.90115000000003, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 478.59399, "t": 208.29351999999994, "r": 486.93274, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 135, "text": "82", "bbox": {"l": 478.59399, "t": 208.29351999999994, "r": 486.93274, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 504.6324200000001, "t": 208.29351999999994, "r": 512.97119, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 136, "text": "88", "bbox": {"l": 504.6324200000001, "t": 208.29351999999994, "r": 512.97119, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 358.63901, "t": 219.25256000000002, "r": 401.16666, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 137, "text": "Page-footer", "bbox": {"l": 358.63901, "t": 219.25256000000002, "r": 401.16666, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 426.52399, "t": 219.25256000000002, "r": 434.86273, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 138, "text": "62", "bbox": {"l": 426.52399, "t": 219.25256000000002, "r": 434.86273, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 452.56240999999994, "t": 219.25256000000002, "r": 460.90115000000003, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 139, "text": "89", "bbox": {"l": 452.56240999999994, "t": 219.25256000000002, "r": 460.90115000000003, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 358.63901, "t": 230.21155, "r": 403.91931, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 140, "text": "Page-header", "bbox": {"l": 358.63901, "t": 230.21155, "r": 403.91931, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 426.52399, "t": 230.21155, "r": 434.86273, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 141, "text": "72", "bbox": {"l": 426.52399, "t": 230.21155, "r": 434.86273, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 452.56240999999994, "t": 230.21155, "r": 460.90115000000003, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 142, "text": "90", "bbox": {"l": 452.56240999999994, "t": 230.21155, "r": 460.90115000000003, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 358.63901, "t": 241.16956000000005, "r": 384.62366, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 143, "text": "Picture", "bbox": {"l": 358.63901, "t": 241.16956000000005, "r": 384.62366, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 426.52399, "t": 241.16956000000005, "r": 434.86273, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 144, "text": "72", "bbox": {"l": 426.52399, "t": 241.16956000000005, "r": 434.86273, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 452.56240999999994, "t": 241.16956000000005, "r": 460.90115000000003, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 145, "text": "82", "bbox": {"l": 452.56240999999994, "t": 241.16956000000005, "r": 460.90115000000003, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 478.59399, "t": 241.16956000000005, "r": 486.93274, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 146, "text": "72", "bbox": {"l": 478.59399, "t": 241.16956000000005, "r": 486.93274, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 504.6324200000001, "t": 241.16956000000005, "r": 512.97119, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 147, "text": "82", "bbox": {"l": 504.6324200000001, "t": 241.16956000000005, "r": 512.97119, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 358.63901, "t": 252.12854000000004, "r": 413.37891, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 148, "text": "Section-header", "bbox": {"l": 358.63901, "t": 252.12854000000004, "r": 413.37891, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 114, "label": "text", "bbox": {"l": 426.52399, "t": 252.12854000000004, "r": 434.86273, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 149, "text": "68", "bbox": {"l": 426.52399, "t": 252.12854000000004, "r": 434.86273, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 115, "label": "text", "bbox": {"l": 452.56240999999994, "t": 252.12854000000004, "r": 460.90115000000003, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 150, "text": "83", "bbox": {"l": 452.56240999999994, "t": 252.12854000000004, "r": 460.90115000000003, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 116, "label": "text", "bbox": {"l": 478.59399, "t": 252.12854000000004, "r": 486.93274, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 151, "text": "69", "bbox": {"l": 478.59399, "t": 252.12854000000004, "r": 486.93274, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 117, "label": "text", "bbox": {"l": 504.6324200000001, "t": 252.12854000000004, "r": 512.97119, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 152, "text": "83", "bbox": {"l": 504.6324200000001, "t": 252.12854000000004, "r": 512.97119, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 118, "label": "text", "bbox": {"l": 358.63901, "t": 263.08752000000004, "r": 378.44577, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 153, "text": "Table", "bbox": {"l": 358.63901, "t": 263.08752000000004, "r": 378.44577, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 119, "label": "text", "bbox": {"l": 426.52399, "t": 263.08752000000004, "r": 434.86273, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 154, "text": "82", "bbox": {"l": 426.52399, "t": 263.08752000000004, "r": 434.86273, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 120, "label": "text", "bbox": {"l": 452.56240999999994, "t": 263.08752000000004, "r": 460.90115000000003, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 155, "text": "89", "bbox": {"l": 452.56240999999994, "t": 263.08752000000004, "r": 460.90115000000003, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 121, "label": "text", "bbox": {"l": 478.59399, "t": 263.08752000000004, "r": 486.93274, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 156, "text": "82", "bbox": {"l": 478.59399, "t": 263.08752000000004, "r": 486.93274, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 122, "label": "text", "bbox": {"l": 504.6324200000001, "t": 263.08752000000004, "r": 512.97119, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 157, "text": "90", "bbox": {"l": 504.6324200000001, "t": 263.08752000000004, "r": 512.97119, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 123, "label": "text", "bbox": {"l": 358.63901, "t": 274.04657, "r": 374.59921, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 158, "text": "Text", "bbox": {"l": 358.63901, "t": 274.04657, "r": 374.59921, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 124, "label": "text", "bbox": {"l": 426.52399, "t": 274.04657, "r": 434.86273, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 159, "text": "85", "bbox": {"l": 426.52399, "t": 274.04657, "r": 434.86273, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 125, "label": "text", "bbox": {"l": 452.56240999999994, "t": 274.04657, "r": 460.90115000000003, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 160, "text": "91", "bbox": {"l": 452.56240999999994, "t": 274.04657, "r": 460.90115000000003, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 126, "label": "text", "bbox": {"l": 478.59399, "t": 274.04657, "r": 486.93274, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 161, "text": "84", "bbox": {"l": 478.59399, "t": 274.04657, "r": 486.93274, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 127, "label": "text", "bbox": {"l": 504.6324200000001, "t": 274.04657, "r": 512.97119, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 162, "text": "90", "bbox": {"l": 504.6324200000001, "t": 274.04657, "r": 512.97119, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 128, "label": "text", "bbox": {"l": 358.63901, "t": 285.00552, "r": 375.63034, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 163, "text": "Title", "bbox": {"l": 358.63901, "t": 285.00552, "r": 375.63034, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 129, "label": "text", "bbox": {"l": 426.52399, "t": 285.00552, "r": 434.86273, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 164, "text": "77", "bbox": {"l": 426.52399, "t": 285.00552, "r": 434.86273, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 130, "label": "text", "bbox": {"l": 452.56240999999994, "t": 285.00552, "r": 460.90115000000003, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 165, "text": "81", "bbox": {"l": 452.56240999999994, "t": 285.00552, "r": 460.90115000000003, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 131, "label": "text", "bbox": {"l": 358.63901, "t": 296.36255, "r": 369.60492, "b": 304.73718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 166, "text": "All", "bbox": {"l": 358.63901, "t": 296.36255, "r": 369.60492, "b": 304.73718, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 132, "label": "text", "bbox": {"l": 426.52399, "t": 296.36255, "r": 434.86273, "b": 304.73718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 167, "text": "72", "bbox": {"l": 426.52399, "t": 296.36255, "r": 434.86273, "b": 304.73718, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 133, "label": "text", "bbox": {"l": 452.56240999999994, "t": 296.36255, "r": 460.90115000000003, "b": 304.73718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 168, "text": "84", "bbox": {"l": 452.56240999999994, "t": 296.36255, "r": 460.90115000000003, "b": 304.73718, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 134, "label": "text", "bbox": {"l": 478.59399, "t": 296.36255, "r": 486.93274, "b": 304.73718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 169, "text": "78", "bbox": {"l": 478.59399, "t": 296.36255, "r": 486.93274, "b": 304.73718, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 135, "label": "text", "bbox": {"l": 504.6324200000001, "t": 296.36255, "r": 512.97119, "b": 304.73718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 170, "text": "87", "bbox": {"l": 504.6324200000001, "t": 296.36255, "r": 512.97119, "b": 304.73718, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["fcel", "ched", "lcel", "ched", "lcel", "nl", "fcel", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 14, "num_cols": 5, "table_cells": [{"bbox": {"l": 358.63901, "t": 153.10051999999996, "r": 401.73154, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Class-count", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.22501, "t": 153.10051999999996, "r": 448.56375, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 3, "text": "11", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 494.38, "t": 153.10051999999996, "r": 498.54938, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 5, "text": "5", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 164.05951000000005, "r": 375.27167, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Split", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 423.341, "t": 164.05951000000005, "r": 438.0459, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Doc", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 448.00757, "t": 164.05951000000005, "r": 465.4472, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Page", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 475.41101, "t": 164.05951000000005, "r": 490.11591, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Doc", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 500.07757999999995, "t": 164.05951000000005, "r": 517.51721, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Page", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 175.41656, "r": 387.82465, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Caption", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 175.41656, "r": 434.86273, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 175.41656, "r": 460.90115000000003, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 186.37554999999998, "r": 391.14221, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Footnote", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 186.37554999999998, "r": 434.86273, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "71", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 186.37554999999998, "r": 460.90115000000003, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 197.33452999999997, "r": 389.15167, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Formula", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 197.33452999999997, "r": 434.86273, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "60", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 197.33452999999997, "r": 460.90115000000003, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "66", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 208.29351999999994, "r": 391.5188, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "List-item", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 208.29351999999994, "r": 434.86273, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 208.29351999999994, "r": 460.90115000000003, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 478.59399, "t": 208.29351999999994, "r": 486.93274, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 504.6324200000001, "t": 208.29351999999994, "r": 512.97119, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 219.25256000000002, "r": 401.16666, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-footer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 219.25256000000002, "r": 434.86273, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "62", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 219.25256000000002, "r": 460.90115000000003, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "89", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 230.21155, "r": 403.91931, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 230.21155, "r": 434.86273, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 230.21155, "r": 460.90115000000003, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "90", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 241.16956000000005, "r": 384.62366, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Picture", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 241.16956000000005, "r": 434.86273, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 241.16956000000005, "r": 460.90115000000003, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 478.59399, "t": 241.16956000000005, "r": 486.93274, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 504.6324200000001, "t": 241.16956000000005, "r": 512.97119, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 252.12854000000004, "r": 413.37891, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Section-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 252.12854000000004, "r": 434.86273, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 252.12854000000004, "r": 460.90115000000003, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 478.59399, "t": 252.12854000000004, "r": 486.93274, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "69", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 504.6324200000001, "t": 252.12854000000004, "r": 512.97119, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 263.08752000000004, "r": 378.44577, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 263.08752000000004, "r": 434.86273, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 263.08752000000004, "r": 460.90115000000003, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "89", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 478.59399, "t": 263.08752000000004, "r": 486.93274, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 504.6324200000001, "t": 263.08752000000004, "r": 512.97119, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "90", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 274.04657, "r": 374.59921, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Text", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 274.04657, "r": 434.86273, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 274.04657, "r": 460.90115000000003, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "91", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 478.59399, "t": 274.04657, "r": 486.93274, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 504.6324200000001, "t": 274.04657, "r": 512.97119, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "90", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 285.00552, "r": 375.63034, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Title", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 285.00552, "r": 434.86273, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 285.00552, "r": 460.90115000000003, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 296.36255, "r": 369.60492, "b": 304.73718, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "All", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 296.36255, "r": 434.86273, "b": 304.73718, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 296.36255, "r": 460.90115000000003, "b": 304.73718, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 478.59399, "t": 296.36255, "r": 486.93274, "b": 304.73718, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "78", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 504.6324200000001, "t": 296.36255, "r": 512.97119, "b": 304.73718, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "87", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "text", "id": 6, "page_no": 6, "cluster": {"id": 6, "label": "text", "bbox": {"l": 317.686, "t": 331.40353, "r": 559.58496, "b": 416.49017, "coord_origin": "TOPLEFT"}, "confidence": 0.9740146994590759, "cells": [{"id": 171, "text": "lists in PubLayNet (grouped list-items) versus DocLayNet (separate", "bbox": {"l": 317.95499, "t": 331.40353, "r": 558.20233, "b": 339.77817, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "list-items), the label set of size 4 is the closest to PubLayNet, in the", "bbox": {"l": 317.95499, "t": 342.36255, "r": 558.2005, "b": 350.73718, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "assumption that the", "bbox": {"l": 317.95499, "t": 353.32153, "r": 393.16028, "b": 361.69617000000005, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "List", "bbox": {"l": 395.84201, "t": 353.36639, "r": 409.14905, "b": 361.70514, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "is down-mapped to", "bbox": {"l": 412.33301, "t": 353.32153, "r": 485.02324999999996, "b": 361.69617000000005, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "Text", "bbox": {"l": 487.70401, "t": 353.36639, "r": 502.86761, "b": 361.70514, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "in PubLayNet.", "bbox": {"l": 506.05499, "t": 353.32153, "r": 559.58496, "b": 361.69617000000005, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "The results in Table 3 show that the prediction accuracy on the", "bbox": {"l": 317.686, "t": 364.28054999999995, "r": 558.2002, "b": 372.65518, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "remaining class labels does not change significantly when other", "bbox": {"l": 317.95499, "t": 375.23853, "r": 558.36877, "b": 383.61316, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "classes are merged into them. The overall macro-average improves", "bbox": {"l": 317.95499, "t": 386.19754, "r": 558.19958, "b": 394.57217, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "by around 5%, in particular when", "bbox": {"l": 317.95499, "t": 397.15652, "r": 439.49454, "b": 405.53116000000006, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "Page-footer", "bbox": {"l": 441.728, "t": 397.20139, "r": 481.8616, "b": 405.54013, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "and", "bbox": {"l": 484.74298, "t": 397.15652, "r": 498.23743, "b": 405.53116000000006, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "Page-header", "bbox": {"l": 500.47299, "t": 397.20139, "r": 543.95105, "b": 405.54013, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": "are", "bbox": {"l": 546.83197, "t": 397.15652, "r": 558.20142, "b": 405.53116000000006, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "excluded.", "bbox": {"l": 317.95496, "t": 408.11553999999995, "r": 352.37698, "b": 416.49017, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "lists in PubLayNet (grouped list-items) versus DocLayNet (separate list-items), the label set of size 4 is the closest to PubLayNet, in the assumption that the List is down-mapped to Text in PubLayNet. The results in Table 3 show that the prediction accuracy on the remaining class labels does not change significantly when other classes are merged into them. The overall macro-average improves by around 5%, in particular when Page-footer and Page-header are excluded."}, {"label": "section_header", "id": 9, "page_no": 6, "cluster": {"id": 9, "label": "section_header", "bbox": {"l": 317.95496, "t": 429.3949, "r": 549.8606, "b": 439.70398, "coord_origin": "TOPLEFT"}, "confidence": 0.9562516808509827, "cells": [{"id": 187, "text": "Impact of Document Split in Train and Test Set", "bbox": {"l": 317.95496, "t": 429.3949, "r": 549.8606, "b": 439.70398, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Impact of Document Split in Train and Test Set"}, {"label": "text", "id": 3, "page_no": 6, "cluster": {"id": 3, "label": "text", "bbox": {"l": 317.62299, "t": 444.59653, "r": 559.71381, "b": 595.43718, "coord_origin": "TOPLEFT"}, "confidence": 0.9869834184646606, "cells": [{"id": 188, "text": "Many documents in DocLayNet have a unique styling. In order", "bbox": {"l": 317.95499, "t": 444.59653, "r": 558.36884, "b": 452.97116, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "to avoid overfitting on a particular style, we have split the train-,", "bbox": {"l": 317.95499, "t": 455.55554, "r": 559.19189, "b": 463.93018, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "test- and validation-sets of DocLayNet on document boundaries, i.e.", "bbox": {"l": 317.95499, "t": 466.51453, "r": 559.58185, "b": 474.88916, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "every document contributes pages to only one set. To the best of", "bbox": {"l": 317.95499, "t": 477.47354, "r": 558.20605, "b": 485.84818, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": "our knowledge, this was not considered in PubLayNet or DocBank.", "bbox": {"l": 317.95499, "t": 488.43253, "r": 559.58203, "b": 496.80716, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "To quantify how this affects model performance, we trained and", "bbox": {"l": 317.686, "t": 499.39154, "r": 558.20032, "b": 507.76617, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "evaluated a Mask R-CNN R50 model on a modified dataset version.", "bbox": {"l": 317.95499, "t": 510.35052, "r": 559.5849, "b": 518.72516, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "Here, the train-, test- and validation-sets were obtained by a ran-", "bbox": {"l": 317.95499, "t": 521.30954, "r": 559.71381, "b": 529.68417, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "domised draw over the individual pages. As can be seen in Table 4,", "bbox": {"l": 317.95499, "t": 532.26855, "r": 559.18707, "b": 540.64317, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "the difference in model performance is surprisingly large: page-", "bbox": {"l": 317.95499, "t": 543.22655, "r": 559.71313, "b": 551.60117, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "wise splitting gains", "bbox": {"l": 317.62299, "t": 554.18555, "r": 388.35168, "b": 562.56017, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "\u02dc", "bbox": {"l": 391.36499, "t": 552.50055, "r": 393.98318, "b": 560.87517, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "10% in mAP over the document-wise splitting.", "bbox": {"l": 390.59, "t": 554.18555, "r": 559.58191, "b": 562.56017, "coord_origin": "TOPLEFT"}}, {"id": 201, "text": "Thus, random page-wise splitting of DocLayNet can easily lead", "bbox": {"l": 317.686, "t": 565.14455, "r": 558.20032, "b": 573.51917, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": "to accidental overestimation of model performance and should be", "bbox": {"l": 317.95499, "t": 576.10356, "r": 558.20508, "b": 584.4781800000001, "coord_origin": "TOPLEFT"}}, {"id": 203, "text": "avoided.", "bbox": {"l": 317.95499, "t": 587.06256, "r": 348.50354, "b": 595.43718, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Many documents in DocLayNet have a unique styling. In order to avoid overfitting on a particular style, we have split the train-, test- and validation-sets of DocLayNet on document boundaries, i.e. every document contributes pages to only one set. To the best of our knowledge, this was not considered in PubLayNet or DocBank. To quantify how this affects model performance, we trained and evaluated a Mask R-CNN R50 model on a modified dataset version. Here, the train-, test- and validation-sets were obtained by a randomised draw over the individual pages. As can be seen in Table 4, the difference in model performance is surprisingly large: pagewise splitting gains \u02dc 10% in mAP over the document-wise splitting. Thus, random page-wise splitting of DocLayNet can easily lead to accidental overestimation of model performance and should be avoided."}, {"label": "section_header", "id": 7, "page_no": 6, "cluster": {"id": 7, "label": "section_header", "bbox": {"l": 317.95499, "t": 608.34192, "r": 418.54776, "b": 618.65102, "coord_origin": "TOPLEFT"}, "confidence": 0.9589217305183411, "cells": [{"id": 204, "text": "Dataset Comparison", "bbox": {"l": 317.95499, "t": 608.34192, "r": 418.54776, "b": 618.65102, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Dataset Comparison"}, {"label": "text", "id": 2, "page_no": 6, "cluster": {"id": 2, "label": "text", "bbox": {"l": 317.686, "t": 623.54355, "r": 559.18817, "b": 708.640137, "coord_origin": "TOPLEFT"}, "confidence": 0.9872549772262573, "cells": [{"id": 205, "text": "Throughout this paper, we claim that DocLayNet\u2019s wider variety of", "bbox": {"l": 317.686, "t": 623.54355, "r": 558.20575, "b": 631.91817, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": "document layouts leads to more robust layout detection models. In", "bbox": {"l": 317.95499, "t": 634.50255, "r": 558.20624, "b": 642.87717, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": "Table 5, we provide evidence for that. We trained models on each", "bbox": {"l": 317.686, "t": 645.46155, "r": 558.20319, "b": 653.83617, "coord_origin": "TOPLEFT"}}, {"id": 208, "text": "of the available datasets (PubLayNet, DocBank and DocLayNet)", "bbox": {"l": 317.95499, "t": 656.42055, "r": 558.74377, "b": 664.79517, "coord_origin": "TOPLEFT"}}, {"id": 209, "text": "and evaluated them on the test sets of the other datasets. Due to", "bbox": {"l": 317.95499, "t": 667.37955, "r": 558.20398, "b": 675.7541699999999, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": "the different label sets and annotation styles, a direct comparison", "bbox": {"l": 317.95499, "t": 678.3385499999999, "r": 558.20062, "b": 686.71317, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "is not possible. Hence, we focussed on the common labels among", "bbox": {"l": 317.95499, "t": 689.29755, "r": 558.20343, "b": 697.672173, "coord_origin": "TOPLEFT"}}, {"id": 212, "text": "the datasets. Between PubLayNet and DocLayNet, these are", "bbox": {"l": 317.95499, "t": 700.256554, "r": 531.07666, "b": 708.631172, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "Picture", "bbox": {"l": 533.16199, "t": 700.301384, "r": 557.2561, "b": 708.640137, "coord_origin": "TOPLEFT"}}, {"id": 214, "text": ",", "bbox": {"l": 557.255, "t": 700.256554, "r": 559.18817, "b": 708.631172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Throughout this paper, we claim that DocLayNet\u2019s wider variety of document layouts leads to more robust layout detection models. In Table 5, we provide evidence for that. We trained models on each of the available datasets (PubLayNet, DocBank and DocLayNet) and evaluated them on the test sets of the other datasets. Due to the different label sets and annotation styles, a direct comparison is not possible. Hence, we focussed on the common labels among the datasets. Between PubLayNet and DocLayNet, these are Picture ,"}], "headers": [{"label": "page_header", "id": 12, "page_no": 6, "cluster": {"id": 12, "label": "page_header", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.9316118955612183, "cells": [{"id": 0, "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis"}, {"label": "page_header", "id": 11, "page_no": 6, "cluster": {"id": 11, "label": "page_header", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.9318180084228516, "cells": [{"id": 1, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA"}]}}, {"page_no": 7, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 246.24382, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar", "bbox": {"l": 253.13897999999998, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Table 5: Prediction Performance (mAP@0.5-0.95) of a Mask", "bbox": {"l": 53.501999, "t": 86.87292000000002, "r": 294.32153, "b": 95.34618999999998, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "R-CNN R50 network across the PubLayNet, DocBank & Do-", "bbox": {"l": 53.79800000000001, "t": 97.83191, "r": 295.64868, "b": 106.30517999999995, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "cLayNet data-sets. By evaluating on common label classes of", "bbox": {"l": 53.79800000000001, "t": 108.79088999999999, "r": 294.0437, "b": 117.26415999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "each dataset, we observe that the DocLayNet-trained model", "bbox": {"l": 53.79800000000001, "t": 119.74987999999996, "r": 294.04373, "b": 128.22313999999994, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "has much less pronounced variations in performance across", "bbox": {"l": 53.79800000000001, "t": 130.70885999999996, "r": 294.0437, "b": 139.18213000000003, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "all datasets.", "bbox": {"l": 53.79800000000001, "t": 141.66785000000004, "r": 101.15852, "b": 150.14111000000003, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Testing on", "bbox": {"l": 217.74099999999999, "t": 175.01855, "r": 256.26065, "b": 183.39319, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Training on", "bbox": {"l": 89.954002, "t": 185.97655999999995, "r": 133.24379, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "labels", "bbox": {"l": 154.629, "t": 185.97655999999995, "r": 175.47588, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "PLN", "bbox": {"l": 204.69, "t": 185.97655999999995, "r": 220.54260000000002, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "DB", "bbox": {"l": 230.50427000000002, "t": 185.97655999999995, "r": 242.06197, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "DLN", "bbox": {"l": 252.02364, "t": 185.97655999999995, "r": 269.31085, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "PubLayNet (PLN)", "bbox": {"l": 78.530998, "t": 219.25256000000002, "r": 142.56006, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Figure", "bbox": {"l": 154.629, "t": 197.33452999999997, "r": 177.92371, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "96", "bbox": {"l": 208.44701, "t": 197.33452999999997, "r": 216.78575000000004, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "43", "bbox": {"l": 232.1183, "t": 197.33452999999997, "r": 240.45705, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "23", "bbox": {"l": 256.49792, "t": 197.33452999999997, "r": 264.83667, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Sec-header", "bbox": {"l": 154.629, "t": 208.29351999999994, "r": 194.72675, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "87", "bbox": {"l": 208.44701, "t": 208.29351999999994, "r": 216.78575000000004, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "-", "bbox": {"l": 234.77235, "t": 208.29351999999994, "r": 237.80299000000002, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "32", "bbox": {"l": 256.49792, "t": 208.29351999999994, "r": 264.83667, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Table", "bbox": {"l": 154.629, "t": 219.25256000000002, "r": 174.43578, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "95", "bbox": {"l": 208.44701, "t": 219.25256000000002, "r": 216.78575000000004, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "24", "bbox": {"l": 232.1183, "t": 219.25256000000002, "r": 240.45705, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "49", "bbox": {"l": 256.49792, "t": 219.25256000000002, "r": 264.83667, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Text", "bbox": {"l": 154.629, "t": 230.21155, "r": 170.58919, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "96", "bbox": {"l": 208.44701, "t": 230.21155, "r": 216.78575000000004, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "-", "bbox": {"l": 234.77235, "t": 230.21155, "r": 237.80299000000002, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "42", "bbox": {"l": 256.49792, "t": 230.21155, "r": 264.83667, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "total", "bbox": {"l": 154.629, "t": 241.16956000000005, "r": 171.2796, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "93", "bbox": {"l": 208.44701, "t": 241.16956000000005, "r": 216.78575000000004, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "34", "bbox": {"l": 232.1183, "t": 241.16956000000005, "r": 240.45705, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "30", "bbox": {"l": 256.49792, "t": 241.16956000000005, "r": 264.83667, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "DocBank (DB)", "bbox": {"l": 78.530998, "t": 263.48650999999995, "r": 131.19963, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Figure", "bbox": {"l": 154.629, "t": 252.52752999999996, "r": 177.92371, "b": 260.90216, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "77", "bbox": {"l": 208.44701, "t": 252.52752999999996, "r": 216.78575000000004, "b": 260.90216, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "71", "bbox": {"l": 232.1183, "t": 252.52752999999996, "r": 240.45705, "b": 260.90216, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "31", "bbox": {"l": 256.49792, "t": 252.52752999999996, "r": 264.83667, "b": 260.90216, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "Table", "bbox": {"l": 154.629, "t": 263.48650999999995, "r": 174.43578, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "19", "bbox": {"l": 208.44701, "t": 263.48650999999995, "r": 216.78575000000004, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "65", "bbox": {"l": 232.1183, "t": 263.48650999999995, "r": 240.45705, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "22", "bbox": {"l": 256.49792, "t": 263.48650999999995, "r": 264.83667, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "total", "bbox": {"l": 154.629, "t": 274.44556, "r": 171.2796, "b": 282.82016, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "48", "bbox": {"l": 208.44701, "t": 274.44556, "r": 216.78575000000004, "b": 282.82016, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "68", "bbox": {"l": 232.1183, "t": 274.44556, "r": 240.45705, "b": 282.82016, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "27", "bbox": {"l": 256.49792, "t": 274.44556, "r": 264.83667, "b": 282.82016, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "DocLayNet (DLN)", "bbox": {"l": 78.530998, "t": 307.72055, "r": 144.66716, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "Figure", "bbox": {"l": 154.629, "t": 285.80255, "r": 177.92371, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "67", "bbox": {"l": 208.44701, "t": 285.80255, "r": 216.78575000000004, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "51", "bbox": {"l": 232.1183, "t": 285.80255, "r": 240.45705, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "72", "bbox": {"l": 256.49792, "t": 285.80255, "r": 264.83667, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Sec-header", "bbox": {"l": 154.629, "t": 296.76154, "r": 194.72675, "b": 305.13617, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "53", "bbox": {"l": 208.44701, "t": 296.76154, "r": 216.78575000000004, "b": 305.13617, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "-", "bbox": {"l": 234.77235, "t": 296.76154, "r": 237.80299000000002, "b": 305.13617, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "68", "bbox": {"l": 256.49792, "t": 296.76154, "r": 264.83667, "b": 305.13617, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Table", "bbox": {"l": 154.629, "t": 307.72055, "r": 174.43578, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "87", "bbox": {"l": 208.44701, "t": 307.72055, "r": 216.78575000000004, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "43", "bbox": {"l": 232.1183, "t": 307.72055, "r": 240.45705, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "82", "bbox": {"l": 256.49792, "t": 307.72055, "r": 264.83667, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "Text", "bbox": {"l": 154.629, "t": 318.67953, "r": 170.58919, "b": 327.05417, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "77", "bbox": {"l": 208.44701, "t": 318.67953, "r": 216.78575000000004, "b": 327.05417, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "-", "bbox": {"l": 234.77235, "t": 318.67953, "r": 237.80299000000002, "b": 327.05417, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "84", "bbox": {"l": 256.49792, "t": 318.67953, "r": 264.83667, "b": 327.05417, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "total", "bbox": {"l": 154.629, "t": 329.63855, "r": 171.2796, "b": 338.01318, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "59", "bbox": {"l": 208.44701, "t": 329.63855, "r": 216.78575000000004, "b": 338.01318, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "47", "bbox": {"l": 232.1183, "t": 329.63855, "r": 240.45705, "b": 338.01318, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "78", "bbox": {"l": 256.49792, "t": 329.63855, "r": 264.83667, "b": 338.01318, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "Section-header", "bbox": {"l": 53.79800000000001, "t": 390.96539, "r": 106.2392, "b": 399.30414, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": ",", "bbox": {"l": 106.239, "t": 390.92053, "r": 108.23331, "b": 399.2951699999999, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Table", "bbox": {"l": 110.482, "t": 390.96539, "r": 129.76332, "b": 399.30414, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "and", "bbox": {"l": 132.21899, "t": 390.92053, "r": 145.86186, "b": 399.2951699999999, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "Text", "bbox": {"l": 148.112, "t": 390.96539, "r": 163.14182, "b": 399.30414, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": ". Before training, we either mapped", "bbox": {"l": 163.13901, "t": 390.92053, "r": 294.04709, "b": 399.2951699999999, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "or excluded DocLayNet\u2019s other labels as specified in table 3, and", "bbox": {"l": 53.79800000000001, "t": 401.87954999999994, "r": 294.04712, "b": 410.25418, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "also PubLayNet\u2019s", "bbox": {"l": 53.79800000000001, "t": 412.83853, "r": 117.12856, "b": 421.21317, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "List", "bbox": {"l": 119.362, "t": 412.88339, "r": 132.4342, "b": 421.22214, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "to", "bbox": {"l": 135.177, "t": 412.83853, "r": 142.54416, "b": 421.21317, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "Text", "bbox": {"l": 144.77901, "t": 412.88339, "r": 159.66605, "b": 421.22214, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": ". Note that the different clustering of", "bbox": {"l": 159.66701, "t": 412.83853, "r": 294.04562, "b": 421.21317, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "lists (by list-element vs. whole list objects) naturally decreases the", "bbox": {"l": 53.79800000000001, "t": 423.79755, "r": 294.04614, "b": 432.17217999999997, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "mAP score for", "bbox": {"l": 53.79800000000001, "t": 434.75653, "r": 106.2066, "b": 443.13116, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "Text", "bbox": {"l": 108.448, "t": 434.80139, "r": 123.30533, "b": 443.14014, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": ".", "bbox": {"l": 123.305, "t": 434.75653, "r": 125.27761000000001, "b": 443.13116, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "For comparison of DocBank with DocLayNet, we trained only", "bbox": {"l": 63.76100199999999, "t": 445.71453999999994, "r": 294.27582, "b": 454.08917, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "on", "bbox": {"l": 53.79800000000001, "t": 456.67355, "r": 62.989277, "b": 465.04819, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Picture", "bbox": {"l": 64.852997, "t": 456.71841, "r": 88.947144, "b": 465.05716, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "and", "bbox": {"l": 91.019997, "t": 456.67355, "r": 104.24454, "b": 465.04819, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "Table", "bbox": {"l": 106.108, "t": 456.71841, "r": 124.78053, "b": 465.05716, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "clusters of each dataset. We had to exclude", "bbox": {"l": 126.85500000000002, "t": 456.67355, "r": 277.63235, "b": 465.04819, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "Text", "bbox": {"l": 279.49701, "t": 456.71841, "r": 294.0484, "b": 465.05716, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "because successive paragraphs are often grouped together into a", "bbox": {"l": 53.79800000000001, "t": 467.63254, "r": 294.04709, "b": 476.00717, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "single object in DocBank. This paragraph grouping is incompatible", "bbox": {"l": 53.79800000000001, "t": 478.59155, "r": 294.04532, "b": 486.96619, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "with the individual paragraphs of DocLayNet. As can be seen in", "bbox": {"l": 53.466999, "t": 489.55054, "r": 294.04538, "b": 497.92517, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "Table 5, DocLayNet trained models yield better performance com-", "bbox": {"l": 53.528999, "t": 500.50955, "r": 295.55908, "b": 508.88419, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "pared to the previous datasets. It is noteworthy that the models", "bbox": {"l": 53.79800000000001, "t": 511.46854, "r": 294.04712, "b": 519.84317, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "trained on PubLayNet and DocBank perform very well on their", "bbox": {"l": 53.79800000000001, "t": 522.42755, "r": 294.21179, "b": 530.80219, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "own test set, but have a much lower performance on the foreign", "bbox": {"l": 53.79800000000001, "t": 533.38654, "r": 294.04712, "b": 541.76117, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "datasets. While this also applies to DocLayNet, the difference is", "bbox": {"l": 53.79800000000001, "t": 544.34555, "r": 294.04715, "b": 552.72017, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "far less pronounced. Thus we conclude that DocLayNet trained", "bbox": {"l": 53.79800000000001, "t": 555.3045500000001, "r": 294.04712, "b": 563.67917, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "models are overall more robust and will produce better results for", "bbox": {"l": 53.79800000000001, "t": 566.26256, "r": 294.21411, "b": 574.63718, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "challenging, unseen layouts.", "bbox": {"l": 53.79800000000001, "t": 577.22156, "r": 157.52132, "b": 585.59618, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "Example Predictions", "bbox": {"l": 53.79800000000001, "t": 605.06091, "r": 156.00534, "b": 615.37001, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "To conclude this section, we illustrate the quality of layout predic-", "bbox": {"l": 53.528999, "t": 620.26355, "r": 295.5571, "b": 628.63817, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "tions one can expect from DocLayNet-trained models by providing", "bbox": {"l": 53.79800000000001, "t": 631.22255, "r": 294.04532, "b": 639.59717, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "a selection of examples without any further post-processing ap-", "bbox": {"l": 53.79800000000001, "t": 642.18155, "r": 295.55618, "b": 650.5561700000001, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "plied. Figure 6 shows selected layout predictions on pages from the", "bbox": {"l": 53.79800000000001, "t": 653.14055, "r": 294.04541, "b": 661.51517, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "test-set of DocLayNet. Results look decent in general across docu-", "bbox": {"l": 53.79800000000001, "t": 664.09956, "r": 295.55844, "b": 672.47417, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "ment categories, however one can also observe mistakes such as", "bbox": {"l": 53.79800000000001, "t": 675.05756, "r": 294.04712, "b": 683.43217, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "overlapping clusters of different classes, or entirely missing boxes", "bbox": {"l": 53.79800000000001, "t": 686.01656, "r": 294.04535, "b": 694.391174, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "due to low confidence.", "bbox": {"l": 53.79800000000001, "t": 696.975555, "r": 136.07368, "b": 705.350174, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "6", "bbox": {"l": 317.95502, "t": 85.85986000000003, "r": 323.56229, "b": 96.16900999999996, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "CONCLUSION", "bbox": {"l": 334.47137, "t": 85.85986000000003, "r": 405.72961, "b": 96.16900999999996, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "In this paper, we presented the DocLayNet dataset. It provides the", "bbox": {"l": 317.95499, "t": 101.06151999999997, "r": 558.2038, "b": 109.43615999999997, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "document conversion and layout analysis research community a", "bbox": {"l": 317.95499, "t": 112.02057000000002, "r": 558.2041, "b": 120.39520000000005, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "new and challenging dataset to improve and fine-tune novel ML", "bbox": {"l": 317.95499, "t": 122.97955000000002, "r": 558.43274, "b": 131.35419000000002, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "methods on. In contrast to many other datasets, DocLayNet was", "bbox": {"l": 317.95499, "t": 133.93854, "r": 558.20416, "b": 142.31317, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "created by human annotation in order to obtain reliable layout", "bbox": {"l": 317.95499, "t": 144.89752, "r": 558.20422, "b": 153.27215999999999, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "ground-truth on a wide variety of publication- and typesetting-", "bbox": {"l": 317.95499, "t": 155.85657000000003, "r": 559.71313, "b": 164.23119999999994, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "styles. Including a large proportion of documents outside the scien-", "bbox": {"l": 317.95499, "t": 166.81555000000003, "r": 559.71375, "b": 175.19019000000003, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "tific publishing domain adds significant value in this respect.", "bbox": {"l": 317.95499, "t": 177.77454, "r": 540.04382, "b": 186.14917000000003, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "From the dataset, we have derived on the one hand reference", "bbox": {"l": 327.918, "t": 188.73352, "r": 558.19836, "b": 197.10815000000002, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "metrics for human performance on document-layout annotation", "bbox": {"l": 317.95499, "t": 199.69257000000005, "r": 558.20404, "b": 208.06719999999996, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "(through double and triple annotations) and on the other hand eval-", "bbox": {"l": 317.686, "t": 210.65155000000004, "r": 559.71704, "b": 219.02617999999995, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "uated the baseline performance of commonly used object detection", "bbox": {"l": 317.95499, "t": 221.60956, "r": 558.20245, "b": 229.98419, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "methods. We also illustrated the impact of various dataset-related", "bbox": {"l": 317.95499, "t": 232.56853999999998, "r": 558.20502, "b": 240.94317999999998, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "aspects on model performance through data-ablation experiments,", "bbox": {"l": 317.95499, "t": 243.52752999999996, "r": 559.18408, "b": 251.90215999999998, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "both from a size and class-label perspective. Last but not least, we", "bbox": {"l": 317.95499, "t": 254.48650999999995, "r": 558.20227, "b": 262.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "compared the accuracy of models trained on other public datasets", "bbox": {"l": 317.95499, "t": 265.44556, "r": 558.20349, "b": 273.82019, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "and showed that DocLayNet trained models are more robust.", "bbox": {"l": 317.95499, "t": 276.40454, "r": 540.99426, "b": 284.77917, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "To date, there is still a significant gap between human and ML", "bbox": {"l": 327.918, "t": 287.36353, "r": 558.43469, "b": 295.73816, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "accuracy on the layout interpretation task, and we hope that this", "bbox": {"l": 317.95499, "t": 298.32254, "r": 558.20013, "b": 306.69717, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "work will inspire the research community to close that gap.", "bbox": {"l": 317.62299, "t": 309.28152, "r": 535.65015, "b": 317.65616000000006, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "REFERENCES", "bbox": {"l": 317.95499, "t": 335.09189, "r": 387.3696, "b": 345.40097, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "[1]", "bbox": {"l": 321.198, "t": 348.70233, "r": 329.72415, "b": 355.21588, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "Max G\u00f6bel, Tamir Hassan, Ermelinda Oro, and Giorgio Orsi. Icdar 2013 table", "bbox": {"l": 331.53516, "t": 348.70233, "r": 558.19904, "b": 355.21588, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "competition. In", "bbox": {"l": 333.39099, "t": 356.67236, "r": 379.36414, "b": 363.18591, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "2013 12th International Conference on Document Analysis and", "bbox": {"l": 381.37201, "t": 356.70724, "r": 558.20099, "b": 363.19287, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "Recognition", "bbox": {"l": 333.39099, "t": 364.67724999999996, "r": 365.59601, "b": 371.16286999999994, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": ", pages 1449-1453, 2013.", "bbox": {"l": 365.59601, "t": 364.64236, "r": 434.29489, "b": 371.15591, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "[2]", "bbox": {"l": 321.198, "t": 372.61237, "r": 329.85956, "b": 379.12592, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "Christian Clausner, Apostolos Antonacopoulos, and Stefan Pletschacher. Ic-", "bbox": {"l": 331.69931, "t": 372.61237, "r": 559.37976, "b": 379.12592, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "dar2017 competition on recognition of documents with complex layouts -", "bbox": {"l": 333.39099, "t": 380.58237, "r": 559.37982, "b": 387.09592, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "rdcl2017. In", "bbox": {"l": 333.39099, "t": 388.55236999999994, "r": 367.4339, "b": 395.06592, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "2017 14th IAPR International Conference on Document Analysis and", "bbox": {"l": 369.17401, "t": 388.58725000000004, "r": 558.20422, "b": 395.07288, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "Recognition (ICDAR)", "bbox": {"l": 333.39099, "t": 396.55725, "r": 390.87601, "b": 403.04287999999997, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": ", volume 01, pages 1404-1410, 2017.", "bbox": {"l": 390.87698, "t": 396.52237, "r": 492.17831, "b": 403.03592, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "[3]", "bbox": {"l": 321.198, "t": 404.49237, "r": 329.53583, "b": 411.00592, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "Herv\u00e9 D\u00e9jean, Jean-Luc Meunier, Liangcai Gao, Yilun Huang, Yu Fang, Florian", "bbox": {"l": 331.30682, "t": 404.49237, "r": 558.19958, "b": 411.00592, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "Kleber, and Eva-Maria Lang. ICDAR 2019 Competition on Table Detection and", "bbox": {"l": 333.39099, "t": 412.46335, "r": 558.20013, "b": 418.9769, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "Recognition (cTDaR), April 2019. http://sac.founderit.com/.", "bbox": {"l": 333.39099, "t": 420.43335, "r": 501.80127, "b": 426.94689999999997, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "[4]", "bbox": {"l": 321.198, "t": 428.40335, "r": 329.91299, "b": 434.9169, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "Antonio Jimeno Yepes, Peter Zhong, and Douglas Burdick. Competition on", "bbox": {"l": 331.7641, "t": 428.40335, "r": 558.19885, "b": 434.9169, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "scientific literature parsing. In", "bbox": {"l": 333.39099, "t": 436.3733500000001, "r": 423.77225, "b": 442.8869, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "Proceedings of the International Conference on", "bbox": {"l": 425.909, "t": 436.40823, "r": 558.20178, "b": 442.89386, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "Document Analysis and Recognition", "bbox": {"l": 333.39099, "t": 444.37823, "r": 429.42697, "b": 450.86386, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": ", ICDAR, pages 605-617. LNCS 12824, Springer-", "bbox": {"l": 429.42400999999995, "t": 444.34335, "r": 559.37872, "b": 450.85689999999994, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "Verlag, sep 2021.", "bbox": {"l": 332.819, "t": 452.31335, "r": 380.01764, "b": 458.8269, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "[5]", "bbox": {"l": 321.198, "t": 460.28336, "r": 329.22977, "b": 466.79691, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "Logan Markewich, Hao Zhang, Yubin Xing, Navid Lambert-Shirzad, Jiang Zhexin,", "bbox": {"l": 330.93576, "t": 460.28336, "r": 558.97156, "b": 466.79691, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "Roy Lee, Zhi Li, and Seok-Bum Ko. Segmentation for document layout analysis:", "bbox": {"l": 333.39099, "t": 468.25336, "r": 559.02625, "b": 474.76691, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "not dead yet.", "bbox": {"l": 333.39099, "t": 476.22437, "r": 368.85431, "b": 482.73792, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "International Journal on Document Analysis and Recognition (IJDAR)", "bbox": {"l": 370.811, "t": 476.25925, "r": 557.46326, "b": 482.74487, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": ",", "bbox": {"l": 557.46503, "t": 476.22437, "r": 558.96857, "b": 482.73792, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "pages 1-11, 01 2022.", "bbox": {"l": 333.39099, "t": 484.19437, "r": 390.82715, "b": 490.70792, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "[6]", "bbox": {"l": 321.198, "t": 492.16437, "r": 329.42145, "b": 498.67792, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "Xu Zhong, Jianbin Tang, and Antonio Jimeno-Yepes. Publaynet: Largest dataset", "bbox": {"l": 331.16812, "t": 492.16437, "r": 558.20361, "b": 498.67792, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "ever for document layout analysis. In", "bbox": {"l": 333.39099, "t": 500.13437, "r": 438.6101100000001, "b": 506.64792, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "Proceedings of the International Conference", "bbox": {"l": 440.349, "t": 500.16925, "r": 558.19958, "b": 506.65488, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "on Document Analysis and Recognition", "bbox": {"l": 333.39099, "t": 508.13925, "r": 441.40118, "b": 514.6248800000001, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": ", ICDAR, pages 1015-1022, sep 2019.", "bbox": {"l": 441.4019799999999, "t": 508.10437, "r": 544.78162, "b": 514.61792, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "[7]", "bbox": {"l": 321.19797, "t": 516.07437, "r": 329.74161, "b": 522.5879199999999, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "Minghao Li, Yiheng Xu, Lei Cui, Shaohan Huang, Furu Wei, Zhoujun Li, and", "bbox": {"l": 331.55634, "t": 516.07437, "r": 558.19897, "b": 522.5879199999999, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "Ming Zhou. Docbank: A benchmark dataset for document layout analysis. In", "bbox": {"l": 333.39099, "t": 524.0443700000001, "r": 558.19891, "b": 530.55792, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "Proceedings of the 28th International Conference on Computational Linguistics", "bbox": {"l": 333.39099, "t": 532.04922, "r": 557.40228, "b": 538.53487, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": ",", "bbox": {"l": 557.40399, "t": 532.01437, "r": 558.96893, "b": 538.5278900000001, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "COLING, pages 949-960. International Committee on Computational Linguistics,", "bbox": {"l": 333.39099, "t": 539.98438, "r": 558.9715, "b": 546.49789, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "dec 2020.", "bbox": {"l": 333.39099, "t": 547.95535, "r": 359.31955, "b": 554.46889, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "[8]", "bbox": {"l": 321.198, "t": 555.92535, "r": 329.7088, "b": 562.43889, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "Riaz Ahmad, Muhammad Tanvir Afzal, and M. Qadir. Information extraction", "bbox": {"l": 331.51654, "t": 555.92535, "r": 558.19891, "b": 562.43889, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "from pdf sources based on rule-based system using integrated formats. In", "bbox": {"l": 333.39099, "t": 563.89536, "r": 535.54352, "b": 570.40889, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "SemWe-", "bbox": {"l": 536.96399, "t": 563.93024, "r": 558.90222, "b": 570.4158600000001, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "bEval@ESWC", "bbox": {"l": 333.39099, "t": 571.9002399999999, "r": 371.94217, "b": 578.38586, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": ", 2016.", "bbox": {"l": 371.94299, "t": 571.86536, "r": 389.72617, "b": 578.3788900000001, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": "[9]", "bbox": {"l": 321.198, "t": 579.83536, "r": 329.45999, "b": 586.34889, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "Ross B. Girshick, Jeff Donahue, Trevor Darrell, and Jitendra Malik. Rich feature", "bbox": {"l": 331.21487, "t": 579.83536, "r": 558.19843, "b": 586.34889, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "hierarchies for accurate object detection and semantic segmentation. In", "bbox": {"l": 333.39099, "t": 587.8053600000001, "r": 543.05487, "b": 594.31889, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": "IEEE", "bbox": {"l": 544.98499, "t": 587.84024, "r": 558.20148, "b": 594.32587, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "Conference on Computer Vision and Pattern Recognition", "bbox": {"l": 333.39099, "t": 595.81024, "r": 491.61166, "b": 602.29587, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": ", CVPR, pages 580-587.", "bbox": {"l": 491.61301, "t": 595.77536, "r": 559.27448, "b": 602.28889, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "IEEE Computer Society, jun 2014.", "bbox": {"l": 333.39099, "t": 603.74536, "r": 428.59726000000006, "b": 610.2589, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": "[10]", "bbox": {"l": 317.95499, "t": 611.71536, "r": 329.54767, "b": 618.2289000000001, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "Ross B. Girshick. Fast R-CNN. In", "bbox": {"l": 331.31268, "t": 611.71536, "r": 425.1554, "b": 618.2289000000001, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "2015 IEEE International Conference on Computer", "bbox": {"l": 426.77802, "t": 611.75024, "r": 558.20203, "b": 618.23587, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "Vision", "bbox": {"l": 333.39099, "t": 619.72124, "r": 350.59537, "b": 626.20686, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": ", ICCV, pages 1440-1448. IEEE Computer Society, dec 2015.", "bbox": {"l": 350.59598, "t": 619.68637, "r": 518.58777, "b": 626.19989, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "[11]", "bbox": {"l": 317.95499, "t": 627.65637, "r": 329.5459, "b": 634.16989, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "Shaoqing Ren, Kaiming He, Ross Girshick, and Jian Sun. Faster r-cnn: Towards", "bbox": {"l": 331.31064, "t": 627.65637, "r": 558.20142, "b": 634.16989, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "real-time object detection with region proposal networks.", "bbox": {"l": 333.39099, "t": 635.62637, "r": 497.50909, "b": 642.13989, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "IEEE Transactions on", "bbox": {"l": 500.01401, "t": 635.66124, "r": 558.19885, "b": 642.14687, "coord_origin": "TOPLEFT"}}, {"id": 201, "text": "Pattern Analysis and Machine Intelligence", "bbox": {"l": 333.39099, "t": 643.6312399999999, "r": 449.38620000000003, "b": 650.1168700000001, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": ", 39(6):1137-1149, 2017.", "bbox": {"l": 449.38699, "t": 643.59637, "r": 515.74268, "b": 650.10989, "coord_origin": "TOPLEFT"}}, {"id": 203, "text": "[12]", "bbox": {"l": 317.95499, "t": 651.56638, "r": 329.41763, "b": 658.0799, "coord_origin": "TOPLEFT"}}, {"id": 204, "text": "Kaiming He, Georgia Gkioxari, Piotr Doll\u00e1r, and Ross B. Girshick. Mask R-CNN.", "bbox": {"l": 331.16287, "t": 651.56638, "r": 559.27808, "b": 658.0799, "coord_origin": "TOPLEFT"}}, {"id": 205, "text": "In", "bbox": {"l": 333.39099, "t": 659.53638, "r": 339.35904, "b": 666.0499, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": "IEEE International Conference on Computer Vision", "bbox": {"l": 341.56299, "t": 659.57124, "r": 485.8273, "b": 666.05687, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": ", ICCV, pages 2980-2988.", "bbox": {"l": 485.82901, "t": 659.53638, "r": 559.27356, "b": 666.0499, "coord_origin": "TOPLEFT"}}, {"id": 208, "text": "IEEE Computer Society, Oct 2017.", "bbox": {"l": 333.39099, "t": 667.50636, "r": 429.30161000000004, "b": 674.01989, "coord_origin": "TOPLEFT"}}, {"id": 209, "text": "[13]", "bbox": {"l": 317.95499, "t": 675.47636, "r": 330.11407, "b": 681.9898900000001, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": "Glenn Jocher, Alex Stoken, Ayush Chaurasia, Jirka Borovec, NanoCode012,", "bbox": {"l": 331.96533, "t": 675.47636, "r": 558.96716, "b": 681.9898900000001, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "TaoXie, Yonghye Kwon, Kalen Michael, Liu Changyu, Jiacong Fang, Abhiram V,", "bbox": {"l": 333.18201, "t": 683.44637, "r": 558.96661, "b": 689.95989, "coord_origin": "TOPLEFT"}}, {"id": 212, "text": "Laughing, tkianai, yxNONG, Piotr Skalski, Adam Hogan, Jebastin Nadar, imyhxy,", "bbox": {"l": 333.39099, "t": 691.41737, "r": 558.97156, "b": 697.930893, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "Lorenzo Mammana, Alex Wang, Cristi Fati, Diego Montes, Jan Hajek, Laurentiu", "bbox": {"l": 333.39099, "t": 699.387367, "r": 558.20001, "b": 705.900894, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 24, "label": "page_header", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.7984216809272766, "cells": [{"id": 0, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 246.24382, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar", "bbox": {"l": 253.13897999999998, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "text", "bbox": {"l": 53.501999, "t": 86.87292000000002, "r": 295.64868, "b": 150.14111000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9824112057685852, "cells": [{"id": 2, "text": "Table 5: Prediction Performance (mAP@0.5-0.95) of a Mask", "bbox": {"l": 53.501999, "t": 86.87292000000002, "r": 294.32153, "b": 95.34618999999998, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "R-CNN R50 network across the PubLayNet, DocBank & Do-", "bbox": {"l": 53.79800000000001, "t": 97.83191, "r": 295.64868, "b": 106.30517999999995, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "cLayNet data-sets. By evaluating on common label classes of", "bbox": {"l": 53.79800000000001, "t": 108.79088999999999, "r": 294.0437, "b": 117.26415999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "each dataset, we observe that the DocLayNet-trained model", "bbox": {"l": 53.79800000000001, "t": 119.74987999999996, "r": 294.04373, "b": 128.22313999999994, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "has much less pronounced variations in performance across", "bbox": {"l": 53.79800000000001, "t": 130.70885999999996, "r": 294.0437, "b": 139.18213000000003, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "all datasets.", "bbox": {"l": 53.79800000000001, "t": 141.66785000000004, "r": 101.15852, "b": 150.14111000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "table", "bbox": {"l": 72.6590347290039, "t": 172.48080444335938, "r": 274.83465576171875, "b": 339.8540344238281, "coord_origin": "TOPLEFT"}, "confidence": 0.9892616271972656, "cells": [{"id": 8, "text": "Testing on", "bbox": {"l": 217.74099999999999, "t": 175.01855, "r": 256.26065, "b": 183.39319, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Training on", "bbox": {"l": 89.954002, "t": 185.97655999999995, "r": 133.24379, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "labels", "bbox": {"l": 154.629, "t": 185.97655999999995, "r": 175.47588, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "PLN", "bbox": {"l": 204.69, "t": 185.97655999999995, "r": 220.54260000000002, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "DB", "bbox": {"l": 230.50427000000002, "t": 185.97655999999995, "r": 242.06197, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "DLN", "bbox": {"l": 252.02364, "t": 185.97655999999995, "r": 269.31085, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "PubLayNet (PLN)", "bbox": {"l": 78.530998, "t": 219.25256000000002, "r": 142.56006, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Figure", "bbox": {"l": 154.629, "t": 197.33452999999997, "r": 177.92371, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "96", "bbox": {"l": 208.44701, "t": 197.33452999999997, "r": 216.78575000000004, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "43", "bbox": {"l": 232.1183, "t": 197.33452999999997, "r": 240.45705, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "23", "bbox": {"l": 256.49792, "t": 197.33452999999997, "r": 264.83667, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Sec-header", "bbox": {"l": 154.629, "t": 208.29351999999994, "r": 194.72675, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "87", "bbox": {"l": 208.44701, "t": 208.29351999999994, "r": 216.78575000000004, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "-", "bbox": {"l": 234.77235, "t": 208.29351999999994, "r": 237.80299000000002, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "32", "bbox": {"l": 256.49792, "t": 208.29351999999994, "r": 264.83667, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Table", "bbox": {"l": 154.629, "t": 219.25256000000002, "r": 174.43578, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "95", "bbox": {"l": 208.44701, "t": 219.25256000000002, "r": 216.78575000000004, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "24", "bbox": {"l": 232.1183, "t": 219.25256000000002, "r": 240.45705, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "49", "bbox": {"l": 256.49792, "t": 219.25256000000002, "r": 264.83667, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Text", "bbox": {"l": 154.629, "t": 230.21155, "r": 170.58919, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "96", "bbox": {"l": 208.44701, "t": 230.21155, "r": 216.78575000000004, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "-", "bbox": {"l": 234.77235, "t": 230.21155, "r": 237.80299000000002, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "42", "bbox": {"l": 256.49792, "t": 230.21155, "r": 264.83667, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "total", "bbox": {"l": 154.629, "t": 241.16956000000005, "r": 171.2796, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "93", "bbox": {"l": 208.44701, "t": 241.16956000000005, "r": 216.78575000000004, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "34", "bbox": {"l": 232.1183, "t": 241.16956000000005, "r": 240.45705, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "30", "bbox": {"l": 256.49792, "t": 241.16956000000005, "r": 264.83667, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "DocBank (DB)", "bbox": {"l": 78.530998, "t": 263.48650999999995, "r": 131.19963, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Figure", "bbox": {"l": 154.629, "t": 252.52752999999996, "r": 177.92371, "b": 260.90216, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "77", "bbox": {"l": 208.44701, "t": 252.52752999999996, "r": 216.78575000000004, "b": 260.90216, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "71", "bbox": {"l": 232.1183, "t": 252.52752999999996, "r": 240.45705, "b": 260.90216, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "31", "bbox": {"l": 256.49792, "t": 252.52752999999996, "r": 264.83667, "b": 260.90216, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "Table", "bbox": {"l": 154.629, "t": 263.48650999999995, "r": 174.43578, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "19", "bbox": {"l": 208.44701, "t": 263.48650999999995, "r": 216.78575000000004, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "65", "bbox": {"l": 232.1183, "t": 263.48650999999995, "r": 240.45705, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "22", "bbox": {"l": 256.49792, "t": 263.48650999999995, "r": 264.83667, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "total", "bbox": {"l": 154.629, "t": 274.44556, "r": 171.2796, "b": 282.82016, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "48", "bbox": {"l": 208.44701, "t": 274.44556, "r": 216.78575000000004, "b": 282.82016, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "68", "bbox": {"l": 232.1183, "t": 274.44556, "r": 240.45705, "b": 282.82016, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "27", "bbox": {"l": 256.49792, "t": 274.44556, "r": 264.83667, "b": 282.82016, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "DocLayNet (DLN)", "bbox": {"l": 78.530998, "t": 307.72055, "r": 144.66716, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "Figure", "bbox": {"l": 154.629, "t": 285.80255, "r": 177.92371, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "67", "bbox": {"l": 208.44701, "t": 285.80255, "r": 216.78575000000004, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "51", "bbox": {"l": 232.1183, "t": 285.80255, "r": 240.45705, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "72", "bbox": {"l": 256.49792, "t": 285.80255, "r": 264.83667, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Sec-header", "bbox": {"l": 154.629, "t": 296.76154, "r": 194.72675, "b": 305.13617, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "53", "bbox": {"l": 208.44701, "t": 296.76154, "r": 216.78575000000004, "b": 305.13617, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "-", "bbox": {"l": 234.77235, "t": 296.76154, "r": 237.80299000000002, "b": 305.13617, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "68", "bbox": {"l": 256.49792, "t": 296.76154, "r": 264.83667, "b": 305.13617, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Table", "bbox": {"l": 154.629, "t": 307.72055, "r": 174.43578, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "87", "bbox": {"l": 208.44701, "t": 307.72055, "r": 216.78575000000004, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "43", "bbox": {"l": 232.1183, "t": 307.72055, "r": 240.45705, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "82", "bbox": {"l": 256.49792, "t": 307.72055, "r": 264.83667, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "Text", "bbox": {"l": 154.629, "t": 318.67953, "r": 170.58919, "b": 327.05417, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "77", "bbox": {"l": 208.44701, "t": 318.67953, "r": 216.78575000000004, "b": 327.05417, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "-", "bbox": {"l": 234.77235, "t": 318.67953, "r": 237.80299000000002, "b": 327.05417, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "84", "bbox": {"l": 256.49792, "t": 318.67953, "r": 264.83667, "b": 327.05417, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "total", "bbox": {"l": 154.629, "t": 329.63855, "r": 171.2796, "b": 338.01318, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "59", "bbox": {"l": 208.44701, "t": 329.63855, "r": 216.78575000000004, "b": 338.01318, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "47", "bbox": {"l": 232.1183, "t": 329.63855, "r": 240.45705, "b": 338.01318, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "78", "bbox": {"l": 256.49792, "t": 329.63855, "r": 264.83667, "b": 338.01318, "coord_origin": "TOPLEFT"}}], "children": [{"id": 25, "label": "text", "bbox": {"l": 217.74099999999999, "t": 175.01855, "r": 256.26065, "b": 183.39319, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "Testing on", "bbox": {"l": 217.74099999999999, "t": 175.01855, "r": 256.26065, "b": 183.39319, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 89.954002, "t": 185.97655999999995, "r": 133.24379, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "Training on", "bbox": {"l": 89.954002, "t": 185.97655999999995, "r": 133.24379, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 154.629, "t": 185.97655999999995, "r": 175.47588, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "labels", "bbox": {"l": 154.629, "t": 185.97655999999995, "r": 175.47588, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 204.69, "t": 185.97655999999995, "r": 220.54260000000002, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "PLN", "bbox": {"l": 204.69, "t": 185.97655999999995, "r": 220.54260000000002, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 230.50427000000002, "t": 185.97655999999995, "r": 242.06197, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "DB", "bbox": {"l": 230.50427000000002, "t": 185.97655999999995, "r": 242.06197, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 252.02364, "t": 185.97655999999995, "r": 269.31085, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "DLN", "bbox": {"l": 252.02364, "t": 185.97655999999995, "r": 269.31085, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 78.530998, "t": 219.25256000000002, "r": 142.56006, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "PubLayNet (PLN)", "bbox": {"l": 78.530998, "t": 219.25256000000002, "r": 142.56006, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 154.629, "t": 197.33452999999997, "r": 177.92371, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "Figure", "bbox": {"l": 154.629, "t": 197.33452999999997, "r": 177.92371, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 208.44701, "t": 197.33452999999997, "r": 216.78575000000004, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "96", "bbox": {"l": 208.44701, "t": 197.33452999999997, "r": 216.78575000000004, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 232.1183, "t": 197.33452999999997, "r": 240.45705, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "43", "bbox": {"l": 232.1183, "t": 197.33452999999997, "r": 240.45705, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 256.49792, "t": 197.33452999999997, "r": 264.83667, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "23", "bbox": {"l": 256.49792, "t": 197.33452999999997, "r": 264.83667, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 154.629, "t": 208.29351999999994, "r": 194.72675, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "Sec-header", "bbox": {"l": 154.629, "t": 208.29351999999994, "r": 194.72675, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 208.44701, "t": 208.29351999999994, "r": 216.78575000000004, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "87", "bbox": {"l": 208.44701, "t": 208.29351999999994, "r": 216.78575000000004, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 234.77235, "t": 208.29351999999994, "r": 237.80299000000002, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "-", "bbox": {"l": 234.77235, "t": 208.29351999999994, "r": 237.80299000000002, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 256.49792, "t": 208.29351999999994, "r": 264.83667, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "32", "bbox": {"l": 256.49792, "t": 208.29351999999994, "r": 264.83667, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 154.629, "t": 219.25256000000002, "r": 174.43578, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "Table", "bbox": {"l": 154.629, "t": 219.25256000000002, "r": 174.43578, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 208.44701, "t": 219.25256000000002, "r": 216.78575000000004, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "95", "bbox": {"l": 208.44701, "t": 219.25256000000002, "r": 216.78575000000004, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 232.1183, "t": 219.25256000000002, "r": 240.45705, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "24", "bbox": {"l": 232.1183, "t": 219.25256000000002, "r": 240.45705, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 256.49792, "t": 219.25256000000002, "r": 264.83667, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "49", "bbox": {"l": 256.49792, "t": 219.25256000000002, "r": 264.83667, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 154.629, "t": 230.21155, "r": 170.58919, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "Text", "bbox": {"l": 154.629, "t": 230.21155, "r": 170.58919, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 208.44701, "t": 230.21155, "r": 216.78575000000004, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "96", "bbox": {"l": 208.44701, "t": 230.21155, "r": 216.78575000000004, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 234.77235, "t": 230.21155, "r": 237.80299000000002, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "-", "bbox": {"l": 234.77235, "t": 230.21155, "r": 237.80299000000002, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 256.49792, "t": 230.21155, "r": 264.83667, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "42", "bbox": {"l": 256.49792, "t": 230.21155, "r": 264.83667, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 154.629, "t": 241.16956000000005, "r": 171.2796, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "total", "bbox": {"l": 154.629, "t": 241.16956000000005, "r": 171.2796, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 208.44701, "t": 241.16956000000005, "r": 216.78575000000004, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "93", "bbox": {"l": 208.44701, "t": 241.16956000000005, "r": 216.78575000000004, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 232.1183, "t": 241.16956000000005, "r": 240.45705, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "34", "bbox": {"l": 232.1183, "t": 241.16956000000005, "r": 240.45705, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 256.49792, "t": 241.16956000000005, "r": 264.83667, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "30", "bbox": {"l": 256.49792, "t": 241.16956000000005, "r": 264.83667, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 78.530998, "t": 263.48650999999995, "r": 131.19963, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "DocBank (DB)", "bbox": {"l": 78.530998, "t": 263.48650999999995, "r": 131.19963, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 154.629, "t": 252.52752999999996, "r": 177.92371, "b": 260.90216, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "Figure", "bbox": {"l": 154.629, "t": 252.52752999999996, "r": 177.92371, "b": 260.90216, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 208.44701, "t": 252.52752999999996, "r": 216.78575000000004, "b": 260.90216, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "77", "bbox": {"l": 208.44701, "t": 252.52752999999996, "r": 216.78575000000004, "b": 260.90216, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 232.1183, "t": 252.52752999999996, "r": 240.45705, "b": 260.90216, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "71", "bbox": {"l": 232.1183, "t": 252.52752999999996, "r": 240.45705, "b": 260.90216, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 256.49792, "t": 252.52752999999996, "r": 264.83667, "b": 260.90216, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "31", "bbox": {"l": 256.49792, "t": 252.52752999999996, "r": 264.83667, "b": 260.90216, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 154.629, "t": 263.48650999999995, "r": 174.43578, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "Table", "bbox": {"l": 154.629, "t": 263.48650999999995, "r": 174.43578, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 208.44701, "t": 263.48650999999995, "r": 216.78575000000004, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "19", "bbox": {"l": 208.44701, "t": 263.48650999999995, "r": 216.78575000000004, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 232.1183, "t": 263.48650999999995, "r": 240.45705, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "65", "bbox": {"l": 232.1183, "t": 263.48650999999995, "r": 240.45705, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 256.49792, "t": 263.48650999999995, "r": 264.83667, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "22", "bbox": {"l": 256.49792, "t": 263.48650999999995, "r": 264.83667, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 154.629, "t": 274.44556, "r": 171.2796, "b": 282.82016, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "total", "bbox": {"l": 154.629, "t": 274.44556, "r": 171.2796, "b": 282.82016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 208.44701, "t": 274.44556, "r": 216.78575000000004, "b": 282.82016, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "48", "bbox": {"l": 208.44701, "t": 274.44556, "r": 216.78575000000004, "b": 282.82016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 232.1183, "t": 274.44556, "r": 240.45705, "b": 282.82016, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "68", "bbox": {"l": 232.1183, "t": 274.44556, "r": 240.45705, "b": 282.82016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 256.49792, "t": 274.44556, "r": 264.83667, "b": 282.82016, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "27", "bbox": {"l": 256.49792, "t": 274.44556, "r": 264.83667, "b": 282.82016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 78.530998, "t": 307.72055, "r": 144.66716, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "DocLayNet (DLN)", "bbox": {"l": 78.530998, "t": 307.72055, "r": 144.66716, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 154.629, "t": 285.80255, "r": 177.92371, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "Figure", "bbox": {"l": 154.629, "t": 285.80255, "r": 177.92371, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 208.44701, "t": 285.80255, "r": 216.78575000000004, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "67", "bbox": {"l": 208.44701, "t": 285.80255, "r": 216.78575000000004, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 232.1183, "t": 285.80255, "r": 240.45705, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "51", "bbox": {"l": 232.1183, "t": 285.80255, "r": 240.45705, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 256.49792, "t": 285.80255, "r": 264.83667, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "72", "bbox": {"l": 256.49792, "t": 285.80255, "r": 264.83667, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 154.629, "t": 296.76154, "r": 194.72675, "b": 305.13617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "Sec-header", "bbox": {"l": 154.629, "t": 296.76154, "r": 194.72675, "b": 305.13617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 208.44701, "t": 296.76154, "r": 216.78575000000004, "b": 305.13617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "53", "bbox": {"l": 208.44701, "t": 296.76154, "r": 216.78575000000004, "b": 305.13617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 234.77235, "t": 296.76154, "r": 237.80299000000002, "b": 305.13617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "-", "bbox": {"l": 234.77235, "t": 296.76154, "r": 237.80299000000002, "b": 305.13617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 256.49792, "t": 296.76154, "r": 264.83667, "b": 305.13617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "68", "bbox": {"l": 256.49792, "t": 296.76154, "r": 264.83667, "b": 305.13617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 154.629, "t": 307.72055, "r": 174.43578, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "Table", "bbox": {"l": 154.629, "t": 307.72055, "r": 174.43578, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 208.44701, "t": 307.72055, "r": 216.78575000000004, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "87", "bbox": {"l": 208.44701, "t": 307.72055, "r": 216.78575000000004, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 232.1183, "t": 307.72055, "r": 240.45705, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "43", "bbox": {"l": 232.1183, "t": 307.72055, "r": 240.45705, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 256.49792, "t": 307.72055, "r": 264.83667, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "82", "bbox": {"l": 256.49792, "t": 307.72055, "r": 264.83667, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 154.629, "t": 318.67953, "r": 170.58919, "b": 327.05417, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "Text", "bbox": {"l": 154.629, "t": 318.67953, "r": 170.58919, "b": 327.05417, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 208.44701, "t": 318.67953, "r": 216.78575000000004, "b": 327.05417, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "77", "bbox": {"l": 208.44701, "t": 318.67953, "r": 216.78575000000004, "b": 327.05417, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 234.77235, "t": 318.67953, "r": 237.80299000000002, "b": 327.05417, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "-", "bbox": {"l": 234.77235, "t": 318.67953, "r": 237.80299000000002, "b": 327.05417, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 256.49792, "t": 318.67953, "r": 264.83667, "b": 327.05417, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "84", "bbox": {"l": 256.49792, "t": 318.67953, "r": 264.83667, "b": 327.05417, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 154.629, "t": 329.63855, "r": 171.2796, "b": 338.01318, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "total", "bbox": {"l": 154.629, "t": 329.63855, "r": 171.2796, "b": 338.01318, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 208.44701, "t": 329.63855, "r": 216.78575000000004, "b": 338.01318, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "59", "bbox": {"l": 208.44701, "t": 329.63855, "r": 216.78575000000004, "b": 338.01318, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 232.1183, "t": 329.63855, "r": 240.45705, "b": 338.01318, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "47", "bbox": {"l": 232.1183, "t": 329.63855, "r": 240.45705, "b": 338.01318, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 256.49792, "t": 329.63855, "r": 264.83667, "b": 338.01318, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "78", "bbox": {"l": 256.49792, "t": 329.63855, "r": 264.83667, "b": 338.01318, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 4, "label": "text", "bbox": {"l": 53.79800000000001, "t": 390.92053, "r": 294.04712, "b": 443.14014, "coord_origin": "TOPLEFT"}, "confidence": 0.9839397668838501, "cells": [{"id": 69, "text": "Section-header", "bbox": {"l": 53.79800000000001, "t": 390.96539, "r": 106.2392, "b": 399.30414, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": ",", "bbox": {"l": 106.239, "t": 390.92053, "r": 108.23331, "b": 399.2951699999999, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Table", "bbox": {"l": 110.482, "t": 390.96539, "r": 129.76332, "b": 399.30414, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "and", "bbox": {"l": 132.21899, "t": 390.92053, "r": 145.86186, "b": 399.2951699999999, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "Text", "bbox": {"l": 148.112, "t": 390.96539, "r": 163.14182, "b": 399.30414, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": ". Before training, we either mapped", "bbox": {"l": 163.13901, "t": 390.92053, "r": 294.04709, "b": 399.2951699999999, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "or excluded DocLayNet\u2019s other labels as specified in table 3, and", "bbox": {"l": 53.79800000000001, "t": 401.87954999999994, "r": 294.04712, "b": 410.25418, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "also PubLayNet\u2019s", "bbox": {"l": 53.79800000000001, "t": 412.83853, "r": 117.12856, "b": 421.21317, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "List", "bbox": {"l": 119.362, "t": 412.88339, "r": 132.4342, "b": 421.22214, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "to", "bbox": {"l": 135.177, "t": 412.83853, "r": 142.54416, "b": 421.21317, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "Text", "bbox": {"l": 144.77901, "t": 412.88339, "r": 159.66605, "b": 421.22214, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": ". Note that the different clustering of", "bbox": {"l": 159.66701, "t": 412.83853, "r": 294.04562, "b": 421.21317, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "lists (by list-element vs. whole list objects) naturally decreases the", "bbox": {"l": 53.79800000000001, "t": 423.79755, "r": 294.04614, "b": 432.17217999999997, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "mAP score for", "bbox": {"l": 53.79800000000001, "t": 434.75653, "r": 106.2066, "b": 443.13116, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "Text", "bbox": {"l": 108.448, "t": 434.80139, "r": 123.30533, "b": 443.14014, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": ".", "bbox": {"l": 123.305, "t": 434.75653, "r": 125.27761000000001, "b": 443.13116, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 53.466999, "t": 445.71453999999994, "r": 295.55908, "b": 585.59618, "coord_origin": "TOPLEFT"}, "confidence": 0.9868056774139404, "cells": [{"id": 85, "text": "For comparison of DocBank with DocLayNet, we trained only", "bbox": {"l": 63.76100199999999, "t": 445.71453999999994, "r": 294.27582, "b": 454.08917, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "on", "bbox": {"l": 53.79800000000001, "t": 456.67355, "r": 62.989277, "b": 465.04819, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Picture", "bbox": {"l": 64.852997, "t": 456.71841, "r": 88.947144, "b": 465.05716, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "and", "bbox": {"l": 91.019997, "t": 456.67355, "r": 104.24454, "b": 465.04819, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "Table", "bbox": {"l": 106.108, "t": 456.71841, "r": 124.78053, "b": 465.05716, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "clusters of each dataset. We had to exclude", "bbox": {"l": 126.85500000000002, "t": 456.67355, "r": 277.63235, "b": 465.04819, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "Text", "bbox": {"l": 279.49701, "t": 456.71841, "r": 294.0484, "b": 465.05716, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "because successive paragraphs are often grouped together into a", "bbox": {"l": 53.79800000000001, "t": 467.63254, "r": 294.04709, "b": 476.00717, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "single object in DocBank. This paragraph grouping is incompatible", "bbox": {"l": 53.79800000000001, "t": 478.59155, "r": 294.04532, "b": 486.96619, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "with the individual paragraphs of DocLayNet. As can be seen in", "bbox": {"l": 53.466999, "t": 489.55054, "r": 294.04538, "b": 497.92517, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "Table 5, DocLayNet trained models yield better performance com-", "bbox": {"l": 53.528999, "t": 500.50955, "r": 295.55908, "b": 508.88419, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "pared to the previous datasets. It is noteworthy that the models", "bbox": {"l": 53.79800000000001, "t": 511.46854, "r": 294.04712, "b": 519.84317, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "trained on PubLayNet and DocBank perform very well on their", "bbox": {"l": 53.79800000000001, "t": 522.42755, "r": 294.21179, "b": 530.80219, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "own test set, but have a much lower performance on the foreign", "bbox": {"l": 53.79800000000001, "t": 533.38654, "r": 294.04712, "b": 541.76117, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "datasets. While this also applies to DocLayNet, the difference is", "bbox": {"l": 53.79800000000001, "t": 544.34555, "r": 294.04715, "b": 552.72017, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "far less pronounced. Thus we conclude that DocLayNet trained", "bbox": {"l": 53.79800000000001, "t": 555.3045500000001, "r": 294.04712, "b": 563.67917, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "models are overall more robust and will produce better results for", "bbox": {"l": 53.79800000000001, "t": 566.26256, "r": 294.21411, "b": 574.63718, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "challenging, unseen layouts.", "bbox": {"l": 53.79800000000001, "t": 577.22156, "r": 157.52132, "b": 585.59618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "section_header", "bbox": {"l": 53.79800000000001, "t": 605.06091, "r": 156.00534, "b": 615.37001, "coord_origin": "TOPLEFT"}, "confidence": 0.9574698805809021, "cells": [{"id": 103, "text": "Example Predictions", "bbox": {"l": 53.79800000000001, "t": 605.06091, "r": 156.00534, "b": 615.37001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 53.528999, "t": 620.26355, "r": 295.55844, "b": 705.350174, "coord_origin": "TOPLEFT"}, "confidence": 0.9859886169433594, "cells": [{"id": 104, "text": "To conclude this section, we illustrate the quality of layout predic-", "bbox": {"l": 53.528999, "t": 620.26355, "r": 295.5571, "b": 628.63817, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "tions one can expect from DocLayNet-trained models by providing", "bbox": {"l": 53.79800000000001, "t": 631.22255, "r": 294.04532, "b": 639.59717, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "a selection of examples without any further post-processing ap-", "bbox": {"l": 53.79800000000001, "t": 642.18155, "r": 295.55618, "b": 650.5561700000001, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "plied. Figure 6 shows selected layout predictions on pages from the", "bbox": {"l": 53.79800000000001, "t": 653.14055, "r": 294.04541, "b": 661.51517, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "test-set of DocLayNet. Results look decent in general across docu-", "bbox": {"l": 53.79800000000001, "t": 664.09956, "r": 295.55844, "b": 672.47417, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "ment categories, however one can also observe mistakes such as", "bbox": {"l": 53.79800000000001, "t": 675.05756, "r": 294.04712, "b": 683.43217, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "overlapping clusters of different classes, or entirely missing boxes", "bbox": {"l": 53.79800000000001, "t": 686.01656, "r": 294.04535, "b": 694.391174, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "due to low confidence.", "bbox": {"l": 53.79800000000001, "t": 696.975555, "r": 136.07368, "b": 705.350174, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "section_header", "bbox": {"l": 317.95502, "t": 85.85986000000003, "r": 405.72961, "b": 96.16900999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.931998074054718, "cells": [{"id": 112, "text": "6", "bbox": {"l": 317.95502, "t": 85.85986000000003, "r": 323.56229, "b": 96.16900999999996, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "CONCLUSION", "bbox": {"l": 334.47137, "t": 85.85986000000003, "r": 405.72961, "b": 96.16900999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 317.95499, "t": 101.06151999999997, "r": 559.71375, "b": 186.14917000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.985493004322052, "cells": [{"id": 114, "text": "In this paper, we presented the DocLayNet dataset. It provides the", "bbox": {"l": 317.95499, "t": 101.06151999999997, "r": 558.2038, "b": 109.43615999999997, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "document conversion and layout analysis research community a", "bbox": {"l": 317.95499, "t": 112.02057000000002, "r": 558.2041, "b": 120.39520000000005, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "new and challenging dataset to improve and fine-tune novel ML", "bbox": {"l": 317.95499, "t": 122.97955000000002, "r": 558.43274, "b": 131.35419000000002, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "methods on. In contrast to many other datasets, DocLayNet was", "bbox": {"l": 317.95499, "t": 133.93854, "r": 558.20416, "b": 142.31317, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "created by human annotation in order to obtain reliable layout", "bbox": {"l": 317.95499, "t": 144.89752, "r": 558.20422, "b": 153.27215999999999, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "ground-truth on a wide variety of publication- and typesetting-", "bbox": {"l": 317.95499, "t": 155.85657000000003, "r": 559.71313, "b": 164.23119999999994, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "styles. Including a large proportion of documents outside the scien-", "bbox": {"l": 317.95499, "t": 166.81555000000003, "r": 559.71375, "b": 175.19019000000003, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "tific publishing domain adds significant value in this respect.", "bbox": {"l": 317.95499, "t": 177.77454, "r": 540.04382, "b": 186.14917000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "text", "bbox": {"l": 317.686, "t": 188.73352, "r": 559.71704, "b": 284.77917, "coord_origin": "TOPLEFT"}, "confidence": 0.9800531268119812, "cells": [{"id": 122, "text": "From the dataset, we have derived on the one hand reference", "bbox": {"l": 327.918, "t": 188.73352, "r": 558.19836, "b": 197.10815000000002, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "metrics for human performance on document-layout annotation", "bbox": {"l": 317.95499, "t": 199.69257000000005, "r": 558.20404, "b": 208.06719999999996, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "(through double and triple annotations) and on the other hand eval-", "bbox": {"l": 317.686, "t": 210.65155000000004, "r": 559.71704, "b": 219.02617999999995, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "uated the baseline performance of commonly used object detection", "bbox": {"l": 317.95499, "t": 221.60956, "r": 558.20245, "b": 229.98419, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "methods. We also illustrated the impact of various dataset-related", "bbox": {"l": 317.95499, "t": 232.56853999999998, "r": 558.20502, "b": 240.94317999999998, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "aspects on model performance through data-ablation experiments,", "bbox": {"l": 317.95499, "t": 243.52752999999996, "r": 559.18408, "b": 251.90215999999998, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "both from a size and class-label perspective. Last but not least, we", "bbox": {"l": 317.95499, "t": 254.48650999999995, "r": 558.20227, "b": 262.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "compared the accuracy of models trained on other public datasets", "bbox": {"l": 317.95499, "t": 265.44556, "r": 558.20349, "b": 273.82019, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "and showed that DocLayNet trained models are more robust.", "bbox": {"l": 317.95499, "t": 276.40454, "r": 540.99426, "b": 284.77917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "text", "bbox": {"l": 317.62299, "t": 287.36353, "r": 558.43469, "b": 317.65616000000006, "coord_origin": "TOPLEFT"}, "confidence": 0.9676101207733154, "cells": [{"id": 131, "text": "To date, there is still a significant gap between human and ML", "bbox": {"l": 327.918, "t": 287.36353, "r": 558.43469, "b": 295.73816, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "accuracy on the layout interpretation task, and we hope that this", "bbox": {"l": 317.95499, "t": 298.32254, "r": 558.20013, "b": 306.69717, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "work will inspire the research community to close that gap.", "bbox": {"l": 317.62299, "t": 309.28152, "r": 535.65015, "b": 317.65616000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "section_header", "bbox": {"l": 317.95499, "t": 335.09189, "r": 387.3696, "b": 345.40097, "coord_origin": "TOPLEFT"}, "confidence": 0.9378752708435059, "cells": [{"id": 134, "text": "REFERENCES", "bbox": {"l": 317.95499, "t": 335.09189, "r": 387.3696, "b": 345.40097, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "list_item", "bbox": {"l": 321.198, "t": 348.70233, "r": 558.20099, "b": 371.16286999999994, "coord_origin": "TOPLEFT"}, "confidence": 0.9372857213020325, "cells": [{"id": 135, "text": "[1]", "bbox": {"l": 321.198, "t": 348.70233, "r": 329.72415, "b": 355.21588, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "Max G\u00f6bel, Tamir Hassan, Ermelinda Oro, and Giorgio Orsi. Icdar 2013 table", "bbox": {"l": 331.53516, "t": 348.70233, "r": 558.19904, "b": 355.21588, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "competition. In", "bbox": {"l": 333.39099, "t": 356.67236, "r": 379.36414, "b": 363.18591, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "2013 12th International Conference on Document Analysis and", "bbox": {"l": 381.37201, "t": 356.70724, "r": 558.20099, "b": 363.19287, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "Recognition", "bbox": {"l": 333.39099, "t": 364.67724999999996, "r": 365.59601, "b": 371.16286999999994, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": ", pages 1449-1453, 2013.", "bbox": {"l": 365.59601, "t": 364.64236, "r": 434.29489, "b": 371.15591, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "list_item", "bbox": {"l": 321.198, "t": 372.61237, "r": 559.37982, "b": 403.04287999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9480945467948914, "cells": [{"id": 141, "text": "[2]", "bbox": {"l": 321.198, "t": 372.61237, "r": 329.85956, "b": 379.12592, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "Christian Clausner, Apostolos Antonacopoulos, and Stefan Pletschacher. Ic-", "bbox": {"l": 331.69931, "t": 372.61237, "r": 559.37976, "b": 379.12592, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "dar2017 competition on recognition of documents with complex layouts -", "bbox": {"l": 333.39099, "t": 380.58237, "r": 559.37982, "b": 387.09592, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "rdcl2017. In", "bbox": {"l": 333.39099, "t": 388.55236999999994, "r": 367.4339, "b": 395.06592, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "2017 14th IAPR International Conference on Document Analysis and", "bbox": {"l": 369.17401, "t": 388.58725000000004, "r": 558.20422, "b": 395.07288, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "Recognition (ICDAR)", "bbox": {"l": 333.39099, "t": 396.55725, "r": 390.87601, "b": 403.04287999999997, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": ", volume 01, pages 1404-1410, 2017.", "bbox": {"l": 390.87698, "t": 396.52237, "r": 492.17831, "b": 403.03592, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "list_item", "bbox": {"l": 321.198, "t": 404.49237, "r": 558.20013, "b": 426.94689999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9257517457008362, "cells": [{"id": 148, "text": "[3]", "bbox": {"l": 321.198, "t": 404.49237, "r": 329.53583, "b": 411.00592, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "Herv\u00e9 D\u00e9jean, Jean-Luc Meunier, Liangcai Gao, Yilun Huang, Yu Fang, Florian", "bbox": {"l": 331.30682, "t": 404.49237, "r": 558.19958, "b": 411.00592, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "Kleber, and Eva-Maria Lang. ICDAR 2019 Competition on Table Detection and", "bbox": {"l": 333.39099, "t": 412.46335, "r": 558.20013, "b": 418.9769, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "Recognition (cTDaR), April 2019. http://sac.founderit.com/.", "bbox": {"l": 333.39099, "t": 420.43335, "r": 501.80127, "b": 426.94689999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "list_item", "bbox": {"l": 321.198, "t": 428.40335, "r": 559.37872, "b": 458.8269, "coord_origin": "TOPLEFT"}, "confidence": 0.9270977973937988, "cells": [{"id": 152, "text": "[4]", "bbox": {"l": 321.198, "t": 428.40335, "r": 329.91299, "b": 434.9169, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "Antonio Jimeno Yepes, Peter Zhong, and Douglas Burdick. Competition on", "bbox": {"l": 331.7641, "t": 428.40335, "r": 558.19885, "b": 434.9169, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "scientific literature parsing. In", "bbox": {"l": 333.39099, "t": 436.3733500000001, "r": 423.77225, "b": 442.8869, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "Proceedings of the International Conference on", "bbox": {"l": 425.909, "t": 436.40823, "r": 558.20178, "b": 442.89386, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "Document Analysis and Recognition", "bbox": {"l": 333.39099, "t": 444.37823, "r": 429.42697, "b": 450.86386, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": ", ICDAR, pages 605-617. LNCS 12824, Springer-", "bbox": {"l": 429.42400999999995, "t": 444.34335, "r": 559.37872, "b": 450.85689999999994, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "Verlag, sep 2021.", "bbox": {"l": 332.819, "t": 452.31335, "r": 380.01764, "b": 458.8269, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "list_item", "bbox": {"l": 321.198, "t": 460.28336, "r": 559.02625, "b": 490.70792, "coord_origin": "TOPLEFT"}, "confidence": 0.9290012121200562, "cells": [{"id": 159, "text": "[5]", "bbox": {"l": 321.198, "t": 460.28336, "r": 329.22977, "b": 466.79691, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "Logan Markewich, Hao Zhang, Yubin Xing, Navid Lambert-Shirzad, Jiang Zhexin,", "bbox": {"l": 330.93576, "t": 460.28336, "r": 558.97156, "b": 466.79691, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "Roy Lee, Zhi Li, and Seok-Bum Ko. Segmentation for document layout analysis:", "bbox": {"l": 333.39099, "t": 468.25336, "r": 559.02625, "b": 474.76691, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "not dead yet.", "bbox": {"l": 333.39099, "t": 476.22437, "r": 368.85431, "b": 482.73792, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "International Journal on Document Analysis and Recognition (IJDAR)", "bbox": {"l": 370.811, "t": 476.25925, "r": 557.46326, "b": 482.74487, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": ",", "bbox": {"l": 557.46503, "t": 476.22437, "r": 558.96857, "b": 482.73792, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "pages 1-11, 01 2022.", "bbox": {"l": 333.39099, "t": 484.19437, "r": 390.82715, "b": 490.70792, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "list_item", "bbox": {"l": 321.198, "t": 492.16437, "r": 558.20361, "b": 514.6248800000001, "coord_origin": "TOPLEFT"}, "confidence": 0.927480161190033, "cells": [{"id": 166, "text": "[6]", "bbox": {"l": 321.198, "t": 492.16437, "r": 329.42145, "b": 498.67792, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "Xu Zhong, Jianbin Tang, and Antonio Jimeno-Yepes. Publaynet: Largest dataset", "bbox": {"l": 331.16812, "t": 492.16437, "r": 558.20361, "b": 498.67792, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "ever for document layout analysis. In", "bbox": {"l": 333.39099, "t": 500.13437, "r": 438.6101100000001, "b": 506.64792, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "Proceedings of the International Conference", "bbox": {"l": 440.349, "t": 500.16925, "r": 558.19958, "b": 506.65488, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "on Document Analysis and Recognition", "bbox": {"l": 333.39099, "t": 508.13925, "r": 441.40118, "b": 514.6248800000001, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": ", ICDAR, pages 1015-1022, sep 2019.", "bbox": {"l": 441.4019799999999, "t": 508.10437, "r": 544.78162, "b": 514.61792, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "list_item", "bbox": {"l": 321.19797, "t": 516.07437, "r": 558.9715, "b": 554.46889, "coord_origin": "TOPLEFT"}, "confidence": 0.9426893591880798, "cells": [{"id": 172, "text": "[7]", "bbox": {"l": 321.19797, "t": 516.07437, "r": 329.74161, "b": 522.5879199999999, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "Minghao Li, Yiheng Xu, Lei Cui, Shaohan Huang, Furu Wei, Zhoujun Li, and", "bbox": {"l": 331.55634, "t": 516.07437, "r": 558.19897, "b": 522.5879199999999, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "Ming Zhou. Docbank: A benchmark dataset for document layout analysis. In", "bbox": {"l": 333.39099, "t": 524.0443700000001, "r": 558.19891, "b": 530.55792, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "Proceedings of the 28th International Conference on Computational Linguistics", "bbox": {"l": 333.39099, "t": 532.04922, "r": 557.40228, "b": 538.53487, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": ",", "bbox": {"l": 557.40399, "t": 532.01437, "r": 558.96893, "b": 538.5278900000001, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "COLING, pages 949-960. International Committee on Computational Linguistics,", "bbox": {"l": 333.39099, "t": 539.98438, "r": 558.9715, "b": 546.49789, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "dec 2020.", "bbox": {"l": 333.39099, "t": 547.95535, "r": 359.31955, "b": 554.46889, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "list_item", "bbox": {"l": 321.198, "t": 555.92535, "r": 558.90222, "b": 578.38586, "coord_origin": "TOPLEFT"}, "confidence": 0.9139686226844788, "cells": [{"id": 179, "text": "[8]", "bbox": {"l": 321.198, "t": 555.92535, "r": 329.7088, "b": 562.43889, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "Riaz Ahmad, Muhammad Tanvir Afzal, and M. Qadir. Information extraction", "bbox": {"l": 331.51654, "t": 555.92535, "r": 558.19891, "b": 562.43889, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "from pdf sources based on rule-based system using integrated formats. In", "bbox": {"l": 333.39099, "t": 563.89536, "r": 535.54352, "b": 570.40889, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "SemWe-", "bbox": {"l": 536.96399, "t": 563.93024, "r": 558.90222, "b": 570.4158600000001, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "bEval@ESWC", "bbox": {"l": 333.39099, "t": 571.9002399999999, "r": 371.94217, "b": 578.38586, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": ", 2016.", "bbox": {"l": 371.94299, "t": 571.86536, "r": 389.72617, "b": 578.3788900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "list_item", "bbox": {"l": 321.198, "t": 579.83536, "r": 559.27448, "b": 610.2589, "coord_origin": "TOPLEFT"}, "confidence": 0.9113100171089172, "cells": [{"id": 185, "text": "[9]", "bbox": {"l": 321.198, "t": 579.83536, "r": 329.45999, "b": 586.34889, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "Ross B. Girshick, Jeff Donahue, Trevor Darrell, and Jitendra Malik. Rich feature", "bbox": {"l": 331.21487, "t": 579.83536, "r": 558.19843, "b": 586.34889, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "hierarchies for accurate object detection and semantic segmentation. In", "bbox": {"l": 333.39099, "t": 587.8053600000001, "r": 543.05487, "b": 594.31889, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": "IEEE", "bbox": {"l": 544.98499, "t": 587.84024, "r": 558.20148, "b": 594.32587, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "Conference on Computer Vision and Pattern Recognition", "bbox": {"l": 333.39099, "t": 595.81024, "r": 491.61166, "b": 602.29587, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": ", CVPR, pages 580-587.", "bbox": {"l": 491.61301, "t": 595.77536, "r": 559.27448, "b": 602.28889, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "IEEE Computer Society, jun 2014.", "bbox": {"l": 333.39099, "t": 603.74536, "r": 428.59726000000006, "b": 610.2589, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "list_item", "bbox": {"l": 317.95499, "t": 611.71536, "r": 558.20203, "b": 626.20686, "coord_origin": "TOPLEFT"}, "confidence": 0.9028767347335815, "cells": [{"id": 192, "text": "[10]", "bbox": {"l": 317.95499, "t": 611.71536, "r": 329.54767, "b": 618.2289000000001, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "Ross B. Girshick. Fast R-CNN. In", "bbox": {"l": 331.31268, "t": 611.71536, "r": 425.1554, "b": 618.2289000000001, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "2015 IEEE International Conference on Computer", "bbox": {"l": 426.77802, "t": 611.75024, "r": 558.20203, "b": 618.23587, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "Vision", "bbox": {"l": 333.39099, "t": 619.72124, "r": 350.59537, "b": 626.20686, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": ", ICCV, pages 1440-1448. IEEE Computer Society, dec 2015.", "bbox": {"l": 350.59598, "t": 619.68637, "r": 518.58777, "b": 626.19989, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "list_item", "bbox": {"l": 317.95499, "t": 627.65637, "r": 558.20142, "b": 650.1168700000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9127691984176636, "cells": [{"id": 197, "text": "[11]", "bbox": {"l": 317.95499, "t": 627.65637, "r": 329.5459, "b": 634.16989, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "Shaoqing Ren, Kaiming He, Ross Girshick, and Jian Sun. Faster r-cnn: Towards", "bbox": {"l": 331.31064, "t": 627.65637, "r": 558.20142, "b": 634.16989, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "real-time object detection with region proposal networks.", "bbox": {"l": 333.39099, "t": 635.62637, "r": 497.50909, "b": 642.13989, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "IEEE Transactions on", "bbox": {"l": 500.01401, "t": 635.66124, "r": 558.19885, "b": 642.14687, "coord_origin": "TOPLEFT"}}, {"id": 201, "text": "Pattern Analysis and Machine Intelligence", "bbox": {"l": 333.39099, "t": 643.6312399999999, "r": 449.38620000000003, "b": 650.1168700000001, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": ", 39(6):1137-1149, 2017.", "bbox": {"l": 449.38699, "t": 643.59637, "r": 515.74268, "b": 650.10989, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "list_item", "bbox": {"l": 317.95499, "t": 651.56638, "r": 559.27808, "b": 674.01989, "coord_origin": "TOPLEFT"}, "confidence": 0.9142459630966187, "cells": [{"id": 203, "text": "[12]", "bbox": {"l": 317.95499, "t": 651.56638, "r": 329.41763, "b": 658.0799, "coord_origin": "TOPLEFT"}}, {"id": 204, "text": "Kaiming He, Georgia Gkioxari, Piotr Doll\u00e1r, and Ross B. Girshick. Mask R-CNN.", "bbox": {"l": 331.16287, "t": 651.56638, "r": 559.27808, "b": 658.0799, "coord_origin": "TOPLEFT"}}, {"id": 205, "text": "In", "bbox": {"l": 333.39099, "t": 659.53638, "r": 339.35904, "b": 666.0499, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": "IEEE International Conference on Computer Vision", "bbox": {"l": 341.56299, "t": 659.57124, "r": 485.8273, "b": 666.05687, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": ", ICCV, pages 2980-2988.", "bbox": {"l": 485.82901, "t": 659.53638, "r": 559.27356, "b": 666.0499, "coord_origin": "TOPLEFT"}}, {"id": 208, "text": "IEEE Computer Society, Oct 2017.", "bbox": {"l": 333.39099, "t": 667.50636, "r": 429.30161000000004, "b": 674.01989, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "list_item", "bbox": {"l": 317.95499, "t": 675.47636, "r": 558.97156, "b": 705.900894, "coord_origin": "TOPLEFT"}, "confidence": 0.889543354511261, "cells": [{"id": 209, "text": "[13]", "bbox": {"l": 317.95499, "t": 675.47636, "r": 330.11407, "b": 681.9898900000001, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": "Glenn Jocher, Alex Stoken, Ayush Chaurasia, Jirka Borovec, NanoCode012,", "bbox": {"l": 331.96533, "t": 675.47636, "r": 558.96716, "b": 681.9898900000001, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "TaoXie, Yonghye Kwon, Kalen Michael, Liu Changyu, Jiacong Fang, Abhiram V,", "bbox": {"l": 333.18201, "t": 683.44637, "r": 558.96661, "b": 689.95989, "coord_origin": "TOPLEFT"}}, {"id": 212, "text": "Laughing, tkianai, yxNONG, Piotr Skalski, Adam Hogan, Jebastin Nadar, imyhxy,", "bbox": {"l": 333.39099, "t": 691.41737, "r": 558.97156, "b": 697.930893, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "Lorenzo Mammana, Alex Wang, Cristi Fati, Diego Montes, Jan Hajek, Laurentiu", "bbox": {"l": 333.39099, "t": 699.387367, "r": 558.20001, "b": 705.900894, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {"0": {"label": "table", "id": 0, "page_no": 7, "cluster": {"id": 0, "label": "table", "bbox": {"l": 72.6590347290039, "t": 172.48080444335938, "r": 274.83465576171875, "b": 339.8540344238281, "coord_origin": "TOPLEFT"}, "confidence": 0.9892616271972656, "cells": [{"id": 8, "text": "Testing on", "bbox": {"l": 217.74099999999999, "t": 175.01855, "r": 256.26065, "b": 183.39319, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Training on", "bbox": {"l": 89.954002, "t": 185.97655999999995, "r": 133.24379, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "labels", "bbox": {"l": 154.629, "t": 185.97655999999995, "r": 175.47588, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "PLN", "bbox": {"l": 204.69, "t": 185.97655999999995, "r": 220.54260000000002, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "DB", "bbox": {"l": 230.50427000000002, "t": 185.97655999999995, "r": 242.06197, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "DLN", "bbox": {"l": 252.02364, "t": 185.97655999999995, "r": 269.31085, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "PubLayNet (PLN)", "bbox": {"l": 78.530998, "t": 219.25256000000002, "r": 142.56006, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Figure", "bbox": {"l": 154.629, "t": 197.33452999999997, "r": 177.92371, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "96", "bbox": {"l": 208.44701, "t": 197.33452999999997, "r": 216.78575000000004, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "43", "bbox": {"l": 232.1183, "t": 197.33452999999997, "r": 240.45705, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "23", "bbox": {"l": 256.49792, "t": 197.33452999999997, "r": 264.83667, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Sec-header", "bbox": {"l": 154.629, "t": 208.29351999999994, "r": 194.72675, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "87", "bbox": {"l": 208.44701, "t": 208.29351999999994, "r": 216.78575000000004, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "-", "bbox": {"l": 234.77235, "t": 208.29351999999994, "r": 237.80299000000002, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "32", "bbox": {"l": 256.49792, "t": 208.29351999999994, "r": 264.83667, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Table", "bbox": {"l": 154.629, "t": 219.25256000000002, "r": 174.43578, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "95", "bbox": {"l": 208.44701, "t": 219.25256000000002, "r": 216.78575000000004, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "24", "bbox": {"l": 232.1183, "t": 219.25256000000002, "r": 240.45705, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "49", "bbox": {"l": 256.49792, "t": 219.25256000000002, "r": 264.83667, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Text", "bbox": {"l": 154.629, "t": 230.21155, "r": 170.58919, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "96", "bbox": {"l": 208.44701, "t": 230.21155, "r": 216.78575000000004, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "-", "bbox": {"l": 234.77235, "t": 230.21155, "r": 237.80299000000002, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "42", "bbox": {"l": 256.49792, "t": 230.21155, "r": 264.83667, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "total", "bbox": {"l": 154.629, "t": 241.16956000000005, "r": 171.2796, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "93", "bbox": {"l": 208.44701, "t": 241.16956000000005, "r": 216.78575000000004, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "34", "bbox": {"l": 232.1183, "t": 241.16956000000005, "r": 240.45705, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "30", "bbox": {"l": 256.49792, "t": 241.16956000000005, "r": 264.83667, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "DocBank (DB)", "bbox": {"l": 78.530998, "t": 263.48650999999995, "r": 131.19963, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Figure", "bbox": {"l": 154.629, "t": 252.52752999999996, "r": 177.92371, "b": 260.90216, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "77", "bbox": {"l": 208.44701, "t": 252.52752999999996, "r": 216.78575000000004, "b": 260.90216, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "71", "bbox": {"l": 232.1183, "t": 252.52752999999996, "r": 240.45705, "b": 260.90216, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "31", "bbox": {"l": 256.49792, "t": 252.52752999999996, "r": 264.83667, "b": 260.90216, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "Table", "bbox": {"l": 154.629, "t": 263.48650999999995, "r": 174.43578, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "19", "bbox": {"l": 208.44701, "t": 263.48650999999995, "r": 216.78575000000004, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "65", "bbox": {"l": 232.1183, "t": 263.48650999999995, "r": 240.45705, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "22", "bbox": {"l": 256.49792, "t": 263.48650999999995, "r": 264.83667, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "total", "bbox": {"l": 154.629, "t": 274.44556, "r": 171.2796, "b": 282.82016, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "48", "bbox": {"l": 208.44701, "t": 274.44556, "r": 216.78575000000004, "b": 282.82016, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "68", "bbox": {"l": 232.1183, "t": 274.44556, "r": 240.45705, "b": 282.82016, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "27", "bbox": {"l": 256.49792, "t": 274.44556, "r": 264.83667, "b": 282.82016, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "DocLayNet (DLN)", "bbox": {"l": 78.530998, "t": 307.72055, "r": 144.66716, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "Figure", "bbox": {"l": 154.629, "t": 285.80255, "r": 177.92371, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "67", "bbox": {"l": 208.44701, "t": 285.80255, "r": 216.78575000000004, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "51", "bbox": {"l": 232.1183, "t": 285.80255, "r": 240.45705, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "72", "bbox": {"l": 256.49792, "t": 285.80255, "r": 264.83667, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Sec-header", "bbox": {"l": 154.629, "t": 296.76154, "r": 194.72675, "b": 305.13617, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "53", "bbox": {"l": 208.44701, "t": 296.76154, "r": 216.78575000000004, "b": 305.13617, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "-", "bbox": {"l": 234.77235, "t": 296.76154, "r": 237.80299000000002, "b": 305.13617, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "68", "bbox": {"l": 256.49792, "t": 296.76154, "r": 264.83667, "b": 305.13617, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Table", "bbox": {"l": 154.629, "t": 307.72055, "r": 174.43578, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "87", "bbox": {"l": 208.44701, "t": 307.72055, "r": 216.78575000000004, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "43", "bbox": {"l": 232.1183, "t": 307.72055, "r": 240.45705, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "82", "bbox": {"l": 256.49792, "t": 307.72055, "r": 264.83667, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "Text", "bbox": {"l": 154.629, "t": 318.67953, "r": 170.58919, "b": 327.05417, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "77", "bbox": {"l": 208.44701, "t": 318.67953, "r": 216.78575000000004, "b": 327.05417, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "-", "bbox": {"l": 234.77235, "t": 318.67953, "r": 237.80299000000002, "b": 327.05417, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "84", "bbox": {"l": 256.49792, "t": 318.67953, "r": 264.83667, "b": 327.05417, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "total", "bbox": {"l": 154.629, "t": 329.63855, "r": 171.2796, "b": 338.01318, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "59", "bbox": {"l": 208.44701, "t": 329.63855, "r": 216.78575000000004, "b": 338.01318, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "47", "bbox": {"l": 232.1183, "t": 329.63855, "r": 240.45705, "b": 338.01318, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "78", "bbox": {"l": 256.49792, "t": 329.63855, "r": 264.83667, "b": 338.01318, "coord_origin": "TOPLEFT"}}], "children": [{"id": 25, "label": "text", "bbox": {"l": 217.74099999999999, "t": 175.01855, "r": 256.26065, "b": 183.39319, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "Testing on", "bbox": {"l": 217.74099999999999, "t": 175.01855, "r": 256.26065, "b": 183.39319, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 89.954002, "t": 185.97655999999995, "r": 133.24379, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "Training on", "bbox": {"l": 89.954002, "t": 185.97655999999995, "r": 133.24379, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 154.629, "t": 185.97655999999995, "r": 175.47588, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "labels", "bbox": {"l": 154.629, "t": 185.97655999999995, "r": 175.47588, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 204.69, "t": 185.97655999999995, "r": 220.54260000000002, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "PLN", "bbox": {"l": 204.69, "t": 185.97655999999995, "r": 220.54260000000002, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 230.50427000000002, "t": 185.97655999999995, "r": 242.06197, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "DB", "bbox": {"l": 230.50427000000002, "t": 185.97655999999995, "r": 242.06197, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 252.02364, "t": 185.97655999999995, "r": 269.31085, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "DLN", "bbox": {"l": 252.02364, "t": 185.97655999999995, "r": 269.31085, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 78.530998, "t": 219.25256000000002, "r": 142.56006, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "PubLayNet (PLN)", "bbox": {"l": 78.530998, "t": 219.25256000000002, "r": 142.56006, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 154.629, "t": 197.33452999999997, "r": 177.92371, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "Figure", "bbox": {"l": 154.629, "t": 197.33452999999997, "r": 177.92371, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 208.44701, "t": 197.33452999999997, "r": 216.78575000000004, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "96", "bbox": {"l": 208.44701, "t": 197.33452999999997, "r": 216.78575000000004, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 232.1183, "t": 197.33452999999997, "r": 240.45705, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "43", "bbox": {"l": 232.1183, "t": 197.33452999999997, "r": 240.45705, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 256.49792, "t": 197.33452999999997, "r": 264.83667, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "23", "bbox": {"l": 256.49792, "t": 197.33452999999997, "r": 264.83667, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 154.629, "t": 208.29351999999994, "r": 194.72675, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "Sec-header", "bbox": {"l": 154.629, "t": 208.29351999999994, "r": 194.72675, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 208.44701, "t": 208.29351999999994, "r": 216.78575000000004, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "87", "bbox": {"l": 208.44701, "t": 208.29351999999994, "r": 216.78575000000004, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 234.77235, "t": 208.29351999999994, "r": 237.80299000000002, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "-", "bbox": {"l": 234.77235, "t": 208.29351999999994, "r": 237.80299000000002, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 256.49792, "t": 208.29351999999994, "r": 264.83667, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "32", "bbox": {"l": 256.49792, "t": 208.29351999999994, "r": 264.83667, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 154.629, "t": 219.25256000000002, "r": 174.43578, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "Table", "bbox": {"l": 154.629, "t": 219.25256000000002, "r": 174.43578, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 208.44701, "t": 219.25256000000002, "r": 216.78575000000004, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "95", "bbox": {"l": 208.44701, "t": 219.25256000000002, "r": 216.78575000000004, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 232.1183, "t": 219.25256000000002, "r": 240.45705, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "24", "bbox": {"l": 232.1183, "t": 219.25256000000002, "r": 240.45705, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 256.49792, "t": 219.25256000000002, "r": 264.83667, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "49", "bbox": {"l": 256.49792, "t": 219.25256000000002, "r": 264.83667, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 154.629, "t": 230.21155, "r": 170.58919, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "Text", "bbox": {"l": 154.629, "t": 230.21155, "r": 170.58919, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 208.44701, "t": 230.21155, "r": 216.78575000000004, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "96", "bbox": {"l": 208.44701, "t": 230.21155, "r": 216.78575000000004, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 234.77235, "t": 230.21155, "r": 237.80299000000002, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "-", "bbox": {"l": 234.77235, "t": 230.21155, "r": 237.80299000000002, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 256.49792, "t": 230.21155, "r": 264.83667, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "42", "bbox": {"l": 256.49792, "t": 230.21155, "r": 264.83667, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 154.629, "t": 241.16956000000005, "r": 171.2796, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "total", "bbox": {"l": 154.629, "t": 241.16956000000005, "r": 171.2796, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 208.44701, "t": 241.16956000000005, "r": 216.78575000000004, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "93", "bbox": {"l": 208.44701, "t": 241.16956000000005, "r": 216.78575000000004, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 232.1183, "t": 241.16956000000005, "r": 240.45705, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "34", "bbox": {"l": 232.1183, "t": 241.16956000000005, "r": 240.45705, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 256.49792, "t": 241.16956000000005, "r": 264.83667, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "30", "bbox": {"l": 256.49792, "t": 241.16956000000005, "r": 264.83667, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 78.530998, "t": 263.48650999999995, "r": 131.19963, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "DocBank (DB)", "bbox": {"l": 78.530998, "t": 263.48650999999995, "r": 131.19963, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 154.629, "t": 252.52752999999996, "r": 177.92371, "b": 260.90216, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "Figure", "bbox": {"l": 154.629, "t": 252.52752999999996, "r": 177.92371, "b": 260.90216, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 208.44701, "t": 252.52752999999996, "r": 216.78575000000004, "b": 260.90216, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "77", "bbox": {"l": 208.44701, "t": 252.52752999999996, "r": 216.78575000000004, "b": 260.90216, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 232.1183, "t": 252.52752999999996, "r": 240.45705, "b": 260.90216, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "71", "bbox": {"l": 232.1183, "t": 252.52752999999996, "r": 240.45705, "b": 260.90216, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 256.49792, "t": 252.52752999999996, "r": 264.83667, "b": 260.90216, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "31", "bbox": {"l": 256.49792, "t": 252.52752999999996, "r": 264.83667, "b": 260.90216, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 154.629, "t": 263.48650999999995, "r": 174.43578, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "Table", "bbox": {"l": 154.629, "t": 263.48650999999995, "r": 174.43578, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 208.44701, "t": 263.48650999999995, "r": 216.78575000000004, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "19", "bbox": {"l": 208.44701, "t": 263.48650999999995, "r": 216.78575000000004, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 232.1183, "t": 263.48650999999995, "r": 240.45705, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "65", "bbox": {"l": 232.1183, "t": 263.48650999999995, "r": 240.45705, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 256.49792, "t": 263.48650999999995, "r": 264.83667, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "22", "bbox": {"l": 256.49792, "t": 263.48650999999995, "r": 264.83667, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 154.629, "t": 274.44556, "r": 171.2796, "b": 282.82016, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "total", "bbox": {"l": 154.629, "t": 274.44556, "r": 171.2796, "b": 282.82016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 208.44701, "t": 274.44556, "r": 216.78575000000004, "b": 282.82016, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "48", "bbox": {"l": 208.44701, "t": 274.44556, "r": 216.78575000000004, "b": 282.82016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 232.1183, "t": 274.44556, "r": 240.45705, "b": 282.82016, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "68", "bbox": {"l": 232.1183, "t": 274.44556, "r": 240.45705, "b": 282.82016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 256.49792, "t": 274.44556, "r": 264.83667, "b": 282.82016, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "27", "bbox": {"l": 256.49792, "t": 274.44556, "r": 264.83667, "b": 282.82016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 78.530998, "t": 307.72055, "r": 144.66716, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "DocLayNet (DLN)", "bbox": {"l": 78.530998, "t": 307.72055, "r": 144.66716, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 154.629, "t": 285.80255, "r": 177.92371, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "Figure", "bbox": {"l": 154.629, "t": 285.80255, "r": 177.92371, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 208.44701, "t": 285.80255, "r": 216.78575000000004, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "67", "bbox": {"l": 208.44701, "t": 285.80255, "r": 216.78575000000004, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 232.1183, "t": 285.80255, "r": 240.45705, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "51", "bbox": {"l": 232.1183, "t": 285.80255, "r": 240.45705, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 256.49792, "t": 285.80255, "r": 264.83667, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "72", "bbox": {"l": 256.49792, "t": 285.80255, "r": 264.83667, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 154.629, "t": 296.76154, "r": 194.72675, "b": 305.13617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "Sec-header", "bbox": {"l": 154.629, "t": 296.76154, "r": 194.72675, "b": 305.13617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 208.44701, "t": 296.76154, "r": 216.78575000000004, "b": 305.13617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "53", "bbox": {"l": 208.44701, "t": 296.76154, "r": 216.78575000000004, "b": 305.13617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 234.77235, "t": 296.76154, "r": 237.80299000000002, "b": 305.13617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "-", "bbox": {"l": 234.77235, "t": 296.76154, "r": 237.80299000000002, "b": 305.13617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 256.49792, "t": 296.76154, "r": 264.83667, "b": 305.13617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "68", "bbox": {"l": 256.49792, "t": 296.76154, "r": 264.83667, "b": 305.13617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 154.629, "t": 307.72055, "r": 174.43578, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "Table", "bbox": {"l": 154.629, "t": 307.72055, "r": 174.43578, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 208.44701, "t": 307.72055, "r": 216.78575000000004, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "87", "bbox": {"l": 208.44701, "t": 307.72055, "r": 216.78575000000004, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 232.1183, "t": 307.72055, "r": 240.45705, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "43", "bbox": {"l": 232.1183, "t": 307.72055, "r": 240.45705, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 256.49792, "t": 307.72055, "r": 264.83667, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "82", "bbox": {"l": 256.49792, "t": 307.72055, "r": 264.83667, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 154.629, "t": 318.67953, "r": 170.58919, "b": 327.05417, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "Text", "bbox": {"l": 154.629, "t": 318.67953, "r": 170.58919, "b": 327.05417, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 208.44701, "t": 318.67953, "r": 216.78575000000004, "b": 327.05417, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "77", "bbox": {"l": 208.44701, "t": 318.67953, "r": 216.78575000000004, "b": 327.05417, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 234.77235, "t": 318.67953, "r": 237.80299000000002, "b": 327.05417, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "-", "bbox": {"l": 234.77235, "t": 318.67953, "r": 237.80299000000002, "b": 327.05417, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 256.49792, "t": 318.67953, "r": 264.83667, "b": 327.05417, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "84", "bbox": {"l": 256.49792, "t": 318.67953, "r": 264.83667, "b": 327.05417, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 154.629, "t": 329.63855, "r": 171.2796, "b": 338.01318, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "total", "bbox": {"l": 154.629, "t": 329.63855, "r": 171.2796, "b": 338.01318, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 208.44701, "t": 329.63855, "r": 216.78575000000004, "b": 338.01318, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "59", "bbox": {"l": 208.44701, "t": 329.63855, "r": 216.78575000000004, "b": 338.01318, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 232.1183, "t": 329.63855, "r": 240.45705, "b": 338.01318, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "47", "bbox": {"l": 232.1183, "t": 329.63855, "r": 240.45705, "b": 338.01318, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 256.49792, "t": 329.63855, "r": 264.83667, "b": 338.01318, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "78", "bbox": {"l": 256.49792, "t": 329.63855, "r": 264.83667, "b": 338.01318, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "lcel", "lcel", "nl", "ched", "ched", "ched", "ched", "ched", "nl", "rhed", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl", "rhed", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl", "rhed", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl"], "num_rows": 15, "num_cols": 5, "table_cells": [{"bbox": {"l": 217.74099999999999, "t": 175.01855, "r": 256.26065, "b": 183.39319, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 3, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 5, "text": "Testing on", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 89.954002, "t": 185.97655999999995, "r": 133.24379, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Training on", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 185.97655999999995, "r": 175.47588, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "labels", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 204.69, "t": 185.97655999999995, "r": 220.54260000000002, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "PLN", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 230.50427000000002, "t": 185.97655999999995, "r": 242.06197, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "DB", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 252.02364, "t": 185.97655999999995, "r": 269.31085, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "DLN", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 78.530998, "t": 219.25256000000002, "r": 142.56006, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 5, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PubLayNet (PLN)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 154.629, "t": 197.33452999999997, "r": 177.92371, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Figure", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 197.33452999999997, "r": 216.78575000000004, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 197.33452999999997, "r": 240.45705, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "43", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 197.33452999999997, "r": 264.83667, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "23", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 208.29351999999994, "r": 194.72675, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Sec-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 208.29351999999994, "r": 216.78575000000004, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "87", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 234.77235, "t": 208.29351999999994, "r": 237.80299000000002, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 208.29351999999994, "r": 264.83667, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "32", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 219.25256000000002, "r": 174.43578, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 219.25256000000002, "r": 216.78575000000004, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "95", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 219.25256000000002, "r": 240.45705, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "24", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 219.25256000000002, "r": 264.83667, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "49", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 230.21155, "r": 170.58919, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Text", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 230.21155, "r": 216.78575000000004, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 234.77235, "t": 230.21155, "r": 237.80299000000002, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 230.21155, "r": 264.83667, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "42", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 241.16956000000005, "r": 171.2796, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "total", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 241.16956000000005, "r": 216.78575000000004, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "93", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 241.16956000000005, "r": 240.45705, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "34", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 241.16956000000005, "r": 264.83667, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "30", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 78.530998, "t": 263.48650999999995, "r": 131.19963, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "row_span": 3, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "DocBank (DB)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 154.629, "t": 252.52752999999996, "r": 177.92371, "b": 260.90216, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Figure", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 252.52752999999996, "r": 216.78575000000004, "b": 260.90216, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 252.52752999999996, "r": 240.45705, "b": 260.90216, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "71", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 252.52752999999996, "r": 264.83667, "b": 260.90216, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "31", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 263.48650999999995, "r": 174.43578, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 263.48650999999995, "r": 216.78575000000004, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "19", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 263.48650999999995, "r": 240.45705, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "65", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 263.48650999999995, "r": 264.83667, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "22", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 274.44556, "r": 171.2796, "b": 282.82016, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "total", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 274.44556, "r": 216.78575000000004, "b": 282.82016, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "48", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 274.44556, "r": 240.45705, "b": 282.82016, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 274.44556, "r": 264.83667, "b": 282.82016, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "27", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 78.530998, "t": 307.72055, "r": 144.66716, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "row_span": 5, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 15, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "DocLayNet (DLN)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 154.629, "t": 285.80255, "r": 177.92371, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Figure", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 285.80255, "r": 216.78575000000004, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "67", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 285.80255, "r": 240.45705, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "51", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 285.80255, "r": 264.83667, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 296.76154, "r": 194.72675, "b": 305.13617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Sec-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 296.76154, "r": 216.78575000000004, "b": 305.13617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "53", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 234.77235, "t": 296.76154, "r": 237.80299000000002, "b": 305.13617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 296.76154, "r": 264.83667, "b": 305.13617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 307.72055, "r": 174.43578, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 307.72055, "r": 216.78575000000004, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "87", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 307.72055, "r": 240.45705, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "43", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 307.72055, "r": 264.83667, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 318.67953, "r": 170.58919, "b": 327.05417, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Text", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 318.67953, "r": 216.78575000000004, "b": 327.05417, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 234.77235, "t": 318.67953, "r": 237.80299000000002, "b": 327.05417, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 318.67953, "r": 264.83667, "b": 327.05417, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 329.63855, "r": 171.2796, "b": 338.01318, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 14, "end_row_offset_idx": 15, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "total", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 329.63855, "r": 216.78575000000004, "b": 338.01318, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 14, "end_row_offset_idx": 15, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "59", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 329.63855, "r": 240.45705, "b": 338.01318, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 14, "end_row_offset_idx": 15, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "47", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 329.63855, "r": 264.83667, "b": 338.01318, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 14, "end_row_offset_idx": 15, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "78", "column_header": false, "row_header": false, "row_section": false}]}}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_header", "id": 24, "page_no": 7, "cluster": {"id": 24, "label": "page_header", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.7984216809272766, "cells": [{"id": 0, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 246.24382, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar", "bbox": {"l": 253.13897999999998, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar"}, {"label": "text", "id": 5, "page_no": 7, "cluster": {"id": 5, "label": "text", "bbox": {"l": 53.501999, "t": 86.87292000000002, "r": 295.64868, "b": 150.14111000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9824112057685852, "cells": [{"id": 2, "text": "Table 5: Prediction Performance (mAP@0.5-0.95) of a Mask", "bbox": {"l": 53.501999, "t": 86.87292000000002, "r": 294.32153, "b": 95.34618999999998, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "R-CNN R50 network across the PubLayNet, DocBank & Do-", "bbox": {"l": 53.79800000000001, "t": 97.83191, "r": 295.64868, "b": 106.30517999999995, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "cLayNet data-sets. By evaluating on common label classes of", "bbox": {"l": 53.79800000000001, "t": 108.79088999999999, "r": 294.0437, "b": 117.26415999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "each dataset, we observe that the DocLayNet-trained model", "bbox": {"l": 53.79800000000001, "t": 119.74987999999996, "r": 294.04373, "b": 128.22313999999994, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "has much less pronounced variations in performance across", "bbox": {"l": 53.79800000000001, "t": 130.70885999999996, "r": 294.0437, "b": 139.18213000000003, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "all datasets.", "bbox": {"l": 53.79800000000001, "t": 141.66785000000004, "r": 101.15852, "b": 150.14111000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 5: Prediction Performance (mAP@0.5-0.95) of a Mask R-CNN R50 network across the PubLayNet, DocBank & DocLayNet data-sets. By evaluating on common label classes of each dataset, we observe that the DocLayNet-trained model has much less pronounced variations in performance across all datasets."}, {"label": "table", "id": 0, "page_no": 7, "cluster": {"id": 0, "label": "table", "bbox": {"l": 72.6590347290039, "t": 172.48080444335938, "r": 274.83465576171875, "b": 339.8540344238281, "coord_origin": "TOPLEFT"}, "confidence": 0.9892616271972656, "cells": [{"id": 8, "text": "Testing on", "bbox": {"l": 217.74099999999999, "t": 175.01855, "r": 256.26065, "b": 183.39319, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Training on", "bbox": {"l": 89.954002, "t": 185.97655999999995, "r": 133.24379, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "labels", "bbox": {"l": 154.629, "t": 185.97655999999995, "r": 175.47588, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "PLN", "bbox": {"l": 204.69, "t": 185.97655999999995, "r": 220.54260000000002, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "DB", "bbox": {"l": 230.50427000000002, "t": 185.97655999999995, "r": 242.06197, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "DLN", "bbox": {"l": 252.02364, "t": 185.97655999999995, "r": 269.31085, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "PubLayNet (PLN)", "bbox": {"l": 78.530998, "t": 219.25256000000002, "r": 142.56006, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Figure", "bbox": {"l": 154.629, "t": 197.33452999999997, "r": 177.92371, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "96", "bbox": {"l": 208.44701, "t": 197.33452999999997, "r": 216.78575000000004, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "43", "bbox": {"l": 232.1183, "t": 197.33452999999997, "r": 240.45705, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "23", "bbox": {"l": 256.49792, "t": 197.33452999999997, "r": 264.83667, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Sec-header", "bbox": {"l": 154.629, "t": 208.29351999999994, "r": 194.72675, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "87", "bbox": {"l": 208.44701, "t": 208.29351999999994, "r": 216.78575000000004, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "-", "bbox": {"l": 234.77235, "t": 208.29351999999994, "r": 237.80299000000002, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "32", "bbox": {"l": 256.49792, "t": 208.29351999999994, "r": 264.83667, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Table", "bbox": {"l": 154.629, "t": 219.25256000000002, "r": 174.43578, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "95", "bbox": {"l": 208.44701, "t": 219.25256000000002, "r": 216.78575000000004, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "24", "bbox": {"l": 232.1183, "t": 219.25256000000002, "r": 240.45705, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "49", "bbox": {"l": 256.49792, "t": 219.25256000000002, "r": 264.83667, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Text", "bbox": {"l": 154.629, "t": 230.21155, "r": 170.58919, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "96", "bbox": {"l": 208.44701, "t": 230.21155, "r": 216.78575000000004, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "-", "bbox": {"l": 234.77235, "t": 230.21155, "r": 237.80299000000002, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "42", "bbox": {"l": 256.49792, "t": 230.21155, "r": 264.83667, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "total", "bbox": {"l": 154.629, "t": 241.16956000000005, "r": 171.2796, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "93", "bbox": {"l": 208.44701, "t": 241.16956000000005, "r": 216.78575000000004, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "34", "bbox": {"l": 232.1183, "t": 241.16956000000005, "r": 240.45705, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "30", "bbox": {"l": 256.49792, "t": 241.16956000000005, "r": 264.83667, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "DocBank (DB)", "bbox": {"l": 78.530998, "t": 263.48650999999995, "r": 131.19963, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Figure", "bbox": {"l": 154.629, "t": 252.52752999999996, "r": 177.92371, "b": 260.90216, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "77", "bbox": {"l": 208.44701, "t": 252.52752999999996, "r": 216.78575000000004, "b": 260.90216, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "71", "bbox": {"l": 232.1183, "t": 252.52752999999996, "r": 240.45705, "b": 260.90216, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "31", "bbox": {"l": 256.49792, "t": 252.52752999999996, "r": 264.83667, "b": 260.90216, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "Table", "bbox": {"l": 154.629, "t": 263.48650999999995, "r": 174.43578, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "19", "bbox": {"l": 208.44701, "t": 263.48650999999995, "r": 216.78575000000004, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "65", "bbox": {"l": 232.1183, "t": 263.48650999999995, "r": 240.45705, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "22", "bbox": {"l": 256.49792, "t": 263.48650999999995, "r": 264.83667, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "total", "bbox": {"l": 154.629, "t": 274.44556, "r": 171.2796, "b": 282.82016, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "48", "bbox": {"l": 208.44701, "t": 274.44556, "r": 216.78575000000004, "b": 282.82016, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "68", "bbox": {"l": 232.1183, "t": 274.44556, "r": 240.45705, "b": 282.82016, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "27", "bbox": {"l": 256.49792, "t": 274.44556, "r": 264.83667, "b": 282.82016, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "DocLayNet (DLN)", "bbox": {"l": 78.530998, "t": 307.72055, "r": 144.66716, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "Figure", "bbox": {"l": 154.629, "t": 285.80255, "r": 177.92371, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "67", "bbox": {"l": 208.44701, "t": 285.80255, "r": 216.78575000000004, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "51", "bbox": {"l": 232.1183, "t": 285.80255, "r": 240.45705, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "72", "bbox": {"l": 256.49792, "t": 285.80255, "r": 264.83667, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Sec-header", "bbox": {"l": 154.629, "t": 296.76154, "r": 194.72675, "b": 305.13617, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "53", "bbox": {"l": 208.44701, "t": 296.76154, "r": 216.78575000000004, "b": 305.13617, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "-", "bbox": {"l": 234.77235, "t": 296.76154, "r": 237.80299000000002, "b": 305.13617, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "68", "bbox": {"l": 256.49792, "t": 296.76154, "r": 264.83667, "b": 305.13617, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Table", "bbox": {"l": 154.629, "t": 307.72055, "r": 174.43578, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "87", "bbox": {"l": 208.44701, "t": 307.72055, "r": 216.78575000000004, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "43", "bbox": {"l": 232.1183, "t": 307.72055, "r": 240.45705, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "82", "bbox": {"l": 256.49792, "t": 307.72055, "r": 264.83667, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "Text", "bbox": {"l": 154.629, "t": 318.67953, "r": 170.58919, "b": 327.05417, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "77", "bbox": {"l": 208.44701, "t": 318.67953, "r": 216.78575000000004, "b": 327.05417, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "-", "bbox": {"l": 234.77235, "t": 318.67953, "r": 237.80299000000002, "b": 327.05417, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "84", "bbox": {"l": 256.49792, "t": 318.67953, "r": 264.83667, "b": 327.05417, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "total", "bbox": {"l": 154.629, "t": 329.63855, "r": 171.2796, "b": 338.01318, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "59", "bbox": {"l": 208.44701, "t": 329.63855, "r": 216.78575000000004, "b": 338.01318, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "47", "bbox": {"l": 232.1183, "t": 329.63855, "r": 240.45705, "b": 338.01318, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "78", "bbox": {"l": 256.49792, "t": 329.63855, "r": 264.83667, "b": 338.01318, "coord_origin": "TOPLEFT"}}], "children": [{"id": 25, "label": "text", "bbox": {"l": 217.74099999999999, "t": 175.01855, "r": 256.26065, "b": 183.39319, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "Testing on", "bbox": {"l": 217.74099999999999, "t": 175.01855, "r": 256.26065, "b": 183.39319, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 89.954002, "t": 185.97655999999995, "r": 133.24379, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "Training on", "bbox": {"l": 89.954002, "t": 185.97655999999995, "r": 133.24379, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 154.629, "t": 185.97655999999995, "r": 175.47588, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "labels", "bbox": {"l": 154.629, "t": 185.97655999999995, "r": 175.47588, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 204.69, "t": 185.97655999999995, "r": 220.54260000000002, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "PLN", "bbox": {"l": 204.69, "t": 185.97655999999995, "r": 220.54260000000002, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 230.50427000000002, "t": 185.97655999999995, "r": 242.06197, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "DB", "bbox": {"l": 230.50427000000002, "t": 185.97655999999995, "r": 242.06197, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 252.02364, "t": 185.97655999999995, "r": 269.31085, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "DLN", "bbox": {"l": 252.02364, "t": 185.97655999999995, "r": 269.31085, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 78.530998, "t": 219.25256000000002, "r": 142.56006, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "PubLayNet (PLN)", "bbox": {"l": 78.530998, "t": 219.25256000000002, "r": 142.56006, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 154.629, "t": 197.33452999999997, "r": 177.92371, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "Figure", "bbox": {"l": 154.629, "t": 197.33452999999997, "r": 177.92371, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 208.44701, "t": 197.33452999999997, "r": 216.78575000000004, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "96", "bbox": {"l": 208.44701, "t": 197.33452999999997, "r": 216.78575000000004, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 232.1183, "t": 197.33452999999997, "r": 240.45705, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "43", "bbox": {"l": 232.1183, "t": 197.33452999999997, "r": 240.45705, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 256.49792, "t": 197.33452999999997, "r": 264.83667, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "23", "bbox": {"l": 256.49792, "t": 197.33452999999997, "r": 264.83667, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 154.629, "t": 208.29351999999994, "r": 194.72675, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "Sec-header", "bbox": {"l": 154.629, "t": 208.29351999999994, "r": 194.72675, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 208.44701, "t": 208.29351999999994, "r": 216.78575000000004, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "87", "bbox": {"l": 208.44701, "t": 208.29351999999994, "r": 216.78575000000004, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 234.77235, "t": 208.29351999999994, "r": 237.80299000000002, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "-", "bbox": {"l": 234.77235, "t": 208.29351999999994, "r": 237.80299000000002, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 256.49792, "t": 208.29351999999994, "r": 264.83667, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "32", "bbox": {"l": 256.49792, "t": 208.29351999999994, "r": 264.83667, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 154.629, "t": 219.25256000000002, "r": 174.43578, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "Table", "bbox": {"l": 154.629, "t": 219.25256000000002, "r": 174.43578, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 208.44701, "t": 219.25256000000002, "r": 216.78575000000004, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "95", "bbox": {"l": 208.44701, "t": 219.25256000000002, "r": 216.78575000000004, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 232.1183, "t": 219.25256000000002, "r": 240.45705, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "24", "bbox": {"l": 232.1183, "t": 219.25256000000002, "r": 240.45705, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 256.49792, "t": 219.25256000000002, "r": 264.83667, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "49", "bbox": {"l": 256.49792, "t": 219.25256000000002, "r": 264.83667, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 154.629, "t": 230.21155, "r": 170.58919, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "Text", "bbox": {"l": 154.629, "t": 230.21155, "r": 170.58919, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 208.44701, "t": 230.21155, "r": 216.78575000000004, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "96", "bbox": {"l": 208.44701, "t": 230.21155, "r": 216.78575000000004, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 234.77235, "t": 230.21155, "r": 237.80299000000002, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "-", "bbox": {"l": 234.77235, "t": 230.21155, "r": 237.80299000000002, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 256.49792, "t": 230.21155, "r": 264.83667, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "42", "bbox": {"l": 256.49792, "t": 230.21155, "r": 264.83667, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 154.629, "t": 241.16956000000005, "r": 171.2796, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "total", "bbox": {"l": 154.629, "t": 241.16956000000005, "r": 171.2796, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 208.44701, "t": 241.16956000000005, "r": 216.78575000000004, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "93", "bbox": {"l": 208.44701, "t": 241.16956000000005, "r": 216.78575000000004, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 232.1183, "t": 241.16956000000005, "r": 240.45705, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "34", "bbox": {"l": 232.1183, "t": 241.16956000000005, "r": 240.45705, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 256.49792, "t": 241.16956000000005, "r": 264.83667, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "30", "bbox": {"l": 256.49792, "t": 241.16956000000005, "r": 264.83667, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 78.530998, "t": 263.48650999999995, "r": 131.19963, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "DocBank (DB)", "bbox": {"l": 78.530998, "t": 263.48650999999995, "r": 131.19963, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 154.629, "t": 252.52752999999996, "r": 177.92371, "b": 260.90216, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "Figure", "bbox": {"l": 154.629, "t": 252.52752999999996, "r": 177.92371, "b": 260.90216, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 208.44701, "t": 252.52752999999996, "r": 216.78575000000004, "b": 260.90216, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "77", "bbox": {"l": 208.44701, "t": 252.52752999999996, "r": 216.78575000000004, "b": 260.90216, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 232.1183, "t": 252.52752999999996, "r": 240.45705, "b": 260.90216, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "71", "bbox": {"l": 232.1183, "t": 252.52752999999996, "r": 240.45705, "b": 260.90216, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 256.49792, "t": 252.52752999999996, "r": 264.83667, "b": 260.90216, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "31", "bbox": {"l": 256.49792, "t": 252.52752999999996, "r": 264.83667, "b": 260.90216, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 154.629, "t": 263.48650999999995, "r": 174.43578, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "Table", "bbox": {"l": 154.629, "t": 263.48650999999995, "r": 174.43578, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 208.44701, "t": 263.48650999999995, "r": 216.78575000000004, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "19", "bbox": {"l": 208.44701, "t": 263.48650999999995, "r": 216.78575000000004, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 232.1183, "t": 263.48650999999995, "r": 240.45705, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "65", "bbox": {"l": 232.1183, "t": 263.48650999999995, "r": 240.45705, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 256.49792, "t": 263.48650999999995, "r": 264.83667, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "22", "bbox": {"l": 256.49792, "t": 263.48650999999995, "r": 264.83667, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 154.629, "t": 274.44556, "r": 171.2796, "b": 282.82016, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "total", "bbox": {"l": 154.629, "t": 274.44556, "r": 171.2796, "b": 282.82016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 208.44701, "t": 274.44556, "r": 216.78575000000004, "b": 282.82016, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "48", "bbox": {"l": 208.44701, "t": 274.44556, "r": 216.78575000000004, "b": 282.82016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 232.1183, "t": 274.44556, "r": 240.45705, "b": 282.82016, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "68", "bbox": {"l": 232.1183, "t": 274.44556, "r": 240.45705, "b": 282.82016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 256.49792, "t": 274.44556, "r": 264.83667, "b": 282.82016, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "27", "bbox": {"l": 256.49792, "t": 274.44556, "r": 264.83667, "b": 282.82016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 78.530998, "t": 307.72055, "r": 144.66716, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "DocLayNet (DLN)", "bbox": {"l": 78.530998, "t": 307.72055, "r": 144.66716, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 154.629, "t": 285.80255, "r": 177.92371, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "Figure", "bbox": {"l": 154.629, "t": 285.80255, "r": 177.92371, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 208.44701, "t": 285.80255, "r": 216.78575000000004, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "67", "bbox": {"l": 208.44701, "t": 285.80255, "r": 216.78575000000004, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 232.1183, "t": 285.80255, "r": 240.45705, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "51", "bbox": {"l": 232.1183, "t": 285.80255, "r": 240.45705, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 256.49792, "t": 285.80255, "r": 264.83667, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "72", "bbox": {"l": 256.49792, "t": 285.80255, "r": 264.83667, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 154.629, "t": 296.76154, "r": 194.72675, "b": 305.13617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "Sec-header", "bbox": {"l": 154.629, "t": 296.76154, "r": 194.72675, "b": 305.13617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 208.44701, "t": 296.76154, "r": 216.78575000000004, "b": 305.13617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "53", "bbox": {"l": 208.44701, "t": 296.76154, "r": 216.78575000000004, "b": 305.13617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 234.77235, "t": 296.76154, "r": 237.80299000000002, "b": 305.13617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "-", "bbox": {"l": 234.77235, "t": 296.76154, "r": 237.80299000000002, "b": 305.13617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 256.49792, "t": 296.76154, "r": 264.83667, "b": 305.13617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "68", "bbox": {"l": 256.49792, "t": 296.76154, "r": 264.83667, "b": 305.13617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 154.629, "t": 307.72055, "r": 174.43578, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "Table", "bbox": {"l": 154.629, "t": 307.72055, "r": 174.43578, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 208.44701, "t": 307.72055, "r": 216.78575000000004, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "87", "bbox": {"l": 208.44701, "t": 307.72055, "r": 216.78575000000004, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 232.1183, "t": 307.72055, "r": 240.45705, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "43", "bbox": {"l": 232.1183, "t": 307.72055, "r": 240.45705, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 256.49792, "t": 307.72055, "r": 264.83667, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "82", "bbox": {"l": 256.49792, "t": 307.72055, "r": 264.83667, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 154.629, "t": 318.67953, "r": 170.58919, "b": 327.05417, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "Text", "bbox": {"l": 154.629, "t": 318.67953, "r": 170.58919, "b": 327.05417, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 208.44701, "t": 318.67953, "r": 216.78575000000004, "b": 327.05417, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "77", "bbox": {"l": 208.44701, "t": 318.67953, "r": 216.78575000000004, "b": 327.05417, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 234.77235, "t": 318.67953, "r": 237.80299000000002, "b": 327.05417, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "-", "bbox": {"l": 234.77235, "t": 318.67953, "r": 237.80299000000002, "b": 327.05417, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 256.49792, "t": 318.67953, "r": 264.83667, "b": 327.05417, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "84", "bbox": {"l": 256.49792, "t": 318.67953, "r": 264.83667, "b": 327.05417, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 154.629, "t": 329.63855, "r": 171.2796, "b": 338.01318, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "total", "bbox": {"l": 154.629, "t": 329.63855, "r": 171.2796, "b": 338.01318, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 208.44701, "t": 329.63855, "r": 216.78575000000004, "b": 338.01318, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "59", "bbox": {"l": 208.44701, "t": 329.63855, "r": 216.78575000000004, "b": 338.01318, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 232.1183, "t": 329.63855, "r": 240.45705, "b": 338.01318, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "47", "bbox": {"l": 232.1183, "t": 329.63855, "r": 240.45705, "b": 338.01318, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 256.49792, "t": 329.63855, "r": 264.83667, "b": 338.01318, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "78", "bbox": {"l": 256.49792, "t": 329.63855, "r": 264.83667, "b": 338.01318, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "lcel", "lcel", "nl", "ched", "ched", "ched", "ched", "ched", "nl", "rhed", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl", "rhed", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl", "rhed", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl"], "num_rows": 15, "num_cols": 5, "table_cells": [{"bbox": {"l": 217.74099999999999, "t": 175.01855, "r": 256.26065, "b": 183.39319, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 3, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 5, "text": "Testing on", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 89.954002, "t": 185.97655999999995, "r": 133.24379, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Training on", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 185.97655999999995, "r": 175.47588, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "labels", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 204.69, "t": 185.97655999999995, "r": 220.54260000000002, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "PLN", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 230.50427000000002, "t": 185.97655999999995, "r": 242.06197, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "DB", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 252.02364, "t": 185.97655999999995, "r": 269.31085, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "DLN", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 78.530998, "t": 219.25256000000002, "r": 142.56006, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 5, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PubLayNet (PLN)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 154.629, "t": 197.33452999999997, "r": 177.92371, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Figure", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 197.33452999999997, "r": 216.78575000000004, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 197.33452999999997, "r": 240.45705, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "43", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 197.33452999999997, "r": 264.83667, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "23", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 208.29351999999994, "r": 194.72675, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Sec-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 208.29351999999994, "r": 216.78575000000004, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "87", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 234.77235, "t": 208.29351999999994, "r": 237.80299000000002, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 208.29351999999994, "r": 264.83667, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "32", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 219.25256000000002, "r": 174.43578, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 219.25256000000002, "r": 216.78575000000004, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "95", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 219.25256000000002, "r": 240.45705, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "24", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 219.25256000000002, "r": 264.83667, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "49", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 230.21155, "r": 170.58919, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Text", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 230.21155, "r": 216.78575000000004, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 234.77235, "t": 230.21155, "r": 237.80299000000002, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 230.21155, "r": 264.83667, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "42", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 241.16956000000005, "r": 171.2796, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "total", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 241.16956000000005, "r": 216.78575000000004, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "93", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 241.16956000000005, "r": 240.45705, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "34", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 241.16956000000005, "r": 264.83667, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "30", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 78.530998, "t": 263.48650999999995, "r": 131.19963, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "row_span": 3, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "DocBank (DB)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 154.629, "t": 252.52752999999996, "r": 177.92371, "b": 260.90216, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Figure", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 252.52752999999996, "r": 216.78575000000004, "b": 260.90216, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 252.52752999999996, "r": 240.45705, "b": 260.90216, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "71", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 252.52752999999996, "r": 264.83667, "b": 260.90216, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "31", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 263.48650999999995, "r": 174.43578, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 263.48650999999995, "r": 216.78575000000004, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "19", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 263.48650999999995, "r": 240.45705, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "65", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 263.48650999999995, "r": 264.83667, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "22", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 274.44556, "r": 171.2796, "b": 282.82016, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "total", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 274.44556, "r": 216.78575000000004, "b": 282.82016, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "48", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 274.44556, "r": 240.45705, "b": 282.82016, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 274.44556, "r": 264.83667, "b": 282.82016, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "27", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 78.530998, "t": 307.72055, "r": 144.66716, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "row_span": 5, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 15, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "DocLayNet (DLN)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 154.629, "t": 285.80255, "r": 177.92371, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Figure", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 285.80255, "r": 216.78575000000004, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "67", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 285.80255, "r": 240.45705, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "51", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 285.80255, "r": 264.83667, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 296.76154, "r": 194.72675, "b": 305.13617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Sec-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 296.76154, "r": 216.78575000000004, "b": 305.13617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "53", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 234.77235, "t": 296.76154, "r": 237.80299000000002, "b": 305.13617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 296.76154, "r": 264.83667, "b": 305.13617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 307.72055, "r": 174.43578, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 307.72055, "r": 216.78575000000004, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "87", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 307.72055, "r": 240.45705, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "43", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 307.72055, "r": 264.83667, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 318.67953, "r": 170.58919, "b": 327.05417, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Text", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 318.67953, "r": 216.78575000000004, "b": 327.05417, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 234.77235, "t": 318.67953, "r": 237.80299000000002, "b": 327.05417, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 318.67953, "r": 264.83667, "b": 327.05417, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 329.63855, "r": 171.2796, "b": 338.01318, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 14, "end_row_offset_idx": 15, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "total", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 329.63855, "r": 216.78575000000004, "b": 338.01318, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 14, "end_row_offset_idx": 15, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "59", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 329.63855, "r": 240.45705, "b": 338.01318, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 14, "end_row_offset_idx": 15, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "47", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 329.63855, "r": 264.83667, "b": 338.01318, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 14, "end_row_offset_idx": 15, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "78", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "text", "id": 4, "page_no": 7, "cluster": {"id": 4, "label": "text", "bbox": {"l": 53.79800000000001, "t": 390.92053, "r": 294.04712, "b": 443.14014, "coord_origin": "TOPLEFT"}, "confidence": 0.9839397668838501, "cells": [{"id": 69, "text": "Section-header", "bbox": {"l": 53.79800000000001, "t": 390.96539, "r": 106.2392, "b": 399.30414, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": ",", "bbox": {"l": 106.239, "t": 390.92053, "r": 108.23331, "b": 399.2951699999999, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Table", "bbox": {"l": 110.482, "t": 390.96539, "r": 129.76332, "b": 399.30414, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "and", "bbox": {"l": 132.21899, "t": 390.92053, "r": 145.86186, "b": 399.2951699999999, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "Text", "bbox": {"l": 148.112, "t": 390.96539, "r": 163.14182, "b": 399.30414, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": ". Before training, we either mapped", "bbox": {"l": 163.13901, "t": 390.92053, "r": 294.04709, "b": 399.2951699999999, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "or excluded DocLayNet\u2019s other labels as specified in table 3, and", "bbox": {"l": 53.79800000000001, "t": 401.87954999999994, "r": 294.04712, "b": 410.25418, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "also PubLayNet\u2019s", "bbox": {"l": 53.79800000000001, "t": 412.83853, "r": 117.12856, "b": 421.21317, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "List", "bbox": {"l": 119.362, "t": 412.88339, "r": 132.4342, "b": 421.22214, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "to", "bbox": {"l": 135.177, "t": 412.83853, "r": 142.54416, "b": 421.21317, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "Text", "bbox": {"l": 144.77901, "t": 412.88339, "r": 159.66605, "b": 421.22214, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": ". Note that the different clustering of", "bbox": {"l": 159.66701, "t": 412.83853, "r": 294.04562, "b": 421.21317, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "lists (by list-element vs. whole list objects) naturally decreases the", "bbox": {"l": 53.79800000000001, "t": 423.79755, "r": 294.04614, "b": 432.17217999999997, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "mAP score for", "bbox": {"l": 53.79800000000001, "t": 434.75653, "r": 106.2066, "b": 443.13116, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "Text", "bbox": {"l": 108.448, "t": 434.80139, "r": 123.30533, "b": 443.14014, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": ".", "bbox": {"l": 123.305, "t": 434.75653, "r": 125.27761000000001, "b": 443.13116, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Section-header , Table and Text . Before training, we either mapped or excluded DocLayNet\u2019s other labels as specified in table 3, and also PubLayNet\u2019s List to Text . Note that the different clustering of lists (by list-element vs. whole list objects) naturally decreases the mAP score for Text ."}, {"label": "text", "id": 1, "page_no": 7, "cluster": {"id": 1, "label": "text", "bbox": {"l": 53.466999, "t": 445.71453999999994, "r": 295.55908, "b": 585.59618, "coord_origin": "TOPLEFT"}, "confidence": 0.9868056774139404, "cells": [{"id": 85, "text": "For comparison of DocBank with DocLayNet, we trained only", "bbox": {"l": 63.76100199999999, "t": 445.71453999999994, "r": 294.27582, "b": 454.08917, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "on", "bbox": {"l": 53.79800000000001, "t": 456.67355, "r": 62.989277, "b": 465.04819, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Picture", "bbox": {"l": 64.852997, "t": 456.71841, "r": 88.947144, "b": 465.05716, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "and", "bbox": {"l": 91.019997, "t": 456.67355, "r": 104.24454, "b": 465.04819, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "Table", "bbox": {"l": 106.108, "t": 456.71841, "r": 124.78053, "b": 465.05716, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "clusters of each dataset. We had to exclude", "bbox": {"l": 126.85500000000002, "t": 456.67355, "r": 277.63235, "b": 465.04819, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "Text", "bbox": {"l": 279.49701, "t": 456.71841, "r": 294.0484, "b": 465.05716, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "because successive paragraphs are often grouped together into a", "bbox": {"l": 53.79800000000001, "t": 467.63254, "r": 294.04709, "b": 476.00717, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "single object in DocBank. This paragraph grouping is incompatible", "bbox": {"l": 53.79800000000001, "t": 478.59155, "r": 294.04532, "b": 486.96619, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "with the individual paragraphs of DocLayNet. As can be seen in", "bbox": {"l": 53.466999, "t": 489.55054, "r": 294.04538, "b": 497.92517, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "Table 5, DocLayNet trained models yield better performance com-", "bbox": {"l": 53.528999, "t": 500.50955, "r": 295.55908, "b": 508.88419, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "pared to the previous datasets. It is noteworthy that the models", "bbox": {"l": 53.79800000000001, "t": 511.46854, "r": 294.04712, "b": 519.84317, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "trained on PubLayNet and DocBank perform very well on their", "bbox": {"l": 53.79800000000001, "t": 522.42755, "r": 294.21179, "b": 530.80219, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "own test set, but have a much lower performance on the foreign", "bbox": {"l": 53.79800000000001, "t": 533.38654, "r": 294.04712, "b": 541.76117, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "datasets. While this also applies to DocLayNet, the difference is", "bbox": {"l": 53.79800000000001, "t": 544.34555, "r": 294.04715, "b": 552.72017, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "far less pronounced. Thus we conclude that DocLayNet trained", "bbox": {"l": 53.79800000000001, "t": 555.3045500000001, "r": 294.04712, "b": 563.67917, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "models are overall more robust and will produce better results for", "bbox": {"l": 53.79800000000001, "t": 566.26256, "r": 294.21411, "b": 574.63718, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "challenging, unseen layouts.", "bbox": {"l": 53.79800000000001, "t": 577.22156, "r": 157.52132, "b": 585.59618, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "For comparison of DocBank with DocLayNet, we trained only on Picture and Table clusters of each dataset. We had to exclude Text because successive paragraphs are often grouped together into a single object in DocBank. This paragraph grouping is incompatible with the individual paragraphs of DocLayNet. As can be seen in Table 5, DocLayNet trained models yield better performance compared to the previous datasets. It is noteworthy that the models trained on PubLayNet and DocBank perform very well on their own test set, but have a much lower performance on the foreign datasets. While this also applies to DocLayNet, the difference is far less pronounced. Thus we conclude that DocLayNet trained models are overall more robust and will produce better results for challenging, unseen layouts."}, {"label": "section_header", "id": 8, "page_no": 7, "cluster": {"id": 8, "label": "section_header", "bbox": {"l": 53.79800000000001, "t": 605.06091, "r": 156.00534, "b": 615.37001, "coord_origin": "TOPLEFT"}, "confidence": 0.9574698805809021, "cells": [{"id": 103, "text": "Example Predictions", "bbox": {"l": 53.79800000000001, "t": 605.06091, "r": 156.00534, "b": 615.37001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Example Predictions"}, {"label": "text", "id": 2, "page_no": 7, "cluster": {"id": 2, "label": "text", "bbox": {"l": 53.528999, "t": 620.26355, "r": 295.55844, "b": 705.350174, "coord_origin": "TOPLEFT"}, "confidence": 0.9859886169433594, "cells": [{"id": 104, "text": "To conclude this section, we illustrate the quality of layout predic-", "bbox": {"l": 53.528999, "t": 620.26355, "r": 295.5571, "b": 628.63817, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "tions one can expect from DocLayNet-trained models by providing", "bbox": {"l": 53.79800000000001, "t": 631.22255, "r": 294.04532, "b": 639.59717, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "a selection of examples without any further post-processing ap-", "bbox": {"l": 53.79800000000001, "t": 642.18155, "r": 295.55618, "b": 650.5561700000001, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "plied. Figure 6 shows selected layout predictions on pages from the", "bbox": {"l": 53.79800000000001, "t": 653.14055, "r": 294.04541, "b": 661.51517, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "test-set of DocLayNet. Results look decent in general across docu-", "bbox": {"l": 53.79800000000001, "t": 664.09956, "r": 295.55844, "b": 672.47417, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "ment categories, however one can also observe mistakes such as", "bbox": {"l": 53.79800000000001, "t": 675.05756, "r": 294.04712, "b": 683.43217, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "overlapping clusters of different classes, or entirely missing boxes", "bbox": {"l": 53.79800000000001, "t": 686.01656, "r": 294.04535, "b": 694.391174, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "due to low confidence.", "bbox": {"l": 53.79800000000001, "t": 696.975555, "r": 136.07368, "b": 705.350174, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "To conclude this section, we illustrate the quality of layout predictions one can expect from DocLayNet-trained models by providing a selection of examples without any further post-processing applied. Figure 6 shows selected layout predictions on pages from the test-set of DocLayNet. Results look decent in general across document categories, however one can also observe mistakes such as overlapping clusters of different classes, or entirely missing boxes due to low confidence."}, {"label": "section_header", "id": 13, "page_no": 7, "cluster": {"id": 13, "label": "section_header", "bbox": {"l": 317.95502, "t": 85.85986000000003, "r": 405.72961, "b": 96.16900999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.931998074054718, "cells": [{"id": 112, "text": "6", "bbox": {"l": 317.95502, "t": 85.85986000000003, "r": 323.56229, "b": 96.16900999999996, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "CONCLUSION", "bbox": {"l": 334.47137, "t": 85.85986000000003, "r": 405.72961, "b": 96.16900999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "6 CONCLUSION"}, {"label": "text", "id": 3, "page_no": 7, "cluster": {"id": 3, "label": "text", "bbox": {"l": 317.95499, "t": 101.06151999999997, "r": 559.71375, "b": 186.14917000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.985493004322052, "cells": [{"id": 114, "text": "In this paper, we presented the DocLayNet dataset. It provides the", "bbox": {"l": 317.95499, "t": 101.06151999999997, "r": 558.2038, "b": 109.43615999999997, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "document conversion and layout analysis research community a", "bbox": {"l": 317.95499, "t": 112.02057000000002, "r": 558.2041, "b": 120.39520000000005, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "new and challenging dataset to improve and fine-tune novel ML", "bbox": {"l": 317.95499, "t": 122.97955000000002, "r": 558.43274, "b": 131.35419000000002, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "methods on. In contrast to many other datasets, DocLayNet was", "bbox": {"l": 317.95499, "t": 133.93854, "r": 558.20416, "b": 142.31317, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "created by human annotation in order to obtain reliable layout", "bbox": {"l": 317.95499, "t": 144.89752, "r": 558.20422, "b": 153.27215999999999, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "ground-truth on a wide variety of publication- and typesetting-", "bbox": {"l": 317.95499, "t": 155.85657000000003, "r": 559.71313, "b": 164.23119999999994, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "styles. Including a large proportion of documents outside the scien-", "bbox": {"l": 317.95499, "t": 166.81555000000003, "r": 559.71375, "b": 175.19019000000003, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "tific publishing domain adds significant value in this respect.", "bbox": {"l": 317.95499, "t": 177.77454, "r": 540.04382, "b": 186.14917000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In this paper, we presented the DocLayNet dataset. It provides the document conversion and layout analysis research community a new and challenging dataset to improve and fine-tune novel ML methods on. In contrast to many other datasets, DocLayNet was created by human annotation in order to obtain reliable layout ground-truth on a wide variety of publication- and typesettingstyles. Including a large proportion of documents outside the scientific publishing domain adds significant value in this respect."}, {"label": "text", "id": 6, "page_no": 7, "cluster": {"id": 6, "label": "text", "bbox": {"l": 317.686, "t": 188.73352, "r": 559.71704, "b": 284.77917, "coord_origin": "TOPLEFT"}, "confidence": 0.9800531268119812, "cells": [{"id": 122, "text": "From the dataset, we have derived on the one hand reference", "bbox": {"l": 327.918, "t": 188.73352, "r": 558.19836, "b": 197.10815000000002, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "metrics for human performance on document-layout annotation", "bbox": {"l": 317.95499, "t": 199.69257000000005, "r": 558.20404, "b": 208.06719999999996, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "(through double and triple annotations) and on the other hand eval-", "bbox": {"l": 317.686, "t": 210.65155000000004, "r": 559.71704, "b": 219.02617999999995, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "uated the baseline performance of commonly used object detection", "bbox": {"l": 317.95499, "t": 221.60956, "r": 558.20245, "b": 229.98419, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "methods. We also illustrated the impact of various dataset-related", "bbox": {"l": 317.95499, "t": 232.56853999999998, "r": 558.20502, "b": 240.94317999999998, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "aspects on model performance through data-ablation experiments,", "bbox": {"l": 317.95499, "t": 243.52752999999996, "r": 559.18408, "b": 251.90215999999998, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "both from a size and class-label perspective. Last but not least, we", "bbox": {"l": 317.95499, "t": 254.48650999999995, "r": 558.20227, "b": 262.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "compared the accuracy of models trained on other public datasets", "bbox": {"l": 317.95499, "t": 265.44556, "r": 558.20349, "b": 273.82019, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "and showed that DocLayNet trained models are more robust.", "bbox": {"l": 317.95499, "t": 276.40454, "r": 540.99426, "b": 284.77917, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "From the dataset, we have derived on the one hand reference metrics for human performance on document-layout annotation (through double and triple annotations) and on the other hand evaluated the baseline performance of commonly used object detection methods. We also illustrated the impact of various dataset-related aspects on model performance through data-ablation experiments, both from a size and class-label perspective. Last but not least, we compared the accuracy of models trained on other public datasets and showed that DocLayNet trained models are more robust."}, {"label": "text", "id": 7, "page_no": 7, "cluster": {"id": 7, "label": "text", "bbox": {"l": 317.62299, "t": 287.36353, "r": 558.43469, "b": 317.65616000000006, "coord_origin": "TOPLEFT"}, "confidence": 0.9676101207733154, "cells": [{"id": 131, "text": "To date, there is still a significant gap between human and ML", "bbox": {"l": 327.918, "t": 287.36353, "r": 558.43469, "b": 295.73816, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "accuracy on the layout interpretation task, and we hope that this", "bbox": {"l": 317.95499, "t": 298.32254, "r": 558.20013, "b": 306.69717, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "work will inspire the research community to close that gap.", "bbox": {"l": 317.62299, "t": 309.28152, "r": 535.65015, "b": 317.65616000000006, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "To date, there is still a significant gap between human and ML accuracy on the layout interpretation task, and we hope that this work will inspire the research community to close that gap."}, {"label": "section_header", "id": 11, "page_no": 7, "cluster": {"id": 11, "label": "section_header", "bbox": {"l": 317.95499, "t": 335.09189, "r": 387.3696, "b": 345.40097, "coord_origin": "TOPLEFT"}, "confidence": 0.9378752708435059, "cells": [{"id": 134, "text": "REFERENCES", "bbox": {"l": 317.95499, "t": 335.09189, "r": 387.3696, "b": 345.40097, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "REFERENCES"}, {"label": "list_item", "id": 12, "page_no": 7, "cluster": {"id": 12, "label": "list_item", "bbox": {"l": 321.198, "t": 348.70233, "r": 558.20099, "b": 371.16286999999994, "coord_origin": "TOPLEFT"}, "confidence": 0.9372857213020325, "cells": [{"id": 135, "text": "[1]", "bbox": {"l": 321.198, "t": 348.70233, "r": 329.72415, "b": 355.21588, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "Max G\u00f6bel, Tamir Hassan, Ermelinda Oro, and Giorgio Orsi. Icdar 2013 table", "bbox": {"l": 331.53516, "t": 348.70233, "r": 558.19904, "b": 355.21588, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "competition. In", "bbox": {"l": 333.39099, "t": 356.67236, "r": 379.36414, "b": 363.18591, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "2013 12th International Conference on Document Analysis and", "bbox": {"l": 381.37201, "t": 356.70724, "r": 558.20099, "b": 363.19287, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "Recognition", "bbox": {"l": 333.39099, "t": 364.67724999999996, "r": 365.59601, "b": 371.16286999999994, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": ", pages 1449-1453, 2013.", "bbox": {"l": 365.59601, "t": 364.64236, "r": 434.29489, "b": 371.15591, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[1] Max G\u00f6bel, Tamir Hassan, Ermelinda Oro, and Giorgio Orsi. Icdar 2013 table competition. In 2013 12th International Conference on Document Analysis and Recognition , pages 1449-1453, 2013."}, {"label": "list_item", "id": 9, "page_no": 7, "cluster": {"id": 9, "label": "list_item", "bbox": {"l": 321.198, "t": 372.61237, "r": 559.37982, "b": 403.04287999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9480945467948914, "cells": [{"id": 141, "text": "[2]", "bbox": {"l": 321.198, "t": 372.61237, "r": 329.85956, "b": 379.12592, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "Christian Clausner, Apostolos Antonacopoulos, and Stefan Pletschacher. Ic-", "bbox": {"l": 331.69931, "t": 372.61237, "r": 559.37976, "b": 379.12592, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "dar2017 competition on recognition of documents with complex layouts -", "bbox": {"l": 333.39099, "t": 380.58237, "r": 559.37982, "b": 387.09592, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "rdcl2017. In", "bbox": {"l": 333.39099, "t": 388.55236999999994, "r": 367.4339, "b": 395.06592, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "2017 14th IAPR International Conference on Document Analysis and", "bbox": {"l": 369.17401, "t": 388.58725000000004, "r": 558.20422, "b": 395.07288, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "Recognition (ICDAR)", "bbox": {"l": 333.39099, "t": 396.55725, "r": 390.87601, "b": 403.04287999999997, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": ", volume 01, pages 1404-1410, 2017.", "bbox": {"l": 390.87698, "t": 396.52237, "r": 492.17831, "b": 403.03592, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[2] Christian Clausner, Apostolos Antonacopoulos, and Stefan Pletschacher. Icdar2017 competition on recognition of documents with complex layouts rdcl2017. In 2017 14th IAPR International Conference on Document Analysis and Recognition (ICDAR) , volume 01, pages 1404-1410, 2017."}, {"label": "list_item", "id": 17, "page_no": 7, "cluster": {"id": 17, "label": "list_item", "bbox": {"l": 321.198, "t": 404.49237, "r": 558.20013, "b": 426.94689999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9257517457008362, "cells": [{"id": 148, "text": "[3]", "bbox": {"l": 321.198, "t": 404.49237, "r": 329.53583, "b": 411.00592, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "Herv\u00e9 D\u00e9jean, Jean-Luc Meunier, Liangcai Gao, Yilun Huang, Yu Fang, Florian", "bbox": {"l": 331.30682, "t": 404.49237, "r": 558.19958, "b": 411.00592, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "Kleber, and Eva-Maria Lang. ICDAR 2019 Competition on Table Detection and", "bbox": {"l": 333.39099, "t": 412.46335, "r": 558.20013, "b": 418.9769, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "Recognition (cTDaR), April 2019. http://sac.founderit.com/.", "bbox": {"l": 333.39099, "t": 420.43335, "r": 501.80127, "b": 426.94689999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[3] Herv\u00e9 D\u00e9jean, Jean-Luc Meunier, Liangcai Gao, Yilun Huang, Yu Fang, Florian Kleber, and Eva-Maria Lang. ICDAR 2019 Competition on Table Detection and Recognition (cTDaR), April 2019. http://sac.founderit.com/."}, {"label": "list_item", "id": 16, "page_no": 7, "cluster": {"id": 16, "label": "list_item", "bbox": {"l": 321.198, "t": 428.40335, "r": 559.37872, "b": 458.8269, "coord_origin": "TOPLEFT"}, "confidence": 0.9270977973937988, "cells": [{"id": 152, "text": "[4]", "bbox": {"l": 321.198, "t": 428.40335, "r": 329.91299, "b": 434.9169, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "Antonio Jimeno Yepes, Peter Zhong, and Douglas Burdick. Competition on", "bbox": {"l": 331.7641, "t": 428.40335, "r": 558.19885, "b": 434.9169, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "scientific literature parsing. In", "bbox": {"l": 333.39099, "t": 436.3733500000001, "r": 423.77225, "b": 442.8869, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "Proceedings of the International Conference on", "bbox": {"l": 425.909, "t": 436.40823, "r": 558.20178, "b": 442.89386, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "Document Analysis and Recognition", "bbox": {"l": 333.39099, "t": 444.37823, "r": 429.42697, "b": 450.86386, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": ", ICDAR, pages 605-617. LNCS 12824, Springer-", "bbox": {"l": 429.42400999999995, "t": 444.34335, "r": 559.37872, "b": 450.85689999999994, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "Verlag, sep 2021.", "bbox": {"l": 332.819, "t": 452.31335, "r": 380.01764, "b": 458.8269, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[4] Antonio Jimeno Yepes, Peter Zhong, and Douglas Burdick. Competition on scientific literature parsing. In Proceedings of the International Conference on Document Analysis and Recognition , ICDAR, pages 605-617. LNCS 12824, SpringerVerlag, sep 2021."}, {"label": "list_item", "id": 14, "page_no": 7, "cluster": {"id": 14, "label": "list_item", "bbox": {"l": 321.198, "t": 460.28336, "r": 559.02625, "b": 490.70792, "coord_origin": "TOPLEFT"}, "confidence": 0.9290012121200562, "cells": [{"id": 159, "text": "[5]", "bbox": {"l": 321.198, "t": 460.28336, "r": 329.22977, "b": 466.79691, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "Logan Markewich, Hao Zhang, Yubin Xing, Navid Lambert-Shirzad, Jiang Zhexin,", "bbox": {"l": 330.93576, "t": 460.28336, "r": 558.97156, "b": 466.79691, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "Roy Lee, Zhi Li, and Seok-Bum Ko. Segmentation for document layout analysis:", "bbox": {"l": 333.39099, "t": 468.25336, "r": 559.02625, "b": 474.76691, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "not dead yet.", "bbox": {"l": 333.39099, "t": 476.22437, "r": 368.85431, "b": 482.73792, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "International Journal on Document Analysis and Recognition (IJDAR)", "bbox": {"l": 370.811, "t": 476.25925, "r": 557.46326, "b": 482.74487, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": ",", "bbox": {"l": 557.46503, "t": 476.22437, "r": 558.96857, "b": 482.73792, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "pages 1-11, 01 2022.", "bbox": {"l": 333.39099, "t": 484.19437, "r": 390.82715, "b": 490.70792, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[5] Logan Markewich, Hao Zhang, Yubin Xing, Navid Lambert-Shirzad, Jiang Zhexin, Roy Lee, Zhi Li, and Seok-Bum Ko. Segmentation for document layout analysis: not dead yet. International Journal on Document Analysis and Recognition (IJDAR) , pages 1-11, 01 2022."}, {"label": "list_item", "id": 15, "page_no": 7, "cluster": {"id": 15, "label": "list_item", "bbox": {"l": 321.198, "t": 492.16437, "r": 558.20361, "b": 514.6248800000001, "coord_origin": "TOPLEFT"}, "confidence": 0.927480161190033, "cells": [{"id": 166, "text": "[6]", "bbox": {"l": 321.198, "t": 492.16437, "r": 329.42145, "b": 498.67792, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "Xu Zhong, Jianbin Tang, and Antonio Jimeno-Yepes. Publaynet: Largest dataset", "bbox": {"l": 331.16812, "t": 492.16437, "r": 558.20361, "b": 498.67792, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "ever for document layout analysis. In", "bbox": {"l": 333.39099, "t": 500.13437, "r": 438.6101100000001, "b": 506.64792, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "Proceedings of the International Conference", "bbox": {"l": 440.349, "t": 500.16925, "r": 558.19958, "b": 506.65488, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "on Document Analysis and Recognition", "bbox": {"l": 333.39099, "t": 508.13925, "r": 441.40118, "b": 514.6248800000001, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": ", ICDAR, pages 1015-1022, sep 2019.", "bbox": {"l": 441.4019799999999, "t": 508.10437, "r": 544.78162, "b": 514.61792, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[6] Xu Zhong, Jianbin Tang, and Antonio Jimeno-Yepes. Publaynet: Largest dataset ever for document layout analysis. In Proceedings of the International Conference on Document Analysis and Recognition , ICDAR, pages 1015-1022, sep 2019."}, {"label": "list_item", "id": 10, "page_no": 7, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 321.19797, "t": 516.07437, "r": 558.9715, "b": 554.46889, "coord_origin": "TOPLEFT"}, "confidence": 0.9426893591880798, "cells": [{"id": 172, "text": "[7]", "bbox": {"l": 321.19797, "t": 516.07437, "r": 329.74161, "b": 522.5879199999999, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "Minghao Li, Yiheng Xu, Lei Cui, Shaohan Huang, Furu Wei, Zhoujun Li, and", "bbox": {"l": 331.55634, "t": 516.07437, "r": 558.19897, "b": 522.5879199999999, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "Ming Zhou. Docbank: A benchmark dataset for document layout analysis. In", "bbox": {"l": 333.39099, "t": 524.0443700000001, "r": 558.19891, "b": 530.55792, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "Proceedings of the 28th International Conference on Computational Linguistics", "bbox": {"l": 333.39099, "t": 532.04922, "r": 557.40228, "b": 538.53487, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": ",", "bbox": {"l": 557.40399, "t": 532.01437, "r": 558.96893, "b": 538.5278900000001, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "COLING, pages 949-960. International Committee on Computational Linguistics,", "bbox": {"l": 333.39099, "t": 539.98438, "r": 558.9715, "b": 546.49789, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "dec 2020.", "bbox": {"l": 333.39099, "t": 547.95535, "r": 359.31955, "b": 554.46889, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[7] Minghao Li, Yiheng Xu, Lei Cui, Shaohan Huang, Furu Wei, Zhoujun Li, and Ming Zhou. Docbank: A benchmark dataset for document layout analysis. In Proceedings of the 28th International Conference on Computational Linguistics , COLING, pages 949-960. International Committee on Computational Linguistics, dec 2020."}, {"label": "list_item", "id": 19, "page_no": 7, "cluster": {"id": 19, "label": "list_item", "bbox": {"l": 321.198, "t": 555.92535, "r": 558.90222, "b": 578.38586, "coord_origin": "TOPLEFT"}, "confidence": 0.9139686226844788, "cells": [{"id": 179, "text": "[8]", "bbox": {"l": 321.198, "t": 555.92535, "r": 329.7088, "b": 562.43889, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "Riaz Ahmad, Muhammad Tanvir Afzal, and M. Qadir. Information extraction", "bbox": {"l": 331.51654, "t": 555.92535, "r": 558.19891, "b": 562.43889, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "from pdf sources based on rule-based system using integrated formats. In", "bbox": {"l": 333.39099, "t": 563.89536, "r": 535.54352, "b": 570.40889, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "SemWe-", "bbox": {"l": 536.96399, "t": 563.93024, "r": 558.90222, "b": 570.4158600000001, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "bEval@ESWC", "bbox": {"l": 333.39099, "t": 571.9002399999999, "r": 371.94217, "b": 578.38586, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": ", 2016.", "bbox": {"l": 371.94299, "t": 571.86536, "r": 389.72617, "b": 578.3788900000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[8] Riaz Ahmad, Muhammad Tanvir Afzal, and M. Qadir. Information extraction from pdf sources based on rule-based system using integrated formats. In SemWebEval@ESWC , 2016."}, {"label": "list_item", "id": 21, "page_no": 7, "cluster": {"id": 21, "label": "list_item", "bbox": {"l": 321.198, "t": 579.83536, "r": 559.27448, "b": 610.2589, "coord_origin": "TOPLEFT"}, "confidence": 0.9113100171089172, "cells": [{"id": 185, "text": "[9]", "bbox": {"l": 321.198, "t": 579.83536, "r": 329.45999, "b": 586.34889, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "Ross B. Girshick, Jeff Donahue, Trevor Darrell, and Jitendra Malik. Rich feature", "bbox": {"l": 331.21487, "t": 579.83536, "r": 558.19843, "b": 586.34889, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "hierarchies for accurate object detection and semantic segmentation. In", "bbox": {"l": 333.39099, "t": 587.8053600000001, "r": 543.05487, "b": 594.31889, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": "IEEE", "bbox": {"l": 544.98499, "t": 587.84024, "r": 558.20148, "b": 594.32587, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "Conference on Computer Vision and Pattern Recognition", "bbox": {"l": 333.39099, "t": 595.81024, "r": 491.61166, "b": 602.29587, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": ", CVPR, pages 580-587.", "bbox": {"l": 491.61301, "t": 595.77536, "r": 559.27448, "b": 602.28889, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "IEEE Computer Society, jun 2014.", "bbox": {"l": 333.39099, "t": 603.74536, "r": 428.59726000000006, "b": 610.2589, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[9] Ross B. Girshick, Jeff Donahue, Trevor Darrell, and Jitendra Malik. Rich feature hierarchies for accurate object detection and semantic segmentation. In IEEE Conference on Computer Vision and Pattern Recognition , CVPR, pages 580-587. IEEE Computer Society, jun 2014."}, {"label": "list_item", "id": 22, "page_no": 7, "cluster": {"id": 22, "label": "list_item", "bbox": {"l": 317.95499, "t": 611.71536, "r": 558.20203, "b": 626.20686, "coord_origin": "TOPLEFT"}, "confidence": 0.9028767347335815, "cells": [{"id": 192, "text": "[10]", "bbox": {"l": 317.95499, "t": 611.71536, "r": 329.54767, "b": 618.2289000000001, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "Ross B. Girshick. Fast R-CNN. In", "bbox": {"l": 331.31268, "t": 611.71536, "r": 425.1554, "b": 618.2289000000001, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "2015 IEEE International Conference on Computer", "bbox": {"l": 426.77802, "t": 611.75024, "r": 558.20203, "b": 618.23587, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "Vision", "bbox": {"l": 333.39099, "t": 619.72124, "r": 350.59537, "b": 626.20686, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": ", ICCV, pages 1440-1448. IEEE Computer Society, dec 2015.", "bbox": {"l": 350.59598, "t": 619.68637, "r": 518.58777, "b": 626.19989, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[10] Ross B. Girshick. Fast R-CNN. In 2015 IEEE International Conference on Computer Vision , ICCV, pages 1440-1448. IEEE Computer Society, dec 2015."}, {"label": "list_item", "id": 20, "page_no": 7, "cluster": {"id": 20, "label": "list_item", "bbox": {"l": 317.95499, "t": 627.65637, "r": 558.20142, "b": 650.1168700000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9127691984176636, "cells": [{"id": 197, "text": "[11]", "bbox": {"l": 317.95499, "t": 627.65637, "r": 329.5459, "b": 634.16989, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "Shaoqing Ren, Kaiming He, Ross Girshick, and Jian Sun. Faster r-cnn: Towards", "bbox": {"l": 331.31064, "t": 627.65637, "r": 558.20142, "b": 634.16989, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "real-time object detection with region proposal networks.", "bbox": {"l": 333.39099, "t": 635.62637, "r": 497.50909, "b": 642.13989, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "IEEE Transactions on", "bbox": {"l": 500.01401, "t": 635.66124, "r": 558.19885, "b": 642.14687, "coord_origin": "TOPLEFT"}}, {"id": 201, "text": "Pattern Analysis and Machine Intelligence", "bbox": {"l": 333.39099, "t": 643.6312399999999, "r": 449.38620000000003, "b": 650.1168700000001, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": ", 39(6):1137-1149, 2017.", "bbox": {"l": 449.38699, "t": 643.59637, "r": 515.74268, "b": 650.10989, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[11] Shaoqing Ren, Kaiming He, Ross Girshick, and Jian Sun. Faster r-cnn: Towards real-time object detection with region proposal networks. IEEE Transactions on Pattern Analysis and Machine Intelligence , 39(6):1137-1149, 2017."}, {"label": "list_item", "id": 18, "page_no": 7, "cluster": {"id": 18, "label": "list_item", "bbox": {"l": 317.95499, "t": 651.56638, "r": 559.27808, "b": 674.01989, "coord_origin": "TOPLEFT"}, "confidence": 0.9142459630966187, "cells": [{"id": 203, "text": "[12]", "bbox": {"l": 317.95499, "t": 651.56638, "r": 329.41763, "b": 658.0799, "coord_origin": "TOPLEFT"}}, {"id": 204, "text": "Kaiming He, Georgia Gkioxari, Piotr Doll\u00e1r, and Ross B. Girshick. Mask R-CNN.", "bbox": {"l": 331.16287, "t": 651.56638, "r": 559.27808, "b": 658.0799, "coord_origin": "TOPLEFT"}}, {"id": 205, "text": "In", "bbox": {"l": 333.39099, "t": 659.53638, "r": 339.35904, "b": 666.0499, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": "IEEE International Conference on Computer Vision", "bbox": {"l": 341.56299, "t": 659.57124, "r": 485.8273, "b": 666.05687, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": ", ICCV, pages 2980-2988.", "bbox": {"l": 485.82901, "t": 659.53638, "r": 559.27356, "b": 666.0499, "coord_origin": "TOPLEFT"}}, {"id": 208, "text": "IEEE Computer Society, Oct 2017.", "bbox": {"l": 333.39099, "t": 667.50636, "r": 429.30161000000004, "b": 674.01989, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[12] Kaiming He, Georgia Gkioxari, Piotr Doll\u00e1r, and Ross B. Girshick. Mask R-CNN. In IEEE International Conference on Computer Vision , ICCV, pages 2980-2988. IEEE Computer Society, Oct 2017."}, {"label": "list_item", "id": 23, "page_no": 7, "cluster": {"id": 23, "label": "list_item", "bbox": {"l": 317.95499, "t": 675.47636, "r": 558.97156, "b": 705.900894, "coord_origin": "TOPLEFT"}, "confidence": 0.889543354511261, "cells": [{"id": 209, "text": "[13]", "bbox": {"l": 317.95499, "t": 675.47636, "r": 330.11407, "b": 681.9898900000001, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": "Glenn Jocher, Alex Stoken, Ayush Chaurasia, Jirka Borovec, NanoCode012,", "bbox": {"l": 331.96533, "t": 675.47636, "r": 558.96716, "b": 681.9898900000001, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "TaoXie, Yonghye Kwon, Kalen Michael, Liu Changyu, Jiacong Fang, Abhiram V,", "bbox": {"l": 333.18201, "t": 683.44637, "r": 558.96661, "b": 689.95989, "coord_origin": "TOPLEFT"}}, {"id": 212, "text": "Laughing, tkianai, yxNONG, Piotr Skalski, Adam Hogan, Jebastin Nadar, imyhxy,", "bbox": {"l": 333.39099, "t": 691.41737, "r": 558.97156, "b": 697.930893, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "Lorenzo Mammana, Alex Wang, Cristi Fati, Diego Montes, Jan Hajek, Laurentiu", "bbox": {"l": 333.39099, "t": 699.387367, "r": 558.20001, "b": 705.900894, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[13] Glenn Jocher, Alex Stoken, Ayush Chaurasia, Jirka Borovec, NanoCode012, TaoXie, Yonghye Kwon, Kalen Michael, Liu Changyu, Jiacong Fang, Abhiram V, Laughing, tkianai, yxNONG, Piotr Skalski, Adam Hogan, Jebastin Nadar, imyhxy, Lorenzo Mammana, Alex Wang, Cristi Fati, Diego Montes, Jan Hajek, Laurentiu"}], "body": [{"label": "text", "id": 5, "page_no": 7, "cluster": {"id": 5, "label": "text", "bbox": {"l": 53.501999, "t": 86.87292000000002, "r": 295.64868, "b": 150.14111000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9824112057685852, "cells": [{"id": 2, "text": "Table 5: Prediction Performance (mAP@0.5-0.95) of a Mask", "bbox": {"l": 53.501999, "t": 86.87292000000002, "r": 294.32153, "b": 95.34618999999998, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "R-CNN R50 network across the PubLayNet, DocBank & Do-", "bbox": {"l": 53.79800000000001, "t": 97.83191, "r": 295.64868, "b": 106.30517999999995, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "cLayNet data-sets. By evaluating on common label classes of", "bbox": {"l": 53.79800000000001, "t": 108.79088999999999, "r": 294.0437, "b": 117.26415999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "each dataset, we observe that the DocLayNet-trained model", "bbox": {"l": 53.79800000000001, "t": 119.74987999999996, "r": 294.04373, "b": 128.22313999999994, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "has much less pronounced variations in performance across", "bbox": {"l": 53.79800000000001, "t": 130.70885999999996, "r": 294.0437, "b": 139.18213000000003, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "all datasets.", "bbox": {"l": 53.79800000000001, "t": 141.66785000000004, "r": 101.15852, "b": 150.14111000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 5: Prediction Performance (mAP@0.5-0.95) of a Mask R-CNN R50 network across the PubLayNet, DocBank & DocLayNet data-sets. By evaluating on common label classes of each dataset, we observe that the DocLayNet-trained model has much less pronounced variations in performance across all datasets."}, {"label": "table", "id": 0, "page_no": 7, "cluster": {"id": 0, "label": "table", "bbox": {"l": 72.6590347290039, "t": 172.48080444335938, "r": 274.83465576171875, "b": 339.8540344238281, "coord_origin": "TOPLEFT"}, "confidence": 0.9892616271972656, "cells": [{"id": 8, "text": "Testing on", "bbox": {"l": 217.74099999999999, "t": 175.01855, "r": 256.26065, "b": 183.39319, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Training on", "bbox": {"l": 89.954002, "t": 185.97655999999995, "r": 133.24379, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "labels", "bbox": {"l": 154.629, "t": 185.97655999999995, "r": 175.47588, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "PLN", "bbox": {"l": 204.69, "t": 185.97655999999995, "r": 220.54260000000002, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "DB", "bbox": {"l": 230.50427000000002, "t": 185.97655999999995, "r": 242.06197, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "DLN", "bbox": {"l": 252.02364, "t": 185.97655999999995, "r": 269.31085, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "PubLayNet (PLN)", "bbox": {"l": 78.530998, "t": 219.25256000000002, "r": 142.56006, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Figure", "bbox": {"l": 154.629, "t": 197.33452999999997, "r": 177.92371, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "96", "bbox": {"l": 208.44701, "t": 197.33452999999997, "r": 216.78575000000004, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "43", "bbox": {"l": 232.1183, "t": 197.33452999999997, "r": 240.45705, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "23", "bbox": {"l": 256.49792, "t": 197.33452999999997, "r": 264.83667, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Sec-header", "bbox": {"l": 154.629, "t": 208.29351999999994, "r": 194.72675, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "87", "bbox": {"l": 208.44701, "t": 208.29351999999994, "r": 216.78575000000004, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "-", "bbox": {"l": 234.77235, "t": 208.29351999999994, "r": 237.80299000000002, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "32", "bbox": {"l": 256.49792, "t": 208.29351999999994, "r": 264.83667, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Table", "bbox": {"l": 154.629, "t": 219.25256000000002, "r": 174.43578, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "95", "bbox": {"l": 208.44701, "t": 219.25256000000002, "r": 216.78575000000004, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "24", "bbox": {"l": 232.1183, "t": 219.25256000000002, "r": 240.45705, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "49", "bbox": {"l": 256.49792, "t": 219.25256000000002, "r": 264.83667, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Text", "bbox": {"l": 154.629, "t": 230.21155, "r": 170.58919, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "96", "bbox": {"l": 208.44701, "t": 230.21155, "r": 216.78575000000004, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "-", "bbox": {"l": 234.77235, "t": 230.21155, "r": 237.80299000000002, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "42", "bbox": {"l": 256.49792, "t": 230.21155, "r": 264.83667, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "total", "bbox": {"l": 154.629, "t": 241.16956000000005, "r": 171.2796, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "93", "bbox": {"l": 208.44701, "t": 241.16956000000005, "r": 216.78575000000004, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "34", "bbox": {"l": 232.1183, "t": 241.16956000000005, "r": 240.45705, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "30", "bbox": {"l": 256.49792, "t": 241.16956000000005, "r": 264.83667, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "DocBank (DB)", "bbox": {"l": 78.530998, "t": 263.48650999999995, "r": 131.19963, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Figure", "bbox": {"l": 154.629, "t": 252.52752999999996, "r": 177.92371, "b": 260.90216, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "77", "bbox": {"l": 208.44701, "t": 252.52752999999996, "r": 216.78575000000004, "b": 260.90216, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "71", "bbox": {"l": 232.1183, "t": 252.52752999999996, "r": 240.45705, "b": 260.90216, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "31", "bbox": {"l": 256.49792, "t": 252.52752999999996, "r": 264.83667, "b": 260.90216, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "Table", "bbox": {"l": 154.629, "t": 263.48650999999995, "r": 174.43578, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "19", "bbox": {"l": 208.44701, "t": 263.48650999999995, "r": 216.78575000000004, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "65", "bbox": {"l": 232.1183, "t": 263.48650999999995, "r": 240.45705, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "22", "bbox": {"l": 256.49792, "t": 263.48650999999995, "r": 264.83667, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "total", "bbox": {"l": 154.629, "t": 274.44556, "r": 171.2796, "b": 282.82016, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "48", "bbox": {"l": 208.44701, "t": 274.44556, "r": 216.78575000000004, "b": 282.82016, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "68", "bbox": {"l": 232.1183, "t": 274.44556, "r": 240.45705, "b": 282.82016, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "27", "bbox": {"l": 256.49792, "t": 274.44556, "r": 264.83667, "b": 282.82016, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "DocLayNet (DLN)", "bbox": {"l": 78.530998, "t": 307.72055, "r": 144.66716, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "Figure", "bbox": {"l": 154.629, "t": 285.80255, "r": 177.92371, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "67", "bbox": {"l": 208.44701, "t": 285.80255, "r": 216.78575000000004, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "51", "bbox": {"l": 232.1183, "t": 285.80255, "r": 240.45705, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "72", "bbox": {"l": 256.49792, "t": 285.80255, "r": 264.83667, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Sec-header", "bbox": {"l": 154.629, "t": 296.76154, "r": 194.72675, "b": 305.13617, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "53", "bbox": {"l": 208.44701, "t": 296.76154, "r": 216.78575000000004, "b": 305.13617, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "-", "bbox": {"l": 234.77235, "t": 296.76154, "r": 237.80299000000002, "b": 305.13617, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "68", "bbox": {"l": 256.49792, "t": 296.76154, "r": 264.83667, "b": 305.13617, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Table", "bbox": {"l": 154.629, "t": 307.72055, "r": 174.43578, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "87", "bbox": {"l": 208.44701, "t": 307.72055, "r": 216.78575000000004, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "43", "bbox": {"l": 232.1183, "t": 307.72055, "r": 240.45705, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "82", "bbox": {"l": 256.49792, "t": 307.72055, "r": 264.83667, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "Text", "bbox": {"l": 154.629, "t": 318.67953, "r": 170.58919, "b": 327.05417, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "77", "bbox": {"l": 208.44701, "t": 318.67953, "r": 216.78575000000004, "b": 327.05417, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "-", "bbox": {"l": 234.77235, "t": 318.67953, "r": 237.80299000000002, "b": 327.05417, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "84", "bbox": {"l": 256.49792, "t": 318.67953, "r": 264.83667, "b": 327.05417, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "total", "bbox": {"l": 154.629, "t": 329.63855, "r": 171.2796, "b": 338.01318, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "59", "bbox": {"l": 208.44701, "t": 329.63855, "r": 216.78575000000004, "b": 338.01318, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "47", "bbox": {"l": 232.1183, "t": 329.63855, "r": 240.45705, "b": 338.01318, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "78", "bbox": {"l": 256.49792, "t": 329.63855, "r": 264.83667, "b": 338.01318, "coord_origin": "TOPLEFT"}}], "children": [{"id": 25, "label": "text", "bbox": {"l": 217.74099999999999, "t": 175.01855, "r": 256.26065, "b": 183.39319, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "Testing on", "bbox": {"l": 217.74099999999999, "t": 175.01855, "r": 256.26065, "b": 183.39319, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 89.954002, "t": 185.97655999999995, "r": 133.24379, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "Training on", "bbox": {"l": 89.954002, "t": 185.97655999999995, "r": 133.24379, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 154.629, "t": 185.97655999999995, "r": 175.47588, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "labels", "bbox": {"l": 154.629, "t": 185.97655999999995, "r": 175.47588, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 204.69, "t": 185.97655999999995, "r": 220.54260000000002, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "PLN", "bbox": {"l": 204.69, "t": 185.97655999999995, "r": 220.54260000000002, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 230.50427000000002, "t": 185.97655999999995, "r": 242.06197, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "DB", "bbox": {"l": 230.50427000000002, "t": 185.97655999999995, "r": 242.06197, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 252.02364, "t": 185.97655999999995, "r": 269.31085, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "DLN", "bbox": {"l": 252.02364, "t": 185.97655999999995, "r": 269.31085, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 78.530998, "t": 219.25256000000002, "r": 142.56006, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "PubLayNet (PLN)", "bbox": {"l": 78.530998, "t": 219.25256000000002, "r": 142.56006, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 154.629, "t": 197.33452999999997, "r": 177.92371, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "Figure", "bbox": {"l": 154.629, "t": 197.33452999999997, "r": 177.92371, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 208.44701, "t": 197.33452999999997, "r": 216.78575000000004, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "96", "bbox": {"l": 208.44701, "t": 197.33452999999997, "r": 216.78575000000004, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 232.1183, "t": 197.33452999999997, "r": 240.45705, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "43", "bbox": {"l": 232.1183, "t": 197.33452999999997, "r": 240.45705, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 256.49792, "t": 197.33452999999997, "r": 264.83667, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "23", "bbox": {"l": 256.49792, "t": 197.33452999999997, "r": 264.83667, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 154.629, "t": 208.29351999999994, "r": 194.72675, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "Sec-header", "bbox": {"l": 154.629, "t": 208.29351999999994, "r": 194.72675, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 208.44701, "t": 208.29351999999994, "r": 216.78575000000004, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "87", "bbox": {"l": 208.44701, "t": 208.29351999999994, "r": 216.78575000000004, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 234.77235, "t": 208.29351999999994, "r": 237.80299000000002, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "-", "bbox": {"l": 234.77235, "t": 208.29351999999994, "r": 237.80299000000002, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 256.49792, "t": 208.29351999999994, "r": 264.83667, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "32", "bbox": {"l": 256.49792, "t": 208.29351999999994, "r": 264.83667, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 154.629, "t": 219.25256000000002, "r": 174.43578, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "Table", "bbox": {"l": 154.629, "t": 219.25256000000002, "r": 174.43578, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 208.44701, "t": 219.25256000000002, "r": 216.78575000000004, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "95", "bbox": {"l": 208.44701, "t": 219.25256000000002, "r": 216.78575000000004, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 232.1183, "t": 219.25256000000002, "r": 240.45705, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "24", "bbox": {"l": 232.1183, "t": 219.25256000000002, "r": 240.45705, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 256.49792, "t": 219.25256000000002, "r": 264.83667, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "49", "bbox": {"l": 256.49792, "t": 219.25256000000002, "r": 264.83667, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 154.629, "t": 230.21155, "r": 170.58919, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "Text", "bbox": {"l": 154.629, "t": 230.21155, "r": 170.58919, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 208.44701, "t": 230.21155, "r": 216.78575000000004, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "96", "bbox": {"l": 208.44701, "t": 230.21155, "r": 216.78575000000004, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 234.77235, "t": 230.21155, "r": 237.80299000000002, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "-", "bbox": {"l": 234.77235, "t": 230.21155, "r": 237.80299000000002, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 256.49792, "t": 230.21155, "r": 264.83667, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "42", "bbox": {"l": 256.49792, "t": 230.21155, "r": 264.83667, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 154.629, "t": 241.16956000000005, "r": 171.2796, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "total", "bbox": {"l": 154.629, "t": 241.16956000000005, "r": 171.2796, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 208.44701, "t": 241.16956000000005, "r": 216.78575000000004, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "93", "bbox": {"l": 208.44701, "t": 241.16956000000005, "r": 216.78575000000004, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 232.1183, "t": 241.16956000000005, "r": 240.45705, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "34", "bbox": {"l": 232.1183, "t": 241.16956000000005, "r": 240.45705, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 256.49792, "t": 241.16956000000005, "r": 264.83667, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "30", "bbox": {"l": 256.49792, "t": 241.16956000000005, "r": 264.83667, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 78.530998, "t": 263.48650999999995, "r": 131.19963, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "DocBank (DB)", "bbox": {"l": 78.530998, "t": 263.48650999999995, "r": 131.19963, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 154.629, "t": 252.52752999999996, "r": 177.92371, "b": 260.90216, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "Figure", "bbox": {"l": 154.629, "t": 252.52752999999996, "r": 177.92371, "b": 260.90216, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 208.44701, "t": 252.52752999999996, "r": 216.78575000000004, "b": 260.90216, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "77", "bbox": {"l": 208.44701, "t": 252.52752999999996, "r": 216.78575000000004, "b": 260.90216, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 232.1183, "t": 252.52752999999996, "r": 240.45705, "b": 260.90216, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "71", "bbox": {"l": 232.1183, "t": 252.52752999999996, "r": 240.45705, "b": 260.90216, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 256.49792, "t": 252.52752999999996, "r": 264.83667, "b": 260.90216, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "31", "bbox": {"l": 256.49792, "t": 252.52752999999996, "r": 264.83667, "b": 260.90216, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 154.629, "t": 263.48650999999995, "r": 174.43578, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "Table", "bbox": {"l": 154.629, "t": 263.48650999999995, "r": 174.43578, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 208.44701, "t": 263.48650999999995, "r": 216.78575000000004, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "19", "bbox": {"l": 208.44701, "t": 263.48650999999995, "r": 216.78575000000004, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 232.1183, "t": 263.48650999999995, "r": 240.45705, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "65", "bbox": {"l": 232.1183, "t": 263.48650999999995, "r": 240.45705, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 256.49792, "t": 263.48650999999995, "r": 264.83667, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "22", "bbox": {"l": 256.49792, "t": 263.48650999999995, "r": 264.83667, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 154.629, "t": 274.44556, "r": 171.2796, "b": 282.82016, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "total", "bbox": {"l": 154.629, "t": 274.44556, "r": 171.2796, "b": 282.82016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 208.44701, "t": 274.44556, "r": 216.78575000000004, "b": 282.82016, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "48", "bbox": {"l": 208.44701, "t": 274.44556, "r": 216.78575000000004, "b": 282.82016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 232.1183, "t": 274.44556, "r": 240.45705, "b": 282.82016, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "68", "bbox": {"l": 232.1183, "t": 274.44556, "r": 240.45705, "b": 282.82016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 256.49792, "t": 274.44556, "r": 264.83667, "b": 282.82016, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "27", "bbox": {"l": 256.49792, "t": 274.44556, "r": 264.83667, "b": 282.82016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 78.530998, "t": 307.72055, "r": 144.66716, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "DocLayNet (DLN)", "bbox": {"l": 78.530998, "t": 307.72055, "r": 144.66716, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 154.629, "t": 285.80255, "r": 177.92371, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "Figure", "bbox": {"l": 154.629, "t": 285.80255, "r": 177.92371, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 208.44701, "t": 285.80255, "r": 216.78575000000004, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "67", "bbox": {"l": 208.44701, "t": 285.80255, "r": 216.78575000000004, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 232.1183, "t": 285.80255, "r": 240.45705, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "51", "bbox": {"l": 232.1183, "t": 285.80255, "r": 240.45705, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 256.49792, "t": 285.80255, "r": 264.83667, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "72", "bbox": {"l": 256.49792, "t": 285.80255, "r": 264.83667, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 154.629, "t": 296.76154, "r": 194.72675, "b": 305.13617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "Sec-header", "bbox": {"l": 154.629, "t": 296.76154, "r": 194.72675, "b": 305.13617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 208.44701, "t": 296.76154, "r": 216.78575000000004, "b": 305.13617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "53", "bbox": {"l": 208.44701, "t": 296.76154, "r": 216.78575000000004, "b": 305.13617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 234.77235, "t": 296.76154, "r": 237.80299000000002, "b": 305.13617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "-", "bbox": {"l": 234.77235, "t": 296.76154, "r": 237.80299000000002, "b": 305.13617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 256.49792, "t": 296.76154, "r": 264.83667, "b": 305.13617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "68", "bbox": {"l": 256.49792, "t": 296.76154, "r": 264.83667, "b": 305.13617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 154.629, "t": 307.72055, "r": 174.43578, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "Table", "bbox": {"l": 154.629, "t": 307.72055, "r": 174.43578, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 208.44701, "t": 307.72055, "r": 216.78575000000004, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "87", "bbox": {"l": 208.44701, "t": 307.72055, "r": 216.78575000000004, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 232.1183, "t": 307.72055, "r": 240.45705, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "43", "bbox": {"l": 232.1183, "t": 307.72055, "r": 240.45705, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 256.49792, "t": 307.72055, "r": 264.83667, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "82", "bbox": {"l": 256.49792, "t": 307.72055, "r": 264.83667, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 154.629, "t": 318.67953, "r": 170.58919, "b": 327.05417, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "Text", "bbox": {"l": 154.629, "t": 318.67953, "r": 170.58919, "b": 327.05417, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 208.44701, "t": 318.67953, "r": 216.78575000000004, "b": 327.05417, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "77", "bbox": {"l": 208.44701, "t": 318.67953, "r": 216.78575000000004, "b": 327.05417, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 234.77235, "t": 318.67953, "r": 237.80299000000002, "b": 327.05417, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "-", "bbox": {"l": 234.77235, "t": 318.67953, "r": 237.80299000000002, "b": 327.05417, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 256.49792, "t": 318.67953, "r": 264.83667, "b": 327.05417, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "84", "bbox": {"l": 256.49792, "t": 318.67953, "r": 264.83667, "b": 327.05417, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 154.629, "t": 329.63855, "r": 171.2796, "b": 338.01318, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "total", "bbox": {"l": 154.629, "t": 329.63855, "r": 171.2796, "b": 338.01318, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 208.44701, "t": 329.63855, "r": 216.78575000000004, "b": 338.01318, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "59", "bbox": {"l": 208.44701, "t": 329.63855, "r": 216.78575000000004, "b": 338.01318, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 232.1183, "t": 329.63855, "r": 240.45705, "b": 338.01318, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "47", "bbox": {"l": 232.1183, "t": 329.63855, "r": 240.45705, "b": 338.01318, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 256.49792, "t": 329.63855, "r": 264.83667, "b": 338.01318, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "78", "bbox": {"l": 256.49792, "t": 329.63855, "r": 264.83667, "b": 338.01318, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "lcel", "lcel", "nl", "ched", "ched", "ched", "ched", "ched", "nl", "rhed", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl", "rhed", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl", "rhed", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl"], "num_rows": 15, "num_cols": 5, "table_cells": [{"bbox": {"l": 217.74099999999999, "t": 175.01855, "r": 256.26065, "b": 183.39319, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 3, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 5, "text": "Testing on", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 89.954002, "t": 185.97655999999995, "r": 133.24379, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Training on", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 185.97655999999995, "r": 175.47588, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "labels", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 204.69, "t": 185.97655999999995, "r": 220.54260000000002, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "PLN", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 230.50427000000002, "t": 185.97655999999995, "r": 242.06197, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "DB", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 252.02364, "t": 185.97655999999995, "r": 269.31085, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "DLN", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 78.530998, "t": 219.25256000000002, "r": 142.56006, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 5, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PubLayNet (PLN)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 154.629, "t": 197.33452999999997, "r": 177.92371, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Figure", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 197.33452999999997, "r": 216.78575000000004, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 197.33452999999997, "r": 240.45705, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "43", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 197.33452999999997, "r": 264.83667, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "23", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 208.29351999999994, "r": 194.72675, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Sec-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 208.29351999999994, "r": 216.78575000000004, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "87", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 234.77235, "t": 208.29351999999994, "r": 237.80299000000002, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 208.29351999999994, "r": 264.83667, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "32", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 219.25256000000002, "r": 174.43578, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 219.25256000000002, "r": 216.78575000000004, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "95", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 219.25256000000002, "r": 240.45705, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "24", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 219.25256000000002, "r": 264.83667, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "49", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 230.21155, "r": 170.58919, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Text", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 230.21155, "r": 216.78575000000004, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 234.77235, "t": 230.21155, "r": 237.80299000000002, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 230.21155, "r": 264.83667, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "42", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 241.16956000000005, "r": 171.2796, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "total", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 241.16956000000005, "r": 216.78575000000004, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "93", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 241.16956000000005, "r": 240.45705, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "34", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 241.16956000000005, "r": 264.83667, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "30", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 78.530998, "t": 263.48650999999995, "r": 131.19963, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "row_span": 3, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "DocBank (DB)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 154.629, "t": 252.52752999999996, "r": 177.92371, "b": 260.90216, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Figure", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 252.52752999999996, "r": 216.78575000000004, "b": 260.90216, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 252.52752999999996, "r": 240.45705, "b": 260.90216, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "71", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 252.52752999999996, "r": 264.83667, "b": 260.90216, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "31", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 263.48650999999995, "r": 174.43578, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 263.48650999999995, "r": 216.78575000000004, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "19", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 263.48650999999995, "r": 240.45705, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "65", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 263.48650999999995, "r": 264.83667, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "22", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 274.44556, "r": 171.2796, "b": 282.82016, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "total", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 274.44556, "r": 216.78575000000004, "b": 282.82016, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "48", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 274.44556, "r": 240.45705, "b": 282.82016, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 274.44556, "r": 264.83667, "b": 282.82016, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "27", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 78.530998, "t": 307.72055, "r": 144.66716, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "row_span": 5, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 15, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "DocLayNet (DLN)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 154.629, "t": 285.80255, "r": 177.92371, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Figure", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 285.80255, "r": 216.78575000000004, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "67", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 285.80255, "r": 240.45705, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "51", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 285.80255, "r": 264.83667, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 296.76154, "r": 194.72675, "b": 305.13617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Sec-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 296.76154, "r": 216.78575000000004, "b": 305.13617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "53", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 234.77235, "t": 296.76154, "r": 237.80299000000002, "b": 305.13617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 296.76154, "r": 264.83667, "b": 305.13617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 307.72055, "r": 174.43578, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 307.72055, "r": 216.78575000000004, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "87", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 307.72055, "r": 240.45705, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "43", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 307.72055, "r": 264.83667, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 318.67953, "r": 170.58919, "b": 327.05417, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Text", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 318.67953, "r": 216.78575000000004, "b": 327.05417, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 234.77235, "t": 318.67953, "r": 237.80299000000002, "b": 327.05417, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 318.67953, "r": 264.83667, "b": 327.05417, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 329.63855, "r": 171.2796, "b": 338.01318, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 14, "end_row_offset_idx": 15, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "total", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 329.63855, "r": 216.78575000000004, "b": 338.01318, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 14, "end_row_offset_idx": 15, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "59", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 329.63855, "r": 240.45705, "b": 338.01318, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 14, "end_row_offset_idx": 15, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "47", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 329.63855, "r": 264.83667, "b": 338.01318, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 14, "end_row_offset_idx": 15, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "78", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "text", "id": 4, "page_no": 7, "cluster": {"id": 4, "label": "text", "bbox": {"l": 53.79800000000001, "t": 390.92053, "r": 294.04712, "b": 443.14014, "coord_origin": "TOPLEFT"}, "confidence": 0.9839397668838501, "cells": [{"id": 69, "text": "Section-header", "bbox": {"l": 53.79800000000001, "t": 390.96539, "r": 106.2392, "b": 399.30414, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": ",", "bbox": {"l": 106.239, "t": 390.92053, "r": 108.23331, "b": 399.2951699999999, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Table", "bbox": {"l": 110.482, "t": 390.96539, "r": 129.76332, "b": 399.30414, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "and", "bbox": {"l": 132.21899, "t": 390.92053, "r": 145.86186, "b": 399.2951699999999, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "Text", "bbox": {"l": 148.112, "t": 390.96539, "r": 163.14182, "b": 399.30414, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": ". Before training, we either mapped", "bbox": {"l": 163.13901, "t": 390.92053, "r": 294.04709, "b": 399.2951699999999, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "or excluded DocLayNet\u2019s other labels as specified in table 3, and", "bbox": {"l": 53.79800000000001, "t": 401.87954999999994, "r": 294.04712, "b": 410.25418, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "also PubLayNet\u2019s", "bbox": {"l": 53.79800000000001, "t": 412.83853, "r": 117.12856, "b": 421.21317, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "List", "bbox": {"l": 119.362, "t": 412.88339, "r": 132.4342, "b": 421.22214, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "to", "bbox": {"l": 135.177, "t": 412.83853, "r": 142.54416, "b": 421.21317, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "Text", "bbox": {"l": 144.77901, "t": 412.88339, "r": 159.66605, "b": 421.22214, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": ". Note that the different clustering of", "bbox": {"l": 159.66701, "t": 412.83853, "r": 294.04562, "b": 421.21317, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "lists (by list-element vs. whole list objects) naturally decreases the", "bbox": {"l": 53.79800000000001, "t": 423.79755, "r": 294.04614, "b": 432.17217999999997, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "mAP score for", "bbox": {"l": 53.79800000000001, "t": 434.75653, "r": 106.2066, "b": 443.13116, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "Text", "bbox": {"l": 108.448, "t": 434.80139, "r": 123.30533, "b": 443.14014, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": ".", "bbox": {"l": 123.305, "t": 434.75653, "r": 125.27761000000001, "b": 443.13116, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Section-header , Table and Text . Before training, we either mapped or excluded DocLayNet\u2019s other labels as specified in table 3, and also PubLayNet\u2019s List to Text . Note that the different clustering of lists (by list-element vs. whole list objects) naturally decreases the mAP score for Text ."}, {"label": "text", "id": 1, "page_no": 7, "cluster": {"id": 1, "label": "text", "bbox": {"l": 53.466999, "t": 445.71453999999994, "r": 295.55908, "b": 585.59618, "coord_origin": "TOPLEFT"}, "confidence": 0.9868056774139404, "cells": [{"id": 85, "text": "For comparison of DocBank with DocLayNet, we trained only", "bbox": {"l": 63.76100199999999, "t": 445.71453999999994, "r": 294.27582, "b": 454.08917, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "on", "bbox": {"l": 53.79800000000001, "t": 456.67355, "r": 62.989277, "b": 465.04819, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Picture", "bbox": {"l": 64.852997, "t": 456.71841, "r": 88.947144, "b": 465.05716, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "and", "bbox": {"l": 91.019997, "t": 456.67355, "r": 104.24454, "b": 465.04819, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "Table", "bbox": {"l": 106.108, "t": 456.71841, "r": 124.78053, "b": 465.05716, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "clusters of each dataset. We had to exclude", "bbox": {"l": 126.85500000000002, "t": 456.67355, "r": 277.63235, "b": 465.04819, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "Text", "bbox": {"l": 279.49701, "t": 456.71841, "r": 294.0484, "b": 465.05716, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "because successive paragraphs are often grouped together into a", "bbox": {"l": 53.79800000000001, "t": 467.63254, "r": 294.04709, "b": 476.00717, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "single object in DocBank. This paragraph grouping is incompatible", "bbox": {"l": 53.79800000000001, "t": 478.59155, "r": 294.04532, "b": 486.96619, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "with the individual paragraphs of DocLayNet. As can be seen in", "bbox": {"l": 53.466999, "t": 489.55054, "r": 294.04538, "b": 497.92517, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "Table 5, DocLayNet trained models yield better performance com-", "bbox": {"l": 53.528999, "t": 500.50955, "r": 295.55908, "b": 508.88419, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "pared to the previous datasets. It is noteworthy that the models", "bbox": {"l": 53.79800000000001, "t": 511.46854, "r": 294.04712, "b": 519.84317, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "trained on PubLayNet and DocBank perform very well on their", "bbox": {"l": 53.79800000000001, "t": 522.42755, "r": 294.21179, "b": 530.80219, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "own test set, but have a much lower performance on the foreign", "bbox": {"l": 53.79800000000001, "t": 533.38654, "r": 294.04712, "b": 541.76117, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "datasets. While this also applies to DocLayNet, the difference is", "bbox": {"l": 53.79800000000001, "t": 544.34555, "r": 294.04715, "b": 552.72017, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "far less pronounced. Thus we conclude that DocLayNet trained", "bbox": {"l": 53.79800000000001, "t": 555.3045500000001, "r": 294.04712, "b": 563.67917, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "models are overall more robust and will produce better results for", "bbox": {"l": 53.79800000000001, "t": 566.26256, "r": 294.21411, "b": 574.63718, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "challenging, unseen layouts.", "bbox": {"l": 53.79800000000001, "t": 577.22156, "r": 157.52132, "b": 585.59618, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "For comparison of DocBank with DocLayNet, we trained only on Picture and Table clusters of each dataset. We had to exclude Text because successive paragraphs are often grouped together into a single object in DocBank. This paragraph grouping is incompatible with the individual paragraphs of DocLayNet. As can be seen in Table 5, DocLayNet trained models yield better performance compared to the previous datasets. It is noteworthy that the models trained on PubLayNet and DocBank perform very well on their own test set, but have a much lower performance on the foreign datasets. While this also applies to DocLayNet, the difference is far less pronounced. Thus we conclude that DocLayNet trained models are overall more robust and will produce better results for challenging, unseen layouts."}, {"label": "section_header", "id": 8, "page_no": 7, "cluster": {"id": 8, "label": "section_header", "bbox": {"l": 53.79800000000001, "t": 605.06091, "r": 156.00534, "b": 615.37001, "coord_origin": "TOPLEFT"}, "confidence": 0.9574698805809021, "cells": [{"id": 103, "text": "Example Predictions", "bbox": {"l": 53.79800000000001, "t": 605.06091, "r": 156.00534, "b": 615.37001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Example Predictions"}, {"label": "text", "id": 2, "page_no": 7, "cluster": {"id": 2, "label": "text", "bbox": {"l": 53.528999, "t": 620.26355, "r": 295.55844, "b": 705.350174, "coord_origin": "TOPLEFT"}, "confidence": 0.9859886169433594, "cells": [{"id": 104, "text": "To conclude this section, we illustrate the quality of layout predic-", "bbox": {"l": 53.528999, "t": 620.26355, "r": 295.5571, "b": 628.63817, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "tions one can expect from DocLayNet-trained models by providing", "bbox": {"l": 53.79800000000001, "t": 631.22255, "r": 294.04532, "b": 639.59717, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "a selection of examples without any further post-processing ap-", "bbox": {"l": 53.79800000000001, "t": 642.18155, "r": 295.55618, "b": 650.5561700000001, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "plied. Figure 6 shows selected layout predictions on pages from the", "bbox": {"l": 53.79800000000001, "t": 653.14055, "r": 294.04541, "b": 661.51517, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "test-set of DocLayNet. Results look decent in general across docu-", "bbox": {"l": 53.79800000000001, "t": 664.09956, "r": 295.55844, "b": 672.47417, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "ment categories, however one can also observe mistakes such as", "bbox": {"l": 53.79800000000001, "t": 675.05756, "r": 294.04712, "b": 683.43217, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "overlapping clusters of different classes, or entirely missing boxes", "bbox": {"l": 53.79800000000001, "t": 686.01656, "r": 294.04535, "b": 694.391174, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "due to low confidence.", "bbox": {"l": 53.79800000000001, "t": 696.975555, "r": 136.07368, "b": 705.350174, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "To conclude this section, we illustrate the quality of layout predictions one can expect from DocLayNet-trained models by providing a selection of examples without any further post-processing applied. Figure 6 shows selected layout predictions on pages from the test-set of DocLayNet. Results look decent in general across document categories, however one can also observe mistakes such as overlapping clusters of different classes, or entirely missing boxes due to low confidence."}, {"label": "section_header", "id": 13, "page_no": 7, "cluster": {"id": 13, "label": "section_header", "bbox": {"l": 317.95502, "t": 85.85986000000003, "r": 405.72961, "b": 96.16900999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.931998074054718, "cells": [{"id": 112, "text": "6", "bbox": {"l": 317.95502, "t": 85.85986000000003, "r": 323.56229, "b": 96.16900999999996, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "CONCLUSION", "bbox": {"l": 334.47137, "t": 85.85986000000003, "r": 405.72961, "b": 96.16900999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "6 CONCLUSION"}, {"label": "text", "id": 3, "page_no": 7, "cluster": {"id": 3, "label": "text", "bbox": {"l": 317.95499, "t": 101.06151999999997, "r": 559.71375, "b": 186.14917000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.985493004322052, "cells": [{"id": 114, "text": "In this paper, we presented the DocLayNet dataset. It provides the", "bbox": {"l": 317.95499, "t": 101.06151999999997, "r": 558.2038, "b": 109.43615999999997, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "document conversion and layout analysis research community a", "bbox": {"l": 317.95499, "t": 112.02057000000002, "r": 558.2041, "b": 120.39520000000005, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "new and challenging dataset to improve and fine-tune novel ML", "bbox": {"l": 317.95499, "t": 122.97955000000002, "r": 558.43274, "b": 131.35419000000002, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "methods on. In contrast to many other datasets, DocLayNet was", "bbox": {"l": 317.95499, "t": 133.93854, "r": 558.20416, "b": 142.31317, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "created by human annotation in order to obtain reliable layout", "bbox": {"l": 317.95499, "t": 144.89752, "r": 558.20422, "b": 153.27215999999999, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "ground-truth on a wide variety of publication- and typesetting-", "bbox": {"l": 317.95499, "t": 155.85657000000003, "r": 559.71313, "b": 164.23119999999994, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "styles. Including a large proportion of documents outside the scien-", "bbox": {"l": 317.95499, "t": 166.81555000000003, "r": 559.71375, "b": 175.19019000000003, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "tific publishing domain adds significant value in this respect.", "bbox": {"l": 317.95499, "t": 177.77454, "r": 540.04382, "b": 186.14917000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In this paper, we presented the DocLayNet dataset. It provides the document conversion and layout analysis research community a new and challenging dataset to improve and fine-tune novel ML methods on. In contrast to many other datasets, DocLayNet was created by human annotation in order to obtain reliable layout ground-truth on a wide variety of publication- and typesettingstyles. Including a large proportion of documents outside the scientific publishing domain adds significant value in this respect."}, {"label": "text", "id": 6, "page_no": 7, "cluster": {"id": 6, "label": "text", "bbox": {"l": 317.686, "t": 188.73352, "r": 559.71704, "b": 284.77917, "coord_origin": "TOPLEFT"}, "confidence": 0.9800531268119812, "cells": [{"id": 122, "text": "From the dataset, we have derived on the one hand reference", "bbox": {"l": 327.918, "t": 188.73352, "r": 558.19836, "b": 197.10815000000002, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "metrics for human performance on document-layout annotation", "bbox": {"l": 317.95499, "t": 199.69257000000005, "r": 558.20404, "b": 208.06719999999996, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "(through double and triple annotations) and on the other hand eval-", "bbox": {"l": 317.686, "t": 210.65155000000004, "r": 559.71704, "b": 219.02617999999995, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "uated the baseline performance of commonly used object detection", "bbox": {"l": 317.95499, "t": 221.60956, "r": 558.20245, "b": 229.98419, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "methods. We also illustrated the impact of various dataset-related", "bbox": {"l": 317.95499, "t": 232.56853999999998, "r": 558.20502, "b": 240.94317999999998, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "aspects on model performance through data-ablation experiments,", "bbox": {"l": 317.95499, "t": 243.52752999999996, "r": 559.18408, "b": 251.90215999999998, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "both from a size and class-label perspective. Last but not least, we", "bbox": {"l": 317.95499, "t": 254.48650999999995, "r": 558.20227, "b": 262.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "compared the accuracy of models trained on other public datasets", "bbox": {"l": 317.95499, "t": 265.44556, "r": 558.20349, "b": 273.82019, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "and showed that DocLayNet trained models are more robust.", "bbox": {"l": 317.95499, "t": 276.40454, "r": 540.99426, "b": 284.77917, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "From the dataset, we have derived on the one hand reference metrics for human performance on document-layout annotation (through double and triple annotations) and on the other hand evaluated the baseline performance of commonly used object detection methods. We also illustrated the impact of various dataset-related aspects on model performance through data-ablation experiments, both from a size and class-label perspective. Last but not least, we compared the accuracy of models trained on other public datasets and showed that DocLayNet trained models are more robust."}, {"label": "text", "id": 7, "page_no": 7, "cluster": {"id": 7, "label": "text", "bbox": {"l": 317.62299, "t": 287.36353, "r": 558.43469, "b": 317.65616000000006, "coord_origin": "TOPLEFT"}, "confidence": 0.9676101207733154, "cells": [{"id": 131, "text": "To date, there is still a significant gap between human and ML", "bbox": {"l": 327.918, "t": 287.36353, "r": 558.43469, "b": 295.73816, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "accuracy on the layout interpretation task, and we hope that this", "bbox": {"l": 317.95499, "t": 298.32254, "r": 558.20013, "b": 306.69717, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "work will inspire the research community to close that gap.", "bbox": {"l": 317.62299, "t": 309.28152, "r": 535.65015, "b": 317.65616000000006, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "To date, there is still a significant gap between human and ML accuracy on the layout interpretation task, and we hope that this work will inspire the research community to close that gap."}, {"label": "section_header", "id": 11, "page_no": 7, "cluster": {"id": 11, "label": "section_header", "bbox": {"l": 317.95499, "t": 335.09189, "r": 387.3696, "b": 345.40097, "coord_origin": "TOPLEFT"}, "confidence": 0.9378752708435059, "cells": [{"id": 134, "text": "REFERENCES", "bbox": {"l": 317.95499, "t": 335.09189, "r": 387.3696, "b": 345.40097, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "REFERENCES"}, {"label": "list_item", "id": 12, "page_no": 7, "cluster": {"id": 12, "label": "list_item", "bbox": {"l": 321.198, "t": 348.70233, "r": 558.20099, "b": 371.16286999999994, "coord_origin": "TOPLEFT"}, "confidence": 0.9372857213020325, "cells": [{"id": 135, "text": "[1]", "bbox": {"l": 321.198, "t": 348.70233, "r": 329.72415, "b": 355.21588, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "Max G\u00f6bel, Tamir Hassan, Ermelinda Oro, and Giorgio Orsi. Icdar 2013 table", "bbox": {"l": 331.53516, "t": 348.70233, "r": 558.19904, "b": 355.21588, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "competition. In", "bbox": {"l": 333.39099, "t": 356.67236, "r": 379.36414, "b": 363.18591, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "2013 12th International Conference on Document Analysis and", "bbox": {"l": 381.37201, "t": 356.70724, "r": 558.20099, "b": 363.19287, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "Recognition", "bbox": {"l": 333.39099, "t": 364.67724999999996, "r": 365.59601, "b": 371.16286999999994, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": ", pages 1449-1453, 2013.", "bbox": {"l": 365.59601, "t": 364.64236, "r": 434.29489, "b": 371.15591, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[1] Max G\u00f6bel, Tamir Hassan, Ermelinda Oro, and Giorgio Orsi. Icdar 2013 table competition. In 2013 12th International Conference on Document Analysis and Recognition , pages 1449-1453, 2013."}, {"label": "list_item", "id": 9, "page_no": 7, "cluster": {"id": 9, "label": "list_item", "bbox": {"l": 321.198, "t": 372.61237, "r": 559.37982, "b": 403.04287999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9480945467948914, "cells": [{"id": 141, "text": "[2]", "bbox": {"l": 321.198, "t": 372.61237, "r": 329.85956, "b": 379.12592, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "Christian Clausner, Apostolos Antonacopoulos, and Stefan Pletschacher. Ic-", "bbox": {"l": 331.69931, "t": 372.61237, "r": 559.37976, "b": 379.12592, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "dar2017 competition on recognition of documents with complex layouts -", "bbox": {"l": 333.39099, "t": 380.58237, "r": 559.37982, "b": 387.09592, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "rdcl2017. In", "bbox": {"l": 333.39099, "t": 388.55236999999994, "r": 367.4339, "b": 395.06592, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "2017 14th IAPR International Conference on Document Analysis and", "bbox": {"l": 369.17401, "t": 388.58725000000004, "r": 558.20422, "b": 395.07288, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "Recognition (ICDAR)", "bbox": {"l": 333.39099, "t": 396.55725, "r": 390.87601, "b": 403.04287999999997, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": ", volume 01, pages 1404-1410, 2017.", "bbox": {"l": 390.87698, "t": 396.52237, "r": 492.17831, "b": 403.03592, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[2] Christian Clausner, Apostolos Antonacopoulos, and Stefan Pletschacher. Icdar2017 competition on recognition of documents with complex layouts rdcl2017. In 2017 14th IAPR International Conference on Document Analysis and Recognition (ICDAR) , volume 01, pages 1404-1410, 2017."}, {"label": "list_item", "id": 17, "page_no": 7, "cluster": {"id": 17, "label": "list_item", "bbox": {"l": 321.198, "t": 404.49237, "r": 558.20013, "b": 426.94689999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9257517457008362, "cells": [{"id": 148, "text": "[3]", "bbox": {"l": 321.198, "t": 404.49237, "r": 329.53583, "b": 411.00592, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "Herv\u00e9 D\u00e9jean, Jean-Luc Meunier, Liangcai Gao, Yilun Huang, Yu Fang, Florian", "bbox": {"l": 331.30682, "t": 404.49237, "r": 558.19958, "b": 411.00592, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "Kleber, and Eva-Maria Lang. ICDAR 2019 Competition on Table Detection and", "bbox": {"l": 333.39099, "t": 412.46335, "r": 558.20013, "b": 418.9769, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "Recognition (cTDaR), April 2019. http://sac.founderit.com/.", "bbox": {"l": 333.39099, "t": 420.43335, "r": 501.80127, "b": 426.94689999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[3] Herv\u00e9 D\u00e9jean, Jean-Luc Meunier, Liangcai Gao, Yilun Huang, Yu Fang, Florian Kleber, and Eva-Maria Lang. ICDAR 2019 Competition on Table Detection and Recognition (cTDaR), April 2019. http://sac.founderit.com/."}, {"label": "list_item", "id": 16, "page_no": 7, "cluster": {"id": 16, "label": "list_item", "bbox": {"l": 321.198, "t": 428.40335, "r": 559.37872, "b": 458.8269, "coord_origin": "TOPLEFT"}, "confidence": 0.9270977973937988, "cells": [{"id": 152, "text": "[4]", "bbox": {"l": 321.198, "t": 428.40335, "r": 329.91299, "b": 434.9169, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "Antonio Jimeno Yepes, Peter Zhong, and Douglas Burdick. Competition on", "bbox": {"l": 331.7641, "t": 428.40335, "r": 558.19885, "b": 434.9169, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "scientific literature parsing. In", "bbox": {"l": 333.39099, "t": 436.3733500000001, "r": 423.77225, "b": 442.8869, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "Proceedings of the International Conference on", "bbox": {"l": 425.909, "t": 436.40823, "r": 558.20178, "b": 442.89386, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "Document Analysis and Recognition", "bbox": {"l": 333.39099, "t": 444.37823, "r": 429.42697, "b": 450.86386, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": ", ICDAR, pages 605-617. LNCS 12824, Springer-", "bbox": {"l": 429.42400999999995, "t": 444.34335, "r": 559.37872, "b": 450.85689999999994, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "Verlag, sep 2021.", "bbox": {"l": 332.819, "t": 452.31335, "r": 380.01764, "b": 458.8269, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[4] Antonio Jimeno Yepes, Peter Zhong, and Douglas Burdick. Competition on scientific literature parsing. In Proceedings of the International Conference on Document Analysis and Recognition , ICDAR, pages 605-617. LNCS 12824, SpringerVerlag, sep 2021."}, {"label": "list_item", "id": 14, "page_no": 7, "cluster": {"id": 14, "label": "list_item", "bbox": {"l": 321.198, "t": 460.28336, "r": 559.02625, "b": 490.70792, "coord_origin": "TOPLEFT"}, "confidence": 0.9290012121200562, "cells": [{"id": 159, "text": "[5]", "bbox": {"l": 321.198, "t": 460.28336, "r": 329.22977, "b": 466.79691, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "Logan Markewich, Hao Zhang, Yubin Xing, Navid Lambert-Shirzad, Jiang Zhexin,", "bbox": {"l": 330.93576, "t": 460.28336, "r": 558.97156, "b": 466.79691, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "Roy Lee, Zhi Li, and Seok-Bum Ko. Segmentation for document layout analysis:", "bbox": {"l": 333.39099, "t": 468.25336, "r": 559.02625, "b": 474.76691, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "not dead yet.", "bbox": {"l": 333.39099, "t": 476.22437, "r": 368.85431, "b": 482.73792, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "International Journal on Document Analysis and Recognition (IJDAR)", "bbox": {"l": 370.811, "t": 476.25925, "r": 557.46326, "b": 482.74487, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": ",", "bbox": {"l": 557.46503, "t": 476.22437, "r": 558.96857, "b": 482.73792, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "pages 1-11, 01 2022.", "bbox": {"l": 333.39099, "t": 484.19437, "r": 390.82715, "b": 490.70792, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[5] Logan Markewich, Hao Zhang, Yubin Xing, Navid Lambert-Shirzad, Jiang Zhexin, Roy Lee, Zhi Li, and Seok-Bum Ko. Segmentation for document layout analysis: not dead yet. International Journal on Document Analysis and Recognition (IJDAR) , pages 1-11, 01 2022."}, {"label": "list_item", "id": 15, "page_no": 7, "cluster": {"id": 15, "label": "list_item", "bbox": {"l": 321.198, "t": 492.16437, "r": 558.20361, "b": 514.6248800000001, "coord_origin": "TOPLEFT"}, "confidence": 0.927480161190033, "cells": [{"id": 166, "text": "[6]", "bbox": {"l": 321.198, "t": 492.16437, "r": 329.42145, "b": 498.67792, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "Xu Zhong, Jianbin Tang, and Antonio Jimeno-Yepes. Publaynet: Largest dataset", "bbox": {"l": 331.16812, "t": 492.16437, "r": 558.20361, "b": 498.67792, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "ever for document layout analysis. In", "bbox": {"l": 333.39099, "t": 500.13437, "r": 438.6101100000001, "b": 506.64792, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "Proceedings of the International Conference", "bbox": {"l": 440.349, "t": 500.16925, "r": 558.19958, "b": 506.65488, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "on Document Analysis and Recognition", "bbox": {"l": 333.39099, "t": 508.13925, "r": 441.40118, "b": 514.6248800000001, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": ", ICDAR, pages 1015-1022, sep 2019.", "bbox": {"l": 441.4019799999999, "t": 508.10437, "r": 544.78162, "b": 514.61792, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[6] Xu Zhong, Jianbin Tang, and Antonio Jimeno-Yepes. Publaynet: Largest dataset ever for document layout analysis. In Proceedings of the International Conference on Document Analysis and Recognition , ICDAR, pages 1015-1022, sep 2019."}, {"label": "list_item", "id": 10, "page_no": 7, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 321.19797, "t": 516.07437, "r": 558.9715, "b": 554.46889, "coord_origin": "TOPLEFT"}, "confidence": 0.9426893591880798, "cells": [{"id": 172, "text": "[7]", "bbox": {"l": 321.19797, "t": 516.07437, "r": 329.74161, "b": 522.5879199999999, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "Minghao Li, Yiheng Xu, Lei Cui, Shaohan Huang, Furu Wei, Zhoujun Li, and", "bbox": {"l": 331.55634, "t": 516.07437, "r": 558.19897, "b": 522.5879199999999, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "Ming Zhou. Docbank: A benchmark dataset for document layout analysis. In", "bbox": {"l": 333.39099, "t": 524.0443700000001, "r": 558.19891, "b": 530.55792, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "Proceedings of the 28th International Conference on Computational Linguistics", "bbox": {"l": 333.39099, "t": 532.04922, "r": 557.40228, "b": 538.53487, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": ",", "bbox": {"l": 557.40399, "t": 532.01437, "r": 558.96893, "b": 538.5278900000001, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "COLING, pages 949-960. International Committee on Computational Linguistics,", "bbox": {"l": 333.39099, "t": 539.98438, "r": 558.9715, "b": 546.49789, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "dec 2020.", "bbox": {"l": 333.39099, "t": 547.95535, "r": 359.31955, "b": 554.46889, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[7] Minghao Li, Yiheng Xu, Lei Cui, Shaohan Huang, Furu Wei, Zhoujun Li, and Ming Zhou. Docbank: A benchmark dataset for document layout analysis. In Proceedings of the 28th International Conference on Computational Linguistics , COLING, pages 949-960. International Committee on Computational Linguistics, dec 2020."}, {"label": "list_item", "id": 19, "page_no": 7, "cluster": {"id": 19, "label": "list_item", "bbox": {"l": 321.198, "t": 555.92535, "r": 558.90222, "b": 578.38586, "coord_origin": "TOPLEFT"}, "confidence": 0.9139686226844788, "cells": [{"id": 179, "text": "[8]", "bbox": {"l": 321.198, "t": 555.92535, "r": 329.7088, "b": 562.43889, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "Riaz Ahmad, Muhammad Tanvir Afzal, and M. Qadir. Information extraction", "bbox": {"l": 331.51654, "t": 555.92535, "r": 558.19891, "b": 562.43889, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "from pdf sources based on rule-based system using integrated formats. In", "bbox": {"l": 333.39099, "t": 563.89536, "r": 535.54352, "b": 570.40889, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "SemWe-", "bbox": {"l": 536.96399, "t": 563.93024, "r": 558.90222, "b": 570.4158600000001, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "bEval@ESWC", "bbox": {"l": 333.39099, "t": 571.9002399999999, "r": 371.94217, "b": 578.38586, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": ", 2016.", "bbox": {"l": 371.94299, "t": 571.86536, "r": 389.72617, "b": 578.3788900000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[8] Riaz Ahmad, Muhammad Tanvir Afzal, and M. Qadir. Information extraction from pdf sources based on rule-based system using integrated formats. In SemWebEval@ESWC , 2016."}, {"label": "list_item", "id": 21, "page_no": 7, "cluster": {"id": 21, "label": "list_item", "bbox": {"l": 321.198, "t": 579.83536, "r": 559.27448, "b": 610.2589, "coord_origin": "TOPLEFT"}, "confidence": 0.9113100171089172, "cells": [{"id": 185, "text": "[9]", "bbox": {"l": 321.198, "t": 579.83536, "r": 329.45999, "b": 586.34889, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "Ross B. Girshick, Jeff Donahue, Trevor Darrell, and Jitendra Malik. Rich feature", "bbox": {"l": 331.21487, "t": 579.83536, "r": 558.19843, "b": 586.34889, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "hierarchies for accurate object detection and semantic segmentation. In", "bbox": {"l": 333.39099, "t": 587.8053600000001, "r": 543.05487, "b": 594.31889, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": "IEEE", "bbox": {"l": 544.98499, "t": 587.84024, "r": 558.20148, "b": 594.32587, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "Conference on Computer Vision and Pattern Recognition", "bbox": {"l": 333.39099, "t": 595.81024, "r": 491.61166, "b": 602.29587, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": ", CVPR, pages 580-587.", "bbox": {"l": 491.61301, "t": 595.77536, "r": 559.27448, "b": 602.28889, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "IEEE Computer Society, jun 2014.", "bbox": {"l": 333.39099, "t": 603.74536, "r": 428.59726000000006, "b": 610.2589, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[9] Ross B. Girshick, Jeff Donahue, Trevor Darrell, and Jitendra Malik. Rich feature hierarchies for accurate object detection and semantic segmentation. In IEEE Conference on Computer Vision and Pattern Recognition , CVPR, pages 580-587. IEEE Computer Society, jun 2014."}, {"label": "list_item", "id": 22, "page_no": 7, "cluster": {"id": 22, "label": "list_item", "bbox": {"l": 317.95499, "t": 611.71536, "r": 558.20203, "b": 626.20686, "coord_origin": "TOPLEFT"}, "confidence": 0.9028767347335815, "cells": [{"id": 192, "text": "[10]", "bbox": {"l": 317.95499, "t": 611.71536, "r": 329.54767, "b": 618.2289000000001, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "Ross B. Girshick. Fast R-CNN. In", "bbox": {"l": 331.31268, "t": 611.71536, "r": 425.1554, "b": 618.2289000000001, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "2015 IEEE International Conference on Computer", "bbox": {"l": 426.77802, "t": 611.75024, "r": 558.20203, "b": 618.23587, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "Vision", "bbox": {"l": 333.39099, "t": 619.72124, "r": 350.59537, "b": 626.20686, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": ", ICCV, pages 1440-1448. IEEE Computer Society, dec 2015.", "bbox": {"l": 350.59598, "t": 619.68637, "r": 518.58777, "b": 626.19989, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[10] Ross B. Girshick. Fast R-CNN. In 2015 IEEE International Conference on Computer Vision , ICCV, pages 1440-1448. IEEE Computer Society, dec 2015."}, {"label": "list_item", "id": 20, "page_no": 7, "cluster": {"id": 20, "label": "list_item", "bbox": {"l": 317.95499, "t": 627.65637, "r": 558.20142, "b": 650.1168700000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9127691984176636, "cells": [{"id": 197, "text": "[11]", "bbox": {"l": 317.95499, "t": 627.65637, "r": 329.5459, "b": 634.16989, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "Shaoqing Ren, Kaiming He, Ross Girshick, and Jian Sun. Faster r-cnn: Towards", "bbox": {"l": 331.31064, "t": 627.65637, "r": 558.20142, "b": 634.16989, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "real-time object detection with region proposal networks.", "bbox": {"l": 333.39099, "t": 635.62637, "r": 497.50909, "b": 642.13989, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "IEEE Transactions on", "bbox": {"l": 500.01401, "t": 635.66124, "r": 558.19885, "b": 642.14687, "coord_origin": "TOPLEFT"}}, {"id": 201, "text": "Pattern Analysis and Machine Intelligence", "bbox": {"l": 333.39099, "t": 643.6312399999999, "r": 449.38620000000003, "b": 650.1168700000001, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": ", 39(6):1137-1149, 2017.", "bbox": {"l": 449.38699, "t": 643.59637, "r": 515.74268, "b": 650.10989, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[11] Shaoqing Ren, Kaiming He, Ross Girshick, and Jian Sun. Faster r-cnn: Towards real-time object detection with region proposal networks. IEEE Transactions on Pattern Analysis and Machine Intelligence , 39(6):1137-1149, 2017."}, {"label": "list_item", "id": 18, "page_no": 7, "cluster": {"id": 18, "label": "list_item", "bbox": {"l": 317.95499, "t": 651.56638, "r": 559.27808, "b": 674.01989, "coord_origin": "TOPLEFT"}, "confidence": 0.9142459630966187, "cells": [{"id": 203, "text": "[12]", "bbox": {"l": 317.95499, "t": 651.56638, "r": 329.41763, "b": 658.0799, "coord_origin": "TOPLEFT"}}, {"id": 204, "text": "Kaiming He, Georgia Gkioxari, Piotr Doll\u00e1r, and Ross B. Girshick. Mask R-CNN.", "bbox": {"l": 331.16287, "t": 651.56638, "r": 559.27808, "b": 658.0799, "coord_origin": "TOPLEFT"}}, {"id": 205, "text": "In", "bbox": {"l": 333.39099, "t": 659.53638, "r": 339.35904, "b": 666.0499, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": "IEEE International Conference on Computer Vision", "bbox": {"l": 341.56299, "t": 659.57124, "r": 485.8273, "b": 666.05687, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": ", ICCV, pages 2980-2988.", "bbox": {"l": 485.82901, "t": 659.53638, "r": 559.27356, "b": 666.0499, "coord_origin": "TOPLEFT"}}, {"id": 208, "text": "IEEE Computer Society, Oct 2017.", "bbox": {"l": 333.39099, "t": 667.50636, "r": 429.30161000000004, "b": 674.01989, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[12] Kaiming He, Georgia Gkioxari, Piotr Doll\u00e1r, and Ross B. Girshick. Mask R-CNN. In IEEE International Conference on Computer Vision , ICCV, pages 2980-2988. IEEE Computer Society, Oct 2017."}, {"label": "list_item", "id": 23, "page_no": 7, "cluster": {"id": 23, "label": "list_item", "bbox": {"l": 317.95499, "t": 675.47636, "r": 558.97156, "b": 705.900894, "coord_origin": "TOPLEFT"}, "confidence": 0.889543354511261, "cells": [{"id": 209, "text": "[13]", "bbox": {"l": 317.95499, "t": 675.47636, "r": 330.11407, "b": 681.9898900000001, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": "Glenn Jocher, Alex Stoken, Ayush Chaurasia, Jirka Borovec, NanoCode012,", "bbox": {"l": 331.96533, "t": 675.47636, "r": 558.96716, "b": 681.9898900000001, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "TaoXie, Yonghye Kwon, Kalen Michael, Liu Changyu, Jiacong Fang, Abhiram V,", "bbox": {"l": 333.18201, "t": 683.44637, "r": 558.96661, "b": 689.95989, "coord_origin": "TOPLEFT"}}, {"id": 212, "text": "Laughing, tkianai, yxNONG, Piotr Skalski, Adam Hogan, Jebastin Nadar, imyhxy,", "bbox": {"l": 333.39099, "t": 691.41737, "r": 558.97156, "b": 697.930893, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "Lorenzo Mammana, Alex Wang, Cristi Fati, Diego Montes, Jan Hajek, Laurentiu", "bbox": {"l": 333.39099, "t": 699.387367, "r": 558.20001, "b": 705.900894, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[13] Glenn Jocher, Alex Stoken, Ayush Chaurasia, Jirka Borovec, NanoCode012, TaoXie, Yonghye Kwon, Kalen Michael, Liu Changyu, Jiacong Fang, Abhiram V, Laughing, tkianai, yxNONG, Piotr Skalski, Adam Hogan, Jebastin Nadar, imyhxy, Lorenzo Mammana, Alex Wang, Cristi Fati, Diego Montes, Jan Hajek, Laurentiu"}], "headers": [{"label": "page_header", "id": 24, "page_no": 7, "cluster": {"id": 24, "label": "page_header", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.7984216809272766, "cells": [{"id": 0, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 246.24382, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar", "bbox": {"l": 253.13897999999998, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar"}]}}, {"page_no": 8, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "4bed2a8aa51ac37058e79605821bbc426d032b0b6ca8bdf3409ed8508ccd8c67", "bbox": {"l": 231.8804, "t": 301.50543, "r": 235.14504999999997, "b": 414.69144, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "2f2a06d08f5ad565d0f5e815f4ddf666365b2cff435cdaeb8850217e8a8efabf", "bbox": {"l": 395.06876, "t": 117.37183000000005, "r": 398.33353, "b": 230.55786, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "7f2fd7293e04bf4f1756ae51f5779764933da1d1d2002e3915356050570fc75b", "bbox": {"l": 55.775887, "t": 301.50543, "r": 59.04052000000001, "b": 414.69144, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "1b81cf65f47456ad4faa725d1eb09879bd633af16cfe2bf8cea661b87907bfac", "bbox": {"l": 232.01364, "t": 117.37183000000005, "r": 235.27841000000004, "b": 230.55786, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "b60da9d26f488cb133e47d101d35fda1bdca2671ade60764d1cd569590270327", "bbox": {"l": 395.20047, "t": 301.50543, "r": 398.46512, "b": 414.69144, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "2b7b8355a42ebef0cf91583aad9f30f7c9fa63c5b05911730ba15275c024965b$^{A}$", "bbox": {"l": 55.775818, "t": 117.37183000000005, "r": 65.409912, "b": 230.55786, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "B", "bbox": {"l": 234.56980999999996, "t": 88.50183000000015, "r": 240.06987, "b": 97.01098999999988, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "C", "bbox": {"l": 397.81934, "t": 88.89355, "r": 403.3194, "b": 97.40270999999996, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "D", "bbox": {"l": 59.909843, "t": 266.75885000000005, "r": 65.409912, "b": 275.26793999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "E", "bbox": {"l": 234.77386, "t": 266.36707, "r": 239.85495000000003, "b": 274.87616, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "F", "bbox": {"l": 398.26144, "t": 266.75885000000005, "r": 402.91592, "b": 275.26793999999995, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Text", "bbox": {"l": 62.323874999999994, "t": 442.28543, "r": 70.895882, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Caption", "bbox": {"l": 80.16581, "t": 442.28543, "r": 95.565453, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "List-Item", "bbox": {"l": 104.94447, "t": 442.28543, "r": 122.38113000000001, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Formula", "bbox": {"l": 131.78354, "t": 442.28543, "r": 148.34625, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "Table", "bbox": {"l": 157.66106, "t": 442.28543, "r": 168.53032, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Section-Header", "bbox": {"l": 201.24315, "t": 442.28543, "r": 232.00499, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Picture", "bbox": {"l": 177.8381, "t": 442.28543, "r": 191.88956, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Page-Header", "bbox": {"l": 240.95844000000002, "t": 442.28543, "r": 266.61908, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Page-Footer", "bbox": {"l": 276.03928, "t": 442.28543, "r": 300.33261, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "Title", "bbox": {"l": 309.74615, "t": 442.28543, "r": 318.50473, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Figure 6: Example layout predictions on selected pages from the DocLayNet test-set. (A, D) exhibit favourable results on", "bbox": {"l": 53.79800000000001, "t": 464.48199, "r": 558.203, "b": 472.95523, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "coloured backgrounds. (B, C) show accurate list-item and paragraph differentiation despite densely-spaced lines. (E) demon-", "bbox": {"l": 53.79800000000001, "t": 475.44101, "r": 559.80786, "b": 483.91425, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "strates good table and figure distinction. (F) shows predictions on a Chinese patent with multiple overlaps, label confusion", "bbox": {"l": 53.79800000000001, "t": 486.39999, "r": 558.20294, "b": 494.87323, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "and missing boxes.", "bbox": {"l": 53.79800000000001, "t": 497.358, "r": 130.37105, "b": 505.83124, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Diaconu, Mai Thanh Minh, Marc, albinxavi, fatih, oleg, and wanghao yang. ul-", "bbox": {"l": 69.234001, "t": 527.06635, "r": 295.22406, "b": 533.5799, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "tralytics/yolov5: v6.0 - yolov5n nano models, roboflow integration, tensorflow", "bbox": {"l": 69.234001, "t": 535.03638, "r": 294.30612, "b": 541.5499, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "export, opencv dnn support, October 2021.", "bbox": {"l": 69.234001, "t": 543.00638, "r": 190.45259, "b": 549.5199, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "[14]", "bbox": {"l": 53.79800000000001, "t": 550.97638, "r": 65.286942, "b": 557.4899, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Nicolas Carion, Francisco Massa, Gabriel Synnaeve, Nicolas Usunier, Alexander", "bbox": {"l": 67.036171, "t": 550.97638, "r": 294.17709, "b": 557.4899, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Kirillov, and Sergey Zagoruyko. End-to-end object detection with transformers.", "bbox": {"l": 69.234001, "t": 558.94638, "r": 295.12177, "b": 565.4599000000001, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "CoRR", "bbox": {"l": 69.234001, "t": 566.95123, "r": 84.388069, "b": 573.43686, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": ", abs/2005.12872, 2020.", "bbox": {"l": 84.388, "t": 566.91635, "r": 147.7659, "b": 573.42989, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "[15]", "bbox": {"l": 53.79800000000001, "t": 574.88635, "r": 64.994034, "b": 581.39989, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Mingxing Tan, Ruoming Pang, and Quoc V. Le. Efficientdet: Scalable and efficient", "bbox": {"l": 66.698669, "t": 574.88635, "r": 294.04224, "b": 581.39989, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "object detection.", "bbox": {"l": 69.234001, "t": 582.85736, "r": 116.1049, "b": 589.3709, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "CoRR", "bbox": {"l": 118.616, "t": 582.89224, "r": 133.77007, "b": 589.37787, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": ", abs/1911.09070, 2019.", "bbox": {"l": 133.77, "t": 582.85736, "r": 197.14792, "b": 589.3709, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "[16]", "bbox": {"l": 53.79800399999999, "t": 590.82736, "r": 65.110367, "b": 597.3409, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Tsung-Yi Lin, Michael Maire, Serge J. Belongie, Lubomir D. Bourdev, Ross B. Gir-", "bbox": {"l": 66.832718, "t": 590.82736, "r": 295.22263, "b": 597.3409, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "shick, James Hays, Pietro Perona, Deva Ramanan, Piotr Doll\u00e1r, and C. Lawrence", "bbox": {"l": 69.234001, "t": 598.79736, "r": 294.04462, "b": 605.3109, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Zitnick. Microsoft COCO: common objects in context, 2014.", "bbox": {"l": 69.234001, "t": 606.76736, "r": 239.71553000000003, "b": 613.2809, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "[17]", "bbox": {"l": 53.79800000000001, "t": 614.7373699999999, "r": 65.177979, "b": 621.2509, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Yuxin Wu, Alexander Kirillov, Francisco Massa, Wan-Yen Lo, and Ross Girshick.", "bbox": {"l": 66.910622, "t": 614.7373699999999, "r": 295.12009, "b": 621.2509, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "Detectron2, 2019.", "bbox": {"l": 69.234001, "t": 622.70737, "r": 118.65732, "b": 629.22089, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "[18]", "bbox": {"l": 53.79800000000001, "t": 630.67737, "r": 65.022064, "b": 637.19089, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Nikolaos Livathinos, Cesar Berrospi, Maksym Lysak, Viktor Kuropiatnyk, Ahmed", "bbox": {"l": 66.730972, "t": 630.67737, "r": 294.04224, "b": 637.19089, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "Nassar, Andre Carvalho, Michele Dolfi, Christoph Auer, Kasper Dinkla, and Peter", "bbox": {"l": 69.234001, "t": 638.64737, "r": 294.17896, "b": 645.16089, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "W.", "bbox": {"l": 68.900002, "t": 646.6173699999999, "r": 76.877083, "b": 653.13089, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "J. Staar. Robust pdf document conversion using recurrent neural networks. In", "bbox": {"l": 78.580124, "t": 646.6173699999999, "r": 294.04312, "b": 653.13089, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Proceedings of the 35th Conference on Artificial Intelligence", "bbox": {"l": 69.234001, "t": 654.62325, "r": 233.43309000000002, "b": 661.10887, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": ", AAAI, pages 15137-", "bbox": {"l": 233.43401000000003, "t": 654.58838, "r": 294.8089, "b": 661.1019, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "15145, feb 2021.", "bbox": {"l": 69.073997, "t": 662.55836, "r": 113.53197, "b": 669.0718899999999, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "[19]", "bbox": {"l": 53.797997, "t": 670.52837, "r": 65.760811, "b": 677.04189, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Yiheng Xu, Minghao Li, Lei Cui, Shaohan Huang, Furu Wei, and Ming Zhou.", "bbox": {"l": 67.582199, "t": 670.52837, "r": 295.11609, "b": 677.04189, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Layoutlm: Pre-training of text and layout for document image understanding.", "bbox": {"l": 69.234001, "t": 678.49837, "r": 295.11606, "b": 685.01189, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "In", "bbox": {"l": 69.234001, "t": 686.46837, "r": 75.155228, "b": 692.981895, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Proceedings of the 26th ACM SIGKDD International Conference on Knowledge", "bbox": {"l": 76.891998, "t": 686.50323, "r": 294.04382, "b": 692.988869, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Discovery and Data Mining", "bbox": {"l": 69.234001, "t": 694.473236, "r": 144.91022, "b": 700.95887, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": ", KDD, pages 1192-1200, New York, USA, 2020. Asso-", "bbox": {"l": 144.908, "t": 694.4383700000001, "r": 295.22174, "b": 700.951897, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "ciation for Computing Machinery.", "bbox": {"l": 69.234001, "t": 702.408363, "r": 166.37207, "b": 708.92189, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "[20]", "bbox": {"l": 317.95499, "t": 527.06638, "r": 329.24017, "b": 533.57993, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "Shoubin Li, Xuyan Ma, Shuaiqun Pan, Jun Hu, Lin Shi, and Qing Wang. Vtlayout:", "bbox": {"l": 330.95837, "t": 527.06638, "r": 559.02637, "b": 533.57993, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "Fusion of visual and text features for document layout analysis, 2021.", "bbox": {"l": 333.39099, "t": 535.03638, "r": 530.03815, "b": 541.5499, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "[21]", "bbox": {"l": 317.95499, "t": 543.00638, "r": 329.54419, "b": 549.5199, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "Peng Zhang, Can Li, Liang Qiao, Zhanzhan Cheng, Shiliang Pu, Yi Niu, and Fei", "bbox": {"l": 331.30869, "t": 543.00638, "r": 558.20135, "b": 549.5199, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "Wu. Vsr: A unified framework for document layout analysis combining vision,", "bbox": {"l": 333.05701, "t": 550.97638, "r": 558.9715, "b": 557.4899, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "semantics and relations, 2021.", "bbox": {"l": 333.39099, "t": 558.94638, "r": 418.05988, "b": 565.4599000000001, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "[22]", "bbox": {"l": 317.95499, "t": 566.91638, "r": 330.14108, "b": 573.4299, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Peter W J Staar, Michele Dolfi, Christoph Auer, and Costas Bekas.", "bbox": {"l": 331.99646, "t": 566.91638, "r": 531.54553, "b": 573.4299, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "Corpus", "bbox": {"l": 537.12946, "t": 566.91635, "r": 558.19897, "b": 573.42989, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "conversion service: A machine learning platform to ingest documents at scale.", "bbox": {"l": 333.39099, "t": 574.88635, "r": 559.27539, "b": 581.39989, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "In", "bbox": {"l": 333.39099, "t": 582.85736, "r": 339.31223, "b": 589.3709, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "Proceedings of the 24th ACM SIGKDD International Conference on Knowledge", "bbox": {"l": 341.04901, "t": 582.89224, "r": 558.20081, "b": 589.37787, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "Discovery and Data Mining", "bbox": {"l": 333.39099, "t": 590.8622399999999, "r": 409.56577, "b": 597.3478700000001, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": ", KDD, pages 774-782. ACM, 2018.", "bbox": {"l": 409.56598, "t": 590.82736, "r": 507.31765999999993, "b": 597.3409, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "[23]", "bbox": {"l": 317.95499, "t": 598.79736, "r": 329.37976, "b": 605.3109, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "Connor Shorten and Taghi M. Khoshgoftaar. A survey on image data augmenta-", "bbox": {"l": 331.11923, "t": 598.79736, "r": 559.3783, "b": 605.3109, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "tion for deep learning.", "bbox": {"l": 333.39099, "t": 606.76736, "r": 396.9223, "b": 613.2809, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Journal of Big Data", "bbox": {"l": 399.43298, "t": 606.80225, "r": 453.66122, "b": 613.28787, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": ", 6(1):60, 2019.", "bbox": {"l": 453.66199, "t": 606.76736, "r": 493.49631, "b": 613.2809, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 13, "label": "page_header", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.8021690249443054, "cells": [{"id": 0, "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "page_header", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.8429245352745056, "cells": [{"id": 1, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "picture", "bbox": {"l": 52.963985443115234, "t": 84.73588562011719, "r": 556.931640625, "b": 442.1351318359375, "coord_origin": "TOPLEFT"}, "confidence": 0.8352116942405701, "cells": [{"id": 2, "text": "4bed2a8aa51ac37058e79605821bbc426d032b0b6ca8bdf3409ed8508ccd8c67", "bbox": {"l": 231.8804, "t": 301.50543, "r": 235.14504999999997, "b": 414.69144, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "2f2a06d08f5ad565d0f5e815f4ddf666365b2cff435cdaeb8850217e8a8efabf", "bbox": {"l": 395.06876, "t": 117.37183000000005, "r": 398.33353, "b": 230.55786, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "7f2fd7293e04bf4f1756ae51f5779764933da1d1d2002e3915356050570fc75b", "bbox": {"l": 55.775887, "t": 301.50543, "r": 59.04052000000001, "b": 414.69144, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "1b81cf65f47456ad4faa725d1eb09879bd633af16cfe2bf8cea661b87907bfac", "bbox": {"l": 232.01364, "t": 117.37183000000005, "r": 235.27841000000004, "b": 230.55786, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "b60da9d26f488cb133e47d101d35fda1bdca2671ade60764d1cd569590270327", "bbox": {"l": 395.20047, "t": 301.50543, "r": 398.46512, "b": 414.69144, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "2b7b8355a42ebef0cf91583aad9f30f7c9fa63c5b05911730ba15275c024965b$^{A}$", "bbox": {"l": 55.775818, "t": 117.37183000000005, "r": 65.409912, "b": 230.55786, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "B", "bbox": {"l": 234.56980999999996, "t": 88.50183000000015, "r": 240.06987, "b": 97.01098999999988, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "C", "bbox": {"l": 397.81934, "t": 88.89355, "r": 403.3194, "b": 97.40270999999996, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "D", "bbox": {"l": 59.909843, "t": 266.75885000000005, "r": 65.409912, "b": 275.26793999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "E", "bbox": {"l": 234.77386, "t": 266.36707, "r": 239.85495000000003, "b": 274.87616, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "F", "bbox": {"l": 398.26144, "t": 266.75885000000005, "r": 402.91592, "b": 275.26793999999995, "coord_origin": "TOPLEFT"}}], "children": [{"id": 17, "label": "text", "bbox": {"l": 231.8804, "t": 301.50543, "r": 235.14504999999997, "b": 414.69144, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 2, "text": "4bed2a8aa51ac37058e79605821bbc426d032b0b6ca8bdf3409ed8508ccd8c67", "bbox": {"l": 231.8804, "t": 301.50543, "r": 235.14504999999997, "b": 414.69144, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 395.06876, "t": 117.37183000000005, "r": 398.33353, "b": 230.55786, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 3, "text": "2f2a06d08f5ad565d0f5e815f4ddf666365b2cff435cdaeb8850217e8a8efabf", "bbox": {"l": 395.06876, "t": 117.37183000000005, "r": 398.33353, "b": 230.55786, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 55.775887, "t": 301.50543, "r": 59.04052000000001, "b": 414.69144, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 4, "text": "7f2fd7293e04bf4f1756ae51f5779764933da1d1d2002e3915356050570fc75b", "bbox": {"l": 55.775887, "t": 301.50543, "r": 59.04052000000001, "b": 414.69144, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 232.01364, "t": 117.37183000000005, "r": 235.27841000000004, "b": 230.55786, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 5, "text": "1b81cf65f47456ad4faa725d1eb09879bd633af16cfe2bf8cea661b87907bfac", "bbox": {"l": 232.01364, "t": 117.37183000000005, "r": 235.27841000000004, "b": 230.55786, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 395.20047, "t": 301.50543, "r": 398.46512, "b": 414.69144, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": "b60da9d26f488cb133e47d101d35fda1bdca2671ade60764d1cd569590270327", "bbox": {"l": 395.20047, "t": 301.50543, "r": 398.46512, "b": 414.69144, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 55.775818, "t": 117.37183000000005, "r": 65.409912, "b": 230.55786, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "2b7b8355a42ebef0cf91583aad9f30f7c9fa63c5b05911730ba15275c024965b$^{A}$", "bbox": {"l": 55.775818, "t": 117.37183000000005, "r": 65.409912, "b": 230.55786, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 234.56980999999996, "t": 88.50183000000015, "r": 240.06987, "b": 97.01098999999988, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "B", "bbox": {"l": 234.56980999999996, "t": 88.50183000000015, "r": 240.06987, "b": 97.01098999999988, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 397.81934, "t": 88.89355, "r": 403.3194, "b": 97.40270999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "C", "bbox": {"l": 397.81934, "t": 88.89355, "r": 403.3194, "b": 97.40270999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 59.909843, "t": 266.75885000000005, "r": 65.409912, "b": 275.26793999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "D", "bbox": {"l": 59.909843, "t": 266.75885000000005, "r": 65.409912, "b": 275.26793999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 234.77386, "t": 266.36707, "r": 239.85495000000003, "b": 274.87616, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "E", "bbox": {"l": 234.77386, "t": 266.36707, "r": 239.85495000000003, "b": 274.87616, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 398.26144, "t": 266.75885000000005, "r": 402.91592, "b": 275.26793999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "F", "bbox": {"l": 398.26144, "t": 266.75885000000005, "r": 402.91592, "b": 275.26793999999995, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 16, "label": "caption", "bbox": {"l": 62.323874999999994, "t": 442.28543, "r": 318.50473, "b": 448.26483, "coord_origin": "TOPLEFT"}, "confidence": 0.6248989701271057, "cells": [{"id": 13, "text": "Text", "bbox": {"l": 62.323874999999994, "t": 442.28543, "r": 70.895882, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Caption", "bbox": {"l": 80.16581, "t": 442.28543, "r": 95.565453, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "List-Item", "bbox": {"l": 104.94447, "t": 442.28543, "r": 122.38113000000001, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Formula", "bbox": {"l": 131.78354, "t": 442.28543, "r": 148.34625, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "Table", "bbox": {"l": 157.66106, "t": 442.28543, "r": 168.53032, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Section-Header", "bbox": {"l": 201.24315, "t": 442.28543, "r": 232.00499, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Picture", "bbox": {"l": 177.8381, "t": 442.28543, "r": 191.88956, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Page-Header", "bbox": {"l": 240.95844000000002, "t": 442.28543, "r": 266.61908, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Page-Footer", "bbox": {"l": 276.03928, "t": 442.28543, "r": 300.33261, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "Title", "bbox": {"l": 309.74615, "t": 442.28543, "r": 318.50473, "b": 448.26483, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "text", "bbox": {"l": 53.79800000000001, "t": 464.48199, "r": 559.80786, "b": 505.83124, "coord_origin": "TOPLEFT"}, "confidence": 0.8651240468025208, "cells": [{"id": 23, "text": "Figure 6: Example layout predictions on selected pages from the DocLayNet test-set. (A, D) exhibit favourable results on", "bbox": {"l": 53.79800000000001, "t": 464.48199, "r": 558.203, "b": 472.95523, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "coloured backgrounds. (B, C) show accurate list-item and paragraph differentiation despite densely-spaced lines. (E) demon-", "bbox": {"l": 53.79800000000001, "t": 475.44101, "r": 559.80786, "b": 483.91425, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "strates good table and figure distinction. (F) shows predictions on a Chinese patent with multiple overlaps, label confusion", "bbox": {"l": 53.79800000000001, "t": 486.39999, "r": 558.20294, "b": 494.87323, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "and missing boxes.", "bbox": {"l": 53.79800000000001, "t": 497.358, "r": 130.37105, "b": 505.83124, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "text", "bbox": {"l": 69.234001, "t": 527.06635, "r": 295.22406, "b": 549.5199, "coord_origin": "TOPLEFT"}, "confidence": 0.8445900082588196, "cells": [{"id": 27, "text": "Diaconu, Mai Thanh Minh, Marc, albinxavi, fatih, oleg, and wanghao yang. ul-", "bbox": {"l": 69.234001, "t": 527.06635, "r": 295.22406, "b": 533.5799, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "tralytics/yolov5: v6.0 - yolov5n nano models, roboflow integration, tensorflow", "bbox": {"l": 69.234001, "t": 535.03638, "r": 294.30612, "b": 541.5499, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "export, opencv dnn support, October 2021.", "bbox": {"l": 69.234001, "t": 543.00638, "r": 190.45259, "b": 549.5199, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "list_item", "bbox": {"l": 53.79800000000001, "t": 550.97638, "r": 295.12177, "b": 573.43686, "coord_origin": "TOPLEFT"}, "confidence": 0.8561117053031921, "cells": [{"id": 30, "text": "[14]", "bbox": {"l": 53.79800000000001, "t": 550.97638, "r": 65.286942, "b": 557.4899, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Nicolas Carion, Francisco Massa, Gabriel Synnaeve, Nicolas Usunier, Alexander", "bbox": {"l": 67.036171, "t": 550.97638, "r": 294.17709, "b": 557.4899, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Kirillov, and Sergey Zagoruyko. End-to-end object detection with transformers.", "bbox": {"l": 69.234001, "t": 558.94638, "r": 295.12177, "b": 565.4599000000001, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "CoRR", "bbox": {"l": 69.234001, "t": 566.95123, "r": 84.388069, "b": 573.43686, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": ", abs/2005.12872, 2020.", "bbox": {"l": 84.388, "t": 566.91635, "r": 147.7659, "b": 573.42989, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "list_item", "bbox": {"l": 53.79800000000001, "t": 574.88635, "r": 294.04224, "b": 589.37787, "coord_origin": "TOPLEFT"}, "confidence": 0.8615185618400574, "cells": [{"id": 35, "text": "[15]", "bbox": {"l": 53.79800000000001, "t": 574.88635, "r": 64.994034, "b": 581.39989, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Mingxing Tan, Ruoming Pang, and Quoc V. Le. Efficientdet: Scalable and efficient", "bbox": {"l": 66.698669, "t": 574.88635, "r": 294.04224, "b": 581.39989, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "object detection.", "bbox": {"l": 69.234001, "t": 582.85736, "r": 116.1049, "b": 589.3709, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "CoRR", "bbox": {"l": 118.616, "t": 582.89224, "r": 133.77007, "b": 589.37787, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": ", abs/1911.09070, 2019.", "bbox": {"l": 133.77, "t": 582.85736, "r": 197.14792, "b": 589.3709, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "list_item", "bbox": {"l": 53.79800399999999, "t": 590.82736, "r": 295.22263, "b": 613.2809, "coord_origin": "TOPLEFT"}, "confidence": 0.859420895576477, "cells": [{"id": 40, "text": "[16]", "bbox": {"l": 53.79800399999999, "t": 590.82736, "r": 65.110367, "b": 597.3409, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Tsung-Yi Lin, Michael Maire, Serge J. Belongie, Lubomir D. Bourdev, Ross B. Gir-", "bbox": {"l": 66.832718, "t": 590.82736, "r": 295.22263, "b": 597.3409, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "shick, James Hays, Pietro Perona, Deva Ramanan, Piotr Doll\u00e1r, and C. Lawrence", "bbox": {"l": 69.234001, "t": 598.79736, "r": 294.04462, "b": 605.3109, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Zitnick. Microsoft COCO: common objects in context, 2014.", "bbox": {"l": 69.234001, "t": 606.76736, "r": 239.71553000000003, "b": 613.2809, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "list_item", "bbox": {"l": 53.79800000000001, "t": 614.7373699999999, "r": 295.12009, "b": 629.22089, "coord_origin": "TOPLEFT"}, "confidence": 0.8385182023048401, "cells": [{"id": 44, "text": "[17]", "bbox": {"l": 53.79800000000001, "t": 614.7373699999999, "r": 65.177979, "b": 621.2509, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Yuxin Wu, Alexander Kirillov, Francisco Massa, Wan-Yen Lo, and Ross Girshick.", "bbox": {"l": 66.910622, "t": 614.7373699999999, "r": 295.12009, "b": 621.2509, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "Detectron2, 2019.", "bbox": {"l": 69.234001, "t": 622.70737, "r": 118.65732, "b": 629.22089, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "list_item", "bbox": {"l": 53.79800000000001, "t": 630.67737, "r": 294.8089, "b": 669.0718899999999, "coord_origin": "TOPLEFT"}, "confidence": 0.8362045288085938, "cells": [{"id": 47, "text": "[18]", "bbox": {"l": 53.79800000000001, "t": 630.67737, "r": 65.022064, "b": 637.19089, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Nikolaos Livathinos, Cesar Berrospi, Maksym Lysak, Viktor Kuropiatnyk, Ahmed", "bbox": {"l": 66.730972, "t": 630.67737, "r": 294.04224, "b": 637.19089, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "Nassar, Andre Carvalho, Michele Dolfi, Christoph Auer, Kasper Dinkla, and Peter", "bbox": {"l": 69.234001, "t": 638.64737, "r": 294.17896, "b": 645.16089, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "W.", "bbox": {"l": 68.900002, "t": 646.6173699999999, "r": 76.877083, "b": 653.13089, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "J. Staar. Robust pdf document conversion using recurrent neural networks. In", "bbox": {"l": 78.580124, "t": 646.6173699999999, "r": 294.04312, "b": 653.13089, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Proceedings of the 35th Conference on Artificial Intelligence", "bbox": {"l": 69.234001, "t": 654.62325, "r": 233.43309000000002, "b": 661.10887, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": ", AAAI, pages 15137-", "bbox": {"l": 233.43401000000003, "t": 654.58838, "r": 294.8089, "b": 661.1019, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "15145, feb 2021.", "bbox": {"l": 69.073997, "t": 662.55836, "r": 113.53197, "b": 669.0718899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "list_item", "bbox": {"l": 53.797997, "t": 670.52837, "r": 295.22174, "b": 708.92189, "coord_origin": "TOPLEFT"}, "confidence": 0.7421631217002869, "cells": [{"id": 55, "text": "[19]", "bbox": {"l": 53.797997, "t": 670.52837, "r": 65.760811, "b": 677.04189, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Yiheng Xu, Minghao Li, Lei Cui, Shaohan Huang, Furu Wei, and Ming Zhou.", "bbox": {"l": 67.582199, "t": 670.52837, "r": 295.11609, "b": 677.04189, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Layoutlm: Pre-training of text and layout for document image understanding.", "bbox": {"l": 69.234001, "t": 678.49837, "r": 295.11606, "b": 685.01189, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "In", "bbox": {"l": 69.234001, "t": 686.46837, "r": 75.155228, "b": 692.981895, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Proceedings of the 26th ACM SIGKDD International Conference on Knowledge", "bbox": {"l": 76.891998, "t": 686.50323, "r": 294.04382, "b": 692.988869, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Discovery and Data Mining", "bbox": {"l": 69.234001, "t": 694.473236, "r": 144.91022, "b": 700.95887, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": ", KDD, pages 1192-1200, New York, USA, 2020. Asso-", "bbox": {"l": 144.908, "t": 694.4383700000001, "r": 295.22174, "b": 700.951897, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "ciation for Computing Machinery.", "bbox": {"l": 69.234001, "t": 702.408363, "r": 166.37207, "b": 708.92189, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "list_item", "bbox": {"l": 317.95499, "t": 527.06638, "r": 559.02637, "b": 541.5499, "coord_origin": "TOPLEFT"}, "confidence": 0.9088895320892334, "cells": [{"id": 63, "text": "[20]", "bbox": {"l": 317.95499, "t": 527.06638, "r": 329.24017, "b": 533.57993, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "Shoubin Li, Xuyan Ma, Shuaiqun Pan, Jun Hu, Lin Shi, and Qing Wang. Vtlayout:", "bbox": {"l": 330.95837, "t": 527.06638, "r": 559.02637, "b": 533.57993, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "Fusion of visual and text features for document layout analysis, 2021.", "bbox": {"l": 333.39099, "t": 535.03638, "r": 530.03815, "b": 541.5499, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "list_item", "bbox": {"l": 317.95499, "t": 543.00638, "r": 558.9715, "b": 565.4599000000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9247174859046936, "cells": [{"id": 66, "text": "[21]", "bbox": {"l": 317.95499, "t": 543.00638, "r": 329.54419, "b": 549.5199, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "Peng Zhang, Can Li, Liang Qiao, Zhanzhan Cheng, Shiliang Pu, Yi Niu, and Fei", "bbox": {"l": 331.30869, "t": 543.00638, "r": 558.20135, "b": 549.5199, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "Wu. Vsr: A unified framework for document layout analysis combining vision,", "bbox": {"l": 333.05701, "t": 550.97638, "r": 558.9715, "b": 557.4899, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "semantics and relations, 2021.", "bbox": {"l": 333.39099, "t": 558.94638, "r": 418.05988, "b": 565.4599000000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "list_item", "bbox": {"l": 317.95499, "t": 566.91635, "r": 559.27539, "b": 597.3478700000001, "coord_origin": "TOPLEFT"}, "confidence": 0.8956930637359619, "cells": [{"id": 70, "text": "[22]", "bbox": {"l": 317.95499, "t": 566.91638, "r": 330.14108, "b": 573.4299, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Peter W J Staar, Michele Dolfi, Christoph Auer, and Costas Bekas.", "bbox": {"l": 331.99646, "t": 566.91638, "r": 531.54553, "b": 573.4299, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "Corpus", "bbox": {"l": 537.12946, "t": 566.91635, "r": 558.19897, "b": 573.42989, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "conversion service: A machine learning platform to ingest documents at scale.", "bbox": {"l": 333.39099, "t": 574.88635, "r": 559.27539, "b": 581.39989, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "In", "bbox": {"l": 333.39099, "t": 582.85736, "r": 339.31223, "b": 589.3709, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "Proceedings of the 24th ACM SIGKDD International Conference on Knowledge", "bbox": {"l": 341.04901, "t": 582.89224, "r": 558.20081, "b": 589.37787, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "Discovery and Data Mining", "bbox": {"l": 333.39099, "t": 590.8622399999999, "r": 409.56577, "b": 597.3478700000001, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": ", KDD, pages 774-782. ACM, 2018.", "bbox": {"l": 409.56598, "t": 590.82736, "r": 507.31765999999993, "b": 597.3409, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "list_item", "bbox": {"l": 317.95499, "t": 598.79736, "r": 559.3783, "b": 613.28787, "coord_origin": "TOPLEFT"}, "confidence": 0.8972970843315125, "cells": [{"id": 78, "text": "[23]", "bbox": {"l": 317.95499, "t": 598.79736, "r": 329.37976, "b": 605.3109, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "Connor Shorten and Taghi M. Khoshgoftaar. A survey on image data augmenta-", "bbox": {"l": 331.11923, "t": 598.79736, "r": 559.3783, "b": 605.3109, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "tion for deep learning.", "bbox": {"l": 333.39099, "t": 606.76736, "r": 396.9223, "b": 613.2809, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Journal of Big Data", "bbox": {"l": 399.43298, "t": 606.80225, "r": 453.66122, "b": 613.28787, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": ", 6(1):60, 2019.", "bbox": {"l": 453.66199, "t": 606.76736, "r": 493.49631, "b": 613.2809, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_header", "id": 13, "page_no": 8, "cluster": {"id": 13, "label": "page_header", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.8021690249443054, "cells": [{"id": 0, "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis"}, {"label": "page_header", "id": 9, "page_no": 8, "cluster": {"id": 9, "label": "page_header", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.8429245352745056, "cells": [{"id": 1, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA"}, {"label": "picture", "id": 12, "page_no": 8, "cluster": {"id": 12, "label": "picture", "bbox": {"l": 52.963985443115234, "t": 84.73588562011719, "r": 556.931640625, "b": 442.1351318359375, "coord_origin": "TOPLEFT"}, "confidence": 0.8352116942405701, "cells": [{"id": 2, "text": "4bed2a8aa51ac37058e79605821bbc426d032b0b6ca8bdf3409ed8508ccd8c67", "bbox": {"l": 231.8804, "t": 301.50543, "r": 235.14504999999997, "b": 414.69144, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "2f2a06d08f5ad565d0f5e815f4ddf666365b2cff435cdaeb8850217e8a8efabf", "bbox": {"l": 395.06876, "t": 117.37183000000005, "r": 398.33353, "b": 230.55786, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "7f2fd7293e04bf4f1756ae51f5779764933da1d1d2002e3915356050570fc75b", "bbox": {"l": 55.775887, "t": 301.50543, "r": 59.04052000000001, "b": 414.69144, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "1b81cf65f47456ad4faa725d1eb09879bd633af16cfe2bf8cea661b87907bfac", "bbox": {"l": 232.01364, "t": 117.37183000000005, "r": 235.27841000000004, "b": 230.55786, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "b60da9d26f488cb133e47d101d35fda1bdca2671ade60764d1cd569590270327", "bbox": {"l": 395.20047, "t": 301.50543, "r": 398.46512, "b": 414.69144, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "2b7b8355a42ebef0cf91583aad9f30f7c9fa63c5b05911730ba15275c024965b$^{A}$", "bbox": {"l": 55.775818, "t": 117.37183000000005, "r": 65.409912, "b": 230.55786, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "B", "bbox": {"l": 234.56980999999996, "t": 88.50183000000015, "r": 240.06987, "b": 97.01098999999988, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "C", "bbox": {"l": 397.81934, "t": 88.89355, "r": 403.3194, "b": 97.40270999999996, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "D", "bbox": {"l": 59.909843, "t": 266.75885000000005, "r": 65.409912, "b": 275.26793999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "E", "bbox": {"l": 234.77386, "t": 266.36707, "r": 239.85495000000003, "b": 274.87616, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "F", "bbox": {"l": 398.26144, "t": 266.75885000000005, "r": 402.91592, "b": 275.26793999999995, "coord_origin": "TOPLEFT"}}], "children": [{"id": 17, "label": "text", "bbox": {"l": 231.8804, "t": 301.50543, "r": 235.14504999999997, "b": 414.69144, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 2, "text": "4bed2a8aa51ac37058e79605821bbc426d032b0b6ca8bdf3409ed8508ccd8c67", "bbox": {"l": 231.8804, "t": 301.50543, "r": 235.14504999999997, "b": 414.69144, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 395.06876, "t": 117.37183000000005, "r": 398.33353, "b": 230.55786, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 3, "text": "2f2a06d08f5ad565d0f5e815f4ddf666365b2cff435cdaeb8850217e8a8efabf", "bbox": {"l": 395.06876, "t": 117.37183000000005, "r": 398.33353, "b": 230.55786, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 55.775887, "t": 301.50543, "r": 59.04052000000001, "b": 414.69144, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 4, "text": "7f2fd7293e04bf4f1756ae51f5779764933da1d1d2002e3915356050570fc75b", "bbox": {"l": 55.775887, "t": 301.50543, "r": 59.04052000000001, "b": 414.69144, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 232.01364, "t": 117.37183000000005, "r": 235.27841000000004, "b": 230.55786, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 5, "text": "1b81cf65f47456ad4faa725d1eb09879bd633af16cfe2bf8cea661b87907bfac", "bbox": {"l": 232.01364, "t": 117.37183000000005, "r": 235.27841000000004, "b": 230.55786, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 395.20047, "t": 301.50543, "r": 398.46512, "b": 414.69144, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": "b60da9d26f488cb133e47d101d35fda1bdca2671ade60764d1cd569590270327", "bbox": {"l": 395.20047, "t": 301.50543, "r": 398.46512, "b": 414.69144, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 55.775818, "t": 117.37183000000005, "r": 65.409912, "b": 230.55786, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "2b7b8355a42ebef0cf91583aad9f30f7c9fa63c5b05911730ba15275c024965b$^{A}$", "bbox": {"l": 55.775818, "t": 117.37183000000005, "r": 65.409912, "b": 230.55786, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 234.56980999999996, "t": 88.50183000000015, "r": 240.06987, "b": 97.01098999999988, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "B", "bbox": {"l": 234.56980999999996, "t": 88.50183000000015, "r": 240.06987, "b": 97.01098999999988, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 397.81934, "t": 88.89355, "r": 403.3194, "b": 97.40270999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "C", "bbox": {"l": 397.81934, "t": 88.89355, "r": 403.3194, "b": 97.40270999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 59.909843, "t": 266.75885000000005, "r": 65.409912, "b": 275.26793999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "D", "bbox": {"l": 59.909843, "t": 266.75885000000005, "r": 65.409912, "b": 275.26793999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 234.77386, "t": 266.36707, "r": 239.85495000000003, "b": 274.87616, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "E", "bbox": {"l": 234.77386, "t": 266.36707, "r": 239.85495000000003, "b": 274.87616, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 398.26144, "t": 266.75885000000005, "r": 402.91592, "b": 275.26793999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "F", "bbox": {"l": 398.26144, "t": 266.75885000000005, "r": 402.91592, "b": 275.26793999999995, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "caption", "id": 16, "page_no": 8, "cluster": {"id": 16, "label": "caption", "bbox": {"l": 62.323874999999994, "t": 442.28543, "r": 318.50473, "b": 448.26483, "coord_origin": "TOPLEFT"}, "confidence": 0.6248989701271057, "cells": [{"id": 13, "text": "Text", "bbox": {"l": 62.323874999999994, "t": 442.28543, "r": 70.895882, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Caption", "bbox": {"l": 80.16581, "t": 442.28543, "r": 95.565453, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "List-Item", "bbox": {"l": 104.94447, "t": 442.28543, "r": 122.38113000000001, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Formula", "bbox": {"l": 131.78354, "t": 442.28543, "r": 148.34625, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "Table", "bbox": {"l": 157.66106, "t": 442.28543, "r": 168.53032, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Section-Header", "bbox": {"l": 201.24315, "t": 442.28543, "r": 232.00499, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Picture", "bbox": {"l": 177.8381, "t": 442.28543, "r": 191.88956, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Page-Header", "bbox": {"l": 240.95844000000002, "t": 442.28543, "r": 266.61908, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Page-Footer", "bbox": {"l": 276.03928, "t": 442.28543, "r": 300.33261, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "Title", "bbox": {"l": 309.74615, "t": 442.28543, "r": 318.50473, "b": 448.26483, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Text Caption List-Item Formula Table Section-Header Picture Page-Header Page-Footer Title"}, {"label": "text", "id": 4, "page_no": 8, "cluster": {"id": 4, "label": "text", "bbox": {"l": 53.79800000000001, "t": 464.48199, "r": 559.80786, "b": 505.83124, "coord_origin": "TOPLEFT"}, "confidence": 0.8651240468025208, "cells": [{"id": 23, "text": "Figure 6: Example layout predictions on selected pages from the DocLayNet test-set. (A, D) exhibit favourable results on", "bbox": {"l": 53.79800000000001, "t": 464.48199, "r": 558.203, "b": 472.95523, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "coloured backgrounds. (B, C) show accurate list-item and paragraph differentiation despite densely-spaced lines. (E) demon-", "bbox": {"l": 53.79800000000001, "t": 475.44101, "r": 559.80786, "b": 483.91425, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "strates good table and figure distinction. (F) shows predictions on a Chinese patent with multiple overlaps, label confusion", "bbox": {"l": 53.79800000000001, "t": 486.39999, "r": 558.20294, "b": 494.87323, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "and missing boxes.", "bbox": {"l": 53.79800000000001, "t": 497.358, "r": 130.37105, "b": 505.83124, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 6: Example layout predictions on selected pages from the DocLayNet test-set. (A, D) exhibit favourable results on coloured backgrounds. (B, C) show accurate list-item and paragraph differentiation despite densely-spaced lines. (E) demonstrates good table and figure distinction. (F) shows predictions on a Chinese patent with multiple overlaps, label confusion and missing boxes."}, {"label": "text", "id": 8, "page_no": 8, "cluster": {"id": 8, "label": "text", "bbox": {"l": 69.234001, "t": 527.06635, "r": 295.22406, "b": 549.5199, "coord_origin": "TOPLEFT"}, "confidence": 0.8445900082588196, "cells": [{"id": 27, "text": "Diaconu, Mai Thanh Minh, Marc, albinxavi, fatih, oleg, and wanghao yang. ul-", "bbox": {"l": 69.234001, "t": 527.06635, "r": 295.22406, "b": 533.5799, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "tralytics/yolov5: v6.0 - yolov5n nano models, roboflow integration, tensorflow", "bbox": {"l": 69.234001, "t": 535.03638, "r": 294.30612, "b": 541.5499, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "export, opencv dnn support, October 2021.", "bbox": {"l": 69.234001, "t": 543.00638, "r": 190.45259, "b": 549.5199, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Diaconu, Mai Thanh Minh, Marc, albinxavi, fatih, oleg, and wanghao yang. ultralytics/yolov5: v6.0 - yolov5n nano models, roboflow integration, tensorflow export, opencv dnn support, October 2021."}, {"label": "list_item", "id": 7, "page_no": 8, "cluster": {"id": 7, "label": "list_item", "bbox": {"l": 53.79800000000001, "t": 550.97638, "r": 295.12177, "b": 573.43686, "coord_origin": "TOPLEFT"}, "confidence": 0.8561117053031921, "cells": [{"id": 30, "text": "[14]", "bbox": {"l": 53.79800000000001, "t": 550.97638, "r": 65.286942, "b": 557.4899, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Nicolas Carion, Francisco Massa, Gabriel Synnaeve, Nicolas Usunier, Alexander", "bbox": {"l": 67.036171, "t": 550.97638, "r": 294.17709, "b": 557.4899, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Kirillov, and Sergey Zagoruyko. End-to-end object detection with transformers.", "bbox": {"l": 69.234001, "t": 558.94638, "r": 295.12177, "b": 565.4599000000001, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "CoRR", "bbox": {"l": 69.234001, "t": 566.95123, "r": 84.388069, "b": 573.43686, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": ", abs/2005.12872, 2020.", "bbox": {"l": 84.388, "t": 566.91635, "r": 147.7659, "b": 573.42989, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[14] Nicolas Carion, Francisco Massa, Gabriel Synnaeve, Nicolas Usunier, Alexander Kirillov, and Sergey Zagoruyko. End-to-end object detection with transformers. CoRR , abs/2005.12872, 2020."}, {"label": "list_item", "id": 5, "page_no": 8, "cluster": {"id": 5, "label": "list_item", "bbox": {"l": 53.79800000000001, "t": 574.88635, "r": 294.04224, "b": 589.37787, "coord_origin": "TOPLEFT"}, "confidence": 0.8615185618400574, "cells": [{"id": 35, "text": "[15]", "bbox": {"l": 53.79800000000001, "t": 574.88635, "r": 64.994034, "b": 581.39989, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Mingxing Tan, Ruoming Pang, and Quoc V. Le. Efficientdet: Scalable and efficient", "bbox": {"l": 66.698669, "t": 574.88635, "r": 294.04224, "b": 581.39989, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "object detection.", "bbox": {"l": 69.234001, "t": 582.85736, "r": 116.1049, "b": 589.3709, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "CoRR", "bbox": {"l": 118.616, "t": 582.89224, "r": 133.77007, "b": 589.37787, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": ", abs/1911.09070, 2019.", "bbox": {"l": 133.77, "t": 582.85736, "r": 197.14792, "b": 589.3709, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[15] Mingxing Tan, Ruoming Pang, and Quoc V. Le. Efficientdet: Scalable and efficient object detection. CoRR , abs/1911.09070, 2019."}, {"label": "list_item", "id": 6, "page_no": 8, "cluster": {"id": 6, "label": "list_item", "bbox": {"l": 53.79800399999999, "t": 590.82736, "r": 295.22263, "b": 613.2809, "coord_origin": "TOPLEFT"}, "confidence": 0.859420895576477, "cells": [{"id": 40, "text": "[16]", "bbox": {"l": 53.79800399999999, "t": 590.82736, "r": 65.110367, "b": 597.3409, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Tsung-Yi Lin, Michael Maire, Serge J. Belongie, Lubomir D. Bourdev, Ross B. Gir-", "bbox": {"l": 66.832718, "t": 590.82736, "r": 295.22263, "b": 597.3409, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "shick, James Hays, Pietro Perona, Deva Ramanan, Piotr Doll\u00e1r, and C. Lawrence", "bbox": {"l": 69.234001, "t": 598.79736, "r": 294.04462, "b": 605.3109, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Zitnick. Microsoft COCO: common objects in context, 2014.", "bbox": {"l": 69.234001, "t": 606.76736, "r": 239.71553000000003, "b": 613.2809, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[16] Tsung-Yi Lin, Michael Maire, Serge J. Belongie, Lubomir D. Bourdev, Ross B. Girshick, James Hays, Pietro Perona, Deva Ramanan, Piotr Doll\u00e1r, and C. Lawrence Zitnick. Microsoft COCO: common objects in context, 2014."}, {"label": "list_item", "id": 10, "page_no": 8, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 53.79800000000001, "t": 614.7373699999999, "r": 295.12009, "b": 629.22089, "coord_origin": "TOPLEFT"}, "confidence": 0.8385182023048401, "cells": [{"id": 44, "text": "[17]", "bbox": {"l": 53.79800000000001, "t": 614.7373699999999, "r": 65.177979, "b": 621.2509, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Yuxin Wu, Alexander Kirillov, Francisco Massa, Wan-Yen Lo, and Ross Girshick.", "bbox": {"l": 66.910622, "t": 614.7373699999999, "r": 295.12009, "b": 621.2509, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "Detectron2, 2019.", "bbox": {"l": 69.234001, "t": 622.70737, "r": 118.65732, "b": 629.22089, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[17] Yuxin Wu, Alexander Kirillov, Francisco Massa, Wan-Yen Lo, and Ross Girshick. Detectron2, 2019."}, {"label": "list_item", "id": 11, "page_no": 8, "cluster": {"id": 11, "label": "list_item", "bbox": {"l": 53.79800000000001, "t": 630.67737, "r": 294.8089, "b": 669.0718899999999, "coord_origin": "TOPLEFT"}, "confidence": 0.8362045288085938, "cells": [{"id": 47, "text": "[18]", "bbox": {"l": 53.79800000000001, "t": 630.67737, "r": 65.022064, "b": 637.19089, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Nikolaos Livathinos, Cesar Berrospi, Maksym Lysak, Viktor Kuropiatnyk, Ahmed", "bbox": {"l": 66.730972, "t": 630.67737, "r": 294.04224, "b": 637.19089, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "Nassar, Andre Carvalho, Michele Dolfi, Christoph Auer, Kasper Dinkla, and Peter", "bbox": {"l": 69.234001, "t": 638.64737, "r": 294.17896, "b": 645.16089, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "W.", "bbox": {"l": 68.900002, "t": 646.6173699999999, "r": 76.877083, "b": 653.13089, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "J. Staar. Robust pdf document conversion using recurrent neural networks. In", "bbox": {"l": 78.580124, "t": 646.6173699999999, "r": 294.04312, "b": 653.13089, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Proceedings of the 35th Conference on Artificial Intelligence", "bbox": {"l": 69.234001, "t": 654.62325, "r": 233.43309000000002, "b": 661.10887, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": ", AAAI, pages 15137-", "bbox": {"l": 233.43401000000003, "t": 654.58838, "r": 294.8089, "b": 661.1019, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "15145, feb 2021.", "bbox": {"l": 69.073997, "t": 662.55836, "r": 113.53197, "b": 669.0718899999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[18] Nikolaos Livathinos, Cesar Berrospi, Maksym Lysak, Viktor Kuropiatnyk, Ahmed Nassar, Andre Carvalho, Michele Dolfi, Christoph Auer, Kasper Dinkla, and Peter W. J. Staar. Robust pdf document conversion using recurrent neural networks. In Proceedings of the 35th Conference on Artificial Intelligence , AAAI, pages 1513715145, feb 2021."}, {"label": "list_item", "id": 14, "page_no": 8, "cluster": {"id": 14, "label": "list_item", "bbox": {"l": 53.797997, "t": 670.52837, "r": 295.22174, "b": 708.92189, "coord_origin": "TOPLEFT"}, "confidence": 0.7421631217002869, "cells": [{"id": 55, "text": "[19]", "bbox": {"l": 53.797997, "t": 670.52837, "r": 65.760811, "b": 677.04189, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Yiheng Xu, Minghao Li, Lei Cui, Shaohan Huang, Furu Wei, and Ming Zhou.", "bbox": {"l": 67.582199, "t": 670.52837, "r": 295.11609, "b": 677.04189, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Layoutlm: Pre-training of text and layout for document image understanding.", "bbox": {"l": 69.234001, "t": 678.49837, "r": 295.11606, "b": 685.01189, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "In", "bbox": {"l": 69.234001, "t": 686.46837, "r": 75.155228, "b": 692.981895, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Proceedings of the 26th ACM SIGKDD International Conference on Knowledge", "bbox": {"l": 76.891998, "t": 686.50323, "r": 294.04382, "b": 692.988869, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Discovery and Data Mining", "bbox": {"l": 69.234001, "t": 694.473236, "r": 144.91022, "b": 700.95887, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": ", KDD, pages 1192-1200, New York, USA, 2020. Asso-", "bbox": {"l": 144.908, "t": 694.4383700000001, "r": 295.22174, "b": 700.951897, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "ciation for Computing Machinery.", "bbox": {"l": 69.234001, "t": 702.408363, "r": 166.37207, "b": 708.92189, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[19] Yiheng Xu, Minghao Li, Lei Cui, Shaohan Huang, Furu Wei, and Ming Zhou. Layoutlm: Pre-training of text and layout for document image understanding. In Proceedings of the 26th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining , KDD, pages 1192-1200, New York, USA, 2020. Association for Computing Machinery."}, {"label": "list_item", "id": 1, "page_no": 8, "cluster": {"id": 1, "label": "list_item", "bbox": {"l": 317.95499, "t": 527.06638, "r": 559.02637, "b": 541.5499, "coord_origin": "TOPLEFT"}, "confidence": 0.9088895320892334, "cells": [{"id": 63, "text": "[20]", "bbox": {"l": 317.95499, "t": 527.06638, "r": 329.24017, "b": 533.57993, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "Shoubin Li, Xuyan Ma, Shuaiqun Pan, Jun Hu, Lin Shi, and Qing Wang. Vtlayout:", "bbox": {"l": 330.95837, "t": 527.06638, "r": 559.02637, "b": 533.57993, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "Fusion of visual and text features for document layout analysis, 2021.", "bbox": {"l": 333.39099, "t": 535.03638, "r": 530.03815, "b": 541.5499, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[20] Shoubin Li, Xuyan Ma, Shuaiqun Pan, Jun Hu, Lin Shi, and Qing Wang. Vtlayout: Fusion of visual and text features for document layout analysis, 2021."}, {"label": "list_item", "id": 0, "page_no": 8, "cluster": {"id": 0, "label": "list_item", "bbox": {"l": 317.95499, "t": 543.00638, "r": 558.9715, "b": 565.4599000000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9247174859046936, "cells": [{"id": 66, "text": "[21]", "bbox": {"l": 317.95499, "t": 543.00638, "r": 329.54419, "b": 549.5199, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "Peng Zhang, Can Li, Liang Qiao, Zhanzhan Cheng, Shiliang Pu, Yi Niu, and Fei", "bbox": {"l": 331.30869, "t": 543.00638, "r": 558.20135, "b": 549.5199, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "Wu. Vsr: A unified framework for document layout analysis combining vision,", "bbox": {"l": 333.05701, "t": 550.97638, "r": 558.9715, "b": 557.4899, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "semantics and relations, 2021.", "bbox": {"l": 333.39099, "t": 558.94638, "r": 418.05988, "b": 565.4599000000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[21] Peng Zhang, Can Li, Liang Qiao, Zhanzhan Cheng, Shiliang Pu, Yi Niu, and Fei Wu. Vsr: A unified framework for document layout analysis combining vision, semantics and relations, 2021."}, {"label": "list_item", "id": 3, "page_no": 8, "cluster": {"id": 3, "label": "list_item", "bbox": {"l": 317.95499, "t": 566.91635, "r": 559.27539, "b": 597.3478700000001, "coord_origin": "TOPLEFT"}, "confidence": 0.8956930637359619, "cells": [{"id": 70, "text": "[22]", "bbox": {"l": 317.95499, "t": 566.91638, "r": 330.14108, "b": 573.4299, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Peter W J Staar, Michele Dolfi, Christoph Auer, and Costas Bekas.", "bbox": {"l": 331.99646, "t": 566.91638, "r": 531.54553, "b": 573.4299, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "Corpus", "bbox": {"l": 537.12946, "t": 566.91635, "r": 558.19897, "b": 573.42989, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "conversion service: A machine learning platform to ingest documents at scale.", "bbox": {"l": 333.39099, "t": 574.88635, "r": 559.27539, "b": 581.39989, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "In", "bbox": {"l": 333.39099, "t": 582.85736, "r": 339.31223, "b": 589.3709, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "Proceedings of the 24th ACM SIGKDD International Conference on Knowledge", "bbox": {"l": 341.04901, "t": 582.89224, "r": 558.20081, "b": 589.37787, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "Discovery and Data Mining", "bbox": {"l": 333.39099, "t": 590.8622399999999, "r": 409.56577, "b": 597.3478700000001, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": ", KDD, pages 774-782. ACM, 2018.", "bbox": {"l": 409.56598, "t": 590.82736, "r": 507.31765999999993, "b": 597.3409, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[22] Peter W J Staar, Michele Dolfi, Christoph Auer, and Costas Bekas. Corpus conversion service: A machine learning platform to ingest documents at scale. In Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining , KDD, pages 774-782. ACM, 2018."}, {"label": "list_item", "id": 2, "page_no": 8, "cluster": {"id": 2, "label": "list_item", "bbox": {"l": 317.95499, "t": 598.79736, "r": 559.3783, "b": 613.28787, "coord_origin": "TOPLEFT"}, "confidence": 0.8972970843315125, "cells": [{"id": 78, "text": "[23]", "bbox": {"l": 317.95499, "t": 598.79736, "r": 329.37976, "b": 605.3109, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "Connor Shorten and Taghi M. Khoshgoftaar. A survey on image data augmenta-", "bbox": {"l": 331.11923, "t": 598.79736, "r": 559.3783, "b": 605.3109, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "tion for deep learning.", "bbox": {"l": 333.39099, "t": 606.76736, "r": 396.9223, "b": 613.2809, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Journal of Big Data", "bbox": {"l": 399.43298, "t": 606.80225, "r": 453.66122, "b": 613.28787, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": ", 6(1):60, 2019.", "bbox": {"l": 453.66199, "t": 606.76736, "r": 493.49631, "b": 613.2809, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[23] Connor Shorten and Taghi M. Khoshgoftaar. A survey on image data augmentation for deep learning. Journal of Big Data , 6(1):60, 2019."}], "body": [{"label": "picture", "id": 12, "page_no": 8, "cluster": {"id": 12, "label": "picture", "bbox": {"l": 52.963985443115234, "t": 84.73588562011719, "r": 556.931640625, "b": 442.1351318359375, "coord_origin": "TOPLEFT"}, "confidence": 0.8352116942405701, "cells": [{"id": 2, "text": "4bed2a8aa51ac37058e79605821bbc426d032b0b6ca8bdf3409ed8508ccd8c67", "bbox": {"l": 231.8804, "t": 301.50543, "r": 235.14504999999997, "b": 414.69144, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "2f2a06d08f5ad565d0f5e815f4ddf666365b2cff435cdaeb8850217e8a8efabf", "bbox": {"l": 395.06876, "t": 117.37183000000005, "r": 398.33353, "b": 230.55786, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "7f2fd7293e04bf4f1756ae51f5779764933da1d1d2002e3915356050570fc75b", "bbox": {"l": 55.775887, "t": 301.50543, "r": 59.04052000000001, "b": 414.69144, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "1b81cf65f47456ad4faa725d1eb09879bd633af16cfe2bf8cea661b87907bfac", "bbox": {"l": 232.01364, "t": 117.37183000000005, "r": 235.27841000000004, "b": 230.55786, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "b60da9d26f488cb133e47d101d35fda1bdca2671ade60764d1cd569590270327", "bbox": {"l": 395.20047, "t": 301.50543, "r": 398.46512, "b": 414.69144, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "2b7b8355a42ebef0cf91583aad9f30f7c9fa63c5b05911730ba15275c024965b$^{A}$", "bbox": {"l": 55.775818, "t": 117.37183000000005, "r": 65.409912, "b": 230.55786, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "B", "bbox": {"l": 234.56980999999996, "t": 88.50183000000015, "r": 240.06987, "b": 97.01098999999988, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "C", "bbox": {"l": 397.81934, "t": 88.89355, "r": 403.3194, "b": 97.40270999999996, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "D", "bbox": {"l": 59.909843, "t": 266.75885000000005, "r": 65.409912, "b": 275.26793999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "E", "bbox": {"l": 234.77386, "t": 266.36707, "r": 239.85495000000003, "b": 274.87616, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "F", "bbox": {"l": 398.26144, "t": 266.75885000000005, "r": 402.91592, "b": 275.26793999999995, "coord_origin": "TOPLEFT"}}], "children": [{"id": 17, "label": "text", "bbox": {"l": 231.8804, "t": 301.50543, "r": 235.14504999999997, "b": 414.69144, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 2, "text": "4bed2a8aa51ac37058e79605821bbc426d032b0b6ca8bdf3409ed8508ccd8c67", "bbox": {"l": 231.8804, "t": 301.50543, "r": 235.14504999999997, "b": 414.69144, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 395.06876, "t": 117.37183000000005, "r": 398.33353, "b": 230.55786, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 3, "text": "2f2a06d08f5ad565d0f5e815f4ddf666365b2cff435cdaeb8850217e8a8efabf", "bbox": {"l": 395.06876, "t": 117.37183000000005, "r": 398.33353, "b": 230.55786, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 55.775887, "t": 301.50543, "r": 59.04052000000001, "b": 414.69144, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 4, "text": "7f2fd7293e04bf4f1756ae51f5779764933da1d1d2002e3915356050570fc75b", "bbox": {"l": 55.775887, "t": 301.50543, "r": 59.04052000000001, "b": 414.69144, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 232.01364, "t": 117.37183000000005, "r": 235.27841000000004, "b": 230.55786, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 5, "text": "1b81cf65f47456ad4faa725d1eb09879bd633af16cfe2bf8cea661b87907bfac", "bbox": {"l": 232.01364, "t": 117.37183000000005, "r": 235.27841000000004, "b": 230.55786, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 395.20047, "t": 301.50543, "r": 398.46512, "b": 414.69144, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": "b60da9d26f488cb133e47d101d35fda1bdca2671ade60764d1cd569590270327", "bbox": {"l": 395.20047, "t": 301.50543, "r": 398.46512, "b": 414.69144, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 55.775818, "t": 117.37183000000005, "r": 65.409912, "b": 230.55786, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "2b7b8355a42ebef0cf91583aad9f30f7c9fa63c5b05911730ba15275c024965b$^{A}$", "bbox": {"l": 55.775818, "t": 117.37183000000005, "r": 65.409912, "b": 230.55786, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 234.56980999999996, "t": 88.50183000000015, "r": 240.06987, "b": 97.01098999999988, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "B", "bbox": {"l": 234.56980999999996, "t": 88.50183000000015, "r": 240.06987, "b": 97.01098999999988, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 397.81934, "t": 88.89355, "r": 403.3194, "b": 97.40270999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "C", "bbox": {"l": 397.81934, "t": 88.89355, "r": 403.3194, "b": 97.40270999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 59.909843, "t": 266.75885000000005, "r": 65.409912, "b": 275.26793999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "D", "bbox": {"l": 59.909843, "t": 266.75885000000005, "r": 65.409912, "b": 275.26793999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 234.77386, "t": 266.36707, "r": 239.85495000000003, "b": 274.87616, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "E", "bbox": {"l": 234.77386, "t": 266.36707, "r": 239.85495000000003, "b": 274.87616, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 398.26144, "t": 266.75885000000005, "r": 402.91592, "b": 275.26793999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "F", "bbox": {"l": 398.26144, "t": 266.75885000000005, "r": 402.91592, "b": 275.26793999999995, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "caption", "id": 16, "page_no": 8, "cluster": {"id": 16, "label": "caption", "bbox": {"l": 62.323874999999994, "t": 442.28543, "r": 318.50473, "b": 448.26483, "coord_origin": "TOPLEFT"}, "confidence": 0.6248989701271057, "cells": [{"id": 13, "text": "Text", "bbox": {"l": 62.323874999999994, "t": 442.28543, "r": 70.895882, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Caption", "bbox": {"l": 80.16581, "t": 442.28543, "r": 95.565453, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "List-Item", "bbox": {"l": 104.94447, "t": 442.28543, "r": 122.38113000000001, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Formula", "bbox": {"l": 131.78354, "t": 442.28543, "r": 148.34625, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "Table", "bbox": {"l": 157.66106, "t": 442.28543, "r": 168.53032, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Section-Header", "bbox": {"l": 201.24315, "t": 442.28543, "r": 232.00499, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Picture", "bbox": {"l": 177.8381, "t": 442.28543, "r": 191.88956, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Page-Header", "bbox": {"l": 240.95844000000002, "t": 442.28543, "r": 266.61908, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Page-Footer", "bbox": {"l": 276.03928, "t": 442.28543, "r": 300.33261, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "Title", "bbox": {"l": 309.74615, "t": 442.28543, "r": 318.50473, "b": 448.26483, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Text Caption List-Item Formula Table Section-Header Picture Page-Header Page-Footer Title"}, {"label": "text", "id": 4, "page_no": 8, "cluster": {"id": 4, "label": "text", "bbox": {"l": 53.79800000000001, "t": 464.48199, "r": 559.80786, "b": 505.83124, "coord_origin": "TOPLEFT"}, "confidence": 0.8651240468025208, "cells": [{"id": 23, "text": "Figure 6: Example layout predictions on selected pages from the DocLayNet test-set. (A, D) exhibit favourable results on", "bbox": {"l": 53.79800000000001, "t": 464.48199, "r": 558.203, "b": 472.95523, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "coloured backgrounds. (B, C) show accurate list-item and paragraph differentiation despite densely-spaced lines. (E) demon-", "bbox": {"l": 53.79800000000001, "t": 475.44101, "r": 559.80786, "b": 483.91425, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "strates good table and figure distinction. (F) shows predictions on a Chinese patent with multiple overlaps, label confusion", "bbox": {"l": 53.79800000000001, "t": 486.39999, "r": 558.20294, "b": 494.87323, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "and missing boxes.", "bbox": {"l": 53.79800000000001, "t": 497.358, "r": 130.37105, "b": 505.83124, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 6: Example layout predictions on selected pages from the DocLayNet test-set. (A, D) exhibit favourable results on coloured backgrounds. (B, C) show accurate list-item and paragraph differentiation despite densely-spaced lines. (E) demonstrates good table and figure distinction. (F) shows predictions on a Chinese patent with multiple overlaps, label confusion and missing boxes."}, {"label": "text", "id": 8, "page_no": 8, "cluster": {"id": 8, "label": "text", "bbox": {"l": 69.234001, "t": 527.06635, "r": 295.22406, "b": 549.5199, "coord_origin": "TOPLEFT"}, "confidence": 0.8445900082588196, "cells": [{"id": 27, "text": "Diaconu, Mai Thanh Minh, Marc, albinxavi, fatih, oleg, and wanghao yang. ul-", "bbox": {"l": 69.234001, "t": 527.06635, "r": 295.22406, "b": 533.5799, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "tralytics/yolov5: v6.0 - yolov5n nano models, roboflow integration, tensorflow", "bbox": {"l": 69.234001, "t": 535.03638, "r": 294.30612, "b": 541.5499, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "export, opencv dnn support, October 2021.", "bbox": {"l": 69.234001, "t": 543.00638, "r": 190.45259, "b": 549.5199, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Diaconu, Mai Thanh Minh, Marc, albinxavi, fatih, oleg, and wanghao yang. ultralytics/yolov5: v6.0 - yolov5n nano models, roboflow integration, tensorflow export, opencv dnn support, October 2021."}, {"label": "list_item", "id": 7, "page_no": 8, "cluster": {"id": 7, "label": "list_item", "bbox": {"l": 53.79800000000001, "t": 550.97638, "r": 295.12177, "b": 573.43686, "coord_origin": "TOPLEFT"}, "confidence": 0.8561117053031921, "cells": [{"id": 30, "text": "[14]", "bbox": {"l": 53.79800000000001, "t": 550.97638, "r": 65.286942, "b": 557.4899, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Nicolas Carion, Francisco Massa, Gabriel Synnaeve, Nicolas Usunier, Alexander", "bbox": {"l": 67.036171, "t": 550.97638, "r": 294.17709, "b": 557.4899, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Kirillov, and Sergey Zagoruyko. End-to-end object detection with transformers.", "bbox": {"l": 69.234001, "t": 558.94638, "r": 295.12177, "b": 565.4599000000001, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "CoRR", "bbox": {"l": 69.234001, "t": 566.95123, "r": 84.388069, "b": 573.43686, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": ", abs/2005.12872, 2020.", "bbox": {"l": 84.388, "t": 566.91635, "r": 147.7659, "b": 573.42989, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[14] Nicolas Carion, Francisco Massa, Gabriel Synnaeve, Nicolas Usunier, Alexander Kirillov, and Sergey Zagoruyko. End-to-end object detection with transformers. CoRR , abs/2005.12872, 2020."}, {"label": "list_item", "id": 5, "page_no": 8, "cluster": {"id": 5, "label": "list_item", "bbox": {"l": 53.79800000000001, "t": 574.88635, "r": 294.04224, "b": 589.37787, "coord_origin": "TOPLEFT"}, "confidence": 0.8615185618400574, "cells": [{"id": 35, "text": "[15]", "bbox": {"l": 53.79800000000001, "t": 574.88635, "r": 64.994034, "b": 581.39989, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Mingxing Tan, Ruoming Pang, and Quoc V. Le. Efficientdet: Scalable and efficient", "bbox": {"l": 66.698669, "t": 574.88635, "r": 294.04224, "b": 581.39989, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "object detection.", "bbox": {"l": 69.234001, "t": 582.85736, "r": 116.1049, "b": 589.3709, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "CoRR", "bbox": {"l": 118.616, "t": 582.89224, "r": 133.77007, "b": 589.37787, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": ", abs/1911.09070, 2019.", "bbox": {"l": 133.77, "t": 582.85736, "r": 197.14792, "b": 589.3709, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[15] Mingxing Tan, Ruoming Pang, and Quoc V. Le. Efficientdet: Scalable and efficient object detection. CoRR , abs/1911.09070, 2019."}, {"label": "list_item", "id": 6, "page_no": 8, "cluster": {"id": 6, "label": "list_item", "bbox": {"l": 53.79800399999999, "t": 590.82736, "r": 295.22263, "b": 613.2809, "coord_origin": "TOPLEFT"}, "confidence": 0.859420895576477, "cells": [{"id": 40, "text": "[16]", "bbox": {"l": 53.79800399999999, "t": 590.82736, "r": 65.110367, "b": 597.3409, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Tsung-Yi Lin, Michael Maire, Serge J. Belongie, Lubomir D. Bourdev, Ross B. Gir-", "bbox": {"l": 66.832718, "t": 590.82736, "r": 295.22263, "b": 597.3409, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "shick, James Hays, Pietro Perona, Deva Ramanan, Piotr Doll\u00e1r, and C. Lawrence", "bbox": {"l": 69.234001, "t": 598.79736, "r": 294.04462, "b": 605.3109, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Zitnick. Microsoft COCO: common objects in context, 2014.", "bbox": {"l": 69.234001, "t": 606.76736, "r": 239.71553000000003, "b": 613.2809, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[16] Tsung-Yi Lin, Michael Maire, Serge J. Belongie, Lubomir D. Bourdev, Ross B. Girshick, James Hays, Pietro Perona, Deva Ramanan, Piotr Doll\u00e1r, and C. Lawrence Zitnick. Microsoft COCO: common objects in context, 2014."}, {"label": "list_item", "id": 10, "page_no": 8, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 53.79800000000001, "t": 614.7373699999999, "r": 295.12009, "b": 629.22089, "coord_origin": "TOPLEFT"}, "confidence": 0.8385182023048401, "cells": [{"id": 44, "text": "[17]", "bbox": {"l": 53.79800000000001, "t": 614.7373699999999, "r": 65.177979, "b": 621.2509, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Yuxin Wu, Alexander Kirillov, Francisco Massa, Wan-Yen Lo, and Ross Girshick.", "bbox": {"l": 66.910622, "t": 614.7373699999999, "r": 295.12009, "b": 621.2509, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "Detectron2, 2019.", "bbox": {"l": 69.234001, "t": 622.70737, "r": 118.65732, "b": 629.22089, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[17] Yuxin Wu, Alexander Kirillov, Francisco Massa, Wan-Yen Lo, and Ross Girshick. Detectron2, 2019."}, {"label": "list_item", "id": 11, "page_no": 8, "cluster": {"id": 11, "label": "list_item", "bbox": {"l": 53.79800000000001, "t": 630.67737, "r": 294.8089, "b": 669.0718899999999, "coord_origin": "TOPLEFT"}, "confidence": 0.8362045288085938, "cells": [{"id": 47, "text": "[18]", "bbox": {"l": 53.79800000000001, "t": 630.67737, "r": 65.022064, "b": 637.19089, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Nikolaos Livathinos, Cesar Berrospi, Maksym Lysak, Viktor Kuropiatnyk, Ahmed", "bbox": {"l": 66.730972, "t": 630.67737, "r": 294.04224, "b": 637.19089, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "Nassar, Andre Carvalho, Michele Dolfi, Christoph Auer, Kasper Dinkla, and Peter", "bbox": {"l": 69.234001, "t": 638.64737, "r": 294.17896, "b": 645.16089, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "W.", "bbox": {"l": 68.900002, "t": 646.6173699999999, "r": 76.877083, "b": 653.13089, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "J. Staar. Robust pdf document conversion using recurrent neural networks. In", "bbox": {"l": 78.580124, "t": 646.6173699999999, "r": 294.04312, "b": 653.13089, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Proceedings of the 35th Conference on Artificial Intelligence", "bbox": {"l": 69.234001, "t": 654.62325, "r": 233.43309000000002, "b": 661.10887, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": ", AAAI, pages 15137-", "bbox": {"l": 233.43401000000003, "t": 654.58838, "r": 294.8089, "b": 661.1019, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "15145, feb 2021.", "bbox": {"l": 69.073997, "t": 662.55836, "r": 113.53197, "b": 669.0718899999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[18] Nikolaos Livathinos, Cesar Berrospi, Maksym Lysak, Viktor Kuropiatnyk, Ahmed Nassar, Andre Carvalho, Michele Dolfi, Christoph Auer, Kasper Dinkla, and Peter W. J. Staar. Robust pdf document conversion using recurrent neural networks. In Proceedings of the 35th Conference on Artificial Intelligence , AAAI, pages 1513715145, feb 2021."}, {"label": "list_item", "id": 14, "page_no": 8, "cluster": {"id": 14, "label": "list_item", "bbox": {"l": 53.797997, "t": 670.52837, "r": 295.22174, "b": 708.92189, "coord_origin": "TOPLEFT"}, "confidence": 0.7421631217002869, "cells": [{"id": 55, "text": "[19]", "bbox": {"l": 53.797997, "t": 670.52837, "r": 65.760811, "b": 677.04189, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Yiheng Xu, Minghao Li, Lei Cui, Shaohan Huang, Furu Wei, and Ming Zhou.", "bbox": {"l": 67.582199, "t": 670.52837, "r": 295.11609, "b": 677.04189, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Layoutlm: Pre-training of text and layout for document image understanding.", "bbox": {"l": 69.234001, "t": 678.49837, "r": 295.11606, "b": 685.01189, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "In", "bbox": {"l": 69.234001, "t": 686.46837, "r": 75.155228, "b": 692.981895, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Proceedings of the 26th ACM SIGKDD International Conference on Knowledge", "bbox": {"l": 76.891998, "t": 686.50323, "r": 294.04382, "b": 692.988869, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Discovery and Data Mining", "bbox": {"l": 69.234001, "t": 694.473236, "r": 144.91022, "b": 700.95887, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": ", KDD, pages 1192-1200, New York, USA, 2020. Asso-", "bbox": {"l": 144.908, "t": 694.4383700000001, "r": 295.22174, "b": 700.951897, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "ciation for Computing Machinery.", "bbox": {"l": 69.234001, "t": 702.408363, "r": 166.37207, "b": 708.92189, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[19] Yiheng Xu, Minghao Li, Lei Cui, Shaohan Huang, Furu Wei, and Ming Zhou. Layoutlm: Pre-training of text and layout for document image understanding. In Proceedings of the 26th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining , KDD, pages 1192-1200, New York, USA, 2020. Association for Computing Machinery."}, {"label": "list_item", "id": 1, "page_no": 8, "cluster": {"id": 1, "label": "list_item", "bbox": {"l": 317.95499, "t": 527.06638, "r": 559.02637, "b": 541.5499, "coord_origin": "TOPLEFT"}, "confidence": 0.9088895320892334, "cells": [{"id": 63, "text": "[20]", "bbox": {"l": 317.95499, "t": 527.06638, "r": 329.24017, "b": 533.57993, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "Shoubin Li, Xuyan Ma, Shuaiqun Pan, Jun Hu, Lin Shi, and Qing Wang. Vtlayout:", "bbox": {"l": 330.95837, "t": 527.06638, "r": 559.02637, "b": 533.57993, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "Fusion of visual and text features for document layout analysis, 2021.", "bbox": {"l": 333.39099, "t": 535.03638, "r": 530.03815, "b": 541.5499, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[20] Shoubin Li, Xuyan Ma, Shuaiqun Pan, Jun Hu, Lin Shi, and Qing Wang. Vtlayout: Fusion of visual and text features for document layout analysis, 2021."}, {"label": "list_item", "id": 0, "page_no": 8, "cluster": {"id": 0, "label": "list_item", "bbox": {"l": 317.95499, "t": 543.00638, "r": 558.9715, "b": 565.4599000000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9247174859046936, "cells": [{"id": 66, "text": "[21]", "bbox": {"l": 317.95499, "t": 543.00638, "r": 329.54419, "b": 549.5199, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "Peng Zhang, Can Li, Liang Qiao, Zhanzhan Cheng, Shiliang Pu, Yi Niu, and Fei", "bbox": {"l": 331.30869, "t": 543.00638, "r": 558.20135, "b": 549.5199, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "Wu. Vsr: A unified framework for document layout analysis combining vision,", "bbox": {"l": 333.05701, "t": 550.97638, "r": 558.9715, "b": 557.4899, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "semantics and relations, 2021.", "bbox": {"l": 333.39099, "t": 558.94638, "r": 418.05988, "b": 565.4599000000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[21] Peng Zhang, Can Li, Liang Qiao, Zhanzhan Cheng, Shiliang Pu, Yi Niu, and Fei Wu. Vsr: A unified framework for document layout analysis combining vision, semantics and relations, 2021."}, {"label": "list_item", "id": 3, "page_no": 8, "cluster": {"id": 3, "label": "list_item", "bbox": {"l": 317.95499, "t": 566.91635, "r": 559.27539, "b": 597.3478700000001, "coord_origin": "TOPLEFT"}, "confidence": 0.8956930637359619, "cells": [{"id": 70, "text": "[22]", "bbox": {"l": 317.95499, "t": 566.91638, "r": 330.14108, "b": 573.4299, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Peter W J Staar, Michele Dolfi, Christoph Auer, and Costas Bekas.", "bbox": {"l": 331.99646, "t": 566.91638, "r": 531.54553, "b": 573.4299, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "Corpus", "bbox": {"l": 537.12946, "t": 566.91635, "r": 558.19897, "b": 573.42989, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "conversion service: A machine learning platform to ingest documents at scale.", "bbox": {"l": 333.39099, "t": 574.88635, "r": 559.27539, "b": 581.39989, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "In", "bbox": {"l": 333.39099, "t": 582.85736, "r": 339.31223, "b": 589.3709, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "Proceedings of the 24th ACM SIGKDD International Conference on Knowledge", "bbox": {"l": 341.04901, "t": 582.89224, "r": 558.20081, "b": 589.37787, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "Discovery and Data Mining", "bbox": {"l": 333.39099, "t": 590.8622399999999, "r": 409.56577, "b": 597.3478700000001, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": ", KDD, pages 774-782. ACM, 2018.", "bbox": {"l": 409.56598, "t": 590.82736, "r": 507.31765999999993, "b": 597.3409, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[22] Peter W J Staar, Michele Dolfi, Christoph Auer, and Costas Bekas. Corpus conversion service: A machine learning platform to ingest documents at scale. In Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining , KDD, pages 774-782. ACM, 2018."}, {"label": "list_item", "id": 2, "page_no": 8, "cluster": {"id": 2, "label": "list_item", "bbox": {"l": 317.95499, "t": 598.79736, "r": 559.3783, "b": 613.28787, "coord_origin": "TOPLEFT"}, "confidence": 0.8972970843315125, "cells": [{"id": 78, "text": "[23]", "bbox": {"l": 317.95499, "t": 598.79736, "r": 329.37976, "b": 605.3109, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "Connor Shorten and Taghi M. Khoshgoftaar. A survey on image data augmenta-", "bbox": {"l": 331.11923, "t": 598.79736, "r": 559.3783, "b": 605.3109, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "tion for deep learning.", "bbox": {"l": 333.39099, "t": 606.76736, "r": 396.9223, "b": 613.2809, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Journal of Big Data", "bbox": {"l": 399.43298, "t": 606.80225, "r": 453.66122, "b": 613.28787, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": ", 6(1):60, 2019.", "bbox": {"l": 453.66199, "t": 606.76736, "r": 493.49631, "b": 613.2809, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[23] Connor Shorten and Taghi M. Khoshgoftaar. A survey on image data augmentation for deep learning. Journal of Big Data , 6(1):60, 2019."}], "headers": [{"label": "page_header", "id": 13, "page_no": 8, "cluster": {"id": 13, "label": "page_header", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.8021690249443054, "cells": [{"id": 0, "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis"}, {"label": "page_header", "id": 9, "page_no": 8, "cluster": {"id": 9, "label": "page_header", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.8429245352745056, "cells": [{"id": 1, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA"}]}}]
\ No newline at end of file
+[{"page_no": 0, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "DocLayNet: A Large Human-Annotated Dataset for", "bbox": {"l": 107.29999999999998, "t": 83.69470000000013, "r": 505.06195, "b": 99.67058999999995, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Document-Layout Analysis", "bbox": {"l": 200.117, "t": 103.6196900000001, "r": 411.88367, "b": 119.59558000000015, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Birgit Pfitzmann", "bbox": {"l": 102.06001, "t": 133.67236000000003, "r": 182.63805, "b": 144.83856000000003, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "IBM Research", "bbox": {"l": 114.29401000000001, "t": 147.02423, "r": 170.40337, "b": 156.32928000000004, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Rueschlikon, Switzerland", "bbox": {"l": 90.96701, "t": 158.97924999999998, "r": 193.73123, "b": 168.28430000000003, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "bpf@zurich.ibm.com", "bbox": {"l": 100.02301, "t": 170.93524000000002, "r": 184.67522, "b": 180.24030000000005, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Christoph Auer", "bbox": {"l": 268.62402, "t": 133.67236000000003, "r": 344.59933, "b": 144.83856000000003, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "IBM Research", "bbox": {"l": 278.44302, "t": 147.02423, "r": 334.55237, "b": 156.32928000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Rueschlikon, Switzerland", "bbox": {"l": 255.11602999999997, "t": 158.97924999999998, "r": 357.88025, "b": 168.28430000000003, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "cau@zurich.ibm.com", "bbox": {"l": 263.70404, "t": 170.93524000000002, "r": 349.29272, "b": 180.24030000000005, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Michele Dolfi", "bbox": {"l": 437.6930500000001, "t": 133.67236000000003, "r": 503.60208, "b": 144.83856000000003, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "IBM Research", "bbox": {"l": 442.59305000000006, "t": 147.02423, "r": 498.7023899999999, "b": 156.32928000000004, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Rueschlikon, Switzerland", "bbox": {"l": 419.26505, "t": 158.97924999999998, "r": 522.0293, "b": 168.28430000000003, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "dol@zurich.ibm.com", "bbox": {"l": 428.56104000000005, "t": 170.93524000000002, "r": 512.73505, "b": 180.24030000000005, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Ahmed S. Nassar", "bbox": {"l": 182.26804, "t": 192.05737, "r": 265.39255, "b": 203.22357, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "IBM Research", "bbox": {"l": 195.87103, "t": 205.40923999999995, "r": 251.98038999999997, "b": 214.71429, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Rueschlikon, Switzerland", "bbox": {"l": 172.54303, "t": 217.36425999999994, "r": 275.30725, "b": 226.66931, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "ahn@zurich.ibm.com", "bbox": {"l": 180.52803, "t": 229.32025, "r": 267.3222, "b": 238.62531, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Peter Staar", "bbox": {"l": 361.52802, "t": 192.05737, "r": 414.84821, "b": 203.22357, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "IBM Research", "bbox": {"l": 360.02002, "t": 205.40923999999995, "r": 416.12939, "b": 214.71429, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Rueschlikon, Switzerland", "bbox": {"l": 336.69302, "t": 217.36425999999994, "r": 439.45727999999997, "b": 226.66931, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "taa@zurich.ibm.com", "bbox": {"l": 346.20703, "t": 229.32025, "r": 429.94269, "b": 238.62531, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "ABSTRACT", "bbox": {"l": 53.798035, "t": 247.70288000000005, "r": 111.94354, "b": 258.01202, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Accurate document layout analysis is a key requirement for high-", "bbox": {"l": 53.484001, "t": 262.90454, "r": 295.55591, "b": 271.27917, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "quality PDF document conversion. With the recent availability of", "bbox": {"l": 53.79800000000001, "t": 273.86352999999997, "r": 294.04199, "b": 282.23816, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "public, large ground-truth datasets such as PubLayNet and DocBank,", "bbox": {"l": 53.79800000000001, "t": 284.82254, "r": 295.34586, "b": 293.19717, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "deep-learning models have proven to be very effective at layout", "bbox": {"l": 53.79800000000001, "t": 295.78152, "r": 294.04709, "b": 304.15616000000006, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "detection and segmentation. While these datasets are of adequate", "bbox": {"l": 53.79800000000001, "t": 306.74053999999995, "r": 294.04645, "b": 315.11517, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "size to train such models, they severely lack in layout variability", "bbox": {"l": 53.79800000000001, "t": 317.69952, "r": 294.27573, "b": 326.07416, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "since they are sourced from scientific article repositories such as", "bbox": {"l": 53.79800000000001, "t": 328.65854, "r": 294.04712, "b": 337.03317, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "PubMed and arXiv only. Consequently, the accuracy of the layout", "bbox": {"l": 53.79800000000001, "t": 339.61755, "r": 294.0437, "b": 347.99219, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "segmentation drops significantly when these models are applied", "bbox": {"l": 53.79800000000001, "t": 350.57654, "r": 294.04715, "b": 358.95117, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "on more challenging and diverse layouts. In this paper, we present", "bbox": {"l": 53.79800000000001, "t": 361.53455, "r": 294.04364, "b": 369.90918000000005, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "DocLayNet", "bbox": {"l": 53.79800000000001, "t": 372.53839, "r": 92.863388, "b": 380.87714000000005, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": ", a new, publicly available, document-layout annotation", "bbox": {"l": 92.863998, "t": 372.49353, "r": 294.04361, "b": 380.86816, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "dataset in COCO format. It contains 80863 manually annotated", "bbox": {"l": 53.79800000000001, "t": 383.45255, "r": 294.04718, "b": 391.82718, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "pages from diverse data sources to represent a wide variability in", "bbox": {"l": 53.79800000000001, "t": 394.41153, "r": 294.0437, "b": 402.78616, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "layouts. For each PDF page, the layout annotations provide labelled", "bbox": {"l": 53.79800000000001, "t": 405.37054, "r": 294.04535, "b": 413.74518, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "bounding-boxes with a choice of 11 distinct classes. DocLayNet", "bbox": {"l": 53.79800000000001, "t": 416.32953, "r": 294.04715, "b": 424.70416000000006, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "also provides a subset of double- and triple-annotated pages to", "bbox": {"l": 53.79800000000001, "t": 427.28853999999995, "r": 294.04712, "b": 435.66318, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "determine the inter-annotator agreement. In multiple experiments,", "bbox": {"l": 53.79800000000001, "t": 438.24753, "r": 295.03, "b": 446.62216, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "we provide baseline accuracy scores (in mAP) for a set of popular", "bbox": {"l": 53.466999, "t": 449.20654, "r": 294.21616, "b": 457.58118, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "object detection models. We also demonstrate that these models", "bbox": {"l": 53.79800000000001, "t": 460.16553, "r": 294.04712, "b": 468.54016, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "fall approximately 10% behind the inter-annotator agreement. Fur-", "bbox": {"l": 53.79800000000001, "t": 471.12354, "r": 295.56018, "b": 479.49817, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "thermore, we provide evidence that DocLayNet is of sufficient size.", "bbox": {"l": 53.79800000000001, "t": 482.08255, "r": 295.42783, "b": 490.45718, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Lastly, we compare models trained on PubLayNet, DocBank and", "bbox": {"l": 53.79800000000001, "t": 493.04153, "r": 294.04715, "b": 501.41617, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "DocLayNet, showing that layout predictions of the DocLayNet-", "bbox": {"l": 53.79800000000001, "t": 504.00055, "r": 295.55618, "b": 512.37518, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "trained models are more robust and thus the preferred choice for", "bbox": {"l": 53.79800000000001, "t": 514.95953, "r": 294.21643, "b": 523.33417, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "general-purpose document-layout analysis.", "bbox": {"l": 53.79800000000001, "t": 525.91855, "r": 212.05495, "b": 534.29318, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "CCS CONCEPTS", "bbox": {"l": 53.79800000000001, "t": 550.99692, "r": 134.81989, "b": 561.30602, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "\u2022", "bbox": {"l": 53.79800000000001, "t": 566.19957, "r": 56.945206000000006, "b": 574.57419, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Information systems", "bbox": {"l": 58.440002, "t": 566.0830100000001, "r": 142.4462, "b": 574.5562600000001, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "\u2192", "bbox": {"l": 143.938, "t": 566.36096, "r": 153.15099, "b": 574.43073, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Document structure", "bbox": {"l": 154.646, "t": 566.0830100000001, "r": 235.46015999999997, "b": 574.5562600000001, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "; \u2022", "bbox": {"l": 235.45700000000002, "t": 566.19955, "r": 242.17419, "b": 574.57417, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "Applied com-", "bbox": {"l": 243.66899, "t": 566.08299, "r": 297.85294, "b": 574.55624, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "puting", "bbox": {"l": 53.797989, "t": 577.0419899999999, "r": 80.661324, "b": 585.51524, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "\u2192", "bbox": {"l": 83.565987, "t": 577.3199500000001, "r": 92.778961, "b": 585.38971, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Document analysis", "bbox": {"l": 95.68399, "t": 577.0419899999999, "r": 173.91583, "b": 585.51524, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "; \u2022", "bbox": {"l": 173.916, "t": 577.15855, "r": 182.1272, "b": 585.53317, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Computing methodologies", "bbox": {"l": 185.032, "t": 577.0419899999999, "r": 294.0455, "b": 585.51524, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "\u2192", "bbox": {"l": 53.79800399999999, "t": 588.27895, "r": 63.01097899999999, "b": 596.34871, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "Machine learning", "bbox": {"l": 65.253006, "t": 588.00099, "r": 136.80487, "b": 596.47424, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": ";", "bbox": {"l": 136.80501, "t": 588.1175499999999, "r": 138.92108, "b": 596.49217, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "Computer vision", "bbox": {"l": 141.162, "t": 588.00099, "r": 209.60254, "b": 596.47424, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": ";", "bbox": {"l": 209.60201, "t": 588.1175499999999, "r": 211.71808, "b": 596.49217, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "Object detection", "bbox": {"l": 213.96001, "t": 588.16238, "r": 270.45728, "b": 596.50114, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": ";", "bbox": {"l": 270.48001, "t": 588.1175499999999, "r": 272.59607, "b": 596.49217, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "Permission to make digital or hard copies of part or all of this work for personal or", "bbox": {"l": 53.79800000000001, "t": 634.39838, "r": 294.17697, "b": 640.9119000000001, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "classroom use is granted without fee provided that copies are not made or distributed", "bbox": {"l": 53.79800000000001, "t": 642.36838, "r": 294.04443, "b": 648.8819, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "for profit or commercial advantage and that copies bear this notice and the full citation", "bbox": {"l": 53.79800000000001, "t": 650.33838, "r": 294.04498, "b": 656.8519, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "on the first page. Copyrights for third-party components of this work must be honored.", "bbox": {"l": 53.79800000000001, "t": 658.3083799999999, "r": 295.11798, "b": 664.8219, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "For all other uses, contact the owner/author(s).", "bbox": {"l": 53.79800000000001, "t": 666.27837, "r": 187.72285, "b": 672.79189, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 53.79800000000001, "t": 675.08023, "r": 197.86275, "b": 681.56586, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "\u00a9 2022 Copyright held by the owner/author(s).", "bbox": {"l": 53.317001, "t": 683.81236, "r": 186.74652, "b": 690.32589, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "ACM ISBN 978-1-4503-9385-0/22/08.", "bbox": {"l": 53.554001, "t": 691.78336, "r": 157.03125, "b": 698.29689, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "https://doi.org/10.1145/3534678.3539043", "bbox": {"l": 53.79800000000001, "t": 699.753365, "r": 166.94093, "b": 706.266891, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "13", "bbox": {"l": 327.86951, "t": 351.78085, "r": 330.41248, "b": 353.95465, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "USING THE VERTICAL TUBE -", "bbox": {"l": 327.83005, "t": 331.57268999999997, "r": 351.16092, "b": 333.31171, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "MODELS AY11230/11234", "bbox": {"l": 327.83005, "t": 333.18292, "r": 348.30536, "b": 334.92194, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "1.", "bbox": {"l": 327.83005, "t": 336.40439, "r": 329.05914, "b": 337.92606, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "The vertical tube can be used for", "bbox": {"l": 329.67368, "t": 336.40439, "r": 349.95349, "b": 337.92606, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "instructional viewing or to photograph", "bbox": {"l": 329.11752, "t": 337.83588, "r": 353.57977, "b": 339.35751000000005, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": " the image with a digital camera or a", "bbox": {"l": 327.77121, "t": 339.26736, "r": 352.4306, "b": 340.789, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": " micro TV unit", "bbox": {"l": 328.15176, "t": 340.69882, "r": 337.91086, "b": 342.22049, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "2.", "bbox": {"l": 327.8313, "t": 342.19043000000005, "r": 329.09155, "b": 343.71207, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Loosen the retention screw, then rotate ", "bbox": {"l": 329.72168, "t": 342.19043000000005, "r": 354.9267, "b": 343.71207, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": " the adjustment ring to change the ", "bbox": {"l": 327.8313, "t": 343.62192, "r": 351.66949, "b": 345.14355, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": " length of the vertical tube.", "bbox": {"l": 328.21185, "t": 345.05338, "r": 346.33179, "b": 346.57504, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "3.", "bbox": {"l": 327.83005, "t": 346.84680000000003, "r": 329.12726, "b": 348.36847, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "Make sure that both the images in", "bbox": {"l": 329.77588, "t": 346.84680000000003, "r": 351.18005, "b": 348.36847, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "OPERATION ", "bbox": {"l": 327.25311, "t": 254.94812000000002, "r": 350.07861, "b": 258.86096, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "(", "bbox": {"l": 350.07861, "t": 254.76782000000003, "r": 351.82651, "b": 258.68066, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "cont.", "bbox": {"l": 351.82651, "t": 254.94812000000002, "r": 360.85242, "b": 258.86096, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": ")", "bbox": {"l": 360.85242, "t": 254.76782000000003, "r": 362.60028, "b": 258.68066, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "SELECTING OBJECTIVE ", "bbox": {"l": 326.88037, "t": 263.49492999999995, "r": 345.84351, "b": 265.23395000000005, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "MAGNIFICATION", "bbox": {"l": 326.88037, "t": 265.10515999999996, "r": 340.54153, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "1.", "bbox": {"l": 326.88037, "t": 266.71533, "r": 328.31903, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "There are two objectives. The lower", "bbox": {"l": 329.03836, "t": 266.71533, "r": 354.21472, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": " magnification objective has a greater", "bbox": {"l": 326.88037, "t": 268.32556, "r": 355.19193, "b": 270.06458, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": " depth of field and view.", "bbox": {"l": 326.88037, "t": 269.93579, "r": 345.80057, "b": 271.6748, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "2.", "bbox": {"l": 326.88037, "t": 271.54602, "r": 328.33862, "b": 273.28503, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "In order to observe the specimen", "bbox": {"l": 329.06775, "t": 271.54602, "r": 352.39969, "b": 273.28503, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": " easily use the lower magnification", "bbox": {"l": 326.88037, "t": 273.15619000000004, "r": 352.90042, "b": 274.89526, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": " objective first. Then, by rotating the", "bbox": {"l": 326.88037, "t": 274.76642000000004, "r": 354.59546, "b": 276.50543000000005, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": " case, the magnification can be", "bbox": {"l": 326.88037, "t": 276.37665000000004, "r": 350.81885, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": " changed.", "bbox": {"l": 326.88037, "t": 277.98688000000004, "r": 335.46707, "b": 279.72589000000005, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "CHANGING THE INTERPUPILLARY ", "bbox": {"l": 326.88037, "t": 281.20728, "r": 354.57755, "b": 282.94632, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "DISTANCE", "bbox": {"l": 326.88037, "t": 282.81750000000005, "r": 335.1752, "b": 284.55652, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "1.", "bbox": {"l": 326.88037, "t": 284.4277, "r": 328.34784, "b": 286.16675, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "The distance between the observer's", "bbox": {"l": 329.08157, "t": 284.4277, "r": 354.76245, "b": 286.16675, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": " pupils is the interpupillary distance.", "bbox": {"l": 326.88037, "t": 286.03793, "r": 354.6499, "b": 287.77695, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "2.", "bbox": {"l": 326.88037, "t": 287.64813, "r": 328.25125, "b": 289.38718, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "To adjust the interpupillary distance", "bbox": {"l": 328.93671, "t": 287.64813, "r": 354.29825, "b": 289.38718, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": " rotate the prism caps until both eyes", "bbox": {"l": 326.88181, "t": 289.25836, "r": 355.02075, "b": 290.99738, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": " coincide with the image in the", "bbox": {"l": 326.88181, "t": 290.86855999999995, "r": 350.82028, "b": 292.6076, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": " eyepiece. ", "bbox": {"l": 326.88181, "t": 292.47879, "r": 336.2067, "b": 294.2178, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "FOCUSING", "bbox": {"l": 326.88181, "t": 295.69922, "r": 335.3941, "b": 297.43823, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "1.", "bbox": {"l": 326.88181, "t": 297.30942, "r": 328.34314, "b": 299.04846, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "Remove the lens protective cover.", "bbox": {"l": 329.07379, "t": 297.30942, "r": 353.18555, "b": 299.04846, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "2.", "bbox": {"l": 326.88324, "t": 298.91965, "r": 328.35919, "b": 300.65866, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "Place the specimen on the working", "bbox": {"l": 329.0972, "t": 298.91965, "r": 353.45065, "b": 300.65866, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": " stage.", "bbox": {"l": 326.88324, "t": 300.52985, "r": 333.32825, "b": 302.26889000000006, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "3.", "bbox": {"l": 326.88324, "t": 302.14008000000007, "r": 328.31296, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "Focus the specimen with the left eye", "bbox": {"l": 329.02783, "t": 302.14008000000007, "r": 354.76303, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": " first while turning the focus knob until", "bbox": {"l": 326.88324, "t": 303.75027, "r": 355.96307, "b": 305.48932, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": " the image appears clear and sharp.", "bbox": {"l": 326.88324, "t": 305.3605, "r": 354.46594, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "4.", "bbox": {"l": 326.88324, "t": 306.9707, "r": 328.25488, "b": 308.70975, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "Rotate the right eyepiece ring until the", "bbox": {"l": 328.9407, "t": 306.9707, "r": 356.37335, "b": 308.70975, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": " images in each eyepiece coincide and", "bbox": {"l": 326.88324, "t": 308.58093, "r": 355.38867, "b": 310.31995, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": " are sharp and clear.", "bbox": {"l": 326.88324, "t": 310.19113, "r": 343.17249, "b": 311.93018, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "CHANGING THE BULB", "bbox": {"l": 326.88324, "t": 313.41156, "r": 344.13388, "b": 315.15059999999994, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "1.", "bbox": {"l": 326.88324, "t": 315.02178999999995, "r": 328.37418, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "Disconnect the power cord.", "bbox": {"l": 329.11963, "t": 315.02178999999995, "r": 348.50162, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "2.", "bbox": {"l": 326.88324, "t": 316.63199, "r": 328.34061, "b": 318.37103, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "When the bulb is cool, remove the", "bbox": {"l": 329.06931, "t": 316.63199, "r": 353.11588, "b": 318.37103, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": " oblique illuminator cap and remove", "bbox": {"l": 326.88464, "t": 318.2422199999999, "r": 353.79517, "b": 319.9812299999999, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": " the halogen bulb with cap.", "bbox": {"l": 326.88464, "t": 319.85242000000005, "r": 348.02094, "b": 321.59146, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "3.", "bbox": {"l": 326.88464, "t": 321.46265, "r": 328.37512, "b": 323.20166, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "Replace with a new halogen bulb.", "bbox": {"l": 329.12036, "t": 321.46265, "r": 352.96808, "b": 323.20166, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "4.", "bbox": {"l": 326.88608, "t": 323.07285, "r": 328.36884, "b": 324.81189, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "Open the window in the base plate and", "bbox": {"l": 329.1102, "t": 323.07285, "r": 356.5412, "b": 324.81189, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": " replace the halogen lamp or ", "bbox": {"l": 326.88608, "t": 324.68307000000004, "r": 350.13828, "b": 326.42209, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": " fluorescent lamp of transmitted", "bbox": {"l": 326.88608, "t": 326.29327, "r": 351.59677, "b": 328.03232, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": " illuminator.", "bbox": {"l": 326.88608, "t": 327.9035, "r": 336.89197, "b": 329.64252, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "FOCUSING", "bbox": {"l": 358.42023, "t": 263.49492999999995, "r": 366.93256, "b": 265.23395000000005, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "1.", "bbox": {"l": 358.42023, "t": 265.10515999999996, "r": 359.89841, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "Turn the focusing knob away or toward", "bbox": {"l": 360.63751, "t": 265.10515999999996, "r": 387.98407, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": " you until a clear image is viewed.", "bbox": {"l": 358.42023, "t": 266.71533, "r": 384.58948, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "2.", "bbox": {"l": 358.42166, "t": 268.32556, "r": 359.78549, "b": 270.06458, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "If the image is unclear, adjust the", "bbox": {"l": 360.46741, "t": 268.32556, "r": 384.33441, "b": 270.06458, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": " height of the elevator up or down,", "bbox": {"l": 358.4231, "t": 269.93579, "r": 384.61502, "b": 271.6748, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": " then turn the focusing knob again.", "bbox": {"l": 358.4231, "t": 271.54602, "r": 385.38922, "b": 273.28503, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "ZOOM MAGNIFICATION", "bbox": {"l": 358.4231, "t": 274.76642000000004, "r": 377.35046, "b": 276.50543000000005, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "1.", "bbox": {"l": 358.4231, "t": 276.37665000000004, "r": 359.89429, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "Turn the zoom magnification knob to", "bbox": {"l": 360.62988, "t": 276.37665000000004, "r": 386.37589, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": " the desired magnification and field of", "bbox": {"l": 358.4231, "t": 277.98688000000004, "r": 386.78732, "b": 279.72589000000005, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": " view.", "bbox": {"l": 358.4231, "t": 279.59704999999997, "r": 364.16855, "b": 281.33609, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "2.", "bbox": {"l": 358.4231, "t": 281.20728, "r": 359.86777, "b": 282.94632, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "In most situations, it is recommended", "bbox": {"l": 360.59012, "t": 281.20728, "r": 387.31656, "b": 282.94632, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": " that you focus at the lowest ", "bbox": {"l": 358.4231, "t": 282.81750000000005, "r": 381.56656, "b": 284.55652, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": " magnification, then move to a higher", "bbox": {"l": 358.4231, "t": 284.4277, "r": 386.63403, "b": 286.16675, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": " magnification and re-focus as ", "bbox": {"l": 358.42453, "t": 286.03793, "r": 382.77115, "b": 287.77695, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": " necessary.", "bbox": {"l": 358.42453, "t": 287.64813, "r": 367.98694, "b": 289.38718, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "3.", "bbox": {"l": 358.42453, "t": 289.25836, "r": 359.80386, "b": 290.99738, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "If the image is not clear to both eyes", "bbox": {"l": 360.49353, "t": 289.25836, "r": 386.70093, "b": 290.99738, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": " at the same time, the diopter ring may", "bbox": {"l": 358.42453, "t": 290.86855999999995, "r": 388.03534, "b": 292.6076, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": " need adjustment.", "bbox": {"l": 358.42453, "t": 292.47879, "r": 373.13724, "b": 294.2178, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "DIOPTER RING ADJUSTMENT", "bbox": {"l": 358.42453, "t": 295.69922, "r": 381.74539, "b": 297.43823, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "1.", "bbox": {"l": 358.42453, "t": 297.30942, "r": 359.83682, "b": 299.04846, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "To adjust the eyepiece for viewing with", "bbox": {"l": 360.54297, "t": 297.30942, "r": 388.08289, "b": 299.04846, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": " or without eyeglasses and for ", "bbox": {"l": 358.42453, "t": 298.91965, "r": 382.73251, "b": 300.65866, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": " differences in acuity between the right", "bbox": {"l": 358.42453, "t": 300.52985, "r": 387.72266, "b": 302.26889000000006, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": " and left eyes, follow the following", "bbox": {"l": 358.42453, "t": 302.14008000000007, "r": 384.1991, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": " steps:", "bbox": {"l": 358.42453, "t": 303.75027, "r": 364.88672, "b": 305.48932, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "a.", "bbox": {"l": 358.42453, "t": 305.3605, "r": 359.95078, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "Observe an image through the left", "bbox": {"l": 361.47699, "t": 305.3605, "r": 386.65988, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": " eyepiece and bring a specific point", "bbox": {"l": 358.42453, "t": 306.9707, "r": 386.7634, "b": 308.70975, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": " into focus using the focus knob.", "bbox": {"l": 358.42453, "t": 308.58093, "r": 385.41354, "b": 310.31995, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "b.", "bbox": {"l": 358.42453, "t": 310.19113, "r": 359.93304, "b": 311.93018, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "By turning the diopter ring ", "bbox": {"l": 361.44156, "t": 310.19113, "r": 382.56085, "b": 311.93018, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": " adjustment for the left eyepiece,", "bbox": {"l": 358.42596, "t": 311.80136, "r": 385.4559, "b": 313.54037, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": " bring the same point into sharp", "bbox": {"l": 358.42596, "t": 313.41156, "r": 384.56122, "b": 315.15059999999994, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": " focus.", "bbox": {"l": 358.42596, "t": 315.02178999999995, "r": 366.74371, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": " c.Then bring the same point into", "bbox": {"l": 358.42596, "t": 316.63199, "r": 383.93884, "b": 318.37103, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": " focus through the right eyepiece", "bbox": {"l": 358.42596, "t": 318.2422199999999, "r": 385.69241, "b": 319.9812299999999, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": " by turning the right diopter ring.", "bbox": {"l": 358.42596, "t": 319.85242000000005, "r": 385.94861, "b": 321.59146, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": " d.With more than one viewer, each", "bbox": {"l": 358.42596, "t": 321.46265, "r": 385.54236, "b": 323.20166, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": " viewer should note their own", "bbox": {"l": 358.42596, "t": 323.07285, "r": 382.98718, "b": 324.81189, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": " diopter ring position for the left", "bbox": {"l": 358.42596, "t": 324.68307000000004, "r": 385.06448, "b": 326.42209, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": " and right eyepieces, then before", "bbox": {"l": 358.42596, "t": 326.29327, "r": 385.20682, "b": 328.03232, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": " viewing set the diopter ring", "bbox": {"l": 358.42596, "t": 327.9035, "r": 382.21964, "b": 329.64252, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": " adjustments to that setting.", "bbox": {"l": 358.42596, "t": 329.5137, "r": 382.63382, "b": 331.25275, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "CHANGING THE BULB", "bbox": {"l": 358.42596, "t": 332.73412999999994, "r": 375.67661, "b": 334.47317999999996, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "1.", "bbox": {"l": 358.42596, "t": 334.34436, "r": 359.90311, "b": 336.08337, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "Disconnect the power cord from the", "bbox": {"l": 360.64169, "t": 334.34436, "r": 385.75333, "b": 336.08337, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": " electrical outlet.", "bbox": {"l": 358.42596, "t": 335.95456, "r": 372.01416, "b": 337.6936, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "2.", "bbox": {"l": 358.42596, "t": 337.56479, "r": 359.88327, "b": 339.3038, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "When the bulb is cool, remove the", "bbox": {"l": 360.61191, "t": 337.56479, "r": 384.65726, "b": 339.3038, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": " oblique illuminator cap and remove", "bbox": {"l": 358.42596, "t": 339.17499, "r": 385.33649, "b": 340.9140300000001, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": " the halogen bulb with cap.", "bbox": {"l": 358.42596, "t": 340.78522, "r": 379.57224, "b": 342.52423, "coord_origin": "TOPLEFT"}}, {"id": 201, "text": "3.", "bbox": {"l": 358.4274, "t": 342.39542, "r": 359.91788, "b": 344.13446000000005, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": "Replace with a new halogen bulb.", "bbox": {"l": 360.66312, "t": 342.39542, "r": 384.5108, "b": 344.13446000000005, "coord_origin": "TOPLEFT"}}, {"id": 203, "text": "4.", "bbox": {"l": 358.42883, "t": 344.00565000000006, "r": 359.92792, "b": 345.74466, "coord_origin": "TOPLEFT"}}, {"id": 204, "text": "Open the window in the base plate", "bbox": {"l": 360.67746, "t": 344.00565000000006, "r": 385.41235, "b": 345.74466, "coord_origin": "TOPLEFT"}}, {"id": 205, "text": " and replace the halogen lamp or", "bbox": {"l": 358.42883, "t": 345.61584, "r": 383.2782, "b": 347.35489, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": " fluorescent lamp of transmitted", "bbox": {"l": 358.42883, "t": 347.22607, "r": 383.13953, "b": 348.96509, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": " illuminator.", "bbox": {"l": 358.42883, "t": 348.83627, "r": 368.43472, "b": 350.57532, "coord_origin": "TOPLEFT"}}, {"id": 208, "text": "Model AY11230", "bbox": {"l": 326.59567, "t": 261.14185, "r": 339.11377, "b": 262.88091999999995, "coord_origin": "TOPLEFT"}}, {"id": 209, "text": "Model AY11234", "bbox": {"l": 358.48605, "t": 261.14185, "r": 371.00415, "b": 262.88091999999995, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": "14", "bbox": {"l": 455.43533, "t": 351.77038999999996, "r": 457.97827000000007, "b": 353.94415, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "Objectives", "bbox": {"l": 408.24518, "t": 275.52673000000004, "r": 414.4234, "b": 276.96020999999996, "coord_origin": "TOPLEFT"}}, {"id": 212, "text": "Revolving Turret", "bbox": {"l": 409.39554, "t": 268.98235999999997, "r": 419.06677, "b": 270.41583, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "Coarse ", "bbox": {"l": 441.3895, "t": 279.12627999999995, "r": 445.87192, "b": 280.55975, "coord_origin": "TOPLEFT"}}, {"id": 214, "text": "Adjustment", "bbox": {"l": 441.3895, "t": 280.30609, "r": 448.22338999999994, "b": 281.7395900000001, "coord_origin": "TOPLEFT"}}, {"id": 215, "text": "Knob", "bbox": {"l": 441.3895, "t": 281.48593, "r": 444.40371999999996, "b": 282.91939999999994, "coord_origin": "TOPLEFT"}}, {"id": 216, "text": "MODEL AY11236", "bbox": {"l": 398.79288, "t": 254.94646999999998, "r": 428.91568, "b": 258.85931000000005, "coord_origin": "TOPLEFT"}}, {"id": 217, "text": "MICROSCOPE USAGE", "bbox": {"l": 398.32535, "t": 305.04291, "r": 435.93542, "b": 308.95572000000004, "coord_origin": "TOPLEFT"}}, {"id": 218, "text": "BARSKA Model AY11236 is a powerful fixed power compound ", "bbox": {"l": 398.08594, "t": 310.35892, "r": 453.72171, "b": 312.53271, "coord_origin": "TOPLEFT"}}, {"id": 219, "text": "microscope designed for biological studies such as specimen ", "bbox": {"l": 398.08594, "t": 312.50586, "r": 453.09939999999995, "b": 314.67966, "coord_origin": "TOPLEFT"}}, {"id": 220, "text": "examination. It can also be used for examining bacteria and", "bbox": {"l": 398.08594, "t": 314.6528, "r": 456.65246999999994, "b": 316.8266, "coord_origin": "TOPLEFT"}}, {"id": 221, "text": "for general clinical and medical studies and other scientific uses. ", "bbox": {"l": 398.08594, "t": 316.79977, "r": 456.73859000000004, "b": 318.97354, "coord_origin": "TOPLEFT"}}, {"id": 222, "text": "CONSTRUCTION", "bbox": {"l": 398.62399, "t": 320.42941, "r": 427.77472, "b": 324.34222000000005, "coord_origin": "TOPLEFT"}}, {"id": 223, "text": "BARSKA Model AY11236 is a fixed power compound microscope.", "bbox": {"l": 398.08594, "t": 326.46069000000006, "r": 456.02639999999997, "b": 328.63449, "coord_origin": "TOPLEFT"}}, {"id": 224, "text": "It is constructed with two optical paths at the same angle. It is ", "bbox": {"l": 398.08414, "t": 328.6076699999999, "r": 455.42238999999995, "b": 330.7814599999999, "coord_origin": "TOPLEFT"}}, {"id": 225, "text": "equipped with transmitted illumination. By using this instrument, ", "bbox": {"l": 398.08414, "t": 330.75461, "r": 457.39844, "b": 332.92841, "coord_origin": "TOPLEFT"}}, {"id": 226, "text": "the user can observe specimens at magnification from 40x to ", "bbox": {"l": 398.08414, "t": 332.90155, "r": 453.97745, "b": 335.07535000000007, "coord_origin": "TOPLEFT"}}, {"id": 227, "text": "1000x by selecting the desired objective lens. Coarse and fine ", "bbox": {"l": 398.08414, "t": 335.04852, "r": 454.70708999999994, "b": 337.22232, "coord_origin": "TOPLEFT"}}, {"id": 228, "text": "focus adjustments provide accuracy and image detail. The rotating ", "bbox": {"l": 398.08414, "t": 337.19547, "r": 458.90240000000006, "b": 339.36926, "coord_origin": "TOPLEFT"}}, {"id": 229, "text": "head allows the user to position the eyepieces for maximum ", "bbox": {"l": 398.08594, "t": 339.34241, "r": 453.0672, "b": 341.5162, "coord_origin": "TOPLEFT"}}, {"id": 230, "text": "viewing comfort and easy access to all adjustment knobs.", "bbox": {"l": 398.08594, "t": 341.48938, "r": 449.63113, "b": 343.66318, "coord_origin": "TOPLEFT"}}, {"id": 231, "text": "Model AY11236", "bbox": {"l": 422.10626, "t": 301.24191, "r": 434.62433000000004, "b": 302.98096, "coord_origin": "TOPLEFT"}}, {"id": 232, "text": "Fine ", "bbox": {"l": 442.01610999999997, "t": 283.08649, "r": 444.8817399999999, "b": 284.51996, "coord_origin": "TOPLEFT"}}, {"id": 233, "text": "Adjustment", "bbox": {"l": 442.01610999999997, "t": 284.2663, "r": 448.85001, "b": 285.69980000000004, "coord_origin": "TOPLEFT"}}, {"id": 234, "text": "Knob", "bbox": {"l": 442.01610999999997, "t": 285.44611, "r": 445.03033000000005, "b": 286.87961, "coord_origin": "TOPLEFT"}}, {"id": 235, "text": "Stage", "bbox": {"l": 408.00577, "t": 279.12579000000005, "r": 411.42212, "b": 280.5593, "coord_origin": "TOPLEFT"}}, {"id": 236, "text": "Condenser ", "bbox": {"l": 404.07172, "t": 280.9144299999999, "r": 410.77707, "b": 282.3479, "coord_origin": "TOPLEFT"}}, {"id": 237, "text": "Focusing", "bbox": {"l": 404.07172, "t": 282.09424, "r": 409.2157, "b": 283.52774, "coord_origin": "TOPLEFT"}}, {"id": 238, "text": "Knob", "bbox": {"l": 404.07172, "t": 283.27408, "r": 407.08594, "b": 284.7075500000001, "coord_origin": "TOPLEFT"}}, {"id": 239, "text": "Eyepiece", "bbox": {"l": 441.81281, "t": 262.32178, "r": 447.03702, "b": 263.75525000000005, "coord_origin": "TOPLEFT"}}, {"id": 240, "text": "Stand", "bbox": {"l": 437.34607, "t": 271.13025000000005, "r": 440.80496, "b": 272.56281, "coord_origin": "TOPLEFT"}}, {"id": 241, "text": "Lamp ", "bbox": {"l": 409.7164, "t": 284.40027, "r": 413.3768, "b": 285.83282, "coord_origin": "TOPLEFT"}}, {"id": 242, "text": "On/Off", "bbox": {"l": 409.7164, "t": 285.83163, "r": 413.68201, "b": 287.26416, "coord_origin": "TOPLEFT"}}, {"id": 243, "text": "Switch", "bbox": {"l": 409.7164, "t": 287.263, "r": 413.6337, "b": 288.69553, "coord_origin": "TOPLEFT"}}, {"id": 244, "text": "Lamp ", "bbox": {"l": 434.8712499999999, "t": 296.7153, "r": 438.53164999999996, "b": 298.14783, "coord_origin": "TOPLEFT"}}, {"id": 245, "text": "Power", "bbox": {"l": 439.52039, "t": 292.18307000000004, "r": 443.08768, "b": 293.61560000000003, "coord_origin": "TOPLEFT"}}, {"id": 246, "text": "Cord", "bbox": {"l": 439.52039, "t": 293.61444, "r": 442.29575, "b": 295.04697, "coord_origin": "TOPLEFT"}}, {"id": 247, "text": "Rotating Head", "bbox": {"l": 413.55829, "t": 264.66089, "r": 421.94913, "b": 266.09344, "coord_origin": "TOPLEFT"}}, {"id": 248, "text": "Stage Clip", "bbox": {"l": 441.84316999999993, "t": 286.90573, "r": 447.87585000000007, "b": 288.33826, "coord_origin": "TOPLEFT"}}, {"id": 249, "text": "Adjustment", "bbox": {"l": 441.84316999999993, "t": 288.3371, "r": 448.67252, "b": 289.76962000000003, "coord_origin": "TOPLEFT"}}, {"id": 250, "text": "Interpupillary Slide Adjustment", "bbox": {"l": 407.2403, "t": 259.86645999999996, "r": 425.79089, "b": 261.29895, "coord_origin": "TOPLEFT"}}, {"id": 251, "text": "Circling Minimums", "bbox": {"l": 449.10074000000003, "t": 378.66302, "r": 466.08835000000005, "b": 380.78412, "coord_origin": "TOPLEFT"}}, {"id": 252, "text": "7", "bbox": {"l": 449.10074000000003, "t": 383.2203999999999, "r": 449.64444, "b": 385.34148999999996, "coord_origin": "TOPLEFT"}}, {"id": 253, "text": "K H U H Z D V D F K D Q J H W R W K H 7 ( 5 3 6 F U L W H U L D L Q W K D W D \u1087H F W V F L U F O L Q J D U H D G L P H Q V L R Q E \\ H [ S D Q G L Q J W K H D U H D V W R S U R Y L G H ", "bbox": {"l": 450.18811, "t": 383.2203999999999, "r": 550.77124, "b": 385.34148999999996, "coord_origin": "TOPLEFT"}}, {"id": 254, "text": "improved obstacle protection. To indicate that the new criteria had been applied to a given procedure, a ", "bbox": {"l": 449.10074000000003, "t": 385.75732, "r": 536.14716, "b": 387.87842, "coord_origin": "TOPLEFT"}}, {"id": 255, "text": " is placed on ", "bbox": {"l": 538.31085, "t": 385.75732, "r": 549.49921, "b": 387.87842, "coord_origin": "TOPLEFT"}}, {"id": 256, "text": "the circling line of minimums. The new circling tables and explanatory information is located in the Legend of the TPP.", "bbox": {"l": 449.10074000000003, "t": 388.03601, "r": 547.58185, "b": 390.1571, "coord_origin": "TOPLEFT"}}, {"id": 257, "text": "7", "bbox": {"l": 449.10074000000003, "t": 393.2128000000001, "r": 449.6163, "b": 395.33386, "coord_origin": "TOPLEFT"}}, {"id": 258, "text": "K H D S S U R D F K H V X V L Q J V W D Q G D U G F L U F O L Q J D S S U R D F K D U H D V F D Q E H L G H Q W L \u00bf H G E \\ W K H D E V H Q F H R I W K H ", "bbox": {"l": 450.1319, "t": 393.2128000000001, "r": 529.53082, "b": 395.33386, "coord_origin": "TOPLEFT"}}, {"id": 259, "text": " on the circling line of ", "bbox": {"l": 532.05829, "t": 393.2128000000001, "r": 550.42261, "b": 395.33386, "coord_origin": "TOPLEFT"}}, {"id": 260, "text": "minima.", "bbox": {"l": 449.10074000000003, "t": 395.49149, "r": 455.74692, "b": 397.61255, "coord_origin": "TOPLEFT"}}, {"id": 261, "text": "$ S S O \\ 6 W D Q G D U G & L U F O L Q J $ S S U R D F K 0 D Q H X Y H U L Q J 5 D G L X V 7 D E O H ", "bbox": {"l": 449.95525999999995, "t": 415.59549, "r": 496.2829, "b": 417.50446, "coord_origin": "TOPLEFT"}}, {"id": 262, "text": "$ S S O \\ ( [ S D Q G H G & L U F O L Q J $ S S U R D F K 0 D Q H X Y H U L Q J $ L U V S D F H 5 D G L X V ", "bbox": {"l": 501.13077, "t": 409.25543, "r": 551.16101, "b": 411.1644, "coord_origin": "TOPLEFT"}}, {"id": 263, "text": "Table", "bbox": {"l": 501.13077, "t": 411.30624, "r": 505.2477999999999, "b": 413.21521, "coord_origin": "TOPLEFT"}}, {"id": 264, "text": "AIRPORT SKETCH", "bbox": {"l": 449.10074000000003, "t": 420.18802, "r": 469.35599, "b": 422.73331, "coord_origin": "TOPLEFT"}}, {"id": 265, "text": "The airport sketch is a depiction of the airport with emphasis on runway pattern and related ", "bbox": {"l": 449.10074000000003, "t": 425.08908, "r": 525.93616, "b": 427.21017, "coord_origin": "TOPLEFT"}}, {"id": 266, "text": "information, positioned in either the lower left or lower right corner of the chart to aid pi-", "bbox": {"l": 449.10074000000003, "t": 427.3678, "r": 522.0343, "b": 429.48886, "coord_origin": "TOPLEFT"}}, {"id": 267, "text": "lot recognition of the airport from the air and to provide some information to aid on ground ", "bbox": {"l": 449.10074000000003, "t": 429.64648, "r": 524.67151, "b": 431.76755, "coord_origin": "TOPLEFT"}}, {"id": 268, "text": "navigation of the airport. The runways are drawn to scale and oriented to true north. Runway ", "bbox": {"l": 449.10074000000003, "t": 431.92514000000006, "r": 527.172, "b": 434.04623, "coord_origin": "TOPLEFT"}}, {"id": 269, "text": "dimensions (length and width) are shown for all active runways.", "bbox": {"l": 449.10074000000003, "t": 434.20383, "r": 502.39545, "b": 436.32492, "coord_origin": "TOPLEFT"}}, {"id": 270, "text": "Runway(s) are depicted based on what type and construction of the runway.", "bbox": {"l": 449.10074000000003, "t": 438.7611999999999, "r": 512.92676, "b": 440.88228999999995, "coord_origin": "TOPLEFT"}}, {"id": 271, "text": "Hard Surface", "bbox": {"l": 449.95525999999995, "t": 444.07001, "r": 460.02307, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}, {"id": 272, "text": "Other Than ", "bbox": {"l": 464.89963, "t": 444.07001, "r": 473.98819, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}, {"id": 273, "text": "Hard Surface", "bbox": {"l": 464.89963, "t": 446.12085, "r": 474.96744, "b": 448.02979, "coord_origin": "TOPLEFT"}}, {"id": 274, "text": "Metal Surface", "bbox": {"l": 478.91357, "t": 444.07001, "r": 489.45648, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}, {"id": 275, "text": "Closed Runway", "bbox": {"l": 493.06420999999995, "t": 444.07001, "r": 505.03076, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}, {"id": 276, "text": "Under Construction", "bbox": {"l": 509.5809, "t": 444.07001, "r": 524.30237, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}, {"id": 277, "text": "Stopways, ", "bbox": {"l": 449.95525999999995, "t": 454.81207, "r": 458.31406, "b": 456.72104, "coord_origin": "TOPLEFT"}}, {"id": 278, "text": "Taxiways, Park-", "bbox": {"l": 449.95525999999995, "t": 456.86288, "r": 461.92083999999994, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}}, {"id": 279, "text": "ing Areas", "bbox": {"l": 449.95525999999995, "t": 458.91373, "r": 457.08014, "b": 460.82268999999997, "coord_origin": "TOPLEFT"}}, {"id": 280, "text": "Displaced ", "bbox": {"l": 464.89963, "t": 454.81207, "r": 472.87732, "b": 456.72104, "coord_origin": "TOPLEFT"}}, {"id": 281, "text": "Threshold", "bbox": {"l": 464.89963, "t": 456.86288, "r": 472.49792, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}}, {"id": 282, "text": "Closed", "bbox": {"l": 478.91357, "t": 454.81207, "r": 483.61584, "b": 456.72104, "coord_origin": "TOPLEFT"}}, {"id": 283, "text": "Pavement", "bbox": {"l": 478.91357, "t": 456.86288, "r": 486.60754000000003, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}}, {"id": 284, "text": "Water Runway", "bbox": {"l": 493.06420999999995, "t": 454.81207, "r": 504.20648, "b": 456.72104, "coord_origin": "TOPLEFT"}}, {"id": 285, "text": "Taxiways and aprons are shaded grey. Other runway features that may be shown are runway numbers, runway dimen-", "bbox": {"l": 449.10074000000003, "t": 469.32974, "r": 548.59674, "b": 471.45081, "coord_origin": "TOPLEFT"}}, {"id": 286, "text": "sions, runway slope, arresting gear, and displaced threshold.", "bbox": {"l": 449.10074000000003, "t": 471.60843, "r": 500.08181999999994, "b": 473.72949, "coord_origin": "TOPLEFT"}}, {"id": 287, "text": "2", "bbox": {"l": 449.10074000000003, "t": 476.16577, "r": 449.59933000000007, "b": 478.28687, "coord_origin": "TOPLEFT"}}, {"id": 288, "text": "W K H U L Q I R U P D W L R Q F R Q F H U Q L Q J O L J K W L Q J \u00bf Q D O D S S U R D F K E H D U L Q J V D L U S R U W E H D F R Q R E V W D F O H V F R Q W U R O W R Z H U 1 $ 9 $ , ' V K H O L ", "bbox": {"l": 450.09796, "t": 476.16577, "r": 547.82562, "b": 478.28687, "coord_origin": "TOPLEFT"}}, {"id": 289, "text": "-", "bbox": {"l": 547.82623, "t": 476.16577, "r": 548.45862, "b": 478.28687, "coord_origin": "TOPLEFT"}}, {"id": 290, "text": "pads may also be shown.", "bbox": {"l": 449.10074000000003, "t": 478.44446, "r": 470.52609000000007, "b": 480.56555, "coord_origin": "TOPLEFT"}}, {"id": 291, "text": "$ L U S R U W ( O H Y D W L R Q D Q G 7 R X F K G R Z Q = R Q H ( O H Y D W L R Q ", "bbox": {"l": 449.10074000000003, "t": 483.00183, "r": 493.37906000000004, "b": 485.12292, "coord_origin": "TOPLEFT"}}, {"id": 292, "text": "The airport elevation is shown enclosed within a box in the upper left corner of the sketch box and the touchdown zone ", "bbox": {"l": 449.10074000000003, "t": 487.5592, "r": 549.16168, "b": 489.6803, "coord_origin": "TOPLEFT"}}, {"id": 293, "text": "elevation (TDZE) is shown in the upper right corner of the sketch box. The airport elevation is the highest point of an ", "bbox": {"l": 449.10074000000003, "t": 489.83789, "r": 546.90881, "b": 491.95898, "coord_origin": "TOPLEFT"}}, {"id": 294, "text": "D L U S R U W \u00b6 V X V D E O H U X Q Z D \\ V P H D V X U H G L Q I H H W I U R P P H D Q V H D O H Y H O 7 K H 7 ' = ( L V W K H K L J K H V W H O H Y D W L R Q L Q W K H \u00bf U V W I H H W R I ", "bbox": {"l": 449.10074000000003, "t": 492.11658, "r": 551.80023, "b": 494.23767, "coord_origin": "TOPLEFT"}}, {"id": 295, "text": "the landing surface. Circling only approaches will not show a TDZE.", "bbox": {"l": 449.10074000000003, "t": 494.39526, "r": 505.85068000000007, "b": 496.51636, "coord_origin": "TOPLEFT"}}, {"id": 296, "text": "114", "bbox": {"l": 498.80661000000003, "t": 515.9437, "r": 502.08792, "b": 519.01764, "coord_origin": "TOPLEFT"}}, {"id": 297, "text": "FAA Chart Users\u2019 Guide - Terminal Procedures Publication (TPP) - Terms", "bbox": {"l": 444.56319999999994, "t": 422.84869, "r": 446.25998, "b": 471.87128, "coord_origin": "TOPLEFT"}}, {"id": 298, "text": "AGL 2013 Financial Calendar", "bbox": {"l": 329.40536, "t": 379.37537, "r": 355.13138, "b": 382.13336, "coord_origin": "TOPLEFT"}}, {"id": 299, "text": "22", "bbox": {"l": 329.40536, "t": 382.30273, "r": 330.96848, "b": 384.55927, "coord_origin": "TOPLEFT"}}, {"id": 300, "text": "August 2012 ", "bbox": {"l": 331.75003, "t": 382.30273, "r": 341.12875, "b": 384.55927, "coord_origin": "TOPLEFT"}}, {"id": 301, "text": "2012 full year result and fi nal dividend announced", "bbox": {"l": 350.4722, "t": 382.30273, "r": 384.81079, "b": 384.55927, "coord_origin": "TOPLEFT"}}, {"id": 302, "text": "30", "bbox": {"l": 329.40536, "t": 384.84552, "r": 330.97336, "b": 387.10205, "coord_origin": "TOPLEFT"}}, {"id": 303, "text": "August 2012 ", "bbox": {"l": 331.75735, "t": 384.84552, "r": 341.16534, "b": 387.10205, "coord_origin": "TOPLEFT"}}, {"id": 304, "text": "Ex-dividend trading commences", "bbox": {"l": 350.4722, "t": 384.84552, "r": 372.90613, "b": 387.10205, "coord_origin": "TOPLEFT"}}, {"id": 305, "text": "5", "bbox": {"l": 329.40536, "t": 387.38828, "r": 330.20337, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}}, {"id": 306, "text": "September 2012 ", "bbox": {"l": 331.00137, "t": 387.38828, "r": 342.9715, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}}, {"id": 307, "text": "Record date for 2012 fi nal dividend", "bbox": {"l": 350.4722, "t": 387.38828, "r": 374.88693, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}}, {"id": 308, "text": "27", "bbox": {"l": 329.40536, "t": 389.93103, "r": 331.0173, "b": 392.18762, "coord_origin": "TOPLEFT"}}, {"id": 309, "text": "September 2012 ", "bbox": {"l": 331.82327, "t": 389.93103, "r": 343.91284, "b": 392.18762, "coord_origin": "TOPLEFT"}}, {"id": 310, "text": "Final dividend payable", "bbox": {"l": 350.4722, "t": 389.93103, "r": 365.65988, "b": 392.18762, "coord_origin": "TOPLEFT"}}, {"id": 311, "text": "23", "bbox": {"l": 329.40536, "t": 392.47382, "r": 330.98804, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}}, {"id": 312, "text": "October 2012 ", "bbox": {"l": 331.77936, "t": 392.47382, "r": 342.06674, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}}, {"id": 313, "text": "Annual General Meeting", "bbox": {"l": 350.4722, "t": 392.47382, "r": 367.22156, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}}, {"id": 314, "text": "27", "bbox": {"l": 329.40536, "t": 395.0166, "r": 330.99741, "b": 397.27313, "coord_origin": "TOPLEFT"}}, {"id": 315, "text": "February 2013", "bbox": {"l": 331.7934, "t": 395.0166, "r": 342.1416, "b": 397.27313, "coord_origin": "TOPLEFT"}}, {"id": 316, "text": " 1", "bbox": {"l": 342.64841, "t": 395.18298, "r": 342.65811, "b": 396.49857000000003, "coord_origin": "TOPLEFT"}}, {"id": 317, "text": "2013 interim result and interim dividend announced", "bbox": {"l": 350.47177, "t": 395.01474, "r": 386.25897, "b": 397.2713, "coord_origin": "TOPLEFT"}}, {"id": 318, "text": "28", "bbox": {"l": 329.40491, "t": 397.55749999999995, "r": 331.02695, "b": 399.81406, "coord_origin": "TOPLEFT"}}, {"id": 319, "text": "August 2013", "bbox": {"l": 331.83795, "t": 397.55749999999995, "r": 340.75909, "b": 399.81406, "coord_origin": "TOPLEFT"}}, {"id": 320, "text": " 1", "bbox": {"l": 341.26437, "t": 397.7254, "r": 341.27408, "b": 399.04095, "coord_origin": "TOPLEFT"}}, {"id": 321, "text": "2013 full year results and fi nal dividend announced ", "bbox": {"l": 350.47144, "t": 397.55713, "r": 385.93265, "b": 399.81369, "coord_origin": "TOPLEFT"}}, {"id": 322, "text": "1", "bbox": {"l": 329.40536, "t": 400.46155, "r": 329.87708, "b": 401.96588, "coord_origin": "TOPLEFT"}}, {"id": 323, "text": "Indicative dates only, subject to change/Board confi rmation", "bbox": {"l": 330.34882, "t": 400.46155, "r": 358.65204, "b": 401.96588, "coord_origin": "TOPLEFT"}}, {"id": 324, "text": "AGL\u2019s Annual General Meeting will be held at the City Recital Hall, Angel Place, Sydney ", "bbox": {"l": 329.40536, "t": 404.34503, "r": 391.771, "b": 406.60156, "coord_origin": "TOPLEFT"}}, {"id": 325, "text": "commencing at 10.30am on Tuesday 23 October 2012.", "bbox": {"l": 329.40536, "t": 406.37857, "r": 369.65308, "b": 408.63513000000006, "coord_origin": "TOPLEFT"}}, {"id": 326, "text": "Ye s te rd ay", "bbox": {"l": 363.54486, "t": 460.53054999999995, "r": 379.25955, "b": 465.54507, "coord_origin": "TOPLEFT"}}, {"id": 327, "text": "Established in Sydney in 1837, and then ", "bbox": {"l": 363.54486, "t": 466.7157, "r": 391.38229, "b": 468.97223, "coord_origin": "TOPLEFT"}}, {"id": 328, "text": "known as The Australian Gas Light Company, ", "bbox": {"l": 363.54486, "t": 468.74924, "r": 395.01788, "b": 471.00577, "coord_origin": "TOPLEFT"}}, {"id": 329, "text": "the AGL business has an established history ", "bbox": {"l": 363.54486, "t": 470.78281, "r": 394.08322, "b": 473.03934, "coord_origin": "TOPLEFT"}}, {"id": 330, "text": "and reputation for serving the gas and ", "bbox": {"l": 363.54486, "t": 472.81635, "r": 390.60727, "b": 475.07288, "coord_origin": "TOPLEFT"}}, {"id": 331, "text": "electricity needs of Australian households. ", "bbox": {"l": 363.54486, "t": 474.84988, "r": 393.49612, "b": 477.10645, "coord_origin": "TOPLEFT"}}, {"id": 332, "text": "In 1841, when AGL supplied the gas to light ", "bbox": {"l": 363.54486, "t": 476.88345, "r": 394.11481, "b": 479.13998, "coord_origin": "TOPLEFT"}}, {"id": 333, "text": "the fi rst public street lamp, it was reported ", "bbox": {"l": 363.54486, "t": 478.91699, "r": 393.75891, "b": 481.17352, "coord_origin": "TOPLEFT"}}, {"id": 334, "text": "in the Sydney Gazette as a \u201cwonderful ", "bbox": {"l": 363.54486, "t": 480.95053, "r": 390.4975, "b": 483.20709, "coord_origin": "TOPLEFT"}}, {"id": 335, "text": "achievement of scientifi c knowledge, assisted ", "bbox": {"l": 363.54486, "t": 482.9841, "r": 395.70975, "b": 485.24063, "coord_origin": "TOPLEFT"}}, {"id": 336, "text": "by mechanical ingenuity.\u201d Within two years, ", "bbox": {"l": 363.54486, "t": 485.01764, "r": 394.27283, "b": 487.2742, "coord_origin": "TOPLEFT"}}, {"id": 337, "text": "165 gas lamps were lighting the City of Sydney.", "bbox": {"l": 363.54486, "t": 487.05121, "r": 396.65939, "b": 489.30774, "coord_origin": "TOPLEFT"}}, {"id": 338, "text": "Looking back on ", "bbox": {"l": 329.4054, "t": 419.93124, "r": 384.19696, "b": 431.09412, "coord_origin": "TOPLEFT"}}, {"id": 339, "text": "175 years of ", "bbox": {"l": 329.4054, "t": 430.10379, "r": 372.16626, "b": 441.26669, "coord_origin": "TOPLEFT"}}, {"id": 340, "text": "looking forward.", "bbox": {"l": 329.4054, "t": 440.27636999999993, "r": 385.3981, "b": 451.43924, "coord_origin": "TOPLEFT"}}, {"id": 341, "text": "AGL Energy Limited ABN 74 115 061 375", "bbox": {"l": 329.40536, "t": 372.16159, "r": 353.36179, "b": 373.91669, "coord_origin": "TOPLEFT"}}, {"id": 342, "text": "29", "bbox": {"l": 546.20587, "t": 360.90448, "r": 548.23407, "b": 362.82242, "coord_origin": "TOPLEFT"}}, {"id": 343, "text": "signs, signals and road markings", "bbox": {"l": 497.77728, "t": 251.43384000000003, "r": 542.8255, "b": 254.94385, "coord_origin": "TOPLEFT"}}, {"id": 344, "text": "3", "bbox": {"l": 490.30679, "t": 251.47478999999998, "r": 492.09982, "b": 254.98479999999995, "coord_origin": "TOPLEFT"}}, {"id": 345, "text": "In ", "bbox": {"l": 498.15335, "t": 263.88922, "r": 500.05637, "b": 265.92719, "coord_origin": "TOPLEFT"}}, {"id": 346, "text": "chapter 2, you and your vehicle", "bbox": {"l": 500.05637, "t": 263.85717999999997, "r": 524.37036, "b": 265.86310000000003, "coord_origin": "TOPLEFT"}}, {"id": 347, "text": ", you learned about ", "bbox": {"l": 524.37036, "t": 263.88922, "r": 539.89124, "b": 265.92719, "coord_origin": "TOPLEFT"}}, {"id": 348, "text": "some of the controls in your vehicle. This chapter is a handy ", "bbox": {"l": 498.15335, "t": 265.93224999999995, "r": 544.50403, "b": 267.97020999999995, "coord_origin": "TOPLEFT"}}, {"id": 349, "text": "reference section that gives examples of the most common ", "bbox": {"l": 498.15335, "t": 267.97533999999996, "r": 544.01343, "b": 270.01331000000005, "coord_origin": "TOPLEFT"}}, {"id": 350, "text": "signs, signals and road markings that keep traffi c organized ", "bbox": {"l": 498.15335, "t": 270.01831000000004, "r": 544.11987, "b": 272.05634, "coord_origin": "TOPLEFT"}}, {"id": 351, "text": "and flowing smoothly. ", "bbox": {"l": 498.15335, "t": 272.06140000000005, "r": 515.41071, "b": 274.09937, "coord_origin": "TOPLEFT"}}, {"id": 352, "text": "Signs", "bbox": {"l": 498.15335, "t": 277.34619, "r": 505.64642000000003, "b": 280.9357, "coord_origin": "TOPLEFT"}}, {"id": 353, "text": "There are three ways to read signs: by their shape, colour and ", "bbox": {"l": 498.15335, "t": 281.82187, "r": 543.92957, "b": 283.85983, "coord_origin": "TOPLEFT"}}, {"id": 354, "text": "the messages printed on them. Understanding these three ways ", "bbox": {"l": 498.15335, "t": 283.8649, "r": 545.67834, "b": 285.90289, "coord_origin": "TOPLEFT"}}, {"id": 355, "text": "of classifying signs will help you figure out the meaning of signs ", "bbox": {"l": 498.15335, "t": 285.90796, "r": 545.26471, "b": 287.94592, "coord_origin": "TOPLEFT"}}, {"id": 356, "text": "that are new to you. ", "bbox": {"l": 498.15335, "t": 287.95099, "r": 513.31335, "b": 289.98895, "coord_origin": "TOPLEFT"}}, {"id": 357, "text": "Stop", "bbox": {"l": 505.43439, "t": 303.07596, "r": 508.53033000000005, "b": 304.89639, "coord_origin": "TOPLEFT"}}, {"id": 358, "text": "Yield the right-of-way", "bbox": {"l": 527.45502, "t": 303.25354, "r": 541.44678, "b": 305.07397, "coord_origin": "TOPLEFT"}}, {"id": 359, "text": "Shows driving", "bbox": {"l": 501.79385, "t": 321.18973, "r": 510.41632, "b": 323.01016, "coord_origin": "TOPLEFT"}}, {"id": 360, "text": "regulations", "bbox": {"l": 501.79385, "t": 322.87731999999994, "r": 509.04268999999994, "b": 324.69775000000004, "coord_origin": "TOPLEFT"}}, {"id": 361, "text": "Explains lane use", "bbox": {"l": 518.66455, "t": 319.59146, "r": 529.80902, "b": 321.41190000000006, "coord_origin": "TOPLEFT"}}, {"id": 362, "text": "School zone signs ", "bbox": {"l": 534.87561, "t": 318.37616, "r": 546.95142, "b": 320.19659, "coord_origin": "TOPLEFT"}}, {"id": 363, "text": "are fl uorescent ", "bbox": {"l": 534.87561, "t": 320.0637500000001, "r": 545.05762, "b": 321.88419, "coord_origin": "TOPLEFT"}}, {"id": 364, "text": "yellow-green", "bbox": {"l": 534.87561, "t": 321.75134, "r": 543.32263, "b": 323.57178, "coord_origin": "TOPLEFT"}}, {"id": 365, "text": "Tells about motorist ", "bbox": {"l": 499.21862999999996, "t": 338.12772, "r": 512.62451, "b": 339.94815, "coord_origin": "TOPLEFT"}}, {"id": 366, "text": "services", "bbox": {"l": 499.21862999999996, "t": 339.81531000000007, "r": 504.39917, "b": 341.63574, "coord_origin": "TOPLEFT"}}, {"id": 367, "text": "Shows a permitted ", "bbox": {"l": 516.97748, "t": 338.06039, "r": 529.77484, "b": 339.88082999999995, "coord_origin": "TOPLEFT"}}, {"id": 368, "text": "action", "bbox": {"l": 516.97748, "t": 339.74799, "r": 520.96399, "b": 341.56842, "coord_origin": "TOPLEFT"}}, {"id": 369, "text": "Shows an action that ", "bbox": {"l": 534.55847, "t": 337.88281, "r": 548.58453, "b": 339.7032500000001, "coord_origin": "TOPLEFT"}}, {"id": 370, "text": "is not permitted", "bbox": {"l": 534.55847, "t": 339.57040000000006, "r": 545.08862, "b": 341.39084, "coord_origin": "TOPLEFT"}}, {"id": 371, "text": "Warns of hazards ", "bbox": {"l": 483.05853, "t": 356.17416, "r": 494.72577, "b": 357.9946, "coord_origin": "TOPLEFT"}}, {"id": 372, "text": "ahead", "bbox": {"l": 483.05853, "t": 357.86179, "r": 487.07525999999996, "b": 359.68222, "coord_origin": "TOPLEFT"}}, {"id": 373, "text": "Warns of", "bbox": {"l": 499.39645, "t": 356.26297000000005, "r": 504.69171, "b": 358.0834, "coord_origin": "TOPLEFT"}}, {"id": 374, "text": "construction zones", "bbox": {"l": 499.39645, "t": 357.95056, "r": 511.69116, "b": 359.77099999999996, "coord_origin": "TOPLEFT"}}, {"id": 375, "text": "Railway crossing", "bbox": {"l": 516.75891, "t": 356.26297000000005, "r": 527.42938, "b": 358.0834, "coord_origin": "TOPLEFT"}}, {"id": 376, "text": "Shows distance and ", "bbox": {"l": 534.5141, "t": 352.92981, "r": 547.89862, "b": 354.75024, "coord_origin": "TOPLEFT"}}, {"id": 377, "text": "direction", "bbox": {"l": 534.5141, "t": 354.6174, "r": 540.2818, "b": 356.43784, "coord_origin": "TOPLEFT"}}, {"id": 378, "text": "\u2022", "bbox": {"l": 478.37466, "t": 270.14075, "r": 479.14251999999993, "b": 272.17877, "coord_origin": "TOPLEFT"}}, {"id": 379, "text": "Signs", "bbox": {"l": 479.91036999999994, "t": 270.14075, "r": 483.74963, "b": 272.17877, "coord_origin": "TOPLEFT"}}, {"id": 380, "text": "- regulatory signs", "bbox": {"l": 479.97293, "t": 272.84717, "r": 492.31219, "b": 274.34888, "coord_origin": "TOPLEFT"}}, {"id": 381, "text": "- school, ", "bbox": {"l": 479.97293, "t": 275.14513999999997, "r": 486.72598000000005, "b": 276.64679, "coord_origin": "TOPLEFT"}}, {"id": 382, "text": "playground and ", "bbox": {"l": 481.21602999999993, "t": 276.77972, "r": 492.93286000000006, "b": 278.81768999999997, "coord_origin": "TOPLEFT"}}, {"id": 383, "text": "crosswalk signs", "bbox": {"l": 481.21602999999993, "t": 278.82275000000004, "r": 491.82938000000007, "b": 280.86075, "coord_origin": "TOPLEFT"}}, {"id": 384, "text": "- lane use signs", "bbox": {"l": 479.97293, "t": 281.52759, "r": 491.00775000000004, "b": 283.02924, "coord_origin": "TOPLEFT"}}, {"id": 385, "text": "- turn control signs", "bbox": {"l": 479.97293, "t": 283.82556, "r": 493.32748, "b": 285.3272099999999, "coord_origin": "TOPLEFT"}}, {"id": 386, "text": "- parking signs", "bbox": {"l": 479.97293, "t": 286.1235, "r": 490.4915199999999, "b": 287.62518, "coord_origin": "TOPLEFT"}}, {"id": 387, "text": "- reserved lane ", "bbox": {"l": 479.97293, "t": 288.42148, "r": 491.17004000000003, "b": 289.92316, "coord_origin": "TOPLEFT"}}, {"id": 388, "text": "signs", "bbox": {"l": 481.21602999999993, "t": 290.05605999999995, "r": 484.77405000000005, "b": 292.09406, "coord_origin": "TOPLEFT"}}, {"id": 389, "text": "- warning signs", "bbox": {"l": 479.97293, "t": 292.76169000000004, "r": 490.83398, "b": 294.26334, "coord_origin": "TOPLEFT"}}, {"id": 390, "text": "- object markers", "bbox": {"l": 479.97293, "t": 295.05963, "r": 491.62692, "b": 296.56131, "coord_origin": "TOPLEFT"}}, {"id": 391, "text": "- construction ", "bbox": {"l": 479.97293, "t": 297.3576, "r": 490.37341, "b": 298.8592499999999, "coord_origin": "TOPLEFT"}}, {"id": 392, "text": "signs", "bbox": {"l": 481.21602999999993, "t": 298.99219, "r": 484.77405000000005, "b": 301.03015, "coord_origin": "TOPLEFT"}}, {"id": 393, "text": "- information and ", "bbox": {"l": 479.97293, "t": 301.69780999999995, "r": 492.93912, "b": 303.19946, "coord_origin": "TOPLEFT"}}, {"id": 394, "text": "destination signs", "bbox": {"l": 481.21602999999993, "t": 303.3324, "r": 493.00525, "b": 305.37036, "coord_origin": "TOPLEFT"}}, {"id": 395, "text": "- railway signs", "bbox": {"l": 479.97293, "t": 306.0379899999999, "r": 489.99047999999993, "b": 307.53967, "coord_origin": "TOPLEFT"}}, {"id": 396, "text": "\u2022", "bbox": {"l": 478.375, "t": 308.24789, "r": 479.1032400000001, "b": 310.28586, "coord_origin": "TOPLEFT"}}, {"id": 397, "text": "Signals", "bbox": {"l": 479.83151, "t": 308.24789, "r": 484.92925999999994, "b": 310.28586, "coord_origin": "TOPLEFT"}}, {"id": 398, "text": "- lane control ", "bbox": {"l": 479.97293, "t": 310.95358, "r": 490.00091999999995, "b": 312.45526, "coord_origin": "TOPLEFT"}}, {"id": 399, "text": "signals", "bbox": {"l": 481.21602999999993, "t": 312.5881999999999, "r": 485.95331, "b": 314.62616, "coord_origin": "TOPLEFT"}}, {"id": 400, "text": "- traffic lights", "bbox": {"l": 479.97293, "t": 315.29379, "r": 489.29876999999993, "b": 316.79544, "coord_origin": "TOPLEFT"}}, {"id": 401, "text": "\u2022", "bbox": {"l": 478.375, "t": 317.50366, "r": 479.18129999999996, "b": 319.5416599999999, "coord_origin": "TOPLEFT"}}, {"id": 402, "text": "Road markings", "bbox": {"l": 479.98761, "t": 317.50366, "r": 490.46960000000007, "b": 319.5416599999999, "coord_origin": "TOPLEFT"}}, {"id": 403, "text": "- yellow lines", "bbox": {"l": 479.97293, "t": 320.20938, "r": 489.26166000000006, "b": 321.71103, "coord_origin": "TOPLEFT"}}, {"id": 404, "text": "- white lines", "bbox": {"l": 479.97293, "t": 322.50732, "r": 488.59189, "b": 324.009, "coord_origin": "TOPLEFT"}}, {"id": 405, "text": "- reserved lane ", "bbox": {"l": 479.97293, "t": 324.8053, "r": 491.17004000000003, "b": 326.30698, "coord_origin": "TOPLEFT"}}, {"id": 406, "text": "markings", "bbox": {"l": 481.21602999999993, "t": 326.43988, "r": 487.58978, "b": 328.47784, "coord_origin": "TOPLEFT"}}, {"id": 407, "text": "- other markings", "bbox": {"l": 479.97293, "t": 329.14551, "r": 491.75177, "b": 330.64716, "coord_origin": "TOPLEFT"}}, {"id": 408, "text": "in this chapter", "bbox": {"l": 478.15246999999994, "t": 265.07030999999995, "r": 493.75586, "b": 268.06872999999996, "coord_origin": "TOPLEFT"}}, {"id": 409, "text": "Figure 1: Four examples of complex page layouts across dif-", "bbox": {"l": 317.95499, "t": 540.08299, "r": 559.80579, "b": 548.55624, "coord_origin": "TOPLEFT"}}, {"id": 410, "text": "ferent document categories", "bbox": {"l": 317.95499, "t": 551.0419899999999, "r": 428.69907, "b": 559.51524, "coord_origin": "TOPLEFT"}}, {"id": 411, "text": "KEYWORDS", "bbox": {"l": 317.95499, "t": 592.46591, "r": 379.8205, "b": 602.7750100000001, "coord_origin": "TOPLEFT"}}, {"id": 412, "text": "PDF document conversion, layout segmentation, object-detection,", "bbox": {"l": 317.95499, "t": 607.66756, "r": 559.18597, "b": 616.04218, "coord_origin": "TOPLEFT"}}, {"id": 413, "text": "data set, Machine Learning", "bbox": {"l": 317.95499, "t": 618.62656, "r": 416.94403, "b": 627.00117, "coord_origin": "TOPLEFT"}}, {"id": 414, "text": "ACM Reference Format:", "bbox": {"l": 317.65997, "t": 640.05434, "r": 404.65366, "b": 647.58609, "coord_origin": "TOPLEFT"}}, {"id": 415, "text": "Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter", "bbox": {"l": 317.95499, "t": 650.11996, "r": 558.35266, "b": 657.56404, "coord_origin": "TOPLEFT"}}, {"id": 416, "text": "Staar. 2022. DocLayNet: A Large Human-Annotated Dataset for Document-", "bbox": {"l": 317.95499, "t": 660.08296, "r": 559.5495, "b": 667.52703, "coord_origin": "TOPLEFT"}}, {"id": 417, "text": "Layout Analysis. In", "bbox": {"l": 317.95499, "t": 670.04497, "r": 383.30807, "b": 677.48904, "coord_origin": "TOPLEFT"}}, {"id": 418, "text": "Proceedings of the 28th ACM SIGKDD Conference on", "bbox": {"l": 385.798, "t": 670.08482, "r": 558.20032, "b": 677.49701, "coord_origin": "TOPLEFT"}}, {"id": 419, "text": "Knowledge Discovery and Data Mining (KDD \u201922), August 14-18, 2022, Wash-", "bbox": {"l": 317.95499, "t": 680.04781, "r": 559.00092, "b": 687.46001, "coord_origin": "TOPLEFT"}}, {"id": 420, "text": "ington, DC, USA.", "bbox": {"l": 317.95499, "t": 690.01081, "r": 370.11481, "b": 697.423004, "coord_origin": "TOPLEFT"}}, {"id": 421, "text": "ACM, New York, NY, USA, 9 pages. https://doi.org/10.1145/", "bbox": {"l": 371.82999, "t": 689.97096, "r": 558.71655, "b": 697.415031, "coord_origin": "TOPLEFT"}}, {"id": 422, "text": "3534678.3539043", "bbox": {"l": 317.95499, "t": 699.932953, "r": 371.59375, "b": 707.377029, "coord_origin": "TOPLEFT"}}, {"id": 423, "text": "arXiv:2206.01062v1 [cs.CV] 2 Jun 2022", "bbox": {"l": 18.34021, "t": 218.35999000000004, "r": 36.339794, "b": 555.00003, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 12, "label": "section_header", "bbox": {"l": 107.29999999999998, "t": 83.69470000000013, "r": 505.06195, "b": 119.59558000000015, "coord_origin": "TOPLEFT"}, "confidence": 0.8416302800178528, "cells": [{"id": 0, "text": "DocLayNet: A Large Human-Annotated Dataset for", "bbox": {"l": 107.29999999999998, "t": 83.69470000000013, "r": 505.06195, "b": 99.67058999999995, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Document-Layout Analysis", "bbox": {"l": 200.117, "t": 103.6196900000001, "r": 411.88367, "b": 119.59558000000015, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "text", "bbox": {"l": 90.96701, "t": 133.67236000000003, "r": 193.73123, "b": 180.24030000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.8637151718139648, "cells": [{"id": 2, "text": "Birgit Pfitzmann", "bbox": {"l": 102.06001, "t": 133.67236000000003, "r": 182.63805, "b": 144.83856000000003, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "IBM Research", "bbox": {"l": 114.29401000000001, "t": 147.02423, "r": 170.40337, "b": 156.32928000000004, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Rueschlikon, Switzerland", "bbox": {"l": 90.96701, "t": 158.97924999999998, "r": 193.73123, "b": 168.28430000000003, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "bpf@zurich.ibm.com", "bbox": {"l": 100.02301, "t": 170.93524000000002, "r": 184.67522, "b": 180.24030000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 255.11602999999997, "t": 133.67236000000003, "r": 357.88025, "b": 180.24030000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.8612664937973022, "cells": [{"id": 6, "text": "Christoph Auer", "bbox": {"l": 268.62402, "t": 133.67236000000003, "r": 344.59933, "b": 144.83856000000003, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "IBM Research", "bbox": {"l": 278.44302, "t": 147.02423, "r": 334.55237, "b": 156.32928000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Rueschlikon, Switzerland", "bbox": {"l": 255.11602999999997, "t": 158.97924999999998, "r": 357.88025, "b": 168.28430000000003, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "cau@zurich.ibm.com", "bbox": {"l": 263.70404, "t": 170.93524000000002, "r": 349.29272, "b": 180.24030000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "text", "bbox": {"l": 419.26505, "t": 133.67236000000003, "r": 522.0293, "b": 180.24030000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.8760607242584229, "cells": [{"id": 10, "text": "Michele Dolfi", "bbox": {"l": 437.6930500000001, "t": 133.67236000000003, "r": 503.60208, "b": 144.83856000000003, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "IBM Research", "bbox": {"l": 442.59305000000006, "t": 147.02423, "r": 498.7023899999999, "b": 156.32928000000004, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Rueschlikon, Switzerland", "bbox": {"l": 419.26505, "t": 158.97924999999998, "r": 522.0293, "b": 168.28430000000003, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "dol@zurich.ibm.com", "bbox": {"l": 428.56104000000005, "t": 170.93524000000002, "r": 512.73505, "b": 180.24030000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 172.54303, "t": 192.05737, "r": 275.30725, "b": 238.62531, "coord_origin": "TOPLEFT"}, "confidence": 0.8319916129112244, "cells": [{"id": 14, "text": "Ahmed S. Nassar", "bbox": {"l": 182.26804, "t": 192.05737, "r": 265.39255, "b": 203.22357, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "IBM Research", "bbox": {"l": 195.87103, "t": 205.40923999999995, "r": 251.98038999999997, "b": 214.71429, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Rueschlikon, Switzerland", "bbox": {"l": 172.54303, "t": 217.36425999999994, "r": 275.30725, "b": 226.66931, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "ahn@zurich.ibm.com", "bbox": {"l": 180.52803, "t": 229.32025, "r": 267.3222, "b": 238.62531, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 336.69302, "t": 192.05737, "r": 439.45727999999997, "b": 238.62531, "coord_origin": "TOPLEFT"}, "confidence": 0.8027974367141724, "cells": [{"id": 18, "text": "Peter Staar", "bbox": {"l": 361.52802, "t": 192.05737, "r": 414.84821, "b": 203.22357, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "IBM Research", "bbox": {"l": 360.02002, "t": 205.40923999999995, "r": 416.12939, "b": 214.71429, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Rueschlikon, Switzerland", "bbox": {"l": 336.69302, "t": 217.36425999999994, "r": 439.45727999999997, "b": 226.66931, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "taa@zurich.ibm.com", "bbox": {"l": 346.20703, "t": 229.32025, "r": 429.94269, "b": 238.62531, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "section_header", "bbox": {"l": 53.798035, "t": 247.70288000000005, "r": 111.94354, "b": 258.01202, "coord_origin": "TOPLEFT"}, "confidence": 0.8876155018806458, "cells": [{"id": 22, "text": "ABSTRACT", "bbox": {"l": 53.798035, "t": 247.70288000000005, "r": 111.94354, "b": 258.01202, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 53.466999, "t": 262.90454, "r": 295.56018, "b": 534.29318, "coord_origin": "TOPLEFT"}, "confidence": 0.9823057055473328, "cells": [{"id": 23, "text": "Accurate document layout analysis is a key requirement for high-", "bbox": {"l": 53.484001, "t": 262.90454, "r": 295.55591, "b": 271.27917, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "quality PDF document conversion. With the recent availability of", "bbox": {"l": 53.79800000000001, "t": 273.86352999999997, "r": 294.04199, "b": 282.23816, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "public, large ground-truth datasets such as PubLayNet and DocBank,", "bbox": {"l": 53.79800000000001, "t": 284.82254, "r": 295.34586, "b": 293.19717, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "deep-learning models have proven to be very effective at layout", "bbox": {"l": 53.79800000000001, "t": 295.78152, "r": 294.04709, "b": 304.15616000000006, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "detection and segmentation. While these datasets are of adequate", "bbox": {"l": 53.79800000000001, "t": 306.74053999999995, "r": 294.04645, "b": 315.11517, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "size to train such models, they severely lack in layout variability", "bbox": {"l": 53.79800000000001, "t": 317.69952, "r": 294.27573, "b": 326.07416, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "since they are sourced from scientific article repositories such as", "bbox": {"l": 53.79800000000001, "t": 328.65854, "r": 294.04712, "b": 337.03317, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "PubMed and arXiv only. Consequently, the accuracy of the layout", "bbox": {"l": 53.79800000000001, "t": 339.61755, "r": 294.0437, "b": 347.99219, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "segmentation drops significantly when these models are applied", "bbox": {"l": 53.79800000000001, "t": 350.57654, "r": 294.04715, "b": 358.95117, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "on more challenging and diverse layouts. In this paper, we present", "bbox": {"l": 53.79800000000001, "t": 361.53455, "r": 294.04364, "b": 369.90918000000005, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "DocLayNet", "bbox": {"l": 53.79800000000001, "t": 372.53839, "r": 92.863388, "b": 380.87714000000005, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": ", a new, publicly available, document-layout annotation", "bbox": {"l": 92.863998, "t": 372.49353, "r": 294.04361, "b": 380.86816, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "dataset in COCO format. It contains 80863 manually annotated", "bbox": {"l": 53.79800000000001, "t": 383.45255, "r": 294.04718, "b": 391.82718, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "pages from diverse data sources to represent a wide variability in", "bbox": {"l": 53.79800000000001, "t": 394.41153, "r": 294.0437, "b": 402.78616, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "layouts. For each PDF page, the layout annotations provide labelled", "bbox": {"l": 53.79800000000001, "t": 405.37054, "r": 294.04535, "b": 413.74518, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "bounding-boxes with a choice of 11 distinct classes. DocLayNet", "bbox": {"l": 53.79800000000001, "t": 416.32953, "r": 294.04715, "b": 424.70416000000006, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "also provides a subset of double- and triple-annotated pages to", "bbox": {"l": 53.79800000000001, "t": 427.28853999999995, "r": 294.04712, "b": 435.66318, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "determine the inter-annotator agreement. In multiple experiments,", "bbox": {"l": 53.79800000000001, "t": 438.24753, "r": 295.03, "b": 446.62216, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "we provide baseline accuracy scores (in mAP) for a set of popular", "bbox": {"l": 53.466999, "t": 449.20654, "r": 294.21616, "b": 457.58118, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "object detection models. We also demonstrate that these models", "bbox": {"l": 53.79800000000001, "t": 460.16553, "r": 294.04712, "b": 468.54016, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "fall approximately 10% behind the inter-annotator agreement. Fur-", "bbox": {"l": 53.79800000000001, "t": 471.12354, "r": 295.56018, "b": 479.49817, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "thermore, we provide evidence that DocLayNet is of sufficient size.", "bbox": {"l": 53.79800000000001, "t": 482.08255, "r": 295.42783, "b": 490.45718, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Lastly, we compare models trained on PubLayNet, DocBank and", "bbox": {"l": 53.79800000000001, "t": 493.04153, "r": 294.04715, "b": 501.41617, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "DocLayNet, showing that layout predictions of the DocLayNet-", "bbox": {"l": 53.79800000000001, "t": 504.00055, "r": 295.55618, "b": 512.37518, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "trained models are more robust and thus the preferred choice for", "bbox": {"l": 53.79800000000001, "t": 514.95953, "r": 294.21643, "b": 523.33417, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "general-purpose document-layout analysis.", "bbox": {"l": 53.79800000000001, "t": 525.91855, "r": 212.05495, "b": 534.29318, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "section_header", "bbox": {"l": 53.79800000000001, "t": 550.99692, "r": 134.81989, "b": 561.30602, "coord_origin": "TOPLEFT"}, "confidence": 0.9149598479270935, "cells": [{"id": 49, "text": "CCS CONCEPTS", "bbox": {"l": 53.79800000000001, "t": 550.99692, "r": 134.81989, "b": 561.30602, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 53.797989, "t": 566.08299, "r": 297.85294, "b": 596.50114, "coord_origin": "TOPLEFT"}, "confidence": 0.8458839058876038, "cells": [{"id": 50, "text": "\u2022", "bbox": {"l": 53.79800000000001, "t": 566.19957, "r": 56.945206000000006, "b": 574.57419, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Information systems", "bbox": {"l": 58.440002, "t": 566.0830100000001, "r": 142.4462, "b": 574.5562600000001, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "\u2192", "bbox": {"l": 143.938, "t": 566.36096, "r": 153.15099, "b": 574.43073, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Document structure", "bbox": {"l": 154.646, "t": 566.0830100000001, "r": 235.46015999999997, "b": 574.5562600000001, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "; \u2022", "bbox": {"l": 235.45700000000002, "t": 566.19955, "r": 242.17419, "b": 574.57417, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "Applied com-", "bbox": {"l": 243.66899, "t": 566.08299, "r": 297.85294, "b": 574.55624, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "puting", "bbox": {"l": 53.797989, "t": 577.0419899999999, "r": 80.661324, "b": 585.51524, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "\u2192", "bbox": {"l": 83.565987, "t": 577.3199500000001, "r": 92.778961, "b": 585.38971, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Document analysis", "bbox": {"l": 95.68399, "t": 577.0419899999999, "r": 173.91583, "b": 585.51524, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "; \u2022", "bbox": {"l": 173.916, "t": 577.15855, "r": 182.1272, "b": 585.53317, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Computing methodologies", "bbox": {"l": 185.032, "t": 577.0419899999999, "r": 294.0455, "b": 585.51524, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "\u2192", "bbox": {"l": 53.79800399999999, "t": 588.27895, "r": 63.01097899999999, "b": 596.34871, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "Machine learning", "bbox": {"l": 65.253006, "t": 588.00099, "r": 136.80487, "b": 596.47424, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": ";", "bbox": {"l": 136.80501, "t": 588.1175499999999, "r": 138.92108, "b": 596.49217, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "Computer vision", "bbox": {"l": 141.162, "t": 588.00099, "r": 209.60254, "b": 596.47424, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": ";", "bbox": {"l": 209.60201, "t": 588.1175499999999, "r": 211.71808, "b": 596.49217, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "Object detection", "bbox": {"l": 213.96001, "t": 588.16238, "r": 270.45728, "b": 596.50114, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": ";", "bbox": {"l": 270.48001, "t": 588.1175499999999, "r": 272.59607, "b": 596.49217, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 53.79800000000001, "t": 634.39838, "r": 295.11798, "b": 672.79189, "coord_origin": "TOPLEFT"}, "confidence": 0.7107349038124084, "cells": [{"id": 68, "text": "Permission to make digital or hard copies of part or all of this work for personal or", "bbox": {"l": 53.79800000000001, "t": 634.39838, "r": 294.17697, "b": 640.9119000000001, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "classroom use is granted without fee provided that copies are not made or distributed", "bbox": {"l": 53.79800000000001, "t": 642.36838, "r": 294.04443, "b": 648.8819, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "for profit or commercial advantage and that copies bear this notice and the full citation", "bbox": {"l": 53.79800000000001, "t": 650.33838, "r": 294.04498, "b": 656.8519, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "on the first page. Copyrights for third-party components of this work must be honored.", "bbox": {"l": 53.79800000000001, "t": 658.3083799999999, "r": 295.11798, "b": 664.8219, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "For all other uses, contact the owner/author(s).", "bbox": {"l": 53.79800000000001, "t": 666.27837, "r": 187.72285, "b": 672.79189, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 53.79800000000001, "t": 675.08023, "r": 197.86275, "b": 681.56586, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 53.79800000000001, "t": 675.08023, "r": 197.86275, "b": 681.56586, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 53.317001, "t": 683.81236, "r": 186.74652, "b": 690.32589, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "\u00a9 2022 Copyright held by the owner/author(s).", "bbox": {"l": 53.317001, "t": 683.81236, "r": 186.74652, "b": 690.32589, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 53.554001, "t": 691.78336, "r": 157.03125, "b": 698.29689, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "ACM ISBN 978-1-4503-9385-0/22/08.", "bbox": {"l": 53.554001, "t": 691.78336, "r": 157.03125, "b": 698.29689, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 53.79800000000001, "t": 699.753365, "r": 166.94093, "b": 706.266891, "coord_origin": "TOPLEFT"}, "confidence": 0.509588360786438, "cells": [{"id": 76, "text": "https://doi.org/10.1145/3534678.3539043", "bbox": {"l": 53.79800000000001, "t": 699.753365, "r": 166.94093, "b": 706.266891, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "picture", "bbox": {"l": 323.408203125, "t": 250.34873962402344, "r": 553.2952270507812, "b": 525.8507080078125, "coord_origin": "TOPLEFT"}, "confidence": 0.5910208821296692, "cells": [{"id": 77, "text": "13", "bbox": {"l": 327.86951, "t": 351.78085, "r": 330.41248, "b": 353.95465, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "USING THE VERTICAL TUBE -", "bbox": {"l": 327.83005, "t": 331.57268999999997, "r": 351.16092, "b": 333.31171, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "MODELS AY11230/11234", "bbox": {"l": 327.83005, "t": 333.18292, "r": 348.30536, "b": 334.92194, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "1.", "bbox": {"l": 327.83005, "t": 336.40439, "r": 329.05914, "b": 337.92606, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "The vertical tube can be used for", "bbox": {"l": 329.67368, "t": 336.40439, "r": 349.95349, "b": 337.92606, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "instructional viewing or to photograph", "bbox": {"l": 329.11752, "t": 337.83588, "r": 353.57977, "b": 339.35751000000005, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": " the image with a digital camera or a", "bbox": {"l": 327.77121, "t": 339.26736, "r": 352.4306, "b": 340.789, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": " micro TV unit", "bbox": {"l": 328.15176, "t": 340.69882, "r": 337.91086, "b": 342.22049, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "2.", "bbox": {"l": 327.8313, "t": 342.19043000000005, "r": 329.09155, "b": 343.71207, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Loosen the retention screw, then rotate ", "bbox": {"l": 329.72168, "t": 342.19043000000005, "r": 354.9267, "b": 343.71207, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": " the adjustment ring to change the ", "bbox": {"l": 327.8313, "t": 343.62192, "r": 351.66949, "b": 345.14355, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": " length of the vertical tube.", "bbox": {"l": 328.21185, "t": 345.05338, "r": 346.33179, "b": 346.57504, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "3.", "bbox": {"l": 327.83005, "t": 346.84680000000003, "r": 329.12726, "b": 348.36847, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "Make sure that both the images in", "bbox": {"l": 329.77588, "t": 346.84680000000003, "r": 351.18005, "b": 348.36847, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "OPERATION ", "bbox": {"l": 327.25311, "t": 254.94812000000002, "r": 350.07861, "b": 258.86096, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "(", "bbox": {"l": 350.07861, "t": 254.76782000000003, "r": 351.82651, "b": 258.68066, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "cont.", "bbox": {"l": 351.82651, "t": 254.94812000000002, "r": 360.85242, "b": 258.86096, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": ")", "bbox": {"l": 360.85242, "t": 254.76782000000003, "r": 362.60028, "b": 258.68066, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "SELECTING OBJECTIVE ", "bbox": {"l": 326.88037, "t": 263.49492999999995, "r": 345.84351, "b": 265.23395000000005, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "MAGNIFICATION", "bbox": {"l": 326.88037, "t": 265.10515999999996, "r": 340.54153, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "1.", "bbox": {"l": 326.88037, "t": 266.71533, "r": 328.31903, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "There are two objectives. The lower", "bbox": {"l": 329.03836, "t": 266.71533, "r": 354.21472, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": " magnification objective has a greater", "bbox": {"l": 326.88037, "t": 268.32556, "r": 355.19193, "b": 270.06458, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": " depth of field and view.", "bbox": {"l": 326.88037, "t": 269.93579, "r": 345.80057, "b": 271.6748, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "2.", "bbox": {"l": 326.88037, "t": 271.54602, "r": 328.33862, "b": 273.28503, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "In order to observe the specimen", "bbox": {"l": 329.06775, "t": 271.54602, "r": 352.39969, "b": 273.28503, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": " easily use the lower magnification", "bbox": {"l": 326.88037, "t": 273.15619000000004, "r": 352.90042, "b": 274.89526, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": " objective first. Then, by rotating the", "bbox": {"l": 326.88037, "t": 274.76642000000004, "r": 354.59546, "b": 276.50543000000005, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": " case, the magnification can be", "bbox": {"l": 326.88037, "t": 276.37665000000004, "r": 350.81885, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": " changed.", "bbox": {"l": 326.88037, "t": 277.98688000000004, "r": 335.46707, "b": 279.72589000000005, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "CHANGING THE INTERPUPILLARY ", "bbox": {"l": 326.88037, "t": 281.20728, "r": 354.57755, "b": 282.94632, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "DISTANCE", "bbox": {"l": 326.88037, "t": 282.81750000000005, "r": 335.1752, "b": 284.55652, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "1.", "bbox": {"l": 326.88037, "t": 284.4277, "r": 328.34784, "b": 286.16675, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "The distance between the observer's", "bbox": {"l": 329.08157, "t": 284.4277, "r": 354.76245, "b": 286.16675, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": " pupils is the interpupillary distance.", "bbox": {"l": 326.88037, "t": 286.03793, "r": 354.6499, "b": 287.77695, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "2.", "bbox": {"l": 326.88037, "t": 287.64813, "r": 328.25125, "b": 289.38718, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "To adjust the interpupillary distance", "bbox": {"l": 328.93671, "t": 287.64813, "r": 354.29825, "b": 289.38718, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": " rotate the prism caps until both eyes", "bbox": {"l": 326.88181, "t": 289.25836, "r": 355.02075, "b": 290.99738, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": " coincide with the image in the", "bbox": {"l": 326.88181, "t": 290.86855999999995, "r": 350.82028, "b": 292.6076, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": " eyepiece. ", "bbox": {"l": 326.88181, "t": 292.47879, "r": 336.2067, "b": 294.2178, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "FOCUSING", "bbox": {"l": 326.88181, "t": 295.69922, "r": 335.3941, "b": 297.43823, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "1.", "bbox": {"l": 326.88181, "t": 297.30942, "r": 328.34314, "b": 299.04846, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "Remove the lens protective cover.", "bbox": {"l": 329.07379, "t": 297.30942, "r": 353.18555, "b": 299.04846, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "2.", "bbox": {"l": 326.88324, "t": 298.91965, "r": 328.35919, "b": 300.65866, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "Place the specimen on the working", "bbox": {"l": 329.0972, "t": 298.91965, "r": 353.45065, "b": 300.65866, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": " stage.", "bbox": {"l": 326.88324, "t": 300.52985, "r": 333.32825, "b": 302.26889000000006, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "3.", "bbox": {"l": 326.88324, "t": 302.14008000000007, "r": 328.31296, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "Focus the specimen with the left eye", "bbox": {"l": 329.02783, "t": 302.14008000000007, "r": 354.76303, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": " first while turning the focus knob until", "bbox": {"l": 326.88324, "t": 303.75027, "r": 355.96307, "b": 305.48932, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": " the image appears clear and sharp.", "bbox": {"l": 326.88324, "t": 305.3605, "r": 354.46594, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "4.", "bbox": {"l": 326.88324, "t": 306.9707, "r": 328.25488, "b": 308.70975, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "Rotate the right eyepiece ring until the", "bbox": {"l": 328.9407, "t": 306.9707, "r": 356.37335, "b": 308.70975, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": " images in each eyepiece coincide and", "bbox": {"l": 326.88324, "t": 308.58093, "r": 355.38867, "b": 310.31995, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": " are sharp and clear.", "bbox": {"l": 326.88324, "t": 310.19113, "r": 343.17249, "b": 311.93018, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "CHANGING THE BULB", "bbox": {"l": 326.88324, "t": 313.41156, "r": 344.13388, "b": 315.15059999999994, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "1.", "bbox": {"l": 326.88324, "t": 315.02178999999995, "r": 328.37418, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "Disconnect the power cord.", "bbox": {"l": 329.11963, "t": 315.02178999999995, "r": 348.50162, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "2.", "bbox": {"l": 326.88324, "t": 316.63199, "r": 328.34061, "b": 318.37103, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "When the bulb is cool, remove the", "bbox": {"l": 329.06931, "t": 316.63199, "r": 353.11588, "b": 318.37103, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": " oblique illuminator cap and remove", "bbox": {"l": 326.88464, "t": 318.2422199999999, "r": 353.79517, "b": 319.9812299999999, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": " the halogen bulb with cap.", "bbox": {"l": 326.88464, "t": 319.85242000000005, "r": 348.02094, "b": 321.59146, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "3.", "bbox": {"l": 326.88464, "t": 321.46265, "r": 328.37512, "b": 323.20166, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "Replace with a new halogen bulb.", "bbox": {"l": 329.12036, "t": 321.46265, "r": 352.96808, "b": 323.20166, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "4.", "bbox": {"l": 326.88608, "t": 323.07285, "r": 328.36884, "b": 324.81189, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "Open the window in the base plate and", "bbox": {"l": 329.1102, "t": 323.07285, "r": 356.5412, "b": 324.81189, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": " replace the halogen lamp or ", "bbox": {"l": 326.88608, "t": 324.68307000000004, "r": 350.13828, "b": 326.42209, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": " fluorescent lamp of transmitted", "bbox": {"l": 326.88608, "t": 326.29327, "r": 351.59677, "b": 328.03232, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": " illuminator.", "bbox": {"l": 326.88608, "t": 327.9035, "r": 336.89197, "b": 329.64252, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "FOCUSING", "bbox": {"l": 358.42023, "t": 263.49492999999995, "r": 366.93256, "b": 265.23395000000005, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "1.", "bbox": {"l": 358.42023, "t": 265.10515999999996, "r": 359.89841, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "Turn the focusing knob away or toward", "bbox": {"l": 360.63751, "t": 265.10515999999996, "r": 387.98407, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": " you until a clear image is viewed.", "bbox": {"l": 358.42023, "t": 266.71533, "r": 384.58948, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "2.", "bbox": {"l": 358.42166, "t": 268.32556, "r": 359.78549, "b": 270.06458, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "If the image is unclear, adjust the", "bbox": {"l": 360.46741, "t": 268.32556, "r": 384.33441, "b": 270.06458, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": " height of the elevator up or down,", "bbox": {"l": 358.4231, "t": 269.93579, "r": 384.61502, "b": 271.6748, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": " then turn the focusing knob again.", "bbox": {"l": 358.4231, "t": 271.54602, "r": 385.38922, "b": 273.28503, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "ZOOM MAGNIFICATION", "bbox": {"l": 358.4231, "t": 274.76642000000004, "r": 377.35046, "b": 276.50543000000005, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "1.", "bbox": {"l": 358.4231, "t": 276.37665000000004, "r": 359.89429, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "Turn the zoom magnification knob to", "bbox": {"l": 360.62988, "t": 276.37665000000004, "r": 386.37589, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": " the desired magnification and field of", "bbox": {"l": 358.4231, "t": 277.98688000000004, "r": 386.78732, "b": 279.72589000000005, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": " view.", "bbox": {"l": 358.4231, "t": 279.59704999999997, "r": 364.16855, "b": 281.33609, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "2.", "bbox": {"l": 358.4231, "t": 281.20728, "r": 359.86777, "b": 282.94632, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "In most situations, it is recommended", "bbox": {"l": 360.59012, "t": 281.20728, "r": 387.31656, "b": 282.94632, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": " that you focus at the lowest ", "bbox": {"l": 358.4231, "t": 282.81750000000005, "r": 381.56656, "b": 284.55652, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": " magnification, then move to a higher", "bbox": {"l": 358.4231, "t": 284.4277, "r": 386.63403, "b": 286.16675, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": " magnification and re-focus as ", "bbox": {"l": 358.42453, "t": 286.03793, "r": 382.77115, "b": 287.77695, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": " necessary.", "bbox": {"l": 358.42453, "t": 287.64813, "r": 367.98694, "b": 289.38718, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "3.", "bbox": {"l": 358.42453, "t": 289.25836, "r": 359.80386, "b": 290.99738, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "If the image is not clear to both eyes", "bbox": {"l": 360.49353, "t": 289.25836, "r": 386.70093, "b": 290.99738, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": " at the same time, the diopter ring may", "bbox": {"l": 358.42453, "t": 290.86855999999995, "r": 388.03534, "b": 292.6076, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": " need adjustment.", "bbox": {"l": 358.42453, "t": 292.47879, "r": 373.13724, "b": 294.2178, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "DIOPTER RING ADJUSTMENT", "bbox": {"l": 358.42453, "t": 295.69922, "r": 381.74539, "b": 297.43823, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "1.", "bbox": {"l": 358.42453, "t": 297.30942, "r": 359.83682, "b": 299.04846, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "To adjust the eyepiece for viewing with", "bbox": {"l": 360.54297, "t": 297.30942, "r": 388.08289, "b": 299.04846, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": " or without eyeglasses and for ", "bbox": {"l": 358.42453, "t": 298.91965, "r": 382.73251, "b": 300.65866, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": " differences in acuity between the right", "bbox": {"l": 358.42453, "t": 300.52985, "r": 387.72266, "b": 302.26889000000006, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": " and left eyes, follow the following", "bbox": {"l": 358.42453, "t": 302.14008000000007, "r": 384.1991, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": " steps:", "bbox": {"l": 358.42453, "t": 303.75027, "r": 364.88672, "b": 305.48932, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "a.", "bbox": {"l": 358.42453, "t": 305.3605, "r": 359.95078, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "Observe an image through the left", "bbox": {"l": 361.47699, "t": 305.3605, "r": 386.65988, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": " eyepiece and bring a specific point", "bbox": {"l": 358.42453, "t": 306.9707, "r": 386.7634, "b": 308.70975, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": " into focus using the focus knob.", "bbox": {"l": 358.42453, "t": 308.58093, "r": 385.41354, "b": 310.31995, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "b.", "bbox": {"l": 358.42453, "t": 310.19113, "r": 359.93304, "b": 311.93018, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "By turning the diopter ring ", "bbox": {"l": 361.44156, "t": 310.19113, "r": 382.56085, "b": 311.93018, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": " adjustment for the left eyepiece,", "bbox": {"l": 358.42596, "t": 311.80136, "r": 385.4559, "b": 313.54037, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": " bring the same point into sharp", "bbox": {"l": 358.42596, "t": 313.41156, "r": 384.56122, "b": 315.15059999999994, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": " focus.", "bbox": {"l": 358.42596, "t": 315.02178999999995, "r": 366.74371, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": " c.Then bring the same point into", "bbox": {"l": 358.42596, "t": 316.63199, "r": 383.93884, "b": 318.37103, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": " focus through the right eyepiece", "bbox": {"l": 358.42596, "t": 318.2422199999999, "r": 385.69241, "b": 319.9812299999999, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": " by turning the right diopter ring.", "bbox": {"l": 358.42596, "t": 319.85242000000005, "r": 385.94861, "b": 321.59146, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": " d.With more than one viewer, each", "bbox": {"l": 358.42596, "t": 321.46265, "r": 385.54236, "b": 323.20166, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": " viewer should note their own", "bbox": {"l": 358.42596, "t": 323.07285, "r": 382.98718, "b": 324.81189, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": " diopter ring position for the left", "bbox": {"l": 358.42596, "t": 324.68307000000004, "r": 385.06448, "b": 326.42209, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": " and right eyepieces, then before", "bbox": {"l": 358.42596, "t": 326.29327, "r": 385.20682, "b": 328.03232, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": " viewing set the diopter ring", "bbox": {"l": 358.42596, "t": 327.9035, "r": 382.21964, "b": 329.64252, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": " adjustments to that setting.", "bbox": {"l": 358.42596, "t": 329.5137, "r": 382.63382, "b": 331.25275, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "CHANGING THE BULB", "bbox": {"l": 358.42596, "t": 332.73412999999994, "r": 375.67661, "b": 334.47317999999996, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "1.", "bbox": {"l": 358.42596, "t": 334.34436, "r": 359.90311, "b": 336.08337, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "Disconnect the power cord from the", "bbox": {"l": 360.64169, "t": 334.34436, "r": 385.75333, "b": 336.08337, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": " electrical outlet.", "bbox": {"l": 358.42596, "t": 335.95456, "r": 372.01416, "b": 337.6936, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "2.", "bbox": {"l": 358.42596, "t": 337.56479, "r": 359.88327, "b": 339.3038, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "When the bulb is cool, remove the", "bbox": {"l": 360.61191, "t": 337.56479, "r": 384.65726, "b": 339.3038, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": " oblique illuminator cap and remove", "bbox": {"l": 358.42596, "t": 339.17499, "r": 385.33649, "b": 340.9140300000001, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": " the halogen bulb with cap.", "bbox": {"l": 358.42596, "t": 340.78522, "r": 379.57224, "b": 342.52423, "coord_origin": "TOPLEFT"}}, {"id": 201, "text": "3.", "bbox": {"l": 358.4274, "t": 342.39542, "r": 359.91788, "b": 344.13446000000005, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": "Replace with a new halogen bulb.", "bbox": {"l": 360.66312, "t": 342.39542, "r": 384.5108, "b": 344.13446000000005, "coord_origin": "TOPLEFT"}}, {"id": 203, "text": "4.", "bbox": {"l": 358.42883, "t": 344.00565000000006, "r": 359.92792, "b": 345.74466, "coord_origin": "TOPLEFT"}}, {"id": 204, "text": "Open the window in the base plate", "bbox": {"l": 360.67746, "t": 344.00565000000006, "r": 385.41235, "b": 345.74466, "coord_origin": "TOPLEFT"}}, {"id": 205, "text": " and replace the halogen lamp or", "bbox": {"l": 358.42883, "t": 345.61584, "r": 383.2782, "b": 347.35489, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": " fluorescent lamp of transmitted", "bbox": {"l": 358.42883, "t": 347.22607, "r": 383.13953, "b": 348.96509, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": " illuminator.", "bbox": {"l": 358.42883, "t": 348.83627, "r": 368.43472, "b": 350.57532, "coord_origin": "TOPLEFT"}}, {"id": 208, "text": "Model AY11230", "bbox": {"l": 326.59567, "t": 261.14185, "r": 339.11377, "b": 262.88091999999995, "coord_origin": "TOPLEFT"}}, {"id": 209, "text": "Model AY11234", "bbox": {"l": 358.48605, "t": 261.14185, "r": 371.00415, "b": 262.88091999999995, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": "14", "bbox": {"l": 455.43533, "t": 351.77038999999996, "r": 457.97827000000007, "b": 353.94415, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "Objectives", "bbox": {"l": 408.24518, "t": 275.52673000000004, "r": 414.4234, "b": 276.96020999999996, "coord_origin": "TOPLEFT"}}, {"id": 212, "text": "Revolving Turret", "bbox": {"l": 409.39554, "t": 268.98235999999997, "r": 419.06677, "b": 270.41583, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "Coarse ", "bbox": {"l": 441.3895, "t": 279.12627999999995, "r": 445.87192, "b": 280.55975, "coord_origin": "TOPLEFT"}}, {"id": 214, "text": "Adjustment", "bbox": {"l": 441.3895, "t": 280.30609, "r": 448.22338999999994, "b": 281.7395900000001, "coord_origin": "TOPLEFT"}}, {"id": 215, "text": "Knob", "bbox": {"l": 441.3895, "t": 281.48593, "r": 444.40371999999996, "b": 282.91939999999994, "coord_origin": "TOPLEFT"}}, {"id": 216, "text": "MODEL AY11236", "bbox": {"l": 398.79288, "t": 254.94646999999998, "r": 428.91568, "b": 258.85931000000005, "coord_origin": "TOPLEFT"}}, {"id": 217, "text": "MICROSCOPE USAGE", "bbox": {"l": 398.32535, "t": 305.04291, "r": 435.93542, "b": 308.95572000000004, "coord_origin": "TOPLEFT"}}, {"id": 218, "text": "BARSKA Model AY11236 is a powerful fixed power compound ", "bbox": {"l": 398.08594, "t": 310.35892, "r": 453.72171, "b": 312.53271, "coord_origin": "TOPLEFT"}}, {"id": 219, "text": "microscope designed for biological studies such as specimen ", "bbox": {"l": 398.08594, "t": 312.50586, "r": 453.09939999999995, "b": 314.67966, "coord_origin": "TOPLEFT"}}, {"id": 220, "text": "examination. It can also be used for examining bacteria and", "bbox": {"l": 398.08594, "t": 314.6528, "r": 456.65246999999994, "b": 316.8266, "coord_origin": "TOPLEFT"}}, {"id": 221, "text": "for general clinical and medical studies and other scientific uses. ", "bbox": {"l": 398.08594, "t": 316.79977, "r": 456.73859000000004, "b": 318.97354, "coord_origin": "TOPLEFT"}}, {"id": 222, "text": "CONSTRUCTION", "bbox": {"l": 398.62399, "t": 320.42941, "r": 427.77472, "b": 324.34222000000005, "coord_origin": "TOPLEFT"}}, {"id": 223, "text": "BARSKA Model AY11236 is a fixed power compound microscope.", "bbox": {"l": 398.08594, "t": 326.46069000000006, "r": 456.02639999999997, "b": 328.63449, "coord_origin": "TOPLEFT"}}, {"id": 224, "text": "It is constructed with two optical paths at the same angle. It is ", "bbox": {"l": 398.08414, "t": 328.6076699999999, "r": 455.42238999999995, "b": 330.7814599999999, "coord_origin": "TOPLEFT"}}, {"id": 225, "text": "equipped with transmitted illumination. By using this instrument, ", "bbox": {"l": 398.08414, "t": 330.75461, "r": 457.39844, "b": 332.92841, "coord_origin": "TOPLEFT"}}, {"id": 226, "text": "the user can observe specimens at magnification from 40x to ", "bbox": {"l": 398.08414, "t": 332.90155, "r": 453.97745, "b": 335.07535000000007, "coord_origin": "TOPLEFT"}}, {"id": 227, "text": "1000x by selecting the desired objective lens. Coarse and fine ", "bbox": {"l": 398.08414, "t": 335.04852, "r": 454.70708999999994, "b": 337.22232, "coord_origin": "TOPLEFT"}}, {"id": 228, "text": "focus adjustments provide accuracy and image detail. The rotating ", "bbox": {"l": 398.08414, "t": 337.19547, "r": 458.90240000000006, "b": 339.36926, "coord_origin": "TOPLEFT"}}, {"id": 229, "text": "head allows the user to position the eyepieces for maximum ", "bbox": {"l": 398.08594, "t": 339.34241, "r": 453.0672, "b": 341.5162, "coord_origin": "TOPLEFT"}}, {"id": 230, "text": "viewing comfort and easy access to all adjustment knobs.", "bbox": {"l": 398.08594, "t": 341.48938, "r": 449.63113, "b": 343.66318, "coord_origin": "TOPLEFT"}}, {"id": 231, "text": "Model AY11236", "bbox": {"l": 422.10626, "t": 301.24191, "r": 434.62433000000004, "b": 302.98096, "coord_origin": "TOPLEFT"}}, {"id": 232, "text": "Fine ", "bbox": {"l": 442.01610999999997, "t": 283.08649, "r": 444.8817399999999, "b": 284.51996, "coord_origin": "TOPLEFT"}}, {"id": 233, "text": "Adjustment", "bbox": {"l": 442.01610999999997, "t": 284.2663, "r": 448.85001, "b": 285.69980000000004, "coord_origin": "TOPLEFT"}}, {"id": 234, "text": "Knob", "bbox": {"l": 442.01610999999997, "t": 285.44611, "r": 445.03033000000005, "b": 286.87961, "coord_origin": "TOPLEFT"}}, {"id": 235, "text": "Stage", "bbox": {"l": 408.00577, "t": 279.12579000000005, "r": 411.42212, "b": 280.5593, "coord_origin": "TOPLEFT"}}, {"id": 236, "text": "Condenser ", "bbox": {"l": 404.07172, "t": 280.9144299999999, "r": 410.77707, "b": 282.3479, "coord_origin": "TOPLEFT"}}, {"id": 237, "text": "Focusing", "bbox": {"l": 404.07172, "t": 282.09424, "r": 409.2157, "b": 283.52774, "coord_origin": "TOPLEFT"}}, {"id": 238, "text": "Knob", "bbox": {"l": 404.07172, "t": 283.27408, "r": 407.08594, "b": 284.7075500000001, "coord_origin": "TOPLEFT"}}, {"id": 239, "text": "Eyepiece", "bbox": {"l": 441.81281, "t": 262.32178, "r": 447.03702, "b": 263.75525000000005, "coord_origin": "TOPLEFT"}}, {"id": 240, "text": "Stand", "bbox": {"l": 437.34607, "t": 271.13025000000005, "r": 440.80496, "b": 272.56281, "coord_origin": "TOPLEFT"}}, {"id": 241, "text": "Lamp ", "bbox": {"l": 409.7164, "t": 284.40027, "r": 413.3768, "b": 285.83282, "coord_origin": "TOPLEFT"}}, {"id": 242, "text": "On/Off", "bbox": {"l": 409.7164, "t": 285.83163, "r": 413.68201, "b": 287.26416, "coord_origin": "TOPLEFT"}}, {"id": 243, "text": "Switch", "bbox": {"l": 409.7164, "t": 287.263, "r": 413.6337, "b": 288.69553, "coord_origin": "TOPLEFT"}}, {"id": 244, "text": "Lamp ", "bbox": {"l": 434.8712499999999, "t": 296.7153, "r": 438.53164999999996, "b": 298.14783, "coord_origin": "TOPLEFT"}}, {"id": 245, "text": "Power", "bbox": {"l": 439.52039, "t": 292.18307000000004, "r": 443.08768, "b": 293.61560000000003, "coord_origin": "TOPLEFT"}}, {"id": 246, "text": "Cord", "bbox": {"l": 439.52039, "t": 293.61444, "r": 442.29575, "b": 295.04697, "coord_origin": "TOPLEFT"}}, {"id": 247, "text": "Rotating Head", "bbox": {"l": 413.55829, "t": 264.66089, "r": 421.94913, "b": 266.09344, "coord_origin": "TOPLEFT"}}, {"id": 248, "text": "Stage Clip", "bbox": {"l": 441.84316999999993, "t": 286.90573, "r": 447.87585000000007, "b": 288.33826, "coord_origin": "TOPLEFT"}}, {"id": 249, "text": "Adjustment", "bbox": {"l": 441.84316999999993, "t": 288.3371, "r": 448.67252, "b": 289.76962000000003, "coord_origin": "TOPLEFT"}}, {"id": 250, "text": "Interpupillary Slide Adjustment", "bbox": {"l": 407.2403, "t": 259.86645999999996, "r": 425.79089, "b": 261.29895, "coord_origin": "TOPLEFT"}}, {"id": 251, "text": "Circling Minimums", "bbox": {"l": 449.10074000000003, "t": 378.66302, "r": 466.08835000000005, "b": 380.78412, "coord_origin": "TOPLEFT"}}, {"id": 252, "text": "7", "bbox": {"l": 449.10074000000003, "t": 383.2203999999999, "r": 449.64444, "b": 385.34148999999996, "coord_origin": "TOPLEFT"}}, {"id": 253, "text": "K H U H Z D V D F K D Q J H W R W K H 7 ( 5 3 6 F U L W H U L D L Q W K D W D \u1087H F W V F L U F O L Q J D U H D G L P H Q V L R Q E \\ H [ S D Q G L Q J W K H D U H D V W R S U R Y L G H ", "bbox": {"l": 450.18811, "t": 383.2203999999999, "r": 550.77124, "b": 385.34148999999996, "coord_origin": "TOPLEFT"}}, {"id": 254, "text": "improved obstacle protection. To indicate that the new criteria had been applied to a given procedure, a ", "bbox": {"l": 449.10074000000003, "t": 385.75732, "r": 536.14716, "b": 387.87842, "coord_origin": "TOPLEFT"}}, {"id": 255, "text": " is placed on ", "bbox": {"l": 538.31085, "t": 385.75732, "r": 549.49921, "b": 387.87842, "coord_origin": "TOPLEFT"}}, {"id": 256, "text": "the circling line of minimums. The new circling tables and explanatory information is located in the Legend of the TPP.", "bbox": {"l": 449.10074000000003, "t": 388.03601, "r": 547.58185, "b": 390.1571, "coord_origin": "TOPLEFT"}}, {"id": 257, "text": "7", "bbox": {"l": 449.10074000000003, "t": 393.2128000000001, "r": 449.6163, "b": 395.33386, "coord_origin": "TOPLEFT"}}, {"id": 258, "text": "K H D S S U R D F K H V X V L Q J V W D Q G D U G F L U F O L Q J D S S U R D F K D U H D V F D Q E H L G H Q W L \u00bf H G E \\ W K H D E V H Q F H R I W K H ", "bbox": {"l": 450.1319, "t": 393.2128000000001, "r": 529.53082, "b": 395.33386, "coord_origin": "TOPLEFT"}}, {"id": 259, "text": " on the circling line of ", "bbox": {"l": 532.05829, "t": 393.2128000000001, "r": 550.42261, "b": 395.33386, "coord_origin": "TOPLEFT"}}, {"id": 260, "text": "minima.", "bbox": {"l": 449.10074000000003, "t": 395.49149, "r": 455.74692, "b": 397.61255, "coord_origin": "TOPLEFT"}}, {"id": 261, "text": "$ S S O \\ 6 W D Q G D U G & L U F O L Q J $ S S U R D F K 0 D Q H X Y H U L Q J 5 D G L X V 7 D E O H ", "bbox": {"l": 449.95525999999995, "t": 415.59549, "r": 496.2829, "b": 417.50446, "coord_origin": "TOPLEFT"}}, {"id": 262, "text": "$ S S O \\ ( [ S D Q G H G & L U F O L Q J $ S S U R D F K 0 D Q H X Y H U L Q J $ L U V S D F H 5 D G L X V ", "bbox": {"l": 501.13077, "t": 409.25543, "r": 551.16101, "b": 411.1644, "coord_origin": "TOPLEFT"}}, {"id": 263, "text": "Table", "bbox": {"l": 501.13077, "t": 411.30624, "r": 505.2477999999999, "b": 413.21521, "coord_origin": "TOPLEFT"}}, {"id": 264, "text": "AIRPORT SKETCH", "bbox": {"l": 449.10074000000003, "t": 420.18802, "r": 469.35599, "b": 422.73331, "coord_origin": "TOPLEFT"}}, {"id": 265, "text": "The airport sketch is a depiction of the airport with emphasis on runway pattern and related ", "bbox": {"l": 449.10074000000003, "t": 425.08908, "r": 525.93616, "b": 427.21017, "coord_origin": "TOPLEFT"}}, {"id": 266, "text": "information, positioned in either the lower left or lower right corner of the chart to aid pi-", "bbox": {"l": 449.10074000000003, "t": 427.3678, "r": 522.0343, "b": 429.48886, "coord_origin": "TOPLEFT"}}, {"id": 267, "text": "lot recognition of the airport from the air and to provide some information to aid on ground ", "bbox": {"l": 449.10074000000003, "t": 429.64648, "r": 524.67151, "b": 431.76755, "coord_origin": "TOPLEFT"}}, {"id": 268, "text": "navigation of the airport. The runways are drawn to scale and oriented to true north. Runway ", "bbox": {"l": 449.10074000000003, "t": 431.92514000000006, "r": 527.172, "b": 434.04623, "coord_origin": "TOPLEFT"}}, {"id": 269, "text": "dimensions (length and width) are shown for all active runways.", "bbox": {"l": 449.10074000000003, "t": 434.20383, "r": 502.39545, "b": 436.32492, "coord_origin": "TOPLEFT"}}, {"id": 270, "text": "Runway(s) are depicted based on what type and construction of the runway.", "bbox": {"l": 449.10074000000003, "t": 438.7611999999999, "r": 512.92676, "b": 440.88228999999995, "coord_origin": "TOPLEFT"}}, {"id": 271, "text": "Hard Surface", "bbox": {"l": 449.95525999999995, "t": 444.07001, "r": 460.02307, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}, {"id": 272, "text": "Other Than ", "bbox": {"l": 464.89963, "t": 444.07001, "r": 473.98819, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}, {"id": 273, "text": "Hard Surface", "bbox": {"l": 464.89963, "t": 446.12085, "r": 474.96744, "b": 448.02979, "coord_origin": "TOPLEFT"}}, {"id": 274, "text": "Metal Surface", "bbox": {"l": 478.91357, "t": 444.07001, "r": 489.45648, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}, {"id": 275, "text": "Closed Runway", "bbox": {"l": 493.06420999999995, "t": 444.07001, "r": 505.03076, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}, {"id": 276, "text": "Under Construction", "bbox": {"l": 509.5809, "t": 444.07001, "r": 524.30237, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}, {"id": 277, "text": "Stopways, ", "bbox": {"l": 449.95525999999995, "t": 454.81207, "r": 458.31406, "b": 456.72104, "coord_origin": "TOPLEFT"}}, {"id": 278, "text": "Taxiways, Park-", "bbox": {"l": 449.95525999999995, "t": 456.86288, "r": 461.92083999999994, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}}, {"id": 279, "text": "ing Areas", "bbox": {"l": 449.95525999999995, "t": 458.91373, "r": 457.08014, "b": 460.82268999999997, "coord_origin": "TOPLEFT"}}, {"id": 280, "text": "Displaced ", "bbox": {"l": 464.89963, "t": 454.81207, "r": 472.87732, "b": 456.72104, "coord_origin": "TOPLEFT"}}, {"id": 281, "text": "Threshold", "bbox": {"l": 464.89963, "t": 456.86288, "r": 472.49792, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}}, {"id": 282, "text": "Closed", "bbox": {"l": 478.91357, "t": 454.81207, "r": 483.61584, "b": 456.72104, "coord_origin": "TOPLEFT"}}, {"id": 283, "text": "Pavement", "bbox": {"l": 478.91357, "t": 456.86288, "r": 486.60754000000003, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}}, {"id": 284, "text": "Water Runway", "bbox": {"l": 493.06420999999995, "t": 454.81207, "r": 504.20648, "b": 456.72104, "coord_origin": "TOPLEFT"}}, {"id": 285, "text": "Taxiways and aprons are shaded grey. Other runway features that may be shown are runway numbers, runway dimen-", "bbox": {"l": 449.10074000000003, "t": 469.32974, "r": 548.59674, "b": 471.45081, "coord_origin": "TOPLEFT"}}, {"id": 286, "text": "sions, runway slope, arresting gear, and displaced threshold.", "bbox": {"l": 449.10074000000003, "t": 471.60843, "r": 500.08181999999994, "b": 473.72949, "coord_origin": "TOPLEFT"}}, {"id": 287, "text": "2", "bbox": {"l": 449.10074000000003, "t": 476.16577, "r": 449.59933000000007, "b": 478.28687, "coord_origin": "TOPLEFT"}}, {"id": 288, "text": "W K H U L Q I R U P D W L R Q F R Q F H U Q L Q J O L J K W L Q J \u00bf Q D O D S S U R D F K E H D U L Q J V D L U S R U W E H D F R Q R E V W D F O H V F R Q W U R O W R Z H U 1 $ 9 $ , ' V K H O L ", "bbox": {"l": 450.09796, "t": 476.16577, "r": 547.82562, "b": 478.28687, "coord_origin": "TOPLEFT"}}, {"id": 289, "text": "-", "bbox": {"l": 547.82623, "t": 476.16577, "r": 548.45862, "b": 478.28687, "coord_origin": "TOPLEFT"}}, {"id": 290, "text": "pads may also be shown.", "bbox": {"l": 449.10074000000003, "t": 478.44446, "r": 470.52609000000007, "b": 480.56555, "coord_origin": "TOPLEFT"}}, {"id": 291, "text": "$ L U S R U W ( O H Y D W L R Q D Q G 7 R X F K G R Z Q = R Q H ( O H Y D W L R Q ", "bbox": {"l": 449.10074000000003, "t": 483.00183, "r": 493.37906000000004, "b": 485.12292, "coord_origin": "TOPLEFT"}}, {"id": 292, "text": "The airport elevation is shown enclosed within a box in the upper left corner of the sketch box and the touchdown zone ", "bbox": {"l": 449.10074000000003, "t": 487.5592, "r": 549.16168, "b": 489.6803, "coord_origin": "TOPLEFT"}}, {"id": 293, "text": "elevation (TDZE) is shown in the upper right corner of the sketch box. The airport elevation is the highest point of an ", "bbox": {"l": 449.10074000000003, "t": 489.83789, "r": 546.90881, "b": 491.95898, "coord_origin": "TOPLEFT"}}, {"id": 294, "text": "D L U S R U W \u00b6 V X V D E O H U X Q Z D \\ V P H D V X U H G L Q I H H W I U R P P H D Q V H D O H Y H O 7 K H 7 ' = ( L V W K H K L J K H V W H O H Y D W L R Q L Q W K H \u00bf U V W I H H W R I ", "bbox": {"l": 449.10074000000003, "t": 492.11658, "r": 551.80023, "b": 494.23767, "coord_origin": "TOPLEFT"}}, {"id": 295, "text": "the landing surface. Circling only approaches will not show a TDZE.", "bbox": {"l": 449.10074000000003, "t": 494.39526, "r": 505.85068000000007, "b": 496.51636, "coord_origin": "TOPLEFT"}}, {"id": 296, "text": "114", "bbox": {"l": 498.80661000000003, "t": 515.9437, "r": 502.08792, "b": 519.01764, "coord_origin": "TOPLEFT"}}, {"id": 297, "text": "FAA Chart Users\u2019 Guide - Terminal Procedures Publication (TPP) - Terms", "bbox": {"l": 444.56319999999994, "t": 422.84869, "r": 446.25998, "b": 471.87128, "coord_origin": "TOPLEFT"}}, {"id": 298, "text": "AGL 2013 Financial Calendar", "bbox": {"l": 329.40536, "t": 379.37537, "r": 355.13138, "b": 382.13336, "coord_origin": "TOPLEFT"}}, {"id": 299, "text": "22", "bbox": {"l": 329.40536, "t": 382.30273, "r": 330.96848, "b": 384.55927, "coord_origin": "TOPLEFT"}}, {"id": 300, "text": "August 2012 ", "bbox": {"l": 331.75003, "t": 382.30273, "r": 341.12875, "b": 384.55927, "coord_origin": "TOPLEFT"}}, {"id": 301, "text": "2012 full year result and fi nal dividend announced", "bbox": {"l": 350.4722, "t": 382.30273, "r": 384.81079, "b": 384.55927, "coord_origin": "TOPLEFT"}}, {"id": 302, "text": "30", "bbox": {"l": 329.40536, "t": 384.84552, "r": 330.97336, "b": 387.10205, "coord_origin": "TOPLEFT"}}, {"id": 303, "text": "August 2012 ", "bbox": {"l": 331.75735, "t": 384.84552, "r": 341.16534, "b": 387.10205, "coord_origin": "TOPLEFT"}}, {"id": 304, "text": "Ex-dividend trading commences", "bbox": {"l": 350.4722, "t": 384.84552, "r": 372.90613, "b": 387.10205, "coord_origin": "TOPLEFT"}}, {"id": 305, "text": "5", "bbox": {"l": 329.40536, "t": 387.38828, "r": 330.20337, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}}, {"id": 306, "text": "September 2012 ", "bbox": {"l": 331.00137, "t": 387.38828, "r": 342.9715, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}}, {"id": 307, "text": "Record date for 2012 fi nal dividend", "bbox": {"l": 350.4722, "t": 387.38828, "r": 374.88693, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}}, {"id": 308, "text": "27", "bbox": {"l": 329.40536, "t": 389.93103, "r": 331.0173, "b": 392.18762, "coord_origin": "TOPLEFT"}}, {"id": 309, "text": "September 2012 ", "bbox": {"l": 331.82327, "t": 389.93103, "r": 343.91284, "b": 392.18762, "coord_origin": "TOPLEFT"}}, {"id": 310, "text": "Final dividend payable", "bbox": {"l": 350.4722, "t": 389.93103, "r": 365.65988, "b": 392.18762, "coord_origin": "TOPLEFT"}}, {"id": 311, "text": "23", "bbox": {"l": 329.40536, "t": 392.47382, "r": 330.98804, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}}, {"id": 312, "text": "October 2012 ", "bbox": {"l": 331.77936, "t": 392.47382, "r": 342.06674, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}}, {"id": 313, "text": "Annual General Meeting", "bbox": {"l": 350.4722, "t": 392.47382, "r": 367.22156, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}}, {"id": 314, "text": "27", "bbox": {"l": 329.40536, "t": 395.0166, "r": 330.99741, "b": 397.27313, "coord_origin": "TOPLEFT"}}, {"id": 315, "text": "February 2013", "bbox": {"l": 331.7934, "t": 395.0166, "r": 342.1416, "b": 397.27313, "coord_origin": "TOPLEFT"}}, {"id": 316, "text": " 1", "bbox": {"l": 342.64841, "t": 395.18298, "r": 342.65811, "b": 396.49857000000003, "coord_origin": "TOPLEFT"}}, {"id": 317, "text": "2013 interim result and interim dividend announced", "bbox": {"l": 350.47177, "t": 395.01474, "r": 386.25897, "b": 397.2713, "coord_origin": "TOPLEFT"}}, {"id": 318, "text": "28", "bbox": {"l": 329.40491, "t": 397.55749999999995, "r": 331.02695, "b": 399.81406, "coord_origin": "TOPLEFT"}}, {"id": 319, "text": "August 2013", "bbox": {"l": 331.83795, "t": 397.55749999999995, "r": 340.75909, "b": 399.81406, "coord_origin": "TOPLEFT"}}, {"id": 320, "text": " 1", "bbox": {"l": 341.26437, "t": 397.7254, "r": 341.27408, "b": 399.04095, "coord_origin": "TOPLEFT"}}, {"id": 321, "text": "2013 full year results and fi nal dividend announced ", "bbox": {"l": 350.47144, "t": 397.55713, "r": 385.93265, "b": 399.81369, "coord_origin": "TOPLEFT"}}, {"id": 322, "text": "1", "bbox": {"l": 329.40536, "t": 400.46155, "r": 329.87708, "b": 401.96588, "coord_origin": "TOPLEFT"}}, {"id": 323, "text": "Indicative dates only, subject to change/Board confi rmation", "bbox": {"l": 330.34882, "t": 400.46155, "r": 358.65204, "b": 401.96588, "coord_origin": "TOPLEFT"}}, {"id": 324, "text": "AGL\u2019s Annual General Meeting will be held at the City Recital Hall, Angel Place, Sydney ", "bbox": {"l": 329.40536, "t": 404.34503, "r": 391.771, "b": 406.60156, "coord_origin": "TOPLEFT"}}, {"id": 325, "text": "commencing at 10.30am on Tuesday 23 October 2012.", "bbox": {"l": 329.40536, "t": 406.37857, "r": 369.65308, "b": 408.63513000000006, "coord_origin": "TOPLEFT"}}, {"id": 326, "text": "Ye s te rd ay", "bbox": {"l": 363.54486, "t": 460.53054999999995, "r": 379.25955, "b": 465.54507, "coord_origin": "TOPLEFT"}}, {"id": 327, "text": "Established in Sydney in 1837, and then ", "bbox": {"l": 363.54486, "t": 466.7157, "r": 391.38229, "b": 468.97223, "coord_origin": "TOPLEFT"}}, {"id": 328, "text": "known as The Australian Gas Light Company, ", "bbox": {"l": 363.54486, "t": 468.74924, "r": 395.01788, "b": 471.00577, "coord_origin": "TOPLEFT"}}, {"id": 329, "text": "the AGL business has an established history ", "bbox": {"l": 363.54486, "t": 470.78281, "r": 394.08322, "b": 473.03934, "coord_origin": "TOPLEFT"}}, {"id": 330, "text": "and reputation for serving the gas and ", "bbox": {"l": 363.54486, "t": 472.81635, "r": 390.60727, "b": 475.07288, "coord_origin": "TOPLEFT"}}, {"id": 331, "text": "electricity needs of Australian households. ", "bbox": {"l": 363.54486, "t": 474.84988, "r": 393.49612, "b": 477.10645, "coord_origin": "TOPLEFT"}}, {"id": 332, "text": "In 1841, when AGL supplied the gas to light ", "bbox": {"l": 363.54486, "t": 476.88345, "r": 394.11481, "b": 479.13998, "coord_origin": "TOPLEFT"}}, {"id": 333, "text": "the fi rst public street lamp, it was reported ", "bbox": {"l": 363.54486, "t": 478.91699, "r": 393.75891, "b": 481.17352, "coord_origin": "TOPLEFT"}}, {"id": 334, "text": "in the Sydney Gazette as a \u201cwonderful ", "bbox": {"l": 363.54486, "t": 480.95053, "r": 390.4975, "b": 483.20709, "coord_origin": "TOPLEFT"}}, {"id": 335, "text": "achievement of scientifi c knowledge, assisted ", "bbox": {"l": 363.54486, "t": 482.9841, "r": 395.70975, "b": 485.24063, "coord_origin": "TOPLEFT"}}, {"id": 336, "text": "by mechanical ingenuity.\u201d Within two years, ", "bbox": {"l": 363.54486, "t": 485.01764, "r": 394.27283, "b": 487.2742, "coord_origin": "TOPLEFT"}}, {"id": 337, "text": "165 gas lamps were lighting the City of Sydney.", "bbox": {"l": 363.54486, "t": 487.05121, "r": 396.65939, "b": 489.30774, "coord_origin": "TOPLEFT"}}, {"id": 338, "text": "Looking back on ", "bbox": {"l": 329.4054, "t": 419.93124, "r": 384.19696, "b": 431.09412, "coord_origin": "TOPLEFT"}}, {"id": 339, "text": "175 years of ", "bbox": {"l": 329.4054, "t": 430.10379, "r": 372.16626, "b": 441.26669, "coord_origin": "TOPLEFT"}}, {"id": 340, "text": "looking forward.", "bbox": {"l": 329.4054, "t": 440.27636999999993, "r": 385.3981, "b": 451.43924, "coord_origin": "TOPLEFT"}}, {"id": 341, "text": "AGL Energy Limited ABN 74 115 061 375", "bbox": {"l": 329.40536, "t": 372.16159, "r": 353.36179, "b": 373.91669, "coord_origin": "TOPLEFT"}}, {"id": 342, "text": "29", "bbox": {"l": 546.20587, "t": 360.90448, "r": 548.23407, "b": 362.82242, "coord_origin": "TOPLEFT"}}, {"id": 343, "text": "signs, signals and road markings", "bbox": {"l": 497.77728, "t": 251.43384000000003, "r": 542.8255, "b": 254.94385, "coord_origin": "TOPLEFT"}}, {"id": 344, "text": "3", "bbox": {"l": 490.30679, "t": 251.47478999999998, "r": 492.09982, "b": 254.98479999999995, "coord_origin": "TOPLEFT"}}, {"id": 345, "text": "In ", "bbox": {"l": 498.15335, "t": 263.88922, "r": 500.05637, "b": 265.92719, "coord_origin": "TOPLEFT"}}, {"id": 346, "text": "chapter 2, you and your vehicle", "bbox": {"l": 500.05637, "t": 263.85717999999997, "r": 524.37036, "b": 265.86310000000003, "coord_origin": "TOPLEFT"}}, {"id": 347, "text": ", you learned about ", "bbox": {"l": 524.37036, "t": 263.88922, "r": 539.89124, "b": 265.92719, "coord_origin": "TOPLEFT"}}, {"id": 348, "text": "some of the controls in your vehicle. This chapter is a handy ", "bbox": {"l": 498.15335, "t": 265.93224999999995, "r": 544.50403, "b": 267.97020999999995, "coord_origin": "TOPLEFT"}}, {"id": 349, "text": "reference section that gives examples of the most common ", "bbox": {"l": 498.15335, "t": 267.97533999999996, "r": 544.01343, "b": 270.01331000000005, "coord_origin": "TOPLEFT"}}, {"id": 350, "text": "signs, signals and road markings that keep traffi c organized ", "bbox": {"l": 498.15335, "t": 270.01831000000004, "r": 544.11987, "b": 272.05634, "coord_origin": "TOPLEFT"}}, {"id": 351, "text": "and flowing smoothly. ", "bbox": {"l": 498.15335, "t": 272.06140000000005, "r": 515.41071, "b": 274.09937, "coord_origin": "TOPLEFT"}}, {"id": 352, "text": "Signs", "bbox": {"l": 498.15335, "t": 277.34619, "r": 505.64642000000003, "b": 280.9357, "coord_origin": "TOPLEFT"}}, {"id": 353, "text": "There are three ways to read signs: by their shape, colour and ", "bbox": {"l": 498.15335, "t": 281.82187, "r": 543.92957, "b": 283.85983, "coord_origin": "TOPLEFT"}}, {"id": 354, "text": "the messages printed on them. Understanding these three ways ", "bbox": {"l": 498.15335, "t": 283.8649, "r": 545.67834, "b": 285.90289, "coord_origin": "TOPLEFT"}}, {"id": 355, "text": "of classifying signs will help you figure out the meaning of signs ", "bbox": {"l": 498.15335, "t": 285.90796, "r": 545.26471, "b": 287.94592, "coord_origin": "TOPLEFT"}}, {"id": 356, "text": "that are new to you. ", "bbox": {"l": 498.15335, "t": 287.95099, "r": 513.31335, "b": 289.98895, "coord_origin": "TOPLEFT"}}, {"id": 357, "text": "Stop", "bbox": {"l": 505.43439, "t": 303.07596, "r": 508.53033000000005, "b": 304.89639, "coord_origin": "TOPLEFT"}}, {"id": 358, "text": "Yield the right-of-way", "bbox": {"l": 527.45502, "t": 303.25354, "r": 541.44678, "b": 305.07397, "coord_origin": "TOPLEFT"}}, {"id": 359, "text": "Shows driving", "bbox": {"l": 501.79385, "t": 321.18973, "r": 510.41632, "b": 323.01016, "coord_origin": "TOPLEFT"}}, {"id": 360, "text": "regulations", "bbox": {"l": 501.79385, "t": 322.87731999999994, "r": 509.04268999999994, "b": 324.69775000000004, "coord_origin": "TOPLEFT"}}, {"id": 361, "text": "Explains lane use", "bbox": {"l": 518.66455, "t": 319.59146, "r": 529.80902, "b": 321.41190000000006, "coord_origin": "TOPLEFT"}}, {"id": 362, "text": "School zone signs ", "bbox": {"l": 534.87561, "t": 318.37616, "r": 546.95142, "b": 320.19659, "coord_origin": "TOPLEFT"}}, {"id": 363, "text": "are fl uorescent ", "bbox": {"l": 534.87561, "t": 320.0637500000001, "r": 545.05762, "b": 321.88419, "coord_origin": "TOPLEFT"}}, {"id": 364, "text": "yellow-green", "bbox": {"l": 534.87561, "t": 321.75134, "r": 543.32263, "b": 323.57178, "coord_origin": "TOPLEFT"}}, {"id": 365, "text": "Tells about motorist ", "bbox": {"l": 499.21862999999996, "t": 338.12772, "r": 512.62451, "b": 339.94815, "coord_origin": "TOPLEFT"}}, {"id": 366, "text": "services", "bbox": {"l": 499.21862999999996, "t": 339.81531000000007, "r": 504.39917, "b": 341.63574, "coord_origin": "TOPLEFT"}}, {"id": 367, "text": "Shows a permitted ", "bbox": {"l": 516.97748, "t": 338.06039, "r": 529.77484, "b": 339.88082999999995, "coord_origin": "TOPLEFT"}}, {"id": 368, "text": "action", "bbox": {"l": 516.97748, "t": 339.74799, "r": 520.96399, "b": 341.56842, "coord_origin": "TOPLEFT"}}, {"id": 369, "text": "Shows an action that ", "bbox": {"l": 534.55847, "t": 337.88281, "r": 548.58453, "b": 339.7032500000001, "coord_origin": "TOPLEFT"}}, {"id": 370, "text": "is not permitted", "bbox": {"l": 534.55847, "t": 339.57040000000006, "r": 545.08862, "b": 341.39084, "coord_origin": "TOPLEFT"}}, {"id": 371, "text": "Warns of hazards ", "bbox": {"l": 483.05853, "t": 356.17416, "r": 494.72577, "b": 357.9946, "coord_origin": "TOPLEFT"}}, {"id": 372, "text": "ahead", "bbox": {"l": 483.05853, "t": 357.86179, "r": 487.07525999999996, "b": 359.68222, "coord_origin": "TOPLEFT"}}, {"id": 373, "text": "Warns of", "bbox": {"l": 499.39645, "t": 356.26297000000005, "r": 504.69171, "b": 358.0834, "coord_origin": "TOPLEFT"}}, {"id": 374, "text": "construction zones", "bbox": {"l": 499.39645, "t": 357.95056, "r": 511.69116, "b": 359.77099999999996, "coord_origin": "TOPLEFT"}}, {"id": 375, "text": "Railway crossing", "bbox": {"l": 516.75891, "t": 356.26297000000005, "r": 527.42938, "b": 358.0834, "coord_origin": "TOPLEFT"}}, {"id": 376, "text": "Shows distance and ", "bbox": {"l": 534.5141, "t": 352.92981, "r": 547.89862, "b": 354.75024, "coord_origin": "TOPLEFT"}}, {"id": 377, "text": "direction", "bbox": {"l": 534.5141, "t": 354.6174, "r": 540.2818, "b": 356.43784, "coord_origin": "TOPLEFT"}}, {"id": 378, "text": "\u2022", "bbox": {"l": 478.37466, "t": 270.14075, "r": 479.14251999999993, "b": 272.17877, "coord_origin": "TOPLEFT"}}, {"id": 379, "text": "Signs", "bbox": {"l": 479.91036999999994, "t": 270.14075, "r": 483.74963, "b": 272.17877, "coord_origin": "TOPLEFT"}}, {"id": 380, "text": "- regulatory signs", "bbox": {"l": 479.97293, "t": 272.84717, "r": 492.31219, "b": 274.34888, "coord_origin": "TOPLEFT"}}, {"id": 381, "text": "- school, ", "bbox": {"l": 479.97293, "t": 275.14513999999997, "r": 486.72598000000005, "b": 276.64679, "coord_origin": "TOPLEFT"}}, {"id": 382, "text": "playground and ", "bbox": {"l": 481.21602999999993, "t": 276.77972, "r": 492.93286000000006, "b": 278.81768999999997, "coord_origin": "TOPLEFT"}}, {"id": 383, "text": "crosswalk signs", "bbox": {"l": 481.21602999999993, "t": 278.82275000000004, "r": 491.82938000000007, "b": 280.86075, "coord_origin": "TOPLEFT"}}, {"id": 384, "text": "- lane use signs", "bbox": {"l": 479.97293, "t": 281.52759, "r": 491.00775000000004, "b": 283.02924, "coord_origin": "TOPLEFT"}}, {"id": 385, "text": "- turn control signs", "bbox": {"l": 479.97293, "t": 283.82556, "r": 493.32748, "b": 285.3272099999999, "coord_origin": "TOPLEFT"}}, {"id": 386, "text": "- parking signs", "bbox": {"l": 479.97293, "t": 286.1235, "r": 490.4915199999999, "b": 287.62518, "coord_origin": "TOPLEFT"}}, {"id": 387, "text": "- reserved lane ", "bbox": {"l": 479.97293, "t": 288.42148, "r": 491.17004000000003, "b": 289.92316, "coord_origin": "TOPLEFT"}}, {"id": 388, "text": "signs", "bbox": {"l": 481.21602999999993, "t": 290.05605999999995, "r": 484.77405000000005, "b": 292.09406, "coord_origin": "TOPLEFT"}}, {"id": 389, "text": "- warning signs", "bbox": {"l": 479.97293, "t": 292.76169000000004, "r": 490.83398, "b": 294.26334, "coord_origin": "TOPLEFT"}}, {"id": 390, "text": "- object markers", "bbox": {"l": 479.97293, "t": 295.05963, "r": 491.62692, "b": 296.56131, "coord_origin": "TOPLEFT"}}, {"id": 391, "text": "- construction ", "bbox": {"l": 479.97293, "t": 297.3576, "r": 490.37341, "b": 298.8592499999999, "coord_origin": "TOPLEFT"}}, {"id": 392, "text": "signs", "bbox": {"l": 481.21602999999993, "t": 298.99219, "r": 484.77405000000005, "b": 301.03015, "coord_origin": "TOPLEFT"}}, {"id": 393, "text": "- information and ", "bbox": {"l": 479.97293, "t": 301.69780999999995, "r": 492.93912, "b": 303.19946, "coord_origin": "TOPLEFT"}}, {"id": 394, "text": "destination signs", "bbox": {"l": 481.21602999999993, "t": 303.3324, "r": 493.00525, "b": 305.37036, "coord_origin": "TOPLEFT"}}, {"id": 395, "text": "- railway signs", "bbox": {"l": 479.97293, "t": 306.0379899999999, "r": 489.99047999999993, "b": 307.53967, "coord_origin": "TOPLEFT"}}, {"id": 396, "text": "\u2022", "bbox": {"l": 478.375, "t": 308.24789, "r": 479.1032400000001, "b": 310.28586, "coord_origin": "TOPLEFT"}}, {"id": 397, "text": "Signals", "bbox": {"l": 479.83151, "t": 308.24789, "r": 484.92925999999994, "b": 310.28586, "coord_origin": "TOPLEFT"}}, {"id": 398, "text": "- lane control ", "bbox": {"l": 479.97293, "t": 310.95358, "r": 490.00091999999995, "b": 312.45526, "coord_origin": "TOPLEFT"}}, {"id": 399, "text": "signals", "bbox": {"l": 481.21602999999993, "t": 312.5881999999999, "r": 485.95331, "b": 314.62616, "coord_origin": "TOPLEFT"}}, {"id": 400, "text": "- traffic lights", "bbox": {"l": 479.97293, "t": 315.29379, "r": 489.29876999999993, "b": 316.79544, "coord_origin": "TOPLEFT"}}, {"id": 401, "text": "\u2022", "bbox": {"l": 478.375, "t": 317.50366, "r": 479.18129999999996, "b": 319.5416599999999, "coord_origin": "TOPLEFT"}}, {"id": 402, "text": "Road markings", "bbox": {"l": 479.98761, "t": 317.50366, "r": 490.46960000000007, "b": 319.5416599999999, "coord_origin": "TOPLEFT"}}, {"id": 403, "text": "- yellow lines", "bbox": {"l": 479.97293, "t": 320.20938, "r": 489.26166000000006, "b": 321.71103, "coord_origin": "TOPLEFT"}}, {"id": 404, "text": "- white lines", "bbox": {"l": 479.97293, "t": 322.50732, "r": 488.59189, "b": 324.009, "coord_origin": "TOPLEFT"}}, {"id": 405, "text": "- reserved lane ", "bbox": {"l": 479.97293, "t": 324.8053, "r": 491.17004000000003, "b": 326.30698, "coord_origin": "TOPLEFT"}}, {"id": 406, "text": "markings", "bbox": {"l": 481.21602999999993, "t": 326.43988, "r": 487.58978, "b": 328.47784, "coord_origin": "TOPLEFT"}}, {"id": 407, "text": "- other markings", "bbox": {"l": 479.97293, "t": 329.14551, "r": 491.75177, "b": 330.64716, "coord_origin": "TOPLEFT"}}, {"id": 408, "text": "in this chapter", "bbox": {"l": 478.15246999999994, "t": 265.07030999999995, "r": 493.75586, "b": 268.06872999999996, "coord_origin": "TOPLEFT"}}], "children": [{"id": 32, "label": "text", "bbox": {"l": 327.86951, "t": 351.78085, "r": 330.41248, "b": 353.95465, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "13", "bbox": {"l": 327.86951, "t": 351.78085, "r": 330.41248, "b": 353.95465, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 327.83005, "t": 331.57268999999997, "r": 351.16092, "b": 333.31171, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "USING THE VERTICAL TUBE -", "bbox": {"l": 327.83005, "t": 331.57268999999997, "r": 351.16092, "b": 333.31171, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 327.83005, "t": 333.18292, "r": 348.30536, "b": 334.92194, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "MODELS AY11230/11234", "bbox": {"l": 327.83005, "t": 333.18292, "r": 348.30536, "b": 334.92194, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 327.83005, "t": 336.40439, "r": 329.05914, "b": 337.92606, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "1.", "bbox": {"l": 327.83005, "t": 336.40439, "r": 329.05914, "b": 337.92606, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 329.67368, "t": 336.40439, "r": 349.95349, "b": 337.92606, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "The vertical tube can be used for", "bbox": {"l": 329.67368, "t": 336.40439, "r": 349.95349, "b": 337.92606, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 329.11752, "t": 337.83588, "r": 353.57977, "b": 339.35751000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "instructional viewing or to photograph", "bbox": {"l": 329.11752, "t": 337.83588, "r": 353.57977, "b": 339.35751000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 327.77121, "t": 339.26736, "r": 352.4306, "b": 340.789, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": " the image with a digital camera or a", "bbox": {"l": 327.77121, "t": 339.26736, "r": 352.4306, "b": 340.789, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 328.15176, "t": 340.69882, "r": 337.91086, "b": 342.22049, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": " micro TV unit", "bbox": {"l": 328.15176, "t": 340.69882, "r": 337.91086, "b": 342.22049, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 327.8313, "t": 342.19043000000005, "r": 329.09155, "b": 343.71207, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "2.", "bbox": {"l": 327.8313, "t": 342.19043000000005, "r": 329.09155, "b": 343.71207, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 329.72168, "t": 342.19043000000005, "r": 354.9267, "b": 343.71207, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "Loosen the retention screw, then rotate ", "bbox": {"l": 329.72168, "t": 342.19043000000005, "r": 354.9267, "b": 343.71207, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 327.8313, "t": 343.62192, "r": 351.66949, "b": 345.14355, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": " the adjustment ring to change the ", "bbox": {"l": 327.8313, "t": 343.62192, "r": 351.66949, "b": 345.14355, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 328.21185, "t": 345.05338, "r": 346.33179, "b": 346.57504, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": " length of the vertical tube.", "bbox": {"l": 328.21185, "t": 345.05338, "r": 346.33179, "b": 346.57504, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 327.83005, "t": 346.84680000000003, "r": 329.12726, "b": 348.36847, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "3.", "bbox": {"l": 327.83005, "t": 346.84680000000003, "r": 329.12726, "b": 348.36847, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 329.77588, "t": 346.84680000000003, "r": 351.18005, "b": 348.36847, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "Make sure that both the images in", "bbox": {"l": 329.77588, "t": 346.84680000000003, "r": 351.18005, "b": 348.36847, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 327.25311, "t": 254.94812000000002, "r": 350.07861, "b": 258.86096, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "OPERATION ", "bbox": {"l": 327.25311, "t": 254.94812000000002, "r": 350.07861, "b": 258.86096, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 350.07861, "t": 254.76782000000003, "r": 351.82651, "b": 258.68066, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "(", "bbox": {"l": 350.07861, "t": 254.76782000000003, "r": 351.82651, "b": 258.68066, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 351.82651, "t": 254.94812000000002, "r": 360.85242, "b": 258.86096, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "cont.", "bbox": {"l": 351.82651, "t": 254.94812000000002, "r": 360.85242, "b": 258.86096, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 360.85242, "t": 254.76782000000003, "r": 362.60028, "b": 258.68066, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": ")", "bbox": {"l": 360.85242, "t": 254.76782000000003, "r": 362.60028, "b": 258.68066, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 326.88037, "t": 263.49492999999995, "r": 345.84351, "b": 265.23395000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "SELECTING OBJECTIVE ", "bbox": {"l": 326.88037, "t": 263.49492999999995, "r": 345.84351, "b": 265.23395000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 326.88037, "t": 265.10515999999996, "r": 340.54153, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "MAGNIFICATION", "bbox": {"l": 326.88037, "t": 265.10515999999996, "r": 340.54153, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 326.88037, "t": 266.71533, "r": 328.31903, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "1.", "bbox": {"l": 326.88037, "t": 266.71533, "r": 328.31903, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 329.03836, "t": 266.71533, "r": 354.21472, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "There are two objectives. The lower", "bbox": {"l": 329.03836, "t": 266.71533, "r": 354.21472, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 326.88037, "t": 268.32556, "r": 355.19193, "b": 270.06458, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": " magnification objective has a greater", "bbox": {"l": 326.88037, "t": 268.32556, "r": 355.19193, "b": 270.06458, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 326.88037, "t": 269.93579, "r": 345.80057, "b": 271.6748, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": " depth of field and view.", "bbox": {"l": 326.88037, "t": 269.93579, "r": 345.80057, "b": 271.6748, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 326.88037, "t": 271.54602, "r": 328.33862, "b": 273.28503, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "2.", "bbox": {"l": 326.88037, "t": 271.54602, "r": 328.33862, "b": 273.28503, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 329.06775, "t": 271.54602, "r": 352.39969, "b": 273.28503, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "In order to observe the specimen", "bbox": {"l": 329.06775, "t": 271.54602, "r": 352.39969, "b": 273.28503, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 326.88037, "t": 273.15619000000004, "r": 352.90042, "b": 274.89526, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": " easily use the lower magnification", "bbox": {"l": 326.88037, "t": 273.15619000000004, "r": 352.90042, "b": 274.89526, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 326.88037, "t": 274.76642000000004, "r": 354.59546, "b": 276.50543000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": " objective first. Then, by rotating the", "bbox": {"l": 326.88037, "t": 274.76642000000004, "r": 354.59546, "b": 276.50543000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 326.88037, "t": 276.37665000000004, "r": 350.81885, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": " case, the magnification can be", "bbox": {"l": 326.88037, "t": 276.37665000000004, "r": 350.81885, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 326.88037, "t": 277.98688000000004, "r": 335.46707, "b": 279.72589000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": " changed.", "bbox": {"l": 326.88037, "t": 277.98688000000004, "r": 335.46707, "b": 279.72589000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 326.88037, "t": 281.20728, "r": 354.57755, "b": 282.94632, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 107, "text": "CHANGING THE INTERPUPILLARY ", "bbox": {"l": 326.88037, "t": 281.20728, "r": 354.57755, "b": 282.94632, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 326.88037, "t": 282.81750000000005, "r": 335.1752, "b": 284.55652, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 108, "text": "DISTANCE", "bbox": {"l": 326.88037, "t": 282.81750000000005, "r": 335.1752, "b": 284.55652, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 326.88037, "t": 284.4277, "r": 328.34784, "b": 286.16675, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 109, "text": "1.", "bbox": {"l": 326.88037, "t": 284.4277, "r": 328.34784, "b": 286.16675, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 329.08157, "t": 284.4277, "r": 354.76245, "b": 286.16675, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 110, "text": "The distance between the observer's", "bbox": {"l": 329.08157, "t": 284.4277, "r": 354.76245, "b": 286.16675, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 326.88037, "t": 286.03793, "r": 354.6499, "b": 287.77695, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 111, "text": " pupils is the interpupillary distance.", "bbox": {"l": 326.88037, "t": 286.03793, "r": 354.6499, "b": 287.77695, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 326.88037, "t": 287.64813, "r": 328.25125, "b": 289.38718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 112, "text": "2.", "bbox": {"l": 326.88037, "t": 287.64813, "r": 328.25125, "b": 289.38718, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 328.93671, "t": 287.64813, "r": 354.29825, "b": 289.38718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 113, "text": "To adjust the interpupillary distance", "bbox": {"l": 328.93671, "t": 287.64813, "r": 354.29825, "b": 289.38718, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 326.88181, "t": 289.25836, "r": 355.02075, "b": 290.99738, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 114, "text": " rotate the prism caps until both eyes", "bbox": {"l": 326.88181, "t": 289.25836, "r": 355.02075, "b": 290.99738, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 326.88181, "t": 290.86855999999995, "r": 350.82028, "b": 292.6076, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 115, "text": " coincide with the image in the", "bbox": {"l": 326.88181, "t": 290.86855999999995, "r": 350.82028, "b": 292.6076, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 326.88181, "t": 292.47879, "r": 336.2067, "b": 294.2178, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 116, "text": " eyepiece. ", "bbox": {"l": 326.88181, "t": 292.47879, "r": 336.2067, "b": 294.2178, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 326.88181, "t": 295.69922, "r": 335.3941, "b": 297.43823, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 117, "text": "FOCUSING", "bbox": {"l": 326.88181, "t": 295.69922, "r": 335.3941, "b": 297.43823, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 326.88181, "t": 297.30942, "r": 328.34314, "b": 299.04846, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 118, "text": "1.", "bbox": {"l": 326.88181, "t": 297.30942, "r": 328.34314, "b": 299.04846, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 329.07379, "t": 297.30942, "r": 353.18555, "b": 299.04846, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 119, "text": "Remove the lens protective cover.", "bbox": {"l": 329.07379, "t": 297.30942, "r": 353.18555, "b": 299.04846, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 326.88324, "t": 298.91965, "r": 328.35919, "b": 300.65866, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 120, "text": "2.", "bbox": {"l": 326.88324, "t": 298.91965, "r": 328.35919, "b": 300.65866, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 329.0972, "t": 298.91965, "r": 353.45065, "b": 300.65866, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 121, "text": "Place the specimen on the working", "bbox": {"l": 329.0972, "t": 298.91965, "r": 353.45065, "b": 300.65866, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 326.88324, "t": 300.52985, "r": 333.32825, "b": 302.26889000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 122, "text": " stage.", "bbox": {"l": 326.88324, "t": 300.52985, "r": 333.32825, "b": 302.26889000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 326.88324, "t": 302.14008000000007, "r": 328.31296, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 123, "text": "3.", "bbox": {"l": 326.88324, "t": 302.14008000000007, "r": 328.31296, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 329.02783, "t": 302.14008000000007, "r": 354.76303, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 124, "text": "Focus the specimen with the left eye", "bbox": {"l": 329.02783, "t": 302.14008000000007, "r": 354.76303, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 326.88324, "t": 303.75027, "r": 355.96307, "b": 305.48932, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 125, "text": " first while turning the focus knob until", "bbox": {"l": 326.88324, "t": 303.75027, "r": 355.96307, "b": 305.48932, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 326.88324, "t": 305.3605, "r": 354.46594, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 126, "text": " the image appears clear and sharp.", "bbox": {"l": 326.88324, "t": 305.3605, "r": 354.46594, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 326.88324, "t": 306.9707, "r": 328.25488, "b": 308.70975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 127, "text": "4.", "bbox": {"l": 326.88324, "t": 306.9707, "r": 328.25488, "b": 308.70975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 328.9407, "t": 306.9707, "r": 356.37335, "b": 308.70975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 128, "text": "Rotate the right eyepiece ring until the", "bbox": {"l": 328.9407, "t": 306.9707, "r": 356.37335, "b": 308.70975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 326.88324, "t": 308.58093, "r": 355.38867, "b": 310.31995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 129, "text": " images in each eyepiece coincide and", "bbox": {"l": 326.88324, "t": 308.58093, "r": 355.38867, "b": 310.31995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 326.88324, "t": 310.19113, "r": 343.17249, "b": 311.93018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 130, "text": " are sharp and clear.", "bbox": {"l": 326.88324, "t": 310.19113, "r": 343.17249, "b": 311.93018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 326.88324, "t": 313.41156, "r": 344.13388, "b": 315.15059999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 131, "text": "CHANGING THE BULB", "bbox": {"l": 326.88324, "t": 313.41156, "r": 344.13388, "b": 315.15059999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 326.88324, "t": 315.02178999999995, "r": 328.37418, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 132, "text": "1.", "bbox": {"l": 326.88324, "t": 315.02178999999995, "r": 328.37418, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 329.11963, "t": 315.02178999999995, "r": 348.50162, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 133, "text": "Disconnect the power cord.", "bbox": {"l": 329.11963, "t": 315.02178999999995, "r": 348.50162, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 326.88324, "t": 316.63199, "r": 328.34061, "b": 318.37103, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 134, "text": "2.", "bbox": {"l": 326.88324, "t": 316.63199, "r": 328.34061, "b": 318.37103, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 329.06931, "t": 316.63199, "r": 353.11588, "b": 318.37103, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 135, "text": "When the bulb is cool, remove the", "bbox": {"l": 329.06931, "t": 316.63199, "r": 353.11588, "b": 318.37103, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 326.88464, "t": 318.2422199999999, "r": 353.79517, "b": 319.9812299999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 136, "text": " oblique illuminator cap and remove", "bbox": {"l": 326.88464, "t": 318.2422199999999, "r": 353.79517, "b": 319.9812299999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 326.88464, "t": 319.85242000000005, "r": 348.02094, "b": 321.59146, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 137, "text": " the halogen bulb with cap.", "bbox": {"l": 326.88464, "t": 319.85242000000005, "r": 348.02094, "b": 321.59146, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 326.88464, "t": 321.46265, "r": 328.37512, "b": 323.20166, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 138, "text": "3.", "bbox": {"l": 326.88464, "t": 321.46265, "r": 328.37512, "b": 323.20166, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 329.12036, "t": 321.46265, "r": 352.96808, "b": 323.20166, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 139, "text": "Replace with a new halogen bulb.", "bbox": {"l": 329.12036, "t": 321.46265, "r": 352.96808, "b": 323.20166, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 326.88608, "t": 323.07285, "r": 328.36884, "b": 324.81189, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 140, "text": "4.", "bbox": {"l": 326.88608, "t": 323.07285, "r": 328.36884, "b": 324.81189, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 329.1102, "t": 323.07285, "r": 356.5412, "b": 324.81189, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 141, "text": "Open the window in the base plate and", "bbox": {"l": 329.1102, "t": 323.07285, "r": 356.5412, "b": 324.81189, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 326.88608, "t": 324.68307000000004, "r": 350.13828, "b": 326.42209, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 142, "text": " replace the halogen lamp or ", "bbox": {"l": 326.88608, "t": 324.68307000000004, "r": 350.13828, "b": 326.42209, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 326.88608, "t": 326.29327, "r": 351.59677, "b": 328.03232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 143, "text": " fluorescent lamp of transmitted", "bbox": {"l": 326.88608, "t": 326.29327, "r": 351.59677, "b": 328.03232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 326.88608, "t": 327.9035, "r": 336.89197, "b": 329.64252, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 144, "text": " illuminator.", "bbox": {"l": 326.88608, "t": 327.9035, "r": 336.89197, "b": 329.64252, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 358.42023, "t": 263.49492999999995, "r": 366.93256, "b": 265.23395000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 145, "text": "FOCUSING", "bbox": {"l": 358.42023, "t": 263.49492999999995, "r": 366.93256, "b": 265.23395000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 358.42023, "t": 265.10515999999996, "r": 359.89841, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 146, "text": "1.", "bbox": {"l": 358.42023, "t": 265.10515999999996, "r": 359.89841, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 360.63751, "t": 265.10515999999996, "r": 387.98407, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 147, "text": "Turn the focusing knob away or toward", "bbox": {"l": 360.63751, "t": 265.10515999999996, "r": 387.98407, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 358.42023, "t": 266.71533, "r": 384.58948, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 148, "text": " you until a clear image is viewed.", "bbox": {"l": 358.42023, "t": 266.71533, "r": 384.58948, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 358.42166, "t": 268.32556, "r": 359.78549, "b": 270.06458, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 149, "text": "2.", "bbox": {"l": 358.42166, "t": 268.32556, "r": 359.78549, "b": 270.06458, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 360.46741, "t": 268.32556, "r": 384.33441, "b": 270.06458, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 150, "text": "If the image is unclear, adjust the", "bbox": {"l": 360.46741, "t": 268.32556, "r": 384.33441, "b": 270.06458, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 358.4231, "t": 269.93579, "r": 384.61502, "b": 271.6748, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 151, "text": " height of the elevator up or down,", "bbox": {"l": 358.4231, "t": 269.93579, "r": 384.61502, "b": 271.6748, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 358.4231, "t": 271.54602, "r": 385.38922, "b": 273.28503, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 152, "text": " then turn the focusing knob again.", "bbox": {"l": 358.4231, "t": 271.54602, "r": 385.38922, "b": 273.28503, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 358.4231, "t": 274.76642000000004, "r": 377.35046, "b": 276.50543000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 153, "text": "ZOOM MAGNIFICATION", "bbox": {"l": 358.4231, "t": 274.76642000000004, "r": 377.35046, "b": 276.50543000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 358.4231, "t": 276.37665000000004, "r": 359.89429, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 154, "text": "1.", "bbox": {"l": 358.4231, "t": 276.37665000000004, "r": 359.89429, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 360.62988, "t": 276.37665000000004, "r": 386.37589, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 155, "text": "Turn the zoom magnification knob to", "bbox": {"l": 360.62988, "t": 276.37665000000004, "r": 386.37589, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 358.4231, "t": 277.98688000000004, "r": 386.78732, "b": 279.72589000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 156, "text": " the desired magnification and field of", "bbox": {"l": 358.4231, "t": 277.98688000000004, "r": 386.78732, "b": 279.72589000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 358.4231, "t": 279.59704999999997, "r": 364.16855, "b": 281.33609, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 157, "text": " view.", "bbox": {"l": 358.4231, "t": 279.59704999999997, "r": 364.16855, "b": 281.33609, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 358.4231, "t": 281.20728, "r": 359.86777, "b": 282.94632, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 158, "text": "2.", "bbox": {"l": 358.4231, "t": 281.20728, "r": 359.86777, "b": 282.94632, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 114, "label": "text", "bbox": {"l": 360.59012, "t": 281.20728, "r": 387.31656, "b": 282.94632, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 159, "text": "In most situations, it is recommended", "bbox": {"l": 360.59012, "t": 281.20728, "r": 387.31656, "b": 282.94632, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 115, "label": "text", "bbox": {"l": 358.4231, "t": 282.81750000000005, "r": 381.56656, "b": 284.55652, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 160, "text": " that you focus at the lowest ", "bbox": {"l": 358.4231, "t": 282.81750000000005, "r": 381.56656, "b": 284.55652, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 116, "label": "text", "bbox": {"l": 358.4231, "t": 284.4277, "r": 386.63403, "b": 286.16675, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 161, "text": " magnification, then move to a higher", "bbox": {"l": 358.4231, "t": 284.4277, "r": 386.63403, "b": 286.16675, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 117, "label": "text", "bbox": {"l": 358.42453, "t": 286.03793, "r": 382.77115, "b": 287.77695, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 162, "text": " magnification and re-focus as ", "bbox": {"l": 358.42453, "t": 286.03793, "r": 382.77115, "b": 287.77695, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 118, "label": "text", "bbox": {"l": 358.42453, "t": 287.64813, "r": 367.98694, "b": 289.38718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 163, "text": " necessary.", "bbox": {"l": 358.42453, "t": 287.64813, "r": 367.98694, "b": 289.38718, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 119, "label": "text", "bbox": {"l": 358.42453, "t": 289.25836, "r": 359.80386, "b": 290.99738, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 164, "text": "3.", "bbox": {"l": 358.42453, "t": 289.25836, "r": 359.80386, "b": 290.99738, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 120, "label": "text", "bbox": {"l": 360.49353, "t": 289.25836, "r": 386.70093, "b": 290.99738, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 165, "text": "If the image is not clear to both eyes", "bbox": {"l": 360.49353, "t": 289.25836, "r": 386.70093, "b": 290.99738, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 121, "label": "text", "bbox": {"l": 358.42453, "t": 290.86855999999995, "r": 388.03534, "b": 292.6076, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 166, "text": " at the same time, the diopter ring may", "bbox": {"l": 358.42453, "t": 290.86855999999995, "r": 388.03534, "b": 292.6076, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 122, "label": "text", "bbox": {"l": 358.42453, "t": 292.47879, "r": 373.13724, "b": 294.2178, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 167, "text": " need adjustment.", "bbox": {"l": 358.42453, "t": 292.47879, "r": 373.13724, "b": 294.2178, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 123, "label": "text", "bbox": {"l": 358.42453, "t": 295.69922, "r": 381.74539, "b": 297.43823, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 168, "text": "DIOPTER RING ADJUSTMENT", "bbox": {"l": 358.42453, "t": 295.69922, "r": 381.74539, "b": 297.43823, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 124, "label": "text", "bbox": {"l": 358.42453, "t": 297.30942, "r": 359.83682, "b": 299.04846, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 169, "text": "1.", "bbox": {"l": 358.42453, "t": 297.30942, "r": 359.83682, "b": 299.04846, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 125, "label": "text", "bbox": {"l": 360.54297, "t": 297.30942, "r": 388.08289, "b": 299.04846, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 170, "text": "To adjust the eyepiece for viewing with", "bbox": {"l": 360.54297, "t": 297.30942, "r": 388.08289, "b": 299.04846, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 126, "label": "text", "bbox": {"l": 358.42453, "t": 298.91965, "r": 382.73251, "b": 300.65866, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 171, "text": " or without eyeglasses and for ", "bbox": {"l": 358.42453, "t": 298.91965, "r": 382.73251, "b": 300.65866, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 127, "label": "text", "bbox": {"l": 358.42453, "t": 300.52985, "r": 387.72266, "b": 302.26889000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 172, "text": " differences in acuity between the right", "bbox": {"l": 358.42453, "t": 300.52985, "r": 387.72266, "b": 302.26889000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 128, "label": "text", "bbox": {"l": 358.42453, "t": 302.14008000000007, "r": 384.1991, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 173, "text": " and left eyes, follow the following", "bbox": {"l": 358.42453, "t": 302.14008000000007, "r": 384.1991, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 129, "label": "text", "bbox": {"l": 358.42453, "t": 303.75027, "r": 364.88672, "b": 305.48932, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 174, "text": " steps:", "bbox": {"l": 358.42453, "t": 303.75027, "r": 364.88672, "b": 305.48932, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 130, "label": "text", "bbox": {"l": 358.42453, "t": 305.3605, "r": 359.95078, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 175, "text": "a.", "bbox": {"l": 358.42453, "t": 305.3605, "r": 359.95078, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 131, "label": "text", "bbox": {"l": 361.47699, "t": 305.3605, "r": 386.65988, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 176, "text": "Observe an image through the left", "bbox": {"l": 361.47699, "t": 305.3605, "r": 386.65988, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 132, "label": "text", "bbox": {"l": 358.42453, "t": 306.9707, "r": 386.7634, "b": 308.70975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 177, "text": " eyepiece and bring a specific point", "bbox": {"l": 358.42453, "t": 306.9707, "r": 386.7634, "b": 308.70975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 133, "label": "text", "bbox": {"l": 358.42453, "t": 308.58093, "r": 385.41354, "b": 310.31995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 178, "text": " into focus using the focus knob.", "bbox": {"l": 358.42453, "t": 308.58093, "r": 385.41354, "b": 310.31995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 134, "label": "text", "bbox": {"l": 358.42453, "t": 310.19113, "r": 359.93304, "b": 311.93018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 179, "text": "b.", "bbox": {"l": 358.42453, "t": 310.19113, "r": 359.93304, "b": 311.93018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 135, "label": "text", "bbox": {"l": 361.44156, "t": 310.19113, "r": 382.56085, "b": 311.93018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 180, "text": "By turning the diopter ring ", "bbox": {"l": 361.44156, "t": 310.19113, "r": 382.56085, "b": 311.93018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 136, "label": "text", "bbox": {"l": 358.42596, "t": 311.80136, "r": 385.4559, "b": 313.54037, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 181, "text": " adjustment for the left eyepiece,", "bbox": {"l": 358.42596, "t": 311.80136, "r": 385.4559, "b": 313.54037, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 137, "label": "text", "bbox": {"l": 358.42596, "t": 313.41156, "r": 384.56122, "b": 315.15059999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 182, "text": " bring the same point into sharp", "bbox": {"l": 358.42596, "t": 313.41156, "r": 384.56122, "b": 315.15059999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 138, "label": "text", "bbox": {"l": 358.42596, "t": 315.02178999999995, "r": 366.74371, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 183, "text": " focus.", "bbox": {"l": 358.42596, "t": 315.02178999999995, "r": 366.74371, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 139, "label": "text", "bbox": {"l": 358.42596, "t": 316.63199, "r": 383.93884, "b": 318.37103, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 184, "text": " c.Then bring the same point into", "bbox": {"l": 358.42596, "t": 316.63199, "r": 383.93884, "b": 318.37103, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 140, "label": "text", "bbox": {"l": 358.42596, "t": 318.2422199999999, "r": 385.69241, "b": 319.9812299999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 185, "text": " focus through the right eyepiece", "bbox": {"l": 358.42596, "t": 318.2422199999999, "r": 385.69241, "b": 319.9812299999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 141, "label": "text", "bbox": {"l": 358.42596, "t": 319.85242000000005, "r": 385.94861, "b": 321.59146, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 186, "text": " by turning the right diopter ring.", "bbox": {"l": 358.42596, "t": 319.85242000000005, "r": 385.94861, "b": 321.59146, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 142, "label": "text", "bbox": {"l": 358.42596, "t": 321.46265, "r": 385.54236, "b": 323.20166, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 187, "text": " d.With more than one viewer, each", "bbox": {"l": 358.42596, "t": 321.46265, "r": 385.54236, "b": 323.20166, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 143, "label": "text", "bbox": {"l": 358.42596, "t": 323.07285, "r": 382.98718, "b": 324.81189, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 188, "text": " viewer should note their own", "bbox": {"l": 358.42596, "t": 323.07285, "r": 382.98718, "b": 324.81189, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 144, "label": "text", "bbox": {"l": 358.42596, "t": 324.68307000000004, "r": 385.06448, "b": 326.42209, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 189, "text": " diopter ring position for the left", "bbox": {"l": 358.42596, "t": 324.68307000000004, "r": 385.06448, "b": 326.42209, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 145, "label": "text", "bbox": {"l": 358.42596, "t": 326.29327, "r": 385.20682, "b": 328.03232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 190, "text": " and right eyepieces, then before", "bbox": {"l": 358.42596, "t": 326.29327, "r": 385.20682, "b": 328.03232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 146, "label": "text", "bbox": {"l": 358.42596, "t": 327.9035, "r": 382.21964, "b": 329.64252, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 191, "text": " viewing set the diopter ring", "bbox": {"l": 358.42596, "t": 327.9035, "r": 382.21964, "b": 329.64252, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 147, "label": "text", "bbox": {"l": 358.42596, "t": 329.5137, "r": 382.63382, "b": 331.25275, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 192, "text": " adjustments to that setting.", "bbox": {"l": 358.42596, "t": 329.5137, "r": 382.63382, "b": 331.25275, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 148, "label": "text", "bbox": {"l": 358.42596, "t": 332.73412999999994, "r": 375.67661, "b": 334.47317999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 193, "text": "CHANGING THE BULB", "bbox": {"l": 358.42596, "t": 332.73412999999994, "r": 375.67661, "b": 334.47317999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 149, "label": "text", "bbox": {"l": 358.42596, "t": 334.34436, "r": 359.90311, "b": 336.08337, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 194, "text": "1.", "bbox": {"l": 358.42596, "t": 334.34436, "r": 359.90311, "b": 336.08337, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 150, "label": "text", "bbox": {"l": 360.64169, "t": 334.34436, "r": 385.75333, "b": 336.08337, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 195, "text": "Disconnect the power cord from the", "bbox": {"l": 360.64169, "t": 334.34436, "r": 385.75333, "b": 336.08337, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 151, "label": "text", "bbox": {"l": 358.42596, "t": 335.95456, "r": 372.01416, "b": 337.6936, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 196, "text": " electrical outlet.", "bbox": {"l": 358.42596, "t": 335.95456, "r": 372.01416, "b": 337.6936, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 152, "label": "text", "bbox": {"l": 358.42596, "t": 337.56479, "r": 359.88327, "b": 339.3038, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 197, "text": "2.", "bbox": {"l": 358.42596, "t": 337.56479, "r": 359.88327, "b": 339.3038, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 153, "label": "text", "bbox": {"l": 360.61191, "t": 337.56479, "r": 384.65726, "b": 339.3038, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 198, "text": "When the bulb is cool, remove the", "bbox": {"l": 360.61191, "t": 337.56479, "r": 384.65726, "b": 339.3038, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 154, "label": "text", "bbox": {"l": 358.42596, "t": 339.17499, "r": 385.33649, "b": 340.9140300000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 199, "text": " oblique illuminator cap and remove", "bbox": {"l": 358.42596, "t": 339.17499, "r": 385.33649, "b": 340.9140300000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 155, "label": "text", "bbox": {"l": 358.42596, "t": 340.78522, "r": 379.57224, "b": 342.52423, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 200, "text": " the halogen bulb with cap.", "bbox": {"l": 358.42596, "t": 340.78522, "r": 379.57224, "b": 342.52423, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 156, "label": "text", "bbox": {"l": 358.4274, "t": 342.39542, "r": 359.91788, "b": 344.13446000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 201, "text": "3.", "bbox": {"l": 358.4274, "t": 342.39542, "r": 359.91788, "b": 344.13446000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 157, "label": "text", "bbox": {"l": 360.66312, "t": 342.39542, "r": 384.5108, "b": 344.13446000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 202, "text": "Replace with a new halogen bulb.", "bbox": {"l": 360.66312, "t": 342.39542, "r": 384.5108, "b": 344.13446000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 158, "label": "text", "bbox": {"l": 358.42883, "t": 344.00565000000006, "r": 359.92792, "b": 345.74466, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 203, "text": "4.", "bbox": {"l": 358.42883, "t": 344.00565000000006, "r": 359.92792, "b": 345.74466, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 159, "label": "text", "bbox": {"l": 360.67746, "t": 344.00565000000006, "r": 385.41235, "b": 345.74466, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 204, "text": "Open the window in the base plate", "bbox": {"l": 360.67746, "t": 344.00565000000006, "r": 385.41235, "b": 345.74466, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 160, "label": "text", "bbox": {"l": 358.42883, "t": 345.61584, "r": 383.2782, "b": 347.35489, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 205, "text": " and replace the halogen lamp or", "bbox": {"l": 358.42883, "t": 345.61584, "r": 383.2782, "b": 347.35489, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 161, "label": "text", "bbox": {"l": 358.42883, "t": 347.22607, "r": 383.13953, "b": 348.96509, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 206, "text": " fluorescent lamp of transmitted", "bbox": {"l": 358.42883, "t": 347.22607, "r": 383.13953, "b": 348.96509, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 162, "label": "text", "bbox": {"l": 358.42883, "t": 348.83627, "r": 368.43472, "b": 350.57532, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 207, "text": " illuminator.", "bbox": {"l": 358.42883, "t": 348.83627, "r": 368.43472, "b": 350.57532, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 163, "label": "text", "bbox": {"l": 326.59567, "t": 261.14185, "r": 339.11377, "b": 262.88091999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 208, "text": "Model AY11230", "bbox": {"l": 326.59567, "t": 261.14185, "r": 339.11377, "b": 262.88091999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 164, "label": "text", "bbox": {"l": 358.48605, "t": 261.14185, "r": 371.00415, "b": 262.88091999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 209, "text": "Model AY11234", "bbox": {"l": 358.48605, "t": 261.14185, "r": 371.00415, "b": 262.88091999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 165, "label": "text", "bbox": {"l": 455.43533, "t": 351.77038999999996, "r": 457.97827000000007, "b": 353.94415, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 210, "text": "14", "bbox": {"l": 455.43533, "t": 351.77038999999996, "r": 457.97827000000007, "b": 353.94415, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 166, "label": "text", "bbox": {"l": 408.24518, "t": 275.52673000000004, "r": 414.4234, "b": 276.96020999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 211, "text": "Objectives", "bbox": {"l": 408.24518, "t": 275.52673000000004, "r": 414.4234, "b": 276.96020999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 167, "label": "text", "bbox": {"l": 409.39554, "t": 268.98235999999997, "r": 419.06677, "b": 270.41583, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 212, "text": "Revolving Turret", "bbox": {"l": 409.39554, "t": 268.98235999999997, "r": 419.06677, "b": 270.41583, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 168, "label": "text", "bbox": {"l": 441.3895, "t": 279.12627999999995, "r": 445.87192, "b": 280.55975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 213, "text": "Coarse ", "bbox": {"l": 441.3895, "t": 279.12627999999995, "r": 445.87192, "b": 280.55975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 169, "label": "text", "bbox": {"l": 441.3895, "t": 280.30609, "r": 448.22338999999994, "b": 281.7395900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 214, "text": "Adjustment", "bbox": {"l": 441.3895, "t": 280.30609, "r": 448.22338999999994, "b": 281.7395900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 170, "label": "text", "bbox": {"l": 441.3895, "t": 281.48593, "r": 444.40371999999996, "b": 282.91939999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 215, "text": "Knob", "bbox": {"l": 441.3895, "t": 281.48593, "r": 444.40371999999996, "b": 282.91939999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 171, "label": "text", "bbox": {"l": 398.79288, "t": 254.94646999999998, "r": 428.91568, "b": 258.85931000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 216, "text": "MODEL AY11236", "bbox": {"l": 398.79288, "t": 254.94646999999998, "r": 428.91568, "b": 258.85931000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 172, "label": "text", "bbox": {"l": 398.32535, "t": 305.04291, "r": 435.93542, "b": 308.95572000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 217, "text": "MICROSCOPE USAGE", "bbox": {"l": 398.32535, "t": 305.04291, "r": 435.93542, "b": 308.95572000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 173, "label": "text", "bbox": {"l": 398.08594, "t": 310.35892, "r": 453.72171, "b": 312.53271, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 218, "text": "BARSKA Model AY11236 is a powerful fixed power compound ", "bbox": {"l": 398.08594, "t": 310.35892, "r": 453.72171, "b": 312.53271, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 174, "label": "text", "bbox": {"l": 398.08594, "t": 312.50586, "r": 453.09939999999995, "b": 314.67966, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 219, "text": "microscope designed for biological studies such as specimen ", "bbox": {"l": 398.08594, "t": 312.50586, "r": 453.09939999999995, "b": 314.67966, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 175, "label": "text", "bbox": {"l": 398.08594, "t": 314.6528, "r": 456.65246999999994, "b": 316.8266, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 220, "text": "examination. It can also be used for examining bacteria and", "bbox": {"l": 398.08594, "t": 314.6528, "r": 456.65246999999994, "b": 316.8266, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 176, "label": "text", "bbox": {"l": 398.08594, "t": 316.79977, "r": 456.73859000000004, "b": 318.97354, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 221, "text": "for general clinical and medical studies and other scientific uses. ", "bbox": {"l": 398.08594, "t": 316.79977, "r": 456.73859000000004, "b": 318.97354, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 177, "label": "text", "bbox": {"l": 398.62399, "t": 320.42941, "r": 427.77472, "b": 324.34222000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 222, "text": "CONSTRUCTION", "bbox": {"l": 398.62399, "t": 320.42941, "r": 427.77472, "b": 324.34222000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 178, "label": "text", "bbox": {"l": 398.08594, "t": 326.46069000000006, "r": 456.02639999999997, "b": 328.63449, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 223, "text": "BARSKA Model AY11236 is a fixed power compound microscope.", "bbox": {"l": 398.08594, "t": 326.46069000000006, "r": 456.02639999999997, "b": 328.63449, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 179, "label": "text", "bbox": {"l": 398.08414, "t": 328.6076699999999, "r": 455.42238999999995, "b": 330.7814599999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 224, "text": "It is constructed with two optical paths at the same angle. It is ", "bbox": {"l": 398.08414, "t": 328.6076699999999, "r": 455.42238999999995, "b": 330.7814599999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 180, "label": "text", "bbox": {"l": 398.08414, "t": 330.75461, "r": 457.39844, "b": 332.92841, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 225, "text": "equipped with transmitted illumination. By using this instrument, ", "bbox": {"l": 398.08414, "t": 330.75461, "r": 457.39844, "b": 332.92841, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 181, "label": "text", "bbox": {"l": 398.08414, "t": 332.90155, "r": 453.97745, "b": 335.07535000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 226, "text": "the user can observe specimens at magnification from 40x to ", "bbox": {"l": 398.08414, "t": 332.90155, "r": 453.97745, "b": 335.07535000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 182, "label": "text", "bbox": {"l": 398.08414, "t": 335.04852, "r": 454.70708999999994, "b": 337.22232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 227, "text": "1000x by selecting the desired objective lens. Coarse and fine ", "bbox": {"l": 398.08414, "t": 335.04852, "r": 454.70708999999994, "b": 337.22232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 183, "label": "text", "bbox": {"l": 398.08414, "t": 337.19547, "r": 458.90240000000006, "b": 339.36926, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 228, "text": "focus adjustments provide accuracy and image detail. The rotating ", "bbox": {"l": 398.08414, "t": 337.19547, "r": 458.90240000000006, "b": 339.36926, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 184, "label": "text", "bbox": {"l": 398.08594, "t": 339.34241, "r": 453.0672, "b": 341.5162, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 229, "text": "head allows the user to position the eyepieces for maximum ", "bbox": {"l": 398.08594, "t": 339.34241, "r": 453.0672, "b": 341.5162, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 185, "label": "text", "bbox": {"l": 398.08594, "t": 341.48938, "r": 449.63113, "b": 343.66318, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 230, "text": "viewing comfort and easy access to all adjustment knobs.", "bbox": {"l": 398.08594, "t": 341.48938, "r": 449.63113, "b": 343.66318, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 186, "label": "text", "bbox": {"l": 422.10626, "t": 301.24191, "r": 434.62433000000004, "b": 302.98096, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 231, "text": "Model AY11236", "bbox": {"l": 422.10626, "t": 301.24191, "r": 434.62433000000004, "b": 302.98096, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 187, "label": "text", "bbox": {"l": 442.01610999999997, "t": 283.08649, "r": 444.8817399999999, "b": 284.51996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 232, "text": "Fine ", "bbox": {"l": 442.01610999999997, "t": 283.08649, "r": 444.8817399999999, "b": 284.51996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 188, "label": "text", "bbox": {"l": 442.01610999999997, "t": 284.2663, "r": 448.85001, "b": 285.69980000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 233, "text": "Adjustment", "bbox": {"l": 442.01610999999997, "t": 284.2663, "r": 448.85001, "b": 285.69980000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 189, "label": "text", "bbox": {"l": 442.01610999999997, "t": 285.44611, "r": 445.03033000000005, "b": 286.87961, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 234, "text": "Knob", "bbox": {"l": 442.01610999999997, "t": 285.44611, "r": 445.03033000000005, "b": 286.87961, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 190, "label": "text", "bbox": {"l": 408.00577, "t": 279.12579000000005, "r": 411.42212, "b": 280.5593, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 235, "text": "Stage", "bbox": {"l": 408.00577, "t": 279.12579000000005, "r": 411.42212, "b": 280.5593, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 191, "label": "text", "bbox": {"l": 404.07172, "t": 280.9144299999999, "r": 410.77707, "b": 282.3479, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 236, "text": "Condenser ", "bbox": {"l": 404.07172, "t": 280.9144299999999, "r": 410.77707, "b": 282.3479, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 192, "label": "text", "bbox": {"l": 404.07172, "t": 282.09424, "r": 409.2157, "b": 283.52774, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 237, "text": "Focusing", "bbox": {"l": 404.07172, "t": 282.09424, "r": 409.2157, "b": 283.52774, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 193, "label": "text", "bbox": {"l": 404.07172, "t": 283.27408, "r": 407.08594, "b": 284.7075500000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 238, "text": "Knob", "bbox": {"l": 404.07172, "t": 283.27408, "r": 407.08594, "b": 284.7075500000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 194, "label": "text", "bbox": {"l": 441.81281, "t": 262.32178, "r": 447.03702, "b": 263.75525000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 239, "text": "Eyepiece", "bbox": {"l": 441.81281, "t": 262.32178, "r": 447.03702, "b": 263.75525000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 195, "label": "text", "bbox": {"l": 437.34607, "t": 271.13025000000005, "r": 440.80496, "b": 272.56281, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 240, "text": "Stand", "bbox": {"l": 437.34607, "t": 271.13025000000005, "r": 440.80496, "b": 272.56281, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 196, "label": "text", "bbox": {"l": 409.7164, "t": 284.40027, "r": 413.3768, "b": 285.83282, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 241, "text": "Lamp ", "bbox": {"l": 409.7164, "t": 284.40027, "r": 413.3768, "b": 285.83282, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 197, "label": "text", "bbox": {"l": 409.7164, "t": 285.83163, "r": 413.68201, "b": 287.26416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 242, "text": "On/Off", "bbox": {"l": 409.7164, "t": 285.83163, "r": 413.68201, "b": 287.26416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 198, "label": "text", "bbox": {"l": 409.7164, "t": 287.263, "r": 413.6337, "b": 288.69553, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 243, "text": "Switch", "bbox": {"l": 409.7164, "t": 287.263, "r": 413.6337, "b": 288.69553, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 199, "label": "text", "bbox": {"l": 434.8712499999999, "t": 296.7153, "r": 438.53164999999996, "b": 298.14783, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 244, "text": "Lamp ", "bbox": {"l": 434.8712499999999, "t": 296.7153, "r": 438.53164999999996, "b": 298.14783, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 200, "label": "text", "bbox": {"l": 439.52039, "t": 292.18307000000004, "r": 443.08768, "b": 293.61560000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 245, "text": "Power", "bbox": {"l": 439.52039, "t": 292.18307000000004, "r": 443.08768, "b": 293.61560000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 201, "label": "text", "bbox": {"l": 439.52039, "t": 293.61444, "r": 442.29575, "b": 295.04697, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 246, "text": "Cord", "bbox": {"l": 439.52039, "t": 293.61444, "r": 442.29575, "b": 295.04697, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 202, "label": "text", "bbox": {"l": 413.55829, "t": 264.66089, "r": 421.94913, "b": 266.09344, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 247, "text": "Rotating Head", "bbox": {"l": 413.55829, "t": 264.66089, "r": 421.94913, "b": 266.09344, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 203, "label": "text", "bbox": {"l": 441.84316999999993, "t": 286.90573, "r": 447.87585000000007, "b": 288.33826, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 248, "text": "Stage Clip", "bbox": {"l": 441.84316999999993, "t": 286.90573, "r": 447.87585000000007, "b": 288.33826, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 204, "label": "text", "bbox": {"l": 441.84316999999993, "t": 288.3371, "r": 448.67252, "b": 289.76962000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 249, "text": "Adjustment", "bbox": {"l": 441.84316999999993, "t": 288.3371, "r": 448.67252, "b": 289.76962000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 205, "label": "text", "bbox": {"l": 407.2403, "t": 259.86645999999996, "r": 425.79089, "b": 261.29895, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 250, "text": "Interpupillary Slide Adjustment", "bbox": {"l": 407.2403, "t": 259.86645999999996, "r": 425.79089, "b": 261.29895, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 206, "label": "text", "bbox": {"l": 449.10074000000003, "t": 378.66302, "r": 466.08835000000005, "b": 380.78412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 251, "text": "Circling Minimums", "bbox": {"l": 449.10074000000003, "t": 378.66302, "r": 466.08835000000005, "b": 380.78412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 207, "label": "text", "bbox": {"l": 449.10074000000003, "t": 383.2203999999999, "r": 449.64444, "b": 385.34148999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 252, "text": "7", "bbox": {"l": 449.10074000000003, "t": 383.2203999999999, "r": 449.64444, "b": 385.34148999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 208, "label": "text", "bbox": {"l": 450.18811, "t": 383.2203999999999, "r": 550.77124, "b": 385.34148999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 253, "text": "K H U H Z D V D F K D Q J H W R W K H 7 ( 5 3 6 F U L W H U L D L Q W K D W D \u1087H F W V F L U F O L Q J D U H D G L P H Q V L R Q E \\ H [ S D Q G L Q J W K H D U H D V W R S U R Y L G H ", "bbox": {"l": 450.18811, "t": 383.2203999999999, "r": 550.77124, "b": 385.34148999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 209, "label": "text", "bbox": {"l": 449.10074000000003, "t": 385.75732, "r": 536.14716, "b": 387.87842, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 254, "text": "improved obstacle protection. To indicate that the new criteria had been applied to a given procedure, a ", "bbox": {"l": 449.10074000000003, "t": 385.75732, "r": 536.14716, "b": 387.87842, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 210, "label": "text", "bbox": {"l": 538.31085, "t": 385.75732, "r": 549.49921, "b": 387.87842, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 255, "text": " is placed on ", "bbox": {"l": 538.31085, "t": 385.75732, "r": 549.49921, "b": 387.87842, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 211, "label": "text", "bbox": {"l": 449.10074000000003, "t": 388.03601, "r": 547.58185, "b": 390.1571, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 256, "text": "the circling line of minimums. The new circling tables and explanatory information is located in the Legend of the TPP.", "bbox": {"l": 449.10074000000003, "t": 388.03601, "r": 547.58185, "b": 390.1571, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 212, "label": "text", "bbox": {"l": 449.10074000000003, "t": 393.2128000000001, "r": 449.6163, "b": 395.33386, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 257, "text": "7", "bbox": {"l": 449.10074000000003, "t": 393.2128000000001, "r": 449.6163, "b": 395.33386, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 213, "label": "text", "bbox": {"l": 450.1319, "t": 393.2128000000001, "r": 529.53082, "b": 395.33386, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 258, "text": "K H D S S U R D F K H V X V L Q J V W D Q G D U G F L U F O L Q J D S S U R D F K D U H D V F D Q E H L G H Q W L \u00bf H G E \\ W K H D E V H Q F H R I W K H ", "bbox": {"l": 450.1319, "t": 393.2128000000001, "r": 529.53082, "b": 395.33386, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 214, "label": "text", "bbox": {"l": 532.05829, "t": 393.2128000000001, "r": 550.42261, "b": 395.33386, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 259, "text": " on the circling line of ", "bbox": {"l": 532.05829, "t": 393.2128000000001, "r": 550.42261, "b": 395.33386, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 215, "label": "text", "bbox": {"l": 449.10074000000003, "t": 395.49149, "r": 455.74692, "b": 397.61255, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 260, "text": "minima.", "bbox": {"l": 449.10074000000003, "t": 395.49149, "r": 455.74692, "b": 397.61255, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 216, "label": "text", "bbox": {"l": 449.95525999999995, "t": 415.59549, "r": 496.2829, "b": 417.50446, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 261, "text": "$ S S O \\ 6 W D Q G D U G & L U F O L Q J $ S S U R D F K 0 D Q H X Y H U L Q J 5 D G L X V 7 D E O H ", "bbox": {"l": 449.95525999999995, "t": 415.59549, "r": 496.2829, "b": 417.50446, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 217, "label": "text", "bbox": {"l": 501.13077, "t": 409.25543, "r": 551.16101, "b": 411.1644, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 262, "text": "$ S S O \\ ( [ S D Q G H G & L U F O L Q J $ S S U R D F K 0 D Q H X Y H U L Q J $ L U V S D F H 5 D G L X V ", "bbox": {"l": 501.13077, "t": 409.25543, "r": 551.16101, "b": 411.1644, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 218, "label": "text", "bbox": {"l": 501.13077, "t": 411.30624, "r": 505.2477999999999, "b": 413.21521, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 263, "text": "Table", "bbox": {"l": 501.13077, "t": 411.30624, "r": 505.2477999999999, "b": 413.21521, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 219, "label": "text", "bbox": {"l": 449.10074000000003, "t": 420.18802, "r": 469.35599, "b": 422.73331, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 264, "text": "AIRPORT SKETCH", "bbox": {"l": 449.10074000000003, "t": 420.18802, "r": 469.35599, "b": 422.73331, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 220, "label": "text", "bbox": {"l": 449.10074000000003, "t": 425.08908, "r": 525.93616, "b": 427.21017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 265, "text": "The airport sketch is a depiction of the airport with emphasis on runway pattern and related ", "bbox": {"l": 449.10074000000003, "t": 425.08908, "r": 525.93616, "b": 427.21017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 221, "label": "text", "bbox": {"l": 449.10074000000003, "t": 427.3678, "r": 522.0343, "b": 429.48886, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 266, "text": "information, positioned in either the lower left or lower right corner of the chart to aid pi-", "bbox": {"l": 449.10074000000003, "t": 427.3678, "r": 522.0343, "b": 429.48886, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 222, "label": "text", "bbox": {"l": 449.10074000000003, "t": 429.64648, "r": 524.67151, "b": 431.76755, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 267, "text": "lot recognition of the airport from the air and to provide some information to aid on ground ", "bbox": {"l": 449.10074000000003, "t": 429.64648, "r": 524.67151, "b": 431.76755, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 223, "label": "text", "bbox": {"l": 449.10074000000003, "t": 431.92514000000006, "r": 527.172, "b": 434.04623, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 268, "text": "navigation of the airport. The runways are drawn to scale and oriented to true north. Runway ", "bbox": {"l": 449.10074000000003, "t": 431.92514000000006, "r": 527.172, "b": 434.04623, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 224, "label": "text", "bbox": {"l": 449.10074000000003, "t": 434.20383, "r": 502.39545, "b": 436.32492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 269, "text": "dimensions (length and width) are shown for all active runways.", "bbox": {"l": 449.10074000000003, "t": 434.20383, "r": 502.39545, "b": 436.32492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 225, "label": "text", "bbox": {"l": 449.10074000000003, "t": 438.7611999999999, "r": 512.92676, "b": 440.88228999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 270, "text": "Runway(s) are depicted based on what type and construction of the runway.", "bbox": {"l": 449.10074000000003, "t": 438.7611999999999, "r": 512.92676, "b": 440.88228999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 226, "label": "text", "bbox": {"l": 449.95525999999995, "t": 444.07001, "r": 460.02307, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 271, "text": "Hard Surface", "bbox": {"l": 449.95525999999995, "t": 444.07001, "r": 460.02307, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 227, "label": "text", "bbox": {"l": 464.89963, "t": 444.07001, "r": 473.98819, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 272, "text": "Other Than ", "bbox": {"l": 464.89963, "t": 444.07001, "r": 473.98819, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 228, "label": "text", "bbox": {"l": 464.89963, "t": 446.12085, "r": 474.96744, "b": 448.02979, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 273, "text": "Hard Surface", "bbox": {"l": 464.89963, "t": 446.12085, "r": 474.96744, "b": 448.02979, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 229, "label": "text", "bbox": {"l": 478.91357, "t": 444.07001, "r": 489.45648, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 274, "text": "Metal Surface", "bbox": {"l": 478.91357, "t": 444.07001, "r": 489.45648, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 230, "label": "text", "bbox": {"l": 493.06420999999995, "t": 444.07001, "r": 505.03076, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 275, "text": "Closed Runway", "bbox": {"l": 493.06420999999995, "t": 444.07001, "r": 505.03076, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 231, "label": "text", "bbox": {"l": 509.5809, "t": 444.07001, "r": 524.30237, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 276, "text": "Under Construction", "bbox": {"l": 509.5809, "t": 444.07001, "r": 524.30237, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 232, "label": "text", "bbox": {"l": 449.95525999999995, "t": 454.81207, "r": 458.31406, "b": 456.72104, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 277, "text": "Stopways, ", "bbox": {"l": 449.95525999999995, "t": 454.81207, "r": 458.31406, "b": 456.72104, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 233, "label": "text", "bbox": {"l": 449.95525999999995, "t": 456.86288, "r": 461.92083999999994, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 278, "text": "Taxiways, Park-", "bbox": {"l": 449.95525999999995, "t": 456.86288, "r": 461.92083999999994, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 234, "label": "text", "bbox": {"l": 449.95525999999995, "t": 458.91373, "r": 457.08014, "b": 460.82268999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 279, "text": "ing Areas", "bbox": {"l": 449.95525999999995, "t": 458.91373, "r": 457.08014, "b": 460.82268999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 235, "label": "text", "bbox": {"l": 464.89963, "t": 454.81207, "r": 472.87732, "b": 456.72104, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 280, "text": "Displaced ", "bbox": {"l": 464.89963, "t": 454.81207, "r": 472.87732, "b": 456.72104, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 236, "label": "text", "bbox": {"l": 464.89963, "t": 456.86288, "r": 472.49792, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 281, "text": "Threshold", "bbox": {"l": 464.89963, "t": 456.86288, "r": 472.49792, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 237, "label": "text", "bbox": {"l": 478.91357, "t": 454.81207, "r": 483.61584, "b": 456.72104, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 282, "text": "Closed", "bbox": {"l": 478.91357, "t": 454.81207, "r": 483.61584, "b": 456.72104, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 238, "label": "text", "bbox": {"l": 478.91357, "t": 456.86288, "r": 486.60754000000003, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 283, "text": "Pavement", "bbox": {"l": 478.91357, "t": 456.86288, "r": 486.60754000000003, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 239, "label": "text", "bbox": {"l": 493.06420999999995, "t": 454.81207, "r": 504.20648, "b": 456.72104, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 284, "text": "Water Runway", "bbox": {"l": 493.06420999999995, "t": 454.81207, "r": 504.20648, "b": 456.72104, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 240, "label": "text", "bbox": {"l": 449.10074000000003, "t": 469.32974, "r": 548.59674, "b": 471.45081, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 285, "text": "Taxiways and aprons are shaded grey. Other runway features that may be shown are runway numbers, runway dimen-", "bbox": {"l": 449.10074000000003, "t": 469.32974, "r": 548.59674, "b": 471.45081, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 241, "label": "text", "bbox": {"l": 449.10074000000003, "t": 471.60843, "r": 500.08181999999994, "b": 473.72949, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 286, "text": "sions, runway slope, arresting gear, and displaced threshold.", "bbox": {"l": 449.10074000000003, "t": 471.60843, "r": 500.08181999999994, "b": 473.72949, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 242, "label": "text", "bbox": {"l": 449.10074000000003, "t": 476.16577, "r": 449.59933000000007, "b": 478.28687, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 287, "text": "2", "bbox": {"l": 449.10074000000003, "t": 476.16577, "r": 449.59933000000007, "b": 478.28687, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 243, "label": "text", "bbox": {"l": 450.09796, "t": 476.16577, "r": 547.82562, "b": 478.28687, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 288, "text": "W K H U L Q I R U P D W L R Q F R Q F H U Q L Q J O L J K W L Q J \u00bf Q D O D S S U R D F K E H D U L Q J V D L U S R U W E H D F R Q R E V W D F O H V F R Q W U R O W R Z H U 1 $ 9 $ , ' V K H O L ", "bbox": {"l": 450.09796, "t": 476.16577, "r": 547.82562, "b": 478.28687, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 244, "label": "text", "bbox": {"l": 547.82623, "t": 476.16577, "r": 548.45862, "b": 478.28687, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 289, "text": "-", "bbox": {"l": 547.82623, "t": 476.16577, "r": 548.45862, "b": 478.28687, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 245, "label": "text", "bbox": {"l": 449.10074000000003, "t": 478.44446, "r": 470.52609000000007, "b": 480.56555, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 290, "text": "pads may also be shown.", "bbox": {"l": 449.10074000000003, "t": 478.44446, "r": 470.52609000000007, "b": 480.56555, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 246, "label": "text", "bbox": {"l": 449.10074000000003, "t": 483.00183, "r": 493.37906000000004, "b": 485.12292, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 291, "text": "$ L U S R U W ( O H Y D W L R Q D Q G 7 R X F K G R Z Q = R Q H ( O H Y D W L R Q ", "bbox": {"l": 449.10074000000003, "t": 483.00183, "r": 493.37906000000004, "b": 485.12292, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 449.10074000000003, "t": 487.5592, "r": 551.80023, "b": 496.51636, "coord_origin": "TOPLEFT"}, "confidence": 0.5027860403060913, "cells": [{"id": 292, "text": "The airport elevation is shown enclosed within a box in the upper left corner of the sketch box and the touchdown zone ", "bbox": {"l": 449.10074000000003, "t": 487.5592, "r": 549.16168, "b": 489.6803, "coord_origin": "TOPLEFT"}}, {"id": 293, "text": "elevation (TDZE) is shown in the upper right corner of the sketch box. The airport elevation is the highest point of an ", "bbox": {"l": 449.10074000000003, "t": 489.83789, "r": 546.90881, "b": 491.95898, "coord_origin": "TOPLEFT"}}, {"id": 294, "text": "D L U S R U W \u00b6 V X V D E O H U X Q Z D \\ V P H D V X U H G L Q I H H W I U R P P H D Q V H D O H Y H O 7 K H 7 ' = ( L V W K H K L J K H V W H O H Y D W L R Q L Q W K H \u00bf U V W I H H W R I ", "bbox": {"l": 449.10074000000003, "t": 492.11658, "r": 551.80023, "b": 494.23767, "coord_origin": "TOPLEFT"}}, {"id": 295, "text": "the landing surface. Circling only approaches will not show a TDZE.", "bbox": {"l": 449.10074000000003, "t": 494.39526, "r": 505.85068000000007, "b": 496.51636, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 247, "label": "text", "bbox": {"l": 498.80661000000003, "t": 515.9437, "r": 502.08792, "b": 519.01764, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 296, "text": "114", "bbox": {"l": 498.80661000000003, "t": 515.9437, "r": 502.08792, "b": 519.01764, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 248, "label": "text", "bbox": {"l": 444.56319999999994, "t": 422.84869, "r": 446.25998, "b": 471.87128, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 297, "text": "FAA Chart Users\u2019 Guide - Terminal Procedures Publication (TPP) - Terms", "bbox": {"l": 444.56319999999994, "t": 422.84869, "r": 446.25998, "b": 471.87128, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 249, "label": "text", "bbox": {"l": 329.40536, "t": 379.37537, "r": 355.13138, "b": 382.13336, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 298, "text": "AGL 2013 Financial Calendar", "bbox": {"l": 329.40536, "t": 379.37537, "r": 355.13138, "b": 382.13336, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 250, "label": "text", "bbox": {"l": 329.40536, "t": 382.30273, "r": 330.96848, "b": 384.55927, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 299, "text": "22", "bbox": {"l": 329.40536, "t": 382.30273, "r": 330.96848, "b": 384.55927, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 251, "label": "text", "bbox": {"l": 331.75003, "t": 382.30273, "r": 341.12875, "b": 384.55927, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 300, "text": "August 2012 ", "bbox": {"l": 331.75003, "t": 382.30273, "r": 341.12875, "b": 384.55927, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 252, "label": "text", "bbox": {"l": 350.4722, "t": 382.30273, "r": 384.81079, "b": 384.55927, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 301, "text": "2012 full year result and fi nal dividend announced", "bbox": {"l": 350.4722, "t": 382.30273, "r": 384.81079, "b": 384.55927, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 253, "label": "text", "bbox": {"l": 329.40536, "t": 384.84552, "r": 330.97336, "b": 387.10205, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 302, "text": "30", "bbox": {"l": 329.40536, "t": 384.84552, "r": 330.97336, "b": 387.10205, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 254, "label": "text", "bbox": {"l": 331.75735, "t": 384.84552, "r": 341.16534, "b": 387.10205, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 303, "text": "August 2012 ", "bbox": {"l": 331.75735, "t": 384.84552, "r": 341.16534, "b": 387.10205, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 255, "label": "text", "bbox": {"l": 350.4722, "t": 384.84552, "r": 372.90613, "b": 387.10205, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 304, "text": "Ex-dividend trading commences", "bbox": {"l": 350.4722, "t": 384.84552, "r": 372.90613, "b": 387.10205, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 256, "label": "text", "bbox": {"l": 329.40536, "t": 387.38828, "r": 330.20337, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 305, "text": "5", "bbox": {"l": 329.40536, "t": 387.38828, "r": 330.20337, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 257, "label": "text", "bbox": {"l": 331.00137, "t": 387.38828, "r": 342.9715, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 306, "text": "September 2012 ", "bbox": {"l": 331.00137, "t": 387.38828, "r": 342.9715, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 258, "label": "text", "bbox": {"l": 350.4722, "t": 387.38828, "r": 374.88693, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 307, "text": "Record date for 2012 fi nal dividend", "bbox": {"l": 350.4722, "t": 387.38828, "r": 374.88693, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 259, "label": "text", "bbox": {"l": 329.40536, "t": 389.93103, "r": 331.0173, "b": 392.18762, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 308, "text": "27", "bbox": {"l": 329.40536, "t": 389.93103, "r": 331.0173, "b": 392.18762, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 260, "label": "text", "bbox": {"l": 331.82327, "t": 389.93103, "r": 343.91284, "b": 392.18762, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 309, "text": "September 2012 ", "bbox": {"l": 331.82327, "t": 389.93103, "r": 343.91284, "b": 392.18762, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 261, "label": "text", "bbox": {"l": 350.4722, "t": 389.93103, "r": 365.65988, "b": 392.18762, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 310, "text": "Final dividend payable", "bbox": {"l": 350.4722, "t": 389.93103, "r": 365.65988, "b": 392.18762, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 262, "label": "text", "bbox": {"l": 329.40536, "t": 392.47382, "r": 330.98804, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 311, "text": "23", "bbox": {"l": 329.40536, "t": 392.47382, "r": 330.98804, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 263, "label": "text", "bbox": {"l": 331.77936, "t": 392.47382, "r": 342.06674, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 312, "text": "October 2012 ", "bbox": {"l": 331.77936, "t": 392.47382, "r": 342.06674, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 264, "label": "text", "bbox": {"l": 350.4722, "t": 392.47382, "r": 367.22156, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 313, "text": "Annual General Meeting", "bbox": {"l": 350.4722, "t": 392.47382, "r": 367.22156, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 265, "label": "text", "bbox": {"l": 329.40536, "t": 395.0166, "r": 330.99741, "b": 397.27313, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 314, "text": "27", "bbox": {"l": 329.40536, "t": 395.0166, "r": 330.99741, "b": 397.27313, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 266, "label": "text", "bbox": {"l": 331.7934, "t": 395.0166, "r": 342.1416, "b": 397.27313, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 315, "text": "February 2013", "bbox": {"l": 331.7934, "t": 395.0166, "r": 342.1416, "b": 397.27313, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 267, "label": "text", "bbox": {"l": 342.64841, "t": 395.18298, "r": 342.65811, "b": 396.49857000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 316, "text": " 1", "bbox": {"l": 342.64841, "t": 395.18298, "r": 342.65811, "b": 396.49857000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 268, "label": "text", "bbox": {"l": 350.47177, "t": 395.01474, "r": 386.25897, "b": 397.2713, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 317, "text": "2013 interim result and interim dividend announced", "bbox": {"l": 350.47177, "t": 395.01474, "r": 386.25897, "b": 397.2713, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 269, "label": "text", "bbox": {"l": 329.40491, "t": 397.55749999999995, "r": 331.02695, "b": 399.81406, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 318, "text": "28", "bbox": {"l": 329.40491, "t": 397.55749999999995, "r": 331.02695, "b": 399.81406, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 270, "label": "text", "bbox": {"l": 331.83795, "t": 397.55749999999995, "r": 340.75909, "b": 399.81406, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 319, "text": "August 2013", "bbox": {"l": 331.83795, "t": 397.55749999999995, "r": 340.75909, "b": 399.81406, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 271, "label": "text", "bbox": {"l": 341.26437, "t": 397.7254, "r": 341.27408, "b": 399.04095, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 320, "text": " 1", "bbox": {"l": 341.26437, "t": 397.7254, "r": 341.27408, "b": 399.04095, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 272, "label": "text", "bbox": {"l": 350.47144, "t": 397.55713, "r": 385.93265, "b": 399.81369, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 321, "text": "2013 full year results and fi nal dividend announced ", "bbox": {"l": 350.47144, "t": 397.55713, "r": 385.93265, "b": 399.81369, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 273, "label": "text", "bbox": {"l": 329.40536, "t": 400.46155, "r": 329.87708, "b": 401.96588, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 322, "text": "1", "bbox": {"l": 329.40536, "t": 400.46155, "r": 329.87708, "b": 401.96588, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 274, "label": "text", "bbox": {"l": 330.34882, "t": 400.46155, "r": 358.65204, "b": 401.96588, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 323, "text": "Indicative dates only, subject to change/Board confi rmation", "bbox": {"l": 330.34882, "t": 400.46155, "r": 358.65204, "b": 401.96588, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 275, "label": "text", "bbox": {"l": 329.40536, "t": 404.34503, "r": 391.771, "b": 406.60156, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 324, "text": "AGL\u2019s Annual General Meeting will be held at the City Recital Hall, Angel Place, Sydney ", "bbox": {"l": 329.40536, "t": 404.34503, "r": 391.771, "b": 406.60156, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 276, "label": "text", "bbox": {"l": 329.40536, "t": 406.37857, "r": 369.65308, "b": 408.63513000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 325, "text": "commencing at 10.30am on Tuesday 23 October 2012.", "bbox": {"l": 329.40536, "t": 406.37857, "r": 369.65308, "b": 408.63513000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 277, "label": "text", "bbox": {"l": 363.54486, "t": 460.53054999999995, "r": 379.25955, "b": 465.54507, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 326, "text": "Ye s te rd ay", "bbox": {"l": 363.54486, "t": 460.53054999999995, "r": 379.25955, "b": 465.54507, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 278, "label": "text", "bbox": {"l": 363.54486, "t": 466.7157, "r": 391.38229, "b": 468.97223, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 327, "text": "Established in Sydney in 1837, and then ", "bbox": {"l": 363.54486, "t": 466.7157, "r": 391.38229, "b": 468.97223, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 279, "label": "text", "bbox": {"l": 363.54486, "t": 468.74924, "r": 395.01788, "b": 471.00577, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 328, "text": "known as The Australian Gas Light Company, ", "bbox": {"l": 363.54486, "t": 468.74924, "r": 395.01788, "b": 471.00577, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 280, "label": "text", "bbox": {"l": 363.54486, "t": 470.78281, "r": 394.08322, "b": 473.03934, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 329, "text": "the AGL business has an established history ", "bbox": {"l": 363.54486, "t": 470.78281, "r": 394.08322, "b": 473.03934, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 281, "label": "text", "bbox": {"l": 363.54486, "t": 472.81635, "r": 390.60727, "b": 475.07288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 330, "text": "and reputation for serving the gas and ", "bbox": {"l": 363.54486, "t": 472.81635, "r": 390.60727, "b": 475.07288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 282, "label": "text", "bbox": {"l": 363.54486, "t": 474.84988, "r": 393.49612, "b": 477.10645, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 331, "text": "electricity needs of Australian households. ", "bbox": {"l": 363.54486, "t": 474.84988, "r": 393.49612, "b": 477.10645, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 283, "label": "text", "bbox": {"l": 363.54486, "t": 476.88345, "r": 394.11481, "b": 479.13998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 332, "text": "In 1841, when AGL supplied the gas to light ", "bbox": {"l": 363.54486, "t": 476.88345, "r": 394.11481, "b": 479.13998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 284, "label": "text", "bbox": {"l": 363.54486, "t": 478.91699, "r": 393.75891, "b": 481.17352, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 333, "text": "the fi rst public street lamp, it was reported ", "bbox": {"l": 363.54486, "t": 478.91699, "r": 393.75891, "b": 481.17352, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 285, "label": "text", "bbox": {"l": 363.54486, "t": 480.95053, "r": 390.4975, "b": 483.20709, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 334, "text": "in the Sydney Gazette as a \u201cwonderful ", "bbox": {"l": 363.54486, "t": 480.95053, "r": 390.4975, "b": 483.20709, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 286, "label": "text", "bbox": {"l": 363.54486, "t": 482.9841, "r": 395.70975, "b": 485.24063, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 335, "text": "achievement of scientifi c knowledge, assisted ", "bbox": {"l": 363.54486, "t": 482.9841, "r": 395.70975, "b": 485.24063, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 287, "label": "text", "bbox": {"l": 363.54486, "t": 485.01764, "r": 394.27283, "b": 487.2742, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 336, "text": "by mechanical ingenuity.\u201d Within two years, ", "bbox": {"l": 363.54486, "t": 485.01764, "r": 394.27283, "b": 487.2742, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 288, "label": "text", "bbox": {"l": 363.54486, "t": 487.05121, "r": 396.65939, "b": 489.30774, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 337, "text": "165 gas lamps were lighting the City of Sydney.", "bbox": {"l": 363.54486, "t": 487.05121, "r": 396.65939, "b": 489.30774, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 289, "label": "text", "bbox": {"l": 329.4054, "t": 419.93124, "r": 384.19696, "b": 431.09412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 338, "text": "Looking back on ", "bbox": {"l": 329.4054, "t": 419.93124, "r": 384.19696, "b": 431.09412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 290, "label": "text", "bbox": {"l": 329.4054, "t": 430.10379, "r": 372.16626, "b": 441.26669, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 339, "text": "175 years of ", "bbox": {"l": 329.4054, "t": 430.10379, "r": 372.16626, "b": 441.26669, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 291, "label": "text", "bbox": {"l": 329.4054, "t": 440.27636999999993, "r": 385.3981, "b": 451.43924, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 340, "text": "looking forward.", "bbox": {"l": 329.4054, "t": 440.27636999999993, "r": 385.3981, "b": 451.43924, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 292, "label": "text", "bbox": {"l": 329.40536, "t": 372.16159, "r": 353.36179, "b": 373.91669, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 341, "text": "AGL Energy Limited ABN 74 115 061 375", "bbox": {"l": 329.40536, "t": 372.16159, "r": 353.36179, "b": 373.91669, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 293, "label": "text", "bbox": {"l": 546.20587, "t": 360.90448, "r": 548.23407, "b": 362.82242, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 342, "text": "29", "bbox": {"l": 546.20587, "t": 360.90448, "r": 548.23407, "b": 362.82242, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 294, "label": "text", "bbox": {"l": 497.77728, "t": 251.43384000000003, "r": 542.8255, "b": 254.94385, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 343, "text": "signs, signals and road markings", "bbox": {"l": 497.77728, "t": 251.43384000000003, "r": 542.8255, "b": 254.94385, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 295, "label": "text", "bbox": {"l": 490.30679, "t": 251.47478999999998, "r": 492.09982, "b": 254.98479999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 344, "text": "3", "bbox": {"l": 490.30679, "t": 251.47478999999998, "r": 492.09982, "b": 254.98479999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 296, "label": "text", "bbox": {"l": 498.15335, "t": 263.88922, "r": 500.05637, "b": 265.92719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 345, "text": "In ", "bbox": {"l": 498.15335, "t": 263.88922, "r": 500.05637, "b": 265.92719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 297, "label": "text", "bbox": {"l": 500.05637, "t": 263.85717999999997, "r": 524.37036, "b": 265.86310000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 346, "text": "chapter 2, you and your vehicle", "bbox": {"l": 500.05637, "t": 263.85717999999997, "r": 524.37036, "b": 265.86310000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 298, "label": "text", "bbox": {"l": 524.37036, "t": 263.88922, "r": 539.89124, "b": 265.92719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 347, "text": ", you learned about ", "bbox": {"l": 524.37036, "t": 263.88922, "r": 539.89124, "b": 265.92719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 299, "label": "text", "bbox": {"l": 498.15335, "t": 265.93224999999995, "r": 544.50403, "b": 267.97020999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 348, "text": "some of the controls in your vehicle. This chapter is a handy ", "bbox": {"l": 498.15335, "t": 265.93224999999995, "r": 544.50403, "b": 267.97020999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 300, "label": "text", "bbox": {"l": 498.15335, "t": 267.97533999999996, "r": 544.01343, "b": 270.01331000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 349, "text": "reference section that gives examples of the most common ", "bbox": {"l": 498.15335, "t": 267.97533999999996, "r": 544.01343, "b": 270.01331000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 301, "label": "text", "bbox": {"l": 498.15335, "t": 270.01831000000004, "r": 544.11987, "b": 272.05634, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 350, "text": "signs, signals and road markings that keep traffi c organized ", "bbox": {"l": 498.15335, "t": 270.01831000000004, "r": 544.11987, "b": 272.05634, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 302, "label": "text", "bbox": {"l": 498.15335, "t": 272.06140000000005, "r": 515.41071, "b": 274.09937, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 351, "text": "and flowing smoothly. ", "bbox": {"l": 498.15335, "t": 272.06140000000005, "r": 515.41071, "b": 274.09937, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 303, "label": "text", "bbox": {"l": 498.15335, "t": 277.34619, "r": 505.64642000000003, "b": 280.9357, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 352, "text": "Signs", "bbox": {"l": 498.15335, "t": 277.34619, "r": 505.64642000000003, "b": 280.9357, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 304, "label": "text", "bbox": {"l": 498.15335, "t": 281.82187, "r": 543.92957, "b": 283.85983, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 353, "text": "There are three ways to read signs: by their shape, colour and ", "bbox": {"l": 498.15335, "t": 281.82187, "r": 543.92957, "b": 283.85983, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 305, "label": "text", "bbox": {"l": 498.15335, "t": 283.8649, "r": 545.67834, "b": 285.90289, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 354, "text": "the messages printed on them. Understanding these three ways ", "bbox": {"l": 498.15335, "t": 283.8649, "r": 545.67834, "b": 285.90289, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 306, "label": "text", "bbox": {"l": 498.15335, "t": 285.90796, "r": 545.26471, "b": 287.94592, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 355, "text": "of classifying signs will help you figure out the meaning of signs ", "bbox": {"l": 498.15335, "t": 285.90796, "r": 545.26471, "b": 287.94592, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 307, "label": "text", "bbox": {"l": 498.15335, "t": 287.95099, "r": 513.31335, "b": 289.98895, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 356, "text": "that are new to you. ", "bbox": {"l": 498.15335, "t": 287.95099, "r": 513.31335, "b": 289.98895, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 308, "label": "text", "bbox": {"l": 505.43439, "t": 303.07596, "r": 508.53033000000005, "b": 304.89639, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 357, "text": "Stop", "bbox": {"l": 505.43439, "t": 303.07596, "r": 508.53033000000005, "b": 304.89639, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 309, "label": "text", "bbox": {"l": 527.45502, "t": 303.25354, "r": 541.44678, "b": 305.07397, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 358, "text": "Yield the right-of-way", "bbox": {"l": 527.45502, "t": 303.25354, "r": 541.44678, "b": 305.07397, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 310, "label": "text", "bbox": {"l": 501.79385, "t": 321.18973, "r": 510.41632, "b": 323.01016, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 359, "text": "Shows driving", "bbox": {"l": 501.79385, "t": 321.18973, "r": 510.41632, "b": 323.01016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 311, "label": "text", "bbox": {"l": 501.79385, "t": 322.87731999999994, "r": 509.04268999999994, "b": 324.69775000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 360, "text": "regulations", "bbox": {"l": 501.79385, "t": 322.87731999999994, "r": 509.04268999999994, "b": 324.69775000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 312, "label": "text", "bbox": {"l": 518.66455, "t": 319.59146, "r": 529.80902, "b": 321.41190000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 361, "text": "Explains lane use", "bbox": {"l": 518.66455, "t": 319.59146, "r": 529.80902, "b": 321.41190000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 313, "label": "text", "bbox": {"l": 534.87561, "t": 318.37616, "r": 546.95142, "b": 320.19659, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 362, "text": "School zone signs ", "bbox": {"l": 534.87561, "t": 318.37616, "r": 546.95142, "b": 320.19659, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 314, "label": "text", "bbox": {"l": 534.87561, "t": 320.0637500000001, "r": 545.05762, "b": 321.88419, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 363, "text": "are fl uorescent ", "bbox": {"l": 534.87561, "t": 320.0637500000001, "r": 545.05762, "b": 321.88419, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 315, "label": "text", "bbox": {"l": 534.87561, "t": 321.75134, "r": 543.32263, "b": 323.57178, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 364, "text": "yellow-green", "bbox": {"l": 534.87561, "t": 321.75134, "r": 543.32263, "b": 323.57178, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 316, "label": "text", "bbox": {"l": 499.21862999999996, "t": 338.12772, "r": 512.62451, "b": 339.94815, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 365, "text": "Tells about motorist ", "bbox": {"l": 499.21862999999996, "t": 338.12772, "r": 512.62451, "b": 339.94815, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 317, "label": "text", "bbox": {"l": 499.21862999999996, "t": 339.81531000000007, "r": 504.39917, "b": 341.63574, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 366, "text": "services", "bbox": {"l": 499.21862999999996, "t": 339.81531000000007, "r": 504.39917, "b": 341.63574, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 318, "label": "text", "bbox": {"l": 516.97748, "t": 338.06039, "r": 529.77484, "b": 339.88082999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 367, "text": "Shows a permitted ", "bbox": {"l": 516.97748, "t": 338.06039, "r": 529.77484, "b": 339.88082999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 319, "label": "text", "bbox": {"l": 516.97748, "t": 339.74799, "r": 520.96399, "b": 341.56842, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 368, "text": "action", "bbox": {"l": 516.97748, "t": 339.74799, "r": 520.96399, "b": 341.56842, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 320, "label": "text", "bbox": {"l": 534.55847, "t": 337.88281, "r": 548.58453, "b": 339.7032500000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 369, "text": "Shows an action that ", "bbox": {"l": 534.55847, "t": 337.88281, "r": 548.58453, "b": 339.7032500000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 321, "label": "text", "bbox": {"l": 534.55847, "t": 339.57040000000006, "r": 545.08862, "b": 341.39084, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 370, "text": "is not permitted", "bbox": {"l": 534.55847, "t": 339.57040000000006, "r": 545.08862, "b": 341.39084, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 322, "label": "text", "bbox": {"l": 483.05853, "t": 356.17416, "r": 494.72577, "b": 357.9946, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 371, "text": "Warns of hazards ", "bbox": {"l": 483.05853, "t": 356.17416, "r": 494.72577, "b": 357.9946, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 323, "label": "text", "bbox": {"l": 483.05853, "t": 357.86179, "r": 487.07525999999996, "b": 359.68222, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 372, "text": "ahead", "bbox": {"l": 483.05853, "t": 357.86179, "r": 487.07525999999996, "b": 359.68222, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 324, "label": "text", "bbox": {"l": 499.39645, "t": 356.26297000000005, "r": 504.69171, "b": 358.0834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 373, "text": "Warns of", "bbox": {"l": 499.39645, "t": 356.26297000000005, "r": 504.69171, "b": 358.0834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 325, "label": "text", "bbox": {"l": 499.39645, "t": 357.95056, "r": 511.69116, "b": 359.77099999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 374, "text": "construction zones", "bbox": {"l": 499.39645, "t": 357.95056, "r": 511.69116, "b": 359.77099999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 326, "label": "text", "bbox": {"l": 516.75891, "t": 356.26297000000005, "r": 527.42938, "b": 358.0834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 375, "text": "Railway crossing", "bbox": {"l": 516.75891, "t": 356.26297000000005, "r": 527.42938, "b": 358.0834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 327, "label": "text", "bbox": {"l": 534.5141, "t": 352.92981, "r": 547.89862, "b": 354.75024, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 376, "text": "Shows distance and ", "bbox": {"l": 534.5141, "t": 352.92981, "r": 547.89862, "b": 354.75024, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 328, "label": "text", "bbox": {"l": 534.5141, "t": 354.6174, "r": 540.2818, "b": 356.43784, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 377, "text": "direction", "bbox": {"l": 534.5141, "t": 354.6174, "r": 540.2818, "b": 356.43784, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 329, "label": "text", "bbox": {"l": 478.37466, "t": 270.14075, "r": 479.14251999999993, "b": 272.17877, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 378, "text": "\u2022", "bbox": {"l": 478.37466, "t": 270.14075, "r": 479.14251999999993, "b": 272.17877, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 330, "label": "text", "bbox": {"l": 479.91036999999994, "t": 270.14075, "r": 483.74963, "b": 272.17877, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 379, "text": "Signs", "bbox": {"l": 479.91036999999994, "t": 270.14075, "r": 483.74963, "b": 272.17877, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 331, "label": "text", "bbox": {"l": 479.97293, "t": 272.84717, "r": 492.31219, "b": 274.34888, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 380, "text": "- regulatory signs", "bbox": {"l": 479.97293, "t": 272.84717, "r": 492.31219, "b": 274.34888, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 332, "label": "text", "bbox": {"l": 479.97293, "t": 275.14513999999997, "r": 486.72598000000005, "b": 276.64679, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 381, "text": "- school, ", "bbox": {"l": 479.97293, "t": 275.14513999999997, "r": 486.72598000000005, "b": 276.64679, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 333, "label": "text", "bbox": {"l": 481.21602999999993, "t": 276.77972, "r": 492.93286000000006, "b": 278.81768999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 382, "text": "playground and ", "bbox": {"l": 481.21602999999993, "t": 276.77972, "r": 492.93286000000006, "b": 278.81768999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 334, "label": "text", "bbox": {"l": 481.21602999999993, "t": 278.82275000000004, "r": 491.82938000000007, "b": 280.86075, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 383, "text": "crosswalk signs", "bbox": {"l": 481.21602999999993, "t": 278.82275000000004, "r": 491.82938000000007, "b": 280.86075, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 335, "label": "text", "bbox": {"l": 479.97293, "t": 281.52759, "r": 491.00775000000004, "b": 283.02924, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 384, "text": "- lane use signs", "bbox": {"l": 479.97293, "t": 281.52759, "r": 491.00775000000004, "b": 283.02924, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 336, "label": "text", "bbox": {"l": 479.97293, "t": 283.82556, "r": 493.32748, "b": 285.3272099999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 385, "text": "- turn control signs", "bbox": {"l": 479.97293, "t": 283.82556, "r": 493.32748, "b": 285.3272099999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 337, "label": "text", "bbox": {"l": 479.97293, "t": 286.1235, "r": 490.4915199999999, "b": 287.62518, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 386, "text": "- parking signs", "bbox": {"l": 479.97293, "t": 286.1235, "r": 490.4915199999999, "b": 287.62518, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 338, "label": "text", "bbox": {"l": 479.97293, "t": 288.42148, "r": 491.17004000000003, "b": 289.92316, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 387, "text": "- reserved lane ", "bbox": {"l": 479.97293, "t": 288.42148, "r": 491.17004000000003, "b": 289.92316, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 339, "label": "text", "bbox": {"l": 481.21602999999993, "t": 290.05605999999995, "r": 484.77405000000005, "b": 292.09406, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 388, "text": "signs", "bbox": {"l": 481.21602999999993, "t": 290.05605999999995, "r": 484.77405000000005, "b": 292.09406, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 340, "label": "text", "bbox": {"l": 479.97293, "t": 292.76169000000004, "r": 490.83398, "b": 294.26334, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 389, "text": "- warning signs", "bbox": {"l": 479.97293, "t": 292.76169000000004, "r": 490.83398, "b": 294.26334, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 341, "label": "text", "bbox": {"l": 479.97293, "t": 295.05963, "r": 491.62692, "b": 296.56131, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 390, "text": "- object markers", "bbox": {"l": 479.97293, "t": 295.05963, "r": 491.62692, "b": 296.56131, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 342, "label": "text", "bbox": {"l": 479.97293, "t": 297.3576, "r": 490.37341, "b": 298.8592499999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 391, "text": "- construction ", "bbox": {"l": 479.97293, "t": 297.3576, "r": 490.37341, "b": 298.8592499999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 343, "label": "text", "bbox": {"l": 481.21602999999993, "t": 298.99219, "r": 484.77405000000005, "b": 301.03015, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 392, "text": "signs", "bbox": {"l": 481.21602999999993, "t": 298.99219, "r": 484.77405000000005, "b": 301.03015, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 344, "label": "text", "bbox": {"l": 479.97293, "t": 301.69780999999995, "r": 492.93912, "b": 303.19946, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 393, "text": "- information and ", "bbox": {"l": 479.97293, "t": 301.69780999999995, "r": 492.93912, "b": 303.19946, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 345, "label": "text", "bbox": {"l": 481.21602999999993, "t": 303.3324, "r": 493.00525, "b": 305.37036, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 394, "text": "destination signs", "bbox": {"l": 481.21602999999993, "t": 303.3324, "r": 493.00525, "b": 305.37036, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 346, "label": "text", "bbox": {"l": 479.97293, "t": 306.0379899999999, "r": 489.99047999999993, "b": 307.53967, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 395, "text": "- railway signs", "bbox": {"l": 479.97293, "t": 306.0379899999999, "r": 489.99047999999993, "b": 307.53967, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 347, "label": "text", "bbox": {"l": 478.375, "t": 308.24789, "r": 479.1032400000001, "b": 310.28586, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 396, "text": "\u2022", "bbox": {"l": 478.375, "t": 308.24789, "r": 479.1032400000001, "b": 310.28586, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 348, "label": "text", "bbox": {"l": 479.83151, "t": 308.24789, "r": 484.92925999999994, "b": 310.28586, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 397, "text": "Signals", "bbox": {"l": 479.83151, "t": 308.24789, "r": 484.92925999999994, "b": 310.28586, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 349, "label": "text", "bbox": {"l": 479.97293, "t": 310.95358, "r": 490.00091999999995, "b": 312.45526, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 398, "text": "- lane control ", "bbox": {"l": 479.97293, "t": 310.95358, "r": 490.00091999999995, "b": 312.45526, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 350, "label": "text", "bbox": {"l": 481.21602999999993, "t": 312.5881999999999, "r": 485.95331, "b": 314.62616, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 399, "text": "signals", "bbox": {"l": 481.21602999999993, "t": 312.5881999999999, "r": 485.95331, "b": 314.62616, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 351, "label": "text", "bbox": {"l": 479.97293, "t": 315.29379, "r": 489.29876999999993, "b": 316.79544, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 400, "text": "- traffic lights", "bbox": {"l": 479.97293, "t": 315.29379, "r": 489.29876999999993, "b": 316.79544, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 352, "label": "text", "bbox": {"l": 478.375, "t": 317.50366, "r": 479.18129999999996, "b": 319.5416599999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 401, "text": "\u2022", "bbox": {"l": 478.375, "t": 317.50366, "r": 479.18129999999996, "b": 319.5416599999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 353, "label": "text", "bbox": {"l": 479.98761, "t": 317.50366, "r": 490.46960000000007, "b": 319.5416599999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 402, "text": "Road markings", "bbox": {"l": 479.98761, "t": 317.50366, "r": 490.46960000000007, "b": 319.5416599999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 354, "label": "text", "bbox": {"l": 479.97293, "t": 320.20938, "r": 489.26166000000006, "b": 321.71103, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 403, "text": "- yellow lines", "bbox": {"l": 479.97293, "t": 320.20938, "r": 489.26166000000006, "b": 321.71103, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 355, "label": "text", "bbox": {"l": 479.97293, "t": 322.50732, "r": 488.59189, "b": 324.009, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 404, "text": "- white lines", "bbox": {"l": 479.97293, "t": 322.50732, "r": 488.59189, "b": 324.009, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 356, "label": "text", "bbox": {"l": 479.97293, "t": 324.8053, "r": 491.17004000000003, "b": 326.30698, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 405, "text": "- reserved lane ", "bbox": {"l": 479.97293, "t": 324.8053, "r": 491.17004000000003, "b": 326.30698, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 357, "label": "text", "bbox": {"l": 481.21602999999993, "t": 326.43988, "r": 487.58978, "b": 328.47784, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 406, "text": "markings", "bbox": {"l": 481.21602999999993, "t": 326.43988, "r": 487.58978, "b": 328.47784, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 358, "label": "text", "bbox": {"l": 479.97293, "t": 329.14551, "r": 491.75177, "b": 330.64716, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 407, "text": "- other markings", "bbox": {"l": 479.97293, "t": 329.14551, "r": 491.75177, "b": 330.64716, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 359, "label": "text", "bbox": {"l": 478.15246999999994, "t": 265.07030999999995, "r": 493.75586, "b": 268.06872999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 408, "text": "in this chapter", "bbox": {"l": 478.15246999999994, "t": 265.07030999999995, "r": 493.75586, "b": 268.06872999999996, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 16, "label": "caption", "bbox": {"l": 317.95499, "t": 540.08299, "r": 559.80579, "b": 559.51524, "coord_origin": "TOPLEFT"}, "confidence": 0.7793365120887756, "cells": [{"id": 409, "text": "Figure 1: Four examples of complex page layouts across dif-", "bbox": {"l": 317.95499, "t": 540.08299, "r": 559.80579, "b": 548.55624, "coord_origin": "TOPLEFT"}}, {"id": 410, "text": "ferent document categories", "bbox": {"l": 317.95499, "t": 551.0419899999999, "r": 428.69907, "b": 559.51524, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "section_header", "bbox": {"l": 317.95499, "t": 592.46591, "r": 379.8205, "b": 602.7750100000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9208476543426514, "cells": [{"id": 411, "text": "KEYWORDS", "bbox": {"l": 317.95499, "t": 592.46591, "r": 379.8205, "b": 602.7750100000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 317.95499, "t": 607.66756, "r": 559.18597, "b": 627.00117, "coord_origin": "TOPLEFT"}, "confidence": 0.9509093761444092, "cells": [{"id": 412, "text": "PDF document conversion, layout segmentation, object-detection,", "bbox": {"l": 317.95499, "t": 607.66756, "r": 559.18597, "b": 616.04218, "coord_origin": "TOPLEFT"}}, {"id": 413, "text": "data set, Machine Learning", "bbox": {"l": 317.95499, "t": 618.62656, "r": 416.94403, "b": 627.00117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "section_header", "bbox": {"l": 317.65997, "t": 640.05434, "r": 404.65366, "b": 647.58609, "coord_origin": "TOPLEFT"}, "confidence": 0.8721988797187805, "cells": [{"id": 414, "text": "ACM Reference Format:", "bbox": {"l": 317.65997, "t": 640.05434, "r": 404.65366, "b": 647.58609, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 317.95499, "t": 650.11996, "r": 559.5495, "b": 707.377029, "coord_origin": "TOPLEFT"}, "confidence": 0.9455165863037109, "cells": [{"id": 415, "text": "Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter", "bbox": {"l": 317.95499, "t": 650.11996, "r": 558.35266, "b": 657.56404, "coord_origin": "TOPLEFT"}}, {"id": 416, "text": "Staar. 2022. DocLayNet: A Large Human-Annotated Dataset for Document-", "bbox": {"l": 317.95499, "t": 660.08296, "r": 559.5495, "b": 667.52703, "coord_origin": "TOPLEFT"}}, {"id": 417, "text": "Layout Analysis. In", "bbox": {"l": 317.95499, "t": 670.04497, "r": 383.30807, "b": 677.48904, "coord_origin": "TOPLEFT"}}, {"id": 418, "text": "Proceedings of the 28th ACM SIGKDD Conference on", "bbox": {"l": 385.798, "t": 670.08482, "r": 558.20032, "b": 677.49701, "coord_origin": "TOPLEFT"}}, {"id": 419, "text": "Knowledge Discovery and Data Mining (KDD \u201922), August 14-18, 2022, Wash-", "bbox": {"l": 317.95499, "t": 680.04781, "r": 559.00092, "b": 687.46001, "coord_origin": "TOPLEFT"}}, {"id": 420, "text": "ington, DC, USA.", "bbox": {"l": 317.95499, "t": 690.01081, "r": 370.11481, "b": 697.423004, "coord_origin": "TOPLEFT"}}, {"id": 421, "text": "ACM, New York, NY, USA, 9 pages. https://doi.org/10.1145/", "bbox": {"l": 371.82999, "t": 689.97096, "r": 558.71655, "b": 697.415031, "coord_origin": "TOPLEFT"}}, {"id": 422, "text": "3534678.3539043", "bbox": {"l": 317.95499, "t": 699.932953, "r": 371.59375, "b": 707.377029, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "page_header", "bbox": {"l": 18.34021, "t": 218.35999000000004, "r": 36.339794, "b": 555.00003, "coord_origin": "TOPLEFT"}, "confidence": 0.8537883758544922, "cells": [{"id": 423, "text": "arXiv:2206.01062v1 [cs.CV] 2 Jun 2022", "bbox": {"l": 18.34021, "t": 218.35999000000004, "r": 36.339794, "b": 555.00003, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "section_header", "id": 12, "page_no": 0, "cluster": {"id": 12, "label": "section_header", "bbox": {"l": 107.29999999999998, "t": 83.69470000000013, "r": 505.06195, "b": 119.59558000000015, "coord_origin": "TOPLEFT"}, "confidence": 0.8416302800178528, "cells": [{"id": 0, "text": "DocLayNet: A Large Human-Annotated Dataset for", "bbox": {"l": 107.29999999999998, "t": 83.69470000000013, "r": 505.06195, "b": 99.67058999999995, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Document-Layout Analysis", "bbox": {"l": 200.117, "t": 103.6196900000001, "r": 411.88367, "b": 119.59558000000015, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis"}, {"label": "text", "id": 8, "page_no": 0, "cluster": {"id": 8, "label": "text", "bbox": {"l": 90.96701, "t": 133.67236000000003, "r": 193.73123, "b": 180.24030000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.8637151718139648, "cells": [{"id": 2, "text": "Birgit Pfitzmann", "bbox": {"l": 102.06001, "t": 133.67236000000003, "r": 182.63805, "b": 144.83856000000003, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "IBM Research", "bbox": {"l": 114.29401000000001, "t": 147.02423, "r": 170.40337, "b": 156.32928000000004, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Rueschlikon, Switzerland", "bbox": {"l": 90.96701, "t": 158.97924999999998, "r": 193.73123, "b": 168.28430000000003, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "bpf@zurich.ibm.com", "bbox": {"l": 100.02301, "t": 170.93524000000002, "r": 184.67522, "b": 180.24030000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Birgit Pfitzmann IBM Research Rueschlikon, Switzerland bpf@zurich.ibm.com"}, {"label": "text", "id": 9, "page_no": 0, "cluster": {"id": 9, "label": "text", "bbox": {"l": 255.11602999999997, "t": 133.67236000000003, "r": 357.88025, "b": 180.24030000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.8612664937973022, "cells": [{"id": 6, "text": "Christoph Auer", "bbox": {"l": 268.62402, "t": 133.67236000000003, "r": 344.59933, "b": 144.83856000000003, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "IBM Research", "bbox": {"l": 278.44302, "t": 147.02423, "r": 334.55237, "b": 156.32928000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Rueschlikon, Switzerland", "bbox": {"l": 255.11602999999997, "t": 158.97924999999998, "r": 357.88025, "b": 168.28430000000003, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "cau@zurich.ibm.com", "bbox": {"l": 263.70404, "t": 170.93524000000002, "r": 349.29272, "b": 180.24030000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Christoph Auer IBM Research Rueschlikon, Switzerland cau@zurich.ibm.com"}, {"label": "text", "id": 6, "page_no": 0, "cluster": {"id": 6, "label": "text", "bbox": {"l": 419.26505, "t": 133.67236000000003, "r": 522.0293, "b": 180.24030000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.8760607242584229, "cells": [{"id": 10, "text": "Michele Dolfi", "bbox": {"l": 437.6930500000001, "t": 133.67236000000003, "r": 503.60208, "b": 144.83856000000003, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "IBM Research", "bbox": {"l": 442.59305000000006, "t": 147.02423, "r": 498.7023899999999, "b": 156.32928000000004, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Rueschlikon, Switzerland", "bbox": {"l": 419.26505, "t": 158.97924999999998, "r": 522.0293, "b": 168.28430000000003, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "dol@zurich.ibm.com", "bbox": {"l": 428.56104000000005, "t": 170.93524000000002, "r": 512.73505, "b": 180.24030000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Michele Dolfi IBM Research Rueschlikon, Switzerland dol@zurich.ibm.com"}, {"label": "text", "id": 13, "page_no": 0, "cluster": {"id": 13, "label": "text", "bbox": {"l": 172.54303, "t": 192.05737, "r": 275.30725, "b": 238.62531, "coord_origin": "TOPLEFT"}, "confidence": 0.8319916129112244, "cells": [{"id": 14, "text": "Ahmed S. Nassar", "bbox": {"l": 182.26804, "t": 192.05737, "r": 265.39255, "b": 203.22357, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "IBM Research", "bbox": {"l": 195.87103, "t": 205.40923999999995, "r": 251.98038999999997, "b": 214.71429, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Rueschlikon, Switzerland", "bbox": {"l": 172.54303, "t": 217.36425999999994, "r": 275.30725, "b": 226.66931, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "ahn@zurich.ibm.com", "bbox": {"l": 180.52803, "t": 229.32025, "r": 267.3222, "b": 238.62531, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Ahmed S. Nassar IBM Research Rueschlikon, Switzerland ahn@zurich.ibm.com"}, {"label": "text", "id": 15, "page_no": 0, "cluster": {"id": 15, "label": "text", "bbox": {"l": 336.69302, "t": 192.05737, "r": 439.45727999999997, "b": 238.62531, "coord_origin": "TOPLEFT"}, "confidence": 0.8027974367141724, "cells": [{"id": 18, "text": "Peter Staar", "bbox": {"l": 361.52802, "t": 192.05737, "r": 414.84821, "b": 203.22357, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "IBM Research", "bbox": {"l": 360.02002, "t": 205.40923999999995, "r": 416.12939, "b": 214.71429, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Rueschlikon, Switzerland", "bbox": {"l": 336.69302, "t": 217.36425999999994, "r": 439.45727999999997, "b": 226.66931, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "taa@zurich.ibm.com", "bbox": {"l": 346.20703, "t": 229.32025, "r": 429.94269, "b": 238.62531, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Peter Staar IBM Research Rueschlikon, Switzerland taa@zurich.ibm.com"}, {"label": "section_header", "id": 5, "page_no": 0, "cluster": {"id": 5, "label": "section_header", "bbox": {"l": 53.798035, "t": 247.70288000000005, "r": 111.94354, "b": 258.01202, "coord_origin": "TOPLEFT"}, "confidence": 0.8876155018806458, "cells": [{"id": 22, "text": "ABSTRACT", "bbox": {"l": 53.798035, "t": 247.70288000000005, "r": 111.94354, "b": 258.01202, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "ABSTRACT"}, {"label": "text", "id": 0, "page_no": 0, "cluster": {"id": 0, "label": "text", "bbox": {"l": 53.466999, "t": 262.90454, "r": 295.56018, "b": 534.29318, "coord_origin": "TOPLEFT"}, "confidence": 0.9823057055473328, "cells": [{"id": 23, "text": "Accurate document layout analysis is a key requirement for high-", "bbox": {"l": 53.484001, "t": 262.90454, "r": 295.55591, "b": 271.27917, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "quality PDF document conversion. With the recent availability of", "bbox": {"l": 53.79800000000001, "t": 273.86352999999997, "r": 294.04199, "b": 282.23816, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "public, large ground-truth datasets such as PubLayNet and DocBank,", "bbox": {"l": 53.79800000000001, "t": 284.82254, "r": 295.34586, "b": 293.19717, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "deep-learning models have proven to be very effective at layout", "bbox": {"l": 53.79800000000001, "t": 295.78152, "r": 294.04709, "b": 304.15616000000006, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "detection and segmentation. While these datasets are of adequate", "bbox": {"l": 53.79800000000001, "t": 306.74053999999995, "r": 294.04645, "b": 315.11517, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "size to train such models, they severely lack in layout variability", "bbox": {"l": 53.79800000000001, "t": 317.69952, "r": 294.27573, "b": 326.07416, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "since they are sourced from scientific article repositories such as", "bbox": {"l": 53.79800000000001, "t": 328.65854, "r": 294.04712, "b": 337.03317, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "PubMed and arXiv only. Consequently, the accuracy of the layout", "bbox": {"l": 53.79800000000001, "t": 339.61755, "r": 294.0437, "b": 347.99219, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "segmentation drops significantly when these models are applied", "bbox": {"l": 53.79800000000001, "t": 350.57654, "r": 294.04715, "b": 358.95117, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "on more challenging and diverse layouts. In this paper, we present", "bbox": {"l": 53.79800000000001, "t": 361.53455, "r": 294.04364, "b": 369.90918000000005, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "DocLayNet", "bbox": {"l": 53.79800000000001, "t": 372.53839, "r": 92.863388, "b": 380.87714000000005, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": ", a new, publicly available, document-layout annotation", "bbox": {"l": 92.863998, "t": 372.49353, "r": 294.04361, "b": 380.86816, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "dataset in COCO format. It contains 80863 manually annotated", "bbox": {"l": 53.79800000000001, "t": 383.45255, "r": 294.04718, "b": 391.82718, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "pages from diverse data sources to represent a wide variability in", "bbox": {"l": 53.79800000000001, "t": 394.41153, "r": 294.0437, "b": 402.78616, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "layouts. For each PDF page, the layout annotations provide labelled", "bbox": {"l": 53.79800000000001, "t": 405.37054, "r": 294.04535, "b": 413.74518, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "bounding-boxes with a choice of 11 distinct classes. DocLayNet", "bbox": {"l": 53.79800000000001, "t": 416.32953, "r": 294.04715, "b": 424.70416000000006, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "also provides a subset of double- and triple-annotated pages to", "bbox": {"l": 53.79800000000001, "t": 427.28853999999995, "r": 294.04712, "b": 435.66318, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "determine the inter-annotator agreement. In multiple experiments,", "bbox": {"l": 53.79800000000001, "t": 438.24753, "r": 295.03, "b": 446.62216, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "we provide baseline accuracy scores (in mAP) for a set of popular", "bbox": {"l": 53.466999, "t": 449.20654, "r": 294.21616, "b": 457.58118, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "object detection models. We also demonstrate that these models", "bbox": {"l": 53.79800000000001, "t": 460.16553, "r": 294.04712, "b": 468.54016, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "fall approximately 10% behind the inter-annotator agreement. Fur-", "bbox": {"l": 53.79800000000001, "t": 471.12354, "r": 295.56018, "b": 479.49817, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "thermore, we provide evidence that DocLayNet is of sufficient size.", "bbox": {"l": 53.79800000000001, "t": 482.08255, "r": 295.42783, "b": 490.45718, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Lastly, we compare models trained on PubLayNet, DocBank and", "bbox": {"l": 53.79800000000001, "t": 493.04153, "r": 294.04715, "b": 501.41617, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "DocLayNet, showing that layout predictions of the DocLayNet-", "bbox": {"l": 53.79800000000001, "t": 504.00055, "r": 295.55618, "b": 512.37518, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "trained models are more robust and thus the preferred choice for", "bbox": {"l": 53.79800000000001, "t": 514.95953, "r": 294.21643, "b": 523.33417, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "general-purpose document-layout analysis.", "bbox": {"l": 53.79800000000001, "t": 525.91855, "r": 212.05495, "b": 534.29318, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Accurate document layout analysis is a key requirement for highquality PDF document conversion. With the recent availability of public, large ground-truth datasets such as PubLayNet and DocBank, deep-learning models have proven to be very effective at layout detection and segmentation. While these datasets are of adequate size to train such models, they severely lack in layout variability since they are sourced from scientific article repositories such as PubMed and arXiv only. Consequently, the accuracy of the layout segmentation drops significantly when these models are applied on more challenging and diverse layouts. In this paper, we present DocLayNet , a new, publicly available, document-layout annotation dataset in COCO format. It contains 80863 manually annotated pages from diverse data sources to represent a wide variability in layouts. For each PDF page, the layout annotations provide labelled bounding-boxes with a choice of 11 distinct classes. DocLayNet also provides a subset of double- and triple-annotated pages to determine the inter-annotator agreement. In multiple experiments, we provide baseline accuracy scores (in mAP) for a set of popular object detection models. We also demonstrate that these models fall approximately 10% behind the inter-annotator agreement. Furthermore, we provide evidence that DocLayNet is of sufficient size. Lastly, we compare models trained on PubLayNet, DocBank and DocLayNet, showing that layout predictions of the DocLayNettrained models are more robust and thus the preferred choice for general-purpose document-layout analysis."}, {"label": "section_header", "id": 4, "page_no": 0, "cluster": {"id": 4, "label": "section_header", "bbox": {"l": 53.79800000000001, "t": 550.99692, "r": 134.81989, "b": 561.30602, "coord_origin": "TOPLEFT"}, "confidence": 0.9149598479270935, "cells": [{"id": 49, "text": "CCS CONCEPTS", "bbox": {"l": 53.79800000000001, "t": 550.99692, "r": 134.81989, "b": 561.30602, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "CCS CONCEPTS"}, {"label": "text", "id": 11, "page_no": 0, "cluster": {"id": 11, "label": "text", "bbox": {"l": 53.797989, "t": 566.08299, "r": 297.85294, "b": 596.50114, "coord_origin": "TOPLEFT"}, "confidence": 0.8458839058876038, "cells": [{"id": 50, "text": "\u2022", "bbox": {"l": 53.79800000000001, "t": 566.19957, "r": 56.945206000000006, "b": 574.57419, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Information systems", "bbox": {"l": 58.440002, "t": 566.0830100000001, "r": 142.4462, "b": 574.5562600000001, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "\u2192", "bbox": {"l": 143.938, "t": 566.36096, "r": 153.15099, "b": 574.43073, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Document structure", "bbox": {"l": 154.646, "t": 566.0830100000001, "r": 235.46015999999997, "b": 574.5562600000001, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "; \u2022", "bbox": {"l": 235.45700000000002, "t": 566.19955, "r": 242.17419, "b": 574.57417, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "Applied com-", "bbox": {"l": 243.66899, "t": 566.08299, "r": 297.85294, "b": 574.55624, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "puting", "bbox": {"l": 53.797989, "t": 577.0419899999999, "r": 80.661324, "b": 585.51524, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "\u2192", "bbox": {"l": 83.565987, "t": 577.3199500000001, "r": 92.778961, "b": 585.38971, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Document analysis", "bbox": {"l": 95.68399, "t": 577.0419899999999, "r": 173.91583, "b": 585.51524, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "; \u2022", "bbox": {"l": 173.916, "t": 577.15855, "r": 182.1272, "b": 585.53317, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Computing methodologies", "bbox": {"l": 185.032, "t": 577.0419899999999, "r": 294.0455, "b": 585.51524, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "\u2192", "bbox": {"l": 53.79800399999999, "t": 588.27895, "r": 63.01097899999999, "b": 596.34871, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "Machine learning", "bbox": {"l": 65.253006, "t": 588.00099, "r": 136.80487, "b": 596.47424, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": ";", "bbox": {"l": 136.80501, "t": 588.1175499999999, "r": 138.92108, "b": 596.49217, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "Computer vision", "bbox": {"l": 141.162, "t": 588.00099, "r": 209.60254, "b": 596.47424, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": ";", "bbox": {"l": 209.60201, "t": 588.1175499999999, "r": 211.71808, "b": 596.49217, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "Object detection", "bbox": {"l": 213.96001, "t": 588.16238, "r": 270.45728, "b": 596.50114, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": ";", "bbox": {"l": 270.48001, "t": 588.1175499999999, "r": 272.59607, "b": 596.49217, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u00b7 Information systems \u2192 Document structure ; \u00b7 Applied computing \u2192 Document analysis ; \u00b7 Computing methodologies \u2192 Machine learning ; Computer vision ; Object detection ;"}, {"label": "text", "id": 17, "page_no": 0, "cluster": {"id": 17, "label": "text", "bbox": {"l": 53.79800000000001, "t": 634.39838, "r": 295.11798, "b": 672.79189, "coord_origin": "TOPLEFT"}, "confidence": 0.7107349038124084, "cells": [{"id": 68, "text": "Permission to make digital or hard copies of part or all of this work for personal or", "bbox": {"l": 53.79800000000001, "t": 634.39838, "r": 294.17697, "b": 640.9119000000001, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "classroom use is granted without fee provided that copies are not made or distributed", "bbox": {"l": 53.79800000000001, "t": 642.36838, "r": 294.04443, "b": 648.8819, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "for profit or commercial advantage and that copies bear this notice and the full citation", "bbox": {"l": 53.79800000000001, "t": 650.33838, "r": 294.04498, "b": 656.8519, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "on the first page. Copyrights for third-party components of this work must be honored.", "bbox": {"l": 53.79800000000001, "t": 658.3083799999999, "r": 295.11798, "b": 664.8219, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "For all other uses, contact the owner/author(s).", "bbox": {"l": 53.79800000000001, "t": 666.27837, "r": 187.72285, "b": 672.79189, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Permission to make digital or hard copies of part or all of this work for personal or classroom use is granted without fee provided that copies are not made or distributed for profit or commercial advantage and that copies bear this notice and the full citation on the first page. Copyrights for third-party components of this work must be honored. For all other uses, contact the owner/author(s)."}, {"label": "text", "id": 29, "page_no": 0, "cluster": {"id": 29, "label": "text", "bbox": {"l": 53.79800000000001, "t": 675.08023, "r": 197.86275, "b": 681.56586, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 53.79800000000001, "t": 675.08023, "r": 197.86275, "b": 681.56586, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA"}, {"label": "text", "id": 30, "page_no": 0, "cluster": {"id": 30, "label": "text", "bbox": {"l": 53.317001, "t": 683.81236, "r": 186.74652, "b": 690.32589, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "\u00a9 2022 Copyright held by the owner/author(s).", "bbox": {"l": 53.317001, "t": 683.81236, "r": 186.74652, "b": 690.32589, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u00a9 2022 Copyright held by the owner/author(s)."}, {"label": "text", "id": 31, "page_no": 0, "cluster": {"id": 31, "label": "text", "bbox": {"l": 53.554001, "t": 691.78336, "r": 157.03125, "b": 698.29689, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "ACM ISBN 978-1-4503-9385-0/22/08.", "bbox": {"l": 53.554001, "t": 691.78336, "r": 157.03125, "b": 698.29689, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "ACM ISBN 978-1-4503-9385-0/22/08."}, {"label": "text", "id": 27, "page_no": 0, "cluster": {"id": 27, "label": "text", "bbox": {"l": 53.79800000000001, "t": 699.753365, "r": 166.94093, "b": 706.266891, "coord_origin": "TOPLEFT"}, "confidence": 0.509588360786438, "cells": [{"id": 76, "text": "https://doi.org/10.1145/3534678.3539043", "bbox": {"l": 53.79800000000001, "t": 699.753365, "r": 166.94093, "b": 706.266891, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "https://doi.org/10.1145/3534678.3539043"}, {"label": "picture", "id": 20, "page_no": 0, "cluster": {"id": 20, "label": "picture", "bbox": {"l": 323.408203125, "t": 250.34873962402344, "r": 553.2952270507812, "b": 525.8507080078125, "coord_origin": "TOPLEFT"}, "confidence": 0.5910208821296692, "cells": [{"id": 77, "text": "13", "bbox": {"l": 327.86951, "t": 351.78085, "r": 330.41248, "b": 353.95465, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "USING THE VERTICAL TUBE -", "bbox": {"l": 327.83005, "t": 331.57268999999997, "r": 351.16092, "b": 333.31171, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "MODELS AY11230/11234", "bbox": {"l": 327.83005, "t": 333.18292, "r": 348.30536, "b": 334.92194, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "1.", "bbox": {"l": 327.83005, "t": 336.40439, "r": 329.05914, "b": 337.92606, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "The vertical tube can be used for", "bbox": {"l": 329.67368, "t": 336.40439, "r": 349.95349, "b": 337.92606, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "instructional viewing or to photograph", "bbox": {"l": 329.11752, "t": 337.83588, "r": 353.57977, "b": 339.35751000000005, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": " the image with a digital camera or a", "bbox": {"l": 327.77121, "t": 339.26736, "r": 352.4306, "b": 340.789, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": " micro TV unit", "bbox": {"l": 328.15176, "t": 340.69882, "r": 337.91086, "b": 342.22049, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "2.", "bbox": {"l": 327.8313, "t": 342.19043000000005, "r": 329.09155, "b": 343.71207, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Loosen the retention screw, then rotate ", "bbox": {"l": 329.72168, "t": 342.19043000000005, "r": 354.9267, "b": 343.71207, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": " the adjustment ring to change the ", "bbox": {"l": 327.8313, "t": 343.62192, "r": 351.66949, "b": 345.14355, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": " length of the vertical tube.", "bbox": {"l": 328.21185, "t": 345.05338, "r": 346.33179, "b": 346.57504, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "3.", "bbox": {"l": 327.83005, "t": 346.84680000000003, "r": 329.12726, "b": 348.36847, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "Make sure that both the images in", "bbox": {"l": 329.77588, "t": 346.84680000000003, "r": 351.18005, "b": 348.36847, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "OPERATION ", "bbox": {"l": 327.25311, "t": 254.94812000000002, "r": 350.07861, "b": 258.86096, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "(", "bbox": {"l": 350.07861, "t": 254.76782000000003, "r": 351.82651, "b": 258.68066, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "cont.", "bbox": {"l": 351.82651, "t": 254.94812000000002, "r": 360.85242, "b": 258.86096, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": ")", "bbox": {"l": 360.85242, "t": 254.76782000000003, "r": 362.60028, "b": 258.68066, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "SELECTING OBJECTIVE ", "bbox": {"l": 326.88037, "t": 263.49492999999995, "r": 345.84351, "b": 265.23395000000005, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "MAGNIFICATION", "bbox": {"l": 326.88037, "t": 265.10515999999996, "r": 340.54153, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "1.", "bbox": {"l": 326.88037, "t": 266.71533, "r": 328.31903, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "There are two objectives. The lower", "bbox": {"l": 329.03836, "t": 266.71533, "r": 354.21472, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": " magnification objective has a greater", "bbox": {"l": 326.88037, "t": 268.32556, "r": 355.19193, "b": 270.06458, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": " depth of field and view.", "bbox": {"l": 326.88037, "t": 269.93579, "r": 345.80057, "b": 271.6748, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "2.", "bbox": {"l": 326.88037, "t": 271.54602, "r": 328.33862, "b": 273.28503, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "In order to observe the specimen", "bbox": {"l": 329.06775, "t": 271.54602, "r": 352.39969, "b": 273.28503, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": " easily use the lower magnification", "bbox": {"l": 326.88037, "t": 273.15619000000004, "r": 352.90042, "b": 274.89526, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": " objective first. Then, by rotating the", "bbox": {"l": 326.88037, "t": 274.76642000000004, "r": 354.59546, "b": 276.50543000000005, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": " case, the magnification can be", "bbox": {"l": 326.88037, "t": 276.37665000000004, "r": 350.81885, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": " changed.", "bbox": {"l": 326.88037, "t": 277.98688000000004, "r": 335.46707, "b": 279.72589000000005, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "CHANGING THE INTERPUPILLARY ", "bbox": {"l": 326.88037, "t": 281.20728, "r": 354.57755, "b": 282.94632, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "DISTANCE", "bbox": {"l": 326.88037, "t": 282.81750000000005, "r": 335.1752, "b": 284.55652, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "1.", "bbox": {"l": 326.88037, "t": 284.4277, "r": 328.34784, "b": 286.16675, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "The distance between the observer's", "bbox": {"l": 329.08157, "t": 284.4277, "r": 354.76245, "b": 286.16675, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": " pupils is the interpupillary distance.", "bbox": {"l": 326.88037, "t": 286.03793, "r": 354.6499, "b": 287.77695, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "2.", "bbox": {"l": 326.88037, "t": 287.64813, "r": 328.25125, "b": 289.38718, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "To adjust the interpupillary distance", "bbox": {"l": 328.93671, "t": 287.64813, "r": 354.29825, "b": 289.38718, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": " rotate the prism caps until both eyes", "bbox": {"l": 326.88181, "t": 289.25836, "r": 355.02075, "b": 290.99738, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": " coincide with the image in the", "bbox": {"l": 326.88181, "t": 290.86855999999995, "r": 350.82028, "b": 292.6076, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": " eyepiece. ", "bbox": {"l": 326.88181, "t": 292.47879, "r": 336.2067, "b": 294.2178, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "FOCUSING", "bbox": {"l": 326.88181, "t": 295.69922, "r": 335.3941, "b": 297.43823, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "1.", "bbox": {"l": 326.88181, "t": 297.30942, "r": 328.34314, "b": 299.04846, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "Remove the lens protective cover.", "bbox": {"l": 329.07379, "t": 297.30942, "r": 353.18555, "b": 299.04846, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "2.", "bbox": {"l": 326.88324, "t": 298.91965, "r": 328.35919, "b": 300.65866, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "Place the specimen on the working", "bbox": {"l": 329.0972, "t": 298.91965, "r": 353.45065, "b": 300.65866, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": " stage.", "bbox": {"l": 326.88324, "t": 300.52985, "r": 333.32825, "b": 302.26889000000006, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "3.", "bbox": {"l": 326.88324, "t": 302.14008000000007, "r": 328.31296, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "Focus the specimen with the left eye", "bbox": {"l": 329.02783, "t": 302.14008000000007, "r": 354.76303, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": " first while turning the focus knob until", "bbox": {"l": 326.88324, "t": 303.75027, "r": 355.96307, "b": 305.48932, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": " the image appears clear and sharp.", "bbox": {"l": 326.88324, "t": 305.3605, "r": 354.46594, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "4.", "bbox": {"l": 326.88324, "t": 306.9707, "r": 328.25488, "b": 308.70975, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "Rotate the right eyepiece ring until the", "bbox": {"l": 328.9407, "t": 306.9707, "r": 356.37335, "b": 308.70975, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": " images in each eyepiece coincide and", "bbox": {"l": 326.88324, "t": 308.58093, "r": 355.38867, "b": 310.31995, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": " are sharp and clear.", "bbox": {"l": 326.88324, "t": 310.19113, "r": 343.17249, "b": 311.93018, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "CHANGING THE BULB", "bbox": {"l": 326.88324, "t": 313.41156, "r": 344.13388, "b": 315.15059999999994, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "1.", "bbox": {"l": 326.88324, "t": 315.02178999999995, "r": 328.37418, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "Disconnect the power cord.", "bbox": {"l": 329.11963, "t": 315.02178999999995, "r": 348.50162, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "2.", "bbox": {"l": 326.88324, "t": 316.63199, "r": 328.34061, "b": 318.37103, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "When the bulb is cool, remove the", "bbox": {"l": 329.06931, "t": 316.63199, "r": 353.11588, "b": 318.37103, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": " oblique illuminator cap and remove", "bbox": {"l": 326.88464, "t": 318.2422199999999, "r": 353.79517, "b": 319.9812299999999, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": " the halogen bulb with cap.", "bbox": {"l": 326.88464, "t": 319.85242000000005, "r": 348.02094, "b": 321.59146, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "3.", "bbox": {"l": 326.88464, "t": 321.46265, "r": 328.37512, "b": 323.20166, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "Replace with a new halogen bulb.", "bbox": {"l": 329.12036, "t": 321.46265, "r": 352.96808, "b": 323.20166, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "4.", "bbox": {"l": 326.88608, "t": 323.07285, "r": 328.36884, "b": 324.81189, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "Open the window in the base plate and", "bbox": {"l": 329.1102, "t": 323.07285, "r": 356.5412, "b": 324.81189, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": " replace the halogen lamp or ", "bbox": {"l": 326.88608, "t": 324.68307000000004, "r": 350.13828, "b": 326.42209, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": " fluorescent lamp of transmitted", "bbox": {"l": 326.88608, "t": 326.29327, "r": 351.59677, "b": 328.03232, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": " illuminator.", "bbox": {"l": 326.88608, "t": 327.9035, "r": 336.89197, "b": 329.64252, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "FOCUSING", "bbox": {"l": 358.42023, "t": 263.49492999999995, "r": 366.93256, "b": 265.23395000000005, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "1.", "bbox": {"l": 358.42023, "t": 265.10515999999996, "r": 359.89841, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "Turn the focusing knob away or toward", "bbox": {"l": 360.63751, "t": 265.10515999999996, "r": 387.98407, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": " you until a clear image is viewed.", "bbox": {"l": 358.42023, "t": 266.71533, "r": 384.58948, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "2.", "bbox": {"l": 358.42166, "t": 268.32556, "r": 359.78549, "b": 270.06458, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "If the image is unclear, adjust the", "bbox": {"l": 360.46741, "t": 268.32556, "r": 384.33441, "b": 270.06458, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": " height of the elevator up or down,", "bbox": {"l": 358.4231, "t": 269.93579, "r": 384.61502, "b": 271.6748, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": " then turn the focusing knob again.", "bbox": {"l": 358.4231, "t": 271.54602, "r": 385.38922, "b": 273.28503, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "ZOOM MAGNIFICATION", "bbox": {"l": 358.4231, "t": 274.76642000000004, "r": 377.35046, "b": 276.50543000000005, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "1.", "bbox": {"l": 358.4231, "t": 276.37665000000004, "r": 359.89429, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "Turn the zoom magnification knob to", "bbox": {"l": 360.62988, "t": 276.37665000000004, "r": 386.37589, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": " the desired magnification and field of", "bbox": {"l": 358.4231, "t": 277.98688000000004, "r": 386.78732, "b": 279.72589000000005, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": " view.", "bbox": {"l": 358.4231, "t": 279.59704999999997, "r": 364.16855, "b": 281.33609, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "2.", "bbox": {"l": 358.4231, "t": 281.20728, "r": 359.86777, "b": 282.94632, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "In most situations, it is recommended", "bbox": {"l": 360.59012, "t": 281.20728, "r": 387.31656, "b": 282.94632, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": " that you focus at the lowest ", "bbox": {"l": 358.4231, "t": 282.81750000000005, "r": 381.56656, "b": 284.55652, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": " magnification, then move to a higher", "bbox": {"l": 358.4231, "t": 284.4277, "r": 386.63403, "b": 286.16675, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": " magnification and re-focus as ", "bbox": {"l": 358.42453, "t": 286.03793, "r": 382.77115, "b": 287.77695, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": " necessary.", "bbox": {"l": 358.42453, "t": 287.64813, "r": 367.98694, "b": 289.38718, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "3.", "bbox": {"l": 358.42453, "t": 289.25836, "r": 359.80386, "b": 290.99738, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "If the image is not clear to both eyes", "bbox": {"l": 360.49353, "t": 289.25836, "r": 386.70093, "b": 290.99738, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": " at the same time, the diopter ring may", "bbox": {"l": 358.42453, "t": 290.86855999999995, "r": 388.03534, "b": 292.6076, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": " need adjustment.", "bbox": {"l": 358.42453, "t": 292.47879, "r": 373.13724, "b": 294.2178, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "DIOPTER RING ADJUSTMENT", "bbox": {"l": 358.42453, "t": 295.69922, "r": 381.74539, "b": 297.43823, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "1.", "bbox": {"l": 358.42453, "t": 297.30942, "r": 359.83682, "b": 299.04846, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "To adjust the eyepiece for viewing with", "bbox": {"l": 360.54297, "t": 297.30942, "r": 388.08289, "b": 299.04846, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": " or without eyeglasses and for ", "bbox": {"l": 358.42453, "t": 298.91965, "r": 382.73251, "b": 300.65866, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": " differences in acuity between the right", "bbox": {"l": 358.42453, "t": 300.52985, "r": 387.72266, "b": 302.26889000000006, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": " and left eyes, follow the following", "bbox": {"l": 358.42453, "t": 302.14008000000007, "r": 384.1991, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": " steps:", "bbox": {"l": 358.42453, "t": 303.75027, "r": 364.88672, "b": 305.48932, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "a.", "bbox": {"l": 358.42453, "t": 305.3605, "r": 359.95078, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "Observe an image through the left", "bbox": {"l": 361.47699, "t": 305.3605, "r": 386.65988, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": " eyepiece and bring a specific point", "bbox": {"l": 358.42453, "t": 306.9707, "r": 386.7634, "b": 308.70975, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": " into focus using the focus knob.", "bbox": {"l": 358.42453, "t": 308.58093, "r": 385.41354, "b": 310.31995, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "b.", "bbox": {"l": 358.42453, "t": 310.19113, "r": 359.93304, "b": 311.93018, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "By turning the diopter ring ", "bbox": {"l": 361.44156, "t": 310.19113, "r": 382.56085, "b": 311.93018, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": " adjustment for the left eyepiece,", "bbox": {"l": 358.42596, "t": 311.80136, "r": 385.4559, "b": 313.54037, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": " bring the same point into sharp", "bbox": {"l": 358.42596, "t": 313.41156, "r": 384.56122, "b": 315.15059999999994, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": " focus.", "bbox": {"l": 358.42596, "t": 315.02178999999995, "r": 366.74371, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": " c.Then bring the same point into", "bbox": {"l": 358.42596, "t": 316.63199, "r": 383.93884, "b": 318.37103, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": " focus through the right eyepiece", "bbox": {"l": 358.42596, "t": 318.2422199999999, "r": 385.69241, "b": 319.9812299999999, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": " by turning the right diopter ring.", "bbox": {"l": 358.42596, "t": 319.85242000000005, "r": 385.94861, "b": 321.59146, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": " d.With more than one viewer, each", "bbox": {"l": 358.42596, "t": 321.46265, "r": 385.54236, "b": 323.20166, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": " viewer should note their own", "bbox": {"l": 358.42596, "t": 323.07285, "r": 382.98718, "b": 324.81189, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": " diopter ring position for the left", "bbox": {"l": 358.42596, "t": 324.68307000000004, "r": 385.06448, "b": 326.42209, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": " and right eyepieces, then before", "bbox": {"l": 358.42596, "t": 326.29327, "r": 385.20682, "b": 328.03232, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": " viewing set the diopter ring", "bbox": {"l": 358.42596, "t": 327.9035, "r": 382.21964, "b": 329.64252, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": " adjustments to that setting.", "bbox": {"l": 358.42596, "t": 329.5137, "r": 382.63382, "b": 331.25275, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "CHANGING THE BULB", "bbox": {"l": 358.42596, "t": 332.73412999999994, "r": 375.67661, "b": 334.47317999999996, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "1.", "bbox": {"l": 358.42596, "t": 334.34436, "r": 359.90311, "b": 336.08337, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "Disconnect the power cord from the", "bbox": {"l": 360.64169, "t": 334.34436, "r": 385.75333, "b": 336.08337, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": " electrical outlet.", "bbox": {"l": 358.42596, "t": 335.95456, "r": 372.01416, "b": 337.6936, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "2.", "bbox": {"l": 358.42596, "t": 337.56479, "r": 359.88327, "b": 339.3038, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "When the bulb is cool, remove the", "bbox": {"l": 360.61191, "t": 337.56479, "r": 384.65726, "b": 339.3038, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": " oblique illuminator cap and remove", "bbox": {"l": 358.42596, "t": 339.17499, "r": 385.33649, "b": 340.9140300000001, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": " the halogen bulb with cap.", "bbox": {"l": 358.42596, "t": 340.78522, "r": 379.57224, "b": 342.52423, "coord_origin": "TOPLEFT"}}, {"id": 201, "text": "3.", "bbox": {"l": 358.4274, "t": 342.39542, "r": 359.91788, "b": 344.13446000000005, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": "Replace with a new halogen bulb.", "bbox": {"l": 360.66312, "t": 342.39542, "r": 384.5108, "b": 344.13446000000005, "coord_origin": "TOPLEFT"}}, {"id": 203, "text": "4.", "bbox": {"l": 358.42883, "t": 344.00565000000006, "r": 359.92792, "b": 345.74466, "coord_origin": "TOPLEFT"}}, {"id": 204, "text": "Open the window in the base plate", "bbox": {"l": 360.67746, "t": 344.00565000000006, "r": 385.41235, "b": 345.74466, "coord_origin": "TOPLEFT"}}, {"id": 205, "text": " and replace the halogen lamp or", "bbox": {"l": 358.42883, "t": 345.61584, "r": 383.2782, "b": 347.35489, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": " fluorescent lamp of transmitted", "bbox": {"l": 358.42883, "t": 347.22607, "r": 383.13953, "b": 348.96509, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": " illuminator.", "bbox": {"l": 358.42883, "t": 348.83627, "r": 368.43472, "b": 350.57532, "coord_origin": "TOPLEFT"}}, {"id": 208, "text": "Model AY11230", "bbox": {"l": 326.59567, "t": 261.14185, "r": 339.11377, "b": 262.88091999999995, "coord_origin": "TOPLEFT"}}, {"id": 209, "text": "Model AY11234", "bbox": {"l": 358.48605, "t": 261.14185, "r": 371.00415, "b": 262.88091999999995, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": "14", "bbox": {"l": 455.43533, "t": 351.77038999999996, "r": 457.97827000000007, "b": 353.94415, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "Objectives", "bbox": {"l": 408.24518, "t": 275.52673000000004, "r": 414.4234, "b": 276.96020999999996, "coord_origin": "TOPLEFT"}}, {"id": 212, "text": "Revolving Turret", "bbox": {"l": 409.39554, "t": 268.98235999999997, "r": 419.06677, "b": 270.41583, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "Coarse ", "bbox": {"l": 441.3895, "t": 279.12627999999995, "r": 445.87192, "b": 280.55975, "coord_origin": "TOPLEFT"}}, {"id": 214, "text": "Adjustment", "bbox": {"l": 441.3895, "t": 280.30609, "r": 448.22338999999994, "b": 281.7395900000001, "coord_origin": "TOPLEFT"}}, {"id": 215, "text": "Knob", "bbox": {"l": 441.3895, "t": 281.48593, "r": 444.40371999999996, "b": 282.91939999999994, "coord_origin": "TOPLEFT"}}, {"id": 216, "text": "MODEL AY11236", "bbox": {"l": 398.79288, "t": 254.94646999999998, "r": 428.91568, "b": 258.85931000000005, "coord_origin": "TOPLEFT"}}, {"id": 217, "text": "MICROSCOPE USAGE", "bbox": {"l": 398.32535, "t": 305.04291, "r": 435.93542, "b": 308.95572000000004, "coord_origin": "TOPLEFT"}}, {"id": 218, "text": "BARSKA Model AY11236 is a powerful fixed power compound ", "bbox": {"l": 398.08594, "t": 310.35892, "r": 453.72171, "b": 312.53271, "coord_origin": "TOPLEFT"}}, {"id": 219, "text": "microscope designed for biological studies such as specimen ", "bbox": {"l": 398.08594, "t": 312.50586, "r": 453.09939999999995, "b": 314.67966, "coord_origin": "TOPLEFT"}}, {"id": 220, "text": "examination. It can also be used for examining bacteria and", "bbox": {"l": 398.08594, "t": 314.6528, "r": 456.65246999999994, "b": 316.8266, "coord_origin": "TOPLEFT"}}, {"id": 221, "text": "for general clinical and medical studies and other scientific uses. ", "bbox": {"l": 398.08594, "t": 316.79977, "r": 456.73859000000004, "b": 318.97354, "coord_origin": "TOPLEFT"}}, {"id": 222, "text": "CONSTRUCTION", "bbox": {"l": 398.62399, "t": 320.42941, "r": 427.77472, "b": 324.34222000000005, "coord_origin": "TOPLEFT"}}, {"id": 223, "text": "BARSKA Model AY11236 is a fixed power compound microscope.", "bbox": {"l": 398.08594, "t": 326.46069000000006, "r": 456.02639999999997, "b": 328.63449, "coord_origin": "TOPLEFT"}}, {"id": 224, "text": "It is constructed with two optical paths at the same angle. It is ", "bbox": {"l": 398.08414, "t": 328.6076699999999, "r": 455.42238999999995, "b": 330.7814599999999, "coord_origin": "TOPLEFT"}}, {"id": 225, "text": "equipped with transmitted illumination. By using this instrument, ", "bbox": {"l": 398.08414, "t": 330.75461, "r": 457.39844, "b": 332.92841, "coord_origin": "TOPLEFT"}}, {"id": 226, "text": "the user can observe specimens at magnification from 40x to ", "bbox": {"l": 398.08414, "t": 332.90155, "r": 453.97745, "b": 335.07535000000007, "coord_origin": "TOPLEFT"}}, {"id": 227, "text": "1000x by selecting the desired objective lens. Coarse and fine ", "bbox": {"l": 398.08414, "t": 335.04852, "r": 454.70708999999994, "b": 337.22232, "coord_origin": "TOPLEFT"}}, {"id": 228, "text": "focus adjustments provide accuracy and image detail. The rotating ", "bbox": {"l": 398.08414, "t": 337.19547, "r": 458.90240000000006, "b": 339.36926, "coord_origin": "TOPLEFT"}}, {"id": 229, "text": "head allows the user to position the eyepieces for maximum ", "bbox": {"l": 398.08594, "t": 339.34241, "r": 453.0672, "b": 341.5162, "coord_origin": "TOPLEFT"}}, {"id": 230, "text": "viewing comfort and easy access to all adjustment knobs.", "bbox": {"l": 398.08594, "t": 341.48938, "r": 449.63113, "b": 343.66318, "coord_origin": "TOPLEFT"}}, {"id": 231, "text": "Model AY11236", "bbox": {"l": 422.10626, "t": 301.24191, "r": 434.62433000000004, "b": 302.98096, "coord_origin": "TOPLEFT"}}, {"id": 232, "text": "Fine ", "bbox": {"l": 442.01610999999997, "t": 283.08649, "r": 444.8817399999999, "b": 284.51996, "coord_origin": "TOPLEFT"}}, {"id": 233, "text": "Adjustment", "bbox": {"l": 442.01610999999997, "t": 284.2663, "r": 448.85001, "b": 285.69980000000004, "coord_origin": "TOPLEFT"}}, {"id": 234, "text": "Knob", "bbox": {"l": 442.01610999999997, "t": 285.44611, "r": 445.03033000000005, "b": 286.87961, "coord_origin": "TOPLEFT"}}, {"id": 235, "text": "Stage", "bbox": {"l": 408.00577, "t": 279.12579000000005, "r": 411.42212, "b": 280.5593, "coord_origin": "TOPLEFT"}}, {"id": 236, "text": "Condenser ", "bbox": {"l": 404.07172, "t": 280.9144299999999, "r": 410.77707, "b": 282.3479, "coord_origin": "TOPLEFT"}}, {"id": 237, "text": "Focusing", "bbox": {"l": 404.07172, "t": 282.09424, "r": 409.2157, "b": 283.52774, "coord_origin": "TOPLEFT"}}, {"id": 238, "text": "Knob", "bbox": {"l": 404.07172, "t": 283.27408, "r": 407.08594, "b": 284.7075500000001, "coord_origin": "TOPLEFT"}}, {"id": 239, "text": "Eyepiece", "bbox": {"l": 441.81281, "t": 262.32178, "r": 447.03702, "b": 263.75525000000005, "coord_origin": "TOPLEFT"}}, {"id": 240, "text": "Stand", "bbox": {"l": 437.34607, "t": 271.13025000000005, "r": 440.80496, "b": 272.56281, "coord_origin": "TOPLEFT"}}, {"id": 241, "text": "Lamp ", "bbox": {"l": 409.7164, "t": 284.40027, "r": 413.3768, "b": 285.83282, "coord_origin": "TOPLEFT"}}, {"id": 242, "text": "On/Off", "bbox": {"l": 409.7164, "t": 285.83163, "r": 413.68201, "b": 287.26416, "coord_origin": "TOPLEFT"}}, {"id": 243, "text": "Switch", "bbox": {"l": 409.7164, "t": 287.263, "r": 413.6337, "b": 288.69553, "coord_origin": "TOPLEFT"}}, {"id": 244, "text": "Lamp ", "bbox": {"l": 434.8712499999999, "t": 296.7153, "r": 438.53164999999996, "b": 298.14783, "coord_origin": "TOPLEFT"}}, {"id": 245, "text": "Power", "bbox": {"l": 439.52039, "t": 292.18307000000004, "r": 443.08768, "b": 293.61560000000003, "coord_origin": "TOPLEFT"}}, {"id": 246, "text": "Cord", "bbox": {"l": 439.52039, "t": 293.61444, "r": 442.29575, "b": 295.04697, "coord_origin": "TOPLEFT"}}, {"id": 247, "text": "Rotating Head", "bbox": {"l": 413.55829, "t": 264.66089, "r": 421.94913, "b": 266.09344, "coord_origin": "TOPLEFT"}}, {"id": 248, "text": "Stage Clip", "bbox": {"l": 441.84316999999993, "t": 286.90573, "r": 447.87585000000007, "b": 288.33826, "coord_origin": "TOPLEFT"}}, {"id": 249, "text": "Adjustment", "bbox": {"l": 441.84316999999993, "t": 288.3371, "r": 448.67252, "b": 289.76962000000003, "coord_origin": "TOPLEFT"}}, {"id": 250, "text": "Interpupillary Slide Adjustment", "bbox": {"l": 407.2403, "t": 259.86645999999996, "r": 425.79089, "b": 261.29895, "coord_origin": "TOPLEFT"}}, {"id": 251, "text": "Circling Minimums", "bbox": {"l": 449.10074000000003, "t": 378.66302, "r": 466.08835000000005, "b": 380.78412, "coord_origin": "TOPLEFT"}}, {"id": 252, "text": "7", "bbox": {"l": 449.10074000000003, "t": 383.2203999999999, "r": 449.64444, "b": 385.34148999999996, "coord_origin": "TOPLEFT"}}, {"id": 253, "text": "K H U H Z D V D F K D Q J H W R W K H 7 ( 5 3 6 F U L W H U L D L Q W K D W D \u1087H F W V F L U F O L Q J D U H D G L P H Q V L R Q E \\ H [ S D Q G L Q J W K H D U H D V W R S U R Y L G H ", "bbox": {"l": 450.18811, "t": 383.2203999999999, "r": 550.77124, "b": 385.34148999999996, "coord_origin": "TOPLEFT"}}, {"id": 254, "text": "improved obstacle protection. To indicate that the new criteria had been applied to a given procedure, a ", "bbox": {"l": 449.10074000000003, "t": 385.75732, "r": 536.14716, "b": 387.87842, "coord_origin": "TOPLEFT"}}, {"id": 255, "text": " is placed on ", "bbox": {"l": 538.31085, "t": 385.75732, "r": 549.49921, "b": 387.87842, "coord_origin": "TOPLEFT"}}, {"id": 256, "text": "the circling line of minimums. The new circling tables and explanatory information is located in the Legend of the TPP.", "bbox": {"l": 449.10074000000003, "t": 388.03601, "r": 547.58185, "b": 390.1571, "coord_origin": "TOPLEFT"}}, {"id": 257, "text": "7", "bbox": {"l": 449.10074000000003, "t": 393.2128000000001, "r": 449.6163, "b": 395.33386, "coord_origin": "TOPLEFT"}}, {"id": 258, "text": "K H D S S U R D F K H V X V L Q J V W D Q G D U G F L U F O L Q J D S S U R D F K D U H D V F D Q E H L G H Q W L \u00bf H G E \\ W K H D E V H Q F H R I W K H ", "bbox": {"l": 450.1319, "t": 393.2128000000001, "r": 529.53082, "b": 395.33386, "coord_origin": "TOPLEFT"}}, {"id": 259, "text": " on the circling line of ", "bbox": {"l": 532.05829, "t": 393.2128000000001, "r": 550.42261, "b": 395.33386, "coord_origin": "TOPLEFT"}}, {"id": 260, "text": "minima.", "bbox": {"l": 449.10074000000003, "t": 395.49149, "r": 455.74692, "b": 397.61255, "coord_origin": "TOPLEFT"}}, {"id": 261, "text": "$ S S O \\ 6 W D Q G D U G & L U F O L Q J $ S S U R D F K 0 D Q H X Y H U L Q J 5 D G L X V 7 D E O H ", "bbox": {"l": 449.95525999999995, "t": 415.59549, "r": 496.2829, "b": 417.50446, "coord_origin": "TOPLEFT"}}, {"id": 262, "text": "$ S S O \\ ( [ S D Q G H G & L U F O L Q J $ S S U R D F K 0 D Q H X Y H U L Q J $ L U V S D F H 5 D G L X V ", "bbox": {"l": 501.13077, "t": 409.25543, "r": 551.16101, "b": 411.1644, "coord_origin": "TOPLEFT"}}, {"id": 263, "text": "Table", "bbox": {"l": 501.13077, "t": 411.30624, "r": 505.2477999999999, "b": 413.21521, "coord_origin": "TOPLEFT"}}, {"id": 264, "text": "AIRPORT SKETCH", "bbox": {"l": 449.10074000000003, "t": 420.18802, "r": 469.35599, "b": 422.73331, "coord_origin": "TOPLEFT"}}, {"id": 265, "text": "The airport sketch is a depiction of the airport with emphasis on runway pattern and related ", "bbox": {"l": 449.10074000000003, "t": 425.08908, "r": 525.93616, "b": 427.21017, "coord_origin": "TOPLEFT"}}, {"id": 266, "text": "information, positioned in either the lower left or lower right corner of the chart to aid pi-", "bbox": {"l": 449.10074000000003, "t": 427.3678, "r": 522.0343, "b": 429.48886, "coord_origin": "TOPLEFT"}}, {"id": 267, "text": "lot recognition of the airport from the air and to provide some information to aid on ground ", "bbox": {"l": 449.10074000000003, "t": 429.64648, "r": 524.67151, "b": 431.76755, "coord_origin": "TOPLEFT"}}, {"id": 268, "text": "navigation of the airport. The runways are drawn to scale and oriented to true north. Runway ", "bbox": {"l": 449.10074000000003, "t": 431.92514000000006, "r": 527.172, "b": 434.04623, "coord_origin": "TOPLEFT"}}, {"id": 269, "text": "dimensions (length and width) are shown for all active runways.", "bbox": {"l": 449.10074000000003, "t": 434.20383, "r": 502.39545, "b": 436.32492, "coord_origin": "TOPLEFT"}}, {"id": 270, "text": "Runway(s) are depicted based on what type and construction of the runway.", "bbox": {"l": 449.10074000000003, "t": 438.7611999999999, "r": 512.92676, "b": 440.88228999999995, "coord_origin": "TOPLEFT"}}, {"id": 271, "text": "Hard Surface", "bbox": {"l": 449.95525999999995, "t": 444.07001, "r": 460.02307, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}, {"id": 272, "text": "Other Than ", "bbox": {"l": 464.89963, "t": 444.07001, "r": 473.98819, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}, {"id": 273, "text": "Hard Surface", "bbox": {"l": 464.89963, "t": 446.12085, "r": 474.96744, "b": 448.02979, "coord_origin": "TOPLEFT"}}, {"id": 274, "text": "Metal Surface", "bbox": {"l": 478.91357, "t": 444.07001, "r": 489.45648, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}, {"id": 275, "text": "Closed Runway", "bbox": {"l": 493.06420999999995, "t": 444.07001, "r": 505.03076, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}, {"id": 276, "text": "Under Construction", "bbox": {"l": 509.5809, "t": 444.07001, "r": 524.30237, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}, {"id": 277, "text": "Stopways, ", "bbox": {"l": 449.95525999999995, "t": 454.81207, "r": 458.31406, "b": 456.72104, "coord_origin": "TOPLEFT"}}, {"id": 278, "text": "Taxiways, Park-", "bbox": {"l": 449.95525999999995, "t": 456.86288, "r": 461.92083999999994, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}}, {"id": 279, "text": "ing Areas", "bbox": {"l": 449.95525999999995, "t": 458.91373, "r": 457.08014, "b": 460.82268999999997, "coord_origin": "TOPLEFT"}}, {"id": 280, "text": "Displaced ", "bbox": {"l": 464.89963, "t": 454.81207, "r": 472.87732, "b": 456.72104, "coord_origin": "TOPLEFT"}}, {"id": 281, "text": "Threshold", "bbox": {"l": 464.89963, "t": 456.86288, "r": 472.49792, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}}, {"id": 282, "text": "Closed", "bbox": {"l": 478.91357, "t": 454.81207, "r": 483.61584, "b": 456.72104, "coord_origin": "TOPLEFT"}}, {"id": 283, "text": "Pavement", "bbox": {"l": 478.91357, "t": 456.86288, "r": 486.60754000000003, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}}, {"id": 284, "text": "Water Runway", "bbox": {"l": 493.06420999999995, "t": 454.81207, "r": 504.20648, "b": 456.72104, "coord_origin": "TOPLEFT"}}, {"id": 285, "text": "Taxiways and aprons are shaded grey. Other runway features that may be shown are runway numbers, runway dimen-", "bbox": {"l": 449.10074000000003, "t": 469.32974, "r": 548.59674, "b": 471.45081, "coord_origin": "TOPLEFT"}}, {"id": 286, "text": "sions, runway slope, arresting gear, and displaced threshold.", "bbox": {"l": 449.10074000000003, "t": 471.60843, "r": 500.08181999999994, "b": 473.72949, "coord_origin": "TOPLEFT"}}, {"id": 287, "text": "2", "bbox": {"l": 449.10074000000003, "t": 476.16577, "r": 449.59933000000007, "b": 478.28687, "coord_origin": "TOPLEFT"}}, {"id": 288, "text": "W K H U L Q I R U P D W L R Q F R Q F H U Q L Q J O L J K W L Q J \u00bf Q D O D S S U R D F K E H D U L Q J V D L U S R U W E H D F R Q R E V W D F O H V F R Q W U R O W R Z H U 1 $ 9 $ , ' V K H O L ", "bbox": {"l": 450.09796, "t": 476.16577, "r": 547.82562, "b": 478.28687, "coord_origin": "TOPLEFT"}}, {"id": 289, "text": "-", "bbox": {"l": 547.82623, "t": 476.16577, "r": 548.45862, "b": 478.28687, "coord_origin": "TOPLEFT"}}, {"id": 290, "text": "pads may also be shown.", "bbox": {"l": 449.10074000000003, "t": 478.44446, "r": 470.52609000000007, "b": 480.56555, "coord_origin": "TOPLEFT"}}, {"id": 291, "text": "$ L U S R U W ( O H Y D W L R Q D Q G 7 R X F K G R Z Q = R Q H ( O H Y D W L R Q ", "bbox": {"l": 449.10074000000003, "t": 483.00183, "r": 493.37906000000004, "b": 485.12292, "coord_origin": "TOPLEFT"}}, {"id": 292, "text": "The airport elevation is shown enclosed within a box in the upper left corner of the sketch box and the touchdown zone ", "bbox": {"l": 449.10074000000003, "t": 487.5592, "r": 549.16168, "b": 489.6803, "coord_origin": "TOPLEFT"}}, {"id": 293, "text": "elevation (TDZE) is shown in the upper right corner of the sketch box. The airport elevation is the highest point of an ", "bbox": {"l": 449.10074000000003, "t": 489.83789, "r": 546.90881, "b": 491.95898, "coord_origin": "TOPLEFT"}}, {"id": 294, "text": "D L U S R U W \u00b6 V X V D E O H U X Q Z D \\ V P H D V X U H G L Q I H H W I U R P P H D Q V H D O H Y H O 7 K H 7 ' = ( L V W K H K L J K H V W H O H Y D W L R Q L Q W K H \u00bf U V W I H H W R I ", "bbox": {"l": 449.10074000000003, "t": 492.11658, "r": 551.80023, "b": 494.23767, "coord_origin": "TOPLEFT"}}, {"id": 295, "text": "the landing surface. Circling only approaches will not show a TDZE.", "bbox": {"l": 449.10074000000003, "t": 494.39526, "r": 505.85068000000007, "b": 496.51636, "coord_origin": "TOPLEFT"}}, {"id": 296, "text": "114", "bbox": {"l": 498.80661000000003, "t": 515.9437, "r": 502.08792, "b": 519.01764, "coord_origin": "TOPLEFT"}}, {"id": 297, "text": "FAA Chart Users\u2019 Guide - Terminal Procedures Publication (TPP) - Terms", "bbox": {"l": 444.56319999999994, "t": 422.84869, "r": 446.25998, "b": 471.87128, "coord_origin": "TOPLEFT"}}, {"id": 298, "text": "AGL 2013 Financial Calendar", "bbox": {"l": 329.40536, "t": 379.37537, "r": 355.13138, "b": 382.13336, "coord_origin": "TOPLEFT"}}, {"id": 299, "text": "22", "bbox": {"l": 329.40536, "t": 382.30273, "r": 330.96848, "b": 384.55927, "coord_origin": "TOPLEFT"}}, {"id": 300, "text": "August 2012 ", "bbox": {"l": 331.75003, "t": 382.30273, "r": 341.12875, "b": 384.55927, "coord_origin": "TOPLEFT"}}, {"id": 301, "text": "2012 full year result and fi nal dividend announced", "bbox": {"l": 350.4722, "t": 382.30273, "r": 384.81079, "b": 384.55927, "coord_origin": "TOPLEFT"}}, {"id": 302, "text": "30", "bbox": {"l": 329.40536, "t": 384.84552, "r": 330.97336, "b": 387.10205, "coord_origin": "TOPLEFT"}}, {"id": 303, "text": "August 2012 ", "bbox": {"l": 331.75735, "t": 384.84552, "r": 341.16534, "b": 387.10205, "coord_origin": "TOPLEFT"}}, {"id": 304, "text": "Ex-dividend trading commences", "bbox": {"l": 350.4722, "t": 384.84552, "r": 372.90613, "b": 387.10205, "coord_origin": "TOPLEFT"}}, {"id": 305, "text": "5", "bbox": {"l": 329.40536, "t": 387.38828, "r": 330.20337, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}}, {"id": 306, "text": "September 2012 ", "bbox": {"l": 331.00137, "t": 387.38828, "r": 342.9715, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}}, {"id": 307, "text": "Record date for 2012 fi nal dividend", "bbox": {"l": 350.4722, "t": 387.38828, "r": 374.88693, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}}, {"id": 308, "text": "27", "bbox": {"l": 329.40536, "t": 389.93103, "r": 331.0173, "b": 392.18762, "coord_origin": "TOPLEFT"}}, {"id": 309, "text": "September 2012 ", "bbox": {"l": 331.82327, "t": 389.93103, "r": 343.91284, "b": 392.18762, "coord_origin": "TOPLEFT"}}, {"id": 310, "text": "Final dividend payable", "bbox": {"l": 350.4722, "t": 389.93103, "r": 365.65988, "b": 392.18762, "coord_origin": "TOPLEFT"}}, {"id": 311, "text": "23", "bbox": {"l": 329.40536, "t": 392.47382, "r": 330.98804, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}}, {"id": 312, "text": "October 2012 ", "bbox": {"l": 331.77936, "t": 392.47382, "r": 342.06674, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}}, {"id": 313, "text": "Annual General Meeting", "bbox": {"l": 350.4722, "t": 392.47382, "r": 367.22156, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}}, {"id": 314, "text": "27", "bbox": {"l": 329.40536, "t": 395.0166, "r": 330.99741, "b": 397.27313, "coord_origin": "TOPLEFT"}}, {"id": 315, "text": "February 2013", "bbox": {"l": 331.7934, "t": 395.0166, "r": 342.1416, "b": 397.27313, "coord_origin": "TOPLEFT"}}, {"id": 316, "text": " 1", "bbox": {"l": 342.64841, "t": 395.18298, "r": 342.65811, "b": 396.49857000000003, "coord_origin": "TOPLEFT"}}, {"id": 317, "text": "2013 interim result and interim dividend announced", "bbox": {"l": 350.47177, "t": 395.01474, "r": 386.25897, "b": 397.2713, "coord_origin": "TOPLEFT"}}, {"id": 318, "text": "28", "bbox": {"l": 329.40491, "t": 397.55749999999995, "r": 331.02695, "b": 399.81406, "coord_origin": "TOPLEFT"}}, {"id": 319, "text": "August 2013", "bbox": {"l": 331.83795, "t": 397.55749999999995, "r": 340.75909, "b": 399.81406, "coord_origin": "TOPLEFT"}}, {"id": 320, "text": " 1", "bbox": {"l": 341.26437, "t": 397.7254, "r": 341.27408, "b": 399.04095, "coord_origin": "TOPLEFT"}}, {"id": 321, "text": "2013 full year results and fi nal dividend announced ", "bbox": {"l": 350.47144, "t": 397.55713, "r": 385.93265, "b": 399.81369, "coord_origin": "TOPLEFT"}}, {"id": 322, "text": "1", "bbox": {"l": 329.40536, "t": 400.46155, "r": 329.87708, "b": 401.96588, "coord_origin": "TOPLEFT"}}, {"id": 323, "text": "Indicative dates only, subject to change/Board confi rmation", "bbox": {"l": 330.34882, "t": 400.46155, "r": 358.65204, "b": 401.96588, "coord_origin": "TOPLEFT"}}, {"id": 324, "text": "AGL\u2019s Annual General Meeting will be held at the City Recital Hall, Angel Place, Sydney ", "bbox": {"l": 329.40536, "t": 404.34503, "r": 391.771, "b": 406.60156, "coord_origin": "TOPLEFT"}}, {"id": 325, "text": "commencing at 10.30am on Tuesday 23 October 2012.", "bbox": {"l": 329.40536, "t": 406.37857, "r": 369.65308, "b": 408.63513000000006, "coord_origin": "TOPLEFT"}}, {"id": 326, "text": "Ye s te rd ay", "bbox": {"l": 363.54486, "t": 460.53054999999995, "r": 379.25955, "b": 465.54507, "coord_origin": "TOPLEFT"}}, {"id": 327, "text": "Established in Sydney in 1837, and then ", "bbox": {"l": 363.54486, "t": 466.7157, "r": 391.38229, "b": 468.97223, "coord_origin": "TOPLEFT"}}, {"id": 328, "text": "known as The Australian Gas Light Company, ", "bbox": {"l": 363.54486, "t": 468.74924, "r": 395.01788, "b": 471.00577, "coord_origin": "TOPLEFT"}}, {"id": 329, "text": "the AGL business has an established history ", "bbox": {"l": 363.54486, "t": 470.78281, "r": 394.08322, "b": 473.03934, "coord_origin": "TOPLEFT"}}, {"id": 330, "text": "and reputation for serving the gas and ", "bbox": {"l": 363.54486, "t": 472.81635, "r": 390.60727, "b": 475.07288, "coord_origin": "TOPLEFT"}}, {"id": 331, "text": "electricity needs of Australian households. ", "bbox": {"l": 363.54486, "t": 474.84988, "r": 393.49612, "b": 477.10645, "coord_origin": "TOPLEFT"}}, {"id": 332, "text": "In 1841, when AGL supplied the gas to light ", "bbox": {"l": 363.54486, "t": 476.88345, "r": 394.11481, "b": 479.13998, "coord_origin": "TOPLEFT"}}, {"id": 333, "text": "the fi rst public street lamp, it was reported ", "bbox": {"l": 363.54486, "t": 478.91699, "r": 393.75891, "b": 481.17352, "coord_origin": "TOPLEFT"}}, {"id": 334, "text": "in the Sydney Gazette as a \u201cwonderful ", "bbox": {"l": 363.54486, "t": 480.95053, "r": 390.4975, "b": 483.20709, "coord_origin": "TOPLEFT"}}, {"id": 335, "text": "achievement of scientifi c knowledge, assisted ", "bbox": {"l": 363.54486, "t": 482.9841, "r": 395.70975, "b": 485.24063, "coord_origin": "TOPLEFT"}}, {"id": 336, "text": "by mechanical ingenuity.\u201d Within two years, ", "bbox": {"l": 363.54486, "t": 485.01764, "r": 394.27283, "b": 487.2742, "coord_origin": "TOPLEFT"}}, {"id": 337, "text": "165 gas lamps were lighting the City of Sydney.", "bbox": {"l": 363.54486, "t": 487.05121, "r": 396.65939, "b": 489.30774, "coord_origin": "TOPLEFT"}}, {"id": 338, "text": "Looking back on ", "bbox": {"l": 329.4054, "t": 419.93124, "r": 384.19696, "b": 431.09412, "coord_origin": "TOPLEFT"}}, {"id": 339, "text": "175 years of ", "bbox": {"l": 329.4054, "t": 430.10379, "r": 372.16626, "b": 441.26669, "coord_origin": "TOPLEFT"}}, {"id": 340, "text": "looking forward.", "bbox": {"l": 329.4054, "t": 440.27636999999993, "r": 385.3981, "b": 451.43924, "coord_origin": "TOPLEFT"}}, {"id": 341, "text": "AGL Energy Limited ABN 74 115 061 375", "bbox": {"l": 329.40536, "t": 372.16159, "r": 353.36179, "b": 373.91669, "coord_origin": "TOPLEFT"}}, {"id": 342, "text": "29", "bbox": {"l": 546.20587, "t": 360.90448, "r": 548.23407, "b": 362.82242, "coord_origin": "TOPLEFT"}}, {"id": 343, "text": "signs, signals and road markings", "bbox": {"l": 497.77728, "t": 251.43384000000003, "r": 542.8255, "b": 254.94385, "coord_origin": "TOPLEFT"}}, {"id": 344, "text": "3", "bbox": {"l": 490.30679, "t": 251.47478999999998, "r": 492.09982, "b": 254.98479999999995, "coord_origin": "TOPLEFT"}}, {"id": 345, "text": "In ", "bbox": {"l": 498.15335, "t": 263.88922, "r": 500.05637, "b": 265.92719, "coord_origin": "TOPLEFT"}}, {"id": 346, "text": "chapter 2, you and your vehicle", "bbox": {"l": 500.05637, "t": 263.85717999999997, "r": 524.37036, "b": 265.86310000000003, "coord_origin": "TOPLEFT"}}, {"id": 347, "text": ", you learned about ", "bbox": {"l": 524.37036, "t": 263.88922, "r": 539.89124, "b": 265.92719, "coord_origin": "TOPLEFT"}}, {"id": 348, "text": "some of the controls in your vehicle. This chapter is a handy ", "bbox": {"l": 498.15335, "t": 265.93224999999995, "r": 544.50403, "b": 267.97020999999995, "coord_origin": "TOPLEFT"}}, {"id": 349, "text": "reference section that gives examples of the most common ", "bbox": {"l": 498.15335, "t": 267.97533999999996, "r": 544.01343, "b": 270.01331000000005, "coord_origin": "TOPLEFT"}}, {"id": 350, "text": "signs, signals and road markings that keep traffi c organized ", "bbox": {"l": 498.15335, "t": 270.01831000000004, "r": 544.11987, "b": 272.05634, "coord_origin": "TOPLEFT"}}, {"id": 351, "text": "and flowing smoothly. ", "bbox": {"l": 498.15335, "t": 272.06140000000005, "r": 515.41071, "b": 274.09937, "coord_origin": "TOPLEFT"}}, {"id": 352, "text": "Signs", "bbox": {"l": 498.15335, "t": 277.34619, "r": 505.64642000000003, "b": 280.9357, "coord_origin": "TOPLEFT"}}, {"id": 353, "text": "There are three ways to read signs: by their shape, colour and ", "bbox": {"l": 498.15335, "t": 281.82187, "r": 543.92957, "b": 283.85983, "coord_origin": "TOPLEFT"}}, {"id": 354, "text": "the messages printed on them. Understanding these three ways ", "bbox": {"l": 498.15335, "t": 283.8649, "r": 545.67834, "b": 285.90289, "coord_origin": "TOPLEFT"}}, {"id": 355, "text": "of classifying signs will help you figure out the meaning of signs ", "bbox": {"l": 498.15335, "t": 285.90796, "r": 545.26471, "b": 287.94592, "coord_origin": "TOPLEFT"}}, {"id": 356, "text": "that are new to you. ", "bbox": {"l": 498.15335, "t": 287.95099, "r": 513.31335, "b": 289.98895, "coord_origin": "TOPLEFT"}}, {"id": 357, "text": "Stop", "bbox": {"l": 505.43439, "t": 303.07596, "r": 508.53033000000005, "b": 304.89639, "coord_origin": "TOPLEFT"}}, {"id": 358, "text": "Yield the right-of-way", "bbox": {"l": 527.45502, "t": 303.25354, "r": 541.44678, "b": 305.07397, "coord_origin": "TOPLEFT"}}, {"id": 359, "text": "Shows driving", "bbox": {"l": 501.79385, "t": 321.18973, "r": 510.41632, "b": 323.01016, "coord_origin": "TOPLEFT"}}, {"id": 360, "text": "regulations", "bbox": {"l": 501.79385, "t": 322.87731999999994, "r": 509.04268999999994, "b": 324.69775000000004, "coord_origin": "TOPLEFT"}}, {"id": 361, "text": "Explains lane use", "bbox": {"l": 518.66455, "t": 319.59146, "r": 529.80902, "b": 321.41190000000006, "coord_origin": "TOPLEFT"}}, {"id": 362, "text": "School zone signs ", "bbox": {"l": 534.87561, "t": 318.37616, "r": 546.95142, "b": 320.19659, "coord_origin": "TOPLEFT"}}, {"id": 363, "text": "are fl uorescent ", "bbox": {"l": 534.87561, "t": 320.0637500000001, "r": 545.05762, "b": 321.88419, "coord_origin": "TOPLEFT"}}, {"id": 364, "text": "yellow-green", "bbox": {"l": 534.87561, "t": 321.75134, "r": 543.32263, "b": 323.57178, "coord_origin": "TOPLEFT"}}, {"id": 365, "text": "Tells about motorist ", "bbox": {"l": 499.21862999999996, "t": 338.12772, "r": 512.62451, "b": 339.94815, "coord_origin": "TOPLEFT"}}, {"id": 366, "text": "services", "bbox": {"l": 499.21862999999996, "t": 339.81531000000007, "r": 504.39917, "b": 341.63574, "coord_origin": "TOPLEFT"}}, {"id": 367, "text": "Shows a permitted ", "bbox": {"l": 516.97748, "t": 338.06039, "r": 529.77484, "b": 339.88082999999995, "coord_origin": "TOPLEFT"}}, {"id": 368, "text": "action", "bbox": {"l": 516.97748, "t": 339.74799, "r": 520.96399, "b": 341.56842, "coord_origin": "TOPLEFT"}}, {"id": 369, "text": "Shows an action that ", "bbox": {"l": 534.55847, "t": 337.88281, "r": 548.58453, "b": 339.7032500000001, "coord_origin": "TOPLEFT"}}, {"id": 370, "text": "is not permitted", "bbox": {"l": 534.55847, "t": 339.57040000000006, "r": 545.08862, "b": 341.39084, "coord_origin": "TOPLEFT"}}, {"id": 371, "text": "Warns of hazards ", "bbox": {"l": 483.05853, "t": 356.17416, "r": 494.72577, "b": 357.9946, "coord_origin": "TOPLEFT"}}, {"id": 372, "text": "ahead", "bbox": {"l": 483.05853, "t": 357.86179, "r": 487.07525999999996, "b": 359.68222, "coord_origin": "TOPLEFT"}}, {"id": 373, "text": "Warns of", "bbox": {"l": 499.39645, "t": 356.26297000000005, "r": 504.69171, "b": 358.0834, "coord_origin": "TOPLEFT"}}, {"id": 374, "text": "construction zones", "bbox": {"l": 499.39645, "t": 357.95056, "r": 511.69116, "b": 359.77099999999996, "coord_origin": "TOPLEFT"}}, {"id": 375, "text": "Railway crossing", "bbox": {"l": 516.75891, "t": 356.26297000000005, "r": 527.42938, "b": 358.0834, "coord_origin": "TOPLEFT"}}, {"id": 376, "text": "Shows distance and ", "bbox": {"l": 534.5141, "t": 352.92981, "r": 547.89862, "b": 354.75024, "coord_origin": "TOPLEFT"}}, {"id": 377, "text": "direction", "bbox": {"l": 534.5141, "t": 354.6174, "r": 540.2818, "b": 356.43784, "coord_origin": "TOPLEFT"}}, {"id": 378, "text": "\u2022", "bbox": {"l": 478.37466, "t": 270.14075, "r": 479.14251999999993, "b": 272.17877, "coord_origin": "TOPLEFT"}}, {"id": 379, "text": "Signs", "bbox": {"l": 479.91036999999994, "t": 270.14075, "r": 483.74963, "b": 272.17877, "coord_origin": "TOPLEFT"}}, {"id": 380, "text": "- regulatory signs", "bbox": {"l": 479.97293, "t": 272.84717, "r": 492.31219, "b": 274.34888, "coord_origin": "TOPLEFT"}}, {"id": 381, "text": "- school, ", "bbox": {"l": 479.97293, "t": 275.14513999999997, "r": 486.72598000000005, "b": 276.64679, "coord_origin": "TOPLEFT"}}, {"id": 382, "text": "playground and ", "bbox": {"l": 481.21602999999993, "t": 276.77972, "r": 492.93286000000006, "b": 278.81768999999997, "coord_origin": "TOPLEFT"}}, {"id": 383, "text": "crosswalk signs", "bbox": {"l": 481.21602999999993, "t": 278.82275000000004, "r": 491.82938000000007, "b": 280.86075, "coord_origin": "TOPLEFT"}}, {"id": 384, "text": "- lane use signs", "bbox": {"l": 479.97293, "t": 281.52759, "r": 491.00775000000004, "b": 283.02924, "coord_origin": "TOPLEFT"}}, {"id": 385, "text": "- turn control signs", "bbox": {"l": 479.97293, "t": 283.82556, "r": 493.32748, "b": 285.3272099999999, "coord_origin": "TOPLEFT"}}, {"id": 386, "text": "- parking signs", "bbox": {"l": 479.97293, "t": 286.1235, "r": 490.4915199999999, "b": 287.62518, "coord_origin": "TOPLEFT"}}, {"id": 387, "text": "- reserved lane ", "bbox": {"l": 479.97293, "t": 288.42148, "r": 491.17004000000003, "b": 289.92316, "coord_origin": "TOPLEFT"}}, {"id": 388, "text": "signs", "bbox": {"l": 481.21602999999993, "t": 290.05605999999995, "r": 484.77405000000005, "b": 292.09406, "coord_origin": "TOPLEFT"}}, {"id": 389, "text": "- warning signs", "bbox": {"l": 479.97293, "t": 292.76169000000004, "r": 490.83398, "b": 294.26334, "coord_origin": "TOPLEFT"}}, {"id": 390, "text": "- object markers", "bbox": {"l": 479.97293, "t": 295.05963, "r": 491.62692, "b": 296.56131, "coord_origin": "TOPLEFT"}}, {"id": 391, "text": "- construction ", "bbox": {"l": 479.97293, "t": 297.3576, "r": 490.37341, "b": 298.8592499999999, "coord_origin": "TOPLEFT"}}, {"id": 392, "text": "signs", "bbox": {"l": 481.21602999999993, "t": 298.99219, "r": 484.77405000000005, "b": 301.03015, "coord_origin": "TOPLEFT"}}, {"id": 393, "text": "- information and ", "bbox": {"l": 479.97293, "t": 301.69780999999995, "r": 492.93912, "b": 303.19946, "coord_origin": "TOPLEFT"}}, {"id": 394, "text": "destination signs", "bbox": {"l": 481.21602999999993, "t": 303.3324, "r": 493.00525, "b": 305.37036, "coord_origin": "TOPLEFT"}}, {"id": 395, "text": "- railway signs", "bbox": {"l": 479.97293, "t": 306.0379899999999, "r": 489.99047999999993, "b": 307.53967, "coord_origin": "TOPLEFT"}}, {"id": 396, "text": "\u2022", "bbox": {"l": 478.375, "t": 308.24789, "r": 479.1032400000001, "b": 310.28586, "coord_origin": "TOPLEFT"}}, {"id": 397, "text": "Signals", "bbox": {"l": 479.83151, "t": 308.24789, "r": 484.92925999999994, "b": 310.28586, "coord_origin": "TOPLEFT"}}, {"id": 398, "text": "- lane control ", "bbox": {"l": 479.97293, "t": 310.95358, "r": 490.00091999999995, "b": 312.45526, "coord_origin": "TOPLEFT"}}, {"id": 399, "text": "signals", "bbox": {"l": 481.21602999999993, "t": 312.5881999999999, "r": 485.95331, "b": 314.62616, "coord_origin": "TOPLEFT"}}, {"id": 400, "text": "- traffic lights", "bbox": {"l": 479.97293, "t": 315.29379, "r": 489.29876999999993, "b": 316.79544, "coord_origin": "TOPLEFT"}}, {"id": 401, "text": "\u2022", "bbox": {"l": 478.375, "t": 317.50366, "r": 479.18129999999996, "b": 319.5416599999999, "coord_origin": "TOPLEFT"}}, {"id": 402, "text": "Road markings", "bbox": {"l": 479.98761, "t": 317.50366, "r": 490.46960000000007, "b": 319.5416599999999, "coord_origin": "TOPLEFT"}}, {"id": 403, "text": "- yellow lines", "bbox": {"l": 479.97293, "t": 320.20938, "r": 489.26166000000006, "b": 321.71103, "coord_origin": "TOPLEFT"}}, {"id": 404, "text": "- white lines", "bbox": {"l": 479.97293, "t": 322.50732, "r": 488.59189, "b": 324.009, "coord_origin": "TOPLEFT"}}, {"id": 405, "text": "- reserved lane ", "bbox": {"l": 479.97293, "t": 324.8053, "r": 491.17004000000003, "b": 326.30698, "coord_origin": "TOPLEFT"}}, {"id": 406, "text": "markings", "bbox": {"l": 481.21602999999993, "t": 326.43988, "r": 487.58978, "b": 328.47784, "coord_origin": "TOPLEFT"}}, {"id": 407, "text": "- other markings", "bbox": {"l": 479.97293, "t": 329.14551, "r": 491.75177, "b": 330.64716, "coord_origin": "TOPLEFT"}}, {"id": 408, "text": "in this chapter", "bbox": {"l": 478.15246999999994, "t": 265.07030999999995, "r": 493.75586, "b": 268.06872999999996, "coord_origin": "TOPLEFT"}}], "children": [{"id": 32, "label": "text", "bbox": {"l": 327.86951, "t": 351.78085, "r": 330.41248, "b": 353.95465, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "13", "bbox": {"l": 327.86951, "t": 351.78085, "r": 330.41248, "b": 353.95465, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 327.83005, "t": 331.57268999999997, "r": 351.16092, "b": 333.31171, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "USING THE VERTICAL TUBE -", "bbox": {"l": 327.83005, "t": 331.57268999999997, "r": 351.16092, "b": 333.31171, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 327.83005, "t": 333.18292, "r": 348.30536, "b": 334.92194, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "MODELS AY11230/11234", "bbox": {"l": 327.83005, "t": 333.18292, "r": 348.30536, "b": 334.92194, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 327.83005, "t": 336.40439, "r": 329.05914, "b": 337.92606, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "1.", "bbox": {"l": 327.83005, "t": 336.40439, "r": 329.05914, "b": 337.92606, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 329.67368, "t": 336.40439, "r": 349.95349, "b": 337.92606, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "The vertical tube can be used for", "bbox": {"l": 329.67368, "t": 336.40439, "r": 349.95349, "b": 337.92606, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 329.11752, "t": 337.83588, "r": 353.57977, "b": 339.35751000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "instructional viewing or to photograph", "bbox": {"l": 329.11752, "t": 337.83588, "r": 353.57977, "b": 339.35751000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 327.77121, "t": 339.26736, "r": 352.4306, "b": 340.789, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": " the image with a digital camera or a", "bbox": {"l": 327.77121, "t": 339.26736, "r": 352.4306, "b": 340.789, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 328.15176, "t": 340.69882, "r": 337.91086, "b": 342.22049, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": " micro TV unit", "bbox": {"l": 328.15176, "t": 340.69882, "r": 337.91086, "b": 342.22049, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 327.8313, "t": 342.19043000000005, "r": 329.09155, "b": 343.71207, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "2.", "bbox": {"l": 327.8313, "t": 342.19043000000005, "r": 329.09155, "b": 343.71207, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 329.72168, "t": 342.19043000000005, "r": 354.9267, "b": 343.71207, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "Loosen the retention screw, then rotate ", "bbox": {"l": 329.72168, "t": 342.19043000000005, "r": 354.9267, "b": 343.71207, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 327.8313, "t": 343.62192, "r": 351.66949, "b": 345.14355, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": " the adjustment ring to change the ", "bbox": {"l": 327.8313, "t": 343.62192, "r": 351.66949, "b": 345.14355, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 328.21185, "t": 345.05338, "r": 346.33179, "b": 346.57504, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": " length of the vertical tube.", "bbox": {"l": 328.21185, "t": 345.05338, "r": 346.33179, "b": 346.57504, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 327.83005, "t": 346.84680000000003, "r": 329.12726, "b": 348.36847, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "3.", "bbox": {"l": 327.83005, "t": 346.84680000000003, "r": 329.12726, "b": 348.36847, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 329.77588, "t": 346.84680000000003, "r": 351.18005, "b": 348.36847, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "Make sure that both the images in", "bbox": {"l": 329.77588, "t": 346.84680000000003, "r": 351.18005, "b": 348.36847, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 327.25311, "t": 254.94812000000002, "r": 350.07861, "b": 258.86096, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "OPERATION ", "bbox": {"l": 327.25311, "t": 254.94812000000002, "r": 350.07861, "b": 258.86096, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 350.07861, "t": 254.76782000000003, "r": 351.82651, "b": 258.68066, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "(", "bbox": {"l": 350.07861, "t": 254.76782000000003, "r": 351.82651, "b": 258.68066, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 351.82651, "t": 254.94812000000002, "r": 360.85242, "b": 258.86096, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "cont.", "bbox": {"l": 351.82651, "t": 254.94812000000002, "r": 360.85242, "b": 258.86096, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 360.85242, "t": 254.76782000000003, "r": 362.60028, "b": 258.68066, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": ")", "bbox": {"l": 360.85242, "t": 254.76782000000003, "r": 362.60028, "b": 258.68066, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 326.88037, "t": 263.49492999999995, "r": 345.84351, "b": 265.23395000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "SELECTING OBJECTIVE ", "bbox": {"l": 326.88037, "t": 263.49492999999995, "r": 345.84351, "b": 265.23395000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 326.88037, "t": 265.10515999999996, "r": 340.54153, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "MAGNIFICATION", "bbox": {"l": 326.88037, "t": 265.10515999999996, "r": 340.54153, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 326.88037, "t": 266.71533, "r": 328.31903, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "1.", "bbox": {"l": 326.88037, "t": 266.71533, "r": 328.31903, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 329.03836, "t": 266.71533, "r": 354.21472, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "There are two objectives. The lower", "bbox": {"l": 329.03836, "t": 266.71533, "r": 354.21472, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 326.88037, "t": 268.32556, "r": 355.19193, "b": 270.06458, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": " magnification objective has a greater", "bbox": {"l": 326.88037, "t": 268.32556, "r": 355.19193, "b": 270.06458, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 326.88037, "t": 269.93579, "r": 345.80057, "b": 271.6748, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": " depth of field and view.", "bbox": {"l": 326.88037, "t": 269.93579, "r": 345.80057, "b": 271.6748, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 326.88037, "t": 271.54602, "r": 328.33862, "b": 273.28503, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "2.", "bbox": {"l": 326.88037, "t": 271.54602, "r": 328.33862, "b": 273.28503, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 329.06775, "t": 271.54602, "r": 352.39969, "b": 273.28503, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "In order to observe the specimen", "bbox": {"l": 329.06775, "t": 271.54602, "r": 352.39969, "b": 273.28503, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 326.88037, "t": 273.15619000000004, "r": 352.90042, "b": 274.89526, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": " easily use the lower magnification", "bbox": {"l": 326.88037, "t": 273.15619000000004, "r": 352.90042, "b": 274.89526, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 326.88037, "t": 274.76642000000004, "r": 354.59546, "b": 276.50543000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": " objective first. Then, by rotating the", "bbox": {"l": 326.88037, "t": 274.76642000000004, "r": 354.59546, "b": 276.50543000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 326.88037, "t": 276.37665000000004, "r": 350.81885, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": " case, the magnification can be", "bbox": {"l": 326.88037, "t": 276.37665000000004, "r": 350.81885, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 326.88037, "t": 277.98688000000004, "r": 335.46707, "b": 279.72589000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": " changed.", "bbox": {"l": 326.88037, "t": 277.98688000000004, "r": 335.46707, "b": 279.72589000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 326.88037, "t": 281.20728, "r": 354.57755, "b": 282.94632, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 107, "text": "CHANGING THE INTERPUPILLARY ", "bbox": {"l": 326.88037, "t": 281.20728, "r": 354.57755, "b": 282.94632, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 326.88037, "t": 282.81750000000005, "r": 335.1752, "b": 284.55652, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 108, "text": "DISTANCE", "bbox": {"l": 326.88037, "t": 282.81750000000005, "r": 335.1752, "b": 284.55652, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 326.88037, "t": 284.4277, "r": 328.34784, "b": 286.16675, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 109, "text": "1.", "bbox": {"l": 326.88037, "t": 284.4277, "r": 328.34784, "b": 286.16675, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 329.08157, "t": 284.4277, "r": 354.76245, "b": 286.16675, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 110, "text": "The distance between the observer's", "bbox": {"l": 329.08157, "t": 284.4277, "r": 354.76245, "b": 286.16675, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 326.88037, "t": 286.03793, "r": 354.6499, "b": 287.77695, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 111, "text": " pupils is the interpupillary distance.", "bbox": {"l": 326.88037, "t": 286.03793, "r": 354.6499, "b": 287.77695, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 326.88037, "t": 287.64813, "r": 328.25125, "b": 289.38718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 112, "text": "2.", "bbox": {"l": 326.88037, "t": 287.64813, "r": 328.25125, "b": 289.38718, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 328.93671, "t": 287.64813, "r": 354.29825, "b": 289.38718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 113, "text": "To adjust the interpupillary distance", "bbox": {"l": 328.93671, "t": 287.64813, "r": 354.29825, "b": 289.38718, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 326.88181, "t": 289.25836, "r": 355.02075, "b": 290.99738, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 114, "text": " rotate the prism caps until both eyes", "bbox": {"l": 326.88181, "t": 289.25836, "r": 355.02075, "b": 290.99738, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 326.88181, "t": 290.86855999999995, "r": 350.82028, "b": 292.6076, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 115, "text": " coincide with the image in the", "bbox": {"l": 326.88181, "t": 290.86855999999995, "r": 350.82028, "b": 292.6076, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 326.88181, "t": 292.47879, "r": 336.2067, "b": 294.2178, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 116, "text": " eyepiece. ", "bbox": {"l": 326.88181, "t": 292.47879, "r": 336.2067, "b": 294.2178, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 326.88181, "t": 295.69922, "r": 335.3941, "b": 297.43823, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 117, "text": "FOCUSING", "bbox": {"l": 326.88181, "t": 295.69922, "r": 335.3941, "b": 297.43823, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 326.88181, "t": 297.30942, "r": 328.34314, "b": 299.04846, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 118, "text": "1.", "bbox": {"l": 326.88181, "t": 297.30942, "r": 328.34314, "b": 299.04846, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 329.07379, "t": 297.30942, "r": 353.18555, "b": 299.04846, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 119, "text": "Remove the lens protective cover.", "bbox": {"l": 329.07379, "t": 297.30942, "r": 353.18555, "b": 299.04846, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 326.88324, "t": 298.91965, "r": 328.35919, "b": 300.65866, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 120, "text": "2.", "bbox": {"l": 326.88324, "t": 298.91965, "r": 328.35919, "b": 300.65866, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 329.0972, "t": 298.91965, "r": 353.45065, "b": 300.65866, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 121, "text": "Place the specimen on the working", "bbox": {"l": 329.0972, "t": 298.91965, "r": 353.45065, "b": 300.65866, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 326.88324, "t": 300.52985, "r": 333.32825, "b": 302.26889000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 122, "text": " stage.", "bbox": {"l": 326.88324, "t": 300.52985, "r": 333.32825, "b": 302.26889000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 326.88324, "t": 302.14008000000007, "r": 328.31296, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 123, "text": "3.", "bbox": {"l": 326.88324, "t": 302.14008000000007, "r": 328.31296, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 329.02783, "t": 302.14008000000007, "r": 354.76303, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 124, "text": "Focus the specimen with the left eye", "bbox": {"l": 329.02783, "t": 302.14008000000007, "r": 354.76303, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 326.88324, "t": 303.75027, "r": 355.96307, "b": 305.48932, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 125, "text": " first while turning the focus knob until", "bbox": {"l": 326.88324, "t": 303.75027, "r": 355.96307, "b": 305.48932, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 326.88324, "t": 305.3605, "r": 354.46594, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 126, "text": " the image appears clear and sharp.", "bbox": {"l": 326.88324, "t": 305.3605, "r": 354.46594, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 326.88324, "t": 306.9707, "r": 328.25488, "b": 308.70975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 127, "text": "4.", "bbox": {"l": 326.88324, "t": 306.9707, "r": 328.25488, "b": 308.70975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 328.9407, "t": 306.9707, "r": 356.37335, "b": 308.70975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 128, "text": "Rotate the right eyepiece ring until the", "bbox": {"l": 328.9407, "t": 306.9707, "r": 356.37335, "b": 308.70975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 326.88324, "t": 308.58093, "r": 355.38867, "b": 310.31995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 129, "text": " images in each eyepiece coincide and", "bbox": {"l": 326.88324, "t": 308.58093, "r": 355.38867, "b": 310.31995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 326.88324, "t": 310.19113, "r": 343.17249, "b": 311.93018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 130, "text": " are sharp and clear.", "bbox": {"l": 326.88324, "t": 310.19113, "r": 343.17249, "b": 311.93018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 326.88324, "t": 313.41156, "r": 344.13388, "b": 315.15059999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 131, "text": "CHANGING THE BULB", "bbox": {"l": 326.88324, "t": 313.41156, "r": 344.13388, "b": 315.15059999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 326.88324, "t": 315.02178999999995, "r": 328.37418, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 132, "text": "1.", "bbox": {"l": 326.88324, "t": 315.02178999999995, "r": 328.37418, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 329.11963, "t": 315.02178999999995, "r": 348.50162, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 133, "text": "Disconnect the power cord.", "bbox": {"l": 329.11963, "t": 315.02178999999995, "r": 348.50162, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 326.88324, "t": 316.63199, "r": 328.34061, "b": 318.37103, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 134, "text": "2.", "bbox": {"l": 326.88324, "t": 316.63199, "r": 328.34061, "b": 318.37103, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 329.06931, "t": 316.63199, "r": 353.11588, "b": 318.37103, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 135, "text": "When the bulb is cool, remove the", "bbox": {"l": 329.06931, "t": 316.63199, "r": 353.11588, "b": 318.37103, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 326.88464, "t": 318.2422199999999, "r": 353.79517, "b": 319.9812299999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 136, "text": " oblique illuminator cap and remove", "bbox": {"l": 326.88464, "t": 318.2422199999999, "r": 353.79517, "b": 319.9812299999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 326.88464, "t": 319.85242000000005, "r": 348.02094, "b": 321.59146, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 137, "text": " the halogen bulb with cap.", "bbox": {"l": 326.88464, "t": 319.85242000000005, "r": 348.02094, "b": 321.59146, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 326.88464, "t": 321.46265, "r": 328.37512, "b": 323.20166, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 138, "text": "3.", "bbox": {"l": 326.88464, "t": 321.46265, "r": 328.37512, "b": 323.20166, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 329.12036, "t": 321.46265, "r": 352.96808, "b": 323.20166, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 139, "text": "Replace with a new halogen bulb.", "bbox": {"l": 329.12036, "t": 321.46265, "r": 352.96808, "b": 323.20166, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 326.88608, "t": 323.07285, "r": 328.36884, "b": 324.81189, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 140, "text": "4.", "bbox": {"l": 326.88608, "t": 323.07285, "r": 328.36884, "b": 324.81189, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 329.1102, "t": 323.07285, "r": 356.5412, "b": 324.81189, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 141, "text": "Open the window in the base plate and", "bbox": {"l": 329.1102, "t": 323.07285, "r": 356.5412, "b": 324.81189, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 326.88608, "t": 324.68307000000004, "r": 350.13828, "b": 326.42209, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 142, "text": " replace the halogen lamp or ", "bbox": {"l": 326.88608, "t": 324.68307000000004, "r": 350.13828, "b": 326.42209, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 326.88608, "t": 326.29327, "r": 351.59677, "b": 328.03232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 143, "text": " fluorescent lamp of transmitted", "bbox": {"l": 326.88608, "t": 326.29327, "r": 351.59677, "b": 328.03232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 326.88608, "t": 327.9035, "r": 336.89197, "b": 329.64252, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 144, "text": " illuminator.", "bbox": {"l": 326.88608, "t": 327.9035, "r": 336.89197, "b": 329.64252, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 358.42023, "t": 263.49492999999995, "r": 366.93256, "b": 265.23395000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 145, "text": "FOCUSING", "bbox": {"l": 358.42023, "t": 263.49492999999995, "r": 366.93256, "b": 265.23395000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 358.42023, "t": 265.10515999999996, "r": 359.89841, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 146, "text": "1.", "bbox": {"l": 358.42023, "t": 265.10515999999996, "r": 359.89841, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 360.63751, "t": 265.10515999999996, "r": 387.98407, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 147, "text": "Turn the focusing knob away or toward", "bbox": {"l": 360.63751, "t": 265.10515999999996, "r": 387.98407, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 358.42023, "t": 266.71533, "r": 384.58948, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 148, "text": " you until a clear image is viewed.", "bbox": {"l": 358.42023, "t": 266.71533, "r": 384.58948, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 358.42166, "t": 268.32556, "r": 359.78549, "b": 270.06458, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 149, "text": "2.", "bbox": {"l": 358.42166, "t": 268.32556, "r": 359.78549, "b": 270.06458, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 360.46741, "t": 268.32556, "r": 384.33441, "b": 270.06458, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 150, "text": "If the image is unclear, adjust the", "bbox": {"l": 360.46741, "t": 268.32556, "r": 384.33441, "b": 270.06458, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 358.4231, "t": 269.93579, "r": 384.61502, "b": 271.6748, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 151, "text": " height of the elevator up or down,", "bbox": {"l": 358.4231, "t": 269.93579, "r": 384.61502, "b": 271.6748, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 358.4231, "t": 271.54602, "r": 385.38922, "b": 273.28503, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 152, "text": " then turn the focusing knob again.", "bbox": {"l": 358.4231, "t": 271.54602, "r": 385.38922, "b": 273.28503, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 358.4231, "t": 274.76642000000004, "r": 377.35046, "b": 276.50543000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 153, "text": "ZOOM MAGNIFICATION", "bbox": {"l": 358.4231, "t": 274.76642000000004, "r": 377.35046, "b": 276.50543000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 358.4231, "t": 276.37665000000004, "r": 359.89429, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 154, "text": "1.", "bbox": {"l": 358.4231, "t": 276.37665000000004, "r": 359.89429, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 360.62988, "t": 276.37665000000004, "r": 386.37589, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 155, "text": "Turn the zoom magnification knob to", "bbox": {"l": 360.62988, "t": 276.37665000000004, "r": 386.37589, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 358.4231, "t": 277.98688000000004, "r": 386.78732, "b": 279.72589000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 156, "text": " the desired magnification and field of", "bbox": {"l": 358.4231, "t": 277.98688000000004, "r": 386.78732, "b": 279.72589000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 358.4231, "t": 279.59704999999997, "r": 364.16855, "b": 281.33609, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 157, "text": " view.", "bbox": {"l": 358.4231, "t": 279.59704999999997, "r": 364.16855, "b": 281.33609, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 358.4231, "t": 281.20728, "r": 359.86777, "b": 282.94632, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 158, "text": "2.", "bbox": {"l": 358.4231, "t": 281.20728, "r": 359.86777, "b": 282.94632, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 114, "label": "text", "bbox": {"l": 360.59012, "t": 281.20728, "r": 387.31656, "b": 282.94632, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 159, "text": "In most situations, it is recommended", "bbox": {"l": 360.59012, "t": 281.20728, "r": 387.31656, "b": 282.94632, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 115, "label": "text", "bbox": {"l": 358.4231, "t": 282.81750000000005, "r": 381.56656, "b": 284.55652, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 160, "text": " that you focus at the lowest ", "bbox": {"l": 358.4231, "t": 282.81750000000005, "r": 381.56656, "b": 284.55652, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 116, "label": "text", "bbox": {"l": 358.4231, "t": 284.4277, "r": 386.63403, "b": 286.16675, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 161, "text": " magnification, then move to a higher", "bbox": {"l": 358.4231, "t": 284.4277, "r": 386.63403, "b": 286.16675, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 117, "label": "text", "bbox": {"l": 358.42453, "t": 286.03793, "r": 382.77115, "b": 287.77695, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 162, "text": " magnification and re-focus as ", "bbox": {"l": 358.42453, "t": 286.03793, "r": 382.77115, "b": 287.77695, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 118, "label": "text", "bbox": {"l": 358.42453, "t": 287.64813, "r": 367.98694, "b": 289.38718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 163, "text": " necessary.", "bbox": {"l": 358.42453, "t": 287.64813, "r": 367.98694, "b": 289.38718, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 119, "label": "text", "bbox": {"l": 358.42453, "t": 289.25836, "r": 359.80386, "b": 290.99738, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 164, "text": "3.", "bbox": {"l": 358.42453, "t": 289.25836, "r": 359.80386, "b": 290.99738, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 120, "label": "text", "bbox": {"l": 360.49353, "t": 289.25836, "r": 386.70093, "b": 290.99738, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 165, "text": "If the image is not clear to both eyes", "bbox": {"l": 360.49353, "t": 289.25836, "r": 386.70093, "b": 290.99738, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 121, "label": "text", "bbox": {"l": 358.42453, "t": 290.86855999999995, "r": 388.03534, "b": 292.6076, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 166, "text": " at the same time, the diopter ring may", "bbox": {"l": 358.42453, "t": 290.86855999999995, "r": 388.03534, "b": 292.6076, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 122, "label": "text", "bbox": {"l": 358.42453, "t": 292.47879, "r": 373.13724, "b": 294.2178, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 167, "text": " need adjustment.", "bbox": {"l": 358.42453, "t": 292.47879, "r": 373.13724, "b": 294.2178, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 123, "label": "text", "bbox": {"l": 358.42453, "t": 295.69922, "r": 381.74539, "b": 297.43823, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 168, "text": "DIOPTER RING ADJUSTMENT", "bbox": {"l": 358.42453, "t": 295.69922, "r": 381.74539, "b": 297.43823, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 124, "label": "text", "bbox": {"l": 358.42453, "t": 297.30942, "r": 359.83682, "b": 299.04846, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 169, "text": "1.", "bbox": {"l": 358.42453, "t": 297.30942, "r": 359.83682, "b": 299.04846, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 125, "label": "text", "bbox": {"l": 360.54297, "t": 297.30942, "r": 388.08289, "b": 299.04846, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 170, "text": "To adjust the eyepiece for viewing with", "bbox": {"l": 360.54297, "t": 297.30942, "r": 388.08289, "b": 299.04846, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 126, "label": "text", "bbox": {"l": 358.42453, "t": 298.91965, "r": 382.73251, "b": 300.65866, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 171, "text": " or without eyeglasses and for ", "bbox": {"l": 358.42453, "t": 298.91965, "r": 382.73251, "b": 300.65866, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 127, "label": "text", "bbox": {"l": 358.42453, "t": 300.52985, "r": 387.72266, "b": 302.26889000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 172, "text": " differences in acuity between the right", "bbox": {"l": 358.42453, "t": 300.52985, "r": 387.72266, "b": 302.26889000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 128, "label": "text", "bbox": {"l": 358.42453, "t": 302.14008000000007, "r": 384.1991, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 173, "text": " and left eyes, follow the following", "bbox": {"l": 358.42453, "t": 302.14008000000007, "r": 384.1991, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 129, "label": "text", "bbox": {"l": 358.42453, "t": 303.75027, "r": 364.88672, "b": 305.48932, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 174, "text": " steps:", "bbox": {"l": 358.42453, "t": 303.75027, "r": 364.88672, "b": 305.48932, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 130, "label": "text", "bbox": {"l": 358.42453, "t": 305.3605, "r": 359.95078, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 175, "text": "a.", "bbox": {"l": 358.42453, "t": 305.3605, "r": 359.95078, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 131, "label": "text", "bbox": {"l": 361.47699, "t": 305.3605, "r": 386.65988, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 176, "text": "Observe an image through the left", "bbox": {"l": 361.47699, "t": 305.3605, "r": 386.65988, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 132, "label": "text", "bbox": {"l": 358.42453, "t": 306.9707, "r": 386.7634, "b": 308.70975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 177, "text": " eyepiece and bring a specific point", "bbox": {"l": 358.42453, "t": 306.9707, "r": 386.7634, "b": 308.70975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 133, "label": "text", "bbox": {"l": 358.42453, "t": 308.58093, "r": 385.41354, "b": 310.31995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 178, "text": " into focus using the focus knob.", "bbox": {"l": 358.42453, "t": 308.58093, "r": 385.41354, "b": 310.31995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 134, "label": "text", "bbox": {"l": 358.42453, "t": 310.19113, "r": 359.93304, "b": 311.93018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 179, "text": "b.", "bbox": {"l": 358.42453, "t": 310.19113, "r": 359.93304, "b": 311.93018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 135, "label": "text", "bbox": {"l": 361.44156, "t": 310.19113, "r": 382.56085, "b": 311.93018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 180, "text": "By turning the diopter ring ", "bbox": {"l": 361.44156, "t": 310.19113, "r": 382.56085, "b": 311.93018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 136, "label": "text", "bbox": {"l": 358.42596, "t": 311.80136, "r": 385.4559, "b": 313.54037, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 181, "text": " adjustment for the left eyepiece,", "bbox": {"l": 358.42596, "t": 311.80136, "r": 385.4559, "b": 313.54037, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 137, "label": "text", "bbox": {"l": 358.42596, "t": 313.41156, "r": 384.56122, "b": 315.15059999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 182, "text": " bring the same point into sharp", "bbox": {"l": 358.42596, "t": 313.41156, "r": 384.56122, "b": 315.15059999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 138, "label": "text", "bbox": {"l": 358.42596, "t": 315.02178999999995, "r": 366.74371, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 183, "text": " focus.", "bbox": {"l": 358.42596, "t": 315.02178999999995, "r": 366.74371, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 139, "label": "text", "bbox": {"l": 358.42596, "t": 316.63199, "r": 383.93884, "b": 318.37103, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 184, "text": " c.Then bring the same point into", "bbox": {"l": 358.42596, "t": 316.63199, "r": 383.93884, "b": 318.37103, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 140, "label": "text", "bbox": {"l": 358.42596, "t": 318.2422199999999, "r": 385.69241, "b": 319.9812299999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 185, "text": " focus through the right eyepiece", "bbox": {"l": 358.42596, "t": 318.2422199999999, "r": 385.69241, "b": 319.9812299999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 141, "label": "text", "bbox": {"l": 358.42596, "t": 319.85242000000005, "r": 385.94861, "b": 321.59146, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 186, "text": " by turning the right diopter ring.", "bbox": {"l": 358.42596, "t": 319.85242000000005, "r": 385.94861, "b": 321.59146, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 142, "label": "text", "bbox": {"l": 358.42596, "t": 321.46265, "r": 385.54236, "b": 323.20166, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 187, "text": " d.With more than one viewer, each", "bbox": {"l": 358.42596, "t": 321.46265, "r": 385.54236, "b": 323.20166, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 143, "label": "text", "bbox": {"l": 358.42596, "t": 323.07285, "r": 382.98718, "b": 324.81189, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 188, "text": " viewer should note their own", "bbox": {"l": 358.42596, "t": 323.07285, "r": 382.98718, "b": 324.81189, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 144, "label": "text", "bbox": {"l": 358.42596, "t": 324.68307000000004, "r": 385.06448, "b": 326.42209, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 189, "text": " diopter ring position for the left", "bbox": {"l": 358.42596, "t": 324.68307000000004, "r": 385.06448, "b": 326.42209, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 145, "label": "text", "bbox": {"l": 358.42596, "t": 326.29327, "r": 385.20682, "b": 328.03232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 190, "text": " and right eyepieces, then before", "bbox": {"l": 358.42596, "t": 326.29327, "r": 385.20682, "b": 328.03232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 146, "label": "text", "bbox": {"l": 358.42596, "t": 327.9035, "r": 382.21964, "b": 329.64252, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 191, "text": " viewing set the diopter ring", "bbox": {"l": 358.42596, "t": 327.9035, "r": 382.21964, "b": 329.64252, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 147, "label": "text", "bbox": {"l": 358.42596, "t": 329.5137, "r": 382.63382, "b": 331.25275, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 192, "text": " adjustments to that setting.", "bbox": {"l": 358.42596, "t": 329.5137, "r": 382.63382, "b": 331.25275, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 148, "label": "text", "bbox": {"l": 358.42596, "t": 332.73412999999994, "r": 375.67661, "b": 334.47317999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 193, "text": "CHANGING THE BULB", "bbox": {"l": 358.42596, "t": 332.73412999999994, "r": 375.67661, "b": 334.47317999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 149, "label": "text", "bbox": {"l": 358.42596, "t": 334.34436, "r": 359.90311, "b": 336.08337, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 194, "text": "1.", "bbox": {"l": 358.42596, "t": 334.34436, "r": 359.90311, "b": 336.08337, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 150, "label": "text", "bbox": {"l": 360.64169, "t": 334.34436, "r": 385.75333, "b": 336.08337, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 195, "text": "Disconnect the power cord from the", "bbox": {"l": 360.64169, "t": 334.34436, "r": 385.75333, "b": 336.08337, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 151, "label": "text", "bbox": {"l": 358.42596, "t": 335.95456, "r": 372.01416, "b": 337.6936, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 196, "text": " electrical outlet.", "bbox": {"l": 358.42596, "t": 335.95456, "r": 372.01416, "b": 337.6936, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 152, "label": "text", "bbox": {"l": 358.42596, "t": 337.56479, "r": 359.88327, "b": 339.3038, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 197, "text": "2.", "bbox": {"l": 358.42596, "t": 337.56479, "r": 359.88327, "b": 339.3038, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 153, "label": "text", "bbox": {"l": 360.61191, "t": 337.56479, "r": 384.65726, "b": 339.3038, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 198, "text": "When the bulb is cool, remove the", "bbox": {"l": 360.61191, "t": 337.56479, "r": 384.65726, "b": 339.3038, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 154, "label": "text", "bbox": {"l": 358.42596, "t": 339.17499, "r": 385.33649, "b": 340.9140300000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 199, "text": " oblique illuminator cap and remove", "bbox": {"l": 358.42596, "t": 339.17499, "r": 385.33649, "b": 340.9140300000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 155, "label": "text", "bbox": {"l": 358.42596, "t": 340.78522, "r": 379.57224, "b": 342.52423, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 200, "text": " the halogen bulb with cap.", "bbox": {"l": 358.42596, "t": 340.78522, "r": 379.57224, "b": 342.52423, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 156, "label": "text", "bbox": {"l": 358.4274, "t": 342.39542, "r": 359.91788, "b": 344.13446000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 201, "text": "3.", "bbox": {"l": 358.4274, "t": 342.39542, "r": 359.91788, "b": 344.13446000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 157, "label": "text", "bbox": {"l": 360.66312, "t": 342.39542, "r": 384.5108, "b": 344.13446000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 202, "text": "Replace with a new halogen bulb.", "bbox": {"l": 360.66312, "t": 342.39542, "r": 384.5108, "b": 344.13446000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 158, "label": "text", "bbox": {"l": 358.42883, "t": 344.00565000000006, "r": 359.92792, "b": 345.74466, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 203, "text": "4.", "bbox": {"l": 358.42883, "t": 344.00565000000006, "r": 359.92792, "b": 345.74466, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 159, "label": "text", "bbox": {"l": 360.67746, "t": 344.00565000000006, "r": 385.41235, "b": 345.74466, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 204, "text": "Open the window in the base plate", "bbox": {"l": 360.67746, "t": 344.00565000000006, "r": 385.41235, "b": 345.74466, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 160, "label": "text", "bbox": {"l": 358.42883, "t": 345.61584, "r": 383.2782, "b": 347.35489, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 205, "text": " and replace the halogen lamp or", "bbox": {"l": 358.42883, "t": 345.61584, "r": 383.2782, "b": 347.35489, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 161, "label": "text", "bbox": {"l": 358.42883, "t": 347.22607, "r": 383.13953, "b": 348.96509, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 206, "text": " fluorescent lamp of transmitted", "bbox": {"l": 358.42883, "t": 347.22607, "r": 383.13953, "b": 348.96509, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 162, "label": "text", "bbox": {"l": 358.42883, "t": 348.83627, "r": 368.43472, "b": 350.57532, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 207, "text": " illuminator.", "bbox": {"l": 358.42883, "t": 348.83627, "r": 368.43472, "b": 350.57532, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 163, "label": "text", "bbox": {"l": 326.59567, "t": 261.14185, "r": 339.11377, "b": 262.88091999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 208, "text": "Model AY11230", "bbox": {"l": 326.59567, "t": 261.14185, "r": 339.11377, "b": 262.88091999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 164, "label": "text", "bbox": {"l": 358.48605, "t": 261.14185, "r": 371.00415, "b": 262.88091999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 209, "text": "Model AY11234", "bbox": {"l": 358.48605, "t": 261.14185, "r": 371.00415, "b": 262.88091999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 165, "label": "text", "bbox": {"l": 455.43533, "t": 351.77038999999996, "r": 457.97827000000007, "b": 353.94415, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 210, "text": "14", "bbox": {"l": 455.43533, "t": 351.77038999999996, "r": 457.97827000000007, "b": 353.94415, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 166, "label": "text", "bbox": {"l": 408.24518, "t": 275.52673000000004, "r": 414.4234, "b": 276.96020999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 211, "text": "Objectives", "bbox": {"l": 408.24518, "t": 275.52673000000004, "r": 414.4234, "b": 276.96020999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 167, "label": "text", "bbox": {"l": 409.39554, "t": 268.98235999999997, "r": 419.06677, "b": 270.41583, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 212, "text": "Revolving Turret", "bbox": {"l": 409.39554, "t": 268.98235999999997, "r": 419.06677, "b": 270.41583, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 168, "label": "text", "bbox": {"l": 441.3895, "t": 279.12627999999995, "r": 445.87192, "b": 280.55975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 213, "text": "Coarse ", "bbox": {"l": 441.3895, "t": 279.12627999999995, "r": 445.87192, "b": 280.55975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 169, "label": "text", "bbox": {"l": 441.3895, "t": 280.30609, "r": 448.22338999999994, "b": 281.7395900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 214, "text": "Adjustment", "bbox": {"l": 441.3895, "t": 280.30609, "r": 448.22338999999994, "b": 281.7395900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 170, "label": "text", "bbox": {"l": 441.3895, "t": 281.48593, "r": 444.40371999999996, "b": 282.91939999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 215, "text": "Knob", "bbox": {"l": 441.3895, "t": 281.48593, "r": 444.40371999999996, "b": 282.91939999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 171, "label": "text", "bbox": {"l": 398.79288, "t": 254.94646999999998, "r": 428.91568, "b": 258.85931000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 216, "text": "MODEL AY11236", "bbox": {"l": 398.79288, "t": 254.94646999999998, "r": 428.91568, "b": 258.85931000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 172, "label": "text", "bbox": {"l": 398.32535, "t": 305.04291, "r": 435.93542, "b": 308.95572000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 217, "text": "MICROSCOPE USAGE", "bbox": {"l": 398.32535, "t": 305.04291, "r": 435.93542, "b": 308.95572000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 173, "label": "text", "bbox": {"l": 398.08594, "t": 310.35892, "r": 453.72171, "b": 312.53271, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 218, "text": "BARSKA Model AY11236 is a powerful fixed power compound ", "bbox": {"l": 398.08594, "t": 310.35892, "r": 453.72171, "b": 312.53271, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 174, "label": "text", "bbox": {"l": 398.08594, "t": 312.50586, "r": 453.09939999999995, "b": 314.67966, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 219, "text": "microscope designed for biological studies such as specimen ", "bbox": {"l": 398.08594, "t": 312.50586, "r": 453.09939999999995, "b": 314.67966, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 175, "label": "text", "bbox": {"l": 398.08594, "t": 314.6528, "r": 456.65246999999994, "b": 316.8266, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 220, "text": "examination. It can also be used for examining bacteria and", "bbox": {"l": 398.08594, "t": 314.6528, "r": 456.65246999999994, "b": 316.8266, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 176, "label": "text", "bbox": {"l": 398.08594, "t": 316.79977, "r": 456.73859000000004, "b": 318.97354, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 221, "text": "for general clinical and medical studies and other scientific uses. ", "bbox": {"l": 398.08594, "t": 316.79977, "r": 456.73859000000004, "b": 318.97354, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 177, "label": "text", "bbox": {"l": 398.62399, "t": 320.42941, "r": 427.77472, "b": 324.34222000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 222, "text": "CONSTRUCTION", "bbox": {"l": 398.62399, "t": 320.42941, "r": 427.77472, "b": 324.34222000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 178, "label": "text", "bbox": {"l": 398.08594, "t": 326.46069000000006, "r": 456.02639999999997, "b": 328.63449, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 223, "text": "BARSKA Model AY11236 is a fixed power compound microscope.", "bbox": {"l": 398.08594, "t": 326.46069000000006, "r": 456.02639999999997, "b": 328.63449, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 179, "label": "text", "bbox": {"l": 398.08414, "t": 328.6076699999999, "r": 455.42238999999995, "b": 330.7814599999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 224, "text": "It is constructed with two optical paths at the same angle. It is ", "bbox": {"l": 398.08414, "t": 328.6076699999999, "r": 455.42238999999995, "b": 330.7814599999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 180, "label": "text", "bbox": {"l": 398.08414, "t": 330.75461, "r": 457.39844, "b": 332.92841, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 225, "text": "equipped with transmitted illumination. By using this instrument, ", "bbox": {"l": 398.08414, "t": 330.75461, "r": 457.39844, "b": 332.92841, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 181, "label": "text", "bbox": {"l": 398.08414, "t": 332.90155, "r": 453.97745, "b": 335.07535000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 226, "text": "the user can observe specimens at magnification from 40x to ", "bbox": {"l": 398.08414, "t": 332.90155, "r": 453.97745, "b": 335.07535000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 182, "label": "text", "bbox": {"l": 398.08414, "t": 335.04852, "r": 454.70708999999994, "b": 337.22232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 227, "text": "1000x by selecting the desired objective lens. Coarse and fine ", "bbox": {"l": 398.08414, "t": 335.04852, "r": 454.70708999999994, "b": 337.22232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 183, "label": "text", "bbox": {"l": 398.08414, "t": 337.19547, "r": 458.90240000000006, "b": 339.36926, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 228, "text": "focus adjustments provide accuracy and image detail. The rotating ", "bbox": {"l": 398.08414, "t": 337.19547, "r": 458.90240000000006, "b": 339.36926, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 184, "label": "text", "bbox": {"l": 398.08594, "t": 339.34241, "r": 453.0672, "b": 341.5162, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 229, "text": "head allows the user to position the eyepieces for maximum ", "bbox": {"l": 398.08594, "t": 339.34241, "r": 453.0672, "b": 341.5162, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 185, "label": "text", "bbox": {"l": 398.08594, "t": 341.48938, "r": 449.63113, "b": 343.66318, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 230, "text": "viewing comfort and easy access to all adjustment knobs.", "bbox": {"l": 398.08594, "t": 341.48938, "r": 449.63113, "b": 343.66318, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 186, "label": "text", "bbox": {"l": 422.10626, "t": 301.24191, "r": 434.62433000000004, "b": 302.98096, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 231, "text": "Model AY11236", "bbox": {"l": 422.10626, "t": 301.24191, "r": 434.62433000000004, "b": 302.98096, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 187, "label": "text", "bbox": {"l": 442.01610999999997, "t": 283.08649, "r": 444.8817399999999, "b": 284.51996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 232, "text": "Fine ", "bbox": {"l": 442.01610999999997, "t": 283.08649, "r": 444.8817399999999, "b": 284.51996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 188, "label": "text", "bbox": {"l": 442.01610999999997, "t": 284.2663, "r": 448.85001, "b": 285.69980000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 233, "text": "Adjustment", "bbox": {"l": 442.01610999999997, "t": 284.2663, "r": 448.85001, "b": 285.69980000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 189, "label": "text", "bbox": {"l": 442.01610999999997, "t": 285.44611, "r": 445.03033000000005, "b": 286.87961, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 234, "text": "Knob", "bbox": {"l": 442.01610999999997, "t": 285.44611, "r": 445.03033000000005, "b": 286.87961, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 190, "label": "text", "bbox": {"l": 408.00577, "t": 279.12579000000005, "r": 411.42212, "b": 280.5593, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 235, "text": "Stage", "bbox": {"l": 408.00577, "t": 279.12579000000005, "r": 411.42212, "b": 280.5593, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 191, "label": "text", "bbox": {"l": 404.07172, "t": 280.9144299999999, "r": 410.77707, "b": 282.3479, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 236, "text": "Condenser ", "bbox": {"l": 404.07172, "t": 280.9144299999999, "r": 410.77707, "b": 282.3479, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 192, "label": "text", "bbox": {"l": 404.07172, "t": 282.09424, "r": 409.2157, "b": 283.52774, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 237, "text": "Focusing", "bbox": {"l": 404.07172, "t": 282.09424, "r": 409.2157, "b": 283.52774, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 193, "label": "text", "bbox": {"l": 404.07172, "t": 283.27408, "r": 407.08594, "b": 284.7075500000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 238, "text": "Knob", "bbox": {"l": 404.07172, "t": 283.27408, "r": 407.08594, "b": 284.7075500000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 194, "label": "text", "bbox": {"l": 441.81281, "t": 262.32178, "r": 447.03702, "b": 263.75525000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 239, "text": "Eyepiece", "bbox": {"l": 441.81281, "t": 262.32178, "r": 447.03702, "b": 263.75525000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 195, "label": "text", "bbox": {"l": 437.34607, "t": 271.13025000000005, "r": 440.80496, "b": 272.56281, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 240, "text": "Stand", "bbox": {"l": 437.34607, "t": 271.13025000000005, "r": 440.80496, "b": 272.56281, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 196, "label": "text", "bbox": {"l": 409.7164, "t": 284.40027, "r": 413.3768, "b": 285.83282, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 241, "text": "Lamp ", "bbox": {"l": 409.7164, "t": 284.40027, "r": 413.3768, "b": 285.83282, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 197, "label": "text", "bbox": {"l": 409.7164, "t": 285.83163, "r": 413.68201, "b": 287.26416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 242, "text": "On/Off", "bbox": {"l": 409.7164, "t": 285.83163, "r": 413.68201, "b": 287.26416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 198, "label": "text", "bbox": {"l": 409.7164, "t": 287.263, "r": 413.6337, "b": 288.69553, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 243, "text": "Switch", "bbox": {"l": 409.7164, "t": 287.263, "r": 413.6337, "b": 288.69553, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 199, "label": "text", "bbox": {"l": 434.8712499999999, "t": 296.7153, "r": 438.53164999999996, "b": 298.14783, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 244, "text": "Lamp ", "bbox": {"l": 434.8712499999999, "t": 296.7153, "r": 438.53164999999996, "b": 298.14783, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 200, "label": "text", "bbox": {"l": 439.52039, "t": 292.18307000000004, "r": 443.08768, "b": 293.61560000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 245, "text": "Power", "bbox": {"l": 439.52039, "t": 292.18307000000004, "r": 443.08768, "b": 293.61560000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 201, "label": "text", "bbox": {"l": 439.52039, "t": 293.61444, "r": 442.29575, "b": 295.04697, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 246, "text": "Cord", "bbox": {"l": 439.52039, "t": 293.61444, "r": 442.29575, "b": 295.04697, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 202, "label": "text", "bbox": {"l": 413.55829, "t": 264.66089, "r": 421.94913, "b": 266.09344, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 247, "text": "Rotating Head", "bbox": {"l": 413.55829, "t": 264.66089, "r": 421.94913, "b": 266.09344, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 203, "label": "text", "bbox": {"l": 441.84316999999993, "t": 286.90573, "r": 447.87585000000007, "b": 288.33826, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 248, "text": "Stage Clip", "bbox": {"l": 441.84316999999993, "t": 286.90573, "r": 447.87585000000007, "b": 288.33826, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 204, "label": "text", "bbox": {"l": 441.84316999999993, "t": 288.3371, "r": 448.67252, "b": 289.76962000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 249, "text": "Adjustment", "bbox": {"l": 441.84316999999993, "t": 288.3371, "r": 448.67252, "b": 289.76962000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 205, "label": "text", "bbox": {"l": 407.2403, "t": 259.86645999999996, "r": 425.79089, "b": 261.29895, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 250, "text": "Interpupillary Slide Adjustment", "bbox": {"l": 407.2403, "t": 259.86645999999996, "r": 425.79089, "b": 261.29895, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 206, "label": "text", "bbox": {"l": 449.10074000000003, "t": 378.66302, "r": 466.08835000000005, "b": 380.78412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 251, "text": "Circling Minimums", "bbox": {"l": 449.10074000000003, "t": 378.66302, "r": 466.08835000000005, "b": 380.78412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 207, "label": "text", "bbox": {"l": 449.10074000000003, "t": 383.2203999999999, "r": 449.64444, "b": 385.34148999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 252, "text": "7", "bbox": {"l": 449.10074000000003, "t": 383.2203999999999, "r": 449.64444, "b": 385.34148999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 208, "label": "text", "bbox": {"l": 450.18811, "t": 383.2203999999999, "r": 550.77124, "b": 385.34148999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 253, "text": "K H U H Z D V D F K D Q J H W R W K H 7 ( 5 3 6 F U L W H U L D L Q W K D W D \u1087H F W V F L U F O L Q J D U H D G L P H Q V L R Q E \\ H [ S D Q G L Q J W K H D U H D V W R S U R Y L G H ", "bbox": {"l": 450.18811, "t": 383.2203999999999, "r": 550.77124, "b": 385.34148999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 209, "label": "text", "bbox": {"l": 449.10074000000003, "t": 385.75732, "r": 536.14716, "b": 387.87842, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 254, "text": "improved obstacle protection. To indicate that the new criteria had been applied to a given procedure, a ", "bbox": {"l": 449.10074000000003, "t": 385.75732, "r": 536.14716, "b": 387.87842, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 210, "label": "text", "bbox": {"l": 538.31085, "t": 385.75732, "r": 549.49921, "b": 387.87842, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 255, "text": " is placed on ", "bbox": {"l": 538.31085, "t": 385.75732, "r": 549.49921, "b": 387.87842, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 211, "label": "text", "bbox": {"l": 449.10074000000003, "t": 388.03601, "r": 547.58185, "b": 390.1571, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 256, "text": "the circling line of minimums. The new circling tables and explanatory information is located in the Legend of the TPP.", "bbox": {"l": 449.10074000000003, "t": 388.03601, "r": 547.58185, "b": 390.1571, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 212, "label": "text", "bbox": {"l": 449.10074000000003, "t": 393.2128000000001, "r": 449.6163, "b": 395.33386, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 257, "text": "7", "bbox": {"l": 449.10074000000003, "t": 393.2128000000001, "r": 449.6163, "b": 395.33386, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 213, "label": "text", "bbox": {"l": 450.1319, "t": 393.2128000000001, "r": 529.53082, "b": 395.33386, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 258, "text": "K H D S S U R D F K H V X V L Q J V W D Q G D U G F L U F O L Q J D S S U R D F K D U H D V F D Q E H L G H Q W L \u00bf H G E \\ W K H D E V H Q F H R I W K H ", "bbox": {"l": 450.1319, "t": 393.2128000000001, "r": 529.53082, "b": 395.33386, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 214, "label": "text", "bbox": {"l": 532.05829, "t": 393.2128000000001, "r": 550.42261, "b": 395.33386, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 259, "text": " on the circling line of ", "bbox": {"l": 532.05829, "t": 393.2128000000001, "r": 550.42261, "b": 395.33386, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 215, "label": "text", "bbox": {"l": 449.10074000000003, "t": 395.49149, "r": 455.74692, "b": 397.61255, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 260, "text": "minima.", "bbox": {"l": 449.10074000000003, "t": 395.49149, "r": 455.74692, "b": 397.61255, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 216, "label": "text", "bbox": {"l": 449.95525999999995, "t": 415.59549, "r": 496.2829, "b": 417.50446, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 261, "text": "$ S S O \\ 6 W D Q G D U G & L U F O L Q J $ S S U R D F K 0 D Q H X Y H U L Q J 5 D G L X V 7 D E O H ", "bbox": {"l": 449.95525999999995, "t": 415.59549, "r": 496.2829, "b": 417.50446, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 217, "label": "text", "bbox": {"l": 501.13077, "t": 409.25543, "r": 551.16101, "b": 411.1644, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 262, "text": "$ S S O \\ ( [ S D Q G H G & L U F O L Q J $ S S U R D F K 0 D Q H X Y H U L Q J $ L U V S D F H 5 D G L X V ", "bbox": {"l": 501.13077, "t": 409.25543, "r": 551.16101, "b": 411.1644, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 218, "label": "text", "bbox": {"l": 501.13077, "t": 411.30624, "r": 505.2477999999999, "b": 413.21521, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 263, "text": "Table", "bbox": {"l": 501.13077, "t": 411.30624, "r": 505.2477999999999, "b": 413.21521, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 219, "label": "text", "bbox": {"l": 449.10074000000003, "t": 420.18802, "r": 469.35599, "b": 422.73331, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 264, "text": "AIRPORT SKETCH", "bbox": {"l": 449.10074000000003, "t": 420.18802, "r": 469.35599, "b": 422.73331, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 220, "label": "text", "bbox": {"l": 449.10074000000003, "t": 425.08908, "r": 525.93616, "b": 427.21017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 265, "text": "The airport sketch is a depiction of the airport with emphasis on runway pattern and related ", "bbox": {"l": 449.10074000000003, "t": 425.08908, "r": 525.93616, "b": 427.21017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 221, "label": "text", "bbox": {"l": 449.10074000000003, "t": 427.3678, "r": 522.0343, "b": 429.48886, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 266, "text": "information, positioned in either the lower left or lower right corner of the chart to aid pi-", "bbox": {"l": 449.10074000000003, "t": 427.3678, "r": 522.0343, "b": 429.48886, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 222, "label": "text", "bbox": {"l": 449.10074000000003, "t": 429.64648, "r": 524.67151, "b": 431.76755, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 267, "text": "lot recognition of the airport from the air and to provide some information to aid on ground ", "bbox": {"l": 449.10074000000003, "t": 429.64648, "r": 524.67151, "b": 431.76755, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 223, "label": "text", "bbox": {"l": 449.10074000000003, "t": 431.92514000000006, "r": 527.172, "b": 434.04623, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 268, "text": "navigation of the airport. The runways are drawn to scale and oriented to true north. Runway ", "bbox": {"l": 449.10074000000003, "t": 431.92514000000006, "r": 527.172, "b": 434.04623, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 224, "label": "text", "bbox": {"l": 449.10074000000003, "t": 434.20383, "r": 502.39545, "b": 436.32492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 269, "text": "dimensions (length and width) are shown for all active runways.", "bbox": {"l": 449.10074000000003, "t": 434.20383, "r": 502.39545, "b": 436.32492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 225, "label": "text", "bbox": {"l": 449.10074000000003, "t": 438.7611999999999, "r": 512.92676, "b": 440.88228999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 270, "text": "Runway(s) are depicted based on what type and construction of the runway.", "bbox": {"l": 449.10074000000003, "t": 438.7611999999999, "r": 512.92676, "b": 440.88228999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 226, "label": "text", "bbox": {"l": 449.95525999999995, "t": 444.07001, "r": 460.02307, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 271, "text": "Hard Surface", "bbox": {"l": 449.95525999999995, "t": 444.07001, "r": 460.02307, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 227, "label": "text", "bbox": {"l": 464.89963, "t": 444.07001, "r": 473.98819, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 272, "text": "Other Than ", "bbox": {"l": 464.89963, "t": 444.07001, "r": 473.98819, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 228, "label": "text", "bbox": {"l": 464.89963, "t": 446.12085, "r": 474.96744, "b": 448.02979, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 273, "text": "Hard Surface", "bbox": {"l": 464.89963, "t": 446.12085, "r": 474.96744, "b": 448.02979, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 229, "label": "text", "bbox": {"l": 478.91357, "t": 444.07001, "r": 489.45648, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 274, "text": "Metal Surface", "bbox": {"l": 478.91357, "t": 444.07001, "r": 489.45648, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 230, "label": "text", "bbox": {"l": 493.06420999999995, "t": 444.07001, "r": 505.03076, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 275, "text": "Closed Runway", "bbox": {"l": 493.06420999999995, "t": 444.07001, "r": 505.03076, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 231, "label": "text", "bbox": {"l": 509.5809, "t": 444.07001, "r": 524.30237, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 276, "text": "Under Construction", "bbox": {"l": 509.5809, "t": 444.07001, "r": 524.30237, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 232, "label": "text", "bbox": {"l": 449.95525999999995, "t": 454.81207, "r": 458.31406, "b": 456.72104, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 277, "text": "Stopways, ", "bbox": {"l": 449.95525999999995, "t": 454.81207, "r": 458.31406, "b": 456.72104, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 233, "label": "text", "bbox": {"l": 449.95525999999995, "t": 456.86288, "r": 461.92083999999994, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 278, "text": "Taxiways, Park-", "bbox": {"l": 449.95525999999995, "t": 456.86288, "r": 461.92083999999994, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 234, "label": "text", "bbox": {"l": 449.95525999999995, "t": 458.91373, "r": 457.08014, "b": 460.82268999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 279, "text": "ing Areas", "bbox": {"l": 449.95525999999995, "t": 458.91373, "r": 457.08014, "b": 460.82268999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 235, "label": "text", "bbox": {"l": 464.89963, "t": 454.81207, "r": 472.87732, "b": 456.72104, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 280, "text": "Displaced ", "bbox": {"l": 464.89963, "t": 454.81207, "r": 472.87732, "b": 456.72104, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 236, "label": "text", "bbox": {"l": 464.89963, "t": 456.86288, "r": 472.49792, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 281, "text": "Threshold", "bbox": {"l": 464.89963, "t": 456.86288, "r": 472.49792, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 237, "label": "text", "bbox": {"l": 478.91357, "t": 454.81207, "r": 483.61584, "b": 456.72104, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 282, "text": "Closed", "bbox": {"l": 478.91357, "t": 454.81207, "r": 483.61584, "b": 456.72104, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 238, "label": "text", "bbox": {"l": 478.91357, "t": 456.86288, "r": 486.60754000000003, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 283, "text": "Pavement", "bbox": {"l": 478.91357, "t": 456.86288, "r": 486.60754000000003, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 239, "label": "text", "bbox": {"l": 493.06420999999995, "t": 454.81207, "r": 504.20648, "b": 456.72104, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 284, "text": "Water Runway", "bbox": {"l": 493.06420999999995, "t": 454.81207, "r": 504.20648, "b": 456.72104, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 240, "label": "text", "bbox": {"l": 449.10074000000003, "t": 469.32974, "r": 548.59674, "b": 471.45081, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 285, "text": "Taxiways and aprons are shaded grey. Other runway features that may be shown are runway numbers, runway dimen-", "bbox": {"l": 449.10074000000003, "t": 469.32974, "r": 548.59674, "b": 471.45081, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 241, "label": "text", "bbox": {"l": 449.10074000000003, "t": 471.60843, "r": 500.08181999999994, "b": 473.72949, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 286, "text": "sions, runway slope, arresting gear, and displaced threshold.", "bbox": {"l": 449.10074000000003, "t": 471.60843, "r": 500.08181999999994, "b": 473.72949, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 242, "label": "text", "bbox": {"l": 449.10074000000003, "t": 476.16577, "r": 449.59933000000007, "b": 478.28687, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 287, "text": "2", "bbox": {"l": 449.10074000000003, "t": 476.16577, "r": 449.59933000000007, "b": 478.28687, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 243, "label": "text", "bbox": {"l": 450.09796, "t": 476.16577, "r": 547.82562, "b": 478.28687, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 288, "text": "W K H U L Q I R U P D W L R Q F R Q F H U Q L Q J O L J K W L Q J \u00bf Q D O D S S U R D F K E H D U L Q J V D L U S R U W E H D F R Q R E V W D F O H V F R Q W U R O W R Z H U 1 $ 9 $ , ' V K H O L ", "bbox": {"l": 450.09796, "t": 476.16577, "r": 547.82562, "b": 478.28687, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 244, "label": "text", "bbox": {"l": 547.82623, "t": 476.16577, "r": 548.45862, "b": 478.28687, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 289, "text": "-", "bbox": {"l": 547.82623, "t": 476.16577, "r": 548.45862, "b": 478.28687, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 245, "label": "text", "bbox": {"l": 449.10074000000003, "t": 478.44446, "r": 470.52609000000007, "b": 480.56555, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 290, "text": "pads may also be shown.", "bbox": {"l": 449.10074000000003, "t": 478.44446, "r": 470.52609000000007, "b": 480.56555, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 246, "label": "text", "bbox": {"l": 449.10074000000003, "t": 483.00183, "r": 493.37906000000004, "b": 485.12292, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 291, "text": "$ L U S R U W ( O H Y D W L R Q D Q G 7 R X F K G R Z Q = R Q H ( O H Y D W L R Q ", "bbox": {"l": 449.10074000000003, "t": 483.00183, "r": 493.37906000000004, "b": 485.12292, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 449.10074000000003, "t": 487.5592, "r": 551.80023, "b": 496.51636, "coord_origin": "TOPLEFT"}, "confidence": 0.5027860403060913, "cells": [{"id": 292, "text": "The airport elevation is shown enclosed within a box in the upper left corner of the sketch box and the touchdown zone ", "bbox": {"l": 449.10074000000003, "t": 487.5592, "r": 549.16168, "b": 489.6803, "coord_origin": "TOPLEFT"}}, {"id": 293, "text": "elevation (TDZE) is shown in the upper right corner of the sketch box. The airport elevation is the highest point of an ", "bbox": {"l": 449.10074000000003, "t": 489.83789, "r": 546.90881, "b": 491.95898, "coord_origin": "TOPLEFT"}}, {"id": 294, "text": "D L U S R U W \u00b6 V X V D E O H U X Q Z D \\ V P H D V X U H G L Q I H H W I U R P P H D Q V H D O H Y H O 7 K H 7 ' = ( L V W K H K L J K H V W H O H Y D W L R Q L Q W K H \u00bf U V W I H H W R I ", "bbox": {"l": 449.10074000000003, "t": 492.11658, "r": 551.80023, "b": 494.23767, "coord_origin": "TOPLEFT"}}, {"id": 295, "text": "the landing surface. Circling only approaches will not show a TDZE.", "bbox": {"l": 449.10074000000003, "t": 494.39526, "r": 505.85068000000007, "b": 496.51636, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 247, "label": "text", "bbox": {"l": 498.80661000000003, "t": 515.9437, "r": 502.08792, "b": 519.01764, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 296, "text": "114", "bbox": {"l": 498.80661000000003, "t": 515.9437, "r": 502.08792, "b": 519.01764, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 248, "label": "text", "bbox": {"l": 444.56319999999994, "t": 422.84869, "r": 446.25998, "b": 471.87128, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 297, "text": "FAA Chart Users\u2019 Guide - Terminal Procedures Publication (TPP) - Terms", "bbox": {"l": 444.56319999999994, "t": 422.84869, "r": 446.25998, "b": 471.87128, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 249, "label": "text", "bbox": {"l": 329.40536, "t": 379.37537, "r": 355.13138, "b": 382.13336, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 298, "text": "AGL 2013 Financial Calendar", "bbox": {"l": 329.40536, "t": 379.37537, "r": 355.13138, "b": 382.13336, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 250, "label": "text", "bbox": {"l": 329.40536, "t": 382.30273, "r": 330.96848, "b": 384.55927, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 299, "text": "22", "bbox": {"l": 329.40536, "t": 382.30273, "r": 330.96848, "b": 384.55927, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 251, "label": "text", "bbox": {"l": 331.75003, "t": 382.30273, "r": 341.12875, "b": 384.55927, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 300, "text": "August 2012 ", "bbox": {"l": 331.75003, "t": 382.30273, "r": 341.12875, "b": 384.55927, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 252, "label": "text", "bbox": {"l": 350.4722, "t": 382.30273, "r": 384.81079, "b": 384.55927, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 301, "text": "2012 full year result and fi nal dividend announced", "bbox": {"l": 350.4722, "t": 382.30273, "r": 384.81079, "b": 384.55927, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 253, "label": "text", "bbox": {"l": 329.40536, "t": 384.84552, "r": 330.97336, "b": 387.10205, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 302, "text": "30", "bbox": {"l": 329.40536, "t": 384.84552, "r": 330.97336, "b": 387.10205, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 254, "label": "text", "bbox": {"l": 331.75735, "t": 384.84552, "r": 341.16534, "b": 387.10205, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 303, "text": "August 2012 ", "bbox": {"l": 331.75735, "t": 384.84552, "r": 341.16534, "b": 387.10205, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 255, "label": "text", "bbox": {"l": 350.4722, "t": 384.84552, "r": 372.90613, "b": 387.10205, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 304, "text": "Ex-dividend trading commences", "bbox": {"l": 350.4722, "t": 384.84552, "r": 372.90613, "b": 387.10205, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 256, "label": "text", "bbox": {"l": 329.40536, "t": 387.38828, "r": 330.20337, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 305, "text": "5", "bbox": {"l": 329.40536, "t": 387.38828, "r": 330.20337, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 257, "label": "text", "bbox": {"l": 331.00137, "t": 387.38828, "r": 342.9715, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 306, "text": "September 2012 ", "bbox": {"l": 331.00137, "t": 387.38828, "r": 342.9715, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 258, "label": "text", "bbox": {"l": 350.4722, "t": 387.38828, "r": 374.88693, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 307, "text": "Record date for 2012 fi nal dividend", "bbox": {"l": 350.4722, "t": 387.38828, "r": 374.88693, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 259, "label": "text", "bbox": {"l": 329.40536, "t": 389.93103, "r": 331.0173, "b": 392.18762, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 308, "text": "27", "bbox": {"l": 329.40536, "t": 389.93103, "r": 331.0173, "b": 392.18762, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 260, "label": "text", "bbox": {"l": 331.82327, "t": 389.93103, "r": 343.91284, "b": 392.18762, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 309, "text": "September 2012 ", "bbox": {"l": 331.82327, "t": 389.93103, "r": 343.91284, "b": 392.18762, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 261, "label": "text", "bbox": {"l": 350.4722, "t": 389.93103, "r": 365.65988, "b": 392.18762, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 310, "text": "Final dividend payable", "bbox": {"l": 350.4722, "t": 389.93103, "r": 365.65988, "b": 392.18762, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 262, "label": "text", "bbox": {"l": 329.40536, "t": 392.47382, "r": 330.98804, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 311, "text": "23", "bbox": {"l": 329.40536, "t": 392.47382, "r": 330.98804, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 263, "label": "text", "bbox": {"l": 331.77936, "t": 392.47382, "r": 342.06674, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 312, "text": "October 2012 ", "bbox": {"l": 331.77936, "t": 392.47382, "r": 342.06674, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 264, "label": "text", "bbox": {"l": 350.4722, "t": 392.47382, "r": 367.22156, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 313, "text": "Annual General Meeting", "bbox": {"l": 350.4722, "t": 392.47382, "r": 367.22156, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 265, "label": "text", "bbox": {"l": 329.40536, "t": 395.0166, "r": 330.99741, "b": 397.27313, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 314, "text": "27", "bbox": {"l": 329.40536, "t": 395.0166, "r": 330.99741, "b": 397.27313, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 266, "label": "text", "bbox": {"l": 331.7934, "t": 395.0166, "r": 342.1416, "b": 397.27313, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 315, "text": "February 2013", "bbox": {"l": 331.7934, "t": 395.0166, "r": 342.1416, "b": 397.27313, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 267, "label": "text", "bbox": {"l": 342.64841, "t": 395.18298, "r": 342.65811, "b": 396.49857000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 316, "text": " 1", "bbox": {"l": 342.64841, "t": 395.18298, "r": 342.65811, "b": 396.49857000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 268, "label": "text", "bbox": {"l": 350.47177, "t": 395.01474, "r": 386.25897, "b": 397.2713, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 317, "text": "2013 interim result and interim dividend announced", "bbox": {"l": 350.47177, "t": 395.01474, "r": 386.25897, "b": 397.2713, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 269, "label": "text", "bbox": {"l": 329.40491, "t": 397.55749999999995, "r": 331.02695, "b": 399.81406, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 318, "text": "28", "bbox": {"l": 329.40491, "t": 397.55749999999995, "r": 331.02695, "b": 399.81406, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 270, "label": "text", "bbox": {"l": 331.83795, "t": 397.55749999999995, "r": 340.75909, "b": 399.81406, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 319, "text": "August 2013", "bbox": {"l": 331.83795, "t": 397.55749999999995, "r": 340.75909, "b": 399.81406, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 271, "label": "text", "bbox": {"l": 341.26437, "t": 397.7254, "r": 341.27408, "b": 399.04095, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 320, "text": " 1", "bbox": {"l": 341.26437, "t": 397.7254, "r": 341.27408, "b": 399.04095, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 272, "label": "text", "bbox": {"l": 350.47144, "t": 397.55713, "r": 385.93265, "b": 399.81369, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 321, "text": "2013 full year results and fi nal dividend announced ", "bbox": {"l": 350.47144, "t": 397.55713, "r": 385.93265, "b": 399.81369, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 273, "label": "text", "bbox": {"l": 329.40536, "t": 400.46155, "r": 329.87708, "b": 401.96588, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 322, "text": "1", "bbox": {"l": 329.40536, "t": 400.46155, "r": 329.87708, "b": 401.96588, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 274, "label": "text", "bbox": {"l": 330.34882, "t": 400.46155, "r": 358.65204, "b": 401.96588, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 323, "text": "Indicative dates only, subject to change/Board confi rmation", "bbox": {"l": 330.34882, "t": 400.46155, "r": 358.65204, "b": 401.96588, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 275, "label": "text", "bbox": {"l": 329.40536, "t": 404.34503, "r": 391.771, "b": 406.60156, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 324, "text": "AGL\u2019s Annual General Meeting will be held at the City Recital Hall, Angel Place, Sydney ", "bbox": {"l": 329.40536, "t": 404.34503, "r": 391.771, "b": 406.60156, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 276, "label": "text", "bbox": {"l": 329.40536, "t": 406.37857, "r": 369.65308, "b": 408.63513000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 325, "text": "commencing at 10.30am on Tuesday 23 October 2012.", "bbox": {"l": 329.40536, "t": 406.37857, "r": 369.65308, "b": 408.63513000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 277, "label": "text", "bbox": {"l": 363.54486, "t": 460.53054999999995, "r": 379.25955, "b": 465.54507, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 326, "text": "Ye s te rd ay", "bbox": {"l": 363.54486, "t": 460.53054999999995, "r": 379.25955, "b": 465.54507, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 278, "label": "text", "bbox": {"l": 363.54486, "t": 466.7157, "r": 391.38229, "b": 468.97223, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 327, "text": "Established in Sydney in 1837, and then ", "bbox": {"l": 363.54486, "t": 466.7157, "r": 391.38229, "b": 468.97223, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 279, "label": "text", "bbox": {"l": 363.54486, "t": 468.74924, "r": 395.01788, "b": 471.00577, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 328, "text": "known as The Australian Gas Light Company, ", "bbox": {"l": 363.54486, "t": 468.74924, "r": 395.01788, "b": 471.00577, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 280, "label": "text", "bbox": {"l": 363.54486, "t": 470.78281, "r": 394.08322, "b": 473.03934, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 329, "text": "the AGL business has an established history ", "bbox": {"l": 363.54486, "t": 470.78281, "r": 394.08322, "b": 473.03934, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 281, "label": "text", "bbox": {"l": 363.54486, "t": 472.81635, "r": 390.60727, "b": 475.07288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 330, "text": "and reputation for serving the gas and ", "bbox": {"l": 363.54486, "t": 472.81635, "r": 390.60727, "b": 475.07288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 282, "label": "text", "bbox": {"l": 363.54486, "t": 474.84988, "r": 393.49612, "b": 477.10645, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 331, "text": "electricity needs of Australian households. ", "bbox": {"l": 363.54486, "t": 474.84988, "r": 393.49612, "b": 477.10645, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 283, "label": "text", "bbox": {"l": 363.54486, "t": 476.88345, "r": 394.11481, "b": 479.13998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 332, "text": "In 1841, when AGL supplied the gas to light ", "bbox": {"l": 363.54486, "t": 476.88345, "r": 394.11481, "b": 479.13998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 284, "label": "text", "bbox": {"l": 363.54486, "t": 478.91699, "r": 393.75891, "b": 481.17352, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 333, "text": "the fi rst public street lamp, it was reported ", "bbox": {"l": 363.54486, "t": 478.91699, "r": 393.75891, "b": 481.17352, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 285, "label": "text", "bbox": {"l": 363.54486, "t": 480.95053, "r": 390.4975, "b": 483.20709, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 334, "text": "in the Sydney Gazette as a \u201cwonderful ", "bbox": {"l": 363.54486, "t": 480.95053, "r": 390.4975, "b": 483.20709, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 286, "label": "text", "bbox": {"l": 363.54486, "t": 482.9841, "r": 395.70975, "b": 485.24063, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 335, "text": "achievement of scientifi c knowledge, assisted ", "bbox": {"l": 363.54486, "t": 482.9841, "r": 395.70975, "b": 485.24063, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 287, "label": "text", "bbox": {"l": 363.54486, "t": 485.01764, "r": 394.27283, "b": 487.2742, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 336, "text": "by mechanical ingenuity.\u201d Within two years, ", "bbox": {"l": 363.54486, "t": 485.01764, "r": 394.27283, "b": 487.2742, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 288, "label": "text", "bbox": {"l": 363.54486, "t": 487.05121, "r": 396.65939, "b": 489.30774, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 337, "text": "165 gas lamps were lighting the City of Sydney.", "bbox": {"l": 363.54486, "t": 487.05121, "r": 396.65939, "b": 489.30774, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 289, "label": "text", "bbox": {"l": 329.4054, "t": 419.93124, "r": 384.19696, "b": 431.09412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 338, "text": "Looking back on ", "bbox": {"l": 329.4054, "t": 419.93124, "r": 384.19696, "b": 431.09412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 290, "label": "text", "bbox": {"l": 329.4054, "t": 430.10379, "r": 372.16626, "b": 441.26669, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 339, "text": "175 years of ", "bbox": {"l": 329.4054, "t": 430.10379, "r": 372.16626, "b": 441.26669, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 291, "label": "text", "bbox": {"l": 329.4054, "t": 440.27636999999993, "r": 385.3981, "b": 451.43924, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 340, "text": "looking forward.", "bbox": {"l": 329.4054, "t": 440.27636999999993, "r": 385.3981, "b": 451.43924, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 292, "label": "text", "bbox": {"l": 329.40536, "t": 372.16159, "r": 353.36179, "b": 373.91669, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 341, "text": "AGL Energy Limited ABN 74 115 061 375", "bbox": {"l": 329.40536, "t": 372.16159, "r": 353.36179, "b": 373.91669, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 293, "label": "text", "bbox": {"l": 546.20587, "t": 360.90448, "r": 548.23407, "b": 362.82242, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 342, "text": "29", "bbox": {"l": 546.20587, "t": 360.90448, "r": 548.23407, "b": 362.82242, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 294, "label": "text", "bbox": {"l": 497.77728, "t": 251.43384000000003, "r": 542.8255, "b": 254.94385, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 343, "text": "signs, signals and road markings", "bbox": {"l": 497.77728, "t": 251.43384000000003, "r": 542.8255, "b": 254.94385, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 295, "label": "text", "bbox": {"l": 490.30679, "t": 251.47478999999998, "r": 492.09982, "b": 254.98479999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 344, "text": "3", "bbox": {"l": 490.30679, "t": 251.47478999999998, "r": 492.09982, "b": 254.98479999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 296, "label": "text", "bbox": {"l": 498.15335, "t": 263.88922, "r": 500.05637, "b": 265.92719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 345, "text": "In ", "bbox": {"l": 498.15335, "t": 263.88922, "r": 500.05637, "b": 265.92719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 297, "label": "text", "bbox": {"l": 500.05637, "t": 263.85717999999997, "r": 524.37036, "b": 265.86310000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 346, "text": "chapter 2, you and your vehicle", "bbox": {"l": 500.05637, "t": 263.85717999999997, "r": 524.37036, "b": 265.86310000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 298, "label": "text", "bbox": {"l": 524.37036, "t": 263.88922, "r": 539.89124, "b": 265.92719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 347, "text": ", you learned about ", "bbox": {"l": 524.37036, "t": 263.88922, "r": 539.89124, "b": 265.92719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 299, "label": "text", "bbox": {"l": 498.15335, "t": 265.93224999999995, "r": 544.50403, "b": 267.97020999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 348, "text": "some of the controls in your vehicle. This chapter is a handy ", "bbox": {"l": 498.15335, "t": 265.93224999999995, "r": 544.50403, "b": 267.97020999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 300, "label": "text", "bbox": {"l": 498.15335, "t": 267.97533999999996, "r": 544.01343, "b": 270.01331000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 349, "text": "reference section that gives examples of the most common ", "bbox": {"l": 498.15335, "t": 267.97533999999996, "r": 544.01343, "b": 270.01331000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 301, "label": "text", "bbox": {"l": 498.15335, "t": 270.01831000000004, "r": 544.11987, "b": 272.05634, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 350, "text": "signs, signals and road markings that keep traffi c organized ", "bbox": {"l": 498.15335, "t": 270.01831000000004, "r": 544.11987, "b": 272.05634, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 302, "label": "text", "bbox": {"l": 498.15335, "t": 272.06140000000005, "r": 515.41071, "b": 274.09937, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 351, "text": "and flowing smoothly. ", "bbox": {"l": 498.15335, "t": 272.06140000000005, "r": 515.41071, "b": 274.09937, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 303, "label": "text", "bbox": {"l": 498.15335, "t": 277.34619, "r": 505.64642000000003, "b": 280.9357, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 352, "text": "Signs", "bbox": {"l": 498.15335, "t": 277.34619, "r": 505.64642000000003, "b": 280.9357, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 304, "label": "text", "bbox": {"l": 498.15335, "t": 281.82187, "r": 543.92957, "b": 283.85983, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 353, "text": "There are three ways to read signs: by their shape, colour and ", "bbox": {"l": 498.15335, "t": 281.82187, "r": 543.92957, "b": 283.85983, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 305, "label": "text", "bbox": {"l": 498.15335, "t": 283.8649, "r": 545.67834, "b": 285.90289, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 354, "text": "the messages printed on them. Understanding these three ways ", "bbox": {"l": 498.15335, "t": 283.8649, "r": 545.67834, "b": 285.90289, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 306, "label": "text", "bbox": {"l": 498.15335, "t": 285.90796, "r": 545.26471, "b": 287.94592, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 355, "text": "of classifying signs will help you figure out the meaning of signs ", "bbox": {"l": 498.15335, "t": 285.90796, "r": 545.26471, "b": 287.94592, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 307, "label": "text", "bbox": {"l": 498.15335, "t": 287.95099, "r": 513.31335, "b": 289.98895, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 356, "text": "that are new to you. ", "bbox": {"l": 498.15335, "t": 287.95099, "r": 513.31335, "b": 289.98895, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 308, "label": "text", "bbox": {"l": 505.43439, "t": 303.07596, "r": 508.53033000000005, "b": 304.89639, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 357, "text": "Stop", "bbox": {"l": 505.43439, "t": 303.07596, "r": 508.53033000000005, "b": 304.89639, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 309, "label": "text", "bbox": {"l": 527.45502, "t": 303.25354, "r": 541.44678, "b": 305.07397, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 358, "text": "Yield the right-of-way", "bbox": {"l": 527.45502, "t": 303.25354, "r": 541.44678, "b": 305.07397, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 310, "label": "text", "bbox": {"l": 501.79385, "t": 321.18973, "r": 510.41632, "b": 323.01016, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 359, "text": "Shows driving", "bbox": {"l": 501.79385, "t": 321.18973, "r": 510.41632, "b": 323.01016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 311, "label": "text", "bbox": {"l": 501.79385, "t": 322.87731999999994, "r": 509.04268999999994, "b": 324.69775000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 360, "text": "regulations", "bbox": {"l": 501.79385, "t": 322.87731999999994, "r": 509.04268999999994, "b": 324.69775000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 312, "label": "text", "bbox": {"l": 518.66455, "t": 319.59146, "r": 529.80902, "b": 321.41190000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 361, "text": "Explains lane use", "bbox": {"l": 518.66455, "t": 319.59146, "r": 529.80902, "b": 321.41190000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 313, "label": "text", "bbox": {"l": 534.87561, "t": 318.37616, "r": 546.95142, "b": 320.19659, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 362, "text": "School zone signs ", "bbox": {"l": 534.87561, "t": 318.37616, "r": 546.95142, "b": 320.19659, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 314, "label": "text", "bbox": {"l": 534.87561, "t": 320.0637500000001, "r": 545.05762, "b": 321.88419, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 363, "text": "are fl uorescent ", "bbox": {"l": 534.87561, "t": 320.0637500000001, "r": 545.05762, "b": 321.88419, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 315, "label": "text", "bbox": {"l": 534.87561, "t": 321.75134, "r": 543.32263, "b": 323.57178, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 364, "text": "yellow-green", "bbox": {"l": 534.87561, "t": 321.75134, "r": 543.32263, "b": 323.57178, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 316, "label": "text", "bbox": {"l": 499.21862999999996, "t": 338.12772, "r": 512.62451, "b": 339.94815, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 365, "text": "Tells about motorist ", "bbox": {"l": 499.21862999999996, "t": 338.12772, "r": 512.62451, "b": 339.94815, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 317, "label": "text", "bbox": {"l": 499.21862999999996, "t": 339.81531000000007, "r": 504.39917, "b": 341.63574, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 366, "text": "services", "bbox": {"l": 499.21862999999996, "t": 339.81531000000007, "r": 504.39917, "b": 341.63574, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 318, "label": "text", "bbox": {"l": 516.97748, "t": 338.06039, "r": 529.77484, "b": 339.88082999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 367, "text": "Shows a permitted ", "bbox": {"l": 516.97748, "t": 338.06039, "r": 529.77484, "b": 339.88082999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 319, "label": "text", "bbox": {"l": 516.97748, "t": 339.74799, "r": 520.96399, "b": 341.56842, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 368, "text": "action", "bbox": {"l": 516.97748, "t": 339.74799, "r": 520.96399, "b": 341.56842, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 320, "label": "text", "bbox": {"l": 534.55847, "t": 337.88281, "r": 548.58453, "b": 339.7032500000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 369, "text": "Shows an action that ", "bbox": {"l": 534.55847, "t": 337.88281, "r": 548.58453, "b": 339.7032500000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 321, "label": "text", "bbox": {"l": 534.55847, "t": 339.57040000000006, "r": 545.08862, "b": 341.39084, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 370, "text": "is not permitted", "bbox": {"l": 534.55847, "t": 339.57040000000006, "r": 545.08862, "b": 341.39084, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 322, "label": "text", "bbox": {"l": 483.05853, "t": 356.17416, "r": 494.72577, "b": 357.9946, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 371, "text": "Warns of hazards ", "bbox": {"l": 483.05853, "t": 356.17416, "r": 494.72577, "b": 357.9946, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 323, "label": "text", "bbox": {"l": 483.05853, "t": 357.86179, "r": 487.07525999999996, "b": 359.68222, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 372, "text": "ahead", "bbox": {"l": 483.05853, "t": 357.86179, "r": 487.07525999999996, "b": 359.68222, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 324, "label": "text", "bbox": {"l": 499.39645, "t": 356.26297000000005, "r": 504.69171, "b": 358.0834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 373, "text": "Warns of", "bbox": {"l": 499.39645, "t": 356.26297000000005, "r": 504.69171, "b": 358.0834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 325, "label": "text", "bbox": {"l": 499.39645, "t": 357.95056, "r": 511.69116, "b": 359.77099999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 374, "text": "construction zones", "bbox": {"l": 499.39645, "t": 357.95056, "r": 511.69116, "b": 359.77099999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 326, "label": "text", "bbox": {"l": 516.75891, "t": 356.26297000000005, "r": 527.42938, "b": 358.0834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 375, "text": "Railway crossing", "bbox": {"l": 516.75891, "t": 356.26297000000005, "r": 527.42938, "b": 358.0834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 327, "label": "text", "bbox": {"l": 534.5141, "t": 352.92981, "r": 547.89862, "b": 354.75024, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 376, "text": "Shows distance and ", "bbox": {"l": 534.5141, "t": 352.92981, "r": 547.89862, "b": 354.75024, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 328, "label": "text", "bbox": {"l": 534.5141, "t": 354.6174, "r": 540.2818, "b": 356.43784, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 377, "text": "direction", "bbox": {"l": 534.5141, "t": 354.6174, "r": 540.2818, "b": 356.43784, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 329, "label": "text", "bbox": {"l": 478.37466, "t": 270.14075, "r": 479.14251999999993, "b": 272.17877, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 378, "text": "\u2022", "bbox": {"l": 478.37466, "t": 270.14075, "r": 479.14251999999993, "b": 272.17877, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 330, "label": "text", "bbox": {"l": 479.91036999999994, "t": 270.14075, "r": 483.74963, "b": 272.17877, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 379, "text": "Signs", "bbox": {"l": 479.91036999999994, "t": 270.14075, "r": 483.74963, "b": 272.17877, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 331, "label": "text", "bbox": {"l": 479.97293, "t": 272.84717, "r": 492.31219, "b": 274.34888, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 380, "text": "- regulatory signs", "bbox": {"l": 479.97293, "t": 272.84717, "r": 492.31219, "b": 274.34888, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 332, "label": "text", "bbox": {"l": 479.97293, "t": 275.14513999999997, "r": 486.72598000000005, "b": 276.64679, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 381, "text": "- school, ", "bbox": {"l": 479.97293, "t": 275.14513999999997, "r": 486.72598000000005, "b": 276.64679, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 333, "label": "text", "bbox": {"l": 481.21602999999993, "t": 276.77972, "r": 492.93286000000006, "b": 278.81768999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 382, "text": "playground and ", "bbox": {"l": 481.21602999999993, "t": 276.77972, "r": 492.93286000000006, "b": 278.81768999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 334, "label": "text", "bbox": {"l": 481.21602999999993, "t": 278.82275000000004, "r": 491.82938000000007, "b": 280.86075, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 383, "text": "crosswalk signs", "bbox": {"l": 481.21602999999993, "t": 278.82275000000004, "r": 491.82938000000007, "b": 280.86075, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 335, "label": "text", "bbox": {"l": 479.97293, "t": 281.52759, "r": 491.00775000000004, "b": 283.02924, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 384, "text": "- lane use signs", "bbox": {"l": 479.97293, "t": 281.52759, "r": 491.00775000000004, "b": 283.02924, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 336, "label": "text", "bbox": {"l": 479.97293, "t": 283.82556, "r": 493.32748, "b": 285.3272099999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 385, "text": "- turn control signs", "bbox": {"l": 479.97293, "t": 283.82556, "r": 493.32748, "b": 285.3272099999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 337, "label": "text", "bbox": {"l": 479.97293, "t": 286.1235, "r": 490.4915199999999, "b": 287.62518, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 386, "text": "- parking signs", "bbox": {"l": 479.97293, "t": 286.1235, "r": 490.4915199999999, "b": 287.62518, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 338, "label": "text", "bbox": {"l": 479.97293, "t": 288.42148, "r": 491.17004000000003, "b": 289.92316, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 387, "text": "- reserved lane ", "bbox": {"l": 479.97293, "t": 288.42148, "r": 491.17004000000003, "b": 289.92316, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 339, "label": "text", "bbox": {"l": 481.21602999999993, "t": 290.05605999999995, "r": 484.77405000000005, "b": 292.09406, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 388, "text": "signs", "bbox": {"l": 481.21602999999993, "t": 290.05605999999995, "r": 484.77405000000005, "b": 292.09406, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 340, "label": "text", "bbox": {"l": 479.97293, "t": 292.76169000000004, "r": 490.83398, "b": 294.26334, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 389, "text": "- warning signs", "bbox": {"l": 479.97293, "t": 292.76169000000004, "r": 490.83398, "b": 294.26334, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 341, "label": "text", "bbox": {"l": 479.97293, "t": 295.05963, "r": 491.62692, "b": 296.56131, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 390, "text": "- object markers", "bbox": {"l": 479.97293, "t": 295.05963, "r": 491.62692, "b": 296.56131, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 342, "label": "text", "bbox": {"l": 479.97293, "t": 297.3576, "r": 490.37341, "b": 298.8592499999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 391, "text": "- construction ", "bbox": {"l": 479.97293, "t": 297.3576, "r": 490.37341, "b": 298.8592499999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 343, "label": "text", "bbox": {"l": 481.21602999999993, "t": 298.99219, "r": 484.77405000000005, "b": 301.03015, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 392, "text": "signs", "bbox": {"l": 481.21602999999993, "t": 298.99219, "r": 484.77405000000005, "b": 301.03015, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 344, "label": "text", "bbox": {"l": 479.97293, "t": 301.69780999999995, "r": 492.93912, "b": 303.19946, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 393, "text": "- information and ", "bbox": {"l": 479.97293, "t": 301.69780999999995, "r": 492.93912, "b": 303.19946, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 345, "label": "text", "bbox": {"l": 481.21602999999993, "t": 303.3324, "r": 493.00525, "b": 305.37036, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 394, "text": "destination signs", "bbox": {"l": 481.21602999999993, "t": 303.3324, "r": 493.00525, "b": 305.37036, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 346, "label": "text", "bbox": {"l": 479.97293, "t": 306.0379899999999, "r": 489.99047999999993, "b": 307.53967, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 395, "text": "- railway signs", "bbox": {"l": 479.97293, "t": 306.0379899999999, "r": 489.99047999999993, "b": 307.53967, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 347, "label": "text", "bbox": {"l": 478.375, "t": 308.24789, "r": 479.1032400000001, "b": 310.28586, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 396, "text": "\u2022", "bbox": {"l": 478.375, "t": 308.24789, "r": 479.1032400000001, "b": 310.28586, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 348, "label": "text", "bbox": {"l": 479.83151, "t": 308.24789, "r": 484.92925999999994, "b": 310.28586, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 397, "text": "Signals", "bbox": {"l": 479.83151, "t": 308.24789, "r": 484.92925999999994, "b": 310.28586, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 349, "label": "text", "bbox": {"l": 479.97293, "t": 310.95358, "r": 490.00091999999995, "b": 312.45526, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 398, "text": "- lane control ", "bbox": {"l": 479.97293, "t": 310.95358, "r": 490.00091999999995, "b": 312.45526, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 350, "label": "text", "bbox": {"l": 481.21602999999993, "t": 312.5881999999999, "r": 485.95331, "b": 314.62616, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 399, "text": "signals", "bbox": {"l": 481.21602999999993, "t": 312.5881999999999, "r": 485.95331, "b": 314.62616, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 351, "label": "text", "bbox": {"l": 479.97293, "t": 315.29379, "r": 489.29876999999993, "b": 316.79544, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 400, "text": "- traffic lights", "bbox": {"l": 479.97293, "t": 315.29379, "r": 489.29876999999993, "b": 316.79544, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 352, "label": "text", "bbox": {"l": 478.375, "t": 317.50366, "r": 479.18129999999996, "b": 319.5416599999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 401, "text": "\u2022", "bbox": {"l": 478.375, "t": 317.50366, "r": 479.18129999999996, "b": 319.5416599999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 353, "label": "text", "bbox": {"l": 479.98761, "t": 317.50366, "r": 490.46960000000007, "b": 319.5416599999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 402, "text": "Road markings", "bbox": {"l": 479.98761, "t": 317.50366, "r": 490.46960000000007, "b": 319.5416599999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 354, "label": "text", "bbox": {"l": 479.97293, "t": 320.20938, "r": 489.26166000000006, "b": 321.71103, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 403, "text": "- yellow lines", "bbox": {"l": 479.97293, "t": 320.20938, "r": 489.26166000000006, "b": 321.71103, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 355, "label": "text", "bbox": {"l": 479.97293, "t": 322.50732, "r": 488.59189, "b": 324.009, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 404, "text": "- white lines", "bbox": {"l": 479.97293, "t": 322.50732, "r": 488.59189, "b": 324.009, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 356, "label": "text", "bbox": {"l": 479.97293, "t": 324.8053, "r": 491.17004000000003, "b": 326.30698, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 405, "text": "- reserved lane ", "bbox": {"l": 479.97293, "t": 324.8053, "r": 491.17004000000003, "b": 326.30698, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 357, "label": "text", "bbox": {"l": 481.21602999999993, "t": 326.43988, "r": 487.58978, "b": 328.47784, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 406, "text": "markings", "bbox": {"l": 481.21602999999993, "t": 326.43988, "r": 487.58978, "b": 328.47784, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 358, "label": "text", "bbox": {"l": 479.97293, "t": 329.14551, "r": 491.75177, "b": 330.64716, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 407, "text": "- other markings", "bbox": {"l": 479.97293, "t": 329.14551, "r": 491.75177, "b": 330.64716, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 359, "label": "text", "bbox": {"l": 478.15246999999994, "t": 265.07030999999995, "r": 493.75586, "b": 268.06872999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 408, "text": "in this chapter", "bbox": {"l": 478.15246999999994, "t": 265.07030999999995, "r": 493.75586, "b": 268.06872999999996, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "caption", "id": 16, "page_no": 0, "cluster": {"id": 16, "label": "caption", "bbox": {"l": 317.95499, "t": 540.08299, "r": 559.80579, "b": 559.51524, "coord_origin": "TOPLEFT"}, "confidence": 0.7793365120887756, "cells": [{"id": 409, "text": "Figure 1: Four examples of complex page layouts across dif-", "bbox": {"l": 317.95499, "t": 540.08299, "r": 559.80579, "b": 548.55624, "coord_origin": "TOPLEFT"}}, {"id": 410, "text": "ferent document categories", "bbox": {"l": 317.95499, "t": 551.0419899999999, "r": 428.69907, "b": 559.51524, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 1: Four examples of complex page layouts across different document categories"}, {"label": "section_header", "id": 3, "page_no": 0, "cluster": {"id": 3, "label": "section_header", "bbox": {"l": 317.95499, "t": 592.46591, "r": 379.8205, "b": 602.7750100000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9208476543426514, "cells": [{"id": 411, "text": "KEYWORDS", "bbox": {"l": 317.95499, "t": 592.46591, "r": 379.8205, "b": 602.7750100000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "KEYWORDS"}, {"label": "text", "id": 1, "page_no": 0, "cluster": {"id": 1, "label": "text", "bbox": {"l": 317.95499, "t": 607.66756, "r": 559.18597, "b": 627.00117, "coord_origin": "TOPLEFT"}, "confidence": 0.9509093761444092, "cells": [{"id": 412, "text": "PDF document conversion, layout segmentation, object-detection,", "bbox": {"l": 317.95499, "t": 607.66756, "r": 559.18597, "b": 616.04218, "coord_origin": "TOPLEFT"}}, {"id": 413, "text": "data set, Machine Learning", "bbox": {"l": 317.95499, "t": 618.62656, "r": 416.94403, "b": 627.00117, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "PDF document conversion, layout segmentation, object-detection, data set, Machine Learning"}, {"label": "section_header", "id": 7, "page_no": 0, "cluster": {"id": 7, "label": "section_header", "bbox": {"l": 317.65997, "t": 640.05434, "r": 404.65366, "b": 647.58609, "coord_origin": "TOPLEFT"}, "confidence": 0.8721988797187805, "cells": [{"id": 414, "text": "ACM Reference Format:", "bbox": {"l": 317.65997, "t": 640.05434, "r": 404.65366, "b": 647.58609, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "ACM Reference Format:"}, {"label": "text", "id": 2, "page_no": 0, "cluster": {"id": 2, "label": "text", "bbox": {"l": 317.95499, "t": 650.11996, "r": 559.5495, "b": 707.377029, "coord_origin": "TOPLEFT"}, "confidence": 0.9455165863037109, "cells": [{"id": 415, "text": "Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter", "bbox": {"l": 317.95499, "t": 650.11996, "r": 558.35266, "b": 657.56404, "coord_origin": "TOPLEFT"}}, {"id": 416, "text": "Staar. 2022. DocLayNet: A Large Human-Annotated Dataset for Document-", "bbox": {"l": 317.95499, "t": 660.08296, "r": 559.5495, "b": 667.52703, "coord_origin": "TOPLEFT"}}, {"id": 417, "text": "Layout Analysis. In", "bbox": {"l": 317.95499, "t": 670.04497, "r": 383.30807, "b": 677.48904, "coord_origin": "TOPLEFT"}}, {"id": 418, "text": "Proceedings of the 28th ACM SIGKDD Conference on", "bbox": {"l": 385.798, "t": 670.08482, "r": 558.20032, "b": 677.49701, "coord_origin": "TOPLEFT"}}, {"id": 419, "text": "Knowledge Discovery and Data Mining (KDD \u201922), August 14-18, 2022, Wash-", "bbox": {"l": 317.95499, "t": 680.04781, "r": 559.00092, "b": 687.46001, "coord_origin": "TOPLEFT"}}, {"id": 420, "text": "ington, DC, USA.", "bbox": {"l": 317.95499, "t": 690.01081, "r": 370.11481, "b": 697.423004, "coord_origin": "TOPLEFT"}}, {"id": 421, "text": "ACM, New York, NY, USA, 9 pages. https://doi.org/10.1145/", "bbox": {"l": 371.82999, "t": 689.97096, "r": 558.71655, "b": 697.415031, "coord_origin": "TOPLEFT"}}, {"id": 422, "text": "3534678.3539043", "bbox": {"l": 317.95499, "t": 699.932953, "r": 371.59375, "b": 707.377029, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar. 2022. DocLayNet: A Large Human-Annotated Dataset for DocumentLayout Analysis. In Proceedings of the 28th ACM SIGKDD Conference on Knowledge Discovery and Data Mining (KDD '22), August 14-18, 2022, Washington, DC, USA. ACM, New York, NY, USA, 9 pages. https://doi.org/10.1145/ 3534678.3539043"}, {"label": "page_header", "id": 10, "page_no": 0, "cluster": {"id": 10, "label": "page_header", "bbox": {"l": 18.34021, "t": 218.35999000000004, "r": 36.339794, "b": 555.00003, "coord_origin": "TOPLEFT"}, "confidence": 0.8537883758544922, "cells": [{"id": 423, "text": "arXiv:2206.01062v1 [cs.CV] 2 Jun 2022", "bbox": {"l": 18.34021, "t": 218.35999000000004, "r": 36.339794, "b": 555.00003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "arXiv:2206.01062v1 [cs.CV] 2 Jun 2022"}], "body": [{"label": "section_header", "id": 12, "page_no": 0, "cluster": {"id": 12, "label": "section_header", "bbox": {"l": 107.29999999999998, "t": 83.69470000000013, "r": 505.06195, "b": 119.59558000000015, "coord_origin": "TOPLEFT"}, "confidence": 0.8416302800178528, "cells": [{"id": 0, "text": "DocLayNet: A Large Human-Annotated Dataset for", "bbox": {"l": 107.29999999999998, "t": 83.69470000000013, "r": 505.06195, "b": 99.67058999999995, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Document-Layout Analysis", "bbox": {"l": 200.117, "t": 103.6196900000001, "r": 411.88367, "b": 119.59558000000015, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis"}, {"label": "text", "id": 8, "page_no": 0, "cluster": {"id": 8, "label": "text", "bbox": {"l": 90.96701, "t": 133.67236000000003, "r": 193.73123, "b": 180.24030000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.8637151718139648, "cells": [{"id": 2, "text": "Birgit Pfitzmann", "bbox": {"l": 102.06001, "t": 133.67236000000003, "r": 182.63805, "b": 144.83856000000003, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "IBM Research", "bbox": {"l": 114.29401000000001, "t": 147.02423, "r": 170.40337, "b": 156.32928000000004, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Rueschlikon, Switzerland", "bbox": {"l": 90.96701, "t": 158.97924999999998, "r": 193.73123, "b": 168.28430000000003, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "bpf@zurich.ibm.com", "bbox": {"l": 100.02301, "t": 170.93524000000002, "r": 184.67522, "b": 180.24030000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Birgit Pfitzmann IBM Research Rueschlikon, Switzerland bpf@zurich.ibm.com"}, {"label": "text", "id": 9, "page_no": 0, "cluster": {"id": 9, "label": "text", "bbox": {"l": 255.11602999999997, "t": 133.67236000000003, "r": 357.88025, "b": 180.24030000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.8612664937973022, "cells": [{"id": 6, "text": "Christoph Auer", "bbox": {"l": 268.62402, "t": 133.67236000000003, "r": 344.59933, "b": 144.83856000000003, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "IBM Research", "bbox": {"l": 278.44302, "t": 147.02423, "r": 334.55237, "b": 156.32928000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Rueschlikon, Switzerland", "bbox": {"l": 255.11602999999997, "t": 158.97924999999998, "r": 357.88025, "b": 168.28430000000003, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "cau@zurich.ibm.com", "bbox": {"l": 263.70404, "t": 170.93524000000002, "r": 349.29272, "b": 180.24030000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Christoph Auer IBM Research Rueschlikon, Switzerland cau@zurich.ibm.com"}, {"label": "text", "id": 6, "page_no": 0, "cluster": {"id": 6, "label": "text", "bbox": {"l": 419.26505, "t": 133.67236000000003, "r": 522.0293, "b": 180.24030000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.8760607242584229, "cells": [{"id": 10, "text": "Michele Dolfi", "bbox": {"l": 437.6930500000001, "t": 133.67236000000003, "r": 503.60208, "b": 144.83856000000003, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "IBM Research", "bbox": {"l": 442.59305000000006, "t": 147.02423, "r": 498.7023899999999, "b": 156.32928000000004, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Rueschlikon, Switzerland", "bbox": {"l": 419.26505, "t": 158.97924999999998, "r": 522.0293, "b": 168.28430000000003, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "dol@zurich.ibm.com", "bbox": {"l": 428.56104000000005, "t": 170.93524000000002, "r": 512.73505, "b": 180.24030000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Michele Dolfi IBM Research Rueschlikon, Switzerland dol@zurich.ibm.com"}, {"label": "text", "id": 13, "page_no": 0, "cluster": {"id": 13, "label": "text", "bbox": {"l": 172.54303, "t": 192.05737, "r": 275.30725, "b": 238.62531, "coord_origin": "TOPLEFT"}, "confidence": 0.8319916129112244, "cells": [{"id": 14, "text": "Ahmed S. Nassar", "bbox": {"l": 182.26804, "t": 192.05737, "r": 265.39255, "b": 203.22357, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "IBM Research", "bbox": {"l": 195.87103, "t": 205.40923999999995, "r": 251.98038999999997, "b": 214.71429, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Rueschlikon, Switzerland", "bbox": {"l": 172.54303, "t": 217.36425999999994, "r": 275.30725, "b": 226.66931, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "ahn@zurich.ibm.com", "bbox": {"l": 180.52803, "t": 229.32025, "r": 267.3222, "b": 238.62531, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Ahmed S. Nassar IBM Research Rueschlikon, Switzerland ahn@zurich.ibm.com"}, {"label": "text", "id": 15, "page_no": 0, "cluster": {"id": 15, "label": "text", "bbox": {"l": 336.69302, "t": 192.05737, "r": 439.45727999999997, "b": 238.62531, "coord_origin": "TOPLEFT"}, "confidence": 0.8027974367141724, "cells": [{"id": 18, "text": "Peter Staar", "bbox": {"l": 361.52802, "t": 192.05737, "r": 414.84821, "b": 203.22357, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "IBM Research", "bbox": {"l": 360.02002, "t": 205.40923999999995, "r": 416.12939, "b": 214.71429, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Rueschlikon, Switzerland", "bbox": {"l": 336.69302, "t": 217.36425999999994, "r": 439.45727999999997, "b": 226.66931, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "taa@zurich.ibm.com", "bbox": {"l": 346.20703, "t": 229.32025, "r": 429.94269, "b": 238.62531, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Peter Staar IBM Research Rueschlikon, Switzerland taa@zurich.ibm.com"}, {"label": "section_header", "id": 5, "page_no": 0, "cluster": {"id": 5, "label": "section_header", "bbox": {"l": 53.798035, "t": 247.70288000000005, "r": 111.94354, "b": 258.01202, "coord_origin": "TOPLEFT"}, "confidence": 0.8876155018806458, "cells": [{"id": 22, "text": "ABSTRACT", "bbox": {"l": 53.798035, "t": 247.70288000000005, "r": 111.94354, "b": 258.01202, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "ABSTRACT"}, {"label": "text", "id": 0, "page_no": 0, "cluster": {"id": 0, "label": "text", "bbox": {"l": 53.466999, "t": 262.90454, "r": 295.56018, "b": 534.29318, "coord_origin": "TOPLEFT"}, "confidence": 0.9823057055473328, "cells": [{"id": 23, "text": "Accurate document layout analysis is a key requirement for high-", "bbox": {"l": 53.484001, "t": 262.90454, "r": 295.55591, "b": 271.27917, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "quality PDF document conversion. With the recent availability of", "bbox": {"l": 53.79800000000001, "t": 273.86352999999997, "r": 294.04199, "b": 282.23816, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "public, large ground-truth datasets such as PubLayNet and DocBank,", "bbox": {"l": 53.79800000000001, "t": 284.82254, "r": 295.34586, "b": 293.19717, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "deep-learning models have proven to be very effective at layout", "bbox": {"l": 53.79800000000001, "t": 295.78152, "r": 294.04709, "b": 304.15616000000006, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "detection and segmentation. While these datasets are of adequate", "bbox": {"l": 53.79800000000001, "t": 306.74053999999995, "r": 294.04645, "b": 315.11517, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "size to train such models, they severely lack in layout variability", "bbox": {"l": 53.79800000000001, "t": 317.69952, "r": 294.27573, "b": 326.07416, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "since they are sourced from scientific article repositories such as", "bbox": {"l": 53.79800000000001, "t": 328.65854, "r": 294.04712, "b": 337.03317, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "PubMed and arXiv only. Consequently, the accuracy of the layout", "bbox": {"l": 53.79800000000001, "t": 339.61755, "r": 294.0437, "b": 347.99219, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "segmentation drops significantly when these models are applied", "bbox": {"l": 53.79800000000001, "t": 350.57654, "r": 294.04715, "b": 358.95117, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "on more challenging and diverse layouts. In this paper, we present", "bbox": {"l": 53.79800000000001, "t": 361.53455, "r": 294.04364, "b": 369.90918000000005, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "DocLayNet", "bbox": {"l": 53.79800000000001, "t": 372.53839, "r": 92.863388, "b": 380.87714000000005, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": ", a new, publicly available, document-layout annotation", "bbox": {"l": 92.863998, "t": 372.49353, "r": 294.04361, "b": 380.86816, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "dataset in COCO format. It contains 80863 manually annotated", "bbox": {"l": 53.79800000000001, "t": 383.45255, "r": 294.04718, "b": 391.82718, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "pages from diverse data sources to represent a wide variability in", "bbox": {"l": 53.79800000000001, "t": 394.41153, "r": 294.0437, "b": 402.78616, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "layouts. For each PDF page, the layout annotations provide labelled", "bbox": {"l": 53.79800000000001, "t": 405.37054, "r": 294.04535, "b": 413.74518, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "bounding-boxes with a choice of 11 distinct classes. DocLayNet", "bbox": {"l": 53.79800000000001, "t": 416.32953, "r": 294.04715, "b": 424.70416000000006, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "also provides a subset of double- and triple-annotated pages to", "bbox": {"l": 53.79800000000001, "t": 427.28853999999995, "r": 294.04712, "b": 435.66318, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "determine the inter-annotator agreement. In multiple experiments,", "bbox": {"l": 53.79800000000001, "t": 438.24753, "r": 295.03, "b": 446.62216, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "we provide baseline accuracy scores (in mAP) for a set of popular", "bbox": {"l": 53.466999, "t": 449.20654, "r": 294.21616, "b": 457.58118, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "object detection models. We also demonstrate that these models", "bbox": {"l": 53.79800000000001, "t": 460.16553, "r": 294.04712, "b": 468.54016, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "fall approximately 10% behind the inter-annotator agreement. Fur-", "bbox": {"l": 53.79800000000001, "t": 471.12354, "r": 295.56018, "b": 479.49817, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "thermore, we provide evidence that DocLayNet is of sufficient size.", "bbox": {"l": 53.79800000000001, "t": 482.08255, "r": 295.42783, "b": 490.45718, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Lastly, we compare models trained on PubLayNet, DocBank and", "bbox": {"l": 53.79800000000001, "t": 493.04153, "r": 294.04715, "b": 501.41617, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "DocLayNet, showing that layout predictions of the DocLayNet-", "bbox": {"l": 53.79800000000001, "t": 504.00055, "r": 295.55618, "b": 512.37518, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "trained models are more robust and thus the preferred choice for", "bbox": {"l": 53.79800000000001, "t": 514.95953, "r": 294.21643, "b": 523.33417, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "general-purpose document-layout analysis.", "bbox": {"l": 53.79800000000001, "t": 525.91855, "r": 212.05495, "b": 534.29318, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Accurate document layout analysis is a key requirement for highquality PDF document conversion. With the recent availability of public, large ground-truth datasets such as PubLayNet and DocBank, deep-learning models have proven to be very effective at layout detection and segmentation. While these datasets are of adequate size to train such models, they severely lack in layout variability since they are sourced from scientific article repositories such as PubMed and arXiv only. Consequently, the accuracy of the layout segmentation drops significantly when these models are applied on more challenging and diverse layouts. In this paper, we present DocLayNet , a new, publicly available, document-layout annotation dataset in COCO format. It contains 80863 manually annotated pages from diverse data sources to represent a wide variability in layouts. For each PDF page, the layout annotations provide labelled bounding-boxes with a choice of 11 distinct classes. DocLayNet also provides a subset of double- and triple-annotated pages to determine the inter-annotator agreement. In multiple experiments, we provide baseline accuracy scores (in mAP) for a set of popular object detection models. We also demonstrate that these models fall approximately 10% behind the inter-annotator agreement. Furthermore, we provide evidence that DocLayNet is of sufficient size. Lastly, we compare models trained on PubLayNet, DocBank and DocLayNet, showing that layout predictions of the DocLayNettrained models are more robust and thus the preferred choice for general-purpose document-layout analysis."}, {"label": "section_header", "id": 4, "page_no": 0, "cluster": {"id": 4, "label": "section_header", "bbox": {"l": 53.79800000000001, "t": 550.99692, "r": 134.81989, "b": 561.30602, "coord_origin": "TOPLEFT"}, "confidence": 0.9149598479270935, "cells": [{"id": 49, "text": "CCS CONCEPTS", "bbox": {"l": 53.79800000000001, "t": 550.99692, "r": 134.81989, "b": 561.30602, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "CCS CONCEPTS"}, {"label": "text", "id": 11, "page_no": 0, "cluster": {"id": 11, "label": "text", "bbox": {"l": 53.797989, "t": 566.08299, "r": 297.85294, "b": 596.50114, "coord_origin": "TOPLEFT"}, "confidence": 0.8458839058876038, "cells": [{"id": 50, "text": "\u2022", "bbox": {"l": 53.79800000000001, "t": 566.19957, "r": 56.945206000000006, "b": 574.57419, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Information systems", "bbox": {"l": 58.440002, "t": 566.0830100000001, "r": 142.4462, "b": 574.5562600000001, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "\u2192", "bbox": {"l": 143.938, "t": 566.36096, "r": 153.15099, "b": 574.43073, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Document structure", "bbox": {"l": 154.646, "t": 566.0830100000001, "r": 235.46015999999997, "b": 574.5562600000001, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "; \u2022", "bbox": {"l": 235.45700000000002, "t": 566.19955, "r": 242.17419, "b": 574.57417, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "Applied com-", "bbox": {"l": 243.66899, "t": 566.08299, "r": 297.85294, "b": 574.55624, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "puting", "bbox": {"l": 53.797989, "t": 577.0419899999999, "r": 80.661324, "b": 585.51524, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "\u2192", "bbox": {"l": 83.565987, "t": 577.3199500000001, "r": 92.778961, "b": 585.38971, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Document analysis", "bbox": {"l": 95.68399, "t": 577.0419899999999, "r": 173.91583, "b": 585.51524, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "; \u2022", "bbox": {"l": 173.916, "t": 577.15855, "r": 182.1272, "b": 585.53317, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Computing methodologies", "bbox": {"l": 185.032, "t": 577.0419899999999, "r": 294.0455, "b": 585.51524, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "\u2192", "bbox": {"l": 53.79800399999999, "t": 588.27895, "r": 63.01097899999999, "b": 596.34871, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "Machine learning", "bbox": {"l": 65.253006, "t": 588.00099, "r": 136.80487, "b": 596.47424, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": ";", "bbox": {"l": 136.80501, "t": 588.1175499999999, "r": 138.92108, "b": 596.49217, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "Computer vision", "bbox": {"l": 141.162, "t": 588.00099, "r": 209.60254, "b": 596.47424, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": ";", "bbox": {"l": 209.60201, "t": 588.1175499999999, "r": 211.71808, "b": 596.49217, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "Object detection", "bbox": {"l": 213.96001, "t": 588.16238, "r": 270.45728, "b": 596.50114, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": ";", "bbox": {"l": 270.48001, "t": 588.1175499999999, "r": 272.59607, "b": 596.49217, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u00b7 Information systems \u2192 Document structure ; \u00b7 Applied computing \u2192 Document analysis ; \u00b7 Computing methodologies \u2192 Machine learning ; Computer vision ; Object detection ;"}, {"label": "text", "id": 17, "page_no": 0, "cluster": {"id": 17, "label": "text", "bbox": {"l": 53.79800000000001, "t": 634.39838, "r": 295.11798, "b": 672.79189, "coord_origin": "TOPLEFT"}, "confidence": 0.7107349038124084, "cells": [{"id": 68, "text": "Permission to make digital or hard copies of part or all of this work for personal or", "bbox": {"l": 53.79800000000001, "t": 634.39838, "r": 294.17697, "b": 640.9119000000001, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "classroom use is granted without fee provided that copies are not made or distributed", "bbox": {"l": 53.79800000000001, "t": 642.36838, "r": 294.04443, "b": 648.8819, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "for profit or commercial advantage and that copies bear this notice and the full citation", "bbox": {"l": 53.79800000000001, "t": 650.33838, "r": 294.04498, "b": 656.8519, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "on the first page. Copyrights for third-party components of this work must be honored.", "bbox": {"l": 53.79800000000001, "t": 658.3083799999999, "r": 295.11798, "b": 664.8219, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "For all other uses, contact the owner/author(s).", "bbox": {"l": 53.79800000000001, "t": 666.27837, "r": 187.72285, "b": 672.79189, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Permission to make digital or hard copies of part or all of this work for personal or classroom use is granted without fee provided that copies are not made or distributed for profit or commercial advantage and that copies bear this notice and the full citation on the first page. Copyrights for third-party components of this work must be honored. For all other uses, contact the owner/author(s)."}, {"label": "text", "id": 29, "page_no": 0, "cluster": {"id": 29, "label": "text", "bbox": {"l": 53.79800000000001, "t": 675.08023, "r": 197.86275, "b": 681.56586, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 53.79800000000001, "t": 675.08023, "r": 197.86275, "b": 681.56586, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA"}, {"label": "text", "id": 30, "page_no": 0, "cluster": {"id": 30, "label": "text", "bbox": {"l": 53.317001, "t": 683.81236, "r": 186.74652, "b": 690.32589, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "\u00a9 2022 Copyright held by the owner/author(s).", "bbox": {"l": 53.317001, "t": 683.81236, "r": 186.74652, "b": 690.32589, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u00a9 2022 Copyright held by the owner/author(s)."}, {"label": "text", "id": 31, "page_no": 0, "cluster": {"id": 31, "label": "text", "bbox": {"l": 53.554001, "t": 691.78336, "r": 157.03125, "b": 698.29689, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "ACM ISBN 978-1-4503-9385-0/22/08.", "bbox": {"l": 53.554001, "t": 691.78336, "r": 157.03125, "b": 698.29689, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "ACM ISBN 978-1-4503-9385-0/22/08."}, {"label": "text", "id": 27, "page_no": 0, "cluster": {"id": 27, "label": "text", "bbox": {"l": 53.79800000000001, "t": 699.753365, "r": 166.94093, "b": 706.266891, "coord_origin": "TOPLEFT"}, "confidence": 0.509588360786438, "cells": [{"id": 76, "text": "https://doi.org/10.1145/3534678.3539043", "bbox": {"l": 53.79800000000001, "t": 699.753365, "r": 166.94093, "b": 706.266891, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "https://doi.org/10.1145/3534678.3539043"}, {"label": "picture", "id": 20, "page_no": 0, "cluster": {"id": 20, "label": "picture", "bbox": {"l": 323.408203125, "t": 250.34873962402344, "r": 553.2952270507812, "b": 525.8507080078125, "coord_origin": "TOPLEFT"}, "confidence": 0.5910208821296692, "cells": [{"id": 77, "text": "13", "bbox": {"l": 327.86951, "t": 351.78085, "r": 330.41248, "b": 353.95465, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "USING THE VERTICAL TUBE -", "bbox": {"l": 327.83005, "t": 331.57268999999997, "r": 351.16092, "b": 333.31171, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "MODELS AY11230/11234", "bbox": {"l": 327.83005, "t": 333.18292, "r": 348.30536, "b": 334.92194, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "1.", "bbox": {"l": 327.83005, "t": 336.40439, "r": 329.05914, "b": 337.92606, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "The vertical tube can be used for", "bbox": {"l": 329.67368, "t": 336.40439, "r": 349.95349, "b": 337.92606, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "instructional viewing or to photograph", "bbox": {"l": 329.11752, "t": 337.83588, "r": 353.57977, "b": 339.35751000000005, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": " the image with a digital camera or a", "bbox": {"l": 327.77121, "t": 339.26736, "r": 352.4306, "b": 340.789, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": " micro TV unit", "bbox": {"l": 328.15176, "t": 340.69882, "r": 337.91086, "b": 342.22049, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "2.", "bbox": {"l": 327.8313, "t": 342.19043000000005, "r": 329.09155, "b": 343.71207, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Loosen the retention screw, then rotate ", "bbox": {"l": 329.72168, "t": 342.19043000000005, "r": 354.9267, "b": 343.71207, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": " the adjustment ring to change the ", "bbox": {"l": 327.8313, "t": 343.62192, "r": 351.66949, "b": 345.14355, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": " length of the vertical tube.", "bbox": {"l": 328.21185, "t": 345.05338, "r": 346.33179, "b": 346.57504, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "3.", "bbox": {"l": 327.83005, "t": 346.84680000000003, "r": 329.12726, "b": 348.36847, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "Make sure that both the images in", "bbox": {"l": 329.77588, "t": 346.84680000000003, "r": 351.18005, "b": 348.36847, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "OPERATION ", "bbox": {"l": 327.25311, "t": 254.94812000000002, "r": 350.07861, "b": 258.86096, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "(", "bbox": {"l": 350.07861, "t": 254.76782000000003, "r": 351.82651, "b": 258.68066, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "cont.", "bbox": {"l": 351.82651, "t": 254.94812000000002, "r": 360.85242, "b": 258.86096, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": ")", "bbox": {"l": 360.85242, "t": 254.76782000000003, "r": 362.60028, "b": 258.68066, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "SELECTING OBJECTIVE ", "bbox": {"l": 326.88037, "t": 263.49492999999995, "r": 345.84351, "b": 265.23395000000005, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "MAGNIFICATION", "bbox": {"l": 326.88037, "t": 265.10515999999996, "r": 340.54153, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "1.", "bbox": {"l": 326.88037, "t": 266.71533, "r": 328.31903, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "There are two objectives. The lower", "bbox": {"l": 329.03836, "t": 266.71533, "r": 354.21472, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": " magnification objective has a greater", "bbox": {"l": 326.88037, "t": 268.32556, "r": 355.19193, "b": 270.06458, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": " depth of field and view.", "bbox": {"l": 326.88037, "t": 269.93579, "r": 345.80057, "b": 271.6748, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "2.", "bbox": {"l": 326.88037, "t": 271.54602, "r": 328.33862, "b": 273.28503, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "In order to observe the specimen", "bbox": {"l": 329.06775, "t": 271.54602, "r": 352.39969, "b": 273.28503, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": " easily use the lower magnification", "bbox": {"l": 326.88037, "t": 273.15619000000004, "r": 352.90042, "b": 274.89526, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": " objective first. Then, by rotating the", "bbox": {"l": 326.88037, "t": 274.76642000000004, "r": 354.59546, "b": 276.50543000000005, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": " case, the magnification can be", "bbox": {"l": 326.88037, "t": 276.37665000000004, "r": 350.81885, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": " changed.", "bbox": {"l": 326.88037, "t": 277.98688000000004, "r": 335.46707, "b": 279.72589000000005, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "CHANGING THE INTERPUPILLARY ", "bbox": {"l": 326.88037, "t": 281.20728, "r": 354.57755, "b": 282.94632, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "DISTANCE", "bbox": {"l": 326.88037, "t": 282.81750000000005, "r": 335.1752, "b": 284.55652, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "1.", "bbox": {"l": 326.88037, "t": 284.4277, "r": 328.34784, "b": 286.16675, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "The distance between the observer's", "bbox": {"l": 329.08157, "t": 284.4277, "r": 354.76245, "b": 286.16675, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": " pupils is the interpupillary distance.", "bbox": {"l": 326.88037, "t": 286.03793, "r": 354.6499, "b": 287.77695, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "2.", "bbox": {"l": 326.88037, "t": 287.64813, "r": 328.25125, "b": 289.38718, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "To adjust the interpupillary distance", "bbox": {"l": 328.93671, "t": 287.64813, "r": 354.29825, "b": 289.38718, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": " rotate the prism caps until both eyes", "bbox": {"l": 326.88181, "t": 289.25836, "r": 355.02075, "b": 290.99738, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": " coincide with the image in the", "bbox": {"l": 326.88181, "t": 290.86855999999995, "r": 350.82028, "b": 292.6076, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": " eyepiece. ", "bbox": {"l": 326.88181, "t": 292.47879, "r": 336.2067, "b": 294.2178, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "FOCUSING", "bbox": {"l": 326.88181, "t": 295.69922, "r": 335.3941, "b": 297.43823, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "1.", "bbox": {"l": 326.88181, "t": 297.30942, "r": 328.34314, "b": 299.04846, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "Remove the lens protective cover.", "bbox": {"l": 329.07379, "t": 297.30942, "r": 353.18555, "b": 299.04846, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "2.", "bbox": {"l": 326.88324, "t": 298.91965, "r": 328.35919, "b": 300.65866, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "Place the specimen on the working", "bbox": {"l": 329.0972, "t": 298.91965, "r": 353.45065, "b": 300.65866, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": " stage.", "bbox": {"l": 326.88324, "t": 300.52985, "r": 333.32825, "b": 302.26889000000006, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "3.", "bbox": {"l": 326.88324, "t": 302.14008000000007, "r": 328.31296, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "Focus the specimen with the left eye", "bbox": {"l": 329.02783, "t": 302.14008000000007, "r": 354.76303, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": " first while turning the focus knob until", "bbox": {"l": 326.88324, "t": 303.75027, "r": 355.96307, "b": 305.48932, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": " the image appears clear and sharp.", "bbox": {"l": 326.88324, "t": 305.3605, "r": 354.46594, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "4.", "bbox": {"l": 326.88324, "t": 306.9707, "r": 328.25488, "b": 308.70975, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "Rotate the right eyepiece ring until the", "bbox": {"l": 328.9407, "t": 306.9707, "r": 356.37335, "b": 308.70975, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": " images in each eyepiece coincide and", "bbox": {"l": 326.88324, "t": 308.58093, "r": 355.38867, "b": 310.31995, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": " are sharp and clear.", "bbox": {"l": 326.88324, "t": 310.19113, "r": 343.17249, "b": 311.93018, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "CHANGING THE BULB", "bbox": {"l": 326.88324, "t": 313.41156, "r": 344.13388, "b": 315.15059999999994, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "1.", "bbox": {"l": 326.88324, "t": 315.02178999999995, "r": 328.37418, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "Disconnect the power cord.", "bbox": {"l": 329.11963, "t": 315.02178999999995, "r": 348.50162, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "2.", "bbox": {"l": 326.88324, "t": 316.63199, "r": 328.34061, "b": 318.37103, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "When the bulb is cool, remove the", "bbox": {"l": 329.06931, "t": 316.63199, "r": 353.11588, "b": 318.37103, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": " oblique illuminator cap and remove", "bbox": {"l": 326.88464, "t": 318.2422199999999, "r": 353.79517, "b": 319.9812299999999, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": " the halogen bulb with cap.", "bbox": {"l": 326.88464, "t": 319.85242000000005, "r": 348.02094, "b": 321.59146, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "3.", "bbox": {"l": 326.88464, "t": 321.46265, "r": 328.37512, "b": 323.20166, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "Replace with a new halogen bulb.", "bbox": {"l": 329.12036, "t": 321.46265, "r": 352.96808, "b": 323.20166, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "4.", "bbox": {"l": 326.88608, "t": 323.07285, "r": 328.36884, "b": 324.81189, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "Open the window in the base plate and", "bbox": {"l": 329.1102, "t": 323.07285, "r": 356.5412, "b": 324.81189, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": " replace the halogen lamp or ", "bbox": {"l": 326.88608, "t": 324.68307000000004, "r": 350.13828, "b": 326.42209, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": " fluorescent lamp of transmitted", "bbox": {"l": 326.88608, "t": 326.29327, "r": 351.59677, "b": 328.03232, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": " illuminator.", "bbox": {"l": 326.88608, "t": 327.9035, "r": 336.89197, "b": 329.64252, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "FOCUSING", "bbox": {"l": 358.42023, "t": 263.49492999999995, "r": 366.93256, "b": 265.23395000000005, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "1.", "bbox": {"l": 358.42023, "t": 265.10515999999996, "r": 359.89841, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "Turn the focusing knob away or toward", "bbox": {"l": 360.63751, "t": 265.10515999999996, "r": 387.98407, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": " you until a clear image is viewed.", "bbox": {"l": 358.42023, "t": 266.71533, "r": 384.58948, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "2.", "bbox": {"l": 358.42166, "t": 268.32556, "r": 359.78549, "b": 270.06458, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "If the image is unclear, adjust the", "bbox": {"l": 360.46741, "t": 268.32556, "r": 384.33441, "b": 270.06458, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": " height of the elevator up or down,", "bbox": {"l": 358.4231, "t": 269.93579, "r": 384.61502, "b": 271.6748, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": " then turn the focusing knob again.", "bbox": {"l": 358.4231, "t": 271.54602, "r": 385.38922, "b": 273.28503, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "ZOOM MAGNIFICATION", "bbox": {"l": 358.4231, "t": 274.76642000000004, "r": 377.35046, "b": 276.50543000000005, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "1.", "bbox": {"l": 358.4231, "t": 276.37665000000004, "r": 359.89429, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "Turn the zoom magnification knob to", "bbox": {"l": 360.62988, "t": 276.37665000000004, "r": 386.37589, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": " the desired magnification and field of", "bbox": {"l": 358.4231, "t": 277.98688000000004, "r": 386.78732, "b": 279.72589000000005, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": " view.", "bbox": {"l": 358.4231, "t": 279.59704999999997, "r": 364.16855, "b": 281.33609, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "2.", "bbox": {"l": 358.4231, "t": 281.20728, "r": 359.86777, "b": 282.94632, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "In most situations, it is recommended", "bbox": {"l": 360.59012, "t": 281.20728, "r": 387.31656, "b": 282.94632, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": " that you focus at the lowest ", "bbox": {"l": 358.4231, "t": 282.81750000000005, "r": 381.56656, "b": 284.55652, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": " magnification, then move to a higher", "bbox": {"l": 358.4231, "t": 284.4277, "r": 386.63403, "b": 286.16675, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": " magnification and re-focus as ", "bbox": {"l": 358.42453, "t": 286.03793, "r": 382.77115, "b": 287.77695, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": " necessary.", "bbox": {"l": 358.42453, "t": 287.64813, "r": 367.98694, "b": 289.38718, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "3.", "bbox": {"l": 358.42453, "t": 289.25836, "r": 359.80386, "b": 290.99738, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "If the image is not clear to both eyes", "bbox": {"l": 360.49353, "t": 289.25836, "r": 386.70093, "b": 290.99738, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": " at the same time, the diopter ring may", "bbox": {"l": 358.42453, "t": 290.86855999999995, "r": 388.03534, "b": 292.6076, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": " need adjustment.", "bbox": {"l": 358.42453, "t": 292.47879, "r": 373.13724, "b": 294.2178, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "DIOPTER RING ADJUSTMENT", "bbox": {"l": 358.42453, "t": 295.69922, "r": 381.74539, "b": 297.43823, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "1.", "bbox": {"l": 358.42453, "t": 297.30942, "r": 359.83682, "b": 299.04846, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "To adjust the eyepiece for viewing with", "bbox": {"l": 360.54297, "t": 297.30942, "r": 388.08289, "b": 299.04846, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": " or without eyeglasses and for ", "bbox": {"l": 358.42453, "t": 298.91965, "r": 382.73251, "b": 300.65866, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": " differences in acuity between the right", "bbox": {"l": 358.42453, "t": 300.52985, "r": 387.72266, "b": 302.26889000000006, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": " and left eyes, follow the following", "bbox": {"l": 358.42453, "t": 302.14008000000007, "r": 384.1991, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": " steps:", "bbox": {"l": 358.42453, "t": 303.75027, "r": 364.88672, "b": 305.48932, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "a.", "bbox": {"l": 358.42453, "t": 305.3605, "r": 359.95078, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "Observe an image through the left", "bbox": {"l": 361.47699, "t": 305.3605, "r": 386.65988, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": " eyepiece and bring a specific point", "bbox": {"l": 358.42453, "t": 306.9707, "r": 386.7634, "b": 308.70975, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": " into focus using the focus knob.", "bbox": {"l": 358.42453, "t": 308.58093, "r": 385.41354, "b": 310.31995, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "b.", "bbox": {"l": 358.42453, "t": 310.19113, "r": 359.93304, "b": 311.93018, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "By turning the diopter ring ", "bbox": {"l": 361.44156, "t": 310.19113, "r": 382.56085, "b": 311.93018, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": " adjustment for the left eyepiece,", "bbox": {"l": 358.42596, "t": 311.80136, "r": 385.4559, "b": 313.54037, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": " bring the same point into sharp", "bbox": {"l": 358.42596, "t": 313.41156, "r": 384.56122, "b": 315.15059999999994, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": " focus.", "bbox": {"l": 358.42596, "t": 315.02178999999995, "r": 366.74371, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": " c.Then bring the same point into", "bbox": {"l": 358.42596, "t": 316.63199, "r": 383.93884, "b": 318.37103, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": " focus through the right eyepiece", "bbox": {"l": 358.42596, "t": 318.2422199999999, "r": 385.69241, "b": 319.9812299999999, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": " by turning the right diopter ring.", "bbox": {"l": 358.42596, "t": 319.85242000000005, "r": 385.94861, "b": 321.59146, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": " d.With more than one viewer, each", "bbox": {"l": 358.42596, "t": 321.46265, "r": 385.54236, "b": 323.20166, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": " viewer should note their own", "bbox": {"l": 358.42596, "t": 323.07285, "r": 382.98718, "b": 324.81189, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": " diopter ring position for the left", "bbox": {"l": 358.42596, "t": 324.68307000000004, "r": 385.06448, "b": 326.42209, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": " and right eyepieces, then before", "bbox": {"l": 358.42596, "t": 326.29327, "r": 385.20682, "b": 328.03232, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": " viewing set the diopter ring", "bbox": {"l": 358.42596, "t": 327.9035, "r": 382.21964, "b": 329.64252, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": " adjustments to that setting.", "bbox": {"l": 358.42596, "t": 329.5137, "r": 382.63382, "b": 331.25275, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "CHANGING THE BULB", "bbox": {"l": 358.42596, "t": 332.73412999999994, "r": 375.67661, "b": 334.47317999999996, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "1.", "bbox": {"l": 358.42596, "t": 334.34436, "r": 359.90311, "b": 336.08337, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "Disconnect the power cord from the", "bbox": {"l": 360.64169, "t": 334.34436, "r": 385.75333, "b": 336.08337, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": " electrical outlet.", "bbox": {"l": 358.42596, "t": 335.95456, "r": 372.01416, "b": 337.6936, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "2.", "bbox": {"l": 358.42596, "t": 337.56479, "r": 359.88327, "b": 339.3038, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "When the bulb is cool, remove the", "bbox": {"l": 360.61191, "t": 337.56479, "r": 384.65726, "b": 339.3038, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": " oblique illuminator cap and remove", "bbox": {"l": 358.42596, "t": 339.17499, "r": 385.33649, "b": 340.9140300000001, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": " the halogen bulb with cap.", "bbox": {"l": 358.42596, "t": 340.78522, "r": 379.57224, "b": 342.52423, "coord_origin": "TOPLEFT"}}, {"id": 201, "text": "3.", "bbox": {"l": 358.4274, "t": 342.39542, "r": 359.91788, "b": 344.13446000000005, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": "Replace with a new halogen bulb.", "bbox": {"l": 360.66312, "t": 342.39542, "r": 384.5108, "b": 344.13446000000005, "coord_origin": "TOPLEFT"}}, {"id": 203, "text": "4.", "bbox": {"l": 358.42883, "t": 344.00565000000006, "r": 359.92792, "b": 345.74466, "coord_origin": "TOPLEFT"}}, {"id": 204, "text": "Open the window in the base plate", "bbox": {"l": 360.67746, "t": 344.00565000000006, "r": 385.41235, "b": 345.74466, "coord_origin": "TOPLEFT"}}, {"id": 205, "text": " and replace the halogen lamp or", "bbox": {"l": 358.42883, "t": 345.61584, "r": 383.2782, "b": 347.35489, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": " fluorescent lamp of transmitted", "bbox": {"l": 358.42883, "t": 347.22607, "r": 383.13953, "b": 348.96509, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": " illuminator.", "bbox": {"l": 358.42883, "t": 348.83627, "r": 368.43472, "b": 350.57532, "coord_origin": "TOPLEFT"}}, {"id": 208, "text": "Model AY11230", "bbox": {"l": 326.59567, "t": 261.14185, "r": 339.11377, "b": 262.88091999999995, "coord_origin": "TOPLEFT"}}, {"id": 209, "text": "Model AY11234", "bbox": {"l": 358.48605, "t": 261.14185, "r": 371.00415, "b": 262.88091999999995, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": "14", "bbox": {"l": 455.43533, "t": 351.77038999999996, "r": 457.97827000000007, "b": 353.94415, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "Objectives", "bbox": {"l": 408.24518, "t": 275.52673000000004, "r": 414.4234, "b": 276.96020999999996, "coord_origin": "TOPLEFT"}}, {"id": 212, "text": "Revolving Turret", "bbox": {"l": 409.39554, "t": 268.98235999999997, "r": 419.06677, "b": 270.41583, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "Coarse ", "bbox": {"l": 441.3895, "t": 279.12627999999995, "r": 445.87192, "b": 280.55975, "coord_origin": "TOPLEFT"}}, {"id": 214, "text": "Adjustment", "bbox": {"l": 441.3895, "t": 280.30609, "r": 448.22338999999994, "b": 281.7395900000001, "coord_origin": "TOPLEFT"}}, {"id": 215, "text": "Knob", "bbox": {"l": 441.3895, "t": 281.48593, "r": 444.40371999999996, "b": 282.91939999999994, "coord_origin": "TOPLEFT"}}, {"id": 216, "text": "MODEL AY11236", "bbox": {"l": 398.79288, "t": 254.94646999999998, "r": 428.91568, "b": 258.85931000000005, "coord_origin": "TOPLEFT"}}, {"id": 217, "text": "MICROSCOPE USAGE", "bbox": {"l": 398.32535, "t": 305.04291, "r": 435.93542, "b": 308.95572000000004, "coord_origin": "TOPLEFT"}}, {"id": 218, "text": "BARSKA Model AY11236 is a powerful fixed power compound ", "bbox": {"l": 398.08594, "t": 310.35892, "r": 453.72171, "b": 312.53271, "coord_origin": "TOPLEFT"}}, {"id": 219, "text": "microscope designed for biological studies such as specimen ", "bbox": {"l": 398.08594, "t": 312.50586, "r": 453.09939999999995, "b": 314.67966, "coord_origin": "TOPLEFT"}}, {"id": 220, "text": "examination. It can also be used for examining bacteria and", "bbox": {"l": 398.08594, "t": 314.6528, "r": 456.65246999999994, "b": 316.8266, "coord_origin": "TOPLEFT"}}, {"id": 221, "text": "for general clinical and medical studies and other scientific uses. ", "bbox": {"l": 398.08594, "t": 316.79977, "r": 456.73859000000004, "b": 318.97354, "coord_origin": "TOPLEFT"}}, {"id": 222, "text": "CONSTRUCTION", "bbox": {"l": 398.62399, "t": 320.42941, "r": 427.77472, "b": 324.34222000000005, "coord_origin": "TOPLEFT"}}, {"id": 223, "text": "BARSKA Model AY11236 is a fixed power compound microscope.", "bbox": {"l": 398.08594, "t": 326.46069000000006, "r": 456.02639999999997, "b": 328.63449, "coord_origin": "TOPLEFT"}}, {"id": 224, "text": "It is constructed with two optical paths at the same angle. It is ", "bbox": {"l": 398.08414, "t": 328.6076699999999, "r": 455.42238999999995, "b": 330.7814599999999, "coord_origin": "TOPLEFT"}}, {"id": 225, "text": "equipped with transmitted illumination. By using this instrument, ", "bbox": {"l": 398.08414, "t": 330.75461, "r": 457.39844, "b": 332.92841, "coord_origin": "TOPLEFT"}}, {"id": 226, "text": "the user can observe specimens at magnification from 40x to ", "bbox": {"l": 398.08414, "t": 332.90155, "r": 453.97745, "b": 335.07535000000007, "coord_origin": "TOPLEFT"}}, {"id": 227, "text": "1000x by selecting the desired objective lens. Coarse and fine ", "bbox": {"l": 398.08414, "t": 335.04852, "r": 454.70708999999994, "b": 337.22232, "coord_origin": "TOPLEFT"}}, {"id": 228, "text": "focus adjustments provide accuracy and image detail. The rotating ", "bbox": {"l": 398.08414, "t": 337.19547, "r": 458.90240000000006, "b": 339.36926, "coord_origin": "TOPLEFT"}}, {"id": 229, "text": "head allows the user to position the eyepieces for maximum ", "bbox": {"l": 398.08594, "t": 339.34241, "r": 453.0672, "b": 341.5162, "coord_origin": "TOPLEFT"}}, {"id": 230, "text": "viewing comfort and easy access to all adjustment knobs.", "bbox": {"l": 398.08594, "t": 341.48938, "r": 449.63113, "b": 343.66318, "coord_origin": "TOPLEFT"}}, {"id": 231, "text": "Model AY11236", "bbox": {"l": 422.10626, "t": 301.24191, "r": 434.62433000000004, "b": 302.98096, "coord_origin": "TOPLEFT"}}, {"id": 232, "text": "Fine ", "bbox": {"l": 442.01610999999997, "t": 283.08649, "r": 444.8817399999999, "b": 284.51996, "coord_origin": "TOPLEFT"}}, {"id": 233, "text": "Adjustment", "bbox": {"l": 442.01610999999997, "t": 284.2663, "r": 448.85001, "b": 285.69980000000004, "coord_origin": "TOPLEFT"}}, {"id": 234, "text": "Knob", "bbox": {"l": 442.01610999999997, "t": 285.44611, "r": 445.03033000000005, "b": 286.87961, "coord_origin": "TOPLEFT"}}, {"id": 235, "text": "Stage", "bbox": {"l": 408.00577, "t": 279.12579000000005, "r": 411.42212, "b": 280.5593, "coord_origin": "TOPLEFT"}}, {"id": 236, "text": "Condenser ", "bbox": {"l": 404.07172, "t": 280.9144299999999, "r": 410.77707, "b": 282.3479, "coord_origin": "TOPLEFT"}}, {"id": 237, "text": "Focusing", "bbox": {"l": 404.07172, "t": 282.09424, "r": 409.2157, "b": 283.52774, "coord_origin": "TOPLEFT"}}, {"id": 238, "text": "Knob", "bbox": {"l": 404.07172, "t": 283.27408, "r": 407.08594, "b": 284.7075500000001, "coord_origin": "TOPLEFT"}}, {"id": 239, "text": "Eyepiece", "bbox": {"l": 441.81281, "t": 262.32178, "r": 447.03702, "b": 263.75525000000005, "coord_origin": "TOPLEFT"}}, {"id": 240, "text": "Stand", "bbox": {"l": 437.34607, "t": 271.13025000000005, "r": 440.80496, "b": 272.56281, "coord_origin": "TOPLEFT"}}, {"id": 241, "text": "Lamp ", "bbox": {"l": 409.7164, "t": 284.40027, "r": 413.3768, "b": 285.83282, "coord_origin": "TOPLEFT"}}, {"id": 242, "text": "On/Off", "bbox": {"l": 409.7164, "t": 285.83163, "r": 413.68201, "b": 287.26416, "coord_origin": "TOPLEFT"}}, {"id": 243, "text": "Switch", "bbox": {"l": 409.7164, "t": 287.263, "r": 413.6337, "b": 288.69553, "coord_origin": "TOPLEFT"}}, {"id": 244, "text": "Lamp ", "bbox": {"l": 434.8712499999999, "t": 296.7153, "r": 438.53164999999996, "b": 298.14783, "coord_origin": "TOPLEFT"}}, {"id": 245, "text": "Power", "bbox": {"l": 439.52039, "t": 292.18307000000004, "r": 443.08768, "b": 293.61560000000003, "coord_origin": "TOPLEFT"}}, {"id": 246, "text": "Cord", "bbox": {"l": 439.52039, "t": 293.61444, "r": 442.29575, "b": 295.04697, "coord_origin": "TOPLEFT"}}, {"id": 247, "text": "Rotating Head", "bbox": {"l": 413.55829, "t": 264.66089, "r": 421.94913, "b": 266.09344, "coord_origin": "TOPLEFT"}}, {"id": 248, "text": "Stage Clip", "bbox": {"l": 441.84316999999993, "t": 286.90573, "r": 447.87585000000007, "b": 288.33826, "coord_origin": "TOPLEFT"}}, {"id": 249, "text": "Adjustment", "bbox": {"l": 441.84316999999993, "t": 288.3371, "r": 448.67252, "b": 289.76962000000003, "coord_origin": "TOPLEFT"}}, {"id": 250, "text": "Interpupillary Slide Adjustment", "bbox": {"l": 407.2403, "t": 259.86645999999996, "r": 425.79089, "b": 261.29895, "coord_origin": "TOPLEFT"}}, {"id": 251, "text": "Circling Minimums", "bbox": {"l": 449.10074000000003, "t": 378.66302, "r": 466.08835000000005, "b": 380.78412, "coord_origin": "TOPLEFT"}}, {"id": 252, "text": "7", "bbox": {"l": 449.10074000000003, "t": 383.2203999999999, "r": 449.64444, "b": 385.34148999999996, "coord_origin": "TOPLEFT"}}, {"id": 253, "text": "K H U H Z D V D F K D Q J H W R W K H 7 ( 5 3 6 F U L W H U L D L Q W K D W D \u1087H F W V F L U F O L Q J D U H D G L P H Q V L R Q E \\ H [ S D Q G L Q J W K H D U H D V W R S U R Y L G H ", "bbox": {"l": 450.18811, "t": 383.2203999999999, "r": 550.77124, "b": 385.34148999999996, "coord_origin": "TOPLEFT"}}, {"id": 254, "text": "improved obstacle protection. To indicate that the new criteria had been applied to a given procedure, a ", "bbox": {"l": 449.10074000000003, "t": 385.75732, "r": 536.14716, "b": 387.87842, "coord_origin": "TOPLEFT"}}, {"id": 255, "text": " is placed on ", "bbox": {"l": 538.31085, "t": 385.75732, "r": 549.49921, "b": 387.87842, "coord_origin": "TOPLEFT"}}, {"id": 256, "text": "the circling line of minimums. The new circling tables and explanatory information is located in the Legend of the TPP.", "bbox": {"l": 449.10074000000003, "t": 388.03601, "r": 547.58185, "b": 390.1571, "coord_origin": "TOPLEFT"}}, {"id": 257, "text": "7", "bbox": {"l": 449.10074000000003, "t": 393.2128000000001, "r": 449.6163, "b": 395.33386, "coord_origin": "TOPLEFT"}}, {"id": 258, "text": "K H D S S U R D F K H V X V L Q J V W D Q G D U G F L U F O L Q J D S S U R D F K D U H D V F D Q E H L G H Q W L \u00bf H G E \\ W K H D E V H Q F H R I W K H ", "bbox": {"l": 450.1319, "t": 393.2128000000001, "r": 529.53082, "b": 395.33386, "coord_origin": "TOPLEFT"}}, {"id": 259, "text": " on the circling line of ", "bbox": {"l": 532.05829, "t": 393.2128000000001, "r": 550.42261, "b": 395.33386, "coord_origin": "TOPLEFT"}}, {"id": 260, "text": "minima.", "bbox": {"l": 449.10074000000003, "t": 395.49149, "r": 455.74692, "b": 397.61255, "coord_origin": "TOPLEFT"}}, {"id": 261, "text": "$ S S O \\ 6 W D Q G D U G & L U F O L Q J $ S S U R D F K 0 D Q H X Y H U L Q J 5 D G L X V 7 D E O H ", "bbox": {"l": 449.95525999999995, "t": 415.59549, "r": 496.2829, "b": 417.50446, "coord_origin": "TOPLEFT"}}, {"id": 262, "text": "$ S S O \\ ( [ S D Q G H G & L U F O L Q J $ S S U R D F K 0 D Q H X Y H U L Q J $ L U V S D F H 5 D G L X V ", "bbox": {"l": 501.13077, "t": 409.25543, "r": 551.16101, "b": 411.1644, "coord_origin": "TOPLEFT"}}, {"id": 263, "text": "Table", "bbox": {"l": 501.13077, "t": 411.30624, "r": 505.2477999999999, "b": 413.21521, "coord_origin": "TOPLEFT"}}, {"id": 264, "text": "AIRPORT SKETCH", "bbox": {"l": 449.10074000000003, "t": 420.18802, "r": 469.35599, "b": 422.73331, "coord_origin": "TOPLEFT"}}, {"id": 265, "text": "The airport sketch is a depiction of the airport with emphasis on runway pattern and related ", "bbox": {"l": 449.10074000000003, "t": 425.08908, "r": 525.93616, "b": 427.21017, "coord_origin": "TOPLEFT"}}, {"id": 266, "text": "information, positioned in either the lower left or lower right corner of the chart to aid pi-", "bbox": {"l": 449.10074000000003, "t": 427.3678, "r": 522.0343, "b": 429.48886, "coord_origin": "TOPLEFT"}}, {"id": 267, "text": "lot recognition of the airport from the air and to provide some information to aid on ground ", "bbox": {"l": 449.10074000000003, "t": 429.64648, "r": 524.67151, "b": 431.76755, "coord_origin": "TOPLEFT"}}, {"id": 268, "text": "navigation of the airport. The runways are drawn to scale and oriented to true north. Runway ", "bbox": {"l": 449.10074000000003, "t": 431.92514000000006, "r": 527.172, "b": 434.04623, "coord_origin": "TOPLEFT"}}, {"id": 269, "text": "dimensions (length and width) are shown for all active runways.", "bbox": {"l": 449.10074000000003, "t": 434.20383, "r": 502.39545, "b": 436.32492, "coord_origin": "TOPLEFT"}}, {"id": 270, "text": "Runway(s) are depicted based on what type and construction of the runway.", "bbox": {"l": 449.10074000000003, "t": 438.7611999999999, "r": 512.92676, "b": 440.88228999999995, "coord_origin": "TOPLEFT"}}, {"id": 271, "text": "Hard Surface", "bbox": {"l": 449.95525999999995, "t": 444.07001, "r": 460.02307, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}, {"id": 272, "text": "Other Than ", "bbox": {"l": 464.89963, "t": 444.07001, "r": 473.98819, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}, {"id": 273, "text": "Hard Surface", "bbox": {"l": 464.89963, "t": 446.12085, "r": 474.96744, "b": 448.02979, "coord_origin": "TOPLEFT"}}, {"id": 274, "text": "Metal Surface", "bbox": {"l": 478.91357, "t": 444.07001, "r": 489.45648, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}, {"id": 275, "text": "Closed Runway", "bbox": {"l": 493.06420999999995, "t": 444.07001, "r": 505.03076, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}, {"id": 276, "text": "Under Construction", "bbox": {"l": 509.5809, "t": 444.07001, "r": 524.30237, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}, {"id": 277, "text": "Stopways, ", "bbox": {"l": 449.95525999999995, "t": 454.81207, "r": 458.31406, "b": 456.72104, "coord_origin": "TOPLEFT"}}, {"id": 278, "text": "Taxiways, Park-", "bbox": {"l": 449.95525999999995, "t": 456.86288, "r": 461.92083999999994, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}}, {"id": 279, "text": "ing Areas", "bbox": {"l": 449.95525999999995, "t": 458.91373, "r": 457.08014, "b": 460.82268999999997, "coord_origin": "TOPLEFT"}}, {"id": 280, "text": "Displaced ", "bbox": {"l": 464.89963, "t": 454.81207, "r": 472.87732, "b": 456.72104, "coord_origin": "TOPLEFT"}}, {"id": 281, "text": "Threshold", "bbox": {"l": 464.89963, "t": 456.86288, "r": 472.49792, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}}, {"id": 282, "text": "Closed", "bbox": {"l": 478.91357, "t": 454.81207, "r": 483.61584, "b": 456.72104, "coord_origin": "TOPLEFT"}}, {"id": 283, "text": "Pavement", "bbox": {"l": 478.91357, "t": 456.86288, "r": 486.60754000000003, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}}, {"id": 284, "text": "Water Runway", "bbox": {"l": 493.06420999999995, "t": 454.81207, "r": 504.20648, "b": 456.72104, "coord_origin": "TOPLEFT"}}, {"id": 285, "text": "Taxiways and aprons are shaded grey. Other runway features that may be shown are runway numbers, runway dimen-", "bbox": {"l": 449.10074000000003, "t": 469.32974, "r": 548.59674, "b": 471.45081, "coord_origin": "TOPLEFT"}}, {"id": 286, "text": "sions, runway slope, arresting gear, and displaced threshold.", "bbox": {"l": 449.10074000000003, "t": 471.60843, "r": 500.08181999999994, "b": 473.72949, "coord_origin": "TOPLEFT"}}, {"id": 287, "text": "2", "bbox": {"l": 449.10074000000003, "t": 476.16577, "r": 449.59933000000007, "b": 478.28687, "coord_origin": "TOPLEFT"}}, {"id": 288, "text": "W K H U L Q I R U P D W L R Q F R Q F H U Q L Q J O L J K W L Q J \u00bf Q D O D S S U R D F K E H D U L Q J V D L U S R U W E H D F R Q R E V W D F O H V F R Q W U R O W R Z H U 1 $ 9 $ , ' V K H O L ", "bbox": {"l": 450.09796, "t": 476.16577, "r": 547.82562, "b": 478.28687, "coord_origin": "TOPLEFT"}}, {"id": 289, "text": "-", "bbox": {"l": 547.82623, "t": 476.16577, "r": 548.45862, "b": 478.28687, "coord_origin": "TOPLEFT"}}, {"id": 290, "text": "pads may also be shown.", "bbox": {"l": 449.10074000000003, "t": 478.44446, "r": 470.52609000000007, "b": 480.56555, "coord_origin": "TOPLEFT"}}, {"id": 291, "text": "$ L U S R U W ( O H Y D W L R Q D Q G 7 R X F K G R Z Q = R Q H ( O H Y D W L R Q ", "bbox": {"l": 449.10074000000003, "t": 483.00183, "r": 493.37906000000004, "b": 485.12292, "coord_origin": "TOPLEFT"}}, {"id": 292, "text": "The airport elevation is shown enclosed within a box in the upper left corner of the sketch box and the touchdown zone ", "bbox": {"l": 449.10074000000003, "t": 487.5592, "r": 549.16168, "b": 489.6803, "coord_origin": "TOPLEFT"}}, {"id": 293, "text": "elevation (TDZE) is shown in the upper right corner of the sketch box. The airport elevation is the highest point of an ", "bbox": {"l": 449.10074000000003, "t": 489.83789, "r": 546.90881, "b": 491.95898, "coord_origin": "TOPLEFT"}}, {"id": 294, "text": "D L U S R U W \u00b6 V X V D E O H U X Q Z D \\ V P H D V X U H G L Q I H H W I U R P P H D Q V H D O H Y H O 7 K H 7 ' = ( L V W K H K L J K H V W H O H Y D W L R Q L Q W K H \u00bf U V W I H H W R I ", "bbox": {"l": 449.10074000000003, "t": 492.11658, "r": 551.80023, "b": 494.23767, "coord_origin": "TOPLEFT"}}, {"id": 295, "text": "the landing surface. Circling only approaches will not show a TDZE.", "bbox": {"l": 449.10074000000003, "t": 494.39526, "r": 505.85068000000007, "b": 496.51636, "coord_origin": "TOPLEFT"}}, {"id": 296, "text": "114", "bbox": {"l": 498.80661000000003, "t": 515.9437, "r": 502.08792, "b": 519.01764, "coord_origin": "TOPLEFT"}}, {"id": 297, "text": "FAA Chart Users\u2019 Guide - Terminal Procedures Publication (TPP) - Terms", "bbox": {"l": 444.56319999999994, "t": 422.84869, "r": 446.25998, "b": 471.87128, "coord_origin": "TOPLEFT"}}, {"id": 298, "text": "AGL 2013 Financial Calendar", "bbox": {"l": 329.40536, "t": 379.37537, "r": 355.13138, "b": 382.13336, "coord_origin": "TOPLEFT"}}, {"id": 299, "text": "22", "bbox": {"l": 329.40536, "t": 382.30273, "r": 330.96848, "b": 384.55927, "coord_origin": "TOPLEFT"}}, {"id": 300, "text": "August 2012 ", "bbox": {"l": 331.75003, "t": 382.30273, "r": 341.12875, "b": 384.55927, "coord_origin": "TOPLEFT"}}, {"id": 301, "text": "2012 full year result and fi nal dividend announced", "bbox": {"l": 350.4722, "t": 382.30273, "r": 384.81079, "b": 384.55927, "coord_origin": "TOPLEFT"}}, {"id": 302, "text": "30", "bbox": {"l": 329.40536, "t": 384.84552, "r": 330.97336, "b": 387.10205, "coord_origin": "TOPLEFT"}}, {"id": 303, "text": "August 2012 ", "bbox": {"l": 331.75735, "t": 384.84552, "r": 341.16534, "b": 387.10205, "coord_origin": "TOPLEFT"}}, {"id": 304, "text": "Ex-dividend trading commences", "bbox": {"l": 350.4722, "t": 384.84552, "r": 372.90613, "b": 387.10205, "coord_origin": "TOPLEFT"}}, {"id": 305, "text": "5", "bbox": {"l": 329.40536, "t": 387.38828, "r": 330.20337, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}}, {"id": 306, "text": "September 2012 ", "bbox": {"l": 331.00137, "t": 387.38828, "r": 342.9715, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}}, {"id": 307, "text": "Record date for 2012 fi nal dividend", "bbox": {"l": 350.4722, "t": 387.38828, "r": 374.88693, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}}, {"id": 308, "text": "27", "bbox": {"l": 329.40536, "t": 389.93103, "r": 331.0173, "b": 392.18762, "coord_origin": "TOPLEFT"}}, {"id": 309, "text": "September 2012 ", "bbox": {"l": 331.82327, "t": 389.93103, "r": 343.91284, "b": 392.18762, "coord_origin": "TOPLEFT"}}, {"id": 310, "text": "Final dividend payable", "bbox": {"l": 350.4722, "t": 389.93103, "r": 365.65988, "b": 392.18762, "coord_origin": "TOPLEFT"}}, {"id": 311, "text": "23", "bbox": {"l": 329.40536, "t": 392.47382, "r": 330.98804, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}}, {"id": 312, "text": "October 2012 ", "bbox": {"l": 331.77936, "t": 392.47382, "r": 342.06674, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}}, {"id": 313, "text": "Annual General Meeting", "bbox": {"l": 350.4722, "t": 392.47382, "r": 367.22156, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}}, {"id": 314, "text": "27", "bbox": {"l": 329.40536, "t": 395.0166, "r": 330.99741, "b": 397.27313, "coord_origin": "TOPLEFT"}}, {"id": 315, "text": "February 2013", "bbox": {"l": 331.7934, "t": 395.0166, "r": 342.1416, "b": 397.27313, "coord_origin": "TOPLEFT"}}, {"id": 316, "text": " 1", "bbox": {"l": 342.64841, "t": 395.18298, "r": 342.65811, "b": 396.49857000000003, "coord_origin": "TOPLEFT"}}, {"id": 317, "text": "2013 interim result and interim dividend announced", "bbox": {"l": 350.47177, "t": 395.01474, "r": 386.25897, "b": 397.2713, "coord_origin": "TOPLEFT"}}, {"id": 318, "text": "28", "bbox": {"l": 329.40491, "t": 397.55749999999995, "r": 331.02695, "b": 399.81406, "coord_origin": "TOPLEFT"}}, {"id": 319, "text": "August 2013", "bbox": {"l": 331.83795, "t": 397.55749999999995, "r": 340.75909, "b": 399.81406, "coord_origin": "TOPLEFT"}}, {"id": 320, "text": " 1", "bbox": {"l": 341.26437, "t": 397.7254, "r": 341.27408, "b": 399.04095, "coord_origin": "TOPLEFT"}}, {"id": 321, "text": "2013 full year results and fi nal dividend announced ", "bbox": {"l": 350.47144, "t": 397.55713, "r": 385.93265, "b": 399.81369, "coord_origin": "TOPLEFT"}}, {"id": 322, "text": "1", "bbox": {"l": 329.40536, "t": 400.46155, "r": 329.87708, "b": 401.96588, "coord_origin": "TOPLEFT"}}, {"id": 323, "text": "Indicative dates only, subject to change/Board confi rmation", "bbox": {"l": 330.34882, "t": 400.46155, "r": 358.65204, "b": 401.96588, "coord_origin": "TOPLEFT"}}, {"id": 324, "text": "AGL\u2019s Annual General Meeting will be held at the City Recital Hall, Angel Place, Sydney ", "bbox": {"l": 329.40536, "t": 404.34503, "r": 391.771, "b": 406.60156, "coord_origin": "TOPLEFT"}}, {"id": 325, "text": "commencing at 10.30am on Tuesday 23 October 2012.", "bbox": {"l": 329.40536, "t": 406.37857, "r": 369.65308, "b": 408.63513000000006, "coord_origin": "TOPLEFT"}}, {"id": 326, "text": "Ye s te rd ay", "bbox": {"l": 363.54486, "t": 460.53054999999995, "r": 379.25955, "b": 465.54507, "coord_origin": "TOPLEFT"}}, {"id": 327, "text": "Established in Sydney in 1837, and then ", "bbox": {"l": 363.54486, "t": 466.7157, "r": 391.38229, "b": 468.97223, "coord_origin": "TOPLEFT"}}, {"id": 328, "text": "known as The Australian Gas Light Company, ", "bbox": {"l": 363.54486, "t": 468.74924, "r": 395.01788, "b": 471.00577, "coord_origin": "TOPLEFT"}}, {"id": 329, "text": "the AGL business has an established history ", "bbox": {"l": 363.54486, "t": 470.78281, "r": 394.08322, "b": 473.03934, "coord_origin": "TOPLEFT"}}, {"id": 330, "text": "and reputation for serving the gas and ", "bbox": {"l": 363.54486, "t": 472.81635, "r": 390.60727, "b": 475.07288, "coord_origin": "TOPLEFT"}}, {"id": 331, "text": "electricity needs of Australian households. ", "bbox": {"l": 363.54486, "t": 474.84988, "r": 393.49612, "b": 477.10645, "coord_origin": "TOPLEFT"}}, {"id": 332, "text": "In 1841, when AGL supplied the gas to light ", "bbox": {"l": 363.54486, "t": 476.88345, "r": 394.11481, "b": 479.13998, "coord_origin": "TOPLEFT"}}, {"id": 333, "text": "the fi rst public street lamp, it was reported ", "bbox": {"l": 363.54486, "t": 478.91699, "r": 393.75891, "b": 481.17352, "coord_origin": "TOPLEFT"}}, {"id": 334, "text": "in the Sydney Gazette as a \u201cwonderful ", "bbox": {"l": 363.54486, "t": 480.95053, "r": 390.4975, "b": 483.20709, "coord_origin": "TOPLEFT"}}, {"id": 335, "text": "achievement of scientifi c knowledge, assisted ", "bbox": {"l": 363.54486, "t": 482.9841, "r": 395.70975, "b": 485.24063, "coord_origin": "TOPLEFT"}}, {"id": 336, "text": "by mechanical ingenuity.\u201d Within two years, ", "bbox": {"l": 363.54486, "t": 485.01764, "r": 394.27283, "b": 487.2742, "coord_origin": "TOPLEFT"}}, {"id": 337, "text": "165 gas lamps were lighting the City of Sydney.", "bbox": {"l": 363.54486, "t": 487.05121, "r": 396.65939, "b": 489.30774, "coord_origin": "TOPLEFT"}}, {"id": 338, "text": "Looking back on ", "bbox": {"l": 329.4054, "t": 419.93124, "r": 384.19696, "b": 431.09412, "coord_origin": "TOPLEFT"}}, {"id": 339, "text": "175 years of ", "bbox": {"l": 329.4054, "t": 430.10379, "r": 372.16626, "b": 441.26669, "coord_origin": "TOPLEFT"}}, {"id": 340, "text": "looking forward.", "bbox": {"l": 329.4054, "t": 440.27636999999993, "r": 385.3981, "b": 451.43924, "coord_origin": "TOPLEFT"}}, {"id": 341, "text": "AGL Energy Limited ABN 74 115 061 375", "bbox": {"l": 329.40536, "t": 372.16159, "r": 353.36179, "b": 373.91669, "coord_origin": "TOPLEFT"}}, {"id": 342, "text": "29", "bbox": {"l": 546.20587, "t": 360.90448, "r": 548.23407, "b": 362.82242, "coord_origin": "TOPLEFT"}}, {"id": 343, "text": "signs, signals and road markings", "bbox": {"l": 497.77728, "t": 251.43384000000003, "r": 542.8255, "b": 254.94385, "coord_origin": "TOPLEFT"}}, {"id": 344, "text": "3", "bbox": {"l": 490.30679, "t": 251.47478999999998, "r": 492.09982, "b": 254.98479999999995, "coord_origin": "TOPLEFT"}}, {"id": 345, "text": "In ", "bbox": {"l": 498.15335, "t": 263.88922, "r": 500.05637, "b": 265.92719, "coord_origin": "TOPLEFT"}}, {"id": 346, "text": "chapter 2, you and your vehicle", "bbox": {"l": 500.05637, "t": 263.85717999999997, "r": 524.37036, "b": 265.86310000000003, "coord_origin": "TOPLEFT"}}, {"id": 347, "text": ", you learned about ", "bbox": {"l": 524.37036, "t": 263.88922, "r": 539.89124, "b": 265.92719, "coord_origin": "TOPLEFT"}}, {"id": 348, "text": "some of the controls in your vehicle. This chapter is a handy ", "bbox": {"l": 498.15335, "t": 265.93224999999995, "r": 544.50403, "b": 267.97020999999995, "coord_origin": "TOPLEFT"}}, {"id": 349, "text": "reference section that gives examples of the most common ", "bbox": {"l": 498.15335, "t": 267.97533999999996, "r": 544.01343, "b": 270.01331000000005, "coord_origin": "TOPLEFT"}}, {"id": 350, "text": "signs, signals and road markings that keep traffi c organized ", "bbox": {"l": 498.15335, "t": 270.01831000000004, "r": 544.11987, "b": 272.05634, "coord_origin": "TOPLEFT"}}, {"id": 351, "text": "and flowing smoothly. ", "bbox": {"l": 498.15335, "t": 272.06140000000005, "r": 515.41071, "b": 274.09937, "coord_origin": "TOPLEFT"}}, {"id": 352, "text": "Signs", "bbox": {"l": 498.15335, "t": 277.34619, "r": 505.64642000000003, "b": 280.9357, "coord_origin": "TOPLEFT"}}, {"id": 353, "text": "There are three ways to read signs: by their shape, colour and ", "bbox": {"l": 498.15335, "t": 281.82187, "r": 543.92957, "b": 283.85983, "coord_origin": "TOPLEFT"}}, {"id": 354, "text": "the messages printed on them. Understanding these three ways ", "bbox": {"l": 498.15335, "t": 283.8649, "r": 545.67834, "b": 285.90289, "coord_origin": "TOPLEFT"}}, {"id": 355, "text": "of classifying signs will help you figure out the meaning of signs ", "bbox": {"l": 498.15335, "t": 285.90796, "r": 545.26471, "b": 287.94592, "coord_origin": "TOPLEFT"}}, {"id": 356, "text": "that are new to you. ", "bbox": {"l": 498.15335, "t": 287.95099, "r": 513.31335, "b": 289.98895, "coord_origin": "TOPLEFT"}}, {"id": 357, "text": "Stop", "bbox": {"l": 505.43439, "t": 303.07596, "r": 508.53033000000005, "b": 304.89639, "coord_origin": "TOPLEFT"}}, {"id": 358, "text": "Yield the right-of-way", "bbox": {"l": 527.45502, "t": 303.25354, "r": 541.44678, "b": 305.07397, "coord_origin": "TOPLEFT"}}, {"id": 359, "text": "Shows driving", "bbox": {"l": 501.79385, "t": 321.18973, "r": 510.41632, "b": 323.01016, "coord_origin": "TOPLEFT"}}, {"id": 360, "text": "regulations", "bbox": {"l": 501.79385, "t": 322.87731999999994, "r": 509.04268999999994, "b": 324.69775000000004, "coord_origin": "TOPLEFT"}}, {"id": 361, "text": "Explains lane use", "bbox": {"l": 518.66455, "t": 319.59146, "r": 529.80902, "b": 321.41190000000006, "coord_origin": "TOPLEFT"}}, {"id": 362, "text": "School zone signs ", "bbox": {"l": 534.87561, "t": 318.37616, "r": 546.95142, "b": 320.19659, "coord_origin": "TOPLEFT"}}, {"id": 363, "text": "are fl uorescent ", "bbox": {"l": 534.87561, "t": 320.0637500000001, "r": 545.05762, "b": 321.88419, "coord_origin": "TOPLEFT"}}, {"id": 364, "text": "yellow-green", "bbox": {"l": 534.87561, "t": 321.75134, "r": 543.32263, "b": 323.57178, "coord_origin": "TOPLEFT"}}, {"id": 365, "text": "Tells about motorist ", "bbox": {"l": 499.21862999999996, "t": 338.12772, "r": 512.62451, "b": 339.94815, "coord_origin": "TOPLEFT"}}, {"id": 366, "text": "services", "bbox": {"l": 499.21862999999996, "t": 339.81531000000007, "r": 504.39917, "b": 341.63574, "coord_origin": "TOPLEFT"}}, {"id": 367, "text": "Shows a permitted ", "bbox": {"l": 516.97748, "t": 338.06039, "r": 529.77484, "b": 339.88082999999995, "coord_origin": "TOPLEFT"}}, {"id": 368, "text": "action", "bbox": {"l": 516.97748, "t": 339.74799, "r": 520.96399, "b": 341.56842, "coord_origin": "TOPLEFT"}}, {"id": 369, "text": "Shows an action that ", "bbox": {"l": 534.55847, "t": 337.88281, "r": 548.58453, "b": 339.7032500000001, "coord_origin": "TOPLEFT"}}, {"id": 370, "text": "is not permitted", "bbox": {"l": 534.55847, "t": 339.57040000000006, "r": 545.08862, "b": 341.39084, "coord_origin": "TOPLEFT"}}, {"id": 371, "text": "Warns of hazards ", "bbox": {"l": 483.05853, "t": 356.17416, "r": 494.72577, "b": 357.9946, "coord_origin": "TOPLEFT"}}, {"id": 372, "text": "ahead", "bbox": {"l": 483.05853, "t": 357.86179, "r": 487.07525999999996, "b": 359.68222, "coord_origin": "TOPLEFT"}}, {"id": 373, "text": "Warns of", "bbox": {"l": 499.39645, "t": 356.26297000000005, "r": 504.69171, "b": 358.0834, "coord_origin": "TOPLEFT"}}, {"id": 374, "text": "construction zones", "bbox": {"l": 499.39645, "t": 357.95056, "r": 511.69116, "b": 359.77099999999996, "coord_origin": "TOPLEFT"}}, {"id": 375, "text": "Railway crossing", "bbox": {"l": 516.75891, "t": 356.26297000000005, "r": 527.42938, "b": 358.0834, "coord_origin": "TOPLEFT"}}, {"id": 376, "text": "Shows distance and ", "bbox": {"l": 534.5141, "t": 352.92981, "r": 547.89862, "b": 354.75024, "coord_origin": "TOPLEFT"}}, {"id": 377, "text": "direction", "bbox": {"l": 534.5141, "t": 354.6174, "r": 540.2818, "b": 356.43784, "coord_origin": "TOPLEFT"}}, {"id": 378, "text": "\u2022", "bbox": {"l": 478.37466, "t": 270.14075, "r": 479.14251999999993, "b": 272.17877, "coord_origin": "TOPLEFT"}}, {"id": 379, "text": "Signs", "bbox": {"l": 479.91036999999994, "t": 270.14075, "r": 483.74963, "b": 272.17877, "coord_origin": "TOPLEFT"}}, {"id": 380, "text": "- regulatory signs", "bbox": {"l": 479.97293, "t": 272.84717, "r": 492.31219, "b": 274.34888, "coord_origin": "TOPLEFT"}}, {"id": 381, "text": "- school, ", "bbox": {"l": 479.97293, "t": 275.14513999999997, "r": 486.72598000000005, "b": 276.64679, "coord_origin": "TOPLEFT"}}, {"id": 382, "text": "playground and ", "bbox": {"l": 481.21602999999993, "t": 276.77972, "r": 492.93286000000006, "b": 278.81768999999997, "coord_origin": "TOPLEFT"}}, {"id": 383, "text": "crosswalk signs", "bbox": {"l": 481.21602999999993, "t": 278.82275000000004, "r": 491.82938000000007, "b": 280.86075, "coord_origin": "TOPLEFT"}}, {"id": 384, "text": "- lane use signs", "bbox": {"l": 479.97293, "t": 281.52759, "r": 491.00775000000004, "b": 283.02924, "coord_origin": "TOPLEFT"}}, {"id": 385, "text": "- turn control signs", "bbox": {"l": 479.97293, "t": 283.82556, "r": 493.32748, "b": 285.3272099999999, "coord_origin": "TOPLEFT"}}, {"id": 386, "text": "- parking signs", "bbox": {"l": 479.97293, "t": 286.1235, "r": 490.4915199999999, "b": 287.62518, "coord_origin": "TOPLEFT"}}, {"id": 387, "text": "- reserved lane ", "bbox": {"l": 479.97293, "t": 288.42148, "r": 491.17004000000003, "b": 289.92316, "coord_origin": "TOPLEFT"}}, {"id": 388, "text": "signs", "bbox": {"l": 481.21602999999993, "t": 290.05605999999995, "r": 484.77405000000005, "b": 292.09406, "coord_origin": "TOPLEFT"}}, {"id": 389, "text": "- warning signs", "bbox": {"l": 479.97293, "t": 292.76169000000004, "r": 490.83398, "b": 294.26334, "coord_origin": "TOPLEFT"}}, {"id": 390, "text": "- object markers", "bbox": {"l": 479.97293, "t": 295.05963, "r": 491.62692, "b": 296.56131, "coord_origin": "TOPLEFT"}}, {"id": 391, "text": "- construction ", "bbox": {"l": 479.97293, "t": 297.3576, "r": 490.37341, "b": 298.8592499999999, "coord_origin": "TOPLEFT"}}, {"id": 392, "text": "signs", "bbox": {"l": 481.21602999999993, "t": 298.99219, "r": 484.77405000000005, "b": 301.03015, "coord_origin": "TOPLEFT"}}, {"id": 393, "text": "- information and ", "bbox": {"l": 479.97293, "t": 301.69780999999995, "r": 492.93912, "b": 303.19946, "coord_origin": "TOPLEFT"}}, {"id": 394, "text": "destination signs", "bbox": {"l": 481.21602999999993, "t": 303.3324, "r": 493.00525, "b": 305.37036, "coord_origin": "TOPLEFT"}}, {"id": 395, "text": "- railway signs", "bbox": {"l": 479.97293, "t": 306.0379899999999, "r": 489.99047999999993, "b": 307.53967, "coord_origin": "TOPLEFT"}}, {"id": 396, "text": "\u2022", "bbox": {"l": 478.375, "t": 308.24789, "r": 479.1032400000001, "b": 310.28586, "coord_origin": "TOPLEFT"}}, {"id": 397, "text": "Signals", "bbox": {"l": 479.83151, "t": 308.24789, "r": 484.92925999999994, "b": 310.28586, "coord_origin": "TOPLEFT"}}, {"id": 398, "text": "- lane control ", "bbox": {"l": 479.97293, "t": 310.95358, "r": 490.00091999999995, "b": 312.45526, "coord_origin": "TOPLEFT"}}, {"id": 399, "text": "signals", "bbox": {"l": 481.21602999999993, "t": 312.5881999999999, "r": 485.95331, "b": 314.62616, "coord_origin": "TOPLEFT"}}, {"id": 400, "text": "- traffic lights", "bbox": {"l": 479.97293, "t": 315.29379, "r": 489.29876999999993, "b": 316.79544, "coord_origin": "TOPLEFT"}}, {"id": 401, "text": "\u2022", "bbox": {"l": 478.375, "t": 317.50366, "r": 479.18129999999996, "b": 319.5416599999999, "coord_origin": "TOPLEFT"}}, {"id": 402, "text": "Road markings", "bbox": {"l": 479.98761, "t": 317.50366, "r": 490.46960000000007, "b": 319.5416599999999, "coord_origin": "TOPLEFT"}}, {"id": 403, "text": "- yellow lines", "bbox": {"l": 479.97293, "t": 320.20938, "r": 489.26166000000006, "b": 321.71103, "coord_origin": "TOPLEFT"}}, {"id": 404, "text": "- white lines", "bbox": {"l": 479.97293, "t": 322.50732, "r": 488.59189, "b": 324.009, "coord_origin": "TOPLEFT"}}, {"id": 405, "text": "- reserved lane ", "bbox": {"l": 479.97293, "t": 324.8053, "r": 491.17004000000003, "b": 326.30698, "coord_origin": "TOPLEFT"}}, {"id": 406, "text": "markings", "bbox": {"l": 481.21602999999993, "t": 326.43988, "r": 487.58978, "b": 328.47784, "coord_origin": "TOPLEFT"}}, {"id": 407, "text": "- other markings", "bbox": {"l": 479.97293, "t": 329.14551, "r": 491.75177, "b": 330.64716, "coord_origin": "TOPLEFT"}}, {"id": 408, "text": "in this chapter", "bbox": {"l": 478.15246999999994, "t": 265.07030999999995, "r": 493.75586, "b": 268.06872999999996, "coord_origin": "TOPLEFT"}}], "children": [{"id": 32, "label": "text", "bbox": {"l": 327.86951, "t": 351.78085, "r": 330.41248, "b": 353.95465, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "13", "bbox": {"l": 327.86951, "t": 351.78085, "r": 330.41248, "b": 353.95465, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 327.83005, "t": 331.57268999999997, "r": 351.16092, "b": 333.31171, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "USING THE VERTICAL TUBE -", "bbox": {"l": 327.83005, "t": 331.57268999999997, "r": 351.16092, "b": 333.31171, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 327.83005, "t": 333.18292, "r": 348.30536, "b": 334.92194, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "MODELS AY11230/11234", "bbox": {"l": 327.83005, "t": 333.18292, "r": 348.30536, "b": 334.92194, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 327.83005, "t": 336.40439, "r": 329.05914, "b": 337.92606, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "1.", "bbox": {"l": 327.83005, "t": 336.40439, "r": 329.05914, "b": 337.92606, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 329.67368, "t": 336.40439, "r": 349.95349, "b": 337.92606, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "The vertical tube can be used for", "bbox": {"l": 329.67368, "t": 336.40439, "r": 349.95349, "b": 337.92606, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 329.11752, "t": 337.83588, "r": 353.57977, "b": 339.35751000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "instructional viewing or to photograph", "bbox": {"l": 329.11752, "t": 337.83588, "r": 353.57977, "b": 339.35751000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 327.77121, "t": 339.26736, "r": 352.4306, "b": 340.789, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": " the image with a digital camera or a", "bbox": {"l": 327.77121, "t": 339.26736, "r": 352.4306, "b": 340.789, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 328.15176, "t": 340.69882, "r": 337.91086, "b": 342.22049, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": " micro TV unit", "bbox": {"l": 328.15176, "t": 340.69882, "r": 337.91086, "b": 342.22049, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 327.8313, "t": 342.19043000000005, "r": 329.09155, "b": 343.71207, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "2.", "bbox": {"l": 327.8313, "t": 342.19043000000005, "r": 329.09155, "b": 343.71207, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 329.72168, "t": 342.19043000000005, "r": 354.9267, "b": 343.71207, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "Loosen the retention screw, then rotate ", "bbox": {"l": 329.72168, "t": 342.19043000000005, "r": 354.9267, "b": 343.71207, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 327.8313, "t": 343.62192, "r": 351.66949, "b": 345.14355, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": " the adjustment ring to change the ", "bbox": {"l": 327.8313, "t": 343.62192, "r": 351.66949, "b": 345.14355, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 328.21185, "t": 345.05338, "r": 346.33179, "b": 346.57504, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": " length of the vertical tube.", "bbox": {"l": 328.21185, "t": 345.05338, "r": 346.33179, "b": 346.57504, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 327.83005, "t": 346.84680000000003, "r": 329.12726, "b": 348.36847, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "3.", "bbox": {"l": 327.83005, "t": 346.84680000000003, "r": 329.12726, "b": 348.36847, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 329.77588, "t": 346.84680000000003, "r": 351.18005, "b": 348.36847, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "Make sure that both the images in", "bbox": {"l": 329.77588, "t": 346.84680000000003, "r": 351.18005, "b": 348.36847, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 327.25311, "t": 254.94812000000002, "r": 350.07861, "b": 258.86096, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "OPERATION ", "bbox": {"l": 327.25311, "t": 254.94812000000002, "r": 350.07861, "b": 258.86096, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 350.07861, "t": 254.76782000000003, "r": 351.82651, "b": 258.68066, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "(", "bbox": {"l": 350.07861, "t": 254.76782000000003, "r": 351.82651, "b": 258.68066, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 351.82651, "t": 254.94812000000002, "r": 360.85242, "b": 258.86096, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "cont.", "bbox": {"l": 351.82651, "t": 254.94812000000002, "r": 360.85242, "b": 258.86096, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 360.85242, "t": 254.76782000000003, "r": 362.60028, "b": 258.68066, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": ")", "bbox": {"l": 360.85242, "t": 254.76782000000003, "r": 362.60028, "b": 258.68066, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 326.88037, "t": 263.49492999999995, "r": 345.84351, "b": 265.23395000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "SELECTING OBJECTIVE ", "bbox": {"l": 326.88037, "t": 263.49492999999995, "r": 345.84351, "b": 265.23395000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 326.88037, "t": 265.10515999999996, "r": 340.54153, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "MAGNIFICATION", "bbox": {"l": 326.88037, "t": 265.10515999999996, "r": 340.54153, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 326.88037, "t": 266.71533, "r": 328.31903, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "1.", "bbox": {"l": 326.88037, "t": 266.71533, "r": 328.31903, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 329.03836, "t": 266.71533, "r": 354.21472, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "There are two objectives. The lower", "bbox": {"l": 329.03836, "t": 266.71533, "r": 354.21472, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 326.88037, "t": 268.32556, "r": 355.19193, "b": 270.06458, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": " magnification objective has a greater", "bbox": {"l": 326.88037, "t": 268.32556, "r": 355.19193, "b": 270.06458, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 326.88037, "t": 269.93579, "r": 345.80057, "b": 271.6748, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": " depth of field and view.", "bbox": {"l": 326.88037, "t": 269.93579, "r": 345.80057, "b": 271.6748, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 326.88037, "t": 271.54602, "r": 328.33862, "b": 273.28503, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "2.", "bbox": {"l": 326.88037, "t": 271.54602, "r": 328.33862, "b": 273.28503, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 329.06775, "t": 271.54602, "r": 352.39969, "b": 273.28503, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "In order to observe the specimen", "bbox": {"l": 329.06775, "t": 271.54602, "r": 352.39969, "b": 273.28503, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 326.88037, "t": 273.15619000000004, "r": 352.90042, "b": 274.89526, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": " easily use the lower magnification", "bbox": {"l": 326.88037, "t": 273.15619000000004, "r": 352.90042, "b": 274.89526, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 326.88037, "t": 274.76642000000004, "r": 354.59546, "b": 276.50543000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": " objective first. Then, by rotating the", "bbox": {"l": 326.88037, "t": 274.76642000000004, "r": 354.59546, "b": 276.50543000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 326.88037, "t": 276.37665000000004, "r": 350.81885, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": " case, the magnification can be", "bbox": {"l": 326.88037, "t": 276.37665000000004, "r": 350.81885, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 326.88037, "t": 277.98688000000004, "r": 335.46707, "b": 279.72589000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": " changed.", "bbox": {"l": 326.88037, "t": 277.98688000000004, "r": 335.46707, "b": 279.72589000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 326.88037, "t": 281.20728, "r": 354.57755, "b": 282.94632, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 107, "text": "CHANGING THE INTERPUPILLARY ", "bbox": {"l": 326.88037, "t": 281.20728, "r": 354.57755, "b": 282.94632, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 326.88037, "t": 282.81750000000005, "r": 335.1752, "b": 284.55652, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 108, "text": "DISTANCE", "bbox": {"l": 326.88037, "t": 282.81750000000005, "r": 335.1752, "b": 284.55652, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 326.88037, "t": 284.4277, "r": 328.34784, "b": 286.16675, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 109, "text": "1.", "bbox": {"l": 326.88037, "t": 284.4277, "r": 328.34784, "b": 286.16675, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 329.08157, "t": 284.4277, "r": 354.76245, "b": 286.16675, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 110, "text": "The distance between the observer's", "bbox": {"l": 329.08157, "t": 284.4277, "r": 354.76245, "b": 286.16675, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 326.88037, "t": 286.03793, "r": 354.6499, "b": 287.77695, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 111, "text": " pupils is the interpupillary distance.", "bbox": {"l": 326.88037, "t": 286.03793, "r": 354.6499, "b": 287.77695, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 326.88037, "t": 287.64813, "r": 328.25125, "b": 289.38718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 112, "text": "2.", "bbox": {"l": 326.88037, "t": 287.64813, "r": 328.25125, "b": 289.38718, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 328.93671, "t": 287.64813, "r": 354.29825, "b": 289.38718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 113, "text": "To adjust the interpupillary distance", "bbox": {"l": 328.93671, "t": 287.64813, "r": 354.29825, "b": 289.38718, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 326.88181, "t": 289.25836, "r": 355.02075, "b": 290.99738, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 114, "text": " rotate the prism caps until both eyes", "bbox": {"l": 326.88181, "t": 289.25836, "r": 355.02075, "b": 290.99738, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 326.88181, "t": 290.86855999999995, "r": 350.82028, "b": 292.6076, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 115, "text": " coincide with the image in the", "bbox": {"l": 326.88181, "t": 290.86855999999995, "r": 350.82028, "b": 292.6076, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 326.88181, "t": 292.47879, "r": 336.2067, "b": 294.2178, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 116, "text": " eyepiece. ", "bbox": {"l": 326.88181, "t": 292.47879, "r": 336.2067, "b": 294.2178, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 326.88181, "t": 295.69922, "r": 335.3941, "b": 297.43823, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 117, "text": "FOCUSING", "bbox": {"l": 326.88181, "t": 295.69922, "r": 335.3941, "b": 297.43823, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 326.88181, "t": 297.30942, "r": 328.34314, "b": 299.04846, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 118, "text": "1.", "bbox": {"l": 326.88181, "t": 297.30942, "r": 328.34314, "b": 299.04846, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 329.07379, "t": 297.30942, "r": 353.18555, "b": 299.04846, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 119, "text": "Remove the lens protective cover.", "bbox": {"l": 329.07379, "t": 297.30942, "r": 353.18555, "b": 299.04846, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 326.88324, "t": 298.91965, "r": 328.35919, "b": 300.65866, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 120, "text": "2.", "bbox": {"l": 326.88324, "t": 298.91965, "r": 328.35919, "b": 300.65866, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 329.0972, "t": 298.91965, "r": 353.45065, "b": 300.65866, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 121, "text": "Place the specimen on the working", "bbox": {"l": 329.0972, "t": 298.91965, "r": 353.45065, "b": 300.65866, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 326.88324, "t": 300.52985, "r": 333.32825, "b": 302.26889000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 122, "text": " stage.", "bbox": {"l": 326.88324, "t": 300.52985, "r": 333.32825, "b": 302.26889000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 326.88324, "t": 302.14008000000007, "r": 328.31296, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 123, "text": "3.", "bbox": {"l": 326.88324, "t": 302.14008000000007, "r": 328.31296, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 329.02783, "t": 302.14008000000007, "r": 354.76303, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 124, "text": "Focus the specimen with the left eye", "bbox": {"l": 329.02783, "t": 302.14008000000007, "r": 354.76303, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 326.88324, "t": 303.75027, "r": 355.96307, "b": 305.48932, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 125, "text": " first while turning the focus knob until", "bbox": {"l": 326.88324, "t": 303.75027, "r": 355.96307, "b": 305.48932, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 326.88324, "t": 305.3605, "r": 354.46594, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 126, "text": " the image appears clear and sharp.", "bbox": {"l": 326.88324, "t": 305.3605, "r": 354.46594, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 326.88324, "t": 306.9707, "r": 328.25488, "b": 308.70975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 127, "text": "4.", "bbox": {"l": 326.88324, "t": 306.9707, "r": 328.25488, "b": 308.70975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 328.9407, "t": 306.9707, "r": 356.37335, "b": 308.70975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 128, "text": "Rotate the right eyepiece ring until the", "bbox": {"l": 328.9407, "t": 306.9707, "r": 356.37335, "b": 308.70975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 326.88324, "t": 308.58093, "r": 355.38867, "b": 310.31995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 129, "text": " images in each eyepiece coincide and", "bbox": {"l": 326.88324, "t": 308.58093, "r": 355.38867, "b": 310.31995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 326.88324, "t": 310.19113, "r": 343.17249, "b": 311.93018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 130, "text": " are sharp and clear.", "bbox": {"l": 326.88324, "t": 310.19113, "r": 343.17249, "b": 311.93018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 326.88324, "t": 313.41156, "r": 344.13388, "b": 315.15059999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 131, "text": "CHANGING THE BULB", "bbox": {"l": 326.88324, "t": 313.41156, "r": 344.13388, "b": 315.15059999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 326.88324, "t": 315.02178999999995, "r": 328.37418, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 132, "text": "1.", "bbox": {"l": 326.88324, "t": 315.02178999999995, "r": 328.37418, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 329.11963, "t": 315.02178999999995, "r": 348.50162, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 133, "text": "Disconnect the power cord.", "bbox": {"l": 329.11963, "t": 315.02178999999995, "r": 348.50162, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 326.88324, "t": 316.63199, "r": 328.34061, "b": 318.37103, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 134, "text": "2.", "bbox": {"l": 326.88324, "t": 316.63199, "r": 328.34061, "b": 318.37103, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 329.06931, "t": 316.63199, "r": 353.11588, "b": 318.37103, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 135, "text": "When the bulb is cool, remove the", "bbox": {"l": 329.06931, "t": 316.63199, "r": 353.11588, "b": 318.37103, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 326.88464, "t": 318.2422199999999, "r": 353.79517, "b": 319.9812299999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 136, "text": " oblique illuminator cap and remove", "bbox": {"l": 326.88464, "t": 318.2422199999999, "r": 353.79517, "b": 319.9812299999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 326.88464, "t": 319.85242000000005, "r": 348.02094, "b": 321.59146, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 137, "text": " the halogen bulb with cap.", "bbox": {"l": 326.88464, "t": 319.85242000000005, "r": 348.02094, "b": 321.59146, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 326.88464, "t": 321.46265, "r": 328.37512, "b": 323.20166, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 138, "text": "3.", "bbox": {"l": 326.88464, "t": 321.46265, "r": 328.37512, "b": 323.20166, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 329.12036, "t": 321.46265, "r": 352.96808, "b": 323.20166, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 139, "text": "Replace with a new halogen bulb.", "bbox": {"l": 329.12036, "t": 321.46265, "r": 352.96808, "b": 323.20166, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 326.88608, "t": 323.07285, "r": 328.36884, "b": 324.81189, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 140, "text": "4.", "bbox": {"l": 326.88608, "t": 323.07285, "r": 328.36884, "b": 324.81189, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 329.1102, "t": 323.07285, "r": 356.5412, "b": 324.81189, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 141, "text": "Open the window in the base plate and", "bbox": {"l": 329.1102, "t": 323.07285, "r": 356.5412, "b": 324.81189, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 326.88608, "t": 324.68307000000004, "r": 350.13828, "b": 326.42209, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 142, "text": " replace the halogen lamp or ", "bbox": {"l": 326.88608, "t": 324.68307000000004, "r": 350.13828, "b": 326.42209, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 326.88608, "t": 326.29327, "r": 351.59677, "b": 328.03232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 143, "text": " fluorescent lamp of transmitted", "bbox": {"l": 326.88608, "t": 326.29327, "r": 351.59677, "b": 328.03232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 326.88608, "t": 327.9035, "r": 336.89197, "b": 329.64252, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 144, "text": " illuminator.", "bbox": {"l": 326.88608, "t": 327.9035, "r": 336.89197, "b": 329.64252, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 358.42023, "t": 263.49492999999995, "r": 366.93256, "b": 265.23395000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 145, "text": "FOCUSING", "bbox": {"l": 358.42023, "t": 263.49492999999995, "r": 366.93256, "b": 265.23395000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 358.42023, "t": 265.10515999999996, "r": 359.89841, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 146, "text": "1.", "bbox": {"l": 358.42023, "t": 265.10515999999996, "r": 359.89841, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 360.63751, "t": 265.10515999999996, "r": 387.98407, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 147, "text": "Turn the focusing knob away or toward", "bbox": {"l": 360.63751, "t": 265.10515999999996, "r": 387.98407, "b": 266.84418000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 358.42023, "t": 266.71533, "r": 384.58948, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 148, "text": " you until a clear image is viewed.", "bbox": {"l": 358.42023, "t": 266.71533, "r": 384.58948, "b": 268.45441000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 358.42166, "t": 268.32556, "r": 359.78549, "b": 270.06458, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 149, "text": "2.", "bbox": {"l": 358.42166, "t": 268.32556, "r": 359.78549, "b": 270.06458, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 360.46741, "t": 268.32556, "r": 384.33441, "b": 270.06458, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 150, "text": "If the image is unclear, adjust the", "bbox": {"l": 360.46741, "t": 268.32556, "r": 384.33441, "b": 270.06458, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 358.4231, "t": 269.93579, "r": 384.61502, "b": 271.6748, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 151, "text": " height of the elevator up or down,", "bbox": {"l": 358.4231, "t": 269.93579, "r": 384.61502, "b": 271.6748, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 358.4231, "t": 271.54602, "r": 385.38922, "b": 273.28503, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 152, "text": " then turn the focusing knob again.", "bbox": {"l": 358.4231, "t": 271.54602, "r": 385.38922, "b": 273.28503, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 358.4231, "t": 274.76642000000004, "r": 377.35046, "b": 276.50543000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 153, "text": "ZOOM MAGNIFICATION", "bbox": {"l": 358.4231, "t": 274.76642000000004, "r": 377.35046, "b": 276.50543000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 358.4231, "t": 276.37665000000004, "r": 359.89429, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 154, "text": "1.", "bbox": {"l": 358.4231, "t": 276.37665000000004, "r": 359.89429, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 360.62988, "t": 276.37665000000004, "r": 386.37589, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 155, "text": "Turn the zoom magnification knob to", "bbox": {"l": 360.62988, "t": 276.37665000000004, "r": 386.37589, "b": 278.11566000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 358.4231, "t": 277.98688000000004, "r": 386.78732, "b": 279.72589000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 156, "text": " the desired magnification and field of", "bbox": {"l": 358.4231, "t": 277.98688000000004, "r": 386.78732, "b": 279.72589000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 358.4231, "t": 279.59704999999997, "r": 364.16855, "b": 281.33609, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 157, "text": " view.", "bbox": {"l": 358.4231, "t": 279.59704999999997, "r": 364.16855, "b": 281.33609, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 358.4231, "t": 281.20728, "r": 359.86777, "b": 282.94632, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 158, "text": "2.", "bbox": {"l": 358.4231, "t": 281.20728, "r": 359.86777, "b": 282.94632, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 114, "label": "text", "bbox": {"l": 360.59012, "t": 281.20728, "r": 387.31656, "b": 282.94632, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 159, "text": "In most situations, it is recommended", "bbox": {"l": 360.59012, "t": 281.20728, "r": 387.31656, "b": 282.94632, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 115, "label": "text", "bbox": {"l": 358.4231, "t": 282.81750000000005, "r": 381.56656, "b": 284.55652, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 160, "text": " that you focus at the lowest ", "bbox": {"l": 358.4231, "t": 282.81750000000005, "r": 381.56656, "b": 284.55652, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 116, "label": "text", "bbox": {"l": 358.4231, "t": 284.4277, "r": 386.63403, "b": 286.16675, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 161, "text": " magnification, then move to a higher", "bbox": {"l": 358.4231, "t": 284.4277, "r": 386.63403, "b": 286.16675, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 117, "label": "text", "bbox": {"l": 358.42453, "t": 286.03793, "r": 382.77115, "b": 287.77695, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 162, "text": " magnification and re-focus as ", "bbox": {"l": 358.42453, "t": 286.03793, "r": 382.77115, "b": 287.77695, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 118, "label": "text", "bbox": {"l": 358.42453, "t": 287.64813, "r": 367.98694, "b": 289.38718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 163, "text": " necessary.", "bbox": {"l": 358.42453, "t": 287.64813, "r": 367.98694, "b": 289.38718, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 119, "label": "text", "bbox": {"l": 358.42453, "t": 289.25836, "r": 359.80386, "b": 290.99738, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 164, "text": "3.", "bbox": {"l": 358.42453, "t": 289.25836, "r": 359.80386, "b": 290.99738, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 120, "label": "text", "bbox": {"l": 360.49353, "t": 289.25836, "r": 386.70093, "b": 290.99738, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 165, "text": "If the image is not clear to both eyes", "bbox": {"l": 360.49353, "t": 289.25836, "r": 386.70093, "b": 290.99738, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 121, "label": "text", "bbox": {"l": 358.42453, "t": 290.86855999999995, "r": 388.03534, "b": 292.6076, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 166, "text": " at the same time, the diopter ring may", "bbox": {"l": 358.42453, "t": 290.86855999999995, "r": 388.03534, "b": 292.6076, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 122, "label": "text", "bbox": {"l": 358.42453, "t": 292.47879, "r": 373.13724, "b": 294.2178, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 167, "text": " need adjustment.", "bbox": {"l": 358.42453, "t": 292.47879, "r": 373.13724, "b": 294.2178, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 123, "label": "text", "bbox": {"l": 358.42453, "t": 295.69922, "r": 381.74539, "b": 297.43823, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 168, "text": "DIOPTER RING ADJUSTMENT", "bbox": {"l": 358.42453, "t": 295.69922, "r": 381.74539, "b": 297.43823, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 124, "label": "text", "bbox": {"l": 358.42453, "t": 297.30942, "r": 359.83682, "b": 299.04846, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 169, "text": "1.", "bbox": {"l": 358.42453, "t": 297.30942, "r": 359.83682, "b": 299.04846, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 125, "label": "text", "bbox": {"l": 360.54297, "t": 297.30942, "r": 388.08289, "b": 299.04846, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 170, "text": "To adjust the eyepiece for viewing with", "bbox": {"l": 360.54297, "t": 297.30942, "r": 388.08289, "b": 299.04846, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 126, "label": "text", "bbox": {"l": 358.42453, "t": 298.91965, "r": 382.73251, "b": 300.65866, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 171, "text": " or without eyeglasses and for ", "bbox": {"l": 358.42453, "t": 298.91965, "r": 382.73251, "b": 300.65866, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 127, "label": "text", "bbox": {"l": 358.42453, "t": 300.52985, "r": 387.72266, "b": 302.26889000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 172, "text": " differences in acuity between the right", "bbox": {"l": 358.42453, "t": 300.52985, "r": 387.72266, "b": 302.26889000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 128, "label": "text", "bbox": {"l": 358.42453, "t": 302.14008000000007, "r": 384.1991, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 173, "text": " and left eyes, follow the following", "bbox": {"l": 358.42453, "t": 302.14008000000007, "r": 384.1991, "b": 303.8790900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 129, "label": "text", "bbox": {"l": 358.42453, "t": 303.75027, "r": 364.88672, "b": 305.48932, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 174, "text": " steps:", "bbox": {"l": 358.42453, "t": 303.75027, "r": 364.88672, "b": 305.48932, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 130, "label": "text", "bbox": {"l": 358.42453, "t": 305.3605, "r": 359.95078, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 175, "text": "a.", "bbox": {"l": 358.42453, "t": 305.3605, "r": 359.95078, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 131, "label": "text", "bbox": {"l": 361.47699, "t": 305.3605, "r": 386.65988, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 176, "text": "Observe an image through the left", "bbox": {"l": 361.47699, "t": 305.3605, "r": 386.65988, "b": 307.09952000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 132, "label": "text", "bbox": {"l": 358.42453, "t": 306.9707, "r": 386.7634, "b": 308.70975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 177, "text": " eyepiece and bring a specific point", "bbox": {"l": 358.42453, "t": 306.9707, "r": 386.7634, "b": 308.70975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 133, "label": "text", "bbox": {"l": 358.42453, "t": 308.58093, "r": 385.41354, "b": 310.31995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 178, "text": " into focus using the focus knob.", "bbox": {"l": 358.42453, "t": 308.58093, "r": 385.41354, "b": 310.31995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 134, "label": "text", "bbox": {"l": 358.42453, "t": 310.19113, "r": 359.93304, "b": 311.93018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 179, "text": "b.", "bbox": {"l": 358.42453, "t": 310.19113, "r": 359.93304, "b": 311.93018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 135, "label": "text", "bbox": {"l": 361.44156, "t": 310.19113, "r": 382.56085, "b": 311.93018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 180, "text": "By turning the diopter ring ", "bbox": {"l": 361.44156, "t": 310.19113, "r": 382.56085, "b": 311.93018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 136, "label": "text", "bbox": {"l": 358.42596, "t": 311.80136, "r": 385.4559, "b": 313.54037, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 181, "text": " adjustment for the left eyepiece,", "bbox": {"l": 358.42596, "t": 311.80136, "r": 385.4559, "b": 313.54037, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 137, "label": "text", "bbox": {"l": 358.42596, "t": 313.41156, "r": 384.56122, "b": 315.15059999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 182, "text": " bring the same point into sharp", "bbox": {"l": 358.42596, "t": 313.41156, "r": 384.56122, "b": 315.15059999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 138, "label": "text", "bbox": {"l": 358.42596, "t": 315.02178999999995, "r": 366.74371, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 183, "text": " focus.", "bbox": {"l": 358.42596, "t": 315.02178999999995, "r": 366.74371, "b": 316.76079999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 139, "label": "text", "bbox": {"l": 358.42596, "t": 316.63199, "r": 383.93884, "b": 318.37103, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 184, "text": " c.Then bring the same point into", "bbox": {"l": 358.42596, "t": 316.63199, "r": 383.93884, "b": 318.37103, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 140, "label": "text", "bbox": {"l": 358.42596, "t": 318.2422199999999, "r": 385.69241, "b": 319.9812299999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 185, "text": " focus through the right eyepiece", "bbox": {"l": 358.42596, "t": 318.2422199999999, "r": 385.69241, "b": 319.9812299999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 141, "label": "text", "bbox": {"l": 358.42596, "t": 319.85242000000005, "r": 385.94861, "b": 321.59146, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 186, "text": " by turning the right diopter ring.", "bbox": {"l": 358.42596, "t": 319.85242000000005, "r": 385.94861, "b": 321.59146, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 142, "label": "text", "bbox": {"l": 358.42596, "t": 321.46265, "r": 385.54236, "b": 323.20166, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 187, "text": " d.With more than one viewer, each", "bbox": {"l": 358.42596, "t": 321.46265, "r": 385.54236, "b": 323.20166, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 143, "label": "text", "bbox": {"l": 358.42596, "t": 323.07285, "r": 382.98718, "b": 324.81189, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 188, "text": " viewer should note their own", "bbox": {"l": 358.42596, "t": 323.07285, "r": 382.98718, "b": 324.81189, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 144, "label": "text", "bbox": {"l": 358.42596, "t": 324.68307000000004, "r": 385.06448, "b": 326.42209, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 189, "text": " diopter ring position for the left", "bbox": {"l": 358.42596, "t": 324.68307000000004, "r": 385.06448, "b": 326.42209, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 145, "label": "text", "bbox": {"l": 358.42596, "t": 326.29327, "r": 385.20682, "b": 328.03232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 190, "text": " and right eyepieces, then before", "bbox": {"l": 358.42596, "t": 326.29327, "r": 385.20682, "b": 328.03232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 146, "label": "text", "bbox": {"l": 358.42596, "t": 327.9035, "r": 382.21964, "b": 329.64252, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 191, "text": " viewing set the diopter ring", "bbox": {"l": 358.42596, "t": 327.9035, "r": 382.21964, "b": 329.64252, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 147, "label": "text", "bbox": {"l": 358.42596, "t": 329.5137, "r": 382.63382, "b": 331.25275, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 192, "text": " adjustments to that setting.", "bbox": {"l": 358.42596, "t": 329.5137, "r": 382.63382, "b": 331.25275, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 148, "label": "text", "bbox": {"l": 358.42596, "t": 332.73412999999994, "r": 375.67661, "b": 334.47317999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 193, "text": "CHANGING THE BULB", "bbox": {"l": 358.42596, "t": 332.73412999999994, "r": 375.67661, "b": 334.47317999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 149, "label": "text", "bbox": {"l": 358.42596, "t": 334.34436, "r": 359.90311, "b": 336.08337, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 194, "text": "1.", "bbox": {"l": 358.42596, "t": 334.34436, "r": 359.90311, "b": 336.08337, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 150, "label": "text", "bbox": {"l": 360.64169, "t": 334.34436, "r": 385.75333, "b": 336.08337, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 195, "text": "Disconnect the power cord from the", "bbox": {"l": 360.64169, "t": 334.34436, "r": 385.75333, "b": 336.08337, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 151, "label": "text", "bbox": {"l": 358.42596, "t": 335.95456, "r": 372.01416, "b": 337.6936, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 196, "text": " electrical outlet.", "bbox": {"l": 358.42596, "t": 335.95456, "r": 372.01416, "b": 337.6936, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 152, "label": "text", "bbox": {"l": 358.42596, "t": 337.56479, "r": 359.88327, "b": 339.3038, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 197, "text": "2.", "bbox": {"l": 358.42596, "t": 337.56479, "r": 359.88327, "b": 339.3038, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 153, "label": "text", "bbox": {"l": 360.61191, "t": 337.56479, "r": 384.65726, "b": 339.3038, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 198, "text": "When the bulb is cool, remove the", "bbox": {"l": 360.61191, "t": 337.56479, "r": 384.65726, "b": 339.3038, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 154, "label": "text", "bbox": {"l": 358.42596, "t": 339.17499, "r": 385.33649, "b": 340.9140300000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 199, "text": " oblique illuminator cap and remove", "bbox": {"l": 358.42596, "t": 339.17499, "r": 385.33649, "b": 340.9140300000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 155, "label": "text", "bbox": {"l": 358.42596, "t": 340.78522, "r": 379.57224, "b": 342.52423, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 200, "text": " the halogen bulb with cap.", "bbox": {"l": 358.42596, "t": 340.78522, "r": 379.57224, "b": 342.52423, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 156, "label": "text", "bbox": {"l": 358.4274, "t": 342.39542, "r": 359.91788, "b": 344.13446000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 201, "text": "3.", "bbox": {"l": 358.4274, "t": 342.39542, "r": 359.91788, "b": 344.13446000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 157, "label": "text", "bbox": {"l": 360.66312, "t": 342.39542, "r": 384.5108, "b": 344.13446000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 202, "text": "Replace with a new halogen bulb.", "bbox": {"l": 360.66312, "t": 342.39542, "r": 384.5108, "b": 344.13446000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 158, "label": "text", "bbox": {"l": 358.42883, "t": 344.00565000000006, "r": 359.92792, "b": 345.74466, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 203, "text": "4.", "bbox": {"l": 358.42883, "t": 344.00565000000006, "r": 359.92792, "b": 345.74466, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 159, "label": "text", "bbox": {"l": 360.67746, "t": 344.00565000000006, "r": 385.41235, "b": 345.74466, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 204, "text": "Open the window in the base plate", "bbox": {"l": 360.67746, "t": 344.00565000000006, "r": 385.41235, "b": 345.74466, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 160, "label": "text", "bbox": {"l": 358.42883, "t": 345.61584, "r": 383.2782, "b": 347.35489, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 205, "text": " and replace the halogen lamp or", "bbox": {"l": 358.42883, "t": 345.61584, "r": 383.2782, "b": 347.35489, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 161, "label": "text", "bbox": {"l": 358.42883, "t": 347.22607, "r": 383.13953, "b": 348.96509, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 206, "text": " fluorescent lamp of transmitted", "bbox": {"l": 358.42883, "t": 347.22607, "r": 383.13953, "b": 348.96509, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 162, "label": "text", "bbox": {"l": 358.42883, "t": 348.83627, "r": 368.43472, "b": 350.57532, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 207, "text": " illuminator.", "bbox": {"l": 358.42883, "t": 348.83627, "r": 368.43472, "b": 350.57532, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 163, "label": "text", "bbox": {"l": 326.59567, "t": 261.14185, "r": 339.11377, "b": 262.88091999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 208, "text": "Model AY11230", "bbox": {"l": 326.59567, "t": 261.14185, "r": 339.11377, "b": 262.88091999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 164, "label": "text", "bbox": {"l": 358.48605, "t": 261.14185, "r": 371.00415, "b": 262.88091999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 209, "text": "Model AY11234", "bbox": {"l": 358.48605, "t": 261.14185, "r": 371.00415, "b": 262.88091999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 165, "label": "text", "bbox": {"l": 455.43533, "t": 351.77038999999996, "r": 457.97827000000007, "b": 353.94415, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 210, "text": "14", "bbox": {"l": 455.43533, "t": 351.77038999999996, "r": 457.97827000000007, "b": 353.94415, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 166, "label": "text", "bbox": {"l": 408.24518, "t": 275.52673000000004, "r": 414.4234, "b": 276.96020999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 211, "text": "Objectives", "bbox": {"l": 408.24518, "t": 275.52673000000004, "r": 414.4234, "b": 276.96020999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 167, "label": "text", "bbox": {"l": 409.39554, "t": 268.98235999999997, "r": 419.06677, "b": 270.41583, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 212, "text": "Revolving Turret", "bbox": {"l": 409.39554, "t": 268.98235999999997, "r": 419.06677, "b": 270.41583, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 168, "label": "text", "bbox": {"l": 441.3895, "t": 279.12627999999995, "r": 445.87192, "b": 280.55975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 213, "text": "Coarse ", "bbox": {"l": 441.3895, "t": 279.12627999999995, "r": 445.87192, "b": 280.55975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 169, "label": "text", "bbox": {"l": 441.3895, "t": 280.30609, "r": 448.22338999999994, "b": 281.7395900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 214, "text": "Adjustment", "bbox": {"l": 441.3895, "t": 280.30609, "r": 448.22338999999994, "b": 281.7395900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 170, "label": "text", "bbox": {"l": 441.3895, "t": 281.48593, "r": 444.40371999999996, "b": 282.91939999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 215, "text": "Knob", "bbox": {"l": 441.3895, "t": 281.48593, "r": 444.40371999999996, "b": 282.91939999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 171, "label": "text", "bbox": {"l": 398.79288, "t": 254.94646999999998, "r": 428.91568, "b": 258.85931000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 216, "text": "MODEL AY11236", "bbox": {"l": 398.79288, "t": 254.94646999999998, "r": 428.91568, "b": 258.85931000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 172, "label": "text", "bbox": {"l": 398.32535, "t": 305.04291, "r": 435.93542, "b": 308.95572000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 217, "text": "MICROSCOPE USAGE", "bbox": {"l": 398.32535, "t": 305.04291, "r": 435.93542, "b": 308.95572000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 173, "label": "text", "bbox": {"l": 398.08594, "t": 310.35892, "r": 453.72171, "b": 312.53271, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 218, "text": "BARSKA Model AY11236 is a powerful fixed power compound ", "bbox": {"l": 398.08594, "t": 310.35892, "r": 453.72171, "b": 312.53271, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 174, "label": "text", "bbox": {"l": 398.08594, "t": 312.50586, "r": 453.09939999999995, "b": 314.67966, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 219, "text": "microscope designed for biological studies such as specimen ", "bbox": {"l": 398.08594, "t": 312.50586, "r": 453.09939999999995, "b": 314.67966, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 175, "label": "text", "bbox": {"l": 398.08594, "t": 314.6528, "r": 456.65246999999994, "b": 316.8266, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 220, "text": "examination. It can also be used for examining bacteria and", "bbox": {"l": 398.08594, "t": 314.6528, "r": 456.65246999999994, "b": 316.8266, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 176, "label": "text", "bbox": {"l": 398.08594, "t": 316.79977, "r": 456.73859000000004, "b": 318.97354, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 221, "text": "for general clinical and medical studies and other scientific uses. ", "bbox": {"l": 398.08594, "t": 316.79977, "r": 456.73859000000004, "b": 318.97354, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 177, "label": "text", "bbox": {"l": 398.62399, "t": 320.42941, "r": 427.77472, "b": 324.34222000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 222, "text": "CONSTRUCTION", "bbox": {"l": 398.62399, "t": 320.42941, "r": 427.77472, "b": 324.34222000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 178, "label": "text", "bbox": {"l": 398.08594, "t": 326.46069000000006, "r": 456.02639999999997, "b": 328.63449, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 223, "text": "BARSKA Model AY11236 is a fixed power compound microscope.", "bbox": {"l": 398.08594, "t": 326.46069000000006, "r": 456.02639999999997, "b": 328.63449, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 179, "label": "text", "bbox": {"l": 398.08414, "t": 328.6076699999999, "r": 455.42238999999995, "b": 330.7814599999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 224, "text": "It is constructed with two optical paths at the same angle. It is ", "bbox": {"l": 398.08414, "t": 328.6076699999999, "r": 455.42238999999995, "b": 330.7814599999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 180, "label": "text", "bbox": {"l": 398.08414, "t": 330.75461, "r": 457.39844, "b": 332.92841, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 225, "text": "equipped with transmitted illumination. By using this instrument, ", "bbox": {"l": 398.08414, "t": 330.75461, "r": 457.39844, "b": 332.92841, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 181, "label": "text", "bbox": {"l": 398.08414, "t": 332.90155, "r": 453.97745, "b": 335.07535000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 226, "text": "the user can observe specimens at magnification from 40x to ", "bbox": {"l": 398.08414, "t": 332.90155, "r": 453.97745, "b": 335.07535000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 182, "label": "text", "bbox": {"l": 398.08414, "t": 335.04852, "r": 454.70708999999994, "b": 337.22232, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 227, "text": "1000x by selecting the desired objective lens. Coarse and fine ", "bbox": {"l": 398.08414, "t": 335.04852, "r": 454.70708999999994, "b": 337.22232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 183, "label": "text", "bbox": {"l": 398.08414, "t": 337.19547, "r": 458.90240000000006, "b": 339.36926, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 228, "text": "focus adjustments provide accuracy and image detail. The rotating ", "bbox": {"l": 398.08414, "t": 337.19547, "r": 458.90240000000006, "b": 339.36926, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 184, "label": "text", "bbox": {"l": 398.08594, "t": 339.34241, "r": 453.0672, "b": 341.5162, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 229, "text": "head allows the user to position the eyepieces for maximum ", "bbox": {"l": 398.08594, "t": 339.34241, "r": 453.0672, "b": 341.5162, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 185, "label": "text", "bbox": {"l": 398.08594, "t": 341.48938, "r": 449.63113, "b": 343.66318, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 230, "text": "viewing comfort and easy access to all adjustment knobs.", "bbox": {"l": 398.08594, "t": 341.48938, "r": 449.63113, "b": 343.66318, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 186, "label": "text", "bbox": {"l": 422.10626, "t": 301.24191, "r": 434.62433000000004, "b": 302.98096, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 231, "text": "Model AY11236", "bbox": {"l": 422.10626, "t": 301.24191, "r": 434.62433000000004, "b": 302.98096, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 187, "label": "text", "bbox": {"l": 442.01610999999997, "t": 283.08649, "r": 444.8817399999999, "b": 284.51996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 232, "text": "Fine ", "bbox": {"l": 442.01610999999997, "t": 283.08649, "r": 444.8817399999999, "b": 284.51996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 188, "label": "text", "bbox": {"l": 442.01610999999997, "t": 284.2663, "r": 448.85001, "b": 285.69980000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 233, "text": "Adjustment", "bbox": {"l": 442.01610999999997, "t": 284.2663, "r": 448.85001, "b": 285.69980000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 189, "label": "text", "bbox": {"l": 442.01610999999997, "t": 285.44611, "r": 445.03033000000005, "b": 286.87961, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 234, "text": "Knob", "bbox": {"l": 442.01610999999997, "t": 285.44611, "r": 445.03033000000005, "b": 286.87961, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 190, "label": "text", "bbox": {"l": 408.00577, "t": 279.12579000000005, "r": 411.42212, "b": 280.5593, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 235, "text": "Stage", "bbox": {"l": 408.00577, "t": 279.12579000000005, "r": 411.42212, "b": 280.5593, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 191, "label": "text", "bbox": {"l": 404.07172, "t": 280.9144299999999, "r": 410.77707, "b": 282.3479, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 236, "text": "Condenser ", "bbox": {"l": 404.07172, "t": 280.9144299999999, "r": 410.77707, "b": 282.3479, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 192, "label": "text", "bbox": {"l": 404.07172, "t": 282.09424, "r": 409.2157, "b": 283.52774, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 237, "text": "Focusing", "bbox": {"l": 404.07172, "t": 282.09424, "r": 409.2157, "b": 283.52774, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 193, "label": "text", "bbox": {"l": 404.07172, "t": 283.27408, "r": 407.08594, "b": 284.7075500000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 238, "text": "Knob", "bbox": {"l": 404.07172, "t": 283.27408, "r": 407.08594, "b": 284.7075500000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 194, "label": "text", "bbox": {"l": 441.81281, "t": 262.32178, "r": 447.03702, "b": 263.75525000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 239, "text": "Eyepiece", "bbox": {"l": 441.81281, "t": 262.32178, "r": 447.03702, "b": 263.75525000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 195, "label": "text", "bbox": {"l": 437.34607, "t": 271.13025000000005, "r": 440.80496, "b": 272.56281, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 240, "text": "Stand", "bbox": {"l": 437.34607, "t": 271.13025000000005, "r": 440.80496, "b": 272.56281, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 196, "label": "text", "bbox": {"l": 409.7164, "t": 284.40027, "r": 413.3768, "b": 285.83282, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 241, "text": "Lamp ", "bbox": {"l": 409.7164, "t": 284.40027, "r": 413.3768, "b": 285.83282, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 197, "label": "text", "bbox": {"l": 409.7164, "t": 285.83163, "r": 413.68201, "b": 287.26416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 242, "text": "On/Off", "bbox": {"l": 409.7164, "t": 285.83163, "r": 413.68201, "b": 287.26416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 198, "label": "text", "bbox": {"l": 409.7164, "t": 287.263, "r": 413.6337, "b": 288.69553, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 243, "text": "Switch", "bbox": {"l": 409.7164, "t": 287.263, "r": 413.6337, "b": 288.69553, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 199, "label": "text", "bbox": {"l": 434.8712499999999, "t": 296.7153, "r": 438.53164999999996, "b": 298.14783, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 244, "text": "Lamp ", "bbox": {"l": 434.8712499999999, "t": 296.7153, "r": 438.53164999999996, "b": 298.14783, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 200, "label": "text", "bbox": {"l": 439.52039, "t": 292.18307000000004, "r": 443.08768, "b": 293.61560000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 245, "text": "Power", "bbox": {"l": 439.52039, "t": 292.18307000000004, "r": 443.08768, "b": 293.61560000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 201, "label": "text", "bbox": {"l": 439.52039, "t": 293.61444, "r": 442.29575, "b": 295.04697, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 246, "text": "Cord", "bbox": {"l": 439.52039, "t": 293.61444, "r": 442.29575, "b": 295.04697, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 202, "label": "text", "bbox": {"l": 413.55829, "t": 264.66089, "r": 421.94913, "b": 266.09344, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 247, "text": "Rotating Head", "bbox": {"l": 413.55829, "t": 264.66089, "r": 421.94913, "b": 266.09344, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 203, "label": "text", "bbox": {"l": 441.84316999999993, "t": 286.90573, "r": 447.87585000000007, "b": 288.33826, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 248, "text": "Stage Clip", "bbox": {"l": 441.84316999999993, "t": 286.90573, "r": 447.87585000000007, "b": 288.33826, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 204, "label": "text", "bbox": {"l": 441.84316999999993, "t": 288.3371, "r": 448.67252, "b": 289.76962000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 249, "text": "Adjustment", "bbox": {"l": 441.84316999999993, "t": 288.3371, "r": 448.67252, "b": 289.76962000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 205, "label": "text", "bbox": {"l": 407.2403, "t": 259.86645999999996, "r": 425.79089, "b": 261.29895, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 250, "text": "Interpupillary Slide Adjustment", "bbox": {"l": 407.2403, "t": 259.86645999999996, "r": 425.79089, "b": 261.29895, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 206, "label": "text", "bbox": {"l": 449.10074000000003, "t": 378.66302, "r": 466.08835000000005, "b": 380.78412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 251, "text": "Circling Minimums", "bbox": {"l": 449.10074000000003, "t": 378.66302, "r": 466.08835000000005, "b": 380.78412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 207, "label": "text", "bbox": {"l": 449.10074000000003, "t": 383.2203999999999, "r": 449.64444, "b": 385.34148999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 252, "text": "7", "bbox": {"l": 449.10074000000003, "t": 383.2203999999999, "r": 449.64444, "b": 385.34148999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 208, "label": "text", "bbox": {"l": 450.18811, "t": 383.2203999999999, "r": 550.77124, "b": 385.34148999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 253, "text": "K H U H Z D V D F K D Q J H W R W K H 7 ( 5 3 6 F U L W H U L D L Q W K D W D \u1087H F W V F L U F O L Q J D U H D G L P H Q V L R Q E \\ H [ S D Q G L Q J W K H D U H D V W R S U R Y L G H ", "bbox": {"l": 450.18811, "t": 383.2203999999999, "r": 550.77124, "b": 385.34148999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 209, "label": "text", "bbox": {"l": 449.10074000000003, "t": 385.75732, "r": 536.14716, "b": 387.87842, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 254, "text": "improved obstacle protection. To indicate that the new criteria had been applied to a given procedure, a ", "bbox": {"l": 449.10074000000003, "t": 385.75732, "r": 536.14716, "b": 387.87842, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 210, "label": "text", "bbox": {"l": 538.31085, "t": 385.75732, "r": 549.49921, "b": 387.87842, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 255, "text": " is placed on ", "bbox": {"l": 538.31085, "t": 385.75732, "r": 549.49921, "b": 387.87842, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 211, "label": "text", "bbox": {"l": 449.10074000000003, "t": 388.03601, "r": 547.58185, "b": 390.1571, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 256, "text": "the circling line of minimums. The new circling tables and explanatory information is located in the Legend of the TPP.", "bbox": {"l": 449.10074000000003, "t": 388.03601, "r": 547.58185, "b": 390.1571, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 212, "label": "text", "bbox": {"l": 449.10074000000003, "t": 393.2128000000001, "r": 449.6163, "b": 395.33386, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 257, "text": "7", "bbox": {"l": 449.10074000000003, "t": 393.2128000000001, "r": 449.6163, "b": 395.33386, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 213, "label": "text", "bbox": {"l": 450.1319, "t": 393.2128000000001, "r": 529.53082, "b": 395.33386, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 258, "text": "K H D S S U R D F K H V X V L Q J V W D Q G D U G F L U F O L Q J D S S U R D F K D U H D V F D Q E H L G H Q W L \u00bf H G E \\ W K H D E V H Q F H R I W K H ", "bbox": {"l": 450.1319, "t": 393.2128000000001, "r": 529.53082, "b": 395.33386, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 214, "label": "text", "bbox": {"l": 532.05829, "t": 393.2128000000001, "r": 550.42261, "b": 395.33386, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 259, "text": " on the circling line of ", "bbox": {"l": 532.05829, "t": 393.2128000000001, "r": 550.42261, "b": 395.33386, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 215, "label": "text", "bbox": {"l": 449.10074000000003, "t": 395.49149, "r": 455.74692, "b": 397.61255, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 260, "text": "minima.", "bbox": {"l": 449.10074000000003, "t": 395.49149, "r": 455.74692, "b": 397.61255, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 216, "label": "text", "bbox": {"l": 449.95525999999995, "t": 415.59549, "r": 496.2829, "b": 417.50446, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 261, "text": "$ S S O \\ 6 W D Q G D U G & L U F O L Q J $ S S U R D F K 0 D Q H X Y H U L Q J 5 D G L X V 7 D E O H ", "bbox": {"l": 449.95525999999995, "t": 415.59549, "r": 496.2829, "b": 417.50446, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 217, "label": "text", "bbox": {"l": 501.13077, "t": 409.25543, "r": 551.16101, "b": 411.1644, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 262, "text": "$ S S O \\ ( [ S D Q G H G & L U F O L Q J $ S S U R D F K 0 D Q H X Y H U L Q J $ L U V S D F H 5 D G L X V ", "bbox": {"l": 501.13077, "t": 409.25543, "r": 551.16101, "b": 411.1644, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 218, "label": "text", "bbox": {"l": 501.13077, "t": 411.30624, "r": 505.2477999999999, "b": 413.21521, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 263, "text": "Table", "bbox": {"l": 501.13077, "t": 411.30624, "r": 505.2477999999999, "b": 413.21521, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 219, "label": "text", "bbox": {"l": 449.10074000000003, "t": 420.18802, "r": 469.35599, "b": 422.73331, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 264, "text": "AIRPORT SKETCH", "bbox": {"l": 449.10074000000003, "t": 420.18802, "r": 469.35599, "b": 422.73331, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 220, "label": "text", "bbox": {"l": 449.10074000000003, "t": 425.08908, "r": 525.93616, "b": 427.21017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 265, "text": "The airport sketch is a depiction of the airport with emphasis on runway pattern and related ", "bbox": {"l": 449.10074000000003, "t": 425.08908, "r": 525.93616, "b": 427.21017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 221, "label": "text", "bbox": {"l": 449.10074000000003, "t": 427.3678, "r": 522.0343, "b": 429.48886, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 266, "text": "information, positioned in either the lower left or lower right corner of the chart to aid pi-", "bbox": {"l": 449.10074000000003, "t": 427.3678, "r": 522.0343, "b": 429.48886, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 222, "label": "text", "bbox": {"l": 449.10074000000003, "t": 429.64648, "r": 524.67151, "b": 431.76755, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 267, "text": "lot recognition of the airport from the air and to provide some information to aid on ground ", "bbox": {"l": 449.10074000000003, "t": 429.64648, "r": 524.67151, "b": 431.76755, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 223, "label": "text", "bbox": {"l": 449.10074000000003, "t": 431.92514000000006, "r": 527.172, "b": 434.04623, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 268, "text": "navigation of the airport. The runways are drawn to scale and oriented to true north. Runway ", "bbox": {"l": 449.10074000000003, "t": 431.92514000000006, "r": 527.172, "b": 434.04623, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 224, "label": "text", "bbox": {"l": 449.10074000000003, "t": 434.20383, "r": 502.39545, "b": 436.32492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 269, "text": "dimensions (length and width) are shown for all active runways.", "bbox": {"l": 449.10074000000003, "t": 434.20383, "r": 502.39545, "b": 436.32492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 225, "label": "text", "bbox": {"l": 449.10074000000003, "t": 438.7611999999999, "r": 512.92676, "b": 440.88228999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 270, "text": "Runway(s) are depicted based on what type and construction of the runway.", "bbox": {"l": 449.10074000000003, "t": 438.7611999999999, "r": 512.92676, "b": 440.88228999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 226, "label": "text", "bbox": {"l": 449.95525999999995, "t": 444.07001, "r": 460.02307, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 271, "text": "Hard Surface", "bbox": {"l": 449.95525999999995, "t": 444.07001, "r": 460.02307, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 227, "label": "text", "bbox": {"l": 464.89963, "t": 444.07001, "r": 473.98819, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 272, "text": "Other Than ", "bbox": {"l": 464.89963, "t": 444.07001, "r": 473.98819, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 228, "label": "text", "bbox": {"l": 464.89963, "t": 446.12085, "r": 474.96744, "b": 448.02979, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 273, "text": "Hard Surface", "bbox": {"l": 464.89963, "t": 446.12085, "r": 474.96744, "b": 448.02979, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 229, "label": "text", "bbox": {"l": 478.91357, "t": 444.07001, "r": 489.45648, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 274, "text": "Metal Surface", "bbox": {"l": 478.91357, "t": 444.07001, "r": 489.45648, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 230, "label": "text", "bbox": {"l": 493.06420999999995, "t": 444.07001, "r": 505.03076, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 275, "text": "Closed Runway", "bbox": {"l": 493.06420999999995, "t": 444.07001, "r": 505.03076, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 231, "label": "text", "bbox": {"l": 509.5809, "t": 444.07001, "r": 524.30237, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 276, "text": "Under Construction", "bbox": {"l": 509.5809, "t": 444.07001, "r": 524.30237, "b": 445.97900000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 232, "label": "text", "bbox": {"l": 449.95525999999995, "t": 454.81207, "r": 458.31406, "b": 456.72104, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 277, "text": "Stopways, ", "bbox": {"l": 449.95525999999995, "t": 454.81207, "r": 458.31406, "b": 456.72104, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 233, "label": "text", "bbox": {"l": 449.95525999999995, "t": 456.86288, "r": 461.92083999999994, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 278, "text": "Taxiways, Park-", "bbox": {"l": 449.95525999999995, "t": 456.86288, "r": 461.92083999999994, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 234, "label": "text", "bbox": {"l": 449.95525999999995, "t": 458.91373, "r": 457.08014, "b": 460.82268999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 279, "text": "ing Areas", "bbox": {"l": 449.95525999999995, "t": 458.91373, "r": 457.08014, "b": 460.82268999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 235, "label": "text", "bbox": {"l": 464.89963, "t": 454.81207, "r": 472.87732, "b": 456.72104, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 280, "text": "Displaced ", "bbox": {"l": 464.89963, "t": 454.81207, "r": 472.87732, "b": 456.72104, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 236, "label": "text", "bbox": {"l": 464.89963, "t": 456.86288, "r": 472.49792, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 281, "text": "Threshold", "bbox": {"l": 464.89963, "t": 456.86288, "r": 472.49792, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 237, "label": "text", "bbox": {"l": 478.91357, "t": 454.81207, "r": 483.61584, "b": 456.72104, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 282, "text": "Closed", "bbox": {"l": 478.91357, "t": 454.81207, "r": 483.61584, "b": 456.72104, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 238, "label": "text", "bbox": {"l": 478.91357, "t": 456.86288, "r": 486.60754000000003, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 283, "text": "Pavement", "bbox": {"l": 478.91357, "t": 456.86288, "r": 486.60754000000003, "b": 458.77185000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 239, "label": "text", "bbox": {"l": 493.06420999999995, "t": 454.81207, "r": 504.20648, "b": 456.72104, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 284, "text": "Water Runway", "bbox": {"l": 493.06420999999995, "t": 454.81207, "r": 504.20648, "b": 456.72104, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 240, "label": "text", "bbox": {"l": 449.10074000000003, "t": 469.32974, "r": 548.59674, "b": 471.45081, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 285, "text": "Taxiways and aprons are shaded grey. Other runway features that may be shown are runway numbers, runway dimen-", "bbox": {"l": 449.10074000000003, "t": 469.32974, "r": 548.59674, "b": 471.45081, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 241, "label": "text", "bbox": {"l": 449.10074000000003, "t": 471.60843, "r": 500.08181999999994, "b": 473.72949, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 286, "text": "sions, runway slope, arresting gear, and displaced threshold.", "bbox": {"l": 449.10074000000003, "t": 471.60843, "r": 500.08181999999994, "b": 473.72949, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 242, "label": "text", "bbox": {"l": 449.10074000000003, "t": 476.16577, "r": 449.59933000000007, "b": 478.28687, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 287, "text": "2", "bbox": {"l": 449.10074000000003, "t": 476.16577, "r": 449.59933000000007, "b": 478.28687, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 243, "label": "text", "bbox": {"l": 450.09796, "t": 476.16577, "r": 547.82562, "b": 478.28687, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 288, "text": "W K H U L Q I R U P D W L R Q F R Q F H U Q L Q J O L J K W L Q J \u00bf Q D O D S S U R D F K E H D U L Q J V D L U S R U W E H D F R Q R E V W D F O H V F R Q W U R O W R Z H U 1 $ 9 $ , ' V K H O L ", "bbox": {"l": 450.09796, "t": 476.16577, "r": 547.82562, "b": 478.28687, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 244, "label": "text", "bbox": {"l": 547.82623, "t": 476.16577, "r": 548.45862, "b": 478.28687, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 289, "text": "-", "bbox": {"l": 547.82623, "t": 476.16577, "r": 548.45862, "b": 478.28687, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 245, "label": "text", "bbox": {"l": 449.10074000000003, "t": 478.44446, "r": 470.52609000000007, "b": 480.56555, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 290, "text": "pads may also be shown.", "bbox": {"l": 449.10074000000003, "t": 478.44446, "r": 470.52609000000007, "b": 480.56555, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 246, "label": "text", "bbox": {"l": 449.10074000000003, "t": 483.00183, "r": 493.37906000000004, "b": 485.12292, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 291, "text": "$ L U S R U W ( O H Y D W L R Q D Q G 7 R X F K G R Z Q = R Q H ( O H Y D W L R Q ", "bbox": {"l": 449.10074000000003, "t": 483.00183, "r": 493.37906000000004, "b": 485.12292, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 449.10074000000003, "t": 487.5592, "r": 551.80023, "b": 496.51636, "coord_origin": "TOPLEFT"}, "confidence": 0.5027860403060913, "cells": [{"id": 292, "text": "The airport elevation is shown enclosed within a box in the upper left corner of the sketch box and the touchdown zone ", "bbox": {"l": 449.10074000000003, "t": 487.5592, "r": 549.16168, "b": 489.6803, "coord_origin": "TOPLEFT"}}, {"id": 293, "text": "elevation (TDZE) is shown in the upper right corner of the sketch box. The airport elevation is the highest point of an ", "bbox": {"l": 449.10074000000003, "t": 489.83789, "r": 546.90881, "b": 491.95898, "coord_origin": "TOPLEFT"}}, {"id": 294, "text": "D L U S R U W \u00b6 V X V D E O H U X Q Z D \\ V P H D V X U H G L Q I H H W I U R P P H D Q V H D O H Y H O 7 K H 7 ' = ( L V W K H K L J K H V W H O H Y D W L R Q L Q W K H \u00bf U V W I H H W R I ", "bbox": {"l": 449.10074000000003, "t": 492.11658, "r": 551.80023, "b": 494.23767, "coord_origin": "TOPLEFT"}}, {"id": 295, "text": "the landing surface. Circling only approaches will not show a TDZE.", "bbox": {"l": 449.10074000000003, "t": 494.39526, "r": 505.85068000000007, "b": 496.51636, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 247, "label": "text", "bbox": {"l": 498.80661000000003, "t": 515.9437, "r": 502.08792, "b": 519.01764, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 296, "text": "114", "bbox": {"l": 498.80661000000003, "t": 515.9437, "r": 502.08792, "b": 519.01764, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 248, "label": "text", "bbox": {"l": 444.56319999999994, "t": 422.84869, "r": 446.25998, "b": 471.87128, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 297, "text": "FAA Chart Users\u2019 Guide - Terminal Procedures Publication (TPP) - Terms", "bbox": {"l": 444.56319999999994, "t": 422.84869, "r": 446.25998, "b": 471.87128, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 249, "label": "text", "bbox": {"l": 329.40536, "t": 379.37537, "r": 355.13138, "b": 382.13336, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 298, "text": "AGL 2013 Financial Calendar", "bbox": {"l": 329.40536, "t": 379.37537, "r": 355.13138, "b": 382.13336, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 250, "label": "text", "bbox": {"l": 329.40536, "t": 382.30273, "r": 330.96848, "b": 384.55927, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 299, "text": "22", "bbox": {"l": 329.40536, "t": 382.30273, "r": 330.96848, "b": 384.55927, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 251, "label": "text", "bbox": {"l": 331.75003, "t": 382.30273, "r": 341.12875, "b": 384.55927, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 300, "text": "August 2012 ", "bbox": {"l": 331.75003, "t": 382.30273, "r": 341.12875, "b": 384.55927, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 252, "label": "text", "bbox": {"l": 350.4722, "t": 382.30273, "r": 384.81079, "b": 384.55927, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 301, "text": "2012 full year result and fi nal dividend announced", "bbox": {"l": 350.4722, "t": 382.30273, "r": 384.81079, "b": 384.55927, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 253, "label": "text", "bbox": {"l": 329.40536, "t": 384.84552, "r": 330.97336, "b": 387.10205, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 302, "text": "30", "bbox": {"l": 329.40536, "t": 384.84552, "r": 330.97336, "b": 387.10205, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 254, "label": "text", "bbox": {"l": 331.75735, "t": 384.84552, "r": 341.16534, "b": 387.10205, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 303, "text": "August 2012 ", "bbox": {"l": 331.75735, "t": 384.84552, "r": 341.16534, "b": 387.10205, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 255, "label": "text", "bbox": {"l": 350.4722, "t": 384.84552, "r": 372.90613, "b": 387.10205, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 304, "text": "Ex-dividend trading commences", "bbox": {"l": 350.4722, "t": 384.84552, "r": 372.90613, "b": 387.10205, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 256, "label": "text", "bbox": {"l": 329.40536, "t": 387.38828, "r": 330.20337, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 305, "text": "5", "bbox": {"l": 329.40536, "t": 387.38828, "r": 330.20337, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 257, "label": "text", "bbox": {"l": 331.00137, "t": 387.38828, "r": 342.9715, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 306, "text": "September 2012 ", "bbox": {"l": 331.00137, "t": 387.38828, "r": 342.9715, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 258, "label": "text", "bbox": {"l": 350.4722, "t": 387.38828, "r": 374.88693, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 307, "text": "Record date for 2012 fi nal dividend", "bbox": {"l": 350.4722, "t": 387.38828, "r": 374.88693, "b": 389.64483999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 259, "label": "text", "bbox": {"l": 329.40536, "t": 389.93103, "r": 331.0173, "b": 392.18762, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 308, "text": "27", "bbox": {"l": 329.40536, "t": 389.93103, "r": 331.0173, "b": 392.18762, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 260, "label": "text", "bbox": {"l": 331.82327, "t": 389.93103, "r": 343.91284, "b": 392.18762, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 309, "text": "September 2012 ", "bbox": {"l": 331.82327, "t": 389.93103, "r": 343.91284, "b": 392.18762, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 261, "label": "text", "bbox": {"l": 350.4722, "t": 389.93103, "r": 365.65988, "b": 392.18762, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 310, "text": "Final dividend payable", "bbox": {"l": 350.4722, "t": 389.93103, "r": 365.65988, "b": 392.18762, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 262, "label": "text", "bbox": {"l": 329.40536, "t": 392.47382, "r": 330.98804, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 311, "text": "23", "bbox": {"l": 329.40536, "t": 392.47382, "r": 330.98804, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 263, "label": "text", "bbox": {"l": 331.77936, "t": 392.47382, "r": 342.06674, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 312, "text": "October 2012 ", "bbox": {"l": 331.77936, "t": 392.47382, "r": 342.06674, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 264, "label": "text", "bbox": {"l": 350.4722, "t": 392.47382, "r": 367.22156, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 313, "text": "Annual General Meeting", "bbox": {"l": 350.4722, "t": 392.47382, "r": 367.22156, "b": 394.73037999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 265, "label": "text", "bbox": {"l": 329.40536, "t": 395.0166, "r": 330.99741, "b": 397.27313, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 314, "text": "27", "bbox": {"l": 329.40536, "t": 395.0166, "r": 330.99741, "b": 397.27313, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 266, "label": "text", "bbox": {"l": 331.7934, "t": 395.0166, "r": 342.1416, "b": 397.27313, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 315, "text": "February 2013", "bbox": {"l": 331.7934, "t": 395.0166, "r": 342.1416, "b": 397.27313, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 267, "label": "text", "bbox": {"l": 342.64841, "t": 395.18298, "r": 342.65811, "b": 396.49857000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 316, "text": " 1", "bbox": {"l": 342.64841, "t": 395.18298, "r": 342.65811, "b": 396.49857000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 268, "label": "text", "bbox": {"l": 350.47177, "t": 395.01474, "r": 386.25897, "b": 397.2713, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 317, "text": "2013 interim result and interim dividend announced", "bbox": {"l": 350.47177, "t": 395.01474, "r": 386.25897, "b": 397.2713, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 269, "label": "text", "bbox": {"l": 329.40491, "t": 397.55749999999995, "r": 331.02695, "b": 399.81406, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 318, "text": "28", "bbox": {"l": 329.40491, "t": 397.55749999999995, "r": 331.02695, "b": 399.81406, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 270, "label": "text", "bbox": {"l": 331.83795, "t": 397.55749999999995, "r": 340.75909, "b": 399.81406, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 319, "text": "August 2013", "bbox": {"l": 331.83795, "t": 397.55749999999995, "r": 340.75909, "b": 399.81406, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 271, "label": "text", "bbox": {"l": 341.26437, "t": 397.7254, "r": 341.27408, "b": 399.04095, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 320, "text": " 1", "bbox": {"l": 341.26437, "t": 397.7254, "r": 341.27408, "b": 399.04095, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 272, "label": "text", "bbox": {"l": 350.47144, "t": 397.55713, "r": 385.93265, "b": 399.81369, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 321, "text": "2013 full year results and fi nal dividend announced ", "bbox": {"l": 350.47144, "t": 397.55713, "r": 385.93265, "b": 399.81369, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 273, "label": "text", "bbox": {"l": 329.40536, "t": 400.46155, "r": 329.87708, "b": 401.96588, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 322, "text": "1", "bbox": {"l": 329.40536, "t": 400.46155, "r": 329.87708, "b": 401.96588, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 274, "label": "text", "bbox": {"l": 330.34882, "t": 400.46155, "r": 358.65204, "b": 401.96588, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 323, "text": "Indicative dates only, subject to change/Board confi rmation", "bbox": {"l": 330.34882, "t": 400.46155, "r": 358.65204, "b": 401.96588, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 275, "label": "text", "bbox": {"l": 329.40536, "t": 404.34503, "r": 391.771, "b": 406.60156, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 324, "text": "AGL\u2019s Annual General Meeting will be held at the City Recital Hall, Angel Place, Sydney ", "bbox": {"l": 329.40536, "t": 404.34503, "r": 391.771, "b": 406.60156, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 276, "label": "text", "bbox": {"l": 329.40536, "t": 406.37857, "r": 369.65308, "b": 408.63513000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 325, "text": "commencing at 10.30am on Tuesday 23 October 2012.", "bbox": {"l": 329.40536, "t": 406.37857, "r": 369.65308, "b": 408.63513000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 277, "label": "text", "bbox": {"l": 363.54486, "t": 460.53054999999995, "r": 379.25955, "b": 465.54507, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 326, "text": "Ye s te rd ay", "bbox": {"l": 363.54486, "t": 460.53054999999995, "r": 379.25955, "b": 465.54507, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 278, "label": "text", "bbox": {"l": 363.54486, "t": 466.7157, "r": 391.38229, "b": 468.97223, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 327, "text": "Established in Sydney in 1837, and then ", "bbox": {"l": 363.54486, "t": 466.7157, "r": 391.38229, "b": 468.97223, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 279, "label": "text", "bbox": {"l": 363.54486, "t": 468.74924, "r": 395.01788, "b": 471.00577, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 328, "text": "known as The Australian Gas Light Company, ", "bbox": {"l": 363.54486, "t": 468.74924, "r": 395.01788, "b": 471.00577, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 280, "label": "text", "bbox": {"l": 363.54486, "t": 470.78281, "r": 394.08322, "b": 473.03934, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 329, "text": "the AGL business has an established history ", "bbox": {"l": 363.54486, "t": 470.78281, "r": 394.08322, "b": 473.03934, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 281, "label": "text", "bbox": {"l": 363.54486, "t": 472.81635, "r": 390.60727, "b": 475.07288, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 330, "text": "and reputation for serving the gas and ", "bbox": {"l": 363.54486, "t": 472.81635, "r": 390.60727, "b": 475.07288, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 282, "label": "text", "bbox": {"l": 363.54486, "t": 474.84988, "r": 393.49612, "b": 477.10645, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 331, "text": "electricity needs of Australian households. ", "bbox": {"l": 363.54486, "t": 474.84988, "r": 393.49612, "b": 477.10645, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 283, "label": "text", "bbox": {"l": 363.54486, "t": 476.88345, "r": 394.11481, "b": 479.13998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 332, "text": "In 1841, when AGL supplied the gas to light ", "bbox": {"l": 363.54486, "t": 476.88345, "r": 394.11481, "b": 479.13998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 284, "label": "text", "bbox": {"l": 363.54486, "t": 478.91699, "r": 393.75891, "b": 481.17352, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 333, "text": "the fi rst public street lamp, it was reported ", "bbox": {"l": 363.54486, "t": 478.91699, "r": 393.75891, "b": 481.17352, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 285, "label": "text", "bbox": {"l": 363.54486, "t": 480.95053, "r": 390.4975, "b": 483.20709, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 334, "text": "in the Sydney Gazette as a \u201cwonderful ", "bbox": {"l": 363.54486, "t": 480.95053, "r": 390.4975, "b": 483.20709, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 286, "label": "text", "bbox": {"l": 363.54486, "t": 482.9841, "r": 395.70975, "b": 485.24063, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 335, "text": "achievement of scientifi c knowledge, assisted ", "bbox": {"l": 363.54486, "t": 482.9841, "r": 395.70975, "b": 485.24063, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 287, "label": "text", "bbox": {"l": 363.54486, "t": 485.01764, "r": 394.27283, "b": 487.2742, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 336, "text": "by mechanical ingenuity.\u201d Within two years, ", "bbox": {"l": 363.54486, "t": 485.01764, "r": 394.27283, "b": 487.2742, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 288, "label": "text", "bbox": {"l": 363.54486, "t": 487.05121, "r": 396.65939, "b": 489.30774, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 337, "text": "165 gas lamps were lighting the City of Sydney.", "bbox": {"l": 363.54486, "t": 487.05121, "r": 396.65939, "b": 489.30774, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 289, "label": "text", "bbox": {"l": 329.4054, "t": 419.93124, "r": 384.19696, "b": 431.09412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 338, "text": "Looking back on ", "bbox": {"l": 329.4054, "t": 419.93124, "r": 384.19696, "b": 431.09412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 290, "label": "text", "bbox": {"l": 329.4054, "t": 430.10379, "r": 372.16626, "b": 441.26669, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 339, "text": "175 years of ", "bbox": {"l": 329.4054, "t": 430.10379, "r": 372.16626, "b": 441.26669, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 291, "label": "text", "bbox": {"l": 329.4054, "t": 440.27636999999993, "r": 385.3981, "b": 451.43924, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 340, "text": "looking forward.", "bbox": {"l": 329.4054, "t": 440.27636999999993, "r": 385.3981, "b": 451.43924, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 292, "label": "text", "bbox": {"l": 329.40536, "t": 372.16159, "r": 353.36179, "b": 373.91669, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 341, "text": "AGL Energy Limited ABN 74 115 061 375", "bbox": {"l": 329.40536, "t": 372.16159, "r": 353.36179, "b": 373.91669, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 293, "label": "text", "bbox": {"l": 546.20587, "t": 360.90448, "r": 548.23407, "b": 362.82242, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 342, "text": "29", "bbox": {"l": 546.20587, "t": 360.90448, "r": 548.23407, "b": 362.82242, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 294, "label": "text", "bbox": {"l": 497.77728, "t": 251.43384000000003, "r": 542.8255, "b": 254.94385, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 343, "text": "signs, signals and road markings", "bbox": {"l": 497.77728, "t": 251.43384000000003, "r": 542.8255, "b": 254.94385, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 295, "label": "text", "bbox": {"l": 490.30679, "t": 251.47478999999998, "r": 492.09982, "b": 254.98479999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 344, "text": "3", "bbox": {"l": 490.30679, "t": 251.47478999999998, "r": 492.09982, "b": 254.98479999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 296, "label": "text", "bbox": {"l": 498.15335, "t": 263.88922, "r": 500.05637, "b": 265.92719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 345, "text": "In ", "bbox": {"l": 498.15335, "t": 263.88922, "r": 500.05637, "b": 265.92719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 297, "label": "text", "bbox": {"l": 500.05637, "t": 263.85717999999997, "r": 524.37036, "b": 265.86310000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 346, "text": "chapter 2, you and your vehicle", "bbox": {"l": 500.05637, "t": 263.85717999999997, "r": 524.37036, "b": 265.86310000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 298, "label": "text", "bbox": {"l": 524.37036, "t": 263.88922, "r": 539.89124, "b": 265.92719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 347, "text": ", you learned about ", "bbox": {"l": 524.37036, "t": 263.88922, "r": 539.89124, "b": 265.92719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 299, "label": "text", "bbox": {"l": 498.15335, "t": 265.93224999999995, "r": 544.50403, "b": 267.97020999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 348, "text": "some of the controls in your vehicle. This chapter is a handy ", "bbox": {"l": 498.15335, "t": 265.93224999999995, "r": 544.50403, "b": 267.97020999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 300, "label": "text", "bbox": {"l": 498.15335, "t": 267.97533999999996, "r": 544.01343, "b": 270.01331000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 349, "text": "reference section that gives examples of the most common ", "bbox": {"l": 498.15335, "t": 267.97533999999996, "r": 544.01343, "b": 270.01331000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 301, "label": "text", "bbox": {"l": 498.15335, "t": 270.01831000000004, "r": 544.11987, "b": 272.05634, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 350, "text": "signs, signals and road markings that keep traffi c organized ", "bbox": {"l": 498.15335, "t": 270.01831000000004, "r": 544.11987, "b": 272.05634, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 302, "label": "text", "bbox": {"l": 498.15335, "t": 272.06140000000005, "r": 515.41071, "b": 274.09937, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 351, "text": "and flowing smoothly. ", "bbox": {"l": 498.15335, "t": 272.06140000000005, "r": 515.41071, "b": 274.09937, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 303, "label": "text", "bbox": {"l": 498.15335, "t": 277.34619, "r": 505.64642000000003, "b": 280.9357, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 352, "text": "Signs", "bbox": {"l": 498.15335, "t": 277.34619, "r": 505.64642000000003, "b": 280.9357, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 304, "label": "text", "bbox": {"l": 498.15335, "t": 281.82187, "r": 543.92957, "b": 283.85983, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 353, "text": "There are three ways to read signs: by their shape, colour and ", "bbox": {"l": 498.15335, "t": 281.82187, "r": 543.92957, "b": 283.85983, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 305, "label": "text", "bbox": {"l": 498.15335, "t": 283.8649, "r": 545.67834, "b": 285.90289, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 354, "text": "the messages printed on them. Understanding these three ways ", "bbox": {"l": 498.15335, "t": 283.8649, "r": 545.67834, "b": 285.90289, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 306, "label": "text", "bbox": {"l": 498.15335, "t": 285.90796, "r": 545.26471, "b": 287.94592, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 355, "text": "of classifying signs will help you figure out the meaning of signs ", "bbox": {"l": 498.15335, "t": 285.90796, "r": 545.26471, "b": 287.94592, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 307, "label": "text", "bbox": {"l": 498.15335, "t": 287.95099, "r": 513.31335, "b": 289.98895, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 356, "text": "that are new to you. ", "bbox": {"l": 498.15335, "t": 287.95099, "r": 513.31335, "b": 289.98895, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 308, "label": "text", "bbox": {"l": 505.43439, "t": 303.07596, "r": 508.53033000000005, "b": 304.89639, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 357, "text": "Stop", "bbox": {"l": 505.43439, "t": 303.07596, "r": 508.53033000000005, "b": 304.89639, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 309, "label": "text", "bbox": {"l": 527.45502, "t": 303.25354, "r": 541.44678, "b": 305.07397, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 358, "text": "Yield the right-of-way", "bbox": {"l": 527.45502, "t": 303.25354, "r": 541.44678, "b": 305.07397, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 310, "label": "text", "bbox": {"l": 501.79385, "t": 321.18973, "r": 510.41632, "b": 323.01016, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 359, "text": "Shows driving", "bbox": {"l": 501.79385, "t": 321.18973, "r": 510.41632, "b": 323.01016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 311, "label": "text", "bbox": {"l": 501.79385, "t": 322.87731999999994, "r": 509.04268999999994, "b": 324.69775000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 360, "text": "regulations", "bbox": {"l": 501.79385, "t": 322.87731999999994, "r": 509.04268999999994, "b": 324.69775000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 312, "label": "text", "bbox": {"l": 518.66455, "t": 319.59146, "r": 529.80902, "b": 321.41190000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 361, "text": "Explains lane use", "bbox": {"l": 518.66455, "t": 319.59146, "r": 529.80902, "b": 321.41190000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 313, "label": "text", "bbox": {"l": 534.87561, "t": 318.37616, "r": 546.95142, "b": 320.19659, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 362, "text": "School zone signs ", "bbox": {"l": 534.87561, "t": 318.37616, "r": 546.95142, "b": 320.19659, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 314, "label": "text", "bbox": {"l": 534.87561, "t": 320.0637500000001, "r": 545.05762, "b": 321.88419, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 363, "text": "are fl uorescent ", "bbox": {"l": 534.87561, "t": 320.0637500000001, "r": 545.05762, "b": 321.88419, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 315, "label": "text", "bbox": {"l": 534.87561, "t": 321.75134, "r": 543.32263, "b": 323.57178, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 364, "text": "yellow-green", "bbox": {"l": 534.87561, "t": 321.75134, "r": 543.32263, "b": 323.57178, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 316, "label": "text", "bbox": {"l": 499.21862999999996, "t": 338.12772, "r": 512.62451, "b": 339.94815, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 365, "text": "Tells about motorist ", "bbox": {"l": 499.21862999999996, "t": 338.12772, "r": 512.62451, "b": 339.94815, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 317, "label": "text", "bbox": {"l": 499.21862999999996, "t": 339.81531000000007, "r": 504.39917, "b": 341.63574, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 366, "text": "services", "bbox": {"l": 499.21862999999996, "t": 339.81531000000007, "r": 504.39917, "b": 341.63574, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 318, "label": "text", "bbox": {"l": 516.97748, "t": 338.06039, "r": 529.77484, "b": 339.88082999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 367, "text": "Shows a permitted ", "bbox": {"l": 516.97748, "t": 338.06039, "r": 529.77484, "b": 339.88082999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 319, "label": "text", "bbox": {"l": 516.97748, "t": 339.74799, "r": 520.96399, "b": 341.56842, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 368, "text": "action", "bbox": {"l": 516.97748, "t": 339.74799, "r": 520.96399, "b": 341.56842, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 320, "label": "text", "bbox": {"l": 534.55847, "t": 337.88281, "r": 548.58453, "b": 339.7032500000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 369, "text": "Shows an action that ", "bbox": {"l": 534.55847, "t": 337.88281, "r": 548.58453, "b": 339.7032500000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 321, "label": "text", "bbox": {"l": 534.55847, "t": 339.57040000000006, "r": 545.08862, "b": 341.39084, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 370, "text": "is not permitted", "bbox": {"l": 534.55847, "t": 339.57040000000006, "r": 545.08862, "b": 341.39084, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 322, "label": "text", "bbox": {"l": 483.05853, "t": 356.17416, "r": 494.72577, "b": 357.9946, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 371, "text": "Warns of hazards ", "bbox": {"l": 483.05853, "t": 356.17416, "r": 494.72577, "b": 357.9946, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 323, "label": "text", "bbox": {"l": 483.05853, "t": 357.86179, "r": 487.07525999999996, "b": 359.68222, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 372, "text": "ahead", "bbox": {"l": 483.05853, "t": 357.86179, "r": 487.07525999999996, "b": 359.68222, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 324, "label": "text", "bbox": {"l": 499.39645, "t": 356.26297000000005, "r": 504.69171, "b": 358.0834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 373, "text": "Warns of", "bbox": {"l": 499.39645, "t": 356.26297000000005, "r": 504.69171, "b": 358.0834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 325, "label": "text", "bbox": {"l": 499.39645, "t": 357.95056, "r": 511.69116, "b": 359.77099999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 374, "text": "construction zones", "bbox": {"l": 499.39645, "t": 357.95056, "r": 511.69116, "b": 359.77099999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 326, "label": "text", "bbox": {"l": 516.75891, "t": 356.26297000000005, "r": 527.42938, "b": 358.0834, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 375, "text": "Railway crossing", "bbox": {"l": 516.75891, "t": 356.26297000000005, "r": 527.42938, "b": 358.0834, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 327, "label": "text", "bbox": {"l": 534.5141, "t": 352.92981, "r": 547.89862, "b": 354.75024, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 376, "text": "Shows distance and ", "bbox": {"l": 534.5141, "t": 352.92981, "r": 547.89862, "b": 354.75024, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 328, "label": "text", "bbox": {"l": 534.5141, "t": 354.6174, "r": 540.2818, "b": 356.43784, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 377, "text": "direction", "bbox": {"l": 534.5141, "t": 354.6174, "r": 540.2818, "b": 356.43784, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 329, "label": "text", "bbox": {"l": 478.37466, "t": 270.14075, "r": 479.14251999999993, "b": 272.17877, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 378, "text": "\u2022", "bbox": {"l": 478.37466, "t": 270.14075, "r": 479.14251999999993, "b": 272.17877, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 330, "label": "text", "bbox": {"l": 479.91036999999994, "t": 270.14075, "r": 483.74963, "b": 272.17877, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 379, "text": "Signs", "bbox": {"l": 479.91036999999994, "t": 270.14075, "r": 483.74963, "b": 272.17877, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 331, "label": "text", "bbox": {"l": 479.97293, "t": 272.84717, "r": 492.31219, "b": 274.34888, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 380, "text": "- regulatory signs", "bbox": {"l": 479.97293, "t": 272.84717, "r": 492.31219, "b": 274.34888, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 332, "label": "text", "bbox": {"l": 479.97293, "t": 275.14513999999997, "r": 486.72598000000005, "b": 276.64679, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 381, "text": "- school, ", "bbox": {"l": 479.97293, "t": 275.14513999999997, "r": 486.72598000000005, "b": 276.64679, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 333, "label": "text", "bbox": {"l": 481.21602999999993, "t": 276.77972, "r": 492.93286000000006, "b": 278.81768999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 382, "text": "playground and ", "bbox": {"l": 481.21602999999993, "t": 276.77972, "r": 492.93286000000006, "b": 278.81768999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 334, "label": "text", "bbox": {"l": 481.21602999999993, "t": 278.82275000000004, "r": 491.82938000000007, "b": 280.86075, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 383, "text": "crosswalk signs", "bbox": {"l": 481.21602999999993, "t": 278.82275000000004, "r": 491.82938000000007, "b": 280.86075, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 335, "label": "text", "bbox": {"l": 479.97293, "t": 281.52759, "r": 491.00775000000004, "b": 283.02924, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 384, "text": "- lane use signs", "bbox": {"l": 479.97293, "t": 281.52759, "r": 491.00775000000004, "b": 283.02924, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 336, "label": "text", "bbox": {"l": 479.97293, "t": 283.82556, "r": 493.32748, "b": 285.3272099999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 385, "text": "- turn control signs", "bbox": {"l": 479.97293, "t": 283.82556, "r": 493.32748, "b": 285.3272099999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 337, "label": "text", "bbox": {"l": 479.97293, "t": 286.1235, "r": 490.4915199999999, "b": 287.62518, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 386, "text": "- parking signs", "bbox": {"l": 479.97293, "t": 286.1235, "r": 490.4915199999999, "b": 287.62518, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 338, "label": "text", "bbox": {"l": 479.97293, "t": 288.42148, "r": 491.17004000000003, "b": 289.92316, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 387, "text": "- reserved lane ", "bbox": {"l": 479.97293, "t": 288.42148, "r": 491.17004000000003, "b": 289.92316, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 339, "label": "text", "bbox": {"l": 481.21602999999993, "t": 290.05605999999995, "r": 484.77405000000005, "b": 292.09406, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 388, "text": "signs", "bbox": {"l": 481.21602999999993, "t": 290.05605999999995, "r": 484.77405000000005, "b": 292.09406, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 340, "label": "text", "bbox": {"l": 479.97293, "t": 292.76169000000004, "r": 490.83398, "b": 294.26334, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 389, "text": "- warning signs", "bbox": {"l": 479.97293, "t": 292.76169000000004, "r": 490.83398, "b": 294.26334, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 341, "label": "text", "bbox": {"l": 479.97293, "t": 295.05963, "r": 491.62692, "b": 296.56131, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 390, "text": "- object markers", "bbox": {"l": 479.97293, "t": 295.05963, "r": 491.62692, "b": 296.56131, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 342, "label": "text", "bbox": {"l": 479.97293, "t": 297.3576, "r": 490.37341, "b": 298.8592499999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 391, "text": "- construction ", "bbox": {"l": 479.97293, "t": 297.3576, "r": 490.37341, "b": 298.8592499999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 343, "label": "text", "bbox": {"l": 481.21602999999993, "t": 298.99219, "r": 484.77405000000005, "b": 301.03015, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 392, "text": "signs", "bbox": {"l": 481.21602999999993, "t": 298.99219, "r": 484.77405000000005, "b": 301.03015, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 344, "label": "text", "bbox": {"l": 479.97293, "t": 301.69780999999995, "r": 492.93912, "b": 303.19946, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 393, "text": "- information and ", "bbox": {"l": 479.97293, "t": 301.69780999999995, "r": 492.93912, "b": 303.19946, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 345, "label": "text", "bbox": {"l": 481.21602999999993, "t": 303.3324, "r": 493.00525, "b": 305.37036, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 394, "text": "destination signs", "bbox": {"l": 481.21602999999993, "t": 303.3324, "r": 493.00525, "b": 305.37036, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 346, "label": "text", "bbox": {"l": 479.97293, "t": 306.0379899999999, "r": 489.99047999999993, "b": 307.53967, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 395, "text": "- railway signs", "bbox": {"l": 479.97293, "t": 306.0379899999999, "r": 489.99047999999993, "b": 307.53967, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 347, "label": "text", "bbox": {"l": 478.375, "t": 308.24789, "r": 479.1032400000001, "b": 310.28586, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 396, "text": "\u2022", "bbox": {"l": 478.375, "t": 308.24789, "r": 479.1032400000001, "b": 310.28586, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 348, "label": "text", "bbox": {"l": 479.83151, "t": 308.24789, "r": 484.92925999999994, "b": 310.28586, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 397, "text": "Signals", "bbox": {"l": 479.83151, "t": 308.24789, "r": 484.92925999999994, "b": 310.28586, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 349, "label": "text", "bbox": {"l": 479.97293, "t": 310.95358, "r": 490.00091999999995, "b": 312.45526, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 398, "text": "- lane control ", "bbox": {"l": 479.97293, "t": 310.95358, "r": 490.00091999999995, "b": 312.45526, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 350, "label": "text", "bbox": {"l": 481.21602999999993, "t": 312.5881999999999, "r": 485.95331, "b": 314.62616, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 399, "text": "signals", "bbox": {"l": 481.21602999999993, "t": 312.5881999999999, "r": 485.95331, "b": 314.62616, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 351, "label": "text", "bbox": {"l": 479.97293, "t": 315.29379, "r": 489.29876999999993, "b": 316.79544, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 400, "text": "- traffic lights", "bbox": {"l": 479.97293, "t": 315.29379, "r": 489.29876999999993, "b": 316.79544, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 352, "label": "text", "bbox": {"l": 478.375, "t": 317.50366, "r": 479.18129999999996, "b": 319.5416599999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 401, "text": "\u2022", "bbox": {"l": 478.375, "t": 317.50366, "r": 479.18129999999996, "b": 319.5416599999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 353, "label": "text", "bbox": {"l": 479.98761, "t": 317.50366, "r": 490.46960000000007, "b": 319.5416599999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 402, "text": "Road markings", "bbox": {"l": 479.98761, "t": 317.50366, "r": 490.46960000000007, "b": 319.5416599999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 354, "label": "text", "bbox": {"l": 479.97293, "t": 320.20938, "r": 489.26166000000006, "b": 321.71103, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 403, "text": "- yellow lines", "bbox": {"l": 479.97293, "t": 320.20938, "r": 489.26166000000006, "b": 321.71103, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 355, "label": "text", "bbox": {"l": 479.97293, "t": 322.50732, "r": 488.59189, "b": 324.009, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 404, "text": "- white lines", "bbox": {"l": 479.97293, "t": 322.50732, "r": 488.59189, "b": 324.009, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 356, "label": "text", "bbox": {"l": 479.97293, "t": 324.8053, "r": 491.17004000000003, "b": 326.30698, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 405, "text": "- reserved lane ", "bbox": {"l": 479.97293, "t": 324.8053, "r": 491.17004000000003, "b": 326.30698, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 357, "label": "text", "bbox": {"l": 481.21602999999993, "t": 326.43988, "r": 487.58978, "b": 328.47784, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 406, "text": "markings", "bbox": {"l": 481.21602999999993, "t": 326.43988, "r": 487.58978, "b": 328.47784, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 358, "label": "text", "bbox": {"l": 479.97293, "t": 329.14551, "r": 491.75177, "b": 330.64716, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 407, "text": "- other markings", "bbox": {"l": 479.97293, "t": 329.14551, "r": 491.75177, "b": 330.64716, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 359, "label": "text", "bbox": {"l": 478.15246999999994, "t": 265.07030999999995, "r": 493.75586, "b": 268.06872999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 408, "text": "in this chapter", "bbox": {"l": 478.15246999999994, "t": 265.07030999999995, "r": 493.75586, "b": 268.06872999999996, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "caption", "id": 16, "page_no": 0, "cluster": {"id": 16, "label": "caption", "bbox": {"l": 317.95499, "t": 540.08299, "r": 559.80579, "b": 559.51524, "coord_origin": "TOPLEFT"}, "confidence": 0.7793365120887756, "cells": [{"id": 409, "text": "Figure 1: Four examples of complex page layouts across dif-", "bbox": {"l": 317.95499, "t": 540.08299, "r": 559.80579, "b": 548.55624, "coord_origin": "TOPLEFT"}}, {"id": 410, "text": "ferent document categories", "bbox": {"l": 317.95499, "t": 551.0419899999999, "r": 428.69907, "b": 559.51524, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 1: Four examples of complex page layouts across different document categories"}, {"label": "section_header", "id": 3, "page_no": 0, "cluster": {"id": 3, "label": "section_header", "bbox": {"l": 317.95499, "t": 592.46591, "r": 379.8205, "b": 602.7750100000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9208476543426514, "cells": [{"id": 411, "text": "KEYWORDS", "bbox": {"l": 317.95499, "t": 592.46591, "r": 379.8205, "b": 602.7750100000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "KEYWORDS"}, {"label": "text", "id": 1, "page_no": 0, "cluster": {"id": 1, "label": "text", "bbox": {"l": 317.95499, "t": 607.66756, "r": 559.18597, "b": 627.00117, "coord_origin": "TOPLEFT"}, "confidence": 0.9509093761444092, "cells": [{"id": 412, "text": "PDF document conversion, layout segmentation, object-detection,", "bbox": {"l": 317.95499, "t": 607.66756, "r": 559.18597, "b": 616.04218, "coord_origin": "TOPLEFT"}}, {"id": 413, "text": "data set, Machine Learning", "bbox": {"l": 317.95499, "t": 618.62656, "r": 416.94403, "b": 627.00117, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "PDF document conversion, layout segmentation, object-detection, data set, Machine Learning"}, {"label": "section_header", "id": 7, "page_no": 0, "cluster": {"id": 7, "label": "section_header", "bbox": {"l": 317.65997, "t": 640.05434, "r": 404.65366, "b": 647.58609, "coord_origin": "TOPLEFT"}, "confidence": 0.8721988797187805, "cells": [{"id": 414, "text": "ACM Reference Format:", "bbox": {"l": 317.65997, "t": 640.05434, "r": 404.65366, "b": 647.58609, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "ACM Reference Format:"}, {"label": "text", "id": 2, "page_no": 0, "cluster": {"id": 2, "label": "text", "bbox": {"l": 317.95499, "t": 650.11996, "r": 559.5495, "b": 707.377029, "coord_origin": "TOPLEFT"}, "confidence": 0.9455165863037109, "cells": [{"id": 415, "text": "Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter", "bbox": {"l": 317.95499, "t": 650.11996, "r": 558.35266, "b": 657.56404, "coord_origin": "TOPLEFT"}}, {"id": 416, "text": "Staar. 2022. DocLayNet: A Large Human-Annotated Dataset for Document-", "bbox": {"l": 317.95499, "t": 660.08296, "r": 559.5495, "b": 667.52703, "coord_origin": "TOPLEFT"}}, {"id": 417, "text": "Layout Analysis. In", "bbox": {"l": 317.95499, "t": 670.04497, "r": 383.30807, "b": 677.48904, "coord_origin": "TOPLEFT"}}, {"id": 418, "text": "Proceedings of the 28th ACM SIGKDD Conference on", "bbox": {"l": 385.798, "t": 670.08482, "r": 558.20032, "b": 677.49701, "coord_origin": "TOPLEFT"}}, {"id": 419, "text": "Knowledge Discovery and Data Mining (KDD \u201922), August 14-18, 2022, Wash-", "bbox": {"l": 317.95499, "t": 680.04781, "r": 559.00092, "b": 687.46001, "coord_origin": "TOPLEFT"}}, {"id": 420, "text": "ington, DC, USA.", "bbox": {"l": 317.95499, "t": 690.01081, "r": 370.11481, "b": 697.423004, "coord_origin": "TOPLEFT"}}, {"id": 421, "text": "ACM, New York, NY, USA, 9 pages. https://doi.org/10.1145/", "bbox": {"l": 371.82999, "t": 689.97096, "r": 558.71655, "b": 697.415031, "coord_origin": "TOPLEFT"}}, {"id": 422, "text": "3534678.3539043", "bbox": {"l": 317.95499, "t": 699.932953, "r": 371.59375, "b": 707.377029, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar. 2022. DocLayNet: A Large Human-Annotated Dataset for DocumentLayout Analysis. In Proceedings of the 28th ACM SIGKDD Conference on Knowledge Discovery and Data Mining (KDD '22), August 14-18, 2022, Washington, DC, USA. ACM, New York, NY, USA, 9 pages. https://doi.org/10.1145/ 3534678.3539043"}], "headers": [{"label": "page_header", "id": 10, "page_no": 0, "cluster": {"id": 10, "label": "page_header", "bbox": {"l": 18.34021, "t": 218.35999000000004, "r": 36.339794, "b": 555.00003, "coord_origin": "TOPLEFT"}, "confidence": 0.8537883758544922, "cells": [{"id": 423, "text": "arXiv:2206.01062v1 [cs.CV] 2 Jun 2022", "bbox": {"l": 18.34021, "t": 218.35999000000004, "r": 36.339794, "b": 555.00003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "arXiv:2206.01062v1 [cs.CV] 2 Jun 2022"}]}}, {"page_no": 1, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 246.24382, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar", "bbox": {"l": 253.13897999999998, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "1", "bbox": {"l": 53.79800000000001, "t": 85.85986000000003, "r": 59.427395, "b": 96.16900999999996, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "INTRODUCTION", "bbox": {"l": 70.379532, "t": 85.85986000000003, "r": 156.52899, "b": 96.16900999999996, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Despite the substantial improvements achieved with machine-learning", "bbox": {"l": 53.79800000000001, "t": 110.98352, "r": 303.01697, "b": 119.35815000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "(ML) approaches and deep neural networks in recent years, docu-", "bbox": {"l": 53.528999, "t": 121.94256999999993, "r": 295.55695, "b": 130.31719999999996, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "ment conversion remains a challenging problem, as demonstrated", "bbox": {"l": 53.79800000000001, "t": 132.90155000000004, "r": 294.04642, "b": 141.27617999999995, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "by the numerous public competitions held on this topic [1-4]. The", "bbox": {"l": 53.79800000000001, "t": 143.85956, "r": 294.04733, "b": 152.23419, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "challenge originates from the huge variability in PDF documents", "bbox": {"l": 53.79800000000001, "t": 154.81853999999998, "r": 294.04349, "b": 163.19317999999998, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "regarding layout, language and formats (scanned, programmatic", "bbox": {"l": 53.79800000000001, "t": 165.77752999999996, "r": 294.04718, "b": 174.15215999999998, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "or a combination of both). Engineering a single ML model that can", "bbox": {"l": 53.79800000000001, "t": 176.73650999999995, "r": 294.04919, "b": 185.11114999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "be applied on all types of documents and provides high-quality", "bbox": {"l": 53.79800000000001, "t": 187.69556, "r": 294.27573, "b": 196.07019000000003, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "layout segmentation remains to this day extremely challenging [5].", "bbox": {"l": 53.79800000000001, "t": 198.65454, "r": 295.42569, "b": 207.02917000000002, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "To highlight the variability in document layouts, we show a few", "bbox": {"l": 53.528999, "t": 209.61352999999997, "r": 294.37256, "b": 217.98816, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "example documents from the DocLayNet dataset in Figure 1.", "bbox": {"l": 53.79800000000001, "t": 220.57250999999997, "r": 275.48334, "b": 228.94714, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "A key problem in the process of document conversion is to under-", "bbox": {"l": 63.76100199999999, "t": 231.53156, "r": 295.564, "b": 239.90619000000004, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "stand the structure of a single document page, i.e. which segments", "bbox": {"l": 53.79800000000001, "t": 242.49054, "r": 294.04868, "b": 250.86517000000003, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "of text should be grouped together in a unit. To train models for this", "bbox": {"l": 53.79800000000001, "t": 253.44854999999995, "r": 294.04532, "b": 261.82318, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "task, there are currently two large datasets available to the com-", "bbox": {"l": 53.79800000000001, "t": 264.40752999999995, "r": 295.55618, "b": 272.78216999999995, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "munity, PubLayNet [6] and DocBank [7]. They were introduced", "bbox": {"l": 53.79800000000001, "t": 275.36658, "r": 294.04059, "b": 283.74118, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "in 2019 and 2020 respectively and significantly accelerated the im-", "bbox": {"l": 53.79800000000001, "t": 286.32552999999996, "r": 295.55783, "b": 294.70016, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "plementation of layout detection and segmentation models due to", "bbox": {"l": 53.79800000000001, "t": 297.28455, "r": 294.04538, "b": 305.65918000000005, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "their sizes of 300K and 500K ground-truth pages. These sizes were", "bbox": {"l": 53.79800000000001, "t": 308.24353, "r": 294.043, "b": 316.61816, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "achieved by leveraging an automation approach. The benefit of au-", "bbox": {"l": 53.79800000000001, "t": 319.20255, "r": 295.56412, "b": 327.57718, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "tomated ground-truth generation is obvious: one can generate large", "bbox": {"l": 53.79800000000001, "t": 330.16153, "r": 294.04532, "b": 338.53616, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "ground-truth datasets at virtually no cost. However, the automation", "bbox": {"l": 53.79800000000001, "t": 341.12054, "r": 294.04538, "b": 349.49518, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "introduces a constraint on the variability in the dataset, because", "bbox": {"l": 53.79800000000001, "t": 352.07953, "r": 294.04712, "b": 360.45416000000006, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "corresponding structured source data must be available. PubLayNet", "bbox": {"l": 53.79800000000001, "t": 363.03853999999995, "r": 294.04538, "b": 371.41318, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "and DocBank were both generated from scientific document repos-", "bbox": {"l": 53.79800000000001, "t": 373.99655, "r": 295.55643, "b": 382.37119, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "itories (PubMed and arXiv), which provide XML or L", "bbox": {"l": 53.79800000000001, "t": 384.95554, "r": 246.75909, "b": 393.33017, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "A", "bbox": {"l": 243.53101000000004, "t": 385.03183000000007, "r": 248.58553000000003, "b": 391.82455, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "T", "bbox": {"l": 247.24099999999999, "t": 384.95554, "r": 252.58859, "b": 393.33017, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "E", "bbox": {"l": 251.09398999999996, "t": 386.87954999999994, "r": 256.08829, "b": 395.25418, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "X", "bbox": {"l": 254.967, "t": 384.95554, "r": 261.33725, "b": 393.33017, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "sources.", "bbox": {"l": 263.75021, "t": 384.95554, "r": 295.42773, "b": 393.33017, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "Those scientific documents present a limited variability in their", "bbox": {"l": 53.528999, "t": 395.91455, "r": 294.21713, "b": 404.28918, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "layouts, because they are typeset in uniform templates provided by", "bbox": {"l": 53.79800000000001, "t": 406.87354, "r": 294.27386, "b": 415.24817, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "the publishers. Obviously, documents such as technical manuals,", "bbox": {"l": 53.79800000000001, "t": 417.8325500000001, "r": 295.03488, "b": 426.20717999999994, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "annual company reports, legal text, government tenders, etc. have", "bbox": {"l": 53.79800000000001, "t": 428.79153, "r": 294.04691, "b": 437.16617, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "very different and partially unique layouts. As a consequence, the", "bbox": {"l": 53.57400100000001, "t": 439.75055, "r": 294.04865, "b": 448.12518, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "layout predictions obtained from models trained on PubLayNet or", "bbox": {"l": 53.79800000000001, "t": 450.7095299999999, "r": 294.21643, "b": 459.08417, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "DocBank is very reasonable when applied on scientific documents.", "bbox": {"l": 53.79800000000001, "t": 461.66855, "r": 295.42181, "b": 470.04318, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "However, for more", "bbox": {"l": 53.79800000000001, "t": 472.62753, "r": 125.52795, "b": 481.00217, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "artistic", "bbox": {"l": 128.608, "t": 472.67239, "r": 153.7679, "b": 481.01114, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "or", "bbox": {"l": 157.15199, "t": 472.62753, "r": 165.16365, "b": 481.00217, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "free-style", "bbox": {"l": 168.248, "t": 472.67239, "r": 201.49272, "b": 481.01114, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "layouts, we see sub-par", "bbox": {"l": 204.78799, "t": 472.62753, "r": 294.21494, "b": 481.00217, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "prediction quality from these models, which we demonstrate in", "bbox": {"l": 53.79800000000001, "t": 483.58554, "r": 294.04715, "b": 491.96017, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Section 5.", "bbox": {"l": 53.79800000000001, "t": 494.54453, "r": 89.080788, "b": 502.91916, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "In this paper, we present the DocLayNet dataset. It provides page-", "bbox": {"l": 63.76100199999999, "t": 505.50354, "r": 295.56396, "b": 513.87817, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "by-page layout annotation ground-truth using bounding-boxes for", "bbox": {"l": 53.79800000000001, "t": 516.46252, "r": 294.21271, "b": 524.83716, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "11", "bbox": {"l": 53.591999, "t": 527.42154, "r": 61.92275599999999, "b": 535.7961700000001, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "distinct class labels on 80863 unique document pages, of which", "bbox": {"l": 64.162201, "t": 527.42154, "r": 294.04626, "b": 535.7961700000001, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "a fraction carry double- or triple-annotations. DocLayNet is similar", "bbox": {"l": 53.79800000000001, "t": 538.38055, "r": 294.21228, "b": 546.75517, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "in spirit to PubLayNet and DocBank and will likewise be made", "bbox": {"l": 53.79800000000001, "t": 549.33955, "r": 294.04709, "b": 557.71417, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "available to the public", "bbox": {"l": 53.79800000000001, "t": 560.29855, "r": 134.28951, "b": 568.67317, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "1", "bbox": {"l": 134.29201, "t": 558.23083, "r": 137.67381, "b": 565.0235299999999, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "in order to stimulate the document-layout", "bbox": {"l": 140.418, "t": 560.29855, "r": 294.047, "b": 568.67317, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "analysis community. It distinguishes itself in the following aspects:", "bbox": {"l": 53.79800000000001, "t": 571.25755, "r": 295.10538, "b": 579.63217, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "(1)", "bbox": {"l": 64.708, "t": 584.58156, "r": 74.221352, "b": 592.95618, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Human Annotation", "bbox": {"l": 78.207001, "t": 584.62639, "r": 146.39589, "b": 592.96515, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": ": In contrast to PubLayNet and DocBank,", "bbox": {"l": 146.41701, "t": 584.58156, "r": 295.03036, "b": 592.95618, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "we relied on human annotation instead of automation ap-", "bbox": {"l": 77.875, "t": 595.54056, "r": 295.56165, "b": 603.91518, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "proaches to generate the data set.", "bbox": {"l": 78.207001, "t": 606.49956, "r": 200.6432, "b": 614.87418, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "(2)", "bbox": {"l": 64.708, "t": 617.45856, "r": 74.221352, "b": 625.8331800000001, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "Large Layout Variability", "bbox": {"l": 78.207001, "t": 617.50339, "r": 167.91745, "b": 625.84215, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": ": We include diverse and complex", "bbox": {"l": 168.33501, "t": 617.45856, "r": 294.26254, "b": 625.8331800000001, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "layouts from a large variety of public sources.", "bbox": {"l": 78.207001, "t": 628.41655, "r": 245.45726000000002, "b": 636.79117, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "(3)", "bbox": {"l": 64.708, "t": 639.37555, "r": 74.221352, "b": 647.75017, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "Detailed Label Set", "bbox": {"l": 78.207001, "t": 639.42038, "r": 143.51663, "b": 647.75914, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": ": We define 11 class labels to distinguish", "bbox": {"l": 144.02, "t": 639.37555, "r": 294.04648, "b": 647.75017, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "layout features in high detail. PubLayNet provides 5 labels;", "bbox": {"l": 78.207001, "t": 650.33455, "r": 294.68381, "b": 658.70917, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "DocBank provides 13, although not a superset of ours.", "bbox": {"l": 78.207001, "t": 661.29355, "r": 276.33752, "b": 669.66817, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "(4)", "bbox": {"l": 64.708, "t": 672.25256, "r": 74.221352, "b": 680.62717, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "Redundant Annotations", "bbox": {"l": 78.207001, "t": 672.29739, "r": 163.78357, "b": 680.63614, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": ": A fraction of the pages in the Do-", "bbox": {"l": 163.994, "t": 672.25256, "r": 295.56439, "b": 680.62717, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "cLayNet data set carry more than one human annotation.", "bbox": {"l": 78.207001, "t": 683.21156, "r": 295.42719, "b": 691.58617, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "$^{1}$https://developer.ibm.com/exchanges/data/all/doclaynet", "bbox": {"l": 53.672001, "t": 702.226364, "r": 216.02750000000003, "b": 708.739891, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "This enables experimentation with annotation uncertainty", "bbox": {"l": 342.095, "t": 87.36352999999997, "r": 558.43201, "b": 95.73816, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "and quality control analysis.", "bbox": {"l": 342.36401, "t": 98.32250999999997, "r": 445.83629999999994, "b": 106.69713999999999, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "(5)", "bbox": {"l": 328.86502, "t": 109.28148999999996, "r": 338.37836, "b": 117.65612999999996, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Pre-defined Train-, Test- & Validation-set", "bbox": {"l": 342.36401, "t": 109.32641999999998, "r": 487.25296, "b": 117.66516000000001, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": ": Like DocBank, we", "bbox": {"l": 487.75900000000007, "t": 109.28156000000001, "r": 558.20294, "b": 117.65618999999992, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "provide fixed train-, test- & validation-sets to ensure propor-", "bbox": {"l": 342.36401, "t": 120.24054000000001, "r": 559.72101, "b": 128.61517000000003, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "tional representation of the class-labels. Further, we prevent", "bbox": {"l": 342.36401, "t": 131.19854999999995, "r": 558.20117, "b": 139.57317999999998, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "leakage of unique layouts across sets, which has a large effect", "bbox": {"l": 342.36401, "t": 142.15752999999995, "r": 558.20087, "b": 150.53216999999995, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "on model accuracy scores.", "bbox": {"l": 342.36401, "t": 153.11652000000004, "r": 438.0624399999999, "b": 161.49114999999995, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "All aspects outlined above are detailed in Section 3. In Section 4,", "bbox": {"l": 327.918, "t": 167.97551999999996, "r": 559.19031, "b": 176.35015999999996, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "we will elaborate on how we designed and executed this large-scale", "bbox": {"l": 317.62299, "t": 178.93451000000005, "r": 558.20422, "b": 187.30913999999996, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "human annotation campaign. We will also share key insights and", "bbox": {"l": 317.95499, "t": 189.89355, "r": 558.19763, "b": 198.26819, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "lessons learned that might prove helpful for other parties planning", "bbox": {"l": 317.95499, "t": 200.85253999999998, "r": 558.20612, "b": 209.22717, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "to set up annotation campaigns.", "bbox": {"l": 317.95499, "t": 211.81151999999997, "r": 434.94861, "b": 220.18615999999997, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "In Section 5, we will present baseline accuracy numbers for a", "bbox": {"l": 327.918, "t": 222.77057000000002, "r": 558.19836, "b": 231.14520000000005, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "variety of object detection methods (Faster R-CNN, Mask R-CNN", "bbox": {"l": 317.73099, "t": 233.72955000000002, "r": 558.1991, "b": 242.10419000000002, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "and YOLOv5) trained on DocLayNet. We further show how the", "bbox": {"l": 317.95499, "t": 244.68854, "r": 558.20416, "b": 253.06317, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "model performance is impacted by varying the DocLayNet dataset", "bbox": {"l": 317.95499, "t": 255.64752, "r": 558.20563, "b": 264.02216, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "size, reducing the label set and modifying the train/test-split. Last", "bbox": {"l": 317.95499, "t": 266.60553000000004, "r": 558.19861, "b": 274.98015999999996, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "but not least, we compare the performance of models trained on", "bbox": {"l": 317.95499, "t": 277.56458, "r": 558.20416, "b": 285.93918, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "PubLayNet, DocBank and DocLayNet and demonstrate that a model", "bbox": {"l": 317.95499, "t": 288.52353, "r": 558.20239, "b": 296.89816, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "trained on DocLayNet provides overall more robust layout recovery.", "bbox": {"l": 317.95499, "t": 299.48254, "r": 559.58197, "b": 307.85718, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "2", "bbox": {"l": 317.95499, "t": 321.20889, "r": 323.10388, "b": 331.51797, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "RELATED WORK", "bbox": {"l": 333.12115, "t": 321.20889, "r": 421.74411, "b": 331.51797, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "While early approaches in document-layout analysis used rule-", "bbox": {"l": 317.52499, "t": 346.3325500000001, "r": 559.71301, "b": 354.70717999999994, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "based algorithms and heuristics [8], the problem is lately addressed", "bbox": {"l": 317.95499, "t": 357.29153, "r": 558.20276, "b": 365.66617, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "with deep learning methods. The most common approach is to lever-", "bbox": {"l": 317.62299, "t": 368.25055, "r": 559.71564, "b": 376.62518, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "age object detection models [9-15]. In the last decade, the accuracy", "bbox": {"l": 317.95499, "t": 379.2095299999999, "r": 558.43365, "b": 387.58417, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "and speed of these models has increased dramatically. Furthermore,", "bbox": {"l": 317.95499, "t": 390.16855000000004, "r": 559.18658, "b": 398.54318, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "most state-of-the-art object detection methods can be trained and", "bbox": {"l": 317.95499, "t": 401.12753, "r": 558.20502, "b": 409.50217, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "applied with very little work, thanks to a standardisation effort", "bbox": {"l": 317.95499, "t": 412.08655, "r": 558.20422, "b": 420.46118, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "of the ground-truth data format [16] and common deep-learning", "bbox": {"l": 317.95499, "t": 423.04553, "r": 558.20477, "b": 431.4201699999999, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "frameworks [17]. Reference data sets such as PubLayNet [6] and", "bbox": {"l": 317.95499, "t": 434.00354, "r": 558.19952, "b": 442.37817, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "DocBank provide their data in the commonly accepted COCO for-", "bbox": {"l": 317.95499, "t": 444.96252, "r": 559.71613, "b": 453.33716, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "mat [16].", "bbox": {"l": 317.95499, "t": 455.92154, "r": 350.90652, "b": 464.29617, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "Lately, new types of ML models for document-layout analysis", "bbox": {"l": 327.918, "t": 466.88052, "r": 558.19824, "b": 475.25516, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "have emerged in the community [18-21]. These models do not", "bbox": {"l": 317.95499, "t": 477.83954, "r": 558.20551, "b": 486.21417, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "approach the problem of layout analysis purely based on an image", "bbox": {"l": 317.95499, "t": 488.79855, "r": 558.20575, "b": 497.17319, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "representation of the page, as computer vision methods do. Instead,", "bbox": {"l": 317.95499, "t": 499.75754, "r": 559.18646, "b": 508.13217, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "they combine the text tokens and image representation of a page", "bbox": {"l": 317.95499, "t": 510.71655, "r": 558.2002, "b": 519.09119, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "in order to obtain a segmentation. While the reported accuracies", "bbox": {"l": 317.95499, "t": 521.67554, "r": 558.20618, "b": 530.05017, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "appear to be promising, a broadly accepted data format which links", "bbox": {"l": 317.95499, "t": 532.63455, "r": 558.20239, "b": 541.00917, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "geometric and textual features has yet to establish.", "bbox": {"l": 317.95499, "t": 543.59355, "r": 503.32648, "b": 551.96817, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "3", "bbox": {"l": 317.95499, "t": 565.3199, "r": 322.97391, "b": 575.629, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "THE DOCLAYNET DATASET", "bbox": {"l": 332.73831, "t": 565.3199, "r": 477.45688, "b": 575.629, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "DocLayNet contains 80863 PDF pages. Among these, 7059 carry two", "bbox": {"l": 317.95499, "t": 590.4435599999999, "r": 558.20233, "b": 598.81818, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "instances of human annotations, and 1591 carry three. This amounts", "bbox": {"l": 317.95499, "t": 601.40256, "r": 558.20239, "b": 609.77718, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "to 91104 total annotation instances. The annotations provide lay-", "bbox": {"l": 317.95499, "t": 612.36055, "r": 559.7132, "b": 620.73517, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "out information in the shape of labeled, rectangular bounding-", "bbox": {"l": 317.95499, "t": 623.3195499999999, "r": 559.71313, "b": 631.69417, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "boxes. We define 11 distinct labels for layout features, namely", "bbox": {"l": 317.95499, "t": 634.27855, "r": 539.92047, "b": 642.65317, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "Cap-", "bbox": {"l": 542.15802, "t": 634.32338, "r": 559.09888, "b": 642.66214, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "tion", "bbox": {"l": 317.95499, "t": 645.28238, "r": 331.86273, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": ",", "bbox": {"l": 331.86301, "t": 645.23755, "r": 333.83957, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "Footnote", "bbox": {"l": 336.064, "t": 645.28238, "r": 366.05368, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": ",", "bbox": {"l": 366.05301, "t": 645.23755, "r": 368.02957, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "Formula", "bbox": {"l": 370.254, "t": 645.28238, "r": 400.05502, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": ",", "bbox": {"l": 400.05499, "t": 645.23755, "r": 402.03156, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "List-item", "bbox": {"l": 404.25601, "t": 645.28238, "r": 436.19531, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": ",", "bbox": {"l": 436.19501, "t": 645.23755, "r": 438.17157, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "Page-footer", "bbox": {"l": 440.396, "t": 645.28238, "r": 480.60988999999995, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": ",", "bbox": {"l": 480.60999, "t": 645.23755, "r": 482.58655000000005, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "Page-header", "bbox": {"l": 484.811, "t": 645.28238, "r": 528.37604, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": ",", "bbox": {"l": 528.375, "t": 645.23755, "r": 530.35156, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "Picture", "bbox": {"l": 532.57599, "t": 645.28238, "r": 557.211, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": ",", "bbox": {"l": 557.211, "t": 645.23755, "r": 559.18756, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "Section-header", "bbox": {"l": 317.95499, "t": 656.2413799999999, "r": 368.78821, "b": 664.58013, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": ",", "bbox": {"l": 368.789, "t": 656.19655, "r": 370.72217, "b": 664.5711699999999, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "Table", "bbox": {"l": 372.89999, "t": 656.2413799999999, "r": 391.57254, "b": 664.58013, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": ",", "bbox": {"l": 391.573, "t": 656.19655, "r": 393.50616, "b": 664.5711699999999, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "Text", "bbox": {"l": 395.68399, "t": 656.2413799999999, "r": 410.23538, "b": 664.58013, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": ", and", "bbox": {"l": 410.23099, "t": 656.19655, "r": 427.5679, "b": 664.5711699999999, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "Title", "bbox": {"l": 429.74399, "t": 656.2413799999999, "r": 445.50800000000004, "b": 664.58013, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": ". Our reasoning for picking this", "bbox": {"l": 445.50800000000004, "t": 656.19655, "r": 558.20227, "b": 664.5711699999999, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "particular label set is detailed in Section 4.", "bbox": {"l": 317.95499, "t": 667.15556, "r": 472.22198, "b": 675.53017, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "In addition to open intellectual property constraints for the", "bbox": {"l": 327.918, "t": 678.11456, "r": 558.19843, "b": 686.4891700000001, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "source documents, we required that the documents in DocLayNet", "bbox": {"l": 317.95499, "t": 689.07355, "r": 558.19867, "b": 697.448174, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "adhere to a few conditions. Firstly, we kept scanned documents", "bbox": {"l": 317.95499, "t": 700.032555, "r": 558.2041, "b": 708.4071730000001, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 19, "label": "page_header", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.7682238221168518, "cells": [{"id": 0, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 246.24382, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar", "bbox": {"l": 253.13897999999998, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "section_header", "bbox": {"l": 53.79800000000001, "t": 85.85986000000003, "r": 156.52899, "b": 96.16900999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9367801547050476, "cells": [{"id": 2, "text": "1", "bbox": {"l": 53.79800000000001, "t": 85.85986000000003, "r": 59.427395, "b": 96.16900999999996, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "INTRODUCTION", "bbox": {"l": 70.379532, "t": 85.85986000000003, "r": 156.52899, "b": 96.16900999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "text", "bbox": {"l": 53.528999, "t": 110.98352, "r": 303.01697, "b": 228.94714, "coord_origin": "TOPLEFT"}, "confidence": 0.9802607893943787, "cells": [{"id": 4, "text": "Despite the substantial improvements achieved with machine-learning", "bbox": {"l": 53.79800000000001, "t": 110.98352, "r": 303.01697, "b": 119.35815000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "(ML) approaches and deep neural networks in recent years, docu-", "bbox": {"l": 53.528999, "t": 121.94256999999993, "r": 295.55695, "b": 130.31719999999996, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "ment conversion remains a challenging problem, as demonstrated", "bbox": {"l": 53.79800000000001, "t": 132.90155000000004, "r": 294.04642, "b": 141.27617999999995, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "by the numerous public competitions held on this topic [1-4]. The", "bbox": {"l": 53.79800000000001, "t": 143.85956, "r": 294.04733, "b": 152.23419, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "challenge originates from the huge variability in PDF documents", "bbox": {"l": 53.79800000000001, "t": 154.81853999999998, "r": 294.04349, "b": 163.19317999999998, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "regarding layout, language and formats (scanned, programmatic", "bbox": {"l": 53.79800000000001, "t": 165.77752999999996, "r": 294.04718, "b": 174.15215999999998, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "or a combination of both). Engineering a single ML model that can", "bbox": {"l": 53.79800000000001, "t": 176.73650999999995, "r": 294.04919, "b": 185.11114999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "be applied on all types of documents and provides high-quality", "bbox": {"l": 53.79800000000001, "t": 187.69556, "r": 294.27573, "b": 196.07019000000003, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "layout segmentation remains to this day extremely challenging [5].", "bbox": {"l": 53.79800000000001, "t": 198.65454, "r": 295.42569, "b": 207.02917000000002, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "To highlight the variability in document layouts, we show a few", "bbox": {"l": 53.528999, "t": 209.61352999999997, "r": 294.37256, "b": 217.98816, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "example documents from the DocLayNet dataset in Figure 1.", "bbox": {"l": 53.79800000000001, "t": 220.57250999999997, "r": 275.48334, "b": 228.94714, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "text", "bbox": {"l": 53.528999, "t": 231.53156, "r": 295.56412, "b": 502.91916, "coord_origin": "TOPLEFT"}, "confidence": 0.9793015718460083, "cells": [{"id": 15, "text": "A key problem in the process of document conversion is to under-", "bbox": {"l": 63.76100199999999, "t": 231.53156, "r": 295.564, "b": 239.90619000000004, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "stand the structure of a single document page, i.e. which segments", "bbox": {"l": 53.79800000000001, "t": 242.49054, "r": 294.04868, "b": 250.86517000000003, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "of text should be grouped together in a unit. To train models for this", "bbox": {"l": 53.79800000000001, "t": 253.44854999999995, "r": 294.04532, "b": 261.82318, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "task, there are currently two large datasets available to the com-", "bbox": {"l": 53.79800000000001, "t": 264.40752999999995, "r": 295.55618, "b": 272.78216999999995, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "munity, PubLayNet [6] and DocBank [7]. They were introduced", "bbox": {"l": 53.79800000000001, "t": 275.36658, "r": 294.04059, "b": 283.74118, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "in 2019 and 2020 respectively and significantly accelerated the im-", "bbox": {"l": 53.79800000000001, "t": 286.32552999999996, "r": 295.55783, "b": 294.70016, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "plementation of layout detection and segmentation models due to", "bbox": {"l": 53.79800000000001, "t": 297.28455, "r": 294.04538, "b": 305.65918000000005, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "their sizes of 300K and 500K ground-truth pages. These sizes were", "bbox": {"l": 53.79800000000001, "t": 308.24353, "r": 294.043, "b": 316.61816, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "achieved by leveraging an automation approach. The benefit of au-", "bbox": {"l": 53.79800000000001, "t": 319.20255, "r": 295.56412, "b": 327.57718, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "tomated ground-truth generation is obvious: one can generate large", "bbox": {"l": 53.79800000000001, "t": 330.16153, "r": 294.04532, "b": 338.53616, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "ground-truth datasets at virtually no cost. However, the automation", "bbox": {"l": 53.79800000000001, "t": 341.12054, "r": 294.04538, "b": 349.49518, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "introduces a constraint on the variability in the dataset, because", "bbox": {"l": 53.79800000000001, "t": 352.07953, "r": 294.04712, "b": 360.45416000000006, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "corresponding structured source data must be available. PubLayNet", "bbox": {"l": 53.79800000000001, "t": 363.03853999999995, "r": 294.04538, "b": 371.41318, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "and DocBank were both generated from scientific document repos-", "bbox": {"l": 53.79800000000001, "t": 373.99655, "r": 295.55643, "b": 382.37119, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "itories (PubMed and arXiv), which provide XML or L", "bbox": {"l": 53.79800000000001, "t": 384.95554, "r": 246.75909, "b": 393.33017, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "A", "bbox": {"l": 243.53101000000004, "t": 385.03183000000007, "r": 248.58553000000003, "b": 391.82455, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "T", "bbox": {"l": 247.24099999999999, "t": 384.95554, "r": 252.58859, "b": 393.33017, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "E", "bbox": {"l": 251.09398999999996, "t": 386.87954999999994, "r": 256.08829, "b": 395.25418, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "X", "bbox": {"l": 254.967, "t": 384.95554, "r": 261.33725, "b": 393.33017, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "sources.", "bbox": {"l": 263.75021, "t": 384.95554, "r": 295.42773, "b": 393.33017, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "Those scientific documents present a limited variability in their", "bbox": {"l": 53.528999, "t": 395.91455, "r": 294.21713, "b": 404.28918, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "layouts, because they are typeset in uniform templates provided by", "bbox": {"l": 53.79800000000001, "t": 406.87354, "r": 294.27386, "b": 415.24817, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "the publishers. Obviously, documents such as technical manuals,", "bbox": {"l": 53.79800000000001, "t": 417.8325500000001, "r": 295.03488, "b": 426.20717999999994, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "annual company reports, legal text, government tenders, etc. have", "bbox": {"l": 53.79800000000001, "t": 428.79153, "r": 294.04691, "b": 437.16617, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "very different and partially unique layouts. As a consequence, the", "bbox": {"l": 53.57400100000001, "t": 439.75055, "r": 294.04865, "b": 448.12518, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "layout predictions obtained from models trained on PubLayNet or", "bbox": {"l": 53.79800000000001, "t": 450.7095299999999, "r": 294.21643, "b": 459.08417, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "DocBank is very reasonable when applied on scientific documents.", "bbox": {"l": 53.79800000000001, "t": 461.66855, "r": 295.42181, "b": 470.04318, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "However, for more", "bbox": {"l": 53.79800000000001, "t": 472.62753, "r": 125.52795, "b": 481.00217, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "artistic", "bbox": {"l": 128.608, "t": 472.67239, "r": 153.7679, "b": 481.01114, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "or", "bbox": {"l": 157.15199, "t": 472.62753, "r": 165.16365, "b": 481.00217, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "free-style", "bbox": {"l": 168.248, "t": 472.67239, "r": 201.49272, "b": 481.01114, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "layouts, we see sub-par", "bbox": {"l": 204.78799, "t": 472.62753, "r": 294.21494, "b": 481.00217, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "prediction quality from these models, which we demonstrate in", "bbox": {"l": 53.79800000000001, "t": 483.58554, "r": 294.04715, "b": 491.96017, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Section 5.", "bbox": {"l": 53.79800000000001, "t": 494.54453, "r": 89.080788, "b": 502.91916, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "text", "bbox": {"l": 53.591999, "t": 505.50354, "r": 295.56396, "b": 579.63217, "coord_origin": "TOPLEFT"}, "confidence": 0.9795253276824951, "cells": [{"id": 49, "text": "In this paper, we present the DocLayNet dataset. It provides page-", "bbox": {"l": 63.76100199999999, "t": 505.50354, "r": 295.56396, "b": 513.87817, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "by-page layout annotation ground-truth using bounding-boxes for", "bbox": {"l": 53.79800000000001, "t": 516.46252, "r": 294.21271, "b": 524.83716, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "11", "bbox": {"l": 53.591999, "t": 527.42154, "r": 61.92275599999999, "b": 535.7961700000001, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "distinct class labels on 80863 unique document pages, of which", "bbox": {"l": 64.162201, "t": 527.42154, "r": 294.04626, "b": 535.7961700000001, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "a fraction carry double- or triple-annotations. DocLayNet is similar", "bbox": {"l": 53.79800000000001, "t": 538.38055, "r": 294.21228, "b": 546.75517, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "in spirit to PubLayNet and DocBank and will likewise be made", "bbox": {"l": 53.79800000000001, "t": 549.33955, "r": 294.04709, "b": 557.71417, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "available to the public", "bbox": {"l": 53.79800000000001, "t": 560.29855, "r": 134.28951, "b": 568.67317, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "1", "bbox": {"l": 134.29201, "t": 558.23083, "r": 137.67381, "b": 565.0235299999999, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "in order to stimulate the document-layout", "bbox": {"l": 140.418, "t": 560.29855, "r": 294.047, "b": 568.67317, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "analysis community. It distinguishes itself in the following aspects:", "bbox": {"l": 53.79800000000001, "t": 571.25755, "r": 295.10538, "b": 579.63217, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "list_item", "bbox": {"l": 64.708, "t": 584.58156, "r": 295.56165, "b": 614.87418, "coord_origin": "TOPLEFT"}, "confidence": 0.9687220454216003, "cells": [{"id": 59, "text": "(1)", "bbox": {"l": 64.708, "t": 584.58156, "r": 74.221352, "b": 592.95618, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Human Annotation", "bbox": {"l": 78.207001, "t": 584.62639, "r": 146.39589, "b": 592.96515, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": ": In contrast to PubLayNet and DocBank,", "bbox": {"l": 146.41701, "t": 584.58156, "r": 295.03036, "b": 592.95618, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "we relied on human annotation instead of automation ap-", "bbox": {"l": 77.875, "t": 595.54056, "r": 295.56165, "b": 603.91518, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "proaches to generate the data set.", "bbox": {"l": 78.207001, "t": 606.49956, "r": 200.6432, "b": 614.87418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "list_item", "bbox": {"l": 64.708, "t": 617.45856, "r": 294.26254, "b": 636.79117, "coord_origin": "TOPLEFT"}, "confidence": 0.9594229459762573, "cells": [{"id": 64, "text": "(2)", "bbox": {"l": 64.708, "t": 617.45856, "r": 74.221352, "b": 625.8331800000001, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "Large Layout Variability", "bbox": {"l": 78.207001, "t": 617.50339, "r": 167.91745, "b": 625.84215, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": ": We include diverse and complex", "bbox": {"l": 168.33501, "t": 617.45856, "r": 294.26254, "b": 625.8331800000001, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "layouts from a large variety of public sources.", "bbox": {"l": 78.207001, "t": 628.41655, "r": 245.45726000000002, "b": 636.79117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "list_item", "bbox": {"l": 64.708, "t": 639.37555, "r": 294.68381, "b": 669.66817, "coord_origin": "TOPLEFT"}, "confidence": 0.9615103006362915, "cells": [{"id": 68, "text": "(3)", "bbox": {"l": 64.708, "t": 639.37555, "r": 74.221352, "b": 647.75017, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "Detailed Label Set", "bbox": {"l": 78.207001, "t": 639.42038, "r": 143.51663, "b": 647.75914, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": ": We define 11 class labels to distinguish", "bbox": {"l": 144.02, "t": 639.37555, "r": 294.04648, "b": 647.75017, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "layout features in high detail. PubLayNet provides 5 labels;", "bbox": {"l": 78.207001, "t": 650.33455, "r": 294.68381, "b": 658.70917, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "DocBank provides 13, although not a superset of ours.", "bbox": {"l": 78.207001, "t": 661.29355, "r": 276.33752, "b": 669.66817, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "list_item", "bbox": {"l": 64.708, "t": 672.25256, "r": 295.56439, "b": 691.58617, "coord_origin": "TOPLEFT"}, "confidence": 0.9447500109672546, "cells": [{"id": 73, "text": "(4)", "bbox": {"l": 64.708, "t": 672.25256, "r": 74.221352, "b": 680.62717, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "Redundant Annotations", "bbox": {"l": 78.207001, "t": 672.29739, "r": 163.78357, "b": 680.63614, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": ": A fraction of the pages in the Do-", "bbox": {"l": 163.994, "t": 672.25256, "r": 295.56439, "b": 680.62717, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "cLayNet data set carry more than one human annotation.", "bbox": {"l": 78.207001, "t": 683.21156, "r": 295.42719, "b": 691.58617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "footnote", "bbox": {"l": 53.672001, "t": 702.226364, "r": 216.02750000000003, "b": 708.739891, "coord_origin": "TOPLEFT"}, "confidence": 0.8584771752357483, "cells": [{"id": 77, "text": "$^{1}$https://developer.ibm.com/exchanges/data/all/doclaynet", "bbox": {"l": 53.672001, "t": 702.226364, "r": 216.02750000000003, "b": 708.739891, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 342.095, "t": 87.36352999999997, "r": 558.43201, "b": 106.69713999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.7997146844863892, "cells": [{"id": 78, "text": "This enables experimentation with annotation uncertainty", "bbox": {"l": 342.095, "t": 87.36352999999997, "r": 558.43201, "b": 95.73816, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "and quality control analysis.", "bbox": {"l": 342.36401, "t": 98.32250999999997, "r": 445.83629999999994, "b": 106.69713999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "list_item", "bbox": {"l": 328.86502, "t": 109.28148999999996, "r": 559.72101, "b": 161.49114999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9563499093055725, "cells": [{"id": 80, "text": "(5)", "bbox": {"l": 328.86502, "t": 109.28148999999996, "r": 338.37836, "b": 117.65612999999996, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Pre-defined Train-, Test- & Validation-set", "bbox": {"l": 342.36401, "t": 109.32641999999998, "r": 487.25296, "b": 117.66516000000001, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": ": Like DocBank, we", "bbox": {"l": 487.75900000000007, "t": 109.28156000000001, "r": 558.20294, "b": 117.65618999999992, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "provide fixed train-, test- & validation-sets to ensure propor-", "bbox": {"l": 342.36401, "t": 120.24054000000001, "r": 559.72101, "b": 128.61517000000003, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "tional representation of the class-labels. Further, we prevent", "bbox": {"l": 342.36401, "t": 131.19854999999995, "r": 558.20117, "b": 139.57317999999998, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "leakage of unique layouts across sets, which has a large effect", "bbox": {"l": 342.36401, "t": 142.15752999999995, "r": 558.20087, "b": 150.53216999999995, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "on model accuracy scores.", "bbox": {"l": 342.36401, "t": 153.11652000000004, "r": 438.0624399999999, "b": 161.49114999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "text", "bbox": {"l": 317.62299, "t": 167.97551999999996, "r": 559.19031, "b": 220.18615999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9813903570175171, "cells": [{"id": 87, "text": "All aspects outlined above are detailed in Section 3. In Section 4,", "bbox": {"l": 327.918, "t": 167.97551999999996, "r": 559.19031, "b": 176.35015999999996, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "we will elaborate on how we designed and executed this large-scale", "bbox": {"l": 317.62299, "t": 178.93451000000005, "r": 558.20422, "b": 187.30913999999996, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "human annotation campaign. We will also share key insights and", "bbox": {"l": 317.95499, "t": 189.89355, "r": 558.19763, "b": 198.26819, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "lessons learned that might prove helpful for other parties planning", "bbox": {"l": 317.95499, "t": 200.85253999999998, "r": 558.20612, "b": 209.22717, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "to set up annotation campaigns.", "bbox": {"l": 317.95499, "t": 211.81151999999997, "r": 434.94861, "b": 220.18615999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 317.73099, "t": 222.77057000000002, "r": 559.58197, "b": 307.85718, "coord_origin": "TOPLEFT"}, "confidence": 0.9844217300415039, "cells": [{"id": 92, "text": "In Section 5, we will present baseline accuracy numbers for a", "bbox": {"l": 327.918, "t": 222.77057000000002, "r": 558.19836, "b": 231.14520000000005, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "variety of object detection methods (Faster R-CNN, Mask R-CNN", "bbox": {"l": 317.73099, "t": 233.72955000000002, "r": 558.1991, "b": 242.10419000000002, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "and YOLOv5) trained on DocLayNet. We further show how the", "bbox": {"l": 317.95499, "t": 244.68854, "r": 558.20416, "b": 253.06317, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "model performance is impacted by varying the DocLayNet dataset", "bbox": {"l": 317.95499, "t": 255.64752, "r": 558.20563, "b": 264.02216, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "size, reducing the label set and modifying the train/test-split. Last", "bbox": {"l": 317.95499, "t": 266.60553000000004, "r": 558.19861, "b": 274.98015999999996, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "but not least, we compare the performance of models trained on", "bbox": {"l": 317.95499, "t": 277.56458, "r": 558.20416, "b": 285.93918, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "PubLayNet, DocBank and DocLayNet and demonstrate that a model", "bbox": {"l": 317.95499, "t": 288.52353, "r": 558.20239, "b": 296.89816, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "trained on DocLayNet provides overall more robust layout recovery.", "bbox": {"l": 317.95499, "t": 299.48254, "r": 559.58197, "b": 307.85718, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "section_header", "bbox": {"l": 317.95499, "t": 321.20889, "r": 421.74411, "b": 331.51797, "coord_origin": "TOPLEFT"}, "confidence": 0.9347459077835083, "cells": [{"id": 100, "text": "2", "bbox": {"l": 317.95499, "t": 321.20889, "r": 323.10388, "b": 331.51797, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "RELATED WORK", "bbox": {"l": 333.12115, "t": 321.20889, "r": 421.74411, "b": 331.51797, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 317.52499, "t": 346.3325500000001, "r": 559.71613, "b": 464.29617, "coord_origin": "TOPLEFT"}, "confidence": 0.9860377907752991, "cells": [{"id": 102, "text": "While early approaches in document-layout analysis used rule-", "bbox": {"l": 317.52499, "t": 346.3325500000001, "r": 559.71301, "b": 354.70717999999994, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "based algorithms and heuristics [8], the problem is lately addressed", "bbox": {"l": 317.95499, "t": 357.29153, "r": 558.20276, "b": 365.66617, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "with deep learning methods. The most common approach is to lever-", "bbox": {"l": 317.62299, "t": 368.25055, "r": 559.71564, "b": 376.62518, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "age object detection models [9-15]. In the last decade, the accuracy", "bbox": {"l": 317.95499, "t": 379.2095299999999, "r": 558.43365, "b": 387.58417, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "and speed of these models has increased dramatically. Furthermore,", "bbox": {"l": 317.95499, "t": 390.16855000000004, "r": 559.18658, "b": 398.54318, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "most state-of-the-art object detection methods can be trained and", "bbox": {"l": 317.95499, "t": 401.12753, "r": 558.20502, "b": 409.50217, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "applied with very little work, thanks to a standardisation effort", "bbox": {"l": 317.95499, "t": 412.08655, "r": 558.20422, "b": 420.46118, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "of the ground-truth data format [16] and common deep-learning", "bbox": {"l": 317.95499, "t": 423.04553, "r": 558.20477, "b": 431.4201699999999, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "frameworks [17]. Reference data sets such as PubLayNet [6] and", "bbox": {"l": 317.95499, "t": 434.00354, "r": 558.19952, "b": 442.37817, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "DocBank provide their data in the commonly accepted COCO for-", "bbox": {"l": 317.95499, "t": 444.96252, "r": 559.71613, "b": 453.33716, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "mat [16].", "bbox": {"l": 317.95499, "t": 455.92154, "r": 350.90652, "b": 464.29617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 317.95499, "t": 466.88052, "r": 559.18646, "b": 551.96817, "coord_origin": "TOPLEFT"}, "confidence": 0.9861046671867371, "cells": [{"id": 113, "text": "Lately, new types of ML models for document-layout analysis", "bbox": {"l": 327.918, "t": 466.88052, "r": 558.19824, "b": 475.25516, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "have emerged in the community [18-21]. These models do not", "bbox": {"l": 317.95499, "t": 477.83954, "r": 558.20551, "b": 486.21417, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "approach the problem of layout analysis purely based on an image", "bbox": {"l": 317.95499, "t": 488.79855, "r": 558.20575, "b": 497.17319, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "representation of the page, as computer vision methods do. Instead,", "bbox": {"l": 317.95499, "t": 499.75754, "r": 559.18646, "b": 508.13217, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "they combine the text tokens and image representation of a page", "bbox": {"l": 317.95499, "t": 510.71655, "r": 558.2002, "b": 519.09119, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "in order to obtain a segmentation. While the reported accuracies", "bbox": {"l": 317.95499, "t": 521.67554, "r": 558.20618, "b": 530.05017, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "appear to be promising, a broadly accepted data format which links", "bbox": {"l": 317.95499, "t": 532.63455, "r": 558.20239, "b": 541.00917, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "geometric and textual features has yet to establish.", "bbox": {"l": 317.95499, "t": 543.59355, "r": 503.32648, "b": 551.96817, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "section_header", "bbox": {"l": 317.95499, "t": 565.3199, "r": 477.45688, "b": 575.629, "coord_origin": "TOPLEFT"}, "confidence": 0.9331073760986328, "cells": [{"id": 121, "text": "3", "bbox": {"l": 317.95499, "t": 565.3199, "r": 322.97391, "b": 575.629, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "THE DOCLAYNET DATASET", "bbox": {"l": 332.73831, "t": 565.3199, "r": 477.45688, "b": 575.629, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 317.95499, "t": 590.4435599999999, "r": 559.7132, "b": 675.53017, "coord_origin": "TOPLEFT"}, "confidence": 0.9852981567382812, "cells": [{"id": 123, "text": "DocLayNet contains 80863 PDF pages. Among these, 7059 carry two", "bbox": {"l": 317.95499, "t": 590.4435599999999, "r": 558.20233, "b": 598.81818, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "instances of human annotations, and 1591 carry three. This amounts", "bbox": {"l": 317.95499, "t": 601.40256, "r": 558.20239, "b": 609.77718, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "to 91104 total annotation instances. The annotations provide lay-", "bbox": {"l": 317.95499, "t": 612.36055, "r": 559.7132, "b": 620.73517, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "out information in the shape of labeled, rectangular bounding-", "bbox": {"l": 317.95499, "t": 623.3195499999999, "r": 559.71313, "b": 631.69417, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "boxes. We define 11 distinct labels for layout features, namely", "bbox": {"l": 317.95499, "t": 634.27855, "r": 539.92047, "b": 642.65317, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "Cap-", "bbox": {"l": 542.15802, "t": 634.32338, "r": 559.09888, "b": 642.66214, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "tion", "bbox": {"l": 317.95499, "t": 645.28238, "r": 331.86273, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": ",", "bbox": {"l": 331.86301, "t": 645.23755, "r": 333.83957, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "Footnote", "bbox": {"l": 336.064, "t": 645.28238, "r": 366.05368, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": ",", "bbox": {"l": 366.05301, "t": 645.23755, "r": 368.02957, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "Formula", "bbox": {"l": 370.254, "t": 645.28238, "r": 400.05502, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": ",", "bbox": {"l": 400.05499, "t": 645.23755, "r": 402.03156, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "List-item", "bbox": {"l": 404.25601, "t": 645.28238, "r": 436.19531, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": ",", "bbox": {"l": 436.19501, "t": 645.23755, "r": 438.17157, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "Page-footer", "bbox": {"l": 440.396, "t": 645.28238, "r": 480.60988999999995, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": ",", "bbox": {"l": 480.60999, "t": 645.23755, "r": 482.58655000000005, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "Page-header", "bbox": {"l": 484.811, "t": 645.28238, "r": 528.37604, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": ",", "bbox": {"l": 528.375, "t": 645.23755, "r": 530.35156, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "Picture", "bbox": {"l": 532.57599, "t": 645.28238, "r": 557.211, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": ",", "bbox": {"l": 557.211, "t": 645.23755, "r": 559.18756, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "Section-header", "bbox": {"l": 317.95499, "t": 656.2413799999999, "r": 368.78821, "b": 664.58013, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": ",", "bbox": {"l": 368.789, "t": 656.19655, "r": 370.72217, "b": 664.5711699999999, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "Table", "bbox": {"l": 372.89999, "t": 656.2413799999999, "r": 391.57254, "b": 664.58013, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": ",", "bbox": {"l": 391.573, "t": 656.19655, "r": 393.50616, "b": 664.5711699999999, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "Text", "bbox": {"l": 395.68399, "t": 656.2413799999999, "r": 410.23538, "b": 664.58013, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": ", and", "bbox": {"l": 410.23099, "t": 656.19655, "r": 427.5679, "b": 664.5711699999999, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "Title", "bbox": {"l": 429.74399, "t": 656.2413799999999, "r": 445.50800000000004, "b": 664.58013, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": ". Our reasoning for picking this", "bbox": {"l": 445.50800000000004, "t": 656.19655, "r": 558.20227, "b": 664.5711699999999, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "particular label set is detailed in Section 4.", "bbox": {"l": 317.95499, "t": 667.15556, "r": 472.22198, "b": 675.53017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "text", "bbox": {"l": 317.95499, "t": 678.11456, "r": 558.2041, "b": 708.4071730000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9749757051467896, "cells": [{"id": 152, "text": "In addition to open intellectual property constraints for the", "bbox": {"l": 327.918, "t": 678.11456, "r": 558.19843, "b": 686.4891700000001, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "source documents, we required that the documents in DocLayNet", "bbox": {"l": 317.95499, "t": 689.07355, "r": 558.19867, "b": 697.448174, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "adhere to a few conditions. Firstly, we kept scanned documents", "bbox": {"l": 317.95499, "t": 700.032555, "r": 558.2041, "b": 708.4071730000001, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_header", "id": 19, "page_no": 1, "cluster": {"id": 19, "label": "page_header", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.7682238221168518, "cells": [{"id": 0, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 246.24382, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar", "bbox": {"l": 253.13897999999998, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "KDD '22, August 14-18, 2022, Washington, DC, USA Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar"}, {"label": "section_header", "id": 14, "page_no": 1, "cluster": {"id": 14, "label": "section_header", "bbox": {"l": 53.79800000000001, "t": 85.85986000000003, "r": 156.52899, "b": 96.16900999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9367801547050476, "cells": [{"id": 2, "text": "1", "bbox": {"l": 53.79800000000001, "t": 85.85986000000003, "r": 59.427395, "b": 96.16900999999996, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "INTRODUCTION", "bbox": {"l": 70.379532, "t": 85.85986000000003, "r": 156.52899, "b": 96.16900999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1 INTRODUCTION"}, {"label": "text", "id": 5, "page_no": 1, "cluster": {"id": 5, "label": "text", "bbox": {"l": 53.528999, "t": 110.98352, "r": 303.01697, "b": 228.94714, "coord_origin": "TOPLEFT"}, "confidence": 0.9802607893943787, "cells": [{"id": 4, "text": "Despite the substantial improvements achieved with machine-learning", "bbox": {"l": 53.79800000000001, "t": 110.98352, "r": 303.01697, "b": 119.35815000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "(ML) approaches and deep neural networks in recent years, docu-", "bbox": {"l": 53.528999, "t": 121.94256999999993, "r": 295.55695, "b": 130.31719999999996, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "ment conversion remains a challenging problem, as demonstrated", "bbox": {"l": 53.79800000000001, "t": 132.90155000000004, "r": 294.04642, "b": 141.27617999999995, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "by the numerous public competitions held on this topic [1-4]. The", "bbox": {"l": 53.79800000000001, "t": 143.85956, "r": 294.04733, "b": 152.23419, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "challenge originates from the huge variability in PDF documents", "bbox": {"l": 53.79800000000001, "t": 154.81853999999998, "r": 294.04349, "b": 163.19317999999998, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "regarding layout, language and formats (scanned, programmatic", "bbox": {"l": 53.79800000000001, "t": 165.77752999999996, "r": 294.04718, "b": 174.15215999999998, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "or a combination of both). Engineering a single ML model that can", "bbox": {"l": 53.79800000000001, "t": 176.73650999999995, "r": 294.04919, "b": 185.11114999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "be applied on all types of documents and provides high-quality", "bbox": {"l": 53.79800000000001, "t": 187.69556, "r": 294.27573, "b": 196.07019000000003, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "layout segmentation remains to this day extremely challenging [5].", "bbox": {"l": 53.79800000000001, "t": 198.65454, "r": 295.42569, "b": 207.02917000000002, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "To highlight the variability in document layouts, we show a few", "bbox": {"l": 53.528999, "t": 209.61352999999997, "r": 294.37256, "b": 217.98816, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "example documents from the DocLayNet dataset in Figure 1.", "bbox": {"l": 53.79800000000001, "t": 220.57250999999997, "r": 275.48334, "b": 228.94714, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Despite the substantial improvements achieved with machine-learning (ML) approaches and deep neural networks in recent years, document conversion remains a challenging problem, as demonstrated by the numerous public competitions held on this topic [1-4]. The challenge originates from the huge variability in PDF documents regarding layout, language and formats (scanned, programmatic or a combination of both). Engineering a single ML model that can be applied on all types of documents and provides high-quality layout segmentation remains to this day extremely challenging [5]. To highlight the variability in document layouts, we show a few example documents from the DocLayNet dataset in Figure 1."}, {"label": "text", "id": 7, "page_no": 1, "cluster": {"id": 7, "label": "text", "bbox": {"l": 53.528999, "t": 231.53156, "r": 295.56412, "b": 502.91916, "coord_origin": "TOPLEFT"}, "confidence": 0.9793015718460083, "cells": [{"id": 15, "text": "A key problem in the process of document conversion is to under-", "bbox": {"l": 63.76100199999999, "t": 231.53156, "r": 295.564, "b": 239.90619000000004, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "stand the structure of a single document page, i.e. which segments", "bbox": {"l": 53.79800000000001, "t": 242.49054, "r": 294.04868, "b": 250.86517000000003, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "of text should be grouped together in a unit. To train models for this", "bbox": {"l": 53.79800000000001, "t": 253.44854999999995, "r": 294.04532, "b": 261.82318, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "task, there are currently two large datasets available to the com-", "bbox": {"l": 53.79800000000001, "t": 264.40752999999995, "r": 295.55618, "b": 272.78216999999995, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "munity, PubLayNet [6] and DocBank [7]. They were introduced", "bbox": {"l": 53.79800000000001, "t": 275.36658, "r": 294.04059, "b": 283.74118, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "in 2019 and 2020 respectively and significantly accelerated the im-", "bbox": {"l": 53.79800000000001, "t": 286.32552999999996, "r": 295.55783, "b": 294.70016, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "plementation of layout detection and segmentation models due to", "bbox": {"l": 53.79800000000001, "t": 297.28455, "r": 294.04538, "b": 305.65918000000005, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "their sizes of 300K and 500K ground-truth pages. These sizes were", "bbox": {"l": 53.79800000000001, "t": 308.24353, "r": 294.043, "b": 316.61816, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "achieved by leveraging an automation approach. The benefit of au-", "bbox": {"l": 53.79800000000001, "t": 319.20255, "r": 295.56412, "b": 327.57718, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "tomated ground-truth generation is obvious: one can generate large", "bbox": {"l": 53.79800000000001, "t": 330.16153, "r": 294.04532, "b": 338.53616, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "ground-truth datasets at virtually no cost. However, the automation", "bbox": {"l": 53.79800000000001, "t": 341.12054, "r": 294.04538, "b": 349.49518, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "introduces a constraint on the variability in the dataset, because", "bbox": {"l": 53.79800000000001, "t": 352.07953, "r": 294.04712, "b": 360.45416000000006, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "corresponding structured source data must be available. PubLayNet", "bbox": {"l": 53.79800000000001, "t": 363.03853999999995, "r": 294.04538, "b": 371.41318, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "and DocBank were both generated from scientific document repos-", "bbox": {"l": 53.79800000000001, "t": 373.99655, "r": 295.55643, "b": 382.37119, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "itories (PubMed and arXiv), which provide XML or L", "bbox": {"l": 53.79800000000001, "t": 384.95554, "r": 246.75909, "b": 393.33017, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "A", "bbox": {"l": 243.53101000000004, "t": 385.03183000000007, "r": 248.58553000000003, "b": 391.82455, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "T", "bbox": {"l": 247.24099999999999, "t": 384.95554, "r": 252.58859, "b": 393.33017, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "E", "bbox": {"l": 251.09398999999996, "t": 386.87954999999994, "r": 256.08829, "b": 395.25418, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "X", "bbox": {"l": 254.967, "t": 384.95554, "r": 261.33725, "b": 393.33017, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "sources.", "bbox": {"l": 263.75021, "t": 384.95554, "r": 295.42773, "b": 393.33017, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "Those scientific documents present a limited variability in their", "bbox": {"l": 53.528999, "t": 395.91455, "r": 294.21713, "b": 404.28918, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "layouts, because they are typeset in uniform templates provided by", "bbox": {"l": 53.79800000000001, "t": 406.87354, "r": 294.27386, "b": 415.24817, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "the publishers. Obviously, documents such as technical manuals,", "bbox": {"l": 53.79800000000001, "t": 417.8325500000001, "r": 295.03488, "b": 426.20717999999994, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "annual company reports, legal text, government tenders, etc. have", "bbox": {"l": 53.79800000000001, "t": 428.79153, "r": 294.04691, "b": 437.16617, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "very different and partially unique layouts. As a consequence, the", "bbox": {"l": 53.57400100000001, "t": 439.75055, "r": 294.04865, "b": 448.12518, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "layout predictions obtained from models trained on PubLayNet or", "bbox": {"l": 53.79800000000001, "t": 450.7095299999999, "r": 294.21643, "b": 459.08417, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "DocBank is very reasonable when applied on scientific documents.", "bbox": {"l": 53.79800000000001, "t": 461.66855, "r": 295.42181, "b": 470.04318, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "However, for more", "bbox": {"l": 53.79800000000001, "t": 472.62753, "r": 125.52795, "b": 481.00217, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "artistic", "bbox": {"l": 128.608, "t": 472.67239, "r": 153.7679, "b": 481.01114, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "or", "bbox": {"l": 157.15199, "t": 472.62753, "r": 165.16365, "b": 481.00217, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "free-style", "bbox": {"l": 168.248, "t": 472.67239, "r": 201.49272, "b": 481.01114, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "layouts, we see sub-par", "bbox": {"l": 204.78799, "t": 472.62753, "r": 294.21494, "b": 481.00217, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "prediction quality from these models, which we demonstrate in", "bbox": {"l": 53.79800000000001, "t": 483.58554, "r": 294.04715, "b": 491.96017, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Section 5.", "bbox": {"l": 53.79800000000001, "t": 494.54453, "r": 89.080788, "b": 502.91916, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "A key problem in the process of document conversion is to understand the structure of a single document page, i.e. which segments of text should be grouped together in a unit. To train models for this task, there are currently two large datasets available to the community, PubLayNet [6] and DocBank [7]. They were introduced in 2019 and 2020 respectively and significantly accelerated the implementation of layout detection and segmentation models due to their sizes of 300K and 500K ground-truth pages. These sizes were achieved by leveraging an automation approach. The benefit of automated ground-truth generation is obvious: one can generate large ground-truth datasets at virtually no cost. However, the automation introduces a constraint on the variability in the dataset, because corresponding structured source data must be available. PubLayNet and DocBank were both generated from scientific document repositories (PubMed and arXiv), which provide XML or L A T E X sources. Those scientific documents present a limited variability in their layouts, because they are typeset in uniform templates provided by the publishers. Obviously, documents such as technical manuals, annual company reports, legal text, government tenders, etc. have very different and partially unique layouts. As a consequence, the layout predictions obtained from models trained on PubLayNet or DocBank is very reasonable when applied on scientific documents. However, for more artistic or free-style layouts, we see sub-par prediction quality from these models, which we demonstrate in Section 5."}, {"label": "text", "id": 6, "page_no": 1, "cluster": {"id": 6, "label": "text", "bbox": {"l": 53.591999, "t": 505.50354, "r": 295.56396, "b": 579.63217, "coord_origin": "TOPLEFT"}, "confidence": 0.9795253276824951, "cells": [{"id": 49, "text": "In this paper, we present the DocLayNet dataset. It provides page-", "bbox": {"l": 63.76100199999999, "t": 505.50354, "r": 295.56396, "b": 513.87817, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "by-page layout annotation ground-truth using bounding-boxes for", "bbox": {"l": 53.79800000000001, "t": 516.46252, "r": 294.21271, "b": 524.83716, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "11", "bbox": {"l": 53.591999, "t": 527.42154, "r": 61.92275599999999, "b": 535.7961700000001, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "distinct class labels on 80863 unique document pages, of which", "bbox": {"l": 64.162201, "t": 527.42154, "r": 294.04626, "b": 535.7961700000001, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "a fraction carry double- or triple-annotations. DocLayNet is similar", "bbox": {"l": 53.79800000000001, "t": 538.38055, "r": 294.21228, "b": 546.75517, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "in spirit to PubLayNet and DocBank and will likewise be made", "bbox": {"l": 53.79800000000001, "t": 549.33955, "r": 294.04709, "b": 557.71417, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "available to the public", "bbox": {"l": 53.79800000000001, "t": 560.29855, "r": 134.28951, "b": 568.67317, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "1", "bbox": {"l": 134.29201, "t": 558.23083, "r": 137.67381, "b": 565.0235299999999, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "in order to stimulate the document-layout", "bbox": {"l": 140.418, "t": 560.29855, "r": 294.047, "b": 568.67317, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "analysis community. It distinguishes itself in the following aspects:", "bbox": {"l": 53.79800000000001, "t": 571.25755, "r": 295.10538, "b": 579.63217, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In this paper, we present the DocLayNet dataset. It provides pageby-page layout annotation ground-truth using bounding-boxes for 11 distinct class labels on 80863 unique document pages, of which a fraction carry double- or triple-annotations. DocLayNet is similar in spirit to PubLayNet and DocBank and will likewise be made available to the public 1 in order to stimulate the document-layout analysis community. It distinguishes itself in the following aspects:"}, {"label": "list_item", "id": 9, "page_no": 1, "cluster": {"id": 9, "label": "list_item", "bbox": {"l": 64.708, "t": 584.58156, "r": 295.56165, "b": 614.87418, "coord_origin": "TOPLEFT"}, "confidence": 0.9687220454216003, "cells": [{"id": 59, "text": "(1)", "bbox": {"l": 64.708, "t": 584.58156, "r": 74.221352, "b": 592.95618, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Human Annotation", "bbox": {"l": 78.207001, "t": 584.62639, "r": 146.39589, "b": 592.96515, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": ": In contrast to PubLayNet and DocBank,", "bbox": {"l": 146.41701, "t": 584.58156, "r": 295.03036, "b": 592.95618, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "we relied on human annotation instead of automation ap-", "bbox": {"l": 77.875, "t": 595.54056, "r": 295.56165, "b": 603.91518, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "proaches to generate the data set.", "bbox": {"l": 78.207001, "t": 606.49956, "r": 200.6432, "b": 614.87418, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "(1) Human Annotation : In contrast to PubLayNet and DocBank, we relied on human annotation instead of automation approaches to generate the data set."}, {"label": "list_item", "id": 11, "page_no": 1, "cluster": {"id": 11, "label": "list_item", "bbox": {"l": 64.708, "t": 617.45856, "r": 294.26254, "b": 636.79117, "coord_origin": "TOPLEFT"}, "confidence": 0.9594229459762573, "cells": [{"id": 64, "text": "(2)", "bbox": {"l": 64.708, "t": 617.45856, "r": 74.221352, "b": 625.8331800000001, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "Large Layout Variability", "bbox": {"l": 78.207001, "t": 617.50339, "r": 167.91745, "b": 625.84215, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": ": We include diverse and complex", "bbox": {"l": 168.33501, "t": 617.45856, "r": 294.26254, "b": 625.8331800000001, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "layouts from a large variety of public sources.", "bbox": {"l": 78.207001, "t": 628.41655, "r": 245.45726000000002, "b": 636.79117, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "(2) Large Layout Variability : We include diverse and complex layouts from a large variety of public sources."}, {"label": "list_item", "id": 10, "page_no": 1, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 64.708, "t": 639.37555, "r": 294.68381, "b": 669.66817, "coord_origin": "TOPLEFT"}, "confidence": 0.9615103006362915, "cells": [{"id": 68, "text": "(3)", "bbox": {"l": 64.708, "t": 639.37555, "r": 74.221352, "b": 647.75017, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "Detailed Label Set", "bbox": {"l": 78.207001, "t": 639.42038, "r": 143.51663, "b": 647.75914, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": ": We define 11 class labels to distinguish", "bbox": {"l": 144.02, "t": 639.37555, "r": 294.04648, "b": 647.75017, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "layout features in high detail. PubLayNet provides 5 labels;", "bbox": {"l": 78.207001, "t": 650.33455, "r": 294.68381, "b": 658.70917, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "DocBank provides 13, although not a superset of ours.", "bbox": {"l": 78.207001, "t": 661.29355, "r": 276.33752, "b": 669.66817, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "(3) Detailed Label Set : We define 11 class labels to distinguish layout features in high detail. PubLayNet provides 5 labels; DocBank provides 13, although not a superset of ours."}, {"label": "list_item", "id": 13, "page_no": 1, "cluster": {"id": 13, "label": "list_item", "bbox": {"l": 64.708, "t": 672.25256, "r": 295.56439, "b": 691.58617, "coord_origin": "TOPLEFT"}, "confidence": 0.9447500109672546, "cells": [{"id": 73, "text": "(4)", "bbox": {"l": 64.708, "t": 672.25256, "r": 74.221352, "b": 680.62717, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "Redundant Annotations", "bbox": {"l": 78.207001, "t": 672.29739, "r": 163.78357, "b": 680.63614, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": ": A fraction of the pages in the Do-", "bbox": {"l": 163.994, "t": 672.25256, "r": 295.56439, "b": 680.62717, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "cLayNet data set carry more than one human annotation.", "bbox": {"l": 78.207001, "t": 683.21156, "r": 295.42719, "b": 691.58617, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "(4) Redundant Annotations : A fraction of the pages in the DocLayNet data set carry more than one human annotation."}, {"label": "footnote", "id": 17, "page_no": 1, "cluster": {"id": 17, "label": "footnote", "bbox": {"l": 53.672001, "t": 702.226364, "r": 216.02750000000003, "b": 708.739891, "coord_origin": "TOPLEFT"}, "confidence": 0.8584771752357483, "cells": [{"id": 77, "text": "$^{1}$https://developer.ibm.com/exchanges/data/all/doclaynet", "bbox": {"l": 53.672001, "t": 702.226364, "r": 216.02750000000003, "b": 708.739891, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "$^{1}$https://developer.ibm.com/exchanges/data/all/doclaynet"}, {"label": "text", "id": 18, "page_no": 1, "cluster": {"id": 18, "label": "text", "bbox": {"l": 342.095, "t": 87.36352999999997, "r": 558.43201, "b": 106.69713999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.7997146844863892, "cells": [{"id": 78, "text": "This enables experimentation with annotation uncertainty", "bbox": {"l": 342.095, "t": 87.36352999999997, "r": 558.43201, "b": 95.73816, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "and quality control analysis.", "bbox": {"l": 342.36401, "t": 98.32250999999997, "r": 445.83629999999994, "b": 106.69713999999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "This enables experimentation with annotation uncertainty and quality control analysis."}, {"label": "list_item", "id": 12, "page_no": 1, "cluster": {"id": 12, "label": "list_item", "bbox": {"l": 328.86502, "t": 109.28148999999996, "r": 559.72101, "b": 161.49114999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9563499093055725, "cells": [{"id": 80, "text": "(5)", "bbox": {"l": 328.86502, "t": 109.28148999999996, "r": 338.37836, "b": 117.65612999999996, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Pre-defined Train-, Test- & Validation-set", "bbox": {"l": 342.36401, "t": 109.32641999999998, "r": 487.25296, "b": 117.66516000000001, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": ": Like DocBank, we", "bbox": {"l": 487.75900000000007, "t": 109.28156000000001, "r": 558.20294, "b": 117.65618999999992, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "provide fixed train-, test- & validation-sets to ensure propor-", "bbox": {"l": 342.36401, "t": 120.24054000000001, "r": 559.72101, "b": 128.61517000000003, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "tional representation of the class-labels. Further, we prevent", "bbox": {"l": 342.36401, "t": 131.19854999999995, "r": 558.20117, "b": 139.57317999999998, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "leakage of unique layouts across sets, which has a large effect", "bbox": {"l": 342.36401, "t": 142.15752999999995, "r": 558.20087, "b": 150.53216999999995, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "on model accuracy scores.", "bbox": {"l": 342.36401, "t": 153.11652000000004, "r": 438.0624399999999, "b": 161.49114999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "(5) Pre-defined Train-, Test- & Validation-set : Like DocBank, we provide fixed train-, test- & validation-sets to ensure proportional representation of the class-labels. Further, we prevent leakage of unique layouts across sets, which has a large effect on model accuracy scores."}, {"label": "text", "id": 4, "page_no": 1, "cluster": {"id": 4, "label": "text", "bbox": {"l": 317.62299, "t": 167.97551999999996, "r": 559.19031, "b": 220.18615999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9813903570175171, "cells": [{"id": 87, "text": "All aspects outlined above are detailed in Section 3. In Section 4,", "bbox": {"l": 327.918, "t": 167.97551999999996, "r": 559.19031, "b": 176.35015999999996, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "we will elaborate on how we designed and executed this large-scale", "bbox": {"l": 317.62299, "t": 178.93451000000005, "r": 558.20422, "b": 187.30913999999996, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "human annotation campaign. We will also share key insights and", "bbox": {"l": 317.95499, "t": 189.89355, "r": 558.19763, "b": 198.26819, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "lessons learned that might prove helpful for other parties planning", "bbox": {"l": 317.95499, "t": 200.85253999999998, "r": 558.20612, "b": 209.22717, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "to set up annotation campaigns.", "bbox": {"l": 317.95499, "t": 211.81151999999997, "r": 434.94861, "b": 220.18615999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "All aspects outlined above are detailed in Section 3. In Section 4, we will elaborate on how we designed and executed this large-scale human annotation campaign. We will also share key insights and lessons learned that might prove helpful for other parties planning to set up annotation campaigns."}, {"label": "text", "id": 3, "page_no": 1, "cluster": {"id": 3, "label": "text", "bbox": {"l": 317.73099, "t": 222.77057000000002, "r": 559.58197, "b": 307.85718, "coord_origin": "TOPLEFT"}, "confidence": 0.9844217300415039, "cells": [{"id": 92, "text": "In Section 5, we will present baseline accuracy numbers for a", "bbox": {"l": 327.918, "t": 222.77057000000002, "r": 558.19836, "b": 231.14520000000005, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "variety of object detection methods (Faster R-CNN, Mask R-CNN", "bbox": {"l": 317.73099, "t": 233.72955000000002, "r": 558.1991, "b": 242.10419000000002, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "and YOLOv5) trained on DocLayNet. We further show how the", "bbox": {"l": 317.95499, "t": 244.68854, "r": 558.20416, "b": 253.06317, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "model performance is impacted by varying the DocLayNet dataset", "bbox": {"l": 317.95499, "t": 255.64752, "r": 558.20563, "b": 264.02216, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "size, reducing the label set and modifying the train/test-split. Last", "bbox": {"l": 317.95499, "t": 266.60553000000004, "r": 558.19861, "b": 274.98015999999996, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "but not least, we compare the performance of models trained on", "bbox": {"l": 317.95499, "t": 277.56458, "r": 558.20416, "b": 285.93918, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "PubLayNet, DocBank and DocLayNet and demonstrate that a model", "bbox": {"l": 317.95499, "t": 288.52353, "r": 558.20239, "b": 296.89816, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "trained on DocLayNet provides overall more robust layout recovery.", "bbox": {"l": 317.95499, "t": 299.48254, "r": 559.58197, "b": 307.85718, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In Section 5, we will present baseline accuracy numbers for a variety of object detection methods (Faster R-CNN, Mask R-CNN and YOLOv5) trained on DocLayNet. We further show how the model performance is impacted by varying the DocLayNet dataset size, reducing the label set and modifying the train/test-split. Last but not least, we compare the performance of models trained on PubLayNet, DocBank and DocLayNet and demonstrate that a model trained on DocLayNet provides overall more robust layout recovery."}, {"label": "section_header", "id": 15, "page_no": 1, "cluster": {"id": 15, "label": "section_header", "bbox": {"l": 317.95499, "t": 321.20889, "r": 421.74411, "b": 331.51797, "coord_origin": "TOPLEFT"}, "confidence": 0.9347459077835083, "cells": [{"id": 100, "text": "2", "bbox": {"l": 317.95499, "t": 321.20889, "r": 323.10388, "b": 331.51797, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "RELATED WORK", "bbox": {"l": 333.12115, "t": 321.20889, "r": 421.74411, "b": 331.51797, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2 RELATED WORK"}, {"label": "text", "id": 1, "page_no": 1, "cluster": {"id": 1, "label": "text", "bbox": {"l": 317.52499, "t": 346.3325500000001, "r": 559.71613, "b": 464.29617, "coord_origin": "TOPLEFT"}, "confidence": 0.9860377907752991, "cells": [{"id": 102, "text": "While early approaches in document-layout analysis used rule-", "bbox": {"l": 317.52499, "t": 346.3325500000001, "r": 559.71301, "b": 354.70717999999994, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "based algorithms and heuristics [8], the problem is lately addressed", "bbox": {"l": 317.95499, "t": 357.29153, "r": 558.20276, "b": 365.66617, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "with deep learning methods. The most common approach is to lever-", "bbox": {"l": 317.62299, "t": 368.25055, "r": 559.71564, "b": 376.62518, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "age object detection models [9-15]. In the last decade, the accuracy", "bbox": {"l": 317.95499, "t": 379.2095299999999, "r": 558.43365, "b": 387.58417, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "and speed of these models has increased dramatically. Furthermore,", "bbox": {"l": 317.95499, "t": 390.16855000000004, "r": 559.18658, "b": 398.54318, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "most state-of-the-art object detection methods can be trained and", "bbox": {"l": 317.95499, "t": 401.12753, "r": 558.20502, "b": 409.50217, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "applied with very little work, thanks to a standardisation effort", "bbox": {"l": 317.95499, "t": 412.08655, "r": 558.20422, "b": 420.46118, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "of the ground-truth data format [16] and common deep-learning", "bbox": {"l": 317.95499, "t": 423.04553, "r": 558.20477, "b": 431.4201699999999, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "frameworks [17]. Reference data sets such as PubLayNet [6] and", "bbox": {"l": 317.95499, "t": 434.00354, "r": 558.19952, "b": 442.37817, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "DocBank provide their data in the commonly accepted COCO for-", "bbox": {"l": 317.95499, "t": 444.96252, "r": 559.71613, "b": 453.33716, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "mat [16].", "bbox": {"l": 317.95499, "t": 455.92154, "r": 350.90652, "b": 464.29617, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "While early approaches in document-layout analysis used rulebased algorithms and heuristics [8], the problem is lately addressed with deep learning methods. The most common approach is to leverage object detection models [9-15]. In the last decade, the accuracy and speed of these models has increased dramatically. Furthermore, most state-of-the-art object detection methods can be trained and applied with very little work, thanks to a standardisation effort of the ground-truth data format [16] and common deep-learning frameworks [17]. Reference data sets such as PubLayNet [6] and DocBank provide their data in the commonly accepted COCO format [16]."}, {"label": "text", "id": 0, "page_no": 1, "cluster": {"id": 0, "label": "text", "bbox": {"l": 317.95499, "t": 466.88052, "r": 559.18646, "b": 551.96817, "coord_origin": "TOPLEFT"}, "confidence": 0.9861046671867371, "cells": [{"id": 113, "text": "Lately, new types of ML models for document-layout analysis", "bbox": {"l": 327.918, "t": 466.88052, "r": 558.19824, "b": 475.25516, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "have emerged in the community [18-21]. These models do not", "bbox": {"l": 317.95499, "t": 477.83954, "r": 558.20551, "b": 486.21417, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "approach the problem of layout analysis purely based on an image", "bbox": {"l": 317.95499, "t": 488.79855, "r": 558.20575, "b": 497.17319, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "representation of the page, as computer vision methods do. Instead,", "bbox": {"l": 317.95499, "t": 499.75754, "r": 559.18646, "b": 508.13217, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "they combine the text tokens and image representation of a page", "bbox": {"l": 317.95499, "t": 510.71655, "r": 558.2002, "b": 519.09119, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "in order to obtain a segmentation. While the reported accuracies", "bbox": {"l": 317.95499, "t": 521.67554, "r": 558.20618, "b": 530.05017, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "appear to be promising, a broadly accepted data format which links", "bbox": {"l": 317.95499, "t": 532.63455, "r": 558.20239, "b": 541.00917, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "geometric and textual features has yet to establish.", "bbox": {"l": 317.95499, "t": 543.59355, "r": 503.32648, "b": 551.96817, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Lately, new types of ML models for document-layout analysis have emerged in the community [18-21]. These models do not approach the problem of layout analysis purely based on an image representation of the page, as computer vision methods do. Instead, they combine the text tokens and image representation of a page in order to obtain a segmentation. While the reported accuracies appear to be promising, a broadly accepted data format which links geometric and textual features has yet to establish."}, {"label": "section_header", "id": 16, "page_no": 1, "cluster": {"id": 16, "label": "section_header", "bbox": {"l": 317.95499, "t": 565.3199, "r": 477.45688, "b": 575.629, "coord_origin": "TOPLEFT"}, "confidence": 0.9331073760986328, "cells": [{"id": 121, "text": "3", "bbox": {"l": 317.95499, "t": 565.3199, "r": 322.97391, "b": 575.629, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "THE DOCLAYNET DATASET", "bbox": {"l": 332.73831, "t": 565.3199, "r": 477.45688, "b": 575.629, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3 THE DOCLAYNET DATASET"}, {"label": "text", "id": 2, "page_no": 1, "cluster": {"id": 2, "label": "text", "bbox": {"l": 317.95499, "t": 590.4435599999999, "r": 559.7132, "b": 675.53017, "coord_origin": "TOPLEFT"}, "confidence": 0.9852981567382812, "cells": [{"id": 123, "text": "DocLayNet contains 80863 PDF pages. Among these, 7059 carry two", "bbox": {"l": 317.95499, "t": 590.4435599999999, "r": 558.20233, "b": 598.81818, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "instances of human annotations, and 1591 carry three. This amounts", "bbox": {"l": 317.95499, "t": 601.40256, "r": 558.20239, "b": 609.77718, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "to 91104 total annotation instances. The annotations provide lay-", "bbox": {"l": 317.95499, "t": 612.36055, "r": 559.7132, "b": 620.73517, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "out information in the shape of labeled, rectangular bounding-", "bbox": {"l": 317.95499, "t": 623.3195499999999, "r": 559.71313, "b": 631.69417, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "boxes. We define 11 distinct labels for layout features, namely", "bbox": {"l": 317.95499, "t": 634.27855, "r": 539.92047, "b": 642.65317, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "Cap-", "bbox": {"l": 542.15802, "t": 634.32338, "r": 559.09888, "b": 642.66214, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "tion", "bbox": {"l": 317.95499, "t": 645.28238, "r": 331.86273, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": ",", "bbox": {"l": 331.86301, "t": 645.23755, "r": 333.83957, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "Footnote", "bbox": {"l": 336.064, "t": 645.28238, "r": 366.05368, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": ",", "bbox": {"l": 366.05301, "t": 645.23755, "r": 368.02957, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "Formula", "bbox": {"l": 370.254, "t": 645.28238, "r": 400.05502, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": ",", "bbox": {"l": 400.05499, "t": 645.23755, "r": 402.03156, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "List-item", "bbox": {"l": 404.25601, "t": 645.28238, "r": 436.19531, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": ",", "bbox": {"l": 436.19501, "t": 645.23755, "r": 438.17157, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "Page-footer", "bbox": {"l": 440.396, "t": 645.28238, "r": 480.60988999999995, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": ",", "bbox": {"l": 480.60999, "t": 645.23755, "r": 482.58655000000005, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "Page-header", "bbox": {"l": 484.811, "t": 645.28238, "r": 528.37604, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": ",", "bbox": {"l": 528.375, "t": 645.23755, "r": 530.35156, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "Picture", "bbox": {"l": 532.57599, "t": 645.28238, "r": 557.211, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": ",", "bbox": {"l": 557.211, "t": 645.23755, "r": 559.18756, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "Section-header", "bbox": {"l": 317.95499, "t": 656.2413799999999, "r": 368.78821, "b": 664.58013, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": ",", "bbox": {"l": 368.789, "t": 656.19655, "r": 370.72217, "b": 664.5711699999999, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "Table", "bbox": {"l": 372.89999, "t": 656.2413799999999, "r": 391.57254, "b": 664.58013, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": ",", "bbox": {"l": 391.573, "t": 656.19655, "r": 393.50616, "b": 664.5711699999999, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "Text", "bbox": {"l": 395.68399, "t": 656.2413799999999, "r": 410.23538, "b": 664.58013, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": ", and", "bbox": {"l": 410.23099, "t": 656.19655, "r": 427.5679, "b": 664.5711699999999, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "Title", "bbox": {"l": 429.74399, "t": 656.2413799999999, "r": 445.50800000000004, "b": 664.58013, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": ". Our reasoning for picking this", "bbox": {"l": 445.50800000000004, "t": 656.19655, "r": 558.20227, "b": 664.5711699999999, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "particular label set is detailed in Section 4.", "bbox": {"l": 317.95499, "t": 667.15556, "r": 472.22198, "b": 675.53017, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "DocLayNet contains 80863 PDF pages. Among these, 7059 carry two instances of human annotations, and 1591 carry three. This amounts to 91104 total annotation instances. The annotations provide layout information in the shape of labeled, rectangular boundingboxes. We define 11 distinct labels for layout features, namely Caption , Footnote , Formula , List-item , Page-footer , Page-header , Picture , Section-header , Table , Text , and Title . Our reasoning for picking this particular label set is detailed in Section 4."}, {"label": "text", "id": 8, "page_no": 1, "cluster": {"id": 8, "label": "text", "bbox": {"l": 317.95499, "t": 678.11456, "r": 558.2041, "b": 708.4071730000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9749757051467896, "cells": [{"id": 152, "text": "In addition to open intellectual property constraints for the", "bbox": {"l": 327.918, "t": 678.11456, "r": 558.19843, "b": 686.4891700000001, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "source documents, we required that the documents in DocLayNet", "bbox": {"l": 317.95499, "t": 689.07355, "r": 558.19867, "b": 697.448174, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "adhere to a few conditions. Firstly, we kept scanned documents", "bbox": {"l": 317.95499, "t": 700.032555, "r": 558.2041, "b": 708.4071730000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In addition to open intellectual property constraints for the source documents, we required that the documents in DocLayNet adhere to a few conditions. Firstly, we kept scanned documents"}], "body": [{"label": "section_header", "id": 14, "page_no": 1, "cluster": {"id": 14, "label": "section_header", "bbox": {"l": 53.79800000000001, "t": 85.85986000000003, "r": 156.52899, "b": 96.16900999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9367801547050476, "cells": [{"id": 2, "text": "1", "bbox": {"l": 53.79800000000001, "t": 85.85986000000003, "r": 59.427395, "b": 96.16900999999996, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "INTRODUCTION", "bbox": {"l": 70.379532, "t": 85.85986000000003, "r": 156.52899, "b": 96.16900999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1 INTRODUCTION"}, {"label": "text", "id": 5, "page_no": 1, "cluster": {"id": 5, "label": "text", "bbox": {"l": 53.528999, "t": 110.98352, "r": 303.01697, "b": 228.94714, "coord_origin": "TOPLEFT"}, "confidence": 0.9802607893943787, "cells": [{"id": 4, "text": "Despite the substantial improvements achieved with machine-learning", "bbox": {"l": 53.79800000000001, "t": 110.98352, "r": 303.01697, "b": 119.35815000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "(ML) approaches and deep neural networks in recent years, docu-", "bbox": {"l": 53.528999, "t": 121.94256999999993, "r": 295.55695, "b": 130.31719999999996, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "ment conversion remains a challenging problem, as demonstrated", "bbox": {"l": 53.79800000000001, "t": 132.90155000000004, "r": 294.04642, "b": 141.27617999999995, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "by the numerous public competitions held on this topic [1-4]. The", "bbox": {"l": 53.79800000000001, "t": 143.85956, "r": 294.04733, "b": 152.23419, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "challenge originates from the huge variability in PDF documents", "bbox": {"l": 53.79800000000001, "t": 154.81853999999998, "r": 294.04349, "b": 163.19317999999998, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "regarding layout, language and formats (scanned, programmatic", "bbox": {"l": 53.79800000000001, "t": 165.77752999999996, "r": 294.04718, "b": 174.15215999999998, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "or a combination of both). Engineering a single ML model that can", "bbox": {"l": 53.79800000000001, "t": 176.73650999999995, "r": 294.04919, "b": 185.11114999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "be applied on all types of documents and provides high-quality", "bbox": {"l": 53.79800000000001, "t": 187.69556, "r": 294.27573, "b": 196.07019000000003, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "layout segmentation remains to this day extremely challenging [5].", "bbox": {"l": 53.79800000000001, "t": 198.65454, "r": 295.42569, "b": 207.02917000000002, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "To highlight the variability in document layouts, we show a few", "bbox": {"l": 53.528999, "t": 209.61352999999997, "r": 294.37256, "b": 217.98816, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "example documents from the DocLayNet dataset in Figure 1.", "bbox": {"l": 53.79800000000001, "t": 220.57250999999997, "r": 275.48334, "b": 228.94714, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Despite the substantial improvements achieved with machine-learning (ML) approaches and deep neural networks in recent years, document conversion remains a challenging problem, as demonstrated by the numerous public competitions held on this topic [1-4]. The challenge originates from the huge variability in PDF documents regarding layout, language and formats (scanned, programmatic or a combination of both). Engineering a single ML model that can be applied on all types of documents and provides high-quality layout segmentation remains to this day extremely challenging [5]. To highlight the variability in document layouts, we show a few example documents from the DocLayNet dataset in Figure 1."}, {"label": "text", "id": 7, "page_no": 1, "cluster": {"id": 7, "label": "text", "bbox": {"l": 53.528999, "t": 231.53156, "r": 295.56412, "b": 502.91916, "coord_origin": "TOPLEFT"}, "confidence": 0.9793015718460083, "cells": [{"id": 15, "text": "A key problem in the process of document conversion is to under-", "bbox": {"l": 63.76100199999999, "t": 231.53156, "r": 295.564, "b": 239.90619000000004, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "stand the structure of a single document page, i.e. which segments", "bbox": {"l": 53.79800000000001, "t": 242.49054, "r": 294.04868, "b": 250.86517000000003, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "of text should be grouped together in a unit. To train models for this", "bbox": {"l": 53.79800000000001, "t": 253.44854999999995, "r": 294.04532, "b": 261.82318, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "task, there are currently two large datasets available to the com-", "bbox": {"l": 53.79800000000001, "t": 264.40752999999995, "r": 295.55618, "b": 272.78216999999995, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "munity, PubLayNet [6] and DocBank [7]. They were introduced", "bbox": {"l": 53.79800000000001, "t": 275.36658, "r": 294.04059, "b": 283.74118, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "in 2019 and 2020 respectively and significantly accelerated the im-", "bbox": {"l": 53.79800000000001, "t": 286.32552999999996, "r": 295.55783, "b": 294.70016, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "plementation of layout detection and segmentation models due to", "bbox": {"l": 53.79800000000001, "t": 297.28455, "r": 294.04538, "b": 305.65918000000005, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "their sizes of 300K and 500K ground-truth pages. These sizes were", "bbox": {"l": 53.79800000000001, "t": 308.24353, "r": 294.043, "b": 316.61816, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "achieved by leveraging an automation approach. The benefit of au-", "bbox": {"l": 53.79800000000001, "t": 319.20255, "r": 295.56412, "b": 327.57718, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "tomated ground-truth generation is obvious: one can generate large", "bbox": {"l": 53.79800000000001, "t": 330.16153, "r": 294.04532, "b": 338.53616, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "ground-truth datasets at virtually no cost. However, the automation", "bbox": {"l": 53.79800000000001, "t": 341.12054, "r": 294.04538, "b": 349.49518, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "introduces a constraint on the variability in the dataset, because", "bbox": {"l": 53.79800000000001, "t": 352.07953, "r": 294.04712, "b": 360.45416000000006, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "corresponding structured source data must be available. PubLayNet", "bbox": {"l": 53.79800000000001, "t": 363.03853999999995, "r": 294.04538, "b": 371.41318, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "and DocBank were both generated from scientific document repos-", "bbox": {"l": 53.79800000000001, "t": 373.99655, "r": 295.55643, "b": 382.37119, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "itories (PubMed and arXiv), which provide XML or L", "bbox": {"l": 53.79800000000001, "t": 384.95554, "r": 246.75909, "b": 393.33017, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "A", "bbox": {"l": 243.53101000000004, "t": 385.03183000000007, "r": 248.58553000000003, "b": 391.82455, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "T", "bbox": {"l": 247.24099999999999, "t": 384.95554, "r": 252.58859, "b": 393.33017, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "E", "bbox": {"l": 251.09398999999996, "t": 386.87954999999994, "r": 256.08829, "b": 395.25418, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "X", "bbox": {"l": 254.967, "t": 384.95554, "r": 261.33725, "b": 393.33017, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "sources.", "bbox": {"l": 263.75021, "t": 384.95554, "r": 295.42773, "b": 393.33017, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "Those scientific documents present a limited variability in their", "bbox": {"l": 53.528999, "t": 395.91455, "r": 294.21713, "b": 404.28918, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "layouts, because they are typeset in uniform templates provided by", "bbox": {"l": 53.79800000000001, "t": 406.87354, "r": 294.27386, "b": 415.24817, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "the publishers. Obviously, documents such as technical manuals,", "bbox": {"l": 53.79800000000001, "t": 417.8325500000001, "r": 295.03488, "b": 426.20717999999994, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "annual company reports, legal text, government tenders, etc. have", "bbox": {"l": 53.79800000000001, "t": 428.79153, "r": 294.04691, "b": 437.16617, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "very different and partially unique layouts. As a consequence, the", "bbox": {"l": 53.57400100000001, "t": 439.75055, "r": 294.04865, "b": 448.12518, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "layout predictions obtained from models trained on PubLayNet or", "bbox": {"l": 53.79800000000001, "t": 450.7095299999999, "r": 294.21643, "b": 459.08417, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "DocBank is very reasonable when applied on scientific documents.", "bbox": {"l": 53.79800000000001, "t": 461.66855, "r": 295.42181, "b": 470.04318, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "However, for more", "bbox": {"l": 53.79800000000001, "t": 472.62753, "r": 125.52795, "b": 481.00217, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "artistic", "bbox": {"l": 128.608, "t": 472.67239, "r": 153.7679, "b": 481.01114, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "or", "bbox": {"l": 157.15199, "t": 472.62753, "r": 165.16365, "b": 481.00217, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "free-style", "bbox": {"l": 168.248, "t": 472.67239, "r": 201.49272, "b": 481.01114, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "layouts, we see sub-par", "bbox": {"l": 204.78799, "t": 472.62753, "r": 294.21494, "b": 481.00217, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "prediction quality from these models, which we demonstrate in", "bbox": {"l": 53.79800000000001, "t": 483.58554, "r": 294.04715, "b": 491.96017, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Section 5.", "bbox": {"l": 53.79800000000001, "t": 494.54453, "r": 89.080788, "b": 502.91916, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "A key problem in the process of document conversion is to understand the structure of a single document page, i.e. which segments of text should be grouped together in a unit. To train models for this task, there are currently two large datasets available to the community, PubLayNet [6] and DocBank [7]. They were introduced in 2019 and 2020 respectively and significantly accelerated the implementation of layout detection and segmentation models due to their sizes of 300K and 500K ground-truth pages. These sizes were achieved by leveraging an automation approach. The benefit of automated ground-truth generation is obvious: one can generate large ground-truth datasets at virtually no cost. However, the automation introduces a constraint on the variability in the dataset, because corresponding structured source data must be available. PubLayNet and DocBank were both generated from scientific document repositories (PubMed and arXiv), which provide XML or L A T E X sources. Those scientific documents present a limited variability in their layouts, because they are typeset in uniform templates provided by the publishers. Obviously, documents such as technical manuals, annual company reports, legal text, government tenders, etc. have very different and partially unique layouts. As a consequence, the layout predictions obtained from models trained on PubLayNet or DocBank is very reasonable when applied on scientific documents. However, for more artistic or free-style layouts, we see sub-par prediction quality from these models, which we demonstrate in Section 5."}, {"label": "text", "id": 6, "page_no": 1, "cluster": {"id": 6, "label": "text", "bbox": {"l": 53.591999, "t": 505.50354, "r": 295.56396, "b": 579.63217, "coord_origin": "TOPLEFT"}, "confidence": 0.9795253276824951, "cells": [{"id": 49, "text": "In this paper, we present the DocLayNet dataset. It provides page-", "bbox": {"l": 63.76100199999999, "t": 505.50354, "r": 295.56396, "b": 513.87817, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "by-page layout annotation ground-truth using bounding-boxes for", "bbox": {"l": 53.79800000000001, "t": 516.46252, "r": 294.21271, "b": 524.83716, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "11", "bbox": {"l": 53.591999, "t": 527.42154, "r": 61.92275599999999, "b": 535.7961700000001, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "distinct class labels on 80863 unique document pages, of which", "bbox": {"l": 64.162201, "t": 527.42154, "r": 294.04626, "b": 535.7961700000001, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "a fraction carry double- or triple-annotations. DocLayNet is similar", "bbox": {"l": 53.79800000000001, "t": 538.38055, "r": 294.21228, "b": 546.75517, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "in spirit to PubLayNet and DocBank and will likewise be made", "bbox": {"l": 53.79800000000001, "t": 549.33955, "r": 294.04709, "b": 557.71417, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "available to the public", "bbox": {"l": 53.79800000000001, "t": 560.29855, "r": 134.28951, "b": 568.67317, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "1", "bbox": {"l": 134.29201, "t": 558.23083, "r": 137.67381, "b": 565.0235299999999, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "in order to stimulate the document-layout", "bbox": {"l": 140.418, "t": 560.29855, "r": 294.047, "b": 568.67317, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "analysis community. It distinguishes itself in the following aspects:", "bbox": {"l": 53.79800000000001, "t": 571.25755, "r": 295.10538, "b": 579.63217, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In this paper, we present the DocLayNet dataset. It provides pageby-page layout annotation ground-truth using bounding-boxes for 11 distinct class labels on 80863 unique document pages, of which a fraction carry double- or triple-annotations. DocLayNet is similar in spirit to PubLayNet and DocBank and will likewise be made available to the public 1 in order to stimulate the document-layout analysis community. It distinguishes itself in the following aspects:"}, {"label": "list_item", "id": 9, "page_no": 1, "cluster": {"id": 9, "label": "list_item", "bbox": {"l": 64.708, "t": 584.58156, "r": 295.56165, "b": 614.87418, "coord_origin": "TOPLEFT"}, "confidence": 0.9687220454216003, "cells": [{"id": 59, "text": "(1)", "bbox": {"l": 64.708, "t": 584.58156, "r": 74.221352, "b": 592.95618, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Human Annotation", "bbox": {"l": 78.207001, "t": 584.62639, "r": 146.39589, "b": 592.96515, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": ": In contrast to PubLayNet and DocBank,", "bbox": {"l": 146.41701, "t": 584.58156, "r": 295.03036, "b": 592.95618, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "we relied on human annotation instead of automation ap-", "bbox": {"l": 77.875, "t": 595.54056, "r": 295.56165, "b": 603.91518, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "proaches to generate the data set.", "bbox": {"l": 78.207001, "t": 606.49956, "r": 200.6432, "b": 614.87418, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "(1) Human Annotation : In contrast to PubLayNet and DocBank, we relied on human annotation instead of automation approaches to generate the data set."}, {"label": "list_item", "id": 11, "page_no": 1, "cluster": {"id": 11, "label": "list_item", "bbox": {"l": 64.708, "t": 617.45856, "r": 294.26254, "b": 636.79117, "coord_origin": "TOPLEFT"}, "confidence": 0.9594229459762573, "cells": [{"id": 64, "text": "(2)", "bbox": {"l": 64.708, "t": 617.45856, "r": 74.221352, "b": 625.8331800000001, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "Large Layout Variability", "bbox": {"l": 78.207001, "t": 617.50339, "r": 167.91745, "b": 625.84215, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": ": We include diverse and complex", "bbox": {"l": 168.33501, "t": 617.45856, "r": 294.26254, "b": 625.8331800000001, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "layouts from a large variety of public sources.", "bbox": {"l": 78.207001, "t": 628.41655, "r": 245.45726000000002, "b": 636.79117, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "(2) Large Layout Variability : We include diverse and complex layouts from a large variety of public sources."}, {"label": "list_item", "id": 10, "page_no": 1, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 64.708, "t": 639.37555, "r": 294.68381, "b": 669.66817, "coord_origin": "TOPLEFT"}, "confidence": 0.9615103006362915, "cells": [{"id": 68, "text": "(3)", "bbox": {"l": 64.708, "t": 639.37555, "r": 74.221352, "b": 647.75017, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "Detailed Label Set", "bbox": {"l": 78.207001, "t": 639.42038, "r": 143.51663, "b": 647.75914, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": ": We define 11 class labels to distinguish", "bbox": {"l": 144.02, "t": 639.37555, "r": 294.04648, "b": 647.75017, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "layout features in high detail. PubLayNet provides 5 labels;", "bbox": {"l": 78.207001, "t": 650.33455, "r": 294.68381, "b": 658.70917, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "DocBank provides 13, although not a superset of ours.", "bbox": {"l": 78.207001, "t": 661.29355, "r": 276.33752, "b": 669.66817, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "(3) Detailed Label Set : We define 11 class labels to distinguish layout features in high detail. PubLayNet provides 5 labels; DocBank provides 13, although not a superset of ours."}, {"label": "list_item", "id": 13, "page_no": 1, "cluster": {"id": 13, "label": "list_item", "bbox": {"l": 64.708, "t": 672.25256, "r": 295.56439, "b": 691.58617, "coord_origin": "TOPLEFT"}, "confidence": 0.9447500109672546, "cells": [{"id": 73, "text": "(4)", "bbox": {"l": 64.708, "t": 672.25256, "r": 74.221352, "b": 680.62717, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "Redundant Annotations", "bbox": {"l": 78.207001, "t": 672.29739, "r": 163.78357, "b": 680.63614, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": ": A fraction of the pages in the Do-", "bbox": {"l": 163.994, "t": 672.25256, "r": 295.56439, "b": 680.62717, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "cLayNet data set carry more than one human annotation.", "bbox": {"l": 78.207001, "t": 683.21156, "r": 295.42719, "b": 691.58617, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "(4) Redundant Annotations : A fraction of the pages in the DocLayNet data set carry more than one human annotation."}, {"label": "footnote", "id": 17, "page_no": 1, "cluster": {"id": 17, "label": "footnote", "bbox": {"l": 53.672001, "t": 702.226364, "r": 216.02750000000003, "b": 708.739891, "coord_origin": "TOPLEFT"}, "confidence": 0.8584771752357483, "cells": [{"id": 77, "text": "$^{1}$https://developer.ibm.com/exchanges/data/all/doclaynet", "bbox": {"l": 53.672001, "t": 702.226364, "r": 216.02750000000003, "b": 708.739891, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "$^{1}$https://developer.ibm.com/exchanges/data/all/doclaynet"}, {"label": "text", "id": 18, "page_no": 1, "cluster": {"id": 18, "label": "text", "bbox": {"l": 342.095, "t": 87.36352999999997, "r": 558.43201, "b": 106.69713999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.7997146844863892, "cells": [{"id": 78, "text": "This enables experimentation with annotation uncertainty", "bbox": {"l": 342.095, "t": 87.36352999999997, "r": 558.43201, "b": 95.73816, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "and quality control analysis.", "bbox": {"l": 342.36401, "t": 98.32250999999997, "r": 445.83629999999994, "b": 106.69713999999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "This enables experimentation with annotation uncertainty and quality control analysis."}, {"label": "list_item", "id": 12, "page_no": 1, "cluster": {"id": 12, "label": "list_item", "bbox": {"l": 328.86502, "t": 109.28148999999996, "r": 559.72101, "b": 161.49114999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9563499093055725, "cells": [{"id": 80, "text": "(5)", "bbox": {"l": 328.86502, "t": 109.28148999999996, "r": 338.37836, "b": 117.65612999999996, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Pre-defined Train-, Test- & Validation-set", "bbox": {"l": 342.36401, "t": 109.32641999999998, "r": 487.25296, "b": 117.66516000000001, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": ": Like DocBank, we", "bbox": {"l": 487.75900000000007, "t": 109.28156000000001, "r": 558.20294, "b": 117.65618999999992, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "provide fixed train-, test- & validation-sets to ensure propor-", "bbox": {"l": 342.36401, "t": 120.24054000000001, "r": 559.72101, "b": 128.61517000000003, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "tional representation of the class-labels. Further, we prevent", "bbox": {"l": 342.36401, "t": 131.19854999999995, "r": 558.20117, "b": 139.57317999999998, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "leakage of unique layouts across sets, which has a large effect", "bbox": {"l": 342.36401, "t": 142.15752999999995, "r": 558.20087, "b": 150.53216999999995, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "on model accuracy scores.", "bbox": {"l": 342.36401, "t": 153.11652000000004, "r": 438.0624399999999, "b": 161.49114999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "(5) Pre-defined Train-, Test- & Validation-set : Like DocBank, we provide fixed train-, test- & validation-sets to ensure proportional representation of the class-labels. Further, we prevent leakage of unique layouts across sets, which has a large effect on model accuracy scores."}, {"label": "text", "id": 4, "page_no": 1, "cluster": {"id": 4, "label": "text", "bbox": {"l": 317.62299, "t": 167.97551999999996, "r": 559.19031, "b": 220.18615999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9813903570175171, "cells": [{"id": 87, "text": "All aspects outlined above are detailed in Section 3. In Section 4,", "bbox": {"l": 327.918, "t": 167.97551999999996, "r": 559.19031, "b": 176.35015999999996, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "we will elaborate on how we designed and executed this large-scale", "bbox": {"l": 317.62299, "t": 178.93451000000005, "r": 558.20422, "b": 187.30913999999996, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "human annotation campaign. We will also share key insights and", "bbox": {"l": 317.95499, "t": 189.89355, "r": 558.19763, "b": 198.26819, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "lessons learned that might prove helpful for other parties planning", "bbox": {"l": 317.95499, "t": 200.85253999999998, "r": 558.20612, "b": 209.22717, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "to set up annotation campaigns.", "bbox": {"l": 317.95499, "t": 211.81151999999997, "r": 434.94861, "b": 220.18615999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "All aspects outlined above are detailed in Section 3. In Section 4, we will elaborate on how we designed and executed this large-scale human annotation campaign. We will also share key insights and lessons learned that might prove helpful for other parties planning to set up annotation campaigns."}, {"label": "text", "id": 3, "page_no": 1, "cluster": {"id": 3, "label": "text", "bbox": {"l": 317.73099, "t": 222.77057000000002, "r": 559.58197, "b": 307.85718, "coord_origin": "TOPLEFT"}, "confidence": 0.9844217300415039, "cells": [{"id": 92, "text": "In Section 5, we will present baseline accuracy numbers for a", "bbox": {"l": 327.918, "t": 222.77057000000002, "r": 558.19836, "b": 231.14520000000005, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "variety of object detection methods (Faster R-CNN, Mask R-CNN", "bbox": {"l": 317.73099, "t": 233.72955000000002, "r": 558.1991, "b": 242.10419000000002, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "and YOLOv5) trained on DocLayNet. We further show how the", "bbox": {"l": 317.95499, "t": 244.68854, "r": 558.20416, "b": 253.06317, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "model performance is impacted by varying the DocLayNet dataset", "bbox": {"l": 317.95499, "t": 255.64752, "r": 558.20563, "b": 264.02216, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "size, reducing the label set and modifying the train/test-split. Last", "bbox": {"l": 317.95499, "t": 266.60553000000004, "r": 558.19861, "b": 274.98015999999996, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "but not least, we compare the performance of models trained on", "bbox": {"l": 317.95499, "t": 277.56458, "r": 558.20416, "b": 285.93918, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "PubLayNet, DocBank and DocLayNet and demonstrate that a model", "bbox": {"l": 317.95499, "t": 288.52353, "r": 558.20239, "b": 296.89816, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "trained on DocLayNet provides overall more robust layout recovery.", "bbox": {"l": 317.95499, "t": 299.48254, "r": 559.58197, "b": 307.85718, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In Section 5, we will present baseline accuracy numbers for a variety of object detection methods (Faster R-CNN, Mask R-CNN and YOLOv5) trained on DocLayNet. We further show how the model performance is impacted by varying the DocLayNet dataset size, reducing the label set and modifying the train/test-split. Last but not least, we compare the performance of models trained on PubLayNet, DocBank and DocLayNet and demonstrate that a model trained on DocLayNet provides overall more robust layout recovery."}, {"label": "section_header", "id": 15, "page_no": 1, "cluster": {"id": 15, "label": "section_header", "bbox": {"l": 317.95499, "t": 321.20889, "r": 421.74411, "b": 331.51797, "coord_origin": "TOPLEFT"}, "confidence": 0.9347459077835083, "cells": [{"id": 100, "text": "2", "bbox": {"l": 317.95499, "t": 321.20889, "r": 323.10388, "b": 331.51797, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "RELATED WORK", "bbox": {"l": 333.12115, "t": 321.20889, "r": 421.74411, "b": 331.51797, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2 RELATED WORK"}, {"label": "text", "id": 1, "page_no": 1, "cluster": {"id": 1, "label": "text", "bbox": {"l": 317.52499, "t": 346.3325500000001, "r": 559.71613, "b": 464.29617, "coord_origin": "TOPLEFT"}, "confidence": 0.9860377907752991, "cells": [{"id": 102, "text": "While early approaches in document-layout analysis used rule-", "bbox": {"l": 317.52499, "t": 346.3325500000001, "r": 559.71301, "b": 354.70717999999994, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "based algorithms and heuristics [8], the problem is lately addressed", "bbox": {"l": 317.95499, "t": 357.29153, "r": 558.20276, "b": 365.66617, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "with deep learning methods. The most common approach is to lever-", "bbox": {"l": 317.62299, "t": 368.25055, "r": 559.71564, "b": 376.62518, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "age object detection models [9-15]. In the last decade, the accuracy", "bbox": {"l": 317.95499, "t": 379.2095299999999, "r": 558.43365, "b": 387.58417, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "and speed of these models has increased dramatically. Furthermore,", "bbox": {"l": 317.95499, "t": 390.16855000000004, "r": 559.18658, "b": 398.54318, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "most state-of-the-art object detection methods can be trained and", "bbox": {"l": 317.95499, "t": 401.12753, "r": 558.20502, "b": 409.50217, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "applied with very little work, thanks to a standardisation effort", "bbox": {"l": 317.95499, "t": 412.08655, "r": 558.20422, "b": 420.46118, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "of the ground-truth data format [16] and common deep-learning", "bbox": {"l": 317.95499, "t": 423.04553, "r": 558.20477, "b": 431.4201699999999, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "frameworks [17]. Reference data sets such as PubLayNet [6] and", "bbox": {"l": 317.95499, "t": 434.00354, "r": 558.19952, "b": 442.37817, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "DocBank provide their data in the commonly accepted COCO for-", "bbox": {"l": 317.95499, "t": 444.96252, "r": 559.71613, "b": 453.33716, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "mat [16].", "bbox": {"l": 317.95499, "t": 455.92154, "r": 350.90652, "b": 464.29617, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "While early approaches in document-layout analysis used rulebased algorithms and heuristics [8], the problem is lately addressed with deep learning methods. The most common approach is to leverage object detection models [9-15]. In the last decade, the accuracy and speed of these models has increased dramatically. Furthermore, most state-of-the-art object detection methods can be trained and applied with very little work, thanks to a standardisation effort of the ground-truth data format [16] and common deep-learning frameworks [17]. Reference data sets such as PubLayNet [6] and DocBank provide their data in the commonly accepted COCO format [16]."}, {"label": "text", "id": 0, "page_no": 1, "cluster": {"id": 0, "label": "text", "bbox": {"l": 317.95499, "t": 466.88052, "r": 559.18646, "b": 551.96817, "coord_origin": "TOPLEFT"}, "confidence": 0.9861046671867371, "cells": [{"id": 113, "text": "Lately, new types of ML models for document-layout analysis", "bbox": {"l": 327.918, "t": 466.88052, "r": 558.19824, "b": 475.25516, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "have emerged in the community [18-21]. These models do not", "bbox": {"l": 317.95499, "t": 477.83954, "r": 558.20551, "b": 486.21417, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "approach the problem of layout analysis purely based on an image", "bbox": {"l": 317.95499, "t": 488.79855, "r": 558.20575, "b": 497.17319, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "representation of the page, as computer vision methods do. Instead,", "bbox": {"l": 317.95499, "t": 499.75754, "r": 559.18646, "b": 508.13217, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "they combine the text tokens and image representation of a page", "bbox": {"l": 317.95499, "t": 510.71655, "r": 558.2002, "b": 519.09119, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "in order to obtain a segmentation. While the reported accuracies", "bbox": {"l": 317.95499, "t": 521.67554, "r": 558.20618, "b": 530.05017, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "appear to be promising, a broadly accepted data format which links", "bbox": {"l": 317.95499, "t": 532.63455, "r": 558.20239, "b": 541.00917, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "geometric and textual features has yet to establish.", "bbox": {"l": 317.95499, "t": 543.59355, "r": 503.32648, "b": 551.96817, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Lately, new types of ML models for document-layout analysis have emerged in the community [18-21]. These models do not approach the problem of layout analysis purely based on an image representation of the page, as computer vision methods do. Instead, they combine the text tokens and image representation of a page in order to obtain a segmentation. While the reported accuracies appear to be promising, a broadly accepted data format which links geometric and textual features has yet to establish."}, {"label": "section_header", "id": 16, "page_no": 1, "cluster": {"id": 16, "label": "section_header", "bbox": {"l": 317.95499, "t": 565.3199, "r": 477.45688, "b": 575.629, "coord_origin": "TOPLEFT"}, "confidence": 0.9331073760986328, "cells": [{"id": 121, "text": "3", "bbox": {"l": 317.95499, "t": 565.3199, "r": 322.97391, "b": 575.629, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "THE DOCLAYNET DATASET", "bbox": {"l": 332.73831, "t": 565.3199, "r": 477.45688, "b": 575.629, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3 THE DOCLAYNET DATASET"}, {"label": "text", "id": 2, "page_no": 1, "cluster": {"id": 2, "label": "text", "bbox": {"l": 317.95499, "t": 590.4435599999999, "r": 559.7132, "b": 675.53017, "coord_origin": "TOPLEFT"}, "confidence": 0.9852981567382812, "cells": [{"id": 123, "text": "DocLayNet contains 80863 PDF pages. Among these, 7059 carry two", "bbox": {"l": 317.95499, "t": 590.4435599999999, "r": 558.20233, "b": 598.81818, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "instances of human annotations, and 1591 carry three. This amounts", "bbox": {"l": 317.95499, "t": 601.40256, "r": 558.20239, "b": 609.77718, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "to 91104 total annotation instances. The annotations provide lay-", "bbox": {"l": 317.95499, "t": 612.36055, "r": 559.7132, "b": 620.73517, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "out information in the shape of labeled, rectangular bounding-", "bbox": {"l": 317.95499, "t": 623.3195499999999, "r": 559.71313, "b": 631.69417, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "boxes. We define 11 distinct labels for layout features, namely", "bbox": {"l": 317.95499, "t": 634.27855, "r": 539.92047, "b": 642.65317, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "Cap-", "bbox": {"l": 542.15802, "t": 634.32338, "r": 559.09888, "b": 642.66214, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "tion", "bbox": {"l": 317.95499, "t": 645.28238, "r": 331.86273, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": ",", "bbox": {"l": 331.86301, "t": 645.23755, "r": 333.83957, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "Footnote", "bbox": {"l": 336.064, "t": 645.28238, "r": 366.05368, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": ",", "bbox": {"l": 366.05301, "t": 645.23755, "r": 368.02957, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "Formula", "bbox": {"l": 370.254, "t": 645.28238, "r": 400.05502, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": ",", "bbox": {"l": 400.05499, "t": 645.23755, "r": 402.03156, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "List-item", "bbox": {"l": 404.25601, "t": 645.28238, "r": 436.19531, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": ",", "bbox": {"l": 436.19501, "t": 645.23755, "r": 438.17157, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "Page-footer", "bbox": {"l": 440.396, "t": 645.28238, "r": 480.60988999999995, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": ",", "bbox": {"l": 480.60999, "t": 645.23755, "r": 482.58655000000005, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "Page-header", "bbox": {"l": 484.811, "t": 645.28238, "r": 528.37604, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": ",", "bbox": {"l": 528.375, "t": 645.23755, "r": 530.35156, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "Picture", "bbox": {"l": 532.57599, "t": 645.28238, "r": 557.211, "b": 653.62114, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": ",", "bbox": {"l": 557.211, "t": 645.23755, "r": 559.18756, "b": 653.61217, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "Section-header", "bbox": {"l": 317.95499, "t": 656.2413799999999, "r": 368.78821, "b": 664.58013, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": ",", "bbox": {"l": 368.789, "t": 656.19655, "r": 370.72217, "b": 664.5711699999999, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "Table", "bbox": {"l": 372.89999, "t": 656.2413799999999, "r": 391.57254, "b": 664.58013, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": ",", "bbox": {"l": 391.573, "t": 656.19655, "r": 393.50616, "b": 664.5711699999999, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "Text", "bbox": {"l": 395.68399, "t": 656.2413799999999, "r": 410.23538, "b": 664.58013, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": ", and", "bbox": {"l": 410.23099, "t": 656.19655, "r": 427.5679, "b": 664.5711699999999, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "Title", "bbox": {"l": 429.74399, "t": 656.2413799999999, "r": 445.50800000000004, "b": 664.58013, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": ". Our reasoning for picking this", "bbox": {"l": 445.50800000000004, "t": 656.19655, "r": 558.20227, "b": 664.5711699999999, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "particular label set is detailed in Section 4.", "bbox": {"l": 317.95499, "t": 667.15556, "r": 472.22198, "b": 675.53017, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "DocLayNet contains 80863 PDF pages. Among these, 7059 carry two instances of human annotations, and 1591 carry three. This amounts to 91104 total annotation instances. The annotations provide layout information in the shape of labeled, rectangular boundingboxes. We define 11 distinct labels for layout features, namely Caption , Footnote , Formula , List-item , Page-footer , Page-header , Picture , Section-header , Table , Text , and Title . Our reasoning for picking this particular label set is detailed in Section 4."}, {"label": "text", "id": 8, "page_no": 1, "cluster": {"id": 8, "label": "text", "bbox": {"l": 317.95499, "t": 678.11456, "r": 558.2041, "b": 708.4071730000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9749757051467896, "cells": [{"id": 152, "text": "In addition to open intellectual property constraints for the", "bbox": {"l": 327.918, "t": 678.11456, "r": 558.19843, "b": 686.4891700000001, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "source documents, we required that the documents in DocLayNet", "bbox": {"l": 317.95499, "t": 689.07355, "r": 558.19867, "b": 697.448174, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "adhere to a few conditions. Firstly, we kept scanned documents", "bbox": {"l": 317.95499, "t": 700.032555, "r": 558.2041, "b": 708.4071730000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In addition to open intellectual property constraints for the source documents, we required that the documents in DocLayNet adhere to a few conditions. Firstly, we kept scanned documents"}], "headers": [{"label": "page_header", "id": 19, "page_no": 1, "cluster": {"id": 19, "label": "page_header", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.7682238221168518, "cells": [{"id": 0, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 246.24382, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar", "bbox": {"l": 253.13897999999998, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "KDD '22, August 14-18, 2022, Washington, DC, USA Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar"}]}}, {"page_no": 2, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Patents", "bbox": {"l": 237.11293, "t": 133.08716000000004, "r": 262.97623, "b": 141.61419999999998, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "8%", "bbox": {"l": 202.87892, "t": 140.46178999999995, "r": 213.89999, "b": 148.98883, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Scientific", "bbox": {"l": 207.13306, "t": 93.1576500000001, "r": 237.64882999999998, "b": 101.68469000000005, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "17%", "bbox": {"l": 184.40349, "t": 118.68206999999995, "r": 199.66519, "b": 127.20911000000001, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Financial", "bbox": {"l": 88.288223, "t": 114.35473999999988, "r": 118.80401, "b": 122.88176999999985, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "32%", "bbox": {"l": 136.24422, "t": 130.24408000000005, "r": 151.50592, "b": 138.77112, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Tenders", "bbox": {"l": 93.973373, "t": 187.65765, "r": 121.11515, "b": 196.18469000000005, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "6%", "bbox": {"l": 139.6235, "t": 170.22748, "r": 150.64458, "b": 178.75451999999996, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Laws", "bbox": {"l": 139.88339, "t": 212.50036999999998, "r": 157.68491, "b": 221.02739999999994, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "16%", "bbox": {"l": 157.43983, "t": 183.77808000000005, "r": 172.70154, "b": 192.30511, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Manuals", "bbox": {"l": 225.47252, "t": 189.29656999999997, "r": 254.29510000000002, "b": 197.82361000000003, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "21%", "bbox": {"l": 194.40683, "t": 171.12145999999996, "r": 209.66853, "b": 179.6485, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Figure 2: Distribution of DocLayNet pages across document", "bbox": {"l": 53.79800000000001, "t": 236.11499000000003, "r": 294.04373, "b": 244.58826, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "categories.", "bbox": {"l": 53.79800000000001, "t": 247.07397000000003, "r": 96.756027, "b": 255.54724, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "to a minimum, since they introduce difficulties in annotation (see", "bbox": {"l": 53.79800000000001, "t": 281.8035300000001, "r": 294.04605, "b": 290.17815999999993, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "Section 4). As a second condition, we focussed on medium to large", "bbox": {"l": 53.79800000000001, "t": 292.76254, "r": 294.04868, "b": 301.13718, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "documents (", "bbox": {"l": 53.79800000000001, "t": 303.72153, "r": 98.881348, "b": 312.09616, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": ">", "bbox": {"l": 99.070999, "t": 306.07971, "r": 104.77363, "b": 310.08768, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "10", "bbox": {"l": 107.46399999999998, "t": 303.72153, "r": 115.83373999999999, "b": 312.09616, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "pages) with technical content, dense in complex", "bbox": {"l": 118.08366, "t": 303.72153, "r": 294.26233, "b": 312.09616, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "tables, figures, plots and captions. Such documents carry a lot of", "bbox": {"l": 53.79800000000001, "t": 314.68054, "r": 294.04715, "b": 323.05518, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "information value, but are often hard to analyse with high accuracy", "bbox": {"l": 53.79800000000001, "t": 325.63855, "r": 294.27383, "b": 334.01318, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "due to their challenging layouts. Counterexamples of documents", "bbox": {"l": 53.79800000000001, "t": 336.59753, "r": 294.0416, "b": 344.97217, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "not included in the dataset are receipts, invoices, hand-written", "bbox": {"l": 53.79800000000001, "t": 347.5565500000001, "r": 294.04712, "b": 355.9311799999999, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "documents or photographs showing \u201ctext in the wild\".", "bbox": {"l": 53.79800000000001, "t": 358.51553, "r": 251.73131, "b": 366.89017, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "The pages in DocLayNet can be grouped into six distinct cate-", "bbox": {"l": 63.76100199999999, "t": 369.47455, "r": 295.55945, "b": 377.84918, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "gories, namely", "bbox": {"l": 53.79800000000001, "t": 380.43353, "r": 105.90533, "b": 388.80816999999996, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Financial Reports", "bbox": {"l": 107.754, "t": 380.47838999999993, "r": 167.4973, "b": 388.81714, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": ",", "bbox": {"l": 167.496, "t": 380.43353, "r": 169.42915, "b": 388.80816999999996, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Manuals", "bbox": {"l": 171.28101, "t": 380.47838999999993, "r": 201.45581, "b": 388.81714, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": ",", "bbox": {"l": 201.455, "t": 380.43353, "r": 203.38815, "b": 388.80816999999996, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "Scientific Articles", "bbox": {"l": 205.24001, "t": 380.47838999999993, "r": 264.55273, "b": 388.81714, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": ",", "bbox": {"l": 264.54901, "t": 380.43353, "r": 266.48218, "b": 388.80816999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "Laws &", "bbox": {"l": 268.33401, "t": 380.47838999999993, "r": 294.36133, "b": 388.81714, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Regulations", "bbox": {"l": 53.79800000000001, "t": 391.43741000000006, "r": 94.899666, "b": 399.77615, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": ",", "bbox": {"l": 94.900002, "t": 391.39255, "r": 96.862747, "b": 399.76718, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "Patents", "bbox": {"l": 99.109001, "t": 391.43741000000006, "r": 124.72282, "b": 399.77615, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "and", "bbox": {"l": 127.17899999999999, "t": 391.39255, "r": 140.60596, "b": 399.76718, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "Government Tenders", "bbox": {"l": 142.853, "t": 391.43741000000006, "r": 215.15340000000003, "b": 399.77615, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": ". Each document cate-", "bbox": {"l": 215.15601000000004, "t": 391.39255, "r": 295.55716, "b": 399.76718, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "gory was sourced from various repositories. For example, Financial", "bbox": {"l": 53.79800000000001, "t": 402.3515300000001, "r": 294.04535, "b": 410.72617, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Reports contain both", "bbox": {"l": 53.79800000000001, "t": 413.31055, "r": 132.19516, "b": 421.68518000000006, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "free-style", "bbox": {"l": 134.528, "t": 413.35541, "r": 167.77272, "b": 421.69415, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "format annual reports", "bbox": {"l": 170.314, "t": 413.31055, "r": 252.36031, "b": 421.68518000000006, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "2", "bbox": {"l": 252.356, "t": 411.24283, "r": 255.73781, "b": 418.03555, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "which ex-", "bbox": {"l": 258.56601, "t": 413.31055, "r": 295.56046, "b": 421.68518000000006, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "pose company-specific, artistic layouts as well as the more formal", "bbox": {"l": 53.79800000000001, "t": 424.26953, "r": 294.04376, "b": 432.6441699999999, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "SEC filings. The two largest categories (", "bbox": {"l": 53.79800000000001, "t": 435.22754000000003, "r": 197.59023, "b": 443.60217, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Financial Reports", "bbox": {"l": 197.591, "t": 435.27240000000006, "r": 258.02774, "b": 443.61115, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "and", "bbox": {"l": 260.48901, "t": 435.22754000000003, "r": 273.78104, "b": 443.60217, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Man-", "bbox": {"l": 276.03201, "t": 435.27240000000006, "r": 294.94113, "b": 443.61115, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "uals", "bbox": {"l": 53.79800000000001, "t": 446.23138, "r": 68.085777, "b": 454.57013, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": ") contain a large amount of free-style layouts in order to obtain", "bbox": {"l": 68.296997, "t": 446.18652, "r": 294.04565, "b": 454.56116, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "maximum variability. In the other four categories, we boosted the", "bbox": {"l": 53.79800000000001, "t": 457.14554, "r": 294.04163, "b": 465.52017, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "variability by mixing documents from independent providers, such", "bbox": {"l": 53.57400100000001, "t": 468.10455, "r": 294.04889, "b": 476.47919, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "as different government websites or publishers. In Figure 2, we", "bbox": {"l": 53.79800000000001, "t": 479.06354, "r": 294.04715, "b": 487.43817, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "show the document categories contained in DocLayNet with their", "bbox": {"l": 53.79800000000001, "t": 490.02255, "r": 294.21643, "b": 498.39719, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "respective sizes.", "bbox": {"l": 53.79800000000001, "t": 500.98154, "r": 112.2948, "b": 509.35617, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "We did not control the document selection with regard to lan-", "bbox": {"l": 63.76100199999999, "t": 511.94055, "r": 295.55954, "b": 520.31519, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "guage. The vast majority of documents contained in DocLayNet", "bbox": {"l": 53.79800000000001, "t": 522.89954, "r": 294.04718, "b": 531.27417, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "(close to 95%) are published in English language. However, Do-", "bbox": {"l": 53.528999, "t": 533.8585499999999, "r": 295.56155, "b": 542.23317, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "cLayNet also contains a number of documents in other languages", "bbox": {"l": 53.79800000000001, "t": 544.81755, "r": 294.04144, "b": 553.19217, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "such as German (2.5%), French (1.0%) and Japanese (1.0%). While", "bbox": {"l": 53.79800000000001, "t": 555.77556, "r": 294.04709, "b": 564.15018, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "the document language has negligible impact on the performance", "bbox": {"l": 53.79800000000001, "t": 566.73456, "r": 294.04163, "b": 575.10918, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "of computer vision methods such as object detection and segmenta-", "bbox": {"l": 53.79800000000001, "t": 577.6935599999999, "r": 295.5567, "b": 586.06818, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "tion models, it might prove challenging for layout analysis methods", "bbox": {"l": 53.79800000000001, "t": 588.65256, "r": 294.04541, "b": 597.02718, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "which exploit textual features.", "bbox": {"l": 53.466999, "t": 599.61156, "r": 164.39928, "b": 607.98618, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "To ensure that future benchmarks in the document-layout analy-", "bbox": {"l": 63.76100199999999, "t": 610.57056, "r": 295.56396, "b": 618.9451799999999, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "sis community can be easily compared, we have split up DocLayNet", "bbox": {"l": 53.79800000000001, "t": 621.52956, "r": 294.04532, "b": 629.90417, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "into pre-defined train-, test- and validation-sets. In this way, we can", "bbox": {"l": 53.79800000000001, "t": 632.48856, "r": 294.04538, "b": 640.86317, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "avoid spurious variations in the evaluation scores due to random", "bbox": {"l": 53.79800000000001, "t": 643.4475600000001, "r": 294.04315, "b": 651.82217, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "splitting in train-, test- and validation-sets. We also ensured that", "bbox": {"l": 53.79800000000001, "t": 654.40656, "r": 294.04712, "b": 662.78117, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "less frequent labels are represented in train and test sets in equal", "bbox": {"l": 53.79800000000001, "t": 665.36456, "r": 294.04333, "b": 673.7391700000001, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "proportions.", "bbox": {"l": 53.79800000000001, "t": 676.32355, "r": 98.916931, "b": 684.69817, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "$^{2}$e.g. AAPL from https://www.annualreports.com/", "bbox": {"l": 53.79800000000001, "t": 701.6563639999999, "r": 195.78998, "b": 708.169891, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "Table 1 shows the overall frequency and distribution of the labels", "bbox": {"l": 327.918, "t": 87.36352999999997, "r": 558.20093, "b": 95.73816, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "among the different sets. Importantly, we ensure that subsets are", "bbox": {"l": 317.95499, "t": 98.32250999999997, "r": 558.20013, "b": 106.69713999999999, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "only split on full-document boundaries. This avoids that pages of", "bbox": {"l": 317.95499, "t": 109.28156000000001, "r": 558.20056, "b": 117.65618999999992, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "the same document are spread over train, test and validation set,", "bbox": {"l": 317.95499, "t": 120.24054000000001, "r": 559.19183, "b": 128.61517000000003, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "which can give an undesired evaluation advantage to models and", "bbox": {"l": 317.62299, "t": 131.19854999999995, "r": 558.20349, "b": 139.57317999999998, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "lead to overestimation of their prediction accuracy. We will show", "bbox": {"l": 317.95499, "t": 142.15752999999995, "r": 558.52936, "b": 150.53216999999995, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "the impact of this decision in Section 5.", "bbox": {"l": 317.95499, "t": 153.11652000000004, "r": 461.6416, "b": 161.49114999999995, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "In order to accommodate the different types of models currently", "bbox": {"l": 327.918, "t": 164.07556, "r": 558.43811, "b": 172.4502, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "in use by the community, we provide DocLayNet in an", "bbox": {"l": 317.95499, "t": 175.03454999999997, "r": 516.8219, "b": 183.40918, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "augmented", "bbox": {"l": 519.07501, "t": 175.07941000000005, "r": 558.20135, "b": 183.41814999999997, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "COCO format [16]. This entails the standard COCO ground-truth", "bbox": {"l": 317.95499, "t": 185.99352999999996, "r": 558.20325, "b": 194.36816, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "file (in JSON format) with the associated page images (in PNG", "bbox": {"l": 317.95499, "t": 196.95250999999996, "r": 558.20404, "b": 205.32714999999996, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "format, 1025", "bbox": {"l": 317.95499, "t": 207.91156, "r": 364.28769, "b": 216.28619000000003, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "\u00d7", "bbox": {"l": 364.28699, "t": 207.85779000000002, "r": 369.98962, "b": 215.55993999999998, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "1025 pixels). Furthermore, custom fields have been", "bbox": {"l": 369.98999, "t": 207.91156, "r": 558.20526, "b": 216.28619000000003, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "added to each COCO record to specify document category, original", "bbox": {"l": 317.95499, "t": 218.87054, "r": 558.20251, "b": 227.24518, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "document filename and page number. In addition, we also provide", "bbox": {"l": 317.95499, "t": 229.82952999999998, "r": 558.203, "b": 238.20416, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "the original PDF pages, as well as sidecar files containing parsed", "bbox": {"l": 317.95499, "t": 240.78754000000004, "r": 558.20404, "b": 249.16216999999995, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "PDF text and text-cell coordinates (in JSON). All additional files are", "bbox": {"l": 317.95499, "t": 251.74652000000003, "r": 558.20227, "b": 260.12114999999994, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "linked to the primary page images by their matching filenames.", "bbox": {"l": 317.95499, "t": 262.70556999999997, "r": 550.36414, "b": 271.0802, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "Despite being cost-intense and far less scalable than automation,", "bbox": {"l": 327.918, "t": 273.66454999999996, "r": 559.18488, "b": 282.03918, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "human annotation has several benefits over automated ground-", "bbox": {"l": 317.95499, "t": 284.62354, "r": 559.7132, "b": 292.99817, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "truth generation. The first and most obvious reason to leverage", "bbox": {"l": 317.95499, "t": 295.5825500000001, "r": 558.20416, "b": 303.95717999999994, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "human annotations is the freedom to annotate any type of doc-", "bbox": {"l": 317.95499, "t": 306.54153, "r": 559.71326, "b": 314.91617, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "ument without requiring a programmatic source. For most PDF", "bbox": {"l": 317.95499, "t": 317.50055, "r": 558.41443, "b": 325.87518, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "documents, the original source document is not available. The lat-", "bbox": {"l": 317.95499, "t": 328.4595299999999, "r": 559.71545, "b": 336.83417, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "ter is not a hard constraint with human annotation, but it is for", "bbox": {"l": 317.95499, "t": 339.41855000000004, "r": 558.36865, "b": 347.79318, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "automated methods. A second reason to use human annotations is", "bbox": {"l": 317.95499, "t": 350.37753, "r": 558.20062, "b": 358.75217, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "that the latter usually provide a more natural interpretation of the", "bbox": {"l": 317.95499, "t": 361.33554, "r": 558.20184, "b": 369.71017, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "page layout. The human-interpreted layout can significantly devi-", "bbox": {"l": 317.95499, "t": 372.29453, "r": 559.71442, "b": 380.66916, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "ate from the programmatic layout used in typesetting. For example,", "bbox": {"l": 317.95499, "t": 383.25354, "r": 559.1864, "b": 391.62817, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "\u201cinvisible\u201d tables might be used solely for aligning text paragraphs", "bbox": {"l": 316.94199, "t": 394.21252, "r": 558.20111, "b": 402.58716, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "on columns. Such typesetting tricks might be interpreted by au-", "bbox": {"l": 317.95499, "t": 405.17154, "r": 559.7132, "b": 413.54617, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "tomated methods incorrectly as an actual table, while the human", "bbox": {"l": 317.95499, "t": 416.13052, "r": 558.20013, "b": 424.50515999999993, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "annotation will interpret it correctly as", "bbox": {"l": 317.95499, "t": 427.08953999999994, "r": 464.50613, "b": 435.46417, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "Text", "bbox": {"l": 466.98199000000005, "t": 427.13439999999997, "r": 482.14560000000006, "b": 435.47313999999994, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "or other styles. The", "bbox": {"l": 485.13199000000003, "t": 427.08953999999994, "r": 558.19727, "b": 435.46417, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "same applies to multi-line text elements, when authors decided to", "bbox": {"l": 317.95499, "t": 438.04855, "r": 558.20221, "b": 446.4231899999999, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "space them as \u201cinvisible\u201d list elements without bullet symbols. A", "bbox": {"l": 317.95499, "t": 449.00754, "r": 558.51501, "b": 457.38217, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "third reason to gather ground-truth through human annotation is", "bbox": {"l": 317.95499, "t": 459.96655000000004, "r": 558.19855, "b": 468.34119, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "to estimate a \u201cnatural\u201d upper bound on the segmentation accuracy.", "bbox": {"l": 317.95499, "t": 470.92453, "r": 559.58215, "b": 479.29916, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "As we will show in Section 4, certain documents featuring complex", "bbox": {"l": 317.64099, "t": 481.88354, "r": 558.41559, "b": 490.25818, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "layouts can have different but equally acceptable layout interpre-", "bbox": {"l": 317.95499, "t": 492.84253, "r": 559.72156, "b": 501.21716, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "tations. This natural upper bound for segmentation accuracy can", "bbox": {"l": 317.95499, "t": 503.80154, "r": 558.19928, "b": 512.1761799999999, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "be found by annotating the same pages multiple times by different", "bbox": {"l": 317.95499, "t": 514.76053, "r": 558.20581, "b": 523.13516, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "people and evaluating the inter-annotator agreement. Such a base-", "bbox": {"l": 317.95499, "t": 525.71954, "r": 559.71729, "b": 534.09418, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "line consistency evaluation is very useful to define expectations", "bbox": {"l": 317.95499, "t": 536.6785600000001, "r": 558.20404, "b": 545.05318, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "for a good target accuracy in trained deep neural network models", "bbox": {"l": 317.95499, "t": 547.63756, "r": 558.20074, "b": 556.01218, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "and avoid overfitting (see Table 1). On the flip side, achieving high", "bbox": {"l": 317.95499, "t": 558.59656, "r": 558.20062, "b": 566.97118, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "annotation consistency proved to be a key challenge in human", "bbox": {"l": 317.95499, "t": 569.55556, "r": 558.20416, "b": 577.9301800000001, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "annotation, as we outline in Section 4.", "bbox": {"l": 317.95499, "t": 580.51456, "r": 457.62469, "b": 588.88918, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "4", "bbox": {"l": 317.95499, "t": 606.84991, "r": 323.56226, "b": 617.15901, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "ANNOTATION CAMPAIGN", "bbox": {"l": 334.47134, "t": 606.84991, "r": 470.21326, "b": 617.15901, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "The annotation campaign was carried out in four phases. In phase", "bbox": {"l": 317.686, "t": 631.97356, "r": 558.20148, "b": 640.34818, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "one, we identified and prepared the data sources for annotation.", "bbox": {"l": 317.95499, "t": 642.93256, "r": 559.58521, "b": 651.30717, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "In phase two, we determined the class labels and how annotations", "bbox": {"l": 317.95499, "t": 653.89156, "r": 558.20007, "b": 662.26617, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "should be done on the documents in order to obtain maximum con-", "bbox": {"l": 317.95499, "t": 664.85056, "r": 559.71375, "b": 673.22517, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "sistency. The latter was guided by a detailed requirement analysis", "bbox": {"l": 317.95499, "t": 675.80956, "r": 558.20233, "b": 684.18417, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "and exhaustive experiments. In phase three, we trained the annota-", "bbox": {"l": 317.95499, "t": 686.76855, "r": 559.71381, "b": 695.143173, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "tion staff and performed exams for quality assurance. In phase four,", "bbox": {"l": 317.95499, "t": 697.7275539999999, "r": 559.1864, "b": 706.102173, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 13, "label": "page_header", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.8919971585273743, "cells": [{"id": 0, "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "page_header", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.9104517102241516, "cells": [{"id": 1, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "picture", "bbox": {"l": 88.33030700683594, "t": 92.88652038574219, "r": 263.7049560546875, "b": 220.56826782226562, "coord_origin": "TOPLEFT"}, "confidence": 0.9698190689086914, "cells": [{"id": 2, "text": "Patents", "bbox": {"l": 237.11293, "t": 133.08716000000004, "r": 262.97623, "b": 141.61419999999998, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "8%", "bbox": {"l": 202.87892, "t": 140.46178999999995, "r": 213.89999, "b": 148.98883, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Scientific", "bbox": {"l": 207.13306, "t": 93.1576500000001, "r": 237.64882999999998, "b": 101.68469000000005, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "17%", "bbox": {"l": 184.40349, "t": 118.68206999999995, "r": 199.66519, "b": 127.20911000000001, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Financial", "bbox": {"l": 88.288223, "t": 114.35473999999988, "r": 118.80401, "b": 122.88176999999985, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "32%", "bbox": {"l": 136.24422, "t": 130.24408000000005, "r": 151.50592, "b": 138.77112, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Tenders", "bbox": {"l": 93.973373, "t": 187.65765, "r": 121.11515, "b": 196.18469000000005, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "6%", "bbox": {"l": 139.6235, "t": 170.22748, "r": 150.64458, "b": 178.75451999999996, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Laws", "bbox": {"l": 139.88339, "t": 212.50036999999998, "r": 157.68491, "b": 221.02739999999994, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "16%", "bbox": {"l": 157.43983, "t": 183.77808000000005, "r": 172.70154, "b": 192.30511, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Manuals", "bbox": {"l": 225.47252, "t": 189.29656999999997, "r": 254.29510000000002, "b": 197.82361000000003, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "21%", "bbox": {"l": 194.40683, "t": 171.12145999999996, "r": 209.66853, "b": 179.6485, "coord_origin": "TOPLEFT"}}], "children": [{"id": 14, "label": "text", "bbox": {"l": 237.11293, "t": 133.08716000000004, "r": 262.97623, "b": 141.61419999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 2, "text": "Patents", "bbox": {"l": 237.11293, "t": 133.08716000000004, "r": 262.97623, "b": 141.61419999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 202.87892, "t": 140.46178999999995, "r": 213.89999, "b": 148.98883, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 3, "text": "8%", "bbox": {"l": 202.87892, "t": 140.46178999999995, "r": 213.89999, "b": 148.98883, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 207.13306, "t": 93.1576500000001, "r": 237.64882999999998, "b": 101.68469000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 4, "text": "Scientific", "bbox": {"l": 207.13306, "t": 93.1576500000001, "r": 237.64882999999998, "b": 101.68469000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 184.40349, "t": 118.68206999999995, "r": 199.66519, "b": 127.20911000000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 5, "text": "17%", "bbox": {"l": 184.40349, "t": 118.68206999999995, "r": 199.66519, "b": 127.20911000000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 88.288223, "t": 114.35473999999988, "r": 118.80401, "b": 122.88176999999985, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": "Financial", "bbox": {"l": 88.288223, "t": 114.35473999999988, "r": 118.80401, "b": 122.88176999999985, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 136.24422, "t": 130.24408000000005, "r": 151.50592, "b": 138.77112, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "32%", "bbox": {"l": 136.24422, "t": 130.24408000000005, "r": 151.50592, "b": 138.77112, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 93.973373, "t": 187.65765, "r": 121.11515, "b": 196.18469000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "Tenders", "bbox": {"l": 93.973373, "t": 187.65765, "r": 121.11515, "b": 196.18469000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 139.6235, "t": 170.22748, "r": 150.64458, "b": 178.75451999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "6%", "bbox": {"l": 139.6235, "t": 170.22748, "r": 150.64458, "b": 178.75451999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 139.88339, "t": 212.50036999999998, "r": 157.68491, "b": 221.02739999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "Laws", "bbox": {"l": 139.88339, "t": 212.50036999999998, "r": 157.68491, "b": 221.02739999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 157.43983, "t": 183.77808000000005, "r": 172.70154, "b": 192.30511, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "16%", "bbox": {"l": 157.43983, "t": 183.77808000000005, "r": 172.70154, "b": 192.30511, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 225.47252, "t": 189.29656999999997, "r": 254.29510000000002, "b": 197.82361000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "Manuals", "bbox": {"l": 225.47252, "t": 189.29656999999997, "r": 254.29510000000002, "b": 197.82361000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 194.40683, "t": 171.12145999999996, "r": 209.66853, "b": 179.6485, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "21%", "bbox": {"l": 194.40683, "t": 171.12145999999996, "r": 209.66853, "b": 179.6485, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 9, "label": "caption", "bbox": {"l": 53.79800000000001, "t": 236.11499000000003, "r": 294.04373, "b": 255.54724, "coord_origin": "TOPLEFT"}, "confidence": 0.9425410628318787, "cells": [{"id": 14, "text": "Figure 2: Distribution of DocLayNet pages across document", "bbox": {"l": 53.79800000000001, "t": 236.11499000000003, "r": 294.04373, "b": 244.58826, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "categories.", "bbox": {"l": 53.79800000000001, "t": 247.07397000000003, "r": 96.756027, "b": 255.54724, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "text", "bbox": {"l": 53.79800000000001, "t": 281.8035300000001, "r": 294.27383, "b": 366.89017, "coord_origin": "TOPLEFT"}, "confidence": 0.9866552352905273, "cells": [{"id": 16, "text": "to a minimum, since they introduce difficulties in annotation (see", "bbox": {"l": 53.79800000000001, "t": 281.8035300000001, "r": 294.04605, "b": 290.17815999999993, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "Section 4). As a second condition, we focussed on medium to large", "bbox": {"l": 53.79800000000001, "t": 292.76254, "r": 294.04868, "b": 301.13718, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "documents (", "bbox": {"l": 53.79800000000001, "t": 303.72153, "r": 98.881348, "b": 312.09616, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": ">", "bbox": {"l": 99.070999, "t": 306.07971, "r": 104.77363, "b": 310.08768, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "10", "bbox": {"l": 107.46399999999998, "t": 303.72153, "r": 115.83373999999999, "b": 312.09616, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "pages) with technical content, dense in complex", "bbox": {"l": 118.08366, "t": 303.72153, "r": 294.26233, "b": 312.09616, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "tables, figures, plots and captions. Such documents carry a lot of", "bbox": {"l": 53.79800000000001, "t": 314.68054, "r": 294.04715, "b": 323.05518, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "information value, but are often hard to analyse with high accuracy", "bbox": {"l": 53.79800000000001, "t": 325.63855, "r": 294.27383, "b": 334.01318, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "due to their challenging layouts. Counterexamples of documents", "bbox": {"l": 53.79800000000001, "t": 336.59753, "r": 294.0416, "b": 344.97217, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "not included in the dataset are receipts, invoices, hand-written", "bbox": {"l": 53.79800000000001, "t": 347.5565500000001, "r": 294.04712, "b": 355.9311799999999, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "documents or photographs showing \u201ctext in the wild\".", "bbox": {"l": 53.79800000000001, "t": 358.51553, "r": 251.73131, "b": 366.89017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 53.57400100000001, "t": 369.47455, "r": 295.56046, "b": 509.35617, "coord_origin": "TOPLEFT"}, "confidence": 0.987700879573822, "cells": [{"id": 27, "text": "The pages in DocLayNet can be grouped into six distinct cate-", "bbox": {"l": 63.76100199999999, "t": 369.47455, "r": 295.55945, "b": 377.84918, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "gories, namely", "bbox": {"l": 53.79800000000001, "t": 380.43353, "r": 105.90533, "b": 388.80816999999996, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Financial Reports", "bbox": {"l": 107.754, "t": 380.47838999999993, "r": 167.4973, "b": 388.81714, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": ",", "bbox": {"l": 167.496, "t": 380.43353, "r": 169.42915, "b": 388.80816999999996, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Manuals", "bbox": {"l": 171.28101, "t": 380.47838999999993, "r": 201.45581, "b": 388.81714, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": ",", "bbox": {"l": 201.455, "t": 380.43353, "r": 203.38815, "b": 388.80816999999996, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "Scientific Articles", "bbox": {"l": 205.24001, "t": 380.47838999999993, "r": 264.55273, "b": 388.81714, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": ",", "bbox": {"l": 264.54901, "t": 380.43353, "r": 266.48218, "b": 388.80816999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "Laws &", "bbox": {"l": 268.33401, "t": 380.47838999999993, "r": 294.36133, "b": 388.81714, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Regulations", "bbox": {"l": 53.79800000000001, "t": 391.43741000000006, "r": 94.899666, "b": 399.77615, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": ",", "bbox": {"l": 94.900002, "t": 391.39255, "r": 96.862747, "b": 399.76718, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "Patents", "bbox": {"l": 99.109001, "t": 391.43741000000006, "r": 124.72282, "b": 399.77615, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "and", "bbox": {"l": 127.17899999999999, "t": 391.39255, "r": 140.60596, "b": 399.76718, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "Government Tenders", "bbox": {"l": 142.853, "t": 391.43741000000006, "r": 215.15340000000003, "b": 399.77615, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": ". Each document cate-", "bbox": {"l": 215.15601000000004, "t": 391.39255, "r": 295.55716, "b": 399.76718, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "gory was sourced from various repositories. For example, Financial", "bbox": {"l": 53.79800000000001, "t": 402.3515300000001, "r": 294.04535, "b": 410.72617, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Reports contain both", "bbox": {"l": 53.79800000000001, "t": 413.31055, "r": 132.19516, "b": 421.68518000000006, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "free-style", "bbox": {"l": 134.528, "t": 413.35541, "r": 167.77272, "b": 421.69415, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "format annual reports", "bbox": {"l": 170.314, "t": 413.31055, "r": 252.36031, "b": 421.68518000000006, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "2", "bbox": {"l": 252.356, "t": 411.24283, "r": 255.73781, "b": 418.03555, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "which ex-", "bbox": {"l": 258.56601, "t": 413.31055, "r": 295.56046, "b": 421.68518000000006, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "pose company-specific, artistic layouts as well as the more formal", "bbox": {"l": 53.79800000000001, "t": 424.26953, "r": 294.04376, "b": 432.6441699999999, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "SEC filings. The two largest categories (", "bbox": {"l": 53.79800000000001, "t": 435.22754000000003, "r": 197.59023, "b": 443.60217, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Financial Reports", "bbox": {"l": 197.591, "t": 435.27240000000006, "r": 258.02774, "b": 443.61115, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "and", "bbox": {"l": 260.48901, "t": 435.22754000000003, "r": 273.78104, "b": 443.60217, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Man-", "bbox": {"l": 276.03201, "t": 435.27240000000006, "r": 294.94113, "b": 443.61115, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "uals", "bbox": {"l": 53.79800000000001, "t": 446.23138, "r": 68.085777, "b": 454.57013, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": ") contain a large amount of free-style layouts in order to obtain", "bbox": {"l": 68.296997, "t": 446.18652, "r": 294.04565, "b": 454.56116, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "maximum variability. In the other four categories, we boosted the", "bbox": {"l": 53.79800000000001, "t": 457.14554, "r": 294.04163, "b": 465.52017, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "variability by mixing documents from independent providers, such", "bbox": {"l": 53.57400100000001, "t": 468.10455, "r": 294.04889, "b": 476.47919, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "as different government websites or publishers. In Figure 2, we", "bbox": {"l": 53.79800000000001, "t": 479.06354, "r": 294.04715, "b": 487.43817, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "show the document categories contained in DocLayNet with their", "bbox": {"l": 53.79800000000001, "t": 490.02255, "r": 294.21643, "b": 498.39719, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "respective sizes.", "bbox": {"l": 53.79800000000001, "t": 500.98154, "r": 112.2948, "b": 509.35617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 53.466999, "t": 511.94055, "r": 295.56155, "b": 607.98618, "coord_origin": "TOPLEFT"}, "confidence": 0.9877581000328064, "cells": [{"id": 60, "text": "We did not control the document selection with regard to lan-", "bbox": {"l": 63.76100199999999, "t": 511.94055, "r": 295.55954, "b": 520.31519, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "guage. The vast majority of documents contained in DocLayNet", "bbox": {"l": 53.79800000000001, "t": 522.89954, "r": 294.04718, "b": 531.27417, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "(close to 95%) are published in English language. However, Do-", "bbox": {"l": 53.528999, "t": 533.8585499999999, "r": 295.56155, "b": 542.23317, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "cLayNet also contains a number of documents in other languages", "bbox": {"l": 53.79800000000001, "t": 544.81755, "r": 294.04144, "b": 553.19217, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "such as German (2.5%), French (1.0%) and Japanese (1.0%). While", "bbox": {"l": 53.79800000000001, "t": 555.77556, "r": 294.04709, "b": 564.15018, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "the document language has negligible impact on the performance", "bbox": {"l": 53.79800000000001, "t": 566.73456, "r": 294.04163, "b": 575.10918, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "of computer vision methods such as object detection and segmenta-", "bbox": {"l": 53.79800000000001, "t": 577.6935599999999, "r": 295.5567, "b": 586.06818, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "tion models, it might prove challenging for layout analysis methods", "bbox": {"l": 53.79800000000001, "t": 588.65256, "r": 294.04541, "b": 597.02718, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "which exploit textual features.", "bbox": {"l": 53.466999, "t": 599.61156, "r": 164.39928, "b": 607.98618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 53.79800000000001, "t": 610.57056, "r": 295.56396, "b": 684.69817, "coord_origin": "TOPLEFT"}, "confidence": 0.9880735278129578, "cells": [{"id": 69, "text": "To ensure that future benchmarks in the document-layout analy-", "bbox": {"l": 63.76100199999999, "t": 610.57056, "r": 295.56396, "b": 618.9451799999999, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "sis community can be easily compared, we have split up DocLayNet", "bbox": {"l": 53.79800000000001, "t": 621.52956, "r": 294.04532, "b": 629.90417, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "into pre-defined train-, test- and validation-sets. In this way, we can", "bbox": {"l": 53.79800000000001, "t": 632.48856, "r": 294.04538, "b": 640.86317, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "avoid spurious variations in the evaluation scores due to random", "bbox": {"l": 53.79800000000001, "t": 643.4475600000001, "r": 294.04315, "b": 651.82217, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "splitting in train-, test- and validation-sets. We also ensured that", "bbox": {"l": 53.79800000000001, "t": 654.40656, "r": 294.04712, "b": 662.78117, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "less frequent labels are represented in train and test sets in equal", "bbox": {"l": 53.79800000000001, "t": 665.36456, "r": 294.04333, "b": 673.7391700000001, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "proportions.", "bbox": {"l": 53.79800000000001, "t": 676.32355, "r": 98.916931, "b": 684.69817, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "footnote", "bbox": {"l": 53.79800000000001, "t": 701.6563639999999, "r": 195.78998, "b": 708.169891, "coord_origin": "TOPLEFT"}, "confidence": 0.9048352241516113, "cells": [{"id": 76, "text": "$^{2}$e.g. AAPL from https://www.annualreports.com/", "bbox": {"l": 53.79800000000001, "t": 701.6563639999999, "r": 195.78998, "b": 708.169891, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 317.62299, "t": 87.36352999999997, "r": 559.19183, "b": 161.49114999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.986920952796936, "cells": [{"id": 77, "text": "Table 1 shows the overall frequency and distribution of the labels", "bbox": {"l": 327.918, "t": 87.36352999999997, "r": 558.20093, "b": 95.73816, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "among the different sets. Importantly, we ensure that subsets are", "bbox": {"l": 317.95499, "t": 98.32250999999997, "r": 558.20013, "b": 106.69713999999999, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "only split on full-document boundaries. This avoids that pages of", "bbox": {"l": 317.95499, "t": 109.28156000000001, "r": 558.20056, "b": 117.65618999999992, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "the same document are spread over train, test and validation set,", "bbox": {"l": 317.95499, "t": 120.24054000000001, "r": 559.19183, "b": 128.61517000000003, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "which can give an undesired evaluation advantage to models and", "bbox": {"l": 317.62299, "t": 131.19854999999995, "r": 558.20349, "b": 139.57317999999998, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "lead to overestimation of their prediction accuracy. We will show", "bbox": {"l": 317.95499, "t": 142.15752999999995, "r": 558.52936, "b": 150.53216999999995, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "the impact of this decision in Section 5.", "bbox": {"l": 317.95499, "t": 153.11652000000004, "r": 461.6416, "b": 161.49114999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "text", "bbox": {"l": 317.95499, "t": 164.07556, "r": 558.43811, "b": 271.0802, "coord_origin": "TOPLEFT"}, "confidence": 0.9860605001449585, "cells": [{"id": 84, "text": "In order to accommodate the different types of models currently", "bbox": {"l": 327.918, "t": 164.07556, "r": 558.43811, "b": 172.4502, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "in use by the community, we provide DocLayNet in an", "bbox": {"l": 317.95499, "t": 175.03454999999997, "r": 516.8219, "b": 183.40918, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "augmented", "bbox": {"l": 519.07501, "t": 175.07941000000005, "r": 558.20135, "b": 183.41814999999997, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "COCO format [16]. This entails the standard COCO ground-truth", "bbox": {"l": 317.95499, "t": 185.99352999999996, "r": 558.20325, "b": 194.36816, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "file (in JSON format) with the associated page images (in PNG", "bbox": {"l": 317.95499, "t": 196.95250999999996, "r": 558.20404, "b": 205.32714999999996, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "format, 1025", "bbox": {"l": 317.95499, "t": 207.91156, "r": 364.28769, "b": 216.28619000000003, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "\u00d7", "bbox": {"l": 364.28699, "t": 207.85779000000002, "r": 369.98962, "b": 215.55993999999998, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "1025 pixels). Furthermore, custom fields have been", "bbox": {"l": 369.98999, "t": 207.91156, "r": 558.20526, "b": 216.28619000000003, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "added to each COCO record to specify document category, original", "bbox": {"l": 317.95499, "t": 218.87054, "r": 558.20251, "b": 227.24518, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "document filename and page number. In addition, we also provide", "bbox": {"l": 317.95499, "t": 229.82952999999998, "r": 558.203, "b": 238.20416, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "the original PDF pages, as well as sidecar files containing parsed", "bbox": {"l": 317.95499, "t": 240.78754000000004, "r": 558.20404, "b": 249.16216999999995, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "PDF text and text-cell coordinates (in JSON). All additional files are", "bbox": {"l": 317.95499, "t": 251.74652000000003, "r": 558.20227, "b": 260.12114999999994, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "linked to the primary page images by their matching filenames.", "bbox": {"l": 317.95499, "t": 262.70556999999997, "r": 550.36414, "b": 271.0802, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "text", "bbox": {"l": 316.94199, "t": 273.66454999999996, "r": 559.72156, "b": 588.88918, "coord_origin": "TOPLEFT"}, "confidence": 0.9853296875953674, "cells": [{"id": 97, "text": "Despite being cost-intense and far less scalable than automation,", "bbox": {"l": 327.918, "t": 273.66454999999996, "r": 559.18488, "b": 282.03918, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "human annotation has several benefits over automated ground-", "bbox": {"l": 317.95499, "t": 284.62354, "r": 559.7132, "b": 292.99817, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "truth generation. The first and most obvious reason to leverage", "bbox": {"l": 317.95499, "t": 295.5825500000001, "r": 558.20416, "b": 303.95717999999994, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "human annotations is the freedom to annotate any type of doc-", "bbox": {"l": 317.95499, "t": 306.54153, "r": 559.71326, "b": 314.91617, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "ument without requiring a programmatic source. For most PDF", "bbox": {"l": 317.95499, "t": 317.50055, "r": 558.41443, "b": 325.87518, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "documents, the original source document is not available. The lat-", "bbox": {"l": 317.95499, "t": 328.4595299999999, "r": 559.71545, "b": 336.83417, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "ter is not a hard constraint with human annotation, but it is for", "bbox": {"l": 317.95499, "t": 339.41855000000004, "r": 558.36865, "b": 347.79318, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "automated methods. A second reason to use human annotations is", "bbox": {"l": 317.95499, "t": 350.37753, "r": 558.20062, "b": 358.75217, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "that the latter usually provide a more natural interpretation of the", "bbox": {"l": 317.95499, "t": 361.33554, "r": 558.20184, "b": 369.71017, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "page layout. The human-interpreted layout can significantly devi-", "bbox": {"l": 317.95499, "t": 372.29453, "r": 559.71442, "b": 380.66916, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "ate from the programmatic layout used in typesetting. For example,", "bbox": {"l": 317.95499, "t": 383.25354, "r": 559.1864, "b": 391.62817, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "\u201cinvisible\u201d tables might be used solely for aligning text paragraphs", "bbox": {"l": 316.94199, "t": 394.21252, "r": 558.20111, "b": 402.58716, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "on columns. Such typesetting tricks might be interpreted by au-", "bbox": {"l": 317.95499, "t": 405.17154, "r": 559.7132, "b": 413.54617, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "tomated methods incorrectly as an actual table, while the human", "bbox": {"l": 317.95499, "t": 416.13052, "r": 558.20013, "b": 424.50515999999993, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "annotation will interpret it correctly as", "bbox": {"l": 317.95499, "t": 427.08953999999994, "r": 464.50613, "b": 435.46417, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "Text", "bbox": {"l": 466.98199000000005, "t": 427.13439999999997, "r": 482.14560000000006, "b": 435.47313999999994, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "or other styles. The", "bbox": {"l": 485.13199000000003, "t": 427.08953999999994, "r": 558.19727, "b": 435.46417, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "same applies to multi-line text elements, when authors decided to", "bbox": {"l": 317.95499, "t": 438.04855, "r": 558.20221, "b": 446.4231899999999, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "space them as \u201cinvisible\u201d list elements without bullet symbols. A", "bbox": {"l": 317.95499, "t": 449.00754, "r": 558.51501, "b": 457.38217, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "third reason to gather ground-truth through human annotation is", "bbox": {"l": 317.95499, "t": 459.96655000000004, "r": 558.19855, "b": 468.34119, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "to estimate a \u201cnatural\u201d upper bound on the segmentation accuracy.", "bbox": {"l": 317.95499, "t": 470.92453, "r": 559.58215, "b": 479.29916, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "As we will show in Section 4, certain documents featuring complex", "bbox": {"l": 317.64099, "t": 481.88354, "r": 558.41559, "b": 490.25818, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "layouts can have different but equally acceptable layout interpre-", "bbox": {"l": 317.95499, "t": 492.84253, "r": 559.72156, "b": 501.21716, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "tations. This natural upper bound for segmentation accuracy can", "bbox": {"l": 317.95499, "t": 503.80154, "r": 558.19928, "b": 512.1761799999999, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "be found by annotating the same pages multiple times by different", "bbox": {"l": 317.95499, "t": 514.76053, "r": 558.20581, "b": 523.13516, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "people and evaluating the inter-annotator agreement. Such a base-", "bbox": {"l": 317.95499, "t": 525.71954, "r": 559.71729, "b": 534.09418, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "line consistency evaluation is very useful to define expectations", "bbox": {"l": 317.95499, "t": 536.6785600000001, "r": 558.20404, "b": 545.05318, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "for a good target accuracy in trained deep neural network models", "bbox": {"l": 317.95499, "t": 547.63756, "r": 558.20074, "b": 556.01218, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "and avoid overfitting (see Table 1). On the flip side, achieving high", "bbox": {"l": 317.95499, "t": 558.59656, "r": 558.20062, "b": 566.97118, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "annotation consistency proved to be a key challenge in human", "bbox": {"l": 317.95499, "t": 569.55556, "r": 558.20416, "b": 577.9301800000001, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "annotation, as we outline in Section 4.", "bbox": {"l": 317.95499, "t": 580.51456, "r": 457.62469, "b": 588.88918, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "section_header", "bbox": {"l": 317.95499, "t": 606.84991, "r": 470.21326, "b": 617.15901, "coord_origin": "TOPLEFT"}, "confidence": 0.9422592520713806, "cells": [{"id": 128, "text": "4", "bbox": {"l": 317.95499, "t": 606.84991, "r": 323.56226, "b": 617.15901, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "ANNOTATION CAMPAIGN", "bbox": {"l": 334.47134, "t": 606.84991, "r": 470.21326, "b": 617.15901, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "text", "bbox": {"l": 317.686, "t": 631.97356, "r": 559.71381, "b": 706.102173, "coord_origin": "TOPLEFT"}, "confidence": 0.9863831996917725, "cells": [{"id": 130, "text": "The annotation campaign was carried out in four phases. In phase", "bbox": {"l": 317.686, "t": 631.97356, "r": 558.20148, "b": 640.34818, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "one, we identified and prepared the data sources for annotation.", "bbox": {"l": 317.95499, "t": 642.93256, "r": 559.58521, "b": 651.30717, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "In phase two, we determined the class labels and how annotations", "bbox": {"l": 317.95499, "t": 653.89156, "r": 558.20007, "b": 662.26617, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "should be done on the documents in order to obtain maximum con-", "bbox": {"l": 317.95499, "t": 664.85056, "r": 559.71375, "b": 673.22517, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "sistency. The latter was guided by a detailed requirement analysis", "bbox": {"l": 317.95499, "t": 675.80956, "r": 558.20233, "b": 684.18417, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "and exhaustive experiments. In phase three, we trained the annota-", "bbox": {"l": 317.95499, "t": 686.76855, "r": 559.71381, "b": 695.143173, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "tion staff and performed exams for quality assurance. In phase four,", "bbox": {"l": 317.95499, "t": 697.7275539999999, "r": 559.1864, "b": 706.102173, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_header", "id": 13, "page_no": 2, "cluster": {"id": 13, "label": "page_header", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.8919971585273743, "cells": [{"id": 0, "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis"}, {"label": "page_header", "id": 11, "page_no": 2, "cluster": {"id": 11, "label": "page_header", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.9104517102241516, "cells": [{"id": 1, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA"}, {"label": "picture", "id": 8, "page_no": 2, "cluster": {"id": 8, "label": "picture", "bbox": {"l": 88.33030700683594, "t": 92.88652038574219, "r": 263.7049560546875, "b": 220.56826782226562, "coord_origin": "TOPLEFT"}, "confidence": 0.9698190689086914, "cells": [{"id": 2, "text": "Patents", "bbox": {"l": 237.11293, "t": 133.08716000000004, "r": 262.97623, "b": 141.61419999999998, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "8%", "bbox": {"l": 202.87892, "t": 140.46178999999995, "r": 213.89999, "b": 148.98883, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Scientific", "bbox": {"l": 207.13306, "t": 93.1576500000001, "r": 237.64882999999998, "b": 101.68469000000005, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "17%", "bbox": {"l": 184.40349, "t": 118.68206999999995, "r": 199.66519, "b": 127.20911000000001, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Financial", "bbox": {"l": 88.288223, "t": 114.35473999999988, "r": 118.80401, "b": 122.88176999999985, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "32%", "bbox": {"l": 136.24422, "t": 130.24408000000005, "r": 151.50592, "b": 138.77112, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Tenders", "bbox": {"l": 93.973373, "t": 187.65765, "r": 121.11515, "b": 196.18469000000005, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "6%", "bbox": {"l": 139.6235, "t": 170.22748, "r": 150.64458, "b": 178.75451999999996, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Laws", "bbox": {"l": 139.88339, "t": 212.50036999999998, "r": 157.68491, "b": 221.02739999999994, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "16%", "bbox": {"l": 157.43983, "t": 183.77808000000005, "r": 172.70154, "b": 192.30511, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Manuals", "bbox": {"l": 225.47252, "t": 189.29656999999997, "r": 254.29510000000002, "b": 197.82361000000003, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "21%", "bbox": {"l": 194.40683, "t": 171.12145999999996, "r": 209.66853, "b": 179.6485, "coord_origin": "TOPLEFT"}}], "children": [{"id": 14, "label": "text", "bbox": {"l": 237.11293, "t": 133.08716000000004, "r": 262.97623, "b": 141.61419999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 2, "text": "Patents", "bbox": {"l": 237.11293, "t": 133.08716000000004, "r": 262.97623, "b": 141.61419999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 202.87892, "t": 140.46178999999995, "r": 213.89999, "b": 148.98883, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 3, "text": "8%", "bbox": {"l": 202.87892, "t": 140.46178999999995, "r": 213.89999, "b": 148.98883, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 207.13306, "t": 93.1576500000001, "r": 237.64882999999998, "b": 101.68469000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 4, "text": "Scientific", "bbox": {"l": 207.13306, "t": 93.1576500000001, "r": 237.64882999999998, "b": 101.68469000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 184.40349, "t": 118.68206999999995, "r": 199.66519, "b": 127.20911000000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 5, "text": "17%", "bbox": {"l": 184.40349, "t": 118.68206999999995, "r": 199.66519, "b": 127.20911000000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 88.288223, "t": 114.35473999999988, "r": 118.80401, "b": 122.88176999999985, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": "Financial", "bbox": {"l": 88.288223, "t": 114.35473999999988, "r": 118.80401, "b": 122.88176999999985, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 136.24422, "t": 130.24408000000005, "r": 151.50592, "b": 138.77112, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "32%", "bbox": {"l": 136.24422, "t": 130.24408000000005, "r": 151.50592, "b": 138.77112, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 93.973373, "t": 187.65765, "r": 121.11515, "b": 196.18469000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "Tenders", "bbox": {"l": 93.973373, "t": 187.65765, "r": 121.11515, "b": 196.18469000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 139.6235, "t": 170.22748, "r": 150.64458, "b": 178.75451999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "6%", "bbox": {"l": 139.6235, "t": 170.22748, "r": 150.64458, "b": 178.75451999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 139.88339, "t": 212.50036999999998, "r": 157.68491, "b": 221.02739999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "Laws", "bbox": {"l": 139.88339, "t": 212.50036999999998, "r": 157.68491, "b": 221.02739999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 157.43983, "t": 183.77808000000005, "r": 172.70154, "b": 192.30511, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "16%", "bbox": {"l": 157.43983, "t": 183.77808000000005, "r": 172.70154, "b": 192.30511, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 225.47252, "t": 189.29656999999997, "r": 254.29510000000002, "b": 197.82361000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "Manuals", "bbox": {"l": 225.47252, "t": 189.29656999999997, "r": 254.29510000000002, "b": 197.82361000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 194.40683, "t": 171.12145999999996, "r": 209.66853, "b": 179.6485, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "21%", "bbox": {"l": 194.40683, "t": 171.12145999999996, "r": 209.66853, "b": 179.6485, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "caption", "id": 9, "page_no": 2, "cluster": {"id": 9, "label": "caption", "bbox": {"l": 53.79800000000001, "t": 236.11499000000003, "r": 294.04373, "b": 255.54724, "coord_origin": "TOPLEFT"}, "confidence": 0.9425410628318787, "cells": [{"id": 14, "text": "Figure 2: Distribution of DocLayNet pages across document", "bbox": {"l": 53.79800000000001, "t": 236.11499000000003, "r": 294.04373, "b": 244.58826, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "categories.", "bbox": {"l": 53.79800000000001, "t": 247.07397000000003, "r": 96.756027, "b": 255.54724, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 2: Distribution of DocLayNet pages across document categories."}, {"label": "text", "id": 4, "page_no": 2, "cluster": {"id": 4, "label": "text", "bbox": {"l": 53.79800000000001, "t": 281.8035300000001, "r": 294.27383, "b": 366.89017, "coord_origin": "TOPLEFT"}, "confidence": 0.9866552352905273, "cells": [{"id": 16, "text": "to a minimum, since they introduce difficulties in annotation (see", "bbox": {"l": 53.79800000000001, "t": 281.8035300000001, "r": 294.04605, "b": 290.17815999999993, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "Section 4). As a second condition, we focussed on medium to large", "bbox": {"l": 53.79800000000001, "t": 292.76254, "r": 294.04868, "b": 301.13718, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "documents (", "bbox": {"l": 53.79800000000001, "t": 303.72153, "r": 98.881348, "b": 312.09616, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": ">", "bbox": {"l": 99.070999, "t": 306.07971, "r": 104.77363, "b": 310.08768, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "10", "bbox": {"l": 107.46399999999998, "t": 303.72153, "r": 115.83373999999999, "b": 312.09616, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "pages) with technical content, dense in complex", "bbox": {"l": 118.08366, "t": 303.72153, "r": 294.26233, "b": 312.09616, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "tables, figures, plots and captions. Such documents carry a lot of", "bbox": {"l": 53.79800000000001, "t": 314.68054, "r": 294.04715, "b": 323.05518, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "information value, but are often hard to analyse with high accuracy", "bbox": {"l": 53.79800000000001, "t": 325.63855, "r": 294.27383, "b": 334.01318, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "due to their challenging layouts. Counterexamples of documents", "bbox": {"l": 53.79800000000001, "t": 336.59753, "r": 294.0416, "b": 344.97217, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "not included in the dataset are receipts, invoices, hand-written", "bbox": {"l": 53.79800000000001, "t": 347.5565500000001, "r": 294.04712, "b": 355.9311799999999, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "documents or photographs showing \u201ctext in the wild\".", "bbox": {"l": 53.79800000000001, "t": 358.51553, "r": 251.73131, "b": 366.89017, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "to a minimum, since they introduce difficulties in annotation (see Section 4). As a second condition, we focussed on medium to large documents ( > 10 pages) with technical content, dense in complex tables, figures, plots and captions. Such documents carry a lot of information value, but are often hard to analyse with high accuracy due to their challenging layouts. Counterexamples of documents not included in the dataset are receipts, invoices, hand-written documents or photographs showing \"text in the wild\"."}, {"label": "text", "id": 2, "page_no": 2, "cluster": {"id": 2, "label": "text", "bbox": {"l": 53.57400100000001, "t": 369.47455, "r": 295.56046, "b": 509.35617, "coord_origin": "TOPLEFT"}, "confidence": 0.987700879573822, "cells": [{"id": 27, "text": "The pages in DocLayNet can be grouped into six distinct cate-", "bbox": {"l": 63.76100199999999, "t": 369.47455, "r": 295.55945, "b": 377.84918, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "gories, namely", "bbox": {"l": 53.79800000000001, "t": 380.43353, "r": 105.90533, "b": 388.80816999999996, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Financial Reports", "bbox": {"l": 107.754, "t": 380.47838999999993, "r": 167.4973, "b": 388.81714, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": ",", "bbox": {"l": 167.496, "t": 380.43353, "r": 169.42915, "b": 388.80816999999996, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Manuals", "bbox": {"l": 171.28101, "t": 380.47838999999993, "r": 201.45581, "b": 388.81714, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": ",", "bbox": {"l": 201.455, "t": 380.43353, "r": 203.38815, "b": 388.80816999999996, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "Scientific Articles", "bbox": {"l": 205.24001, "t": 380.47838999999993, "r": 264.55273, "b": 388.81714, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": ",", "bbox": {"l": 264.54901, "t": 380.43353, "r": 266.48218, "b": 388.80816999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "Laws &", "bbox": {"l": 268.33401, "t": 380.47838999999993, "r": 294.36133, "b": 388.81714, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Regulations", "bbox": {"l": 53.79800000000001, "t": 391.43741000000006, "r": 94.899666, "b": 399.77615, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": ",", "bbox": {"l": 94.900002, "t": 391.39255, "r": 96.862747, "b": 399.76718, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "Patents", "bbox": {"l": 99.109001, "t": 391.43741000000006, "r": 124.72282, "b": 399.77615, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "and", "bbox": {"l": 127.17899999999999, "t": 391.39255, "r": 140.60596, "b": 399.76718, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "Government Tenders", "bbox": {"l": 142.853, "t": 391.43741000000006, "r": 215.15340000000003, "b": 399.77615, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": ". Each document cate-", "bbox": {"l": 215.15601000000004, "t": 391.39255, "r": 295.55716, "b": 399.76718, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "gory was sourced from various repositories. For example, Financial", "bbox": {"l": 53.79800000000001, "t": 402.3515300000001, "r": 294.04535, "b": 410.72617, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Reports contain both", "bbox": {"l": 53.79800000000001, "t": 413.31055, "r": 132.19516, "b": 421.68518000000006, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "free-style", "bbox": {"l": 134.528, "t": 413.35541, "r": 167.77272, "b": 421.69415, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "format annual reports", "bbox": {"l": 170.314, "t": 413.31055, "r": 252.36031, "b": 421.68518000000006, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "2", "bbox": {"l": 252.356, "t": 411.24283, "r": 255.73781, "b": 418.03555, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "which ex-", "bbox": {"l": 258.56601, "t": 413.31055, "r": 295.56046, "b": 421.68518000000006, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "pose company-specific, artistic layouts as well as the more formal", "bbox": {"l": 53.79800000000001, "t": 424.26953, "r": 294.04376, "b": 432.6441699999999, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "SEC filings. The two largest categories (", "bbox": {"l": 53.79800000000001, "t": 435.22754000000003, "r": 197.59023, "b": 443.60217, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Financial Reports", "bbox": {"l": 197.591, "t": 435.27240000000006, "r": 258.02774, "b": 443.61115, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "and", "bbox": {"l": 260.48901, "t": 435.22754000000003, "r": 273.78104, "b": 443.60217, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Man-", "bbox": {"l": 276.03201, "t": 435.27240000000006, "r": 294.94113, "b": 443.61115, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "uals", "bbox": {"l": 53.79800000000001, "t": 446.23138, "r": 68.085777, "b": 454.57013, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": ") contain a large amount of free-style layouts in order to obtain", "bbox": {"l": 68.296997, "t": 446.18652, "r": 294.04565, "b": 454.56116, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "maximum variability. In the other four categories, we boosted the", "bbox": {"l": 53.79800000000001, "t": 457.14554, "r": 294.04163, "b": 465.52017, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "variability by mixing documents from independent providers, such", "bbox": {"l": 53.57400100000001, "t": 468.10455, "r": 294.04889, "b": 476.47919, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "as different government websites or publishers. In Figure 2, we", "bbox": {"l": 53.79800000000001, "t": 479.06354, "r": 294.04715, "b": 487.43817, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "show the document categories contained in DocLayNet with their", "bbox": {"l": 53.79800000000001, "t": 490.02255, "r": 294.21643, "b": 498.39719, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "respective sizes.", "bbox": {"l": 53.79800000000001, "t": 500.98154, "r": 112.2948, "b": 509.35617, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The pages in DocLayNet can be grouped into six distinct categories, namely Financial Reports , Manuals , Scientific Articles , Laws & Regulations , Patents and Government Tenders . Each document category was sourced from various repositories. For example, Financial Reports contain both free-style format annual reports 2 which expose company-specific, artistic layouts as well as the more formal SEC filings. The two largest categories ( Financial Reports and Manuals ) contain a large amount of free-style layouts in order to obtain maximum variability. In the other four categories, we boosted the variability by mixing documents from independent providers, such as different government websites or publishers. In Figure 2, we show the document categories contained in DocLayNet with their respective sizes."}, {"label": "text", "id": 1, "page_no": 2, "cluster": {"id": 1, "label": "text", "bbox": {"l": 53.466999, "t": 511.94055, "r": 295.56155, "b": 607.98618, "coord_origin": "TOPLEFT"}, "confidence": 0.9877581000328064, "cells": [{"id": 60, "text": "We did not control the document selection with regard to lan-", "bbox": {"l": 63.76100199999999, "t": 511.94055, "r": 295.55954, "b": 520.31519, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "guage. The vast majority of documents contained in DocLayNet", "bbox": {"l": 53.79800000000001, "t": 522.89954, "r": 294.04718, "b": 531.27417, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "(close to 95%) are published in English language. However, Do-", "bbox": {"l": 53.528999, "t": 533.8585499999999, "r": 295.56155, "b": 542.23317, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "cLayNet also contains a number of documents in other languages", "bbox": {"l": 53.79800000000001, "t": 544.81755, "r": 294.04144, "b": 553.19217, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "such as German (2.5%), French (1.0%) and Japanese (1.0%). While", "bbox": {"l": 53.79800000000001, "t": 555.77556, "r": 294.04709, "b": 564.15018, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "the document language has negligible impact on the performance", "bbox": {"l": 53.79800000000001, "t": 566.73456, "r": 294.04163, "b": 575.10918, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "of computer vision methods such as object detection and segmenta-", "bbox": {"l": 53.79800000000001, "t": 577.6935599999999, "r": 295.5567, "b": 586.06818, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "tion models, it might prove challenging for layout analysis methods", "bbox": {"l": 53.79800000000001, "t": 588.65256, "r": 294.04541, "b": 597.02718, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "which exploit textual features.", "bbox": {"l": 53.466999, "t": 599.61156, "r": 164.39928, "b": 607.98618, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "We did not control the document selection with regard to language. The vast majority of documents contained in DocLayNet (close to 95%) are published in English language. However, DocLayNet also contains a number of documents in other languages such as German (2.5%), French (1.0%) and Japanese (1.0%). While the document language has negligible impact on the performance of computer vision methods such as object detection and segmentation models, it might prove challenging for layout analysis methods which exploit textual features."}, {"label": "text", "id": 0, "page_no": 2, "cluster": {"id": 0, "label": "text", "bbox": {"l": 53.79800000000001, "t": 610.57056, "r": 295.56396, "b": 684.69817, "coord_origin": "TOPLEFT"}, "confidence": 0.9880735278129578, "cells": [{"id": 69, "text": "To ensure that future benchmarks in the document-layout analy-", "bbox": {"l": 63.76100199999999, "t": 610.57056, "r": 295.56396, "b": 618.9451799999999, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "sis community can be easily compared, we have split up DocLayNet", "bbox": {"l": 53.79800000000001, "t": 621.52956, "r": 294.04532, "b": 629.90417, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "into pre-defined train-, test- and validation-sets. In this way, we can", "bbox": {"l": 53.79800000000001, "t": 632.48856, "r": 294.04538, "b": 640.86317, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "avoid spurious variations in the evaluation scores due to random", "bbox": {"l": 53.79800000000001, "t": 643.4475600000001, "r": 294.04315, "b": 651.82217, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "splitting in train-, test- and validation-sets. We also ensured that", "bbox": {"l": 53.79800000000001, "t": 654.40656, "r": 294.04712, "b": 662.78117, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "less frequent labels are represented in train and test sets in equal", "bbox": {"l": 53.79800000000001, "t": 665.36456, "r": 294.04333, "b": 673.7391700000001, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "proportions.", "bbox": {"l": 53.79800000000001, "t": 676.32355, "r": 98.916931, "b": 684.69817, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "To ensure that future benchmarks in the document-layout analysis community can be easily compared, we have split up DocLayNet into pre-defined train-, test- and validation-sets. In this way, we can avoid spurious variations in the evaluation scores due to random splitting in train-, test- and validation-sets. We also ensured that less frequent labels are represented in train and test sets in equal proportions."}, {"label": "footnote", "id": 12, "page_no": 2, "cluster": {"id": 12, "label": "footnote", "bbox": {"l": 53.79800000000001, "t": 701.6563639999999, "r": 195.78998, "b": 708.169891, "coord_origin": "TOPLEFT"}, "confidence": 0.9048352241516113, "cells": [{"id": 76, "text": "$^{2}$e.g. AAPL from https://www.annualreports.com/", "bbox": {"l": 53.79800000000001, "t": 701.6563639999999, "r": 195.78998, "b": 708.169891, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "$^{2}$e.g. AAPL from https://www.annualreports.com/"}, {"label": "text", "id": 3, "page_no": 2, "cluster": {"id": 3, "label": "text", "bbox": {"l": 317.62299, "t": 87.36352999999997, "r": 559.19183, "b": 161.49114999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.986920952796936, "cells": [{"id": 77, "text": "Table 1 shows the overall frequency and distribution of the labels", "bbox": {"l": 327.918, "t": 87.36352999999997, "r": 558.20093, "b": 95.73816, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "among the different sets. Importantly, we ensure that subsets are", "bbox": {"l": 317.95499, "t": 98.32250999999997, "r": 558.20013, "b": 106.69713999999999, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "only split on full-document boundaries. This avoids that pages of", "bbox": {"l": 317.95499, "t": 109.28156000000001, "r": 558.20056, "b": 117.65618999999992, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "the same document are spread over train, test and validation set,", "bbox": {"l": 317.95499, "t": 120.24054000000001, "r": 559.19183, "b": 128.61517000000003, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "which can give an undesired evaluation advantage to models and", "bbox": {"l": 317.62299, "t": 131.19854999999995, "r": 558.20349, "b": 139.57317999999998, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "lead to overestimation of their prediction accuracy. We will show", "bbox": {"l": 317.95499, "t": 142.15752999999995, "r": 558.52936, "b": 150.53216999999995, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "the impact of this decision in Section 5.", "bbox": {"l": 317.95499, "t": 153.11652000000004, "r": 461.6416, "b": 161.49114999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 1 shows the overall frequency and distribution of the labels among the different sets. Importantly, we ensure that subsets are only split on full-document boundaries. This avoids that pages of the same document are spread over train, test and validation set, which can give an undesired evaluation advantage to models and lead to overestimation of their prediction accuracy. We will show the impact of this decision in Section 5."}, {"label": "text", "id": 6, "page_no": 2, "cluster": {"id": 6, "label": "text", "bbox": {"l": 317.95499, "t": 164.07556, "r": 558.43811, "b": 271.0802, "coord_origin": "TOPLEFT"}, "confidence": 0.9860605001449585, "cells": [{"id": 84, "text": "In order to accommodate the different types of models currently", "bbox": {"l": 327.918, "t": 164.07556, "r": 558.43811, "b": 172.4502, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "in use by the community, we provide DocLayNet in an", "bbox": {"l": 317.95499, "t": 175.03454999999997, "r": 516.8219, "b": 183.40918, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "augmented", "bbox": {"l": 519.07501, "t": 175.07941000000005, "r": 558.20135, "b": 183.41814999999997, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "COCO format [16]. This entails the standard COCO ground-truth", "bbox": {"l": 317.95499, "t": 185.99352999999996, "r": 558.20325, "b": 194.36816, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "file (in JSON format) with the associated page images (in PNG", "bbox": {"l": 317.95499, "t": 196.95250999999996, "r": 558.20404, "b": 205.32714999999996, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "format, 1025", "bbox": {"l": 317.95499, "t": 207.91156, "r": 364.28769, "b": 216.28619000000003, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "\u00d7", "bbox": {"l": 364.28699, "t": 207.85779000000002, "r": 369.98962, "b": 215.55993999999998, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "1025 pixels). Furthermore, custom fields have been", "bbox": {"l": 369.98999, "t": 207.91156, "r": 558.20526, "b": 216.28619000000003, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "added to each COCO record to specify document category, original", "bbox": {"l": 317.95499, "t": 218.87054, "r": 558.20251, "b": 227.24518, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "document filename and page number. In addition, we also provide", "bbox": {"l": 317.95499, "t": 229.82952999999998, "r": 558.203, "b": 238.20416, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "the original PDF pages, as well as sidecar files containing parsed", "bbox": {"l": 317.95499, "t": 240.78754000000004, "r": 558.20404, "b": 249.16216999999995, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "PDF text and text-cell coordinates (in JSON). All additional files are", "bbox": {"l": 317.95499, "t": 251.74652000000003, "r": 558.20227, "b": 260.12114999999994, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "linked to the primary page images by their matching filenames.", "bbox": {"l": 317.95499, "t": 262.70556999999997, "r": 550.36414, "b": 271.0802, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In order to accommodate the different types of models currently in use by the community, we provide DocLayNet in an augmented COCO format [16]. This entails the standard COCO ground-truth file (in JSON format) with the associated page images (in PNG format, 1025 \u00d7 1025 pixels). Furthermore, custom fields have been added to each COCO record to specify document category, original document filename and page number. In addition, we also provide the original PDF pages, as well as sidecar files containing parsed PDF text and text-cell coordinates (in JSON). All additional files are linked to the primary page images by their matching filenames."}, {"label": "text", "id": 7, "page_no": 2, "cluster": {"id": 7, "label": "text", "bbox": {"l": 316.94199, "t": 273.66454999999996, "r": 559.72156, "b": 588.88918, "coord_origin": "TOPLEFT"}, "confidence": 0.9853296875953674, "cells": [{"id": 97, "text": "Despite being cost-intense and far less scalable than automation,", "bbox": {"l": 327.918, "t": 273.66454999999996, "r": 559.18488, "b": 282.03918, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "human annotation has several benefits over automated ground-", "bbox": {"l": 317.95499, "t": 284.62354, "r": 559.7132, "b": 292.99817, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "truth generation. The first and most obvious reason to leverage", "bbox": {"l": 317.95499, "t": 295.5825500000001, "r": 558.20416, "b": 303.95717999999994, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "human annotations is the freedom to annotate any type of doc-", "bbox": {"l": 317.95499, "t": 306.54153, "r": 559.71326, "b": 314.91617, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "ument without requiring a programmatic source. For most PDF", "bbox": {"l": 317.95499, "t": 317.50055, "r": 558.41443, "b": 325.87518, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "documents, the original source document is not available. The lat-", "bbox": {"l": 317.95499, "t": 328.4595299999999, "r": 559.71545, "b": 336.83417, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "ter is not a hard constraint with human annotation, but it is for", "bbox": {"l": 317.95499, "t": 339.41855000000004, "r": 558.36865, "b": 347.79318, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "automated methods. A second reason to use human annotations is", "bbox": {"l": 317.95499, "t": 350.37753, "r": 558.20062, "b": 358.75217, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "that the latter usually provide a more natural interpretation of the", "bbox": {"l": 317.95499, "t": 361.33554, "r": 558.20184, "b": 369.71017, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "page layout. The human-interpreted layout can significantly devi-", "bbox": {"l": 317.95499, "t": 372.29453, "r": 559.71442, "b": 380.66916, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "ate from the programmatic layout used in typesetting. For example,", "bbox": {"l": 317.95499, "t": 383.25354, "r": 559.1864, "b": 391.62817, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "\u201cinvisible\u201d tables might be used solely for aligning text paragraphs", "bbox": {"l": 316.94199, "t": 394.21252, "r": 558.20111, "b": 402.58716, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "on columns. Such typesetting tricks might be interpreted by au-", "bbox": {"l": 317.95499, "t": 405.17154, "r": 559.7132, "b": 413.54617, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "tomated methods incorrectly as an actual table, while the human", "bbox": {"l": 317.95499, "t": 416.13052, "r": 558.20013, "b": 424.50515999999993, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "annotation will interpret it correctly as", "bbox": {"l": 317.95499, "t": 427.08953999999994, "r": 464.50613, "b": 435.46417, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "Text", "bbox": {"l": 466.98199000000005, "t": 427.13439999999997, "r": 482.14560000000006, "b": 435.47313999999994, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "or other styles. The", "bbox": {"l": 485.13199000000003, "t": 427.08953999999994, "r": 558.19727, "b": 435.46417, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "same applies to multi-line text elements, when authors decided to", "bbox": {"l": 317.95499, "t": 438.04855, "r": 558.20221, "b": 446.4231899999999, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "space them as \u201cinvisible\u201d list elements without bullet symbols. A", "bbox": {"l": 317.95499, "t": 449.00754, "r": 558.51501, "b": 457.38217, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "third reason to gather ground-truth through human annotation is", "bbox": {"l": 317.95499, "t": 459.96655000000004, "r": 558.19855, "b": 468.34119, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "to estimate a \u201cnatural\u201d upper bound on the segmentation accuracy.", "bbox": {"l": 317.95499, "t": 470.92453, "r": 559.58215, "b": 479.29916, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "As we will show in Section 4, certain documents featuring complex", "bbox": {"l": 317.64099, "t": 481.88354, "r": 558.41559, "b": 490.25818, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "layouts can have different but equally acceptable layout interpre-", "bbox": {"l": 317.95499, "t": 492.84253, "r": 559.72156, "b": 501.21716, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "tations. This natural upper bound for segmentation accuracy can", "bbox": {"l": 317.95499, "t": 503.80154, "r": 558.19928, "b": 512.1761799999999, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "be found by annotating the same pages multiple times by different", "bbox": {"l": 317.95499, "t": 514.76053, "r": 558.20581, "b": 523.13516, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "people and evaluating the inter-annotator agreement. Such a base-", "bbox": {"l": 317.95499, "t": 525.71954, "r": 559.71729, "b": 534.09418, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "line consistency evaluation is very useful to define expectations", "bbox": {"l": 317.95499, "t": 536.6785600000001, "r": 558.20404, "b": 545.05318, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "for a good target accuracy in trained deep neural network models", "bbox": {"l": 317.95499, "t": 547.63756, "r": 558.20074, "b": 556.01218, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "and avoid overfitting (see Table 1). On the flip side, achieving high", "bbox": {"l": 317.95499, "t": 558.59656, "r": 558.20062, "b": 566.97118, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "annotation consistency proved to be a key challenge in human", "bbox": {"l": 317.95499, "t": 569.55556, "r": 558.20416, "b": 577.9301800000001, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "annotation, as we outline in Section 4.", "bbox": {"l": 317.95499, "t": 580.51456, "r": 457.62469, "b": 588.88918, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Despite being cost-intense and far less scalable than automation, human annotation has several benefits over automated groundtruth generation. The first and most obvious reason to leverage human annotations is the freedom to annotate any type of document without requiring a programmatic source. For most PDF documents, the original source document is not available. The latter is not a hard constraint with human annotation, but it is for automated methods. A second reason to use human annotations is that the latter usually provide a more natural interpretation of the page layout. The human-interpreted layout can significantly deviate from the programmatic layout used in typesetting. For example, \"invisible\" tables might be used solely for aligning text paragraphs on columns. Such typesetting tricks might be interpreted by automated methods incorrectly as an actual table, while the human annotation will interpret it correctly as Text or other styles. The same applies to multi-line text elements, when authors decided to space them as \"invisible\" list elements without bullet symbols. A third reason to gather ground-truth through human annotation is to estimate a \"natural\" upper bound on the segmentation accuracy. As we will show in Section 4, certain documents featuring complex layouts can have different but equally acceptable layout interpretations. This natural upper bound for segmentation accuracy can be found by annotating the same pages multiple times by different people and evaluating the inter-annotator agreement. Such a baseline consistency evaluation is very useful to define expectations for a good target accuracy in trained deep neural network models and avoid overfitting (see Table 1). On the flip side, achieving high annotation consistency proved to be a key challenge in human annotation, as we outline in Section 4."}, {"label": "section_header", "id": 10, "page_no": 2, "cluster": {"id": 10, "label": "section_header", "bbox": {"l": 317.95499, "t": 606.84991, "r": 470.21326, "b": 617.15901, "coord_origin": "TOPLEFT"}, "confidence": 0.9422592520713806, "cells": [{"id": 128, "text": "4", "bbox": {"l": 317.95499, "t": 606.84991, "r": 323.56226, "b": 617.15901, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "ANNOTATION CAMPAIGN", "bbox": {"l": 334.47134, "t": 606.84991, "r": 470.21326, "b": 617.15901, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4 ANNOTATION CAMPAIGN"}, {"label": "text", "id": 5, "page_no": 2, "cluster": {"id": 5, "label": "text", "bbox": {"l": 317.686, "t": 631.97356, "r": 559.71381, "b": 706.102173, "coord_origin": "TOPLEFT"}, "confidence": 0.9863831996917725, "cells": [{"id": 130, "text": "The annotation campaign was carried out in four phases. In phase", "bbox": {"l": 317.686, "t": 631.97356, "r": 558.20148, "b": 640.34818, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "one, we identified and prepared the data sources for annotation.", "bbox": {"l": 317.95499, "t": 642.93256, "r": 559.58521, "b": 651.30717, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "In phase two, we determined the class labels and how annotations", "bbox": {"l": 317.95499, "t": 653.89156, "r": 558.20007, "b": 662.26617, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "should be done on the documents in order to obtain maximum con-", "bbox": {"l": 317.95499, "t": 664.85056, "r": 559.71375, "b": 673.22517, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "sistency. The latter was guided by a detailed requirement analysis", "bbox": {"l": 317.95499, "t": 675.80956, "r": 558.20233, "b": 684.18417, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "and exhaustive experiments. In phase three, we trained the annota-", "bbox": {"l": 317.95499, "t": 686.76855, "r": 559.71381, "b": 695.143173, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "tion staff and performed exams for quality assurance. In phase four,", "bbox": {"l": 317.95499, "t": 697.7275539999999, "r": 559.1864, "b": 706.102173, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The annotation campaign was carried out in four phases. In phase one, we identified and prepared the data sources for annotation. In phase two, we determined the class labels and how annotations should be done on the documents in order to obtain maximum consistency. The latter was guided by a detailed requirement analysis and exhaustive experiments. In phase three, we trained the annotation staff and performed exams for quality assurance. In phase four,"}], "body": [{"label": "picture", "id": 8, "page_no": 2, "cluster": {"id": 8, "label": "picture", "bbox": {"l": 88.33030700683594, "t": 92.88652038574219, "r": 263.7049560546875, "b": 220.56826782226562, "coord_origin": "TOPLEFT"}, "confidence": 0.9698190689086914, "cells": [{"id": 2, "text": "Patents", "bbox": {"l": 237.11293, "t": 133.08716000000004, "r": 262.97623, "b": 141.61419999999998, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "8%", "bbox": {"l": 202.87892, "t": 140.46178999999995, "r": 213.89999, "b": 148.98883, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Scientific", "bbox": {"l": 207.13306, "t": 93.1576500000001, "r": 237.64882999999998, "b": 101.68469000000005, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "17%", "bbox": {"l": 184.40349, "t": 118.68206999999995, "r": 199.66519, "b": 127.20911000000001, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Financial", "bbox": {"l": 88.288223, "t": 114.35473999999988, "r": 118.80401, "b": 122.88176999999985, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "32%", "bbox": {"l": 136.24422, "t": 130.24408000000005, "r": 151.50592, "b": 138.77112, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Tenders", "bbox": {"l": 93.973373, "t": 187.65765, "r": 121.11515, "b": 196.18469000000005, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "6%", "bbox": {"l": 139.6235, "t": 170.22748, "r": 150.64458, "b": 178.75451999999996, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Laws", "bbox": {"l": 139.88339, "t": 212.50036999999998, "r": 157.68491, "b": 221.02739999999994, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "16%", "bbox": {"l": 157.43983, "t": 183.77808000000005, "r": 172.70154, "b": 192.30511, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Manuals", "bbox": {"l": 225.47252, "t": 189.29656999999997, "r": 254.29510000000002, "b": 197.82361000000003, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "21%", "bbox": {"l": 194.40683, "t": 171.12145999999996, "r": 209.66853, "b": 179.6485, "coord_origin": "TOPLEFT"}}], "children": [{"id": 14, "label": "text", "bbox": {"l": 237.11293, "t": 133.08716000000004, "r": 262.97623, "b": 141.61419999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 2, "text": "Patents", "bbox": {"l": 237.11293, "t": 133.08716000000004, "r": 262.97623, "b": 141.61419999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 202.87892, "t": 140.46178999999995, "r": 213.89999, "b": 148.98883, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 3, "text": "8%", "bbox": {"l": 202.87892, "t": 140.46178999999995, "r": 213.89999, "b": 148.98883, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 207.13306, "t": 93.1576500000001, "r": 237.64882999999998, "b": 101.68469000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 4, "text": "Scientific", "bbox": {"l": 207.13306, "t": 93.1576500000001, "r": 237.64882999999998, "b": 101.68469000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 184.40349, "t": 118.68206999999995, "r": 199.66519, "b": 127.20911000000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 5, "text": "17%", "bbox": {"l": 184.40349, "t": 118.68206999999995, "r": 199.66519, "b": 127.20911000000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 88.288223, "t": 114.35473999999988, "r": 118.80401, "b": 122.88176999999985, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": "Financial", "bbox": {"l": 88.288223, "t": 114.35473999999988, "r": 118.80401, "b": 122.88176999999985, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 136.24422, "t": 130.24408000000005, "r": 151.50592, "b": 138.77112, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "32%", "bbox": {"l": 136.24422, "t": 130.24408000000005, "r": 151.50592, "b": 138.77112, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 93.973373, "t": 187.65765, "r": 121.11515, "b": 196.18469000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "Tenders", "bbox": {"l": 93.973373, "t": 187.65765, "r": 121.11515, "b": 196.18469000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 139.6235, "t": 170.22748, "r": 150.64458, "b": 178.75451999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "6%", "bbox": {"l": 139.6235, "t": 170.22748, "r": 150.64458, "b": 178.75451999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 139.88339, "t": 212.50036999999998, "r": 157.68491, "b": 221.02739999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "Laws", "bbox": {"l": 139.88339, "t": 212.50036999999998, "r": 157.68491, "b": 221.02739999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 157.43983, "t": 183.77808000000005, "r": 172.70154, "b": 192.30511, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "16%", "bbox": {"l": 157.43983, "t": 183.77808000000005, "r": 172.70154, "b": 192.30511, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 225.47252, "t": 189.29656999999997, "r": 254.29510000000002, "b": 197.82361000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "Manuals", "bbox": {"l": 225.47252, "t": 189.29656999999997, "r": 254.29510000000002, "b": 197.82361000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 194.40683, "t": 171.12145999999996, "r": 209.66853, "b": 179.6485, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "21%", "bbox": {"l": 194.40683, "t": 171.12145999999996, "r": 209.66853, "b": 179.6485, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "caption", "id": 9, "page_no": 2, "cluster": {"id": 9, "label": "caption", "bbox": {"l": 53.79800000000001, "t": 236.11499000000003, "r": 294.04373, "b": 255.54724, "coord_origin": "TOPLEFT"}, "confidence": 0.9425410628318787, "cells": [{"id": 14, "text": "Figure 2: Distribution of DocLayNet pages across document", "bbox": {"l": 53.79800000000001, "t": 236.11499000000003, "r": 294.04373, "b": 244.58826, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "categories.", "bbox": {"l": 53.79800000000001, "t": 247.07397000000003, "r": 96.756027, "b": 255.54724, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 2: Distribution of DocLayNet pages across document categories."}, {"label": "text", "id": 4, "page_no": 2, "cluster": {"id": 4, "label": "text", "bbox": {"l": 53.79800000000001, "t": 281.8035300000001, "r": 294.27383, "b": 366.89017, "coord_origin": "TOPLEFT"}, "confidence": 0.9866552352905273, "cells": [{"id": 16, "text": "to a minimum, since they introduce difficulties in annotation (see", "bbox": {"l": 53.79800000000001, "t": 281.8035300000001, "r": 294.04605, "b": 290.17815999999993, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "Section 4). As a second condition, we focussed on medium to large", "bbox": {"l": 53.79800000000001, "t": 292.76254, "r": 294.04868, "b": 301.13718, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "documents (", "bbox": {"l": 53.79800000000001, "t": 303.72153, "r": 98.881348, "b": 312.09616, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": ">", "bbox": {"l": 99.070999, "t": 306.07971, "r": 104.77363, "b": 310.08768, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "10", "bbox": {"l": 107.46399999999998, "t": 303.72153, "r": 115.83373999999999, "b": 312.09616, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "pages) with technical content, dense in complex", "bbox": {"l": 118.08366, "t": 303.72153, "r": 294.26233, "b": 312.09616, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "tables, figures, plots and captions. Such documents carry a lot of", "bbox": {"l": 53.79800000000001, "t": 314.68054, "r": 294.04715, "b": 323.05518, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "information value, but are often hard to analyse with high accuracy", "bbox": {"l": 53.79800000000001, "t": 325.63855, "r": 294.27383, "b": 334.01318, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "due to their challenging layouts. Counterexamples of documents", "bbox": {"l": 53.79800000000001, "t": 336.59753, "r": 294.0416, "b": 344.97217, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "not included in the dataset are receipts, invoices, hand-written", "bbox": {"l": 53.79800000000001, "t": 347.5565500000001, "r": 294.04712, "b": 355.9311799999999, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "documents or photographs showing \u201ctext in the wild\".", "bbox": {"l": 53.79800000000001, "t": 358.51553, "r": 251.73131, "b": 366.89017, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "to a minimum, since they introduce difficulties in annotation (see Section 4). As a second condition, we focussed on medium to large documents ( > 10 pages) with technical content, dense in complex tables, figures, plots and captions. Such documents carry a lot of information value, but are often hard to analyse with high accuracy due to their challenging layouts. Counterexamples of documents not included in the dataset are receipts, invoices, hand-written documents or photographs showing \"text in the wild\"."}, {"label": "text", "id": 2, "page_no": 2, "cluster": {"id": 2, "label": "text", "bbox": {"l": 53.57400100000001, "t": 369.47455, "r": 295.56046, "b": 509.35617, "coord_origin": "TOPLEFT"}, "confidence": 0.987700879573822, "cells": [{"id": 27, "text": "The pages in DocLayNet can be grouped into six distinct cate-", "bbox": {"l": 63.76100199999999, "t": 369.47455, "r": 295.55945, "b": 377.84918, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "gories, namely", "bbox": {"l": 53.79800000000001, "t": 380.43353, "r": 105.90533, "b": 388.80816999999996, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Financial Reports", "bbox": {"l": 107.754, "t": 380.47838999999993, "r": 167.4973, "b": 388.81714, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": ",", "bbox": {"l": 167.496, "t": 380.43353, "r": 169.42915, "b": 388.80816999999996, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Manuals", "bbox": {"l": 171.28101, "t": 380.47838999999993, "r": 201.45581, "b": 388.81714, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": ",", "bbox": {"l": 201.455, "t": 380.43353, "r": 203.38815, "b": 388.80816999999996, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "Scientific Articles", "bbox": {"l": 205.24001, "t": 380.47838999999993, "r": 264.55273, "b": 388.81714, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": ",", "bbox": {"l": 264.54901, "t": 380.43353, "r": 266.48218, "b": 388.80816999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "Laws &", "bbox": {"l": 268.33401, "t": 380.47838999999993, "r": 294.36133, "b": 388.81714, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Regulations", "bbox": {"l": 53.79800000000001, "t": 391.43741000000006, "r": 94.899666, "b": 399.77615, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": ",", "bbox": {"l": 94.900002, "t": 391.39255, "r": 96.862747, "b": 399.76718, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "Patents", "bbox": {"l": 99.109001, "t": 391.43741000000006, "r": 124.72282, "b": 399.77615, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "and", "bbox": {"l": 127.17899999999999, "t": 391.39255, "r": 140.60596, "b": 399.76718, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "Government Tenders", "bbox": {"l": 142.853, "t": 391.43741000000006, "r": 215.15340000000003, "b": 399.77615, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": ". Each document cate-", "bbox": {"l": 215.15601000000004, "t": 391.39255, "r": 295.55716, "b": 399.76718, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "gory was sourced from various repositories. For example, Financial", "bbox": {"l": 53.79800000000001, "t": 402.3515300000001, "r": 294.04535, "b": 410.72617, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Reports contain both", "bbox": {"l": 53.79800000000001, "t": 413.31055, "r": 132.19516, "b": 421.68518000000006, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "free-style", "bbox": {"l": 134.528, "t": 413.35541, "r": 167.77272, "b": 421.69415, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "format annual reports", "bbox": {"l": 170.314, "t": 413.31055, "r": 252.36031, "b": 421.68518000000006, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "2", "bbox": {"l": 252.356, "t": 411.24283, "r": 255.73781, "b": 418.03555, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "which ex-", "bbox": {"l": 258.56601, "t": 413.31055, "r": 295.56046, "b": 421.68518000000006, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "pose company-specific, artistic layouts as well as the more formal", "bbox": {"l": 53.79800000000001, "t": 424.26953, "r": 294.04376, "b": 432.6441699999999, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "SEC filings. The two largest categories (", "bbox": {"l": 53.79800000000001, "t": 435.22754000000003, "r": 197.59023, "b": 443.60217, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Financial Reports", "bbox": {"l": 197.591, "t": 435.27240000000006, "r": 258.02774, "b": 443.61115, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "and", "bbox": {"l": 260.48901, "t": 435.22754000000003, "r": 273.78104, "b": 443.60217, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Man-", "bbox": {"l": 276.03201, "t": 435.27240000000006, "r": 294.94113, "b": 443.61115, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "uals", "bbox": {"l": 53.79800000000001, "t": 446.23138, "r": 68.085777, "b": 454.57013, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": ") contain a large amount of free-style layouts in order to obtain", "bbox": {"l": 68.296997, "t": 446.18652, "r": 294.04565, "b": 454.56116, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "maximum variability. In the other four categories, we boosted the", "bbox": {"l": 53.79800000000001, "t": 457.14554, "r": 294.04163, "b": 465.52017, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "variability by mixing documents from independent providers, such", "bbox": {"l": 53.57400100000001, "t": 468.10455, "r": 294.04889, "b": 476.47919, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "as different government websites or publishers. In Figure 2, we", "bbox": {"l": 53.79800000000001, "t": 479.06354, "r": 294.04715, "b": 487.43817, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "show the document categories contained in DocLayNet with their", "bbox": {"l": 53.79800000000001, "t": 490.02255, "r": 294.21643, "b": 498.39719, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "respective sizes.", "bbox": {"l": 53.79800000000001, "t": 500.98154, "r": 112.2948, "b": 509.35617, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The pages in DocLayNet can be grouped into six distinct categories, namely Financial Reports , Manuals , Scientific Articles , Laws & Regulations , Patents and Government Tenders . Each document category was sourced from various repositories. For example, Financial Reports contain both free-style format annual reports 2 which expose company-specific, artistic layouts as well as the more formal SEC filings. The two largest categories ( Financial Reports and Manuals ) contain a large amount of free-style layouts in order to obtain maximum variability. In the other four categories, we boosted the variability by mixing documents from independent providers, such as different government websites or publishers. In Figure 2, we show the document categories contained in DocLayNet with their respective sizes."}, {"label": "text", "id": 1, "page_no": 2, "cluster": {"id": 1, "label": "text", "bbox": {"l": 53.466999, "t": 511.94055, "r": 295.56155, "b": 607.98618, "coord_origin": "TOPLEFT"}, "confidence": 0.9877581000328064, "cells": [{"id": 60, "text": "We did not control the document selection with regard to lan-", "bbox": {"l": 63.76100199999999, "t": 511.94055, "r": 295.55954, "b": 520.31519, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "guage. The vast majority of documents contained in DocLayNet", "bbox": {"l": 53.79800000000001, "t": 522.89954, "r": 294.04718, "b": 531.27417, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "(close to 95%) are published in English language. However, Do-", "bbox": {"l": 53.528999, "t": 533.8585499999999, "r": 295.56155, "b": 542.23317, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "cLayNet also contains a number of documents in other languages", "bbox": {"l": 53.79800000000001, "t": 544.81755, "r": 294.04144, "b": 553.19217, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "such as German (2.5%), French (1.0%) and Japanese (1.0%). While", "bbox": {"l": 53.79800000000001, "t": 555.77556, "r": 294.04709, "b": 564.15018, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "the document language has negligible impact on the performance", "bbox": {"l": 53.79800000000001, "t": 566.73456, "r": 294.04163, "b": 575.10918, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "of computer vision methods such as object detection and segmenta-", "bbox": {"l": 53.79800000000001, "t": 577.6935599999999, "r": 295.5567, "b": 586.06818, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "tion models, it might prove challenging for layout analysis methods", "bbox": {"l": 53.79800000000001, "t": 588.65256, "r": 294.04541, "b": 597.02718, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "which exploit textual features.", "bbox": {"l": 53.466999, "t": 599.61156, "r": 164.39928, "b": 607.98618, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "We did not control the document selection with regard to language. The vast majority of documents contained in DocLayNet (close to 95%) are published in English language. However, DocLayNet also contains a number of documents in other languages such as German (2.5%), French (1.0%) and Japanese (1.0%). While the document language has negligible impact on the performance of computer vision methods such as object detection and segmentation models, it might prove challenging for layout analysis methods which exploit textual features."}, {"label": "text", "id": 0, "page_no": 2, "cluster": {"id": 0, "label": "text", "bbox": {"l": 53.79800000000001, "t": 610.57056, "r": 295.56396, "b": 684.69817, "coord_origin": "TOPLEFT"}, "confidence": 0.9880735278129578, "cells": [{"id": 69, "text": "To ensure that future benchmarks in the document-layout analy-", "bbox": {"l": 63.76100199999999, "t": 610.57056, "r": 295.56396, "b": 618.9451799999999, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "sis community can be easily compared, we have split up DocLayNet", "bbox": {"l": 53.79800000000001, "t": 621.52956, "r": 294.04532, "b": 629.90417, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "into pre-defined train-, test- and validation-sets. In this way, we can", "bbox": {"l": 53.79800000000001, "t": 632.48856, "r": 294.04538, "b": 640.86317, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "avoid spurious variations in the evaluation scores due to random", "bbox": {"l": 53.79800000000001, "t": 643.4475600000001, "r": 294.04315, "b": 651.82217, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "splitting in train-, test- and validation-sets. We also ensured that", "bbox": {"l": 53.79800000000001, "t": 654.40656, "r": 294.04712, "b": 662.78117, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "less frequent labels are represented in train and test sets in equal", "bbox": {"l": 53.79800000000001, "t": 665.36456, "r": 294.04333, "b": 673.7391700000001, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "proportions.", "bbox": {"l": 53.79800000000001, "t": 676.32355, "r": 98.916931, "b": 684.69817, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "To ensure that future benchmarks in the document-layout analysis community can be easily compared, we have split up DocLayNet into pre-defined train-, test- and validation-sets. In this way, we can avoid spurious variations in the evaluation scores due to random splitting in train-, test- and validation-sets. We also ensured that less frequent labels are represented in train and test sets in equal proportions."}, {"label": "footnote", "id": 12, "page_no": 2, "cluster": {"id": 12, "label": "footnote", "bbox": {"l": 53.79800000000001, "t": 701.6563639999999, "r": 195.78998, "b": 708.169891, "coord_origin": "TOPLEFT"}, "confidence": 0.9048352241516113, "cells": [{"id": 76, "text": "$^{2}$e.g. AAPL from https://www.annualreports.com/", "bbox": {"l": 53.79800000000001, "t": 701.6563639999999, "r": 195.78998, "b": 708.169891, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "$^{2}$e.g. AAPL from https://www.annualreports.com/"}, {"label": "text", "id": 3, "page_no": 2, "cluster": {"id": 3, "label": "text", "bbox": {"l": 317.62299, "t": 87.36352999999997, "r": 559.19183, "b": 161.49114999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.986920952796936, "cells": [{"id": 77, "text": "Table 1 shows the overall frequency and distribution of the labels", "bbox": {"l": 327.918, "t": 87.36352999999997, "r": 558.20093, "b": 95.73816, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "among the different sets. Importantly, we ensure that subsets are", "bbox": {"l": 317.95499, "t": 98.32250999999997, "r": 558.20013, "b": 106.69713999999999, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "only split on full-document boundaries. This avoids that pages of", "bbox": {"l": 317.95499, "t": 109.28156000000001, "r": 558.20056, "b": 117.65618999999992, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "the same document are spread over train, test and validation set,", "bbox": {"l": 317.95499, "t": 120.24054000000001, "r": 559.19183, "b": 128.61517000000003, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "which can give an undesired evaluation advantage to models and", "bbox": {"l": 317.62299, "t": 131.19854999999995, "r": 558.20349, "b": 139.57317999999998, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "lead to overestimation of their prediction accuracy. We will show", "bbox": {"l": 317.95499, "t": 142.15752999999995, "r": 558.52936, "b": 150.53216999999995, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "the impact of this decision in Section 5.", "bbox": {"l": 317.95499, "t": 153.11652000000004, "r": 461.6416, "b": 161.49114999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 1 shows the overall frequency and distribution of the labels among the different sets. Importantly, we ensure that subsets are only split on full-document boundaries. This avoids that pages of the same document are spread over train, test and validation set, which can give an undesired evaluation advantage to models and lead to overestimation of their prediction accuracy. We will show the impact of this decision in Section 5."}, {"label": "text", "id": 6, "page_no": 2, "cluster": {"id": 6, "label": "text", "bbox": {"l": 317.95499, "t": 164.07556, "r": 558.43811, "b": 271.0802, "coord_origin": "TOPLEFT"}, "confidence": 0.9860605001449585, "cells": [{"id": 84, "text": "In order to accommodate the different types of models currently", "bbox": {"l": 327.918, "t": 164.07556, "r": 558.43811, "b": 172.4502, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "in use by the community, we provide DocLayNet in an", "bbox": {"l": 317.95499, "t": 175.03454999999997, "r": 516.8219, "b": 183.40918, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "augmented", "bbox": {"l": 519.07501, "t": 175.07941000000005, "r": 558.20135, "b": 183.41814999999997, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "COCO format [16]. This entails the standard COCO ground-truth", "bbox": {"l": 317.95499, "t": 185.99352999999996, "r": 558.20325, "b": 194.36816, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "file (in JSON format) with the associated page images (in PNG", "bbox": {"l": 317.95499, "t": 196.95250999999996, "r": 558.20404, "b": 205.32714999999996, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "format, 1025", "bbox": {"l": 317.95499, "t": 207.91156, "r": 364.28769, "b": 216.28619000000003, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "\u00d7", "bbox": {"l": 364.28699, "t": 207.85779000000002, "r": 369.98962, "b": 215.55993999999998, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "1025 pixels). Furthermore, custom fields have been", "bbox": {"l": 369.98999, "t": 207.91156, "r": 558.20526, "b": 216.28619000000003, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "added to each COCO record to specify document category, original", "bbox": {"l": 317.95499, "t": 218.87054, "r": 558.20251, "b": 227.24518, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "document filename and page number. In addition, we also provide", "bbox": {"l": 317.95499, "t": 229.82952999999998, "r": 558.203, "b": 238.20416, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "the original PDF pages, as well as sidecar files containing parsed", "bbox": {"l": 317.95499, "t": 240.78754000000004, "r": 558.20404, "b": 249.16216999999995, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "PDF text and text-cell coordinates (in JSON). All additional files are", "bbox": {"l": 317.95499, "t": 251.74652000000003, "r": 558.20227, "b": 260.12114999999994, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "linked to the primary page images by their matching filenames.", "bbox": {"l": 317.95499, "t": 262.70556999999997, "r": 550.36414, "b": 271.0802, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In order to accommodate the different types of models currently in use by the community, we provide DocLayNet in an augmented COCO format [16]. This entails the standard COCO ground-truth file (in JSON format) with the associated page images (in PNG format, 1025 \u00d7 1025 pixels). Furthermore, custom fields have been added to each COCO record to specify document category, original document filename and page number. In addition, we also provide the original PDF pages, as well as sidecar files containing parsed PDF text and text-cell coordinates (in JSON). All additional files are linked to the primary page images by their matching filenames."}, {"label": "text", "id": 7, "page_no": 2, "cluster": {"id": 7, "label": "text", "bbox": {"l": 316.94199, "t": 273.66454999999996, "r": 559.72156, "b": 588.88918, "coord_origin": "TOPLEFT"}, "confidence": 0.9853296875953674, "cells": [{"id": 97, "text": "Despite being cost-intense and far less scalable than automation,", "bbox": {"l": 327.918, "t": 273.66454999999996, "r": 559.18488, "b": 282.03918, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "human annotation has several benefits over automated ground-", "bbox": {"l": 317.95499, "t": 284.62354, "r": 559.7132, "b": 292.99817, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "truth generation. The first and most obvious reason to leverage", "bbox": {"l": 317.95499, "t": 295.5825500000001, "r": 558.20416, "b": 303.95717999999994, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "human annotations is the freedom to annotate any type of doc-", "bbox": {"l": 317.95499, "t": 306.54153, "r": 559.71326, "b": 314.91617, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "ument without requiring a programmatic source. For most PDF", "bbox": {"l": 317.95499, "t": 317.50055, "r": 558.41443, "b": 325.87518, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "documents, the original source document is not available. The lat-", "bbox": {"l": 317.95499, "t": 328.4595299999999, "r": 559.71545, "b": 336.83417, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "ter is not a hard constraint with human annotation, but it is for", "bbox": {"l": 317.95499, "t": 339.41855000000004, "r": 558.36865, "b": 347.79318, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "automated methods. A second reason to use human annotations is", "bbox": {"l": 317.95499, "t": 350.37753, "r": 558.20062, "b": 358.75217, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "that the latter usually provide a more natural interpretation of the", "bbox": {"l": 317.95499, "t": 361.33554, "r": 558.20184, "b": 369.71017, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "page layout. The human-interpreted layout can significantly devi-", "bbox": {"l": 317.95499, "t": 372.29453, "r": 559.71442, "b": 380.66916, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "ate from the programmatic layout used in typesetting. For example,", "bbox": {"l": 317.95499, "t": 383.25354, "r": 559.1864, "b": 391.62817, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "\u201cinvisible\u201d tables might be used solely for aligning text paragraphs", "bbox": {"l": 316.94199, "t": 394.21252, "r": 558.20111, "b": 402.58716, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "on columns. Such typesetting tricks might be interpreted by au-", "bbox": {"l": 317.95499, "t": 405.17154, "r": 559.7132, "b": 413.54617, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "tomated methods incorrectly as an actual table, while the human", "bbox": {"l": 317.95499, "t": 416.13052, "r": 558.20013, "b": 424.50515999999993, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "annotation will interpret it correctly as", "bbox": {"l": 317.95499, "t": 427.08953999999994, "r": 464.50613, "b": 435.46417, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "Text", "bbox": {"l": 466.98199000000005, "t": 427.13439999999997, "r": 482.14560000000006, "b": 435.47313999999994, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "or other styles. The", "bbox": {"l": 485.13199000000003, "t": 427.08953999999994, "r": 558.19727, "b": 435.46417, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "same applies to multi-line text elements, when authors decided to", "bbox": {"l": 317.95499, "t": 438.04855, "r": 558.20221, "b": 446.4231899999999, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "space them as \u201cinvisible\u201d list elements without bullet symbols. A", "bbox": {"l": 317.95499, "t": 449.00754, "r": 558.51501, "b": 457.38217, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "third reason to gather ground-truth through human annotation is", "bbox": {"l": 317.95499, "t": 459.96655000000004, "r": 558.19855, "b": 468.34119, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "to estimate a \u201cnatural\u201d upper bound on the segmentation accuracy.", "bbox": {"l": 317.95499, "t": 470.92453, "r": 559.58215, "b": 479.29916, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "As we will show in Section 4, certain documents featuring complex", "bbox": {"l": 317.64099, "t": 481.88354, "r": 558.41559, "b": 490.25818, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "layouts can have different but equally acceptable layout interpre-", "bbox": {"l": 317.95499, "t": 492.84253, "r": 559.72156, "b": 501.21716, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "tations. This natural upper bound for segmentation accuracy can", "bbox": {"l": 317.95499, "t": 503.80154, "r": 558.19928, "b": 512.1761799999999, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "be found by annotating the same pages multiple times by different", "bbox": {"l": 317.95499, "t": 514.76053, "r": 558.20581, "b": 523.13516, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "people and evaluating the inter-annotator agreement. Such a base-", "bbox": {"l": 317.95499, "t": 525.71954, "r": 559.71729, "b": 534.09418, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "line consistency evaluation is very useful to define expectations", "bbox": {"l": 317.95499, "t": 536.6785600000001, "r": 558.20404, "b": 545.05318, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "for a good target accuracy in trained deep neural network models", "bbox": {"l": 317.95499, "t": 547.63756, "r": 558.20074, "b": 556.01218, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "and avoid overfitting (see Table 1). On the flip side, achieving high", "bbox": {"l": 317.95499, "t": 558.59656, "r": 558.20062, "b": 566.97118, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "annotation consistency proved to be a key challenge in human", "bbox": {"l": 317.95499, "t": 569.55556, "r": 558.20416, "b": 577.9301800000001, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "annotation, as we outline in Section 4.", "bbox": {"l": 317.95499, "t": 580.51456, "r": 457.62469, "b": 588.88918, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Despite being cost-intense and far less scalable than automation, human annotation has several benefits over automated groundtruth generation. The first and most obvious reason to leverage human annotations is the freedom to annotate any type of document without requiring a programmatic source. For most PDF documents, the original source document is not available. The latter is not a hard constraint with human annotation, but it is for automated methods. A second reason to use human annotations is that the latter usually provide a more natural interpretation of the page layout. The human-interpreted layout can significantly deviate from the programmatic layout used in typesetting. For example, \"invisible\" tables might be used solely for aligning text paragraphs on columns. Such typesetting tricks might be interpreted by automated methods incorrectly as an actual table, while the human annotation will interpret it correctly as Text or other styles. The same applies to multi-line text elements, when authors decided to space them as \"invisible\" list elements without bullet symbols. A third reason to gather ground-truth through human annotation is to estimate a \"natural\" upper bound on the segmentation accuracy. As we will show in Section 4, certain documents featuring complex layouts can have different but equally acceptable layout interpretations. This natural upper bound for segmentation accuracy can be found by annotating the same pages multiple times by different people and evaluating the inter-annotator agreement. Such a baseline consistency evaluation is very useful to define expectations for a good target accuracy in trained deep neural network models and avoid overfitting (see Table 1). On the flip side, achieving high annotation consistency proved to be a key challenge in human annotation, as we outline in Section 4."}, {"label": "section_header", "id": 10, "page_no": 2, "cluster": {"id": 10, "label": "section_header", "bbox": {"l": 317.95499, "t": 606.84991, "r": 470.21326, "b": 617.15901, "coord_origin": "TOPLEFT"}, "confidence": 0.9422592520713806, "cells": [{"id": 128, "text": "4", "bbox": {"l": 317.95499, "t": 606.84991, "r": 323.56226, "b": 617.15901, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "ANNOTATION CAMPAIGN", "bbox": {"l": 334.47134, "t": 606.84991, "r": 470.21326, "b": 617.15901, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4 ANNOTATION CAMPAIGN"}, {"label": "text", "id": 5, "page_no": 2, "cluster": {"id": 5, "label": "text", "bbox": {"l": 317.686, "t": 631.97356, "r": 559.71381, "b": 706.102173, "coord_origin": "TOPLEFT"}, "confidence": 0.9863831996917725, "cells": [{"id": 130, "text": "The annotation campaign was carried out in four phases. In phase", "bbox": {"l": 317.686, "t": 631.97356, "r": 558.20148, "b": 640.34818, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "one, we identified and prepared the data sources for annotation.", "bbox": {"l": 317.95499, "t": 642.93256, "r": 559.58521, "b": 651.30717, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "In phase two, we determined the class labels and how annotations", "bbox": {"l": 317.95499, "t": 653.89156, "r": 558.20007, "b": 662.26617, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "should be done on the documents in order to obtain maximum con-", "bbox": {"l": 317.95499, "t": 664.85056, "r": 559.71375, "b": 673.22517, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "sistency. The latter was guided by a detailed requirement analysis", "bbox": {"l": 317.95499, "t": 675.80956, "r": 558.20233, "b": 684.18417, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "and exhaustive experiments. In phase three, we trained the annota-", "bbox": {"l": 317.95499, "t": 686.76855, "r": 559.71381, "b": 695.143173, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "tion staff and performed exams for quality assurance. In phase four,", "bbox": {"l": 317.95499, "t": 697.7275539999999, "r": 559.1864, "b": 706.102173, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The annotation campaign was carried out in four phases. In phase one, we identified and prepared the data sources for annotation. In phase two, we determined the class labels and how annotations should be done on the documents in order to obtain maximum consistency. The latter was guided by a detailed requirement analysis and exhaustive experiments. In phase three, we trained the annotation staff and performed exams for quality assurance. In phase four,"}], "headers": [{"label": "page_header", "id": 13, "page_no": 2, "cluster": {"id": 13, "label": "page_header", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.8919971585273743, "cells": [{"id": 0, "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis"}, {"label": "page_header", "id": 11, "page_no": 2, "cluster": {"id": 11, "label": "page_header", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.9104517102241516, "cells": [{"id": 1, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA"}]}}, {"page_no": 3, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 246.24382, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar", "bbox": {"l": 253.13897999999998, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Table 1: DocLayNet dataset overview. Along with the frequency of each class label, we present the relative occurrence (as %", "bbox": {"l": 53.501999, "t": 84.95495999999991, "r": 558.48969, "b": 93.42822000000001, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "of row \u201cTotal\u201d) in the train, test and validation sets. The inter-annotator agreement is computed as the mAP@0.5-0.95 metric", "bbox": {"l": 53.79800000000001, "t": 95.91394000000003, "r": 558.20294, "b": 104.3872100000001, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "between pairwise annotations from the triple-annotated pages, from which we obtain accuracy ranges.", "bbox": {"l": 53.79800000000001, "t": 106.87292000000002, "r": 469.84805000000006, "b": 115.34618999999998, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "% of Total", "bbox": {"l": 233.94400000000002, "t": 140.22351000000003, "r": 270.04272, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "triple inter-annotator mAP @ 0.5-0.95 (%)", "bbox": {"l": 329.04999, "t": 140.22351000000003, "r": 483.3976400000001, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "class label", "bbox": {"l": 104.825, "t": 151.18255999999997, "r": 141.71277, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Count", "bbox": {"l": 175.94701, "t": 151.18255999999997, "r": 198.71269, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Train", "bbox": {"l": 213.795, "t": 151.18255999999997, "r": 233.69144, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Test", "bbox": {"l": 249.37367, "t": 151.18255999999997, "r": 264.5, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Val", "bbox": {"l": 283.53568, "t": 151.18255999999997, "r": 295.30856, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "All", "bbox": {"l": 314.01501, "t": 151.18255999999997, "r": 324.98093, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Fin", "bbox": {"l": 343.01236, "t": 151.18255999999997, "r": 354.65076, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Man", "bbox": {"l": 367.84033, "t": 151.18255999999997, "r": 384.32059, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Sci", "bbox": {"l": 407.54358, "t": 151.18255999999997, "r": 418.15979, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Law", "bbox": {"l": 432.29979999999995, "t": 151.18255999999997, "r": 447.82962, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "Pat", "bbox": {"l": 465.72656, "t": 151.18255999999997, "r": 477.50842, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Ten", "bbox": {"l": 493.52240000000006, "t": 151.18255999999997, "r": 507.17822, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Caption", "bbox": {"l": 104.825, "t": 162.53954999999996, "r": 134.01064, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "22524", "bbox": {"l": 177.866, "t": 162.53954999999996, "r": 198.71288, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "2.04", "bbox": {"l": 219.211, "t": 162.53954999999996, "r": 233.69174000000004, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "1.77", "bbox": {"l": 250.01956, "t": 162.53954999999996, "r": 264.50031, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "2.32", "bbox": {"l": 280.82812, "t": 162.53954999999996, "r": 295.30887, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "84-89", "bbox": {"l": 305.27301, "t": 162.53954999999996, "r": 324.98117, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "40-61", "bbox": {"l": 334.94284, "t": 162.53954999999996, "r": 354.651, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "86-92", "bbox": {"l": 364.61267, "t": 162.53954999999996, "r": 384.32083, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "94-99", "bbox": {"l": 398.45187, "t": 162.53954999999996, "r": 418.16003, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "95-99", "bbox": {"l": 428.1217, "t": 162.53954999999996, "r": 447.82986, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "69-78", "bbox": {"l": 457.80051, "t": 162.53954999999996, "r": 477.50867, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "n/a", "bbox": {"l": 495.32489, "t": 162.53954999999996, "r": 507.17846999999995, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Footnote", "bbox": {"l": 104.825, "t": 173.49854000000005, "r": 137.3282, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "6318", "bbox": {"l": 182.035, "t": 173.49854000000005, "r": 198.71251, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "0.60", "bbox": {"l": 219.211, "t": 173.49854000000005, "r": 233.69174000000004, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "0.31", "bbox": {"l": 250.01956, "t": 173.49854000000005, "r": 264.50031, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "0.58", "bbox": {"l": 280.82812, "t": 173.49854000000005, "r": 295.30887, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "83-91", "bbox": {"l": 305.27301, "t": 173.49854000000005, "r": 324.98117, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "n/a", "bbox": {"l": 342.79739, "t": 173.49854000000005, "r": 354.65097, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "100", "bbox": {"l": 371.81265, "t": 173.49854000000005, "r": 384.32077, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "62-88", "bbox": {"l": 398.45181, "t": 173.49854000000005, "r": 418.15997, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "85-94", "bbox": {"l": 428.12164, "t": 173.49854000000005, "r": 447.8298, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "n/a", "bbox": {"l": 465.655, "t": 173.49854000000005, "r": 477.50857999999994, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "82-97", "bbox": {"l": 487.47025, "t": 173.49854000000005, "r": 507.17841, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Formula", "bbox": {"l": 104.825, "t": 184.45752000000005, "r": 135.33766, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "25027", "bbox": {"l": 177.866, "t": 184.45752000000005, "r": 198.71288, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "2.25", "bbox": {"l": 219.211, "t": 184.45752000000005, "r": 233.69174000000004, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "1.90", "bbox": {"l": 250.01956, "t": 184.45752000000005, "r": 264.50031, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "2.96", "bbox": {"l": 280.82812, "t": 184.45752000000005, "r": 295.30887, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "83-85", "bbox": {"l": 305.27301, "t": 184.45752000000005, "r": 324.98117, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "n/a", "bbox": {"l": 342.79739, "t": 184.45752000000005, "r": 354.65097, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "n/a", "bbox": {"l": 372.46719, "t": 184.45752000000005, "r": 384.32077, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "84-87", "bbox": {"l": 398.45181, "t": 184.45752000000005, "r": 418.15997, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "86-96", "bbox": {"l": 428.12164, "t": 184.45752000000005, "r": 447.8298, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "n/a", "bbox": {"l": 465.655, "t": 184.45752000000005, "r": 477.50857999999994, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "n/a", "bbox": {"l": 495.3248, "t": 184.45752000000005, "r": 507.17838000000006, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "List-item", "bbox": {"l": 104.825, "t": 195.41656, "r": 137.70479, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "185660", "bbox": {"l": 173.69701, "t": 195.41656, "r": 198.71326, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "17.19", "bbox": {"l": 215.04201, "t": 195.41656, "r": 233.69212, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "13.34", "bbox": {"l": 245.85056, "t": 195.41656, "r": 264.50067, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "15.82", "bbox": {"l": 276.65912, "t": 195.41656, "r": 295.30923, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "87-88", "bbox": {"l": 305.27301, "t": 195.41656, "r": 324.98117, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "74-83", "bbox": {"l": 334.94284, "t": 195.41656, "r": 354.651, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "90-92", "bbox": {"l": 364.61267, "t": 195.41656, "r": 384.32083, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "97-97", "bbox": {"l": 398.45187, "t": 195.41656, "r": 418.16003, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "81-85", "bbox": {"l": 428.1217, "t": 195.41656, "r": 447.82986, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "75-88", "bbox": {"l": 457.80051, "t": 195.41656, "r": 477.50867, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "93-95", "bbox": {"l": 487.47034, "t": 195.41656, "r": 507.17849999999993, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "Page-footer", "bbox": {"l": 104.825, "t": 206.37554999999998, "r": 147.35262, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "70878", "bbox": {"l": 177.866, "t": 206.37554999999998, "r": 198.71288, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "6.51", "bbox": {"l": 219.211, "t": 206.37554999999998, "r": 233.69174000000004, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "5.58", "bbox": {"l": 250.01956, "t": 206.37554999999998, "r": 264.50031, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "6.00", "bbox": {"l": 280.82812, "t": 206.37554999999998, "r": 295.30887, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "93-94", "bbox": {"l": 305.27301, "t": 206.37554999999998, "r": 324.98117, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "88-90", "bbox": {"l": 334.94284, "t": 206.37554999999998, "r": 354.651, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "95-96", "bbox": {"l": 364.61267, "t": 206.37554999999998, "r": 384.32083, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "100", "bbox": {"l": 405.65189, "t": 206.37554999999998, "r": 418.16, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "92-97", "bbox": {"l": 428.12167, "t": 206.37554999999998, "r": 447.82983, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "100", "bbox": {"l": 465.00049, "t": 206.37554999999998, "r": 477.5086099999999, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "96-98", "bbox": {"l": 487.47028, "t": 206.37554999999998, "r": 507.17843999999997, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "Page-header", "bbox": {"l": 104.825, "t": 217.33452999999997, "r": 150.10532, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "58022", "bbox": {"l": 177.866, "t": 217.33452999999997, "r": 198.71288, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "5.10", "bbox": {"l": 219.211, "t": 217.33452999999997, "r": 233.69174000000004, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "6.70", "bbox": {"l": 250.01956, "t": 217.33452999999997, "r": 264.50031, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "5.06", "bbox": {"l": 280.82812, "t": 217.33452999999997, "r": 295.30887, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "85-89", "bbox": {"l": 305.27301, "t": 217.33452999999997, "r": 324.98117, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "66-76", "bbox": {"l": 334.94284, "t": 217.33452999999997, "r": 354.651, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "90-94", "bbox": {"l": 364.61267, "t": 217.33452999999997, "r": 384.32083, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "98-100", "bbox": {"l": 394.2825, "t": 217.33452999999997, "r": 418.16003, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "91-92", "bbox": {"l": 428.1217, "t": 217.33452999999997, "r": 447.82986, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "97-99", "bbox": {"l": 457.80051, "t": 217.33452999999997, "r": 477.50867, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "81-86", "bbox": {"l": 487.47034, "t": 217.33452999999997, "r": 507.17849999999993, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "Picture", "bbox": {"l": 104.825, "t": 228.29351999999994, "r": 130.80963, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "45976", "bbox": {"l": 177.866, "t": 228.29351999999994, "r": 198.71288, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "4.21", "bbox": {"l": 219.211, "t": 228.29351999999994, "r": 233.69174000000004, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "2.78", "bbox": {"l": 250.01956, "t": 228.29351999999994, "r": 264.50031, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "5.31", "bbox": {"l": 280.82812, "t": 228.29351999999994, "r": 295.30887, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "69-71", "bbox": {"l": 305.27301, "t": 228.29351999999994, "r": 324.98117, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "56-59", "bbox": {"l": 334.94284, "t": 228.29351999999994, "r": 354.651, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "82-86", "bbox": {"l": 364.61267, "t": 228.29351999999994, "r": 384.32083, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "69-82", "bbox": {"l": 398.45187, "t": 228.29351999999994, "r": 418.16003, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "80-95", "bbox": {"l": 428.1217, "t": 228.29351999999994, "r": 447.82986, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "66-71", "bbox": {"l": 457.80051, "t": 228.29351999999994, "r": 477.50867, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "59-76", "bbox": {"l": 487.47034, "t": 228.29351999999994, "r": 507.17849999999993, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "Section-header", "bbox": {"l": 104.825, "t": 239.25256000000002, "r": 159.56487, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "142884", "bbox": {"l": 173.69701, "t": 239.25256000000002, "r": 198.71326, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "12.60", "bbox": {"l": 215.04201, "t": 239.25256000000002, "r": 233.69212, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "15.77", "bbox": {"l": 245.85056, "t": 239.25256000000002, "r": 264.50067, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "12.85", "bbox": {"l": 276.65912, "t": 239.25256000000002, "r": 295.30923, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "83-84", "bbox": {"l": 305.27301, "t": 239.25256000000002, "r": 324.98117, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "76-81", "bbox": {"l": 334.94284, "t": 239.25256000000002, "r": 354.651, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "90-92", "bbox": {"l": 364.61267, "t": 239.25256000000002, "r": 384.32083, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "94-95", "bbox": {"l": 398.45187, "t": 239.25256000000002, "r": 418.16003, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "87-94", "bbox": {"l": 428.1217, "t": 239.25256000000002, "r": 447.82986, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "69-73", "bbox": {"l": 457.80051, "t": 239.25256000000002, "r": 477.50867, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "78-86", "bbox": {"l": 487.47034, "t": 239.25256000000002, "r": 507.17849999999993, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "Table", "bbox": {"l": 104.825, "t": 250.21155, "r": 124.63177, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "34733", "bbox": {"l": 177.866, "t": 250.21155, "r": 198.71288, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "3.20", "bbox": {"l": 219.211, "t": 250.21155, "r": 233.69174000000004, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "2.27", "bbox": {"l": 250.01956, "t": 250.21155, "r": 264.50031, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "3.60", "bbox": {"l": 280.82812, "t": 250.21155, "r": 295.30887, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "77-81", "bbox": {"l": 305.27301, "t": 250.21155, "r": 324.98117, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "75-80", "bbox": {"l": 334.94284, "t": 250.21155, "r": 354.651, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "83-86", "bbox": {"l": 364.61267, "t": 250.21155, "r": 384.32083, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "98-99", "bbox": {"l": 398.45187, "t": 250.21155, "r": 418.16003, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "58-80", "bbox": {"l": 428.1217, "t": 250.21155, "r": 447.82986, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "79-84", "bbox": {"l": 457.80051, "t": 250.21155, "r": 477.50867, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "70-85", "bbox": {"l": 487.47034, "t": 250.21155, "r": 507.17849999999993, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "Text", "bbox": {"l": 104.825, "t": 261.16956000000005, "r": 120.78519, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "510377", "bbox": {"l": 173.69701, "t": 261.16956000000005, "r": 198.71326, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "45.82", "bbox": {"l": 215.04201, "t": 261.16956000000005, "r": 233.69212, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "49.28", "bbox": {"l": 245.85056, "t": 261.16956000000005, "r": 264.50067, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "45.00", "bbox": {"l": 276.65912, "t": 261.16956000000005, "r": 295.30923, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "84-86", "bbox": {"l": 305.27301, "t": 261.16956000000005, "r": 324.98117, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "81-86", "bbox": {"l": 334.94284, "t": 261.16956000000005, "r": 354.651, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "88-93", "bbox": {"l": 364.61267, "t": 261.16956000000005, "r": 384.32083, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "89-93", "bbox": {"l": 398.45187, "t": 261.16956000000005, "r": 418.16003, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "87-92", "bbox": {"l": 428.1217, "t": 261.16956000000005, "r": 447.82986, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "71-79", "bbox": {"l": 457.80051, "t": 261.16956000000005, "r": 477.50867, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "87-95", "bbox": {"l": 487.47034, "t": 261.16956000000005, "r": 507.17849999999993, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "Title", "bbox": {"l": 104.825, "t": 272.12854000000004, "r": 121.81633, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "5071", "bbox": {"l": 182.035, "t": 272.12854000000004, "r": 198.71251, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "0.47", "bbox": {"l": 219.211, "t": 272.12854000000004, "r": 233.69174000000004, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "0.30", "bbox": {"l": 250.01956, "t": 272.12854000000004, "r": 264.50031, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "0.50", "bbox": {"l": 280.82812, "t": 272.12854000000004, "r": 295.30887, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "60-72", "bbox": {"l": 305.27301, "t": 272.12854000000004, "r": 324.98117, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "24-63", "bbox": {"l": 334.94284, "t": 272.12854000000004, "r": 354.651, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "50-63", "bbox": {"l": 364.61267, "t": 272.12854000000004, "r": 384.32083, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "94-100", "bbox": {"l": 394.2825, "t": 272.12854000000004, "r": 418.16003, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "82-96", "bbox": {"l": 428.1217, "t": 272.12854000000004, "r": 447.82986, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "68-79", "bbox": {"l": 457.80051, "t": 272.12854000000004, "r": 477.50867, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "24-56", "bbox": {"l": 487.47034, "t": 272.12854000000004, "r": 507.17849999999993, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "Total", "bbox": {"l": 104.825, "t": 283.48654, "r": 123.43028, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "1107470", "bbox": {"l": 169.52699, "t": 283.48654, "r": 198.71263, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "941123", "bbox": {"l": 208.675, "t": 283.48654, "r": 233.69124999999997, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "99816", "bbox": {"l": 243.65291999999997, "t": 283.48654, "r": 264.49982, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "66531", "bbox": {"l": 274.46149, "t": 283.48654, "r": 295.30838, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "82-83", "bbox": {"l": 305.27301, "t": 283.48654, "r": 324.98117, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "71-74", "bbox": {"l": 334.94284, "t": 283.48654, "r": 354.651, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "79-81", "bbox": {"l": 364.61267, "t": 283.48654, "r": 384.32083, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "89-94", "bbox": {"l": 398.45187, "t": 283.48654, "r": 418.16003, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "86-91", "bbox": {"l": 428.1217, "t": 283.48654, "r": 447.82986, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "71-76", "bbox": {"l": 457.80051, "t": 283.48654, "r": 477.50867, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "68-85", "bbox": {"l": 487.47034, "t": 283.48654, "r": 507.17849999999993, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "Figure 3: Corpus Conversion Service annotation user inter-", "bbox": {"l": 53.79800000000001, "t": 554.00999, "r": 295.64871, "b": 562.48325, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "face. The PDF page is shown in the background, with over-", "bbox": {"l": 53.79800000000001, "t": 564.96899, "r": 295.64874, "b": 573.44225, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "laid text-cells (in darker shades). The annotation boxes can", "bbox": {"l": 53.79800000000001, "t": 575.92799, "r": 294.04376, "b": 584.40125, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "be drawn by dragging a rectangle over each segment with", "bbox": {"l": 53.79800000000001, "t": 586.88699, "r": 294.04373, "b": 595.36024, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "the respective label from the palette on the right.", "bbox": {"l": 53.79800000000001, "t": 597.84599, "r": 252.78931000000003, "b": 606.31924, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "we distributed the annotation workload and performed continuous", "bbox": {"l": 53.466999, "t": 634.29155, "r": 294.04745, "b": 642.66617, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "quality controls. Phase one and two required a small team of experts", "bbox": {"l": 53.79800000000001, "t": 645.25055, "r": 294.04535, "b": 653.62517, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "only. For phases three and four, a group of 40 dedicated annotators", "bbox": {"l": 53.79800000000001, "t": 656.20955, "r": 294.04422, "b": 664.58417, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "were assembled and supervised.", "bbox": {"l": 53.466999, "t": 667.16856, "r": 170.58611, "b": 675.54317, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "Phase 1: Data selection and preparation.", "bbox": {"l": 63.76099800000001, "t": 678.01099, "r": 226.72533000000004, "b": 686.48424, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "Our inclusion cri-", "bbox": {"l": 229.06900000000002, "t": 678.12756, "r": 295.55844, "b": 686.50217, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "teria for documents were described in Section 3. A large effort went", "bbox": {"l": 53.79800000000001, "t": 689.08656, "r": 294.04538, "b": 697.461174, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "into ensuring that all documents are free to use. The data sources", "bbox": {"l": 53.79800000000001, "t": 700.045555, "r": 294.04642, "b": 708.420174, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "include publication repositories such as arXiv$^{3}$, government offices,", "bbox": {"l": 317.95499, "t": 312.07953, "r": 559.18536, "b": 320.45416000000006, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "company websites as well as data directory services for financial", "bbox": {"l": 317.95499, "t": 323.03754, "r": 558.19843, "b": 331.41217, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "reports and patents. Scanned documents were excluded wherever", "bbox": {"l": 317.95499, "t": 333.99655, "r": 558.36963, "b": 342.37119, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "possible because they can be rotated or skewed. This would not", "bbox": {"l": 317.95499, "t": 344.95554, "r": 558.2041, "b": 353.33017, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "allow us to perform annotation with rectangular bounding-boxes", "bbox": {"l": 317.95499, "t": 355.91455, "r": 558.20294, "b": 364.28918, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "and therefore complicate the annotation process.", "bbox": {"l": 317.95499, "t": 366.87354, "r": 496.71826, "b": 375.24817, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "Preparation work included uploading and parsing the sourced", "bbox": {"l": 327.918, "t": 377.8325500000001, "r": 558.20618, "b": 386.20717999999994, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "PDF documents in the Corpus Conversion Service (CCS) [22], a", "bbox": {"l": 317.95499, "t": 388.79153, "r": 558.2019, "b": 397.16617, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "cloud-native platform which provides a visual annotation interface", "bbox": {"l": 317.95499, "t": 399.75055, "r": 558.20233, "b": 408.12518, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": "and allows for dataset inspection and analysis. The annotation in-", "bbox": {"l": 317.95499, "t": 410.7095299999999, "r": 559.71277, "b": 419.08417, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "terface of CCS is shown in Figure 3. The desired balance of pages", "bbox": {"l": 317.95499, "t": 421.66855000000004, "r": 558.20062, "b": 430.04318, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "between the different document categories was achieved by se-", "bbox": {"l": 317.95499, "t": 432.62753, "r": 559.71307, "b": 441.00217, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": "lective subsampling of pages with certain desired properties. For", "bbox": {"l": 317.95499, "t": 443.58554, "r": 558.36877, "b": 451.96017, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "example, we made sure to include the title page of each document", "bbox": {"l": 317.95499, "t": 454.54453, "r": 558.20428, "b": 462.91916, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "and bias the remaining page selection to those with figures or", "bbox": {"l": 317.95499, "t": 465.50354, "r": 558.36877, "b": 473.87817, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "tables. The latter was achieved by leveraging pre-trained object", "bbox": {"l": 317.95499, "t": 476.46252, "r": 558.20428, "b": 484.83716, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": "detection models from PubLayNet, which helped us estimate how", "bbox": {"l": 317.95499, "t": 487.42154, "r": 558.5307, "b": 495.79617, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "many figures and tables a given page contains.", "bbox": {"l": 317.95499, "t": 498.38052, "r": 488.46914999999996, "b": 506.75516, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "Phase 2: Label selection and guideline.", "bbox": {"l": 327.918, "t": 509.22299, "r": 482.41809, "b": 517.69623, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "We reviewed the col-", "bbox": {"l": 484.474, "t": 509.33954, "r": 559.71765, "b": 517.71417, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "lected documents and identified the most common structural fea-", "bbox": {"l": 317.95499, "t": 520.29855, "r": 559.71619, "b": 528.67319, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "tures they exhibit. This was achieved by identifying recurrent layout", "bbox": {"l": 317.95499, "t": 531.2575400000001, "r": 558.20239, "b": 539.63217, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "elements and lead us to the definition of 11 distinct class labels.", "bbox": {"l": 317.95499, "t": 542.21655, "r": 559.58502, "b": 550.59117, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "These 11 class labels are", "bbox": {"l": 317.686, "t": 553.17456, "r": 404.14197, "b": 561.54918, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "Caption", "bbox": {"l": 406.26599, "t": 553.21939, "r": 433.84860000000003, "b": 561.5581500000001, "coord_origin": "TOPLEFT"}}, {"id": 201, "text": ",", "bbox": {"l": 433.84799, "t": 553.17456, "r": 435.78115999999994, "b": 561.54918, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": "Footnote", "bbox": {"l": 437.9079899999999, "t": 553.21939, "r": 467.23926, "b": 561.5581500000001, "coord_origin": "TOPLEFT"}}, {"id": 203, "text": ",", "bbox": {"l": 467.23999, "t": 553.17456, "r": 469.17316000000005, "b": 561.54918, "coord_origin": "TOPLEFT"}}, {"id": 204, "text": "Formula", "bbox": {"l": 471.29900999999995, "t": 553.21939, "r": 500.44574000000006, "b": 561.5581500000001, "coord_origin": "TOPLEFT"}}, {"id": 205, "text": ",", "bbox": {"l": 500.44601000000006, "t": 553.17456, "r": 502.37918, "b": 561.54918, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": "List-item", "bbox": {"l": 504.505, "t": 553.21939, "r": 535.74304, "b": 561.5581500000001, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": ",", "bbox": {"l": 535.74298, "t": 553.17456, "r": 537.67615, "b": 561.54918, "coord_origin": "TOPLEFT"}}, {"id": 208, "text": "Page-", "bbox": {"l": 539.802, "t": 553.21939, "r": 559.09839, "b": 561.5581500000001, "coord_origin": "TOPLEFT"}}, {"id": 209, "text": "footer", "bbox": {"l": 317.95499, "t": 564.17839, "r": 338.80725, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": ",", "bbox": {"l": 338.806, "t": 564.13356, "r": 340.81805, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "Page-header", "bbox": {"l": 343.61401, "t": 564.17839, "r": 387.96164, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 212, "text": ",", "bbox": {"l": 387.961, "t": 564.13356, "r": 389.97305, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "Picture", "bbox": {"l": 392.76901, "t": 564.17839, "r": 417.84662, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 214, "text": ",", "bbox": {"l": 417.84799, "t": 564.13356, "r": 419.86005, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 215, "text": "Section-header", "bbox": {"l": 422.655, "t": 564.17839, "r": 475.56305, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 216, "text": ",", "bbox": {"l": 475.56201, "t": 564.13356, "r": 477.57407, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 217, "text": "Table", "bbox": {"l": 480.36899, "t": 564.17839, "r": 499.82196, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 218, "text": ",", "bbox": {"l": 499.8219900000001, "t": 564.13356, "r": 501.83405, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 219, "text": "Text", "bbox": {"l": 504.6290000000001, "t": 564.17839, "r": 519.7926, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 220, "text": ", and", "bbox": {"l": 519.79602, "t": 564.13356, "r": 538.37103, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 221, "text": "Title", "bbox": {"l": 541.16302, "t": 564.17839, "r": 557.57043, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 222, "text": ".", "bbox": {"l": 557.57098, "t": 564.13356, "r": 559.58307, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 223, "text": "Critical factors that were considered for the choice of these class", "bbox": {"l": 317.95499, "t": 575.09256, "r": 558.20416, "b": 583.46718, "coord_origin": "TOPLEFT"}}, {"id": 224, "text": "labels were (1) the overall occurrence of the label, (2) the specificity", "bbox": {"l": 317.95499, "t": 586.05156, "r": 558.43091, "b": 594.4261799999999, "coord_origin": "TOPLEFT"}}, {"id": 225, "text": "of the label, (3) recognisability on a single page (i.e. no need for", "bbox": {"l": 317.95499, "t": 597.0105599999999, "r": 558.36871, "b": 605.38518, "coord_origin": "TOPLEFT"}}, {"id": 226, "text": "context from previous or next page) and (4) overall coverage of the", "bbox": {"l": 317.95499, "t": 607.96956, "r": 558.20105, "b": 616.3441799999999, "coord_origin": "TOPLEFT"}}, {"id": 227, "text": "page. Specificity ensures that the choice of label is not ambiguous,", "bbox": {"l": 317.95499, "t": 618.9285600000001, "r": 559.18665, "b": 627.30318, "coord_origin": "TOPLEFT"}}, {"id": 228, "text": "while coverage ensures that all meaningful items on a page can", "bbox": {"l": 317.62299, "t": 629.88756, "r": 558.20142, "b": 638.26218, "coord_origin": "TOPLEFT"}}, {"id": 229, "text": "be annotated. We refrained from class labels that are very specific", "bbox": {"l": 317.95499, "t": 640.84656, "r": 558.20227, "b": 649.22118, "coord_origin": "TOPLEFT"}}, {"id": 230, "text": "to a document category, such as", "bbox": {"l": 317.95499, "t": 651.80556, "r": 436.90649, "b": 660.1801800000001, "coord_origin": "TOPLEFT"}}, {"id": 231, "text": "Abstract", "bbox": {"l": 439.13800000000003, "t": 651.8503900000001, "r": 469.69134999999994, "b": 660.18915, "coord_origin": "TOPLEFT"}}, {"id": 232, "text": "in the", "bbox": {"l": 472.42898999999994, "t": 651.80556, "r": 493.97348, "b": 660.1801800000001, "coord_origin": "TOPLEFT"}}, {"id": 233, "text": "Scientific Articles", "bbox": {"l": 496.207, "t": 651.8503900000001, "r": 558.20001, "b": 660.18915, "coord_origin": "TOPLEFT"}}, {"id": 234, "text": "category. We also avoided class labels that are tightly linked to the", "bbox": {"l": 317.95499, "t": 662.76456, "r": 558.20557, "b": 671.13918, "coord_origin": "TOPLEFT"}}, {"id": 235, "text": "semantics of the text. Labels such as", "bbox": {"l": 317.95499, "t": 673.7225599999999, "r": 447.65221999999994, "b": 682.09718, "coord_origin": "TOPLEFT"}}, {"id": 236, "text": "Author", "bbox": {"l": 449.85999, "t": 673.76739, "r": 474.31439, "b": 682.10614, "coord_origin": "TOPLEFT"}}, {"id": 237, "text": "and", "bbox": {"l": 477.172, "t": 673.7225599999999, "r": 490.39655, "b": 682.09718, "coord_origin": "TOPLEFT"}}, {"id": 238, "text": "Affiliation", "bbox": {"l": 492.60599, "t": 673.76739, "r": 528.29907, "b": 682.10614, "coord_origin": "TOPLEFT"}}, {"id": 239, "text": ", as seen", "bbox": {"l": 528.29901, "t": 673.7225599999999, "r": 558.20148, "b": 682.09718, "coord_origin": "TOPLEFT"}}, {"id": 240, "text": "in DocBank, are often only distinguishable by discriminating on", "bbox": {"l": 317.95499, "t": 684.68156, "r": 558.2041, "b": 693.0561749999999, "coord_origin": "TOPLEFT"}}, {"id": 241, "text": "$^{3}$https://arxiv.org/", "bbox": {"l": 317.95499, "t": 702.353363, "r": 369.2457, "b": 708.86689, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 10, "label": "page_header", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.7625049948692322, "cells": [{"id": 0, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 246.24382, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar", "bbox": {"l": 253.13897999999998, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "caption", "bbox": {"l": 53.501999, "t": 84.95495999999991, "r": 558.48969, "b": 115.34618999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.8906616568565369, "cells": [{"id": 2, "text": "Table 1: DocLayNet dataset overview. Along with the frequency of each class label, we present the relative occurrence (as %", "bbox": {"l": 53.501999, "t": 84.95495999999991, "r": 558.48969, "b": 93.42822000000001, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "of row \u201cTotal\u201d) in the train, test and validation sets. The inter-annotator agreement is computed as the mAP@0.5-0.95 metric", "bbox": {"l": 53.79800000000001, "t": 95.91394000000003, "r": 558.20294, "b": 104.3872100000001, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "between pairwise annotations from the triple-annotated pages, from which we obtain accuracy ranges.", "bbox": {"l": 53.79800000000001, "t": 106.87292000000002, "r": 469.84805000000006, "b": 115.34618999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "table", "bbox": {"l": 98.93103790283203, "t": 137.47547912597656, "r": 512.579833984375, "b": 294.08148193359375, "coord_origin": "TOPLEFT"}, "confidence": 0.9860090613365173, "cells": [{"id": 5, "text": "% of Total", "bbox": {"l": 233.94400000000002, "t": 140.22351000000003, "r": 270.04272, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "triple inter-annotator mAP @ 0.5-0.95 (%)", "bbox": {"l": 329.04999, "t": 140.22351000000003, "r": 483.3976400000001, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "class label", "bbox": {"l": 104.825, "t": 151.18255999999997, "r": 141.71277, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Count", "bbox": {"l": 175.94701, "t": 151.18255999999997, "r": 198.71269, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Train", "bbox": {"l": 213.795, "t": 151.18255999999997, "r": 233.69144, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Test", "bbox": {"l": 249.37367, "t": 151.18255999999997, "r": 264.5, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Val", "bbox": {"l": 283.53568, "t": 151.18255999999997, "r": 295.30856, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "All", "bbox": {"l": 314.01501, "t": 151.18255999999997, "r": 324.98093, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Fin", "bbox": {"l": 343.01236, "t": 151.18255999999997, "r": 354.65076, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Man", "bbox": {"l": 367.84033, "t": 151.18255999999997, "r": 384.32059, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Sci", "bbox": {"l": 407.54358, "t": 151.18255999999997, "r": 418.15979, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Law", "bbox": {"l": 432.29979999999995, "t": 151.18255999999997, "r": 447.82962, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "Pat", "bbox": {"l": 465.72656, "t": 151.18255999999997, "r": 477.50842, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Ten", "bbox": {"l": 493.52240000000006, "t": 151.18255999999997, "r": 507.17822, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Caption", "bbox": {"l": 104.825, "t": 162.53954999999996, "r": 134.01064, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "22524", "bbox": {"l": 177.866, "t": 162.53954999999996, "r": 198.71288, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "2.04", "bbox": {"l": 219.211, "t": 162.53954999999996, "r": 233.69174000000004, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "1.77", "bbox": {"l": 250.01956, "t": 162.53954999999996, "r": 264.50031, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "2.32", "bbox": {"l": 280.82812, "t": 162.53954999999996, "r": 295.30887, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "84-89", "bbox": {"l": 305.27301, "t": 162.53954999999996, "r": 324.98117, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "40-61", "bbox": {"l": 334.94284, "t": 162.53954999999996, "r": 354.651, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "86-92", "bbox": {"l": 364.61267, "t": 162.53954999999996, "r": 384.32083, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "94-99", "bbox": {"l": 398.45187, "t": 162.53954999999996, "r": 418.16003, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "95-99", "bbox": {"l": 428.1217, "t": 162.53954999999996, "r": 447.82986, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "69-78", "bbox": {"l": 457.80051, "t": 162.53954999999996, "r": 477.50867, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "n/a", "bbox": {"l": 495.32489, "t": 162.53954999999996, "r": 507.17846999999995, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Footnote", "bbox": {"l": 104.825, "t": 173.49854000000005, "r": 137.3282, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "6318", "bbox": {"l": 182.035, "t": 173.49854000000005, "r": 198.71251, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "0.60", "bbox": {"l": 219.211, "t": 173.49854000000005, "r": 233.69174000000004, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "0.31", "bbox": {"l": 250.01956, "t": 173.49854000000005, "r": 264.50031, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "0.58", "bbox": {"l": 280.82812, "t": 173.49854000000005, "r": 295.30887, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "83-91", "bbox": {"l": 305.27301, "t": 173.49854000000005, "r": 324.98117, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "n/a", "bbox": {"l": 342.79739, "t": 173.49854000000005, "r": 354.65097, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "100", "bbox": {"l": 371.81265, "t": 173.49854000000005, "r": 384.32077, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "62-88", "bbox": {"l": 398.45181, "t": 173.49854000000005, "r": 418.15997, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "85-94", "bbox": {"l": 428.12164, "t": 173.49854000000005, "r": 447.8298, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "n/a", "bbox": {"l": 465.655, "t": 173.49854000000005, "r": 477.50857999999994, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "82-97", "bbox": {"l": 487.47025, "t": 173.49854000000005, "r": 507.17841, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Formula", "bbox": {"l": 104.825, "t": 184.45752000000005, "r": 135.33766, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "25027", "bbox": {"l": 177.866, "t": 184.45752000000005, "r": 198.71288, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "2.25", "bbox": {"l": 219.211, "t": 184.45752000000005, "r": 233.69174000000004, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "1.90", "bbox": {"l": 250.01956, "t": 184.45752000000005, "r": 264.50031, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "2.96", "bbox": {"l": 280.82812, "t": 184.45752000000005, "r": 295.30887, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "83-85", "bbox": {"l": 305.27301, "t": 184.45752000000005, "r": 324.98117, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "n/a", "bbox": {"l": 342.79739, "t": 184.45752000000005, "r": 354.65097, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "n/a", "bbox": {"l": 372.46719, "t": 184.45752000000005, "r": 384.32077, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "84-87", "bbox": {"l": 398.45181, "t": 184.45752000000005, "r": 418.15997, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "86-96", "bbox": {"l": 428.12164, "t": 184.45752000000005, "r": 447.8298, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "n/a", "bbox": {"l": 465.655, "t": 184.45752000000005, "r": 477.50857999999994, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "n/a", "bbox": {"l": 495.3248, "t": 184.45752000000005, "r": 507.17838000000006, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "List-item", "bbox": {"l": 104.825, "t": 195.41656, "r": 137.70479, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "185660", "bbox": {"l": 173.69701, "t": 195.41656, "r": 198.71326, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "17.19", "bbox": {"l": 215.04201, "t": 195.41656, "r": 233.69212, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "13.34", "bbox": {"l": 245.85056, "t": 195.41656, "r": 264.50067, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "15.82", "bbox": {"l": 276.65912, "t": 195.41656, "r": 295.30923, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "87-88", "bbox": {"l": 305.27301, "t": 195.41656, "r": 324.98117, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "74-83", "bbox": {"l": 334.94284, "t": 195.41656, "r": 354.651, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "90-92", "bbox": {"l": 364.61267, "t": 195.41656, "r": 384.32083, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "97-97", "bbox": {"l": 398.45187, "t": 195.41656, "r": 418.16003, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "81-85", "bbox": {"l": 428.1217, "t": 195.41656, "r": 447.82986, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "75-88", "bbox": {"l": 457.80051, "t": 195.41656, "r": 477.50867, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "93-95", "bbox": {"l": 487.47034, "t": 195.41656, "r": 507.17849999999993, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "Page-footer", "bbox": {"l": 104.825, "t": 206.37554999999998, "r": 147.35262, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "70878", "bbox": {"l": 177.866, "t": 206.37554999999998, "r": 198.71288, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "6.51", "bbox": {"l": 219.211, "t": 206.37554999999998, "r": 233.69174000000004, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "5.58", "bbox": {"l": 250.01956, "t": 206.37554999999998, "r": 264.50031, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "6.00", "bbox": {"l": 280.82812, "t": 206.37554999999998, "r": 295.30887, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "93-94", "bbox": {"l": 305.27301, "t": 206.37554999999998, "r": 324.98117, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "88-90", "bbox": {"l": 334.94284, "t": 206.37554999999998, "r": 354.651, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "95-96", "bbox": {"l": 364.61267, "t": 206.37554999999998, "r": 384.32083, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "100", "bbox": {"l": 405.65189, "t": 206.37554999999998, "r": 418.16, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "92-97", "bbox": {"l": 428.12167, "t": 206.37554999999998, "r": 447.82983, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "100", "bbox": {"l": 465.00049, "t": 206.37554999999998, "r": 477.5086099999999, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "96-98", "bbox": {"l": 487.47028, "t": 206.37554999999998, "r": 507.17843999999997, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "Page-header", "bbox": {"l": 104.825, "t": 217.33452999999997, "r": 150.10532, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "58022", "bbox": {"l": 177.866, "t": 217.33452999999997, "r": 198.71288, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "5.10", "bbox": {"l": 219.211, "t": 217.33452999999997, "r": 233.69174000000004, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "6.70", "bbox": {"l": 250.01956, "t": 217.33452999999997, "r": 264.50031, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "5.06", "bbox": {"l": 280.82812, "t": 217.33452999999997, "r": 295.30887, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "85-89", "bbox": {"l": 305.27301, "t": 217.33452999999997, "r": 324.98117, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "66-76", "bbox": {"l": 334.94284, "t": 217.33452999999997, "r": 354.651, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "90-94", "bbox": {"l": 364.61267, "t": 217.33452999999997, "r": 384.32083, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "98-100", "bbox": {"l": 394.2825, "t": 217.33452999999997, "r": 418.16003, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "91-92", "bbox": {"l": 428.1217, "t": 217.33452999999997, "r": 447.82986, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "97-99", "bbox": {"l": 457.80051, "t": 217.33452999999997, "r": 477.50867, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "81-86", "bbox": {"l": 487.47034, "t": 217.33452999999997, "r": 507.17849999999993, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "Picture", "bbox": {"l": 104.825, "t": 228.29351999999994, "r": 130.80963, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "45976", "bbox": {"l": 177.866, "t": 228.29351999999994, "r": 198.71288, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "4.21", "bbox": {"l": 219.211, "t": 228.29351999999994, "r": 233.69174000000004, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "2.78", "bbox": {"l": 250.01956, "t": 228.29351999999994, "r": 264.50031, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "5.31", "bbox": {"l": 280.82812, "t": 228.29351999999994, "r": 295.30887, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "69-71", "bbox": {"l": 305.27301, "t": 228.29351999999994, "r": 324.98117, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "56-59", "bbox": {"l": 334.94284, "t": 228.29351999999994, "r": 354.651, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "82-86", "bbox": {"l": 364.61267, "t": 228.29351999999994, "r": 384.32083, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "69-82", "bbox": {"l": 398.45187, "t": 228.29351999999994, "r": 418.16003, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "80-95", "bbox": {"l": 428.1217, "t": 228.29351999999994, "r": 447.82986, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "66-71", "bbox": {"l": 457.80051, "t": 228.29351999999994, "r": 477.50867, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "59-76", "bbox": {"l": 487.47034, "t": 228.29351999999994, "r": 507.17849999999993, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "Section-header", "bbox": {"l": 104.825, "t": 239.25256000000002, "r": 159.56487, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "142884", "bbox": {"l": 173.69701, "t": 239.25256000000002, "r": 198.71326, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "12.60", "bbox": {"l": 215.04201, "t": 239.25256000000002, "r": 233.69212, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "15.77", "bbox": {"l": 245.85056, "t": 239.25256000000002, "r": 264.50067, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "12.85", "bbox": {"l": 276.65912, "t": 239.25256000000002, "r": 295.30923, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "83-84", "bbox": {"l": 305.27301, "t": 239.25256000000002, "r": 324.98117, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "76-81", "bbox": {"l": 334.94284, "t": 239.25256000000002, "r": 354.651, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "90-92", "bbox": {"l": 364.61267, "t": 239.25256000000002, "r": 384.32083, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "94-95", "bbox": {"l": 398.45187, "t": 239.25256000000002, "r": 418.16003, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "87-94", "bbox": {"l": 428.1217, "t": 239.25256000000002, "r": 447.82986, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "69-73", "bbox": {"l": 457.80051, "t": 239.25256000000002, "r": 477.50867, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "78-86", "bbox": {"l": 487.47034, "t": 239.25256000000002, "r": 507.17849999999993, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "Table", "bbox": {"l": 104.825, "t": 250.21155, "r": 124.63177, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "34733", "bbox": {"l": 177.866, "t": 250.21155, "r": 198.71288, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "3.20", "bbox": {"l": 219.211, "t": 250.21155, "r": 233.69174000000004, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "2.27", "bbox": {"l": 250.01956, "t": 250.21155, "r": 264.50031, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "3.60", "bbox": {"l": 280.82812, "t": 250.21155, "r": 295.30887, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "77-81", "bbox": {"l": 305.27301, "t": 250.21155, "r": 324.98117, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "75-80", "bbox": {"l": 334.94284, "t": 250.21155, "r": 354.651, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "83-86", "bbox": {"l": 364.61267, "t": 250.21155, "r": 384.32083, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "98-99", "bbox": {"l": 398.45187, "t": 250.21155, "r": 418.16003, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "58-80", "bbox": {"l": 428.1217, "t": 250.21155, "r": 447.82986, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "79-84", "bbox": {"l": 457.80051, "t": 250.21155, "r": 477.50867, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "70-85", "bbox": {"l": 487.47034, "t": 250.21155, "r": 507.17849999999993, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "Text", "bbox": {"l": 104.825, "t": 261.16956000000005, "r": 120.78519, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "510377", "bbox": {"l": 173.69701, "t": 261.16956000000005, "r": 198.71326, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "45.82", "bbox": {"l": 215.04201, "t": 261.16956000000005, "r": 233.69212, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "49.28", "bbox": {"l": 245.85056, "t": 261.16956000000005, "r": 264.50067, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "45.00", "bbox": {"l": 276.65912, "t": 261.16956000000005, "r": 295.30923, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "84-86", "bbox": {"l": 305.27301, "t": 261.16956000000005, "r": 324.98117, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "81-86", "bbox": {"l": 334.94284, "t": 261.16956000000005, "r": 354.651, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "88-93", "bbox": {"l": 364.61267, "t": 261.16956000000005, "r": 384.32083, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "89-93", "bbox": {"l": 398.45187, "t": 261.16956000000005, "r": 418.16003, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "87-92", "bbox": {"l": 428.1217, "t": 261.16956000000005, "r": 447.82986, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "71-79", "bbox": {"l": 457.80051, "t": 261.16956000000005, "r": 477.50867, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "87-95", "bbox": {"l": 487.47034, "t": 261.16956000000005, "r": 507.17849999999993, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "Title", "bbox": {"l": 104.825, "t": 272.12854000000004, "r": 121.81633, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "5071", "bbox": {"l": 182.035, "t": 272.12854000000004, "r": 198.71251, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "0.47", "bbox": {"l": 219.211, "t": 272.12854000000004, "r": 233.69174000000004, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "0.30", "bbox": {"l": 250.01956, "t": 272.12854000000004, "r": 264.50031, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "0.50", "bbox": {"l": 280.82812, "t": 272.12854000000004, "r": 295.30887, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "60-72", "bbox": {"l": 305.27301, "t": 272.12854000000004, "r": 324.98117, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "24-63", "bbox": {"l": 334.94284, "t": 272.12854000000004, "r": 354.651, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "50-63", "bbox": {"l": 364.61267, "t": 272.12854000000004, "r": 384.32083, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "94-100", "bbox": {"l": 394.2825, "t": 272.12854000000004, "r": 418.16003, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "82-96", "bbox": {"l": 428.1217, "t": 272.12854000000004, "r": 447.82986, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "68-79", "bbox": {"l": 457.80051, "t": 272.12854000000004, "r": 477.50867, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "24-56", "bbox": {"l": 487.47034, "t": 272.12854000000004, "r": 507.17849999999993, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "Total", "bbox": {"l": 104.825, "t": 283.48654, "r": 123.43028, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "1107470", "bbox": {"l": 169.52699, "t": 283.48654, "r": 198.71263, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "941123", "bbox": {"l": 208.675, "t": 283.48654, "r": 233.69124999999997, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "99816", "bbox": {"l": 243.65291999999997, "t": 283.48654, "r": 264.49982, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "66531", "bbox": {"l": 274.46149, "t": 283.48654, "r": 295.30838, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "82-83", "bbox": {"l": 305.27301, "t": 283.48654, "r": 324.98117, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "71-74", "bbox": {"l": 334.94284, "t": 283.48654, "r": 354.651, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "79-81", "bbox": {"l": 364.61267, "t": 283.48654, "r": 384.32083, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "89-94", "bbox": {"l": 398.45187, "t": 283.48654, "r": 418.16003, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "86-91", "bbox": {"l": 428.1217, "t": 283.48654, "r": 447.82986, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "71-76", "bbox": {"l": 457.80051, "t": 283.48654, "r": 477.50867, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "68-85", "bbox": {"l": 487.47034, "t": 283.48654, "r": 507.17849999999993, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": [{"id": 11, "label": "text", "bbox": {"l": 233.94400000000002, "t": 140.22351000000003, "r": 270.04272, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 5, "text": "% of Total", "bbox": {"l": 233.94400000000002, "t": 140.22351000000003, "r": 270.04272, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 329.04999, "t": 140.22351000000003, "r": 483.3976400000001, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": "triple inter-annotator mAP @ 0.5-0.95 (%)", "bbox": {"l": 329.04999, "t": 140.22351000000003, "r": 483.3976400000001, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 104.825, "t": 151.18255999999997, "r": 141.71277, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "class label", "bbox": {"l": 104.825, "t": 151.18255999999997, "r": 141.71277, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 175.94701, "t": 151.18255999999997, "r": 198.71269, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "Count", "bbox": {"l": 175.94701, "t": 151.18255999999997, "r": 198.71269, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 213.795, "t": 151.18255999999997, "r": 233.69144, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "Train", "bbox": {"l": 213.795, "t": 151.18255999999997, "r": 233.69144, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 249.37367, "t": 151.18255999999997, "r": 264.5, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "Test", "bbox": {"l": 249.37367, "t": 151.18255999999997, "r": 264.5, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 283.53568, "t": 151.18255999999997, "r": 295.30856, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "Val", "bbox": {"l": 283.53568, "t": 151.18255999999997, "r": 295.30856, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 314.01501, "t": 151.18255999999997, "r": 324.98093, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "All", "bbox": {"l": 314.01501, "t": 151.18255999999997, "r": 324.98093, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 343.01236, "t": 151.18255999999997, "r": 354.65076, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "Fin", "bbox": {"l": 343.01236, "t": 151.18255999999997, "r": 354.65076, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 367.84033, "t": 151.18255999999997, "r": 384.32059, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "Man", "bbox": {"l": 367.84033, "t": 151.18255999999997, "r": 384.32059, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 407.54358, "t": 151.18255999999997, "r": 418.15979, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "Sci", "bbox": {"l": 407.54358, "t": 151.18255999999997, "r": 418.15979, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 432.29979999999995, "t": 151.18255999999997, "r": 447.82962, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "Law", "bbox": {"l": 432.29979999999995, "t": 151.18255999999997, "r": 447.82962, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 465.72656, "t": 151.18255999999997, "r": 477.50842, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "Pat", "bbox": {"l": 465.72656, "t": 151.18255999999997, "r": 477.50842, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 493.52240000000006, "t": 151.18255999999997, "r": 507.17822, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "Ten", "bbox": {"l": 493.52240000000006, "t": 151.18255999999997, "r": 507.17822, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 104.825, "t": 162.53954999999996, "r": 134.01064, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "Caption", "bbox": {"l": 104.825, "t": 162.53954999999996, "r": 134.01064, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 177.866, "t": 162.53954999999996, "r": 198.71288, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "22524", "bbox": {"l": 177.866, "t": 162.53954999999996, "r": 198.71288, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 219.211, "t": 162.53954999999996, "r": 233.69174000000004, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "2.04", "bbox": {"l": 219.211, "t": 162.53954999999996, "r": 233.69174000000004, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 250.01956, "t": 162.53954999999996, "r": 264.50031, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "1.77", "bbox": {"l": 250.01956, "t": 162.53954999999996, "r": 264.50031, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 280.82812, "t": 162.53954999999996, "r": 295.30887, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "2.32", "bbox": {"l": 280.82812, "t": 162.53954999999996, "r": 295.30887, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 305.27301, "t": 162.53954999999996, "r": 324.98117, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "84-89", "bbox": {"l": 305.27301, "t": 162.53954999999996, "r": 324.98117, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 334.94284, "t": 162.53954999999996, "r": 354.651, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "40-61", "bbox": {"l": 334.94284, "t": 162.53954999999996, "r": 354.651, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 364.61267, "t": 162.53954999999996, "r": 384.32083, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "86-92", "bbox": {"l": 364.61267, "t": 162.53954999999996, "r": 384.32083, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 398.45187, "t": 162.53954999999996, "r": 418.16003, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "94-99", "bbox": {"l": 398.45187, "t": 162.53954999999996, "r": 418.16003, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 428.1217, "t": 162.53954999999996, "r": 447.82986, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "95-99", "bbox": {"l": 428.1217, "t": 162.53954999999996, "r": 447.82986, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 457.80051, "t": 162.53954999999996, "r": 477.50867, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "69-78", "bbox": {"l": 457.80051, "t": 162.53954999999996, "r": 477.50867, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 495.32489, "t": 162.53954999999996, "r": 507.17846999999995, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "n/a", "bbox": {"l": 495.32489, "t": 162.53954999999996, "r": 507.17846999999995, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 104.825, "t": 173.49854000000005, "r": 137.3282, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "Footnote", "bbox": {"l": 104.825, "t": 173.49854000000005, "r": 137.3282, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 182.035, "t": 173.49854000000005, "r": 198.71251, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "6318", "bbox": {"l": 182.035, "t": 173.49854000000005, "r": 198.71251, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 219.211, "t": 173.49854000000005, "r": 233.69174000000004, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "0.60", "bbox": {"l": 219.211, "t": 173.49854000000005, "r": 233.69174000000004, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 250.01956, "t": 173.49854000000005, "r": 264.50031, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "0.31", "bbox": {"l": 250.01956, "t": 173.49854000000005, "r": 264.50031, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 280.82812, "t": 173.49854000000005, "r": 295.30887, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "0.58", "bbox": {"l": 280.82812, "t": 173.49854000000005, "r": 295.30887, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 305.27301, "t": 173.49854000000005, "r": 324.98117, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "83-91", "bbox": {"l": 305.27301, "t": 173.49854000000005, "r": 324.98117, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 342.79739, "t": 173.49854000000005, "r": 354.65097, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "n/a", "bbox": {"l": 342.79739, "t": 173.49854000000005, "r": 354.65097, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 371.81265, "t": 173.49854000000005, "r": 384.32077, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "100", "bbox": {"l": 371.81265, "t": 173.49854000000005, "r": 384.32077, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 398.45181, "t": 173.49854000000005, "r": 418.15997, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "62-88", "bbox": {"l": 398.45181, "t": 173.49854000000005, "r": 418.15997, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 428.12164, "t": 173.49854000000005, "r": 447.8298, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "85-94", "bbox": {"l": 428.12164, "t": 173.49854000000005, "r": 447.8298, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 465.655, "t": 173.49854000000005, "r": 477.50857999999994, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "n/a", "bbox": {"l": 465.655, "t": 173.49854000000005, "r": 477.50857999999994, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 487.47025, "t": 173.49854000000005, "r": 507.17841, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "82-97", "bbox": {"l": 487.47025, "t": 173.49854000000005, "r": 507.17841, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 104.825, "t": 184.45752000000005, "r": 135.33766, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "Formula", "bbox": {"l": 104.825, "t": 184.45752000000005, "r": 135.33766, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 177.866, "t": 184.45752000000005, "r": 198.71288, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "25027", "bbox": {"l": 177.866, "t": 184.45752000000005, "r": 198.71288, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 219.211, "t": 184.45752000000005, "r": 233.69174000000004, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "2.25", "bbox": {"l": 219.211, "t": 184.45752000000005, "r": 233.69174000000004, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 250.01956, "t": 184.45752000000005, "r": 264.50031, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "1.90", "bbox": {"l": 250.01956, "t": 184.45752000000005, "r": 264.50031, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 280.82812, "t": 184.45752000000005, "r": 295.30887, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "2.96", "bbox": {"l": 280.82812, "t": 184.45752000000005, "r": 295.30887, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 305.27301, "t": 184.45752000000005, "r": 324.98117, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "83-85", "bbox": {"l": 305.27301, "t": 184.45752000000005, "r": 324.98117, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 342.79739, "t": 184.45752000000005, "r": 354.65097, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "n/a", "bbox": {"l": 342.79739, "t": 184.45752000000005, "r": 354.65097, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 372.46719, "t": 184.45752000000005, "r": 384.32077, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "n/a", "bbox": {"l": 372.46719, "t": 184.45752000000005, "r": 384.32077, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 398.45181, "t": 184.45752000000005, "r": 418.15997, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "84-87", "bbox": {"l": 398.45181, "t": 184.45752000000005, "r": 418.15997, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 428.12164, "t": 184.45752000000005, "r": 447.8298, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "86-96", "bbox": {"l": 428.12164, "t": 184.45752000000005, "r": 447.8298, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 465.655, "t": 184.45752000000005, "r": 477.50857999999994, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "n/a", "bbox": {"l": 465.655, "t": 184.45752000000005, "r": 477.50857999999994, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 495.3248, "t": 184.45752000000005, "r": 507.17838000000006, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "n/a", "bbox": {"l": 495.3248, "t": 184.45752000000005, "r": 507.17838000000006, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 104.825, "t": 195.41656, "r": 137.70479, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "List-item", "bbox": {"l": 104.825, "t": 195.41656, "r": 137.70479, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 173.69701, "t": 195.41656, "r": 198.71326, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "185660", "bbox": {"l": 173.69701, "t": 195.41656, "r": 198.71326, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 215.04201, "t": 195.41656, "r": 233.69212, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "17.19", "bbox": {"l": 215.04201, "t": 195.41656, "r": 233.69212, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 245.85056, "t": 195.41656, "r": 264.50067, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "13.34", "bbox": {"l": 245.85056, "t": 195.41656, "r": 264.50067, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 276.65912, "t": 195.41656, "r": 295.30923, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "15.82", "bbox": {"l": 276.65912, "t": 195.41656, "r": 295.30923, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 305.27301, "t": 195.41656, "r": 324.98117, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "87-88", "bbox": {"l": 305.27301, "t": 195.41656, "r": 324.98117, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 334.94284, "t": 195.41656, "r": 354.651, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "74-83", "bbox": {"l": 334.94284, "t": 195.41656, "r": 354.651, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 364.61267, "t": 195.41656, "r": 384.32083, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "90-92", "bbox": {"l": 364.61267, "t": 195.41656, "r": 384.32083, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 398.45187, "t": 195.41656, "r": 418.16003, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "97-97", "bbox": {"l": 398.45187, "t": 195.41656, "r": 418.16003, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 428.1217, "t": 195.41656, "r": 447.82986, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "81-85", "bbox": {"l": 428.1217, "t": 195.41656, "r": 447.82986, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 457.80051, "t": 195.41656, "r": 477.50867, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "75-88", "bbox": {"l": 457.80051, "t": 195.41656, "r": 477.50867, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 487.47034, "t": 195.41656, "r": 507.17849999999993, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "93-95", "bbox": {"l": 487.47034, "t": 195.41656, "r": 507.17849999999993, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 104.825, "t": 206.37554999999998, "r": 147.35262, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "Page-footer", "bbox": {"l": 104.825, "t": 206.37554999999998, "r": 147.35262, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 177.866, "t": 206.37554999999998, "r": 198.71288, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "70878", "bbox": {"l": 177.866, "t": 206.37554999999998, "r": 198.71288, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 219.211, "t": 206.37554999999998, "r": 233.69174000000004, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "6.51", "bbox": {"l": 219.211, "t": 206.37554999999998, "r": 233.69174000000004, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 250.01956, "t": 206.37554999999998, "r": 264.50031, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "5.58", "bbox": {"l": 250.01956, "t": 206.37554999999998, "r": 264.50031, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 280.82812, "t": 206.37554999999998, "r": 295.30887, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "6.00", "bbox": {"l": 280.82812, "t": 206.37554999999998, "r": 295.30887, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 305.27301, "t": 206.37554999999998, "r": 324.98117, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "93-94", "bbox": {"l": 305.27301, "t": 206.37554999999998, "r": 324.98117, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 334.94284, "t": 206.37554999999998, "r": 354.651, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "88-90", "bbox": {"l": 334.94284, "t": 206.37554999999998, "r": 354.651, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 364.61267, "t": 206.37554999999998, "r": 384.32083, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "95-96", "bbox": {"l": 364.61267, "t": 206.37554999999998, "r": 384.32083, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 405.65189, "t": 206.37554999999998, "r": 418.16, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "100", "bbox": {"l": 405.65189, "t": 206.37554999999998, "r": 418.16, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 428.12167, "t": 206.37554999999998, "r": 447.82983, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "92-97", "bbox": {"l": 428.12167, "t": 206.37554999999998, "r": 447.82983, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 465.00049, "t": 206.37554999999998, "r": 477.5086099999999, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "100", "bbox": {"l": 465.00049, "t": 206.37554999999998, "r": 477.5086099999999, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 487.47028, "t": 206.37554999999998, "r": 507.17843999999997, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "96-98", "bbox": {"l": 487.47028, "t": 206.37554999999998, "r": 507.17843999999997, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 104.825, "t": 217.33452999999997, "r": 150.10532, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "Page-header", "bbox": {"l": 104.825, "t": 217.33452999999997, "r": 150.10532, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 177.866, "t": 217.33452999999997, "r": 198.71288, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "58022", "bbox": {"l": 177.866, "t": 217.33452999999997, "r": 198.71288, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 219.211, "t": 217.33452999999997, "r": 233.69174000000004, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "5.10", "bbox": {"l": 219.211, "t": 217.33452999999997, "r": 233.69174000000004, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 250.01956, "t": 217.33452999999997, "r": 264.50031, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "6.70", "bbox": {"l": 250.01956, "t": 217.33452999999997, "r": 264.50031, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 280.82812, "t": 217.33452999999997, "r": 295.30887, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "5.06", "bbox": {"l": 280.82812, "t": 217.33452999999997, "r": 295.30887, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 305.27301, "t": 217.33452999999997, "r": 324.98117, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "85-89", "bbox": {"l": 305.27301, "t": 217.33452999999997, "r": 324.98117, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 334.94284, "t": 217.33452999999997, "r": 354.651, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "66-76", "bbox": {"l": 334.94284, "t": 217.33452999999997, "r": 354.651, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 364.61267, "t": 217.33452999999997, "r": 384.32083, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "90-94", "bbox": {"l": 364.61267, "t": 217.33452999999997, "r": 384.32083, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 394.2825, "t": 217.33452999999997, "r": 418.16003, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "98-100", "bbox": {"l": 394.2825, "t": 217.33452999999997, "r": 418.16003, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 428.1217, "t": 217.33452999999997, "r": 447.82986, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "91-92", "bbox": {"l": 428.1217, "t": 217.33452999999997, "r": 447.82986, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 457.80051, "t": 217.33452999999997, "r": 477.50867, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "97-99", "bbox": {"l": 457.80051, "t": 217.33452999999997, "r": 477.50867, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 487.47034, "t": 217.33452999999997, "r": 507.17849999999993, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "81-86", "bbox": {"l": 487.47034, "t": 217.33452999999997, "r": 507.17849999999993, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 104.825, "t": 228.29351999999994, "r": 130.80963, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "Picture", "bbox": {"l": 104.825, "t": 228.29351999999994, "r": 130.80963, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 177.866, "t": 228.29351999999994, "r": 198.71288, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "45976", "bbox": {"l": 177.866, "t": 228.29351999999994, "r": 198.71288, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 219.211, "t": 228.29351999999994, "r": 233.69174000000004, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "4.21", "bbox": {"l": 219.211, "t": 228.29351999999994, "r": 233.69174000000004, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 250.01956, "t": 228.29351999999994, "r": 264.50031, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "2.78", "bbox": {"l": 250.01956, "t": 228.29351999999994, "r": 264.50031, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 280.82812, "t": 228.29351999999994, "r": 295.30887, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "5.31", "bbox": {"l": 280.82812, "t": 228.29351999999994, "r": 295.30887, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 305.27301, "t": 228.29351999999994, "r": 324.98117, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "69-71", "bbox": {"l": 305.27301, "t": 228.29351999999994, "r": 324.98117, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 334.94284, "t": 228.29351999999994, "r": 354.651, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "56-59", "bbox": {"l": 334.94284, "t": 228.29351999999994, "r": 354.651, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 364.61267, "t": 228.29351999999994, "r": 384.32083, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "82-86", "bbox": {"l": 364.61267, "t": 228.29351999999994, "r": 384.32083, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 398.45187, "t": 228.29351999999994, "r": 418.16003, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "69-82", "bbox": {"l": 398.45187, "t": 228.29351999999994, "r": 418.16003, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 428.1217, "t": 228.29351999999994, "r": 447.82986, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "80-95", "bbox": {"l": 428.1217, "t": 228.29351999999994, "r": 447.82986, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 457.80051, "t": 228.29351999999994, "r": 477.50867, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "66-71", "bbox": {"l": 457.80051, "t": 228.29351999999994, "r": 477.50867, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 487.47034, "t": 228.29351999999994, "r": 507.17849999999993, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "59-76", "bbox": {"l": 487.47034, "t": 228.29351999999994, "r": 507.17849999999993, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 104.825, "t": 239.25256000000002, "r": 159.56487, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": "Section-header", "bbox": {"l": 104.825, "t": 239.25256000000002, "r": 159.56487, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 173.69701, "t": 239.25256000000002, "r": 198.71326, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "142884", "bbox": {"l": 173.69701, "t": 239.25256000000002, "r": 198.71326, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 215.04201, "t": 239.25256000000002, "r": 233.69212, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "12.60", "bbox": {"l": 215.04201, "t": 239.25256000000002, "r": 233.69212, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 245.85056, "t": 239.25256000000002, "r": 264.50067, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": "15.77", "bbox": {"l": 245.85056, "t": 239.25256000000002, "r": 264.50067, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 276.65912, "t": 239.25256000000002, "r": 295.30923, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 107, "text": "12.85", "bbox": {"l": 276.65912, "t": 239.25256000000002, "r": 295.30923, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 114, "label": "text", "bbox": {"l": 305.27301, "t": 239.25256000000002, "r": 324.98117, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 108, "text": "83-84", "bbox": {"l": 305.27301, "t": 239.25256000000002, "r": 324.98117, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 115, "label": "text", "bbox": {"l": 334.94284, "t": 239.25256000000002, "r": 354.651, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 109, "text": "76-81", "bbox": {"l": 334.94284, "t": 239.25256000000002, "r": 354.651, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 116, "label": "text", "bbox": {"l": 364.61267, "t": 239.25256000000002, "r": 384.32083, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 110, "text": "90-92", "bbox": {"l": 364.61267, "t": 239.25256000000002, "r": 384.32083, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 117, "label": "text", "bbox": {"l": 398.45187, "t": 239.25256000000002, "r": 418.16003, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 111, "text": "94-95", "bbox": {"l": 398.45187, "t": 239.25256000000002, "r": 418.16003, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 118, "label": "text", "bbox": {"l": 428.1217, "t": 239.25256000000002, "r": 447.82986, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 112, "text": "87-94", "bbox": {"l": 428.1217, "t": 239.25256000000002, "r": 447.82986, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 119, "label": "text", "bbox": {"l": 457.80051, "t": 239.25256000000002, "r": 477.50867, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 113, "text": "69-73", "bbox": {"l": 457.80051, "t": 239.25256000000002, "r": 477.50867, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 120, "label": "text", "bbox": {"l": 487.47034, "t": 239.25256000000002, "r": 507.17849999999993, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 114, "text": "78-86", "bbox": {"l": 487.47034, "t": 239.25256000000002, "r": 507.17849999999993, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 121, "label": "text", "bbox": {"l": 104.825, "t": 250.21155, "r": 124.63177, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 115, "text": "Table", "bbox": {"l": 104.825, "t": 250.21155, "r": 124.63177, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 122, "label": "text", "bbox": {"l": 177.866, "t": 250.21155, "r": 198.71288, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 116, "text": "34733", "bbox": {"l": 177.866, "t": 250.21155, "r": 198.71288, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 123, "label": "text", "bbox": {"l": 219.211, "t": 250.21155, "r": 233.69174000000004, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 117, "text": "3.20", "bbox": {"l": 219.211, "t": 250.21155, "r": 233.69174000000004, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 124, "label": "text", "bbox": {"l": 250.01956, "t": 250.21155, "r": 264.50031, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 118, "text": "2.27", "bbox": {"l": 250.01956, "t": 250.21155, "r": 264.50031, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 125, "label": "text", "bbox": {"l": 280.82812, "t": 250.21155, "r": 295.30887, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 119, "text": "3.60", "bbox": {"l": 280.82812, "t": 250.21155, "r": 295.30887, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 126, "label": "text", "bbox": {"l": 305.27301, "t": 250.21155, "r": 324.98117, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 120, "text": "77-81", "bbox": {"l": 305.27301, "t": 250.21155, "r": 324.98117, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 127, "label": "text", "bbox": {"l": 334.94284, "t": 250.21155, "r": 354.651, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 121, "text": "75-80", "bbox": {"l": 334.94284, "t": 250.21155, "r": 354.651, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 128, "label": "text", "bbox": {"l": 364.61267, "t": 250.21155, "r": 384.32083, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 122, "text": "83-86", "bbox": {"l": 364.61267, "t": 250.21155, "r": 384.32083, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 129, "label": "text", "bbox": {"l": 398.45187, "t": 250.21155, "r": 418.16003, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 123, "text": "98-99", "bbox": {"l": 398.45187, "t": 250.21155, "r": 418.16003, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 130, "label": "text", "bbox": {"l": 428.1217, "t": 250.21155, "r": 447.82986, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 124, "text": "58-80", "bbox": {"l": 428.1217, "t": 250.21155, "r": 447.82986, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 131, "label": "text", "bbox": {"l": 457.80051, "t": 250.21155, "r": 477.50867, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 125, "text": "79-84", "bbox": {"l": 457.80051, "t": 250.21155, "r": 477.50867, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 132, "label": "text", "bbox": {"l": 487.47034, "t": 250.21155, "r": 507.17849999999993, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 126, "text": "70-85", "bbox": {"l": 487.47034, "t": 250.21155, "r": 507.17849999999993, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 133, "label": "text", "bbox": {"l": 104.825, "t": 261.16956000000005, "r": 120.78519, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 127, "text": "Text", "bbox": {"l": 104.825, "t": 261.16956000000005, "r": 120.78519, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 134, "label": "text", "bbox": {"l": 173.69701, "t": 261.16956000000005, "r": 198.71326, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 128, "text": "510377", "bbox": {"l": 173.69701, "t": 261.16956000000005, "r": 198.71326, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 135, "label": "text", "bbox": {"l": 215.04201, "t": 261.16956000000005, "r": 233.69212, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 129, "text": "45.82", "bbox": {"l": 215.04201, "t": 261.16956000000005, "r": 233.69212, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 136, "label": "text", "bbox": {"l": 245.85056, "t": 261.16956000000005, "r": 264.50067, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 130, "text": "49.28", "bbox": {"l": 245.85056, "t": 261.16956000000005, "r": 264.50067, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 137, "label": "text", "bbox": {"l": 276.65912, "t": 261.16956000000005, "r": 295.30923, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 131, "text": "45.00", "bbox": {"l": 276.65912, "t": 261.16956000000005, "r": 295.30923, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 138, "label": "text", "bbox": {"l": 305.27301, "t": 261.16956000000005, "r": 324.98117, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 132, "text": "84-86", "bbox": {"l": 305.27301, "t": 261.16956000000005, "r": 324.98117, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 139, "label": "text", "bbox": {"l": 334.94284, "t": 261.16956000000005, "r": 354.651, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 133, "text": "81-86", "bbox": {"l": 334.94284, "t": 261.16956000000005, "r": 354.651, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 140, "label": "text", "bbox": {"l": 364.61267, "t": 261.16956000000005, "r": 384.32083, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 134, "text": "88-93", "bbox": {"l": 364.61267, "t": 261.16956000000005, "r": 384.32083, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 141, "label": "text", "bbox": {"l": 398.45187, "t": 261.16956000000005, "r": 418.16003, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 135, "text": "89-93", "bbox": {"l": 398.45187, "t": 261.16956000000005, "r": 418.16003, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 142, "label": "text", "bbox": {"l": 428.1217, "t": 261.16956000000005, "r": 447.82986, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 136, "text": "87-92", "bbox": {"l": 428.1217, "t": 261.16956000000005, "r": 447.82986, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 143, "label": "text", "bbox": {"l": 457.80051, "t": 261.16956000000005, "r": 477.50867, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 137, "text": "71-79", "bbox": {"l": 457.80051, "t": 261.16956000000005, "r": 477.50867, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 144, "label": "text", "bbox": {"l": 487.47034, "t": 261.16956000000005, "r": 507.17849999999993, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 138, "text": "87-95", "bbox": {"l": 487.47034, "t": 261.16956000000005, "r": 507.17849999999993, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 145, "label": "text", "bbox": {"l": 104.825, "t": 272.12854000000004, "r": 121.81633, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 139, "text": "Title", "bbox": {"l": 104.825, "t": 272.12854000000004, "r": 121.81633, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 146, "label": "text", "bbox": {"l": 182.035, "t": 272.12854000000004, "r": 198.71251, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 140, "text": "5071", "bbox": {"l": 182.035, "t": 272.12854000000004, "r": 198.71251, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 147, "label": "text", "bbox": {"l": 219.211, "t": 272.12854000000004, "r": 233.69174000000004, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 141, "text": "0.47", "bbox": {"l": 219.211, "t": 272.12854000000004, "r": 233.69174000000004, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 148, "label": "text", "bbox": {"l": 250.01956, "t": 272.12854000000004, "r": 264.50031, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 142, "text": "0.30", "bbox": {"l": 250.01956, "t": 272.12854000000004, "r": 264.50031, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 149, "label": "text", "bbox": {"l": 280.82812, "t": 272.12854000000004, "r": 295.30887, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 143, "text": "0.50", "bbox": {"l": 280.82812, "t": 272.12854000000004, "r": 295.30887, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 150, "label": "text", "bbox": {"l": 305.27301, "t": 272.12854000000004, "r": 324.98117, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 144, "text": "60-72", "bbox": {"l": 305.27301, "t": 272.12854000000004, "r": 324.98117, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 151, "label": "text", "bbox": {"l": 334.94284, "t": 272.12854000000004, "r": 354.651, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 145, "text": "24-63", "bbox": {"l": 334.94284, "t": 272.12854000000004, "r": 354.651, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 152, "label": "text", "bbox": {"l": 364.61267, "t": 272.12854000000004, "r": 384.32083, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 146, "text": "50-63", "bbox": {"l": 364.61267, "t": 272.12854000000004, "r": 384.32083, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 153, "label": "text", "bbox": {"l": 394.2825, "t": 272.12854000000004, "r": 418.16003, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 147, "text": "94-100", "bbox": {"l": 394.2825, "t": 272.12854000000004, "r": 418.16003, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 154, "label": "text", "bbox": {"l": 428.1217, "t": 272.12854000000004, "r": 447.82986, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 148, "text": "82-96", "bbox": {"l": 428.1217, "t": 272.12854000000004, "r": 447.82986, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 155, "label": "text", "bbox": {"l": 457.80051, "t": 272.12854000000004, "r": 477.50867, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 149, "text": "68-79", "bbox": {"l": 457.80051, "t": 272.12854000000004, "r": 477.50867, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 156, "label": "text", "bbox": {"l": 487.47034, "t": 272.12854000000004, "r": 507.17849999999993, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 150, "text": "24-56", "bbox": {"l": 487.47034, "t": 272.12854000000004, "r": 507.17849999999993, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 157, "label": "text", "bbox": {"l": 104.825, "t": 283.48654, "r": 123.43028, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 151, "text": "Total", "bbox": {"l": 104.825, "t": 283.48654, "r": 123.43028, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 158, "label": "text", "bbox": {"l": 169.52699, "t": 283.48654, "r": 198.71263, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 152, "text": "1107470", "bbox": {"l": 169.52699, "t": 283.48654, "r": 198.71263, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 159, "label": "text", "bbox": {"l": 208.675, "t": 283.48654, "r": 233.69124999999997, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 153, "text": "941123", "bbox": {"l": 208.675, "t": 283.48654, "r": 233.69124999999997, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 160, "label": "text", "bbox": {"l": 243.65291999999997, "t": 283.48654, "r": 264.49982, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 154, "text": "99816", "bbox": {"l": 243.65291999999997, "t": 283.48654, "r": 264.49982, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 161, "label": "text", "bbox": {"l": 274.46149, "t": 283.48654, "r": 295.30838, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 155, "text": "66531", "bbox": {"l": 274.46149, "t": 283.48654, "r": 295.30838, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 162, "label": "text", "bbox": {"l": 305.27301, "t": 283.48654, "r": 324.98117, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 156, "text": "82-83", "bbox": {"l": 305.27301, "t": 283.48654, "r": 324.98117, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 163, "label": "text", "bbox": {"l": 334.94284, "t": 283.48654, "r": 354.651, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 157, "text": "71-74", "bbox": {"l": 334.94284, "t": 283.48654, "r": 354.651, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 164, "label": "text", "bbox": {"l": 364.61267, "t": 283.48654, "r": 384.32083, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 158, "text": "79-81", "bbox": {"l": 364.61267, "t": 283.48654, "r": 384.32083, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 165, "label": "text", "bbox": {"l": 398.45187, "t": 283.48654, "r": 418.16003, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 159, "text": "89-94", "bbox": {"l": 398.45187, "t": 283.48654, "r": 418.16003, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 166, "label": "text", "bbox": {"l": 428.1217, "t": 283.48654, "r": 447.82986, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 160, "text": "86-91", "bbox": {"l": 428.1217, "t": 283.48654, "r": 447.82986, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 167, "label": "text", "bbox": {"l": 457.80051, "t": 283.48654, "r": 477.50867, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 161, "text": "71-76", "bbox": {"l": 457.80051, "t": 283.48654, "r": 477.50867, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 168, "label": "text", "bbox": {"l": 487.47034, "t": 283.48654, "r": 507.17849999999993, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 162, "text": "68-85", "bbox": {"l": 487.47034, "t": 283.48654, "r": 507.17849999999993, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 9, "label": "caption", "bbox": {"l": 53.79800000000001, "t": 554.00999, "r": 295.64874, "b": 606.31924, "coord_origin": "TOPLEFT"}, "confidence": 0.810490071773529, "cells": [{"id": 163, "text": "Figure 3: Corpus Conversion Service annotation user inter-", "bbox": {"l": 53.79800000000001, "t": 554.00999, "r": 295.64871, "b": 562.48325, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "face. The PDF page is shown in the background, with over-", "bbox": {"l": 53.79800000000001, "t": 564.96899, "r": 295.64874, "b": 573.44225, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "laid text-cells (in darker shades). The annotation boxes can", "bbox": {"l": 53.79800000000001, "t": 575.92799, "r": 294.04376, "b": 584.40125, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "be drawn by dragging a rectangle over each segment with", "bbox": {"l": 53.79800000000001, "t": 586.88699, "r": 294.04373, "b": 595.36024, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "the respective label from the palette on the right.", "bbox": {"l": 53.79800000000001, "t": 597.84599, "r": 252.78931000000003, "b": 606.31924, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "text", "bbox": {"l": 53.466999, "t": 634.29155, "r": 294.04745, "b": 675.54317, "coord_origin": "TOPLEFT"}, "confidence": 0.980393648147583, "cells": [{"id": 168, "text": "we distributed the annotation workload and performed continuous", "bbox": {"l": 53.466999, "t": 634.29155, "r": 294.04745, "b": 642.66617, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "quality controls. Phase one and two required a small team of experts", "bbox": {"l": 53.79800000000001, "t": 645.25055, "r": 294.04535, "b": 653.62517, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "only. For phases three and four, a group of 40 dedicated annotators", "bbox": {"l": 53.79800000000001, "t": 656.20955, "r": 294.04422, "b": 664.58417, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "were assembled and supervised.", "bbox": {"l": 53.466999, "t": 667.16856, "r": 170.58611, "b": 675.54317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "text", "bbox": {"l": 53.79800000000001, "t": 678.01099, "r": 295.55844, "b": 708.420174, "coord_origin": "TOPLEFT"}, "confidence": 0.9748398661613464, "cells": [{"id": 172, "text": "Phase 1: Data selection and preparation.", "bbox": {"l": 63.76099800000001, "t": 678.01099, "r": 226.72533000000004, "b": 686.48424, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "Our inclusion cri-", "bbox": {"l": 229.06900000000002, "t": 678.12756, "r": 295.55844, "b": 686.50217, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "teria for documents were described in Section 3. A large effort went", "bbox": {"l": 53.79800000000001, "t": 689.08656, "r": 294.04538, "b": 697.461174, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "into ensuring that all documents are free to use. The data sources", "bbox": {"l": 53.79800000000001, "t": 700.045555, "r": 294.04642, "b": 708.420174, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "text", "bbox": {"l": 317.95499, "t": 312.07953, "r": 559.18536, "b": 375.24817, "coord_origin": "TOPLEFT"}, "confidence": 0.9818483591079712, "cells": [{"id": 176, "text": "include publication repositories such as arXiv$^{3}$, government offices,", "bbox": {"l": 317.95499, "t": 312.07953, "r": 559.18536, "b": 320.45416000000006, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "company websites as well as data directory services for financial", "bbox": {"l": 317.95499, "t": 323.03754, "r": 558.19843, "b": 331.41217, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "reports and patents. Scanned documents were excluded wherever", "bbox": {"l": 317.95499, "t": 333.99655, "r": 558.36963, "b": 342.37119, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "possible because they can be rotated or skewed. This would not", "bbox": {"l": 317.95499, "t": 344.95554, "r": 558.2041, "b": 353.33017, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "allow us to perform annotation with rectangular bounding-boxes", "bbox": {"l": 317.95499, "t": 355.91455, "r": 558.20294, "b": 364.28918, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "and therefore complicate the annotation process.", "bbox": {"l": 317.95499, "t": 366.87354, "r": 496.71826, "b": 375.24817, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 317.95499, "t": 377.8325500000001, "r": 559.71307, "b": 506.75516, "coord_origin": "TOPLEFT"}, "confidence": 0.9866719841957092, "cells": [{"id": 182, "text": "Preparation work included uploading and parsing the sourced", "bbox": {"l": 327.918, "t": 377.8325500000001, "r": 558.20618, "b": 386.20717999999994, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "PDF documents in the Corpus Conversion Service (CCS) [22], a", "bbox": {"l": 317.95499, "t": 388.79153, "r": 558.2019, "b": 397.16617, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "cloud-native platform which provides a visual annotation interface", "bbox": {"l": 317.95499, "t": 399.75055, "r": 558.20233, "b": 408.12518, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": "and allows for dataset inspection and analysis. The annotation in-", "bbox": {"l": 317.95499, "t": 410.7095299999999, "r": 559.71277, "b": 419.08417, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "terface of CCS is shown in Figure 3. The desired balance of pages", "bbox": {"l": 317.95499, "t": 421.66855000000004, "r": 558.20062, "b": 430.04318, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "between the different document categories was achieved by se-", "bbox": {"l": 317.95499, "t": 432.62753, "r": 559.71307, "b": 441.00217, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": "lective subsampling of pages with certain desired properties. For", "bbox": {"l": 317.95499, "t": 443.58554, "r": 558.36877, "b": 451.96017, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "example, we made sure to include the title page of each document", "bbox": {"l": 317.95499, "t": 454.54453, "r": 558.20428, "b": 462.91916, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "and bias the remaining page selection to those with figures or", "bbox": {"l": 317.95499, "t": 465.50354, "r": 558.36877, "b": 473.87817, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "tables. The latter was achieved by leveraging pre-trained object", "bbox": {"l": 317.95499, "t": 476.46252, "r": 558.20428, "b": 484.83716, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": "detection models from PubLayNet, which helped us estimate how", "bbox": {"l": 317.95499, "t": 487.42154, "r": 558.5307, "b": 495.79617, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "many figures and tables a given page contains.", "bbox": {"l": 317.95499, "t": 498.38052, "r": 488.46914999999996, "b": 506.75516, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 317.62299, "t": 509.22299, "r": 559.71765, "b": 693.0561749999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9847556948661804, "cells": [{"id": 194, "text": "Phase 2: Label selection and guideline.", "bbox": {"l": 327.918, "t": 509.22299, "r": 482.41809, "b": 517.69623, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "We reviewed the col-", "bbox": {"l": 484.474, "t": 509.33954, "r": 559.71765, "b": 517.71417, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "lected documents and identified the most common structural fea-", "bbox": {"l": 317.95499, "t": 520.29855, "r": 559.71619, "b": 528.67319, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "tures they exhibit. This was achieved by identifying recurrent layout", "bbox": {"l": 317.95499, "t": 531.2575400000001, "r": 558.20239, "b": 539.63217, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "elements and lead us to the definition of 11 distinct class labels.", "bbox": {"l": 317.95499, "t": 542.21655, "r": 559.58502, "b": 550.59117, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "These 11 class labels are", "bbox": {"l": 317.686, "t": 553.17456, "r": 404.14197, "b": 561.54918, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "Caption", "bbox": {"l": 406.26599, "t": 553.21939, "r": 433.84860000000003, "b": 561.5581500000001, "coord_origin": "TOPLEFT"}}, {"id": 201, "text": ",", "bbox": {"l": 433.84799, "t": 553.17456, "r": 435.78115999999994, "b": 561.54918, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": "Footnote", "bbox": {"l": 437.9079899999999, "t": 553.21939, "r": 467.23926, "b": 561.5581500000001, "coord_origin": "TOPLEFT"}}, {"id": 203, "text": ",", "bbox": {"l": 467.23999, "t": 553.17456, "r": 469.17316000000005, "b": 561.54918, "coord_origin": "TOPLEFT"}}, {"id": 204, "text": "Formula", "bbox": {"l": 471.29900999999995, "t": 553.21939, "r": 500.44574000000006, "b": 561.5581500000001, "coord_origin": "TOPLEFT"}}, {"id": 205, "text": ",", "bbox": {"l": 500.44601000000006, "t": 553.17456, "r": 502.37918, "b": 561.54918, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": "List-item", "bbox": {"l": 504.505, "t": 553.21939, "r": 535.74304, "b": 561.5581500000001, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": ",", "bbox": {"l": 535.74298, "t": 553.17456, "r": 537.67615, "b": 561.54918, "coord_origin": "TOPLEFT"}}, {"id": 208, "text": "Page-", "bbox": {"l": 539.802, "t": 553.21939, "r": 559.09839, "b": 561.5581500000001, "coord_origin": "TOPLEFT"}}, {"id": 209, "text": "footer", "bbox": {"l": 317.95499, "t": 564.17839, "r": 338.80725, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": ",", "bbox": {"l": 338.806, "t": 564.13356, "r": 340.81805, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "Page-header", "bbox": {"l": 343.61401, "t": 564.17839, "r": 387.96164, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 212, "text": ",", "bbox": {"l": 387.961, "t": 564.13356, "r": 389.97305, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "Picture", "bbox": {"l": 392.76901, "t": 564.17839, "r": 417.84662, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 214, "text": ",", "bbox": {"l": 417.84799, "t": 564.13356, "r": 419.86005, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 215, "text": "Section-header", "bbox": {"l": 422.655, "t": 564.17839, "r": 475.56305, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 216, "text": ",", "bbox": {"l": 475.56201, "t": 564.13356, "r": 477.57407, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 217, "text": "Table", "bbox": {"l": 480.36899, "t": 564.17839, "r": 499.82196, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 218, "text": ",", "bbox": {"l": 499.8219900000001, "t": 564.13356, "r": 501.83405, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 219, "text": "Text", "bbox": {"l": 504.6290000000001, "t": 564.17839, "r": 519.7926, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 220, "text": ", and", "bbox": {"l": 519.79602, "t": 564.13356, "r": 538.37103, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 221, "text": "Title", "bbox": {"l": 541.16302, "t": 564.17839, "r": 557.57043, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 222, "text": ".", "bbox": {"l": 557.57098, "t": 564.13356, "r": 559.58307, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 223, "text": "Critical factors that were considered for the choice of these class", "bbox": {"l": 317.95499, "t": 575.09256, "r": 558.20416, "b": 583.46718, "coord_origin": "TOPLEFT"}}, {"id": 224, "text": "labels were (1) the overall occurrence of the label, (2) the specificity", "bbox": {"l": 317.95499, "t": 586.05156, "r": 558.43091, "b": 594.4261799999999, "coord_origin": "TOPLEFT"}}, {"id": 225, "text": "of the label, (3) recognisability on a single page (i.e. no need for", "bbox": {"l": 317.95499, "t": 597.0105599999999, "r": 558.36871, "b": 605.38518, "coord_origin": "TOPLEFT"}}, {"id": 226, "text": "context from previous or next page) and (4) overall coverage of the", "bbox": {"l": 317.95499, "t": 607.96956, "r": 558.20105, "b": 616.3441799999999, "coord_origin": "TOPLEFT"}}, {"id": 227, "text": "page. Specificity ensures that the choice of label is not ambiguous,", "bbox": {"l": 317.95499, "t": 618.9285600000001, "r": 559.18665, "b": 627.30318, "coord_origin": "TOPLEFT"}}, {"id": 228, "text": "while coverage ensures that all meaningful items on a page can", "bbox": {"l": 317.62299, "t": 629.88756, "r": 558.20142, "b": 638.26218, "coord_origin": "TOPLEFT"}}, {"id": 229, "text": "be annotated. We refrained from class labels that are very specific", "bbox": {"l": 317.95499, "t": 640.84656, "r": 558.20227, "b": 649.22118, "coord_origin": "TOPLEFT"}}, {"id": 230, "text": "to a document category, such as", "bbox": {"l": 317.95499, "t": 651.80556, "r": 436.90649, "b": 660.1801800000001, "coord_origin": "TOPLEFT"}}, {"id": 231, "text": "Abstract", "bbox": {"l": 439.13800000000003, "t": 651.8503900000001, "r": 469.69134999999994, "b": 660.18915, "coord_origin": "TOPLEFT"}}, {"id": 232, "text": "in the", "bbox": {"l": 472.42898999999994, "t": 651.80556, "r": 493.97348, "b": 660.1801800000001, "coord_origin": "TOPLEFT"}}, {"id": 233, "text": "Scientific Articles", "bbox": {"l": 496.207, "t": 651.8503900000001, "r": 558.20001, "b": 660.18915, "coord_origin": "TOPLEFT"}}, {"id": 234, "text": "category. We also avoided class labels that are tightly linked to the", "bbox": {"l": 317.95499, "t": 662.76456, "r": 558.20557, "b": 671.13918, "coord_origin": "TOPLEFT"}}, {"id": 235, "text": "semantics of the text. Labels such as", "bbox": {"l": 317.95499, "t": 673.7225599999999, "r": 447.65221999999994, "b": 682.09718, "coord_origin": "TOPLEFT"}}, {"id": 236, "text": "Author", "bbox": {"l": 449.85999, "t": 673.76739, "r": 474.31439, "b": 682.10614, "coord_origin": "TOPLEFT"}}, {"id": 237, "text": "and", "bbox": {"l": 477.172, "t": 673.7225599999999, "r": 490.39655, "b": 682.09718, "coord_origin": "TOPLEFT"}}, {"id": 238, "text": "Affiliation", "bbox": {"l": 492.60599, "t": 673.76739, "r": 528.29907, "b": 682.10614, "coord_origin": "TOPLEFT"}}, {"id": 239, "text": ", as seen", "bbox": {"l": 528.29901, "t": 673.7225599999999, "r": 558.20148, "b": 682.09718, "coord_origin": "TOPLEFT"}}, {"id": 240, "text": "in DocBank, are often only distinguishable by discriminating on", "bbox": {"l": 317.95499, "t": 684.68156, "r": 558.2041, "b": 693.0561749999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "footnote", "bbox": {"l": 317.95499, "t": 702.353363, "r": 369.2457, "b": 708.86689, "coord_origin": "TOPLEFT"}, "confidence": 0.9080352783203125, "cells": [{"id": 241, "text": "$^{3}$https://arxiv.org/", "bbox": {"l": 317.95499, "t": 702.353363, "r": 369.2457, "b": 708.86689, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "picture", "bbox": {"l": 53.05912780761719, "t": 310.7912902832031, "r": 295.8506164550781, "b": 540.864013671875, "coord_origin": "TOPLEFT"}, "confidence": 0.9847871661186218, "cells": [], "children": []}]}, "tablestructure": {"table_map": {"1": {"label": "table", "id": 1, "page_no": 3, "cluster": {"id": 1, "label": "table", "bbox": {"l": 98.93103790283203, "t": 137.47547912597656, "r": 512.579833984375, "b": 294.08148193359375, "coord_origin": "TOPLEFT"}, "confidence": 0.9860090613365173, "cells": [{"id": 5, "text": "% of Total", "bbox": {"l": 233.94400000000002, "t": 140.22351000000003, "r": 270.04272, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "triple inter-annotator mAP @ 0.5-0.95 (%)", "bbox": {"l": 329.04999, "t": 140.22351000000003, "r": 483.3976400000001, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "class label", "bbox": {"l": 104.825, "t": 151.18255999999997, "r": 141.71277, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Count", "bbox": {"l": 175.94701, "t": 151.18255999999997, "r": 198.71269, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Train", "bbox": {"l": 213.795, "t": 151.18255999999997, "r": 233.69144, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Test", "bbox": {"l": 249.37367, "t": 151.18255999999997, "r": 264.5, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Val", "bbox": {"l": 283.53568, "t": 151.18255999999997, "r": 295.30856, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "All", "bbox": {"l": 314.01501, "t": 151.18255999999997, "r": 324.98093, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Fin", "bbox": {"l": 343.01236, "t": 151.18255999999997, "r": 354.65076, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Man", "bbox": {"l": 367.84033, "t": 151.18255999999997, "r": 384.32059, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Sci", "bbox": {"l": 407.54358, "t": 151.18255999999997, "r": 418.15979, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Law", "bbox": {"l": 432.29979999999995, "t": 151.18255999999997, "r": 447.82962, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "Pat", "bbox": {"l": 465.72656, "t": 151.18255999999997, "r": 477.50842, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Ten", "bbox": {"l": 493.52240000000006, "t": 151.18255999999997, "r": 507.17822, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Caption", "bbox": {"l": 104.825, "t": 162.53954999999996, "r": 134.01064, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "22524", "bbox": {"l": 177.866, "t": 162.53954999999996, "r": 198.71288, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "2.04", "bbox": {"l": 219.211, "t": 162.53954999999996, "r": 233.69174000000004, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "1.77", "bbox": {"l": 250.01956, "t": 162.53954999999996, "r": 264.50031, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "2.32", "bbox": {"l": 280.82812, "t": 162.53954999999996, "r": 295.30887, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "84-89", "bbox": {"l": 305.27301, "t": 162.53954999999996, "r": 324.98117, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "40-61", "bbox": {"l": 334.94284, "t": 162.53954999999996, "r": 354.651, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "86-92", "bbox": {"l": 364.61267, "t": 162.53954999999996, "r": 384.32083, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "94-99", "bbox": {"l": 398.45187, "t": 162.53954999999996, "r": 418.16003, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "95-99", "bbox": {"l": 428.1217, "t": 162.53954999999996, "r": 447.82986, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "69-78", "bbox": {"l": 457.80051, "t": 162.53954999999996, "r": 477.50867, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "n/a", "bbox": {"l": 495.32489, "t": 162.53954999999996, "r": 507.17846999999995, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Footnote", "bbox": {"l": 104.825, "t": 173.49854000000005, "r": 137.3282, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "6318", "bbox": {"l": 182.035, "t": 173.49854000000005, "r": 198.71251, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "0.60", "bbox": {"l": 219.211, "t": 173.49854000000005, "r": 233.69174000000004, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "0.31", "bbox": {"l": 250.01956, "t": 173.49854000000005, "r": 264.50031, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "0.58", "bbox": {"l": 280.82812, "t": 173.49854000000005, "r": 295.30887, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "83-91", "bbox": {"l": 305.27301, "t": 173.49854000000005, "r": 324.98117, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "n/a", "bbox": {"l": 342.79739, "t": 173.49854000000005, "r": 354.65097, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "100", "bbox": {"l": 371.81265, "t": 173.49854000000005, "r": 384.32077, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "62-88", "bbox": {"l": 398.45181, "t": 173.49854000000005, "r": 418.15997, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "85-94", "bbox": {"l": 428.12164, "t": 173.49854000000005, "r": 447.8298, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "n/a", "bbox": {"l": 465.655, "t": 173.49854000000005, "r": 477.50857999999994, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "82-97", "bbox": {"l": 487.47025, "t": 173.49854000000005, "r": 507.17841, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Formula", "bbox": {"l": 104.825, "t": 184.45752000000005, "r": 135.33766, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "25027", "bbox": {"l": 177.866, "t": 184.45752000000005, "r": 198.71288, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "2.25", "bbox": {"l": 219.211, "t": 184.45752000000005, "r": 233.69174000000004, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "1.90", "bbox": {"l": 250.01956, "t": 184.45752000000005, "r": 264.50031, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "2.96", "bbox": {"l": 280.82812, "t": 184.45752000000005, "r": 295.30887, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "83-85", "bbox": {"l": 305.27301, "t": 184.45752000000005, "r": 324.98117, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "n/a", "bbox": {"l": 342.79739, "t": 184.45752000000005, "r": 354.65097, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "n/a", "bbox": {"l": 372.46719, "t": 184.45752000000005, "r": 384.32077, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "84-87", "bbox": {"l": 398.45181, "t": 184.45752000000005, "r": 418.15997, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "86-96", "bbox": {"l": 428.12164, "t": 184.45752000000005, "r": 447.8298, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "n/a", "bbox": {"l": 465.655, "t": 184.45752000000005, "r": 477.50857999999994, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "n/a", "bbox": {"l": 495.3248, "t": 184.45752000000005, "r": 507.17838000000006, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "List-item", "bbox": {"l": 104.825, "t": 195.41656, "r": 137.70479, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "185660", "bbox": {"l": 173.69701, "t": 195.41656, "r": 198.71326, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "17.19", "bbox": {"l": 215.04201, "t": 195.41656, "r": 233.69212, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "13.34", "bbox": {"l": 245.85056, "t": 195.41656, "r": 264.50067, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "15.82", "bbox": {"l": 276.65912, "t": 195.41656, "r": 295.30923, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "87-88", "bbox": {"l": 305.27301, "t": 195.41656, "r": 324.98117, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "74-83", "bbox": {"l": 334.94284, "t": 195.41656, "r": 354.651, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "90-92", "bbox": {"l": 364.61267, "t": 195.41656, "r": 384.32083, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "97-97", "bbox": {"l": 398.45187, "t": 195.41656, "r": 418.16003, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "81-85", "bbox": {"l": 428.1217, "t": 195.41656, "r": 447.82986, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "75-88", "bbox": {"l": 457.80051, "t": 195.41656, "r": 477.50867, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "93-95", "bbox": {"l": 487.47034, "t": 195.41656, "r": 507.17849999999993, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "Page-footer", "bbox": {"l": 104.825, "t": 206.37554999999998, "r": 147.35262, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "70878", "bbox": {"l": 177.866, "t": 206.37554999999998, "r": 198.71288, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "6.51", "bbox": {"l": 219.211, "t": 206.37554999999998, "r": 233.69174000000004, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "5.58", "bbox": {"l": 250.01956, "t": 206.37554999999998, "r": 264.50031, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "6.00", "bbox": {"l": 280.82812, "t": 206.37554999999998, "r": 295.30887, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "93-94", "bbox": {"l": 305.27301, "t": 206.37554999999998, "r": 324.98117, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "88-90", "bbox": {"l": 334.94284, "t": 206.37554999999998, "r": 354.651, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "95-96", "bbox": {"l": 364.61267, "t": 206.37554999999998, "r": 384.32083, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "100", "bbox": {"l": 405.65189, "t": 206.37554999999998, "r": 418.16, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "92-97", "bbox": {"l": 428.12167, "t": 206.37554999999998, "r": 447.82983, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "100", "bbox": {"l": 465.00049, "t": 206.37554999999998, "r": 477.5086099999999, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "96-98", "bbox": {"l": 487.47028, "t": 206.37554999999998, "r": 507.17843999999997, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "Page-header", "bbox": {"l": 104.825, "t": 217.33452999999997, "r": 150.10532, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "58022", "bbox": {"l": 177.866, "t": 217.33452999999997, "r": 198.71288, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "5.10", "bbox": {"l": 219.211, "t": 217.33452999999997, "r": 233.69174000000004, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "6.70", "bbox": {"l": 250.01956, "t": 217.33452999999997, "r": 264.50031, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "5.06", "bbox": {"l": 280.82812, "t": 217.33452999999997, "r": 295.30887, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "85-89", "bbox": {"l": 305.27301, "t": 217.33452999999997, "r": 324.98117, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "66-76", "bbox": {"l": 334.94284, "t": 217.33452999999997, "r": 354.651, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "90-94", "bbox": {"l": 364.61267, "t": 217.33452999999997, "r": 384.32083, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "98-100", "bbox": {"l": 394.2825, "t": 217.33452999999997, "r": 418.16003, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "91-92", "bbox": {"l": 428.1217, "t": 217.33452999999997, "r": 447.82986, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "97-99", "bbox": {"l": 457.80051, "t": 217.33452999999997, "r": 477.50867, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "81-86", "bbox": {"l": 487.47034, "t": 217.33452999999997, "r": 507.17849999999993, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "Picture", "bbox": {"l": 104.825, "t": 228.29351999999994, "r": 130.80963, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "45976", "bbox": {"l": 177.866, "t": 228.29351999999994, "r": 198.71288, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "4.21", "bbox": {"l": 219.211, "t": 228.29351999999994, "r": 233.69174000000004, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "2.78", "bbox": {"l": 250.01956, "t": 228.29351999999994, "r": 264.50031, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "5.31", "bbox": {"l": 280.82812, "t": 228.29351999999994, "r": 295.30887, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "69-71", "bbox": {"l": 305.27301, "t": 228.29351999999994, "r": 324.98117, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "56-59", "bbox": {"l": 334.94284, "t": 228.29351999999994, "r": 354.651, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "82-86", "bbox": {"l": 364.61267, "t": 228.29351999999994, "r": 384.32083, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "69-82", "bbox": {"l": 398.45187, "t": 228.29351999999994, "r": 418.16003, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "80-95", "bbox": {"l": 428.1217, "t": 228.29351999999994, "r": 447.82986, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "66-71", "bbox": {"l": 457.80051, "t": 228.29351999999994, "r": 477.50867, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "59-76", "bbox": {"l": 487.47034, "t": 228.29351999999994, "r": 507.17849999999993, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "Section-header", "bbox": {"l": 104.825, "t": 239.25256000000002, "r": 159.56487, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "142884", "bbox": {"l": 173.69701, "t": 239.25256000000002, "r": 198.71326, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "12.60", "bbox": {"l": 215.04201, "t": 239.25256000000002, "r": 233.69212, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "15.77", "bbox": {"l": 245.85056, "t": 239.25256000000002, "r": 264.50067, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "12.85", "bbox": {"l": 276.65912, "t": 239.25256000000002, "r": 295.30923, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "83-84", "bbox": {"l": 305.27301, "t": 239.25256000000002, "r": 324.98117, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "76-81", "bbox": {"l": 334.94284, "t": 239.25256000000002, "r": 354.651, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "90-92", "bbox": {"l": 364.61267, "t": 239.25256000000002, "r": 384.32083, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "94-95", "bbox": {"l": 398.45187, "t": 239.25256000000002, "r": 418.16003, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "87-94", "bbox": {"l": 428.1217, "t": 239.25256000000002, "r": 447.82986, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "69-73", "bbox": {"l": 457.80051, "t": 239.25256000000002, "r": 477.50867, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "78-86", "bbox": {"l": 487.47034, "t": 239.25256000000002, "r": 507.17849999999993, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "Table", "bbox": {"l": 104.825, "t": 250.21155, "r": 124.63177, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "34733", "bbox": {"l": 177.866, "t": 250.21155, "r": 198.71288, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "3.20", "bbox": {"l": 219.211, "t": 250.21155, "r": 233.69174000000004, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "2.27", "bbox": {"l": 250.01956, "t": 250.21155, "r": 264.50031, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "3.60", "bbox": {"l": 280.82812, "t": 250.21155, "r": 295.30887, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "77-81", "bbox": {"l": 305.27301, "t": 250.21155, "r": 324.98117, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "75-80", "bbox": {"l": 334.94284, "t": 250.21155, "r": 354.651, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "83-86", "bbox": {"l": 364.61267, "t": 250.21155, "r": 384.32083, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "98-99", "bbox": {"l": 398.45187, "t": 250.21155, "r": 418.16003, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "58-80", "bbox": {"l": 428.1217, "t": 250.21155, "r": 447.82986, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "79-84", "bbox": {"l": 457.80051, "t": 250.21155, "r": 477.50867, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "70-85", "bbox": {"l": 487.47034, "t": 250.21155, "r": 507.17849999999993, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "Text", "bbox": {"l": 104.825, "t": 261.16956000000005, "r": 120.78519, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "510377", "bbox": {"l": 173.69701, "t": 261.16956000000005, "r": 198.71326, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "45.82", "bbox": {"l": 215.04201, "t": 261.16956000000005, "r": 233.69212, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "49.28", "bbox": {"l": 245.85056, "t": 261.16956000000005, "r": 264.50067, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "45.00", "bbox": {"l": 276.65912, "t": 261.16956000000005, "r": 295.30923, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "84-86", "bbox": {"l": 305.27301, "t": 261.16956000000005, "r": 324.98117, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "81-86", "bbox": {"l": 334.94284, "t": 261.16956000000005, "r": 354.651, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "88-93", "bbox": {"l": 364.61267, "t": 261.16956000000005, "r": 384.32083, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "89-93", "bbox": {"l": 398.45187, "t": 261.16956000000005, "r": 418.16003, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "87-92", "bbox": {"l": 428.1217, "t": 261.16956000000005, "r": 447.82986, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "71-79", "bbox": {"l": 457.80051, "t": 261.16956000000005, "r": 477.50867, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "87-95", "bbox": {"l": 487.47034, "t": 261.16956000000005, "r": 507.17849999999993, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "Title", "bbox": {"l": 104.825, "t": 272.12854000000004, "r": 121.81633, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "5071", "bbox": {"l": 182.035, "t": 272.12854000000004, "r": 198.71251, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "0.47", "bbox": {"l": 219.211, "t": 272.12854000000004, "r": 233.69174000000004, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "0.30", "bbox": {"l": 250.01956, "t": 272.12854000000004, "r": 264.50031, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "0.50", "bbox": {"l": 280.82812, "t": 272.12854000000004, "r": 295.30887, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "60-72", "bbox": {"l": 305.27301, "t": 272.12854000000004, "r": 324.98117, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "24-63", "bbox": {"l": 334.94284, "t": 272.12854000000004, "r": 354.651, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "50-63", "bbox": {"l": 364.61267, "t": 272.12854000000004, "r": 384.32083, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "94-100", "bbox": {"l": 394.2825, "t": 272.12854000000004, "r": 418.16003, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "82-96", "bbox": {"l": 428.1217, "t": 272.12854000000004, "r": 447.82986, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "68-79", "bbox": {"l": 457.80051, "t": 272.12854000000004, "r": 477.50867, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "24-56", "bbox": {"l": 487.47034, "t": 272.12854000000004, "r": 507.17849999999993, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "Total", "bbox": {"l": 104.825, "t": 283.48654, "r": 123.43028, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "1107470", "bbox": {"l": 169.52699, "t": 283.48654, "r": 198.71263, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "941123", "bbox": {"l": 208.675, "t": 283.48654, "r": 233.69124999999997, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "99816", "bbox": {"l": 243.65291999999997, "t": 283.48654, "r": 264.49982, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "66531", "bbox": {"l": 274.46149, "t": 283.48654, "r": 295.30838, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "82-83", "bbox": {"l": 305.27301, "t": 283.48654, "r": 324.98117, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "71-74", "bbox": {"l": 334.94284, "t": 283.48654, "r": 354.651, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "79-81", "bbox": {"l": 364.61267, "t": 283.48654, "r": 384.32083, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "89-94", "bbox": {"l": 398.45187, "t": 283.48654, "r": 418.16003, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "86-91", "bbox": {"l": 428.1217, "t": 283.48654, "r": 447.82986, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "71-76", "bbox": {"l": 457.80051, "t": 283.48654, "r": 477.50867, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "68-85", "bbox": {"l": 487.47034, "t": 283.48654, "r": 507.17849999999993, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": [{"id": 11, "label": "text", "bbox": {"l": 233.94400000000002, "t": 140.22351000000003, "r": 270.04272, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 5, "text": "% of Total", "bbox": {"l": 233.94400000000002, "t": 140.22351000000003, "r": 270.04272, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 329.04999, "t": 140.22351000000003, "r": 483.3976400000001, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": "triple inter-annotator mAP @ 0.5-0.95 (%)", "bbox": {"l": 329.04999, "t": 140.22351000000003, "r": 483.3976400000001, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 104.825, "t": 151.18255999999997, "r": 141.71277, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "class label", "bbox": {"l": 104.825, "t": 151.18255999999997, "r": 141.71277, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 175.94701, "t": 151.18255999999997, "r": 198.71269, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "Count", "bbox": {"l": 175.94701, "t": 151.18255999999997, "r": 198.71269, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 213.795, "t": 151.18255999999997, "r": 233.69144, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "Train", "bbox": {"l": 213.795, "t": 151.18255999999997, "r": 233.69144, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 249.37367, "t": 151.18255999999997, "r": 264.5, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "Test", "bbox": {"l": 249.37367, "t": 151.18255999999997, "r": 264.5, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 283.53568, "t": 151.18255999999997, "r": 295.30856, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "Val", "bbox": {"l": 283.53568, "t": 151.18255999999997, "r": 295.30856, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 314.01501, "t": 151.18255999999997, "r": 324.98093, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "All", "bbox": {"l": 314.01501, "t": 151.18255999999997, "r": 324.98093, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 343.01236, "t": 151.18255999999997, "r": 354.65076, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "Fin", "bbox": {"l": 343.01236, "t": 151.18255999999997, "r": 354.65076, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 367.84033, "t": 151.18255999999997, "r": 384.32059, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "Man", "bbox": {"l": 367.84033, "t": 151.18255999999997, "r": 384.32059, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 407.54358, "t": 151.18255999999997, "r": 418.15979, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "Sci", "bbox": {"l": 407.54358, "t": 151.18255999999997, "r": 418.15979, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 432.29979999999995, "t": 151.18255999999997, "r": 447.82962, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "Law", "bbox": {"l": 432.29979999999995, "t": 151.18255999999997, "r": 447.82962, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 465.72656, "t": 151.18255999999997, "r": 477.50842, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "Pat", "bbox": {"l": 465.72656, "t": 151.18255999999997, "r": 477.50842, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 493.52240000000006, "t": 151.18255999999997, "r": 507.17822, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "Ten", "bbox": {"l": 493.52240000000006, "t": 151.18255999999997, "r": 507.17822, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 104.825, "t": 162.53954999999996, "r": 134.01064, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "Caption", "bbox": {"l": 104.825, "t": 162.53954999999996, "r": 134.01064, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 177.866, "t": 162.53954999999996, "r": 198.71288, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "22524", "bbox": {"l": 177.866, "t": 162.53954999999996, "r": 198.71288, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 219.211, "t": 162.53954999999996, "r": 233.69174000000004, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "2.04", "bbox": {"l": 219.211, "t": 162.53954999999996, "r": 233.69174000000004, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 250.01956, "t": 162.53954999999996, "r": 264.50031, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "1.77", "bbox": {"l": 250.01956, "t": 162.53954999999996, "r": 264.50031, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 280.82812, "t": 162.53954999999996, "r": 295.30887, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "2.32", "bbox": {"l": 280.82812, "t": 162.53954999999996, "r": 295.30887, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 305.27301, "t": 162.53954999999996, "r": 324.98117, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "84-89", "bbox": {"l": 305.27301, "t": 162.53954999999996, "r": 324.98117, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 334.94284, "t": 162.53954999999996, "r": 354.651, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "40-61", "bbox": {"l": 334.94284, "t": 162.53954999999996, "r": 354.651, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 364.61267, "t": 162.53954999999996, "r": 384.32083, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "86-92", "bbox": {"l": 364.61267, "t": 162.53954999999996, "r": 384.32083, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 398.45187, "t": 162.53954999999996, "r": 418.16003, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "94-99", "bbox": {"l": 398.45187, "t": 162.53954999999996, "r": 418.16003, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 428.1217, "t": 162.53954999999996, "r": 447.82986, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "95-99", "bbox": {"l": 428.1217, "t": 162.53954999999996, "r": 447.82986, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 457.80051, "t": 162.53954999999996, "r": 477.50867, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "69-78", "bbox": {"l": 457.80051, "t": 162.53954999999996, "r": 477.50867, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 495.32489, "t": 162.53954999999996, "r": 507.17846999999995, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "n/a", "bbox": {"l": 495.32489, "t": 162.53954999999996, "r": 507.17846999999995, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 104.825, "t": 173.49854000000005, "r": 137.3282, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "Footnote", "bbox": {"l": 104.825, "t": 173.49854000000005, "r": 137.3282, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 182.035, "t": 173.49854000000005, "r": 198.71251, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "6318", "bbox": {"l": 182.035, "t": 173.49854000000005, "r": 198.71251, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 219.211, "t": 173.49854000000005, "r": 233.69174000000004, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "0.60", "bbox": {"l": 219.211, "t": 173.49854000000005, "r": 233.69174000000004, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 250.01956, "t": 173.49854000000005, "r": 264.50031, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "0.31", "bbox": {"l": 250.01956, "t": 173.49854000000005, "r": 264.50031, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 280.82812, "t": 173.49854000000005, "r": 295.30887, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "0.58", "bbox": {"l": 280.82812, "t": 173.49854000000005, "r": 295.30887, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 305.27301, "t": 173.49854000000005, "r": 324.98117, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "83-91", "bbox": {"l": 305.27301, "t": 173.49854000000005, "r": 324.98117, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 342.79739, "t": 173.49854000000005, "r": 354.65097, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "n/a", "bbox": {"l": 342.79739, "t": 173.49854000000005, "r": 354.65097, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 371.81265, "t": 173.49854000000005, "r": 384.32077, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "100", "bbox": {"l": 371.81265, "t": 173.49854000000005, "r": 384.32077, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 398.45181, "t": 173.49854000000005, "r": 418.15997, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "62-88", "bbox": {"l": 398.45181, "t": 173.49854000000005, "r": 418.15997, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 428.12164, "t": 173.49854000000005, "r": 447.8298, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "85-94", "bbox": {"l": 428.12164, "t": 173.49854000000005, "r": 447.8298, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 465.655, "t": 173.49854000000005, "r": 477.50857999999994, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "n/a", "bbox": {"l": 465.655, "t": 173.49854000000005, "r": 477.50857999999994, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 487.47025, "t": 173.49854000000005, "r": 507.17841, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "82-97", "bbox": {"l": 487.47025, "t": 173.49854000000005, "r": 507.17841, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 104.825, "t": 184.45752000000005, "r": 135.33766, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "Formula", "bbox": {"l": 104.825, "t": 184.45752000000005, "r": 135.33766, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 177.866, "t": 184.45752000000005, "r": 198.71288, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "25027", "bbox": {"l": 177.866, "t": 184.45752000000005, "r": 198.71288, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 219.211, "t": 184.45752000000005, "r": 233.69174000000004, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "2.25", "bbox": {"l": 219.211, "t": 184.45752000000005, "r": 233.69174000000004, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 250.01956, "t": 184.45752000000005, "r": 264.50031, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "1.90", "bbox": {"l": 250.01956, "t": 184.45752000000005, "r": 264.50031, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 280.82812, "t": 184.45752000000005, "r": 295.30887, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "2.96", "bbox": {"l": 280.82812, "t": 184.45752000000005, "r": 295.30887, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 305.27301, "t": 184.45752000000005, "r": 324.98117, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "83-85", "bbox": {"l": 305.27301, "t": 184.45752000000005, "r": 324.98117, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 342.79739, "t": 184.45752000000005, "r": 354.65097, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "n/a", "bbox": {"l": 342.79739, "t": 184.45752000000005, "r": 354.65097, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 372.46719, "t": 184.45752000000005, "r": 384.32077, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "n/a", "bbox": {"l": 372.46719, "t": 184.45752000000005, "r": 384.32077, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 398.45181, "t": 184.45752000000005, "r": 418.15997, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "84-87", "bbox": {"l": 398.45181, "t": 184.45752000000005, "r": 418.15997, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 428.12164, "t": 184.45752000000005, "r": 447.8298, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "86-96", "bbox": {"l": 428.12164, "t": 184.45752000000005, "r": 447.8298, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 465.655, "t": 184.45752000000005, "r": 477.50857999999994, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "n/a", "bbox": {"l": 465.655, "t": 184.45752000000005, "r": 477.50857999999994, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 495.3248, "t": 184.45752000000005, "r": 507.17838000000006, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "n/a", "bbox": {"l": 495.3248, "t": 184.45752000000005, "r": 507.17838000000006, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 104.825, "t": 195.41656, "r": 137.70479, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "List-item", "bbox": {"l": 104.825, "t": 195.41656, "r": 137.70479, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 173.69701, "t": 195.41656, "r": 198.71326, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "185660", "bbox": {"l": 173.69701, "t": 195.41656, "r": 198.71326, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 215.04201, "t": 195.41656, "r": 233.69212, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "17.19", "bbox": {"l": 215.04201, "t": 195.41656, "r": 233.69212, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 245.85056, "t": 195.41656, "r": 264.50067, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "13.34", "bbox": {"l": 245.85056, "t": 195.41656, "r": 264.50067, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 276.65912, "t": 195.41656, "r": 295.30923, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "15.82", "bbox": {"l": 276.65912, "t": 195.41656, "r": 295.30923, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 305.27301, "t": 195.41656, "r": 324.98117, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "87-88", "bbox": {"l": 305.27301, "t": 195.41656, "r": 324.98117, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 334.94284, "t": 195.41656, "r": 354.651, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "74-83", "bbox": {"l": 334.94284, "t": 195.41656, "r": 354.651, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 364.61267, "t": 195.41656, "r": 384.32083, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "90-92", "bbox": {"l": 364.61267, "t": 195.41656, "r": 384.32083, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 398.45187, "t": 195.41656, "r": 418.16003, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "97-97", "bbox": {"l": 398.45187, "t": 195.41656, "r": 418.16003, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 428.1217, "t": 195.41656, "r": 447.82986, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "81-85", "bbox": {"l": 428.1217, "t": 195.41656, "r": 447.82986, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 457.80051, "t": 195.41656, "r": 477.50867, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "75-88", "bbox": {"l": 457.80051, "t": 195.41656, "r": 477.50867, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 487.47034, "t": 195.41656, "r": 507.17849999999993, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "93-95", "bbox": {"l": 487.47034, "t": 195.41656, "r": 507.17849999999993, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 104.825, "t": 206.37554999999998, "r": 147.35262, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "Page-footer", "bbox": {"l": 104.825, "t": 206.37554999999998, "r": 147.35262, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 177.866, "t": 206.37554999999998, "r": 198.71288, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "70878", "bbox": {"l": 177.866, "t": 206.37554999999998, "r": 198.71288, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 219.211, "t": 206.37554999999998, "r": 233.69174000000004, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "6.51", "bbox": {"l": 219.211, "t": 206.37554999999998, "r": 233.69174000000004, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 250.01956, "t": 206.37554999999998, "r": 264.50031, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "5.58", "bbox": {"l": 250.01956, "t": 206.37554999999998, "r": 264.50031, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 280.82812, "t": 206.37554999999998, "r": 295.30887, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "6.00", "bbox": {"l": 280.82812, "t": 206.37554999999998, "r": 295.30887, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 305.27301, "t": 206.37554999999998, "r": 324.98117, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "93-94", "bbox": {"l": 305.27301, "t": 206.37554999999998, "r": 324.98117, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 334.94284, "t": 206.37554999999998, "r": 354.651, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "88-90", "bbox": {"l": 334.94284, "t": 206.37554999999998, "r": 354.651, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 364.61267, "t": 206.37554999999998, "r": 384.32083, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "95-96", "bbox": {"l": 364.61267, "t": 206.37554999999998, "r": 384.32083, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 405.65189, "t": 206.37554999999998, "r": 418.16, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "100", "bbox": {"l": 405.65189, "t": 206.37554999999998, "r": 418.16, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 428.12167, "t": 206.37554999999998, "r": 447.82983, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "92-97", "bbox": {"l": 428.12167, "t": 206.37554999999998, "r": 447.82983, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 465.00049, "t": 206.37554999999998, "r": 477.5086099999999, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "100", "bbox": {"l": 465.00049, "t": 206.37554999999998, "r": 477.5086099999999, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 487.47028, "t": 206.37554999999998, "r": 507.17843999999997, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "96-98", "bbox": {"l": 487.47028, "t": 206.37554999999998, "r": 507.17843999999997, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 104.825, "t": 217.33452999999997, "r": 150.10532, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "Page-header", "bbox": {"l": 104.825, "t": 217.33452999999997, "r": 150.10532, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 177.866, "t": 217.33452999999997, "r": 198.71288, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "58022", "bbox": {"l": 177.866, "t": 217.33452999999997, "r": 198.71288, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 219.211, "t": 217.33452999999997, "r": 233.69174000000004, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "5.10", "bbox": {"l": 219.211, "t": 217.33452999999997, "r": 233.69174000000004, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 250.01956, "t": 217.33452999999997, "r": 264.50031, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "6.70", "bbox": {"l": 250.01956, "t": 217.33452999999997, "r": 264.50031, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 280.82812, "t": 217.33452999999997, "r": 295.30887, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "5.06", "bbox": {"l": 280.82812, "t": 217.33452999999997, "r": 295.30887, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 305.27301, "t": 217.33452999999997, "r": 324.98117, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "85-89", "bbox": {"l": 305.27301, "t": 217.33452999999997, "r": 324.98117, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 334.94284, "t": 217.33452999999997, "r": 354.651, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "66-76", "bbox": {"l": 334.94284, "t": 217.33452999999997, "r": 354.651, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 364.61267, "t": 217.33452999999997, "r": 384.32083, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "90-94", "bbox": {"l": 364.61267, "t": 217.33452999999997, "r": 384.32083, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 394.2825, "t": 217.33452999999997, "r": 418.16003, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "98-100", "bbox": {"l": 394.2825, "t": 217.33452999999997, "r": 418.16003, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 428.1217, "t": 217.33452999999997, "r": 447.82986, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "91-92", "bbox": {"l": 428.1217, "t": 217.33452999999997, "r": 447.82986, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 457.80051, "t": 217.33452999999997, "r": 477.50867, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "97-99", "bbox": {"l": 457.80051, "t": 217.33452999999997, "r": 477.50867, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 487.47034, "t": 217.33452999999997, "r": 507.17849999999993, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "81-86", "bbox": {"l": 487.47034, "t": 217.33452999999997, "r": 507.17849999999993, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 104.825, "t": 228.29351999999994, "r": 130.80963, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "Picture", "bbox": {"l": 104.825, "t": 228.29351999999994, "r": 130.80963, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 177.866, "t": 228.29351999999994, "r": 198.71288, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "45976", "bbox": {"l": 177.866, "t": 228.29351999999994, "r": 198.71288, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 219.211, "t": 228.29351999999994, "r": 233.69174000000004, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "4.21", "bbox": {"l": 219.211, "t": 228.29351999999994, "r": 233.69174000000004, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 250.01956, "t": 228.29351999999994, "r": 264.50031, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "2.78", "bbox": {"l": 250.01956, "t": 228.29351999999994, "r": 264.50031, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 280.82812, "t": 228.29351999999994, "r": 295.30887, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "5.31", "bbox": {"l": 280.82812, "t": 228.29351999999994, "r": 295.30887, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 305.27301, "t": 228.29351999999994, "r": 324.98117, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "69-71", "bbox": {"l": 305.27301, "t": 228.29351999999994, "r": 324.98117, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 334.94284, "t": 228.29351999999994, "r": 354.651, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "56-59", "bbox": {"l": 334.94284, "t": 228.29351999999994, "r": 354.651, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 364.61267, "t": 228.29351999999994, "r": 384.32083, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "82-86", "bbox": {"l": 364.61267, "t": 228.29351999999994, "r": 384.32083, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 398.45187, "t": 228.29351999999994, "r": 418.16003, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "69-82", "bbox": {"l": 398.45187, "t": 228.29351999999994, "r": 418.16003, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 428.1217, "t": 228.29351999999994, "r": 447.82986, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "80-95", "bbox": {"l": 428.1217, "t": 228.29351999999994, "r": 447.82986, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 457.80051, "t": 228.29351999999994, "r": 477.50867, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "66-71", "bbox": {"l": 457.80051, "t": 228.29351999999994, "r": 477.50867, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 487.47034, "t": 228.29351999999994, "r": 507.17849999999993, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "59-76", "bbox": {"l": 487.47034, "t": 228.29351999999994, "r": 507.17849999999993, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 104.825, "t": 239.25256000000002, "r": 159.56487, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": "Section-header", "bbox": {"l": 104.825, "t": 239.25256000000002, "r": 159.56487, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 173.69701, "t": 239.25256000000002, "r": 198.71326, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "142884", "bbox": {"l": 173.69701, "t": 239.25256000000002, "r": 198.71326, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 215.04201, "t": 239.25256000000002, "r": 233.69212, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "12.60", "bbox": {"l": 215.04201, "t": 239.25256000000002, "r": 233.69212, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 245.85056, "t": 239.25256000000002, "r": 264.50067, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": "15.77", "bbox": {"l": 245.85056, "t": 239.25256000000002, "r": 264.50067, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 276.65912, "t": 239.25256000000002, "r": 295.30923, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 107, "text": "12.85", "bbox": {"l": 276.65912, "t": 239.25256000000002, "r": 295.30923, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 114, "label": "text", "bbox": {"l": 305.27301, "t": 239.25256000000002, "r": 324.98117, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 108, "text": "83-84", "bbox": {"l": 305.27301, "t": 239.25256000000002, "r": 324.98117, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 115, "label": "text", "bbox": {"l": 334.94284, "t": 239.25256000000002, "r": 354.651, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 109, "text": "76-81", "bbox": {"l": 334.94284, "t": 239.25256000000002, "r": 354.651, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 116, "label": "text", "bbox": {"l": 364.61267, "t": 239.25256000000002, "r": 384.32083, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 110, "text": "90-92", "bbox": {"l": 364.61267, "t": 239.25256000000002, "r": 384.32083, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 117, "label": "text", "bbox": {"l": 398.45187, "t": 239.25256000000002, "r": 418.16003, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 111, "text": "94-95", "bbox": {"l": 398.45187, "t": 239.25256000000002, "r": 418.16003, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 118, "label": "text", "bbox": {"l": 428.1217, "t": 239.25256000000002, "r": 447.82986, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 112, "text": "87-94", "bbox": {"l": 428.1217, "t": 239.25256000000002, "r": 447.82986, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 119, "label": "text", "bbox": {"l": 457.80051, "t": 239.25256000000002, "r": 477.50867, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 113, "text": "69-73", "bbox": {"l": 457.80051, "t": 239.25256000000002, "r": 477.50867, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 120, "label": "text", "bbox": {"l": 487.47034, "t": 239.25256000000002, "r": 507.17849999999993, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 114, "text": "78-86", "bbox": {"l": 487.47034, "t": 239.25256000000002, "r": 507.17849999999993, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 121, "label": "text", "bbox": {"l": 104.825, "t": 250.21155, "r": 124.63177, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 115, "text": "Table", "bbox": {"l": 104.825, "t": 250.21155, "r": 124.63177, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 122, "label": "text", "bbox": {"l": 177.866, "t": 250.21155, "r": 198.71288, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 116, "text": "34733", "bbox": {"l": 177.866, "t": 250.21155, "r": 198.71288, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 123, "label": "text", "bbox": {"l": 219.211, "t": 250.21155, "r": 233.69174000000004, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 117, "text": "3.20", "bbox": {"l": 219.211, "t": 250.21155, "r": 233.69174000000004, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 124, "label": "text", "bbox": {"l": 250.01956, "t": 250.21155, "r": 264.50031, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 118, "text": "2.27", "bbox": {"l": 250.01956, "t": 250.21155, "r": 264.50031, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 125, "label": "text", "bbox": {"l": 280.82812, "t": 250.21155, "r": 295.30887, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 119, "text": "3.60", "bbox": {"l": 280.82812, "t": 250.21155, "r": 295.30887, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 126, "label": "text", "bbox": {"l": 305.27301, "t": 250.21155, "r": 324.98117, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 120, "text": "77-81", "bbox": {"l": 305.27301, "t": 250.21155, "r": 324.98117, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 127, "label": "text", "bbox": {"l": 334.94284, "t": 250.21155, "r": 354.651, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 121, "text": "75-80", "bbox": {"l": 334.94284, "t": 250.21155, "r": 354.651, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 128, "label": "text", "bbox": {"l": 364.61267, "t": 250.21155, "r": 384.32083, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 122, "text": "83-86", "bbox": {"l": 364.61267, "t": 250.21155, "r": 384.32083, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 129, "label": "text", "bbox": {"l": 398.45187, "t": 250.21155, "r": 418.16003, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 123, "text": "98-99", "bbox": {"l": 398.45187, "t": 250.21155, "r": 418.16003, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 130, "label": "text", "bbox": {"l": 428.1217, "t": 250.21155, "r": 447.82986, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 124, "text": "58-80", "bbox": {"l": 428.1217, "t": 250.21155, "r": 447.82986, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 131, "label": "text", "bbox": {"l": 457.80051, "t": 250.21155, "r": 477.50867, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 125, "text": "79-84", "bbox": {"l": 457.80051, "t": 250.21155, "r": 477.50867, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 132, "label": "text", "bbox": {"l": 487.47034, "t": 250.21155, "r": 507.17849999999993, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 126, "text": "70-85", "bbox": {"l": 487.47034, "t": 250.21155, "r": 507.17849999999993, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 133, "label": "text", "bbox": {"l": 104.825, "t": 261.16956000000005, "r": 120.78519, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 127, "text": "Text", "bbox": {"l": 104.825, "t": 261.16956000000005, "r": 120.78519, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 134, "label": "text", "bbox": {"l": 173.69701, "t": 261.16956000000005, "r": 198.71326, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 128, "text": "510377", "bbox": {"l": 173.69701, "t": 261.16956000000005, "r": 198.71326, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 135, "label": "text", "bbox": {"l": 215.04201, "t": 261.16956000000005, "r": 233.69212, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 129, "text": "45.82", "bbox": {"l": 215.04201, "t": 261.16956000000005, "r": 233.69212, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 136, "label": "text", "bbox": {"l": 245.85056, "t": 261.16956000000005, "r": 264.50067, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 130, "text": "49.28", "bbox": {"l": 245.85056, "t": 261.16956000000005, "r": 264.50067, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 137, "label": "text", "bbox": {"l": 276.65912, "t": 261.16956000000005, "r": 295.30923, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 131, "text": "45.00", "bbox": {"l": 276.65912, "t": 261.16956000000005, "r": 295.30923, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 138, "label": "text", "bbox": {"l": 305.27301, "t": 261.16956000000005, "r": 324.98117, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 132, "text": "84-86", "bbox": {"l": 305.27301, "t": 261.16956000000005, "r": 324.98117, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 139, "label": "text", "bbox": {"l": 334.94284, "t": 261.16956000000005, "r": 354.651, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 133, "text": "81-86", "bbox": {"l": 334.94284, "t": 261.16956000000005, "r": 354.651, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 140, "label": "text", "bbox": {"l": 364.61267, "t": 261.16956000000005, "r": 384.32083, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 134, "text": "88-93", "bbox": {"l": 364.61267, "t": 261.16956000000005, "r": 384.32083, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 141, "label": "text", "bbox": {"l": 398.45187, "t": 261.16956000000005, "r": 418.16003, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 135, "text": "89-93", "bbox": {"l": 398.45187, "t": 261.16956000000005, "r": 418.16003, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 142, "label": "text", "bbox": {"l": 428.1217, "t": 261.16956000000005, "r": 447.82986, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 136, "text": "87-92", "bbox": {"l": 428.1217, "t": 261.16956000000005, "r": 447.82986, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 143, "label": "text", "bbox": {"l": 457.80051, "t": 261.16956000000005, "r": 477.50867, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 137, "text": "71-79", "bbox": {"l": 457.80051, "t": 261.16956000000005, "r": 477.50867, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 144, "label": "text", "bbox": {"l": 487.47034, "t": 261.16956000000005, "r": 507.17849999999993, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 138, "text": "87-95", "bbox": {"l": 487.47034, "t": 261.16956000000005, "r": 507.17849999999993, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 145, "label": "text", "bbox": {"l": 104.825, "t": 272.12854000000004, "r": 121.81633, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 139, "text": "Title", "bbox": {"l": 104.825, "t": 272.12854000000004, "r": 121.81633, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 146, "label": "text", "bbox": {"l": 182.035, "t": 272.12854000000004, "r": 198.71251, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 140, "text": "5071", "bbox": {"l": 182.035, "t": 272.12854000000004, "r": 198.71251, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 147, "label": "text", "bbox": {"l": 219.211, "t": 272.12854000000004, "r": 233.69174000000004, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 141, "text": "0.47", "bbox": {"l": 219.211, "t": 272.12854000000004, "r": 233.69174000000004, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 148, "label": "text", "bbox": {"l": 250.01956, "t": 272.12854000000004, "r": 264.50031, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 142, "text": "0.30", "bbox": {"l": 250.01956, "t": 272.12854000000004, "r": 264.50031, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 149, "label": "text", "bbox": {"l": 280.82812, "t": 272.12854000000004, "r": 295.30887, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 143, "text": "0.50", "bbox": {"l": 280.82812, "t": 272.12854000000004, "r": 295.30887, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 150, "label": "text", "bbox": {"l": 305.27301, "t": 272.12854000000004, "r": 324.98117, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 144, "text": "60-72", "bbox": {"l": 305.27301, "t": 272.12854000000004, "r": 324.98117, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 151, "label": "text", "bbox": {"l": 334.94284, "t": 272.12854000000004, "r": 354.651, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 145, "text": "24-63", "bbox": {"l": 334.94284, "t": 272.12854000000004, "r": 354.651, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 152, "label": "text", "bbox": {"l": 364.61267, "t": 272.12854000000004, "r": 384.32083, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 146, "text": "50-63", "bbox": {"l": 364.61267, "t": 272.12854000000004, "r": 384.32083, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 153, "label": "text", "bbox": {"l": 394.2825, "t": 272.12854000000004, "r": 418.16003, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 147, "text": "94-100", "bbox": {"l": 394.2825, "t": 272.12854000000004, "r": 418.16003, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 154, "label": "text", "bbox": {"l": 428.1217, "t": 272.12854000000004, "r": 447.82986, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 148, "text": "82-96", "bbox": {"l": 428.1217, "t": 272.12854000000004, "r": 447.82986, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 155, "label": "text", "bbox": {"l": 457.80051, "t": 272.12854000000004, "r": 477.50867, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 149, "text": "68-79", "bbox": {"l": 457.80051, "t": 272.12854000000004, "r": 477.50867, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 156, "label": "text", "bbox": {"l": 487.47034, "t": 272.12854000000004, "r": 507.17849999999993, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 150, "text": "24-56", "bbox": {"l": 487.47034, "t": 272.12854000000004, "r": 507.17849999999993, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 157, "label": "text", "bbox": {"l": 104.825, "t": 283.48654, "r": 123.43028, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 151, "text": "Total", "bbox": {"l": 104.825, "t": 283.48654, "r": 123.43028, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 158, "label": "text", "bbox": {"l": 169.52699, "t": 283.48654, "r": 198.71263, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 152, "text": "1107470", "bbox": {"l": 169.52699, "t": 283.48654, "r": 198.71263, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 159, "label": "text", "bbox": {"l": 208.675, "t": 283.48654, "r": 233.69124999999997, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 153, "text": "941123", "bbox": {"l": 208.675, "t": 283.48654, "r": 233.69124999999997, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 160, "label": "text", "bbox": {"l": 243.65291999999997, "t": 283.48654, "r": 264.49982, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 154, "text": "99816", "bbox": {"l": 243.65291999999997, "t": 283.48654, "r": 264.49982, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 161, "label": "text", "bbox": {"l": 274.46149, "t": 283.48654, "r": 295.30838, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 155, "text": "66531", "bbox": {"l": 274.46149, "t": 283.48654, "r": 295.30838, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 162, "label": "text", "bbox": {"l": 305.27301, "t": 283.48654, "r": 324.98117, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 156, "text": "82-83", "bbox": {"l": 305.27301, "t": 283.48654, "r": 324.98117, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 163, "label": "text", "bbox": {"l": 334.94284, "t": 283.48654, "r": 354.651, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 157, "text": "71-74", "bbox": {"l": 334.94284, "t": 283.48654, "r": 354.651, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 164, "label": "text", "bbox": {"l": 364.61267, "t": 283.48654, "r": 384.32083, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 158, "text": "79-81", "bbox": {"l": 364.61267, "t": 283.48654, "r": 384.32083, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 165, "label": "text", "bbox": {"l": 398.45187, "t": 283.48654, "r": 418.16003, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 159, "text": "89-94", "bbox": {"l": 398.45187, "t": 283.48654, "r": 418.16003, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 166, "label": "text", "bbox": {"l": 428.1217, "t": 283.48654, "r": 447.82986, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 160, "text": "86-91", "bbox": {"l": 428.1217, "t": 283.48654, "r": 447.82986, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 167, "label": "text", "bbox": {"l": 457.80051, "t": 283.48654, "r": 477.50867, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 161, "text": "71-76", "bbox": {"l": 457.80051, "t": 283.48654, "r": 477.50867, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 168, "label": "text", "bbox": {"l": 487.47034, "t": 283.48654, "r": 507.17849999999993, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 162, "text": "68-85", "bbox": {"l": 487.47034, "t": 283.48654, "r": 507.17849999999993, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "lcel", "lcel", "lcel", "ched", "lcel", "lcel", "lcel", "lcel", "lcel", "nl", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 14, "num_cols": 12, "table_cells": [{"bbox": {"l": 233.94400000000002, "t": 140.22351000000003, "r": 270.04272, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 4, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 6, "text": "% of Total", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 329.04999, "t": 140.22351000000003, "r": 483.3976400000001, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 6, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 6, "end_col_offset_idx": 12, "text": "triple inter-annotator mAP @ 0.5-0.95 (%)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 151.18255999999997, "r": 141.71277, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "class label", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 175.94701, "t": 151.18255999999997, "r": 198.71269, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Count", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 213.795, "t": 151.18255999999997, "r": 233.69144, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Train", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 249.37367, "t": 151.18255999999997, "r": 264.5, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Test", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 283.53568, "t": 151.18255999999997, "r": 295.30856, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Val", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 314.01501, "t": 151.18255999999997, "r": 324.98093, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "All", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 343.01236, "t": 151.18255999999997, "r": 354.65076, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "Fin", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 367.84033, "t": 151.18255999999997, "r": 384.32059, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "Man", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 407.54358, "t": 151.18255999999997, "r": 418.15979, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "Sci", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 432.29979999999995, "t": 151.18255999999997, "r": 447.82962, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "Law", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 465.72656, "t": 151.18255999999997, "r": 477.50842, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "Pat", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 493.52240000000006, "t": 151.18255999999997, "r": 507.17822, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "Ten", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 162.53954999999996, "r": 134.01064, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Caption", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 177.866, "t": 162.53954999999996, "r": 198.71288, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "22524", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 162.53954999999996, "r": 233.69174000000004, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "2.04", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 162.53954999999996, "r": 264.50031, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "1.77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 162.53954999999996, "r": 295.30887, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "2.32", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 162.53954999999996, "r": 324.98117, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "84-89", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 162.53954999999996, "r": 354.651, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "40-61", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 162.53954999999996, "r": 384.32083, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "86-92", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45187, "t": 162.53954999999996, "r": 418.16003, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "94-99", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 162.53954999999996, "r": 447.82986, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "95-99", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 162.53954999999996, "r": 477.50867, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "69-78", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 495.32489, "t": 162.53954999999996, "r": 507.17846999999995, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 173.49854000000005, "r": 137.3282, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Footnote", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 182.035, "t": 173.49854000000005, "r": 198.71251, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "6318", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 173.49854000000005, "r": 233.69174000000004, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.60", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 173.49854000000005, "r": 264.50031, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.31", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 173.49854000000005, "r": 295.30887, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.58", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 173.49854000000005, "r": 324.98117, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "83-91", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 342.79739, "t": 173.49854000000005, "r": 354.65097, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 371.81265, "t": 173.49854000000005, "r": 384.32077, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "100", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45181, "t": 173.49854000000005, "r": 418.15997, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "62-88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.12164, "t": 173.49854000000005, "r": 447.8298, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "85-94", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 465.655, "t": 173.49854000000005, "r": 477.50857999999994, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47025, "t": 173.49854000000005, "r": 507.17841, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "82-97", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 184.45752000000005, "r": 135.33766, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Formula", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 177.866, "t": 184.45752000000005, "r": 198.71288, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "25027", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 184.45752000000005, "r": 233.69174000000004, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "2.25", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 184.45752000000005, "r": 264.50031, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "1.90", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 184.45752000000005, "r": 295.30887, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "2.96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 184.45752000000005, "r": 324.98117, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "83-85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 342.79739, "t": 184.45752000000005, "r": 354.65097, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 372.46719, "t": 184.45752000000005, "r": 384.32077, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45181, "t": 184.45752000000005, "r": 418.15997, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "84-87", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.12164, "t": 184.45752000000005, "r": 447.8298, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "86-96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 465.655, "t": 184.45752000000005, "r": 477.50857999999994, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 495.3248, "t": 184.45752000000005, "r": 507.17838000000006, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 195.41656, "r": 137.70479, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "List-item", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 173.69701, "t": 195.41656, "r": 198.71326, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "185660", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 215.04201, "t": 195.41656, "r": 233.69212, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "17.19", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.85056, "t": 195.41656, "r": 264.50067, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "13.34", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 276.65912, "t": 195.41656, "r": 295.30923, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "15.82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 195.41656, "r": 324.98117, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "87-88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 195.41656, "r": 354.651, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "74-83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 195.41656, "r": 384.32083, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "90-92", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45187, "t": 195.41656, "r": 418.16003, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "97-97", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 195.41656, "r": 447.82986, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "81-85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 195.41656, "r": 477.50867, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "75-88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 195.41656, "r": 507.17849999999993, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "93-95", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 206.37554999999998, "r": 147.35262, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-footer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 177.866, "t": 206.37554999999998, "r": 198.71288, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "70878", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 206.37554999999998, "r": 233.69174000000004, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "6.51", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 206.37554999999998, "r": 264.50031, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "5.58", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 206.37554999999998, "r": 295.30887, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "6.00", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 206.37554999999998, "r": 324.98117, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "93-94", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 206.37554999999998, "r": 354.651, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "88-90", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 206.37554999999998, "r": 384.32083, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "95-96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 405.65189, "t": 206.37554999999998, "r": 418.16, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "100", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.12167, "t": 206.37554999999998, "r": 447.82983, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "92-97", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 465.00049, "t": 206.37554999999998, "r": 477.5086099999999, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "100", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47028, "t": 206.37554999999998, "r": 507.17843999999997, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "96-98", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 217.33452999999997, "r": 150.10532, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 177.866, "t": 217.33452999999997, "r": 198.71288, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "58022", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 217.33452999999997, "r": 233.69174000000004, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "5.10", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 217.33452999999997, "r": 264.50031, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "6.70", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 217.33452999999997, "r": 295.30887, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "5.06", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 217.33452999999997, "r": 324.98117, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "85-89", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 217.33452999999997, "r": 354.651, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "66-76", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 217.33452999999997, "r": 384.32083, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "90-94", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.2825, "t": 217.33452999999997, "r": 418.16003, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "98-100", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 217.33452999999997, "r": 447.82986, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "91-92", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 217.33452999999997, "r": 477.50867, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "97-99", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 217.33452999999997, "r": 507.17849999999993, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "81-86", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 228.29351999999994, "r": 130.80963, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Picture", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 177.866, "t": 228.29351999999994, "r": 198.71288, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "45976", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 228.29351999999994, "r": 233.69174000000004, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "4.21", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 228.29351999999994, "r": 264.50031, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "2.78", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 228.29351999999994, "r": 295.30887, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "5.31", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 228.29351999999994, "r": 324.98117, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "69-71", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 228.29351999999994, "r": 354.651, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "56-59", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 228.29351999999994, "r": 384.32083, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "82-86", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45187, "t": 228.29351999999994, "r": 418.16003, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "69-82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 228.29351999999994, "r": 447.82986, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "80-95", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 228.29351999999994, "r": 477.50867, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "66-71", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 228.29351999999994, "r": 507.17849999999993, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "59-76", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 239.25256000000002, "r": 159.56487, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Section-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 173.69701, "t": 239.25256000000002, "r": 198.71326, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "142884", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 215.04201, "t": 239.25256000000002, "r": 233.69212, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "12.60", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.85056, "t": 239.25256000000002, "r": 264.50067, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "15.77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 276.65912, "t": 239.25256000000002, "r": 295.30923, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "12.85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 239.25256000000002, "r": 324.98117, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "83-84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 239.25256000000002, "r": 354.651, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "76-81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 239.25256000000002, "r": 384.32083, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "90-92", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45187, "t": 239.25256000000002, "r": 418.16003, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "94-95", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 239.25256000000002, "r": 447.82986, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "87-94", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 239.25256000000002, "r": 477.50867, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "69-73", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 239.25256000000002, "r": 507.17849999999993, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "78-86", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 250.21155, "r": 124.63177, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 177.866, "t": 250.21155, "r": 198.71288, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "34733", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 250.21155, "r": 233.69174000000004, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "3.20", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 250.21155, "r": 264.50031, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "2.27", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 250.21155, "r": 295.30887, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "3.60", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 250.21155, "r": 324.98117, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "77-81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 250.21155, "r": 354.651, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "75-80", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 250.21155, "r": 384.32083, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "83-86", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45187, "t": 250.21155, "r": 418.16003, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "98-99", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 250.21155, "r": 447.82986, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "58-80", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 250.21155, "r": 477.50867, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "79-84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 250.21155, "r": 507.17849999999993, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "70-85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 261.16956000000005, "r": 120.78519, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Text", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 173.69701, "t": 261.16956000000005, "r": 198.71326, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "510377", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 215.04201, "t": 261.16956000000005, "r": 233.69212, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "45.82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.85056, "t": 261.16956000000005, "r": 264.50067, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "49.28", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 276.65912, "t": 261.16956000000005, "r": 295.30923, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "45.00", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 261.16956000000005, "r": 324.98117, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "84-86", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 261.16956000000005, "r": 354.651, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "81-86", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 261.16956000000005, "r": 384.32083, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "88-93", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45187, "t": 261.16956000000005, "r": 418.16003, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "89-93", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 261.16956000000005, "r": 447.82986, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "87-92", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 261.16956000000005, "r": 477.50867, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "71-79", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 261.16956000000005, "r": 507.17849999999993, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "87-95", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 272.12854000000004, "r": 121.81633, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Title", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 182.035, "t": 272.12854000000004, "r": 198.71251, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "5071", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 272.12854000000004, "r": 233.69174000000004, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.47", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 272.12854000000004, "r": 264.50031, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.30", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 272.12854000000004, "r": 295.30887, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.50", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 272.12854000000004, "r": 324.98117, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "60-72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 272.12854000000004, "r": 354.651, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "24-63", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 272.12854000000004, "r": 384.32083, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "50-63", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.2825, "t": 272.12854000000004, "r": 418.16003, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "94-100", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 272.12854000000004, "r": 447.82986, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "82-96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 272.12854000000004, "r": 477.50867, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "68-79", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 272.12854000000004, "r": 507.17849999999993, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "24-56", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 283.48654, "r": 123.43028, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Total", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 169.52699, "t": 283.48654, "r": 198.71263, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "1107470", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 208.675, "t": 283.48654, "r": 233.69124999999997, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "941123", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 243.65291999999997, "t": 283.48654, "r": 264.49982, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "99816", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 274.46149, "t": 283.48654, "r": 295.30838, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "66531", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 283.48654, "r": 324.98117, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "82-83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 283.48654, "r": 354.651, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "71-74", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 283.48654, "r": 384.32083, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "79-81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45187, "t": 283.48654, "r": 418.16003, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "89-94", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 283.48654, "r": 447.82986, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "86-91", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 283.48654, "r": 477.50867, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "71-76", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 283.48654, "r": 507.17849999999993, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "68-85", "column_header": false, "row_header": false, "row_section": false}]}}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_header", "id": 10, "page_no": 3, "cluster": {"id": 10, "label": "page_header", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.7625049948692322, "cells": [{"id": 0, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 246.24382, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar", "bbox": {"l": 253.13897999999998, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "KDD '22, August 14-18, 2022, Washington, DC, USA Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar"}, {"label": "caption", "id": 8, "page_no": 3, "cluster": {"id": 8, "label": "caption", "bbox": {"l": 53.501999, "t": 84.95495999999991, "r": 558.48969, "b": 115.34618999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.8906616568565369, "cells": [{"id": 2, "text": "Table 1: DocLayNet dataset overview. Along with the frequency of each class label, we present the relative occurrence (as %", "bbox": {"l": 53.501999, "t": 84.95495999999991, "r": 558.48969, "b": 93.42822000000001, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "of row \u201cTotal\u201d) in the train, test and validation sets. The inter-annotator agreement is computed as the mAP@0.5-0.95 metric", "bbox": {"l": 53.79800000000001, "t": 95.91394000000003, "r": 558.20294, "b": 104.3872100000001, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "between pairwise annotations from the triple-annotated pages, from which we obtain accuracy ranges.", "bbox": {"l": 53.79800000000001, "t": 106.87292000000002, "r": 469.84805000000006, "b": 115.34618999999998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 1: DocLayNet dataset overview. Along with the frequency of each class label, we present the relative occurrence (as % of row \"Total\") in the train, test and validation sets. The inter-annotator agreement is computed as the mAP@0.5-0.95 metric between pairwise annotations from the triple-annotated pages, from which we obtain accuracy ranges."}, {"label": "table", "id": 1, "page_no": 3, "cluster": {"id": 1, "label": "table", "bbox": {"l": 98.93103790283203, "t": 137.47547912597656, "r": 512.579833984375, "b": 294.08148193359375, "coord_origin": "TOPLEFT"}, "confidence": 0.9860090613365173, "cells": [{"id": 5, "text": "% of Total", "bbox": {"l": 233.94400000000002, "t": 140.22351000000003, "r": 270.04272, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "triple inter-annotator mAP @ 0.5-0.95 (%)", "bbox": {"l": 329.04999, "t": 140.22351000000003, "r": 483.3976400000001, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "class label", "bbox": {"l": 104.825, "t": 151.18255999999997, "r": 141.71277, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Count", "bbox": {"l": 175.94701, "t": 151.18255999999997, "r": 198.71269, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Train", "bbox": {"l": 213.795, "t": 151.18255999999997, "r": 233.69144, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Test", "bbox": {"l": 249.37367, "t": 151.18255999999997, "r": 264.5, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Val", "bbox": {"l": 283.53568, "t": 151.18255999999997, "r": 295.30856, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "All", "bbox": {"l": 314.01501, "t": 151.18255999999997, "r": 324.98093, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Fin", "bbox": {"l": 343.01236, "t": 151.18255999999997, "r": 354.65076, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Man", "bbox": {"l": 367.84033, "t": 151.18255999999997, "r": 384.32059, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Sci", "bbox": {"l": 407.54358, "t": 151.18255999999997, "r": 418.15979, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Law", "bbox": {"l": 432.29979999999995, "t": 151.18255999999997, "r": 447.82962, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "Pat", "bbox": {"l": 465.72656, "t": 151.18255999999997, "r": 477.50842, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Ten", "bbox": {"l": 493.52240000000006, "t": 151.18255999999997, "r": 507.17822, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Caption", "bbox": {"l": 104.825, "t": 162.53954999999996, "r": 134.01064, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "22524", "bbox": {"l": 177.866, "t": 162.53954999999996, "r": 198.71288, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "2.04", "bbox": {"l": 219.211, "t": 162.53954999999996, "r": 233.69174000000004, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "1.77", "bbox": {"l": 250.01956, "t": 162.53954999999996, "r": 264.50031, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "2.32", "bbox": {"l": 280.82812, "t": 162.53954999999996, "r": 295.30887, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "84-89", "bbox": {"l": 305.27301, "t": 162.53954999999996, "r": 324.98117, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "40-61", "bbox": {"l": 334.94284, "t": 162.53954999999996, "r": 354.651, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "86-92", "bbox": {"l": 364.61267, "t": 162.53954999999996, "r": 384.32083, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "94-99", "bbox": {"l": 398.45187, "t": 162.53954999999996, "r": 418.16003, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "95-99", "bbox": {"l": 428.1217, "t": 162.53954999999996, "r": 447.82986, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "69-78", "bbox": {"l": 457.80051, "t": 162.53954999999996, "r": 477.50867, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "n/a", "bbox": {"l": 495.32489, "t": 162.53954999999996, "r": 507.17846999999995, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Footnote", "bbox": {"l": 104.825, "t": 173.49854000000005, "r": 137.3282, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "6318", "bbox": {"l": 182.035, "t": 173.49854000000005, "r": 198.71251, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "0.60", "bbox": {"l": 219.211, "t": 173.49854000000005, "r": 233.69174000000004, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "0.31", "bbox": {"l": 250.01956, "t": 173.49854000000005, "r": 264.50031, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "0.58", "bbox": {"l": 280.82812, "t": 173.49854000000005, "r": 295.30887, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "83-91", "bbox": {"l": 305.27301, "t": 173.49854000000005, "r": 324.98117, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "n/a", "bbox": {"l": 342.79739, "t": 173.49854000000005, "r": 354.65097, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "100", "bbox": {"l": 371.81265, "t": 173.49854000000005, "r": 384.32077, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "62-88", "bbox": {"l": 398.45181, "t": 173.49854000000005, "r": 418.15997, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "85-94", "bbox": {"l": 428.12164, "t": 173.49854000000005, "r": 447.8298, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "n/a", "bbox": {"l": 465.655, "t": 173.49854000000005, "r": 477.50857999999994, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "82-97", "bbox": {"l": 487.47025, "t": 173.49854000000005, "r": 507.17841, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Formula", "bbox": {"l": 104.825, "t": 184.45752000000005, "r": 135.33766, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "25027", "bbox": {"l": 177.866, "t": 184.45752000000005, "r": 198.71288, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "2.25", "bbox": {"l": 219.211, "t": 184.45752000000005, "r": 233.69174000000004, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "1.90", "bbox": {"l": 250.01956, "t": 184.45752000000005, "r": 264.50031, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "2.96", "bbox": {"l": 280.82812, "t": 184.45752000000005, "r": 295.30887, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "83-85", "bbox": {"l": 305.27301, "t": 184.45752000000005, "r": 324.98117, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "n/a", "bbox": {"l": 342.79739, "t": 184.45752000000005, "r": 354.65097, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "n/a", "bbox": {"l": 372.46719, "t": 184.45752000000005, "r": 384.32077, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "84-87", "bbox": {"l": 398.45181, "t": 184.45752000000005, "r": 418.15997, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "86-96", "bbox": {"l": 428.12164, "t": 184.45752000000005, "r": 447.8298, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "n/a", "bbox": {"l": 465.655, "t": 184.45752000000005, "r": 477.50857999999994, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "n/a", "bbox": {"l": 495.3248, "t": 184.45752000000005, "r": 507.17838000000006, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "List-item", "bbox": {"l": 104.825, "t": 195.41656, "r": 137.70479, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "185660", "bbox": {"l": 173.69701, "t": 195.41656, "r": 198.71326, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "17.19", "bbox": {"l": 215.04201, "t": 195.41656, "r": 233.69212, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "13.34", "bbox": {"l": 245.85056, "t": 195.41656, "r": 264.50067, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "15.82", "bbox": {"l": 276.65912, "t": 195.41656, "r": 295.30923, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "87-88", "bbox": {"l": 305.27301, "t": 195.41656, "r": 324.98117, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "74-83", "bbox": {"l": 334.94284, "t": 195.41656, "r": 354.651, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "90-92", "bbox": {"l": 364.61267, "t": 195.41656, "r": 384.32083, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "97-97", "bbox": {"l": 398.45187, "t": 195.41656, "r": 418.16003, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "81-85", "bbox": {"l": 428.1217, "t": 195.41656, "r": 447.82986, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "75-88", "bbox": {"l": 457.80051, "t": 195.41656, "r": 477.50867, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "93-95", "bbox": {"l": 487.47034, "t": 195.41656, "r": 507.17849999999993, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "Page-footer", "bbox": {"l": 104.825, "t": 206.37554999999998, "r": 147.35262, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "70878", "bbox": {"l": 177.866, "t": 206.37554999999998, "r": 198.71288, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "6.51", "bbox": {"l": 219.211, "t": 206.37554999999998, "r": 233.69174000000004, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "5.58", "bbox": {"l": 250.01956, "t": 206.37554999999998, "r": 264.50031, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "6.00", "bbox": {"l": 280.82812, "t": 206.37554999999998, "r": 295.30887, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "93-94", "bbox": {"l": 305.27301, "t": 206.37554999999998, "r": 324.98117, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "88-90", "bbox": {"l": 334.94284, "t": 206.37554999999998, "r": 354.651, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "95-96", "bbox": {"l": 364.61267, "t": 206.37554999999998, "r": 384.32083, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "100", "bbox": {"l": 405.65189, "t": 206.37554999999998, "r": 418.16, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "92-97", "bbox": {"l": 428.12167, "t": 206.37554999999998, "r": 447.82983, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "100", "bbox": {"l": 465.00049, "t": 206.37554999999998, "r": 477.5086099999999, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "96-98", "bbox": {"l": 487.47028, "t": 206.37554999999998, "r": 507.17843999999997, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "Page-header", "bbox": {"l": 104.825, "t": 217.33452999999997, "r": 150.10532, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "58022", "bbox": {"l": 177.866, "t": 217.33452999999997, "r": 198.71288, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "5.10", "bbox": {"l": 219.211, "t": 217.33452999999997, "r": 233.69174000000004, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "6.70", "bbox": {"l": 250.01956, "t": 217.33452999999997, "r": 264.50031, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "5.06", "bbox": {"l": 280.82812, "t": 217.33452999999997, "r": 295.30887, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "85-89", "bbox": {"l": 305.27301, "t": 217.33452999999997, "r": 324.98117, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "66-76", "bbox": {"l": 334.94284, "t": 217.33452999999997, "r": 354.651, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "90-94", "bbox": {"l": 364.61267, "t": 217.33452999999997, "r": 384.32083, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "98-100", "bbox": {"l": 394.2825, "t": 217.33452999999997, "r": 418.16003, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "91-92", "bbox": {"l": 428.1217, "t": 217.33452999999997, "r": 447.82986, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "97-99", "bbox": {"l": 457.80051, "t": 217.33452999999997, "r": 477.50867, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "81-86", "bbox": {"l": 487.47034, "t": 217.33452999999997, "r": 507.17849999999993, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "Picture", "bbox": {"l": 104.825, "t": 228.29351999999994, "r": 130.80963, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "45976", "bbox": {"l": 177.866, "t": 228.29351999999994, "r": 198.71288, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "4.21", "bbox": {"l": 219.211, "t": 228.29351999999994, "r": 233.69174000000004, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "2.78", "bbox": {"l": 250.01956, "t": 228.29351999999994, "r": 264.50031, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "5.31", "bbox": {"l": 280.82812, "t": 228.29351999999994, "r": 295.30887, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "69-71", "bbox": {"l": 305.27301, "t": 228.29351999999994, "r": 324.98117, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "56-59", "bbox": {"l": 334.94284, "t": 228.29351999999994, "r": 354.651, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "82-86", "bbox": {"l": 364.61267, "t": 228.29351999999994, "r": 384.32083, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "69-82", "bbox": {"l": 398.45187, "t": 228.29351999999994, "r": 418.16003, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "80-95", "bbox": {"l": 428.1217, "t": 228.29351999999994, "r": 447.82986, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "66-71", "bbox": {"l": 457.80051, "t": 228.29351999999994, "r": 477.50867, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "59-76", "bbox": {"l": 487.47034, "t": 228.29351999999994, "r": 507.17849999999993, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "Section-header", "bbox": {"l": 104.825, "t": 239.25256000000002, "r": 159.56487, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "142884", "bbox": {"l": 173.69701, "t": 239.25256000000002, "r": 198.71326, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "12.60", "bbox": {"l": 215.04201, "t": 239.25256000000002, "r": 233.69212, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "15.77", "bbox": {"l": 245.85056, "t": 239.25256000000002, "r": 264.50067, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "12.85", "bbox": {"l": 276.65912, "t": 239.25256000000002, "r": 295.30923, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "83-84", "bbox": {"l": 305.27301, "t": 239.25256000000002, "r": 324.98117, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "76-81", "bbox": {"l": 334.94284, "t": 239.25256000000002, "r": 354.651, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "90-92", "bbox": {"l": 364.61267, "t": 239.25256000000002, "r": 384.32083, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "94-95", "bbox": {"l": 398.45187, "t": 239.25256000000002, "r": 418.16003, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "87-94", "bbox": {"l": 428.1217, "t": 239.25256000000002, "r": 447.82986, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "69-73", "bbox": {"l": 457.80051, "t": 239.25256000000002, "r": 477.50867, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "78-86", "bbox": {"l": 487.47034, "t": 239.25256000000002, "r": 507.17849999999993, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "Table", "bbox": {"l": 104.825, "t": 250.21155, "r": 124.63177, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "34733", "bbox": {"l": 177.866, "t": 250.21155, "r": 198.71288, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "3.20", "bbox": {"l": 219.211, "t": 250.21155, "r": 233.69174000000004, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "2.27", "bbox": {"l": 250.01956, "t": 250.21155, "r": 264.50031, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "3.60", "bbox": {"l": 280.82812, "t": 250.21155, "r": 295.30887, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "77-81", "bbox": {"l": 305.27301, "t": 250.21155, "r": 324.98117, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "75-80", "bbox": {"l": 334.94284, "t": 250.21155, "r": 354.651, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "83-86", "bbox": {"l": 364.61267, "t": 250.21155, "r": 384.32083, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "98-99", "bbox": {"l": 398.45187, "t": 250.21155, "r": 418.16003, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "58-80", "bbox": {"l": 428.1217, "t": 250.21155, "r": 447.82986, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "79-84", "bbox": {"l": 457.80051, "t": 250.21155, "r": 477.50867, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "70-85", "bbox": {"l": 487.47034, "t": 250.21155, "r": 507.17849999999993, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "Text", "bbox": {"l": 104.825, "t": 261.16956000000005, "r": 120.78519, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "510377", "bbox": {"l": 173.69701, "t": 261.16956000000005, "r": 198.71326, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "45.82", "bbox": {"l": 215.04201, "t": 261.16956000000005, "r": 233.69212, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "49.28", "bbox": {"l": 245.85056, "t": 261.16956000000005, "r": 264.50067, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "45.00", "bbox": {"l": 276.65912, "t": 261.16956000000005, "r": 295.30923, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "84-86", "bbox": {"l": 305.27301, "t": 261.16956000000005, "r": 324.98117, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "81-86", "bbox": {"l": 334.94284, "t": 261.16956000000005, "r": 354.651, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "88-93", "bbox": {"l": 364.61267, "t": 261.16956000000005, "r": 384.32083, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "89-93", "bbox": {"l": 398.45187, "t": 261.16956000000005, "r": 418.16003, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "87-92", "bbox": {"l": 428.1217, "t": 261.16956000000005, "r": 447.82986, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "71-79", "bbox": {"l": 457.80051, "t": 261.16956000000005, "r": 477.50867, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "87-95", "bbox": {"l": 487.47034, "t": 261.16956000000005, "r": 507.17849999999993, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "Title", "bbox": {"l": 104.825, "t": 272.12854000000004, "r": 121.81633, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "5071", "bbox": {"l": 182.035, "t": 272.12854000000004, "r": 198.71251, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "0.47", "bbox": {"l": 219.211, "t": 272.12854000000004, "r": 233.69174000000004, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "0.30", "bbox": {"l": 250.01956, "t": 272.12854000000004, "r": 264.50031, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "0.50", "bbox": {"l": 280.82812, "t": 272.12854000000004, "r": 295.30887, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "60-72", "bbox": {"l": 305.27301, "t": 272.12854000000004, "r": 324.98117, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "24-63", "bbox": {"l": 334.94284, "t": 272.12854000000004, "r": 354.651, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "50-63", "bbox": {"l": 364.61267, "t": 272.12854000000004, "r": 384.32083, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "94-100", "bbox": {"l": 394.2825, "t": 272.12854000000004, "r": 418.16003, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "82-96", "bbox": {"l": 428.1217, "t": 272.12854000000004, "r": 447.82986, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "68-79", "bbox": {"l": 457.80051, "t": 272.12854000000004, "r": 477.50867, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "24-56", "bbox": {"l": 487.47034, "t": 272.12854000000004, "r": 507.17849999999993, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "Total", "bbox": {"l": 104.825, "t": 283.48654, "r": 123.43028, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "1107470", "bbox": {"l": 169.52699, "t": 283.48654, "r": 198.71263, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "941123", "bbox": {"l": 208.675, "t": 283.48654, "r": 233.69124999999997, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "99816", "bbox": {"l": 243.65291999999997, "t": 283.48654, "r": 264.49982, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "66531", "bbox": {"l": 274.46149, "t": 283.48654, "r": 295.30838, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "82-83", "bbox": {"l": 305.27301, "t": 283.48654, "r": 324.98117, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "71-74", "bbox": {"l": 334.94284, "t": 283.48654, "r": 354.651, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "79-81", "bbox": {"l": 364.61267, "t": 283.48654, "r": 384.32083, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "89-94", "bbox": {"l": 398.45187, "t": 283.48654, "r": 418.16003, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "86-91", "bbox": {"l": 428.1217, "t": 283.48654, "r": 447.82986, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "71-76", "bbox": {"l": 457.80051, "t": 283.48654, "r": 477.50867, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "68-85", "bbox": {"l": 487.47034, "t": 283.48654, "r": 507.17849999999993, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": [{"id": 11, "label": "text", "bbox": {"l": 233.94400000000002, "t": 140.22351000000003, "r": 270.04272, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 5, "text": "% of Total", "bbox": {"l": 233.94400000000002, "t": 140.22351000000003, "r": 270.04272, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 329.04999, "t": 140.22351000000003, "r": 483.3976400000001, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": "triple inter-annotator mAP @ 0.5-0.95 (%)", "bbox": {"l": 329.04999, "t": 140.22351000000003, "r": 483.3976400000001, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 104.825, "t": 151.18255999999997, "r": 141.71277, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "class label", "bbox": {"l": 104.825, "t": 151.18255999999997, "r": 141.71277, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 175.94701, "t": 151.18255999999997, "r": 198.71269, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "Count", "bbox": {"l": 175.94701, "t": 151.18255999999997, "r": 198.71269, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 213.795, "t": 151.18255999999997, "r": 233.69144, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "Train", "bbox": {"l": 213.795, "t": 151.18255999999997, "r": 233.69144, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 249.37367, "t": 151.18255999999997, "r": 264.5, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "Test", "bbox": {"l": 249.37367, "t": 151.18255999999997, "r": 264.5, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 283.53568, "t": 151.18255999999997, "r": 295.30856, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "Val", "bbox": {"l": 283.53568, "t": 151.18255999999997, "r": 295.30856, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 314.01501, "t": 151.18255999999997, "r": 324.98093, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "All", "bbox": {"l": 314.01501, "t": 151.18255999999997, "r": 324.98093, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 343.01236, "t": 151.18255999999997, "r": 354.65076, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "Fin", "bbox": {"l": 343.01236, "t": 151.18255999999997, "r": 354.65076, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 367.84033, "t": 151.18255999999997, "r": 384.32059, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "Man", "bbox": {"l": 367.84033, "t": 151.18255999999997, "r": 384.32059, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 407.54358, "t": 151.18255999999997, "r": 418.15979, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "Sci", "bbox": {"l": 407.54358, "t": 151.18255999999997, "r": 418.15979, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 432.29979999999995, "t": 151.18255999999997, "r": 447.82962, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "Law", "bbox": {"l": 432.29979999999995, "t": 151.18255999999997, "r": 447.82962, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 465.72656, "t": 151.18255999999997, "r": 477.50842, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "Pat", "bbox": {"l": 465.72656, "t": 151.18255999999997, "r": 477.50842, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 493.52240000000006, "t": 151.18255999999997, "r": 507.17822, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "Ten", "bbox": {"l": 493.52240000000006, "t": 151.18255999999997, "r": 507.17822, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 104.825, "t": 162.53954999999996, "r": 134.01064, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "Caption", "bbox": {"l": 104.825, "t": 162.53954999999996, "r": 134.01064, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 177.866, "t": 162.53954999999996, "r": 198.71288, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "22524", "bbox": {"l": 177.866, "t": 162.53954999999996, "r": 198.71288, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 219.211, "t": 162.53954999999996, "r": 233.69174000000004, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "2.04", "bbox": {"l": 219.211, "t": 162.53954999999996, "r": 233.69174000000004, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 250.01956, "t": 162.53954999999996, "r": 264.50031, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "1.77", "bbox": {"l": 250.01956, "t": 162.53954999999996, "r": 264.50031, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 280.82812, "t": 162.53954999999996, "r": 295.30887, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "2.32", "bbox": {"l": 280.82812, "t": 162.53954999999996, "r": 295.30887, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 305.27301, "t": 162.53954999999996, "r": 324.98117, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "84-89", "bbox": {"l": 305.27301, "t": 162.53954999999996, "r": 324.98117, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 334.94284, "t": 162.53954999999996, "r": 354.651, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "40-61", "bbox": {"l": 334.94284, "t": 162.53954999999996, "r": 354.651, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 364.61267, "t": 162.53954999999996, "r": 384.32083, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "86-92", "bbox": {"l": 364.61267, "t": 162.53954999999996, "r": 384.32083, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 398.45187, "t": 162.53954999999996, "r": 418.16003, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "94-99", "bbox": {"l": 398.45187, "t": 162.53954999999996, "r": 418.16003, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 428.1217, "t": 162.53954999999996, "r": 447.82986, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "95-99", "bbox": {"l": 428.1217, "t": 162.53954999999996, "r": 447.82986, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 457.80051, "t": 162.53954999999996, "r": 477.50867, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "69-78", "bbox": {"l": 457.80051, "t": 162.53954999999996, "r": 477.50867, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 495.32489, "t": 162.53954999999996, "r": 507.17846999999995, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "n/a", "bbox": {"l": 495.32489, "t": 162.53954999999996, "r": 507.17846999999995, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 104.825, "t": 173.49854000000005, "r": 137.3282, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "Footnote", "bbox": {"l": 104.825, "t": 173.49854000000005, "r": 137.3282, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 182.035, "t": 173.49854000000005, "r": 198.71251, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "6318", "bbox": {"l": 182.035, "t": 173.49854000000005, "r": 198.71251, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 219.211, "t": 173.49854000000005, "r": 233.69174000000004, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "0.60", "bbox": {"l": 219.211, "t": 173.49854000000005, "r": 233.69174000000004, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 250.01956, "t": 173.49854000000005, "r": 264.50031, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "0.31", "bbox": {"l": 250.01956, "t": 173.49854000000005, "r": 264.50031, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 280.82812, "t": 173.49854000000005, "r": 295.30887, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "0.58", "bbox": {"l": 280.82812, "t": 173.49854000000005, "r": 295.30887, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 305.27301, "t": 173.49854000000005, "r": 324.98117, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "83-91", "bbox": {"l": 305.27301, "t": 173.49854000000005, "r": 324.98117, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 342.79739, "t": 173.49854000000005, "r": 354.65097, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "n/a", "bbox": {"l": 342.79739, "t": 173.49854000000005, "r": 354.65097, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 371.81265, "t": 173.49854000000005, "r": 384.32077, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "100", "bbox": {"l": 371.81265, "t": 173.49854000000005, "r": 384.32077, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 398.45181, "t": 173.49854000000005, "r": 418.15997, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "62-88", "bbox": {"l": 398.45181, "t": 173.49854000000005, "r": 418.15997, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 428.12164, "t": 173.49854000000005, "r": 447.8298, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "85-94", "bbox": {"l": 428.12164, "t": 173.49854000000005, "r": 447.8298, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 465.655, "t": 173.49854000000005, "r": 477.50857999999994, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "n/a", "bbox": {"l": 465.655, "t": 173.49854000000005, "r": 477.50857999999994, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 487.47025, "t": 173.49854000000005, "r": 507.17841, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "82-97", "bbox": {"l": 487.47025, "t": 173.49854000000005, "r": 507.17841, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 104.825, "t": 184.45752000000005, "r": 135.33766, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "Formula", "bbox": {"l": 104.825, "t": 184.45752000000005, "r": 135.33766, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 177.866, "t": 184.45752000000005, "r": 198.71288, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "25027", "bbox": {"l": 177.866, "t": 184.45752000000005, "r": 198.71288, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 219.211, "t": 184.45752000000005, "r": 233.69174000000004, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "2.25", "bbox": {"l": 219.211, "t": 184.45752000000005, "r": 233.69174000000004, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 250.01956, "t": 184.45752000000005, "r": 264.50031, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "1.90", "bbox": {"l": 250.01956, "t": 184.45752000000005, "r": 264.50031, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 280.82812, "t": 184.45752000000005, "r": 295.30887, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "2.96", "bbox": {"l": 280.82812, "t": 184.45752000000005, "r": 295.30887, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 305.27301, "t": 184.45752000000005, "r": 324.98117, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "83-85", "bbox": {"l": 305.27301, "t": 184.45752000000005, "r": 324.98117, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 342.79739, "t": 184.45752000000005, "r": 354.65097, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "n/a", "bbox": {"l": 342.79739, "t": 184.45752000000005, "r": 354.65097, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 372.46719, "t": 184.45752000000005, "r": 384.32077, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "n/a", "bbox": {"l": 372.46719, "t": 184.45752000000005, "r": 384.32077, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 398.45181, "t": 184.45752000000005, "r": 418.15997, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "84-87", "bbox": {"l": 398.45181, "t": 184.45752000000005, "r": 418.15997, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 428.12164, "t": 184.45752000000005, "r": 447.8298, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "86-96", "bbox": {"l": 428.12164, "t": 184.45752000000005, "r": 447.8298, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 465.655, "t": 184.45752000000005, "r": 477.50857999999994, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "n/a", "bbox": {"l": 465.655, "t": 184.45752000000005, "r": 477.50857999999994, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 495.3248, "t": 184.45752000000005, "r": 507.17838000000006, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "n/a", "bbox": {"l": 495.3248, "t": 184.45752000000005, "r": 507.17838000000006, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 104.825, "t": 195.41656, "r": 137.70479, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "List-item", "bbox": {"l": 104.825, "t": 195.41656, "r": 137.70479, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 173.69701, "t": 195.41656, "r": 198.71326, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "185660", "bbox": {"l": 173.69701, "t": 195.41656, "r": 198.71326, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 215.04201, "t": 195.41656, "r": 233.69212, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "17.19", "bbox": {"l": 215.04201, "t": 195.41656, "r": 233.69212, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 245.85056, "t": 195.41656, "r": 264.50067, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "13.34", "bbox": {"l": 245.85056, "t": 195.41656, "r": 264.50067, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 276.65912, "t": 195.41656, "r": 295.30923, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "15.82", "bbox": {"l": 276.65912, "t": 195.41656, "r": 295.30923, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 305.27301, "t": 195.41656, "r": 324.98117, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "87-88", "bbox": {"l": 305.27301, "t": 195.41656, "r": 324.98117, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 334.94284, "t": 195.41656, "r": 354.651, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "74-83", "bbox": {"l": 334.94284, "t": 195.41656, "r": 354.651, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 364.61267, "t": 195.41656, "r": 384.32083, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "90-92", "bbox": {"l": 364.61267, "t": 195.41656, "r": 384.32083, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 398.45187, "t": 195.41656, "r": 418.16003, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "97-97", "bbox": {"l": 398.45187, "t": 195.41656, "r": 418.16003, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 428.1217, "t": 195.41656, "r": 447.82986, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "81-85", "bbox": {"l": 428.1217, "t": 195.41656, "r": 447.82986, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 457.80051, "t": 195.41656, "r": 477.50867, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "75-88", "bbox": {"l": 457.80051, "t": 195.41656, "r": 477.50867, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 487.47034, "t": 195.41656, "r": 507.17849999999993, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "93-95", "bbox": {"l": 487.47034, "t": 195.41656, "r": 507.17849999999993, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 104.825, "t": 206.37554999999998, "r": 147.35262, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "Page-footer", "bbox": {"l": 104.825, "t": 206.37554999999998, "r": 147.35262, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 177.866, "t": 206.37554999999998, "r": 198.71288, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "70878", "bbox": {"l": 177.866, "t": 206.37554999999998, "r": 198.71288, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 219.211, "t": 206.37554999999998, "r": 233.69174000000004, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "6.51", "bbox": {"l": 219.211, "t": 206.37554999999998, "r": 233.69174000000004, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 250.01956, "t": 206.37554999999998, "r": 264.50031, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "5.58", "bbox": {"l": 250.01956, "t": 206.37554999999998, "r": 264.50031, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 280.82812, "t": 206.37554999999998, "r": 295.30887, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "6.00", "bbox": {"l": 280.82812, "t": 206.37554999999998, "r": 295.30887, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 305.27301, "t": 206.37554999999998, "r": 324.98117, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "93-94", "bbox": {"l": 305.27301, "t": 206.37554999999998, "r": 324.98117, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 334.94284, "t": 206.37554999999998, "r": 354.651, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "88-90", "bbox": {"l": 334.94284, "t": 206.37554999999998, "r": 354.651, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 364.61267, "t": 206.37554999999998, "r": 384.32083, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "95-96", "bbox": {"l": 364.61267, "t": 206.37554999999998, "r": 384.32083, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 405.65189, "t": 206.37554999999998, "r": 418.16, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "100", "bbox": {"l": 405.65189, "t": 206.37554999999998, "r": 418.16, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 428.12167, "t": 206.37554999999998, "r": 447.82983, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "92-97", "bbox": {"l": 428.12167, "t": 206.37554999999998, "r": 447.82983, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 465.00049, "t": 206.37554999999998, "r": 477.5086099999999, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "100", "bbox": {"l": 465.00049, "t": 206.37554999999998, "r": 477.5086099999999, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 487.47028, "t": 206.37554999999998, "r": 507.17843999999997, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "96-98", "bbox": {"l": 487.47028, "t": 206.37554999999998, "r": 507.17843999999997, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 104.825, "t": 217.33452999999997, "r": 150.10532, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "Page-header", "bbox": {"l": 104.825, "t": 217.33452999999997, "r": 150.10532, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 177.866, "t": 217.33452999999997, "r": 198.71288, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "58022", "bbox": {"l": 177.866, "t": 217.33452999999997, "r": 198.71288, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 219.211, "t": 217.33452999999997, "r": 233.69174000000004, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "5.10", "bbox": {"l": 219.211, "t": 217.33452999999997, "r": 233.69174000000004, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 250.01956, "t": 217.33452999999997, "r": 264.50031, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "6.70", "bbox": {"l": 250.01956, "t": 217.33452999999997, "r": 264.50031, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 280.82812, "t": 217.33452999999997, "r": 295.30887, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "5.06", "bbox": {"l": 280.82812, "t": 217.33452999999997, "r": 295.30887, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 305.27301, "t": 217.33452999999997, "r": 324.98117, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "85-89", "bbox": {"l": 305.27301, "t": 217.33452999999997, "r": 324.98117, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 334.94284, "t": 217.33452999999997, "r": 354.651, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "66-76", "bbox": {"l": 334.94284, "t": 217.33452999999997, "r": 354.651, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 364.61267, "t": 217.33452999999997, "r": 384.32083, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "90-94", "bbox": {"l": 364.61267, "t": 217.33452999999997, "r": 384.32083, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 394.2825, "t": 217.33452999999997, "r": 418.16003, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "98-100", "bbox": {"l": 394.2825, "t": 217.33452999999997, "r": 418.16003, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 428.1217, "t": 217.33452999999997, "r": 447.82986, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "91-92", "bbox": {"l": 428.1217, "t": 217.33452999999997, "r": 447.82986, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 457.80051, "t": 217.33452999999997, "r": 477.50867, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "97-99", "bbox": {"l": 457.80051, "t": 217.33452999999997, "r": 477.50867, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 487.47034, "t": 217.33452999999997, "r": 507.17849999999993, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "81-86", "bbox": {"l": 487.47034, "t": 217.33452999999997, "r": 507.17849999999993, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 104.825, "t": 228.29351999999994, "r": 130.80963, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "Picture", "bbox": {"l": 104.825, "t": 228.29351999999994, "r": 130.80963, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 177.866, "t": 228.29351999999994, "r": 198.71288, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "45976", "bbox": {"l": 177.866, "t": 228.29351999999994, "r": 198.71288, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 219.211, "t": 228.29351999999994, "r": 233.69174000000004, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "4.21", "bbox": {"l": 219.211, "t": 228.29351999999994, "r": 233.69174000000004, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 250.01956, "t": 228.29351999999994, "r": 264.50031, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "2.78", "bbox": {"l": 250.01956, "t": 228.29351999999994, "r": 264.50031, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 280.82812, "t": 228.29351999999994, "r": 295.30887, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "5.31", "bbox": {"l": 280.82812, "t": 228.29351999999994, "r": 295.30887, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 305.27301, "t": 228.29351999999994, "r": 324.98117, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "69-71", "bbox": {"l": 305.27301, "t": 228.29351999999994, "r": 324.98117, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 334.94284, "t": 228.29351999999994, "r": 354.651, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "56-59", "bbox": {"l": 334.94284, "t": 228.29351999999994, "r": 354.651, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 364.61267, "t": 228.29351999999994, "r": 384.32083, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "82-86", "bbox": {"l": 364.61267, "t": 228.29351999999994, "r": 384.32083, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 398.45187, "t": 228.29351999999994, "r": 418.16003, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "69-82", "bbox": {"l": 398.45187, "t": 228.29351999999994, "r": 418.16003, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 428.1217, "t": 228.29351999999994, "r": 447.82986, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "80-95", "bbox": {"l": 428.1217, "t": 228.29351999999994, "r": 447.82986, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 457.80051, "t": 228.29351999999994, "r": 477.50867, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "66-71", "bbox": {"l": 457.80051, "t": 228.29351999999994, "r": 477.50867, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 487.47034, "t": 228.29351999999994, "r": 507.17849999999993, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "59-76", "bbox": {"l": 487.47034, "t": 228.29351999999994, "r": 507.17849999999993, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 104.825, "t": 239.25256000000002, "r": 159.56487, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": "Section-header", "bbox": {"l": 104.825, "t": 239.25256000000002, "r": 159.56487, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 173.69701, "t": 239.25256000000002, "r": 198.71326, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "142884", "bbox": {"l": 173.69701, "t": 239.25256000000002, "r": 198.71326, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 215.04201, "t": 239.25256000000002, "r": 233.69212, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "12.60", "bbox": {"l": 215.04201, "t": 239.25256000000002, "r": 233.69212, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 245.85056, "t": 239.25256000000002, "r": 264.50067, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": "15.77", "bbox": {"l": 245.85056, "t": 239.25256000000002, "r": 264.50067, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 276.65912, "t": 239.25256000000002, "r": 295.30923, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 107, "text": "12.85", "bbox": {"l": 276.65912, "t": 239.25256000000002, "r": 295.30923, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 114, "label": "text", "bbox": {"l": 305.27301, "t": 239.25256000000002, "r": 324.98117, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 108, "text": "83-84", "bbox": {"l": 305.27301, "t": 239.25256000000002, "r": 324.98117, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 115, "label": "text", "bbox": {"l": 334.94284, "t": 239.25256000000002, "r": 354.651, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 109, "text": "76-81", "bbox": {"l": 334.94284, "t": 239.25256000000002, "r": 354.651, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 116, "label": "text", "bbox": {"l": 364.61267, "t": 239.25256000000002, "r": 384.32083, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 110, "text": "90-92", "bbox": {"l": 364.61267, "t": 239.25256000000002, "r": 384.32083, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 117, "label": "text", "bbox": {"l": 398.45187, "t": 239.25256000000002, "r": 418.16003, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 111, "text": "94-95", "bbox": {"l": 398.45187, "t": 239.25256000000002, "r": 418.16003, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 118, "label": "text", "bbox": {"l": 428.1217, "t": 239.25256000000002, "r": 447.82986, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 112, "text": "87-94", "bbox": {"l": 428.1217, "t": 239.25256000000002, "r": 447.82986, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 119, "label": "text", "bbox": {"l": 457.80051, "t": 239.25256000000002, "r": 477.50867, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 113, "text": "69-73", "bbox": {"l": 457.80051, "t": 239.25256000000002, "r": 477.50867, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 120, "label": "text", "bbox": {"l": 487.47034, "t": 239.25256000000002, "r": 507.17849999999993, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 114, "text": "78-86", "bbox": {"l": 487.47034, "t": 239.25256000000002, "r": 507.17849999999993, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 121, "label": "text", "bbox": {"l": 104.825, "t": 250.21155, "r": 124.63177, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 115, "text": "Table", "bbox": {"l": 104.825, "t": 250.21155, "r": 124.63177, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 122, "label": "text", "bbox": {"l": 177.866, "t": 250.21155, "r": 198.71288, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 116, "text": "34733", "bbox": {"l": 177.866, "t": 250.21155, "r": 198.71288, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 123, "label": "text", "bbox": {"l": 219.211, "t": 250.21155, "r": 233.69174000000004, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 117, "text": "3.20", "bbox": {"l": 219.211, "t": 250.21155, "r": 233.69174000000004, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 124, "label": "text", "bbox": {"l": 250.01956, "t": 250.21155, "r": 264.50031, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 118, "text": "2.27", "bbox": {"l": 250.01956, "t": 250.21155, "r": 264.50031, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 125, "label": "text", "bbox": {"l": 280.82812, "t": 250.21155, "r": 295.30887, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 119, "text": "3.60", "bbox": {"l": 280.82812, "t": 250.21155, "r": 295.30887, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 126, "label": "text", "bbox": {"l": 305.27301, "t": 250.21155, "r": 324.98117, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 120, "text": "77-81", "bbox": {"l": 305.27301, "t": 250.21155, "r": 324.98117, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 127, "label": "text", "bbox": {"l": 334.94284, "t": 250.21155, "r": 354.651, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 121, "text": "75-80", "bbox": {"l": 334.94284, "t": 250.21155, "r": 354.651, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 128, "label": "text", "bbox": {"l": 364.61267, "t": 250.21155, "r": 384.32083, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 122, "text": "83-86", "bbox": {"l": 364.61267, "t": 250.21155, "r": 384.32083, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 129, "label": "text", "bbox": {"l": 398.45187, "t": 250.21155, "r": 418.16003, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 123, "text": "98-99", "bbox": {"l": 398.45187, "t": 250.21155, "r": 418.16003, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 130, "label": "text", "bbox": {"l": 428.1217, "t": 250.21155, "r": 447.82986, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 124, "text": "58-80", "bbox": {"l": 428.1217, "t": 250.21155, "r": 447.82986, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 131, "label": "text", "bbox": {"l": 457.80051, "t": 250.21155, "r": 477.50867, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 125, "text": "79-84", "bbox": {"l": 457.80051, "t": 250.21155, "r": 477.50867, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 132, "label": "text", "bbox": {"l": 487.47034, "t": 250.21155, "r": 507.17849999999993, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 126, "text": "70-85", "bbox": {"l": 487.47034, "t": 250.21155, "r": 507.17849999999993, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 133, "label": "text", "bbox": {"l": 104.825, "t": 261.16956000000005, "r": 120.78519, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 127, "text": "Text", "bbox": {"l": 104.825, "t": 261.16956000000005, "r": 120.78519, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 134, "label": "text", "bbox": {"l": 173.69701, "t": 261.16956000000005, "r": 198.71326, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 128, "text": "510377", "bbox": {"l": 173.69701, "t": 261.16956000000005, "r": 198.71326, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 135, "label": "text", "bbox": {"l": 215.04201, "t": 261.16956000000005, "r": 233.69212, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 129, "text": "45.82", "bbox": {"l": 215.04201, "t": 261.16956000000005, "r": 233.69212, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 136, "label": "text", "bbox": {"l": 245.85056, "t": 261.16956000000005, "r": 264.50067, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 130, "text": "49.28", "bbox": {"l": 245.85056, "t": 261.16956000000005, "r": 264.50067, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 137, "label": "text", "bbox": {"l": 276.65912, "t": 261.16956000000005, "r": 295.30923, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 131, "text": "45.00", "bbox": {"l": 276.65912, "t": 261.16956000000005, "r": 295.30923, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 138, "label": "text", "bbox": {"l": 305.27301, "t": 261.16956000000005, "r": 324.98117, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 132, "text": "84-86", "bbox": {"l": 305.27301, "t": 261.16956000000005, "r": 324.98117, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 139, "label": "text", "bbox": {"l": 334.94284, "t": 261.16956000000005, "r": 354.651, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 133, "text": "81-86", "bbox": {"l": 334.94284, "t": 261.16956000000005, "r": 354.651, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 140, "label": "text", "bbox": {"l": 364.61267, "t": 261.16956000000005, "r": 384.32083, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 134, "text": "88-93", "bbox": {"l": 364.61267, "t": 261.16956000000005, "r": 384.32083, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 141, "label": "text", "bbox": {"l": 398.45187, "t": 261.16956000000005, "r": 418.16003, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 135, "text": "89-93", "bbox": {"l": 398.45187, "t": 261.16956000000005, "r": 418.16003, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 142, "label": "text", "bbox": {"l": 428.1217, "t": 261.16956000000005, "r": 447.82986, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 136, "text": "87-92", "bbox": {"l": 428.1217, "t": 261.16956000000005, "r": 447.82986, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 143, "label": "text", "bbox": {"l": 457.80051, "t": 261.16956000000005, "r": 477.50867, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 137, "text": "71-79", "bbox": {"l": 457.80051, "t": 261.16956000000005, "r": 477.50867, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 144, "label": "text", "bbox": {"l": 487.47034, "t": 261.16956000000005, "r": 507.17849999999993, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 138, "text": "87-95", "bbox": {"l": 487.47034, "t": 261.16956000000005, "r": 507.17849999999993, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 145, "label": "text", "bbox": {"l": 104.825, "t": 272.12854000000004, "r": 121.81633, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 139, "text": "Title", "bbox": {"l": 104.825, "t": 272.12854000000004, "r": 121.81633, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 146, "label": "text", "bbox": {"l": 182.035, "t": 272.12854000000004, "r": 198.71251, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 140, "text": "5071", "bbox": {"l": 182.035, "t": 272.12854000000004, "r": 198.71251, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 147, "label": "text", "bbox": {"l": 219.211, "t": 272.12854000000004, "r": 233.69174000000004, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 141, "text": "0.47", "bbox": {"l": 219.211, "t": 272.12854000000004, "r": 233.69174000000004, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 148, "label": "text", "bbox": {"l": 250.01956, "t": 272.12854000000004, "r": 264.50031, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 142, "text": "0.30", "bbox": {"l": 250.01956, "t": 272.12854000000004, "r": 264.50031, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 149, "label": "text", "bbox": {"l": 280.82812, "t": 272.12854000000004, "r": 295.30887, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 143, "text": "0.50", "bbox": {"l": 280.82812, "t": 272.12854000000004, "r": 295.30887, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 150, "label": "text", "bbox": {"l": 305.27301, "t": 272.12854000000004, "r": 324.98117, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 144, "text": "60-72", "bbox": {"l": 305.27301, "t": 272.12854000000004, "r": 324.98117, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 151, "label": "text", "bbox": {"l": 334.94284, "t": 272.12854000000004, "r": 354.651, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 145, "text": "24-63", "bbox": {"l": 334.94284, "t": 272.12854000000004, "r": 354.651, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 152, "label": "text", "bbox": {"l": 364.61267, "t": 272.12854000000004, "r": 384.32083, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 146, "text": "50-63", "bbox": {"l": 364.61267, "t": 272.12854000000004, "r": 384.32083, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 153, "label": "text", "bbox": {"l": 394.2825, "t": 272.12854000000004, "r": 418.16003, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 147, "text": "94-100", "bbox": {"l": 394.2825, "t": 272.12854000000004, "r": 418.16003, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 154, "label": "text", "bbox": {"l": 428.1217, "t": 272.12854000000004, "r": 447.82986, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 148, "text": "82-96", "bbox": {"l": 428.1217, "t": 272.12854000000004, "r": 447.82986, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 155, "label": "text", "bbox": {"l": 457.80051, "t": 272.12854000000004, "r": 477.50867, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 149, "text": "68-79", "bbox": {"l": 457.80051, "t": 272.12854000000004, "r": 477.50867, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 156, "label": "text", "bbox": {"l": 487.47034, "t": 272.12854000000004, "r": 507.17849999999993, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 150, "text": "24-56", "bbox": {"l": 487.47034, "t": 272.12854000000004, "r": 507.17849999999993, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 157, "label": "text", "bbox": {"l": 104.825, "t": 283.48654, "r": 123.43028, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 151, "text": "Total", "bbox": {"l": 104.825, "t": 283.48654, "r": 123.43028, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 158, "label": "text", "bbox": {"l": 169.52699, "t": 283.48654, "r": 198.71263, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 152, "text": "1107470", "bbox": {"l": 169.52699, "t": 283.48654, "r": 198.71263, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 159, "label": "text", "bbox": {"l": 208.675, "t": 283.48654, "r": 233.69124999999997, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 153, "text": "941123", "bbox": {"l": 208.675, "t": 283.48654, "r": 233.69124999999997, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 160, "label": "text", "bbox": {"l": 243.65291999999997, "t": 283.48654, "r": 264.49982, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 154, "text": "99816", "bbox": {"l": 243.65291999999997, "t": 283.48654, "r": 264.49982, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 161, "label": "text", "bbox": {"l": 274.46149, "t": 283.48654, "r": 295.30838, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 155, "text": "66531", "bbox": {"l": 274.46149, "t": 283.48654, "r": 295.30838, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 162, "label": "text", "bbox": {"l": 305.27301, "t": 283.48654, "r": 324.98117, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 156, "text": "82-83", "bbox": {"l": 305.27301, "t": 283.48654, "r": 324.98117, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 163, "label": "text", "bbox": {"l": 334.94284, "t": 283.48654, "r": 354.651, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 157, "text": "71-74", "bbox": {"l": 334.94284, "t": 283.48654, "r": 354.651, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 164, "label": "text", "bbox": {"l": 364.61267, "t": 283.48654, "r": 384.32083, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 158, "text": "79-81", "bbox": {"l": 364.61267, "t": 283.48654, "r": 384.32083, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 165, "label": "text", "bbox": {"l": 398.45187, "t": 283.48654, "r": 418.16003, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 159, "text": "89-94", "bbox": {"l": 398.45187, "t": 283.48654, "r": 418.16003, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 166, "label": "text", "bbox": {"l": 428.1217, "t": 283.48654, "r": 447.82986, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 160, "text": "86-91", "bbox": {"l": 428.1217, "t": 283.48654, "r": 447.82986, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 167, "label": "text", "bbox": {"l": 457.80051, "t": 283.48654, "r": 477.50867, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 161, "text": "71-76", "bbox": {"l": 457.80051, "t": 283.48654, "r": 477.50867, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 168, "label": "text", "bbox": {"l": 487.47034, "t": 283.48654, "r": 507.17849999999993, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 162, "text": "68-85", "bbox": {"l": 487.47034, "t": 283.48654, "r": 507.17849999999993, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "lcel", "lcel", "lcel", "ched", "lcel", "lcel", "lcel", "lcel", "lcel", "nl", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 14, "num_cols": 12, "table_cells": [{"bbox": {"l": 233.94400000000002, "t": 140.22351000000003, "r": 270.04272, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 4, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 6, "text": "% of Total", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 329.04999, "t": 140.22351000000003, "r": 483.3976400000001, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 6, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 6, "end_col_offset_idx": 12, "text": "triple inter-annotator mAP @ 0.5-0.95 (%)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 151.18255999999997, "r": 141.71277, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "class label", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 175.94701, "t": 151.18255999999997, "r": 198.71269, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Count", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 213.795, "t": 151.18255999999997, "r": 233.69144, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Train", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 249.37367, "t": 151.18255999999997, "r": 264.5, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Test", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 283.53568, "t": 151.18255999999997, "r": 295.30856, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Val", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 314.01501, "t": 151.18255999999997, "r": 324.98093, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "All", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 343.01236, "t": 151.18255999999997, "r": 354.65076, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "Fin", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 367.84033, "t": 151.18255999999997, "r": 384.32059, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "Man", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 407.54358, "t": 151.18255999999997, "r": 418.15979, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "Sci", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 432.29979999999995, "t": 151.18255999999997, "r": 447.82962, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "Law", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 465.72656, "t": 151.18255999999997, "r": 477.50842, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "Pat", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 493.52240000000006, "t": 151.18255999999997, "r": 507.17822, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "Ten", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 162.53954999999996, "r": 134.01064, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Caption", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 177.866, "t": 162.53954999999996, "r": 198.71288, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "22524", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 162.53954999999996, "r": 233.69174000000004, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "2.04", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 162.53954999999996, "r": 264.50031, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "1.77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 162.53954999999996, "r": 295.30887, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "2.32", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 162.53954999999996, "r": 324.98117, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "84-89", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 162.53954999999996, "r": 354.651, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "40-61", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 162.53954999999996, "r": 384.32083, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "86-92", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45187, "t": 162.53954999999996, "r": 418.16003, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "94-99", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 162.53954999999996, "r": 447.82986, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "95-99", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 162.53954999999996, "r": 477.50867, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "69-78", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 495.32489, "t": 162.53954999999996, "r": 507.17846999999995, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 173.49854000000005, "r": 137.3282, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Footnote", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 182.035, "t": 173.49854000000005, "r": 198.71251, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "6318", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 173.49854000000005, "r": 233.69174000000004, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.60", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 173.49854000000005, "r": 264.50031, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.31", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 173.49854000000005, "r": 295.30887, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.58", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 173.49854000000005, "r": 324.98117, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "83-91", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 342.79739, "t": 173.49854000000005, "r": 354.65097, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 371.81265, "t": 173.49854000000005, "r": 384.32077, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "100", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45181, "t": 173.49854000000005, "r": 418.15997, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "62-88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.12164, "t": 173.49854000000005, "r": 447.8298, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "85-94", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 465.655, "t": 173.49854000000005, "r": 477.50857999999994, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47025, "t": 173.49854000000005, "r": 507.17841, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "82-97", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 184.45752000000005, "r": 135.33766, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Formula", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 177.866, "t": 184.45752000000005, "r": 198.71288, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "25027", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 184.45752000000005, "r": 233.69174000000004, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "2.25", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 184.45752000000005, "r": 264.50031, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "1.90", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 184.45752000000005, "r": 295.30887, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "2.96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 184.45752000000005, "r": 324.98117, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "83-85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 342.79739, "t": 184.45752000000005, "r": 354.65097, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 372.46719, "t": 184.45752000000005, "r": 384.32077, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45181, "t": 184.45752000000005, "r": 418.15997, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "84-87", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.12164, "t": 184.45752000000005, "r": 447.8298, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "86-96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 465.655, "t": 184.45752000000005, "r": 477.50857999999994, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 495.3248, "t": 184.45752000000005, "r": 507.17838000000006, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 195.41656, "r": 137.70479, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "List-item", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 173.69701, "t": 195.41656, "r": 198.71326, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "185660", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 215.04201, "t": 195.41656, "r": 233.69212, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "17.19", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.85056, "t": 195.41656, "r": 264.50067, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "13.34", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 276.65912, "t": 195.41656, "r": 295.30923, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "15.82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 195.41656, "r": 324.98117, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "87-88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 195.41656, "r": 354.651, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "74-83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 195.41656, "r": 384.32083, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "90-92", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45187, "t": 195.41656, "r": 418.16003, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "97-97", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 195.41656, "r": 447.82986, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "81-85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 195.41656, "r": 477.50867, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "75-88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 195.41656, "r": 507.17849999999993, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "93-95", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 206.37554999999998, "r": 147.35262, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-footer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 177.866, "t": 206.37554999999998, "r": 198.71288, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "70878", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 206.37554999999998, "r": 233.69174000000004, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "6.51", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 206.37554999999998, "r": 264.50031, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "5.58", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 206.37554999999998, "r": 295.30887, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "6.00", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 206.37554999999998, "r": 324.98117, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "93-94", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 206.37554999999998, "r": 354.651, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "88-90", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 206.37554999999998, "r": 384.32083, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "95-96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 405.65189, "t": 206.37554999999998, "r": 418.16, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "100", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.12167, "t": 206.37554999999998, "r": 447.82983, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "92-97", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 465.00049, "t": 206.37554999999998, "r": 477.5086099999999, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "100", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47028, "t": 206.37554999999998, "r": 507.17843999999997, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "96-98", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 217.33452999999997, "r": 150.10532, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 177.866, "t": 217.33452999999997, "r": 198.71288, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "58022", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 217.33452999999997, "r": 233.69174000000004, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "5.10", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 217.33452999999997, "r": 264.50031, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "6.70", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 217.33452999999997, "r": 295.30887, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "5.06", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 217.33452999999997, "r": 324.98117, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "85-89", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 217.33452999999997, "r": 354.651, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "66-76", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 217.33452999999997, "r": 384.32083, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "90-94", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.2825, "t": 217.33452999999997, "r": 418.16003, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "98-100", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 217.33452999999997, "r": 447.82986, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "91-92", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 217.33452999999997, "r": 477.50867, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "97-99", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 217.33452999999997, "r": 507.17849999999993, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "81-86", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 228.29351999999994, "r": 130.80963, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Picture", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 177.866, "t": 228.29351999999994, "r": 198.71288, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "45976", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 228.29351999999994, "r": 233.69174000000004, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "4.21", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 228.29351999999994, "r": 264.50031, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "2.78", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 228.29351999999994, "r": 295.30887, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "5.31", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 228.29351999999994, "r": 324.98117, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "69-71", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 228.29351999999994, "r": 354.651, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "56-59", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 228.29351999999994, "r": 384.32083, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "82-86", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45187, "t": 228.29351999999994, "r": 418.16003, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "69-82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 228.29351999999994, "r": 447.82986, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "80-95", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 228.29351999999994, "r": 477.50867, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "66-71", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 228.29351999999994, "r": 507.17849999999993, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "59-76", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 239.25256000000002, "r": 159.56487, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Section-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 173.69701, "t": 239.25256000000002, "r": 198.71326, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "142884", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 215.04201, "t": 239.25256000000002, "r": 233.69212, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "12.60", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.85056, "t": 239.25256000000002, "r": 264.50067, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "15.77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 276.65912, "t": 239.25256000000002, "r": 295.30923, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "12.85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 239.25256000000002, "r": 324.98117, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "83-84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 239.25256000000002, "r": 354.651, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "76-81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 239.25256000000002, "r": 384.32083, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "90-92", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45187, "t": 239.25256000000002, "r": 418.16003, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "94-95", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 239.25256000000002, "r": 447.82986, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "87-94", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 239.25256000000002, "r": 477.50867, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "69-73", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 239.25256000000002, "r": 507.17849999999993, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "78-86", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 250.21155, "r": 124.63177, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 177.866, "t": 250.21155, "r": 198.71288, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "34733", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 250.21155, "r": 233.69174000000004, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "3.20", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 250.21155, "r": 264.50031, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "2.27", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 250.21155, "r": 295.30887, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "3.60", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 250.21155, "r": 324.98117, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "77-81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 250.21155, "r": 354.651, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "75-80", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 250.21155, "r": 384.32083, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "83-86", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45187, "t": 250.21155, "r": 418.16003, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "98-99", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 250.21155, "r": 447.82986, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "58-80", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 250.21155, "r": 477.50867, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "79-84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 250.21155, "r": 507.17849999999993, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "70-85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 261.16956000000005, "r": 120.78519, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Text", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 173.69701, "t": 261.16956000000005, "r": 198.71326, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "510377", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 215.04201, "t": 261.16956000000005, "r": 233.69212, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "45.82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.85056, "t": 261.16956000000005, "r": 264.50067, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "49.28", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 276.65912, "t": 261.16956000000005, "r": 295.30923, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "45.00", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 261.16956000000005, "r": 324.98117, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "84-86", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 261.16956000000005, "r": 354.651, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "81-86", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 261.16956000000005, "r": 384.32083, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "88-93", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45187, "t": 261.16956000000005, "r": 418.16003, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "89-93", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 261.16956000000005, "r": 447.82986, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "87-92", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 261.16956000000005, "r": 477.50867, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "71-79", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 261.16956000000005, "r": 507.17849999999993, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "87-95", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 272.12854000000004, "r": 121.81633, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Title", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 182.035, "t": 272.12854000000004, "r": 198.71251, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "5071", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 272.12854000000004, "r": 233.69174000000004, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.47", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 272.12854000000004, "r": 264.50031, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.30", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 272.12854000000004, "r": 295.30887, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.50", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 272.12854000000004, "r": 324.98117, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "60-72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 272.12854000000004, "r": 354.651, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "24-63", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 272.12854000000004, "r": 384.32083, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "50-63", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.2825, "t": 272.12854000000004, "r": 418.16003, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "94-100", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 272.12854000000004, "r": 447.82986, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "82-96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 272.12854000000004, "r": 477.50867, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "68-79", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 272.12854000000004, "r": 507.17849999999993, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "24-56", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 283.48654, "r": 123.43028, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Total", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 169.52699, "t": 283.48654, "r": 198.71263, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "1107470", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 208.675, "t": 283.48654, "r": 233.69124999999997, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "941123", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 243.65291999999997, "t": 283.48654, "r": 264.49982, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "99816", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 274.46149, "t": 283.48654, "r": 295.30838, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "66531", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 283.48654, "r": 324.98117, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "82-83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 283.48654, "r": 354.651, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "71-74", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 283.48654, "r": 384.32083, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "79-81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45187, "t": 283.48654, "r": 418.16003, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "89-94", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 283.48654, "r": 447.82986, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "86-91", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 283.48654, "r": 477.50867, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "71-76", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 283.48654, "r": 507.17849999999993, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "68-85", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "caption", "id": 9, "page_no": 3, "cluster": {"id": 9, "label": "caption", "bbox": {"l": 53.79800000000001, "t": 554.00999, "r": 295.64874, "b": 606.31924, "coord_origin": "TOPLEFT"}, "confidence": 0.810490071773529, "cells": [{"id": 163, "text": "Figure 3: Corpus Conversion Service annotation user inter-", "bbox": {"l": 53.79800000000001, "t": 554.00999, "r": 295.64871, "b": 562.48325, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "face. The PDF page is shown in the background, with over-", "bbox": {"l": 53.79800000000001, "t": 564.96899, "r": 295.64874, "b": 573.44225, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "laid text-cells (in darker shades). The annotation boxes can", "bbox": {"l": 53.79800000000001, "t": 575.92799, "r": 294.04376, "b": 584.40125, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "be drawn by dragging a rectangle over each segment with", "bbox": {"l": 53.79800000000001, "t": 586.88699, "r": 294.04373, "b": 595.36024, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "the respective label from the palette on the right.", "bbox": {"l": 53.79800000000001, "t": 597.84599, "r": 252.78931000000003, "b": 606.31924, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 3: Corpus Conversion Service annotation user interface. The PDF page is shown in the background, with overlaid text-cells (in darker shades). The annotation boxes can be drawn by dragging a rectangle over each segment with the respective label from the palette on the right."}, {"label": "text", "id": 5, "page_no": 3, "cluster": {"id": 5, "label": "text", "bbox": {"l": 53.466999, "t": 634.29155, "r": 294.04745, "b": 675.54317, "coord_origin": "TOPLEFT"}, "confidence": 0.980393648147583, "cells": [{"id": 168, "text": "we distributed the annotation workload and performed continuous", "bbox": {"l": 53.466999, "t": 634.29155, "r": 294.04745, "b": 642.66617, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "quality controls. Phase one and two required a small team of experts", "bbox": {"l": 53.79800000000001, "t": 645.25055, "r": 294.04535, "b": 653.62517, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "only. For phases three and four, a group of 40 dedicated annotators", "bbox": {"l": 53.79800000000001, "t": 656.20955, "r": 294.04422, "b": 664.58417, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "were assembled and supervised.", "bbox": {"l": 53.466999, "t": 667.16856, "r": 170.58611, "b": 675.54317, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "we distributed the annotation workload and performed continuous quality controls. Phase one and two required a small team of experts only. For phases three and four, a group of 40 dedicated annotators were assembled and supervised."}, {"label": "text", "id": 6, "page_no": 3, "cluster": {"id": 6, "label": "text", "bbox": {"l": 53.79800000000001, "t": 678.01099, "r": 295.55844, "b": 708.420174, "coord_origin": "TOPLEFT"}, "confidence": 0.9748398661613464, "cells": [{"id": 172, "text": "Phase 1: Data selection and preparation.", "bbox": {"l": 63.76099800000001, "t": 678.01099, "r": 226.72533000000004, "b": 686.48424, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "Our inclusion cri-", "bbox": {"l": 229.06900000000002, "t": 678.12756, "r": 295.55844, "b": 686.50217, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "teria for documents were described in Section 3. A large effort went", "bbox": {"l": 53.79800000000001, "t": 689.08656, "r": 294.04538, "b": 697.461174, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "into ensuring that all documents are free to use. The data sources", "bbox": {"l": 53.79800000000001, "t": 700.045555, "r": 294.04642, "b": 708.420174, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Phase 1: Data selection and preparation. Our inclusion criteria for documents were described in Section 3. A large effort went into ensuring that all documents are free to use. The data sources"}, {"label": "text", "id": 4, "page_no": 3, "cluster": {"id": 4, "label": "text", "bbox": {"l": 317.95499, "t": 312.07953, "r": 559.18536, "b": 375.24817, "coord_origin": "TOPLEFT"}, "confidence": 0.9818483591079712, "cells": [{"id": 176, "text": "include publication repositories such as arXiv$^{3}$, government offices,", "bbox": {"l": 317.95499, "t": 312.07953, "r": 559.18536, "b": 320.45416000000006, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "company websites as well as data directory services for financial", "bbox": {"l": 317.95499, "t": 323.03754, "r": 558.19843, "b": 331.41217, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "reports and patents. Scanned documents were excluded wherever", "bbox": {"l": 317.95499, "t": 333.99655, "r": 558.36963, "b": 342.37119, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "possible because they can be rotated or skewed. This would not", "bbox": {"l": 317.95499, "t": 344.95554, "r": 558.2041, "b": 353.33017, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "allow us to perform annotation with rectangular bounding-boxes", "bbox": {"l": 317.95499, "t": 355.91455, "r": 558.20294, "b": 364.28918, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "and therefore complicate the annotation process.", "bbox": {"l": 317.95499, "t": 366.87354, "r": 496.71826, "b": 375.24817, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "include publication repositories such as arXiv$^{3}$, government offices, company websites as well as data directory services for financial reports and patents. Scanned documents were excluded wherever possible because they can be rotated or skewed. This would not allow us to perform annotation with rectangular bounding-boxes and therefore complicate the annotation process."}, {"label": "text", "id": 0, "page_no": 3, "cluster": {"id": 0, "label": "text", "bbox": {"l": 317.95499, "t": 377.8325500000001, "r": 559.71307, "b": 506.75516, "coord_origin": "TOPLEFT"}, "confidence": 0.9866719841957092, "cells": [{"id": 182, "text": "Preparation work included uploading and parsing the sourced", "bbox": {"l": 327.918, "t": 377.8325500000001, "r": 558.20618, "b": 386.20717999999994, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "PDF documents in the Corpus Conversion Service (CCS) [22], a", "bbox": {"l": 317.95499, "t": 388.79153, "r": 558.2019, "b": 397.16617, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "cloud-native platform which provides a visual annotation interface", "bbox": {"l": 317.95499, "t": 399.75055, "r": 558.20233, "b": 408.12518, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": "and allows for dataset inspection and analysis. The annotation in-", "bbox": {"l": 317.95499, "t": 410.7095299999999, "r": 559.71277, "b": 419.08417, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "terface of CCS is shown in Figure 3. The desired balance of pages", "bbox": {"l": 317.95499, "t": 421.66855000000004, "r": 558.20062, "b": 430.04318, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "between the different document categories was achieved by se-", "bbox": {"l": 317.95499, "t": 432.62753, "r": 559.71307, "b": 441.00217, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": "lective subsampling of pages with certain desired properties. For", "bbox": {"l": 317.95499, "t": 443.58554, "r": 558.36877, "b": 451.96017, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "example, we made sure to include the title page of each document", "bbox": {"l": 317.95499, "t": 454.54453, "r": 558.20428, "b": 462.91916, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "and bias the remaining page selection to those with figures or", "bbox": {"l": 317.95499, "t": 465.50354, "r": 558.36877, "b": 473.87817, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "tables. The latter was achieved by leveraging pre-trained object", "bbox": {"l": 317.95499, "t": 476.46252, "r": 558.20428, "b": 484.83716, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": "detection models from PubLayNet, which helped us estimate how", "bbox": {"l": 317.95499, "t": 487.42154, "r": 558.5307, "b": 495.79617, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "many figures and tables a given page contains.", "bbox": {"l": 317.95499, "t": 498.38052, "r": 488.46914999999996, "b": 506.75516, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Preparation work included uploading and parsing the sourced PDF documents in the Corpus Conversion Service (CCS) [22], a cloud-native platform which provides a visual annotation interface and allows for dataset inspection and analysis. The annotation interface of CCS is shown in Figure 3. The desired balance of pages between the different document categories was achieved by selective subsampling of pages with certain desired properties. For example, we made sure to include the title page of each document and bias the remaining page selection to those with figures or tables. The latter was achieved by leveraging pre-trained object detection models from PubLayNet, which helped us estimate how many figures and tables a given page contains."}, {"label": "text", "id": 3, "page_no": 3, "cluster": {"id": 3, "label": "text", "bbox": {"l": 317.62299, "t": 509.22299, "r": 559.71765, "b": 693.0561749999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9847556948661804, "cells": [{"id": 194, "text": "Phase 2: Label selection and guideline.", "bbox": {"l": 327.918, "t": 509.22299, "r": 482.41809, "b": 517.69623, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "We reviewed the col-", "bbox": {"l": 484.474, "t": 509.33954, "r": 559.71765, "b": 517.71417, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "lected documents and identified the most common structural fea-", "bbox": {"l": 317.95499, "t": 520.29855, "r": 559.71619, "b": 528.67319, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "tures they exhibit. This was achieved by identifying recurrent layout", "bbox": {"l": 317.95499, "t": 531.2575400000001, "r": 558.20239, "b": 539.63217, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "elements and lead us to the definition of 11 distinct class labels.", "bbox": {"l": 317.95499, "t": 542.21655, "r": 559.58502, "b": 550.59117, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "These 11 class labels are", "bbox": {"l": 317.686, "t": 553.17456, "r": 404.14197, "b": 561.54918, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "Caption", "bbox": {"l": 406.26599, "t": 553.21939, "r": 433.84860000000003, "b": 561.5581500000001, "coord_origin": "TOPLEFT"}}, {"id": 201, "text": ",", "bbox": {"l": 433.84799, "t": 553.17456, "r": 435.78115999999994, "b": 561.54918, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": "Footnote", "bbox": {"l": 437.9079899999999, "t": 553.21939, "r": 467.23926, "b": 561.5581500000001, "coord_origin": "TOPLEFT"}}, {"id": 203, "text": ",", "bbox": {"l": 467.23999, "t": 553.17456, "r": 469.17316000000005, "b": 561.54918, "coord_origin": "TOPLEFT"}}, {"id": 204, "text": "Formula", "bbox": {"l": 471.29900999999995, "t": 553.21939, "r": 500.44574000000006, "b": 561.5581500000001, "coord_origin": "TOPLEFT"}}, {"id": 205, "text": ",", "bbox": {"l": 500.44601000000006, "t": 553.17456, "r": 502.37918, "b": 561.54918, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": "List-item", "bbox": {"l": 504.505, "t": 553.21939, "r": 535.74304, "b": 561.5581500000001, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": ",", "bbox": {"l": 535.74298, "t": 553.17456, "r": 537.67615, "b": 561.54918, "coord_origin": "TOPLEFT"}}, {"id": 208, "text": "Page-", "bbox": {"l": 539.802, "t": 553.21939, "r": 559.09839, "b": 561.5581500000001, "coord_origin": "TOPLEFT"}}, {"id": 209, "text": "footer", "bbox": {"l": 317.95499, "t": 564.17839, "r": 338.80725, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": ",", "bbox": {"l": 338.806, "t": 564.13356, "r": 340.81805, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "Page-header", "bbox": {"l": 343.61401, "t": 564.17839, "r": 387.96164, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 212, "text": ",", "bbox": {"l": 387.961, "t": 564.13356, "r": 389.97305, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "Picture", "bbox": {"l": 392.76901, "t": 564.17839, "r": 417.84662, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 214, "text": ",", "bbox": {"l": 417.84799, "t": 564.13356, "r": 419.86005, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 215, "text": "Section-header", "bbox": {"l": 422.655, "t": 564.17839, "r": 475.56305, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 216, "text": ",", "bbox": {"l": 475.56201, "t": 564.13356, "r": 477.57407, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 217, "text": "Table", "bbox": {"l": 480.36899, "t": 564.17839, "r": 499.82196, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 218, "text": ",", "bbox": {"l": 499.8219900000001, "t": 564.13356, "r": 501.83405, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 219, "text": "Text", "bbox": {"l": 504.6290000000001, "t": 564.17839, "r": 519.7926, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 220, "text": ", and", "bbox": {"l": 519.79602, "t": 564.13356, "r": 538.37103, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 221, "text": "Title", "bbox": {"l": 541.16302, "t": 564.17839, "r": 557.57043, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 222, "text": ".", "bbox": {"l": 557.57098, "t": 564.13356, "r": 559.58307, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 223, "text": "Critical factors that were considered for the choice of these class", "bbox": {"l": 317.95499, "t": 575.09256, "r": 558.20416, "b": 583.46718, "coord_origin": "TOPLEFT"}}, {"id": 224, "text": "labels were (1) the overall occurrence of the label, (2) the specificity", "bbox": {"l": 317.95499, "t": 586.05156, "r": 558.43091, "b": 594.4261799999999, "coord_origin": "TOPLEFT"}}, {"id": 225, "text": "of the label, (3) recognisability on a single page (i.e. no need for", "bbox": {"l": 317.95499, "t": 597.0105599999999, "r": 558.36871, "b": 605.38518, "coord_origin": "TOPLEFT"}}, {"id": 226, "text": "context from previous or next page) and (4) overall coverage of the", "bbox": {"l": 317.95499, "t": 607.96956, "r": 558.20105, "b": 616.3441799999999, "coord_origin": "TOPLEFT"}}, {"id": 227, "text": "page. Specificity ensures that the choice of label is not ambiguous,", "bbox": {"l": 317.95499, "t": 618.9285600000001, "r": 559.18665, "b": 627.30318, "coord_origin": "TOPLEFT"}}, {"id": 228, "text": "while coverage ensures that all meaningful items on a page can", "bbox": {"l": 317.62299, "t": 629.88756, "r": 558.20142, "b": 638.26218, "coord_origin": "TOPLEFT"}}, {"id": 229, "text": "be annotated. We refrained from class labels that are very specific", "bbox": {"l": 317.95499, "t": 640.84656, "r": 558.20227, "b": 649.22118, "coord_origin": "TOPLEFT"}}, {"id": 230, "text": "to a document category, such as", "bbox": {"l": 317.95499, "t": 651.80556, "r": 436.90649, "b": 660.1801800000001, "coord_origin": "TOPLEFT"}}, {"id": 231, "text": "Abstract", "bbox": {"l": 439.13800000000003, "t": 651.8503900000001, "r": 469.69134999999994, "b": 660.18915, "coord_origin": "TOPLEFT"}}, {"id": 232, "text": "in the", "bbox": {"l": 472.42898999999994, "t": 651.80556, "r": 493.97348, "b": 660.1801800000001, "coord_origin": "TOPLEFT"}}, {"id": 233, "text": "Scientific Articles", "bbox": {"l": 496.207, "t": 651.8503900000001, "r": 558.20001, "b": 660.18915, "coord_origin": "TOPLEFT"}}, {"id": 234, "text": "category. We also avoided class labels that are tightly linked to the", "bbox": {"l": 317.95499, "t": 662.76456, "r": 558.20557, "b": 671.13918, "coord_origin": "TOPLEFT"}}, {"id": 235, "text": "semantics of the text. Labels such as", "bbox": {"l": 317.95499, "t": 673.7225599999999, "r": 447.65221999999994, "b": 682.09718, "coord_origin": "TOPLEFT"}}, {"id": 236, "text": "Author", "bbox": {"l": 449.85999, "t": 673.76739, "r": 474.31439, "b": 682.10614, "coord_origin": "TOPLEFT"}}, {"id": 237, "text": "and", "bbox": {"l": 477.172, "t": 673.7225599999999, "r": 490.39655, "b": 682.09718, "coord_origin": "TOPLEFT"}}, {"id": 238, "text": "Affiliation", "bbox": {"l": 492.60599, "t": 673.76739, "r": 528.29907, "b": 682.10614, "coord_origin": "TOPLEFT"}}, {"id": 239, "text": ", as seen", "bbox": {"l": 528.29901, "t": 673.7225599999999, "r": 558.20148, "b": 682.09718, "coord_origin": "TOPLEFT"}}, {"id": 240, "text": "in DocBank, are often only distinguishable by discriminating on", "bbox": {"l": 317.95499, "t": 684.68156, "r": 558.2041, "b": 693.0561749999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Phase 2: Label selection and guideline. We reviewed the collected documents and identified the most common structural features they exhibit. This was achieved by identifying recurrent layout elements and lead us to the definition of 11 distinct class labels. These 11 class labels are Caption , Footnote , Formula , List-item , Pagefooter , Page-header , Picture , Section-header , Table , Text , and Title . Critical factors that were considered for the choice of these class labels were (1) the overall occurrence of the label, (2) the specificity of the label, (3) recognisability on a single page (i.e. no need for context from previous or next page) and (4) overall coverage of the page. Specificity ensures that the choice of label is not ambiguous, while coverage ensures that all meaningful items on a page can be annotated. We refrained from class labels that are very specific to a document category, such as Abstract in the Scientific Articles category. We also avoided class labels that are tightly linked to the semantics of the text. Labels such as Author and Affiliation , as seen in DocBank, are often only distinguishable by discriminating on"}, {"label": "footnote", "id": 7, "page_no": 3, "cluster": {"id": 7, "label": "footnote", "bbox": {"l": 317.95499, "t": 702.353363, "r": 369.2457, "b": 708.86689, "coord_origin": "TOPLEFT"}, "confidence": 0.9080352783203125, "cells": [{"id": 241, "text": "$^{3}$https://arxiv.org/", "bbox": {"l": 317.95499, "t": 702.353363, "r": 369.2457, "b": 708.86689, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "$^{3}$https://arxiv.org/"}, {"label": "picture", "id": 2, "page_no": 3, "cluster": {"id": 2, "label": "picture", "bbox": {"l": 53.05912780761719, "t": 310.7912902832031, "r": 295.8506164550781, "b": 540.864013671875, "coord_origin": "TOPLEFT"}, "confidence": 0.9847871661186218, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "body": [{"label": "caption", "id": 8, "page_no": 3, "cluster": {"id": 8, "label": "caption", "bbox": {"l": 53.501999, "t": 84.95495999999991, "r": 558.48969, "b": 115.34618999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.8906616568565369, "cells": [{"id": 2, "text": "Table 1: DocLayNet dataset overview. Along with the frequency of each class label, we present the relative occurrence (as %", "bbox": {"l": 53.501999, "t": 84.95495999999991, "r": 558.48969, "b": 93.42822000000001, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "of row \u201cTotal\u201d) in the train, test and validation sets. The inter-annotator agreement is computed as the mAP@0.5-0.95 metric", "bbox": {"l": 53.79800000000001, "t": 95.91394000000003, "r": 558.20294, "b": 104.3872100000001, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "between pairwise annotations from the triple-annotated pages, from which we obtain accuracy ranges.", "bbox": {"l": 53.79800000000001, "t": 106.87292000000002, "r": 469.84805000000006, "b": 115.34618999999998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 1: DocLayNet dataset overview. Along with the frequency of each class label, we present the relative occurrence (as % of row \"Total\") in the train, test and validation sets. The inter-annotator agreement is computed as the mAP@0.5-0.95 metric between pairwise annotations from the triple-annotated pages, from which we obtain accuracy ranges."}, {"label": "table", "id": 1, "page_no": 3, "cluster": {"id": 1, "label": "table", "bbox": {"l": 98.93103790283203, "t": 137.47547912597656, "r": 512.579833984375, "b": 294.08148193359375, "coord_origin": "TOPLEFT"}, "confidence": 0.9860090613365173, "cells": [{"id": 5, "text": "% of Total", "bbox": {"l": 233.94400000000002, "t": 140.22351000000003, "r": 270.04272, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "triple inter-annotator mAP @ 0.5-0.95 (%)", "bbox": {"l": 329.04999, "t": 140.22351000000003, "r": 483.3976400000001, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "class label", "bbox": {"l": 104.825, "t": 151.18255999999997, "r": 141.71277, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Count", "bbox": {"l": 175.94701, "t": 151.18255999999997, "r": 198.71269, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Train", "bbox": {"l": 213.795, "t": 151.18255999999997, "r": 233.69144, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Test", "bbox": {"l": 249.37367, "t": 151.18255999999997, "r": 264.5, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Val", "bbox": {"l": 283.53568, "t": 151.18255999999997, "r": 295.30856, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "All", "bbox": {"l": 314.01501, "t": 151.18255999999997, "r": 324.98093, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Fin", "bbox": {"l": 343.01236, "t": 151.18255999999997, "r": 354.65076, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Man", "bbox": {"l": 367.84033, "t": 151.18255999999997, "r": 384.32059, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Sci", "bbox": {"l": 407.54358, "t": 151.18255999999997, "r": 418.15979, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Law", "bbox": {"l": 432.29979999999995, "t": 151.18255999999997, "r": 447.82962, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "Pat", "bbox": {"l": 465.72656, "t": 151.18255999999997, "r": 477.50842, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Ten", "bbox": {"l": 493.52240000000006, "t": 151.18255999999997, "r": 507.17822, "b": 159.55719, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Caption", "bbox": {"l": 104.825, "t": 162.53954999999996, "r": 134.01064, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "22524", "bbox": {"l": 177.866, "t": 162.53954999999996, "r": 198.71288, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "2.04", "bbox": {"l": 219.211, "t": 162.53954999999996, "r": 233.69174000000004, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "1.77", "bbox": {"l": 250.01956, "t": 162.53954999999996, "r": 264.50031, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "2.32", "bbox": {"l": 280.82812, "t": 162.53954999999996, "r": 295.30887, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "84-89", "bbox": {"l": 305.27301, "t": 162.53954999999996, "r": 324.98117, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "40-61", "bbox": {"l": 334.94284, "t": 162.53954999999996, "r": 354.651, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "86-92", "bbox": {"l": 364.61267, "t": 162.53954999999996, "r": 384.32083, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "94-99", "bbox": {"l": 398.45187, "t": 162.53954999999996, "r": 418.16003, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "95-99", "bbox": {"l": 428.1217, "t": 162.53954999999996, "r": 447.82986, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "69-78", "bbox": {"l": 457.80051, "t": 162.53954999999996, "r": 477.50867, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "n/a", "bbox": {"l": 495.32489, "t": 162.53954999999996, "r": 507.17846999999995, "b": 170.91418, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Footnote", "bbox": {"l": 104.825, "t": 173.49854000000005, "r": 137.3282, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "6318", "bbox": {"l": 182.035, "t": 173.49854000000005, "r": 198.71251, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "0.60", "bbox": {"l": 219.211, "t": 173.49854000000005, "r": 233.69174000000004, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "0.31", "bbox": {"l": 250.01956, "t": 173.49854000000005, "r": 264.50031, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "0.58", "bbox": {"l": 280.82812, "t": 173.49854000000005, "r": 295.30887, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "83-91", "bbox": {"l": 305.27301, "t": 173.49854000000005, "r": 324.98117, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "n/a", "bbox": {"l": 342.79739, "t": 173.49854000000005, "r": 354.65097, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "100", "bbox": {"l": 371.81265, "t": 173.49854000000005, "r": 384.32077, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "62-88", "bbox": {"l": 398.45181, "t": 173.49854000000005, "r": 418.15997, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "85-94", "bbox": {"l": 428.12164, "t": 173.49854000000005, "r": 447.8298, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "n/a", "bbox": {"l": 465.655, "t": 173.49854000000005, "r": 477.50857999999994, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "82-97", "bbox": {"l": 487.47025, "t": 173.49854000000005, "r": 507.17841, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Formula", "bbox": {"l": 104.825, "t": 184.45752000000005, "r": 135.33766, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "25027", "bbox": {"l": 177.866, "t": 184.45752000000005, "r": 198.71288, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "2.25", "bbox": {"l": 219.211, "t": 184.45752000000005, "r": 233.69174000000004, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "1.90", "bbox": {"l": 250.01956, "t": 184.45752000000005, "r": 264.50031, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "2.96", "bbox": {"l": 280.82812, "t": 184.45752000000005, "r": 295.30887, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "83-85", "bbox": {"l": 305.27301, "t": 184.45752000000005, "r": 324.98117, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "n/a", "bbox": {"l": 342.79739, "t": 184.45752000000005, "r": 354.65097, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "n/a", "bbox": {"l": 372.46719, "t": 184.45752000000005, "r": 384.32077, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "84-87", "bbox": {"l": 398.45181, "t": 184.45752000000005, "r": 418.15997, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "86-96", "bbox": {"l": 428.12164, "t": 184.45752000000005, "r": 447.8298, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "n/a", "bbox": {"l": 465.655, "t": 184.45752000000005, "r": 477.50857999999994, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "n/a", "bbox": {"l": 495.3248, "t": 184.45752000000005, "r": 507.17838000000006, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "List-item", "bbox": {"l": 104.825, "t": 195.41656, "r": 137.70479, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "185660", "bbox": {"l": 173.69701, "t": 195.41656, "r": 198.71326, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "17.19", "bbox": {"l": 215.04201, "t": 195.41656, "r": 233.69212, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "13.34", "bbox": {"l": 245.85056, "t": 195.41656, "r": 264.50067, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "15.82", "bbox": {"l": 276.65912, "t": 195.41656, "r": 295.30923, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "87-88", "bbox": {"l": 305.27301, "t": 195.41656, "r": 324.98117, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "74-83", "bbox": {"l": 334.94284, "t": 195.41656, "r": 354.651, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "90-92", "bbox": {"l": 364.61267, "t": 195.41656, "r": 384.32083, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "97-97", "bbox": {"l": 398.45187, "t": 195.41656, "r": 418.16003, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "81-85", "bbox": {"l": 428.1217, "t": 195.41656, "r": 447.82986, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "75-88", "bbox": {"l": 457.80051, "t": 195.41656, "r": 477.50867, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "93-95", "bbox": {"l": 487.47034, "t": 195.41656, "r": 507.17849999999993, "b": 203.7912, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "Page-footer", "bbox": {"l": 104.825, "t": 206.37554999999998, "r": 147.35262, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "70878", "bbox": {"l": 177.866, "t": 206.37554999999998, "r": 198.71288, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "6.51", "bbox": {"l": 219.211, "t": 206.37554999999998, "r": 233.69174000000004, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "5.58", "bbox": {"l": 250.01956, "t": 206.37554999999998, "r": 264.50031, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "6.00", "bbox": {"l": 280.82812, "t": 206.37554999999998, "r": 295.30887, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "93-94", "bbox": {"l": 305.27301, "t": 206.37554999999998, "r": 324.98117, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "88-90", "bbox": {"l": 334.94284, "t": 206.37554999999998, "r": 354.651, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "95-96", "bbox": {"l": 364.61267, "t": 206.37554999999998, "r": 384.32083, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "100", "bbox": {"l": 405.65189, "t": 206.37554999999998, "r": 418.16, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "92-97", "bbox": {"l": 428.12167, "t": 206.37554999999998, "r": 447.82983, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "100", "bbox": {"l": 465.00049, "t": 206.37554999999998, "r": 477.5086099999999, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "96-98", "bbox": {"l": 487.47028, "t": 206.37554999999998, "r": 507.17843999999997, "b": 214.75018, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "Page-header", "bbox": {"l": 104.825, "t": 217.33452999999997, "r": 150.10532, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "58022", "bbox": {"l": 177.866, "t": 217.33452999999997, "r": 198.71288, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "5.10", "bbox": {"l": 219.211, "t": 217.33452999999997, "r": 233.69174000000004, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "6.70", "bbox": {"l": 250.01956, "t": 217.33452999999997, "r": 264.50031, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "5.06", "bbox": {"l": 280.82812, "t": 217.33452999999997, "r": 295.30887, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "85-89", "bbox": {"l": 305.27301, "t": 217.33452999999997, "r": 324.98117, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "66-76", "bbox": {"l": 334.94284, "t": 217.33452999999997, "r": 354.651, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "90-94", "bbox": {"l": 364.61267, "t": 217.33452999999997, "r": 384.32083, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "98-100", "bbox": {"l": 394.2825, "t": 217.33452999999997, "r": 418.16003, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "91-92", "bbox": {"l": 428.1217, "t": 217.33452999999997, "r": 447.82986, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "97-99", "bbox": {"l": 457.80051, "t": 217.33452999999997, "r": 477.50867, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "81-86", "bbox": {"l": 487.47034, "t": 217.33452999999997, "r": 507.17849999999993, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "Picture", "bbox": {"l": 104.825, "t": 228.29351999999994, "r": 130.80963, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "45976", "bbox": {"l": 177.866, "t": 228.29351999999994, "r": 198.71288, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "4.21", "bbox": {"l": 219.211, "t": 228.29351999999994, "r": 233.69174000000004, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "2.78", "bbox": {"l": 250.01956, "t": 228.29351999999994, "r": 264.50031, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "5.31", "bbox": {"l": 280.82812, "t": 228.29351999999994, "r": 295.30887, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "69-71", "bbox": {"l": 305.27301, "t": 228.29351999999994, "r": 324.98117, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "56-59", "bbox": {"l": 334.94284, "t": 228.29351999999994, "r": 354.651, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "82-86", "bbox": {"l": 364.61267, "t": 228.29351999999994, "r": 384.32083, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "69-82", "bbox": {"l": 398.45187, "t": 228.29351999999994, "r": 418.16003, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "80-95", "bbox": {"l": 428.1217, "t": 228.29351999999994, "r": 447.82986, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "66-71", "bbox": {"l": 457.80051, "t": 228.29351999999994, "r": 477.50867, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "59-76", "bbox": {"l": 487.47034, "t": 228.29351999999994, "r": 507.17849999999993, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "Section-header", "bbox": {"l": 104.825, "t": 239.25256000000002, "r": 159.56487, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "142884", "bbox": {"l": 173.69701, "t": 239.25256000000002, "r": 198.71326, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "12.60", "bbox": {"l": 215.04201, "t": 239.25256000000002, "r": 233.69212, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "15.77", "bbox": {"l": 245.85056, "t": 239.25256000000002, "r": 264.50067, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "12.85", "bbox": {"l": 276.65912, "t": 239.25256000000002, "r": 295.30923, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "83-84", "bbox": {"l": 305.27301, "t": 239.25256000000002, "r": 324.98117, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "76-81", "bbox": {"l": 334.94284, "t": 239.25256000000002, "r": 354.651, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "90-92", "bbox": {"l": 364.61267, "t": 239.25256000000002, "r": 384.32083, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "94-95", "bbox": {"l": 398.45187, "t": 239.25256000000002, "r": 418.16003, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "87-94", "bbox": {"l": 428.1217, "t": 239.25256000000002, "r": 447.82986, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "69-73", "bbox": {"l": 457.80051, "t": 239.25256000000002, "r": 477.50867, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "78-86", "bbox": {"l": 487.47034, "t": 239.25256000000002, "r": 507.17849999999993, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "Table", "bbox": {"l": 104.825, "t": 250.21155, "r": 124.63177, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "34733", "bbox": {"l": 177.866, "t": 250.21155, "r": 198.71288, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "3.20", "bbox": {"l": 219.211, "t": 250.21155, "r": 233.69174000000004, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "2.27", "bbox": {"l": 250.01956, "t": 250.21155, "r": 264.50031, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "3.60", "bbox": {"l": 280.82812, "t": 250.21155, "r": 295.30887, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "77-81", "bbox": {"l": 305.27301, "t": 250.21155, "r": 324.98117, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "75-80", "bbox": {"l": 334.94284, "t": 250.21155, "r": 354.651, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "83-86", "bbox": {"l": 364.61267, "t": 250.21155, "r": 384.32083, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "98-99", "bbox": {"l": 398.45187, "t": 250.21155, "r": 418.16003, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "58-80", "bbox": {"l": 428.1217, "t": 250.21155, "r": 447.82986, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "79-84", "bbox": {"l": 457.80051, "t": 250.21155, "r": 477.50867, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "70-85", "bbox": {"l": 487.47034, "t": 250.21155, "r": 507.17849999999993, "b": 258.58618, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "Text", "bbox": {"l": 104.825, "t": 261.16956000000005, "r": 120.78519, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "510377", "bbox": {"l": 173.69701, "t": 261.16956000000005, "r": 198.71326, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "45.82", "bbox": {"l": 215.04201, "t": 261.16956000000005, "r": 233.69212, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "49.28", "bbox": {"l": 245.85056, "t": 261.16956000000005, "r": 264.50067, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "45.00", "bbox": {"l": 276.65912, "t": 261.16956000000005, "r": 295.30923, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "84-86", "bbox": {"l": 305.27301, "t": 261.16956000000005, "r": 324.98117, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "81-86", "bbox": {"l": 334.94284, "t": 261.16956000000005, "r": 354.651, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "88-93", "bbox": {"l": 364.61267, "t": 261.16956000000005, "r": 384.32083, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "89-93", "bbox": {"l": 398.45187, "t": 261.16956000000005, "r": 418.16003, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "87-92", "bbox": {"l": 428.1217, "t": 261.16956000000005, "r": 447.82986, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "71-79", "bbox": {"l": 457.80051, "t": 261.16956000000005, "r": 477.50867, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "87-95", "bbox": {"l": 487.47034, "t": 261.16956000000005, "r": 507.17849999999993, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "Title", "bbox": {"l": 104.825, "t": 272.12854000000004, "r": 121.81633, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "5071", "bbox": {"l": 182.035, "t": 272.12854000000004, "r": 198.71251, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "0.47", "bbox": {"l": 219.211, "t": 272.12854000000004, "r": 233.69174000000004, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "0.30", "bbox": {"l": 250.01956, "t": 272.12854000000004, "r": 264.50031, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "0.50", "bbox": {"l": 280.82812, "t": 272.12854000000004, "r": 295.30887, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "60-72", "bbox": {"l": 305.27301, "t": 272.12854000000004, "r": 324.98117, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "24-63", "bbox": {"l": 334.94284, "t": 272.12854000000004, "r": 354.651, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "50-63", "bbox": {"l": 364.61267, "t": 272.12854000000004, "r": 384.32083, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "94-100", "bbox": {"l": 394.2825, "t": 272.12854000000004, "r": 418.16003, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "82-96", "bbox": {"l": 428.1217, "t": 272.12854000000004, "r": 447.82986, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "68-79", "bbox": {"l": 457.80051, "t": 272.12854000000004, "r": 477.50867, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "24-56", "bbox": {"l": 487.47034, "t": 272.12854000000004, "r": 507.17849999999993, "b": 280.50317, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "Total", "bbox": {"l": 104.825, "t": 283.48654, "r": 123.43028, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "1107470", "bbox": {"l": 169.52699, "t": 283.48654, "r": 198.71263, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "941123", "bbox": {"l": 208.675, "t": 283.48654, "r": 233.69124999999997, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "99816", "bbox": {"l": 243.65291999999997, "t": 283.48654, "r": 264.49982, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "66531", "bbox": {"l": 274.46149, "t": 283.48654, "r": 295.30838, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "82-83", "bbox": {"l": 305.27301, "t": 283.48654, "r": 324.98117, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "71-74", "bbox": {"l": 334.94284, "t": 283.48654, "r": 354.651, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "79-81", "bbox": {"l": 364.61267, "t": 283.48654, "r": 384.32083, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "89-94", "bbox": {"l": 398.45187, "t": 283.48654, "r": 418.16003, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "86-91", "bbox": {"l": 428.1217, "t": 283.48654, "r": 447.82986, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "71-76", "bbox": {"l": 457.80051, "t": 283.48654, "r": 477.50867, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "68-85", "bbox": {"l": 487.47034, "t": 283.48654, "r": 507.17849999999993, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": [{"id": 11, "label": "text", "bbox": {"l": 233.94400000000002, "t": 140.22351000000003, "r": 270.04272, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 5, "text": "% of Total", "bbox": {"l": 233.94400000000002, "t": 140.22351000000003, "r": 270.04272, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 329.04999, "t": 140.22351000000003, "r": 483.3976400000001, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": "triple inter-annotator mAP @ 0.5-0.95 (%)", "bbox": {"l": 329.04999, "t": 140.22351000000003, "r": 483.3976400000001, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 104.825, "t": 151.18255999999997, "r": 141.71277, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "class label", "bbox": {"l": 104.825, "t": 151.18255999999997, "r": 141.71277, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 175.94701, "t": 151.18255999999997, "r": 198.71269, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "Count", "bbox": {"l": 175.94701, "t": 151.18255999999997, "r": 198.71269, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 213.795, "t": 151.18255999999997, "r": 233.69144, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "Train", "bbox": {"l": 213.795, "t": 151.18255999999997, "r": 233.69144, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 249.37367, "t": 151.18255999999997, "r": 264.5, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "Test", "bbox": {"l": 249.37367, "t": 151.18255999999997, "r": 264.5, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 283.53568, "t": 151.18255999999997, "r": 295.30856, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "Val", "bbox": {"l": 283.53568, "t": 151.18255999999997, "r": 295.30856, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 314.01501, "t": 151.18255999999997, "r": 324.98093, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "All", "bbox": {"l": 314.01501, "t": 151.18255999999997, "r": 324.98093, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 343.01236, "t": 151.18255999999997, "r": 354.65076, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "Fin", "bbox": {"l": 343.01236, "t": 151.18255999999997, "r": 354.65076, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 367.84033, "t": 151.18255999999997, "r": 384.32059, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "Man", "bbox": {"l": 367.84033, "t": 151.18255999999997, "r": 384.32059, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 407.54358, "t": 151.18255999999997, "r": 418.15979, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "Sci", "bbox": {"l": 407.54358, "t": 151.18255999999997, "r": 418.15979, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 432.29979999999995, "t": 151.18255999999997, "r": 447.82962, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "Law", "bbox": {"l": 432.29979999999995, "t": 151.18255999999997, "r": 447.82962, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 465.72656, "t": 151.18255999999997, "r": 477.50842, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "Pat", "bbox": {"l": 465.72656, "t": 151.18255999999997, "r": 477.50842, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 493.52240000000006, "t": 151.18255999999997, "r": 507.17822, "b": 159.55719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "Ten", "bbox": {"l": 493.52240000000006, "t": 151.18255999999997, "r": 507.17822, "b": 159.55719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 104.825, "t": 162.53954999999996, "r": 134.01064, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "Caption", "bbox": {"l": 104.825, "t": 162.53954999999996, "r": 134.01064, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 177.866, "t": 162.53954999999996, "r": 198.71288, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "22524", "bbox": {"l": 177.866, "t": 162.53954999999996, "r": 198.71288, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 219.211, "t": 162.53954999999996, "r": 233.69174000000004, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "2.04", "bbox": {"l": 219.211, "t": 162.53954999999996, "r": 233.69174000000004, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 250.01956, "t": 162.53954999999996, "r": 264.50031, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "1.77", "bbox": {"l": 250.01956, "t": 162.53954999999996, "r": 264.50031, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 280.82812, "t": 162.53954999999996, "r": 295.30887, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "2.32", "bbox": {"l": 280.82812, "t": 162.53954999999996, "r": 295.30887, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 305.27301, "t": 162.53954999999996, "r": 324.98117, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "84-89", "bbox": {"l": 305.27301, "t": 162.53954999999996, "r": 324.98117, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 334.94284, "t": 162.53954999999996, "r": 354.651, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "40-61", "bbox": {"l": 334.94284, "t": 162.53954999999996, "r": 354.651, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 364.61267, "t": 162.53954999999996, "r": 384.32083, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "86-92", "bbox": {"l": 364.61267, "t": 162.53954999999996, "r": 384.32083, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 398.45187, "t": 162.53954999999996, "r": 418.16003, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "94-99", "bbox": {"l": 398.45187, "t": 162.53954999999996, "r": 418.16003, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 428.1217, "t": 162.53954999999996, "r": 447.82986, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "95-99", "bbox": {"l": 428.1217, "t": 162.53954999999996, "r": 447.82986, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 457.80051, "t": 162.53954999999996, "r": 477.50867, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "69-78", "bbox": {"l": 457.80051, "t": 162.53954999999996, "r": 477.50867, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 495.32489, "t": 162.53954999999996, "r": 507.17846999999995, "b": 170.91418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "n/a", "bbox": {"l": 495.32489, "t": 162.53954999999996, "r": 507.17846999999995, "b": 170.91418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 104.825, "t": 173.49854000000005, "r": 137.3282, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "Footnote", "bbox": {"l": 104.825, "t": 173.49854000000005, "r": 137.3282, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 182.035, "t": 173.49854000000005, "r": 198.71251, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "6318", "bbox": {"l": 182.035, "t": 173.49854000000005, "r": 198.71251, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 219.211, "t": 173.49854000000005, "r": 233.69174000000004, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "0.60", "bbox": {"l": 219.211, "t": 173.49854000000005, "r": 233.69174000000004, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 250.01956, "t": 173.49854000000005, "r": 264.50031, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "0.31", "bbox": {"l": 250.01956, "t": 173.49854000000005, "r": 264.50031, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 280.82812, "t": 173.49854000000005, "r": 295.30887, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "0.58", "bbox": {"l": 280.82812, "t": 173.49854000000005, "r": 295.30887, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 305.27301, "t": 173.49854000000005, "r": 324.98117, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "83-91", "bbox": {"l": 305.27301, "t": 173.49854000000005, "r": 324.98117, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 342.79739, "t": 173.49854000000005, "r": 354.65097, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "n/a", "bbox": {"l": 342.79739, "t": 173.49854000000005, "r": 354.65097, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 371.81265, "t": 173.49854000000005, "r": 384.32077, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "100", "bbox": {"l": 371.81265, "t": 173.49854000000005, "r": 384.32077, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 398.45181, "t": 173.49854000000005, "r": 418.15997, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "62-88", "bbox": {"l": 398.45181, "t": 173.49854000000005, "r": 418.15997, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 428.12164, "t": 173.49854000000005, "r": 447.8298, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "85-94", "bbox": {"l": 428.12164, "t": 173.49854000000005, "r": 447.8298, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 465.655, "t": 173.49854000000005, "r": 477.50857999999994, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "n/a", "bbox": {"l": 465.655, "t": 173.49854000000005, "r": 477.50857999999994, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 487.47025, "t": 173.49854000000005, "r": 507.17841, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "82-97", "bbox": {"l": 487.47025, "t": 173.49854000000005, "r": 507.17841, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 104.825, "t": 184.45752000000005, "r": 135.33766, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "Formula", "bbox": {"l": 104.825, "t": 184.45752000000005, "r": 135.33766, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 177.866, "t": 184.45752000000005, "r": 198.71288, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "25027", "bbox": {"l": 177.866, "t": 184.45752000000005, "r": 198.71288, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 219.211, "t": 184.45752000000005, "r": 233.69174000000004, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "2.25", "bbox": {"l": 219.211, "t": 184.45752000000005, "r": 233.69174000000004, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 250.01956, "t": 184.45752000000005, "r": 264.50031, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "1.90", "bbox": {"l": 250.01956, "t": 184.45752000000005, "r": 264.50031, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 280.82812, "t": 184.45752000000005, "r": 295.30887, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "2.96", "bbox": {"l": 280.82812, "t": 184.45752000000005, "r": 295.30887, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 305.27301, "t": 184.45752000000005, "r": 324.98117, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "83-85", "bbox": {"l": 305.27301, "t": 184.45752000000005, "r": 324.98117, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 342.79739, "t": 184.45752000000005, "r": 354.65097, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "n/a", "bbox": {"l": 342.79739, "t": 184.45752000000005, "r": 354.65097, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 372.46719, "t": 184.45752000000005, "r": 384.32077, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "n/a", "bbox": {"l": 372.46719, "t": 184.45752000000005, "r": 384.32077, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 398.45181, "t": 184.45752000000005, "r": 418.15997, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "84-87", "bbox": {"l": 398.45181, "t": 184.45752000000005, "r": 418.15997, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 428.12164, "t": 184.45752000000005, "r": 447.8298, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "86-96", "bbox": {"l": 428.12164, "t": 184.45752000000005, "r": 447.8298, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 465.655, "t": 184.45752000000005, "r": 477.50857999999994, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "n/a", "bbox": {"l": 465.655, "t": 184.45752000000005, "r": 477.50857999999994, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 495.3248, "t": 184.45752000000005, "r": 507.17838000000006, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "n/a", "bbox": {"l": 495.3248, "t": 184.45752000000005, "r": 507.17838000000006, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 104.825, "t": 195.41656, "r": 137.70479, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "List-item", "bbox": {"l": 104.825, "t": 195.41656, "r": 137.70479, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 173.69701, "t": 195.41656, "r": 198.71326, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "185660", "bbox": {"l": 173.69701, "t": 195.41656, "r": 198.71326, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 215.04201, "t": 195.41656, "r": 233.69212, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "17.19", "bbox": {"l": 215.04201, "t": 195.41656, "r": 233.69212, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 245.85056, "t": 195.41656, "r": 264.50067, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "13.34", "bbox": {"l": 245.85056, "t": 195.41656, "r": 264.50067, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 276.65912, "t": 195.41656, "r": 295.30923, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "15.82", "bbox": {"l": 276.65912, "t": 195.41656, "r": 295.30923, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 305.27301, "t": 195.41656, "r": 324.98117, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "87-88", "bbox": {"l": 305.27301, "t": 195.41656, "r": 324.98117, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 334.94284, "t": 195.41656, "r": 354.651, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "74-83", "bbox": {"l": 334.94284, "t": 195.41656, "r": 354.651, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 364.61267, "t": 195.41656, "r": 384.32083, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "90-92", "bbox": {"l": 364.61267, "t": 195.41656, "r": 384.32083, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 398.45187, "t": 195.41656, "r": 418.16003, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "97-97", "bbox": {"l": 398.45187, "t": 195.41656, "r": 418.16003, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 428.1217, "t": 195.41656, "r": 447.82986, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "81-85", "bbox": {"l": 428.1217, "t": 195.41656, "r": 447.82986, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 457.80051, "t": 195.41656, "r": 477.50867, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "75-88", "bbox": {"l": 457.80051, "t": 195.41656, "r": 477.50867, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 487.47034, "t": 195.41656, "r": 507.17849999999993, "b": 203.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "93-95", "bbox": {"l": 487.47034, "t": 195.41656, "r": 507.17849999999993, "b": 203.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 104.825, "t": 206.37554999999998, "r": 147.35262, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "Page-footer", "bbox": {"l": 104.825, "t": 206.37554999999998, "r": 147.35262, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 177.866, "t": 206.37554999999998, "r": 198.71288, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "70878", "bbox": {"l": 177.866, "t": 206.37554999999998, "r": 198.71288, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 219.211, "t": 206.37554999999998, "r": 233.69174000000004, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "6.51", "bbox": {"l": 219.211, "t": 206.37554999999998, "r": 233.69174000000004, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 250.01956, "t": 206.37554999999998, "r": 264.50031, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "5.58", "bbox": {"l": 250.01956, "t": 206.37554999999998, "r": 264.50031, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 280.82812, "t": 206.37554999999998, "r": 295.30887, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "6.00", "bbox": {"l": 280.82812, "t": 206.37554999999998, "r": 295.30887, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 305.27301, "t": 206.37554999999998, "r": 324.98117, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "93-94", "bbox": {"l": 305.27301, "t": 206.37554999999998, "r": 324.98117, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 334.94284, "t": 206.37554999999998, "r": 354.651, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "88-90", "bbox": {"l": 334.94284, "t": 206.37554999999998, "r": 354.651, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 364.61267, "t": 206.37554999999998, "r": 384.32083, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "95-96", "bbox": {"l": 364.61267, "t": 206.37554999999998, "r": 384.32083, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 405.65189, "t": 206.37554999999998, "r": 418.16, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "100", "bbox": {"l": 405.65189, "t": 206.37554999999998, "r": 418.16, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 428.12167, "t": 206.37554999999998, "r": 447.82983, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "92-97", "bbox": {"l": 428.12167, "t": 206.37554999999998, "r": 447.82983, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 465.00049, "t": 206.37554999999998, "r": 477.5086099999999, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "100", "bbox": {"l": 465.00049, "t": 206.37554999999998, "r": 477.5086099999999, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 487.47028, "t": 206.37554999999998, "r": 507.17843999999997, "b": 214.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "96-98", "bbox": {"l": 487.47028, "t": 206.37554999999998, "r": 507.17843999999997, "b": 214.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 104.825, "t": 217.33452999999997, "r": 150.10532, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "Page-header", "bbox": {"l": 104.825, "t": 217.33452999999997, "r": 150.10532, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 177.866, "t": 217.33452999999997, "r": 198.71288, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "58022", "bbox": {"l": 177.866, "t": 217.33452999999997, "r": 198.71288, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 219.211, "t": 217.33452999999997, "r": 233.69174000000004, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "5.10", "bbox": {"l": 219.211, "t": 217.33452999999997, "r": 233.69174000000004, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 250.01956, "t": 217.33452999999997, "r": 264.50031, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "6.70", "bbox": {"l": 250.01956, "t": 217.33452999999997, "r": 264.50031, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 280.82812, "t": 217.33452999999997, "r": 295.30887, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "5.06", "bbox": {"l": 280.82812, "t": 217.33452999999997, "r": 295.30887, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 305.27301, "t": 217.33452999999997, "r": 324.98117, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "85-89", "bbox": {"l": 305.27301, "t": 217.33452999999997, "r": 324.98117, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 334.94284, "t": 217.33452999999997, "r": 354.651, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "66-76", "bbox": {"l": 334.94284, "t": 217.33452999999997, "r": 354.651, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 364.61267, "t": 217.33452999999997, "r": 384.32083, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "90-94", "bbox": {"l": 364.61267, "t": 217.33452999999997, "r": 384.32083, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 394.2825, "t": 217.33452999999997, "r": 418.16003, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "98-100", "bbox": {"l": 394.2825, "t": 217.33452999999997, "r": 418.16003, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 428.1217, "t": 217.33452999999997, "r": 447.82986, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "91-92", "bbox": {"l": 428.1217, "t": 217.33452999999997, "r": 447.82986, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 457.80051, "t": 217.33452999999997, "r": 477.50867, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "97-99", "bbox": {"l": 457.80051, "t": 217.33452999999997, "r": 477.50867, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 487.47034, "t": 217.33452999999997, "r": 507.17849999999993, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "81-86", "bbox": {"l": 487.47034, "t": 217.33452999999997, "r": 507.17849999999993, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 104.825, "t": 228.29351999999994, "r": 130.80963, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "Picture", "bbox": {"l": 104.825, "t": 228.29351999999994, "r": 130.80963, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 177.866, "t": 228.29351999999994, "r": 198.71288, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "45976", "bbox": {"l": 177.866, "t": 228.29351999999994, "r": 198.71288, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 219.211, "t": 228.29351999999994, "r": 233.69174000000004, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "4.21", "bbox": {"l": 219.211, "t": 228.29351999999994, "r": 233.69174000000004, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 250.01956, "t": 228.29351999999994, "r": 264.50031, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "2.78", "bbox": {"l": 250.01956, "t": 228.29351999999994, "r": 264.50031, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 280.82812, "t": 228.29351999999994, "r": 295.30887, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "5.31", "bbox": {"l": 280.82812, "t": 228.29351999999994, "r": 295.30887, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 305.27301, "t": 228.29351999999994, "r": 324.98117, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "69-71", "bbox": {"l": 305.27301, "t": 228.29351999999994, "r": 324.98117, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 334.94284, "t": 228.29351999999994, "r": 354.651, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "56-59", "bbox": {"l": 334.94284, "t": 228.29351999999994, "r": 354.651, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 364.61267, "t": 228.29351999999994, "r": 384.32083, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "82-86", "bbox": {"l": 364.61267, "t": 228.29351999999994, "r": 384.32083, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 398.45187, "t": 228.29351999999994, "r": 418.16003, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "69-82", "bbox": {"l": 398.45187, "t": 228.29351999999994, "r": 418.16003, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 428.1217, "t": 228.29351999999994, "r": 447.82986, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "80-95", "bbox": {"l": 428.1217, "t": 228.29351999999994, "r": 447.82986, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 457.80051, "t": 228.29351999999994, "r": 477.50867, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "66-71", "bbox": {"l": 457.80051, "t": 228.29351999999994, "r": 477.50867, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 487.47034, "t": 228.29351999999994, "r": 507.17849999999993, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "59-76", "bbox": {"l": 487.47034, "t": 228.29351999999994, "r": 507.17849999999993, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 104.825, "t": 239.25256000000002, "r": 159.56487, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": "Section-header", "bbox": {"l": 104.825, "t": 239.25256000000002, "r": 159.56487, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 173.69701, "t": 239.25256000000002, "r": 198.71326, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "142884", "bbox": {"l": 173.69701, "t": 239.25256000000002, "r": 198.71326, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 215.04201, "t": 239.25256000000002, "r": 233.69212, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "12.60", "bbox": {"l": 215.04201, "t": 239.25256000000002, "r": 233.69212, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 245.85056, "t": 239.25256000000002, "r": 264.50067, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": "15.77", "bbox": {"l": 245.85056, "t": 239.25256000000002, "r": 264.50067, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 276.65912, "t": 239.25256000000002, "r": 295.30923, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 107, "text": "12.85", "bbox": {"l": 276.65912, "t": 239.25256000000002, "r": 295.30923, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 114, "label": "text", "bbox": {"l": 305.27301, "t": 239.25256000000002, "r": 324.98117, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 108, "text": "83-84", "bbox": {"l": 305.27301, "t": 239.25256000000002, "r": 324.98117, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 115, "label": "text", "bbox": {"l": 334.94284, "t": 239.25256000000002, "r": 354.651, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 109, "text": "76-81", "bbox": {"l": 334.94284, "t": 239.25256000000002, "r": 354.651, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 116, "label": "text", "bbox": {"l": 364.61267, "t": 239.25256000000002, "r": 384.32083, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 110, "text": "90-92", "bbox": {"l": 364.61267, "t": 239.25256000000002, "r": 384.32083, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 117, "label": "text", "bbox": {"l": 398.45187, "t": 239.25256000000002, "r": 418.16003, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 111, "text": "94-95", "bbox": {"l": 398.45187, "t": 239.25256000000002, "r": 418.16003, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 118, "label": "text", "bbox": {"l": 428.1217, "t": 239.25256000000002, "r": 447.82986, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 112, "text": "87-94", "bbox": {"l": 428.1217, "t": 239.25256000000002, "r": 447.82986, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 119, "label": "text", "bbox": {"l": 457.80051, "t": 239.25256000000002, "r": 477.50867, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 113, "text": "69-73", "bbox": {"l": 457.80051, "t": 239.25256000000002, "r": 477.50867, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 120, "label": "text", "bbox": {"l": 487.47034, "t": 239.25256000000002, "r": 507.17849999999993, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 114, "text": "78-86", "bbox": {"l": 487.47034, "t": 239.25256000000002, "r": 507.17849999999993, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 121, "label": "text", "bbox": {"l": 104.825, "t": 250.21155, "r": 124.63177, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 115, "text": "Table", "bbox": {"l": 104.825, "t": 250.21155, "r": 124.63177, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 122, "label": "text", "bbox": {"l": 177.866, "t": 250.21155, "r": 198.71288, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 116, "text": "34733", "bbox": {"l": 177.866, "t": 250.21155, "r": 198.71288, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 123, "label": "text", "bbox": {"l": 219.211, "t": 250.21155, "r": 233.69174000000004, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 117, "text": "3.20", "bbox": {"l": 219.211, "t": 250.21155, "r": 233.69174000000004, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 124, "label": "text", "bbox": {"l": 250.01956, "t": 250.21155, "r": 264.50031, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 118, "text": "2.27", "bbox": {"l": 250.01956, "t": 250.21155, "r": 264.50031, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 125, "label": "text", "bbox": {"l": 280.82812, "t": 250.21155, "r": 295.30887, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 119, "text": "3.60", "bbox": {"l": 280.82812, "t": 250.21155, "r": 295.30887, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 126, "label": "text", "bbox": {"l": 305.27301, "t": 250.21155, "r": 324.98117, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 120, "text": "77-81", "bbox": {"l": 305.27301, "t": 250.21155, "r": 324.98117, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 127, "label": "text", "bbox": {"l": 334.94284, "t": 250.21155, "r": 354.651, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 121, "text": "75-80", "bbox": {"l": 334.94284, "t": 250.21155, "r": 354.651, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 128, "label": "text", "bbox": {"l": 364.61267, "t": 250.21155, "r": 384.32083, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 122, "text": "83-86", "bbox": {"l": 364.61267, "t": 250.21155, "r": 384.32083, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 129, "label": "text", "bbox": {"l": 398.45187, "t": 250.21155, "r": 418.16003, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 123, "text": "98-99", "bbox": {"l": 398.45187, "t": 250.21155, "r": 418.16003, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 130, "label": "text", "bbox": {"l": 428.1217, "t": 250.21155, "r": 447.82986, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 124, "text": "58-80", "bbox": {"l": 428.1217, "t": 250.21155, "r": 447.82986, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 131, "label": "text", "bbox": {"l": 457.80051, "t": 250.21155, "r": 477.50867, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 125, "text": "79-84", "bbox": {"l": 457.80051, "t": 250.21155, "r": 477.50867, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 132, "label": "text", "bbox": {"l": 487.47034, "t": 250.21155, "r": 507.17849999999993, "b": 258.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 126, "text": "70-85", "bbox": {"l": 487.47034, "t": 250.21155, "r": 507.17849999999993, "b": 258.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 133, "label": "text", "bbox": {"l": 104.825, "t": 261.16956000000005, "r": 120.78519, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 127, "text": "Text", "bbox": {"l": 104.825, "t": 261.16956000000005, "r": 120.78519, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 134, "label": "text", "bbox": {"l": 173.69701, "t": 261.16956000000005, "r": 198.71326, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 128, "text": "510377", "bbox": {"l": 173.69701, "t": 261.16956000000005, "r": 198.71326, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 135, "label": "text", "bbox": {"l": 215.04201, "t": 261.16956000000005, "r": 233.69212, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 129, "text": "45.82", "bbox": {"l": 215.04201, "t": 261.16956000000005, "r": 233.69212, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 136, "label": "text", "bbox": {"l": 245.85056, "t": 261.16956000000005, "r": 264.50067, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 130, "text": "49.28", "bbox": {"l": 245.85056, "t": 261.16956000000005, "r": 264.50067, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 137, "label": "text", "bbox": {"l": 276.65912, "t": 261.16956000000005, "r": 295.30923, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 131, "text": "45.00", "bbox": {"l": 276.65912, "t": 261.16956000000005, "r": 295.30923, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 138, "label": "text", "bbox": {"l": 305.27301, "t": 261.16956000000005, "r": 324.98117, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 132, "text": "84-86", "bbox": {"l": 305.27301, "t": 261.16956000000005, "r": 324.98117, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 139, "label": "text", "bbox": {"l": 334.94284, "t": 261.16956000000005, "r": 354.651, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 133, "text": "81-86", "bbox": {"l": 334.94284, "t": 261.16956000000005, "r": 354.651, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 140, "label": "text", "bbox": {"l": 364.61267, "t": 261.16956000000005, "r": 384.32083, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 134, "text": "88-93", "bbox": {"l": 364.61267, "t": 261.16956000000005, "r": 384.32083, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 141, "label": "text", "bbox": {"l": 398.45187, "t": 261.16956000000005, "r": 418.16003, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 135, "text": "89-93", "bbox": {"l": 398.45187, "t": 261.16956000000005, "r": 418.16003, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 142, "label": "text", "bbox": {"l": 428.1217, "t": 261.16956000000005, "r": 447.82986, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 136, "text": "87-92", "bbox": {"l": 428.1217, "t": 261.16956000000005, "r": 447.82986, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 143, "label": "text", "bbox": {"l": 457.80051, "t": 261.16956000000005, "r": 477.50867, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 137, "text": "71-79", "bbox": {"l": 457.80051, "t": 261.16956000000005, "r": 477.50867, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 144, "label": "text", "bbox": {"l": 487.47034, "t": 261.16956000000005, "r": 507.17849999999993, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 138, "text": "87-95", "bbox": {"l": 487.47034, "t": 261.16956000000005, "r": 507.17849999999993, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 145, "label": "text", "bbox": {"l": 104.825, "t": 272.12854000000004, "r": 121.81633, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 139, "text": "Title", "bbox": {"l": 104.825, "t": 272.12854000000004, "r": 121.81633, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 146, "label": "text", "bbox": {"l": 182.035, "t": 272.12854000000004, "r": 198.71251, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 140, "text": "5071", "bbox": {"l": 182.035, "t": 272.12854000000004, "r": 198.71251, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 147, "label": "text", "bbox": {"l": 219.211, "t": 272.12854000000004, "r": 233.69174000000004, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 141, "text": "0.47", "bbox": {"l": 219.211, "t": 272.12854000000004, "r": 233.69174000000004, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 148, "label": "text", "bbox": {"l": 250.01956, "t": 272.12854000000004, "r": 264.50031, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 142, "text": "0.30", "bbox": {"l": 250.01956, "t": 272.12854000000004, "r": 264.50031, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 149, "label": "text", "bbox": {"l": 280.82812, "t": 272.12854000000004, "r": 295.30887, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 143, "text": "0.50", "bbox": {"l": 280.82812, "t": 272.12854000000004, "r": 295.30887, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 150, "label": "text", "bbox": {"l": 305.27301, "t": 272.12854000000004, "r": 324.98117, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 144, "text": "60-72", "bbox": {"l": 305.27301, "t": 272.12854000000004, "r": 324.98117, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 151, "label": "text", "bbox": {"l": 334.94284, "t": 272.12854000000004, "r": 354.651, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 145, "text": "24-63", "bbox": {"l": 334.94284, "t": 272.12854000000004, "r": 354.651, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 152, "label": "text", "bbox": {"l": 364.61267, "t": 272.12854000000004, "r": 384.32083, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 146, "text": "50-63", "bbox": {"l": 364.61267, "t": 272.12854000000004, "r": 384.32083, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 153, "label": "text", "bbox": {"l": 394.2825, "t": 272.12854000000004, "r": 418.16003, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 147, "text": "94-100", "bbox": {"l": 394.2825, "t": 272.12854000000004, "r": 418.16003, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 154, "label": "text", "bbox": {"l": 428.1217, "t": 272.12854000000004, "r": 447.82986, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 148, "text": "82-96", "bbox": {"l": 428.1217, "t": 272.12854000000004, "r": 447.82986, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 155, "label": "text", "bbox": {"l": 457.80051, "t": 272.12854000000004, "r": 477.50867, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 149, "text": "68-79", "bbox": {"l": 457.80051, "t": 272.12854000000004, "r": 477.50867, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 156, "label": "text", "bbox": {"l": 487.47034, "t": 272.12854000000004, "r": 507.17849999999993, "b": 280.50317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 150, "text": "24-56", "bbox": {"l": 487.47034, "t": 272.12854000000004, "r": 507.17849999999993, "b": 280.50317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 157, "label": "text", "bbox": {"l": 104.825, "t": 283.48654, "r": 123.43028, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 151, "text": "Total", "bbox": {"l": 104.825, "t": 283.48654, "r": 123.43028, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 158, "label": "text", "bbox": {"l": 169.52699, "t": 283.48654, "r": 198.71263, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 152, "text": "1107470", "bbox": {"l": 169.52699, "t": 283.48654, "r": 198.71263, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 159, "label": "text", "bbox": {"l": 208.675, "t": 283.48654, "r": 233.69124999999997, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 153, "text": "941123", "bbox": {"l": 208.675, "t": 283.48654, "r": 233.69124999999997, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 160, "label": "text", "bbox": {"l": 243.65291999999997, "t": 283.48654, "r": 264.49982, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 154, "text": "99816", "bbox": {"l": 243.65291999999997, "t": 283.48654, "r": 264.49982, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 161, "label": "text", "bbox": {"l": 274.46149, "t": 283.48654, "r": 295.30838, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 155, "text": "66531", "bbox": {"l": 274.46149, "t": 283.48654, "r": 295.30838, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 162, "label": "text", "bbox": {"l": 305.27301, "t": 283.48654, "r": 324.98117, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 156, "text": "82-83", "bbox": {"l": 305.27301, "t": 283.48654, "r": 324.98117, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 163, "label": "text", "bbox": {"l": 334.94284, "t": 283.48654, "r": 354.651, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 157, "text": "71-74", "bbox": {"l": 334.94284, "t": 283.48654, "r": 354.651, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 164, "label": "text", "bbox": {"l": 364.61267, "t": 283.48654, "r": 384.32083, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 158, "text": "79-81", "bbox": {"l": 364.61267, "t": 283.48654, "r": 384.32083, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 165, "label": "text", "bbox": {"l": 398.45187, "t": 283.48654, "r": 418.16003, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 159, "text": "89-94", "bbox": {"l": 398.45187, "t": 283.48654, "r": 418.16003, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 166, "label": "text", "bbox": {"l": 428.1217, "t": 283.48654, "r": 447.82986, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 160, "text": "86-91", "bbox": {"l": 428.1217, "t": 283.48654, "r": 447.82986, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 167, "label": "text", "bbox": {"l": 457.80051, "t": 283.48654, "r": 477.50867, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 161, "text": "71-76", "bbox": {"l": 457.80051, "t": 283.48654, "r": 477.50867, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 168, "label": "text", "bbox": {"l": 487.47034, "t": 283.48654, "r": 507.17849999999993, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 162, "text": "68-85", "bbox": {"l": 487.47034, "t": 283.48654, "r": 507.17849999999993, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "lcel", "lcel", "lcel", "ched", "lcel", "lcel", "lcel", "lcel", "lcel", "nl", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 14, "num_cols": 12, "table_cells": [{"bbox": {"l": 233.94400000000002, "t": 140.22351000000003, "r": 270.04272, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 4, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 6, "text": "% of Total", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 329.04999, "t": 140.22351000000003, "r": 483.3976400000001, "b": 148.59813999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 6, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 6, "end_col_offset_idx": 12, "text": "triple inter-annotator mAP @ 0.5-0.95 (%)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 151.18255999999997, "r": 141.71277, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "class label", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 175.94701, "t": 151.18255999999997, "r": 198.71269, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Count", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 213.795, "t": 151.18255999999997, "r": 233.69144, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Train", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 249.37367, "t": 151.18255999999997, "r": 264.5, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Test", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 283.53568, "t": 151.18255999999997, "r": 295.30856, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Val", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 314.01501, "t": 151.18255999999997, "r": 324.98093, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "All", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 343.01236, "t": 151.18255999999997, "r": 354.65076, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "Fin", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 367.84033, "t": 151.18255999999997, "r": 384.32059, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "Man", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 407.54358, "t": 151.18255999999997, "r": 418.15979, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "Sci", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 432.29979999999995, "t": 151.18255999999997, "r": 447.82962, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "Law", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 465.72656, "t": 151.18255999999997, "r": 477.50842, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "Pat", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 493.52240000000006, "t": 151.18255999999997, "r": 507.17822, "b": 159.55719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "Ten", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 162.53954999999996, "r": 134.01064, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Caption", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 177.866, "t": 162.53954999999996, "r": 198.71288, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "22524", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 162.53954999999996, "r": 233.69174000000004, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "2.04", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 162.53954999999996, "r": 264.50031, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "1.77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 162.53954999999996, "r": 295.30887, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "2.32", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 162.53954999999996, "r": 324.98117, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "84-89", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 162.53954999999996, "r": 354.651, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "40-61", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 162.53954999999996, "r": 384.32083, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "86-92", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45187, "t": 162.53954999999996, "r": 418.16003, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "94-99", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 162.53954999999996, "r": 447.82986, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "95-99", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 162.53954999999996, "r": 477.50867, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "69-78", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 495.32489, "t": 162.53954999999996, "r": 507.17846999999995, "b": 170.91418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 173.49854000000005, "r": 137.3282, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Footnote", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 182.035, "t": 173.49854000000005, "r": 198.71251, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "6318", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 173.49854000000005, "r": 233.69174000000004, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.60", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 173.49854000000005, "r": 264.50031, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.31", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 173.49854000000005, "r": 295.30887, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.58", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 173.49854000000005, "r": 324.98117, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "83-91", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 342.79739, "t": 173.49854000000005, "r": 354.65097, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 371.81265, "t": 173.49854000000005, "r": 384.32077, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "100", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45181, "t": 173.49854000000005, "r": 418.15997, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "62-88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.12164, "t": 173.49854000000005, "r": 447.8298, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "85-94", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 465.655, "t": 173.49854000000005, "r": 477.50857999999994, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47025, "t": 173.49854000000005, "r": 507.17841, "b": 181.87316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "82-97", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 184.45752000000005, "r": 135.33766, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Formula", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 177.866, "t": 184.45752000000005, "r": 198.71288, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "25027", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 184.45752000000005, "r": 233.69174000000004, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "2.25", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 184.45752000000005, "r": 264.50031, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "1.90", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 184.45752000000005, "r": 295.30887, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "2.96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 184.45752000000005, "r": 324.98117, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "83-85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 342.79739, "t": 184.45752000000005, "r": 354.65097, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 372.46719, "t": 184.45752000000005, "r": 384.32077, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45181, "t": 184.45752000000005, "r": 418.15997, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "84-87", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.12164, "t": 184.45752000000005, "r": 447.8298, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "86-96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 465.655, "t": 184.45752000000005, "r": 477.50857999999994, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 495.3248, "t": 184.45752000000005, "r": 507.17838000000006, "b": 192.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "n/a", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 195.41656, "r": 137.70479, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "List-item", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 173.69701, "t": 195.41656, "r": 198.71326, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "185660", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 215.04201, "t": 195.41656, "r": 233.69212, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "17.19", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.85056, "t": 195.41656, "r": 264.50067, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "13.34", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 276.65912, "t": 195.41656, "r": 295.30923, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "15.82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 195.41656, "r": 324.98117, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "87-88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 195.41656, "r": 354.651, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "74-83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 195.41656, "r": 384.32083, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "90-92", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45187, "t": 195.41656, "r": 418.16003, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "97-97", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 195.41656, "r": 447.82986, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "81-85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 195.41656, "r": 477.50867, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "75-88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 195.41656, "r": 507.17849999999993, "b": 203.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "93-95", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 206.37554999999998, "r": 147.35262, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-footer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 177.866, "t": 206.37554999999998, "r": 198.71288, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "70878", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 206.37554999999998, "r": 233.69174000000004, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "6.51", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 206.37554999999998, "r": 264.50031, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "5.58", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 206.37554999999998, "r": 295.30887, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "6.00", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 206.37554999999998, "r": 324.98117, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "93-94", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 206.37554999999998, "r": 354.651, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "88-90", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 206.37554999999998, "r": 384.32083, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "95-96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 405.65189, "t": 206.37554999999998, "r": 418.16, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "100", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.12167, "t": 206.37554999999998, "r": 447.82983, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "92-97", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 465.00049, "t": 206.37554999999998, "r": 477.5086099999999, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "100", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47028, "t": 206.37554999999998, "r": 507.17843999999997, "b": 214.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "96-98", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 217.33452999999997, "r": 150.10532, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 177.866, "t": 217.33452999999997, "r": 198.71288, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "58022", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 217.33452999999997, "r": 233.69174000000004, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "5.10", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 217.33452999999997, "r": 264.50031, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "6.70", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 217.33452999999997, "r": 295.30887, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "5.06", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 217.33452999999997, "r": 324.98117, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "85-89", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 217.33452999999997, "r": 354.651, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "66-76", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 217.33452999999997, "r": 384.32083, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "90-94", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.2825, "t": 217.33452999999997, "r": 418.16003, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "98-100", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 217.33452999999997, "r": 447.82986, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "91-92", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 217.33452999999997, "r": 477.50867, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "97-99", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 217.33452999999997, "r": 507.17849999999993, "b": 225.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "81-86", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 228.29351999999994, "r": 130.80963, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Picture", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 177.866, "t": 228.29351999999994, "r": 198.71288, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "45976", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 228.29351999999994, "r": 233.69174000000004, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "4.21", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 228.29351999999994, "r": 264.50031, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "2.78", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 228.29351999999994, "r": 295.30887, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "5.31", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 228.29351999999994, "r": 324.98117, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "69-71", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 228.29351999999994, "r": 354.651, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "56-59", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 228.29351999999994, "r": 384.32083, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "82-86", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45187, "t": 228.29351999999994, "r": 418.16003, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "69-82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 228.29351999999994, "r": 447.82986, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "80-95", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 228.29351999999994, "r": 477.50867, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "66-71", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 228.29351999999994, "r": 507.17849999999993, "b": 236.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "59-76", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 239.25256000000002, "r": 159.56487, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Section-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 173.69701, "t": 239.25256000000002, "r": 198.71326, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "142884", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 215.04201, "t": 239.25256000000002, "r": 233.69212, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "12.60", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.85056, "t": 239.25256000000002, "r": 264.50067, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "15.77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 276.65912, "t": 239.25256000000002, "r": 295.30923, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "12.85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 239.25256000000002, "r": 324.98117, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "83-84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 239.25256000000002, "r": 354.651, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "76-81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 239.25256000000002, "r": 384.32083, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "90-92", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45187, "t": 239.25256000000002, "r": 418.16003, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "94-95", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 239.25256000000002, "r": 447.82986, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "87-94", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 239.25256000000002, "r": 477.50867, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "69-73", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 239.25256000000002, "r": 507.17849999999993, "b": 247.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "78-86", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 250.21155, "r": 124.63177, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 177.866, "t": 250.21155, "r": 198.71288, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "34733", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 250.21155, "r": 233.69174000000004, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "3.20", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 250.21155, "r": 264.50031, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "2.27", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 250.21155, "r": 295.30887, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "3.60", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 250.21155, "r": 324.98117, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "77-81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 250.21155, "r": 354.651, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "75-80", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 250.21155, "r": 384.32083, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "83-86", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45187, "t": 250.21155, "r": 418.16003, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "98-99", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 250.21155, "r": 447.82986, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "58-80", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 250.21155, "r": 477.50867, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "79-84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 250.21155, "r": 507.17849999999993, "b": 258.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "70-85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 261.16956000000005, "r": 120.78519, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Text", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 173.69701, "t": 261.16956000000005, "r": 198.71326, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "510377", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 215.04201, "t": 261.16956000000005, "r": 233.69212, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "45.82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.85056, "t": 261.16956000000005, "r": 264.50067, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "49.28", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 276.65912, "t": 261.16956000000005, "r": 295.30923, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "45.00", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 261.16956000000005, "r": 324.98117, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "84-86", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 261.16956000000005, "r": 354.651, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "81-86", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 261.16956000000005, "r": 384.32083, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "88-93", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45187, "t": 261.16956000000005, "r": 418.16003, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "89-93", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 261.16956000000005, "r": 447.82986, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "87-92", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 261.16956000000005, "r": 477.50867, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "71-79", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 261.16956000000005, "r": 507.17849999999993, "b": 269.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "87-95", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 272.12854000000004, "r": 121.81633, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Title", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 182.035, "t": 272.12854000000004, "r": 198.71251, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "5071", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 219.211, "t": 272.12854000000004, "r": 233.69174000000004, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.47", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 250.01956, "t": 272.12854000000004, "r": 264.50031, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.30", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.82812, "t": 272.12854000000004, "r": 295.30887, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.50", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 272.12854000000004, "r": 324.98117, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "60-72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 272.12854000000004, "r": 354.651, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "24-63", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 272.12854000000004, "r": 384.32083, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "50-63", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.2825, "t": 272.12854000000004, "r": 418.16003, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "94-100", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 272.12854000000004, "r": 447.82986, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "82-96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 272.12854000000004, "r": 477.50867, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "68-79", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 272.12854000000004, "r": 507.17849999999993, "b": 280.50317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "24-56", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 104.825, "t": 283.48654, "r": 123.43028, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Total", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 169.52699, "t": 283.48654, "r": 198.71263, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "1107470", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 208.675, "t": 283.48654, "r": 233.69124999999997, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "941123", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 243.65291999999997, "t": 283.48654, "r": 264.49982, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "99816", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 274.46149, "t": 283.48654, "r": 295.30838, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "66531", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 305.27301, "t": 283.48654, "r": 324.98117, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "82-83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 334.94284, "t": 283.48654, "r": 354.651, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "71-74", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 364.61267, "t": 283.48654, "r": 384.32083, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "79-81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 398.45187, "t": 283.48654, "r": 418.16003, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 8, "end_col_offset_idx": 9, "text": "89-94", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 428.1217, "t": 283.48654, "r": 447.82986, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 9, "end_col_offset_idx": 10, "text": "86-91", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 457.80051, "t": 283.48654, "r": 477.50867, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 10, "end_col_offset_idx": 11, "text": "71-76", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 487.47034, "t": 283.48654, "r": 507.17849999999993, "b": 291.86118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 11, "end_col_offset_idx": 12, "text": "68-85", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "caption", "id": 9, "page_no": 3, "cluster": {"id": 9, "label": "caption", "bbox": {"l": 53.79800000000001, "t": 554.00999, "r": 295.64874, "b": 606.31924, "coord_origin": "TOPLEFT"}, "confidence": 0.810490071773529, "cells": [{"id": 163, "text": "Figure 3: Corpus Conversion Service annotation user inter-", "bbox": {"l": 53.79800000000001, "t": 554.00999, "r": 295.64871, "b": 562.48325, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "face. The PDF page is shown in the background, with over-", "bbox": {"l": 53.79800000000001, "t": 564.96899, "r": 295.64874, "b": 573.44225, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "laid text-cells (in darker shades). The annotation boxes can", "bbox": {"l": 53.79800000000001, "t": 575.92799, "r": 294.04376, "b": 584.40125, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "be drawn by dragging a rectangle over each segment with", "bbox": {"l": 53.79800000000001, "t": 586.88699, "r": 294.04373, "b": 595.36024, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "the respective label from the palette on the right.", "bbox": {"l": 53.79800000000001, "t": 597.84599, "r": 252.78931000000003, "b": 606.31924, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 3: Corpus Conversion Service annotation user interface. The PDF page is shown in the background, with overlaid text-cells (in darker shades). The annotation boxes can be drawn by dragging a rectangle over each segment with the respective label from the palette on the right."}, {"label": "text", "id": 5, "page_no": 3, "cluster": {"id": 5, "label": "text", "bbox": {"l": 53.466999, "t": 634.29155, "r": 294.04745, "b": 675.54317, "coord_origin": "TOPLEFT"}, "confidence": 0.980393648147583, "cells": [{"id": 168, "text": "we distributed the annotation workload and performed continuous", "bbox": {"l": 53.466999, "t": 634.29155, "r": 294.04745, "b": 642.66617, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "quality controls. Phase one and two required a small team of experts", "bbox": {"l": 53.79800000000001, "t": 645.25055, "r": 294.04535, "b": 653.62517, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "only. For phases three and four, a group of 40 dedicated annotators", "bbox": {"l": 53.79800000000001, "t": 656.20955, "r": 294.04422, "b": 664.58417, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "were assembled and supervised.", "bbox": {"l": 53.466999, "t": 667.16856, "r": 170.58611, "b": 675.54317, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "we distributed the annotation workload and performed continuous quality controls. Phase one and two required a small team of experts only. For phases three and four, a group of 40 dedicated annotators were assembled and supervised."}, {"label": "text", "id": 6, "page_no": 3, "cluster": {"id": 6, "label": "text", "bbox": {"l": 53.79800000000001, "t": 678.01099, "r": 295.55844, "b": 708.420174, "coord_origin": "TOPLEFT"}, "confidence": 0.9748398661613464, "cells": [{"id": 172, "text": "Phase 1: Data selection and preparation.", "bbox": {"l": 63.76099800000001, "t": 678.01099, "r": 226.72533000000004, "b": 686.48424, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "Our inclusion cri-", "bbox": {"l": 229.06900000000002, "t": 678.12756, "r": 295.55844, "b": 686.50217, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "teria for documents were described in Section 3. A large effort went", "bbox": {"l": 53.79800000000001, "t": 689.08656, "r": 294.04538, "b": 697.461174, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "into ensuring that all documents are free to use. The data sources", "bbox": {"l": 53.79800000000001, "t": 700.045555, "r": 294.04642, "b": 708.420174, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Phase 1: Data selection and preparation. Our inclusion criteria for documents were described in Section 3. A large effort went into ensuring that all documents are free to use. The data sources"}, {"label": "text", "id": 4, "page_no": 3, "cluster": {"id": 4, "label": "text", "bbox": {"l": 317.95499, "t": 312.07953, "r": 559.18536, "b": 375.24817, "coord_origin": "TOPLEFT"}, "confidence": 0.9818483591079712, "cells": [{"id": 176, "text": "include publication repositories such as arXiv$^{3}$, government offices,", "bbox": {"l": 317.95499, "t": 312.07953, "r": 559.18536, "b": 320.45416000000006, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "company websites as well as data directory services for financial", "bbox": {"l": 317.95499, "t": 323.03754, "r": 558.19843, "b": 331.41217, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "reports and patents. Scanned documents were excluded wherever", "bbox": {"l": 317.95499, "t": 333.99655, "r": 558.36963, "b": 342.37119, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "possible because they can be rotated or skewed. This would not", "bbox": {"l": 317.95499, "t": 344.95554, "r": 558.2041, "b": 353.33017, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "allow us to perform annotation with rectangular bounding-boxes", "bbox": {"l": 317.95499, "t": 355.91455, "r": 558.20294, "b": 364.28918, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "and therefore complicate the annotation process.", "bbox": {"l": 317.95499, "t": 366.87354, "r": 496.71826, "b": 375.24817, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "include publication repositories such as arXiv$^{3}$, government offices, company websites as well as data directory services for financial reports and patents. Scanned documents were excluded wherever possible because they can be rotated or skewed. This would not allow us to perform annotation with rectangular bounding-boxes and therefore complicate the annotation process."}, {"label": "text", "id": 0, "page_no": 3, "cluster": {"id": 0, "label": "text", "bbox": {"l": 317.95499, "t": 377.8325500000001, "r": 559.71307, "b": 506.75516, "coord_origin": "TOPLEFT"}, "confidence": 0.9866719841957092, "cells": [{"id": 182, "text": "Preparation work included uploading and parsing the sourced", "bbox": {"l": 327.918, "t": 377.8325500000001, "r": 558.20618, "b": 386.20717999999994, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "PDF documents in the Corpus Conversion Service (CCS) [22], a", "bbox": {"l": 317.95499, "t": 388.79153, "r": 558.2019, "b": 397.16617, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "cloud-native platform which provides a visual annotation interface", "bbox": {"l": 317.95499, "t": 399.75055, "r": 558.20233, "b": 408.12518, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": "and allows for dataset inspection and analysis. The annotation in-", "bbox": {"l": 317.95499, "t": 410.7095299999999, "r": 559.71277, "b": 419.08417, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "terface of CCS is shown in Figure 3. The desired balance of pages", "bbox": {"l": 317.95499, "t": 421.66855000000004, "r": 558.20062, "b": 430.04318, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "between the different document categories was achieved by se-", "bbox": {"l": 317.95499, "t": 432.62753, "r": 559.71307, "b": 441.00217, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": "lective subsampling of pages with certain desired properties. For", "bbox": {"l": 317.95499, "t": 443.58554, "r": 558.36877, "b": 451.96017, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "example, we made sure to include the title page of each document", "bbox": {"l": 317.95499, "t": 454.54453, "r": 558.20428, "b": 462.91916, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "and bias the remaining page selection to those with figures or", "bbox": {"l": 317.95499, "t": 465.50354, "r": 558.36877, "b": 473.87817, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "tables. The latter was achieved by leveraging pre-trained object", "bbox": {"l": 317.95499, "t": 476.46252, "r": 558.20428, "b": 484.83716, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": "detection models from PubLayNet, which helped us estimate how", "bbox": {"l": 317.95499, "t": 487.42154, "r": 558.5307, "b": 495.79617, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "many figures and tables a given page contains.", "bbox": {"l": 317.95499, "t": 498.38052, "r": 488.46914999999996, "b": 506.75516, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Preparation work included uploading and parsing the sourced PDF documents in the Corpus Conversion Service (CCS) [22], a cloud-native platform which provides a visual annotation interface and allows for dataset inspection and analysis. The annotation interface of CCS is shown in Figure 3. The desired balance of pages between the different document categories was achieved by selective subsampling of pages with certain desired properties. For example, we made sure to include the title page of each document and bias the remaining page selection to those with figures or tables. The latter was achieved by leveraging pre-trained object detection models from PubLayNet, which helped us estimate how many figures and tables a given page contains."}, {"label": "text", "id": 3, "page_no": 3, "cluster": {"id": 3, "label": "text", "bbox": {"l": 317.62299, "t": 509.22299, "r": 559.71765, "b": 693.0561749999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9847556948661804, "cells": [{"id": 194, "text": "Phase 2: Label selection and guideline.", "bbox": {"l": 327.918, "t": 509.22299, "r": 482.41809, "b": 517.69623, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "We reviewed the col-", "bbox": {"l": 484.474, "t": 509.33954, "r": 559.71765, "b": 517.71417, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "lected documents and identified the most common structural fea-", "bbox": {"l": 317.95499, "t": 520.29855, "r": 559.71619, "b": 528.67319, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "tures they exhibit. This was achieved by identifying recurrent layout", "bbox": {"l": 317.95499, "t": 531.2575400000001, "r": 558.20239, "b": 539.63217, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "elements and lead us to the definition of 11 distinct class labels.", "bbox": {"l": 317.95499, "t": 542.21655, "r": 559.58502, "b": 550.59117, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "These 11 class labels are", "bbox": {"l": 317.686, "t": 553.17456, "r": 404.14197, "b": 561.54918, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "Caption", "bbox": {"l": 406.26599, "t": 553.21939, "r": 433.84860000000003, "b": 561.5581500000001, "coord_origin": "TOPLEFT"}}, {"id": 201, "text": ",", "bbox": {"l": 433.84799, "t": 553.17456, "r": 435.78115999999994, "b": 561.54918, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": "Footnote", "bbox": {"l": 437.9079899999999, "t": 553.21939, "r": 467.23926, "b": 561.5581500000001, "coord_origin": "TOPLEFT"}}, {"id": 203, "text": ",", "bbox": {"l": 467.23999, "t": 553.17456, "r": 469.17316000000005, "b": 561.54918, "coord_origin": "TOPLEFT"}}, {"id": 204, "text": "Formula", "bbox": {"l": 471.29900999999995, "t": 553.21939, "r": 500.44574000000006, "b": 561.5581500000001, "coord_origin": "TOPLEFT"}}, {"id": 205, "text": ",", "bbox": {"l": 500.44601000000006, "t": 553.17456, "r": 502.37918, "b": 561.54918, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": "List-item", "bbox": {"l": 504.505, "t": 553.21939, "r": 535.74304, "b": 561.5581500000001, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": ",", "bbox": {"l": 535.74298, "t": 553.17456, "r": 537.67615, "b": 561.54918, "coord_origin": "TOPLEFT"}}, {"id": 208, "text": "Page-", "bbox": {"l": 539.802, "t": 553.21939, "r": 559.09839, "b": 561.5581500000001, "coord_origin": "TOPLEFT"}}, {"id": 209, "text": "footer", "bbox": {"l": 317.95499, "t": 564.17839, "r": 338.80725, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": ",", "bbox": {"l": 338.806, "t": 564.13356, "r": 340.81805, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "Page-header", "bbox": {"l": 343.61401, "t": 564.17839, "r": 387.96164, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 212, "text": ",", "bbox": {"l": 387.961, "t": 564.13356, "r": 389.97305, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "Picture", "bbox": {"l": 392.76901, "t": 564.17839, "r": 417.84662, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 214, "text": ",", "bbox": {"l": 417.84799, "t": 564.13356, "r": 419.86005, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 215, "text": "Section-header", "bbox": {"l": 422.655, "t": 564.17839, "r": 475.56305, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 216, "text": ",", "bbox": {"l": 475.56201, "t": 564.13356, "r": 477.57407, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 217, "text": "Table", "bbox": {"l": 480.36899, "t": 564.17839, "r": 499.82196, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 218, "text": ",", "bbox": {"l": 499.8219900000001, "t": 564.13356, "r": 501.83405, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 219, "text": "Text", "bbox": {"l": 504.6290000000001, "t": 564.17839, "r": 519.7926, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 220, "text": ", and", "bbox": {"l": 519.79602, "t": 564.13356, "r": 538.37103, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 221, "text": "Title", "bbox": {"l": 541.16302, "t": 564.17839, "r": 557.57043, "b": 572.51715, "coord_origin": "TOPLEFT"}}, {"id": 222, "text": ".", "bbox": {"l": 557.57098, "t": 564.13356, "r": 559.58307, "b": 572.50818, "coord_origin": "TOPLEFT"}}, {"id": 223, "text": "Critical factors that were considered for the choice of these class", "bbox": {"l": 317.95499, "t": 575.09256, "r": 558.20416, "b": 583.46718, "coord_origin": "TOPLEFT"}}, {"id": 224, "text": "labels were (1) the overall occurrence of the label, (2) the specificity", "bbox": {"l": 317.95499, "t": 586.05156, "r": 558.43091, "b": 594.4261799999999, "coord_origin": "TOPLEFT"}}, {"id": 225, "text": "of the label, (3) recognisability on a single page (i.e. no need for", "bbox": {"l": 317.95499, "t": 597.0105599999999, "r": 558.36871, "b": 605.38518, "coord_origin": "TOPLEFT"}}, {"id": 226, "text": "context from previous or next page) and (4) overall coverage of the", "bbox": {"l": 317.95499, "t": 607.96956, "r": 558.20105, "b": 616.3441799999999, "coord_origin": "TOPLEFT"}}, {"id": 227, "text": "page. Specificity ensures that the choice of label is not ambiguous,", "bbox": {"l": 317.95499, "t": 618.9285600000001, "r": 559.18665, "b": 627.30318, "coord_origin": "TOPLEFT"}}, {"id": 228, "text": "while coverage ensures that all meaningful items on a page can", "bbox": {"l": 317.62299, "t": 629.88756, "r": 558.20142, "b": 638.26218, "coord_origin": "TOPLEFT"}}, {"id": 229, "text": "be annotated. We refrained from class labels that are very specific", "bbox": {"l": 317.95499, "t": 640.84656, "r": 558.20227, "b": 649.22118, "coord_origin": "TOPLEFT"}}, {"id": 230, "text": "to a document category, such as", "bbox": {"l": 317.95499, "t": 651.80556, "r": 436.90649, "b": 660.1801800000001, "coord_origin": "TOPLEFT"}}, {"id": 231, "text": "Abstract", "bbox": {"l": 439.13800000000003, "t": 651.8503900000001, "r": 469.69134999999994, "b": 660.18915, "coord_origin": "TOPLEFT"}}, {"id": 232, "text": "in the", "bbox": {"l": 472.42898999999994, "t": 651.80556, "r": 493.97348, "b": 660.1801800000001, "coord_origin": "TOPLEFT"}}, {"id": 233, "text": "Scientific Articles", "bbox": {"l": 496.207, "t": 651.8503900000001, "r": 558.20001, "b": 660.18915, "coord_origin": "TOPLEFT"}}, {"id": 234, "text": "category. We also avoided class labels that are tightly linked to the", "bbox": {"l": 317.95499, "t": 662.76456, "r": 558.20557, "b": 671.13918, "coord_origin": "TOPLEFT"}}, {"id": 235, "text": "semantics of the text. Labels such as", "bbox": {"l": 317.95499, "t": 673.7225599999999, "r": 447.65221999999994, "b": 682.09718, "coord_origin": "TOPLEFT"}}, {"id": 236, "text": "Author", "bbox": {"l": 449.85999, "t": 673.76739, "r": 474.31439, "b": 682.10614, "coord_origin": "TOPLEFT"}}, {"id": 237, "text": "and", "bbox": {"l": 477.172, "t": 673.7225599999999, "r": 490.39655, "b": 682.09718, "coord_origin": "TOPLEFT"}}, {"id": 238, "text": "Affiliation", "bbox": {"l": 492.60599, "t": 673.76739, "r": 528.29907, "b": 682.10614, "coord_origin": "TOPLEFT"}}, {"id": 239, "text": ", as seen", "bbox": {"l": 528.29901, "t": 673.7225599999999, "r": 558.20148, "b": 682.09718, "coord_origin": "TOPLEFT"}}, {"id": 240, "text": "in DocBank, are often only distinguishable by discriminating on", "bbox": {"l": 317.95499, "t": 684.68156, "r": 558.2041, "b": 693.0561749999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Phase 2: Label selection and guideline. We reviewed the collected documents and identified the most common structural features they exhibit. This was achieved by identifying recurrent layout elements and lead us to the definition of 11 distinct class labels. These 11 class labels are Caption , Footnote , Formula , List-item , Pagefooter , Page-header , Picture , Section-header , Table , Text , and Title . Critical factors that were considered for the choice of these class labels were (1) the overall occurrence of the label, (2) the specificity of the label, (3) recognisability on a single page (i.e. no need for context from previous or next page) and (4) overall coverage of the page. Specificity ensures that the choice of label is not ambiguous, while coverage ensures that all meaningful items on a page can be annotated. We refrained from class labels that are very specific to a document category, such as Abstract in the Scientific Articles category. We also avoided class labels that are tightly linked to the semantics of the text. Labels such as Author and Affiliation , as seen in DocBank, are often only distinguishable by discriminating on"}, {"label": "footnote", "id": 7, "page_no": 3, "cluster": {"id": 7, "label": "footnote", "bbox": {"l": 317.95499, "t": 702.353363, "r": 369.2457, "b": 708.86689, "coord_origin": "TOPLEFT"}, "confidence": 0.9080352783203125, "cells": [{"id": 241, "text": "$^{3}$https://arxiv.org/", "bbox": {"l": 317.95499, "t": 702.353363, "r": 369.2457, "b": 708.86689, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "$^{3}$https://arxiv.org/"}, {"label": "picture", "id": 2, "page_no": 3, "cluster": {"id": 2, "label": "picture", "bbox": {"l": 53.05912780761719, "t": 310.7912902832031, "r": 295.8506164550781, "b": 540.864013671875, "coord_origin": "TOPLEFT"}, "confidence": 0.9847871661186218, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "headers": [{"label": "page_header", "id": 10, "page_no": 3, "cluster": {"id": 10, "label": "page_header", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.7625049948692322, "cells": [{"id": 0, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 246.24382, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar", "bbox": {"l": 253.13897999999998, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "KDD '22, August 14-18, 2022, Washington, DC, USA Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar"}]}}, {"page_no": 4, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "the textual content of an element, which goes beyond visual layout", "bbox": {"l": 53.79800000000001, "t": 87.36352999999997, "r": 294.04541, "b": 95.73816, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "recognition, in particular outside the", "bbox": {"l": 53.79800000000001, "t": 98.32250999999997, "r": 188.1326, "b": 106.69713999999999, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Scientific Articles", "bbox": {"l": 190.37401, "t": 98.36737000000005, "r": 251.25586999999996, "b": 106.70612000000006, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "category.", "bbox": {"l": 253.70801, "t": 98.32250999999997, "r": 287.01816, "b": 106.69713999999999, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "At first sight, the task of visual document-layout interpretation", "bbox": {"l": 63.76100199999999, "t": 109.28156000000001, "r": 294.04257, "b": 117.65618999999992, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "appears intuitive enough to obtain plausible annotations in most", "bbox": {"l": 53.79800000000001, "t": 120.24054000000001, "r": 294.04266, "b": 128.61517000000003, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "cases. However, during early trial-runs in the core team, we ob-", "bbox": {"l": 53.79800000000001, "t": 131.19854999999995, "r": 295.55615, "b": 139.57317999999998, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "served many cases in which annotators use different annotation", "bbox": {"l": 53.79800000000001, "t": 142.15752999999995, "r": 294.04715, "b": 150.53216999999995, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "styles, especially for documents with challenging layouts. For ex-", "bbox": {"l": 53.79800000000001, "t": 153.11652000000004, "r": 295.55923, "b": 161.49114999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "ample, if a figure is presented with subfigures, one annotator might", "bbox": {"l": 53.79800000000001, "t": 164.07556, "r": 294.04535, "b": 172.4502, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "draw a single figure bounding-box, while another might annotate", "bbox": {"l": 53.79800000000001, "t": 175.03454999999997, "r": 294.04803, "b": 183.40918, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "each subfigure separately. The same applies for lists, where one", "bbox": {"l": 53.79800000000001, "t": 185.99352999999996, "r": 294.04709, "b": 194.36816, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "might annotate all list items in one block or each list item sep-", "bbox": {"l": 53.79800000000001, "t": 196.95250999999996, "r": 295.55612, "b": 205.32714999999996, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "arately. In essence, we observed that challenging layouts would", "bbox": {"l": 53.79800000000001, "t": 207.91156, "r": 294.04712, "b": 216.28619000000003, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "be annotated in different but plausible ways. To illustrate this, we", "bbox": {"l": 53.79800000000001, "t": 218.87054, "r": 294.04495, "b": 227.24518, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "show in Figure 4 multiple examples of plausible but inconsistent", "bbox": {"l": 53.79800000000001, "t": 229.82952999999998, "r": 294.04712, "b": 238.20416, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "annotations on the same pages.", "bbox": {"l": 53.79800000000001, "t": 240.78754000000004, "r": 168.61276, "b": 249.16216999999995, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Obviously, this inconsistency in annotations is not desirable for", "bbox": {"l": 63.76100199999999, "t": 251.74652000000003, "r": 294.21884, "b": 260.12114999999994, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "datasets which are intended to be used for model training. To min-", "bbox": {"l": 53.79800000000001, "t": 262.70556999999997, "r": 295.56006, "b": 271.0802, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "imise these inconsistencies, we created a detailed annotation guide-", "bbox": {"l": 53.79800000000001, "t": 273.66454999999996, "r": 295.55676, "b": 282.03918, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "line. While perfect consistency across 40 annotation staff members", "bbox": {"l": 53.79800000000001, "t": 284.62354, "r": 294.04922, "b": 292.99817, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "is clearly not possible to achieve, we saw a huge improvement in", "bbox": {"l": 53.79800000000001, "t": 295.5825500000001, "r": 294.04343, "b": 303.95717999999994, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "annotation consistency after the introduction of our annotation", "bbox": {"l": 53.79800000000001, "t": 306.54153, "r": 294.04712, "b": 314.91617, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "guideline. A few selected, non-trivial highlights of the guideline", "bbox": {"l": 53.79800000000001, "t": 317.50055, "r": 294.04718, "b": 325.87518, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "are:", "bbox": {"l": 53.79800000000001, "t": 328.4595299999999, "r": 67.28347, "b": 336.83417, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "(1)", "bbox": {"l": 64.708, "t": 348.51254, "r": 74.626793, "b": 356.88718, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Every list-item is an individual object instance with class", "bbox": {"l": 76.963936, "t": 348.51254, "r": 294.0462, "b": 356.88718, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "label", "bbox": {"l": 78.207001, "t": 359.47153, "r": 95.730484, "b": 367.84616, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "List-item", "bbox": {"l": 97.976997, "t": 359.51639, "r": 130.17131, "b": 367.85513, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": ". This definition is different from PubLayNet", "bbox": {"l": 130.17101, "t": 359.47153, "r": 294.04053, "b": 367.84616, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "and DocBank, where all list-items are grouped together into", "bbox": {"l": 78.207001, "t": 370.43054, "r": 294.04385, "b": 378.80518, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "one", "bbox": {"l": 78.207001, "t": 381.38953000000004, "r": 91.593834, "b": 389.76416, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "List", "bbox": {"l": 93.834999, "t": 381.43439000000006, "r": 106.88111, "b": 389.77313, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "object.", "bbox": {"l": 109.629, "t": 381.38953000000004, "r": 133.72173, "b": 389.76416, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "(2)", "bbox": {"l": 64.707993, "t": 392.34851, "r": 75.097656, "b": 400.72313999999994, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "A", "bbox": {"l": 77.545731, "t": 392.34851, "r": 84.351402, "b": 400.72313999999994, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "List-item", "bbox": {"l": 86.584, "t": 392.39339999999993, "r": 118.01329000000001, "b": 400.73215, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "is a paragraph with hanging indentation. Single-", "bbox": {"l": 120.26899999999999, "t": 392.34854, "r": 295.55695, "b": 400.72317999999996, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "line elements can qualify as", "bbox": {"l": 78.207001, "t": 403.30753, "r": 181.80978, "b": 411.68216, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "List-item", "bbox": {"l": 184.175, "t": 403.35239, "r": 216.68806000000004, "b": 411.69113, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "if the neighbour ele-", "bbox": {"l": 219.078, "t": 403.30753, "r": 295.56372, "b": 411.68216, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "ments expose hanging indentation. Bullet or enumeration", "bbox": {"l": 78.207001, "t": 414.2665400000001, "r": 294.04617, "b": 422.64116999999993, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "symbols are not a requirement.", "bbox": {"l": 78.207001, "t": 425.22552, "r": 192.00853, "b": 433.60016, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "(3)", "bbox": {"l": 64.708, "t": 436.18451000000005, "r": 74.483009, "b": 444.55914, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "For every", "bbox": {"l": 76.786255, "t": 436.18451000000005, "r": 112.61566, "b": 444.55914, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "Caption", "bbox": {"l": 114.861, "t": 436.2294, "r": 142.61249, "b": 444.56815000000006, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": ", there must be exactly one corresponding", "bbox": {"l": 142.612, "t": 436.18454, "r": 294.04724, "b": 444.55917, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "Picture", "bbox": {"l": 78.207001, "t": 447.18839, "r": 102.79287, "b": 455.52713, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "or", "bbox": {"l": 105.245, "t": 447.14352, "r": 113.09956999999999, "b": 455.51815999999997, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Table", "bbox": {"l": 115.341, "t": 447.18839, "r": 134.40356, "b": 455.52713, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": ".", "bbox": {"l": 134.403, "t": 447.14352, "r": 136.37561, "b": 455.51815999999997, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "(4)", "bbox": {"l": 64.708, "t": 458.1015300000001, "r": 74.220215, "b": 466.47617, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "Connected sub-pictures are grouped together in one", "bbox": {"l": 76.461555, "t": 458.1015300000001, "r": 267.46786, "b": 466.47617, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "Picture", "bbox": {"l": 269.70599, "t": 458.14639, "r": 294.04599, "b": 466.48514, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "object.", "bbox": {"l": 78.207001, "t": 469.06055, "r": 102.29972, "b": 477.43518, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "(5)", "bbox": {"l": 64.708, "t": 480.01953, "r": 74.345383, "b": 488.39417, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Formula numbers are included in a", "bbox": {"l": 76.616203, "t": 480.01953, "r": 206.13503, "b": 488.39417, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Formula", "bbox": {"l": 208.38, "t": 480.06439, "r": 238.12155, "b": 488.40314, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "object.", "bbox": {"l": 240.41300999999999, "t": 480.01953, "r": 264.50571, "b": 488.39417, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "(6)", "bbox": {"l": 64.708008, "t": 490.97852, "r": 74.564522, "b": 499.35315, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "Emphasised text (e.g. in italic or bold) at the beginning of", "bbox": {"l": 76.886978, "t": 490.97852, "r": 294.04617, "b": 499.35315, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "a paragraph is not considered a", "bbox": {"l": 78.207001, "t": 501.93753, "r": 200.34819, "b": 510.31216, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "Section-header", "bbox": {"l": 203.66701, "t": 501.98239, "r": 256.57504, "b": 510.32114, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": ", unless it", "bbox": {"l": 256.57401, "t": 501.93753, "r": 294.04401, "b": 510.31216, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "appears exclusively on its own line.", "bbox": {"l": 78.207001, "t": 512.8965499999999, "r": 208.13017, "b": 521.27118, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "The complete annotation guideline is over 100 pages long and a", "bbox": {"l": 53.528999, "t": 532.9505300000001, "r": 294.04337, "b": 541.32516, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "detailed description is obviously out of scope for this paper. Never-", "bbox": {"l": 53.79800000000001, "t": 543.90855, "r": 295.56253, "b": 552.28317, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "theless, it will be made publicly available alongside with DocLayNet", "bbox": {"l": 53.79800000000001, "t": 554.8675499999999, "r": 294.04538, "b": 563.24217, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "for future reference.", "bbox": {"l": 53.79800000000001, "t": 565.82655, "r": 127.2418, "b": 574.20117, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Phase 3: Training.", "bbox": {"l": 63.76100199999999, "t": 576.66899, "r": 136.7744, "b": 585.14224, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "After a first trial with a small group of peo-", "bbox": {"l": 139.008, "t": 576.7855500000001, "r": 295.56226, "b": 585.16017, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "ple, we realised that providing the annotation guideline and a set of", "bbox": {"l": 53.79800000000001, "t": 587.74455, "r": 294.04532, "b": 596.1191699999999, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "random practice pages did not yield the desired quality level for lay-", "bbox": {"l": 53.79800000000001, "t": 598.70355, "r": 295.55676, "b": 607.07817, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "out annotation. Therefore we prepared a subset of pages with two", "bbox": {"l": 53.79800000000001, "t": 609.66255, "r": 294.04605, "b": 618.0371700000001, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "different complexity levels, each with a practice and an exam part.", "bbox": {"l": 53.79800000000001, "t": 620.6215500000001, "r": 295.42377, "b": 628.99617, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "974 pages were reference-annotated by one proficient core team", "bbox": {"l": 53.79800000000001, "t": 631.58055, "r": 294.04712, "b": 639.95517, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "member. Annotation staff were then given the task to annotate the", "bbox": {"l": 53.79800000000001, "t": 642.53955, "r": 294.04922, "b": 650.91417, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "same subsets (blinded from the reference). By comparing the an-", "bbox": {"l": 53.79800000000001, "t": 653.49855, "r": 295.55618, "b": 661.87317, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "notations of each staff member with the reference annotations, we", "bbox": {"l": 53.79800000000001, "t": 664.45655, "r": 294.04874, "b": 672.83117, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "could quantify how closely their annotations matched the reference.", "bbox": {"l": 53.79800000000001, "t": 675.4155499999999, "r": 295.42496, "b": 683.79017, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "Only after passing two exam levels with high annotation quality,", "bbox": {"l": 53.79800000000001, "t": 686.37456, "r": 295.0274, "b": 694.749176, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "staff were admitted into the production phase. Practice iterations", "bbox": {"l": 53.79800000000001, "t": 697.333557, "r": 294.04114, "b": 705.708176, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "1ef23f5e6d7f10d393f9947e8208285dce9ae87250ac483ac4b4a59d51b4e037", "bbox": {"l": 340.00214, "t": 179.79296999999997, "r": 416.20551, "b": 181.90972999999997, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "Compliant with guidelines", "bbox": {"l": 339.38269, "t": 85.19066999999995, "r": 417.83722, "b": 92.28399999999999, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Plausible but invalid alternative", "bbox": {"l": 451.42834, "t": 85.19066999999995, "r": 546.22913, "b": 92.28399999999999, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Borderline case: Two guideline-compliant alternatives", "bbox": {"l": 350.33701, "t": 364.85706, "r": 513.48035, "b": 371.95035000000007, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "03c31a2ee1ed1b583c28957f475ee545d144e1b5a264dc4dd068c8d2f6a64860", "bbox": {"l": 340.00201, "t": 245.07385, "r": 416.20538, "b": 247.19061, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "1a5cd524f1844c1260c8e8c073e1f442423c264583212b0d0b6626fc780e6ed4", "bbox": {"l": 340.00201, "t": 359.12488, "r": 416.20538, "b": 361.24167, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "05237a14f2524e3f53c8454b074409d05078038a6a36b770fcc8ec7e540deae0", "bbox": {"l": 400.12842, "t": 458.44327000000004, "r": 476.33178999999996, "b": 460.5600600000001, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "A", "bbox": {"l": 322.19424, "t": 98.34105999999997, "r": 326.01498, "b": 104.25214000000005, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "B", "bbox": {"l": 322.19424, "t": 186.99103000000002, "r": 326.01498, "b": 192.90204000000006, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "C", "bbox": {"l": 322.19424, "t": 253.54192999999998, "r": 326.01498, "b": 259.453, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "D", "bbox": {"l": 322.19424, "t": 367.08495999999997, "r": 326.01498, "b": 372.996, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "Figure 4: Examples of plausible annotation alternatives for", "bbox": {"l": 317.95499, "t": 473.49399, "r": 558.3891, "b": 481.96722, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "the same page. Criteria in our annotation guideline can re-", "bbox": {"l": 317.95499, "t": 484.45297, "r": 559.80579, "b": 492.92621, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "solve cases A to C, while the case D remains ambiguous.", "bbox": {"l": 317.95499, "t": 495.41196, "r": 544.14148, "b": 503.88519, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "were carried out over a timeframe of 12 weeks, after which 8 of the", "bbox": {"l": 317.62299, "t": 525.49753, "r": 558.20435, "b": 533.87216, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "40", "bbox": {"l": 317.74899, "t": 536.45656, "r": 326.07019, "b": 544.83118, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "initially allocated annotators did not pass the bar.", "bbox": {"l": 328.3071, "t": 536.45656, "r": 509.11896, "b": 544.83118, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "Phase 4: Production annotation.", "bbox": {"l": 327.918, "t": 547.299, "r": 456.80109000000004, "b": 555.77225, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "The previously selected 80K", "bbox": {"l": 458.7120100000001, "t": 547.41556, "r": 558.48926, "b": 555.79018, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "pages were annotated with the defined 11 class labels by 32 annota-", "bbox": {"l": 317.95499, "t": 558.37456, "r": 559.71368, "b": 566.74918, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "tors. This production phase took around three months to complete.", "bbox": {"l": 317.95499, "t": 569.33356, "r": 559.58124, "b": 577.7081800000001, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "All annotations were created online through CCS, which visualises", "bbox": {"l": 317.64099, "t": 580.29256, "r": 558.20386, "b": 588.66718, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "the programmatic PDF text-cells as an overlay on the page. The page", "bbox": {"l": 317.95499, "t": 591.25156, "r": 558.20221, "b": 599.62617, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "annotation are obtained by drawing rectangular bounding-boxes,", "bbox": {"l": 317.95499, "t": 602.20955, "r": 559.18457, "b": 610.58417, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "as shown in Figure 3. With regard to the annotation practices, we", "bbox": {"l": 317.95499, "t": 613.16855, "r": 558.20197, "b": 621.54317, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "implemented a few constraints and capabilities on the tooling level.", "bbox": {"l": 317.95499, "t": 624.12755, "r": 559.58197, "b": 632.50217, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "First, we only allow non-overlapping, vertically oriented, rectangu-", "bbox": {"l": 317.95499, "t": 635.08655, "r": 559.71411, "b": 643.46117, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "lar boxes. For the large majority of documents, this constraint was", "bbox": {"l": 317.95499, "t": 646.04555, "r": 558.20557, "b": 654.42017, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "sufficient and it speeds up the annotation considerably in compar-", "bbox": {"l": 317.95499, "t": 657.00455, "r": 559.7149, "b": 665.3791699999999, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "ison with arbitrary segmentation shapes. Second, annotator staff", "bbox": {"l": 317.95499, "t": 667.9635499999999, "r": 558.19849, "b": 676.33817, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "were not able to see each other\u2019s annotations. This was enforced by", "bbox": {"l": 317.62299, "t": 678.92255, "r": 558.43268, "b": 687.29717, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "design to avoid any bias in the annotation, which could skew the", "bbox": {"l": 317.95499, "t": 689.8815500000001, "r": 558.19806, "b": 698.256172, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "numbers of the inter-annotator agreement (see Table 1). We wanted", "bbox": {"l": 317.95499, "t": 700.840553, "r": 558.20227, "b": 709.2151719999999, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 13, "label": "page_header", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.8877827525138855, "cells": [{"id": 0, "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "page_header", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.8534670472145081, "cells": [{"id": 1, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 53.79800000000001, "t": 87.36352999999997, "r": 294.04541, "b": 106.70612000000006, "coord_origin": "TOPLEFT"}, "confidence": 0.9022762179374695, "cells": [{"id": 2, "text": "the textual content of an element, which goes beyond visual layout", "bbox": {"l": 53.79800000000001, "t": 87.36352999999997, "r": 294.04541, "b": 95.73816, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "recognition, in particular outside the", "bbox": {"l": 53.79800000000001, "t": 98.32250999999997, "r": 188.1326, "b": 106.69713999999999, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Scientific Articles", "bbox": {"l": 190.37401, "t": 98.36737000000005, "r": 251.25586999999996, "b": 106.70612000000006, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "category.", "bbox": {"l": 253.70801, "t": 98.32250999999997, "r": 287.01816, "b": 106.69713999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "text", "bbox": {"l": 53.79800000000001, "t": 109.28156000000001, "r": 295.55923, "b": 249.16216999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9711344838142395, "cells": [{"id": 6, "text": "At first sight, the task of visual document-layout interpretation", "bbox": {"l": 63.76100199999999, "t": 109.28156000000001, "r": 294.04257, "b": 117.65618999999992, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "appears intuitive enough to obtain plausible annotations in most", "bbox": {"l": 53.79800000000001, "t": 120.24054000000001, "r": 294.04266, "b": 128.61517000000003, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "cases. However, during early trial-runs in the core team, we ob-", "bbox": {"l": 53.79800000000001, "t": 131.19854999999995, "r": 295.55615, "b": 139.57317999999998, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "served many cases in which annotators use different annotation", "bbox": {"l": 53.79800000000001, "t": 142.15752999999995, "r": 294.04715, "b": 150.53216999999995, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "styles, especially for documents with challenging layouts. For ex-", "bbox": {"l": 53.79800000000001, "t": 153.11652000000004, "r": 295.55923, "b": 161.49114999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "ample, if a figure is presented with subfigures, one annotator might", "bbox": {"l": 53.79800000000001, "t": 164.07556, "r": 294.04535, "b": 172.4502, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "draw a single figure bounding-box, while another might annotate", "bbox": {"l": 53.79800000000001, "t": 175.03454999999997, "r": 294.04803, "b": 183.40918, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "each subfigure separately. The same applies for lists, where one", "bbox": {"l": 53.79800000000001, "t": 185.99352999999996, "r": 294.04709, "b": 194.36816, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "might annotate all list items in one block or each list item sep-", "bbox": {"l": 53.79800000000001, "t": 196.95250999999996, "r": 295.55612, "b": 205.32714999999996, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "arately. In essence, we observed that challenging layouts would", "bbox": {"l": 53.79800000000001, "t": 207.91156, "r": 294.04712, "b": 216.28619000000003, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "be annotated in different but plausible ways. To illustrate this, we", "bbox": {"l": 53.79800000000001, "t": 218.87054, "r": 294.04495, "b": 227.24518, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "show in Figure 4 multiple examples of plausible but inconsistent", "bbox": {"l": 53.79800000000001, "t": 229.82952999999998, "r": 294.04712, "b": 238.20416, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "annotations on the same pages.", "bbox": {"l": 53.79800000000001, "t": 240.78754000000004, "r": 168.61276, "b": 249.16216999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 53.79800000000001, "t": 251.74652000000003, "r": 295.56006, "b": 336.83417, "coord_origin": "TOPLEFT"}, "confidence": 0.985905110836029, "cells": [{"id": 19, "text": "Obviously, this inconsistency in annotations is not desirable for", "bbox": {"l": 63.76100199999999, "t": 251.74652000000003, "r": 294.21884, "b": 260.12114999999994, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "datasets which are intended to be used for model training. To min-", "bbox": {"l": 53.79800000000001, "t": 262.70556999999997, "r": 295.56006, "b": 271.0802, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "imise these inconsistencies, we created a detailed annotation guide-", "bbox": {"l": 53.79800000000001, "t": 273.66454999999996, "r": 295.55676, "b": 282.03918, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "line. While perfect consistency across 40 annotation staff members", "bbox": {"l": 53.79800000000001, "t": 284.62354, "r": 294.04922, "b": 292.99817, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "is clearly not possible to achieve, we saw a huge improvement in", "bbox": {"l": 53.79800000000001, "t": 295.5825500000001, "r": 294.04343, "b": 303.95717999999994, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "annotation consistency after the introduction of our annotation", "bbox": {"l": 53.79800000000001, "t": 306.54153, "r": 294.04712, "b": 314.91617, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "guideline. A few selected, non-trivial highlights of the guideline", "bbox": {"l": 53.79800000000001, "t": 317.50055, "r": 294.04718, "b": 325.87518, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "are:", "bbox": {"l": 53.79800000000001, "t": 328.4595299999999, "r": 67.28347, "b": 336.83417, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "list_item", "bbox": {"l": 64.708, "t": 348.51254, "r": 294.0462, "b": 389.77313, "coord_origin": "TOPLEFT"}, "confidence": 0.9691526293754578, "cells": [{"id": 27, "text": "(1)", "bbox": {"l": 64.708, "t": 348.51254, "r": 74.626793, "b": 356.88718, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Every list-item is an individual object instance with class", "bbox": {"l": 76.963936, "t": 348.51254, "r": 294.0462, "b": 356.88718, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "label", "bbox": {"l": 78.207001, "t": 359.47153, "r": 95.730484, "b": 367.84616, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "List-item", "bbox": {"l": 97.976997, "t": 359.51639, "r": 130.17131, "b": 367.85513, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": ". This definition is different from PubLayNet", "bbox": {"l": 130.17101, "t": 359.47153, "r": 294.04053, "b": 367.84616, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "and DocBank, where all list-items are grouped together into", "bbox": {"l": 78.207001, "t": 370.43054, "r": 294.04385, "b": 378.80518, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "one", "bbox": {"l": 78.207001, "t": 381.38953000000004, "r": 91.593834, "b": 389.76416, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "List", "bbox": {"l": 93.834999, "t": 381.43439000000006, "r": 106.88111, "b": 389.77313, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "object.", "bbox": {"l": 109.629, "t": 381.38953000000004, "r": 133.72173, "b": 389.76416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "list_item", "bbox": {"l": 64.707993, "t": 392.34851, "r": 295.56372, "b": 433.60016, "coord_origin": "TOPLEFT"}, "confidence": 0.9591284990310669, "cells": [{"id": 36, "text": "(2)", "bbox": {"l": 64.707993, "t": 392.34851, "r": 75.097656, "b": 400.72313999999994, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "A", "bbox": {"l": 77.545731, "t": 392.34851, "r": 84.351402, "b": 400.72313999999994, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "List-item", "bbox": {"l": 86.584, "t": 392.39339999999993, "r": 118.01329000000001, "b": 400.73215, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "is a paragraph with hanging indentation. Single-", "bbox": {"l": 120.26899999999999, "t": 392.34854, "r": 295.55695, "b": 400.72317999999996, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "line elements can qualify as", "bbox": {"l": 78.207001, "t": 403.30753, "r": 181.80978, "b": 411.68216, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "List-item", "bbox": {"l": 184.175, "t": 403.35239, "r": 216.68806000000004, "b": 411.69113, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "if the neighbour ele-", "bbox": {"l": 219.078, "t": 403.30753, "r": 295.56372, "b": 411.68216, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "ments expose hanging indentation. Bullet or enumeration", "bbox": {"l": 78.207001, "t": 414.2665400000001, "r": 294.04617, "b": 422.64116999999993, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "symbols are not a requirement.", "bbox": {"l": 78.207001, "t": 425.22552, "r": 192.00853, "b": 433.60016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "list_item", "bbox": {"l": 64.708, "t": 436.18451000000005, "r": 294.04724, "b": 455.52713, "coord_origin": "TOPLEFT"}, "confidence": 0.9413429498672485, "cells": [{"id": 45, "text": "(3)", "bbox": {"l": 64.708, "t": 436.18451000000005, "r": 74.483009, "b": 444.55914, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "For every", "bbox": {"l": 76.786255, "t": 436.18451000000005, "r": 112.61566, "b": 444.55914, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "Caption", "bbox": {"l": 114.861, "t": 436.2294, "r": 142.61249, "b": 444.56815000000006, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": ", there must be exactly one corresponding", "bbox": {"l": 142.612, "t": 436.18454, "r": 294.04724, "b": 444.55917, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "Picture", "bbox": {"l": 78.207001, "t": 447.18839, "r": 102.79287, "b": 455.52713, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "or", "bbox": {"l": 105.245, "t": 447.14352, "r": 113.09956999999999, "b": 455.51815999999997, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Table", "bbox": {"l": 115.341, "t": 447.18839, "r": 134.40356, "b": 455.52713, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": ".", "bbox": {"l": 134.403, "t": 447.14352, "r": 136.37561, "b": 455.51815999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "list_item", "bbox": {"l": 64.708, "t": 458.1015300000001, "r": 294.04599, "b": 477.43518, "coord_origin": "TOPLEFT"}, "confidence": 0.9426738023757935, "cells": [{"id": 53, "text": "(4)", "bbox": {"l": 64.708, "t": 458.1015300000001, "r": 74.220215, "b": 466.47617, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "Connected sub-pictures are grouped together in one", "bbox": {"l": 76.461555, "t": 458.1015300000001, "r": 267.46786, "b": 466.47617, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "Picture", "bbox": {"l": 269.70599, "t": 458.14639, "r": 294.04599, "b": 466.48514, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "object.", "bbox": {"l": 78.207001, "t": 469.06055, "r": 102.29972, "b": 477.43518, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "list_item", "bbox": {"l": 64.708, "t": 480.01953, "r": 264.50571, "b": 488.40314, "coord_origin": "TOPLEFT"}, "confidence": 0.9147457480430603, "cells": [{"id": 57, "text": "(5)", "bbox": {"l": 64.708, "t": 480.01953, "r": 74.345383, "b": 488.39417, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Formula numbers are included in a", "bbox": {"l": 76.616203, "t": 480.01953, "r": 206.13503, "b": 488.39417, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Formula", "bbox": {"l": 208.38, "t": 480.06439, "r": 238.12155, "b": 488.40314, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "object.", "bbox": {"l": 240.41300999999999, "t": 480.01953, "r": 264.50571, "b": 488.39417, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "list_item", "bbox": {"l": 64.708008, "t": 490.97852, "r": 294.04617, "b": 521.27118, "coord_origin": "TOPLEFT"}, "confidence": 0.9544308185577393, "cells": [{"id": 61, "text": "(6)", "bbox": {"l": 64.708008, "t": 490.97852, "r": 74.564522, "b": 499.35315, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "Emphasised text (e.g. in italic or bold) at the beginning of", "bbox": {"l": 76.886978, "t": 490.97852, "r": 294.04617, "b": 499.35315, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "a paragraph is not considered a", "bbox": {"l": 78.207001, "t": 501.93753, "r": 200.34819, "b": 510.31216, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "Section-header", "bbox": {"l": 203.66701, "t": 501.98239, "r": 256.57504, "b": 510.32114, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": ", unless it", "bbox": {"l": 256.57401, "t": 501.93753, "r": 294.04401, "b": 510.31216, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "appears exclusively on its own line.", "bbox": {"l": 78.207001, "t": 512.8965499999999, "r": 208.13017, "b": 521.27118, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 53.528999, "t": 532.9505300000001, "r": 295.56253, "b": 574.20117, "coord_origin": "TOPLEFT"}, "confidence": 0.9811431169509888, "cells": [{"id": 67, "text": "The complete annotation guideline is over 100 pages long and a", "bbox": {"l": 53.528999, "t": 532.9505300000001, "r": 294.04337, "b": 541.32516, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "detailed description is obviously out of scope for this paper. Never-", "bbox": {"l": 53.79800000000001, "t": 543.90855, "r": 295.56253, "b": 552.28317, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "theless, it will be made publicly available alongside with DocLayNet", "bbox": {"l": 53.79800000000001, "t": 554.8675499999999, "r": 294.04538, "b": 563.24217, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "for future reference.", "bbox": {"l": 53.79800000000001, "t": 565.82655, "r": 127.2418, "b": 574.20117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 53.79800000000001, "t": 576.66899, "r": 295.56226, "b": 705.708176, "coord_origin": "TOPLEFT"}, "confidence": 0.9864389896392822, "cells": [{"id": 71, "text": "Phase 3: Training.", "bbox": {"l": 63.76100199999999, "t": 576.66899, "r": 136.7744, "b": 585.14224, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "After a first trial with a small group of peo-", "bbox": {"l": 139.008, "t": 576.7855500000001, "r": 295.56226, "b": 585.16017, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "ple, we realised that providing the annotation guideline and a set of", "bbox": {"l": 53.79800000000001, "t": 587.74455, "r": 294.04532, "b": 596.1191699999999, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "random practice pages did not yield the desired quality level for lay-", "bbox": {"l": 53.79800000000001, "t": 598.70355, "r": 295.55676, "b": 607.07817, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "out annotation. Therefore we prepared a subset of pages with two", "bbox": {"l": 53.79800000000001, "t": 609.66255, "r": 294.04605, "b": 618.0371700000001, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "different complexity levels, each with a practice and an exam part.", "bbox": {"l": 53.79800000000001, "t": 620.6215500000001, "r": 295.42377, "b": 628.99617, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "974 pages were reference-annotated by one proficient core team", "bbox": {"l": 53.79800000000001, "t": 631.58055, "r": 294.04712, "b": 639.95517, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "member. Annotation staff were then given the task to annotate the", "bbox": {"l": 53.79800000000001, "t": 642.53955, "r": 294.04922, "b": 650.91417, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "same subsets (blinded from the reference). By comparing the an-", "bbox": {"l": 53.79800000000001, "t": 653.49855, "r": 295.55618, "b": 661.87317, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "notations of each staff member with the reference annotations, we", "bbox": {"l": 53.79800000000001, "t": 664.45655, "r": 294.04874, "b": 672.83117, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "could quantify how closely their annotations matched the reference.", "bbox": {"l": 53.79800000000001, "t": 675.4155499999999, "r": 295.42496, "b": 683.79017, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "Only after passing two exam levels with high annotation quality,", "bbox": {"l": 53.79800000000001, "t": 686.37456, "r": 295.0274, "b": 694.749176, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "staff were admitted into the production phase. Practice iterations", "bbox": {"l": 53.79800000000001, "t": 697.333557, "r": 294.04114, "b": 705.708176, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "picture", "bbox": {"l": 315.960205078125, "t": 85.33881378173828, "r": 559.396484375, "b": 459.68084716796875, "coord_origin": "TOPLEFT"}, "confidence": 0.7264115214347839, "cells": [{"id": 84, "text": "1ef23f5e6d7f10d393f9947e8208285dce9ae87250ac483ac4b4a59d51b4e037", "bbox": {"l": 340.00214, "t": 179.79296999999997, "r": 416.20551, "b": 181.90972999999997, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "Compliant with guidelines", "bbox": {"l": 339.38269, "t": 85.19066999999995, "r": 417.83722, "b": 92.28399999999999, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Plausible but invalid alternative", "bbox": {"l": 451.42834, "t": 85.19066999999995, "r": 546.22913, "b": 92.28399999999999, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Borderline case: Two guideline-compliant alternatives", "bbox": {"l": 350.33701, "t": 364.85706, "r": 513.48035, "b": 371.95035000000007, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "03c31a2ee1ed1b583c28957f475ee545d144e1b5a264dc4dd068c8d2f6a64860", "bbox": {"l": 340.00201, "t": 245.07385, "r": 416.20538, "b": 247.19061, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "1a5cd524f1844c1260c8e8c073e1f442423c264583212b0d0b6626fc780e6ed4", "bbox": {"l": 340.00201, "t": 359.12488, "r": 416.20538, "b": 361.24167, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "A", "bbox": {"l": 322.19424, "t": 98.34105999999997, "r": 326.01498, "b": 104.25214000000005, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "B", "bbox": {"l": 322.19424, "t": 186.99103000000002, "r": 326.01498, "b": 192.90204000000006, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "C", "bbox": {"l": 322.19424, "t": 253.54192999999998, "r": 326.01498, "b": 259.453, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "D", "bbox": {"l": 322.19424, "t": 367.08495999999997, "r": 326.01498, "b": 372.996, "coord_origin": "TOPLEFT"}}], "children": [{"id": 16, "label": "text", "bbox": {"l": 340.00214, "t": 179.79296999999997, "r": 416.20551, "b": 181.90972999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "1ef23f5e6d7f10d393f9947e8208285dce9ae87250ac483ac4b4a59d51b4e037", "bbox": {"l": 340.00214, "t": 179.79296999999997, "r": 416.20551, "b": 181.90972999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 339.38269, "t": 85.19066999999995, "r": 417.83722, "b": 92.28399999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "Compliant with guidelines", "bbox": {"l": 339.38269, "t": 85.19066999999995, "r": 417.83722, "b": 92.28399999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 451.42834, "t": 85.19066999999995, "r": 546.22913, "b": 92.28399999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "Plausible but invalid alternative", "bbox": {"l": 451.42834, "t": 85.19066999999995, "r": 546.22913, "b": 92.28399999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 350.33701, "t": 364.85706, "r": 513.48035, "b": 371.95035000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "Borderline case: Two guideline-compliant alternatives", "bbox": {"l": 350.33701, "t": 364.85706, "r": 513.48035, "b": 371.95035000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 340.00201, "t": 245.07385, "r": 416.20538, "b": 247.19061, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "03c31a2ee1ed1b583c28957f475ee545d144e1b5a264dc4dd068c8d2f6a64860", "bbox": {"l": 340.00201, "t": 245.07385, "r": 416.20538, "b": 247.19061, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 340.00201, "t": 359.12488, "r": 416.20538, "b": 361.24167, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "1a5cd524f1844c1260c8e8c073e1f442423c264583212b0d0b6626fc780e6ed4", "bbox": {"l": 340.00201, "t": 359.12488, "r": 416.20538, "b": 361.24167, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 322.19424, "t": 98.34105999999997, "r": 326.01498, "b": 104.25214000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "A", "bbox": {"l": 322.19424, "t": 98.34105999999997, "r": 326.01498, "b": 104.25214000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 322.19424, "t": 186.99103000000002, "r": 326.01498, "b": 192.90204000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "B", "bbox": {"l": 322.19424, "t": 186.99103000000002, "r": 326.01498, "b": 192.90204000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 322.19424, "t": 253.54192999999998, "r": 326.01498, "b": 259.453, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "C", "bbox": {"l": 322.19424, "t": 253.54192999999998, "r": 326.01498, "b": 259.453, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 322.19424, "t": 367.08495999999997, "r": 326.01498, "b": 372.996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "D", "bbox": {"l": 322.19424, "t": 367.08495999999997, "r": 326.01498, "b": 372.996, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 22, "label": "text", "bbox": {"l": 400.12842, "t": 458.44327000000004, "r": 476.33178999999996, "b": 460.5600600000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "05237a14f2524e3f53c8454b074409d05078038a6a36b770fcc8ec7e540deae0", "bbox": {"l": 400.12842, "t": 458.44327000000004, "r": 476.33178999999996, "b": 460.5600600000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "caption", "bbox": {"l": 317.95499, "t": 473.49399, "r": 559.80579, "b": 503.88519, "coord_origin": "TOPLEFT"}, "confidence": 0.8873711824417114, "cells": [{"id": 95, "text": "Figure 4: Examples of plausible annotation alternatives for", "bbox": {"l": 317.95499, "t": 473.49399, "r": 558.3891, "b": 481.96722, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "the same page. Criteria in our annotation guideline can re-", "bbox": {"l": 317.95499, "t": 484.45297, "r": 559.80579, "b": 492.92621, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "solve cases A to C, while the case D remains ambiguous.", "bbox": {"l": 317.95499, "t": 495.41196, "r": 544.14148, "b": 503.88519, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "text", "bbox": {"l": 317.62299, "t": 525.49753, "r": 558.20435, "b": 544.83118, "coord_origin": "TOPLEFT"}, "confidence": 0.9611718654632568, "cells": [{"id": 98, "text": "were carried out over a timeframe of 12 weeks, after which 8 of the", "bbox": {"l": 317.62299, "t": 525.49753, "r": 558.20435, "b": 533.87216, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "40", "bbox": {"l": 317.74899, "t": 536.45656, "r": 326.07019, "b": 544.83118, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "initially allocated annotators did not pass the bar.", "bbox": {"l": 328.3071, "t": 536.45656, "r": 509.11896, "b": 544.83118, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 317.62299, "t": 547.299, "r": 559.7149, "b": 709.2151719999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9829543232917786, "cells": [{"id": 101, "text": "Phase 4: Production annotation.", "bbox": {"l": 327.918, "t": 547.299, "r": 456.80109000000004, "b": 555.77225, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "The previously selected 80K", "bbox": {"l": 458.7120100000001, "t": 547.41556, "r": 558.48926, "b": 555.79018, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "pages were annotated with the defined 11 class labels by 32 annota-", "bbox": {"l": 317.95499, "t": 558.37456, "r": 559.71368, "b": 566.74918, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "tors. This production phase took around three months to complete.", "bbox": {"l": 317.95499, "t": 569.33356, "r": 559.58124, "b": 577.7081800000001, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "All annotations were created online through CCS, which visualises", "bbox": {"l": 317.64099, "t": 580.29256, "r": 558.20386, "b": 588.66718, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "the programmatic PDF text-cells as an overlay on the page. The page", "bbox": {"l": 317.95499, "t": 591.25156, "r": 558.20221, "b": 599.62617, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "annotation are obtained by drawing rectangular bounding-boxes,", "bbox": {"l": 317.95499, "t": 602.20955, "r": 559.18457, "b": 610.58417, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "as shown in Figure 3. With regard to the annotation practices, we", "bbox": {"l": 317.95499, "t": 613.16855, "r": 558.20197, "b": 621.54317, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "implemented a few constraints and capabilities on the tooling level.", "bbox": {"l": 317.95499, "t": 624.12755, "r": 559.58197, "b": 632.50217, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "First, we only allow non-overlapping, vertically oriented, rectangu-", "bbox": {"l": 317.95499, "t": 635.08655, "r": 559.71411, "b": 643.46117, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "lar boxes. For the large majority of documents, this constraint was", "bbox": {"l": 317.95499, "t": 646.04555, "r": 558.20557, "b": 654.42017, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "sufficient and it speeds up the annotation considerably in compar-", "bbox": {"l": 317.95499, "t": 657.00455, "r": 559.7149, "b": 665.3791699999999, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "ison with arbitrary segmentation shapes. Second, annotator staff", "bbox": {"l": 317.95499, "t": 667.9635499999999, "r": 558.19849, "b": 676.33817, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "were not able to see each other\u2019s annotations. This was enforced by", "bbox": {"l": 317.62299, "t": 678.92255, "r": 558.43268, "b": 687.29717, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "design to avoid any bias in the annotation, which could skew the", "bbox": {"l": 317.95499, "t": 689.8815500000001, "r": 558.19806, "b": 698.256172, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "numbers of the inter-annotator agreement (see Table 1). We wanted", "bbox": {"l": 317.95499, "t": 700.840553, "r": 558.20227, "b": 709.2151719999999, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_header", "id": 13, "page_no": 4, "cluster": {"id": 13, "label": "page_header", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.8877827525138855, "cells": [{"id": 0, "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis"}, {"label": "page_header", "id": 15, "page_no": 4, "cluster": {"id": 15, "label": "page_header", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.8534670472145081, "cells": [{"id": 1, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA"}, {"label": "text", "id": 12, "page_no": 4, "cluster": {"id": 12, "label": "text", "bbox": {"l": 53.79800000000001, "t": 87.36352999999997, "r": 294.04541, "b": 106.70612000000006, "coord_origin": "TOPLEFT"}, "confidence": 0.9022762179374695, "cells": [{"id": 2, "text": "the textual content of an element, which goes beyond visual layout", "bbox": {"l": 53.79800000000001, "t": 87.36352999999997, "r": 294.04541, "b": 95.73816, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "recognition, in particular outside the", "bbox": {"l": 53.79800000000001, "t": 98.32250999999997, "r": 188.1326, "b": 106.69713999999999, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Scientific Articles", "bbox": {"l": 190.37401, "t": 98.36737000000005, "r": 251.25586999999996, "b": 106.70612000000006, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "category.", "bbox": {"l": 253.70801, "t": 98.32250999999997, "r": 287.01816, "b": 106.69713999999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "the textual content of an element, which goes beyond visual layout recognition, in particular outside the Scientific Articles category."}, {"label": "text", "id": 4, "page_no": 4, "cluster": {"id": 4, "label": "text", "bbox": {"l": 53.79800000000001, "t": 109.28156000000001, "r": 295.55923, "b": 249.16216999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9711344838142395, "cells": [{"id": 6, "text": "At first sight, the task of visual document-layout interpretation", "bbox": {"l": 63.76100199999999, "t": 109.28156000000001, "r": 294.04257, "b": 117.65618999999992, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "appears intuitive enough to obtain plausible annotations in most", "bbox": {"l": 53.79800000000001, "t": 120.24054000000001, "r": 294.04266, "b": 128.61517000000003, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "cases. However, during early trial-runs in the core team, we ob-", "bbox": {"l": 53.79800000000001, "t": 131.19854999999995, "r": 295.55615, "b": 139.57317999999998, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "served many cases in which annotators use different annotation", "bbox": {"l": 53.79800000000001, "t": 142.15752999999995, "r": 294.04715, "b": 150.53216999999995, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "styles, especially for documents with challenging layouts. For ex-", "bbox": {"l": 53.79800000000001, "t": 153.11652000000004, "r": 295.55923, "b": 161.49114999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "ample, if a figure is presented with subfigures, one annotator might", "bbox": {"l": 53.79800000000001, "t": 164.07556, "r": 294.04535, "b": 172.4502, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "draw a single figure bounding-box, while another might annotate", "bbox": {"l": 53.79800000000001, "t": 175.03454999999997, "r": 294.04803, "b": 183.40918, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "each subfigure separately. The same applies for lists, where one", "bbox": {"l": 53.79800000000001, "t": 185.99352999999996, "r": 294.04709, "b": 194.36816, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "might annotate all list items in one block or each list item sep-", "bbox": {"l": 53.79800000000001, "t": 196.95250999999996, "r": 295.55612, "b": 205.32714999999996, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "arately. In essence, we observed that challenging layouts would", "bbox": {"l": 53.79800000000001, "t": 207.91156, "r": 294.04712, "b": 216.28619000000003, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "be annotated in different but plausible ways. To illustrate this, we", "bbox": {"l": 53.79800000000001, "t": 218.87054, "r": 294.04495, "b": 227.24518, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "show in Figure 4 multiple examples of plausible but inconsistent", "bbox": {"l": 53.79800000000001, "t": 229.82952999999998, "r": 294.04712, "b": 238.20416, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "annotations on the same pages.", "bbox": {"l": 53.79800000000001, "t": 240.78754000000004, "r": 168.61276, "b": 249.16216999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "At first sight, the task of visual document-layout interpretation appears intuitive enough to obtain plausible annotations in most cases. However, during early trial-runs in the core team, we observed many cases in which annotators use different annotation styles, especially for documents with challenging layouts. For example, if a figure is presented with subfigures, one annotator might draw a single figure bounding-box, while another might annotate each subfigure separately. The same applies for lists, where one might annotate all list items in one block or each list item separately. In essence, we observed that challenging layouts would be annotated in different but plausible ways. To illustrate this, we show in Figure 4 multiple examples of plausible but inconsistent annotations on the same pages."}, {"label": "text", "id": 1, "page_no": 4, "cluster": {"id": 1, "label": "text", "bbox": {"l": 53.79800000000001, "t": 251.74652000000003, "r": 295.56006, "b": 336.83417, "coord_origin": "TOPLEFT"}, "confidence": 0.985905110836029, "cells": [{"id": 19, "text": "Obviously, this inconsistency in annotations is not desirable for", "bbox": {"l": 63.76100199999999, "t": 251.74652000000003, "r": 294.21884, "b": 260.12114999999994, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "datasets which are intended to be used for model training. To min-", "bbox": {"l": 53.79800000000001, "t": 262.70556999999997, "r": 295.56006, "b": 271.0802, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "imise these inconsistencies, we created a detailed annotation guide-", "bbox": {"l": 53.79800000000001, "t": 273.66454999999996, "r": 295.55676, "b": 282.03918, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "line. While perfect consistency across 40 annotation staff members", "bbox": {"l": 53.79800000000001, "t": 284.62354, "r": 294.04922, "b": 292.99817, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "is clearly not possible to achieve, we saw a huge improvement in", "bbox": {"l": 53.79800000000001, "t": 295.5825500000001, "r": 294.04343, "b": 303.95717999999994, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "annotation consistency after the introduction of our annotation", "bbox": {"l": 53.79800000000001, "t": 306.54153, "r": 294.04712, "b": 314.91617, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "guideline. A few selected, non-trivial highlights of the guideline", "bbox": {"l": 53.79800000000001, "t": 317.50055, "r": 294.04718, "b": 325.87518, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "are:", "bbox": {"l": 53.79800000000001, "t": 328.4595299999999, "r": 67.28347, "b": 336.83417, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Obviously, this inconsistency in annotations is not desirable for datasets which are intended to be used for model training. To minimise these inconsistencies, we created a detailed annotation guideline. While perfect consistency across 40 annotation staff members is clearly not possible to achieve, we saw a huge improvement in annotation consistency after the introduction of our annotation guideline. A few selected, non-trivial highlights of the guideline are:"}, {"label": "list_item", "id": 5, "page_no": 4, "cluster": {"id": 5, "label": "list_item", "bbox": {"l": 64.708, "t": 348.51254, "r": 294.0462, "b": 389.77313, "coord_origin": "TOPLEFT"}, "confidence": 0.9691526293754578, "cells": [{"id": 27, "text": "(1)", "bbox": {"l": 64.708, "t": 348.51254, "r": 74.626793, "b": 356.88718, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Every list-item is an individual object instance with class", "bbox": {"l": 76.963936, "t": 348.51254, "r": 294.0462, "b": 356.88718, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "label", "bbox": {"l": 78.207001, "t": 359.47153, "r": 95.730484, "b": 367.84616, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "List-item", "bbox": {"l": 97.976997, "t": 359.51639, "r": 130.17131, "b": 367.85513, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": ". This definition is different from PubLayNet", "bbox": {"l": 130.17101, "t": 359.47153, "r": 294.04053, "b": 367.84616, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "and DocBank, where all list-items are grouped together into", "bbox": {"l": 78.207001, "t": 370.43054, "r": 294.04385, "b": 378.80518, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "one", "bbox": {"l": 78.207001, "t": 381.38953000000004, "r": 91.593834, "b": 389.76416, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "List", "bbox": {"l": 93.834999, "t": 381.43439000000006, "r": 106.88111, "b": 389.77313, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "object.", "bbox": {"l": 109.629, "t": 381.38953000000004, "r": 133.72173, "b": 389.76416, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "(1) Every list-item is an individual object instance with class label List-item . This definition is different from PubLayNet and DocBank, where all list-items are grouped together into one List object."}, {"label": "list_item", "id": 7, "page_no": 4, "cluster": {"id": 7, "label": "list_item", "bbox": {"l": 64.707993, "t": 392.34851, "r": 295.56372, "b": 433.60016, "coord_origin": "TOPLEFT"}, "confidence": 0.9591284990310669, "cells": [{"id": 36, "text": "(2)", "bbox": {"l": 64.707993, "t": 392.34851, "r": 75.097656, "b": 400.72313999999994, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "A", "bbox": {"l": 77.545731, "t": 392.34851, "r": 84.351402, "b": 400.72313999999994, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "List-item", "bbox": {"l": 86.584, "t": 392.39339999999993, "r": 118.01329000000001, "b": 400.73215, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "is a paragraph with hanging indentation. Single-", "bbox": {"l": 120.26899999999999, "t": 392.34854, "r": 295.55695, "b": 400.72317999999996, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "line elements can qualify as", "bbox": {"l": 78.207001, "t": 403.30753, "r": 181.80978, "b": 411.68216, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "List-item", "bbox": {"l": 184.175, "t": 403.35239, "r": 216.68806000000004, "b": 411.69113, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "if the neighbour ele-", "bbox": {"l": 219.078, "t": 403.30753, "r": 295.56372, "b": 411.68216, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "ments expose hanging indentation. Bullet or enumeration", "bbox": {"l": 78.207001, "t": 414.2665400000001, "r": 294.04617, "b": 422.64116999999993, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "symbols are not a requirement.", "bbox": {"l": 78.207001, "t": 425.22552, "r": 192.00853, "b": 433.60016, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "(2) A List-item is a paragraph with hanging indentation. Singleline elements can qualify as List-item if the neighbour elements expose hanging indentation. Bullet or enumeration symbols are not a requirement."}, {"label": "list_item", "id": 10, "page_no": 4, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 64.708, "t": 436.18451000000005, "r": 294.04724, "b": 455.52713, "coord_origin": "TOPLEFT"}, "confidence": 0.9413429498672485, "cells": [{"id": 45, "text": "(3)", "bbox": {"l": 64.708, "t": 436.18451000000005, "r": 74.483009, "b": 444.55914, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "For every", "bbox": {"l": 76.786255, "t": 436.18451000000005, "r": 112.61566, "b": 444.55914, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "Caption", "bbox": {"l": 114.861, "t": 436.2294, "r": 142.61249, "b": 444.56815000000006, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": ", there must be exactly one corresponding", "bbox": {"l": 142.612, "t": 436.18454, "r": 294.04724, "b": 444.55917, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "Picture", "bbox": {"l": 78.207001, "t": 447.18839, "r": 102.79287, "b": 455.52713, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "or", "bbox": {"l": 105.245, "t": 447.14352, "r": 113.09956999999999, "b": 455.51815999999997, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Table", "bbox": {"l": 115.341, "t": 447.18839, "r": 134.40356, "b": 455.52713, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": ".", "bbox": {"l": 134.403, "t": 447.14352, "r": 136.37561, "b": 455.51815999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "(3) For every Caption , there must be exactly one corresponding Picture or Table ."}, {"label": "list_item", "id": 9, "page_no": 4, "cluster": {"id": 9, "label": "list_item", "bbox": {"l": 64.708, "t": 458.1015300000001, "r": 294.04599, "b": 477.43518, "coord_origin": "TOPLEFT"}, "confidence": 0.9426738023757935, "cells": [{"id": 53, "text": "(4)", "bbox": {"l": 64.708, "t": 458.1015300000001, "r": 74.220215, "b": 466.47617, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "Connected sub-pictures are grouped together in one", "bbox": {"l": 76.461555, "t": 458.1015300000001, "r": 267.46786, "b": 466.47617, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "Picture", "bbox": {"l": 269.70599, "t": 458.14639, "r": 294.04599, "b": 466.48514, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "object.", "bbox": {"l": 78.207001, "t": 469.06055, "r": 102.29972, "b": 477.43518, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "(4) Connected sub-pictures are grouped together in one Picture object."}, {"label": "list_item", "id": 11, "page_no": 4, "cluster": {"id": 11, "label": "list_item", "bbox": {"l": 64.708, "t": 480.01953, "r": 264.50571, "b": 488.40314, "coord_origin": "TOPLEFT"}, "confidence": 0.9147457480430603, "cells": [{"id": 57, "text": "(5)", "bbox": {"l": 64.708, "t": 480.01953, "r": 74.345383, "b": 488.39417, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Formula numbers are included in a", "bbox": {"l": 76.616203, "t": 480.01953, "r": 206.13503, "b": 488.39417, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Formula", "bbox": {"l": 208.38, "t": 480.06439, "r": 238.12155, "b": 488.40314, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "object.", "bbox": {"l": 240.41300999999999, "t": 480.01953, "r": 264.50571, "b": 488.39417, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "(5) Formula numbers are included in a Formula object."}, {"label": "list_item", "id": 8, "page_no": 4, "cluster": {"id": 8, "label": "list_item", "bbox": {"l": 64.708008, "t": 490.97852, "r": 294.04617, "b": 521.27118, "coord_origin": "TOPLEFT"}, "confidence": 0.9544308185577393, "cells": [{"id": 61, "text": "(6)", "bbox": {"l": 64.708008, "t": 490.97852, "r": 74.564522, "b": 499.35315, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "Emphasised text (e.g. in italic or bold) at the beginning of", "bbox": {"l": 76.886978, "t": 490.97852, "r": 294.04617, "b": 499.35315, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "a paragraph is not considered a", "bbox": {"l": 78.207001, "t": 501.93753, "r": 200.34819, "b": 510.31216, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "Section-header", "bbox": {"l": 203.66701, "t": 501.98239, "r": 256.57504, "b": 510.32114, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": ", unless it", "bbox": {"l": 256.57401, "t": 501.93753, "r": 294.04401, "b": 510.31216, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "appears exclusively on its own line.", "bbox": {"l": 78.207001, "t": 512.8965499999999, "r": 208.13017, "b": 521.27118, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "(6) Emphasised text (e.g. in italic or bold) at the beginning of a paragraph is not considered a Section-header , unless it appears exclusively on its own line."}, {"label": "text", "id": 3, "page_no": 4, "cluster": {"id": 3, "label": "text", "bbox": {"l": 53.528999, "t": 532.9505300000001, "r": 295.56253, "b": 574.20117, "coord_origin": "TOPLEFT"}, "confidence": 0.9811431169509888, "cells": [{"id": 67, "text": "The complete annotation guideline is over 100 pages long and a", "bbox": {"l": 53.528999, "t": 532.9505300000001, "r": 294.04337, "b": 541.32516, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "detailed description is obviously out of scope for this paper. Never-", "bbox": {"l": 53.79800000000001, "t": 543.90855, "r": 295.56253, "b": 552.28317, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "theless, it will be made publicly available alongside with DocLayNet", "bbox": {"l": 53.79800000000001, "t": 554.8675499999999, "r": 294.04538, "b": 563.24217, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "for future reference.", "bbox": {"l": 53.79800000000001, "t": 565.82655, "r": 127.2418, "b": 574.20117, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The complete annotation guideline is over 100 pages long and a detailed description is obviously out of scope for this paper. Nevertheless, it will be made publicly available alongside with DocLayNet for future reference."}, {"label": "text", "id": 0, "page_no": 4, "cluster": {"id": 0, "label": "text", "bbox": {"l": 53.79800000000001, "t": 576.66899, "r": 295.56226, "b": 705.708176, "coord_origin": "TOPLEFT"}, "confidence": 0.9864389896392822, "cells": [{"id": 71, "text": "Phase 3: Training.", "bbox": {"l": 63.76100199999999, "t": 576.66899, "r": 136.7744, "b": 585.14224, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "After a first trial with a small group of peo-", "bbox": {"l": 139.008, "t": 576.7855500000001, "r": 295.56226, "b": 585.16017, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "ple, we realised that providing the annotation guideline and a set of", "bbox": {"l": 53.79800000000001, "t": 587.74455, "r": 294.04532, "b": 596.1191699999999, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "random practice pages did not yield the desired quality level for lay-", "bbox": {"l": 53.79800000000001, "t": 598.70355, "r": 295.55676, "b": 607.07817, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "out annotation. Therefore we prepared a subset of pages with two", "bbox": {"l": 53.79800000000001, "t": 609.66255, "r": 294.04605, "b": 618.0371700000001, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "different complexity levels, each with a practice and an exam part.", "bbox": {"l": 53.79800000000001, "t": 620.6215500000001, "r": 295.42377, "b": 628.99617, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "974 pages were reference-annotated by one proficient core team", "bbox": {"l": 53.79800000000001, "t": 631.58055, "r": 294.04712, "b": 639.95517, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "member. Annotation staff were then given the task to annotate the", "bbox": {"l": 53.79800000000001, "t": 642.53955, "r": 294.04922, "b": 650.91417, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "same subsets (blinded from the reference). By comparing the an-", "bbox": {"l": 53.79800000000001, "t": 653.49855, "r": 295.55618, "b": 661.87317, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "notations of each staff member with the reference annotations, we", "bbox": {"l": 53.79800000000001, "t": 664.45655, "r": 294.04874, "b": 672.83117, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "could quantify how closely their annotations matched the reference.", "bbox": {"l": 53.79800000000001, "t": 675.4155499999999, "r": 295.42496, "b": 683.79017, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "Only after passing two exam levels with high annotation quality,", "bbox": {"l": 53.79800000000001, "t": 686.37456, "r": 295.0274, "b": 694.749176, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "staff were admitted into the production phase. Practice iterations", "bbox": {"l": 53.79800000000001, "t": 697.333557, "r": 294.04114, "b": 705.708176, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Phase 3: Training. After a first trial with a small group of people, we realised that providing the annotation guideline and a set of random practice pages did not yield the desired quality level for layout annotation. Therefore we prepared a subset of pages with two different complexity levels, each with a practice and an exam part. 974 pages were reference-annotated by one proficient core team member. Annotation staff were then given the task to annotate the same subsets (blinded from the reference). By comparing the annotations of each staff member with the reference annotations, we could quantify how closely their annotations matched the reference. Only after passing two exam levels with high annotation quality, staff were admitted into the production phase. Practice iterations"}, {"label": "picture", "id": 16, "page_no": 4, "cluster": {"id": 16, "label": "picture", "bbox": {"l": 315.960205078125, "t": 85.33881378173828, "r": 559.396484375, "b": 459.68084716796875, "coord_origin": "TOPLEFT"}, "confidence": 0.7264115214347839, "cells": [{"id": 84, "text": "1ef23f5e6d7f10d393f9947e8208285dce9ae87250ac483ac4b4a59d51b4e037", "bbox": {"l": 340.00214, "t": 179.79296999999997, "r": 416.20551, "b": 181.90972999999997, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "Compliant with guidelines", "bbox": {"l": 339.38269, "t": 85.19066999999995, "r": 417.83722, "b": 92.28399999999999, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Plausible but invalid alternative", "bbox": {"l": 451.42834, "t": 85.19066999999995, "r": 546.22913, "b": 92.28399999999999, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Borderline case: Two guideline-compliant alternatives", "bbox": {"l": 350.33701, "t": 364.85706, "r": 513.48035, "b": 371.95035000000007, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "03c31a2ee1ed1b583c28957f475ee545d144e1b5a264dc4dd068c8d2f6a64860", "bbox": {"l": 340.00201, "t": 245.07385, "r": 416.20538, "b": 247.19061, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "1a5cd524f1844c1260c8e8c073e1f442423c264583212b0d0b6626fc780e6ed4", "bbox": {"l": 340.00201, "t": 359.12488, "r": 416.20538, "b": 361.24167, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "A", "bbox": {"l": 322.19424, "t": 98.34105999999997, "r": 326.01498, "b": 104.25214000000005, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "B", "bbox": {"l": 322.19424, "t": 186.99103000000002, "r": 326.01498, "b": 192.90204000000006, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "C", "bbox": {"l": 322.19424, "t": 253.54192999999998, "r": 326.01498, "b": 259.453, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "D", "bbox": {"l": 322.19424, "t": 367.08495999999997, "r": 326.01498, "b": 372.996, "coord_origin": "TOPLEFT"}}], "children": [{"id": 16, "label": "text", "bbox": {"l": 340.00214, "t": 179.79296999999997, "r": 416.20551, "b": 181.90972999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "1ef23f5e6d7f10d393f9947e8208285dce9ae87250ac483ac4b4a59d51b4e037", "bbox": {"l": 340.00214, "t": 179.79296999999997, "r": 416.20551, "b": 181.90972999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 339.38269, "t": 85.19066999999995, "r": 417.83722, "b": 92.28399999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "Compliant with guidelines", "bbox": {"l": 339.38269, "t": 85.19066999999995, "r": 417.83722, "b": 92.28399999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 451.42834, "t": 85.19066999999995, "r": 546.22913, "b": 92.28399999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "Plausible but invalid alternative", "bbox": {"l": 451.42834, "t": 85.19066999999995, "r": 546.22913, "b": 92.28399999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 350.33701, "t": 364.85706, "r": 513.48035, "b": 371.95035000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "Borderline case: Two guideline-compliant alternatives", "bbox": {"l": 350.33701, "t": 364.85706, "r": 513.48035, "b": 371.95035000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 340.00201, "t": 245.07385, "r": 416.20538, "b": 247.19061, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "03c31a2ee1ed1b583c28957f475ee545d144e1b5a264dc4dd068c8d2f6a64860", "bbox": {"l": 340.00201, "t": 245.07385, "r": 416.20538, "b": 247.19061, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 340.00201, "t": 359.12488, "r": 416.20538, "b": 361.24167, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "1a5cd524f1844c1260c8e8c073e1f442423c264583212b0d0b6626fc780e6ed4", "bbox": {"l": 340.00201, "t": 359.12488, "r": 416.20538, "b": 361.24167, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 322.19424, "t": 98.34105999999997, "r": 326.01498, "b": 104.25214000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "A", "bbox": {"l": 322.19424, "t": 98.34105999999997, "r": 326.01498, "b": 104.25214000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 322.19424, "t": 186.99103000000002, "r": 326.01498, "b": 192.90204000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "B", "bbox": {"l": 322.19424, "t": 186.99103000000002, "r": 326.01498, "b": 192.90204000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 322.19424, "t": 253.54192999999998, "r": 326.01498, "b": 259.453, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "C", "bbox": {"l": 322.19424, "t": 253.54192999999998, "r": 326.01498, "b": 259.453, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 322.19424, "t": 367.08495999999997, "r": 326.01498, "b": 372.996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "D", "bbox": {"l": 322.19424, "t": 367.08495999999997, "r": 326.01498, "b": 372.996, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "text", "id": 22, "page_no": 4, "cluster": {"id": 22, "label": "text", "bbox": {"l": 400.12842, "t": 458.44327000000004, "r": 476.33178999999996, "b": 460.5600600000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "05237a14f2524e3f53c8454b074409d05078038a6a36b770fcc8ec7e540deae0", "bbox": {"l": 400.12842, "t": 458.44327000000004, "r": 476.33178999999996, "b": 460.5600600000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "05237a14f2524e3f53c8454b074409d05078038a6a36b770fcc8ec7e540deae0"}, {"label": "caption", "id": 14, "page_no": 4, "cluster": {"id": 14, "label": "caption", "bbox": {"l": 317.95499, "t": 473.49399, "r": 559.80579, "b": 503.88519, "coord_origin": "TOPLEFT"}, "confidence": 0.8873711824417114, "cells": [{"id": 95, "text": "Figure 4: Examples of plausible annotation alternatives for", "bbox": {"l": 317.95499, "t": 473.49399, "r": 558.3891, "b": 481.96722, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "the same page. Criteria in our annotation guideline can re-", "bbox": {"l": 317.95499, "t": 484.45297, "r": 559.80579, "b": 492.92621, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "solve cases A to C, while the case D remains ambiguous.", "bbox": {"l": 317.95499, "t": 495.41196, "r": 544.14148, "b": 503.88519, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 4: Examples of plausible annotation alternatives for the same page. Criteria in our annotation guideline can resolve cases A to C, while the case D remains ambiguous."}, {"label": "text", "id": 6, "page_no": 4, "cluster": {"id": 6, "label": "text", "bbox": {"l": 317.62299, "t": 525.49753, "r": 558.20435, "b": 544.83118, "coord_origin": "TOPLEFT"}, "confidence": 0.9611718654632568, "cells": [{"id": 98, "text": "were carried out over a timeframe of 12 weeks, after which 8 of the", "bbox": {"l": 317.62299, "t": 525.49753, "r": 558.20435, "b": 533.87216, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "40", "bbox": {"l": 317.74899, "t": 536.45656, "r": 326.07019, "b": 544.83118, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "initially allocated annotators did not pass the bar.", "bbox": {"l": 328.3071, "t": 536.45656, "r": 509.11896, "b": 544.83118, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "were carried out over a timeframe of 12 weeks, after which 8 of the 40 initially allocated annotators did not pass the bar."}, {"label": "text", "id": 2, "page_no": 4, "cluster": {"id": 2, "label": "text", "bbox": {"l": 317.62299, "t": 547.299, "r": 559.7149, "b": 709.2151719999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9829543232917786, "cells": [{"id": 101, "text": "Phase 4: Production annotation.", "bbox": {"l": 327.918, "t": 547.299, "r": 456.80109000000004, "b": 555.77225, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "The previously selected 80K", "bbox": {"l": 458.7120100000001, "t": 547.41556, "r": 558.48926, "b": 555.79018, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "pages were annotated with the defined 11 class labels by 32 annota-", "bbox": {"l": 317.95499, "t": 558.37456, "r": 559.71368, "b": 566.74918, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "tors. This production phase took around three months to complete.", "bbox": {"l": 317.95499, "t": 569.33356, "r": 559.58124, "b": 577.7081800000001, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "All annotations were created online through CCS, which visualises", "bbox": {"l": 317.64099, "t": 580.29256, "r": 558.20386, "b": 588.66718, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "the programmatic PDF text-cells as an overlay on the page. The page", "bbox": {"l": 317.95499, "t": 591.25156, "r": 558.20221, "b": 599.62617, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "annotation are obtained by drawing rectangular bounding-boxes,", "bbox": {"l": 317.95499, "t": 602.20955, "r": 559.18457, "b": 610.58417, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "as shown in Figure 3. With regard to the annotation practices, we", "bbox": {"l": 317.95499, "t": 613.16855, "r": 558.20197, "b": 621.54317, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "implemented a few constraints and capabilities on the tooling level.", "bbox": {"l": 317.95499, "t": 624.12755, "r": 559.58197, "b": 632.50217, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "First, we only allow non-overlapping, vertically oriented, rectangu-", "bbox": {"l": 317.95499, "t": 635.08655, "r": 559.71411, "b": 643.46117, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "lar boxes. For the large majority of documents, this constraint was", "bbox": {"l": 317.95499, "t": 646.04555, "r": 558.20557, "b": 654.42017, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "sufficient and it speeds up the annotation considerably in compar-", "bbox": {"l": 317.95499, "t": 657.00455, "r": 559.7149, "b": 665.3791699999999, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "ison with arbitrary segmentation shapes. Second, annotator staff", "bbox": {"l": 317.95499, "t": 667.9635499999999, "r": 558.19849, "b": 676.33817, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "were not able to see each other\u2019s annotations. This was enforced by", "bbox": {"l": 317.62299, "t": 678.92255, "r": 558.43268, "b": 687.29717, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "design to avoid any bias in the annotation, which could skew the", "bbox": {"l": 317.95499, "t": 689.8815500000001, "r": 558.19806, "b": 698.256172, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "numbers of the inter-annotator agreement (see Table 1). We wanted", "bbox": {"l": 317.95499, "t": 700.840553, "r": 558.20227, "b": 709.2151719999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Phase 4: Production annotation. The previously selected 80K pages were annotated with the defined 11 class labels by 32 annotators. This production phase took around three months to complete. All annotations were created online through CCS, which visualises the programmatic PDF text-cells as an overlay on the page. The page annotation are obtained by drawing rectangular bounding-boxes, as shown in Figure 3. With regard to the annotation practices, we implemented a few constraints and capabilities on the tooling level. First, we only allow non-overlapping, vertically oriented, rectangular boxes. For the large majority of documents, this constraint was sufficient and it speeds up the annotation considerably in comparison with arbitrary segmentation shapes. Second, annotator staff were not able to see each other's annotations. This was enforced by design to avoid any bias in the annotation, which could skew the numbers of the inter-annotator agreement (see Table 1). We wanted"}], "body": [{"label": "text", "id": 12, "page_no": 4, "cluster": {"id": 12, "label": "text", "bbox": {"l": 53.79800000000001, "t": 87.36352999999997, "r": 294.04541, "b": 106.70612000000006, "coord_origin": "TOPLEFT"}, "confidence": 0.9022762179374695, "cells": [{"id": 2, "text": "the textual content of an element, which goes beyond visual layout", "bbox": {"l": 53.79800000000001, "t": 87.36352999999997, "r": 294.04541, "b": 95.73816, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "recognition, in particular outside the", "bbox": {"l": 53.79800000000001, "t": 98.32250999999997, "r": 188.1326, "b": 106.69713999999999, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Scientific Articles", "bbox": {"l": 190.37401, "t": 98.36737000000005, "r": 251.25586999999996, "b": 106.70612000000006, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "category.", "bbox": {"l": 253.70801, "t": 98.32250999999997, "r": 287.01816, "b": 106.69713999999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "the textual content of an element, which goes beyond visual layout recognition, in particular outside the Scientific Articles category."}, {"label": "text", "id": 4, "page_no": 4, "cluster": {"id": 4, "label": "text", "bbox": {"l": 53.79800000000001, "t": 109.28156000000001, "r": 295.55923, "b": 249.16216999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9711344838142395, "cells": [{"id": 6, "text": "At first sight, the task of visual document-layout interpretation", "bbox": {"l": 63.76100199999999, "t": 109.28156000000001, "r": 294.04257, "b": 117.65618999999992, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "appears intuitive enough to obtain plausible annotations in most", "bbox": {"l": 53.79800000000001, "t": 120.24054000000001, "r": 294.04266, "b": 128.61517000000003, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "cases. However, during early trial-runs in the core team, we ob-", "bbox": {"l": 53.79800000000001, "t": 131.19854999999995, "r": 295.55615, "b": 139.57317999999998, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "served many cases in which annotators use different annotation", "bbox": {"l": 53.79800000000001, "t": 142.15752999999995, "r": 294.04715, "b": 150.53216999999995, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "styles, especially for documents with challenging layouts. For ex-", "bbox": {"l": 53.79800000000001, "t": 153.11652000000004, "r": 295.55923, "b": 161.49114999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "ample, if a figure is presented with subfigures, one annotator might", "bbox": {"l": 53.79800000000001, "t": 164.07556, "r": 294.04535, "b": 172.4502, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "draw a single figure bounding-box, while another might annotate", "bbox": {"l": 53.79800000000001, "t": 175.03454999999997, "r": 294.04803, "b": 183.40918, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "each subfigure separately. The same applies for lists, where one", "bbox": {"l": 53.79800000000001, "t": 185.99352999999996, "r": 294.04709, "b": 194.36816, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "might annotate all list items in one block or each list item sep-", "bbox": {"l": 53.79800000000001, "t": 196.95250999999996, "r": 295.55612, "b": 205.32714999999996, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "arately. In essence, we observed that challenging layouts would", "bbox": {"l": 53.79800000000001, "t": 207.91156, "r": 294.04712, "b": 216.28619000000003, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "be annotated in different but plausible ways. To illustrate this, we", "bbox": {"l": 53.79800000000001, "t": 218.87054, "r": 294.04495, "b": 227.24518, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "show in Figure 4 multiple examples of plausible but inconsistent", "bbox": {"l": 53.79800000000001, "t": 229.82952999999998, "r": 294.04712, "b": 238.20416, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "annotations on the same pages.", "bbox": {"l": 53.79800000000001, "t": 240.78754000000004, "r": 168.61276, "b": 249.16216999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "At first sight, the task of visual document-layout interpretation appears intuitive enough to obtain plausible annotations in most cases. However, during early trial-runs in the core team, we observed many cases in which annotators use different annotation styles, especially for documents with challenging layouts. For example, if a figure is presented with subfigures, one annotator might draw a single figure bounding-box, while another might annotate each subfigure separately. The same applies for lists, where one might annotate all list items in one block or each list item separately. In essence, we observed that challenging layouts would be annotated in different but plausible ways. To illustrate this, we show in Figure 4 multiple examples of plausible but inconsistent annotations on the same pages."}, {"label": "text", "id": 1, "page_no": 4, "cluster": {"id": 1, "label": "text", "bbox": {"l": 53.79800000000001, "t": 251.74652000000003, "r": 295.56006, "b": 336.83417, "coord_origin": "TOPLEFT"}, "confidence": 0.985905110836029, "cells": [{"id": 19, "text": "Obviously, this inconsistency in annotations is not desirable for", "bbox": {"l": 63.76100199999999, "t": 251.74652000000003, "r": 294.21884, "b": 260.12114999999994, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "datasets which are intended to be used for model training. To min-", "bbox": {"l": 53.79800000000001, "t": 262.70556999999997, "r": 295.56006, "b": 271.0802, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "imise these inconsistencies, we created a detailed annotation guide-", "bbox": {"l": 53.79800000000001, "t": 273.66454999999996, "r": 295.55676, "b": 282.03918, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "line. While perfect consistency across 40 annotation staff members", "bbox": {"l": 53.79800000000001, "t": 284.62354, "r": 294.04922, "b": 292.99817, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "is clearly not possible to achieve, we saw a huge improvement in", "bbox": {"l": 53.79800000000001, "t": 295.5825500000001, "r": 294.04343, "b": 303.95717999999994, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "annotation consistency after the introduction of our annotation", "bbox": {"l": 53.79800000000001, "t": 306.54153, "r": 294.04712, "b": 314.91617, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "guideline. A few selected, non-trivial highlights of the guideline", "bbox": {"l": 53.79800000000001, "t": 317.50055, "r": 294.04718, "b": 325.87518, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "are:", "bbox": {"l": 53.79800000000001, "t": 328.4595299999999, "r": 67.28347, "b": 336.83417, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Obviously, this inconsistency in annotations is not desirable for datasets which are intended to be used for model training. To minimise these inconsistencies, we created a detailed annotation guideline. While perfect consistency across 40 annotation staff members is clearly not possible to achieve, we saw a huge improvement in annotation consistency after the introduction of our annotation guideline. A few selected, non-trivial highlights of the guideline are:"}, {"label": "list_item", "id": 5, "page_no": 4, "cluster": {"id": 5, "label": "list_item", "bbox": {"l": 64.708, "t": 348.51254, "r": 294.0462, "b": 389.77313, "coord_origin": "TOPLEFT"}, "confidence": 0.9691526293754578, "cells": [{"id": 27, "text": "(1)", "bbox": {"l": 64.708, "t": 348.51254, "r": 74.626793, "b": 356.88718, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Every list-item is an individual object instance with class", "bbox": {"l": 76.963936, "t": 348.51254, "r": 294.0462, "b": 356.88718, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "label", "bbox": {"l": 78.207001, "t": 359.47153, "r": 95.730484, "b": 367.84616, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "List-item", "bbox": {"l": 97.976997, "t": 359.51639, "r": 130.17131, "b": 367.85513, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": ". This definition is different from PubLayNet", "bbox": {"l": 130.17101, "t": 359.47153, "r": 294.04053, "b": 367.84616, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "and DocBank, where all list-items are grouped together into", "bbox": {"l": 78.207001, "t": 370.43054, "r": 294.04385, "b": 378.80518, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "one", "bbox": {"l": 78.207001, "t": 381.38953000000004, "r": 91.593834, "b": 389.76416, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "List", "bbox": {"l": 93.834999, "t": 381.43439000000006, "r": 106.88111, "b": 389.77313, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "object.", "bbox": {"l": 109.629, "t": 381.38953000000004, "r": 133.72173, "b": 389.76416, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "(1) Every list-item is an individual object instance with class label List-item . This definition is different from PubLayNet and DocBank, where all list-items are grouped together into one List object."}, {"label": "list_item", "id": 7, "page_no": 4, "cluster": {"id": 7, "label": "list_item", "bbox": {"l": 64.707993, "t": 392.34851, "r": 295.56372, "b": 433.60016, "coord_origin": "TOPLEFT"}, "confidence": 0.9591284990310669, "cells": [{"id": 36, "text": "(2)", "bbox": {"l": 64.707993, "t": 392.34851, "r": 75.097656, "b": 400.72313999999994, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "A", "bbox": {"l": 77.545731, "t": 392.34851, "r": 84.351402, "b": 400.72313999999994, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "List-item", "bbox": {"l": 86.584, "t": 392.39339999999993, "r": 118.01329000000001, "b": 400.73215, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "is a paragraph with hanging indentation. Single-", "bbox": {"l": 120.26899999999999, "t": 392.34854, "r": 295.55695, "b": 400.72317999999996, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "line elements can qualify as", "bbox": {"l": 78.207001, "t": 403.30753, "r": 181.80978, "b": 411.68216, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "List-item", "bbox": {"l": 184.175, "t": 403.35239, "r": 216.68806000000004, "b": 411.69113, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "if the neighbour ele-", "bbox": {"l": 219.078, "t": 403.30753, "r": 295.56372, "b": 411.68216, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "ments expose hanging indentation. Bullet or enumeration", "bbox": {"l": 78.207001, "t": 414.2665400000001, "r": 294.04617, "b": 422.64116999999993, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "symbols are not a requirement.", "bbox": {"l": 78.207001, "t": 425.22552, "r": 192.00853, "b": 433.60016, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "(2) A List-item is a paragraph with hanging indentation. Singleline elements can qualify as List-item if the neighbour elements expose hanging indentation. Bullet or enumeration symbols are not a requirement."}, {"label": "list_item", "id": 10, "page_no": 4, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 64.708, "t": 436.18451000000005, "r": 294.04724, "b": 455.52713, "coord_origin": "TOPLEFT"}, "confidence": 0.9413429498672485, "cells": [{"id": 45, "text": "(3)", "bbox": {"l": 64.708, "t": 436.18451000000005, "r": 74.483009, "b": 444.55914, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "For every", "bbox": {"l": 76.786255, "t": 436.18451000000005, "r": 112.61566, "b": 444.55914, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "Caption", "bbox": {"l": 114.861, "t": 436.2294, "r": 142.61249, "b": 444.56815000000006, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": ", there must be exactly one corresponding", "bbox": {"l": 142.612, "t": 436.18454, "r": 294.04724, "b": 444.55917, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "Picture", "bbox": {"l": 78.207001, "t": 447.18839, "r": 102.79287, "b": 455.52713, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "or", "bbox": {"l": 105.245, "t": 447.14352, "r": 113.09956999999999, "b": 455.51815999999997, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Table", "bbox": {"l": 115.341, "t": 447.18839, "r": 134.40356, "b": 455.52713, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": ".", "bbox": {"l": 134.403, "t": 447.14352, "r": 136.37561, "b": 455.51815999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "(3) For every Caption , there must be exactly one corresponding Picture or Table ."}, {"label": "list_item", "id": 9, "page_no": 4, "cluster": {"id": 9, "label": "list_item", "bbox": {"l": 64.708, "t": 458.1015300000001, "r": 294.04599, "b": 477.43518, "coord_origin": "TOPLEFT"}, "confidence": 0.9426738023757935, "cells": [{"id": 53, "text": "(4)", "bbox": {"l": 64.708, "t": 458.1015300000001, "r": 74.220215, "b": 466.47617, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "Connected sub-pictures are grouped together in one", "bbox": {"l": 76.461555, "t": 458.1015300000001, "r": 267.46786, "b": 466.47617, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "Picture", "bbox": {"l": 269.70599, "t": 458.14639, "r": 294.04599, "b": 466.48514, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "object.", "bbox": {"l": 78.207001, "t": 469.06055, "r": 102.29972, "b": 477.43518, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "(4) Connected sub-pictures are grouped together in one Picture object."}, {"label": "list_item", "id": 11, "page_no": 4, "cluster": {"id": 11, "label": "list_item", "bbox": {"l": 64.708, "t": 480.01953, "r": 264.50571, "b": 488.40314, "coord_origin": "TOPLEFT"}, "confidence": 0.9147457480430603, "cells": [{"id": 57, "text": "(5)", "bbox": {"l": 64.708, "t": 480.01953, "r": 74.345383, "b": 488.39417, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Formula numbers are included in a", "bbox": {"l": 76.616203, "t": 480.01953, "r": 206.13503, "b": 488.39417, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Formula", "bbox": {"l": 208.38, "t": 480.06439, "r": 238.12155, "b": 488.40314, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "object.", "bbox": {"l": 240.41300999999999, "t": 480.01953, "r": 264.50571, "b": 488.39417, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "(5) Formula numbers are included in a Formula object."}, {"label": "list_item", "id": 8, "page_no": 4, "cluster": {"id": 8, "label": "list_item", "bbox": {"l": 64.708008, "t": 490.97852, "r": 294.04617, "b": 521.27118, "coord_origin": "TOPLEFT"}, "confidence": 0.9544308185577393, "cells": [{"id": 61, "text": "(6)", "bbox": {"l": 64.708008, "t": 490.97852, "r": 74.564522, "b": 499.35315, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "Emphasised text (e.g. in italic or bold) at the beginning of", "bbox": {"l": 76.886978, "t": 490.97852, "r": 294.04617, "b": 499.35315, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "a paragraph is not considered a", "bbox": {"l": 78.207001, "t": 501.93753, "r": 200.34819, "b": 510.31216, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "Section-header", "bbox": {"l": 203.66701, "t": 501.98239, "r": 256.57504, "b": 510.32114, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": ", unless it", "bbox": {"l": 256.57401, "t": 501.93753, "r": 294.04401, "b": 510.31216, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "appears exclusively on its own line.", "bbox": {"l": 78.207001, "t": 512.8965499999999, "r": 208.13017, "b": 521.27118, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "(6) Emphasised text (e.g. in italic or bold) at the beginning of a paragraph is not considered a Section-header , unless it appears exclusively on its own line."}, {"label": "text", "id": 3, "page_no": 4, "cluster": {"id": 3, "label": "text", "bbox": {"l": 53.528999, "t": 532.9505300000001, "r": 295.56253, "b": 574.20117, "coord_origin": "TOPLEFT"}, "confidence": 0.9811431169509888, "cells": [{"id": 67, "text": "The complete annotation guideline is over 100 pages long and a", "bbox": {"l": 53.528999, "t": 532.9505300000001, "r": 294.04337, "b": 541.32516, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "detailed description is obviously out of scope for this paper. Never-", "bbox": {"l": 53.79800000000001, "t": 543.90855, "r": 295.56253, "b": 552.28317, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "theless, it will be made publicly available alongside with DocLayNet", "bbox": {"l": 53.79800000000001, "t": 554.8675499999999, "r": 294.04538, "b": 563.24217, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "for future reference.", "bbox": {"l": 53.79800000000001, "t": 565.82655, "r": 127.2418, "b": 574.20117, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The complete annotation guideline is over 100 pages long and a detailed description is obviously out of scope for this paper. Nevertheless, it will be made publicly available alongside with DocLayNet for future reference."}, {"label": "text", "id": 0, "page_no": 4, "cluster": {"id": 0, "label": "text", "bbox": {"l": 53.79800000000001, "t": 576.66899, "r": 295.56226, "b": 705.708176, "coord_origin": "TOPLEFT"}, "confidence": 0.9864389896392822, "cells": [{"id": 71, "text": "Phase 3: Training.", "bbox": {"l": 63.76100199999999, "t": 576.66899, "r": 136.7744, "b": 585.14224, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "After a first trial with a small group of peo-", "bbox": {"l": 139.008, "t": 576.7855500000001, "r": 295.56226, "b": 585.16017, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "ple, we realised that providing the annotation guideline and a set of", "bbox": {"l": 53.79800000000001, "t": 587.74455, "r": 294.04532, "b": 596.1191699999999, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "random practice pages did not yield the desired quality level for lay-", "bbox": {"l": 53.79800000000001, "t": 598.70355, "r": 295.55676, "b": 607.07817, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "out annotation. Therefore we prepared a subset of pages with two", "bbox": {"l": 53.79800000000001, "t": 609.66255, "r": 294.04605, "b": 618.0371700000001, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "different complexity levels, each with a practice and an exam part.", "bbox": {"l": 53.79800000000001, "t": 620.6215500000001, "r": 295.42377, "b": 628.99617, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "974 pages were reference-annotated by one proficient core team", "bbox": {"l": 53.79800000000001, "t": 631.58055, "r": 294.04712, "b": 639.95517, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "member. Annotation staff were then given the task to annotate the", "bbox": {"l": 53.79800000000001, "t": 642.53955, "r": 294.04922, "b": 650.91417, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "same subsets (blinded from the reference). By comparing the an-", "bbox": {"l": 53.79800000000001, "t": 653.49855, "r": 295.55618, "b": 661.87317, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "notations of each staff member with the reference annotations, we", "bbox": {"l": 53.79800000000001, "t": 664.45655, "r": 294.04874, "b": 672.83117, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "could quantify how closely their annotations matched the reference.", "bbox": {"l": 53.79800000000001, "t": 675.4155499999999, "r": 295.42496, "b": 683.79017, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "Only after passing two exam levels with high annotation quality,", "bbox": {"l": 53.79800000000001, "t": 686.37456, "r": 295.0274, "b": 694.749176, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "staff were admitted into the production phase. Practice iterations", "bbox": {"l": 53.79800000000001, "t": 697.333557, "r": 294.04114, "b": 705.708176, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Phase 3: Training. After a first trial with a small group of people, we realised that providing the annotation guideline and a set of random practice pages did not yield the desired quality level for layout annotation. Therefore we prepared a subset of pages with two different complexity levels, each with a practice and an exam part. 974 pages were reference-annotated by one proficient core team member. Annotation staff were then given the task to annotate the same subsets (blinded from the reference). By comparing the annotations of each staff member with the reference annotations, we could quantify how closely their annotations matched the reference. Only after passing two exam levels with high annotation quality, staff were admitted into the production phase. Practice iterations"}, {"label": "picture", "id": 16, "page_no": 4, "cluster": {"id": 16, "label": "picture", "bbox": {"l": 315.960205078125, "t": 85.33881378173828, "r": 559.396484375, "b": 459.68084716796875, "coord_origin": "TOPLEFT"}, "confidence": 0.7264115214347839, "cells": [{"id": 84, "text": "1ef23f5e6d7f10d393f9947e8208285dce9ae87250ac483ac4b4a59d51b4e037", "bbox": {"l": 340.00214, "t": 179.79296999999997, "r": 416.20551, "b": 181.90972999999997, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "Compliant with guidelines", "bbox": {"l": 339.38269, "t": 85.19066999999995, "r": 417.83722, "b": 92.28399999999999, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Plausible but invalid alternative", "bbox": {"l": 451.42834, "t": 85.19066999999995, "r": 546.22913, "b": 92.28399999999999, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Borderline case: Two guideline-compliant alternatives", "bbox": {"l": 350.33701, "t": 364.85706, "r": 513.48035, "b": 371.95035000000007, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "03c31a2ee1ed1b583c28957f475ee545d144e1b5a264dc4dd068c8d2f6a64860", "bbox": {"l": 340.00201, "t": 245.07385, "r": 416.20538, "b": 247.19061, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "1a5cd524f1844c1260c8e8c073e1f442423c264583212b0d0b6626fc780e6ed4", "bbox": {"l": 340.00201, "t": 359.12488, "r": 416.20538, "b": 361.24167, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "A", "bbox": {"l": 322.19424, "t": 98.34105999999997, "r": 326.01498, "b": 104.25214000000005, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "B", "bbox": {"l": 322.19424, "t": 186.99103000000002, "r": 326.01498, "b": 192.90204000000006, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "C", "bbox": {"l": 322.19424, "t": 253.54192999999998, "r": 326.01498, "b": 259.453, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "D", "bbox": {"l": 322.19424, "t": 367.08495999999997, "r": 326.01498, "b": 372.996, "coord_origin": "TOPLEFT"}}], "children": [{"id": 16, "label": "text", "bbox": {"l": 340.00214, "t": 179.79296999999997, "r": 416.20551, "b": 181.90972999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "1ef23f5e6d7f10d393f9947e8208285dce9ae87250ac483ac4b4a59d51b4e037", "bbox": {"l": 340.00214, "t": 179.79296999999997, "r": 416.20551, "b": 181.90972999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 339.38269, "t": 85.19066999999995, "r": 417.83722, "b": 92.28399999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "Compliant with guidelines", "bbox": {"l": 339.38269, "t": 85.19066999999995, "r": 417.83722, "b": 92.28399999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 451.42834, "t": 85.19066999999995, "r": 546.22913, "b": 92.28399999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "Plausible but invalid alternative", "bbox": {"l": 451.42834, "t": 85.19066999999995, "r": 546.22913, "b": 92.28399999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 350.33701, "t": 364.85706, "r": 513.48035, "b": 371.95035000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "Borderline case: Two guideline-compliant alternatives", "bbox": {"l": 350.33701, "t": 364.85706, "r": 513.48035, "b": 371.95035000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 340.00201, "t": 245.07385, "r": 416.20538, "b": 247.19061, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "03c31a2ee1ed1b583c28957f475ee545d144e1b5a264dc4dd068c8d2f6a64860", "bbox": {"l": 340.00201, "t": 245.07385, "r": 416.20538, "b": 247.19061, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 340.00201, "t": 359.12488, "r": 416.20538, "b": 361.24167, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "1a5cd524f1844c1260c8e8c073e1f442423c264583212b0d0b6626fc780e6ed4", "bbox": {"l": 340.00201, "t": 359.12488, "r": 416.20538, "b": 361.24167, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 322.19424, "t": 98.34105999999997, "r": 326.01498, "b": 104.25214000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "A", "bbox": {"l": 322.19424, "t": 98.34105999999997, "r": 326.01498, "b": 104.25214000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 322.19424, "t": 186.99103000000002, "r": 326.01498, "b": 192.90204000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "B", "bbox": {"l": 322.19424, "t": 186.99103000000002, "r": 326.01498, "b": 192.90204000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 322.19424, "t": 253.54192999999998, "r": 326.01498, "b": 259.453, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "C", "bbox": {"l": 322.19424, "t": 253.54192999999998, "r": 326.01498, "b": 259.453, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 322.19424, "t": 367.08495999999997, "r": 326.01498, "b": 372.996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "D", "bbox": {"l": 322.19424, "t": 367.08495999999997, "r": 326.01498, "b": 372.996, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "text", "id": 22, "page_no": 4, "cluster": {"id": 22, "label": "text", "bbox": {"l": 400.12842, "t": 458.44327000000004, "r": 476.33178999999996, "b": 460.5600600000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "05237a14f2524e3f53c8454b074409d05078038a6a36b770fcc8ec7e540deae0", "bbox": {"l": 400.12842, "t": 458.44327000000004, "r": 476.33178999999996, "b": 460.5600600000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "05237a14f2524e3f53c8454b074409d05078038a6a36b770fcc8ec7e540deae0"}, {"label": "caption", "id": 14, "page_no": 4, "cluster": {"id": 14, "label": "caption", "bbox": {"l": 317.95499, "t": 473.49399, "r": 559.80579, "b": 503.88519, "coord_origin": "TOPLEFT"}, "confidence": 0.8873711824417114, "cells": [{"id": 95, "text": "Figure 4: Examples of plausible annotation alternatives for", "bbox": {"l": 317.95499, "t": 473.49399, "r": 558.3891, "b": 481.96722, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "the same page. Criteria in our annotation guideline can re-", "bbox": {"l": 317.95499, "t": 484.45297, "r": 559.80579, "b": 492.92621, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "solve cases A to C, while the case D remains ambiguous.", "bbox": {"l": 317.95499, "t": 495.41196, "r": 544.14148, "b": 503.88519, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 4: Examples of plausible annotation alternatives for the same page. Criteria in our annotation guideline can resolve cases A to C, while the case D remains ambiguous."}, {"label": "text", "id": 6, "page_no": 4, "cluster": {"id": 6, "label": "text", "bbox": {"l": 317.62299, "t": 525.49753, "r": 558.20435, "b": 544.83118, "coord_origin": "TOPLEFT"}, "confidence": 0.9611718654632568, "cells": [{"id": 98, "text": "were carried out over a timeframe of 12 weeks, after which 8 of the", "bbox": {"l": 317.62299, "t": 525.49753, "r": 558.20435, "b": 533.87216, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "40", "bbox": {"l": 317.74899, "t": 536.45656, "r": 326.07019, "b": 544.83118, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "initially allocated annotators did not pass the bar.", "bbox": {"l": 328.3071, "t": 536.45656, "r": 509.11896, "b": 544.83118, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "were carried out over a timeframe of 12 weeks, after which 8 of the 40 initially allocated annotators did not pass the bar."}, {"label": "text", "id": 2, "page_no": 4, "cluster": {"id": 2, "label": "text", "bbox": {"l": 317.62299, "t": 547.299, "r": 559.7149, "b": 709.2151719999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9829543232917786, "cells": [{"id": 101, "text": "Phase 4: Production annotation.", "bbox": {"l": 327.918, "t": 547.299, "r": 456.80109000000004, "b": 555.77225, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "The previously selected 80K", "bbox": {"l": 458.7120100000001, "t": 547.41556, "r": 558.48926, "b": 555.79018, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "pages were annotated with the defined 11 class labels by 32 annota-", "bbox": {"l": 317.95499, "t": 558.37456, "r": 559.71368, "b": 566.74918, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "tors. This production phase took around three months to complete.", "bbox": {"l": 317.95499, "t": 569.33356, "r": 559.58124, "b": 577.7081800000001, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "All annotations were created online through CCS, which visualises", "bbox": {"l": 317.64099, "t": 580.29256, "r": 558.20386, "b": 588.66718, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "the programmatic PDF text-cells as an overlay on the page. The page", "bbox": {"l": 317.95499, "t": 591.25156, "r": 558.20221, "b": 599.62617, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "annotation are obtained by drawing rectangular bounding-boxes,", "bbox": {"l": 317.95499, "t": 602.20955, "r": 559.18457, "b": 610.58417, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "as shown in Figure 3. With regard to the annotation practices, we", "bbox": {"l": 317.95499, "t": 613.16855, "r": 558.20197, "b": 621.54317, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "implemented a few constraints and capabilities on the tooling level.", "bbox": {"l": 317.95499, "t": 624.12755, "r": 559.58197, "b": 632.50217, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "First, we only allow non-overlapping, vertically oriented, rectangu-", "bbox": {"l": 317.95499, "t": 635.08655, "r": 559.71411, "b": 643.46117, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "lar boxes. For the large majority of documents, this constraint was", "bbox": {"l": 317.95499, "t": 646.04555, "r": 558.20557, "b": 654.42017, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "sufficient and it speeds up the annotation considerably in compar-", "bbox": {"l": 317.95499, "t": 657.00455, "r": 559.7149, "b": 665.3791699999999, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "ison with arbitrary segmentation shapes. Second, annotator staff", "bbox": {"l": 317.95499, "t": 667.9635499999999, "r": 558.19849, "b": 676.33817, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "were not able to see each other\u2019s annotations. This was enforced by", "bbox": {"l": 317.62299, "t": 678.92255, "r": 558.43268, "b": 687.29717, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "design to avoid any bias in the annotation, which could skew the", "bbox": {"l": 317.95499, "t": 689.8815500000001, "r": 558.19806, "b": 698.256172, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "numbers of the inter-annotator agreement (see Table 1). We wanted", "bbox": {"l": 317.95499, "t": 700.840553, "r": 558.20227, "b": 709.2151719999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Phase 4: Production annotation. The previously selected 80K pages were annotated with the defined 11 class labels by 32 annotators. This production phase took around three months to complete. All annotations were created online through CCS, which visualises the programmatic PDF text-cells as an overlay on the page. The page annotation are obtained by drawing rectangular bounding-boxes, as shown in Figure 3. With regard to the annotation practices, we implemented a few constraints and capabilities on the tooling level. First, we only allow non-overlapping, vertically oriented, rectangular boxes. For the large majority of documents, this constraint was sufficient and it speeds up the annotation considerably in comparison with arbitrary segmentation shapes. Second, annotator staff were not able to see each other's annotations. This was enforced by design to avoid any bias in the annotation, which could skew the numbers of the inter-annotator agreement (see Table 1). We wanted"}], "headers": [{"label": "page_header", "id": 13, "page_no": 4, "cluster": {"id": 13, "label": "page_header", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.8877827525138855, "cells": [{"id": 0, "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis"}, {"label": "page_header", "id": 15, "page_no": 4, "cluster": {"id": 15, "label": "page_header", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.8534670472145081, "cells": [{"id": 1, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA"}]}}, {"page_no": 5, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 246.24382, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar", "bbox": {"l": 253.13897999999998, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Table 2: Prediction performance (mAP@0.5-0.95) of object", "bbox": {"l": 53.501999, "t": 86.87292000000002, "r": 294.04361, "b": 95.34618999999998, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "detection networks on DocLayNet test set. The MRCNN", "bbox": {"l": 53.79800000000001, "t": 97.83191, "r": 294.04373, "b": 106.30517999999995, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "(Mask R-CNN) and FRCNN (Faster R-CNN) models with", "bbox": {"l": 53.52, "t": 108.79088999999999, "r": 294.0437, "b": 117.26415999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "ResNet-50 or ResNet-101 backbone were trained based on", "bbox": {"l": 53.79800000000001, "t": 119.74987999999996, "r": 294.04373, "b": 128.22313999999994, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "the network architectures from the", "bbox": {"l": 53.79800000000001, "t": 130.70885999999996, "r": 202.43402, "b": 139.18213000000003, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "detectron2", "bbox": {"l": 206.08501, "t": 130.71783000000005, "r": 247.14215000000002, "b": 139.20905000000005, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "model zoo", "bbox": {"l": 250.95001, "t": 130.70885999999996, "r": 294.04254, "b": 139.18213000000003, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "(Mask R-CNN R50, R101-FPN 3x, Faster R-CNN R101-FPN", "bbox": {"l": 53.52002, "t": 141.66785000000004, "r": 294.04367, "b": 150.14111000000003, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "3x), with default configurations. The YOLO implementation", "bbox": {"l": 53.798019, "t": 152.62683000000004, "r": 294.04373, "b": 161.1001, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "utilized was YOLOv5x6 [13]. All models were initialised us-", "bbox": {"l": 53.798019, "t": 163.58582, "r": 295.64874, "b": 172.05908, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "ing pre-trained weights from the COCO 2017 dataset.", "bbox": {"l": 53.798019, "t": 174.54381999999998, "r": 268.62399, "b": 183.01709000000005, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "human", "bbox": {"l": 132.36501, "t": 197.97351000000003, "r": 157.99098, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "MRCNN", "bbox": {"l": 173.505, "t": 197.97351000000003, "r": 204.61841, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "FRCNN", "bbox": {"l": 220.13028, "t": 197.97351000000003, "r": 248.06958, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "YOLO", "bbox": {"l": 258.03125, "t": 197.97351000000003, "r": 280.17825, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "R50", "bbox": {"l": 168.39301, "t": 208.93255999999997, "r": 181.99504, "b": 217.30719, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "R101", "bbox": {"l": 192.39606, "t": 208.93255999999997, "r": 210.16747, "b": 217.30719, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "R101", "bbox": {"l": 225.21309, "t": 208.93255999999997, "r": 242.9845, "b": 217.30719, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "v5x6", "bbox": {"l": 260.51379, "t": 208.93255999999997, "r": 277.70239, "b": 217.30719, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Caption", "bbox": {"l": 67.663002, "t": 220.28954999999996, "r": 96.848633, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "84-89", "bbox": {"l": 135.32401, "t": 220.28954999999996, "r": 155.03215, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "68.4", "bbox": {"l": 167.95399, "t": 220.28954999999996, "r": 182.43472, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "71.5", "bbox": {"l": 194.0462, "t": 220.28954999999996, "r": 208.52695, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "70.1", "bbox": {"l": 226.86324000000002, "t": 220.28954999999996, "r": 241.34396, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "77.7", "bbox": {"l": 261.86804, "t": 220.28954999999996, "r": 276.34879, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Footnote", "bbox": {"l": 67.663002, "t": 231.24854000000005, "r": 100.1662, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "83-91", "bbox": {"l": 135.32401, "t": 231.24854000000005, "r": 155.03215, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "70.9", "bbox": {"l": 167.95399, "t": 231.24854000000005, "r": 182.43472, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "71.8", "bbox": {"l": 194.0462, "t": 231.24854000000005, "r": 208.52695, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "73.7", "bbox": {"l": 226.86324000000002, "t": 231.24854000000005, "r": 241.34396, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "77.2", "bbox": {"l": 261.86804, "t": 231.24854000000005, "r": 276.34879, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "Formula", "bbox": {"l": 67.663002, "t": 242.20752000000005, "r": 98.175659, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "83-85", "bbox": {"l": 135.32401, "t": 242.20752000000005, "r": 155.03215, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "60.1", "bbox": {"l": 167.95399, "t": 242.20752000000005, "r": 182.43472, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "63.4", "bbox": {"l": 194.0462, "t": 242.20752000000005, "r": 208.52695, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "63.5", "bbox": {"l": 226.86324000000002, "t": 242.20752000000005, "r": 241.34396, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "66.2", "bbox": {"l": 261.86804, "t": 242.20752000000005, "r": 276.34879, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "List-item", "bbox": {"l": 67.663002, "t": 253.16656, "r": 100.54279, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "87-88", "bbox": {"l": 135.32401, "t": 253.16656, "r": 155.03215, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "81.2", "bbox": {"l": 167.95399, "t": 253.16656, "r": 182.43472, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "80.8", "bbox": {"l": 194.0462, "t": 253.16656, "r": 208.52695, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "81.0", "bbox": {"l": 226.86324000000002, "t": 253.16656, "r": 241.34396, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "86.2", "bbox": {"l": 261.86804, "t": 253.16656, "r": 276.34879, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Page-footer", "bbox": {"l": 67.663002, "t": 264.12555, "r": 110.19064, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "93-94", "bbox": {"l": 135.32401, "t": 264.12555, "r": 155.03215, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "61.6", "bbox": {"l": 167.95399, "t": 264.12555, "r": 182.43472, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "59.3", "bbox": {"l": 194.0462, "t": 264.12555, "r": 208.52695, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "58.9", "bbox": {"l": 226.86324000000002, "t": 264.12555, "r": 241.34396, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "61.1", "bbox": {"l": 261.86804, "t": 264.12555, "r": 276.34879, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Page-header", "bbox": {"l": 67.663002, "t": 275.08453, "r": 112.94331999999999, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "85-89", "bbox": {"l": 135.32401, "t": 275.08453, "r": 155.03215, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "71.9", "bbox": {"l": 167.95399, "t": 275.08453, "r": 182.43472, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "70.0", "bbox": {"l": 194.0462, "t": 275.08453, "r": 208.52695, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "72.0", "bbox": {"l": 226.86324000000002, "t": 275.08453, "r": 241.34396, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "67.9", "bbox": {"l": 261.86804, "t": 275.08453, "r": 276.34879, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Picture", "bbox": {"l": 67.663002, "t": 286.04355000000004, "r": 93.647629, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "69-71", "bbox": {"l": 135.32401, "t": 286.04355000000004, "r": 155.03215, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "71.7", "bbox": {"l": 167.95399, "t": 286.04355000000004, "r": 182.43472, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "72.7", "bbox": {"l": 194.0462, "t": 286.04355000000004, "r": 208.52695, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "72.0", "bbox": {"l": 226.86324000000002, "t": 286.04355000000004, "r": 241.34396, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "77.1", "bbox": {"l": 261.86804, "t": 286.04355000000004, "r": 276.34879, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "Section-header", "bbox": {"l": 67.663002, "t": 297.00253, "r": 122.40287999999998, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "83-84", "bbox": {"l": 135.32401, "t": 297.00253, "r": 155.03215, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "67.6", "bbox": {"l": 167.95399, "t": 297.00253, "r": 182.43472, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "69.3", "bbox": {"l": 194.0462, "t": 297.00253, "r": 208.52695, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "68.4", "bbox": {"l": 226.86324000000002, "t": 297.00253, "r": 241.34396, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "74.6", "bbox": {"l": 261.86804, "t": 297.00253, "r": 276.34879, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "Table", "bbox": {"l": 67.663002, "t": 307.96155, "r": 87.46978, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "77-81", "bbox": {"l": 135.32401, "t": 307.96155, "r": 155.03215, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "82.2", "bbox": {"l": 167.95399, "t": 307.96155, "r": 182.43472, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "82.9", "bbox": {"l": 194.0462, "t": 307.96155, "r": 208.52695, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "82.2", "bbox": {"l": 226.86324000000002, "t": 307.96155, "r": 241.34396, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "86.3", "bbox": {"l": 261.86804, "t": 307.96155, "r": 276.34879, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "Text", "bbox": {"l": 67.663002, "t": 318.91953, "r": 83.623199, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "84-86", "bbox": {"l": 135.32401, "t": 318.91953, "r": 155.03215, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "84.6", "bbox": {"l": 167.95399, "t": 318.91953, "r": 182.43472, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "85.8", "bbox": {"l": 194.0462, "t": 318.91953, "r": 208.52695, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "85.4", "bbox": {"l": 226.86324000000002, "t": 318.91953, "r": 241.34396, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "88.1", "bbox": {"l": 261.86804, "t": 318.91953, "r": 276.34879, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Title", "bbox": {"l": 67.663002, "t": 329.87854, "r": 84.654327, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "60-72", "bbox": {"l": 135.32401, "t": 329.87854, "r": 155.03215, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "76.7", "bbox": {"l": 167.95399, "t": 329.87854, "r": 182.43472, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "80.4", "bbox": {"l": 194.0462, "t": 329.87854, "r": 208.52695, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "79.9", "bbox": {"l": 226.86324000000002, "t": 329.87854, "r": 241.34396, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "82.7", "bbox": {"l": 261.86804, "t": 329.87854, "r": 276.34879, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "All", "bbox": {"l": 67.663002, "t": 341.23654, "r": 78.628906, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "82-83", "bbox": {"l": 135.32401, "t": 341.23654, "r": 155.03215, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "72.4", "bbox": {"l": 167.95399, "t": 341.23654, "r": 182.43472, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "73.5", "bbox": {"l": 194.0462, "t": 341.23654, "r": 208.52695, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "73.4", "bbox": {"l": 226.86324000000002, "t": 341.23654, "r": 241.34396, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "76.8", "bbox": {"l": 261.86804, "t": 341.23654, "r": 276.34879, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "to avoid this at any cost in order to have clear, unbiased baseline", "bbox": {"l": 53.79800000000001, "t": 370.92755, "r": 294.04712, "b": 379.30219000000005, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "numbers for human document-layout annotation. Third, we in-", "bbox": {"l": 53.79800000000001, "t": 381.88654, "r": 295.55612, "b": 390.26117, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "troduced the feature of", "bbox": {"l": 53.79800000000001, "t": 392.84555, "r": 140.3623, "b": 401.22017999999997, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "snapping", "bbox": {"l": 142.99001, "t": 392.89041, "r": 175.9695, "b": 401.2291599999999, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "boxes around text segments to", "bbox": {"l": 178.951, "t": 392.84555, "r": 294.04083, "b": 401.22017999999997, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "obtain a pixel-accurate annotation and again reduce time and effort.", "bbox": {"l": 53.79800000000001, "t": 403.80453, "r": 295.42493, "b": 412.17917, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "The CCS annotation tool automatically shrinks every user-drawn", "bbox": {"l": 53.528999, "t": 414.76355, "r": 294.04251, "b": 423.13818, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "box to the minimum bounding-box around the enclosed text-cells", "bbox": {"l": 53.79800000000001, "t": 425.72253, "r": 294.04807, "b": 434.09717, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "for all purely text-based segments, which excludes only", "bbox": {"l": 53.79800000000001, "t": 436.6815500000001, "r": 256.80627, "b": 445.0561799999999, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "Table", "bbox": {"l": 259.04199, "t": 436.72641, "r": 278.10455, "b": 445.06516, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "and", "bbox": {"l": 280.54999, "t": 436.6815500000001, "r": 294.04443, "b": 445.0561799999999, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "Picture", "bbox": {"l": 53.79800000000001, "t": 447.68539, "r": 78.875587, "b": 456.02413999999993, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": ". For the latter, we instructed annotation staff to minimise", "bbox": {"l": 78.876999, "t": 447.64053, "r": 294.04852, "b": 456.01517, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "inclusion of surrounding whitespace while including all graphical", "bbox": {"l": 53.79800000000001, "t": 458.59955, "r": 294.04645, "b": 466.97418, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "lines. A downside of snapping boxes to enclosed text cells is that", "bbox": {"l": 53.79800000000001, "t": 469.55853, "r": 294.0416, "b": 477.93317, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "some wrongly parsed PDF pages cannot be annotated correctly and", "bbox": {"l": 53.79800000000001, "t": 480.51654, "r": 294.04538, "b": 488.89117, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "need to be skipped. Fourth, we established a way to flag pages as", "bbox": {"l": 53.79800000000001, "t": 491.47552, "r": 294.04312, "b": 499.85016, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "rejected", "bbox": {"l": 53.79800000000001, "t": 502.4794, "r": 80.597939, "b": 510.81815, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "for cases where no valid annotation according to the label", "bbox": {"l": 83.366997, "t": 502.43454, "r": 294.04483, "b": 510.80917, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "guidelines could be achieved. Example cases for this would be PDF", "bbox": {"l": 53.79800000000001, "t": 513.3935200000001, "r": 294.25833, "b": 521.7681600000001, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "pages that render incorrectly or contain layouts that are impossible", "bbox": {"l": 53.79800000000001, "t": 524.35254, "r": 294.04535, "b": 532.72717, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "to capture with non-overlapping rectangles. Such rejected pages are", "bbox": {"l": 53.79800000000001, "t": 535.31155, "r": 294.04535, "b": 543.68617, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "not contained in the final dataset. With all these measures in place,", "bbox": {"l": 53.79800000000001, "t": 546.27055, "r": 295.02759, "b": 554.64517, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "experienced annotation staff managed to annotate a single page in", "bbox": {"l": 53.79800000000001, "t": 557.22955, "r": 294.0488, "b": 565.6041700000001, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "a typical timeframe of 20s to 60s, depending on its complexity.", "bbox": {"l": 53.79800000000001, "t": 568.18855, "r": 281.80457, "b": 576.56317, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "5", "bbox": {"l": 53.79800000000001, "t": 588.12991, "r": 59.405277, "b": 598.43901, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "EXPERIMENTS", "bbox": {"l": 70.314377, "t": 588.12991, "r": 147.48535, "b": 598.43901, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "The primary goal of DocLayNet is to obtain high-quality ML models", "bbox": {"l": 53.528999, "t": 613.25356, "r": 294.04871, "b": 621.6281700000001, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "capable of accurate document-layout analysis on a wide variety", "bbox": {"l": 53.79800000000001, "t": 624.21255, "r": 294.27576, "b": 632.58717, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "of challenging layouts. As discussed in Section 2, object detection", "bbox": {"l": 53.79800000000001, "t": 635.17155, "r": 294.04144, "b": 643.54617, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "models are currently the easiest to use, due to the standardisation", "bbox": {"l": 53.79800000000001, "t": 646.13055, "r": 294.04163, "b": 654.50517, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "of ground-truth data in COCO format [16] and the availability of", "bbox": {"l": 53.79800000000001, "t": 657.0885499999999, "r": 294.0412, "b": 665.46317, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "general frameworks such as", "bbox": {"l": 53.79800000000001, "t": 668.04755, "r": 155.01054, "b": 676.42217, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "detectron2", "bbox": {"l": 157.23599, "t": 668.09238, "r": 193.26666, "b": 676.43114, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "[17]. Furthermore, baseline", "bbox": {"l": 195.867, "t": 668.04755, "r": 294.0473, "b": 676.42217, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "numbers in PubLayNet and DocBank were obtained using standard", "bbox": {"l": 53.79800000000001, "t": 679.0065500000001, "r": 294.04538, "b": 687.38117, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "object detection models such as Mask R-CNN and Faster R-CNN.", "bbox": {"l": 53.79800000000001, "t": 689.96555, "r": 295.4281, "b": 698.3401719999999, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "As such, we will relate to these object detection methods in this", "bbox": {"l": 53.484001, "t": 700.9245530000001, "r": 294.04413, "b": 709.299171, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "0", "bbox": {"l": 349.16577, "t": 246.68017999999995, "r": 352.48175, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "20", "bbox": {"l": 385.93698, "t": 246.68017999999995, "r": 392.56894, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "40", "bbox": {"l": 424.366, "t": 246.68017999999995, "r": 430.99796, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "60", "bbox": {"l": 462.79504000000003, "t": 246.68017999999995, "r": 469.427, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "80", "bbox": {"l": 501.22406, "t": 246.68017999999995, "r": 507.85602, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "100", "bbox": {"l": 537.99524, "t": 246.68017999999995, "r": 547.94318, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "% of DocLayNet training set", "bbox": {"l": 410.28143, "t": 253.80840999999998, "r": 483.47278000000006, "b": 259.88251, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "50", "bbox": {"l": 330.93539, "t": 218.38464, "r": 337.56735, "b": 224.45874000000003, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "55", "bbox": {"l": 330.93539, "t": 192.08660999999995, "r": 337.56735, "b": 198.16071, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "60", "bbox": {"l": 330.93539, "t": 165.78864, "r": 337.56735, "b": 171.86273000000006, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "65", "bbox": {"l": 330.93539, "t": 139.49059999999997, "r": 337.56735, "b": 145.56470000000002, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "70", "bbox": {"l": 330.93539, "t": 113.19263000000001, "r": 337.56735, "b": 119.26671999999996, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "mAP 0.50:0.95", "bbox": {"l": 322.92276, "t": 148.37689, "r": 328.99686, "b": 186.79218000000003, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "10", "bbox": {"l": 470.97235, "t": 235.36676, "r": 477.6055, "b": 241.44086000000004, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "1", "bbox": {"l": 477.65662, "t": 234.82390999999996, "r": 479.97778000000005, "b": 239.07581000000005, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "10", "bbox": {"l": 531.55127, "t": 235.41234999999995, "r": 538.18445, "b": 241.48645, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "2", "bbox": {"l": 538.23553, "t": 234.86951, "r": 540.5567, "b": 239.1214, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "50", "bbox": {"l": 404.91125, "t": 216.00005999999996, "r": 411.54321, "b": 222.07416, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "55", "bbox": {"l": 404.91125, "t": 200.22125000000005, "r": 411.54321, "b": 206.29534999999998, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "60", "bbox": {"l": 404.91125, "t": 184.44244000000003, "r": 411.54321, "b": 190.51653999999996, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "65", "bbox": {"l": 404.91125, "t": 168.66364, "r": 411.54321, "b": 174.73773000000006, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "70", "bbox": {"l": 404.91125, "t": 152.88489000000004, "r": 411.54321, "b": 158.95898, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "Figure 5: Prediction performance (mAP@0.5-0.95) of a Mask", "bbox": {"l": 317.95499, "t": 279.01599, "r": 558.47876, "b": 287.48923, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "R-CNN network with ResNet50 backbone trained on increas-", "bbox": {"l": 317.95499, "t": 289.97501, "r": 559.80579, "b": 298.44824, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "ing fractions of the DocLayNet dataset. The learning curve", "bbox": {"l": 317.95499, "t": 300.93399, "r": 558.20068, "b": 309.40723, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "flattens around the 80% mark, indicating that increasing the", "bbox": {"l": 317.95499, "t": 311.89297, "r": 558.20062, "b": 320.36620999999997, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "size of the DocLayNet dataset with similar data will not yield", "bbox": {"l": 317.95499, "t": 322.85196, "r": 558.20074, "b": 331.3252, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "significantly better predictions.", "bbox": {"l": 317.95499, "t": 333.81094, "r": 445.24207, "b": 342.28418000000005, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "paper and leave the detailed evaluation of more recent methods", "bbox": {"l": 317.95499, "t": 384.01154, "r": 558.20416, "b": 392.38617, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "mentioned in Section 2 for future work.", "bbox": {"l": 317.95499, "t": 394.97055, "r": 463.04938, "b": 403.34517999999997, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "In this section, we will present several aspects related to the", "bbox": {"l": 327.918, "t": 405.92953, "r": 558.19836, "b": 414.30417, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "performance of object detection models on DocLayNet. Similarly", "bbox": {"l": 317.95499, "t": 416.88855, "r": 558.4364, "b": 425.26318, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "as in PubLayNet, we will evaluate the quality of their predictions", "bbox": {"l": 317.95499, "t": 427.84653, "r": 558.20563, "b": 436.22116, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "using mean average precision (mAP) with 10 overlaps that range", "bbox": {"l": 317.95499, "t": 438.80554, "r": 558.20044, "b": 447.18018, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "from 0.5 to 0.95 in steps of 0.05 (mAP@0.5-0.95). These scores are", "bbox": {"l": 317.95499, "t": 449.76453000000004, "r": 558.19891, "b": 458.13916, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "computed by leveraging the evaluation code provided by the COCO", "bbox": {"l": 317.95499, "t": 460.72354, "r": 558.20239, "b": 469.09818, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "API [16].", "bbox": {"l": 317.64099, "t": 471.68253, "r": 350.32352, "b": 480.05716, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "Baselines for Object Detection", "bbox": {"l": 317.95499, "t": 496.8219, "r": 466.8532400000001, "b": 507.13098, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "In Table 2, we present baseline experiments (given in mAP) on Mask", "bbox": {"l": 317.95499, "t": 512.02454, "r": 558.43085, "b": 520.39917, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "R-CNN [12], Faster R-CNN [11], and YOLOv5 [13]. Both training", "bbox": {"l": 317.95499, "t": 522.9835499999999, "r": 558.20117, "b": 531.35818, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "and evaluation were performed on RGB images with dimensions of", "bbox": {"l": 317.95499, "t": 533.94254, "r": 558.20233, "b": 542.31717, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "1025", "bbox": {"l": 317.74899, "t": 544.90155, "r": 334.09296, "b": 553.27617, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "\u00d7", "bbox": {"l": 334.81201, "t": 544.84775, "r": 340.51465, "b": 552.5499, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "1025 pixels. For training, we only used one annotation in case", "bbox": {"l": 341.233, "t": 544.90155, "r": 558.20117, "b": 553.27617, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "of redundantly annotated pages. As one can observe, the variation", "bbox": {"l": 317.95499, "t": 555.85956, "r": 558.20392, "b": 564.23418, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "in mAP between the models is rather low, but overall between 6", "bbox": {"l": 317.95499, "t": 566.8185599999999, "r": 558.2041, "b": 575.19318, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "and 10% lower than the mAP computed from the pairwise human", "bbox": {"l": 317.95499, "t": 577.77756, "r": 558.2052, "b": 586.15218, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "annotations on triple-annotated pages. This gives a good indication", "bbox": {"l": 317.95499, "t": 588.73656, "r": 558.20233, "b": 597.11118, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "that the DocLayNet dataset poses a worthwhile challenge for the", "bbox": {"l": 317.95499, "t": 599.69556, "r": 558.1983, "b": 608.0701799999999, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "research community to close the gap between human recognition", "bbox": {"l": 317.95499, "t": 610.65456, "r": 558.20502, "b": 619.02917, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "and ML approaches. It is interesting to see that Mask R-CNN and", "bbox": {"l": 317.95499, "t": 621.61356, "r": 558.20337, "b": 629.98817, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "Faster R-CNN produce very comparable mAP scores, indicating", "bbox": {"l": 317.95499, "t": 632.5725600000001, "r": 558.2041, "b": 640.94717, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "that pixel-based image segmentation derived from bounding-boxes", "bbox": {"l": 317.95499, "t": 643.53156, "r": 558.20245, "b": 651.90617, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "does not help to obtain better predictions. On the other hand, the", "bbox": {"l": 317.95499, "t": 654.49055, "r": 558.19757, "b": 662.86517, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": "more recent Yolov5x model does very well and even out-performs", "bbox": {"l": 317.95499, "t": 665.44855, "r": 558.20404, "b": 673.82317, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "humans on selected labels such as", "bbox": {"l": 317.95499, "t": 676.40755, "r": 444.54102, "b": 684.78217, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "Text", "bbox": {"l": 446.78900000000004, "t": 676.45238, "r": 461.95261000000005, "b": 684.79114, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": ",", "bbox": {"l": 461.95599000000004, "t": 676.40755, "r": 463.96805000000006, "b": 684.78217, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "Table", "bbox": {"l": 466.2170100000001, "t": 676.45238, "r": 485.66998000000007, "b": 684.79114, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "and", "bbox": {"l": 488.1290000000001, "t": 676.40755, "r": 501.89330999999993, "b": 684.78217, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "Picture", "bbox": {"l": 504.142, "t": 676.45238, "r": 529.21954, "b": 684.79114, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": ". This is", "bbox": {"l": 529.22101, "t": 676.40755, "r": 558.20392, "b": 684.78217, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "not entirely surprising, as", "bbox": {"l": 317.95499, "t": 687.36655, "r": 410.81366, "b": 695.741173, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "Text", "bbox": {"l": 413.05301, "t": 687.41138, "r": 427.67865, "b": 695.750137, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": ",", "bbox": {"l": 427.67801, "t": 687.36655, "r": 429.62103, "b": 695.741173, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "Table", "bbox": {"l": 431.86099, "t": 687.41138, "r": 450.62881000000004, "b": 695.750137, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "and", "bbox": {"l": 453.082, "t": 687.36655, "r": 466.37402, "b": 695.741173, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "Picture", "bbox": {"l": 468.61499, "t": 687.41138, "r": 492.83208999999994, "b": 695.750137, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "are abundant and", "bbox": {"l": 495.28201, "t": 687.36655, "r": 558.2005, "b": 695.741173, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "the most visually distinctive in a document.", "bbox": {"l": 317.95499, "t": 698.325554, "r": 477.53903, "b": 706.700172, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 11, "label": "page_header", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.8662876486778259, "cells": [{"id": 0, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 246.24382, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar", "bbox": {"l": 253.13897999999998, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "text", "bbox": {"l": 53.501999, "t": 86.87292000000002, "r": 295.64874, "b": 183.01709000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9782760143280029, "cells": [{"id": 2, "text": "Table 2: Prediction performance (mAP@0.5-0.95) of object", "bbox": {"l": 53.501999, "t": 86.87292000000002, "r": 294.04361, "b": 95.34618999999998, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "detection networks on DocLayNet test set. The MRCNN", "bbox": {"l": 53.79800000000001, "t": 97.83191, "r": 294.04373, "b": 106.30517999999995, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "(Mask R-CNN) and FRCNN (Faster R-CNN) models with", "bbox": {"l": 53.52, "t": 108.79088999999999, "r": 294.0437, "b": 117.26415999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "ResNet-50 or ResNet-101 backbone were trained based on", "bbox": {"l": 53.79800000000001, "t": 119.74987999999996, "r": 294.04373, "b": 128.22313999999994, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "the network architectures from the", "bbox": {"l": 53.79800000000001, "t": 130.70885999999996, "r": 202.43402, "b": 139.18213000000003, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "detectron2", "bbox": {"l": 206.08501, "t": 130.71783000000005, "r": 247.14215000000002, "b": 139.20905000000005, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "model zoo", "bbox": {"l": 250.95001, "t": 130.70885999999996, "r": 294.04254, "b": 139.18213000000003, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "(Mask R-CNN R50, R101-FPN 3x, Faster R-CNN R101-FPN", "bbox": {"l": 53.52002, "t": 141.66785000000004, "r": 294.04367, "b": 150.14111000000003, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "3x), with default configurations. The YOLO implementation", "bbox": {"l": 53.798019, "t": 152.62683000000004, "r": 294.04373, "b": 161.1001, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "utilized was YOLOv5x6 [13]. All models were initialised us-", "bbox": {"l": 53.798019, "t": 163.58582, "r": 295.64874, "b": 172.05908, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "ing pre-trained weights from the COCO 2017 dataset.", "bbox": {"l": 53.798019, "t": 174.54381999999998, "r": 268.62399, "b": 183.01709000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "table", "bbox": {"l": 62.02753829956055, "t": 195.68006896972656, "r": 285.78955078125, "b": 351.6618957519531, "coord_origin": "TOPLEFT"}, "confidence": 0.9883638620376587, "cells": [{"id": 13, "text": "human", "bbox": {"l": 132.36501, "t": 197.97351000000003, "r": 157.99098, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "MRCNN", "bbox": {"l": 173.505, "t": 197.97351000000003, "r": 204.61841, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "FRCNN", "bbox": {"l": 220.13028, "t": 197.97351000000003, "r": 248.06958, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "YOLO", "bbox": {"l": 258.03125, "t": 197.97351000000003, "r": 280.17825, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "R50", "bbox": {"l": 168.39301, "t": 208.93255999999997, "r": 181.99504, "b": 217.30719, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "R101", "bbox": {"l": 192.39606, "t": 208.93255999999997, "r": 210.16747, "b": 217.30719, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "R101", "bbox": {"l": 225.21309, "t": 208.93255999999997, "r": 242.9845, "b": 217.30719, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "v5x6", "bbox": {"l": 260.51379, "t": 208.93255999999997, "r": 277.70239, "b": 217.30719, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Caption", "bbox": {"l": 67.663002, "t": 220.28954999999996, "r": 96.848633, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "84-89", "bbox": {"l": 135.32401, "t": 220.28954999999996, "r": 155.03215, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "68.4", "bbox": {"l": 167.95399, "t": 220.28954999999996, "r": 182.43472, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "71.5", "bbox": {"l": 194.0462, "t": 220.28954999999996, "r": 208.52695, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "70.1", "bbox": {"l": 226.86324000000002, "t": 220.28954999999996, "r": 241.34396, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "77.7", "bbox": {"l": 261.86804, "t": 220.28954999999996, "r": 276.34879, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Footnote", "bbox": {"l": 67.663002, "t": 231.24854000000005, "r": 100.1662, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "83-91", "bbox": {"l": 135.32401, "t": 231.24854000000005, "r": 155.03215, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "70.9", "bbox": {"l": 167.95399, "t": 231.24854000000005, "r": 182.43472, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "71.8", "bbox": {"l": 194.0462, "t": 231.24854000000005, "r": 208.52695, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "73.7", "bbox": {"l": 226.86324000000002, "t": 231.24854000000005, "r": 241.34396, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "77.2", "bbox": {"l": 261.86804, "t": 231.24854000000005, "r": 276.34879, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "Formula", "bbox": {"l": 67.663002, "t": 242.20752000000005, "r": 98.175659, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "83-85", "bbox": {"l": 135.32401, "t": 242.20752000000005, "r": 155.03215, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "60.1", "bbox": {"l": 167.95399, "t": 242.20752000000005, "r": 182.43472, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "63.4", "bbox": {"l": 194.0462, "t": 242.20752000000005, "r": 208.52695, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "63.5", "bbox": {"l": 226.86324000000002, "t": 242.20752000000005, "r": 241.34396, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "66.2", "bbox": {"l": 261.86804, "t": 242.20752000000005, "r": 276.34879, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "List-item", "bbox": {"l": 67.663002, "t": 253.16656, "r": 100.54279, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "87-88", "bbox": {"l": 135.32401, "t": 253.16656, "r": 155.03215, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "81.2", "bbox": {"l": 167.95399, "t": 253.16656, "r": 182.43472, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "80.8", "bbox": {"l": 194.0462, "t": 253.16656, "r": 208.52695, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "81.0", "bbox": {"l": 226.86324000000002, "t": 253.16656, "r": 241.34396, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "86.2", "bbox": {"l": 261.86804, "t": 253.16656, "r": 276.34879, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Page-footer", "bbox": {"l": 67.663002, "t": 264.12555, "r": 110.19064, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "93-94", "bbox": {"l": 135.32401, "t": 264.12555, "r": 155.03215, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "61.6", "bbox": {"l": 167.95399, "t": 264.12555, "r": 182.43472, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "59.3", "bbox": {"l": 194.0462, "t": 264.12555, "r": 208.52695, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "58.9", "bbox": {"l": 226.86324000000002, "t": 264.12555, "r": 241.34396, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "61.1", "bbox": {"l": 261.86804, "t": 264.12555, "r": 276.34879, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Page-header", "bbox": {"l": 67.663002, "t": 275.08453, "r": 112.94331999999999, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "85-89", "bbox": {"l": 135.32401, "t": 275.08453, "r": 155.03215, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "71.9", "bbox": {"l": 167.95399, "t": 275.08453, "r": 182.43472, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "70.0", "bbox": {"l": 194.0462, "t": 275.08453, "r": 208.52695, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "72.0", "bbox": {"l": 226.86324000000002, "t": 275.08453, "r": 241.34396, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "67.9", "bbox": {"l": 261.86804, "t": 275.08453, "r": 276.34879, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Picture", "bbox": {"l": 67.663002, "t": 286.04355000000004, "r": 93.647629, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "69-71", "bbox": {"l": 135.32401, "t": 286.04355000000004, "r": 155.03215, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "71.7", "bbox": {"l": 167.95399, "t": 286.04355000000004, "r": 182.43472, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "72.7", "bbox": {"l": 194.0462, "t": 286.04355000000004, "r": 208.52695, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "72.0", "bbox": {"l": 226.86324000000002, "t": 286.04355000000004, "r": 241.34396, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "77.1", "bbox": {"l": 261.86804, "t": 286.04355000000004, "r": 276.34879, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "Section-header", "bbox": {"l": 67.663002, "t": 297.00253, "r": 122.40287999999998, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "83-84", "bbox": {"l": 135.32401, "t": 297.00253, "r": 155.03215, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "67.6", "bbox": {"l": 167.95399, "t": 297.00253, "r": 182.43472, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "69.3", "bbox": {"l": 194.0462, "t": 297.00253, "r": 208.52695, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "68.4", "bbox": {"l": 226.86324000000002, "t": 297.00253, "r": 241.34396, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "74.6", "bbox": {"l": 261.86804, "t": 297.00253, "r": 276.34879, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "Table", "bbox": {"l": 67.663002, "t": 307.96155, "r": 87.46978, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "77-81", "bbox": {"l": 135.32401, "t": 307.96155, "r": 155.03215, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "82.2", "bbox": {"l": 167.95399, "t": 307.96155, "r": 182.43472, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "82.9", "bbox": {"l": 194.0462, "t": 307.96155, "r": 208.52695, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "82.2", "bbox": {"l": 226.86324000000002, "t": 307.96155, "r": 241.34396, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "86.3", "bbox": {"l": 261.86804, "t": 307.96155, "r": 276.34879, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "Text", "bbox": {"l": 67.663002, "t": 318.91953, "r": 83.623199, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "84-86", "bbox": {"l": 135.32401, "t": 318.91953, "r": 155.03215, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "84.6", "bbox": {"l": 167.95399, "t": 318.91953, "r": 182.43472, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "85.8", "bbox": {"l": 194.0462, "t": 318.91953, "r": 208.52695, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "85.4", "bbox": {"l": 226.86324000000002, "t": 318.91953, "r": 241.34396, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "88.1", "bbox": {"l": 261.86804, "t": 318.91953, "r": 276.34879, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Title", "bbox": {"l": 67.663002, "t": 329.87854, "r": 84.654327, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "60-72", "bbox": {"l": 135.32401, "t": 329.87854, "r": 155.03215, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "76.7", "bbox": {"l": 167.95399, "t": 329.87854, "r": 182.43472, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "80.4", "bbox": {"l": 194.0462, "t": 329.87854, "r": 208.52695, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "79.9", "bbox": {"l": 226.86324000000002, "t": 329.87854, "r": 241.34396, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "82.7", "bbox": {"l": 261.86804, "t": 329.87854, "r": 276.34879, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "All", "bbox": {"l": 67.663002, "t": 341.23654, "r": 78.628906, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "82-83", "bbox": {"l": 135.32401, "t": 341.23654, "r": 155.03215, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "72.4", "bbox": {"l": 167.95399, "t": 341.23654, "r": 182.43472, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "73.5", "bbox": {"l": 194.0462, "t": 341.23654, "r": 208.52695, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "73.4", "bbox": {"l": 226.86324000000002, "t": 341.23654, "r": 241.34396, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "76.8", "bbox": {"l": 261.86804, "t": 341.23654, "r": 276.34879, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": [{"id": 12, "label": "text", "bbox": {"l": 132.36501, "t": 197.97351000000003, "r": 157.99098, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "human", "bbox": {"l": 132.36501, "t": 197.97351000000003, "r": 157.99098, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 173.505, "t": 197.97351000000003, "r": 204.61841, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "MRCNN", "bbox": {"l": 173.505, "t": 197.97351000000003, "r": 204.61841, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 220.13028, "t": 197.97351000000003, "r": 248.06958, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "FRCNN", "bbox": {"l": 220.13028, "t": 197.97351000000003, "r": 248.06958, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 258.03125, "t": 197.97351000000003, "r": 280.17825, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "YOLO", "bbox": {"l": 258.03125, "t": 197.97351000000003, "r": 280.17825, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 168.39301, "t": 208.93255999999997, "r": 181.99504, "b": 217.30719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "R50", "bbox": {"l": 168.39301, "t": 208.93255999999997, "r": 181.99504, "b": 217.30719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 192.39606, "t": 208.93255999999997, "r": 210.16747, "b": 217.30719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "R101", "bbox": {"l": 192.39606, "t": 208.93255999999997, "r": 210.16747, "b": 217.30719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 225.21309, "t": 208.93255999999997, "r": 242.9845, "b": 217.30719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "R101", "bbox": {"l": 225.21309, "t": 208.93255999999997, "r": 242.9845, "b": 217.30719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 260.51379, "t": 208.93255999999997, "r": 277.70239, "b": 217.30719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "v5x6", "bbox": {"l": 260.51379, "t": 208.93255999999997, "r": 277.70239, "b": 217.30719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 67.663002, "t": 220.28954999999996, "r": 96.848633, "b": 228.66418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "Caption", "bbox": {"l": 67.663002, "t": 220.28954999999996, "r": 96.848633, "b": 228.66418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 135.32401, "t": 220.28954999999996, "r": 155.03215, "b": 228.66418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "84-89", "bbox": {"l": 135.32401, "t": 220.28954999999996, "r": 155.03215, "b": 228.66418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 167.95399, "t": 220.28954999999996, "r": 182.43472, "b": 228.66418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "68.4", "bbox": {"l": 167.95399, "t": 220.28954999999996, "r": 182.43472, "b": 228.66418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 194.0462, "t": 220.28954999999996, "r": 208.52695, "b": 228.66418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "71.5", "bbox": {"l": 194.0462, "t": 220.28954999999996, "r": 208.52695, "b": 228.66418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 226.86324000000002, "t": 220.28954999999996, "r": 241.34396, "b": 228.66418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "70.1", "bbox": {"l": 226.86324000000002, "t": 220.28954999999996, "r": 241.34396, "b": 228.66418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 261.86804, "t": 220.28954999999996, "r": 276.34879, "b": 228.66418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "77.7", "bbox": {"l": 261.86804, "t": 220.28954999999996, "r": 276.34879, "b": 228.66418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 67.663002, "t": 231.24854000000005, "r": 100.1662, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "Footnote", "bbox": {"l": 67.663002, "t": 231.24854000000005, "r": 100.1662, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 135.32401, "t": 231.24854000000005, "r": 155.03215, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "83-91", "bbox": {"l": 135.32401, "t": 231.24854000000005, "r": 155.03215, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 167.95399, "t": 231.24854000000005, "r": 182.43472, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "70.9", "bbox": {"l": 167.95399, "t": 231.24854000000005, "r": 182.43472, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 194.0462, "t": 231.24854000000005, "r": 208.52695, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "71.8", "bbox": {"l": 194.0462, "t": 231.24854000000005, "r": 208.52695, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 226.86324000000002, "t": 231.24854000000005, "r": 241.34396, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "73.7", "bbox": {"l": 226.86324000000002, "t": 231.24854000000005, "r": 241.34396, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 261.86804, "t": 231.24854000000005, "r": 276.34879, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "77.2", "bbox": {"l": 261.86804, "t": 231.24854000000005, "r": 276.34879, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 67.663002, "t": 242.20752000000005, "r": 98.175659, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "Formula", "bbox": {"l": 67.663002, "t": 242.20752000000005, "r": 98.175659, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 135.32401, "t": 242.20752000000005, "r": 155.03215, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "83-85", "bbox": {"l": 135.32401, "t": 242.20752000000005, "r": 155.03215, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 167.95399, "t": 242.20752000000005, "r": 182.43472, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "60.1", "bbox": {"l": 167.95399, "t": 242.20752000000005, "r": 182.43472, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 194.0462, "t": 242.20752000000005, "r": 208.52695, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "63.4", "bbox": {"l": 194.0462, "t": 242.20752000000005, "r": 208.52695, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 226.86324000000002, "t": 242.20752000000005, "r": 241.34396, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "63.5", "bbox": {"l": 226.86324000000002, "t": 242.20752000000005, "r": 241.34396, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 261.86804, "t": 242.20752000000005, "r": 276.34879, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "66.2", "bbox": {"l": 261.86804, "t": 242.20752000000005, "r": 276.34879, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 67.663002, "t": 253.16656, "r": 100.54279, "b": 261.5412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "List-item", "bbox": {"l": 67.663002, "t": 253.16656, "r": 100.54279, "b": 261.5412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 135.32401, "t": 253.16656, "r": 155.03215, "b": 261.5412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "87-88", "bbox": {"l": 135.32401, "t": 253.16656, "r": 155.03215, "b": 261.5412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 167.95399, "t": 253.16656, "r": 182.43472, "b": 261.5412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "81.2", "bbox": {"l": 167.95399, "t": 253.16656, "r": 182.43472, "b": 261.5412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 194.0462, "t": 253.16656, "r": 208.52695, "b": 261.5412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "80.8", "bbox": {"l": 194.0462, "t": 253.16656, "r": 208.52695, "b": 261.5412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 226.86324000000002, "t": 253.16656, "r": 241.34396, "b": 261.5412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "81.0", "bbox": {"l": 226.86324000000002, "t": 253.16656, "r": 241.34396, "b": 261.5412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 261.86804, "t": 253.16656, "r": 276.34879, "b": 261.5412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "86.2", "bbox": {"l": 261.86804, "t": 253.16656, "r": 276.34879, "b": 261.5412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 67.663002, "t": 264.12555, "r": 110.19064, "b": 272.50018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "Page-footer", "bbox": {"l": 67.663002, "t": 264.12555, "r": 110.19064, "b": 272.50018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 135.32401, "t": 264.12555, "r": 155.03215, "b": 272.50018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "93-94", "bbox": {"l": 135.32401, "t": 264.12555, "r": 155.03215, "b": 272.50018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 167.95399, "t": 264.12555, "r": 182.43472, "b": 272.50018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "61.6", "bbox": {"l": 167.95399, "t": 264.12555, "r": 182.43472, "b": 272.50018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 194.0462, "t": 264.12555, "r": 208.52695, "b": 272.50018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "59.3", "bbox": {"l": 194.0462, "t": 264.12555, "r": 208.52695, "b": 272.50018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 226.86324000000002, "t": 264.12555, "r": 241.34396, "b": 272.50018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "58.9", "bbox": {"l": 226.86324000000002, "t": 264.12555, "r": 241.34396, "b": 272.50018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 261.86804, "t": 264.12555, "r": 276.34879, "b": 272.50018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "61.1", "bbox": {"l": 261.86804, "t": 264.12555, "r": 276.34879, "b": 272.50018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 67.663002, "t": 275.08453, "r": 112.94331999999999, "b": 283.45917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "Page-header", "bbox": {"l": 67.663002, "t": 275.08453, "r": 112.94331999999999, "b": 283.45917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 135.32401, "t": 275.08453, "r": 155.03215, "b": 283.45917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "85-89", "bbox": {"l": 135.32401, "t": 275.08453, "r": 155.03215, "b": 283.45917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 167.95399, "t": 275.08453, "r": 182.43472, "b": 283.45917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "71.9", "bbox": {"l": 167.95399, "t": 275.08453, "r": 182.43472, "b": 283.45917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 194.0462, "t": 275.08453, "r": 208.52695, "b": 283.45917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "70.0", "bbox": {"l": 194.0462, "t": 275.08453, "r": 208.52695, "b": 283.45917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 226.86324000000002, "t": 275.08453, "r": 241.34396, "b": 283.45917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "72.0", "bbox": {"l": 226.86324000000002, "t": 275.08453, "r": 241.34396, "b": 283.45917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 261.86804, "t": 275.08453, "r": 276.34879, "b": 283.45917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "67.9", "bbox": {"l": 261.86804, "t": 275.08453, "r": 276.34879, "b": 283.45917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 67.663002, "t": 286.04355000000004, "r": 93.647629, "b": 294.41818, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "Picture", "bbox": {"l": 67.663002, "t": 286.04355000000004, "r": 93.647629, "b": 294.41818, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 135.32401, "t": 286.04355000000004, "r": 155.03215, "b": 294.41818, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "69-71", "bbox": {"l": 135.32401, "t": 286.04355000000004, "r": 155.03215, "b": 294.41818, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 167.95399, "t": 286.04355000000004, "r": 182.43472, "b": 294.41818, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "71.7", "bbox": {"l": 167.95399, "t": 286.04355000000004, "r": 182.43472, "b": 294.41818, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 194.0462, "t": 286.04355000000004, "r": 208.52695, "b": 294.41818, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "72.7", "bbox": {"l": 194.0462, "t": 286.04355000000004, "r": 208.52695, "b": 294.41818, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 226.86324000000002, "t": 286.04355000000004, "r": 241.34396, "b": 294.41818, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "72.0", "bbox": {"l": 226.86324000000002, "t": 286.04355000000004, "r": 241.34396, "b": 294.41818, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 261.86804, "t": 286.04355000000004, "r": 276.34879, "b": 294.41818, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "77.1", "bbox": {"l": 261.86804, "t": 286.04355000000004, "r": 276.34879, "b": 294.41818, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 67.663002, "t": 297.00253, "r": 122.40287999999998, "b": 305.37717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "Section-header", "bbox": {"l": 67.663002, "t": 297.00253, "r": 122.40287999999998, "b": 305.37717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 135.32401, "t": 297.00253, "r": 155.03215, "b": 305.37717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "83-84", "bbox": {"l": 135.32401, "t": 297.00253, "r": 155.03215, "b": 305.37717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 167.95399, "t": 297.00253, "r": 182.43472, "b": 305.37717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "67.6", "bbox": {"l": 167.95399, "t": 297.00253, "r": 182.43472, "b": 305.37717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 194.0462, "t": 297.00253, "r": 208.52695, "b": 305.37717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "69.3", "bbox": {"l": 194.0462, "t": 297.00253, "r": 208.52695, "b": 305.37717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 226.86324000000002, "t": 297.00253, "r": 241.34396, "b": 305.37717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "68.4", "bbox": {"l": 226.86324000000002, "t": 297.00253, "r": 241.34396, "b": 305.37717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 261.86804, "t": 297.00253, "r": 276.34879, "b": 305.37717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "74.6", "bbox": {"l": 261.86804, "t": 297.00253, "r": 276.34879, "b": 305.37717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 67.663002, "t": 307.96155, "r": 87.46978, "b": 316.33618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "Table", "bbox": {"l": 67.663002, "t": 307.96155, "r": 87.46978, "b": 316.33618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 135.32401, "t": 307.96155, "r": 155.03215, "b": 316.33618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "77-81", "bbox": {"l": 135.32401, "t": 307.96155, "r": 155.03215, "b": 316.33618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 167.95399, "t": 307.96155, "r": 182.43472, "b": 316.33618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "82.2", "bbox": {"l": 167.95399, "t": 307.96155, "r": 182.43472, "b": 316.33618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 194.0462, "t": 307.96155, "r": 208.52695, "b": 316.33618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "82.9", "bbox": {"l": 194.0462, "t": 307.96155, "r": 208.52695, "b": 316.33618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 226.86324000000002, "t": 307.96155, "r": 241.34396, "b": 316.33618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "82.2", "bbox": {"l": 226.86324000000002, "t": 307.96155, "r": 241.34396, "b": 316.33618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 261.86804, "t": 307.96155, "r": 276.34879, "b": 316.33618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "86.3", "bbox": {"l": 261.86804, "t": 307.96155, "r": 276.34879, "b": 316.33618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 67.663002, "t": 318.91953, "r": 83.623199, "b": 327.29416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "Text", "bbox": {"l": 67.663002, "t": 318.91953, "r": 83.623199, "b": 327.29416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 135.32401, "t": 318.91953, "r": 155.03215, "b": 327.29416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "84-86", "bbox": {"l": 135.32401, "t": 318.91953, "r": 155.03215, "b": 327.29416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 167.95399, "t": 318.91953, "r": 182.43472, "b": 327.29416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "84.6", "bbox": {"l": 167.95399, "t": 318.91953, "r": 182.43472, "b": 327.29416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 194.0462, "t": 318.91953, "r": 208.52695, "b": 327.29416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "85.8", "bbox": {"l": 194.0462, "t": 318.91953, "r": 208.52695, "b": 327.29416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 226.86324000000002, "t": 318.91953, "r": 241.34396, "b": 327.29416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "85.4", "bbox": {"l": 226.86324000000002, "t": 318.91953, "r": 241.34396, "b": 327.29416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 261.86804, "t": 318.91953, "r": 276.34879, "b": 327.29416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "88.1", "bbox": {"l": 261.86804, "t": 318.91953, "r": 276.34879, "b": 327.29416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 67.663002, "t": 329.87854, "r": 84.654327, "b": 338.25317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "Title", "bbox": {"l": 67.663002, "t": 329.87854, "r": 84.654327, "b": 338.25317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 135.32401, "t": 329.87854, "r": 155.03215, "b": 338.25317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "60-72", "bbox": {"l": 135.32401, "t": 329.87854, "r": 155.03215, "b": 338.25317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 167.95399, "t": 329.87854, "r": 182.43472, "b": 338.25317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "76.7", "bbox": {"l": 167.95399, "t": 329.87854, "r": 182.43472, "b": 338.25317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 194.0462, "t": 329.87854, "r": 208.52695, "b": 338.25317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "80.4", "bbox": {"l": 194.0462, "t": 329.87854, "r": 208.52695, "b": 338.25317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 226.86324000000002, "t": 329.87854, "r": 241.34396, "b": 338.25317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "79.9", "bbox": {"l": 226.86324000000002, "t": 329.87854, "r": 241.34396, "b": 338.25317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 261.86804, "t": 329.87854, "r": 276.34879, "b": 338.25317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "82.7", "bbox": {"l": 261.86804, "t": 329.87854, "r": 276.34879, "b": 338.25317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 67.663002, "t": 341.23654, "r": 78.628906, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "All", "bbox": {"l": 67.663002, "t": 341.23654, "r": 78.628906, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 135.32401, "t": 341.23654, "r": 155.03215, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "82-83", "bbox": {"l": 135.32401, "t": 341.23654, "r": 155.03215, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 167.95399, "t": 341.23654, "r": 182.43472, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "72.4", "bbox": {"l": 167.95399, "t": 341.23654, "r": 182.43472, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 194.0462, "t": 341.23654, "r": 208.52695, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "73.5", "bbox": {"l": 194.0462, "t": 341.23654, "r": 208.52695, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 226.86324000000002, "t": 341.23654, "r": 241.34396, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "73.4", "bbox": {"l": 226.86324000000002, "t": 341.23654, "r": 241.34396, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 261.86804, "t": 341.23654, "r": 276.34879, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "76.8", "bbox": {"l": 261.86804, "t": 341.23654, "r": 276.34879, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 4, "label": "text", "bbox": {"l": 53.528999, "t": 370.92755, "r": 295.55612, "b": 576.56317, "coord_origin": "TOPLEFT"}, "confidence": 0.9866557121276855, "cells": [{"id": 93, "text": "to avoid this at any cost in order to have clear, unbiased baseline", "bbox": {"l": 53.79800000000001, "t": 370.92755, "r": 294.04712, "b": 379.30219000000005, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "numbers for human document-layout annotation. Third, we in-", "bbox": {"l": 53.79800000000001, "t": 381.88654, "r": 295.55612, "b": 390.26117, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "troduced the feature of", "bbox": {"l": 53.79800000000001, "t": 392.84555, "r": 140.3623, "b": 401.22017999999997, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "snapping", "bbox": {"l": 142.99001, "t": 392.89041, "r": 175.9695, "b": 401.2291599999999, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "boxes around text segments to", "bbox": {"l": 178.951, "t": 392.84555, "r": 294.04083, "b": 401.22017999999997, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "obtain a pixel-accurate annotation and again reduce time and effort.", "bbox": {"l": 53.79800000000001, "t": 403.80453, "r": 295.42493, "b": 412.17917, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "The CCS annotation tool automatically shrinks every user-drawn", "bbox": {"l": 53.528999, "t": 414.76355, "r": 294.04251, "b": 423.13818, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "box to the minimum bounding-box around the enclosed text-cells", "bbox": {"l": 53.79800000000001, "t": 425.72253, "r": 294.04807, "b": 434.09717, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "for all purely text-based segments, which excludes only", "bbox": {"l": 53.79800000000001, "t": 436.6815500000001, "r": 256.80627, "b": 445.0561799999999, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "Table", "bbox": {"l": 259.04199, "t": 436.72641, "r": 278.10455, "b": 445.06516, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "and", "bbox": {"l": 280.54999, "t": 436.6815500000001, "r": 294.04443, "b": 445.0561799999999, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "Picture", "bbox": {"l": 53.79800000000001, "t": 447.68539, "r": 78.875587, "b": 456.02413999999993, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": ". For the latter, we instructed annotation staff to minimise", "bbox": {"l": 78.876999, "t": 447.64053, "r": 294.04852, "b": 456.01517, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "inclusion of surrounding whitespace while including all graphical", "bbox": {"l": 53.79800000000001, "t": 458.59955, "r": 294.04645, "b": 466.97418, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "lines. A downside of snapping boxes to enclosed text cells is that", "bbox": {"l": 53.79800000000001, "t": 469.55853, "r": 294.0416, "b": 477.93317, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "some wrongly parsed PDF pages cannot be annotated correctly and", "bbox": {"l": 53.79800000000001, "t": 480.51654, "r": 294.04538, "b": 488.89117, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "need to be skipped. Fourth, we established a way to flag pages as", "bbox": {"l": 53.79800000000001, "t": 491.47552, "r": 294.04312, "b": 499.85016, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "rejected", "bbox": {"l": 53.79800000000001, "t": 502.4794, "r": 80.597939, "b": 510.81815, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "for cases where no valid annotation according to the label", "bbox": {"l": 83.366997, "t": 502.43454, "r": 294.04483, "b": 510.80917, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "guidelines could be achieved. Example cases for this would be PDF", "bbox": {"l": 53.79800000000001, "t": 513.3935200000001, "r": 294.25833, "b": 521.7681600000001, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "pages that render incorrectly or contain layouts that are impossible", "bbox": {"l": 53.79800000000001, "t": 524.35254, "r": 294.04535, "b": 532.72717, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "to capture with non-overlapping rectangles. Such rejected pages are", "bbox": {"l": 53.79800000000001, "t": 535.31155, "r": 294.04535, "b": 543.68617, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "not contained in the final dataset. With all these measures in place,", "bbox": {"l": 53.79800000000001, "t": 546.27055, "r": 295.02759, "b": 554.64517, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "experienced annotation staff managed to annotate a single page in", "bbox": {"l": 53.79800000000001, "t": 557.22955, "r": 294.0488, "b": 565.6041700000001, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "a typical timeframe of 20s to 60s, depending on its complexity.", "bbox": {"l": 53.79800000000001, "t": 568.18855, "r": 281.80457, "b": 576.56317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "section_header", "bbox": {"l": 53.79800000000001, "t": 588.12991, "r": 147.48535, "b": 598.43901, "coord_origin": "TOPLEFT"}, "confidence": 0.9419495463371277, "cells": [{"id": 118, "text": "5", "bbox": {"l": 53.79800000000001, "t": 588.12991, "r": 59.405277, "b": 598.43901, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "EXPERIMENTS", "bbox": {"l": 70.314377, "t": 588.12991, "r": 147.48535, "b": 598.43901, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 53.484001, "t": 613.25356, "r": 295.4281, "b": 709.299171, "coord_origin": "TOPLEFT"}, "confidence": 0.987605094909668, "cells": [{"id": 120, "text": "The primary goal of DocLayNet is to obtain high-quality ML models", "bbox": {"l": 53.528999, "t": 613.25356, "r": 294.04871, "b": 621.6281700000001, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "capable of accurate document-layout analysis on a wide variety", "bbox": {"l": 53.79800000000001, "t": 624.21255, "r": 294.27576, "b": 632.58717, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "of challenging layouts. As discussed in Section 2, object detection", "bbox": {"l": 53.79800000000001, "t": 635.17155, "r": 294.04144, "b": 643.54617, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "models are currently the easiest to use, due to the standardisation", "bbox": {"l": 53.79800000000001, "t": 646.13055, "r": 294.04163, "b": 654.50517, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "of ground-truth data in COCO format [16] and the availability of", "bbox": {"l": 53.79800000000001, "t": 657.0885499999999, "r": 294.0412, "b": 665.46317, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "general frameworks such as", "bbox": {"l": 53.79800000000001, "t": 668.04755, "r": 155.01054, "b": 676.42217, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "detectron2", "bbox": {"l": 157.23599, "t": 668.09238, "r": 193.26666, "b": 676.43114, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "[17]. Furthermore, baseline", "bbox": {"l": 195.867, "t": 668.04755, "r": 294.0473, "b": 676.42217, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "numbers in PubLayNet and DocBank were obtained using standard", "bbox": {"l": 53.79800000000001, "t": 679.0065500000001, "r": 294.04538, "b": 687.38117, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "object detection models such as Mask R-CNN and Faster R-CNN.", "bbox": {"l": 53.79800000000001, "t": 689.96555, "r": 295.4281, "b": 698.3401719999999, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "As such, we will relate to these object detection methods in this", "bbox": {"l": 53.484001, "t": 700.9245530000001, "r": 294.04413, "b": 709.299171, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "picture", "bbox": {"l": 323.48431396484375, "t": 89.88603210449219, "r": 553.5411376953125, "b": 260.0107727050781, "coord_origin": "TOPLEFT"}, "confidence": 0.9782691597938538, "cells": [{"id": 131, "text": "0", "bbox": {"l": 349.16577, "t": 246.68017999999995, "r": 352.48175, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "20", "bbox": {"l": 385.93698, "t": 246.68017999999995, "r": 392.56894, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "40", "bbox": {"l": 424.366, "t": 246.68017999999995, "r": 430.99796, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "60", "bbox": {"l": 462.79504000000003, "t": 246.68017999999995, "r": 469.427, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "80", "bbox": {"l": 501.22406, "t": 246.68017999999995, "r": 507.85602, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "100", "bbox": {"l": 537.99524, "t": 246.68017999999995, "r": 547.94318, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "% of DocLayNet training set", "bbox": {"l": 410.28143, "t": 253.80840999999998, "r": 483.47278000000006, "b": 259.88251, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "50", "bbox": {"l": 330.93539, "t": 218.38464, "r": 337.56735, "b": 224.45874000000003, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "55", "bbox": {"l": 330.93539, "t": 192.08660999999995, "r": 337.56735, "b": 198.16071, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "60", "bbox": {"l": 330.93539, "t": 165.78864, "r": 337.56735, "b": 171.86273000000006, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "65", "bbox": {"l": 330.93539, "t": 139.49059999999997, "r": 337.56735, "b": 145.56470000000002, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "70", "bbox": {"l": 330.93539, "t": 113.19263000000001, "r": 337.56735, "b": 119.26671999999996, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "mAP 0.50:0.95", "bbox": {"l": 322.92276, "t": 148.37689, "r": 328.99686, "b": 186.79218000000003, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "10", "bbox": {"l": 470.97235, "t": 235.36676, "r": 477.6055, "b": 241.44086000000004, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "1", "bbox": {"l": 477.65662, "t": 234.82390999999996, "r": 479.97778000000005, "b": 239.07581000000005, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "10", "bbox": {"l": 531.55127, "t": 235.41234999999995, "r": 538.18445, "b": 241.48645, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "2", "bbox": {"l": 538.23553, "t": 234.86951, "r": 540.5567, "b": 239.1214, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "50", "bbox": {"l": 404.91125, "t": 216.00005999999996, "r": 411.54321, "b": 222.07416, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "55", "bbox": {"l": 404.91125, "t": 200.22125000000005, "r": 411.54321, "b": 206.29534999999998, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "60", "bbox": {"l": 404.91125, "t": 184.44244000000003, "r": 411.54321, "b": 190.51653999999996, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "65", "bbox": {"l": 404.91125, "t": 168.66364, "r": 411.54321, "b": 174.73773000000006, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "70", "bbox": {"l": 404.91125, "t": 152.88489000000004, "r": 411.54321, "b": 158.95898, "coord_origin": "TOPLEFT"}}], "children": [{"id": 92, "label": "text", "bbox": {"l": 349.16577, "t": 246.68017999999995, "r": 352.48175, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 131, "text": "0", "bbox": {"l": 349.16577, "t": 246.68017999999995, "r": 352.48175, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 385.93698, "t": 246.68017999999995, "r": 392.56894, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 132, "text": "20", "bbox": {"l": 385.93698, "t": 246.68017999999995, "r": 392.56894, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 424.366, "t": 246.68017999999995, "r": 430.99796, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 133, "text": "40", "bbox": {"l": 424.366, "t": 246.68017999999995, "r": 430.99796, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 462.79504000000003, "t": 246.68017999999995, "r": 469.427, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 134, "text": "60", "bbox": {"l": 462.79504000000003, "t": 246.68017999999995, "r": 469.427, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 501.22406, "t": 246.68017999999995, "r": 507.85602, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 135, "text": "80", "bbox": {"l": 501.22406, "t": 246.68017999999995, "r": 507.85602, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 537.99524, "t": 246.68017999999995, "r": 547.94318, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 136, "text": "100", "bbox": {"l": 537.99524, "t": 246.68017999999995, "r": 547.94318, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 410.28143, "t": 253.80840999999998, "r": 483.47278000000006, "b": 259.88251, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 137, "text": "% of DocLayNet training set", "bbox": {"l": 410.28143, "t": 253.80840999999998, "r": 483.47278000000006, "b": 259.88251, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 330.93539, "t": 218.38464, "r": 337.56735, "b": 224.45874000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 138, "text": "50", "bbox": {"l": 330.93539, "t": 218.38464, "r": 337.56735, "b": 224.45874000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 330.93539, "t": 192.08660999999995, "r": 337.56735, "b": 198.16071, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 139, "text": "55", "bbox": {"l": 330.93539, "t": 192.08660999999995, "r": 337.56735, "b": 198.16071, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 330.93539, "t": 165.78864, "r": 337.56735, "b": 171.86273000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 140, "text": "60", "bbox": {"l": 330.93539, "t": 165.78864, "r": 337.56735, "b": 171.86273000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 330.93539, "t": 139.49059999999997, "r": 337.56735, "b": 145.56470000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 141, "text": "65", "bbox": {"l": 330.93539, "t": 139.49059999999997, "r": 337.56735, "b": 145.56470000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 330.93539, "t": 113.19263000000001, "r": 337.56735, "b": 119.26671999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 142, "text": "70", "bbox": {"l": 330.93539, "t": 113.19263000000001, "r": 337.56735, "b": 119.26671999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 322.92276, "t": 148.37689, "r": 328.99686, "b": 186.79218000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 143, "text": "mAP 0.50:0.95", "bbox": {"l": 322.92276, "t": 148.37689, "r": 328.99686, "b": 186.79218000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 470.97235, "t": 235.36676, "r": 477.6055, "b": 241.44086000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 144, "text": "10", "bbox": {"l": 470.97235, "t": 235.36676, "r": 477.6055, "b": 241.44086000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 477.65662, "t": 234.82390999999996, "r": 479.97778000000005, "b": 239.07581000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 145, "text": "1", "bbox": {"l": 477.65662, "t": 234.82390999999996, "r": 479.97778000000005, "b": 239.07581000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 531.55127, "t": 235.41234999999995, "r": 538.18445, "b": 241.48645, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 146, "text": "10", "bbox": {"l": 531.55127, "t": 235.41234999999995, "r": 538.18445, "b": 241.48645, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 538.23553, "t": 234.86951, "r": 540.5567, "b": 239.1214, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 147, "text": "2", "bbox": {"l": 538.23553, "t": 234.86951, "r": 540.5567, "b": 239.1214, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 404.91125, "t": 216.00005999999996, "r": 411.54321, "b": 222.07416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 148, "text": "50", "bbox": {"l": 404.91125, "t": 216.00005999999996, "r": 411.54321, "b": 222.07416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 404.91125, "t": 200.22125000000005, "r": 411.54321, "b": 206.29534999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 149, "text": "55", "bbox": {"l": 404.91125, "t": 200.22125000000005, "r": 411.54321, "b": 206.29534999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 404.91125, "t": 184.44244000000003, "r": 411.54321, "b": 190.51653999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 150, "text": "60", "bbox": {"l": 404.91125, "t": 184.44244000000003, "r": 411.54321, "b": 190.51653999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 404.91125, "t": 168.66364, "r": 411.54321, "b": 174.73773000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 151, "text": "65", "bbox": {"l": 404.91125, "t": 168.66364, "r": 411.54321, "b": 174.73773000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 404.91125, "t": 152.88489000000004, "r": 411.54321, "b": 158.95898, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 152, "text": "70", "bbox": {"l": 404.91125, "t": 152.88489000000004, "r": 411.54321, "b": 158.95898, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 7, "label": "caption", "bbox": {"l": 317.95499, "t": 279.01599, "r": 559.80579, "b": 342.28418000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9639935493469238, "cells": [{"id": 153, "text": "Figure 5: Prediction performance (mAP@0.5-0.95) of a Mask", "bbox": {"l": 317.95499, "t": 279.01599, "r": 558.47876, "b": 287.48923, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "R-CNN network with ResNet50 backbone trained on increas-", "bbox": {"l": 317.95499, "t": 289.97501, "r": 559.80579, "b": 298.44824, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "ing fractions of the DocLayNet dataset. The learning curve", "bbox": {"l": 317.95499, "t": 300.93399, "r": 558.20068, "b": 309.40723, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "flattens around the 80% mark, indicating that increasing the", "bbox": {"l": 317.95499, "t": 311.89297, "r": 558.20062, "b": 320.36620999999997, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "size of the DocLayNet dataset with similar data will not yield", "bbox": {"l": 317.95499, "t": 322.85196, "r": 558.20074, "b": 331.3252, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "significantly better predictions.", "bbox": {"l": 317.95499, "t": 333.81094, "r": 445.24207, "b": 342.28418000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "text", "bbox": {"l": 317.95499, "t": 384.01154, "r": 558.20416, "b": 403.34517999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9594221711158752, "cells": [{"id": 159, "text": "paper and leave the detailed evaluation of more recent methods", "bbox": {"l": 317.95499, "t": 384.01154, "r": 558.20416, "b": 392.38617, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "mentioned in Section 2 for future work.", "bbox": {"l": 317.95499, "t": 394.97055, "r": 463.04938, "b": 403.34517999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 317.64099, "t": 405.92953, "r": 558.4364, "b": 480.05716, "coord_origin": "TOPLEFT"}, "confidence": 0.9872915148735046, "cells": [{"id": 161, "text": "In this section, we will present several aspects related to the", "bbox": {"l": 327.918, "t": 405.92953, "r": 558.19836, "b": 414.30417, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "performance of object detection models on DocLayNet. Similarly", "bbox": {"l": 317.95499, "t": 416.88855, "r": 558.4364, "b": 425.26318, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "as in PubLayNet, we will evaluate the quality of their predictions", "bbox": {"l": 317.95499, "t": 427.84653, "r": 558.20563, "b": 436.22116, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "using mean average precision (mAP) with 10 overlaps that range", "bbox": {"l": 317.95499, "t": 438.80554, "r": 558.20044, "b": 447.18018, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "from 0.5 to 0.95 in steps of 0.05 (mAP@0.5-0.95). These scores are", "bbox": {"l": 317.95499, "t": 449.76453000000004, "r": 558.19891, "b": 458.13916, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "computed by leveraging the evaluation code provided by the COCO", "bbox": {"l": 317.95499, "t": 460.72354, "r": 558.20239, "b": 469.09818, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "API [16].", "bbox": {"l": 317.64099, "t": 471.68253, "r": 350.32352, "b": 480.05716, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "section_header", "bbox": {"l": 317.95499, "t": 496.8219, "r": 466.8532400000001, "b": 507.13098, "coord_origin": "TOPLEFT"}, "confidence": 0.9579005241394043, "cells": [{"id": 168, "text": "Baselines for Object Detection", "bbox": {"l": 317.95499, "t": 496.8219, "r": 466.8532400000001, "b": 507.13098, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 317.74899, "t": 512.02454, "r": 558.43085, "b": 706.700172, "coord_origin": "TOPLEFT"}, "confidence": 0.987722635269165, "cells": [{"id": 169, "text": "In Table 2, we present baseline experiments (given in mAP) on Mask", "bbox": {"l": 317.95499, "t": 512.02454, "r": 558.43085, "b": 520.39917, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "R-CNN [12], Faster R-CNN [11], and YOLOv5 [13]. Both training", "bbox": {"l": 317.95499, "t": 522.9835499999999, "r": 558.20117, "b": 531.35818, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "and evaluation were performed on RGB images with dimensions of", "bbox": {"l": 317.95499, "t": 533.94254, "r": 558.20233, "b": 542.31717, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "1025", "bbox": {"l": 317.74899, "t": 544.90155, "r": 334.09296, "b": 553.27617, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "\u00d7", "bbox": {"l": 334.81201, "t": 544.84775, "r": 340.51465, "b": 552.5499, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "1025 pixels. For training, we only used one annotation in case", "bbox": {"l": 341.233, "t": 544.90155, "r": 558.20117, "b": 553.27617, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "of redundantly annotated pages. As one can observe, the variation", "bbox": {"l": 317.95499, "t": 555.85956, "r": 558.20392, "b": 564.23418, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "in mAP between the models is rather low, but overall between 6", "bbox": {"l": 317.95499, "t": 566.8185599999999, "r": 558.2041, "b": 575.19318, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "and 10% lower than the mAP computed from the pairwise human", "bbox": {"l": 317.95499, "t": 577.77756, "r": 558.2052, "b": 586.15218, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "annotations on triple-annotated pages. This gives a good indication", "bbox": {"l": 317.95499, "t": 588.73656, "r": 558.20233, "b": 597.11118, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "that the DocLayNet dataset poses a worthwhile challenge for the", "bbox": {"l": 317.95499, "t": 599.69556, "r": 558.1983, "b": 608.0701799999999, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "research community to close the gap between human recognition", "bbox": {"l": 317.95499, "t": 610.65456, "r": 558.20502, "b": 619.02917, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "and ML approaches. It is interesting to see that Mask R-CNN and", "bbox": {"l": 317.95499, "t": 621.61356, "r": 558.20337, "b": 629.98817, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "Faster R-CNN produce very comparable mAP scores, indicating", "bbox": {"l": 317.95499, "t": 632.5725600000001, "r": 558.2041, "b": 640.94717, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "that pixel-based image segmentation derived from bounding-boxes", "bbox": {"l": 317.95499, "t": 643.53156, "r": 558.20245, "b": 651.90617, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "does not help to obtain better predictions. On the other hand, the", "bbox": {"l": 317.95499, "t": 654.49055, "r": 558.19757, "b": 662.86517, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": "more recent Yolov5x model does very well and even out-performs", "bbox": {"l": 317.95499, "t": 665.44855, "r": 558.20404, "b": 673.82317, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "humans on selected labels such as", "bbox": {"l": 317.95499, "t": 676.40755, "r": 444.54102, "b": 684.78217, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "Text", "bbox": {"l": 446.78900000000004, "t": 676.45238, "r": 461.95261000000005, "b": 684.79114, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": ",", "bbox": {"l": 461.95599000000004, "t": 676.40755, "r": 463.96805000000006, "b": 684.78217, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "Table", "bbox": {"l": 466.2170100000001, "t": 676.45238, "r": 485.66998000000007, "b": 684.79114, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "and", "bbox": {"l": 488.1290000000001, "t": 676.40755, "r": 501.89330999999993, "b": 684.78217, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "Picture", "bbox": {"l": 504.142, "t": 676.45238, "r": 529.21954, "b": 684.79114, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": ". This is", "bbox": {"l": 529.22101, "t": 676.40755, "r": 558.20392, "b": 684.78217, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "not entirely surprising, as", "bbox": {"l": 317.95499, "t": 687.36655, "r": 410.81366, "b": 695.741173, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "Text", "bbox": {"l": 413.05301, "t": 687.41138, "r": 427.67865, "b": 695.750137, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": ",", "bbox": {"l": 427.67801, "t": 687.36655, "r": 429.62103, "b": 695.741173, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "Table", "bbox": {"l": 431.86099, "t": 687.41138, "r": 450.62881000000004, "b": 695.750137, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "and", "bbox": {"l": 453.082, "t": 687.36655, "r": 466.37402, "b": 695.741173, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "Picture", "bbox": {"l": 468.61499, "t": 687.41138, "r": 492.83208999999994, "b": 695.750137, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "are abundant and", "bbox": {"l": 495.28201, "t": 687.36655, "r": 558.2005, "b": 695.741173, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "the most visually distinctive in a document.", "bbox": {"l": 317.95499, "t": 698.325554, "r": 477.53903, "b": 706.700172, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {"0": {"label": "table", "id": 0, "page_no": 5, "cluster": {"id": 0, "label": "table", "bbox": {"l": 62.02753829956055, "t": 195.68006896972656, "r": 285.78955078125, "b": 351.6618957519531, "coord_origin": "TOPLEFT"}, "confidence": 0.9883638620376587, "cells": [{"id": 13, "text": "human", "bbox": {"l": 132.36501, "t": 197.97351000000003, "r": 157.99098, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "MRCNN", "bbox": {"l": 173.505, "t": 197.97351000000003, "r": 204.61841, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "FRCNN", "bbox": {"l": 220.13028, "t": 197.97351000000003, "r": 248.06958, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "YOLO", "bbox": {"l": 258.03125, "t": 197.97351000000003, "r": 280.17825, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "R50", "bbox": {"l": 168.39301, "t": 208.93255999999997, "r": 181.99504, "b": 217.30719, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "R101", "bbox": {"l": 192.39606, "t": 208.93255999999997, "r": 210.16747, "b": 217.30719, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "R101", "bbox": {"l": 225.21309, "t": 208.93255999999997, "r": 242.9845, "b": 217.30719, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "v5x6", "bbox": {"l": 260.51379, "t": 208.93255999999997, "r": 277.70239, "b": 217.30719, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Caption", "bbox": {"l": 67.663002, "t": 220.28954999999996, "r": 96.848633, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "84-89", "bbox": {"l": 135.32401, "t": 220.28954999999996, "r": 155.03215, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "68.4", "bbox": {"l": 167.95399, "t": 220.28954999999996, "r": 182.43472, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "71.5", "bbox": {"l": 194.0462, "t": 220.28954999999996, "r": 208.52695, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "70.1", "bbox": {"l": 226.86324000000002, "t": 220.28954999999996, "r": 241.34396, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "77.7", "bbox": {"l": 261.86804, "t": 220.28954999999996, "r": 276.34879, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Footnote", "bbox": {"l": 67.663002, "t": 231.24854000000005, "r": 100.1662, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "83-91", "bbox": {"l": 135.32401, "t": 231.24854000000005, "r": 155.03215, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "70.9", "bbox": {"l": 167.95399, "t": 231.24854000000005, "r": 182.43472, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "71.8", "bbox": {"l": 194.0462, "t": 231.24854000000005, "r": 208.52695, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "73.7", "bbox": {"l": 226.86324000000002, "t": 231.24854000000005, "r": 241.34396, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "77.2", "bbox": {"l": 261.86804, "t": 231.24854000000005, "r": 276.34879, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "Formula", "bbox": {"l": 67.663002, "t": 242.20752000000005, "r": 98.175659, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "83-85", "bbox": {"l": 135.32401, "t": 242.20752000000005, "r": 155.03215, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "60.1", "bbox": {"l": 167.95399, "t": 242.20752000000005, "r": 182.43472, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "63.4", "bbox": {"l": 194.0462, "t": 242.20752000000005, "r": 208.52695, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "63.5", "bbox": {"l": 226.86324000000002, "t": 242.20752000000005, "r": 241.34396, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "66.2", "bbox": {"l": 261.86804, "t": 242.20752000000005, "r": 276.34879, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "List-item", "bbox": {"l": 67.663002, "t": 253.16656, "r": 100.54279, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "87-88", "bbox": {"l": 135.32401, "t": 253.16656, "r": 155.03215, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "81.2", "bbox": {"l": 167.95399, "t": 253.16656, "r": 182.43472, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "80.8", "bbox": {"l": 194.0462, "t": 253.16656, "r": 208.52695, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "81.0", "bbox": {"l": 226.86324000000002, "t": 253.16656, "r": 241.34396, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "86.2", "bbox": {"l": 261.86804, "t": 253.16656, "r": 276.34879, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Page-footer", "bbox": {"l": 67.663002, "t": 264.12555, "r": 110.19064, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "93-94", "bbox": {"l": 135.32401, "t": 264.12555, "r": 155.03215, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "61.6", "bbox": {"l": 167.95399, "t": 264.12555, "r": 182.43472, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "59.3", "bbox": {"l": 194.0462, "t": 264.12555, "r": 208.52695, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "58.9", "bbox": {"l": 226.86324000000002, "t": 264.12555, "r": 241.34396, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "61.1", "bbox": {"l": 261.86804, "t": 264.12555, "r": 276.34879, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Page-header", "bbox": {"l": 67.663002, "t": 275.08453, "r": 112.94331999999999, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "85-89", "bbox": {"l": 135.32401, "t": 275.08453, "r": 155.03215, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "71.9", "bbox": {"l": 167.95399, "t": 275.08453, "r": 182.43472, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "70.0", "bbox": {"l": 194.0462, "t": 275.08453, "r": 208.52695, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "72.0", "bbox": {"l": 226.86324000000002, "t": 275.08453, "r": 241.34396, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "67.9", "bbox": {"l": 261.86804, "t": 275.08453, "r": 276.34879, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Picture", "bbox": {"l": 67.663002, "t": 286.04355000000004, "r": 93.647629, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "69-71", "bbox": {"l": 135.32401, "t": 286.04355000000004, "r": 155.03215, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "71.7", "bbox": {"l": 167.95399, "t": 286.04355000000004, "r": 182.43472, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "72.7", "bbox": {"l": 194.0462, "t": 286.04355000000004, "r": 208.52695, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "72.0", "bbox": {"l": 226.86324000000002, "t": 286.04355000000004, "r": 241.34396, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "77.1", "bbox": {"l": 261.86804, "t": 286.04355000000004, "r": 276.34879, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "Section-header", "bbox": {"l": 67.663002, "t": 297.00253, "r": 122.40287999999998, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "83-84", "bbox": {"l": 135.32401, "t": 297.00253, "r": 155.03215, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "67.6", "bbox": {"l": 167.95399, "t": 297.00253, "r": 182.43472, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "69.3", "bbox": {"l": 194.0462, "t": 297.00253, "r": 208.52695, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "68.4", "bbox": {"l": 226.86324000000002, "t": 297.00253, "r": 241.34396, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "74.6", "bbox": {"l": 261.86804, "t": 297.00253, "r": 276.34879, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "Table", "bbox": {"l": 67.663002, "t": 307.96155, "r": 87.46978, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "77-81", "bbox": {"l": 135.32401, "t": 307.96155, "r": 155.03215, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "82.2", "bbox": {"l": 167.95399, "t": 307.96155, "r": 182.43472, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "82.9", "bbox": {"l": 194.0462, "t": 307.96155, "r": 208.52695, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "82.2", "bbox": {"l": 226.86324000000002, "t": 307.96155, "r": 241.34396, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "86.3", "bbox": {"l": 261.86804, "t": 307.96155, "r": 276.34879, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "Text", "bbox": {"l": 67.663002, "t": 318.91953, "r": 83.623199, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "84-86", "bbox": {"l": 135.32401, "t": 318.91953, "r": 155.03215, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "84.6", "bbox": {"l": 167.95399, "t": 318.91953, "r": 182.43472, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "85.8", "bbox": {"l": 194.0462, "t": 318.91953, "r": 208.52695, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "85.4", "bbox": {"l": 226.86324000000002, "t": 318.91953, "r": 241.34396, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "88.1", "bbox": {"l": 261.86804, "t": 318.91953, "r": 276.34879, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Title", "bbox": {"l": 67.663002, "t": 329.87854, "r": 84.654327, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "60-72", "bbox": {"l": 135.32401, "t": 329.87854, "r": 155.03215, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "76.7", "bbox": {"l": 167.95399, "t": 329.87854, "r": 182.43472, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "80.4", "bbox": {"l": 194.0462, "t": 329.87854, "r": 208.52695, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "79.9", "bbox": {"l": 226.86324000000002, "t": 329.87854, "r": 241.34396, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "82.7", "bbox": {"l": 261.86804, "t": 329.87854, "r": 276.34879, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "All", "bbox": {"l": 67.663002, "t": 341.23654, "r": 78.628906, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "82-83", "bbox": {"l": 135.32401, "t": 341.23654, "r": 155.03215, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "72.4", "bbox": {"l": 167.95399, "t": 341.23654, "r": 182.43472, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "73.5", "bbox": {"l": 194.0462, "t": 341.23654, "r": 208.52695, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "73.4", "bbox": {"l": 226.86324000000002, "t": 341.23654, "r": 241.34396, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "76.8", "bbox": {"l": 261.86804, "t": 341.23654, "r": 276.34879, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": [{"id": 12, "label": "text", "bbox": {"l": 132.36501, "t": 197.97351000000003, "r": 157.99098, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "human", "bbox": {"l": 132.36501, "t": 197.97351000000003, "r": 157.99098, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 173.505, "t": 197.97351000000003, "r": 204.61841, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "MRCNN", "bbox": {"l": 173.505, "t": 197.97351000000003, "r": 204.61841, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 220.13028, "t": 197.97351000000003, "r": 248.06958, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "FRCNN", "bbox": {"l": 220.13028, "t": 197.97351000000003, "r": 248.06958, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 258.03125, "t": 197.97351000000003, "r": 280.17825, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "YOLO", "bbox": {"l": 258.03125, "t": 197.97351000000003, "r": 280.17825, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 168.39301, "t": 208.93255999999997, "r": 181.99504, "b": 217.30719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "R50", "bbox": {"l": 168.39301, "t": 208.93255999999997, "r": 181.99504, "b": 217.30719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 192.39606, "t": 208.93255999999997, "r": 210.16747, "b": 217.30719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "R101", "bbox": {"l": 192.39606, "t": 208.93255999999997, "r": 210.16747, "b": 217.30719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 225.21309, "t": 208.93255999999997, "r": 242.9845, "b": 217.30719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "R101", "bbox": {"l": 225.21309, "t": 208.93255999999997, "r": 242.9845, "b": 217.30719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 260.51379, "t": 208.93255999999997, "r": 277.70239, "b": 217.30719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "v5x6", "bbox": {"l": 260.51379, "t": 208.93255999999997, "r": 277.70239, "b": 217.30719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 67.663002, "t": 220.28954999999996, "r": 96.848633, "b": 228.66418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "Caption", "bbox": {"l": 67.663002, "t": 220.28954999999996, "r": 96.848633, "b": 228.66418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 135.32401, "t": 220.28954999999996, "r": 155.03215, "b": 228.66418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "84-89", "bbox": {"l": 135.32401, "t": 220.28954999999996, "r": 155.03215, "b": 228.66418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 167.95399, "t": 220.28954999999996, "r": 182.43472, "b": 228.66418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "68.4", "bbox": {"l": 167.95399, "t": 220.28954999999996, "r": 182.43472, "b": 228.66418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 194.0462, "t": 220.28954999999996, "r": 208.52695, "b": 228.66418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "71.5", "bbox": {"l": 194.0462, "t": 220.28954999999996, "r": 208.52695, "b": 228.66418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 226.86324000000002, "t": 220.28954999999996, "r": 241.34396, "b": 228.66418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "70.1", "bbox": {"l": 226.86324000000002, "t": 220.28954999999996, "r": 241.34396, "b": 228.66418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 261.86804, "t": 220.28954999999996, "r": 276.34879, "b": 228.66418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "77.7", "bbox": {"l": 261.86804, "t": 220.28954999999996, "r": 276.34879, "b": 228.66418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 67.663002, "t": 231.24854000000005, "r": 100.1662, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "Footnote", "bbox": {"l": 67.663002, "t": 231.24854000000005, "r": 100.1662, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 135.32401, "t": 231.24854000000005, "r": 155.03215, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "83-91", "bbox": {"l": 135.32401, "t": 231.24854000000005, "r": 155.03215, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 167.95399, "t": 231.24854000000005, "r": 182.43472, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "70.9", "bbox": {"l": 167.95399, "t": 231.24854000000005, "r": 182.43472, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 194.0462, "t": 231.24854000000005, "r": 208.52695, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "71.8", "bbox": {"l": 194.0462, "t": 231.24854000000005, "r": 208.52695, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 226.86324000000002, "t": 231.24854000000005, "r": 241.34396, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "73.7", "bbox": {"l": 226.86324000000002, "t": 231.24854000000005, "r": 241.34396, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 261.86804, "t": 231.24854000000005, "r": 276.34879, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "77.2", "bbox": {"l": 261.86804, "t": 231.24854000000005, "r": 276.34879, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 67.663002, "t": 242.20752000000005, "r": 98.175659, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "Formula", "bbox": {"l": 67.663002, "t": 242.20752000000005, "r": 98.175659, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 135.32401, "t": 242.20752000000005, "r": 155.03215, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "83-85", "bbox": {"l": 135.32401, "t": 242.20752000000005, "r": 155.03215, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 167.95399, "t": 242.20752000000005, "r": 182.43472, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "60.1", "bbox": {"l": 167.95399, "t": 242.20752000000005, "r": 182.43472, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 194.0462, "t": 242.20752000000005, "r": 208.52695, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "63.4", "bbox": {"l": 194.0462, "t": 242.20752000000005, "r": 208.52695, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 226.86324000000002, "t": 242.20752000000005, "r": 241.34396, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "63.5", "bbox": {"l": 226.86324000000002, "t": 242.20752000000005, "r": 241.34396, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 261.86804, "t": 242.20752000000005, "r": 276.34879, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "66.2", "bbox": {"l": 261.86804, "t": 242.20752000000005, "r": 276.34879, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 67.663002, "t": 253.16656, "r": 100.54279, "b": 261.5412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "List-item", "bbox": {"l": 67.663002, "t": 253.16656, "r": 100.54279, "b": 261.5412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 135.32401, "t": 253.16656, "r": 155.03215, "b": 261.5412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "87-88", "bbox": {"l": 135.32401, "t": 253.16656, "r": 155.03215, "b": 261.5412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 167.95399, "t": 253.16656, "r": 182.43472, "b": 261.5412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "81.2", "bbox": {"l": 167.95399, "t": 253.16656, "r": 182.43472, "b": 261.5412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 194.0462, "t": 253.16656, "r": 208.52695, "b": 261.5412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "80.8", "bbox": {"l": 194.0462, "t": 253.16656, "r": 208.52695, "b": 261.5412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 226.86324000000002, "t": 253.16656, "r": 241.34396, "b": 261.5412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "81.0", "bbox": {"l": 226.86324000000002, "t": 253.16656, "r": 241.34396, "b": 261.5412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 261.86804, "t": 253.16656, "r": 276.34879, "b": 261.5412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "86.2", "bbox": {"l": 261.86804, "t": 253.16656, "r": 276.34879, "b": 261.5412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 67.663002, "t": 264.12555, "r": 110.19064, "b": 272.50018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "Page-footer", "bbox": {"l": 67.663002, "t": 264.12555, "r": 110.19064, "b": 272.50018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 135.32401, "t": 264.12555, "r": 155.03215, "b": 272.50018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "93-94", "bbox": {"l": 135.32401, "t": 264.12555, "r": 155.03215, "b": 272.50018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 167.95399, "t": 264.12555, "r": 182.43472, "b": 272.50018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "61.6", "bbox": {"l": 167.95399, "t": 264.12555, "r": 182.43472, "b": 272.50018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 194.0462, "t": 264.12555, "r": 208.52695, "b": 272.50018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "59.3", "bbox": {"l": 194.0462, "t": 264.12555, "r": 208.52695, "b": 272.50018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 226.86324000000002, "t": 264.12555, "r": 241.34396, "b": 272.50018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "58.9", "bbox": {"l": 226.86324000000002, "t": 264.12555, "r": 241.34396, "b": 272.50018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 261.86804, "t": 264.12555, "r": 276.34879, "b": 272.50018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "61.1", "bbox": {"l": 261.86804, "t": 264.12555, "r": 276.34879, "b": 272.50018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 67.663002, "t": 275.08453, "r": 112.94331999999999, "b": 283.45917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "Page-header", "bbox": {"l": 67.663002, "t": 275.08453, "r": 112.94331999999999, "b": 283.45917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 135.32401, "t": 275.08453, "r": 155.03215, "b": 283.45917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "85-89", "bbox": {"l": 135.32401, "t": 275.08453, "r": 155.03215, "b": 283.45917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 167.95399, "t": 275.08453, "r": 182.43472, "b": 283.45917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "71.9", "bbox": {"l": 167.95399, "t": 275.08453, "r": 182.43472, "b": 283.45917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 194.0462, "t": 275.08453, "r": 208.52695, "b": 283.45917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "70.0", "bbox": {"l": 194.0462, "t": 275.08453, "r": 208.52695, "b": 283.45917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 226.86324000000002, "t": 275.08453, "r": 241.34396, "b": 283.45917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "72.0", "bbox": {"l": 226.86324000000002, "t": 275.08453, "r": 241.34396, "b": 283.45917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 261.86804, "t": 275.08453, "r": 276.34879, "b": 283.45917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "67.9", "bbox": {"l": 261.86804, "t": 275.08453, "r": 276.34879, "b": 283.45917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 67.663002, "t": 286.04355000000004, "r": 93.647629, "b": 294.41818, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "Picture", "bbox": {"l": 67.663002, "t": 286.04355000000004, "r": 93.647629, "b": 294.41818, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 135.32401, "t": 286.04355000000004, "r": 155.03215, "b": 294.41818, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "69-71", "bbox": {"l": 135.32401, "t": 286.04355000000004, "r": 155.03215, "b": 294.41818, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 167.95399, "t": 286.04355000000004, "r": 182.43472, "b": 294.41818, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "71.7", "bbox": {"l": 167.95399, "t": 286.04355000000004, "r": 182.43472, "b": 294.41818, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 194.0462, "t": 286.04355000000004, "r": 208.52695, "b": 294.41818, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "72.7", "bbox": {"l": 194.0462, "t": 286.04355000000004, "r": 208.52695, "b": 294.41818, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 226.86324000000002, "t": 286.04355000000004, "r": 241.34396, "b": 294.41818, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "72.0", "bbox": {"l": 226.86324000000002, "t": 286.04355000000004, "r": 241.34396, "b": 294.41818, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 261.86804, "t": 286.04355000000004, "r": 276.34879, "b": 294.41818, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "77.1", "bbox": {"l": 261.86804, "t": 286.04355000000004, "r": 276.34879, "b": 294.41818, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 67.663002, "t": 297.00253, "r": 122.40287999999998, "b": 305.37717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "Section-header", "bbox": {"l": 67.663002, "t": 297.00253, "r": 122.40287999999998, "b": 305.37717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 135.32401, "t": 297.00253, "r": 155.03215, "b": 305.37717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "83-84", "bbox": {"l": 135.32401, "t": 297.00253, "r": 155.03215, "b": 305.37717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 167.95399, "t": 297.00253, "r": 182.43472, "b": 305.37717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "67.6", "bbox": {"l": 167.95399, "t": 297.00253, "r": 182.43472, "b": 305.37717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 194.0462, "t": 297.00253, "r": 208.52695, "b": 305.37717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "69.3", "bbox": {"l": 194.0462, "t": 297.00253, "r": 208.52695, "b": 305.37717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 226.86324000000002, "t": 297.00253, "r": 241.34396, "b": 305.37717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "68.4", "bbox": {"l": 226.86324000000002, "t": 297.00253, "r": 241.34396, "b": 305.37717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 261.86804, "t": 297.00253, "r": 276.34879, "b": 305.37717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "74.6", "bbox": {"l": 261.86804, "t": 297.00253, "r": 276.34879, "b": 305.37717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 67.663002, "t": 307.96155, "r": 87.46978, "b": 316.33618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "Table", "bbox": {"l": 67.663002, "t": 307.96155, "r": 87.46978, "b": 316.33618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 135.32401, "t": 307.96155, "r": 155.03215, "b": 316.33618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "77-81", "bbox": {"l": 135.32401, "t": 307.96155, "r": 155.03215, "b": 316.33618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 167.95399, "t": 307.96155, "r": 182.43472, "b": 316.33618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "82.2", "bbox": {"l": 167.95399, "t": 307.96155, "r": 182.43472, "b": 316.33618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 194.0462, "t": 307.96155, "r": 208.52695, "b": 316.33618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "82.9", "bbox": {"l": 194.0462, "t": 307.96155, "r": 208.52695, "b": 316.33618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 226.86324000000002, "t": 307.96155, "r": 241.34396, "b": 316.33618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "82.2", "bbox": {"l": 226.86324000000002, "t": 307.96155, "r": 241.34396, "b": 316.33618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 261.86804, "t": 307.96155, "r": 276.34879, "b": 316.33618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "86.3", "bbox": {"l": 261.86804, "t": 307.96155, "r": 276.34879, "b": 316.33618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 67.663002, "t": 318.91953, "r": 83.623199, "b": 327.29416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "Text", "bbox": {"l": 67.663002, "t": 318.91953, "r": 83.623199, "b": 327.29416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 135.32401, "t": 318.91953, "r": 155.03215, "b": 327.29416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "84-86", "bbox": {"l": 135.32401, "t": 318.91953, "r": 155.03215, "b": 327.29416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 167.95399, "t": 318.91953, "r": 182.43472, "b": 327.29416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "84.6", "bbox": {"l": 167.95399, "t": 318.91953, "r": 182.43472, "b": 327.29416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 194.0462, "t": 318.91953, "r": 208.52695, "b": 327.29416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "85.8", "bbox": {"l": 194.0462, "t": 318.91953, "r": 208.52695, "b": 327.29416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 226.86324000000002, "t": 318.91953, "r": 241.34396, "b": 327.29416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "85.4", "bbox": {"l": 226.86324000000002, "t": 318.91953, "r": 241.34396, "b": 327.29416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 261.86804, "t": 318.91953, "r": 276.34879, "b": 327.29416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "88.1", "bbox": {"l": 261.86804, "t": 318.91953, "r": 276.34879, "b": 327.29416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 67.663002, "t": 329.87854, "r": 84.654327, "b": 338.25317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "Title", "bbox": {"l": 67.663002, "t": 329.87854, "r": 84.654327, "b": 338.25317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 135.32401, "t": 329.87854, "r": 155.03215, "b": 338.25317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "60-72", "bbox": {"l": 135.32401, "t": 329.87854, "r": 155.03215, "b": 338.25317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 167.95399, "t": 329.87854, "r": 182.43472, "b": 338.25317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "76.7", "bbox": {"l": 167.95399, "t": 329.87854, "r": 182.43472, "b": 338.25317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 194.0462, "t": 329.87854, "r": 208.52695, "b": 338.25317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "80.4", "bbox": {"l": 194.0462, "t": 329.87854, "r": 208.52695, "b": 338.25317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 226.86324000000002, "t": 329.87854, "r": 241.34396, "b": 338.25317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "79.9", "bbox": {"l": 226.86324000000002, "t": 329.87854, "r": 241.34396, "b": 338.25317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 261.86804, "t": 329.87854, "r": 276.34879, "b": 338.25317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "82.7", "bbox": {"l": 261.86804, "t": 329.87854, "r": 276.34879, "b": 338.25317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 67.663002, "t": 341.23654, "r": 78.628906, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "All", "bbox": {"l": 67.663002, "t": 341.23654, "r": 78.628906, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 135.32401, "t": 341.23654, "r": 155.03215, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "82-83", "bbox": {"l": 135.32401, "t": 341.23654, "r": 155.03215, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 167.95399, "t": 341.23654, "r": 182.43472, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "72.4", "bbox": {"l": 167.95399, "t": 341.23654, "r": 182.43472, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 194.0462, "t": 341.23654, "r": 208.52695, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "73.5", "bbox": {"l": 194.0462, "t": 341.23654, "r": 208.52695, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 226.86324000000002, "t": 341.23654, "r": 241.34396, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "73.4", "bbox": {"l": 226.86324000000002, "t": 341.23654, "r": 241.34396, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 261.86804, "t": 341.23654, "r": 276.34879, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "76.8", "bbox": {"l": 261.86804, "t": 341.23654, "r": 276.34879, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ecel", "ched", "ched", "lcel", "ched", "ched", "nl", "ecel", "ucel", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 14, "num_cols": 6, "table_cells": [{"bbox": {"l": 132.36501, "t": 197.97351000000003, "r": 157.99098, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "human", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 173.505, "t": 197.97351000000003, "r": 204.61841, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 4, "text": "MRCNN", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 220.13028, "t": 197.97351000000003, "r": 248.06958, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "FRCNN", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 258.03125, "t": 197.97351000000003, "r": 280.17825, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "YOLO", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 168.39301, "t": 208.93255999999997, "r": 181.99504, "b": 217.30719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "R50", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 192.39606, "t": 208.93255999999997, "r": 210.16747, "b": 217.30719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "R101", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 225.21309, "t": 208.93255999999997, "r": 242.9845, "b": 217.30719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "R101", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 260.51379, "t": 208.93255999999997, "r": 277.70239, "b": 217.30719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "v5x6", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 220.28954999999996, "r": 96.848633, "b": 228.66418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Caption", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 220.28954999999996, "r": 155.03215, "b": 228.66418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "84-89", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 220.28954999999996, "r": 182.43472, "b": 228.66418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "68.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 220.28954999999996, "r": 208.52695, "b": 228.66418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "71.5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 220.28954999999996, "r": 241.34396, "b": 228.66418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "70.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 220.28954999999996, "r": 276.34879, "b": 228.66418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "77.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 231.24854000000005, "r": 100.1662, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Footnote", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 231.24854000000005, "r": 155.03215, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "83-91", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 231.24854000000005, "r": 182.43472, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "70.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 231.24854000000005, "r": 208.52695, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "71.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 231.24854000000005, "r": 241.34396, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "73.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 231.24854000000005, "r": 276.34879, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "77.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 242.20752000000005, "r": 98.175659, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Formula", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 242.20752000000005, "r": 155.03215, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "83-85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 242.20752000000005, "r": 182.43472, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "60.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 242.20752000000005, "r": 208.52695, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "63.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 242.20752000000005, "r": 241.34396, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "63.5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 242.20752000000005, "r": 276.34879, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "66.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 253.16656, "r": 100.54279, "b": 261.5412, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "List-item", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 253.16656, "r": 155.03215, "b": 261.5412, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "87-88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 253.16656, "r": 182.43472, "b": 261.5412, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "81.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 253.16656, "r": 208.52695, "b": 261.5412, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "80.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 253.16656, "r": 241.34396, "b": 261.5412, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "81.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 253.16656, "r": 276.34879, "b": 261.5412, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "86.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 264.12555, "r": 110.19064, "b": 272.50018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-footer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 264.12555, "r": 155.03215, "b": 272.50018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "93-94", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 264.12555, "r": 182.43472, "b": 272.50018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "61.6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 264.12555, "r": 208.52695, "b": 272.50018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "59.3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 264.12555, "r": 241.34396, "b": 272.50018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "58.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 264.12555, "r": 276.34879, "b": 272.50018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "61.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 275.08453, "r": 112.94331999999999, "b": 283.45917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 275.08453, "r": 155.03215, "b": 283.45917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "85-89", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 275.08453, "r": 182.43472, "b": 283.45917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "71.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 275.08453, "r": 208.52695, "b": 283.45917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "70.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 275.08453, "r": 241.34396, "b": 283.45917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "72.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 275.08453, "r": 276.34879, "b": 283.45917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "67.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 286.04355000000004, "r": 93.647629, "b": 294.41818, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Picture", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 286.04355000000004, "r": 155.03215, "b": 294.41818, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "69-71", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 286.04355000000004, "r": 182.43472, "b": 294.41818, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "71.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 286.04355000000004, "r": 208.52695, "b": 294.41818, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "72.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 286.04355000000004, "r": 241.34396, "b": 294.41818, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "72.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 286.04355000000004, "r": 276.34879, "b": 294.41818, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "77.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 297.00253, "r": 122.40287999999998, "b": 305.37717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Section-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 297.00253, "r": 155.03215, "b": 305.37717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "83-84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 297.00253, "r": 182.43472, "b": 305.37717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "67.6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 297.00253, "r": 208.52695, "b": 305.37717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "69.3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 297.00253, "r": 241.34396, "b": 305.37717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "68.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 297.00253, "r": 276.34879, "b": 305.37717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "74.6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 307.96155, "r": 87.46978, "b": 316.33618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 307.96155, "r": 155.03215, "b": 316.33618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "77-81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 307.96155, "r": 182.43472, "b": 316.33618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "82.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 307.96155, "r": 208.52695, "b": 316.33618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "82.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 307.96155, "r": 241.34396, "b": 316.33618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "82.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 307.96155, "r": 276.34879, "b": 316.33618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "86.3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 318.91953, "r": 83.623199, "b": 327.29416, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Text", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 318.91953, "r": 155.03215, "b": 327.29416, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "84-86", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 318.91953, "r": 182.43472, "b": 327.29416, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "84.6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 318.91953, "r": 208.52695, "b": 327.29416, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "85.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 318.91953, "r": 241.34396, "b": 327.29416, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "85.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 318.91953, "r": 276.34879, "b": 327.29416, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "88.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 329.87854, "r": 84.654327, "b": 338.25317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Title", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 329.87854, "r": 155.03215, "b": 338.25317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "60-72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 329.87854, "r": 182.43472, "b": 338.25317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "76.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 329.87854, "r": 208.52695, "b": 338.25317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "80.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 329.87854, "r": 241.34396, "b": 338.25317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "79.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 329.87854, "r": 276.34879, "b": 338.25317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "82.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 341.23654, "r": 78.628906, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "All", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 341.23654, "r": 155.03215, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "82-83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 341.23654, "r": 182.43472, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "72.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 341.23654, "r": 208.52695, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "73.5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 341.23654, "r": 241.34396, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "73.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 341.23654, "r": 276.34879, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "76.8", "column_header": false, "row_header": false, "row_section": false}]}}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_header", "id": 11, "page_no": 5, "cluster": {"id": 11, "label": "page_header", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.8662876486778259, "cells": [{"id": 0, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 246.24382, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar", "bbox": {"l": 253.13897999999998, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "KDD '22, August 14-18, 2022, Washington, DC, USA Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar"}, {"label": "text", "id": 5, "page_no": 5, "cluster": {"id": 5, "label": "text", "bbox": {"l": 53.501999, "t": 86.87292000000002, "r": 295.64874, "b": 183.01709000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9782760143280029, "cells": [{"id": 2, "text": "Table 2: Prediction performance (mAP@0.5-0.95) of object", "bbox": {"l": 53.501999, "t": 86.87292000000002, "r": 294.04361, "b": 95.34618999999998, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "detection networks on DocLayNet test set. The MRCNN", "bbox": {"l": 53.79800000000001, "t": 97.83191, "r": 294.04373, "b": 106.30517999999995, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "(Mask R-CNN) and FRCNN (Faster R-CNN) models with", "bbox": {"l": 53.52, "t": 108.79088999999999, "r": 294.0437, "b": 117.26415999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "ResNet-50 or ResNet-101 backbone were trained based on", "bbox": {"l": 53.79800000000001, "t": 119.74987999999996, "r": 294.04373, "b": 128.22313999999994, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "the network architectures from the", "bbox": {"l": 53.79800000000001, "t": 130.70885999999996, "r": 202.43402, "b": 139.18213000000003, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "detectron2", "bbox": {"l": 206.08501, "t": 130.71783000000005, "r": 247.14215000000002, "b": 139.20905000000005, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "model zoo", "bbox": {"l": 250.95001, "t": 130.70885999999996, "r": 294.04254, "b": 139.18213000000003, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "(Mask R-CNN R50, R101-FPN 3x, Faster R-CNN R101-FPN", "bbox": {"l": 53.52002, "t": 141.66785000000004, "r": 294.04367, "b": 150.14111000000003, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "3x), with default configurations. The YOLO implementation", "bbox": {"l": 53.798019, "t": 152.62683000000004, "r": 294.04373, "b": 161.1001, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "utilized was YOLOv5x6 [13]. All models were initialised us-", "bbox": {"l": 53.798019, "t": 163.58582, "r": 295.64874, "b": 172.05908, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "ing pre-trained weights from the COCO 2017 dataset.", "bbox": {"l": 53.798019, "t": 174.54381999999998, "r": 268.62399, "b": 183.01709000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 2: Prediction performance (mAP@0.5-0.95) of object detection networks on DocLayNet test set. The MRCNN (Mask R-CNN) and FRCNN (Faster R-CNN) models with ResNet-50 or ResNet-101 backbone were trained based on the network architectures from the detectron2 model zoo (Mask R-CNN R50, R101-FPN 3x, Faster R-CNN R101-FPN 3x), with default configurations. The YOLO implementation utilized was YOLOv5x6 [13]. All models were initialised using pre-trained weights from the COCO 2017 dataset."}, {"label": "table", "id": 0, "page_no": 5, "cluster": {"id": 0, "label": "table", "bbox": {"l": 62.02753829956055, "t": 195.68006896972656, "r": 285.78955078125, "b": 351.6618957519531, "coord_origin": "TOPLEFT"}, "confidence": 0.9883638620376587, "cells": [{"id": 13, "text": "human", "bbox": {"l": 132.36501, "t": 197.97351000000003, "r": 157.99098, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "MRCNN", "bbox": {"l": 173.505, "t": 197.97351000000003, "r": 204.61841, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "FRCNN", "bbox": {"l": 220.13028, "t": 197.97351000000003, "r": 248.06958, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "YOLO", "bbox": {"l": 258.03125, "t": 197.97351000000003, "r": 280.17825, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "R50", "bbox": {"l": 168.39301, "t": 208.93255999999997, "r": 181.99504, "b": 217.30719, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "R101", "bbox": {"l": 192.39606, "t": 208.93255999999997, "r": 210.16747, "b": 217.30719, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "R101", "bbox": {"l": 225.21309, "t": 208.93255999999997, "r": 242.9845, "b": 217.30719, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "v5x6", "bbox": {"l": 260.51379, "t": 208.93255999999997, "r": 277.70239, "b": 217.30719, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Caption", "bbox": {"l": 67.663002, "t": 220.28954999999996, "r": 96.848633, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "84-89", "bbox": {"l": 135.32401, "t": 220.28954999999996, "r": 155.03215, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "68.4", "bbox": {"l": 167.95399, "t": 220.28954999999996, "r": 182.43472, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "71.5", "bbox": {"l": 194.0462, "t": 220.28954999999996, "r": 208.52695, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "70.1", "bbox": {"l": 226.86324000000002, "t": 220.28954999999996, "r": 241.34396, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "77.7", "bbox": {"l": 261.86804, "t": 220.28954999999996, "r": 276.34879, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Footnote", "bbox": {"l": 67.663002, "t": 231.24854000000005, "r": 100.1662, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "83-91", "bbox": {"l": 135.32401, "t": 231.24854000000005, "r": 155.03215, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "70.9", "bbox": {"l": 167.95399, "t": 231.24854000000005, "r": 182.43472, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "71.8", "bbox": {"l": 194.0462, "t": 231.24854000000005, "r": 208.52695, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "73.7", "bbox": {"l": 226.86324000000002, "t": 231.24854000000005, "r": 241.34396, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "77.2", "bbox": {"l": 261.86804, "t": 231.24854000000005, "r": 276.34879, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "Formula", "bbox": {"l": 67.663002, "t": 242.20752000000005, "r": 98.175659, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "83-85", "bbox": {"l": 135.32401, "t": 242.20752000000005, "r": 155.03215, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "60.1", "bbox": {"l": 167.95399, "t": 242.20752000000005, "r": 182.43472, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "63.4", "bbox": {"l": 194.0462, "t": 242.20752000000005, "r": 208.52695, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "63.5", "bbox": {"l": 226.86324000000002, "t": 242.20752000000005, "r": 241.34396, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "66.2", "bbox": {"l": 261.86804, "t": 242.20752000000005, "r": 276.34879, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "List-item", "bbox": {"l": 67.663002, "t": 253.16656, "r": 100.54279, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "87-88", "bbox": {"l": 135.32401, "t": 253.16656, "r": 155.03215, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "81.2", "bbox": {"l": 167.95399, "t": 253.16656, "r": 182.43472, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "80.8", "bbox": {"l": 194.0462, "t": 253.16656, "r": 208.52695, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "81.0", "bbox": {"l": 226.86324000000002, "t": 253.16656, "r": 241.34396, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "86.2", "bbox": {"l": 261.86804, "t": 253.16656, "r": 276.34879, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Page-footer", "bbox": {"l": 67.663002, "t": 264.12555, "r": 110.19064, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "93-94", "bbox": {"l": 135.32401, "t": 264.12555, "r": 155.03215, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "61.6", "bbox": {"l": 167.95399, "t": 264.12555, "r": 182.43472, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "59.3", "bbox": {"l": 194.0462, "t": 264.12555, "r": 208.52695, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "58.9", "bbox": {"l": 226.86324000000002, "t": 264.12555, "r": 241.34396, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "61.1", "bbox": {"l": 261.86804, "t": 264.12555, "r": 276.34879, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Page-header", "bbox": {"l": 67.663002, "t": 275.08453, "r": 112.94331999999999, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "85-89", "bbox": {"l": 135.32401, "t": 275.08453, "r": 155.03215, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "71.9", "bbox": {"l": 167.95399, "t": 275.08453, "r": 182.43472, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "70.0", "bbox": {"l": 194.0462, "t": 275.08453, "r": 208.52695, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "72.0", "bbox": {"l": 226.86324000000002, "t": 275.08453, "r": 241.34396, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "67.9", "bbox": {"l": 261.86804, "t": 275.08453, "r": 276.34879, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Picture", "bbox": {"l": 67.663002, "t": 286.04355000000004, "r": 93.647629, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "69-71", "bbox": {"l": 135.32401, "t": 286.04355000000004, "r": 155.03215, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "71.7", "bbox": {"l": 167.95399, "t": 286.04355000000004, "r": 182.43472, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "72.7", "bbox": {"l": 194.0462, "t": 286.04355000000004, "r": 208.52695, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "72.0", "bbox": {"l": 226.86324000000002, "t": 286.04355000000004, "r": 241.34396, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "77.1", "bbox": {"l": 261.86804, "t": 286.04355000000004, "r": 276.34879, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "Section-header", "bbox": {"l": 67.663002, "t": 297.00253, "r": 122.40287999999998, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "83-84", "bbox": {"l": 135.32401, "t": 297.00253, "r": 155.03215, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "67.6", "bbox": {"l": 167.95399, "t": 297.00253, "r": 182.43472, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "69.3", "bbox": {"l": 194.0462, "t": 297.00253, "r": 208.52695, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "68.4", "bbox": {"l": 226.86324000000002, "t": 297.00253, "r": 241.34396, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "74.6", "bbox": {"l": 261.86804, "t": 297.00253, "r": 276.34879, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "Table", "bbox": {"l": 67.663002, "t": 307.96155, "r": 87.46978, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "77-81", "bbox": {"l": 135.32401, "t": 307.96155, "r": 155.03215, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "82.2", "bbox": {"l": 167.95399, "t": 307.96155, "r": 182.43472, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "82.9", "bbox": {"l": 194.0462, "t": 307.96155, "r": 208.52695, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "82.2", "bbox": {"l": 226.86324000000002, "t": 307.96155, "r": 241.34396, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "86.3", "bbox": {"l": 261.86804, "t": 307.96155, "r": 276.34879, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "Text", "bbox": {"l": 67.663002, "t": 318.91953, "r": 83.623199, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "84-86", "bbox": {"l": 135.32401, "t": 318.91953, "r": 155.03215, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "84.6", "bbox": {"l": 167.95399, "t": 318.91953, "r": 182.43472, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "85.8", "bbox": {"l": 194.0462, "t": 318.91953, "r": 208.52695, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "85.4", "bbox": {"l": 226.86324000000002, "t": 318.91953, "r": 241.34396, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "88.1", "bbox": {"l": 261.86804, "t": 318.91953, "r": 276.34879, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Title", "bbox": {"l": 67.663002, "t": 329.87854, "r": 84.654327, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "60-72", "bbox": {"l": 135.32401, "t": 329.87854, "r": 155.03215, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "76.7", "bbox": {"l": 167.95399, "t": 329.87854, "r": 182.43472, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "80.4", "bbox": {"l": 194.0462, "t": 329.87854, "r": 208.52695, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "79.9", "bbox": {"l": 226.86324000000002, "t": 329.87854, "r": 241.34396, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "82.7", "bbox": {"l": 261.86804, "t": 329.87854, "r": 276.34879, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "All", "bbox": {"l": 67.663002, "t": 341.23654, "r": 78.628906, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "82-83", "bbox": {"l": 135.32401, "t": 341.23654, "r": 155.03215, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "72.4", "bbox": {"l": 167.95399, "t": 341.23654, "r": 182.43472, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "73.5", "bbox": {"l": 194.0462, "t": 341.23654, "r": 208.52695, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "73.4", "bbox": {"l": 226.86324000000002, "t": 341.23654, "r": 241.34396, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "76.8", "bbox": {"l": 261.86804, "t": 341.23654, "r": 276.34879, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": [{"id": 12, "label": "text", "bbox": {"l": 132.36501, "t": 197.97351000000003, "r": 157.99098, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "human", "bbox": {"l": 132.36501, "t": 197.97351000000003, "r": 157.99098, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 173.505, "t": 197.97351000000003, "r": 204.61841, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "MRCNN", "bbox": {"l": 173.505, "t": 197.97351000000003, "r": 204.61841, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 220.13028, "t": 197.97351000000003, "r": 248.06958, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "FRCNN", "bbox": {"l": 220.13028, "t": 197.97351000000003, "r": 248.06958, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 258.03125, "t": 197.97351000000003, "r": 280.17825, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "YOLO", "bbox": {"l": 258.03125, "t": 197.97351000000003, "r": 280.17825, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 168.39301, "t": 208.93255999999997, "r": 181.99504, "b": 217.30719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "R50", "bbox": {"l": 168.39301, "t": 208.93255999999997, "r": 181.99504, "b": 217.30719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 192.39606, "t": 208.93255999999997, "r": 210.16747, "b": 217.30719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "R101", "bbox": {"l": 192.39606, "t": 208.93255999999997, "r": 210.16747, "b": 217.30719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 225.21309, "t": 208.93255999999997, "r": 242.9845, "b": 217.30719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "R101", "bbox": {"l": 225.21309, "t": 208.93255999999997, "r": 242.9845, "b": 217.30719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 260.51379, "t": 208.93255999999997, "r": 277.70239, "b": 217.30719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "v5x6", "bbox": {"l": 260.51379, "t": 208.93255999999997, "r": 277.70239, "b": 217.30719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 67.663002, "t": 220.28954999999996, "r": 96.848633, "b": 228.66418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "Caption", "bbox": {"l": 67.663002, "t": 220.28954999999996, "r": 96.848633, "b": 228.66418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 135.32401, "t": 220.28954999999996, "r": 155.03215, "b": 228.66418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "84-89", "bbox": {"l": 135.32401, "t": 220.28954999999996, "r": 155.03215, "b": 228.66418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 167.95399, "t": 220.28954999999996, "r": 182.43472, "b": 228.66418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "68.4", "bbox": {"l": 167.95399, "t": 220.28954999999996, "r": 182.43472, "b": 228.66418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 194.0462, "t": 220.28954999999996, "r": 208.52695, "b": 228.66418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "71.5", "bbox": {"l": 194.0462, "t": 220.28954999999996, "r": 208.52695, "b": 228.66418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 226.86324000000002, "t": 220.28954999999996, "r": 241.34396, "b": 228.66418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "70.1", "bbox": {"l": 226.86324000000002, "t": 220.28954999999996, "r": 241.34396, "b": 228.66418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 261.86804, "t": 220.28954999999996, "r": 276.34879, "b": 228.66418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "77.7", "bbox": {"l": 261.86804, "t": 220.28954999999996, "r": 276.34879, "b": 228.66418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 67.663002, "t": 231.24854000000005, "r": 100.1662, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "Footnote", "bbox": {"l": 67.663002, "t": 231.24854000000005, "r": 100.1662, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 135.32401, "t": 231.24854000000005, "r": 155.03215, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "83-91", "bbox": {"l": 135.32401, "t": 231.24854000000005, "r": 155.03215, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 167.95399, "t": 231.24854000000005, "r": 182.43472, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "70.9", "bbox": {"l": 167.95399, "t": 231.24854000000005, "r": 182.43472, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 194.0462, "t": 231.24854000000005, "r": 208.52695, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "71.8", "bbox": {"l": 194.0462, "t": 231.24854000000005, "r": 208.52695, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 226.86324000000002, "t": 231.24854000000005, "r": 241.34396, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "73.7", "bbox": {"l": 226.86324000000002, "t": 231.24854000000005, "r": 241.34396, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 261.86804, "t": 231.24854000000005, "r": 276.34879, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "77.2", "bbox": {"l": 261.86804, "t": 231.24854000000005, "r": 276.34879, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 67.663002, "t": 242.20752000000005, "r": 98.175659, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "Formula", "bbox": {"l": 67.663002, "t": 242.20752000000005, "r": 98.175659, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 135.32401, "t": 242.20752000000005, "r": 155.03215, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "83-85", "bbox": {"l": 135.32401, "t": 242.20752000000005, "r": 155.03215, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 167.95399, "t": 242.20752000000005, "r": 182.43472, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "60.1", "bbox": {"l": 167.95399, "t": 242.20752000000005, "r": 182.43472, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 194.0462, "t": 242.20752000000005, "r": 208.52695, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "63.4", "bbox": {"l": 194.0462, "t": 242.20752000000005, "r": 208.52695, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 226.86324000000002, "t": 242.20752000000005, "r": 241.34396, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "63.5", "bbox": {"l": 226.86324000000002, "t": 242.20752000000005, "r": 241.34396, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 261.86804, "t": 242.20752000000005, "r": 276.34879, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "66.2", "bbox": {"l": 261.86804, "t": 242.20752000000005, "r": 276.34879, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 67.663002, "t": 253.16656, "r": 100.54279, "b": 261.5412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "List-item", "bbox": {"l": 67.663002, "t": 253.16656, "r": 100.54279, "b": 261.5412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 135.32401, "t": 253.16656, "r": 155.03215, "b": 261.5412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "87-88", "bbox": {"l": 135.32401, "t": 253.16656, "r": 155.03215, "b": 261.5412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 167.95399, "t": 253.16656, "r": 182.43472, "b": 261.5412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "81.2", "bbox": {"l": 167.95399, "t": 253.16656, "r": 182.43472, "b": 261.5412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 194.0462, "t": 253.16656, "r": 208.52695, "b": 261.5412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "80.8", "bbox": {"l": 194.0462, "t": 253.16656, "r": 208.52695, "b": 261.5412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 226.86324000000002, "t": 253.16656, "r": 241.34396, "b": 261.5412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "81.0", "bbox": {"l": 226.86324000000002, "t": 253.16656, "r": 241.34396, "b": 261.5412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 261.86804, "t": 253.16656, "r": 276.34879, "b": 261.5412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "86.2", "bbox": {"l": 261.86804, "t": 253.16656, "r": 276.34879, "b": 261.5412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 67.663002, "t": 264.12555, "r": 110.19064, "b": 272.50018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "Page-footer", "bbox": {"l": 67.663002, "t": 264.12555, "r": 110.19064, "b": 272.50018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 135.32401, "t": 264.12555, "r": 155.03215, "b": 272.50018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "93-94", "bbox": {"l": 135.32401, "t": 264.12555, "r": 155.03215, "b": 272.50018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 167.95399, "t": 264.12555, "r": 182.43472, "b": 272.50018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "61.6", "bbox": {"l": 167.95399, "t": 264.12555, "r": 182.43472, "b": 272.50018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 194.0462, "t": 264.12555, "r": 208.52695, "b": 272.50018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "59.3", "bbox": {"l": 194.0462, "t": 264.12555, "r": 208.52695, "b": 272.50018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 226.86324000000002, "t": 264.12555, "r": 241.34396, "b": 272.50018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "58.9", "bbox": {"l": 226.86324000000002, "t": 264.12555, "r": 241.34396, "b": 272.50018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 261.86804, "t": 264.12555, "r": 276.34879, "b": 272.50018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "61.1", "bbox": {"l": 261.86804, "t": 264.12555, "r": 276.34879, "b": 272.50018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 67.663002, "t": 275.08453, "r": 112.94331999999999, "b": 283.45917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "Page-header", "bbox": {"l": 67.663002, "t": 275.08453, "r": 112.94331999999999, "b": 283.45917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 135.32401, "t": 275.08453, "r": 155.03215, "b": 283.45917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "85-89", "bbox": {"l": 135.32401, "t": 275.08453, "r": 155.03215, "b": 283.45917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 167.95399, "t": 275.08453, "r": 182.43472, "b": 283.45917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "71.9", "bbox": {"l": 167.95399, "t": 275.08453, "r": 182.43472, "b": 283.45917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 194.0462, "t": 275.08453, "r": 208.52695, "b": 283.45917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "70.0", "bbox": {"l": 194.0462, "t": 275.08453, "r": 208.52695, "b": 283.45917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 226.86324000000002, "t": 275.08453, "r": 241.34396, "b": 283.45917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "72.0", "bbox": {"l": 226.86324000000002, "t": 275.08453, "r": 241.34396, "b": 283.45917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 261.86804, "t": 275.08453, "r": 276.34879, "b": 283.45917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "67.9", "bbox": {"l": 261.86804, "t": 275.08453, "r": 276.34879, "b": 283.45917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 67.663002, "t": 286.04355000000004, "r": 93.647629, "b": 294.41818, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "Picture", "bbox": {"l": 67.663002, "t": 286.04355000000004, "r": 93.647629, "b": 294.41818, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 135.32401, "t": 286.04355000000004, "r": 155.03215, "b": 294.41818, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "69-71", "bbox": {"l": 135.32401, "t": 286.04355000000004, "r": 155.03215, "b": 294.41818, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 167.95399, "t": 286.04355000000004, "r": 182.43472, "b": 294.41818, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "71.7", "bbox": {"l": 167.95399, "t": 286.04355000000004, "r": 182.43472, "b": 294.41818, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 194.0462, "t": 286.04355000000004, "r": 208.52695, "b": 294.41818, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "72.7", "bbox": {"l": 194.0462, "t": 286.04355000000004, "r": 208.52695, "b": 294.41818, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 226.86324000000002, "t": 286.04355000000004, "r": 241.34396, "b": 294.41818, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "72.0", "bbox": {"l": 226.86324000000002, "t": 286.04355000000004, "r": 241.34396, "b": 294.41818, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 261.86804, "t": 286.04355000000004, "r": 276.34879, "b": 294.41818, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "77.1", "bbox": {"l": 261.86804, "t": 286.04355000000004, "r": 276.34879, "b": 294.41818, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 67.663002, "t": 297.00253, "r": 122.40287999999998, "b": 305.37717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "Section-header", "bbox": {"l": 67.663002, "t": 297.00253, "r": 122.40287999999998, "b": 305.37717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 135.32401, "t": 297.00253, "r": 155.03215, "b": 305.37717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "83-84", "bbox": {"l": 135.32401, "t": 297.00253, "r": 155.03215, "b": 305.37717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 167.95399, "t": 297.00253, "r": 182.43472, "b": 305.37717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "67.6", "bbox": {"l": 167.95399, "t": 297.00253, "r": 182.43472, "b": 305.37717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 194.0462, "t": 297.00253, "r": 208.52695, "b": 305.37717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "69.3", "bbox": {"l": 194.0462, "t": 297.00253, "r": 208.52695, "b": 305.37717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 226.86324000000002, "t": 297.00253, "r": 241.34396, "b": 305.37717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "68.4", "bbox": {"l": 226.86324000000002, "t": 297.00253, "r": 241.34396, "b": 305.37717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 261.86804, "t": 297.00253, "r": 276.34879, "b": 305.37717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "74.6", "bbox": {"l": 261.86804, "t": 297.00253, "r": 276.34879, "b": 305.37717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 67.663002, "t": 307.96155, "r": 87.46978, "b": 316.33618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "Table", "bbox": {"l": 67.663002, "t": 307.96155, "r": 87.46978, "b": 316.33618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 135.32401, "t": 307.96155, "r": 155.03215, "b": 316.33618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "77-81", "bbox": {"l": 135.32401, "t": 307.96155, "r": 155.03215, "b": 316.33618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 167.95399, "t": 307.96155, "r": 182.43472, "b": 316.33618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "82.2", "bbox": {"l": 167.95399, "t": 307.96155, "r": 182.43472, "b": 316.33618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 194.0462, "t": 307.96155, "r": 208.52695, "b": 316.33618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "82.9", "bbox": {"l": 194.0462, "t": 307.96155, "r": 208.52695, "b": 316.33618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 226.86324000000002, "t": 307.96155, "r": 241.34396, "b": 316.33618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "82.2", "bbox": {"l": 226.86324000000002, "t": 307.96155, "r": 241.34396, "b": 316.33618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 261.86804, "t": 307.96155, "r": 276.34879, "b": 316.33618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "86.3", "bbox": {"l": 261.86804, "t": 307.96155, "r": 276.34879, "b": 316.33618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 67.663002, "t": 318.91953, "r": 83.623199, "b": 327.29416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "Text", "bbox": {"l": 67.663002, "t": 318.91953, "r": 83.623199, "b": 327.29416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 135.32401, "t": 318.91953, "r": 155.03215, "b": 327.29416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "84-86", "bbox": {"l": 135.32401, "t": 318.91953, "r": 155.03215, "b": 327.29416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 167.95399, "t": 318.91953, "r": 182.43472, "b": 327.29416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "84.6", "bbox": {"l": 167.95399, "t": 318.91953, "r": 182.43472, "b": 327.29416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 194.0462, "t": 318.91953, "r": 208.52695, "b": 327.29416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "85.8", "bbox": {"l": 194.0462, "t": 318.91953, "r": 208.52695, "b": 327.29416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 226.86324000000002, "t": 318.91953, "r": 241.34396, "b": 327.29416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "85.4", "bbox": {"l": 226.86324000000002, "t": 318.91953, "r": 241.34396, "b": 327.29416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 261.86804, "t": 318.91953, "r": 276.34879, "b": 327.29416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "88.1", "bbox": {"l": 261.86804, "t": 318.91953, "r": 276.34879, "b": 327.29416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 67.663002, "t": 329.87854, "r": 84.654327, "b": 338.25317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "Title", "bbox": {"l": 67.663002, "t": 329.87854, "r": 84.654327, "b": 338.25317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 135.32401, "t": 329.87854, "r": 155.03215, "b": 338.25317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "60-72", "bbox": {"l": 135.32401, "t": 329.87854, "r": 155.03215, "b": 338.25317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 167.95399, "t": 329.87854, "r": 182.43472, "b": 338.25317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "76.7", "bbox": {"l": 167.95399, "t": 329.87854, "r": 182.43472, "b": 338.25317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 194.0462, "t": 329.87854, "r": 208.52695, "b": 338.25317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "80.4", "bbox": {"l": 194.0462, "t": 329.87854, "r": 208.52695, "b": 338.25317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 226.86324000000002, "t": 329.87854, "r": 241.34396, "b": 338.25317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "79.9", "bbox": {"l": 226.86324000000002, "t": 329.87854, "r": 241.34396, "b": 338.25317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 261.86804, "t": 329.87854, "r": 276.34879, "b": 338.25317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "82.7", "bbox": {"l": 261.86804, "t": 329.87854, "r": 276.34879, "b": 338.25317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 67.663002, "t": 341.23654, "r": 78.628906, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "All", "bbox": {"l": 67.663002, "t": 341.23654, "r": 78.628906, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 135.32401, "t": 341.23654, "r": 155.03215, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "82-83", "bbox": {"l": 135.32401, "t": 341.23654, "r": 155.03215, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 167.95399, "t": 341.23654, "r": 182.43472, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "72.4", "bbox": {"l": 167.95399, "t": 341.23654, "r": 182.43472, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 194.0462, "t": 341.23654, "r": 208.52695, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "73.5", "bbox": {"l": 194.0462, "t": 341.23654, "r": 208.52695, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 226.86324000000002, "t": 341.23654, "r": 241.34396, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "73.4", "bbox": {"l": 226.86324000000002, "t": 341.23654, "r": 241.34396, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 261.86804, "t": 341.23654, "r": 276.34879, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "76.8", "bbox": {"l": 261.86804, "t": 341.23654, "r": 276.34879, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ecel", "ched", "ched", "lcel", "ched", "ched", "nl", "ecel", "ucel", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 14, "num_cols": 6, "table_cells": [{"bbox": {"l": 132.36501, "t": 197.97351000000003, "r": 157.99098, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "human", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 173.505, "t": 197.97351000000003, "r": 204.61841, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 4, "text": "MRCNN", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 220.13028, "t": 197.97351000000003, "r": 248.06958, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "FRCNN", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 258.03125, "t": 197.97351000000003, "r": 280.17825, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "YOLO", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 168.39301, "t": 208.93255999999997, "r": 181.99504, "b": 217.30719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "R50", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 192.39606, "t": 208.93255999999997, "r": 210.16747, "b": 217.30719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "R101", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 225.21309, "t": 208.93255999999997, "r": 242.9845, "b": 217.30719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "R101", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 260.51379, "t": 208.93255999999997, "r": 277.70239, "b": 217.30719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "v5x6", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 220.28954999999996, "r": 96.848633, "b": 228.66418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Caption", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 220.28954999999996, "r": 155.03215, "b": 228.66418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "84-89", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 220.28954999999996, "r": 182.43472, "b": 228.66418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "68.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 220.28954999999996, "r": 208.52695, "b": 228.66418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "71.5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 220.28954999999996, "r": 241.34396, "b": 228.66418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "70.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 220.28954999999996, "r": 276.34879, "b": 228.66418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "77.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 231.24854000000005, "r": 100.1662, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Footnote", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 231.24854000000005, "r": 155.03215, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "83-91", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 231.24854000000005, "r": 182.43472, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "70.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 231.24854000000005, "r": 208.52695, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "71.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 231.24854000000005, "r": 241.34396, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "73.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 231.24854000000005, "r": 276.34879, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "77.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 242.20752000000005, "r": 98.175659, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Formula", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 242.20752000000005, "r": 155.03215, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "83-85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 242.20752000000005, "r": 182.43472, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "60.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 242.20752000000005, "r": 208.52695, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "63.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 242.20752000000005, "r": 241.34396, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "63.5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 242.20752000000005, "r": 276.34879, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "66.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 253.16656, "r": 100.54279, "b": 261.5412, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "List-item", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 253.16656, "r": 155.03215, "b": 261.5412, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "87-88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 253.16656, "r": 182.43472, "b": 261.5412, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "81.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 253.16656, "r": 208.52695, "b": 261.5412, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "80.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 253.16656, "r": 241.34396, "b": 261.5412, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "81.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 253.16656, "r": 276.34879, "b": 261.5412, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "86.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 264.12555, "r": 110.19064, "b": 272.50018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-footer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 264.12555, "r": 155.03215, "b": 272.50018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "93-94", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 264.12555, "r": 182.43472, "b": 272.50018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "61.6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 264.12555, "r": 208.52695, "b": 272.50018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "59.3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 264.12555, "r": 241.34396, "b": 272.50018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "58.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 264.12555, "r": 276.34879, "b": 272.50018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "61.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 275.08453, "r": 112.94331999999999, "b": 283.45917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 275.08453, "r": 155.03215, "b": 283.45917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "85-89", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 275.08453, "r": 182.43472, "b": 283.45917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "71.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 275.08453, "r": 208.52695, "b": 283.45917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "70.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 275.08453, "r": 241.34396, "b": 283.45917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "72.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 275.08453, "r": 276.34879, "b": 283.45917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "67.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 286.04355000000004, "r": 93.647629, "b": 294.41818, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Picture", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 286.04355000000004, "r": 155.03215, "b": 294.41818, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "69-71", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 286.04355000000004, "r": 182.43472, "b": 294.41818, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "71.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 286.04355000000004, "r": 208.52695, "b": 294.41818, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "72.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 286.04355000000004, "r": 241.34396, "b": 294.41818, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "72.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 286.04355000000004, "r": 276.34879, "b": 294.41818, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "77.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 297.00253, "r": 122.40287999999998, "b": 305.37717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Section-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 297.00253, "r": 155.03215, "b": 305.37717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "83-84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 297.00253, "r": 182.43472, "b": 305.37717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "67.6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 297.00253, "r": 208.52695, "b": 305.37717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "69.3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 297.00253, "r": 241.34396, "b": 305.37717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "68.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 297.00253, "r": 276.34879, "b": 305.37717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "74.6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 307.96155, "r": 87.46978, "b": 316.33618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 307.96155, "r": 155.03215, "b": 316.33618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "77-81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 307.96155, "r": 182.43472, "b": 316.33618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "82.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 307.96155, "r": 208.52695, "b": 316.33618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "82.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 307.96155, "r": 241.34396, "b": 316.33618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "82.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 307.96155, "r": 276.34879, "b": 316.33618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "86.3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 318.91953, "r": 83.623199, "b": 327.29416, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Text", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 318.91953, "r": 155.03215, "b": 327.29416, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "84-86", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 318.91953, "r": 182.43472, "b": 327.29416, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "84.6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 318.91953, "r": 208.52695, "b": 327.29416, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "85.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 318.91953, "r": 241.34396, "b": 327.29416, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "85.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 318.91953, "r": 276.34879, "b": 327.29416, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "88.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 329.87854, "r": 84.654327, "b": 338.25317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Title", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 329.87854, "r": 155.03215, "b": 338.25317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "60-72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 329.87854, "r": 182.43472, "b": 338.25317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "76.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 329.87854, "r": 208.52695, "b": 338.25317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "80.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 329.87854, "r": 241.34396, "b": 338.25317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "79.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 329.87854, "r": 276.34879, "b": 338.25317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "82.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 341.23654, "r": 78.628906, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "All", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 341.23654, "r": 155.03215, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "82-83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 341.23654, "r": 182.43472, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "72.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 341.23654, "r": 208.52695, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "73.5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 341.23654, "r": 241.34396, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "73.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 341.23654, "r": 276.34879, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "76.8", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "text", "id": 4, "page_no": 5, "cluster": {"id": 4, "label": "text", "bbox": {"l": 53.528999, "t": 370.92755, "r": 295.55612, "b": 576.56317, "coord_origin": "TOPLEFT"}, "confidence": 0.9866557121276855, "cells": [{"id": 93, "text": "to avoid this at any cost in order to have clear, unbiased baseline", "bbox": {"l": 53.79800000000001, "t": 370.92755, "r": 294.04712, "b": 379.30219000000005, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "numbers for human document-layout annotation. Third, we in-", "bbox": {"l": 53.79800000000001, "t": 381.88654, "r": 295.55612, "b": 390.26117, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "troduced the feature of", "bbox": {"l": 53.79800000000001, "t": 392.84555, "r": 140.3623, "b": 401.22017999999997, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "snapping", "bbox": {"l": 142.99001, "t": 392.89041, "r": 175.9695, "b": 401.2291599999999, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "boxes around text segments to", "bbox": {"l": 178.951, "t": 392.84555, "r": 294.04083, "b": 401.22017999999997, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "obtain a pixel-accurate annotation and again reduce time and effort.", "bbox": {"l": 53.79800000000001, "t": 403.80453, "r": 295.42493, "b": 412.17917, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "The CCS annotation tool automatically shrinks every user-drawn", "bbox": {"l": 53.528999, "t": 414.76355, "r": 294.04251, "b": 423.13818, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "box to the minimum bounding-box around the enclosed text-cells", "bbox": {"l": 53.79800000000001, "t": 425.72253, "r": 294.04807, "b": 434.09717, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "for all purely text-based segments, which excludes only", "bbox": {"l": 53.79800000000001, "t": 436.6815500000001, "r": 256.80627, "b": 445.0561799999999, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "Table", "bbox": {"l": 259.04199, "t": 436.72641, "r": 278.10455, "b": 445.06516, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "and", "bbox": {"l": 280.54999, "t": 436.6815500000001, "r": 294.04443, "b": 445.0561799999999, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "Picture", "bbox": {"l": 53.79800000000001, "t": 447.68539, "r": 78.875587, "b": 456.02413999999993, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": ". For the latter, we instructed annotation staff to minimise", "bbox": {"l": 78.876999, "t": 447.64053, "r": 294.04852, "b": 456.01517, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "inclusion of surrounding whitespace while including all graphical", "bbox": {"l": 53.79800000000001, "t": 458.59955, "r": 294.04645, "b": 466.97418, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "lines. A downside of snapping boxes to enclosed text cells is that", "bbox": {"l": 53.79800000000001, "t": 469.55853, "r": 294.0416, "b": 477.93317, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "some wrongly parsed PDF pages cannot be annotated correctly and", "bbox": {"l": 53.79800000000001, "t": 480.51654, "r": 294.04538, "b": 488.89117, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "need to be skipped. Fourth, we established a way to flag pages as", "bbox": {"l": 53.79800000000001, "t": 491.47552, "r": 294.04312, "b": 499.85016, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "rejected", "bbox": {"l": 53.79800000000001, "t": 502.4794, "r": 80.597939, "b": 510.81815, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "for cases where no valid annotation according to the label", "bbox": {"l": 83.366997, "t": 502.43454, "r": 294.04483, "b": 510.80917, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "guidelines could be achieved. Example cases for this would be PDF", "bbox": {"l": 53.79800000000001, "t": 513.3935200000001, "r": 294.25833, "b": 521.7681600000001, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "pages that render incorrectly or contain layouts that are impossible", "bbox": {"l": 53.79800000000001, "t": 524.35254, "r": 294.04535, "b": 532.72717, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "to capture with non-overlapping rectangles. Such rejected pages are", "bbox": {"l": 53.79800000000001, "t": 535.31155, "r": 294.04535, "b": 543.68617, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "not contained in the final dataset. With all these measures in place,", "bbox": {"l": 53.79800000000001, "t": 546.27055, "r": 295.02759, "b": 554.64517, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "experienced annotation staff managed to annotate a single page in", "bbox": {"l": 53.79800000000001, "t": 557.22955, "r": 294.0488, "b": 565.6041700000001, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "a typical timeframe of 20s to 60s, depending on its complexity.", "bbox": {"l": 53.79800000000001, "t": 568.18855, "r": 281.80457, "b": 576.56317, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "to avoid this at any cost in order to have clear, unbiased baseline numbers for human document-layout annotation. Third, we introduced the feature of snapping boxes around text segments to obtain a pixel-accurate annotation and again reduce time and effort. The CCS annotation tool automatically shrinks every user-drawn box to the minimum bounding-box around the enclosed text-cells for all purely text-based segments, which excludes only Table and Picture . For the latter, we instructed annotation staff to minimise inclusion of surrounding whitespace while including all graphical lines. A downside of snapping boxes to enclosed text cells is that some wrongly parsed PDF pages cannot be annotated correctly and need to be skipped. Fourth, we established a way to flag pages as rejected for cases where no valid annotation according to the label guidelines could be achieved. Example cases for this would be PDF pages that render incorrectly or contain layouts that are impossible to capture with non-overlapping rectangles. Such rejected pages are not contained in the final dataset. With all these measures in place, experienced annotation staff managed to annotate a single page in a typical timeframe of 20s to 60s, depending on its complexity."}, {"label": "section_header", "id": 10, "page_no": 5, "cluster": {"id": 10, "label": "section_header", "bbox": {"l": 53.79800000000001, "t": 588.12991, "r": 147.48535, "b": 598.43901, "coord_origin": "TOPLEFT"}, "confidence": 0.9419495463371277, "cells": [{"id": 118, "text": "5", "bbox": {"l": 53.79800000000001, "t": 588.12991, "r": 59.405277, "b": 598.43901, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "EXPERIMENTS", "bbox": {"l": 70.314377, "t": 588.12991, "r": 147.48535, "b": 598.43901, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5 EXPERIMENTS"}, {"label": "text", "id": 2, "page_no": 5, "cluster": {"id": 2, "label": "text", "bbox": {"l": 53.484001, "t": 613.25356, "r": 295.4281, "b": 709.299171, "coord_origin": "TOPLEFT"}, "confidence": 0.987605094909668, "cells": [{"id": 120, "text": "The primary goal of DocLayNet is to obtain high-quality ML models", "bbox": {"l": 53.528999, "t": 613.25356, "r": 294.04871, "b": 621.6281700000001, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "capable of accurate document-layout analysis on a wide variety", "bbox": {"l": 53.79800000000001, "t": 624.21255, "r": 294.27576, "b": 632.58717, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "of challenging layouts. As discussed in Section 2, object detection", "bbox": {"l": 53.79800000000001, "t": 635.17155, "r": 294.04144, "b": 643.54617, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "models are currently the easiest to use, due to the standardisation", "bbox": {"l": 53.79800000000001, "t": 646.13055, "r": 294.04163, "b": 654.50517, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "of ground-truth data in COCO format [16] and the availability of", "bbox": {"l": 53.79800000000001, "t": 657.0885499999999, "r": 294.0412, "b": 665.46317, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "general frameworks such as", "bbox": {"l": 53.79800000000001, "t": 668.04755, "r": 155.01054, "b": 676.42217, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "detectron2", "bbox": {"l": 157.23599, "t": 668.09238, "r": 193.26666, "b": 676.43114, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "[17]. Furthermore, baseline", "bbox": {"l": 195.867, "t": 668.04755, "r": 294.0473, "b": 676.42217, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "numbers in PubLayNet and DocBank were obtained using standard", "bbox": {"l": 53.79800000000001, "t": 679.0065500000001, "r": 294.04538, "b": 687.38117, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "object detection models such as Mask R-CNN and Faster R-CNN.", "bbox": {"l": 53.79800000000001, "t": 689.96555, "r": 295.4281, "b": 698.3401719999999, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "As such, we will relate to these object detection methods in this", "bbox": {"l": 53.484001, "t": 700.9245530000001, "r": 294.04413, "b": 709.299171, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The primary goal of DocLayNet is to obtain high-quality ML models capable of accurate document-layout analysis on a wide variety of challenging layouts. As discussed in Section 2, object detection models are currently the easiest to use, due to the standardisation of ground-truth data in COCO format [16] and the availability of general frameworks such as detectron2 [17]. Furthermore, baseline numbers in PubLayNet and DocBank were obtained using standard object detection models such as Mask R-CNN and Faster R-CNN. As such, we will relate to these object detection methods in this"}, {"label": "picture", "id": 6, "page_no": 5, "cluster": {"id": 6, "label": "picture", "bbox": {"l": 323.48431396484375, "t": 89.88603210449219, "r": 553.5411376953125, "b": 260.0107727050781, "coord_origin": "TOPLEFT"}, "confidence": 0.9782691597938538, "cells": [{"id": 131, "text": "0", "bbox": {"l": 349.16577, "t": 246.68017999999995, "r": 352.48175, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "20", "bbox": {"l": 385.93698, "t": 246.68017999999995, "r": 392.56894, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "40", "bbox": {"l": 424.366, "t": 246.68017999999995, "r": 430.99796, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "60", "bbox": {"l": 462.79504000000003, "t": 246.68017999999995, "r": 469.427, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "80", "bbox": {"l": 501.22406, "t": 246.68017999999995, "r": 507.85602, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "100", "bbox": {"l": 537.99524, "t": 246.68017999999995, "r": 547.94318, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "% of DocLayNet training set", "bbox": {"l": 410.28143, "t": 253.80840999999998, "r": 483.47278000000006, "b": 259.88251, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "50", "bbox": {"l": 330.93539, "t": 218.38464, "r": 337.56735, "b": 224.45874000000003, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "55", "bbox": {"l": 330.93539, "t": 192.08660999999995, "r": 337.56735, "b": 198.16071, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "60", "bbox": {"l": 330.93539, "t": 165.78864, "r": 337.56735, "b": 171.86273000000006, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "65", "bbox": {"l": 330.93539, "t": 139.49059999999997, "r": 337.56735, "b": 145.56470000000002, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "70", "bbox": {"l": 330.93539, "t": 113.19263000000001, "r": 337.56735, "b": 119.26671999999996, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "mAP 0.50:0.95", "bbox": {"l": 322.92276, "t": 148.37689, "r": 328.99686, "b": 186.79218000000003, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "10", "bbox": {"l": 470.97235, "t": 235.36676, "r": 477.6055, "b": 241.44086000000004, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "1", "bbox": {"l": 477.65662, "t": 234.82390999999996, "r": 479.97778000000005, "b": 239.07581000000005, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "10", "bbox": {"l": 531.55127, "t": 235.41234999999995, "r": 538.18445, "b": 241.48645, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "2", "bbox": {"l": 538.23553, "t": 234.86951, "r": 540.5567, "b": 239.1214, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "50", "bbox": {"l": 404.91125, "t": 216.00005999999996, "r": 411.54321, "b": 222.07416, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "55", "bbox": {"l": 404.91125, "t": 200.22125000000005, "r": 411.54321, "b": 206.29534999999998, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "60", "bbox": {"l": 404.91125, "t": 184.44244000000003, "r": 411.54321, "b": 190.51653999999996, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "65", "bbox": {"l": 404.91125, "t": 168.66364, "r": 411.54321, "b": 174.73773000000006, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "70", "bbox": {"l": 404.91125, "t": 152.88489000000004, "r": 411.54321, "b": 158.95898, "coord_origin": "TOPLEFT"}}], "children": [{"id": 92, "label": "text", "bbox": {"l": 349.16577, "t": 246.68017999999995, "r": 352.48175, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 131, "text": "0", "bbox": {"l": 349.16577, "t": 246.68017999999995, "r": 352.48175, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 385.93698, "t": 246.68017999999995, "r": 392.56894, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 132, "text": "20", "bbox": {"l": 385.93698, "t": 246.68017999999995, "r": 392.56894, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 424.366, "t": 246.68017999999995, "r": 430.99796, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 133, "text": "40", "bbox": {"l": 424.366, "t": 246.68017999999995, "r": 430.99796, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 462.79504000000003, "t": 246.68017999999995, "r": 469.427, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 134, "text": "60", "bbox": {"l": 462.79504000000003, "t": 246.68017999999995, "r": 469.427, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 501.22406, "t": 246.68017999999995, "r": 507.85602, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 135, "text": "80", "bbox": {"l": 501.22406, "t": 246.68017999999995, "r": 507.85602, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 537.99524, "t": 246.68017999999995, "r": 547.94318, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 136, "text": "100", "bbox": {"l": 537.99524, "t": 246.68017999999995, "r": 547.94318, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 410.28143, "t": 253.80840999999998, "r": 483.47278000000006, "b": 259.88251, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 137, "text": "% of DocLayNet training set", "bbox": {"l": 410.28143, "t": 253.80840999999998, "r": 483.47278000000006, "b": 259.88251, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 330.93539, "t": 218.38464, "r": 337.56735, "b": 224.45874000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 138, "text": "50", "bbox": {"l": 330.93539, "t": 218.38464, "r": 337.56735, "b": 224.45874000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 330.93539, "t": 192.08660999999995, "r": 337.56735, "b": 198.16071, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 139, "text": "55", "bbox": {"l": 330.93539, "t": 192.08660999999995, "r": 337.56735, "b": 198.16071, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 330.93539, "t": 165.78864, "r": 337.56735, "b": 171.86273000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 140, "text": "60", "bbox": {"l": 330.93539, "t": 165.78864, "r": 337.56735, "b": 171.86273000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 330.93539, "t": 139.49059999999997, "r": 337.56735, "b": 145.56470000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 141, "text": "65", "bbox": {"l": 330.93539, "t": 139.49059999999997, "r": 337.56735, "b": 145.56470000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 330.93539, "t": 113.19263000000001, "r": 337.56735, "b": 119.26671999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 142, "text": "70", "bbox": {"l": 330.93539, "t": 113.19263000000001, "r": 337.56735, "b": 119.26671999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 322.92276, "t": 148.37689, "r": 328.99686, "b": 186.79218000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 143, "text": "mAP 0.50:0.95", "bbox": {"l": 322.92276, "t": 148.37689, "r": 328.99686, "b": 186.79218000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 470.97235, "t": 235.36676, "r": 477.6055, "b": 241.44086000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 144, "text": "10", "bbox": {"l": 470.97235, "t": 235.36676, "r": 477.6055, "b": 241.44086000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 477.65662, "t": 234.82390999999996, "r": 479.97778000000005, "b": 239.07581000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 145, "text": "1", "bbox": {"l": 477.65662, "t": 234.82390999999996, "r": 479.97778000000005, "b": 239.07581000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 531.55127, "t": 235.41234999999995, "r": 538.18445, "b": 241.48645, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 146, "text": "10", "bbox": {"l": 531.55127, "t": 235.41234999999995, "r": 538.18445, "b": 241.48645, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 538.23553, "t": 234.86951, "r": 540.5567, "b": 239.1214, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 147, "text": "2", "bbox": {"l": 538.23553, "t": 234.86951, "r": 540.5567, "b": 239.1214, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 404.91125, "t": 216.00005999999996, "r": 411.54321, "b": 222.07416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 148, "text": "50", "bbox": {"l": 404.91125, "t": 216.00005999999996, "r": 411.54321, "b": 222.07416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 404.91125, "t": 200.22125000000005, "r": 411.54321, "b": 206.29534999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 149, "text": "55", "bbox": {"l": 404.91125, "t": 200.22125000000005, "r": 411.54321, "b": 206.29534999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 404.91125, "t": 184.44244000000003, "r": 411.54321, "b": 190.51653999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 150, "text": "60", "bbox": {"l": 404.91125, "t": 184.44244000000003, "r": 411.54321, "b": 190.51653999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 404.91125, "t": 168.66364, "r": 411.54321, "b": 174.73773000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 151, "text": "65", "bbox": {"l": 404.91125, "t": 168.66364, "r": 411.54321, "b": 174.73773000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 404.91125, "t": 152.88489000000004, "r": 411.54321, "b": 158.95898, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 152, "text": "70", "bbox": {"l": 404.91125, "t": 152.88489000000004, "r": 411.54321, "b": 158.95898, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "caption", "id": 7, "page_no": 5, "cluster": {"id": 7, "label": "caption", "bbox": {"l": 317.95499, "t": 279.01599, "r": 559.80579, "b": 342.28418000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9639935493469238, "cells": [{"id": 153, "text": "Figure 5: Prediction performance (mAP@0.5-0.95) of a Mask", "bbox": {"l": 317.95499, "t": 279.01599, "r": 558.47876, "b": 287.48923, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "R-CNN network with ResNet50 backbone trained on increas-", "bbox": {"l": 317.95499, "t": 289.97501, "r": 559.80579, "b": 298.44824, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "ing fractions of the DocLayNet dataset. The learning curve", "bbox": {"l": 317.95499, "t": 300.93399, "r": 558.20068, "b": 309.40723, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "flattens around the 80% mark, indicating that increasing the", "bbox": {"l": 317.95499, "t": 311.89297, "r": 558.20062, "b": 320.36620999999997, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "size of the DocLayNet dataset with similar data will not yield", "bbox": {"l": 317.95499, "t": 322.85196, "r": 558.20074, "b": 331.3252, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "significantly better predictions.", "bbox": {"l": 317.95499, "t": 333.81094, "r": 445.24207, "b": 342.28418000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 5: Prediction performance (mAP@0.5-0.95) of a Mask R-CNN network with ResNet50 backbone trained on increasing fractions of the DocLayNet dataset. The learning curve flattens around the 80% mark, indicating that increasing the size of the DocLayNet dataset with similar data will not yield significantly better predictions."}, {"label": "text", "id": 8, "page_no": 5, "cluster": {"id": 8, "label": "text", "bbox": {"l": 317.95499, "t": 384.01154, "r": 558.20416, "b": 403.34517999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9594221711158752, "cells": [{"id": 159, "text": "paper and leave the detailed evaluation of more recent methods", "bbox": {"l": 317.95499, "t": 384.01154, "r": 558.20416, "b": 392.38617, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "mentioned in Section 2 for future work.", "bbox": {"l": 317.95499, "t": 394.97055, "r": 463.04938, "b": 403.34517999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "paper and leave the detailed evaluation of more recent methods mentioned in Section 2 for future work."}, {"label": "text", "id": 3, "page_no": 5, "cluster": {"id": 3, "label": "text", "bbox": {"l": 317.64099, "t": 405.92953, "r": 558.4364, "b": 480.05716, "coord_origin": "TOPLEFT"}, "confidence": 0.9872915148735046, "cells": [{"id": 161, "text": "In this section, we will present several aspects related to the", "bbox": {"l": 327.918, "t": 405.92953, "r": 558.19836, "b": 414.30417, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "performance of object detection models on DocLayNet. Similarly", "bbox": {"l": 317.95499, "t": 416.88855, "r": 558.4364, "b": 425.26318, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "as in PubLayNet, we will evaluate the quality of their predictions", "bbox": {"l": 317.95499, "t": 427.84653, "r": 558.20563, "b": 436.22116, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "using mean average precision (mAP) with 10 overlaps that range", "bbox": {"l": 317.95499, "t": 438.80554, "r": 558.20044, "b": 447.18018, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "from 0.5 to 0.95 in steps of 0.05 (mAP@0.5-0.95). These scores are", "bbox": {"l": 317.95499, "t": 449.76453000000004, "r": 558.19891, "b": 458.13916, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "computed by leveraging the evaluation code provided by the COCO", "bbox": {"l": 317.95499, "t": 460.72354, "r": 558.20239, "b": 469.09818, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "API [16].", "bbox": {"l": 317.64099, "t": 471.68253, "r": 350.32352, "b": 480.05716, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In this section, we will present several aspects related to the performance of object detection models on DocLayNet. Similarly as in PubLayNet, we will evaluate the quality of their predictions using mean average precision (mAP) with 10 overlaps that range from 0.5 to 0.95 in steps of 0.05 (mAP@0.5-0.95). These scores are computed by leveraging the evaluation code provided by the COCO API [16]."}, {"label": "section_header", "id": 9, "page_no": 5, "cluster": {"id": 9, "label": "section_header", "bbox": {"l": 317.95499, "t": 496.8219, "r": 466.8532400000001, "b": 507.13098, "coord_origin": "TOPLEFT"}, "confidence": 0.9579005241394043, "cells": [{"id": 168, "text": "Baselines for Object Detection", "bbox": {"l": 317.95499, "t": 496.8219, "r": 466.8532400000001, "b": 507.13098, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Baselines for Object Detection"}, {"label": "text", "id": 1, "page_no": 5, "cluster": {"id": 1, "label": "text", "bbox": {"l": 317.74899, "t": 512.02454, "r": 558.43085, "b": 706.700172, "coord_origin": "TOPLEFT"}, "confidence": 0.987722635269165, "cells": [{"id": 169, "text": "In Table 2, we present baseline experiments (given in mAP) on Mask", "bbox": {"l": 317.95499, "t": 512.02454, "r": 558.43085, "b": 520.39917, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "R-CNN [12], Faster R-CNN [11], and YOLOv5 [13]. Both training", "bbox": {"l": 317.95499, "t": 522.9835499999999, "r": 558.20117, "b": 531.35818, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "and evaluation were performed on RGB images with dimensions of", "bbox": {"l": 317.95499, "t": 533.94254, "r": 558.20233, "b": 542.31717, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "1025", "bbox": {"l": 317.74899, "t": 544.90155, "r": 334.09296, "b": 553.27617, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "\u00d7", "bbox": {"l": 334.81201, "t": 544.84775, "r": 340.51465, "b": 552.5499, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "1025 pixels. For training, we only used one annotation in case", "bbox": {"l": 341.233, "t": 544.90155, "r": 558.20117, "b": 553.27617, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "of redundantly annotated pages. As one can observe, the variation", "bbox": {"l": 317.95499, "t": 555.85956, "r": 558.20392, "b": 564.23418, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "in mAP between the models is rather low, but overall between 6", "bbox": {"l": 317.95499, "t": 566.8185599999999, "r": 558.2041, "b": 575.19318, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "and 10% lower than the mAP computed from the pairwise human", "bbox": {"l": 317.95499, "t": 577.77756, "r": 558.2052, "b": 586.15218, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "annotations on triple-annotated pages. This gives a good indication", "bbox": {"l": 317.95499, "t": 588.73656, "r": 558.20233, "b": 597.11118, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "that the DocLayNet dataset poses a worthwhile challenge for the", "bbox": {"l": 317.95499, "t": 599.69556, "r": 558.1983, "b": 608.0701799999999, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "research community to close the gap between human recognition", "bbox": {"l": 317.95499, "t": 610.65456, "r": 558.20502, "b": 619.02917, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "and ML approaches. It is interesting to see that Mask R-CNN and", "bbox": {"l": 317.95499, "t": 621.61356, "r": 558.20337, "b": 629.98817, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "Faster R-CNN produce very comparable mAP scores, indicating", "bbox": {"l": 317.95499, "t": 632.5725600000001, "r": 558.2041, "b": 640.94717, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "that pixel-based image segmentation derived from bounding-boxes", "bbox": {"l": 317.95499, "t": 643.53156, "r": 558.20245, "b": 651.90617, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "does not help to obtain better predictions. On the other hand, the", "bbox": {"l": 317.95499, "t": 654.49055, "r": 558.19757, "b": 662.86517, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": "more recent Yolov5x model does very well and even out-performs", "bbox": {"l": 317.95499, "t": 665.44855, "r": 558.20404, "b": 673.82317, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "humans on selected labels such as", "bbox": {"l": 317.95499, "t": 676.40755, "r": 444.54102, "b": 684.78217, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "Text", "bbox": {"l": 446.78900000000004, "t": 676.45238, "r": 461.95261000000005, "b": 684.79114, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": ",", "bbox": {"l": 461.95599000000004, "t": 676.40755, "r": 463.96805000000006, "b": 684.78217, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "Table", "bbox": {"l": 466.2170100000001, "t": 676.45238, "r": 485.66998000000007, "b": 684.79114, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "and", "bbox": {"l": 488.1290000000001, "t": 676.40755, "r": 501.89330999999993, "b": 684.78217, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "Picture", "bbox": {"l": 504.142, "t": 676.45238, "r": 529.21954, "b": 684.79114, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": ". This is", "bbox": {"l": 529.22101, "t": 676.40755, "r": 558.20392, "b": 684.78217, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "not entirely surprising, as", "bbox": {"l": 317.95499, "t": 687.36655, "r": 410.81366, "b": 695.741173, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "Text", "bbox": {"l": 413.05301, "t": 687.41138, "r": 427.67865, "b": 695.750137, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": ",", "bbox": {"l": 427.67801, "t": 687.36655, "r": 429.62103, "b": 695.741173, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "Table", "bbox": {"l": 431.86099, "t": 687.41138, "r": 450.62881000000004, "b": 695.750137, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "and", "bbox": {"l": 453.082, "t": 687.36655, "r": 466.37402, "b": 695.741173, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "Picture", "bbox": {"l": 468.61499, "t": 687.41138, "r": 492.83208999999994, "b": 695.750137, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "are abundant and", "bbox": {"l": 495.28201, "t": 687.36655, "r": 558.2005, "b": 695.741173, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "the most visually distinctive in a document.", "bbox": {"l": 317.95499, "t": 698.325554, "r": 477.53903, "b": 706.700172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In Table 2, we present baseline experiments (given in mAP) on Mask R-CNN [12], Faster R-CNN [11], and YOLOv5 [13]. Both training and evaluation were performed on RGB images with dimensions of 1025 \u00d7 1025 pixels. For training, we only used one annotation in case of redundantly annotated pages. As one can observe, the variation in mAP between the models is rather low, but overall between 6 and 10% lower than the mAP computed from the pairwise human annotations on triple-annotated pages. This gives a good indication that the DocLayNet dataset poses a worthwhile challenge for the research community to close the gap between human recognition and ML approaches. It is interesting to see that Mask R-CNN and Faster R-CNN produce very comparable mAP scores, indicating that pixel-based image segmentation derived from bounding-boxes does not help to obtain better predictions. On the other hand, the more recent Yolov5x model does very well and even out-performs humans on selected labels such as Text , Table and Picture . This is not entirely surprising, as Text , Table and Picture are abundant and the most visually distinctive in a document."}], "body": [{"label": "text", "id": 5, "page_no": 5, "cluster": {"id": 5, "label": "text", "bbox": {"l": 53.501999, "t": 86.87292000000002, "r": 295.64874, "b": 183.01709000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9782760143280029, "cells": [{"id": 2, "text": "Table 2: Prediction performance (mAP@0.5-0.95) of object", "bbox": {"l": 53.501999, "t": 86.87292000000002, "r": 294.04361, "b": 95.34618999999998, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "detection networks on DocLayNet test set. The MRCNN", "bbox": {"l": 53.79800000000001, "t": 97.83191, "r": 294.04373, "b": 106.30517999999995, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "(Mask R-CNN) and FRCNN (Faster R-CNN) models with", "bbox": {"l": 53.52, "t": 108.79088999999999, "r": 294.0437, "b": 117.26415999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "ResNet-50 or ResNet-101 backbone were trained based on", "bbox": {"l": 53.79800000000001, "t": 119.74987999999996, "r": 294.04373, "b": 128.22313999999994, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "the network architectures from the", "bbox": {"l": 53.79800000000001, "t": 130.70885999999996, "r": 202.43402, "b": 139.18213000000003, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "detectron2", "bbox": {"l": 206.08501, "t": 130.71783000000005, "r": 247.14215000000002, "b": 139.20905000000005, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "model zoo", "bbox": {"l": 250.95001, "t": 130.70885999999996, "r": 294.04254, "b": 139.18213000000003, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "(Mask R-CNN R50, R101-FPN 3x, Faster R-CNN R101-FPN", "bbox": {"l": 53.52002, "t": 141.66785000000004, "r": 294.04367, "b": 150.14111000000003, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "3x), with default configurations. The YOLO implementation", "bbox": {"l": 53.798019, "t": 152.62683000000004, "r": 294.04373, "b": 161.1001, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "utilized was YOLOv5x6 [13]. All models were initialised us-", "bbox": {"l": 53.798019, "t": 163.58582, "r": 295.64874, "b": 172.05908, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "ing pre-trained weights from the COCO 2017 dataset.", "bbox": {"l": 53.798019, "t": 174.54381999999998, "r": 268.62399, "b": 183.01709000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 2: Prediction performance (mAP@0.5-0.95) of object detection networks on DocLayNet test set. The MRCNN (Mask R-CNN) and FRCNN (Faster R-CNN) models with ResNet-50 or ResNet-101 backbone were trained based on the network architectures from the detectron2 model zoo (Mask R-CNN R50, R101-FPN 3x, Faster R-CNN R101-FPN 3x), with default configurations. The YOLO implementation utilized was YOLOv5x6 [13]. All models were initialised using pre-trained weights from the COCO 2017 dataset."}, {"label": "table", "id": 0, "page_no": 5, "cluster": {"id": 0, "label": "table", "bbox": {"l": 62.02753829956055, "t": 195.68006896972656, "r": 285.78955078125, "b": 351.6618957519531, "coord_origin": "TOPLEFT"}, "confidence": 0.9883638620376587, "cells": [{"id": 13, "text": "human", "bbox": {"l": 132.36501, "t": 197.97351000000003, "r": 157.99098, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "MRCNN", "bbox": {"l": 173.505, "t": 197.97351000000003, "r": 204.61841, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "FRCNN", "bbox": {"l": 220.13028, "t": 197.97351000000003, "r": 248.06958, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "YOLO", "bbox": {"l": 258.03125, "t": 197.97351000000003, "r": 280.17825, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "R50", "bbox": {"l": 168.39301, "t": 208.93255999999997, "r": 181.99504, "b": 217.30719, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "R101", "bbox": {"l": 192.39606, "t": 208.93255999999997, "r": 210.16747, "b": 217.30719, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "R101", "bbox": {"l": 225.21309, "t": 208.93255999999997, "r": 242.9845, "b": 217.30719, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "v5x6", "bbox": {"l": 260.51379, "t": 208.93255999999997, "r": 277.70239, "b": 217.30719, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Caption", "bbox": {"l": 67.663002, "t": 220.28954999999996, "r": 96.848633, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "84-89", "bbox": {"l": 135.32401, "t": 220.28954999999996, "r": 155.03215, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "68.4", "bbox": {"l": 167.95399, "t": 220.28954999999996, "r": 182.43472, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "71.5", "bbox": {"l": 194.0462, "t": 220.28954999999996, "r": 208.52695, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "70.1", "bbox": {"l": 226.86324000000002, "t": 220.28954999999996, "r": 241.34396, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "77.7", "bbox": {"l": 261.86804, "t": 220.28954999999996, "r": 276.34879, "b": 228.66418, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Footnote", "bbox": {"l": 67.663002, "t": 231.24854000000005, "r": 100.1662, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "83-91", "bbox": {"l": 135.32401, "t": 231.24854000000005, "r": 155.03215, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "70.9", "bbox": {"l": 167.95399, "t": 231.24854000000005, "r": 182.43472, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "71.8", "bbox": {"l": 194.0462, "t": 231.24854000000005, "r": 208.52695, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "73.7", "bbox": {"l": 226.86324000000002, "t": 231.24854000000005, "r": 241.34396, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "77.2", "bbox": {"l": 261.86804, "t": 231.24854000000005, "r": 276.34879, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "Formula", "bbox": {"l": 67.663002, "t": 242.20752000000005, "r": 98.175659, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "83-85", "bbox": {"l": 135.32401, "t": 242.20752000000005, "r": 155.03215, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "60.1", "bbox": {"l": 167.95399, "t": 242.20752000000005, "r": 182.43472, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "63.4", "bbox": {"l": 194.0462, "t": 242.20752000000005, "r": 208.52695, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "63.5", "bbox": {"l": 226.86324000000002, "t": 242.20752000000005, "r": 241.34396, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "66.2", "bbox": {"l": 261.86804, "t": 242.20752000000005, "r": 276.34879, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "List-item", "bbox": {"l": 67.663002, "t": 253.16656, "r": 100.54279, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "87-88", "bbox": {"l": 135.32401, "t": 253.16656, "r": 155.03215, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "81.2", "bbox": {"l": 167.95399, "t": 253.16656, "r": 182.43472, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "80.8", "bbox": {"l": 194.0462, "t": 253.16656, "r": 208.52695, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "81.0", "bbox": {"l": 226.86324000000002, "t": 253.16656, "r": 241.34396, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "86.2", "bbox": {"l": 261.86804, "t": 253.16656, "r": 276.34879, "b": 261.5412, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Page-footer", "bbox": {"l": 67.663002, "t": 264.12555, "r": 110.19064, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "93-94", "bbox": {"l": 135.32401, "t": 264.12555, "r": 155.03215, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "61.6", "bbox": {"l": 167.95399, "t": 264.12555, "r": 182.43472, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "59.3", "bbox": {"l": 194.0462, "t": 264.12555, "r": 208.52695, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "58.9", "bbox": {"l": 226.86324000000002, "t": 264.12555, "r": 241.34396, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "61.1", "bbox": {"l": 261.86804, "t": 264.12555, "r": 276.34879, "b": 272.50018, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Page-header", "bbox": {"l": 67.663002, "t": 275.08453, "r": 112.94331999999999, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "85-89", "bbox": {"l": 135.32401, "t": 275.08453, "r": 155.03215, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "71.9", "bbox": {"l": 167.95399, "t": 275.08453, "r": 182.43472, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "70.0", "bbox": {"l": 194.0462, "t": 275.08453, "r": 208.52695, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "72.0", "bbox": {"l": 226.86324000000002, "t": 275.08453, "r": 241.34396, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "67.9", "bbox": {"l": 261.86804, "t": 275.08453, "r": 276.34879, "b": 283.45917, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Picture", "bbox": {"l": 67.663002, "t": 286.04355000000004, "r": 93.647629, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "69-71", "bbox": {"l": 135.32401, "t": 286.04355000000004, "r": 155.03215, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "71.7", "bbox": {"l": 167.95399, "t": 286.04355000000004, "r": 182.43472, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "72.7", "bbox": {"l": 194.0462, "t": 286.04355000000004, "r": 208.52695, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "72.0", "bbox": {"l": 226.86324000000002, "t": 286.04355000000004, "r": 241.34396, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "77.1", "bbox": {"l": 261.86804, "t": 286.04355000000004, "r": 276.34879, "b": 294.41818, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "Section-header", "bbox": {"l": 67.663002, "t": 297.00253, "r": 122.40287999999998, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "83-84", "bbox": {"l": 135.32401, "t": 297.00253, "r": 155.03215, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "67.6", "bbox": {"l": 167.95399, "t": 297.00253, "r": 182.43472, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "69.3", "bbox": {"l": 194.0462, "t": 297.00253, "r": 208.52695, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "68.4", "bbox": {"l": 226.86324000000002, "t": 297.00253, "r": 241.34396, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "74.6", "bbox": {"l": 261.86804, "t": 297.00253, "r": 276.34879, "b": 305.37717, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "Table", "bbox": {"l": 67.663002, "t": 307.96155, "r": 87.46978, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "77-81", "bbox": {"l": 135.32401, "t": 307.96155, "r": 155.03215, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "82.2", "bbox": {"l": 167.95399, "t": 307.96155, "r": 182.43472, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "82.9", "bbox": {"l": 194.0462, "t": 307.96155, "r": 208.52695, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "82.2", "bbox": {"l": 226.86324000000002, "t": 307.96155, "r": 241.34396, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "86.3", "bbox": {"l": 261.86804, "t": 307.96155, "r": 276.34879, "b": 316.33618, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "Text", "bbox": {"l": 67.663002, "t": 318.91953, "r": 83.623199, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "84-86", "bbox": {"l": 135.32401, "t": 318.91953, "r": 155.03215, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "84.6", "bbox": {"l": 167.95399, "t": 318.91953, "r": 182.43472, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "85.8", "bbox": {"l": 194.0462, "t": 318.91953, "r": 208.52695, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "85.4", "bbox": {"l": 226.86324000000002, "t": 318.91953, "r": 241.34396, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "88.1", "bbox": {"l": 261.86804, "t": 318.91953, "r": 276.34879, "b": 327.29416, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Title", "bbox": {"l": 67.663002, "t": 329.87854, "r": 84.654327, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "60-72", "bbox": {"l": 135.32401, "t": 329.87854, "r": 155.03215, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "76.7", "bbox": {"l": 167.95399, "t": 329.87854, "r": 182.43472, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "80.4", "bbox": {"l": 194.0462, "t": 329.87854, "r": 208.52695, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "79.9", "bbox": {"l": 226.86324000000002, "t": 329.87854, "r": 241.34396, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "82.7", "bbox": {"l": 261.86804, "t": 329.87854, "r": 276.34879, "b": 338.25317, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "All", "bbox": {"l": 67.663002, "t": 341.23654, "r": 78.628906, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "82-83", "bbox": {"l": 135.32401, "t": 341.23654, "r": 155.03215, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "72.4", "bbox": {"l": 167.95399, "t": 341.23654, "r": 182.43472, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "73.5", "bbox": {"l": 194.0462, "t": 341.23654, "r": 208.52695, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "73.4", "bbox": {"l": 226.86324000000002, "t": 341.23654, "r": 241.34396, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "76.8", "bbox": {"l": 261.86804, "t": 341.23654, "r": 276.34879, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": [{"id": 12, "label": "text", "bbox": {"l": 132.36501, "t": 197.97351000000003, "r": 157.99098, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "human", "bbox": {"l": 132.36501, "t": 197.97351000000003, "r": 157.99098, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 173.505, "t": 197.97351000000003, "r": 204.61841, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "MRCNN", "bbox": {"l": 173.505, "t": 197.97351000000003, "r": 204.61841, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 220.13028, "t": 197.97351000000003, "r": 248.06958, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "FRCNN", "bbox": {"l": 220.13028, "t": 197.97351000000003, "r": 248.06958, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 258.03125, "t": 197.97351000000003, "r": 280.17825, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "YOLO", "bbox": {"l": 258.03125, "t": 197.97351000000003, "r": 280.17825, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 168.39301, "t": 208.93255999999997, "r": 181.99504, "b": 217.30719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "R50", "bbox": {"l": 168.39301, "t": 208.93255999999997, "r": 181.99504, "b": 217.30719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 192.39606, "t": 208.93255999999997, "r": 210.16747, "b": 217.30719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "R101", "bbox": {"l": 192.39606, "t": 208.93255999999997, "r": 210.16747, "b": 217.30719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 225.21309, "t": 208.93255999999997, "r": 242.9845, "b": 217.30719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "R101", "bbox": {"l": 225.21309, "t": 208.93255999999997, "r": 242.9845, "b": 217.30719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 260.51379, "t": 208.93255999999997, "r": 277.70239, "b": 217.30719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "v5x6", "bbox": {"l": 260.51379, "t": 208.93255999999997, "r": 277.70239, "b": 217.30719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 67.663002, "t": 220.28954999999996, "r": 96.848633, "b": 228.66418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "Caption", "bbox": {"l": 67.663002, "t": 220.28954999999996, "r": 96.848633, "b": 228.66418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 135.32401, "t": 220.28954999999996, "r": 155.03215, "b": 228.66418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "84-89", "bbox": {"l": 135.32401, "t": 220.28954999999996, "r": 155.03215, "b": 228.66418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 167.95399, "t": 220.28954999999996, "r": 182.43472, "b": 228.66418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "68.4", "bbox": {"l": 167.95399, "t": 220.28954999999996, "r": 182.43472, "b": 228.66418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 194.0462, "t": 220.28954999999996, "r": 208.52695, "b": 228.66418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "71.5", "bbox": {"l": 194.0462, "t": 220.28954999999996, "r": 208.52695, "b": 228.66418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 226.86324000000002, "t": 220.28954999999996, "r": 241.34396, "b": 228.66418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "70.1", "bbox": {"l": 226.86324000000002, "t": 220.28954999999996, "r": 241.34396, "b": 228.66418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 261.86804, "t": 220.28954999999996, "r": 276.34879, "b": 228.66418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "77.7", "bbox": {"l": 261.86804, "t": 220.28954999999996, "r": 276.34879, "b": 228.66418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 67.663002, "t": 231.24854000000005, "r": 100.1662, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "Footnote", "bbox": {"l": 67.663002, "t": 231.24854000000005, "r": 100.1662, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 135.32401, "t": 231.24854000000005, "r": 155.03215, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "83-91", "bbox": {"l": 135.32401, "t": 231.24854000000005, "r": 155.03215, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 167.95399, "t": 231.24854000000005, "r": 182.43472, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "70.9", "bbox": {"l": 167.95399, "t": 231.24854000000005, "r": 182.43472, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 194.0462, "t": 231.24854000000005, "r": 208.52695, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "71.8", "bbox": {"l": 194.0462, "t": 231.24854000000005, "r": 208.52695, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 226.86324000000002, "t": 231.24854000000005, "r": 241.34396, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "73.7", "bbox": {"l": 226.86324000000002, "t": 231.24854000000005, "r": 241.34396, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 261.86804, "t": 231.24854000000005, "r": 276.34879, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "77.2", "bbox": {"l": 261.86804, "t": 231.24854000000005, "r": 276.34879, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 67.663002, "t": 242.20752000000005, "r": 98.175659, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "Formula", "bbox": {"l": 67.663002, "t": 242.20752000000005, "r": 98.175659, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 135.32401, "t": 242.20752000000005, "r": 155.03215, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "83-85", "bbox": {"l": 135.32401, "t": 242.20752000000005, "r": 155.03215, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 167.95399, "t": 242.20752000000005, "r": 182.43472, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "60.1", "bbox": {"l": 167.95399, "t": 242.20752000000005, "r": 182.43472, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 194.0462, "t": 242.20752000000005, "r": 208.52695, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "63.4", "bbox": {"l": 194.0462, "t": 242.20752000000005, "r": 208.52695, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 226.86324000000002, "t": 242.20752000000005, "r": 241.34396, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "63.5", "bbox": {"l": 226.86324000000002, "t": 242.20752000000005, "r": 241.34396, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 261.86804, "t": 242.20752000000005, "r": 276.34879, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "66.2", "bbox": {"l": 261.86804, "t": 242.20752000000005, "r": 276.34879, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 67.663002, "t": 253.16656, "r": 100.54279, "b": 261.5412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "List-item", "bbox": {"l": 67.663002, "t": 253.16656, "r": 100.54279, "b": 261.5412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 135.32401, "t": 253.16656, "r": 155.03215, "b": 261.5412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "87-88", "bbox": {"l": 135.32401, "t": 253.16656, "r": 155.03215, "b": 261.5412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 167.95399, "t": 253.16656, "r": 182.43472, "b": 261.5412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "81.2", "bbox": {"l": 167.95399, "t": 253.16656, "r": 182.43472, "b": 261.5412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 194.0462, "t": 253.16656, "r": 208.52695, "b": 261.5412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "80.8", "bbox": {"l": 194.0462, "t": 253.16656, "r": 208.52695, "b": 261.5412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 226.86324000000002, "t": 253.16656, "r": 241.34396, "b": 261.5412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "81.0", "bbox": {"l": 226.86324000000002, "t": 253.16656, "r": 241.34396, "b": 261.5412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 261.86804, "t": 253.16656, "r": 276.34879, "b": 261.5412, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "86.2", "bbox": {"l": 261.86804, "t": 253.16656, "r": 276.34879, "b": 261.5412, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 67.663002, "t": 264.12555, "r": 110.19064, "b": 272.50018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "Page-footer", "bbox": {"l": 67.663002, "t": 264.12555, "r": 110.19064, "b": 272.50018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 135.32401, "t": 264.12555, "r": 155.03215, "b": 272.50018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "93-94", "bbox": {"l": 135.32401, "t": 264.12555, "r": 155.03215, "b": 272.50018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 167.95399, "t": 264.12555, "r": 182.43472, "b": 272.50018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "61.6", "bbox": {"l": 167.95399, "t": 264.12555, "r": 182.43472, "b": 272.50018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 194.0462, "t": 264.12555, "r": 208.52695, "b": 272.50018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "59.3", "bbox": {"l": 194.0462, "t": 264.12555, "r": 208.52695, "b": 272.50018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 226.86324000000002, "t": 264.12555, "r": 241.34396, "b": 272.50018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "58.9", "bbox": {"l": 226.86324000000002, "t": 264.12555, "r": 241.34396, "b": 272.50018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 261.86804, "t": 264.12555, "r": 276.34879, "b": 272.50018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "61.1", "bbox": {"l": 261.86804, "t": 264.12555, "r": 276.34879, "b": 272.50018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 67.663002, "t": 275.08453, "r": 112.94331999999999, "b": 283.45917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "Page-header", "bbox": {"l": 67.663002, "t": 275.08453, "r": 112.94331999999999, "b": 283.45917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 135.32401, "t": 275.08453, "r": 155.03215, "b": 283.45917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "85-89", "bbox": {"l": 135.32401, "t": 275.08453, "r": 155.03215, "b": 283.45917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 167.95399, "t": 275.08453, "r": 182.43472, "b": 283.45917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "71.9", "bbox": {"l": 167.95399, "t": 275.08453, "r": 182.43472, "b": 283.45917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 194.0462, "t": 275.08453, "r": 208.52695, "b": 283.45917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "70.0", "bbox": {"l": 194.0462, "t": 275.08453, "r": 208.52695, "b": 283.45917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 226.86324000000002, "t": 275.08453, "r": 241.34396, "b": 283.45917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "72.0", "bbox": {"l": 226.86324000000002, "t": 275.08453, "r": 241.34396, "b": 283.45917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 261.86804, "t": 275.08453, "r": 276.34879, "b": 283.45917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "67.9", "bbox": {"l": 261.86804, "t": 275.08453, "r": 276.34879, "b": 283.45917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 67.663002, "t": 286.04355000000004, "r": 93.647629, "b": 294.41818, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "Picture", "bbox": {"l": 67.663002, "t": 286.04355000000004, "r": 93.647629, "b": 294.41818, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 135.32401, "t": 286.04355000000004, "r": 155.03215, "b": 294.41818, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "69-71", "bbox": {"l": 135.32401, "t": 286.04355000000004, "r": 155.03215, "b": 294.41818, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 167.95399, "t": 286.04355000000004, "r": 182.43472, "b": 294.41818, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "71.7", "bbox": {"l": 167.95399, "t": 286.04355000000004, "r": 182.43472, "b": 294.41818, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 194.0462, "t": 286.04355000000004, "r": 208.52695, "b": 294.41818, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "72.7", "bbox": {"l": 194.0462, "t": 286.04355000000004, "r": 208.52695, "b": 294.41818, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 226.86324000000002, "t": 286.04355000000004, "r": 241.34396, "b": 294.41818, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "72.0", "bbox": {"l": 226.86324000000002, "t": 286.04355000000004, "r": 241.34396, "b": 294.41818, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 261.86804, "t": 286.04355000000004, "r": 276.34879, "b": 294.41818, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "77.1", "bbox": {"l": 261.86804, "t": 286.04355000000004, "r": 276.34879, "b": 294.41818, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 67.663002, "t": 297.00253, "r": 122.40287999999998, "b": 305.37717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "Section-header", "bbox": {"l": 67.663002, "t": 297.00253, "r": 122.40287999999998, "b": 305.37717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 135.32401, "t": 297.00253, "r": 155.03215, "b": 305.37717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "83-84", "bbox": {"l": 135.32401, "t": 297.00253, "r": 155.03215, "b": 305.37717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 167.95399, "t": 297.00253, "r": 182.43472, "b": 305.37717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "67.6", "bbox": {"l": 167.95399, "t": 297.00253, "r": 182.43472, "b": 305.37717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 194.0462, "t": 297.00253, "r": 208.52695, "b": 305.37717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "69.3", "bbox": {"l": 194.0462, "t": 297.00253, "r": 208.52695, "b": 305.37717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 226.86324000000002, "t": 297.00253, "r": 241.34396, "b": 305.37717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "68.4", "bbox": {"l": 226.86324000000002, "t": 297.00253, "r": 241.34396, "b": 305.37717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 261.86804, "t": 297.00253, "r": 276.34879, "b": 305.37717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "74.6", "bbox": {"l": 261.86804, "t": 297.00253, "r": 276.34879, "b": 305.37717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 67.663002, "t": 307.96155, "r": 87.46978, "b": 316.33618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "Table", "bbox": {"l": 67.663002, "t": 307.96155, "r": 87.46978, "b": 316.33618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 135.32401, "t": 307.96155, "r": 155.03215, "b": 316.33618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "77-81", "bbox": {"l": 135.32401, "t": 307.96155, "r": 155.03215, "b": 316.33618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 167.95399, "t": 307.96155, "r": 182.43472, "b": 316.33618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "82.2", "bbox": {"l": 167.95399, "t": 307.96155, "r": 182.43472, "b": 316.33618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 194.0462, "t": 307.96155, "r": 208.52695, "b": 316.33618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "82.9", "bbox": {"l": 194.0462, "t": 307.96155, "r": 208.52695, "b": 316.33618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 226.86324000000002, "t": 307.96155, "r": 241.34396, "b": 316.33618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "82.2", "bbox": {"l": 226.86324000000002, "t": 307.96155, "r": 241.34396, "b": 316.33618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 261.86804, "t": 307.96155, "r": 276.34879, "b": 316.33618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "86.3", "bbox": {"l": 261.86804, "t": 307.96155, "r": 276.34879, "b": 316.33618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 67.663002, "t": 318.91953, "r": 83.623199, "b": 327.29416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "Text", "bbox": {"l": 67.663002, "t": 318.91953, "r": 83.623199, "b": 327.29416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 135.32401, "t": 318.91953, "r": 155.03215, "b": 327.29416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "84-86", "bbox": {"l": 135.32401, "t": 318.91953, "r": 155.03215, "b": 327.29416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 167.95399, "t": 318.91953, "r": 182.43472, "b": 327.29416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "84.6", "bbox": {"l": 167.95399, "t": 318.91953, "r": 182.43472, "b": 327.29416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 194.0462, "t": 318.91953, "r": 208.52695, "b": 327.29416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "85.8", "bbox": {"l": 194.0462, "t": 318.91953, "r": 208.52695, "b": 327.29416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 226.86324000000002, "t": 318.91953, "r": 241.34396, "b": 327.29416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "85.4", "bbox": {"l": 226.86324000000002, "t": 318.91953, "r": 241.34396, "b": 327.29416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 261.86804, "t": 318.91953, "r": 276.34879, "b": 327.29416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "88.1", "bbox": {"l": 261.86804, "t": 318.91953, "r": 276.34879, "b": 327.29416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 67.663002, "t": 329.87854, "r": 84.654327, "b": 338.25317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "Title", "bbox": {"l": 67.663002, "t": 329.87854, "r": 84.654327, "b": 338.25317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 135.32401, "t": 329.87854, "r": 155.03215, "b": 338.25317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "60-72", "bbox": {"l": 135.32401, "t": 329.87854, "r": 155.03215, "b": 338.25317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 167.95399, "t": 329.87854, "r": 182.43472, "b": 338.25317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "76.7", "bbox": {"l": 167.95399, "t": 329.87854, "r": 182.43472, "b": 338.25317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 194.0462, "t": 329.87854, "r": 208.52695, "b": 338.25317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "80.4", "bbox": {"l": 194.0462, "t": 329.87854, "r": 208.52695, "b": 338.25317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 226.86324000000002, "t": 329.87854, "r": 241.34396, "b": 338.25317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "79.9", "bbox": {"l": 226.86324000000002, "t": 329.87854, "r": 241.34396, "b": 338.25317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 261.86804, "t": 329.87854, "r": 276.34879, "b": 338.25317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "82.7", "bbox": {"l": 261.86804, "t": 329.87854, "r": 276.34879, "b": 338.25317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 67.663002, "t": 341.23654, "r": 78.628906, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "All", "bbox": {"l": 67.663002, "t": 341.23654, "r": 78.628906, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 135.32401, "t": 341.23654, "r": 155.03215, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "82-83", "bbox": {"l": 135.32401, "t": 341.23654, "r": 155.03215, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 167.95399, "t": 341.23654, "r": 182.43472, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "72.4", "bbox": {"l": 167.95399, "t": 341.23654, "r": 182.43472, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 194.0462, "t": 341.23654, "r": 208.52695, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "73.5", "bbox": {"l": 194.0462, "t": 341.23654, "r": 208.52695, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 226.86324000000002, "t": 341.23654, "r": 241.34396, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "73.4", "bbox": {"l": 226.86324000000002, "t": 341.23654, "r": 241.34396, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 261.86804, "t": 341.23654, "r": 276.34879, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "76.8", "bbox": {"l": 261.86804, "t": 341.23654, "r": 276.34879, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ecel", "ched", "ched", "lcel", "ched", "ched", "nl", "ecel", "ucel", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 14, "num_cols": 6, "table_cells": [{"bbox": {"l": 132.36501, "t": 197.97351000000003, "r": 157.99098, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "human", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 173.505, "t": 197.97351000000003, "r": 204.61841, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 4, "text": "MRCNN", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 220.13028, "t": 197.97351000000003, "r": 248.06958, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "FRCNN", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 258.03125, "t": 197.97351000000003, "r": 280.17825, "b": 206.34813999999994, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "YOLO", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 168.39301, "t": 208.93255999999997, "r": 181.99504, "b": 217.30719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "R50", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 192.39606, "t": 208.93255999999997, "r": 210.16747, "b": 217.30719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "R101", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 225.21309, "t": 208.93255999999997, "r": 242.9845, "b": 217.30719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "R101", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 260.51379, "t": 208.93255999999997, "r": 277.70239, "b": 217.30719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "v5x6", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 220.28954999999996, "r": 96.848633, "b": 228.66418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Caption", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 220.28954999999996, "r": 155.03215, "b": 228.66418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "84-89", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 220.28954999999996, "r": 182.43472, "b": 228.66418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "68.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 220.28954999999996, "r": 208.52695, "b": 228.66418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "71.5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 220.28954999999996, "r": 241.34396, "b": 228.66418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "70.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 220.28954999999996, "r": 276.34879, "b": 228.66418, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "77.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 231.24854000000005, "r": 100.1662, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Footnote", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 231.24854000000005, "r": 155.03215, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "83-91", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 231.24854000000005, "r": 182.43472, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "70.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 231.24854000000005, "r": 208.52695, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "71.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 231.24854000000005, "r": 241.34396, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "73.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 231.24854000000005, "r": 276.34879, "b": 239.62316999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "77.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 242.20752000000005, "r": 98.175659, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Formula", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 242.20752000000005, "r": 155.03215, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "83-85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 242.20752000000005, "r": 182.43472, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "60.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 242.20752000000005, "r": 208.52695, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "63.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 242.20752000000005, "r": 241.34396, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "63.5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 242.20752000000005, "r": 276.34879, "b": 250.58214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "66.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 253.16656, "r": 100.54279, "b": 261.5412, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "List-item", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 253.16656, "r": 155.03215, "b": 261.5412, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "87-88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 253.16656, "r": 182.43472, "b": 261.5412, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "81.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 253.16656, "r": 208.52695, "b": 261.5412, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "80.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 253.16656, "r": 241.34396, "b": 261.5412, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "81.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 253.16656, "r": 276.34879, "b": 261.5412, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "86.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 264.12555, "r": 110.19064, "b": 272.50018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-footer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 264.12555, "r": 155.03215, "b": 272.50018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "93-94", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 264.12555, "r": 182.43472, "b": 272.50018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "61.6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 264.12555, "r": 208.52695, "b": 272.50018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "59.3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 264.12555, "r": 241.34396, "b": 272.50018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "58.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 264.12555, "r": 276.34879, "b": 272.50018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "61.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 275.08453, "r": 112.94331999999999, "b": 283.45917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 275.08453, "r": 155.03215, "b": 283.45917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "85-89", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 275.08453, "r": 182.43472, "b": 283.45917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "71.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 275.08453, "r": 208.52695, "b": 283.45917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "70.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 275.08453, "r": 241.34396, "b": 283.45917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "72.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 275.08453, "r": 276.34879, "b": 283.45917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "67.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 286.04355000000004, "r": 93.647629, "b": 294.41818, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Picture", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 286.04355000000004, "r": 155.03215, "b": 294.41818, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "69-71", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 286.04355000000004, "r": 182.43472, "b": 294.41818, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "71.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 286.04355000000004, "r": 208.52695, "b": 294.41818, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "72.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 286.04355000000004, "r": 241.34396, "b": 294.41818, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "72.0", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 286.04355000000004, "r": 276.34879, "b": 294.41818, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "77.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 297.00253, "r": 122.40287999999998, "b": 305.37717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Section-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 297.00253, "r": 155.03215, "b": 305.37717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "83-84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 297.00253, "r": 182.43472, "b": 305.37717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "67.6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 297.00253, "r": 208.52695, "b": 305.37717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "69.3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 297.00253, "r": 241.34396, "b": 305.37717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "68.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 297.00253, "r": 276.34879, "b": 305.37717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "74.6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 307.96155, "r": 87.46978, "b": 316.33618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 307.96155, "r": 155.03215, "b": 316.33618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "77-81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 307.96155, "r": 182.43472, "b": 316.33618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "82.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 307.96155, "r": 208.52695, "b": 316.33618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "82.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 307.96155, "r": 241.34396, "b": 316.33618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "82.2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 307.96155, "r": 276.34879, "b": 316.33618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "86.3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 318.91953, "r": 83.623199, "b": 327.29416, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Text", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 318.91953, "r": 155.03215, "b": 327.29416, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "84-86", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 318.91953, "r": 182.43472, "b": 327.29416, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "84.6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 318.91953, "r": 208.52695, "b": 327.29416, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "85.8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 318.91953, "r": 241.34396, "b": 327.29416, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "85.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 318.91953, "r": 276.34879, "b": 327.29416, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "88.1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 329.87854, "r": 84.654327, "b": 338.25317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Title", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 329.87854, "r": 155.03215, "b": 338.25317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "60-72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 329.87854, "r": 182.43472, "b": 338.25317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "76.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 329.87854, "r": 208.52695, "b": 338.25317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "80.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 329.87854, "r": 241.34396, "b": 338.25317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "79.9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 329.87854, "r": 276.34879, "b": 338.25317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "82.7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 67.663002, "t": 341.23654, "r": 78.628906, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "All", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 135.32401, "t": 341.23654, "r": 155.03215, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "82-83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 167.95399, "t": 341.23654, "r": 182.43472, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "72.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 194.0462, "t": 341.23654, "r": 208.52695, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "73.5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 226.86324000000002, "t": 341.23654, "r": 241.34396, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "73.4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 261.86804, "t": 341.23654, "r": 276.34879, "b": 349.61118000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "76.8", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "text", "id": 4, "page_no": 5, "cluster": {"id": 4, "label": "text", "bbox": {"l": 53.528999, "t": 370.92755, "r": 295.55612, "b": 576.56317, "coord_origin": "TOPLEFT"}, "confidence": 0.9866557121276855, "cells": [{"id": 93, "text": "to avoid this at any cost in order to have clear, unbiased baseline", "bbox": {"l": 53.79800000000001, "t": 370.92755, "r": 294.04712, "b": 379.30219000000005, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "numbers for human document-layout annotation. Third, we in-", "bbox": {"l": 53.79800000000001, "t": 381.88654, "r": 295.55612, "b": 390.26117, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "troduced the feature of", "bbox": {"l": 53.79800000000001, "t": 392.84555, "r": 140.3623, "b": 401.22017999999997, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "snapping", "bbox": {"l": 142.99001, "t": 392.89041, "r": 175.9695, "b": 401.2291599999999, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "boxes around text segments to", "bbox": {"l": 178.951, "t": 392.84555, "r": 294.04083, "b": 401.22017999999997, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "obtain a pixel-accurate annotation and again reduce time and effort.", "bbox": {"l": 53.79800000000001, "t": 403.80453, "r": 295.42493, "b": 412.17917, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "The CCS annotation tool automatically shrinks every user-drawn", "bbox": {"l": 53.528999, "t": 414.76355, "r": 294.04251, "b": 423.13818, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "box to the minimum bounding-box around the enclosed text-cells", "bbox": {"l": 53.79800000000001, "t": 425.72253, "r": 294.04807, "b": 434.09717, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "for all purely text-based segments, which excludes only", "bbox": {"l": 53.79800000000001, "t": 436.6815500000001, "r": 256.80627, "b": 445.0561799999999, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "Table", "bbox": {"l": 259.04199, "t": 436.72641, "r": 278.10455, "b": 445.06516, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "and", "bbox": {"l": 280.54999, "t": 436.6815500000001, "r": 294.04443, "b": 445.0561799999999, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "Picture", "bbox": {"l": 53.79800000000001, "t": 447.68539, "r": 78.875587, "b": 456.02413999999993, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": ". For the latter, we instructed annotation staff to minimise", "bbox": {"l": 78.876999, "t": 447.64053, "r": 294.04852, "b": 456.01517, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "inclusion of surrounding whitespace while including all graphical", "bbox": {"l": 53.79800000000001, "t": 458.59955, "r": 294.04645, "b": 466.97418, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "lines. A downside of snapping boxes to enclosed text cells is that", "bbox": {"l": 53.79800000000001, "t": 469.55853, "r": 294.0416, "b": 477.93317, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "some wrongly parsed PDF pages cannot be annotated correctly and", "bbox": {"l": 53.79800000000001, "t": 480.51654, "r": 294.04538, "b": 488.89117, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "need to be skipped. Fourth, we established a way to flag pages as", "bbox": {"l": 53.79800000000001, "t": 491.47552, "r": 294.04312, "b": 499.85016, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "rejected", "bbox": {"l": 53.79800000000001, "t": 502.4794, "r": 80.597939, "b": 510.81815, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "for cases where no valid annotation according to the label", "bbox": {"l": 83.366997, "t": 502.43454, "r": 294.04483, "b": 510.80917, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "guidelines could be achieved. Example cases for this would be PDF", "bbox": {"l": 53.79800000000001, "t": 513.3935200000001, "r": 294.25833, "b": 521.7681600000001, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "pages that render incorrectly or contain layouts that are impossible", "bbox": {"l": 53.79800000000001, "t": 524.35254, "r": 294.04535, "b": 532.72717, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "to capture with non-overlapping rectangles. Such rejected pages are", "bbox": {"l": 53.79800000000001, "t": 535.31155, "r": 294.04535, "b": 543.68617, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "not contained in the final dataset. With all these measures in place,", "bbox": {"l": 53.79800000000001, "t": 546.27055, "r": 295.02759, "b": 554.64517, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "experienced annotation staff managed to annotate a single page in", "bbox": {"l": 53.79800000000001, "t": 557.22955, "r": 294.0488, "b": 565.6041700000001, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "a typical timeframe of 20s to 60s, depending on its complexity.", "bbox": {"l": 53.79800000000001, "t": 568.18855, "r": 281.80457, "b": 576.56317, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "to avoid this at any cost in order to have clear, unbiased baseline numbers for human document-layout annotation. Third, we introduced the feature of snapping boxes around text segments to obtain a pixel-accurate annotation and again reduce time and effort. The CCS annotation tool automatically shrinks every user-drawn box to the minimum bounding-box around the enclosed text-cells for all purely text-based segments, which excludes only Table and Picture . For the latter, we instructed annotation staff to minimise inclusion of surrounding whitespace while including all graphical lines. A downside of snapping boxes to enclosed text cells is that some wrongly parsed PDF pages cannot be annotated correctly and need to be skipped. Fourth, we established a way to flag pages as rejected for cases where no valid annotation according to the label guidelines could be achieved. Example cases for this would be PDF pages that render incorrectly or contain layouts that are impossible to capture with non-overlapping rectangles. Such rejected pages are not contained in the final dataset. With all these measures in place, experienced annotation staff managed to annotate a single page in a typical timeframe of 20s to 60s, depending on its complexity."}, {"label": "section_header", "id": 10, "page_no": 5, "cluster": {"id": 10, "label": "section_header", "bbox": {"l": 53.79800000000001, "t": 588.12991, "r": 147.48535, "b": 598.43901, "coord_origin": "TOPLEFT"}, "confidence": 0.9419495463371277, "cells": [{"id": 118, "text": "5", "bbox": {"l": 53.79800000000001, "t": 588.12991, "r": 59.405277, "b": 598.43901, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "EXPERIMENTS", "bbox": {"l": 70.314377, "t": 588.12991, "r": 147.48535, "b": 598.43901, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5 EXPERIMENTS"}, {"label": "text", "id": 2, "page_no": 5, "cluster": {"id": 2, "label": "text", "bbox": {"l": 53.484001, "t": 613.25356, "r": 295.4281, "b": 709.299171, "coord_origin": "TOPLEFT"}, "confidence": 0.987605094909668, "cells": [{"id": 120, "text": "The primary goal of DocLayNet is to obtain high-quality ML models", "bbox": {"l": 53.528999, "t": 613.25356, "r": 294.04871, "b": 621.6281700000001, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "capable of accurate document-layout analysis on a wide variety", "bbox": {"l": 53.79800000000001, "t": 624.21255, "r": 294.27576, "b": 632.58717, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "of challenging layouts. As discussed in Section 2, object detection", "bbox": {"l": 53.79800000000001, "t": 635.17155, "r": 294.04144, "b": 643.54617, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "models are currently the easiest to use, due to the standardisation", "bbox": {"l": 53.79800000000001, "t": 646.13055, "r": 294.04163, "b": 654.50517, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "of ground-truth data in COCO format [16] and the availability of", "bbox": {"l": 53.79800000000001, "t": 657.0885499999999, "r": 294.0412, "b": 665.46317, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "general frameworks such as", "bbox": {"l": 53.79800000000001, "t": 668.04755, "r": 155.01054, "b": 676.42217, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "detectron2", "bbox": {"l": 157.23599, "t": 668.09238, "r": 193.26666, "b": 676.43114, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "[17]. Furthermore, baseline", "bbox": {"l": 195.867, "t": 668.04755, "r": 294.0473, "b": 676.42217, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "numbers in PubLayNet and DocBank were obtained using standard", "bbox": {"l": 53.79800000000001, "t": 679.0065500000001, "r": 294.04538, "b": 687.38117, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "object detection models such as Mask R-CNN and Faster R-CNN.", "bbox": {"l": 53.79800000000001, "t": 689.96555, "r": 295.4281, "b": 698.3401719999999, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "As such, we will relate to these object detection methods in this", "bbox": {"l": 53.484001, "t": 700.9245530000001, "r": 294.04413, "b": 709.299171, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The primary goal of DocLayNet is to obtain high-quality ML models capable of accurate document-layout analysis on a wide variety of challenging layouts. As discussed in Section 2, object detection models are currently the easiest to use, due to the standardisation of ground-truth data in COCO format [16] and the availability of general frameworks such as detectron2 [17]. Furthermore, baseline numbers in PubLayNet and DocBank were obtained using standard object detection models such as Mask R-CNN and Faster R-CNN. As such, we will relate to these object detection methods in this"}, {"label": "picture", "id": 6, "page_no": 5, "cluster": {"id": 6, "label": "picture", "bbox": {"l": 323.48431396484375, "t": 89.88603210449219, "r": 553.5411376953125, "b": 260.0107727050781, "coord_origin": "TOPLEFT"}, "confidence": 0.9782691597938538, "cells": [{"id": 131, "text": "0", "bbox": {"l": 349.16577, "t": 246.68017999999995, "r": 352.48175, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "20", "bbox": {"l": 385.93698, "t": 246.68017999999995, "r": 392.56894, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "40", "bbox": {"l": 424.366, "t": 246.68017999999995, "r": 430.99796, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "60", "bbox": {"l": 462.79504000000003, "t": 246.68017999999995, "r": 469.427, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "80", "bbox": {"l": 501.22406, "t": 246.68017999999995, "r": 507.85602, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "100", "bbox": {"l": 537.99524, "t": 246.68017999999995, "r": 547.94318, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "% of DocLayNet training set", "bbox": {"l": 410.28143, "t": 253.80840999999998, "r": 483.47278000000006, "b": 259.88251, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "50", "bbox": {"l": 330.93539, "t": 218.38464, "r": 337.56735, "b": 224.45874000000003, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "55", "bbox": {"l": 330.93539, "t": 192.08660999999995, "r": 337.56735, "b": 198.16071, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "60", "bbox": {"l": 330.93539, "t": 165.78864, "r": 337.56735, "b": 171.86273000000006, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "65", "bbox": {"l": 330.93539, "t": 139.49059999999997, "r": 337.56735, "b": 145.56470000000002, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "70", "bbox": {"l": 330.93539, "t": 113.19263000000001, "r": 337.56735, "b": 119.26671999999996, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "mAP 0.50:0.95", "bbox": {"l": 322.92276, "t": 148.37689, "r": 328.99686, "b": 186.79218000000003, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "10", "bbox": {"l": 470.97235, "t": 235.36676, "r": 477.6055, "b": 241.44086000000004, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "1", "bbox": {"l": 477.65662, "t": 234.82390999999996, "r": 479.97778000000005, "b": 239.07581000000005, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "10", "bbox": {"l": 531.55127, "t": 235.41234999999995, "r": 538.18445, "b": 241.48645, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "2", "bbox": {"l": 538.23553, "t": 234.86951, "r": 540.5567, "b": 239.1214, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "50", "bbox": {"l": 404.91125, "t": 216.00005999999996, "r": 411.54321, "b": 222.07416, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "55", "bbox": {"l": 404.91125, "t": 200.22125000000005, "r": 411.54321, "b": 206.29534999999998, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "60", "bbox": {"l": 404.91125, "t": 184.44244000000003, "r": 411.54321, "b": 190.51653999999996, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "65", "bbox": {"l": 404.91125, "t": 168.66364, "r": 411.54321, "b": 174.73773000000006, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "70", "bbox": {"l": 404.91125, "t": 152.88489000000004, "r": 411.54321, "b": 158.95898, "coord_origin": "TOPLEFT"}}], "children": [{"id": 92, "label": "text", "bbox": {"l": 349.16577, "t": 246.68017999999995, "r": 352.48175, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 131, "text": "0", "bbox": {"l": 349.16577, "t": 246.68017999999995, "r": 352.48175, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 385.93698, "t": 246.68017999999995, "r": 392.56894, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 132, "text": "20", "bbox": {"l": 385.93698, "t": 246.68017999999995, "r": 392.56894, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 424.366, "t": 246.68017999999995, "r": 430.99796, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 133, "text": "40", "bbox": {"l": 424.366, "t": 246.68017999999995, "r": 430.99796, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 462.79504000000003, "t": 246.68017999999995, "r": 469.427, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 134, "text": "60", "bbox": {"l": 462.79504000000003, "t": 246.68017999999995, "r": 469.427, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 501.22406, "t": 246.68017999999995, "r": 507.85602, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 135, "text": "80", "bbox": {"l": 501.22406, "t": 246.68017999999995, "r": 507.85602, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 537.99524, "t": 246.68017999999995, "r": 547.94318, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 136, "text": "100", "bbox": {"l": 537.99524, "t": 246.68017999999995, "r": 547.94318, "b": 252.75427000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 410.28143, "t": 253.80840999999998, "r": 483.47278000000006, "b": 259.88251, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 137, "text": "% of DocLayNet training set", "bbox": {"l": 410.28143, "t": 253.80840999999998, "r": 483.47278000000006, "b": 259.88251, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 330.93539, "t": 218.38464, "r": 337.56735, "b": 224.45874000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 138, "text": "50", "bbox": {"l": 330.93539, "t": 218.38464, "r": 337.56735, "b": 224.45874000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 330.93539, "t": 192.08660999999995, "r": 337.56735, "b": 198.16071, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 139, "text": "55", "bbox": {"l": 330.93539, "t": 192.08660999999995, "r": 337.56735, "b": 198.16071, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 330.93539, "t": 165.78864, "r": 337.56735, "b": 171.86273000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 140, "text": "60", "bbox": {"l": 330.93539, "t": 165.78864, "r": 337.56735, "b": 171.86273000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 330.93539, "t": 139.49059999999997, "r": 337.56735, "b": 145.56470000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 141, "text": "65", "bbox": {"l": 330.93539, "t": 139.49059999999997, "r": 337.56735, "b": 145.56470000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 330.93539, "t": 113.19263000000001, "r": 337.56735, "b": 119.26671999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 142, "text": "70", "bbox": {"l": 330.93539, "t": 113.19263000000001, "r": 337.56735, "b": 119.26671999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 322.92276, "t": 148.37689, "r": 328.99686, "b": 186.79218000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 143, "text": "mAP 0.50:0.95", "bbox": {"l": 322.92276, "t": 148.37689, "r": 328.99686, "b": 186.79218000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 470.97235, "t": 235.36676, "r": 477.6055, "b": 241.44086000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 144, "text": "10", "bbox": {"l": 470.97235, "t": 235.36676, "r": 477.6055, "b": 241.44086000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 477.65662, "t": 234.82390999999996, "r": 479.97778000000005, "b": 239.07581000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 145, "text": "1", "bbox": {"l": 477.65662, "t": 234.82390999999996, "r": 479.97778000000005, "b": 239.07581000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 531.55127, "t": 235.41234999999995, "r": 538.18445, "b": 241.48645, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 146, "text": "10", "bbox": {"l": 531.55127, "t": 235.41234999999995, "r": 538.18445, "b": 241.48645, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 538.23553, "t": 234.86951, "r": 540.5567, "b": 239.1214, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 147, "text": "2", "bbox": {"l": 538.23553, "t": 234.86951, "r": 540.5567, "b": 239.1214, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 404.91125, "t": 216.00005999999996, "r": 411.54321, "b": 222.07416, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 148, "text": "50", "bbox": {"l": 404.91125, "t": 216.00005999999996, "r": 411.54321, "b": 222.07416, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 404.91125, "t": 200.22125000000005, "r": 411.54321, "b": 206.29534999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 149, "text": "55", "bbox": {"l": 404.91125, "t": 200.22125000000005, "r": 411.54321, "b": 206.29534999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 404.91125, "t": 184.44244000000003, "r": 411.54321, "b": 190.51653999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 150, "text": "60", "bbox": {"l": 404.91125, "t": 184.44244000000003, "r": 411.54321, "b": 190.51653999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 404.91125, "t": 168.66364, "r": 411.54321, "b": 174.73773000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 151, "text": "65", "bbox": {"l": 404.91125, "t": 168.66364, "r": 411.54321, "b": 174.73773000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 404.91125, "t": 152.88489000000004, "r": 411.54321, "b": 158.95898, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 152, "text": "70", "bbox": {"l": 404.91125, "t": 152.88489000000004, "r": 411.54321, "b": 158.95898, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "caption", "id": 7, "page_no": 5, "cluster": {"id": 7, "label": "caption", "bbox": {"l": 317.95499, "t": 279.01599, "r": 559.80579, "b": 342.28418000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9639935493469238, "cells": [{"id": 153, "text": "Figure 5: Prediction performance (mAP@0.5-0.95) of a Mask", "bbox": {"l": 317.95499, "t": 279.01599, "r": 558.47876, "b": 287.48923, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "R-CNN network with ResNet50 backbone trained on increas-", "bbox": {"l": 317.95499, "t": 289.97501, "r": 559.80579, "b": 298.44824, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "ing fractions of the DocLayNet dataset. The learning curve", "bbox": {"l": 317.95499, "t": 300.93399, "r": 558.20068, "b": 309.40723, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "flattens around the 80% mark, indicating that increasing the", "bbox": {"l": 317.95499, "t": 311.89297, "r": 558.20062, "b": 320.36620999999997, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "size of the DocLayNet dataset with similar data will not yield", "bbox": {"l": 317.95499, "t": 322.85196, "r": 558.20074, "b": 331.3252, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "significantly better predictions.", "bbox": {"l": 317.95499, "t": 333.81094, "r": 445.24207, "b": 342.28418000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 5: Prediction performance (mAP@0.5-0.95) of a Mask R-CNN network with ResNet50 backbone trained on increasing fractions of the DocLayNet dataset. The learning curve flattens around the 80% mark, indicating that increasing the size of the DocLayNet dataset with similar data will not yield significantly better predictions."}, {"label": "text", "id": 8, "page_no": 5, "cluster": {"id": 8, "label": "text", "bbox": {"l": 317.95499, "t": 384.01154, "r": 558.20416, "b": 403.34517999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9594221711158752, "cells": [{"id": 159, "text": "paper and leave the detailed evaluation of more recent methods", "bbox": {"l": 317.95499, "t": 384.01154, "r": 558.20416, "b": 392.38617, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "mentioned in Section 2 for future work.", "bbox": {"l": 317.95499, "t": 394.97055, "r": 463.04938, "b": 403.34517999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "paper and leave the detailed evaluation of more recent methods mentioned in Section 2 for future work."}, {"label": "text", "id": 3, "page_no": 5, "cluster": {"id": 3, "label": "text", "bbox": {"l": 317.64099, "t": 405.92953, "r": 558.4364, "b": 480.05716, "coord_origin": "TOPLEFT"}, "confidence": 0.9872915148735046, "cells": [{"id": 161, "text": "In this section, we will present several aspects related to the", "bbox": {"l": 327.918, "t": 405.92953, "r": 558.19836, "b": 414.30417, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "performance of object detection models on DocLayNet. Similarly", "bbox": {"l": 317.95499, "t": 416.88855, "r": 558.4364, "b": 425.26318, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "as in PubLayNet, we will evaluate the quality of their predictions", "bbox": {"l": 317.95499, "t": 427.84653, "r": 558.20563, "b": 436.22116, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "using mean average precision (mAP) with 10 overlaps that range", "bbox": {"l": 317.95499, "t": 438.80554, "r": 558.20044, "b": 447.18018, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "from 0.5 to 0.95 in steps of 0.05 (mAP@0.5-0.95). These scores are", "bbox": {"l": 317.95499, "t": 449.76453000000004, "r": 558.19891, "b": 458.13916, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "computed by leveraging the evaluation code provided by the COCO", "bbox": {"l": 317.95499, "t": 460.72354, "r": 558.20239, "b": 469.09818, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "API [16].", "bbox": {"l": 317.64099, "t": 471.68253, "r": 350.32352, "b": 480.05716, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In this section, we will present several aspects related to the performance of object detection models on DocLayNet. Similarly as in PubLayNet, we will evaluate the quality of their predictions using mean average precision (mAP) with 10 overlaps that range from 0.5 to 0.95 in steps of 0.05 (mAP@0.5-0.95). These scores are computed by leveraging the evaluation code provided by the COCO API [16]."}, {"label": "section_header", "id": 9, "page_no": 5, "cluster": {"id": 9, "label": "section_header", "bbox": {"l": 317.95499, "t": 496.8219, "r": 466.8532400000001, "b": 507.13098, "coord_origin": "TOPLEFT"}, "confidence": 0.9579005241394043, "cells": [{"id": 168, "text": "Baselines for Object Detection", "bbox": {"l": 317.95499, "t": 496.8219, "r": 466.8532400000001, "b": 507.13098, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Baselines for Object Detection"}, {"label": "text", "id": 1, "page_no": 5, "cluster": {"id": 1, "label": "text", "bbox": {"l": 317.74899, "t": 512.02454, "r": 558.43085, "b": 706.700172, "coord_origin": "TOPLEFT"}, "confidence": 0.987722635269165, "cells": [{"id": 169, "text": "In Table 2, we present baseline experiments (given in mAP) on Mask", "bbox": {"l": 317.95499, "t": 512.02454, "r": 558.43085, "b": 520.39917, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "R-CNN [12], Faster R-CNN [11], and YOLOv5 [13]. Both training", "bbox": {"l": 317.95499, "t": 522.9835499999999, "r": 558.20117, "b": 531.35818, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "and evaluation were performed on RGB images with dimensions of", "bbox": {"l": 317.95499, "t": 533.94254, "r": 558.20233, "b": 542.31717, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "1025", "bbox": {"l": 317.74899, "t": 544.90155, "r": 334.09296, "b": 553.27617, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "\u00d7", "bbox": {"l": 334.81201, "t": 544.84775, "r": 340.51465, "b": 552.5499, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "1025 pixels. For training, we only used one annotation in case", "bbox": {"l": 341.233, "t": 544.90155, "r": 558.20117, "b": 553.27617, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "of redundantly annotated pages. As one can observe, the variation", "bbox": {"l": 317.95499, "t": 555.85956, "r": 558.20392, "b": 564.23418, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "in mAP between the models is rather low, but overall between 6", "bbox": {"l": 317.95499, "t": 566.8185599999999, "r": 558.2041, "b": 575.19318, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "and 10% lower than the mAP computed from the pairwise human", "bbox": {"l": 317.95499, "t": 577.77756, "r": 558.2052, "b": 586.15218, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "annotations on triple-annotated pages. This gives a good indication", "bbox": {"l": 317.95499, "t": 588.73656, "r": 558.20233, "b": 597.11118, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "that the DocLayNet dataset poses a worthwhile challenge for the", "bbox": {"l": 317.95499, "t": 599.69556, "r": 558.1983, "b": 608.0701799999999, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "research community to close the gap between human recognition", "bbox": {"l": 317.95499, "t": 610.65456, "r": 558.20502, "b": 619.02917, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "and ML approaches. It is interesting to see that Mask R-CNN and", "bbox": {"l": 317.95499, "t": 621.61356, "r": 558.20337, "b": 629.98817, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "Faster R-CNN produce very comparable mAP scores, indicating", "bbox": {"l": 317.95499, "t": 632.5725600000001, "r": 558.2041, "b": 640.94717, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "that pixel-based image segmentation derived from bounding-boxes", "bbox": {"l": 317.95499, "t": 643.53156, "r": 558.20245, "b": 651.90617, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "does not help to obtain better predictions. On the other hand, the", "bbox": {"l": 317.95499, "t": 654.49055, "r": 558.19757, "b": 662.86517, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": "more recent Yolov5x model does very well and even out-performs", "bbox": {"l": 317.95499, "t": 665.44855, "r": 558.20404, "b": 673.82317, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "humans on selected labels such as", "bbox": {"l": 317.95499, "t": 676.40755, "r": 444.54102, "b": 684.78217, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "Text", "bbox": {"l": 446.78900000000004, "t": 676.45238, "r": 461.95261000000005, "b": 684.79114, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": ",", "bbox": {"l": 461.95599000000004, "t": 676.40755, "r": 463.96805000000006, "b": 684.78217, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "Table", "bbox": {"l": 466.2170100000001, "t": 676.45238, "r": 485.66998000000007, "b": 684.79114, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "and", "bbox": {"l": 488.1290000000001, "t": 676.40755, "r": 501.89330999999993, "b": 684.78217, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "Picture", "bbox": {"l": 504.142, "t": 676.45238, "r": 529.21954, "b": 684.79114, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": ". This is", "bbox": {"l": 529.22101, "t": 676.40755, "r": 558.20392, "b": 684.78217, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "not entirely surprising, as", "bbox": {"l": 317.95499, "t": 687.36655, "r": 410.81366, "b": 695.741173, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "Text", "bbox": {"l": 413.05301, "t": 687.41138, "r": 427.67865, "b": 695.750137, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": ",", "bbox": {"l": 427.67801, "t": 687.36655, "r": 429.62103, "b": 695.741173, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "Table", "bbox": {"l": 431.86099, "t": 687.41138, "r": 450.62881000000004, "b": 695.750137, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "and", "bbox": {"l": 453.082, "t": 687.36655, "r": 466.37402, "b": 695.741173, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "Picture", "bbox": {"l": 468.61499, "t": 687.41138, "r": 492.83208999999994, "b": 695.750137, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "are abundant and", "bbox": {"l": 495.28201, "t": 687.36655, "r": 558.2005, "b": 695.741173, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "the most visually distinctive in a document.", "bbox": {"l": 317.95499, "t": 698.325554, "r": 477.53903, "b": 706.700172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In Table 2, we present baseline experiments (given in mAP) on Mask R-CNN [12], Faster R-CNN [11], and YOLOv5 [13]. Both training and evaluation were performed on RGB images with dimensions of 1025 \u00d7 1025 pixels. For training, we only used one annotation in case of redundantly annotated pages. As one can observe, the variation in mAP between the models is rather low, but overall between 6 and 10% lower than the mAP computed from the pairwise human annotations on triple-annotated pages. This gives a good indication that the DocLayNet dataset poses a worthwhile challenge for the research community to close the gap between human recognition and ML approaches. It is interesting to see that Mask R-CNN and Faster R-CNN produce very comparable mAP scores, indicating that pixel-based image segmentation derived from bounding-boxes does not help to obtain better predictions. On the other hand, the more recent Yolov5x model does very well and even out-performs humans on selected labels such as Text , Table and Picture . This is not entirely surprising, as Text , Table and Picture are abundant and the most visually distinctive in a document."}], "headers": [{"label": "page_header", "id": 11, "page_no": 5, "cluster": {"id": 11, "label": "page_header", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.8662876486778259, "cells": [{"id": 0, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 246.24382, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar", "bbox": {"l": 253.13897999999998, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "KDD '22, August 14-18, 2022, Washington, DC, USA Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar"}]}}, {"page_no": 6, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Table 3: Performance of a Mask R-CNN R50 network in", "bbox": {"l": 53.501999, "t": 86.87292000000002, "r": 294.0437, "b": 95.34618999999998, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "mAP@0.5-0.95 scores trained on DocLayNet with different", "bbox": {"l": 53.79800000000001, "t": 97.83191, "r": 294.04376, "b": 106.30517999999995, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "class label sets. The reduced label sets were obtained by ei-", "bbox": {"l": 53.79800000000001, "t": 108.79088999999999, "r": 295.64865, "b": 117.26415999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "ther down-mapping or dropping labels.", "bbox": {"l": 53.79800000000001, "t": 119.74987999999996, "r": 213.23856, "b": 128.22313999999994, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Class-count", "bbox": {"l": 86.372002, "t": 153.10051999999996, "r": 129.46452, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "11", "bbox": {"l": 151.07401, "t": 153.10051999999996, "r": 159.41275, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "6", "bbox": {"l": 179.31816, "t": 153.10051999999996, "r": 183.48753, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "5", "bbox": {"l": 213.33669, "t": 153.10051999999996, "r": 217.50606, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "4", "bbox": {"l": 247.35521, "t": 153.10051999999996, "r": 251.52458, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Caption", "bbox": {"l": 86.372002, "t": 164.45752000000005, "r": 115.55763, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "68", "bbox": {"l": 151.07401, "t": 164.45752000000005, "r": 159.41275, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Text", "bbox": {"l": 173.42723, "t": 164.45752000000005, "r": 189.38742, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Text", "bbox": {"l": 207.44576, "t": 164.45752000000005, "r": 223.40594000000002, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Text", "bbox": {"l": 241.46428, "t": 164.45752000000005, "r": 257.42447, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Footnote", "bbox": {"l": 86.372002, "t": 175.41656, "r": 118.8752, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "71", "bbox": {"l": 151.07401, "t": 175.41656, "r": 159.41275, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Text", "bbox": {"l": 173.42723, "t": 175.41656, "r": 189.38742, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Text", "bbox": {"l": 207.44576, "t": 175.41656, "r": 223.40594000000002, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Text", "bbox": {"l": 241.46428, "t": 175.41656, "r": 257.42447, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Formula", "bbox": {"l": 86.372002, "t": 186.37554999999998, "r": 116.88466, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "60", "bbox": {"l": 151.07401, "t": 186.37554999999998, "r": 159.41275, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Text", "bbox": {"l": 173.42723, "t": 186.37554999999998, "r": 189.38742, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "Text", "bbox": {"l": 207.44576, "t": 186.37554999999998, "r": 223.40594000000002, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "Text", "bbox": {"l": 241.46428, "t": 186.37554999999998, "r": 257.42447, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "List-item", "bbox": {"l": 86.372002, "t": 197.33452999999997, "r": 119.25179, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "81", "bbox": {"l": 151.07401, "t": 197.33452999999997, "r": 159.41275, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Text", "bbox": {"l": 173.42723, "t": 197.33452999999997, "r": 189.38742, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "82", "bbox": {"l": 211.25647, "t": 197.33452999999997, "r": 219.59521, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Text", "bbox": {"l": 241.46426, "t": 197.33452999999997, "r": 257.42447, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Page-footer", "bbox": {"l": 86.372002, "t": 208.29351999999994, "r": 128.89964, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "62", "bbox": {"l": 151.07401, "t": 208.29351999999994, "r": 159.41275, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "62", "bbox": {"l": 177.23795, "t": 208.29351999999994, "r": 185.57669, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "-", "bbox": {"l": 213.91052, "t": 208.29351999999994, "r": 216.94116, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "-", "bbox": {"l": 247.92905000000002, "t": 208.29351999999994, "r": 250.95969, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Page-header", "bbox": {"l": 86.372002, "t": 219.25256000000002, "r": 131.65231, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "72", "bbox": {"l": 151.07401, "t": 219.25256000000002, "r": 159.41275, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "68", "bbox": {"l": 177.23795, "t": 219.25256000000002, "r": 185.57669, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "-", "bbox": {"l": 213.91052, "t": 219.25256000000002, "r": 216.94116, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "-", "bbox": {"l": 247.92905000000002, "t": 219.25256000000002, "r": 250.95969, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Picture", "bbox": {"l": 86.372002, "t": 230.21155, "r": 112.35663, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "72", "bbox": {"l": 151.07401, "t": 230.21155, "r": 159.41275, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "72", "bbox": {"l": 177.23795, "t": 230.21155, "r": 185.57669, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "72", "bbox": {"l": 211.25645, "t": 230.21155, "r": 219.5952, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "72", "bbox": {"l": 245.27496, "t": 230.21155, "r": 253.61371, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "Section-header", "bbox": {"l": 86.372002, "t": 241.16956000000005, "r": 141.11188, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "68", "bbox": {"l": 151.07401, "t": 241.16956000000005, "r": 159.41275, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "67", "bbox": {"l": 177.23795, "t": 241.16956000000005, "r": 185.57669, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "69", "bbox": {"l": 211.25645, "t": 241.16956000000005, "r": 219.5952, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "68", "bbox": {"l": 245.27496, "t": 241.16956000000005, "r": 253.61371, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Table", "bbox": {"l": 86.372002, "t": 252.12854000000004, "r": 106.17878, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "82", "bbox": {"l": 151.07401, "t": 252.12854000000004, "r": 159.41275, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "83", "bbox": {"l": 177.23795, "t": 252.12854000000004, "r": 185.57669, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "82", "bbox": {"l": 211.25645, "t": 252.12854000000004, "r": 219.5952, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "82", "bbox": {"l": 245.27496, "t": 252.12854000000004, "r": 253.61371, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Text", "bbox": {"l": 86.372002, "t": 263.08752000000004, "r": 102.3322, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "85", "bbox": {"l": 151.07401, "t": 263.08752000000004, "r": 159.41275, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "84", "bbox": {"l": 177.23795, "t": 263.08752000000004, "r": 185.57669, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "84", "bbox": {"l": 211.25645, "t": 263.08752000000004, "r": 219.5952, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "84", "bbox": {"l": 245.27496, "t": 263.08752000000004, "r": 253.61371, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "Title", "bbox": {"l": 86.372002, "t": 274.04657, "r": 103.36333, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "77", "bbox": {"l": 151.07401, "t": 274.04657, "r": 159.41275, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "Sec.-h.", "bbox": {"l": 169.37442, "t": 274.04657, "r": 193.43127, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "Sec.-h.", "bbox": {"l": 203.39294, "t": 274.04657, "r": 227.4498, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "Sec.-h.", "bbox": {"l": 237.41147, "t": 274.04657, "r": 261.46832, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "Overall", "bbox": {"l": 86.372002, "t": 285.40454, "r": 113.31602000000001, "b": 293.77917, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "72", "bbox": {"l": 151.07401, "t": 285.40454, "r": 159.41275, "b": 293.77917, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "73", "bbox": {"l": 177.23795, "t": 285.40454, "r": 185.57669, "b": 293.77917, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "78", "bbox": {"l": 211.25645, "t": 285.40454, "r": 219.5952, "b": 293.77917, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "77", "bbox": {"l": 245.27496, "t": 285.40454, "r": 253.61371, "b": 293.77917, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Learning Curve", "bbox": {"l": 53.79800000000001, "t": 319.56992, "r": 131.05624, "b": 329.879, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "One of the fundamental questions related to any dataset is if it is", "bbox": {"l": 53.79800000000001, "t": 334.77155, "r": 294.04153, "b": 343.14618, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "\u201clarge enough\u201d. To answer this question for DocLayNet, we per-", "bbox": {"l": 52.785, "t": 345.73053, "r": 295.55835, "b": 354.10516000000007, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "formed a data ablation study in which we evaluated a Mask R-CNN", "bbox": {"l": 53.79800000000001, "t": 356.6895400000001, "r": 294.04535, "b": 365.06418, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "model trained on increasing fractions of the DocLayNet dataset.", "bbox": {"l": 53.79800000000001, "t": 367.64853, "r": 295.4281, "b": 376.02316, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "As can be seen in Figure 5, the mAP score rises sharply in the be-", "bbox": {"l": 53.484001, "t": 378.60754, "r": 295.55667, "b": 386.98218, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "ginning and eventually levels out. To estimate the error-bar on the", "bbox": {"l": 53.79800000000001, "t": 389.56653, "r": 294.04865, "b": 397.94116, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "metrics, we ran the training five times on the entire data-set. This", "bbox": {"l": 53.79800000000001, "t": 400.52554000000003, "r": 294.04376, "b": 408.90018, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "resulted in a 1% error-bar, depicted by the shaded area in Figure 5.", "bbox": {"l": 53.79800000000001, "t": 411.48456, "r": 295.42459, "b": 419.85919, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "In the inset of Figure 5, we show the exact same data-points, but", "bbox": {"l": 53.79800000000001, "t": 422.44354, "r": 294.04709, "b": 430.81818, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "with a logarithmic scale on the x-axis. As is expected, the mAP", "bbox": {"l": 53.466999, "t": 433.40253000000007, "r": 294.04535, "b": 441.7771599999999, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "score increases linearly as a function of the data-size in the inset.", "bbox": {"l": 53.79800000000001, "t": 444.36053000000004, "r": 295.42902, "b": 452.73517, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "The curve ultimately flattens out between the 80% and 100% mark,", "bbox": {"l": 53.528999, "t": 455.31955, "r": 295.03122, "b": 463.69418, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "with the 80% mark falling within the error-bars of the 100% mark.", "bbox": {"l": 53.466999, "t": 466.27853, "r": 295.42154, "b": 474.65317, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "This provides a good indication that the model would not improve", "bbox": {"l": 53.528999, "t": 477.23755, "r": 294.04553, "b": 485.61218, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "significantly by yet increasing the data size. Rather, it would prob-", "bbox": {"l": 53.79800000000001, "t": 488.19653, "r": 295.55646, "b": 496.57117, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "ably benefit more from improved data consistency (as discussed", "bbox": {"l": 53.79800000000001, "t": 499.15555, "r": 294.04715, "b": 507.53018, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "in Section 3), data augmentation methods [23], or the addition of", "bbox": {"l": 53.79800000000001, "t": 510.11453, "r": 294.04245, "b": 518.4891700000001, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "more document categories and styles.", "bbox": {"l": 53.79800000000001, "t": 521.0735500000001, "r": 191.47707, "b": 529.44818, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "Impact of Class Labels", "bbox": {"l": 53.79800000000001, "t": 542.50992, "r": 164.32898, "b": 552.81902, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "The choice and number of labels can have a significant effect on", "bbox": {"l": 53.528999, "t": 557.71155, "r": 294.04333, "b": 566.08617, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "the overall model performance. Since PubLayNet, DocBank and", "bbox": {"l": 53.79800000000001, "t": 568.6705499999999, "r": 294.04712, "b": 577.04517, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "DocLayNet all have different label sets, it is of particular interest to", "bbox": {"l": 53.79800000000001, "t": 579.62955, "r": 294.04538, "b": 588.0041699999999, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "understand and quantify this influence of the label set on the model", "bbox": {"l": 53.79800000000001, "t": 590.5885499999999, "r": 294.04535, "b": 598.96317, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "performance. We investigate this by either down-mapping labels", "bbox": {"l": 53.79800000000001, "t": 601.54755, "r": 294.04266, "b": 609.92216, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "into more common ones (e.g.", "bbox": {"l": 53.79800000000001, "t": 612.50656, "r": 163.59247, "b": 620.88118, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "Caption", "bbox": {"l": 166.26401, "t": 612.55139, "r": 194.97244, "b": 620.89015, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "\u2192", "bbox": {"l": 194.994, "t": 612.45276, "r": 204.1756, "b": 620.15491, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "Text", "bbox": {"l": 204.17599, "t": 612.55139, "r": 219.33961000000002, "b": 620.89015, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": ") or excluding them", "bbox": {"l": 219.849, "t": 612.50656, "r": 294.04828, "b": 620.88118, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "from the annotations entirely. Furthermore, it must be stressed", "bbox": {"l": 53.79800000000001, "t": 623.46556, "r": 294.04709, "b": 631.84018, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "that all mappings and exclusions were performed on the data be-", "bbox": {"l": 53.79800000000001, "t": 634.42355, "r": 295.55679, "b": 642.79817, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "fore model training. In Table 3, we present the mAP scores for a", "bbox": {"l": 53.79800000000001, "t": 645.38255, "r": 294.04715, "b": 653.75717, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "Mask R-CNN R50 network on different label sets. Where a label", "bbox": {"l": 53.79800000000001, "t": 656.34155, "r": 294.04715, "b": 664.71617, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "is down-mapped, we show its corresponding label, otherwise it", "bbox": {"l": 53.79800000000001, "t": 667.30055, "r": 294.04712, "b": 675.67517, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "was excluded. We present three different label sets, with 6, 5 and 4", "bbox": {"l": 53.466999, "t": 678.25955, "r": 294.25174, "b": 686.63417, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "different labels respectively. The set of 5 labels contains the same", "bbox": {"l": 53.79800000000001, "t": 689.21855, "r": 294.04639, "b": 697.59317, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "labels as PubLayNet. However, due to the different definition of", "bbox": {"l": 53.79800000000001, "t": 700.177551, "r": 294.04712, "b": 708.55217, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "Table 4: Performance of a Mask R-CNN R50 network with", "bbox": {"l": 317.659, "t": 86.87298999999996, "r": 558.20068, "b": 95.34625000000017, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "document-wise and page-wise split for different label sets.", "bbox": {"l": 317.95499, "t": 97.83196999999996, "r": 559.73401, "b": 106.30524000000003, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "Naive page-wise split will result in", "bbox": {"l": 317.95499, "t": 108.79094999999995, "r": 467.72089, "b": 117.26422000000014, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "GLYPH<tildelow>", "bbox": {"l": 471.90900000000005, "t": 107.12798999999995, "r": 477.53900000000004, "b": 115.19768999999997, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "10% point improve-", "bbox": {"l": 477.54001000000005, "t": 108.79094999999995, "r": 559.80682, "b": 117.26422000000014, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "ment.", "bbox": {"l": 317.95502, "t": 119.74993999999992, "r": 341.37524, "b": 128.22321, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "Class-count", "bbox": {"l": 358.63901, "t": 153.10051999999996, "r": 401.73154, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "11", "bbox": {"l": 440.22501, "t": 153.10051999999996, "r": 448.56375, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "5", "bbox": {"l": 494.38, "t": 153.10051999999996, "r": 498.54938, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "Split", "bbox": {"l": 358.63901, "t": 164.05951000000005, "r": 375.27167, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "Doc", "bbox": {"l": 423.341, "t": 164.05951000000005, "r": 438.0459, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "Page", "bbox": {"l": 448.00757, "t": 164.05951000000005, "r": 465.4472, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "Doc", "bbox": {"l": 475.41101, "t": 164.05951000000005, "r": 490.11591, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Page", "bbox": {"l": 500.07757999999995, "t": 164.05951000000005, "r": 517.51721, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "Caption", "bbox": {"l": 358.63901, "t": 175.41656, "r": 387.82465, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "68", "bbox": {"l": 426.52399, "t": 175.41656, "r": 434.86273, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "83", "bbox": {"l": 452.56240999999994, "t": 175.41656, "r": 460.90115000000003, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "Footnote", "bbox": {"l": 358.63901, "t": 186.37554999999998, "r": 391.14221, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "71", "bbox": {"l": 426.52399, "t": 186.37554999999998, "r": 434.86273, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "84", "bbox": {"l": 452.56240999999994, "t": 186.37554999999998, "r": 460.90115000000003, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "Formula", "bbox": {"l": 358.63901, "t": 197.33452999999997, "r": 389.15167, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "60", "bbox": {"l": 426.52399, "t": 197.33452999999997, "r": 434.86273, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "66", "bbox": {"l": 452.56240999999994, "t": 197.33452999999997, "r": 460.90115000000003, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "List-item", "bbox": {"l": 358.63901, "t": 208.29351999999994, "r": 391.5188, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "81", "bbox": {"l": 426.52399, "t": 208.29351999999994, "r": 434.86273, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "88", "bbox": {"l": 452.56240999999994, "t": 208.29351999999994, "r": 460.90115000000003, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "82", "bbox": {"l": 478.59399, "t": 208.29351999999994, "r": 486.93274, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "88", "bbox": {"l": 504.6324200000001, "t": 208.29351999999994, "r": 512.97119, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "Page-footer", "bbox": {"l": 358.63901, "t": 219.25256000000002, "r": 401.16666, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "62", "bbox": {"l": 426.52399, "t": 219.25256000000002, "r": 434.86273, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "89", "bbox": {"l": 452.56240999999994, "t": 219.25256000000002, "r": 460.90115000000003, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "Page-header", "bbox": {"l": 358.63901, "t": 230.21155, "r": 403.91931, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "72", "bbox": {"l": 426.52399, "t": 230.21155, "r": 434.86273, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "90", "bbox": {"l": 452.56240999999994, "t": 230.21155, "r": 460.90115000000003, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "Picture", "bbox": {"l": 358.63901, "t": 241.16956000000005, "r": 384.62366, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "72", "bbox": {"l": 426.52399, "t": 241.16956000000005, "r": 434.86273, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "82", "bbox": {"l": 452.56240999999994, "t": 241.16956000000005, "r": 460.90115000000003, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "72", "bbox": {"l": 478.59399, "t": 241.16956000000005, "r": 486.93274, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "82", "bbox": {"l": 504.6324200000001, "t": 241.16956000000005, "r": 512.97119, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "Section-header", "bbox": {"l": 358.63901, "t": 252.12854000000004, "r": 413.37891, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "68", "bbox": {"l": 426.52399, "t": 252.12854000000004, "r": 434.86273, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "83", "bbox": {"l": 452.56240999999994, "t": 252.12854000000004, "r": 460.90115000000003, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "69", "bbox": {"l": 478.59399, "t": 252.12854000000004, "r": 486.93274, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "83", "bbox": {"l": 504.6324200000001, "t": 252.12854000000004, "r": 512.97119, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "Table", "bbox": {"l": 358.63901, "t": 263.08752000000004, "r": 378.44577, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "82", "bbox": {"l": 426.52399, "t": 263.08752000000004, "r": 434.86273, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "89", "bbox": {"l": 452.56240999999994, "t": 263.08752000000004, "r": 460.90115000000003, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "82", "bbox": {"l": 478.59399, "t": 263.08752000000004, "r": 486.93274, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "90", "bbox": {"l": 504.6324200000001, "t": 263.08752000000004, "r": 512.97119, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "Text", "bbox": {"l": 358.63901, "t": 274.04657, "r": 374.59921, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "85", "bbox": {"l": 426.52399, "t": 274.04657, "r": 434.86273, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "91", "bbox": {"l": 452.56240999999994, "t": 274.04657, "r": 460.90115000000003, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "84", "bbox": {"l": 478.59399, "t": 274.04657, "r": 486.93274, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "90", "bbox": {"l": 504.6324200000001, "t": 274.04657, "r": 512.97119, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "Title", "bbox": {"l": 358.63901, "t": 285.00552, "r": 375.63034, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "77", "bbox": {"l": 426.52399, "t": 285.00552, "r": 434.86273, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "81", "bbox": {"l": 452.56240999999994, "t": 285.00552, "r": 460.90115000000003, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "All", "bbox": {"l": 358.63901, "t": 296.36255, "r": 369.60492, "b": 304.73718, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "72", "bbox": {"l": 426.52399, "t": 296.36255, "r": 434.86273, "b": 304.73718, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "84", "bbox": {"l": 452.56240999999994, "t": 296.36255, "r": 460.90115000000003, "b": 304.73718, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "78", "bbox": {"l": 478.59399, "t": 296.36255, "r": 486.93274, "b": 304.73718, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "87", "bbox": {"l": 504.6324200000001, "t": 296.36255, "r": 512.97119, "b": 304.73718, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": "lists in PubLayNet (grouped list-items) versus DocLayNet (separate", "bbox": {"l": 317.95499, "t": 331.40353, "r": 558.20233, "b": 339.77817, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "list-items), the label set of size 4 is the closest to PubLayNet, in the", "bbox": {"l": 317.95499, "t": 342.36255, "r": 558.2005, "b": 350.73718, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "assumption that the", "bbox": {"l": 317.95499, "t": 353.32153, "r": 393.16028, "b": 361.69617000000005, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "List", "bbox": {"l": 395.84201, "t": 353.36639, "r": 409.14905, "b": 361.70514, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "is down-mapped to", "bbox": {"l": 412.33301, "t": 353.32153, "r": 485.02324999999996, "b": 361.69617000000005, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "Text", "bbox": {"l": 487.70401, "t": 353.36639, "r": 502.86761, "b": 361.70514, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "in PubLayNet.", "bbox": {"l": 506.05499, "t": 353.32153, "r": 559.58496, "b": 361.69617000000005, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "The results in Table 3 show that the prediction accuracy on the", "bbox": {"l": 317.686, "t": 364.28054999999995, "r": 558.2002, "b": 372.65518, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "remaining class labels does not change significantly when other", "bbox": {"l": 317.95499, "t": 375.23853, "r": 558.36877, "b": 383.61316, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "classes are merged into them. The overall macro-average improves", "bbox": {"l": 317.95499, "t": 386.19754, "r": 558.19958, "b": 394.57217, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "by around 5%, in particular when", "bbox": {"l": 317.95499, "t": 397.15652, "r": 439.49454, "b": 405.53116000000006, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "Page-footer", "bbox": {"l": 441.728, "t": 397.20139, "r": 481.8616, "b": 405.54013, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "and", "bbox": {"l": 484.74298, "t": 397.15652, "r": 498.23743, "b": 405.53116000000006, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "Page-header", "bbox": {"l": 500.47299, "t": 397.20139, "r": 543.95105, "b": 405.54013, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": "are", "bbox": {"l": 546.83197, "t": 397.15652, "r": 558.20142, "b": 405.53116000000006, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "excluded.", "bbox": {"l": 317.95496, "t": 408.11553999999995, "r": 352.37698, "b": 416.49017, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "Impact of Document Split in Train and Test Set", "bbox": {"l": 317.95496, "t": 429.3949, "r": 549.8606, "b": 439.70398, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": "Many documents in DocLayNet have a unique styling. In order", "bbox": {"l": 317.95499, "t": 444.59653, "r": 558.36884, "b": 452.97116, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "to avoid overfitting on a particular style, we have split the train-,", "bbox": {"l": 317.95499, "t": 455.55554, "r": 559.19189, "b": 463.93018, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "test- and validation-sets of DocLayNet on document boundaries, i.e.", "bbox": {"l": 317.95499, "t": 466.51453, "r": 559.58185, "b": 474.88916, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "every document contributes pages to only one set. To the best of", "bbox": {"l": 317.95499, "t": 477.47354, "r": 558.20605, "b": 485.84818, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": "our knowledge, this was not considered in PubLayNet or DocBank.", "bbox": {"l": 317.95499, "t": 488.43253, "r": 559.58203, "b": 496.80716, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "To quantify how this affects model performance, we trained and", "bbox": {"l": 317.686, "t": 499.39154, "r": 558.20032, "b": 507.76617, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "evaluated a Mask R-CNN R50 model on a modified dataset version.", "bbox": {"l": 317.95499, "t": 510.35052, "r": 559.5849, "b": 518.72516, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "Here, the train-, test- and validation-sets were obtained by a ran-", "bbox": {"l": 317.95499, "t": 521.30954, "r": 559.71381, "b": 529.68417, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "domised draw over the individual pages. As can be seen in Table 4,", "bbox": {"l": 317.95499, "t": 532.26855, "r": 559.18707, "b": 540.64317, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "the difference in model performance is surprisingly large: page-", "bbox": {"l": 317.95499, "t": 543.22655, "r": 559.71313, "b": 551.60117, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "wise splitting gains", "bbox": {"l": 317.62299, "t": 554.18555, "r": 388.35168, "b": 562.56017, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "\u02dc", "bbox": {"l": 391.36499, "t": 552.50055, "r": 393.98318, "b": 560.87517, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "10% in mAP over the document-wise splitting.", "bbox": {"l": 390.59, "t": 554.18555, "r": 559.58191, "b": 562.56017, "coord_origin": "TOPLEFT"}}, {"id": 201, "text": "Thus, random page-wise splitting of DocLayNet can easily lead", "bbox": {"l": 317.686, "t": 565.14455, "r": 558.20032, "b": 573.51917, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": "to accidental overestimation of model performance and should be", "bbox": {"l": 317.95499, "t": 576.10356, "r": 558.20508, "b": 584.4781800000001, "coord_origin": "TOPLEFT"}}, {"id": 203, "text": "avoided.", "bbox": {"l": 317.95499, "t": 587.06256, "r": 348.50354, "b": 595.43718, "coord_origin": "TOPLEFT"}}, {"id": 204, "text": "Dataset Comparison", "bbox": {"l": 317.95499, "t": 608.34192, "r": 418.54776, "b": 618.65102, "coord_origin": "TOPLEFT"}}, {"id": 205, "text": "Throughout this paper, we claim that DocLayNet\u2019s wider variety of", "bbox": {"l": 317.686, "t": 623.54355, "r": 558.20575, "b": 631.91817, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": "document layouts leads to more robust layout detection models. In", "bbox": {"l": 317.95499, "t": 634.50255, "r": 558.20624, "b": 642.87717, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": "Table 5, we provide evidence for that. We trained models on each", "bbox": {"l": 317.686, "t": 645.46155, "r": 558.20319, "b": 653.83617, "coord_origin": "TOPLEFT"}}, {"id": 208, "text": "of the available datasets (PubLayNet, DocBank and DocLayNet)", "bbox": {"l": 317.95499, "t": 656.42055, "r": 558.74377, "b": 664.79517, "coord_origin": "TOPLEFT"}}, {"id": 209, "text": "and evaluated them on the test sets of the other datasets. Due to", "bbox": {"l": 317.95499, "t": 667.37955, "r": 558.20398, "b": 675.7541699999999, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": "the different label sets and annotation styles, a direct comparison", "bbox": {"l": 317.95499, "t": 678.3385499999999, "r": 558.20062, "b": 686.71317, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "is not possible. Hence, we focussed on the common labels among", "bbox": {"l": 317.95499, "t": 689.29755, "r": 558.20343, "b": 697.672173, "coord_origin": "TOPLEFT"}}, {"id": 212, "text": "the datasets. Between PubLayNet and DocLayNet, these are", "bbox": {"l": 317.95499, "t": 700.256554, "r": 531.07666, "b": 708.631172, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "Picture", "bbox": {"l": 533.16199, "t": 700.301384, "r": 557.2561, "b": 708.640137, "coord_origin": "TOPLEFT"}}, {"id": 214, "text": ",", "bbox": {"l": 557.255, "t": 700.256554, "r": 559.18817, "b": 708.631172, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 12, "label": "page_header", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.9316118955612183, "cells": [{"id": 0, "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "page_header", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.9318180084228516, "cells": [{"id": 1, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 53.501999, "t": 86.87292000000002, "r": 295.64865, "b": 128.22313999999994, "coord_origin": "TOPLEFT"}, "confidence": 0.8296934366226196, "cells": [{"id": 2, "text": "Table 3: Performance of a Mask R-CNN R50 network in", "bbox": {"l": 53.501999, "t": 86.87292000000002, "r": 294.0437, "b": 95.34618999999998, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "mAP@0.5-0.95 scores trained on DocLayNet with different", "bbox": {"l": 53.79800000000001, "t": 97.83191, "r": 294.04376, "b": 106.30517999999995, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "class label sets. The reduced label sets were obtained by ei-", "bbox": {"l": 53.79800000000001, "t": 108.79088999999999, "r": 295.64865, "b": 117.26415999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "ther down-mapping or dropping labels.", "bbox": {"l": 53.79800000000001, "t": 119.74987999999996, "r": 213.23856, "b": 128.22313999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "table", "bbox": {"l": 80.35525512695312, "t": 150.93629455566406, "r": 267.0082092285156, "b": 295.4454650878906, "coord_origin": "TOPLEFT"}, "confidence": 0.9869412779808044, "cells": [{"id": 6, "text": "Class-count", "bbox": {"l": 86.372002, "t": 153.10051999999996, "r": 129.46452, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "11", "bbox": {"l": 151.07401, "t": 153.10051999999996, "r": 159.41275, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "6", "bbox": {"l": 179.31816, "t": 153.10051999999996, "r": 183.48753, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "5", "bbox": {"l": 213.33669, "t": 153.10051999999996, "r": 217.50606, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "4", "bbox": {"l": 247.35521, "t": 153.10051999999996, "r": 251.52458, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Caption", "bbox": {"l": 86.372002, "t": 164.45752000000005, "r": 115.55763, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "68", "bbox": {"l": 151.07401, "t": 164.45752000000005, "r": 159.41275, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Text", "bbox": {"l": 173.42723, "t": 164.45752000000005, "r": 189.38742, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Text", "bbox": {"l": 207.44576, "t": 164.45752000000005, "r": 223.40594000000002, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Text", "bbox": {"l": 241.46428, "t": 164.45752000000005, "r": 257.42447, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Footnote", "bbox": {"l": 86.372002, "t": 175.41656, "r": 118.8752, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "71", "bbox": {"l": 151.07401, "t": 175.41656, "r": 159.41275, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Text", "bbox": {"l": 173.42723, "t": 175.41656, "r": 189.38742, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Text", "bbox": {"l": 207.44576, "t": 175.41656, "r": 223.40594000000002, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Text", "bbox": {"l": 241.46428, "t": 175.41656, "r": 257.42447, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Formula", "bbox": {"l": 86.372002, "t": 186.37554999999998, "r": 116.88466, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "60", "bbox": {"l": 151.07401, "t": 186.37554999999998, "r": 159.41275, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Text", "bbox": {"l": 173.42723, "t": 186.37554999999998, "r": 189.38742, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "Text", "bbox": {"l": 207.44576, "t": 186.37554999999998, "r": 223.40594000000002, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "Text", "bbox": {"l": 241.46428, "t": 186.37554999999998, "r": 257.42447, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "List-item", "bbox": {"l": 86.372002, "t": 197.33452999999997, "r": 119.25179, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "81", "bbox": {"l": 151.07401, "t": 197.33452999999997, "r": 159.41275, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Text", "bbox": {"l": 173.42723, "t": 197.33452999999997, "r": 189.38742, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "82", "bbox": {"l": 211.25647, "t": 197.33452999999997, "r": 219.59521, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Text", "bbox": {"l": 241.46426, "t": 197.33452999999997, "r": 257.42447, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Page-footer", "bbox": {"l": 86.372002, "t": 208.29351999999994, "r": 128.89964, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "62", "bbox": {"l": 151.07401, "t": 208.29351999999994, "r": 159.41275, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "62", "bbox": {"l": 177.23795, "t": 208.29351999999994, "r": 185.57669, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "-", "bbox": {"l": 213.91052, "t": 208.29351999999994, "r": 216.94116, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "-", "bbox": {"l": 247.92905000000002, "t": 208.29351999999994, "r": 250.95969, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Page-header", "bbox": {"l": 86.372002, "t": 219.25256000000002, "r": 131.65231, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "72", "bbox": {"l": 151.07401, "t": 219.25256000000002, "r": 159.41275, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "68", "bbox": {"l": 177.23795, "t": 219.25256000000002, "r": 185.57669, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "-", "bbox": {"l": 213.91052, "t": 219.25256000000002, "r": 216.94116, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "-", "bbox": {"l": 247.92905000000002, "t": 219.25256000000002, "r": 250.95969, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Picture", "bbox": {"l": 86.372002, "t": 230.21155, "r": 112.35663, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "72", "bbox": {"l": 151.07401, "t": 230.21155, "r": 159.41275, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "72", "bbox": {"l": 177.23795, "t": 230.21155, "r": 185.57669, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "72", "bbox": {"l": 211.25645, "t": 230.21155, "r": 219.5952, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "72", "bbox": {"l": 245.27496, "t": 230.21155, "r": 253.61371, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "Section-header", "bbox": {"l": 86.372002, "t": 241.16956000000005, "r": 141.11188, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "68", "bbox": {"l": 151.07401, "t": 241.16956000000005, "r": 159.41275, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "67", "bbox": {"l": 177.23795, "t": 241.16956000000005, "r": 185.57669, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "69", "bbox": {"l": 211.25645, "t": 241.16956000000005, "r": 219.5952, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "68", "bbox": {"l": 245.27496, "t": 241.16956000000005, "r": 253.61371, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Table", "bbox": {"l": 86.372002, "t": 252.12854000000004, "r": 106.17878, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "82", "bbox": {"l": 151.07401, "t": 252.12854000000004, "r": 159.41275, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "83", "bbox": {"l": 177.23795, "t": 252.12854000000004, "r": 185.57669, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "82", "bbox": {"l": 211.25645, "t": 252.12854000000004, "r": 219.5952, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "82", "bbox": {"l": 245.27496, "t": 252.12854000000004, "r": 253.61371, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Text", "bbox": {"l": 86.372002, "t": 263.08752000000004, "r": 102.3322, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "85", "bbox": {"l": 151.07401, "t": 263.08752000000004, "r": 159.41275, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "84", "bbox": {"l": 177.23795, "t": 263.08752000000004, "r": 185.57669, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "84", "bbox": {"l": 211.25645, "t": 263.08752000000004, "r": 219.5952, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "84", "bbox": {"l": 245.27496, "t": 263.08752000000004, "r": 253.61371, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "Title", "bbox": {"l": 86.372002, "t": 274.04657, "r": 103.36333, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "77", "bbox": {"l": 151.07401, "t": 274.04657, "r": 159.41275, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "Sec.-h.", "bbox": {"l": 169.37442, "t": 274.04657, "r": 193.43127, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "Sec.-h.", "bbox": {"l": 203.39294, "t": 274.04657, "r": 227.4498, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "Sec.-h.", "bbox": {"l": 237.41147, "t": 274.04657, "r": 261.46832, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "Overall", "bbox": {"l": 86.372002, "t": 285.40454, "r": 113.31602000000001, "b": 293.77917, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "72", "bbox": {"l": 151.07401, "t": 285.40454, "r": 159.41275, "b": 293.77917, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "73", "bbox": {"l": 177.23795, "t": 285.40454, "r": 185.57669, "b": 293.77917, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "78", "bbox": {"l": 211.25645, "t": 285.40454, "r": 219.5952, "b": 293.77917, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "77", "bbox": {"l": 245.27496, "t": 285.40454, "r": 253.61371, "b": 293.77917, "coord_origin": "TOPLEFT"}}], "children": [{"id": 15, "label": "text", "bbox": {"l": 86.372002, "t": 153.10051999999996, "r": 129.46452, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": "Class-count", "bbox": {"l": 86.372002, "t": 153.10051999999996, "r": 129.46452, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 151.07401, "t": 153.10051999999996, "r": 159.41275, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "11", "bbox": {"l": 151.07401, "t": 153.10051999999996, "r": 159.41275, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 179.31816, "t": 153.10051999999996, "r": 183.48753, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "6", "bbox": {"l": 179.31816, "t": 153.10051999999996, "r": 183.48753, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 213.33669, "t": 153.10051999999996, "r": 217.50606, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "5", "bbox": {"l": 213.33669, "t": 153.10051999999996, "r": 217.50606, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 247.35521, "t": 153.10051999999996, "r": 251.52458, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "4", "bbox": {"l": 247.35521, "t": 153.10051999999996, "r": 251.52458, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 86.372002, "t": 164.45752000000005, "r": 115.55763, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "Caption", "bbox": {"l": 86.372002, "t": 164.45752000000005, "r": 115.55763, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 151.07401, "t": 164.45752000000005, "r": 159.41275, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "68", "bbox": {"l": 151.07401, "t": 164.45752000000005, "r": 159.41275, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 173.42723, "t": 164.45752000000005, "r": 189.38742, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "Text", "bbox": {"l": 173.42723, "t": 164.45752000000005, "r": 189.38742, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 207.44576, "t": 164.45752000000005, "r": 223.40594000000002, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "Text", "bbox": {"l": 207.44576, "t": 164.45752000000005, "r": 223.40594000000002, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 241.46428, "t": 164.45752000000005, "r": 257.42447, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "Text", "bbox": {"l": 241.46428, "t": 164.45752000000005, "r": 257.42447, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 86.372002, "t": 175.41656, "r": 118.8752, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "Footnote", "bbox": {"l": 86.372002, "t": 175.41656, "r": 118.8752, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 151.07401, "t": 175.41656, "r": 159.41275, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "71", "bbox": {"l": 151.07401, "t": 175.41656, "r": 159.41275, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 173.42723, "t": 175.41656, "r": 189.38742, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "Text", "bbox": {"l": 173.42723, "t": 175.41656, "r": 189.38742, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 207.44576, "t": 175.41656, "r": 223.40594000000002, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "Text", "bbox": {"l": 207.44576, "t": 175.41656, "r": 223.40594000000002, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 241.46428, "t": 175.41656, "r": 257.42447, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "Text", "bbox": {"l": 241.46428, "t": 175.41656, "r": 257.42447, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 86.372002, "t": 186.37554999999998, "r": 116.88466, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "Formula", "bbox": {"l": 86.372002, "t": 186.37554999999998, "r": 116.88466, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 151.07401, "t": 186.37554999999998, "r": 159.41275, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "60", "bbox": {"l": 151.07401, "t": 186.37554999999998, "r": 159.41275, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 173.42723, "t": 186.37554999999998, "r": 189.38742, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "Text", "bbox": {"l": 173.42723, "t": 186.37554999999998, "r": 189.38742, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 207.44576, "t": 186.37554999999998, "r": 223.40594000000002, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "Text", "bbox": {"l": 207.44576, "t": 186.37554999999998, "r": 223.40594000000002, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 241.46428, "t": 186.37554999999998, "r": 257.42447, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "Text", "bbox": {"l": 241.46428, "t": 186.37554999999998, "r": 257.42447, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 86.372002, "t": 197.33452999999997, "r": 119.25179, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "List-item", "bbox": {"l": 86.372002, "t": 197.33452999999997, "r": 119.25179, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 151.07401, "t": 197.33452999999997, "r": 159.41275, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "81", "bbox": {"l": 151.07401, "t": 197.33452999999997, "r": 159.41275, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 173.42723, "t": 197.33452999999997, "r": 189.38742, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "Text", "bbox": {"l": 173.42723, "t": 197.33452999999997, "r": 189.38742, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 211.25647, "t": 197.33452999999997, "r": 219.59521, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "82", "bbox": {"l": 211.25647, "t": 197.33452999999997, "r": 219.59521, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 241.46426, "t": 197.33452999999997, "r": 257.42447, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "Text", "bbox": {"l": 241.46426, "t": 197.33452999999997, "r": 257.42447, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 86.372002, "t": 208.29351999999994, "r": 128.89964, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "Page-footer", "bbox": {"l": 86.372002, "t": 208.29351999999994, "r": 128.89964, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 151.07401, "t": 208.29351999999994, "r": 159.41275, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "62", "bbox": {"l": 151.07401, "t": 208.29351999999994, "r": 159.41275, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 177.23795, "t": 208.29351999999994, "r": 185.57669, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "62", "bbox": {"l": 177.23795, "t": 208.29351999999994, "r": 185.57669, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 213.91052, "t": 208.29351999999994, "r": 216.94116, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "-", "bbox": {"l": 213.91052, "t": 208.29351999999994, "r": 216.94116, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 247.92905000000002, "t": 208.29351999999994, "r": 250.95969, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "-", "bbox": {"l": 247.92905000000002, "t": 208.29351999999994, "r": 250.95969, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 86.372002, "t": 219.25256000000002, "r": 131.65231, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "Page-header", "bbox": {"l": 86.372002, "t": 219.25256000000002, "r": 131.65231, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 151.07401, "t": 219.25256000000002, "r": 159.41275, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "72", "bbox": {"l": 151.07401, "t": 219.25256000000002, "r": 159.41275, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 177.23795, "t": 219.25256000000002, "r": 185.57669, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "68", "bbox": {"l": 177.23795, "t": 219.25256000000002, "r": 185.57669, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 213.91052, "t": 219.25256000000002, "r": 216.94116, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "-", "bbox": {"l": 213.91052, "t": 219.25256000000002, "r": 216.94116, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 247.92905000000002, "t": 219.25256000000002, "r": 250.95969, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "-", "bbox": {"l": 247.92905000000002, "t": 219.25256000000002, "r": 250.95969, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 86.372002, "t": 230.21155, "r": 112.35663, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "Picture", "bbox": {"l": 86.372002, "t": 230.21155, "r": 112.35663, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 151.07401, "t": 230.21155, "r": 159.41275, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "72", "bbox": {"l": 151.07401, "t": 230.21155, "r": 159.41275, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 177.23795, "t": 230.21155, "r": 185.57669, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "72", "bbox": {"l": 177.23795, "t": 230.21155, "r": 185.57669, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 211.25645, "t": 230.21155, "r": 219.5952, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "72", "bbox": {"l": 211.25645, "t": 230.21155, "r": 219.5952, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 245.27496, "t": 230.21155, "r": 253.61371, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "72", "bbox": {"l": 245.27496, "t": 230.21155, "r": 253.61371, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 86.372002, "t": 241.16956000000005, "r": 141.11188, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "Section-header", "bbox": {"l": 86.372002, "t": 241.16956000000005, "r": 141.11188, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 151.07401, "t": 241.16956000000005, "r": 159.41275, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "68", "bbox": {"l": 151.07401, "t": 241.16956000000005, "r": 159.41275, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 177.23795, "t": 241.16956000000005, "r": 185.57669, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "67", "bbox": {"l": 177.23795, "t": 241.16956000000005, "r": 185.57669, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 211.25645, "t": 241.16956000000005, "r": 219.5952, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "69", "bbox": {"l": 211.25645, "t": 241.16956000000005, "r": 219.5952, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 245.27496, "t": 241.16956000000005, "r": 253.61371, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "68", "bbox": {"l": 245.27496, "t": 241.16956000000005, "r": 253.61371, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 86.372002, "t": 252.12854000000004, "r": 106.17878, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "Table", "bbox": {"l": 86.372002, "t": 252.12854000000004, "r": 106.17878, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 151.07401, "t": 252.12854000000004, "r": 159.41275, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "82", "bbox": {"l": 151.07401, "t": 252.12854000000004, "r": 159.41275, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 177.23795, "t": 252.12854000000004, "r": 185.57669, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "83", "bbox": {"l": 177.23795, "t": 252.12854000000004, "r": 185.57669, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 211.25645, "t": 252.12854000000004, "r": 219.5952, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "82", "bbox": {"l": 211.25645, "t": 252.12854000000004, "r": 219.5952, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 245.27496, "t": 252.12854000000004, "r": 253.61371, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "82", "bbox": {"l": 245.27496, "t": 252.12854000000004, "r": 253.61371, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 86.372002, "t": 263.08752000000004, "r": 102.3322, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "Text", "bbox": {"l": 86.372002, "t": 263.08752000000004, "r": 102.3322, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 151.07401, "t": 263.08752000000004, "r": 159.41275, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "85", "bbox": {"l": 151.07401, "t": 263.08752000000004, "r": 159.41275, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 177.23795, "t": 263.08752000000004, "r": 185.57669, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "84", "bbox": {"l": 177.23795, "t": 263.08752000000004, "r": 185.57669, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 211.25645, "t": 263.08752000000004, "r": 219.5952, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "84", "bbox": {"l": 211.25645, "t": 263.08752000000004, "r": 219.5952, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 245.27496, "t": 263.08752000000004, "r": 253.61371, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "84", "bbox": {"l": 245.27496, "t": 263.08752000000004, "r": 253.61371, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 86.372002, "t": 274.04657, "r": 103.36333, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "Title", "bbox": {"l": 86.372002, "t": 274.04657, "r": 103.36333, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 151.07401, "t": 274.04657, "r": 159.41275, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "77", "bbox": {"l": 151.07401, "t": 274.04657, "r": 159.41275, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 169.37442, "t": 274.04657, "r": 193.43127, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "Sec.-h.", "bbox": {"l": 169.37442, "t": 274.04657, "r": 193.43127, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 203.39294, "t": 274.04657, "r": 227.4498, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "Sec.-h.", "bbox": {"l": 203.39294, "t": 274.04657, "r": 227.4498, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 237.41147, "t": 274.04657, "r": 261.46832, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "Sec.-h.", "bbox": {"l": 237.41147, "t": 274.04657, "r": 261.46832, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 86.372002, "t": 285.40454, "r": 113.31602000000001, "b": 293.77917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "Overall", "bbox": {"l": 86.372002, "t": 285.40454, "r": 113.31602000000001, "b": 293.77917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 151.07401, "t": 285.40454, "r": 159.41275, "b": 293.77917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "72", "bbox": {"l": 151.07401, "t": 285.40454, "r": 159.41275, "b": 293.77917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 177.23795, "t": 285.40454, "r": 185.57669, "b": 293.77917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "73", "bbox": {"l": 177.23795, "t": 285.40454, "r": 185.57669, "b": 293.77917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 211.25645, "t": 285.40454, "r": 219.5952, "b": 293.77917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "78", "bbox": {"l": 211.25645, "t": 285.40454, "r": 219.5952, "b": 293.77917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 245.27496, "t": 285.40454, "r": 253.61371, "b": 293.77917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "77", "bbox": {"l": 245.27496, "t": 285.40454, "r": 253.61371, "b": 293.77917, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 10, "label": "section_header", "bbox": {"l": 53.79800000000001, "t": 319.56992, "r": 131.05624, "b": 329.879, "coord_origin": "TOPLEFT"}, "confidence": 0.9555686116218567, "cells": [{"id": 71, "text": "Learning Curve", "bbox": {"l": 53.79800000000001, "t": 319.56992, "r": 131.05624, "b": 329.879, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "text", "bbox": {"l": 52.785, "t": 334.77155, "r": 295.55835, "b": 529.44818, "coord_origin": "TOPLEFT"}, "confidence": 0.9857739210128784, "cells": [{"id": 72, "text": "One of the fundamental questions related to any dataset is if it is", "bbox": {"l": 53.79800000000001, "t": 334.77155, "r": 294.04153, "b": 343.14618, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "\u201clarge enough\u201d. To answer this question for DocLayNet, we per-", "bbox": {"l": 52.785, "t": 345.73053, "r": 295.55835, "b": 354.10516000000007, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "formed a data ablation study in which we evaluated a Mask R-CNN", "bbox": {"l": 53.79800000000001, "t": 356.6895400000001, "r": 294.04535, "b": 365.06418, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "model trained on increasing fractions of the DocLayNet dataset.", "bbox": {"l": 53.79800000000001, "t": 367.64853, "r": 295.4281, "b": 376.02316, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "As can be seen in Figure 5, the mAP score rises sharply in the be-", "bbox": {"l": 53.484001, "t": 378.60754, "r": 295.55667, "b": 386.98218, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "ginning and eventually levels out. To estimate the error-bar on the", "bbox": {"l": 53.79800000000001, "t": 389.56653, "r": 294.04865, "b": 397.94116, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "metrics, we ran the training five times on the entire data-set. This", "bbox": {"l": 53.79800000000001, "t": 400.52554000000003, "r": 294.04376, "b": 408.90018, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "resulted in a 1% error-bar, depicted by the shaded area in Figure 5.", "bbox": {"l": 53.79800000000001, "t": 411.48456, "r": 295.42459, "b": 419.85919, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "In the inset of Figure 5, we show the exact same data-points, but", "bbox": {"l": 53.79800000000001, "t": 422.44354, "r": 294.04709, "b": 430.81818, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "with a logarithmic scale on the x-axis. As is expected, the mAP", "bbox": {"l": 53.466999, "t": 433.40253000000007, "r": 294.04535, "b": 441.7771599999999, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "score increases linearly as a function of the data-size in the inset.", "bbox": {"l": 53.79800000000001, "t": 444.36053000000004, "r": 295.42902, "b": 452.73517, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "The curve ultimately flattens out between the 80% and 100% mark,", "bbox": {"l": 53.528999, "t": 455.31955, "r": 295.03122, "b": 463.69418, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "with the 80% mark falling within the error-bars of the 100% mark.", "bbox": {"l": 53.466999, "t": 466.27853, "r": 295.42154, "b": 474.65317, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "This provides a good indication that the model would not improve", "bbox": {"l": 53.528999, "t": 477.23755, "r": 294.04553, "b": 485.61218, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "significantly by yet increasing the data size. Rather, it would prob-", "bbox": {"l": 53.79800000000001, "t": 488.19653, "r": 295.55646, "b": 496.57117, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "ably benefit more from improved data consistency (as discussed", "bbox": {"l": 53.79800000000001, "t": 499.15555, "r": 294.04715, "b": 507.53018, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "in Section 3), data augmentation methods [23], or the addition of", "bbox": {"l": 53.79800000000001, "t": 510.11453, "r": 294.04245, "b": 518.4891700000001, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "more document categories and styles.", "bbox": {"l": 53.79800000000001, "t": 521.0735500000001, "r": 191.47707, "b": 529.44818, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "section_header", "bbox": {"l": 53.79800000000001, "t": 542.50992, "r": 164.32898, "b": 552.81902, "coord_origin": "TOPLEFT"}, "confidence": 0.9572026133537292, "cells": [{"id": 90, "text": "Impact of Class Labels", "bbox": {"l": 53.79800000000001, "t": 542.50992, "r": 164.32898, "b": 552.81902, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 53.466999, "t": 557.71155, "r": 295.55679, "b": 708.55217, "coord_origin": "TOPLEFT"}, "confidence": 0.9876301884651184, "cells": [{"id": 91, "text": "The choice and number of labels can have a significant effect on", "bbox": {"l": 53.528999, "t": 557.71155, "r": 294.04333, "b": 566.08617, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "the overall model performance. Since PubLayNet, DocBank and", "bbox": {"l": 53.79800000000001, "t": 568.6705499999999, "r": 294.04712, "b": 577.04517, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "DocLayNet all have different label sets, it is of particular interest to", "bbox": {"l": 53.79800000000001, "t": 579.62955, "r": 294.04538, "b": 588.0041699999999, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "understand and quantify this influence of the label set on the model", "bbox": {"l": 53.79800000000001, "t": 590.5885499999999, "r": 294.04535, "b": 598.96317, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "performance. We investigate this by either down-mapping labels", "bbox": {"l": 53.79800000000001, "t": 601.54755, "r": 294.04266, "b": 609.92216, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "into more common ones (e.g.", "bbox": {"l": 53.79800000000001, "t": 612.50656, "r": 163.59247, "b": 620.88118, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "Caption", "bbox": {"l": 166.26401, "t": 612.55139, "r": 194.97244, "b": 620.89015, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "\u2192", "bbox": {"l": 194.994, "t": 612.45276, "r": 204.1756, "b": 620.15491, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "Text", "bbox": {"l": 204.17599, "t": 612.55139, "r": 219.33961000000002, "b": 620.89015, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": ") or excluding them", "bbox": {"l": 219.849, "t": 612.50656, "r": 294.04828, "b": 620.88118, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "from the annotations entirely. Furthermore, it must be stressed", "bbox": {"l": 53.79800000000001, "t": 623.46556, "r": 294.04709, "b": 631.84018, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "that all mappings and exclusions were performed on the data be-", "bbox": {"l": 53.79800000000001, "t": 634.42355, "r": 295.55679, "b": 642.79817, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "fore model training. In Table 3, we present the mAP scores for a", "bbox": {"l": 53.79800000000001, "t": 645.38255, "r": 294.04715, "b": 653.75717, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "Mask R-CNN R50 network on different label sets. Where a label", "bbox": {"l": 53.79800000000001, "t": 656.34155, "r": 294.04715, "b": 664.71617, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "is down-mapped, we show its corresponding label, otherwise it", "bbox": {"l": 53.79800000000001, "t": 667.30055, "r": 294.04712, "b": 675.67517, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "was excluded. We present three different label sets, with 6, 5 and 4", "bbox": {"l": 53.466999, "t": 678.25955, "r": 294.25174, "b": 686.63417, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "different labels respectively. The set of 5 labels contains the same", "bbox": {"l": 53.79800000000001, "t": 689.21855, "r": 294.04639, "b": 697.59317, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "labels as PubLayNet. However, due to the different definition of", "bbox": {"l": 53.79800000000001, "t": 700.177551, "r": 294.04712, "b": 708.55217, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 317.659, "t": 86.87298999999996, "r": 559.80682, "b": 128.22321, "coord_origin": "TOPLEFT"}, "confidence": 0.8736215829849243, "cells": [{"id": 109, "text": "Table 4: Performance of a Mask R-CNN R50 network with", "bbox": {"l": 317.659, "t": 86.87298999999996, "r": 558.20068, "b": 95.34625000000017, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "document-wise and page-wise split for different label sets.", "bbox": {"l": 317.95499, "t": 97.83196999999996, "r": 559.73401, "b": 106.30524000000003, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "Naive page-wise split will result in", "bbox": {"l": 317.95499, "t": 108.79094999999995, "r": 467.72089, "b": 117.26422000000014, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "GLYPH<tildelow>", "bbox": {"l": 471.90900000000005, "t": 107.12798999999995, "r": 477.53900000000004, "b": 115.19768999999997, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "10% point improve-", "bbox": {"l": 477.54001000000005, "t": 108.79094999999995, "r": 559.80682, "b": 117.26422000000014, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "ment.", "bbox": {"l": 317.95502, "t": 119.74993999999992, "r": 341.37524, "b": 128.22321, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "table", "bbox": {"l": 352.97747802734375, "t": 150.791259765625, "r": 522.9158935546875, "b": 306.2658386230469, "coord_origin": "TOPLEFT"}, "confidence": 0.9879696369171143, "cells": [{"id": 115, "text": "Class-count", "bbox": {"l": 358.63901, "t": 153.10051999999996, "r": 401.73154, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "11", "bbox": {"l": 440.22501, "t": 153.10051999999996, "r": 448.56375, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "5", "bbox": {"l": 494.38, "t": 153.10051999999996, "r": 498.54938, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "Split", "bbox": {"l": 358.63901, "t": 164.05951000000005, "r": 375.27167, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "Doc", "bbox": {"l": 423.341, "t": 164.05951000000005, "r": 438.0459, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "Page", "bbox": {"l": 448.00757, "t": 164.05951000000005, "r": 465.4472, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "Doc", "bbox": {"l": 475.41101, "t": 164.05951000000005, "r": 490.11591, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Page", "bbox": {"l": 500.07757999999995, "t": 164.05951000000005, "r": 517.51721, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "Caption", "bbox": {"l": 358.63901, "t": 175.41656, "r": 387.82465, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "68", "bbox": {"l": 426.52399, "t": 175.41656, "r": 434.86273, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "83", "bbox": {"l": 452.56240999999994, "t": 175.41656, "r": 460.90115000000003, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "Footnote", "bbox": {"l": 358.63901, "t": 186.37554999999998, "r": 391.14221, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "71", "bbox": {"l": 426.52399, "t": 186.37554999999998, "r": 434.86273, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "84", "bbox": {"l": 452.56240999999994, "t": 186.37554999999998, "r": 460.90115000000003, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "Formula", "bbox": {"l": 358.63901, "t": 197.33452999999997, "r": 389.15167, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "60", "bbox": {"l": 426.52399, "t": 197.33452999999997, "r": 434.86273, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "66", "bbox": {"l": 452.56240999999994, "t": 197.33452999999997, "r": 460.90115000000003, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "List-item", "bbox": {"l": 358.63901, "t": 208.29351999999994, "r": 391.5188, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "81", "bbox": {"l": 426.52399, "t": 208.29351999999994, "r": 434.86273, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "88", "bbox": {"l": 452.56240999999994, "t": 208.29351999999994, "r": 460.90115000000003, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "82", "bbox": {"l": 478.59399, "t": 208.29351999999994, "r": 486.93274, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "88", "bbox": {"l": 504.6324200000001, "t": 208.29351999999994, "r": 512.97119, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "Page-footer", "bbox": {"l": 358.63901, "t": 219.25256000000002, "r": 401.16666, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "62", "bbox": {"l": 426.52399, "t": 219.25256000000002, "r": 434.86273, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "89", "bbox": {"l": 452.56240999999994, "t": 219.25256000000002, "r": 460.90115000000003, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "Page-header", "bbox": {"l": 358.63901, "t": 230.21155, "r": 403.91931, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "72", "bbox": {"l": 426.52399, "t": 230.21155, "r": 434.86273, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "90", "bbox": {"l": 452.56240999999994, "t": 230.21155, "r": 460.90115000000003, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "Picture", "bbox": {"l": 358.63901, "t": 241.16956000000005, "r": 384.62366, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "72", "bbox": {"l": 426.52399, "t": 241.16956000000005, "r": 434.86273, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "82", "bbox": {"l": 452.56240999999994, "t": 241.16956000000005, "r": 460.90115000000003, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "72", "bbox": {"l": 478.59399, "t": 241.16956000000005, "r": 486.93274, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "82", "bbox": {"l": 504.6324200000001, "t": 241.16956000000005, "r": 512.97119, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "Section-header", "bbox": {"l": 358.63901, "t": 252.12854000000004, "r": 413.37891, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "68", "bbox": {"l": 426.52399, "t": 252.12854000000004, "r": 434.86273, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "83", "bbox": {"l": 452.56240999999994, "t": 252.12854000000004, "r": 460.90115000000003, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "69", "bbox": {"l": 478.59399, "t": 252.12854000000004, "r": 486.93274, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "83", "bbox": {"l": 504.6324200000001, "t": 252.12854000000004, "r": 512.97119, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "Table", "bbox": {"l": 358.63901, "t": 263.08752000000004, "r": 378.44577, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "82", "bbox": {"l": 426.52399, "t": 263.08752000000004, "r": 434.86273, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "89", "bbox": {"l": 452.56240999999994, "t": 263.08752000000004, "r": 460.90115000000003, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "82", "bbox": {"l": 478.59399, "t": 263.08752000000004, "r": 486.93274, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "90", "bbox": {"l": 504.6324200000001, "t": 263.08752000000004, "r": 512.97119, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "Text", "bbox": {"l": 358.63901, "t": 274.04657, "r": 374.59921, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "85", "bbox": {"l": 426.52399, "t": 274.04657, "r": 434.86273, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "91", "bbox": {"l": 452.56240999999994, "t": 274.04657, "r": 460.90115000000003, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "84", "bbox": {"l": 478.59399, "t": 274.04657, "r": 486.93274, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "90", "bbox": {"l": 504.6324200000001, "t": 274.04657, "r": 512.97119, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "Title", "bbox": {"l": 358.63901, "t": 285.00552, "r": 375.63034, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "77", "bbox": {"l": 426.52399, "t": 285.00552, "r": 434.86273, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "81", "bbox": {"l": 452.56240999999994, "t": 285.00552, "r": 460.90115000000003, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "All", "bbox": {"l": 358.63901, "t": 296.36255, "r": 369.60492, "b": 304.73718, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "72", "bbox": {"l": 426.52399, "t": 296.36255, "r": 434.86273, "b": 304.73718, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "84", "bbox": {"l": 452.56240999999994, "t": 296.36255, "r": 460.90115000000003, "b": 304.73718, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "78", "bbox": {"l": 478.59399, "t": 296.36255, "r": 486.93274, "b": 304.73718, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "87", "bbox": {"l": 504.6324200000001, "t": 296.36255, "r": 512.97119, "b": 304.73718, "coord_origin": "TOPLEFT"}}], "children": [{"id": 80, "label": "text", "bbox": {"l": 358.63901, "t": 153.10051999999996, "r": 401.73154, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 115, "text": "Class-count", "bbox": {"l": 358.63901, "t": 153.10051999999996, "r": 401.73154, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 440.22501, "t": 153.10051999999996, "r": 448.56375, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 116, "text": "11", "bbox": {"l": 440.22501, "t": 153.10051999999996, "r": 448.56375, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 494.38, "t": 153.10051999999996, "r": 498.54938, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 117, "text": "5", "bbox": {"l": 494.38, "t": 153.10051999999996, "r": 498.54938, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 358.63901, "t": 164.05951000000005, "r": 375.27167, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 118, "text": "Split", "bbox": {"l": 358.63901, "t": 164.05951000000005, "r": 375.27167, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 423.341, "t": 164.05951000000005, "r": 438.0459, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 119, "text": "Doc", "bbox": {"l": 423.341, "t": 164.05951000000005, "r": 438.0459, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 448.00757, "t": 164.05951000000005, "r": 465.4472, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 120, "text": "Page", "bbox": {"l": 448.00757, "t": 164.05951000000005, "r": 465.4472, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 475.41101, "t": 164.05951000000005, "r": 490.11591, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 121, "text": "Doc", "bbox": {"l": 475.41101, "t": 164.05951000000005, "r": 490.11591, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 500.07757999999995, "t": 164.05951000000005, "r": 517.51721, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 122, "text": "Page", "bbox": {"l": 500.07757999999995, "t": 164.05951000000005, "r": 517.51721, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 358.63901, "t": 175.41656, "r": 387.82465, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 123, "text": "Caption", "bbox": {"l": 358.63901, "t": 175.41656, "r": 387.82465, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 426.52399, "t": 175.41656, "r": 434.86273, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 124, "text": "68", "bbox": {"l": 426.52399, "t": 175.41656, "r": 434.86273, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 452.56240999999994, "t": 175.41656, "r": 460.90115000000003, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 125, "text": "83", "bbox": {"l": 452.56240999999994, "t": 175.41656, "r": 460.90115000000003, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 358.63901, "t": 186.37554999999998, "r": 391.14221, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 126, "text": "Footnote", "bbox": {"l": 358.63901, "t": 186.37554999999998, "r": 391.14221, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 426.52399, "t": 186.37554999999998, "r": 434.86273, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 127, "text": "71", "bbox": {"l": 426.52399, "t": 186.37554999999998, "r": 434.86273, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 452.56240999999994, "t": 186.37554999999998, "r": 460.90115000000003, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 128, "text": "84", "bbox": {"l": 452.56240999999994, "t": 186.37554999999998, "r": 460.90115000000003, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 358.63901, "t": 197.33452999999997, "r": 389.15167, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 129, "text": "Formula", "bbox": {"l": 358.63901, "t": 197.33452999999997, "r": 389.15167, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 426.52399, "t": 197.33452999999997, "r": 434.86273, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 130, "text": "60", "bbox": {"l": 426.52399, "t": 197.33452999999997, "r": 434.86273, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 452.56240999999994, "t": 197.33452999999997, "r": 460.90115000000003, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 131, "text": "66", "bbox": {"l": 452.56240999999994, "t": 197.33452999999997, "r": 460.90115000000003, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 358.63901, "t": 208.29351999999994, "r": 391.5188, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 132, "text": "List-item", "bbox": {"l": 358.63901, "t": 208.29351999999994, "r": 391.5188, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 426.52399, "t": 208.29351999999994, "r": 434.86273, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 133, "text": "81", "bbox": {"l": 426.52399, "t": 208.29351999999994, "r": 434.86273, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 452.56240999999994, "t": 208.29351999999994, "r": 460.90115000000003, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 134, "text": "88", "bbox": {"l": 452.56240999999994, "t": 208.29351999999994, "r": 460.90115000000003, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 478.59399, "t": 208.29351999999994, "r": 486.93274, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 135, "text": "82", "bbox": {"l": 478.59399, "t": 208.29351999999994, "r": 486.93274, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 504.6324200000001, "t": 208.29351999999994, "r": 512.97119, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 136, "text": "88", "bbox": {"l": 504.6324200000001, "t": 208.29351999999994, "r": 512.97119, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 358.63901, "t": 219.25256000000002, "r": 401.16666, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 137, "text": "Page-footer", "bbox": {"l": 358.63901, "t": 219.25256000000002, "r": 401.16666, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 426.52399, "t": 219.25256000000002, "r": 434.86273, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 138, "text": "62", "bbox": {"l": 426.52399, "t": 219.25256000000002, "r": 434.86273, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 452.56240999999994, "t": 219.25256000000002, "r": 460.90115000000003, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 139, "text": "89", "bbox": {"l": 452.56240999999994, "t": 219.25256000000002, "r": 460.90115000000003, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 358.63901, "t": 230.21155, "r": 403.91931, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 140, "text": "Page-header", "bbox": {"l": 358.63901, "t": 230.21155, "r": 403.91931, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 426.52399, "t": 230.21155, "r": 434.86273, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 141, "text": "72", "bbox": {"l": 426.52399, "t": 230.21155, "r": 434.86273, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 452.56240999999994, "t": 230.21155, "r": 460.90115000000003, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 142, "text": "90", "bbox": {"l": 452.56240999999994, "t": 230.21155, "r": 460.90115000000003, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 358.63901, "t": 241.16956000000005, "r": 384.62366, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 143, "text": "Picture", "bbox": {"l": 358.63901, "t": 241.16956000000005, "r": 384.62366, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 426.52399, "t": 241.16956000000005, "r": 434.86273, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 144, "text": "72", "bbox": {"l": 426.52399, "t": 241.16956000000005, "r": 434.86273, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 452.56240999999994, "t": 241.16956000000005, "r": 460.90115000000003, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 145, "text": "82", "bbox": {"l": 452.56240999999994, "t": 241.16956000000005, "r": 460.90115000000003, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 478.59399, "t": 241.16956000000005, "r": 486.93274, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 146, "text": "72", "bbox": {"l": 478.59399, "t": 241.16956000000005, "r": 486.93274, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 504.6324200000001, "t": 241.16956000000005, "r": 512.97119, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 147, "text": "82", "bbox": {"l": 504.6324200000001, "t": 241.16956000000005, "r": 512.97119, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 358.63901, "t": 252.12854000000004, "r": 413.37891, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 148, "text": "Section-header", "bbox": {"l": 358.63901, "t": 252.12854000000004, "r": 413.37891, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 114, "label": "text", "bbox": {"l": 426.52399, "t": 252.12854000000004, "r": 434.86273, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 149, "text": "68", "bbox": {"l": 426.52399, "t": 252.12854000000004, "r": 434.86273, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 115, "label": "text", "bbox": {"l": 452.56240999999994, "t": 252.12854000000004, "r": 460.90115000000003, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 150, "text": "83", "bbox": {"l": 452.56240999999994, "t": 252.12854000000004, "r": 460.90115000000003, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 116, "label": "text", "bbox": {"l": 478.59399, "t": 252.12854000000004, "r": 486.93274, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 151, "text": "69", "bbox": {"l": 478.59399, "t": 252.12854000000004, "r": 486.93274, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 117, "label": "text", "bbox": {"l": 504.6324200000001, "t": 252.12854000000004, "r": 512.97119, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 152, "text": "83", "bbox": {"l": 504.6324200000001, "t": 252.12854000000004, "r": 512.97119, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 118, "label": "text", "bbox": {"l": 358.63901, "t": 263.08752000000004, "r": 378.44577, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 153, "text": "Table", "bbox": {"l": 358.63901, "t": 263.08752000000004, "r": 378.44577, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 119, "label": "text", "bbox": {"l": 426.52399, "t": 263.08752000000004, "r": 434.86273, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 154, "text": "82", "bbox": {"l": 426.52399, "t": 263.08752000000004, "r": 434.86273, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 120, "label": "text", "bbox": {"l": 452.56240999999994, "t": 263.08752000000004, "r": 460.90115000000003, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 155, "text": "89", "bbox": {"l": 452.56240999999994, "t": 263.08752000000004, "r": 460.90115000000003, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 121, "label": "text", "bbox": {"l": 478.59399, "t": 263.08752000000004, "r": 486.93274, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 156, "text": "82", "bbox": {"l": 478.59399, "t": 263.08752000000004, "r": 486.93274, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 122, "label": "text", "bbox": {"l": 504.6324200000001, "t": 263.08752000000004, "r": 512.97119, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 157, "text": "90", "bbox": {"l": 504.6324200000001, "t": 263.08752000000004, "r": 512.97119, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 123, "label": "text", "bbox": {"l": 358.63901, "t": 274.04657, "r": 374.59921, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 158, "text": "Text", "bbox": {"l": 358.63901, "t": 274.04657, "r": 374.59921, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 124, "label": "text", "bbox": {"l": 426.52399, "t": 274.04657, "r": 434.86273, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 159, "text": "85", "bbox": {"l": 426.52399, "t": 274.04657, "r": 434.86273, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 125, "label": "text", "bbox": {"l": 452.56240999999994, "t": 274.04657, "r": 460.90115000000003, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 160, "text": "91", "bbox": {"l": 452.56240999999994, "t": 274.04657, "r": 460.90115000000003, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 126, "label": "text", "bbox": {"l": 478.59399, "t": 274.04657, "r": 486.93274, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 161, "text": "84", "bbox": {"l": 478.59399, "t": 274.04657, "r": 486.93274, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 127, "label": "text", "bbox": {"l": 504.6324200000001, "t": 274.04657, "r": 512.97119, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 162, "text": "90", "bbox": {"l": 504.6324200000001, "t": 274.04657, "r": 512.97119, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 128, "label": "text", "bbox": {"l": 358.63901, "t": 285.00552, "r": 375.63034, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 163, "text": "Title", "bbox": {"l": 358.63901, "t": 285.00552, "r": 375.63034, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 129, "label": "text", "bbox": {"l": 426.52399, "t": 285.00552, "r": 434.86273, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 164, "text": "77", "bbox": {"l": 426.52399, "t": 285.00552, "r": 434.86273, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 130, "label": "text", "bbox": {"l": 452.56240999999994, "t": 285.00552, "r": 460.90115000000003, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 165, "text": "81", "bbox": {"l": 452.56240999999994, "t": 285.00552, "r": 460.90115000000003, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 131, "label": "text", "bbox": {"l": 358.63901, "t": 296.36255, "r": 369.60492, "b": 304.73718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 166, "text": "All", "bbox": {"l": 358.63901, "t": 296.36255, "r": 369.60492, "b": 304.73718, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 132, "label": "text", "bbox": {"l": 426.52399, "t": 296.36255, "r": 434.86273, "b": 304.73718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 167, "text": "72", "bbox": {"l": 426.52399, "t": 296.36255, "r": 434.86273, "b": 304.73718, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 133, "label": "text", "bbox": {"l": 452.56240999999994, "t": 296.36255, "r": 460.90115000000003, "b": 304.73718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 168, "text": "84", "bbox": {"l": 452.56240999999994, "t": 296.36255, "r": 460.90115000000003, "b": 304.73718, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 134, "label": "text", "bbox": {"l": 478.59399, "t": 296.36255, "r": 486.93274, "b": 304.73718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 169, "text": "78", "bbox": {"l": 478.59399, "t": 296.36255, "r": 486.93274, "b": 304.73718, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 135, "label": "text", "bbox": {"l": 504.6324200000001, "t": 296.36255, "r": 512.97119, "b": 304.73718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 170, "text": "87", "bbox": {"l": 504.6324200000001, "t": 296.36255, "r": 512.97119, "b": 304.73718, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 6, "label": "text", "bbox": {"l": 317.686, "t": 331.40353, "r": 559.58496, "b": 416.49017, "coord_origin": "TOPLEFT"}, "confidence": 0.9740146994590759, "cells": [{"id": 171, "text": "lists in PubLayNet (grouped list-items) versus DocLayNet (separate", "bbox": {"l": 317.95499, "t": 331.40353, "r": 558.20233, "b": 339.77817, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "list-items), the label set of size 4 is the closest to PubLayNet, in the", "bbox": {"l": 317.95499, "t": 342.36255, "r": 558.2005, "b": 350.73718, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "assumption that the", "bbox": {"l": 317.95499, "t": 353.32153, "r": 393.16028, "b": 361.69617000000005, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "List", "bbox": {"l": 395.84201, "t": 353.36639, "r": 409.14905, "b": 361.70514, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "is down-mapped to", "bbox": {"l": 412.33301, "t": 353.32153, "r": 485.02324999999996, "b": 361.69617000000005, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "Text", "bbox": {"l": 487.70401, "t": 353.36639, "r": 502.86761, "b": 361.70514, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "in PubLayNet.", "bbox": {"l": 506.05499, "t": 353.32153, "r": 559.58496, "b": 361.69617000000005, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "The results in Table 3 show that the prediction accuracy on the", "bbox": {"l": 317.686, "t": 364.28054999999995, "r": 558.2002, "b": 372.65518, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "remaining class labels does not change significantly when other", "bbox": {"l": 317.95499, "t": 375.23853, "r": 558.36877, "b": 383.61316, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "classes are merged into them. The overall macro-average improves", "bbox": {"l": 317.95499, "t": 386.19754, "r": 558.19958, "b": 394.57217, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "by around 5%, in particular when", "bbox": {"l": 317.95499, "t": 397.15652, "r": 439.49454, "b": 405.53116000000006, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "Page-footer", "bbox": {"l": 441.728, "t": 397.20139, "r": 481.8616, "b": 405.54013, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "and", "bbox": {"l": 484.74298, "t": 397.15652, "r": 498.23743, "b": 405.53116000000006, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "Page-header", "bbox": {"l": 500.47299, "t": 397.20139, "r": 543.95105, "b": 405.54013, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": "are", "bbox": {"l": 546.83197, "t": 397.15652, "r": 558.20142, "b": 405.53116000000006, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "excluded.", "bbox": {"l": 317.95496, "t": 408.11553999999995, "r": 352.37698, "b": 416.49017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "section_header", "bbox": {"l": 317.95496, "t": 429.3949, "r": 549.8606, "b": 439.70398, "coord_origin": "TOPLEFT"}, "confidence": 0.9562516808509827, "cells": [{"id": 187, "text": "Impact of Document Split in Train and Test Set", "bbox": {"l": 317.95496, "t": 429.3949, "r": 549.8606, "b": 439.70398, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 317.62299, "t": 444.59653, "r": 559.71381, "b": 595.43718, "coord_origin": "TOPLEFT"}, "confidence": 0.9869834184646606, "cells": [{"id": 188, "text": "Many documents in DocLayNet have a unique styling. In order", "bbox": {"l": 317.95499, "t": 444.59653, "r": 558.36884, "b": 452.97116, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "to avoid overfitting on a particular style, we have split the train-,", "bbox": {"l": 317.95499, "t": 455.55554, "r": 559.19189, "b": 463.93018, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "test- and validation-sets of DocLayNet on document boundaries, i.e.", "bbox": {"l": 317.95499, "t": 466.51453, "r": 559.58185, "b": 474.88916, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "every document contributes pages to only one set. To the best of", "bbox": {"l": 317.95499, "t": 477.47354, "r": 558.20605, "b": 485.84818, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": "our knowledge, this was not considered in PubLayNet or DocBank.", "bbox": {"l": 317.95499, "t": 488.43253, "r": 559.58203, "b": 496.80716, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "To quantify how this affects model performance, we trained and", "bbox": {"l": 317.686, "t": 499.39154, "r": 558.20032, "b": 507.76617, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "evaluated a Mask R-CNN R50 model on a modified dataset version.", "bbox": {"l": 317.95499, "t": 510.35052, "r": 559.5849, "b": 518.72516, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "Here, the train-, test- and validation-sets were obtained by a ran-", "bbox": {"l": 317.95499, "t": 521.30954, "r": 559.71381, "b": 529.68417, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "domised draw over the individual pages. As can be seen in Table 4,", "bbox": {"l": 317.95499, "t": 532.26855, "r": 559.18707, "b": 540.64317, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "the difference in model performance is surprisingly large: page-", "bbox": {"l": 317.95499, "t": 543.22655, "r": 559.71313, "b": 551.60117, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "wise splitting gains", "bbox": {"l": 317.62299, "t": 554.18555, "r": 388.35168, "b": 562.56017, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "\u02dc", "bbox": {"l": 391.36499, "t": 552.50055, "r": 393.98318, "b": 560.87517, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "10% in mAP over the document-wise splitting.", "bbox": {"l": 390.59, "t": 554.18555, "r": 559.58191, "b": 562.56017, "coord_origin": "TOPLEFT"}}, {"id": 201, "text": "Thus, random page-wise splitting of DocLayNet can easily lead", "bbox": {"l": 317.686, "t": 565.14455, "r": 558.20032, "b": 573.51917, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": "to accidental overestimation of model performance and should be", "bbox": {"l": 317.95499, "t": 576.10356, "r": 558.20508, "b": 584.4781800000001, "coord_origin": "TOPLEFT"}}, {"id": 203, "text": "avoided.", "bbox": {"l": 317.95499, "t": 587.06256, "r": 348.50354, "b": 595.43718, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "section_header", "bbox": {"l": 317.95499, "t": 608.34192, "r": 418.54776, "b": 618.65102, "coord_origin": "TOPLEFT"}, "confidence": 0.9589217305183411, "cells": [{"id": 204, "text": "Dataset Comparison", "bbox": {"l": 317.95499, "t": 608.34192, "r": 418.54776, "b": 618.65102, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 317.686, "t": 623.54355, "r": 559.18817, "b": 708.640137, "coord_origin": "TOPLEFT"}, "confidence": 0.9872549772262573, "cells": [{"id": 205, "text": "Throughout this paper, we claim that DocLayNet\u2019s wider variety of", "bbox": {"l": 317.686, "t": 623.54355, "r": 558.20575, "b": 631.91817, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": "document layouts leads to more robust layout detection models. In", "bbox": {"l": 317.95499, "t": 634.50255, "r": 558.20624, "b": 642.87717, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": "Table 5, we provide evidence for that. We trained models on each", "bbox": {"l": 317.686, "t": 645.46155, "r": 558.20319, "b": 653.83617, "coord_origin": "TOPLEFT"}}, {"id": 208, "text": "of the available datasets (PubLayNet, DocBank and DocLayNet)", "bbox": {"l": 317.95499, "t": 656.42055, "r": 558.74377, "b": 664.79517, "coord_origin": "TOPLEFT"}}, {"id": 209, "text": "and evaluated them on the test sets of the other datasets. Due to", "bbox": {"l": 317.95499, "t": 667.37955, "r": 558.20398, "b": 675.7541699999999, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": "the different label sets and annotation styles, a direct comparison", "bbox": {"l": 317.95499, "t": 678.3385499999999, "r": 558.20062, "b": 686.71317, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "is not possible. Hence, we focussed on the common labels among", "bbox": {"l": 317.95499, "t": 689.29755, "r": 558.20343, "b": 697.672173, "coord_origin": "TOPLEFT"}}, {"id": 212, "text": "the datasets. Between PubLayNet and DocLayNet, these are", "bbox": {"l": 317.95499, "t": 700.256554, "r": 531.07666, "b": 708.631172, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "Picture", "bbox": {"l": 533.16199, "t": 700.301384, "r": 557.2561, "b": 708.640137, "coord_origin": "TOPLEFT"}}, {"id": 214, "text": ",", "bbox": {"l": 557.255, "t": 700.256554, "r": 559.18817, "b": 708.631172, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {"4": {"label": "table", "id": 4, "page_no": 6, "cluster": {"id": 4, "label": "table", "bbox": {"l": 80.35525512695312, "t": 150.93629455566406, "r": 267.0082092285156, "b": 295.4454650878906, "coord_origin": "TOPLEFT"}, "confidence": 0.9869412779808044, "cells": [{"id": 6, "text": "Class-count", "bbox": {"l": 86.372002, "t": 153.10051999999996, "r": 129.46452, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "11", "bbox": {"l": 151.07401, "t": 153.10051999999996, "r": 159.41275, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "6", "bbox": {"l": 179.31816, "t": 153.10051999999996, "r": 183.48753, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "5", "bbox": {"l": 213.33669, "t": 153.10051999999996, "r": 217.50606, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "4", "bbox": {"l": 247.35521, "t": 153.10051999999996, "r": 251.52458, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Caption", "bbox": {"l": 86.372002, "t": 164.45752000000005, "r": 115.55763, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "68", "bbox": {"l": 151.07401, "t": 164.45752000000005, "r": 159.41275, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Text", "bbox": {"l": 173.42723, "t": 164.45752000000005, "r": 189.38742, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Text", "bbox": {"l": 207.44576, "t": 164.45752000000005, "r": 223.40594000000002, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Text", "bbox": {"l": 241.46428, "t": 164.45752000000005, "r": 257.42447, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Footnote", "bbox": {"l": 86.372002, "t": 175.41656, "r": 118.8752, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "71", "bbox": {"l": 151.07401, "t": 175.41656, "r": 159.41275, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Text", "bbox": {"l": 173.42723, "t": 175.41656, "r": 189.38742, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Text", "bbox": {"l": 207.44576, "t": 175.41656, "r": 223.40594000000002, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Text", "bbox": {"l": 241.46428, "t": 175.41656, "r": 257.42447, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Formula", "bbox": {"l": 86.372002, "t": 186.37554999999998, "r": 116.88466, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "60", "bbox": {"l": 151.07401, "t": 186.37554999999998, "r": 159.41275, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Text", "bbox": {"l": 173.42723, "t": 186.37554999999998, "r": 189.38742, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "Text", "bbox": {"l": 207.44576, "t": 186.37554999999998, "r": 223.40594000000002, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "Text", "bbox": {"l": 241.46428, "t": 186.37554999999998, "r": 257.42447, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "List-item", "bbox": {"l": 86.372002, "t": 197.33452999999997, "r": 119.25179, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "81", "bbox": {"l": 151.07401, "t": 197.33452999999997, "r": 159.41275, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Text", "bbox": {"l": 173.42723, "t": 197.33452999999997, "r": 189.38742, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "82", "bbox": {"l": 211.25647, "t": 197.33452999999997, "r": 219.59521, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Text", "bbox": {"l": 241.46426, "t": 197.33452999999997, "r": 257.42447, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Page-footer", "bbox": {"l": 86.372002, "t": 208.29351999999994, "r": 128.89964, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "62", "bbox": {"l": 151.07401, "t": 208.29351999999994, "r": 159.41275, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "62", "bbox": {"l": 177.23795, "t": 208.29351999999994, "r": 185.57669, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "-", "bbox": {"l": 213.91052, "t": 208.29351999999994, "r": 216.94116, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "-", "bbox": {"l": 247.92905000000002, "t": 208.29351999999994, "r": 250.95969, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Page-header", "bbox": {"l": 86.372002, "t": 219.25256000000002, "r": 131.65231, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "72", "bbox": {"l": 151.07401, "t": 219.25256000000002, "r": 159.41275, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "68", "bbox": {"l": 177.23795, "t": 219.25256000000002, "r": 185.57669, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "-", "bbox": {"l": 213.91052, "t": 219.25256000000002, "r": 216.94116, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "-", "bbox": {"l": 247.92905000000002, "t": 219.25256000000002, "r": 250.95969, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Picture", "bbox": {"l": 86.372002, "t": 230.21155, "r": 112.35663, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "72", "bbox": {"l": 151.07401, "t": 230.21155, "r": 159.41275, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "72", "bbox": {"l": 177.23795, "t": 230.21155, "r": 185.57669, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "72", "bbox": {"l": 211.25645, "t": 230.21155, "r": 219.5952, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "72", "bbox": {"l": 245.27496, "t": 230.21155, "r": 253.61371, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "Section-header", "bbox": {"l": 86.372002, "t": 241.16956000000005, "r": 141.11188, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "68", "bbox": {"l": 151.07401, "t": 241.16956000000005, "r": 159.41275, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "67", "bbox": {"l": 177.23795, "t": 241.16956000000005, "r": 185.57669, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "69", "bbox": {"l": 211.25645, "t": 241.16956000000005, "r": 219.5952, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "68", "bbox": {"l": 245.27496, "t": 241.16956000000005, "r": 253.61371, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Table", "bbox": {"l": 86.372002, "t": 252.12854000000004, "r": 106.17878, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "82", "bbox": {"l": 151.07401, "t": 252.12854000000004, "r": 159.41275, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "83", "bbox": {"l": 177.23795, "t": 252.12854000000004, "r": 185.57669, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "82", "bbox": {"l": 211.25645, "t": 252.12854000000004, "r": 219.5952, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "82", "bbox": {"l": 245.27496, "t": 252.12854000000004, "r": 253.61371, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Text", "bbox": {"l": 86.372002, "t": 263.08752000000004, "r": 102.3322, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "85", "bbox": {"l": 151.07401, "t": 263.08752000000004, "r": 159.41275, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "84", "bbox": {"l": 177.23795, "t": 263.08752000000004, "r": 185.57669, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "84", "bbox": {"l": 211.25645, "t": 263.08752000000004, "r": 219.5952, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "84", "bbox": {"l": 245.27496, "t": 263.08752000000004, "r": 253.61371, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "Title", "bbox": {"l": 86.372002, "t": 274.04657, "r": 103.36333, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "77", "bbox": {"l": 151.07401, "t": 274.04657, "r": 159.41275, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "Sec.-h.", "bbox": {"l": 169.37442, "t": 274.04657, "r": 193.43127, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "Sec.-h.", "bbox": {"l": 203.39294, "t": 274.04657, "r": 227.4498, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "Sec.-h.", "bbox": {"l": 237.41147, "t": 274.04657, "r": 261.46832, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "Overall", "bbox": {"l": 86.372002, "t": 285.40454, "r": 113.31602000000001, "b": 293.77917, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "72", "bbox": {"l": 151.07401, "t": 285.40454, "r": 159.41275, "b": 293.77917, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "73", "bbox": {"l": 177.23795, "t": 285.40454, "r": 185.57669, "b": 293.77917, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "78", "bbox": {"l": 211.25645, "t": 285.40454, "r": 219.5952, "b": 293.77917, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "77", "bbox": {"l": 245.27496, "t": 285.40454, "r": 253.61371, "b": 293.77917, "coord_origin": "TOPLEFT"}}], "children": [{"id": 15, "label": "text", "bbox": {"l": 86.372002, "t": 153.10051999999996, "r": 129.46452, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": "Class-count", "bbox": {"l": 86.372002, "t": 153.10051999999996, "r": 129.46452, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 151.07401, "t": 153.10051999999996, "r": 159.41275, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "11", "bbox": {"l": 151.07401, "t": 153.10051999999996, "r": 159.41275, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 179.31816, "t": 153.10051999999996, "r": 183.48753, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "6", "bbox": {"l": 179.31816, "t": 153.10051999999996, "r": 183.48753, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 213.33669, "t": 153.10051999999996, "r": 217.50606, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "5", "bbox": {"l": 213.33669, "t": 153.10051999999996, "r": 217.50606, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 247.35521, "t": 153.10051999999996, "r": 251.52458, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "4", "bbox": {"l": 247.35521, "t": 153.10051999999996, "r": 251.52458, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 86.372002, "t": 164.45752000000005, "r": 115.55763, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "Caption", "bbox": {"l": 86.372002, "t": 164.45752000000005, "r": 115.55763, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 151.07401, "t": 164.45752000000005, "r": 159.41275, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "68", "bbox": {"l": 151.07401, "t": 164.45752000000005, "r": 159.41275, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 173.42723, "t": 164.45752000000005, "r": 189.38742, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "Text", "bbox": {"l": 173.42723, "t": 164.45752000000005, "r": 189.38742, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 207.44576, "t": 164.45752000000005, "r": 223.40594000000002, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "Text", "bbox": {"l": 207.44576, "t": 164.45752000000005, "r": 223.40594000000002, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 241.46428, "t": 164.45752000000005, "r": 257.42447, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "Text", "bbox": {"l": 241.46428, "t": 164.45752000000005, "r": 257.42447, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 86.372002, "t": 175.41656, "r": 118.8752, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "Footnote", "bbox": {"l": 86.372002, "t": 175.41656, "r": 118.8752, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 151.07401, "t": 175.41656, "r": 159.41275, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "71", "bbox": {"l": 151.07401, "t": 175.41656, "r": 159.41275, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 173.42723, "t": 175.41656, "r": 189.38742, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "Text", "bbox": {"l": 173.42723, "t": 175.41656, "r": 189.38742, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 207.44576, "t": 175.41656, "r": 223.40594000000002, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "Text", "bbox": {"l": 207.44576, "t": 175.41656, "r": 223.40594000000002, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 241.46428, "t": 175.41656, "r": 257.42447, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "Text", "bbox": {"l": 241.46428, "t": 175.41656, "r": 257.42447, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 86.372002, "t": 186.37554999999998, "r": 116.88466, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "Formula", "bbox": {"l": 86.372002, "t": 186.37554999999998, "r": 116.88466, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 151.07401, "t": 186.37554999999998, "r": 159.41275, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "60", "bbox": {"l": 151.07401, "t": 186.37554999999998, "r": 159.41275, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 173.42723, "t": 186.37554999999998, "r": 189.38742, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "Text", "bbox": {"l": 173.42723, "t": 186.37554999999998, "r": 189.38742, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 207.44576, "t": 186.37554999999998, "r": 223.40594000000002, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "Text", "bbox": {"l": 207.44576, "t": 186.37554999999998, "r": 223.40594000000002, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 241.46428, "t": 186.37554999999998, "r": 257.42447, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "Text", "bbox": {"l": 241.46428, "t": 186.37554999999998, "r": 257.42447, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 86.372002, "t": 197.33452999999997, "r": 119.25179, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "List-item", "bbox": {"l": 86.372002, "t": 197.33452999999997, "r": 119.25179, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 151.07401, "t": 197.33452999999997, "r": 159.41275, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "81", "bbox": {"l": 151.07401, "t": 197.33452999999997, "r": 159.41275, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 173.42723, "t": 197.33452999999997, "r": 189.38742, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "Text", "bbox": {"l": 173.42723, "t": 197.33452999999997, "r": 189.38742, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 211.25647, "t": 197.33452999999997, "r": 219.59521, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "82", "bbox": {"l": 211.25647, "t": 197.33452999999997, "r": 219.59521, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 241.46426, "t": 197.33452999999997, "r": 257.42447, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "Text", "bbox": {"l": 241.46426, "t": 197.33452999999997, "r": 257.42447, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 86.372002, "t": 208.29351999999994, "r": 128.89964, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "Page-footer", "bbox": {"l": 86.372002, "t": 208.29351999999994, "r": 128.89964, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 151.07401, "t": 208.29351999999994, "r": 159.41275, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "62", "bbox": {"l": 151.07401, "t": 208.29351999999994, "r": 159.41275, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 177.23795, "t": 208.29351999999994, "r": 185.57669, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "62", "bbox": {"l": 177.23795, "t": 208.29351999999994, "r": 185.57669, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 213.91052, "t": 208.29351999999994, "r": 216.94116, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "-", "bbox": {"l": 213.91052, "t": 208.29351999999994, "r": 216.94116, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 247.92905000000002, "t": 208.29351999999994, "r": 250.95969, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "-", "bbox": {"l": 247.92905000000002, "t": 208.29351999999994, "r": 250.95969, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 86.372002, "t": 219.25256000000002, "r": 131.65231, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "Page-header", "bbox": {"l": 86.372002, "t": 219.25256000000002, "r": 131.65231, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 151.07401, "t": 219.25256000000002, "r": 159.41275, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "72", "bbox": {"l": 151.07401, "t": 219.25256000000002, "r": 159.41275, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 177.23795, "t": 219.25256000000002, "r": 185.57669, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "68", "bbox": {"l": 177.23795, "t": 219.25256000000002, "r": 185.57669, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 213.91052, "t": 219.25256000000002, "r": 216.94116, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "-", "bbox": {"l": 213.91052, "t": 219.25256000000002, "r": 216.94116, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 247.92905000000002, "t": 219.25256000000002, "r": 250.95969, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "-", "bbox": {"l": 247.92905000000002, "t": 219.25256000000002, "r": 250.95969, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 86.372002, "t": 230.21155, "r": 112.35663, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "Picture", "bbox": {"l": 86.372002, "t": 230.21155, "r": 112.35663, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 151.07401, "t": 230.21155, "r": 159.41275, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "72", "bbox": {"l": 151.07401, "t": 230.21155, "r": 159.41275, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 177.23795, "t": 230.21155, "r": 185.57669, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "72", "bbox": {"l": 177.23795, "t": 230.21155, "r": 185.57669, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 211.25645, "t": 230.21155, "r": 219.5952, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "72", "bbox": {"l": 211.25645, "t": 230.21155, "r": 219.5952, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 245.27496, "t": 230.21155, "r": 253.61371, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "72", "bbox": {"l": 245.27496, "t": 230.21155, "r": 253.61371, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 86.372002, "t": 241.16956000000005, "r": 141.11188, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "Section-header", "bbox": {"l": 86.372002, "t": 241.16956000000005, "r": 141.11188, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 151.07401, "t": 241.16956000000005, "r": 159.41275, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "68", "bbox": {"l": 151.07401, "t": 241.16956000000005, "r": 159.41275, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 177.23795, "t": 241.16956000000005, "r": 185.57669, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "67", "bbox": {"l": 177.23795, "t": 241.16956000000005, "r": 185.57669, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 211.25645, "t": 241.16956000000005, "r": 219.5952, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "69", "bbox": {"l": 211.25645, "t": 241.16956000000005, "r": 219.5952, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 245.27496, "t": 241.16956000000005, "r": 253.61371, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "68", "bbox": {"l": 245.27496, "t": 241.16956000000005, "r": 253.61371, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 86.372002, "t": 252.12854000000004, "r": 106.17878, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "Table", "bbox": {"l": 86.372002, "t": 252.12854000000004, "r": 106.17878, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 151.07401, "t": 252.12854000000004, "r": 159.41275, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "82", "bbox": {"l": 151.07401, "t": 252.12854000000004, "r": 159.41275, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 177.23795, "t": 252.12854000000004, "r": 185.57669, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "83", "bbox": {"l": 177.23795, "t": 252.12854000000004, "r": 185.57669, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 211.25645, "t": 252.12854000000004, "r": 219.5952, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "82", "bbox": {"l": 211.25645, "t": 252.12854000000004, "r": 219.5952, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 245.27496, "t": 252.12854000000004, "r": 253.61371, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "82", "bbox": {"l": 245.27496, "t": 252.12854000000004, "r": 253.61371, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 86.372002, "t": 263.08752000000004, "r": 102.3322, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "Text", "bbox": {"l": 86.372002, "t": 263.08752000000004, "r": 102.3322, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 151.07401, "t": 263.08752000000004, "r": 159.41275, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "85", "bbox": {"l": 151.07401, "t": 263.08752000000004, "r": 159.41275, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 177.23795, "t": 263.08752000000004, "r": 185.57669, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "84", "bbox": {"l": 177.23795, "t": 263.08752000000004, "r": 185.57669, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 211.25645, "t": 263.08752000000004, "r": 219.5952, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "84", "bbox": {"l": 211.25645, "t": 263.08752000000004, "r": 219.5952, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 245.27496, "t": 263.08752000000004, "r": 253.61371, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "84", "bbox": {"l": 245.27496, "t": 263.08752000000004, "r": 253.61371, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 86.372002, "t": 274.04657, "r": 103.36333, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "Title", "bbox": {"l": 86.372002, "t": 274.04657, "r": 103.36333, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 151.07401, "t": 274.04657, "r": 159.41275, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "77", "bbox": {"l": 151.07401, "t": 274.04657, "r": 159.41275, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 169.37442, "t": 274.04657, "r": 193.43127, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "Sec.-h.", "bbox": {"l": 169.37442, "t": 274.04657, "r": 193.43127, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 203.39294, "t": 274.04657, "r": 227.4498, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "Sec.-h.", "bbox": {"l": 203.39294, "t": 274.04657, "r": 227.4498, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 237.41147, "t": 274.04657, "r": 261.46832, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "Sec.-h.", "bbox": {"l": 237.41147, "t": 274.04657, "r": 261.46832, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 86.372002, "t": 285.40454, "r": 113.31602000000001, "b": 293.77917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "Overall", "bbox": {"l": 86.372002, "t": 285.40454, "r": 113.31602000000001, "b": 293.77917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 151.07401, "t": 285.40454, "r": 159.41275, "b": 293.77917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "72", "bbox": {"l": 151.07401, "t": 285.40454, "r": 159.41275, "b": 293.77917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 177.23795, "t": 285.40454, "r": 185.57669, "b": 293.77917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "73", "bbox": {"l": 177.23795, "t": 285.40454, "r": 185.57669, "b": 293.77917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 211.25645, "t": 285.40454, "r": 219.5952, "b": 293.77917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "78", "bbox": {"l": 211.25645, "t": 285.40454, "r": 219.5952, "b": 293.77917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 245.27496, "t": 285.40454, "r": 253.61371, "b": 293.77917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "77", "bbox": {"l": 245.27496, "t": 285.40454, "r": 253.61371, "b": 293.77917, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 13, "num_cols": 5, "table_cells": [{"bbox": {"l": 86.372002, "t": 153.10051999999996, "r": 129.46452, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Class-count", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 151.07401, "t": 153.10051999999996, "r": 159.41275, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "11", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 179.31816, "t": 153.10051999999996, "r": 183.48753, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "6", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 213.33669, "t": 153.10051999999996, "r": 217.50606, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "5", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 247.35521, "t": 153.10051999999996, "r": 251.52458, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "4", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 164.45752000000005, "r": 115.55763, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Caption", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 164.45752000000005, "r": 159.41275, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 173.42723, "t": 164.45752000000005, "r": 189.38742, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 207.44576, "t": 164.45752000000005, "r": 223.40594000000002, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 241.46428, "t": 164.45752000000005, "r": 257.42447, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 175.41656, "r": 118.8752, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Footnote", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 175.41656, "r": 159.41275, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "71", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 173.42723, "t": 175.41656, "r": 189.38742, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 207.44576, "t": 175.41656, "r": 223.40594000000002, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 241.46428, "t": 175.41656, "r": 257.42447, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 186.37554999999998, "r": 116.88466, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Formula", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 186.37554999999998, "r": 159.41275, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "60", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 173.42723, "t": 186.37554999999998, "r": 189.38742, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 207.44576, "t": 186.37554999999998, "r": 223.40594000000002, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 241.46428, "t": 186.37554999999998, "r": 257.42447, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 197.33452999999997, "r": 119.25179, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "List-item", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 197.33452999999997, "r": 159.41275, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 173.42723, "t": 197.33452999999997, "r": 189.38742, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 211.25647, "t": 197.33452999999997, "r": 219.59521, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 241.46426, "t": 197.33452999999997, "r": 257.42447, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 208.29351999999994, "r": 128.89964, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-footer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 208.29351999999994, "r": 159.41275, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "62", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23795, "t": 208.29351999999994, "r": 185.57669, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "62", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 213.91052, "t": 208.29351999999994, "r": 216.94116, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 247.92905000000002, "t": 208.29351999999994, "r": 250.95969, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 219.25256000000002, "r": 131.65231, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 219.25256000000002, "r": 159.41275, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23795, "t": 219.25256000000002, "r": 185.57669, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 213.91052, "t": 219.25256000000002, "r": 216.94116, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 247.92905000000002, "t": 219.25256000000002, "r": 250.95969, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 230.21155, "r": 112.35663, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Picture", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 230.21155, "r": 159.41275, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23795, "t": 230.21155, "r": 185.57669, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 211.25645, "t": 230.21155, "r": 219.5952, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.27496, "t": 230.21155, "r": 253.61371, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 241.16956000000005, "r": 141.11188, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Section-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 241.16956000000005, "r": 159.41275, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23795, "t": 241.16956000000005, "r": 185.57669, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "67", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 211.25645, "t": 241.16956000000005, "r": 219.5952, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "69", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.27496, "t": 241.16956000000005, "r": 253.61371, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 252.12854000000004, "r": 106.17878, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 252.12854000000004, "r": 159.41275, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23795, "t": 252.12854000000004, "r": 185.57669, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 211.25645, "t": 252.12854000000004, "r": 219.5952, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.27496, "t": 252.12854000000004, "r": 253.61371, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 263.08752000000004, "r": 102.3322, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Text", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 263.08752000000004, "r": 159.41275, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23795, "t": 263.08752000000004, "r": 185.57669, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 211.25645, "t": 263.08752000000004, "r": 219.5952, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.27496, "t": 263.08752000000004, "r": 253.61371, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 274.04657, "r": 103.36333, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Title", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 274.04657, "r": 159.41275, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 169.37442, "t": 274.04657, "r": 193.43127, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Sec.-h.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 203.39294, "t": 274.04657, "r": 227.4498, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Sec.-h.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 237.41147, "t": 274.04657, "r": 261.46832, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Sec.-h.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 285.40454, "r": 113.31602000000001, "b": 293.77917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Overall", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 285.40454, "r": 159.41275, "b": 293.77917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23795, "t": 285.40454, "r": 185.57669, "b": 293.77917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "73", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 211.25645, "t": 285.40454, "r": 219.5952, "b": 293.77917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "78", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.27496, "t": 285.40454, "r": 253.61371, "b": 293.77917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "77", "column_header": false, "row_header": false, "row_section": false}]}, "0": {"label": "table", "id": 0, "page_no": 6, "cluster": {"id": 0, "label": "table", "bbox": {"l": 352.97747802734375, "t": 150.791259765625, "r": 522.9158935546875, "b": 306.2658386230469, "coord_origin": "TOPLEFT"}, "confidence": 0.9879696369171143, "cells": [{"id": 115, "text": "Class-count", "bbox": {"l": 358.63901, "t": 153.10051999999996, "r": 401.73154, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "11", "bbox": {"l": 440.22501, "t": 153.10051999999996, "r": 448.56375, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "5", "bbox": {"l": 494.38, "t": 153.10051999999996, "r": 498.54938, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "Split", "bbox": {"l": 358.63901, "t": 164.05951000000005, "r": 375.27167, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "Doc", "bbox": {"l": 423.341, "t": 164.05951000000005, "r": 438.0459, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "Page", "bbox": {"l": 448.00757, "t": 164.05951000000005, "r": 465.4472, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "Doc", "bbox": {"l": 475.41101, "t": 164.05951000000005, "r": 490.11591, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Page", "bbox": {"l": 500.07757999999995, "t": 164.05951000000005, "r": 517.51721, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "Caption", "bbox": {"l": 358.63901, "t": 175.41656, "r": 387.82465, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "68", "bbox": {"l": 426.52399, "t": 175.41656, "r": 434.86273, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "83", "bbox": {"l": 452.56240999999994, "t": 175.41656, "r": 460.90115000000003, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "Footnote", "bbox": {"l": 358.63901, "t": 186.37554999999998, "r": 391.14221, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "71", "bbox": {"l": 426.52399, "t": 186.37554999999998, "r": 434.86273, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "84", "bbox": {"l": 452.56240999999994, "t": 186.37554999999998, "r": 460.90115000000003, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "Formula", "bbox": {"l": 358.63901, "t": 197.33452999999997, "r": 389.15167, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "60", "bbox": {"l": 426.52399, "t": 197.33452999999997, "r": 434.86273, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "66", "bbox": {"l": 452.56240999999994, "t": 197.33452999999997, "r": 460.90115000000003, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "List-item", "bbox": {"l": 358.63901, "t": 208.29351999999994, "r": 391.5188, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "81", "bbox": {"l": 426.52399, "t": 208.29351999999994, "r": 434.86273, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "88", "bbox": {"l": 452.56240999999994, "t": 208.29351999999994, "r": 460.90115000000003, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "82", "bbox": {"l": 478.59399, "t": 208.29351999999994, "r": 486.93274, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "88", "bbox": {"l": 504.6324200000001, "t": 208.29351999999994, "r": 512.97119, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "Page-footer", "bbox": {"l": 358.63901, "t": 219.25256000000002, "r": 401.16666, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "62", "bbox": {"l": 426.52399, "t": 219.25256000000002, "r": 434.86273, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "89", "bbox": {"l": 452.56240999999994, "t": 219.25256000000002, "r": 460.90115000000003, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "Page-header", "bbox": {"l": 358.63901, "t": 230.21155, "r": 403.91931, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "72", "bbox": {"l": 426.52399, "t": 230.21155, "r": 434.86273, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "90", "bbox": {"l": 452.56240999999994, "t": 230.21155, "r": 460.90115000000003, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "Picture", "bbox": {"l": 358.63901, "t": 241.16956000000005, "r": 384.62366, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "72", "bbox": {"l": 426.52399, "t": 241.16956000000005, "r": 434.86273, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "82", "bbox": {"l": 452.56240999999994, "t": 241.16956000000005, "r": 460.90115000000003, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "72", "bbox": {"l": 478.59399, "t": 241.16956000000005, "r": 486.93274, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "82", "bbox": {"l": 504.6324200000001, "t": 241.16956000000005, "r": 512.97119, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "Section-header", "bbox": {"l": 358.63901, "t": 252.12854000000004, "r": 413.37891, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "68", "bbox": {"l": 426.52399, "t": 252.12854000000004, "r": 434.86273, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "83", "bbox": {"l": 452.56240999999994, "t": 252.12854000000004, "r": 460.90115000000003, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "69", "bbox": {"l": 478.59399, "t": 252.12854000000004, "r": 486.93274, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "83", "bbox": {"l": 504.6324200000001, "t": 252.12854000000004, "r": 512.97119, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "Table", "bbox": {"l": 358.63901, "t": 263.08752000000004, "r": 378.44577, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "82", "bbox": {"l": 426.52399, "t": 263.08752000000004, "r": 434.86273, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "89", "bbox": {"l": 452.56240999999994, "t": 263.08752000000004, "r": 460.90115000000003, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "82", "bbox": {"l": 478.59399, "t": 263.08752000000004, "r": 486.93274, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "90", "bbox": {"l": 504.6324200000001, "t": 263.08752000000004, "r": 512.97119, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "Text", "bbox": {"l": 358.63901, "t": 274.04657, "r": 374.59921, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "85", "bbox": {"l": 426.52399, "t": 274.04657, "r": 434.86273, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "91", "bbox": {"l": 452.56240999999994, "t": 274.04657, "r": 460.90115000000003, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "84", "bbox": {"l": 478.59399, "t": 274.04657, "r": 486.93274, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "90", "bbox": {"l": 504.6324200000001, "t": 274.04657, "r": 512.97119, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "Title", "bbox": {"l": 358.63901, "t": 285.00552, "r": 375.63034, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "77", "bbox": {"l": 426.52399, "t": 285.00552, "r": 434.86273, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "81", "bbox": {"l": 452.56240999999994, "t": 285.00552, "r": 460.90115000000003, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "All", "bbox": {"l": 358.63901, "t": 296.36255, "r": 369.60492, "b": 304.73718, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "72", "bbox": {"l": 426.52399, "t": 296.36255, "r": 434.86273, "b": 304.73718, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "84", "bbox": {"l": 452.56240999999994, "t": 296.36255, "r": 460.90115000000003, "b": 304.73718, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "78", "bbox": {"l": 478.59399, "t": 296.36255, "r": 486.93274, "b": 304.73718, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "87", "bbox": {"l": 504.6324200000001, "t": 296.36255, "r": 512.97119, "b": 304.73718, "coord_origin": "TOPLEFT"}}], "children": [{"id": 80, "label": "text", "bbox": {"l": 358.63901, "t": 153.10051999999996, "r": 401.73154, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 115, "text": "Class-count", "bbox": {"l": 358.63901, "t": 153.10051999999996, "r": 401.73154, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 440.22501, "t": 153.10051999999996, "r": 448.56375, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 116, "text": "11", "bbox": {"l": 440.22501, "t": 153.10051999999996, "r": 448.56375, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 494.38, "t": 153.10051999999996, "r": 498.54938, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 117, "text": "5", "bbox": {"l": 494.38, "t": 153.10051999999996, "r": 498.54938, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 358.63901, "t": 164.05951000000005, "r": 375.27167, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 118, "text": "Split", "bbox": {"l": 358.63901, "t": 164.05951000000005, "r": 375.27167, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 423.341, "t": 164.05951000000005, "r": 438.0459, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 119, "text": "Doc", "bbox": {"l": 423.341, "t": 164.05951000000005, "r": 438.0459, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 448.00757, "t": 164.05951000000005, "r": 465.4472, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 120, "text": "Page", "bbox": {"l": 448.00757, "t": 164.05951000000005, "r": 465.4472, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 475.41101, "t": 164.05951000000005, "r": 490.11591, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 121, "text": "Doc", "bbox": {"l": 475.41101, "t": 164.05951000000005, "r": 490.11591, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 500.07757999999995, "t": 164.05951000000005, "r": 517.51721, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 122, "text": "Page", "bbox": {"l": 500.07757999999995, "t": 164.05951000000005, "r": 517.51721, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 358.63901, "t": 175.41656, "r": 387.82465, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 123, "text": "Caption", "bbox": {"l": 358.63901, "t": 175.41656, "r": 387.82465, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 426.52399, "t": 175.41656, "r": 434.86273, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 124, "text": "68", "bbox": {"l": 426.52399, "t": 175.41656, "r": 434.86273, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 452.56240999999994, "t": 175.41656, "r": 460.90115000000003, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 125, "text": "83", "bbox": {"l": 452.56240999999994, "t": 175.41656, "r": 460.90115000000003, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 358.63901, "t": 186.37554999999998, "r": 391.14221, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 126, "text": "Footnote", "bbox": {"l": 358.63901, "t": 186.37554999999998, "r": 391.14221, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 426.52399, "t": 186.37554999999998, "r": 434.86273, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 127, "text": "71", "bbox": {"l": 426.52399, "t": 186.37554999999998, "r": 434.86273, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 452.56240999999994, "t": 186.37554999999998, "r": 460.90115000000003, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 128, "text": "84", "bbox": {"l": 452.56240999999994, "t": 186.37554999999998, "r": 460.90115000000003, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 358.63901, "t": 197.33452999999997, "r": 389.15167, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 129, "text": "Formula", "bbox": {"l": 358.63901, "t": 197.33452999999997, "r": 389.15167, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 426.52399, "t": 197.33452999999997, "r": 434.86273, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 130, "text": "60", "bbox": {"l": 426.52399, "t": 197.33452999999997, "r": 434.86273, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 452.56240999999994, "t": 197.33452999999997, "r": 460.90115000000003, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 131, "text": "66", "bbox": {"l": 452.56240999999994, "t": 197.33452999999997, "r": 460.90115000000003, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 358.63901, "t": 208.29351999999994, "r": 391.5188, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 132, "text": "List-item", "bbox": {"l": 358.63901, "t": 208.29351999999994, "r": 391.5188, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 426.52399, "t": 208.29351999999994, "r": 434.86273, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 133, "text": "81", "bbox": {"l": 426.52399, "t": 208.29351999999994, "r": 434.86273, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 452.56240999999994, "t": 208.29351999999994, "r": 460.90115000000003, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 134, "text": "88", "bbox": {"l": 452.56240999999994, "t": 208.29351999999994, "r": 460.90115000000003, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 478.59399, "t": 208.29351999999994, "r": 486.93274, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 135, "text": "82", "bbox": {"l": 478.59399, "t": 208.29351999999994, "r": 486.93274, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 504.6324200000001, "t": 208.29351999999994, "r": 512.97119, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 136, "text": "88", "bbox": {"l": 504.6324200000001, "t": 208.29351999999994, "r": 512.97119, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 358.63901, "t": 219.25256000000002, "r": 401.16666, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 137, "text": "Page-footer", "bbox": {"l": 358.63901, "t": 219.25256000000002, "r": 401.16666, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 426.52399, "t": 219.25256000000002, "r": 434.86273, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 138, "text": "62", "bbox": {"l": 426.52399, "t": 219.25256000000002, "r": 434.86273, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 452.56240999999994, "t": 219.25256000000002, "r": 460.90115000000003, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 139, "text": "89", "bbox": {"l": 452.56240999999994, "t": 219.25256000000002, "r": 460.90115000000003, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 358.63901, "t": 230.21155, "r": 403.91931, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 140, "text": "Page-header", "bbox": {"l": 358.63901, "t": 230.21155, "r": 403.91931, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 426.52399, "t": 230.21155, "r": 434.86273, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 141, "text": "72", "bbox": {"l": 426.52399, "t": 230.21155, "r": 434.86273, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 452.56240999999994, "t": 230.21155, "r": 460.90115000000003, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 142, "text": "90", "bbox": {"l": 452.56240999999994, "t": 230.21155, "r": 460.90115000000003, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 358.63901, "t": 241.16956000000005, "r": 384.62366, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 143, "text": "Picture", "bbox": {"l": 358.63901, "t": 241.16956000000005, "r": 384.62366, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 426.52399, "t": 241.16956000000005, "r": 434.86273, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 144, "text": "72", "bbox": {"l": 426.52399, "t": 241.16956000000005, "r": 434.86273, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 452.56240999999994, "t": 241.16956000000005, "r": 460.90115000000003, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 145, "text": "82", "bbox": {"l": 452.56240999999994, "t": 241.16956000000005, "r": 460.90115000000003, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 478.59399, "t": 241.16956000000005, "r": 486.93274, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 146, "text": "72", "bbox": {"l": 478.59399, "t": 241.16956000000005, "r": 486.93274, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 504.6324200000001, "t": 241.16956000000005, "r": 512.97119, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 147, "text": "82", "bbox": {"l": 504.6324200000001, "t": 241.16956000000005, "r": 512.97119, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 358.63901, "t": 252.12854000000004, "r": 413.37891, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 148, "text": "Section-header", "bbox": {"l": 358.63901, "t": 252.12854000000004, "r": 413.37891, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 114, "label": "text", "bbox": {"l": 426.52399, "t": 252.12854000000004, "r": 434.86273, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 149, "text": "68", "bbox": {"l": 426.52399, "t": 252.12854000000004, "r": 434.86273, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 115, "label": "text", "bbox": {"l": 452.56240999999994, "t": 252.12854000000004, "r": 460.90115000000003, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 150, "text": "83", "bbox": {"l": 452.56240999999994, "t": 252.12854000000004, "r": 460.90115000000003, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 116, "label": "text", "bbox": {"l": 478.59399, "t": 252.12854000000004, "r": 486.93274, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 151, "text": "69", "bbox": {"l": 478.59399, "t": 252.12854000000004, "r": 486.93274, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 117, "label": "text", "bbox": {"l": 504.6324200000001, "t": 252.12854000000004, "r": 512.97119, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 152, "text": "83", "bbox": {"l": 504.6324200000001, "t": 252.12854000000004, "r": 512.97119, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 118, "label": "text", "bbox": {"l": 358.63901, "t": 263.08752000000004, "r": 378.44577, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 153, "text": "Table", "bbox": {"l": 358.63901, "t": 263.08752000000004, "r": 378.44577, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 119, "label": "text", "bbox": {"l": 426.52399, "t": 263.08752000000004, "r": 434.86273, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 154, "text": "82", "bbox": {"l": 426.52399, "t": 263.08752000000004, "r": 434.86273, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 120, "label": "text", "bbox": {"l": 452.56240999999994, "t": 263.08752000000004, "r": 460.90115000000003, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 155, "text": "89", "bbox": {"l": 452.56240999999994, "t": 263.08752000000004, "r": 460.90115000000003, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 121, "label": "text", "bbox": {"l": 478.59399, "t": 263.08752000000004, "r": 486.93274, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 156, "text": "82", "bbox": {"l": 478.59399, "t": 263.08752000000004, "r": 486.93274, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 122, "label": "text", "bbox": {"l": 504.6324200000001, "t": 263.08752000000004, "r": 512.97119, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 157, "text": "90", "bbox": {"l": 504.6324200000001, "t": 263.08752000000004, "r": 512.97119, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 123, "label": "text", "bbox": {"l": 358.63901, "t": 274.04657, "r": 374.59921, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 158, "text": "Text", "bbox": {"l": 358.63901, "t": 274.04657, "r": 374.59921, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 124, "label": "text", "bbox": {"l": 426.52399, "t": 274.04657, "r": 434.86273, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 159, "text": "85", "bbox": {"l": 426.52399, "t": 274.04657, "r": 434.86273, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 125, "label": "text", "bbox": {"l": 452.56240999999994, "t": 274.04657, "r": 460.90115000000003, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 160, "text": "91", "bbox": {"l": 452.56240999999994, "t": 274.04657, "r": 460.90115000000003, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 126, "label": "text", "bbox": {"l": 478.59399, "t": 274.04657, "r": 486.93274, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 161, "text": "84", "bbox": {"l": 478.59399, "t": 274.04657, "r": 486.93274, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 127, "label": "text", "bbox": {"l": 504.6324200000001, "t": 274.04657, "r": 512.97119, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 162, "text": "90", "bbox": {"l": 504.6324200000001, "t": 274.04657, "r": 512.97119, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 128, "label": "text", "bbox": {"l": 358.63901, "t": 285.00552, "r": 375.63034, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 163, "text": "Title", "bbox": {"l": 358.63901, "t": 285.00552, "r": 375.63034, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 129, "label": "text", "bbox": {"l": 426.52399, "t": 285.00552, "r": 434.86273, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 164, "text": "77", "bbox": {"l": 426.52399, "t": 285.00552, "r": 434.86273, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 130, "label": "text", "bbox": {"l": 452.56240999999994, "t": 285.00552, "r": 460.90115000000003, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 165, "text": "81", "bbox": {"l": 452.56240999999994, "t": 285.00552, "r": 460.90115000000003, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 131, "label": "text", "bbox": {"l": 358.63901, "t": 296.36255, "r": 369.60492, "b": 304.73718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 166, "text": "All", "bbox": {"l": 358.63901, "t": 296.36255, "r": 369.60492, "b": 304.73718, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 132, "label": "text", "bbox": {"l": 426.52399, "t": 296.36255, "r": 434.86273, "b": 304.73718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 167, "text": "72", "bbox": {"l": 426.52399, "t": 296.36255, "r": 434.86273, "b": 304.73718, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 133, "label": "text", "bbox": {"l": 452.56240999999994, "t": 296.36255, "r": 460.90115000000003, "b": 304.73718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 168, "text": "84", "bbox": {"l": 452.56240999999994, "t": 296.36255, "r": 460.90115000000003, "b": 304.73718, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 134, "label": "text", "bbox": {"l": 478.59399, "t": 296.36255, "r": 486.93274, "b": 304.73718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 169, "text": "78", "bbox": {"l": 478.59399, "t": 296.36255, "r": 486.93274, "b": 304.73718, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 135, "label": "text", "bbox": {"l": 504.6324200000001, "t": 296.36255, "r": 512.97119, "b": 304.73718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 170, "text": "87", "bbox": {"l": 504.6324200000001, "t": 296.36255, "r": 512.97119, "b": 304.73718, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["fcel", "ched", "lcel", "ched", "lcel", "nl", "fcel", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 14, "num_cols": 5, "table_cells": [{"bbox": {"l": 358.63901, "t": 153.10051999999996, "r": 401.73154, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Class-count", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.22501, "t": 153.10051999999996, "r": 448.56375, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 3, "text": "11", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 494.38, "t": 153.10051999999996, "r": 498.54938, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 5, "text": "5", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 164.05951000000005, "r": 375.27167, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Split", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 423.341, "t": 164.05951000000005, "r": 438.0459, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Doc", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 448.00757, "t": 164.05951000000005, "r": 465.4472, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Page", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 475.41101, "t": 164.05951000000005, "r": 490.11591, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Doc", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 500.07757999999995, "t": 164.05951000000005, "r": 517.51721, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Page", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 175.41656, "r": 387.82465, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Caption", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 175.41656, "r": 434.86273, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 175.41656, "r": 460.90115000000003, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 186.37554999999998, "r": 391.14221, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Footnote", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 186.37554999999998, "r": 434.86273, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "71", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 186.37554999999998, "r": 460.90115000000003, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 197.33452999999997, "r": 389.15167, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Formula", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 197.33452999999997, "r": 434.86273, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "60", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 197.33452999999997, "r": 460.90115000000003, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "66", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 208.29351999999994, "r": 391.5188, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "List-item", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 208.29351999999994, "r": 434.86273, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 208.29351999999994, "r": 460.90115000000003, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 478.59399, "t": 208.29351999999994, "r": 486.93274, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 504.6324200000001, "t": 208.29351999999994, "r": 512.97119, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 219.25256000000002, "r": 401.16666, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-footer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 219.25256000000002, "r": 434.86273, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "62", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 219.25256000000002, "r": 460.90115000000003, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "89", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 230.21155, "r": 403.91931, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 230.21155, "r": 434.86273, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 230.21155, "r": 460.90115000000003, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "90", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 241.16956000000005, "r": 384.62366, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Picture", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 241.16956000000005, "r": 434.86273, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 241.16956000000005, "r": 460.90115000000003, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 478.59399, "t": 241.16956000000005, "r": 486.93274, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 504.6324200000001, "t": 241.16956000000005, "r": 512.97119, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 252.12854000000004, "r": 413.37891, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Section-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 252.12854000000004, "r": 434.86273, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 252.12854000000004, "r": 460.90115000000003, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 478.59399, "t": 252.12854000000004, "r": 486.93274, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "69", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 504.6324200000001, "t": 252.12854000000004, "r": 512.97119, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 263.08752000000004, "r": 378.44577, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 263.08752000000004, "r": 434.86273, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 263.08752000000004, "r": 460.90115000000003, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "89", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 478.59399, "t": 263.08752000000004, "r": 486.93274, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 504.6324200000001, "t": 263.08752000000004, "r": 512.97119, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "90", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 274.04657, "r": 374.59921, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Text", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 274.04657, "r": 434.86273, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 274.04657, "r": 460.90115000000003, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "91", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 478.59399, "t": 274.04657, "r": 486.93274, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 504.6324200000001, "t": 274.04657, "r": 512.97119, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "90", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 285.00552, "r": 375.63034, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Title", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 285.00552, "r": 434.86273, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 285.00552, "r": 460.90115000000003, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 296.36255, "r": 369.60492, "b": 304.73718, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "All", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 296.36255, "r": 434.86273, "b": 304.73718, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 296.36255, "r": 460.90115000000003, "b": 304.73718, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 478.59399, "t": 296.36255, "r": 486.93274, "b": 304.73718, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "78", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 504.6324200000001, "t": 296.36255, "r": 512.97119, "b": 304.73718, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "87", "column_header": false, "row_header": false, "row_section": false}]}}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_header", "id": 12, "page_no": 6, "cluster": {"id": 12, "label": "page_header", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.9316118955612183, "cells": [{"id": 0, "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis"}, {"label": "page_header", "id": 11, "page_no": 6, "cluster": {"id": 11, "label": "page_header", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.9318180084228516, "cells": [{"id": 1, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA"}, {"label": "text", "id": 14, "page_no": 6, "cluster": {"id": 14, "label": "text", "bbox": {"l": 53.501999, "t": 86.87292000000002, "r": 295.64865, "b": 128.22313999999994, "coord_origin": "TOPLEFT"}, "confidence": 0.8296934366226196, "cells": [{"id": 2, "text": "Table 3: Performance of a Mask R-CNN R50 network in", "bbox": {"l": 53.501999, "t": 86.87292000000002, "r": 294.0437, "b": 95.34618999999998, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "mAP@0.5-0.95 scores trained on DocLayNet with different", "bbox": {"l": 53.79800000000001, "t": 97.83191, "r": 294.04376, "b": 106.30517999999995, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "class label sets. The reduced label sets were obtained by ei-", "bbox": {"l": 53.79800000000001, "t": 108.79088999999999, "r": 295.64865, "b": 117.26415999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "ther down-mapping or dropping labels.", "bbox": {"l": 53.79800000000001, "t": 119.74987999999996, "r": 213.23856, "b": 128.22313999999994, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 3: Performance of a Mask R-CNN R50 network in mAP@0.5-0.95 scores trained on DocLayNet with different class label sets. The reduced label sets were obtained by either down-mapping or dropping labels."}, {"label": "table", "id": 4, "page_no": 6, "cluster": {"id": 4, "label": "table", "bbox": {"l": 80.35525512695312, "t": 150.93629455566406, "r": 267.0082092285156, "b": 295.4454650878906, "coord_origin": "TOPLEFT"}, "confidence": 0.9869412779808044, "cells": [{"id": 6, "text": "Class-count", "bbox": {"l": 86.372002, "t": 153.10051999999996, "r": 129.46452, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "11", "bbox": {"l": 151.07401, "t": 153.10051999999996, "r": 159.41275, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "6", "bbox": {"l": 179.31816, "t": 153.10051999999996, "r": 183.48753, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "5", "bbox": {"l": 213.33669, "t": 153.10051999999996, "r": 217.50606, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "4", "bbox": {"l": 247.35521, "t": 153.10051999999996, "r": 251.52458, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Caption", "bbox": {"l": 86.372002, "t": 164.45752000000005, "r": 115.55763, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "68", "bbox": {"l": 151.07401, "t": 164.45752000000005, "r": 159.41275, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Text", "bbox": {"l": 173.42723, "t": 164.45752000000005, "r": 189.38742, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Text", "bbox": {"l": 207.44576, "t": 164.45752000000005, "r": 223.40594000000002, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Text", "bbox": {"l": 241.46428, "t": 164.45752000000005, "r": 257.42447, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Footnote", "bbox": {"l": 86.372002, "t": 175.41656, "r": 118.8752, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "71", "bbox": {"l": 151.07401, "t": 175.41656, "r": 159.41275, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Text", "bbox": {"l": 173.42723, "t": 175.41656, "r": 189.38742, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Text", "bbox": {"l": 207.44576, "t": 175.41656, "r": 223.40594000000002, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Text", "bbox": {"l": 241.46428, "t": 175.41656, "r": 257.42447, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Formula", "bbox": {"l": 86.372002, "t": 186.37554999999998, "r": 116.88466, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "60", "bbox": {"l": 151.07401, "t": 186.37554999999998, "r": 159.41275, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Text", "bbox": {"l": 173.42723, "t": 186.37554999999998, "r": 189.38742, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "Text", "bbox": {"l": 207.44576, "t": 186.37554999999998, "r": 223.40594000000002, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "Text", "bbox": {"l": 241.46428, "t": 186.37554999999998, "r": 257.42447, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "List-item", "bbox": {"l": 86.372002, "t": 197.33452999999997, "r": 119.25179, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "81", "bbox": {"l": 151.07401, "t": 197.33452999999997, "r": 159.41275, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Text", "bbox": {"l": 173.42723, "t": 197.33452999999997, "r": 189.38742, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "82", "bbox": {"l": 211.25647, "t": 197.33452999999997, "r": 219.59521, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Text", "bbox": {"l": 241.46426, "t": 197.33452999999997, "r": 257.42447, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Page-footer", "bbox": {"l": 86.372002, "t": 208.29351999999994, "r": 128.89964, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "62", "bbox": {"l": 151.07401, "t": 208.29351999999994, "r": 159.41275, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "62", "bbox": {"l": 177.23795, "t": 208.29351999999994, "r": 185.57669, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "-", "bbox": {"l": 213.91052, "t": 208.29351999999994, "r": 216.94116, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "-", "bbox": {"l": 247.92905000000002, "t": 208.29351999999994, "r": 250.95969, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Page-header", "bbox": {"l": 86.372002, "t": 219.25256000000002, "r": 131.65231, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "72", "bbox": {"l": 151.07401, "t": 219.25256000000002, "r": 159.41275, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "68", "bbox": {"l": 177.23795, "t": 219.25256000000002, "r": 185.57669, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "-", "bbox": {"l": 213.91052, "t": 219.25256000000002, "r": 216.94116, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "-", "bbox": {"l": 247.92905000000002, "t": 219.25256000000002, "r": 250.95969, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Picture", "bbox": {"l": 86.372002, "t": 230.21155, "r": 112.35663, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "72", "bbox": {"l": 151.07401, "t": 230.21155, "r": 159.41275, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "72", "bbox": {"l": 177.23795, "t": 230.21155, "r": 185.57669, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "72", "bbox": {"l": 211.25645, "t": 230.21155, "r": 219.5952, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "72", "bbox": {"l": 245.27496, "t": 230.21155, "r": 253.61371, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "Section-header", "bbox": {"l": 86.372002, "t": 241.16956000000005, "r": 141.11188, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "68", "bbox": {"l": 151.07401, "t": 241.16956000000005, "r": 159.41275, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "67", "bbox": {"l": 177.23795, "t": 241.16956000000005, "r": 185.57669, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "69", "bbox": {"l": 211.25645, "t": 241.16956000000005, "r": 219.5952, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "68", "bbox": {"l": 245.27496, "t": 241.16956000000005, "r": 253.61371, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Table", "bbox": {"l": 86.372002, "t": 252.12854000000004, "r": 106.17878, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "82", "bbox": {"l": 151.07401, "t": 252.12854000000004, "r": 159.41275, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "83", "bbox": {"l": 177.23795, "t": 252.12854000000004, "r": 185.57669, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "82", "bbox": {"l": 211.25645, "t": 252.12854000000004, "r": 219.5952, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "82", "bbox": {"l": 245.27496, "t": 252.12854000000004, "r": 253.61371, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Text", "bbox": {"l": 86.372002, "t": 263.08752000000004, "r": 102.3322, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "85", "bbox": {"l": 151.07401, "t": 263.08752000000004, "r": 159.41275, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "84", "bbox": {"l": 177.23795, "t": 263.08752000000004, "r": 185.57669, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "84", "bbox": {"l": 211.25645, "t": 263.08752000000004, "r": 219.5952, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "84", "bbox": {"l": 245.27496, "t": 263.08752000000004, "r": 253.61371, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "Title", "bbox": {"l": 86.372002, "t": 274.04657, "r": 103.36333, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "77", "bbox": {"l": 151.07401, "t": 274.04657, "r": 159.41275, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "Sec.-h.", "bbox": {"l": 169.37442, "t": 274.04657, "r": 193.43127, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "Sec.-h.", "bbox": {"l": 203.39294, "t": 274.04657, "r": 227.4498, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "Sec.-h.", "bbox": {"l": 237.41147, "t": 274.04657, "r": 261.46832, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "Overall", "bbox": {"l": 86.372002, "t": 285.40454, "r": 113.31602000000001, "b": 293.77917, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "72", "bbox": {"l": 151.07401, "t": 285.40454, "r": 159.41275, "b": 293.77917, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "73", "bbox": {"l": 177.23795, "t": 285.40454, "r": 185.57669, "b": 293.77917, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "78", "bbox": {"l": 211.25645, "t": 285.40454, "r": 219.5952, "b": 293.77917, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "77", "bbox": {"l": 245.27496, "t": 285.40454, "r": 253.61371, "b": 293.77917, "coord_origin": "TOPLEFT"}}], "children": [{"id": 15, "label": "text", "bbox": {"l": 86.372002, "t": 153.10051999999996, "r": 129.46452, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": "Class-count", "bbox": {"l": 86.372002, "t": 153.10051999999996, "r": 129.46452, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 151.07401, "t": 153.10051999999996, "r": 159.41275, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "11", "bbox": {"l": 151.07401, "t": 153.10051999999996, "r": 159.41275, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 179.31816, "t": 153.10051999999996, "r": 183.48753, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "6", "bbox": {"l": 179.31816, "t": 153.10051999999996, "r": 183.48753, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 213.33669, "t": 153.10051999999996, "r": 217.50606, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "5", "bbox": {"l": 213.33669, "t": 153.10051999999996, "r": 217.50606, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 247.35521, "t": 153.10051999999996, "r": 251.52458, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "4", "bbox": {"l": 247.35521, "t": 153.10051999999996, "r": 251.52458, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 86.372002, "t": 164.45752000000005, "r": 115.55763, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "Caption", "bbox": {"l": 86.372002, "t": 164.45752000000005, "r": 115.55763, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 151.07401, "t": 164.45752000000005, "r": 159.41275, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "68", "bbox": {"l": 151.07401, "t": 164.45752000000005, "r": 159.41275, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 173.42723, "t": 164.45752000000005, "r": 189.38742, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "Text", "bbox": {"l": 173.42723, "t": 164.45752000000005, "r": 189.38742, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 207.44576, "t": 164.45752000000005, "r": 223.40594000000002, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "Text", "bbox": {"l": 207.44576, "t": 164.45752000000005, "r": 223.40594000000002, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 241.46428, "t": 164.45752000000005, "r": 257.42447, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "Text", "bbox": {"l": 241.46428, "t": 164.45752000000005, "r": 257.42447, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 86.372002, "t": 175.41656, "r": 118.8752, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "Footnote", "bbox": {"l": 86.372002, "t": 175.41656, "r": 118.8752, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 151.07401, "t": 175.41656, "r": 159.41275, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "71", "bbox": {"l": 151.07401, "t": 175.41656, "r": 159.41275, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 173.42723, "t": 175.41656, "r": 189.38742, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "Text", "bbox": {"l": 173.42723, "t": 175.41656, "r": 189.38742, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 207.44576, "t": 175.41656, "r": 223.40594000000002, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "Text", "bbox": {"l": 207.44576, "t": 175.41656, "r": 223.40594000000002, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 241.46428, "t": 175.41656, "r": 257.42447, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "Text", "bbox": {"l": 241.46428, "t": 175.41656, "r": 257.42447, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 86.372002, "t": 186.37554999999998, "r": 116.88466, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "Formula", "bbox": {"l": 86.372002, "t": 186.37554999999998, "r": 116.88466, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 151.07401, "t": 186.37554999999998, "r": 159.41275, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "60", "bbox": {"l": 151.07401, "t": 186.37554999999998, "r": 159.41275, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 173.42723, "t": 186.37554999999998, "r": 189.38742, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "Text", "bbox": {"l": 173.42723, "t": 186.37554999999998, "r": 189.38742, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 207.44576, "t": 186.37554999999998, "r": 223.40594000000002, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "Text", "bbox": {"l": 207.44576, "t": 186.37554999999998, "r": 223.40594000000002, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 241.46428, "t": 186.37554999999998, "r": 257.42447, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "Text", "bbox": {"l": 241.46428, "t": 186.37554999999998, "r": 257.42447, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 86.372002, "t": 197.33452999999997, "r": 119.25179, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "List-item", "bbox": {"l": 86.372002, "t": 197.33452999999997, "r": 119.25179, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 151.07401, "t": 197.33452999999997, "r": 159.41275, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "81", "bbox": {"l": 151.07401, "t": 197.33452999999997, "r": 159.41275, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 173.42723, "t": 197.33452999999997, "r": 189.38742, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "Text", "bbox": {"l": 173.42723, "t": 197.33452999999997, "r": 189.38742, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 211.25647, "t": 197.33452999999997, "r": 219.59521, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "82", "bbox": {"l": 211.25647, "t": 197.33452999999997, "r": 219.59521, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 241.46426, "t": 197.33452999999997, "r": 257.42447, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "Text", "bbox": {"l": 241.46426, "t": 197.33452999999997, "r": 257.42447, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 86.372002, "t": 208.29351999999994, "r": 128.89964, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "Page-footer", "bbox": {"l": 86.372002, "t": 208.29351999999994, "r": 128.89964, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 151.07401, "t": 208.29351999999994, "r": 159.41275, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "62", "bbox": {"l": 151.07401, "t": 208.29351999999994, "r": 159.41275, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 177.23795, "t": 208.29351999999994, "r": 185.57669, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "62", "bbox": {"l": 177.23795, "t": 208.29351999999994, "r": 185.57669, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 213.91052, "t": 208.29351999999994, "r": 216.94116, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "-", "bbox": {"l": 213.91052, "t": 208.29351999999994, "r": 216.94116, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 247.92905000000002, "t": 208.29351999999994, "r": 250.95969, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "-", "bbox": {"l": 247.92905000000002, "t": 208.29351999999994, "r": 250.95969, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 86.372002, "t": 219.25256000000002, "r": 131.65231, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "Page-header", "bbox": {"l": 86.372002, "t": 219.25256000000002, "r": 131.65231, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 151.07401, "t": 219.25256000000002, "r": 159.41275, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "72", "bbox": {"l": 151.07401, "t": 219.25256000000002, "r": 159.41275, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 177.23795, "t": 219.25256000000002, "r": 185.57669, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "68", "bbox": {"l": 177.23795, "t": 219.25256000000002, "r": 185.57669, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 213.91052, "t": 219.25256000000002, "r": 216.94116, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "-", "bbox": {"l": 213.91052, "t": 219.25256000000002, "r": 216.94116, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 247.92905000000002, "t": 219.25256000000002, "r": 250.95969, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "-", "bbox": {"l": 247.92905000000002, "t": 219.25256000000002, "r": 250.95969, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 86.372002, "t": 230.21155, "r": 112.35663, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "Picture", "bbox": {"l": 86.372002, "t": 230.21155, "r": 112.35663, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 151.07401, "t": 230.21155, "r": 159.41275, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "72", "bbox": {"l": 151.07401, "t": 230.21155, "r": 159.41275, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 177.23795, "t": 230.21155, "r": 185.57669, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "72", "bbox": {"l": 177.23795, "t": 230.21155, "r": 185.57669, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 211.25645, "t": 230.21155, "r": 219.5952, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "72", "bbox": {"l": 211.25645, "t": 230.21155, "r": 219.5952, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 245.27496, "t": 230.21155, "r": 253.61371, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "72", "bbox": {"l": 245.27496, "t": 230.21155, "r": 253.61371, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 86.372002, "t": 241.16956000000005, "r": 141.11188, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "Section-header", "bbox": {"l": 86.372002, "t": 241.16956000000005, "r": 141.11188, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 151.07401, "t": 241.16956000000005, "r": 159.41275, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "68", "bbox": {"l": 151.07401, "t": 241.16956000000005, "r": 159.41275, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 177.23795, "t": 241.16956000000005, "r": 185.57669, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "67", "bbox": {"l": 177.23795, "t": 241.16956000000005, "r": 185.57669, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 211.25645, "t": 241.16956000000005, "r": 219.5952, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "69", "bbox": {"l": 211.25645, "t": 241.16956000000005, "r": 219.5952, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 245.27496, "t": 241.16956000000005, "r": 253.61371, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "68", "bbox": {"l": 245.27496, "t": 241.16956000000005, "r": 253.61371, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 86.372002, "t": 252.12854000000004, "r": 106.17878, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "Table", "bbox": {"l": 86.372002, "t": 252.12854000000004, "r": 106.17878, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 151.07401, "t": 252.12854000000004, "r": 159.41275, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "82", "bbox": {"l": 151.07401, "t": 252.12854000000004, "r": 159.41275, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 177.23795, "t": 252.12854000000004, "r": 185.57669, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "83", "bbox": {"l": 177.23795, "t": 252.12854000000004, "r": 185.57669, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 211.25645, "t": 252.12854000000004, "r": 219.5952, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "82", "bbox": {"l": 211.25645, "t": 252.12854000000004, "r": 219.5952, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 245.27496, "t": 252.12854000000004, "r": 253.61371, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "82", "bbox": {"l": 245.27496, "t": 252.12854000000004, "r": 253.61371, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 86.372002, "t": 263.08752000000004, "r": 102.3322, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "Text", "bbox": {"l": 86.372002, "t": 263.08752000000004, "r": 102.3322, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 151.07401, "t": 263.08752000000004, "r": 159.41275, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "85", "bbox": {"l": 151.07401, "t": 263.08752000000004, "r": 159.41275, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 177.23795, "t": 263.08752000000004, "r": 185.57669, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "84", "bbox": {"l": 177.23795, "t": 263.08752000000004, "r": 185.57669, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 211.25645, "t": 263.08752000000004, "r": 219.5952, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "84", "bbox": {"l": 211.25645, "t": 263.08752000000004, "r": 219.5952, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 245.27496, "t": 263.08752000000004, "r": 253.61371, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "84", "bbox": {"l": 245.27496, "t": 263.08752000000004, "r": 253.61371, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 86.372002, "t": 274.04657, "r": 103.36333, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "Title", "bbox": {"l": 86.372002, "t": 274.04657, "r": 103.36333, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 151.07401, "t": 274.04657, "r": 159.41275, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "77", "bbox": {"l": 151.07401, "t": 274.04657, "r": 159.41275, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 169.37442, "t": 274.04657, "r": 193.43127, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "Sec.-h.", "bbox": {"l": 169.37442, "t": 274.04657, "r": 193.43127, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 203.39294, "t": 274.04657, "r": 227.4498, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "Sec.-h.", "bbox": {"l": 203.39294, "t": 274.04657, "r": 227.4498, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 237.41147, "t": 274.04657, "r": 261.46832, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "Sec.-h.", "bbox": {"l": 237.41147, "t": 274.04657, "r": 261.46832, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 86.372002, "t": 285.40454, "r": 113.31602000000001, "b": 293.77917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "Overall", "bbox": {"l": 86.372002, "t": 285.40454, "r": 113.31602000000001, "b": 293.77917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 151.07401, "t": 285.40454, "r": 159.41275, "b": 293.77917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "72", "bbox": {"l": 151.07401, "t": 285.40454, "r": 159.41275, "b": 293.77917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 177.23795, "t": 285.40454, "r": 185.57669, "b": 293.77917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "73", "bbox": {"l": 177.23795, "t": 285.40454, "r": 185.57669, "b": 293.77917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 211.25645, "t": 285.40454, "r": 219.5952, "b": 293.77917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "78", "bbox": {"l": 211.25645, "t": 285.40454, "r": 219.5952, "b": 293.77917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 245.27496, "t": 285.40454, "r": 253.61371, "b": 293.77917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "77", "bbox": {"l": 245.27496, "t": 285.40454, "r": 253.61371, "b": 293.77917, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 13, "num_cols": 5, "table_cells": [{"bbox": {"l": 86.372002, "t": 153.10051999999996, "r": 129.46452, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Class-count", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 151.07401, "t": 153.10051999999996, "r": 159.41275, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "11", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 179.31816, "t": 153.10051999999996, "r": 183.48753, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "6", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 213.33669, "t": 153.10051999999996, "r": 217.50606, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "5", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 247.35521, "t": 153.10051999999996, "r": 251.52458, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "4", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 164.45752000000005, "r": 115.55763, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Caption", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 164.45752000000005, "r": 159.41275, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 173.42723, "t": 164.45752000000005, "r": 189.38742, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 207.44576, "t": 164.45752000000005, "r": 223.40594000000002, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 241.46428, "t": 164.45752000000005, "r": 257.42447, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 175.41656, "r": 118.8752, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Footnote", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 175.41656, "r": 159.41275, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "71", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 173.42723, "t": 175.41656, "r": 189.38742, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 207.44576, "t": 175.41656, "r": 223.40594000000002, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 241.46428, "t": 175.41656, "r": 257.42447, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 186.37554999999998, "r": 116.88466, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Formula", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 186.37554999999998, "r": 159.41275, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "60", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 173.42723, "t": 186.37554999999998, "r": 189.38742, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 207.44576, "t": 186.37554999999998, "r": 223.40594000000002, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 241.46428, "t": 186.37554999999998, "r": 257.42447, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 197.33452999999997, "r": 119.25179, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "List-item", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 197.33452999999997, "r": 159.41275, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 173.42723, "t": 197.33452999999997, "r": 189.38742, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 211.25647, "t": 197.33452999999997, "r": 219.59521, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 241.46426, "t": 197.33452999999997, "r": 257.42447, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 208.29351999999994, "r": 128.89964, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-footer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 208.29351999999994, "r": 159.41275, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "62", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23795, "t": 208.29351999999994, "r": 185.57669, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "62", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 213.91052, "t": 208.29351999999994, "r": 216.94116, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 247.92905000000002, "t": 208.29351999999994, "r": 250.95969, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 219.25256000000002, "r": 131.65231, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 219.25256000000002, "r": 159.41275, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23795, "t": 219.25256000000002, "r": 185.57669, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 213.91052, "t": 219.25256000000002, "r": 216.94116, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 247.92905000000002, "t": 219.25256000000002, "r": 250.95969, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 230.21155, "r": 112.35663, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Picture", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 230.21155, "r": 159.41275, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23795, "t": 230.21155, "r": 185.57669, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 211.25645, "t": 230.21155, "r": 219.5952, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.27496, "t": 230.21155, "r": 253.61371, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 241.16956000000005, "r": 141.11188, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Section-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 241.16956000000005, "r": 159.41275, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23795, "t": 241.16956000000005, "r": 185.57669, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "67", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 211.25645, "t": 241.16956000000005, "r": 219.5952, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "69", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.27496, "t": 241.16956000000005, "r": 253.61371, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 252.12854000000004, "r": 106.17878, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 252.12854000000004, "r": 159.41275, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23795, "t": 252.12854000000004, "r": 185.57669, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 211.25645, "t": 252.12854000000004, "r": 219.5952, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.27496, "t": 252.12854000000004, "r": 253.61371, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 263.08752000000004, "r": 102.3322, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Text", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 263.08752000000004, "r": 159.41275, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23795, "t": 263.08752000000004, "r": 185.57669, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 211.25645, "t": 263.08752000000004, "r": 219.5952, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.27496, "t": 263.08752000000004, "r": 253.61371, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 274.04657, "r": 103.36333, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Title", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 274.04657, "r": 159.41275, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 169.37442, "t": 274.04657, "r": 193.43127, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Sec.-h.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 203.39294, "t": 274.04657, "r": 227.4498, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Sec.-h.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 237.41147, "t": 274.04657, "r": 261.46832, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Sec.-h.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 285.40454, "r": 113.31602000000001, "b": 293.77917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Overall", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 285.40454, "r": 159.41275, "b": 293.77917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23795, "t": 285.40454, "r": 185.57669, "b": 293.77917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "73", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 211.25645, "t": 285.40454, "r": 219.5952, "b": 293.77917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "78", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.27496, "t": 285.40454, "r": 253.61371, "b": 293.77917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "77", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "section_header", "id": 10, "page_no": 6, "cluster": {"id": 10, "label": "section_header", "bbox": {"l": 53.79800000000001, "t": 319.56992, "r": 131.05624, "b": 329.879, "coord_origin": "TOPLEFT"}, "confidence": 0.9555686116218567, "cells": [{"id": 71, "text": "Learning Curve", "bbox": {"l": 53.79800000000001, "t": 319.56992, "r": 131.05624, "b": 329.879, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Learning Curve"}, {"label": "text", "id": 5, "page_no": 6, "cluster": {"id": 5, "label": "text", "bbox": {"l": 52.785, "t": 334.77155, "r": 295.55835, "b": 529.44818, "coord_origin": "TOPLEFT"}, "confidence": 0.9857739210128784, "cells": [{"id": 72, "text": "One of the fundamental questions related to any dataset is if it is", "bbox": {"l": 53.79800000000001, "t": 334.77155, "r": 294.04153, "b": 343.14618, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "\u201clarge enough\u201d. To answer this question for DocLayNet, we per-", "bbox": {"l": 52.785, "t": 345.73053, "r": 295.55835, "b": 354.10516000000007, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "formed a data ablation study in which we evaluated a Mask R-CNN", "bbox": {"l": 53.79800000000001, "t": 356.6895400000001, "r": 294.04535, "b": 365.06418, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "model trained on increasing fractions of the DocLayNet dataset.", "bbox": {"l": 53.79800000000001, "t": 367.64853, "r": 295.4281, "b": 376.02316, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "As can be seen in Figure 5, the mAP score rises sharply in the be-", "bbox": {"l": 53.484001, "t": 378.60754, "r": 295.55667, "b": 386.98218, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "ginning and eventually levels out. To estimate the error-bar on the", "bbox": {"l": 53.79800000000001, "t": 389.56653, "r": 294.04865, "b": 397.94116, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "metrics, we ran the training five times on the entire data-set. This", "bbox": {"l": 53.79800000000001, "t": 400.52554000000003, "r": 294.04376, "b": 408.90018, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "resulted in a 1% error-bar, depicted by the shaded area in Figure 5.", "bbox": {"l": 53.79800000000001, "t": 411.48456, "r": 295.42459, "b": 419.85919, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "In the inset of Figure 5, we show the exact same data-points, but", "bbox": {"l": 53.79800000000001, "t": 422.44354, "r": 294.04709, "b": 430.81818, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "with a logarithmic scale on the x-axis. As is expected, the mAP", "bbox": {"l": 53.466999, "t": 433.40253000000007, "r": 294.04535, "b": 441.7771599999999, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "score increases linearly as a function of the data-size in the inset.", "bbox": {"l": 53.79800000000001, "t": 444.36053000000004, "r": 295.42902, "b": 452.73517, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "The curve ultimately flattens out between the 80% and 100% mark,", "bbox": {"l": 53.528999, "t": 455.31955, "r": 295.03122, "b": 463.69418, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "with the 80% mark falling within the error-bars of the 100% mark.", "bbox": {"l": 53.466999, "t": 466.27853, "r": 295.42154, "b": 474.65317, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "This provides a good indication that the model would not improve", "bbox": {"l": 53.528999, "t": 477.23755, "r": 294.04553, "b": 485.61218, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "significantly by yet increasing the data size. Rather, it would prob-", "bbox": {"l": 53.79800000000001, "t": 488.19653, "r": 295.55646, "b": 496.57117, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "ably benefit more from improved data consistency (as discussed", "bbox": {"l": 53.79800000000001, "t": 499.15555, "r": 294.04715, "b": 507.53018, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "in Section 3), data augmentation methods [23], or the addition of", "bbox": {"l": 53.79800000000001, "t": 510.11453, "r": 294.04245, "b": 518.4891700000001, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "more document categories and styles.", "bbox": {"l": 53.79800000000001, "t": 521.0735500000001, "r": 191.47707, "b": 529.44818, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "One of the fundamental questions related to any dataset is if it is \"large enough\". To answer this question for DocLayNet, we performed a data ablation study in which we evaluated a Mask R-CNN model trained on increasing fractions of the DocLayNet dataset. As can be seen in Figure 5, the mAP score rises sharply in the beginning and eventually levels out. To estimate the error-bar on the metrics, we ran the training five times on the entire data-set. This resulted in a 1% error-bar, depicted by the shaded area in Figure 5. In the inset of Figure 5, we show the exact same data-points, but with a logarithmic scale on the x-axis. As is expected, the mAP score increases linearly as a function of the data-size in the inset. The curve ultimately flattens out between the 80% and 100% mark, with the 80% mark falling within the error-bars of the 100% mark. This provides a good indication that the model would not improve significantly by yet increasing the data size. Rather, it would probably benefit more from improved data consistency (as discussed in Section 3), data augmentation methods [23], or the addition of more document categories and styles."}, {"label": "section_header", "id": 8, "page_no": 6, "cluster": {"id": 8, "label": "section_header", "bbox": {"l": 53.79800000000001, "t": 542.50992, "r": 164.32898, "b": 552.81902, "coord_origin": "TOPLEFT"}, "confidence": 0.9572026133537292, "cells": [{"id": 90, "text": "Impact of Class Labels", "bbox": {"l": 53.79800000000001, "t": 542.50992, "r": 164.32898, "b": 552.81902, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Impact of Class Labels"}, {"label": "text", "id": 1, "page_no": 6, "cluster": {"id": 1, "label": "text", "bbox": {"l": 53.466999, "t": 557.71155, "r": 295.55679, "b": 708.55217, "coord_origin": "TOPLEFT"}, "confidence": 0.9876301884651184, "cells": [{"id": 91, "text": "The choice and number of labels can have a significant effect on", "bbox": {"l": 53.528999, "t": 557.71155, "r": 294.04333, "b": 566.08617, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "the overall model performance. Since PubLayNet, DocBank and", "bbox": {"l": 53.79800000000001, "t": 568.6705499999999, "r": 294.04712, "b": 577.04517, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "DocLayNet all have different label sets, it is of particular interest to", "bbox": {"l": 53.79800000000001, "t": 579.62955, "r": 294.04538, "b": 588.0041699999999, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "understand and quantify this influence of the label set on the model", "bbox": {"l": 53.79800000000001, "t": 590.5885499999999, "r": 294.04535, "b": 598.96317, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "performance. We investigate this by either down-mapping labels", "bbox": {"l": 53.79800000000001, "t": 601.54755, "r": 294.04266, "b": 609.92216, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "into more common ones (e.g.", "bbox": {"l": 53.79800000000001, "t": 612.50656, "r": 163.59247, "b": 620.88118, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "Caption", "bbox": {"l": 166.26401, "t": 612.55139, "r": 194.97244, "b": 620.89015, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "\u2192", "bbox": {"l": 194.994, "t": 612.45276, "r": 204.1756, "b": 620.15491, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "Text", "bbox": {"l": 204.17599, "t": 612.55139, "r": 219.33961000000002, "b": 620.89015, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": ") or excluding them", "bbox": {"l": 219.849, "t": 612.50656, "r": 294.04828, "b": 620.88118, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "from the annotations entirely. Furthermore, it must be stressed", "bbox": {"l": 53.79800000000001, "t": 623.46556, "r": 294.04709, "b": 631.84018, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "that all mappings and exclusions were performed on the data be-", "bbox": {"l": 53.79800000000001, "t": 634.42355, "r": 295.55679, "b": 642.79817, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "fore model training. In Table 3, we present the mAP scores for a", "bbox": {"l": 53.79800000000001, "t": 645.38255, "r": 294.04715, "b": 653.75717, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "Mask R-CNN R50 network on different label sets. Where a label", "bbox": {"l": 53.79800000000001, "t": 656.34155, "r": 294.04715, "b": 664.71617, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "is down-mapped, we show its corresponding label, otherwise it", "bbox": {"l": 53.79800000000001, "t": 667.30055, "r": 294.04712, "b": 675.67517, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "was excluded. We present three different label sets, with 6, 5 and 4", "bbox": {"l": 53.466999, "t": 678.25955, "r": 294.25174, "b": 686.63417, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "different labels respectively. The set of 5 labels contains the same", "bbox": {"l": 53.79800000000001, "t": 689.21855, "r": 294.04639, "b": 697.59317, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "labels as PubLayNet. However, due to the different definition of", "bbox": {"l": 53.79800000000001, "t": 700.177551, "r": 294.04712, "b": 708.55217, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The choice and number of labels can have a significant effect on the overall model performance. Since PubLayNet, DocBank and DocLayNet all have different label sets, it is of particular interest to understand and quantify this influence of the label set on the model performance. We investigate this by either down-mapping labels into more common ones (e.g. Caption \u2192 Text ) or excluding them from the annotations entirely. Furthermore, it must be stressed that all mappings and exclusions were performed on the data before model training. In Table 3, we present the mAP scores for a Mask R-CNN R50 network on different label sets. Where a label is down-mapped, we show its corresponding label, otherwise it was excluded. We present three different label sets, with 6, 5 and 4 different labels respectively. The set of 5 labels contains the same labels as PubLayNet. However, due to the different definition of"}, {"label": "text", "id": 13, "page_no": 6, "cluster": {"id": 13, "label": "text", "bbox": {"l": 317.659, "t": 86.87298999999996, "r": 559.80682, "b": 128.22321, "coord_origin": "TOPLEFT"}, "confidence": 0.8736215829849243, "cells": [{"id": 109, "text": "Table 4: Performance of a Mask R-CNN R50 network with", "bbox": {"l": 317.659, "t": 86.87298999999996, "r": 558.20068, "b": 95.34625000000017, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "document-wise and page-wise split for different label sets.", "bbox": {"l": 317.95499, "t": 97.83196999999996, "r": 559.73401, "b": 106.30524000000003, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "Naive page-wise split will result in", "bbox": {"l": 317.95499, "t": 108.79094999999995, "r": 467.72089, "b": 117.26422000000014, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "GLYPH<tildelow>", "bbox": {"l": 471.90900000000005, "t": 107.12798999999995, "r": 477.53900000000004, "b": 115.19768999999997, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "10% point improve-", "bbox": {"l": 477.54001000000005, "t": 108.79094999999995, "r": 559.80682, "b": 117.26422000000014, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "ment.", "bbox": {"l": 317.95502, "t": 119.74993999999992, "r": 341.37524, "b": 128.22321, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 4: Performance of a Mask R-CNN R50 network with document-wise and page-wise split for different label sets. Naive page-wise split will result in GLYPH<tildelow> 10% point improvement."}, {"label": "table", "id": 0, "page_no": 6, "cluster": {"id": 0, "label": "table", "bbox": {"l": 352.97747802734375, "t": 150.791259765625, "r": 522.9158935546875, "b": 306.2658386230469, "coord_origin": "TOPLEFT"}, "confidence": 0.9879696369171143, "cells": [{"id": 115, "text": "Class-count", "bbox": {"l": 358.63901, "t": 153.10051999999996, "r": 401.73154, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "11", "bbox": {"l": 440.22501, "t": 153.10051999999996, "r": 448.56375, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "5", "bbox": {"l": 494.38, "t": 153.10051999999996, "r": 498.54938, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "Split", "bbox": {"l": 358.63901, "t": 164.05951000000005, "r": 375.27167, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "Doc", "bbox": {"l": 423.341, "t": 164.05951000000005, "r": 438.0459, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "Page", "bbox": {"l": 448.00757, "t": 164.05951000000005, "r": 465.4472, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "Doc", "bbox": {"l": 475.41101, "t": 164.05951000000005, "r": 490.11591, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Page", "bbox": {"l": 500.07757999999995, "t": 164.05951000000005, "r": 517.51721, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "Caption", "bbox": {"l": 358.63901, "t": 175.41656, "r": 387.82465, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "68", "bbox": {"l": 426.52399, "t": 175.41656, "r": 434.86273, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "83", "bbox": {"l": 452.56240999999994, "t": 175.41656, "r": 460.90115000000003, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "Footnote", "bbox": {"l": 358.63901, "t": 186.37554999999998, "r": 391.14221, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "71", "bbox": {"l": 426.52399, "t": 186.37554999999998, "r": 434.86273, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "84", "bbox": {"l": 452.56240999999994, "t": 186.37554999999998, "r": 460.90115000000003, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "Formula", "bbox": {"l": 358.63901, "t": 197.33452999999997, "r": 389.15167, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "60", "bbox": {"l": 426.52399, "t": 197.33452999999997, "r": 434.86273, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "66", "bbox": {"l": 452.56240999999994, "t": 197.33452999999997, "r": 460.90115000000003, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "List-item", "bbox": {"l": 358.63901, "t": 208.29351999999994, "r": 391.5188, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "81", "bbox": {"l": 426.52399, "t": 208.29351999999994, "r": 434.86273, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "88", "bbox": {"l": 452.56240999999994, "t": 208.29351999999994, "r": 460.90115000000003, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "82", "bbox": {"l": 478.59399, "t": 208.29351999999994, "r": 486.93274, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "88", "bbox": {"l": 504.6324200000001, "t": 208.29351999999994, "r": 512.97119, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "Page-footer", "bbox": {"l": 358.63901, "t": 219.25256000000002, "r": 401.16666, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "62", "bbox": {"l": 426.52399, "t": 219.25256000000002, "r": 434.86273, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "89", "bbox": {"l": 452.56240999999994, "t": 219.25256000000002, "r": 460.90115000000003, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "Page-header", "bbox": {"l": 358.63901, "t": 230.21155, "r": 403.91931, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "72", "bbox": {"l": 426.52399, "t": 230.21155, "r": 434.86273, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "90", "bbox": {"l": 452.56240999999994, "t": 230.21155, "r": 460.90115000000003, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "Picture", "bbox": {"l": 358.63901, "t": 241.16956000000005, "r": 384.62366, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "72", "bbox": {"l": 426.52399, "t": 241.16956000000005, "r": 434.86273, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "82", "bbox": {"l": 452.56240999999994, "t": 241.16956000000005, "r": 460.90115000000003, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "72", "bbox": {"l": 478.59399, "t": 241.16956000000005, "r": 486.93274, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "82", "bbox": {"l": 504.6324200000001, "t": 241.16956000000005, "r": 512.97119, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "Section-header", "bbox": {"l": 358.63901, "t": 252.12854000000004, "r": 413.37891, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "68", "bbox": {"l": 426.52399, "t": 252.12854000000004, "r": 434.86273, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "83", "bbox": {"l": 452.56240999999994, "t": 252.12854000000004, "r": 460.90115000000003, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "69", "bbox": {"l": 478.59399, "t": 252.12854000000004, "r": 486.93274, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "83", "bbox": {"l": 504.6324200000001, "t": 252.12854000000004, "r": 512.97119, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "Table", "bbox": {"l": 358.63901, "t": 263.08752000000004, "r": 378.44577, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "82", "bbox": {"l": 426.52399, "t": 263.08752000000004, "r": 434.86273, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "89", "bbox": {"l": 452.56240999999994, "t": 263.08752000000004, "r": 460.90115000000003, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "82", "bbox": {"l": 478.59399, "t": 263.08752000000004, "r": 486.93274, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "90", "bbox": {"l": 504.6324200000001, "t": 263.08752000000004, "r": 512.97119, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "Text", "bbox": {"l": 358.63901, "t": 274.04657, "r": 374.59921, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "85", "bbox": {"l": 426.52399, "t": 274.04657, "r": 434.86273, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "91", "bbox": {"l": 452.56240999999994, "t": 274.04657, "r": 460.90115000000003, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "84", "bbox": {"l": 478.59399, "t": 274.04657, "r": 486.93274, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "90", "bbox": {"l": 504.6324200000001, "t": 274.04657, "r": 512.97119, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "Title", "bbox": {"l": 358.63901, "t": 285.00552, "r": 375.63034, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "77", "bbox": {"l": 426.52399, "t": 285.00552, "r": 434.86273, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "81", "bbox": {"l": 452.56240999999994, "t": 285.00552, "r": 460.90115000000003, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "All", "bbox": {"l": 358.63901, "t": 296.36255, "r": 369.60492, "b": 304.73718, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "72", "bbox": {"l": 426.52399, "t": 296.36255, "r": 434.86273, "b": 304.73718, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "84", "bbox": {"l": 452.56240999999994, "t": 296.36255, "r": 460.90115000000003, "b": 304.73718, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "78", "bbox": {"l": 478.59399, "t": 296.36255, "r": 486.93274, "b": 304.73718, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "87", "bbox": {"l": 504.6324200000001, "t": 296.36255, "r": 512.97119, "b": 304.73718, "coord_origin": "TOPLEFT"}}], "children": [{"id": 80, "label": "text", "bbox": {"l": 358.63901, "t": 153.10051999999996, "r": 401.73154, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 115, "text": "Class-count", "bbox": {"l": 358.63901, "t": 153.10051999999996, "r": 401.73154, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 440.22501, "t": 153.10051999999996, "r": 448.56375, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 116, "text": "11", "bbox": {"l": 440.22501, "t": 153.10051999999996, "r": 448.56375, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 494.38, "t": 153.10051999999996, "r": 498.54938, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 117, "text": "5", "bbox": {"l": 494.38, "t": 153.10051999999996, "r": 498.54938, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 358.63901, "t": 164.05951000000005, "r": 375.27167, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 118, "text": "Split", "bbox": {"l": 358.63901, "t": 164.05951000000005, "r": 375.27167, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 423.341, "t": 164.05951000000005, "r": 438.0459, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 119, "text": "Doc", "bbox": {"l": 423.341, "t": 164.05951000000005, "r": 438.0459, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 448.00757, "t": 164.05951000000005, "r": 465.4472, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 120, "text": "Page", "bbox": {"l": 448.00757, "t": 164.05951000000005, "r": 465.4472, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 475.41101, "t": 164.05951000000005, "r": 490.11591, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 121, "text": "Doc", "bbox": {"l": 475.41101, "t": 164.05951000000005, "r": 490.11591, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 500.07757999999995, "t": 164.05951000000005, "r": 517.51721, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 122, "text": "Page", "bbox": {"l": 500.07757999999995, "t": 164.05951000000005, "r": 517.51721, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 358.63901, "t": 175.41656, "r": 387.82465, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 123, "text": "Caption", "bbox": {"l": 358.63901, "t": 175.41656, "r": 387.82465, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 426.52399, "t": 175.41656, "r": 434.86273, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 124, "text": "68", "bbox": {"l": 426.52399, "t": 175.41656, "r": 434.86273, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 452.56240999999994, "t": 175.41656, "r": 460.90115000000003, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 125, "text": "83", "bbox": {"l": 452.56240999999994, "t": 175.41656, "r": 460.90115000000003, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 358.63901, "t": 186.37554999999998, "r": 391.14221, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 126, "text": "Footnote", "bbox": {"l": 358.63901, "t": 186.37554999999998, "r": 391.14221, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 426.52399, "t": 186.37554999999998, "r": 434.86273, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 127, "text": "71", "bbox": {"l": 426.52399, "t": 186.37554999999998, "r": 434.86273, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 452.56240999999994, "t": 186.37554999999998, "r": 460.90115000000003, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 128, "text": "84", "bbox": {"l": 452.56240999999994, "t": 186.37554999999998, "r": 460.90115000000003, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 358.63901, "t": 197.33452999999997, "r": 389.15167, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 129, "text": "Formula", "bbox": {"l": 358.63901, "t": 197.33452999999997, "r": 389.15167, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 426.52399, "t": 197.33452999999997, "r": 434.86273, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 130, "text": "60", "bbox": {"l": 426.52399, "t": 197.33452999999997, "r": 434.86273, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 452.56240999999994, "t": 197.33452999999997, "r": 460.90115000000003, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 131, "text": "66", "bbox": {"l": 452.56240999999994, "t": 197.33452999999997, "r": 460.90115000000003, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 358.63901, "t": 208.29351999999994, "r": 391.5188, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 132, "text": "List-item", "bbox": {"l": 358.63901, "t": 208.29351999999994, "r": 391.5188, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 426.52399, "t": 208.29351999999994, "r": 434.86273, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 133, "text": "81", "bbox": {"l": 426.52399, "t": 208.29351999999994, "r": 434.86273, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 452.56240999999994, "t": 208.29351999999994, "r": 460.90115000000003, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 134, "text": "88", "bbox": {"l": 452.56240999999994, "t": 208.29351999999994, "r": 460.90115000000003, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 478.59399, "t": 208.29351999999994, "r": 486.93274, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 135, "text": "82", "bbox": {"l": 478.59399, "t": 208.29351999999994, "r": 486.93274, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 504.6324200000001, "t": 208.29351999999994, "r": 512.97119, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 136, "text": "88", "bbox": {"l": 504.6324200000001, "t": 208.29351999999994, "r": 512.97119, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 358.63901, "t": 219.25256000000002, "r": 401.16666, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 137, "text": "Page-footer", "bbox": {"l": 358.63901, "t": 219.25256000000002, "r": 401.16666, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 426.52399, "t": 219.25256000000002, "r": 434.86273, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 138, "text": "62", "bbox": {"l": 426.52399, "t": 219.25256000000002, "r": 434.86273, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 452.56240999999994, "t": 219.25256000000002, "r": 460.90115000000003, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 139, "text": "89", "bbox": {"l": 452.56240999999994, "t": 219.25256000000002, "r": 460.90115000000003, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 358.63901, "t": 230.21155, "r": 403.91931, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 140, "text": "Page-header", "bbox": {"l": 358.63901, "t": 230.21155, "r": 403.91931, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 426.52399, "t": 230.21155, "r": 434.86273, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 141, "text": "72", "bbox": {"l": 426.52399, "t": 230.21155, "r": 434.86273, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 452.56240999999994, "t": 230.21155, "r": 460.90115000000003, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 142, "text": "90", "bbox": {"l": 452.56240999999994, "t": 230.21155, "r": 460.90115000000003, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 358.63901, "t": 241.16956000000005, "r": 384.62366, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 143, "text": "Picture", "bbox": {"l": 358.63901, "t": 241.16956000000005, "r": 384.62366, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 426.52399, "t": 241.16956000000005, "r": 434.86273, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 144, "text": "72", "bbox": {"l": 426.52399, "t": 241.16956000000005, "r": 434.86273, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 452.56240999999994, "t": 241.16956000000005, "r": 460.90115000000003, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 145, "text": "82", "bbox": {"l": 452.56240999999994, "t": 241.16956000000005, "r": 460.90115000000003, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 478.59399, "t": 241.16956000000005, "r": 486.93274, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 146, "text": "72", "bbox": {"l": 478.59399, "t": 241.16956000000005, "r": 486.93274, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 504.6324200000001, "t": 241.16956000000005, "r": 512.97119, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 147, "text": "82", "bbox": {"l": 504.6324200000001, "t": 241.16956000000005, "r": 512.97119, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 358.63901, "t": 252.12854000000004, "r": 413.37891, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 148, "text": "Section-header", "bbox": {"l": 358.63901, "t": 252.12854000000004, "r": 413.37891, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 114, "label": "text", "bbox": {"l": 426.52399, "t": 252.12854000000004, "r": 434.86273, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 149, "text": "68", "bbox": {"l": 426.52399, "t": 252.12854000000004, "r": 434.86273, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 115, "label": "text", "bbox": {"l": 452.56240999999994, "t": 252.12854000000004, "r": 460.90115000000003, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 150, "text": "83", "bbox": {"l": 452.56240999999994, "t": 252.12854000000004, "r": 460.90115000000003, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 116, "label": "text", "bbox": {"l": 478.59399, "t": 252.12854000000004, "r": 486.93274, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 151, "text": "69", "bbox": {"l": 478.59399, "t": 252.12854000000004, "r": 486.93274, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 117, "label": "text", "bbox": {"l": 504.6324200000001, "t": 252.12854000000004, "r": 512.97119, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 152, "text": "83", "bbox": {"l": 504.6324200000001, "t": 252.12854000000004, "r": 512.97119, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 118, "label": "text", "bbox": {"l": 358.63901, "t": 263.08752000000004, "r": 378.44577, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 153, "text": "Table", "bbox": {"l": 358.63901, "t": 263.08752000000004, "r": 378.44577, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 119, "label": "text", "bbox": {"l": 426.52399, "t": 263.08752000000004, "r": 434.86273, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 154, "text": "82", "bbox": {"l": 426.52399, "t": 263.08752000000004, "r": 434.86273, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 120, "label": "text", "bbox": {"l": 452.56240999999994, "t": 263.08752000000004, "r": 460.90115000000003, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 155, "text": "89", "bbox": {"l": 452.56240999999994, "t": 263.08752000000004, "r": 460.90115000000003, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 121, "label": "text", "bbox": {"l": 478.59399, "t": 263.08752000000004, "r": 486.93274, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 156, "text": "82", "bbox": {"l": 478.59399, "t": 263.08752000000004, "r": 486.93274, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 122, "label": "text", "bbox": {"l": 504.6324200000001, "t": 263.08752000000004, "r": 512.97119, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 157, "text": "90", "bbox": {"l": 504.6324200000001, "t": 263.08752000000004, "r": 512.97119, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 123, "label": "text", "bbox": {"l": 358.63901, "t": 274.04657, "r": 374.59921, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 158, "text": "Text", "bbox": {"l": 358.63901, "t": 274.04657, "r": 374.59921, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 124, "label": "text", "bbox": {"l": 426.52399, "t": 274.04657, "r": 434.86273, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 159, "text": "85", "bbox": {"l": 426.52399, "t": 274.04657, "r": 434.86273, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 125, "label": "text", "bbox": {"l": 452.56240999999994, "t": 274.04657, "r": 460.90115000000003, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 160, "text": "91", "bbox": {"l": 452.56240999999994, "t": 274.04657, "r": 460.90115000000003, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 126, "label": "text", "bbox": {"l": 478.59399, "t": 274.04657, "r": 486.93274, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 161, "text": "84", "bbox": {"l": 478.59399, "t": 274.04657, "r": 486.93274, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 127, "label": "text", "bbox": {"l": 504.6324200000001, "t": 274.04657, "r": 512.97119, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 162, "text": "90", "bbox": {"l": 504.6324200000001, "t": 274.04657, "r": 512.97119, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 128, "label": "text", "bbox": {"l": 358.63901, "t": 285.00552, "r": 375.63034, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 163, "text": "Title", "bbox": {"l": 358.63901, "t": 285.00552, "r": 375.63034, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 129, "label": "text", "bbox": {"l": 426.52399, "t": 285.00552, "r": 434.86273, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 164, "text": "77", "bbox": {"l": 426.52399, "t": 285.00552, "r": 434.86273, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 130, "label": "text", "bbox": {"l": 452.56240999999994, "t": 285.00552, "r": 460.90115000000003, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 165, "text": "81", "bbox": {"l": 452.56240999999994, "t": 285.00552, "r": 460.90115000000003, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 131, "label": "text", "bbox": {"l": 358.63901, "t": 296.36255, "r": 369.60492, "b": 304.73718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 166, "text": "All", "bbox": {"l": 358.63901, "t": 296.36255, "r": 369.60492, "b": 304.73718, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 132, "label": "text", "bbox": {"l": 426.52399, "t": 296.36255, "r": 434.86273, "b": 304.73718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 167, "text": "72", "bbox": {"l": 426.52399, "t": 296.36255, "r": 434.86273, "b": 304.73718, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 133, "label": "text", "bbox": {"l": 452.56240999999994, "t": 296.36255, "r": 460.90115000000003, "b": 304.73718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 168, "text": "84", "bbox": {"l": 452.56240999999994, "t": 296.36255, "r": 460.90115000000003, "b": 304.73718, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 134, "label": "text", "bbox": {"l": 478.59399, "t": 296.36255, "r": 486.93274, "b": 304.73718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 169, "text": "78", "bbox": {"l": 478.59399, "t": 296.36255, "r": 486.93274, "b": 304.73718, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 135, "label": "text", "bbox": {"l": 504.6324200000001, "t": 296.36255, "r": 512.97119, "b": 304.73718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 170, "text": "87", "bbox": {"l": 504.6324200000001, "t": 296.36255, "r": 512.97119, "b": 304.73718, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["fcel", "ched", "lcel", "ched", "lcel", "nl", "fcel", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 14, "num_cols": 5, "table_cells": [{"bbox": {"l": 358.63901, "t": 153.10051999999996, "r": 401.73154, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Class-count", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.22501, "t": 153.10051999999996, "r": 448.56375, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 3, "text": "11", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 494.38, "t": 153.10051999999996, "r": 498.54938, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 5, "text": "5", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 164.05951000000005, "r": 375.27167, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Split", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 423.341, "t": 164.05951000000005, "r": 438.0459, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Doc", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 448.00757, "t": 164.05951000000005, "r": 465.4472, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Page", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 475.41101, "t": 164.05951000000005, "r": 490.11591, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Doc", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 500.07757999999995, "t": 164.05951000000005, "r": 517.51721, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Page", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 175.41656, "r": 387.82465, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Caption", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 175.41656, "r": 434.86273, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 175.41656, "r": 460.90115000000003, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 186.37554999999998, "r": 391.14221, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Footnote", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 186.37554999999998, "r": 434.86273, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "71", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 186.37554999999998, "r": 460.90115000000003, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 197.33452999999997, "r": 389.15167, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Formula", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 197.33452999999997, "r": 434.86273, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "60", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 197.33452999999997, "r": 460.90115000000003, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "66", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 208.29351999999994, "r": 391.5188, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "List-item", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 208.29351999999994, "r": 434.86273, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 208.29351999999994, "r": 460.90115000000003, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 478.59399, "t": 208.29351999999994, "r": 486.93274, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 504.6324200000001, "t": 208.29351999999994, "r": 512.97119, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 219.25256000000002, "r": 401.16666, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-footer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 219.25256000000002, "r": 434.86273, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "62", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 219.25256000000002, "r": 460.90115000000003, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "89", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 230.21155, "r": 403.91931, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 230.21155, "r": 434.86273, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 230.21155, "r": 460.90115000000003, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "90", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 241.16956000000005, "r": 384.62366, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Picture", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 241.16956000000005, "r": 434.86273, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 241.16956000000005, "r": 460.90115000000003, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 478.59399, "t": 241.16956000000005, "r": 486.93274, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 504.6324200000001, "t": 241.16956000000005, "r": 512.97119, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 252.12854000000004, "r": 413.37891, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Section-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 252.12854000000004, "r": 434.86273, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 252.12854000000004, "r": 460.90115000000003, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 478.59399, "t": 252.12854000000004, "r": 486.93274, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "69", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 504.6324200000001, "t": 252.12854000000004, "r": 512.97119, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 263.08752000000004, "r": 378.44577, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 263.08752000000004, "r": 434.86273, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 263.08752000000004, "r": 460.90115000000003, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "89", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 478.59399, "t": 263.08752000000004, "r": 486.93274, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 504.6324200000001, "t": 263.08752000000004, "r": 512.97119, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "90", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 274.04657, "r": 374.59921, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Text", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 274.04657, "r": 434.86273, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 274.04657, "r": 460.90115000000003, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "91", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 478.59399, "t": 274.04657, "r": 486.93274, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 504.6324200000001, "t": 274.04657, "r": 512.97119, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "90", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 285.00552, "r": 375.63034, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Title", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 285.00552, "r": 434.86273, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 285.00552, "r": 460.90115000000003, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 296.36255, "r": 369.60492, "b": 304.73718, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "All", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 296.36255, "r": 434.86273, "b": 304.73718, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 296.36255, "r": 460.90115000000003, "b": 304.73718, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 478.59399, "t": 296.36255, "r": 486.93274, "b": 304.73718, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "78", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 504.6324200000001, "t": 296.36255, "r": 512.97119, "b": 304.73718, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "87", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "text", "id": 6, "page_no": 6, "cluster": {"id": 6, "label": "text", "bbox": {"l": 317.686, "t": 331.40353, "r": 559.58496, "b": 416.49017, "coord_origin": "TOPLEFT"}, "confidence": 0.9740146994590759, "cells": [{"id": 171, "text": "lists in PubLayNet (grouped list-items) versus DocLayNet (separate", "bbox": {"l": 317.95499, "t": 331.40353, "r": 558.20233, "b": 339.77817, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "list-items), the label set of size 4 is the closest to PubLayNet, in the", "bbox": {"l": 317.95499, "t": 342.36255, "r": 558.2005, "b": 350.73718, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "assumption that the", "bbox": {"l": 317.95499, "t": 353.32153, "r": 393.16028, "b": 361.69617000000005, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "List", "bbox": {"l": 395.84201, "t": 353.36639, "r": 409.14905, "b": 361.70514, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "is down-mapped to", "bbox": {"l": 412.33301, "t": 353.32153, "r": 485.02324999999996, "b": 361.69617000000005, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "Text", "bbox": {"l": 487.70401, "t": 353.36639, "r": 502.86761, "b": 361.70514, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "in PubLayNet.", "bbox": {"l": 506.05499, "t": 353.32153, "r": 559.58496, "b": 361.69617000000005, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "The results in Table 3 show that the prediction accuracy on the", "bbox": {"l": 317.686, "t": 364.28054999999995, "r": 558.2002, "b": 372.65518, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "remaining class labels does not change significantly when other", "bbox": {"l": 317.95499, "t": 375.23853, "r": 558.36877, "b": 383.61316, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "classes are merged into them. The overall macro-average improves", "bbox": {"l": 317.95499, "t": 386.19754, "r": 558.19958, "b": 394.57217, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "by around 5%, in particular when", "bbox": {"l": 317.95499, "t": 397.15652, "r": 439.49454, "b": 405.53116000000006, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "Page-footer", "bbox": {"l": 441.728, "t": 397.20139, "r": 481.8616, "b": 405.54013, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "and", "bbox": {"l": 484.74298, "t": 397.15652, "r": 498.23743, "b": 405.53116000000006, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "Page-header", "bbox": {"l": 500.47299, "t": 397.20139, "r": 543.95105, "b": 405.54013, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": "are", "bbox": {"l": 546.83197, "t": 397.15652, "r": 558.20142, "b": 405.53116000000006, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "excluded.", "bbox": {"l": 317.95496, "t": 408.11553999999995, "r": 352.37698, "b": 416.49017, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "lists in PubLayNet (grouped list-items) versus DocLayNet (separate list-items), the label set of size 4 is the closest to PubLayNet, in the assumption that the List is down-mapped to Text in PubLayNet. The results in Table 3 show that the prediction accuracy on the remaining class labels does not change significantly when other classes are merged into them. The overall macro-average improves by around 5%, in particular when Page-footer and Page-header are excluded."}, {"label": "section_header", "id": 9, "page_no": 6, "cluster": {"id": 9, "label": "section_header", "bbox": {"l": 317.95496, "t": 429.3949, "r": 549.8606, "b": 439.70398, "coord_origin": "TOPLEFT"}, "confidence": 0.9562516808509827, "cells": [{"id": 187, "text": "Impact of Document Split in Train and Test Set", "bbox": {"l": 317.95496, "t": 429.3949, "r": 549.8606, "b": 439.70398, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Impact of Document Split in Train and Test Set"}, {"label": "text", "id": 3, "page_no": 6, "cluster": {"id": 3, "label": "text", "bbox": {"l": 317.62299, "t": 444.59653, "r": 559.71381, "b": 595.43718, "coord_origin": "TOPLEFT"}, "confidence": 0.9869834184646606, "cells": [{"id": 188, "text": "Many documents in DocLayNet have a unique styling. In order", "bbox": {"l": 317.95499, "t": 444.59653, "r": 558.36884, "b": 452.97116, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "to avoid overfitting on a particular style, we have split the train-,", "bbox": {"l": 317.95499, "t": 455.55554, "r": 559.19189, "b": 463.93018, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "test- and validation-sets of DocLayNet on document boundaries, i.e.", "bbox": {"l": 317.95499, "t": 466.51453, "r": 559.58185, "b": 474.88916, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "every document contributes pages to only one set. To the best of", "bbox": {"l": 317.95499, "t": 477.47354, "r": 558.20605, "b": 485.84818, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": "our knowledge, this was not considered in PubLayNet or DocBank.", "bbox": {"l": 317.95499, "t": 488.43253, "r": 559.58203, "b": 496.80716, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "To quantify how this affects model performance, we trained and", "bbox": {"l": 317.686, "t": 499.39154, "r": 558.20032, "b": 507.76617, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "evaluated a Mask R-CNN R50 model on a modified dataset version.", "bbox": {"l": 317.95499, "t": 510.35052, "r": 559.5849, "b": 518.72516, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "Here, the train-, test- and validation-sets were obtained by a ran-", "bbox": {"l": 317.95499, "t": 521.30954, "r": 559.71381, "b": 529.68417, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "domised draw over the individual pages. As can be seen in Table 4,", "bbox": {"l": 317.95499, "t": 532.26855, "r": 559.18707, "b": 540.64317, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "the difference in model performance is surprisingly large: page-", "bbox": {"l": 317.95499, "t": 543.22655, "r": 559.71313, "b": 551.60117, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "wise splitting gains", "bbox": {"l": 317.62299, "t": 554.18555, "r": 388.35168, "b": 562.56017, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "\u02dc", "bbox": {"l": 391.36499, "t": 552.50055, "r": 393.98318, "b": 560.87517, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "10% in mAP over the document-wise splitting.", "bbox": {"l": 390.59, "t": 554.18555, "r": 559.58191, "b": 562.56017, "coord_origin": "TOPLEFT"}}, {"id": 201, "text": "Thus, random page-wise splitting of DocLayNet can easily lead", "bbox": {"l": 317.686, "t": 565.14455, "r": 558.20032, "b": 573.51917, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": "to accidental overestimation of model performance and should be", "bbox": {"l": 317.95499, "t": 576.10356, "r": 558.20508, "b": 584.4781800000001, "coord_origin": "TOPLEFT"}}, {"id": 203, "text": "avoided.", "bbox": {"l": 317.95499, "t": 587.06256, "r": 348.50354, "b": 595.43718, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Many documents in DocLayNet have a unique styling. In order to avoid overfitting on a particular style, we have split the train-, test- and validation-sets of DocLayNet on document boundaries, i.e. every document contributes pages to only one set. To the best of our knowledge, this was not considered in PubLayNet or DocBank. To quantify how this affects model performance, we trained and evaluated a Mask R-CNN R50 model on a modified dataset version. Here, the train-, test- and validation-sets were obtained by a randomised draw over the individual pages. As can be seen in Table 4, the difference in model performance is surprisingly large: pagewise splitting gains \u02dc 10% in mAP over the document-wise splitting. Thus, random page-wise splitting of DocLayNet can easily lead to accidental overestimation of model performance and should be avoided."}, {"label": "section_header", "id": 7, "page_no": 6, "cluster": {"id": 7, "label": "section_header", "bbox": {"l": 317.95499, "t": 608.34192, "r": 418.54776, "b": 618.65102, "coord_origin": "TOPLEFT"}, "confidence": 0.9589217305183411, "cells": [{"id": 204, "text": "Dataset Comparison", "bbox": {"l": 317.95499, "t": 608.34192, "r": 418.54776, "b": 618.65102, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Dataset Comparison"}, {"label": "text", "id": 2, "page_no": 6, "cluster": {"id": 2, "label": "text", "bbox": {"l": 317.686, "t": 623.54355, "r": 559.18817, "b": 708.640137, "coord_origin": "TOPLEFT"}, "confidence": 0.9872549772262573, "cells": [{"id": 205, "text": "Throughout this paper, we claim that DocLayNet\u2019s wider variety of", "bbox": {"l": 317.686, "t": 623.54355, "r": 558.20575, "b": 631.91817, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": "document layouts leads to more robust layout detection models. In", "bbox": {"l": 317.95499, "t": 634.50255, "r": 558.20624, "b": 642.87717, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": "Table 5, we provide evidence for that. We trained models on each", "bbox": {"l": 317.686, "t": 645.46155, "r": 558.20319, "b": 653.83617, "coord_origin": "TOPLEFT"}}, {"id": 208, "text": "of the available datasets (PubLayNet, DocBank and DocLayNet)", "bbox": {"l": 317.95499, "t": 656.42055, "r": 558.74377, "b": 664.79517, "coord_origin": "TOPLEFT"}}, {"id": 209, "text": "and evaluated them on the test sets of the other datasets. Due to", "bbox": {"l": 317.95499, "t": 667.37955, "r": 558.20398, "b": 675.7541699999999, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": "the different label sets and annotation styles, a direct comparison", "bbox": {"l": 317.95499, "t": 678.3385499999999, "r": 558.20062, "b": 686.71317, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "is not possible. Hence, we focussed on the common labels among", "bbox": {"l": 317.95499, "t": 689.29755, "r": 558.20343, "b": 697.672173, "coord_origin": "TOPLEFT"}}, {"id": 212, "text": "the datasets. Between PubLayNet and DocLayNet, these are", "bbox": {"l": 317.95499, "t": 700.256554, "r": 531.07666, "b": 708.631172, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "Picture", "bbox": {"l": 533.16199, "t": 700.301384, "r": 557.2561, "b": 708.640137, "coord_origin": "TOPLEFT"}}, {"id": 214, "text": ",", "bbox": {"l": 557.255, "t": 700.256554, "r": 559.18817, "b": 708.631172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Throughout this paper, we claim that DocLayNet's wider variety of document layouts leads to more robust layout detection models. In Table 5, we provide evidence for that. We trained models on each of the available datasets (PubLayNet, DocBank and DocLayNet) and evaluated them on the test sets of the other datasets. Due to the different label sets and annotation styles, a direct comparison is not possible. Hence, we focussed on the common labels among the datasets. Between PubLayNet and DocLayNet, these are Picture ,"}], "body": [{"label": "text", "id": 14, "page_no": 6, "cluster": {"id": 14, "label": "text", "bbox": {"l": 53.501999, "t": 86.87292000000002, "r": 295.64865, "b": 128.22313999999994, "coord_origin": "TOPLEFT"}, "confidence": 0.8296934366226196, "cells": [{"id": 2, "text": "Table 3: Performance of a Mask R-CNN R50 network in", "bbox": {"l": 53.501999, "t": 86.87292000000002, "r": 294.0437, "b": 95.34618999999998, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "mAP@0.5-0.95 scores trained on DocLayNet with different", "bbox": {"l": 53.79800000000001, "t": 97.83191, "r": 294.04376, "b": 106.30517999999995, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "class label sets. The reduced label sets were obtained by ei-", "bbox": {"l": 53.79800000000001, "t": 108.79088999999999, "r": 295.64865, "b": 117.26415999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "ther down-mapping or dropping labels.", "bbox": {"l": 53.79800000000001, "t": 119.74987999999996, "r": 213.23856, "b": 128.22313999999994, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 3: Performance of a Mask R-CNN R50 network in mAP@0.5-0.95 scores trained on DocLayNet with different class label sets. The reduced label sets were obtained by either down-mapping or dropping labels."}, {"label": "table", "id": 4, "page_no": 6, "cluster": {"id": 4, "label": "table", "bbox": {"l": 80.35525512695312, "t": 150.93629455566406, "r": 267.0082092285156, "b": 295.4454650878906, "coord_origin": "TOPLEFT"}, "confidence": 0.9869412779808044, "cells": [{"id": 6, "text": "Class-count", "bbox": {"l": 86.372002, "t": 153.10051999999996, "r": 129.46452, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "11", "bbox": {"l": 151.07401, "t": 153.10051999999996, "r": 159.41275, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "6", "bbox": {"l": 179.31816, "t": 153.10051999999996, "r": 183.48753, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "5", "bbox": {"l": 213.33669, "t": 153.10051999999996, "r": 217.50606, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "4", "bbox": {"l": 247.35521, "t": 153.10051999999996, "r": 251.52458, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Caption", "bbox": {"l": 86.372002, "t": 164.45752000000005, "r": 115.55763, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "68", "bbox": {"l": 151.07401, "t": 164.45752000000005, "r": 159.41275, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Text", "bbox": {"l": 173.42723, "t": 164.45752000000005, "r": 189.38742, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Text", "bbox": {"l": 207.44576, "t": 164.45752000000005, "r": 223.40594000000002, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Text", "bbox": {"l": 241.46428, "t": 164.45752000000005, "r": 257.42447, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Footnote", "bbox": {"l": 86.372002, "t": 175.41656, "r": 118.8752, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "71", "bbox": {"l": 151.07401, "t": 175.41656, "r": 159.41275, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Text", "bbox": {"l": 173.42723, "t": 175.41656, "r": 189.38742, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Text", "bbox": {"l": 207.44576, "t": 175.41656, "r": 223.40594000000002, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Text", "bbox": {"l": 241.46428, "t": 175.41656, "r": 257.42447, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Formula", "bbox": {"l": 86.372002, "t": 186.37554999999998, "r": 116.88466, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "60", "bbox": {"l": 151.07401, "t": 186.37554999999998, "r": 159.41275, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Text", "bbox": {"l": 173.42723, "t": 186.37554999999998, "r": 189.38742, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "Text", "bbox": {"l": 207.44576, "t": 186.37554999999998, "r": 223.40594000000002, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "Text", "bbox": {"l": 241.46428, "t": 186.37554999999998, "r": 257.42447, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "List-item", "bbox": {"l": 86.372002, "t": 197.33452999999997, "r": 119.25179, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "81", "bbox": {"l": 151.07401, "t": 197.33452999999997, "r": 159.41275, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Text", "bbox": {"l": 173.42723, "t": 197.33452999999997, "r": 189.38742, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "82", "bbox": {"l": 211.25647, "t": 197.33452999999997, "r": 219.59521, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Text", "bbox": {"l": 241.46426, "t": 197.33452999999997, "r": 257.42447, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Page-footer", "bbox": {"l": 86.372002, "t": 208.29351999999994, "r": 128.89964, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "62", "bbox": {"l": 151.07401, "t": 208.29351999999994, "r": 159.41275, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "62", "bbox": {"l": 177.23795, "t": 208.29351999999994, "r": 185.57669, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "-", "bbox": {"l": 213.91052, "t": 208.29351999999994, "r": 216.94116, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "-", "bbox": {"l": 247.92905000000002, "t": 208.29351999999994, "r": 250.95969, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Page-header", "bbox": {"l": 86.372002, "t": 219.25256000000002, "r": 131.65231, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "72", "bbox": {"l": 151.07401, "t": 219.25256000000002, "r": 159.41275, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "68", "bbox": {"l": 177.23795, "t": 219.25256000000002, "r": 185.57669, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "-", "bbox": {"l": 213.91052, "t": 219.25256000000002, "r": 216.94116, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "-", "bbox": {"l": 247.92905000000002, "t": 219.25256000000002, "r": 250.95969, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Picture", "bbox": {"l": 86.372002, "t": 230.21155, "r": 112.35663, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "72", "bbox": {"l": 151.07401, "t": 230.21155, "r": 159.41275, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "72", "bbox": {"l": 177.23795, "t": 230.21155, "r": 185.57669, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "72", "bbox": {"l": 211.25645, "t": 230.21155, "r": 219.5952, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "72", "bbox": {"l": 245.27496, "t": 230.21155, "r": 253.61371, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "Section-header", "bbox": {"l": 86.372002, "t": 241.16956000000005, "r": 141.11188, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "68", "bbox": {"l": 151.07401, "t": 241.16956000000005, "r": 159.41275, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "67", "bbox": {"l": 177.23795, "t": 241.16956000000005, "r": 185.57669, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "69", "bbox": {"l": 211.25645, "t": 241.16956000000005, "r": 219.5952, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "68", "bbox": {"l": 245.27496, "t": 241.16956000000005, "r": 253.61371, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Table", "bbox": {"l": 86.372002, "t": 252.12854000000004, "r": 106.17878, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "82", "bbox": {"l": 151.07401, "t": 252.12854000000004, "r": 159.41275, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "83", "bbox": {"l": 177.23795, "t": 252.12854000000004, "r": 185.57669, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "82", "bbox": {"l": 211.25645, "t": 252.12854000000004, "r": 219.5952, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "82", "bbox": {"l": 245.27496, "t": 252.12854000000004, "r": 253.61371, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Text", "bbox": {"l": 86.372002, "t": 263.08752000000004, "r": 102.3322, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "85", "bbox": {"l": 151.07401, "t": 263.08752000000004, "r": 159.41275, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "84", "bbox": {"l": 177.23795, "t": 263.08752000000004, "r": 185.57669, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "84", "bbox": {"l": 211.25645, "t": 263.08752000000004, "r": 219.5952, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "84", "bbox": {"l": 245.27496, "t": 263.08752000000004, "r": 253.61371, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "Title", "bbox": {"l": 86.372002, "t": 274.04657, "r": 103.36333, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "77", "bbox": {"l": 151.07401, "t": 274.04657, "r": 159.41275, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "Sec.-h.", "bbox": {"l": 169.37442, "t": 274.04657, "r": 193.43127, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "Sec.-h.", "bbox": {"l": 203.39294, "t": 274.04657, "r": 227.4498, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "Sec.-h.", "bbox": {"l": 237.41147, "t": 274.04657, "r": 261.46832, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "Overall", "bbox": {"l": 86.372002, "t": 285.40454, "r": 113.31602000000001, "b": 293.77917, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "72", "bbox": {"l": 151.07401, "t": 285.40454, "r": 159.41275, "b": 293.77917, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "73", "bbox": {"l": 177.23795, "t": 285.40454, "r": 185.57669, "b": 293.77917, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "78", "bbox": {"l": 211.25645, "t": 285.40454, "r": 219.5952, "b": 293.77917, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "77", "bbox": {"l": 245.27496, "t": 285.40454, "r": 253.61371, "b": 293.77917, "coord_origin": "TOPLEFT"}}], "children": [{"id": 15, "label": "text", "bbox": {"l": 86.372002, "t": 153.10051999999996, "r": 129.46452, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": "Class-count", "bbox": {"l": 86.372002, "t": 153.10051999999996, "r": 129.46452, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 151.07401, "t": 153.10051999999996, "r": 159.41275, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "11", "bbox": {"l": 151.07401, "t": 153.10051999999996, "r": 159.41275, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 179.31816, "t": 153.10051999999996, "r": 183.48753, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "6", "bbox": {"l": 179.31816, "t": 153.10051999999996, "r": 183.48753, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 213.33669, "t": 153.10051999999996, "r": 217.50606, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "5", "bbox": {"l": 213.33669, "t": 153.10051999999996, "r": 217.50606, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 247.35521, "t": 153.10051999999996, "r": 251.52458, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "4", "bbox": {"l": 247.35521, "t": 153.10051999999996, "r": 251.52458, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 86.372002, "t": 164.45752000000005, "r": 115.55763, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "Caption", "bbox": {"l": 86.372002, "t": 164.45752000000005, "r": 115.55763, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 151.07401, "t": 164.45752000000005, "r": 159.41275, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "68", "bbox": {"l": 151.07401, "t": 164.45752000000005, "r": 159.41275, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 173.42723, "t": 164.45752000000005, "r": 189.38742, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "Text", "bbox": {"l": 173.42723, "t": 164.45752000000005, "r": 189.38742, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 207.44576, "t": 164.45752000000005, "r": 223.40594000000002, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "Text", "bbox": {"l": 207.44576, "t": 164.45752000000005, "r": 223.40594000000002, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 241.46428, "t": 164.45752000000005, "r": 257.42447, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "Text", "bbox": {"l": 241.46428, "t": 164.45752000000005, "r": 257.42447, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 86.372002, "t": 175.41656, "r": 118.8752, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "Footnote", "bbox": {"l": 86.372002, "t": 175.41656, "r": 118.8752, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 151.07401, "t": 175.41656, "r": 159.41275, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "71", "bbox": {"l": 151.07401, "t": 175.41656, "r": 159.41275, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 173.42723, "t": 175.41656, "r": 189.38742, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "Text", "bbox": {"l": 173.42723, "t": 175.41656, "r": 189.38742, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 207.44576, "t": 175.41656, "r": 223.40594000000002, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "Text", "bbox": {"l": 207.44576, "t": 175.41656, "r": 223.40594000000002, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 241.46428, "t": 175.41656, "r": 257.42447, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "Text", "bbox": {"l": 241.46428, "t": 175.41656, "r": 257.42447, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 86.372002, "t": 186.37554999999998, "r": 116.88466, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "Formula", "bbox": {"l": 86.372002, "t": 186.37554999999998, "r": 116.88466, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 151.07401, "t": 186.37554999999998, "r": 159.41275, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "60", "bbox": {"l": 151.07401, "t": 186.37554999999998, "r": 159.41275, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 173.42723, "t": 186.37554999999998, "r": 189.38742, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "Text", "bbox": {"l": 173.42723, "t": 186.37554999999998, "r": 189.38742, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 207.44576, "t": 186.37554999999998, "r": 223.40594000000002, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "Text", "bbox": {"l": 207.44576, "t": 186.37554999999998, "r": 223.40594000000002, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 241.46428, "t": 186.37554999999998, "r": 257.42447, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "Text", "bbox": {"l": 241.46428, "t": 186.37554999999998, "r": 257.42447, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 86.372002, "t": 197.33452999999997, "r": 119.25179, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "List-item", "bbox": {"l": 86.372002, "t": 197.33452999999997, "r": 119.25179, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 151.07401, "t": 197.33452999999997, "r": 159.41275, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "81", "bbox": {"l": 151.07401, "t": 197.33452999999997, "r": 159.41275, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 173.42723, "t": 197.33452999999997, "r": 189.38742, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "Text", "bbox": {"l": 173.42723, "t": 197.33452999999997, "r": 189.38742, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 211.25647, "t": 197.33452999999997, "r": 219.59521, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "82", "bbox": {"l": 211.25647, "t": 197.33452999999997, "r": 219.59521, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 241.46426, "t": 197.33452999999997, "r": 257.42447, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "Text", "bbox": {"l": 241.46426, "t": 197.33452999999997, "r": 257.42447, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 86.372002, "t": 208.29351999999994, "r": 128.89964, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "Page-footer", "bbox": {"l": 86.372002, "t": 208.29351999999994, "r": 128.89964, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 151.07401, "t": 208.29351999999994, "r": 159.41275, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "62", "bbox": {"l": 151.07401, "t": 208.29351999999994, "r": 159.41275, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 177.23795, "t": 208.29351999999994, "r": 185.57669, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "62", "bbox": {"l": 177.23795, "t": 208.29351999999994, "r": 185.57669, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 213.91052, "t": 208.29351999999994, "r": 216.94116, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "-", "bbox": {"l": 213.91052, "t": 208.29351999999994, "r": 216.94116, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 247.92905000000002, "t": 208.29351999999994, "r": 250.95969, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "-", "bbox": {"l": 247.92905000000002, "t": 208.29351999999994, "r": 250.95969, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 86.372002, "t": 219.25256000000002, "r": 131.65231, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "Page-header", "bbox": {"l": 86.372002, "t": 219.25256000000002, "r": 131.65231, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 151.07401, "t": 219.25256000000002, "r": 159.41275, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "72", "bbox": {"l": 151.07401, "t": 219.25256000000002, "r": 159.41275, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 177.23795, "t": 219.25256000000002, "r": 185.57669, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "68", "bbox": {"l": 177.23795, "t": 219.25256000000002, "r": 185.57669, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 213.91052, "t": 219.25256000000002, "r": 216.94116, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "-", "bbox": {"l": 213.91052, "t": 219.25256000000002, "r": 216.94116, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 247.92905000000002, "t": 219.25256000000002, "r": 250.95969, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "-", "bbox": {"l": 247.92905000000002, "t": 219.25256000000002, "r": 250.95969, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 86.372002, "t": 230.21155, "r": 112.35663, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "Picture", "bbox": {"l": 86.372002, "t": 230.21155, "r": 112.35663, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 151.07401, "t": 230.21155, "r": 159.41275, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "72", "bbox": {"l": 151.07401, "t": 230.21155, "r": 159.41275, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 177.23795, "t": 230.21155, "r": 185.57669, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "72", "bbox": {"l": 177.23795, "t": 230.21155, "r": 185.57669, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 211.25645, "t": 230.21155, "r": 219.5952, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "72", "bbox": {"l": 211.25645, "t": 230.21155, "r": 219.5952, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 245.27496, "t": 230.21155, "r": 253.61371, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "72", "bbox": {"l": 245.27496, "t": 230.21155, "r": 253.61371, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 86.372002, "t": 241.16956000000005, "r": 141.11188, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "Section-header", "bbox": {"l": 86.372002, "t": 241.16956000000005, "r": 141.11188, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 151.07401, "t": 241.16956000000005, "r": 159.41275, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "68", "bbox": {"l": 151.07401, "t": 241.16956000000005, "r": 159.41275, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 177.23795, "t": 241.16956000000005, "r": 185.57669, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "67", "bbox": {"l": 177.23795, "t": 241.16956000000005, "r": 185.57669, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 211.25645, "t": 241.16956000000005, "r": 219.5952, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "69", "bbox": {"l": 211.25645, "t": 241.16956000000005, "r": 219.5952, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 245.27496, "t": 241.16956000000005, "r": 253.61371, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "68", "bbox": {"l": 245.27496, "t": 241.16956000000005, "r": 253.61371, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 86.372002, "t": 252.12854000000004, "r": 106.17878, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "Table", "bbox": {"l": 86.372002, "t": 252.12854000000004, "r": 106.17878, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 151.07401, "t": 252.12854000000004, "r": 159.41275, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "82", "bbox": {"l": 151.07401, "t": 252.12854000000004, "r": 159.41275, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 177.23795, "t": 252.12854000000004, "r": 185.57669, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "83", "bbox": {"l": 177.23795, "t": 252.12854000000004, "r": 185.57669, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 211.25645, "t": 252.12854000000004, "r": 219.5952, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "82", "bbox": {"l": 211.25645, "t": 252.12854000000004, "r": 219.5952, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 245.27496, "t": 252.12854000000004, "r": 253.61371, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "82", "bbox": {"l": 245.27496, "t": 252.12854000000004, "r": 253.61371, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 86.372002, "t": 263.08752000000004, "r": 102.3322, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "Text", "bbox": {"l": 86.372002, "t": 263.08752000000004, "r": 102.3322, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 151.07401, "t": 263.08752000000004, "r": 159.41275, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "85", "bbox": {"l": 151.07401, "t": 263.08752000000004, "r": 159.41275, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 177.23795, "t": 263.08752000000004, "r": 185.57669, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "84", "bbox": {"l": 177.23795, "t": 263.08752000000004, "r": 185.57669, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 211.25645, "t": 263.08752000000004, "r": 219.5952, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "84", "bbox": {"l": 211.25645, "t": 263.08752000000004, "r": 219.5952, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 245.27496, "t": 263.08752000000004, "r": 253.61371, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "84", "bbox": {"l": 245.27496, "t": 263.08752000000004, "r": 253.61371, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 86.372002, "t": 274.04657, "r": 103.36333, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "Title", "bbox": {"l": 86.372002, "t": 274.04657, "r": 103.36333, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 151.07401, "t": 274.04657, "r": 159.41275, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "77", "bbox": {"l": 151.07401, "t": 274.04657, "r": 159.41275, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 169.37442, "t": 274.04657, "r": 193.43127, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "Sec.-h.", "bbox": {"l": 169.37442, "t": 274.04657, "r": 193.43127, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 203.39294, "t": 274.04657, "r": 227.4498, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "Sec.-h.", "bbox": {"l": 203.39294, "t": 274.04657, "r": 227.4498, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 237.41147, "t": 274.04657, "r": 261.46832, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "Sec.-h.", "bbox": {"l": 237.41147, "t": 274.04657, "r": 261.46832, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 86.372002, "t": 285.40454, "r": 113.31602000000001, "b": 293.77917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "Overall", "bbox": {"l": 86.372002, "t": 285.40454, "r": 113.31602000000001, "b": 293.77917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 151.07401, "t": 285.40454, "r": 159.41275, "b": 293.77917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "72", "bbox": {"l": 151.07401, "t": 285.40454, "r": 159.41275, "b": 293.77917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 177.23795, "t": 285.40454, "r": 185.57669, "b": 293.77917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "73", "bbox": {"l": 177.23795, "t": 285.40454, "r": 185.57669, "b": 293.77917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 211.25645, "t": 285.40454, "r": 219.5952, "b": 293.77917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "78", "bbox": {"l": 211.25645, "t": 285.40454, "r": 219.5952, "b": 293.77917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 245.27496, "t": 285.40454, "r": 253.61371, "b": 293.77917, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "77", "bbox": {"l": 245.27496, "t": 285.40454, "r": 253.61371, "b": 293.77917, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 13, "num_cols": 5, "table_cells": [{"bbox": {"l": 86.372002, "t": 153.10051999999996, "r": 129.46452, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Class-count", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 151.07401, "t": 153.10051999999996, "r": 159.41275, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "11", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 179.31816, "t": 153.10051999999996, "r": 183.48753, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "6", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 213.33669, "t": 153.10051999999996, "r": 217.50606, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "5", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 247.35521, "t": 153.10051999999996, "r": 251.52458, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "4", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 164.45752000000005, "r": 115.55763, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Caption", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 164.45752000000005, "r": 159.41275, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 173.42723, "t": 164.45752000000005, "r": 189.38742, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 207.44576, "t": 164.45752000000005, "r": 223.40594000000002, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 241.46428, "t": 164.45752000000005, "r": 257.42447, "b": 172.83214999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 175.41656, "r": 118.8752, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Footnote", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 175.41656, "r": 159.41275, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "71", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 173.42723, "t": 175.41656, "r": 189.38742, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 207.44576, "t": 175.41656, "r": 223.40594000000002, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 241.46428, "t": 175.41656, "r": 257.42447, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 186.37554999999998, "r": 116.88466, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Formula", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 186.37554999999998, "r": 159.41275, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "60", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 173.42723, "t": 186.37554999999998, "r": 189.38742, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 207.44576, "t": 186.37554999999998, "r": 223.40594000000002, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 241.46428, "t": 186.37554999999998, "r": 257.42447, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 197.33452999999997, "r": 119.25179, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "List-item", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 197.33452999999997, "r": 159.41275, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 173.42723, "t": 197.33452999999997, "r": 189.38742, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 211.25647, "t": 197.33452999999997, "r": 219.59521, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 241.46426, "t": 197.33452999999997, "r": 257.42447, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Text", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 208.29351999999994, "r": 128.89964, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-footer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 208.29351999999994, "r": 159.41275, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "62", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23795, "t": 208.29351999999994, "r": 185.57669, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "62", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 213.91052, "t": 208.29351999999994, "r": 216.94116, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 247.92905000000002, "t": 208.29351999999994, "r": 250.95969, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 219.25256000000002, "r": 131.65231, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 219.25256000000002, "r": 159.41275, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23795, "t": 219.25256000000002, "r": 185.57669, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 213.91052, "t": 219.25256000000002, "r": 216.94116, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 247.92905000000002, "t": 219.25256000000002, "r": 250.95969, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 230.21155, "r": 112.35663, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Picture", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 230.21155, "r": 159.41275, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23795, "t": 230.21155, "r": 185.57669, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 211.25645, "t": 230.21155, "r": 219.5952, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.27496, "t": 230.21155, "r": 253.61371, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 241.16956000000005, "r": 141.11188, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Section-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 241.16956000000005, "r": 159.41275, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23795, "t": 241.16956000000005, "r": 185.57669, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "67", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 211.25645, "t": 241.16956000000005, "r": 219.5952, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "69", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.27496, "t": 241.16956000000005, "r": 253.61371, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 252.12854000000004, "r": 106.17878, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 252.12854000000004, "r": 159.41275, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23795, "t": 252.12854000000004, "r": 185.57669, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 211.25645, "t": 252.12854000000004, "r": 219.5952, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.27496, "t": 252.12854000000004, "r": 253.61371, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 263.08752000000004, "r": 102.3322, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Text", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 263.08752000000004, "r": 159.41275, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23795, "t": 263.08752000000004, "r": 185.57669, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 211.25645, "t": 263.08752000000004, "r": 219.5952, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.27496, "t": 263.08752000000004, "r": 253.61371, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 274.04657, "r": 103.36333, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Title", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 274.04657, "r": 159.41275, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 169.37442, "t": 274.04657, "r": 193.43127, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Sec.-h.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 203.39294, "t": 274.04657, "r": 227.4498, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Sec.-h.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 237.41147, "t": 274.04657, "r": 261.46832, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Sec.-h.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 86.372002, "t": 285.40454, "r": 113.31602000000001, "b": 293.77917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Overall", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 151.07401, "t": 285.40454, "r": 159.41275, "b": 293.77917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 177.23795, "t": 285.40454, "r": 185.57669, "b": 293.77917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "73", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 211.25645, "t": 285.40454, "r": 219.5952, "b": 293.77917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "78", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.27496, "t": 285.40454, "r": 253.61371, "b": 293.77917, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "77", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "section_header", "id": 10, "page_no": 6, "cluster": {"id": 10, "label": "section_header", "bbox": {"l": 53.79800000000001, "t": 319.56992, "r": 131.05624, "b": 329.879, "coord_origin": "TOPLEFT"}, "confidence": 0.9555686116218567, "cells": [{"id": 71, "text": "Learning Curve", "bbox": {"l": 53.79800000000001, "t": 319.56992, "r": 131.05624, "b": 329.879, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Learning Curve"}, {"label": "text", "id": 5, "page_no": 6, "cluster": {"id": 5, "label": "text", "bbox": {"l": 52.785, "t": 334.77155, "r": 295.55835, "b": 529.44818, "coord_origin": "TOPLEFT"}, "confidence": 0.9857739210128784, "cells": [{"id": 72, "text": "One of the fundamental questions related to any dataset is if it is", "bbox": {"l": 53.79800000000001, "t": 334.77155, "r": 294.04153, "b": 343.14618, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "\u201clarge enough\u201d. To answer this question for DocLayNet, we per-", "bbox": {"l": 52.785, "t": 345.73053, "r": 295.55835, "b": 354.10516000000007, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "formed a data ablation study in which we evaluated a Mask R-CNN", "bbox": {"l": 53.79800000000001, "t": 356.6895400000001, "r": 294.04535, "b": 365.06418, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "model trained on increasing fractions of the DocLayNet dataset.", "bbox": {"l": 53.79800000000001, "t": 367.64853, "r": 295.4281, "b": 376.02316, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "As can be seen in Figure 5, the mAP score rises sharply in the be-", "bbox": {"l": 53.484001, "t": 378.60754, "r": 295.55667, "b": 386.98218, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "ginning and eventually levels out. To estimate the error-bar on the", "bbox": {"l": 53.79800000000001, "t": 389.56653, "r": 294.04865, "b": 397.94116, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "metrics, we ran the training five times on the entire data-set. This", "bbox": {"l": 53.79800000000001, "t": 400.52554000000003, "r": 294.04376, "b": 408.90018, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "resulted in a 1% error-bar, depicted by the shaded area in Figure 5.", "bbox": {"l": 53.79800000000001, "t": 411.48456, "r": 295.42459, "b": 419.85919, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "In the inset of Figure 5, we show the exact same data-points, but", "bbox": {"l": 53.79800000000001, "t": 422.44354, "r": 294.04709, "b": 430.81818, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "with a logarithmic scale on the x-axis. As is expected, the mAP", "bbox": {"l": 53.466999, "t": 433.40253000000007, "r": 294.04535, "b": 441.7771599999999, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "score increases linearly as a function of the data-size in the inset.", "bbox": {"l": 53.79800000000001, "t": 444.36053000000004, "r": 295.42902, "b": 452.73517, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "The curve ultimately flattens out between the 80% and 100% mark,", "bbox": {"l": 53.528999, "t": 455.31955, "r": 295.03122, "b": 463.69418, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "with the 80% mark falling within the error-bars of the 100% mark.", "bbox": {"l": 53.466999, "t": 466.27853, "r": 295.42154, "b": 474.65317, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "This provides a good indication that the model would not improve", "bbox": {"l": 53.528999, "t": 477.23755, "r": 294.04553, "b": 485.61218, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "significantly by yet increasing the data size. Rather, it would prob-", "bbox": {"l": 53.79800000000001, "t": 488.19653, "r": 295.55646, "b": 496.57117, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "ably benefit more from improved data consistency (as discussed", "bbox": {"l": 53.79800000000001, "t": 499.15555, "r": 294.04715, "b": 507.53018, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "in Section 3), data augmentation methods [23], or the addition of", "bbox": {"l": 53.79800000000001, "t": 510.11453, "r": 294.04245, "b": 518.4891700000001, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "more document categories and styles.", "bbox": {"l": 53.79800000000001, "t": 521.0735500000001, "r": 191.47707, "b": 529.44818, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "One of the fundamental questions related to any dataset is if it is \"large enough\". To answer this question for DocLayNet, we performed a data ablation study in which we evaluated a Mask R-CNN model trained on increasing fractions of the DocLayNet dataset. As can be seen in Figure 5, the mAP score rises sharply in the beginning and eventually levels out. To estimate the error-bar on the metrics, we ran the training five times on the entire data-set. This resulted in a 1% error-bar, depicted by the shaded area in Figure 5. In the inset of Figure 5, we show the exact same data-points, but with a logarithmic scale on the x-axis. As is expected, the mAP score increases linearly as a function of the data-size in the inset. The curve ultimately flattens out between the 80% and 100% mark, with the 80% mark falling within the error-bars of the 100% mark. This provides a good indication that the model would not improve significantly by yet increasing the data size. Rather, it would probably benefit more from improved data consistency (as discussed in Section 3), data augmentation methods [23], or the addition of more document categories and styles."}, {"label": "section_header", "id": 8, "page_no": 6, "cluster": {"id": 8, "label": "section_header", "bbox": {"l": 53.79800000000001, "t": 542.50992, "r": 164.32898, "b": 552.81902, "coord_origin": "TOPLEFT"}, "confidence": 0.9572026133537292, "cells": [{"id": 90, "text": "Impact of Class Labels", "bbox": {"l": 53.79800000000001, "t": 542.50992, "r": 164.32898, "b": 552.81902, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Impact of Class Labels"}, {"label": "text", "id": 1, "page_no": 6, "cluster": {"id": 1, "label": "text", "bbox": {"l": 53.466999, "t": 557.71155, "r": 295.55679, "b": 708.55217, "coord_origin": "TOPLEFT"}, "confidence": 0.9876301884651184, "cells": [{"id": 91, "text": "The choice and number of labels can have a significant effect on", "bbox": {"l": 53.528999, "t": 557.71155, "r": 294.04333, "b": 566.08617, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "the overall model performance. Since PubLayNet, DocBank and", "bbox": {"l": 53.79800000000001, "t": 568.6705499999999, "r": 294.04712, "b": 577.04517, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "DocLayNet all have different label sets, it is of particular interest to", "bbox": {"l": 53.79800000000001, "t": 579.62955, "r": 294.04538, "b": 588.0041699999999, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "understand and quantify this influence of the label set on the model", "bbox": {"l": 53.79800000000001, "t": 590.5885499999999, "r": 294.04535, "b": 598.96317, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "performance. We investigate this by either down-mapping labels", "bbox": {"l": 53.79800000000001, "t": 601.54755, "r": 294.04266, "b": 609.92216, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "into more common ones (e.g.", "bbox": {"l": 53.79800000000001, "t": 612.50656, "r": 163.59247, "b": 620.88118, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "Caption", "bbox": {"l": 166.26401, "t": 612.55139, "r": 194.97244, "b": 620.89015, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "\u2192", "bbox": {"l": 194.994, "t": 612.45276, "r": 204.1756, "b": 620.15491, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "Text", "bbox": {"l": 204.17599, "t": 612.55139, "r": 219.33961000000002, "b": 620.89015, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": ") or excluding them", "bbox": {"l": 219.849, "t": 612.50656, "r": 294.04828, "b": 620.88118, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "from the annotations entirely. Furthermore, it must be stressed", "bbox": {"l": 53.79800000000001, "t": 623.46556, "r": 294.04709, "b": 631.84018, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "that all mappings and exclusions were performed on the data be-", "bbox": {"l": 53.79800000000001, "t": 634.42355, "r": 295.55679, "b": 642.79817, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "fore model training. In Table 3, we present the mAP scores for a", "bbox": {"l": 53.79800000000001, "t": 645.38255, "r": 294.04715, "b": 653.75717, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "Mask R-CNN R50 network on different label sets. Where a label", "bbox": {"l": 53.79800000000001, "t": 656.34155, "r": 294.04715, "b": 664.71617, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "is down-mapped, we show its corresponding label, otherwise it", "bbox": {"l": 53.79800000000001, "t": 667.30055, "r": 294.04712, "b": 675.67517, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "was excluded. We present three different label sets, with 6, 5 and 4", "bbox": {"l": 53.466999, "t": 678.25955, "r": 294.25174, "b": 686.63417, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "different labels respectively. The set of 5 labels contains the same", "bbox": {"l": 53.79800000000001, "t": 689.21855, "r": 294.04639, "b": 697.59317, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "labels as PubLayNet. However, due to the different definition of", "bbox": {"l": 53.79800000000001, "t": 700.177551, "r": 294.04712, "b": 708.55217, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The choice and number of labels can have a significant effect on the overall model performance. Since PubLayNet, DocBank and DocLayNet all have different label sets, it is of particular interest to understand and quantify this influence of the label set on the model performance. We investigate this by either down-mapping labels into more common ones (e.g. Caption \u2192 Text ) or excluding them from the annotations entirely. Furthermore, it must be stressed that all mappings and exclusions were performed on the data before model training. In Table 3, we present the mAP scores for a Mask R-CNN R50 network on different label sets. Where a label is down-mapped, we show its corresponding label, otherwise it was excluded. We present three different label sets, with 6, 5 and 4 different labels respectively. The set of 5 labels contains the same labels as PubLayNet. However, due to the different definition of"}, {"label": "text", "id": 13, "page_no": 6, "cluster": {"id": 13, "label": "text", "bbox": {"l": 317.659, "t": 86.87298999999996, "r": 559.80682, "b": 128.22321, "coord_origin": "TOPLEFT"}, "confidence": 0.8736215829849243, "cells": [{"id": 109, "text": "Table 4: Performance of a Mask R-CNN R50 network with", "bbox": {"l": 317.659, "t": 86.87298999999996, "r": 558.20068, "b": 95.34625000000017, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "document-wise and page-wise split for different label sets.", "bbox": {"l": 317.95499, "t": 97.83196999999996, "r": 559.73401, "b": 106.30524000000003, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "Naive page-wise split will result in", "bbox": {"l": 317.95499, "t": 108.79094999999995, "r": 467.72089, "b": 117.26422000000014, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "GLYPH<tildelow>", "bbox": {"l": 471.90900000000005, "t": 107.12798999999995, "r": 477.53900000000004, "b": 115.19768999999997, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "10% point improve-", "bbox": {"l": 477.54001000000005, "t": 108.79094999999995, "r": 559.80682, "b": 117.26422000000014, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "ment.", "bbox": {"l": 317.95502, "t": 119.74993999999992, "r": 341.37524, "b": 128.22321, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 4: Performance of a Mask R-CNN R50 network with document-wise and page-wise split for different label sets. Naive page-wise split will result in GLYPH<tildelow> 10% point improvement."}, {"label": "table", "id": 0, "page_no": 6, "cluster": {"id": 0, "label": "table", "bbox": {"l": 352.97747802734375, "t": 150.791259765625, "r": 522.9158935546875, "b": 306.2658386230469, "coord_origin": "TOPLEFT"}, "confidence": 0.9879696369171143, "cells": [{"id": 115, "text": "Class-count", "bbox": {"l": 358.63901, "t": 153.10051999999996, "r": 401.73154, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "11", "bbox": {"l": 440.22501, "t": 153.10051999999996, "r": 448.56375, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "5", "bbox": {"l": 494.38, "t": 153.10051999999996, "r": 498.54938, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "Split", "bbox": {"l": 358.63901, "t": 164.05951000000005, "r": 375.27167, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "Doc", "bbox": {"l": 423.341, "t": 164.05951000000005, "r": 438.0459, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "Page", "bbox": {"l": 448.00757, "t": 164.05951000000005, "r": 465.4472, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "Doc", "bbox": {"l": 475.41101, "t": 164.05951000000005, "r": 490.11591, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Page", "bbox": {"l": 500.07757999999995, "t": 164.05951000000005, "r": 517.51721, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "Caption", "bbox": {"l": 358.63901, "t": 175.41656, "r": 387.82465, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "68", "bbox": {"l": 426.52399, "t": 175.41656, "r": 434.86273, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "83", "bbox": {"l": 452.56240999999994, "t": 175.41656, "r": 460.90115000000003, "b": 183.7912, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "Footnote", "bbox": {"l": 358.63901, "t": 186.37554999999998, "r": 391.14221, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "71", "bbox": {"l": 426.52399, "t": 186.37554999999998, "r": 434.86273, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "84", "bbox": {"l": 452.56240999999994, "t": 186.37554999999998, "r": 460.90115000000003, "b": 194.75018, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "Formula", "bbox": {"l": 358.63901, "t": 197.33452999999997, "r": 389.15167, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "60", "bbox": {"l": 426.52399, "t": 197.33452999999997, "r": 434.86273, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "66", "bbox": {"l": 452.56240999999994, "t": 197.33452999999997, "r": 460.90115000000003, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "List-item", "bbox": {"l": 358.63901, "t": 208.29351999999994, "r": 391.5188, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "81", "bbox": {"l": 426.52399, "t": 208.29351999999994, "r": 434.86273, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "88", "bbox": {"l": 452.56240999999994, "t": 208.29351999999994, "r": 460.90115000000003, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "82", "bbox": {"l": 478.59399, "t": 208.29351999999994, "r": 486.93274, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "88", "bbox": {"l": 504.6324200000001, "t": 208.29351999999994, "r": 512.97119, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "Page-footer", "bbox": {"l": 358.63901, "t": 219.25256000000002, "r": 401.16666, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "62", "bbox": {"l": 426.52399, "t": 219.25256000000002, "r": 434.86273, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "89", "bbox": {"l": 452.56240999999994, "t": 219.25256000000002, "r": 460.90115000000003, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "Page-header", "bbox": {"l": 358.63901, "t": 230.21155, "r": 403.91931, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "72", "bbox": {"l": 426.52399, "t": 230.21155, "r": 434.86273, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "90", "bbox": {"l": 452.56240999999994, "t": 230.21155, "r": 460.90115000000003, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "Picture", "bbox": {"l": 358.63901, "t": 241.16956000000005, "r": 384.62366, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "72", "bbox": {"l": 426.52399, "t": 241.16956000000005, "r": 434.86273, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "82", "bbox": {"l": 452.56240999999994, "t": 241.16956000000005, "r": 460.90115000000003, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "72", "bbox": {"l": 478.59399, "t": 241.16956000000005, "r": 486.93274, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "82", "bbox": {"l": 504.6324200000001, "t": 241.16956000000005, "r": 512.97119, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "Section-header", "bbox": {"l": 358.63901, "t": 252.12854000000004, "r": 413.37891, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "68", "bbox": {"l": 426.52399, "t": 252.12854000000004, "r": 434.86273, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "83", "bbox": {"l": 452.56240999999994, "t": 252.12854000000004, "r": 460.90115000000003, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "69", "bbox": {"l": 478.59399, "t": 252.12854000000004, "r": 486.93274, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "83", "bbox": {"l": 504.6324200000001, "t": 252.12854000000004, "r": 512.97119, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "Table", "bbox": {"l": 358.63901, "t": 263.08752000000004, "r": 378.44577, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "82", "bbox": {"l": 426.52399, "t": 263.08752000000004, "r": 434.86273, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "89", "bbox": {"l": 452.56240999999994, "t": 263.08752000000004, "r": 460.90115000000003, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "82", "bbox": {"l": 478.59399, "t": 263.08752000000004, "r": 486.93274, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "90", "bbox": {"l": 504.6324200000001, "t": 263.08752000000004, "r": 512.97119, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "Text", "bbox": {"l": 358.63901, "t": 274.04657, "r": 374.59921, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "85", "bbox": {"l": 426.52399, "t": 274.04657, "r": 434.86273, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "91", "bbox": {"l": 452.56240999999994, "t": 274.04657, "r": 460.90115000000003, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "84", "bbox": {"l": 478.59399, "t": 274.04657, "r": 486.93274, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "90", "bbox": {"l": 504.6324200000001, "t": 274.04657, "r": 512.97119, "b": 282.42117, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "Title", "bbox": {"l": 358.63901, "t": 285.00552, "r": 375.63034, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "77", "bbox": {"l": 426.52399, "t": 285.00552, "r": 434.86273, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "81", "bbox": {"l": 452.56240999999994, "t": 285.00552, "r": 460.90115000000003, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "All", "bbox": {"l": 358.63901, "t": 296.36255, "r": 369.60492, "b": 304.73718, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "72", "bbox": {"l": 426.52399, "t": 296.36255, "r": 434.86273, "b": 304.73718, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "84", "bbox": {"l": 452.56240999999994, "t": 296.36255, "r": 460.90115000000003, "b": 304.73718, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "78", "bbox": {"l": 478.59399, "t": 296.36255, "r": 486.93274, "b": 304.73718, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "87", "bbox": {"l": 504.6324200000001, "t": 296.36255, "r": 512.97119, "b": 304.73718, "coord_origin": "TOPLEFT"}}], "children": [{"id": 80, "label": "text", "bbox": {"l": 358.63901, "t": 153.10051999999996, "r": 401.73154, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 115, "text": "Class-count", "bbox": {"l": 358.63901, "t": 153.10051999999996, "r": 401.73154, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 440.22501, "t": 153.10051999999996, "r": 448.56375, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 116, "text": "11", "bbox": {"l": 440.22501, "t": 153.10051999999996, "r": 448.56375, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 494.38, "t": 153.10051999999996, "r": 498.54938, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 117, "text": "5", "bbox": {"l": 494.38, "t": 153.10051999999996, "r": 498.54938, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 358.63901, "t": 164.05951000000005, "r": 375.27167, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 118, "text": "Split", "bbox": {"l": 358.63901, "t": 164.05951000000005, "r": 375.27167, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 423.341, "t": 164.05951000000005, "r": 438.0459, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 119, "text": "Doc", "bbox": {"l": 423.341, "t": 164.05951000000005, "r": 438.0459, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 448.00757, "t": 164.05951000000005, "r": 465.4472, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 120, "text": "Page", "bbox": {"l": 448.00757, "t": 164.05951000000005, "r": 465.4472, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 475.41101, "t": 164.05951000000005, "r": 490.11591, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 121, "text": "Doc", "bbox": {"l": 475.41101, "t": 164.05951000000005, "r": 490.11591, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 500.07757999999995, "t": 164.05951000000005, "r": 517.51721, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 122, "text": "Page", "bbox": {"l": 500.07757999999995, "t": 164.05951000000005, "r": 517.51721, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 358.63901, "t": 175.41656, "r": 387.82465, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 123, "text": "Caption", "bbox": {"l": 358.63901, "t": 175.41656, "r": 387.82465, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 426.52399, "t": 175.41656, "r": 434.86273, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 124, "text": "68", "bbox": {"l": 426.52399, "t": 175.41656, "r": 434.86273, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 452.56240999999994, "t": 175.41656, "r": 460.90115000000003, "b": 183.7912, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 125, "text": "83", "bbox": {"l": 452.56240999999994, "t": 175.41656, "r": 460.90115000000003, "b": 183.7912, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 358.63901, "t": 186.37554999999998, "r": 391.14221, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 126, "text": "Footnote", "bbox": {"l": 358.63901, "t": 186.37554999999998, "r": 391.14221, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 426.52399, "t": 186.37554999999998, "r": 434.86273, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 127, "text": "71", "bbox": {"l": 426.52399, "t": 186.37554999999998, "r": 434.86273, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 452.56240999999994, "t": 186.37554999999998, "r": 460.90115000000003, "b": 194.75018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 128, "text": "84", "bbox": {"l": 452.56240999999994, "t": 186.37554999999998, "r": 460.90115000000003, "b": 194.75018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 358.63901, "t": 197.33452999999997, "r": 389.15167, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 129, "text": "Formula", "bbox": {"l": 358.63901, "t": 197.33452999999997, "r": 389.15167, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 426.52399, "t": 197.33452999999997, "r": 434.86273, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 130, "text": "60", "bbox": {"l": 426.52399, "t": 197.33452999999997, "r": 434.86273, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 452.56240999999994, "t": 197.33452999999997, "r": 460.90115000000003, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 131, "text": "66", "bbox": {"l": 452.56240999999994, "t": 197.33452999999997, "r": 460.90115000000003, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 358.63901, "t": 208.29351999999994, "r": 391.5188, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 132, "text": "List-item", "bbox": {"l": 358.63901, "t": 208.29351999999994, "r": 391.5188, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 426.52399, "t": 208.29351999999994, "r": 434.86273, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 133, "text": "81", "bbox": {"l": 426.52399, "t": 208.29351999999994, "r": 434.86273, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 452.56240999999994, "t": 208.29351999999994, "r": 460.90115000000003, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 134, "text": "88", "bbox": {"l": 452.56240999999994, "t": 208.29351999999994, "r": 460.90115000000003, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 478.59399, "t": 208.29351999999994, "r": 486.93274, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 135, "text": "82", "bbox": {"l": 478.59399, "t": 208.29351999999994, "r": 486.93274, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 504.6324200000001, "t": 208.29351999999994, "r": 512.97119, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 136, "text": "88", "bbox": {"l": 504.6324200000001, "t": 208.29351999999994, "r": 512.97119, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 358.63901, "t": 219.25256000000002, "r": 401.16666, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 137, "text": "Page-footer", "bbox": {"l": 358.63901, "t": 219.25256000000002, "r": 401.16666, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 426.52399, "t": 219.25256000000002, "r": 434.86273, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 138, "text": "62", "bbox": {"l": 426.52399, "t": 219.25256000000002, "r": 434.86273, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 452.56240999999994, "t": 219.25256000000002, "r": 460.90115000000003, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 139, "text": "89", "bbox": {"l": 452.56240999999994, "t": 219.25256000000002, "r": 460.90115000000003, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 358.63901, "t": 230.21155, "r": 403.91931, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 140, "text": "Page-header", "bbox": {"l": 358.63901, "t": 230.21155, "r": 403.91931, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 426.52399, "t": 230.21155, "r": 434.86273, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 141, "text": "72", "bbox": {"l": 426.52399, "t": 230.21155, "r": 434.86273, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 452.56240999999994, "t": 230.21155, "r": 460.90115000000003, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 142, "text": "90", "bbox": {"l": 452.56240999999994, "t": 230.21155, "r": 460.90115000000003, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 358.63901, "t": 241.16956000000005, "r": 384.62366, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 143, "text": "Picture", "bbox": {"l": 358.63901, "t": 241.16956000000005, "r": 384.62366, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 426.52399, "t": 241.16956000000005, "r": 434.86273, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 144, "text": "72", "bbox": {"l": 426.52399, "t": 241.16956000000005, "r": 434.86273, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 452.56240999999994, "t": 241.16956000000005, "r": 460.90115000000003, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 145, "text": "82", "bbox": {"l": 452.56240999999994, "t": 241.16956000000005, "r": 460.90115000000003, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 478.59399, "t": 241.16956000000005, "r": 486.93274, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 146, "text": "72", "bbox": {"l": 478.59399, "t": 241.16956000000005, "r": 486.93274, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 504.6324200000001, "t": 241.16956000000005, "r": 512.97119, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 147, "text": "82", "bbox": {"l": 504.6324200000001, "t": 241.16956000000005, "r": 512.97119, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 358.63901, "t": 252.12854000000004, "r": 413.37891, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 148, "text": "Section-header", "bbox": {"l": 358.63901, "t": 252.12854000000004, "r": 413.37891, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 114, "label": "text", "bbox": {"l": 426.52399, "t": 252.12854000000004, "r": 434.86273, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 149, "text": "68", "bbox": {"l": 426.52399, "t": 252.12854000000004, "r": 434.86273, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 115, "label": "text", "bbox": {"l": 452.56240999999994, "t": 252.12854000000004, "r": 460.90115000000003, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 150, "text": "83", "bbox": {"l": 452.56240999999994, "t": 252.12854000000004, "r": 460.90115000000003, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 116, "label": "text", "bbox": {"l": 478.59399, "t": 252.12854000000004, "r": 486.93274, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 151, "text": "69", "bbox": {"l": 478.59399, "t": 252.12854000000004, "r": 486.93274, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 117, "label": "text", "bbox": {"l": 504.6324200000001, "t": 252.12854000000004, "r": 512.97119, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 152, "text": "83", "bbox": {"l": 504.6324200000001, "t": 252.12854000000004, "r": 512.97119, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 118, "label": "text", "bbox": {"l": 358.63901, "t": 263.08752000000004, "r": 378.44577, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 153, "text": "Table", "bbox": {"l": 358.63901, "t": 263.08752000000004, "r": 378.44577, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 119, "label": "text", "bbox": {"l": 426.52399, "t": 263.08752000000004, "r": 434.86273, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 154, "text": "82", "bbox": {"l": 426.52399, "t": 263.08752000000004, "r": 434.86273, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 120, "label": "text", "bbox": {"l": 452.56240999999994, "t": 263.08752000000004, "r": 460.90115000000003, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 155, "text": "89", "bbox": {"l": 452.56240999999994, "t": 263.08752000000004, "r": 460.90115000000003, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 121, "label": "text", "bbox": {"l": 478.59399, "t": 263.08752000000004, "r": 486.93274, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 156, "text": "82", "bbox": {"l": 478.59399, "t": 263.08752000000004, "r": 486.93274, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 122, "label": "text", "bbox": {"l": 504.6324200000001, "t": 263.08752000000004, "r": 512.97119, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 157, "text": "90", "bbox": {"l": 504.6324200000001, "t": 263.08752000000004, "r": 512.97119, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 123, "label": "text", "bbox": {"l": 358.63901, "t": 274.04657, "r": 374.59921, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 158, "text": "Text", "bbox": {"l": 358.63901, "t": 274.04657, "r": 374.59921, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 124, "label": "text", "bbox": {"l": 426.52399, "t": 274.04657, "r": 434.86273, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 159, "text": "85", "bbox": {"l": 426.52399, "t": 274.04657, "r": 434.86273, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 125, "label": "text", "bbox": {"l": 452.56240999999994, "t": 274.04657, "r": 460.90115000000003, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 160, "text": "91", "bbox": {"l": 452.56240999999994, "t": 274.04657, "r": 460.90115000000003, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 126, "label": "text", "bbox": {"l": 478.59399, "t": 274.04657, "r": 486.93274, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 161, "text": "84", "bbox": {"l": 478.59399, "t": 274.04657, "r": 486.93274, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 127, "label": "text", "bbox": {"l": 504.6324200000001, "t": 274.04657, "r": 512.97119, "b": 282.42117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 162, "text": "90", "bbox": {"l": 504.6324200000001, "t": 274.04657, "r": 512.97119, "b": 282.42117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 128, "label": "text", "bbox": {"l": 358.63901, "t": 285.00552, "r": 375.63034, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 163, "text": "Title", "bbox": {"l": 358.63901, "t": 285.00552, "r": 375.63034, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 129, "label": "text", "bbox": {"l": 426.52399, "t": 285.00552, "r": 434.86273, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 164, "text": "77", "bbox": {"l": 426.52399, "t": 285.00552, "r": 434.86273, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 130, "label": "text", "bbox": {"l": 452.56240999999994, "t": 285.00552, "r": 460.90115000000003, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 165, "text": "81", "bbox": {"l": 452.56240999999994, "t": 285.00552, "r": 460.90115000000003, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 131, "label": "text", "bbox": {"l": 358.63901, "t": 296.36255, "r": 369.60492, "b": 304.73718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 166, "text": "All", "bbox": {"l": 358.63901, "t": 296.36255, "r": 369.60492, "b": 304.73718, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 132, "label": "text", "bbox": {"l": 426.52399, "t": 296.36255, "r": 434.86273, "b": 304.73718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 167, "text": "72", "bbox": {"l": 426.52399, "t": 296.36255, "r": 434.86273, "b": 304.73718, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 133, "label": "text", "bbox": {"l": 452.56240999999994, "t": 296.36255, "r": 460.90115000000003, "b": 304.73718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 168, "text": "84", "bbox": {"l": 452.56240999999994, "t": 296.36255, "r": 460.90115000000003, "b": 304.73718, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 134, "label": "text", "bbox": {"l": 478.59399, "t": 296.36255, "r": 486.93274, "b": 304.73718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 169, "text": "78", "bbox": {"l": 478.59399, "t": 296.36255, "r": 486.93274, "b": 304.73718, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 135, "label": "text", "bbox": {"l": 504.6324200000001, "t": 296.36255, "r": 512.97119, "b": 304.73718, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 170, "text": "87", "bbox": {"l": 504.6324200000001, "t": 296.36255, "r": 512.97119, "b": 304.73718, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["fcel", "ched", "lcel", "ched", "lcel", "nl", "fcel", "ched", "ched", "ched", "ched", "nl", "rhed", "fcel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 14, "num_cols": 5, "table_cells": [{"bbox": {"l": 358.63901, "t": 153.10051999999996, "r": 401.73154, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Class-count", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.22501, "t": 153.10051999999996, "r": 448.56375, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 3, "text": "11", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 494.38, "t": 153.10051999999996, "r": 498.54938, "b": 161.47515999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 2, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 5, "text": "5", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 164.05951000000005, "r": 375.27167, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Split", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 423.341, "t": 164.05951000000005, "r": 438.0459, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Doc", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 448.00757, "t": 164.05951000000005, "r": 465.4472, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Page", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 475.41101, "t": 164.05951000000005, "r": 490.11591, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "Doc", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 500.07757999999995, "t": 164.05951000000005, "r": 517.51721, "b": 172.43413999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "Page", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 175.41656, "r": 387.82465, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Caption", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 175.41656, "r": 434.86273, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 175.41656, "r": 460.90115000000003, "b": 183.7912, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 186.37554999999998, "r": 391.14221, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Footnote", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 186.37554999999998, "r": 434.86273, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "71", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 186.37554999999998, "r": 460.90115000000003, "b": 194.75018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 197.33452999999997, "r": 389.15167, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Formula", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 197.33452999999997, "r": 434.86273, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "60", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 197.33452999999997, "r": 460.90115000000003, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "66", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 208.29351999999994, "r": 391.5188, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "List-item", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 208.29351999999994, "r": 434.86273, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 208.29351999999994, "r": 460.90115000000003, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 478.59399, "t": 208.29351999999994, "r": 486.93274, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 504.6324200000001, "t": 208.29351999999994, "r": 512.97119, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 219.25256000000002, "r": 401.16666, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-footer", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 219.25256000000002, "r": 434.86273, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "62", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 219.25256000000002, "r": 460.90115000000003, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "89", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 230.21155, "r": 403.91931, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Page-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 230.21155, "r": 434.86273, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 230.21155, "r": 460.90115000000003, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "90", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 241.16956000000005, "r": 384.62366, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Picture", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 241.16956000000005, "r": 434.86273, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 241.16956000000005, "r": 460.90115000000003, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 478.59399, "t": 241.16956000000005, "r": 486.93274, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 504.6324200000001, "t": 241.16956000000005, "r": 512.97119, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 252.12854000000004, "r": 413.37891, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Section-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 252.12854000000004, "r": 434.86273, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 252.12854000000004, "r": 460.90115000000003, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 478.59399, "t": 252.12854000000004, "r": 486.93274, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "69", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 504.6324200000001, "t": 252.12854000000004, "r": 512.97119, "b": 260.50316999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "83", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 263.08752000000004, "r": 378.44577, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 263.08752000000004, "r": 434.86273, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 263.08752000000004, "r": 460.90115000000003, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "89", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 478.59399, "t": 263.08752000000004, "r": 486.93274, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 504.6324200000001, "t": 263.08752000000004, "r": 512.97119, "b": 271.46216000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "90", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 274.04657, "r": 374.59921, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Text", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 274.04657, "r": 434.86273, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 274.04657, "r": 460.90115000000003, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "91", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 478.59399, "t": 274.04657, "r": 486.93274, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 504.6324200000001, "t": 274.04657, "r": 512.97119, "b": 282.42117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "90", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 285.00552, "r": 375.63034, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Title", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 285.00552, "r": 434.86273, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 285.00552, "r": 460.90115000000003, "b": 293.38015999999993, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 358.63901, "t": 296.36255, "r": 369.60492, "b": 304.73718, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "All", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 426.52399, "t": 296.36255, "r": 434.86273, "b": 304.73718, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 452.56240999999994, "t": 296.36255, "r": 460.90115000000003, "b": 304.73718, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 478.59399, "t": 296.36255, "r": 486.93274, "b": 304.73718, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "78", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 504.6324200000001, "t": 296.36255, "r": 512.97119, "b": 304.73718, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "87", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "text", "id": 6, "page_no": 6, "cluster": {"id": 6, "label": "text", "bbox": {"l": 317.686, "t": 331.40353, "r": 559.58496, "b": 416.49017, "coord_origin": "TOPLEFT"}, "confidence": 0.9740146994590759, "cells": [{"id": 171, "text": "lists in PubLayNet (grouped list-items) versus DocLayNet (separate", "bbox": {"l": 317.95499, "t": 331.40353, "r": 558.20233, "b": 339.77817, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "list-items), the label set of size 4 is the closest to PubLayNet, in the", "bbox": {"l": 317.95499, "t": 342.36255, "r": 558.2005, "b": 350.73718, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "assumption that the", "bbox": {"l": 317.95499, "t": 353.32153, "r": 393.16028, "b": 361.69617000000005, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "List", "bbox": {"l": 395.84201, "t": 353.36639, "r": 409.14905, "b": 361.70514, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "is down-mapped to", "bbox": {"l": 412.33301, "t": 353.32153, "r": 485.02324999999996, "b": 361.69617000000005, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": "Text", "bbox": {"l": 487.70401, "t": 353.36639, "r": 502.86761, "b": 361.70514, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "in PubLayNet.", "bbox": {"l": 506.05499, "t": 353.32153, "r": 559.58496, "b": 361.69617000000005, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "The results in Table 3 show that the prediction accuracy on the", "bbox": {"l": 317.686, "t": 364.28054999999995, "r": 558.2002, "b": 372.65518, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "remaining class labels does not change significantly when other", "bbox": {"l": 317.95499, "t": 375.23853, "r": 558.36877, "b": 383.61316, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "classes are merged into them. The overall macro-average improves", "bbox": {"l": 317.95499, "t": 386.19754, "r": 558.19958, "b": 394.57217, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "by around 5%, in particular when", "bbox": {"l": 317.95499, "t": 397.15652, "r": 439.49454, "b": 405.53116000000006, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "Page-footer", "bbox": {"l": 441.728, "t": 397.20139, "r": 481.8616, "b": 405.54013, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "and", "bbox": {"l": 484.74298, "t": 397.15652, "r": 498.23743, "b": 405.53116000000006, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": "Page-header", "bbox": {"l": 500.47299, "t": 397.20139, "r": 543.95105, "b": 405.54013, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": "are", "bbox": {"l": 546.83197, "t": 397.15652, "r": 558.20142, "b": 405.53116000000006, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "excluded.", "bbox": {"l": 317.95496, "t": 408.11553999999995, "r": 352.37698, "b": 416.49017, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "lists in PubLayNet (grouped list-items) versus DocLayNet (separate list-items), the label set of size 4 is the closest to PubLayNet, in the assumption that the List is down-mapped to Text in PubLayNet. The results in Table 3 show that the prediction accuracy on the remaining class labels does not change significantly when other classes are merged into them. The overall macro-average improves by around 5%, in particular when Page-footer and Page-header are excluded."}, {"label": "section_header", "id": 9, "page_no": 6, "cluster": {"id": 9, "label": "section_header", "bbox": {"l": 317.95496, "t": 429.3949, "r": 549.8606, "b": 439.70398, "coord_origin": "TOPLEFT"}, "confidence": 0.9562516808509827, "cells": [{"id": 187, "text": "Impact of Document Split in Train and Test Set", "bbox": {"l": 317.95496, "t": 429.3949, "r": 549.8606, "b": 439.70398, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Impact of Document Split in Train and Test Set"}, {"label": "text", "id": 3, "page_no": 6, "cluster": {"id": 3, "label": "text", "bbox": {"l": 317.62299, "t": 444.59653, "r": 559.71381, "b": 595.43718, "coord_origin": "TOPLEFT"}, "confidence": 0.9869834184646606, "cells": [{"id": 188, "text": "Many documents in DocLayNet have a unique styling. In order", "bbox": {"l": 317.95499, "t": 444.59653, "r": 558.36884, "b": 452.97116, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "to avoid overfitting on a particular style, we have split the train-,", "bbox": {"l": 317.95499, "t": 455.55554, "r": 559.19189, "b": 463.93018, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": "test- and validation-sets of DocLayNet on document boundaries, i.e.", "bbox": {"l": 317.95499, "t": 466.51453, "r": 559.58185, "b": 474.88916, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "every document contributes pages to only one set. To the best of", "bbox": {"l": 317.95499, "t": 477.47354, "r": 558.20605, "b": 485.84818, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": "our knowledge, this was not considered in PubLayNet or DocBank.", "bbox": {"l": 317.95499, "t": 488.43253, "r": 559.58203, "b": 496.80716, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "To quantify how this affects model performance, we trained and", "bbox": {"l": 317.686, "t": 499.39154, "r": 558.20032, "b": 507.76617, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "evaluated a Mask R-CNN R50 model on a modified dataset version.", "bbox": {"l": 317.95499, "t": 510.35052, "r": 559.5849, "b": 518.72516, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "Here, the train-, test- and validation-sets were obtained by a ran-", "bbox": {"l": 317.95499, "t": 521.30954, "r": 559.71381, "b": 529.68417, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": "domised draw over the individual pages. As can be seen in Table 4,", "bbox": {"l": 317.95499, "t": 532.26855, "r": 559.18707, "b": 540.64317, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "the difference in model performance is surprisingly large: page-", "bbox": {"l": 317.95499, "t": 543.22655, "r": 559.71313, "b": 551.60117, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "wise splitting gains", "bbox": {"l": 317.62299, "t": 554.18555, "r": 388.35168, "b": 562.56017, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "\u02dc", "bbox": {"l": 391.36499, "t": 552.50055, "r": 393.98318, "b": 560.87517, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "10% in mAP over the document-wise splitting.", "bbox": {"l": 390.59, "t": 554.18555, "r": 559.58191, "b": 562.56017, "coord_origin": "TOPLEFT"}}, {"id": 201, "text": "Thus, random page-wise splitting of DocLayNet can easily lead", "bbox": {"l": 317.686, "t": 565.14455, "r": 558.20032, "b": 573.51917, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": "to accidental overestimation of model performance and should be", "bbox": {"l": 317.95499, "t": 576.10356, "r": 558.20508, "b": 584.4781800000001, "coord_origin": "TOPLEFT"}}, {"id": 203, "text": "avoided.", "bbox": {"l": 317.95499, "t": 587.06256, "r": 348.50354, "b": 595.43718, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Many documents in DocLayNet have a unique styling. In order to avoid overfitting on a particular style, we have split the train-, test- and validation-sets of DocLayNet on document boundaries, i.e. every document contributes pages to only one set. To the best of our knowledge, this was not considered in PubLayNet or DocBank. To quantify how this affects model performance, we trained and evaluated a Mask R-CNN R50 model on a modified dataset version. Here, the train-, test- and validation-sets were obtained by a randomised draw over the individual pages. As can be seen in Table 4, the difference in model performance is surprisingly large: pagewise splitting gains \u02dc 10% in mAP over the document-wise splitting. Thus, random page-wise splitting of DocLayNet can easily lead to accidental overestimation of model performance and should be avoided."}, {"label": "section_header", "id": 7, "page_no": 6, "cluster": {"id": 7, "label": "section_header", "bbox": {"l": 317.95499, "t": 608.34192, "r": 418.54776, "b": 618.65102, "coord_origin": "TOPLEFT"}, "confidence": 0.9589217305183411, "cells": [{"id": 204, "text": "Dataset Comparison", "bbox": {"l": 317.95499, "t": 608.34192, "r": 418.54776, "b": 618.65102, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Dataset Comparison"}, {"label": "text", "id": 2, "page_no": 6, "cluster": {"id": 2, "label": "text", "bbox": {"l": 317.686, "t": 623.54355, "r": 559.18817, "b": 708.640137, "coord_origin": "TOPLEFT"}, "confidence": 0.9872549772262573, "cells": [{"id": 205, "text": "Throughout this paper, we claim that DocLayNet\u2019s wider variety of", "bbox": {"l": 317.686, "t": 623.54355, "r": 558.20575, "b": 631.91817, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": "document layouts leads to more robust layout detection models. In", "bbox": {"l": 317.95499, "t": 634.50255, "r": 558.20624, "b": 642.87717, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": "Table 5, we provide evidence for that. We trained models on each", "bbox": {"l": 317.686, "t": 645.46155, "r": 558.20319, "b": 653.83617, "coord_origin": "TOPLEFT"}}, {"id": 208, "text": "of the available datasets (PubLayNet, DocBank and DocLayNet)", "bbox": {"l": 317.95499, "t": 656.42055, "r": 558.74377, "b": 664.79517, "coord_origin": "TOPLEFT"}}, {"id": 209, "text": "and evaluated them on the test sets of the other datasets. Due to", "bbox": {"l": 317.95499, "t": 667.37955, "r": 558.20398, "b": 675.7541699999999, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": "the different label sets and annotation styles, a direct comparison", "bbox": {"l": 317.95499, "t": 678.3385499999999, "r": 558.20062, "b": 686.71317, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "is not possible. Hence, we focussed on the common labels among", "bbox": {"l": 317.95499, "t": 689.29755, "r": 558.20343, "b": 697.672173, "coord_origin": "TOPLEFT"}}, {"id": 212, "text": "the datasets. Between PubLayNet and DocLayNet, these are", "bbox": {"l": 317.95499, "t": 700.256554, "r": 531.07666, "b": 708.631172, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "Picture", "bbox": {"l": 533.16199, "t": 700.301384, "r": 557.2561, "b": 708.640137, "coord_origin": "TOPLEFT"}}, {"id": 214, "text": ",", "bbox": {"l": 557.255, "t": 700.256554, "r": 559.18817, "b": 708.631172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Throughout this paper, we claim that DocLayNet's wider variety of document layouts leads to more robust layout detection models. In Table 5, we provide evidence for that. We trained models on each of the available datasets (PubLayNet, DocBank and DocLayNet) and evaluated them on the test sets of the other datasets. Due to the different label sets and annotation styles, a direct comparison is not possible. Hence, we focussed on the common labels among the datasets. Between PubLayNet and DocLayNet, these are Picture ,"}], "headers": [{"label": "page_header", "id": 12, "page_no": 6, "cluster": {"id": 12, "label": "page_header", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.9316118955612183, "cells": [{"id": 0, "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis"}, {"label": "page_header", "id": 11, "page_no": 6, "cluster": {"id": 11, "label": "page_header", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.9318180084228516, "cells": [{"id": 1, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA"}]}}, {"page_no": 7, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 246.24382, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar", "bbox": {"l": 253.13897999999998, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Table 5: Prediction Performance (mAP@0.5-0.95) of a Mask", "bbox": {"l": 53.501999, "t": 86.87292000000002, "r": 294.32153, "b": 95.34618999999998, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "R-CNN R50 network across the PubLayNet, DocBank & Do-", "bbox": {"l": 53.79800000000001, "t": 97.83191, "r": 295.64868, "b": 106.30517999999995, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "cLayNet data-sets. By evaluating on common label classes of", "bbox": {"l": 53.79800000000001, "t": 108.79088999999999, "r": 294.0437, "b": 117.26415999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "each dataset, we observe that the DocLayNet-trained model", "bbox": {"l": 53.79800000000001, "t": 119.74987999999996, "r": 294.04373, "b": 128.22313999999994, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "has much less pronounced variations in performance across", "bbox": {"l": 53.79800000000001, "t": 130.70885999999996, "r": 294.0437, "b": 139.18213000000003, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "all datasets.", "bbox": {"l": 53.79800000000001, "t": 141.66785000000004, "r": 101.15852, "b": 150.14111000000003, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Testing on", "bbox": {"l": 217.74099999999999, "t": 175.01855, "r": 256.26065, "b": 183.39319, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Training on", "bbox": {"l": 89.954002, "t": 185.97655999999995, "r": 133.24379, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "labels", "bbox": {"l": 154.629, "t": 185.97655999999995, "r": 175.47588, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "PLN", "bbox": {"l": 204.69, "t": 185.97655999999995, "r": 220.54260000000002, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "DB", "bbox": {"l": 230.50427000000002, "t": 185.97655999999995, "r": 242.06197, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "DLN", "bbox": {"l": 252.02364, "t": 185.97655999999995, "r": 269.31085, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "PubLayNet (PLN)", "bbox": {"l": 78.530998, "t": 219.25256000000002, "r": 142.56006, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Figure", "bbox": {"l": 154.629, "t": 197.33452999999997, "r": 177.92371, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "96", "bbox": {"l": 208.44701, "t": 197.33452999999997, "r": 216.78575000000004, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "43", "bbox": {"l": 232.1183, "t": 197.33452999999997, "r": 240.45705, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "23", "bbox": {"l": 256.49792, "t": 197.33452999999997, "r": 264.83667, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Sec-header", "bbox": {"l": 154.629, "t": 208.29351999999994, "r": 194.72675, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "87", "bbox": {"l": 208.44701, "t": 208.29351999999994, "r": 216.78575000000004, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "-", "bbox": {"l": 234.77235, "t": 208.29351999999994, "r": 237.80299000000002, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "32", "bbox": {"l": 256.49792, "t": 208.29351999999994, "r": 264.83667, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Table", "bbox": {"l": 154.629, "t": 219.25256000000002, "r": 174.43578, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "95", "bbox": {"l": 208.44701, "t": 219.25256000000002, "r": 216.78575000000004, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "24", "bbox": {"l": 232.1183, "t": 219.25256000000002, "r": 240.45705, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "49", "bbox": {"l": 256.49792, "t": 219.25256000000002, "r": 264.83667, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Text", "bbox": {"l": 154.629, "t": 230.21155, "r": 170.58919, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "96", "bbox": {"l": 208.44701, "t": 230.21155, "r": 216.78575000000004, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "-", "bbox": {"l": 234.77235, "t": 230.21155, "r": 237.80299000000002, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "42", "bbox": {"l": 256.49792, "t": 230.21155, "r": 264.83667, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "total", "bbox": {"l": 154.629, "t": 241.16956000000005, "r": 171.2796, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "93", "bbox": {"l": 208.44701, "t": 241.16956000000005, "r": 216.78575000000004, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "34", "bbox": {"l": 232.1183, "t": 241.16956000000005, "r": 240.45705, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "30", "bbox": {"l": 256.49792, "t": 241.16956000000005, "r": 264.83667, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "DocBank (DB)", "bbox": {"l": 78.530998, "t": 263.48650999999995, "r": 131.19963, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Figure", "bbox": {"l": 154.629, "t": 252.52752999999996, "r": 177.92371, "b": 260.90216, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "77", "bbox": {"l": 208.44701, "t": 252.52752999999996, "r": 216.78575000000004, "b": 260.90216, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "71", "bbox": {"l": 232.1183, "t": 252.52752999999996, "r": 240.45705, "b": 260.90216, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "31", "bbox": {"l": 256.49792, "t": 252.52752999999996, "r": 264.83667, "b": 260.90216, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "Table", "bbox": {"l": 154.629, "t": 263.48650999999995, "r": 174.43578, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "19", "bbox": {"l": 208.44701, "t": 263.48650999999995, "r": 216.78575000000004, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "65", "bbox": {"l": 232.1183, "t": 263.48650999999995, "r": 240.45705, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "22", "bbox": {"l": 256.49792, "t": 263.48650999999995, "r": 264.83667, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "total", "bbox": {"l": 154.629, "t": 274.44556, "r": 171.2796, "b": 282.82016, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "48", "bbox": {"l": 208.44701, "t": 274.44556, "r": 216.78575000000004, "b": 282.82016, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "68", "bbox": {"l": 232.1183, "t": 274.44556, "r": 240.45705, "b": 282.82016, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "27", "bbox": {"l": 256.49792, "t": 274.44556, "r": 264.83667, "b": 282.82016, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "DocLayNet (DLN)", "bbox": {"l": 78.530998, "t": 307.72055, "r": 144.66716, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "Figure", "bbox": {"l": 154.629, "t": 285.80255, "r": 177.92371, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "67", "bbox": {"l": 208.44701, "t": 285.80255, "r": 216.78575000000004, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "51", "bbox": {"l": 232.1183, "t": 285.80255, "r": 240.45705, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "72", "bbox": {"l": 256.49792, "t": 285.80255, "r": 264.83667, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Sec-header", "bbox": {"l": 154.629, "t": 296.76154, "r": 194.72675, "b": 305.13617, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "53", "bbox": {"l": 208.44701, "t": 296.76154, "r": 216.78575000000004, "b": 305.13617, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "-", "bbox": {"l": 234.77235, "t": 296.76154, "r": 237.80299000000002, "b": 305.13617, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "68", "bbox": {"l": 256.49792, "t": 296.76154, "r": 264.83667, "b": 305.13617, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Table", "bbox": {"l": 154.629, "t": 307.72055, "r": 174.43578, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "87", "bbox": {"l": 208.44701, "t": 307.72055, "r": 216.78575000000004, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "43", "bbox": {"l": 232.1183, "t": 307.72055, "r": 240.45705, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "82", "bbox": {"l": 256.49792, "t": 307.72055, "r": 264.83667, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "Text", "bbox": {"l": 154.629, "t": 318.67953, "r": 170.58919, "b": 327.05417, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "77", "bbox": {"l": 208.44701, "t": 318.67953, "r": 216.78575000000004, "b": 327.05417, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "-", "bbox": {"l": 234.77235, "t": 318.67953, "r": 237.80299000000002, "b": 327.05417, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "84", "bbox": {"l": 256.49792, "t": 318.67953, "r": 264.83667, "b": 327.05417, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "total", "bbox": {"l": 154.629, "t": 329.63855, "r": 171.2796, "b": 338.01318, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "59", "bbox": {"l": 208.44701, "t": 329.63855, "r": 216.78575000000004, "b": 338.01318, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "47", "bbox": {"l": 232.1183, "t": 329.63855, "r": 240.45705, "b": 338.01318, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "78", "bbox": {"l": 256.49792, "t": 329.63855, "r": 264.83667, "b": 338.01318, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "Section-header", "bbox": {"l": 53.79800000000001, "t": 390.96539, "r": 106.2392, "b": 399.30414, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": ",", "bbox": {"l": 106.239, "t": 390.92053, "r": 108.23331, "b": 399.2951699999999, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Table", "bbox": {"l": 110.482, "t": 390.96539, "r": 129.76332, "b": 399.30414, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "and", "bbox": {"l": 132.21899, "t": 390.92053, "r": 145.86186, "b": 399.2951699999999, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "Text", "bbox": {"l": 148.112, "t": 390.96539, "r": 163.14182, "b": 399.30414, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": ". Before training, we either mapped", "bbox": {"l": 163.13901, "t": 390.92053, "r": 294.04709, "b": 399.2951699999999, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "or excluded DocLayNet\u2019s other labels as specified in table 3, and", "bbox": {"l": 53.79800000000001, "t": 401.87954999999994, "r": 294.04712, "b": 410.25418, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "also PubLayNet\u2019s", "bbox": {"l": 53.79800000000001, "t": 412.83853, "r": 117.12856, "b": 421.21317, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "List", "bbox": {"l": 119.362, "t": 412.88339, "r": 132.4342, "b": 421.22214, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "to", "bbox": {"l": 135.177, "t": 412.83853, "r": 142.54416, "b": 421.21317, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "Text", "bbox": {"l": 144.77901, "t": 412.88339, "r": 159.66605, "b": 421.22214, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": ". Note that the different clustering of", "bbox": {"l": 159.66701, "t": 412.83853, "r": 294.04562, "b": 421.21317, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "lists (by list-element vs. whole list objects) naturally decreases the", "bbox": {"l": 53.79800000000001, "t": 423.79755, "r": 294.04614, "b": 432.17217999999997, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "mAP score for", "bbox": {"l": 53.79800000000001, "t": 434.75653, "r": 106.2066, "b": 443.13116, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "Text", "bbox": {"l": 108.448, "t": 434.80139, "r": 123.30533, "b": 443.14014, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": ".", "bbox": {"l": 123.305, "t": 434.75653, "r": 125.27761000000001, "b": 443.13116, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "For comparison of DocBank with DocLayNet, we trained only", "bbox": {"l": 63.76100199999999, "t": 445.71453999999994, "r": 294.27582, "b": 454.08917, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "on", "bbox": {"l": 53.79800000000001, "t": 456.67355, "r": 62.989277, "b": 465.04819, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Picture", "bbox": {"l": 64.852997, "t": 456.71841, "r": 88.947144, "b": 465.05716, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "and", "bbox": {"l": 91.019997, "t": 456.67355, "r": 104.24454, "b": 465.04819, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "Table", "bbox": {"l": 106.108, "t": 456.71841, "r": 124.78053, "b": 465.05716, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "clusters of each dataset. We had to exclude", "bbox": {"l": 126.85500000000002, "t": 456.67355, "r": 277.63235, "b": 465.04819, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "Text", "bbox": {"l": 279.49701, "t": 456.71841, "r": 294.0484, "b": 465.05716, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "because successive paragraphs are often grouped together into a", "bbox": {"l": 53.79800000000001, "t": 467.63254, "r": 294.04709, "b": 476.00717, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "single object in DocBank. This paragraph grouping is incompatible", "bbox": {"l": 53.79800000000001, "t": 478.59155, "r": 294.04532, "b": 486.96619, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "with the individual paragraphs of DocLayNet. As can be seen in", "bbox": {"l": 53.466999, "t": 489.55054, "r": 294.04538, "b": 497.92517, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "Table 5, DocLayNet trained models yield better performance com-", "bbox": {"l": 53.528999, "t": 500.50955, "r": 295.55908, "b": 508.88419, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "pared to the previous datasets. It is noteworthy that the models", "bbox": {"l": 53.79800000000001, "t": 511.46854, "r": 294.04712, "b": 519.84317, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "trained on PubLayNet and DocBank perform very well on their", "bbox": {"l": 53.79800000000001, "t": 522.42755, "r": 294.21179, "b": 530.80219, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "own test set, but have a much lower performance on the foreign", "bbox": {"l": 53.79800000000001, "t": 533.38654, "r": 294.04712, "b": 541.76117, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "datasets. While this also applies to DocLayNet, the difference is", "bbox": {"l": 53.79800000000001, "t": 544.34555, "r": 294.04715, "b": 552.72017, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "far less pronounced. Thus we conclude that DocLayNet trained", "bbox": {"l": 53.79800000000001, "t": 555.3045500000001, "r": 294.04712, "b": 563.67917, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "models are overall more robust and will produce better results for", "bbox": {"l": 53.79800000000001, "t": 566.26256, "r": 294.21411, "b": 574.63718, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "challenging, unseen layouts.", "bbox": {"l": 53.79800000000001, "t": 577.22156, "r": 157.52132, "b": 585.59618, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "Example Predictions", "bbox": {"l": 53.79800000000001, "t": 605.06091, "r": 156.00534, "b": 615.37001, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "To conclude this section, we illustrate the quality of layout predic-", "bbox": {"l": 53.528999, "t": 620.26355, "r": 295.5571, "b": 628.63817, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "tions one can expect from DocLayNet-trained models by providing", "bbox": {"l": 53.79800000000001, "t": 631.22255, "r": 294.04532, "b": 639.59717, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "a selection of examples without any further post-processing ap-", "bbox": {"l": 53.79800000000001, "t": 642.18155, "r": 295.55618, "b": 650.5561700000001, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "plied. Figure 6 shows selected layout predictions on pages from the", "bbox": {"l": 53.79800000000001, "t": 653.14055, "r": 294.04541, "b": 661.51517, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "test-set of DocLayNet. Results look decent in general across docu-", "bbox": {"l": 53.79800000000001, "t": 664.09956, "r": 295.55844, "b": 672.47417, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "ment categories, however one can also observe mistakes such as", "bbox": {"l": 53.79800000000001, "t": 675.05756, "r": 294.04712, "b": 683.43217, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "overlapping clusters of different classes, or entirely missing boxes", "bbox": {"l": 53.79800000000001, "t": 686.01656, "r": 294.04535, "b": 694.391174, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "due to low confidence.", "bbox": {"l": 53.79800000000001, "t": 696.975555, "r": 136.07368, "b": 705.350174, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "6", "bbox": {"l": 317.95502, "t": 85.85986000000003, "r": 323.56229, "b": 96.16900999999996, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "CONCLUSION", "bbox": {"l": 334.47137, "t": 85.85986000000003, "r": 405.72961, "b": 96.16900999999996, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "In this paper, we presented the DocLayNet dataset. It provides the", "bbox": {"l": 317.95499, "t": 101.06151999999997, "r": 558.2038, "b": 109.43615999999997, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "document conversion and layout analysis research community a", "bbox": {"l": 317.95499, "t": 112.02057000000002, "r": 558.2041, "b": 120.39520000000005, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "new and challenging dataset to improve and fine-tune novel ML", "bbox": {"l": 317.95499, "t": 122.97955000000002, "r": 558.43274, "b": 131.35419000000002, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "methods on. In contrast to many other datasets, DocLayNet was", "bbox": {"l": 317.95499, "t": 133.93854, "r": 558.20416, "b": 142.31317, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "created by human annotation in order to obtain reliable layout", "bbox": {"l": 317.95499, "t": 144.89752, "r": 558.20422, "b": 153.27215999999999, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "ground-truth on a wide variety of publication- and typesetting-", "bbox": {"l": 317.95499, "t": 155.85657000000003, "r": 559.71313, "b": 164.23119999999994, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "styles. Including a large proportion of documents outside the scien-", "bbox": {"l": 317.95499, "t": 166.81555000000003, "r": 559.71375, "b": 175.19019000000003, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "tific publishing domain adds significant value in this respect.", "bbox": {"l": 317.95499, "t": 177.77454, "r": 540.04382, "b": 186.14917000000003, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "From the dataset, we have derived on the one hand reference", "bbox": {"l": 327.918, "t": 188.73352, "r": 558.19836, "b": 197.10815000000002, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "metrics for human performance on document-layout annotation", "bbox": {"l": 317.95499, "t": 199.69257000000005, "r": 558.20404, "b": 208.06719999999996, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "(through double and triple annotations) and on the other hand eval-", "bbox": {"l": 317.686, "t": 210.65155000000004, "r": 559.71704, "b": 219.02617999999995, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "uated the baseline performance of commonly used object detection", "bbox": {"l": 317.95499, "t": 221.60956, "r": 558.20245, "b": 229.98419, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "methods. We also illustrated the impact of various dataset-related", "bbox": {"l": 317.95499, "t": 232.56853999999998, "r": 558.20502, "b": 240.94317999999998, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "aspects on model performance through data-ablation experiments,", "bbox": {"l": 317.95499, "t": 243.52752999999996, "r": 559.18408, "b": 251.90215999999998, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "both from a size and class-label perspective. Last but not least, we", "bbox": {"l": 317.95499, "t": 254.48650999999995, "r": 558.20227, "b": 262.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "compared the accuracy of models trained on other public datasets", "bbox": {"l": 317.95499, "t": 265.44556, "r": 558.20349, "b": 273.82019, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "and showed that DocLayNet trained models are more robust.", "bbox": {"l": 317.95499, "t": 276.40454, "r": 540.99426, "b": 284.77917, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "To date, there is still a significant gap between human and ML", "bbox": {"l": 327.918, "t": 287.36353, "r": 558.43469, "b": 295.73816, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "accuracy on the layout interpretation task, and we hope that this", "bbox": {"l": 317.95499, "t": 298.32254, "r": 558.20013, "b": 306.69717, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "work will inspire the research community to close that gap.", "bbox": {"l": 317.62299, "t": 309.28152, "r": 535.65015, "b": 317.65616000000006, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "REFERENCES", "bbox": {"l": 317.95499, "t": 335.09189, "r": 387.3696, "b": 345.40097, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "[1]", "bbox": {"l": 321.198, "t": 348.70233, "r": 329.72415, "b": 355.21588, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "Max G\u00f6bel, Tamir Hassan, Ermelinda Oro, and Giorgio Orsi. Icdar 2013 table", "bbox": {"l": 331.53516, "t": 348.70233, "r": 558.19904, "b": 355.21588, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "competition. In", "bbox": {"l": 333.39099, "t": 356.67236, "r": 379.36414, "b": 363.18591, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "2013 12th International Conference on Document Analysis and", "bbox": {"l": 381.37201, "t": 356.70724, "r": 558.20099, "b": 363.19287, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "Recognition", "bbox": {"l": 333.39099, "t": 364.67724999999996, "r": 365.59601, "b": 371.16286999999994, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": ", pages 1449-1453, 2013.", "bbox": {"l": 365.59601, "t": 364.64236, "r": 434.29489, "b": 371.15591, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "[2]", "bbox": {"l": 321.198, "t": 372.61237, "r": 329.85956, "b": 379.12592, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "Christian Clausner, Apostolos Antonacopoulos, and Stefan Pletschacher. Ic-", "bbox": {"l": 331.69931, "t": 372.61237, "r": 559.37976, "b": 379.12592, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "dar2017 competition on recognition of documents with complex layouts -", "bbox": {"l": 333.39099, "t": 380.58237, "r": 559.37982, "b": 387.09592, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "rdcl2017. In", "bbox": {"l": 333.39099, "t": 388.55236999999994, "r": 367.4339, "b": 395.06592, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "2017 14th IAPR International Conference on Document Analysis and", "bbox": {"l": 369.17401, "t": 388.58725000000004, "r": 558.20422, "b": 395.07288, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "Recognition (ICDAR)", "bbox": {"l": 333.39099, "t": 396.55725, "r": 390.87601, "b": 403.04287999999997, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": ", volume 01, pages 1404-1410, 2017.", "bbox": {"l": 390.87698, "t": 396.52237, "r": 492.17831, "b": 403.03592, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "[3]", "bbox": {"l": 321.198, "t": 404.49237, "r": 329.53583, "b": 411.00592, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "Herv\u00e9 D\u00e9jean, Jean-Luc Meunier, Liangcai Gao, Yilun Huang, Yu Fang, Florian", "bbox": {"l": 331.30682, "t": 404.49237, "r": 558.19958, "b": 411.00592, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "Kleber, and Eva-Maria Lang. ICDAR 2019 Competition on Table Detection and", "bbox": {"l": 333.39099, "t": 412.46335, "r": 558.20013, "b": 418.9769, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "Recognition (cTDaR), April 2019. http://sac.founderit.com/.", "bbox": {"l": 333.39099, "t": 420.43335, "r": 501.80127, "b": 426.94689999999997, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "[4]", "bbox": {"l": 321.198, "t": 428.40335, "r": 329.91299, "b": 434.9169, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "Antonio Jimeno Yepes, Peter Zhong, and Douglas Burdick. Competition on", "bbox": {"l": 331.7641, "t": 428.40335, "r": 558.19885, "b": 434.9169, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "scientific literature parsing. In", "bbox": {"l": 333.39099, "t": 436.3733500000001, "r": 423.77225, "b": 442.8869, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "Proceedings of the International Conference on", "bbox": {"l": 425.909, "t": 436.40823, "r": 558.20178, "b": 442.89386, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "Document Analysis and Recognition", "bbox": {"l": 333.39099, "t": 444.37823, "r": 429.42697, "b": 450.86386, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": ", ICDAR, pages 605-617. LNCS 12824, Springer-", "bbox": {"l": 429.42400999999995, "t": 444.34335, "r": 559.37872, "b": 450.85689999999994, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "Verlag, sep 2021.", "bbox": {"l": 332.819, "t": 452.31335, "r": 380.01764, "b": 458.8269, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "[5]", "bbox": {"l": 321.198, "t": 460.28336, "r": 329.22977, "b": 466.79691, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "Logan Markewich, Hao Zhang, Yubin Xing, Navid Lambert-Shirzad, Jiang Zhexin,", "bbox": {"l": 330.93576, "t": 460.28336, "r": 558.97156, "b": 466.79691, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "Roy Lee, Zhi Li, and Seok-Bum Ko. Segmentation for document layout analysis:", "bbox": {"l": 333.39099, "t": 468.25336, "r": 559.02625, "b": 474.76691, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "not dead yet.", "bbox": {"l": 333.39099, "t": 476.22437, "r": 368.85431, "b": 482.73792, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "International Journal on Document Analysis and Recognition (IJDAR)", "bbox": {"l": 370.811, "t": 476.25925, "r": 557.46326, "b": 482.74487, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": ",", "bbox": {"l": 557.46503, "t": 476.22437, "r": 558.96857, "b": 482.73792, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "pages 1-11, 01 2022.", "bbox": {"l": 333.39099, "t": 484.19437, "r": 390.82715, "b": 490.70792, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "[6]", "bbox": {"l": 321.198, "t": 492.16437, "r": 329.42145, "b": 498.67792, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "Xu Zhong, Jianbin Tang, and Antonio Jimeno-Yepes. Publaynet: Largest dataset", "bbox": {"l": 331.16812, "t": 492.16437, "r": 558.20361, "b": 498.67792, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "ever for document layout analysis. In", "bbox": {"l": 333.39099, "t": 500.13437, "r": 438.6101100000001, "b": 506.64792, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "Proceedings of the International Conference", "bbox": {"l": 440.349, "t": 500.16925, "r": 558.19958, "b": 506.65488, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "on Document Analysis and Recognition", "bbox": {"l": 333.39099, "t": 508.13925, "r": 441.40118, "b": 514.6248800000001, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": ", ICDAR, pages 1015-1022, sep 2019.", "bbox": {"l": 441.4019799999999, "t": 508.10437, "r": 544.78162, "b": 514.61792, "coord_origin": "TOPLEFT"}}, {"id": 172, "text": "[7]", "bbox": {"l": 321.19797, "t": 516.07437, "r": 329.74161, "b": 522.5879199999999, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "Minghao Li, Yiheng Xu, Lei Cui, Shaohan Huang, Furu Wei, Zhoujun Li, and", "bbox": {"l": 331.55634, "t": 516.07437, "r": 558.19897, "b": 522.5879199999999, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "Ming Zhou. Docbank: A benchmark dataset for document layout analysis. In", "bbox": {"l": 333.39099, "t": 524.0443700000001, "r": 558.19891, "b": 530.55792, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "Proceedings of the 28th International Conference on Computational Linguistics", "bbox": {"l": 333.39099, "t": 532.04922, "r": 557.40228, "b": 538.53487, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": ",", "bbox": {"l": 557.40399, "t": 532.01437, "r": 558.96893, "b": 538.5278900000001, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "COLING, pages 949-960. International Committee on Computational Linguistics,", "bbox": {"l": 333.39099, "t": 539.98438, "r": 558.9715, "b": 546.49789, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "dec 2020.", "bbox": {"l": 333.39099, "t": 547.95535, "r": 359.31955, "b": 554.46889, "coord_origin": "TOPLEFT"}}, {"id": 179, "text": "[8]", "bbox": {"l": 321.198, "t": 555.92535, "r": 329.7088, "b": 562.43889, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "Riaz Ahmad, Muhammad Tanvir Afzal, and M. Qadir. Information extraction", "bbox": {"l": 331.51654, "t": 555.92535, "r": 558.19891, "b": 562.43889, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "from pdf sources based on rule-based system using integrated formats. In", "bbox": {"l": 333.39099, "t": 563.89536, "r": 535.54352, "b": 570.40889, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "SemWe-", "bbox": {"l": 536.96399, "t": 563.93024, "r": 558.90222, "b": 570.4158600000001, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "bEval@ESWC", "bbox": {"l": 333.39099, "t": 571.9002399999999, "r": 371.94217, "b": 578.38586, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": ", 2016.", "bbox": {"l": 371.94299, "t": 571.86536, "r": 389.72617, "b": 578.3788900000001, "coord_origin": "TOPLEFT"}}, {"id": 185, "text": "[9]", "bbox": {"l": 321.198, "t": 579.83536, "r": 329.45999, "b": 586.34889, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "Ross B. Girshick, Jeff Donahue, Trevor Darrell, and Jitendra Malik. Rich feature", "bbox": {"l": 331.21487, "t": 579.83536, "r": 558.19843, "b": 586.34889, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "hierarchies for accurate object detection and semantic segmentation. In", "bbox": {"l": 333.39099, "t": 587.8053600000001, "r": 543.05487, "b": 594.31889, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": "IEEE", "bbox": {"l": 544.98499, "t": 587.84024, "r": 558.20148, "b": 594.32587, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "Conference on Computer Vision and Pattern Recognition", "bbox": {"l": 333.39099, "t": 595.81024, "r": 491.61166, "b": 602.29587, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": ", CVPR, pages 580-587.", "bbox": {"l": 491.61301, "t": 595.77536, "r": 559.27448, "b": 602.28889, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "IEEE Computer Society, jun 2014.", "bbox": {"l": 333.39099, "t": 603.74536, "r": 428.59726000000006, "b": 610.2589, "coord_origin": "TOPLEFT"}}, {"id": 192, "text": "[10]", "bbox": {"l": 317.95499, "t": 611.71536, "r": 329.54767, "b": 618.2289000000001, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "Ross B. Girshick. Fast R-CNN. In", "bbox": {"l": 331.31268, "t": 611.71536, "r": 425.1554, "b": 618.2289000000001, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "2015 IEEE International Conference on Computer", "bbox": {"l": 426.77802, "t": 611.75024, "r": 558.20203, "b": 618.23587, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "Vision", "bbox": {"l": 333.39099, "t": 619.72124, "r": 350.59537, "b": 626.20686, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": ", ICCV, pages 1440-1448. IEEE Computer Society, dec 2015.", "bbox": {"l": 350.59598, "t": 619.68637, "r": 518.58777, "b": 626.19989, "coord_origin": "TOPLEFT"}}, {"id": 197, "text": "[11]", "bbox": {"l": 317.95499, "t": 627.65637, "r": 329.5459, "b": 634.16989, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "Shaoqing Ren, Kaiming He, Ross Girshick, and Jian Sun. Faster r-cnn: Towards", "bbox": {"l": 331.31064, "t": 627.65637, "r": 558.20142, "b": 634.16989, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "real-time object detection with region proposal networks.", "bbox": {"l": 333.39099, "t": 635.62637, "r": 497.50909, "b": 642.13989, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "IEEE Transactions on", "bbox": {"l": 500.01401, "t": 635.66124, "r": 558.19885, "b": 642.14687, "coord_origin": "TOPLEFT"}}, {"id": 201, "text": "Pattern Analysis and Machine Intelligence", "bbox": {"l": 333.39099, "t": 643.6312399999999, "r": 449.38620000000003, "b": 650.1168700000001, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": ", 39(6):1137-1149, 2017.", "bbox": {"l": 449.38699, "t": 643.59637, "r": 515.74268, "b": 650.10989, "coord_origin": "TOPLEFT"}}, {"id": 203, "text": "[12]", "bbox": {"l": 317.95499, "t": 651.56638, "r": 329.41763, "b": 658.0799, "coord_origin": "TOPLEFT"}}, {"id": 204, "text": "Kaiming He, Georgia Gkioxari, Piotr Doll\u00e1r, and Ross B. Girshick. Mask R-CNN.", "bbox": {"l": 331.16287, "t": 651.56638, "r": 559.27808, "b": 658.0799, "coord_origin": "TOPLEFT"}}, {"id": 205, "text": "In", "bbox": {"l": 333.39099, "t": 659.53638, "r": 339.35904, "b": 666.0499, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": "IEEE International Conference on Computer Vision", "bbox": {"l": 341.56299, "t": 659.57124, "r": 485.8273, "b": 666.05687, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": ", ICCV, pages 2980-2988.", "bbox": {"l": 485.82901, "t": 659.53638, "r": 559.27356, "b": 666.0499, "coord_origin": "TOPLEFT"}}, {"id": 208, "text": "IEEE Computer Society, Oct 2017.", "bbox": {"l": 333.39099, "t": 667.50636, "r": 429.30161000000004, "b": 674.01989, "coord_origin": "TOPLEFT"}}, {"id": 209, "text": "[13]", "bbox": {"l": 317.95499, "t": 675.47636, "r": 330.11407, "b": 681.9898900000001, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": "Glenn Jocher, Alex Stoken, Ayush Chaurasia, Jirka Borovec, NanoCode012,", "bbox": {"l": 331.96533, "t": 675.47636, "r": 558.96716, "b": 681.9898900000001, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "TaoXie, Yonghye Kwon, Kalen Michael, Liu Changyu, Jiacong Fang, Abhiram V,", "bbox": {"l": 333.18201, "t": 683.44637, "r": 558.96661, "b": 689.95989, "coord_origin": "TOPLEFT"}}, {"id": 212, "text": "Laughing, tkianai, yxNONG, Piotr Skalski, Adam Hogan, Jebastin Nadar, imyhxy,", "bbox": {"l": 333.39099, "t": 691.41737, "r": 558.97156, "b": 697.930893, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "Lorenzo Mammana, Alex Wang, Cristi Fati, Diego Montes, Jan Hajek, Laurentiu", "bbox": {"l": 333.39099, "t": 699.387367, "r": 558.20001, "b": 705.900894, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 24, "label": "page_header", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.7984216809272766, "cells": [{"id": 0, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 246.24382, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar", "bbox": {"l": 253.13897999999998, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "text", "bbox": {"l": 53.501999, "t": 86.87292000000002, "r": 295.64868, "b": 150.14111000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9824112057685852, "cells": [{"id": 2, "text": "Table 5: Prediction Performance (mAP@0.5-0.95) of a Mask", "bbox": {"l": 53.501999, "t": 86.87292000000002, "r": 294.32153, "b": 95.34618999999998, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "R-CNN R50 network across the PubLayNet, DocBank & Do-", "bbox": {"l": 53.79800000000001, "t": 97.83191, "r": 295.64868, "b": 106.30517999999995, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "cLayNet data-sets. By evaluating on common label classes of", "bbox": {"l": 53.79800000000001, "t": 108.79088999999999, "r": 294.0437, "b": 117.26415999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "each dataset, we observe that the DocLayNet-trained model", "bbox": {"l": 53.79800000000001, "t": 119.74987999999996, "r": 294.04373, "b": 128.22313999999994, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "has much less pronounced variations in performance across", "bbox": {"l": 53.79800000000001, "t": 130.70885999999996, "r": 294.0437, "b": 139.18213000000003, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "all datasets.", "bbox": {"l": 53.79800000000001, "t": 141.66785000000004, "r": 101.15852, "b": 150.14111000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "table", "bbox": {"l": 72.6590347290039, "t": 172.48080444335938, "r": 274.83465576171875, "b": 339.8540344238281, "coord_origin": "TOPLEFT"}, "confidence": 0.9892616271972656, "cells": [{"id": 8, "text": "Testing on", "bbox": {"l": 217.74099999999999, "t": 175.01855, "r": 256.26065, "b": 183.39319, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Training on", "bbox": {"l": 89.954002, "t": 185.97655999999995, "r": 133.24379, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "labels", "bbox": {"l": 154.629, "t": 185.97655999999995, "r": 175.47588, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "PLN", "bbox": {"l": 204.69, "t": 185.97655999999995, "r": 220.54260000000002, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "DB", "bbox": {"l": 230.50427000000002, "t": 185.97655999999995, "r": 242.06197, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "DLN", "bbox": {"l": 252.02364, "t": 185.97655999999995, "r": 269.31085, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "PubLayNet (PLN)", "bbox": {"l": 78.530998, "t": 219.25256000000002, "r": 142.56006, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Figure", "bbox": {"l": 154.629, "t": 197.33452999999997, "r": 177.92371, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "96", "bbox": {"l": 208.44701, "t": 197.33452999999997, "r": 216.78575000000004, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "43", "bbox": {"l": 232.1183, "t": 197.33452999999997, "r": 240.45705, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "23", "bbox": {"l": 256.49792, "t": 197.33452999999997, "r": 264.83667, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Sec-header", "bbox": {"l": 154.629, "t": 208.29351999999994, "r": 194.72675, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "87", "bbox": {"l": 208.44701, "t": 208.29351999999994, "r": 216.78575000000004, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "-", "bbox": {"l": 234.77235, "t": 208.29351999999994, "r": 237.80299000000002, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "32", "bbox": {"l": 256.49792, "t": 208.29351999999994, "r": 264.83667, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Table", "bbox": {"l": 154.629, "t": 219.25256000000002, "r": 174.43578, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "95", "bbox": {"l": 208.44701, "t": 219.25256000000002, "r": 216.78575000000004, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "24", "bbox": {"l": 232.1183, "t": 219.25256000000002, "r": 240.45705, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "49", "bbox": {"l": 256.49792, "t": 219.25256000000002, "r": 264.83667, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Text", "bbox": {"l": 154.629, "t": 230.21155, "r": 170.58919, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "96", "bbox": {"l": 208.44701, "t": 230.21155, "r": 216.78575000000004, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "-", "bbox": {"l": 234.77235, "t": 230.21155, "r": 237.80299000000002, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "42", "bbox": {"l": 256.49792, "t": 230.21155, "r": 264.83667, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "total", "bbox": {"l": 154.629, "t": 241.16956000000005, "r": 171.2796, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "93", "bbox": {"l": 208.44701, "t": 241.16956000000005, "r": 216.78575000000004, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "34", "bbox": {"l": 232.1183, "t": 241.16956000000005, "r": 240.45705, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "30", "bbox": {"l": 256.49792, "t": 241.16956000000005, "r": 264.83667, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "DocBank (DB)", "bbox": {"l": 78.530998, "t": 263.48650999999995, "r": 131.19963, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Figure", "bbox": {"l": 154.629, "t": 252.52752999999996, "r": 177.92371, "b": 260.90216, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "77", "bbox": {"l": 208.44701, "t": 252.52752999999996, "r": 216.78575000000004, "b": 260.90216, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "71", "bbox": {"l": 232.1183, "t": 252.52752999999996, "r": 240.45705, "b": 260.90216, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "31", "bbox": {"l": 256.49792, "t": 252.52752999999996, "r": 264.83667, "b": 260.90216, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "Table", "bbox": {"l": 154.629, "t": 263.48650999999995, "r": 174.43578, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "19", "bbox": {"l": 208.44701, "t": 263.48650999999995, "r": 216.78575000000004, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "65", "bbox": {"l": 232.1183, "t": 263.48650999999995, "r": 240.45705, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "22", "bbox": {"l": 256.49792, "t": 263.48650999999995, "r": 264.83667, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "total", "bbox": {"l": 154.629, "t": 274.44556, "r": 171.2796, "b": 282.82016, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "48", "bbox": {"l": 208.44701, "t": 274.44556, "r": 216.78575000000004, "b": 282.82016, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "68", "bbox": {"l": 232.1183, "t": 274.44556, "r": 240.45705, "b": 282.82016, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "27", "bbox": {"l": 256.49792, "t": 274.44556, "r": 264.83667, "b": 282.82016, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "DocLayNet (DLN)", "bbox": {"l": 78.530998, "t": 307.72055, "r": 144.66716, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "Figure", "bbox": {"l": 154.629, "t": 285.80255, "r": 177.92371, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "67", "bbox": {"l": 208.44701, "t": 285.80255, "r": 216.78575000000004, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "51", "bbox": {"l": 232.1183, "t": 285.80255, "r": 240.45705, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "72", "bbox": {"l": 256.49792, "t": 285.80255, "r": 264.83667, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Sec-header", "bbox": {"l": 154.629, "t": 296.76154, "r": 194.72675, "b": 305.13617, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "53", "bbox": {"l": 208.44701, "t": 296.76154, "r": 216.78575000000004, "b": 305.13617, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "-", "bbox": {"l": 234.77235, "t": 296.76154, "r": 237.80299000000002, "b": 305.13617, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "68", "bbox": {"l": 256.49792, "t": 296.76154, "r": 264.83667, "b": 305.13617, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Table", "bbox": {"l": 154.629, "t": 307.72055, "r": 174.43578, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "87", "bbox": {"l": 208.44701, "t": 307.72055, "r": 216.78575000000004, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "43", "bbox": {"l": 232.1183, "t": 307.72055, "r": 240.45705, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "82", "bbox": {"l": 256.49792, "t": 307.72055, "r": 264.83667, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "Text", "bbox": {"l": 154.629, "t": 318.67953, "r": 170.58919, "b": 327.05417, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "77", "bbox": {"l": 208.44701, "t": 318.67953, "r": 216.78575000000004, "b": 327.05417, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "-", "bbox": {"l": 234.77235, "t": 318.67953, "r": 237.80299000000002, "b": 327.05417, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "84", "bbox": {"l": 256.49792, "t": 318.67953, "r": 264.83667, "b": 327.05417, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "total", "bbox": {"l": 154.629, "t": 329.63855, "r": 171.2796, "b": 338.01318, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "59", "bbox": {"l": 208.44701, "t": 329.63855, "r": 216.78575000000004, "b": 338.01318, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "47", "bbox": {"l": 232.1183, "t": 329.63855, "r": 240.45705, "b": 338.01318, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "78", "bbox": {"l": 256.49792, "t": 329.63855, "r": 264.83667, "b": 338.01318, "coord_origin": "TOPLEFT"}}], "children": [{"id": 25, "label": "text", "bbox": {"l": 217.74099999999999, "t": 175.01855, "r": 256.26065, "b": 183.39319, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "Testing on", "bbox": {"l": 217.74099999999999, "t": 175.01855, "r": 256.26065, "b": 183.39319, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 89.954002, "t": 185.97655999999995, "r": 133.24379, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "Training on", "bbox": {"l": 89.954002, "t": 185.97655999999995, "r": 133.24379, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 154.629, "t": 185.97655999999995, "r": 175.47588, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "labels", "bbox": {"l": 154.629, "t": 185.97655999999995, "r": 175.47588, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 204.69, "t": 185.97655999999995, "r": 220.54260000000002, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "PLN", "bbox": {"l": 204.69, "t": 185.97655999999995, "r": 220.54260000000002, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 230.50427000000002, "t": 185.97655999999995, "r": 242.06197, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "DB", "bbox": {"l": 230.50427000000002, "t": 185.97655999999995, "r": 242.06197, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 252.02364, "t": 185.97655999999995, "r": 269.31085, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "DLN", "bbox": {"l": 252.02364, "t": 185.97655999999995, "r": 269.31085, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 78.530998, "t": 219.25256000000002, "r": 142.56006, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "PubLayNet (PLN)", "bbox": {"l": 78.530998, "t": 219.25256000000002, "r": 142.56006, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 154.629, "t": 197.33452999999997, "r": 177.92371, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "Figure", "bbox": {"l": 154.629, "t": 197.33452999999997, "r": 177.92371, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 208.44701, "t": 197.33452999999997, "r": 216.78575000000004, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "96", "bbox": {"l": 208.44701, "t": 197.33452999999997, "r": 216.78575000000004, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 232.1183, "t": 197.33452999999997, "r": 240.45705, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "43", "bbox": {"l": 232.1183, "t": 197.33452999999997, "r": 240.45705, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 256.49792, "t": 197.33452999999997, "r": 264.83667, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "23", "bbox": {"l": 256.49792, "t": 197.33452999999997, "r": 264.83667, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 154.629, "t": 208.29351999999994, "r": 194.72675, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "Sec-header", "bbox": {"l": 154.629, "t": 208.29351999999994, "r": 194.72675, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 208.44701, "t": 208.29351999999994, "r": 216.78575000000004, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "87", "bbox": {"l": 208.44701, "t": 208.29351999999994, "r": 216.78575000000004, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 234.77235, "t": 208.29351999999994, "r": 237.80299000000002, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "-", "bbox": {"l": 234.77235, "t": 208.29351999999994, "r": 237.80299000000002, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 256.49792, "t": 208.29351999999994, "r": 264.83667, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "32", "bbox": {"l": 256.49792, "t": 208.29351999999994, "r": 264.83667, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 154.629, "t": 219.25256000000002, "r": 174.43578, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "Table", "bbox": {"l": 154.629, "t": 219.25256000000002, "r": 174.43578, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 208.44701, "t": 219.25256000000002, "r": 216.78575000000004, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "95", "bbox": {"l": 208.44701, "t": 219.25256000000002, "r": 216.78575000000004, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 232.1183, "t": 219.25256000000002, "r": 240.45705, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "24", "bbox": {"l": 232.1183, "t": 219.25256000000002, "r": 240.45705, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 256.49792, "t": 219.25256000000002, "r": 264.83667, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "49", "bbox": {"l": 256.49792, "t": 219.25256000000002, "r": 264.83667, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 154.629, "t": 230.21155, "r": 170.58919, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "Text", "bbox": {"l": 154.629, "t": 230.21155, "r": 170.58919, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 208.44701, "t": 230.21155, "r": 216.78575000000004, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "96", "bbox": {"l": 208.44701, "t": 230.21155, "r": 216.78575000000004, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 234.77235, "t": 230.21155, "r": 237.80299000000002, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "-", "bbox": {"l": 234.77235, "t": 230.21155, "r": 237.80299000000002, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 256.49792, "t": 230.21155, "r": 264.83667, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "42", "bbox": {"l": 256.49792, "t": 230.21155, "r": 264.83667, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 154.629, "t": 241.16956000000005, "r": 171.2796, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "total", "bbox": {"l": 154.629, "t": 241.16956000000005, "r": 171.2796, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 208.44701, "t": 241.16956000000005, "r": 216.78575000000004, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "93", "bbox": {"l": 208.44701, "t": 241.16956000000005, "r": 216.78575000000004, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 232.1183, "t": 241.16956000000005, "r": 240.45705, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "34", "bbox": {"l": 232.1183, "t": 241.16956000000005, "r": 240.45705, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 256.49792, "t": 241.16956000000005, "r": 264.83667, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "30", "bbox": {"l": 256.49792, "t": 241.16956000000005, "r": 264.83667, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 78.530998, "t": 263.48650999999995, "r": 131.19963, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "DocBank (DB)", "bbox": {"l": 78.530998, "t": 263.48650999999995, "r": 131.19963, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 154.629, "t": 252.52752999999996, "r": 177.92371, "b": 260.90216, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "Figure", "bbox": {"l": 154.629, "t": 252.52752999999996, "r": 177.92371, "b": 260.90216, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 208.44701, "t": 252.52752999999996, "r": 216.78575000000004, "b": 260.90216, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "77", "bbox": {"l": 208.44701, "t": 252.52752999999996, "r": 216.78575000000004, "b": 260.90216, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 232.1183, "t": 252.52752999999996, "r": 240.45705, "b": 260.90216, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "71", "bbox": {"l": 232.1183, "t": 252.52752999999996, "r": 240.45705, "b": 260.90216, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 256.49792, "t": 252.52752999999996, "r": 264.83667, "b": 260.90216, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "31", "bbox": {"l": 256.49792, "t": 252.52752999999996, "r": 264.83667, "b": 260.90216, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 154.629, "t": 263.48650999999995, "r": 174.43578, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "Table", "bbox": {"l": 154.629, "t": 263.48650999999995, "r": 174.43578, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 208.44701, "t": 263.48650999999995, "r": 216.78575000000004, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "19", "bbox": {"l": 208.44701, "t": 263.48650999999995, "r": 216.78575000000004, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 232.1183, "t": 263.48650999999995, "r": 240.45705, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "65", "bbox": {"l": 232.1183, "t": 263.48650999999995, "r": 240.45705, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 256.49792, "t": 263.48650999999995, "r": 264.83667, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "22", "bbox": {"l": 256.49792, "t": 263.48650999999995, "r": 264.83667, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 154.629, "t": 274.44556, "r": 171.2796, "b": 282.82016, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "total", "bbox": {"l": 154.629, "t": 274.44556, "r": 171.2796, "b": 282.82016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 208.44701, "t": 274.44556, "r": 216.78575000000004, "b": 282.82016, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "48", "bbox": {"l": 208.44701, "t": 274.44556, "r": 216.78575000000004, "b": 282.82016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 232.1183, "t": 274.44556, "r": 240.45705, "b": 282.82016, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "68", "bbox": {"l": 232.1183, "t": 274.44556, "r": 240.45705, "b": 282.82016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 256.49792, "t": 274.44556, "r": 264.83667, "b": 282.82016, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "27", "bbox": {"l": 256.49792, "t": 274.44556, "r": 264.83667, "b": 282.82016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 78.530998, "t": 307.72055, "r": 144.66716, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "DocLayNet (DLN)", "bbox": {"l": 78.530998, "t": 307.72055, "r": 144.66716, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 154.629, "t": 285.80255, "r": 177.92371, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "Figure", "bbox": {"l": 154.629, "t": 285.80255, "r": 177.92371, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 208.44701, "t": 285.80255, "r": 216.78575000000004, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "67", "bbox": {"l": 208.44701, "t": 285.80255, "r": 216.78575000000004, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 232.1183, "t": 285.80255, "r": 240.45705, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "51", "bbox": {"l": 232.1183, "t": 285.80255, "r": 240.45705, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 256.49792, "t": 285.80255, "r": 264.83667, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "72", "bbox": {"l": 256.49792, "t": 285.80255, "r": 264.83667, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 154.629, "t": 296.76154, "r": 194.72675, "b": 305.13617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "Sec-header", "bbox": {"l": 154.629, "t": 296.76154, "r": 194.72675, "b": 305.13617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 208.44701, "t": 296.76154, "r": 216.78575000000004, "b": 305.13617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "53", "bbox": {"l": 208.44701, "t": 296.76154, "r": 216.78575000000004, "b": 305.13617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 234.77235, "t": 296.76154, "r": 237.80299000000002, "b": 305.13617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "-", "bbox": {"l": 234.77235, "t": 296.76154, "r": 237.80299000000002, "b": 305.13617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 256.49792, "t": 296.76154, "r": 264.83667, "b": 305.13617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "68", "bbox": {"l": 256.49792, "t": 296.76154, "r": 264.83667, "b": 305.13617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 154.629, "t": 307.72055, "r": 174.43578, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "Table", "bbox": {"l": 154.629, "t": 307.72055, "r": 174.43578, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 208.44701, "t": 307.72055, "r": 216.78575000000004, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "87", "bbox": {"l": 208.44701, "t": 307.72055, "r": 216.78575000000004, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 232.1183, "t": 307.72055, "r": 240.45705, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "43", "bbox": {"l": 232.1183, "t": 307.72055, "r": 240.45705, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 256.49792, "t": 307.72055, "r": 264.83667, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "82", "bbox": {"l": 256.49792, "t": 307.72055, "r": 264.83667, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 154.629, "t": 318.67953, "r": 170.58919, "b": 327.05417, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "Text", "bbox": {"l": 154.629, "t": 318.67953, "r": 170.58919, "b": 327.05417, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 208.44701, "t": 318.67953, "r": 216.78575000000004, "b": 327.05417, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "77", "bbox": {"l": 208.44701, "t": 318.67953, "r": 216.78575000000004, "b": 327.05417, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 234.77235, "t": 318.67953, "r": 237.80299000000002, "b": 327.05417, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "-", "bbox": {"l": 234.77235, "t": 318.67953, "r": 237.80299000000002, "b": 327.05417, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 256.49792, "t": 318.67953, "r": 264.83667, "b": 327.05417, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "84", "bbox": {"l": 256.49792, "t": 318.67953, "r": 264.83667, "b": 327.05417, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 154.629, "t": 329.63855, "r": 171.2796, "b": 338.01318, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "total", "bbox": {"l": 154.629, "t": 329.63855, "r": 171.2796, "b": 338.01318, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 208.44701, "t": 329.63855, "r": 216.78575000000004, "b": 338.01318, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "59", "bbox": {"l": 208.44701, "t": 329.63855, "r": 216.78575000000004, "b": 338.01318, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 232.1183, "t": 329.63855, "r": 240.45705, "b": 338.01318, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "47", "bbox": {"l": 232.1183, "t": 329.63855, "r": 240.45705, "b": 338.01318, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 256.49792, "t": 329.63855, "r": 264.83667, "b": 338.01318, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "78", "bbox": {"l": 256.49792, "t": 329.63855, "r": 264.83667, "b": 338.01318, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 4, "label": "text", "bbox": {"l": 53.79800000000001, "t": 390.92053, "r": 294.04712, "b": 443.14014, "coord_origin": "TOPLEFT"}, "confidence": 0.9839397668838501, "cells": [{"id": 69, "text": "Section-header", "bbox": {"l": 53.79800000000001, "t": 390.96539, "r": 106.2392, "b": 399.30414, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": ",", "bbox": {"l": 106.239, "t": 390.92053, "r": 108.23331, "b": 399.2951699999999, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Table", "bbox": {"l": 110.482, "t": 390.96539, "r": 129.76332, "b": 399.30414, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "and", "bbox": {"l": 132.21899, "t": 390.92053, "r": 145.86186, "b": 399.2951699999999, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "Text", "bbox": {"l": 148.112, "t": 390.96539, "r": 163.14182, "b": 399.30414, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": ". Before training, we either mapped", "bbox": {"l": 163.13901, "t": 390.92053, "r": 294.04709, "b": 399.2951699999999, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "or excluded DocLayNet\u2019s other labels as specified in table 3, and", "bbox": {"l": 53.79800000000001, "t": 401.87954999999994, "r": 294.04712, "b": 410.25418, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "also PubLayNet\u2019s", "bbox": {"l": 53.79800000000001, "t": 412.83853, "r": 117.12856, "b": 421.21317, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "List", "bbox": {"l": 119.362, "t": 412.88339, "r": 132.4342, "b": 421.22214, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "to", "bbox": {"l": 135.177, "t": 412.83853, "r": 142.54416, "b": 421.21317, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "Text", "bbox": {"l": 144.77901, "t": 412.88339, "r": 159.66605, "b": 421.22214, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": ". Note that the different clustering of", "bbox": {"l": 159.66701, "t": 412.83853, "r": 294.04562, "b": 421.21317, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "lists (by list-element vs. whole list objects) naturally decreases the", "bbox": {"l": 53.79800000000001, "t": 423.79755, "r": 294.04614, "b": 432.17217999999997, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "mAP score for", "bbox": {"l": 53.79800000000001, "t": 434.75653, "r": 106.2066, "b": 443.13116, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "Text", "bbox": {"l": 108.448, "t": 434.80139, "r": 123.30533, "b": 443.14014, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": ".", "bbox": {"l": 123.305, "t": 434.75653, "r": 125.27761000000001, "b": 443.13116, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 53.466999, "t": 445.71453999999994, "r": 295.55908, "b": 585.59618, "coord_origin": "TOPLEFT"}, "confidence": 0.9868056774139404, "cells": [{"id": 85, "text": "For comparison of DocBank with DocLayNet, we trained only", "bbox": {"l": 63.76100199999999, "t": 445.71453999999994, "r": 294.27582, "b": 454.08917, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "on", "bbox": {"l": 53.79800000000001, "t": 456.67355, "r": 62.989277, "b": 465.04819, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Picture", "bbox": {"l": 64.852997, "t": 456.71841, "r": 88.947144, "b": 465.05716, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "and", "bbox": {"l": 91.019997, "t": 456.67355, "r": 104.24454, "b": 465.04819, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "Table", "bbox": {"l": 106.108, "t": 456.71841, "r": 124.78053, "b": 465.05716, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "clusters of each dataset. We had to exclude", "bbox": {"l": 126.85500000000002, "t": 456.67355, "r": 277.63235, "b": 465.04819, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "Text", "bbox": {"l": 279.49701, "t": 456.71841, "r": 294.0484, "b": 465.05716, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "because successive paragraphs are often grouped together into a", "bbox": {"l": 53.79800000000001, "t": 467.63254, "r": 294.04709, "b": 476.00717, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "single object in DocBank. This paragraph grouping is incompatible", "bbox": {"l": 53.79800000000001, "t": 478.59155, "r": 294.04532, "b": 486.96619, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "with the individual paragraphs of DocLayNet. As can be seen in", "bbox": {"l": 53.466999, "t": 489.55054, "r": 294.04538, "b": 497.92517, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "Table 5, DocLayNet trained models yield better performance com-", "bbox": {"l": 53.528999, "t": 500.50955, "r": 295.55908, "b": 508.88419, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "pared to the previous datasets. It is noteworthy that the models", "bbox": {"l": 53.79800000000001, "t": 511.46854, "r": 294.04712, "b": 519.84317, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "trained on PubLayNet and DocBank perform very well on their", "bbox": {"l": 53.79800000000001, "t": 522.42755, "r": 294.21179, "b": 530.80219, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "own test set, but have a much lower performance on the foreign", "bbox": {"l": 53.79800000000001, "t": 533.38654, "r": 294.04712, "b": 541.76117, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "datasets. While this also applies to DocLayNet, the difference is", "bbox": {"l": 53.79800000000001, "t": 544.34555, "r": 294.04715, "b": 552.72017, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "far less pronounced. Thus we conclude that DocLayNet trained", "bbox": {"l": 53.79800000000001, "t": 555.3045500000001, "r": 294.04712, "b": 563.67917, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "models are overall more robust and will produce better results for", "bbox": {"l": 53.79800000000001, "t": 566.26256, "r": 294.21411, "b": 574.63718, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "challenging, unseen layouts.", "bbox": {"l": 53.79800000000001, "t": 577.22156, "r": 157.52132, "b": 585.59618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "section_header", "bbox": {"l": 53.79800000000001, "t": 605.06091, "r": 156.00534, "b": 615.37001, "coord_origin": "TOPLEFT"}, "confidence": 0.9574698805809021, "cells": [{"id": 103, "text": "Example Predictions", "bbox": {"l": 53.79800000000001, "t": 605.06091, "r": 156.00534, "b": 615.37001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 53.528999, "t": 620.26355, "r": 295.55844, "b": 705.350174, "coord_origin": "TOPLEFT"}, "confidence": 0.9859886169433594, "cells": [{"id": 104, "text": "To conclude this section, we illustrate the quality of layout predic-", "bbox": {"l": 53.528999, "t": 620.26355, "r": 295.5571, "b": 628.63817, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "tions one can expect from DocLayNet-trained models by providing", "bbox": {"l": 53.79800000000001, "t": 631.22255, "r": 294.04532, "b": 639.59717, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "a selection of examples without any further post-processing ap-", "bbox": {"l": 53.79800000000001, "t": 642.18155, "r": 295.55618, "b": 650.5561700000001, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "plied. Figure 6 shows selected layout predictions on pages from the", "bbox": {"l": 53.79800000000001, "t": 653.14055, "r": 294.04541, "b": 661.51517, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "test-set of DocLayNet. Results look decent in general across docu-", "bbox": {"l": 53.79800000000001, "t": 664.09956, "r": 295.55844, "b": 672.47417, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "ment categories, however one can also observe mistakes such as", "bbox": {"l": 53.79800000000001, "t": 675.05756, "r": 294.04712, "b": 683.43217, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "overlapping clusters of different classes, or entirely missing boxes", "bbox": {"l": 53.79800000000001, "t": 686.01656, "r": 294.04535, "b": 694.391174, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "due to low confidence.", "bbox": {"l": 53.79800000000001, "t": 696.975555, "r": 136.07368, "b": 705.350174, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "section_header", "bbox": {"l": 317.95502, "t": 85.85986000000003, "r": 405.72961, "b": 96.16900999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.931998074054718, "cells": [{"id": 112, "text": "6", "bbox": {"l": 317.95502, "t": 85.85986000000003, "r": 323.56229, "b": 96.16900999999996, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "CONCLUSION", "bbox": {"l": 334.47137, "t": 85.85986000000003, "r": 405.72961, "b": 96.16900999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 317.95499, "t": 101.06151999999997, "r": 559.71375, "b": 186.14917000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.985493004322052, "cells": [{"id": 114, "text": "In this paper, we presented the DocLayNet dataset. It provides the", "bbox": {"l": 317.95499, "t": 101.06151999999997, "r": 558.2038, "b": 109.43615999999997, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "document conversion and layout analysis research community a", "bbox": {"l": 317.95499, "t": 112.02057000000002, "r": 558.2041, "b": 120.39520000000005, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "new and challenging dataset to improve and fine-tune novel ML", "bbox": {"l": 317.95499, "t": 122.97955000000002, "r": 558.43274, "b": 131.35419000000002, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "methods on. In contrast to many other datasets, DocLayNet was", "bbox": {"l": 317.95499, "t": 133.93854, "r": 558.20416, "b": 142.31317, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "created by human annotation in order to obtain reliable layout", "bbox": {"l": 317.95499, "t": 144.89752, "r": 558.20422, "b": 153.27215999999999, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "ground-truth on a wide variety of publication- and typesetting-", "bbox": {"l": 317.95499, "t": 155.85657000000003, "r": 559.71313, "b": 164.23119999999994, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "styles. Including a large proportion of documents outside the scien-", "bbox": {"l": 317.95499, "t": 166.81555000000003, "r": 559.71375, "b": 175.19019000000003, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "tific publishing domain adds significant value in this respect.", "bbox": {"l": 317.95499, "t": 177.77454, "r": 540.04382, "b": 186.14917000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "text", "bbox": {"l": 317.686, "t": 188.73352, "r": 559.71704, "b": 284.77917, "coord_origin": "TOPLEFT"}, "confidence": 0.9800531268119812, "cells": [{"id": 122, "text": "From the dataset, we have derived on the one hand reference", "bbox": {"l": 327.918, "t": 188.73352, "r": 558.19836, "b": 197.10815000000002, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "metrics for human performance on document-layout annotation", "bbox": {"l": 317.95499, "t": 199.69257000000005, "r": 558.20404, "b": 208.06719999999996, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "(through double and triple annotations) and on the other hand eval-", "bbox": {"l": 317.686, "t": 210.65155000000004, "r": 559.71704, "b": 219.02617999999995, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "uated the baseline performance of commonly used object detection", "bbox": {"l": 317.95499, "t": 221.60956, "r": 558.20245, "b": 229.98419, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "methods. We also illustrated the impact of various dataset-related", "bbox": {"l": 317.95499, "t": 232.56853999999998, "r": 558.20502, "b": 240.94317999999998, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "aspects on model performance through data-ablation experiments,", "bbox": {"l": 317.95499, "t": 243.52752999999996, "r": 559.18408, "b": 251.90215999999998, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "both from a size and class-label perspective. Last but not least, we", "bbox": {"l": 317.95499, "t": 254.48650999999995, "r": 558.20227, "b": 262.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "compared the accuracy of models trained on other public datasets", "bbox": {"l": 317.95499, "t": 265.44556, "r": 558.20349, "b": 273.82019, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "and showed that DocLayNet trained models are more robust.", "bbox": {"l": 317.95499, "t": 276.40454, "r": 540.99426, "b": 284.77917, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "text", "bbox": {"l": 317.62299, "t": 287.36353, "r": 558.43469, "b": 317.65616000000006, "coord_origin": "TOPLEFT"}, "confidence": 0.9676101207733154, "cells": [{"id": 131, "text": "To date, there is still a significant gap between human and ML", "bbox": {"l": 327.918, "t": 287.36353, "r": 558.43469, "b": 295.73816, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "accuracy on the layout interpretation task, and we hope that this", "bbox": {"l": 317.95499, "t": 298.32254, "r": 558.20013, "b": 306.69717, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "work will inspire the research community to close that gap.", "bbox": {"l": 317.62299, "t": 309.28152, "r": 535.65015, "b": 317.65616000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "section_header", "bbox": {"l": 317.95499, "t": 335.09189, "r": 387.3696, "b": 345.40097, "coord_origin": "TOPLEFT"}, "confidence": 0.9378752708435059, "cells": [{"id": 134, "text": "REFERENCES", "bbox": {"l": 317.95499, "t": 335.09189, "r": 387.3696, "b": 345.40097, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "list_item", "bbox": {"l": 321.198, "t": 348.70233, "r": 558.20099, "b": 371.16286999999994, "coord_origin": "TOPLEFT"}, "confidence": 0.9372857213020325, "cells": [{"id": 135, "text": "[1]", "bbox": {"l": 321.198, "t": 348.70233, "r": 329.72415, "b": 355.21588, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "Max G\u00f6bel, Tamir Hassan, Ermelinda Oro, and Giorgio Orsi. Icdar 2013 table", "bbox": {"l": 331.53516, "t": 348.70233, "r": 558.19904, "b": 355.21588, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "competition. In", "bbox": {"l": 333.39099, "t": 356.67236, "r": 379.36414, "b": 363.18591, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "2013 12th International Conference on Document Analysis and", "bbox": {"l": 381.37201, "t": 356.70724, "r": 558.20099, "b": 363.19287, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "Recognition", "bbox": {"l": 333.39099, "t": 364.67724999999996, "r": 365.59601, "b": 371.16286999999994, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": ", pages 1449-1453, 2013.", "bbox": {"l": 365.59601, "t": 364.64236, "r": 434.29489, "b": 371.15591, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "list_item", "bbox": {"l": 321.198, "t": 372.61237, "r": 559.37982, "b": 403.04287999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9480945467948914, "cells": [{"id": 141, "text": "[2]", "bbox": {"l": 321.198, "t": 372.61237, "r": 329.85956, "b": 379.12592, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "Christian Clausner, Apostolos Antonacopoulos, and Stefan Pletschacher. Ic-", "bbox": {"l": 331.69931, "t": 372.61237, "r": 559.37976, "b": 379.12592, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "dar2017 competition on recognition of documents with complex layouts -", "bbox": {"l": 333.39099, "t": 380.58237, "r": 559.37982, "b": 387.09592, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "rdcl2017. In", "bbox": {"l": 333.39099, "t": 388.55236999999994, "r": 367.4339, "b": 395.06592, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "2017 14th IAPR International Conference on Document Analysis and", "bbox": {"l": 369.17401, "t": 388.58725000000004, "r": 558.20422, "b": 395.07288, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "Recognition (ICDAR)", "bbox": {"l": 333.39099, "t": 396.55725, "r": 390.87601, "b": 403.04287999999997, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": ", volume 01, pages 1404-1410, 2017.", "bbox": {"l": 390.87698, "t": 396.52237, "r": 492.17831, "b": 403.03592, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "list_item", "bbox": {"l": 321.198, "t": 404.49237, "r": 558.20013, "b": 426.94689999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9257517457008362, "cells": [{"id": 148, "text": "[3]", "bbox": {"l": 321.198, "t": 404.49237, "r": 329.53583, "b": 411.00592, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "Herv\u00e9 D\u00e9jean, Jean-Luc Meunier, Liangcai Gao, Yilun Huang, Yu Fang, Florian", "bbox": {"l": 331.30682, "t": 404.49237, "r": 558.19958, "b": 411.00592, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "Kleber, and Eva-Maria Lang. ICDAR 2019 Competition on Table Detection and", "bbox": {"l": 333.39099, "t": 412.46335, "r": 558.20013, "b": 418.9769, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "Recognition (cTDaR), April 2019. http://sac.founderit.com/.", "bbox": {"l": 333.39099, "t": 420.43335, "r": 501.80127, "b": 426.94689999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "list_item", "bbox": {"l": 321.198, "t": 428.40335, "r": 559.37872, "b": 458.8269, "coord_origin": "TOPLEFT"}, "confidence": 0.9270977973937988, "cells": [{"id": 152, "text": "[4]", "bbox": {"l": 321.198, "t": 428.40335, "r": 329.91299, "b": 434.9169, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "Antonio Jimeno Yepes, Peter Zhong, and Douglas Burdick. Competition on", "bbox": {"l": 331.7641, "t": 428.40335, "r": 558.19885, "b": 434.9169, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "scientific literature parsing. In", "bbox": {"l": 333.39099, "t": 436.3733500000001, "r": 423.77225, "b": 442.8869, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "Proceedings of the International Conference on", "bbox": {"l": 425.909, "t": 436.40823, "r": 558.20178, "b": 442.89386, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "Document Analysis and Recognition", "bbox": {"l": 333.39099, "t": 444.37823, "r": 429.42697, "b": 450.86386, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": ", ICDAR, pages 605-617. LNCS 12824, Springer-", "bbox": {"l": 429.42400999999995, "t": 444.34335, "r": 559.37872, "b": 450.85689999999994, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "Verlag, sep 2021.", "bbox": {"l": 332.819, "t": 452.31335, "r": 380.01764, "b": 458.8269, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "list_item", "bbox": {"l": 321.198, "t": 460.28336, "r": 559.02625, "b": 490.70792, "coord_origin": "TOPLEFT"}, "confidence": 0.9290012121200562, "cells": [{"id": 159, "text": "[5]", "bbox": {"l": 321.198, "t": 460.28336, "r": 329.22977, "b": 466.79691, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "Logan Markewich, Hao Zhang, Yubin Xing, Navid Lambert-Shirzad, Jiang Zhexin,", "bbox": {"l": 330.93576, "t": 460.28336, "r": 558.97156, "b": 466.79691, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "Roy Lee, Zhi Li, and Seok-Bum Ko. Segmentation for document layout analysis:", "bbox": {"l": 333.39099, "t": 468.25336, "r": 559.02625, "b": 474.76691, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "not dead yet.", "bbox": {"l": 333.39099, "t": 476.22437, "r": 368.85431, "b": 482.73792, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "International Journal on Document Analysis and Recognition (IJDAR)", "bbox": {"l": 370.811, "t": 476.25925, "r": 557.46326, "b": 482.74487, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": ",", "bbox": {"l": 557.46503, "t": 476.22437, "r": 558.96857, "b": 482.73792, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "pages 1-11, 01 2022.", "bbox": {"l": 333.39099, "t": 484.19437, "r": 390.82715, "b": 490.70792, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "list_item", "bbox": {"l": 321.198, "t": 492.16437, "r": 558.20361, "b": 514.6248800000001, "coord_origin": "TOPLEFT"}, "confidence": 0.927480161190033, "cells": [{"id": 166, "text": "[6]", "bbox": {"l": 321.198, "t": 492.16437, "r": 329.42145, "b": 498.67792, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "Xu Zhong, Jianbin Tang, and Antonio Jimeno-Yepes. Publaynet: Largest dataset", "bbox": {"l": 331.16812, "t": 492.16437, "r": 558.20361, "b": 498.67792, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "ever for document layout analysis. In", "bbox": {"l": 333.39099, "t": 500.13437, "r": 438.6101100000001, "b": 506.64792, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "Proceedings of the International Conference", "bbox": {"l": 440.349, "t": 500.16925, "r": 558.19958, "b": 506.65488, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "on Document Analysis and Recognition", "bbox": {"l": 333.39099, "t": 508.13925, "r": 441.40118, "b": 514.6248800000001, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": ", ICDAR, pages 1015-1022, sep 2019.", "bbox": {"l": 441.4019799999999, "t": 508.10437, "r": 544.78162, "b": 514.61792, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "list_item", "bbox": {"l": 321.19797, "t": 516.07437, "r": 558.9715, "b": 554.46889, "coord_origin": "TOPLEFT"}, "confidence": 0.9426893591880798, "cells": [{"id": 172, "text": "[7]", "bbox": {"l": 321.19797, "t": 516.07437, "r": 329.74161, "b": 522.5879199999999, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "Minghao Li, Yiheng Xu, Lei Cui, Shaohan Huang, Furu Wei, Zhoujun Li, and", "bbox": {"l": 331.55634, "t": 516.07437, "r": 558.19897, "b": 522.5879199999999, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "Ming Zhou. Docbank: A benchmark dataset for document layout analysis. In", "bbox": {"l": 333.39099, "t": 524.0443700000001, "r": 558.19891, "b": 530.55792, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "Proceedings of the 28th International Conference on Computational Linguistics", "bbox": {"l": 333.39099, "t": 532.04922, "r": 557.40228, "b": 538.53487, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": ",", "bbox": {"l": 557.40399, "t": 532.01437, "r": 558.96893, "b": 538.5278900000001, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "COLING, pages 949-960. International Committee on Computational Linguistics,", "bbox": {"l": 333.39099, "t": 539.98438, "r": 558.9715, "b": 546.49789, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "dec 2020.", "bbox": {"l": 333.39099, "t": 547.95535, "r": 359.31955, "b": 554.46889, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "list_item", "bbox": {"l": 321.198, "t": 555.92535, "r": 558.90222, "b": 578.38586, "coord_origin": "TOPLEFT"}, "confidence": 0.9139686226844788, "cells": [{"id": 179, "text": "[8]", "bbox": {"l": 321.198, "t": 555.92535, "r": 329.7088, "b": 562.43889, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "Riaz Ahmad, Muhammad Tanvir Afzal, and M. Qadir. Information extraction", "bbox": {"l": 331.51654, "t": 555.92535, "r": 558.19891, "b": 562.43889, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "from pdf sources based on rule-based system using integrated formats. In", "bbox": {"l": 333.39099, "t": 563.89536, "r": 535.54352, "b": 570.40889, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "SemWe-", "bbox": {"l": 536.96399, "t": 563.93024, "r": 558.90222, "b": 570.4158600000001, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "bEval@ESWC", "bbox": {"l": 333.39099, "t": 571.9002399999999, "r": 371.94217, "b": 578.38586, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": ", 2016.", "bbox": {"l": 371.94299, "t": 571.86536, "r": 389.72617, "b": 578.3788900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "list_item", "bbox": {"l": 321.198, "t": 579.83536, "r": 559.27448, "b": 610.2589, "coord_origin": "TOPLEFT"}, "confidence": 0.9113100171089172, "cells": [{"id": 185, "text": "[9]", "bbox": {"l": 321.198, "t": 579.83536, "r": 329.45999, "b": 586.34889, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "Ross B. Girshick, Jeff Donahue, Trevor Darrell, and Jitendra Malik. Rich feature", "bbox": {"l": 331.21487, "t": 579.83536, "r": 558.19843, "b": 586.34889, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "hierarchies for accurate object detection and semantic segmentation. In", "bbox": {"l": 333.39099, "t": 587.8053600000001, "r": 543.05487, "b": 594.31889, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": "IEEE", "bbox": {"l": 544.98499, "t": 587.84024, "r": 558.20148, "b": 594.32587, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "Conference on Computer Vision and Pattern Recognition", "bbox": {"l": 333.39099, "t": 595.81024, "r": 491.61166, "b": 602.29587, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": ", CVPR, pages 580-587.", "bbox": {"l": 491.61301, "t": 595.77536, "r": 559.27448, "b": 602.28889, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "IEEE Computer Society, jun 2014.", "bbox": {"l": 333.39099, "t": 603.74536, "r": 428.59726000000006, "b": 610.2589, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "list_item", "bbox": {"l": 317.95499, "t": 611.71536, "r": 558.20203, "b": 626.20686, "coord_origin": "TOPLEFT"}, "confidence": 0.9028767347335815, "cells": [{"id": 192, "text": "[10]", "bbox": {"l": 317.95499, "t": 611.71536, "r": 329.54767, "b": 618.2289000000001, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "Ross B. Girshick. Fast R-CNN. In", "bbox": {"l": 331.31268, "t": 611.71536, "r": 425.1554, "b": 618.2289000000001, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "2015 IEEE International Conference on Computer", "bbox": {"l": 426.77802, "t": 611.75024, "r": 558.20203, "b": 618.23587, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "Vision", "bbox": {"l": 333.39099, "t": 619.72124, "r": 350.59537, "b": 626.20686, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": ", ICCV, pages 1440-1448. IEEE Computer Society, dec 2015.", "bbox": {"l": 350.59598, "t": 619.68637, "r": 518.58777, "b": 626.19989, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "list_item", "bbox": {"l": 317.95499, "t": 627.65637, "r": 558.20142, "b": 650.1168700000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9127691984176636, "cells": [{"id": 197, "text": "[11]", "bbox": {"l": 317.95499, "t": 627.65637, "r": 329.5459, "b": 634.16989, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "Shaoqing Ren, Kaiming He, Ross Girshick, and Jian Sun. Faster r-cnn: Towards", "bbox": {"l": 331.31064, "t": 627.65637, "r": 558.20142, "b": 634.16989, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "real-time object detection with region proposal networks.", "bbox": {"l": 333.39099, "t": 635.62637, "r": 497.50909, "b": 642.13989, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "IEEE Transactions on", "bbox": {"l": 500.01401, "t": 635.66124, "r": 558.19885, "b": 642.14687, "coord_origin": "TOPLEFT"}}, {"id": 201, "text": "Pattern Analysis and Machine Intelligence", "bbox": {"l": 333.39099, "t": 643.6312399999999, "r": 449.38620000000003, "b": 650.1168700000001, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": ", 39(6):1137-1149, 2017.", "bbox": {"l": 449.38699, "t": 643.59637, "r": 515.74268, "b": 650.10989, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "list_item", "bbox": {"l": 317.95499, "t": 651.56638, "r": 559.27808, "b": 674.01989, "coord_origin": "TOPLEFT"}, "confidence": 0.9142459630966187, "cells": [{"id": 203, "text": "[12]", "bbox": {"l": 317.95499, "t": 651.56638, "r": 329.41763, "b": 658.0799, "coord_origin": "TOPLEFT"}}, {"id": 204, "text": "Kaiming He, Georgia Gkioxari, Piotr Doll\u00e1r, and Ross B. Girshick. Mask R-CNN.", "bbox": {"l": 331.16287, "t": 651.56638, "r": 559.27808, "b": 658.0799, "coord_origin": "TOPLEFT"}}, {"id": 205, "text": "In", "bbox": {"l": 333.39099, "t": 659.53638, "r": 339.35904, "b": 666.0499, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": "IEEE International Conference on Computer Vision", "bbox": {"l": 341.56299, "t": 659.57124, "r": 485.8273, "b": 666.05687, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": ", ICCV, pages 2980-2988.", "bbox": {"l": 485.82901, "t": 659.53638, "r": 559.27356, "b": 666.0499, "coord_origin": "TOPLEFT"}}, {"id": 208, "text": "IEEE Computer Society, Oct 2017.", "bbox": {"l": 333.39099, "t": 667.50636, "r": 429.30161000000004, "b": 674.01989, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "list_item", "bbox": {"l": 317.95499, "t": 675.47636, "r": 558.97156, "b": 705.900894, "coord_origin": "TOPLEFT"}, "confidence": 0.889543354511261, "cells": [{"id": 209, "text": "[13]", "bbox": {"l": 317.95499, "t": 675.47636, "r": 330.11407, "b": 681.9898900000001, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": "Glenn Jocher, Alex Stoken, Ayush Chaurasia, Jirka Borovec, NanoCode012,", "bbox": {"l": 331.96533, "t": 675.47636, "r": 558.96716, "b": 681.9898900000001, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "TaoXie, Yonghye Kwon, Kalen Michael, Liu Changyu, Jiacong Fang, Abhiram V,", "bbox": {"l": 333.18201, "t": 683.44637, "r": 558.96661, "b": 689.95989, "coord_origin": "TOPLEFT"}}, {"id": 212, "text": "Laughing, tkianai, yxNONG, Piotr Skalski, Adam Hogan, Jebastin Nadar, imyhxy,", "bbox": {"l": 333.39099, "t": 691.41737, "r": 558.97156, "b": 697.930893, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "Lorenzo Mammana, Alex Wang, Cristi Fati, Diego Montes, Jan Hajek, Laurentiu", "bbox": {"l": 333.39099, "t": 699.387367, "r": 558.20001, "b": 705.900894, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {"0": {"label": "table", "id": 0, "page_no": 7, "cluster": {"id": 0, "label": "table", "bbox": {"l": 72.6590347290039, "t": 172.48080444335938, "r": 274.83465576171875, "b": 339.8540344238281, "coord_origin": "TOPLEFT"}, "confidence": 0.9892616271972656, "cells": [{"id": 8, "text": "Testing on", "bbox": {"l": 217.74099999999999, "t": 175.01855, "r": 256.26065, "b": 183.39319, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Training on", "bbox": {"l": 89.954002, "t": 185.97655999999995, "r": 133.24379, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "labels", "bbox": {"l": 154.629, "t": 185.97655999999995, "r": 175.47588, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "PLN", "bbox": {"l": 204.69, "t": 185.97655999999995, "r": 220.54260000000002, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "DB", "bbox": {"l": 230.50427000000002, "t": 185.97655999999995, "r": 242.06197, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "DLN", "bbox": {"l": 252.02364, "t": 185.97655999999995, "r": 269.31085, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "PubLayNet (PLN)", "bbox": {"l": 78.530998, "t": 219.25256000000002, "r": 142.56006, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Figure", "bbox": {"l": 154.629, "t": 197.33452999999997, "r": 177.92371, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "96", "bbox": {"l": 208.44701, "t": 197.33452999999997, "r": 216.78575000000004, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "43", "bbox": {"l": 232.1183, "t": 197.33452999999997, "r": 240.45705, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "23", "bbox": {"l": 256.49792, "t": 197.33452999999997, "r": 264.83667, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Sec-header", "bbox": {"l": 154.629, "t": 208.29351999999994, "r": 194.72675, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "87", "bbox": {"l": 208.44701, "t": 208.29351999999994, "r": 216.78575000000004, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "-", "bbox": {"l": 234.77235, "t": 208.29351999999994, "r": 237.80299000000002, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "32", "bbox": {"l": 256.49792, "t": 208.29351999999994, "r": 264.83667, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Table", "bbox": {"l": 154.629, "t": 219.25256000000002, "r": 174.43578, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "95", "bbox": {"l": 208.44701, "t": 219.25256000000002, "r": 216.78575000000004, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "24", "bbox": {"l": 232.1183, "t": 219.25256000000002, "r": 240.45705, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "49", "bbox": {"l": 256.49792, "t": 219.25256000000002, "r": 264.83667, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Text", "bbox": {"l": 154.629, "t": 230.21155, "r": 170.58919, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "96", "bbox": {"l": 208.44701, "t": 230.21155, "r": 216.78575000000004, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "-", "bbox": {"l": 234.77235, "t": 230.21155, "r": 237.80299000000002, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "42", "bbox": {"l": 256.49792, "t": 230.21155, "r": 264.83667, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "total", "bbox": {"l": 154.629, "t": 241.16956000000005, "r": 171.2796, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "93", "bbox": {"l": 208.44701, "t": 241.16956000000005, "r": 216.78575000000004, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "34", "bbox": {"l": 232.1183, "t": 241.16956000000005, "r": 240.45705, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "30", "bbox": {"l": 256.49792, "t": 241.16956000000005, "r": 264.83667, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "DocBank (DB)", "bbox": {"l": 78.530998, "t": 263.48650999999995, "r": 131.19963, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Figure", "bbox": {"l": 154.629, "t": 252.52752999999996, "r": 177.92371, "b": 260.90216, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "77", "bbox": {"l": 208.44701, "t": 252.52752999999996, "r": 216.78575000000004, "b": 260.90216, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "71", "bbox": {"l": 232.1183, "t": 252.52752999999996, "r": 240.45705, "b": 260.90216, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "31", "bbox": {"l": 256.49792, "t": 252.52752999999996, "r": 264.83667, "b": 260.90216, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "Table", "bbox": {"l": 154.629, "t": 263.48650999999995, "r": 174.43578, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "19", "bbox": {"l": 208.44701, "t": 263.48650999999995, "r": 216.78575000000004, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "65", "bbox": {"l": 232.1183, "t": 263.48650999999995, "r": 240.45705, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "22", "bbox": {"l": 256.49792, "t": 263.48650999999995, "r": 264.83667, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "total", "bbox": {"l": 154.629, "t": 274.44556, "r": 171.2796, "b": 282.82016, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "48", "bbox": {"l": 208.44701, "t": 274.44556, "r": 216.78575000000004, "b": 282.82016, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "68", "bbox": {"l": 232.1183, "t": 274.44556, "r": 240.45705, "b": 282.82016, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "27", "bbox": {"l": 256.49792, "t": 274.44556, "r": 264.83667, "b": 282.82016, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "DocLayNet (DLN)", "bbox": {"l": 78.530998, "t": 307.72055, "r": 144.66716, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "Figure", "bbox": {"l": 154.629, "t": 285.80255, "r": 177.92371, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "67", "bbox": {"l": 208.44701, "t": 285.80255, "r": 216.78575000000004, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "51", "bbox": {"l": 232.1183, "t": 285.80255, "r": 240.45705, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "72", "bbox": {"l": 256.49792, "t": 285.80255, "r": 264.83667, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Sec-header", "bbox": {"l": 154.629, "t": 296.76154, "r": 194.72675, "b": 305.13617, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "53", "bbox": {"l": 208.44701, "t": 296.76154, "r": 216.78575000000004, "b": 305.13617, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "-", "bbox": {"l": 234.77235, "t": 296.76154, "r": 237.80299000000002, "b": 305.13617, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "68", "bbox": {"l": 256.49792, "t": 296.76154, "r": 264.83667, "b": 305.13617, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Table", "bbox": {"l": 154.629, "t": 307.72055, "r": 174.43578, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "87", "bbox": {"l": 208.44701, "t": 307.72055, "r": 216.78575000000004, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "43", "bbox": {"l": 232.1183, "t": 307.72055, "r": 240.45705, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "82", "bbox": {"l": 256.49792, "t": 307.72055, "r": 264.83667, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "Text", "bbox": {"l": 154.629, "t": 318.67953, "r": 170.58919, "b": 327.05417, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "77", "bbox": {"l": 208.44701, "t": 318.67953, "r": 216.78575000000004, "b": 327.05417, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "-", "bbox": {"l": 234.77235, "t": 318.67953, "r": 237.80299000000002, "b": 327.05417, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "84", "bbox": {"l": 256.49792, "t": 318.67953, "r": 264.83667, "b": 327.05417, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "total", "bbox": {"l": 154.629, "t": 329.63855, "r": 171.2796, "b": 338.01318, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "59", "bbox": {"l": 208.44701, "t": 329.63855, "r": 216.78575000000004, "b": 338.01318, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "47", "bbox": {"l": 232.1183, "t": 329.63855, "r": 240.45705, "b": 338.01318, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "78", "bbox": {"l": 256.49792, "t": 329.63855, "r": 264.83667, "b": 338.01318, "coord_origin": "TOPLEFT"}}], "children": [{"id": 25, "label": "text", "bbox": {"l": 217.74099999999999, "t": 175.01855, "r": 256.26065, "b": 183.39319, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "Testing on", "bbox": {"l": 217.74099999999999, "t": 175.01855, "r": 256.26065, "b": 183.39319, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 89.954002, "t": 185.97655999999995, "r": 133.24379, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "Training on", "bbox": {"l": 89.954002, "t": 185.97655999999995, "r": 133.24379, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 154.629, "t": 185.97655999999995, "r": 175.47588, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "labels", "bbox": {"l": 154.629, "t": 185.97655999999995, "r": 175.47588, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 204.69, "t": 185.97655999999995, "r": 220.54260000000002, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "PLN", "bbox": {"l": 204.69, "t": 185.97655999999995, "r": 220.54260000000002, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 230.50427000000002, "t": 185.97655999999995, "r": 242.06197, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "DB", "bbox": {"l": 230.50427000000002, "t": 185.97655999999995, "r": 242.06197, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 252.02364, "t": 185.97655999999995, "r": 269.31085, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "DLN", "bbox": {"l": 252.02364, "t": 185.97655999999995, "r": 269.31085, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 78.530998, "t": 219.25256000000002, "r": 142.56006, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "PubLayNet (PLN)", "bbox": {"l": 78.530998, "t": 219.25256000000002, "r": 142.56006, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 154.629, "t": 197.33452999999997, "r": 177.92371, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "Figure", "bbox": {"l": 154.629, "t": 197.33452999999997, "r": 177.92371, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 208.44701, "t": 197.33452999999997, "r": 216.78575000000004, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "96", "bbox": {"l": 208.44701, "t": 197.33452999999997, "r": 216.78575000000004, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 232.1183, "t": 197.33452999999997, "r": 240.45705, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "43", "bbox": {"l": 232.1183, "t": 197.33452999999997, "r": 240.45705, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 256.49792, "t": 197.33452999999997, "r": 264.83667, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "23", "bbox": {"l": 256.49792, "t": 197.33452999999997, "r": 264.83667, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 154.629, "t": 208.29351999999994, "r": 194.72675, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "Sec-header", "bbox": {"l": 154.629, "t": 208.29351999999994, "r": 194.72675, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 208.44701, "t": 208.29351999999994, "r": 216.78575000000004, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "87", "bbox": {"l": 208.44701, "t": 208.29351999999994, "r": 216.78575000000004, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 234.77235, "t": 208.29351999999994, "r": 237.80299000000002, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "-", "bbox": {"l": 234.77235, "t": 208.29351999999994, "r": 237.80299000000002, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 256.49792, "t": 208.29351999999994, "r": 264.83667, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "32", "bbox": {"l": 256.49792, "t": 208.29351999999994, "r": 264.83667, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 154.629, "t": 219.25256000000002, "r": 174.43578, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "Table", "bbox": {"l": 154.629, "t": 219.25256000000002, "r": 174.43578, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 208.44701, "t": 219.25256000000002, "r": 216.78575000000004, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "95", "bbox": {"l": 208.44701, "t": 219.25256000000002, "r": 216.78575000000004, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 232.1183, "t": 219.25256000000002, "r": 240.45705, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "24", "bbox": {"l": 232.1183, "t": 219.25256000000002, "r": 240.45705, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 256.49792, "t": 219.25256000000002, "r": 264.83667, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "49", "bbox": {"l": 256.49792, "t": 219.25256000000002, "r": 264.83667, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 154.629, "t": 230.21155, "r": 170.58919, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "Text", "bbox": {"l": 154.629, "t": 230.21155, "r": 170.58919, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 208.44701, "t": 230.21155, "r": 216.78575000000004, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "96", "bbox": {"l": 208.44701, "t": 230.21155, "r": 216.78575000000004, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 234.77235, "t": 230.21155, "r": 237.80299000000002, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "-", "bbox": {"l": 234.77235, "t": 230.21155, "r": 237.80299000000002, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 256.49792, "t": 230.21155, "r": 264.83667, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "42", "bbox": {"l": 256.49792, "t": 230.21155, "r": 264.83667, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 154.629, "t": 241.16956000000005, "r": 171.2796, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "total", "bbox": {"l": 154.629, "t": 241.16956000000005, "r": 171.2796, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 208.44701, "t": 241.16956000000005, "r": 216.78575000000004, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "93", "bbox": {"l": 208.44701, "t": 241.16956000000005, "r": 216.78575000000004, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 232.1183, "t": 241.16956000000005, "r": 240.45705, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "34", "bbox": {"l": 232.1183, "t": 241.16956000000005, "r": 240.45705, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 256.49792, "t": 241.16956000000005, "r": 264.83667, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "30", "bbox": {"l": 256.49792, "t": 241.16956000000005, "r": 264.83667, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 78.530998, "t": 263.48650999999995, "r": 131.19963, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "DocBank (DB)", "bbox": {"l": 78.530998, "t": 263.48650999999995, "r": 131.19963, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 154.629, "t": 252.52752999999996, "r": 177.92371, "b": 260.90216, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "Figure", "bbox": {"l": 154.629, "t": 252.52752999999996, "r": 177.92371, "b": 260.90216, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 208.44701, "t": 252.52752999999996, "r": 216.78575000000004, "b": 260.90216, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "77", "bbox": {"l": 208.44701, "t": 252.52752999999996, "r": 216.78575000000004, "b": 260.90216, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 232.1183, "t": 252.52752999999996, "r": 240.45705, "b": 260.90216, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "71", "bbox": {"l": 232.1183, "t": 252.52752999999996, "r": 240.45705, "b": 260.90216, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 256.49792, "t": 252.52752999999996, "r": 264.83667, "b": 260.90216, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "31", "bbox": {"l": 256.49792, "t": 252.52752999999996, "r": 264.83667, "b": 260.90216, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 154.629, "t": 263.48650999999995, "r": 174.43578, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "Table", "bbox": {"l": 154.629, "t": 263.48650999999995, "r": 174.43578, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 208.44701, "t": 263.48650999999995, "r": 216.78575000000004, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "19", "bbox": {"l": 208.44701, "t": 263.48650999999995, "r": 216.78575000000004, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 232.1183, "t": 263.48650999999995, "r": 240.45705, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "65", "bbox": {"l": 232.1183, "t": 263.48650999999995, "r": 240.45705, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 256.49792, "t": 263.48650999999995, "r": 264.83667, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "22", "bbox": {"l": 256.49792, "t": 263.48650999999995, "r": 264.83667, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 154.629, "t": 274.44556, "r": 171.2796, "b": 282.82016, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "total", "bbox": {"l": 154.629, "t": 274.44556, "r": 171.2796, "b": 282.82016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 208.44701, "t": 274.44556, "r": 216.78575000000004, "b": 282.82016, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "48", "bbox": {"l": 208.44701, "t": 274.44556, "r": 216.78575000000004, "b": 282.82016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 232.1183, "t": 274.44556, "r": 240.45705, "b": 282.82016, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "68", "bbox": {"l": 232.1183, "t": 274.44556, "r": 240.45705, "b": 282.82016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 256.49792, "t": 274.44556, "r": 264.83667, "b": 282.82016, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "27", "bbox": {"l": 256.49792, "t": 274.44556, "r": 264.83667, "b": 282.82016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 78.530998, "t": 307.72055, "r": 144.66716, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "DocLayNet (DLN)", "bbox": {"l": 78.530998, "t": 307.72055, "r": 144.66716, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 154.629, "t": 285.80255, "r": 177.92371, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "Figure", "bbox": {"l": 154.629, "t": 285.80255, "r": 177.92371, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 208.44701, "t": 285.80255, "r": 216.78575000000004, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "67", "bbox": {"l": 208.44701, "t": 285.80255, "r": 216.78575000000004, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 232.1183, "t": 285.80255, "r": 240.45705, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "51", "bbox": {"l": 232.1183, "t": 285.80255, "r": 240.45705, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 256.49792, "t": 285.80255, "r": 264.83667, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "72", "bbox": {"l": 256.49792, "t": 285.80255, "r": 264.83667, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 154.629, "t": 296.76154, "r": 194.72675, "b": 305.13617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "Sec-header", "bbox": {"l": 154.629, "t": 296.76154, "r": 194.72675, "b": 305.13617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 208.44701, "t": 296.76154, "r": 216.78575000000004, "b": 305.13617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "53", "bbox": {"l": 208.44701, "t": 296.76154, "r": 216.78575000000004, "b": 305.13617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 234.77235, "t": 296.76154, "r": 237.80299000000002, "b": 305.13617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "-", "bbox": {"l": 234.77235, "t": 296.76154, "r": 237.80299000000002, "b": 305.13617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 256.49792, "t": 296.76154, "r": 264.83667, "b": 305.13617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "68", "bbox": {"l": 256.49792, "t": 296.76154, "r": 264.83667, "b": 305.13617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 154.629, "t": 307.72055, "r": 174.43578, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "Table", "bbox": {"l": 154.629, "t": 307.72055, "r": 174.43578, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 208.44701, "t": 307.72055, "r": 216.78575000000004, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "87", "bbox": {"l": 208.44701, "t": 307.72055, "r": 216.78575000000004, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 232.1183, "t": 307.72055, "r": 240.45705, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "43", "bbox": {"l": 232.1183, "t": 307.72055, "r": 240.45705, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 256.49792, "t": 307.72055, "r": 264.83667, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "82", "bbox": {"l": 256.49792, "t": 307.72055, "r": 264.83667, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 154.629, "t": 318.67953, "r": 170.58919, "b": 327.05417, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "Text", "bbox": {"l": 154.629, "t": 318.67953, "r": 170.58919, "b": 327.05417, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 208.44701, "t": 318.67953, "r": 216.78575000000004, "b": 327.05417, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "77", "bbox": {"l": 208.44701, "t": 318.67953, "r": 216.78575000000004, "b": 327.05417, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 234.77235, "t": 318.67953, "r": 237.80299000000002, "b": 327.05417, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "-", "bbox": {"l": 234.77235, "t": 318.67953, "r": 237.80299000000002, "b": 327.05417, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 256.49792, "t": 318.67953, "r": 264.83667, "b": 327.05417, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "84", "bbox": {"l": 256.49792, "t": 318.67953, "r": 264.83667, "b": 327.05417, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 154.629, "t": 329.63855, "r": 171.2796, "b": 338.01318, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "total", "bbox": {"l": 154.629, "t": 329.63855, "r": 171.2796, "b": 338.01318, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 208.44701, "t": 329.63855, "r": 216.78575000000004, "b": 338.01318, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "59", "bbox": {"l": 208.44701, "t": 329.63855, "r": 216.78575000000004, "b": 338.01318, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 232.1183, "t": 329.63855, "r": 240.45705, "b": 338.01318, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "47", "bbox": {"l": 232.1183, "t": 329.63855, "r": 240.45705, "b": 338.01318, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 256.49792, "t": 329.63855, "r": 264.83667, "b": 338.01318, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "78", "bbox": {"l": 256.49792, "t": 329.63855, "r": 264.83667, "b": 338.01318, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "lcel", "lcel", "nl", "ched", "ched", "ched", "ched", "ched", "nl", "rhed", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl", "rhed", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl", "rhed", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl"], "num_rows": 15, "num_cols": 5, "table_cells": [{"bbox": {"l": 217.74099999999999, "t": 175.01855, "r": 256.26065, "b": 183.39319, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 3, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 5, "text": "Testing on", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 89.954002, "t": 185.97655999999995, "r": 133.24379, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Training on", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 185.97655999999995, "r": 175.47588, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "labels", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 204.69, "t": 185.97655999999995, "r": 220.54260000000002, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "PLN", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 230.50427000000002, "t": 185.97655999999995, "r": 242.06197, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "DB", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 252.02364, "t": 185.97655999999995, "r": 269.31085, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "DLN", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 78.530998, "t": 219.25256000000002, "r": 142.56006, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 5, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PubLayNet (PLN)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 154.629, "t": 197.33452999999997, "r": 177.92371, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Figure", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 197.33452999999997, "r": 216.78575000000004, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 197.33452999999997, "r": 240.45705, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "43", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 197.33452999999997, "r": 264.83667, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "23", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 208.29351999999994, "r": 194.72675, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Sec-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 208.29351999999994, "r": 216.78575000000004, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "87", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 234.77235, "t": 208.29351999999994, "r": 237.80299000000002, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 208.29351999999994, "r": 264.83667, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "32", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 219.25256000000002, "r": 174.43578, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 219.25256000000002, "r": 216.78575000000004, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "95", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 219.25256000000002, "r": 240.45705, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "24", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 219.25256000000002, "r": 264.83667, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "49", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 230.21155, "r": 170.58919, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Text", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 230.21155, "r": 216.78575000000004, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 234.77235, "t": 230.21155, "r": 237.80299000000002, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 230.21155, "r": 264.83667, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "42", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 241.16956000000005, "r": 171.2796, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "total", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 241.16956000000005, "r": 216.78575000000004, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "93", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 241.16956000000005, "r": 240.45705, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "34", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 241.16956000000005, "r": 264.83667, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "30", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 78.530998, "t": 263.48650999999995, "r": 131.19963, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "row_span": 3, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "DocBank (DB)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 154.629, "t": 252.52752999999996, "r": 177.92371, "b": 260.90216, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Figure", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 252.52752999999996, "r": 216.78575000000004, "b": 260.90216, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 252.52752999999996, "r": 240.45705, "b": 260.90216, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "71", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 252.52752999999996, "r": 264.83667, "b": 260.90216, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "31", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 263.48650999999995, "r": 174.43578, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 263.48650999999995, "r": 216.78575000000004, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "19", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 263.48650999999995, "r": 240.45705, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "65", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 263.48650999999995, "r": 264.83667, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "22", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 274.44556, "r": 171.2796, "b": 282.82016, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "total", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 274.44556, "r": 216.78575000000004, "b": 282.82016, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "48", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 274.44556, "r": 240.45705, "b": 282.82016, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 274.44556, "r": 264.83667, "b": 282.82016, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "27", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 78.530998, "t": 307.72055, "r": 144.66716, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "row_span": 5, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 15, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "DocLayNet (DLN)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 154.629, "t": 285.80255, "r": 177.92371, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Figure", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 285.80255, "r": 216.78575000000004, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "67", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 285.80255, "r": 240.45705, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "51", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 285.80255, "r": 264.83667, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 296.76154, "r": 194.72675, "b": 305.13617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Sec-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 296.76154, "r": 216.78575000000004, "b": 305.13617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "53", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 234.77235, "t": 296.76154, "r": 237.80299000000002, "b": 305.13617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 296.76154, "r": 264.83667, "b": 305.13617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 307.72055, "r": 174.43578, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 307.72055, "r": 216.78575000000004, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "87", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 307.72055, "r": 240.45705, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "43", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 307.72055, "r": 264.83667, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 318.67953, "r": 170.58919, "b": 327.05417, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Text", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 318.67953, "r": 216.78575000000004, "b": 327.05417, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 234.77235, "t": 318.67953, "r": 237.80299000000002, "b": 327.05417, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 318.67953, "r": 264.83667, "b": 327.05417, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 329.63855, "r": 171.2796, "b": 338.01318, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 14, "end_row_offset_idx": 15, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "total", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 329.63855, "r": 216.78575000000004, "b": 338.01318, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 14, "end_row_offset_idx": 15, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "59", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 329.63855, "r": 240.45705, "b": 338.01318, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 14, "end_row_offset_idx": 15, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "47", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 329.63855, "r": 264.83667, "b": 338.01318, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 14, "end_row_offset_idx": 15, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "78", "column_header": false, "row_header": false, "row_section": false}]}}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_header", "id": 24, "page_no": 7, "cluster": {"id": 24, "label": "page_header", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.7984216809272766, "cells": [{"id": 0, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 246.24382, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar", "bbox": {"l": 253.13897999999998, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "KDD '22, August 14-18, 2022, Washington, DC, USA Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar"}, {"label": "text", "id": 5, "page_no": 7, "cluster": {"id": 5, "label": "text", "bbox": {"l": 53.501999, "t": 86.87292000000002, "r": 295.64868, "b": 150.14111000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9824112057685852, "cells": [{"id": 2, "text": "Table 5: Prediction Performance (mAP@0.5-0.95) of a Mask", "bbox": {"l": 53.501999, "t": 86.87292000000002, "r": 294.32153, "b": 95.34618999999998, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "R-CNN R50 network across the PubLayNet, DocBank & Do-", "bbox": {"l": 53.79800000000001, "t": 97.83191, "r": 295.64868, "b": 106.30517999999995, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "cLayNet data-sets. By evaluating on common label classes of", "bbox": {"l": 53.79800000000001, "t": 108.79088999999999, "r": 294.0437, "b": 117.26415999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "each dataset, we observe that the DocLayNet-trained model", "bbox": {"l": 53.79800000000001, "t": 119.74987999999996, "r": 294.04373, "b": 128.22313999999994, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "has much less pronounced variations in performance across", "bbox": {"l": 53.79800000000001, "t": 130.70885999999996, "r": 294.0437, "b": 139.18213000000003, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "all datasets.", "bbox": {"l": 53.79800000000001, "t": 141.66785000000004, "r": 101.15852, "b": 150.14111000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 5: Prediction Performance (mAP@0.5-0.95) of a Mask R-CNN R50 network across the PubLayNet, DocBank & DocLayNet data-sets. By evaluating on common label classes of each dataset, we observe that the DocLayNet-trained model has much less pronounced variations in performance across all datasets."}, {"label": "table", "id": 0, "page_no": 7, "cluster": {"id": 0, "label": "table", "bbox": {"l": 72.6590347290039, "t": 172.48080444335938, "r": 274.83465576171875, "b": 339.8540344238281, "coord_origin": "TOPLEFT"}, "confidence": 0.9892616271972656, "cells": [{"id": 8, "text": "Testing on", "bbox": {"l": 217.74099999999999, "t": 175.01855, "r": 256.26065, "b": 183.39319, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Training on", "bbox": {"l": 89.954002, "t": 185.97655999999995, "r": 133.24379, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "labels", "bbox": {"l": 154.629, "t": 185.97655999999995, "r": 175.47588, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "PLN", "bbox": {"l": 204.69, "t": 185.97655999999995, "r": 220.54260000000002, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "DB", "bbox": {"l": 230.50427000000002, "t": 185.97655999999995, "r": 242.06197, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "DLN", "bbox": {"l": 252.02364, "t": 185.97655999999995, "r": 269.31085, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "PubLayNet (PLN)", "bbox": {"l": 78.530998, "t": 219.25256000000002, "r": 142.56006, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Figure", "bbox": {"l": 154.629, "t": 197.33452999999997, "r": 177.92371, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "96", "bbox": {"l": 208.44701, "t": 197.33452999999997, "r": 216.78575000000004, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "43", "bbox": {"l": 232.1183, "t": 197.33452999999997, "r": 240.45705, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "23", "bbox": {"l": 256.49792, "t": 197.33452999999997, "r": 264.83667, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Sec-header", "bbox": {"l": 154.629, "t": 208.29351999999994, "r": 194.72675, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "87", "bbox": {"l": 208.44701, "t": 208.29351999999994, "r": 216.78575000000004, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "-", "bbox": {"l": 234.77235, "t": 208.29351999999994, "r": 237.80299000000002, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "32", "bbox": {"l": 256.49792, "t": 208.29351999999994, "r": 264.83667, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Table", "bbox": {"l": 154.629, "t": 219.25256000000002, "r": 174.43578, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "95", "bbox": {"l": 208.44701, "t": 219.25256000000002, "r": 216.78575000000004, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "24", "bbox": {"l": 232.1183, "t": 219.25256000000002, "r": 240.45705, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "49", "bbox": {"l": 256.49792, "t": 219.25256000000002, "r": 264.83667, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Text", "bbox": {"l": 154.629, "t": 230.21155, "r": 170.58919, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "96", "bbox": {"l": 208.44701, "t": 230.21155, "r": 216.78575000000004, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "-", "bbox": {"l": 234.77235, "t": 230.21155, "r": 237.80299000000002, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "42", "bbox": {"l": 256.49792, "t": 230.21155, "r": 264.83667, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "total", "bbox": {"l": 154.629, "t": 241.16956000000005, "r": 171.2796, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "93", "bbox": {"l": 208.44701, "t": 241.16956000000005, "r": 216.78575000000004, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "34", "bbox": {"l": 232.1183, "t": 241.16956000000005, "r": 240.45705, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "30", "bbox": {"l": 256.49792, "t": 241.16956000000005, "r": 264.83667, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "DocBank (DB)", "bbox": {"l": 78.530998, "t": 263.48650999999995, "r": 131.19963, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Figure", "bbox": {"l": 154.629, "t": 252.52752999999996, "r": 177.92371, "b": 260.90216, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "77", "bbox": {"l": 208.44701, "t": 252.52752999999996, "r": 216.78575000000004, "b": 260.90216, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "71", "bbox": {"l": 232.1183, "t": 252.52752999999996, "r": 240.45705, "b": 260.90216, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "31", "bbox": {"l": 256.49792, "t": 252.52752999999996, "r": 264.83667, "b": 260.90216, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "Table", "bbox": {"l": 154.629, "t": 263.48650999999995, "r": 174.43578, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "19", "bbox": {"l": 208.44701, "t": 263.48650999999995, "r": 216.78575000000004, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "65", "bbox": {"l": 232.1183, "t": 263.48650999999995, "r": 240.45705, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "22", "bbox": {"l": 256.49792, "t": 263.48650999999995, "r": 264.83667, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "total", "bbox": {"l": 154.629, "t": 274.44556, "r": 171.2796, "b": 282.82016, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "48", "bbox": {"l": 208.44701, "t": 274.44556, "r": 216.78575000000004, "b": 282.82016, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "68", "bbox": {"l": 232.1183, "t": 274.44556, "r": 240.45705, "b": 282.82016, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "27", "bbox": {"l": 256.49792, "t": 274.44556, "r": 264.83667, "b": 282.82016, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "DocLayNet (DLN)", "bbox": {"l": 78.530998, "t": 307.72055, "r": 144.66716, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "Figure", "bbox": {"l": 154.629, "t": 285.80255, "r": 177.92371, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "67", "bbox": {"l": 208.44701, "t": 285.80255, "r": 216.78575000000004, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "51", "bbox": {"l": 232.1183, "t": 285.80255, "r": 240.45705, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "72", "bbox": {"l": 256.49792, "t": 285.80255, "r": 264.83667, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Sec-header", "bbox": {"l": 154.629, "t": 296.76154, "r": 194.72675, "b": 305.13617, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "53", "bbox": {"l": 208.44701, "t": 296.76154, "r": 216.78575000000004, "b": 305.13617, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "-", "bbox": {"l": 234.77235, "t": 296.76154, "r": 237.80299000000002, "b": 305.13617, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "68", "bbox": {"l": 256.49792, "t": 296.76154, "r": 264.83667, "b": 305.13617, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Table", "bbox": {"l": 154.629, "t": 307.72055, "r": 174.43578, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "87", "bbox": {"l": 208.44701, "t": 307.72055, "r": 216.78575000000004, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "43", "bbox": {"l": 232.1183, "t": 307.72055, "r": 240.45705, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "82", "bbox": {"l": 256.49792, "t": 307.72055, "r": 264.83667, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "Text", "bbox": {"l": 154.629, "t": 318.67953, "r": 170.58919, "b": 327.05417, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "77", "bbox": {"l": 208.44701, "t": 318.67953, "r": 216.78575000000004, "b": 327.05417, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "-", "bbox": {"l": 234.77235, "t": 318.67953, "r": 237.80299000000002, "b": 327.05417, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "84", "bbox": {"l": 256.49792, "t": 318.67953, "r": 264.83667, "b": 327.05417, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "total", "bbox": {"l": 154.629, "t": 329.63855, "r": 171.2796, "b": 338.01318, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "59", "bbox": {"l": 208.44701, "t": 329.63855, "r": 216.78575000000004, "b": 338.01318, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "47", "bbox": {"l": 232.1183, "t": 329.63855, "r": 240.45705, "b": 338.01318, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "78", "bbox": {"l": 256.49792, "t": 329.63855, "r": 264.83667, "b": 338.01318, "coord_origin": "TOPLEFT"}}], "children": [{"id": 25, "label": "text", "bbox": {"l": 217.74099999999999, "t": 175.01855, "r": 256.26065, "b": 183.39319, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "Testing on", "bbox": {"l": 217.74099999999999, "t": 175.01855, "r": 256.26065, "b": 183.39319, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 89.954002, "t": 185.97655999999995, "r": 133.24379, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "Training on", "bbox": {"l": 89.954002, "t": 185.97655999999995, "r": 133.24379, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 154.629, "t": 185.97655999999995, "r": 175.47588, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "labels", "bbox": {"l": 154.629, "t": 185.97655999999995, "r": 175.47588, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 204.69, "t": 185.97655999999995, "r": 220.54260000000002, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "PLN", "bbox": {"l": 204.69, "t": 185.97655999999995, "r": 220.54260000000002, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 230.50427000000002, "t": 185.97655999999995, "r": 242.06197, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "DB", "bbox": {"l": 230.50427000000002, "t": 185.97655999999995, "r": 242.06197, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 252.02364, "t": 185.97655999999995, "r": 269.31085, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "DLN", "bbox": {"l": 252.02364, "t": 185.97655999999995, "r": 269.31085, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 78.530998, "t": 219.25256000000002, "r": 142.56006, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "PubLayNet (PLN)", "bbox": {"l": 78.530998, "t": 219.25256000000002, "r": 142.56006, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 154.629, "t": 197.33452999999997, "r": 177.92371, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "Figure", "bbox": {"l": 154.629, "t": 197.33452999999997, "r": 177.92371, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 208.44701, "t": 197.33452999999997, "r": 216.78575000000004, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "96", "bbox": {"l": 208.44701, "t": 197.33452999999997, "r": 216.78575000000004, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 232.1183, "t": 197.33452999999997, "r": 240.45705, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "43", "bbox": {"l": 232.1183, "t": 197.33452999999997, "r": 240.45705, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 256.49792, "t": 197.33452999999997, "r": 264.83667, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "23", "bbox": {"l": 256.49792, "t": 197.33452999999997, "r": 264.83667, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 154.629, "t": 208.29351999999994, "r": 194.72675, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "Sec-header", "bbox": {"l": 154.629, "t": 208.29351999999994, "r": 194.72675, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 208.44701, "t": 208.29351999999994, "r": 216.78575000000004, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "87", "bbox": {"l": 208.44701, "t": 208.29351999999994, "r": 216.78575000000004, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 234.77235, "t": 208.29351999999994, "r": 237.80299000000002, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "-", "bbox": {"l": 234.77235, "t": 208.29351999999994, "r": 237.80299000000002, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 256.49792, "t": 208.29351999999994, "r": 264.83667, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "32", "bbox": {"l": 256.49792, "t": 208.29351999999994, "r": 264.83667, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 154.629, "t": 219.25256000000002, "r": 174.43578, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "Table", "bbox": {"l": 154.629, "t": 219.25256000000002, "r": 174.43578, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 208.44701, "t": 219.25256000000002, "r": 216.78575000000004, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "95", "bbox": {"l": 208.44701, "t": 219.25256000000002, "r": 216.78575000000004, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 232.1183, "t": 219.25256000000002, "r": 240.45705, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "24", "bbox": {"l": 232.1183, "t": 219.25256000000002, "r": 240.45705, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 256.49792, "t": 219.25256000000002, "r": 264.83667, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "49", "bbox": {"l": 256.49792, "t": 219.25256000000002, "r": 264.83667, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 154.629, "t": 230.21155, "r": 170.58919, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "Text", "bbox": {"l": 154.629, "t": 230.21155, "r": 170.58919, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 208.44701, "t": 230.21155, "r": 216.78575000000004, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "96", "bbox": {"l": 208.44701, "t": 230.21155, "r": 216.78575000000004, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 234.77235, "t": 230.21155, "r": 237.80299000000002, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "-", "bbox": {"l": 234.77235, "t": 230.21155, "r": 237.80299000000002, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 256.49792, "t": 230.21155, "r": 264.83667, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "42", "bbox": {"l": 256.49792, "t": 230.21155, "r": 264.83667, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 154.629, "t": 241.16956000000005, "r": 171.2796, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "total", "bbox": {"l": 154.629, "t": 241.16956000000005, "r": 171.2796, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 208.44701, "t": 241.16956000000005, "r": 216.78575000000004, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "93", "bbox": {"l": 208.44701, "t": 241.16956000000005, "r": 216.78575000000004, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 232.1183, "t": 241.16956000000005, "r": 240.45705, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "34", "bbox": {"l": 232.1183, "t": 241.16956000000005, "r": 240.45705, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 256.49792, "t": 241.16956000000005, "r": 264.83667, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "30", "bbox": {"l": 256.49792, "t": 241.16956000000005, "r": 264.83667, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 78.530998, "t": 263.48650999999995, "r": 131.19963, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "DocBank (DB)", "bbox": {"l": 78.530998, "t": 263.48650999999995, "r": 131.19963, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 154.629, "t": 252.52752999999996, "r": 177.92371, "b": 260.90216, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "Figure", "bbox": {"l": 154.629, "t": 252.52752999999996, "r": 177.92371, "b": 260.90216, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 208.44701, "t": 252.52752999999996, "r": 216.78575000000004, "b": 260.90216, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "77", "bbox": {"l": 208.44701, "t": 252.52752999999996, "r": 216.78575000000004, "b": 260.90216, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 232.1183, "t": 252.52752999999996, "r": 240.45705, "b": 260.90216, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "71", "bbox": {"l": 232.1183, "t": 252.52752999999996, "r": 240.45705, "b": 260.90216, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 256.49792, "t": 252.52752999999996, "r": 264.83667, "b": 260.90216, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "31", "bbox": {"l": 256.49792, "t": 252.52752999999996, "r": 264.83667, "b": 260.90216, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 154.629, "t": 263.48650999999995, "r": 174.43578, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "Table", "bbox": {"l": 154.629, "t": 263.48650999999995, "r": 174.43578, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 208.44701, "t": 263.48650999999995, "r": 216.78575000000004, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "19", "bbox": {"l": 208.44701, "t": 263.48650999999995, "r": 216.78575000000004, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 232.1183, "t": 263.48650999999995, "r": 240.45705, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "65", "bbox": {"l": 232.1183, "t": 263.48650999999995, "r": 240.45705, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 256.49792, "t": 263.48650999999995, "r": 264.83667, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "22", "bbox": {"l": 256.49792, "t": 263.48650999999995, "r": 264.83667, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 154.629, "t": 274.44556, "r": 171.2796, "b": 282.82016, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "total", "bbox": {"l": 154.629, "t": 274.44556, "r": 171.2796, "b": 282.82016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 208.44701, "t": 274.44556, "r": 216.78575000000004, "b": 282.82016, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "48", "bbox": {"l": 208.44701, "t": 274.44556, "r": 216.78575000000004, "b": 282.82016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 232.1183, "t": 274.44556, "r": 240.45705, "b": 282.82016, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "68", "bbox": {"l": 232.1183, "t": 274.44556, "r": 240.45705, "b": 282.82016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 256.49792, "t": 274.44556, "r": 264.83667, "b": 282.82016, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "27", "bbox": {"l": 256.49792, "t": 274.44556, "r": 264.83667, "b": 282.82016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 78.530998, "t": 307.72055, "r": 144.66716, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "DocLayNet (DLN)", "bbox": {"l": 78.530998, "t": 307.72055, "r": 144.66716, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 154.629, "t": 285.80255, "r": 177.92371, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "Figure", "bbox": {"l": 154.629, "t": 285.80255, "r": 177.92371, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 208.44701, "t": 285.80255, "r": 216.78575000000004, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "67", "bbox": {"l": 208.44701, "t": 285.80255, "r": 216.78575000000004, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 232.1183, "t": 285.80255, "r": 240.45705, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "51", "bbox": {"l": 232.1183, "t": 285.80255, "r": 240.45705, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 256.49792, "t": 285.80255, "r": 264.83667, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "72", "bbox": {"l": 256.49792, "t": 285.80255, "r": 264.83667, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 154.629, "t": 296.76154, "r": 194.72675, "b": 305.13617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "Sec-header", "bbox": {"l": 154.629, "t": 296.76154, "r": 194.72675, "b": 305.13617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 208.44701, "t": 296.76154, "r": 216.78575000000004, "b": 305.13617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "53", "bbox": {"l": 208.44701, "t": 296.76154, "r": 216.78575000000004, "b": 305.13617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 234.77235, "t": 296.76154, "r": 237.80299000000002, "b": 305.13617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "-", "bbox": {"l": 234.77235, "t": 296.76154, "r": 237.80299000000002, "b": 305.13617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 256.49792, "t": 296.76154, "r": 264.83667, "b": 305.13617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "68", "bbox": {"l": 256.49792, "t": 296.76154, "r": 264.83667, "b": 305.13617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 154.629, "t": 307.72055, "r": 174.43578, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "Table", "bbox": {"l": 154.629, "t": 307.72055, "r": 174.43578, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 208.44701, "t": 307.72055, "r": 216.78575000000004, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "87", "bbox": {"l": 208.44701, "t": 307.72055, "r": 216.78575000000004, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 232.1183, "t": 307.72055, "r": 240.45705, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "43", "bbox": {"l": 232.1183, "t": 307.72055, "r": 240.45705, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 256.49792, "t": 307.72055, "r": 264.83667, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "82", "bbox": {"l": 256.49792, "t": 307.72055, "r": 264.83667, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 154.629, "t": 318.67953, "r": 170.58919, "b": 327.05417, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "Text", "bbox": {"l": 154.629, "t": 318.67953, "r": 170.58919, "b": 327.05417, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 208.44701, "t": 318.67953, "r": 216.78575000000004, "b": 327.05417, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "77", "bbox": {"l": 208.44701, "t": 318.67953, "r": 216.78575000000004, "b": 327.05417, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 234.77235, "t": 318.67953, "r": 237.80299000000002, "b": 327.05417, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "-", "bbox": {"l": 234.77235, "t": 318.67953, "r": 237.80299000000002, "b": 327.05417, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 256.49792, "t": 318.67953, "r": 264.83667, "b": 327.05417, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "84", "bbox": {"l": 256.49792, "t": 318.67953, "r": 264.83667, "b": 327.05417, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 154.629, "t": 329.63855, "r": 171.2796, "b": 338.01318, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "total", "bbox": {"l": 154.629, "t": 329.63855, "r": 171.2796, "b": 338.01318, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 208.44701, "t": 329.63855, "r": 216.78575000000004, "b": 338.01318, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "59", "bbox": {"l": 208.44701, "t": 329.63855, "r": 216.78575000000004, "b": 338.01318, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 232.1183, "t": 329.63855, "r": 240.45705, "b": 338.01318, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "47", "bbox": {"l": 232.1183, "t": 329.63855, "r": 240.45705, "b": 338.01318, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 256.49792, "t": 329.63855, "r": 264.83667, "b": 338.01318, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "78", "bbox": {"l": 256.49792, "t": 329.63855, "r": 264.83667, "b": 338.01318, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "lcel", "lcel", "nl", "ched", "ched", "ched", "ched", "ched", "nl", "rhed", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl", "rhed", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl", "rhed", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl"], "num_rows": 15, "num_cols": 5, "table_cells": [{"bbox": {"l": 217.74099999999999, "t": 175.01855, "r": 256.26065, "b": 183.39319, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 3, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 5, "text": "Testing on", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 89.954002, "t": 185.97655999999995, "r": 133.24379, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Training on", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 185.97655999999995, "r": 175.47588, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "labels", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 204.69, "t": 185.97655999999995, "r": 220.54260000000002, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "PLN", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 230.50427000000002, "t": 185.97655999999995, "r": 242.06197, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "DB", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 252.02364, "t": 185.97655999999995, "r": 269.31085, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "DLN", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 78.530998, "t": 219.25256000000002, "r": 142.56006, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 5, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PubLayNet (PLN)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 154.629, "t": 197.33452999999997, "r": 177.92371, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Figure", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 197.33452999999997, "r": 216.78575000000004, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 197.33452999999997, "r": 240.45705, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "43", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 197.33452999999997, "r": 264.83667, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "23", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 208.29351999999994, "r": 194.72675, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Sec-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 208.29351999999994, "r": 216.78575000000004, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "87", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 234.77235, "t": 208.29351999999994, "r": 237.80299000000002, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 208.29351999999994, "r": 264.83667, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "32", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 219.25256000000002, "r": 174.43578, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 219.25256000000002, "r": 216.78575000000004, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "95", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 219.25256000000002, "r": 240.45705, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "24", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 219.25256000000002, "r": 264.83667, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "49", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 230.21155, "r": 170.58919, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Text", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 230.21155, "r": 216.78575000000004, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 234.77235, "t": 230.21155, "r": 237.80299000000002, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 230.21155, "r": 264.83667, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "42", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 241.16956000000005, "r": 171.2796, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "total", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 241.16956000000005, "r": 216.78575000000004, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "93", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 241.16956000000005, "r": 240.45705, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "34", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 241.16956000000005, "r": 264.83667, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "30", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 78.530998, "t": 263.48650999999995, "r": 131.19963, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "row_span": 3, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "DocBank (DB)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 154.629, "t": 252.52752999999996, "r": 177.92371, "b": 260.90216, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Figure", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 252.52752999999996, "r": 216.78575000000004, "b": 260.90216, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 252.52752999999996, "r": 240.45705, "b": 260.90216, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "71", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 252.52752999999996, "r": 264.83667, "b": 260.90216, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "31", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 263.48650999999995, "r": 174.43578, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 263.48650999999995, "r": 216.78575000000004, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "19", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 263.48650999999995, "r": 240.45705, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "65", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 263.48650999999995, "r": 264.83667, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "22", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 274.44556, "r": 171.2796, "b": 282.82016, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "total", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 274.44556, "r": 216.78575000000004, "b": 282.82016, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "48", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 274.44556, "r": 240.45705, "b": 282.82016, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 274.44556, "r": 264.83667, "b": 282.82016, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "27", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 78.530998, "t": 307.72055, "r": 144.66716, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "row_span": 5, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 15, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "DocLayNet (DLN)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 154.629, "t": 285.80255, "r": 177.92371, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Figure", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 285.80255, "r": 216.78575000000004, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "67", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 285.80255, "r": 240.45705, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "51", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 285.80255, "r": 264.83667, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 296.76154, "r": 194.72675, "b": 305.13617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Sec-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 296.76154, "r": 216.78575000000004, "b": 305.13617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "53", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 234.77235, "t": 296.76154, "r": 237.80299000000002, "b": 305.13617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 296.76154, "r": 264.83667, "b": 305.13617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 307.72055, "r": 174.43578, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 307.72055, "r": 216.78575000000004, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "87", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 307.72055, "r": 240.45705, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "43", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 307.72055, "r": 264.83667, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 318.67953, "r": 170.58919, "b": 327.05417, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Text", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 318.67953, "r": 216.78575000000004, "b": 327.05417, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 234.77235, "t": 318.67953, "r": 237.80299000000002, "b": 327.05417, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 318.67953, "r": 264.83667, "b": 327.05417, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 329.63855, "r": 171.2796, "b": 338.01318, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 14, "end_row_offset_idx": 15, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "total", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 329.63855, "r": 216.78575000000004, "b": 338.01318, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 14, "end_row_offset_idx": 15, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "59", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 329.63855, "r": 240.45705, "b": 338.01318, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 14, "end_row_offset_idx": 15, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "47", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 329.63855, "r": 264.83667, "b": 338.01318, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 14, "end_row_offset_idx": 15, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "78", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "text", "id": 4, "page_no": 7, "cluster": {"id": 4, "label": "text", "bbox": {"l": 53.79800000000001, "t": 390.92053, "r": 294.04712, "b": 443.14014, "coord_origin": "TOPLEFT"}, "confidence": 0.9839397668838501, "cells": [{"id": 69, "text": "Section-header", "bbox": {"l": 53.79800000000001, "t": 390.96539, "r": 106.2392, "b": 399.30414, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": ",", "bbox": {"l": 106.239, "t": 390.92053, "r": 108.23331, "b": 399.2951699999999, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Table", "bbox": {"l": 110.482, "t": 390.96539, "r": 129.76332, "b": 399.30414, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "and", "bbox": {"l": 132.21899, "t": 390.92053, "r": 145.86186, "b": 399.2951699999999, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "Text", "bbox": {"l": 148.112, "t": 390.96539, "r": 163.14182, "b": 399.30414, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": ". Before training, we either mapped", "bbox": {"l": 163.13901, "t": 390.92053, "r": 294.04709, "b": 399.2951699999999, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "or excluded DocLayNet\u2019s other labels as specified in table 3, and", "bbox": {"l": 53.79800000000001, "t": 401.87954999999994, "r": 294.04712, "b": 410.25418, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "also PubLayNet\u2019s", "bbox": {"l": 53.79800000000001, "t": 412.83853, "r": 117.12856, "b": 421.21317, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "List", "bbox": {"l": 119.362, "t": 412.88339, "r": 132.4342, "b": 421.22214, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "to", "bbox": {"l": 135.177, "t": 412.83853, "r": 142.54416, "b": 421.21317, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "Text", "bbox": {"l": 144.77901, "t": 412.88339, "r": 159.66605, "b": 421.22214, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": ". Note that the different clustering of", "bbox": {"l": 159.66701, "t": 412.83853, "r": 294.04562, "b": 421.21317, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "lists (by list-element vs. whole list objects) naturally decreases the", "bbox": {"l": 53.79800000000001, "t": 423.79755, "r": 294.04614, "b": 432.17217999999997, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "mAP score for", "bbox": {"l": 53.79800000000001, "t": 434.75653, "r": 106.2066, "b": 443.13116, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "Text", "bbox": {"l": 108.448, "t": 434.80139, "r": 123.30533, "b": 443.14014, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": ".", "bbox": {"l": 123.305, "t": 434.75653, "r": 125.27761000000001, "b": 443.13116, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Section-header , Table and Text . Before training, we either mapped or excluded DocLayNet's other labels as specified in table 3, and also PubLayNet's List to Text . Note that the different clustering of lists (by list-element vs. whole list objects) naturally decreases the mAP score for Text ."}, {"label": "text", "id": 1, "page_no": 7, "cluster": {"id": 1, "label": "text", "bbox": {"l": 53.466999, "t": 445.71453999999994, "r": 295.55908, "b": 585.59618, "coord_origin": "TOPLEFT"}, "confidence": 0.9868056774139404, "cells": [{"id": 85, "text": "For comparison of DocBank with DocLayNet, we trained only", "bbox": {"l": 63.76100199999999, "t": 445.71453999999994, "r": 294.27582, "b": 454.08917, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "on", "bbox": {"l": 53.79800000000001, "t": 456.67355, "r": 62.989277, "b": 465.04819, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Picture", "bbox": {"l": 64.852997, "t": 456.71841, "r": 88.947144, "b": 465.05716, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "and", "bbox": {"l": 91.019997, "t": 456.67355, "r": 104.24454, "b": 465.04819, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "Table", "bbox": {"l": 106.108, "t": 456.71841, "r": 124.78053, "b": 465.05716, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "clusters of each dataset. We had to exclude", "bbox": {"l": 126.85500000000002, "t": 456.67355, "r": 277.63235, "b": 465.04819, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "Text", "bbox": {"l": 279.49701, "t": 456.71841, "r": 294.0484, "b": 465.05716, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "because successive paragraphs are often grouped together into a", "bbox": {"l": 53.79800000000001, "t": 467.63254, "r": 294.04709, "b": 476.00717, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "single object in DocBank. This paragraph grouping is incompatible", "bbox": {"l": 53.79800000000001, "t": 478.59155, "r": 294.04532, "b": 486.96619, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "with the individual paragraphs of DocLayNet. As can be seen in", "bbox": {"l": 53.466999, "t": 489.55054, "r": 294.04538, "b": 497.92517, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "Table 5, DocLayNet trained models yield better performance com-", "bbox": {"l": 53.528999, "t": 500.50955, "r": 295.55908, "b": 508.88419, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "pared to the previous datasets. It is noteworthy that the models", "bbox": {"l": 53.79800000000001, "t": 511.46854, "r": 294.04712, "b": 519.84317, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "trained on PubLayNet and DocBank perform very well on their", "bbox": {"l": 53.79800000000001, "t": 522.42755, "r": 294.21179, "b": 530.80219, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "own test set, but have a much lower performance on the foreign", "bbox": {"l": 53.79800000000001, "t": 533.38654, "r": 294.04712, "b": 541.76117, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "datasets. While this also applies to DocLayNet, the difference is", "bbox": {"l": 53.79800000000001, "t": 544.34555, "r": 294.04715, "b": 552.72017, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "far less pronounced. Thus we conclude that DocLayNet trained", "bbox": {"l": 53.79800000000001, "t": 555.3045500000001, "r": 294.04712, "b": 563.67917, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "models are overall more robust and will produce better results for", "bbox": {"l": 53.79800000000001, "t": 566.26256, "r": 294.21411, "b": 574.63718, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "challenging, unseen layouts.", "bbox": {"l": 53.79800000000001, "t": 577.22156, "r": 157.52132, "b": 585.59618, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "For comparison of DocBank with DocLayNet, we trained only on Picture and Table clusters of each dataset. We had to exclude Text because successive paragraphs are often grouped together into a single object in DocBank. This paragraph grouping is incompatible with the individual paragraphs of DocLayNet. As can be seen in Table 5, DocLayNet trained models yield better performance compared to the previous datasets. It is noteworthy that the models trained on PubLayNet and DocBank perform very well on their own test set, but have a much lower performance on the foreign datasets. While this also applies to DocLayNet, the difference is far less pronounced. Thus we conclude that DocLayNet trained models are overall more robust and will produce better results for challenging, unseen layouts."}, {"label": "section_header", "id": 8, "page_no": 7, "cluster": {"id": 8, "label": "section_header", "bbox": {"l": 53.79800000000001, "t": 605.06091, "r": 156.00534, "b": 615.37001, "coord_origin": "TOPLEFT"}, "confidence": 0.9574698805809021, "cells": [{"id": 103, "text": "Example Predictions", "bbox": {"l": 53.79800000000001, "t": 605.06091, "r": 156.00534, "b": 615.37001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Example Predictions"}, {"label": "text", "id": 2, "page_no": 7, "cluster": {"id": 2, "label": "text", "bbox": {"l": 53.528999, "t": 620.26355, "r": 295.55844, "b": 705.350174, "coord_origin": "TOPLEFT"}, "confidence": 0.9859886169433594, "cells": [{"id": 104, "text": "To conclude this section, we illustrate the quality of layout predic-", "bbox": {"l": 53.528999, "t": 620.26355, "r": 295.5571, "b": 628.63817, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "tions one can expect from DocLayNet-trained models by providing", "bbox": {"l": 53.79800000000001, "t": 631.22255, "r": 294.04532, "b": 639.59717, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "a selection of examples without any further post-processing ap-", "bbox": {"l": 53.79800000000001, "t": 642.18155, "r": 295.55618, "b": 650.5561700000001, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "plied. Figure 6 shows selected layout predictions on pages from the", "bbox": {"l": 53.79800000000001, "t": 653.14055, "r": 294.04541, "b": 661.51517, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "test-set of DocLayNet. Results look decent in general across docu-", "bbox": {"l": 53.79800000000001, "t": 664.09956, "r": 295.55844, "b": 672.47417, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "ment categories, however one can also observe mistakes such as", "bbox": {"l": 53.79800000000001, "t": 675.05756, "r": 294.04712, "b": 683.43217, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "overlapping clusters of different classes, or entirely missing boxes", "bbox": {"l": 53.79800000000001, "t": 686.01656, "r": 294.04535, "b": 694.391174, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "due to low confidence.", "bbox": {"l": 53.79800000000001, "t": 696.975555, "r": 136.07368, "b": 705.350174, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "To conclude this section, we illustrate the quality of layout predictions one can expect from DocLayNet-trained models by providing a selection of examples without any further post-processing applied. Figure 6 shows selected layout predictions on pages from the test-set of DocLayNet. Results look decent in general across document categories, however one can also observe mistakes such as overlapping clusters of different classes, or entirely missing boxes due to low confidence."}, {"label": "section_header", "id": 13, "page_no": 7, "cluster": {"id": 13, "label": "section_header", "bbox": {"l": 317.95502, "t": 85.85986000000003, "r": 405.72961, "b": 96.16900999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.931998074054718, "cells": [{"id": 112, "text": "6", "bbox": {"l": 317.95502, "t": 85.85986000000003, "r": 323.56229, "b": 96.16900999999996, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "CONCLUSION", "bbox": {"l": 334.47137, "t": 85.85986000000003, "r": 405.72961, "b": 96.16900999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "6 CONCLUSION"}, {"label": "text", "id": 3, "page_no": 7, "cluster": {"id": 3, "label": "text", "bbox": {"l": 317.95499, "t": 101.06151999999997, "r": 559.71375, "b": 186.14917000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.985493004322052, "cells": [{"id": 114, "text": "In this paper, we presented the DocLayNet dataset. It provides the", "bbox": {"l": 317.95499, "t": 101.06151999999997, "r": 558.2038, "b": 109.43615999999997, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "document conversion and layout analysis research community a", "bbox": {"l": 317.95499, "t": 112.02057000000002, "r": 558.2041, "b": 120.39520000000005, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "new and challenging dataset to improve and fine-tune novel ML", "bbox": {"l": 317.95499, "t": 122.97955000000002, "r": 558.43274, "b": 131.35419000000002, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "methods on. In contrast to many other datasets, DocLayNet was", "bbox": {"l": 317.95499, "t": 133.93854, "r": 558.20416, "b": 142.31317, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "created by human annotation in order to obtain reliable layout", "bbox": {"l": 317.95499, "t": 144.89752, "r": 558.20422, "b": 153.27215999999999, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "ground-truth on a wide variety of publication- and typesetting-", "bbox": {"l": 317.95499, "t": 155.85657000000003, "r": 559.71313, "b": 164.23119999999994, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "styles. Including a large proportion of documents outside the scien-", "bbox": {"l": 317.95499, "t": 166.81555000000003, "r": 559.71375, "b": 175.19019000000003, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "tific publishing domain adds significant value in this respect.", "bbox": {"l": 317.95499, "t": 177.77454, "r": 540.04382, "b": 186.14917000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In this paper, we presented the DocLayNet dataset. It provides the document conversion and layout analysis research community a new and challenging dataset to improve and fine-tune novel ML methods on. In contrast to many other datasets, DocLayNet was created by human annotation in order to obtain reliable layout ground-truth on a wide variety of publication- and typesettingstyles. Including a large proportion of documents outside the scientific publishing domain adds significant value in this respect."}, {"label": "text", "id": 6, "page_no": 7, "cluster": {"id": 6, "label": "text", "bbox": {"l": 317.686, "t": 188.73352, "r": 559.71704, "b": 284.77917, "coord_origin": "TOPLEFT"}, "confidence": 0.9800531268119812, "cells": [{"id": 122, "text": "From the dataset, we have derived on the one hand reference", "bbox": {"l": 327.918, "t": 188.73352, "r": 558.19836, "b": 197.10815000000002, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "metrics for human performance on document-layout annotation", "bbox": {"l": 317.95499, "t": 199.69257000000005, "r": 558.20404, "b": 208.06719999999996, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "(through double and triple annotations) and on the other hand eval-", "bbox": {"l": 317.686, "t": 210.65155000000004, "r": 559.71704, "b": 219.02617999999995, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "uated the baseline performance of commonly used object detection", "bbox": {"l": 317.95499, "t": 221.60956, "r": 558.20245, "b": 229.98419, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "methods. We also illustrated the impact of various dataset-related", "bbox": {"l": 317.95499, "t": 232.56853999999998, "r": 558.20502, "b": 240.94317999999998, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "aspects on model performance through data-ablation experiments,", "bbox": {"l": 317.95499, "t": 243.52752999999996, "r": 559.18408, "b": 251.90215999999998, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "both from a size and class-label perspective. Last but not least, we", "bbox": {"l": 317.95499, "t": 254.48650999999995, "r": 558.20227, "b": 262.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "compared the accuracy of models trained on other public datasets", "bbox": {"l": 317.95499, "t": 265.44556, "r": 558.20349, "b": 273.82019, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "and showed that DocLayNet trained models are more robust.", "bbox": {"l": 317.95499, "t": 276.40454, "r": 540.99426, "b": 284.77917, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "From the dataset, we have derived on the one hand reference metrics for human performance on document-layout annotation (through double and triple annotations) and on the other hand evaluated the baseline performance of commonly used object detection methods. We also illustrated the impact of various dataset-related aspects on model performance through data-ablation experiments, both from a size and class-label perspective. Last but not least, we compared the accuracy of models trained on other public datasets and showed that DocLayNet trained models are more robust."}, {"label": "text", "id": 7, "page_no": 7, "cluster": {"id": 7, "label": "text", "bbox": {"l": 317.62299, "t": 287.36353, "r": 558.43469, "b": 317.65616000000006, "coord_origin": "TOPLEFT"}, "confidence": 0.9676101207733154, "cells": [{"id": 131, "text": "To date, there is still a significant gap between human and ML", "bbox": {"l": 327.918, "t": 287.36353, "r": 558.43469, "b": 295.73816, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "accuracy on the layout interpretation task, and we hope that this", "bbox": {"l": 317.95499, "t": 298.32254, "r": 558.20013, "b": 306.69717, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "work will inspire the research community to close that gap.", "bbox": {"l": 317.62299, "t": 309.28152, "r": 535.65015, "b": 317.65616000000006, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "To date, there is still a significant gap between human and ML accuracy on the layout interpretation task, and we hope that this work will inspire the research community to close that gap."}, {"label": "section_header", "id": 11, "page_no": 7, "cluster": {"id": 11, "label": "section_header", "bbox": {"l": 317.95499, "t": 335.09189, "r": 387.3696, "b": 345.40097, "coord_origin": "TOPLEFT"}, "confidence": 0.9378752708435059, "cells": [{"id": 134, "text": "REFERENCES", "bbox": {"l": 317.95499, "t": 335.09189, "r": 387.3696, "b": 345.40097, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "REFERENCES"}, {"label": "list_item", "id": 12, "page_no": 7, "cluster": {"id": 12, "label": "list_item", "bbox": {"l": 321.198, "t": 348.70233, "r": 558.20099, "b": 371.16286999999994, "coord_origin": "TOPLEFT"}, "confidence": 0.9372857213020325, "cells": [{"id": 135, "text": "[1]", "bbox": {"l": 321.198, "t": 348.70233, "r": 329.72415, "b": 355.21588, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "Max G\u00f6bel, Tamir Hassan, Ermelinda Oro, and Giorgio Orsi. Icdar 2013 table", "bbox": {"l": 331.53516, "t": 348.70233, "r": 558.19904, "b": 355.21588, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "competition. In", "bbox": {"l": 333.39099, "t": 356.67236, "r": 379.36414, "b": 363.18591, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "2013 12th International Conference on Document Analysis and", "bbox": {"l": 381.37201, "t": 356.70724, "r": 558.20099, "b": 363.19287, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "Recognition", "bbox": {"l": 333.39099, "t": 364.67724999999996, "r": 365.59601, "b": 371.16286999999994, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": ", pages 1449-1453, 2013.", "bbox": {"l": 365.59601, "t": 364.64236, "r": 434.29489, "b": 371.15591, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[1] Max G\u00f6bel, Tamir Hassan, Ermelinda Oro, and Giorgio Orsi. Icdar 2013 table competition. In 2013 12th International Conference on Document Analysis and Recognition , pages 1449-1453, 2013."}, {"label": "list_item", "id": 9, "page_no": 7, "cluster": {"id": 9, "label": "list_item", "bbox": {"l": 321.198, "t": 372.61237, "r": 559.37982, "b": 403.04287999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9480945467948914, "cells": [{"id": 141, "text": "[2]", "bbox": {"l": 321.198, "t": 372.61237, "r": 329.85956, "b": 379.12592, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "Christian Clausner, Apostolos Antonacopoulos, and Stefan Pletschacher. Ic-", "bbox": {"l": 331.69931, "t": 372.61237, "r": 559.37976, "b": 379.12592, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "dar2017 competition on recognition of documents with complex layouts -", "bbox": {"l": 333.39099, "t": 380.58237, "r": 559.37982, "b": 387.09592, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "rdcl2017. In", "bbox": {"l": 333.39099, "t": 388.55236999999994, "r": 367.4339, "b": 395.06592, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "2017 14th IAPR International Conference on Document Analysis and", "bbox": {"l": 369.17401, "t": 388.58725000000004, "r": 558.20422, "b": 395.07288, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "Recognition (ICDAR)", "bbox": {"l": 333.39099, "t": 396.55725, "r": 390.87601, "b": 403.04287999999997, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": ", volume 01, pages 1404-1410, 2017.", "bbox": {"l": 390.87698, "t": 396.52237, "r": 492.17831, "b": 403.03592, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[2] Christian Clausner, Apostolos Antonacopoulos, and Stefan Pletschacher. Icdar2017 competition on recognition of documents with complex layouts rdcl2017. In 2017 14th IAPR International Conference on Document Analysis and Recognition (ICDAR) , volume 01, pages 1404-1410, 2017."}, {"label": "list_item", "id": 17, "page_no": 7, "cluster": {"id": 17, "label": "list_item", "bbox": {"l": 321.198, "t": 404.49237, "r": 558.20013, "b": 426.94689999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9257517457008362, "cells": [{"id": 148, "text": "[3]", "bbox": {"l": 321.198, "t": 404.49237, "r": 329.53583, "b": 411.00592, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "Herv\u00e9 D\u00e9jean, Jean-Luc Meunier, Liangcai Gao, Yilun Huang, Yu Fang, Florian", "bbox": {"l": 331.30682, "t": 404.49237, "r": 558.19958, "b": 411.00592, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "Kleber, and Eva-Maria Lang. ICDAR 2019 Competition on Table Detection and", "bbox": {"l": 333.39099, "t": 412.46335, "r": 558.20013, "b": 418.9769, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "Recognition (cTDaR), April 2019. http://sac.founderit.com/.", "bbox": {"l": 333.39099, "t": 420.43335, "r": 501.80127, "b": 426.94689999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[3] Herv\u00e9 D\u00e9jean, Jean-Luc Meunier, Liangcai Gao, Yilun Huang, Yu Fang, Florian Kleber, and Eva-Maria Lang. ICDAR 2019 Competition on Table Detection and Recognition (cTDaR), April 2019. http://sac.founderit.com/."}, {"label": "list_item", "id": 16, "page_no": 7, "cluster": {"id": 16, "label": "list_item", "bbox": {"l": 321.198, "t": 428.40335, "r": 559.37872, "b": 458.8269, "coord_origin": "TOPLEFT"}, "confidence": 0.9270977973937988, "cells": [{"id": 152, "text": "[4]", "bbox": {"l": 321.198, "t": 428.40335, "r": 329.91299, "b": 434.9169, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "Antonio Jimeno Yepes, Peter Zhong, and Douglas Burdick. Competition on", "bbox": {"l": 331.7641, "t": 428.40335, "r": 558.19885, "b": 434.9169, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "scientific literature parsing. In", "bbox": {"l": 333.39099, "t": 436.3733500000001, "r": 423.77225, "b": 442.8869, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "Proceedings of the International Conference on", "bbox": {"l": 425.909, "t": 436.40823, "r": 558.20178, "b": 442.89386, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "Document Analysis and Recognition", "bbox": {"l": 333.39099, "t": 444.37823, "r": 429.42697, "b": 450.86386, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": ", ICDAR, pages 605-617. LNCS 12824, Springer-", "bbox": {"l": 429.42400999999995, "t": 444.34335, "r": 559.37872, "b": 450.85689999999994, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "Verlag, sep 2021.", "bbox": {"l": 332.819, "t": 452.31335, "r": 380.01764, "b": 458.8269, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[4] Antonio Jimeno Yepes, Peter Zhong, and Douglas Burdick. Competition on scientific literature parsing. In Proceedings of the International Conference on Document Analysis and Recognition , ICDAR, pages 605-617. LNCS 12824, SpringerVerlag, sep 2021."}, {"label": "list_item", "id": 14, "page_no": 7, "cluster": {"id": 14, "label": "list_item", "bbox": {"l": 321.198, "t": 460.28336, "r": 559.02625, "b": 490.70792, "coord_origin": "TOPLEFT"}, "confidence": 0.9290012121200562, "cells": [{"id": 159, "text": "[5]", "bbox": {"l": 321.198, "t": 460.28336, "r": 329.22977, "b": 466.79691, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "Logan Markewich, Hao Zhang, Yubin Xing, Navid Lambert-Shirzad, Jiang Zhexin,", "bbox": {"l": 330.93576, "t": 460.28336, "r": 558.97156, "b": 466.79691, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "Roy Lee, Zhi Li, and Seok-Bum Ko. Segmentation for document layout analysis:", "bbox": {"l": 333.39099, "t": 468.25336, "r": 559.02625, "b": 474.76691, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "not dead yet.", "bbox": {"l": 333.39099, "t": 476.22437, "r": 368.85431, "b": 482.73792, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "International Journal on Document Analysis and Recognition (IJDAR)", "bbox": {"l": 370.811, "t": 476.25925, "r": 557.46326, "b": 482.74487, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": ",", "bbox": {"l": 557.46503, "t": 476.22437, "r": 558.96857, "b": 482.73792, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "pages 1-11, 01 2022.", "bbox": {"l": 333.39099, "t": 484.19437, "r": 390.82715, "b": 490.70792, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[5] Logan Markewich, Hao Zhang, Yubin Xing, Navid Lambert-Shirzad, Jiang Zhexin, Roy Lee, Zhi Li, and Seok-Bum Ko. Segmentation for document layout analysis: not dead yet. International Journal on Document Analysis and Recognition (IJDAR) , pages 1-11, 01 2022."}, {"label": "list_item", "id": 15, "page_no": 7, "cluster": {"id": 15, "label": "list_item", "bbox": {"l": 321.198, "t": 492.16437, "r": 558.20361, "b": 514.6248800000001, "coord_origin": "TOPLEFT"}, "confidence": 0.927480161190033, "cells": [{"id": 166, "text": "[6]", "bbox": {"l": 321.198, "t": 492.16437, "r": 329.42145, "b": 498.67792, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "Xu Zhong, Jianbin Tang, and Antonio Jimeno-Yepes. Publaynet: Largest dataset", "bbox": {"l": 331.16812, "t": 492.16437, "r": 558.20361, "b": 498.67792, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "ever for document layout analysis. In", "bbox": {"l": 333.39099, "t": 500.13437, "r": 438.6101100000001, "b": 506.64792, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "Proceedings of the International Conference", "bbox": {"l": 440.349, "t": 500.16925, "r": 558.19958, "b": 506.65488, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "on Document Analysis and Recognition", "bbox": {"l": 333.39099, "t": 508.13925, "r": 441.40118, "b": 514.6248800000001, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": ", ICDAR, pages 1015-1022, sep 2019.", "bbox": {"l": 441.4019799999999, "t": 508.10437, "r": 544.78162, "b": 514.61792, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[6] Xu Zhong, Jianbin Tang, and Antonio Jimeno-Yepes. Publaynet: Largest dataset ever for document layout analysis. In Proceedings of the International Conference on Document Analysis and Recognition , ICDAR, pages 1015-1022, sep 2019."}, {"label": "list_item", "id": 10, "page_no": 7, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 321.19797, "t": 516.07437, "r": 558.9715, "b": 554.46889, "coord_origin": "TOPLEFT"}, "confidence": 0.9426893591880798, "cells": [{"id": 172, "text": "[7]", "bbox": {"l": 321.19797, "t": 516.07437, "r": 329.74161, "b": 522.5879199999999, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "Minghao Li, Yiheng Xu, Lei Cui, Shaohan Huang, Furu Wei, Zhoujun Li, and", "bbox": {"l": 331.55634, "t": 516.07437, "r": 558.19897, "b": 522.5879199999999, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "Ming Zhou. Docbank: A benchmark dataset for document layout analysis. In", "bbox": {"l": 333.39099, "t": 524.0443700000001, "r": 558.19891, "b": 530.55792, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "Proceedings of the 28th International Conference on Computational Linguistics", "bbox": {"l": 333.39099, "t": 532.04922, "r": 557.40228, "b": 538.53487, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": ",", "bbox": {"l": 557.40399, "t": 532.01437, "r": 558.96893, "b": 538.5278900000001, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "COLING, pages 949-960. International Committee on Computational Linguistics,", "bbox": {"l": 333.39099, "t": 539.98438, "r": 558.9715, "b": 546.49789, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "dec 2020.", "bbox": {"l": 333.39099, "t": 547.95535, "r": 359.31955, "b": 554.46889, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[7] Minghao Li, Yiheng Xu, Lei Cui, Shaohan Huang, Furu Wei, Zhoujun Li, and Ming Zhou. Docbank: A benchmark dataset for document layout analysis. In Proceedings of the 28th International Conference on Computational Linguistics , COLING, pages 949-960. International Committee on Computational Linguistics, dec 2020."}, {"label": "list_item", "id": 19, "page_no": 7, "cluster": {"id": 19, "label": "list_item", "bbox": {"l": 321.198, "t": 555.92535, "r": 558.90222, "b": 578.38586, "coord_origin": "TOPLEFT"}, "confidence": 0.9139686226844788, "cells": [{"id": 179, "text": "[8]", "bbox": {"l": 321.198, "t": 555.92535, "r": 329.7088, "b": 562.43889, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "Riaz Ahmad, Muhammad Tanvir Afzal, and M. Qadir. Information extraction", "bbox": {"l": 331.51654, "t": 555.92535, "r": 558.19891, "b": 562.43889, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "from pdf sources based on rule-based system using integrated formats. In", "bbox": {"l": 333.39099, "t": 563.89536, "r": 535.54352, "b": 570.40889, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "SemWe-", "bbox": {"l": 536.96399, "t": 563.93024, "r": 558.90222, "b": 570.4158600000001, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "bEval@ESWC", "bbox": {"l": 333.39099, "t": 571.9002399999999, "r": 371.94217, "b": 578.38586, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": ", 2016.", "bbox": {"l": 371.94299, "t": 571.86536, "r": 389.72617, "b": 578.3788900000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[8] Riaz Ahmad, Muhammad Tanvir Afzal, and M. Qadir. Information extraction from pdf sources based on rule-based system using integrated formats. In SemWebEval@ESWC , 2016."}, {"label": "list_item", "id": 21, "page_no": 7, "cluster": {"id": 21, "label": "list_item", "bbox": {"l": 321.198, "t": 579.83536, "r": 559.27448, "b": 610.2589, "coord_origin": "TOPLEFT"}, "confidence": 0.9113100171089172, "cells": [{"id": 185, "text": "[9]", "bbox": {"l": 321.198, "t": 579.83536, "r": 329.45999, "b": 586.34889, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "Ross B. Girshick, Jeff Donahue, Trevor Darrell, and Jitendra Malik. Rich feature", "bbox": {"l": 331.21487, "t": 579.83536, "r": 558.19843, "b": 586.34889, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "hierarchies for accurate object detection and semantic segmentation. In", "bbox": {"l": 333.39099, "t": 587.8053600000001, "r": 543.05487, "b": 594.31889, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": "IEEE", "bbox": {"l": 544.98499, "t": 587.84024, "r": 558.20148, "b": 594.32587, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "Conference on Computer Vision and Pattern Recognition", "bbox": {"l": 333.39099, "t": 595.81024, "r": 491.61166, "b": 602.29587, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": ", CVPR, pages 580-587.", "bbox": {"l": 491.61301, "t": 595.77536, "r": 559.27448, "b": 602.28889, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "IEEE Computer Society, jun 2014.", "bbox": {"l": 333.39099, "t": 603.74536, "r": 428.59726000000006, "b": 610.2589, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[9] Ross B. Girshick, Jeff Donahue, Trevor Darrell, and Jitendra Malik. Rich feature hierarchies for accurate object detection and semantic segmentation. In IEEE Conference on Computer Vision and Pattern Recognition , CVPR, pages 580-587. IEEE Computer Society, jun 2014."}, {"label": "list_item", "id": 22, "page_no": 7, "cluster": {"id": 22, "label": "list_item", "bbox": {"l": 317.95499, "t": 611.71536, "r": 558.20203, "b": 626.20686, "coord_origin": "TOPLEFT"}, "confidence": 0.9028767347335815, "cells": [{"id": 192, "text": "[10]", "bbox": {"l": 317.95499, "t": 611.71536, "r": 329.54767, "b": 618.2289000000001, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "Ross B. Girshick. Fast R-CNN. In", "bbox": {"l": 331.31268, "t": 611.71536, "r": 425.1554, "b": 618.2289000000001, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "2015 IEEE International Conference on Computer", "bbox": {"l": 426.77802, "t": 611.75024, "r": 558.20203, "b": 618.23587, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "Vision", "bbox": {"l": 333.39099, "t": 619.72124, "r": 350.59537, "b": 626.20686, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": ", ICCV, pages 1440-1448. IEEE Computer Society, dec 2015.", "bbox": {"l": 350.59598, "t": 619.68637, "r": 518.58777, "b": 626.19989, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[10] Ross B. Girshick. Fast R-CNN. In 2015 IEEE International Conference on Computer Vision , ICCV, pages 1440-1448. IEEE Computer Society, dec 2015."}, {"label": "list_item", "id": 20, "page_no": 7, "cluster": {"id": 20, "label": "list_item", "bbox": {"l": 317.95499, "t": 627.65637, "r": 558.20142, "b": 650.1168700000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9127691984176636, "cells": [{"id": 197, "text": "[11]", "bbox": {"l": 317.95499, "t": 627.65637, "r": 329.5459, "b": 634.16989, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "Shaoqing Ren, Kaiming He, Ross Girshick, and Jian Sun. Faster r-cnn: Towards", "bbox": {"l": 331.31064, "t": 627.65637, "r": 558.20142, "b": 634.16989, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "real-time object detection with region proposal networks.", "bbox": {"l": 333.39099, "t": 635.62637, "r": 497.50909, "b": 642.13989, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "IEEE Transactions on", "bbox": {"l": 500.01401, "t": 635.66124, "r": 558.19885, "b": 642.14687, "coord_origin": "TOPLEFT"}}, {"id": 201, "text": "Pattern Analysis and Machine Intelligence", "bbox": {"l": 333.39099, "t": 643.6312399999999, "r": 449.38620000000003, "b": 650.1168700000001, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": ", 39(6):1137-1149, 2017.", "bbox": {"l": 449.38699, "t": 643.59637, "r": 515.74268, "b": 650.10989, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[11] Shaoqing Ren, Kaiming He, Ross Girshick, and Jian Sun. Faster r-cnn: Towards real-time object detection with region proposal networks. IEEE Transactions on Pattern Analysis and Machine Intelligence , 39(6):1137-1149, 2017."}, {"label": "list_item", "id": 18, "page_no": 7, "cluster": {"id": 18, "label": "list_item", "bbox": {"l": 317.95499, "t": 651.56638, "r": 559.27808, "b": 674.01989, "coord_origin": "TOPLEFT"}, "confidence": 0.9142459630966187, "cells": [{"id": 203, "text": "[12]", "bbox": {"l": 317.95499, "t": 651.56638, "r": 329.41763, "b": 658.0799, "coord_origin": "TOPLEFT"}}, {"id": 204, "text": "Kaiming He, Georgia Gkioxari, Piotr Doll\u00e1r, and Ross B. Girshick. Mask R-CNN.", "bbox": {"l": 331.16287, "t": 651.56638, "r": 559.27808, "b": 658.0799, "coord_origin": "TOPLEFT"}}, {"id": 205, "text": "In", "bbox": {"l": 333.39099, "t": 659.53638, "r": 339.35904, "b": 666.0499, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": "IEEE International Conference on Computer Vision", "bbox": {"l": 341.56299, "t": 659.57124, "r": 485.8273, "b": 666.05687, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": ", ICCV, pages 2980-2988.", "bbox": {"l": 485.82901, "t": 659.53638, "r": 559.27356, "b": 666.0499, "coord_origin": "TOPLEFT"}}, {"id": 208, "text": "IEEE Computer Society, Oct 2017.", "bbox": {"l": 333.39099, "t": 667.50636, "r": 429.30161000000004, "b": 674.01989, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[12] Kaiming He, Georgia Gkioxari, Piotr Doll\u00e1r, and Ross B. Girshick. Mask R-CNN. In IEEE International Conference on Computer Vision , ICCV, pages 2980-2988. IEEE Computer Society, Oct 2017."}, {"label": "list_item", "id": 23, "page_no": 7, "cluster": {"id": 23, "label": "list_item", "bbox": {"l": 317.95499, "t": 675.47636, "r": 558.97156, "b": 705.900894, "coord_origin": "TOPLEFT"}, "confidence": 0.889543354511261, "cells": [{"id": 209, "text": "[13]", "bbox": {"l": 317.95499, "t": 675.47636, "r": 330.11407, "b": 681.9898900000001, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": "Glenn Jocher, Alex Stoken, Ayush Chaurasia, Jirka Borovec, NanoCode012,", "bbox": {"l": 331.96533, "t": 675.47636, "r": 558.96716, "b": 681.9898900000001, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "TaoXie, Yonghye Kwon, Kalen Michael, Liu Changyu, Jiacong Fang, Abhiram V,", "bbox": {"l": 333.18201, "t": 683.44637, "r": 558.96661, "b": 689.95989, "coord_origin": "TOPLEFT"}}, {"id": 212, "text": "Laughing, tkianai, yxNONG, Piotr Skalski, Adam Hogan, Jebastin Nadar, imyhxy,", "bbox": {"l": 333.39099, "t": 691.41737, "r": 558.97156, "b": 697.930893, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "Lorenzo Mammana, Alex Wang, Cristi Fati, Diego Montes, Jan Hajek, Laurentiu", "bbox": {"l": 333.39099, "t": 699.387367, "r": 558.20001, "b": 705.900894, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[13] Glenn Jocher, Alex Stoken, Ayush Chaurasia, Jirka Borovec, NanoCode012, TaoXie, Yonghye Kwon, Kalen Michael, Liu Changyu, Jiacong Fang, Abhiram V, Laughing, tkianai, yxNONG, Piotr Skalski, Adam Hogan, Jebastin Nadar, imyhxy, Lorenzo Mammana, Alex Wang, Cristi Fati, Diego Montes, Jan Hajek, Laurentiu"}], "body": [{"label": "text", "id": 5, "page_no": 7, "cluster": {"id": 5, "label": "text", "bbox": {"l": 53.501999, "t": 86.87292000000002, "r": 295.64868, "b": 150.14111000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9824112057685852, "cells": [{"id": 2, "text": "Table 5: Prediction Performance (mAP@0.5-0.95) of a Mask", "bbox": {"l": 53.501999, "t": 86.87292000000002, "r": 294.32153, "b": 95.34618999999998, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "R-CNN R50 network across the PubLayNet, DocBank & Do-", "bbox": {"l": 53.79800000000001, "t": 97.83191, "r": 295.64868, "b": 106.30517999999995, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "cLayNet data-sets. By evaluating on common label classes of", "bbox": {"l": 53.79800000000001, "t": 108.79088999999999, "r": 294.0437, "b": 117.26415999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "each dataset, we observe that the DocLayNet-trained model", "bbox": {"l": 53.79800000000001, "t": 119.74987999999996, "r": 294.04373, "b": 128.22313999999994, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "has much less pronounced variations in performance across", "bbox": {"l": 53.79800000000001, "t": 130.70885999999996, "r": 294.0437, "b": 139.18213000000003, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "all datasets.", "bbox": {"l": 53.79800000000001, "t": 141.66785000000004, "r": 101.15852, "b": 150.14111000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 5: Prediction Performance (mAP@0.5-0.95) of a Mask R-CNN R50 network across the PubLayNet, DocBank & DocLayNet data-sets. By evaluating on common label classes of each dataset, we observe that the DocLayNet-trained model has much less pronounced variations in performance across all datasets."}, {"label": "table", "id": 0, "page_no": 7, "cluster": {"id": 0, "label": "table", "bbox": {"l": 72.6590347290039, "t": 172.48080444335938, "r": 274.83465576171875, "b": 339.8540344238281, "coord_origin": "TOPLEFT"}, "confidence": 0.9892616271972656, "cells": [{"id": 8, "text": "Testing on", "bbox": {"l": 217.74099999999999, "t": 175.01855, "r": 256.26065, "b": 183.39319, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Training on", "bbox": {"l": 89.954002, "t": 185.97655999999995, "r": 133.24379, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "labels", "bbox": {"l": 154.629, "t": 185.97655999999995, "r": 175.47588, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "PLN", "bbox": {"l": 204.69, "t": 185.97655999999995, "r": 220.54260000000002, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "DB", "bbox": {"l": 230.50427000000002, "t": 185.97655999999995, "r": 242.06197, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "DLN", "bbox": {"l": 252.02364, "t": 185.97655999999995, "r": 269.31085, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "PubLayNet (PLN)", "bbox": {"l": 78.530998, "t": 219.25256000000002, "r": 142.56006, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Figure", "bbox": {"l": 154.629, "t": 197.33452999999997, "r": 177.92371, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "96", "bbox": {"l": 208.44701, "t": 197.33452999999997, "r": 216.78575000000004, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "43", "bbox": {"l": 232.1183, "t": 197.33452999999997, "r": 240.45705, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "23", "bbox": {"l": 256.49792, "t": 197.33452999999997, "r": 264.83667, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Sec-header", "bbox": {"l": 154.629, "t": 208.29351999999994, "r": 194.72675, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "87", "bbox": {"l": 208.44701, "t": 208.29351999999994, "r": 216.78575000000004, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "-", "bbox": {"l": 234.77235, "t": 208.29351999999994, "r": 237.80299000000002, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "32", "bbox": {"l": 256.49792, "t": 208.29351999999994, "r": 264.83667, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Table", "bbox": {"l": 154.629, "t": 219.25256000000002, "r": 174.43578, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "95", "bbox": {"l": 208.44701, "t": 219.25256000000002, "r": 216.78575000000004, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "24", "bbox": {"l": 232.1183, "t": 219.25256000000002, "r": 240.45705, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "49", "bbox": {"l": 256.49792, "t": 219.25256000000002, "r": 264.83667, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Text", "bbox": {"l": 154.629, "t": 230.21155, "r": 170.58919, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "96", "bbox": {"l": 208.44701, "t": 230.21155, "r": 216.78575000000004, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "-", "bbox": {"l": 234.77235, "t": 230.21155, "r": 237.80299000000002, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "42", "bbox": {"l": 256.49792, "t": 230.21155, "r": 264.83667, "b": 238.58618, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "total", "bbox": {"l": 154.629, "t": 241.16956000000005, "r": 171.2796, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "93", "bbox": {"l": 208.44701, "t": 241.16956000000005, "r": 216.78575000000004, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "34", "bbox": {"l": 232.1183, "t": 241.16956000000005, "r": 240.45705, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "30", "bbox": {"l": 256.49792, "t": 241.16956000000005, "r": 264.83667, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "DocBank (DB)", "bbox": {"l": 78.530998, "t": 263.48650999999995, "r": 131.19963, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Figure", "bbox": {"l": 154.629, "t": 252.52752999999996, "r": 177.92371, "b": 260.90216, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "77", "bbox": {"l": 208.44701, "t": 252.52752999999996, "r": 216.78575000000004, "b": 260.90216, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "71", "bbox": {"l": 232.1183, "t": 252.52752999999996, "r": 240.45705, "b": 260.90216, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "31", "bbox": {"l": 256.49792, "t": 252.52752999999996, "r": 264.83667, "b": 260.90216, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "Table", "bbox": {"l": 154.629, "t": 263.48650999999995, "r": 174.43578, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "19", "bbox": {"l": 208.44701, "t": 263.48650999999995, "r": 216.78575000000004, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "65", "bbox": {"l": 232.1183, "t": 263.48650999999995, "r": 240.45705, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "22", "bbox": {"l": 256.49792, "t": 263.48650999999995, "r": 264.83667, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "total", "bbox": {"l": 154.629, "t": 274.44556, "r": 171.2796, "b": 282.82016, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "48", "bbox": {"l": 208.44701, "t": 274.44556, "r": 216.78575000000004, "b": 282.82016, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "68", "bbox": {"l": 232.1183, "t": 274.44556, "r": 240.45705, "b": 282.82016, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "27", "bbox": {"l": 256.49792, "t": 274.44556, "r": 264.83667, "b": 282.82016, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "DocLayNet (DLN)", "bbox": {"l": 78.530998, "t": 307.72055, "r": 144.66716, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "Figure", "bbox": {"l": 154.629, "t": 285.80255, "r": 177.92371, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "67", "bbox": {"l": 208.44701, "t": 285.80255, "r": 216.78575000000004, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "51", "bbox": {"l": 232.1183, "t": 285.80255, "r": 240.45705, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "72", "bbox": {"l": 256.49792, "t": 285.80255, "r": 264.83667, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Sec-header", "bbox": {"l": 154.629, "t": 296.76154, "r": 194.72675, "b": 305.13617, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "53", "bbox": {"l": 208.44701, "t": 296.76154, "r": 216.78575000000004, "b": 305.13617, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "-", "bbox": {"l": 234.77235, "t": 296.76154, "r": 237.80299000000002, "b": 305.13617, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "68", "bbox": {"l": 256.49792, "t": 296.76154, "r": 264.83667, "b": 305.13617, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Table", "bbox": {"l": 154.629, "t": 307.72055, "r": 174.43578, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "87", "bbox": {"l": 208.44701, "t": 307.72055, "r": 216.78575000000004, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "43", "bbox": {"l": 232.1183, "t": 307.72055, "r": 240.45705, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "82", "bbox": {"l": 256.49792, "t": 307.72055, "r": 264.83667, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "Text", "bbox": {"l": 154.629, "t": 318.67953, "r": 170.58919, "b": 327.05417, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "77", "bbox": {"l": 208.44701, "t": 318.67953, "r": 216.78575000000004, "b": 327.05417, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "-", "bbox": {"l": 234.77235, "t": 318.67953, "r": 237.80299000000002, "b": 327.05417, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "84", "bbox": {"l": 256.49792, "t": 318.67953, "r": 264.83667, "b": 327.05417, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "total", "bbox": {"l": 154.629, "t": 329.63855, "r": 171.2796, "b": 338.01318, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "59", "bbox": {"l": 208.44701, "t": 329.63855, "r": 216.78575000000004, "b": 338.01318, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "47", "bbox": {"l": 232.1183, "t": 329.63855, "r": 240.45705, "b": 338.01318, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "78", "bbox": {"l": 256.49792, "t": 329.63855, "r": 264.83667, "b": 338.01318, "coord_origin": "TOPLEFT"}}], "children": [{"id": 25, "label": "text", "bbox": {"l": 217.74099999999999, "t": 175.01855, "r": 256.26065, "b": 183.39319, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "Testing on", "bbox": {"l": 217.74099999999999, "t": 175.01855, "r": 256.26065, "b": 183.39319, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 89.954002, "t": 185.97655999999995, "r": 133.24379, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "Training on", "bbox": {"l": 89.954002, "t": 185.97655999999995, "r": 133.24379, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 154.629, "t": 185.97655999999995, "r": 175.47588, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "labels", "bbox": {"l": 154.629, "t": 185.97655999999995, "r": 175.47588, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 204.69, "t": 185.97655999999995, "r": 220.54260000000002, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "PLN", "bbox": {"l": 204.69, "t": 185.97655999999995, "r": 220.54260000000002, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 230.50427000000002, "t": 185.97655999999995, "r": 242.06197, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "DB", "bbox": {"l": 230.50427000000002, "t": 185.97655999999995, "r": 242.06197, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 252.02364, "t": 185.97655999999995, "r": 269.31085, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "DLN", "bbox": {"l": 252.02364, "t": 185.97655999999995, "r": 269.31085, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 78.530998, "t": 219.25256000000002, "r": 142.56006, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "PubLayNet (PLN)", "bbox": {"l": 78.530998, "t": 219.25256000000002, "r": 142.56006, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 154.629, "t": 197.33452999999997, "r": 177.92371, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "Figure", "bbox": {"l": 154.629, "t": 197.33452999999997, "r": 177.92371, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 208.44701, "t": 197.33452999999997, "r": 216.78575000000004, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "96", "bbox": {"l": 208.44701, "t": 197.33452999999997, "r": 216.78575000000004, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 232.1183, "t": 197.33452999999997, "r": 240.45705, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "43", "bbox": {"l": 232.1183, "t": 197.33452999999997, "r": 240.45705, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 256.49792, "t": 197.33452999999997, "r": 264.83667, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "23", "bbox": {"l": 256.49792, "t": 197.33452999999997, "r": 264.83667, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 154.629, "t": 208.29351999999994, "r": 194.72675, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "Sec-header", "bbox": {"l": 154.629, "t": 208.29351999999994, "r": 194.72675, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 208.44701, "t": 208.29351999999994, "r": 216.78575000000004, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "87", "bbox": {"l": 208.44701, "t": 208.29351999999994, "r": 216.78575000000004, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 234.77235, "t": 208.29351999999994, "r": 237.80299000000002, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "-", "bbox": {"l": 234.77235, "t": 208.29351999999994, "r": 237.80299000000002, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 256.49792, "t": 208.29351999999994, "r": 264.83667, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "32", "bbox": {"l": 256.49792, "t": 208.29351999999994, "r": 264.83667, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 154.629, "t": 219.25256000000002, "r": 174.43578, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "Table", "bbox": {"l": 154.629, "t": 219.25256000000002, "r": 174.43578, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 208.44701, "t": 219.25256000000002, "r": 216.78575000000004, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "95", "bbox": {"l": 208.44701, "t": 219.25256000000002, "r": 216.78575000000004, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 232.1183, "t": 219.25256000000002, "r": 240.45705, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "24", "bbox": {"l": 232.1183, "t": 219.25256000000002, "r": 240.45705, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 256.49792, "t": 219.25256000000002, "r": 264.83667, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "49", "bbox": {"l": 256.49792, "t": 219.25256000000002, "r": 264.83667, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 154.629, "t": 230.21155, "r": 170.58919, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "Text", "bbox": {"l": 154.629, "t": 230.21155, "r": 170.58919, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 208.44701, "t": 230.21155, "r": 216.78575000000004, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "96", "bbox": {"l": 208.44701, "t": 230.21155, "r": 216.78575000000004, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 234.77235, "t": 230.21155, "r": 237.80299000000002, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "-", "bbox": {"l": 234.77235, "t": 230.21155, "r": 237.80299000000002, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 256.49792, "t": 230.21155, "r": 264.83667, "b": 238.58618, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "42", "bbox": {"l": 256.49792, "t": 230.21155, "r": 264.83667, "b": 238.58618, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 154.629, "t": 241.16956000000005, "r": 171.2796, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "total", "bbox": {"l": 154.629, "t": 241.16956000000005, "r": 171.2796, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 208.44701, "t": 241.16956000000005, "r": 216.78575000000004, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "93", "bbox": {"l": 208.44701, "t": 241.16956000000005, "r": 216.78575000000004, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 232.1183, "t": 241.16956000000005, "r": 240.45705, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "34", "bbox": {"l": 232.1183, "t": 241.16956000000005, "r": 240.45705, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 256.49792, "t": 241.16956000000005, "r": 264.83667, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "30", "bbox": {"l": 256.49792, "t": 241.16956000000005, "r": 264.83667, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 78.530998, "t": 263.48650999999995, "r": 131.19963, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "DocBank (DB)", "bbox": {"l": 78.530998, "t": 263.48650999999995, "r": 131.19963, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 154.629, "t": 252.52752999999996, "r": 177.92371, "b": 260.90216, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "Figure", "bbox": {"l": 154.629, "t": 252.52752999999996, "r": 177.92371, "b": 260.90216, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 208.44701, "t": 252.52752999999996, "r": 216.78575000000004, "b": 260.90216, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "77", "bbox": {"l": 208.44701, "t": 252.52752999999996, "r": 216.78575000000004, "b": 260.90216, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 232.1183, "t": 252.52752999999996, "r": 240.45705, "b": 260.90216, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "71", "bbox": {"l": 232.1183, "t": 252.52752999999996, "r": 240.45705, "b": 260.90216, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 256.49792, "t": 252.52752999999996, "r": 264.83667, "b": 260.90216, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "31", "bbox": {"l": 256.49792, "t": 252.52752999999996, "r": 264.83667, "b": 260.90216, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 154.629, "t": 263.48650999999995, "r": 174.43578, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "Table", "bbox": {"l": 154.629, "t": 263.48650999999995, "r": 174.43578, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 208.44701, "t": 263.48650999999995, "r": 216.78575000000004, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "19", "bbox": {"l": 208.44701, "t": 263.48650999999995, "r": 216.78575000000004, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 232.1183, "t": 263.48650999999995, "r": 240.45705, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "65", "bbox": {"l": 232.1183, "t": 263.48650999999995, "r": 240.45705, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 256.49792, "t": 263.48650999999995, "r": 264.83667, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "22", "bbox": {"l": 256.49792, "t": 263.48650999999995, "r": 264.83667, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 154.629, "t": 274.44556, "r": 171.2796, "b": 282.82016, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "total", "bbox": {"l": 154.629, "t": 274.44556, "r": 171.2796, "b": 282.82016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 208.44701, "t": 274.44556, "r": 216.78575000000004, "b": 282.82016, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "48", "bbox": {"l": 208.44701, "t": 274.44556, "r": 216.78575000000004, "b": 282.82016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 232.1183, "t": 274.44556, "r": 240.45705, "b": 282.82016, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "68", "bbox": {"l": 232.1183, "t": 274.44556, "r": 240.45705, "b": 282.82016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 256.49792, "t": 274.44556, "r": 264.83667, "b": 282.82016, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "27", "bbox": {"l": 256.49792, "t": 274.44556, "r": 264.83667, "b": 282.82016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 78.530998, "t": 307.72055, "r": 144.66716, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "DocLayNet (DLN)", "bbox": {"l": 78.530998, "t": 307.72055, "r": 144.66716, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 154.629, "t": 285.80255, "r": 177.92371, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "Figure", "bbox": {"l": 154.629, "t": 285.80255, "r": 177.92371, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 208.44701, "t": 285.80255, "r": 216.78575000000004, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "67", "bbox": {"l": 208.44701, "t": 285.80255, "r": 216.78575000000004, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 232.1183, "t": 285.80255, "r": 240.45705, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "51", "bbox": {"l": 232.1183, "t": 285.80255, "r": 240.45705, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 256.49792, "t": 285.80255, "r": 264.83667, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "72", "bbox": {"l": 256.49792, "t": 285.80255, "r": 264.83667, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 154.629, "t": 296.76154, "r": 194.72675, "b": 305.13617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "Sec-header", "bbox": {"l": 154.629, "t": 296.76154, "r": 194.72675, "b": 305.13617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 208.44701, "t": 296.76154, "r": 216.78575000000004, "b": 305.13617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "53", "bbox": {"l": 208.44701, "t": 296.76154, "r": 216.78575000000004, "b": 305.13617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 234.77235, "t": 296.76154, "r": 237.80299000000002, "b": 305.13617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "-", "bbox": {"l": 234.77235, "t": 296.76154, "r": 237.80299000000002, "b": 305.13617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 256.49792, "t": 296.76154, "r": 264.83667, "b": 305.13617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "68", "bbox": {"l": 256.49792, "t": 296.76154, "r": 264.83667, "b": 305.13617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 154.629, "t": 307.72055, "r": 174.43578, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "Table", "bbox": {"l": 154.629, "t": 307.72055, "r": 174.43578, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 208.44701, "t": 307.72055, "r": 216.78575000000004, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "87", "bbox": {"l": 208.44701, "t": 307.72055, "r": 216.78575000000004, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 232.1183, "t": 307.72055, "r": 240.45705, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "43", "bbox": {"l": 232.1183, "t": 307.72055, "r": 240.45705, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 256.49792, "t": 307.72055, "r": 264.83667, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "82", "bbox": {"l": 256.49792, "t": 307.72055, "r": 264.83667, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 154.629, "t": 318.67953, "r": 170.58919, "b": 327.05417, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "Text", "bbox": {"l": 154.629, "t": 318.67953, "r": 170.58919, "b": 327.05417, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 208.44701, "t": 318.67953, "r": 216.78575000000004, "b": 327.05417, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "77", "bbox": {"l": 208.44701, "t": 318.67953, "r": 216.78575000000004, "b": 327.05417, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 234.77235, "t": 318.67953, "r": 237.80299000000002, "b": 327.05417, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "-", "bbox": {"l": 234.77235, "t": 318.67953, "r": 237.80299000000002, "b": 327.05417, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 256.49792, "t": 318.67953, "r": 264.83667, "b": 327.05417, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "84", "bbox": {"l": 256.49792, "t": 318.67953, "r": 264.83667, "b": 327.05417, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 154.629, "t": 329.63855, "r": 171.2796, "b": 338.01318, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "total", "bbox": {"l": 154.629, "t": 329.63855, "r": 171.2796, "b": 338.01318, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 208.44701, "t": 329.63855, "r": 216.78575000000004, "b": 338.01318, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "59", "bbox": {"l": 208.44701, "t": 329.63855, "r": 216.78575000000004, "b": 338.01318, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 232.1183, "t": 329.63855, "r": 240.45705, "b": 338.01318, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "47", "bbox": {"l": 232.1183, "t": 329.63855, "r": 240.45705, "b": 338.01318, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 256.49792, "t": 329.63855, "r": 264.83667, "b": 338.01318, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "78", "bbox": {"l": 256.49792, "t": 329.63855, "r": 264.83667, "b": 338.01318, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "lcel", "lcel", "nl", "ched", "ched", "ched", "ched", "ched", "nl", "rhed", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl", "rhed", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl", "rhed", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "nl"], "num_rows": 15, "num_cols": 5, "table_cells": [{"bbox": {"l": 217.74099999999999, "t": 175.01855, "r": 256.26065, "b": 183.39319, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 3, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 5, "text": "Testing on", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 89.954002, "t": 185.97655999999995, "r": 133.24379, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Training on", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 185.97655999999995, "r": 175.47588, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "labels", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 204.69, "t": 185.97655999999995, "r": 220.54260000000002, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "PLN", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 230.50427000000002, "t": 185.97655999999995, "r": 242.06197, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "DB", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 252.02364, "t": 185.97655999999995, "r": 269.31085, "b": 194.35119999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "DLN", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 78.530998, "t": 219.25256000000002, "r": 142.56006, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 5, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PubLayNet (PLN)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 154.629, "t": 197.33452999999997, "r": 177.92371, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Figure", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 197.33452999999997, "r": 216.78575000000004, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 197.33452999999997, "r": 240.45705, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "43", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 197.33452999999997, "r": 264.83667, "b": 205.70916999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "23", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 208.29351999999994, "r": 194.72675, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Sec-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 208.29351999999994, "r": 216.78575000000004, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "87", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 234.77235, "t": 208.29351999999994, "r": 237.80299000000002, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 208.29351999999994, "r": 264.83667, "b": 216.66814999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "32", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 219.25256000000002, "r": 174.43578, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 219.25256000000002, "r": 216.78575000000004, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "95", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 219.25256000000002, "r": 240.45705, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "24", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 219.25256000000002, "r": 264.83667, "b": 227.62720000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "49", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 230.21155, "r": 170.58919, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Text", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 230.21155, "r": 216.78575000000004, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "96", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 234.77235, "t": 230.21155, "r": 237.80299000000002, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 230.21155, "r": 264.83667, "b": 238.58618, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "42", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 241.16956000000005, "r": 171.2796, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "total", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 241.16956000000005, "r": 216.78575000000004, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "93", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 241.16956000000005, "r": 240.45705, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "34", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 241.16956000000005, "r": 264.83667, "b": 249.54418999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "30", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 78.530998, "t": 263.48650999999995, "r": 131.19963, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "row_span": 3, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "DocBank (DB)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 154.629, "t": 252.52752999999996, "r": 177.92371, "b": 260.90216, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Figure", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 252.52752999999996, "r": 216.78575000000004, "b": 260.90216, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 252.52752999999996, "r": 240.45705, "b": 260.90216, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "71", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 252.52752999999996, "r": 264.83667, "b": 260.90216, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "31", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 263.48650999999995, "r": 174.43578, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 263.48650999999995, "r": 216.78575000000004, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "19", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 263.48650999999995, "r": 240.45705, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "65", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 263.48650999999995, "r": 264.83667, "b": 271.86114999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "22", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 274.44556, "r": 171.2796, "b": 282.82016, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "total", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 274.44556, "r": 216.78575000000004, "b": 282.82016, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "48", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 274.44556, "r": 240.45705, "b": 282.82016, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 274.44556, "r": 264.83667, "b": 282.82016, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "27", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 78.530998, "t": 307.72055, "r": 144.66716, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "row_span": 5, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 15, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "DocLayNet (DLN)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 154.629, "t": 285.80255, "r": 177.92371, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Figure", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 285.80255, "r": 216.78575000000004, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "67", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 285.80255, "r": 240.45705, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "51", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 285.80255, "r": 264.83667, "b": 294.17719000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "72", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 296.76154, "r": 194.72675, "b": 305.13617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Sec-header", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 296.76154, "r": 216.78575000000004, "b": 305.13617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "53", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 234.77235, "t": 296.76154, "r": 237.80299000000002, "b": 305.13617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 296.76154, "r": 264.83667, "b": 305.13617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "68", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 307.72055, "r": 174.43578, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Table", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 307.72055, "r": 216.78575000000004, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "87", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 307.72055, "r": 240.45705, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "43", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 307.72055, "r": 264.83667, "b": 316.09517999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "82", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 318.67953, "r": 170.58919, "b": 327.05417, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Text", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 318.67953, "r": 216.78575000000004, "b": 327.05417, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 234.77235, "t": 318.67953, "r": 237.80299000000002, "b": 327.05417, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "-", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 318.67953, "r": 264.83667, "b": 327.05417, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "84", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 154.629, "t": 329.63855, "r": 171.2796, "b": 338.01318, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 14, "end_row_offset_idx": 15, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "total", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 208.44701, "t": 329.63855, "r": 216.78575000000004, "b": 338.01318, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 14, "end_row_offset_idx": 15, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "59", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 232.1183, "t": 329.63855, "r": 240.45705, "b": 338.01318, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 14, "end_row_offset_idx": 15, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "47", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 256.49792, "t": 329.63855, "r": 264.83667, "b": 338.01318, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 14, "end_row_offset_idx": 15, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "78", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "text", "id": 4, "page_no": 7, "cluster": {"id": 4, "label": "text", "bbox": {"l": 53.79800000000001, "t": 390.92053, "r": 294.04712, "b": 443.14014, "coord_origin": "TOPLEFT"}, "confidence": 0.9839397668838501, "cells": [{"id": 69, "text": "Section-header", "bbox": {"l": 53.79800000000001, "t": 390.96539, "r": 106.2392, "b": 399.30414, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": ",", "bbox": {"l": 106.239, "t": 390.92053, "r": 108.23331, "b": 399.2951699999999, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Table", "bbox": {"l": 110.482, "t": 390.96539, "r": 129.76332, "b": 399.30414, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "and", "bbox": {"l": 132.21899, "t": 390.92053, "r": 145.86186, "b": 399.2951699999999, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "Text", "bbox": {"l": 148.112, "t": 390.96539, "r": 163.14182, "b": 399.30414, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": ". Before training, we either mapped", "bbox": {"l": 163.13901, "t": 390.92053, "r": 294.04709, "b": 399.2951699999999, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "or excluded DocLayNet\u2019s other labels as specified in table 3, and", "bbox": {"l": 53.79800000000001, "t": 401.87954999999994, "r": 294.04712, "b": 410.25418, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "also PubLayNet\u2019s", "bbox": {"l": 53.79800000000001, "t": 412.83853, "r": 117.12856, "b": 421.21317, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "List", "bbox": {"l": 119.362, "t": 412.88339, "r": 132.4342, "b": 421.22214, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "to", "bbox": {"l": 135.177, "t": 412.83853, "r": 142.54416, "b": 421.21317, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "Text", "bbox": {"l": 144.77901, "t": 412.88339, "r": 159.66605, "b": 421.22214, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": ". Note that the different clustering of", "bbox": {"l": 159.66701, "t": 412.83853, "r": 294.04562, "b": 421.21317, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "lists (by list-element vs. whole list objects) naturally decreases the", "bbox": {"l": 53.79800000000001, "t": 423.79755, "r": 294.04614, "b": 432.17217999999997, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "mAP score for", "bbox": {"l": 53.79800000000001, "t": 434.75653, "r": 106.2066, "b": 443.13116, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "Text", "bbox": {"l": 108.448, "t": 434.80139, "r": 123.30533, "b": 443.14014, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": ".", "bbox": {"l": 123.305, "t": 434.75653, "r": 125.27761000000001, "b": 443.13116, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Section-header , Table and Text . Before training, we either mapped or excluded DocLayNet's other labels as specified in table 3, and also PubLayNet's List to Text . Note that the different clustering of lists (by list-element vs. whole list objects) naturally decreases the mAP score for Text ."}, {"label": "text", "id": 1, "page_no": 7, "cluster": {"id": 1, "label": "text", "bbox": {"l": 53.466999, "t": 445.71453999999994, "r": 295.55908, "b": 585.59618, "coord_origin": "TOPLEFT"}, "confidence": 0.9868056774139404, "cells": [{"id": 85, "text": "For comparison of DocBank with DocLayNet, we trained only", "bbox": {"l": 63.76100199999999, "t": 445.71453999999994, "r": 294.27582, "b": 454.08917, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "on", "bbox": {"l": 53.79800000000001, "t": 456.67355, "r": 62.989277, "b": 465.04819, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Picture", "bbox": {"l": 64.852997, "t": 456.71841, "r": 88.947144, "b": 465.05716, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "and", "bbox": {"l": 91.019997, "t": 456.67355, "r": 104.24454, "b": 465.04819, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "Table", "bbox": {"l": 106.108, "t": 456.71841, "r": 124.78053, "b": 465.05716, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "clusters of each dataset. We had to exclude", "bbox": {"l": 126.85500000000002, "t": 456.67355, "r": 277.63235, "b": 465.04819, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "Text", "bbox": {"l": 279.49701, "t": 456.71841, "r": 294.0484, "b": 465.05716, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "because successive paragraphs are often grouped together into a", "bbox": {"l": 53.79800000000001, "t": 467.63254, "r": 294.04709, "b": 476.00717, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "single object in DocBank. This paragraph grouping is incompatible", "bbox": {"l": 53.79800000000001, "t": 478.59155, "r": 294.04532, "b": 486.96619, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "with the individual paragraphs of DocLayNet. As can be seen in", "bbox": {"l": 53.466999, "t": 489.55054, "r": 294.04538, "b": 497.92517, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "Table 5, DocLayNet trained models yield better performance com-", "bbox": {"l": 53.528999, "t": 500.50955, "r": 295.55908, "b": 508.88419, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "pared to the previous datasets. It is noteworthy that the models", "bbox": {"l": 53.79800000000001, "t": 511.46854, "r": 294.04712, "b": 519.84317, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "trained on PubLayNet and DocBank perform very well on their", "bbox": {"l": 53.79800000000001, "t": 522.42755, "r": 294.21179, "b": 530.80219, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "own test set, but have a much lower performance on the foreign", "bbox": {"l": 53.79800000000001, "t": 533.38654, "r": 294.04712, "b": 541.76117, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "datasets. While this also applies to DocLayNet, the difference is", "bbox": {"l": 53.79800000000001, "t": 544.34555, "r": 294.04715, "b": 552.72017, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "far less pronounced. Thus we conclude that DocLayNet trained", "bbox": {"l": 53.79800000000001, "t": 555.3045500000001, "r": 294.04712, "b": 563.67917, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "models are overall more robust and will produce better results for", "bbox": {"l": 53.79800000000001, "t": 566.26256, "r": 294.21411, "b": 574.63718, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "challenging, unseen layouts.", "bbox": {"l": 53.79800000000001, "t": 577.22156, "r": 157.52132, "b": 585.59618, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "For comparison of DocBank with DocLayNet, we trained only on Picture and Table clusters of each dataset. We had to exclude Text because successive paragraphs are often grouped together into a single object in DocBank. This paragraph grouping is incompatible with the individual paragraphs of DocLayNet. As can be seen in Table 5, DocLayNet trained models yield better performance compared to the previous datasets. It is noteworthy that the models trained on PubLayNet and DocBank perform very well on their own test set, but have a much lower performance on the foreign datasets. While this also applies to DocLayNet, the difference is far less pronounced. Thus we conclude that DocLayNet trained models are overall more robust and will produce better results for challenging, unseen layouts."}, {"label": "section_header", "id": 8, "page_no": 7, "cluster": {"id": 8, "label": "section_header", "bbox": {"l": 53.79800000000001, "t": 605.06091, "r": 156.00534, "b": 615.37001, "coord_origin": "TOPLEFT"}, "confidence": 0.9574698805809021, "cells": [{"id": 103, "text": "Example Predictions", "bbox": {"l": 53.79800000000001, "t": 605.06091, "r": 156.00534, "b": 615.37001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Example Predictions"}, {"label": "text", "id": 2, "page_no": 7, "cluster": {"id": 2, "label": "text", "bbox": {"l": 53.528999, "t": 620.26355, "r": 295.55844, "b": 705.350174, "coord_origin": "TOPLEFT"}, "confidence": 0.9859886169433594, "cells": [{"id": 104, "text": "To conclude this section, we illustrate the quality of layout predic-", "bbox": {"l": 53.528999, "t": 620.26355, "r": 295.5571, "b": 628.63817, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "tions one can expect from DocLayNet-trained models by providing", "bbox": {"l": 53.79800000000001, "t": 631.22255, "r": 294.04532, "b": 639.59717, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "a selection of examples without any further post-processing ap-", "bbox": {"l": 53.79800000000001, "t": 642.18155, "r": 295.55618, "b": 650.5561700000001, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "plied. Figure 6 shows selected layout predictions on pages from the", "bbox": {"l": 53.79800000000001, "t": 653.14055, "r": 294.04541, "b": 661.51517, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "test-set of DocLayNet. Results look decent in general across docu-", "bbox": {"l": 53.79800000000001, "t": 664.09956, "r": 295.55844, "b": 672.47417, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "ment categories, however one can also observe mistakes such as", "bbox": {"l": 53.79800000000001, "t": 675.05756, "r": 294.04712, "b": 683.43217, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "overlapping clusters of different classes, or entirely missing boxes", "bbox": {"l": 53.79800000000001, "t": 686.01656, "r": 294.04535, "b": 694.391174, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "due to low confidence.", "bbox": {"l": 53.79800000000001, "t": 696.975555, "r": 136.07368, "b": 705.350174, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "To conclude this section, we illustrate the quality of layout predictions one can expect from DocLayNet-trained models by providing a selection of examples without any further post-processing applied. Figure 6 shows selected layout predictions on pages from the test-set of DocLayNet. Results look decent in general across document categories, however one can also observe mistakes such as overlapping clusters of different classes, or entirely missing boxes due to low confidence."}, {"label": "section_header", "id": 13, "page_no": 7, "cluster": {"id": 13, "label": "section_header", "bbox": {"l": 317.95502, "t": 85.85986000000003, "r": 405.72961, "b": 96.16900999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.931998074054718, "cells": [{"id": 112, "text": "6", "bbox": {"l": 317.95502, "t": 85.85986000000003, "r": 323.56229, "b": 96.16900999999996, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "CONCLUSION", "bbox": {"l": 334.47137, "t": 85.85986000000003, "r": 405.72961, "b": 96.16900999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "6 CONCLUSION"}, {"label": "text", "id": 3, "page_no": 7, "cluster": {"id": 3, "label": "text", "bbox": {"l": 317.95499, "t": 101.06151999999997, "r": 559.71375, "b": 186.14917000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.985493004322052, "cells": [{"id": 114, "text": "In this paper, we presented the DocLayNet dataset. It provides the", "bbox": {"l": 317.95499, "t": 101.06151999999997, "r": 558.2038, "b": 109.43615999999997, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "document conversion and layout analysis research community a", "bbox": {"l": 317.95499, "t": 112.02057000000002, "r": 558.2041, "b": 120.39520000000005, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "new and challenging dataset to improve and fine-tune novel ML", "bbox": {"l": 317.95499, "t": 122.97955000000002, "r": 558.43274, "b": 131.35419000000002, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "methods on. In contrast to many other datasets, DocLayNet was", "bbox": {"l": 317.95499, "t": 133.93854, "r": 558.20416, "b": 142.31317, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "created by human annotation in order to obtain reliable layout", "bbox": {"l": 317.95499, "t": 144.89752, "r": 558.20422, "b": 153.27215999999999, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "ground-truth on a wide variety of publication- and typesetting-", "bbox": {"l": 317.95499, "t": 155.85657000000003, "r": 559.71313, "b": 164.23119999999994, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "styles. Including a large proportion of documents outside the scien-", "bbox": {"l": 317.95499, "t": 166.81555000000003, "r": 559.71375, "b": 175.19019000000003, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "tific publishing domain adds significant value in this respect.", "bbox": {"l": 317.95499, "t": 177.77454, "r": 540.04382, "b": 186.14917000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In this paper, we presented the DocLayNet dataset. It provides the document conversion and layout analysis research community a new and challenging dataset to improve and fine-tune novel ML methods on. In contrast to many other datasets, DocLayNet was created by human annotation in order to obtain reliable layout ground-truth on a wide variety of publication- and typesettingstyles. Including a large proportion of documents outside the scientific publishing domain adds significant value in this respect."}, {"label": "text", "id": 6, "page_no": 7, "cluster": {"id": 6, "label": "text", "bbox": {"l": 317.686, "t": 188.73352, "r": 559.71704, "b": 284.77917, "coord_origin": "TOPLEFT"}, "confidence": 0.9800531268119812, "cells": [{"id": 122, "text": "From the dataset, we have derived on the one hand reference", "bbox": {"l": 327.918, "t": 188.73352, "r": 558.19836, "b": 197.10815000000002, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "metrics for human performance on document-layout annotation", "bbox": {"l": 317.95499, "t": 199.69257000000005, "r": 558.20404, "b": 208.06719999999996, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "(through double and triple annotations) and on the other hand eval-", "bbox": {"l": 317.686, "t": 210.65155000000004, "r": 559.71704, "b": 219.02617999999995, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "uated the baseline performance of commonly used object detection", "bbox": {"l": 317.95499, "t": 221.60956, "r": 558.20245, "b": 229.98419, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "methods. We also illustrated the impact of various dataset-related", "bbox": {"l": 317.95499, "t": 232.56853999999998, "r": 558.20502, "b": 240.94317999999998, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "aspects on model performance through data-ablation experiments,", "bbox": {"l": 317.95499, "t": 243.52752999999996, "r": 559.18408, "b": 251.90215999999998, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "both from a size and class-label perspective. Last but not least, we", "bbox": {"l": 317.95499, "t": 254.48650999999995, "r": 558.20227, "b": 262.86114999999995, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "compared the accuracy of models trained on other public datasets", "bbox": {"l": 317.95499, "t": 265.44556, "r": 558.20349, "b": 273.82019, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "and showed that DocLayNet trained models are more robust.", "bbox": {"l": 317.95499, "t": 276.40454, "r": 540.99426, "b": 284.77917, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "From the dataset, we have derived on the one hand reference metrics for human performance on document-layout annotation (through double and triple annotations) and on the other hand evaluated the baseline performance of commonly used object detection methods. We also illustrated the impact of various dataset-related aspects on model performance through data-ablation experiments, both from a size and class-label perspective. Last but not least, we compared the accuracy of models trained on other public datasets and showed that DocLayNet trained models are more robust."}, {"label": "text", "id": 7, "page_no": 7, "cluster": {"id": 7, "label": "text", "bbox": {"l": 317.62299, "t": 287.36353, "r": 558.43469, "b": 317.65616000000006, "coord_origin": "TOPLEFT"}, "confidence": 0.9676101207733154, "cells": [{"id": 131, "text": "To date, there is still a significant gap between human and ML", "bbox": {"l": 327.918, "t": 287.36353, "r": 558.43469, "b": 295.73816, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "accuracy on the layout interpretation task, and we hope that this", "bbox": {"l": 317.95499, "t": 298.32254, "r": 558.20013, "b": 306.69717, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "work will inspire the research community to close that gap.", "bbox": {"l": 317.62299, "t": 309.28152, "r": 535.65015, "b": 317.65616000000006, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "To date, there is still a significant gap between human and ML accuracy on the layout interpretation task, and we hope that this work will inspire the research community to close that gap."}, {"label": "section_header", "id": 11, "page_no": 7, "cluster": {"id": 11, "label": "section_header", "bbox": {"l": 317.95499, "t": 335.09189, "r": 387.3696, "b": 345.40097, "coord_origin": "TOPLEFT"}, "confidence": 0.9378752708435059, "cells": [{"id": 134, "text": "REFERENCES", "bbox": {"l": 317.95499, "t": 335.09189, "r": 387.3696, "b": 345.40097, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "REFERENCES"}, {"label": "list_item", "id": 12, "page_no": 7, "cluster": {"id": 12, "label": "list_item", "bbox": {"l": 321.198, "t": 348.70233, "r": 558.20099, "b": 371.16286999999994, "coord_origin": "TOPLEFT"}, "confidence": 0.9372857213020325, "cells": [{"id": 135, "text": "[1]", "bbox": {"l": 321.198, "t": 348.70233, "r": 329.72415, "b": 355.21588, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "Max G\u00f6bel, Tamir Hassan, Ermelinda Oro, and Giorgio Orsi. Icdar 2013 table", "bbox": {"l": 331.53516, "t": 348.70233, "r": 558.19904, "b": 355.21588, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "competition. In", "bbox": {"l": 333.39099, "t": 356.67236, "r": 379.36414, "b": 363.18591, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "2013 12th International Conference on Document Analysis and", "bbox": {"l": 381.37201, "t": 356.70724, "r": 558.20099, "b": 363.19287, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "Recognition", "bbox": {"l": 333.39099, "t": 364.67724999999996, "r": 365.59601, "b": 371.16286999999994, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": ", pages 1449-1453, 2013.", "bbox": {"l": 365.59601, "t": 364.64236, "r": 434.29489, "b": 371.15591, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[1] Max G\u00f6bel, Tamir Hassan, Ermelinda Oro, and Giorgio Orsi. Icdar 2013 table competition. In 2013 12th International Conference on Document Analysis and Recognition , pages 1449-1453, 2013."}, {"label": "list_item", "id": 9, "page_no": 7, "cluster": {"id": 9, "label": "list_item", "bbox": {"l": 321.198, "t": 372.61237, "r": 559.37982, "b": 403.04287999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9480945467948914, "cells": [{"id": 141, "text": "[2]", "bbox": {"l": 321.198, "t": 372.61237, "r": 329.85956, "b": 379.12592, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "Christian Clausner, Apostolos Antonacopoulos, and Stefan Pletschacher. Ic-", "bbox": {"l": 331.69931, "t": 372.61237, "r": 559.37976, "b": 379.12592, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "dar2017 competition on recognition of documents with complex layouts -", "bbox": {"l": 333.39099, "t": 380.58237, "r": 559.37982, "b": 387.09592, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "rdcl2017. In", "bbox": {"l": 333.39099, "t": 388.55236999999994, "r": 367.4339, "b": 395.06592, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "2017 14th IAPR International Conference on Document Analysis and", "bbox": {"l": 369.17401, "t": 388.58725000000004, "r": 558.20422, "b": 395.07288, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "Recognition (ICDAR)", "bbox": {"l": 333.39099, "t": 396.55725, "r": 390.87601, "b": 403.04287999999997, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": ", volume 01, pages 1404-1410, 2017.", "bbox": {"l": 390.87698, "t": 396.52237, "r": 492.17831, "b": 403.03592, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[2] Christian Clausner, Apostolos Antonacopoulos, and Stefan Pletschacher. Icdar2017 competition on recognition of documents with complex layouts rdcl2017. In 2017 14th IAPR International Conference on Document Analysis and Recognition (ICDAR) , volume 01, pages 1404-1410, 2017."}, {"label": "list_item", "id": 17, "page_no": 7, "cluster": {"id": 17, "label": "list_item", "bbox": {"l": 321.198, "t": 404.49237, "r": 558.20013, "b": 426.94689999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9257517457008362, "cells": [{"id": 148, "text": "[3]", "bbox": {"l": 321.198, "t": 404.49237, "r": 329.53583, "b": 411.00592, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "Herv\u00e9 D\u00e9jean, Jean-Luc Meunier, Liangcai Gao, Yilun Huang, Yu Fang, Florian", "bbox": {"l": 331.30682, "t": 404.49237, "r": 558.19958, "b": 411.00592, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "Kleber, and Eva-Maria Lang. ICDAR 2019 Competition on Table Detection and", "bbox": {"l": 333.39099, "t": 412.46335, "r": 558.20013, "b": 418.9769, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "Recognition (cTDaR), April 2019. http://sac.founderit.com/.", "bbox": {"l": 333.39099, "t": 420.43335, "r": 501.80127, "b": 426.94689999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[3] Herv\u00e9 D\u00e9jean, Jean-Luc Meunier, Liangcai Gao, Yilun Huang, Yu Fang, Florian Kleber, and Eva-Maria Lang. ICDAR 2019 Competition on Table Detection and Recognition (cTDaR), April 2019. http://sac.founderit.com/."}, {"label": "list_item", "id": 16, "page_no": 7, "cluster": {"id": 16, "label": "list_item", "bbox": {"l": 321.198, "t": 428.40335, "r": 559.37872, "b": 458.8269, "coord_origin": "TOPLEFT"}, "confidence": 0.9270977973937988, "cells": [{"id": 152, "text": "[4]", "bbox": {"l": 321.198, "t": 428.40335, "r": 329.91299, "b": 434.9169, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "Antonio Jimeno Yepes, Peter Zhong, and Douglas Burdick. Competition on", "bbox": {"l": 331.7641, "t": 428.40335, "r": 558.19885, "b": 434.9169, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "scientific literature parsing. In", "bbox": {"l": 333.39099, "t": 436.3733500000001, "r": 423.77225, "b": 442.8869, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "Proceedings of the International Conference on", "bbox": {"l": 425.909, "t": 436.40823, "r": 558.20178, "b": 442.89386, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "Document Analysis and Recognition", "bbox": {"l": 333.39099, "t": 444.37823, "r": 429.42697, "b": 450.86386, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": ", ICDAR, pages 605-617. LNCS 12824, Springer-", "bbox": {"l": 429.42400999999995, "t": 444.34335, "r": 559.37872, "b": 450.85689999999994, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "Verlag, sep 2021.", "bbox": {"l": 332.819, "t": 452.31335, "r": 380.01764, "b": 458.8269, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[4] Antonio Jimeno Yepes, Peter Zhong, and Douglas Burdick. Competition on scientific literature parsing. In Proceedings of the International Conference on Document Analysis and Recognition , ICDAR, pages 605-617. LNCS 12824, SpringerVerlag, sep 2021."}, {"label": "list_item", "id": 14, "page_no": 7, "cluster": {"id": 14, "label": "list_item", "bbox": {"l": 321.198, "t": 460.28336, "r": 559.02625, "b": 490.70792, "coord_origin": "TOPLEFT"}, "confidence": 0.9290012121200562, "cells": [{"id": 159, "text": "[5]", "bbox": {"l": 321.198, "t": 460.28336, "r": 329.22977, "b": 466.79691, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "Logan Markewich, Hao Zhang, Yubin Xing, Navid Lambert-Shirzad, Jiang Zhexin,", "bbox": {"l": 330.93576, "t": 460.28336, "r": 558.97156, "b": 466.79691, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "Roy Lee, Zhi Li, and Seok-Bum Ko. Segmentation for document layout analysis:", "bbox": {"l": 333.39099, "t": 468.25336, "r": 559.02625, "b": 474.76691, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "not dead yet.", "bbox": {"l": 333.39099, "t": 476.22437, "r": 368.85431, "b": 482.73792, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "International Journal on Document Analysis and Recognition (IJDAR)", "bbox": {"l": 370.811, "t": 476.25925, "r": 557.46326, "b": 482.74487, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": ",", "bbox": {"l": 557.46503, "t": 476.22437, "r": 558.96857, "b": 482.73792, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "pages 1-11, 01 2022.", "bbox": {"l": 333.39099, "t": 484.19437, "r": 390.82715, "b": 490.70792, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[5] Logan Markewich, Hao Zhang, Yubin Xing, Navid Lambert-Shirzad, Jiang Zhexin, Roy Lee, Zhi Li, and Seok-Bum Ko. Segmentation for document layout analysis: not dead yet. International Journal on Document Analysis and Recognition (IJDAR) , pages 1-11, 01 2022."}, {"label": "list_item", "id": 15, "page_no": 7, "cluster": {"id": 15, "label": "list_item", "bbox": {"l": 321.198, "t": 492.16437, "r": 558.20361, "b": 514.6248800000001, "coord_origin": "TOPLEFT"}, "confidence": 0.927480161190033, "cells": [{"id": 166, "text": "[6]", "bbox": {"l": 321.198, "t": 492.16437, "r": 329.42145, "b": 498.67792, "coord_origin": "TOPLEFT"}}, {"id": 167, "text": "Xu Zhong, Jianbin Tang, and Antonio Jimeno-Yepes. Publaynet: Largest dataset", "bbox": {"l": 331.16812, "t": 492.16437, "r": 558.20361, "b": 498.67792, "coord_origin": "TOPLEFT"}}, {"id": 168, "text": "ever for document layout analysis. In", "bbox": {"l": 333.39099, "t": 500.13437, "r": 438.6101100000001, "b": 506.64792, "coord_origin": "TOPLEFT"}}, {"id": 169, "text": "Proceedings of the International Conference", "bbox": {"l": 440.349, "t": 500.16925, "r": 558.19958, "b": 506.65488, "coord_origin": "TOPLEFT"}}, {"id": 170, "text": "on Document Analysis and Recognition", "bbox": {"l": 333.39099, "t": 508.13925, "r": 441.40118, "b": 514.6248800000001, "coord_origin": "TOPLEFT"}}, {"id": 171, "text": ", ICDAR, pages 1015-1022, sep 2019.", "bbox": {"l": 441.4019799999999, "t": 508.10437, "r": 544.78162, "b": 514.61792, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[6] Xu Zhong, Jianbin Tang, and Antonio Jimeno-Yepes. Publaynet: Largest dataset ever for document layout analysis. In Proceedings of the International Conference on Document Analysis and Recognition , ICDAR, pages 1015-1022, sep 2019."}, {"label": "list_item", "id": 10, "page_no": 7, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 321.19797, "t": 516.07437, "r": 558.9715, "b": 554.46889, "coord_origin": "TOPLEFT"}, "confidence": 0.9426893591880798, "cells": [{"id": 172, "text": "[7]", "bbox": {"l": 321.19797, "t": 516.07437, "r": 329.74161, "b": 522.5879199999999, "coord_origin": "TOPLEFT"}}, {"id": 173, "text": "Minghao Li, Yiheng Xu, Lei Cui, Shaohan Huang, Furu Wei, Zhoujun Li, and", "bbox": {"l": 331.55634, "t": 516.07437, "r": 558.19897, "b": 522.5879199999999, "coord_origin": "TOPLEFT"}}, {"id": 174, "text": "Ming Zhou. Docbank: A benchmark dataset for document layout analysis. In", "bbox": {"l": 333.39099, "t": 524.0443700000001, "r": 558.19891, "b": 530.55792, "coord_origin": "TOPLEFT"}}, {"id": 175, "text": "Proceedings of the 28th International Conference on Computational Linguistics", "bbox": {"l": 333.39099, "t": 532.04922, "r": 557.40228, "b": 538.53487, "coord_origin": "TOPLEFT"}}, {"id": 176, "text": ",", "bbox": {"l": 557.40399, "t": 532.01437, "r": 558.96893, "b": 538.5278900000001, "coord_origin": "TOPLEFT"}}, {"id": 177, "text": "COLING, pages 949-960. International Committee on Computational Linguistics,", "bbox": {"l": 333.39099, "t": 539.98438, "r": 558.9715, "b": 546.49789, "coord_origin": "TOPLEFT"}}, {"id": 178, "text": "dec 2020.", "bbox": {"l": 333.39099, "t": 547.95535, "r": 359.31955, "b": 554.46889, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[7] Minghao Li, Yiheng Xu, Lei Cui, Shaohan Huang, Furu Wei, Zhoujun Li, and Ming Zhou. Docbank: A benchmark dataset for document layout analysis. In Proceedings of the 28th International Conference on Computational Linguistics , COLING, pages 949-960. International Committee on Computational Linguistics, dec 2020."}, {"label": "list_item", "id": 19, "page_no": 7, "cluster": {"id": 19, "label": "list_item", "bbox": {"l": 321.198, "t": 555.92535, "r": 558.90222, "b": 578.38586, "coord_origin": "TOPLEFT"}, "confidence": 0.9139686226844788, "cells": [{"id": 179, "text": "[8]", "bbox": {"l": 321.198, "t": 555.92535, "r": 329.7088, "b": 562.43889, "coord_origin": "TOPLEFT"}}, {"id": 180, "text": "Riaz Ahmad, Muhammad Tanvir Afzal, and M. Qadir. Information extraction", "bbox": {"l": 331.51654, "t": 555.92535, "r": 558.19891, "b": 562.43889, "coord_origin": "TOPLEFT"}}, {"id": 181, "text": "from pdf sources based on rule-based system using integrated formats. In", "bbox": {"l": 333.39099, "t": 563.89536, "r": 535.54352, "b": 570.40889, "coord_origin": "TOPLEFT"}}, {"id": 182, "text": "SemWe-", "bbox": {"l": 536.96399, "t": 563.93024, "r": 558.90222, "b": 570.4158600000001, "coord_origin": "TOPLEFT"}}, {"id": 183, "text": "bEval@ESWC", "bbox": {"l": 333.39099, "t": 571.9002399999999, "r": 371.94217, "b": 578.38586, "coord_origin": "TOPLEFT"}}, {"id": 184, "text": ", 2016.", "bbox": {"l": 371.94299, "t": 571.86536, "r": 389.72617, "b": 578.3788900000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[8] Riaz Ahmad, Muhammad Tanvir Afzal, and M. Qadir. Information extraction from pdf sources based on rule-based system using integrated formats. In SemWebEval@ESWC , 2016."}, {"label": "list_item", "id": 21, "page_no": 7, "cluster": {"id": 21, "label": "list_item", "bbox": {"l": 321.198, "t": 579.83536, "r": 559.27448, "b": 610.2589, "coord_origin": "TOPLEFT"}, "confidence": 0.9113100171089172, "cells": [{"id": 185, "text": "[9]", "bbox": {"l": 321.198, "t": 579.83536, "r": 329.45999, "b": 586.34889, "coord_origin": "TOPLEFT"}}, {"id": 186, "text": "Ross B. Girshick, Jeff Donahue, Trevor Darrell, and Jitendra Malik. Rich feature", "bbox": {"l": 331.21487, "t": 579.83536, "r": 558.19843, "b": 586.34889, "coord_origin": "TOPLEFT"}}, {"id": 187, "text": "hierarchies for accurate object detection and semantic segmentation. In", "bbox": {"l": 333.39099, "t": 587.8053600000001, "r": 543.05487, "b": 594.31889, "coord_origin": "TOPLEFT"}}, {"id": 188, "text": "IEEE", "bbox": {"l": 544.98499, "t": 587.84024, "r": 558.20148, "b": 594.32587, "coord_origin": "TOPLEFT"}}, {"id": 189, "text": "Conference on Computer Vision and Pattern Recognition", "bbox": {"l": 333.39099, "t": 595.81024, "r": 491.61166, "b": 602.29587, "coord_origin": "TOPLEFT"}}, {"id": 190, "text": ", CVPR, pages 580-587.", "bbox": {"l": 491.61301, "t": 595.77536, "r": 559.27448, "b": 602.28889, "coord_origin": "TOPLEFT"}}, {"id": 191, "text": "IEEE Computer Society, jun 2014.", "bbox": {"l": 333.39099, "t": 603.74536, "r": 428.59726000000006, "b": 610.2589, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[9] Ross B. Girshick, Jeff Donahue, Trevor Darrell, and Jitendra Malik. Rich feature hierarchies for accurate object detection and semantic segmentation. In IEEE Conference on Computer Vision and Pattern Recognition , CVPR, pages 580-587. IEEE Computer Society, jun 2014."}, {"label": "list_item", "id": 22, "page_no": 7, "cluster": {"id": 22, "label": "list_item", "bbox": {"l": 317.95499, "t": 611.71536, "r": 558.20203, "b": 626.20686, "coord_origin": "TOPLEFT"}, "confidence": 0.9028767347335815, "cells": [{"id": 192, "text": "[10]", "bbox": {"l": 317.95499, "t": 611.71536, "r": 329.54767, "b": 618.2289000000001, "coord_origin": "TOPLEFT"}}, {"id": 193, "text": "Ross B. Girshick. Fast R-CNN. In", "bbox": {"l": 331.31268, "t": 611.71536, "r": 425.1554, "b": 618.2289000000001, "coord_origin": "TOPLEFT"}}, {"id": 194, "text": "2015 IEEE International Conference on Computer", "bbox": {"l": 426.77802, "t": 611.75024, "r": 558.20203, "b": 618.23587, "coord_origin": "TOPLEFT"}}, {"id": 195, "text": "Vision", "bbox": {"l": 333.39099, "t": 619.72124, "r": 350.59537, "b": 626.20686, "coord_origin": "TOPLEFT"}}, {"id": 196, "text": ", ICCV, pages 1440-1448. IEEE Computer Society, dec 2015.", "bbox": {"l": 350.59598, "t": 619.68637, "r": 518.58777, "b": 626.19989, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[10] Ross B. Girshick. Fast R-CNN. In 2015 IEEE International Conference on Computer Vision , ICCV, pages 1440-1448. IEEE Computer Society, dec 2015."}, {"label": "list_item", "id": 20, "page_no": 7, "cluster": {"id": 20, "label": "list_item", "bbox": {"l": 317.95499, "t": 627.65637, "r": 558.20142, "b": 650.1168700000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9127691984176636, "cells": [{"id": 197, "text": "[11]", "bbox": {"l": 317.95499, "t": 627.65637, "r": 329.5459, "b": 634.16989, "coord_origin": "TOPLEFT"}}, {"id": 198, "text": "Shaoqing Ren, Kaiming He, Ross Girshick, and Jian Sun. Faster r-cnn: Towards", "bbox": {"l": 331.31064, "t": 627.65637, "r": 558.20142, "b": 634.16989, "coord_origin": "TOPLEFT"}}, {"id": 199, "text": "real-time object detection with region proposal networks.", "bbox": {"l": 333.39099, "t": 635.62637, "r": 497.50909, "b": 642.13989, "coord_origin": "TOPLEFT"}}, {"id": 200, "text": "IEEE Transactions on", "bbox": {"l": 500.01401, "t": 635.66124, "r": 558.19885, "b": 642.14687, "coord_origin": "TOPLEFT"}}, {"id": 201, "text": "Pattern Analysis and Machine Intelligence", "bbox": {"l": 333.39099, "t": 643.6312399999999, "r": 449.38620000000003, "b": 650.1168700000001, "coord_origin": "TOPLEFT"}}, {"id": 202, "text": ", 39(6):1137-1149, 2017.", "bbox": {"l": 449.38699, "t": 643.59637, "r": 515.74268, "b": 650.10989, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[11] Shaoqing Ren, Kaiming He, Ross Girshick, and Jian Sun. Faster r-cnn: Towards real-time object detection with region proposal networks. IEEE Transactions on Pattern Analysis and Machine Intelligence , 39(6):1137-1149, 2017."}, {"label": "list_item", "id": 18, "page_no": 7, "cluster": {"id": 18, "label": "list_item", "bbox": {"l": 317.95499, "t": 651.56638, "r": 559.27808, "b": 674.01989, "coord_origin": "TOPLEFT"}, "confidence": 0.9142459630966187, "cells": [{"id": 203, "text": "[12]", "bbox": {"l": 317.95499, "t": 651.56638, "r": 329.41763, "b": 658.0799, "coord_origin": "TOPLEFT"}}, {"id": 204, "text": "Kaiming He, Georgia Gkioxari, Piotr Doll\u00e1r, and Ross B. Girshick. Mask R-CNN.", "bbox": {"l": 331.16287, "t": 651.56638, "r": 559.27808, "b": 658.0799, "coord_origin": "TOPLEFT"}}, {"id": 205, "text": "In", "bbox": {"l": 333.39099, "t": 659.53638, "r": 339.35904, "b": 666.0499, "coord_origin": "TOPLEFT"}}, {"id": 206, "text": "IEEE International Conference on Computer Vision", "bbox": {"l": 341.56299, "t": 659.57124, "r": 485.8273, "b": 666.05687, "coord_origin": "TOPLEFT"}}, {"id": 207, "text": ", ICCV, pages 2980-2988.", "bbox": {"l": 485.82901, "t": 659.53638, "r": 559.27356, "b": 666.0499, "coord_origin": "TOPLEFT"}}, {"id": 208, "text": "IEEE Computer Society, Oct 2017.", "bbox": {"l": 333.39099, "t": 667.50636, "r": 429.30161000000004, "b": 674.01989, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[12] Kaiming He, Georgia Gkioxari, Piotr Doll\u00e1r, and Ross B. Girshick. Mask R-CNN. In IEEE International Conference on Computer Vision , ICCV, pages 2980-2988. IEEE Computer Society, Oct 2017."}, {"label": "list_item", "id": 23, "page_no": 7, "cluster": {"id": 23, "label": "list_item", "bbox": {"l": 317.95499, "t": 675.47636, "r": 558.97156, "b": 705.900894, "coord_origin": "TOPLEFT"}, "confidence": 0.889543354511261, "cells": [{"id": 209, "text": "[13]", "bbox": {"l": 317.95499, "t": 675.47636, "r": 330.11407, "b": 681.9898900000001, "coord_origin": "TOPLEFT"}}, {"id": 210, "text": "Glenn Jocher, Alex Stoken, Ayush Chaurasia, Jirka Borovec, NanoCode012,", "bbox": {"l": 331.96533, "t": 675.47636, "r": 558.96716, "b": 681.9898900000001, "coord_origin": "TOPLEFT"}}, {"id": 211, "text": "TaoXie, Yonghye Kwon, Kalen Michael, Liu Changyu, Jiacong Fang, Abhiram V,", "bbox": {"l": 333.18201, "t": 683.44637, "r": 558.96661, "b": 689.95989, "coord_origin": "TOPLEFT"}}, {"id": 212, "text": "Laughing, tkianai, yxNONG, Piotr Skalski, Adam Hogan, Jebastin Nadar, imyhxy,", "bbox": {"l": 333.39099, "t": 691.41737, "r": 558.97156, "b": 697.930893, "coord_origin": "TOPLEFT"}}, {"id": 213, "text": "Lorenzo Mammana, Alex Wang, Cristi Fati, Diego Montes, Jan Hajek, Laurentiu", "bbox": {"l": 333.39099, "t": 699.387367, "r": 558.20001, "b": 705.900894, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[13] Glenn Jocher, Alex Stoken, Ayush Chaurasia, Jirka Borovec, NanoCode012, TaoXie, Yonghye Kwon, Kalen Michael, Liu Changyu, Jiacong Fang, Abhiram V, Laughing, tkianai, yxNONG, Piotr Skalski, Adam Hogan, Jebastin Nadar, imyhxy, Lorenzo Mammana, Alex Wang, Cristi Fati, Diego Montes, Jan Hajek, Laurentiu"}], "headers": [{"label": "page_header", "id": 24, "page_no": 7, "cluster": {"id": 24, "label": "page_header", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.7984216809272766, "cells": [{"id": 0, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 246.24382, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar", "bbox": {"l": 253.13897999999998, "t": 60.30902000000003, "r": 558.20288, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "KDD '22, August 14-18, 2022, Washington, DC, USA Birgit Pfitzmann, Christoph Auer, Michele Dolfi, Ahmed S. Nassar, and Peter Staar"}]}}, {"page_no": 8, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "4bed2a8aa51ac37058e79605821bbc426d032b0b6ca8bdf3409ed8508ccd8c67", "bbox": {"l": 231.8804, "t": 301.50543, "r": 235.14504999999997, "b": 414.69144, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "2f2a06d08f5ad565d0f5e815f4ddf666365b2cff435cdaeb8850217e8a8efabf", "bbox": {"l": 395.06876, "t": 117.37183000000005, "r": 398.33353, "b": 230.55786, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "7f2fd7293e04bf4f1756ae51f5779764933da1d1d2002e3915356050570fc75b", "bbox": {"l": 55.775887, "t": 301.50543, "r": 59.04052000000001, "b": 414.69144, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "1b81cf65f47456ad4faa725d1eb09879bd633af16cfe2bf8cea661b87907bfac", "bbox": {"l": 232.01364, "t": 117.37183000000005, "r": 235.27841000000004, "b": 230.55786, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "b60da9d26f488cb133e47d101d35fda1bdca2671ade60764d1cd569590270327", "bbox": {"l": 395.20047, "t": 301.50543, "r": 398.46512, "b": 414.69144, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "2b7b8355a42ebef0cf91583aad9f30f7c9fa63c5b05911730ba15275c024965b$^{A}$", "bbox": {"l": 55.775818, "t": 117.37183000000005, "r": 65.409912, "b": 230.55786, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "B", "bbox": {"l": 234.56980999999996, "t": 88.50183000000015, "r": 240.06987, "b": 97.01098999999988, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "C", "bbox": {"l": 397.81934, "t": 88.89355, "r": 403.3194, "b": 97.40270999999996, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "D", "bbox": {"l": 59.909843, "t": 266.75885000000005, "r": 65.409912, "b": 275.26793999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "E", "bbox": {"l": 234.77386, "t": 266.36707, "r": 239.85495000000003, "b": 274.87616, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "F", "bbox": {"l": 398.26144, "t": 266.75885000000005, "r": 402.91592, "b": 275.26793999999995, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Text", "bbox": {"l": 62.323874999999994, "t": 442.28543, "r": 70.895882, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Caption", "bbox": {"l": 80.16581, "t": 442.28543, "r": 95.565453, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "List-Item", "bbox": {"l": 104.94447, "t": 442.28543, "r": 122.38113000000001, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Formula", "bbox": {"l": 131.78354, "t": 442.28543, "r": 148.34625, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "Table", "bbox": {"l": 157.66106, "t": 442.28543, "r": 168.53032, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Section-Header", "bbox": {"l": 201.24315, "t": 442.28543, "r": 232.00499, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Picture", "bbox": {"l": 177.8381, "t": 442.28543, "r": 191.88956, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Page-Header", "bbox": {"l": 240.95844000000002, "t": 442.28543, "r": 266.61908, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Page-Footer", "bbox": {"l": 276.03928, "t": 442.28543, "r": 300.33261, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "Title", "bbox": {"l": 309.74615, "t": 442.28543, "r": 318.50473, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Figure 6: Example layout predictions on selected pages from the DocLayNet test-set. (A, D) exhibit favourable results on", "bbox": {"l": 53.79800000000001, "t": 464.48199, "r": 558.203, "b": 472.95523, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "coloured backgrounds. (B, C) show accurate list-item and paragraph differentiation despite densely-spaced lines. (E) demon-", "bbox": {"l": 53.79800000000001, "t": 475.44101, "r": 559.80786, "b": 483.91425, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "strates good table and figure distinction. (F) shows predictions on a Chinese patent with multiple overlaps, label confusion", "bbox": {"l": 53.79800000000001, "t": 486.39999, "r": 558.20294, "b": 494.87323, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "and missing boxes.", "bbox": {"l": 53.79800000000001, "t": 497.358, "r": 130.37105, "b": 505.83124, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Diaconu, Mai Thanh Minh, Marc, albinxavi, fatih, oleg, and wanghao yang. ul-", "bbox": {"l": 69.234001, "t": 527.06635, "r": 295.22406, "b": 533.5799, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "tralytics/yolov5: v6.0 - yolov5n nano models, roboflow integration, tensorflow", "bbox": {"l": 69.234001, "t": 535.03638, "r": 294.30612, "b": 541.5499, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "export, opencv dnn support, October 2021.", "bbox": {"l": 69.234001, "t": 543.00638, "r": 190.45259, "b": 549.5199, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "[14]", "bbox": {"l": 53.79800000000001, "t": 550.97638, "r": 65.286942, "b": 557.4899, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Nicolas Carion, Francisco Massa, Gabriel Synnaeve, Nicolas Usunier, Alexander", "bbox": {"l": 67.036171, "t": 550.97638, "r": 294.17709, "b": 557.4899, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Kirillov, and Sergey Zagoruyko. End-to-end object detection with transformers.", "bbox": {"l": 69.234001, "t": 558.94638, "r": 295.12177, "b": 565.4599000000001, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "CoRR", "bbox": {"l": 69.234001, "t": 566.95123, "r": 84.388069, "b": 573.43686, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": ", abs/2005.12872, 2020.", "bbox": {"l": 84.388, "t": 566.91635, "r": 147.7659, "b": 573.42989, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "[15]", "bbox": {"l": 53.79800000000001, "t": 574.88635, "r": 64.994034, "b": 581.39989, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Mingxing Tan, Ruoming Pang, and Quoc V. Le. Efficientdet: Scalable and efficient", "bbox": {"l": 66.698669, "t": 574.88635, "r": 294.04224, "b": 581.39989, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "object detection.", "bbox": {"l": 69.234001, "t": 582.85736, "r": 116.1049, "b": 589.3709, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "CoRR", "bbox": {"l": 118.616, "t": 582.89224, "r": 133.77007, "b": 589.37787, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": ", abs/1911.09070, 2019.", "bbox": {"l": 133.77, "t": 582.85736, "r": 197.14792, "b": 589.3709, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "[16]", "bbox": {"l": 53.79800399999999, "t": 590.82736, "r": 65.110367, "b": 597.3409, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Tsung-Yi Lin, Michael Maire, Serge J. Belongie, Lubomir D. Bourdev, Ross B. Gir-", "bbox": {"l": 66.832718, "t": 590.82736, "r": 295.22263, "b": 597.3409, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "shick, James Hays, Pietro Perona, Deva Ramanan, Piotr Doll\u00e1r, and C. Lawrence", "bbox": {"l": 69.234001, "t": 598.79736, "r": 294.04462, "b": 605.3109, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Zitnick. Microsoft COCO: common objects in context, 2014.", "bbox": {"l": 69.234001, "t": 606.76736, "r": 239.71553000000003, "b": 613.2809, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "[17]", "bbox": {"l": 53.79800000000001, "t": 614.7373699999999, "r": 65.177979, "b": 621.2509, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Yuxin Wu, Alexander Kirillov, Francisco Massa, Wan-Yen Lo, and Ross Girshick.", "bbox": {"l": 66.910622, "t": 614.7373699999999, "r": 295.12009, "b": 621.2509, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "Detectron2, 2019.", "bbox": {"l": 69.234001, "t": 622.70737, "r": 118.65732, "b": 629.22089, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "[18]", "bbox": {"l": 53.79800000000001, "t": 630.67737, "r": 65.022064, "b": 637.19089, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Nikolaos Livathinos, Cesar Berrospi, Maksym Lysak, Viktor Kuropiatnyk, Ahmed", "bbox": {"l": 66.730972, "t": 630.67737, "r": 294.04224, "b": 637.19089, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "Nassar, Andre Carvalho, Michele Dolfi, Christoph Auer, Kasper Dinkla, and Peter", "bbox": {"l": 69.234001, "t": 638.64737, "r": 294.17896, "b": 645.16089, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "W.", "bbox": {"l": 68.900002, "t": 646.6173699999999, "r": 76.877083, "b": 653.13089, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "J. Staar. Robust pdf document conversion using recurrent neural networks. In", "bbox": {"l": 78.580124, "t": 646.6173699999999, "r": 294.04312, "b": 653.13089, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Proceedings of the 35th Conference on Artificial Intelligence", "bbox": {"l": 69.234001, "t": 654.62325, "r": 233.43309000000002, "b": 661.10887, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": ", AAAI, pages 15137-", "bbox": {"l": 233.43401000000003, "t": 654.58838, "r": 294.8089, "b": 661.1019, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "15145, feb 2021.", "bbox": {"l": 69.073997, "t": 662.55836, "r": 113.53197, "b": 669.0718899999999, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "[19]", "bbox": {"l": 53.797997, "t": 670.52837, "r": 65.760811, "b": 677.04189, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Yiheng Xu, Minghao Li, Lei Cui, Shaohan Huang, Furu Wei, and Ming Zhou.", "bbox": {"l": 67.582199, "t": 670.52837, "r": 295.11609, "b": 677.04189, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Layoutlm: Pre-training of text and layout for document image understanding.", "bbox": {"l": 69.234001, "t": 678.49837, "r": 295.11606, "b": 685.01189, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "In", "bbox": {"l": 69.234001, "t": 686.46837, "r": 75.155228, "b": 692.981895, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Proceedings of the 26th ACM SIGKDD International Conference on Knowledge", "bbox": {"l": 76.891998, "t": 686.50323, "r": 294.04382, "b": 692.988869, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Discovery and Data Mining", "bbox": {"l": 69.234001, "t": 694.473236, "r": 144.91022, "b": 700.95887, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": ", KDD, pages 1192-1200, New York, USA, 2020. Asso-", "bbox": {"l": 144.908, "t": 694.4383700000001, "r": 295.22174, "b": 700.951897, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "ciation for Computing Machinery.", "bbox": {"l": 69.234001, "t": 702.408363, "r": 166.37207, "b": 708.92189, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "[20]", "bbox": {"l": 317.95499, "t": 527.06638, "r": 329.24017, "b": 533.57993, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "Shoubin Li, Xuyan Ma, Shuaiqun Pan, Jun Hu, Lin Shi, and Qing Wang. Vtlayout:", "bbox": {"l": 330.95837, "t": 527.06638, "r": 559.02637, "b": 533.57993, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "Fusion of visual and text features for document layout analysis, 2021.", "bbox": {"l": 333.39099, "t": 535.03638, "r": 530.03815, "b": 541.5499, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "[21]", "bbox": {"l": 317.95499, "t": 543.00638, "r": 329.54419, "b": 549.5199, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "Peng Zhang, Can Li, Liang Qiao, Zhanzhan Cheng, Shiliang Pu, Yi Niu, and Fei", "bbox": {"l": 331.30869, "t": 543.00638, "r": 558.20135, "b": 549.5199, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "Wu. Vsr: A unified framework for document layout analysis combining vision,", "bbox": {"l": 333.05701, "t": 550.97638, "r": 558.9715, "b": 557.4899, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "semantics and relations, 2021.", "bbox": {"l": 333.39099, "t": 558.94638, "r": 418.05988, "b": 565.4599000000001, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "[22]", "bbox": {"l": 317.95499, "t": 566.91638, "r": 330.14108, "b": 573.4299, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Peter W J Staar, Michele Dolfi, Christoph Auer, and Costas Bekas.", "bbox": {"l": 331.99646, "t": 566.91638, "r": 531.54553, "b": 573.4299, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "Corpus", "bbox": {"l": 537.12946, "t": 566.91635, "r": 558.19897, "b": 573.42989, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "conversion service: A machine learning platform to ingest documents at scale.", "bbox": {"l": 333.39099, "t": 574.88635, "r": 559.27539, "b": 581.39989, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "In", "bbox": {"l": 333.39099, "t": 582.85736, "r": 339.31223, "b": 589.3709, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "Proceedings of the 24th ACM SIGKDD International Conference on Knowledge", "bbox": {"l": 341.04901, "t": 582.89224, "r": 558.20081, "b": 589.37787, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "Discovery and Data Mining", "bbox": {"l": 333.39099, "t": 590.8622399999999, "r": 409.56577, "b": 597.3478700000001, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": ", KDD, pages 774-782. ACM, 2018.", "bbox": {"l": 409.56598, "t": 590.82736, "r": 507.31765999999993, "b": 597.3409, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "[23]", "bbox": {"l": 317.95499, "t": 598.79736, "r": 329.37976, "b": 605.3109, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "Connor Shorten and Taghi M. Khoshgoftaar. A survey on image data augmenta-", "bbox": {"l": 331.11923, "t": 598.79736, "r": 559.3783, "b": 605.3109, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "tion for deep learning.", "bbox": {"l": 333.39099, "t": 606.76736, "r": 396.9223, "b": 613.2809, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Journal of Big Data", "bbox": {"l": 399.43298, "t": 606.80225, "r": 453.66122, "b": 613.28787, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": ", 6(1):60, 2019.", "bbox": {"l": 453.66199, "t": 606.76736, "r": 493.49631, "b": 613.2809, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 13, "label": "page_header", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.8021690249443054, "cells": [{"id": 0, "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "page_header", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.8429245352745056, "cells": [{"id": 1, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "picture", "bbox": {"l": 52.963985443115234, "t": 84.73588562011719, "r": 556.931640625, "b": 442.1351318359375, "coord_origin": "TOPLEFT"}, "confidence": 0.8352116942405701, "cells": [{"id": 2, "text": "4bed2a8aa51ac37058e79605821bbc426d032b0b6ca8bdf3409ed8508ccd8c67", "bbox": {"l": 231.8804, "t": 301.50543, "r": 235.14504999999997, "b": 414.69144, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "2f2a06d08f5ad565d0f5e815f4ddf666365b2cff435cdaeb8850217e8a8efabf", "bbox": {"l": 395.06876, "t": 117.37183000000005, "r": 398.33353, "b": 230.55786, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "7f2fd7293e04bf4f1756ae51f5779764933da1d1d2002e3915356050570fc75b", "bbox": {"l": 55.775887, "t": 301.50543, "r": 59.04052000000001, "b": 414.69144, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "1b81cf65f47456ad4faa725d1eb09879bd633af16cfe2bf8cea661b87907bfac", "bbox": {"l": 232.01364, "t": 117.37183000000005, "r": 235.27841000000004, "b": 230.55786, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "b60da9d26f488cb133e47d101d35fda1bdca2671ade60764d1cd569590270327", "bbox": {"l": 395.20047, "t": 301.50543, "r": 398.46512, "b": 414.69144, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "2b7b8355a42ebef0cf91583aad9f30f7c9fa63c5b05911730ba15275c024965b$^{A}$", "bbox": {"l": 55.775818, "t": 117.37183000000005, "r": 65.409912, "b": 230.55786, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "B", "bbox": {"l": 234.56980999999996, "t": 88.50183000000015, "r": 240.06987, "b": 97.01098999999988, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "C", "bbox": {"l": 397.81934, "t": 88.89355, "r": 403.3194, "b": 97.40270999999996, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "D", "bbox": {"l": 59.909843, "t": 266.75885000000005, "r": 65.409912, "b": 275.26793999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "E", "bbox": {"l": 234.77386, "t": 266.36707, "r": 239.85495000000003, "b": 274.87616, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "F", "bbox": {"l": 398.26144, "t": 266.75885000000005, "r": 402.91592, "b": 275.26793999999995, "coord_origin": "TOPLEFT"}}], "children": [{"id": 17, "label": "text", "bbox": {"l": 231.8804, "t": 301.50543, "r": 235.14504999999997, "b": 414.69144, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 2, "text": "4bed2a8aa51ac37058e79605821bbc426d032b0b6ca8bdf3409ed8508ccd8c67", "bbox": {"l": 231.8804, "t": 301.50543, "r": 235.14504999999997, "b": 414.69144, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 395.06876, "t": 117.37183000000005, "r": 398.33353, "b": 230.55786, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 3, "text": "2f2a06d08f5ad565d0f5e815f4ddf666365b2cff435cdaeb8850217e8a8efabf", "bbox": {"l": 395.06876, "t": 117.37183000000005, "r": 398.33353, "b": 230.55786, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 55.775887, "t": 301.50543, "r": 59.04052000000001, "b": 414.69144, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 4, "text": "7f2fd7293e04bf4f1756ae51f5779764933da1d1d2002e3915356050570fc75b", "bbox": {"l": 55.775887, "t": 301.50543, "r": 59.04052000000001, "b": 414.69144, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 232.01364, "t": 117.37183000000005, "r": 235.27841000000004, "b": 230.55786, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 5, "text": "1b81cf65f47456ad4faa725d1eb09879bd633af16cfe2bf8cea661b87907bfac", "bbox": {"l": 232.01364, "t": 117.37183000000005, "r": 235.27841000000004, "b": 230.55786, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 395.20047, "t": 301.50543, "r": 398.46512, "b": 414.69144, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": "b60da9d26f488cb133e47d101d35fda1bdca2671ade60764d1cd569590270327", "bbox": {"l": 395.20047, "t": 301.50543, "r": 398.46512, "b": 414.69144, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 55.775818, "t": 117.37183000000005, "r": 65.409912, "b": 230.55786, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "2b7b8355a42ebef0cf91583aad9f30f7c9fa63c5b05911730ba15275c024965b$^{A}$", "bbox": {"l": 55.775818, "t": 117.37183000000005, "r": 65.409912, "b": 230.55786, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 234.56980999999996, "t": 88.50183000000015, "r": 240.06987, "b": 97.01098999999988, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "B", "bbox": {"l": 234.56980999999996, "t": 88.50183000000015, "r": 240.06987, "b": 97.01098999999988, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 397.81934, "t": 88.89355, "r": 403.3194, "b": 97.40270999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "C", "bbox": {"l": 397.81934, "t": 88.89355, "r": 403.3194, "b": 97.40270999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 59.909843, "t": 266.75885000000005, "r": 65.409912, "b": 275.26793999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "D", "bbox": {"l": 59.909843, "t": 266.75885000000005, "r": 65.409912, "b": 275.26793999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 234.77386, "t": 266.36707, "r": 239.85495000000003, "b": 274.87616, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "E", "bbox": {"l": 234.77386, "t": 266.36707, "r": 239.85495000000003, "b": 274.87616, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 398.26144, "t": 266.75885000000005, "r": 402.91592, "b": 275.26793999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "F", "bbox": {"l": 398.26144, "t": 266.75885000000005, "r": 402.91592, "b": 275.26793999999995, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 16, "label": "caption", "bbox": {"l": 62.323874999999994, "t": 442.28543, "r": 318.50473, "b": 448.26483, "coord_origin": "TOPLEFT"}, "confidence": 0.6248989701271057, "cells": [{"id": 13, "text": "Text", "bbox": {"l": 62.323874999999994, "t": 442.28543, "r": 70.895882, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Caption", "bbox": {"l": 80.16581, "t": 442.28543, "r": 95.565453, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "List-Item", "bbox": {"l": 104.94447, "t": 442.28543, "r": 122.38113000000001, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Formula", "bbox": {"l": 131.78354, "t": 442.28543, "r": 148.34625, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "Table", "bbox": {"l": 157.66106, "t": 442.28543, "r": 168.53032, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Section-Header", "bbox": {"l": 201.24315, "t": 442.28543, "r": 232.00499, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Picture", "bbox": {"l": 177.8381, "t": 442.28543, "r": 191.88956, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Page-Header", "bbox": {"l": 240.95844000000002, "t": 442.28543, "r": 266.61908, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Page-Footer", "bbox": {"l": 276.03928, "t": 442.28543, "r": 300.33261, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "Title", "bbox": {"l": 309.74615, "t": 442.28543, "r": 318.50473, "b": 448.26483, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "text", "bbox": {"l": 53.79800000000001, "t": 464.48199, "r": 559.80786, "b": 505.83124, "coord_origin": "TOPLEFT"}, "confidence": 0.8651240468025208, "cells": [{"id": 23, "text": "Figure 6: Example layout predictions on selected pages from the DocLayNet test-set. (A, D) exhibit favourable results on", "bbox": {"l": 53.79800000000001, "t": 464.48199, "r": 558.203, "b": 472.95523, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "coloured backgrounds. (B, C) show accurate list-item and paragraph differentiation despite densely-spaced lines. (E) demon-", "bbox": {"l": 53.79800000000001, "t": 475.44101, "r": 559.80786, "b": 483.91425, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "strates good table and figure distinction. (F) shows predictions on a Chinese patent with multiple overlaps, label confusion", "bbox": {"l": 53.79800000000001, "t": 486.39999, "r": 558.20294, "b": 494.87323, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "and missing boxes.", "bbox": {"l": 53.79800000000001, "t": 497.358, "r": 130.37105, "b": 505.83124, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "text", "bbox": {"l": 69.234001, "t": 527.06635, "r": 295.22406, "b": 549.5199, "coord_origin": "TOPLEFT"}, "confidence": 0.8445900082588196, "cells": [{"id": 27, "text": "Diaconu, Mai Thanh Minh, Marc, albinxavi, fatih, oleg, and wanghao yang. ul-", "bbox": {"l": 69.234001, "t": 527.06635, "r": 295.22406, "b": 533.5799, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "tralytics/yolov5: v6.0 - yolov5n nano models, roboflow integration, tensorflow", "bbox": {"l": 69.234001, "t": 535.03638, "r": 294.30612, "b": 541.5499, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "export, opencv dnn support, October 2021.", "bbox": {"l": 69.234001, "t": 543.00638, "r": 190.45259, "b": 549.5199, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "list_item", "bbox": {"l": 53.79800000000001, "t": 550.97638, "r": 295.12177, "b": 573.43686, "coord_origin": "TOPLEFT"}, "confidence": 0.8561117053031921, "cells": [{"id": 30, "text": "[14]", "bbox": {"l": 53.79800000000001, "t": 550.97638, "r": 65.286942, "b": 557.4899, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Nicolas Carion, Francisco Massa, Gabriel Synnaeve, Nicolas Usunier, Alexander", "bbox": {"l": 67.036171, "t": 550.97638, "r": 294.17709, "b": 557.4899, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Kirillov, and Sergey Zagoruyko. End-to-end object detection with transformers.", "bbox": {"l": 69.234001, "t": 558.94638, "r": 295.12177, "b": 565.4599000000001, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "CoRR", "bbox": {"l": 69.234001, "t": 566.95123, "r": 84.388069, "b": 573.43686, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": ", abs/2005.12872, 2020.", "bbox": {"l": 84.388, "t": 566.91635, "r": 147.7659, "b": 573.42989, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "list_item", "bbox": {"l": 53.79800000000001, "t": 574.88635, "r": 294.04224, "b": 589.37787, "coord_origin": "TOPLEFT"}, "confidence": 0.8615185618400574, "cells": [{"id": 35, "text": "[15]", "bbox": {"l": 53.79800000000001, "t": 574.88635, "r": 64.994034, "b": 581.39989, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Mingxing Tan, Ruoming Pang, and Quoc V. Le. Efficientdet: Scalable and efficient", "bbox": {"l": 66.698669, "t": 574.88635, "r": 294.04224, "b": 581.39989, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "object detection.", "bbox": {"l": 69.234001, "t": 582.85736, "r": 116.1049, "b": 589.3709, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "CoRR", "bbox": {"l": 118.616, "t": 582.89224, "r": 133.77007, "b": 589.37787, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": ", abs/1911.09070, 2019.", "bbox": {"l": 133.77, "t": 582.85736, "r": 197.14792, "b": 589.3709, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "list_item", "bbox": {"l": 53.79800399999999, "t": 590.82736, "r": 295.22263, "b": 613.2809, "coord_origin": "TOPLEFT"}, "confidence": 0.859420895576477, "cells": [{"id": 40, "text": "[16]", "bbox": {"l": 53.79800399999999, "t": 590.82736, "r": 65.110367, "b": 597.3409, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Tsung-Yi Lin, Michael Maire, Serge J. Belongie, Lubomir D. Bourdev, Ross B. Gir-", "bbox": {"l": 66.832718, "t": 590.82736, "r": 295.22263, "b": 597.3409, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "shick, James Hays, Pietro Perona, Deva Ramanan, Piotr Doll\u00e1r, and C. Lawrence", "bbox": {"l": 69.234001, "t": 598.79736, "r": 294.04462, "b": 605.3109, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Zitnick. Microsoft COCO: common objects in context, 2014.", "bbox": {"l": 69.234001, "t": 606.76736, "r": 239.71553000000003, "b": 613.2809, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "list_item", "bbox": {"l": 53.79800000000001, "t": 614.7373699999999, "r": 295.12009, "b": 629.22089, "coord_origin": "TOPLEFT"}, "confidence": 0.8385182023048401, "cells": [{"id": 44, "text": "[17]", "bbox": {"l": 53.79800000000001, "t": 614.7373699999999, "r": 65.177979, "b": 621.2509, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Yuxin Wu, Alexander Kirillov, Francisco Massa, Wan-Yen Lo, and Ross Girshick.", "bbox": {"l": 66.910622, "t": 614.7373699999999, "r": 295.12009, "b": 621.2509, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "Detectron2, 2019.", "bbox": {"l": 69.234001, "t": 622.70737, "r": 118.65732, "b": 629.22089, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "list_item", "bbox": {"l": 53.79800000000001, "t": 630.67737, "r": 294.8089, "b": 669.0718899999999, "coord_origin": "TOPLEFT"}, "confidence": 0.8362045288085938, "cells": [{"id": 47, "text": "[18]", "bbox": {"l": 53.79800000000001, "t": 630.67737, "r": 65.022064, "b": 637.19089, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Nikolaos Livathinos, Cesar Berrospi, Maksym Lysak, Viktor Kuropiatnyk, Ahmed", "bbox": {"l": 66.730972, "t": 630.67737, "r": 294.04224, "b": 637.19089, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "Nassar, Andre Carvalho, Michele Dolfi, Christoph Auer, Kasper Dinkla, and Peter", "bbox": {"l": 69.234001, "t": 638.64737, "r": 294.17896, "b": 645.16089, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "W.", "bbox": {"l": 68.900002, "t": 646.6173699999999, "r": 76.877083, "b": 653.13089, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "J. Staar. Robust pdf document conversion using recurrent neural networks. In", "bbox": {"l": 78.580124, "t": 646.6173699999999, "r": 294.04312, "b": 653.13089, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Proceedings of the 35th Conference on Artificial Intelligence", "bbox": {"l": 69.234001, "t": 654.62325, "r": 233.43309000000002, "b": 661.10887, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": ", AAAI, pages 15137-", "bbox": {"l": 233.43401000000003, "t": 654.58838, "r": 294.8089, "b": 661.1019, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "15145, feb 2021.", "bbox": {"l": 69.073997, "t": 662.55836, "r": 113.53197, "b": 669.0718899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "list_item", "bbox": {"l": 53.797997, "t": 670.52837, "r": 295.22174, "b": 708.92189, "coord_origin": "TOPLEFT"}, "confidence": 0.7421631217002869, "cells": [{"id": 55, "text": "[19]", "bbox": {"l": 53.797997, "t": 670.52837, "r": 65.760811, "b": 677.04189, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Yiheng Xu, Minghao Li, Lei Cui, Shaohan Huang, Furu Wei, and Ming Zhou.", "bbox": {"l": 67.582199, "t": 670.52837, "r": 295.11609, "b": 677.04189, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Layoutlm: Pre-training of text and layout for document image understanding.", "bbox": {"l": 69.234001, "t": 678.49837, "r": 295.11606, "b": 685.01189, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "In", "bbox": {"l": 69.234001, "t": 686.46837, "r": 75.155228, "b": 692.981895, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Proceedings of the 26th ACM SIGKDD International Conference on Knowledge", "bbox": {"l": 76.891998, "t": 686.50323, "r": 294.04382, "b": 692.988869, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Discovery and Data Mining", "bbox": {"l": 69.234001, "t": 694.473236, "r": 144.91022, "b": 700.95887, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": ", KDD, pages 1192-1200, New York, USA, 2020. Asso-", "bbox": {"l": 144.908, "t": 694.4383700000001, "r": 295.22174, "b": 700.951897, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "ciation for Computing Machinery.", "bbox": {"l": 69.234001, "t": 702.408363, "r": 166.37207, "b": 708.92189, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "list_item", "bbox": {"l": 317.95499, "t": 527.06638, "r": 559.02637, "b": 541.5499, "coord_origin": "TOPLEFT"}, "confidence": 0.9088895320892334, "cells": [{"id": 63, "text": "[20]", "bbox": {"l": 317.95499, "t": 527.06638, "r": 329.24017, "b": 533.57993, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "Shoubin Li, Xuyan Ma, Shuaiqun Pan, Jun Hu, Lin Shi, and Qing Wang. Vtlayout:", "bbox": {"l": 330.95837, "t": 527.06638, "r": 559.02637, "b": 533.57993, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "Fusion of visual and text features for document layout analysis, 2021.", "bbox": {"l": 333.39099, "t": 535.03638, "r": 530.03815, "b": 541.5499, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "list_item", "bbox": {"l": 317.95499, "t": 543.00638, "r": 558.9715, "b": 565.4599000000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9247174859046936, "cells": [{"id": 66, "text": "[21]", "bbox": {"l": 317.95499, "t": 543.00638, "r": 329.54419, "b": 549.5199, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "Peng Zhang, Can Li, Liang Qiao, Zhanzhan Cheng, Shiliang Pu, Yi Niu, and Fei", "bbox": {"l": 331.30869, "t": 543.00638, "r": 558.20135, "b": 549.5199, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "Wu. Vsr: A unified framework for document layout analysis combining vision,", "bbox": {"l": 333.05701, "t": 550.97638, "r": 558.9715, "b": 557.4899, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "semantics and relations, 2021.", "bbox": {"l": 333.39099, "t": 558.94638, "r": 418.05988, "b": 565.4599000000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "list_item", "bbox": {"l": 317.95499, "t": 566.91635, "r": 559.27539, "b": 597.3478700000001, "coord_origin": "TOPLEFT"}, "confidence": 0.8956930637359619, "cells": [{"id": 70, "text": "[22]", "bbox": {"l": 317.95499, "t": 566.91638, "r": 330.14108, "b": 573.4299, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Peter W J Staar, Michele Dolfi, Christoph Auer, and Costas Bekas.", "bbox": {"l": 331.99646, "t": 566.91638, "r": 531.54553, "b": 573.4299, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "Corpus", "bbox": {"l": 537.12946, "t": 566.91635, "r": 558.19897, "b": 573.42989, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "conversion service: A machine learning platform to ingest documents at scale.", "bbox": {"l": 333.39099, "t": 574.88635, "r": 559.27539, "b": 581.39989, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "In", "bbox": {"l": 333.39099, "t": 582.85736, "r": 339.31223, "b": 589.3709, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "Proceedings of the 24th ACM SIGKDD International Conference on Knowledge", "bbox": {"l": 341.04901, "t": 582.89224, "r": 558.20081, "b": 589.37787, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "Discovery and Data Mining", "bbox": {"l": 333.39099, "t": 590.8622399999999, "r": 409.56577, "b": 597.3478700000001, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": ", KDD, pages 774-782. ACM, 2018.", "bbox": {"l": 409.56598, "t": 590.82736, "r": 507.31765999999993, "b": 597.3409, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "list_item", "bbox": {"l": 317.95499, "t": 598.79736, "r": 559.3783, "b": 613.28787, "coord_origin": "TOPLEFT"}, "confidence": 0.8972970843315125, "cells": [{"id": 78, "text": "[23]", "bbox": {"l": 317.95499, "t": 598.79736, "r": 329.37976, "b": 605.3109, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "Connor Shorten and Taghi M. Khoshgoftaar. A survey on image data augmenta-", "bbox": {"l": 331.11923, "t": 598.79736, "r": 559.3783, "b": 605.3109, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "tion for deep learning.", "bbox": {"l": 333.39099, "t": 606.76736, "r": 396.9223, "b": 613.2809, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Journal of Big Data", "bbox": {"l": 399.43298, "t": 606.80225, "r": 453.66122, "b": 613.28787, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": ", 6(1):60, 2019.", "bbox": {"l": 453.66199, "t": 606.76736, "r": 493.49631, "b": 613.2809, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_header", "id": 13, "page_no": 8, "cluster": {"id": 13, "label": "page_header", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.8021690249443054, "cells": [{"id": 0, "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis"}, {"label": "page_header", "id": 9, "page_no": 8, "cluster": {"id": 9, "label": "page_header", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.8429245352745056, "cells": [{"id": 1, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA"}, {"label": "picture", "id": 12, "page_no": 8, "cluster": {"id": 12, "label": "picture", "bbox": {"l": 52.963985443115234, "t": 84.73588562011719, "r": 556.931640625, "b": 442.1351318359375, "coord_origin": "TOPLEFT"}, "confidence": 0.8352116942405701, "cells": [{"id": 2, "text": "4bed2a8aa51ac37058e79605821bbc426d032b0b6ca8bdf3409ed8508ccd8c67", "bbox": {"l": 231.8804, "t": 301.50543, "r": 235.14504999999997, "b": 414.69144, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "2f2a06d08f5ad565d0f5e815f4ddf666365b2cff435cdaeb8850217e8a8efabf", "bbox": {"l": 395.06876, "t": 117.37183000000005, "r": 398.33353, "b": 230.55786, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "7f2fd7293e04bf4f1756ae51f5779764933da1d1d2002e3915356050570fc75b", "bbox": {"l": 55.775887, "t": 301.50543, "r": 59.04052000000001, "b": 414.69144, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "1b81cf65f47456ad4faa725d1eb09879bd633af16cfe2bf8cea661b87907bfac", "bbox": {"l": 232.01364, "t": 117.37183000000005, "r": 235.27841000000004, "b": 230.55786, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "b60da9d26f488cb133e47d101d35fda1bdca2671ade60764d1cd569590270327", "bbox": {"l": 395.20047, "t": 301.50543, "r": 398.46512, "b": 414.69144, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "2b7b8355a42ebef0cf91583aad9f30f7c9fa63c5b05911730ba15275c024965b$^{A}$", "bbox": {"l": 55.775818, "t": 117.37183000000005, "r": 65.409912, "b": 230.55786, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "B", "bbox": {"l": 234.56980999999996, "t": 88.50183000000015, "r": 240.06987, "b": 97.01098999999988, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "C", "bbox": {"l": 397.81934, "t": 88.89355, "r": 403.3194, "b": 97.40270999999996, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "D", "bbox": {"l": 59.909843, "t": 266.75885000000005, "r": 65.409912, "b": 275.26793999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "E", "bbox": {"l": 234.77386, "t": 266.36707, "r": 239.85495000000003, "b": 274.87616, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "F", "bbox": {"l": 398.26144, "t": 266.75885000000005, "r": 402.91592, "b": 275.26793999999995, "coord_origin": "TOPLEFT"}}], "children": [{"id": 17, "label": "text", "bbox": {"l": 231.8804, "t": 301.50543, "r": 235.14504999999997, "b": 414.69144, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 2, "text": "4bed2a8aa51ac37058e79605821bbc426d032b0b6ca8bdf3409ed8508ccd8c67", "bbox": {"l": 231.8804, "t": 301.50543, "r": 235.14504999999997, "b": 414.69144, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 395.06876, "t": 117.37183000000005, "r": 398.33353, "b": 230.55786, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 3, "text": "2f2a06d08f5ad565d0f5e815f4ddf666365b2cff435cdaeb8850217e8a8efabf", "bbox": {"l": 395.06876, "t": 117.37183000000005, "r": 398.33353, "b": 230.55786, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 55.775887, "t": 301.50543, "r": 59.04052000000001, "b": 414.69144, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 4, "text": "7f2fd7293e04bf4f1756ae51f5779764933da1d1d2002e3915356050570fc75b", "bbox": {"l": 55.775887, "t": 301.50543, "r": 59.04052000000001, "b": 414.69144, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 232.01364, "t": 117.37183000000005, "r": 235.27841000000004, "b": 230.55786, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 5, "text": "1b81cf65f47456ad4faa725d1eb09879bd633af16cfe2bf8cea661b87907bfac", "bbox": {"l": 232.01364, "t": 117.37183000000005, "r": 235.27841000000004, "b": 230.55786, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 395.20047, "t": 301.50543, "r": 398.46512, "b": 414.69144, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": "b60da9d26f488cb133e47d101d35fda1bdca2671ade60764d1cd569590270327", "bbox": {"l": 395.20047, "t": 301.50543, "r": 398.46512, "b": 414.69144, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 55.775818, "t": 117.37183000000005, "r": 65.409912, "b": 230.55786, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "2b7b8355a42ebef0cf91583aad9f30f7c9fa63c5b05911730ba15275c024965b$^{A}$", "bbox": {"l": 55.775818, "t": 117.37183000000005, "r": 65.409912, "b": 230.55786, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 234.56980999999996, "t": 88.50183000000015, "r": 240.06987, "b": 97.01098999999988, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "B", "bbox": {"l": 234.56980999999996, "t": 88.50183000000015, "r": 240.06987, "b": 97.01098999999988, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 397.81934, "t": 88.89355, "r": 403.3194, "b": 97.40270999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "C", "bbox": {"l": 397.81934, "t": 88.89355, "r": 403.3194, "b": 97.40270999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 59.909843, "t": 266.75885000000005, "r": 65.409912, "b": 275.26793999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "D", "bbox": {"l": 59.909843, "t": 266.75885000000005, "r": 65.409912, "b": 275.26793999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 234.77386, "t": 266.36707, "r": 239.85495000000003, "b": 274.87616, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "E", "bbox": {"l": 234.77386, "t": 266.36707, "r": 239.85495000000003, "b": 274.87616, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 398.26144, "t": 266.75885000000005, "r": 402.91592, "b": 275.26793999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "F", "bbox": {"l": 398.26144, "t": 266.75885000000005, "r": 402.91592, "b": 275.26793999999995, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "caption", "id": 16, "page_no": 8, "cluster": {"id": 16, "label": "caption", "bbox": {"l": 62.323874999999994, "t": 442.28543, "r": 318.50473, "b": 448.26483, "coord_origin": "TOPLEFT"}, "confidence": 0.6248989701271057, "cells": [{"id": 13, "text": "Text", "bbox": {"l": 62.323874999999994, "t": 442.28543, "r": 70.895882, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Caption", "bbox": {"l": 80.16581, "t": 442.28543, "r": 95.565453, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "List-Item", "bbox": {"l": 104.94447, "t": 442.28543, "r": 122.38113000000001, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Formula", "bbox": {"l": 131.78354, "t": 442.28543, "r": 148.34625, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "Table", "bbox": {"l": 157.66106, "t": 442.28543, "r": 168.53032, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Section-Header", "bbox": {"l": 201.24315, "t": 442.28543, "r": 232.00499, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Picture", "bbox": {"l": 177.8381, "t": 442.28543, "r": 191.88956, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Page-Header", "bbox": {"l": 240.95844000000002, "t": 442.28543, "r": 266.61908, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Page-Footer", "bbox": {"l": 276.03928, "t": 442.28543, "r": 300.33261, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "Title", "bbox": {"l": 309.74615, "t": 442.28543, "r": 318.50473, "b": 448.26483, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Text Caption List-Item Formula Table Section-Header Picture Page-Header Page-Footer Title"}, {"label": "text", "id": 4, "page_no": 8, "cluster": {"id": 4, "label": "text", "bbox": {"l": 53.79800000000001, "t": 464.48199, "r": 559.80786, "b": 505.83124, "coord_origin": "TOPLEFT"}, "confidence": 0.8651240468025208, "cells": [{"id": 23, "text": "Figure 6: Example layout predictions on selected pages from the DocLayNet test-set. (A, D) exhibit favourable results on", "bbox": {"l": 53.79800000000001, "t": 464.48199, "r": 558.203, "b": 472.95523, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "coloured backgrounds. (B, C) show accurate list-item and paragraph differentiation despite densely-spaced lines. (E) demon-", "bbox": {"l": 53.79800000000001, "t": 475.44101, "r": 559.80786, "b": 483.91425, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "strates good table and figure distinction. (F) shows predictions on a Chinese patent with multiple overlaps, label confusion", "bbox": {"l": 53.79800000000001, "t": 486.39999, "r": 558.20294, "b": 494.87323, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "and missing boxes.", "bbox": {"l": 53.79800000000001, "t": 497.358, "r": 130.37105, "b": 505.83124, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 6: Example layout predictions on selected pages from the DocLayNet test-set. (A, D) exhibit favourable results on coloured backgrounds. (B, C) show accurate list-item and paragraph differentiation despite densely-spaced lines. (E) demonstrates good table and figure distinction. (F) shows predictions on a Chinese patent with multiple overlaps, label confusion and missing boxes."}, {"label": "text", "id": 8, "page_no": 8, "cluster": {"id": 8, "label": "text", "bbox": {"l": 69.234001, "t": 527.06635, "r": 295.22406, "b": 549.5199, "coord_origin": "TOPLEFT"}, "confidence": 0.8445900082588196, "cells": [{"id": 27, "text": "Diaconu, Mai Thanh Minh, Marc, albinxavi, fatih, oleg, and wanghao yang. ul-", "bbox": {"l": 69.234001, "t": 527.06635, "r": 295.22406, "b": 533.5799, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "tralytics/yolov5: v6.0 - yolov5n nano models, roboflow integration, tensorflow", "bbox": {"l": 69.234001, "t": 535.03638, "r": 294.30612, "b": 541.5499, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "export, opencv dnn support, October 2021.", "bbox": {"l": 69.234001, "t": 543.00638, "r": 190.45259, "b": 549.5199, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Diaconu, Mai Thanh Minh, Marc, albinxavi, fatih, oleg, and wanghao yang. ultralytics/yolov5: v6.0 - yolov5n nano models, roboflow integration, tensorflow export, opencv dnn support, October 2021."}, {"label": "list_item", "id": 7, "page_no": 8, "cluster": {"id": 7, "label": "list_item", "bbox": {"l": 53.79800000000001, "t": 550.97638, "r": 295.12177, "b": 573.43686, "coord_origin": "TOPLEFT"}, "confidence": 0.8561117053031921, "cells": [{"id": 30, "text": "[14]", "bbox": {"l": 53.79800000000001, "t": 550.97638, "r": 65.286942, "b": 557.4899, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Nicolas Carion, Francisco Massa, Gabriel Synnaeve, Nicolas Usunier, Alexander", "bbox": {"l": 67.036171, "t": 550.97638, "r": 294.17709, "b": 557.4899, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Kirillov, and Sergey Zagoruyko. End-to-end object detection with transformers.", "bbox": {"l": 69.234001, "t": 558.94638, "r": 295.12177, "b": 565.4599000000001, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "CoRR", "bbox": {"l": 69.234001, "t": 566.95123, "r": 84.388069, "b": 573.43686, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": ", abs/2005.12872, 2020.", "bbox": {"l": 84.388, "t": 566.91635, "r": 147.7659, "b": 573.42989, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[14] Nicolas Carion, Francisco Massa, Gabriel Synnaeve, Nicolas Usunier, Alexander Kirillov, and Sergey Zagoruyko. End-to-end object detection with transformers. CoRR , abs/2005.12872, 2020."}, {"label": "list_item", "id": 5, "page_no": 8, "cluster": {"id": 5, "label": "list_item", "bbox": {"l": 53.79800000000001, "t": 574.88635, "r": 294.04224, "b": 589.37787, "coord_origin": "TOPLEFT"}, "confidence": 0.8615185618400574, "cells": [{"id": 35, "text": "[15]", "bbox": {"l": 53.79800000000001, "t": 574.88635, "r": 64.994034, "b": 581.39989, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Mingxing Tan, Ruoming Pang, and Quoc V. Le. Efficientdet: Scalable and efficient", "bbox": {"l": 66.698669, "t": 574.88635, "r": 294.04224, "b": 581.39989, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "object detection.", "bbox": {"l": 69.234001, "t": 582.85736, "r": 116.1049, "b": 589.3709, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "CoRR", "bbox": {"l": 118.616, "t": 582.89224, "r": 133.77007, "b": 589.37787, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": ", abs/1911.09070, 2019.", "bbox": {"l": 133.77, "t": 582.85736, "r": 197.14792, "b": 589.3709, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[15] Mingxing Tan, Ruoming Pang, and Quoc V. Le. Efficientdet: Scalable and efficient object detection. CoRR , abs/1911.09070, 2019."}, {"label": "list_item", "id": 6, "page_no": 8, "cluster": {"id": 6, "label": "list_item", "bbox": {"l": 53.79800399999999, "t": 590.82736, "r": 295.22263, "b": 613.2809, "coord_origin": "TOPLEFT"}, "confidence": 0.859420895576477, "cells": [{"id": 40, "text": "[16]", "bbox": {"l": 53.79800399999999, "t": 590.82736, "r": 65.110367, "b": 597.3409, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Tsung-Yi Lin, Michael Maire, Serge J. Belongie, Lubomir D. Bourdev, Ross B. Gir-", "bbox": {"l": 66.832718, "t": 590.82736, "r": 295.22263, "b": 597.3409, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "shick, James Hays, Pietro Perona, Deva Ramanan, Piotr Doll\u00e1r, and C. Lawrence", "bbox": {"l": 69.234001, "t": 598.79736, "r": 294.04462, "b": 605.3109, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Zitnick. Microsoft COCO: common objects in context, 2014.", "bbox": {"l": 69.234001, "t": 606.76736, "r": 239.71553000000003, "b": 613.2809, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[16] Tsung-Yi Lin, Michael Maire, Serge J. Belongie, Lubomir D. Bourdev, Ross B. Girshick, James Hays, Pietro Perona, Deva Ramanan, Piotr Doll\u00e1r, and C. Lawrence Zitnick. Microsoft COCO: common objects in context, 2014."}, {"label": "list_item", "id": 10, "page_no": 8, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 53.79800000000001, "t": 614.7373699999999, "r": 295.12009, "b": 629.22089, "coord_origin": "TOPLEFT"}, "confidence": 0.8385182023048401, "cells": [{"id": 44, "text": "[17]", "bbox": {"l": 53.79800000000001, "t": 614.7373699999999, "r": 65.177979, "b": 621.2509, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Yuxin Wu, Alexander Kirillov, Francisco Massa, Wan-Yen Lo, and Ross Girshick.", "bbox": {"l": 66.910622, "t": 614.7373699999999, "r": 295.12009, "b": 621.2509, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "Detectron2, 2019.", "bbox": {"l": 69.234001, "t": 622.70737, "r": 118.65732, "b": 629.22089, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[17] Yuxin Wu, Alexander Kirillov, Francisco Massa, Wan-Yen Lo, and Ross Girshick. Detectron2, 2019."}, {"label": "list_item", "id": 11, "page_no": 8, "cluster": {"id": 11, "label": "list_item", "bbox": {"l": 53.79800000000001, "t": 630.67737, "r": 294.8089, "b": 669.0718899999999, "coord_origin": "TOPLEFT"}, "confidence": 0.8362045288085938, "cells": [{"id": 47, "text": "[18]", "bbox": {"l": 53.79800000000001, "t": 630.67737, "r": 65.022064, "b": 637.19089, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Nikolaos Livathinos, Cesar Berrospi, Maksym Lysak, Viktor Kuropiatnyk, Ahmed", "bbox": {"l": 66.730972, "t": 630.67737, "r": 294.04224, "b": 637.19089, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "Nassar, Andre Carvalho, Michele Dolfi, Christoph Auer, Kasper Dinkla, and Peter", "bbox": {"l": 69.234001, "t": 638.64737, "r": 294.17896, "b": 645.16089, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "W.", "bbox": {"l": 68.900002, "t": 646.6173699999999, "r": 76.877083, "b": 653.13089, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "J. Staar. Robust pdf document conversion using recurrent neural networks. In", "bbox": {"l": 78.580124, "t": 646.6173699999999, "r": 294.04312, "b": 653.13089, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Proceedings of the 35th Conference on Artificial Intelligence", "bbox": {"l": 69.234001, "t": 654.62325, "r": 233.43309000000002, "b": 661.10887, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": ", AAAI, pages 15137-", "bbox": {"l": 233.43401000000003, "t": 654.58838, "r": 294.8089, "b": 661.1019, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "15145, feb 2021.", "bbox": {"l": 69.073997, "t": 662.55836, "r": 113.53197, "b": 669.0718899999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[18] Nikolaos Livathinos, Cesar Berrospi, Maksym Lysak, Viktor Kuropiatnyk, Ahmed Nassar, Andre Carvalho, Michele Dolfi, Christoph Auer, Kasper Dinkla, and Peter W. J. Staar. Robust pdf document conversion using recurrent neural networks. In Proceedings of the 35th Conference on Artificial Intelligence , AAAI, pages 1513715145, feb 2021."}, {"label": "list_item", "id": 14, "page_no": 8, "cluster": {"id": 14, "label": "list_item", "bbox": {"l": 53.797997, "t": 670.52837, "r": 295.22174, "b": 708.92189, "coord_origin": "TOPLEFT"}, "confidence": 0.7421631217002869, "cells": [{"id": 55, "text": "[19]", "bbox": {"l": 53.797997, "t": 670.52837, "r": 65.760811, "b": 677.04189, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Yiheng Xu, Minghao Li, Lei Cui, Shaohan Huang, Furu Wei, and Ming Zhou.", "bbox": {"l": 67.582199, "t": 670.52837, "r": 295.11609, "b": 677.04189, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Layoutlm: Pre-training of text and layout for document image understanding.", "bbox": {"l": 69.234001, "t": 678.49837, "r": 295.11606, "b": 685.01189, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "In", "bbox": {"l": 69.234001, "t": 686.46837, "r": 75.155228, "b": 692.981895, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Proceedings of the 26th ACM SIGKDD International Conference on Knowledge", "bbox": {"l": 76.891998, "t": 686.50323, "r": 294.04382, "b": 692.988869, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Discovery and Data Mining", "bbox": {"l": 69.234001, "t": 694.473236, "r": 144.91022, "b": 700.95887, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": ", KDD, pages 1192-1200, New York, USA, 2020. Asso-", "bbox": {"l": 144.908, "t": 694.4383700000001, "r": 295.22174, "b": 700.951897, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "ciation for Computing Machinery.", "bbox": {"l": 69.234001, "t": 702.408363, "r": 166.37207, "b": 708.92189, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[19] Yiheng Xu, Minghao Li, Lei Cui, Shaohan Huang, Furu Wei, and Ming Zhou. Layoutlm: Pre-training of text and layout for document image understanding. In Proceedings of the 26th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining , KDD, pages 1192-1200, New York, USA, 2020. Association for Computing Machinery."}, {"label": "list_item", "id": 1, "page_no": 8, "cluster": {"id": 1, "label": "list_item", "bbox": {"l": 317.95499, "t": 527.06638, "r": 559.02637, "b": 541.5499, "coord_origin": "TOPLEFT"}, "confidence": 0.9088895320892334, "cells": [{"id": 63, "text": "[20]", "bbox": {"l": 317.95499, "t": 527.06638, "r": 329.24017, "b": 533.57993, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "Shoubin Li, Xuyan Ma, Shuaiqun Pan, Jun Hu, Lin Shi, and Qing Wang. Vtlayout:", "bbox": {"l": 330.95837, "t": 527.06638, "r": 559.02637, "b": 533.57993, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "Fusion of visual and text features for document layout analysis, 2021.", "bbox": {"l": 333.39099, "t": 535.03638, "r": 530.03815, "b": 541.5499, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[20] Shoubin Li, Xuyan Ma, Shuaiqun Pan, Jun Hu, Lin Shi, and Qing Wang. Vtlayout: Fusion of visual and text features for document layout analysis, 2021."}, {"label": "list_item", "id": 0, "page_no": 8, "cluster": {"id": 0, "label": "list_item", "bbox": {"l": 317.95499, "t": 543.00638, "r": 558.9715, "b": 565.4599000000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9247174859046936, "cells": [{"id": 66, "text": "[21]", "bbox": {"l": 317.95499, "t": 543.00638, "r": 329.54419, "b": 549.5199, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "Peng Zhang, Can Li, Liang Qiao, Zhanzhan Cheng, Shiliang Pu, Yi Niu, and Fei", "bbox": {"l": 331.30869, "t": 543.00638, "r": 558.20135, "b": 549.5199, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "Wu. Vsr: A unified framework for document layout analysis combining vision,", "bbox": {"l": 333.05701, "t": 550.97638, "r": 558.9715, "b": 557.4899, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "semantics and relations, 2021.", "bbox": {"l": 333.39099, "t": 558.94638, "r": 418.05988, "b": 565.4599000000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[21] Peng Zhang, Can Li, Liang Qiao, Zhanzhan Cheng, Shiliang Pu, Yi Niu, and Fei Wu. Vsr: A unified framework for document layout analysis combining vision, semantics and relations, 2021."}, {"label": "list_item", "id": 3, "page_no": 8, "cluster": {"id": 3, "label": "list_item", "bbox": {"l": 317.95499, "t": 566.91635, "r": 559.27539, "b": 597.3478700000001, "coord_origin": "TOPLEFT"}, "confidence": 0.8956930637359619, "cells": [{"id": 70, "text": "[22]", "bbox": {"l": 317.95499, "t": 566.91638, "r": 330.14108, "b": 573.4299, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Peter W J Staar, Michele Dolfi, Christoph Auer, and Costas Bekas.", "bbox": {"l": 331.99646, "t": 566.91638, "r": 531.54553, "b": 573.4299, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "Corpus", "bbox": {"l": 537.12946, "t": 566.91635, "r": 558.19897, "b": 573.42989, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "conversion service: A machine learning platform to ingest documents at scale.", "bbox": {"l": 333.39099, "t": 574.88635, "r": 559.27539, "b": 581.39989, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "In", "bbox": {"l": 333.39099, "t": 582.85736, "r": 339.31223, "b": 589.3709, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "Proceedings of the 24th ACM SIGKDD International Conference on Knowledge", "bbox": {"l": 341.04901, "t": 582.89224, "r": 558.20081, "b": 589.37787, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "Discovery and Data Mining", "bbox": {"l": 333.39099, "t": 590.8622399999999, "r": 409.56577, "b": 597.3478700000001, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": ", KDD, pages 774-782. ACM, 2018.", "bbox": {"l": 409.56598, "t": 590.82736, "r": 507.31765999999993, "b": 597.3409, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[22] Peter W J Staar, Michele Dolfi, Christoph Auer, and Costas Bekas. Corpus conversion service: A machine learning platform to ingest documents at scale. In Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining , KDD, pages 774-782. ACM, 2018."}, {"label": "list_item", "id": 2, "page_no": 8, "cluster": {"id": 2, "label": "list_item", "bbox": {"l": 317.95499, "t": 598.79736, "r": 559.3783, "b": 613.28787, "coord_origin": "TOPLEFT"}, "confidence": 0.8972970843315125, "cells": [{"id": 78, "text": "[23]", "bbox": {"l": 317.95499, "t": 598.79736, "r": 329.37976, "b": 605.3109, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "Connor Shorten and Taghi M. Khoshgoftaar. A survey on image data augmenta-", "bbox": {"l": 331.11923, "t": 598.79736, "r": 559.3783, "b": 605.3109, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "tion for deep learning.", "bbox": {"l": 333.39099, "t": 606.76736, "r": 396.9223, "b": 613.2809, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Journal of Big Data", "bbox": {"l": 399.43298, "t": 606.80225, "r": 453.66122, "b": 613.28787, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": ", 6(1):60, 2019.", "bbox": {"l": 453.66199, "t": 606.76736, "r": 493.49631, "b": 613.2809, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[23] Connor Shorten and Taghi M. Khoshgoftaar. A survey on image data augmentation for deep learning. Journal of Big Data , 6(1):60, 2019."}], "body": [{"label": "picture", "id": 12, "page_no": 8, "cluster": {"id": 12, "label": "picture", "bbox": {"l": 52.963985443115234, "t": 84.73588562011719, "r": 556.931640625, "b": 442.1351318359375, "coord_origin": "TOPLEFT"}, "confidence": 0.8352116942405701, "cells": [{"id": 2, "text": "4bed2a8aa51ac37058e79605821bbc426d032b0b6ca8bdf3409ed8508ccd8c67", "bbox": {"l": 231.8804, "t": 301.50543, "r": 235.14504999999997, "b": 414.69144, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "2f2a06d08f5ad565d0f5e815f4ddf666365b2cff435cdaeb8850217e8a8efabf", "bbox": {"l": 395.06876, "t": 117.37183000000005, "r": 398.33353, "b": 230.55786, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "7f2fd7293e04bf4f1756ae51f5779764933da1d1d2002e3915356050570fc75b", "bbox": {"l": 55.775887, "t": 301.50543, "r": 59.04052000000001, "b": 414.69144, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "1b81cf65f47456ad4faa725d1eb09879bd633af16cfe2bf8cea661b87907bfac", "bbox": {"l": 232.01364, "t": 117.37183000000005, "r": 235.27841000000004, "b": 230.55786, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "b60da9d26f488cb133e47d101d35fda1bdca2671ade60764d1cd569590270327", "bbox": {"l": 395.20047, "t": 301.50543, "r": 398.46512, "b": 414.69144, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "2b7b8355a42ebef0cf91583aad9f30f7c9fa63c5b05911730ba15275c024965b$^{A}$", "bbox": {"l": 55.775818, "t": 117.37183000000005, "r": 65.409912, "b": 230.55786, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "B", "bbox": {"l": 234.56980999999996, "t": 88.50183000000015, "r": 240.06987, "b": 97.01098999999988, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "C", "bbox": {"l": 397.81934, "t": 88.89355, "r": 403.3194, "b": 97.40270999999996, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "D", "bbox": {"l": 59.909843, "t": 266.75885000000005, "r": 65.409912, "b": 275.26793999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "E", "bbox": {"l": 234.77386, "t": 266.36707, "r": 239.85495000000003, "b": 274.87616, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "F", "bbox": {"l": 398.26144, "t": 266.75885000000005, "r": 402.91592, "b": 275.26793999999995, "coord_origin": "TOPLEFT"}}], "children": [{"id": 17, "label": "text", "bbox": {"l": 231.8804, "t": 301.50543, "r": 235.14504999999997, "b": 414.69144, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 2, "text": "4bed2a8aa51ac37058e79605821bbc426d032b0b6ca8bdf3409ed8508ccd8c67", "bbox": {"l": 231.8804, "t": 301.50543, "r": 235.14504999999997, "b": 414.69144, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 395.06876, "t": 117.37183000000005, "r": 398.33353, "b": 230.55786, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 3, "text": "2f2a06d08f5ad565d0f5e815f4ddf666365b2cff435cdaeb8850217e8a8efabf", "bbox": {"l": 395.06876, "t": 117.37183000000005, "r": 398.33353, "b": 230.55786, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 55.775887, "t": 301.50543, "r": 59.04052000000001, "b": 414.69144, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 4, "text": "7f2fd7293e04bf4f1756ae51f5779764933da1d1d2002e3915356050570fc75b", "bbox": {"l": 55.775887, "t": 301.50543, "r": 59.04052000000001, "b": 414.69144, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 232.01364, "t": 117.37183000000005, "r": 235.27841000000004, "b": 230.55786, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 5, "text": "1b81cf65f47456ad4faa725d1eb09879bd633af16cfe2bf8cea661b87907bfac", "bbox": {"l": 232.01364, "t": 117.37183000000005, "r": 235.27841000000004, "b": 230.55786, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 395.20047, "t": 301.50543, "r": 398.46512, "b": 414.69144, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": "b60da9d26f488cb133e47d101d35fda1bdca2671ade60764d1cd569590270327", "bbox": {"l": 395.20047, "t": 301.50543, "r": 398.46512, "b": 414.69144, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 55.775818, "t": 117.37183000000005, "r": 65.409912, "b": 230.55786, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "2b7b8355a42ebef0cf91583aad9f30f7c9fa63c5b05911730ba15275c024965b$^{A}$", "bbox": {"l": 55.775818, "t": 117.37183000000005, "r": 65.409912, "b": 230.55786, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 234.56980999999996, "t": 88.50183000000015, "r": 240.06987, "b": 97.01098999999988, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "B", "bbox": {"l": 234.56980999999996, "t": 88.50183000000015, "r": 240.06987, "b": 97.01098999999988, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 397.81934, "t": 88.89355, "r": 403.3194, "b": 97.40270999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "C", "bbox": {"l": 397.81934, "t": 88.89355, "r": 403.3194, "b": 97.40270999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 59.909843, "t": 266.75885000000005, "r": 65.409912, "b": 275.26793999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "D", "bbox": {"l": 59.909843, "t": 266.75885000000005, "r": 65.409912, "b": 275.26793999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 234.77386, "t": 266.36707, "r": 239.85495000000003, "b": 274.87616, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "E", "bbox": {"l": 234.77386, "t": 266.36707, "r": 239.85495000000003, "b": 274.87616, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 398.26144, "t": 266.75885000000005, "r": 402.91592, "b": 275.26793999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "F", "bbox": {"l": 398.26144, "t": 266.75885000000005, "r": 402.91592, "b": 275.26793999999995, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "caption", "id": 16, "page_no": 8, "cluster": {"id": 16, "label": "caption", "bbox": {"l": 62.323874999999994, "t": 442.28543, "r": 318.50473, "b": 448.26483, "coord_origin": "TOPLEFT"}, "confidence": 0.6248989701271057, "cells": [{"id": 13, "text": "Text", "bbox": {"l": 62.323874999999994, "t": 442.28543, "r": 70.895882, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Caption", "bbox": {"l": 80.16581, "t": 442.28543, "r": 95.565453, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "List-Item", "bbox": {"l": 104.94447, "t": 442.28543, "r": 122.38113000000001, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Formula", "bbox": {"l": 131.78354, "t": 442.28543, "r": 148.34625, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "Table", "bbox": {"l": 157.66106, "t": 442.28543, "r": 168.53032, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Section-Header", "bbox": {"l": 201.24315, "t": 442.28543, "r": 232.00499, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Picture", "bbox": {"l": 177.8381, "t": 442.28543, "r": 191.88956, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Page-Header", "bbox": {"l": 240.95844000000002, "t": 442.28543, "r": 266.61908, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Page-Footer", "bbox": {"l": 276.03928, "t": 442.28543, "r": 300.33261, "b": 448.26483, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "Title", "bbox": {"l": 309.74615, "t": 442.28543, "r": 318.50473, "b": 448.26483, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Text Caption List-Item Formula Table Section-Header Picture Page-Header Page-Footer Title"}, {"label": "text", "id": 4, "page_no": 8, "cluster": {"id": 4, "label": "text", "bbox": {"l": 53.79800000000001, "t": 464.48199, "r": 559.80786, "b": 505.83124, "coord_origin": "TOPLEFT"}, "confidence": 0.8651240468025208, "cells": [{"id": 23, "text": "Figure 6: Example layout predictions on selected pages from the DocLayNet test-set. (A, D) exhibit favourable results on", "bbox": {"l": 53.79800000000001, "t": 464.48199, "r": 558.203, "b": 472.95523, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "coloured backgrounds. (B, C) show accurate list-item and paragraph differentiation despite densely-spaced lines. (E) demon-", "bbox": {"l": 53.79800000000001, "t": 475.44101, "r": 559.80786, "b": 483.91425, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "strates good table and figure distinction. (F) shows predictions on a Chinese patent with multiple overlaps, label confusion", "bbox": {"l": 53.79800000000001, "t": 486.39999, "r": 558.20294, "b": 494.87323, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "and missing boxes.", "bbox": {"l": 53.79800000000001, "t": 497.358, "r": 130.37105, "b": 505.83124, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 6: Example layout predictions on selected pages from the DocLayNet test-set. (A, D) exhibit favourable results on coloured backgrounds. (B, C) show accurate list-item and paragraph differentiation despite densely-spaced lines. (E) demonstrates good table and figure distinction. (F) shows predictions on a Chinese patent with multiple overlaps, label confusion and missing boxes."}, {"label": "text", "id": 8, "page_no": 8, "cluster": {"id": 8, "label": "text", "bbox": {"l": 69.234001, "t": 527.06635, "r": 295.22406, "b": 549.5199, "coord_origin": "TOPLEFT"}, "confidence": 0.8445900082588196, "cells": [{"id": 27, "text": "Diaconu, Mai Thanh Minh, Marc, albinxavi, fatih, oleg, and wanghao yang. ul-", "bbox": {"l": 69.234001, "t": 527.06635, "r": 295.22406, "b": 533.5799, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "tralytics/yolov5: v6.0 - yolov5n nano models, roboflow integration, tensorflow", "bbox": {"l": 69.234001, "t": 535.03638, "r": 294.30612, "b": 541.5499, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "export, opencv dnn support, October 2021.", "bbox": {"l": 69.234001, "t": 543.00638, "r": 190.45259, "b": 549.5199, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Diaconu, Mai Thanh Minh, Marc, albinxavi, fatih, oleg, and wanghao yang. ultralytics/yolov5: v6.0 - yolov5n nano models, roboflow integration, tensorflow export, opencv dnn support, October 2021."}, {"label": "list_item", "id": 7, "page_no": 8, "cluster": {"id": 7, "label": "list_item", "bbox": {"l": 53.79800000000001, "t": 550.97638, "r": 295.12177, "b": 573.43686, "coord_origin": "TOPLEFT"}, "confidence": 0.8561117053031921, "cells": [{"id": 30, "text": "[14]", "bbox": {"l": 53.79800000000001, "t": 550.97638, "r": 65.286942, "b": 557.4899, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Nicolas Carion, Francisco Massa, Gabriel Synnaeve, Nicolas Usunier, Alexander", "bbox": {"l": 67.036171, "t": 550.97638, "r": 294.17709, "b": 557.4899, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Kirillov, and Sergey Zagoruyko. End-to-end object detection with transformers.", "bbox": {"l": 69.234001, "t": 558.94638, "r": 295.12177, "b": 565.4599000000001, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "CoRR", "bbox": {"l": 69.234001, "t": 566.95123, "r": 84.388069, "b": 573.43686, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": ", abs/2005.12872, 2020.", "bbox": {"l": 84.388, "t": 566.91635, "r": 147.7659, "b": 573.42989, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[14] Nicolas Carion, Francisco Massa, Gabriel Synnaeve, Nicolas Usunier, Alexander Kirillov, and Sergey Zagoruyko. End-to-end object detection with transformers. CoRR , abs/2005.12872, 2020."}, {"label": "list_item", "id": 5, "page_no": 8, "cluster": {"id": 5, "label": "list_item", "bbox": {"l": 53.79800000000001, "t": 574.88635, "r": 294.04224, "b": 589.37787, "coord_origin": "TOPLEFT"}, "confidence": 0.8615185618400574, "cells": [{"id": 35, "text": "[15]", "bbox": {"l": 53.79800000000001, "t": 574.88635, "r": 64.994034, "b": 581.39989, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Mingxing Tan, Ruoming Pang, and Quoc V. Le. Efficientdet: Scalable and efficient", "bbox": {"l": 66.698669, "t": 574.88635, "r": 294.04224, "b": 581.39989, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "object detection.", "bbox": {"l": 69.234001, "t": 582.85736, "r": 116.1049, "b": 589.3709, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "CoRR", "bbox": {"l": 118.616, "t": 582.89224, "r": 133.77007, "b": 589.37787, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": ", abs/1911.09070, 2019.", "bbox": {"l": 133.77, "t": 582.85736, "r": 197.14792, "b": 589.3709, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[15] Mingxing Tan, Ruoming Pang, and Quoc V. Le. Efficientdet: Scalable and efficient object detection. CoRR , abs/1911.09070, 2019."}, {"label": "list_item", "id": 6, "page_no": 8, "cluster": {"id": 6, "label": "list_item", "bbox": {"l": 53.79800399999999, "t": 590.82736, "r": 295.22263, "b": 613.2809, "coord_origin": "TOPLEFT"}, "confidence": 0.859420895576477, "cells": [{"id": 40, "text": "[16]", "bbox": {"l": 53.79800399999999, "t": 590.82736, "r": 65.110367, "b": 597.3409, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Tsung-Yi Lin, Michael Maire, Serge J. Belongie, Lubomir D. Bourdev, Ross B. Gir-", "bbox": {"l": 66.832718, "t": 590.82736, "r": 295.22263, "b": 597.3409, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "shick, James Hays, Pietro Perona, Deva Ramanan, Piotr Doll\u00e1r, and C. Lawrence", "bbox": {"l": 69.234001, "t": 598.79736, "r": 294.04462, "b": 605.3109, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Zitnick. Microsoft COCO: common objects in context, 2014.", "bbox": {"l": 69.234001, "t": 606.76736, "r": 239.71553000000003, "b": 613.2809, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[16] Tsung-Yi Lin, Michael Maire, Serge J. Belongie, Lubomir D. Bourdev, Ross B. Girshick, James Hays, Pietro Perona, Deva Ramanan, Piotr Doll\u00e1r, and C. Lawrence Zitnick. Microsoft COCO: common objects in context, 2014."}, {"label": "list_item", "id": 10, "page_no": 8, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 53.79800000000001, "t": 614.7373699999999, "r": 295.12009, "b": 629.22089, "coord_origin": "TOPLEFT"}, "confidence": 0.8385182023048401, "cells": [{"id": 44, "text": "[17]", "bbox": {"l": 53.79800000000001, "t": 614.7373699999999, "r": 65.177979, "b": 621.2509, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Yuxin Wu, Alexander Kirillov, Francisco Massa, Wan-Yen Lo, and Ross Girshick.", "bbox": {"l": 66.910622, "t": 614.7373699999999, "r": 295.12009, "b": 621.2509, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "Detectron2, 2019.", "bbox": {"l": 69.234001, "t": 622.70737, "r": 118.65732, "b": 629.22089, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[17] Yuxin Wu, Alexander Kirillov, Francisco Massa, Wan-Yen Lo, and Ross Girshick. Detectron2, 2019."}, {"label": "list_item", "id": 11, "page_no": 8, "cluster": {"id": 11, "label": "list_item", "bbox": {"l": 53.79800000000001, "t": 630.67737, "r": 294.8089, "b": 669.0718899999999, "coord_origin": "TOPLEFT"}, "confidence": 0.8362045288085938, "cells": [{"id": 47, "text": "[18]", "bbox": {"l": 53.79800000000001, "t": 630.67737, "r": 65.022064, "b": 637.19089, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Nikolaos Livathinos, Cesar Berrospi, Maksym Lysak, Viktor Kuropiatnyk, Ahmed", "bbox": {"l": 66.730972, "t": 630.67737, "r": 294.04224, "b": 637.19089, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "Nassar, Andre Carvalho, Michele Dolfi, Christoph Auer, Kasper Dinkla, and Peter", "bbox": {"l": 69.234001, "t": 638.64737, "r": 294.17896, "b": 645.16089, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "W.", "bbox": {"l": 68.900002, "t": 646.6173699999999, "r": 76.877083, "b": 653.13089, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "J. Staar. Robust pdf document conversion using recurrent neural networks. In", "bbox": {"l": 78.580124, "t": 646.6173699999999, "r": 294.04312, "b": 653.13089, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Proceedings of the 35th Conference on Artificial Intelligence", "bbox": {"l": 69.234001, "t": 654.62325, "r": 233.43309000000002, "b": 661.10887, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": ", AAAI, pages 15137-", "bbox": {"l": 233.43401000000003, "t": 654.58838, "r": 294.8089, "b": 661.1019, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "15145, feb 2021.", "bbox": {"l": 69.073997, "t": 662.55836, "r": 113.53197, "b": 669.0718899999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[18] Nikolaos Livathinos, Cesar Berrospi, Maksym Lysak, Viktor Kuropiatnyk, Ahmed Nassar, Andre Carvalho, Michele Dolfi, Christoph Auer, Kasper Dinkla, and Peter W. J. Staar. Robust pdf document conversion using recurrent neural networks. In Proceedings of the 35th Conference on Artificial Intelligence , AAAI, pages 1513715145, feb 2021."}, {"label": "list_item", "id": 14, "page_no": 8, "cluster": {"id": 14, "label": "list_item", "bbox": {"l": 53.797997, "t": 670.52837, "r": 295.22174, "b": 708.92189, "coord_origin": "TOPLEFT"}, "confidence": 0.7421631217002869, "cells": [{"id": 55, "text": "[19]", "bbox": {"l": 53.797997, "t": 670.52837, "r": 65.760811, "b": 677.04189, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Yiheng Xu, Minghao Li, Lei Cui, Shaohan Huang, Furu Wei, and Ming Zhou.", "bbox": {"l": 67.582199, "t": 670.52837, "r": 295.11609, "b": 677.04189, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Layoutlm: Pre-training of text and layout for document image understanding.", "bbox": {"l": 69.234001, "t": 678.49837, "r": 295.11606, "b": 685.01189, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "In", "bbox": {"l": 69.234001, "t": 686.46837, "r": 75.155228, "b": 692.981895, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Proceedings of the 26th ACM SIGKDD International Conference on Knowledge", "bbox": {"l": 76.891998, "t": 686.50323, "r": 294.04382, "b": 692.988869, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Discovery and Data Mining", "bbox": {"l": 69.234001, "t": 694.473236, "r": 144.91022, "b": 700.95887, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": ", KDD, pages 1192-1200, New York, USA, 2020. Asso-", "bbox": {"l": 144.908, "t": 694.4383700000001, "r": 295.22174, "b": 700.951897, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "ciation for Computing Machinery.", "bbox": {"l": 69.234001, "t": 702.408363, "r": 166.37207, "b": 708.92189, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[19] Yiheng Xu, Minghao Li, Lei Cui, Shaohan Huang, Furu Wei, and Ming Zhou. Layoutlm: Pre-training of text and layout for document image understanding. In Proceedings of the 26th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining , KDD, pages 1192-1200, New York, USA, 2020. Association for Computing Machinery."}, {"label": "list_item", "id": 1, "page_no": 8, "cluster": {"id": 1, "label": "list_item", "bbox": {"l": 317.95499, "t": 527.06638, "r": 559.02637, "b": 541.5499, "coord_origin": "TOPLEFT"}, "confidence": 0.9088895320892334, "cells": [{"id": 63, "text": "[20]", "bbox": {"l": 317.95499, "t": 527.06638, "r": 329.24017, "b": 533.57993, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "Shoubin Li, Xuyan Ma, Shuaiqun Pan, Jun Hu, Lin Shi, and Qing Wang. Vtlayout:", "bbox": {"l": 330.95837, "t": 527.06638, "r": 559.02637, "b": 533.57993, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "Fusion of visual and text features for document layout analysis, 2021.", "bbox": {"l": 333.39099, "t": 535.03638, "r": 530.03815, "b": 541.5499, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[20] Shoubin Li, Xuyan Ma, Shuaiqun Pan, Jun Hu, Lin Shi, and Qing Wang. Vtlayout: Fusion of visual and text features for document layout analysis, 2021."}, {"label": "list_item", "id": 0, "page_no": 8, "cluster": {"id": 0, "label": "list_item", "bbox": {"l": 317.95499, "t": 543.00638, "r": 558.9715, "b": 565.4599000000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9247174859046936, "cells": [{"id": 66, "text": "[21]", "bbox": {"l": 317.95499, "t": 543.00638, "r": 329.54419, "b": 549.5199, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "Peng Zhang, Can Li, Liang Qiao, Zhanzhan Cheng, Shiliang Pu, Yi Niu, and Fei", "bbox": {"l": 331.30869, "t": 543.00638, "r": 558.20135, "b": 549.5199, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "Wu. Vsr: A unified framework for document layout analysis combining vision,", "bbox": {"l": 333.05701, "t": 550.97638, "r": 558.9715, "b": 557.4899, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "semantics and relations, 2021.", "bbox": {"l": 333.39099, "t": 558.94638, "r": 418.05988, "b": 565.4599000000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[21] Peng Zhang, Can Li, Liang Qiao, Zhanzhan Cheng, Shiliang Pu, Yi Niu, and Fei Wu. Vsr: A unified framework for document layout analysis combining vision, semantics and relations, 2021."}, {"label": "list_item", "id": 3, "page_no": 8, "cluster": {"id": 3, "label": "list_item", "bbox": {"l": 317.95499, "t": 566.91635, "r": 559.27539, "b": 597.3478700000001, "coord_origin": "TOPLEFT"}, "confidence": 0.8956930637359619, "cells": [{"id": 70, "text": "[22]", "bbox": {"l": 317.95499, "t": 566.91638, "r": 330.14108, "b": 573.4299, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Peter W J Staar, Michele Dolfi, Christoph Auer, and Costas Bekas.", "bbox": {"l": 331.99646, "t": 566.91638, "r": 531.54553, "b": 573.4299, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "Corpus", "bbox": {"l": 537.12946, "t": 566.91635, "r": 558.19897, "b": 573.42989, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "conversion service: A machine learning platform to ingest documents at scale.", "bbox": {"l": 333.39099, "t": 574.88635, "r": 559.27539, "b": 581.39989, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "In", "bbox": {"l": 333.39099, "t": 582.85736, "r": 339.31223, "b": 589.3709, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "Proceedings of the 24th ACM SIGKDD International Conference on Knowledge", "bbox": {"l": 341.04901, "t": 582.89224, "r": 558.20081, "b": 589.37787, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "Discovery and Data Mining", "bbox": {"l": 333.39099, "t": 590.8622399999999, "r": 409.56577, "b": 597.3478700000001, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": ", KDD, pages 774-782. ACM, 2018.", "bbox": {"l": 409.56598, "t": 590.82736, "r": 507.31765999999993, "b": 597.3409, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[22] Peter W J Staar, Michele Dolfi, Christoph Auer, and Costas Bekas. Corpus conversion service: A machine learning platform to ingest documents at scale. In Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining , KDD, pages 774-782. ACM, 2018."}, {"label": "list_item", "id": 2, "page_no": 8, "cluster": {"id": 2, "label": "list_item", "bbox": {"l": 317.95499, "t": 598.79736, "r": 559.3783, "b": 613.28787, "coord_origin": "TOPLEFT"}, "confidence": 0.8972970843315125, "cells": [{"id": 78, "text": "[23]", "bbox": {"l": 317.95499, "t": 598.79736, "r": 329.37976, "b": 605.3109, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "Connor Shorten and Taghi M. Khoshgoftaar. A survey on image data augmenta-", "bbox": {"l": 331.11923, "t": 598.79736, "r": 559.3783, "b": 605.3109, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "tion for deep learning.", "bbox": {"l": 333.39099, "t": 606.76736, "r": 396.9223, "b": 613.2809, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Journal of Big Data", "bbox": {"l": 399.43298, "t": 606.80225, "r": 453.66122, "b": 613.28787, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": ", 6(1):60, 2019.", "bbox": {"l": 453.66199, "t": 606.76736, "r": 493.49631, "b": 613.2809, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "[23] Connor Shorten and Taghi M. Khoshgoftaar. A survey on image data augmentation for deep learning. Journal of Big Data , 6(1):60, 2019."}], "headers": [{"label": "page_header", "id": 13, "page_no": 8, "cluster": {"id": 13, "label": "page_header", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.8021690249443054, "cells": [{"id": 0, "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis", "bbox": {"l": 53.79800000000001, "t": 60.30902000000003, "r": 347.01724, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "DocLayNet: A Large Human-Annotated Dataset for Document-Layout Analysis"}, {"label": "page_header", "id": 9, "page_no": 8, "cluster": {"id": 9, "label": "page_header", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}, "confidence": 0.8429245352745056, "cells": [{"id": 1, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA", "bbox": {"l": 365.75702, "t": 60.30902000000003, "r": 558.20282, "b": 68.57605000000012, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "KDD \u201922, August 14-18, 2022, Washington, DC, USA"}]}}]
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v2/2305.03393v1-pg9.doctags.txt b/tests/data/groundtruth/docling_v2/2305.03393v1-pg9.doctags.txt
index 9352bf30..adfdf6f6 100644
--- a/tests/data/groundtruth/docling_v2/2305.03393v1-pg9.doctags.txt
+++ b/tests/data/groundtruth/docling_v2/2305.03393v1-pg9.doctags.txt
@@ -1,19 +1,10 @@
-<document>
-<text><location><page_1><loc_22><loc_81><loc_79><loc_85></location>order to compute the TED score. Inference timing results for all experiments were obtained from the same machine on a single core with AMD EPYC 7763 CPU @2.45 GHz.</text>
-<section_header_level_1><location><page_1><loc_22><loc_77><loc_52><loc_79></location>5.1 Hyper Parameter Optimization</section_header_level_1>
-<text><location><page_1><loc_22><loc_68><loc_79><loc_77></location>We have chosen the PubTabNet data set to perform HPO, since it includes a highly diverse set of tables. Also we report TED scores separately for simple and complex tables (tables with cell spans). Results are presented in Table. 1. It is evident that with OTSL, our model achieves the same TED score and slightly better mAP scores in comparison to HTML. However OTSL yields a 2x speed up in the inference runtime over HTML.</text>
-<table>
-<location><page_1><loc_23><loc_41><loc_78><loc_57></location>
-<caption>Table 1. HPO performed in OTSL and HTML representation on the same transformer-based TableFormer [9] architecture, trained only on PubTabNet [22]. Effects of reducing the # of layers in encoder and decoder stages of the model show that smaller models trained on OTSL perform better, especially in recognizing complex table structures, and maintain a much higher mAP score than the HTML counterpart.</caption>
-<row_0><col_0><col_header>#</col_0><col_1><col_header>#</col_1><col_2><col_header>Language</col_2><col_3><col_header>TEDs</col_3><col_4><col_header>TEDs</col_4><col_5><col_header>TEDs</col_5><col_6><col_header>mAP</col_6><col_7><col_header>Inference</col_7></row_0>
-<row_1><col_0><col_header>enc-layers</col_0><col_1><col_header>dec-layers</col_1><col_2><col_header>Language</col_2><col_3><col_header>simple</col_3><col_4><col_header>complex</col_4><col_5><col_header>all</col_5><col_6><col_header>(0.75)</col_6><col_7><col_header>time (secs)</col_7></row_1>
-<row_2><col_0><body>6</col_0><col_1><body>6</col_1><col_2><body>OTSL HTML</col_2><col_3><body>0.965 0.969</col_3><col_4><body>0.934 0.927</col_4><col_5><body>0.955 0.955</col_5><col_6><body>0.88 0.857</col_6><col_7><body>2.73 5.39</col_7></row_2>
-<row_3><col_0><body>4</col_0><col_1><body>4</col_1><col_2><body>OTSL HTML</col_2><col_3><body>0.938</col_3><col_4><body>0.904</col_4><col_5><body>0.927</col_5><col_6><body>0.853</col_6><col_7><body>1.97</col_7></row_3>
-<row_4><col_0><body></col_0><col_1><body></col_1><col_2><body>OTSL</col_2><col_3><body>0.952 0.923</col_3><col_4><body>0.909</col_4><col_5><body>0.938</col_5><col_6><body>0.843</col_6><col_7><body>3.77</col_7></row_4>
-<row_5><col_0><body>2</col_0><col_1><body>4</col_1><col_2><body>HTML</col_2><col_3><body>0.945</col_3><col_4><body>0.897 0.901</col_4><col_5><body>0.915 0.931</col_5><col_6><body>0.859 0.834</col_6><col_7><body>1.91 3.81</col_7></row_5>
-<row_6><col_0><body>4</col_0><col_1><body>2</col_1><col_2><body>OTSL HTML</col_2><col_3><body>0.952 0.944</col_3><col_4><body>0.92 0.903</col_4><col_5><body>0.942 0.931</col_5><col_6><body>0.857 0.824</col_6><col_7><body>1.22 2</col_7></row_6>
-</table>
-<section_header_level_1><location><page_1><loc_22><loc_35><loc_43><loc_36></location>5.2 Quantitative Results</section_header_level_1>
-<text><location><page_1><loc_22><loc_22><loc_79><loc_34></location>We picked the model parameter configuration that produced the best prediction quality (enc=6, dec=6, heads=8) with PubTabNet alone, then independently trained and evaluated it on three publicly available data sets: PubTabNet (395k samples), FinTabNet (113k samples) and PubTables-1M (about 1M samples). Performance results are presented in Table. 2. It is clearly evident that the model trained on OTSL outperforms HTML across the board, keeping high TEDs and mAP scores even on difficult financial tables (FinTabNet) that contain sparse and large tables.</text>
-<text><location><page_1><loc_22><loc_16><loc_79><loc_22></location>Additionally, the results show that OTSL has an advantage over HTML when applied on a bigger data set like PubTables-1M and achieves significantly improved scores. Finally, OTSL achieves faster inference due to fewer decoding steps which is a result of the reduced sequence representation.</text>
-</document>
\ No newline at end of file
+<doctag><page_header><loc_159><loc_58><loc_366><loc_65>Optimized Table Tokenization for Table Structure Recognition</page_header>
+<page_header><loc_389><loc_58><loc_393><loc_65>9</page_header>
+<text><loc_110><loc_74><loc_393><loc_97>order to compute the TED score. Inference timing results for all experiments were obtained from the same machine on a single core with AMD EPYC 7763 CPU @2.45 GHz.</text>
+<section_header_level_1><loc_110><loc_105><loc_260><loc_113>5.1 Hyper Parameter Optimization</section_header_level_1>
+<text><loc_110><loc_116><loc_393><loc_161>We have chosen the PubTabNet data set to perform HPO, since it includes a highly diverse set of tables. Also we report TED scores separately for simple and complex tables (tables with cell spans). Results are presented in Table. 1. It is evident that with OTSL, our model achieves the same TED score and slightly better mAP scores in comparison to HTML. However OTSL yields a 2x speed up in the inference runtime over HTML.</text>
+<otsl><loc_114><loc_213><loc_388><loc_296><ched>#<ched>#<ched>Language<ched>TEDs<lcel><lcel><ched>mAP<ched>Inference<nl><ched>enc-layers<ched>dec-layers<ucel><ched>simple<ched>complex<ched>all<ched>(0.75)<ched>time (secs)<nl><fcel>6<fcel>6<fcel>OTSL HTML<fcel>0.965 0.969<fcel>0.934 0.927<fcel>0.955 0.955<fcel>0.88 0.857<fcel>2.73 5.39<nl><fcel>4<fcel>4<fcel>OTSL HTML<fcel>0.938<fcel>0.904<fcel>0.927<fcel>0.853<fcel>1.97<nl><ecel><ecel><fcel>OTSL<fcel>0.952 0.923<fcel>0.909<fcel>0.938<fcel>0.843<fcel>3.77<nl><fcel>2<fcel>4<fcel>HTML<fcel>0.945<fcel>0.897 0.901<fcel>0.915 0.931<fcel>0.859 0.834<fcel>1.91 3.81<nl><fcel>4<fcel>2<fcel>OTSL HTML<fcel>0.952 0.944<fcel>0.92 0.903<fcel>0.942 0.931<fcel>0.857 0.824<fcel>1.22 2<nl><caption><loc_110><loc_172><loc_393><loc_207>Table 1. HPO performed in OTSL and HTML representation on the same transformer-based TableFormer [9] architecture, trained only on PubTabNet [22]. Effects of reducing the # of layers in encoder and decoder stages of the model show that smaller models trained on OTSL perform better, especially in recognizing complex table structures, and maintain a much higher mAP score than the HTML counterpart.</caption></otsl>
+<section_header_level_1><loc_110><loc_319><loc_216><loc_327>5.2 Quantitative Results</section_header_level_1>
+<text><loc_110><loc_330><loc_393><loc_390>We picked the model parameter configuration that produced the best prediction quality (enc=6, dec=6, heads=8) with PubTabNet alone, then independently trained and evaluated it on three publicly available data sets: PubTabNet (395k samples), FinTabNet (113k samples) and PubTables-1M (about 1M samples). Performance results are presented in Table. 2. It is clearly evident that the model trained on OTSL outperforms HTML across the board, keeping high TEDs and mAP scores even on difficult financial tables (FinTabNet) that contain sparse and large tables.</text>
+<text><loc_110><loc_390><loc_393><loc_421>Additionally, the results show that OTSL has an advantage over HTML when applied on a bigger data set like PubTables-1M and achieves significantly improved scores. Finally, OTSL achieves faster inference due to fewer decoding steps which is a result of the reduced sequence representation.</text>
+</doctag>
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v2/2305.03393v1-pg9.json b/tests/data/groundtruth/docling_v2/2305.03393v1-pg9.json
index 8108fb67..57ff945f 100644
--- a/tests/data/groundtruth/docling_v2/2305.03393v1-pg9.json
+++ b/tests/data/groundtruth/docling_v2/2305.03393v1-pg9.json
@@ -1 +1 @@
-{"schema_name": "DoclingDocument", "version": "1.0.0", "name": "2305.03393v1-pg9", "origin": {"mimetype": "application/pdf", "binary_hash": 3463920545297462180, "filename": "2305.03393v1-pg9.pdf", "uri": null}, "furniture": {"self_ref": "#/furniture", "parent": null, "children": [], "name": "_root_", "label": "unspecified"}, "body": {"self_ref": "#/body", "parent": null, "children": [{"cref": "#/texts/0"}, {"cref": "#/texts/1"}, {"cref": "#/texts/2"}, {"cref": "#/texts/3"}, {"cref": "#/texts/4"}, {"cref": "#/texts/5"}, {"cref": "#/tables/0"}, {"cref": "#/texts/6"}, {"cref": "#/texts/7"}, {"cref": "#/texts/8"}], "name": "_root_", "label": "unspecified"}, "groups": [], "texts": [{"self_ref": "#/texts/0", "parent": {"cref": "#/body"}, "children": [], "label": "page_header", "prov": [{"page_no": 1, "bbox": {"l": 194.47799682617188, "t": 700.5064697265625, "r": 447.5447692871094, "b": 689.2177734375, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 60]}], "orig": "Optimized Table Tokenization for Table Structure Recognition", "text": "Optimized Table Tokenization for Table Structure Recognition"}, {"self_ref": "#/texts/1", "parent": {"cref": "#/body"}, "children": [], "label": "page_header", "prov": [{"page_no": 1, "bbox": {"l": 475.9844055175781, "t": 700.5064697265625, "r": 480.5931396484375, "b": 689.2177734375, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "9", "text": "9"}, {"self_ref": "#/texts/2", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 134.76499938964844, "t": 675.5369873046875, "r": 480.5966491699219, "b": 639.093017578125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 163]}], "orig": "order to compute the TED score. Inference timing results for all experiments were obtained from the same machine on a single core with AMD EPYC 7763 CPU @2.45 GHz.", "text": "order to compute the TED score. Inference timing results for all experiments were obtained from the same machine on a single core with AMD EPYC 7763 CPU @2.45 GHz."}, {"self_ref": "#/texts/3", "parent": {"cref": "#/body"}, "children": [], "label": "section_header", "prov": [{"page_no": 1, "bbox": {"l": 134.76499938964844, "t": 625.2948608398438, "r": 318.4514465332031, "b": 612.7918090820312, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 32]}], "orig": "5.1 Hyper Parameter Optimization", "text": "5.1 Hyper Parameter Optimization", "level": 1}, {"self_ref": "#/texts/4", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 134.76499938964844, "t": 608.8849487304688, "r": 480.5956726074219, "b": 536.5759887695312, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 423]}], "orig": "We have chosen the PubTabNet data set to perform HPO, since it includes a highly diverse set of tables. Also we report TED scores separately for simple and complex tables (tables with cell spans). Results are presented in Table. 1. It is evident that with OTSL, our model achieves the same TED score and slightly better mAP scores in comparison to HTML. However OTSL yields a 2x speed up in the inference runtime over HTML.", "text": "We have chosen the PubTabNet data set to perform HPO, since it includes a highly diverse set of tables. Also we report TED scores separately for simple and complex tables (tables with cell spans). Results are presented in Table. 1. It is evident that with OTSL, our model achieves the same TED score and slightly better mAP scores in comparison to HTML. However OTSL yields a 2x speed up in the inference runtime over HTML."}, {"self_ref": "#/texts/5", "parent": {"cref": "#/body"}, "children": [], "label": "caption", "prov": [{"page_no": 1, "bbox": {"l": 134.76499938964844, "t": 519.2052612304688, "r": 480.5989074707031, "b": 464.017822265625, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 398]}], "orig": "Table 1. HPO performed in OTSL and HTML representation on the same transformer-based TableFormer [9] architecture, trained only on PubTabNet [22]. Effects of reducing the # of layers in encoder and decoder stages of the model show that smaller models trained on OTSL perform better, especially in recognizing complex table structures, and maintain a much higher mAP score than the HTML counterpart.", "text": "Table 1. HPO performed in OTSL and HTML representation on the same transformer-based TableFormer [9] architecture, trained only on PubTabNet [22]. Effects of reducing the # of layers in encoder and decoder stages of the model show that smaller models trained on OTSL perform better, especially in recognizing complex table structures, and maintain a much higher mAP score than the HTML counterpart."}, {"self_ref": "#/texts/6", "parent": {"cref": "#/body"}, "children": [], "label": "section_header", "prov": [{"page_no": 1, "bbox": {"l": 134.76499938964844, "t": 286.3288879394531, "r": 264.4082946777344, "b": 273.8258056640625, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 24]}], "orig": "5.2 Quantitative Results", "text": "5.2 Quantitative Results", "level": 1}, {"self_ref": "#/texts/7", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 134.76499938964844, "t": 269.9199523925781, "r": 480.72003173828125, "b": 173.6999969482422, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 555]}], "orig": "We picked the model parameter configuration that produced the best prediction quality (enc=6, dec=6, heads=8) with PubTabNet alone, then independently trained and evaluated it on three publicly available data sets: PubTabNet (395k samples), FinTabNet (113k samples) and PubTables-1M (about 1M samples). Performance results are presented in Table. 2. It is clearly evident that the model trained on OTSL outperforms HTML across the board, keeping high TEDs and mAP scores even on difficult financial tables (FinTabNet) that contain sparse and large tables.", "text": "We picked the model parameter configuration that produced the best prediction quality (enc=6, dec=6, heads=8) with PubTabNet alone, then independently trained and evaluated it on three publicly available data sets: PubTabNet (395k samples), FinTabNet (113k samples) and PubTables-1M (about 1M samples). Performance results are presented in Table. 2. It is clearly evident that the model trained on OTSL outperforms HTML across the board, keeping high TEDs and mAP scores even on difficult financial tables (FinTabNet) that contain sparse and large tables."}, {"self_ref": "#/texts/8", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 134.76499938964844, "t": 174.2779541015625, "r": 480.59857177734375, "b": 125.87999725341797, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 289]}], "orig": "Additionally, the results show that OTSL has an advantage over HTML when applied on a bigger data set like PubTables-1M and achieves significantly improved scores. Finally, OTSL achieves faster inference due to fewer decoding steps which is a result of the reduced sequence representation.", "text": "Additionally, the results show that OTSL has an advantage over HTML when applied on a bigger data set like PubTables-1M and achieves significantly improved scores. Finally, OTSL achieves faster inference due to fewer decoding steps which is a result of the reduced sequence representation."}], "pictures": [], "tables": [{"self_ref": "#/tables/0", "parent": {"cref": "#/body"}, "children": [], "label": "table", "prov": [{"page_no": 1, "bbox": {"l": 139.6674041748047, "t": 454.4546203613281, "r": 475.00927734375, "b": 322.5054626464844, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [{"cref": "#/texts/5"}], "references": [], "footnotes": [], "image": null, "data": {"table_cells": [{"bbox": {"l": 160.3699951171875, "t": 452.5425109863281, "r": 168.04522705078125, "b": 441.2538146972656, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "#", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 207.9739990234375, "t": 452.5425109863281, "r": 215.64923095703125, "b": 441.2538146972656, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "#", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 239.79800415039062, "t": 447.0635070800781, "r": 278.33380126953125, "b": 435.7748107910156, "coord_origin": "BOTTOMLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Language", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 324.6700134277344, "t": 452.5425109863281, "r": 348.2641906738281, "b": 441.2538146972656, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 3, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 6, "text": "TEDs", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 396.27099609375, "t": 452.5425109863281, "r": 417.1259460449219, "b": 441.2538146972656, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "mAP", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 430.77099609375, "t": 452.5425109863281, "r": 467.14141845703125, "b": 441.2538146972656, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "Inference", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 144.5919952392578, "t": 439.5915222167969, "r": 183.82894897460938, "b": 428.3028259277344, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "enc-layers", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 192.19500732421875, "t": 439.5915222167969, "r": 231.42303466796875, "b": 428.3028259277344, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "dec-layers", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 286.6860046386719, "t": 439.5915222167969, "r": 312.328125, "b": 428.3028259277344, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "simple", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 320.7019958496094, "t": 439.5915222167969, "r": 353.71539306640625, "b": 428.3028259277344, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "complex", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 369.3059997558594, "t": 439.5915222167969, "r": 379.0291442871094, "b": 428.3028259277344, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "all", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 394.927001953125, "t": 441.5835266113281, "r": 418.4692077636719, "b": 430.2948303222656, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "(0.75)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 427.14801025390625, "t": 441.5835266113281, "r": 470.7695617675781, "b": 430.2948303222656, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "time (secs)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 161.906005859375, "t": 420.7615051269531, "r": 166.51473999023438, "b": 409.4728088378906, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.50900268554688, "t": 420.7615051269531, "r": 214.11773681640625, "b": 409.4728088378906, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17599487304688, "t": 426.24151611328125, "r": 272.9449462890625, "b": 402.0008239746094, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.0169982910156, "t": 426.24151611328125, "r": 310.00732421875, "b": 402.0008239746094, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.965 0.969", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.7170104980469, "t": 426.24151611328125, "r": 347.70733642578125, "b": 402.0008239746094, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.934 0.927", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 363.6759948730469, "t": 426.24151611328125, "r": 384.66632080078125, "b": 402.0008239746094, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.955 0.955", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 396.20599365234375, "t": 426.3042907714844, "r": 417.1963195800781, "b": 402.0008239746094, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.88 0.857", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.5270080566406, "t": 426.3042907714844, "r": 458.38336181640625, "b": 402.0008239746094, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "2.73 5.39", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 161.906005859375, "t": 394.46051025390625, "r": 166.51473999023438, "b": 383.17181396484375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.50900268554688, "t": 394.46051025390625, "r": 214.11773681640625, "b": 383.17181396484375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17599487304688, "t": 399.93951416015625, "r": 272.9449462890625, "b": 375.6998291015625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.0169982910156, "t": 399.93951416015625, "r": 310.00732421875, "b": 388.65081787109375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.938", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.7170104980469, "t": 399.93951416015625, "r": 347.70733642578125, "b": 388.65081787109375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.904", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 363.6759948730469, "t": 399.93951416015625, "r": 384.66632080078125, "b": 388.65081787109375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.927", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.6180114746094, "t": 400.0022888183594, "r": 418.7779846191406, "b": 388.5970153808594, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.853", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.5270080566406, "t": 400.0022888183594, "r": 458.38336181640625, "b": 388.5970153808594, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "1.97", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 246.7100067138672, "t": 373.6385192871094, "r": 271.41064453125, "b": 362.3498229980469, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.0169982910156, "t": 386.988525390625, "r": 310.00732421875, "b": 362.3498229980469, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.952 0.923", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.7170104980469, "t": 386.988525390625, "r": 347.70733642578125, "b": 375.6998291015625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.909", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 362.0880126953125, "t": 387.0513000488281, "r": 386.24798583984375, "b": 375.6460266113281, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.938", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 396.20599365234375, "t": 386.988525390625, "r": 417.1963195800781, "b": 375.6998291015625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.843", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.7669982910156, "t": 386.988525390625, "r": 457.150390625, "b": 375.6998291015625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "3.77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 161.906005859375, "t": 368.1595153808594, "r": 166.51473999023438, "b": 356.8708190917969, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.50900268554688, "t": 368.1595153808594, "r": 214.11773681640625, "b": 356.8708190917969, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17599487304688, "t": 360.6875305175781, "r": 272.9449462890625, "b": 349.3988342285156, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.0169982910156, "t": 360.6875305175781, "r": 310.00732421875, "b": 349.3988342285156, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.945", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.7170104980469, "t": 373.6385192871094, "r": 347.70733642578125, "b": 349.3988342285156, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.897 0.901", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 362.0880126953125, "t": 373.6385192871094, "r": 386.24798583984375, "b": 349.34503173828125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.915 0.931", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.6180114746094, "t": 373.7012939453125, "r": 418.7779846191406, "b": 349.3988342285156, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.859 0.834", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.5270080566406, "t": 373.7012939453125, "r": 458.38336181640625, "b": 349.3988342285156, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "1.91 3.81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 161.906005859375, "t": 341.8575134277344, "r": 166.51473999023438, "b": 330.5688171386719, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.50900268554688, "t": 341.8575134277344, "r": 214.11773681640625, "b": 330.5688171386719, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17599487304688, "t": 347.3375244140625, "r": 272.9449462890625, "b": 323.0968322753906, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.0169982910156, "t": 347.3375244140625, "r": 310.00732421875, "b": 323.0968322753906, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.952 0.944", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.7170104980469, "t": 347.3375244140625, "r": 347.70733642578125, "b": 323.0968322753906, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.92 0.903", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 362.0880126953125, "t": 347.4002990722656, "r": 386.24798583984375, "b": 323.0968322753906, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.942 0.931", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.6180114746094, "t": 347.4002990722656, "r": 418.7779846191406, "b": 323.0968322753906, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.857 0.824", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.5270080566406, "t": 347.4002990722656, "r": 458.38336181640625, "b": 323.0968322753906, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "1.22 2", "column_header": false, "row_header": false, "row_section": false}], "num_rows": 7, "num_cols": 8, "grid": [[{"bbox": {"l": 160.3699951171875, "t": 452.5425109863281, "r": 168.04522705078125, "b": 441.2538146972656, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "#", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 207.9739990234375, "t": 452.5425109863281, "r": 215.64923095703125, "b": 441.2538146972656, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "#", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 239.79800415039062, "t": 447.0635070800781, "r": 278.33380126953125, "b": 435.7748107910156, "coord_origin": "BOTTOMLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Language", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 324.6700134277344, "t": 452.5425109863281, "r": 348.2641906738281, "b": 441.2538146972656, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 3, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 6, "text": "TEDs", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 324.6700134277344, "t": 452.5425109863281, "r": 348.2641906738281, "b": 441.2538146972656, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 3, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 6, "text": "TEDs", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 324.6700134277344, "t": 452.5425109863281, "r": 348.2641906738281, "b": 441.2538146972656, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 3, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 6, "text": "TEDs", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 396.27099609375, "t": 452.5425109863281, "r": 417.1259460449219, "b": 441.2538146972656, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "mAP", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 430.77099609375, "t": 452.5425109863281, "r": 467.14141845703125, "b": 441.2538146972656, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "Inference", "column_header": true, "row_header": false, "row_section": false}], [{"bbox": {"l": 144.5919952392578, "t": 439.5915222167969, "r": 183.82894897460938, "b": 428.3028259277344, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "enc-layers", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 192.19500732421875, "t": 439.5915222167969, "r": 231.42303466796875, "b": 428.3028259277344, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "dec-layers", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 239.79800415039062, "t": 447.0635070800781, "r": 278.33380126953125, "b": 435.7748107910156, "coord_origin": "BOTTOMLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Language", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 286.6860046386719, "t": 439.5915222167969, "r": 312.328125, "b": 428.3028259277344, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "simple", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 320.7019958496094, "t": 439.5915222167969, "r": 353.71539306640625, "b": 428.3028259277344, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "complex", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 369.3059997558594, "t": 439.5915222167969, "r": 379.0291442871094, "b": 428.3028259277344, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "all", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 394.927001953125, "t": 441.5835266113281, "r": 418.4692077636719, "b": 430.2948303222656, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "(0.75)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 427.14801025390625, "t": 441.5835266113281, "r": 470.7695617675781, "b": 430.2948303222656, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "time (secs)", "column_header": true, "row_header": false, "row_section": false}], [{"bbox": {"l": 161.906005859375, "t": 420.7615051269531, "r": 166.51473999023438, "b": 409.4728088378906, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.50900268554688, "t": 420.7615051269531, "r": 214.11773681640625, "b": 409.4728088378906, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17599487304688, "t": 426.24151611328125, "r": 272.9449462890625, "b": 402.0008239746094, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.0169982910156, "t": 426.24151611328125, "r": 310.00732421875, "b": 402.0008239746094, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.965 0.969", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.7170104980469, "t": 426.24151611328125, "r": 347.70733642578125, "b": 402.0008239746094, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.934 0.927", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 363.6759948730469, "t": 426.24151611328125, "r": 384.66632080078125, "b": 402.0008239746094, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.955 0.955", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 396.20599365234375, "t": 426.3042907714844, "r": 417.1963195800781, "b": 402.0008239746094, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.88 0.857", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.5270080566406, "t": 426.3042907714844, "r": 458.38336181640625, "b": 402.0008239746094, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "2.73 5.39", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 161.906005859375, "t": 394.46051025390625, "r": 166.51473999023438, "b": 383.17181396484375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.50900268554688, "t": 394.46051025390625, "r": 214.11773681640625, "b": 383.17181396484375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17599487304688, "t": 399.93951416015625, "r": 272.9449462890625, "b": 375.6998291015625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.0169982910156, "t": 399.93951416015625, "r": 310.00732421875, "b": 388.65081787109375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.938", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.7170104980469, "t": 399.93951416015625, "r": 347.70733642578125, "b": 388.65081787109375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.904", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 363.6759948730469, "t": 399.93951416015625, "r": 384.66632080078125, "b": 388.65081787109375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.927", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.6180114746094, "t": 400.0022888183594, "r": 418.7779846191406, "b": 388.5970153808594, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.853", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.5270080566406, "t": 400.0022888183594, "r": 458.38336181640625, "b": 388.5970153808594, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "1.97", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 246.7100067138672, "t": 373.6385192871094, "r": 271.41064453125, "b": 362.3498229980469, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.0169982910156, "t": 386.988525390625, "r": 310.00732421875, "b": 362.3498229980469, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.952 0.923", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.7170104980469, "t": 386.988525390625, "r": 347.70733642578125, "b": 375.6998291015625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.909", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 362.0880126953125, "t": 387.0513000488281, "r": 386.24798583984375, "b": 375.6460266113281, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.938", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 396.20599365234375, "t": 386.988525390625, "r": 417.1963195800781, "b": 375.6998291015625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.843", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.7669982910156, "t": 386.988525390625, "r": 457.150390625, "b": 375.6998291015625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "3.77", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 161.906005859375, "t": 368.1595153808594, "r": 166.51473999023438, "b": 356.8708190917969, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.50900268554688, "t": 368.1595153808594, "r": 214.11773681640625, "b": 356.8708190917969, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17599487304688, "t": 360.6875305175781, "r": 272.9449462890625, "b": 349.3988342285156, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.0169982910156, "t": 360.6875305175781, "r": 310.00732421875, "b": 349.3988342285156, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.945", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.7170104980469, "t": 373.6385192871094, "r": 347.70733642578125, "b": 349.3988342285156, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.897 0.901", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 362.0880126953125, "t": 373.6385192871094, "r": 386.24798583984375, "b": 349.34503173828125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.915 0.931", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.6180114746094, "t": 373.7012939453125, "r": 418.7779846191406, "b": 349.3988342285156, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.859 0.834", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.5270080566406, "t": 373.7012939453125, "r": 458.38336181640625, "b": 349.3988342285156, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "1.91 3.81", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 161.906005859375, "t": 341.8575134277344, "r": 166.51473999023438, "b": 330.5688171386719, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.50900268554688, "t": 341.8575134277344, "r": 214.11773681640625, "b": 330.5688171386719, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17599487304688, "t": 347.3375244140625, "r": 272.9449462890625, "b": 323.0968322753906, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.0169982910156, "t": 347.3375244140625, "r": 310.00732421875, "b": 323.0968322753906, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.952 0.944", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.7170104980469, "t": 347.3375244140625, "r": 347.70733642578125, "b": 323.0968322753906, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.92 0.903", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 362.0880126953125, "t": 347.4002990722656, "r": 386.24798583984375, "b": 323.0968322753906, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.942 0.931", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.6180114746094, "t": 347.4002990722656, "r": 418.7779846191406, "b": 323.0968322753906, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.857 0.824", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.5270080566406, "t": 347.4002990722656, "r": 458.38336181640625, "b": 323.0968322753906, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "1.22 2", "column_header": false, "row_header": false, "row_section": false}]]}}], "key_value_items": [], "pages": {"1": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 1}}}
\ No newline at end of file
+{"schema_name": "DoclingDocument", "version": "1.1.0", "name": "2305.03393v1-pg9", "origin": {"mimetype": "application/pdf", "binary_hash": 3463920545297462180, "filename": "2305.03393v1-pg9.pdf", "uri": null}, "furniture": {"self_ref": "#/furniture", "parent": null, "children": [], "content_layer": "furniture", "name": "_root_", "label": "unspecified"}, "body": {"self_ref": "#/body", "parent": null, "children": [{"cref": "#/texts/0"}, {"cref": "#/texts/1"}, {"cref": "#/texts/2"}, {"cref": "#/texts/3"}, {"cref": "#/texts/4"}, {"cref": "#/tables/0"}, {"cref": "#/texts/6"}, {"cref": "#/texts/7"}, {"cref": "#/texts/8"}], "content_layer": "body", "name": "_root_", "label": "unspecified"}, "groups": [], "texts": [{"self_ref": "#/texts/0", "parent": {"cref": "#/body"}, "children": [], "content_layer": "furniture", "label": "page_header", "prov": [{"page_no": 1, "bbox": {"l": 194.478, "t": 700.50647, "r": 447.54476999999997, "b": 689.21777, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 60]}], "orig": "Optimized Table Tokenization for Table Structure Recognition", "text": "Optimized Table Tokenization for Table Structure Recognition"}, {"self_ref": "#/texts/1", "parent": {"cref": "#/body"}, "children": [], "content_layer": "furniture", "label": "page_header", "prov": [{"page_no": 1, "bbox": {"l": 475.98441, "t": 700.50647, "r": 480.59314, "b": 689.21777, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "9", "text": "9"}, {"self_ref": "#/texts/2", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 134.765, "t": 675.53699, "r": 480.59665, "b": 639.09302, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 163]}], "orig": "order to compute the TED score. Inference timing results for all experiments were obtained from the same machine on a single core with AMD EPYC 7763 CPU @2.45 GHz.", "text": "order to compute the TED score. Inference timing results for all experiments were obtained from the same machine on a single core with AMD EPYC 7763 CPU @2.45 GHz."}, {"self_ref": "#/texts/3", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "section_header", "prov": [{"page_no": 1, "bbox": {"l": 134.765, "t": 625.29486, "r": 318.45145, "b": 612.79181, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 32]}], "orig": "5.1 Hyper Parameter Optimization", "text": "5.1 Hyper Parameter Optimization", "level": 1}, {"self_ref": "#/texts/4", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 134.765, "t": 608.88495, "r": 480.59567, "b": 536.57599, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 423]}], "orig": "We have chosen the PubTabNet data set to perform HPO, since it includes a highly diverse set of tables. Also we report TED scores separately for simple and complex tables (tables with cell spans). Results are presented in Table. 1. It is evident that with OTSL, our model achieves the same TED score and slightly better mAP scores in comparison to HTML. However OTSL yields a 2x speed up in the inference runtime over HTML.", "text": "We have chosen the PubTabNet data set to perform HPO, since it includes a highly diverse set of tables. Also we report TED scores separately for simple and complex tables (tables with cell spans). Results are presented in Table. 1. It is evident that with OTSL, our model achieves the same TED score and slightly better mAP scores in comparison to HTML. However OTSL yields a 2x speed up in the inference runtime over HTML."}, {"self_ref": "#/texts/5", "parent": {"cref": "#/tables/0"}, "children": [], "content_layer": "body", "label": "caption", "prov": [{"page_no": 1, "bbox": {"l": 134.765, "t": 519.20526, "r": 480.59890999999993, "b": 464.01782, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 398]}], "orig": "Table 1. HPO performed in OTSL and HTML representation on the same transformer-based TableFormer [9] architecture, trained only on PubTabNet [22]. Effects of reducing the # of layers in encoder and decoder stages of the model show that smaller models trained on OTSL perform better, especially in recognizing complex table structures, and maintain a much higher mAP score than the HTML counterpart.", "text": "Table 1. HPO performed in OTSL and HTML representation on the same transformer-based TableFormer [9] architecture, trained only on PubTabNet [22]. Effects of reducing the # of layers in encoder and decoder stages of the model show that smaller models trained on OTSL perform better, especially in recognizing complex table structures, and maintain a much higher mAP score than the HTML counterpart."}, {"self_ref": "#/texts/6", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "section_header", "prov": [{"page_no": 1, "bbox": {"l": 134.765, "t": 286.32889, "r": 264.40829, "b": 273.82581000000005, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 24]}], "orig": "5.2 Quantitative Results", "text": "5.2 Quantitative Results", "level": 1}, {"self_ref": "#/texts/7", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 134.765, "t": 269.91995, "r": 480.72003, "b": 173.70000000000005, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 555]}], "orig": "We picked the model parameter configuration that produced the best prediction quality (enc=6, dec=6, heads=8) with PubTabNet alone, then independently trained and evaluated it on three publicly available data sets: PubTabNet (395k samples), FinTabNet (113k samples) and PubTables-1M (about 1M samples). Performance results are presented in Table. 2. It is clearly evident that the model trained on OTSL outperforms HTML across the board, keeping high TEDs and mAP scores even on difficult financial tables (FinTabNet) that contain sparse and large tables.", "text": "We picked the model parameter configuration that produced the best prediction quality (enc=6, dec=6, heads=8) with PubTabNet alone, then independently trained and evaluated it on three publicly available data sets: PubTabNet (395k samples), FinTabNet (113k samples) and PubTables-1M (about 1M samples). Performance results are presented in Table. 2. It is clearly evident that the model trained on OTSL outperforms HTML across the board, keeping high TEDs and mAP scores even on difficult financial tables (FinTabNet) that contain sparse and large tables."}, {"self_ref": "#/texts/8", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 134.765, "t": 174.27795000000003, "r": 480.59857000000005, "b": 125.88, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 289]}], "orig": "Additionally, the results show that OTSL has an advantage over HTML when applied on a bigger data set like PubTables-1M and achieves significantly improved scores. Finally, OTSL achieves faster inference due to fewer decoding steps which is a result of the reduced sequence representation.", "text": "Additionally, the results show that OTSL has an advantage over HTML when applied on a bigger data set like PubTables-1M and achieves significantly improved scores. Finally, OTSL achieves faster inference due to fewer decoding steps which is a result of the reduced sequence representation."}], "pictures": [], "tables": [{"self_ref": "#/tables/0", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/5"}], "content_layer": "body", "label": "table", "prov": [{"page_no": 1, "bbox": {"l": 139.66741943359375, "t": 454.45458984375, "r": 475.00927734375, "b": 322.5054626464844, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [{"cref": "#/texts/5"}], "references": [], "footnotes": [], "image": null, "data": {"table_cells": [{"bbox": {"l": 160.37, "t": 339.45749, "r": 168.04523, "b": 350.74619, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "#", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 144.592, "t": 352.40848, "r": 183.82895, "b": 363.69717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "enc-layers", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 207.974, "t": 339.45749, "r": 215.64923000000002, "b": 350.74619, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "#", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 192.19501, "t": 352.40848, "r": 231.42303, "b": 363.69717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "dec-layers", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 239.79799999999997, "t": 344.93649, "r": 278.3338, "b": 356.22519000000005, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Language", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 324.67001, "t": 339.45749, "r": 348.26419, "b": 350.74619, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 3, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 6, "text": "TEDs", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 396.271, "t": 339.45749, "r": 417.12595, "b": 350.74619, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "mAP", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 394.927, "t": 350.41647, "r": 418.46921, "b": 361.70517, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "(0.75)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 430.771, "t": 339.45749, "r": 467.14142000000004, "b": 350.74619, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "Inference", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 427.14801, "t": 350.41647, "r": 470.76955999999996, "b": 361.70517, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "time (secs)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 286.686, "t": 352.40848, "r": 312.32812, "b": 363.69717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "simple", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 320.702, "t": 352.40848, "r": 353.71539, "b": 363.69717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "complex", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 369.306, "t": 352.40848, "r": 379.02914, "b": 363.69717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "all", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 161.90601, "t": 371.23849, "r": 166.51474, "b": 382.52719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 371.23849, "r": 214.11774, "b": 382.52719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 365.75848, "r": 272.94495, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 365.75848, "r": 310.00732, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.965 0.969", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 365.75848, "r": 347.70734, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.934 0.927", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 363.67599, "t": 365.75848, "r": 384.66632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.955 0.955", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 396.20599, "t": 365.69571, "r": 417.19632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.88 0.857", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 365.69571, "r": 458.38336, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "2.73 5.39", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 161.90601, "t": 397.53949, "r": 166.51474, "b": 408.82819, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 397.53949, "r": 214.11774, "b": 408.82819, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 392.06049, "r": 272.94495, "b": 416.30017, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 392.06049, "r": 310.00732, "b": 403.34918, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.938", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 392.06049, "r": 347.70734, "b": 403.34918, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.904", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 363.67599, "t": 392.06049, "r": 384.66632, "b": 403.34918, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.927", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.61801, "t": 391.99771, "r": 418.77798, "b": 403.40298, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.853", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 391.99771, "r": 458.38336, "b": 403.40298, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "1.97", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 405.01147, "r": 310.00732, "b": 429.65018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.952 0.923", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 405.01147, "r": 347.70734, "b": 416.30017, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.909", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 362.08801, "t": 404.9486999999999, "r": 386.24799, "b": 416.35397, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.938", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 396.20599, "t": 405.01147, "r": 417.19632, "b": 416.30017, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.843", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.767, "t": 405.01147, "r": 457.15039, "b": 416.30017, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "3.77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 161.90601, "t": 423.84048, "r": 166.51474, "b": 435.12918, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 423.84048, "r": 214.11774, "b": 435.12918, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 246.71000999999998, "t": 418.3614799999999, "r": 271.41064, "b": 429.65018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 418.3614799999999, "r": 347.70734, "b": 442.60117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.897 0.901", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 362.08801, "t": 418.3614799999999, "r": 386.24799, "b": 442.65497, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.915 0.931", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.61801, "t": 418.29871, "r": 418.77798, "b": 442.60117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.859 0.834", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 418.29871, "r": 458.38336, "b": 442.60117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "1.91 3.81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 431.31246999999996, "r": 272.94495, "b": 442.60117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 431.31246999999996, "r": 310.00732, "b": 442.60117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.945", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 161.90601, "t": 450.14248999999995, "r": 166.51474, "b": 461.43118, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 450.14248999999995, "r": 214.11774, "b": 461.43118, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 444.66248, "r": 272.94495, "b": 468.90317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 444.66248, "r": 310.00732, "b": 468.90317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.952 0.944", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 444.66248, "r": 347.70734, "b": 468.90317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.92 0.903", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 362.08801, "t": 444.5996999999999, "r": 386.24799, "b": 468.90317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.942 0.931", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.61801, "t": 444.5996999999999, "r": 418.77798, "b": 468.90317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.857 0.824", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 444.5996999999999, "r": 458.38336, "b": 468.90317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "1.22 2", "column_header": false, "row_header": false, "row_section": false}], "num_rows": 7, "num_cols": 8, "grid": [[{"bbox": {"l": 160.37, "t": 339.45749, "r": 168.04523, "b": 350.74619, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "#", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 207.974, "t": 339.45749, "r": 215.64923000000002, "b": 350.74619, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "#", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 239.79799999999997, "t": 344.93649, "r": 278.3338, "b": 356.22519000000005, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Language", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 324.67001, "t": 339.45749, "r": 348.26419, "b": 350.74619, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 3, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 6, "text": "TEDs", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 324.67001, "t": 339.45749, "r": 348.26419, "b": 350.74619, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 3, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 6, "text": "TEDs", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 324.67001, "t": 339.45749, "r": 348.26419, "b": 350.74619, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 3, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 6, "text": "TEDs", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 396.271, "t": 339.45749, "r": 417.12595, "b": 350.74619, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "mAP", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 430.771, "t": 339.45749, "r": 467.14142000000004, "b": 350.74619, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "Inference", "column_header": true, "row_header": false, "row_section": false}], [{"bbox": {"l": 144.592, "t": 352.40848, "r": 183.82895, "b": 363.69717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "enc-layers", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 192.19501, "t": 352.40848, "r": 231.42303, "b": 363.69717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "dec-layers", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 239.79799999999997, "t": 344.93649, "r": 278.3338, "b": 356.22519000000005, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Language", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 286.686, "t": 352.40848, "r": 312.32812, "b": 363.69717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "simple", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 320.702, "t": 352.40848, "r": 353.71539, "b": 363.69717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "complex", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 369.306, "t": 352.40848, "r": 379.02914, "b": 363.69717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "all", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 394.927, "t": 350.41647, "r": 418.46921, "b": 361.70517, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "(0.75)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 427.14801, "t": 350.41647, "r": 470.76955999999996, "b": 361.70517, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "time (secs)", "column_header": true, "row_header": false, "row_section": false}], [{"bbox": {"l": 161.90601, "t": 371.23849, "r": 166.51474, "b": 382.52719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 371.23849, "r": 214.11774, "b": 382.52719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 365.75848, "r": 272.94495, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 365.75848, "r": 310.00732, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.965 0.969", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 365.75848, "r": 347.70734, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.934 0.927", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 363.67599, "t": 365.75848, "r": 384.66632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.955 0.955", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 396.20599, "t": 365.69571, "r": 417.19632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.88 0.857", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 365.69571, "r": 458.38336, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "2.73 5.39", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 161.90601, "t": 397.53949, "r": 166.51474, "b": 408.82819, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 397.53949, "r": 214.11774, "b": 408.82819, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 392.06049, "r": 272.94495, "b": 416.30017, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 392.06049, "r": 310.00732, "b": 403.34918, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.938", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 392.06049, "r": 347.70734, "b": 403.34918, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.904", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 363.67599, "t": 392.06049, "r": 384.66632, "b": 403.34918, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.927", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.61801, "t": 391.99771, "r": 418.77798, "b": 403.40298, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.853", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 391.99771, "r": 458.38336, "b": 403.40298, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "1.97", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 246.71000999999998, "t": 418.3614799999999, "r": 271.41064, "b": 429.65018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 405.01147, "r": 310.00732, "b": 429.65018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.952 0.923", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 405.01147, "r": 347.70734, "b": 416.30017, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.909", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 362.08801, "t": 404.9486999999999, "r": 386.24799, "b": 416.35397, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.938", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 396.20599, "t": 405.01147, "r": 417.19632, "b": 416.30017, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.843", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.767, "t": 405.01147, "r": 457.15039, "b": 416.30017, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "3.77", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 161.90601, "t": 423.84048, "r": 166.51474, "b": 435.12918, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 423.84048, "r": 214.11774, "b": 435.12918, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 431.31246999999996, "r": 272.94495, "b": 442.60117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 431.31246999999996, "r": 310.00732, "b": 442.60117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.945", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 418.3614799999999, "r": 347.70734, "b": 442.60117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.897 0.901", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 362.08801, "t": 418.3614799999999, "r": 386.24799, "b": 442.65497, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.915 0.931", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.61801, "t": 418.29871, "r": 418.77798, "b": 442.60117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.859 0.834", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 418.29871, "r": 458.38336, "b": 442.60117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "1.91 3.81", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 161.90601, "t": 450.14248999999995, "r": 166.51474, "b": 461.43118, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 450.14248999999995, "r": 214.11774, "b": 461.43118, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 444.66248, "r": 272.94495, "b": 468.90317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 444.66248, "r": 310.00732, "b": 468.90317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.952 0.944", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 444.66248, "r": 347.70734, "b": 468.90317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.92 0.903", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 362.08801, "t": 444.5996999999999, "r": 386.24799, "b": 468.90317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.942 0.931", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.61801, "t": 444.5996999999999, "r": 418.77798, "b": 468.90317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.857 0.824", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 444.5996999999999, "r": 458.38336, "b": 468.90317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "1.22 2", "column_header": false, "row_header": false, "row_section": false}]]}}], "key_value_items": [], "form_items": [], "pages": {"1": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 1}}}
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v2/2305.03393v1-pg9.pages.json b/tests/data/groundtruth/docling_v2/2305.03393v1-pg9.pages.json
index e4596cb8..b6fb5969 100644
--- a/tests/data/groundtruth/docling_v2/2305.03393v1-pg9.pages.json
+++ b/tests/data/groundtruth/docling_v2/2305.03393v1-pg9.pages.json
@@ -1 +1 @@
-[{"page_no": 0, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 91.49352999999996, "r": 447.54476999999997, "b": 102.78223000000003, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "9", "bbox": {"l": 475.98441, "t": 91.49352999999996, "r": 480.59314, "b": 102.78223000000003, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "order to compute the TED score. Inference timing results for all experiments", "bbox": {"l": 134.765, "t": 116.46301000000005, "r": 480.59067, "b": 128.99597000000006, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "were obtained from the same machine on a single core with AMD EPYC 7763", "bbox": {"l": 134.765, "t": 128.41803000000004, "r": 480.59665, "b": 140.95099000000005, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "CPU @2.45 GHz.", "bbox": {"l": 134.765, "t": 140.37401999999997, "r": 210.78761, "b": 152.90697999999998, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "5.1", "bbox": {"l": 134.765, "t": 166.70514000000003, "r": 149.40306, "b": 179.20818999999995, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Hyper Parameter Optimization", "bbox": {"l": 160.85905, "t": 166.70514000000003, "r": 318.45145, "b": 179.20818999999995, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "We have chosen the PubTabNet data set to perform HPO, since it includes a", "bbox": {"l": 134.765, "t": 183.11505, "r": 479.74982000000006, "b": 195.64801, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "highly diverse set of tables. Also we report TED scores separately for simple and", "bbox": {"l": 134.765, "t": 195.07007, "r": 480.58765, "b": 207.60303, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "complex tables (tables with cell spans). Results are presented in Table. 1. It is", "bbox": {"l": 134.765, "t": 207.02502000000004, "r": 480.58859000000007, "b": 219.55798000000004, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "evident that with OTSL, our model achieves the same TED score and slightly", "bbox": {"l": 134.765, "t": 218.98004000000003, "r": 480.59567, "b": 231.51300000000003, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "better mAP scores in comparison to HTML. However OTSL yields a", "bbox": {"l": 134.765, "t": 230.93506000000002, "r": 440.9425, "b": 243.46802000000002, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "2x speed", "bbox": {"l": 444.86800999999997, "t": 230.98486000000003, "r": 480.58792, "b": 243.46802000000002, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "up", "bbox": {"l": 134.765, "t": 242.94086000000004, "r": 145.19585, "b": 255.42400999999995, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "in the inference runtime over HTML.", "bbox": {"l": 149.149, "t": 242.89104999999995, "r": 311.22256, "b": 255.42400999999995, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Table", "bbox": {"l": 134.765, "t": 272.79474000000005, "r": 159.22983, "b": 284.1999799999999, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "1.", "bbox": {"l": 167.34442, "t": 272.79474000000005, "r": 174.71301, "b": 284.1999799999999, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "HPO performed in OTSL and HTML representation on the same", "bbox": {"l": 188.133, "t": 272.85748, "r": 480.58101999999997, "b": 284.14618, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "transformer-based TableFormer [9] architecture, trained only on PubTabNet [22]. Ef-", "bbox": {"l": 134.765, "t": 283.81647, "r": 480.59890999999993, "b": 295.10516000000007, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "fects of reducing the # of layers in encoder and decoder stages of the model show that", "bbox": {"l": 134.765, "t": 294.77547999999996, "r": 480.59887999999995, "b": 306.06418, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "smaller models trained on OTSL perform better, especially in recognizing complex", "bbox": {"l": 134.765, "t": 305.73447, "r": 480.59180000000003, "b": 317.02316, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "table structures, and maintain a much higher mAP score than the HTML counterpart.", "bbox": {"l": 134.765, "t": 316.69348, "r": 480.58471999999995, "b": 327.98218, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "#", "bbox": {"l": 160.37, "t": 339.45749, "r": 168.04523, "b": 350.74619, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "enc-layers", "bbox": {"l": 144.592, "t": 352.40848, "r": 183.82895, "b": 363.69717, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "#", "bbox": {"l": 207.974, "t": 339.45749, "r": 215.64923000000002, "b": 350.74619, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "dec-layers", "bbox": {"l": 192.19501, "t": 352.40848, "r": 231.42303, "b": 363.69717, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "Language", "bbox": {"l": 239.79799999999997, "t": 344.93649, "r": 278.3338, "b": 356.22519000000005, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "TEDs", "bbox": {"l": 324.67001, "t": 339.45749, "r": 348.26419, "b": 350.74619, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "mAP", "bbox": {"l": 396.271, "t": 339.45749, "r": 417.12595, "b": 350.74619, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "(0.75)", "bbox": {"l": 394.927, "t": 350.41647, "r": 418.46921, "b": 361.70517, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Inference", "bbox": {"l": 430.771, "t": 339.45749, "r": 467.14142000000004, "b": 350.74619, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "time (secs)", "bbox": {"l": 427.14801, "t": 350.41647, "r": 470.76955999999996, "b": 361.70517, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "simple", "bbox": {"l": 286.686, "t": 352.40848, "r": 312.32812, "b": 363.69717, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "complex", "bbox": {"l": 320.702, "t": 352.40848, "r": 353.71539, "b": 363.69717, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "all", "bbox": {"l": 369.306, "t": 352.40848, "r": 379.02914, "b": 363.69717, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "6", "bbox": {"l": 161.90601, "t": 371.23849, "r": 166.51474, "b": 382.52719, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "6", "bbox": {"l": 209.509, "t": 371.23849, "r": 214.11774, "b": 382.52719, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 365.75848, "r": 271.41064, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "0.965", "bbox": {"l": 289.017, "t": 365.75848, "r": 310.00732, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "0.934", "bbox": {"l": 326.71701, "t": 365.75848, "r": 347.70734, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "0.955", "bbox": {"l": 363.67599, "t": 365.75848, "r": 384.66632, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "0.88", "bbox": {"l": 397.26999, "t": 365.69571, "r": 416.12634, "b": 377.10098000000005, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "2.73", "bbox": {"l": 439.52701, "t": 365.69571, "r": 458.38336, "b": 377.10098000000005, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 378.71048, "r": 272.94495, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "0.969", "bbox": {"l": 289.017, "t": 378.71048, "r": 310.00732, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "0.927", "bbox": {"l": 326.71701, "t": 378.71048, "r": 347.70734, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "0.955", "bbox": {"l": 363.67599, "t": 378.71048, "r": 384.66632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "0.857", "bbox": {"l": 396.20599, "t": 378.71048, "r": 417.19632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "5.39", "bbox": {"l": 440.767, "t": 378.71048, "r": 457.15039, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "4", "bbox": {"l": 161.90601, "t": 397.53949, "r": 166.51474, "b": 408.82819, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "4", "bbox": {"l": 209.509, "t": 397.53949, "r": 214.11774, "b": 408.82819, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 392.06049, "r": 271.41064, "b": 403.34918, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "0.938", "bbox": {"l": 289.017, "t": 392.06049, "r": 310.00732, "b": 403.34918, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "0.904", "bbox": {"l": 326.71701, "t": 392.06049, "r": 347.70734, "b": 403.34918, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "0.927", "bbox": {"l": 363.67599, "t": 392.06049, "r": 384.66632, "b": 403.34918, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "0.853", "bbox": {"l": 394.61801, "t": 391.99771, "r": 418.77798, "b": 403.40298, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "1.97", "bbox": {"l": 439.52701, "t": 391.99771, "r": 458.38336, "b": 403.40298, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 405.01147, "r": 272.94495, "b": 416.30017, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "0.952", "bbox": {"l": 289.017, "t": 405.01147, "r": 310.00732, "b": 416.30017, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "0.909", "bbox": {"l": 326.71701, "t": 405.01147, "r": 347.70734, "b": 416.30017, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "0.938", "bbox": {"l": 362.08801, "t": 404.9486999999999, "r": 386.24799, "b": 416.35397, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "0.843", "bbox": {"l": 396.20599, "t": 405.01147, "r": 417.19632, "b": 416.30017, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "3.77", "bbox": {"l": 440.767, "t": 405.01147, "r": 457.15039, "b": 416.30017, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "2", "bbox": {"l": 161.90601, "t": 423.84048, "r": 166.51474, "b": 435.12918, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "4", "bbox": {"l": 209.509, "t": 423.84048, "r": 214.11774, "b": 435.12918, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 418.3614799999999, "r": 271.41064, "b": 429.65018, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "0.923", "bbox": {"l": 289.017, "t": 418.3614799999999, "r": 310.00732, "b": 429.65018, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "0.897", "bbox": {"l": 326.71701, "t": 418.3614799999999, "r": 347.70734, "b": 429.65018, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "0.915", "bbox": {"l": 363.67599, "t": 418.3614799999999, "r": 384.66632, "b": 429.65018, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "0.859", "bbox": {"l": 394.61801, "t": 418.29871, "r": 418.77798, "b": 429.70398, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "1.91", "bbox": {"l": 439.52701, "t": 418.29871, "r": 458.38336, "b": 429.70398, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 431.31246999999996, "r": 272.94495, "b": 442.60117, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "0.945", "bbox": {"l": 289.017, "t": 431.31246999999996, "r": 310.00732, "b": 442.60117, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "0.901", "bbox": {"l": 326.71701, "t": 431.31246999999996, "r": 347.70734, "b": 442.60117, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "0.931", "bbox": {"l": 362.08801, "t": 431.24969, "r": 386.24799, "b": 442.65497, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "0.834", "bbox": {"l": 396.20599, "t": 431.31246999999996, "r": 417.19632, "b": 442.60117, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "3.81", "bbox": {"l": 440.767, "t": 431.31246999999996, "r": 457.15039, "b": 442.60117, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "4", "bbox": {"l": 161.90601, "t": 450.14248999999995, "r": 166.51474, "b": 461.43118, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "2", "bbox": {"l": 209.509, "t": 450.14248999999995, "r": 214.11774, "b": 461.43118, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 444.66248, "r": 271.41064, "b": 455.95117, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "0.952", "bbox": {"l": 289.017, "t": 444.66248, "r": 310.00732, "b": 455.95117, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "0.92", "bbox": {"l": 329.021, "t": 444.66248, "r": 345.40439, "b": 455.95117, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "0.942", "bbox": {"l": 362.08801, "t": 444.5996999999999, "r": 386.24799, "b": 456.00497, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "0.857", "bbox": {"l": 394.61801, "t": 444.5996999999999, "r": 418.77798, "b": 456.00497, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "1.22", "bbox": {"l": 439.52701, "t": 444.5996999999999, "r": 458.38336, "b": 456.00497, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 457.61447, "r": 272.94495, "b": 468.90317, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "0.944", "bbox": {"l": 289.017, "t": 457.61447, "r": 310.00732, "b": 468.90317, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "0.903", "bbox": {"l": 326.71701, "t": 457.61447, "r": 347.70734, "b": 468.90317, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "0.931", "bbox": {"l": 363.67599, "t": 457.61447, "r": 384.66632, "b": 468.90317, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "0.824", "bbox": {"l": 396.20599, "t": 457.61447, "r": 417.19632, "b": 468.90317, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "2", "bbox": {"l": 446.65302, "t": 457.61447, "r": 451.26175, "b": 468.90317, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "5.2", "bbox": {"l": 134.765, "t": 505.67111, "r": 149.40306, "b": 518.17419, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Quantitative Results", "bbox": {"l": 160.85905, "t": 505.67111, "r": 264.40829, "b": 518.17419, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "We picked the model parameter configuration that produced the best prediction", "bbox": {"l": 134.765, "t": 522.08005, "r": 479.72983, "b": 534.61301, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "quality (enc=6, dec=6, heads=8) with PubTabNet alone, then independently", "bbox": {"l": 134.765, "t": 534.03604, "r": 480.5897499999999, "b": 546.569, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "trained and evaluated it on three publicly available data sets: PubTabNet (395k", "bbox": {"l": 134.765, "t": 545.99104, "r": 480.72003, "b": 558.524, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "samples), FinTabNet (113k samples) and PubTables-1M (about 1M samples).", "bbox": {"l": 134.765, "t": 557.94604, "r": 480.60577, "b": 570.479, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "Performance results are presented in Table. 2. It is clearly evident that the model", "bbox": {"l": 134.765, "t": 569.90103, "r": 480.5936899999999, "b": 582.43399, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "trained on OTSL outperforms HTML across the board, keeping high TEDs and", "bbox": {"l": 134.765, "t": 581.85603, "r": 480.59158, "b": 594.38899, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "mAP scores even on difficult financial tables (FinTabNet) that contain sparse", "bbox": {"l": 134.765, "t": 593.81204, "r": 480.58080999999993, "b": 606.345, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "and large tables.", "bbox": {"l": 134.765, "t": 605.76704, "r": 206.79959, "b": 618.3, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "Additionally, the results show that OTSL has an advantage over HTML", "bbox": {"l": 149.709, "t": 617.72205, "r": 480.59479, "b": 630.255, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "when applied on a bigger data set like PubTables-1M and achieves significantly", "bbox": {"l": 134.765, "t": 629.6770300000001, "r": 480.59857000000005, "b": 642.2099900000001, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "improved scores. Finally, OTSL achieves faster inference due to fewer decoding", "bbox": {"l": 134.765, "t": 641.63203, "r": 480.59384000000006, "b": 654.16499, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "steps which is a result of the reduced sequence representation.", "bbox": {"l": 134.765, "t": 653.58704, "r": 405.7995, "b": 666.12, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 8, "label": "page_header", "bbox": {"l": 194.478, "t": 91.49352999999996, "r": 447.54476999999997, "b": 102.78223000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9373533129692078, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 91.49352999999996, "r": 447.54476999999997, "b": 102.78223000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "page_header", "bbox": {"l": 475.98441, "t": 91.49352999999996, "r": 480.59314, "b": 102.78223000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.8858679533004761, "cells": [{"id": 1, "text": "9", "bbox": {"l": 475.98441, "t": 91.49352999999996, "r": 480.59314, "b": 102.78223000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "text", "bbox": {"l": 134.765, "t": 116.46301000000005, "r": 480.59665, "b": 152.90697999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.9806435108184814, "cells": [{"id": 2, "text": "order to compute the TED score. Inference timing results for all experiments", "bbox": {"l": 134.765, "t": 116.46301000000005, "r": 480.59067, "b": 128.99597000000006, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "were obtained from the same machine on a single core with AMD EPYC 7763", "bbox": {"l": 134.765, "t": 128.41803000000004, "r": 480.59665, "b": 140.95099000000005, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "CPU @2.45 GHz.", "bbox": {"l": 134.765, "t": 140.37401999999997, "r": 210.78761, "b": 152.90697999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "section_header", "bbox": {"l": 134.765, "t": 166.70514000000003, "r": 318.45145, "b": 179.20818999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9577404260635376, "cells": [{"id": 5, "text": "5.1", "bbox": {"l": 134.765, "t": 166.70514000000003, "r": 149.40306, "b": 179.20818999999995, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Hyper Parameter Optimization", "bbox": {"l": 160.85905, "t": 166.70514000000003, "r": 318.45145, "b": 179.20818999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 134.765, "t": 183.11505, "r": 480.59567, "b": 255.42400999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9850425124168396, "cells": [{"id": 7, "text": "We have chosen the PubTabNet data set to perform HPO, since it includes a", "bbox": {"l": 134.765, "t": 183.11505, "r": 479.74982000000006, "b": 195.64801, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "highly diverse set of tables. Also we report TED scores separately for simple and", "bbox": {"l": 134.765, "t": 195.07007, "r": 480.58765, "b": 207.60303, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "complex tables (tables with cell spans). Results are presented in Table. 1. It is", "bbox": {"l": 134.765, "t": 207.02502000000004, "r": 480.58859000000007, "b": 219.55798000000004, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "evident that with OTSL, our model achieves the same TED score and slightly", "bbox": {"l": 134.765, "t": 218.98004000000003, "r": 480.59567, "b": 231.51300000000003, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "better mAP scores in comparison to HTML. However OTSL yields a", "bbox": {"l": 134.765, "t": 230.93506000000002, "r": 440.9425, "b": 243.46802000000002, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "2x speed", "bbox": {"l": 444.86800999999997, "t": 230.98486000000003, "r": 480.58792, "b": 243.46802000000002, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "up", "bbox": {"l": 134.765, "t": 242.94086000000004, "r": 145.19585, "b": 255.42400999999995, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "in the inference runtime over HTML.", "bbox": {"l": 149.149, "t": 242.89104999999995, "r": 311.22256, "b": 255.42400999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "caption", "bbox": {"l": 134.765, "t": 272.79474000000005, "r": 480.59890999999993, "b": 327.98218, "coord_origin": "TOPLEFT"}, "confidence": 0.9591907262802124, "cells": [{"id": 15, "text": "Table", "bbox": {"l": 134.765, "t": 272.79474000000005, "r": 159.22983, "b": 284.1999799999999, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "1.", "bbox": {"l": 167.34442, "t": 272.79474000000005, "r": 174.71301, "b": 284.1999799999999, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "HPO performed in OTSL and HTML representation on the same", "bbox": {"l": 188.133, "t": 272.85748, "r": 480.58101999999997, "b": 284.14618, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "transformer-based TableFormer [9] architecture, trained only on PubTabNet [22]. Ef-", "bbox": {"l": 134.765, "t": 283.81647, "r": 480.59890999999993, "b": 295.10516000000007, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "fects of reducing the # of layers in encoder and decoder stages of the model show that", "bbox": {"l": 134.765, "t": 294.77547999999996, "r": 480.59887999999995, "b": 306.06418, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "smaller models trained on OTSL perform better, especially in recognizing complex", "bbox": {"l": 134.765, "t": 305.73447, "r": 480.59180000000003, "b": 317.02316, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "table structures, and maintain a much higher mAP score than the HTML counterpart.", "bbox": {"l": 134.765, "t": 316.69348, "r": 480.58471999999995, "b": 327.98218, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "table", "bbox": {"l": 139.6674041748047, "t": 337.5453796386719, "r": 475.00927734375, "b": 469.4945373535156, "coord_origin": "TOPLEFT"}, "confidence": 0.9901031255722046, "cells": [{"id": 22, "text": "#", "bbox": {"l": 160.37, "t": 339.45749, "r": 168.04523, "b": 350.74619, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "enc-layers", "bbox": {"l": 144.592, "t": 352.40848, "r": 183.82895, "b": 363.69717, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "#", "bbox": {"l": 207.974, "t": 339.45749, "r": 215.64923000000002, "b": 350.74619, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "dec-layers", "bbox": {"l": 192.19501, "t": 352.40848, "r": 231.42303, "b": 363.69717, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "Language", "bbox": {"l": 239.79799999999997, "t": 344.93649, "r": 278.3338, "b": 356.22519000000005, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "TEDs", "bbox": {"l": 324.67001, "t": 339.45749, "r": 348.26419, "b": 350.74619, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "mAP", "bbox": {"l": 396.271, "t": 339.45749, "r": 417.12595, "b": 350.74619, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "(0.75)", "bbox": {"l": 394.927, "t": 350.41647, "r": 418.46921, "b": 361.70517, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Inference", "bbox": {"l": 430.771, "t": 339.45749, "r": 467.14142000000004, "b": 350.74619, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "time (secs)", "bbox": {"l": 427.14801, "t": 350.41647, "r": 470.76955999999996, "b": 361.70517, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "simple", "bbox": {"l": 286.686, "t": 352.40848, "r": 312.32812, "b": 363.69717, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "complex", "bbox": {"l": 320.702, "t": 352.40848, "r": 353.71539, "b": 363.69717, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "all", "bbox": {"l": 369.306, "t": 352.40848, "r": 379.02914, "b": 363.69717, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "6", "bbox": {"l": 161.90601, "t": 371.23849, "r": 166.51474, "b": 382.52719, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "6", "bbox": {"l": 209.509, "t": 371.23849, "r": 214.11774, "b": 382.52719, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 365.75848, "r": 271.41064, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "0.965", "bbox": {"l": 289.017, "t": 365.75848, "r": 310.00732, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "0.934", "bbox": {"l": 326.71701, "t": 365.75848, "r": 347.70734, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "0.955", "bbox": {"l": 363.67599, "t": 365.75848, "r": 384.66632, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "0.88", "bbox": {"l": 397.26999, "t": 365.69571, "r": 416.12634, "b": 377.10098000000005, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "2.73", "bbox": {"l": 439.52701, "t": 365.69571, "r": 458.38336, "b": 377.10098000000005, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 378.71048, "r": 272.94495, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "0.969", "bbox": {"l": 289.017, "t": 378.71048, "r": 310.00732, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "0.927", "bbox": {"l": 326.71701, "t": 378.71048, "r": 347.70734, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "0.955", "bbox": {"l": 363.67599, "t": 378.71048, "r": 384.66632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "0.857", "bbox": {"l": 396.20599, "t": 378.71048, "r": 417.19632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "5.39", "bbox": {"l": 440.767, "t": 378.71048, "r": 457.15039, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "4", "bbox": {"l": 161.90601, "t": 397.53949, "r": 166.51474, "b": 408.82819, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "4", "bbox": {"l": 209.509, "t": 397.53949, "r": 214.11774, "b": 408.82819, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 392.06049, "r": 271.41064, "b": 403.34918, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "0.938", "bbox": {"l": 289.017, "t": 392.06049, "r": 310.00732, "b": 403.34918, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "0.904", "bbox": {"l": 326.71701, "t": 392.06049, "r": 347.70734, "b": 403.34918, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "0.927", "bbox": {"l": 363.67599, "t": 392.06049, "r": 384.66632, "b": 403.34918, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "0.853", "bbox": {"l": 394.61801, "t": 391.99771, "r": 418.77798, "b": 403.40298, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "1.97", "bbox": {"l": 439.52701, "t": 391.99771, "r": 458.38336, "b": 403.40298, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 405.01147, "r": 272.94495, "b": 416.30017, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "0.952", "bbox": {"l": 289.017, "t": 405.01147, "r": 310.00732, "b": 416.30017, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "0.909", "bbox": {"l": 326.71701, "t": 405.01147, "r": 347.70734, "b": 416.30017, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "0.938", "bbox": {"l": 362.08801, "t": 404.9486999999999, "r": 386.24799, "b": 416.35397, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "0.843", "bbox": {"l": 396.20599, "t": 405.01147, "r": 417.19632, "b": 416.30017, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "3.77", "bbox": {"l": 440.767, "t": 405.01147, "r": 457.15039, "b": 416.30017, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "2", "bbox": {"l": 161.90601, "t": 423.84048, "r": 166.51474, "b": 435.12918, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "4", "bbox": {"l": 209.509, "t": 423.84048, "r": 214.11774, "b": 435.12918, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 418.3614799999999, "r": 271.41064, "b": 429.65018, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "0.923", "bbox": {"l": 289.017, "t": 418.3614799999999, "r": 310.00732, "b": 429.65018, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "0.897", "bbox": {"l": 326.71701, "t": 418.3614799999999, "r": 347.70734, "b": 429.65018, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "0.915", "bbox": {"l": 363.67599, "t": 418.3614799999999, "r": 384.66632, "b": 429.65018, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "0.859", "bbox": {"l": 394.61801, "t": 418.29871, "r": 418.77798, "b": 429.70398, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "1.91", "bbox": {"l": 439.52701, "t": 418.29871, "r": 458.38336, "b": 429.70398, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 431.31246999999996, "r": 272.94495, "b": 442.60117, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "0.945", "bbox": {"l": 289.017, "t": 431.31246999999996, "r": 310.00732, "b": 442.60117, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "0.901", "bbox": {"l": 326.71701, "t": 431.31246999999996, "r": 347.70734, "b": 442.60117, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "0.931", "bbox": {"l": 362.08801, "t": 431.24969, "r": 386.24799, "b": 442.65497, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "0.834", "bbox": {"l": 396.20599, "t": 431.31246999999996, "r": 417.19632, "b": 442.60117, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "3.81", "bbox": {"l": 440.767, "t": 431.31246999999996, "r": 457.15039, "b": 442.60117, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "4", "bbox": {"l": 161.90601, "t": 450.14248999999995, "r": 166.51474, "b": 461.43118, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "2", "bbox": {"l": 209.509, "t": 450.14248999999995, "r": 214.11774, "b": 461.43118, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 444.66248, "r": 271.41064, "b": 455.95117, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "0.952", "bbox": {"l": 289.017, "t": 444.66248, "r": 310.00732, "b": 455.95117, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "0.92", "bbox": {"l": 329.021, "t": 444.66248, "r": 345.40439, "b": 455.95117, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "0.942", "bbox": {"l": 362.08801, "t": 444.5996999999999, "r": 386.24799, "b": 456.00497, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "0.857", "bbox": {"l": 394.61801, "t": 444.5996999999999, "r": 418.77798, "b": 456.00497, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "1.22", "bbox": {"l": 439.52701, "t": 444.5996999999999, "r": 458.38336, "b": 456.00497, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 457.61447, "r": 272.94495, "b": 468.90317, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "0.944", "bbox": {"l": 289.017, "t": 457.61447, "r": 310.00732, "b": 468.90317, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "0.903", "bbox": {"l": 326.71701, "t": 457.61447, "r": 347.70734, "b": 468.90317, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "0.931", "bbox": {"l": 363.67599, "t": 457.61447, "r": 384.66632, "b": 468.90317, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "0.824", "bbox": {"l": 396.20599, "t": 457.61447, "r": 417.19632, "b": 468.90317, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "2", "bbox": {"l": 446.65302, "t": 457.61447, "r": 451.26175, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": [{"id": 10, "label": "text", "bbox": {"l": 160.37, "t": 339.45749, "r": 168.04523, "b": 350.74619, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "#", "bbox": {"l": 160.37, "t": 339.45749, "r": 168.04523, "b": 350.74619, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 144.592, "t": 352.40848, "r": 183.82895, "b": 363.69717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "enc-layers", "bbox": {"l": 144.592, "t": 352.40848, "r": 183.82895, "b": 363.69717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 207.974, "t": 339.45749, "r": 215.64923000000002, "b": 350.74619, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "#", "bbox": {"l": 207.974, "t": 339.45749, "r": 215.64923000000002, "b": 350.74619, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 192.19501, "t": 352.40848, "r": 231.42303, "b": 363.69717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "dec-layers", "bbox": {"l": 192.19501, "t": 352.40848, "r": 231.42303, "b": 363.69717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 239.79799999999997, "t": 344.93649, "r": 278.3338, "b": 356.22519000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "Language", "bbox": {"l": 239.79799999999997, "t": 344.93649, "r": 278.3338, "b": 356.22519000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 324.67001, "t": 339.45749, "r": 348.26419, "b": 350.74619, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "TEDs", "bbox": {"l": 324.67001, "t": 339.45749, "r": 348.26419, "b": 350.74619, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 396.271, "t": 339.45749, "r": 417.12595, "b": 350.74619, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "mAP", "bbox": {"l": 396.271, "t": 339.45749, "r": 417.12595, "b": 350.74619, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 394.927, "t": 350.41647, "r": 418.46921, "b": 361.70517, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "(0.75)", "bbox": {"l": 394.927, "t": 350.41647, "r": 418.46921, "b": 361.70517, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 430.771, "t": 339.45749, "r": 467.14142000000004, "b": 350.74619, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "Inference", "bbox": {"l": 430.771, "t": 339.45749, "r": 467.14142000000004, "b": 350.74619, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 427.14801, "t": 350.41647, "r": 470.76955999999996, "b": 361.70517, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "time (secs)", "bbox": {"l": 427.14801, "t": 350.41647, "r": 470.76955999999996, "b": 361.70517, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 286.686, "t": 352.40848, "r": 312.32812, "b": 363.69717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "simple", "bbox": {"l": 286.686, "t": 352.40848, "r": 312.32812, "b": 363.69717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 320.702, "t": 352.40848, "r": 353.71539, "b": 363.69717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "complex", "bbox": {"l": 320.702, "t": 352.40848, "r": 353.71539, "b": 363.69717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 369.306, "t": 352.40848, "r": 379.02914, "b": 363.69717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "all", "bbox": {"l": 369.306, "t": 352.40848, "r": 379.02914, "b": 363.69717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 161.90601, "t": 371.23849, "r": 166.51474, "b": 382.52719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "6", "bbox": {"l": 161.90601, "t": 371.23849, "r": 166.51474, "b": 382.52719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 209.509, "t": 371.23849, "r": 214.11774, "b": 382.52719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "6", "bbox": {"l": 209.509, "t": 371.23849, "r": 214.11774, "b": 382.52719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 246.71000999999998, "t": 365.75848, "r": 271.41064, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 365.75848, "r": 271.41064, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 289.017, "t": 365.75848, "r": 310.00732, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "0.965", "bbox": {"l": 289.017, "t": 365.75848, "r": 310.00732, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 326.71701, "t": 365.75848, "r": 347.70734, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "0.934", "bbox": {"l": 326.71701, "t": 365.75848, "r": 347.70734, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 363.67599, "t": 365.75848, "r": 384.66632, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "0.955", "bbox": {"l": 363.67599, "t": 365.75848, "r": 384.66632, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 397.26999, "t": 365.69571, "r": 416.12634, "b": 377.10098000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "0.88", "bbox": {"l": 397.26999, "t": 365.69571, "r": 416.12634, "b": 377.10098000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 439.52701, "t": 365.69571, "r": 458.38336, "b": 377.10098000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "2.73", "bbox": {"l": 439.52701, "t": 365.69571, "r": 458.38336, "b": 377.10098000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 245.17598999999998, "t": 378.71048, "r": 272.94495, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 378.71048, "r": 272.94495, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 289.017, "t": 378.71048, "r": 310.00732, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "0.969", "bbox": {"l": 289.017, "t": 378.71048, "r": 310.00732, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 326.71701, "t": 378.71048, "r": 347.70734, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "0.927", "bbox": {"l": 326.71701, "t": 378.71048, "r": 347.70734, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 363.67599, "t": 378.71048, "r": 384.66632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "0.955", "bbox": {"l": 363.67599, "t": 378.71048, "r": 384.66632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 396.20599, "t": 378.71048, "r": 417.19632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "0.857", "bbox": {"l": 396.20599, "t": 378.71048, "r": 417.19632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 440.767, "t": 378.71048, "r": 457.15039, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "5.39", "bbox": {"l": 440.767, "t": 378.71048, "r": 457.15039, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 161.90601, "t": 397.53949, "r": 166.51474, "b": 408.82819, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "4", "bbox": {"l": 161.90601, "t": 397.53949, "r": 166.51474, "b": 408.82819, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 209.509, "t": 397.53949, "r": 214.11774, "b": 408.82819, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "4", "bbox": {"l": 209.509, "t": 397.53949, "r": 214.11774, "b": 408.82819, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 246.71000999999998, "t": 392.06049, "r": 271.41064, "b": 403.34918, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 392.06049, "r": 271.41064, "b": 403.34918, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 289.017, "t": 392.06049, "r": 310.00732, "b": 403.34918, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "0.938", "bbox": {"l": 289.017, "t": 392.06049, "r": 310.00732, "b": 403.34918, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 326.71701, "t": 392.06049, "r": 347.70734, "b": 403.34918, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "0.904", "bbox": {"l": 326.71701, "t": 392.06049, "r": 347.70734, "b": 403.34918, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 363.67599, "t": 392.06049, "r": 384.66632, "b": 403.34918, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "0.927", "bbox": {"l": 363.67599, "t": 392.06049, "r": 384.66632, "b": 403.34918, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 394.61801, "t": 391.99771, "r": 418.77798, "b": 403.40298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "0.853", "bbox": {"l": 394.61801, "t": 391.99771, "r": 418.77798, "b": 403.40298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 439.52701, "t": 391.99771, "r": 458.38336, "b": 403.40298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "1.97", "bbox": {"l": 439.52701, "t": 391.99771, "r": 458.38336, "b": 403.40298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 245.17598999999998, "t": 405.01147, "r": 272.94495, "b": 416.30017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 405.01147, "r": 272.94495, "b": 416.30017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 289.017, "t": 405.01147, "r": 310.00732, "b": 416.30017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "0.952", "bbox": {"l": 289.017, "t": 405.01147, "r": 310.00732, "b": 416.30017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 326.71701, "t": 405.01147, "r": 347.70734, "b": 416.30017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "0.909", "bbox": {"l": 326.71701, "t": 405.01147, "r": 347.70734, "b": 416.30017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 362.08801, "t": 404.9486999999999, "r": 386.24799, "b": 416.35397, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "0.938", "bbox": {"l": 362.08801, "t": 404.9486999999999, "r": 386.24799, "b": 416.35397, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 396.20599, "t": 405.01147, "r": 417.19632, "b": 416.30017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "0.843", "bbox": {"l": 396.20599, "t": 405.01147, "r": 417.19632, "b": 416.30017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 440.767, "t": 405.01147, "r": 457.15039, "b": 416.30017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "3.77", "bbox": {"l": 440.767, "t": 405.01147, "r": 457.15039, "b": 416.30017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 161.90601, "t": 423.84048, "r": 166.51474, "b": 435.12918, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "2", "bbox": {"l": 161.90601, "t": 423.84048, "r": 166.51474, "b": 435.12918, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 209.509, "t": 423.84048, "r": 214.11774, "b": 435.12918, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "4", "bbox": {"l": 209.509, "t": 423.84048, "r": 214.11774, "b": 435.12918, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 246.71000999999998, "t": 418.3614799999999, "r": 271.41064, "b": 429.65018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 418.3614799999999, "r": 271.41064, "b": 429.65018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 289.017, "t": 418.3614799999999, "r": 310.00732, "b": 429.65018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "0.923", "bbox": {"l": 289.017, "t": 418.3614799999999, "r": 310.00732, "b": 429.65018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 326.71701, "t": 418.3614799999999, "r": 347.70734, "b": 429.65018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "0.897", "bbox": {"l": 326.71701, "t": 418.3614799999999, "r": 347.70734, "b": 429.65018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 363.67599, "t": 418.3614799999999, "r": 384.66632, "b": 429.65018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "0.915", "bbox": {"l": 363.67599, "t": 418.3614799999999, "r": 384.66632, "b": 429.65018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 394.61801, "t": 418.29871, "r": 418.77798, "b": 429.70398, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "0.859", "bbox": {"l": 394.61801, "t": 418.29871, "r": 418.77798, "b": 429.70398, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 439.52701, "t": 418.29871, "r": 458.38336, "b": 429.70398, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "1.91", "bbox": {"l": 439.52701, "t": 418.29871, "r": 458.38336, "b": 429.70398, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 245.17598999999998, "t": 431.31246999999996, "r": 272.94495, "b": 442.60117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 431.31246999999996, "r": 272.94495, "b": 442.60117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 289.017, "t": 431.31246999999996, "r": 310.00732, "b": 442.60117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "0.945", "bbox": {"l": 289.017, "t": 431.31246999999996, "r": 310.00732, "b": 442.60117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 326.71701, "t": 431.31246999999996, "r": 347.70734, "b": 442.60117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "0.901", "bbox": {"l": 326.71701, "t": 431.31246999999996, "r": 347.70734, "b": 442.60117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 362.08801, "t": 431.24969, "r": 386.24799, "b": 442.65497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "0.931", "bbox": {"l": 362.08801, "t": 431.24969, "r": 386.24799, "b": 442.65497, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 396.20599, "t": 431.31246999999996, "r": 417.19632, "b": 442.60117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "0.834", "bbox": {"l": 396.20599, "t": 431.31246999999996, "r": 417.19632, "b": 442.60117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 440.767, "t": 431.31246999999996, "r": 457.15039, "b": 442.60117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "3.81", "bbox": {"l": 440.767, "t": 431.31246999999996, "r": 457.15039, "b": 442.60117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 161.90601, "t": 450.14248999999995, "r": 166.51474, "b": 461.43118, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "4", "bbox": {"l": 161.90601, "t": 450.14248999999995, "r": 166.51474, "b": 461.43118, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 209.509, "t": 450.14248999999995, "r": 214.11774, "b": 461.43118, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "2", "bbox": {"l": 209.509, "t": 450.14248999999995, "r": 214.11774, "b": 461.43118, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 246.71000999999998, "t": 444.66248, "r": 271.41064, "b": 455.95117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 444.66248, "r": 271.41064, "b": 455.95117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 289.017, "t": 444.66248, "r": 310.00732, "b": 455.95117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "0.952", "bbox": {"l": 289.017, "t": 444.66248, "r": 310.00732, "b": 455.95117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 329.021, "t": 444.66248, "r": 345.40439, "b": 455.95117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "0.92", "bbox": {"l": 329.021, "t": 444.66248, "r": 345.40439, "b": 455.95117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 362.08801, "t": 444.5996999999999, "r": 386.24799, "b": 456.00497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "0.942", "bbox": {"l": 362.08801, "t": 444.5996999999999, "r": 386.24799, "b": 456.00497, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 394.61801, "t": 444.5996999999999, "r": 418.77798, "b": 456.00497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "0.857", "bbox": {"l": 394.61801, "t": 444.5996999999999, "r": 418.77798, "b": 456.00497, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 439.52701, "t": 444.5996999999999, "r": 458.38336, "b": 456.00497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "1.22", "bbox": {"l": 439.52701, "t": 444.5996999999999, "r": 458.38336, "b": 456.00497, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 245.17598999999998, "t": 457.61447, "r": 272.94495, "b": 468.90317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 457.61447, "r": 272.94495, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 289.017, "t": 457.61447, "r": 310.00732, "b": 468.90317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "0.944", "bbox": {"l": 289.017, "t": 457.61447, "r": 310.00732, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 326.71701, "t": 457.61447, "r": 347.70734, "b": 468.90317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "0.903", "bbox": {"l": 326.71701, "t": 457.61447, "r": 347.70734, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 363.67599, "t": 457.61447, "r": 384.66632, "b": 468.90317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "0.931", "bbox": {"l": 363.67599, "t": 457.61447, "r": 384.66632, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 396.20599, "t": 457.61447, "r": 417.19632, "b": 468.90317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "0.824", "bbox": {"l": 396.20599, "t": 457.61447, "r": 417.19632, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 446.65302, "t": 457.61447, "r": 451.26175, "b": 468.90317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "2", "bbox": {"l": 446.65302, "t": 457.61447, "r": 451.26175, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 6, "label": "section_header", "bbox": {"l": 134.765, "t": 505.67111, "r": 264.40829, "b": 518.17419, "coord_origin": "TOPLEFT"}, "confidence": 0.9589295387268066, "cells": [{"id": 91, "text": "5.2", "bbox": {"l": 134.765, "t": 505.67111, "r": 149.40306, "b": 518.17419, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Quantitative Results", "bbox": {"l": 160.85905, "t": 505.67111, "r": 264.40829, "b": 518.17419, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 134.765, "t": 522.08005, "r": 480.72003, "b": 618.3, "coord_origin": "TOPLEFT"}, "confidence": 0.9849976301193237, "cells": [{"id": 93, "text": "We picked the model parameter configuration that produced the best prediction", "bbox": {"l": 134.765, "t": 522.08005, "r": 479.72983, "b": 534.61301, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "quality (enc=6, dec=6, heads=8) with PubTabNet alone, then independently", "bbox": {"l": 134.765, "t": 534.03604, "r": 480.5897499999999, "b": 546.569, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "trained and evaluated it on three publicly available data sets: PubTabNet (395k", "bbox": {"l": 134.765, "t": 545.99104, "r": 480.72003, "b": 558.524, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "samples), FinTabNet (113k samples) and PubTables-1M (about 1M samples).", "bbox": {"l": 134.765, "t": 557.94604, "r": 480.60577, "b": 570.479, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "Performance results are presented in Table. 2. It is clearly evident that the model", "bbox": {"l": 134.765, "t": 569.90103, "r": 480.5936899999999, "b": 582.43399, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "trained on OTSL outperforms HTML across the board, keeping high TEDs and", "bbox": {"l": 134.765, "t": 581.85603, "r": 480.59158, "b": 594.38899, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "mAP scores even on difficult financial tables (FinTabNet) that contain sparse", "bbox": {"l": 134.765, "t": 593.81204, "r": 480.58080999999993, "b": 606.345, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "and large tables.", "bbox": {"l": 134.765, "t": 605.76704, "r": 206.79959, "b": 618.3, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 134.765, "t": 617.72205, "r": 480.59857000000005, "b": 666.12, "coord_origin": "TOPLEFT"}, "confidence": 0.9850137829780579, "cells": [{"id": 101, "text": "Additionally, the results show that OTSL has an advantage over HTML", "bbox": {"l": 149.709, "t": 617.72205, "r": 480.59479, "b": 630.255, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "when applied on a bigger data set like PubTables-1M and achieves significantly", "bbox": {"l": 134.765, "t": 629.6770300000001, "r": 480.59857000000005, "b": 642.2099900000001, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "improved scores. Finally, OTSL achieves faster inference due to fewer decoding", "bbox": {"l": 134.765, "t": 641.63203, "r": 480.59384000000006, "b": 654.16499, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "steps which is a result of the reduced sequence representation.", "bbox": {"l": 134.765, "t": 653.58704, "r": 405.7995, "b": 666.12, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {"0": {"label": "table", "id": 0, "page_no": 0, "cluster": {"id": 0, "label": "table", "bbox": {"l": 139.6674041748047, "t": 337.5453796386719, "r": 475.00927734375, "b": 469.4945373535156, "coord_origin": "TOPLEFT"}, "confidence": 0.9901031255722046, "cells": [{"id": 22, "text": "#", "bbox": {"l": 160.37, "t": 339.45749, "r": 168.04523, "b": 350.74619, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "enc-layers", "bbox": {"l": 144.592, "t": 352.40848, "r": 183.82895, "b": 363.69717, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "#", "bbox": {"l": 207.974, "t": 339.45749, "r": 215.64923000000002, "b": 350.74619, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "dec-layers", "bbox": {"l": 192.19501, "t": 352.40848, "r": 231.42303, "b": 363.69717, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "Language", "bbox": {"l": 239.79799999999997, "t": 344.93649, "r": 278.3338, "b": 356.22519000000005, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "TEDs", "bbox": {"l": 324.67001, "t": 339.45749, "r": 348.26419, "b": 350.74619, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "mAP", "bbox": {"l": 396.271, "t": 339.45749, "r": 417.12595, "b": 350.74619, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "(0.75)", "bbox": {"l": 394.927, "t": 350.41647, "r": 418.46921, "b": 361.70517, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Inference", "bbox": {"l": 430.771, "t": 339.45749, "r": 467.14142000000004, "b": 350.74619, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "time (secs)", "bbox": {"l": 427.14801, "t": 350.41647, "r": 470.76955999999996, "b": 361.70517, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "simple", "bbox": {"l": 286.686, "t": 352.40848, "r": 312.32812, "b": 363.69717, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "complex", "bbox": {"l": 320.702, "t": 352.40848, "r": 353.71539, "b": 363.69717, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "all", "bbox": {"l": 369.306, "t": 352.40848, "r": 379.02914, "b": 363.69717, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "6", "bbox": {"l": 161.90601, "t": 371.23849, "r": 166.51474, "b": 382.52719, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "6", "bbox": {"l": 209.509, "t": 371.23849, "r": 214.11774, "b": 382.52719, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 365.75848, "r": 271.41064, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "0.965", "bbox": {"l": 289.017, "t": 365.75848, "r": 310.00732, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "0.934", "bbox": {"l": 326.71701, "t": 365.75848, "r": 347.70734, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "0.955", "bbox": {"l": 363.67599, "t": 365.75848, "r": 384.66632, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "0.88", "bbox": {"l": 397.26999, "t": 365.69571, "r": 416.12634, "b": 377.10098000000005, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "2.73", "bbox": {"l": 439.52701, "t": 365.69571, "r": 458.38336, "b": 377.10098000000005, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 378.71048, "r": 272.94495, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "0.969", "bbox": {"l": 289.017, "t": 378.71048, "r": 310.00732, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "0.927", "bbox": {"l": 326.71701, "t": 378.71048, "r": 347.70734, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "0.955", "bbox": {"l": 363.67599, "t": 378.71048, "r": 384.66632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "0.857", "bbox": {"l": 396.20599, "t": 378.71048, "r": 417.19632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "5.39", "bbox": {"l": 440.767, "t": 378.71048, "r": 457.15039, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "4", "bbox": {"l": 161.90601, "t": 397.53949, "r": 166.51474, "b": 408.82819, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "4", "bbox": {"l": 209.509, "t": 397.53949, "r": 214.11774, "b": 408.82819, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 392.06049, "r": 271.41064, "b": 403.34918, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "0.938", "bbox": {"l": 289.017, "t": 392.06049, "r": 310.00732, "b": 403.34918, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "0.904", "bbox": {"l": 326.71701, "t": 392.06049, "r": 347.70734, "b": 403.34918, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "0.927", "bbox": {"l": 363.67599, "t": 392.06049, "r": 384.66632, "b": 403.34918, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "0.853", "bbox": {"l": 394.61801, "t": 391.99771, "r": 418.77798, "b": 403.40298, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "1.97", "bbox": {"l": 439.52701, "t": 391.99771, "r": 458.38336, "b": 403.40298, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 405.01147, "r": 272.94495, "b": 416.30017, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "0.952", "bbox": {"l": 289.017, "t": 405.01147, "r": 310.00732, "b": 416.30017, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "0.909", "bbox": {"l": 326.71701, "t": 405.01147, "r": 347.70734, "b": 416.30017, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "0.938", "bbox": {"l": 362.08801, "t": 404.9486999999999, "r": 386.24799, "b": 416.35397, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "0.843", "bbox": {"l": 396.20599, "t": 405.01147, "r": 417.19632, "b": 416.30017, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "3.77", "bbox": {"l": 440.767, "t": 405.01147, "r": 457.15039, "b": 416.30017, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "2", "bbox": {"l": 161.90601, "t": 423.84048, "r": 166.51474, "b": 435.12918, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "4", "bbox": {"l": 209.509, "t": 423.84048, "r": 214.11774, "b": 435.12918, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 418.3614799999999, "r": 271.41064, "b": 429.65018, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "0.923", "bbox": {"l": 289.017, "t": 418.3614799999999, "r": 310.00732, "b": 429.65018, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "0.897", "bbox": {"l": 326.71701, "t": 418.3614799999999, "r": 347.70734, "b": 429.65018, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "0.915", "bbox": {"l": 363.67599, "t": 418.3614799999999, "r": 384.66632, "b": 429.65018, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "0.859", "bbox": {"l": 394.61801, "t": 418.29871, "r": 418.77798, "b": 429.70398, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "1.91", "bbox": {"l": 439.52701, "t": 418.29871, "r": 458.38336, "b": 429.70398, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 431.31246999999996, "r": 272.94495, "b": 442.60117, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "0.945", "bbox": {"l": 289.017, "t": 431.31246999999996, "r": 310.00732, "b": 442.60117, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "0.901", "bbox": {"l": 326.71701, "t": 431.31246999999996, "r": 347.70734, "b": 442.60117, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "0.931", "bbox": {"l": 362.08801, "t": 431.24969, "r": 386.24799, "b": 442.65497, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "0.834", "bbox": {"l": 396.20599, "t": 431.31246999999996, "r": 417.19632, "b": 442.60117, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "3.81", "bbox": {"l": 440.767, "t": 431.31246999999996, "r": 457.15039, "b": 442.60117, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "4", "bbox": {"l": 161.90601, "t": 450.14248999999995, "r": 166.51474, "b": 461.43118, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "2", "bbox": {"l": 209.509, "t": 450.14248999999995, "r": 214.11774, "b": 461.43118, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 444.66248, "r": 271.41064, "b": 455.95117, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "0.952", "bbox": {"l": 289.017, "t": 444.66248, "r": 310.00732, "b": 455.95117, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "0.92", "bbox": {"l": 329.021, "t": 444.66248, "r": 345.40439, "b": 455.95117, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "0.942", "bbox": {"l": 362.08801, "t": 444.5996999999999, "r": 386.24799, "b": 456.00497, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "0.857", "bbox": {"l": 394.61801, "t": 444.5996999999999, "r": 418.77798, "b": 456.00497, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "1.22", "bbox": {"l": 439.52701, "t": 444.5996999999999, "r": 458.38336, "b": 456.00497, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 457.61447, "r": 272.94495, "b": 468.90317, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "0.944", "bbox": {"l": 289.017, "t": 457.61447, "r": 310.00732, "b": 468.90317, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "0.903", "bbox": {"l": 326.71701, "t": 457.61447, "r": 347.70734, "b": 468.90317, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "0.931", "bbox": {"l": 363.67599, "t": 457.61447, "r": 384.66632, "b": 468.90317, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "0.824", "bbox": {"l": 396.20599, "t": 457.61447, "r": 417.19632, "b": 468.90317, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "2", "bbox": {"l": 446.65302, "t": 457.61447, "r": 451.26175, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": [{"id": 10, "label": "text", "bbox": {"l": 160.37, "t": 339.45749, "r": 168.04523, "b": 350.74619, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "#", "bbox": {"l": 160.37, "t": 339.45749, "r": 168.04523, "b": 350.74619, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 144.592, "t": 352.40848, "r": 183.82895, "b": 363.69717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "enc-layers", "bbox": {"l": 144.592, "t": 352.40848, "r": 183.82895, "b": 363.69717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 207.974, "t": 339.45749, "r": 215.64923000000002, "b": 350.74619, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "#", "bbox": {"l": 207.974, "t": 339.45749, "r": 215.64923000000002, "b": 350.74619, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 192.19501, "t": 352.40848, "r": 231.42303, "b": 363.69717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "dec-layers", "bbox": {"l": 192.19501, "t": 352.40848, "r": 231.42303, "b": 363.69717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 239.79799999999997, "t": 344.93649, "r": 278.3338, "b": 356.22519000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "Language", "bbox": {"l": 239.79799999999997, "t": 344.93649, "r": 278.3338, "b": 356.22519000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 324.67001, "t": 339.45749, "r": 348.26419, "b": 350.74619, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "TEDs", "bbox": {"l": 324.67001, "t": 339.45749, "r": 348.26419, "b": 350.74619, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 396.271, "t": 339.45749, "r": 417.12595, "b": 350.74619, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "mAP", "bbox": {"l": 396.271, "t": 339.45749, "r": 417.12595, "b": 350.74619, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 394.927, "t": 350.41647, "r": 418.46921, "b": 361.70517, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "(0.75)", "bbox": {"l": 394.927, "t": 350.41647, "r": 418.46921, "b": 361.70517, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 430.771, "t": 339.45749, "r": 467.14142000000004, "b": 350.74619, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "Inference", "bbox": {"l": 430.771, "t": 339.45749, "r": 467.14142000000004, "b": 350.74619, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 427.14801, "t": 350.41647, "r": 470.76955999999996, "b": 361.70517, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "time (secs)", "bbox": {"l": 427.14801, "t": 350.41647, "r": 470.76955999999996, "b": 361.70517, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 286.686, "t": 352.40848, "r": 312.32812, "b": 363.69717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "simple", "bbox": {"l": 286.686, "t": 352.40848, "r": 312.32812, "b": 363.69717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 320.702, "t": 352.40848, "r": 353.71539, "b": 363.69717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "complex", "bbox": {"l": 320.702, "t": 352.40848, "r": 353.71539, "b": 363.69717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 369.306, "t": 352.40848, "r": 379.02914, "b": 363.69717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "all", "bbox": {"l": 369.306, "t": 352.40848, "r": 379.02914, "b": 363.69717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 161.90601, "t": 371.23849, "r": 166.51474, "b": 382.52719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "6", "bbox": {"l": 161.90601, "t": 371.23849, "r": 166.51474, "b": 382.52719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 209.509, "t": 371.23849, "r": 214.11774, "b": 382.52719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "6", "bbox": {"l": 209.509, "t": 371.23849, "r": 214.11774, "b": 382.52719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 246.71000999999998, "t": 365.75848, "r": 271.41064, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 365.75848, "r": 271.41064, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 289.017, "t": 365.75848, "r": 310.00732, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "0.965", "bbox": {"l": 289.017, "t": 365.75848, "r": 310.00732, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 326.71701, "t": 365.75848, "r": 347.70734, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "0.934", "bbox": {"l": 326.71701, "t": 365.75848, "r": 347.70734, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 363.67599, "t": 365.75848, "r": 384.66632, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "0.955", "bbox": {"l": 363.67599, "t": 365.75848, "r": 384.66632, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 397.26999, "t": 365.69571, "r": 416.12634, "b": 377.10098000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "0.88", "bbox": {"l": 397.26999, "t": 365.69571, "r": 416.12634, "b": 377.10098000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 439.52701, "t": 365.69571, "r": 458.38336, "b": 377.10098000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "2.73", "bbox": {"l": 439.52701, "t": 365.69571, "r": 458.38336, "b": 377.10098000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 245.17598999999998, "t": 378.71048, "r": 272.94495, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 378.71048, "r": 272.94495, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 289.017, "t": 378.71048, "r": 310.00732, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "0.969", "bbox": {"l": 289.017, "t": 378.71048, "r": 310.00732, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 326.71701, "t": 378.71048, "r": 347.70734, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "0.927", "bbox": {"l": 326.71701, "t": 378.71048, "r": 347.70734, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 363.67599, "t": 378.71048, "r": 384.66632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "0.955", "bbox": {"l": 363.67599, "t": 378.71048, "r": 384.66632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 396.20599, "t": 378.71048, "r": 417.19632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "0.857", "bbox": {"l": 396.20599, "t": 378.71048, "r": 417.19632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 440.767, "t": 378.71048, "r": 457.15039, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "5.39", "bbox": {"l": 440.767, "t": 378.71048, "r": 457.15039, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 161.90601, "t": 397.53949, "r": 166.51474, "b": 408.82819, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "4", "bbox": {"l": 161.90601, "t": 397.53949, "r": 166.51474, "b": 408.82819, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 209.509, "t": 397.53949, "r": 214.11774, "b": 408.82819, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "4", "bbox": {"l": 209.509, "t": 397.53949, "r": 214.11774, "b": 408.82819, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 246.71000999999998, "t": 392.06049, "r": 271.41064, "b": 403.34918, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 392.06049, "r": 271.41064, "b": 403.34918, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 289.017, "t": 392.06049, "r": 310.00732, "b": 403.34918, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "0.938", "bbox": {"l": 289.017, "t": 392.06049, "r": 310.00732, "b": 403.34918, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 326.71701, "t": 392.06049, "r": 347.70734, "b": 403.34918, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "0.904", "bbox": {"l": 326.71701, "t": 392.06049, "r": 347.70734, "b": 403.34918, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 363.67599, "t": 392.06049, "r": 384.66632, "b": 403.34918, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "0.927", "bbox": {"l": 363.67599, "t": 392.06049, "r": 384.66632, "b": 403.34918, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 394.61801, "t": 391.99771, "r": 418.77798, "b": 403.40298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "0.853", "bbox": {"l": 394.61801, "t": 391.99771, "r": 418.77798, "b": 403.40298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 439.52701, "t": 391.99771, "r": 458.38336, "b": 403.40298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "1.97", "bbox": {"l": 439.52701, "t": 391.99771, "r": 458.38336, "b": 403.40298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 245.17598999999998, "t": 405.01147, "r": 272.94495, "b": 416.30017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 405.01147, "r": 272.94495, "b": 416.30017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 289.017, "t": 405.01147, "r": 310.00732, "b": 416.30017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "0.952", "bbox": {"l": 289.017, "t": 405.01147, "r": 310.00732, "b": 416.30017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 326.71701, "t": 405.01147, "r": 347.70734, "b": 416.30017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "0.909", "bbox": {"l": 326.71701, "t": 405.01147, "r": 347.70734, "b": 416.30017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 362.08801, "t": 404.9486999999999, "r": 386.24799, "b": 416.35397, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "0.938", "bbox": {"l": 362.08801, "t": 404.9486999999999, "r": 386.24799, "b": 416.35397, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 396.20599, "t": 405.01147, "r": 417.19632, "b": 416.30017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "0.843", "bbox": {"l": 396.20599, "t": 405.01147, "r": 417.19632, "b": 416.30017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 440.767, "t": 405.01147, "r": 457.15039, "b": 416.30017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "3.77", "bbox": {"l": 440.767, "t": 405.01147, "r": 457.15039, "b": 416.30017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 161.90601, "t": 423.84048, "r": 166.51474, "b": 435.12918, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "2", "bbox": {"l": 161.90601, "t": 423.84048, "r": 166.51474, "b": 435.12918, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 209.509, "t": 423.84048, "r": 214.11774, "b": 435.12918, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "4", "bbox": {"l": 209.509, "t": 423.84048, "r": 214.11774, "b": 435.12918, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 246.71000999999998, "t": 418.3614799999999, "r": 271.41064, "b": 429.65018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 418.3614799999999, "r": 271.41064, "b": 429.65018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 289.017, "t": 418.3614799999999, "r": 310.00732, "b": 429.65018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "0.923", "bbox": {"l": 289.017, "t": 418.3614799999999, "r": 310.00732, "b": 429.65018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 326.71701, "t": 418.3614799999999, "r": 347.70734, "b": 429.65018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "0.897", "bbox": {"l": 326.71701, "t": 418.3614799999999, "r": 347.70734, "b": 429.65018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 363.67599, "t": 418.3614799999999, "r": 384.66632, "b": 429.65018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "0.915", "bbox": {"l": 363.67599, "t": 418.3614799999999, "r": 384.66632, "b": 429.65018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 394.61801, "t": 418.29871, "r": 418.77798, "b": 429.70398, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "0.859", "bbox": {"l": 394.61801, "t": 418.29871, "r": 418.77798, "b": 429.70398, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 439.52701, "t": 418.29871, "r": 458.38336, "b": 429.70398, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "1.91", "bbox": {"l": 439.52701, "t": 418.29871, "r": 458.38336, "b": 429.70398, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 245.17598999999998, "t": 431.31246999999996, "r": 272.94495, "b": 442.60117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 431.31246999999996, "r": 272.94495, "b": 442.60117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 289.017, "t": 431.31246999999996, "r": 310.00732, "b": 442.60117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "0.945", "bbox": {"l": 289.017, "t": 431.31246999999996, "r": 310.00732, "b": 442.60117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 326.71701, "t": 431.31246999999996, "r": 347.70734, "b": 442.60117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "0.901", "bbox": {"l": 326.71701, "t": 431.31246999999996, "r": 347.70734, "b": 442.60117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 362.08801, "t": 431.24969, "r": 386.24799, "b": 442.65497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "0.931", "bbox": {"l": 362.08801, "t": 431.24969, "r": 386.24799, "b": 442.65497, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 396.20599, "t": 431.31246999999996, "r": 417.19632, "b": 442.60117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "0.834", "bbox": {"l": 396.20599, "t": 431.31246999999996, "r": 417.19632, "b": 442.60117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 440.767, "t": 431.31246999999996, "r": 457.15039, "b": 442.60117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "3.81", "bbox": {"l": 440.767, "t": 431.31246999999996, "r": 457.15039, "b": 442.60117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 161.90601, "t": 450.14248999999995, "r": 166.51474, "b": 461.43118, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "4", "bbox": {"l": 161.90601, "t": 450.14248999999995, "r": 166.51474, "b": 461.43118, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 209.509, "t": 450.14248999999995, "r": 214.11774, "b": 461.43118, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "2", "bbox": {"l": 209.509, "t": 450.14248999999995, "r": 214.11774, "b": 461.43118, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 246.71000999999998, "t": 444.66248, "r": 271.41064, "b": 455.95117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 444.66248, "r": 271.41064, "b": 455.95117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 289.017, "t": 444.66248, "r": 310.00732, "b": 455.95117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "0.952", "bbox": {"l": 289.017, "t": 444.66248, "r": 310.00732, "b": 455.95117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 329.021, "t": 444.66248, "r": 345.40439, "b": 455.95117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "0.92", "bbox": {"l": 329.021, "t": 444.66248, "r": 345.40439, "b": 455.95117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 362.08801, "t": 444.5996999999999, "r": 386.24799, "b": 456.00497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "0.942", "bbox": {"l": 362.08801, "t": 444.5996999999999, "r": 386.24799, "b": 456.00497, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 394.61801, "t": 444.5996999999999, "r": 418.77798, "b": 456.00497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "0.857", "bbox": {"l": 394.61801, "t": 444.5996999999999, "r": 418.77798, "b": 456.00497, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 439.52701, "t": 444.5996999999999, "r": 458.38336, "b": 456.00497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "1.22", "bbox": {"l": 439.52701, "t": 444.5996999999999, "r": 458.38336, "b": 456.00497, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 245.17598999999998, "t": 457.61447, "r": 272.94495, "b": 468.90317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 457.61447, "r": 272.94495, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 289.017, "t": 457.61447, "r": 310.00732, "b": 468.90317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "0.944", "bbox": {"l": 289.017, "t": 457.61447, "r": 310.00732, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 326.71701, "t": 457.61447, "r": 347.70734, "b": 468.90317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "0.903", "bbox": {"l": 326.71701, "t": 457.61447, "r": 347.70734, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 363.67599, "t": 457.61447, "r": 384.66632, "b": 468.90317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "0.931", "bbox": {"l": 363.67599, "t": 457.61447, "r": 384.66632, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 396.20599, "t": 457.61447, "r": 417.19632, "b": 468.90317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "0.824", "bbox": {"l": 396.20599, "t": 457.61447, "r": 417.19632, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 446.65302, "t": 457.61447, "r": 451.26175, "b": 468.90317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "2", "bbox": {"l": 446.65302, "t": 457.61447, "r": 451.26175, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "lcel", "lcel", "ched", "ched", "nl", "ched", "ched", "ucel", "ched", "ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 7, "num_cols": 8, "table_cells": [{"bbox": {"l": 160.37, "t": 339.45749, "r": 168.04523, "b": 350.74619, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "#", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 144.592, "t": 352.40848, "r": 183.82895, "b": 363.69717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "enc-layers", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 207.974, "t": 339.45749, "r": 215.64923000000002, "b": 350.74619, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "#", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 192.19501, "t": 352.40848, "r": 231.42303, "b": 363.69717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "dec-layers", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 239.79799999999997, "t": 344.93649, "r": 278.3338, "b": 356.22519000000005, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Language", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 324.67001, "t": 339.45749, "r": 348.26419, "b": 350.74619, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 3, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 6, "text": "TEDs", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 396.271, "t": 339.45749, "r": 417.12595, "b": 350.74619, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "mAP", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 394.927, "t": 350.41647, "r": 418.46921, "b": 361.70517, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "(0.75)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 430.771, "t": 339.45749, "r": 467.14142000000004, "b": 350.74619, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "Inference", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 427.14801, "t": 350.41647, "r": 470.76955999999996, "b": 361.70517, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "time (secs)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 286.686, "t": 352.40848, "r": 312.32812, "b": 363.69717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "simple", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 320.702, "t": 352.40848, "r": 353.71539, "b": 363.69717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "complex", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 369.306, "t": 352.40848, "r": 379.02914, "b": 363.69717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "all", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 161.90601, "t": 371.23849, "r": 166.51474, "b": 382.52719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 371.23849, "r": 214.11774, "b": 382.52719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 365.75848, "r": 272.94495, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 365.75848, "r": 310.00732, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.965 0.969", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 365.75848, "r": 347.70734, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.934 0.927", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 363.67599, "t": 365.75848, "r": 384.66632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.955 0.955", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 396.20599, "t": 365.69571, "r": 417.19632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.88 0.857", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 365.69571, "r": 458.38336, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "2.73 5.39", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 161.90601, "t": 397.53949, "r": 166.51474, "b": 408.82819, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 397.53949, "r": 214.11774, "b": 408.82819, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 392.06049, "r": 272.94495, "b": 416.30017, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 392.06049, "r": 310.00732, "b": 403.34918, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.938", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 392.06049, "r": 347.70734, "b": 403.34918, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.904", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 363.67599, "t": 392.06049, "r": 384.66632, "b": 403.34918, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.927", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.61801, "t": 391.99771, "r": 418.77798, "b": 403.40298, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.853", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 391.99771, "r": 458.38336, "b": 403.40298, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "1.97", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 405.01147, "r": 310.00732, "b": 429.65018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.952 0.923", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 405.01147, "r": 347.70734, "b": 416.30017, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.909", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 362.08801, "t": 404.9486999999999, "r": 386.24799, "b": 416.35397, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.938", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 396.20599, "t": 405.01147, "r": 417.19632, "b": 416.30017, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.843", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.767, "t": 405.01147, "r": 457.15039, "b": 416.30017, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "3.77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 161.90601, "t": 423.84048, "r": 166.51474, "b": 435.12918, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 423.84048, "r": 214.11774, "b": 435.12918, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 246.71000999999998, "t": 418.3614799999999, "r": 271.41064, "b": 429.65018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 418.3614799999999, "r": 347.70734, "b": 442.60117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.897 0.901", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 362.08801, "t": 418.3614799999999, "r": 386.24799, "b": 442.65497, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.915 0.931", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.61801, "t": 418.29871, "r": 418.77798, "b": 442.60117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.859 0.834", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 418.29871, "r": 458.38336, "b": 442.60117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "1.91 3.81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 431.31246999999996, "r": 272.94495, "b": 442.60117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 431.31246999999996, "r": 310.00732, "b": 442.60117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.945", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 161.90601, "t": 450.14248999999995, "r": 166.51474, "b": 461.43118, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 450.14248999999995, "r": 214.11774, "b": 461.43118, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 444.66248, "r": 272.94495, "b": 468.90317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 444.66248, "r": 310.00732, "b": 468.90317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.952 0.944", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 444.66248, "r": 347.70734, "b": 468.90317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.92 0.903", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 362.08801, "t": 444.5996999999999, "r": 386.24799, "b": 468.90317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.942 0.931", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.61801, "t": 444.5996999999999, "r": 418.77798, "b": 468.90317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.857 0.824", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 444.5996999999999, "r": 458.38336, "b": 468.90317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "1.22 2", "column_header": false, "row_header": false, "row_section": false}]}}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_header", "id": 8, "page_no": 0, "cluster": {"id": 8, "label": "page_header", "bbox": {"l": 194.478, "t": 91.49352999999996, "r": 447.54476999999997, "b": 102.78223000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9373533129692078, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 91.49352999999996, "r": 447.54476999999997, "b": 102.78223000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Optimized Table Tokenization for Table Structure Recognition"}, {"label": "page_header", "id": 9, "page_no": 0, "cluster": {"id": 9, "label": "page_header", "bbox": {"l": 475.98441, "t": 91.49352999999996, "r": 480.59314, "b": 102.78223000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.8858679533004761, "cells": [{"id": 1, "text": "9", "bbox": {"l": 475.98441, "t": 91.49352999999996, "r": 480.59314, "b": 102.78223000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "9"}, {"label": "text", "id": 4, "page_no": 0, "cluster": {"id": 4, "label": "text", "bbox": {"l": 134.765, "t": 116.46301000000005, "r": 480.59665, "b": 152.90697999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.9806435108184814, "cells": [{"id": 2, "text": "order to compute the TED score. Inference timing results for all experiments", "bbox": {"l": 134.765, "t": 116.46301000000005, "r": 480.59067, "b": 128.99597000000006, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "were obtained from the same machine on a single core with AMD EPYC 7763", "bbox": {"l": 134.765, "t": 128.41803000000004, "r": 480.59665, "b": 140.95099000000005, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "CPU @2.45 GHz.", "bbox": {"l": 134.765, "t": 140.37401999999997, "r": 210.78761, "b": 152.90697999999998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "order to compute the TED score. Inference timing results for all experiments were obtained from the same machine on a single core with AMD EPYC 7763 CPU @2.45 GHz."}, {"label": "section_header", "id": 7, "page_no": 0, "cluster": {"id": 7, "label": "section_header", "bbox": {"l": 134.765, "t": 166.70514000000003, "r": 318.45145, "b": 179.20818999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9577404260635376, "cells": [{"id": 5, "text": "5.1", "bbox": {"l": 134.765, "t": 166.70514000000003, "r": 149.40306, "b": 179.20818999999995, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Hyper Parameter Optimization", "bbox": {"l": 160.85905, "t": 166.70514000000003, "r": 318.45145, "b": 179.20818999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5.1 Hyper Parameter Optimization"}, {"label": "text", "id": 1, "page_no": 0, "cluster": {"id": 1, "label": "text", "bbox": {"l": 134.765, "t": 183.11505, "r": 480.59567, "b": 255.42400999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9850425124168396, "cells": [{"id": 7, "text": "We have chosen the PubTabNet data set to perform HPO, since it includes a", "bbox": {"l": 134.765, "t": 183.11505, "r": 479.74982000000006, "b": 195.64801, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "highly diverse set of tables. Also we report TED scores separately for simple and", "bbox": {"l": 134.765, "t": 195.07007, "r": 480.58765, "b": 207.60303, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "complex tables (tables with cell spans). Results are presented in Table. 1. It is", "bbox": {"l": 134.765, "t": 207.02502000000004, "r": 480.58859000000007, "b": 219.55798000000004, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "evident that with OTSL, our model achieves the same TED score and slightly", "bbox": {"l": 134.765, "t": 218.98004000000003, "r": 480.59567, "b": 231.51300000000003, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "better mAP scores in comparison to HTML. However OTSL yields a", "bbox": {"l": 134.765, "t": 230.93506000000002, "r": 440.9425, "b": 243.46802000000002, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "2x speed", "bbox": {"l": 444.86800999999997, "t": 230.98486000000003, "r": 480.58792, "b": 243.46802000000002, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "up", "bbox": {"l": 134.765, "t": 242.94086000000004, "r": 145.19585, "b": 255.42400999999995, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "in the inference runtime over HTML.", "bbox": {"l": 149.149, "t": 242.89104999999995, "r": 311.22256, "b": 255.42400999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "We have chosen the PubTabNet data set to perform HPO, since it includes a highly diverse set of tables. Also we report TED scores separately for simple and complex tables (tables with cell spans). Results are presented in Table. 1. It is evident that with OTSL, our model achieves the same TED score and slightly better mAP scores in comparison to HTML. However OTSL yields a 2x speed up in the inference runtime over HTML."}, {"label": "caption", "id": 5, "page_no": 0, "cluster": {"id": 5, "label": "caption", "bbox": {"l": 134.765, "t": 272.79474000000005, "r": 480.59890999999993, "b": 327.98218, "coord_origin": "TOPLEFT"}, "confidence": 0.9591907262802124, "cells": [{"id": 15, "text": "Table", "bbox": {"l": 134.765, "t": 272.79474000000005, "r": 159.22983, "b": 284.1999799999999, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "1.", "bbox": {"l": 167.34442, "t": 272.79474000000005, "r": 174.71301, "b": 284.1999799999999, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "HPO performed in OTSL and HTML representation on the same", "bbox": {"l": 188.133, "t": 272.85748, "r": 480.58101999999997, "b": 284.14618, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "transformer-based TableFormer [9] architecture, trained only on PubTabNet [22]. Ef-", "bbox": {"l": 134.765, "t": 283.81647, "r": 480.59890999999993, "b": 295.10516000000007, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "fects of reducing the # of layers in encoder and decoder stages of the model show that", "bbox": {"l": 134.765, "t": 294.77547999999996, "r": 480.59887999999995, "b": 306.06418, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "smaller models trained on OTSL perform better, especially in recognizing complex", "bbox": {"l": 134.765, "t": 305.73447, "r": 480.59180000000003, "b": 317.02316, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "table structures, and maintain a much higher mAP score than the HTML counterpart.", "bbox": {"l": 134.765, "t": 316.69348, "r": 480.58471999999995, "b": 327.98218, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 1. HPO performed in OTSL and HTML representation on the same transformer-based TableFormer [9] architecture, trained only on PubTabNet [22]. Effects of reducing the # of layers in encoder and decoder stages of the model show that smaller models trained on OTSL perform better, especially in recognizing complex table structures, and maintain a much higher mAP score than the HTML counterpart."}, {"label": "table", "id": 0, "page_no": 0, "cluster": {"id": 0, "label": "table", "bbox": {"l": 139.6674041748047, "t": 337.5453796386719, "r": 475.00927734375, "b": 469.4945373535156, "coord_origin": "TOPLEFT"}, "confidence": 0.9901031255722046, "cells": [{"id": 22, "text": "#", "bbox": {"l": 160.37, "t": 339.45749, "r": 168.04523, "b": 350.74619, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "enc-layers", "bbox": {"l": 144.592, "t": 352.40848, "r": 183.82895, "b": 363.69717, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "#", "bbox": {"l": 207.974, "t": 339.45749, "r": 215.64923000000002, "b": 350.74619, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "dec-layers", "bbox": {"l": 192.19501, "t": 352.40848, "r": 231.42303, "b": 363.69717, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "Language", "bbox": {"l": 239.79799999999997, "t": 344.93649, "r": 278.3338, "b": 356.22519000000005, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "TEDs", "bbox": {"l": 324.67001, "t": 339.45749, "r": 348.26419, "b": 350.74619, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "mAP", "bbox": {"l": 396.271, "t": 339.45749, "r": 417.12595, "b": 350.74619, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "(0.75)", "bbox": {"l": 394.927, "t": 350.41647, "r": 418.46921, "b": 361.70517, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Inference", "bbox": {"l": 430.771, "t": 339.45749, "r": 467.14142000000004, "b": 350.74619, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "time (secs)", "bbox": {"l": 427.14801, "t": 350.41647, "r": 470.76955999999996, "b": 361.70517, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "simple", "bbox": {"l": 286.686, "t": 352.40848, "r": 312.32812, "b": 363.69717, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "complex", "bbox": {"l": 320.702, "t": 352.40848, "r": 353.71539, "b": 363.69717, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "all", "bbox": {"l": 369.306, "t": 352.40848, "r": 379.02914, "b": 363.69717, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "6", "bbox": {"l": 161.90601, "t": 371.23849, "r": 166.51474, "b": 382.52719, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "6", "bbox": {"l": 209.509, "t": 371.23849, "r": 214.11774, "b": 382.52719, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 365.75848, "r": 271.41064, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "0.965", "bbox": {"l": 289.017, "t": 365.75848, "r": 310.00732, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "0.934", "bbox": {"l": 326.71701, "t": 365.75848, "r": 347.70734, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "0.955", "bbox": {"l": 363.67599, "t": 365.75848, "r": 384.66632, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "0.88", "bbox": {"l": 397.26999, "t": 365.69571, "r": 416.12634, "b": 377.10098000000005, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "2.73", "bbox": {"l": 439.52701, "t": 365.69571, "r": 458.38336, "b": 377.10098000000005, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 378.71048, "r": 272.94495, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "0.969", "bbox": {"l": 289.017, "t": 378.71048, "r": 310.00732, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "0.927", "bbox": {"l": 326.71701, "t": 378.71048, "r": 347.70734, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "0.955", "bbox": {"l": 363.67599, "t": 378.71048, "r": 384.66632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "0.857", "bbox": {"l": 396.20599, "t": 378.71048, "r": 417.19632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "5.39", "bbox": {"l": 440.767, "t": 378.71048, "r": 457.15039, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "4", "bbox": {"l": 161.90601, "t": 397.53949, "r": 166.51474, "b": 408.82819, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "4", "bbox": {"l": 209.509, "t": 397.53949, "r": 214.11774, "b": 408.82819, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 392.06049, "r": 271.41064, "b": 403.34918, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "0.938", "bbox": {"l": 289.017, "t": 392.06049, "r": 310.00732, "b": 403.34918, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "0.904", "bbox": {"l": 326.71701, "t": 392.06049, "r": 347.70734, "b": 403.34918, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "0.927", "bbox": {"l": 363.67599, "t": 392.06049, "r": 384.66632, "b": 403.34918, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "0.853", "bbox": {"l": 394.61801, "t": 391.99771, "r": 418.77798, "b": 403.40298, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "1.97", "bbox": {"l": 439.52701, "t": 391.99771, "r": 458.38336, "b": 403.40298, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 405.01147, "r": 272.94495, "b": 416.30017, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "0.952", "bbox": {"l": 289.017, "t": 405.01147, "r": 310.00732, "b": 416.30017, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "0.909", "bbox": {"l": 326.71701, "t": 405.01147, "r": 347.70734, "b": 416.30017, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "0.938", "bbox": {"l": 362.08801, "t": 404.9486999999999, "r": 386.24799, "b": 416.35397, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "0.843", "bbox": {"l": 396.20599, "t": 405.01147, "r": 417.19632, "b": 416.30017, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "3.77", "bbox": {"l": 440.767, "t": 405.01147, "r": 457.15039, "b": 416.30017, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "2", "bbox": {"l": 161.90601, "t": 423.84048, "r": 166.51474, "b": 435.12918, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "4", "bbox": {"l": 209.509, "t": 423.84048, "r": 214.11774, "b": 435.12918, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 418.3614799999999, "r": 271.41064, "b": 429.65018, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "0.923", "bbox": {"l": 289.017, "t": 418.3614799999999, "r": 310.00732, "b": 429.65018, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "0.897", "bbox": {"l": 326.71701, "t": 418.3614799999999, "r": 347.70734, "b": 429.65018, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "0.915", "bbox": {"l": 363.67599, "t": 418.3614799999999, "r": 384.66632, "b": 429.65018, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "0.859", "bbox": {"l": 394.61801, "t": 418.29871, "r": 418.77798, "b": 429.70398, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "1.91", "bbox": {"l": 439.52701, "t": 418.29871, "r": 458.38336, "b": 429.70398, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 431.31246999999996, "r": 272.94495, "b": 442.60117, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "0.945", "bbox": {"l": 289.017, "t": 431.31246999999996, "r": 310.00732, "b": 442.60117, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "0.901", "bbox": {"l": 326.71701, "t": 431.31246999999996, "r": 347.70734, "b": 442.60117, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "0.931", "bbox": {"l": 362.08801, "t": 431.24969, "r": 386.24799, "b": 442.65497, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "0.834", "bbox": {"l": 396.20599, "t": 431.31246999999996, "r": 417.19632, "b": 442.60117, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "3.81", "bbox": {"l": 440.767, "t": 431.31246999999996, "r": 457.15039, "b": 442.60117, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "4", "bbox": {"l": 161.90601, "t": 450.14248999999995, "r": 166.51474, "b": 461.43118, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "2", "bbox": {"l": 209.509, "t": 450.14248999999995, "r": 214.11774, "b": 461.43118, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 444.66248, "r": 271.41064, "b": 455.95117, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "0.952", "bbox": {"l": 289.017, "t": 444.66248, "r": 310.00732, "b": 455.95117, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "0.92", "bbox": {"l": 329.021, "t": 444.66248, "r": 345.40439, "b": 455.95117, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "0.942", "bbox": {"l": 362.08801, "t": 444.5996999999999, "r": 386.24799, "b": 456.00497, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "0.857", "bbox": {"l": 394.61801, "t": 444.5996999999999, "r": 418.77798, "b": 456.00497, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "1.22", "bbox": {"l": 439.52701, "t": 444.5996999999999, "r": 458.38336, "b": 456.00497, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 457.61447, "r": 272.94495, "b": 468.90317, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "0.944", "bbox": {"l": 289.017, "t": 457.61447, "r": 310.00732, "b": 468.90317, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "0.903", "bbox": {"l": 326.71701, "t": 457.61447, "r": 347.70734, "b": 468.90317, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "0.931", "bbox": {"l": 363.67599, "t": 457.61447, "r": 384.66632, "b": 468.90317, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "0.824", "bbox": {"l": 396.20599, "t": 457.61447, "r": 417.19632, "b": 468.90317, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "2", "bbox": {"l": 446.65302, "t": 457.61447, "r": 451.26175, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": [{"id": 10, "label": "text", "bbox": {"l": 160.37, "t": 339.45749, "r": 168.04523, "b": 350.74619, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "#", "bbox": {"l": 160.37, "t": 339.45749, "r": 168.04523, "b": 350.74619, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 144.592, "t": 352.40848, "r": 183.82895, "b": 363.69717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "enc-layers", "bbox": {"l": 144.592, "t": 352.40848, "r": 183.82895, "b": 363.69717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 207.974, "t": 339.45749, "r": 215.64923000000002, "b": 350.74619, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "#", "bbox": {"l": 207.974, "t": 339.45749, "r": 215.64923000000002, "b": 350.74619, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 192.19501, "t": 352.40848, "r": 231.42303, "b": 363.69717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "dec-layers", "bbox": {"l": 192.19501, "t": 352.40848, "r": 231.42303, "b": 363.69717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 239.79799999999997, "t": 344.93649, "r": 278.3338, "b": 356.22519000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "Language", "bbox": {"l": 239.79799999999997, "t": 344.93649, "r": 278.3338, "b": 356.22519000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 324.67001, "t": 339.45749, "r": 348.26419, "b": 350.74619, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "TEDs", "bbox": {"l": 324.67001, "t": 339.45749, "r": 348.26419, "b": 350.74619, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 396.271, "t": 339.45749, "r": 417.12595, "b": 350.74619, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "mAP", "bbox": {"l": 396.271, "t": 339.45749, "r": 417.12595, "b": 350.74619, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 394.927, "t": 350.41647, "r": 418.46921, "b": 361.70517, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "(0.75)", "bbox": {"l": 394.927, "t": 350.41647, "r": 418.46921, "b": 361.70517, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 430.771, "t": 339.45749, "r": 467.14142000000004, "b": 350.74619, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "Inference", "bbox": {"l": 430.771, "t": 339.45749, "r": 467.14142000000004, "b": 350.74619, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 427.14801, "t": 350.41647, "r": 470.76955999999996, "b": 361.70517, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "time (secs)", "bbox": {"l": 427.14801, "t": 350.41647, "r": 470.76955999999996, "b": 361.70517, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 286.686, "t": 352.40848, "r": 312.32812, "b": 363.69717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "simple", "bbox": {"l": 286.686, "t": 352.40848, "r": 312.32812, "b": 363.69717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 320.702, "t": 352.40848, "r": 353.71539, "b": 363.69717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "complex", "bbox": {"l": 320.702, "t": 352.40848, "r": 353.71539, "b": 363.69717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 369.306, "t": 352.40848, "r": 379.02914, "b": 363.69717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "all", "bbox": {"l": 369.306, "t": 352.40848, "r": 379.02914, "b": 363.69717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 161.90601, "t": 371.23849, "r": 166.51474, "b": 382.52719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "6", "bbox": {"l": 161.90601, "t": 371.23849, "r": 166.51474, "b": 382.52719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 209.509, "t": 371.23849, "r": 214.11774, "b": 382.52719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "6", "bbox": {"l": 209.509, "t": 371.23849, "r": 214.11774, "b": 382.52719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 246.71000999999998, "t": 365.75848, "r": 271.41064, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 365.75848, "r": 271.41064, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 289.017, "t": 365.75848, "r": 310.00732, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "0.965", "bbox": {"l": 289.017, "t": 365.75848, "r": 310.00732, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 326.71701, "t": 365.75848, "r": 347.70734, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "0.934", "bbox": {"l": 326.71701, "t": 365.75848, "r": 347.70734, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 363.67599, "t": 365.75848, "r": 384.66632, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "0.955", "bbox": {"l": 363.67599, "t": 365.75848, "r": 384.66632, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 397.26999, "t": 365.69571, "r": 416.12634, "b": 377.10098000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "0.88", "bbox": {"l": 397.26999, "t": 365.69571, "r": 416.12634, "b": 377.10098000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 439.52701, "t": 365.69571, "r": 458.38336, "b": 377.10098000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "2.73", "bbox": {"l": 439.52701, "t": 365.69571, "r": 458.38336, "b": 377.10098000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 245.17598999999998, "t": 378.71048, "r": 272.94495, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 378.71048, "r": 272.94495, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 289.017, "t": 378.71048, "r": 310.00732, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "0.969", "bbox": {"l": 289.017, "t": 378.71048, "r": 310.00732, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 326.71701, "t": 378.71048, "r": 347.70734, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "0.927", "bbox": {"l": 326.71701, "t": 378.71048, "r": 347.70734, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 363.67599, "t": 378.71048, "r": 384.66632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "0.955", "bbox": {"l": 363.67599, "t": 378.71048, "r": 384.66632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 396.20599, "t": 378.71048, "r": 417.19632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "0.857", "bbox": {"l": 396.20599, "t": 378.71048, "r": 417.19632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 440.767, "t": 378.71048, "r": 457.15039, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "5.39", "bbox": {"l": 440.767, "t": 378.71048, "r": 457.15039, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 161.90601, "t": 397.53949, "r": 166.51474, "b": 408.82819, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "4", "bbox": {"l": 161.90601, "t": 397.53949, "r": 166.51474, "b": 408.82819, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 209.509, "t": 397.53949, "r": 214.11774, "b": 408.82819, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "4", "bbox": {"l": 209.509, "t": 397.53949, "r": 214.11774, "b": 408.82819, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 246.71000999999998, "t": 392.06049, "r": 271.41064, "b": 403.34918, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 392.06049, "r": 271.41064, "b": 403.34918, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 289.017, "t": 392.06049, "r": 310.00732, "b": 403.34918, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "0.938", "bbox": {"l": 289.017, "t": 392.06049, "r": 310.00732, "b": 403.34918, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 326.71701, "t": 392.06049, "r": 347.70734, "b": 403.34918, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "0.904", "bbox": {"l": 326.71701, "t": 392.06049, "r": 347.70734, "b": 403.34918, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 363.67599, "t": 392.06049, "r": 384.66632, "b": 403.34918, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "0.927", "bbox": {"l": 363.67599, "t": 392.06049, "r": 384.66632, "b": 403.34918, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 394.61801, "t": 391.99771, "r": 418.77798, "b": 403.40298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "0.853", "bbox": {"l": 394.61801, "t": 391.99771, "r": 418.77798, "b": 403.40298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 439.52701, "t": 391.99771, "r": 458.38336, "b": 403.40298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "1.97", "bbox": {"l": 439.52701, "t": 391.99771, "r": 458.38336, "b": 403.40298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 245.17598999999998, "t": 405.01147, "r": 272.94495, "b": 416.30017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 405.01147, "r": 272.94495, "b": 416.30017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 289.017, "t": 405.01147, "r": 310.00732, "b": 416.30017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "0.952", "bbox": {"l": 289.017, "t": 405.01147, "r": 310.00732, "b": 416.30017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 326.71701, "t": 405.01147, "r": 347.70734, "b": 416.30017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "0.909", "bbox": {"l": 326.71701, "t": 405.01147, "r": 347.70734, "b": 416.30017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 362.08801, "t": 404.9486999999999, "r": 386.24799, "b": 416.35397, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "0.938", "bbox": {"l": 362.08801, "t": 404.9486999999999, "r": 386.24799, "b": 416.35397, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 396.20599, "t": 405.01147, "r": 417.19632, "b": 416.30017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "0.843", "bbox": {"l": 396.20599, "t": 405.01147, "r": 417.19632, "b": 416.30017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 440.767, "t": 405.01147, "r": 457.15039, "b": 416.30017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "3.77", "bbox": {"l": 440.767, "t": 405.01147, "r": 457.15039, "b": 416.30017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 161.90601, "t": 423.84048, "r": 166.51474, "b": 435.12918, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "2", "bbox": {"l": 161.90601, "t": 423.84048, "r": 166.51474, "b": 435.12918, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 209.509, "t": 423.84048, "r": 214.11774, "b": 435.12918, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "4", "bbox": {"l": 209.509, "t": 423.84048, "r": 214.11774, "b": 435.12918, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 246.71000999999998, "t": 418.3614799999999, "r": 271.41064, "b": 429.65018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 418.3614799999999, "r": 271.41064, "b": 429.65018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 289.017, "t": 418.3614799999999, "r": 310.00732, "b": 429.65018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "0.923", "bbox": {"l": 289.017, "t": 418.3614799999999, "r": 310.00732, "b": 429.65018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 326.71701, "t": 418.3614799999999, "r": 347.70734, "b": 429.65018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "0.897", "bbox": {"l": 326.71701, "t": 418.3614799999999, "r": 347.70734, "b": 429.65018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 363.67599, "t": 418.3614799999999, "r": 384.66632, "b": 429.65018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "0.915", "bbox": {"l": 363.67599, "t": 418.3614799999999, "r": 384.66632, "b": 429.65018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 394.61801, "t": 418.29871, "r": 418.77798, "b": 429.70398, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "0.859", "bbox": {"l": 394.61801, "t": 418.29871, "r": 418.77798, "b": 429.70398, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 439.52701, "t": 418.29871, "r": 458.38336, "b": 429.70398, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "1.91", "bbox": {"l": 439.52701, "t": 418.29871, "r": 458.38336, "b": 429.70398, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 245.17598999999998, "t": 431.31246999999996, "r": 272.94495, "b": 442.60117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 431.31246999999996, "r": 272.94495, "b": 442.60117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 289.017, "t": 431.31246999999996, "r": 310.00732, "b": 442.60117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "0.945", "bbox": {"l": 289.017, "t": 431.31246999999996, "r": 310.00732, "b": 442.60117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 326.71701, "t": 431.31246999999996, "r": 347.70734, "b": 442.60117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "0.901", "bbox": {"l": 326.71701, "t": 431.31246999999996, "r": 347.70734, "b": 442.60117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 362.08801, "t": 431.24969, "r": 386.24799, "b": 442.65497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "0.931", "bbox": {"l": 362.08801, "t": 431.24969, "r": 386.24799, "b": 442.65497, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 396.20599, "t": 431.31246999999996, "r": 417.19632, "b": 442.60117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "0.834", "bbox": {"l": 396.20599, "t": 431.31246999999996, "r": 417.19632, "b": 442.60117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 440.767, "t": 431.31246999999996, "r": 457.15039, "b": 442.60117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "3.81", "bbox": {"l": 440.767, "t": 431.31246999999996, "r": 457.15039, "b": 442.60117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 161.90601, "t": 450.14248999999995, "r": 166.51474, "b": 461.43118, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "4", "bbox": {"l": 161.90601, "t": 450.14248999999995, "r": 166.51474, "b": 461.43118, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 209.509, "t": 450.14248999999995, "r": 214.11774, "b": 461.43118, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "2", "bbox": {"l": 209.509, "t": 450.14248999999995, "r": 214.11774, "b": 461.43118, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 246.71000999999998, "t": 444.66248, "r": 271.41064, "b": 455.95117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 444.66248, "r": 271.41064, "b": 455.95117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 289.017, "t": 444.66248, "r": 310.00732, "b": 455.95117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "0.952", "bbox": {"l": 289.017, "t": 444.66248, "r": 310.00732, "b": 455.95117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 329.021, "t": 444.66248, "r": 345.40439, "b": 455.95117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "0.92", "bbox": {"l": 329.021, "t": 444.66248, "r": 345.40439, "b": 455.95117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 362.08801, "t": 444.5996999999999, "r": 386.24799, "b": 456.00497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "0.942", "bbox": {"l": 362.08801, "t": 444.5996999999999, "r": 386.24799, "b": 456.00497, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 394.61801, "t": 444.5996999999999, "r": 418.77798, "b": 456.00497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "0.857", "bbox": {"l": 394.61801, "t": 444.5996999999999, "r": 418.77798, "b": 456.00497, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 439.52701, "t": 444.5996999999999, "r": 458.38336, "b": 456.00497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "1.22", "bbox": {"l": 439.52701, "t": 444.5996999999999, "r": 458.38336, "b": 456.00497, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 245.17598999999998, "t": 457.61447, "r": 272.94495, "b": 468.90317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 457.61447, "r": 272.94495, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 289.017, "t": 457.61447, "r": 310.00732, "b": 468.90317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "0.944", "bbox": {"l": 289.017, "t": 457.61447, "r": 310.00732, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 326.71701, "t": 457.61447, "r": 347.70734, "b": 468.90317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "0.903", "bbox": {"l": 326.71701, "t": 457.61447, "r": 347.70734, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 363.67599, "t": 457.61447, "r": 384.66632, "b": 468.90317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "0.931", "bbox": {"l": 363.67599, "t": 457.61447, "r": 384.66632, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 396.20599, "t": 457.61447, "r": 417.19632, "b": 468.90317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "0.824", "bbox": {"l": 396.20599, "t": 457.61447, "r": 417.19632, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 446.65302, "t": 457.61447, "r": 451.26175, "b": 468.90317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "2", "bbox": {"l": 446.65302, "t": 457.61447, "r": 451.26175, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "lcel", "lcel", "ched", "ched", "nl", "ched", "ched", "ucel", "ched", "ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 7, "num_cols": 8, "table_cells": [{"bbox": {"l": 160.37, "t": 339.45749, "r": 168.04523, "b": 350.74619, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "#", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 144.592, "t": 352.40848, "r": 183.82895, "b": 363.69717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "enc-layers", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 207.974, "t": 339.45749, "r": 215.64923000000002, "b": 350.74619, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "#", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 192.19501, "t": 352.40848, "r": 231.42303, "b": 363.69717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "dec-layers", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 239.79799999999997, "t": 344.93649, "r": 278.3338, "b": 356.22519000000005, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Language", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 324.67001, "t": 339.45749, "r": 348.26419, "b": 350.74619, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 3, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 6, "text": "TEDs", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 396.271, "t": 339.45749, "r": 417.12595, "b": 350.74619, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "mAP", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 394.927, "t": 350.41647, "r": 418.46921, "b": 361.70517, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "(0.75)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 430.771, "t": 339.45749, "r": 467.14142000000004, "b": 350.74619, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "Inference", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 427.14801, "t": 350.41647, "r": 470.76955999999996, "b": 361.70517, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "time (secs)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 286.686, "t": 352.40848, "r": 312.32812, "b": 363.69717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "simple", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 320.702, "t": 352.40848, "r": 353.71539, "b": 363.69717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "complex", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 369.306, "t": 352.40848, "r": 379.02914, "b": 363.69717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "all", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 161.90601, "t": 371.23849, "r": 166.51474, "b": 382.52719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 371.23849, "r": 214.11774, "b": 382.52719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 365.75848, "r": 272.94495, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 365.75848, "r": 310.00732, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.965 0.969", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 365.75848, "r": 347.70734, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.934 0.927", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 363.67599, "t": 365.75848, "r": 384.66632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.955 0.955", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 396.20599, "t": 365.69571, "r": 417.19632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.88 0.857", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 365.69571, "r": 458.38336, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "2.73 5.39", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 161.90601, "t": 397.53949, "r": 166.51474, "b": 408.82819, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 397.53949, "r": 214.11774, "b": 408.82819, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 392.06049, "r": 272.94495, "b": 416.30017, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 392.06049, "r": 310.00732, "b": 403.34918, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.938", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 392.06049, "r": 347.70734, "b": 403.34918, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.904", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 363.67599, "t": 392.06049, "r": 384.66632, "b": 403.34918, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.927", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.61801, "t": 391.99771, "r": 418.77798, "b": 403.40298, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.853", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 391.99771, "r": 458.38336, "b": 403.40298, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "1.97", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 405.01147, "r": 310.00732, "b": 429.65018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.952 0.923", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 405.01147, "r": 347.70734, "b": 416.30017, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.909", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 362.08801, "t": 404.9486999999999, "r": 386.24799, "b": 416.35397, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.938", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 396.20599, "t": 405.01147, "r": 417.19632, "b": 416.30017, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.843", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.767, "t": 405.01147, "r": 457.15039, "b": 416.30017, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "3.77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 161.90601, "t": 423.84048, "r": 166.51474, "b": 435.12918, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 423.84048, "r": 214.11774, "b": 435.12918, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 246.71000999999998, "t": 418.3614799999999, "r": 271.41064, "b": 429.65018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 418.3614799999999, "r": 347.70734, "b": 442.60117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.897 0.901", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 362.08801, "t": 418.3614799999999, "r": 386.24799, "b": 442.65497, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.915 0.931", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.61801, "t": 418.29871, "r": 418.77798, "b": 442.60117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.859 0.834", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 418.29871, "r": 458.38336, "b": 442.60117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "1.91 3.81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 431.31246999999996, "r": 272.94495, "b": 442.60117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 431.31246999999996, "r": 310.00732, "b": 442.60117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.945", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 161.90601, "t": 450.14248999999995, "r": 166.51474, "b": 461.43118, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 450.14248999999995, "r": 214.11774, "b": 461.43118, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 444.66248, "r": 272.94495, "b": 468.90317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 444.66248, "r": 310.00732, "b": 468.90317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.952 0.944", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 444.66248, "r": 347.70734, "b": 468.90317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.92 0.903", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 362.08801, "t": 444.5996999999999, "r": 386.24799, "b": 468.90317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.942 0.931", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.61801, "t": 444.5996999999999, "r": 418.77798, "b": 468.90317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.857 0.824", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 444.5996999999999, "r": 458.38336, "b": 468.90317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "1.22 2", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "section_header", "id": 6, "page_no": 0, "cluster": {"id": 6, "label": "section_header", "bbox": {"l": 134.765, "t": 505.67111, "r": 264.40829, "b": 518.17419, "coord_origin": "TOPLEFT"}, "confidence": 0.9589295387268066, "cells": [{"id": 91, "text": "5.2", "bbox": {"l": 134.765, "t": 505.67111, "r": 149.40306, "b": 518.17419, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Quantitative Results", "bbox": {"l": 160.85905, "t": 505.67111, "r": 264.40829, "b": 518.17419, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5.2 Quantitative Results"}, {"label": "text", "id": 3, "page_no": 0, "cluster": {"id": 3, "label": "text", "bbox": {"l": 134.765, "t": 522.08005, "r": 480.72003, "b": 618.3, "coord_origin": "TOPLEFT"}, "confidence": 0.9849976301193237, "cells": [{"id": 93, "text": "We picked the model parameter configuration that produced the best prediction", "bbox": {"l": 134.765, "t": 522.08005, "r": 479.72983, "b": 534.61301, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "quality (enc=6, dec=6, heads=8) with PubTabNet alone, then independently", "bbox": {"l": 134.765, "t": 534.03604, "r": 480.5897499999999, "b": 546.569, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "trained and evaluated it on three publicly available data sets: PubTabNet (395k", "bbox": {"l": 134.765, "t": 545.99104, "r": 480.72003, "b": 558.524, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "samples), FinTabNet (113k samples) and PubTables-1M (about 1M samples).", "bbox": {"l": 134.765, "t": 557.94604, "r": 480.60577, "b": 570.479, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "Performance results are presented in Table. 2. It is clearly evident that the model", "bbox": {"l": 134.765, "t": 569.90103, "r": 480.5936899999999, "b": 582.43399, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "trained on OTSL outperforms HTML across the board, keeping high TEDs and", "bbox": {"l": 134.765, "t": 581.85603, "r": 480.59158, "b": 594.38899, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "mAP scores even on difficult financial tables (FinTabNet) that contain sparse", "bbox": {"l": 134.765, "t": 593.81204, "r": 480.58080999999993, "b": 606.345, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "and large tables.", "bbox": {"l": 134.765, "t": 605.76704, "r": 206.79959, "b": 618.3, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "We picked the model parameter configuration that produced the best prediction quality (enc=6, dec=6, heads=8) with PubTabNet alone, then independently trained and evaluated it on three publicly available data sets: PubTabNet (395k samples), FinTabNet (113k samples) and PubTables-1M (about 1M samples). Performance results are presented in Table. 2. It is clearly evident that the model trained on OTSL outperforms HTML across the board, keeping high TEDs and mAP scores even on difficult financial tables (FinTabNet) that contain sparse and large tables."}, {"label": "text", "id": 2, "page_no": 0, "cluster": {"id": 2, "label": "text", "bbox": {"l": 134.765, "t": 617.72205, "r": 480.59857000000005, "b": 666.12, "coord_origin": "TOPLEFT"}, "confidence": 0.9850137829780579, "cells": [{"id": 101, "text": "Additionally, the results show that OTSL has an advantage over HTML", "bbox": {"l": 149.709, "t": 617.72205, "r": 480.59479, "b": 630.255, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "when applied on a bigger data set like PubTables-1M and achieves significantly", "bbox": {"l": 134.765, "t": 629.6770300000001, "r": 480.59857000000005, "b": 642.2099900000001, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "improved scores. Finally, OTSL achieves faster inference due to fewer decoding", "bbox": {"l": 134.765, "t": 641.63203, "r": 480.59384000000006, "b": 654.16499, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "steps which is a result of the reduced sequence representation.", "bbox": {"l": 134.765, "t": 653.58704, "r": 405.7995, "b": 666.12, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Additionally, the results show that OTSL has an advantage over HTML when applied on a bigger data set like PubTables-1M and achieves significantly improved scores. Finally, OTSL achieves faster inference due to fewer decoding steps which is a result of the reduced sequence representation."}], "body": [{"label": "text", "id": 4, "page_no": 0, "cluster": {"id": 4, "label": "text", "bbox": {"l": 134.765, "t": 116.46301000000005, "r": 480.59665, "b": 152.90697999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.9806435108184814, "cells": [{"id": 2, "text": "order to compute the TED score. Inference timing results for all experiments", "bbox": {"l": 134.765, "t": 116.46301000000005, "r": 480.59067, "b": 128.99597000000006, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "were obtained from the same machine on a single core with AMD EPYC 7763", "bbox": {"l": 134.765, "t": 128.41803000000004, "r": 480.59665, "b": 140.95099000000005, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "CPU @2.45 GHz.", "bbox": {"l": 134.765, "t": 140.37401999999997, "r": 210.78761, "b": 152.90697999999998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "order to compute the TED score. Inference timing results for all experiments were obtained from the same machine on a single core with AMD EPYC 7763 CPU @2.45 GHz."}, {"label": "section_header", "id": 7, "page_no": 0, "cluster": {"id": 7, "label": "section_header", "bbox": {"l": 134.765, "t": 166.70514000000003, "r": 318.45145, "b": 179.20818999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9577404260635376, "cells": [{"id": 5, "text": "5.1", "bbox": {"l": 134.765, "t": 166.70514000000003, "r": 149.40306, "b": 179.20818999999995, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Hyper Parameter Optimization", "bbox": {"l": 160.85905, "t": 166.70514000000003, "r": 318.45145, "b": 179.20818999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5.1 Hyper Parameter Optimization"}, {"label": "text", "id": 1, "page_no": 0, "cluster": {"id": 1, "label": "text", "bbox": {"l": 134.765, "t": 183.11505, "r": 480.59567, "b": 255.42400999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9850425124168396, "cells": [{"id": 7, "text": "We have chosen the PubTabNet data set to perform HPO, since it includes a", "bbox": {"l": 134.765, "t": 183.11505, "r": 479.74982000000006, "b": 195.64801, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "highly diverse set of tables. Also we report TED scores separately for simple and", "bbox": {"l": 134.765, "t": 195.07007, "r": 480.58765, "b": 207.60303, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "complex tables (tables with cell spans). Results are presented in Table. 1. It is", "bbox": {"l": 134.765, "t": 207.02502000000004, "r": 480.58859000000007, "b": 219.55798000000004, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "evident that with OTSL, our model achieves the same TED score and slightly", "bbox": {"l": 134.765, "t": 218.98004000000003, "r": 480.59567, "b": 231.51300000000003, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "better mAP scores in comparison to HTML. However OTSL yields a", "bbox": {"l": 134.765, "t": 230.93506000000002, "r": 440.9425, "b": 243.46802000000002, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "2x speed", "bbox": {"l": 444.86800999999997, "t": 230.98486000000003, "r": 480.58792, "b": 243.46802000000002, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "up", "bbox": {"l": 134.765, "t": 242.94086000000004, "r": 145.19585, "b": 255.42400999999995, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "in the inference runtime over HTML.", "bbox": {"l": 149.149, "t": 242.89104999999995, "r": 311.22256, "b": 255.42400999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "We have chosen the PubTabNet data set to perform HPO, since it includes a highly diverse set of tables. Also we report TED scores separately for simple and complex tables (tables with cell spans). Results are presented in Table. 1. It is evident that with OTSL, our model achieves the same TED score and slightly better mAP scores in comparison to HTML. However OTSL yields a 2x speed up in the inference runtime over HTML."}, {"label": "caption", "id": 5, "page_no": 0, "cluster": {"id": 5, "label": "caption", "bbox": {"l": 134.765, "t": 272.79474000000005, "r": 480.59890999999993, "b": 327.98218, "coord_origin": "TOPLEFT"}, "confidence": 0.9591907262802124, "cells": [{"id": 15, "text": "Table", "bbox": {"l": 134.765, "t": 272.79474000000005, "r": 159.22983, "b": 284.1999799999999, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "1.", "bbox": {"l": 167.34442, "t": 272.79474000000005, "r": 174.71301, "b": 284.1999799999999, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "HPO performed in OTSL and HTML representation on the same", "bbox": {"l": 188.133, "t": 272.85748, "r": 480.58101999999997, "b": 284.14618, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "transformer-based TableFormer [9] architecture, trained only on PubTabNet [22]. Ef-", "bbox": {"l": 134.765, "t": 283.81647, "r": 480.59890999999993, "b": 295.10516000000007, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "fects of reducing the # of layers in encoder and decoder stages of the model show that", "bbox": {"l": 134.765, "t": 294.77547999999996, "r": 480.59887999999995, "b": 306.06418, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "smaller models trained on OTSL perform better, especially in recognizing complex", "bbox": {"l": 134.765, "t": 305.73447, "r": 480.59180000000003, "b": 317.02316, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "table structures, and maintain a much higher mAP score than the HTML counterpart.", "bbox": {"l": 134.765, "t": 316.69348, "r": 480.58471999999995, "b": 327.98218, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 1. HPO performed in OTSL and HTML representation on the same transformer-based TableFormer [9] architecture, trained only on PubTabNet [22]. Effects of reducing the # of layers in encoder and decoder stages of the model show that smaller models trained on OTSL perform better, especially in recognizing complex table structures, and maintain a much higher mAP score than the HTML counterpart."}, {"label": "table", "id": 0, "page_no": 0, "cluster": {"id": 0, "label": "table", "bbox": {"l": 139.6674041748047, "t": 337.5453796386719, "r": 475.00927734375, "b": 469.4945373535156, "coord_origin": "TOPLEFT"}, "confidence": 0.9901031255722046, "cells": [{"id": 22, "text": "#", "bbox": {"l": 160.37, "t": 339.45749, "r": 168.04523, "b": 350.74619, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "enc-layers", "bbox": {"l": 144.592, "t": 352.40848, "r": 183.82895, "b": 363.69717, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "#", "bbox": {"l": 207.974, "t": 339.45749, "r": 215.64923000000002, "b": 350.74619, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "dec-layers", "bbox": {"l": 192.19501, "t": 352.40848, "r": 231.42303, "b": 363.69717, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "Language", "bbox": {"l": 239.79799999999997, "t": 344.93649, "r": 278.3338, "b": 356.22519000000005, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "TEDs", "bbox": {"l": 324.67001, "t": 339.45749, "r": 348.26419, "b": 350.74619, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "mAP", "bbox": {"l": 396.271, "t": 339.45749, "r": 417.12595, "b": 350.74619, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "(0.75)", "bbox": {"l": 394.927, "t": 350.41647, "r": 418.46921, "b": 361.70517, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Inference", "bbox": {"l": 430.771, "t": 339.45749, "r": 467.14142000000004, "b": 350.74619, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "time (secs)", "bbox": {"l": 427.14801, "t": 350.41647, "r": 470.76955999999996, "b": 361.70517, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "simple", "bbox": {"l": 286.686, "t": 352.40848, "r": 312.32812, "b": 363.69717, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "complex", "bbox": {"l": 320.702, "t": 352.40848, "r": 353.71539, "b": 363.69717, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "all", "bbox": {"l": 369.306, "t": 352.40848, "r": 379.02914, "b": 363.69717, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "6", "bbox": {"l": 161.90601, "t": 371.23849, "r": 166.51474, "b": 382.52719, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "6", "bbox": {"l": 209.509, "t": 371.23849, "r": 214.11774, "b": 382.52719, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 365.75848, "r": 271.41064, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "0.965", "bbox": {"l": 289.017, "t": 365.75848, "r": 310.00732, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "0.934", "bbox": {"l": 326.71701, "t": 365.75848, "r": 347.70734, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "0.955", "bbox": {"l": 363.67599, "t": 365.75848, "r": 384.66632, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "0.88", "bbox": {"l": 397.26999, "t": 365.69571, "r": 416.12634, "b": 377.10098000000005, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "2.73", "bbox": {"l": 439.52701, "t": 365.69571, "r": 458.38336, "b": 377.10098000000005, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 378.71048, "r": 272.94495, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "0.969", "bbox": {"l": 289.017, "t": 378.71048, "r": 310.00732, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "0.927", "bbox": {"l": 326.71701, "t": 378.71048, "r": 347.70734, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "0.955", "bbox": {"l": 363.67599, "t": 378.71048, "r": 384.66632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "0.857", "bbox": {"l": 396.20599, "t": 378.71048, "r": 417.19632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "5.39", "bbox": {"l": 440.767, "t": 378.71048, "r": 457.15039, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "4", "bbox": {"l": 161.90601, "t": 397.53949, "r": 166.51474, "b": 408.82819, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "4", "bbox": {"l": 209.509, "t": 397.53949, "r": 214.11774, "b": 408.82819, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 392.06049, "r": 271.41064, "b": 403.34918, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "0.938", "bbox": {"l": 289.017, "t": 392.06049, "r": 310.00732, "b": 403.34918, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "0.904", "bbox": {"l": 326.71701, "t": 392.06049, "r": 347.70734, "b": 403.34918, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "0.927", "bbox": {"l": 363.67599, "t": 392.06049, "r": 384.66632, "b": 403.34918, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "0.853", "bbox": {"l": 394.61801, "t": 391.99771, "r": 418.77798, "b": 403.40298, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "1.97", "bbox": {"l": 439.52701, "t": 391.99771, "r": 458.38336, "b": 403.40298, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 405.01147, "r": 272.94495, "b": 416.30017, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "0.952", "bbox": {"l": 289.017, "t": 405.01147, "r": 310.00732, "b": 416.30017, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "0.909", "bbox": {"l": 326.71701, "t": 405.01147, "r": 347.70734, "b": 416.30017, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "0.938", "bbox": {"l": 362.08801, "t": 404.9486999999999, "r": 386.24799, "b": 416.35397, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "0.843", "bbox": {"l": 396.20599, "t": 405.01147, "r": 417.19632, "b": 416.30017, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "3.77", "bbox": {"l": 440.767, "t": 405.01147, "r": 457.15039, "b": 416.30017, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "2", "bbox": {"l": 161.90601, "t": 423.84048, "r": 166.51474, "b": 435.12918, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "4", "bbox": {"l": 209.509, "t": 423.84048, "r": 214.11774, "b": 435.12918, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 418.3614799999999, "r": 271.41064, "b": 429.65018, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "0.923", "bbox": {"l": 289.017, "t": 418.3614799999999, "r": 310.00732, "b": 429.65018, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "0.897", "bbox": {"l": 326.71701, "t": 418.3614799999999, "r": 347.70734, "b": 429.65018, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "0.915", "bbox": {"l": 363.67599, "t": 418.3614799999999, "r": 384.66632, "b": 429.65018, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "0.859", "bbox": {"l": 394.61801, "t": 418.29871, "r": 418.77798, "b": 429.70398, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "1.91", "bbox": {"l": 439.52701, "t": 418.29871, "r": 458.38336, "b": 429.70398, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 431.31246999999996, "r": 272.94495, "b": 442.60117, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "0.945", "bbox": {"l": 289.017, "t": 431.31246999999996, "r": 310.00732, "b": 442.60117, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "0.901", "bbox": {"l": 326.71701, "t": 431.31246999999996, "r": 347.70734, "b": 442.60117, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "0.931", "bbox": {"l": 362.08801, "t": 431.24969, "r": 386.24799, "b": 442.65497, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "0.834", "bbox": {"l": 396.20599, "t": 431.31246999999996, "r": 417.19632, "b": 442.60117, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "3.81", "bbox": {"l": 440.767, "t": 431.31246999999996, "r": 457.15039, "b": 442.60117, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "4", "bbox": {"l": 161.90601, "t": 450.14248999999995, "r": 166.51474, "b": 461.43118, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "2", "bbox": {"l": 209.509, "t": 450.14248999999995, "r": 214.11774, "b": 461.43118, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 444.66248, "r": 271.41064, "b": 455.95117, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "0.952", "bbox": {"l": 289.017, "t": 444.66248, "r": 310.00732, "b": 455.95117, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "0.92", "bbox": {"l": 329.021, "t": 444.66248, "r": 345.40439, "b": 455.95117, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "0.942", "bbox": {"l": 362.08801, "t": 444.5996999999999, "r": 386.24799, "b": 456.00497, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "0.857", "bbox": {"l": 394.61801, "t": 444.5996999999999, "r": 418.77798, "b": 456.00497, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "1.22", "bbox": {"l": 439.52701, "t": 444.5996999999999, "r": 458.38336, "b": 456.00497, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 457.61447, "r": 272.94495, "b": 468.90317, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "0.944", "bbox": {"l": 289.017, "t": 457.61447, "r": 310.00732, "b": 468.90317, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "0.903", "bbox": {"l": 326.71701, "t": 457.61447, "r": 347.70734, "b": 468.90317, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "0.931", "bbox": {"l": 363.67599, "t": 457.61447, "r": 384.66632, "b": 468.90317, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "0.824", "bbox": {"l": 396.20599, "t": 457.61447, "r": 417.19632, "b": 468.90317, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "2", "bbox": {"l": 446.65302, "t": 457.61447, "r": 451.26175, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": [{"id": 10, "label": "text", "bbox": {"l": 160.37, "t": 339.45749, "r": 168.04523, "b": 350.74619, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "#", "bbox": {"l": 160.37, "t": 339.45749, "r": 168.04523, "b": 350.74619, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 144.592, "t": 352.40848, "r": 183.82895, "b": 363.69717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "enc-layers", "bbox": {"l": 144.592, "t": 352.40848, "r": 183.82895, "b": 363.69717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 207.974, "t": 339.45749, "r": 215.64923000000002, "b": 350.74619, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "#", "bbox": {"l": 207.974, "t": 339.45749, "r": 215.64923000000002, "b": 350.74619, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 192.19501, "t": 352.40848, "r": 231.42303, "b": 363.69717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "dec-layers", "bbox": {"l": 192.19501, "t": 352.40848, "r": 231.42303, "b": 363.69717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 239.79799999999997, "t": 344.93649, "r": 278.3338, "b": 356.22519000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "Language", "bbox": {"l": 239.79799999999997, "t": 344.93649, "r": 278.3338, "b": 356.22519000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 324.67001, "t": 339.45749, "r": 348.26419, "b": 350.74619, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "TEDs", "bbox": {"l": 324.67001, "t": 339.45749, "r": 348.26419, "b": 350.74619, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 396.271, "t": 339.45749, "r": 417.12595, "b": 350.74619, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "mAP", "bbox": {"l": 396.271, "t": 339.45749, "r": 417.12595, "b": 350.74619, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 394.927, "t": 350.41647, "r": 418.46921, "b": 361.70517, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "(0.75)", "bbox": {"l": 394.927, "t": 350.41647, "r": 418.46921, "b": 361.70517, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 430.771, "t": 339.45749, "r": 467.14142000000004, "b": 350.74619, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "Inference", "bbox": {"l": 430.771, "t": 339.45749, "r": 467.14142000000004, "b": 350.74619, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 427.14801, "t": 350.41647, "r": 470.76955999999996, "b": 361.70517, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "time (secs)", "bbox": {"l": 427.14801, "t": 350.41647, "r": 470.76955999999996, "b": 361.70517, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 286.686, "t": 352.40848, "r": 312.32812, "b": 363.69717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "simple", "bbox": {"l": 286.686, "t": 352.40848, "r": 312.32812, "b": 363.69717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 320.702, "t": 352.40848, "r": 353.71539, "b": 363.69717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "complex", "bbox": {"l": 320.702, "t": 352.40848, "r": 353.71539, "b": 363.69717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 369.306, "t": 352.40848, "r": 379.02914, "b": 363.69717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "all", "bbox": {"l": 369.306, "t": 352.40848, "r": 379.02914, "b": 363.69717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 161.90601, "t": 371.23849, "r": 166.51474, "b": 382.52719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "6", "bbox": {"l": 161.90601, "t": 371.23849, "r": 166.51474, "b": 382.52719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 209.509, "t": 371.23849, "r": 214.11774, "b": 382.52719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "6", "bbox": {"l": 209.509, "t": 371.23849, "r": 214.11774, "b": 382.52719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 246.71000999999998, "t": 365.75848, "r": 271.41064, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 365.75848, "r": 271.41064, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 289.017, "t": 365.75848, "r": 310.00732, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "0.965", "bbox": {"l": 289.017, "t": 365.75848, "r": 310.00732, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 326.71701, "t": 365.75848, "r": 347.70734, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "0.934", "bbox": {"l": 326.71701, "t": 365.75848, "r": 347.70734, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 363.67599, "t": 365.75848, "r": 384.66632, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "0.955", "bbox": {"l": 363.67599, "t": 365.75848, "r": 384.66632, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 397.26999, "t": 365.69571, "r": 416.12634, "b": 377.10098000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "0.88", "bbox": {"l": 397.26999, "t": 365.69571, "r": 416.12634, "b": 377.10098000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 439.52701, "t": 365.69571, "r": 458.38336, "b": 377.10098000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "2.73", "bbox": {"l": 439.52701, "t": 365.69571, "r": 458.38336, "b": 377.10098000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 245.17598999999998, "t": 378.71048, "r": 272.94495, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 378.71048, "r": 272.94495, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 289.017, "t": 378.71048, "r": 310.00732, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "0.969", "bbox": {"l": 289.017, "t": 378.71048, "r": 310.00732, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 326.71701, "t": 378.71048, "r": 347.70734, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "0.927", "bbox": {"l": 326.71701, "t": 378.71048, "r": 347.70734, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 363.67599, "t": 378.71048, "r": 384.66632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "0.955", "bbox": {"l": 363.67599, "t": 378.71048, "r": 384.66632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 396.20599, "t": 378.71048, "r": 417.19632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "0.857", "bbox": {"l": 396.20599, "t": 378.71048, "r": 417.19632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 440.767, "t": 378.71048, "r": 457.15039, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "5.39", "bbox": {"l": 440.767, "t": 378.71048, "r": 457.15039, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 161.90601, "t": 397.53949, "r": 166.51474, "b": 408.82819, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "4", "bbox": {"l": 161.90601, "t": 397.53949, "r": 166.51474, "b": 408.82819, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 209.509, "t": 397.53949, "r": 214.11774, "b": 408.82819, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "4", "bbox": {"l": 209.509, "t": 397.53949, "r": 214.11774, "b": 408.82819, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 246.71000999999998, "t": 392.06049, "r": 271.41064, "b": 403.34918, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 392.06049, "r": 271.41064, "b": 403.34918, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 289.017, "t": 392.06049, "r": 310.00732, "b": 403.34918, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "0.938", "bbox": {"l": 289.017, "t": 392.06049, "r": 310.00732, "b": 403.34918, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 326.71701, "t": 392.06049, "r": 347.70734, "b": 403.34918, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "0.904", "bbox": {"l": 326.71701, "t": 392.06049, "r": 347.70734, "b": 403.34918, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 363.67599, "t": 392.06049, "r": 384.66632, "b": 403.34918, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "0.927", "bbox": {"l": 363.67599, "t": 392.06049, "r": 384.66632, "b": 403.34918, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 394.61801, "t": 391.99771, "r": 418.77798, "b": 403.40298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "0.853", "bbox": {"l": 394.61801, "t": 391.99771, "r": 418.77798, "b": 403.40298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 439.52701, "t": 391.99771, "r": 458.38336, "b": 403.40298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "1.97", "bbox": {"l": 439.52701, "t": 391.99771, "r": 458.38336, "b": 403.40298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 245.17598999999998, "t": 405.01147, "r": 272.94495, "b": 416.30017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 405.01147, "r": 272.94495, "b": 416.30017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 289.017, "t": 405.01147, "r": 310.00732, "b": 416.30017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "0.952", "bbox": {"l": 289.017, "t": 405.01147, "r": 310.00732, "b": 416.30017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 326.71701, "t": 405.01147, "r": 347.70734, "b": 416.30017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "0.909", "bbox": {"l": 326.71701, "t": 405.01147, "r": 347.70734, "b": 416.30017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 362.08801, "t": 404.9486999999999, "r": 386.24799, "b": 416.35397, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "0.938", "bbox": {"l": 362.08801, "t": 404.9486999999999, "r": 386.24799, "b": 416.35397, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 396.20599, "t": 405.01147, "r": 417.19632, "b": 416.30017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "0.843", "bbox": {"l": 396.20599, "t": 405.01147, "r": 417.19632, "b": 416.30017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 440.767, "t": 405.01147, "r": 457.15039, "b": 416.30017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "3.77", "bbox": {"l": 440.767, "t": 405.01147, "r": 457.15039, "b": 416.30017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 161.90601, "t": 423.84048, "r": 166.51474, "b": 435.12918, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "2", "bbox": {"l": 161.90601, "t": 423.84048, "r": 166.51474, "b": 435.12918, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 209.509, "t": 423.84048, "r": 214.11774, "b": 435.12918, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "4", "bbox": {"l": 209.509, "t": 423.84048, "r": 214.11774, "b": 435.12918, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 246.71000999999998, "t": 418.3614799999999, "r": 271.41064, "b": 429.65018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 418.3614799999999, "r": 271.41064, "b": 429.65018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 289.017, "t": 418.3614799999999, "r": 310.00732, "b": 429.65018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "0.923", "bbox": {"l": 289.017, "t": 418.3614799999999, "r": 310.00732, "b": 429.65018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 326.71701, "t": 418.3614799999999, "r": 347.70734, "b": 429.65018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "0.897", "bbox": {"l": 326.71701, "t": 418.3614799999999, "r": 347.70734, "b": 429.65018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 363.67599, "t": 418.3614799999999, "r": 384.66632, "b": 429.65018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "0.915", "bbox": {"l": 363.67599, "t": 418.3614799999999, "r": 384.66632, "b": 429.65018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 394.61801, "t": 418.29871, "r": 418.77798, "b": 429.70398, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "0.859", "bbox": {"l": 394.61801, "t": 418.29871, "r": 418.77798, "b": 429.70398, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 439.52701, "t": 418.29871, "r": 458.38336, "b": 429.70398, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "1.91", "bbox": {"l": 439.52701, "t": 418.29871, "r": 458.38336, "b": 429.70398, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 245.17598999999998, "t": 431.31246999999996, "r": 272.94495, "b": 442.60117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 431.31246999999996, "r": 272.94495, "b": 442.60117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 289.017, "t": 431.31246999999996, "r": 310.00732, "b": 442.60117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "0.945", "bbox": {"l": 289.017, "t": 431.31246999999996, "r": 310.00732, "b": 442.60117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 326.71701, "t": 431.31246999999996, "r": 347.70734, "b": 442.60117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "0.901", "bbox": {"l": 326.71701, "t": 431.31246999999996, "r": 347.70734, "b": 442.60117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 362.08801, "t": 431.24969, "r": 386.24799, "b": 442.65497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "0.931", "bbox": {"l": 362.08801, "t": 431.24969, "r": 386.24799, "b": 442.65497, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 396.20599, "t": 431.31246999999996, "r": 417.19632, "b": 442.60117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "0.834", "bbox": {"l": 396.20599, "t": 431.31246999999996, "r": 417.19632, "b": 442.60117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 440.767, "t": 431.31246999999996, "r": 457.15039, "b": 442.60117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "3.81", "bbox": {"l": 440.767, "t": 431.31246999999996, "r": 457.15039, "b": 442.60117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 161.90601, "t": 450.14248999999995, "r": 166.51474, "b": 461.43118, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "4", "bbox": {"l": 161.90601, "t": 450.14248999999995, "r": 166.51474, "b": 461.43118, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 209.509, "t": 450.14248999999995, "r": 214.11774, "b": 461.43118, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "2", "bbox": {"l": 209.509, "t": 450.14248999999995, "r": 214.11774, "b": 461.43118, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 246.71000999999998, "t": 444.66248, "r": 271.41064, "b": 455.95117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 444.66248, "r": 271.41064, "b": 455.95117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 289.017, "t": 444.66248, "r": 310.00732, "b": 455.95117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "0.952", "bbox": {"l": 289.017, "t": 444.66248, "r": 310.00732, "b": 455.95117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 329.021, "t": 444.66248, "r": 345.40439, "b": 455.95117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "0.92", "bbox": {"l": 329.021, "t": 444.66248, "r": 345.40439, "b": 455.95117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 362.08801, "t": 444.5996999999999, "r": 386.24799, "b": 456.00497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "0.942", "bbox": {"l": 362.08801, "t": 444.5996999999999, "r": 386.24799, "b": 456.00497, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 394.61801, "t": 444.5996999999999, "r": 418.77798, "b": 456.00497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "0.857", "bbox": {"l": 394.61801, "t": 444.5996999999999, "r": 418.77798, "b": 456.00497, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 439.52701, "t": 444.5996999999999, "r": 458.38336, "b": 456.00497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "1.22", "bbox": {"l": 439.52701, "t": 444.5996999999999, "r": 458.38336, "b": 456.00497, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 245.17598999999998, "t": 457.61447, "r": 272.94495, "b": 468.90317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 457.61447, "r": 272.94495, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 289.017, "t": 457.61447, "r": 310.00732, "b": 468.90317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "0.944", "bbox": {"l": 289.017, "t": 457.61447, "r": 310.00732, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 326.71701, "t": 457.61447, "r": 347.70734, "b": 468.90317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "0.903", "bbox": {"l": 326.71701, "t": 457.61447, "r": 347.70734, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 363.67599, "t": 457.61447, "r": 384.66632, "b": 468.90317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "0.931", "bbox": {"l": 363.67599, "t": 457.61447, "r": 384.66632, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 396.20599, "t": 457.61447, "r": 417.19632, "b": 468.90317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "0.824", "bbox": {"l": 396.20599, "t": 457.61447, "r": 417.19632, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 446.65302, "t": 457.61447, "r": 451.26175, "b": 468.90317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "2", "bbox": {"l": 446.65302, "t": 457.61447, "r": 451.26175, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "lcel", "lcel", "ched", "ched", "nl", "ched", "ched", "ucel", "ched", "ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 7, "num_cols": 8, "table_cells": [{"bbox": {"l": 160.37, "t": 339.45749, "r": 168.04523, "b": 350.74619, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "#", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 144.592, "t": 352.40848, "r": 183.82895, "b": 363.69717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "enc-layers", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 207.974, "t": 339.45749, "r": 215.64923000000002, "b": 350.74619, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "#", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 192.19501, "t": 352.40848, "r": 231.42303, "b": 363.69717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "dec-layers", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 239.79799999999997, "t": 344.93649, "r": 278.3338, "b": 356.22519000000005, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Language", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 324.67001, "t": 339.45749, "r": 348.26419, "b": 350.74619, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 3, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 6, "text": "TEDs", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 396.271, "t": 339.45749, "r": 417.12595, "b": 350.74619, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "mAP", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 394.927, "t": 350.41647, "r": 418.46921, "b": 361.70517, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "(0.75)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 430.771, "t": 339.45749, "r": 467.14142000000004, "b": 350.74619, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "Inference", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 427.14801, "t": 350.41647, "r": 470.76955999999996, "b": 361.70517, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "time (secs)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 286.686, "t": 352.40848, "r": 312.32812, "b": 363.69717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "simple", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 320.702, "t": 352.40848, "r": 353.71539, "b": 363.69717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "complex", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 369.306, "t": 352.40848, "r": 379.02914, "b": 363.69717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "all", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 161.90601, "t": 371.23849, "r": 166.51474, "b": 382.52719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 371.23849, "r": 214.11774, "b": 382.52719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 365.75848, "r": 272.94495, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 365.75848, "r": 310.00732, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.965 0.969", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 365.75848, "r": 347.70734, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.934 0.927", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 363.67599, "t": 365.75848, "r": 384.66632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.955 0.955", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 396.20599, "t": 365.69571, "r": 417.19632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.88 0.857", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 365.69571, "r": 458.38336, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "2.73 5.39", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 161.90601, "t": 397.53949, "r": 166.51474, "b": 408.82819, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 397.53949, "r": 214.11774, "b": 408.82819, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 392.06049, "r": 272.94495, "b": 416.30017, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 392.06049, "r": 310.00732, "b": 403.34918, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.938", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 392.06049, "r": 347.70734, "b": 403.34918, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.904", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 363.67599, "t": 392.06049, "r": 384.66632, "b": 403.34918, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.927", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.61801, "t": 391.99771, "r": 418.77798, "b": 403.40298, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.853", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 391.99771, "r": 458.38336, "b": 403.40298, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "1.97", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 405.01147, "r": 310.00732, "b": 429.65018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.952 0.923", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 405.01147, "r": 347.70734, "b": 416.30017, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.909", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 362.08801, "t": 404.9486999999999, "r": 386.24799, "b": 416.35397, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.938", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 396.20599, "t": 405.01147, "r": 417.19632, "b": 416.30017, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.843", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.767, "t": 405.01147, "r": 457.15039, "b": 416.30017, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "3.77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 161.90601, "t": 423.84048, "r": 166.51474, "b": 435.12918, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 423.84048, "r": 214.11774, "b": 435.12918, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 246.71000999999998, "t": 418.3614799999999, "r": 271.41064, "b": 429.65018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 418.3614799999999, "r": 347.70734, "b": 442.60117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.897 0.901", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 362.08801, "t": 418.3614799999999, "r": 386.24799, "b": 442.65497, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.915 0.931", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.61801, "t": 418.29871, "r": 418.77798, "b": 442.60117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.859 0.834", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 418.29871, "r": 458.38336, "b": 442.60117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "1.91 3.81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 431.31246999999996, "r": 272.94495, "b": 442.60117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 431.31246999999996, "r": 310.00732, "b": 442.60117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.945", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 161.90601, "t": 450.14248999999995, "r": 166.51474, "b": 461.43118, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 450.14248999999995, "r": 214.11774, "b": 461.43118, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 444.66248, "r": 272.94495, "b": 468.90317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 444.66248, "r": 310.00732, "b": 468.90317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.952 0.944", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 444.66248, "r": 347.70734, "b": 468.90317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.92 0.903", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 362.08801, "t": 444.5996999999999, "r": 386.24799, "b": 468.90317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.942 0.931", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.61801, "t": 444.5996999999999, "r": 418.77798, "b": 468.90317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.857 0.824", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 444.5996999999999, "r": 458.38336, "b": 468.90317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "1.22 2", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "section_header", "id": 6, "page_no": 0, "cluster": {"id": 6, "label": "section_header", "bbox": {"l": 134.765, "t": 505.67111, "r": 264.40829, "b": 518.17419, "coord_origin": "TOPLEFT"}, "confidence": 0.9589295387268066, "cells": [{"id": 91, "text": "5.2", "bbox": {"l": 134.765, "t": 505.67111, "r": 149.40306, "b": 518.17419, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Quantitative Results", "bbox": {"l": 160.85905, "t": 505.67111, "r": 264.40829, "b": 518.17419, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5.2 Quantitative Results"}, {"label": "text", "id": 3, "page_no": 0, "cluster": {"id": 3, "label": "text", "bbox": {"l": 134.765, "t": 522.08005, "r": 480.72003, "b": 618.3, "coord_origin": "TOPLEFT"}, "confidence": 0.9849976301193237, "cells": [{"id": 93, "text": "We picked the model parameter configuration that produced the best prediction", "bbox": {"l": 134.765, "t": 522.08005, "r": 479.72983, "b": 534.61301, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "quality (enc=6, dec=6, heads=8) with PubTabNet alone, then independently", "bbox": {"l": 134.765, "t": 534.03604, "r": 480.5897499999999, "b": 546.569, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "trained and evaluated it on three publicly available data sets: PubTabNet (395k", "bbox": {"l": 134.765, "t": 545.99104, "r": 480.72003, "b": 558.524, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "samples), FinTabNet (113k samples) and PubTables-1M (about 1M samples).", "bbox": {"l": 134.765, "t": 557.94604, "r": 480.60577, "b": 570.479, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "Performance results are presented in Table. 2. It is clearly evident that the model", "bbox": {"l": 134.765, "t": 569.90103, "r": 480.5936899999999, "b": 582.43399, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "trained on OTSL outperforms HTML across the board, keeping high TEDs and", "bbox": {"l": 134.765, "t": 581.85603, "r": 480.59158, "b": 594.38899, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "mAP scores even on difficult financial tables (FinTabNet) that contain sparse", "bbox": {"l": 134.765, "t": 593.81204, "r": 480.58080999999993, "b": 606.345, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "and large tables.", "bbox": {"l": 134.765, "t": 605.76704, "r": 206.79959, "b": 618.3, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "We picked the model parameter configuration that produced the best prediction quality (enc=6, dec=6, heads=8) with PubTabNet alone, then independently trained and evaluated it on three publicly available data sets: PubTabNet (395k samples), FinTabNet (113k samples) and PubTables-1M (about 1M samples). Performance results are presented in Table. 2. It is clearly evident that the model trained on OTSL outperforms HTML across the board, keeping high TEDs and mAP scores even on difficult financial tables (FinTabNet) that contain sparse and large tables."}, {"label": "text", "id": 2, "page_no": 0, "cluster": {"id": 2, "label": "text", "bbox": {"l": 134.765, "t": 617.72205, "r": 480.59857000000005, "b": 666.12, "coord_origin": "TOPLEFT"}, "confidence": 0.9850137829780579, "cells": [{"id": 101, "text": "Additionally, the results show that OTSL has an advantage over HTML", "bbox": {"l": 149.709, "t": 617.72205, "r": 480.59479, "b": 630.255, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "when applied on a bigger data set like PubTables-1M and achieves significantly", "bbox": {"l": 134.765, "t": 629.6770300000001, "r": 480.59857000000005, "b": 642.2099900000001, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "improved scores. Finally, OTSL achieves faster inference due to fewer decoding", "bbox": {"l": 134.765, "t": 641.63203, "r": 480.59384000000006, "b": 654.16499, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "steps which is a result of the reduced sequence representation.", "bbox": {"l": 134.765, "t": 653.58704, "r": 405.7995, "b": 666.12, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Additionally, the results show that OTSL has an advantage over HTML when applied on a bigger data set like PubTables-1M and achieves significantly improved scores. Finally, OTSL achieves faster inference due to fewer decoding steps which is a result of the reduced sequence representation."}], "headers": [{"label": "page_header", "id": 8, "page_no": 0, "cluster": {"id": 8, "label": "page_header", "bbox": {"l": 194.478, "t": 91.49352999999996, "r": 447.54476999999997, "b": 102.78223000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9373533129692078, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 91.49352999999996, "r": 447.54476999999997, "b": 102.78223000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Optimized Table Tokenization for Table Structure Recognition"}, {"label": "page_header", "id": 9, "page_no": 0, "cluster": {"id": 9, "label": "page_header", "bbox": {"l": 475.98441, "t": 91.49352999999996, "r": 480.59314, "b": 102.78223000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.8858679533004761, "cells": [{"id": 1, "text": "9", "bbox": {"l": 475.98441, "t": 91.49352999999996, "r": 480.59314, "b": 102.78223000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "9"}]}}]
\ No newline at end of file
+[{"page_no": 0, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 91.49352999999996, "r": 447.54476999999997, "b": 102.78223000000003, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "9", "bbox": {"l": 475.98441, "t": 91.49352999999996, "r": 480.59314, "b": 102.78223000000003, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "order to compute the TED score. Inference timing results for all experiments", "bbox": {"l": 134.765, "t": 116.46301000000005, "r": 480.59067, "b": 128.99597000000006, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "were obtained from the same machine on a single core with AMD EPYC 7763", "bbox": {"l": 134.765, "t": 128.41803000000004, "r": 480.59665, "b": 140.95099000000005, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "CPU @2.45 GHz.", "bbox": {"l": 134.765, "t": 140.37401999999997, "r": 210.78761, "b": 152.90697999999998, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "5.1", "bbox": {"l": 134.765, "t": 166.70514000000003, "r": 149.40306, "b": 179.20818999999995, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Hyper Parameter Optimization", "bbox": {"l": 160.85905, "t": 166.70514000000003, "r": 318.45145, "b": 179.20818999999995, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "We have chosen the PubTabNet data set to perform HPO, since it includes a", "bbox": {"l": 134.765, "t": 183.11505, "r": 479.74982000000006, "b": 195.64801, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "highly diverse set of tables. Also we report TED scores separately for simple and", "bbox": {"l": 134.765, "t": 195.07007, "r": 480.58765, "b": 207.60303, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "complex tables (tables with cell spans). Results are presented in Table. 1. It is", "bbox": {"l": 134.765, "t": 207.02502000000004, "r": 480.58859000000007, "b": 219.55798000000004, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "evident that with OTSL, our model achieves the same TED score and slightly", "bbox": {"l": 134.765, "t": 218.98004000000003, "r": 480.59567, "b": 231.51300000000003, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "better mAP scores in comparison to HTML. However OTSL yields a", "bbox": {"l": 134.765, "t": 230.93506000000002, "r": 440.9425, "b": 243.46802000000002, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "2x speed", "bbox": {"l": 444.86800999999997, "t": 230.98486000000003, "r": 480.58792, "b": 243.46802000000002, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "up", "bbox": {"l": 134.765, "t": 242.94086000000004, "r": 145.19585, "b": 255.42400999999995, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "in the inference runtime over HTML.", "bbox": {"l": 149.149, "t": 242.89104999999995, "r": 311.22256, "b": 255.42400999999995, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Table", "bbox": {"l": 134.765, "t": 272.79474000000005, "r": 159.22983, "b": 284.1999799999999, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "1.", "bbox": {"l": 167.34442, "t": 272.79474000000005, "r": 174.71301, "b": 284.1999799999999, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "HPO performed in OTSL and HTML representation on the same", "bbox": {"l": 188.133, "t": 272.85748, "r": 480.58101999999997, "b": 284.14618, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "transformer-based TableFormer [9] architecture, trained only on PubTabNet [22]. Ef-", "bbox": {"l": 134.765, "t": 283.81647, "r": 480.59890999999993, "b": 295.10516000000007, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "fects of reducing the # of layers in encoder and decoder stages of the model show that", "bbox": {"l": 134.765, "t": 294.77547999999996, "r": 480.59887999999995, "b": 306.06418, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "smaller models trained on OTSL perform better, especially in recognizing complex", "bbox": {"l": 134.765, "t": 305.73447, "r": 480.59180000000003, "b": 317.02316, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "table structures, and maintain a much higher mAP score than the HTML counterpart.", "bbox": {"l": 134.765, "t": 316.69348, "r": 480.58471999999995, "b": 327.98218, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "#", "bbox": {"l": 160.37, "t": 339.45749, "r": 168.04523, "b": 350.74619, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "enc-layers", "bbox": {"l": 144.592, "t": 352.40848, "r": 183.82895, "b": 363.69717, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "#", "bbox": {"l": 207.974, "t": 339.45749, "r": 215.64923000000002, "b": 350.74619, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "dec-layers", "bbox": {"l": 192.19501, "t": 352.40848, "r": 231.42303, "b": 363.69717, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "Language", "bbox": {"l": 239.79799999999997, "t": 344.93649, "r": 278.3338, "b": 356.22519000000005, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "TEDs", "bbox": {"l": 324.67001, "t": 339.45749, "r": 348.26419, "b": 350.74619, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "mAP", "bbox": {"l": 396.271, "t": 339.45749, "r": 417.12595, "b": 350.74619, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "(0.75)", "bbox": {"l": 394.927, "t": 350.41647, "r": 418.46921, "b": 361.70517, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Inference", "bbox": {"l": 430.771, "t": 339.45749, "r": 467.14142000000004, "b": 350.74619, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "time (secs)", "bbox": {"l": 427.14801, "t": 350.41647, "r": 470.76955999999996, "b": 361.70517, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "simple", "bbox": {"l": 286.686, "t": 352.40848, "r": 312.32812, "b": 363.69717, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "complex", "bbox": {"l": 320.702, "t": 352.40848, "r": 353.71539, "b": 363.69717, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "all", "bbox": {"l": 369.306, "t": 352.40848, "r": 379.02914, "b": 363.69717, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "6", "bbox": {"l": 161.90601, "t": 371.23849, "r": 166.51474, "b": 382.52719, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "6", "bbox": {"l": 209.509, "t": 371.23849, "r": 214.11774, "b": 382.52719, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 365.75848, "r": 271.41064, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "0.965", "bbox": {"l": 289.017, "t": 365.75848, "r": 310.00732, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "0.934", "bbox": {"l": 326.71701, "t": 365.75848, "r": 347.70734, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "0.955", "bbox": {"l": 363.67599, "t": 365.75848, "r": 384.66632, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "0.88", "bbox": {"l": 397.26999, "t": 365.69571, "r": 416.12634, "b": 377.10098000000005, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "2.73", "bbox": {"l": 439.52701, "t": 365.69571, "r": 458.38336, "b": 377.10098000000005, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 378.71048, "r": 272.94495, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "0.969", "bbox": {"l": 289.017, "t": 378.71048, "r": 310.00732, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "0.927", "bbox": {"l": 326.71701, "t": 378.71048, "r": 347.70734, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "0.955", "bbox": {"l": 363.67599, "t": 378.71048, "r": 384.66632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "0.857", "bbox": {"l": 396.20599, "t": 378.71048, "r": 417.19632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "5.39", "bbox": {"l": 440.767, "t": 378.71048, "r": 457.15039, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "4", "bbox": {"l": 161.90601, "t": 397.53949, "r": 166.51474, "b": 408.82819, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "4", "bbox": {"l": 209.509, "t": 397.53949, "r": 214.11774, "b": 408.82819, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 392.06049, "r": 271.41064, "b": 403.34918, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "0.938", "bbox": {"l": 289.017, "t": 392.06049, "r": 310.00732, "b": 403.34918, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "0.904", "bbox": {"l": 326.71701, "t": 392.06049, "r": 347.70734, "b": 403.34918, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "0.927", "bbox": {"l": 363.67599, "t": 392.06049, "r": 384.66632, "b": 403.34918, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "0.853", "bbox": {"l": 394.61801, "t": 391.99771, "r": 418.77798, "b": 403.40298, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "1.97", "bbox": {"l": 439.52701, "t": 391.99771, "r": 458.38336, "b": 403.40298, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 405.01147, "r": 272.94495, "b": 416.30017, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "0.952", "bbox": {"l": 289.017, "t": 405.01147, "r": 310.00732, "b": 416.30017, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "0.909", "bbox": {"l": 326.71701, "t": 405.01147, "r": 347.70734, "b": 416.30017, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "0.938", "bbox": {"l": 362.08801, "t": 404.9486999999999, "r": 386.24799, "b": 416.35397, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "0.843", "bbox": {"l": 396.20599, "t": 405.01147, "r": 417.19632, "b": 416.30017, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "3.77", "bbox": {"l": 440.767, "t": 405.01147, "r": 457.15039, "b": 416.30017, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "2", "bbox": {"l": 161.90601, "t": 423.84048, "r": 166.51474, "b": 435.12918, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "4", "bbox": {"l": 209.509, "t": 423.84048, "r": 214.11774, "b": 435.12918, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 418.3614799999999, "r": 271.41064, "b": 429.65018, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "0.923", "bbox": {"l": 289.017, "t": 418.3614799999999, "r": 310.00732, "b": 429.65018, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "0.897", "bbox": {"l": 326.71701, "t": 418.3614799999999, "r": 347.70734, "b": 429.65018, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "0.915", "bbox": {"l": 363.67599, "t": 418.3614799999999, "r": 384.66632, "b": 429.65018, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "0.859", "bbox": {"l": 394.61801, "t": 418.29871, "r": 418.77798, "b": 429.70398, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "1.91", "bbox": {"l": 439.52701, "t": 418.29871, "r": 458.38336, "b": 429.70398, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 431.31246999999996, "r": 272.94495, "b": 442.60117, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "0.945", "bbox": {"l": 289.017, "t": 431.31246999999996, "r": 310.00732, "b": 442.60117, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "0.901", "bbox": {"l": 326.71701, "t": 431.31246999999996, "r": 347.70734, "b": 442.60117, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "0.931", "bbox": {"l": 362.08801, "t": 431.24969, "r": 386.24799, "b": 442.65497, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "0.834", "bbox": {"l": 396.20599, "t": 431.31246999999996, "r": 417.19632, "b": 442.60117, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "3.81", "bbox": {"l": 440.767, "t": 431.31246999999996, "r": 457.15039, "b": 442.60117, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "4", "bbox": {"l": 161.90601, "t": 450.14248999999995, "r": 166.51474, "b": 461.43118, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "2", "bbox": {"l": 209.509, "t": 450.14248999999995, "r": 214.11774, "b": 461.43118, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 444.66248, "r": 271.41064, "b": 455.95117, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "0.952", "bbox": {"l": 289.017, "t": 444.66248, "r": 310.00732, "b": 455.95117, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "0.92", "bbox": {"l": 329.021, "t": 444.66248, "r": 345.40439, "b": 455.95117, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "0.942", "bbox": {"l": 362.08801, "t": 444.5996999999999, "r": 386.24799, "b": 456.00497, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "0.857", "bbox": {"l": 394.61801, "t": 444.5996999999999, "r": 418.77798, "b": 456.00497, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "1.22", "bbox": {"l": 439.52701, "t": 444.5996999999999, "r": 458.38336, "b": 456.00497, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 457.61447, "r": 272.94495, "b": 468.90317, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "0.944", "bbox": {"l": 289.017, "t": 457.61447, "r": 310.00732, "b": 468.90317, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "0.903", "bbox": {"l": 326.71701, "t": 457.61447, "r": 347.70734, "b": 468.90317, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "0.931", "bbox": {"l": 363.67599, "t": 457.61447, "r": 384.66632, "b": 468.90317, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "0.824", "bbox": {"l": 396.20599, "t": 457.61447, "r": 417.19632, "b": 468.90317, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "2", "bbox": {"l": 446.65302, "t": 457.61447, "r": 451.26175, "b": 468.90317, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "5.2", "bbox": {"l": 134.765, "t": 505.67111, "r": 149.40306, "b": 518.17419, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Quantitative Results", "bbox": {"l": 160.85905, "t": 505.67111, "r": 264.40829, "b": 518.17419, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "We picked the model parameter configuration that produced the best prediction", "bbox": {"l": 134.765, "t": 522.08005, "r": 479.72983, "b": 534.61301, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "quality (enc=6, dec=6, heads=8) with PubTabNet alone, then independently", "bbox": {"l": 134.765, "t": 534.03604, "r": 480.5897499999999, "b": 546.569, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "trained and evaluated it on three publicly available data sets: PubTabNet (395k", "bbox": {"l": 134.765, "t": 545.99104, "r": 480.72003, "b": 558.524, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "samples), FinTabNet (113k samples) and PubTables-1M (about 1M samples).", "bbox": {"l": 134.765, "t": 557.94604, "r": 480.60577, "b": 570.479, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "Performance results are presented in Table. 2. It is clearly evident that the model", "bbox": {"l": 134.765, "t": 569.90103, "r": 480.5936899999999, "b": 582.43399, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "trained on OTSL outperforms HTML across the board, keeping high TEDs and", "bbox": {"l": 134.765, "t": 581.85603, "r": 480.59158, "b": 594.38899, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "mAP scores even on difficult financial tables (FinTabNet) that contain sparse", "bbox": {"l": 134.765, "t": 593.81204, "r": 480.58080999999993, "b": 606.345, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "and large tables.", "bbox": {"l": 134.765, "t": 605.76704, "r": 206.79959, "b": 618.3, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "Additionally, the results show that OTSL has an advantage over HTML", "bbox": {"l": 149.709, "t": 617.72205, "r": 480.59479, "b": 630.255, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "when applied on a bigger data set like PubTables-1M and achieves significantly", "bbox": {"l": 134.765, "t": 629.6770300000001, "r": 480.59857000000005, "b": 642.2099900000001, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "improved scores. Finally, OTSL achieves faster inference due to fewer decoding", "bbox": {"l": 134.765, "t": 641.63203, "r": 480.59384000000006, "b": 654.16499, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "steps which is a result of the reduced sequence representation.", "bbox": {"l": 134.765, "t": 653.58704, "r": 405.7995, "b": 666.12, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 8, "label": "page_header", "bbox": {"l": 194.478, "t": 91.49352999999996, "r": 447.54476999999997, "b": 102.78223000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9373534917831421, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 91.49352999999996, "r": 447.54476999999997, "b": 102.78223000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "page_header", "bbox": {"l": 475.98441, "t": 91.49352999999996, "r": 480.59314, "b": 102.78223000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.8858680725097656, "cells": [{"id": 1, "text": "9", "bbox": {"l": 475.98441, "t": 91.49352999999996, "r": 480.59314, "b": 102.78223000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "text", "bbox": {"l": 134.765, "t": 116.46301000000005, "r": 480.59665, "b": 152.90697999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.9806433916091919, "cells": [{"id": 2, "text": "order to compute the TED score. Inference timing results for all experiments", "bbox": {"l": 134.765, "t": 116.46301000000005, "r": 480.59067, "b": 128.99597000000006, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "were obtained from the same machine on a single core with AMD EPYC 7763", "bbox": {"l": 134.765, "t": 128.41803000000004, "r": 480.59665, "b": 140.95099000000005, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "CPU @2.45 GHz.", "bbox": {"l": 134.765, "t": 140.37401999999997, "r": 210.78761, "b": 152.90697999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "section_header", "bbox": {"l": 134.765, "t": 166.70514000000003, "r": 318.45145, "b": 179.20818999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9577404260635376, "cells": [{"id": 5, "text": "5.1", "bbox": {"l": 134.765, "t": 166.70514000000003, "r": 149.40306, "b": 179.20818999999995, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Hyper Parameter Optimization", "bbox": {"l": 160.85905, "t": 166.70514000000003, "r": 318.45145, "b": 179.20818999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 134.765, "t": 183.11505, "r": 480.59567, "b": 255.42400999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.98504239320755, "cells": [{"id": 7, "text": "We have chosen the PubTabNet data set to perform HPO, since it includes a", "bbox": {"l": 134.765, "t": 183.11505, "r": 479.74982000000006, "b": 195.64801, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "highly diverse set of tables. Also we report TED scores separately for simple and", "bbox": {"l": 134.765, "t": 195.07007, "r": 480.58765, "b": 207.60303, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "complex tables (tables with cell spans). Results are presented in Table. 1. It is", "bbox": {"l": 134.765, "t": 207.02502000000004, "r": 480.58859000000007, "b": 219.55798000000004, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "evident that with OTSL, our model achieves the same TED score and slightly", "bbox": {"l": 134.765, "t": 218.98004000000003, "r": 480.59567, "b": 231.51300000000003, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "better mAP scores in comparison to HTML. However OTSL yields a", "bbox": {"l": 134.765, "t": 230.93506000000002, "r": 440.9425, "b": 243.46802000000002, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "2x speed", "bbox": {"l": 444.86800999999997, "t": 230.98486000000003, "r": 480.58792, "b": 243.46802000000002, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "up", "bbox": {"l": 134.765, "t": 242.94086000000004, "r": 145.19585, "b": 255.42400999999995, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "in the inference runtime over HTML.", "bbox": {"l": 149.149, "t": 242.89104999999995, "r": 311.22256, "b": 255.42400999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "caption", "bbox": {"l": 134.765, "t": 272.79474000000005, "r": 480.59890999999993, "b": 327.98218, "coord_origin": "TOPLEFT"}, "confidence": 0.9591909050941467, "cells": [{"id": 15, "text": "Table", "bbox": {"l": 134.765, "t": 272.79474000000005, "r": 159.22983, "b": 284.1999799999999, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "1.", "bbox": {"l": 167.34442, "t": 272.79474000000005, "r": 174.71301, "b": 284.1999799999999, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "HPO performed in OTSL and HTML representation on the same", "bbox": {"l": 188.133, "t": 272.85748, "r": 480.58101999999997, "b": 284.14618, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "transformer-based TableFormer [9] architecture, trained only on PubTabNet [22]. Ef-", "bbox": {"l": 134.765, "t": 283.81647, "r": 480.59890999999993, "b": 295.10516000000007, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "fects of reducing the # of layers in encoder and decoder stages of the model show that", "bbox": {"l": 134.765, "t": 294.77547999999996, "r": 480.59887999999995, "b": 306.06418, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "smaller models trained on OTSL perform better, especially in recognizing complex", "bbox": {"l": 134.765, "t": 305.73447, "r": 480.59180000000003, "b": 317.02316, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "table structures, and maintain a much higher mAP score than the HTML counterpart.", "bbox": {"l": 134.765, "t": 316.69348, "r": 480.58471999999995, "b": 327.98218, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "table", "bbox": {"l": 139.66741943359375, "t": 337.54541015625, "r": 475.00927734375, "b": 469.4945373535156, "coord_origin": "TOPLEFT"}, "confidence": 0.9901031255722046, "cells": [{"id": 22, "text": "#", "bbox": {"l": 160.37, "t": 339.45749, "r": 168.04523, "b": 350.74619, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "enc-layers", "bbox": {"l": 144.592, "t": 352.40848, "r": 183.82895, "b": 363.69717, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "#", "bbox": {"l": 207.974, "t": 339.45749, "r": 215.64923000000002, "b": 350.74619, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "dec-layers", "bbox": {"l": 192.19501, "t": 352.40848, "r": 231.42303, "b": 363.69717, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "Language", "bbox": {"l": 239.79799999999997, "t": 344.93649, "r": 278.3338, "b": 356.22519000000005, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "TEDs", "bbox": {"l": 324.67001, "t": 339.45749, "r": 348.26419, "b": 350.74619, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "mAP", "bbox": {"l": 396.271, "t": 339.45749, "r": 417.12595, "b": 350.74619, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "(0.75)", "bbox": {"l": 394.927, "t": 350.41647, "r": 418.46921, "b": 361.70517, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Inference", "bbox": {"l": 430.771, "t": 339.45749, "r": 467.14142000000004, "b": 350.74619, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "time (secs)", "bbox": {"l": 427.14801, "t": 350.41647, "r": 470.76955999999996, "b": 361.70517, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "simple", "bbox": {"l": 286.686, "t": 352.40848, "r": 312.32812, "b": 363.69717, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "complex", "bbox": {"l": 320.702, "t": 352.40848, "r": 353.71539, "b": 363.69717, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "all", "bbox": {"l": 369.306, "t": 352.40848, "r": 379.02914, "b": 363.69717, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "6", "bbox": {"l": 161.90601, "t": 371.23849, "r": 166.51474, "b": 382.52719, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "6", "bbox": {"l": 209.509, "t": 371.23849, "r": 214.11774, "b": 382.52719, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 365.75848, "r": 271.41064, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "0.965", "bbox": {"l": 289.017, "t": 365.75848, "r": 310.00732, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "0.934", "bbox": {"l": 326.71701, "t": 365.75848, "r": 347.70734, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "0.955", "bbox": {"l": 363.67599, "t": 365.75848, "r": 384.66632, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "0.88", "bbox": {"l": 397.26999, "t": 365.69571, "r": 416.12634, "b": 377.10098000000005, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "2.73", "bbox": {"l": 439.52701, "t": 365.69571, "r": 458.38336, "b": 377.10098000000005, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 378.71048, "r": 272.94495, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "0.969", "bbox": {"l": 289.017, "t": 378.71048, "r": 310.00732, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "0.927", "bbox": {"l": 326.71701, "t": 378.71048, "r": 347.70734, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "0.955", "bbox": {"l": 363.67599, "t": 378.71048, "r": 384.66632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "0.857", "bbox": {"l": 396.20599, "t": 378.71048, "r": 417.19632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "5.39", "bbox": {"l": 440.767, "t": 378.71048, "r": 457.15039, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "4", "bbox": {"l": 161.90601, "t": 397.53949, "r": 166.51474, "b": 408.82819, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "4", "bbox": {"l": 209.509, "t": 397.53949, "r": 214.11774, "b": 408.82819, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 392.06049, "r": 271.41064, "b": 403.34918, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "0.938", "bbox": {"l": 289.017, "t": 392.06049, "r": 310.00732, "b": 403.34918, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "0.904", "bbox": {"l": 326.71701, "t": 392.06049, "r": 347.70734, "b": 403.34918, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "0.927", "bbox": {"l": 363.67599, "t": 392.06049, "r": 384.66632, "b": 403.34918, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "0.853", "bbox": {"l": 394.61801, "t": 391.99771, "r": 418.77798, "b": 403.40298, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "1.97", "bbox": {"l": 439.52701, "t": 391.99771, "r": 458.38336, "b": 403.40298, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 405.01147, "r": 272.94495, "b": 416.30017, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "0.952", "bbox": {"l": 289.017, "t": 405.01147, "r": 310.00732, "b": 416.30017, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "0.909", "bbox": {"l": 326.71701, "t": 405.01147, "r": 347.70734, "b": 416.30017, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "0.938", "bbox": {"l": 362.08801, "t": 404.9486999999999, "r": 386.24799, "b": 416.35397, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "0.843", "bbox": {"l": 396.20599, "t": 405.01147, "r": 417.19632, "b": 416.30017, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "3.77", "bbox": {"l": 440.767, "t": 405.01147, "r": 457.15039, "b": 416.30017, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "2", "bbox": {"l": 161.90601, "t": 423.84048, "r": 166.51474, "b": 435.12918, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "4", "bbox": {"l": 209.509, "t": 423.84048, "r": 214.11774, "b": 435.12918, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 418.3614799999999, "r": 271.41064, "b": 429.65018, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "0.923", "bbox": {"l": 289.017, "t": 418.3614799999999, "r": 310.00732, "b": 429.65018, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "0.897", "bbox": {"l": 326.71701, "t": 418.3614799999999, "r": 347.70734, "b": 429.65018, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "0.915", "bbox": {"l": 363.67599, "t": 418.3614799999999, "r": 384.66632, "b": 429.65018, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "0.859", "bbox": {"l": 394.61801, "t": 418.29871, "r": 418.77798, "b": 429.70398, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "1.91", "bbox": {"l": 439.52701, "t": 418.29871, "r": 458.38336, "b": 429.70398, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 431.31246999999996, "r": 272.94495, "b": 442.60117, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "0.945", "bbox": {"l": 289.017, "t": 431.31246999999996, "r": 310.00732, "b": 442.60117, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "0.901", "bbox": {"l": 326.71701, "t": 431.31246999999996, "r": 347.70734, "b": 442.60117, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "0.931", "bbox": {"l": 362.08801, "t": 431.24969, "r": 386.24799, "b": 442.65497, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "0.834", "bbox": {"l": 396.20599, "t": 431.31246999999996, "r": 417.19632, "b": 442.60117, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "3.81", "bbox": {"l": 440.767, "t": 431.31246999999996, "r": 457.15039, "b": 442.60117, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "4", "bbox": {"l": 161.90601, "t": 450.14248999999995, "r": 166.51474, "b": 461.43118, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "2", "bbox": {"l": 209.509, "t": 450.14248999999995, "r": 214.11774, "b": 461.43118, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 444.66248, "r": 271.41064, "b": 455.95117, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "0.952", "bbox": {"l": 289.017, "t": 444.66248, "r": 310.00732, "b": 455.95117, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "0.92", "bbox": {"l": 329.021, "t": 444.66248, "r": 345.40439, "b": 455.95117, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "0.942", "bbox": {"l": 362.08801, "t": 444.5996999999999, "r": 386.24799, "b": 456.00497, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "0.857", "bbox": {"l": 394.61801, "t": 444.5996999999999, "r": 418.77798, "b": 456.00497, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "1.22", "bbox": {"l": 439.52701, "t": 444.5996999999999, "r": 458.38336, "b": 456.00497, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 457.61447, "r": 272.94495, "b": 468.90317, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "0.944", "bbox": {"l": 289.017, "t": 457.61447, "r": 310.00732, "b": 468.90317, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "0.903", "bbox": {"l": 326.71701, "t": 457.61447, "r": 347.70734, "b": 468.90317, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "0.931", "bbox": {"l": 363.67599, "t": 457.61447, "r": 384.66632, "b": 468.90317, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "0.824", "bbox": {"l": 396.20599, "t": 457.61447, "r": 417.19632, "b": 468.90317, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "2", "bbox": {"l": 446.65302, "t": 457.61447, "r": 451.26175, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": [{"id": 10, "label": "text", "bbox": {"l": 160.37, "t": 339.45749, "r": 168.04523, "b": 350.74619, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "#", "bbox": {"l": 160.37, "t": 339.45749, "r": 168.04523, "b": 350.74619, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 144.592, "t": 352.40848, "r": 183.82895, "b": 363.69717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "enc-layers", "bbox": {"l": 144.592, "t": 352.40848, "r": 183.82895, "b": 363.69717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 207.974, "t": 339.45749, "r": 215.64923000000002, "b": 350.74619, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "#", "bbox": {"l": 207.974, "t": 339.45749, "r": 215.64923000000002, "b": 350.74619, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 192.19501, "t": 352.40848, "r": 231.42303, "b": 363.69717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "dec-layers", "bbox": {"l": 192.19501, "t": 352.40848, "r": 231.42303, "b": 363.69717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 239.79799999999997, "t": 344.93649, "r": 278.3338, "b": 356.22519000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "Language", "bbox": {"l": 239.79799999999997, "t": 344.93649, "r": 278.3338, "b": 356.22519000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 324.67001, "t": 339.45749, "r": 348.26419, "b": 350.74619, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "TEDs", "bbox": {"l": 324.67001, "t": 339.45749, "r": 348.26419, "b": 350.74619, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 396.271, "t": 339.45749, "r": 417.12595, "b": 350.74619, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "mAP", "bbox": {"l": 396.271, "t": 339.45749, "r": 417.12595, "b": 350.74619, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 394.927, "t": 350.41647, "r": 418.46921, "b": 361.70517, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "(0.75)", "bbox": {"l": 394.927, "t": 350.41647, "r": 418.46921, "b": 361.70517, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 430.771, "t": 339.45749, "r": 467.14142000000004, "b": 350.74619, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "Inference", "bbox": {"l": 430.771, "t": 339.45749, "r": 467.14142000000004, "b": 350.74619, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 427.14801, "t": 350.41647, "r": 470.76955999999996, "b": 361.70517, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "time (secs)", "bbox": {"l": 427.14801, "t": 350.41647, "r": 470.76955999999996, "b": 361.70517, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 286.686, "t": 352.40848, "r": 312.32812, "b": 363.69717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "simple", "bbox": {"l": 286.686, "t": 352.40848, "r": 312.32812, "b": 363.69717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 320.702, "t": 352.40848, "r": 353.71539, "b": 363.69717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "complex", "bbox": {"l": 320.702, "t": 352.40848, "r": 353.71539, "b": 363.69717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 369.306, "t": 352.40848, "r": 379.02914, "b": 363.69717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "all", "bbox": {"l": 369.306, "t": 352.40848, "r": 379.02914, "b": 363.69717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 161.90601, "t": 371.23849, "r": 166.51474, "b": 382.52719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "6", "bbox": {"l": 161.90601, "t": 371.23849, "r": 166.51474, "b": 382.52719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 209.509, "t": 371.23849, "r": 214.11774, "b": 382.52719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "6", "bbox": {"l": 209.509, "t": 371.23849, "r": 214.11774, "b": 382.52719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 246.71000999999998, "t": 365.75848, "r": 271.41064, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 365.75848, "r": 271.41064, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 289.017, "t": 365.75848, "r": 310.00732, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "0.965", "bbox": {"l": 289.017, "t": 365.75848, "r": 310.00732, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 326.71701, "t": 365.75848, "r": 347.70734, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "0.934", "bbox": {"l": 326.71701, "t": 365.75848, "r": 347.70734, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 363.67599, "t": 365.75848, "r": 384.66632, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "0.955", "bbox": {"l": 363.67599, "t": 365.75848, "r": 384.66632, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 397.26999, "t": 365.69571, "r": 416.12634, "b": 377.10098000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "0.88", "bbox": {"l": 397.26999, "t": 365.69571, "r": 416.12634, "b": 377.10098000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 439.52701, "t": 365.69571, "r": 458.38336, "b": 377.10098000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "2.73", "bbox": {"l": 439.52701, "t": 365.69571, "r": 458.38336, "b": 377.10098000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 245.17598999999998, "t": 378.71048, "r": 272.94495, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 378.71048, "r": 272.94495, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 289.017, "t": 378.71048, "r": 310.00732, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "0.969", "bbox": {"l": 289.017, "t": 378.71048, "r": 310.00732, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 326.71701, "t": 378.71048, "r": 347.70734, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "0.927", "bbox": {"l": 326.71701, "t": 378.71048, "r": 347.70734, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 363.67599, "t": 378.71048, "r": 384.66632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "0.955", "bbox": {"l": 363.67599, "t": 378.71048, "r": 384.66632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 396.20599, "t": 378.71048, "r": 417.19632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "0.857", "bbox": {"l": 396.20599, "t": 378.71048, "r": 417.19632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 440.767, "t": 378.71048, "r": 457.15039, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "5.39", "bbox": {"l": 440.767, "t": 378.71048, "r": 457.15039, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 161.90601, "t": 397.53949, "r": 166.51474, "b": 408.82819, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "4", "bbox": {"l": 161.90601, "t": 397.53949, "r": 166.51474, "b": 408.82819, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 209.509, "t": 397.53949, "r": 214.11774, "b": 408.82819, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "4", "bbox": {"l": 209.509, "t": 397.53949, "r": 214.11774, "b": 408.82819, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 246.71000999999998, "t": 392.06049, "r": 271.41064, "b": 403.34918, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 392.06049, "r": 271.41064, "b": 403.34918, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 289.017, "t": 392.06049, "r": 310.00732, "b": 403.34918, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "0.938", "bbox": {"l": 289.017, "t": 392.06049, "r": 310.00732, "b": 403.34918, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 326.71701, "t": 392.06049, "r": 347.70734, "b": 403.34918, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "0.904", "bbox": {"l": 326.71701, "t": 392.06049, "r": 347.70734, "b": 403.34918, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 363.67599, "t": 392.06049, "r": 384.66632, "b": 403.34918, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "0.927", "bbox": {"l": 363.67599, "t": 392.06049, "r": 384.66632, "b": 403.34918, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 394.61801, "t": 391.99771, "r": 418.77798, "b": 403.40298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "0.853", "bbox": {"l": 394.61801, "t": 391.99771, "r": 418.77798, "b": 403.40298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 439.52701, "t": 391.99771, "r": 458.38336, "b": 403.40298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "1.97", "bbox": {"l": 439.52701, "t": 391.99771, "r": 458.38336, "b": 403.40298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 245.17598999999998, "t": 405.01147, "r": 272.94495, "b": 416.30017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 405.01147, "r": 272.94495, "b": 416.30017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 289.017, "t": 405.01147, "r": 310.00732, "b": 416.30017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "0.952", "bbox": {"l": 289.017, "t": 405.01147, "r": 310.00732, "b": 416.30017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 326.71701, "t": 405.01147, "r": 347.70734, "b": 416.30017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "0.909", "bbox": {"l": 326.71701, "t": 405.01147, "r": 347.70734, "b": 416.30017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 362.08801, "t": 404.9486999999999, "r": 386.24799, "b": 416.35397, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "0.938", "bbox": {"l": 362.08801, "t": 404.9486999999999, "r": 386.24799, "b": 416.35397, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 396.20599, "t": 405.01147, "r": 417.19632, "b": 416.30017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "0.843", "bbox": {"l": 396.20599, "t": 405.01147, "r": 417.19632, "b": 416.30017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 440.767, "t": 405.01147, "r": 457.15039, "b": 416.30017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "3.77", "bbox": {"l": 440.767, "t": 405.01147, "r": 457.15039, "b": 416.30017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 161.90601, "t": 423.84048, "r": 166.51474, "b": 435.12918, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "2", "bbox": {"l": 161.90601, "t": 423.84048, "r": 166.51474, "b": 435.12918, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 209.509, "t": 423.84048, "r": 214.11774, "b": 435.12918, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "4", "bbox": {"l": 209.509, "t": 423.84048, "r": 214.11774, "b": 435.12918, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 246.71000999999998, "t": 418.3614799999999, "r": 271.41064, "b": 429.65018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 418.3614799999999, "r": 271.41064, "b": 429.65018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 289.017, "t": 418.3614799999999, "r": 310.00732, "b": 429.65018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "0.923", "bbox": {"l": 289.017, "t": 418.3614799999999, "r": 310.00732, "b": 429.65018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 326.71701, "t": 418.3614799999999, "r": 347.70734, "b": 429.65018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "0.897", "bbox": {"l": 326.71701, "t": 418.3614799999999, "r": 347.70734, "b": 429.65018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 363.67599, "t": 418.3614799999999, "r": 384.66632, "b": 429.65018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "0.915", "bbox": {"l": 363.67599, "t": 418.3614799999999, "r": 384.66632, "b": 429.65018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 394.61801, "t": 418.29871, "r": 418.77798, "b": 429.70398, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "0.859", "bbox": {"l": 394.61801, "t": 418.29871, "r": 418.77798, "b": 429.70398, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 439.52701, "t": 418.29871, "r": 458.38336, "b": 429.70398, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "1.91", "bbox": {"l": 439.52701, "t": 418.29871, "r": 458.38336, "b": 429.70398, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 245.17598999999998, "t": 431.31246999999996, "r": 272.94495, "b": 442.60117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 431.31246999999996, "r": 272.94495, "b": 442.60117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 289.017, "t": 431.31246999999996, "r": 310.00732, "b": 442.60117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "0.945", "bbox": {"l": 289.017, "t": 431.31246999999996, "r": 310.00732, "b": 442.60117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 326.71701, "t": 431.31246999999996, "r": 347.70734, "b": 442.60117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "0.901", "bbox": {"l": 326.71701, "t": 431.31246999999996, "r": 347.70734, "b": 442.60117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 362.08801, "t": 431.24969, "r": 386.24799, "b": 442.65497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "0.931", "bbox": {"l": 362.08801, "t": 431.24969, "r": 386.24799, "b": 442.65497, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 396.20599, "t": 431.31246999999996, "r": 417.19632, "b": 442.60117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "0.834", "bbox": {"l": 396.20599, "t": 431.31246999999996, "r": 417.19632, "b": 442.60117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 440.767, "t": 431.31246999999996, "r": 457.15039, "b": 442.60117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "3.81", "bbox": {"l": 440.767, "t": 431.31246999999996, "r": 457.15039, "b": 442.60117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 161.90601, "t": 450.14248999999995, "r": 166.51474, "b": 461.43118, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "4", "bbox": {"l": 161.90601, "t": 450.14248999999995, "r": 166.51474, "b": 461.43118, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 209.509, "t": 450.14248999999995, "r": 214.11774, "b": 461.43118, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "2", "bbox": {"l": 209.509, "t": 450.14248999999995, "r": 214.11774, "b": 461.43118, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 246.71000999999998, "t": 444.66248, "r": 271.41064, "b": 455.95117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 444.66248, "r": 271.41064, "b": 455.95117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 289.017, "t": 444.66248, "r": 310.00732, "b": 455.95117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "0.952", "bbox": {"l": 289.017, "t": 444.66248, "r": 310.00732, "b": 455.95117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 329.021, "t": 444.66248, "r": 345.40439, "b": 455.95117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "0.92", "bbox": {"l": 329.021, "t": 444.66248, "r": 345.40439, "b": 455.95117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 362.08801, "t": 444.5996999999999, "r": 386.24799, "b": 456.00497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "0.942", "bbox": {"l": 362.08801, "t": 444.5996999999999, "r": 386.24799, "b": 456.00497, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 394.61801, "t": 444.5996999999999, "r": 418.77798, "b": 456.00497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "0.857", "bbox": {"l": 394.61801, "t": 444.5996999999999, "r": 418.77798, "b": 456.00497, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 439.52701, "t": 444.5996999999999, "r": 458.38336, "b": 456.00497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "1.22", "bbox": {"l": 439.52701, "t": 444.5996999999999, "r": 458.38336, "b": 456.00497, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 245.17598999999998, "t": 457.61447, "r": 272.94495, "b": 468.90317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 457.61447, "r": 272.94495, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 289.017, "t": 457.61447, "r": 310.00732, "b": 468.90317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "0.944", "bbox": {"l": 289.017, "t": 457.61447, "r": 310.00732, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 326.71701, "t": 457.61447, "r": 347.70734, "b": 468.90317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "0.903", "bbox": {"l": 326.71701, "t": 457.61447, "r": 347.70734, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 363.67599, "t": 457.61447, "r": 384.66632, "b": 468.90317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "0.931", "bbox": {"l": 363.67599, "t": 457.61447, "r": 384.66632, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 396.20599, "t": 457.61447, "r": 417.19632, "b": 468.90317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "0.824", "bbox": {"l": 396.20599, "t": 457.61447, "r": 417.19632, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 446.65302, "t": 457.61447, "r": 451.26175, "b": 468.90317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "2", "bbox": {"l": 446.65302, "t": 457.61447, "r": 451.26175, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 6, "label": "section_header", "bbox": {"l": 134.765, "t": 505.67111, "r": 264.40829, "b": 518.17419, "coord_origin": "TOPLEFT"}, "confidence": 0.9589294195175171, "cells": [{"id": 91, "text": "5.2", "bbox": {"l": 134.765, "t": 505.67111, "r": 149.40306, "b": 518.17419, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Quantitative Results", "bbox": {"l": 160.85905, "t": 505.67111, "r": 264.40829, "b": 518.17419, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 134.765, "t": 522.08005, "r": 480.72003, "b": 618.3, "coord_origin": "TOPLEFT"}, "confidence": 0.9849975109100342, "cells": [{"id": 93, "text": "We picked the model parameter configuration that produced the best prediction", "bbox": {"l": 134.765, "t": 522.08005, "r": 479.72983, "b": 534.61301, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "quality (enc=6, dec=6, heads=8) with PubTabNet alone, then independently", "bbox": {"l": 134.765, "t": 534.03604, "r": 480.5897499999999, "b": 546.569, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "trained and evaluated it on three publicly available data sets: PubTabNet (395k", "bbox": {"l": 134.765, "t": 545.99104, "r": 480.72003, "b": 558.524, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "samples), FinTabNet (113k samples) and PubTables-1M (about 1M samples).", "bbox": {"l": 134.765, "t": 557.94604, "r": 480.60577, "b": 570.479, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "Performance results are presented in Table. 2. It is clearly evident that the model", "bbox": {"l": 134.765, "t": 569.90103, "r": 480.5936899999999, "b": 582.43399, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "trained on OTSL outperforms HTML across the board, keeping high TEDs and", "bbox": {"l": 134.765, "t": 581.85603, "r": 480.59158, "b": 594.38899, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "mAP scores even on difficult financial tables (FinTabNet) that contain sparse", "bbox": {"l": 134.765, "t": 593.81204, "r": 480.58080999999993, "b": 606.345, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "and large tables.", "bbox": {"l": 134.765, "t": 605.76704, "r": 206.79959, "b": 618.3, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 134.765, "t": 617.72205, "r": 480.59857000000005, "b": 666.12, "coord_origin": "TOPLEFT"}, "confidence": 0.9850137829780579, "cells": [{"id": 101, "text": "Additionally, the results show that OTSL has an advantage over HTML", "bbox": {"l": 149.709, "t": 617.72205, "r": 480.59479, "b": 630.255, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "when applied on a bigger data set like PubTables-1M and achieves significantly", "bbox": {"l": 134.765, "t": 629.6770300000001, "r": 480.59857000000005, "b": 642.2099900000001, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "improved scores. Finally, OTSL achieves faster inference due to fewer decoding", "bbox": {"l": 134.765, "t": 641.63203, "r": 480.59384000000006, "b": 654.16499, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "steps which is a result of the reduced sequence representation.", "bbox": {"l": 134.765, "t": 653.58704, "r": 405.7995, "b": 666.12, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {"0": {"label": "table", "id": 0, "page_no": 0, "cluster": {"id": 0, "label": "table", "bbox": {"l": 139.66741943359375, "t": 337.54541015625, "r": 475.00927734375, "b": 469.4945373535156, "coord_origin": "TOPLEFT"}, "confidence": 0.9901031255722046, "cells": [{"id": 22, "text": "#", "bbox": {"l": 160.37, "t": 339.45749, "r": 168.04523, "b": 350.74619, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "enc-layers", "bbox": {"l": 144.592, "t": 352.40848, "r": 183.82895, "b": 363.69717, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "#", "bbox": {"l": 207.974, "t": 339.45749, "r": 215.64923000000002, "b": 350.74619, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "dec-layers", "bbox": {"l": 192.19501, "t": 352.40848, "r": 231.42303, "b": 363.69717, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "Language", "bbox": {"l": 239.79799999999997, "t": 344.93649, "r": 278.3338, "b": 356.22519000000005, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "TEDs", "bbox": {"l": 324.67001, "t": 339.45749, "r": 348.26419, "b": 350.74619, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "mAP", "bbox": {"l": 396.271, "t": 339.45749, "r": 417.12595, "b": 350.74619, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "(0.75)", "bbox": {"l": 394.927, "t": 350.41647, "r": 418.46921, "b": 361.70517, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Inference", "bbox": {"l": 430.771, "t": 339.45749, "r": 467.14142000000004, "b": 350.74619, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "time (secs)", "bbox": {"l": 427.14801, "t": 350.41647, "r": 470.76955999999996, "b": 361.70517, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "simple", "bbox": {"l": 286.686, "t": 352.40848, "r": 312.32812, "b": 363.69717, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "complex", "bbox": {"l": 320.702, "t": 352.40848, "r": 353.71539, "b": 363.69717, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "all", "bbox": {"l": 369.306, "t": 352.40848, "r": 379.02914, "b": 363.69717, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "6", "bbox": {"l": 161.90601, "t": 371.23849, "r": 166.51474, "b": 382.52719, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "6", "bbox": {"l": 209.509, "t": 371.23849, "r": 214.11774, "b": 382.52719, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 365.75848, "r": 271.41064, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "0.965", "bbox": {"l": 289.017, "t": 365.75848, "r": 310.00732, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "0.934", "bbox": {"l": 326.71701, "t": 365.75848, "r": 347.70734, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "0.955", "bbox": {"l": 363.67599, "t": 365.75848, "r": 384.66632, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "0.88", "bbox": {"l": 397.26999, "t": 365.69571, "r": 416.12634, "b": 377.10098000000005, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "2.73", "bbox": {"l": 439.52701, "t": 365.69571, "r": 458.38336, "b": 377.10098000000005, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 378.71048, "r": 272.94495, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "0.969", "bbox": {"l": 289.017, "t": 378.71048, "r": 310.00732, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "0.927", "bbox": {"l": 326.71701, "t": 378.71048, "r": 347.70734, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "0.955", "bbox": {"l": 363.67599, "t": 378.71048, "r": 384.66632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "0.857", "bbox": {"l": 396.20599, "t": 378.71048, "r": 417.19632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "5.39", "bbox": {"l": 440.767, "t": 378.71048, "r": 457.15039, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "4", "bbox": {"l": 161.90601, "t": 397.53949, "r": 166.51474, "b": 408.82819, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "4", "bbox": {"l": 209.509, "t": 397.53949, "r": 214.11774, "b": 408.82819, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 392.06049, "r": 271.41064, "b": 403.34918, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "0.938", "bbox": {"l": 289.017, "t": 392.06049, "r": 310.00732, "b": 403.34918, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "0.904", "bbox": {"l": 326.71701, "t": 392.06049, "r": 347.70734, "b": 403.34918, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "0.927", "bbox": {"l": 363.67599, "t": 392.06049, "r": 384.66632, "b": 403.34918, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "0.853", "bbox": {"l": 394.61801, "t": 391.99771, "r": 418.77798, "b": 403.40298, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "1.97", "bbox": {"l": 439.52701, "t": 391.99771, "r": 458.38336, "b": 403.40298, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 405.01147, "r": 272.94495, "b": 416.30017, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "0.952", "bbox": {"l": 289.017, "t": 405.01147, "r": 310.00732, "b": 416.30017, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "0.909", "bbox": {"l": 326.71701, "t": 405.01147, "r": 347.70734, "b": 416.30017, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "0.938", "bbox": {"l": 362.08801, "t": 404.9486999999999, "r": 386.24799, "b": 416.35397, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "0.843", "bbox": {"l": 396.20599, "t": 405.01147, "r": 417.19632, "b": 416.30017, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "3.77", "bbox": {"l": 440.767, "t": 405.01147, "r": 457.15039, "b": 416.30017, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "2", "bbox": {"l": 161.90601, "t": 423.84048, "r": 166.51474, "b": 435.12918, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "4", "bbox": {"l": 209.509, "t": 423.84048, "r": 214.11774, "b": 435.12918, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 418.3614799999999, "r": 271.41064, "b": 429.65018, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "0.923", "bbox": {"l": 289.017, "t": 418.3614799999999, "r": 310.00732, "b": 429.65018, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "0.897", "bbox": {"l": 326.71701, "t": 418.3614799999999, "r": 347.70734, "b": 429.65018, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "0.915", "bbox": {"l": 363.67599, "t": 418.3614799999999, "r": 384.66632, "b": 429.65018, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "0.859", "bbox": {"l": 394.61801, "t": 418.29871, "r": 418.77798, "b": 429.70398, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "1.91", "bbox": {"l": 439.52701, "t": 418.29871, "r": 458.38336, "b": 429.70398, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 431.31246999999996, "r": 272.94495, "b": 442.60117, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "0.945", "bbox": {"l": 289.017, "t": 431.31246999999996, "r": 310.00732, "b": 442.60117, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "0.901", "bbox": {"l": 326.71701, "t": 431.31246999999996, "r": 347.70734, "b": 442.60117, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "0.931", "bbox": {"l": 362.08801, "t": 431.24969, "r": 386.24799, "b": 442.65497, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "0.834", "bbox": {"l": 396.20599, "t": 431.31246999999996, "r": 417.19632, "b": 442.60117, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "3.81", "bbox": {"l": 440.767, "t": 431.31246999999996, "r": 457.15039, "b": 442.60117, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "4", "bbox": {"l": 161.90601, "t": 450.14248999999995, "r": 166.51474, "b": 461.43118, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "2", "bbox": {"l": 209.509, "t": 450.14248999999995, "r": 214.11774, "b": 461.43118, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 444.66248, "r": 271.41064, "b": 455.95117, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "0.952", "bbox": {"l": 289.017, "t": 444.66248, "r": 310.00732, "b": 455.95117, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "0.92", "bbox": {"l": 329.021, "t": 444.66248, "r": 345.40439, "b": 455.95117, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "0.942", "bbox": {"l": 362.08801, "t": 444.5996999999999, "r": 386.24799, "b": 456.00497, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "0.857", "bbox": {"l": 394.61801, "t": 444.5996999999999, "r": 418.77798, "b": 456.00497, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "1.22", "bbox": {"l": 439.52701, "t": 444.5996999999999, "r": 458.38336, "b": 456.00497, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 457.61447, "r": 272.94495, "b": 468.90317, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "0.944", "bbox": {"l": 289.017, "t": 457.61447, "r": 310.00732, "b": 468.90317, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "0.903", "bbox": {"l": 326.71701, "t": 457.61447, "r": 347.70734, "b": 468.90317, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "0.931", "bbox": {"l": 363.67599, "t": 457.61447, "r": 384.66632, "b": 468.90317, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "0.824", "bbox": {"l": 396.20599, "t": 457.61447, "r": 417.19632, "b": 468.90317, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "2", "bbox": {"l": 446.65302, "t": 457.61447, "r": 451.26175, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": [{"id": 10, "label": "text", "bbox": {"l": 160.37, "t": 339.45749, "r": 168.04523, "b": 350.74619, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "#", "bbox": {"l": 160.37, "t": 339.45749, "r": 168.04523, "b": 350.74619, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 144.592, "t": 352.40848, "r": 183.82895, "b": 363.69717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "enc-layers", "bbox": {"l": 144.592, "t": 352.40848, "r": 183.82895, "b": 363.69717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 207.974, "t": 339.45749, "r": 215.64923000000002, "b": 350.74619, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "#", "bbox": {"l": 207.974, "t": 339.45749, "r": 215.64923000000002, "b": 350.74619, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 192.19501, "t": 352.40848, "r": 231.42303, "b": 363.69717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "dec-layers", "bbox": {"l": 192.19501, "t": 352.40848, "r": 231.42303, "b": 363.69717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 239.79799999999997, "t": 344.93649, "r": 278.3338, "b": 356.22519000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "Language", "bbox": {"l": 239.79799999999997, "t": 344.93649, "r": 278.3338, "b": 356.22519000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 324.67001, "t": 339.45749, "r": 348.26419, "b": 350.74619, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "TEDs", "bbox": {"l": 324.67001, "t": 339.45749, "r": 348.26419, "b": 350.74619, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 396.271, "t": 339.45749, "r": 417.12595, "b": 350.74619, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "mAP", "bbox": {"l": 396.271, "t": 339.45749, "r": 417.12595, "b": 350.74619, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 394.927, "t": 350.41647, "r": 418.46921, "b": 361.70517, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "(0.75)", "bbox": {"l": 394.927, "t": 350.41647, "r": 418.46921, "b": 361.70517, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 430.771, "t": 339.45749, "r": 467.14142000000004, "b": 350.74619, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "Inference", "bbox": {"l": 430.771, "t": 339.45749, "r": 467.14142000000004, "b": 350.74619, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 427.14801, "t": 350.41647, "r": 470.76955999999996, "b": 361.70517, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "time (secs)", "bbox": {"l": 427.14801, "t": 350.41647, "r": 470.76955999999996, "b": 361.70517, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 286.686, "t": 352.40848, "r": 312.32812, "b": 363.69717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "simple", "bbox": {"l": 286.686, "t": 352.40848, "r": 312.32812, "b": 363.69717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 320.702, "t": 352.40848, "r": 353.71539, "b": 363.69717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "complex", "bbox": {"l": 320.702, "t": 352.40848, "r": 353.71539, "b": 363.69717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 369.306, "t": 352.40848, "r": 379.02914, "b": 363.69717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "all", "bbox": {"l": 369.306, "t": 352.40848, "r": 379.02914, "b": 363.69717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 161.90601, "t": 371.23849, "r": 166.51474, "b": 382.52719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "6", "bbox": {"l": 161.90601, "t": 371.23849, "r": 166.51474, "b": 382.52719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 209.509, "t": 371.23849, "r": 214.11774, "b": 382.52719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "6", "bbox": {"l": 209.509, "t": 371.23849, "r": 214.11774, "b": 382.52719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 246.71000999999998, "t": 365.75848, "r": 271.41064, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 365.75848, "r": 271.41064, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 289.017, "t": 365.75848, "r": 310.00732, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "0.965", "bbox": {"l": 289.017, "t": 365.75848, "r": 310.00732, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 326.71701, "t": 365.75848, "r": 347.70734, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "0.934", "bbox": {"l": 326.71701, "t": 365.75848, "r": 347.70734, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 363.67599, "t": 365.75848, "r": 384.66632, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "0.955", "bbox": {"l": 363.67599, "t": 365.75848, "r": 384.66632, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 397.26999, "t": 365.69571, "r": 416.12634, "b": 377.10098000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "0.88", "bbox": {"l": 397.26999, "t": 365.69571, "r": 416.12634, "b": 377.10098000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 439.52701, "t": 365.69571, "r": 458.38336, "b": 377.10098000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "2.73", "bbox": {"l": 439.52701, "t": 365.69571, "r": 458.38336, "b": 377.10098000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 245.17598999999998, "t": 378.71048, "r": 272.94495, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 378.71048, "r": 272.94495, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 289.017, "t": 378.71048, "r": 310.00732, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "0.969", "bbox": {"l": 289.017, "t": 378.71048, "r": 310.00732, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 326.71701, "t": 378.71048, "r": 347.70734, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "0.927", "bbox": {"l": 326.71701, "t": 378.71048, "r": 347.70734, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 363.67599, "t": 378.71048, "r": 384.66632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "0.955", "bbox": {"l": 363.67599, "t": 378.71048, "r": 384.66632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 396.20599, "t": 378.71048, "r": 417.19632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "0.857", "bbox": {"l": 396.20599, "t": 378.71048, "r": 417.19632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 440.767, "t": 378.71048, "r": 457.15039, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "5.39", "bbox": {"l": 440.767, "t": 378.71048, "r": 457.15039, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 161.90601, "t": 397.53949, "r": 166.51474, "b": 408.82819, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "4", "bbox": {"l": 161.90601, "t": 397.53949, "r": 166.51474, "b": 408.82819, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 209.509, "t": 397.53949, "r": 214.11774, "b": 408.82819, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "4", "bbox": {"l": 209.509, "t": 397.53949, "r": 214.11774, "b": 408.82819, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 246.71000999999998, "t": 392.06049, "r": 271.41064, "b": 403.34918, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 392.06049, "r": 271.41064, "b": 403.34918, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 289.017, "t": 392.06049, "r": 310.00732, "b": 403.34918, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "0.938", "bbox": {"l": 289.017, "t": 392.06049, "r": 310.00732, "b": 403.34918, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 326.71701, "t": 392.06049, "r": 347.70734, "b": 403.34918, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "0.904", "bbox": {"l": 326.71701, "t": 392.06049, "r": 347.70734, "b": 403.34918, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 363.67599, "t": 392.06049, "r": 384.66632, "b": 403.34918, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "0.927", "bbox": {"l": 363.67599, "t": 392.06049, "r": 384.66632, "b": 403.34918, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 394.61801, "t": 391.99771, "r": 418.77798, "b": 403.40298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "0.853", "bbox": {"l": 394.61801, "t": 391.99771, "r": 418.77798, "b": 403.40298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 439.52701, "t": 391.99771, "r": 458.38336, "b": 403.40298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "1.97", "bbox": {"l": 439.52701, "t": 391.99771, "r": 458.38336, "b": 403.40298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 245.17598999999998, "t": 405.01147, "r": 272.94495, "b": 416.30017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 405.01147, "r": 272.94495, "b": 416.30017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 289.017, "t": 405.01147, "r": 310.00732, "b": 416.30017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "0.952", "bbox": {"l": 289.017, "t": 405.01147, "r": 310.00732, "b": 416.30017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 326.71701, "t": 405.01147, "r": 347.70734, "b": 416.30017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "0.909", "bbox": {"l": 326.71701, "t": 405.01147, "r": 347.70734, "b": 416.30017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 362.08801, "t": 404.9486999999999, "r": 386.24799, "b": 416.35397, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "0.938", "bbox": {"l": 362.08801, "t": 404.9486999999999, "r": 386.24799, "b": 416.35397, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 396.20599, "t": 405.01147, "r": 417.19632, "b": 416.30017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "0.843", "bbox": {"l": 396.20599, "t": 405.01147, "r": 417.19632, "b": 416.30017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 440.767, "t": 405.01147, "r": 457.15039, "b": 416.30017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "3.77", "bbox": {"l": 440.767, "t": 405.01147, "r": 457.15039, "b": 416.30017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 161.90601, "t": 423.84048, "r": 166.51474, "b": 435.12918, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "2", "bbox": {"l": 161.90601, "t": 423.84048, "r": 166.51474, "b": 435.12918, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 209.509, "t": 423.84048, "r": 214.11774, "b": 435.12918, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "4", "bbox": {"l": 209.509, "t": 423.84048, "r": 214.11774, "b": 435.12918, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 246.71000999999998, "t": 418.3614799999999, "r": 271.41064, "b": 429.65018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 418.3614799999999, "r": 271.41064, "b": 429.65018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 289.017, "t": 418.3614799999999, "r": 310.00732, "b": 429.65018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "0.923", "bbox": {"l": 289.017, "t": 418.3614799999999, "r": 310.00732, "b": 429.65018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 326.71701, "t": 418.3614799999999, "r": 347.70734, "b": 429.65018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "0.897", "bbox": {"l": 326.71701, "t": 418.3614799999999, "r": 347.70734, "b": 429.65018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 363.67599, "t": 418.3614799999999, "r": 384.66632, "b": 429.65018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "0.915", "bbox": {"l": 363.67599, "t": 418.3614799999999, "r": 384.66632, "b": 429.65018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 394.61801, "t": 418.29871, "r": 418.77798, "b": 429.70398, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "0.859", "bbox": {"l": 394.61801, "t": 418.29871, "r": 418.77798, "b": 429.70398, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 439.52701, "t": 418.29871, "r": 458.38336, "b": 429.70398, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "1.91", "bbox": {"l": 439.52701, "t": 418.29871, "r": 458.38336, "b": 429.70398, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 245.17598999999998, "t": 431.31246999999996, "r": 272.94495, "b": 442.60117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 431.31246999999996, "r": 272.94495, "b": 442.60117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 289.017, "t": 431.31246999999996, "r": 310.00732, "b": 442.60117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "0.945", "bbox": {"l": 289.017, "t": 431.31246999999996, "r": 310.00732, "b": 442.60117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 326.71701, "t": 431.31246999999996, "r": 347.70734, "b": 442.60117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "0.901", "bbox": {"l": 326.71701, "t": 431.31246999999996, "r": 347.70734, "b": 442.60117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 362.08801, "t": 431.24969, "r": 386.24799, "b": 442.65497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "0.931", "bbox": {"l": 362.08801, "t": 431.24969, "r": 386.24799, "b": 442.65497, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 396.20599, "t": 431.31246999999996, "r": 417.19632, "b": 442.60117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "0.834", "bbox": {"l": 396.20599, "t": 431.31246999999996, "r": 417.19632, "b": 442.60117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 440.767, "t": 431.31246999999996, "r": 457.15039, "b": 442.60117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "3.81", "bbox": {"l": 440.767, "t": 431.31246999999996, "r": 457.15039, "b": 442.60117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 161.90601, "t": 450.14248999999995, "r": 166.51474, "b": 461.43118, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "4", "bbox": {"l": 161.90601, "t": 450.14248999999995, "r": 166.51474, "b": 461.43118, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 209.509, "t": 450.14248999999995, "r": 214.11774, "b": 461.43118, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "2", "bbox": {"l": 209.509, "t": 450.14248999999995, "r": 214.11774, "b": 461.43118, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 246.71000999999998, "t": 444.66248, "r": 271.41064, "b": 455.95117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 444.66248, "r": 271.41064, "b": 455.95117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 289.017, "t": 444.66248, "r": 310.00732, "b": 455.95117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "0.952", "bbox": {"l": 289.017, "t": 444.66248, "r": 310.00732, "b": 455.95117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 329.021, "t": 444.66248, "r": 345.40439, "b": 455.95117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "0.92", "bbox": {"l": 329.021, "t": 444.66248, "r": 345.40439, "b": 455.95117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 362.08801, "t": 444.5996999999999, "r": 386.24799, "b": 456.00497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "0.942", "bbox": {"l": 362.08801, "t": 444.5996999999999, "r": 386.24799, "b": 456.00497, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 394.61801, "t": 444.5996999999999, "r": 418.77798, "b": 456.00497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "0.857", "bbox": {"l": 394.61801, "t": 444.5996999999999, "r": 418.77798, "b": 456.00497, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 439.52701, "t": 444.5996999999999, "r": 458.38336, "b": 456.00497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "1.22", "bbox": {"l": 439.52701, "t": 444.5996999999999, "r": 458.38336, "b": 456.00497, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 245.17598999999998, "t": 457.61447, "r": 272.94495, "b": 468.90317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 457.61447, "r": 272.94495, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 289.017, "t": 457.61447, "r": 310.00732, "b": 468.90317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "0.944", "bbox": {"l": 289.017, "t": 457.61447, "r": 310.00732, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 326.71701, "t": 457.61447, "r": 347.70734, "b": 468.90317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "0.903", "bbox": {"l": 326.71701, "t": 457.61447, "r": 347.70734, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 363.67599, "t": 457.61447, "r": 384.66632, "b": 468.90317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "0.931", "bbox": {"l": 363.67599, "t": 457.61447, "r": 384.66632, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 396.20599, "t": 457.61447, "r": 417.19632, "b": 468.90317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "0.824", "bbox": {"l": 396.20599, "t": 457.61447, "r": 417.19632, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 446.65302, "t": 457.61447, "r": 451.26175, "b": 468.90317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "2", "bbox": {"l": 446.65302, "t": 457.61447, "r": 451.26175, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "lcel", "lcel", "ched", "ched", "nl", "ched", "ched", "ucel", "ched", "ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 7, "num_cols": 8, "table_cells": [{"bbox": {"l": 160.37, "t": 339.45749, "r": 168.04523, "b": 350.74619, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "#", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 144.592, "t": 352.40848, "r": 183.82895, "b": 363.69717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "enc-layers", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 207.974, "t": 339.45749, "r": 215.64923000000002, "b": 350.74619, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "#", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 192.19501, "t": 352.40848, "r": 231.42303, "b": 363.69717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "dec-layers", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 239.79799999999997, "t": 344.93649, "r": 278.3338, "b": 356.22519000000005, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Language", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 324.67001, "t": 339.45749, "r": 348.26419, "b": 350.74619, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 3, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 6, "text": "TEDs", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 396.271, "t": 339.45749, "r": 417.12595, "b": 350.74619, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "mAP", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 394.927, "t": 350.41647, "r": 418.46921, "b": 361.70517, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "(0.75)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 430.771, "t": 339.45749, "r": 467.14142000000004, "b": 350.74619, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "Inference", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 427.14801, "t": 350.41647, "r": 470.76955999999996, "b": 361.70517, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "time (secs)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 286.686, "t": 352.40848, "r": 312.32812, "b": 363.69717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "simple", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 320.702, "t": 352.40848, "r": 353.71539, "b": 363.69717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "complex", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 369.306, "t": 352.40848, "r": 379.02914, "b": 363.69717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "all", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 161.90601, "t": 371.23849, "r": 166.51474, "b": 382.52719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 371.23849, "r": 214.11774, "b": 382.52719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 365.75848, "r": 272.94495, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 365.75848, "r": 310.00732, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.965 0.969", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 365.75848, "r": 347.70734, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.934 0.927", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 363.67599, "t": 365.75848, "r": 384.66632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.955 0.955", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 396.20599, "t": 365.69571, "r": 417.19632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.88 0.857", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 365.69571, "r": 458.38336, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "2.73 5.39", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 161.90601, "t": 397.53949, "r": 166.51474, "b": 408.82819, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 397.53949, "r": 214.11774, "b": 408.82819, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 392.06049, "r": 272.94495, "b": 416.30017, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 392.06049, "r": 310.00732, "b": 403.34918, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.938", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 392.06049, "r": 347.70734, "b": 403.34918, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.904", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 363.67599, "t": 392.06049, "r": 384.66632, "b": 403.34918, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.927", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.61801, "t": 391.99771, "r": 418.77798, "b": 403.40298, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.853", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 391.99771, "r": 458.38336, "b": 403.40298, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "1.97", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 405.01147, "r": 310.00732, "b": 429.65018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.952 0.923", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 405.01147, "r": 347.70734, "b": 416.30017, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.909", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 362.08801, "t": 404.9486999999999, "r": 386.24799, "b": 416.35397, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.938", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 396.20599, "t": 405.01147, "r": 417.19632, "b": 416.30017, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.843", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.767, "t": 405.01147, "r": 457.15039, "b": 416.30017, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "3.77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 161.90601, "t": 423.84048, "r": 166.51474, "b": 435.12918, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 423.84048, "r": 214.11774, "b": 435.12918, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 246.71000999999998, "t": 418.3614799999999, "r": 271.41064, "b": 429.65018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 418.3614799999999, "r": 347.70734, "b": 442.60117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.897 0.901", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 362.08801, "t": 418.3614799999999, "r": 386.24799, "b": 442.65497, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.915 0.931", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.61801, "t": 418.29871, "r": 418.77798, "b": 442.60117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.859 0.834", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 418.29871, "r": 458.38336, "b": 442.60117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "1.91 3.81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 431.31246999999996, "r": 272.94495, "b": 442.60117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 431.31246999999996, "r": 310.00732, "b": 442.60117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.945", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 161.90601, "t": 450.14248999999995, "r": 166.51474, "b": 461.43118, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 450.14248999999995, "r": 214.11774, "b": 461.43118, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 444.66248, "r": 272.94495, "b": 468.90317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 444.66248, "r": 310.00732, "b": 468.90317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.952 0.944", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 444.66248, "r": 347.70734, "b": 468.90317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.92 0.903", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 362.08801, "t": 444.5996999999999, "r": 386.24799, "b": 468.90317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.942 0.931", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.61801, "t": 444.5996999999999, "r": 418.77798, "b": 468.90317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.857 0.824", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 444.5996999999999, "r": 458.38336, "b": 468.90317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "1.22 2", "column_header": false, "row_header": false, "row_section": false}]}}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_header", "id": 8, "page_no": 0, "cluster": {"id": 8, "label": "page_header", "bbox": {"l": 194.478, "t": 91.49352999999996, "r": 447.54476999999997, "b": 102.78223000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9373534917831421, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 91.49352999999996, "r": 447.54476999999997, "b": 102.78223000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Optimized Table Tokenization for Table Structure Recognition"}, {"label": "page_header", "id": 9, "page_no": 0, "cluster": {"id": 9, "label": "page_header", "bbox": {"l": 475.98441, "t": 91.49352999999996, "r": 480.59314, "b": 102.78223000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.8858680725097656, "cells": [{"id": 1, "text": "9", "bbox": {"l": 475.98441, "t": 91.49352999999996, "r": 480.59314, "b": 102.78223000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "9"}, {"label": "text", "id": 4, "page_no": 0, "cluster": {"id": 4, "label": "text", "bbox": {"l": 134.765, "t": 116.46301000000005, "r": 480.59665, "b": 152.90697999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.9806433916091919, "cells": [{"id": 2, "text": "order to compute the TED score. Inference timing results for all experiments", "bbox": {"l": 134.765, "t": 116.46301000000005, "r": 480.59067, "b": 128.99597000000006, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "were obtained from the same machine on a single core with AMD EPYC 7763", "bbox": {"l": 134.765, "t": 128.41803000000004, "r": 480.59665, "b": 140.95099000000005, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "CPU @2.45 GHz.", "bbox": {"l": 134.765, "t": 140.37401999999997, "r": 210.78761, "b": 152.90697999999998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "order to compute the TED score. Inference timing results for all experiments were obtained from the same machine on a single core with AMD EPYC 7763 CPU @2.45 GHz."}, {"label": "section_header", "id": 7, "page_no": 0, "cluster": {"id": 7, "label": "section_header", "bbox": {"l": 134.765, "t": 166.70514000000003, "r": 318.45145, "b": 179.20818999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9577404260635376, "cells": [{"id": 5, "text": "5.1", "bbox": {"l": 134.765, "t": 166.70514000000003, "r": 149.40306, "b": 179.20818999999995, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Hyper Parameter Optimization", "bbox": {"l": 160.85905, "t": 166.70514000000003, "r": 318.45145, "b": 179.20818999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5.1 Hyper Parameter Optimization"}, {"label": "text", "id": 1, "page_no": 0, "cluster": {"id": 1, "label": "text", "bbox": {"l": 134.765, "t": 183.11505, "r": 480.59567, "b": 255.42400999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.98504239320755, "cells": [{"id": 7, "text": "We have chosen the PubTabNet data set to perform HPO, since it includes a", "bbox": {"l": 134.765, "t": 183.11505, "r": 479.74982000000006, "b": 195.64801, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "highly diverse set of tables. Also we report TED scores separately for simple and", "bbox": {"l": 134.765, "t": 195.07007, "r": 480.58765, "b": 207.60303, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "complex tables (tables with cell spans). Results are presented in Table. 1. It is", "bbox": {"l": 134.765, "t": 207.02502000000004, "r": 480.58859000000007, "b": 219.55798000000004, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "evident that with OTSL, our model achieves the same TED score and slightly", "bbox": {"l": 134.765, "t": 218.98004000000003, "r": 480.59567, "b": 231.51300000000003, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "better mAP scores in comparison to HTML. However OTSL yields a", "bbox": {"l": 134.765, "t": 230.93506000000002, "r": 440.9425, "b": 243.46802000000002, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "2x speed", "bbox": {"l": 444.86800999999997, "t": 230.98486000000003, "r": 480.58792, "b": 243.46802000000002, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "up", "bbox": {"l": 134.765, "t": 242.94086000000004, "r": 145.19585, "b": 255.42400999999995, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "in the inference runtime over HTML.", "bbox": {"l": 149.149, "t": 242.89104999999995, "r": 311.22256, "b": 255.42400999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "We have chosen the PubTabNet data set to perform HPO, since it includes a highly diverse set of tables. Also we report TED scores separately for simple and complex tables (tables with cell spans). Results are presented in Table. 1. It is evident that with OTSL, our model achieves the same TED score and slightly better mAP scores in comparison to HTML. However OTSL yields a 2x speed up in the inference runtime over HTML."}, {"label": "caption", "id": 5, "page_no": 0, "cluster": {"id": 5, "label": "caption", "bbox": {"l": 134.765, "t": 272.79474000000005, "r": 480.59890999999993, "b": 327.98218, "coord_origin": "TOPLEFT"}, "confidence": 0.9591909050941467, "cells": [{"id": 15, "text": "Table", "bbox": {"l": 134.765, "t": 272.79474000000005, "r": 159.22983, "b": 284.1999799999999, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "1.", "bbox": {"l": 167.34442, "t": 272.79474000000005, "r": 174.71301, "b": 284.1999799999999, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "HPO performed in OTSL and HTML representation on the same", "bbox": {"l": 188.133, "t": 272.85748, "r": 480.58101999999997, "b": 284.14618, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "transformer-based TableFormer [9] architecture, trained only on PubTabNet [22]. Ef-", "bbox": {"l": 134.765, "t": 283.81647, "r": 480.59890999999993, "b": 295.10516000000007, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "fects of reducing the # of layers in encoder and decoder stages of the model show that", "bbox": {"l": 134.765, "t": 294.77547999999996, "r": 480.59887999999995, "b": 306.06418, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "smaller models trained on OTSL perform better, especially in recognizing complex", "bbox": {"l": 134.765, "t": 305.73447, "r": 480.59180000000003, "b": 317.02316, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "table structures, and maintain a much higher mAP score than the HTML counterpart.", "bbox": {"l": 134.765, "t": 316.69348, "r": 480.58471999999995, "b": 327.98218, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 1. HPO performed in OTSL and HTML representation on the same transformer-based TableFormer [9] architecture, trained only on PubTabNet [22]. Effects of reducing the # of layers in encoder and decoder stages of the model show that smaller models trained on OTSL perform better, especially in recognizing complex table structures, and maintain a much higher mAP score than the HTML counterpart."}, {"label": "table", "id": 0, "page_no": 0, "cluster": {"id": 0, "label": "table", "bbox": {"l": 139.66741943359375, "t": 337.54541015625, "r": 475.00927734375, "b": 469.4945373535156, "coord_origin": "TOPLEFT"}, "confidence": 0.9901031255722046, "cells": [{"id": 22, "text": "#", "bbox": {"l": 160.37, "t": 339.45749, "r": 168.04523, "b": 350.74619, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "enc-layers", "bbox": {"l": 144.592, "t": 352.40848, "r": 183.82895, "b": 363.69717, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "#", "bbox": {"l": 207.974, "t": 339.45749, "r": 215.64923000000002, "b": 350.74619, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "dec-layers", "bbox": {"l": 192.19501, "t": 352.40848, "r": 231.42303, "b": 363.69717, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "Language", "bbox": {"l": 239.79799999999997, "t": 344.93649, "r": 278.3338, "b": 356.22519000000005, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "TEDs", "bbox": {"l": 324.67001, "t": 339.45749, "r": 348.26419, "b": 350.74619, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "mAP", "bbox": {"l": 396.271, "t": 339.45749, "r": 417.12595, "b": 350.74619, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "(0.75)", "bbox": {"l": 394.927, "t": 350.41647, "r": 418.46921, "b": 361.70517, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Inference", "bbox": {"l": 430.771, "t": 339.45749, "r": 467.14142000000004, "b": 350.74619, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "time (secs)", "bbox": {"l": 427.14801, "t": 350.41647, "r": 470.76955999999996, "b": 361.70517, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "simple", "bbox": {"l": 286.686, "t": 352.40848, "r": 312.32812, "b": 363.69717, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "complex", "bbox": {"l": 320.702, "t": 352.40848, "r": 353.71539, "b": 363.69717, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "all", "bbox": {"l": 369.306, "t": 352.40848, "r": 379.02914, "b": 363.69717, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "6", "bbox": {"l": 161.90601, "t": 371.23849, "r": 166.51474, "b": 382.52719, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "6", "bbox": {"l": 209.509, "t": 371.23849, "r": 214.11774, "b": 382.52719, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 365.75848, "r": 271.41064, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "0.965", "bbox": {"l": 289.017, "t": 365.75848, "r": 310.00732, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "0.934", "bbox": {"l": 326.71701, "t": 365.75848, "r": 347.70734, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "0.955", "bbox": {"l": 363.67599, "t": 365.75848, "r": 384.66632, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "0.88", "bbox": {"l": 397.26999, "t": 365.69571, "r": 416.12634, "b": 377.10098000000005, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "2.73", "bbox": {"l": 439.52701, "t": 365.69571, "r": 458.38336, "b": 377.10098000000005, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 378.71048, "r": 272.94495, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "0.969", "bbox": {"l": 289.017, "t": 378.71048, "r": 310.00732, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "0.927", "bbox": {"l": 326.71701, "t": 378.71048, "r": 347.70734, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "0.955", "bbox": {"l": 363.67599, "t": 378.71048, "r": 384.66632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "0.857", "bbox": {"l": 396.20599, "t": 378.71048, "r": 417.19632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "5.39", "bbox": {"l": 440.767, "t": 378.71048, "r": 457.15039, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "4", "bbox": {"l": 161.90601, "t": 397.53949, "r": 166.51474, "b": 408.82819, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "4", "bbox": {"l": 209.509, "t": 397.53949, "r": 214.11774, "b": 408.82819, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 392.06049, "r": 271.41064, "b": 403.34918, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "0.938", "bbox": {"l": 289.017, "t": 392.06049, "r": 310.00732, "b": 403.34918, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "0.904", "bbox": {"l": 326.71701, "t": 392.06049, "r": 347.70734, "b": 403.34918, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "0.927", "bbox": {"l": 363.67599, "t": 392.06049, "r": 384.66632, "b": 403.34918, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "0.853", "bbox": {"l": 394.61801, "t": 391.99771, "r": 418.77798, "b": 403.40298, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "1.97", "bbox": {"l": 439.52701, "t": 391.99771, "r": 458.38336, "b": 403.40298, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 405.01147, "r": 272.94495, "b": 416.30017, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "0.952", "bbox": {"l": 289.017, "t": 405.01147, "r": 310.00732, "b": 416.30017, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "0.909", "bbox": {"l": 326.71701, "t": 405.01147, "r": 347.70734, "b": 416.30017, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "0.938", "bbox": {"l": 362.08801, "t": 404.9486999999999, "r": 386.24799, "b": 416.35397, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "0.843", "bbox": {"l": 396.20599, "t": 405.01147, "r": 417.19632, "b": 416.30017, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "3.77", "bbox": {"l": 440.767, "t": 405.01147, "r": 457.15039, "b": 416.30017, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "2", "bbox": {"l": 161.90601, "t": 423.84048, "r": 166.51474, "b": 435.12918, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "4", "bbox": {"l": 209.509, "t": 423.84048, "r": 214.11774, "b": 435.12918, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 418.3614799999999, "r": 271.41064, "b": 429.65018, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "0.923", "bbox": {"l": 289.017, "t": 418.3614799999999, "r": 310.00732, "b": 429.65018, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "0.897", "bbox": {"l": 326.71701, "t": 418.3614799999999, "r": 347.70734, "b": 429.65018, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "0.915", "bbox": {"l": 363.67599, "t": 418.3614799999999, "r": 384.66632, "b": 429.65018, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "0.859", "bbox": {"l": 394.61801, "t": 418.29871, "r": 418.77798, "b": 429.70398, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "1.91", "bbox": {"l": 439.52701, "t": 418.29871, "r": 458.38336, "b": 429.70398, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 431.31246999999996, "r": 272.94495, "b": 442.60117, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "0.945", "bbox": {"l": 289.017, "t": 431.31246999999996, "r": 310.00732, "b": 442.60117, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "0.901", "bbox": {"l": 326.71701, "t": 431.31246999999996, "r": 347.70734, "b": 442.60117, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "0.931", "bbox": {"l": 362.08801, "t": 431.24969, "r": 386.24799, "b": 442.65497, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "0.834", "bbox": {"l": 396.20599, "t": 431.31246999999996, "r": 417.19632, "b": 442.60117, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "3.81", "bbox": {"l": 440.767, "t": 431.31246999999996, "r": 457.15039, "b": 442.60117, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "4", "bbox": {"l": 161.90601, "t": 450.14248999999995, "r": 166.51474, "b": 461.43118, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "2", "bbox": {"l": 209.509, "t": 450.14248999999995, "r": 214.11774, "b": 461.43118, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 444.66248, "r": 271.41064, "b": 455.95117, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "0.952", "bbox": {"l": 289.017, "t": 444.66248, "r": 310.00732, "b": 455.95117, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "0.92", "bbox": {"l": 329.021, "t": 444.66248, "r": 345.40439, "b": 455.95117, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "0.942", "bbox": {"l": 362.08801, "t": 444.5996999999999, "r": 386.24799, "b": 456.00497, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "0.857", "bbox": {"l": 394.61801, "t": 444.5996999999999, "r": 418.77798, "b": 456.00497, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "1.22", "bbox": {"l": 439.52701, "t": 444.5996999999999, "r": 458.38336, "b": 456.00497, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 457.61447, "r": 272.94495, "b": 468.90317, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "0.944", "bbox": {"l": 289.017, "t": 457.61447, "r": 310.00732, "b": 468.90317, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "0.903", "bbox": {"l": 326.71701, "t": 457.61447, "r": 347.70734, "b": 468.90317, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "0.931", "bbox": {"l": 363.67599, "t": 457.61447, "r": 384.66632, "b": 468.90317, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "0.824", "bbox": {"l": 396.20599, "t": 457.61447, "r": 417.19632, "b": 468.90317, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "2", "bbox": {"l": 446.65302, "t": 457.61447, "r": 451.26175, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": [{"id": 10, "label": "text", "bbox": {"l": 160.37, "t": 339.45749, "r": 168.04523, "b": 350.74619, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "#", "bbox": {"l": 160.37, "t": 339.45749, "r": 168.04523, "b": 350.74619, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 144.592, "t": 352.40848, "r": 183.82895, "b": 363.69717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "enc-layers", "bbox": {"l": 144.592, "t": 352.40848, "r": 183.82895, "b": 363.69717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 207.974, "t": 339.45749, "r": 215.64923000000002, "b": 350.74619, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "#", "bbox": {"l": 207.974, "t": 339.45749, "r": 215.64923000000002, "b": 350.74619, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 192.19501, "t": 352.40848, "r": 231.42303, "b": 363.69717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "dec-layers", "bbox": {"l": 192.19501, "t": 352.40848, "r": 231.42303, "b": 363.69717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 239.79799999999997, "t": 344.93649, "r": 278.3338, "b": 356.22519000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "Language", "bbox": {"l": 239.79799999999997, "t": 344.93649, "r": 278.3338, "b": 356.22519000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 324.67001, "t": 339.45749, "r": 348.26419, "b": 350.74619, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "TEDs", "bbox": {"l": 324.67001, "t": 339.45749, "r": 348.26419, "b": 350.74619, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 396.271, "t": 339.45749, "r": 417.12595, "b": 350.74619, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "mAP", "bbox": {"l": 396.271, "t": 339.45749, "r": 417.12595, "b": 350.74619, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 394.927, "t": 350.41647, "r": 418.46921, "b": 361.70517, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "(0.75)", "bbox": {"l": 394.927, "t": 350.41647, "r": 418.46921, "b": 361.70517, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 430.771, "t": 339.45749, "r": 467.14142000000004, "b": 350.74619, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "Inference", "bbox": {"l": 430.771, "t": 339.45749, "r": 467.14142000000004, "b": 350.74619, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 427.14801, "t": 350.41647, "r": 470.76955999999996, "b": 361.70517, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "time (secs)", "bbox": {"l": 427.14801, "t": 350.41647, "r": 470.76955999999996, "b": 361.70517, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 286.686, "t": 352.40848, "r": 312.32812, "b": 363.69717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "simple", "bbox": {"l": 286.686, "t": 352.40848, "r": 312.32812, "b": 363.69717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 320.702, "t": 352.40848, "r": 353.71539, "b": 363.69717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "complex", "bbox": {"l": 320.702, "t": 352.40848, "r": 353.71539, "b": 363.69717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 369.306, "t": 352.40848, "r": 379.02914, "b": 363.69717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "all", "bbox": {"l": 369.306, "t": 352.40848, "r": 379.02914, "b": 363.69717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 161.90601, "t": 371.23849, "r": 166.51474, "b": 382.52719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "6", "bbox": {"l": 161.90601, "t": 371.23849, "r": 166.51474, "b": 382.52719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 209.509, "t": 371.23849, "r": 214.11774, "b": 382.52719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "6", "bbox": {"l": 209.509, "t": 371.23849, "r": 214.11774, "b": 382.52719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 246.71000999999998, "t": 365.75848, "r": 271.41064, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 365.75848, "r": 271.41064, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 289.017, "t": 365.75848, "r": 310.00732, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "0.965", "bbox": {"l": 289.017, "t": 365.75848, "r": 310.00732, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 326.71701, "t": 365.75848, "r": 347.70734, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "0.934", "bbox": {"l": 326.71701, "t": 365.75848, "r": 347.70734, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 363.67599, "t": 365.75848, "r": 384.66632, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "0.955", "bbox": {"l": 363.67599, "t": 365.75848, "r": 384.66632, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 397.26999, "t": 365.69571, "r": 416.12634, "b": 377.10098000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "0.88", "bbox": {"l": 397.26999, "t": 365.69571, "r": 416.12634, "b": 377.10098000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 439.52701, "t": 365.69571, "r": 458.38336, "b": 377.10098000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "2.73", "bbox": {"l": 439.52701, "t": 365.69571, "r": 458.38336, "b": 377.10098000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 245.17598999999998, "t": 378.71048, "r": 272.94495, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 378.71048, "r": 272.94495, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 289.017, "t": 378.71048, "r": 310.00732, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "0.969", "bbox": {"l": 289.017, "t": 378.71048, "r": 310.00732, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 326.71701, "t": 378.71048, "r": 347.70734, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "0.927", "bbox": {"l": 326.71701, "t": 378.71048, "r": 347.70734, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 363.67599, "t": 378.71048, "r": 384.66632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "0.955", "bbox": {"l": 363.67599, "t": 378.71048, "r": 384.66632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 396.20599, "t": 378.71048, "r": 417.19632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "0.857", "bbox": {"l": 396.20599, "t": 378.71048, "r": 417.19632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 440.767, "t": 378.71048, "r": 457.15039, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "5.39", "bbox": {"l": 440.767, "t": 378.71048, "r": 457.15039, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 161.90601, "t": 397.53949, "r": 166.51474, "b": 408.82819, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "4", "bbox": {"l": 161.90601, "t": 397.53949, "r": 166.51474, "b": 408.82819, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 209.509, "t": 397.53949, "r": 214.11774, "b": 408.82819, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "4", "bbox": {"l": 209.509, "t": 397.53949, "r": 214.11774, "b": 408.82819, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 246.71000999999998, "t": 392.06049, "r": 271.41064, "b": 403.34918, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 392.06049, "r": 271.41064, "b": 403.34918, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 289.017, "t": 392.06049, "r": 310.00732, "b": 403.34918, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "0.938", "bbox": {"l": 289.017, "t": 392.06049, "r": 310.00732, "b": 403.34918, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 326.71701, "t": 392.06049, "r": 347.70734, "b": 403.34918, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "0.904", "bbox": {"l": 326.71701, "t": 392.06049, "r": 347.70734, "b": 403.34918, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 363.67599, "t": 392.06049, "r": 384.66632, "b": 403.34918, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "0.927", "bbox": {"l": 363.67599, "t": 392.06049, "r": 384.66632, "b": 403.34918, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 394.61801, "t": 391.99771, "r": 418.77798, "b": 403.40298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "0.853", "bbox": {"l": 394.61801, "t": 391.99771, "r": 418.77798, "b": 403.40298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 439.52701, "t": 391.99771, "r": 458.38336, "b": 403.40298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "1.97", "bbox": {"l": 439.52701, "t": 391.99771, "r": 458.38336, "b": 403.40298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 245.17598999999998, "t": 405.01147, "r": 272.94495, "b": 416.30017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 405.01147, "r": 272.94495, "b": 416.30017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 289.017, "t": 405.01147, "r": 310.00732, "b": 416.30017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "0.952", "bbox": {"l": 289.017, "t": 405.01147, "r": 310.00732, "b": 416.30017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 326.71701, "t": 405.01147, "r": 347.70734, "b": 416.30017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "0.909", "bbox": {"l": 326.71701, "t": 405.01147, "r": 347.70734, "b": 416.30017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 362.08801, "t": 404.9486999999999, "r": 386.24799, "b": 416.35397, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "0.938", "bbox": {"l": 362.08801, "t": 404.9486999999999, "r": 386.24799, "b": 416.35397, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 396.20599, "t": 405.01147, "r": 417.19632, "b": 416.30017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "0.843", "bbox": {"l": 396.20599, "t": 405.01147, "r": 417.19632, "b": 416.30017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 440.767, "t": 405.01147, "r": 457.15039, "b": 416.30017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "3.77", "bbox": {"l": 440.767, "t": 405.01147, "r": 457.15039, "b": 416.30017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 161.90601, "t": 423.84048, "r": 166.51474, "b": 435.12918, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "2", "bbox": {"l": 161.90601, "t": 423.84048, "r": 166.51474, "b": 435.12918, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 209.509, "t": 423.84048, "r": 214.11774, "b": 435.12918, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "4", "bbox": {"l": 209.509, "t": 423.84048, "r": 214.11774, "b": 435.12918, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 246.71000999999998, "t": 418.3614799999999, "r": 271.41064, "b": 429.65018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 418.3614799999999, "r": 271.41064, "b": 429.65018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 289.017, "t": 418.3614799999999, "r": 310.00732, "b": 429.65018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "0.923", "bbox": {"l": 289.017, "t": 418.3614799999999, "r": 310.00732, "b": 429.65018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 326.71701, "t": 418.3614799999999, "r": 347.70734, "b": 429.65018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "0.897", "bbox": {"l": 326.71701, "t": 418.3614799999999, "r": 347.70734, "b": 429.65018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 363.67599, "t": 418.3614799999999, "r": 384.66632, "b": 429.65018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "0.915", "bbox": {"l": 363.67599, "t": 418.3614799999999, "r": 384.66632, "b": 429.65018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 394.61801, "t": 418.29871, "r": 418.77798, "b": 429.70398, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "0.859", "bbox": {"l": 394.61801, "t": 418.29871, "r": 418.77798, "b": 429.70398, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 439.52701, "t": 418.29871, "r": 458.38336, "b": 429.70398, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "1.91", "bbox": {"l": 439.52701, "t": 418.29871, "r": 458.38336, "b": 429.70398, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 245.17598999999998, "t": 431.31246999999996, "r": 272.94495, "b": 442.60117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 431.31246999999996, "r": 272.94495, "b": 442.60117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 289.017, "t": 431.31246999999996, "r": 310.00732, "b": 442.60117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "0.945", "bbox": {"l": 289.017, "t": 431.31246999999996, "r": 310.00732, "b": 442.60117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 326.71701, "t": 431.31246999999996, "r": 347.70734, "b": 442.60117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "0.901", "bbox": {"l": 326.71701, "t": 431.31246999999996, "r": 347.70734, "b": 442.60117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 362.08801, "t": 431.24969, "r": 386.24799, "b": 442.65497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "0.931", "bbox": {"l": 362.08801, "t": 431.24969, "r": 386.24799, "b": 442.65497, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 396.20599, "t": 431.31246999999996, "r": 417.19632, "b": 442.60117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "0.834", "bbox": {"l": 396.20599, "t": 431.31246999999996, "r": 417.19632, "b": 442.60117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 440.767, "t": 431.31246999999996, "r": 457.15039, "b": 442.60117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "3.81", "bbox": {"l": 440.767, "t": 431.31246999999996, "r": 457.15039, "b": 442.60117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 161.90601, "t": 450.14248999999995, "r": 166.51474, "b": 461.43118, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "4", "bbox": {"l": 161.90601, "t": 450.14248999999995, "r": 166.51474, "b": 461.43118, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 209.509, "t": 450.14248999999995, "r": 214.11774, "b": 461.43118, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "2", "bbox": {"l": 209.509, "t": 450.14248999999995, "r": 214.11774, "b": 461.43118, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 246.71000999999998, "t": 444.66248, "r": 271.41064, "b": 455.95117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 444.66248, "r": 271.41064, "b": 455.95117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 289.017, "t": 444.66248, "r": 310.00732, "b": 455.95117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "0.952", "bbox": {"l": 289.017, "t": 444.66248, "r": 310.00732, "b": 455.95117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 329.021, "t": 444.66248, "r": 345.40439, "b": 455.95117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "0.92", "bbox": {"l": 329.021, "t": 444.66248, "r": 345.40439, "b": 455.95117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 362.08801, "t": 444.5996999999999, "r": 386.24799, "b": 456.00497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "0.942", "bbox": {"l": 362.08801, "t": 444.5996999999999, "r": 386.24799, "b": 456.00497, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 394.61801, "t": 444.5996999999999, "r": 418.77798, "b": 456.00497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "0.857", "bbox": {"l": 394.61801, "t": 444.5996999999999, "r": 418.77798, "b": 456.00497, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 439.52701, "t": 444.5996999999999, "r": 458.38336, "b": 456.00497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "1.22", "bbox": {"l": 439.52701, "t": 444.5996999999999, "r": 458.38336, "b": 456.00497, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 245.17598999999998, "t": 457.61447, "r": 272.94495, "b": 468.90317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 457.61447, "r": 272.94495, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 289.017, "t": 457.61447, "r": 310.00732, "b": 468.90317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "0.944", "bbox": {"l": 289.017, "t": 457.61447, "r": 310.00732, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 326.71701, "t": 457.61447, "r": 347.70734, "b": 468.90317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "0.903", "bbox": {"l": 326.71701, "t": 457.61447, "r": 347.70734, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 363.67599, "t": 457.61447, "r": 384.66632, "b": 468.90317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "0.931", "bbox": {"l": 363.67599, "t": 457.61447, "r": 384.66632, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 396.20599, "t": 457.61447, "r": 417.19632, "b": 468.90317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "0.824", "bbox": {"l": 396.20599, "t": 457.61447, "r": 417.19632, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 446.65302, "t": 457.61447, "r": 451.26175, "b": 468.90317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "2", "bbox": {"l": 446.65302, "t": 457.61447, "r": 451.26175, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "lcel", "lcel", "ched", "ched", "nl", "ched", "ched", "ucel", "ched", "ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 7, "num_cols": 8, "table_cells": [{"bbox": {"l": 160.37, "t": 339.45749, "r": 168.04523, "b": 350.74619, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "#", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 144.592, "t": 352.40848, "r": 183.82895, "b": 363.69717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "enc-layers", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 207.974, "t": 339.45749, "r": 215.64923000000002, "b": 350.74619, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "#", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 192.19501, "t": 352.40848, "r": 231.42303, "b": 363.69717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "dec-layers", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 239.79799999999997, "t": 344.93649, "r": 278.3338, "b": 356.22519000000005, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Language", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 324.67001, "t": 339.45749, "r": 348.26419, "b": 350.74619, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 3, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 6, "text": "TEDs", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 396.271, "t": 339.45749, "r": 417.12595, "b": 350.74619, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "mAP", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 394.927, "t": 350.41647, "r": 418.46921, "b": 361.70517, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "(0.75)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 430.771, "t": 339.45749, "r": 467.14142000000004, "b": 350.74619, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "Inference", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 427.14801, "t": 350.41647, "r": 470.76955999999996, "b": 361.70517, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "time (secs)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 286.686, "t": 352.40848, "r": 312.32812, "b": 363.69717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "simple", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 320.702, "t": 352.40848, "r": 353.71539, "b": 363.69717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "complex", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 369.306, "t": 352.40848, "r": 379.02914, "b": 363.69717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "all", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 161.90601, "t": 371.23849, "r": 166.51474, "b": 382.52719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 371.23849, "r": 214.11774, "b": 382.52719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 365.75848, "r": 272.94495, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 365.75848, "r": 310.00732, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.965 0.969", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 365.75848, "r": 347.70734, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.934 0.927", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 363.67599, "t": 365.75848, "r": 384.66632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.955 0.955", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 396.20599, "t": 365.69571, "r": 417.19632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.88 0.857", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 365.69571, "r": 458.38336, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "2.73 5.39", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 161.90601, "t": 397.53949, "r": 166.51474, "b": 408.82819, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 397.53949, "r": 214.11774, "b": 408.82819, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 392.06049, "r": 272.94495, "b": 416.30017, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 392.06049, "r": 310.00732, "b": 403.34918, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.938", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 392.06049, "r": 347.70734, "b": 403.34918, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.904", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 363.67599, "t": 392.06049, "r": 384.66632, "b": 403.34918, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.927", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.61801, "t": 391.99771, "r": 418.77798, "b": 403.40298, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.853", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 391.99771, "r": 458.38336, "b": 403.40298, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "1.97", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 405.01147, "r": 310.00732, "b": 429.65018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.952 0.923", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 405.01147, "r": 347.70734, "b": 416.30017, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.909", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 362.08801, "t": 404.9486999999999, "r": 386.24799, "b": 416.35397, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.938", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 396.20599, "t": 405.01147, "r": 417.19632, "b": 416.30017, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.843", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.767, "t": 405.01147, "r": 457.15039, "b": 416.30017, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "3.77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 161.90601, "t": 423.84048, "r": 166.51474, "b": 435.12918, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 423.84048, "r": 214.11774, "b": 435.12918, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 246.71000999999998, "t": 418.3614799999999, "r": 271.41064, "b": 429.65018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 418.3614799999999, "r": 347.70734, "b": 442.60117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.897 0.901", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 362.08801, "t": 418.3614799999999, "r": 386.24799, "b": 442.65497, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.915 0.931", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.61801, "t": 418.29871, "r": 418.77798, "b": 442.60117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.859 0.834", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 418.29871, "r": 458.38336, "b": 442.60117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "1.91 3.81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 431.31246999999996, "r": 272.94495, "b": 442.60117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 431.31246999999996, "r": 310.00732, "b": 442.60117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.945", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 161.90601, "t": 450.14248999999995, "r": 166.51474, "b": 461.43118, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 450.14248999999995, "r": 214.11774, "b": 461.43118, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 444.66248, "r": 272.94495, "b": 468.90317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 444.66248, "r": 310.00732, "b": 468.90317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.952 0.944", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 444.66248, "r": 347.70734, "b": 468.90317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.92 0.903", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 362.08801, "t": 444.5996999999999, "r": 386.24799, "b": 468.90317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.942 0.931", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.61801, "t": 444.5996999999999, "r": 418.77798, "b": 468.90317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.857 0.824", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 444.5996999999999, "r": 458.38336, "b": 468.90317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "1.22 2", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "section_header", "id": 6, "page_no": 0, "cluster": {"id": 6, "label": "section_header", "bbox": {"l": 134.765, "t": 505.67111, "r": 264.40829, "b": 518.17419, "coord_origin": "TOPLEFT"}, "confidence": 0.9589294195175171, "cells": [{"id": 91, "text": "5.2", "bbox": {"l": 134.765, "t": 505.67111, "r": 149.40306, "b": 518.17419, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Quantitative Results", "bbox": {"l": 160.85905, "t": 505.67111, "r": 264.40829, "b": 518.17419, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5.2 Quantitative Results"}, {"label": "text", "id": 3, "page_no": 0, "cluster": {"id": 3, "label": "text", "bbox": {"l": 134.765, "t": 522.08005, "r": 480.72003, "b": 618.3, "coord_origin": "TOPLEFT"}, "confidence": 0.9849975109100342, "cells": [{"id": 93, "text": "We picked the model parameter configuration that produced the best prediction", "bbox": {"l": 134.765, "t": 522.08005, "r": 479.72983, "b": 534.61301, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "quality (enc=6, dec=6, heads=8) with PubTabNet alone, then independently", "bbox": {"l": 134.765, "t": 534.03604, "r": 480.5897499999999, "b": 546.569, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "trained and evaluated it on three publicly available data sets: PubTabNet (395k", "bbox": {"l": 134.765, "t": 545.99104, "r": 480.72003, "b": 558.524, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "samples), FinTabNet (113k samples) and PubTables-1M (about 1M samples).", "bbox": {"l": 134.765, "t": 557.94604, "r": 480.60577, "b": 570.479, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "Performance results are presented in Table. 2. It is clearly evident that the model", "bbox": {"l": 134.765, "t": 569.90103, "r": 480.5936899999999, "b": 582.43399, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "trained on OTSL outperforms HTML across the board, keeping high TEDs and", "bbox": {"l": 134.765, "t": 581.85603, "r": 480.59158, "b": 594.38899, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "mAP scores even on difficult financial tables (FinTabNet) that contain sparse", "bbox": {"l": 134.765, "t": 593.81204, "r": 480.58080999999993, "b": 606.345, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "and large tables.", "bbox": {"l": 134.765, "t": 605.76704, "r": 206.79959, "b": 618.3, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "We picked the model parameter configuration that produced the best prediction quality (enc=6, dec=6, heads=8) with PubTabNet alone, then independently trained and evaluated it on three publicly available data sets: PubTabNet (395k samples), FinTabNet (113k samples) and PubTables-1M (about 1M samples). Performance results are presented in Table. 2. It is clearly evident that the model trained on OTSL outperforms HTML across the board, keeping high TEDs and mAP scores even on difficult financial tables (FinTabNet) that contain sparse and large tables."}, {"label": "text", "id": 2, "page_no": 0, "cluster": {"id": 2, "label": "text", "bbox": {"l": 134.765, "t": 617.72205, "r": 480.59857000000005, "b": 666.12, "coord_origin": "TOPLEFT"}, "confidence": 0.9850137829780579, "cells": [{"id": 101, "text": "Additionally, the results show that OTSL has an advantage over HTML", "bbox": {"l": 149.709, "t": 617.72205, "r": 480.59479, "b": 630.255, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "when applied on a bigger data set like PubTables-1M and achieves significantly", "bbox": {"l": 134.765, "t": 629.6770300000001, "r": 480.59857000000005, "b": 642.2099900000001, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "improved scores. Finally, OTSL achieves faster inference due to fewer decoding", "bbox": {"l": 134.765, "t": 641.63203, "r": 480.59384000000006, "b": 654.16499, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "steps which is a result of the reduced sequence representation.", "bbox": {"l": 134.765, "t": 653.58704, "r": 405.7995, "b": 666.12, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Additionally, the results show that OTSL has an advantage over HTML when applied on a bigger data set like PubTables-1M and achieves significantly improved scores. Finally, OTSL achieves faster inference due to fewer decoding steps which is a result of the reduced sequence representation."}], "body": [{"label": "text", "id": 4, "page_no": 0, "cluster": {"id": 4, "label": "text", "bbox": {"l": 134.765, "t": 116.46301000000005, "r": 480.59665, "b": 152.90697999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.9806433916091919, "cells": [{"id": 2, "text": "order to compute the TED score. Inference timing results for all experiments", "bbox": {"l": 134.765, "t": 116.46301000000005, "r": 480.59067, "b": 128.99597000000006, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "were obtained from the same machine on a single core with AMD EPYC 7763", "bbox": {"l": 134.765, "t": 128.41803000000004, "r": 480.59665, "b": 140.95099000000005, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "CPU @2.45 GHz.", "bbox": {"l": 134.765, "t": 140.37401999999997, "r": 210.78761, "b": 152.90697999999998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "order to compute the TED score. Inference timing results for all experiments were obtained from the same machine on a single core with AMD EPYC 7763 CPU @2.45 GHz."}, {"label": "section_header", "id": 7, "page_no": 0, "cluster": {"id": 7, "label": "section_header", "bbox": {"l": 134.765, "t": 166.70514000000003, "r": 318.45145, "b": 179.20818999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9577404260635376, "cells": [{"id": 5, "text": "5.1", "bbox": {"l": 134.765, "t": 166.70514000000003, "r": 149.40306, "b": 179.20818999999995, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Hyper Parameter Optimization", "bbox": {"l": 160.85905, "t": 166.70514000000003, "r": 318.45145, "b": 179.20818999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5.1 Hyper Parameter Optimization"}, {"label": "text", "id": 1, "page_no": 0, "cluster": {"id": 1, "label": "text", "bbox": {"l": 134.765, "t": 183.11505, "r": 480.59567, "b": 255.42400999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.98504239320755, "cells": [{"id": 7, "text": "We have chosen the PubTabNet data set to perform HPO, since it includes a", "bbox": {"l": 134.765, "t": 183.11505, "r": 479.74982000000006, "b": 195.64801, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "highly diverse set of tables. Also we report TED scores separately for simple and", "bbox": {"l": 134.765, "t": 195.07007, "r": 480.58765, "b": 207.60303, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "complex tables (tables with cell spans). Results are presented in Table. 1. It is", "bbox": {"l": 134.765, "t": 207.02502000000004, "r": 480.58859000000007, "b": 219.55798000000004, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "evident that with OTSL, our model achieves the same TED score and slightly", "bbox": {"l": 134.765, "t": 218.98004000000003, "r": 480.59567, "b": 231.51300000000003, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "better mAP scores in comparison to HTML. However OTSL yields a", "bbox": {"l": 134.765, "t": 230.93506000000002, "r": 440.9425, "b": 243.46802000000002, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "2x speed", "bbox": {"l": 444.86800999999997, "t": 230.98486000000003, "r": 480.58792, "b": 243.46802000000002, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "up", "bbox": {"l": 134.765, "t": 242.94086000000004, "r": 145.19585, "b": 255.42400999999995, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "in the inference runtime over HTML.", "bbox": {"l": 149.149, "t": 242.89104999999995, "r": 311.22256, "b": 255.42400999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "We have chosen the PubTabNet data set to perform HPO, since it includes a highly diverse set of tables. Also we report TED scores separately for simple and complex tables (tables with cell spans). Results are presented in Table. 1. It is evident that with OTSL, our model achieves the same TED score and slightly better mAP scores in comparison to HTML. However OTSL yields a 2x speed up in the inference runtime over HTML."}, {"label": "caption", "id": 5, "page_no": 0, "cluster": {"id": 5, "label": "caption", "bbox": {"l": 134.765, "t": 272.79474000000005, "r": 480.59890999999993, "b": 327.98218, "coord_origin": "TOPLEFT"}, "confidence": 0.9591909050941467, "cells": [{"id": 15, "text": "Table", "bbox": {"l": 134.765, "t": 272.79474000000005, "r": 159.22983, "b": 284.1999799999999, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "1.", "bbox": {"l": 167.34442, "t": 272.79474000000005, "r": 174.71301, "b": 284.1999799999999, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "HPO performed in OTSL and HTML representation on the same", "bbox": {"l": 188.133, "t": 272.85748, "r": 480.58101999999997, "b": 284.14618, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "transformer-based TableFormer [9] architecture, trained only on PubTabNet [22]. Ef-", "bbox": {"l": 134.765, "t": 283.81647, "r": 480.59890999999993, "b": 295.10516000000007, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "fects of reducing the # of layers in encoder and decoder stages of the model show that", "bbox": {"l": 134.765, "t": 294.77547999999996, "r": 480.59887999999995, "b": 306.06418, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "smaller models trained on OTSL perform better, especially in recognizing complex", "bbox": {"l": 134.765, "t": 305.73447, "r": 480.59180000000003, "b": 317.02316, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "table structures, and maintain a much higher mAP score than the HTML counterpart.", "bbox": {"l": 134.765, "t": 316.69348, "r": 480.58471999999995, "b": 327.98218, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 1. HPO performed in OTSL and HTML representation on the same transformer-based TableFormer [9] architecture, trained only on PubTabNet [22]. Effects of reducing the # of layers in encoder and decoder stages of the model show that smaller models trained on OTSL perform better, especially in recognizing complex table structures, and maintain a much higher mAP score than the HTML counterpart."}, {"label": "table", "id": 0, "page_no": 0, "cluster": {"id": 0, "label": "table", "bbox": {"l": 139.66741943359375, "t": 337.54541015625, "r": 475.00927734375, "b": 469.4945373535156, "coord_origin": "TOPLEFT"}, "confidence": 0.9901031255722046, "cells": [{"id": 22, "text": "#", "bbox": {"l": 160.37, "t": 339.45749, "r": 168.04523, "b": 350.74619, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "enc-layers", "bbox": {"l": 144.592, "t": 352.40848, "r": 183.82895, "b": 363.69717, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "#", "bbox": {"l": 207.974, "t": 339.45749, "r": 215.64923000000002, "b": 350.74619, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "dec-layers", "bbox": {"l": 192.19501, "t": 352.40848, "r": 231.42303, "b": 363.69717, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "Language", "bbox": {"l": 239.79799999999997, "t": 344.93649, "r": 278.3338, "b": 356.22519000000005, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "TEDs", "bbox": {"l": 324.67001, "t": 339.45749, "r": 348.26419, "b": 350.74619, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "mAP", "bbox": {"l": 396.271, "t": 339.45749, "r": 417.12595, "b": 350.74619, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "(0.75)", "bbox": {"l": 394.927, "t": 350.41647, "r": 418.46921, "b": 361.70517, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Inference", "bbox": {"l": 430.771, "t": 339.45749, "r": 467.14142000000004, "b": 350.74619, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "time (secs)", "bbox": {"l": 427.14801, "t": 350.41647, "r": 470.76955999999996, "b": 361.70517, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "simple", "bbox": {"l": 286.686, "t": 352.40848, "r": 312.32812, "b": 363.69717, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "complex", "bbox": {"l": 320.702, "t": 352.40848, "r": 353.71539, "b": 363.69717, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "all", "bbox": {"l": 369.306, "t": 352.40848, "r": 379.02914, "b": 363.69717, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "6", "bbox": {"l": 161.90601, "t": 371.23849, "r": 166.51474, "b": 382.52719, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "6", "bbox": {"l": 209.509, "t": 371.23849, "r": 214.11774, "b": 382.52719, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 365.75848, "r": 271.41064, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "0.965", "bbox": {"l": 289.017, "t": 365.75848, "r": 310.00732, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "0.934", "bbox": {"l": 326.71701, "t": 365.75848, "r": 347.70734, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "0.955", "bbox": {"l": 363.67599, "t": 365.75848, "r": 384.66632, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "0.88", "bbox": {"l": 397.26999, "t": 365.69571, "r": 416.12634, "b": 377.10098000000005, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "2.73", "bbox": {"l": 439.52701, "t": 365.69571, "r": 458.38336, "b": 377.10098000000005, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 378.71048, "r": 272.94495, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "0.969", "bbox": {"l": 289.017, "t": 378.71048, "r": 310.00732, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "0.927", "bbox": {"l": 326.71701, "t": 378.71048, "r": 347.70734, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "0.955", "bbox": {"l": 363.67599, "t": 378.71048, "r": 384.66632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "0.857", "bbox": {"l": 396.20599, "t": 378.71048, "r": 417.19632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "5.39", "bbox": {"l": 440.767, "t": 378.71048, "r": 457.15039, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "4", "bbox": {"l": 161.90601, "t": 397.53949, "r": 166.51474, "b": 408.82819, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "4", "bbox": {"l": 209.509, "t": 397.53949, "r": 214.11774, "b": 408.82819, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 392.06049, "r": 271.41064, "b": 403.34918, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "0.938", "bbox": {"l": 289.017, "t": 392.06049, "r": 310.00732, "b": 403.34918, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "0.904", "bbox": {"l": 326.71701, "t": 392.06049, "r": 347.70734, "b": 403.34918, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "0.927", "bbox": {"l": 363.67599, "t": 392.06049, "r": 384.66632, "b": 403.34918, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "0.853", "bbox": {"l": 394.61801, "t": 391.99771, "r": 418.77798, "b": 403.40298, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "1.97", "bbox": {"l": 439.52701, "t": 391.99771, "r": 458.38336, "b": 403.40298, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 405.01147, "r": 272.94495, "b": 416.30017, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "0.952", "bbox": {"l": 289.017, "t": 405.01147, "r": 310.00732, "b": 416.30017, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "0.909", "bbox": {"l": 326.71701, "t": 405.01147, "r": 347.70734, "b": 416.30017, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "0.938", "bbox": {"l": 362.08801, "t": 404.9486999999999, "r": 386.24799, "b": 416.35397, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "0.843", "bbox": {"l": 396.20599, "t": 405.01147, "r": 417.19632, "b": 416.30017, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "3.77", "bbox": {"l": 440.767, "t": 405.01147, "r": 457.15039, "b": 416.30017, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "2", "bbox": {"l": 161.90601, "t": 423.84048, "r": 166.51474, "b": 435.12918, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "4", "bbox": {"l": 209.509, "t": 423.84048, "r": 214.11774, "b": 435.12918, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 418.3614799999999, "r": 271.41064, "b": 429.65018, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "0.923", "bbox": {"l": 289.017, "t": 418.3614799999999, "r": 310.00732, "b": 429.65018, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "0.897", "bbox": {"l": 326.71701, "t": 418.3614799999999, "r": 347.70734, "b": 429.65018, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "0.915", "bbox": {"l": 363.67599, "t": 418.3614799999999, "r": 384.66632, "b": 429.65018, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "0.859", "bbox": {"l": 394.61801, "t": 418.29871, "r": 418.77798, "b": 429.70398, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "1.91", "bbox": {"l": 439.52701, "t": 418.29871, "r": 458.38336, "b": 429.70398, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 431.31246999999996, "r": 272.94495, "b": 442.60117, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "0.945", "bbox": {"l": 289.017, "t": 431.31246999999996, "r": 310.00732, "b": 442.60117, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "0.901", "bbox": {"l": 326.71701, "t": 431.31246999999996, "r": 347.70734, "b": 442.60117, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "0.931", "bbox": {"l": 362.08801, "t": 431.24969, "r": 386.24799, "b": 442.65497, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "0.834", "bbox": {"l": 396.20599, "t": 431.31246999999996, "r": 417.19632, "b": 442.60117, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "3.81", "bbox": {"l": 440.767, "t": 431.31246999999996, "r": 457.15039, "b": 442.60117, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "4", "bbox": {"l": 161.90601, "t": 450.14248999999995, "r": 166.51474, "b": 461.43118, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "2", "bbox": {"l": 209.509, "t": 450.14248999999995, "r": 214.11774, "b": 461.43118, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 444.66248, "r": 271.41064, "b": 455.95117, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "0.952", "bbox": {"l": 289.017, "t": 444.66248, "r": 310.00732, "b": 455.95117, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "0.92", "bbox": {"l": 329.021, "t": 444.66248, "r": 345.40439, "b": 455.95117, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "0.942", "bbox": {"l": 362.08801, "t": 444.5996999999999, "r": 386.24799, "b": 456.00497, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "0.857", "bbox": {"l": 394.61801, "t": 444.5996999999999, "r": 418.77798, "b": 456.00497, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "1.22", "bbox": {"l": 439.52701, "t": 444.5996999999999, "r": 458.38336, "b": 456.00497, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 457.61447, "r": 272.94495, "b": 468.90317, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "0.944", "bbox": {"l": 289.017, "t": 457.61447, "r": 310.00732, "b": 468.90317, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "0.903", "bbox": {"l": 326.71701, "t": 457.61447, "r": 347.70734, "b": 468.90317, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "0.931", "bbox": {"l": 363.67599, "t": 457.61447, "r": 384.66632, "b": 468.90317, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "0.824", "bbox": {"l": 396.20599, "t": 457.61447, "r": 417.19632, "b": 468.90317, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "2", "bbox": {"l": 446.65302, "t": 457.61447, "r": 451.26175, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": [{"id": 10, "label": "text", "bbox": {"l": 160.37, "t": 339.45749, "r": 168.04523, "b": 350.74619, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "#", "bbox": {"l": 160.37, "t": 339.45749, "r": 168.04523, "b": 350.74619, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 144.592, "t": 352.40848, "r": 183.82895, "b": 363.69717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "enc-layers", "bbox": {"l": 144.592, "t": 352.40848, "r": 183.82895, "b": 363.69717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 207.974, "t": 339.45749, "r": 215.64923000000002, "b": 350.74619, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "#", "bbox": {"l": 207.974, "t": 339.45749, "r": 215.64923000000002, "b": 350.74619, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 192.19501, "t": 352.40848, "r": 231.42303, "b": 363.69717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "dec-layers", "bbox": {"l": 192.19501, "t": 352.40848, "r": 231.42303, "b": 363.69717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 239.79799999999997, "t": 344.93649, "r": 278.3338, "b": 356.22519000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "Language", "bbox": {"l": 239.79799999999997, "t": 344.93649, "r": 278.3338, "b": 356.22519000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 324.67001, "t": 339.45749, "r": 348.26419, "b": 350.74619, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "TEDs", "bbox": {"l": 324.67001, "t": 339.45749, "r": 348.26419, "b": 350.74619, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 396.271, "t": 339.45749, "r": 417.12595, "b": 350.74619, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "mAP", "bbox": {"l": 396.271, "t": 339.45749, "r": 417.12595, "b": 350.74619, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 394.927, "t": 350.41647, "r": 418.46921, "b": 361.70517, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "(0.75)", "bbox": {"l": 394.927, "t": 350.41647, "r": 418.46921, "b": 361.70517, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 430.771, "t": 339.45749, "r": 467.14142000000004, "b": 350.74619, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "Inference", "bbox": {"l": 430.771, "t": 339.45749, "r": 467.14142000000004, "b": 350.74619, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 427.14801, "t": 350.41647, "r": 470.76955999999996, "b": 361.70517, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "time (secs)", "bbox": {"l": 427.14801, "t": 350.41647, "r": 470.76955999999996, "b": 361.70517, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 286.686, "t": 352.40848, "r": 312.32812, "b": 363.69717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "simple", "bbox": {"l": 286.686, "t": 352.40848, "r": 312.32812, "b": 363.69717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 320.702, "t": 352.40848, "r": 353.71539, "b": 363.69717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "complex", "bbox": {"l": 320.702, "t": 352.40848, "r": 353.71539, "b": 363.69717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 369.306, "t": 352.40848, "r": 379.02914, "b": 363.69717, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "all", "bbox": {"l": 369.306, "t": 352.40848, "r": 379.02914, "b": 363.69717, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 161.90601, "t": 371.23849, "r": 166.51474, "b": 382.52719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "6", "bbox": {"l": 161.90601, "t": 371.23849, "r": 166.51474, "b": 382.52719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 209.509, "t": 371.23849, "r": 214.11774, "b": 382.52719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "6", "bbox": {"l": 209.509, "t": 371.23849, "r": 214.11774, "b": 382.52719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 246.71000999999998, "t": 365.75848, "r": 271.41064, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 365.75848, "r": 271.41064, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 289.017, "t": 365.75848, "r": 310.00732, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "0.965", "bbox": {"l": 289.017, "t": 365.75848, "r": 310.00732, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 326.71701, "t": 365.75848, "r": 347.70734, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "0.934", "bbox": {"l": 326.71701, "t": 365.75848, "r": 347.70734, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 363.67599, "t": 365.75848, "r": 384.66632, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "0.955", "bbox": {"l": 363.67599, "t": 365.75848, "r": 384.66632, "b": 377.04717999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 397.26999, "t": 365.69571, "r": 416.12634, "b": 377.10098000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "0.88", "bbox": {"l": 397.26999, "t": 365.69571, "r": 416.12634, "b": 377.10098000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 439.52701, "t": 365.69571, "r": 458.38336, "b": 377.10098000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "2.73", "bbox": {"l": 439.52701, "t": 365.69571, "r": 458.38336, "b": 377.10098000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 245.17598999999998, "t": 378.71048, "r": 272.94495, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 378.71048, "r": 272.94495, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 289.017, "t": 378.71048, "r": 310.00732, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "0.969", "bbox": {"l": 289.017, "t": 378.71048, "r": 310.00732, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 326.71701, "t": 378.71048, "r": 347.70734, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "0.927", "bbox": {"l": 326.71701, "t": 378.71048, "r": 347.70734, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 363.67599, "t": 378.71048, "r": 384.66632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "0.955", "bbox": {"l": 363.67599, "t": 378.71048, "r": 384.66632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 396.20599, "t": 378.71048, "r": 417.19632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "0.857", "bbox": {"l": 396.20599, "t": 378.71048, "r": 417.19632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 440.767, "t": 378.71048, "r": 457.15039, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "5.39", "bbox": {"l": 440.767, "t": 378.71048, "r": 457.15039, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 161.90601, "t": 397.53949, "r": 166.51474, "b": 408.82819, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "4", "bbox": {"l": 161.90601, "t": 397.53949, "r": 166.51474, "b": 408.82819, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 209.509, "t": 397.53949, "r": 214.11774, "b": 408.82819, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "4", "bbox": {"l": 209.509, "t": 397.53949, "r": 214.11774, "b": 408.82819, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 246.71000999999998, "t": 392.06049, "r": 271.41064, "b": 403.34918, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 392.06049, "r": 271.41064, "b": 403.34918, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 289.017, "t": 392.06049, "r": 310.00732, "b": 403.34918, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "0.938", "bbox": {"l": 289.017, "t": 392.06049, "r": 310.00732, "b": 403.34918, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 326.71701, "t": 392.06049, "r": 347.70734, "b": 403.34918, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "0.904", "bbox": {"l": 326.71701, "t": 392.06049, "r": 347.70734, "b": 403.34918, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 363.67599, "t": 392.06049, "r": 384.66632, "b": 403.34918, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "0.927", "bbox": {"l": 363.67599, "t": 392.06049, "r": 384.66632, "b": 403.34918, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 394.61801, "t": 391.99771, "r": 418.77798, "b": 403.40298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "0.853", "bbox": {"l": 394.61801, "t": 391.99771, "r": 418.77798, "b": 403.40298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 439.52701, "t": 391.99771, "r": 458.38336, "b": 403.40298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "1.97", "bbox": {"l": 439.52701, "t": 391.99771, "r": 458.38336, "b": 403.40298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 245.17598999999998, "t": 405.01147, "r": 272.94495, "b": 416.30017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 405.01147, "r": 272.94495, "b": 416.30017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 289.017, "t": 405.01147, "r": 310.00732, "b": 416.30017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "0.952", "bbox": {"l": 289.017, "t": 405.01147, "r": 310.00732, "b": 416.30017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 326.71701, "t": 405.01147, "r": 347.70734, "b": 416.30017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "0.909", "bbox": {"l": 326.71701, "t": 405.01147, "r": 347.70734, "b": 416.30017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 362.08801, "t": 404.9486999999999, "r": 386.24799, "b": 416.35397, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "0.938", "bbox": {"l": 362.08801, "t": 404.9486999999999, "r": 386.24799, "b": 416.35397, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 396.20599, "t": 405.01147, "r": 417.19632, "b": 416.30017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "0.843", "bbox": {"l": 396.20599, "t": 405.01147, "r": 417.19632, "b": 416.30017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 440.767, "t": 405.01147, "r": 457.15039, "b": 416.30017, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "3.77", "bbox": {"l": 440.767, "t": 405.01147, "r": 457.15039, "b": 416.30017, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 161.90601, "t": 423.84048, "r": 166.51474, "b": 435.12918, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "2", "bbox": {"l": 161.90601, "t": 423.84048, "r": 166.51474, "b": 435.12918, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 209.509, "t": 423.84048, "r": 214.11774, "b": 435.12918, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "4", "bbox": {"l": 209.509, "t": 423.84048, "r": 214.11774, "b": 435.12918, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 246.71000999999998, "t": 418.3614799999999, "r": 271.41064, "b": 429.65018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 418.3614799999999, "r": 271.41064, "b": 429.65018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 289.017, "t": 418.3614799999999, "r": 310.00732, "b": 429.65018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "0.923", "bbox": {"l": 289.017, "t": 418.3614799999999, "r": 310.00732, "b": 429.65018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 326.71701, "t": 418.3614799999999, "r": 347.70734, "b": 429.65018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "0.897", "bbox": {"l": 326.71701, "t": 418.3614799999999, "r": 347.70734, "b": 429.65018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 363.67599, "t": 418.3614799999999, "r": 384.66632, "b": 429.65018, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "0.915", "bbox": {"l": 363.67599, "t": 418.3614799999999, "r": 384.66632, "b": 429.65018, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 394.61801, "t": 418.29871, "r": 418.77798, "b": 429.70398, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "0.859", "bbox": {"l": 394.61801, "t": 418.29871, "r": 418.77798, "b": 429.70398, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 439.52701, "t": 418.29871, "r": 458.38336, "b": 429.70398, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "1.91", "bbox": {"l": 439.52701, "t": 418.29871, "r": 458.38336, "b": 429.70398, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 245.17598999999998, "t": 431.31246999999996, "r": 272.94495, "b": 442.60117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 431.31246999999996, "r": 272.94495, "b": 442.60117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 289.017, "t": 431.31246999999996, "r": 310.00732, "b": 442.60117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "0.945", "bbox": {"l": 289.017, "t": 431.31246999999996, "r": 310.00732, "b": 442.60117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 326.71701, "t": 431.31246999999996, "r": 347.70734, "b": 442.60117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "0.901", "bbox": {"l": 326.71701, "t": 431.31246999999996, "r": 347.70734, "b": 442.60117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 362.08801, "t": 431.24969, "r": 386.24799, "b": 442.65497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "0.931", "bbox": {"l": 362.08801, "t": 431.24969, "r": 386.24799, "b": 442.65497, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 396.20599, "t": 431.31246999999996, "r": 417.19632, "b": 442.60117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "0.834", "bbox": {"l": 396.20599, "t": 431.31246999999996, "r": 417.19632, "b": 442.60117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 440.767, "t": 431.31246999999996, "r": 457.15039, "b": 442.60117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "3.81", "bbox": {"l": 440.767, "t": 431.31246999999996, "r": 457.15039, "b": 442.60117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 161.90601, "t": 450.14248999999995, "r": 166.51474, "b": 461.43118, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "4", "bbox": {"l": 161.90601, "t": 450.14248999999995, "r": 166.51474, "b": 461.43118, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 209.509, "t": 450.14248999999995, "r": 214.11774, "b": 461.43118, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "2", "bbox": {"l": 209.509, "t": 450.14248999999995, "r": 214.11774, "b": 461.43118, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 246.71000999999998, "t": 444.66248, "r": 271.41064, "b": 455.95117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 444.66248, "r": 271.41064, "b": 455.95117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 289.017, "t": 444.66248, "r": 310.00732, "b": 455.95117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "0.952", "bbox": {"l": 289.017, "t": 444.66248, "r": 310.00732, "b": 455.95117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 329.021, "t": 444.66248, "r": 345.40439, "b": 455.95117, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "0.92", "bbox": {"l": 329.021, "t": 444.66248, "r": 345.40439, "b": 455.95117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 362.08801, "t": 444.5996999999999, "r": 386.24799, "b": 456.00497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "0.942", "bbox": {"l": 362.08801, "t": 444.5996999999999, "r": 386.24799, "b": 456.00497, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 394.61801, "t": 444.5996999999999, "r": 418.77798, "b": 456.00497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "0.857", "bbox": {"l": 394.61801, "t": 444.5996999999999, "r": 418.77798, "b": 456.00497, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 439.52701, "t": 444.5996999999999, "r": 458.38336, "b": 456.00497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "1.22", "bbox": {"l": 439.52701, "t": 444.5996999999999, "r": 458.38336, "b": 456.00497, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 245.17598999999998, "t": 457.61447, "r": 272.94495, "b": 468.90317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 457.61447, "r": 272.94495, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 289.017, "t": 457.61447, "r": 310.00732, "b": 468.90317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "0.944", "bbox": {"l": 289.017, "t": 457.61447, "r": 310.00732, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 326.71701, "t": 457.61447, "r": 347.70734, "b": 468.90317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "0.903", "bbox": {"l": 326.71701, "t": 457.61447, "r": 347.70734, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 363.67599, "t": 457.61447, "r": 384.66632, "b": 468.90317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "0.931", "bbox": {"l": 363.67599, "t": 457.61447, "r": 384.66632, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 396.20599, "t": 457.61447, "r": 417.19632, "b": 468.90317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "0.824", "bbox": {"l": 396.20599, "t": 457.61447, "r": 417.19632, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 446.65302, "t": 457.61447, "r": 451.26175, "b": 468.90317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "2", "bbox": {"l": 446.65302, "t": 457.61447, "r": 451.26175, "b": 468.90317, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "lcel", "lcel", "ched", "ched", "nl", "ched", "ched", "ucel", "ched", "ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 7, "num_cols": 8, "table_cells": [{"bbox": {"l": 160.37, "t": 339.45749, "r": 168.04523, "b": 350.74619, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "#", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 144.592, "t": 352.40848, "r": 183.82895, "b": 363.69717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "enc-layers", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 207.974, "t": 339.45749, "r": 215.64923000000002, "b": 350.74619, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "#", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 192.19501, "t": 352.40848, "r": 231.42303, "b": 363.69717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "dec-layers", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 239.79799999999997, "t": 344.93649, "r": 278.3338, "b": 356.22519000000005, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Language", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 324.67001, "t": 339.45749, "r": 348.26419, "b": 350.74619, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 3, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 6, "text": "TEDs", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 396.271, "t": 339.45749, "r": 417.12595, "b": 350.74619, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "mAP", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 394.927, "t": 350.41647, "r": 418.46921, "b": 361.70517, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "(0.75)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 430.771, "t": 339.45749, "r": 467.14142000000004, "b": 350.74619, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "Inference", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 427.14801, "t": 350.41647, "r": 470.76955999999996, "b": 361.70517, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "time (secs)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 286.686, "t": 352.40848, "r": 312.32812, "b": 363.69717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "simple", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 320.702, "t": 352.40848, "r": 353.71539, "b": 363.69717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "complex", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 369.306, "t": 352.40848, "r": 379.02914, "b": 363.69717, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "all", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 161.90601, "t": 371.23849, "r": 166.51474, "b": 382.52719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 371.23849, "r": 214.11774, "b": 382.52719, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 365.75848, "r": 272.94495, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 365.75848, "r": 310.00732, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.965 0.969", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 365.75848, "r": 347.70734, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.934 0.927", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 363.67599, "t": 365.75848, "r": 384.66632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.955 0.955", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 396.20599, "t": 365.69571, "r": 417.19632, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.88 0.857", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 365.69571, "r": 458.38336, "b": 389.99917999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "2.73 5.39", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 161.90601, "t": 397.53949, "r": 166.51474, "b": 408.82819, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 397.53949, "r": 214.11774, "b": 408.82819, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 392.06049, "r": 272.94495, "b": 416.30017, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 392.06049, "r": 310.00732, "b": 403.34918, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.938", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 392.06049, "r": 347.70734, "b": 403.34918, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.904", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 363.67599, "t": 392.06049, "r": 384.66632, "b": 403.34918, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.927", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.61801, "t": 391.99771, "r": 418.77798, "b": 403.40298, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.853", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 391.99771, "r": 458.38336, "b": 403.40298, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "1.97", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 405.01147, "r": 310.00732, "b": 429.65018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.952 0.923", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 405.01147, "r": 347.70734, "b": 416.30017, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.909", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 362.08801, "t": 404.9486999999999, "r": 386.24799, "b": 416.35397, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.938", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 396.20599, "t": 405.01147, "r": 417.19632, "b": 416.30017, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.843", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.767, "t": 405.01147, "r": 457.15039, "b": 416.30017, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "3.77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 161.90601, "t": 423.84048, "r": 166.51474, "b": 435.12918, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 423.84048, "r": 214.11774, "b": 435.12918, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 246.71000999999998, "t": 418.3614799999999, "r": 271.41064, "b": 429.65018, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 418.3614799999999, "r": 347.70734, "b": 442.60117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.897 0.901", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 362.08801, "t": 418.3614799999999, "r": 386.24799, "b": 442.65497, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.915 0.931", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.61801, "t": 418.29871, "r": 418.77798, "b": 442.60117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.859 0.834", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 418.29871, "r": 458.38336, "b": 442.60117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "1.91 3.81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 431.31246999999996, "r": 272.94495, "b": 442.60117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 431.31246999999996, "r": 310.00732, "b": 442.60117, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.945", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 161.90601, "t": 450.14248999999995, "r": 166.51474, "b": 461.43118, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 450.14248999999995, "r": 214.11774, "b": 461.43118, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 444.66248, "r": 272.94495, "b": 468.90317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 444.66248, "r": 310.00732, "b": 468.90317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.952 0.944", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 444.66248, "r": 347.70734, "b": 468.90317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.92 0.903", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 362.08801, "t": 444.5996999999999, "r": 386.24799, "b": 468.90317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.942 0.931", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.61801, "t": 444.5996999999999, "r": 418.77798, "b": 468.90317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.857 0.824", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 444.5996999999999, "r": 458.38336, "b": 468.90317, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "1.22 2", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "section_header", "id": 6, "page_no": 0, "cluster": {"id": 6, "label": "section_header", "bbox": {"l": 134.765, "t": 505.67111, "r": 264.40829, "b": 518.17419, "coord_origin": "TOPLEFT"}, "confidence": 0.9589294195175171, "cells": [{"id": 91, "text": "5.2", "bbox": {"l": 134.765, "t": 505.67111, "r": 149.40306, "b": 518.17419, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Quantitative Results", "bbox": {"l": 160.85905, "t": 505.67111, "r": 264.40829, "b": 518.17419, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5.2 Quantitative Results"}, {"label": "text", "id": 3, "page_no": 0, "cluster": {"id": 3, "label": "text", "bbox": {"l": 134.765, "t": 522.08005, "r": 480.72003, "b": 618.3, "coord_origin": "TOPLEFT"}, "confidence": 0.9849975109100342, "cells": [{"id": 93, "text": "We picked the model parameter configuration that produced the best prediction", "bbox": {"l": 134.765, "t": 522.08005, "r": 479.72983, "b": 534.61301, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "quality (enc=6, dec=6, heads=8) with PubTabNet alone, then independently", "bbox": {"l": 134.765, "t": 534.03604, "r": 480.5897499999999, "b": 546.569, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "trained and evaluated it on three publicly available data sets: PubTabNet (395k", "bbox": {"l": 134.765, "t": 545.99104, "r": 480.72003, "b": 558.524, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "samples), FinTabNet (113k samples) and PubTables-1M (about 1M samples).", "bbox": {"l": 134.765, "t": 557.94604, "r": 480.60577, "b": 570.479, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "Performance results are presented in Table. 2. It is clearly evident that the model", "bbox": {"l": 134.765, "t": 569.90103, "r": 480.5936899999999, "b": 582.43399, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "trained on OTSL outperforms HTML across the board, keeping high TEDs and", "bbox": {"l": 134.765, "t": 581.85603, "r": 480.59158, "b": 594.38899, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "mAP scores even on difficult financial tables (FinTabNet) that contain sparse", "bbox": {"l": 134.765, "t": 593.81204, "r": 480.58080999999993, "b": 606.345, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "and large tables.", "bbox": {"l": 134.765, "t": 605.76704, "r": 206.79959, "b": 618.3, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "We picked the model parameter configuration that produced the best prediction quality (enc=6, dec=6, heads=8) with PubTabNet alone, then independently trained and evaluated it on three publicly available data sets: PubTabNet (395k samples), FinTabNet (113k samples) and PubTables-1M (about 1M samples). Performance results are presented in Table. 2. It is clearly evident that the model trained on OTSL outperforms HTML across the board, keeping high TEDs and mAP scores even on difficult financial tables (FinTabNet) that contain sparse and large tables."}, {"label": "text", "id": 2, "page_no": 0, "cluster": {"id": 2, "label": "text", "bbox": {"l": 134.765, "t": 617.72205, "r": 480.59857000000005, "b": 666.12, "coord_origin": "TOPLEFT"}, "confidence": 0.9850137829780579, "cells": [{"id": 101, "text": "Additionally, the results show that OTSL has an advantage over HTML", "bbox": {"l": 149.709, "t": 617.72205, "r": 480.59479, "b": 630.255, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "when applied on a bigger data set like PubTables-1M and achieves significantly", "bbox": {"l": 134.765, "t": 629.6770300000001, "r": 480.59857000000005, "b": 642.2099900000001, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "improved scores. Finally, OTSL achieves faster inference due to fewer decoding", "bbox": {"l": 134.765, "t": 641.63203, "r": 480.59384000000006, "b": 654.16499, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "steps which is a result of the reduced sequence representation.", "bbox": {"l": 134.765, "t": 653.58704, "r": 405.7995, "b": 666.12, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Additionally, the results show that OTSL has an advantage over HTML when applied on a bigger data set like PubTables-1M and achieves significantly improved scores. Finally, OTSL achieves faster inference due to fewer decoding steps which is a result of the reduced sequence representation."}], "headers": [{"label": "page_header", "id": 8, "page_no": 0, "cluster": {"id": 8, "label": "page_header", "bbox": {"l": 194.478, "t": 91.49352999999996, "r": 447.54476999999997, "b": 102.78223000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9373534917831421, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 91.49352999999996, "r": 447.54476999999997, "b": 102.78223000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Optimized Table Tokenization for Table Structure Recognition"}, {"label": "page_header", "id": 9, "page_no": 0, "cluster": {"id": 9, "label": "page_header", "bbox": {"l": 475.98441, "t": 91.49352999999996, "r": 480.59314, "b": 102.78223000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.8858680725097656, "cells": [{"id": 1, "text": "9", "bbox": {"l": 475.98441, "t": 91.49352999999996, "r": 480.59314, "b": 102.78223000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "9"}]}}]
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v2/2305.03393v1.doctags.txt b/tests/data/groundtruth/docling_v2/2305.03393v1.doctags.txt
index feb0675e..78d66c2d 100644
--- a/tests/data/groundtruth/docling_v2/2305.03393v1.doctags.txt
+++ b/tests/data/groundtruth/docling_v2/2305.03393v1.doctags.txt
@@ -1,154 +1,149 @@
-<document>
-<section_header_level_1><location><page_1><loc_22><loc_82><loc_79><loc_85></location>Optimized Table Tokenization for Table Structure Recognition</section_header_level_1>
-<text><location><page_1><loc_23><loc_75><loc_78><loc_79></location>Maksym Lysak [0000 − 0002 − 3723 − $^{6960]}$, Ahmed Nassar[0000 − 0002 − 9468 − $^{0822]}$, Nikolaos Livathinos [0000 − 0001 − 8513 − $^{3491]}$, Christoph Auer[0000 − 0001 − 5761 − $^{0422]}$, [0000 − 0002 − 8088 − 0823]</text>
-<text><location><page_1><loc_38><loc_74><loc_49><loc_75></location>and Peter Staar</text>
-<text><location><page_1><loc_46><loc_72><loc_55><loc_73></location>IBM Research</text>
-<text><location><page_1><loc_36><loc_70><loc_64><loc_71></location>{mly,ahn,nli,cau,taa}@zurich.ibm.com</text>
-<text><location><page_1><loc_27><loc_41><loc_74><loc_66></location>Abstract. Extracting tables from documents is a crucial task in any document conversion pipeline. Recently, transformer-based models have demonstrated that table-structure can be recognized with impressive accuracy using Image-to-Markup-Sequence (Im2Seq) approaches. Taking only the image of a table, such models predict a sequence of tokens (e.g. in HTML, LaTeX) which represent the structure of the table. Since the token representation of the table structure has a significant impact on the accuracy and run-time performance of any Im2Seq model, we investigate in this paper how table-structure representation can be optimised. We propose a new, optimised table-structure language (OTSL) with a minimized vocabulary and specific rules. The benefits of OTSL are that it reduces the number of tokens to 5 (HTML needs 28+) and shortens the sequence length to half of HTML on average. Consequently, model accuracy improves significantly, inference time is halved compared to HTML-based models, and the predicted table structures are always syntactically correct. This in turn eliminates most post-processing needs. Popular table structure data-sets will be published in OTSL format to the community.</text>
-<text><location><page_1><loc_27><loc_37><loc_74><loc_40></location>Keywords: Table Structure Recognition · Data Representation · Transformers · Optimization.</text>
-<section_header_level_1><location><page_1><loc_22><loc_33><loc_37><loc_34></location>1 Introduction</section_header_level_1>
-<text><location><page_1><loc_22><loc_21><loc_79><loc_31></location>Tables are ubiquitous in documents such as scientific papers, patents, reports, manuals, specification sheets or marketing material. They often encode highly valuable information and therefore need to be extracted with high accuracy. Unfortunately, tables appear in documents in various sizes, styling and structure, making it difficult to recover their correct structure with simple analytical methods. Therefore, accurate table extraction is achieved these days with machine-learning based methods.</text>
-<text><location><page_1><loc_22><loc_16><loc_79><loc_20></location>In modern document understanding systems [1,15], table extraction is typically a two-step process. Firstly, every table on a page is located with a bounding box, and secondly, their logical row and column structure is recognized. As of</text>
-<figure>
-<location><page_2><loc_24><loc_46><loc_76><loc_74></location>
-<caption>Fig. 1. Comparison between HTML and OTSL table structure representation: (A) table-example with complex row and column headers, including a 2D empty span, (B) minimal graphical representation of table structure using rectangular layout, (C) HTML representation, (D) OTSL representation. This example demonstrates many of the key-features of OTSL, namely its reduced vocabulary size (12 versus 5 in this case), its reduced sequence length (55 versus 30) and a enhanced internal structure (variable token sequence length per row in HTML versus a fixed length of rows in OTSL).</caption>
-</figure>
-<text><location><page_2><loc_22><loc_34><loc_79><loc_43></location>today, table detection in documents is a well understood problem, and the latest state-of-the-art (SOTA) object detection methods provide an accuracy comparable to human observers [7,8,10,14,23]. On the other hand, the problem of table structure recognition (TSR) is a lot more challenging and remains a very active area of research, in which many novel machine learning algorithms are being explored [3,4,5,9,11,12,13,14,17,18,21,22].</text>
-<text><location><page_2><loc_22><loc_16><loc_79><loc_34></location>Recently emerging SOTA methods for table structure recognition employ transformer-based models, in which an image of the table is provided to the network in order to predict the structure of the table as a sequence of tokens. These image-to-sequence (Im2Seq) models are extremely powerful, since they allow for a purely data-driven solution. The tokens of the sequence typically belong to a markup language such as HTML, Latex or Markdown, which allow to describe table structure as rows, columns and spanning cells in various configurations. In Figure 1, we illustrate how HTML is used to represent the table-structure of a particular example table. Public table-structure data sets such as PubTabNet [22], and FinTabNet [21], which were created in a semi-automated way from paired PDF and HTML sources (e.g. PubMed Central), popularized primarily the use of HTML as ground-truth representation format for TSR.</text>
-<text><location><page_3><loc_22><loc_73><loc_79><loc_85></location>While the majority of research in TSR is currently focused on the development and application of novel neural model architectures, the table structure representation language (e.g. HTML in PubTabNet and FinTabNet) is usually adopted as is for the sequence tokenization in Im2Seq models. In this paper, we aim for the opposite and investigate the impact of the table structure representation language with an otherwise unmodified Im2Seq transformer-based architecture. Since the current state-of-the-art Im2Seq model is TableFormer [9], we select this model to perform our experiments.</text>
-<text><location><page_3><loc_22><loc_58><loc_79><loc_73></location>The main contribution of this paper is the introduction of a new optimised table structure language (OTSL), specifically designed to describe table-structure in an compact and structured way for Im2Seq models. OTSL has a number of key features, which make it very attractive to use in Im2Seq models. Specifically, compared to other languages such as HTML, OTSL has a minimized vocabulary which yields short sequence length, strong inherent structure (e.g. strict rectangular layout) and a strict syntax with rules that only look backwards. The latter allows for syntax validation during inference and ensures a syntactically correct table-structure. These OTSL features are illustrated in Figure 1, in comparison to HTML.</text>
-<text><location><page_3><loc_22><loc_45><loc_79><loc_58></location>The paper is structured as follows. In section 2, we give an overview of the latest developments in table-structure reconstruction. In section 3 we review the current HTML table encoding (popularised by PubTabNet and FinTabNet) and discuss its flaws. Subsequently, we introduce OTSL in section 4, which includes the language definition, syntax rules and error-correction procedures. In section 5, we apply OTSL on the TableFormer architecture, compare it to TableFormer models trained on HTML and ultimately demonstrate the advantages of using OTSL. Finally, in section 6 we conclude our work and outline next potential steps.</text>
-<section_header_level_1><location><page_3><loc_22><loc_40><loc_39><loc_42></location>2 Related Work</section_header_level_1>
-<text><location><page_3><loc_22><loc_16><loc_79><loc_38></location>Approaches to formalize the logical structure and layout of tables in electronic documents date back more than two decades [16]. In the recent past, a wide variety of computer vision methods have been explored to tackle the problem of table structure recognition, i.e. the correct identification of columns, rows and spanning cells in a given table. Broadly speaking, the current deeplearning based approaches fall into three categories: object detection (OD) methods, Graph-Neural-Network (GNN) methods and Image-to-Markup-Sequence (Im2Seq) methods. Object-detection based methods [11,12,13,14,21] rely on tablestructure annotation using (overlapping) bounding boxes for training, and produce bounding-box predictions to define table cells, rows, and columns on a table image. Graph Neural Network (GNN) based methods [3,6,17,18], as the name suggests, represent tables as graph structures. The graph nodes represent the content of each table cell, an embedding vector from the table image, or geometric coordinates of the table cell. The edges of the graph define the relationship between the nodes, e.g. if they belong to the same column, row, or table cell.</text>
-<text><location><page_4><loc_22><loc_67><loc_79><loc_85></location>Other work [20] aims at predicting a grid for each table and deciding which cells must be merged using an attention network. Im2Seq methods cast the problem as a sequence generation task [4,5,9,22], and therefore need an internal tablestructure representation language, which is often implemented with standard markup languages (e.g. HTML, LaTeX, Markdown). In theory, Im2Seq methods have a natural advantage over the OD and GNN methods by virtue of directly predicting the table-structure. As such, no post-processing or rules are needed in order to obtain the table-structure, which is necessary with OD and GNN approaches. In practice, this is not entirely true, because a predicted sequence of table-structure markup does not necessarily have to be syntactically correct. Hence, depending on the quality of the predicted sequence, some post-processing needs to be performed to ensure a syntactically valid (let alone correct) sequence.</text>
-<text><location><page_4><loc_22><loc_39><loc_79><loc_67></location>Within the Im2Seq method, we find several popular models, namely the encoder-dual-decoder model (EDD) [22], TableFormer [9], Tabsplitter[2] and Ye et. al. [19]. EDD uses two consecutive long short-term memory (LSTM) decoders to predict a table in HTML representation. The tag decoder predicts a sequence of HTML tags. For each decoded table cell ( <td> ), the attention is passed to the cell decoder to predict the content with an embedded OCR approach. The latter makes it susceptible to transcription errors in the cell content of the table. TableFormer address this reliance on OCR and uses two transformer decoders for HTML structure and cell bounding box prediction in an end-to-end architecture. The predicted cell bounding box is then used to extract text tokens from an originating (digital) PDF page, circumventing any need for OCR. TabSplitter [2] proposes a compact double-matrix representation of table rows and columns to do error detection and error correction of HTML structure sequences based on predictions from [19]. This compact double-matrix representation can not be used directly by the Img2seq model training, so the model uses HTML as an intermediate form. Chi et. al. [4] introduce a data set and a baseline method using bidirectional LSTMs to predict LaTeX code. Kayal [5] introduces Gated ResNet transformers to predict LaTeX code, and a separate OCR module to extract content.</text>
-<text><location><page_4><loc_22><loc_26><loc_79><loc_38></location>Im2Seq approaches have shown to be well-suited for the TSR task and allow a full end-to-end network design that can output the final table structure without pre- or post-processing logic. Furthermore, Im2Seq models have demonstrated to deliver state-of-the-art prediction accuracy [9]. This motivated the authors to investigate if the performance (both in accuracy and inference time) can be further improved by optimising the table structure representation language. We believe this is a necessary step before further improving neural network architectures for this task.</text>
-<section_header_level_1><location><page_4><loc_22><loc_22><loc_44><loc_24></location>3 Problem Statement</section_header_level_1>
-<text><location><page_4><loc_22><loc_16><loc_79><loc_20></location>All known Im2Seq based models for TSR fundamentally work in similar ways. Given an image of a table, the Im2Seq model predicts the structure of the table by generating a sequence of tokens. These tokens originate from a finite vocab-</text>
-<text><location><page_5><loc_22><loc_76><loc_79><loc_85></location>ulary and can be interpreted as a table structure. For example, with the HTML tokens <table> , </table> , <tr> , </tr> , <td> and </td> , one can construct simple table structures without any spanning cells. In reality though, one needs at least 28 HTML tokens to describe the most common complex tables observed in real-world documents [21,22], due to a variety of spanning cells definitions in the HTML token vocabulary.</text>
-<figure>
-<location><page_5><loc_22><loc_57><loc_78><loc_71></location>
-<caption>Fig. 2. Frequency of tokens in HTML and OTSL as they appear in PubTabNet.</caption>
-</figure>
-<text><location><page_5><loc_22><loc_33><loc_79><loc_54></location>Obviously, HTML and other general-purpose markup languages were not designed for Im2Seq models. As such, they have some serious drawbacks. First, the token vocabulary needs to be artificially large in order to describe all plausible tabular structures. Since most Im2Seq models use an autoregressive approach, they generate the sequence token by token. Therefore, to reduce inference time, a shorter sequence length is critical. Every table-cell is represented by at least two tokens ( <td> and </td> ). Furthermore, when tokenizing the HTML structure, one needs to explicitly enumerate possible column-spans and row-spans as words. In practice, this ends up requiring 28 different HTML tokens (when including column- and row-spans up to 10 cells) just to describe every table in the PubTabNet dataset. Clearly, not every token is equally represented, as is depicted in Figure 2. This skewed distribution of tokens in combination with variable token row-length makes it challenging for models to learn the HTML structure.</text>
-<text><location><page_5><loc_22><loc_27><loc_79><loc_32></location>Additionally, it would be desirable if the representation would easily allow an early detection of invalid sequences on-the-go, before the prediction of the entire table structure is completed. HTML is not well-suited for this purpose as the verification of incomplete sequences is non-trivial or even impossible.</text>
-<text><location><page_5><loc_22><loc_16><loc_79><loc_26></location>In a valid HTML table, the token sequence must describe a 2D grid of table cells, serialised in row-major ordering, where each row and each column have the same length (while considering row- and column-spans). Furthermore, every opening tag in HTML needs to be matched by a closing tag in a correct hierarchical manner. Since the number of tokens for each table row and column can vary significantly, especially for large tables with many row- and column-spans, it is complex to verify the consistency of predicted structures during sequence</text>
-<text><location><page_6><loc_22><loc_82><loc_79><loc_85></location>generation. Implicitly, this also means that Im2Seq models need to learn these complex syntax rules, simply to deliver valid output.</text>
-<text><location><page_6><loc_22><loc_63><loc_79><loc_82></location>In practice, we observe two major issues with prediction quality when training Im2Seq models on HTML table structure generation from images. On the one hand, we find that on large tables, the visual attention of the model often starts to drift and is not accurately moving forward cell by cell anymore. This manifests itself in either in an increasing location drift for proposed table-cells in later rows on the same column or even complete loss of vertical alignment, as illustrated in Figure 5. Addressing this with post-processing is partially possible, but clearly undesired. On the other hand, we find many instances of predictions with structural inconsistencies or plain invalid HTML output, as shown in Figure 6, which are nearly impossible to properly correct. Both problems seriously impact the TSR model performance, since they reflect not only in the task of pure structure recognition but also in the equally crucial recognition or matching of table cell content.</text>
-<section_header_level_1><location><page_6><loc_22><loc_58><loc_61><loc_60></location>4 Optimised Table Structure Language</section_header_level_1>
-<text><location><page_6><loc_22><loc_44><loc_79><loc_56></location>To mitigate the issues with HTML in Im2Seq-based TSR models laid out before, we propose here our Optimised Table Structure Language (OTSL). OTSL is designed to express table structure with a minimized vocabulary and a simple set of rules, which are both significantly reduced compared to HTML. At the same time, OTSL enables easy error detection and correction during sequence generation. We further demonstrate how the compact structure representation and minimized sequence length improves prediction accuracy and inference time in the TableFormer architecture.</text>
-<section_header_level_1><location><page_6><loc_22><loc_40><loc_43><loc_41></location>4.1 Language Definition</section_header_level_1>
-<text><location><page_6><loc_22><loc_34><loc_79><loc_38></location>In Figure 3, we illustrate how the OTSL is defined. In essence, the OTSL defines only 5 tokens that directly describe a tabular structure based on an atomic 2D grid.</text>
-<text><location><page_6><loc_24><loc_33><loc_67><loc_34></location>The OTSL vocabulary is comprised of the following tokens:</text>
-<unordered_list>
-<list_item><location><page_6><loc_23><loc_30><loc_75><loc_31></location>-"C" cell a new table cell that either has or does not have cell content</list_item>
-<list_item><location><page_6><loc_23><loc_27><loc_79><loc_29></location>-"L" cell left-looking cell , merging with the left neighbor cell to create a span</list_item>
-<list_item><location><page_6><loc_23><loc_24><loc_79><loc_26></location>-"U" cell up-looking cell , merging with the upper neighbor cell to create a span</list_item>
-<list_item><location><page_6><loc_23><loc_22><loc_74><loc_23></location>-"X" cell cross cell , to merge with both left and upper neighbor cells</list_item>
-<list_item><location><page_6><loc_23><loc_20><loc_54><loc_21></location>-"NL" new-line , switch to the next row.</list_item>
+<doctag><page_header><loc_15><loc_132><loc_30><loc_350>arXiv:2305.03393v1 [cs.CV] 5 May 2023</page_header>
+<section_header_level_1><loc_110><loc_73><loc_393><loc_92>Optimized Table Tokenization for Table Structure Recognition</section_header_level_1>
+<text><loc_114><loc_107><loc_389><loc_126>Maksym Lysak [0000 − 0002 − 3723 − $^{6960]}$, Ahmed Nassar[0000 − 0002 − 9468 − $^{0822]}$, Nikolaos Livathinos [0000 − 0001 − 8513 − $^{3491]}$, Christoph Auer[0000 − 0001 − 5761 − $^{0422]}$, [0000 − 0002 − 8088 − 0823]</text>
+<text><loc_188><loc_123><loc_244><loc_129>and Peter Staar</text>
+<text><loc_228><loc_137><loc_275><loc_142>IBM Research</text>
+<text><loc_182><loc_144><loc_321><loc_149>{mly,ahn,nli,cau,taa}@zurich.ibm.com</text>
+<text><loc_133><loc_171><loc_369><loc_293>Abstract. Extracting tables from documents is a crucial task in any document conversion pipeline. Recently, transformer-based models have demonstrated that table-structure can be recognized with impressive accuracy using Image-to-Markup-Sequence (Im2Seq) approaches. Taking only the image of a table, such models predict a sequence of tokens (e.g. in HTML, LaTeX) which represent the structure of the table. Since the token representation of the table structure has a significant impact on the accuracy and run-time performance of any Im2Seq model, we investigate in this paper how table-structure representation can be optimised. We propose a new, optimised table-structure language (OTSL) with a minimized vocabulary and specific rules. The benefits of OTSL are that it reduces the number of tokens to 5 (HTML needs 28+) and shortens the sequence length to half of HTML on average. Consequently, model accuracy improves significantly, inference time is halved compared to HTML-based models, and the predicted table structures are always syntactically correct. This in turn eliminates most post-processing needs. Popular table structure data-sets will be published in OTSL format to the community.</text>
+<text><loc_133><loc_302><loc_369><loc_314>Keywords: Table Structure Recognition · Data Representation · Transformers · Optimization.</text>
+<section_header_level_1><loc_110><loc_330><loc_187><loc_336>1 Introduction</section_header_level_1>
+<text><loc_110><loc_346><loc_393><loc_397>Tables are ubiquitous in documents such as scientific papers, patents, reports, manuals, specification sheets or marketing material. They often encode highly valuable information and therefore need to be extracted with high accuracy. Unfortunately, tables appear in documents in various sizes, styling and structure, making it difficult to recover their correct structure with simple analytical methods. Therefore, accurate table extraction is achieved these days with machine-learning based methods.</text>
+<text><loc_110><loc_399><loc_393><loc_420>In modern document understanding systems [1,15], table extraction is typically a two-step process. Firstly, every table on a page is located with a bounding box, and secondly, their logical row and column structure is recognized. As of</text>
+<page_break>
+<page_header><loc_110><loc_59><loc_114><loc_64>2</page_header>
+<page_header><loc_137><loc_59><loc_189><loc_64>M. Lysak, et al.</page_header>
+<picture><loc_121><loc_132><loc_379><loc_269><caption><loc_110><loc_80><loc_393><loc_126>Fig. 1. Comparison between HTML and OTSL table structure representation: (A) table-example with complex row and column headers, including a 2D empty span, (B) minimal graphical representation of table structure using rectangular layout, (C) HTML representation, (D) OTSL representation. This example demonstrates many of the key-features of OTSL, namely its reduced vocabulary size (12 versus 5 in this case), its reduced sequence length (55 versus 30) and a enhanced internal structure (variable token sequence length per row in HTML versus a fixed length of rows in OTSL).</caption></picture>
+<text><loc_110><loc_286><loc_393><loc_329>today, table detection in documents is a well understood problem, and the latest state-of-the-art (SOTA) object detection methods provide an accuracy comparable to human observers [7,8,10,14,23]. On the other hand, the problem of table structure recognition (TSR) is a lot more challenging and remains a very active area of research, in which many novel machine learning algorithms are being explored [3,4,5,9,11,12,13,14,17,18,21,22].</text>
+<text><loc_110><loc_331><loc_393><loc_420>Recently emerging SOTA methods for table structure recognition employ transformer-based models, in which an image of the table is provided to the network in order to predict the structure of the table as a sequence of tokens. These image-to-sequence (Im2Seq) models are extremely powerful, since they allow for a purely data-driven solution. The tokens of the sequence typically belong to a markup language such as HTML, Latex or Markdown, which allow to describe table structure as rows, columns and spanning cells in various configurations. In Figure 1, we illustrate how HTML is used to represent the table-structure of a particular example table. Public table-structure data sets such as PubTabNet [22], and FinTabNet [21], which were created in a semi-automated way from paired PDF and HTML sources (e.g. PubMed Central), popularized primarily the use of HTML as ground-truth representation format for TSR.</text>
+<page_break>
+<page_header><loc_159><loc_59><loc_366><loc_64>Optimized Table Tokenization for Table Structure Recognition</page_header>
+<page_header><loc_389><loc_59><loc_393><loc_64>3</page_header>
+<text><loc_110><loc_75><loc_393><loc_133>While the majority of research in TSR is currently focused on the development and application of novel neural model architectures, the table structure representation language (e.g. HTML in PubTabNet and FinTabNet) is usually adopted as is for the sequence tokenization in Im2Seq models. In this paper, we aim for the opposite and investigate the impact of the table structure representation language with an otherwise unmodified Im2Seq transformer-based architecture. Since the current state-of-the-art Im2Seq model is TableFormer [9], we select this model to perform our experiments.</text>
+<text><loc_110><loc_136><loc_393><loc_209>The main contribution of this paper is the introduction of a new optimised table structure language (OTSL), specifically designed to describe table-structure in an compact and structured way for Im2Seq models. OTSL has a number of key features, which make it very attractive to use in Im2Seq models. Specifically, compared to other languages such as HTML, OTSL has a minimized vocabulary which yields short sequence length, strong inherent structure (e.g. strict rectangular layout) and a strict syntax with rules that only look backwards. The latter allows for syntax validation during inference and ensures a syntactically correct table-structure. These OTSL features are illustrated in Figure 1, in comparison to HTML.</text>
+<text><loc_110><loc_211><loc_393><loc_277>The paper is structured as follows. In section 2, we give an overview of the latest developments in table-structure reconstruction. In section 3 we review the current HTML table encoding (popularised by PubTabNet and FinTabNet) and discuss its flaws. Subsequently, we introduce OTSL in section 4, which includes the language definition, syntax rules and error-correction procedures. In section 5, we apply OTSL on the TableFormer architecture, compare it to TableFormer models trained on HTML and ultimately demonstrate the advantages of using OTSL. Finally, in section 6 we conclude our work and outline next potential steps.</text>
+<section_header_level_1><loc_110><loc_292><loc_193><loc_298>2 Related Work</section_header_level_1>
+<text><loc_110><loc_309><loc_396><loc_420>Approaches to formalize the logical structure and layout of tables in electronic documents date back more than two decades [16]. In the recent past, a wide variety of computer vision methods have been explored to tackle the problem of table structure recognition, i.e. the correct identification of columns, rows and spanning cells in a given table. Broadly speaking, the current deeplearning based approaches fall into three categories: object detection (OD) methods, Graph-Neural-Network (GNN) methods and Image-to-Markup-Sequence (Im2Seq) methods. Object-detection based methods [11,12,13,14,21] rely on tablestructure annotation using (overlapping) bounding boxes for training, and produce bounding-box predictions to define table cells, rows, and columns on a table image. Graph Neural Network (GNN) based methods [3,6,17,18], as the name suggests, represent tables as graph structures. The graph nodes represent the content of each table cell, an embedding vector from the table image, or geometric coordinates of the table cell. The edges of the graph define the relationship between the nodes, e.g. if they belong to the same column, row, or table cell.</text>
+<page_break>
+<page_header><loc_110><loc_59><loc_114><loc_64>4</page_header>
+<page_header><loc_137><loc_59><loc_189><loc_64>M. Lysak, et al.</page_header>
+<text><loc_110><loc_75><loc_393><loc_164>Other work [20] aims at predicting a grid for each table and deciding which cells must be merged using an attention network. Im2Seq methods cast the problem as a sequence generation task [4,5,9,22], and therefore need an internal tablestructure representation language, which is often implemented with standard markup languages (e.g. HTML, LaTeX, Markdown). In theory, Im2Seq methods have a natural advantage over the OD and GNN methods by virtue of directly predicting the table-structure. As such, no post-processing or rules are needed in order to obtain the table-structure, which is necessary with OD and GNN approaches. In practice, this is not entirely true, because a predicted sequence of table-structure markup does not necessarily have to be syntactically correct. Hence, depending on the quality of the predicted sequence, some post-processing needs to be performed to ensure a syntactically valid (let alone correct) sequence.</text>
+<text><loc_110><loc_166><loc_393><loc_307>Within the Im2Seq method, we find several popular models, namely the encoder-dual-decoder model (EDD) [22], TableFormer [9], Tabsplitter[2] and Ye et. al. [19]. EDD uses two consecutive long short-term memory (LSTM) decoders to predict a table in HTML representation. The tag decoder predicts a sequence of HTML tags. For each decoded table cell ( <td> ), the attention is passed to the cell decoder to predict the content with an embedded OCR approach. The latter makes it susceptible to transcription errors in the cell content of the table. TableFormer address this reliance on OCR and uses two transformer decoders for HTML structure and cell bounding box prediction in an end-to-end architecture. The predicted cell bounding box is then used to extract text tokens from an originating (digital) PDF page, circumventing any need for OCR. TabSplitter [2] proposes a compact double-matrix representation of table rows and columns to do error detection and error correction of HTML structure sequences based on predictions from [19]. This compact double-matrix representation can not be used directly by the Img2seq model training, so the model uses HTML as an intermediate form. Chi et. al. [4] introduce a data set and a baseline method using bidirectional LSTMs to predict LaTeX code. Kayal [5] introduces Gated ResNet transformers to predict LaTeX code, and a separate OCR module to extract content.</text>
+<text><loc_110><loc_309><loc_393><loc_368>Im2Seq approaches have shown to be well-suited for the TSR task and allow a full end-to-end network design that can output the final table structure without pre- or post-processing logic. Furthermore, Im2Seq models have demonstrated to deliver state-of-the-art prediction accuracy [9]. This motivated the authors to investigate if the performance (both in accuracy and inference time) can be further improved by optimising the table structure representation language. We believe this is a necessary step before further improving neural network architectures for this task.</text>
+<section_header_level_1><loc_110><loc_382><loc_220><loc_389>3 Problem Statement</section_header_level_1>
+<text><loc_110><loc_399><loc_393><loc_420>All known Im2Seq based models for TSR fundamentally work in similar ways. Given an image of a table, the Im2Seq model predicts the structure of the table by generating a sequence of tokens. These tokens originate from a finite vocab-</text>
+<page_break>
+<page_header><loc_159><loc_59><loc_366><loc_64>Optimized Table Tokenization for Table Structure Recognition</page_header>
+<page_header><loc_389><loc_59><loc_393><loc_64>5</page_header>
+<text><loc_110><loc_75><loc_393><loc_118>ulary and can be interpreted as a table structure. For example, with the HTML tokens <table> , </table> , <tr> , </tr> , <td> and </td> , one can construct simple table structures without any spanning cells. In reality though, one needs at least 28 HTML tokens to describe the most common complex tables observed in real-world documents [21,22], due to a variety of spanning cells definitions in the HTML token vocabulary.</text>
+<picture><loc_112><loc_147><loc_389><loc_215><caption><loc_119><loc_140><loc_384><loc_145>Fig. 2. Frequency of tokens in HTML and OTSL as they appear in PubTabNet.</caption></picture>
+<text><loc_110><loc_232><loc_393><loc_336>Obviously, HTML and other general-purpose markup languages were not designed for Im2Seq models. As such, they have some serious drawbacks. First, the token vocabulary needs to be artificially large in order to describe all plausible tabular structures. Since most Im2Seq models use an autoregressive approach, they generate the sequence token by token. Therefore, to reduce inference time, a shorter sequence length is critical. Every table-cell is represented by at least two tokens ( <td> and </td> ). Furthermore, when tokenizing the HTML structure, one needs to explicitly enumerate possible column-spans and row-spans as words. In practice, this ends up requiring 28 different HTML tokens (when including column- and row-spans up to 10 cells) just to describe every table in the PubTabNet dataset. Clearly, not every token is equally represented, as is depicted in Figure 2. This skewed distribution of tokens in combination with variable token row-length makes it challenging for models to learn the HTML structure.</text>
+<text><loc_110><loc_338><loc_393><loc_367>Additionally, it would be desirable if the representation would easily allow an early detection of invalid sequences on-the-go, before the prediction of the entire table structure is completed. HTML is not well-suited for this purpose as the verification of incomplete sequences is non-trivial or even impossible.</text>
+<text><loc_110><loc_369><loc_393><loc_420>In a valid HTML table, the token sequence must describe a 2D grid of table cells, serialised in row-major ordering, where each row and each column have the same length (while considering row- and column-spans). Furthermore, every opening tag in HTML needs to be matched by a closing tag in a correct hierarchical manner. Since the number of tokens for each table row and column can vary significantly, especially for large tables with many row- and column-spans, it is complex to verify the consistency of predicted structures during sequence</text>
+<page_break>
+<page_header><loc_110><loc_59><loc_114><loc_64>6</page_header>
+<page_header><loc_137><loc_59><loc_189><loc_64>M. Lysak, et al.</page_header>
+<text><loc_110><loc_75><loc_393><loc_88>generation. Implicitly, this also means that Im2Seq models need to learn these complex syntax rules, simply to deliver valid output.</text>
+<text><loc_110><loc_91><loc_393><loc_187>In practice, we observe two major issues with prediction quality when training Im2Seq models on HTML table structure generation from images. On the one hand, we find that on large tables, the visual attention of the model often starts to drift and is not accurately moving forward cell by cell anymore. This manifests itself in either in an increasing location drift for proposed table-cells in later rows on the same column or even complete loss of vertical alignment, as illustrated in Figure 5. Addressing this with post-processing is partially possible, but clearly undesired. On the other hand, we find many instances of predictions with structural inconsistencies or plain invalid HTML output, as shown in Figure 6, which are nearly impossible to properly correct. Both problems seriously impact the TSR model performance, since they reflect not only in the task of pure structure recognition but also in the equally crucial recognition or matching of table cell content.</text>
+<section_header_level_1><loc_110><loc_202><loc_304><loc_209>4 Optimised Table Structure Language</section_header_level_1>
+<text><loc_110><loc_220><loc_393><loc_279>To mitigate the issues with HTML in Im2Seq-based TSR models laid out before, we propose here our Optimised Table Structure Language (OTSL). OTSL is designed to express table structure with a minimized vocabulary and a simple set of rules, which are both significantly reduced compared to HTML. At the same time, OTSL enables easy error detection and correction during sequence generation. We further demonstrate how the compact structure representation and minimized sequence length improves prediction accuracy and inference time in the TableFormer architecture.</text>
+<section_header_level_1><loc_110><loc_294><loc_214><loc_300>4.1 Language Definition</section_header_level_1>
+<text><loc_110><loc_309><loc_393><loc_329>In Figure 3, we illustrate how the OTSL is defined. In essence, the OTSL defines only 5 tokens that directly describe a tabular structure based on an atomic 2D grid.</text>
+<text><loc_122><loc_332><loc_334><loc_337>The OTSL vocabulary is comprised of the following tokens:</text>
+<unordered_list><list_item><loc_115><loc_346><loc_376><loc_352>-"C" cell a new table cell that either has or does not have cell content</list_item>
+<list_item><loc_115><loc_354><loc_393><loc_367>-"L" cell left-looking cell , merging with the left neighbor cell to create a span</list_item>
+<list_item><loc_115><loc_369><loc_393><loc_382>-"U" cell up-looking cell , merging with the upper neighbor cell to create a span</list_item>
+<list_item><loc_115><loc_385><loc_371><loc_390>-"X" cell cross cell , to merge with both left and upper neighbor cells</list_item>
+<list_item><loc_115><loc_393><loc_268><loc_398>-"NL" new-line , switch to the next row.</list_item>
 </unordered_list>
-<text><location><page_6><loc_22><loc_16><loc_79><loc_19></location>A notable attribute of OTSL is that it has the capability of achieving lossless conversion to HTML.</text>
-<figure>
-<location><page_7><loc_27><loc_65><loc_73><loc_79></location>
-<caption>Fig. 3. OTSL description of table structure: A - table example; B - graphical representation of table structure; C - mapping structure on a grid; D - OTSL structure encoding; E - explanation on cell encoding</caption>
-</figure>
-<section_header_level_1><location><page_7><loc_22><loc_60><loc_40><loc_61></location>4.2 Language Syntax</section_header_level_1>
-<text><location><page_7><loc_22><loc_58><loc_59><loc_59></location>The OTSL representation follows these syntax rules:</text>
-<unordered_list>
-<list_item><location><page_7><loc_23><loc_54><loc_79><loc_56></location>1. Left-looking cell rule : The left neighbour of an "L" cell must be either another "L" cell or a "C" cell.</list_item>
-<list_item><location><page_7><loc_23><loc_51><loc_79><loc_53></location>2. Up-looking cell rule : The upper neighbour of a "U" cell must be either another "U" cell or a "C" cell.</list_item>
+<text><loc_110><loc_407><loc_393><loc_420>A notable attribute of OTSL is that it has the capability of achieving lossless conversion to HTML.</text>
+<page_break>
+<page_header><loc_159><loc_59><loc_366><loc_64>Optimized Table Tokenization for Table Structure Recognition</page_header>
+<page_header><loc_389><loc_59><loc_393><loc_64>7</page_header>
+<picture><loc_135><loc_103><loc_367><loc_177><caption><loc_110><loc_79><loc_393><loc_98>Fig. 3. OTSL description of table structure: A - table example; B - graphical representation of table structure; C - mapping structure on a grid; D - OTSL structure encoding; E - explanation on cell encoding</caption></picture>
+<section_header_level_1><loc_110><loc_193><loc_202><loc_198>4.2 Language Syntax</section_header_level_1>
+<text><loc_110><loc_205><loc_297><loc_211>The OTSL representation follows these syntax rules:</text>
+<unordered_list><list_item><loc_114><loc_219><loc_393><loc_232>1. Left-looking cell rule : The left neighbour of an "L" cell must be either another "L" cell or a "C" cell.</list_item>
+<list_item><loc_114><loc_234><loc_393><loc_247>2. Up-looking cell rule : The upper neighbour of a "U" cell must be either another "U" cell or a "C" cell.</list_item>
 </unordered_list>
-<section_header_level_1><location><page_7><loc_23><loc_49><loc_37><loc_50></location>3. Cross cell rule :</section_header_level_1>
-<unordered_list>
-<list_item><location><page_7><loc_25><loc_44><loc_79><loc_49></location>The left neighbour of an "X" cell must be either another "X" cell or a "U" cell, and the upper neighbour of an "X" cell must be either another "X" cell or an "L" cell.</list_item>
-<list_item><location><page_7><loc_23><loc_43><loc_78><loc_44></location>4. First row rule : Only "L" cells and "C" cells are allowed in the first row.</list_item>
-<list_item><location><page_7><loc_23><loc_40><loc_79><loc_43></location>5. First column rule : Only "U" cells and "C" cells are allowed in the first column.</list_item>
-<list_item><location><page_7><loc_23><loc_37><loc_79><loc_40></location>6. Rectangular rule : The table representation is always rectangular - all rows must have an equal number of tokens, terminated with "NL" token.</list_item>
+<section_header_level_1><loc_114><loc_249><loc_185><loc_255>3. Cross cell rule :</section_header_level_1>
+<unordered_list><list_item><loc_124><loc_257><loc_393><loc_278>The left neighbour of an "X" cell must be either another "X" cell or a "U" cell, and the upper neighbour of an "X" cell must be either another "X" cell or an "L" cell.</list_item>
+<list_item><loc_114><loc_280><loc_388><loc_285>4. First row rule : Only "L" cells and "C" cells are allowed in the first row.</list_item>
+<list_item><loc_114><loc_287><loc_393><loc_300>5. First column rule : Only "U" cells and "C" cells are allowed in the first column.</list_item>
+<list_item><loc_114><loc_302><loc_393><loc_315>6. Rectangular rule : The table representation is always rectangular - all rows must have an equal number of tokens, terminated with "NL" token.</list_item>
 </unordered_list>
-<text><location><page_7><loc_22><loc_19><loc_79><loc_35></location>The application of these rules gives OTSL a set of unique properties. First of all, the OTSL enforces a strictly rectangular structure representation, where every new-line token starts a new row. As a consequence, all rows and all columns have exactly the same number of tokens, irrespective of cell spans. Secondly, the OTSL representation is unambiguous: Every table structure is represented in one way. In this representation every table cell corresponds to a "C"-cell token, which in case of spans is always located in the top-left corner of the table cell definition. Third, OTSL syntax rules are only backward-looking. As a consequence, every predicted token can be validated straight during sequence generation by looking at the previously predicted sequence. As such, OTSL can guarantee that every predicted sequence is syntactically valid.</text>
-<text><location><page_7><loc_22><loc_16><loc_79><loc_19></location>These characteristics can be easily learned by sequence generator networks, as we demonstrate further below. We find strong indications that this pattern</text>
-<text><location><page_8><loc_22><loc_82><loc_79><loc_85></location>reduces significantly the column drift seen in the HTML based models (see Figure 5).</text>
-<section_header_level_1><location><page_8><loc_22><loc_78><loc_52><loc_80></location>4.3 Error-detection and -mitigation</section_header_level_1>
-<text><location><page_8><loc_22><loc_62><loc_79><loc_77></location>The design of OTSL allows to validate a table structure easily on an unfinished sequence. The detection of an invalid sequence token is a clear indication of a prediction mistake, however a valid sequence by itself does not guarantee prediction correctness. Different heuristics can be used to correct token errors in an invalid sequence and thus increase the chances for accurate predictions. Such heuristics can be applied either after the prediction of each token, or at the end on the entire predicted sequence. For example a simple heuristic which can correct the predicted OTSL sequence on-the-fly is to verify if the token with the highest prediction confidence invalidates the predicted sequence, and replace it by the token with the next highest confidence until OTSL rules are satisfied.</text>
-<section_header_level_1><location><page_8><loc_22><loc_58><loc_37><loc_59></location>5 Experiments</section_header_level_1>
-<text><location><page_8><loc_22><loc_43><loc_79><loc_56></location>To evaluate the impact of OTSL on prediction accuracy and inference times, we conducted a series of experiments based on the TableFormer model (Figure 4) with two objectives: Firstly we evaluate the prediction quality and performance of OTSL vs. HTML after performing Hyper Parameter Optimization (HPO) on the canonical PubTabNet data set. Secondly we pick the best hyper-parameters found in the first step and evaluate how OTSL impacts the performance of TableFormer after training on other publicly available data sets (FinTabNet, PubTables-1M [14]). The ground truth (GT) from all data sets has been converted into OTSL format for this purpose, and will be made publicly available.</text>
-<figure>
-<location><page_8><loc_23><loc_25><loc_77><loc_36></location>
-<caption>Fig. 4. Architecture sketch of the TableFormer model, which is a representative for the Im2Seq approach.</caption>
-</figure>
-<text><location><page_8><loc_22><loc_16><loc_79><loc_22></location>We rely on standard metrics such as Tree Edit Distance score (TEDs) for table structure prediction, and Mean Average Precision (mAP) with 0.75 Intersection Over Union (IOU) threshold for the bounding-box predictions of table cells. The predicted OTSL structures were converted back to HTML format in</text>
-<text><location><page_9><loc_22><loc_81><loc_79><loc_85></location>order to compute the TED score. Inference timing results for all experiments were obtained from the same machine on a single core with AMD EPYC 7763 CPU @2.45 GHz.</text>
-<section_header_level_1><location><page_9><loc_22><loc_78><loc_52><loc_79></location>5.1 Hyper Parameter Optimization</section_header_level_1>
-<text><location><page_9><loc_22><loc_68><loc_79><loc_77></location>We have chosen the PubTabNet data set to perform HPO, since it includes a highly diverse set of tables. Also we report TED scores separately for simple and complex tables (tables with cell spans). Results are presented in Table. 1. It is evident that with OTSL, our model achieves the same TED score and slightly better mAP scores in comparison to HTML. However OTSL yields a 2x speed up in the inference runtime over HTML.</text>
-<table>
-<location><page_9><loc_23><loc_41><loc_78><loc_57></location>
-<caption>Table 1. HPO performed in OTSL and HTML representation on the same transformer-based TableFormer [9] architecture, trained only on PubTabNet [22]. Effects of reducing the # of layers in encoder and decoder stages of the model show that smaller models trained on OTSL perform better, especially in recognizing complex table structures, and maintain a much higher mAP score than the HTML counterpart.</caption>
-<row_0><col_0><col_header>#</col_0><col_1><col_header>#</col_1><col_2><col_header>Language</col_2><col_3><col_header>TEDs</col_3><col_4><col_header>TEDs</col_4><col_5><col_header>TEDs</col_5><col_6><col_header>mAP</col_6><col_7><col_header>Inference</col_7></row_0>
-<row_1><col_0><col_header>enc-layers</col_0><col_1><col_header>dec-layers</col_1><col_2><col_header>Language</col_2><col_3><col_header>simple</col_3><col_4><col_header>complex</col_4><col_5><col_header>all</col_5><col_6><col_header>(0.75)</col_6><col_7><col_header>time (secs)</col_7></row_1>
-<row_2><col_0><body>6</col_0><col_1><body>6</col_1><col_2><body>OTSL HTML</col_2><col_3><body>0.965 0.969</col_3><col_4><body>0.934 0.927</col_4><col_5><body>0.955 0.955</col_5><col_6><body>0.88 0.857</col_6><col_7><body>2.73 5.39</col_7></row_2>
-<row_3><col_0><body>4</col_0><col_1><body>4</col_1><col_2><body>OTSL HTML</col_2><col_3><body>0.938 0.952</col_3><col_4><body>0.904</col_4><col_5><body>0.927</col_5><col_6><body>0.853</col_6><col_7><body>1.97</col_7></row_3>
-<row_4><col_0><body>2</col_0><col_1><body>4</col_1><col_2><body>OTSL</col_2><col_3><body>0.923 0.945</col_3><col_4><body>0.909 0.897</col_4><col_5><body>0.938</col_5><col_6><body>0.843</col_6><col_7><body>3.77</col_7></row_4>
-<row_5><col_0><body></col_0><col_1><body></col_1><col_2><body>HTML</col_2><col_3><body></col_3><col_4><body>0.901</col_4><col_5><body>0.915 0.931</col_5><col_6><body>0.859 0.834</col_6><col_7><body>1.91 3.81</col_7></row_5>
-<row_6><col_0><body>4</col_0><col_1><body>2</col_1><col_2><body>OTSL HTML</col_2><col_3><body>0.952 0.944</col_3><col_4><body>0.92 0.903</col_4><col_5><body>0.942 0.931</col_5><col_6><body>0.857 0.824</col_6><col_7><body>1.22 2</col_7></row_6>
-</table>
-<section_header_level_1><location><page_9><loc_22><loc_35><loc_43><loc_36></location>5.2 Quantitative Results</section_header_level_1>
-<text><location><page_9><loc_22><loc_22><loc_79><loc_34></location>We picked the model parameter configuration that produced the best prediction quality (enc=6, dec=6, heads=8) with PubTabNet alone, then independently trained and evaluated it on three publicly available data sets: PubTabNet (395k samples), FinTabNet (113k samples) and PubTables-1M (about 1M samples). Performance results are presented in Table. 2. It is clearly evident that the model trained on OTSL outperforms HTML across the board, keeping high TEDs and mAP scores even on difficult financial tables (FinTabNet) that contain sparse and large tables.</text>
-<text><location><page_9><loc_22><loc_16><loc_79><loc_22></location>Additionally, the results show that OTSL has an advantage over HTML when applied on a bigger data set like PubTables-1M and achieves significantly improved scores. Finally, OTSL achieves faster inference due to fewer decoding steps which is a result of the reduced sequence representation.</text>
-<table>
-<location><page_10><loc_23><loc_67><loc_77><loc_80></location>
-<caption>Table 2. TSR and cell detection results compared between OTSL and HTML on the PubTabNet [22], FinTabNet [21] and PubTables-1M [14] data sets using TableFormer [9] (with enc=6, dec=6, heads=8).</caption>
-<row_0><col_0><body></col_0><col_1><col_header>Language</col_1><col_2><col_header>TEDs</col_2><col_3><col_header>TEDs</col_3><col_4><col_header>TEDs</col_4><col_5><col_header>mAP(0.75)</col_5><col_6><col_header>Inference time (secs)</col_6></row_0>
-<row_1><col_0><body></col_0><col_1><col_header>Language</col_1><col_2><col_header>simple</col_2><col_3><col_header>complex</col_3><col_4><col_header>all</col_4><col_5><col_header>mAP(0.75)</col_5><col_6><col_header>Inference time (secs)</col_6></row_1>
-<row_2><col_0><row_header>PubTabNet</col_0><col_1><row_header>OTSL</col_1><col_2><body>0.965</col_2><col_3><body>0.934</col_3><col_4><body>0.955</col_4><col_5><body>0.88</col_5><col_6><body>2.73</col_6></row_2>
-<row_3><col_0><row_header>PubTabNet</col_0><col_1><row_header>HTML</col_1><col_2><body>0.969</col_2><col_3><body>0.927</col_3><col_4><body>0.955</col_4><col_5><body>0.857</col_5><col_6><body>5.39</col_6></row_3>
-<row_4><col_0><row_header>FinTabNet</col_0><col_1><row_header>OTSL</col_1><col_2><body>0.955</col_2><col_3><body>0.961</col_3><col_4><body>0.959</col_4><col_5><body>0.862</col_5><col_6><body>1.85</col_6></row_4>
-<row_5><col_0><row_header>FinTabNet</col_0><col_1><row_header>HTML</col_1><col_2><body>0.917</col_2><col_3><body>0.922</col_3><col_4><body>0.92</col_4><col_5><body>0.722</col_5><col_6><body>3.26</col_6></row_5>
-<row_6><col_0><row_header>PubTables-1M</col_0><col_1><row_header>OTSL</col_1><col_2><body>0.987</col_2><col_3><body>0.964</col_3><col_4><body>0.977</col_4><col_5><body>0.896</col_5><col_6><body>1.79</col_6></row_6>
-<row_7><col_0><row_header>PubTables-1M</col_0><col_1><row_header>HTML</col_1><col_2><body>0.983</col_2><col_3><body>0.944</col_3><col_4><body>0.966</col_4><col_5><body>0.889</col_5><col_6><body>3.26</col_6></row_7>
-</table>
-<section_header_level_1><location><page_10><loc_22><loc_62><loc_42><loc_64></location>5.3 Qualitative Results</section_header_level_1>
-<text><location><page_10><loc_22><loc_54><loc_79><loc_61></location>To illustrate the qualitative differences between OTSL and HTML, Figure 5 demonstrates less overlap and more accurate bounding boxes with OTSL. In Figure 6, OTSL proves to be more effective in handling tables with longer token sequences, resulting in even more precise structure prediction and bounding boxes.</text>
-<figure>
-<location><page_10><loc_27><loc_16><loc_74><loc_44></location>
-<caption>Fig. 5. The OTSL model produces more accurate bounding boxes with less overlap (E) than the HTML model (D), when predicting the structure of a sparse table (A), at twice the inference speed because of shorter sequence length (B),(C). "PMC2807444_006_00.png" PubTabNet. μ</caption>
-</figure>
-<text><location><page_10><loc_37><loc_15><loc_38><loc_16></location>μ</text>
-<text><location><page_10><loc_49><loc_12><loc_49><loc_14></location>≥</text>
-<figure>
-<location><page_11><loc_28><loc_20><loc_73><loc_77></location>
-<caption>Fig. 6. Visualization of predicted structure and detected bounding boxes on a complex table with many rows. The OTSL model (B) captured repeating pattern of horizontally merged cells from the GT (A), unlike the HTML model (C). The HTML model also didn't complete the HTML sequence correctly and displayed a lot more of drift and overlap of bounding boxes. "PMC5406406_003_01.png" PubTabNet.</caption>
-</figure>
-<section_header_level_1><location><page_12><loc_22><loc_84><loc_36><loc_85></location>6 Conclusion</section_header_level_1>
-<text><location><page_12><loc_22><loc_74><loc_79><loc_81></location>We demonstrated that representing tables in HTML for the task of table structure recognition with Im2Seq models is ill-suited and has serious limitations. Furthermore, we presented in this paper an Optimized Table Structure Language (OTSL) which, when compared to commonly used general purpose languages, has several key benefits.</text>
-<text><location><page_12><loc_22><loc_59><loc_79><loc_74></location>First and foremost, given the same network configuration, inference time for a table-structure prediction is about 2 times faster compared to the conventional HTML approach. This is primarily owed to the shorter sequence length of the OTSL representation. Additional performance benefits can be obtained with HPO (hyper parameter optimization). As we demonstrate in our experiments, models trained on OTSL can be significantly smaller, e.g. by reducing the number of encoder and decoder layers, while preserving comparatively good prediction quality. This can further improve inference performance, yielding 5-6 times faster inference speed in OTSL with prediction quality comparable to models trained on HTML (see Table 1).</text>
-<text><location><page_12><loc_22><loc_41><loc_79><loc_59></location>Secondly, OTSL has more inherent structure and a significantly restricted vocabulary size. This allows autoregressive models to perform better in the TED metric, but especially with regards to prediction accuracy of the table-cell bounding boxes (see Table 2). As shown in Figure 5, we observe that the OTSL drastically reduces the drift for table cell bounding boxes at high row count and in sparse tables. This leads to more accurate predictions and a significant reduction in post-processing complexity, which is an undesired necessity in HTML-based Im2Seq models. Significant novelty lies in OTSL syntactical rules, which are few, simple and always backwards looking. Each new token can be validated only by analyzing the sequence of previous tokens, without requiring the entire sequence to detect mistakes. This in return allows to perform structural error detection and correction on-the-fly during sequence generation.</text>
-<section_header_level_1><location><page_12><loc_22><loc_36><loc_32><loc_38></location>References</section_header_level_1>
-<unordered_list>
-<list_item><location><page_12><loc_23><loc_29><loc_79><loc_34></location>1. Auer, C., Dolfi, M., Carvalho, A., Ramis, C.B., Staar, P.W.J.: Delivering document conversion as a cloud service with high throughput and responsiveness. CoRR abs/2206.00785 (2022). https://doi.org/10.48550/arXiv.2206.00785 , https://doi.org/10.48550/arXiv.2206.00785</list_item>
-<list_item><location><page_12><loc_23><loc_23><loc_79><loc_28></location>2. Chen, B., Peng, D., Zhang, J., Ren, Y., Jin, L.: Complex table structure recognition in the wild using transformer and identity matrix-based augmentation. In: Porwal, U., Fornés, A., Shafait, F. (eds.) Frontiers in Handwriting Recognition. pp. 545561. Springer International Publishing, Cham (2022)</list_item>
-<list_item><location><page_12><loc_23><loc_20><loc_79><loc_23></location>3. Chi, Z., Huang, H., Xu, H.D., Yu, H., Yin, W., Mao, X.L.: Complicated table structure recognition. arXiv preprint arXiv:1908.04729 (2019)</list_item>
-<list_item><location><page_12><loc_23><loc_16><loc_79><loc_20></location>4. Deng, Y., Rosenberg, D., Mann, G.: Challenges in end-to-end neural scientific table recognition. In: 2019 International Conference on Document Analysis and Recognition (ICDAR). pp. 894-901. IEEE (2019)</list_item>
+<text><loc_110><loc_324><loc_393><loc_405>The application of these rules gives OTSL a set of unique properties. First of all, the OTSL enforces a strictly rectangular structure representation, where every new-line token starts a new row. As a consequence, all rows and all columns have exactly the same number of tokens, irrespective of cell spans. Secondly, the OTSL representation is unambiguous: Every table structure is represented in one way. In this representation every table cell corresponds to a "C"-cell token, which in case of spans is always located in the top-left corner of the table cell definition. Third, OTSL syntax rules are only backward-looking. As a consequence, every predicted token can be validated straight during sequence generation by looking at the previously predicted sequence. As such, OTSL can guarantee that every predicted sequence is syntactically valid.</text>
+<text><loc_110><loc_407><loc_393><loc_420>These characteristics can be easily learned by sequence generator networks, as we demonstrate further below. We find strong indications that this pattern</text>
+<page_break>
+<page_header><loc_110><loc_59><loc_114><loc_64>8</page_header>
+<page_header><loc_137><loc_59><loc_189><loc_64>M. Lysak, et al.</page_header>
+<text><loc_110><loc_75><loc_393><loc_88>reduces significantly the column drift seen in the HTML based models (see Figure 5).</text>
+<section_header_level_1><loc_110><loc_102><loc_261><loc_108>4.3 Error-detection and -mitigation</section_header_level_1>
+<text><loc_110><loc_115><loc_393><loc_189>The design of OTSL allows to validate a table structure easily on an unfinished sequence. The detection of an invalid sequence token is a clear indication of a prediction mistake, however a valid sequence by itself does not guarantee prediction correctness. Different heuristics can be used to correct token errors in an invalid sequence and thus increase the chances for accurate predictions. Such heuristics can be applied either after the prediction of each token, or at the end on the entire predicted sequence. For example a simple heuristic which can correct the predicted OTSL sequence on-the-fly is to verify if the token with the highest prediction confidence invalidates the predicted sequence, and replace it by the token with the next highest confidence until OTSL rules are satisfied.</text>
+<section_header_level_1><loc_110><loc_203><loc_187><loc_209>5 Experiments</section_header_level_1>
+<text><loc_110><loc_219><loc_393><loc_285>To evaluate the impact of OTSL on prediction accuracy and inference times, we conducted a series of experiments based on the TableFormer model (Figure 4) with two objectives: Firstly we evaluate the prediction quality and performance of OTSL vs. HTML after performing Hyper Parameter Optimization (HPO) on the canonical PubTabNet data set. Secondly we pick the best hyper-parameters found in the first step and evaluate how OTSL impacts the performance of TableFormer after training on other publicly available data sets (FinTabNet, PubTables-1M [14]). The ground truth (GT) from all data sets has been converted into OTSL format for this purpose, and will be made publicly available.</text>
+<picture><loc_115><loc_321><loc_386><loc_375><caption><loc_110><loc_306><loc_393><loc_318>Fig. 4. Architecture sketch of the TableFormer model, which is a representative for the Im2Seq approach.</caption></picture>
+<text><loc_110><loc_392><loc_393><loc_420>We rely on standard metrics such as Tree Edit Distance score (TEDs) for table structure prediction, and Mean Average Precision (mAP) with 0.75 Intersection Over Union (IOU) threshold for the bounding-box predictions of table cells. The predicted OTSL structures were converted back to HTML format in</text>
+<page_break>
+<page_header><loc_159><loc_59><loc_366><loc_64>Optimized Table Tokenization for Table Structure Recognition</page_header>
+<page_header><loc_389><loc_59><loc_393><loc_64>9</page_header>
+<text><loc_110><loc_75><loc_393><loc_96>order to compute the TED score. Inference timing results for all experiments were obtained from the same machine on a single core with AMD EPYC 7763 CPU @2.45 GHz.</text>
+<section_header_level_1><loc_110><loc_107><loc_260><loc_112>5.1 Hyper Parameter Optimization</section_header_level_1>
+<text><loc_110><loc_117><loc_393><loc_160>We have chosen the PubTabNet data set to perform HPO, since it includes a highly diverse set of tables. Also we report TED scores separately for simple and complex tables (tables with cell spans). Results are presented in Table. 1. It is evident that with OTSL, our model achieves the same TED score and slightly better mAP scores in comparison to HTML. However OTSL yields a 2x speed up in the inference runtime over HTML.</text>
+<otsl><loc_114><loc_213><loc_388><loc_296><ched>#<ched>#<ched>Language<ched>TEDs<lcel><lcel><ched>mAP<ched>Inference<nl><ched>enc-layers<ched>dec-layers<ucel><ched>simple<ched>complex<ched>all<ched>(0.75)<ched>time (secs)<nl><fcel>6<fcel>6<fcel>OTSL HTML<fcel>0.965 0.969<fcel>0.934 0.927<fcel>0.955 0.955<fcel>0.88 0.857<fcel>2.73 5.39<nl><fcel>4<fcel>4<fcel>OTSL HTML<fcel>0.938 0.952<fcel>0.904<fcel>0.927<fcel>0.853<fcel>1.97<nl><fcel>2<fcel>4<fcel>OTSL<fcel>0.923 0.945<fcel>0.909 0.897<fcel>0.938<fcel>0.843<fcel>3.77<nl><ecel><ecel><fcel>HTML<ecel><fcel>0.901<fcel>0.915 0.931<fcel>0.859 0.834<fcel>1.91 3.81<nl><fcel>4<fcel>2<fcel>OTSL HTML<fcel>0.952 0.944<fcel>0.92 0.903<fcel>0.942 0.931<fcel>0.857 0.824<fcel>1.22 2<nl><caption><loc_110><loc_174><loc_393><loc_206>Table 1. HPO performed in OTSL and HTML representation on the same transformer-based TableFormer [9] architecture, trained only on PubTabNet [22]. Effects of reducing the # of layers in encoder and decoder stages of the model show that smaller models trained on OTSL perform better, especially in recognizing complex table structures, and maintain a much higher mAP score than the HTML counterpart.</caption></otsl>
+<section_header_level_1><loc_110><loc_321><loc_216><loc_326>5.2 Quantitative Results</section_header_level_1>
+<text><loc_110><loc_331><loc_393><loc_390>We picked the model parameter configuration that produced the best prediction quality (enc=6, dec=6, heads=8) with PubTabNet alone, then independently trained and evaluated it on three publicly available data sets: PubTabNet (395k samples), FinTabNet (113k samples) and PubTables-1M (about 1M samples). Performance results are presented in Table. 2. It is clearly evident that the model trained on OTSL outperforms HTML across the board, keeping high TEDs and mAP scores even on difficult financial tables (FinTabNet) that contain sparse and large tables.</text>
+<text><loc_110><loc_392><loc_393><loc_420>Additionally, the results show that OTSL has an advantage over HTML when applied on a bigger data set like PubTables-1M and achieves significantly improved scores. Finally, OTSL achieves faster inference due to fewer decoding steps which is a result of the reduced sequence representation.</text>
+<page_break>
+<page_header><loc_110><loc_59><loc_118><loc_64>10</page_header>
+<page_header><loc_137><loc_59><loc_189><loc_64>M. Lysak, et al.</page_header>
+<otsl><loc_117><loc_99><loc_385><loc_166><ecel><ched>Language<ched>TEDs<lcel><lcel><ched>mAP(0.75)<ched>Inference time (secs)<nl><ecel><ucel><ched>simple<ched>complex<ched>all<ucel><ucel><nl><rhed>PubTabNet<rhed>OTSL<fcel>0.965<fcel>0.934<fcel>0.955<fcel>0.88<fcel>2.73<nl><ucel><rhed>HTML<fcel>0.969<fcel>0.927<fcel>0.955<fcel>0.857<fcel>5.39<nl><rhed>FinTabNet<rhed>OTSL<fcel>0.955<fcel>0.961<fcel>0.959<fcel>0.862<fcel>1.85<nl><ucel><rhed>HTML<fcel>0.917<fcel>0.922<fcel>0.92<fcel>0.722<fcel>3.26<nl><rhed>PubTables-1M<rhed>OTSL<fcel>0.987<fcel>0.964<fcel>0.977<fcel>0.896<fcel>1.79<nl><ucel><rhed>HTML<fcel>0.983<fcel>0.944<fcel>0.966<fcel>0.889<fcel>3.26<nl><caption><loc_110><loc_73><loc_393><loc_92>Table 2. TSR and cell detection results compared between OTSL and HTML on the PubTabNet [22], FinTabNet [21] and PubTables-1M [14] data sets using TableFormer [9] (with enc=6, dec=6, heads=8).</caption></otsl>
+<section_header_level_1><loc_110><loc_182><loc_210><loc_188>5.3 Qualitative Results</section_header_level_1>
+<text><loc_110><loc_196><loc_393><loc_231>To illustrate the qualitative differences between OTSL and HTML, Figure 5 demonstrates less overlap and more accurate bounding boxes with OTSL. In Figure 6, OTSL proves to be more effective in handling tables with longer token sequences, resulting in even more precise structure prediction and bounding boxes.</text>
+<picture><loc_133><loc_281><loc_369><loc_419><caption><loc_110><loc_251><loc_393><loc_278>Fig. 5. The OTSL model produces more accurate bounding boxes with less overlap (E) than the HTML model (D), when predicting the structure of a sparse table (A), at twice the inference speed because of shorter sequence length (B),(C). "PMC2807444_006_00.png" PubTabNet. μ</caption></picture>
+<text><loc_186><loc_420><loc_188><loc_426>μ</text>
+<text><loc_246><loc_432><loc_247><loc_438>≥</text>
+<page_break>
+<page_header><loc_159><loc_59><loc_366><loc_64>Optimized Table Tokenization for Table Structure Recognition</page_header>
+<page_header><loc_385><loc_59><loc_393><loc_64>11</page_header>
+<picture><loc_138><loc_115><loc_365><loc_400><caption><loc_110><loc_79><loc_393><loc_112>Fig. 6. Visualization of predicted structure and detected bounding boxes on a complex table with many rows. The OTSL model (B) captured repeating pattern of horizontally merged cells from the GT (A), unlike the HTML model (C). The HTML model also didn't complete the HTML sequence correctly and displayed a lot more of drift and overlap of bounding boxes. "PMC5406406_003_01.png" PubTabNet.</caption></picture>
+<page_break>
+<page_header><loc_110><loc_59><loc_118><loc_64>12</page_header>
+<page_header><loc_137><loc_59><loc_189><loc_64>M. Lysak, et al.</page_header>
+<section_header_level_1><loc_110><loc_74><loc_179><loc_81>6 Conclusion</section_header_level_1>
+<text><loc_110><loc_93><loc_393><loc_128>We demonstrated that representing tables in HTML for the task of table structure recognition with Im2Seq models is ill-suited and has serious limitations. Furthermore, we presented in this paper an Optimized Table Structure Language (OTSL) which, when compared to commonly used general purpose languages, has several key benefits.</text>
+<text><loc_110><loc_131><loc_393><loc_204>First and foremost, given the same network configuration, inference time for a table-structure prediction is about 2 times faster compared to the conventional HTML approach. This is primarily owed to the shorter sequence length of the OTSL representation. Additional performance benefits can be obtained with HPO (hyper parameter optimization). As we demonstrate in our experiments, models trained on OTSL can be significantly smaller, e.g. by reducing the number of encoder and decoder layers, while preserving comparatively good prediction quality. This can further improve inference performance, yielding 5-6 times faster inference speed in OTSL with prediction quality comparable to models trained on HTML (see Table 1).</text>
+<text><loc_110><loc_207><loc_393><loc_296>Secondly, OTSL has more inherent structure and a significantly restricted vocabulary size. This allows autoregressive models to perform better in the TED metric, but especially with regards to prediction accuracy of the table-cell bounding boxes (see Table 2). As shown in Figure 5, we observe that the OTSL drastically reduces the drift for table cell bounding boxes at high row count and in sparse tables. This leads to more accurate predictions and a significant reduction in post-processing complexity, which is an undesired necessity in HTML-based Im2Seq models. Significant novelty lies in OTSL syntactical rules, which are few, simple and always backwards looking. Each new token can be validated only by analyzing the sequence of previous tokens, without requiring the entire sequence to detect mistakes. This in return allows to perform structural error detection and correction on-the-fly during sequence generation.</text>
+<section_header_level_1><loc_110><loc_312><loc_162><loc_318>References</section_header_level_1>
+<unordered_list><list_item><loc_114><loc_330><loc_393><loc_356>1. Auer, C., Dolfi, M., Carvalho, A., Ramis, C.B., Staar, P.W.J.: Delivering document conversion as a cloud service with high throughput and responsiveness. CoRR abs/2206.00785 (2022). https://doi.org/10.48550/arXiv.2206.00785 , https://doi.org/10.48550/arXiv.2206.00785</list_item>
+<list_item><loc_114><loc_358><loc_393><loc_384>2. Chen, B., Peng, D., Zhang, J., Ren, Y., Jin, L.: Complex table structure recognition in the wild using transformer and identity matrix-based augmentation. In: Porwal, U., Fornés, A., Shafait, F. (eds.) Frontiers in Handwriting Recognition. pp. 545561. Springer International Publishing, Cham (2022)</list_item>
+<list_item><loc_114><loc_386><loc_393><loc_398>3. Chi, Z., Huang, H., Xu, H.D., Yu, H., Yin, W., Mao, X.L.: Complicated table structure recognition. arXiv preprint arXiv:1908.04729 (2019)</list_item>
+<list_item><loc_114><loc_401><loc_393><loc_420>4. Deng, Y., Rosenberg, D., Mann, G.: Challenges in end-to-end neural scientific table recognition. In: 2019 International Conference on Document Analysis and Recognition (ICDAR). pp. 894-901. IEEE (2019)</list_item>
 </unordered_list>
-<unordered_list>
-<list_item><location><page_13><loc_23><loc_81><loc_79><loc_85></location>5. Kayal, P., Anand, M., Desai, H., Singh, M.: Tables to latex: structure and content extraction from scientific tables. International Journal on Document Analysis and Recognition (IJDAR) pp. 1-10 (2022)</list_item>
-<list_item><location><page_13><loc_23><loc_76><loc_79><loc_81></location>6. Lee, E., Kwon, J., Yang, H., Park, J., Lee, S., Koo, H.I., Cho, N.I.: Table structure recognition based on grid shape graph. In: 2022 Asia-Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC). pp. 18681873. IEEE (2022)</list_item>
-<list_item><location><page_13><loc_23><loc_73><loc_79><loc_75></location>7. Li, M., Cui, L., Huang, S., Wei, F., Zhou, M., Li, Z.: Tablebank: A benchmark dataset for table detection and recognition (2019)</list_item>
-<list_item><location><page_13><loc_23><loc_66><loc_79><loc_72></location>8. Livathinos, N., Berrospi, C., Lysak, M., Kuropiatnyk, V., Nassar, A., Carvalho, A., Dolfi, M., Auer, C., Dinkla, K., Staar, P.: Robust pdf document conversion using recurrent neural networks. Proceedings of the AAAI Conference on Artificial Intelligence 35 (17), 15137-15145 (May 2021), https://ojs.aaai.org/index.php/ AAAI/article/view/17777</list_item>
-<list_item><location><page_13><loc_23><loc_62><loc_79><loc_66></location>9. Nassar, A., Livathinos, N., Lysak, M., Staar, P.: Tableformer: Table structure understanding with transformers. In: Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). pp. 4614-4623 (June 2022)</list_item>
-<list_item><location><page_13><loc_22><loc_53><loc_79><loc_61></location>10. Pfitzmann, B., Auer, C., Dolfi, M., Nassar, A.S., Staar, P.W.J.: Doclaynet: A large human-annotated dataset for document-layout segmentation. In: Zhang, A., Rangwala, H. (eds.) KDD '22: The 28th ACM SIGKDD Conference on Knowledge Discovery and Data Mining, Washington, DC, USA, August 14 - 18, 2022. pp. 3743-3751. ACM (2022). https://doi.org/10.1145/3534678.3539043 , https:// doi.org/10.1145/3534678.3539043</list_item>
-<list_item><location><page_13><loc_22><loc_48><loc_79><loc_53></location>11. Prasad, D., Gadpal, A., Kapadni, K., Visave, M., Sultanpure, K.: Cascadetabnet: An approach for end to end table detection and structure recognition from imagebased documents. In: Proceedings of the IEEE/CVF conference on computer vision and pattern recognition workshops. pp. 572-573 (2020)</list_item>
-<list_item><location><page_13><loc_22><loc_42><loc_79><loc_48></location>12. Schreiber, S., Agne, S., Wolf, I., Dengel, A., Ahmed, S.: Deepdesrt: Deep learning for detection and structure recognition of tables in document images. In: 2017 14th IAPR international conference on document analysis and recognition (ICDAR). vol. 1, pp. 1162-1167. IEEE (2017)</list_item>
-<list_item><location><page_13><loc_22><loc_37><loc_79><loc_42></location>13. Siddiqui, S.A., Fateh, I.A., Rizvi, S.T.R., Dengel, A., Ahmed, S.: Deeptabstr: Deep learning based table structure recognition. In: 2019 International Conference on Document Analysis and Recognition (ICDAR). pp. 1403-1409 (2019). https:// doi.org/10.1109/ICDAR.2019.00226</list_item>
-<list_item><location><page_13><loc_22><loc_31><loc_79><loc_36></location>14. Smock, B., Pesala, R., Abraham, R.: PubTables-1M: Towards comprehensive table extraction from unstructured documents. In: Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). pp. 4634-4642 (June 2022)</list_item>
-<list_item><location><page_13><loc_22><loc_23><loc_79><loc_31></location>15. Staar, P.W.J., Dolfi, M., Auer, C., Bekas, C.: Corpus conversion service: A machine learning platform to ingest documents at scale. In: Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining. pp. 774-782. KDD '18, Association for Computing Machinery, New York, NY, USA (2018). https://doi.org/10.1145/3219819.3219834 , https://doi.org/10. 1145/3219819.3219834</list_item>
-<list_item><location><page_13><loc_22><loc_20><loc_79><loc_23></location>16. Wang, X.: Tabular Abstraction, Editing, and Formatting. Ph.D. thesis, CAN (1996), aAINN09397</list_item>
-<list_item><location><page_13><loc_22><loc_16><loc_79><loc_20></location>17. Xue, W., Li, Q., Tao, D.: Res2tim: Reconstruct syntactic structures from table images. In: 2019 International Conference on Document Analysis and Recognition (ICDAR). pp. 749-755. IEEE (2019)</list_item>
+<page_break>
+<page_header><loc_159><loc_59><loc_366><loc_64>Optimized Table Tokenization for Table Structure Recognition</page_header>
+<page_header><loc_385><loc_59><loc_393><loc_64>13</page_header>
+<unordered_list><list_item><loc_114><loc_76><loc_393><loc_94>5. Kayal, P., Anand, M., Desai, H., Singh, M.: Tables to latex: structure and content extraction from scientific tables. International Journal on Document Analysis and Recognition (IJDAR) pp. 1-10 (2022)</list_item>
+<list_item><loc_114><loc_96><loc_393><loc_122>6. Lee, E., Kwon, J., Yang, H., Park, J., Lee, S., Koo, H.I., Cho, N.I.: Table structure recognition based on grid shape graph. In: 2022 Asia-Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC). pp. 18681873. IEEE (2022)</list_item>
+<list_item><loc_114><loc_124><loc_393><loc_136>7. Li, M., Cui, L., Huang, S., Wei, F., Zhou, M., Li, Z.: Tablebank: A benchmark dataset for table detection and recognition (2019)</list_item>
+<list_item><loc_114><loc_138><loc_393><loc_171>8. Livathinos, N., Berrospi, C., Lysak, M., Kuropiatnyk, V., Nassar, A., Carvalho, A., Dolfi, M., Auer, C., Dinkla, K., Staar, P.: Robust pdf document conversion using recurrent neural networks. Proceedings of the AAAI Conference on Artificial Intelligence 35 (17), 15137-15145 (May 2021), https://ojs.aaai.org/index.php/ AAAI/article/view/17777</list_item>
+<list_item><loc_114><loc_172><loc_393><loc_191>9. Nassar, A., Livathinos, N., Lysak, M., Staar, P.: Tableformer: Table structure understanding with transformers. In: Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). pp. 4614-4623 (June 2022)</list_item>
+<list_item><loc_110><loc_193><loc_393><loc_233>10. Pfitzmann, B., Auer, C., Dolfi, M., Nassar, A.S., Staar, P.W.J.: Doclaynet: A large human-annotated dataset for document-layout segmentation. In: Zhang, A., Rangwala, H. (eds.) KDD '22: The 28th ACM SIGKDD Conference on Knowledge Discovery and Data Mining, Washington, DC, USA, August 14 - 18, 2022. pp. 3743-3751. ACM (2022). https://doi.org/10.1145/3534678.3539043 , https:// doi.org/10.1145/3534678.3539043</list_item>
+<list_item><loc_110><loc_235><loc_393><loc_261>11. Prasad, D., Gadpal, A., Kapadni, K., Visave, M., Sultanpure, K.: Cascadetabnet: An approach for end to end table detection and structure recognition from imagebased documents. In: Proceedings of the IEEE/CVF conference on computer vision and pattern recognition workshops. pp. 572-573 (2020)</list_item>
+<list_item><loc_110><loc_262><loc_393><loc_288>12. Schreiber, S., Agne, S., Wolf, I., Dengel, A., Ahmed, S.: Deepdesrt: Deep learning for detection and structure recognition of tables in document images. In: 2017 14th IAPR international conference on document analysis and recognition (ICDAR). vol. 1, pp. 1162-1167. IEEE (2017)</list_item>
+<list_item><loc_110><loc_290><loc_393><loc_316>13. Siddiqui, S.A., Fateh, I.A., Rizvi, S.T.R., Dengel, A., Ahmed, S.: Deeptabstr: Deep learning based table structure recognition. In: 2019 International Conference on Document Analysis and Recognition (ICDAR). pp. 1403-1409 (2019). https:// doi.org/10.1109/ICDAR.2019.00226</list_item>
+<list_item><loc_110><loc_318><loc_393><loc_344>14. Smock, B., Pesala, R., Abraham, R.: PubTables-1M: Towards comprehensive table extraction from unstructured documents. In: Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). pp. 4634-4642 (June 2022)</list_item>
+<list_item><loc_110><loc_345><loc_393><loc_385>15. Staar, P.W.J., Dolfi, M., Auer, C., Bekas, C.: Corpus conversion service: A machine learning platform to ingest documents at scale. In: Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining. pp. 774-782. KDD '18, Association for Computing Machinery, New York, NY, USA (2018). https://doi.org/10.1145/3219819.3219834 , https://doi.org/10. 1145/3219819.3219834</list_item>
+<list_item><loc_110><loc_387><loc_393><loc_399>16. Wang, X.: Tabular Abstraction, Editing, and Formatting. Ph.D. thesis, CAN (1996), aAINN09397</list_item>
+<list_item><loc_110><loc_401><loc_393><loc_420>17. Xue, W., Li, Q., Tao, D.: Res2tim: Reconstruct syntactic structures from table images. In: 2019 International Conference on Document Analysis and Recognition (ICDAR). pp. 749-755. IEEE (2019)</list_item>
 </unordered_list>
-<unordered_list>
-<list_item><location><page_14><loc_22><loc_81><loc_79><loc_85></location>18. Xue, W., Yu, B., Wang, W., Tao, D., Li, Q.: Tgrnet: A table graph reconstruction network for table structure recognition. In: Proceedings of the IEEE/CVF International Conference on Computer Vision. pp. 1295-1304 (2021)</list_item>
-<list_item><location><page_14><loc_22><loc_76><loc_79><loc_81></location>19. Ye, J., Qi, X., He, Y., Chen, Y., Gu, D., Gao, P., Xiao, R.: Pingan-vcgroup's solution for icdar 2021 competition on scientific literature parsing task b: Table recognition to html (2021). https://doi.org/10.48550/ARXIV.2105.01848 , https://arxiv.org/abs/2105.01848</list_item>
-<list_item><location><page_14><loc_22><loc_73><loc_79><loc_75></location>20. Zhang, Z., Zhang, J., Du, J., Wang, F.: Split, embed and merge: An accurate table structure recognizer. Pattern Recognition 126 , 108565 (2022)</list_item>
-<list_item><location><page_14><loc_22><loc_66><loc_79><loc_72></location>21. Zheng, X., Burdick, D., Popa, L., Zhong, X., Wang, N.X.R.: Global table extractor (gte): A framework for joint table identification and cell structure recognition using visual context. In: 2021 IEEE Winter Conference on Applications of Computer Vision (WACV). pp. 697-706 (2021). https://doi.org/10.1109/WACV48630.2021. 00074</list_item>
-<list_item><location><page_14><loc_22><loc_60><loc_79><loc_66></location>22. Zhong, X., ShafieiBavani, E., Jimeno Yepes, A.: Image-based table recognition: Data, model, and evaluation. In: Vedaldi, A., Bischof, H., Brox, T., Frahm, J.M. (eds.) Computer Vision - ECCV 2020. pp. 564-580. Springer International Publishing, Cham (2020)</list_item>
-<list_item><location><page_14><loc_22><loc_56><loc_79><loc_60></location>23. Zhong, X., Tang, J., Yepes, A.J.: Publaynet: largest dataset ever for document layout analysis. In: 2019 International Conference on Document Analysis and Recognition (ICDAR). pp. 1015-1022. IEEE (2019)</list_item>
-</document>
\ No newline at end of file
+<page_break>
+<page_header><loc_110><loc_59><loc_118><loc_64>14</page_header>
+<page_header><loc_137><loc_59><loc_189><loc_64>M. Lysak, et al.</page_header>
+<unordered_list><list_item><loc_110><loc_76><loc_393><loc_94>18. Xue, W., Yu, B., Wang, W., Tao, D., Li, Q.: Tgrnet: A table graph reconstruction network for table structure recognition. In: Proceedings of the IEEE/CVF International Conference on Computer Vision. pp. 1295-1304 (2021)</list_item>
+<list_item><loc_110><loc_96><loc_393><loc_122>19. Ye, J., Qi, X., He, Y., Chen, Y., Gu, D., Gao, P., Xiao, R.: Pingan-vcgroup's solution for icdar 2021 competition on scientific literature parsing task b: Table recognition to html (2021). https://doi.org/10.48550/ARXIV.2105.01848 , https://arxiv.org/abs/2105.01848</list_item>
+<list_item><loc_110><loc_124><loc_393><loc_136>20. Zhang, Z., Zhang, J., Du, J., Wang, F.: Split, embed and merge: An accurate table structure recognizer. Pattern Recognition 126 , 108565 (2022)</list_item>
+<list_item><loc_110><loc_138><loc_393><loc_171>21. Zheng, X., Burdick, D., Popa, L., Zhong, X., Wang, N.X.R.: Global table extractor (gte): A framework for joint table identification and cell structure recognition using visual context. In: 2021 IEEE Winter Conference on Applications of Computer Vision (WACV). pp. 697-706 (2021). https://doi.org/10.1109/WACV48630.2021. 00074</list_item>
+<list_item><loc_110><loc_172><loc_393><loc_198>22. Zhong, X., ShafieiBavani, E., Jimeno Yepes, A.: Image-based table recognition: Data, model, and evaluation. In: Vedaldi, A., Bischof, H., Brox, T., Frahm, J.M. (eds.) Computer Vision - ECCV 2020. pp. 564-580. Springer International Publishing, Cham (2020)</list_item>
+<list_item><loc_110><loc_200><loc_393><loc_219>23. Zhong, X., Tang, J., Yepes, A.J.: Publaynet: largest dataset ever for document layout analysis. In: 2019 International Conference on Document Analysis and Recognition (ICDAR). pp. 1015-1022. IEEE (2019)</list_item>
+</unordered_list>
+</doctag>
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v2/2305.03393v1.json b/tests/data/groundtruth/docling_v2/2305.03393v1.json
index 35bac03b..ac5d13c1 100644
--- a/tests/data/groundtruth/docling_v2/2305.03393v1.json
+++ b/tests/data/groundtruth/docling_v2/2305.03393v1.json
@@ -1 +1 @@
-{"schema_name": "DoclingDocument", "version": "1.0.0", "name": "2305.03393v1", "origin": {"mimetype": "application/pdf", "binary_hash": 8240558336632491037, "filename": "2305.03393v1.pdf", "uri": null}, "furniture": {"self_ref": "#/furniture", "parent": null, "children": [], "name": "_root_", "label": "unspecified"}, "body": {"self_ref": "#/body", "parent": null, "children": [{"cref": "#/texts/0"}, {"cref": "#/texts/1"}, {"cref": "#/groups/0"}, {"cref": "#/texts/6"}, {"cref": "#/texts/7"}, {"cref": "#/texts/8"}, {"cref": "#/texts/9"}, {"cref": "#/texts/10"}, {"cref": "#/texts/11"}, {"cref": "#/texts/12"}, {"cref": "#/texts/13"}, {"cref": "#/pictures/0"}, {"cref": "#/texts/120"}, {"cref": "#/texts/121"}, {"cref": "#/texts/122"}, {"cref": "#/texts/123"}, {"cref": "#/texts/124"}, {"cref": "#/texts/125"}, {"cref": "#/texts/126"}, {"cref": "#/texts/127"}, {"cref": "#/texts/128"}, {"cref": "#/texts/129"}, {"cref": "#/texts/130"}, {"cref": "#/texts/131"}, {"cref": "#/texts/132"}, {"cref": "#/texts/133"}, {"cref": "#/texts/134"}, {"cref": "#/texts/135"}, {"cref": "#/texts/136"}, {"cref": "#/texts/137"}, {"cref": "#/texts/138"}, {"cref": "#/texts/139"}, {"cref": "#/pictures/1"}, {"cref": "#/texts/140"}, {"cref": "#/texts/141"}, {"cref": "#/texts/142"}, {"cref": "#/texts/143"}, {"cref": "#/texts/144"}, {"cref": "#/texts/145"}, {"cref": "#/texts/146"}, {"cref": "#/texts/147"}, {"cref": "#/texts/148"}, {"cref": "#/texts/149"}, {"cref": "#/texts/150"}, {"cref": "#/texts/151"}, {"cref": "#/groups/1"}, {"cref": "#/texts/157"}, {"cref": "#/texts/158"}, {"cref": "#/texts/159"}, {"cref": "#/texts/160"}, {"cref": "#/pictures/2"}, {"cref": "#/texts/229"}, {"cref": "#/texts/230"}, {"cref": "#/groups/2"}, {"cref": "#/texts/233"}, {"cref": "#/groups/3"}, {"cref": "#/texts/238"}, {"cref": "#/texts/239"}, {"cref": "#/texts/240"}, {"cref": "#/texts/241"}, {"cref": "#/texts/242"}, {"cref": "#/texts/243"}, {"cref": "#/texts/244"}, {"cref": "#/texts/245"}, {"cref": "#/texts/246"}, {"cref": "#/texts/247"}, {"cref": "#/pictures/3"}, {"cref": "#/texts/320"}, {"cref": "#/texts/321"}, {"cref": "#/texts/322"}, {"cref": "#/texts/323"}, {"cref": "#/texts/324"}, {"cref": "#/texts/325"}, {"cref": "#/texts/326"}, {"cref": "#/tables/0"}, {"cref": "#/texts/327"}, {"cref": "#/texts/328"}, {"cref": "#/texts/329"}, {"cref": "#/texts/330"}, {"cref": "#/texts/331"}, {"cref": "#/texts/332"}, {"cref": "#/tables/1"}, {"cref": "#/texts/333"}, {"cref": "#/texts/334"}, {"cref": "#/texts/335"}, {"cref": "#/pictures/4"}, {"cref": "#/texts/433"}, {"cref": "#/texts/434"}, {"cref": "#/texts/435"}, {"cref": "#/texts/436"}, {"cref": "#/texts/437"}, {"cref": "#/pictures/5"}, {"cref": "#/texts/449"}, {"cref": "#/texts/450"}, {"cref": "#/texts/451"}, {"cref": "#/texts/452"}, {"cref": "#/texts/453"}, {"cref": "#/texts/454"}, {"cref": "#/texts/455"}, {"cref": "#/groups/4"}, {"cref": "#/texts/460"}, {"cref": "#/texts/461"}, {"cref": "#/groups/5"}, {"cref": "#/texts/475"}, {"cref": "#/texts/476"}, {"cref": "#/groups/6"}], "name": "_root_", "label": "unspecified"}, "groups": [{"self_ref": "#/groups/0", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/2"}, {"cref": "#/texts/3"}, {"cref": "#/texts/4"}, {"cref": "#/texts/5"}], "name": "group", "label": "key_value_area"}, {"self_ref": "#/groups/1", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/152"}, {"cref": "#/texts/153"}, {"cref": "#/texts/154"}, {"cref": "#/texts/155"}, {"cref": "#/texts/156"}], "name": "list", "label": "list"}, {"self_ref": "#/groups/2", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/231"}, {"cref": "#/texts/232"}], "name": "list", "label": "list"}, {"self_ref": "#/groups/3", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/234"}, {"cref": "#/texts/235"}, {"cref": "#/texts/236"}, {"cref": "#/texts/237"}], "name": "list", "label": "list"}, {"self_ref": "#/groups/4", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/456"}, {"cref": "#/texts/457"}, {"cref": "#/texts/458"}, {"cref": "#/texts/459"}], "name": "list", "label": "list"}, {"self_ref": "#/groups/5", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/462"}, {"cref": "#/texts/463"}, {"cref": "#/texts/464"}, {"cref": "#/texts/465"}, {"cref": "#/texts/466"}, {"cref": "#/texts/467"}, {"cref": "#/texts/468"}, {"cref": "#/texts/469"}, {"cref": "#/texts/470"}, {"cref": "#/texts/471"}, {"cref": "#/texts/472"}, {"cref": "#/texts/473"}, {"cref": "#/texts/474"}], "name": "list", "label": "list"}, {"self_ref": "#/groups/6", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/477"}, {"cref": "#/texts/478"}, {"cref": "#/texts/479"}, {"cref": "#/texts/480"}, {"cref": "#/texts/481"}, {"cref": "#/texts/482"}], "name": "list", "label": "list"}], "texts": [{"self_ref": "#/texts/0", "parent": {"cref": "#/body"}, "children": [], "label": "page_header", "prov": [{"page_no": 1, "bbox": {"l": 18.34021759033203, "t": 582.52001953125, "r": 36.339786529541016, "b": 236.99996948242188, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 37]}], "orig": "arXiv:2305.03393v1 [cs.CV] 5 May 2023", "text": "arXiv:2305.03393v1 [cs.CV] 5 May 2023"}, {"self_ref": "#/texts/1", "parent": {"cref": "#/body"}, "children": [], "label": "section_header", "prov": [{"page_no": 1, "bbox": {"l": 134.76499938964844, "t": 676.1008911132812, "r": 480.59735107421875, "b": 645.4859008789062, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 60]}], "orig": "Optimized Table Tokenization for Table Structure Recognition", "text": "Optimized Table Tokenization for Table Structure Recognition", "level": 1}, {"self_ref": "#/texts/2", "parent": {"cref": "#/groups/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 139.34305, "t": 622.30841, "r": 476.01270000000005, "b": 591.81409, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 222]}], "orig": "Maksym Lysak [0000 \u2212 0002 \u2212 3723 \u2212 $^{6960]}$, Ahmed Nassar[0000 \u2212 0002 \u2212 9468 \u2212 $^{0822]}$, Nikolaos Livathinos [0000 \u2212 0001 \u2212 8513 \u2212 $^{3491]}$, Christoph Auer[0000 \u2212 0001 \u2212 5761 \u2212 $^{0422]}$, [0000 \u2212 0002 \u2212 8088 \u2212 0823]", "text": "Maksym Lysak [0000 \u2212 0002 \u2212 3723 \u2212 $^{6960]}$, Ahmed Nassar[0000 \u2212 0002 \u2212 9468 \u2212 $^{0822]}$, Nikolaos Livathinos [0000 \u2212 0001 \u2212 8513 \u2212 $^{3491]}$, Christoph Auer[0000 \u2212 0001 \u2212 5761 \u2212 $^{0422]}$, [0000 \u2212 0002 \u2212 8088 \u2212 0823]"}, {"self_ref": "#/texts/3", "parent": {"cref": "#/groups/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 229.52109000000002, "t": 596.41626, "r": 298.6087, "b": 587.61926, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 15]}], "orig": "and Peter Staar", "text": "and Peter Staar"}, {"self_ref": "#/texts/4", "parent": {"cref": "#/groups/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 279.1051, "t": 574.79602, "r": 336.25153, "b": 566.72632, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 12]}], "orig": "IBM Research", "text": "IBM Research"}, {"self_ref": "#/texts/5", "parent": {"cref": "#/groups/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 222.96609, "t": 563.19147, "r": 392.38983, "b": 555.72247, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 36]}], "orig": "{mly,ahn,nli,cau,taa}@zurich.ibm.com", "text": "{mly,ahn,nli,cau,taa}@zurich.ibm.com"}, {"self_ref": "#/texts/6", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 163.11109924316406, "t": 521.6988525390625, "r": 452.248779296875, "b": 327.2655334472656, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1198]}], "orig": "Abstract. Extracting tables from documents is a crucial task in any document conversion pipeline. Recently, transformer-based models have demonstrated that table-structure can be recognized with impressive accuracy using Image-to-Markup-Sequence (Im2Seq) approaches. Taking only the image of a table, such models predict a sequence of tokens (e.g. in HTML, LaTeX) which represent the structure of the table. Since the token representation of the table structure has a significant impact on the accuracy and run-time performance of any Im2Seq model, we investigate in this paper how table-structure representation can be optimised. We propose a new, optimised table-structure language (OTSL) with a minimized vocabulary and specific rules. The benefits of OTSL are that it reduces the number of tokens to 5 (HTML needs 28+) and shortens the sequence length to half of HTML on average. Consequently, model accuracy improves significantly, inference time is halved compared to HTML-based models, and the predicted table structures are always syntactically correct. This in turn eliminates most post-processing needs. Popular table structure data-sets will be published in OTSL format to the community.", "text": "Abstract. Extracting tables from documents is a crucial task in any document conversion pipeline. Recently, transformer-based models have demonstrated that table-structure can be recognized with impressive accuracy using Image-to-Markup-Sequence (Im2Seq) approaches. Taking only the image of a table, such models predict a sequence of tokens (e.g. in HTML, LaTeX) which represent the structure of the table. Since the token representation of the table structure has a significant impact on the accuracy and run-time performance of any Im2Seq model, we investigate in this paper how table-structure representation can be optimised. We propose a new, optimised table-structure language (OTSL) with a minimized vocabulary and specific rules. The benefits of OTSL are that it reduces the number of tokens to 5 (HTML needs 28+) and shortens the sequence length to half of HTML on average. Consequently, model accuracy improves significantly, inference time is halved compared to HTML-based models, and the predicted table structures are always syntactically correct. This in turn eliminates most post-processing needs. Popular table structure data-sets will be published in OTSL format to the community."}, {"self_ref": "#/texts/7", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 163.11109924316406, "t": 313.3060607910156, "r": 452.2415771484375, "b": 294.2145080566406, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 90]}], "orig": "Keywords: Table Structure Recognition \u00b7 Data Representation \u00b7 Transformers \u00b7 Optimization.", "text": "Keywords: Table Structure Recognition \u00b7 Data Representation \u00b7 Transformers \u00b7 Optimization."}, {"self_ref": "#/texts/8", "parent": {"cref": "#/body"}, "children": [], "label": "section_header", "prov": [{"page_no": 1, "bbox": {"l": 134.76512145996094, "t": 269.88031005859375, "r": 228.933837890625, "b": 259.3119201660156, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 14]}], "orig": "1 Introduction", "text": "1 Introduction", "level": 1}, {"self_ref": "#/texts/9", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 134.76512145996094, "t": 243.7134552001953, "r": 480.595947265625, "b": 163.18548583984375, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 500]}], "orig": "Tables are ubiquitous in documents such as scientific papers, patents, reports, manuals, specification sheets or marketing material. They often encode highly valuable information and therefore need to be extracted with high accuracy. Unfortunately, tables appear in documents in various sizes, styling and structure, making it difficult to recover their correct structure with simple analytical methods. Therefore, accurate table extraction is achieved these days with machine-learning based methods.", "text": "Tables are ubiquitous in documents such as scientific papers, patents, reports, manuals, specification sheets or marketing material. They often encode highly valuable information and therefore need to be extracted with high accuracy. Unfortunately, tables appear in documents in various sizes, styling and structure, making it difficult to recover their correct structure with simple analytical methods. Therefore, accurate table extraction is achieved these days with machine-learning based methods."}, {"self_ref": "#/texts/10", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 134.76512145996094, "t": 159.85244750976562, "r": 480.5958251953125, "b": 127.14546966552734, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 235]}], "orig": "In modern document understanding systems [1,15], table extraction is typically a two-step process. Firstly, every table on a page is located with a bounding box, and secondly, their logical row and column structure is recognized. As of", "text": "In modern document understanding systems [1,15], table extraction is typically a two-step process. Firstly, every table on a page is located with a bounding box, and secondly, their logical row and column structure is recognized. As of"}, {"self_ref": "#/texts/11", "parent": {"cref": "#/body"}, "children": [], "label": "page_header", "prov": [{"page_no": 2, "bbox": {"l": 134.76499938964844, "t": 698.22900390625, "r": 139.37193298339844, "b": 690.1593017578125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "2", "text": "2"}, {"self_ref": "#/texts/12", "parent": {"cref": "#/body"}, "children": [], "label": "page_header", "prov": [{"page_no": 2, "bbox": {"l": 167.8133544921875, "t": 698.22900390625, "r": 231.72227478027344, "b": 690.1593017578125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 16]}], "orig": "M. Lysak, et al.", "text": "M. Lysak, et al."}, {"self_ref": "#/texts/13", "parent": {"cref": "#/body"}, "children": [], "label": "caption", "prov": [{"page_no": 2, "bbox": {"l": 134.76499938964844, "t": 665.6658325195312, "r": 480.5918884277344, "b": 591.7794189453125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 574]}], "orig": "Fig. 1. Comparison between HTML and OTSL table structure representation: (A) table-example with complex row and column headers, including a 2D empty span, (B) minimal graphical representation of table structure using rectangular layout, (C) HTML representation, (D) OTSL representation. This example demonstrates many of the key-features of OTSL, namely its reduced vocabulary size (12 versus 5 in this case), its reduced sequence length (55 versus 30) and a enhanced internal structure (variable token sequence length per row in HTML versus a fixed length of rows in OTSL).", "text": "Fig. 1. Comparison between HTML and OTSL table structure representation: (A) table-example with complex row and column headers, including a 2D empty span, (B) minimal graphical representation of table structure using rectangular layout, (C) HTML representation, (D) OTSL representation. This example demonstrates many of the key-features of OTSL, namely its reduced vocabulary size (12 versus 5 in this case), its reduced sequence length (55 versus 30) and a enhanced internal structure (variable token sequence length per row in HTML versus a fixed length of rows in OTSL)."}, {"self_ref": "#/texts/14", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 396.41107, "t": 511.01648, "r": 402.97336, "b": 502.49097, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/15", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 418.58682, "t": 511.10208, "r": 425.14911, "b": 502.57657, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/16", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 395.74835, "t": 488.76273, "r": 402.31064, "b": 480.23721, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/17", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 407.54214, "t": 488.63019, "r": 414.10443, "b": 480.10468, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/18", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 407.56335, "t": 477.59381, "r": 414.12564, "b": 469.0683, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/19", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 418.51108, "t": 499.91497999999996, "r": 425.07336, "b": 491.38946999999996, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/20", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 429.59744, "t": 499.90894, "r": 436.1597300000001, "b": 491.38342, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/21", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 440.68759000000006, "t": 499.98769999999996, "r": 447.24987999999996, "b": 491.46218999999996, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/22", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 418.6232, "t": 488.70517, "r": 425.18549, "b": 480.17966, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/23", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 429.7095299999999, "t": 488.69989, "r": 436.27182, "b": 480.17438, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/24", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 440.7996800000001, "t": 488.77789, "r": 447.36197, "b": 480.25238, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/25", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 418.62546, "t": 477.43097, "r": 425.18774, "b": 468.90546, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/26", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 429.71181999999993, "t": 477.42566, "r": 436.27411, "b": 468.90015, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/27", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 440.80194, "t": 477.50369, "r": 447.36423, "b": 468.97818, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/28", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 407.39746, "t": 466.70969, "r": 413.95975, "b": 458.18417, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/29", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 418.45959, "t": 466.54684, "r": 425.02188, "b": 458.02133, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/30", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 429.54593, "t": 466.5408, "r": 436.10822, "b": 458.01529, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/31", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 440.63608, "t": 466.61957, "r": 447.19836, "b": 458.09406, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/32", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 451.89511000000005, "t": 511.84283, "r": 463.51273000000003, "b": 503.31732, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "NL", "text": "NL"}, {"self_ref": "#/texts/33", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 452.1557, "t": 500.40124999999995, "r": 463.77332, "b": 491.87573, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "NL", "text": "NL"}, {"self_ref": "#/texts/34", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 452.17688000000004, "t": 489.15735, "r": 463.79449000000005, "b": 480.63184, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "NL", "text": "NL"}, {"self_ref": "#/texts/35", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 452.09887999999995, "t": 477.87558000000007, "r": 463.71648999999996, "b": 469.3500700000001, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "NL", "text": "NL"}, {"self_ref": "#/texts/36", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 452.29733, "t": 466.53094, "r": 463.91495, "b": 458.00543, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "NL", "text": "NL"}, {"self_ref": "#/texts/37", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 396.09677, "t": 477.50522, "r": 402.65906, "b": 468.97970999999995, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "U", "text": "U"}, {"self_ref": "#/texts/38", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 395.99829, "t": 466.61123999999995, "r": 402.56058, "b": 458.08572, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "U", "text": "U"}, {"self_ref": "#/texts/39", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 396.27475, "t": 499.72943, "r": 402.83704, "b": 491.20392, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "U", "text": "U"}, {"self_ref": "#/texts/40", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 408.54724, "t": 511.03088, "r": 413.60074, "b": 502.50537, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "L", "text": "L"}, {"self_ref": "#/texts/41", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 430.58966, "t": 511.50275, "r": 435.6431600000001, "b": 502.97723, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "L", "text": "L"}, {"self_ref": "#/texts/42", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 441.08069, "t": 511.61938, "r": 446.13419, "b": 503.09387, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "L", "text": "L"}, {"self_ref": "#/texts/43", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 407.97388, "t": 499.86575, "r": 414.03625, "b": 491.34024, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "X", "text": "X"}, {"self_ref": "#/texts/44", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 441.25640999999996, "t": 380.8192399999999, "r": 452.87402, "b": 372.2937299999999, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "NL", "text": "NL"}, {"self_ref": "#/texts/45", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 393.75256, "t": 392.2052299999999, "r": 432.48929, "b": 385.10065, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 11]}], "orig": "vocabulary:", "text": "vocabulary:"}, {"self_ref": "#/texts/46", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 434.5896000000001, "t": 392.2052299999999, "r": 438.80083999999994, "b": 385.10065, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "5", "text": "5"}, {"self_ref": "#/texts/47", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 440.90573, "t": 392.2052299999999, "r": 463.22235, "b": 385.10065, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 6]}], "orig": "tokens", "text": "tokens"}, {"self_ref": "#/texts/48", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 384.11816, "t": 533.45282, "r": 413.99307, "b": 526.34821, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 6]}], "orig": "D OTSL", "text": "D OTSL"}, {"self_ref": "#/texts/49", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 393.75256, "t": 525.32495, "r": 451.45129000000003, "b": 518.22034, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 16]}], "orig": "sequence length:", "text": "sequence length:"}, {"self_ref": "#/texts/50", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 453.55083999999994, "t": 525.32495, "r": 461.97485, "b": 518.22034, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "30", "text": "30"}, {"self_ref": "#/texts/51", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 151.79318, "t": 392.23984, "r": 233.89371000000003, "b": 385.13525000000004, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 26]}], "orig": "vocabulary for this table:", "text": "vocabulary for this table:"}, {"self_ref": "#/texts/52", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 235.99332, "t": 392.23984, "r": 244.41734000000002, "b": 385.13525000000004, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "12", "text": "12"}, {"self_ref": "#/texts/53", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 246.52222, "t": 392.23984, "r": 268.83884, "b": 385.13525000000004, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 6]}], "orig": "tokens", "text": "tokens"}, {"self_ref": "#/texts/54", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 154.3298, "t": 578.42542, "r": 159.79837, "b": 571.3208, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "A", "text": "A"}, {"self_ref": "#/texts/55", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 321.07053, "t": 578.42542, "r": 326.53909, "b": 571.3208, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "B", "text": "B"}, {"self_ref": "#/texts/56", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 153.0947, "t": 511.69589, "r": 175.83888, "b": 505.30176, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 7]}], "orig": "<table>", "text": "<table>"}, {"self_ref": "#/texts/57", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 160.67039, "t": 504.87912, "r": 172.79608, "b": 498.48499, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "<tr>", "text": "<tr>"}, {"self_ref": "#/texts/58", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 168.24603, "t": 498.06235, "r": 177.91019, "b": 491.66821, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 3]}], "orig": "<td", "text": "<td"}, {"self_ref": "#/texts/59", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 179.80525, "t": 498.06235, "r": 215.61517, "b": 491.66821, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 11]}], "orig": "colspan=\u201c2\u201d", "text": "colspan=\u201c2\u201d"}, {"self_ref": "#/texts/60", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 217.50886999999997, "t": 498.06235, "r": 255.58945, "b": 491.66821, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 11]}], "orig": "rowspan=\u201c2\u201d", "text": "rowspan=\u201c2\u201d"}, {"self_ref": "#/texts/61", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 257.48315, "t": 498.06235, "r": 261.46414, "b": 491.66821, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": ">", "text": ">"}, {"self_ref": "#/texts/62", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 263.35785, "t": 498.06235, "r": 278.89804, "b": 491.66821, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 5]}], "orig": "</td>", "text": "</td>"}, {"self_ref": "#/texts/63", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 280.79175, "t": 498.06235, "r": 290.4559, "b": 491.66821, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 3]}], "orig": "<td", "text": "<td"}, {"self_ref": "#/texts/64", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 292.35095, "t": 498.06235, "r": 328.16083, "b": 491.66821, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 11]}], "orig": "colspan=\u201c3\u201d", "text": "colspan=\u201c3\u201d"}, {"self_ref": "#/texts/65", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 330.05457, "t": 498.06235, "r": 334.03555, "b": 491.66821, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": ">", "text": ">"}, {"self_ref": "#/texts/66", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 335.92926, "t": 498.06235, "r": 351.46945, "b": 491.66821, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 5]}], "orig": "</td>", "text": "</td>"}, {"self_ref": "#/texts/67", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 160.67039, "t": 491.24557000000004, "r": 174.68979, "b": 484.85144, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 5]}], "orig": "</tr>", "text": "</tr>"}, {"self_ref": "#/texts/68", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 160.67039, "t": 484.42877000000004, "r": 172.79608, "b": 478.03464, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "<tr>", "text": "<tr>"}, {"self_ref": "#/texts/69", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 168.24603, "t": 477.612, "r": 181.89255, "b": 471.21786, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "<td>", "text": "<td>"}, {"self_ref": "#/texts/70", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 183.78624, "t": 477.612, "r": 199.32646, "b": 471.21786, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 5]}], "orig": "</td>", "text": "</td>"}, {"self_ref": "#/texts/71", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 201.22015, "t": 477.612, "r": 214.86666999999997, "b": 471.21786, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "<td>", "text": "<td>"}, {"self_ref": "#/texts/72", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 216.76038, "t": 477.612, "r": 232.30058, "b": 471.21786, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 5]}], "orig": "</td>", "text": "</td>"}, {"self_ref": "#/texts/73", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 234.19427000000002, "t": 477.612, "r": 247.84079000000003, "b": 471.21786, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "<td>", "text": "<td>"}, {"self_ref": "#/texts/74", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 249.73447999999996, "t": 477.612, "r": 265.27469, "b": 471.21786, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 5]}], "orig": "</td>", "text": "</td>"}, {"self_ref": "#/texts/75", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 160.67039, "t": 470.79523, "r": 174.68979, "b": 464.40109000000007, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 5]}], "orig": "</tr>", "text": "</tr>"}, {"self_ref": "#/texts/76", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 160.67039, "t": 463.97842, "r": 172.79608, "b": 457.58428999999995, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "<tr>", "text": "<tr>"}, {"self_ref": "#/texts/77", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 168.24603, "t": 457.16165, "r": 373.09091, "b": 450.76752, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 67]}], "orig": "<td rowspan=\u201c3\u201d > </td> <td> </td> <td> </td> <td> </td> <td> </td>", "text": "<td rowspan=\u201c3\u201d > </td> <td> </td> <td> </td> <td> </td> <td> </td>"}, {"self_ref": "#/texts/78", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 160.67039, "t": 450.34488, "r": 174.68979, "b": 443.95074, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 5]}], "orig": "</tr>", "text": "</tr>"}, {"self_ref": "#/texts/79", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 160.67039, "t": 443.52841, "r": 172.79608, "b": 437.13428, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "<tr>", "text": "<tr>"}, {"self_ref": "#/texts/80", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 168.24603, "t": 436.71163999999993, "r": 181.89255, "b": 430.31750000000005, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "<td>", "text": "<td>"}, {"self_ref": "#/texts/81", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 183.78624, "t": 436.71163999999993, "r": 199.32646, "b": 430.31750000000005, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 5]}], "orig": "</td>", "text": "</td>"}, {"self_ref": "#/texts/82", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 201.22015, "t": 436.71163999999993, "r": 214.86666999999997, "b": 430.31750000000005, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "<td>", "text": "<td>"}, {"self_ref": "#/texts/83", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 216.76038, "t": 436.71163999999993, "r": 232.30058, "b": 430.31750000000005, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 5]}], "orig": "</td>", "text": "</td>"}, {"self_ref": "#/texts/84", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 234.19427000000002, "t": 436.71163999999993, "r": 247.84079000000003, "b": 430.31750000000005, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "<td>", "text": "<td>"}, {"self_ref": "#/texts/85", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 249.73447999999996, "t": 436.71163999999993, "r": 265.27469, "b": 430.31750000000005, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 5]}], "orig": "</td>", "text": "</td>"}, {"self_ref": "#/texts/86", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 267.1684, "t": 436.71163999999993, "r": 280.81488, "b": 430.31750000000005, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "<td>", "text": "<td>"}, {"self_ref": "#/texts/87", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 282.70862, "t": 436.71163999999993, "r": 298.24881, "b": 430.31750000000005, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 5]}], "orig": "</td>", "text": "</td>"}, {"self_ref": "#/texts/88", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 160.67039, "t": 429.89483999999993, "r": 174.68979, "b": 423.50070000000005, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 5]}], "orig": "</tr>", "text": "</tr>"}, {"self_ref": "#/texts/89", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 160.67039, "t": 423.07806, "r": 172.79608, "b": 416.68393, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "<tr>", "text": "<tr>"}, {"self_ref": "#/texts/90", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 168.24603, "t": 416.26129, "r": 181.89255, "b": 409.86716, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "<td>", "text": "<td>"}, {"self_ref": "#/texts/91", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 183.78624, "t": 416.26129, "r": 199.32646, "b": 409.86716, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 5]}], "orig": "</td>", "text": "</td>"}, {"self_ref": "#/texts/92", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 201.22015, "t": 416.26129, "r": 214.86666999999997, "b": 409.86716, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "<td>", "text": "<td>"}, {"self_ref": "#/texts/93", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 216.76038, "t": 416.26129, "r": 232.30058, "b": 409.86716, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 5]}], "orig": "</td>", "text": "</td>"}, {"self_ref": "#/texts/94", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 234.19427000000002, "t": 416.26129, "r": 247.84079000000003, "b": 409.86716, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "<td>", "text": "<td>"}, {"self_ref": "#/texts/95", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 249.73447999999996, "t": 416.26129, "r": 265.27469, "b": 409.86716, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 5]}], "orig": "</td>", "text": "</td>"}, {"self_ref": "#/texts/96", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 267.1684, "t": 416.26129, "r": 280.81488, "b": 409.86716, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "<td>", "text": "<td>"}, {"self_ref": "#/texts/97", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 282.70862, "t": 416.26129, "r": 298.24881, "b": 409.86716, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 5]}], "orig": "</td>", "text": "</td>"}, {"self_ref": "#/texts/98", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 160.67039, "t": 409.44449, "r": 174.68979, "b": 403.05035, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 5]}], "orig": "</tr>", "text": "</tr>"}, {"self_ref": "#/texts/99", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 153.0947, "t": 402.62772, "r": 177.73259, "b": 396.23358, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 8]}], "orig": "</table>", "text": "</table>"}, {"self_ref": "#/texts/100", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 395.06137, "t": 380.66647, "r": 401.62366, "b": 372.14096, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/101", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 407.42249, "t": 380.66647, "r": 412.47598, "b": 372.14096, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "L", "text": "L"}, {"self_ref": "#/texts/102", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 418.69287, "t": 380.66647, "r": 425.25516, "b": 372.14096, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "U", "text": "U"}, {"self_ref": "#/texts/103", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 430.5086099999999, "t": 380.66647, "r": 436.5709800000001, "b": 372.14096, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "X", "text": "X"}, {"self_ref": "#/texts/104", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 152.36208, "t": 382.22638, "r": 175.10626, "b": 375.83224, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 7]}], "orig": "<table>", "text": "<table>"}, {"self_ref": "#/texts/105", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 178.89366, "t": 382.22638, "r": 191.01935, "b": 375.83224, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "<tr>", "text": "<tr>"}, {"self_ref": "#/texts/106", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 194.80676, "t": 382.22638, "r": 208.82614, "b": 375.83224, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 5]}], "orig": "</tr>", "text": "</tr>"}, {"self_ref": "#/texts/107", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 212.61354, "t": 382.22638, "r": 226.26003999999998, "b": 375.83224, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "<td>", "text": "<td>"}, {"self_ref": "#/texts/108", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 230.04745000000003, "t": 382.22638, "r": 245.58765000000002, "b": 375.83224, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 5]}], "orig": "</td>", "text": "</td>"}, {"self_ref": "#/texts/109", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 249.37506000000002, "t": 382.22638, "r": 259.03918, "b": 375.83224, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 3]}], "orig": "<td", "text": "<td"}, {"self_ref": "#/texts/110", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 262.82797, "t": 382.22638, "r": 298.93646, "b": 375.83224, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 11]}], "orig": "colspan=\"2\"", "text": "colspan=\"2\""}, {"self_ref": "#/texts/111", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 302.72385, "t": 382.22638, "r": 338.83234, "b": 375.83224, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 11]}], "orig": "colspan=\"3\"", "text": "colspan=\"3\""}, {"self_ref": "#/texts/112", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 152.36208, "t": 373.89478, "r": 190.74123, "b": 367.50064, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 11]}], "orig": "rowspan=\"2\"", "text": "rowspan=\"2\""}, {"self_ref": "#/texts/113", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 194.52863, "t": 373.89478, "r": 232.90777999999997, "b": 367.50064, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 11]}], "orig": "rowspan=\"3\"", "text": "rowspan=\"3\""}, {"self_ref": "#/texts/114", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 236.69518999999997, "t": 373.89478, "r": 240.67617999999996, "b": 367.50064, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": ">", "text": ">"}, {"self_ref": "#/texts/115", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 244.46358, "t": 373.89478, "r": 269.10144, "b": 367.50064, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 8]}], "orig": "</table>", "text": "</table>"}, {"self_ref": "#/texts/116", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 154.50595, "t": 533.39905, "r": 159.62473, "b": 526.29443, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/117", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 164.74348, "t": 533.39905, "r": 185.21857, "b": 526.29443, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "HTML", "text": "HTML"}, {"self_ref": "#/texts/118", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 164.3548, "t": 525.50293, "r": 222.05352999999997, "b": 518.39832, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 16]}], "orig": "sequence length:", "text": "sequence length:"}, {"self_ref": "#/texts/119", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 224.15326, "t": 525.50293, "r": 232.57729, "b": 518.39832, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "55", "text": "55"}, {"self_ref": "#/texts/120", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 134.76499938964844, "t": 339.68621826171875, "r": 480.5923156738281, "b": 271.1133117675781, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 435]}], "orig": "today, table detection in documents is a well understood problem, and the latest state-of-the-art (SOTA) object detection methods provide an accuracy comparable to human observers [7,8,10,14,23]. On the other hand, the problem of table structure recognition (TSR) is a lot more challenging and remains a very active area of research, in which many novel machine learning algorithms are being explored [3,4,5,9,11,12,13,14,17,18,21,22].", "text": "today, table detection in documents is a well understood problem, and the latest state-of-the-art (SOTA) object detection methods provide an accuracy comparable to human observers [7,8,10,14,23]. On the other hand, the problem of table structure recognition (TSR) is a lot more challenging and remains a very active area of research, in which many novel machine learning algorithms are being explored [3,4,5,9,11,12,13,14,17,18,21,22]."}, {"self_ref": "#/texts/121", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 134.7650146484375, "t": 267.44927978515625, "r": 480.5948181152344, "b": 127.14530181884766, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 911]}], "orig": "Recently emerging SOTA methods for table structure recognition employ transformer-based models, in which an image of the table is provided to the network in order to predict the structure of the table as a sequence of tokens. These image-to-sequence (Im2Seq) models are extremely powerful, since they allow for a purely data-driven solution. The tokens of the sequence typically belong to a markup language such as HTML, Latex or Markdown, which allow to describe table structure as rows, columns and spanning cells in various configurations. In Figure 1, we illustrate how HTML is used to represent the table-structure of a particular example table. Public table-structure data sets such as PubTabNet [22], and FinTabNet [21], which were created in a semi-automated way from paired PDF and HTML sources (e.g. PubMed Central), popularized primarily the use of HTML as ground-truth representation format for TSR.", "text": "Recently emerging SOTA methods for table structure recognition employ transformer-based models, in which an image of the table is provided to the network in order to predict the structure of the table as a sequence of tokens. These image-to-sequence (Im2Seq) models are extremely powerful, since they allow for a purely data-driven solution. The tokens of the sequence typically belong to a markup language such as HTML, Latex or Markdown, which allow to describe table structure as rows, columns and spanning cells in various configurations. In Figure 1, we illustrate how HTML is used to represent the table-structure of a particular example table. Public table-structure data sets such as PubTabNet [22], and FinTabNet [21], which were created in a semi-automated way from paired PDF and HTML sources (e.g. PubMed Central), popularized primarily the use of HTML as ground-truth representation format for TSR."}, {"self_ref": "#/texts/122", "parent": {"cref": "#/body"}, "children": [], "label": "page_header", "prov": [{"page_no": 3, "bbox": {"l": 194.47799682617188, "t": 698.22900390625, "r": 447.54290771484375, "b": 690.1593017578125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 60]}], "orig": "Optimized Table Tokenization for Table Structure Recognition", "text": "Optimized Table Tokenization for Table Structure Recognition"}, {"self_ref": "#/texts/123", "parent": {"cref": "#/body"}, "children": [], "label": "page_header", "prov": [{"page_no": 3, "bbox": {"l": 475.98431396484375, "t": 698.22900390625, "r": 480.59124755859375, "b": 690.1593017578125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "3", "text": "3"}, {"self_ref": "#/texts/124", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 134.76498413085938, "t": 673.0662231445312, "r": 480.5918273925781, "b": 580.5831298828125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 584]}], "orig": "While the majority of research in TSR is currently focused on the development and application of novel neural model architectures, the table structure representation language (e.g. HTML in PubTabNet and FinTabNet) is usually adopted as is for the sequence tokenization in Im2Seq models. In this paper, we aim for the opposite and investigate the impact of the table structure representation language with an otherwise unmodified Im2Seq transformer-based architecture. Since the current state-of-the-art Im2Seq model is TableFormer [9], we select this model to perform our experiments.", "text": "While the majority of research in TSR is currently focused on the development and application of novel neural model architectures, the table structure representation language (e.g. HTML in PubTabNet and FinTabNet) is usually adopted as is for the sequence tokenization in Im2Seq models. In this paper, we aim for the opposite and investigate the impact of the table structure representation language with an otherwise unmodified Im2Seq transformer-based architecture. Since the current state-of-the-art Im2Seq model is TableFormer [9], we select this model to perform our experiments."}, {"self_ref": "#/texts/125", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 134.76498413085938, "t": 577.1641235351562, "r": 480.5957336425781, "b": 460.7701416015625, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 721]}], "orig": "The main contribution of this paper is the introduction of a new optimised table structure language (OTSL), specifically designed to describe table-structure in an compact and structured way for Im2Seq models. OTSL has a number of key features, which make it very attractive to use in Im2Seq models. Specifically, compared to other languages such as HTML, OTSL has a minimized vocabulary which yields short sequence length, strong inherent structure (e.g. strict rectangular layout) and a strict syntax with rules that only look backwards. The latter allows for syntax validation during inference and ensures a syntactically correct table-structure. These OTSL features are illustrated in Figure 1, in comparison to HTML.", "text": "The main contribution of this paper is the introduction of a new optimised table structure language (OTSL), specifically designed to describe table-structure in an compact and structured way for Im2Seq models. OTSL has a number of key features, which make it very attractive to use in Im2Seq models. Specifically, compared to other languages such as HTML, OTSL has a minimized vocabulary which yields short sequence length, strong inherent structure (e.g. strict rectangular layout) and a strict syntax with rules that only look backwards. The latter allows for syntax validation during inference and ensures a syntactically correct table-structure. These OTSL features are illustrated in Figure 1, in comparison to HTML."}, {"self_ref": "#/texts/126", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 134.76498413085938, "t": 457.35211181640625, "r": 480.5956726074219, "b": 352.9132385253906, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 626]}], "orig": "The paper is structured as follows. In section 2, we give an overview of the latest developments in table-structure reconstruction. In section 3 we review the current HTML table encoding (popularised by PubTabNet and FinTabNet) and discuss its flaws. Subsequently, we introduce OTSL in section 4, which includes the language definition, syntax rules and error-correction procedures. In section 5, we apply OTSL on the TableFormer architecture, compare it to TableFormer models trained on HTML and ultimately demonstrate the advantages of using OTSL. Finally, in section 6 we conclude our work and outline next potential steps.", "text": "The paper is structured as follows. In section 2, we give an overview of the latest developments in table-structure reconstruction. In section 3 we review the current HTML table encoding (popularised by PubTabNet and FinTabNet) and discuss its flaws. Subsequently, we introduce OTSL in section 4, which includes the language definition, syntax rules and error-correction procedures. In section 5, we apply OTSL on the TableFormer architecture, compare it to TableFormer models trained on HTML and ultimately demonstrate the advantages of using OTSL. Finally, in section 6 we conclude our work and outline next potential steps."}, {"self_ref": "#/texts/127", "parent": {"cref": "#/body"}, "children": [], "label": "section_header", "prov": [{"page_no": 3, "bbox": {"l": 134.76498413085938, "t": 329.91204833984375, "r": 236.76913452148438, "b": 319.3436584472656, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 14]}], "orig": "2 Related Work", "text": "2 Related Work", "level": 1}, {"self_ref": "#/texts/128", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 134.76498413085938, "t": 303.3141784667969, "r": 484.1204833984375, "b": 127.14423370361328, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1161]}], "orig": "Approaches to formalize the logical structure and layout of tables in electronic documents date back more than two decades [16]. In the recent past, a wide variety of computer vision methods have been explored to tackle the problem of table structure recognition, i.e. the correct identification of columns, rows and spanning cells in a given table. Broadly speaking, the current deeplearning based approaches fall into three categories: object detection (OD) methods, Graph-Neural-Network (GNN) methods and Image-to-Markup-Sequence (Im2Seq) methods. Object-detection based methods [11,12,13,14,21] rely on tablestructure annotation using (overlapping) bounding boxes for training, and produce bounding-box predictions to define table cells, rows, and columns on a table image. Graph Neural Network (GNN) based methods [3,6,17,18], as the name suggests, represent tables as graph structures. The graph nodes represent the content of each table cell, an embedding vector from the table image, or geometric coordinates of the table cell. The edges of the graph define the relationship between the nodes, e.g. if they belong to the same column, row, or table cell.", "text": "Approaches to formalize the logical structure and layout of tables in electronic documents date back more than two decades [16]. In the recent past, a wide variety of computer vision methods have been explored to tackle the problem of table structure recognition, i.e. the correct identification of columns, rows and spanning cells in a given table. Broadly speaking, the current deeplearning based approaches fall into three categories: object detection (OD) methods, Graph-Neural-Network (GNN) methods and Image-to-Markup-Sequence (Im2Seq) methods. Object-detection based methods [11,12,13,14,21] rely on tablestructure annotation using (overlapping) bounding boxes for training, and produce bounding-box predictions to define table cells, rows, and columns on a table image. Graph Neural Network (GNN) based methods [3,6,17,18], as the name suggests, represent tables as graph structures. The graph nodes represent the content of each table cell, an embedding vector from the table image, or geometric coordinates of the table cell. The edges of the graph define the relationship between the nodes, e.g. if they belong to the same column, row, or table cell."}, {"self_ref": "#/texts/129", "parent": {"cref": "#/body"}, "children": [], "label": "page_header", "prov": [{"page_no": 4, "bbox": {"l": 134.76499938964844, "t": 698.22900390625, "r": 139.37193298339844, "b": 690.1593017578125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "4", "text": "4"}, {"self_ref": "#/texts/130", "parent": {"cref": "#/body"}, "children": [], "label": "page_header", "prov": [{"page_no": 4, "bbox": {"l": 167.8133544921875, "t": 698.22900390625, "r": 231.72227478027344, "b": 690.1593017578125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 16]}], "orig": "M. Lysak, et al.", "text": "M. Lysak, et al."}, {"self_ref": "#/texts/131", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 4, "bbox": {"l": 134.76499938964844, "t": 673.0662231445312, "r": 480.59576416015625, "b": 532.7620849609375, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 939]}], "orig": "Other work [20] aims at predicting a grid for each table and deciding which cells must be merged using an attention network. Im2Seq methods cast the problem as a sequence generation task [4,5,9,22], and therefore need an internal tablestructure representation language, which is often implemented with standard markup languages (e.g. HTML, LaTeX, Markdown). In theory, Im2Seq methods have a natural advantage over the OD and GNN methods by virtue of directly predicting the table-structure. As such, no post-processing or rules are needed in order to obtain the table-structure, which is necessary with OD and GNN approaches. In practice, this is not entirely true, because a predicted sequence of table-structure markup does not necessarily have to be syntactically correct. Hence, depending on the quality of the predicted sequence, some post-processing needs to be performed to ensure a syntactically valid (let alone correct) sequence.", "text": "Other work [20] aims at predicting a grid for each table and deciding which cells must be merged using an attention network. Im2Seq methods cast the problem as a sequence generation task [4,5,9,22], and therefore need an internal tablestructure representation language, which is often implemented with standard markup languages (e.g. HTML, LaTeX, Markdown). In theory, Im2Seq methods have a natural advantage over the OD and GNN methods by virtue of directly predicting the table-structure. As such, no post-processing or rules are needed in order to obtain the table-structure, which is necessary with OD and GNN approaches. In practice, this is not entirely true, because a predicted sequence of table-structure markup does not necessarily have to be syntactically correct. Hence, depending on the quality of the predicted sequence, some post-processing needs to be performed to ensure a syntactically valid (let alone correct) sequence."}, {"self_ref": "#/texts/132", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 4, "bbox": {"l": 134.76498413085938, "t": 529.3430786132812, "r": 480.595703125, "b": 305.3533020019531, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1404]}], "orig": "Within the Im2Seq method, we find several popular models, namely the encoder-dual-decoder model (EDD) [22], TableFormer [9], Tabsplitter[2] and Ye et. al. [19]. EDD uses two consecutive long short-term memory (LSTM) decoders to predict a table in HTML representation. The tag decoder predicts a sequence of HTML tags. For each decoded table cell ( <td> ), the attention is passed to the cell decoder to predict the content with an embedded OCR approach. The latter makes it susceptible to transcription errors in the cell content of the table. TableFormer address this reliance on OCR and uses two transformer decoders for HTML structure and cell bounding box prediction in an end-to-end architecture. The predicted cell bounding box is then used to extract text tokens from an originating (digital) PDF page, circumventing any need for OCR. TabSplitter [2] proposes a compact double-matrix representation of table rows and columns to do error detection and error correction of HTML structure sequences based on predictions from [19]. This compact double-matrix representation can not be used directly by the Img2seq model training, so the model uses HTML as an intermediate form. Chi et. al. [4] introduce a data set and a baseline method using bidirectional LSTMs to predict LaTeX code. Kayal [5] introduces Gated ResNet transformers to predict LaTeX code, and a separate OCR module to extract content.", "text": "Within the Im2Seq method, we find several popular models, namely the encoder-dual-decoder model (EDD) [22], TableFormer [9], Tabsplitter[2] and Ye et. al. [19]. EDD uses two consecutive long short-term memory (LSTM) decoders to predict a table in HTML representation. The tag decoder predicts a sequence of HTML tags. For each decoded table cell ( <td> ), the attention is passed to the cell decoder to predict the content with an embedded OCR approach. The latter makes it susceptible to transcription errors in the cell content of the table. TableFormer address this reliance on OCR and uses two transformer decoders for HTML structure and cell bounding box prediction in an end-to-end architecture. The predicted cell bounding box is then used to extract text tokens from an originating (digital) PDF page, circumventing any need for OCR. TabSplitter [2] proposes a compact double-matrix representation of table rows and columns to do error detection and error correction of HTML structure sequences based on predictions from [19]. This compact double-matrix representation can not be used directly by the Img2seq model training, so the model uses HTML as an intermediate form. Chi et. al. [4] introduce a data set and a baseline method using bidirectional LSTMs to predict LaTeX code. Kayal [5] introduces Gated ResNet transformers to predict LaTeX code, and a separate OCR module to extract content."}, {"self_ref": "#/texts/133", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 4, "bbox": {"l": 134.76498413085938, "t": 301.93426513671875, "r": 480.5937805175781, "b": 209.4513397216797, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 572]}], "orig": "Im2Seq approaches have shown to be well-suited for the TSR task and allow a full end-to-end network design that can output the final table structure without pre- or post-processing logic. Furthermore, Im2Seq models have demonstrated to deliver state-of-the-art prediction accuracy [9]. This motivated the authors to investigate if the performance (both in accuracy and inference time) can be further improved by optimising the table structure representation language. We believe this is a necessary step before further improving neural network architectures for this task.", "text": "Im2Seq approaches have shown to be well-suited for the TSR task and allow a full end-to-end network design that can output the final table structure without pre- or post-processing logic. Furthermore, Im2Seq models have demonstrated to deliver state-of-the-art prediction accuracy [9]. This motivated the authors to investigate if the performance (both in accuracy and inference time) can be further improved by optimising the table structure representation language. We believe this is a necessary step before further improving neural network architectures for this task."}, {"self_ref": "#/texts/134", "parent": {"cref": "#/body"}, "children": [], "label": "section_header", "prov": [{"page_no": 4, "bbox": {"l": 134.76498413085938, "t": 186.45016479492188, "r": 269.6244201660156, "b": 175.88177490234375, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 19]}], "orig": "3 Problem Statement", "text": "3 Problem Statement", "level": 1}, {"self_ref": "#/texts/135", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 4, "bbox": {"l": 134.76498413085938, "t": 159.85231018066406, "r": 480.59368896484375, "b": 127.14434051513672, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 233]}], "orig": "All known Im2Seq based models for TSR fundamentally work in similar ways. Given an image of a table, the Im2Seq model predicts the structure of the table by generating a sequence of tokens. These tokens originate from a finite vocab-", "text": "All known Im2Seq based models for TSR fundamentally work in similar ways. Given an image of a table, the Im2Seq model predicts the structure of the table by generating a sequence of tokens. These tokens originate from a finite vocab-"}, {"self_ref": "#/texts/136", "parent": {"cref": "#/body"}, "children": [], "label": "page_header", "prov": [{"page_no": 5, "bbox": {"l": 194.47799682617188, "t": 698.22900390625, "r": 447.54290771484375, "b": 690.1593017578125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 60]}], "orig": "Optimized Table Tokenization for Table Structure Recognition", "text": "Optimized Table Tokenization for Table Structure Recognition"}, {"self_ref": "#/texts/137", "parent": {"cref": "#/body"}, "children": [], "label": "page_header", "prov": [{"page_no": 5, "bbox": {"l": 475.98431396484375, "t": 698.22900390625, "r": 480.59124755859375, "b": 690.1593017578125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "5", "text": "5"}, {"self_ref": "#/texts/138", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 134.76499938964844, "t": 673.0662231445312, "r": 480.5937805175781, "b": 604.4931640625, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 422]}], "orig": "ulary and can be interpreted as a table structure. For example, with the HTML tokens <table> , </table> , <tr> , </tr> , <td> and </td> , one can construct simple table structures without any spanning cells. In reality though, one needs at least 28 HTML tokens to describe the most common complex tables observed in real-world documents [21,22], due to a variety of spanning cells definitions in the HTML token vocabulary.", "text": "ulary and can be interpreted as a table structure. For example, with the HTML tokens <table> , </table> , <tr> , </tr> , <td> and </td> , one can construct simple table structures without any spanning cells. In reality though, one needs at least 28 HTML tokens to describe the most common complex tables observed in real-world documents [21,22], due to a variety of spanning cells definitions in the HTML token vocabulary."}, {"self_ref": "#/texts/139", "parent": {"cref": "#/body"}, "children": [], "label": "caption", "prov": [{"page_no": 5, "bbox": {"l": 145.6070098876953, "t": 570.9207153320312, "r": 469.7522277832031, "b": 562.7882080078125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 73]}], "orig": "Fig. 2. Frequency of tokens in HTML and OTSL as they appear in PubTabNet.", "text": "Fig. 2. Frequency of tokens in HTML and OTSL as they appear in PubTabNet."}, {"self_ref": "#/texts/140", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 134.76499938964844, "t": 423.793212890625, "r": 480.5947570800781, "b": 259.57940673828125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1021]}], "orig": "Obviously, HTML and other general-purpose markup languages were not designed for Im2Seq models. As such, they have some serious drawbacks. First, the token vocabulary needs to be artificially large in order to describe all plausible tabular structures. Since most Im2Seq models use an autoregressive approach, they generate the sequence token by token. Therefore, to reduce inference time, a shorter sequence length is critical. Every table-cell is represented by at least two tokens ( <td> and </td> ). Furthermore, when tokenizing the HTML structure, one needs to explicitly enumerate possible column-spans and row-spans as words. In practice, this ends up requiring 28 different HTML tokens (when including column- and row-spans up to 10 cells) just to describe every table in the PubTabNet dataset. Clearly, not every token is equally represented, as is depicted in Figure 2. This skewed distribution of tokens in combination with variable token row-length makes it challenging for models to learn the HTML structure.", "text": "Obviously, HTML and other general-purpose markup languages were not designed for Im2Seq models. As such, they have some serious drawbacks. First, the token vocabulary needs to be artificially large in order to describe all plausible tabular structures. Since most Im2Seq models use an autoregressive approach, they generate the sequence token by token. Therefore, to reduce inference time, a shorter sequence length is critical. Every table-cell is represented by at least two tokens ( <td> and </td> ). Furthermore, when tokenizing the HTML structure, one needs to explicitly enumerate possible column-spans and row-spans as words. In practice, this ends up requiring 28 different HTML tokens (when including column- and row-spans up to 10 cells) just to describe every table in the PubTabNet dataset. Clearly, not every token is equally represented, as is depicted in Figure 2. This skewed distribution of tokens in combination with variable token row-length makes it challenging for models to learn the HTML structure."}, {"self_ref": "#/texts/141", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 134.7650146484375, "t": 255.95736694335938, "r": 480.5928955078125, "b": 211.29440307617188, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 313]}], "orig": "Additionally, it would be desirable if the representation would easily allow an early detection of invalid sequences on-the-go, before the prediction of the entire table structure is completed. HTML is not well-suited for this purpose as the verification of incomplete sequences is non-trivial or even impossible.", "text": "Additionally, it would be desirable if the representation would easily allow an early detection of invalid sequences on-the-go, before the prediction of the entire table structure is completed. HTML is not well-suited for this purpose as the verification of incomplete sequences is non-trivial or even impossible."}, {"self_ref": "#/texts/142", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 134.7650146484375, "t": 207.67337036132812, "r": 480.5947265625, "b": 127.14539337158203, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 542]}], "orig": "In a valid HTML table, the token sequence must describe a 2D grid of table cells, serialised in row-major ordering, where each row and each column have the same length (while considering row- and column-spans). Furthermore, every opening tag in HTML needs to be matched by a closing tag in a correct hierarchical manner. Since the number of tokens for each table row and column can vary significantly, especially for large tables with many row- and column-spans, it is complex to verify the consistency of predicted structures during sequence", "text": "In a valid HTML table, the token sequence must describe a 2D grid of table cells, serialised in row-major ordering, where each row and each column have the same length (while considering row- and column-spans). Furthermore, every opening tag in HTML needs to be matched by a closing tag in a correct hierarchical manner. Since the number of tokens for each table row and column can vary significantly, especially for large tables with many row- and column-spans, it is complex to verify the consistency of predicted structures during sequence"}, {"self_ref": "#/texts/143", "parent": {"cref": "#/body"}, "children": [], "label": "page_header", "prov": [{"page_no": 6, "bbox": {"l": 134.76499938964844, "t": 698.22900390625, "r": 139.37193298339844, "b": 690.1593017578125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "6", "text": "6"}, {"self_ref": "#/texts/144", "parent": {"cref": "#/body"}, "children": [], "label": "page_header", "prov": [{"page_no": 6, "bbox": {"l": 167.8133544921875, "t": 698.22900390625, "r": 231.72227478027344, "b": 690.1593017578125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 16]}], "orig": "M. Lysak, et al.", "text": "M. Lysak, et al."}, {"self_ref": "#/texts/145", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 6, "bbox": {"l": 134.76499938964844, "t": 673.0662231445312, "r": 480.59478759765625, "b": 652.314208984375, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 132]}], "orig": "generation. Implicitly, this also means that Im2Seq models need to learn these complex syntax rules, simply to deliver valid output.", "text": "generation. Implicitly, this also means that Im2Seq models need to learn these complex syntax rules, simply to deliver valid output."}, {"self_ref": "#/texts/146", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 6, "bbox": {"l": 134.76498413085938, "t": 648.5172119140625, "r": 480.595703125, "b": 496.2580871582031, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 977]}], "orig": "In practice, we observe two major issues with prediction quality when training Im2Seq models on HTML table structure generation from images. On the one hand, we find that on large tables, the visual attention of the model often starts to drift and is not accurately moving forward cell by cell anymore. This manifests itself in either in an increasing location drift for proposed table-cells in later rows on the same column or even complete loss of vertical alignment, as illustrated in Figure 5. Addressing this with post-processing is partially possible, but clearly undesired. On the other hand, we find many instances of predictions with structural inconsistencies or plain invalid HTML output, as shown in Figure 6, which are nearly impossible to properly correct. Both problems seriously impact the TSR model performance, since they reflect not only in the task of pure structure recognition but also in the equally crucial recognition or matching of table cell content.", "text": "In practice, we observe two major issues with prediction quality when training Im2Seq models on HTML table structure generation from images. On the one hand, we find that on large tables, the visual attention of the model often starts to drift and is not accurately moving forward cell by cell anymore. This manifests itself in either in an increasing location drift for proposed table-cells in later rows on the same column or even complete loss of vertical alignment, as illustrated in Figure 5. Addressing this with post-processing is partially possible, but clearly undesired. On the other hand, we find many instances of predictions with structural inconsistencies or plain invalid HTML output, as shown in Figure 6, which are nearly impossible to properly correct. Both problems seriously impact the TSR model performance, since they reflect not only in the task of pure structure recognition but also in the equally crucial recognition or matching of table cell content."}, {"self_ref": "#/texts/147", "parent": {"cref": "#/body"}, "children": [], "label": "section_header", "prov": [{"page_no": 6, "bbox": {"l": 134.76498413085938, "t": 471.368896484375, "r": 372.50848388671875, "b": 460.8005065917969, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 36]}], "orig": "4 Optimised Table Structure Language", "text": "4 Optimised Table Structure Language", "level": 1}, {"self_ref": "#/texts/148", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 6, "bbox": {"l": 134.76498413085938, "t": 442.8830261230469, "r": 480.5947265625, "b": 350.400146484375, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 563]}], "orig": "To mitigate the issues with HTML in Im2Seq-based TSR models laid out before, we propose here our Optimised Table Structure Language (OTSL). OTSL is designed to express table structure with a minimized vocabulary and a simple set of rules, which are both significantly reduced compared to HTML. At the same time, OTSL enables easy error detection and correction during sequence generation. We further demonstrate how the compact structure representation and minimized sequence length improves prediction accuracy and inference time in the TableFormer architecture.", "text": "To mitigate the issues with HTML in Im2Seq-based TSR models laid out before, we propose here our Optimised Table Structure Language (OTSL). OTSL is designed to express table structure with a minimized vocabulary and a simple set of rules, which are both significantly reduced compared to HTML. At the same time, OTSL enables easy error detection and correction during sequence generation. We further demonstrate how the compact structure representation and minimized sequence length improves prediction accuracy and inference time in the TableFormer architecture."}, {"self_ref": "#/texts/149", "parent": {"cref": "#/body"}, "children": [], "label": "section_header", "prov": [{"page_no": 6, "bbox": {"l": 134.76498413085938, "t": 326.1280822753906, "r": 261.80108642578125, "b": 317.3211364746094, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 23]}], "orig": "4.1 Language Definition", "text": "4.1 Language Definition", "level": 1}, {"self_ref": "#/texts/150", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 6, "bbox": {"l": 134.76498413085938, "t": 303.0021057128906, "r": 480.5887145996094, "b": 270.2941589355469, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 165]}], "orig": "In Figure 3, we illustrate how the OTSL is defined. In essence, the OTSL defines only 5 tokens that directly describe a tabular structure based on an atomic 2D grid.", "text": "In Figure 3, we illustrate how the OTSL is defined. In essence, the OTSL defines only 5 tokens that directly describe a tabular structure based on an atomic 2D grid."}, {"self_ref": "#/texts/151", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 6, "bbox": {"l": 149.708984375, "t": 266.4981384277344, "r": 409.3113708496094, "b": 257.701171875, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 57]}], "orig": "The OTSL vocabulary is comprised of the following tokens:", "text": "The OTSL vocabulary is comprised of the following tokens:"}, {"self_ref": "#/texts/152", "parent": {"cref": "#/groups/1"}, "children": [], "label": "list_item", "prov": [{"page_no": 6, "bbox": {"l": 140.99298095703125, "t": 244.0301055908203, "r": 460.54443359375, "b": 235.22317504882812, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 72]}], "orig": "-\"C\" cell a new table cell that either has or does not have cell content", "text": "-\"C\" cell a new table cell that either has or does not have cell content", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/153", "parent": {"cref": "#/groups/1"}, "children": [], "label": "list_item", "prov": [{"page_no": 6, "bbox": {"l": 140.99301147460938, "t": 231.43710327148438, "r": 480.59393310546875, "b": 210.6751708984375, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 82]}], "orig": "-\"L\" cell left-looking cell , merging with the left neighbor cell to create a span", "text": "-\"L\" cell left-looking cell , merging with the left neighbor cell to create a span", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/154", "parent": {"cref": "#/groups/1"}, "children": [], "label": "list_item", "prov": [{"page_no": 6, "bbox": {"l": 140.9930419921875, "t": 206.8881072998047, "r": 480.58856201171875, "b": 186.1261749267578, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 81]}], "orig": "-\"U\" cell up-looking cell , merging with the upper neighbor cell to create a span", "text": "-\"U\" cell up-looking cell , merging with the upper neighbor cell to create a span", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/155", "parent": {"cref": "#/groups/1"}, "children": [], "label": "list_item", "prov": [{"page_no": 6, "bbox": {"l": 140.9930419921875, "t": 182.34010314941406, "r": 454.5549621582031, "b": 173.53317260742188, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 71]}], "orig": "-\"X\" cell cross cell , to merge with both left and upper neighbor cells", "text": "-\"X\" cell cross cell , to merge with both left and upper neighbor cells", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/156", "parent": {"cref": "#/groups/1"}, "children": [], "label": "list_item", "prov": [{"page_no": 6, "bbox": {"l": 140.9930419921875, "t": 169.74610900878906, "r": 328.61676025390625, "b": 160.93917846679688, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 40]}], "orig": "-\"NL\" new-line , switch to the next row.", "text": "-\"NL\" new-line , switch to the next row.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/157", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 6, "bbox": {"l": 134.76504516601562, "t": 147.8971405029297, "r": 480.5928039550781, "b": 127.14515686035156, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 99]}], "orig": "A notable attribute of OTSL is that it has the capability of achieving lossless conversion to HTML.", "text": "A notable attribute of OTSL is that it has the capability of achieving lossless conversion to HTML."}, {"self_ref": "#/texts/158", "parent": {"cref": "#/body"}, "children": [], "label": "page_header", "prov": [{"page_no": 7, "bbox": {"l": 194.47799682617188, "t": 698.22900390625, "r": 447.54290771484375, "b": 690.1593017578125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 60]}], "orig": "Optimized Table Tokenization for Table Structure Recognition", "text": "Optimized Table Tokenization for Table Structure Recognition"}, {"self_ref": "#/texts/159", "parent": {"cref": "#/body"}, "children": [], "label": "page_header", "prov": [{"page_no": 7, "bbox": {"l": 475.98431396484375, "t": 698.22900390625, "r": 480.59124755859375, "b": 690.1593017578125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "7", "text": "7"}, {"self_ref": "#/texts/160", "parent": {"cref": "#/body"}, "children": [], "label": "caption", "prov": [{"page_no": 7, "bbox": {"l": 134.76499938964844, "t": 666.2008056640625, "r": 480.58740234375, "b": 636.1503295898438, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 207]}], "orig": "Fig. 3. OTSL description of table structure: A - table example; B - graphical representation of table structure; C - mapping structure on a grid; D - OTSL structure encoding; E - explanation on cell encoding", "text": "Fig. 3. OTSL description of table structure: A - table example; B - graphical representation of table structure; C - mapping structure on a grid; D - OTSL structure encoding; E - explanation on cell encoding"}, {"self_ref": "#/texts/161", "parent": {"cref": "#/pictures/2"}, "children": [], "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 374.49326, "t": 623.40637, "r": 381.66843, "b": 614.08459, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/162", "parent": {"cref": "#/pictures/2"}, "children": [], "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 398.74011, "t": 623.49994, "r": 405.91528, "b": 614.17816, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/163", "parent": {"cref": "#/pictures/2"}, "children": [], "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 373.76862, "t": 599.07446, "r": 380.94379, "b": 589.75269, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/164", "parent": {"cref": "#/pictures/2"}, "children": [], "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 386.66388, "t": 598.92938, "r": 393.83905, "b": 589.6076, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/165", "parent": {"cref": "#/pictures/2"}, "children": [], "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 386.68707, "t": 586.86243, "r": 393.86224, "b": 577.54065, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/166", "parent": {"cref": "#/pictures/2"}, "children": [], "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 398.65729, "t": 611.26721, "r": 405.83246, "b": 601.94543, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/167", "parent": {"cref": "#/pictures/2"}, "children": [], "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 410.77908, "t": 611.26141, "r": 417.95425, "b": 601.93964, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/168", "parent": {"cref": "#/pictures/2"}, "children": [], "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 422.90503, "t": 611.34753, "r": 430.08020000000005, "b": 602.02576, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/169", "parent": {"cref": "#/pictures/2"}, "children": [], "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 398.7807, "t": 599.01135, "r": 405.95587, "b": 589.68958, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/170", "parent": {"cref": "#/pictures/2"}, "children": [], "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 410.90164, "t": 599.00513, "r": 418.07681, "b": 589.68335, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/171", "parent": {"cref": "#/pictures/2"}, "children": [], "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 423.02753, "t": 599.091, "r": 430.2027, "b": 589.76923, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/172", "parent": {"cref": "#/pictures/2"}, "children": [], "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 398.78235, "t": 586.68427, "r": 405.95752, "b": 577.36249, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/173", "parent": {"cref": "#/pictures/2"}, "children": [], "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 410.90414, "t": 586.67804, "r": 418.07932, "b": 577.35626, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/174", "parent": {"cref": "#/pictures/2"}, "children": [], "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 423.03003, "t": 586.76385, "r": 430.20520000000005, "b": 577.44208, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/175", "parent": {"cref": "#/pictures/2"}, "children": [], "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 386.50574, "t": 574.96118, "r": 393.68091, "b": 565.6394, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/176", "parent": {"cref": "#/pictures/2"}, "children": [], "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 398.60181, "t": 574.78296, "r": 405.77698, "b": 565.46118, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/177", "parent": {"cref": "#/pictures/2"}, "children": [], "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 410.72275, "t": 574.77679, "r": 417.89792, "b": 565.45502, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/178", "parent": {"cref": "#/pictures/2"}, "children": [], "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 422.84869, "t": 574.86261, "r": 430.02386, "b": 565.54083, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/179", "parent": {"cref": "#/pictures/2"}, "children": [], "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 435.16009999999994, "t": 624.30988, "r": 447.86273, "b": 614.9881, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "NL", "text": "NL"}, {"self_ref": "#/texts/180", "parent": {"cref": "#/pictures/2"}, "children": [], "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 435.44415, "t": 611.79974, "r": 448.14679, "b": 602.47797, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "NL", "text": "NL"}, {"self_ref": "#/texts/181", "parent": {"cref": "#/pictures/2"}, "children": [], "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 435.46735, "t": 599.50525, "r": 448.16998000000007, "b": 590.18347, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "NL", "text": "NL"}, {"self_ref": "#/texts/182", "parent": {"cref": "#/pictures/2"}, "children": [], "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 435.38202, "t": 587.16974, "r": 448.08466, "b": 577.84796, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "NL", "text": "NL"}, {"self_ref": "#/texts/183", "parent": {"cref": "#/pictures/2"}, "children": [], "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 435.59906, "t": 574.7663, "r": 448.3017, "b": 565.44452, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "NL", "text": "NL"}, {"self_ref": "#/texts/184", "parent": {"cref": "#/pictures/2"}, "children": [], "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 374.14957, "t": 586.76508, "r": 381.32474, "b": 577.4433, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "U", "text": "U"}, {"self_ref": "#/texts/185", "parent": {"cref": "#/pictures/2"}, "children": [], "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 374.0419, "t": 574.85352, "r": 381.21707, "b": 565.53174, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "U", "text": "U"}, {"self_ref": "#/texts/186", "parent": {"cref": "#/pictures/2"}, "children": [], "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 374.34418, "t": 611.06512, "r": 381.51935, "b": 601.74335, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "U", "text": "U"}, {"self_ref": "#/texts/187", "parent": {"cref": "#/pictures/2"}, "children": [], "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 387.76285, "t": 623.42212, "r": 393.28833, "b": 614.10034, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "L", "text": "L"}, {"self_ref": "#/texts/188", "parent": {"cref": "#/pictures/2"}, "children": [], "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 411.86395, "t": 623.93805, "r": 417.38943, "b": 614.61627, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "L", "text": "L"}, {"self_ref": "#/texts/189", "parent": {"cref": "#/pictures/2"}, "children": [], "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 423.33563, "t": 624.06561, "r": 428.86111, "b": 614.74384, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "L", "text": "L"}, {"self_ref": "#/texts/190", "parent": {"cref": "#/pictures/2"}, "children": [], "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 387.13593, "t": 611.21423, "r": 393.76453, "b": 601.89246, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "X", "text": "X"}, {"self_ref": "#/texts/191", "parent": {"cref": "#/pictures/2"}, "children": [], "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 282.2594, "t": 547.49121, "r": 289.43457, "b": 538.16943, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/192", "parent": {"cref": "#/pictures/2"}, "children": [], "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 282.11035, "t": 535.14978, "r": 289.28552, "b": 525.828, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "U", "text": "U"}, {"self_ref": "#/texts/193", "parent": {"cref": "#/pictures/2"}, "children": [], "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 282.40848, "t": 522.867, "r": 289.58365, "b": 513.54523, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "U", "text": "U"}, {"self_ref": "#/texts/194", "parent": {"cref": "#/pictures/2"}, "children": [], "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 295.52902, "t": 547.50653, "r": 301.0545, "b": 538.18475, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "L", "text": "L"}, {"self_ref": "#/texts/195", "parent": {"cref": "#/pictures/2"}, "children": [], "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 307.46613, "t": 547.42627, "r": 312.99161, "b": 538.10449, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "L", "text": "L"}, {"self_ref": "#/texts/196", "parent": {"cref": "#/pictures/2"}, "children": [], "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 318.76886, "t": 547.55963, "r": 324.29434, "b": 538.23785, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "L", "text": "L"}, {"self_ref": "#/texts/197", "parent": {"cref": "#/pictures/2"}, "children": [], "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 294.9021, "t": 535.29846, "r": 301.03976, "b": 525.97668, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "X", "text": "X"}, {"self_ref": "#/texts/198", "parent": {"cref": "#/pictures/2"}, "children": [], "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 307.17743, "t": 535.29846, "r": 325.59039, "b": 525.97668, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 3]}], "orig": "X X", "text": "X X"}, {"self_ref": "#/texts/199", "parent": {"cref": "#/pictures/2"}, "children": [], "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 294.78949, "t": 522.74579, "r": 300.92715, "b": 513.42401, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "X", "text": "X"}, {"self_ref": "#/texts/200", "parent": {"cref": "#/pictures/2"}, "children": [], "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 307.06482, "t": 522.74579, "r": 325.47778, "b": 513.42401, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 3]}], "orig": "X X", "text": "X X"}, {"self_ref": "#/texts/201", "parent": {"cref": "#/pictures/2"}, "children": [], "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 195.93939, "t": 523.25201, "r": 203.11456, "b": 513.93024, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/202", "parent": {"cref": "#/pictures/2"}, "children": [], "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 209.20891, "t": 523.26733, "r": 214.73439, "b": 513.94556, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "L", "text": "L"}, {"self_ref": "#/texts/203", "parent": {"cref": "#/pictures/2"}, "children": [], "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 221.14551, "t": 523.18707, "r": 226.67099, "b": 513.8653, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "L", "text": "L"}, {"self_ref": "#/texts/204", "parent": {"cref": "#/pictures/2"}, "children": [], "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 232.44858, "t": 523.32043, "r": 237.97405999999998, "b": 513.99866, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "L", "text": "L"}, {"self_ref": "#/texts/205", "parent": {"cref": "#/pictures/2"}, "children": [], "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 196.21715, "t": 547.46039, "r": 203.39232, "b": 538.13861, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/206", "parent": {"cref": "#/pictures/2"}, "children": [], "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 250.32143, "t": 547.90186, "r": 257.49661, "b": 538.58008, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/207", "parent": {"cref": "#/pictures/2"}, "children": [], "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 250.17235999999997, "t": 535.56049, "r": 257.34753, "b": 526.23871, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "U", "text": "U"}, {"self_ref": "#/texts/208", "parent": {"cref": "#/pictures/2"}, "children": [], "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 250.47049000000004, "t": 523.27777, "r": 257.64566, "b": 513.95599, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "U", "text": "U"}, {"self_ref": "#/texts/209", "parent": {"cref": "#/pictures/2"}, "children": [], "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 334.51135, "t": 549.00537, "r": 337.22485, "b": 542.79089, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "1", "text": "1"}, {"self_ref": "#/texts/210", "parent": {"cref": "#/pictures/2"}, "children": [], "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 339.93835, "t": 549.00537, "r": 391.49472, "b": 542.79089, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 19]}], "orig": "- simple cells: \"C\"", "text": "- simple cells: \"C\""}, {"self_ref": "#/texts/211", "parent": {"cref": "#/pictures/2"}, "children": [], "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 334.51135, "t": 539.06744, "r": 337.33313, "b": 532.85297, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "2", "text": "2"}, {"self_ref": "#/texts/212", "parent": {"cref": "#/pictures/2"}, "children": [], "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 340.15491, "t": 539.06744, "r": 421.98624, "b": 532.85297, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 29]}], "orig": "- horizontal merges: \"C\", \"L\"", "text": "- horizontal merges: \"C\", \"L\""}, {"self_ref": "#/texts/213", "parent": {"cref": "#/pictures/2"}, "children": [], "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 334.51135, "t": 529.12952, "r": 337.29868, "b": 522.91504, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "3", "text": "3"}, {"self_ref": "#/texts/214", "parent": {"cref": "#/pictures/2"}, "children": [], "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 340.086, "t": 529.12952, "r": 415.34375, "b": 522.91504, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 27]}], "orig": "- vertical merges: \"C\", \"U\"", "text": "- vertical merges: \"C\", \"U\""}, {"self_ref": "#/texts/215", "parent": {"cref": "#/pictures/2"}, "children": [], "label": "list_item", "prov": [{"page_no": 7, "bbox": {"l": 334.51135, "t": 519.19159, "r": 426.59875, "b": 512.97711, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 33]}], "orig": "4 - 2d merges: \"C\", \"L\", \"U\", \"X\"", "text": "4 - 2d merges: \"C\", \"L\", \"U\", \"X\"", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/216", "parent": {"cref": "#/pictures/2"}, "children": [], "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 185.67178, "t": 547.95776, "r": 189.35544, "b": 541.74329, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "1", "text": "1"}, {"self_ref": "#/texts/217", "parent": {"cref": "#/pictures/2"}, "children": [], "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 185.96759, "t": 523.65234, "r": 189.65125, "b": 517.43787, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "2", "text": "2"}, {"self_ref": "#/texts/218", "parent": {"cref": "#/pictures/2"}, "children": [], "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 239.34152, "t": 548.37476, "r": 243.02518, "b": 542.16028, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "3", "text": "3"}, {"self_ref": "#/texts/219", "parent": {"cref": "#/pictures/2"}, "children": [], "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 271.32852, "t": 548.5061, "r": 275.01218, "b": 542.29163, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "4", "text": "4"}, {"self_ref": "#/texts/220", "parent": {"cref": "#/pictures/2"}, "children": [], "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 229.81627, "t": 625.48505, "r": 233.49992000000003, "b": 619.27057, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "2", "text": "2"}, {"self_ref": "#/texts/221", "parent": {"cref": "#/pictures/2"}, "children": [], "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 257.24402, "t": 602.039, "r": 260.92767, "b": 595.82452, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "1", "text": "1"}, {"self_ref": "#/texts/222", "parent": {"cref": "#/pictures/2"}, "children": [], "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 186.87526, "t": 614.02332, "r": 190.55891, "b": 607.80884, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "3", "text": "3"}, {"self_ref": "#/texts/223", "parent": {"cref": "#/pictures/2"}, "children": [], "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 196.48746, "t": 622.9848, "r": 200.17111, "b": 616.77032, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "4", "text": "4"}, {"self_ref": "#/texts/224", "parent": {"cref": "#/pictures/2"}, "children": [], "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 169.74728, "t": 624.11774, "r": 175.72659, "b": 616.34961, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "A", "text": "A"}, {"self_ref": "#/texts/225", "parent": {"cref": "#/pictures/2"}, "children": [], "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 169.74728, "t": 585.16132, "r": 175.72659, "b": 577.39319, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "B", "text": "B"}, {"self_ref": "#/texts/226", "parent": {"cref": "#/pictures/2"}, "children": [], "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 274.29419, "t": 623.72028, "r": 280.2735, "b": 615.95215, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/227", "parent": {"cref": "#/pictures/2"}, "children": [], "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 359.56152, "t": 623.72028, "r": 365.54083, "b": 615.95215, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "D", "text": "D"}, {"self_ref": "#/texts/228", "parent": {"cref": "#/pictures/2"}, "children": [], "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 169.74728, "t": 548.78851, "r": 175.27112, "b": 541.02039, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "E", "text": "E"}, {"self_ref": "#/texts/229", "parent": {"cref": "#/body"}, "children": [], "label": "section_header", "prov": [{"page_no": 7, "bbox": {"l": 134.76499938964844, "t": 486.7041931152344, "r": 246.6519775390625, "b": 477.8972473144531, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 19]}], "orig": "4.2 Language Syntax", "text": "4.2 Language Syntax", "level": 1}, {"self_ref": "#/texts/230", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 134.76499938964844, "t": 466.7522277832031, "r": 363.7961730957031, "b": 457.95526123046875, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 51]}], "orig": "The OTSL representation follows these syntax rules:", "text": "The OTSL representation follows these syntax rules:"}, {"self_ref": "#/texts/231", "parent": {"cref": "#/groups/2"}, "children": [], "label": "list_item", "prov": [{"page_no": 7, "bbox": {"l": 138.97299194335938, "t": 444.8291931152344, "r": 480.5890197753906, "b": 424.0662536621094, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 108]}], "orig": "1. Left-looking cell rule : The left neighbour of an \"L\" cell must be either another \"L\" cell or a \"C\" cell.", "text": "1. Left-looking cell rule : The left neighbour of an \"L\" cell must be either another \"L\" cell or a \"C\" cell.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/232", "parent": {"cref": "#/groups/2"}, "children": [], "label": "list_item", "prov": [{"page_no": 7, "bbox": {"l": 138.97299194335938, "t": 420.9151916503906, "r": 480.59228515625, "b": 400.15325927734375, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 106]}], "orig": "2. Up-looking cell rule : The upper neighbour of a \"U\" cell must be either another \"U\" cell or a \"C\" cell.", "text": "2. Up-looking cell rule : The upper neighbour of a \"U\" cell must be either another \"U\" cell or a \"C\" cell.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/233", "parent": {"cref": "#/body"}, "children": [], "label": "section_header", "prov": [{"page_no": 7, "bbox": {"l": 138.97299194335938, "t": 397.002197265625, "r": 226.0736083984375, "b": 388.19525146484375, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 20]}], "orig": "3. Cross cell rule :", "text": "3. Cross cell rule :", "level": 1}, {"self_ref": "#/texts/234", "parent": {"cref": "#/groups/3"}, "children": [], "label": "list_item", "prov": [{"page_no": 7, "bbox": {"l": 151.70098876953125, "t": 385.0332336425781, "r": 480.5923767089844, "b": 352.3262939453125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 167]}], "orig": "The left neighbour of an \"X\" cell must be either another \"X\" cell or a \"U\" cell, and the upper neighbour of an \"X\" cell must be either another \"X\" cell or an \"L\" cell.", "text": "The left neighbour of an \"X\" cell must be either another \"X\" cell or a \"U\" cell, and the upper neighbour of an \"X\" cell must be either another \"X\" cell or an \"L\" cell.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/235", "parent": {"cref": "#/groups/3"}, "children": [], "label": "list_item", "prov": [{"page_no": 7, "bbox": {"l": 138.97299194335938, "t": 349.17425537109375, "r": 474.5901794433594, "b": 340.3673095703125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 78]}], "orig": "4. First row rule : Only \"L\" cells and \"C\" cells are allowed in the first row.", "text": "4. First row rule : Only \"L\" cells and \"C\" cells are allowed in the first row.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/236", "parent": {"cref": "#/groups/3"}, "children": [], "label": "list_item", "prov": [{"page_no": 7, "bbox": {"l": 138.97299194335938, "t": 337.21624755859375, "r": 480.58746337890625, "b": 316.4543151855469, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 84]}], "orig": "5. First column rule : Only \"U\" cells and \"C\" cells are allowed in the first column.", "text": "5. First column rule : Only \"U\" cells and \"C\" cells are allowed in the first column.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/237", "parent": {"cref": "#/groups/3"}, "children": [], "label": "list_item", "prov": [{"page_no": 7, "bbox": {"l": 138.97299194335938, "t": 313.3032531738281, "r": 480.5945739746094, "b": 292.5403137207031, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 144]}], "orig": "6. Rectangular rule : The table representation is always rectangular - all rows must have an equal number of tokens, terminated with \"NL\" token.", "text": "6. Rectangular rule : The table representation is always rectangular - all rows must have an equal number of tokens, terminated with \"NL\" token.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/238", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 134.76498413085938, "t": 279.40728759765625, "r": 480.5958251953125, "b": 151.05833435058594, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 848]}], "orig": "The application of these rules gives OTSL a set of unique properties. First of all, the OTSL enforces a strictly rectangular structure representation, where every new-line token starts a new row. As a consequence, all rows and all columns have exactly the same number of tokens, irrespective of cell spans. Secondly, the OTSL representation is unambiguous: Every table structure is represented in one way. In this representation every table cell corresponds to a \"C\"-cell token, which in case of spans is always located in the top-left corner of the table cell definition. Third, OTSL syntax rules are only backward-looking. As a consequence, every predicted token can be validated straight during sequence generation by looking at the previously predicted sequence. As such, OTSL can guarantee that every predicted sequence is syntactically valid.", "text": "The application of these rules gives OTSL a set of unique properties. First of all, the OTSL enforces a strictly rectangular structure representation, where every new-line token starts a new row. As a consequence, all rows and all columns have exactly the same number of tokens, irrespective of cell spans. Secondly, the OTSL representation is unambiguous: Every table structure is represented in one way. In this representation every table cell corresponds to a \"C\"-cell token, which in case of spans is always located in the top-left corner of the table cell definition. Third, OTSL syntax rules are only backward-looking. As a consequence, every predicted token can be validated straight during sequence generation by looking at the previously predicted sequence. As such, OTSL can guarantee that every predicted sequence is syntactically valid."}, {"self_ref": "#/texts/239", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 134.76498413085938, "t": 147.89730834960938, "r": 480.5926513671875, "b": 127.14533233642578, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 153]}], "orig": "These characteristics can be easily learned by sequence generator networks, as we demonstrate further below. We find strong indications that this pattern", "text": "These characteristics can be easily learned by sequence generator networks, as we demonstrate further below. We find strong indications that this pattern"}, {"self_ref": "#/texts/240", "parent": {"cref": "#/body"}, "children": [], "label": "page_header", "prov": [{"page_no": 8, "bbox": {"l": 134.76499938964844, "t": 698.22900390625, "r": 139.37193298339844, "b": 690.1593017578125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "8", "text": "8"}, {"self_ref": "#/texts/241", "parent": {"cref": "#/body"}, "children": [], "label": "page_header", "prov": [{"page_no": 8, "bbox": {"l": 167.8133544921875, "t": 698.22900390625, "r": 231.72227478027344, "b": 690.1593017578125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 16]}], "orig": "M. Lysak, et al.", "text": "M. Lysak, et al."}, {"self_ref": "#/texts/242", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 134.76499938964844, "t": 673.0662231445312, "r": 480.5888366699219, "b": 652.314208984375, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 84]}], "orig": "reduces significantly the column drift seen in the HTML based models (see Figure 5).", "text": "reduces significantly the column drift seen in the HTML based models (see Figure 5)."}, {"self_ref": "#/texts/243", "parent": {"cref": "#/body"}, "children": [], "label": "section_header", "prov": [{"page_no": 8, "bbox": {"l": 134.76499938964844, "t": 630.4431762695312, "r": 319.3470764160156, "b": 621.63623046875, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 35]}], "orig": "4.3 Error-detection and -mitigation", "text": "4.3 Error-detection and -mitigation", "level": 1}, {"self_ref": "#/texts/244", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 134.76499938964844, "t": 609.7182006835938, "r": 480.59576416015625, "b": 493.32415771484375, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 797]}], "orig": "The design of OTSL allows to validate a table structure easily on an unfinished sequence. The detection of an invalid sequence token is a clear indication of a prediction mistake, however a valid sequence by itself does not guarantee prediction correctness. Different heuristics can be used to correct token errors in an invalid sequence and thus increase the chances for accurate predictions. Such heuristics can be applied either after the prediction of each token, or at the end on the entire predicted sequence. For example a simple heuristic which can correct the predicted OTSL sequence on-the-fly is to verify if the token with the highest prediction confidence invalidates the predicted sequence, and replace it by the token with the next highest confidence until OTSL rules are satisfied.", "text": "The design of OTSL allows to validate a table structure easily on an unfinished sequence. The detection of an invalid sequence token is a clear indication of a prediction mistake, however a valid sequence by itself does not guarantee prediction correctness. Different heuristics can be used to correct token errors in an invalid sequence and thus increase the chances for accurate predictions. Such heuristics can be applied either after the prediction of each token, or at the end on the entire predicted sequence. For example a simple heuristic which can correct the predicted OTSL sequence on-the-fly is to verify if the token with the highest prediction confidence invalidates the predicted sequence, and replace it by the token with the next highest confidence until OTSL rules are satisfied."}, {"self_ref": "#/texts/245", "parent": {"cref": "#/body"}, "children": [], "label": "section_header", "prov": [{"page_no": 8, "bbox": {"l": 134.76499938964844, "t": 470.83599853515625, "r": 229.03533935546875, "b": 460.2676086425781, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 13]}], "orig": "5 Experiments", "text": "5 Experiments", "level": 1}, {"self_ref": "#/texts/246", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 134.76499938964844, "t": 444.7501525878906, "r": 480.59527587890625, "b": 340.3122863769531, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 684]}], "orig": "To evaluate the impact of OTSL on prediction accuracy and inference times, we conducted a series of experiments based on the TableFormer model (Figure 4) with two objectives: Firstly we evaluate the prediction quality and performance of OTSL vs. HTML after performing Hyper Parameter Optimization (HPO) on the canonical PubTabNet data set. Secondly we pick the best hyper-parameters found in the first step and evaluate how OTSL impacts the performance of TableFormer after training on other publicly available data sets (FinTabNet, PubTables-1M [14]). The ground truth (GT) from all data sets has been converted into OTSL format for this purpose, and will be made publicly available.", "text": "To evaluate the impact of OTSL on prediction accuracy and inference times, we conducted a series of experiments based on the TableFormer model (Figure 4) with two objectives: Firstly we evaluate the prediction quality and performance of OTSL vs. HTML after performing Hyper Parameter Optimization (HPO) on the canonical PubTabNet data set. Secondly we pick the best hyper-parameters found in the first step and evaluate how OTSL impacts the performance of TableFormer after training on other publicly available data sets (FinTabNet, PubTables-1M [14]). The ground truth (GT) from all data sets has been converted into OTSL format for this purpose, and will be made publicly available."}, {"self_ref": "#/texts/247", "parent": {"cref": "#/body"}, "children": [], "label": "caption", "prov": [{"page_no": 8, "bbox": {"l": 134.7650146484375, "t": 307.35186767578125, "r": 480.5908203125, "b": 288.2603454589844, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 104]}], "orig": "Fig. 4. Architecture sketch of the TableFormer model, which is a representative for the Im2Seq approach.", "text": "Fig. 4. Architecture sketch of the TableFormer model, which is a representative for the Im2Seq approach."}, {"self_ref": "#/texts/248", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 147.30025, "t": 251.26836000000003, "r": 149.70605, "b": 248.89992000000007, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "1.", "text": "1."}, {"self_ref": "#/texts/249", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 150.90895, "t": 251.26836000000003, "r": 155.72055, "b": 248.89992000000007, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "Item", "text": "Item"}, {"self_ref": "#/texts/250", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 162.75987, "t": 256.60619999999994, "r": 172.2963, "b": 254.23775999999998, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 6]}], "orig": "Amount", "text": "Amount"}, {"self_ref": "#/texts/251", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 147.63603, "t": 256.63384999999994, "r": 155.91753, "b": 254.26540999999997, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 5]}], "orig": "Names", "text": "Names"}, {"self_ref": "#/texts/252", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 158.48466, "t": 251.26836000000003, "r": 164.10178, "b": 248.89992000000007, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "1000", "text": "1000"}, {"self_ref": "#/texts/253", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 158.48466, "t": 247.32934999999998, "r": 162.69737, "b": 244.96091, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 3]}], "orig": "500", "text": "500"}, {"self_ref": "#/texts/254", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 158.48466, "t": 243.08736, "r": 164.10178, "b": 240.71892000000003, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "3500", "text": "3500"}, {"self_ref": "#/texts/255", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 158.48466, "t": 238.84535000000005, "r": 162.69737, "b": 236.47690999999998, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 3]}], "orig": "150", "text": "150"}, {"self_ref": "#/texts/256", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 168.81696, "t": 251.26836000000003, "r": 172.88876, "b": 248.89992000000007, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "unit", "text": "unit"}, {"self_ref": "#/texts/257", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 168.81696, "t": 247.32934999999998, "r": 172.88876, "b": 244.96091, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "unit", "text": "unit"}, {"self_ref": "#/texts/258", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 168.81696, "t": 243.08736, "r": 172.88876, "b": 240.71892000000003, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "unit", "text": "unit"}, {"self_ref": "#/texts/259", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 168.81696, "t": 238.84535000000005, "r": 172.88876, "b": 236.47690999999998, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "unit", "text": "unit"}, {"self_ref": "#/texts/260", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 147.30025, "t": 247.32934999999998, "r": 149.70605, "b": 244.96091, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "2.", "text": "2."}, {"self_ref": "#/texts/261", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 150.90895, "t": 247.32934999999998, "r": 155.72055, "b": 244.96091, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "Item", "text": "Item"}, {"self_ref": "#/texts/262", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 147.30025, "t": 243.08736, "r": 149.70605, "b": 240.71892000000003, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "3.", "text": "3."}, {"self_ref": "#/texts/263", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 150.90895, "t": 243.08736, "r": 155.72055, "b": 240.71892000000003, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "Item", "text": "Item"}, {"self_ref": "#/texts/264", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 147.30025, "t": 238.84535000000005, "r": 149.70605, "b": 236.47690999999998, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "4.", "text": "4."}, {"self_ref": "#/texts/265", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 150.90895, "t": 238.84535000000005, "r": 155.72055, "b": 236.47690999999998, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "Item", "text": "Item"}, {"self_ref": "#/texts/266", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 152.05046, "t": 274.99019999999996, "r": 171.24945, "b": 270.72702000000004, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 9]}], "orig": "Extracted", "text": "Extracted"}, {"self_ref": "#/texts/267", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 148.13347, "t": 269.6877099999999, "r": 175.16759, "b": 265.42453, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 12]}], "orig": "Table Images", "text": "Table Images"}, {"self_ref": "#/texts/268", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 193.53331, "t": 267.48578, "r": 220.31973, "b": 263.22260000000006, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 12]}], "orig": "Standardized", "text": "Standardized"}, {"self_ref": "#/texts/269", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 199.47311, "t": 262.18328999999994, "r": 214.37889, "b": 257.92010000000005, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 6]}], "orig": "Images", "text": "Images"}, {"self_ref": "#/texts/270", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 273.61066, "t": 282.0947, "r": 284.47275, "b": 277.83151, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "BBox", "text": "BBox"}, {"self_ref": "#/texts/271", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 270.45187, "t": 278.30716000000007, "r": 287.63242, "b": 274.0439799999999, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 7]}], "orig": "Decoder", "text": "Decoder"}, {"self_ref": "#/texts/272", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 332.47852, "t": 283.85562, "r": 348.14014, "b": 279.59244, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 6]}], "orig": "BBoxes", "text": "BBoxes"}, {"self_ref": "#/texts/273", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 376.68622, "t": 270.87976000000003, "r": 407.25497, "b": 266.61658, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 13]}], "orig": "BBoxes can be", "text": "BBoxes can be"}, {"self_ref": "#/texts/274", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 373.90869, "t": 266.33475, "r": 410.03506, "b": 262.07156, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 18]}], "orig": "traced back to the", "text": "traced back to the"}, {"self_ref": "#/texts/275", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 375.29871, "t": 261.78976, "r": 408.64902, "b": 257.52657999999997, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 17]}], "orig": "original image to", "text": "original image to"}, {"self_ref": "#/texts/276", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 377.06747, "t": 257.24478, "r": 406.88312, "b": 252.98157000000003, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 15]}], "orig": "extract content", "text": "extract content"}, {"self_ref": "#/texts/277", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 383.56683, "t": 228.75824, "r": 433.76544, "b": 224.49503000000004, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 23]}], "orig": "Structure Tags sequence", "text": "Structure Tags sequence"}, {"self_ref": "#/texts/278", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 383.52768, "t": 224.21324000000004, "r": 433.80764999999997, "b": 219.95002999999997, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 27]}], "orig": "provide full description of", "text": "provide full description of"}, {"self_ref": "#/texts/279", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 390.47522, "t": 219.66823, "r": 426.85703, "b": 215.40500999999995, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 19]}], "orig": "the table structure", "text": "the table structure"}, {"self_ref": "#/texts/280", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 293.94702, "t": 214.10857, "r": 323.1691, "b": 209.84535000000005, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 14]}], "orig": "Structure Tags", "text": "Structure Tags"}, {"self_ref": "#/texts/281", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 293.94702, "t": 209.56352000000004, "r": 324.59396, "b": 205.30030999999997, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 14]}], "orig": "in OTSL format", "text": "in OTSL format"}, {"self_ref": "#/texts/282", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 333.07819, "t": 250.17731000000003, "r": 364.14691, "b": 245.91409, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 14]}], "orig": "BBoxes in sync", "text": "BBoxes in sync"}, {"self_ref": "#/texts/283", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 333.07819, "t": 246.38980000000004, "r": 369.71542, "b": 242.12658999999996, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 17]}], "orig": "with tag sequence", "text": "with tag sequence"}, {"self_ref": "#/texts/284", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 232.65881000000002, "t": 276.75861, "r": 249.58894000000004, "b": 272.49541999999997, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 7]}], "orig": "Encoder", "text": "Encoder"}, {"self_ref": "#/texts/285", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 269.8219, "t": 246.02898000000005, "r": 288.26279, "b": 241.76576, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 9]}], "orig": "Structure", "text": "Structure"}, {"self_ref": "#/texts/286", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 270.45187, "t": 242.24149, "r": 287.63242, "b": 237.97827000000007, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 7]}], "orig": "Decoder", "text": "Decoder"}, {"self_ref": "#/texts/287", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 332.17676, "t": 276.08795, "r": 358.11206, "b": 271.82476999999994, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 16]}], "orig": "[x1, y2, x2, y2]", "text": "[x1, y2, x2, y2]"}, {"self_ref": "#/texts/288", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 332.17676, "t": 270.0279499999999, "r": 361.58298, "b": 265.76477, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 20]}], "orig": "[x1', y2', x2', y2']", "text": "[x1', y2', x2', y2']"}, {"self_ref": "#/texts/289", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 332.17676, "t": 263.96795999999995, "r": 364.76474, "b": 259.70477000000005, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 24]}], "orig": "[x1'', y2'', x2'', y2'']", "text": "[x1'', y2'', x2'', y2'']"}, {"self_ref": "#/texts/290", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 332.17676, "t": 257.90796, "r": 335.96548, "b": 253.64476000000002, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 3]}], "orig": "...", "text": "..."}, {"self_ref": "#/texts/291", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 326.8894, "t": 275.60492, "r": 329.41641, "b": 271.3417400000001, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "1", "text": "1"}, {"self_ref": "#/texts/292", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 327.04089, "t": 269.5752299999999, "r": 329.5679, "b": 265.31204, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "2", "text": "2"}, {"self_ref": "#/texts/293", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 327.04089, "t": 263.48492, "r": 329.5679, "b": 259.22173999999995, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "3", "text": "3"}, {"self_ref": "#/texts/294", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 424.14102, "t": 264.55716000000007, "r": 426.66803, "b": 260.2939799999999, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "3", "text": "3"}, {"self_ref": "#/texts/295", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 453.0018, "t": 274.5460499999999, "r": 455.52881, "b": 270.28287, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "2", "text": "2"}, {"self_ref": "#/texts/296", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 423.85825, "t": 274.93719, "r": 426.38525, "b": 270.67400999999995, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "1", "text": "1"}, {"self_ref": "#/texts/297", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 333.4342, "t": 234.63320999999996, "r": 337.27542, "b": 229.64281000000005, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/298", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 340.35397, "t": 234.68321000000003, "r": 344.19519, "b": 229.69281, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/299", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 340.30978, "t": 228.13461000000007, "r": 344.151, "b": 223.14420999999993, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/300", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 346.79904, "t": 228.13132999999993, "r": 350.64026, "b": 223.14093000000003, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/301", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 333.59583, "t": 228.17728999999997, "r": 337.43704, "b": 223.18688999999995, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/302", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 340.37543, "t": 221.57326999999998, "r": 344.21664, "b": 216.58286999999996, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/303", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 346.86469, "t": 221.56998999999996, "r": 350.7059, "b": 216.57959000000005, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/304", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 333.66144, "t": 221.61595, "r": 337.50266, "b": 216.62554999999998, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/305", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 340.37671, "t": 214.97393999999997, "r": 344.21793, "b": 209.98354000000006, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/306", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 346.86597, "t": 214.97065999999995, "r": 350.70718, "b": 209.98026000000004, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/307", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 333.66272, "t": 215.01662, "r": 337.50394, "b": 210.02621, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/308", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 340.27948, "t": 208.60262999999998, "r": 344.1207, "b": 203.61222999999995, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/309", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 346.76874, "t": 208.59932000000003, "r": 350.60995, "b": 203.60892, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/310", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 333.56549, "t": 208.64526, "r": 337.40671, "b": 203.65485999999999, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/311", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 353.03326, "t": 235.11687000000006, "r": 359.83362, "b": 230.12645999999995, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "NL", "text": "NL"}, {"self_ref": "#/texts/312", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 353.18604, "t": 228.41956000000005, "r": 359.98639, "b": 223.42915000000005, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "NL", "text": "NL"}, {"self_ref": "#/texts/313", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 353.19864, "t": 221.83764999999994, "r": 359.99899, "b": 216.84724000000006, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "NL", "text": "NL"}, {"self_ref": "#/texts/314", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 353.1532, "t": 215.23388999999997, "r": 359.95355, "b": 210.24347999999998, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "NL", "text": "NL"}, {"self_ref": "#/texts/315", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 353.26935, "t": 208.59371999999996, "r": 360.0697, "b": 203.60331999999994, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "NL", "text": "NL"}, {"self_ref": "#/texts/316", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 347.37979, "t": 234.91764999999998, "r": 350.33786, "b": 229.92724999999996, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "L", "text": "L"}, {"self_ref": "#/texts/317", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 331.14026, "t": 227.70922999999993, "r": 333.66727, "b": 223.44601, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "3", "text": "3"}, {"self_ref": "#/texts/318", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 340.80972, "t": 237.40688, "r": 343.33673, "b": 233.14365999999995, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "2", "text": "2"}, {"self_ref": "#/texts/319", "parent": {"cref": "#/pictures/3"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 330.97992, "t": 237.16965000000005, "r": 333.50693, "b": 232.90643, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "1", "text": "1"}, {"self_ref": "#/texts/320", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 134.76499938964844, "t": 171.80722045898438, "r": 480.59173583984375, "b": 127.1452407836914, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 299]}], "orig": "We rely on standard metrics such as Tree Edit Distance score (TEDs) for table structure prediction, and Mean Average Precision (mAP) with 0.75 Intersection Over Union (IOU) threshold for the bounding-box predictions of table cells. The predicted OTSL structures were converted back to HTML format in", "text": "We rely on standard metrics such as Tree Edit Distance score (TEDs) for table structure prediction, and Mean Average Precision (mAP) with 0.75 Intersection Over Union (IOU) threshold for the bounding-box predictions of table cells. The predicted OTSL structures were converted back to HTML format in"}, {"self_ref": "#/texts/321", "parent": {"cref": "#/body"}, "children": [], "label": "page_header", "prov": [{"page_no": 9, "bbox": {"l": 194.47799682617188, "t": 698.22900390625, "r": 447.54290771484375, "b": 690.1593017578125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 60]}], "orig": "Optimized Table Tokenization for Table Structure Recognition", "text": "Optimized Table Tokenization for Table Structure Recognition"}, {"self_ref": "#/texts/322", "parent": {"cref": "#/body"}, "children": [], "label": "page_header", "prov": [{"page_no": 9, "bbox": {"l": 475.98431396484375, "t": 698.22900390625, "r": 480.59124755859375, "b": 690.1593017578125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "9", "text": "9"}, {"self_ref": "#/texts/323", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 9, "bbox": {"l": 134.76499938964844, "t": 673.0662231445312, "r": 480.5957946777344, "b": 640.3582153320312, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 163]}], "orig": "order to compute the TED score. Inference timing results for all experiments were obtained from the same machine on a single core with AMD EPYC 7763 CPU @2.45 GHz.", "text": "order to compute the TED score. Inference timing results for all experiments were obtained from the same machine on a single core with AMD EPYC 7763 CPU @2.45 GHz."}, {"self_ref": "#/texts/324", "parent": {"cref": "#/body"}, "children": [], "label": "section_header", "prov": [{"page_no": 9, "bbox": {"l": 134.76499938964844, "t": 622.8141479492188, "r": 318.44842529296875, "b": 614.0072021484375, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 32]}], "orig": "5.1 Hyper Parameter Optimization", "text": "5.1 Hyper Parameter Optimization", "level": 1}, {"self_ref": "#/texts/325", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 9, "bbox": {"l": 134.76498413085938, "t": 606.4141845703125, "r": 480.5927734375, "b": 537.8411254882812, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 423]}], "orig": "We have chosen the PubTabNet data set to perform HPO, since it includes a highly diverse set of tables. Also we report TED scores separately for simple and complex tables (tables with cell spans). Results are presented in Table. 1. It is evident that with OTSL, our model achieves the same TED score and slightly better mAP scores in comparison to HTML. However OTSL yields a 2x speed up in the inference runtime over HTML.", "text": "We have chosen the PubTabNet data set to perform HPO, since it includes a highly diverse set of tables. Also we report TED scores separately for simple and complex tables (tables with cell spans). Results are presented in Table. 1. It is evident that with OTSL, our model achieves the same TED score and slightly better mAP scores in comparison to HTML. However OTSL yields a 2x speed up in the inference runtime over HTML."}, {"self_ref": "#/texts/326", "parent": {"cref": "#/body"}, "children": [], "label": "caption", "prov": [{"page_no": 9, "bbox": {"l": 134.76498413085938, "t": 516.9276733398438, "r": 480.59539794921875, "b": 464.9591979980469, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 398]}], "orig": "Table 1. HPO performed in OTSL and HTML representation on the same transformer-based TableFormer [9] architecture, trained only on PubTabNet [22]. Effects of reducing the # of layers in encoder and decoder stages of the model show that smaller models trained on OTSL perform better, especially in recognizing complex table structures, and maintain a much higher mAP score than the HTML counterpart.", "text": "Table 1. HPO performed in OTSL and HTML representation on the same transformer-based TableFormer [9] architecture, trained only on PubTabNet [22]. Effects of reducing the # of layers in encoder and decoder stages of the model show that smaller models trained on OTSL perform better, especially in recognizing complex table structures, and maintain a much higher mAP score than the HTML counterpart."}, {"self_ref": "#/texts/327", "parent": {"cref": "#/body"}, "children": [], "label": "section_header", "prov": [{"page_no": 9, "bbox": {"l": 134.76499938964844, "t": 283.84820556640625, "r": 264.4033203125, "b": 275.041259765625, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 24]}], "orig": "5.2 Quantitative Results", "text": "5.2 Quantitative Results", "level": 1}, {"self_ref": "#/texts/328", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 9, "bbox": {"l": 134.76499938964844, "t": 267.44921875, "r": 480.59576416015625, "b": 174.9652557373047, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 555]}], "orig": "We picked the model parameter configuration that produced the best prediction quality (enc=6, dec=6, heads=8) with PubTabNet alone, then independently trained and evaluated it on three publicly available data sets: PubTabNet (395k samples), FinTabNet (113k samples) and PubTables-1M (about 1M samples). Performance results are presented in Table. 2. It is clearly evident that the model trained on OTSL outperforms HTML across the board, keeping high TEDs and mAP scores even on difficult financial tables (FinTabNet) that contain sparse and large tables.", "text": "We picked the model parameter configuration that produced the best prediction quality (enc=6, dec=6, heads=8) with PubTabNet alone, then independently trained and evaluated it on three publicly available data sets: PubTabNet (395k samples), FinTabNet (113k samples) and PubTables-1M (about 1M samples). Performance results are presented in Table. 2. It is clearly evident that the model trained on OTSL outperforms HTML across the board, keeping high TEDs and mAP scores even on difficult financial tables (FinTabNet) that contain sparse and large tables."}, {"self_ref": "#/texts/329", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 9, "bbox": {"l": 134.76499938964844, "t": 171.80722045898438, "r": 480.59576416015625, "b": 127.1452407836914, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 289]}], "orig": "Additionally, the results show that OTSL has an advantage over HTML when applied on a bigger data set like PubTables-1M and achieves significantly improved scores. Finally, OTSL achieves faster inference due to fewer decoding steps which is a result of the reduced sequence representation.", "text": "Additionally, the results show that OTSL has an advantage over HTML when applied on a bigger data set like PubTables-1M and achieves significantly improved scores. Finally, OTSL achieves faster inference due to fewer decoding steps which is a result of the reduced sequence representation."}, {"self_ref": "#/texts/330", "parent": {"cref": "#/body"}, "children": [], "label": "page_header", "prov": [{"page_no": 10, "bbox": {"l": 134.76499938964844, "t": 698.22900390625, "r": 143.97886657714844, "b": 690.1593017578125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "10", "text": "10"}, {"self_ref": "#/texts/331", "parent": {"cref": "#/body"}, "children": [], "label": "page_header", "prov": [{"page_no": 10, "bbox": {"l": 167.82052612304688, "t": 698.22900390625, "r": 231.72048950195312, "b": 690.1593017578125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 16]}], "orig": "M. Lysak, et al.", "text": "M. Lysak, et al."}, {"self_ref": "#/texts/332", "parent": {"cref": "#/body"}, "children": [], "label": "caption", "prov": [{"page_no": 10, "bbox": {"l": 134.76499938964844, "t": 676.163818359375, "r": 480.59356689453125, "b": 646.1133422851562, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 192]}], "orig": "Table 2. TSR and cell detection results compared between OTSL and HTML on the PubTabNet [22], FinTabNet [21] and PubTables-1M [14] data sets using TableFormer [9] (with enc=6, dec=6, heads=8).", "text": "Table 2. TSR and cell detection results compared between OTSL and HTML on the PubTabNet [22], FinTabNet [21] and PubTables-1M [14] data sets using TableFormer [9] (with enc=6, dec=6, heads=8)."}, {"self_ref": "#/texts/333", "parent": {"cref": "#/body"}, "children": [], "label": "section_header", "prov": [{"page_no": 10, "bbox": {"l": 134.76499938964844, "t": 503.085205078125, "r": 257.0867919921875, "b": 494.27825927734375, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 23]}], "orig": "5.3 Qualitative Results", "text": "5.3 Qualitative Results", "level": 1}, {"self_ref": "#/texts/334", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 134.76499938964844, "t": 482.13922119140625, "r": 480.5898132324219, "b": 425.5223083496094, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 309]}], "orig": "To illustrate the qualitative differences between OTSL and HTML, Figure 5 demonstrates less overlap and more accurate bounding boxes with OTSL. In Figure 6, OTSL proves to be more effective in handling tables with longer token sequences, resulting in even more precise structure prediction and bounding boxes.", "text": "To illustrate the qualitative differences between OTSL and HTML, Figure 5 demonstrates less overlap and more accurate bounding boxes with OTSL. In Figure 6, OTSL proves to be more effective in handling tables with longer token sequences, resulting in even more precise structure prediction and bounding boxes."}, {"self_ref": "#/texts/335", "parent": {"cref": "#/body"}, "children": [], "label": "caption", "prov": [{"page_no": 10, "bbox": {"l": 134.76499938964844, "t": 394.4098815917969, "r": 480.591064453125, "b": 352.2828369140625, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 270]}], "orig": "Fig. 5. The OTSL model produces more accurate bounding boxes with less overlap (E) than the HTML model (D), when predicting the structure of a sparse table (A), at twice the inference speed because of shorter sequence length (B),(C). \"PMC2807444_006_00.png\" PubTabNet. \u03bc", "text": "Fig. 5. The OTSL model produces more accurate bounding boxes with less overlap (E) than the HTML model (D), when predicting the structure of a sparse table (A), at twice the inference speed because of shorter sequence length (B),(C). \"PMC2807444_006_00.png\" PubTabNet. \u03bc"}, {"self_ref": "#/texts/336", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 180.12473, "t": 275.7667799999999, "r": 190.62042, "b": 273.05008, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 7]}], "orig": "<table>", "text": "<table>"}, {"self_ref": "#/texts/337", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 183.2438, "t": 271.86792, "r": 304.54797, "b": 269.15121, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 81]}], "orig": "<tr><td></td><td colspan=\"4\"></td><td colspan=\"6\"></td><td colspan=\"3\"></td></tr>", "text": "<tr><td></td><td colspan=\"4\"></td><td colspan=\"6\"></td><td colspan=\"3\"></td></tr>"}, {"self_ref": "#/texts/338", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 183.2438, "t": 267.96906, "r": 388.42313, "b": 265.25235, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 135]}], "orig": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>"}, {"self_ref": "#/texts/339", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 183.2438, "t": 264.07022000000006, "r": 388.42313, "b": 261.35352, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 135]}], "orig": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>"}, {"self_ref": "#/texts/340", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 183.2438, "t": 260.17139, "r": 388.42313, "b": 257.45468000000005, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 135]}], "orig": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>"}, {"self_ref": "#/texts/341", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 183.2438, "t": 256.27252, "r": 388.42313, "b": 253.55582000000004, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 135]}], "orig": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>"}, {"self_ref": "#/texts/342", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 183.2438, "t": 252.37369, "r": 388.42313, "b": 249.65697, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 135]}], "orig": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>"}, {"self_ref": "#/texts/343", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 183.2438, "t": 248.47483999999997, "r": 388.42313, "b": 245.75811999999996, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 135]}], "orig": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>"}, {"self_ref": "#/texts/344", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 183.2438, "t": 244.57599000000005, "r": 388.42313, "b": 241.85927000000004, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 135]}], "orig": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>"}, {"self_ref": "#/texts/345", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 183.2438, "t": 240.67714, "r": 388.42313, "b": 237.96042, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 135]}], "orig": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>"}, {"self_ref": "#/texts/346", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 180.12473, "t": 236.77827000000002, "r": 191.86806, "b": 234.06155, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 8]}], "orig": "</table>", "text": "</table>"}, {"self_ref": "#/texts/347", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 407.38348, "t": 273.69957999999997, "r": 408.82025, "b": 270.98288, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/348", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 410.25699, "t": 273.69957999999997, "r": 450.48605, "b": 270.98288, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 28]}], "orig": "C L L L C L L L L L C L L NL", "text": "C L L L C L L L L L C L L NL"}, {"self_ref": "#/texts/349", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 407.38348, "t": 269.80075, "r": 408.82025, "b": 267.08404999999993, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/350", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 410.25699, "t": 269.80075, "r": 450.48605, "b": 267.08404999999993, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 28]}], "orig": "C C C C C C C C C C C C C NL", "text": "C C C C C C C C C C C C C NL"}, {"self_ref": "#/texts/351", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 407.38348, "t": 265.90192, "r": 408.82025, "b": 263.18521, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/352", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 410.25699, "t": 265.90192, "r": 450.48605, "b": 263.18521, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 28]}], "orig": "C C C C C C C C C C C C C NL", "text": "C C C C C C C C C C C C C NL"}, {"self_ref": "#/texts/353", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 407.38348, "t": 262.00305000000003, "r": 408.82025, "b": 259.2863500000001, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/354", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 410.25699, "t": 262.00305000000003, "r": 450.48605, "b": 259.2863500000001, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 28]}], "orig": "C C C C C C C C C C C C C NL", "text": "C C C C C C C C C C C C C NL"}, {"self_ref": "#/texts/355", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 407.38348, "t": 258.10421999999994, "r": 408.82025, "b": 255.38750000000005, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/356", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 410.25699, "t": 258.10421999999994, "r": 450.48605, "b": 255.38750000000005, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 28]}], "orig": "C C C C C C C C C C C C C NL", "text": "C C C C C C C C C C C C C NL"}, {"self_ref": "#/texts/357", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 407.38348, "t": 254.20537000000002, "r": 408.82025, "b": 251.48865, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/358", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 410.25699, "t": 254.20537000000002, "r": 450.48605, "b": 251.48865, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 28]}], "orig": "C C C C C C C C C C C C C NL", "text": "C C C C C C C C C C C C C NL"}, {"self_ref": "#/texts/359", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 407.38348, "t": 250.30651999999998, "r": 408.82025, "b": 247.58979999999997, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/360", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 410.25699, "t": 250.30651999999998, "r": 450.48605, "b": 247.58979999999997, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 28]}], "orig": "C C C C C C C C C C C C C NL", "text": "C C C C C C C C C C C C C NL"}, {"self_ref": "#/texts/361", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 407.38348, "t": 246.40767000000005, "r": 408.82025, "b": 243.69094999999993, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/362", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 410.25699, "t": 246.40767000000005, "r": 450.48605, "b": 243.69094999999993, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 28]}], "orig": "C C C C C C C C C C C C C NL", "text": "C C C C C C C C C C C C C NL"}, {"self_ref": "#/texts/363", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 407.38348, "t": 242.50880000000006, "r": 408.82025, "b": 239.79207999999994, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/364", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 410.25699, "t": 242.50880000000006, "r": 450.48605, "b": 239.79207999999994, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 28]}], "orig": "C C C C C C C C C C C C C NL", "text": "C C C C C C C C C C C C C NL"}, {"self_ref": "#/texts/365", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 164.52881, "t": 282.54141, "r": 181.8528, "b": 276.69000000000005, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "HTML", "text": "HTML"}, {"self_ref": "#/texts/366", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 183.58441, "t": 282.54141, "r": 186.3974, "b": 276.69000000000005, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "#", "text": "#"}, {"self_ref": "#/texts/367", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 189.2104, "t": 282.54141, "r": 208.90137, "b": 276.69000000000005, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 7]}], "orig": "tokens:", "text": "tokens:"}, {"self_ref": "#/texts/368", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 210.63269, "t": 282.54141, "r": 221.04044, "b": 276.69000000000005, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 3]}], "orig": "258", "text": "258"}, {"self_ref": "#/texts/369", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 390.20203, "t": 282.39639, "r": 406.83609, "b": 276.54498, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "OTSL", "text": "OTSL"}, {"self_ref": "#/texts/370", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 408.56952, "t": 282.39639, "r": 411.38251, "b": 276.54498, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "#", "text": "#"}, {"self_ref": "#/texts/371", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 414.1955, "t": 282.39639, "r": 433.88647000000003, "b": 276.54498, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 7]}], "orig": "tokens:", "text": "tokens:"}, {"self_ref": "#/texts/372", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 435.61737, "t": 282.39639, "r": 446.02512, "b": 276.54498, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 3]}], "orig": "135", "text": "135"}, {"self_ref": "#/texts/373", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 167.19316, "t": 272.92764, "r": 172.8231, "b": 265.61339999999996, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "B", "text": "B"}, {"self_ref": "#/texts/374", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 187.33745, "t": 343.37515, "r": 192.96739, "b": 336.06091, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "A", "text": "A"}, {"self_ref": "#/texts/375", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 167.38654, "t": 225.99484000000007, "r": 173.01648, "b": 218.68060000000003, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "D", "text": "D"}, {"self_ref": "#/texts/376", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 248.45621000000003, "t": 170.21992, "r": 253.65727, "b": 162.90569000000005, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "E", "text": "E"}, {"self_ref": "#/texts/377", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 395.90057, "t": 272.80053999999996, "r": 401.53052, "b": 265.4863, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/378", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 171.62886, "t": 211.71146999999996, "r": 177.48148, "b": 194.73216000000002, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "HTML", "text": "HTML"}, {"self_ref": "#/texts/379", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 251.05969000000002, "t": 158.36591999999996, "r": 256.91235, "b": 142.07655, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "OTSL", "text": "OTSL"}, {"self_ref": "#/texts/380", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 372.14645, "t": 190.54276000000004, "r": 427.0379, "b": 184.69136000000003, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 16]}], "orig": "HTML model shows", "text": "HTML model shows"}, {"self_ref": "#/texts/381", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 372.14645, "t": 184.10051999999996, "r": 430.06838999999997, "b": 178.24913000000004, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 21]}], "orig": "bounding box drifting", "text": "bounding box drifting"}, {"self_ref": "#/texts/382", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 176.88042, "t": 149.12791000000004, "r": 231.08191, "b": 143.27652, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 16]}], "orig": "OTSL model shows", "text": "OTSL model shows"}, {"self_ref": "#/texts/383", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 176.88042, "t": 142.6857, "r": 230.99271000000002, "b": 136.83429999999998, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 18]}], "orig": "clean bounding box", "text": "clean bounding box"}, {"self_ref": "#/texts/384", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 176.88042, "t": 136.24344999999994, "r": 203.93219, "b": 130.39206000000001, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 9]}], "orig": "alignment", "text": "alignment"}, {"self_ref": "#/texts/385", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 215.93231000000003, "t": 234.43658000000005, "r": 218.4697, "b": 222.84033, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "\u2264", "text": "\u2264"}, {"self_ref": "#/texts/386", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 229.05689999999998, "t": 234.43658000000005, "r": 231.71908999999997, "b": 222.84033, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "\u03bc", "text": "\u03bc"}, {"self_ref": "#/texts/387", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 261.20892, "t": 343.53876, "r": 263.56973, "b": 340.80273, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "S", "text": "S"}, {"self_ref": "#/texts/388", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 312.33463, "t": 343.53876, "r": 313.6362, "b": 340.80273, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "I", "text": "I"}, {"self_ref": "#/texts/389", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 377.41125, "t": 343.53876, "r": 380.05737, "b": 340.80273, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "R", "text": "R"}, {"self_ref": "#/texts/390", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 200.63976, "t": 338.66003, "r": 205.82492, "b": 335.92401, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "ST", "text": "ST"}, {"self_ref": "#/texts/391", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 222.20833000000002, "t": 338.66003, "r": 229.76836, "b": 335.92401, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "0.03", "text": "0.03"}, {"self_ref": "#/texts/392", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 243.26666, "t": 338.66003, "r": 250.82669, "b": 335.92401, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "0.06", "text": "0.06"}, {"self_ref": "#/texts/393", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 264.29657, "t": 338.66003, "r": 271.84949, "b": 335.92401, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "0.12", "text": "0.12"}, {"self_ref": "#/texts/394", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 285.31943, "t": 338.66003, "r": 292.87946, "b": 335.92401, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "0.25", "text": "0.25"}, {"self_ref": "#/texts/395", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 306.37775, "t": 338.66003, "r": 311.77319, "b": 335.92401, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 3]}], "orig": "0.5", "text": "0.5"}, {"self_ref": "#/texts/396", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 323.41699, "t": 338.66003, "r": 325.58157, "b": 335.92401, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "1", "text": "1"}, {"self_ref": "#/texts/397", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 334.45807, "t": 338.66003, "r": 336.62265, "b": 335.92401, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "2", "text": "2"}, {"self_ref": "#/texts/398", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 345.52756, "t": 338.66003, "r": 347.69214, "b": 335.92401, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "4", "text": "4"}, {"self_ref": "#/texts/399", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 356.56863, "t": 338.66003, "r": 358.73322, "b": 335.92401, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "8", "text": "8"}, {"self_ref": "#/texts/400", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 367.63812, "t": 338.66003, "r": 371.97089, "b": 335.92401, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "16", "text": "16"}, {"self_ref": "#/texts/401", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 382.6734, "t": 338.66003, "r": 387.00616, "b": 335.92401, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "32", "text": "32"}, {"self_ref": "#/texts/402", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 397.73727, "t": 338.66003, "r": 402.07001, "b": 335.92401, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "64", "text": "64"}, {"self_ref": "#/texts/403", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 412.78879, "t": 344.00702, "r": 414.93463, "b": 334.20035000000007, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "\u2265", "text": "\u2265"}, {"self_ref": "#/texts/404", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 414.95697, "t": 338.66003, "r": 422.51746, "b": 335.92401, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 3]}], "orig": "128", "text": "128"}, {"self_ref": "#/texts/405", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 200.63998, "t": 328.07556, "r": 204.57674, "b": 325.33957, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "63", "text": "63"}, {"self_ref": "#/texts/406", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 367.62604, "t": 328.07556, "r": 369.58032, "b": 325.33957, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "1", "text": "1"}, {"self_ref": "#/texts/407", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 382.66132, "t": 328.07556, "r": 384.6156, "b": 325.33957, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "1", "text": "1"}, {"self_ref": "#/texts/408", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 397.72504, "t": 328.07556, "r": 399.67932, "b": 325.33957, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "3", "text": "3"}, {"self_ref": "#/texts/409", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 200.64, "t": 323.19687, "r": 206.51694, "b": 320.46085, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 3]}], "orig": "199", "text": "199"}, {"self_ref": "#/texts/410", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 264.29047, "t": 323.19687, "r": 266.25885, "b": 320.46085, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "5", "text": "5"}, {"self_ref": "#/texts/411", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 306.37213, "t": 323.19687, "r": 308.34052, "b": 320.46085, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "1", "text": "1"}, {"self_ref": "#/texts/412", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 345.51526, "t": 323.19687, "r": 347.48364, "b": 320.46085, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "2", "text": "2"}, {"self_ref": "#/texts/413", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 356.55634, "t": 323.19687, "r": 358.52472, "b": 320.46085, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "4", "text": "4"}, {"self_ref": "#/texts/414", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 367.62582, "t": 323.19687, "r": 369.59418, "b": 320.46085, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "1", "text": "1"}, {"self_ref": "#/texts/415", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 382.66107, "t": 323.19687, "r": 384.62946, "b": 320.46085, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "1", "text": "1"}, {"self_ref": "#/texts/416", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 200.64, "t": 318.31815, "r": 206.51694, "b": 315.58212, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 3]}], "orig": "416", "text": "416"}, {"self_ref": "#/texts/417", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 264.29047, "t": 318.31815, "r": 266.25885, "b": 315.58212, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "4", "text": "4"}, {"self_ref": "#/texts/418", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 200.64, "t": 313.46786, "r": 206.51694, "b": 310.73184, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 3]}], "orig": "230", "text": "230"}, {"self_ref": "#/texts/419", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 243.26373, "t": 313.46786, "r": 245.2321, "b": 310.73184, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "1", "text": "1"}, {"self_ref": "#/texts/420", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 264.29047, "t": 313.46786, "r": 266.25885, "b": 310.73184, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "9", "text": "9"}, {"self_ref": "#/texts/421", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 323.40466, "t": 313.46786, "r": 325.37305, "b": 310.73184, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "1", "text": "1"}, {"self_ref": "#/texts/422", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 397.72519, "t": 313.46786, "r": 399.69354, "b": 310.73184, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "1", "text": "1"}, {"self_ref": "#/texts/423", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 200.64, "t": 308.58914, "r": 206.51694, "b": 305.85312, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 3]}], "orig": "276", "text": "276"}, {"self_ref": "#/texts/424", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 382.66132, "t": 308.58914, "r": 384.61563, "b": 305.85312, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "2", "text": "2"}, {"self_ref": "#/texts/425", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 397.72513, "t": 308.58914, "r": 401.64819, "b": 305.85312, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "12", "text": "12"}, {"self_ref": "#/texts/426", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 412.78928, "t": 308.58914, "r": 414.74359, "b": 305.85312, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "1", "text": "1"}, {"self_ref": "#/texts/427", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 200.64014, "t": 303.71042, "r": 207.14445, "b": 300.9744, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 3]}], "orig": "320", "text": "320"}, {"self_ref": "#/texts/428", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 367.62616, "t": 303.71042, "r": 369.78375, "b": 300.9744, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "1", "text": "1"}, {"self_ref": "#/texts/429", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 382.66141, "t": 303.71042, "r": 384.81897, "b": 300.9744, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "4", "text": "4"}, {"self_ref": "#/texts/430", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 397.7251, "t": 303.71042, "r": 402.05087, "b": 300.9744, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "20", "text": "20"}, {"self_ref": "#/texts/431", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 200.64032, "t": 298.8317, "r": 208.48566, "b": 296.09567, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "2013", "text": "2013"}, {"self_ref": "#/texts/432", "parent": {"cref": "#/pictures/4"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 264.29044, "t": 298.8317, "r": 266.25879, "b": 296.09567, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "3", "text": "3"}, {"self_ref": "#/texts/433", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 227.91465759277344, "t": 126.1739730834961, "r": 230.10028076171875, "b": 116.65360260009766, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "\u03bc", "text": "\u03bc"}, {"self_ref": "#/texts/434", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 300.58056640625, "t": 108.3780517578125, "r": 302.72637939453125, "b": 98.57134246826172, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "\u2265", "text": "\u2265"}, {"self_ref": "#/texts/435", "parent": {"cref": "#/body"}, "children": [], "label": "page_header", "prov": [{"page_no": 11, "bbox": {"l": 194.47799682617188, "t": 698.22900390625, "r": 447.54290771484375, "b": 690.1593017578125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 60]}], "orig": "Optimized Table Tokenization for Table Structure Recognition", "text": "Optimized Table Tokenization for Table Structure Recognition"}, {"self_ref": "#/texts/436", "parent": {"cref": "#/body"}, "children": [], "label": "page_header", "prov": [{"page_no": 11, "bbox": {"l": 471.3756103515625, "t": 698.22900390625, "r": 480.5894775390625, "b": 690.1593017578125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "11", "text": "11"}, {"self_ref": "#/texts/437", "parent": {"cref": "#/body"}, "children": [], "label": "caption", "prov": [{"page_no": 11, "bbox": {"l": 134.76499938964844, "t": 666.2008056640625, "r": 480.58837890625, "b": 614.2323608398438, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 390]}], "orig": "Fig. 6. Visualization of predicted structure and detected bounding boxes on a complex table with many rows. The OTSL model (B) captured repeating pattern of horizontally merged cells from the GT (A), unlike the HTML model (C). The HTML model also didn't complete the HTML sequence correctly and displayed a lot more of drift and overlap of bounding boxes. \"PMC5406406_003_01.png\" PubTabNet.", "text": "Fig. 6. Visualization of predicted structure and detected bounding boxes on a complex table with many rows. The OTSL model (B) captured repeating pattern of horizontally merged cells from the GT (A), unlike the HTML model (C). The HTML model also didn't complete the HTML sequence correctly and displayed a lot more of drift and overlap of bounding boxes. \"PMC5406406_003_01.png\" PubTabNet."}, {"self_ref": "#/texts/438", "parent": {"cref": "#/pictures/5"}, "children": [], "label": "text", "prov": [{"page_no": 11, "bbox": {"l": 171.5049, "t": 479.54968, "r": 177.59613, "b": 471.63614, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "B", "text": "B"}, {"self_ref": "#/texts/439", "parent": {"cref": "#/pictures/5"}, "children": [], "label": "text", "prov": [{"page_no": 11, "bbox": {"l": 171.05823, "t": 299.34726, "r": 177.14946, "b": 291.43372, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/440", "parent": {"cref": "#/pictures/5"}, "children": [], "label": "text", "prov": [{"page_no": 11, "bbox": {"l": 283.047, "t": 164.51833999999997, "r": 374.96332, "b": 158.58319000000006, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 30]}], "orig": "Incorrect end of HTML sequence", "text": "Incorrect end of HTML sequence"}, {"self_ref": "#/texts/441", "parent": {"cref": "#/pictures/5"}, "children": [], "label": "text", "prov": [{"page_no": 11, "bbox": {"l": 283.047, "t": 174.64224000000002, "r": 398.05978, "b": 168.70709, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 41]}], "orig": "Horizontally merged cells are not present", "text": "Horizontally merged cells are not present"}, {"self_ref": "#/texts/442", "parent": {"cref": "#/pictures/5"}, "children": [], "label": "text", "prov": [{"page_no": 11, "bbox": {"l": 293.64209, "t": 326.40216, "r": 437.50800000000004, "b": 320.46701, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 52]}], "orig": "Repeating pattern is well represented in predictions", "text": "Repeating pattern is well represented in predictions"}, {"self_ref": "#/texts/443", "parent": {"cref": "#/pictures/5"}, "children": [], "label": "text", "prov": [{"page_no": 11, "bbox": {"l": 181.89114, "t": 503.64037999999994, "r": 239.23492, "b": 497.7052299999999, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 20]}], "orig": "Repeating pattern of", "text": "Repeating pattern of"}, {"self_ref": "#/texts/444", "parent": {"cref": "#/pictures/5"}, "children": [], "label": "text", "prov": [{"page_no": 11, "bbox": {"l": 181.89114, "t": 497.10577, "r": 251.52917, "b": 491.17062, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 25]}], "orig": "horizontally merged cells", "text": "horizontally merged cells"}, {"self_ref": "#/texts/445", "parent": {"cref": "#/pictures/5"}, "children": [], "label": "text", "prov": [{"page_no": 11, "bbox": {"l": 247.83432, "t": 607.24011, "r": 253.61339, "b": 597.18365, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "A", "text": "A"}, {"self_ref": "#/texts/446", "parent": {"cref": "#/pictures/5"}, "children": [], "label": "text", "prov": [{"page_no": 11, "bbox": {"l": 292.18976, "t": 184.19390999999996, "r": 381.54663, "b": 178.25875999999994, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 32]}], "orig": "Bounding box drifting at the end", "text": "Bounding box drifting at the end"}, {"self_ref": "#/texts/447", "parent": {"cref": "#/pictures/5"}, "children": [], "label": "text", "prov": [{"page_no": 11, "bbox": {"l": 172.27777, "t": 410.63712, "r": 180.18666, "b": 388.59933, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "OTSL", "text": "OTSL"}, {"self_ref": "#/texts/448", "parent": {"cref": "#/pictures/5"}, "children": [], "label": "text", "prov": [{"page_no": 11, "bbox": {"l": 172.27747, "t": 236.22305000000006, "r": 180.18663, "b": 213.25220000000002, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "HTML", "text": "HTML"}, {"self_ref": "#/texts/449", "parent": {"cref": "#/body"}, "children": [], "label": "page_header", "prov": [{"page_no": 12, "bbox": {"l": 134.76499938964844, "t": 698.22900390625, "r": 143.97886657714844, "b": 690.1593017578125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "12", "text": "12"}, {"self_ref": "#/texts/450", "parent": {"cref": "#/body"}, "children": [], "label": "page_header", "prov": [{"page_no": 12, "bbox": {"l": 167.82052612304688, "t": 698.22900390625, "r": 231.72048950195312, "b": 690.1593017578125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 16]}], "orig": "M. Lysak, et al.", "text": "M. Lysak, et al."}, {"self_ref": "#/texts/451", "parent": {"cref": "#/body"}, "children": [], "label": "section_header", "prov": [{"page_no": 12, "bbox": {"l": 134.76499938964844, "t": 674.4510498046875, "r": 219.25479125976562, "b": 663.8826293945312, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 12]}], "orig": "6 Conclusion", "text": "6 Conclusion", "level": 1}, {"self_ref": "#/texts/452", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 134.76499938964844, "t": 645.13623046875, "r": 480.595703125, "b": 588.5181884765625, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 330]}], "orig": "We demonstrated that representing tables in HTML for the task of table structure recognition with Im2Seq models is ill-suited and has serious limitations. Furthermore, we presented in this paper an Optimized Table Structure Language (OTSL) which, when compared to commonly used general purpose languages, has several key benefits.", "text": "We demonstrated that representing tables in HTML for the task of table structure recognition with Im2Seq models is ill-suited and has serious limitations. Furthermore, we presented in this paper an Optimized Table Structure Language (OTSL) which, when compared to commonly used general purpose languages, has several key benefits."}, {"self_ref": "#/texts/453", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 134.76499938964844, "t": 584.5562133789062, "r": 480.59478759765625, "b": 468.1632080078125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 724]}], "orig": "First and foremost, given the same network configuration, inference time for a table-structure prediction is about 2 times faster compared to the conventional HTML approach. This is primarily owed to the shorter sequence length of the OTSL representation. Additional performance benefits can be obtained with HPO (hyper parameter optimization). As we demonstrate in our experiments, models trained on OTSL can be significantly smaller, e.g. by reducing the number of encoder and decoder layers, while preserving comparatively good prediction quality. This can further improve inference performance, yielding 5-6 times faster inference speed in OTSL with prediction quality comparable to models trained on HTML (see Table 1).", "text": "First and foremost, given the same network configuration, inference time for a table-structure prediction is about 2 times faster compared to the conventional HTML approach. This is primarily owed to the shorter sequence length of the OTSL representation. Additional performance benefits can be obtained with HPO (hyper parameter optimization). As we demonstrate in our experiments, models trained on OTSL can be significantly smaller, e.g. by reducing the number of encoder and decoder layers, while preserving comparatively good prediction quality. This can further improve inference performance, yielding 5-6 times faster inference speed in OTSL with prediction quality comparable to models trained on HTML (see Table 1)."}, {"self_ref": "#/texts/454", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 134.76499938964844, "t": 464.201171875, "r": 480.5948181152344, "b": 323.8973388671875, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 926]}], "orig": "Secondly, OTSL has more inherent structure and a significantly restricted vocabulary size. This allows autoregressive models to perform better in the TED metric, but especially with regards to prediction accuracy of the table-cell bounding boxes (see Table 2). As shown in Figure 5, we observe that the OTSL drastically reduces the drift for table cell bounding boxes at high row count and in sparse tables. This leads to more accurate predictions and a significant reduction in post-processing complexity, which is an undesired necessity in HTML-based Im2Seq models. Significant novelty lies in OTSL syntactical rules, which are few, simple and always backwards looking. Each new token can be validated only by analyzing the sequence of previous tokens, without requiring the entire sequence to detect mistakes. This in return allows to perform structural error detection and correction on-the-fly during sequence generation.", "text": "Secondly, OTSL has more inherent structure and a significantly restricted vocabulary size. This allows autoregressive models to perform better in the TED metric, but especially with regards to prediction accuracy of the table-cell bounding boxes (see Table 2). As shown in Figure 5, we observe that the OTSL drastically reduces the drift for table cell bounding boxes at high row count and in sparse tables. This leads to more accurate predictions and a significant reduction in post-processing complexity, which is an undesired necessity in HTML-based Im2Seq models. Significant novelty lies in OTSL syntactical rules, which are few, simple and always backwards looking. Each new token can be validated only by analyzing the sequence of previous tokens, without requiring the entire sequence to detect mistakes. This in return allows to perform structural error detection and correction on-the-fly during sequence generation."}, {"self_ref": "#/texts/455", "parent": {"cref": "#/body"}, "children": [], "label": "section_header", "prov": [{"page_no": 12, "bbox": {"l": 134.76499938964844, "t": 298.1791687011719, "r": 197.68641662597656, "b": 287.61077880859375, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 10]}], "orig": "References", "text": "References", "level": 1}, {"self_ref": "#/texts/456", "parent": {"cref": "#/groups/4"}, "children": [], "label": "list_item", "prov": [{"page_no": 12, "bbox": {"l": 139.37100219726562, "t": 269.1201477050781, "r": 480.5920104980469, "b": 228.12855529785156, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 270]}], "orig": "1. Auer, C., Dolfi, M., Carvalho, A., Ramis, C.B., Staar, P.W.J.: Delivering document conversion as a cloud service with high throughput and responsiveness. CoRR abs/2206.00785 (2022). https://doi.org/10.48550/arXiv.2206.00785 , https://doi.org/10.48550/arXiv.2206.00785", "text": "1. Auer, C., Dolfi, M., Carvalho, A., Ramis, C.B., Staar, P.W.J.: Delivering document conversion as a cloud service with high throughput and responsiveness. CoRR abs/2206.00785 (2022). https://doi.org/10.48550/arXiv.2206.00785 , https://doi.org/10.48550/arXiv.2206.00785", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/457", "parent": {"cref": "#/groups/4"}, "children": [], "label": "list_item", "prov": [{"page_no": 12, "bbox": {"l": 139.3709716796875, "t": 224.4811553955078, "r": 480.5920104980469, "b": 183.53439331054688, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 301]}], "orig": "2. Chen, B., Peng, D., Zhang, J., Ren, Y., Jin, L.: Complex table structure recognition in the wild using transformer and identity matrix-based augmentation. In: Porwal, U., Forn\u00e9s, A., Shafait, F. (eds.) Frontiers in Handwriting Recognition. pp. 545561. Springer International Publishing, Cham (2022)", "text": "2. Chen, B., Peng, D., Zhang, J., Ren, Y., Jin, L.: Complex table structure recognition in the wild using transformer and identity matrix-based augmentation. In: Porwal, U., Forn\u00e9s, A., Shafait, F. (eds.) Frontiers in Handwriting Recognition. pp. 545561. Springer International Publishing, Cham (2022)", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/458", "parent": {"cref": "#/groups/4"}, "children": [], "label": "list_item", "prov": [{"page_no": 12, "bbox": {"l": 139.3709716796875, "t": 179.84115600585938, "r": 480.5873107910156, "b": 160.81239318847656, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 140]}], "orig": "3. Chi, Z., Huang, H., Xu, H.D., Yu, H., Yin, W., Mao, X.L.: Complicated table structure recognition. arXiv preprint arXiv:1908.04729 (2019)", "text": "3. Chi, Z., Huang, H., Xu, H.D., Yu, H., Yin, W., Mao, X.L.: Complicated table structure recognition. arXiv preprint arXiv:1908.04729 (2019)", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/459", "parent": {"cref": "#/groups/4"}, "children": [], "label": "list_item", "prov": [{"page_no": 12, "bbox": {"l": 139.3709716796875, "t": 157.11915588378906, "r": 480.5882568359375, "b": 127.13239288330078, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 204]}], "orig": "4. Deng, Y., Rosenberg, D., Mann, G.: Challenges in end-to-end neural scientific table recognition. In: 2019 International Conference on Document Analysis and Recognition (ICDAR). pp. 894-901. IEEE (2019)", "text": "4. Deng, Y., Rosenberg, D., Mann, G.: Challenges in end-to-end neural scientific table recognition. In: 2019 International Conference on Document Analysis and Recognition (ICDAR). pp. 894-901. IEEE (2019)", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/460", "parent": {"cref": "#/body"}, "children": [], "label": "page_header", "prov": [{"page_no": 13, "bbox": {"l": 194.47799682617188, "t": 698.22900390625, "r": 447.54290771484375, "b": 690.1593017578125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 60]}], "orig": "Optimized Table Tokenization for Table Structure Recognition", "text": "Optimized Table Tokenization for Table Structure Recognition"}, {"self_ref": "#/texts/461", "parent": {"cref": "#/body"}, "children": [], "label": "page_header", "prov": [{"page_no": 13, "bbox": {"l": 471.3756103515625, "t": 698.22900390625, "r": 480.5894775390625, "b": 690.1593017578125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "13", "text": "13"}, {"self_ref": "#/texts/462", "parent": {"cref": "#/groups/5"}, "children": [], "label": "list_item", "prov": [{"page_no": 13, "bbox": {"l": 139.37100219726562, "t": 672.3259887695312, "r": 480.59478759765625, "b": 642.3383178710938, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 203]}], "orig": "5. Kayal, P., Anand, M., Desai, H., Singh, M.: Tables to latex: structure and content extraction from scientific tables. International Journal on Document Analysis and Recognition (IJDAR) pp. 1-10 (2022)", "text": "5. Kayal, P., Anand, M., Desai, H., Singh, M.: Tables to latex: structure and content extraction from scientific tables. International Journal on Document Analysis and Recognition (IJDAR) pp. 1-10 (2022)", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/463", "parent": {"cref": "#/groups/5"}, "children": [], "label": "list_item", "prov": [{"page_no": 13, "bbox": {"l": 139.37100219726562, "t": 639.4380493164062, "r": 480.5928649902344, "b": 598.4913940429688, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 264]}], "orig": "6. Lee, E., Kwon, J., Yang, H., Park, J., Lee, S., Koo, H.I., Cho, N.I.: Table structure recognition based on grid shape graph. In: 2022 Asia-Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC). pp. 18681873. IEEE (2022)", "text": "6. Lee, E., Kwon, J., Yang, H., Park, J., Lee, S., Koo, H.I., Cho, N.I.: Table structure recognition based on grid shape graph. In: 2022 Asia-Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC). pp. 18681873. IEEE (2022)", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/464", "parent": {"cref": "#/groups/5"}, "children": [], "label": "list_item", "prov": [{"page_no": 13, "bbox": {"l": 139.37100219726562, "t": 595.5911254882812, "r": 480.5901184082031, "b": 576.5624389648438, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 131]}], "orig": "7. Li, M., Cui, L., Huang, S., Wei, F., Zhou, M., Li, Z.: Tablebank: A benchmark dataset for table detection and recognition (2019)", "text": "7. Li, M., Cui, L., Huang, S., Wei, F., Zhou, M., Li, Z.: Tablebank: A benchmark dataset for table detection and recognition (2019)", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/465", "parent": {"cref": "#/groups/5"}, "children": [], "label": "list_item", "prov": [{"page_no": 13, "bbox": {"l": 139.37100219726562, "t": 573.6611328125, "r": 480.5947265625, "b": 521.7116088867188, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 345]}], "orig": "8. Livathinos, N., Berrospi, C., Lysak, M., Kuropiatnyk, V., Nassar, A., Carvalho, A., Dolfi, M., Auer, C., Dinkla, K., Staar, P.: Robust pdf document conversion using recurrent neural networks. Proceedings of the AAAI Conference on Artificial Intelligence 35 (17), 15137-15145 (May 2021), https://ojs.aaai.org/index.php/ AAAI/article/view/17777", "text": "8. Livathinos, N., Berrospi, C., Lysak, M., Kuropiatnyk, V., Nassar, A., Carvalho, A., Dolfi, M., Auer, C., Dinkla, K., Staar, P.: Robust pdf document conversion using recurrent neural networks. Proceedings of the AAAI Conference on Artificial Intelligence 35 (17), 15137-15145 (May 2021), https://ojs.aaai.org/index.php/ AAAI/article/view/17777", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/466", "parent": {"cref": "#/groups/5"}, "children": [], "label": "list_item", "prov": [{"page_no": 13, "bbox": {"l": 139.37100219726562, "t": 518.8551635742188, "r": 480.5938720703125, "b": 488.8674621582031, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 234]}], "orig": "9. Nassar, A., Livathinos, N., Lysak, M., Staar, P.: Tableformer: Table structure understanding with transformers. In: Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). pp. 4614-4623 (June 2022)", "text": "9. Nassar, A., Livathinos, N., Lysak, M., Staar, P.: Tableformer: Table structure understanding with transformers. In: Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). pp. 4614-4623 (June 2022)", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/467", "parent": {"cref": "#/groups/5"}, "children": [], "label": "list_item", "prov": [{"page_no": 13, "bbox": {"l": 134.76400756835938, "t": 485.96722412109375, "r": 480.5937194824219, "b": 423.05767822265625, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 413]}], "orig": "10. Pfitzmann, B., Auer, C., Dolfi, M., Nassar, A.S., Staar, P.W.J.: Doclaynet: A large human-annotated dataset for document-layout segmentation. In: Zhang, A., Rangwala, H. (eds.) KDD '22: The 28th ACM SIGKDD Conference on Knowledge Discovery and Data Mining, Washington, DC, USA, August 14 - 18, 2022. pp. 3743-3751. ACM (2022). https://doi.org/10.1145/3534678.3539043 , https:// doi.org/10.1145/3534678.3539043", "text": "10. Pfitzmann, B., Auer, C., Dolfi, M., Nassar, A.S., Staar, P.W.J.: Doclaynet: A large human-annotated dataset for document-layout segmentation. In: Zhang, A., Rangwala, H. (eds.) KDD '22: The 28th ACM SIGKDD Conference on Knowledge Discovery and Data Mining, Washington, DC, USA, August 14 - 18, 2022. pp. 3743-3751. ACM (2022). https://doi.org/10.1145/3534678.3539043 , https:// doi.org/10.1145/3534678.3539043", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/468", "parent": {"cref": "#/groups/5"}, "children": [], "label": "list_item", "prov": [{"page_no": 13, "bbox": {"l": 134.76400756835938, "t": 420.2022705078125, "r": 480.59295654296875, "b": 379.2555236816406, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 295]}], "orig": "11. Prasad, D., Gadpal, A., Kapadni, K., Visave, M., Sultanpure, K.: Cascadetabnet: An approach for end to end table detection and structure recognition from imagebased documents. In: Proceedings of the IEEE/CVF conference on computer vision and pattern recognition workshops. pp. 572-573 (2020)", "text": "11. Prasad, D., Gadpal, A., Kapadni, K., Visave, M., Sultanpure, K.: Cascadetabnet: An approach for end to end table detection and structure recognition from imagebased documents. In: Proceedings of the IEEE/CVF conference on computer vision and pattern recognition workshops. pp. 572-573 (2020)", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/469", "parent": {"cref": "#/groups/5"}, "children": [], "label": "list_item", "prov": [{"page_no": 13, "bbox": {"l": 134.76400756835938, "t": 376.35528564453125, "r": 480.5946960449219, "b": 335.4085388183594, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 281]}], "orig": "12. Schreiber, S., Agne, S., Wolf, I., Dengel, A., Ahmed, S.: Deepdesrt: Deep learning for detection and structure recognition of tables in document images. In: 2017 14th IAPR international conference on document analysis and recognition (ICDAR). vol. 1, pp. 1162-1167. IEEE (2017)", "text": "12. Schreiber, S., Agne, S., Wolf, I., Dengel, A., Ahmed, S.: Deepdesrt: Deep learning for detection and structure recognition of tables in document images. In: 2017 14th IAPR international conference on document analysis and recognition (ICDAR). vol. 1, pp. 1162-1167. IEEE (2017)", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/470", "parent": {"cref": "#/groups/5"}, "children": [], "label": "list_item", "prov": [{"page_no": 13, "bbox": {"l": 134.76400756835938, "t": 332.50830078125, "r": 480.5937194824219, "b": 291.5167236328125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 275]}], "orig": "13. Siddiqui, S.A., Fateh, I.A., Rizvi, S.T.R., Dengel, A., Ahmed, S.: Deeptabstr: Deep learning based table structure recognition. In: 2019 International Conference on Document Analysis and Recognition (ICDAR). pp. 1403-1409 (2019). https:// doi.org/10.1109/ICDAR.2019.00226", "text": "13. Siddiqui, S.A., Fateh, I.A., Rizvi, S.T.R., Dengel, A., Ahmed, S.: Deeptabstr: Deep learning based table structure recognition. In: 2019 International Conference on Document Analysis and Recognition (ICDAR). pp. 1403-1409 (2019). https:// doi.org/10.1109/ICDAR.2019.00226", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/471", "parent": {"cref": "#/groups/5"}, "children": [], "label": "list_item", "prov": [{"page_no": 13, "bbox": {"l": 134.76400756835938, "t": 288.66131591796875, "r": 480.5928649902344, "b": 247.7145538330078, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 241]}], "orig": "14. Smock, B., Pesala, R., Abraham, R.: PubTables-1M: Towards comprehensive table extraction from unstructured documents. In: Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). pp. 4634-4642 (June 2022)", "text": "14. Smock, B., Pesala, R., Abraham, R.: PubTables-1M: Towards comprehensive table extraction from unstructured documents. In: Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). pp. 4634-4642 (June 2022)", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/472", "parent": {"cref": "#/groups/5"}, "children": [], "label": "list_item", "prov": [{"page_no": 13, "bbox": {"l": 134.76400756835938, "t": 244.81431579589844, "r": 480.5958251953125, "b": 181.90472412109375, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 405]}], "orig": "15. Staar, P.W.J., Dolfi, M., Auer, C., Bekas, C.: Corpus conversion service: A machine learning platform to ingest documents at scale. In: Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining. pp. 774-782. KDD '18, Association for Computing Machinery, New York, NY, USA (2018). https://doi.org/10.1145/3219819.3219834 , https://doi.org/10. 1145/3219819.3219834", "text": "15. Staar, P.W.J., Dolfi, M., Auer, C., Bekas, C.: Corpus conversion service: A machine learning platform to ingest documents at scale. In: Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining. pp. 774-782. KDD '18, Association for Computing Machinery, New York, NY, USA (2018). https://doi.org/10.1145/3219819.3219834 , https://doi.org/10. 1145/3219819.3219834", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/473", "parent": {"cref": "#/groups/5"}, "children": [], "label": "list_item", "prov": [{"page_no": 13, "bbox": {"l": 134.76400756835938, "t": 179.04931640625, "r": 480.5954284667969, "b": 160.0205535888672, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 96]}], "orig": "16. Wang, X.: Tabular Abstraction, Editing, and Formatting. Ph.D. thesis, CAN (1996), aAINN09397", "text": "16. Wang, X.: Tabular Abstraction, Editing, and Formatting. Ph.D. thesis, CAN (1996), aAINN09397", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/474", "parent": {"cref": "#/groups/5"}, "children": [], "label": "list_item", "prov": [{"page_no": 13, "bbox": {"l": 134.76400756835938, "t": 157.1203155517578, "r": 480.5911865234375, "b": 127.13255310058594, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 195]}], "orig": "17. Xue, W., Li, Q., Tao, D.: Res2tim: Reconstruct syntactic structures from table images. In: 2019 International Conference on Document Analysis and Recognition (ICDAR). pp. 749-755. IEEE (2019)", "text": "17. Xue, W., Li, Q., Tao, D.: Res2tim: Reconstruct syntactic structures from table images. In: 2019 International Conference on Document Analysis and Recognition (ICDAR). pp. 749-755. IEEE (2019)", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/475", "parent": {"cref": "#/body"}, "children": [], "label": "page_header", "prov": [{"page_no": 14, "bbox": {"l": 134.76499938964844, "t": 698.22900390625, "r": 143.97886657714844, "b": 690.1593017578125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "14", "text": "14"}, {"self_ref": "#/texts/476", "parent": {"cref": "#/body"}, "children": [], "label": "page_header", "prov": [{"page_no": 14, "bbox": {"l": 167.82052612304688, "t": 698.22900390625, "r": 231.72048950195312, "b": 690.1593017578125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 16]}], "orig": "M. Lysak, et al.", "text": "M. Lysak, et al."}, {"self_ref": "#/texts/477", "parent": {"cref": "#/groups/6"}, "children": [], "label": "list_item", "prov": [{"page_no": 14, "bbox": {"l": 134.76499938964844, "t": 672.3259887695312, "r": 480.59112548828125, "b": 642.3383178710938, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 223]}], "orig": "18. Xue, W., Yu, B., Wang, W., Tao, D., Li, Q.: Tgrnet: A table graph reconstruction network for table structure recognition. In: Proceedings of the IEEE/CVF International Conference on Computer Vision. pp. 1295-1304 (2021)", "text": "18. Xue, W., Yu, B., Wang, W., Tao, D., Li, Q.: Tgrnet: A table graph reconstruction network for table structure recognition. In: Proceedings of the IEEE/CVF International Conference on Computer Vision. pp. 1295-1304 (2021)", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/478", "parent": {"cref": "#/groups/6"}, "children": [], "label": "list_item", "prov": [{"page_no": 14, "bbox": {"l": 134.76499938964844, "t": 639.4490356445312, "r": 480.5946960449219, "b": 598.45751953125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 269]}], "orig": "19. Ye, J., Qi, X., He, Y., Chen, Y., Gu, D., Gao, P., Xiao, R.: Pingan-vcgroup's solution for icdar 2021 competition on scientific literature parsing task b: Table recognition to html (2021). https://doi.org/10.48550/ARXIV.2105.01848 , https://arxiv.org/abs/2105.01848", "text": "19. Ye, J., Qi, X., He, Y., Chen, Y., Gu, D., Gao, P., Xiao, R.: Pingan-vcgroup's solution for icdar 2021 competition on scientific literature parsing task b: Table recognition to html (2021). https://doi.org/10.48550/ARXIV.2105.01848 , https://arxiv.org/abs/2105.01848", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/479", "parent": {"cref": "#/groups/6"}, "children": [], "label": "list_item", "prov": [{"page_no": 14, "bbox": {"l": 134.7649688720703, "t": 595.6130981445312, "r": 480.5935363769531, "b": 576.5853881835938, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 147]}], "orig": "20. Zhang, Z., Zhang, J., Du, J., Wang, F.: Split, embed and merge: An accurate table structure recognizer. Pattern Recognition 126 , 108565 (2022)", "text": "20. Zhang, Z., Zhang, J., Du, J., Wang, F.: Split, embed and merge: An accurate table structure recognizer. Pattern Recognition 126 , 108565 (2022)", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/480", "parent": {"cref": "#/groups/6"}, "children": [], "label": "list_item", "prov": [{"page_no": 14, "bbox": {"l": 134.76495361328125, "t": 573.6961059570312, "r": 480.5930480957031, "b": 521.74560546875, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 329]}], "orig": "21. Zheng, X., Burdick, D., Popa, L., Zhong, X., Wang, N.X.R.: Global table extractor (gte): A framework for joint table identification and cell structure recognition using visual context. In: 2021 IEEE Winter Conference on Applications of Computer Vision (WACV). pp. 697-706 (2021). https://doi.org/10.1109/WACV48630.2021. 00074", "text": "21. Zheng, X., Burdick, D., Popa, L., Zhong, X., Wang, N.X.R.: Global table extractor (gte): A framework for joint table identification and cell structure recognition using visual context. In: 2021 IEEE Winter Conference on Applications of Computer Vision (WACV). pp. 697-706 (2021). https://doi.org/10.1109/WACV48630.2021. 00074", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/481", "parent": {"cref": "#/groups/6"}, "children": [], "label": "list_item", "prov": [{"page_no": 14, "bbox": {"l": 134.76495361328125, "t": 518.9011840820312, "r": 480.5955810546875, "b": 477.9544982910156, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 259]}], "orig": "22. Zhong, X., ShafieiBavani, E., Jimeno Yepes, A.: Image-based table recognition: Data, model, and evaluation. In: Vedaldi, A., Bischof, H., Brox, T., Frahm, J.M. (eds.) Computer Vision - ECCV 2020. pp. 564-580. Springer International Publishing, Cham (2020)", "text": "22. Zhong, X., ShafieiBavani, E., Jimeno Yepes, A.: Image-based table recognition: Data, model, and evaluation. In: Vedaldi, A., Bischof, H., Brox, T., Frahm, J.M. (eds.) Computer Vision - ECCV 2020. pp. 564-580. Springer International Publishing, Cham (2020)", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/482", "parent": {"cref": "#/groups/6"}, "children": [], "label": "list_item", "prov": [{"page_no": 14, "bbox": {"l": 134.76495361328125, "t": 475.0652770996094, "r": 480.59454345703125, "b": 445.0785217285156, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 206]}], "orig": "23. Zhong, X., Tang, J., Yepes, A.J.: Publaynet: largest dataset ever for document layout analysis. In: 2019 International Conference on Document Analysis and Recognition (ICDAR). pp. 1015-1022. IEEE (2019)", "text": "23. Zhong, X., Tang, J., Yepes, A.J.: Publaynet: largest dataset ever for document layout analysis. In: 2019 International Conference on Document Analysis and Recognition (ICDAR). pp. 1015-1022. IEEE (2019)", "enumerated": false, "marker": "-"}], "pictures": [{"self_ref": "#/pictures/0", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/14"}, {"cref": "#/texts/15"}, {"cref": "#/texts/16"}, {"cref": "#/texts/17"}, {"cref": "#/texts/18"}, {"cref": "#/texts/19"}, {"cref": "#/texts/20"}, {"cref": "#/texts/21"}, {"cref": "#/texts/22"}, {"cref": "#/texts/23"}, {"cref": "#/texts/24"}, {"cref": "#/texts/25"}, {"cref": "#/texts/26"}, {"cref": "#/texts/27"}, {"cref": "#/texts/28"}, {"cref": "#/texts/29"}, {"cref": "#/texts/30"}, {"cref": "#/texts/31"}, {"cref": "#/texts/32"}, {"cref": "#/texts/33"}, {"cref": "#/texts/34"}, {"cref": "#/texts/35"}, {"cref": "#/texts/36"}, {"cref": "#/texts/37"}, {"cref": "#/texts/38"}, {"cref": "#/texts/39"}, {"cref": "#/texts/40"}, {"cref": "#/texts/41"}, {"cref": "#/texts/42"}, {"cref": "#/texts/43"}, {"cref": "#/texts/44"}, {"cref": "#/texts/45"}, {"cref": "#/texts/46"}, {"cref": "#/texts/47"}, {"cref": "#/texts/48"}, {"cref": "#/texts/49"}, {"cref": "#/texts/50"}, {"cref": "#/texts/51"}, {"cref": "#/texts/52"}, {"cref": "#/texts/53"}, {"cref": "#/texts/54"}, {"cref": "#/texts/55"}, {"cref": "#/texts/56"}, {"cref": "#/texts/57"}, {"cref": "#/texts/58"}, {"cref": "#/texts/59"}, {"cref": "#/texts/60"}, {"cref": "#/texts/61"}, {"cref": "#/texts/62"}, {"cref": "#/texts/63"}, {"cref": "#/texts/64"}, {"cref": "#/texts/65"}, {"cref": "#/texts/66"}, {"cref": "#/texts/67"}, {"cref": "#/texts/68"}, {"cref": "#/texts/69"}, {"cref": "#/texts/70"}, {"cref": "#/texts/71"}, {"cref": "#/texts/72"}, {"cref": "#/texts/73"}, {"cref": "#/texts/74"}, {"cref": "#/texts/75"}, {"cref": "#/texts/76"}, {"cref": "#/texts/77"}, {"cref": "#/texts/78"}, {"cref": "#/texts/79"}, {"cref": "#/texts/80"}, {"cref": "#/texts/81"}, {"cref": "#/texts/82"}, {"cref": "#/texts/83"}, {"cref": "#/texts/84"}, {"cref": "#/texts/85"}, {"cref": "#/texts/86"}, {"cref": "#/texts/87"}, {"cref": "#/texts/88"}, {"cref": "#/texts/89"}, {"cref": "#/texts/90"}, {"cref": "#/texts/91"}, {"cref": "#/texts/92"}, {"cref": "#/texts/93"}, {"cref": "#/texts/94"}, {"cref": "#/texts/95"}, {"cref": "#/texts/96"}, {"cref": "#/texts/97"}, {"cref": "#/texts/98"}, {"cref": "#/texts/99"}, {"cref": "#/texts/100"}, {"cref": "#/texts/101"}, {"cref": "#/texts/102"}, {"cref": "#/texts/103"}, {"cref": "#/texts/104"}, {"cref": "#/texts/105"}, {"cref": "#/texts/106"}, {"cref": "#/texts/107"}, {"cref": "#/texts/108"}, {"cref": "#/texts/109"}, {"cref": "#/texts/110"}, {"cref": "#/texts/111"}, {"cref": "#/texts/112"}, {"cref": "#/texts/113"}, {"cref": "#/texts/114"}, {"cref": "#/texts/115"}, {"cref": "#/texts/116"}, {"cref": "#/texts/117"}, {"cref": "#/texts/118"}, {"cref": "#/texts/119"}], "label": "picture", "prov": [{"page_no": 2, "bbox": {"l": 148.45364379882812, "t": 583.625732421875, "r": 464.3608093261719, "b": 366.1537780761719, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 574]}], "captions": [{"cref": "#/texts/13"}], "references": [], "footnotes": [], "image": null, "annotations": []}, {"self_ref": "#/pictures/1", "parent": {"cref": "#/body"}, "children": [], "label": "picture", "prov": [{"page_no": 5, "bbox": {"l": 137.41448974609375, "t": 558.4876708984375, "r": 476.5608215332031, "b": 451.7695007324219, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 73]}], "captions": [{"cref": "#/texts/139"}], "references": [], "footnotes": [], "image": null, "annotations": []}, {"self_ref": "#/pictures/2", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/161"}, {"cref": "#/texts/162"}, {"cref": "#/texts/163"}, {"cref": "#/texts/164"}, {"cref": "#/texts/165"}, {"cref": "#/texts/166"}, {"cref": "#/texts/167"}, {"cref": "#/texts/168"}, {"cref": "#/texts/169"}, {"cref": "#/texts/170"}, {"cref": "#/texts/171"}, {"cref": "#/texts/172"}, {"cref": "#/texts/173"}, {"cref": "#/texts/174"}, {"cref": "#/texts/175"}, {"cref": "#/texts/176"}, {"cref": "#/texts/177"}, {"cref": "#/texts/178"}, {"cref": "#/texts/179"}, {"cref": "#/texts/180"}, {"cref": "#/texts/181"}, {"cref": "#/texts/182"}, {"cref": "#/texts/183"}, {"cref": "#/texts/184"}, {"cref": "#/texts/185"}, {"cref": "#/texts/186"}, {"cref": "#/texts/187"}, {"cref": "#/texts/188"}, {"cref": "#/texts/189"}, {"cref": "#/texts/190"}, {"cref": "#/texts/191"}, {"cref": "#/texts/192"}, {"cref": "#/texts/193"}, {"cref": "#/texts/194"}, {"cref": "#/texts/195"}, {"cref": "#/texts/196"}, {"cref": "#/texts/197"}, {"cref": "#/texts/198"}, {"cref": "#/texts/199"}, {"cref": "#/texts/200"}, {"cref": "#/texts/201"}, {"cref": "#/texts/202"}, {"cref": "#/texts/203"}, {"cref": "#/texts/204"}, {"cref": "#/texts/205"}, {"cref": "#/texts/206"}, {"cref": "#/texts/207"}, {"cref": "#/texts/208"}, {"cref": "#/texts/209"}, {"cref": "#/texts/210"}, {"cref": "#/texts/211"}, {"cref": "#/texts/212"}, {"cref": "#/texts/213"}, {"cref": "#/texts/214"}, {"cref": "#/texts/215"}, {"cref": "#/texts/216"}, {"cref": "#/texts/217"}, {"cref": "#/texts/218"}, {"cref": "#/texts/219"}, {"cref": "#/texts/220"}, {"cref": "#/texts/221"}, {"cref": "#/texts/222"}, {"cref": "#/texts/223"}, {"cref": "#/texts/224"}, {"cref": "#/texts/225"}, {"cref": "#/texts/226"}, {"cref": "#/texts/227"}, {"cref": "#/texts/228"}], "label": "picture", "prov": [{"page_no": 7, "bbox": {"l": 164.65028381347656, "t": 628.202880859375, "r": 449.5505676269531, "b": 511.6590576171875, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 207]}], "captions": [{"cref": "#/texts/160"}], "references": [], "footnotes": [], "image": null, "annotations": []}, {"self_ref": "#/pictures/3", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/248"}, {"cref": "#/texts/249"}, {"cref": "#/texts/250"}, {"cref": "#/texts/251"}, {"cref": "#/texts/252"}, {"cref": "#/texts/253"}, {"cref": "#/texts/254"}, {"cref": "#/texts/255"}, {"cref": "#/texts/256"}, {"cref": "#/texts/257"}, {"cref": "#/texts/258"}, {"cref": "#/texts/259"}, {"cref": "#/texts/260"}, {"cref": "#/texts/261"}, {"cref": "#/texts/262"}, {"cref": "#/texts/263"}, {"cref": "#/texts/264"}, {"cref": "#/texts/265"}, {"cref": "#/texts/266"}, {"cref": "#/texts/267"}, {"cref": "#/texts/268"}, {"cref": "#/texts/269"}, {"cref": "#/texts/270"}, {"cref": "#/texts/271"}, {"cref": "#/texts/272"}, {"cref": "#/texts/273"}, {"cref": "#/texts/274"}, {"cref": "#/texts/275"}, {"cref": "#/texts/276"}, {"cref": "#/texts/277"}, {"cref": "#/texts/278"}, {"cref": "#/texts/279"}, {"cref": "#/texts/280"}, {"cref": "#/texts/281"}, {"cref": "#/texts/282"}, {"cref": "#/texts/283"}, {"cref": "#/texts/284"}, {"cref": "#/texts/285"}, {"cref": "#/texts/286"}, {"cref": "#/texts/287"}, {"cref": "#/texts/288"}, {"cref": "#/texts/289"}, {"cref": "#/texts/290"}, {"cref": "#/texts/291"}, {"cref": "#/texts/292"}, {"cref": "#/texts/293"}, {"cref": "#/texts/294"}, {"cref": "#/texts/295"}, {"cref": "#/texts/296"}, {"cref": "#/texts/297"}, {"cref": "#/texts/298"}, {"cref": "#/texts/299"}, {"cref": "#/texts/300"}, {"cref": "#/texts/301"}, {"cref": "#/texts/302"}, {"cref": "#/texts/303"}, {"cref": "#/texts/304"}, {"cref": "#/texts/305"}, {"cref": "#/texts/306"}, {"cref": "#/texts/307"}, {"cref": "#/texts/308"}, {"cref": "#/texts/309"}, {"cref": "#/texts/310"}, {"cref": "#/texts/311"}, {"cref": "#/texts/312"}, {"cref": "#/texts/313"}, {"cref": "#/texts/314"}, {"cref": "#/texts/315"}, {"cref": "#/texts/316"}, {"cref": "#/texts/317"}, {"cref": "#/texts/318"}, {"cref": "#/texts/319"}], "label": "picture", "prov": [{"page_no": 8, "bbox": {"l": 140.70968627929688, "t": 283.9361572265625, "r": 472.73382568359375, "b": 198.32281494140625, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 104]}], "captions": [{"cref": "#/texts/247"}], "references": [], "footnotes": [], "image": null, "annotations": []}, {"self_ref": "#/pictures/4", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/336"}, {"cref": "#/texts/337"}, {"cref": "#/texts/338"}, {"cref": "#/texts/339"}, {"cref": "#/texts/340"}, {"cref": "#/texts/341"}, {"cref": "#/texts/342"}, {"cref": "#/texts/343"}, {"cref": "#/texts/344"}, {"cref": "#/texts/345"}, {"cref": "#/texts/346"}, {"cref": "#/texts/347"}, {"cref": "#/texts/348"}, {"cref": "#/texts/349"}, {"cref": "#/texts/350"}, {"cref": "#/texts/351"}, {"cref": "#/texts/352"}, {"cref": "#/texts/353"}, {"cref": "#/texts/354"}, {"cref": "#/texts/355"}, {"cref": "#/texts/356"}, {"cref": "#/texts/357"}, {"cref": "#/texts/358"}, {"cref": "#/texts/359"}, {"cref": "#/texts/360"}, {"cref": "#/texts/361"}, {"cref": "#/texts/362"}, {"cref": "#/texts/363"}, {"cref": "#/texts/364"}, {"cref": "#/texts/365"}, {"cref": "#/texts/366"}, {"cref": "#/texts/367"}, {"cref": "#/texts/368"}, {"cref": "#/texts/369"}, {"cref": "#/texts/370"}, {"cref": "#/texts/371"}, {"cref": "#/texts/372"}, {"cref": "#/texts/373"}, {"cref": "#/texts/374"}, {"cref": "#/texts/375"}, {"cref": "#/texts/376"}, {"cref": "#/texts/377"}, {"cref": "#/texts/378"}, {"cref": "#/texts/379"}, {"cref": "#/texts/380"}, {"cref": "#/texts/381"}, {"cref": "#/texts/382"}, {"cref": "#/texts/383"}, {"cref": "#/texts/384"}, {"cref": "#/texts/385"}, {"cref": "#/texts/386"}, {"cref": "#/texts/387"}, {"cref": "#/texts/388"}, {"cref": "#/texts/389"}, {"cref": "#/texts/390"}, {"cref": "#/texts/391"}, {"cref": "#/texts/392"}, {"cref": "#/texts/393"}, {"cref": "#/texts/394"}, {"cref": "#/texts/395"}, {"cref": "#/texts/396"}, {"cref": "#/texts/397"}, {"cref": "#/texts/398"}, {"cref": "#/texts/399"}, {"cref": "#/texts/400"}, {"cref": "#/texts/401"}, {"cref": "#/texts/402"}, {"cref": "#/texts/403"}, {"cref": "#/texts/404"}, {"cref": "#/texts/405"}, {"cref": "#/texts/406"}, {"cref": "#/texts/407"}, {"cref": "#/texts/408"}, {"cref": "#/texts/409"}, {"cref": "#/texts/410"}, {"cref": "#/texts/411"}, {"cref": "#/texts/412"}, {"cref": "#/texts/413"}, {"cref": "#/texts/414"}, {"cref": "#/texts/415"}, {"cref": "#/texts/416"}, {"cref": "#/texts/417"}, {"cref": "#/texts/418"}, {"cref": "#/texts/419"}, {"cref": "#/texts/420"}, {"cref": "#/texts/421"}, {"cref": "#/texts/422"}, {"cref": "#/texts/423"}, {"cref": "#/texts/424"}, {"cref": "#/texts/425"}, {"cref": "#/texts/426"}, {"cref": "#/texts/427"}, {"cref": "#/texts/428"}, {"cref": "#/texts/429"}, {"cref": "#/texts/430"}, {"cref": "#/texts/431"}, {"cref": "#/texts/432"}], "label": "picture", "prov": [{"page_no": 10, "bbox": {"l": 162.67430114746094, "t": 347.37744140625, "r": 451.70062255859375, "b": 128.78643798828125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 270]}], "captions": [{"cref": "#/texts/335"}], "references": [], "footnotes": [], "image": null, "annotations": []}, {"self_ref": "#/pictures/5", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/438"}, {"cref": "#/texts/439"}, {"cref": "#/texts/440"}, {"cref": "#/texts/441"}, {"cref": "#/texts/442"}, {"cref": "#/texts/443"}, {"cref": "#/texts/444"}, {"cref": "#/texts/445"}, {"cref": "#/texts/446"}, {"cref": "#/texts/447"}, {"cref": "#/texts/448"}], "label": "picture", "prov": [{"page_no": 11, "bbox": {"l": 168.39285278320312, "t": 610.0335083007812, "r": 447.35137939453125, "b": 157.99432373046875, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 390]}], "captions": [{"cref": "#/texts/437"}], "references": [], "footnotes": [], "image": null, "annotations": []}], "tables": [{"self_ref": "#/tables/0", "parent": {"cref": "#/body"}, "children": [], "label": "table", "prov": [{"page_no": 9, "bbox": {"l": 139.66845703125, "t": 454.4252014160156, "r": 475.00372314453125, "b": 322.5278625488281, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [{"cref": "#/texts/326"}], "references": [], "footnotes": [], "image": null, "data": {"table_cells": [{"bbox": {"l": 160.3699951171875, "t": 450.2650451660156, "r": 168.0479278564453, "b": 442.1952819824219, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "#", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 207.9739990234375, "t": 450.2650451660156, "r": 215.6519317626953, "b": 442.1952819824219, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "#", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 239.79800415039062, "t": 444.7860412597656, "r": 278.3176574707031, "b": 436.7162780761719, "coord_origin": "BOTTOMLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Language", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 324.6700134277344, "t": 450.2650451660156, "r": 348.2641906738281, "b": 442.1952819824219, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 3, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 6, "text": "TEDs", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 396.27099609375, "t": 450.2650451660156, "r": 417.1268310546875, "b": 442.1952819824219, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "mAP", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 430.77099609375, "t": 450.2650451660156, "r": 467.1423034667969, "b": 442.1952819824219, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "Inference", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 144.5919952392578, "t": 437.3140563964844, "r": 183.82806396484375, "b": 429.2442932128906, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "enc-layers", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 192.1949920654297, "t": 437.3140563964844, "r": 231.43106079101562, "b": 429.2442932128906, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "dec-layers", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 286.6860046386719, "t": 437.3140563964844, "r": 312.3326110839844, "b": 429.2442932128906, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "simple", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 320.7019958496094, "t": 437.3140563964844, "r": 353.7198791503906, "b": 429.2442932128906, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "complex", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 369.3059997558594, "t": 437.3140563964844, "r": 379.03094482421875, "b": 429.2442932128906, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "all", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 394.927001953125, "t": 439.3060607910156, "r": 418.4727783203125, "b": 431.2362976074219, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "(0.75)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 427.14801025390625, "t": 439.3060607910156, "r": 470.76055908203125, "b": 431.2362976074219, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "time (secs)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 161.906005859375, "t": 418.4840393066406, "r": 166.512939453125, "b": 410.4142761230469, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.50900268554688, "t": 418.4840393066406, "r": 214.11593627929688, "b": 410.4142761230469, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17599487304688, "t": 423.96405029296875, "r": 272.9395446777344, "b": 402.9422912597656, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.0169982910156, "t": 423.96405029296875, "r": 310.0037536621094, "b": 402.9422912597656, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.965 0.969", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.7170104980469, "t": 423.96405029296875, "r": 347.7037658691406, "b": 402.9422912597656, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.934 0.927", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 363.6759948730469, "t": 423.96405029296875, "r": 384.6627502441406, "b": 402.9422912597656, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.955 0.955", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 396.20599365234375, "t": 424.0268249511719, "r": 417.1927490234375, "b": 402.9422912597656, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.88 0.857", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.5270080566406, "t": 424.0268249511719, "r": 458.3842468261719, "b": 402.9422912597656, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "2.73 5.39", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 161.906005859375, "t": 392.18304443359375, "r": 166.512939453125, "b": 384.11328125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.50900268554688, "t": 392.18304443359375, "r": 214.11593627929688, "b": 384.11328125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17599487304688, "t": 397.66204833984375, "r": 272.9395446777344, "b": 376.64129638671875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.0169982910156, "t": 397.66204833984375, "r": 310.0037536621094, "b": 376.64129638671875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.938 0.952", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.7170104980469, "t": 397.66204833984375, "r": 347.7037658691406, "b": 389.59228515625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.904", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 363.6759948730469, "t": 397.66204833984375, "r": 384.6627502441406, "b": 389.59228515625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.927", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.6180114746094, "t": 397.7248229980469, "r": 418.77886962890625, "b": 389.79852294921875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.853", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.5270080566406, "t": 397.7248229980469, "r": 458.3842468261719, "b": 389.79852294921875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "1.97", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 161.906005859375, "t": 365.8820495605469, "r": 166.512939453125, "b": 357.8122863769531, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.50900268554688, "t": 365.8820495605469, "r": 214.11593627929688, "b": 357.8122863769531, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 246.7100067138672, "t": 371.3610534667969, "r": 271.4052734375, "b": 363.2912902832031, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.0169982910156, "t": 371.3610534667969, "r": 310.0037536621094, "b": 350.3403015136719, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.923 0.945", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.7170104980469, "t": 384.7110595703125, "r": 347.7037658691406, "b": 363.2912902832031, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.909 0.897", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 362.0880126953125, "t": 384.7738342285156, "r": 386.2488708496094, "b": 376.8475341796875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.938", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 396.20599365234375, "t": 384.7110595703125, "r": 417.1927490234375, "b": 376.64129638671875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.843", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.7669982910156, "t": 384.7110595703125, "r": 457.1468200683594, "b": 376.64129638671875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "3.77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17599487304688, "t": 358.4100646972656, "r": 272.9395446777344, "b": 350.3403015136719, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.7170104980469, "t": 358.4100646972656, "r": 347.7037658691406, "b": 350.3403015136719, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.901", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 362.0880126953125, "t": 371.3610534667969, "r": 386.2488708496094, "b": 350.5465393066406, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.915 0.931", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.6180114746094, "t": 371.423828125, "r": 418.77886962890625, "b": 350.3403015136719, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.859 0.834", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.5270080566406, "t": 371.423828125, "r": 458.3842468261719, "b": 350.3403015136719, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "1.91 3.81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 161.906005859375, "t": 339.5800476074219, "r": 166.512939453125, "b": 331.5102844238281, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.50900268554688, "t": 339.5800476074219, "r": 214.11593627929688, "b": 331.5102844238281, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17599487304688, "t": 345.06005859375, "r": 272.9395446777344, "b": 324.0382995605469, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.0169982910156, "t": 345.06005859375, "r": 310.0037536621094, "b": 324.0382995605469, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.952 0.944", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.7170104980469, "t": 345.06005859375, "r": 347.7037658691406, "b": 324.0382995605469, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.92 0.903", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 362.0880126953125, "t": 345.1228332519531, "r": 386.2488708496094, "b": 324.0382995605469, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.942 0.931", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.6180114746094, "t": 345.1228332519531, "r": 418.77886962890625, "b": 324.0382995605469, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.857 0.824", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.5270080566406, "t": 345.1228332519531, "r": 458.3842468261719, "b": 324.0382995605469, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "1.22 2", "column_header": false, "row_header": false, "row_section": false}], "num_rows": 7, "num_cols": 8, "grid": [[{"bbox": {"l": 160.3699951171875, "t": 450.2650451660156, "r": 168.0479278564453, "b": 442.1952819824219, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "#", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 207.9739990234375, "t": 450.2650451660156, "r": 215.6519317626953, "b": 442.1952819824219, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "#", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 239.79800415039062, "t": 444.7860412597656, "r": 278.3176574707031, "b": 436.7162780761719, "coord_origin": "BOTTOMLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Language", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 324.6700134277344, "t": 450.2650451660156, "r": 348.2641906738281, "b": 442.1952819824219, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 3, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 6, "text": "TEDs", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 324.6700134277344, "t": 450.2650451660156, "r": 348.2641906738281, "b": 442.1952819824219, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 3, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 6, "text": "TEDs", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 324.6700134277344, "t": 450.2650451660156, "r": 348.2641906738281, "b": 442.1952819824219, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 3, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 6, "text": "TEDs", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 396.27099609375, "t": 450.2650451660156, "r": 417.1268310546875, "b": 442.1952819824219, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "mAP", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 430.77099609375, "t": 450.2650451660156, "r": 467.1423034667969, "b": 442.1952819824219, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "Inference", "column_header": true, "row_header": false, "row_section": false}], [{"bbox": {"l": 144.5919952392578, "t": 437.3140563964844, "r": 183.82806396484375, "b": 429.2442932128906, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "enc-layers", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 192.1949920654297, "t": 437.3140563964844, "r": 231.43106079101562, "b": 429.2442932128906, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "dec-layers", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 239.79800415039062, "t": 444.7860412597656, "r": 278.3176574707031, "b": 436.7162780761719, "coord_origin": "BOTTOMLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Language", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 286.6860046386719, "t": 437.3140563964844, "r": 312.3326110839844, "b": 429.2442932128906, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "simple", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 320.7019958496094, "t": 437.3140563964844, "r": 353.7198791503906, "b": 429.2442932128906, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "complex", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 369.3059997558594, "t": 437.3140563964844, "r": 379.03094482421875, "b": 429.2442932128906, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "all", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 394.927001953125, "t": 439.3060607910156, "r": 418.4727783203125, "b": 431.2362976074219, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "(0.75)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 427.14801025390625, "t": 439.3060607910156, "r": 470.76055908203125, "b": 431.2362976074219, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "time (secs)", "column_header": true, "row_header": false, "row_section": false}], [{"bbox": {"l": 161.906005859375, "t": 418.4840393066406, "r": 166.512939453125, "b": 410.4142761230469, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.50900268554688, "t": 418.4840393066406, "r": 214.11593627929688, "b": 410.4142761230469, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17599487304688, "t": 423.96405029296875, "r": 272.9395446777344, "b": 402.9422912597656, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.0169982910156, "t": 423.96405029296875, "r": 310.0037536621094, "b": 402.9422912597656, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.965 0.969", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.7170104980469, "t": 423.96405029296875, "r": 347.7037658691406, "b": 402.9422912597656, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.934 0.927", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 363.6759948730469, "t": 423.96405029296875, "r": 384.6627502441406, "b": 402.9422912597656, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.955 0.955", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 396.20599365234375, "t": 424.0268249511719, "r": 417.1927490234375, "b": 402.9422912597656, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.88 0.857", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.5270080566406, "t": 424.0268249511719, "r": 458.3842468261719, "b": 402.9422912597656, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "2.73 5.39", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 161.906005859375, "t": 392.18304443359375, "r": 166.512939453125, "b": 384.11328125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.50900268554688, "t": 392.18304443359375, "r": 214.11593627929688, "b": 384.11328125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17599487304688, "t": 397.66204833984375, "r": 272.9395446777344, "b": 376.64129638671875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.0169982910156, "t": 397.66204833984375, "r": 310.0037536621094, "b": 376.64129638671875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.938 0.952", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.7170104980469, "t": 397.66204833984375, "r": 347.7037658691406, "b": 389.59228515625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.904", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 363.6759948730469, "t": 397.66204833984375, "r": 384.6627502441406, "b": 389.59228515625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.927", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.6180114746094, "t": 397.7248229980469, "r": 418.77886962890625, "b": 389.79852294921875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.853", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.5270080566406, "t": 397.7248229980469, "r": 458.3842468261719, "b": 389.79852294921875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "1.97", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 161.906005859375, "t": 365.8820495605469, "r": 166.512939453125, "b": 357.8122863769531, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.50900268554688, "t": 365.8820495605469, "r": 214.11593627929688, "b": 357.8122863769531, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 246.7100067138672, "t": 371.3610534667969, "r": 271.4052734375, "b": 363.2912902832031, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.0169982910156, "t": 371.3610534667969, "r": 310.0037536621094, "b": 350.3403015136719, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.923 0.945", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.7170104980469, "t": 384.7110595703125, "r": 347.7037658691406, "b": 363.2912902832031, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.909 0.897", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 362.0880126953125, "t": 384.7738342285156, "r": 386.2488708496094, "b": 376.8475341796875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.938", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 396.20599365234375, "t": 384.7110595703125, "r": 417.1927490234375, "b": 376.64129638671875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.843", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.7669982910156, "t": 384.7110595703125, "r": 457.1468200683594, "b": 376.64129638671875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "3.77", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17599487304688, "t": 358.4100646972656, "r": 272.9395446777344, "b": 350.3403015136719, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.7170104980469, "t": 358.4100646972656, "r": 347.7037658691406, "b": 350.3403015136719, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.901", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 362.0880126953125, "t": 371.3610534667969, "r": 386.2488708496094, "b": 350.5465393066406, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.915 0.931", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.6180114746094, "t": 371.423828125, "r": 418.77886962890625, "b": 350.3403015136719, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.859 0.834", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.5270080566406, "t": 371.423828125, "r": 458.3842468261719, "b": 350.3403015136719, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "1.91 3.81", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 161.906005859375, "t": 339.5800476074219, "r": 166.512939453125, "b": 331.5102844238281, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.50900268554688, "t": 339.5800476074219, "r": 214.11593627929688, "b": 331.5102844238281, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17599487304688, "t": 345.06005859375, "r": 272.9395446777344, "b": 324.0382995605469, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.0169982910156, "t": 345.06005859375, "r": 310.0037536621094, "b": 324.0382995605469, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.952 0.944", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.7170104980469, "t": 345.06005859375, "r": 347.7037658691406, "b": 324.0382995605469, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.92 0.903", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 362.0880126953125, "t": 345.1228332519531, "r": 386.2488708496094, "b": 324.0382995605469, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.942 0.931", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.6180114746094, "t": 345.1228332519531, "r": 418.77886962890625, "b": 324.0382995605469, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.857 0.824", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.5270080566406, "t": 345.1228332519531, "r": 458.3842468261719, "b": 324.0382995605469, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "1.22 2", "column_header": false, "row_header": false, "row_section": false}]]}}, {"self_ref": "#/tables/1", "parent": {"cref": "#/body"}, "children": [], "label": "table", "prov": [{"page_no": 10, "bbox": {"l": 143.6376495361328, "t": 635.6522827148438, "r": 470.8485412597656, "b": 528.737548828125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [{"cref": "#/texts/332"}], "references": [], "footnotes": [], "image": null, "data": {"table_cells": [{"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 215.52499389648438, "t": 625.4660034179688, "r": 254.04464721679688, "b": 617.3963012695312, "coord_origin": "BOTTOMLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Language", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 300.3970031738281, "t": 630.9210205078125, "r": 323.9911804199219, "b": 622.851318359375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 3, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 5, "text": "TEDs", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 370.3450012207031, "t": 625.4410400390625, "r": 414.7466125488281, "b": 617.371337890625, "coord_origin": "BOTTOMLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 2, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "mAP(0.75)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 423.114013671875, "t": 630.9210205078125, "r": 466.7265625, "b": 611.892333984375, "coord_origin": "BOTTOMLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 2, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "Inference time (secs)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 262.4129943847656, "t": 617.968994140625, "r": 288.0596008300781, "b": 609.8992919921875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "simple", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 296.4289855957031, "t": 617.968994140625, "r": 329.4468688964844, "b": 609.8992919921875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "complex", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 345.0329895019531, "t": 617.968994140625, "r": 354.7579345703125, "b": 609.8992919921875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "all", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 154.53799438476562, "t": 599.1400146484375, "r": 201.2412872314453, "b": 591.0703125, "coord_origin": "BOTTOMLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PubTabNet", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 222.43699645996094, "t": 604.6190185546875, "r": 247.13226318359375, "b": 596.54931640625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "OTSL", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 264.7439880371094, "t": 604.6190185546875, "r": 285.7307434082031, "b": 596.54931640625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.965", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 302.4440002441406, "t": 604.6190185546875, "r": 323.4307556152344, "b": 596.54931640625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.934", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 339.40301513671875, "t": 604.6190185546875, "r": 360.3897705078125, "b": 596.54931640625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.955", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 383.1159973144531, "t": 604.6818237304688, "r": 401.9732360839844, "b": 596.7554931640625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 435.4930114746094, "t": 604.6818237304688, "r": 454.3502502441406, "b": 596.7554931640625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "2.73", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 220.9029998779297, "t": 591.6680297851562, "r": 248.66656494140625, "b": 583.5983276367188, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "HTML", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 264.7439880371094, "t": 591.6680297851562, "r": 285.7307434082031, "b": 583.5983276367188, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.969", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 302.4440002441406, "t": 591.6680297851562, "r": 323.4307556152344, "b": 583.5983276367188, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.927", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 339.40301513671875, "t": 591.6680297851562, "r": 360.3897705078125, "b": 583.5983276367188, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.955", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 382.052001953125, "t": 591.6680297851562, "r": 403.03875732421875, "b": 583.5983276367188, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.857", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 436.73199462890625, "t": 591.6680297851562, "r": 453.11181640625, "b": 583.5983276367188, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "5.39", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 155.94500732421875, "t": 572.8380126953125, "r": 199.833740234375, "b": 564.768310546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "FinTabNet", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 222.43699645996094, "t": 578.3179931640625, "r": 247.13226318359375, "b": 570.248291015625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "OTSL", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 264.7439880371094, "t": 578.3179931640625, "r": 285.7307434082031, "b": 570.248291015625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.955", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 302.4440002441406, "t": 578.3179931640625, "r": 323.4307556152344, "b": 570.248291015625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.961", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 337.81500244140625, "t": 578.3807983398438, "r": 361.9758605957031, "b": 570.4544677734375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.959", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 380.4639892578125, "t": 578.3807983398438, "r": 404.6248474121094, "b": 570.4544677734375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.862", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 435.4930114746094, "t": 578.3807983398438, "r": 454.3502502441406, "b": 570.4544677734375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "1.85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 220.9029998779297, "t": 565.3660278320312, "r": 248.66656494140625, "b": 557.2963256835938, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "HTML", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 264.7439880371094, "t": 565.3660278320312, "r": 285.7307434082031, "b": 557.2963256835938, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.917", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 302.4440002441406, "t": 565.3660278320312, "r": 323.4307556152344, "b": 557.2963256835938, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.922", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 341.70599365234375, "t": 565.3660278320312, "r": 358.0858154296875, "b": 557.2963256835938, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.92", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 382.052001953125, "t": 565.3660278320312, "r": 403.03875732421875, "b": 557.2963256835938, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.722", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 436.73199462890625, "t": 565.3660278320312, "r": 453.11181640625, "b": 557.2963256835938, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "3.26", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 148.62600708007812, "t": 546.5370483398438, "r": 207.15240478515625, "b": 538.4673461914062, "coord_origin": "BOTTOMLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PubTables-1M", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 222.43699645996094, "t": 552.0170288085938, "r": 247.13226318359375, "b": 543.9473266601562, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "OTSL", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 264.7439880371094, "t": 552.0170288085938, "r": 285.7307434082031, "b": 543.9473266601562, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.987", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 302.4440002441406, "t": 552.0170288085938, "r": 323.4307556152344, "b": 543.9473266601562, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.964", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 337.81500244140625, "t": 552.079833984375, "r": 361.9758605957031, "b": 544.1535034179688, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.977", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 380.4639892578125, "t": 552.079833984375, "r": 404.6248474121094, "b": 544.1535034179688, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.896", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 435.4930114746094, "t": 552.079833984375, "r": 454.3502502441406, "b": 544.1535034179688, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "1.79", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 220.9029998779297, "t": 539.0650024414062, "r": 248.66656494140625, "b": 530.9953002929688, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "HTML", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 264.7439880371094, "t": 539.0650024414062, "r": 285.7307434082031, "b": 530.9953002929688, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.983", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 302.4440002441406, "t": 539.0650024414062, "r": 323.4307556152344, "b": 530.9953002929688, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.944", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 339.40301513671875, "t": 539.0650024414062, "r": 360.3897705078125, "b": 530.9953002929688, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.966", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 382.052001953125, "t": 539.0650024414062, "r": 403.03875732421875, "b": 530.9953002929688, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.889", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 436.73199462890625, "t": 539.0650024414062, "r": 453.11181640625, "b": 530.9953002929688, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "3.26", "column_header": false, "row_header": false, "row_section": false}], "num_rows": 8, "num_cols": 7, "grid": [[{"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 215.52499389648438, "t": 625.4660034179688, "r": 254.04464721679688, "b": 617.3963012695312, "coord_origin": "BOTTOMLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Language", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 300.3970031738281, "t": 630.9210205078125, "r": 323.9911804199219, "b": 622.851318359375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 3, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 5, "text": "TEDs", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 300.3970031738281, "t": 630.9210205078125, "r": 323.9911804199219, "b": 622.851318359375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 3, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 5, "text": "TEDs", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 300.3970031738281, "t": 630.9210205078125, "r": 323.9911804199219, "b": 622.851318359375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 3, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 5, "text": "TEDs", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 370.3450012207031, "t": 625.4410400390625, "r": 414.7466125488281, "b": 617.371337890625, "coord_origin": "BOTTOMLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 2, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "mAP(0.75)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 423.114013671875, "t": 630.9210205078125, "r": 466.7265625, "b": 611.892333984375, "coord_origin": "BOTTOMLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 2, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "Inference time (secs)", "column_header": true, "row_header": false, "row_section": false}], [{"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 215.52499389648438, "t": 625.4660034179688, "r": 254.04464721679688, "b": 617.3963012695312, "coord_origin": "BOTTOMLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Language", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 262.4129943847656, "t": 617.968994140625, "r": 288.0596008300781, "b": 609.8992919921875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "simple", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 296.4289855957031, "t": 617.968994140625, "r": 329.4468688964844, "b": 609.8992919921875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "complex", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 345.0329895019531, "t": 617.968994140625, "r": 354.7579345703125, "b": 609.8992919921875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "all", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 370.3450012207031, "t": 625.4410400390625, "r": 414.7466125488281, "b": 617.371337890625, "coord_origin": "BOTTOMLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 2, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "mAP(0.75)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 423.114013671875, "t": 630.9210205078125, "r": 466.7265625, "b": 611.892333984375, "coord_origin": "BOTTOMLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 2, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "Inference time (secs)", "column_header": true, "row_header": false, "row_section": false}], [{"bbox": {"l": 154.53799438476562, "t": 599.1400146484375, "r": 201.2412872314453, "b": 591.0703125, "coord_origin": "BOTTOMLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PubTabNet", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 222.43699645996094, "t": 604.6190185546875, "r": 247.13226318359375, "b": 596.54931640625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "OTSL", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 264.7439880371094, "t": 604.6190185546875, "r": 285.7307434082031, "b": 596.54931640625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.965", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 302.4440002441406, "t": 604.6190185546875, "r": 323.4307556152344, "b": 596.54931640625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.934", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 339.40301513671875, "t": 604.6190185546875, "r": 360.3897705078125, "b": 596.54931640625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.955", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 383.1159973144531, "t": 604.6818237304688, "r": 401.9732360839844, "b": 596.7554931640625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 435.4930114746094, "t": 604.6818237304688, "r": 454.3502502441406, "b": 596.7554931640625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "2.73", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 154.53799438476562, "t": 599.1400146484375, "r": 201.2412872314453, "b": 591.0703125, "coord_origin": "BOTTOMLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PubTabNet", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 220.9029998779297, "t": 591.6680297851562, "r": 248.66656494140625, "b": 583.5983276367188, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "HTML", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 264.7439880371094, "t": 591.6680297851562, "r": 285.7307434082031, "b": 583.5983276367188, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.969", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 302.4440002441406, "t": 591.6680297851562, "r": 323.4307556152344, "b": 583.5983276367188, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.927", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 339.40301513671875, "t": 591.6680297851562, "r": 360.3897705078125, "b": 583.5983276367188, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.955", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 382.052001953125, "t": 591.6680297851562, "r": 403.03875732421875, "b": 583.5983276367188, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.857", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 436.73199462890625, "t": 591.6680297851562, "r": 453.11181640625, "b": 583.5983276367188, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "5.39", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 155.94500732421875, "t": 572.8380126953125, "r": 199.833740234375, "b": 564.768310546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "FinTabNet", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 222.43699645996094, "t": 578.3179931640625, "r": 247.13226318359375, "b": 570.248291015625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "OTSL", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 264.7439880371094, "t": 578.3179931640625, "r": 285.7307434082031, "b": 570.248291015625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.955", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 302.4440002441406, "t": 578.3179931640625, "r": 323.4307556152344, "b": 570.248291015625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.961", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 337.81500244140625, "t": 578.3807983398438, "r": 361.9758605957031, "b": 570.4544677734375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.959", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 380.4639892578125, "t": 578.3807983398438, "r": 404.6248474121094, "b": 570.4544677734375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.862", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 435.4930114746094, "t": 578.3807983398438, "r": 454.3502502441406, "b": 570.4544677734375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "1.85", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 155.94500732421875, "t": 572.8380126953125, "r": 199.833740234375, "b": 564.768310546875, "coord_origin": "BOTTOMLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "FinTabNet", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 220.9029998779297, "t": 565.3660278320312, "r": 248.66656494140625, "b": 557.2963256835938, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "HTML", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 264.7439880371094, "t": 565.3660278320312, "r": 285.7307434082031, "b": 557.2963256835938, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.917", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 302.4440002441406, "t": 565.3660278320312, "r": 323.4307556152344, "b": 557.2963256835938, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.922", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 341.70599365234375, "t": 565.3660278320312, "r": 358.0858154296875, "b": 557.2963256835938, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.92", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 382.052001953125, "t": 565.3660278320312, "r": 403.03875732421875, "b": 557.2963256835938, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.722", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 436.73199462890625, "t": 565.3660278320312, "r": 453.11181640625, "b": 557.2963256835938, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "3.26", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 148.62600708007812, "t": 546.5370483398438, "r": 207.15240478515625, "b": 538.4673461914062, "coord_origin": "BOTTOMLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PubTables-1M", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 222.43699645996094, "t": 552.0170288085938, "r": 247.13226318359375, "b": 543.9473266601562, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "OTSL", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 264.7439880371094, "t": 552.0170288085938, "r": 285.7307434082031, "b": 543.9473266601562, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.987", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 302.4440002441406, "t": 552.0170288085938, "r": 323.4307556152344, "b": 543.9473266601562, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.964", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 337.81500244140625, "t": 552.079833984375, "r": 361.9758605957031, "b": 544.1535034179688, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.977", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 380.4639892578125, "t": 552.079833984375, "r": 404.6248474121094, "b": 544.1535034179688, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.896", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 435.4930114746094, "t": 552.079833984375, "r": 454.3502502441406, "b": 544.1535034179688, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "1.79", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 148.62600708007812, "t": 546.5370483398438, "r": 207.15240478515625, "b": 538.4673461914062, "coord_origin": "BOTTOMLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PubTables-1M", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 220.9029998779297, "t": 539.0650024414062, "r": 248.66656494140625, "b": 530.9953002929688, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "HTML", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 264.7439880371094, "t": 539.0650024414062, "r": 285.7307434082031, "b": 530.9953002929688, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.983", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 302.4440002441406, "t": 539.0650024414062, "r": 323.4307556152344, "b": 530.9953002929688, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.944", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 339.40301513671875, "t": 539.0650024414062, "r": 360.3897705078125, "b": 530.9953002929688, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.966", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 382.052001953125, "t": 539.0650024414062, "r": 403.03875732421875, "b": 530.9953002929688, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.889", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 436.73199462890625, "t": 539.0650024414062, "r": 453.11181640625, "b": 530.9953002929688, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "3.26", "column_header": false, "row_header": false, "row_section": false}]]}}], "key_value_items": [], "pages": {"1": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 1}, "2": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 2}, "3": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 3}, "4": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 4}, "5": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 5}, "6": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 6}, "7": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 7}, "8": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 8}, "9": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 9}, "10": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 10}, "11": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 11}, "12": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 12}, "13": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 13}, "14": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 14}}}
\ No newline at end of file
+{"schema_name": "DoclingDocument", "version": "1.1.0", "name": "2305.03393v1", "origin": {"mimetype": "application/pdf", "binary_hash": 8240558336632491037, "filename": "2305.03393v1.pdf", "uri": null}, "furniture": {"self_ref": "#/furniture", "parent": null, "children": [], "content_layer": "furniture", "name": "_root_", "label": "unspecified"}, "body": {"self_ref": "#/body", "parent": null, "children": [{"cref": "#/texts/0"}, {"cref": "#/texts/1"}, {"cref": "#/groups/0"}, {"cref": "#/texts/6"}, {"cref": "#/texts/7"}, {"cref": "#/texts/8"}, {"cref": "#/texts/9"}, {"cref": "#/texts/10"}, {"cref": "#/texts/11"}, {"cref": "#/texts/12"}, {"cref": "#/pictures/0"}, {"cref": "#/texts/120"}, {"cref": "#/texts/121"}, {"cref": "#/texts/122"}, {"cref": "#/texts/123"}, {"cref": "#/texts/124"}, {"cref": "#/texts/125"}, {"cref": "#/texts/126"}, {"cref": "#/texts/127"}, {"cref": "#/texts/128"}, {"cref": "#/texts/129"}, {"cref": "#/texts/130"}, {"cref": "#/texts/131"}, {"cref": "#/texts/132"}, {"cref": "#/texts/133"}, {"cref": "#/texts/134"}, {"cref": "#/texts/135"}, {"cref": "#/texts/136"}, {"cref": "#/texts/137"}, {"cref": "#/texts/138"}, {"cref": "#/pictures/1"}, {"cref": "#/texts/140"}, {"cref": "#/texts/141"}, {"cref": "#/texts/142"}, {"cref": "#/texts/143"}, {"cref": "#/texts/144"}, {"cref": "#/texts/145"}, {"cref": "#/texts/146"}, {"cref": "#/texts/147"}, {"cref": "#/texts/148"}, {"cref": "#/texts/149"}, {"cref": "#/texts/150"}, {"cref": "#/texts/151"}, {"cref": "#/groups/1"}, {"cref": "#/texts/157"}, {"cref": "#/texts/158"}, {"cref": "#/texts/159"}, {"cref": "#/pictures/2"}, {"cref": "#/texts/229"}, {"cref": "#/texts/230"}, {"cref": "#/groups/2"}, {"cref": "#/texts/233"}, {"cref": "#/groups/3"}, {"cref": "#/texts/238"}, {"cref": "#/texts/239"}, {"cref": "#/texts/240"}, {"cref": "#/texts/241"}, {"cref": "#/texts/242"}, {"cref": "#/texts/243"}, {"cref": "#/texts/244"}, {"cref": "#/texts/245"}, {"cref": "#/texts/246"}, {"cref": "#/pictures/3"}, {"cref": "#/texts/320"}, {"cref": "#/texts/321"}, {"cref": "#/texts/322"}, {"cref": "#/texts/323"}, {"cref": "#/texts/324"}, {"cref": "#/texts/325"}, {"cref": "#/tables/0"}, {"cref": "#/texts/327"}, {"cref": "#/texts/328"}, {"cref": "#/texts/329"}, {"cref": "#/texts/330"}, {"cref": "#/texts/331"}, {"cref": "#/tables/1"}, {"cref": "#/texts/333"}, {"cref": "#/texts/334"}, {"cref": "#/pictures/4"}, {"cref": "#/texts/433"}, {"cref": "#/texts/434"}, {"cref": "#/texts/435"}, {"cref": "#/texts/436"}, {"cref": "#/pictures/5"}, {"cref": "#/texts/449"}, {"cref": "#/texts/450"}, {"cref": "#/texts/451"}, {"cref": "#/texts/452"}, {"cref": "#/texts/453"}, {"cref": "#/texts/454"}, {"cref": "#/texts/455"}, {"cref": "#/groups/4"}, {"cref": "#/texts/460"}, {"cref": "#/texts/461"}, {"cref": "#/groups/5"}, {"cref": "#/texts/475"}, {"cref": "#/texts/476"}, {"cref": "#/groups/6"}], "content_layer": "body", "name": "_root_", "label": "unspecified"}, "groups": [{"self_ref": "#/groups/0", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/2"}, {"cref": "#/texts/3"}, {"cref": "#/texts/4"}, {"cref": "#/texts/5"}], "content_layer": "body", "name": "group", "label": "key_value_area"}, {"self_ref": "#/groups/1", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/152"}, {"cref": "#/texts/153"}, {"cref": "#/texts/154"}, {"cref": "#/texts/155"}, {"cref": "#/texts/156"}], "content_layer": "body", "name": "list", "label": "list"}, {"self_ref": "#/groups/2", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/231"}, {"cref": "#/texts/232"}], "content_layer": "body", "name": "list", "label": "list"}, {"self_ref": "#/groups/3", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/234"}, {"cref": "#/texts/235"}, {"cref": "#/texts/236"}, {"cref": "#/texts/237"}], "content_layer": "body", "name": "list", "label": "list"}, {"self_ref": "#/groups/4", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/456"}, {"cref": "#/texts/457"}, {"cref": "#/texts/458"}, {"cref": "#/texts/459"}], "content_layer": "body", "name": "list", "label": "list"}, {"self_ref": "#/groups/5", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/462"}, {"cref": "#/texts/463"}, {"cref": "#/texts/464"}, {"cref": "#/texts/465"}, {"cref": "#/texts/466"}, {"cref": "#/texts/467"}, {"cref": "#/texts/468"}, {"cref": "#/texts/469"}, {"cref": "#/texts/470"}, {"cref": "#/texts/471"}, {"cref": "#/texts/472"}, {"cref": "#/texts/473"}, {"cref": "#/texts/474"}], "content_layer": "body", "name": "list", "label": "list"}, {"self_ref": "#/groups/6", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/477"}, {"cref": "#/texts/478"}, {"cref": "#/texts/479"}, {"cref": "#/texts/480"}, {"cref": "#/texts/481"}, {"cref": "#/texts/482"}], "content_layer": "body", "name": "list", "label": "list"}], "texts": [{"self_ref": "#/texts/0", "parent": {"cref": "#/body"}, "children": [], "content_layer": "furniture", "label": "page_header", "prov": [{"page_no": 1, "bbox": {"l": 18.340218, "t": 582.52002, "r": 36.339787, "b": 236.99996999999996, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 37]}], "orig": "arXiv:2305.03393v1 [cs.CV] 5 May 2023", "text": "arXiv:2305.03393v1 [cs.CV] 5 May 2023"}, {"self_ref": "#/texts/1", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "section_header", "prov": [{"page_no": 1, "bbox": {"l": 134.765, "t": 676.10089, "r": 480.59735, "b": 645.4859, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 60]}], "orig": "Optimized Table Tokenization for Table Structure Recognition", "text": "Optimized Table Tokenization for Table Structure Recognition", "level": 1}, {"self_ref": "#/texts/2", "parent": {"cref": "#/groups/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 139.34305, "t": 622.30841, "r": 476.01270000000005, "b": 591.81409, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 222]}], "orig": "Maksym Lysak [0000 \u2212 0002 \u2212 3723 \u2212 $^{6960]}$, Ahmed Nassar[0000 \u2212 0002 \u2212 9468 \u2212 $^{0822]}$, Nikolaos Livathinos [0000 \u2212 0001 \u2212 8513 \u2212 $^{3491]}$, Christoph Auer[0000 \u2212 0001 \u2212 5761 \u2212 $^{0422]}$, [0000 \u2212 0002 \u2212 8088 \u2212 0823]", "text": "Maksym Lysak [0000 \u2212 0002 \u2212 3723 \u2212 $^{6960]}$, Ahmed Nassar[0000 \u2212 0002 \u2212 9468 \u2212 $^{0822]}$, Nikolaos Livathinos [0000 \u2212 0001 \u2212 8513 \u2212 $^{3491]}$, Christoph Auer[0000 \u2212 0001 \u2212 5761 \u2212 $^{0422]}$, [0000 \u2212 0002 \u2212 8088 \u2212 0823]"}, {"self_ref": "#/texts/3", "parent": {"cref": "#/groups/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 229.52109000000002, "t": 596.41626, "r": 298.6087, "b": 587.61926, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 15]}], "orig": "and Peter Staar", "text": "and Peter Staar"}, {"self_ref": "#/texts/4", "parent": {"cref": "#/groups/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 279.1051, "t": 574.79602, "r": 336.25153, "b": 566.72632, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 12]}], "orig": "IBM Research", "text": "IBM Research"}, {"self_ref": "#/texts/5", "parent": {"cref": "#/groups/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 222.96609, "t": 563.19147, "r": 392.38983, "b": 555.72247, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 36]}], "orig": "{mly,ahn,nli,cau,taa}@zurich.ibm.com", "text": "{mly,ahn,nli,cau,taa}@zurich.ibm.com"}, {"self_ref": "#/texts/6", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 163.1111, "t": 521.69885, "r": 452.24878000000007, "b": 327.26553, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1198]}], "orig": "Abstract. Extracting tables from documents is a crucial task in any document conversion pipeline. Recently, transformer-based models have demonstrated that table-structure can be recognized with impressive accuracy using Image-to-Markup-Sequence (Im2Seq) approaches. Taking only the image of a table, such models predict a sequence of tokens (e.g. in HTML, LaTeX) which represent the structure of the table. Since the token representation of the table structure has a significant impact on the accuracy and run-time performance of any Im2Seq model, we investigate in this paper how table-structure representation can be optimised. We propose a new, optimised table-structure language (OTSL) with a minimized vocabulary and specific rules. The benefits of OTSL are that it reduces the number of tokens to 5 (HTML needs 28+) and shortens the sequence length to half of HTML on average. Consequently, model accuracy improves significantly, inference time is halved compared to HTML-based models, and the predicted table structures are always syntactically correct. This in turn eliminates most post-processing needs. Popular table structure data-sets will be published in OTSL format to the community.", "text": "Abstract. Extracting tables from documents is a crucial task in any document conversion pipeline. Recently, transformer-based models have demonstrated that table-structure can be recognized with impressive accuracy using Image-to-Markup-Sequence (Im2Seq) approaches. Taking only the image of a table, such models predict a sequence of tokens (e.g. in HTML, LaTeX) which represent the structure of the table. Since the token representation of the table structure has a significant impact on the accuracy and run-time performance of any Im2Seq model, we investigate in this paper how table-structure representation can be optimised. We propose a new, optimised table-structure language (OTSL) with a minimized vocabulary and specific rules. The benefits of OTSL are that it reduces the number of tokens to 5 (HTML needs 28+) and shortens the sequence length to half of HTML on average. Consequently, model accuracy improves significantly, inference time is halved compared to HTML-based models, and the predicted table structures are always syntactically correct. This in turn eliminates most post-processing needs. Popular table structure data-sets will be published in OTSL format to the community."}, {"self_ref": "#/texts/7", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 163.1111, "t": 313.30606, "r": 452.24158, "b": 294.21451, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 90]}], "orig": "Keywords: Table Structure Recognition \u00b7 Data Representation \u00b7 Transformers \u00b7 Optimization.", "text": "Keywords: Table Structure Recognition \u00b7 Data Representation \u00b7 Transformers \u00b7 Optimization."}, {"self_ref": "#/texts/8", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "section_header", "prov": [{"page_no": 1, "bbox": {"l": 134.76512, "t": 269.88031, "r": 228.93384, "b": 259.31192, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 14]}], "orig": "1 Introduction", "text": "1 Introduction", "level": 1}, {"self_ref": "#/texts/9", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 134.76512, "t": 243.71345999999994, "r": 480.5959500000001, "b": 163.18548999999996, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 500]}], "orig": "Tables are ubiquitous in documents such as scientific papers, patents, reports, manuals, specification sheets or marketing material. They often encode highly valuable information and therefore need to be extracted with high accuracy. Unfortunately, tables appear in documents in various sizes, styling and structure, making it difficult to recover their correct structure with simple analytical methods. Therefore, accurate table extraction is achieved these days with machine-learning based methods.", "text": "Tables are ubiquitous in documents such as scientific papers, patents, reports, manuals, specification sheets or marketing material. They often encode highly valuable information and therefore need to be extracted with high accuracy. Unfortunately, tables appear in documents in various sizes, styling and structure, making it difficult to recover their correct structure with simple analytical methods. Therefore, accurate table extraction is achieved these days with machine-learning based methods."}, {"self_ref": "#/texts/10", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 134.76512, "t": 159.85244999999998, "r": 480.59583, "b": 127.14547000000005, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 235]}], "orig": "In modern document understanding systems [1,15], table extraction is typically a two-step process. Firstly, every table on a page is located with a bounding box, and secondly, their logical row and column structure is recognized. As of", "text": "In modern document understanding systems [1,15], table extraction is typically a two-step process. Firstly, every table on a page is located with a bounding box, and secondly, their logical row and column structure is recognized. As of"}, {"self_ref": "#/texts/11", "parent": {"cref": "#/body"}, "children": [], "content_layer": "furniture", "label": "page_header", "prov": [{"page_no": 2, "bbox": {"l": 134.765, "t": 698.229, "r": 139.37193, "b": 690.1593, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "2", "text": "2"}, {"self_ref": "#/texts/12", "parent": {"cref": "#/body"}, "children": [], "content_layer": "furniture", "label": "page_header", "prov": [{"page_no": 2, "bbox": {"l": 167.81335, "t": 698.229, "r": 231.72227, "b": 690.1593, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 16]}], "orig": "M. Lysak, et al.", "text": "M. Lysak, et al."}, {"self_ref": "#/texts/13", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "caption", "prov": [{"page_no": 2, "bbox": {"l": 134.765, "t": 665.66583, "r": 480.59189, "b": 591.77942, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 574]}], "orig": "Fig. 1. Comparison between HTML and OTSL table structure representation: (A) table-example with complex row and column headers, including a 2D empty span, (B) minimal graphical representation of table structure using rectangular layout, (C) HTML representation, (D) OTSL representation. This example demonstrates many of the key-features of OTSL, namely its reduced vocabulary size (12 versus 5 in this case), its reduced sequence length (55 versus 30) and a enhanced internal structure (variable token sequence length per row in HTML versus a fixed length of rows in OTSL).", "text": "Fig. 1. Comparison between HTML and OTSL table structure representation: (A) table-example with complex row and column headers, including a 2D empty span, (B) minimal graphical representation of table structure using rectangular layout, (C) HTML representation, (D) OTSL representation. This example demonstrates many of the key-features of OTSL, namely its reduced vocabulary size (12 versus 5 in this case), its reduced sequence length (55 versus 30) and a enhanced internal structure (variable token sequence length per row in HTML versus a fixed length of rows in OTSL)."}, {"self_ref": "#/texts/14", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 396.41107, "t": 511.01648, "r": 402.97336, "b": 502.49097, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/15", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 418.58682, "t": 511.10208, "r": 425.14911, "b": 502.57657, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/16", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 395.74835, "t": 488.76273, "r": 402.31064, "b": 480.23721, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/17", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 407.54214, "t": 488.63019, "r": 414.10443, "b": 480.10468, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/18", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 407.56335, "t": 477.59381, "r": 414.12564, "b": 469.0683, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/19", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 418.51108, "t": 499.91497999999996, "r": 425.07336, "b": 491.38946999999996, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/20", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 429.59744, "t": 499.90894, "r": 436.1597300000001, "b": 491.38342, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/21", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 440.68759000000006, "t": 499.98769999999996, "r": 447.24987999999996, "b": 491.46218999999996, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/22", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 418.6232, "t": 488.70517, "r": 425.18549, "b": 480.17966, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/23", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 429.7095299999999, "t": 488.69989, "r": 436.27182, "b": 480.17438, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/24", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 440.7996800000001, "t": 488.77789, "r": 447.36197, "b": 480.25238, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/25", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 418.62546, "t": 477.43097, "r": 425.18774, "b": 468.90546, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/26", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 429.71181999999993, "t": 477.42566, "r": 436.27411, "b": 468.90015, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/27", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 440.80194, "t": 477.50369, "r": 447.36423, "b": 468.97818, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/28", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 407.39746, "t": 466.70969, "r": 413.95975, "b": 458.18417, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/29", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 418.45959, "t": 466.54684, "r": 425.02188, "b": 458.02133, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/30", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 429.54593, "t": 466.5408, "r": 436.10822, "b": 458.01529, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/31", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 440.63608, "t": 466.61957, "r": 447.19836, "b": 458.09406, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/32", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 451.89511000000005, "t": 511.84283, "r": 463.51273000000003, "b": 503.31732, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "NL", "text": "NL"}, {"self_ref": "#/texts/33", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 452.1557, "t": 500.40124999999995, "r": 463.77332, "b": 491.87573, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "NL", "text": "NL"}, {"self_ref": "#/texts/34", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 452.17688000000004, "t": 489.15735, "r": 463.79449000000005, "b": 480.63184, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "NL", "text": "NL"}, {"self_ref": "#/texts/35", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 452.09887999999995, "t": 477.87558000000007, "r": 463.71648999999996, "b": 469.3500700000001, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "NL", "text": "NL"}, {"self_ref": "#/texts/36", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 452.29733, "t": 466.53094, "r": 463.91495, "b": 458.00543, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "NL", "text": "NL"}, {"self_ref": "#/texts/37", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 396.09677, "t": 477.50522, "r": 402.65906, "b": 468.97970999999995, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "U", "text": "U"}, {"self_ref": "#/texts/38", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 395.99829, "t": 466.61123999999995, "r": 402.56058, "b": 458.08572, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "U", "text": "U"}, {"self_ref": "#/texts/39", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 396.27475, "t": 499.72943, "r": 402.83704, "b": 491.20392, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "U", "text": "U"}, {"self_ref": "#/texts/40", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 408.54724, "t": 511.03088, "r": 413.60074, "b": 502.50537, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "L", "text": "L"}, {"self_ref": "#/texts/41", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 430.58966, "t": 511.50275, "r": 435.6431600000001, "b": 502.97723, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "L", "text": "L"}, {"self_ref": "#/texts/42", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 441.08069, "t": 511.61938, "r": 446.13419, "b": 503.09387, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "L", "text": "L"}, {"self_ref": "#/texts/43", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 407.97388, "t": 499.86575, "r": 414.03625, "b": 491.34024, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "X", "text": "X"}, {"self_ref": "#/texts/44", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 441.25640999999996, "t": 380.8192399999999, "r": 452.87402, "b": 372.2937299999999, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "NL", "text": "NL"}, {"self_ref": "#/texts/45", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 393.75256, "t": 392.2052299999999, "r": 432.48929, "b": 385.10065, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 11]}], "orig": "vocabulary:", "text": "vocabulary:"}, {"self_ref": "#/texts/46", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 434.5896000000001, "t": 392.2052299999999, "r": 438.80083999999994, "b": 385.10065, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "5", "text": "5"}, {"self_ref": "#/texts/47", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 440.90573, "t": 392.2052299999999, "r": 463.22235, "b": 385.10065, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 6]}], "orig": "tokens", "text": "tokens"}, {"self_ref": "#/texts/48", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 384.11816, "t": 533.45282, "r": 413.99307, "b": 526.34821, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 6]}], "orig": "D OTSL", "text": "D OTSL"}, {"self_ref": "#/texts/49", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 393.75256, "t": 525.32495, "r": 451.45129000000003, "b": 518.22034, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 16]}], "orig": "sequence length:", "text": "sequence length:"}, {"self_ref": "#/texts/50", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 453.55083999999994, "t": 525.32495, "r": 461.97485, "b": 518.22034, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "30", "text": "30"}, {"self_ref": "#/texts/51", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 151.79318, "t": 392.23984, "r": 233.89371000000003, "b": 385.13525000000004, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 26]}], "orig": "vocabulary for this table:", "text": "vocabulary for this table:"}, {"self_ref": "#/texts/52", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 235.99332, "t": 392.23984, "r": 244.41734000000002, "b": 385.13525000000004, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "12", "text": "12"}, {"self_ref": "#/texts/53", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 246.52222, "t": 392.23984, "r": 268.83884, "b": 385.13525000000004, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 6]}], "orig": "tokens", "text": "tokens"}, {"self_ref": "#/texts/54", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 154.3298, "t": 578.42542, "r": 159.79837, "b": 571.3208, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "A", "text": "A"}, {"self_ref": "#/texts/55", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 321.07053, "t": 578.42542, "r": 326.53909, "b": 571.3208, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "B", "text": "B"}, {"self_ref": "#/texts/56", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 153.0947, "t": 511.69589, "r": 175.83888, "b": 505.30176, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 7]}], "orig": "<table>", "text": "<table>"}, {"self_ref": "#/texts/57", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 160.67039, "t": 504.87912, "r": 172.79608, "b": 498.48499, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "<tr>", "text": "<tr>"}, {"self_ref": "#/texts/58", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 168.24603, "t": 498.06235, "r": 177.91019, "b": 491.66821, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 3]}], "orig": "<td", "text": "<td"}, {"self_ref": "#/texts/59", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 179.80525, "t": 498.06235, "r": 215.61517, "b": 491.66821, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 11]}], "orig": "colspan=\u201c2\u201d", "text": "colspan=\u201c2\u201d"}, {"self_ref": "#/texts/60", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 217.50886999999997, "t": 498.06235, "r": 255.58945, "b": 491.66821, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 11]}], "orig": "rowspan=\u201c2\u201d", "text": "rowspan=\u201c2\u201d"}, {"self_ref": "#/texts/61", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 257.48315, "t": 498.06235, "r": 261.46414, "b": 491.66821, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": ">", "text": ">"}, {"self_ref": "#/texts/62", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 263.35785, "t": 498.06235, "r": 278.89804, "b": 491.66821, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 5]}], "orig": "</td>", "text": "</td>"}, {"self_ref": "#/texts/63", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 280.79175, "t": 498.06235, "r": 290.4559, "b": 491.66821, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 3]}], "orig": "<td", "text": "<td"}, {"self_ref": "#/texts/64", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 292.35095, "t": 498.06235, "r": 328.16083, "b": 491.66821, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 11]}], "orig": "colspan=\u201c3\u201d", "text": "colspan=\u201c3\u201d"}, {"self_ref": "#/texts/65", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 330.05457, "t": 498.06235, "r": 334.03555, "b": 491.66821, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": ">", "text": ">"}, {"self_ref": "#/texts/66", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 335.92926, "t": 498.06235, "r": 351.46945, "b": 491.66821, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 5]}], "orig": "</td>", "text": "</td>"}, {"self_ref": "#/texts/67", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 160.67039, "t": 491.24557000000004, "r": 174.68979, "b": 484.85144, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 5]}], "orig": "</tr>", "text": "</tr>"}, {"self_ref": "#/texts/68", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 160.67039, "t": 484.42877000000004, "r": 172.79608, "b": 478.03464, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "<tr>", "text": "<tr>"}, {"self_ref": "#/texts/69", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 168.24603, "t": 477.612, "r": 181.89255, "b": 471.21786, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "<td>", "text": "<td>"}, {"self_ref": "#/texts/70", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 183.78624, "t": 477.612, "r": 199.32646, "b": 471.21786, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 5]}], "orig": "</td>", "text": "</td>"}, {"self_ref": "#/texts/71", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 201.22015, "t": 477.612, "r": 214.86666999999997, "b": 471.21786, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "<td>", "text": "<td>"}, {"self_ref": "#/texts/72", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 216.76038, "t": 477.612, "r": 232.30058, "b": 471.21786, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 5]}], "orig": "</td>", "text": "</td>"}, {"self_ref": "#/texts/73", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 234.19427000000002, "t": 477.612, "r": 247.84079000000003, "b": 471.21786, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "<td>", "text": "<td>"}, {"self_ref": "#/texts/74", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 249.73447999999996, "t": 477.612, "r": 265.27469, "b": 471.21786, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 5]}], "orig": "</td>", "text": "</td>"}, {"self_ref": "#/texts/75", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 160.67039, "t": 470.79523, "r": 174.68979, "b": 464.40109000000007, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 5]}], "orig": "</tr>", "text": "</tr>"}, {"self_ref": "#/texts/76", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 160.67039, "t": 463.97842, "r": 172.79608, "b": 457.58428999999995, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "<tr>", "text": "<tr>"}, {"self_ref": "#/texts/77", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 168.24603, "t": 457.16165, "r": 373.09091, "b": 450.76752, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 67]}], "orig": "<td rowspan=\u201c3\u201d > </td> <td> </td> <td> </td> <td> </td> <td> </td>", "text": "<td rowspan=\u201c3\u201d > </td> <td> </td> <td> </td> <td> </td> <td> </td>"}, {"self_ref": "#/texts/78", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 160.67039, "t": 450.34488, "r": 174.68979, "b": 443.95074, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 5]}], "orig": "</tr>", "text": "</tr>"}, {"self_ref": "#/texts/79", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 160.67039, "t": 443.52841, "r": 172.79608, "b": 437.13428, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "<tr>", "text": "<tr>"}, {"self_ref": "#/texts/80", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 168.24603, "t": 436.71163999999993, "r": 181.89255, "b": 430.31750000000005, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "<td>", "text": "<td>"}, {"self_ref": "#/texts/81", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 183.78624, "t": 436.71163999999993, "r": 199.32646, "b": 430.31750000000005, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 5]}], "orig": "</td>", "text": "</td>"}, {"self_ref": "#/texts/82", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 201.22015, "t": 436.71163999999993, "r": 214.86666999999997, "b": 430.31750000000005, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "<td>", "text": "<td>"}, {"self_ref": "#/texts/83", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 216.76038, "t": 436.71163999999993, "r": 232.30058, "b": 430.31750000000005, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 5]}], "orig": "</td>", "text": "</td>"}, {"self_ref": "#/texts/84", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 234.19427000000002, "t": 436.71163999999993, "r": 247.84079000000003, "b": 430.31750000000005, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "<td>", "text": "<td>"}, {"self_ref": "#/texts/85", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 249.73447999999996, "t": 436.71163999999993, "r": 265.27469, "b": 430.31750000000005, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 5]}], "orig": "</td>", "text": "</td>"}, {"self_ref": "#/texts/86", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 267.1684, "t": 436.71163999999993, "r": 280.81488, "b": 430.31750000000005, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "<td>", "text": "<td>"}, {"self_ref": "#/texts/87", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 282.70862, "t": 436.71163999999993, "r": 298.24881, "b": 430.31750000000005, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 5]}], "orig": "</td>", "text": "</td>"}, {"self_ref": "#/texts/88", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 160.67039, "t": 429.89483999999993, "r": 174.68979, "b": 423.50070000000005, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 5]}], "orig": "</tr>", "text": "</tr>"}, {"self_ref": "#/texts/89", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 160.67039, "t": 423.07806, "r": 172.79608, "b": 416.68393, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "<tr>", "text": "<tr>"}, {"self_ref": "#/texts/90", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 168.24603, "t": 416.26129, "r": 181.89255, "b": 409.86716, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "<td>", "text": "<td>"}, {"self_ref": "#/texts/91", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 183.78624, "t": 416.26129, "r": 199.32646, "b": 409.86716, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 5]}], "orig": "</td>", "text": "</td>"}, {"self_ref": "#/texts/92", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 201.22015, "t": 416.26129, "r": 214.86666999999997, "b": 409.86716, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "<td>", "text": "<td>"}, {"self_ref": "#/texts/93", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 216.76038, "t": 416.26129, "r": 232.30058, "b": 409.86716, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 5]}], "orig": "</td>", "text": "</td>"}, {"self_ref": "#/texts/94", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 234.19427000000002, "t": 416.26129, "r": 247.84079000000003, "b": 409.86716, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "<td>", "text": "<td>"}, {"self_ref": "#/texts/95", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 249.73447999999996, "t": 416.26129, "r": 265.27469, "b": 409.86716, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 5]}], "orig": "</td>", "text": "</td>"}, {"self_ref": "#/texts/96", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 267.1684, "t": 416.26129, "r": 280.81488, "b": 409.86716, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "<td>", "text": "<td>"}, {"self_ref": "#/texts/97", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 282.70862, "t": 416.26129, "r": 298.24881, "b": 409.86716, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 5]}], "orig": "</td>", "text": "</td>"}, {"self_ref": "#/texts/98", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 160.67039, "t": 409.44449, "r": 174.68979, "b": 403.05035, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 5]}], "orig": "</tr>", "text": "</tr>"}, {"self_ref": "#/texts/99", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 153.0947, "t": 402.62772, "r": 177.73259, "b": 396.23358, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 8]}], "orig": "</table>", "text": "</table>"}, {"self_ref": "#/texts/100", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 395.06137, "t": 380.66647, "r": 401.62366, "b": 372.14096, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/101", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 407.42249, "t": 380.66647, "r": 412.47598, "b": 372.14096, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "L", "text": "L"}, {"self_ref": "#/texts/102", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 418.69287, "t": 380.66647, "r": 425.25516, "b": 372.14096, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "U", "text": "U"}, {"self_ref": "#/texts/103", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 430.5086099999999, "t": 380.66647, "r": 436.5709800000001, "b": 372.14096, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "X", "text": "X"}, {"self_ref": "#/texts/104", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 152.36208, "t": 382.22638, "r": 175.10626, "b": 375.83224, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 7]}], "orig": "<table>", "text": "<table>"}, {"self_ref": "#/texts/105", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 178.89366, "t": 382.22638, "r": 191.01935, "b": 375.83224, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "<tr>", "text": "<tr>"}, {"self_ref": "#/texts/106", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 194.80676, "t": 382.22638, "r": 208.82614, "b": 375.83224, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 5]}], "orig": "</tr>", "text": "</tr>"}, {"self_ref": "#/texts/107", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 212.61354, "t": 382.22638, "r": 226.26003999999998, "b": 375.83224, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "<td>", "text": "<td>"}, {"self_ref": "#/texts/108", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 230.04745000000003, "t": 382.22638, "r": 245.58765000000002, "b": 375.83224, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 5]}], "orig": "</td>", "text": "</td>"}, {"self_ref": "#/texts/109", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 249.37506000000002, "t": 382.22638, "r": 259.03918, "b": 375.83224, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 3]}], "orig": "<td", "text": "<td"}, {"self_ref": "#/texts/110", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 262.82797, "t": 382.22638, "r": 298.93646, "b": 375.83224, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 11]}], "orig": "colspan=\"2\"", "text": "colspan=\"2\""}, {"self_ref": "#/texts/111", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 302.72385, "t": 382.22638, "r": 338.83234, "b": 375.83224, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 11]}], "orig": "colspan=\"3\"", "text": "colspan=\"3\""}, {"self_ref": "#/texts/112", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 152.36208, "t": 373.89478, "r": 190.74123, "b": 367.50064, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 11]}], "orig": "rowspan=\"2\"", "text": "rowspan=\"2\""}, {"self_ref": "#/texts/113", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 194.52863, "t": 373.89478, "r": 232.90777999999997, "b": 367.50064, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 11]}], "orig": "rowspan=\"3\"", "text": "rowspan=\"3\""}, {"self_ref": "#/texts/114", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 236.69518999999997, "t": 373.89478, "r": 240.67617999999996, "b": 367.50064, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": ">", "text": ">"}, {"self_ref": "#/texts/115", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 244.46358, "t": 373.89478, "r": 269.10144, "b": 367.50064, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 8]}], "orig": "</table>", "text": "</table>"}, {"self_ref": "#/texts/116", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 154.50595, "t": 533.39905, "r": 159.62473, "b": 526.29443, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/117", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 164.74348, "t": 533.39905, "r": 185.21857, "b": 526.29443, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "HTML", "text": "HTML"}, {"self_ref": "#/texts/118", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 164.3548, "t": 525.50293, "r": 222.05352999999997, "b": 518.39832, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 16]}], "orig": "sequence length:", "text": "sequence length:"}, {"self_ref": "#/texts/119", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 224.15326, "t": 525.50293, "r": 232.57729, "b": 518.39832, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "55", "text": "55"}, {"self_ref": "#/texts/120", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 134.765, "t": 339.68622, "r": 480.59232000000003, "b": 271.11330999999996, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 435]}], "orig": "today, table detection in documents is a well understood problem, and the latest state-of-the-art (SOTA) object detection methods provide an accuracy comparable to human observers [7,8,10,14,23]. On the other hand, the problem of table structure recognition (TSR) is a lot more challenging and remains a very active area of research, in which many novel machine learning algorithms are being explored [3,4,5,9,11,12,13,14,17,18,21,22].", "text": "today, table detection in documents is a well understood problem, and the latest state-of-the-art (SOTA) object detection methods provide an accuracy comparable to human observers [7,8,10,14,23]. On the other hand, the problem of table structure recognition (TSR) is a lot more challenging and remains a very active area of research, in which many novel machine learning algorithms are being explored [3,4,5,9,11,12,13,14,17,18,21,22]."}, {"self_ref": "#/texts/121", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 134.76501, "t": 267.44928000000004, "r": 480.59482, "b": 127.14530000000002, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 911]}], "orig": "Recently emerging SOTA methods for table structure recognition employ transformer-based models, in which an image of the table is provided to the network in order to predict the structure of the table as a sequence of tokens. These image-to-sequence (Im2Seq) models are extremely powerful, since they allow for a purely data-driven solution. The tokens of the sequence typically belong to a markup language such as HTML, Latex or Markdown, which allow to describe table structure as rows, columns and spanning cells in various configurations. In Figure 1, we illustrate how HTML is used to represent the table-structure of a particular example table. Public table-structure data sets such as PubTabNet [22], and FinTabNet [21], which were created in a semi-automated way from paired PDF and HTML sources (e.g. PubMed Central), popularized primarily the use of HTML as ground-truth representation format for TSR.", "text": "Recently emerging SOTA methods for table structure recognition employ transformer-based models, in which an image of the table is provided to the network in order to predict the structure of the table as a sequence of tokens. These image-to-sequence (Im2Seq) models are extremely powerful, since they allow for a purely data-driven solution. The tokens of the sequence typically belong to a markup language such as HTML, Latex or Markdown, which allow to describe table structure as rows, columns and spanning cells in various configurations. In Figure 1, we illustrate how HTML is used to represent the table-structure of a particular example table. Public table-structure data sets such as PubTabNet [22], and FinTabNet [21], which were created in a semi-automated way from paired PDF and HTML sources (e.g. PubMed Central), popularized primarily the use of HTML as ground-truth representation format for TSR."}, {"self_ref": "#/texts/122", "parent": {"cref": "#/body"}, "children": [], "content_layer": "furniture", "label": "page_header", "prov": [{"page_no": 3, "bbox": {"l": 194.478, "t": 698.229, "r": 447.54291000000006, "b": 690.1593, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 60]}], "orig": "Optimized Table Tokenization for Table Structure Recognition", "text": "Optimized Table Tokenization for Table Structure Recognition"}, {"self_ref": "#/texts/123", "parent": {"cref": "#/body"}, "children": [], "content_layer": "furniture", "label": "page_header", "prov": [{"page_no": 3, "bbox": {"l": 475.98431, "t": 698.229, "r": 480.59125000000006, "b": 690.1593, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "3", "text": "3"}, {"self_ref": "#/texts/124", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 134.76498, "t": 673.06622, "r": 480.59183, "b": 580.58313, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 584]}], "orig": "While the majority of research in TSR is currently focused on the development and application of novel neural model architectures, the table structure representation language (e.g. HTML in PubTabNet and FinTabNet) is usually adopted as is for the sequence tokenization in Im2Seq models. In this paper, we aim for the opposite and investigate the impact of the table structure representation language with an otherwise unmodified Im2Seq transformer-based architecture. Since the current state-of-the-art Im2Seq model is TableFormer [9], we select this model to perform our experiments.", "text": "While the majority of research in TSR is currently focused on the development and application of novel neural model architectures, the table structure representation language (e.g. HTML in PubTabNet and FinTabNet) is usually adopted as is for the sequence tokenization in Im2Seq models. In this paper, we aim for the opposite and investigate the impact of the table structure representation language with an otherwise unmodified Im2Seq transformer-based architecture. Since the current state-of-the-art Im2Seq model is TableFormer [9], we select this model to perform our experiments."}, {"self_ref": "#/texts/125", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 134.76498, "t": 577.16412, "r": 480.59572999999995, "b": 460.77014, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 721]}], "orig": "The main contribution of this paper is the introduction of a new optimised table structure language (OTSL), specifically designed to describe table-structure in an compact and structured way for Im2Seq models. OTSL has a number of key features, which make it very attractive to use in Im2Seq models. Specifically, compared to other languages such as HTML, OTSL has a minimized vocabulary which yields short sequence length, strong inherent structure (e.g. strict rectangular layout) and a strict syntax with rules that only look backwards. The latter allows for syntax validation during inference and ensures a syntactically correct table-structure. These OTSL features are illustrated in Figure 1, in comparison to HTML.", "text": "The main contribution of this paper is the introduction of a new optimised table structure language (OTSL), specifically designed to describe table-structure in an compact and structured way for Im2Seq models. OTSL has a number of key features, which make it very attractive to use in Im2Seq models. Specifically, compared to other languages such as HTML, OTSL has a minimized vocabulary which yields short sequence length, strong inherent structure (e.g. strict rectangular layout) and a strict syntax with rules that only look backwards. The latter allows for syntax validation during inference and ensures a syntactically correct table-structure. These OTSL features are illustrated in Figure 1, in comparison to HTML."}, {"self_ref": "#/texts/126", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 134.76498, "t": 457.35211, "r": 480.59567, "b": 352.91324, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 626]}], "orig": "The paper is structured as follows. In section 2, we give an overview of the latest developments in table-structure reconstruction. In section 3 we review the current HTML table encoding (popularised by PubTabNet and FinTabNet) and discuss its flaws. Subsequently, we introduce OTSL in section 4, which includes the language definition, syntax rules and error-correction procedures. In section 5, we apply OTSL on the TableFormer architecture, compare it to TableFormer models trained on HTML and ultimately demonstrate the advantages of using OTSL. Finally, in section 6 we conclude our work and outline next potential steps.", "text": "The paper is structured as follows. In section 2, we give an overview of the latest developments in table-structure reconstruction. In section 3 we review the current HTML table encoding (popularised by PubTabNet and FinTabNet) and discuss its flaws. Subsequently, we introduce OTSL in section 4, which includes the language definition, syntax rules and error-correction procedures. In section 5, we apply OTSL on the TableFormer architecture, compare it to TableFormer models trained on HTML and ultimately demonstrate the advantages of using OTSL. Finally, in section 6 we conclude our work and outline next potential steps."}, {"self_ref": "#/texts/127", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "section_header", "prov": [{"page_no": 3, "bbox": {"l": 134.76498, "t": 329.91205, "r": 236.76912999999996, "b": 319.34366, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 14]}], "orig": "2 Related Work", "text": "2 Related Work", "level": 1}, {"self_ref": "#/texts/128", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 134.76498, "t": 303.31418, "r": 484.12047999999993, "b": 127.14423, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1161]}], "orig": "Approaches to formalize the logical structure and layout of tables in electronic documents date back more than two decades [16]. In the recent past, a wide variety of computer vision methods have been explored to tackle the problem of table structure recognition, i.e. the correct identification of columns, rows and spanning cells in a given table. Broadly speaking, the current deeplearning based approaches fall into three categories: object detection (OD) methods, Graph-Neural-Network (GNN) methods and Image-to-Markup-Sequence (Im2Seq) methods. Object-detection based methods [11,12,13,14,21] rely on tablestructure annotation using (overlapping) bounding boxes for training, and produce bounding-box predictions to define table cells, rows, and columns on a table image. Graph Neural Network (GNN) based methods [3,6,17,18], as the name suggests, represent tables as graph structures. The graph nodes represent the content of each table cell, an embedding vector from the table image, or geometric coordinates of the table cell. The edges of the graph define the relationship between the nodes, e.g. if they belong to the same column, row, or table cell.", "text": "Approaches to formalize the logical structure and layout of tables in electronic documents date back more than two decades [16]. In the recent past, a wide variety of computer vision methods have been explored to tackle the problem of table structure recognition, i.e. the correct identification of columns, rows and spanning cells in a given table. Broadly speaking, the current deeplearning based approaches fall into three categories: object detection (OD) methods, Graph-Neural-Network (GNN) methods and Image-to-Markup-Sequence (Im2Seq) methods. Object-detection based methods [11,12,13,14,21] rely on tablestructure annotation using (overlapping) bounding boxes for training, and produce bounding-box predictions to define table cells, rows, and columns on a table image. Graph Neural Network (GNN) based methods [3,6,17,18], as the name suggests, represent tables as graph structures. The graph nodes represent the content of each table cell, an embedding vector from the table image, or geometric coordinates of the table cell. The edges of the graph define the relationship between the nodes, e.g. if they belong to the same column, row, or table cell."}, {"self_ref": "#/texts/129", "parent": {"cref": "#/body"}, "children": [], "content_layer": "furniture", "label": "page_header", "prov": [{"page_no": 4, "bbox": {"l": 134.765, "t": 698.229, "r": 139.37193, "b": 690.1593, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "4", "text": "4"}, {"self_ref": "#/texts/130", "parent": {"cref": "#/body"}, "children": [], "content_layer": "furniture", "label": "page_header", "prov": [{"page_no": 4, "bbox": {"l": 167.81335, "t": 698.229, "r": 231.72227, "b": 690.1593, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 16]}], "orig": "M. Lysak, et al.", "text": "M. Lysak, et al."}, {"self_ref": "#/texts/131", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 4, "bbox": {"l": 134.765, "t": 673.06622, "r": 480.5957599999999, "b": 532.76208, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 939]}], "orig": "Other work [20] aims at predicting a grid for each table and deciding which cells must be merged using an attention network. Im2Seq methods cast the problem as a sequence generation task [4,5,9,22], and therefore need an internal tablestructure representation language, which is often implemented with standard markup languages (e.g. HTML, LaTeX, Markdown). In theory, Im2Seq methods have a natural advantage over the OD and GNN methods by virtue of directly predicting the table-structure. As such, no post-processing or rules are needed in order to obtain the table-structure, which is necessary with OD and GNN approaches. In practice, this is not entirely true, because a predicted sequence of table-structure markup does not necessarily have to be syntactically correct. Hence, depending on the quality of the predicted sequence, some post-processing needs to be performed to ensure a syntactically valid (let alone correct) sequence.", "text": "Other work [20] aims at predicting a grid for each table and deciding which cells must be merged using an attention network. Im2Seq methods cast the problem as a sequence generation task [4,5,9,22], and therefore need an internal tablestructure representation language, which is often implemented with standard markup languages (e.g. HTML, LaTeX, Markdown). In theory, Im2Seq methods have a natural advantage over the OD and GNN methods by virtue of directly predicting the table-structure. As such, no post-processing or rules are needed in order to obtain the table-structure, which is necessary with OD and GNN approaches. In practice, this is not entirely true, because a predicted sequence of table-structure markup does not necessarily have to be syntactically correct. Hence, depending on the quality of the predicted sequence, some post-processing needs to be performed to ensure a syntactically valid (let alone correct) sequence."}, {"self_ref": "#/texts/132", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 4, "bbox": {"l": 134.76498, "t": 529.34308, "r": 480.59569999999997, "b": 305.3533, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1404]}], "orig": "Within the Im2Seq method, we find several popular models, namely the encoder-dual-decoder model (EDD) [22], TableFormer [9], Tabsplitter[2] and Ye et. al. [19]. EDD uses two consecutive long short-term memory (LSTM) decoders to predict a table in HTML representation. The tag decoder predicts a sequence of HTML tags. For each decoded table cell ( <td> ), the attention is passed to the cell decoder to predict the content with an embedded OCR approach. The latter makes it susceptible to transcription errors in the cell content of the table. TableFormer address this reliance on OCR and uses two transformer decoders for HTML structure and cell bounding box prediction in an end-to-end architecture. The predicted cell bounding box is then used to extract text tokens from an originating (digital) PDF page, circumventing any need for OCR. TabSplitter [2] proposes a compact double-matrix representation of table rows and columns to do error detection and error correction of HTML structure sequences based on predictions from [19]. This compact double-matrix representation can not be used directly by the Img2seq model training, so the model uses HTML as an intermediate form. Chi et. al. [4] introduce a data set and a baseline method using bidirectional LSTMs to predict LaTeX code. Kayal [5] introduces Gated ResNet transformers to predict LaTeX code, and a separate OCR module to extract content.", "text": "Within the Im2Seq method, we find several popular models, namely the encoder-dual-decoder model (EDD) [22], TableFormer [9], Tabsplitter[2] and Ye et. al. [19]. EDD uses two consecutive long short-term memory (LSTM) decoders to predict a table in HTML representation. The tag decoder predicts a sequence of HTML tags. For each decoded table cell ( <td> ), the attention is passed to the cell decoder to predict the content with an embedded OCR approach. The latter makes it susceptible to transcription errors in the cell content of the table. TableFormer address this reliance on OCR and uses two transformer decoders for HTML structure and cell bounding box prediction in an end-to-end architecture. The predicted cell bounding box is then used to extract text tokens from an originating (digital) PDF page, circumventing any need for OCR. TabSplitter [2] proposes a compact double-matrix representation of table rows and columns to do error detection and error correction of HTML structure sequences based on predictions from [19]. This compact double-matrix representation can not be used directly by the Img2seq model training, so the model uses HTML as an intermediate form. Chi et. al. [4] introduce a data set and a baseline method using bidirectional LSTMs to predict LaTeX code. Kayal [5] introduces Gated ResNet transformers to predict LaTeX code, and a separate OCR module to extract content."}, {"self_ref": "#/texts/133", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 4, "bbox": {"l": 134.76498, "t": 301.93427, "r": 480.59378, "b": 209.45133999999996, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 572]}], "orig": "Im2Seq approaches have shown to be well-suited for the TSR task and allow a full end-to-end network design that can output the final table structure without pre- or post-processing logic. Furthermore, Im2Seq models have demonstrated to deliver state-of-the-art prediction accuracy [9]. This motivated the authors to investigate if the performance (both in accuracy and inference time) can be further improved by optimising the table structure representation language. We believe this is a necessary step before further improving neural network architectures for this task.", "text": "Im2Seq approaches have shown to be well-suited for the TSR task and allow a full end-to-end network design that can output the final table structure without pre- or post-processing logic. Furthermore, Im2Seq models have demonstrated to deliver state-of-the-art prediction accuracy [9]. This motivated the authors to investigate if the performance (both in accuracy and inference time) can be further improved by optimising the table structure representation language. We believe this is a necessary step before further improving neural network architectures for this task."}, {"self_ref": "#/texts/134", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "section_header", "prov": [{"page_no": 4, "bbox": {"l": 134.76498, "t": 186.45015999999998, "r": 269.62442, "b": 175.88176999999996, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 19]}], "orig": "3 Problem Statement", "text": "3 Problem Statement", "level": 1}, {"self_ref": "#/texts/135", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 4, "bbox": {"l": 134.76498, "t": 159.85231, "r": 480.5936899999999, "b": 127.14434000000006, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 233]}], "orig": "All known Im2Seq based models for TSR fundamentally work in similar ways. Given an image of a table, the Im2Seq model predicts the structure of the table by generating a sequence of tokens. These tokens originate from a finite vocab-", "text": "All known Im2Seq based models for TSR fundamentally work in similar ways. Given an image of a table, the Im2Seq model predicts the structure of the table by generating a sequence of tokens. These tokens originate from a finite vocab-"}, {"self_ref": "#/texts/136", "parent": {"cref": "#/body"}, "children": [], "content_layer": "furniture", "label": "page_header", "prov": [{"page_no": 5, "bbox": {"l": 194.478, "t": 698.229, "r": 447.54291000000006, "b": 690.1593, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 60]}], "orig": "Optimized Table Tokenization for Table Structure Recognition", "text": "Optimized Table Tokenization for Table Structure Recognition"}, {"self_ref": "#/texts/137", "parent": {"cref": "#/body"}, "children": [], "content_layer": "furniture", "label": "page_header", "prov": [{"page_no": 5, "bbox": {"l": 475.98431, "t": 698.229, "r": 480.59125000000006, "b": 690.1593, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "5", "text": "5"}, {"self_ref": "#/texts/138", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 134.765, "t": 673.06622, "r": 480.59378, "b": 604.49316, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 422]}], "orig": "ulary and can be interpreted as a table structure. For example, with the HTML tokens <table> , </table> , <tr> , </tr> , <td> and </td> , one can construct simple table structures without any spanning cells. In reality though, one needs at least 28 HTML tokens to describe the most common complex tables observed in real-world documents [21,22], due to a variety of spanning cells definitions in the HTML token vocabulary.", "text": "ulary and can be interpreted as a table structure. For example, with the HTML tokens <table> , </table> , <tr> , </tr> , <td> and </td> , one can construct simple table structures without any spanning cells. In reality though, one needs at least 28 HTML tokens to describe the most common complex tables observed in real-world documents [21,22], due to a variety of spanning cells definitions in the HTML token vocabulary."}, {"self_ref": "#/texts/139", "parent": {"cref": "#/pictures/1"}, "children": [], "content_layer": "body", "label": "caption", "prov": [{"page_no": 5, "bbox": {"l": 145.60701, "t": 570.92072, "r": 469.75223000000005, "b": 562.78821, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 73]}], "orig": "Fig. 2. Frequency of tokens in HTML and OTSL as they appear in PubTabNet.", "text": "Fig. 2. Frequency of tokens in HTML and OTSL as they appear in PubTabNet."}, {"self_ref": "#/texts/140", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 134.765, "t": 423.79321, "r": 480.59476, "b": 259.57941000000005, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1021]}], "orig": "Obviously, HTML and other general-purpose markup languages were not designed for Im2Seq models. As such, they have some serious drawbacks. First, the token vocabulary needs to be artificially large in order to describe all plausible tabular structures. Since most Im2Seq models use an autoregressive approach, they generate the sequence token by token. Therefore, to reduce inference time, a shorter sequence length is critical. Every table-cell is represented by at least two tokens ( <td> and </td> ). Furthermore, when tokenizing the HTML structure, one needs to explicitly enumerate possible column-spans and row-spans as words. In practice, this ends up requiring 28 different HTML tokens (when including column- and row-spans up to 10 cells) just to describe every table in the PubTabNet dataset. Clearly, not every token is equally represented, as is depicted in Figure 2. This skewed distribution of tokens in combination with variable token row-length makes it challenging for models to learn the HTML structure.", "text": "Obviously, HTML and other general-purpose markup languages were not designed for Im2Seq models. As such, they have some serious drawbacks. First, the token vocabulary needs to be artificially large in order to describe all plausible tabular structures. Since most Im2Seq models use an autoregressive approach, they generate the sequence token by token. Therefore, to reduce inference time, a shorter sequence length is critical. Every table-cell is represented by at least two tokens ( <td> and </td> ). Furthermore, when tokenizing the HTML structure, one needs to explicitly enumerate possible column-spans and row-spans as words. In practice, this ends up requiring 28 different HTML tokens (when including column- and row-spans up to 10 cells) just to describe every table in the PubTabNet dataset. Clearly, not every token is equally represented, as is depicted in Figure 2. This skewed distribution of tokens in combination with variable token row-length makes it challenging for models to learn the HTML structure."}, {"self_ref": "#/texts/141", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 134.76501, "t": 255.95736999999997, "r": 480.59289999999993, "b": 211.2944, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 313]}], "orig": "Additionally, it would be desirable if the representation would easily allow an early detection of invalid sequences on-the-go, before the prediction of the entire table structure is completed. HTML is not well-suited for this purpose as the verification of incomplete sequences is non-trivial or even impossible.", "text": "Additionally, it would be desirable if the representation would easily allow an early detection of invalid sequences on-the-go, before the prediction of the entire table structure is completed. HTML is not well-suited for this purpose as the verification of incomplete sequences is non-trivial or even impossible."}, {"self_ref": "#/texts/142", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 134.76501, "t": 207.67336999999998, "r": 480.59473, "b": 127.14539000000002, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 542]}], "orig": "In a valid HTML table, the token sequence must describe a 2D grid of table cells, serialised in row-major ordering, where each row and each column have the same length (while considering row- and column-spans). Furthermore, every opening tag in HTML needs to be matched by a closing tag in a correct hierarchical manner. Since the number of tokens for each table row and column can vary significantly, especially for large tables with many row- and column-spans, it is complex to verify the consistency of predicted structures during sequence", "text": "In a valid HTML table, the token sequence must describe a 2D grid of table cells, serialised in row-major ordering, where each row and each column have the same length (while considering row- and column-spans). Furthermore, every opening tag in HTML needs to be matched by a closing tag in a correct hierarchical manner. Since the number of tokens for each table row and column can vary significantly, especially for large tables with many row- and column-spans, it is complex to verify the consistency of predicted structures during sequence"}, {"self_ref": "#/texts/143", "parent": {"cref": "#/body"}, "children": [], "content_layer": "furniture", "label": "page_header", "prov": [{"page_no": 6, "bbox": {"l": 134.765, "t": 698.229, "r": 139.37193, "b": 690.1593, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "6", "text": "6"}, {"self_ref": "#/texts/144", "parent": {"cref": "#/body"}, "children": [], "content_layer": "furniture", "label": "page_header", "prov": [{"page_no": 6, "bbox": {"l": 167.81335, "t": 698.229, "r": 231.72227, "b": 690.1593, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 16]}], "orig": "M. Lysak, et al.", "text": "M. Lysak, et al."}, {"self_ref": "#/texts/145", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 6, "bbox": {"l": 134.765, "t": 673.06622, "r": 480.59479, "b": 652.31421, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 132]}], "orig": "generation. Implicitly, this also means that Im2Seq models need to learn these complex syntax rules, simply to deliver valid output.", "text": "generation. Implicitly, this also means that Im2Seq models need to learn these complex syntax rules, simply to deliver valid output."}, {"self_ref": "#/texts/146", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 6, "bbox": {"l": 134.76498, "t": 648.51721, "r": 480.59569999999997, "b": 496.25809, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 977]}], "orig": "In practice, we observe two major issues with prediction quality when training Im2Seq models on HTML table structure generation from images. On the one hand, we find that on large tables, the visual attention of the model often starts to drift and is not accurately moving forward cell by cell anymore. This manifests itself in either in an increasing location drift for proposed table-cells in later rows on the same column or even complete loss of vertical alignment, as illustrated in Figure 5. Addressing this with post-processing is partially possible, but clearly undesired. On the other hand, we find many instances of predictions with structural inconsistencies or plain invalid HTML output, as shown in Figure 6, which are nearly impossible to properly correct. Both problems seriously impact the TSR model performance, since they reflect not only in the task of pure structure recognition but also in the equally crucial recognition or matching of table cell content.", "text": "In practice, we observe two major issues with prediction quality when training Im2Seq models on HTML table structure generation from images. On the one hand, we find that on large tables, the visual attention of the model often starts to drift and is not accurately moving forward cell by cell anymore. This manifests itself in either in an increasing location drift for proposed table-cells in later rows on the same column or even complete loss of vertical alignment, as illustrated in Figure 5. Addressing this with post-processing is partially possible, but clearly undesired. On the other hand, we find many instances of predictions with structural inconsistencies or plain invalid HTML output, as shown in Figure 6, which are nearly impossible to properly correct. Both problems seriously impact the TSR model performance, since they reflect not only in the task of pure structure recognition but also in the equally crucial recognition or matching of table cell content."}, {"self_ref": "#/texts/147", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "section_header", "prov": [{"page_no": 6, "bbox": {"l": 134.76498, "t": 471.3689, "r": 372.50848, "b": 460.80051, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 36]}], "orig": "4 Optimised Table Structure Language", "text": "4 Optimised Table Structure Language", "level": 1}, {"self_ref": "#/texts/148", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 6, "bbox": {"l": 134.76498, "t": 442.88303, "r": 480.59473, "b": 350.40015, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 563]}], "orig": "To mitigate the issues with HTML in Im2Seq-based TSR models laid out before, we propose here our Optimised Table Structure Language (OTSL). OTSL is designed to express table structure with a minimized vocabulary and a simple set of rules, which are both significantly reduced compared to HTML. At the same time, OTSL enables easy error detection and correction during sequence generation. We further demonstrate how the compact structure representation and minimized sequence length improves prediction accuracy and inference time in the TableFormer architecture.", "text": "To mitigate the issues with HTML in Im2Seq-based TSR models laid out before, we propose here our Optimised Table Structure Language (OTSL). OTSL is designed to express table structure with a minimized vocabulary and a simple set of rules, which are both significantly reduced compared to HTML. At the same time, OTSL enables easy error detection and correction during sequence generation. We further demonstrate how the compact structure representation and minimized sequence length improves prediction accuracy and inference time in the TableFormer architecture."}, {"self_ref": "#/texts/149", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "section_header", "prov": [{"page_no": 6, "bbox": {"l": 134.76498, "t": 326.12808, "r": 261.80109, "b": 317.32114, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 23]}], "orig": "4.1 Language Definition", "text": "4.1 Language Definition", "level": 1}, {"self_ref": "#/texts/150", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 6, "bbox": {"l": 134.76498, "t": 303.00211, "r": 480.58871, "b": 270.2941599999999, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 165]}], "orig": "In Figure 3, we illustrate how the OTSL is defined. In essence, the OTSL defines only 5 tokens that directly describe a tabular structure based on an atomic 2D grid.", "text": "In Figure 3, we illustrate how the OTSL is defined. In essence, the OTSL defines only 5 tokens that directly describe a tabular structure based on an atomic 2D grid."}, {"self_ref": "#/texts/151", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 6, "bbox": {"l": 149.70898, "t": 266.4981399999999, "r": 409.31137, "b": 257.70117000000005, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 57]}], "orig": "The OTSL vocabulary is comprised of the following tokens:", "text": "The OTSL vocabulary is comprised of the following tokens:"}, {"self_ref": "#/texts/152", "parent": {"cref": "#/groups/1"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 6, "bbox": {"l": 140.99298, "t": 244.03011000000004, "r": 460.54443, "b": 235.22317999999996, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 72]}], "orig": "-\"C\" cell a new table cell that either has or does not have cell content", "text": "-\"C\" cell a new table cell that either has or does not have cell content", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/153", "parent": {"cref": "#/groups/1"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 6, "bbox": {"l": 140.99301, "t": 231.4371, "r": 480.59392999999994, "b": 210.67516999999998, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 82]}], "orig": "-\"L\" cell left-looking cell , merging with the left neighbor cell to create a span", "text": "-\"L\" cell left-looking cell , merging with the left neighbor cell to create a span", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/154", "parent": {"cref": "#/groups/1"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 6, "bbox": {"l": 140.99304, "t": 206.88810999999998, "r": 480.58856, "b": 186.12617, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 81]}], "orig": "-\"U\" cell up-looking cell , merging with the upper neighbor cell to create a span", "text": "-\"U\" cell up-looking cell , merging with the upper neighbor cell to create a span", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/155", "parent": {"cref": "#/groups/1"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 6, "bbox": {"l": 140.99304, "t": 182.3401, "r": 454.55496, "b": 173.53317000000004, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 71]}], "orig": "-\"X\" cell cross cell , to merge with both left and upper neighbor cells", "text": "-\"X\" cell cross cell , to merge with both left and upper neighbor cells", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/156", "parent": {"cref": "#/groups/1"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 6, "bbox": {"l": 140.99304, "t": 169.74610999999993, "r": 328.61676, "b": 160.93917999999996, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 40]}], "orig": "-\"NL\" new-line , switch to the next row.", "text": "-\"NL\" new-line , switch to the next row.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/157", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 6, "bbox": {"l": 134.76505, "t": 147.89714000000004, "r": 480.59280000000007, "b": 127.14516000000003, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 99]}], "orig": "A notable attribute of OTSL is that it has the capability of achieving lossless conversion to HTML.", "text": "A notable attribute of OTSL is that it has the capability of achieving lossless conversion to HTML."}, {"self_ref": "#/texts/158", "parent": {"cref": "#/body"}, "children": [], "content_layer": "furniture", "label": "page_header", "prov": [{"page_no": 7, "bbox": {"l": 194.478, "t": 698.229, "r": 447.54291000000006, "b": 690.1593, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 60]}], "orig": "Optimized Table Tokenization for Table Structure Recognition", "text": "Optimized Table Tokenization for Table Structure Recognition"}, {"self_ref": "#/texts/159", "parent": {"cref": "#/body"}, "children": [], "content_layer": "furniture", "label": "page_header", "prov": [{"page_no": 7, "bbox": {"l": 475.98431, "t": 698.229, "r": 480.59125000000006, "b": 690.1593, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "7", "text": "7"}, {"self_ref": "#/texts/160", "parent": {"cref": "#/pictures/2"}, "children": [], "content_layer": "body", "label": "caption", "prov": [{"page_no": 7, "bbox": {"l": 134.765, "t": 666.2008100000002, "r": 480.5874, "b": 636.15033, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 207]}], "orig": "Fig. 3. OTSL description of table structure: A - table example; B - graphical representation of table structure; C - mapping structure on a grid; D - OTSL structure encoding; E - explanation on cell encoding", "text": "Fig. 3. OTSL description of table structure: A - table example; B - graphical representation of table structure; C - mapping structure on a grid; D - OTSL structure encoding; E - explanation on cell encoding"}, {"self_ref": "#/texts/161", "parent": {"cref": "#/pictures/2"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 374.49326, "t": 623.40637, "r": 381.66843, "b": 614.08459, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/162", "parent": {"cref": "#/pictures/2"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 398.74011, "t": 623.49994, "r": 405.91528, "b": 614.17816, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/163", "parent": {"cref": "#/pictures/2"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 373.76862, "t": 599.07446, "r": 380.94379, "b": 589.75269, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/164", "parent": {"cref": "#/pictures/2"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 386.66388, "t": 598.92938, "r": 393.83905, "b": 589.6076, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/165", "parent": {"cref": "#/pictures/2"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 386.68707, "t": 586.86243, "r": 393.86224, "b": 577.54065, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/166", "parent": {"cref": "#/pictures/2"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 398.65729, "t": 611.26721, "r": 405.83246, "b": 601.94543, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/167", "parent": {"cref": "#/pictures/2"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 410.77908, "t": 611.26141, "r": 417.95425, "b": 601.93964, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/168", "parent": {"cref": "#/pictures/2"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 422.90503, "t": 611.34753, "r": 430.08020000000005, "b": 602.02576, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/169", "parent": {"cref": "#/pictures/2"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 398.7807, "t": 599.01135, "r": 405.95587, "b": 589.68958, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/170", "parent": {"cref": "#/pictures/2"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 410.90164, "t": 599.00513, "r": 418.07681, "b": 589.68335, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/171", "parent": {"cref": "#/pictures/2"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 423.02753, "t": 599.091, "r": 430.2027, "b": 589.76923, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/172", "parent": {"cref": "#/pictures/2"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 398.78235, "t": 586.68427, "r": 405.95752, "b": 577.36249, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/173", "parent": {"cref": "#/pictures/2"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 410.90414, "t": 586.67804, "r": 418.07932, "b": 577.35626, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/174", "parent": {"cref": "#/pictures/2"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 423.03003, "t": 586.76385, "r": 430.20520000000005, "b": 577.44208, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/175", "parent": {"cref": "#/pictures/2"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 386.50574, "t": 574.96118, "r": 393.68091, "b": 565.6394, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/176", "parent": {"cref": "#/pictures/2"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 398.60181, "t": 574.78296, "r": 405.77698, "b": 565.46118, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/177", "parent": {"cref": "#/pictures/2"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 410.72275, "t": 574.77679, "r": 417.89792, "b": 565.45502, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/178", "parent": {"cref": "#/pictures/2"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 422.84869, "t": 574.86261, "r": 430.02386, "b": 565.54083, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/179", "parent": {"cref": "#/pictures/2"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 435.16009999999994, "t": 624.30988, "r": 447.86273, "b": 614.9881, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "NL", "text": "NL"}, {"self_ref": "#/texts/180", "parent": {"cref": "#/pictures/2"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 435.44415, "t": 611.79974, "r": 448.14679, "b": 602.47797, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "NL", "text": "NL"}, {"self_ref": "#/texts/181", "parent": {"cref": "#/pictures/2"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 435.46735, "t": 599.50525, "r": 448.16998000000007, "b": 590.18347, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "NL", "text": "NL"}, {"self_ref": "#/texts/182", "parent": {"cref": "#/pictures/2"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 435.38202, "t": 587.16974, "r": 448.08466, "b": 577.84796, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "NL", "text": "NL"}, {"self_ref": "#/texts/183", "parent": {"cref": "#/pictures/2"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 435.59906, "t": 574.7663, "r": 448.3017, "b": 565.44452, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "NL", "text": "NL"}, {"self_ref": "#/texts/184", "parent": {"cref": "#/pictures/2"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 374.14957, "t": 586.76508, "r": 381.32474, "b": 577.4433, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "U", "text": "U"}, {"self_ref": "#/texts/185", "parent": {"cref": "#/pictures/2"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 374.0419, "t": 574.85352, "r": 381.21707, "b": 565.53174, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "U", "text": "U"}, {"self_ref": "#/texts/186", "parent": {"cref": "#/pictures/2"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 374.34418, "t": 611.06512, "r": 381.51935, "b": 601.74335, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "U", "text": "U"}, {"self_ref": "#/texts/187", "parent": {"cref": "#/pictures/2"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 387.76285, "t": 623.42212, "r": 393.28833, "b": 614.10034, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "L", "text": "L"}, {"self_ref": "#/texts/188", "parent": {"cref": "#/pictures/2"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 411.86395, "t": 623.93805, "r": 417.38943, "b": 614.61627, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "L", "text": "L"}, {"self_ref": "#/texts/189", "parent": {"cref": "#/pictures/2"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 423.33563, "t": 624.06561, "r": 428.86111, "b": 614.74384, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "L", "text": "L"}, {"self_ref": "#/texts/190", "parent": {"cref": "#/pictures/2"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 387.13593, "t": 611.21423, "r": 393.76453, "b": 601.89246, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "X", "text": "X"}, {"self_ref": "#/texts/191", "parent": {"cref": "#/pictures/2"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 282.2594, "t": 547.49121, "r": 289.43457, "b": 538.16943, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/192", "parent": {"cref": "#/pictures/2"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 282.11035, "t": 535.14978, "r": 289.28552, "b": 525.828, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "U", "text": "U"}, {"self_ref": "#/texts/193", "parent": {"cref": "#/pictures/2"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 282.40848, "t": 522.867, "r": 289.58365, "b": 513.54523, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "U", "text": "U"}, {"self_ref": "#/texts/194", "parent": {"cref": "#/pictures/2"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 295.52902, "t": 547.50653, "r": 301.0545, "b": 538.18475, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "L", "text": "L"}, {"self_ref": "#/texts/195", "parent": {"cref": "#/pictures/2"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 307.46613, "t": 547.42627, "r": 312.99161, "b": 538.10449, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "L", "text": "L"}, {"self_ref": "#/texts/196", "parent": {"cref": "#/pictures/2"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 318.76886, "t": 547.55963, "r": 324.29434, "b": 538.23785, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "L", "text": "L"}, {"self_ref": "#/texts/197", "parent": {"cref": "#/pictures/2"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 294.9021, "t": 535.29846, "r": 301.03976, "b": 525.97668, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "X", "text": "X"}, {"self_ref": "#/texts/198", "parent": {"cref": "#/pictures/2"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 307.17743, "t": 535.29846, "r": 325.59039, "b": 525.97668, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 3]}], "orig": "X X", "text": "X X"}, {"self_ref": "#/texts/199", "parent": {"cref": "#/pictures/2"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 294.78949, "t": 522.74579, "r": 300.92715, "b": 513.42401, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "X", "text": "X"}, {"self_ref": "#/texts/200", "parent": {"cref": "#/pictures/2"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 307.06482, "t": 522.74579, "r": 325.47778, "b": 513.42401, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 3]}], "orig": "X X", "text": "X X"}, {"self_ref": "#/texts/201", "parent": {"cref": "#/pictures/2"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 195.93939, "t": 523.25201, "r": 203.11456, "b": 513.93024, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/202", "parent": {"cref": "#/pictures/2"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 209.20891, "t": 523.26733, "r": 214.73439, "b": 513.94556, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "L", "text": "L"}, {"self_ref": "#/texts/203", "parent": {"cref": "#/pictures/2"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 221.14551, "t": 523.18707, "r": 226.67099, "b": 513.8653, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "L", "text": "L"}, {"self_ref": "#/texts/204", "parent": {"cref": "#/pictures/2"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 232.44858, "t": 523.32043, "r": 237.97405999999998, "b": 513.99866, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "L", "text": "L"}, {"self_ref": "#/texts/205", "parent": {"cref": "#/pictures/2"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 196.21715, "t": 547.46039, "r": 203.39232, "b": 538.13861, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/206", "parent": {"cref": "#/pictures/2"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 250.32143, "t": 547.90186, "r": 257.49661, "b": 538.58008, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/207", "parent": {"cref": "#/pictures/2"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 250.17235999999997, "t": 535.56049, "r": 257.34753, "b": 526.23871, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "U", "text": "U"}, {"self_ref": "#/texts/208", "parent": {"cref": "#/pictures/2"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 250.47049000000004, "t": 523.27777, "r": 257.64566, "b": 513.95599, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "U", "text": "U"}, {"self_ref": "#/texts/209", "parent": {"cref": "#/pictures/2"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 334.51135, "t": 549.00537, "r": 337.22485, "b": 542.79089, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "1", "text": "1"}, {"self_ref": "#/texts/210", "parent": {"cref": "#/pictures/2"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 339.93835, "t": 549.00537, "r": 391.49472, "b": 542.79089, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 19]}], "orig": "- simple cells: \"C\"", "text": "- simple cells: \"C\""}, {"self_ref": "#/texts/211", "parent": {"cref": "#/pictures/2"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 334.51135, "t": 539.06744, "r": 337.33313, "b": 532.85297, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "2", "text": "2"}, {"self_ref": "#/texts/212", "parent": {"cref": "#/pictures/2"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 340.15491, "t": 539.06744, "r": 421.98624, "b": 532.85297, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 29]}], "orig": "- horizontal merges: \"C\", \"L\"", "text": "- horizontal merges: \"C\", \"L\""}, {"self_ref": "#/texts/213", "parent": {"cref": "#/pictures/2"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 334.51135, "t": 529.12952, "r": 337.29868, "b": 522.91504, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "3", "text": "3"}, {"self_ref": "#/texts/214", "parent": {"cref": "#/pictures/2"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 340.086, "t": 529.12952, "r": 415.34375, "b": 522.91504, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 27]}], "orig": "- vertical merges: \"C\", \"U\"", "text": "- vertical merges: \"C\", \"U\""}, {"self_ref": "#/texts/215", "parent": {"cref": "#/pictures/2"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 7, "bbox": {"l": 334.51135, "t": 519.19159, "r": 426.59875, "b": 512.97711, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 33]}], "orig": "4 - 2d merges: \"C\", \"L\", \"U\", \"X\"", "text": "4 - 2d merges: \"C\", \"L\", \"U\", \"X\"", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/216", "parent": {"cref": "#/pictures/2"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 185.67178, "t": 547.95776, "r": 189.35544, "b": 541.74329, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "1", "text": "1"}, {"self_ref": "#/texts/217", "parent": {"cref": "#/pictures/2"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 185.96759, "t": 523.65234, "r": 189.65125, "b": 517.43787, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "2", "text": "2"}, {"self_ref": "#/texts/218", "parent": {"cref": "#/pictures/2"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 239.34152, "t": 548.37476, "r": 243.02518, "b": 542.16028, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "3", "text": "3"}, {"self_ref": "#/texts/219", "parent": {"cref": "#/pictures/2"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 271.32852, "t": 548.5061, "r": 275.01218, "b": 542.29163, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "4", "text": "4"}, {"self_ref": "#/texts/220", "parent": {"cref": "#/pictures/2"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 229.81627, "t": 625.48505, "r": 233.49992000000003, "b": 619.27057, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "2", "text": "2"}, {"self_ref": "#/texts/221", "parent": {"cref": "#/pictures/2"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 257.24402, "t": 602.039, "r": 260.92767, "b": 595.82452, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "1", "text": "1"}, {"self_ref": "#/texts/222", "parent": {"cref": "#/pictures/2"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 186.87526, "t": 614.02332, "r": 190.55891, "b": 607.80884, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "3", "text": "3"}, {"self_ref": "#/texts/223", "parent": {"cref": "#/pictures/2"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 196.48746, "t": 622.9848, "r": 200.17111, "b": 616.77032, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "4", "text": "4"}, {"self_ref": "#/texts/224", "parent": {"cref": "#/pictures/2"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 169.74728, "t": 624.11774, "r": 175.72659, "b": 616.34961, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "A", "text": "A"}, {"self_ref": "#/texts/225", "parent": {"cref": "#/pictures/2"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 169.74728, "t": 585.16132, "r": 175.72659, "b": 577.39319, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "B", "text": "B"}, {"self_ref": "#/texts/226", "parent": {"cref": "#/pictures/2"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 274.29419, "t": 623.72028, "r": 280.2735, "b": 615.95215, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/227", "parent": {"cref": "#/pictures/2"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 359.56152, "t": 623.72028, "r": 365.54083, "b": 615.95215, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "D", "text": "D"}, {"self_ref": "#/texts/228", "parent": {"cref": "#/pictures/2"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 169.74728, "t": 548.78851, "r": 175.27112, "b": 541.02039, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "E", "text": "E"}, {"self_ref": "#/texts/229", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "section_header", "prov": [{"page_no": 7, "bbox": {"l": 134.765, "t": 486.70419, "r": 246.65197999999998, "b": 477.89725, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 19]}], "orig": "4.2 Language Syntax", "text": "4.2 Language Syntax", "level": 1}, {"self_ref": "#/texts/230", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 134.765, "t": 466.75223, "r": 363.79617, "b": 457.95526, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 51]}], "orig": "The OTSL representation follows these syntax rules:", "text": "The OTSL representation follows these syntax rules:"}, {"self_ref": "#/texts/231", "parent": {"cref": "#/groups/2"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 7, "bbox": {"l": 138.97299, "t": 444.82919, "r": 480.58902, "b": 424.06625, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 108]}], "orig": "1. Left-looking cell rule : The left neighbour of an \"L\" cell must be either another \"L\" cell or a \"C\" cell.", "text": "1. Left-looking cell rule : The left neighbour of an \"L\" cell must be either another \"L\" cell or a \"C\" cell.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/232", "parent": {"cref": "#/groups/2"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 7, "bbox": {"l": 138.97299, "t": 420.91519, "r": 480.59229000000005, "b": 400.15326000000005, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 106]}], "orig": "2. Up-looking cell rule : The upper neighbour of a \"U\" cell must be either another \"U\" cell or a \"C\" cell.", "text": "2. Up-looking cell rule : The upper neighbour of a \"U\" cell must be either another \"U\" cell or a \"C\" cell.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/233", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "section_header", "prov": [{"page_no": 7, "bbox": {"l": 138.97299, "t": 397.00219999999996, "r": 226.07360999999997, "b": 388.19525, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 20]}], "orig": "3. Cross cell rule :", "text": "3. Cross cell rule :", "level": 1}, {"self_ref": "#/texts/234", "parent": {"cref": "#/groups/3"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 7, "bbox": {"l": 151.70099, "t": 385.03323, "r": 480.59238, "b": 352.32629, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 167]}], "orig": "The left neighbour of an \"X\" cell must be either another \"X\" cell or a \"U\" cell, and the upper neighbour of an \"X\" cell must be either another \"X\" cell or an \"L\" cell.", "text": "The left neighbour of an \"X\" cell must be either another \"X\" cell or a \"U\" cell, and the upper neighbour of an \"X\" cell must be either another \"X\" cell or an \"L\" cell.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/235", "parent": {"cref": "#/groups/3"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 7, "bbox": {"l": 138.97299, "t": 349.17426, "r": 474.59018, "b": 340.36731, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 78]}], "orig": "4. First row rule : Only \"L\" cells and \"C\" cells are allowed in the first row.", "text": "4. First row rule : Only \"L\" cells and \"C\" cells are allowed in the first row.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/236", "parent": {"cref": "#/groups/3"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 7, "bbox": {"l": 138.97299, "t": 337.21625, "r": 480.58746, "b": 316.45432, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 84]}], "orig": "5. First column rule : Only \"U\" cells and \"C\" cells are allowed in the first column.", "text": "5. First column rule : Only \"U\" cells and \"C\" cells are allowed in the first column.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/237", "parent": {"cref": "#/groups/3"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 7, "bbox": {"l": 138.97299, "t": 313.30325, "r": 480.59457, "b": 292.54031, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 144]}], "orig": "6. Rectangular rule : The table representation is always rectangular - all rows must have an equal number of tokens, terminated with \"NL\" token.", "text": "6. Rectangular rule : The table representation is always rectangular - all rows must have an equal number of tokens, terminated with \"NL\" token.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/238", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 134.76498, "t": 279.40729, "r": 480.59583, "b": 151.05833000000007, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 848]}], "orig": "The application of these rules gives OTSL a set of unique properties. First of all, the OTSL enforces a strictly rectangular structure representation, where every new-line token starts a new row. As a consequence, all rows and all columns have exactly the same number of tokens, irrespective of cell spans. Secondly, the OTSL representation is unambiguous: Every table structure is represented in one way. In this representation every table cell corresponds to a \"C\"-cell token, which in case of spans is always located in the top-left corner of the table cell definition. Third, OTSL syntax rules are only backward-looking. As a consequence, every predicted token can be validated straight during sequence generation by looking at the previously predicted sequence. As such, OTSL can guarantee that every predicted sequence is syntactically valid.", "text": "The application of these rules gives OTSL a set of unique properties. First of all, the OTSL enforces a strictly rectangular structure representation, where every new-line token starts a new row. As a consequence, all rows and all columns have exactly the same number of tokens, irrespective of cell spans. Secondly, the OTSL representation is unambiguous: Every table structure is represented in one way. In this representation every table cell corresponds to a \"C\"-cell token, which in case of spans is always located in the top-left corner of the table cell definition. Third, OTSL syntax rules are only backward-looking. As a consequence, every predicted token can be validated straight during sequence generation by looking at the previously predicted sequence. As such, OTSL can guarantee that every predicted sequence is syntactically valid."}, {"self_ref": "#/texts/239", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 134.76498, "t": 147.89731000000006, "r": 480.59265, "b": 127.14533000000006, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 153]}], "orig": "These characteristics can be easily learned by sequence generator networks, as we demonstrate further below. We find strong indications that this pattern", "text": "These characteristics can be easily learned by sequence generator networks, as we demonstrate further below. We find strong indications that this pattern"}, {"self_ref": "#/texts/240", "parent": {"cref": "#/body"}, "children": [], "content_layer": "furniture", "label": "page_header", "prov": [{"page_no": 8, "bbox": {"l": 134.765, "t": 698.229, "r": 139.37193, "b": 690.1593, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "8", "text": "8"}, {"self_ref": "#/texts/241", "parent": {"cref": "#/body"}, "children": [], "content_layer": "furniture", "label": "page_header", "prov": [{"page_no": 8, "bbox": {"l": 167.81335, "t": 698.229, "r": 231.72227, "b": 690.1593, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 16]}], "orig": "M. Lysak, et al.", "text": "M. Lysak, et al."}, {"self_ref": "#/texts/242", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 134.765, "t": 673.06622, "r": 480.58884000000006, "b": 652.31421, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 84]}], "orig": "reduces significantly the column drift seen in the HTML based models (see Figure 5).", "text": "reduces significantly the column drift seen in the HTML based models (see Figure 5)."}, {"self_ref": "#/texts/243", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "section_header", "prov": [{"page_no": 8, "bbox": {"l": 134.765, "t": 630.44318, "r": 319.34708, "b": 621.63623, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 35]}], "orig": "4.3 Error-detection and -mitigation", "text": "4.3 Error-detection and -mitigation", "level": 1}, {"self_ref": "#/texts/244", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 134.765, "t": 609.7182, "r": 480.5957599999999, "b": 493.32416, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 797]}], "orig": "The design of OTSL allows to validate a table structure easily on an unfinished sequence. The detection of an invalid sequence token is a clear indication of a prediction mistake, however a valid sequence by itself does not guarantee prediction correctness. Different heuristics can be used to correct token errors in an invalid sequence and thus increase the chances for accurate predictions. Such heuristics can be applied either after the prediction of each token, or at the end on the entire predicted sequence. For example a simple heuristic which can correct the predicted OTSL sequence on-the-fly is to verify if the token with the highest prediction confidence invalidates the predicted sequence, and replace it by the token with the next highest confidence until OTSL rules are satisfied.", "text": "The design of OTSL allows to validate a table structure easily on an unfinished sequence. The detection of an invalid sequence token is a clear indication of a prediction mistake, however a valid sequence by itself does not guarantee prediction correctness. Different heuristics can be used to correct token errors in an invalid sequence and thus increase the chances for accurate predictions. Such heuristics can be applied either after the prediction of each token, or at the end on the entire predicted sequence. For example a simple heuristic which can correct the predicted OTSL sequence on-the-fly is to verify if the token with the highest prediction confidence invalidates the predicted sequence, and replace it by the token with the next highest confidence until OTSL rules are satisfied."}, {"self_ref": "#/texts/245", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "section_header", "prov": [{"page_no": 8, "bbox": {"l": 134.765, "t": 470.836, "r": 229.03534, "b": 460.26760999999993, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 13]}], "orig": "5 Experiments", "text": "5 Experiments", "level": 1}, {"self_ref": "#/texts/246", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 134.765, "t": 444.75015, "r": 480.59528, "b": 340.3122900000001, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 684]}], "orig": "To evaluate the impact of OTSL on prediction accuracy and inference times, we conducted a series of experiments based on the TableFormer model (Figure 4) with two objectives: Firstly we evaluate the prediction quality and performance of OTSL vs. HTML after performing Hyper Parameter Optimization (HPO) on the canonical PubTabNet data set. Secondly we pick the best hyper-parameters found in the first step and evaluate how OTSL impacts the performance of TableFormer after training on other publicly available data sets (FinTabNet, PubTables-1M [14]). The ground truth (GT) from all data sets has been converted into OTSL format for this purpose, and will be made publicly available.", "text": "To evaluate the impact of OTSL on prediction accuracy and inference times, we conducted a series of experiments based on the TableFormer model (Figure 4) with two objectives: Firstly we evaluate the prediction quality and performance of OTSL vs. HTML after performing Hyper Parameter Optimization (HPO) on the canonical PubTabNet data set. Secondly we pick the best hyper-parameters found in the first step and evaluate how OTSL impacts the performance of TableFormer after training on other publicly available data sets (FinTabNet, PubTables-1M [14]). The ground truth (GT) from all data sets has been converted into OTSL format for this purpose, and will be made publicly available."}, {"self_ref": "#/texts/247", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "caption", "prov": [{"page_no": 8, "bbox": {"l": 134.76501, "t": 307.35187, "r": 480.59082, "b": 288.26035, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 104]}], "orig": "Fig. 4. Architecture sketch of the TableFormer model, which is a representative for the Im2Seq approach.", "text": "Fig. 4. Architecture sketch of the TableFormer model, which is a representative for the Im2Seq approach."}, {"self_ref": "#/texts/248", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 147.30025, "t": 251.26836000000003, "r": 149.70605, "b": 248.89992000000007, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "1.", "text": "1."}, {"self_ref": "#/texts/249", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 150.90895, "t": 251.26836000000003, "r": 155.72055, "b": 248.89992000000007, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "Item", "text": "Item"}, {"self_ref": "#/texts/250", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 162.75987, "t": 256.60619999999994, "r": 172.2963, "b": 254.23775999999998, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 6]}], "orig": "Amount", "text": "Amount"}, {"self_ref": "#/texts/251", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 147.63603, "t": 256.63384999999994, "r": 155.91753, "b": 254.26540999999997, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 5]}], "orig": "Names", "text": "Names"}, {"self_ref": "#/texts/252", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 158.48466, "t": 251.26836000000003, "r": 164.10178, "b": 248.89992000000007, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "1000", "text": "1000"}, {"self_ref": "#/texts/253", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 158.48466, "t": 247.32934999999998, "r": 162.69737, "b": 244.96091, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 3]}], "orig": "500", "text": "500"}, {"self_ref": "#/texts/254", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 158.48466, "t": 243.08736, "r": 164.10178, "b": 240.71892000000003, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "3500", "text": "3500"}, {"self_ref": "#/texts/255", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 158.48466, "t": 238.84535000000005, "r": 162.69737, "b": 236.47690999999998, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 3]}], "orig": "150", "text": "150"}, {"self_ref": "#/texts/256", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 168.81696, "t": 251.26836000000003, "r": 172.88876, "b": 248.89992000000007, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "unit", "text": "unit"}, {"self_ref": "#/texts/257", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 168.81696, "t": 247.32934999999998, "r": 172.88876, "b": 244.96091, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "unit", "text": "unit"}, {"self_ref": "#/texts/258", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 168.81696, "t": 243.08736, "r": 172.88876, "b": 240.71892000000003, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "unit", "text": "unit"}, {"self_ref": "#/texts/259", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 168.81696, "t": 238.84535000000005, "r": 172.88876, "b": 236.47690999999998, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "unit", "text": "unit"}, {"self_ref": "#/texts/260", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 147.30025, "t": 247.32934999999998, "r": 149.70605, "b": 244.96091, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "2.", "text": "2."}, {"self_ref": "#/texts/261", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 150.90895, "t": 247.32934999999998, "r": 155.72055, "b": 244.96091, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "Item", "text": "Item"}, {"self_ref": "#/texts/262", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 147.30025, "t": 243.08736, "r": 149.70605, "b": 240.71892000000003, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "3.", "text": "3."}, {"self_ref": "#/texts/263", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 150.90895, "t": 243.08736, "r": 155.72055, "b": 240.71892000000003, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "Item", "text": "Item"}, {"self_ref": "#/texts/264", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 147.30025, "t": 238.84535000000005, "r": 149.70605, "b": 236.47690999999998, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "4.", "text": "4."}, {"self_ref": "#/texts/265", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 150.90895, "t": 238.84535000000005, "r": 155.72055, "b": 236.47690999999998, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "Item", "text": "Item"}, {"self_ref": "#/texts/266", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 152.05046, "t": 274.99019999999996, "r": 171.24945, "b": 270.72702000000004, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 9]}], "orig": "Extracted", "text": "Extracted"}, {"self_ref": "#/texts/267", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 148.13347, "t": 269.6877099999999, "r": 175.16759, "b": 265.42453, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 12]}], "orig": "Table Images", "text": "Table Images"}, {"self_ref": "#/texts/268", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 193.53331, "t": 267.48578, "r": 220.31973, "b": 263.22260000000006, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 12]}], "orig": "Standardized", "text": "Standardized"}, {"self_ref": "#/texts/269", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 199.47311, "t": 262.18328999999994, "r": 214.37889, "b": 257.92010000000005, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 6]}], "orig": "Images", "text": "Images"}, {"self_ref": "#/texts/270", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 273.61066, "t": 282.0947, "r": 284.47275, "b": 277.83151, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "BBox", "text": "BBox"}, {"self_ref": "#/texts/271", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 270.45187, "t": 278.30716000000007, "r": 287.63242, "b": 274.0439799999999, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 7]}], "orig": "Decoder", "text": "Decoder"}, {"self_ref": "#/texts/272", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 332.47852, "t": 283.85562, "r": 348.14014, "b": 279.59244, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 6]}], "orig": "BBoxes", "text": "BBoxes"}, {"self_ref": "#/texts/273", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 376.68622, "t": 270.87976000000003, "r": 407.25497, "b": 266.61658, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 13]}], "orig": "BBoxes can be", "text": "BBoxes can be"}, {"self_ref": "#/texts/274", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 373.90869, "t": 266.33475, "r": 410.03506, "b": 262.07156, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 18]}], "orig": "traced back to the", "text": "traced back to the"}, {"self_ref": "#/texts/275", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 375.29871, "t": 261.78976, "r": 408.64902, "b": 257.52657999999997, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 17]}], "orig": "original image to", "text": "original image to"}, {"self_ref": "#/texts/276", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 377.06747, "t": 257.24478, "r": 406.88312, "b": 252.98157000000003, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 15]}], "orig": "extract content", "text": "extract content"}, {"self_ref": "#/texts/277", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 383.56683, "t": 228.75824, "r": 433.76544, "b": 224.49503000000004, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 23]}], "orig": "Structure Tags sequence", "text": "Structure Tags sequence"}, {"self_ref": "#/texts/278", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 383.52768, "t": 224.21324000000004, "r": 433.80764999999997, "b": 219.95002999999997, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 27]}], "orig": "provide full description of", "text": "provide full description of"}, {"self_ref": "#/texts/279", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 390.47522, "t": 219.66823, "r": 426.85703, "b": 215.40500999999995, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 19]}], "orig": "the table structure", "text": "the table structure"}, {"self_ref": "#/texts/280", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 293.94702, "t": 214.10857, "r": 323.1691, "b": 209.84535000000005, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 14]}], "orig": "Structure Tags", "text": "Structure Tags"}, {"self_ref": "#/texts/281", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 293.94702, "t": 209.56352000000004, "r": 324.59396, "b": 205.30030999999997, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 14]}], "orig": "in OTSL format", "text": "in OTSL format"}, {"self_ref": "#/texts/282", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 333.07819, "t": 250.17731000000003, "r": 364.14691, "b": 245.91409, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 14]}], "orig": "BBoxes in sync", "text": "BBoxes in sync"}, {"self_ref": "#/texts/283", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 333.07819, "t": 246.38980000000004, "r": 369.71542, "b": 242.12658999999996, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 17]}], "orig": "with tag sequence", "text": "with tag sequence"}, {"self_ref": "#/texts/284", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 232.65881000000002, "t": 276.75861, "r": 249.58894000000004, "b": 272.49541999999997, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 7]}], "orig": "Encoder", "text": "Encoder"}, {"self_ref": "#/texts/285", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 269.8219, "t": 246.02898000000005, "r": 288.26279, "b": 241.76576, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 9]}], "orig": "Structure", "text": "Structure"}, {"self_ref": "#/texts/286", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 270.45187, "t": 242.24149, "r": 287.63242, "b": 237.97827000000007, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 7]}], "orig": "Decoder", "text": "Decoder"}, {"self_ref": "#/texts/287", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 332.17676, "t": 276.08795, "r": 358.11206, "b": 271.82476999999994, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 16]}], "orig": "[x1, y2, x2, y2]", "text": "[x1, y2, x2, y2]"}, {"self_ref": "#/texts/288", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 332.17676, "t": 270.0279499999999, "r": 361.58298, "b": 265.76477, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 20]}], "orig": "[x1', y2', x2', y2']", "text": "[x1', y2', x2', y2']"}, {"self_ref": "#/texts/289", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 332.17676, "t": 263.96795999999995, "r": 364.76474, "b": 259.70477000000005, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 24]}], "orig": "[x1'', y2'', x2'', y2'']", "text": "[x1'', y2'', x2'', y2'']"}, {"self_ref": "#/texts/290", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 332.17676, "t": 257.90796, "r": 335.96548, "b": 253.64476000000002, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 3]}], "orig": "...", "text": "..."}, {"self_ref": "#/texts/291", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 326.8894, "t": 275.60492, "r": 329.41641, "b": 271.3417400000001, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "1", "text": "1"}, {"self_ref": "#/texts/292", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 327.04089, "t": 269.5752299999999, "r": 329.5679, "b": 265.31204, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "2", "text": "2"}, {"self_ref": "#/texts/293", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 327.04089, "t": 263.48492, "r": 329.5679, "b": 259.22173999999995, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "3", "text": "3"}, {"self_ref": "#/texts/294", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 424.14102, "t": 264.55716000000007, "r": 426.66803, "b": 260.2939799999999, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "3", "text": "3"}, {"self_ref": "#/texts/295", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 453.0018, "t": 274.5460499999999, "r": 455.52881, "b": 270.28287, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "2", "text": "2"}, {"self_ref": "#/texts/296", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 423.85825, "t": 274.93719, "r": 426.38525, "b": 270.67400999999995, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "1", "text": "1"}, {"self_ref": "#/texts/297", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 333.4342, "t": 234.63320999999996, "r": 337.27542, "b": 229.64281000000005, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/298", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 340.35397, "t": 234.68321000000003, "r": 344.19519, "b": 229.69281, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/299", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 340.30978, "t": 228.13461000000007, "r": 344.151, "b": 223.14420999999993, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/300", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 346.79904, "t": 228.13132999999993, "r": 350.64026, "b": 223.14093000000003, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/301", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 333.59583, "t": 228.17728999999997, "r": 337.43704, "b": 223.18688999999995, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/302", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 340.37543, "t": 221.57326999999998, "r": 344.21664, "b": 216.58286999999996, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/303", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 346.86469, "t": 221.56998999999996, "r": 350.7059, "b": 216.57959000000005, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/304", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 333.66144, "t": 221.61595, "r": 337.50266, "b": 216.62554999999998, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/305", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 340.37671, "t": 214.97393999999997, "r": 344.21793, "b": 209.98354000000006, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/306", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 346.86597, "t": 214.97065999999995, "r": 350.70718, "b": 209.98026000000004, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/307", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 333.66272, "t": 215.01662, "r": 337.50394, "b": 210.02621, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/308", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 340.27948, "t": 208.60262999999998, "r": 344.1207, "b": 203.61222999999995, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/309", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 346.76874, "t": 208.59932000000003, "r": 350.60995, "b": 203.60892, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/310", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 333.56549, "t": 208.64526, "r": 337.40671, "b": 203.65485999999999, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/311", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 353.03326, "t": 235.11687000000006, "r": 359.83362, "b": 230.12645999999995, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "NL", "text": "NL"}, {"self_ref": "#/texts/312", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 353.18604, "t": 228.41956000000005, "r": 359.98639, "b": 223.42915000000005, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "NL", "text": "NL"}, {"self_ref": "#/texts/313", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 353.19864, "t": 221.83764999999994, "r": 359.99899, "b": 216.84724000000006, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "NL", "text": "NL"}, {"self_ref": "#/texts/314", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 353.1532, "t": 215.23388999999997, "r": 359.95355, "b": 210.24347999999998, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "NL", "text": "NL"}, {"self_ref": "#/texts/315", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 353.26935, "t": 208.59371999999996, "r": 360.0697, "b": 203.60331999999994, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "NL", "text": "NL"}, {"self_ref": "#/texts/316", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 347.37979, "t": 234.91764999999998, "r": 350.33786, "b": 229.92724999999996, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "L", "text": "L"}, {"self_ref": "#/texts/317", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 331.14026, "t": 227.70922999999993, "r": 333.66727, "b": 223.44601, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "3", "text": "3"}, {"self_ref": "#/texts/318", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 340.80972, "t": 237.40688, "r": 343.33673, "b": 233.14365999999995, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "2", "text": "2"}, {"self_ref": "#/texts/319", "parent": {"cref": "#/pictures/3"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 330.97992, "t": 237.16965000000005, "r": 333.50693, "b": 232.90643, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "1", "text": "1"}, {"self_ref": "#/texts/320", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 134.765, "t": 171.80722000000003, "r": 480.5917400000001, "b": 127.14524000000006, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 299]}], "orig": "We rely on standard metrics such as Tree Edit Distance score (TEDs) for table structure prediction, and Mean Average Precision (mAP) with 0.75 Intersection Over Union (IOU) threshold for the bounding-box predictions of table cells. The predicted OTSL structures were converted back to HTML format in", "text": "We rely on standard metrics such as Tree Edit Distance score (TEDs) for table structure prediction, and Mean Average Precision (mAP) with 0.75 Intersection Over Union (IOU) threshold for the bounding-box predictions of table cells. The predicted OTSL structures were converted back to HTML format in"}, {"self_ref": "#/texts/321", "parent": {"cref": "#/body"}, "children": [], "content_layer": "furniture", "label": "page_header", "prov": [{"page_no": 9, "bbox": {"l": 194.478, "t": 698.229, "r": 447.54291000000006, "b": 690.1593, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 60]}], "orig": "Optimized Table Tokenization for Table Structure Recognition", "text": "Optimized Table Tokenization for Table Structure Recognition"}, {"self_ref": "#/texts/322", "parent": {"cref": "#/body"}, "children": [], "content_layer": "furniture", "label": "page_header", "prov": [{"page_no": 9, "bbox": {"l": 475.98431, "t": 698.229, "r": 480.59125000000006, "b": 690.1593, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "9", "text": "9"}, {"self_ref": "#/texts/323", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 9, "bbox": {"l": 134.765, "t": 673.06622, "r": 480.59579, "b": 640.35822, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 163]}], "orig": "order to compute the TED score. Inference timing results for all experiments were obtained from the same machine on a single core with AMD EPYC 7763 CPU @2.45 GHz.", "text": "order to compute the TED score. Inference timing results for all experiments were obtained from the same machine on a single core with AMD EPYC 7763 CPU @2.45 GHz."}, {"self_ref": "#/texts/324", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "section_header", "prov": [{"page_no": 9, "bbox": {"l": 134.765, "t": 622.81415, "r": 318.44843, "b": 614.0072, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 32]}], "orig": "5.1 Hyper Parameter Optimization", "text": "5.1 Hyper Parameter Optimization", "level": 1}, {"self_ref": "#/texts/325", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 9, "bbox": {"l": 134.76498, "t": 606.41418, "r": 480.59277, "b": 537.84113, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 423]}], "orig": "We have chosen the PubTabNet data set to perform HPO, since it includes a highly diverse set of tables. Also we report TED scores separately for simple and complex tables (tables with cell spans). Results are presented in Table. 1. It is evident that with OTSL, our model achieves the same TED score and slightly better mAP scores in comparison to HTML. However OTSL yields a 2x speed up in the inference runtime over HTML.", "text": "We have chosen the PubTabNet data set to perform HPO, since it includes a highly diverse set of tables. Also we report TED scores separately for simple and complex tables (tables with cell spans). Results are presented in Table. 1. It is evident that with OTSL, our model achieves the same TED score and slightly better mAP scores in comparison to HTML. However OTSL yields a 2x speed up in the inference runtime over HTML."}, {"self_ref": "#/texts/326", "parent": {"cref": "#/tables/0"}, "children": [], "content_layer": "body", "label": "caption", "prov": [{"page_no": 9, "bbox": {"l": 134.76498, "t": 516.92767, "r": 480.5954, "b": 464.9592, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 398]}], "orig": "Table 1. HPO performed in OTSL and HTML representation on the same transformer-based TableFormer [9] architecture, trained only on PubTabNet [22]. Effects of reducing the # of layers in encoder and decoder stages of the model show that smaller models trained on OTSL perform better, especially in recognizing complex table structures, and maintain a much higher mAP score than the HTML counterpart.", "text": "Table 1. HPO performed in OTSL and HTML representation on the same transformer-based TableFormer [9] architecture, trained only on PubTabNet [22]. Effects of reducing the # of layers in encoder and decoder stages of the model show that smaller models trained on OTSL perform better, especially in recognizing complex table structures, and maintain a much higher mAP score than the HTML counterpart."}, {"self_ref": "#/texts/327", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "section_header", "prov": [{"page_no": 9, "bbox": {"l": 134.765, "t": 283.84821, "r": 264.40332, "b": 275.04125999999997, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 24]}], "orig": "5.2 Quantitative Results", "text": "5.2 Quantitative Results", "level": 1}, {"self_ref": "#/texts/328", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 9, "bbox": {"l": 134.765, "t": 267.44921999999997, "r": 480.5957599999999, "b": 174.96525999999994, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 555]}], "orig": "We picked the model parameter configuration that produced the best prediction quality (enc=6, dec=6, heads=8) with PubTabNet alone, then independently trained and evaluated it on three publicly available data sets: PubTabNet (395k samples), FinTabNet (113k samples) and PubTables-1M (about 1M samples). Performance results are presented in Table. 2. It is clearly evident that the model trained on OTSL outperforms HTML across the board, keeping high TEDs and mAP scores even on difficult financial tables (FinTabNet) that contain sparse and large tables.", "text": "We picked the model parameter configuration that produced the best prediction quality (enc=6, dec=6, heads=8) with PubTabNet alone, then independently trained and evaluated it on three publicly available data sets: PubTabNet (395k samples), FinTabNet (113k samples) and PubTables-1M (about 1M samples). Performance results are presented in Table. 2. It is clearly evident that the model trained on OTSL outperforms HTML across the board, keeping high TEDs and mAP scores even on difficult financial tables (FinTabNet) that contain sparse and large tables."}, {"self_ref": "#/texts/329", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 9, "bbox": {"l": 134.765, "t": 171.80722000000003, "r": 480.5957599999999, "b": 127.14524000000006, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 289]}], "orig": "Additionally, the results show that OTSL has an advantage over HTML when applied on a bigger data set like PubTables-1M and achieves significantly improved scores. Finally, OTSL achieves faster inference due to fewer decoding steps which is a result of the reduced sequence representation.", "text": "Additionally, the results show that OTSL has an advantage over HTML when applied on a bigger data set like PubTables-1M and achieves significantly improved scores. Finally, OTSL achieves faster inference due to fewer decoding steps which is a result of the reduced sequence representation."}, {"self_ref": "#/texts/330", "parent": {"cref": "#/body"}, "children": [], "content_layer": "furniture", "label": "page_header", "prov": [{"page_no": 10, "bbox": {"l": 134.765, "t": 698.229, "r": 143.97887, "b": 690.1593, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "10", "text": "10"}, {"self_ref": "#/texts/331", "parent": {"cref": "#/body"}, "children": [], "content_layer": "furniture", "label": "page_header", "prov": [{"page_no": 10, "bbox": {"l": 167.82053, "t": 698.229, "r": 231.72049000000004, "b": 690.1593, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 16]}], "orig": "M. Lysak, et al.", "text": "M. Lysak, et al."}, {"self_ref": "#/texts/332", "parent": {"cref": "#/tables/1"}, "children": [], "content_layer": "body", "label": "caption", "prov": [{"page_no": 10, "bbox": {"l": 134.765, "t": 676.16382, "r": 480.59357000000006, "b": 646.11334, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 192]}], "orig": "Table 2. TSR and cell detection results compared between OTSL and HTML on the PubTabNet [22], FinTabNet [21] and PubTables-1M [14] data sets using TableFormer [9] (with enc=6, dec=6, heads=8).", "text": "Table 2. TSR and cell detection results compared between OTSL and HTML on the PubTabNet [22], FinTabNet [21] and PubTables-1M [14] data sets using TableFormer [9] (with enc=6, dec=6, heads=8)."}, {"self_ref": "#/texts/333", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "section_header", "prov": [{"page_no": 10, "bbox": {"l": 134.765, "t": 503.08521, "r": 257.08679, "b": 494.27826000000005, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 23]}], "orig": "5.3 Qualitative Results", "text": "5.3 Qualitative Results", "level": 1}, {"self_ref": "#/texts/334", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 134.765, "t": 482.13922, "r": 480.58981, "b": 425.52231, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 309]}], "orig": "To illustrate the qualitative differences between OTSL and HTML, Figure 5 demonstrates less overlap and more accurate bounding boxes with OTSL. In Figure 6, OTSL proves to be more effective in handling tables with longer token sequences, resulting in even more precise structure prediction and bounding boxes.", "text": "To illustrate the qualitative differences between OTSL and HTML, Figure 5 demonstrates less overlap and more accurate bounding boxes with OTSL. In Figure 6, OTSL proves to be more effective in handling tables with longer token sequences, resulting in even more precise structure prediction and bounding boxes."}, {"self_ref": "#/texts/335", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "caption", "prov": [{"page_no": 10, "bbox": {"l": 134.765, "t": 394.40988, "r": 480.59106, "b": 352.28284, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 270]}], "orig": "Fig. 5. The OTSL model produces more accurate bounding boxes with less overlap (E) than the HTML model (D), when predicting the structure of a sparse table (A), at twice the inference speed because of shorter sequence length (B),(C). \"PMC2807444_006_00.png\" PubTabNet. \u03bc", "text": "Fig. 5. The OTSL model produces more accurate bounding boxes with less overlap (E) than the HTML model (D), when predicting the structure of a sparse table (A), at twice the inference speed because of shorter sequence length (B),(C). \"PMC2807444_006_00.png\" PubTabNet. \u03bc"}, {"self_ref": "#/texts/336", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 180.12473, "t": 275.7667799999999, "r": 190.62042, "b": 273.05008, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 7]}], "orig": "<table>", "text": "<table>"}, {"self_ref": "#/texts/337", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 183.2438, "t": 271.86792, "r": 304.54797, "b": 269.15121, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 81]}], "orig": "<tr><td></td><td colspan=\"4\"></td><td colspan=\"6\"></td><td colspan=\"3\"></td></tr>", "text": "<tr><td></td><td colspan=\"4\"></td><td colspan=\"6\"></td><td colspan=\"3\"></td></tr>"}, {"self_ref": "#/texts/338", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 183.2438, "t": 267.96906, "r": 388.42313, "b": 265.25235, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 135]}], "orig": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>"}, {"self_ref": "#/texts/339", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 183.2438, "t": 264.07022000000006, "r": 388.42313, "b": 261.35352, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 135]}], "orig": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>"}, {"self_ref": "#/texts/340", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 183.2438, "t": 260.17139, "r": 388.42313, "b": 257.45468000000005, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 135]}], "orig": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>"}, {"self_ref": "#/texts/341", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 183.2438, "t": 256.27252, "r": 388.42313, "b": 253.55582000000004, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 135]}], "orig": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>"}, {"self_ref": "#/texts/342", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 183.2438, "t": 252.37369, "r": 388.42313, "b": 249.65697, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 135]}], "orig": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>"}, {"self_ref": "#/texts/343", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 183.2438, "t": 248.47483999999997, "r": 388.42313, "b": 245.75811999999996, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 135]}], "orig": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>"}, {"self_ref": "#/texts/344", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 183.2438, "t": 244.57599000000005, "r": 388.42313, "b": 241.85927000000004, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 135]}], "orig": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>"}, {"self_ref": "#/texts/345", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 183.2438, "t": 240.67714, "r": 388.42313, "b": 237.96042, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 135]}], "orig": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>"}, {"self_ref": "#/texts/346", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 180.12473, "t": 236.77827000000002, "r": 191.86806, "b": 234.06155, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 8]}], "orig": "</table>", "text": "</table>"}, {"self_ref": "#/texts/347", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 407.38348, "t": 273.69957999999997, "r": 408.82025, "b": 270.98288, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/348", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 410.25699, "t": 273.69957999999997, "r": 450.48605, "b": 270.98288, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 28]}], "orig": "C L L L C L L L L L C L L NL", "text": "C L L L C L L L L L C L L NL"}, {"self_ref": "#/texts/349", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 407.38348, "t": 269.80075, "r": 408.82025, "b": 267.08404999999993, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/350", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 410.25699, "t": 269.80075, "r": 450.48605, "b": 267.08404999999993, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 28]}], "orig": "C C C C C C C C C C C C C NL", "text": "C C C C C C C C C C C C C NL"}, {"self_ref": "#/texts/351", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 407.38348, "t": 265.90192, "r": 408.82025, "b": 263.18521, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/352", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 410.25699, "t": 265.90192, "r": 450.48605, "b": 263.18521, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 28]}], "orig": "C C C C C C C C C C C C C NL", "text": "C C C C C C C C C C C C C NL"}, {"self_ref": "#/texts/353", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 407.38348, "t": 262.00305000000003, "r": 408.82025, "b": 259.2863500000001, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/354", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 410.25699, "t": 262.00305000000003, "r": 450.48605, "b": 259.2863500000001, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 28]}], "orig": "C C C C C C C C C C C C C NL", "text": "C C C C C C C C C C C C C NL"}, {"self_ref": "#/texts/355", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 407.38348, "t": 258.10421999999994, "r": 408.82025, "b": 255.38750000000005, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/356", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 410.25699, "t": 258.10421999999994, "r": 450.48605, "b": 255.38750000000005, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 28]}], "orig": "C C C C C C C C C C C C C NL", "text": "C C C C C C C C C C C C C NL"}, {"self_ref": "#/texts/357", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 407.38348, "t": 254.20537000000002, "r": 408.82025, "b": 251.48865, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/358", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 410.25699, "t": 254.20537000000002, "r": 450.48605, "b": 251.48865, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 28]}], "orig": "C C C C C C C C C C C C C NL", "text": "C C C C C C C C C C C C C NL"}, {"self_ref": "#/texts/359", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 407.38348, "t": 250.30651999999998, "r": 408.82025, "b": 247.58979999999997, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/360", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 410.25699, "t": 250.30651999999998, "r": 450.48605, "b": 247.58979999999997, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 28]}], "orig": "C C C C C C C C C C C C C NL", "text": "C C C C C C C C C C C C C NL"}, {"self_ref": "#/texts/361", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 407.38348, "t": 246.40767000000005, "r": 408.82025, "b": 243.69094999999993, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/362", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 410.25699, "t": 246.40767000000005, "r": 450.48605, "b": 243.69094999999993, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 28]}], "orig": "C C C C C C C C C C C C C NL", "text": "C C C C C C C C C C C C C NL"}, {"self_ref": "#/texts/363", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 407.38348, "t": 242.50880000000006, "r": 408.82025, "b": 239.79207999999994, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/364", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 410.25699, "t": 242.50880000000006, "r": 450.48605, "b": 239.79207999999994, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 28]}], "orig": "C C C C C C C C C C C C C NL", "text": "C C C C C C C C C C C C C NL"}, {"self_ref": "#/texts/365", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 164.52881, "t": 282.54141, "r": 181.8528, "b": 276.69000000000005, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "HTML", "text": "HTML"}, {"self_ref": "#/texts/366", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 183.58441, "t": 282.54141, "r": 186.3974, "b": 276.69000000000005, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "#", "text": "#"}, {"self_ref": "#/texts/367", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 189.2104, "t": 282.54141, "r": 208.90137, "b": 276.69000000000005, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 7]}], "orig": "tokens:", "text": "tokens:"}, {"self_ref": "#/texts/368", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 210.63269, "t": 282.54141, "r": 221.04044, "b": 276.69000000000005, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 3]}], "orig": "258", "text": "258"}, {"self_ref": "#/texts/369", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 390.20203, "t": 282.39639, "r": 406.83609, "b": 276.54498, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "OTSL", "text": "OTSL"}, {"self_ref": "#/texts/370", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 408.56952, "t": 282.39639, "r": 411.38251, "b": 276.54498, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "#", "text": "#"}, {"self_ref": "#/texts/371", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 414.1955, "t": 282.39639, "r": 433.88647000000003, "b": 276.54498, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 7]}], "orig": "tokens:", "text": "tokens:"}, {"self_ref": "#/texts/372", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 435.61737, "t": 282.39639, "r": 446.02512, "b": 276.54498, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 3]}], "orig": "135", "text": "135"}, {"self_ref": "#/texts/373", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 167.19316, "t": 272.92764, "r": 172.8231, "b": 265.61339999999996, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "B", "text": "B"}, {"self_ref": "#/texts/374", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 187.33745, "t": 343.37515, "r": 192.96739, "b": 336.06091, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "A", "text": "A"}, {"self_ref": "#/texts/375", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 167.38654, "t": 225.99484000000007, "r": 173.01648, "b": 218.68060000000003, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "D", "text": "D"}, {"self_ref": "#/texts/376", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 248.45621000000003, "t": 170.21992, "r": 253.65727, "b": 162.90569000000005, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "E", "text": "E"}, {"self_ref": "#/texts/377", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 395.90057, "t": 272.80053999999996, "r": 401.53052, "b": 265.4863, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/378", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 171.62886, "t": 211.71146999999996, "r": 177.48148, "b": 194.73216000000002, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "HTML", "text": "HTML"}, {"self_ref": "#/texts/379", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 251.05969000000002, "t": 158.36591999999996, "r": 256.91235, "b": 142.07655, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "OTSL", "text": "OTSL"}, {"self_ref": "#/texts/380", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 372.14645, "t": 190.54276000000004, "r": 427.0379, "b": 184.69136000000003, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 16]}], "orig": "HTML model shows", "text": "HTML model shows"}, {"self_ref": "#/texts/381", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 372.14645, "t": 184.10051999999996, "r": 430.06838999999997, "b": 178.24913000000004, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 21]}], "orig": "bounding box drifting", "text": "bounding box drifting"}, {"self_ref": "#/texts/382", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 176.88042, "t": 149.12791000000004, "r": 231.08191, "b": 143.27652, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 16]}], "orig": "OTSL model shows", "text": "OTSL model shows"}, {"self_ref": "#/texts/383", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 176.88042, "t": 142.6857, "r": 230.99271000000002, "b": 136.83429999999998, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 18]}], "orig": "clean bounding box", "text": "clean bounding box"}, {"self_ref": "#/texts/384", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 176.88042, "t": 136.24344999999994, "r": 203.93219, "b": 130.39206000000001, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 9]}], "orig": "alignment", "text": "alignment"}, {"self_ref": "#/texts/385", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 215.93231000000003, "t": 234.43658000000005, "r": 218.4697, "b": 222.84033, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "\u2264", "text": "\u2264"}, {"self_ref": "#/texts/386", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 229.05689999999998, "t": 234.43658000000005, "r": 231.71908999999997, "b": 222.84033, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "\u03bc", "text": "\u03bc"}, {"self_ref": "#/texts/387", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 261.20892, "t": 343.53876, "r": 263.56973, "b": 340.80273, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "S", "text": "S"}, {"self_ref": "#/texts/388", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 312.33463, "t": 343.53876, "r": 313.6362, "b": 340.80273, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "I", "text": "I"}, {"self_ref": "#/texts/389", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 377.41125, "t": 343.53876, "r": 380.05737, "b": 340.80273, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "R", "text": "R"}, {"self_ref": "#/texts/390", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 200.63976, "t": 338.66003, "r": 205.82492, "b": 335.92401, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "ST", "text": "ST"}, {"self_ref": "#/texts/391", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 222.20833000000002, "t": 338.66003, "r": 229.76836, "b": 335.92401, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "0.03", "text": "0.03"}, {"self_ref": "#/texts/392", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 243.26666, "t": 338.66003, "r": 250.82669, "b": 335.92401, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "0.06", "text": "0.06"}, {"self_ref": "#/texts/393", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 264.29657, "t": 338.66003, "r": 271.84949, "b": 335.92401, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "0.12", "text": "0.12"}, {"self_ref": "#/texts/394", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 285.31943, "t": 338.66003, "r": 292.87946, "b": 335.92401, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "0.25", "text": "0.25"}, {"self_ref": "#/texts/395", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 306.37775, "t": 338.66003, "r": 311.77319, "b": 335.92401, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 3]}], "orig": "0.5", "text": "0.5"}, {"self_ref": "#/texts/396", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 323.41699, "t": 338.66003, "r": 325.58157, "b": 335.92401, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "1", "text": "1"}, {"self_ref": "#/texts/397", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 334.45807, "t": 338.66003, "r": 336.62265, "b": 335.92401, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "2", "text": "2"}, {"self_ref": "#/texts/398", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 345.52756, "t": 338.66003, "r": 347.69214, "b": 335.92401, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "4", "text": "4"}, {"self_ref": "#/texts/399", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 356.56863, "t": 338.66003, "r": 358.73322, "b": 335.92401, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "8", "text": "8"}, {"self_ref": "#/texts/400", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 367.63812, "t": 338.66003, "r": 371.97089, "b": 335.92401, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "16", "text": "16"}, {"self_ref": "#/texts/401", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 382.6734, "t": 338.66003, "r": 387.00616, "b": 335.92401, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "32", "text": "32"}, {"self_ref": "#/texts/402", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 397.73727, "t": 338.66003, "r": 402.07001, "b": 335.92401, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "64", "text": "64"}, {"self_ref": "#/texts/403", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 412.78879, "t": 344.00702, "r": 414.93463, "b": 334.20035000000007, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "\u2265", "text": "\u2265"}, {"self_ref": "#/texts/404", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 414.95697, "t": 338.66003, "r": 422.51746, "b": 335.92401, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 3]}], "orig": "128", "text": "128"}, {"self_ref": "#/texts/405", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 200.63998, "t": 328.07556, "r": 204.57674, "b": 325.33957, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "63", "text": "63"}, {"self_ref": "#/texts/406", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 367.62604, "t": 328.07556, "r": 369.58032, "b": 325.33957, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "1", "text": "1"}, {"self_ref": "#/texts/407", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 382.66132, "t": 328.07556, "r": 384.6156, "b": 325.33957, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "1", "text": "1"}, {"self_ref": "#/texts/408", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 397.72504, "t": 328.07556, "r": 399.67932, "b": 325.33957, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "3", "text": "3"}, {"self_ref": "#/texts/409", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 200.64, "t": 323.19687, "r": 206.51694, "b": 320.46085, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 3]}], "orig": "199", "text": "199"}, {"self_ref": "#/texts/410", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 264.29047, "t": 323.19687, "r": 266.25885, "b": 320.46085, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "5", "text": "5"}, {"self_ref": "#/texts/411", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 306.37213, "t": 323.19687, "r": 308.34052, "b": 320.46085, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "1", "text": "1"}, {"self_ref": "#/texts/412", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 345.51526, "t": 323.19687, "r": 347.48364, "b": 320.46085, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "2", "text": "2"}, {"self_ref": "#/texts/413", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 356.55634, "t": 323.19687, "r": 358.52472, "b": 320.46085, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "4", "text": "4"}, {"self_ref": "#/texts/414", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 367.62582, "t": 323.19687, "r": 369.59418, "b": 320.46085, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "1", "text": "1"}, {"self_ref": "#/texts/415", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 382.66107, "t": 323.19687, "r": 384.62946, "b": 320.46085, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "1", "text": "1"}, {"self_ref": "#/texts/416", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 200.64, "t": 318.31815, "r": 206.51694, "b": 315.58212, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 3]}], "orig": "416", "text": "416"}, {"self_ref": "#/texts/417", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 264.29047, "t": 318.31815, "r": 266.25885, "b": 315.58212, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "4", "text": "4"}, {"self_ref": "#/texts/418", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 200.64, "t": 313.46786, "r": 206.51694, "b": 310.73184, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 3]}], "orig": "230", "text": "230"}, {"self_ref": "#/texts/419", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 243.26373, "t": 313.46786, "r": 245.2321, "b": 310.73184, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "1", "text": "1"}, {"self_ref": "#/texts/420", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 264.29047, "t": 313.46786, "r": 266.25885, "b": 310.73184, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "9", "text": "9"}, {"self_ref": "#/texts/421", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 323.40466, "t": 313.46786, "r": 325.37305, "b": 310.73184, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "1", "text": "1"}, {"self_ref": "#/texts/422", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 397.72519, "t": 313.46786, "r": 399.69354, "b": 310.73184, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "1", "text": "1"}, {"self_ref": "#/texts/423", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 200.64, "t": 308.58914, "r": 206.51694, "b": 305.85312, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 3]}], "orig": "276", "text": "276"}, {"self_ref": "#/texts/424", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 382.66132, "t": 308.58914, "r": 384.61563, "b": 305.85312, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "2", "text": "2"}, {"self_ref": "#/texts/425", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 397.72513, "t": 308.58914, "r": 401.64819, "b": 305.85312, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "12", "text": "12"}, {"self_ref": "#/texts/426", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 412.78928, "t": 308.58914, "r": 414.74359, "b": 305.85312, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "1", "text": "1"}, {"self_ref": "#/texts/427", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 200.64014, "t": 303.71042, "r": 207.14445, "b": 300.9744, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 3]}], "orig": "320", "text": "320"}, {"self_ref": "#/texts/428", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 367.62616, "t": 303.71042, "r": 369.78375, "b": 300.9744, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "1", "text": "1"}, {"self_ref": "#/texts/429", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 382.66141, "t": 303.71042, "r": 384.81897, "b": 300.9744, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "4", "text": "4"}, {"self_ref": "#/texts/430", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 397.7251, "t": 303.71042, "r": 402.05087, "b": 300.9744, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "20", "text": "20"}, {"self_ref": "#/texts/431", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 200.64032, "t": 298.8317, "r": 208.48566, "b": 296.09567, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "2013", "text": "2013"}, {"self_ref": "#/texts/432", "parent": {"cref": "#/pictures/4"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 264.29044, "t": 298.8317, "r": 266.25879, "b": 296.09567, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "3", "text": "3"}, {"self_ref": "#/texts/433", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 227.91466, "t": 126.17397000000005, "r": 230.10028, "b": 116.65359999999998, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "\u03bc", "text": "\u03bc"}, {"self_ref": "#/texts/434", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 300.58057, "t": 108.37805000000003, "r": 302.72638, "b": 98.57134199999996, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "\u2265", "text": "\u2265"}, {"self_ref": "#/texts/435", "parent": {"cref": "#/body"}, "children": [], "content_layer": "furniture", "label": "page_header", "prov": [{"page_no": 11, "bbox": {"l": 194.478, "t": 698.229, "r": 447.54291000000006, "b": 690.1593, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 60]}], "orig": "Optimized Table Tokenization for Table Structure Recognition", "text": "Optimized Table Tokenization for Table Structure Recognition"}, {"self_ref": "#/texts/436", "parent": {"cref": "#/body"}, "children": [], "content_layer": "furniture", "label": "page_header", "prov": [{"page_no": 11, "bbox": {"l": 471.37561, "t": 698.229, "r": 480.5894799999999, "b": 690.1593, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "11", "text": "11"}, {"self_ref": "#/texts/437", "parent": {"cref": "#/pictures/5"}, "children": [], "content_layer": "body", "label": "caption", "prov": [{"page_no": 11, "bbox": {"l": 134.765, "t": 666.2008100000002, "r": 480.58838000000003, "b": 614.23236, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 390]}], "orig": "Fig. 6. Visualization of predicted structure and detected bounding boxes on a complex table with many rows. The OTSL model (B) captured repeating pattern of horizontally merged cells from the GT (A), unlike the HTML model (C). The HTML model also didn't complete the HTML sequence correctly and displayed a lot more of drift and overlap of bounding boxes. \"PMC5406406_003_01.png\" PubTabNet.", "text": "Fig. 6. Visualization of predicted structure and detected bounding boxes on a complex table with many rows. The OTSL model (B) captured repeating pattern of horizontally merged cells from the GT (A), unlike the HTML model (C). The HTML model also didn't complete the HTML sequence correctly and displayed a lot more of drift and overlap of bounding boxes. \"PMC5406406_003_01.png\" PubTabNet."}, {"self_ref": "#/texts/438", "parent": {"cref": "#/pictures/5"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 11, "bbox": {"l": 171.5049, "t": 479.54968, "r": 177.59613, "b": 471.63614, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "B", "text": "B"}, {"self_ref": "#/texts/439", "parent": {"cref": "#/pictures/5"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 11, "bbox": {"l": 171.05823, "t": 299.34726, "r": 177.14946, "b": 291.43372, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "C", "text": "C"}, {"self_ref": "#/texts/440", "parent": {"cref": "#/pictures/5"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 11, "bbox": {"l": 283.047, "t": 164.51833999999997, "r": 374.96332, "b": 158.58319000000006, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 30]}], "orig": "Incorrect end of HTML sequence", "text": "Incorrect end of HTML sequence"}, {"self_ref": "#/texts/441", "parent": {"cref": "#/pictures/5"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 11, "bbox": {"l": 283.047, "t": 174.64224000000002, "r": 398.05978, "b": 168.70709, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 41]}], "orig": "Horizontally merged cells are not present", "text": "Horizontally merged cells are not present"}, {"self_ref": "#/texts/442", "parent": {"cref": "#/pictures/5"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 11, "bbox": {"l": 293.64209, "t": 326.40216, "r": 437.50800000000004, "b": 320.46701, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 52]}], "orig": "Repeating pattern is well represented in predictions", "text": "Repeating pattern is well represented in predictions"}, {"self_ref": "#/texts/443", "parent": {"cref": "#/pictures/5"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 11, "bbox": {"l": 181.89114, "t": 503.64037999999994, "r": 239.23492, "b": 497.7052299999999, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 20]}], "orig": "Repeating pattern of", "text": "Repeating pattern of"}, {"self_ref": "#/texts/444", "parent": {"cref": "#/pictures/5"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 11, "bbox": {"l": 181.89114, "t": 497.10577, "r": 251.52917, "b": 491.17062, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 25]}], "orig": "horizontally merged cells", "text": "horizontally merged cells"}, {"self_ref": "#/texts/445", "parent": {"cref": "#/pictures/5"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 11, "bbox": {"l": 247.83432, "t": 607.24011, "r": 253.61339, "b": 597.18365, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "A", "text": "A"}, {"self_ref": "#/texts/446", "parent": {"cref": "#/pictures/5"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 11, "bbox": {"l": 292.18976, "t": 184.19390999999996, "r": 381.54663, "b": 178.25875999999994, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 32]}], "orig": "Bounding box drifting at the end", "text": "Bounding box drifting at the end"}, {"self_ref": "#/texts/447", "parent": {"cref": "#/pictures/5"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 11, "bbox": {"l": 172.27777, "t": 410.63712, "r": 180.18666, "b": 388.59933, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "OTSL", "text": "OTSL"}, {"self_ref": "#/texts/448", "parent": {"cref": "#/pictures/5"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 11, "bbox": {"l": 172.27747, "t": 236.22305000000006, "r": 180.18663, "b": 213.25220000000002, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "HTML", "text": "HTML"}, {"self_ref": "#/texts/449", "parent": {"cref": "#/body"}, "children": [], "content_layer": "furniture", "label": "page_header", "prov": [{"page_no": 12, "bbox": {"l": 134.765, "t": 698.229, "r": 143.97887, "b": 690.1593, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "12", "text": "12"}, {"self_ref": "#/texts/450", "parent": {"cref": "#/body"}, "children": [], "content_layer": "furniture", "label": "page_header", "prov": [{"page_no": 12, "bbox": {"l": 167.82053, "t": 698.229, "r": 231.72049000000004, "b": 690.1593, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 16]}], "orig": "M. Lysak, et al.", "text": "M. Lysak, et al."}, {"self_ref": "#/texts/451", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "section_header", "prov": [{"page_no": 12, "bbox": {"l": 134.765, "t": 674.4510500000001, "r": 219.25478999999999, "b": 663.88263, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 12]}], "orig": "6 Conclusion", "text": "6 Conclusion", "level": 1}, {"self_ref": "#/texts/452", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 134.765, "t": 645.13623, "r": 480.59569999999997, "b": 588.51819, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 330]}], "orig": "We demonstrated that representing tables in HTML for the task of table structure recognition with Im2Seq models is ill-suited and has serious limitations. Furthermore, we presented in this paper an Optimized Table Structure Language (OTSL) which, when compared to commonly used general purpose languages, has several key benefits.", "text": "We demonstrated that representing tables in HTML for the task of table structure recognition with Im2Seq models is ill-suited and has serious limitations. Furthermore, we presented in this paper an Optimized Table Structure Language (OTSL) which, when compared to commonly used general purpose languages, has several key benefits."}, {"self_ref": "#/texts/453", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 134.765, "t": 584.55621, "r": 480.59479, "b": 468.16321, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 724]}], "orig": "First and foremost, given the same network configuration, inference time for a table-structure prediction is about 2 times faster compared to the conventional HTML approach. This is primarily owed to the shorter sequence length of the OTSL representation. Additional performance benefits can be obtained with HPO (hyper parameter optimization). As we demonstrate in our experiments, models trained on OTSL can be significantly smaller, e.g. by reducing the number of encoder and decoder layers, while preserving comparatively good prediction quality. This can further improve inference performance, yielding 5-6 times faster inference speed in OTSL with prediction quality comparable to models trained on HTML (see Table 1).", "text": "First and foremost, given the same network configuration, inference time for a table-structure prediction is about 2 times faster compared to the conventional HTML approach. This is primarily owed to the shorter sequence length of the OTSL representation. Additional performance benefits can be obtained with HPO (hyper parameter optimization). As we demonstrate in our experiments, models trained on OTSL can be significantly smaller, e.g. by reducing the number of encoder and decoder layers, while preserving comparatively good prediction quality. This can further improve inference performance, yielding 5-6 times faster inference speed in OTSL with prediction quality comparable to models trained on HTML (see Table 1)."}, {"self_ref": "#/texts/454", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 134.765, "t": 464.20117, "r": 480.59482, "b": 323.89734, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 926]}], "orig": "Secondly, OTSL has more inherent structure and a significantly restricted vocabulary size. This allows autoregressive models to perform better in the TED metric, but especially with regards to prediction accuracy of the table-cell bounding boxes (see Table 2). As shown in Figure 5, we observe that the OTSL drastically reduces the drift for table cell bounding boxes at high row count and in sparse tables. This leads to more accurate predictions and a significant reduction in post-processing complexity, which is an undesired necessity in HTML-based Im2Seq models. Significant novelty lies in OTSL syntactical rules, which are few, simple and always backwards looking. Each new token can be validated only by analyzing the sequence of previous tokens, without requiring the entire sequence to detect mistakes. This in return allows to perform structural error detection and correction on-the-fly during sequence generation.", "text": "Secondly, OTSL has more inherent structure and a significantly restricted vocabulary size. This allows autoregressive models to perform better in the TED metric, but especially with regards to prediction accuracy of the table-cell bounding boxes (see Table 2). As shown in Figure 5, we observe that the OTSL drastically reduces the drift for table cell bounding boxes at high row count and in sparse tables. This leads to more accurate predictions and a significant reduction in post-processing complexity, which is an undesired necessity in HTML-based Im2Seq models. Significant novelty lies in OTSL syntactical rules, which are few, simple and always backwards looking. Each new token can be validated only by analyzing the sequence of previous tokens, without requiring the entire sequence to detect mistakes. This in return allows to perform structural error detection and correction on-the-fly during sequence generation."}, {"self_ref": "#/texts/455", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "section_header", "prov": [{"page_no": 12, "bbox": {"l": 134.765, "t": 298.17917, "r": 197.68642, "b": 287.61078, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 10]}], "orig": "References", "text": "References", "level": 1}, {"self_ref": "#/texts/456", "parent": {"cref": "#/groups/4"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 12, "bbox": {"l": 139.371, "t": 269.12014999999997, "r": 480.5920100000001, "b": 228.12856, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 270]}], "orig": "1. Auer, C., Dolfi, M., Carvalho, A., Ramis, C.B., Staar, P.W.J.: Delivering document conversion as a cloud service with high throughput and responsiveness. CoRR abs/2206.00785 (2022). https://doi.org/10.48550/arXiv.2206.00785 , https://doi.org/10.48550/arXiv.2206.00785", "text": "1. Auer, C., Dolfi, M., Carvalho, A., Ramis, C.B., Staar, P.W.J.: Delivering document conversion as a cloud service with high throughput and responsiveness. CoRR abs/2206.00785 (2022). https://doi.org/10.48550/arXiv.2206.00785 , https://doi.org/10.48550/arXiv.2206.00785", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/457", "parent": {"cref": "#/groups/4"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 12, "bbox": {"l": 139.37097, "t": 224.48116000000005, "r": 480.5920100000001, "b": 183.53439000000003, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 301]}], "orig": "2. Chen, B., Peng, D., Zhang, J., Ren, Y., Jin, L.: Complex table structure recognition in the wild using transformer and identity matrix-based augmentation. In: Porwal, U., Forn\u00e9s, A., Shafait, F. (eds.) Frontiers in Handwriting Recognition. pp. 545561. Springer International Publishing, Cham (2022)", "text": "2. Chen, B., Peng, D., Zhang, J., Ren, Y., Jin, L.: Complex table structure recognition in the wild using transformer and identity matrix-based augmentation. In: Porwal, U., Forn\u00e9s, A., Shafait, F. (eds.) Frontiers in Handwriting Recognition. pp. 545561. Springer International Publishing, Cham (2022)", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/458", "parent": {"cref": "#/groups/4"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 12, "bbox": {"l": 139.37097, "t": 179.84116000000006, "r": 480.58731000000006, "b": 160.81239000000005, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 140]}], "orig": "3. Chi, Z., Huang, H., Xu, H.D., Yu, H., Yin, W., Mao, X.L.: Complicated table structure recognition. arXiv preprint arXiv:1908.04729 (2019)", "text": "3. Chi, Z., Huang, H., Xu, H.D., Yu, H., Yin, W., Mao, X.L.: Complicated table structure recognition. arXiv preprint arXiv:1908.04729 (2019)", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/459", "parent": {"cref": "#/groups/4"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 12, "bbox": {"l": 139.37097, "t": 157.11915999999997, "r": 480.58826, "b": 127.13238999999999, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 204]}], "orig": "4. Deng, Y., Rosenberg, D., Mann, G.: Challenges in end-to-end neural scientific table recognition. In: 2019 International Conference on Document Analysis and Recognition (ICDAR). pp. 894-901. IEEE (2019)", "text": "4. Deng, Y., Rosenberg, D., Mann, G.: Challenges in end-to-end neural scientific table recognition. In: 2019 International Conference on Document Analysis and Recognition (ICDAR). pp. 894-901. IEEE (2019)", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/460", "parent": {"cref": "#/body"}, "children": [], "content_layer": "furniture", "label": "page_header", "prov": [{"page_no": 13, "bbox": {"l": 194.478, "t": 698.229, "r": 447.54291000000006, "b": 690.1593, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 60]}], "orig": "Optimized Table Tokenization for Table Structure Recognition", "text": "Optimized Table Tokenization for Table Structure Recognition"}, {"self_ref": "#/texts/461", "parent": {"cref": "#/body"}, "children": [], "content_layer": "furniture", "label": "page_header", "prov": [{"page_no": 13, "bbox": {"l": 471.37561, "t": 698.229, "r": 480.5894799999999, "b": 690.1593, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "13", "text": "13"}, {"self_ref": "#/texts/462", "parent": {"cref": "#/groups/5"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 13, "bbox": {"l": 139.371, "t": 672.32599, "r": 480.59479, "b": 642.33832, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 203]}], "orig": "5. Kayal, P., Anand, M., Desai, H., Singh, M.: Tables to latex: structure and content extraction from scientific tables. International Journal on Document Analysis and Recognition (IJDAR) pp. 1-10 (2022)", "text": "5. Kayal, P., Anand, M., Desai, H., Singh, M.: Tables to latex: structure and content extraction from scientific tables. International Journal on Document Analysis and Recognition (IJDAR) pp. 1-10 (2022)", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/463", "parent": {"cref": "#/groups/5"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 13, "bbox": {"l": 139.371, "t": 639.43805, "r": 480.59286000000003, "b": 598.49139, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 264]}], "orig": "6. Lee, E., Kwon, J., Yang, H., Park, J., Lee, S., Koo, H.I., Cho, N.I.: Table structure recognition based on grid shape graph. In: 2022 Asia-Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC). pp. 18681873. IEEE (2022)", "text": "6. Lee, E., Kwon, J., Yang, H., Park, J., Lee, S., Koo, H.I., Cho, N.I.: Table structure recognition based on grid shape graph. In: 2022 Asia-Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC). pp. 18681873. IEEE (2022)", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/464", "parent": {"cref": "#/groups/5"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 13, "bbox": {"l": 139.371, "t": 595.59113, "r": 480.59012, "b": 576.56244, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 131]}], "orig": "7. Li, M., Cui, L., Huang, S., Wei, F., Zhou, M., Li, Z.: Tablebank: A benchmark dataset for table detection and recognition (2019)", "text": "7. Li, M., Cui, L., Huang, S., Wei, F., Zhou, M., Li, Z.: Tablebank: A benchmark dataset for table detection and recognition (2019)", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/465", "parent": {"cref": "#/groups/5"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 13, "bbox": {"l": 139.371, "t": 573.66113, "r": 480.59473, "b": 521.71161, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 345]}], "orig": "8. Livathinos, N., Berrospi, C., Lysak, M., Kuropiatnyk, V., Nassar, A., Carvalho, A., Dolfi, M., Auer, C., Dinkla, K., Staar, P.: Robust pdf document conversion using recurrent neural networks. Proceedings of the AAAI Conference on Artificial Intelligence 35 (17), 15137-15145 (May 2021), https://ojs.aaai.org/index.php/ AAAI/article/view/17777", "text": "8. Livathinos, N., Berrospi, C., Lysak, M., Kuropiatnyk, V., Nassar, A., Carvalho, A., Dolfi, M., Auer, C., Dinkla, K., Staar, P.: Robust pdf document conversion using recurrent neural networks. Proceedings of the AAAI Conference on Artificial Intelligence 35 (17), 15137-15145 (May 2021), https://ojs.aaai.org/index.php/ AAAI/article/view/17777", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/466", "parent": {"cref": "#/groups/5"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 13, "bbox": {"l": 139.371, "t": 518.85516, "r": 480.59387000000004, "b": 488.86746, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 234]}], "orig": "9. Nassar, A., Livathinos, N., Lysak, M., Staar, P.: Tableformer: Table structure understanding with transformers. In: Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). pp. 4614-4623 (June 2022)", "text": "9. Nassar, A., Livathinos, N., Lysak, M., Staar, P.: Tableformer: Table structure understanding with transformers. In: Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). pp. 4614-4623 (June 2022)", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/467", "parent": {"cref": "#/groups/5"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 13, "bbox": {"l": 134.76401, "t": 485.96722000000005, "r": 480.59372, "b": 423.05768, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 413]}], "orig": "10. Pfitzmann, B., Auer, C., Dolfi, M., Nassar, A.S., Staar, P.W.J.: Doclaynet: A large human-annotated dataset for document-layout segmentation. In: Zhang, A., Rangwala, H. (eds.) KDD '22: The 28th ACM SIGKDD Conference on Knowledge Discovery and Data Mining, Washington, DC, USA, August 14 - 18, 2022. pp. 3743-3751. ACM (2022). https://doi.org/10.1145/3534678.3539043 , https:// doi.org/10.1145/3534678.3539043", "text": "10. Pfitzmann, B., Auer, C., Dolfi, M., Nassar, A.S., Staar, P.W.J.: Doclaynet: A large human-annotated dataset for document-layout segmentation. In: Zhang, A., Rangwala, H. (eds.) KDD '22: The 28th ACM SIGKDD Conference on Knowledge Discovery and Data Mining, Washington, DC, USA, August 14 - 18, 2022. pp. 3743-3751. ACM (2022). https://doi.org/10.1145/3534678.3539043 , https:// doi.org/10.1145/3534678.3539043", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/468", "parent": {"cref": "#/groups/5"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 13, "bbox": {"l": 134.76401, "t": 420.20227, "r": 480.59296, "b": 379.25552, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 295]}], "orig": "11. Prasad, D., Gadpal, A., Kapadni, K., Visave, M., Sultanpure, K.: Cascadetabnet: An approach for end to end table detection and structure recognition from imagebased documents. In: Proceedings of the IEEE/CVF conference on computer vision and pattern recognition workshops. pp. 572-573 (2020)", "text": "11. Prasad, D., Gadpal, A., Kapadni, K., Visave, M., Sultanpure, K.: Cascadetabnet: An approach for end to end table detection and structure recognition from imagebased documents. In: Proceedings of the IEEE/CVF conference on computer vision and pattern recognition workshops. pp. 572-573 (2020)", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/469", "parent": {"cref": "#/groups/5"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 13, "bbox": {"l": 134.76401, "t": 376.35529, "r": 480.59469999999993, "b": 335.40854, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 281]}], "orig": "12. Schreiber, S., Agne, S., Wolf, I., Dengel, A., Ahmed, S.: Deepdesrt: Deep learning for detection and structure recognition of tables in document images. In: 2017 14th IAPR international conference on document analysis and recognition (ICDAR). vol. 1, pp. 1162-1167. IEEE (2017)", "text": "12. Schreiber, S., Agne, S., Wolf, I., Dengel, A., Ahmed, S.: Deepdesrt: Deep learning for detection and structure recognition of tables in document images. In: 2017 14th IAPR international conference on document analysis and recognition (ICDAR). vol. 1, pp. 1162-1167. IEEE (2017)", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/470", "parent": {"cref": "#/groups/5"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 13, "bbox": {"l": 134.76401, "t": 332.5083, "r": 480.59372, "b": 291.51672, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 275]}], "orig": "13. Siddiqui, S.A., Fateh, I.A., Rizvi, S.T.R., Dengel, A., Ahmed, S.: Deeptabstr: Deep learning based table structure recognition. In: 2019 International Conference on Document Analysis and Recognition (ICDAR). pp. 1403-1409 (2019). https:// doi.org/10.1109/ICDAR.2019.00226", "text": "13. Siddiqui, S.A., Fateh, I.A., Rizvi, S.T.R., Dengel, A., Ahmed, S.: Deeptabstr: Deep learning based table structure recognition. In: 2019 International Conference on Document Analysis and Recognition (ICDAR). pp. 1403-1409 (2019). https:// doi.org/10.1109/ICDAR.2019.00226", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/471", "parent": {"cref": "#/groups/5"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 13, "bbox": {"l": 134.76401, "t": 288.66132, "r": 480.59286000000003, "b": 247.71455000000003, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 241]}], "orig": "14. Smock, B., Pesala, R., Abraham, R.: PubTables-1M: Towards comprehensive table extraction from unstructured documents. In: Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). pp. 4634-4642 (June 2022)", "text": "14. Smock, B., Pesala, R., Abraham, R.: PubTables-1M: Towards comprehensive table extraction from unstructured documents. In: Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). pp. 4634-4642 (June 2022)", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/472", "parent": {"cref": "#/groups/5"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 13, "bbox": {"l": 134.76401, "t": 244.81431999999995, "r": 480.59583, "b": 181.90472, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 405]}], "orig": "15. Staar, P.W.J., Dolfi, M., Auer, C., Bekas, C.: Corpus conversion service: A machine learning platform to ingest documents at scale. In: Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining. pp. 774-782. KDD '18, Association for Computing Machinery, New York, NY, USA (2018). https://doi.org/10.1145/3219819.3219834 , https://doi.org/10. 1145/3219819.3219834", "text": "15. Staar, P.W.J., Dolfi, M., Auer, C., Bekas, C.: Corpus conversion service: A machine learning platform to ingest documents at scale. In: Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining. pp. 774-782. KDD '18, Association for Computing Machinery, New York, NY, USA (2018). https://doi.org/10.1145/3219819.3219834 , https://doi.org/10. 1145/3219819.3219834", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/473", "parent": {"cref": "#/groups/5"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 13, "bbox": {"l": 134.76401, "t": 179.04931999999997, "r": 480.59542999999996, "b": 160.02054999999996, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 96]}], "orig": "16. Wang, X.: Tabular Abstraction, Editing, and Formatting. Ph.D. thesis, CAN (1996), aAINN09397", "text": "16. Wang, X.: Tabular Abstraction, Editing, and Formatting. Ph.D. thesis, CAN (1996), aAINN09397", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/474", "parent": {"cref": "#/groups/5"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 13, "bbox": {"l": 134.76401, "t": 157.12032, "r": 480.59119, "b": 127.13255000000004, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 195]}], "orig": "17. Xue, W., Li, Q., Tao, D.: Res2tim: Reconstruct syntactic structures from table images. In: 2019 International Conference on Document Analysis and Recognition (ICDAR). pp. 749-755. IEEE (2019)", "text": "17. Xue, W., Li, Q., Tao, D.: Res2tim: Reconstruct syntactic structures from table images. In: 2019 International Conference on Document Analysis and Recognition (ICDAR). pp. 749-755. IEEE (2019)", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/475", "parent": {"cref": "#/body"}, "children": [], "content_layer": "furniture", "label": "page_header", "prov": [{"page_no": 14, "bbox": {"l": 134.765, "t": 698.229, "r": 143.97887, "b": 690.1593, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "14", "text": "14"}, {"self_ref": "#/texts/476", "parent": {"cref": "#/body"}, "children": [], "content_layer": "furniture", "label": "page_header", "prov": [{"page_no": 14, "bbox": {"l": 167.82053, "t": 698.229, "r": 231.72049000000004, "b": 690.1593, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 16]}], "orig": "M. Lysak, et al.", "text": "M. Lysak, et al."}, {"self_ref": "#/texts/477", "parent": {"cref": "#/groups/6"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 14, "bbox": {"l": 134.765, "t": 672.32599, "r": 480.59113, "b": 642.33832, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 223]}], "orig": "18. Xue, W., Yu, B., Wang, W., Tao, D., Li, Q.: Tgrnet: A table graph reconstruction network for table structure recognition. In: Proceedings of the IEEE/CVF International Conference on Computer Vision. pp. 1295-1304 (2021)", "text": "18. Xue, W., Yu, B., Wang, W., Tao, D., Li, Q.: Tgrnet: A table graph reconstruction network for table structure recognition. In: Proceedings of the IEEE/CVF International Conference on Computer Vision. pp. 1295-1304 (2021)", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/478", "parent": {"cref": "#/groups/6"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 14, "bbox": {"l": 134.765, "t": 639.44904, "r": 480.59469999999993, "b": 598.45752, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 269]}], "orig": "19. Ye, J., Qi, X., He, Y., Chen, Y., Gu, D., Gao, P., Xiao, R.: Pingan-vcgroup's solution for icdar 2021 competition on scientific literature parsing task b: Table recognition to html (2021). https://doi.org/10.48550/ARXIV.2105.01848 , https://arxiv.org/abs/2105.01848", "text": "19. Ye, J., Qi, X., He, Y., Chen, Y., Gu, D., Gao, P., Xiao, R.: Pingan-vcgroup's solution for icdar 2021 competition on scientific literature parsing task b: Table recognition to html (2021). https://doi.org/10.48550/ARXIV.2105.01848 , https://arxiv.org/abs/2105.01848", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/479", "parent": {"cref": "#/groups/6"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 14, "bbox": {"l": 134.76497, "t": 595.6131, "r": 480.5935400000001, "b": 576.58539, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 147]}], "orig": "20. Zhang, Z., Zhang, J., Du, J., Wang, F.: Split, embed and merge: An accurate table structure recognizer. Pattern Recognition 126 , 108565 (2022)", "text": "20. Zhang, Z., Zhang, J., Du, J., Wang, F.: Split, embed and merge: An accurate table structure recognizer. Pattern Recognition 126 , 108565 (2022)", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/480", "parent": {"cref": "#/groups/6"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 14, "bbox": {"l": 134.76495, "t": 573.69611, "r": 480.59305000000006, "b": 521.74561, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 329]}], "orig": "21. Zheng, X., Burdick, D., Popa, L., Zhong, X., Wang, N.X.R.: Global table extractor (gte): A framework for joint table identification and cell structure recognition using visual context. In: 2021 IEEE Winter Conference on Applications of Computer Vision (WACV). pp. 697-706 (2021). https://doi.org/10.1109/WACV48630.2021. 00074", "text": "21. Zheng, X., Burdick, D., Popa, L., Zhong, X., Wang, N.X.R.: Global table extractor (gte): A framework for joint table identification and cell structure recognition using visual context. In: 2021 IEEE Winter Conference on Applications of Computer Vision (WACV). pp. 697-706 (2021). https://doi.org/10.1109/WACV48630.2021. 00074", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/481", "parent": {"cref": "#/groups/6"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 14, "bbox": {"l": 134.76495, "t": 518.90118, "r": 480.59558, "b": 477.9545, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 259]}], "orig": "22. Zhong, X., ShafieiBavani, E., Jimeno Yepes, A.: Image-based table recognition: Data, model, and evaluation. In: Vedaldi, A., Bischof, H., Brox, T., Frahm, J.M. (eds.) Computer Vision - ECCV 2020. pp. 564-580. Springer International Publishing, Cham (2020)", "text": "22. Zhong, X., ShafieiBavani, E., Jimeno Yepes, A.: Image-based table recognition: Data, model, and evaluation. In: Vedaldi, A., Bischof, H., Brox, T., Frahm, J.M. (eds.) Computer Vision - ECCV 2020. pp. 564-580. Springer International Publishing, Cham (2020)", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/482", "parent": {"cref": "#/groups/6"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 14, "bbox": {"l": 134.76495, "t": 475.06528, "r": 480.59454, "b": 445.07852, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 206]}], "orig": "23. Zhong, X., Tang, J., Yepes, A.J.: Publaynet: largest dataset ever for document layout analysis. In: 2019 International Conference on Document Analysis and Recognition (ICDAR). pp. 1015-1022. IEEE (2019)", "text": "23. Zhong, X., Tang, J., Yepes, A.J.: Publaynet: largest dataset ever for document layout analysis. In: 2019 International Conference on Document Analysis and Recognition (ICDAR). pp. 1015-1022. IEEE (2019)", "enumerated": false, "marker": "-"}], "pictures": [{"self_ref": "#/pictures/0", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/13"}, {"cref": "#/texts/14"}, {"cref": "#/texts/15"}, {"cref": "#/texts/16"}, {"cref": "#/texts/17"}, {"cref": "#/texts/18"}, {"cref": "#/texts/19"}, {"cref": "#/texts/20"}, {"cref": "#/texts/21"}, {"cref": "#/texts/22"}, {"cref": "#/texts/23"}, {"cref": "#/texts/24"}, {"cref": "#/texts/25"}, {"cref": "#/texts/26"}, {"cref": "#/texts/27"}, {"cref": "#/texts/28"}, {"cref": "#/texts/29"}, {"cref": "#/texts/30"}, {"cref": "#/texts/31"}, {"cref": "#/texts/32"}, {"cref": "#/texts/33"}, {"cref": "#/texts/34"}, {"cref": "#/texts/35"}, {"cref": "#/texts/36"}, {"cref": "#/texts/37"}, {"cref": "#/texts/38"}, {"cref": "#/texts/39"}, {"cref": "#/texts/40"}, {"cref": "#/texts/41"}, {"cref": "#/texts/42"}, {"cref": "#/texts/43"}, {"cref": "#/texts/44"}, {"cref": "#/texts/45"}, {"cref": "#/texts/46"}, {"cref": "#/texts/47"}, {"cref": "#/texts/48"}, {"cref": "#/texts/49"}, {"cref": "#/texts/50"}, {"cref": "#/texts/51"}, {"cref": "#/texts/52"}, {"cref": "#/texts/53"}, {"cref": "#/texts/54"}, {"cref": "#/texts/55"}, {"cref": "#/texts/56"}, {"cref": "#/texts/57"}, {"cref": "#/texts/58"}, {"cref": "#/texts/59"}, {"cref": "#/texts/60"}, {"cref": "#/texts/61"}, {"cref": "#/texts/62"}, {"cref": "#/texts/63"}, {"cref": "#/texts/64"}, {"cref": "#/texts/65"}, {"cref": "#/texts/66"}, {"cref": "#/texts/67"}, {"cref": "#/texts/68"}, {"cref": "#/texts/69"}, {"cref": "#/texts/70"}, {"cref": "#/texts/71"}, {"cref": "#/texts/72"}, {"cref": "#/texts/73"}, {"cref": "#/texts/74"}, {"cref": "#/texts/75"}, {"cref": "#/texts/76"}, {"cref": "#/texts/77"}, {"cref": "#/texts/78"}, {"cref": "#/texts/79"}, {"cref": "#/texts/80"}, {"cref": "#/texts/81"}, {"cref": "#/texts/82"}, {"cref": "#/texts/83"}, {"cref": "#/texts/84"}, {"cref": "#/texts/85"}, {"cref": "#/texts/86"}, {"cref": "#/texts/87"}, {"cref": "#/texts/88"}, {"cref": "#/texts/89"}, {"cref": "#/texts/90"}, {"cref": "#/texts/91"}, {"cref": "#/texts/92"}, {"cref": "#/texts/93"}, {"cref": "#/texts/94"}, {"cref": "#/texts/95"}, {"cref": "#/texts/96"}, {"cref": "#/texts/97"}, {"cref": "#/texts/98"}, {"cref": "#/texts/99"}, {"cref": "#/texts/100"}, {"cref": "#/texts/101"}, {"cref": "#/texts/102"}, {"cref": "#/texts/103"}, {"cref": "#/texts/104"}, {"cref": "#/texts/105"}, {"cref": "#/texts/106"}, {"cref": "#/texts/107"}, {"cref": "#/texts/108"}, {"cref": "#/texts/109"}, {"cref": "#/texts/110"}, {"cref": "#/texts/111"}, {"cref": "#/texts/112"}, {"cref": "#/texts/113"}, {"cref": "#/texts/114"}, {"cref": "#/texts/115"}, {"cref": "#/texts/116"}, {"cref": "#/texts/117"}, {"cref": "#/texts/118"}, {"cref": "#/texts/119"}], "content_layer": "body", "label": "picture", "prov": [{"page_no": 2, "bbox": {"l": 148.45364379882812, "t": 583.6257629394531, "r": 464.3608093261719, "b": 366.1537780761719, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [{"cref": "#/texts/13"}], "references": [], "footnotes": [], "image": null, "annotations": []}, {"self_ref": "#/pictures/1", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/139"}], "content_layer": "body", "label": "picture", "prov": [{"page_no": 5, "bbox": {"l": 137.41448974609375, "t": 558.4876861572266, "r": 476.5608215332031, "b": 451.7695007324219, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [{"cref": "#/texts/139"}], "references": [], "footnotes": [], "image": null, "annotations": []}, {"self_ref": "#/pictures/2", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/160"}, {"cref": "#/texts/161"}, {"cref": "#/texts/162"}, {"cref": "#/texts/163"}, {"cref": "#/texts/164"}, {"cref": "#/texts/165"}, {"cref": "#/texts/166"}, {"cref": "#/texts/167"}, {"cref": "#/texts/168"}, {"cref": "#/texts/169"}, {"cref": "#/texts/170"}, {"cref": "#/texts/171"}, {"cref": "#/texts/172"}, {"cref": "#/texts/173"}, {"cref": "#/texts/174"}, {"cref": "#/texts/175"}, {"cref": "#/texts/176"}, {"cref": "#/texts/177"}, {"cref": "#/texts/178"}, {"cref": "#/texts/179"}, {"cref": "#/texts/180"}, {"cref": "#/texts/181"}, {"cref": "#/texts/182"}, {"cref": "#/texts/183"}, {"cref": "#/texts/184"}, {"cref": "#/texts/185"}, {"cref": "#/texts/186"}, {"cref": "#/texts/187"}, {"cref": "#/texts/188"}, {"cref": "#/texts/189"}, {"cref": "#/texts/190"}, {"cref": "#/texts/191"}, {"cref": "#/texts/192"}, {"cref": "#/texts/193"}, {"cref": "#/texts/194"}, {"cref": "#/texts/195"}, {"cref": "#/texts/196"}, {"cref": "#/texts/197"}, {"cref": "#/texts/198"}, {"cref": "#/texts/199"}, {"cref": "#/texts/200"}, {"cref": "#/texts/201"}, {"cref": "#/texts/202"}, {"cref": "#/texts/203"}, {"cref": "#/texts/204"}, {"cref": "#/texts/205"}, {"cref": "#/texts/206"}, {"cref": "#/texts/207"}, {"cref": "#/texts/208"}, {"cref": "#/texts/209"}, {"cref": "#/texts/210"}, {"cref": "#/texts/211"}, {"cref": "#/texts/212"}, {"cref": "#/texts/213"}, {"cref": "#/texts/214"}, {"cref": "#/texts/215"}, {"cref": "#/texts/216"}, {"cref": "#/texts/217"}, {"cref": "#/texts/218"}, {"cref": "#/texts/219"}, {"cref": "#/texts/220"}, {"cref": "#/texts/221"}, {"cref": "#/texts/222"}, {"cref": "#/texts/223"}, {"cref": "#/texts/224"}, {"cref": "#/texts/225"}, {"cref": "#/texts/226"}, {"cref": "#/texts/227"}, {"cref": "#/texts/228"}], "content_layer": "body", "label": "picture", "prov": [{"page_no": 7, "bbox": {"l": 164.65028381347656, "t": 628.2029113769531, "r": 449.5505676269531, "b": 511.6590576171875, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [{"cref": "#/texts/160"}], "references": [], "footnotes": [], "image": null, "annotations": []}, {"self_ref": "#/pictures/3", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/247"}, {"cref": "#/texts/248"}, {"cref": "#/texts/249"}, {"cref": "#/texts/250"}, {"cref": "#/texts/251"}, {"cref": "#/texts/252"}, {"cref": "#/texts/253"}, {"cref": "#/texts/254"}, {"cref": "#/texts/255"}, {"cref": "#/texts/256"}, {"cref": "#/texts/257"}, {"cref": "#/texts/258"}, {"cref": "#/texts/259"}, {"cref": "#/texts/260"}, {"cref": "#/texts/261"}, {"cref": "#/texts/262"}, {"cref": "#/texts/263"}, {"cref": "#/texts/264"}, {"cref": "#/texts/265"}, {"cref": "#/texts/266"}, {"cref": "#/texts/267"}, {"cref": "#/texts/268"}, {"cref": "#/texts/269"}, {"cref": "#/texts/270"}, {"cref": "#/texts/271"}, {"cref": "#/texts/272"}, {"cref": "#/texts/273"}, {"cref": "#/texts/274"}, {"cref": "#/texts/275"}, {"cref": "#/texts/276"}, {"cref": "#/texts/277"}, {"cref": "#/texts/278"}, {"cref": "#/texts/279"}, {"cref": "#/texts/280"}, {"cref": "#/texts/281"}, {"cref": "#/texts/282"}, {"cref": "#/texts/283"}, {"cref": "#/texts/284"}, {"cref": "#/texts/285"}, {"cref": "#/texts/286"}, {"cref": "#/texts/287"}, {"cref": "#/texts/288"}, {"cref": "#/texts/289"}, {"cref": "#/texts/290"}, {"cref": "#/texts/291"}, {"cref": "#/texts/292"}, {"cref": "#/texts/293"}, {"cref": "#/texts/294"}, {"cref": "#/texts/295"}, {"cref": "#/texts/296"}, {"cref": "#/texts/297"}, {"cref": "#/texts/298"}, {"cref": "#/texts/299"}, {"cref": "#/texts/300"}, {"cref": "#/texts/301"}, {"cref": "#/texts/302"}, {"cref": "#/texts/303"}, {"cref": "#/texts/304"}, {"cref": "#/texts/305"}, {"cref": "#/texts/306"}, {"cref": "#/texts/307"}, {"cref": "#/texts/308"}, {"cref": "#/texts/309"}, {"cref": "#/texts/310"}, {"cref": "#/texts/311"}, {"cref": "#/texts/312"}, {"cref": "#/texts/313"}, {"cref": "#/texts/314"}, {"cref": "#/texts/315"}, {"cref": "#/texts/316"}, {"cref": "#/texts/317"}, {"cref": "#/texts/318"}, {"cref": "#/texts/319"}], "content_layer": "body", "label": "picture", "prov": [{"page_no": 8, "bbox": {"l": 140.70968627929688, "t": 283.9361572265625, "r": 472.73382568359375, "b": 198.32281494140625, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [{"cref": "#/texts/247"}], "references": [], "footnotes": [], "image": null, "annotations": []}, {"self_ref": "#/pictures/4", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/335"}, {"cref": "#/texts/336"}, {"cref": "#/texts/337"}, {"cref": "#/texts/338"}, {"cref": "#/texts/339"}, {"cref": "#/texts/340"}, {"cref": "#/texts/341"}, {"cref": "#/texts/342"}, {"cref": "#/texts/343"}, {"cref": "#/texts/344"}, {"cref": "#/texts/345"}, {"cref": "#/texts/346"}, {"cref": "#/texts/347"}, {"cref": "#/texts/348"}, {"cref": "#/texts/349"}, {"cref": "#/texts/350"}, {"cref": "#/texts/351"}, {"cref": "#/texts/352"}, {"cref": "#/texts/353"}, {"cref": "#/texts/354"}, {"cref": "#/texts/355"}, {"cref": "#/texts/356"}, {"cref": "#/texts/357"}, {"cref": "#/texts/358"}, {"cref": "#/texts/359"}, {"cref": "#/texts/360"}, {"cref": "#/texts/361"}, {"cref": "#/texts/362"}, {"cref": "#/texts/363"}, {"cref": "#/texts/364"}, {"cref": "#/texts/365"}, {"cref": "#/texts/366"}, {"cref": "#/texts/367"}, {"cref": "#/texts/368"}, {"cref": "#/texts/369"}, {"cref": "#/texts/370"}, {"cref": "#/texts/371"}, {"cref": "#/texts/372"}, {"cref": "#/texts/373"}, {"cref": "#/texts/374"}, {"cref": "#/texts/375"}, {"cref": "#/texts/376"}, {"cref": "#/texts/377"}, {"cref": "#/texts/378"}, {"cref": "#/texts/379"}, {"cref": "#/texts/380"}, {"cref": "#/texts/381"}, {"cref": "#/texts/382"}, {"cref": "#/texts/383"}, {"cref": "#/texts/384"}, {"cref": "#/texts/385"}, {"cref": "#/texts/386"}, {"cref": "#/texts/387"}, {"cref": "#/texts/388"}, {"cref": "#/texts/389"}, {"cref": "#/texts/390"}, {"cref": "#/texts/391"}, {"cref": "#/texts/392"}, {"cref": "#/texts/393"}, {"cref": "#/texts/394"}, {"cref": "#/texts/395"}, {"cref": "#/texts/396"}, {"cref": "#/texts/397"}, {"cref": "#/texts/398"}, {"cref": "#/texts/399"}, {"cref": "#/texts/400"}, {"cref": "#/texts/401"}, {"cref": "#/texts/402"}, {"cref": "#/texts/403"}, {"cref": "#/texts/404"}, {"cref": "#/texts/405"}, {"cref": "#/texts/406"}, {"cref": "#/texts/407"}, {"cref": "#/texts/408"}, {"cref": "#/texts/409"}, {"cref": "#/texts/410"}, {"cref": "#/texts/411"}, {"cref": "#/texts/412"}, {"cref": "#/texts/413"}, {"cref": "#/texts/414"}, {"cref": "#/texts/415"}, {"cref": "#/texts/416"}, {"cref": "#/texts/417"}, {"cref": "#/texts/418"}, {"cref": "#/texts/419"}, {"cref": "#/texts/420"}, {"cref": "#/texts/421"}, {"cref": "#/texts/422"}, {"cref": "#/texts/423"}, {"cref": "#/texts/424"}, {"cref": "#/texts/425"}, {"cref": "#/texts/426"}, {"cref": "#/texts/427"}, {"cref": "#/texts/428"}, {"cref": "#/texts/429"}, {"cref": "#/texts/430"}, {"cref": "#/texts/431"}, {"cref": "#/texts/432"}], "content_layer": "body", "label": "picture", "prov": [{"page_no": 10, "bbox": {"l": 162.67430114746094, "t": 347.37744140625, "r": 451.70062255859375, "b": 128.78643798828125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [{"cref": "#/texts/335"}], "references": [], "footnotes": [], "image": null, "annotations": []}, {"self_ref": "#/pictures/5", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/437"}, {"cref": "#/texts/438"}, {"cref": "#/texts/439"}, {"cref": "#/texts/440"}, {"cref": "#/texts/441"}, {"cref": "#/texts/442"}, {"cref": "#/texts/443"}, {"cref": "#/texts/444"}, {"cref": "#/texts/445"}, {"cref": "#/texts/446"}, {"cref": "#/texts/447"}, {"cref": "#/texts/448"}], "content_layer": "body", "label": "picture", "prov": [{"page_no": 11, "bbox": {"l": 168.39285278320312, "t": 610.0334930419922, "r": 447.35137939453125, "b": 157.99432373046875, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [{"cref": "#/texts/437"}], "references": [], "footnotes": [], "image": null, "annotations": []}], "tables": [{"self_ref": "#/tables/0", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/326"}], "content_layer": "body", "label": "table", "prov": [{"page_no": 9, "bbox": {"l": 139.66845703125, "t": 454.4252014160156, "r": 475.00372314453125, "b": 322.5278625488281, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [{"cref": "#/texts/326"}], "references": [], "footnotes": [], "image": null, "data": {"table_cells": [{"bbox": {"l": 160.37, "t": 341.73495, "r": 168.04793, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "#", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 144.592, "t": 354.68594, "r": 183.82806, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "enc-layers", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 207.974, "t": 341.73495, "r": 215.65193, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "#", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 192.19499, "t": 354.68594, "r": 231.43106, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "dec-layers", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 239.79799999999997, "t": 347.21396, "r": 278.31766, "b": 355.28372, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Language", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 324.67001, "t": 341.73495, "r": 348.26419, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 3, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 6, "text": "TEDs", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 396.271, "t": 341.73495, "r": 417.12683, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "mAP", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 394.927, "t": 352.69394000000005, "r": 418.47278, "b": 360.7637, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "(0.75)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 430.771, "t": 341.73495, "r": 467.1423, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "Inference", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 427.14801, "t": 352.69394000000005, "r": 470.76056, "b": 360.7637, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "time (secs)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 286.686, "t": 354.68594, "r": 312.33261, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "simple", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 320.702, "t": 354.68594, "r": 353.71988, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "complex", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 369.306, "t": 354.68594, "r": 379.03094, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "all", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 161.90601, "t": 373.51596, "r": 166.51294, "b": 381.58572, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 373.51596, "r": 214.11594, "b": 381.58572, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 368.03595, "r": 272.93954, "b": 389.05771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 368.03595, "r": 310.00375, "b": 389.05771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.965 0.969", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 368.03595, "r": 347.70377, "b": 389.05771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.934 0.927", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 363.67599, "t": 368.03595, "r": 384.66275, "b": 389.05771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.955 0.955", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 396.20599, "t": 367.97317999999996, "r": 417.19275, "b": 389.05771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.88 0.857", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 367.97317999999996, "r": 458.38425, "b": 389.05771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "2.73 5.39", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 161.90601, "t": 399.81696, "r": 166.51294, "b": 407.88672, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 399.81696, "r": 214.11594, "b": 407.88672, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 394.33795, "r": 272.93954, "b": 415.3587, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 394.33795, "r": 310.00375, "b": 415.3587, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.938 0.952", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 394.33795, "r": 347.70377, "b": 402.40771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.904", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 363.67599, "t": 394.33795, "r": 384.66275, "b": 402.40771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.927", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.61801, "t": 394.27518, "r": 418.77887, "b": 402.20148, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.853", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 394.27518, "r": 458.38425, "b": 402.20148, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "1.97", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 407.28894, "r": 347.70377, "b": 428.70871, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.909 0.897", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 362.08801, "t": 407.22617, "r": 386.24887, "b": 415.15247, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.938", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 396.20599, "t": 407.28894, "r": 417.19275, "b": 415.3587, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.843", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.767, "t": 407.28894, "r": 457.14682, "b": 415.3587, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "3.77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 161.90601, "t": 426.11795, "r": 166.51294, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 426.11795, "r": 214.11594, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 246.71000999999998, "t": 420.63895, "r": 271.40527, "b": 428.70871, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 420.63895, "r": 310.00375, "b": 441.6597, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.923 0.945", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 362.08801, "t": 420.63895, "r": 386.24887, "b": 441.45346, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.915 0.931", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.61801, "t": 420.57617, "r": 418.77887, "b": 441.6597, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.859 0.834", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 420.57617, "r": 458.38425, "b": 441.6597, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "1.91 3.81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 433.58994, "r": 272.93954, "b": 441.6597, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 433.58994, "r": 347.70377, "b": 441.6597, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.901", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 161.90601, "t": 452.41995, "r": 166.51294, "b": 460.48972, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 452.41995, "r": 214.11594, "b": 460.48972, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 446.9399399999999, "r": 272.93954, "b": 467.9617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 446.9399399999999, "r": 310.00375, "b": 467.9617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.952 0.944", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 446.9399399999999, "r": 347.70377, "b": 467.9617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.92 0.903", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 362.08801, "t": 446.87717, "r": 386.24887, "b": 467.9617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.942 0.931", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.61801, "t": 446.87717, "r": 418.77887, "b": 467.9617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.857 0.824", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 446.87717, "r": 458.38425, "b": 467.9617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "1.22 2", "column_header": false, "row_header": false, "row_section": false}], "num_rows": 7, "num_cols": 8, "grid": [[{"bbox": {"l": 160.37, "t": 341.73495, "r": 168.04793, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "#", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 207.974, "t": 341.73495, "r": 215.65193, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "#", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 239.79799999999997, "t": 347.21396, "r": 278.31766, "b": 355.28372, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Language", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 324.67001, "t": 341.73495, "r": 348.26419, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 3, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 6, "text": "TEDs", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 324.67001, "t": 341.73495, "r": 348.26419, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 3, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 6, "text": "TEDs", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 324.67001, "t": 341.73495, "r": 348.26419, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 3, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 6, "text": "TEDs", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 396.271, "t": 341.73495, "r": 417.12683, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "mAP", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 430.771, "t": 341.73495, "r": 467.1423, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "Inference", "column_header": true, "row_header": false, "row_section": false}], [{"bbox": {"l": 144.592, "t": 354.68594, "r": 183.82806, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "enc-layers", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 192.19499, "t": 354.68594, "r": 231.43106, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "dec-layers", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 239.79799999999997, "t": 347.21396, "r": 278.31766, "b": 355.28372, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Language", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 286.686, "t": 354.68594, "r": 312.33261, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "simple", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 320.702, "t": 354.68594, "r": 353.71988, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "complex", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 369.306, "t": 354.68594, "r": 379.03094, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "all", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 394.927, "t": 352.69394000000005, "r": 418.47278, "b": 360.7637, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "(0.75)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 427.14801, "t": 352.69394000000005, "r": 470.76056, "b": 360.7637, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "time (secs)", "column_header": true, "row_header": false, "row_section": false}], [{"bbox": {"l": 161.90601, "t": 373.51596, "r": 166.51294, "b": 381.58572, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 373.51596, "r": 214.11594, "b": 381.58572, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 368.03595, "r": 272.93954, "b": 389.05771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 368.03595, "r": 310.00375, "b": 389.05771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.965 0.969", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 368.03595, "r": 347.70377, "b": 389.05771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.934 0.927", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 363.67599, "t": 368.03595, "r": 384.66275, "b": 389.05771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.955 0.955", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 396.20599, "t": 367.97317999999996, "r": 417.19275, "b": 389.05771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.88 0.857", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 367.97317999999996, "r": 458.38425, "b": 389.05771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "2.73 5.39", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 161.90601, "t": 399.81696, "r": 166.51294, "b": 407.88672, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 399.81696, "r": 214.11594, "b": 407.88672, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 394.33795, "r": 272.93954, "b": 415.3587, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 394.33795, "r": 310.00375, "b": 415.3587, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.938 0.952", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 394.33795, "r": 347.70377, "b": 402.40771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.904", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 363.67599, "t": 394.33795, "r": 384.66275, "b": 402.40771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.927", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.61801, "t": 394.27518, "r": 418.77887, "b": 402.20148, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.853", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 394.27518, "r": 458.38425, "b": 402.20148, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "1.97", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 161.90601, "t": 426.11795, "r": 166.51294, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 426.11795, "r": 214.11594, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 246.71000999999998, "t": 420.63895, "r": 271.40527, "b": 428.70871, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 420.63895, "r": 310.00375, "b": 441.6597, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.923 0.945", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 407.28894, "r": 347.70377, "b": 428.70871, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.909 0.897", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 362.08801, "t": 407.22617, "r": 386.24887, "b": 415.15247, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.938", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 396.20599, "t": 407.28894, "r": 417.19275, "b": 415.3587, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.843", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.767, "t": 407.28894, "r": 457.14682, "b": 415.3587, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "3.77", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 433.58994, "r": 272.93954, "b": 441.6597, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 433.58994, "r": 347.70377, "b": 441.6597, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.901", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 362.08801, "t": 420.63895, "r": 386.24887, "b": 441.45346, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.915 0.931", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.61801, "t": 420.57617, "r": 418.77887, "b": 441.6597, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.859 0.834", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 420.57617, "r": 458.38425, "b": 441.6597, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "1.91 3.81", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 161.90601, "t": 452.41995, "r": 166.51294, "b": 460.48972, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 452.41995, "r": 214.11594, "b": 460.48972, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 446.9399399999999, "r": 272.93954, "b": 467.9617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 446.9399399999999, "r": 310.00375, "b": 467.9617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.952 0.944", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 446.9399399999999, "r": 347.70377, "b": 467.9617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.92 0.903", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 362.08801, "t": 446.87717, "r": 386.24887, "b": 467.9617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.942 0.931", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.61801, "t": 446.87717, "r": 418.77887, "b": 467.9617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.857 0.824", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 446.87717, "r": 458.38425, "b": 467.9617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "1.22 2", "column_header": false, "row_header": false, "row_section": false}]]}}, {"self_ref": "#/tables/1", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/332"}], "content_layer": "body", "label": "table", "prov": [{"page_no": 10, "bbox": {"l": 143.6376495361328, "t": 635.6522979736328, "r": 470.8485412597656, "b": 528.7375183105469, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [{"cref": "#/texts/332"}], "references": [], "footnotes": [], "image": null, "data": {"table_cells": [{"bbox": {"l": 215.52499000000003, "t": 166.534, "r": 254.04465, "b": 174.6037, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Language", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 300.397, "t": 161.07898, "r": 323.99118, "b": 169.14868, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 3, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 5, "text": "TEDs", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 370.345, "t": 166.55895999999996, "r": 414.74661, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 2, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "mAP(0.75)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 423.11401, "t": 161.07898, "r": 466.72656, "b": 180.10766999999998, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 2, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "Inference time (secs)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 262.41299, "t": 174.03101000000004, "r": 288.0596, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "simple", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 296.42899, "t": 174.03101000000004, "r": 329.44687, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "complex", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 345.03299, "t": 174.03101000000004, "r": 354.75793, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "all", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 154.53799, "t": 192.85999000000004, "r": 201.24129, "b": 200.92969000000005, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PubTabNet", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 222.43700000000004, "t": 187.38098000000002, "r": 247.13226000000003, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "OTSL", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 264.74399, "t": 187.38098000000002, "r": 285.73074, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.965", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 302.444, "t": 187.38098000000002, "r": 323.43076, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.934", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 339.40302, "t": 187.38098000000002, "r": 360.38977, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.955", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 383.116, "t": 187.31817999999998, "r": 401.97324, "b": 195.24451, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 435.49300999999997, "t": 187.31817999999998, "r": 454.35025, "b": 195.24451, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "2.73", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 220.903, "t": 200.33196999999996, "r": 248.66655999999998, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "HTML", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 264.74399, "t": 200.33196999999996, "r": 285.73074, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.969", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 302.444, "t": 200.33196999999996, "r": 323.43076, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.927", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 339.40302, "t": 200.33196999999996, "r": 360.38977, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.955", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 382.052, "t": 200.33196999999996, "r": 403.03876, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.857", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 436.73199000000005, "t": 200.33196999999996, "r": 453.11182, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "5.39", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 155.94501, "t": 219.16198999999995, "r": 199.83374, "b": 227.23168999999996, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "FinTabNet", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 222.43700000000004, "t": 213.68201, "r": 247.13226000000003, "b": 221.75171, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "OTSL", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 264.74399, "t": 213.68201, "r": 285.73074, "b": 221.75171, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.955", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 302.444, "t": 213.68201, "r": 323.43076, "b": 221.75171, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.961", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 337.815, "t": 213.61919999999998, "r": 361.97586, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.959", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 380.46399, "t": 213.61919999999998, "r": 404.62485, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.862", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 435.49300999999997, "t": 213.61919999999998, "r": 454.35025, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "1.85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 220.903, "t": 226.63396999999998, "r": 248.66655999999998, "b": 234.70367, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "HTML", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 264.74399, "t": 226.63396999999998, "r": 285.73074, "b": 234.70367, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.917", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 302.444, "t": 226.63396999999998, "r": 323.43076, "b": 234.70367, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.922", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 341.70599, "t": 226.63396999999998, "r": 358.08582, "b": 234.70367, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.92", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 382.052, "t": 226.63396999999998, "r": 403.03876, "b": 234.70367, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.722", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 436.73199000000005, "t": 226.63396999999998, "r": 453.11182, "b": 234.70367, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "3.26", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 148.62601, "t": 245.46294999999998, "r": 207.1524, "b": 253.53265, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PubTables-1M", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 222.43700000000004, "t": 239.98297000000002, "r": 247.13226000000003, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "OTSL", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 264.74399, "t": 239.98297000000002, "r": 285.73074, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.987", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 302.444, "t": 239.98297000000002, "r": 323.43076, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.964", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 337.815, "t": 239.92016999999998, "r": 361.97586, "b": 247.8465, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.977", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 380.46399, "t": 239.92016999999998, "r": 404.62485, "b": 247.8465, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.896", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 435.49300999999997, "t": 239.92016999999998, "r": 454.35025, "b": 247.8465, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "1.79", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 220.903, "t": 252.93499999999995, "r": 248.66655999999998, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "HTML", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 264.74399, "t": 252.93499999999995, "r": 285.73074, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.983", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 302.444, "t": 252.93499999999995, "r": 323.43076, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.944", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 339.40302, "t": 252.93499999999995, "r": 360.38977, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.966", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 382.052, "t": 252.93499999999995, "r": 403.03876, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.889", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 436.73199000000005, "t": 252.93499999999995, "r": 453.11182, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "3.26", "column_header": false, "row_header": false, "row_section": false}], "num_rows": 8, "num_cols": 7, "grid": [[{"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 215.52499000000003, "t": 166.534, "r": 254.04465, "b": 174.6037, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Language", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 300.397, "t": 161.07898, "r": 323.99118, "b": 169.14868, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 3, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 5, "text": "TEDs", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 300.397, "t": 161.07898, "r": 323.99118, "b": 169.14868, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 3, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 5, "text": "TEDs", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 300.397, "t": 161.07898, "r": 323.99118, "b": 169.14868, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 3, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 5, "text": "TEDs", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 370.345, "t": 166.55895999999996, "r": 414.74661, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 2, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "mAP(0.75)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 423.11401, "t": 161.07898, "r": 466.72656, "b": 180.10766999999998, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 2, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "Inference time (secs)", "column_header": true, "row_header": false, "row_section": false}], [{"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 215.52499000000003, "t": 166.534, "r": 254.04465, "b": 174.6037, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Language", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 262.41299, "t": 174.03101000000004, "r": 288.0596, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "simple", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 296.42899, "t": 174.03101000000004, "r": 329.44687, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "complex", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 345.03299, "t": 174.03101000000004, "r": 354.75793, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "all", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 370.345, "t": 166.55895999999996, "r": 414.74661, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 2, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "mAP(0.75)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 423.11401, "t": 161.07898, "r": 466.72656, "b": 180.10766999999998, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 2, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "Inference time (secs)", "column_header": true, "row_header": false, "row_section": false}], [{"bbox": {"l": 154.53799, "t": 192.85999000000004, "r": 201.24129, "b": 200.92969000000005, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PubTabNet", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 222.43700000000004, "t": 187.38098000000002, "r": 247.13226000000003, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "OTSL", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 264.74399, "t": 187.38098000000002, "r": 285.73074, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.965", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 302.444, "t": 187.38098000000002, "r": 323.43076, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.934", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 339.40302, "t": 187.38098000000002, "r": 360.38977, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.955", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 383.116, "t": 187.31817999999998, "r": 401.97324, "b": 195.24451, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 435.49300999999997, "t": 187.31817999999998, "r": 454.35025, "b": 195.24451, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "2.73", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 154.53799, "t": 192.85999000000004, "r": 201.24129, "b": 200.92969000000005, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PubTabNet", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 220.903, "t": 200.33196999999996, "r": 248.66655999999998, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "HTML", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 264.74399, "t": 200.33196999999996, "r": 285.73074, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.969", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 302.444, "t": 200.33196999999996, "r": 323.43076, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.927", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 339.40302, "t": 200.33196999999996, "r": 360.38977, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.955", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 382.052, "t": 200.33196999999996, "r": 403.03876, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.857", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 436.73199000000005, "t": 200.33196999999996, "r": 453.11182, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "5.39", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 155.94501, "t": 219.16198999999995, "r": 199.83374, "b": 227.23168999999996, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "FinTabNet", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 222.43700000000004, "t": 213.68201, "r": 247.13226000000003, "b": 221.75171, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "OTSL", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 264.74399, "t": 213.68201, "r": 285.73074, "b": 221.75171, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.955", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 302.444, "t": 213.68201, "r": 323.43076, "b": 221.75171, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.961", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 337.815, "t": 213.61919999999998, "r": 361.97586, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.959", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 380.46399, "t": 213.61919999999998, "r": 404.62485, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.862", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 435.49300999999997, "t": 213.61919999999998, "r": 454.35025, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "1.85", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 155.94501, "t": 219.16198999999995, "r": 199.83374, "b": 227.23168999999996, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "FinTabNet", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 220.903, "t": 226.63396999999998, "r": 248.66655999999998, "b": 234.70367, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "HTML", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 264.74399, "t": 226.63396999999998, "r": 285.73074, "b": 234.70367, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.917", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 302.444, "t": 226.63396999999998, "r": 323.43076, "b": 234.70367, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.922", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 341.70599, "t": 226.63396999999998, "r": 358.08582, "b": 234.70367, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.92", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 382.052, "t": 226.63396999999998, "r": 403.03876, "b": 234.70367, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.722", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 436.73199000000005, "t": 226.63396999999998, "r": 453.11182, "b": 234.70367, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "3.26", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 148.62601, "t": 245.46294999999998, "r": 207.1524, "b": 253.53265, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PubTables-1M", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 222.43700000000004, "t": 239.98297000000002, "r": 247.13226000000003, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "OTSL", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 264.74399, "t": 239.98297000000002, "r": 285.73074, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.987", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 302.444, "t": 239.98297000000002, "r": 323.43076, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.964", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 337.815, "t": 239.92016999999998, "r": 361.97586, "b": 247.8465, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.977", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 380.46399, "t": 239.92016999999998, "r": 404.62485, "b": 247.8465, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.896", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 435.49300999999997, "t": 239.92016999999998, "r": 454.35025, "b": 247.8465, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "1.79", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 148.62601, "t": 245.46294999999998, "r": 207.1524, "b": 253.53265, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PubTables-1M", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 220.903, "t": 252.93499999999995, "r": 248.66655999999998, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "HTML", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 264.74399, "t": 252.93499999999995, "r": 285.73074, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.983", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 302.444, "t": 252.93499999999995, "r": 323.43076, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.944", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 339.40302, "t": 252.93499999999995, "r": 360.38977, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.966", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 382.052, "t": 252.93499999999995, "r": 403.03876, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.889", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 436.73199000000005, "t": 252.93499999999995, "r": 453.11182, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "3.26", "column_header": false, "row_header": false, "row_section": false}]]}}], "key_value_items": [], "form_items": [], "pages": {"1": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 1}, "2": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 2}, "3": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 3}, "4": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 4}, "5": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 5}, "6": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 6}, "7": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 7}, "8": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 8}, "9": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 9}, "10": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 10}, "11": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 11}, "12": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 12}, "13": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 13}, "14": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 14}}}
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v2/2305.03393v1.md b/tests/data/groundtruth/docling_v2/2305.03393v1.md
index 362c0077..b5838fa9 100644
--- a/tests/data/groundtruth/docling_v2/2305.03393v1.md
+++ b/tests/data/groundtruth/docling_v2/2305.03393v1.md
@@ -38,7 +38,7 @@ Approaches to formalize the logical structure and layout of tables in electronic
 
 Other work [20] aims at predicting a grid for each table and deciding which cells must be merged using an attention network. Im2Seq methods cast the problem as a sequence generation task [4,5,9,22], and therefore need an internal tablestructure representation language, which is often implemented with standard markup languages (e.g. HTML, LaTeX, Markdown). In theory, Im2Seq methods have a natural advantage over the OD and GNN methods by virtue of directly predicting the table-structure. As such, no post-processing or rules are needed in order to obtain the table-structure, which is necessary with OD and GNN approaches. In practice, this is not entirely true, because a predicted sequence of table-structure markup does not necessarily have to be syntactically correct. Hence, depending on the quality of the predicted sequence, some post-processing needs to be performed to ensure a syntactically valid (let alone correct) sequence.
 
-Within the Im2Seq method, we find several popular models, namely the encoder-dual-decoder model (EDD) [22], TableFormer [9], Tabsplitter[2] and Ye et. al. [19]. EDD uses two consecutive long short-term memory (LSTM) decoders to predict a table in HTML representation. The tag decoder predicts a sequence of HTML tags. For each decoded table cell ( <td> ), the attention is passed to the cell decoder to predict the content with an embedded OCR approach. The latter makes it susceptible to transcription errors in the cell content of the table. TableFormer address this reliance on OCR and uses two transformer decoders for HTML structure and cell bounding box prediction in an end-to-end architecture. The predicted cell bounding box is then used to extract text tokens from an originating (digital) PDF page, circumventing any need for OCR. TabSplitter [2] proposes a compact double-matrix representation of table rows and columns to do error detection and error correction of HTML structure sequences based on predictions from [19]. This compact double-matrix representation can not be used directly by the Img2seq model training, so the model uses HTML as an intermediate form. Chi et. al. [4] introduce a data set and a baseline method using bidirectional LSTMs to predict LaTeX code. Kayal [5] introduces Gated ResNet transformers to predict LaTeX code, and a separate OCR module to extract content.
+Within the Im2Seq method, we find several popular models, namely the encoder-dual-decoder model (EDD) [22], TableFormer [9], Tabsplitter[2] and Ye et. al. [19]. EDD uses two consecutive long short-term memory (LSTM) decoders to predict a table in HTML representation. The tag decoder predicts a sequence of HTML tags. For each decoded table cell ( &lt;td&gt; ), the attention is passed to the cell decoder to predict the content with an embedded OCR approach. The latter makes it susceptible to transcription errors in the cell content of the table. TableFormer address this reliance on OCR and uses two transformer decoders for HTML structure and cell bounding box prediction in an end-to-end architecture. The predicted cell bounding box is then used to extract text tokens from an originating (digital) PDF page, circumventing any need for OCR. TabSplitter [2] proposes a compact double-matrix representation of table rows and columns to do error detection and error correction of HTML structure sequences based on predictions from [19]. This compact double-matrix representation can not be used directly by the Img2seq model training, so the model uses HTML as an intermediate form. Chi et. al. [4] introduce a data set and a baseline method using bidirectional LSTMs to predict LaTeX code. Kayal [5] introduces Gated ResNet transformers to predict LaTeX code, and a separate OCR module to extract content.
 
 Im2Seq approaches have shown to be well-suited for the TSR task and allow a full end-to-end network design that can output the final table structure without pre- or post-processing logic. Furthermore, Im2Seq models have demonstrated to deliver state-of-the-art prediction accuracy [9]. This motivated the authors to investigate if the performance (both in accuracy and inference time) can be further improved by optimising the table structure representation language. We believe this is a necessary step before further improving neural network architectures for this task.
 
@@ -46,13 +46,13 @@ Im2Seq approaches have shown to be well-suited for the TSR task and allow a full
 
 All known Im2Seq based models for TSR fundamentally work in similar ways. Given an image of a table, the Im2Seq model predicts the structure of the table by generating a sequence of tokens. These tokens originate from a finite vocab-
 
-ulary and can be interpreted as a table structure. For example, with the HTML tokens <table> , </table> , <tr> , </tr> , <td> and </td> , one can construct simple table structures without any spanning cells. In reality though, one needs at least 28 HTML tokens to describe the most common complex tables observed in real-world documents [21,22], due to a variety of spanning cells definitions in the HTML token vocabulary.
+ulary and can be interpreted as a table structure. For example, with the HTML tokens &lt;table&gt; , &lt;/table&gt; , &lt;tr&gt; , &lt;/tr&gt; , &lt;td&gt; and &lt;/td&gt; , one can construct simple table structures without any spanning cells. In reality though, one needs at least 28 HTML tokens to describe the most common complex tables observed in real-world documents [21,22], due to a variety of spanning cells definitions in the HTML token vocabulary.
 
 Fig. 2. Frequency of tokens in HTML and OTSL as they appear in PubTabNet.
 
 <!-- image -->
 
-Obviously, HTML and other general-purpose markup languages were not designed for Im2Seq models. As such, they have some serious drawbacks. First, the token vocabulary needs to be artificially large in order to describe all plausible tabular structures. Since most Im2Seq models use an autoregressive approach, they generate the sequence token by token. Therefore, to reduce inference time, a shorter sequence length is critical. Every table-cell is represented by at least two tokens ( <td> and </td> ). Furthermore, when tokenizing the HTML structure, one needs to explicitly enumerate possible column-spans and row-spans as words. In practice, this ends up requiring 28 different HTML tokens (when including column- and row-spans up to 10 cells) just to describe every table in the PubTabNet dataset. Clearly, not every token is equally represented, as is depicted in Figure 2. This skewed distribution of tokens in combination with variable token row-length makes it challenging for models to learn the HTML structure.
+Obviously, HTML and other general-purpose markup languages were not designed for Im2Seq models. As such, they have some serious drawbacks. First, the token vocabulary needs to be artificially large in order to describe all plausible tabular structures. Since most Im2Seq models use an autoregressive approach, they generate the sequence token by token. Therefore, to reduce inference time, a shorter sequence length is critical. Every table-cell is represented by at least two tokens ( &lt;td&gt; and &lt;/td&gt; ). Furthermore, when tokenizing the HTML structure, one needs to explicitly enumerate possible column-spans and row-spans as words. In practice, this ends up requiring 28 different HTML tokens (when including column- and row-spans up to 10 cells) just to describe every table in the PubTabNet dataset. Clearly, not every token is equally represented, as is depicted in Figure 2. This skewed distribution of tokens in combination with variable token row-length makes it challenging for models to learn the HTML structure.
 
 Additionally, it would be desirable if the representation would easily allow an early detection of invalid sequences on-the-go, before the prediction of the entire table structure is completed. HTML is not well-suited for this purpose as the verification of incomplete sequences is non-trivial or even impossible.
 
@@ -194,7 +194,7 @@ Secondly, OTSL has more inherent structure and a significantly restricted vocabu
 - 12. Schreiber, S., Agne, S., Wolf, I., Dengel, A., Ahmed, S.: Deepdesrt: Deep learning for detection and structure recognition of tables in document images. In: 2017 14th IAPR international conference on document analysis and recognition (ICDAR). vol. 1, pp. 1162-1167. IEEE (2017)
 - 13. Siddiqui, S.A., Fateh, I.A., Rizvi, S.T.R., Dengel, A., Ahmed, S.: Deeptabstr: Deep learning based table structure recognition. In: 2019 International Conference on Document Analysis and Recognition (ICDAR). pp. 1403-1409 (2019). https:// doi.org/10.1109/ICDAR.2019.00226
 - 14. Smock, B., Pesala, R., Abraham, R.: PubTables-1M: Towards comprehensive table extraction from unstructured documents. In: Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). pp. 4634-4642 (June 2022)
-- 15. Staar, P.W.J., Dolfi, M., Auer, C., Bekas, C.: Corpus conversion service: A machine learning platform to ingest documents at scale. In: Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining. pp. 774-782. KDD '18, Association for Computing Machinery, New York, NY, USA (2018). https://doi.org/10.1145/3219819.3219834 , https://doi.org/10. 1145/3219819.3219834
+- 15. Staar, P.W.J., Dolfi, M., Auer, C., Bekas, C.: Corpus conversion service: A machine learning platform to ingest documents at scale. In: Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery &amp; Data Mining. pp. 774-782. KDD '18, Association for Computing Machinery, New York, NY, USA (2018). https://doi.org/10.1145/3219819.3219834 , https://doi.org/10. 1145/3219819.3219834
 - 16. Wang, X.: Tabular Abstraction, Editing, and Formatting. Ph.D. thesis, CAN (1996), aAINN09397
 - 17. Xue, W., Li, Q., Tao, D.: Res2tim: Reconstruct syntactic structures from table images. In: 2019 International Conference on Document Analysis and Recognition (ICDAR). pp. 749-755. IEEE (2019)
 
diff --git a/tests/data/groundtruth/docling_v2/2305.03393v1.pages.json b/tests/data/groundtruth/docling_v2/2305.03393v1.pages.json
index a4737d71..df8dadbc 100644
--- a/tests/data/groundtruth/docling_v2/2305.03393v1.pages.json
+++ b/tests/data/groundtruth/docling_v2/2305.03393v1.pages.json
@@ -1 +1 @@
-[{"page_no": 0, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure", "bbox": {"l": 134.765, "t": 115.89910999999995, "r": 480.59735, "b": 128.58112000000006, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Recognition", "bbox": {"l": 266.67499, "t": 133.83209, "r": 348.68506, "b": 146.51409999999998, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Maksym Lysak", "bbox": {"l": 151.22598, "t": 171.67371000000003, "r": 217.04390999999998, "b": 180.47069999999997, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "[0000", "bbox": {"l": 217.04599, "t": 170.08209, "r": 235.18764, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "\u2212", "bbox": {"l": 235.18598999999998, "t": 169.69159000000002, "r": 241.4129, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "0002", "bbox": {"l": 241.41299000000004, "t": 170.08209, "r": 257.29932, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "\u2212", "bbox": {"l": 257.298, "t": 169.69159000000002, "r": 263.5249, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "3723", "bbox": {"l": 263.52499, "t": 170.08209, "r": 279.41132, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "\u2212", "bbox": {"l": 279.41, "t": 169.69159000000002, "r": 285.6369, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "$^{6960]}$, Ahmed Nassar[0000", "bbox": {"l": 285.63602, "t": 171.67371000000003, "r": 392.27664, "b": 180.47069999999997, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "\u2212", "bbox": {"l": 392.27502, "t": 169.69159000000002, "r": 398.50192, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "0002", "bbox": {"l": 398.50201, "t": 170.08209, "r": 414.38834, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "\u2212", "bbox": {"l": 414.38702, "t": 169.69159000000002, "r": 420.61392, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "9468", "bbox": {"l": 420.61304, "t": 170.08209, "r": 436.49936, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "\u2212", "bbox": {"l": 436.49805000000003, "t": 169.69159000000002, "r": 442.72495000000004, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "$^{0822]}$,", "bbox": {"l": 442.72504, "t": 171.67371000000003, "r": 464.12963999999994, "b": 180.47069999999997, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Nikolaos Livathinos", "bbox": {"l": 139.34305, "t": 183.62872000000004, "r": 224.80720999999997, "b": 192.42571999999996, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "[0000", "bbox": {"l": 224.80704000000003, "t": 182.03814999999997, "r": 242.94868, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "\u2212", "bbox": {"l": 242.94704000000002, "t": 181.64764000000002, "r": 249.17394999999996, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "0001", "bbox": {"l": 249.17404000000002, "t": 182.03814999999997, "r": 265.06036, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "\u2212", "bbox": {"l": 265.05905, "t": 181.64764000000002, "r": 271.28595, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "8513", "bbox": {"l": 271.28506, "t": 182.03814999999997, "r": 287.17139, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "\u2212", "bbox": {"l": 287.17007, "t": 181.64764000000002, "r": 293.39697, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "$^{3491]}$, Christoph Auer[0000", "bbox": {"l": 293.39706, "t": 183.62872000000004, "r": 404.1597, "b": 192.42571999999996, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "\u2212", "bbox": {"l": 404.15808, "t": 181.64764000000002, "r": 410.38498, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "0001", "bbox": {"l": 410.38507, "t": 182.03814999999997, "r": 426.27139, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "\u2212", "bbox": {"l": 426.27008, "t": 181.64764000000002, "r": 432.49697999999995, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "5761", "bbox": {"l": 432.49609, "t": 182.03814999999997, "r": 448.3824200000001, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "\u2212", "bbox": {"l": 448.3811, "t": 181.64764000000002, "r": 454.608, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "$^{0422]}$,", "bbox": {"l": 454.60808999999995, "t": 183.62872000000004, "r": 476.01270000000005, "b": 192.42571999999996, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "and Peter Staar", "bbox": {"l": 229.52109000000002, "t": 195.58374000000003, "r": 298.6087, "b": 204.38073999999995, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "[0000", "bbox": {"l": 298.60608, "t": 193.99316, "r": 316.74771, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "\u2212", "bbox": {"l": 316.74609, "t": 193.60266000000001, "r": 322.97299, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "0002", "bbox": {"l": 322.97308, "t": 193.99316, "r": 338.85941, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "\u2212", "bbox": {"l": 338.85809, "t": 193.60266000000001, "r": 345.08499, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "8088", "bbox": {"l": 345.08508, "t": 193.99316, "r": 360.97141, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "\u2212", "bbox": {"l": 360.97009, "t": 193.60266000000001, "r": 367.19699, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "0823]", "bbox": {"l": 367.19611, "t": 193.99316, "r": 385.33774, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "IBM Research", "bbox": {"l": 279.1051, "t": 217.20398, "r": 336.25153, "b": 225.27368, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "{mly,ahn,nli,cau,taa}@zurich.ibm.com", "bbox": {"l": 222.96609, "t": 228.80853000000002, "r": 392.38983, "b": 236.27752999999996, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "Abstract.", "bbox": {"l": 163.1111, "t": 270.30115, "r": 206.6358, "b": 278.22748, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Extracting tables from documents is a crucial task in any", "bbox": {"l": 211.6171, "t": 270.36395000000005, "r": 452.2447199999999, "b": 278.43364999999994, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "document conversion pipeline. Recently, transformer-based models have", "bbox": {"l": 163.1111, "t": 281.3229099999999, "r": 452.24246, "b": 289.39267, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "demonstrated that table-structure can be recognized with impressive ac-", "bbox": {"l": 163.1111, "t": 292.28189, "r": 452.24792, "b": 300.35165000000006, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "curacy using Image-to-Markup-Sequence (Im2Seq) approaches. Taking", "bbox": {"l": 163.1111, "t": 303.24088, "r": 452.2407799999999, "b": 311.31064, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "only the image of a table, such models predict a sequence of tokens (e.g.", "bbox": {"l": 163.1111, "t": 314.19888, "r": 452.24609, "b": 322.26865, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "in HTML, LaTeX) which represent the structure of the table. Since the", "bbox": {"l": 163.1111, "t": 325.15787, "r": 452.24615000000006, "b": 333.22763, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "token representation of the table structure has a significant impact on", "bbox": {"l": 163.1111, "t": 336.11685, "r": 452.24707, "b": 344.18661, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "the accuracy and run-time performance of any Im2Seq model, we inves-", "bbox": {"l": 163.1111, "t": 347.07584, "r": 452.2459999999999, "b": 355.1456, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "tigate in this paper how table-structure representation can be optimised.", "bbox": {"l": 163.1111, "t": 358.03482, "r": 452.2479900000001, "b": 366.10458, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "We propose a new, optimised table-structure language (OTSL) with a", "bbox": {"l": 163.1111, "t": 368.9938, "r": 452.24609, "b": 377.06357, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "minimized vocabulary and specific rules. The benefits of OTSL are that", "bbox": {"l": 163.1111, "t": 379.95279, "r": 452.2417, "b": 388.02255, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "it reduces the number of tokens to 5 (HTML needs 28+) and shortens", "bbox": {"l": 163.1111, "t": 390.91177, "r": 452.2443200000001, "b": 398.98154, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "the sequence length to half of HTML on average. Consequently, model", "bbox": {"l": 163.1111, "t": 401.87076, "r": 452.24878000000007, "b": 409.94052, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "accuracy improves significantly, inference time is halved compared to", "bbox": {"l": 163.1111, "t": 412.82974, "r": 452.24063000000007, "b": 420.8995100000001, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "HTML-based models, and the predicted table structures are always syn-", "bbox": {"l": 163.1111, "t": 423.78774999999996, "r": 452.24161, "b": 431.85751000000005, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "tactically correct. This in turn eliminates most post-processing needs.", "bbox": {"l": 163.1111, "t": 434.74673, "r": 452.24429, "b": 442.8165, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Popular table structure data-sets will be published in OTSL format to", "bbox": {"l": 163.1111, "t": 445.70572000000004, "r": 452.24603, "b": 453.77547999999996, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "the community.", "bbox": {"l": 163.1111, "t": 456.6647, "r": 225.56116, "b": 464.73447, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Keywords:", "bbox": {"l": 163.1111, "t": 478.69394, "r": 211.94211, "b": 486.62024, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Table Structure Recognition \u00b7 Data Representation \u00b7 Trans-", "bbox": {"l": 216.55208999999996, "t": 478.75671, "r": 452.24158, "b": 486.82648, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "formers \u00b7 Optimization.", "bbox": {"l": 163.11111, "t": 489.71573, "r": 257.64185, "b": 497.78549, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "1", "bbox": {"l": 134.76512, "t": 522.11969, "r": 141.48872, "b": 532.68808, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "Introduction", "bbox": {"l": 154.93832, "t": 522.11969, "r": 228.93384, "b": 532.68808, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "Tables are ubiquitous in documents such as scientific papers, patents, reports,", "bbox": {"l": 134.76512, "t": 548.2865400000001, "r": 480.5939, "b": 557.0835099999999, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "manuals, specification sheets or marketing material. They often encode highly", "bbox": {"l": 134.76512, "t": 560.24254, "r": 480.59180000000003, "b": 569.0395100000001, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "valuable information and therefore need to be extracted with high accuracy.", "bbox": {"l": 134.76512, "t": 572.19754, "r": 480.59283000000005, "b": 580.99451, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "Unfortunately, tables appear in documents in various sizes, styling and struc-", "bbox": {"l": 134.76512, "t": 584.15254, "r": 480.5959500000001, "b": 592.9495099999999, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "ture, making it difficult to recover their correct structure with simple analyt-", "bbox": {"l": 134.76512, "t": 596.10754, "r": 480.58688, "b": 604.90451, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "ical methods. Therefore, accurate table extraction is achieved these days with", "bbox": {"l": 134.76512, "t": 608.06255, "r": 480.59088, "b": 616.85951, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "machine-learning based methods.", "bbox": {"l": 134.76512, "t": 620.01755, "r": 279.32745, "b": 628.81451, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "In modern document understanding systems [1,15], table extraction is typi-", "bbox": {"l": 149.70811, "t": 632.14755, "r": 480.58899, "b": 640.94452, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "cally a two-step process. Firstly, every table on a page is located with a bounding", "bbox": {"l": 134.76512, "t": 644.1025500000001, "r": 480.59583, "b": 652.8995199999999, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "box, and secondly, their logical row and column structure is recognized. As of", "bbox": {"l": 134.76512, "t": 656.05756, "r": 480.59496999999993, "b": 664.85453, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "arXiv:2305.03393v1 [cs.CV] 5 May 2023", "bbox": {"l": 18.340218, "t": 209.47997999999995, "r": 36.339787, "b": 555.00003, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 5, "label": "section_header", "bbox": {"l": 134.765, "t": 115.89910999999995, "r": 480.59735, "b": 146.51409999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.8918349742889404, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure", "bbox": {"l": 134.765, "t": 115.89910999999995, "r": 480.59735, "b": 128.58112000000006, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Recognition", "bbox": {"l": 266.67499, "t": 133.83209, "r": 348.68506, "b": 146.51409999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "key_value_region", "bbox": {"l": 139.34305, "t": 169.69159000000002, "r": 476.01270000000005, "b": 236.27752999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.48445820808410645, "cells": [{"id": 2, "text": "Maksym Lysak", "bbox": {"l": 151.22598, "t": 171.67371000000003, "r": 217.04390999999998, "b": 180.47069999999997, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "[0000", "bbox": {"l": 217.04599, "t": 170.08209, "r": 235.18764, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "\u2212", "bbox": {"l": 235.18598999999998, "t": 169.69159000000002, "r": 241.4129, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "0002", "bbox": {"l": 241.41299000000004, "t": 170.08209, "r": 257.29932, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "\u2212", "bbox": {"l": 257.298, "t": 169.69159000000002, "r": 263.5249, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "3723", "bbox": {"l": 263.52499, "t": 170.08209, "r": 279.41132, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "\u2212", "bbox": {"l": 279.41, "t": 169.69159000000002, "r": 285.6369, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "$^{6960]}$, Ahmed Nassar[0000", "bbox": {"l": 285.63602, "t": 171.67371000000003, "r": 392.27664, "b": 180.47069999999997, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "\u2212", "bbox": {"l": 392.27502, "t": 169.69159000000002, "r": 398.50192, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "0002", "bbox": {"l": 398.50201, "t": 170.08209, "r": 414.38834, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "\u2212", "bbox": {"l": 414.38702, "t": 169.69159000000002, "r": 420.61392, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "9468", "bbox": {"l": 420.61304, "t": 170.08209, "r": 436.49936, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "\u2212", "bbox": {"l": 436.49805000000003, "t": 169.69159000000002, "r": 442.72495000000004, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "$^{0822]}$,", "bbox": {"l": 442.72504, "t": 171.67371000000003, "r": 464.12963999999994, "b": 180.47069999999997, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Nikolaos Livathinos", "bbox": {"l": 139.34305, "t": 183.62872000000004, "r": 224.80720999999997, "b": 192.42571999999996, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "[0000", "bbox": {"l": 224.80704000000003, "t": 182.03814999999997, "r": 242.94868, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "\u2212", "bbox": {"l": 242.94704000000002, "t": 181.64764000000002, "r": 249.17394999999996, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "0001", "bbox": {"l": 249.17404000000002, "t": 182.03814999999997, "r": 265.06036, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "\u2212", "bbox": {"l": 265.05905, "t": 181.64764000000002, "r": 271.28595, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "8513", "bbox": {"l": 271.28506, "t": 182.03814999999997, "r": 287.17139, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "\u2212", "bbox": {"l": 287.17007, "t": 181.64764000000002, "r": 293.39697, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "$^{3491]}$, Christoph Auer[0000", "bbox": {"l": 293.39706, "t": 183.62872000000004, "r": 404.1597, "b": 192.42571999999996, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "\u2212", "bbox": {"l": 404.15808, "t": 181.64764000000002, "r": 410.38498, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "0001", "bbox": {"l": 410.38507, "t": 182.03814999999997, "r": 426.27139, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "\u2212", "bbox": {"l": 426.27008, "t": 181.64764000000002, "r": 432.49697999999995, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "5761", "bbox": {"l": 432.49609, "t": 182.03814999999997, "r": 448.3824200000001, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "\u2212", "bbox": {"l": 448.3811, "t": 181.64764000000002, "r": 454.608, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "$^{0422]}$,", "bbox": {"l": 454.60808999999995, "t": 183.62872000000004, "r": 476.01270000000005, "b": 192.42571999999996, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "and Peter Staar", "bbox": {"l": 229.52109000000002, "t": 195.58374000000003, "r": 298.6087, "b": 204.38073999999995, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "[0000", "bbox": {"l": 298.60608, "t": 193.99316, "r": 316.74771, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "\u2212", "bbox": {"l": 316.74609, "t": 193.60266000000001, "r": 322.97299, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "0002", "bbox": {"l": 322.97308, "t": 193.99316, "r": 338.85941, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "\u2212", "bbox": {"l": 338.85809, "t": 193.60266000000001, "r": 345.08499, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "8088", "bbox": {"l": 345.08508, "t": 193.99316, "r": 360.97141, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "\u2212", "bbox": {"l": 360.97009, "t": 193.60266000000001, "r": 367.19699, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "0823]", "bbox": {"l": 367.19611, "t": 193.99316, "r": 385.33774, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "IBM Research", "bbox": {"l": 279.1051, "t": 217.20398, "r": 336.25153, "b": 225.27368, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "{mly,ahn,nli,cau,taa}@zurich.ibm.com", "bbox": {"l": 222.96609, "t": 228.80853000000002, "r": 392.38983, "b": 236.27752999999996, "coord_origin": "TOPLEFT"}}], "children": [{"id": 7, "label": "text", "bbox": {"l": 139.34305, "t": 169.69159000000002, "r": 476.01270000000005, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.7918068766593933, "cells": [{"id": 2, "text": "Maksym Lysak", "bbox": {"l": 151.22598, "t": 171.67371000000003, "r": 217.04390999999998, "b": 180.47069999999997, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "[0000", "bbox": {"l": 217.04599, "t": 170.08209, "r": 235.18764, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "\u2212", "bbox": {"l": 235.18598999999998, "t": 169.69159000000002, "r": 241.4129, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "0002", "bbox": {"l": 241.41299000000004, "t": 170.08209, "r": 257.29932, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "\u2212", "bbox": {"l": 257.298, "t": 169.69159000000002, "r": 263.5249, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "3723", "bbox": {"l": 263.52499, "t": 170.08209, "r": 279.41132, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "\u2212", "bbox": {"l": 279.41, "t": 169.69159000000002, "r": 285.6369, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "$^{6960]}$, Ahmed Nassar[0000", "bbox": {"l": 285.63602, "t": 171.67371000000003, "r": 392.27664, "b": 180.47069999999997, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "\u2212", "bbox": {"l": 392.27502, "t": 169.69159000000002, "r": 398.50192, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "0002", "bbox": {"l": 398.50201, "t": 170.08209, "r": 414.38834, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "\u2212", "bbox": {"l": 414.38702, "t": 169.69159000000002, "r": 420.61392, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "9468", "bbox": {"l": 420.61304, "t": 170.08209, "r": 436.49936, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "\u2212", "bbox": {"l": 436.49805000000003, "t": 169.69159000000002, "r": 442.72495000000004, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "$^{0822]}$,", "bbox": {"l": 442.72504, "t": 171.67371000000003, "r": 464.12963999999994, "b": 180.47069999999997, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Nikolaos Livathinos", "bbox": {"l": 139.34305, "t": 183.62872000000004, "r": 224.80720999999997, "b": 192.42571999999996, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "[0000", "bbox": {"l": 224.80704000000003, "t": 182.03814999999997, "r": 242.94868, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "\u2212", "bbox": {"l": 242.94704000000002, "t": 181.64764000000002, "r": 249.17394999999996, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "0001", "bbox": {"l": 249.17404000000002, "t": 182.03814999999997, "r": 265.06036, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "\u2212", "bbox": {"l": 265.05905, "t": 181.64764000000002, "r": 271.28595, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "8513", "bbox": {"l": 271.28506, "t": 182.03814999999997, "r": 287.17139, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "\u2212", "bbox": {"l": 287.17007, "t": 181.64764000000002, "r": 293.39697, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "$^{3491]}$, Christoph Auer[0000", "bbox": {"l": 293.39706, "t": 183.62872000000004, "r": 404.1597, "b": 192.42571999999996, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "\u2212", "bbox": {"l": 404.15808, "t": 181.64764000000002, "r": 410.38498, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "0001", "bbox": {"l": 410.38507, "t": 182.03814999999997, "r": 426.27139, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "\u2212", "bbox": {"l": 426.27008, "t": 181.64764000000002, "r": 432.49697999999995, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "5761", "bbox": {"l": 432.49609, "t": 182.03814999999997, "r": 448.3824200000001, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "\u2212", "bbox": {"l": 448.3811, "t": 181.64764000000002, "r": 454.608, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "$^{0422]}$,", "bbox": {"l": 454.60808999999995, "t": 183.62872000000004, "r": 476.01270000000005, "b": 192.42571999999996, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "[0000", "bbox": {"l": 298.60608, "t": 193.99316, "r": 316.74771, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "\u2212", "bbox": {"l": 316.74609, "t": 193.60266000000001, "r": 322.97299, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "0002", "bbox": {"l": 322.97308, "t": 193.99316, "r": 338.85941, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "\u2212", "bbox": {"l": 338.85809, "t": 193.60266000000001, "r": 345.08499, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "8088", "bbox": {"l": 345.08508, "t": 193.99316, "r": 360.97141, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "\u2212", "bbox": {"l": 360.97009, "t": 193.60266000000001, "r": 367.19699, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "0823]", "bbox": {"l": 367.19611, "t": 193.99316, "r": 385.33774, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 229.52109000000002, "t": 195.58374000000003, "r": 298.6087, "b": 204.38073999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.5015263557434082, "cells": [{"id": 30, "text": "and Peter Staar", "bbox": {"l": 229.52109000000002, "t": 195.58374000000003, "r": 298.6087, "b": 204.38073999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 279.1051, "t": 217.20398, "r": 336.25153, "b": 225.27368, "coord_origin": "TOPLEFT"}, "confidence": 0.6310867667198181, "cells": [{"id": 38, "text": "IBM Research", "bbox": {"l": 279.1051, "t": 217.20398, "r": 336.25153, "b": 225.27368, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "text", "bbox": {"l": 222.96609, "t": 228.80853000000002, "r": 392.38983, "b": 236.27752999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.6924149990081787, "cells": [{"id": 39, "text": "{mly,ahn,nli,cau,taa}@zurich.ibm.com", "bbox": {"l": 222.96609, "t": 228.80853000000002, "r": 392.38983, "b": 236.27752999999996, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 1, "label": "text", "bbox": {"l": 163.1111, "t": 270.30115, "r": 452.24878000000007, "b": 464.73447, "coord_origin": "TOPLEFT"}, "confidence": 0.9807654023170471, "cells": [{"id": 40, "text": "Abstract.", "bbox": {"l": 163.1111, "t": 270.30115, "r": 206.6358, "b": 278.22748, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Extracting tables from documents is a crucial task in any", "bbox": {"l": 211.6171, "t": 270.36395000000005, "r": 452.2447199999999, "b": 278.43364999999994, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "document conversion pipeline. Recently, transformer-based models have", "bbox": {"l": 163.1111, "t": 281.3229099999999, "r": 452.24246, "b": 289.39267, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "demonstrated that table-structure can be recognized with impressive ac-", "bbox": {"l": 163.1111, "t": 292.28189, "r": 452.24792, "b": 300.35165000000006, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "curacy using Image-to-Markup-Sequence (Im2Seq) approaches. Taking", "bbox": {"l": 163.1111, "t": 303.24088, "r": 452.2407799999999, "b": 311.31064, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "only the image of a table, such models predict a sequence of tokens (e.g.", "bbox": {"l": 163.1111, "t": 314.19888, "r": 452.24609, "b": 322.26865, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "in HTML, LaTeX) which represent the structure of the table. Since the", "bbox": {"l": 163.1111, "t": 325.15787, "r": 452.24615000000006, "b": 333.22763, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "token representation of the table structure has a significant impact on", "bbox": {"l": 163.1111, "t": 336.11685, "r": 452.24707, "b": 344.18661, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "the accuracy and run-time performance of any Im2Seq model, we inves-", "bbox": {"l": 163.1111, "t": 347.07584, "r": 452.2459999999999, "b": 355.1456, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "tigate in this paper how table-structure representation can be optimised.", "bbox": {"l": 163.1111, "t": 358.03482, "r": 452.2479900000001, "b": 366.10458, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "We propose a new, optimised table-structure language (OTSL) with a", "bbox": {"l": 163.1111, "t": 368.9938, "r": 452.24609, "b": 377.06357, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "minimized vocabulary and specific rules. The benefits of OTSL are that", "bbox": {"l": 163.1111, "t": 379.95279, "r": 452.2417, "b": 388.02255, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "it reduces the number of tokens to 5 (HTML needs 28+) and shortens", "bbox": {"l": 163.1111, "t": 390.91177, "r": 452.2443200000001, "b": 398.98154, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "the sequence length to half of HTML on average. Consequently, model", "bbox": {"l": 163.1111, "t": 401.87076, "r": 452.24878000000007, "b": 409.94052, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "accuracy improves significantly, inference time is halved compared to", "bbox": {"l": 163.1111, "t": 412.82974, "r": 452.24063000000007, "b": 420.8995100000001, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "HTML-based models, and the predicted table structures are always syn-", "bbox": {"l": 163.1111, "t": 423.78774999999996, "r": 452.24161, "b": 431.85751000000005, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "tactically correct. This in turn eliminates most post-processing needs.", "bbox": {"l": 163.1111, "t": 434.74673, "r": 452.24429, "b": 442.8165, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Popular table structure data-sets will be published in OTSL format to", "bbox": {"l": 163.1111, "t": 445.70572000000004, "r": 452.24603, "b": 453.77547999999996, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "the community.", "bbox": {"l": 163.1111, "t": 456.6647, "r": 225.56116, "b": 464.73447, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "text", "bbox": {"l": 163.1111, "t": 478.69394, "r": 452.24158, "b": 497.78549, "coord_origin": "TOPLEFT"}, "confidence": 0.9304055571556091, "cells": [{"id": 59, "text": "Keywords:", "bbox": {"l": 163.1111, "t": 478.69394, "r": 211.94211, "b": 486.62024, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Table Structure Recognition \u00b7 Data Representation \u00b7 Trans-", "bbox": {"l": 216.55208999999996, "t": 478.75671, "r": 452.24158, "b": 486.82648, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "formers \u00b7 Optimization.", "bbox": {"l": 163.11111, "t": 489.71573, "r": 257.64185, "b": 497.78549, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "section_header", "bbox": {"l": 134.76512, "t": 522.11969, "r": 228.93384, "b": 532.68808, "coord_origin": "TOPLEFT"}, "confidence": 0.9392016530036926, "cells": [{"id": 62, "text": "1", "bbox": {"l": 134.76512, "t": 522.11969, "r": 141.48872, "b": 532.68808, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "Introduction", "bbox": {"l": 154.93832, "t": 522.11969, "r": 228.93384, "b": 532.68808, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 134.76512, "t": 548.2865400000001, "r": 480.5959500000001, "b": 628.81451, "coord_origin": "TOPLEFT"}, "confidence": 0.9835679531097412, "cells": [{"id": 64, "text": "Tables are ubiquitous in documents such as scientific papers, patents, reports,", "bbox": {"l": 134.76512, "t": 548.2865400000001, "r": 480.5939, "b": 557.0835099999999, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "manuals, specification sheets or marketing material. They often encode highly", "bbox": {"l": 134.76512, "t": 560.24254, "r": 480.59180000000003, "b": 569.0395100000001, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "valuable information and therefore need to be extracted with high accuracy.", "bbox": {"l": 134.76512, "t": 572.19754, "r": 480.59283000000005, "b": 580.99451, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "Unfortunately, tables appear in documents in various sizes, styling and struc-", "bbox": {"l": 134.76512, "t": 584.15254, "r": 480.5959500000001, "b": 592.9495099999999, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "ture, making it difficult to recover their correct structure with simple analyt-", "bbox": {"l": 134.76512, "t": 596.10754, "r": 480.58688, "b": 604.90451, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "ical methods. Therefore, accurate table extraction is achieved these days with", "bbox": {"l": 134.76512, "t": 608.06255, "r": 480.59088, "b": 616.85951, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "machine-learning based methods.", "bbox": {"l": 134.76512, "t": 620.01755, "r": 279.32745, "b": 628.81451, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 134.76512, "t": 632.14755, "r": 480.59583, "b": 664.85453, "coord_origin": "TOPLEFT"}, "confidence": 0.9696458578109741, "cells": [{"id": 71, "text": "In modern document understanding systems [1,15], table extraction is typi-", "bbox": {"l": 149.70811, "t": 632.14755, "r": 480.58899, "b": 640.94452, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "cally a two-step process. Firstly, every table on a page is located with a bounding", "bbox": {"l": 134.76512, "t": 644.1025500000001, "r": 480.59583, "b": 652.8995199999999, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "box, and secondly, their logical row and column structure is recognized. As of", "bbox": {"l": 134.76512, "t": 656.05756, "r": 480.59496999999993, "b": 664.85453, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "page_header", "bbox": {"l": 18.340218, "t": 209.47997999999995, "r": 36.339787, "b": 555.00003, "coord_origin": "TOPLEFT"}, "confidence": 0.8899643421173096, "cells": [{"id": 74, "text": "arXiv:2305.03393v1 [cs.CV] 5 May 2023", "bbox": {"l": 18.340218, "t": 209.47997999999995, "r": 36.339787, "b": 555.00003, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "section_header", "id": 5, "page_no": 0, "cluster": {"id": 5, "label": "section_header", "bbox": {"l": 134.765, "t": 115.89910999999995, "r": 480.59735, "b": 146.51409999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.8918349742889404, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure", "bbox": {"l": 134.765, "t": 115.89910999999995, "r": 480.59735, "b": 128.58112000000006, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Recognition", "bbox": {"l": 266.67499, "t": 133.83209, "r": 348.68506, "b": 146.51409999999998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Optimized Table Tokenization for Table Structure Recognition"}, {"label": "key_value_region", "id": 16, "page_no": 0, "cluster": {"id": 16, "label": "key_value_region", "bbox": {"l": 139.34305, "t": 169.69159000000002, "r": 476.01270000000005, "b": 236.27752999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.48445820808410645, "cells": [{"id": 2, "text": "Maksym Lysak", "bbox": {"l": 151.22598, "t": 171.67371000000003, "r": 217.04390999999998, "b": 180.47069999999997, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "[0000", "bbox": {"l": 217.04599, "t": 170.08209, "r": 235.18764, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "\u2212", "bbox": {"l": 235.18598999999998, "t": 169.69159000000002, "r": 241.4129, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "0002", "bbox": {"l": 241.41299000000004, "t": 170.08209, "r": 257.29932, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "\u2212", "bbox": {"l": 257.298, "t": 169.69159000000002, "r": 263.5249, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "3723", "bbox": {"l": 263.52499, "t": 170.08209, "r": 279.41132, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "\u2212", "bbox": {"l": 279.41, "t": 169.69159000000002, "r": 285.6369, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "$^{6960]}$, Ahmed Nassar[0000", "bbox": {"l": 285.63602, "t": 171.67371000000003, "r": 392.27664, "b": 180.47069999999997, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "\u2212", "bbox": {"l": 392.27502, "t": 169.69159000000002, "r": 398.50192, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "0002", "bbox": {"l": 398.50201, "t": 170.08209, "r": 414.38834, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "\u2212", "bbox": {"l": 414.38702, "t": 169.69159000000002, "r": 420.61392, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "9468", "bbox": {"l": 420.61304, "t": 170.08209, "r": 436.49936, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "\u2212", "bbox": {"l": 436.49805000000003, "t": 169.69159000000002, "r": 442.72495000000004, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "$^{0822]}$,", "bbox": {"l": 442.72504, "t": 171.67371000000003, "r": 464.12963999999994, "b": 180.47069999999997, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Nikolaos Livathinos", "bbox": {"l": 139.34305, "t": 183.62872000000004, "r": 224.80720999999997, "b": 192.42571999999996, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "[0000", "bbox": {"l": 224.80704000000003, "t": 182.03814999999997, "r": 242.94868, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "\u2212", "bbox": {"l": 242.94704000000002, "t": 181.64764000000002, "r": 249.17394999999996, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "0001", "bbox": {"l": 249.17404000000002, "t": 182.03814999999997, "r": 265.06036, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "\u2212", "bbox": {"l": 265.05905, "t": 181.64764000000002, "r": 271.28595, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "8513", "bbox": {"l": 271.28506, "t": 182.03814999999997, "r": 287.17139, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "\u2212", "bbox": {"l": 287.17007, "t": 181.64764000000002, "r": 293.39697, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "$^{3491]}$, Christoph Auer[0000", "bbox": {"l": 293.39706, "t": 183.62872000000004, "r": 404.1597, "b": 192.42571999999996, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "\u2212", "bbox": {"l": 404.15808, "t": 181.64764000000002, "r": 410.38498, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "0001", "bbox": {"l": 410.38507, "t": 182.03814999999997, "r": 426.27139, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "\u2212", "bbox": {"l": 426.27008, "t": 181.64764000000002, "r": 432.49697999999995, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "5761", "bbox": {"l": 432.49609, "t": 182.03814999999997, "r": 448.3824200000001, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "\u2212", "bbox": {"l": 448.3811, "t": 181.64764000000002, "r": 454.608, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "$^{0422]}$,", "bbox": {"l": 454.60808999999995, "t": 183.62872000000004, "r": 476.01270000000005, "b": 192.42571999999996, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "and Peter Staar", "bbox": {"l": 229.52109000000002, "t": 195.58374000000003, "r": 298.6087, "b": 204.38073999999995, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "[0000", "bbox": {"l": 298.60608, "t": 193.99316, "r": 316.74771, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "\u2212", "bbox": {"l": 316.74609, "t": 193.60266000000001, "r": 322.97299, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "0002", "bbox": {"l": 322.97308, "t": 193.99316, "r": 338.85941, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "\u2212", "bbox": {"l": 338.85809, "t": 193.60266000000001, "r": 345.08499, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "8088", "bbox": {"l": 345.08508, "t": 193.99316, "r": 360.97141, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "\u2212", "bbox": {"l": 360.97009, "t": 193.60266000000001, "r": 367.19699, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "0823]", "bbox": {"l": 367.19611, "t": 193.99316, "r": 385.33774, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "IBM Research", "bbox": {"l": 279.1051, "t": 217.20398, "r": 336.25153, "b": 225.27368, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "{mly,ahn,nli,cau,taa}@zurich.ibm.com", "bbox": {"l": 222.96609, "t": 228.80853000000002, "r": 392.38983, "b": 236.27752999999996, "coord_origin": "TOPLEFT"}}], "children": [{"id": 7, "label": "text", "bbox": {"l": 139.34305, "t": 169.69159000000002, "r": 476.01270000000005, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.7918068766593933, "cells": [{"id": 2, "text": "Maksym Lysak", "bbox": {"l": 151.22598, "t": 171.67371000000003, "r": 217.04390999999998, "b": 180.47069999999997, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "[0000", "bbox": {"l": 217.04599, "t": 170.08209, "r": 235.18764, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "\u2212", "bbox": {"l": 235.18598999999998, "t": 169.69159000000002, "r": 241.4129, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "0002", "bbox": {"l": 241.41299000000004, "t": 170.08209, "r": 257.29932, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "\u2212", "bbox": {"l": 257.298, "t": 169.69159000000002, "r": 263.5249, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "3723", "bbox": {"l": 263.52499, "t": 170.08209, "r": 279.41132, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "\u2212", "bbox": {"l": 279.41, "t": 169.69159000000002, "r": 285.6369, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "$^{6960]}$, Ahmed Nassar[0000", "bbox": {"l": 285.63602, "t": 171.67371000000003, "r": 392.27664, "b": 180.47069999999997, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "\u2212", "bbox": {"l": 392.27502, "t": 169.69159000000002, "r": 398.50192, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "0002", "bbox": {"l": 398.50201, "t": 170.08209, "r": 414.38834, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "\u2212", "bbox": {"l": 414.38702, "t": 169.69159000000002, "r": 420.61392, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "9468", "bbox": {"l": 420.61304, "t": 170.08209, "r": 436.49936, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "\u2212", "bbox": {"l": 436.49805000000003, "t": 169.69159000000002, "r": 442.72495000000004, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "$^{0822]}$,", "bbox": {"l": 442.72504, "t": 171.67371000000003, "r": 464.12963999999994, "b": 180.47069999999997, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Nikolaos Livathinos", "bbox": {"l": 139.34305, "t": 183.62872000000004, "r": 224.80720999999997, "b": 192.42571999999996, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "[0000", "bbox": {"l": 224.80704000000003, "t": 182.03814999999997, "r": 242.94868, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "\u2212", "bbox": {"l": 242.94704000000002, "t": 181.64764000000002, "r": 249.17394999999996, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "0001", "bbox": {"l": 249.17404000000002, "t": 182.03814999999997, "r": 265.06036, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "\u2212", "bbox": {"l": 265.05905, "t": 181.64764000000002, "r": 271.28595, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "8513", "bbox": {"l": 271.28506, "t": 182.03814999999997, "r": 287.17139, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "\u2212", "bbox": {"l": 287.17007, "t": 181.64764000000002, "r": 293.39697, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "$^{3491]}$, Christoph Auer[0000", "bbox": {"l": 293.39706, "t": 183.62872000000004, "r": 404.1597, "b": 192.42571999999996, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "\u2212", "bbox": {"l": 404.15808, "t": 181.64764000000002, "r": 410.38498, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "0001", "bbox": {"l": 410.38507, "t": 182.03814999999997, "r": 426.27139, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "\u2212", "bbox": {"l": 426.27008, "t": 181.64764000000002, "r": 432.49697999999995, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "5761", "bbox": {"l": 432.49609, "t": 182.03814999999997, "r": 448.3824200000001, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "\u2212", "bbox": {"l": 448.3811, "t": 181.64764000000002, "r": 454.608, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "$^{0422]}$,", "bbox": {"l": 454.60808999999995, "t": 183.62872000000004, "r": 476.01270000000005, "b": 192.42571999999996, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "[0000", "bbox": {"l": 298.60608, "t": 193.99316, "r": 316.74771, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "\u2212", "bbox": {"l": 316.74609, "t": 193.60266000000001, "r": 322.97299, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "0002", "bbox": {"l": 322.97308, "t": 193.99316, "r": 338.85941, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "\u2212", "bbox": {"l": 338.85809, "t": 193.60266000000001, "r": 345.08499, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "8088", "bbox": {"l": 345.08508, "t": 193.99316, "r": 360.97141, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "\u2212", "bbox": {"l": 360.97009, "t": 193.60266000000001, "r": 367.19699, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "0823]", "bbox": {"l": 367.19611, "t": 193.99316, "r": 385.33774, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 229.52109000000002, "t": 195.58374000000003, "r": 298.6087, "b": 204.38073999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.5015263557434082, "cells": [{"id": 30, "text": "and Peter Staar", "bbox": {"l": 229.52109000000002, "t": 195.58374000000003, "r": 298.6087, "b": 204.38073999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 279.1051, "t": 217.20398, "r": 336.25153, "b": 225.27368, "coord_origin": "TOPLEFT"}, "confidence": 0.6310867667198181, "cells": [{"id": 38, "text": "IBM Research", "bbox": {"l": 279.1051, "t": 217.20398, "r": 336.25153, "b": 225.27368, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "text", "bbox": {"l": 222.96609, "t": 228.80853000000002, "r": 392.38983, "b": 236.27752999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.6924149990081787, "cells": [{"id": 39, "text": "{mly,ahn,nli,cau,taa}@zurich.ibm.com", "bbox": {"l": 222.96609, "t": 228.80853000000002, "r": 392.38983, "b": 236.27752999999996, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null}, {"label": "text", "id": 1, "page_no": 0, "cluster": {"id": 1, "label": "text", "bbox": {"l": 163.1111, "t": 270.30115, "r": 452.24878000000007, "b": 464.73447, "coord_origin": "TOPLEFT"}, "confidence": 0.9807654023170471, "cells": [{"id": 40, "text": "Abstract.", "bbox": {"l": 163.1111, "t": 270.30115, "r": 206.6358, "b": 278.22748, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Extracting tables from documents is a crucial task in any", "bbox": {"l": 211.6171, "t": 270.36395000000005, "r": 452.2447199999999, "b": 278.43364999999994, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "document conversion pipeline. Recently, transformer-based models have", "bbox": {"l": 163.1111, "t": 281.3229099999999, "r": 452.24246, "b": 289.39267, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "demonstrated that table-structure can be recognized with impressive ac-", "bbox": {"l": 163.1111, "t": 292.28189, "r": 452.24792, "b": 300.35165000000006, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "curacy using Image-to-Markup-Sequence (Im2Seq) approaches. Taking", "bbox": {"l": 163.1111, "t": 303.24088, "r": 452.2407799999999, "b": 311.31064, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "only the image of a table, such models predict a sequence of tokens (e.g.", "bbox": {"l": 163.1111, "t": 314.19888, "r": 452.24609, "b": 322.26865, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "in HTML, LaTeX) which represent the structure of the table. Since the", "bbox": {"l": 163.1111, "t": 325.15787, "r": 452.24615000000006, "b": 333.22763, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "token representation of the table structure has a significant impact on", "bbox": {"l": 163.1111, "t": 336.11685, "r": 452.24707, "b": 344.18661, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "the accuracy and run-time performance of any Im2Seq model, we inves-", "bbox": {"l": 163.1111, "t": 347.07584, "r": 452.2459999999999, "b": 355.1456, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "tigate in this paper how table-structure representation can be optimised.", "bbox": {"l": 163.1111, "t": 358.03482, "r": 452.2479900000001, "b": 366.10458, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "We propose a new, optimised table-structure language (OTSL) with a", "bbox": {"l": 163.1111, "t": 368.9938, "r": 452.24609, "b": 377.06357, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "minimized vocabulary and specific rules. The benefits of OTSL are that", "bbox": {"l": 163.1111, "t": 379.95279, "r": 452.2417, "b": 388.02255, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "it reduces the number of tokens to 5 (HTML needs 28+) and shortens", "bbox": {"l": 163.1111, "t": 390.91177, "r": 452.2443200000001, "b": 398.98154, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "the sequence length to half of HTML on average. Consequently, model", "bbox": {"l": 163.1111, "t": 401.87076, "r": 452.24878000000007, "b": 409.94052, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "accuracy improves significantly, inference time is halved compared to", "bbox": {"l": 163.1111, "t": 412.82974, "r": 452.24063000000007, "b": 420.8995100000001, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "HTML-based models, and the predicted table structures are always syn-", "bbox": {"l": 163.1111, "t": 423.78774999999996, "r": 452.24161, "b": 431.85751000000005, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "tactically correct. This in turn eliminates most post-processing needs.", "bbox": {"l": 163.1111, "t": 434.74673, "r": 452.24429, "b": 442.8165, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Popular table structure data-sets will be published in OTSL format to", "bbox": {"l": 163.1111, "t": 445.70572000000004, "r": 452.24603, "b": 453.77547999999996, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "the community.", "bbox": {"l": 163.1111, "t": 456.6647, "r": 225.56116, "b": 464.73447, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Abstract. Extracting tables from documents is a crucial task in any document conversion pipeline. Recently, transformer-based models have demonstrated that table-structure can be recognized with impressive accuracy using Image-to-Markup-Sequence (Im2Seq) approaches. Taking only the image of a table, such models predict a sequence of tokens (e.g. in HTML, LaTeX) which represent the structure of the table. Since the token representation of the table structure has a significant impact on the accuracy and run-time performance of any Im2Seq model, we investigate in this paper how table-structure representation can be optimised. We propose a new, optimised table-structure language (OTSL) with a minimized vocabulary and specific rules. The benefits of OTSL are that it reduces the number of tokens to 5 (HTML needs 28+) and shortens the sequence length to half of HTML on average. Consequently, model accuracy improves significantly, inference time is halved compared to HTML-based models, and the predicted table structures are always syntactically correct. This in turn eliminates most post-processing needs. Popular table structure data-sets will be published in OTSL format to the community."}, {"label": "text", "id": 4, "page_no": 0, "cluster": {"id": 4, "label": "text", "bbox": {"l": 163.1111, "t": 478.69394, "r": 452.24158, "b": 497.78549, "coord_origin": "TOPLEFT"}, "confidence": 0.9304055571556091, "cells": [{"id": 59, "text": "Keywords:", "bbox": {"l": 163.1111, "t": 478.69394, "r": 211.94211, "b": 486.62024, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Table Structure Recognition \u00b7 Data Representation \u00b7 Trans-", "bbox": {"l": 216.55208999999996, "t": 478.75671, "r": 452.24158, "b": 486.82648, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "formers \u00b7 Optimization.", "bbox": {"l": 163.11111, "t": 489.71573, "r": 257.64185, "b": 497.78549, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Keywords: Table Structure Recognition \u00b7 Data Representation \u00b7 Transformers \u00b7 Optimization."}, {"label": "section_header", "id": 3, "page_no": 0, "cluster": {"id": 3, "label": "section_header", "bbox": {"l": 134.76512, "t": 522.11969, "r": 228.93384, "b": 532.68808, "coord_origin": "TOPLEFT"}, "confidence": 0.9392016530036926, "cells": [{"id": 62, "text": "1", "bbox": {"l": 134.76512, "t": 522.11969, "r": 141.48872, "b": 532.68808, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "Introduction", "bbox": {"l": 154.93832, "t": 522.11969, "r": 228.93384, "b": 532.68808, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1 Introduction"}, {"label": "text", "id": 0, "page_no": 0, "cluster": {"id": 0, "label": "text", "bbox": {"l": 134.76512, "t": 548.2865400000001, "r": 480.5959500000001, "b": 628.81451, "coord_origin": "TOPLEFT"}, "confidence": 0.9835679531097412, "cells": [{"id": 64, "text": "Tables are ubiquitous in documents such as scientific papers, patents, reports,", "bbox": {"l": 134.76512, "t": 548.2865400000001, "r": 480.5939, "b": 557.0835099999999, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "manuals, specification sheets or marketing material. They often encode highly", "bbox": {"l": 134.76512, "t": 560.24254, "r": 480.59180000000003, "b": 569.0395100000001, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "valuable information and therefore need to be extracted with high accuracy.", "bbox": {"l": 134.76512, "t": 572.19754, "r": 480.59283000000005, "b": 580.99451, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "Unfortunately, tables appear in documents in various sizes, styling and struc-", "bbox": {"l": 134.76512, "t": 584.15254, "r": 480.5959500000001, "b": 592.9495099999999, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "ture, making it difficult to recover their correct structure with simple analyt-", "bbox": {"l": 134.76512, "t": 596.10754, "r": 480.58688, "b": 604.90451, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "ical methods. Therefore, accurate table extraction is achieved these days with", "bbox": {"l": 134.76512, "t": 608.06255, "r": 480.59088, "b": 616.85951, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "machine-learning based methods.", "bbox": {"l": 134.76512, "t": 620.01755, "r": 279.32745, "b": 628.81451, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Tables are ubiquitous in documents such as scientific papers, patents, reports, manuals, specification sheets or marketing material. They often encode highly valuable information and therefore need to be extracted with high accuracy. Unfortunately, tables appear in documents in various sizes, styling and structure, making it difficult to recover their correct structure with simple analytical methods. Therefore, accurate table extraction is achieved these days with machine-learning based methods."}, {"label": "text", "id": 2, "page_no": 0, "cluster": {"id": 2, "label": "text", "bbox": {"l": 134.76512, "t": 632.14755, "r": 480.59583, "b": 664.85453, "coord_origin": "TOPLEFT"}, "confidence": 0.9696458578109741, "cells": [{"id": 71, "text": "In modern document understanding systems [1,15], table extraction is typi-", "bbox": {"l": 149.70811, "t": 632.14755, "r": 480.58899, "b": 640.94452, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "cally a two-step process. Firstly, every table on a page is located with a bounding", "bbox": {"l": 134.76512, "t": 644.1025500000001, "r": 480.59583, "b": 652.8995199999999, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "box, and secondly, their logical row and column structure is recognized. As of", "bbox": {"l": 134.76512, "t": 656.05756, "r": 480.59496999999993, "b": 664.85453, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In modern document understanding systems [1,15], table extraction is typically a two-step process. Firstly, every table on a page is located with a bounding box, and secondly, their logical row and column structure is recognized. As of"}, {"label": "page_header", "id": 6, "page_no": 0, "cluster": {"id": 6, "label": "page_header", "bbox": {"l": 18.340218, "t": 209.47997999999995, "r": 36.339787, "b": 555.00003, "coord_origin": "TOPLEFT"}, "confidence": 0.8899643421173096, "cells": [{"id": 74, "text": "arXiv:2305.03393v1 [cs.CV] 5 May 2023", "bbox": {"l": 18.340218, "t": 209.47997999999995, "r": 36.339787, "b": 555.00003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "arXiv:2305.03393v1 [cs.CV] 5 May 2023"}], "body": [{"label": "section_header", "id": 5, "page_no": 0, "cluster": {"id": 5, "label": "section_header", "bbox": {"l": 134.765, "t": 115.89910999999995, "r": 480.59735, "b": 146.51409999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.8918349742889404, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure", "bbox": {"l": 134.765, "t": 115.89910999999995, "r": 480.59735, "b": 128.58112000000006, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Recognition", "bbox": {"l": 266.67499, "t": 133.83209, "r": 348.68506, "b": 146.51409999999998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Optimized Table Tokenization for Table Structure Recognition"}, {"label": "key_value_region", "id": 16, "page_no": 0, "cluster": {"id": 16, "label": "key_value_region", "bbox": {"l": 139.34305, "t": 169.69159000000002, "r": 476.01270000000005, "b": 236.27752999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.48445820808410645, "cells": [{"id": 2, "text": "Maksym Lysak", "bbox": {"l": 151.22598, "t": 171.67371000000003, "r": 217.04390999999998, "b": 180.47069999999997, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "[0000", "bbox": {"l": 217.04599, "t": 170.08209, "r": 235.18764, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "\u2212", "bbox": {"l": 235.18598999999998, "t": 169.69159000000002, "r": 241.4129, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "0002", "bbox": {"l": 241.41299000000004, "t": 170.08209, "r": 257.29932, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "\u2212", "bbox": {"l": 257.298, "t": 169.69159000000002, "r": 263.5249, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "3723", "bbox": {"l": 263.52499, "t": 170.08209, "r": 279.41132, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "\u2212", "bbox": {"l": 279.41, "t": 169.69159000000002, "r": 285.6369, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "$^{6960]}$, Ahmed Nassar[0000", "bbox": {"l": 285.63602, "t": 171.67371000000003, "r": 392.27664, "b": 180.47069999999997, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "\u2212", "bbox": {"l": 392.27502, "t": 169.69159000000002, "r": 398.50192, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "0002", "bbox": {"l": 398.50201, "t": 170.08209, "r": 414.38834, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "\u2212", "bbox": {"l": 414.38702, "t": 169.69159000000002, "r": 420.61392, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "9468", "bbox": {"l": 420.61304, "t": 170.08209, "r": 436.49936, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "\u2212", "bbox": {"l": 436.49805000000003, "t": 169.69159000000002, "r": 442.72495000000004, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "$^{0822]}$,", "bbox": {"l": 442.72504, "t": 171.67371000000003, "r": 464.12963999999994, "b": 180.47069999999997, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Nikolaos Livathinos", "bbox": {"l": 139.34305, "t": 183.62872000000004, "r": 224.80720999999997, "b": 192.42571999999996, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "[0000", "bbox": {"l": 224.80704000000003, "t": 182.03814999999997, "r": 242.94868, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "\u2212", "bbox": {"l": 242.94704000000002, "t": 181.64764000000002, "r": 249.17394999999996, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "0001", "bbox": {"l": 249.17404000000002, "t": 182.03814999999997, "r": 265.06036, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "\u2212", "bbox": {"l": 265.05905, "t": 181.64764000000002, "r": 271.28595, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "8513", "bbox": {"l": 271.28506, "t": 182.03814999999997, "r": 287.17139, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "\u2212", "bbox": {"l": 287.17007, "t": 181.64764000000002, "r": 293.39697, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "$^{3491]}$, Christoph Auer[0000", "bbox": {"l": 293.39706, "t": 183.62872000000004, "r": 404.1597, "b": 192.42571999999996, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "\u2212", "bbox": {"l": 404.15808, "t": 181.64764000000002, "r": 410.38498, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "0001", "bbox": {"l": 410.38507, "t": 182.03814999999997, "r": 426.27139, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "\u2212", "bbox": {"l": 426.27008, "t": 181.64764000000002, "r": 432.49697999999995, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "5761", "bbox": {"l": 432.49609, "t": 182.03814999999997, "r": 448.3824200000001, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "\u2212", "bbox": {"l": 448.3811, "t": 181.64764000000002, "r": 454.608, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "$^{0422]}$,", "bbox": {"l": 454.60808999999995, "t": 183.62872000000004, "r": 476.01270000000005, "b": 192.42571999999996, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "and Peter Staar", "bbox": {"l": 229.52109000000002, "t": 195.58374000000003, "r": 298.6087, "b": 204.38073999999995, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "[0000", "bbox": {"l": 298.60608, "t": 193.99316, "r": 316.74771, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "\u2212", "bbox": {"l": 316.74609, "t": 193.60266000000001, "r": 322.97299, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "0002", "bbox": {"l": 322.97308, "t": 193.99316, "r": 338.85941, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "\u2212", "bbox": {"l": 338.85809, "t": 193.60266000000001, "r": 345.08499, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "8088", "bbox": {"l": 345.08508, "t": 193.99316, "r": 360.97141, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "\u2212", "bbox": {"l": 360.97009, "t": 193.60266000000001, "r": 367.19699, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "0823]", "bbox": {"l": 367.19611, "t": 193.99316, "r": 385.33774, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "IBM Research", "bbox": {"l": 279.1051, "t": 217.20398, "r": 336.25153, "b": 225.27368, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "{mly,ahn,nli,cau,taa}@zurich.ibm.com", "bbox": {"l": 222.96609, "t": 228.80853000000002, "r": 392.38983, "b": 236.27752999999996, "coord_origin": "TOPLEFT"}}], "children": [{"id": 7, "label": "text", "bbox": {"l": 139.34305, "t": 169.69159000000002, "r": 476.01270000000005, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.7918068766593933, "cells": [{"id": 2, "text": "Maksym Lysak", "bbox": {"l": 151.22598, "t": 171.67371000000003, "r": 217.04390999999998, "b": 180.47069999999997, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "[0000", "bbox": {"l": 217.04599, "t": 170.08209, "r": 235.18764, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "\u2212", "bbox": {"l": 235.18598999999998, "t": 169.69159000000002, "r": 241.4129, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "0002", "bbox": {"l": 241.41299000000004, "t": 170.08209, "r": 257.29932, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "\u2212", "bbox": {"l": 257.298, "t": 169.69159000000002, "r": 263.5249, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "3723", "bbox": {"l": 263.52499, "t": 170.08209, "r": 279.41132, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "\u2212", "bbox": {"l": 279.41, "t": 169.69159000000002, "r": 285.6369, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "$^{6960]}$, Ahmed Nassar[0000", "bbox": {"l": 285.63602, "t": 171.67371000000003, "r": 392.27664, "b": 180.47069999999997, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "\u2212", "bbox": {"l": 392.27502, "t": 169.69159000000002, "r": 398.50192, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "0002", "bbox": {"l": 398.50201, "t": 170.08209, "r": 414.38834, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "\u2212", "bbox": {"l": 414.38702, "t": 169.69159000000002, "r": 420.61392, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "9468", "bbox": {"l": 420.61304, "t": 170.08209, "r": 436.49936, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "\u2212", "bbox": {"l": 436.49805000000003, "t": 169.69159000000002, "r": 442.72495000000004, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "$^{0822]}$,", "bbox": {"l": 442.72504, "t": 171.67371000000003, "r": 464.12963999999994, "b": 180.47069999999997, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Nikolaos Livathinos", "bbox": {"l": 139.34305, "t": 183.62872000000004, "r": 224.80720999999997, "b": 192.42571999999996, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "[0000", "bbox": {"l": 224.80704000000003, "t": 182.03814999999997, "r": 242.94868, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "\u2212", "bbox": {"l": 242.94704000000002, "t": 181.64764000000002, "r": 249.17394999999996, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "0001", "bbox": {"l": 249.17404000000002, "t": 182.03814999999997, "r": 265.06036, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "\u2212", "bbox": {"l": 265.05905, "t": 181.64764000000002, "r": 271.28595, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "8513", "bbox": {"l": 271.28506, "t": 182.03814999999997, "r": 287.17139, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "\u2212", "bbox": {"l": 287.17007, "t": 181.64764000000002, "r": 293.39697, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "$^{3491]}$, Christoph Auer[0000", "bbox": {"l": 293.39706, "t": 183.62872000000004, "r": 404.1597, "b": 192.42571999999996, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "\u2212", "bbox": {"l": 404.15808, "t": 181.64764000000002, "r": 410.38498, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "0001", "bbox": {"l": 410.38507, "t": 182.03814999999997, "r": 426.27139, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "\u2212", "bbox": {"l": 426.27008, "t": 181.64764000000002, "r": 432.49697999999995, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "5761", "bbox": {"l": 432.49609, "t": 182.03814999999997, "r": 448.3824200000001, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "\u2212", "bbox": {"l": 448.3811, "t": 181.64764000000002, "r": 454.608, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "$^{0422]}$,", "bbox": {"l": 454.60808999999995, "t": 183.62872000000004, "r": 476.01270000000005, "b": 192.42571999999996, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "[0000", "bbox": {"l": 298.60608, "t": 193.99316, "r": 316.74771, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "\u2212", "bbox": {"l": 316.74609, "t": 193.60266000000001, "r": 322.97299, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "0002", "bbox": {"l": 322.97308, "t": 193.99316, "r": 338.85941, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "\u2212", "bbox": {"l": 338.85809, "t": 193.60266000000001, "r": 345.08499, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "8088", "bbox": {"l": 345.08508, "t": 193.99316, "r": 360.97141, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "\u2212", "bbox": {"l": 360.97009, "t": 193.60266000000001, "r": 367.19699, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "0823]", "bbox": {"l": 367.19611, "t": 193.99316, "r": 385.33774, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 229.52109000000002, "t": 195.58374000000003, "r": 298.6087, "b": 204.38073999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.5015263557434082, "cells": [{"id": 30, "text": "and Peter Staar", "bbox": {"l": 229.52109000000002, "t": 195.58374000000003, "r": 298.6087, "b": 204.38073999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 279.1051, "t": 217.20398, "r": 336.25153, "b": 225.27368, "coord_origin": "TOPLEFT"}, "confidence": 0.6310867667198181, "cells": [{"id": 38, "text": "IBM Research", "bbox": {"l": 279.1051, "t": 217.20398, "r": 336.25153, "b": 225.27368, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "text", "bbox": {"l": 222.96609, "t": 228.80853000000002, "r": 392.38983, "b": 236.27752999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.6924149990081787, "cells": [{"id": 39, "text": "{mly,ahn,nli,cau,taa}@zurich.ibm.com", "bbox": {"l": 222.96609, "t": 228.80853000000002, "r": 392.38983, "b": 236.27752999999996, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null}, {"label": "text", "id": 1, "page_no": 0, "cluster": {"id": 1, "label": "text", "bbox": {"l": 163.1111, "t": 270.30115, "r": 452.24878000000007, "b": 464.73447, "coord_origin": "TOPLEFT"}, "confidence": 0.9807654023170471, "cells": [{"id": 40, "text": "Abstract.", "bbox": {"l": 163.1111, "t": 270.30115, "r": 206.6358, "b": 278.22748, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Extracting tables from documents is a crucial task in any", "bbox": {"l": 211.6171, "t": 270.36395000000005, "r": 452.2447199999999, "b": 278.43364999999994, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "document conversion pipeline. Recently, transformer-based models have", "bbox": {"l": 163.1111, "t": 281.3229099999999, "r": 452.24246, "b": 289.39267, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "demonstrated that table-structure can be recognized with impressive ac-", "bbox": {"l": 163.1111, "t": 292.28189, "r": 452.24792, "b": 300.35165000000006, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "curacy using Image-to-Markup-Sequence (Im2Seq) approaches. Taking", "bbox": {"l": 163.1111, "t": 303.24088, "r": 452.2407799999999, "b": 311.31064, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "only the image of a table, such models predict a sequence of tokens (e.g.", "bbox": {"l": 163.1111, "t": 314.19888, "r": 452.24609, "b": 322.26865, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "in HTML, LaTeX) which represent the structure of the table. Since the", "bbox": {"l": 163.1111, "t": 325.15787, "r": 452.24615000000006, "b": 333.22763, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "token representation of the table structure has a significant impact on", "bbox": {"l": 163.1111, "t": 336.11685, "r": 452.24707, "b": 344.18661, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "the accuracy and run-time performance of any Im2Seq model, we inves-", "bbox": {"l": 163.1111, "t": 347.07584, "r": 452.2459999999999, "b": 355.1456, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "tigate in this paper how table-structure representation can be optimised.", "bbox": {"l": 163.1111, "t": 358.03482, "r": 452.2479900000001, "b": 366.10458, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "We propose a new, optimised table-structure language (OTSL) with a", "bbox": {"l": 163.1111, "t": 368.9938, "r": 452.24609, "b": 377.06357, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "minimized vocabulary and specific rules. The benefits of OTSL are that", "bbox": {"l": 163.1111, "t": 379.95279, "r": 452.2417, "b": 388.02255, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "it reduces the number of tokens to 5 (HTML needs 28+) and shortens", "bbox": {"l": 163.1111, "t": 390.91177, "r": 452.2443200000001, "b": 398.98154, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "the sequence length to half of HTML on average. Consequently, model", "bbox": {"l": 163.1111, "t": 401.87076, "r": 452.24878000000007, "b": 409.94052, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "accuracy improves significantly, inference time is halved compared to", "bbox": {"l": 163.1111, "t": 412.82974, "r": 452.24063000000007, "b": 420.8995100000001, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "HTML-based models, and the predicted table structures are always syn-", "bbox": {"l": 163.1111, "t": 423.78774999999996, "r": 452.24161, "b": 431.85751000000005, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "tactically correct. This in turn eliminates most post-processing needs.", "bbox": {"l": 163.1111, "t": 434.74673, "r": 452.24429, "b": 442.8165, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Popular table structure data-sets will be published in OTSL format to", "bbox": {"l": 163.1111, "t": 445.70572000000004, "r": 452.24603, "b": 453.77547999999996, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "the community.", "bbox": {"l": 163.1111, "t": 456.6647, "r": 225.56116, "b": 464.73447, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Abstract. Extracting tables from documents is a crucial task in any document conversion pipeline. Recently, transformer-based models have demonstrated that table-structure can be recognized with impressive accuracy using Image-to-Markup-Sequence (Im2Seq) approaches. Taking only the image of a table, such models predict a sequence of tokens (e.g. in HTML, LaTeX) which represent the structure of the table. Since the token representation of the table structure has a significant impact on the accuracy and run-time performance of any Im2Seq model, we investigate in this paper how table-structure representation can be optimised. We propose a new, optimised table-structure language (OTSL) with a minimized vocabulary and specific rules. The benefits of OTSL are that it reduces the number of tokens to 5 (HTML needs 28+) and shortens the sequence length to half of HTML on average. Consequently, model accuracy improves significantly, inference time is halved compared to HTML-based models, and the predicted table structures are always syntactically correct. This in turn eliminates most post-processing needs. Popular table structure data-sets will be published in OTSL format to the community."}, {"label": "text", "id": 4, "page_no": 0, "cluster": {"id": 4, "label": "text", "bbox": {"l": 163.1111, "t": 478.69394, "r": 452.24158, "b": 497.78549, "coord_origin": "TOPLEFT"}, "confidence": 0.9304055571556091, "cells": [{"id": 59, "text": "Keywords:", "bbox": {"l": 163.1111, "t": 478.69394, "r": 211.94211, "b": 486.62024, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Table Structure Recognition \u00b7 Data Representation \u00b7 Trans-", "bbox": {"l": 216.55208999999996, "t": 478.75671, "r": 452.24158, "b": 486.82648, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "formers \u00b7 Optimization.", "bbox": {"l": 163.11111, "t": 489.71573, "r": 257.64185, "b": 497.78549, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Keywords: Table Structure Recognition \u00b7 Data Representation \u00b7 Transformers \u00b7 Optimization."}, {"label": "section_header", "id": 3, "page_no": 0, "cluster": {"id": 3, "label": "section_header", "bbox": {"l": 134.76512, "t": 522.11969, "r": 228.93384, "b": 532.68808, "coord_origin": "TOPLEFT"}, "confidence": 0.9392016530036926, "cells": [{"id": 62, "text": "1", "bbox": {"l": 134.76512, "t": 522.11969, "r": 141.48872, "b": 532.68808, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "Introduction", "bbox": {"l": 154.93832, "t": 522.11969, "r": 228.93384, "b": 532.68808, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1 Introduction"}, {"label": "text", "id": 0, "page_no": 0, "cluster": {"id": 0, "label": "text", "bbox": {"l": 134.76512, "t": 548.2865400000001, "r": 480.5959500000001, "b": 628.81451, "coord_origin": "TOPLEFT"}, "confidence": 0.9835679531097412, "cells": [{"id": 64, "text": "Tables are ubiquitous in documents such as scientific papers, patents, reports,", "bbox": {"l": 134.76512, "t": 548.2865400000001, "r": 480.5939, "b": 557.0835099999999, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "manuals, specification sheets or marketing material. They often encode highly", "bbox": {"l": 134.76512, "t": 560.24254, "r": 480.59180000000003, "b": 569.0395100000001, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "valuable information and therefore need to be extracted with high accuracy.", "bbox": {"l": 134.76512, "t": 572.19754, "r": 480.59283000000005, "b": 580.99451, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "Unfortunately, tables appear in documents in various sizes, styling and struc-", "bbox": {"l": 134.76512, "t": 584.15254, "r": 480.5959500000001, "b": 592.9495099999999, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "ture, making it difficult to recover their correct structure with simple analyt-", "bbox": {"l": 134.76512, "t": 596.10754, "r": 480.58688, "b": 604.90451, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "ical methods. Therefore, accurate table extraction is achieved these days with", "bbox": {"l": 134.76512, "t": 608.06255, "r": 480.59088, "b": 616.85951, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "machine-learning based methods.", "bbox": {"l": 134.76512, "t": 620.01755, "r": 279.32745, "b": 628.81451, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Tables are ubiquitous in documents such as scientific papers, patents, reports, manuals, specification sheets or marketing material. They often encode highly valuable information and therefore need to be extracted with high accuracy. Unfortunately, tables appear in documents in various sizes, styling and structure, making it difficult to recover their correct structure with simple analytical methods. Therefore, accurate table extraction is achieved these days with machine-learning based methods."}, {"label": "text", "id": 2, "page_no": 0, "cluster": {"id": 2, "label": "text", "bbox": {"l": 134.76512, "t": 632.14755, "r": 480.59583, "b": 664.85453, "coord_origin": "TOPLEFT"}, "confidence": 0.9696458578109741, "cells": [{"id": 71, "text": "In modern document understanding systems [1,15], table extraction is typi-", "bbox": {"l": 149.70811, "t": 632.14755, "r": 480.58899, "b": 640.94452, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "cally a two-step process. Firstly, every table on a page is located with a bounding", "bbox": {"l": 134.76512, "t": 644.1025500000001, "r": 480.59583, "b": 652.8995199999999, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "box, and secondly, their logical row and column structure is recognized. As of", "bbox": {"l": 134.76512, "t": 656.05756, "r": 480.59496999999993, "b": 664.85453, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In modern document understanding systems [1,15], table extraction is typically a two-step process. Firstly, every table on a page is located with a bounding box, and secondly, their logical row and column structure is recognized. As of"}], "headers": [{"label": "page_header", "id": 6, "page_no": 0, "cluster": {"id": 6, "label": "page_header", "bbox": {"l": 18.340218, "t": 209.47997999999995, "r": 36.339787, "b": 555.00003, "coord_origin": "TOPLEFT"}, "confidence": 0.8899643421173096, "cells": [{"id": 74, "text": "arXiv:2305.03393v1 [cs.CV] 5 May 2023", "bbox": {"l": 18.340218, "t": 209.47997999999995, "r": 36.339787, "b": 555.00003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "arXiv:2305.03393v1 [cs.CV] 5 May 2023"}]}}, {"page_no": 1, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "2", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "M.", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 178.07675, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37415, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Fig. 1.", "bbox": {"l": 134.765, "t": 126.33416999999997, "r": 162.64424, "b": 134.26049999999998, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Comparison between HTML and OTSL table structure representation: (A)", "bbox": {"l": 167.062, "t": 126.39697000000001, "r": 480.59106, "b": 134.46667000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "table-example with complex row and column headers, including a 2D empty span,", "bbox": {"l": 134.765, "t": 137.35595999999998, "r": 480.59018, "b": 145.42566, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "(B)", "bbox": {"l": 134.765, "t": 148.31493999999998, "r": 147.95433, "b": 156.38464, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "minimal graphical representation of table structure using rectangular layout, (C)", "bbox": {"l": 152.39224, "t": 148.31493999999998, "r": 480.59096999999997, "b": 156.38464, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "HTML representation, (D) OTSL representation. This example demonstrates many of", "bbox": {"l": 134.765, "t": 159.27392999999995, "r": 480.59189, "b": 167.34362999999996, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "the key-features of OTSL, namely its reduced vocabulary size (12 versus 5 in this case),", "bbox": {"l": 134.765, "t": 170.23290999999995, "r": 480.58914000000004, "b": 178.30260999999996, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "its reduced sequence length (55 versus 30) and a enhanced internal structure (variable", "bbox": {"l": 134.765, "t": 181.19188999999994, "r": 480.59020999999996, "b": 189.26160000000004, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "token sequence length per row in HTML versus a fixed length of rows in OTSL).", "bbox": {"l": 134.765, "t": 192.15088000000003, "r": 460.87109, "b": 200.22058000000004, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "C", "bbox": {"l": 396.41107, "t": 280.98352, "r": 402.97336, "b": 289.50903, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "C", "bbox": {"l": 418.58682, "t": 280.89792, "r": 425.14911, "b": 289.42343, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "C", "bbox": {"l": 395.74835, "t": 303.23727, "r": 402.31064, "b": 311.76279, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "C", "bbox": {"l": 407.54214, "t": 303.36981, "r": 414.10443, "b": 311.89532, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "C", "bbox": {"l": 407.56335, "t": 314.40619, "r": 414.12564, "b": 322.9317, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "C", "bbox": {"l": 418.51108, "t": 292.08502000000004, "r": 425.07336, "b": 300.61053000000004, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "C", "bbox": {"l": 429.59744, "t": 292.09106, "r": 436.1597300000001, "b": 300.61658, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "C", "bbox": {"l": 440.68759000000006, "t": 292.01230000000004, "r": 447.24987999999996, "b": 300.53781000000004, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "C", "bbox": {"l": 418.6232, "t": 303.29483, "r": 425.18549, "b": 311.82034, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "C", "bbox": {"l": 429.7095299999999, "t": 303.30011, "r": 436.27182, "b": 311.82562, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "C", "bbox": {"l": 440.7996800000001, "t": 303.22211, "r": 447.36197, "b": 311.74762, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "C", "bbox": {"l": 418.62546, "t": 314.56903, "r": 425.18774, "b": 323.09454, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "C", "bbox": {"l": 429.71181999999993, "t": 314.57434, "r": 436.27411, "b": 323.09985, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "C", "bbox": {"l": 440.80194, "t": 314.49631, "r": 447.36423, "b": 323.02182, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "C", "bbox": {"l": 407.39746, "t": 325.29031, "r": 413.95975, "b": 333.81583, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "C", "bbox": {"l": 418.45959, "t": 325.45316, "r": 425.02188, "b": 333.97867, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "C", "bbox": {"l": 429.54593, "t": 325.4592, "r": 436.10822, "b": 333.98471, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "C", "bbox": {"l": 440.63608, "t": 325.38043, "r": 447.19836, "b": 333.90594, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "NL", "bbox": {"l": 451.89511000000005, "t": 280.15717, "r": 463.51273000000003, "b": 288.68268, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "NL", "bbox": {"l": 452.1557, "t": 291.59875000000005, "r": 463.77332, "b": 300.12427, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "NL", "bbox": {"l": 452.17688000000004, "t": 302.84265, "r": 463.79449000000005, "b": 311.36816, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "NL", "bbox": {"l": 452.09887999999995, "t": 314.12441999999993, "r": 463.71648999999996, "b": 322.6499299999999, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "NL", "bbox": {"l": 452.29733, "t": 325.46906, "r": 463.91495, "b": 333.99457, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "U", "bbox": {"l": 396.09677, "t": 314.49478, "r": 402.65906, "b": 323.02029000000005, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "U", "bbox": {"l": 395.99829, "t": 325.38876000000005, "r": 402.56058, "b": 333.91428, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "U", "bbox": {"l": 396.27475, "t": 292.27057, "r": 402.83704, "b": 300.79608, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "L", "bbox": {"l": 408.54724, "t": 280.96912, "r": 413.60074, "b": 289.49463, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "L", "bbox": {"l": 430.58966, "t": 280.49725, "r": 435.6431600000001, "b": 289.02277, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "L", "bbox": {"l": 441.08069, "t": 280.38062, "r": 446.13419, "b": 288.90613, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "X", "bbox": {"l": 407.97388, "t": 292.13425, "r": 414.03625, "b": 300.65976, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "NL", "bbox": {"l": 441.25640999999996, "t": 411.1807600000001, "r": 452.87402, "b": 419.7062700000001, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "vocabulary:", "bbox": {"l": 393.75256, "t": 399.7947700000001, "r": 432.48929, "b": 406.89935, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "5", "bbox": {"l": 434.5896000000001, "t": 399.7947700000001, "r": 438.80083999999994, "b": 406.89935, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "tokens", "bbox": {"l": 440.90573, "t": 399.7947700000001, "r": 463.22235, "b": 406.89935, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "D OTSL", "bbox": {"l": 384.11816, "t": 258.54718, "r": 413.99307, "b": 265.65179, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "sequence length:", "bbox": {"l": 393.75256, "t": 266.67505000000006, "r": 451.45129000000003, "b": 273.77966000000004, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "30", "bbox": {"l": 453.55083999999994, "t": 266.67505000000006, "r": 461.97485, "b": 273.77966000000004, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "vocabulary for this table:", "bbox": {"l": 151.79318, "t": 399.76016, "r": 233.89371000000003, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "12", "bbox": {"l": 235.99332, "t": 399.76016, "r": 244.41734000000002, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "tokens", "bbox": {"l": 246.52222, "t": 399.76016, "r": 268.83884, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "A", "bbox": {"l": 154.3298, "t": 213.57457999999997, "r": 159.79837, "b": 220.67920000000004, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "B", "bbox": {"l": 321.07053, "t": 213.57457999999997, "r": 326.53909, "b": 220.67920000000004, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "<table>", "bbox": {"l": 153.0947, "t": 280.30411, "r": 175.83888, "b": 286.69824, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "<tr>", "bbox": {"l": 160.67039, "t": 287.12088, "r": 172.79608, "b": 293.51501, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "<td", "bbox": {"l": 168.24603, "t": 293.93765, "r": 177.91019, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "colspan=\u201c2\u201d", "bbox": {"l": 179.80525, "t": 293.93765, "r": 215.61517, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "rowspan=\u201c2\u201d", "bbox": {"l": 217.50886999999997, "t": 293.93765, "r": 255.58945, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": ">", "bbox": {"l": 257.48315, "t": 293.93765, "r": 261.46414, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "</td>", "bbox": {"l": 263.35785, "t": 293.93765, "r": 278.89804, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "<td", "bbox": {"l": 280.79175, "t": 293.93765, "r": 290.4559, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "colspan=\u201c3\u201d", "bbox": {"l": 292.35095, "t": 293.93765, "r": 328.16083, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": ">", "bbox": {"l": 330.05457, "t": 293.93765, "r": 334.03555, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "</td>", "bbox": {"l": 335.92926, "t": 293.93765, "r": 351.46945, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "</tr>", "bbox": {"l": 160.67039, "t": 300.75442999999996, "r": 174.68979, "b": 307.14856, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "<tr>", "bbox": {"l": 160.67039, "t": 307.57122999999996, "r": 172.79608, "b": 313.96536, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "<td>", "bbox": {"l": 168.24603, "t": 314.388, "r": 181.89255, "b": 320.78214, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "</td>", "bbox": {"l": 183.78624, "t": 314.388, "r": 199.32646, "b": 320.78214, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "<td>", "bbox": {"l": 201.22015, "t": 314.388, "r": 214.86666999999997, "b": 320.78214, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "</td>", "bbox": {"l": 216.76038, "t": 314.388, "r": 232.30058, "b": 320.78214, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "<td>", "bbox": {"l": 234.19427000000002, "t": 314.388, "r": 247.84079000000003, "b": 320.78214, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "</td>", "bbox": {"l": 249.73447999999996, "t": 314.388, "r": 265.27469, "b": 320.78214, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "</tr>", "bbox": {"l": 160.67039, "t": 321.20477, "r": 174.68979, "b": 327.59890999999993, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "<tr>", "bbox": {"l": 160.67039, "t": 328.02158, "r": 172.79608, "b": 334.41571000000005, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "<td rowspan=\u201c3\u201d > </td> <td> </td> <td> </td> <td> </td> <td> </td>", "bbox": {"l": 168.24603, "t": 334.83835, "r": 373.09091, "b": 341.23248, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "</tr>", "bbox": {"l": 160.67039, "t": 341.65512, "r": 174.68979, "b": 348.04926, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "<tr>", "bbox": {"l": 160.67039, "t": 348.47159, "r": 172.79608, "b": 354.86572, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "<td>", "bbox": {"l": 168.24603, "t": 355.28836000000007, "r": 181.89255, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "</td>", "bbox": {"l": 183.78624, "t": 355.28836000000007, "r": 199.32646, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "<td>", "bbox": {"l": 201.22015, "t": 355.28836000000007, "r": 214.86666999999997, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "</td>", "bbox": {"l": 216.76038, "t": 355.28836000000007, "r": 232.30058, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "<td>", "bbox": {"l": 234.19427000000002, "t": 355.28836000000007, "r": 247.84079000000003, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "</td>", "bbox": {"l": 249.73447999999996, "t": 355.28836000000007, "r": 265.27469, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "<td>", "bbox": {"l": 267.1684, "t": 355.28836000000007, "r": 280.81488, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "</td>", "bbox": {"l": 282.70862, "t": 355.28836000000007, "r": 298.24881, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "</tr>", "bbox": {"l": 160.67039, "t": 362.10516000000007, "r": 174.68979, "b": 368.49929999999995, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "<tr>", "bbox": {"l": 160.67039, "t": 368.92194, "r": 172.79608, "b": 375.31607, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "<td>", "bbox": {"l": 168.24603, "t": 375.73871, "r": 181.89255, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "</td>", "bbox": {"l": 183.78624, "t": 375.73871, "r": 199.32646, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "<td>", "bbox": {"l": 201.22015, "t": 375.73871, "r": 214.86666999999997, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "</td>", "bbox": {"l": 216.76038, "t": 375.73871, "r": 232.30058, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "<td>", "bbox": {"l": 234.19427000000002, "t": 375.73871, "r": 247.84079000000003, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "</td>", "bbox": {"l": 249.73447999999996, "t": 375.73871, "r": 265.27469, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "<td>", "bbox": {"l": 267.1684, "t": 375.73871, "r": 280.81488, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "</td>", "bbox": {"l": 282.70862, "t": 375.73871, "r": 298.24881, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "</tr>", "bbox": {"l": 160.67039, "t": 382.55551, "r": 174.68979, "b": 388.94965, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "</table>", "bbox": {"l": 153.0947, "t": 389.37228, "r": 177.73259, "b": 395.76642, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "C", "bbox": {"l": 395.06137, "t": 411.33353, "r": 401.62366, "b": 419.85904, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "L", "bbox": {"l": 407.42249, "t": 411.33353, "r": 412.47598, "b": 419.85904, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "U", "bbox": {"l": 418.69287, "t": 411.33353, "r": 425.25516, "b": 419.85904, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "X", "bbox": {"l": 430.5086099999999, "t": 411.33353, "r": 436.5709800000001, "b": 419.85904, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "<table>", "bbox": {"l": 152.36208, "t": 409.77362, "r": 175.10626, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "<tr>", "bbox": {"l": 178.89366, "t": 409.77362, "r": 191.01935, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "</tr>", "bbox": {"l": 194.80676, "t": 409.77362, "r": 208.82614, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "<td>", "bbox": {"l": 212.61354, "t": 409.77362, "r": 226.26003999999998, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "</td>", "bbox": {"l": 230.04745000000003, "t": 409.77362, "r": 245.58765000000002, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "<td", "bbox": {"l": 249.37506000000002, "t": 409.77362, "r": 259.03918, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "colspan=\"2\"", "bbox": {"l": 262.82797, "t": 409.77362, "r": 298.93646, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "colspan=\"3\"", "bbox": {"l": 302.72385, "t": 409.77362, "r": 338.83234, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "rowspan=\"2\"", "bbox": {"l": 152.36208, "t": 418.10522, "r": 190.74123, "b": 424.49936, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "rowspan=\"3\"", "bbox": {"l": 194.52863, "t": 418.10522, "r": 232.90777999999997, "b": 424.49936, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": ">", "bbox": {"l": 236.69518999999997, "t": 418.10522, "r": 240.67617999999996, "b": 424.49936, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "</table>", "bbox": {"l": 244.46358, "t": 418.10522, "r": 269.10144, "b": 424.49936, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "C", "bbox": {"l": 154.50595, "t": 258.60095, "r": 159.62473, "b": 265.70556999999997, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "HTML", "bbox": {"l": 164.74348, "t": 258.60095, "r": 185.21857, "b": 265.70556999999997, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "sequence length:", "bbox": {"l": 164.3548, "t": 266.49707, "r": 222.05352999999997, "b": 273.60168, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "55", "bbox": {"l": 224.15326, "t": 266.49707, "r": 232.57729, "b": 273.60168, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "today,", "bbox": {"l": 134.765, "t": 452.31378, "r": 161.32928, "b": 461.11075, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "table detection", "bbox": {"l": 164.269, "t": 452.31378, "r": 226.28617999999997, "b": 461.11075, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "in documents is a well understood problem, and the latest", "bbox": {"l": 229.992, "t": 452.31378, "r": 480.59232000000003, "b": 461.11075, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "state-of-the-art (SOTA) object detection methods provide an accuracy compa-", "bbox": {"l": 134.76501, "t": 464.26877, "r": 480.59180000000003, "b": 473.06573, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "rable to human observers [7,8,10,14,23]. On the other hand, the problem of table", "bbox": {"l": 134.76501, "t": 476.22375, "r": 480.58673, "b": 485.02072, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "structure recognition (TSR) is a lot more challenging and remains a very active", "bbox": {"l": 134.76501, "t": 488.17975, "r": 480.58658, "b": 496.97672, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "area of research, in which many novel machine learning algorithms are being", "bbox": {"l": 134.76501, "t": 500.13474, "r": 480.58978, "b": 508.9317, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "explored [3,4,5,9,11,12,13,14,17,18,21,22].", "bbox": {"l": 134.76501, "t": 512.0897199999999, "r": 313.24597, "b": 520.88669, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "Recently emerging SOTA methods for table structure recognition employ", "bbox": {"l": 149.70901, "t": 524.55072, "r": 480.58884000000006, "b": 533.3476900000001, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "transformer-based models, in which an image of the table is provided to the net-", "bbox": {"l": 134.76501, "t": 536.50671, "r": 480.5917400000001, "b": 545.30368, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "work in order to predict the structure of the table as a sequence of tokens. These", "bbox": {"l": 134.76501, "t": 548.46172, "r": 480.58868, "b": 557.25868, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "image-to-sequence (Im2Seq) models are extremely powerful, since they allow for", "bbox": {"l": 134.76501, "t": 560.41672, "r": 480.58795, "b": 569.2136800000001, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "a purely data-driven solution. The tokens of the sequence typically belong to a", "bbox": {"l": 134.76501, "t": 572.37172, "r": 480.58978, "b": 581.16869, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "markup language such as HTML, Latex or Markdown, which allow to describe", "bbox": {"l": 134.76501, "t": 584.32672, "r": 480.59479, "b": 593.12369, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "table structure as rows, columns and spanning cells in various configurations.", "bbox": {"l": 134.76501, "t": 596.28271, "r": 480.58678999999995, "b": 605.0796799999999, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "In Figure 1, we illustrate how HTML is used to represent the table-structure", "bbox": {"l": 134.76501, "t": 608.23772, "r": 480.59476, "b": 617.03468, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "of a particular example table. Public table-structure data sets such as PubTab-", "bbox": {"l": 134.76501, "t": 620.19272, "r": 480.5938100000001, "b": 628.98969, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "Net [22], and FinTabNet [21], which were created in a semi-automated way from", "bbox": {"l": 134.76501, "t": 632.1477199999999, "r": 480.59482, "b": 640.94469, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "paired PDF and HTML sources (e.g. PubMed Central), popularized primarily", "bbox": {"l": 134.76501, "t": 644.10272, "r": 480.58771, "b": 652.89969, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "the use of HTML as ground-truth representation format for TSR.", "bbox": {"l": 134.76501, "t": 656.05772, "r": 421.45377, "b": 664.8547, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 5, "label": "page_header", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8580349683761597, "cells": [{"id": 0, "text": "2", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "page_header", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9076642990112305, "cells": [{"id": 1, "text": "M.", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 178.07675, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37415, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "caption", "bbox": {"l": 134.765, "t": 126.33416999999997, "r": 480.59189, "b": 200.22058000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.8939083218574524, "cells": [{"id": 3, "text": "Fig. 1.", "bbox": {"l": 134.765, "t": 126.33416999999997, "r": 162.64424, "b": 134.26049999999998, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Comparison between HTML and OTSL table structure representation: (A)", "bbox": {"l": 167.062, "t": 126.39697000000001, "r": 480.59106, "b": 134.46667000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "table-example with complex row and column headers, including a 2D empty span,", "bbox": {"l": 134.765, "t": 137.35595999999998, "r": 480.59018, "b": 145.42566, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "(B)", "bbox": {"l": 134.765, "t": 148.31493999999998, "r": 147.95433, "b": 156.38464, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "minimal graphical representation of table structure using rectangular layout, (C)", "bbox": {"l": 152.39224, "t": 148.31493999999998, "r": 480.59096999999997, "b": 156.38464, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "HTML representation, (D) OTSL representation. This example demonstrates many of", "bbox": {"l": 134.765, "t": 159.27392999999995, "r": 480.59189, "b": 167.34362999999996, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "the key-features of OTSL, namely its reduced vocabulary size (12 versus 5 in this case),", "bbox": {"l": 134.765, "t": 170.23290999999995, "r": 480.58914000000004, "b": 178.30260999999996, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "its reduced sequence length (55 versus 30) and a enhanced internal structure (variable", "bbox": {"l": 134.765, "t": 181.19188999999994, "r": 480.59020999999996, "b": 189.26160000000004, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "token sequence length per row in HTML versus a fixed length of rows in OTSL).", "bbox": {"l": 134.765, "t": 192.15088000000003, "r": 460.87109, "b": 200.22058000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "picture", "bbox": {"l": 148.45364379882812, "t": 208.37423706054688, "r": 464.3608093261719, "b": 425.8462219238281, "coord_origin": "TOPLEFT"}, "confidence": 0.9688959121704102, "cells": [{"id": 12, "text": "C", "bbox": {"l": 396.41107, "t": 280.98352, "r": 402.97336, "b": 289.50903, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "C", "bbox": {"l": 418.58682, "t": 280.89792, "r": 425.14911, "b": 289.42343, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "C", "bbox": {"l": 395.74835, "t": 303.23727, "r": 402.31064, "b": 311.76279, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "C", "bbox": {"l": 407.54214, "t": 303.36981, "r": 414.10443, "b": 311.89532, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "C", "bbox": {"l": 407.56335, "t": 314.40619, "r": 414.12564, "b": 322.9317, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "C", "bbox": {"l": 418.51108, "t": 292.08502000000004, "r": 425.07336, "b": 300.61053000000004, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "C", "bbox": {"l": 429.59744, "t": 292.09106, "r": 436.1597300000001, "b": 300.61658, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "C", "bbox": {"l": 440.68759000000006, "t": 292.01230000000004, "r": 447.24987999999996, "b": 300.53781000000004, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "C", "bbox": {"l": 418.6232, "t": 303.29483, "r": 425.18549, "b": 311.82034, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "C", "bbox": {"l": 429.7095299999999, "t": 303.30011, "r": 436.27182, "b": 311.82562, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "C", "bbox": {"l": 440.7996800000001, "t": 303.22211, "r": 447.36197, "b": 311.74762, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "C", "bbox": {"l": 418.62546, "t": 314.56903, "r": 425.18774, "b": 323.09454, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "C", "bbox": {"l": 429.71181999999993, "t": 314.57434, "r": 436.27411, "b": 323.09985, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "C", "bbox": {"l": 440.80194, "t": 314.49631, "r": 447.36423, "b": 323.02182, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "C", "bbox": {"l": 407.39746, "t": 325.29031, "r": 413.95975, "b": 333.81583, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "C", "bbox": {"l": 418.45959, "t": 325.45316, "r": 425.02188, "b": 333.97867, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "C", "bbox": {"l": 429.54593, "t": 325.4592, "r": 436.10822, "b": 333.98471, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "C", "bbox": {"l": 440.63608, "t": 325.38043, "r": 447.19836, "b": 333.90594, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "NL", "bbox": {"l": 451.89511000000005, "t": 280.15717, "r": 463.51273000000003, "b": 288.68268, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "NL", "bbox": {"l": 452.1557, "t": 291.59875000000005, "r": 463.77332, "b": 300.12427, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "NL", "bbox": {"l": 452.17688000000004, "t": 302.84265, "r": 463.79449000000005, "b": 311.36816, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "NL", "bbox": {"l": 452.09887999999995, "t": 314.12441999999993, "r": 463.71648999999996, "b": 322.6499299999999, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "NL", "bbox": {"l": 452.29733, "t": 325.46906, "r": 463.91495, "b": 333.99457, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "U", "bbox": {"l": 396.09677, "t": 314.49478, "r": 402.65906, "b": 323.02029000000005, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "U", "bbox": {"l": 395.99829, "t": 325.38876000000005, "r": 402.56058, "b": 333.91428, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "U", "bbox": {"l": 396.27475, "t": 292.27057, "r": 402.83704, "b": 300.79608, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "L", "bbox": {"l": 408.54724, "t": 280.96912, "r": 413.60074, "b": 289.49463, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "L", "bbox": {"l": 430.58966, "t": 280.49725, "r": 435.6431600000001, "b": 289.02277, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "L", "bbox": {"l": 441.08069, "t": 280.38062, "r": 446.13419, "b": 288.90613, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "X", "bbox": {"l": 407.97388, "t": 292.13425, "r": 414.03625, "b": 300.65976, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "NL", "bbox": {"l": 441.25640999999996, "t": 411.1807600000001, "r": 452.87402, "b": 419.7062700000001, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "vocabulary:", "bbox": {"l": 393.75256, "t": 399.7947700000001, "r": 432.48929, "b": 406.89935, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "5", "bbox": {"l": 434.5896000000001, "t": 399.7947700000001, "r": 438.80083999999994, "b": 406.89935, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "tokens", "bbox": {"l": 440.90573, "t": 399.7947700000001, "r": 463.22235, "b": 406.89935, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "D OTSL", "bbox": {"l": 384.11816, "t": 258.54718, "r": 413.99307, "b": 265.65179, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "sequence length:", "bbox": {"l": 393.75256, "t": 266.67505000000006, "r": 451.45129000000003, "b": 273.77966000000004, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "30", "bbox": {"l": 453.55083999999994, "t": 266.67505000000006, "r": 461.97485, "b": 273.77966000000004, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "vocabulary for this table:", "bbox": {"l": 151.79318, "t": 399.76016, "r": 233.89371000000003, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "12", "bbox": {"l": 235.99332, "t": 399.76016, "r": 244.41734000000002, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "tokens", "bbox": {"l": 246.52222, "t": 399.76016, "r": 268.83884, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "A", "bbox": {"l": 154.3298, "t": 213.57457999999997, "r": 159.79837, "b": 220.67920000000004, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "B", "bbox": {"l": 321.07053, "t": 213.57457999999997, "r": 326.53909, "b": 220.67920000000004, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "<table>", "bbox": {"l": 153.0947, "t": 280.30411, "r": 175.83888, "b": 286.69824, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "<tr>", "bbox": {"l": 160.67039, "t": 287.12088, "r": 172.79608, "b": 293.51501, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "<td", "bbox": {"l": 168.24603, "t": 293.93765, "r": 177.91019, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "colspan=\u201c2\u201d", "bbox": {"l": 179.80525, "t": 293.93765, "r": 215.61517, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "rowspan=\u201c2\u201d", "bbox": {"l": 217.50886999999997, "t": 293.93765, "r": 255.58945, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": ">", "bbox": {"l": 257.48315, "t": 293.93765, "r": 261.46414, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "</td>", "bbox": {"l": 263.35785, "t": 293.93765, "r": 278.89804, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "<td", "bbox": {"l": 280.79175, "t": 293.93765, "r": 290.4559, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "colspan=\u201c3\u201d", "bbox": {"l": 292.35095, "t": 293.93765, "r": 328.16083, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": ">", "bbox": {"l": 330.05457, "t": 293.93765, "r": 334.03555, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "</td>", "bbox": {"l": 335.92926, "t": 293.93765, "r": 351.46945, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "</tr>", "bbox": {"l": 160.67039, "t": 300.75442999999996, "r": 174.68979, "b": 307.14856, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "<tr>", "bbox": {"l": 160.67039, "t": 307.57122999999996, "r": 172.79608, "b": 313.96536, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "<td>", "bbox": {"l": 168.24603, "t": 314.388, "r": 181.89255, "b": 320.78214, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "</td>", "bbox": {"l": 183.78624, "t": 314.388, "r": 199.32646, "b": 320.78214, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "<td>", "bbox": {"l": 201.22015, "t": 314.388, "r": 214.86666999999997, "b": 320.78214, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "</td>", "bbox": {"l": 216.76038, "t": 314.388, "r": 232.30058, "b": 320.78214, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "<td>", "bbox": {"l": 234.19427000000002, "t": 314.388, "r": 247.84079000000003, "b": 320.78214, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "</td>", "bbox": {"l": 249.73447999999996, "t": 314.388, "r": 265.27469, "b": 320.78214, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "</tr>", "bbox": {"l": 160.67039, "t": 321.20477, "r": 174.68979, "b": 327.59890999999993, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "<tr>", "bbox": {"l": 160.67039, "t": 328.02158, "r": 172.79608, "b": 334.41571000000005, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "<td rowspan=\u201c3\u201d > </td> <td> </td> <td> </td> <td> </td> <td> </td>", "bbox": {"l": 168.24603, "t": 334.83835, "r": 373.09091, "b": 341.23248, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "</tr>", "bbox": {"l": 160.67039, "t": 341.65512, "r": 174.68979, "b": 348.04926, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "<tr>", "bbox": {"l": 160.67039, "t": 348.47159, "r": 172.79608, "b": 354.86572, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "<td>", "bbox": {"l": 168.24603, "t": 355.28836000000007, "r": 181.89255, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "</td>", "bbox": {"l": 183.78624, "t": 355.28836000000007, "r": 199.32646, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "<td>", "bbox": {"l": 201.22015, "t": 355.28836000000007, "r": 214.86666999999997, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "</td>", "bbox": {"l": 216.76038, "t": 355.28836000000007, "r": 232.30058, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "<td>", "bbox": {"l": 234.19427000000002, "t": 355.28836000000007, "r": 247.84079000000003, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "</td>", "bbox": {"l": 249.73447999999996, "t": 355.28836000000007, "r": 265.27469, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "<td>", "bbox": {"l": 267.1684, "t": 355.28836000000007, "r": 280.81488, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "</td>", "bbox": {"l": 282.70862, "t": 355.28836000000007, "r": 298.24881, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "</tr>", "bbox": {"l": 160.67039, "t": 362.10516000000007, "r": 174.68979, "b": 368.49929999999995, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "<tr>", "bbox": {"l": 160.67039, "t": 368.92194, "r": 172.79608, "b": 375.31607, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "<td>", "bbox": {"l": 168.24603, "t": 375.73871, "r": 181.89255, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "</td>", "bbox": {"l": 183.78624, "t": 375.73871, "r": 199.32646, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "<td>", "bbox": {"l": 201.22015, "t": 375.73871, "r": 214.86666999999997, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "</td>", "bbox": {"l": 216.76038, "t": 375.73871, "r": 232.30058, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "<td>", "bbox": {"l": 234.19427000000002, "t": 375.73871, "r": 247.84079000000003, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "</td>", "bbox": {"l": 249.73447999999996, "t": 375.73871, "r": 265.27469, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "<td>", "bbox": {"l": 267.1684, "t": 375.73871, "r": 280.81488, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "</td>", "bbox": {"l": 282.70862, "t": 375.73871, "r": 298.24881, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "</tr>", "bbox": {"l": 160.67039, "t": 382.55551, "r": 174.68979, "b": 388.94965, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "</table>", "bbox": {"l": 153.0947, "t": 389.37228, "r": 177.73259, "b": 395.76642, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "C", "bbox": {"l": 395.06137, "t": 411.33353, "r": 401.62366, "b": 419.85904, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "L", "bbox": {"l": 407.42249, "t": 411.33353, "r": 412.47598, "b": 419.85904, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "U", "bbox": {"l": 418.69287, "t": 411.33353, "r": 425.25516, "b": 419.85904, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "X", "bbox": {"l": 430.5086099999999, "t": 411.33353, "r": 436.5709800000001, "b": 419.85904, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "<table>", "bbox": {"l": 152.36208, "t": 409.77362, "r": 175.10626, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "<tr>", "bbox": {"l": 178.89366, "t": 409.77362, "r": 191.01935, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "</tr>", "bbox": {"l": 194.80676, "t": 409.77362, "r": 208.82614, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "<td>", "bbox": {"l": 212.61354, "t": 409.77362, "r": 226.26003999999998, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "</td>", "bbox": {"l": 230.04745000000003, "t": 409.77362, "r": 245.58765000000002, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "<td", "bbox": {"l": 249.37506000000002, "t": 409.77362, "r": 259.03918, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "colspan=\"2\"", "bbox": {"l": 262.82797, "t": 409.77362, "r": 298.93646, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "colspan=\"3\"", "bbox": {"l": 302.72385, "t": 409.77362, "r": 338.83234, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "rowspan=\"2\"", "bbox": {"l": 152.36208, "t": 418.10522, "r": 190.74123, "b": 424.49936, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "rowspan=\"3\"", "bbox": {"l": 194.52863, "t": 418.10522, "r": 232.90777999999997, "b": 424.49936, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": ">", "bbox": {"l": 236.69518999999997, "t": 418.10522, "r": 240.67617999999996, "b": 424.49936, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "</table>", "bbox": {"l": 244.46358, "t": 418.10522, "r": 269.10144, "b": 424.49936, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "C", "bbox": {"l": 154.50595, "t": 258.60095, "r": 159.62473, "b": 265.70556999999997, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "HTML", "bbox": {"l": 164.74348, "t": 258.60095, "r": 185.21857, "b": 265.70556999999997, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "sequence length:", "bbox": {"l": 164.3548, "t": 266.49707, "r": 222.05352999999997, "b": 273.60168, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "55", "bbox": {"l": 224.15326, "t": 266.49707, "r": 232.57729, "b": 273.60168, "coord_origin": "TOPLEFT"}}], "children": [{"id": 6, "label": "text", "bbox": {"l": 396.41107, "t": 280.98352, "r": 402.97336, "b": 289.50903, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "C", "bbox": {"l": 396.41107, "t": 280.98352, "r": 402.97336, "b": 289.50903, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "text", "bbox": {"l": 418.58682, "t": 280.89792, "r": 425.14911, "b": 289.42343, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "C", "bbox": {"l": 418.58682, "t": 280.89792, "r": 425.14911, "b": 289.42343, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "text", "bbox": {"l": 395.74835, "t": 303.23727, "r": 402.31064, "b": 311.76279, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "C", "bbox": {"l": 395.74835, "t": 303.23727, "r": 402.31064, "b": 311.76279, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 407.54214, "t": 303.36981, "r": 414.10443, "b": 311.89532, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "C", "bbox": {"l": 407.54214, "t": 303.36981, "r": 414.10443, "b": 311.89532, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "text", "bbox": {"l": 407.56335, "t": 314.40619, "r": 414.12564, "b": 322.9317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "C", "bbox": {"l": 407.56335, "t": 314.40619, "r": 414.12564, "b": 322.9317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 418.51108, "t": 292.08502000000004, "r": 425.07336, "b": 300.61053000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "C", "bbox": {"l": 418.51108, "t": 292.08502000000004, "r": 425.07336, "b": 300.61053000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 429.59744, "t": 292.09106, "r": 436.1597300000001, "b": 300.61658, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "C", "bbox": {"l": 429.59744, "t": 292.09106, "r": 436.1597300000001, "b": 300.61658, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 440.68759000000006, "t": 292.01230000000004, "r": 447.24987999999996, "b": 300.53781000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "C", "bbox": {"l": 440.68759000000006, "t": 292.01230000000004, "r": 447.24987999999996, "b": 300.53781000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 418.6232, "t": 303.29483, "r": 425.18549, "b": 311.82034, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "C", "bbox": {"l": 418.6232, "t": 303.29483, "r": 425.18549, "b": 311.82034, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 429.7095299999999, "t": 303.30011, "r": 436.27182, "b": 311.82562, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "C", "bbox": {"l": 429.7095299999999, "t": 303.30011, "r": 436.27182, "b": 311.82562, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 440.7996800000001, "t": 303.22211, "r": 447.36197, "b": 311.74762, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "C", "bbox": {"l": 440.7996800000001, "t": 303.22211, "r": 447.36197, "b": 311.74762, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 418.62546, "t": 314.56903, "r": 425.18774, "b": 323.09454, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "C", "bbox": {"l": 418.62546, "t": 314.56903, "r": 425.18774, "b": 323.09454, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 429.71181999999993, "t": 314.57434, "r": 436.27411, "b": 323.09985, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "C", "bbox": {"l": 429.71181999999993, "t": 314.57434, "r": 436.27411, "b": 323.09985, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 440.80194, "t": 314.49631, "r": 447.36423, "b": 323.02182, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "C", "bbox": {"l": 440.80194, "t": 314.49631, "r": 447.36423, "b": 323.02182, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 407.39746, "t": 325.29031, "r": 413.95975, "b": 333.81583, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "C", "bbox": {"l": 407.39746, "t": 325.29031, "r": 413.95975, "b": 333.81583, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 418.45959, "t": 325.45316, "r": 425.02188, "b": 333.97867, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "C", "bbox": {"l": 418.45959, "t": 325.45316, "r": 425.02188, "b": 333.97867, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 429.54593, "t": 325.4592, "r": 436.10822, "b": 333.98471, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "C", "bbox": {"l": 429.54593, "t": 325.4592, "r": 436.10822, "b": 333.98471, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 440.63608, "t": 325.38043, "r": 447.19836, "b": 333.90594, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "C", "bbox": {"l": 440.63608, "t": 325.38043, "r": 447.19836, "b": 333.90594, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 451.89511000000005, "t": 280.15717, "r": 463.51273000000003, "b": 288.68268, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "NL", "bbox": {"l": 451.89511000000005, "t": 280.15717, "r": 463.51273000000003, "b": 288.68268, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 452.1557, "t": 291.59875000000005, "r": 463.77332, "b": 300.12427, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "NL", "bbox": {"l": 452.1557, "t": 291.59875000000005, "r": 463.77332, "b": 300.12427, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 452.17688000000004, "t": 302.84265, "r": 463.79449000000005, "b": 311.36816, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "NL", "bbox": {"l": 452.17688000000004, "t": 302.84265, "r": 463.79449000000005, "b": 311.36816, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 452.09887999999995, "t": 314.12441999999993, "r": 463.71648999999996, "b": 322.6499299999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "NL", "bbox": {"l": 452.09887999999995, "t": 314.12441999999993, "r": 463.71648999999996, "b": 322.6499299999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 452.29733, "t": 325.46906, "r": 463.91495, "b": 333.99457, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "NL", "bbox": {"l": 452.29733, "t": 325.46906, "r": 463.91495, "b": 333.99457, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 396.09677, "t": 314.49478, "r": 402.65906, "b": 323.02029000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "U", "bbox": {"l": 396.09677, "t": 314.49478, "r": 402.65906, "b": 323.02029000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 395.99829, "t": 325.38876000000005, "r": 402.56058, "b": 333.91428, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "U", "bbox": {"l": 395.99829, "t": 325.38876000000005, "r": 402.56058, "b": 333.91428, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 396.27475, "t": 292.27057, "r": 402.83704, "b": 300.79608, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "U", "bbox": {"l": 396.27475, "t": 292.27057, "r": 402.83704, "b": 300.79608, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 408.54724, "t": 280.96912, "r": 413.60074, "b": 289.49463, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "L", "bbox": {"l": 408.54724, "t": 280.96912, "r": 413.60074, "b": 289.49463, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 430.58966, "t": 280.49725, "r": 435.6431600000001, "b": 289.02277, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "L", "bbox": {"l": 430.58966, "t": 280.49725, "r": 435.6431600000001, "b": 289.02277, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 441.08069, "t": 280.38062, "r": 446.13419, "b": 288.90613, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "L", "bbox": {"l": 441.08069, "t": 280.38062, "r": 446.13419, "b": 288.90613, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 407.97388, "t": 292.13425, "r": 414.03625, "b": 300.65976, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "X", "bbox": {"l": 407.97388, "t": 292.13425, "r": 414.03625, "b": 300.65976, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 441.25640999999996, "t": 411.1807600000001, "r": 452.87402, "b": 419.7062700000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "NL", "bbox": {"l": 441.25640999999996, "t": 411.1807600000001, "r": 452.87402, "b": 419.7062700000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 393.75256, "t": 399.7947700000001, "r": 432.48929, "b": 406.89935, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "vocabulary:", "bbox": {"l": 393.75256, "t": 399.7947700000001, "r": 432.48929, "b": 406.89935, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 434.5896000000001, "t": 399.7947700000001, "r": 438.80083999999994, "b": 406.89935, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "5", "bbox": {"l": 434.5896000000001, "t": 399.7947700000001, "r": 438.80083999999994, "b": 406.89935, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 440.90573, "t": 399.7947700000001, "r": 463.22235, "b": 406.89935, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "tokens", "bbox": {"l": 440.90573, "t": 399.7947700000001, "r": 463.22235, "b": 406.89935, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 384.11816, "t": 258.54718, "r": 413.99307, "b": 265.65179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "D OTSL", "bbox": {"l": 384.11816, "t": 258.54718, "r": 413.99307, "b": 265.65179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 393.75256, "t": 266.67505000000006, "r": 451.45129000000003, "b": 273.77966000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "sequence length:", "bbox": {"l": 393.75256, "t": 266.67505000000006, "r": 451.45129000000003, "b": 273.77966000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 453.55083999999994, "t": 266.67505000000006, "r": 461.97485, "b": 273.77966000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "30", "bbox": {"l": 453.55083999999994, "t": 266.67505000000006, "r": 461.97485, "b": 273.77966000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 151.79318, "t": 399.76016, "r": 233.89371000000003, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "vocabulary for this table:", "bbox": {"l": 151.79318, "t": 399.76016, "r": 233.89371000000003, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 235.99332, "t": 399.76016, "r": 244.41734000000002, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "12", "bbox": {"l": 235.99332, "t": 399.76016, "r": 244.41734000000002, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 246.52222, "t": 399.76016, "r": 268.83884, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "tokens", "bbox": {"l": 246.52222, "t": 399.76016, "r": 268.83884, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 154.3298, "t": 213.57457999999997, "r": 159.79837, "b": 220.67920000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "A", "bbox": {"l": 154.3298, "t": 213.57457999999997, "r": 159.79837, "b": 220.67920000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 321.07053, "t": 213.57457999999997, "r": 326.53909, "b": 220.67920000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "B", "bbox": {"l": 321.07053, "t": 213.57457999999997, "r": 326.53909, "b": 220.67920000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 153.0947, "t": 280.30411, "r": 175.83888, "b": 286.69824, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "<table>", "bbox": {"l": 153.0947, "t": 280.30411, "r": 175.83888, "b": 286.69824, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 160.67039, "t": 287.12088, "r": 172.79608, "b": 293.51501, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "<tr>", "bbox": {"l": 160.67039, "t": 287.12088, "r": 172.79608, "b": 293.51501, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 168.24603, "t": 293.93765, "r": 177.91019, "b": 300.33179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "<td", "bbox": {"l": 168.24603, "t": 293.93765, "r": 177.91019, "b": 300.33179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 179.80525, "t": 293.93765, "r": 215.61517, "b": 300.33179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "colspan=\u201c2\u201d", "bbox": {"l": 179.80525, "t": 293.93765, "r": 215.61517, "b": 300.33179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 217.50886999999997, "t": 293.93765, "r": 255.58945, "b": 300.33179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "rowspan=\u201c2\u201d", "bbox": {"l": 217.50886999999997, "t": 293.93765, "r": 255.58945, "b": 300.33179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 257.48315, "t": 293.93765, "r": 261.46414, "b": 300.33179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": ">", "bbox": {"l": 257.48315, "t": 293.93765, "r": 261.46414, "b": 300.33179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 263.35785, "t": 293.93765, "r": 278.89804, "b": 300.33179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "</td>", "bbox": {"l": 263.35785, "t": 293.93765, "r": 278.89804, "b": 300.33179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 280.79175, "t": 293.93765, "r": 290.4559, "b": 300.33179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "<td", "bbox": {"l": 280.79175, "t": 293.93765, "r": 290.4559, "b": 300.33179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 292.35095, "t": 293.93765, "r": 328.16083, "b": 300.33179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "colspan=\u201c3\u201d", "bbox": {"l": 292.35095, "t": 293.93765, "r": 328.16083, "b": 300.33179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 330.05457, "t": 293.93765, "r": 334.03555, "b": 300.33179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": ">", "bbox": {"l": 330.05457, "t": 293.93765, "r": 334.03555, "b": 300.33179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 335.92926, "t": 293.93765, "r": 351.46945, "b": 300.33179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "</td>", "bbox": {"l": 335.92926, "t": 293.93765, "r": 351.46945, "b": 300.33179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 160.67039, "t": 300.75442999999996, "r": 174.68979, "b": 307.14856, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "</tr>", "bbox": {"l": 160.67039, "t": 300.75442999999996, "r": 174.68979, "b": 307.14856, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 160.67039, "t": 307.57122999999996, "r": 172.79608, "b": 313.96536, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "<tr>", "bbox": {"l": 160.67039, "t": 307.57122999999996, "r": 172.79608, "b": 313.96536, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 168.24603, "t": 314.388, "r": 181.89255, "b": 320.78214, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "<td>", "bbox": {"l": 168.24603, "t": 314.388, "r": 181.89255, "b": 320.78214, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 183.78624, "t": 314.388, "r": 199.32646, "b": 320.78214, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "</td>", "bbox": {"l": 183.78624, "t": 314.388, "r": 199.32646, "b": 320.78214, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 201.22015, "t": 314.388, "r": 214.86666999999997, "b": 320.78214, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "<td>", "bbox": {"l": 201.22015, "t": 314.388, "r": 214.86666999999997, "b": 320.78214, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 216.76038, "t": 314.388, "r": 232.30058, "b": 320.78214, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "</td>", "bbox": {"l": 216.76038, "t": 314.388, "r": 232.30058, "b": 320.78214, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 234.19427000000002, "t": 314.388, "r": 247.84079000000003, "b": 320.78214, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "<td>", "bbox": {"l": 234.19427000000002, "t": 314.388, "r": 247.84079000000003, "b": 320.78214, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 249.73447999999996, "t": 314.388, "r": 265.27469, "b": 320.78214, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "</td>", "bbox": {"l": 249.73447999999996, "t": 314.388, "r": 265.27469, "b": 320.78214, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 160.67039, "t": 321.20477, "r": 174.68979, "b": 327.59890999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "</tr>", "bbox": {"l": 160.67039, "t": 321.20477, "r": 174.68979, "b": 327.59890999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 160.67039, "t": 328.02158, "r": 172.79608, "b": 334.41571000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "<tr>", "bbox": {"l": 160.67039, "t": 328.02158, "r": 172.79608, "b": 334.41571000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 168.24603, "t": 334.83835, "r": 373.09091, "b": 341.23248, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "<td rowspan=\u201c3\u201d > </td> <td> </td> <td> </td> <td> </td> <td> </td>", "bbox": {"l": 168.24603, "t": 334.83835, "r": 373.09091, "b": 341.23248, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 160.67039, "t": 341.65512, "r": 174.68979, "b": 348.04926, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "</tr>", "bbox": {"l": 160.67039, "t": 341.65512, "r": 174.68979, "b": 348.04926, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 160.67039, "t": 348.47159, "r": 172.79608, "b": 354.86572, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "<tr>", "bbox": {"l": 160.67039, "t": 348.47159, "r": 172.79608, "b": 354.86572, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 168.24603, "t": 355.28836000000007, "r": 181.89255, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "<td>", "bbox": {"l": 168.24603, "t": 355.28836000000007, "r": 181.89255, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 183.78624, "t": 355.28836000000007, "r": 199.32646, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "</td>", "bbox": {"l": 183.78624, "t": 355.28836000000007, "r": 199.32646, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 201.22015, "t": 355.28836000000007, "r": 214.86666999999997, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "<td>", "bbox": {"l": 201.22015, "t": 355.28836000000007, "r": 214.86666999999997, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 216.76038, "t": 355.28836000000007, "r": 232.30058, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "</td>", "bbox": {"l": 216.76038, "t": 355.28836000000007, "r": 232.30058, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 234.19427000000002, "t": 355.28836000000007, "r": 247.84079000000003, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "<td>", "bbox": {"l": 234.19427000000002, "t": 355.28836000000007, "r": 247.84079000000003, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 249.73447999999996, "t": 355.28836000000007, "r": 265.27469, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "</td>", "bbox": {"l": 249.73447999999996, "t": 355.28836000000007, "r": 265.27469, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 267.1684, "t": 355.28836000000007, "r": 280.81488, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "<td>", "bbox": {"l": 267.1684, "t": 355.28836000000007, "r": 280.81488, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 282.70862, "t": 355.28836000000007, "r": 298.24881, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "</td>", "bbox": {"l": 282.70862, "t": 355.28836000000007, "r": 298.24881, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 160.67039, "t": 362.10516000000007, "r": 174.68979, "b": 368.49929999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "</tr>", "bbox": {"l": 160.67039, "t": 362.10516000000007, "r": 174.68979, "b": 368.49929999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 160.67039, "t": 368.92194, "r": 172.79608, "b": 375.31607, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "<tr>", "bbox": {"l": 160.67039, "t": 368.92194, "r": 172.79608, "b": 375.31607, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 168.24603, "t": 375.73871, "r": 181.89255, "b": 382.13284, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "<td>", "bbox": {"l": 168.24603, "t": 375.73871, "r": 181.89255, "b": 382.13284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 183.78624, "t": 375.73871, "r": 199.32646, "b": 382.13284, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "</td>", "bbox": {"l": 183.78624, "t": 375.73871, "r": 199.32646, "b": 382.13284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 201.22015, "t": 375.73871, "r": 214.86666999999997, "b": 382.13284, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "<td>", "bbox": {"l": 201.22015, "t": 375.73871, "r": 214.86666999999997, "b": 382.13284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 216.76038, "t": 375.73871, "r": 232.30058, "b": 382.13284, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "</td>", "bbox": {"l": 216.76038, "t": 375.73871, "r": 232.30058, "b": 382.13284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 234.19427000000002, "t": 375.73871, "r": 247.84079000000003, "b": 382.13284, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "<td>", "bbox": {"l": 234.19427000000002, "t": 375.73871, "r": 247.84079000000003, "b": 382.13284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 249.73447999999996, "t": 375.73871, "r": 265.27469, "b": 382.13284, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "</td>", "bbox": {"l": 249.73447999999996, "t": 375.73871, "r": 265.27469, "b": 382.13284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 267.1684, "t": 375.73871, "r": 280.81488, "b": 382.13284, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "<td>", "bbox": {"l": 267.1684, "t": 375.73871, "r": 280.81488, "b": 382.13284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 282.70862, "t": 375.73871, "r": 298.24881, "b": 382.13284, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "</td>", "bbox": {"l": 282.70862, "t": 375.73871, "r": 298.24881, "b": 382.13284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 160.67039, "t": 382.55551, "r": 174.68979, "b": 388.94965, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "</tr>", "bbox": {"l": 160.67039, "t": 382.55551, "r": 174.68979, "b": 388.94965, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 153.0947, "t": 389.37228, "r": 177.73259, "b": 395.76642, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "</table>", "bbox": {"l": 153.0947, "t": 389.37228, "r": 177.73259, "b": 395.76642, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 395.06137, "t": 411.33353, "r": 401.62366, "b": 419.85904, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "C", "bbox": {"l": 395.06137, "t": 411.33353, "r": 401.62366, "b": 419.85904, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 407.42249, "t": 411.33353, "r": 412.47598, "b": 419.85904, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "L", "bbox": {"l": 407.42249, "t": 411.33353, "r": 412.47598, "b": 419.85904, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 418.69287, "t": 411.33353, "r": 425.25516, "b": 419.85904, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "U", "bbox": {"l": 418.69287, "t": 411.33353, "r": 425.25516, "b": 419.85904, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 430.5086099999999, "t": 411.33353, "r": 436.5709800000001, "b": 419.85904, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "X", "bbox": {"l": 430.5086099999999, "t": 411.33353, "r": 436.5709800000001, "b": 419.85904, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 152.36208, "t": 409.77362, "r": 175.10626, "b": 416.16776, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "<table>", "bbox": {"l": 152.36208, "t": 409.77362, "r": 175.10626, "b": 416.16776, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 178.89366, "t": 409.77362, "r": 191.01935, "b": 416.16776, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": "<tr>", "bbox": {"l": 178.89366, "t": 409.77362, "r": 191.01935, "b": 416.16776, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 194.80676, "t": 409.77362, "r": 208.82614, "b": 416.16776, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "</tr>", "bbox": {"l": 194.80676, "t": 409.77362, "r": 208.82614, "b": 416.16776, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 212.61354, "t": 409.77362, "r": 226.26003999999998, "b": 416.16776, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "<td>", "bbox": {"l": 212.61354, "t": 409.77362, "r": 226.26003999999998, "b": 416.16776, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 230.04745000000003, "t": 409.77362, "r": 245.58765000000002, "b": 416.16776, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": "</td>", "bbox": {"l": 230.04745000000003, "t": 409.77362, "r": 245.58765000000002, "b": 416.16776, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 249.37506000000002, "t": 409.77362, "r": 259.03918, "b": 416.16776, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 107, "text": "<td", "bbox": {"l": 249.37506000000002, "t": 409.77362, "r": 259.03918, "b": 416.16776, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 262.82797, "t": 409.77362, "r": 298.93646, "b": 416.16776, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 108, "text": "colspan=\"2\"", "bbox": {"l": 262.82797, "t": 409.77362, "r": 298.93646, "b": 416.16776, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 302.72385, "t": 409.77362, "r": 338.83234, "b": 416.16776, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 109, "text": "colspan=\"3\"", "bbox": {"l": 302.72385, "t": 409.77362, "r": 338.83234, "b": 416.16776, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 152.36208, "t": 418.10522, "r": 190.74123, "b": 424.49936, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 110, "text": "rowspan=\"2\"", "bbox": {"l": 152.36208, "t": 418.10522, "r": 190.74123, "b": 424.49936, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 194.52863, "t": 418.10522, "r": 232.90777999999997, "b": 424.49936, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 111, "text": "rowspan=\"3\"", "bbox": {"l": 194.52863, "t": 418.10522, "r": 232.90777999999997, "b": 424.49936, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 236.69518999999997, "t": 418.10522, "r": 240.67617999999996, "b": 424.49936, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 112, "text": ">", "bbox": {"l": 236.69518999999997, "t": 418.10522, "r": 240.67617999999996, "b": 424.49936, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 244.46358, "t": 418.10522, "r": 269.10144, "b": 424.49936, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 113, "text": "</table>", "bbox": {"l": 244.46358, "t": 418.10522, "r": 269.10144, "b": 424.49936, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 154.50595, "t": 258.60095, "r": 159.62473, "b": 265.70556999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 114, "text": "C", "bbox": {"l": 154.50595, "t": 258.60095, "r": 159.62473, "b": 265.70556999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 164.74348, "t": 258.60095, "r": 185.21857, "b": 265.70556999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 115, "text": "HTML", "bbox": {"l": 164.74348, "t": 258.60095, "r": 185.21857, "b": 265.70556999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 164.3548, "t": 266.49707, "r": 222.05352999999997, "b": 273.60168, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 116, "text": "sequence length:", "bbox": {"l": 164.3548, "t": 266.49707, "r": 222.05352999999997, "b": 273.60168, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 224.15326, "t": 266.49707, "r": 232.57729, "b": 273.60168, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 117, "text": "55", "bbox": {"l": 224.15326, "t": 266.49707, "r": 232.57729, "b": 273.60168, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 2, "label": "text", "bbox": {"l": 134.765, "t": 452.31378, "r": 480.59232000000003, "b": 520.88669, "coord_origin": "TOPLEFT"}, "confidence": 0.950499951839447, "cells": [{"id": 118, "text": "today,", "bbox": {"l": 134.765, "t": 452.31378, "r": 161.32928, "b": 461.11075, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "table detection", "bbox": {"l": 164.269, "t": 452.31378, "r": 226.28617999999997, "b": 461.11075, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "in documents is a well understood problem, and the latest", "bbox": {"l": 229.992, "t": 452.31378, "r": 480.59232000000003, "b": 461.11075, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "state-of-the-art (SOTA) object detection methods provide an accuracy compa-", "bbox": {"l": 134.76501, "t": 464.26877, "r": 480.59180000000003, "b": 473.06573, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "rable to human observers [7,8,10,14,23]. On the other hand, the problem of table", "bbox": {"l": 134.76501, "t": 476.22375, "r": 480.58673, "b": 485.02072, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "structure recognition (TSR) is a lot more challenging and remains a very active", "bbox": {"l": 134.76501, "t": 488.17975, "r": 480.58658, "b": 496.97672, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "area of research, in which many novel machine learning algorithms are being", "bbox": {"l": 134.76501, "t": 500.13474, "r": 480.58978, "b": 508.9317, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "explored [3,4,5,9,11,12,13,14,17,18,21,22].", "bbox": {"l": 134.76501, "t": 512.0897199999999, "r": 313.24597, "b": 520.88669, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 134.76501, "t": 524.55072, "r": 480.59482, "b": 664.8547, "coord_origin": "TOPLEFT"}, "confidence": 0.9845512509346008, "cells": [{"id": 126, "text": "Recently emerging SOTA methods for table structure recognition employ", "bbox": {"l": 149.70901, "t": 524.55072, "r": 480.58884000000006, "b": 533.3476900000001, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "transformer-based models, in which an image of the table is provided to the net-", "bbox": {"l": 134.76501, "t": 536.50671, "r": 480.5917400000001, "b": 545.30368, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "work in order to predict the structure of the table as a sequence of tokens. These", "bbox": {"l": 134.76501, "t": 548.46172, "r": 480.58868, "b": 557.25868, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "image-to-sequence (Im2Seq) models are extremely powerful, since they allow for", "bbox": {"l": 134.76501, "t": 560.41672, "r": 480.58795, "b": 569.2136800000001, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "a purely data-driven solution. The tokens of the sequence typically belong to a", "bbox": {"l": 134.76501, "t": 572.37172, "r": 480.58978, "b": 581.16869, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "markup language such as HTML, Latex or Markdown, which allow to describe", "bbox": {"l": 134.76501, "t": 584.32672, "r": 480.59479, "b": 593.12369, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "table structure as rows, columns and spanning cells in various configurations.", "bbox": {"l": 134.76501, "t": 596.28271, "r": 480.58678999999995, "b": 605.0796799999999, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "In Figure 1, we illustrate how HTML is used to represent the table-structure", "bbox": {"l": 134.76501, "t": 608.23772, "r": 480.59476, "b": 617.03468, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "of a particular example table. Public table-structure data sets such as PubTab-", "bbox": {"l": 134.76501, "t": 620.19272, "r": 480.5938100000001, "b": 628.98969, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "Net [22], and FinTabNet [21], which were created in a semi-automated way from", "bbox": {"l": 134.76501, "t": 632.1477199999999, "r": 480.59482, "b": 640.94469, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "paired PDF and HTML sources (e.g. PubMed Central), popularized primarily", "bbox": {"l": 134.76501, "t": 644.10272, "r": 480.58771, "b": 652.89969, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "the use of HTML as ground-truth representation format for TSR.", "bbox": {"l": 134.76501, "t": 656.05772, "r": 421.45377, "b": 664.8547, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_header", "id": 5, "page_no": 1, "cluster": {"id": 5, "label": "page_header", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8580349683761597, "cells": [{"id": 0, "text": "2", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2"}, {"label": "page_header", "id": 3, "page_no": 1, "cluster": {"id": 3, "label": "page_header", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9076642990112305, "cells": [{"id": 1, "text": "M.", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 178.07675, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37415, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "M. Lysak, et al."}, {"label": "caption", "id": 4, "page_no": 1, "cluster": {"id": 4, "label": "caption", "bbox": {"l": 134.765, "t": 126.33416999999997, "r": 480.59189, "b": 200.22058000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.8939083218574524, "cells": [{"id": 3, "text": "Fig. 1.", "bbox": {"l": 134.765, "t": 126.33416999999997, "r": 162.64424, "b": 134.26049999999998, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Comparison between HTML and OTSL table structure representation: (A)", "bbox": {"l": 167.062, "t": 126.39697000000001, "r": 480.59106, "b": 134.46667000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "table-example with complex row and column headers, including a 2D empty span,", "bbox": {"l": 134.765, "t": 137.35595999999998, "r": 480.59018, "b": 145.42566, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "(B)", "bbox": {"l": 134.765, "t": 148.31493999999998, "r": 147.95433, "b": 156.38464, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "minimal graphical representation of table structure using rectangular layout, (C)", "bbox": {"l": 152.39224, "t": 148.31493999999998, "r": 480.59096999999997, "b": 156.38464, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "HTML representation, (D) OTSL representation. This example demonstrates many of", "bbox": {"l": 134.765, "t": 159.27392999999995, "r": 480.59189, "b": 167.34362999999996, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "the key-features of OTSL, namely its reduced vocabulary size (12 versus 5 in this case),", "bbox": {"l": 134.765, "t": 170.23290999999995, "r": 480.58914000000004, "b": 178.30260999999996, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "its reduced sequence length (55 versus 30) and a enhanced internal structure (variable", "bbox": {"l": 134.765, "t": 181.19188999999994, "r": 480.59020999999996, "b": 189.26160000000004, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "token sequence length per row in HTML versus a fixed length of rows in OTSL).", "bbox": {"l": 134.765, "t": 192.15088000000003, "r": 460.87109, "b": 200.22058000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Fig. 1. Comparison between HTML and OTSL table structure representation: (A) table-example with complex row and column headers, including a 2D empty span, (B) minimal graphical representation of table structure using rectangular layout, (C) HTML representation, (D) OTSL representation. This example demonstrates many of the key-features of OTSL, namely its reduced vocabulary size (12 versus 5 in this case), its reduced sequence length (55 versus 30) and a enhanced internal structure (variable token sequence length per row in HTML versus a fixed length of rows in OTSL)."}, {"label": "picture", "id": 1, "page_no": 1, "cluster": {"id": 1, "label": "picture", "bbox": {"l": 148.45364379882812, "t": 208.37423706054688, "r": 464.3608093261719, "b": 425.8462219238281, "coord_origin": "TOPLEFT"}, "confidence": 0.9688959121704102, "cells": [{"id": 12, "text": "C", "bbox": {"l": 396.41107, "t": 280.98352, "r": 402.97336, "b": 289.50903, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "C", "bbox": {"l": 418.58682, "t": 280.89792, "r": 425.14911, "b": 289.42343, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "C", "bbox": {"l": 395.74835, "t": 303.23727, "r": 402.31064, "b": 311.76279, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "C", "bbox": {"l": 407.54214, "t": 303.36981, "r": 414.10443, "b": 311.89532, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "C", "bbox": {"l": 407.56335, "t": 314.40619, "r": 414.12564, "b": 322.9317, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "C", "bbox": {"l": 418.51108, "t": 292.08502000000004, "r": 425.07336, "b": 300.61053000000004, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "C", "bbox": {"l": 429.59744, "t": 292.09106, "r": 436.1597300000001, "b": 300.61658, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "C", "bbox": {"l": 440.68759000000006, "t": 292.01230000000004, "r": 447.24987999999996, "b": 300.53781000000004, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "C", "bbox": {"l": 418.6232, "t": 303.29483, "r": 425.18549, "b": 311.82034, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "C", "bbox": {"l": 429.7095299999999, "t": 303.30011, "r": 436.27182, "b": 311.82562, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "C", "bbox": {"l": 440.7996800000001, "t": 303.22211, "r": 447.36197, "b": 311.74762, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "C", "bbox": {"l": 418.62546, "t": 314.56903, "r": 425.18774, "b": 323.09454, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "C", "bbox": {"l": 429.71181999999993, "t": 314.57434, "r": 436.27411, "b": 323.09985, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "C", "bbox": {"l": 440.80194, "t": 314.49631, "r": 447.36423, "b": 323.02182, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "C", "bbox": {"l": 407.39746, "t": 325.29031, "r": 413.95975, "b": 333.81583, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "C", "bbox": {"l": 418.45959, "t": 325.45316, "r": 425.02188, "b": 333.97867, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "C", "bbox": {"l": 429.54593, "t": 325.4592, "r": 436.10822, "b": 333.98471, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "C", "bbox": {"l": 440.63608, "t": 325.38043, "r": 447.19836, "b": 333.90594, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "NL", "bbox": {"l": 451.89511000000005, "t": 280.15717, "r": 463.51273000000003, "b": 288.68268, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "NL", "bbox": {"l": 452.1557, "t": 291.59875000000005, "r": 463.77332, "b": 300.12427, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "NL", "bbox": {"l": 452.17688000000004, "t": 302.84265, "r": 463.79449000000005, "b": 311.36816, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "NL", "bbox": {"l": 452.09887999999995, "t": 314.12441999999993, "r": 463.71648999999996, "b": 322.6499299999999, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "NL", "bbox": {"l": 452.29733, "t": 325.46906, "r": 463.91495, "b": 333.99457, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "U", "bbox": {"l": 396.09677, "t": 314.49478, "r": 402.65906, "b": 323.02029000000005, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "U", "bbox": {"l": 395.99829, "t": 325.38876000000005, "r": 402.56058, "b": 333.91428, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "U", "bbox": {"l": 396.27475, "t": 292.27057, "r": 402.83704, "b": 300.79608, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "L", "bbox": {"l": 408.54724, "t": 280.96912, "r": 413.60074, "b": 289.49463, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "L", "bbox": {"l": 430.58966, "t": 280.49725, "r": 435.6431600000001, "b": 289.02277, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "L", "bbox": {"l": 441.08069, "t": 280.38062, "r": 446.13419, "b": 288.90613, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "X", "bbox": {"l": 407.97388, "t": 292.13425, "r": 414.03625, "b": 300.65976, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "NL", "bbox": {"l": 441.25640999999996, "t": 411.1807600000001, "r": 452.87402, "b": 419.7062700000001, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "vocabulary:", "bbox": {"l": 393.75256, "t": 399.7947700000001, "r": 432.48929, "b": 406.89935, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "5", "bbox": {"l": 434.5896000000001, "t": 399.7947700000001, "r": 438.80083999999994, "b": 406.89935, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "tokens", "bbox": {"l": 440.90573, "t": 399.7947700000001, "r": 463.22235, "b": 406.89935, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "D OTSL", "bbox": {"l": 384.11816, "t": 258.54718, "r": 413.99307, "b": 265.65179, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "sequence length:", "bbox": {"l": 393.75256, "t": 266.67505000000006, "r": 451.45129000000003, "b": 273.77966000000004, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "30", "bbox": {"l": 453.55083999999994, "t": 266.67505000000006, "r": 461.97485, "b": 273.77966000000004, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "vocabulary for this table:", "bbox": {"l": 151.79318, "t": 399.76016, "r": 233.89371000000003, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "12", "bbox": {"l": 235.99332, "t": 399.76016, "r": 244.41734000000002, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "tokens", "bbox": {"l": 246.52222, "t": 399.76016, "r": 268.83884, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "A", "bbox": {"l": 154.3298, "t": 213.57457999999997, "r": 159.79837, "b": 220.67920000000004, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "B", "bbox": {"l": 321.07053, "t": 213.57457999999997, "r": 326.53909, "b": 220.67920000000004, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "<table>", "bbox": {"l": 153.0947, "t": 280.30411, "r": 175.83888, "b": 286.69824, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "<tr>", "bbox": {"l": 160.67039, "t": 287.12088, "r": 172.79608, "b": 293.51501, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "<td", "bbox": {"l": 168.24603, "t": 293.93765, "r": 177.91019, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "colspan=\u201c2\u201d", "bbox": {"l": 179.80525, "t": 293.93765, "r": 215.61517, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "rowspan=\u201c2\u201d", "bbox": {"l": 217.50886999999997, "t": 293.93765, "r": 255.58945, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": ">", "bbox": {"l": 257.48315, "t": 293.93765, "r": 261.46414, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "</td>", "bbox": {"l": 263.35785, "t": 293.93765, "r": 278.89804, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "<td", "bbox": {"l": 280.79175, "t": 293.93765, "r": 290.4559, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "colspan=\u201c3\u201d", "bbox": {"l": 292.35095, "t": 293.93765, "r": 328.16083, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": ">", "bbox": {"l": 330.05457, "t": 293.93765, "r": 334.03555, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "</td>", "bbox": {"l": 335.92926, "t": 293.93765, "r": 351.46945, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "</tr>", "bbox": {"l": 160.67039, "t": 300.75442999999996, "r": 174.68979, "b": 307.14856, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "<tr>", "bbox": {"l": 160.67039, "t": 307.57122999999996, "r": 172.79608, "b": 313.96536, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "<td>", "bbox": {"l": 168.24603, "t": 314.388, "r": 181.89255, "b": 320.78214, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "</td>", "bbox": {"l": 183.78624, "t": 314.388, "r": 199.32646, "b": 320.78214, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "<td>", "bbox": {"l": 201.22015, "t": 314.388, "r": 214.86666999999997, "b": 320.78214, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "</td>", "bbox": {"l": 216.76038, "t": 314.388, "r": 232.30058, "b": 320.78214, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "<td>", "bbox": {"l": 234.19427000000002, "t": 314.388, "r": 247.84079000000003, "b": 320.78214, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "</td>", "bbox": {"l": 249.73447999999996, "t": 314.388, "r": 265.27469, "b": 320.78214, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "</tr>", "bbox": {"l": 160.67039, "t": 321.20477, "r": 174.68979, "b": 327.59890999999993, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "<tr>", "bbox": {"l": 160.67039, "t": 328.02158, "r": 172.79608, "b": 334.41571000000005, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "<td rowspan=\u201c3\u201d > </td> <td> </td> <td> </td> <td> </td> <td> </td>", "bbox": {"l": 168.24603, "t": 334.83835, "r": 373.09091, "b": 341.23248, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "</tr>", "bbox": {"l": 160.67039, "t": 341.65512, "r": 174.68979, "b": 348.04926, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "<tr>", "bbox": {"l": 160.67039, "t": 348.47159, "r": 172.79608, "b": 354.86572, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "<td>", "bbox": {"l": 168.24603, "t": 355.28836000000007, "r": 181.89255, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "</td>", "bbox": {"l": 183.78624, "t": 355.28836000000007, "r": 199.32646, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "<td>", "bbox": {"l": 201.22015, "t": 355.28836000000007, "r": 214.86666999999997, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "</td>", "bbox": {"l": 216.76038, "t": 355.28836000000007, "r": 232.30058, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "<td>", "bbox": {"l": 234.19427000000002, "t": 355.28836000000007, "r": 247.84079000000003, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "</td>", "bbox": {"l": 249.73447999999996, "t": 355.28836000000007, "r": 265.27469, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "<td>", "bbox": {"l": 267.1684, "t": 355.28836000000007, "r": 280.81488, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "</td>", "bbox": {"l": 282.70862, "t": 355.28836000000007, "r": 298.24881, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "</tr>", "bbox": {"l": 160.67039, "t": 362.10516000000007, "r": 174.68979, "b": 368.49929999999995, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "<tr>", "bbox": {"l": 160.67039, "t": 368.92194, "r": 172.79608, "b": 375.31607, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "<td>", "bbox": {"l": 168.24603, "t": 375.73871, "r": 181.89255, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "</td>", "bbox": {"l": 183.78624, "t": 375.73871, "r": 199.32646, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "<td>", "bbox": {"l": 201.22015, "t": 375.73871, "r": 214.86666999999997, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "</td>", "bbox": {"l": 216.76038, "t": 375.73871, "r": 232.30058, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "<td>", "bbox": {"l": 234.19427000000002, "t": 375.73871, "r": 247.84079000000003, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "</td>", "bbox": {"l": 249.73447999999996, "t": 375.73871, "r": 265.27469, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "<td>", "bbox": {"l": 267.1684, "t": 375.73871, "r": 280.81488, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "</td>", "bbox": {"l": 282.70862, "t": 375.73871, "r": 298.24881, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "</tr>", "bbox": {"l": 160.67039, "t": 382.55551, "r": 174.68979, "b": 388.94965, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "</table>", "bbox": {"l": 153.0947, "t": 389.37228, "r": 177.73259, "b": 395.76642, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "C", "bbox": {"l": 395.06137, "t": 411.33353, "r": 401.62366, "b": 419.85904, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "L", "bbox": {"l": 407.42249, "t": 411.33353, "r": 412.47598, "b": 419.85904, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "U", "bbox": {"l": 418.69287, "t": 411.33353, "r": 425.25516, "b": 419.85904, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "X", "bbox": {"l": 430.5086099999999, "t": 411.33353, "r": 436.5709800000001, "b": 419.85904, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "<table>", "bbox": {"l": 152.36208, "t": 409.77362, "r": 175.10626, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "<tr>", "bbox": {"l": 178.89366, "t": 409.77362, "r": 191.01935, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "</tr>", "bbox": {"l": 194.80676, "t": 409.77362, "r": 208.82614, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "<td>", "bbox": {"l": 212.61354, "t": 409.77362, "r": 226.26003999999998, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "</td>", "bbox": {"l": 230.04745000000003, "t": 409.77362, "r": 245.58765000000002, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "<td", "bbox": {"l": 249.37506000000002, "t": 409.77362, "r": 259.03918, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "colspan=\"2\"", "bbox": {"l": 262.82797, "t": 409.77362, "r": 298.93646, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "colspan=\"3\"", "bbox": {"l": 302.72385, "t": 409.77362, "r": 338.83234, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "rowspan=\"2\"", "bbox": {"l": 152.36208, "t": 418.10522, "r": 190.74123, "b": 424.49936, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "rowspan=\"3\"", "bbox": {"l": 194.52863, "t": 418.10522, "r": 232.90777999999997, "b": 424.49936, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": ">", "bbox": {"l": 236.69518999999997, "t": 418.10522, "r": 240.67617999999996, "b": 424.49936, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "</table>", "bbox": {"l": 244.46358, "t": 418.10522, "r": 269.10144, "b": 424.49936, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "C", "bbox": {"l": 154.50595, "t": 258.60095, "r": 159.62473, "b": 265.70556999999997, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "HTML", "bbox": {"l": 164.74348, "t": 258.60095, "r": 185.21857, "b": 265.70556999999997, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "sequence length:", "bbox": {"l": 164.3548, "t": 266.49707, "r": 222.05352999999997, "b": 273.60168, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "55", "bbox": {"l": 224.15326, "t": 266.49707, "r": 232.57729, "b": 273.60168, "coord_origin": "TOPLEFT"}}], "children": [{"id": 6, "label": "text", "bbox": {"l": 396.41107, "t": 280.98352, "r": 402.97336, "b": 289.50903, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "C", "bbox": {"l": 396.41107, "t": 280.98352, "r": 402.97336, "b": 289.50903, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "text", "bbox": {"l": 418.58682, "t": 280.89792, "r": 425.14911, "b": 289.42343, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "C", "bbox": {"l": 418.58682, "t": 280.89792, "r": 425.14911, "b": 289.42343, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "text", "bbox": {"l": 395.74835, "t": 303.23727, "r": 402.31064, "b": 311.76279, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "C", "bbox": {"l": 395.74835, "t": 303.23727, "r": 402.31064, "b": 311.76279, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 407.54214, "t": 303.36981, "r": 414.10443, "b": 311.89532, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "C", "bbox": {"l": 407.54214, "t": 303.36981, "r": 414.10443, "b": 311.89532, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "text", "bbox": {"l": 407.56335, "t": 314.40619, "r": 414.12564, "b": 322.9317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "C", "bbox": {"l": 407.56335, "t": 314.40619, "r": 414.12564, "b": 322.9317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 418.51108, "t": 292.08502000000004, "r": 425.07336, "b": 300.61053000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "C", "bbox": {"l": 418.51108, "t": 292.08502000000004, "r": 425.07336, "b": 300.61053000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 429.59744, "t": 292.09106, "r": 436.1597300000001, "b": 300.61658, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "C", "bbox": {"l": 429.59744, "t": 292.09106, "r": 436.1597300000001, "b": 300.61658, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 440.68759000000006, "t": 292.01230000000004, "r": 447.24987999999996, "b": 300.53781000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "C", "bbox": {"l": 440.68759000000006, "t": 292.01230000000004, "r": 447.24987999999996, "b": 300.53781000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 418.6232, "t": 303.29483, "r": 425.18549, "b": 311.82034, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "C", "bbox": {"l": 418.6232, "t": 303.29483, "r": 425.18549, "b": 311.82034, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 429.7095299999999, "t": 303.30011, "r": 436.27182, "b": 311.82562, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "C", "bbox": {"l": 429.7095299999999, "t": 303.30011, "r": 436.27182, "b": 311.82562, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 440.7996800000001, "t": 303.22211, "r": 447.36197, "b": 311.74762, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "C", "bbox": {"l": 440.7996800000001, "t": 303.22211, "r": 447.36197, "b": 311.74762, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 418.62546, "t": 314.56903, "r": 425.18774, "b": 323.09454, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "C", "bbox": {"l": 418.62546, "t": 314.56903, "r": 425.18774, "b": 323.09454, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 429.71181999999993, "t": 314.57434, "r": 436.27411, "b": 323.09985, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "C", "bbox": {"l": 429.71181999999993, "t": 314.57434, "r": 436.27411, "b": 323.09985, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 440.80194, "t": 314.49631, "r": 447.36423, "b": 323.02182, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "C", "bbox": {"l": 440.80194, "t": 314.49631, "r": 447.36423, "b": 323.02182, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 407.39746, "t": 325.29031, "r": 413.95975, "b": 333.81583, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "C", "bbox": {"l": 407.39746, "t": 325.29031, "r": 413.95975, "b": 333.81583, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 418.45959, "t": 325.45316, "r": 425.02188, "b": 333.97867, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "C", "bbox": {"l": 418.45959, "t": 325.45316, "r": 425.02188, "b": 333.97867, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 429.54593, "t": 325.4592, "r": 436.10822, "b": 333.98471, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "C", "bbox": {"l": 429.54593, "t": 325.4592, "r": 436.10822, "b": 333.98471, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 440.63608, "t": 325.38043, "r": 447.19836, "b": 333.90594, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "C", "bbox": {"l": 440.63608, "t": 325.38043, "r": 447.19836, "b": 333.90594, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 451.89511000000005, "t": 280.15717, "r": 463.51273000000003, "b": 288.68268, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "NL", "bbox": {"l": 451.89511000000005, "t": 280.15717, "r": 463.51273000000003, "b": 288.68268, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 452.1557, "t": 291.59875000000005, "r": 463.77332, "b": 300.12427, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "NL", "bbox": {"l": 452.1557, "t": 291.59875000000005, "r": 463.77332, "b": 300.12427, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 452.17688000000004, "t": 302.84265, "r": 463.79449000000005, "b": 311.36816, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "NL", "bbox": {"l": 452.17688000000004, "t": 302.84265, "r": 463.79449000000005, "b": 311.36816, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 452.09887999999995, "t": 314.12441999999993, "r": 463.71648999999996, "b": 322.6499299999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "NL", "bbox": {"l": 452.09887999999995, "t": 314.12441999999993, "r": 463.71648999999996, "b": 322.6499299999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 452.29733, "t": 325.46906, "r": 463.91495, "b": 333.99457, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "NL", "bbox": {"l": 452.29733, "t": 325.46906, "r": 463.91495, "b": 333.99457, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 396.09677, "t": 314.49478, "r": 402.65906, "b": 323.02029000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "U", "bbox": {"l": 396.09677, "t": 314.49478, "r": 402.65906, "b": 323.02029000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 395.99829, "t": 325.38876000000005, "r": 402.56058, "b": 333.91428, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "U", "bbox": {"l": 395.99829, "t": 325.38876000000005, "r": 402.56058, "b": 333.91428, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 396.27475, "t": 292.27057, "r": 402.83704, "b": 300.79608, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "U", "bbox": {"l": 396.27475, "t": 292.27057, "r": 402.83704, "b": 300.79608, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 408.54724, "t": 280.96912, "r": 413.60074, "b": 289.49463, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "L", "bbox": {"l": 408.54724, "t": 280.96912, "r": 413.60074, "b": 289.49463, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 430.58966, "t": 280.49725, "r": 435.6431600000001, "b": 289.02277, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "L", "bbox": {"l": 430.58966, "t": 280.49725, "r": 435.6431600000001, "b": 289.02277, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 441.08069, "t": 280.38062, "r": 446.13419, "b": 288.90613, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "L", "bbox": {"l": 441.08069, "t": 280.38062, "r": 446.13419, "b": 288.90613, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 407.97388, "t": 292.13425, "r": 414.03625, "b": 300.65976, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "X", "bbox": {"l": 407.97388, "t": 292.13425, "r": 414.03625, "b": 300.65976, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 441.25640999999996, "t": 411.1807600000001, "r": 452.87402, "b": 419.7062700000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "NL", "bbox": {"l": 441.25640999999996, "t": 411.1807600000001, "r": 452.87402, "b": 419.7062700000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 393.75256, "t": 399.7947700000001, "r": 432.48929, "b": 406.89935, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "vocabulary:", "bbox": {"l": 393.75256, "t": 399.7947700000001, "r": 432.48929, "b": 406.89935, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 434.5896000000001, "t": 399.7947700000001, "r": 438.80083999999994, "b": 406.89935, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "5", "bbox": {"l": 434.5896000000001, "t": 399.7947700000001, "r": 438.80083999999994, "b": 406.89935, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 440.90573, "t": 399.7947700000001, "r": 463.22235, "b": 406.89935, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "tokens", "bbox": {"l": 440.90573, "t": 399.7947700000001, "r": 463.22235, "b": 406.89935, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 384.11816, "t": 258.54718, "r": 413.99307, "b": 265.65179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "D OTSL", "bbox": {"l": 384.11816, "t": 258.54718, "r": 413.99307, "b": 265.65179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 393.75256, "t": 266.67505000000006, "r": 451.45129000000003, "b": 273.77966000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "sequence length:", "bbox": {"l": 393.75256, "t": 266.67505000000006, "r": 451.45129000000003, "b": 273.77966000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 453.55083999999994, "t": 266.67505000000006, "r": 461.97485, "b": 273.77966000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "30", "bbox": {"l": 453.55083999999994, "t": 266.67505000000006, "r": 461.97485, "b": 273.77966000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 151.79318, "t": 399.76016, "r": 233.89371000000003, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "vocabulary for this table:", "bbox": {"l": 151.79318, "t": 399.76016, "r": 233.89371000000003, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 235.99332, "t": 399.76016, "r": 244.41734000000002, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "12", "bbox": {"l": 235.99332, "t": 399.76016, "r": 244.41734000000002, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 246.52222, "t": 399.76016, "r": 268.83884, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "tokens", "bbox": {"l": 246.52222, "t": 399.76016, "r": 268.83884, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 154.3298, "t": 213.57457999999997, "r": 159.79837, "b": 220.67920000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "A", "bbox": {"l": 154.3298, "t": 213.57457999999997, "r": 159.79837, "b": 220.67920000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 321.07053, "t": 213.57457999999997, "r": 326.53909, "b": 220.67920000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "B", "bbox": {"l": 321.07053, "t": 213.57457999999997, "r": 326.53909, "b": 220.67920000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 153.0947, "t": 280.30411, "r": 175.83888, "b": 286.69824, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "<table>", "bbox": {"l": 153.0947, "t": 280.30411, "r": 175.83888, "b": 286.69824, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 160.67039, "t": 287.12088, "r": 172.79608, "b": 293.51501, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "<tr>", "bbox": {"l": 160.67039, "t": 287.12088, "r": 172.79608, "b": 293.51501, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 168.24603, "t": 293.93765, "r": 177.91019, "b": 300.33179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "<td", "bbox": {"l": 168.24603, "t": 293.93765, "r": 177.91019, "b": 300.33179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 179.80525, "t": 293.93765, "r": 215.61517, "b": 300.33179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "colspan=\u201c2\u201d", "bbox": {"l": 179.80525, "t": 293.93765, "r": 215.61517, "b": 300.33179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 217.50886999999997, "t": 293.93765, "r": 255.58945, "b": 300.33179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "rowspan=\u201c2\u201d", "bbox": {"l": 217.50886999999997, "t": 293.93765, "r": 255.58945, "b": 300.33179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 257.48315, "t": 293.93765, "r": 261.46414, "b": 300.33179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": ">", "bbox": {"l": 257.48315, "t": 293.93765, "r": 261.46414, "b": 300.33179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 263.35785, "t": 293.93765, "r": 278.89804, "b": 300.33179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "</td>", "bbox": {"l": 263.35785, "t": 293.93765, "r": 278.89804, "b": 300.33179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 280.79175, "t": 293.93765, "r": 290.4559, "b": 300.33179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "<td", "bbox": {"l": 280.79175, "t": 293.93765, "r": 290.4559, "b": 300.33179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 292.35095, "t": 293.93765, "r": 328.16083, "b": 300.33179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "colspan=\u201c3\u201d", "bbox": {"l": 292.35095, "t": 293.93765, "r": 328.16083, "b": 300.33179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 330.05457, "t": 293.93765, "r": 334.03555, "b": 300.33179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": ">", "bbox": {"l": 330.05457, "t": 293.93765, "r": 334.03555, "b": 300.33179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 335.92926, "t": 293.93765, "r": 351.46945, "b": 300.33179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "</td>", "bbox": {"l": 335.92926, "t": 293.93765, "r": 351.46945, "b": 300.33179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 160.67039, "t": 300.75442999999996, "r": 174.68979, "b": 307.14856, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "</tr>", "bbox": {"l": 160.67039, "t": 300.75442999999996, "r": 174.68979, "b": 307.14856, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 160.67039, "t": 307.57122999999996, "r": 172.79608, "b": 313.96536, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "<tr>", "bbox": {"l": 160.67039, "t": 307.57122999999996, "r": 172.79608, "b": 313.96536, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 168.24603, "t": 314.388, "r": 181.89255, "b": 320.78214, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "<td>", "bbox": {"l": 168.24603, "t": 314.388, "r": 181.89255, "b": 320.78214, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 183.78624, "t": 314.388, "r": 199.32646, "b": 320.78214, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "</td>", "bbox": {"l": 183.78624, "t": 314.388, "r": 199.32646, "b": 320.78214, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 201.22015, "t": 314.388, "r": 214.86666999999997, "b": 320.78214, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "<td>", "bbox": {"l": 201.22015, "t": 314.388, "r": 214.86666999999997, "b": 320.78214, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 216.76038, "t": 314.388, "r": 232.30058, "b": 320.78214, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "</td>", "bbox": {"l": 216.76038, "t": 314.388, "r": 232.30058, "b": 320.78214, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 234.19427000000002, "t": 314.388, "r": 247.84079000000003, "b": 320.78214, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "<td>", "bbox": {"l": 234.19427000000002, "t": 314.388, "r": 247.84079000000003, "b": 320.78214, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 249.73447999999996, "t": 314.388, "r": 265.27469, "b": 320.78214, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "</td>", "bbox": {"l": 249.73447999999996, "t": 314.388, "r": 265.27469, "b": 320.78214, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 160.67039, "t": 321.20477, "r": 174.68979, "b": 327.59890999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "</tr>", "bbox": {"l": 160.67039, "t": 321.20477, "r": 174.68979, "b": 327.59890999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 160.67039, "t": 328.02158, "r": 172.79608, "b": 334.41571000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "<tr>", "bbox": {"l": 160.67039, "t": 328.02158, "r": 172.79608, "b": 334.41571000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 168.24603, "t": 334.83835, "r": 373.09091, "b": 341.23248, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "<td rowspan=\u201c3\u201d > </td> <td> </td> <td> </td> <td> </td> <td> </td>", "bbox": {"l": 168.24603, "t": 334.83835, "r": 373.09091, "b": 341.23248, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 160.67039, "t": 341.65512, "r": 174.68979, "b": 348.04926, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "</tr>", "bbox": {"l": 160.67039, "t": 341.65512, "r": 174.68979, "b": 348.04926, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 160.67039, "t": 348.47159, "r": 172.79608, "b": 354.86572, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "<tr>", "bbox": {"l": 160.67039, "t": 348.47159, "r": 172.79608, "b": 354.86572, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 168.24603, "t": 355.28836000000007, "r": 181.89255, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "<td>", "bbox": {"l": 168.24603, "t": 355.28836000000007, "r": 181.89255, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 183.78624, "t": 355.28836000000007, "r": 199.32646, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "</td>", "bbox": {"l": 183.78624, "t": 355.28836000000007, "r": 199.32646, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 201.22015, "t": 355.28836000000007, "r": 214.86666999999997, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "<td>", "bbox": {"l": 201.22015, "t": 355.28836000000007, "r": 214.86666999999997, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 216.76038, "t": 355.28836000000007, "r": 232.30058, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "</td>", "bbox": {"l": 216.76038, "t": 355.28836000000007, "r": 232.30058, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 234.19427000000002, "t": 355.28836000000007, "r": 247.84079000000003, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "<td>", "bbox": {"l": 234.19427000000002, "t": 355.28836000000007, "r": 247.84079000000003, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 249.73447999999996, "t": 355.28836000000007, "r": 265.27469, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "</td>", "bbox": {"l": 249.73447999999996, "t": 355.28836000000007, "r": 265.27469, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 267.1684, "t": 355.28836000000007, "r": 280.81488, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "<td>", "bbox": {"l": 267.1684, "t": 355.28836000000007, "r": 280.81488, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 282.70862, "t": 355.28836000000007, "r": 298.24881, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "</td>", "bbox": {"l": 282.70862, "t": 355.28836000000007, "r": 298.24881, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 160.67039, "t": 362.10516000000007, "r": 174.68979, "b": 368.49929999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "</tr>", "bbox": {"l": 160.67039, "t": 362.10516000000007, "r": 174.68979, "b": 368.49929999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 160.67039, "t": 368.92194, "r": 172.79608, "b": 375.31607, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "<tr>", "bbox": {"l": 160.67039, "t": 368.92194, "r": 172.79608, "b": 375.31607, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 168.24603, "t": 375.73871, "r": 181.89255, "b": 382.13284, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "<td>", "bbox": {"l": 168.24603, "t": 375.73871, "r": 181.89255, "b": 382.13284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 183.78624, "t": 375.73871, "r": 199.32646, "b": 382.13284, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "</td>", "bbox": {"l": 183.78624, "t": 375.73871, "r": 199.32646, "b": 382.13284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 201.22015, "t": 375.73871, "r": 214.86666999999997, "b": 382.13284, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "<td>", "bbox": {"l": 201.22015, "t": 375.73871, "r": 214.86666999999997, "b": 382.13284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 216.76038, "t": 375.73871, "r": 232.30058, "b": 382.13284, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "</td>", "bbox": {"l": 216.76038, "t": 375.73871, "r": 232.30058, "b": 382.13284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 234.19427000000002, "t": 375.73871, "r": 247.84079000000003, "b": 382.13284, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "<td>", "bbox": {"l": 234.19427000000002, "t": 375.73871, "r": 247.84079000000003, "b": 382.13284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 249.73447999999996, "t": 375.73871, "r": 265.27469, "b": 382.13284, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "</td>", "bbox": {"l": 249.73447999999996, "t": 375.73871, "r": 265.27469, "b": 382.13284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 267.1684, "t": 375.73871, "r": 280.81488, "b": 382.13284, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "<td>", "bbox": {"l": 267.1684, "t": 375.73871, "r": 280.81488, "b": 382.13284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 282.70862, "t": 375.73871, "r": 298.24881, "b": 382.13284, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "</td>", "bbox": {"l": 282.70862, "t": 375.73871, "r": 298.24881, "b": 382.13284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 160.67039, "t": 382.55551, "r": 174.68979, "b": 388.94965, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "</tr>", "bbox": {"l": 160.67039, "t": 382.55551, "r": 174.68979, "b": 388.94965, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 153.0947, "t": 389.37228, "r": 177.73259, "b": 395.76642, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "</table>", "bbox": {"l": 153.0947, "t": 389.37228, "r": 177.73259, "b": 395.76642, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 395.06137, "t": 411.33353, "r": 401.62366, "b": 419.85904, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "C", "bbox": {"l": 395.06137, "t": 411.33353, "r": 401.62366, "b": 419.85904, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 407.42249, "t": 411.33353, "r": 412.47598, "b": 419.85904, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "L", "bbox": {"l": 407.42249, "t": 411.33353, "r": 412.47598, "b": 419.85904, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 418.69287, "t": 411.33353, "r": 425.25516, "b": 419.85904, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "U", "bbox": {"l": 418.69287, "t": 411.33353, "r": 425.25516, "b": 419.85904, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 430.5086099999999, "t": 411.33353, "r": 436.5709800000001, "b": 419.85904, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "X", "bbox": {"l": 430.5086099999999, "t": 411.33353, "r": 436.5709800000001, "b": 419.85904, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 152.36208, "t": 409.77362, "r": 175.10626, "b": 416.16776, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "<table>", "bbox": {"l": 152.36208, "t": 409.77362, "r": 175.10626, "b": 416.16776, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 178.89366, "t": 409.77362, "r": 191.01935, "b": 416.16776, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": "<tr>", "bbox": {"l": 178.89366, "t": 409.77362, "r": 191.01935, "b": 416.16776, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 194.80676, "t": 409.77362, "r": 208.82614, "b": 416.16776, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "</tr>", "bbox": {"l": 194.80676, "t": 409.77362, "r": 208.82614, "b": 416.16776, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 212.61354, "t": 409.77362, "r": 226.26003999999998, "b": 416.16776, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "<td>", "bbox": {"l": 212.61354, "t": 409.77362, "r": 226.26003999999998, "b": 416.16776, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 230.04745000000003, "t": 409.77362, "r": 245.58765000000002, "b": 416.16776, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": "</td>", "bbox": {"l": 230.04745000000003, "t": 409.77362, "r": 245.58765000000002, "b": 416.16776, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 249.37506000000002, "t": 409.77362, "r": 259.03918, "b": 416.16776, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 107, "text": "<td", "bbox": {"l": 249.37506000000002, "t": 409.77362, "r": 259.03918, "b": 416.16776, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 262.82797, "t": 409.77362, "r": 298.93646, "b": 416.16776, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 108, "text": "colspan=\"2\"", "bbox": {"l": 262.82797, "t": 409.77362, "r": 298.93646, "b": 416.16776, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 302.72385, "t": 409.77362, "r": 338.83234, "b": 416.16776, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 109, "text": "colspan=\"3\"", "bbox": {"l": 302.72385, "t": 409.77362, "r": 338.83234, "b": 416.16776, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 152.36208, "t": 418.10522, "r": 190.74123, "b": 424.49936, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 110, "text": "rowspan=\"2\"", "bbox": {"l": 152.36208, "t": 418.10522, "r": 190.74123, "b": 424.49936, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 194.52863, "t": 418.10522, "r": 232.90777999999997, "b": 424.49936, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 111, "text": "rowspan=\"3\"", "bbox": {"l": 194.52863, "t": 418.10522, "r": 232.90777999999997, "b": 424.49936, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 236.69518999999997, "t": 418.10522, "r": 240.67617999999996, "b": 424.49936, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 112, "text": ">", "bbox": {"l": 236.69518999999997, "t": 418.10522, "r": 240.67617999999996, "b": 424.49936, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 244.46358, "t": 418.10522, "r": 269.10144, "b": 424.49936, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 113, "text": "</table>", "bbox": {"l": 244.46358, "t": 418.10522, "r": 269.10144, "b": 424.49936, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 154.50595, "t": 258.60095, "r": 159.62473, "b": 265.70556999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 114, "text": "C", "bbox": {"l": 154.50595, "t": 258.60095, "r": 159.62473, "b": 265.70556999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 164.74348, "t": 258.60095, "r": 185.21857, "b": 265.70556999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 115, "text": "HTML", "bbox": {"l": 164.74348, "t": 258.60095, "r": 185.21857, "b": 265.70556999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 164.3548, "t": 266.49707, "r": 222.05352999999997, "b": 273.60168, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 116, "text": "sequence length:", "bbox": {"l": 164.3548, "t": 266.49707, "r": 222.05352999999997, "b": 273.60168, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 224.15326, "t": 266.49707, "r": 232.57729, "b": 273.60168, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 117, "text": "55", "bbox": {"l": 224.15326, "t": 266.49707, "r": 232.57729, "b": 273.60168, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "text", "id": 2, "page_no": 1, "cluster": {"id": 2, "label": "text", "bbox": {"l": 134.765, "t": 452.31378, "r": 480.59232000000003, "b": 520.88669, "coord_origin": "TOPLEFT"}, "confidence": 0.950499951839447, "cells": [{"id": 118, "text": "today,", "bbox": {"l": 134.765, "t": 452.31378, "r": 161.32928, "b": 461.11075, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "table detection", "bbox": {"l": 164.269, "t": 452.31378, "r": 226.28617999999997, "b": 461.11075, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "in documents is a well understood problem, and the latest", "bbox": {"l": 229.992, "t": 452.31378, "r": 480.59232000000003, "b": 461.11075, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "state-of-the-art (SOTA) object detection methods provide an accuracy compa-", "bbox": {"l": 134.76501, "t": 464.26877, "r": 480.59180000000003, "b": 473.06573, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "rable to human observers [7,8,10,14,23]. On the other hand, the problem of table", "bbox": {"l": 134.76501, "t": 476.22375, "r": 480.58673, "b": 485.02072, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "structure recognition (TSR) is a lot more challenging and remains a very active", "bbox": {"l": 134.76501, "t": 488.17975, "r": 480.58658, "b": 496.97672, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "area of research, in which many novel machine learning algorithms are being", "bbox": {"l": 134.76501, "t": 500.13474, "r": 480.58978, "b": 508.9317, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "explored [3,4,5,9,11,12,13,14,17,18,21,22].", "bbox": {"l": 134.76501, "t": 512.0897199999999, "r": 313.24597, "b": 520.88669, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "today, table detection in documents is a well understood problem, and the latest state-of-the-art (SOTA) object detection methods provide an accuracy comparable to human observers [7,8,10,14,23]. On the other hand, the problem of table structure recognition (TSR) is a lot more challenging and remains a very active area of research, in which many novel machine learning algorithms are being explored [3,4,5,9,11,12,13,14,17,18,21,22]."}, {"label": "text", "id": 0, "page_no": 1, "cluster": {"id": 0, "label": "text", "bbox": {"l": 134.76501, "t": 524.55072, "r": 480.59482, "b": 664.8547, "coord_origin": "TOPLEFT"}, "confidence": 0.9845512509346008, "cells": [{"id": 126, "text": "Recently emerging SOTA methods for table structure recognition employ", "bbox": {"l": 149.70901, "t": 524.55072, "r": 480.58884000000006, "b": 533.3476900000001, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "transformer-based models, in which an image of the table is provided to the net-", "bbox": {"l": 134.76501, "t": 536.50671, "r": 480.5917400000001, "b": 545.30368, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "work in order to predict the structure of the table as a sequence of tokens. These", "bbox": {"l": 134.76501, "t": 548.46172, "r": 480.58868, "b": 557.25868, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "image-to-sequence (Im2Seq) models are extremely powerful, since they allow for", "bbox": {"l": 134.76501, "t": 560.41672, "r": 480.58795, "b": 569.2136800000001, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "a purely data-driven solution. The tokens of the sequence typically belong to a", "bbox": {"l": 134.76501, "t": 572.37172, "r": 480.58978, "b": 581.16869, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "markup language such as HTML, Latex or Markdown, which allow to describe", "bbox": {"l": 134.76501, "t": 584.32672, "r": 480.59479, "b": 593.12369, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "table structure as rows, columns and spanning cells in various configurations.", "bbox": {"l": 134.76501, "t": 596.28271, "r": 480.58678999999995, "b": 605.0796799999999, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "In Figure 1, we illustrate how HTML is used to represent the table-structure", "bbox": {"l": 134.76501, "t": 608.23772, "r": 480.59476, "b": 617.03468, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "of a particular example table. Public table-structure data sets such as PubTab-", "bbox": {"l": 134.76501, "t": 620.19272, "r": 480.5938100000001, "b": 628.98969, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "Net [22], and FinTabNet [21], which were created in a semi-automated way from", "bbox": {"l": 134.76501, "t": 632.1477199999999, "r": 480.59482, "b": 640.94469, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "paired PDF and HTML sources (e.g. PubMed Central), popularized primarily", "bbox": {"l": 134.76501, "t": 644.10272, "r": 480.58771, "b": 652.89969, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "the use of HTML as ground-truth representation format for TSR.", "bbox": {"l": 134.76501, "t": 656.05772, "r": 421.45377, "b": 664.8547, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Recently emerging SOTA methods for table structure recognition employ transformer-based models, in which an image of the table is provided to the network in order to predict the structure of the table as a sequence of tokens. These image-to-sequence (Im2Seq) models are extremely powerful, since they allow for a purely data-driven solution. The tokens of the sequence typically belong to a markup language such as HTML, Latex or Markdown, which allow to describe table structure as rows, columns and spanning cells in various configurations. In Figure 1, we illustrate how HTML is used to represent the table-structure of a particular example table. Public table-structure data sets such as PubTabNet [22], and FinTabNet [21], which were created in a semi-automated way from paired PDF and HTML sources (e.g. PubMed Central), popularized primarily the use of HTML as ground-truth representation format for TSR."}], "body": [{"label": "caption", "id": 4, "page_no": 1, "cluster": {"id": 4, "label": "caption", "bbox": {"l": 134.765, "t": 126.33416999999997, "r": 480.59189, "b": 200.22058000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.8939083218574524, "cells": [{"id": 3, "text": "Fig. 1.", "bbox": {"l": 134.765, "t": 126.33416999999997, "r": 162.64424, "b": 134.26049999999998, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Comparison between HTML and OTSL table structure representation: (A)", "bbox": {"l": 167.062, "t": 126.39697000000001, "r": 480.59106, "b": 134.46667000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "table-example with complex row and column headers, including a 2D empty span,", "bbox": {"l": 134.765, "t": 137.35595999999998, "r": 480.59018, "b": 145.42566, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "(B)", "bbox": {"l": 134.765, "t": 148.31493999999998, "r": 147.95433, "b": 156.38464, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "minimal graphical representation of table structure using rectangular layout, (C)", "bbox": {"l": 152.39224, "t": 148.31493999999998, "r": 480.59096999999997, "b": 156.38464, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "HTML representation, (D) OTSL representation. This example demonstrates many of", "bbox": {"l": 134.765, "t": 159.27392999999995, "r": 480.59189, "b": 167.34362999999996, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "the key-features of OTSL, namely its reduced vocabulary size (12 versus 5 in this case),", "bbox": {"l": 134.765, "t": 170.23290999999995, "r": 480.58914000000004, "b": 178.30260999999996, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "its reduced sequence length (55 versus 30) and a enhanced internal structure (variable", "bbox": {"l": 134.765, "t": 181.19188999999994, "r": 480.59020999999996, "b": 189.26160000000004, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "token sequence length per row in HTML versus a fixed length of rows in OTSL).", "bbox": {"l": 134.765, "t": 192.15088000000003, "r": 460.87109, "b": 200.22058000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Fig. 1. Comparison between HTML and OTSL table structure representation: (A) table-example with complex row and column headers, including a 2D empty span, (B) minimal graphical representation of table structure using rectangular layout, (C) HTML representation, (D) OTSL representation. This example demonstrates many of the key-features of OTSL, namely its reduced vocabulary size (12 versus 5 in this case), its reduced sequence length (55 versus 30) and a enhanced internal structure (variable token sequence length per row in HTML versus a fixed length of rows in OTSL)."}, {"label": "picture", "id": 1, "page_no": 1, "cluster": {"id": 1, "label": "picture", "bbox": {"l": 148.45364379882812, "t": 208.37423706054688, "r": 464.3608093261719, "b": 425.8462219238281, "coord_origin": "TOPLEFT"}, "confidence": 0.9688959121704102, "cells": [{"id": 12, "text": "C", "bbox": {"l": 396.41107, "t": 280.98352, "r": 402.97336, "b": 289.50903, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "C", "bbox": {"l": 418.58682, "t": 280.89792, "r": 425.14911, "b": 289.42343, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "C", "bbox": {"l": 395.74835, "t": 303.23727, "r": 402.31064, "b": 311.76279, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "C", "bbox": {"l": 407.54214, "t": 303.36981, "r": 414.10443, "b": 311.89532, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "C", "bbox": {"l": 407.56335, "t": 314.40619, "r": 414.12564, "b": 322.9317, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "C", "bbox": {"l": 418.51108, "t": 292.08502000000004, "r": 425.07336, "b": 300.61053000000004, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "C", "bbox": {"l": 429.59744, "t": 292.09106, "r": 436.1597300000001, "b": 300.61658, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "C", "bbox": {"l": 440.68759000000006, "t": 292.01230000000004, "r": 447.24987999999996, "b": 300.53781000000004, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "C", "bbox": {"l": 418.6232, "t": 303.29483, "r": 425.18549, "b": 311.82034, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "C", "bbox": {"l": 429.7095299999999, "t": 303.30011, "r": 436.27182, "b": 311.82562, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "C", "bbox": {"l": 440.7996800000001, "t": 303.22211, "r": 447.36197, "b": 311.74762, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "C", "bbox": {"l": 418.62546, "t": 314.56903, "r": 425.18774, "b": 323.09454, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "C", "bbox": {"l": 429.71181999999993, "t": 314.57434, "r": 436.27411, "b": 323.09985, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "C", "bbox": {"l": 440.80194, "t": 314.49631, "r": 447.36423, "b": 323.02182, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "C", "bbox": {"l": 407.39746, "t": 325.29031, "r": 413.95975, "b": 333.81583, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "C", "bbox": {"l": 418.45959, "t": 325.45316, "r": 425.02188, "b": 333.97867, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "C", "bbox": {"l": 429.54593, "t": 325.4592, "r": 436.10822, "b": 333.98471, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "C", "bbox": {"l": 440.63608, "t": 325.38043, "r": 447.19836, "b": 333.90594, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "NL", "bbox": {"l": 451.89511000000005, "t": 280.15717, "r": 463.51273000000003, "b": 288.68268, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "NL", "bbox": {"l": 452.1557, "t": 291.59875000000005, "r": 463.77332, "b": 300.12427, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "NL", "bbox": {"l": 452.17688000000004, "t": 302.84265, "r": 463.79449000000005, "b": 311.36816, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "NL", "bbox": {"l": 452.09887999999995, "t": 314.12441999999993, "r": 463.71648999999996, "b": 322.6499299999999, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "NL", "bbox": {"l": 452.29733, "t": 325.46906, "r": 463.91495, "b": 333.99457, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "U", "bbox": {"l": 396.09677, "t": 314.49478, "r": 402.65906, "b": 323.02029000000005, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "U", "bbox": {"l": 395.99829, "t": 325.38876000000005, "r": 402.56058, "b": 333.91428, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "U", "bbox": {"l": 396.27475, "t": 292.27057, "r": 402.83704, "b": 300.79608, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "L", "bbox": {"l": 408.54724, "t": 280.96912, "r": 413.60074, "b": 289.49463, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "L", "bbox": {"l": 430.58966, "t": 280.49725, "r": 435.6431600000001, "b": 289.02277, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "L", "bbox": {"l": 441.08069, "t": 280.38062, "r": 446.13419, "b": 288.90613, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "X", "bbox": {"l": 407.97388, "t": 292.13425, "r": 414.03625, "b": 300.65976, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "NL", "bbox": {"l": 441.25640999999996, "t": 411.1807600000001, "r": 452.87402, "b": 419.7062700000001, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "vocabulary:", "bbox": {"l": 393.75256, "t": 399.7947700000001, "r": 432.48929, "b": 406.89935, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "5", "bbox": {"l": 434.5896000000001, "t": 399.7947700000001, "r": 438.80083999999994, "b": 406.89935, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "tokens", "bbox": {"l": 440.90573, "t": 399.7947700000001, "r": 463.22235, "b": 406.89935, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "D OTSL", "bbox": {"l": 384.11816, "t": 258.54718, "r": 413.99307, "b": 265.65179, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "sequence length:", "bbox": {"l": 393.75256, "t": 266.67505000000006, "r": 451.45129000000003, "b": 273.77966000000004, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "30", "bbox": {"l": 453.55083999999994, "t": 266.67505000000006, "r": 461.97485, "b": 273.77966000000004, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "vocabulary for this table:", "bbox": {"l": 151.79318, "t": 399.76016, "r": 233.89371000000003, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "12", "bbox": {"l": 235.99332, "t": 399.76016, "r": 244.41734000000002, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "tokens", "bbox": {"l": 246.52222, "t": 399.76016, "r": 268.83884, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "A", "bbox": {"l": 154.3298, "t": 213.57457999999997, "r": 159.79837, "b": 220.67920000000004, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "B", "bbox": {"l": 321.07053, "t": 213.57457999999997, "r": 326.53909, "b": 220.67920000000004, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "<table>", "bbox": {"l": 153.0947, "t": 280.30411, "r": 175.83888, "b": 286.69824, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "<tr>", "bbox": {"l": 160.67039, "t": 287.12088, "r": 172.79608, "b": 293.51501, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "<td", "bbox": {"l": 168.24603, "t": 293.93765, "r": 177.91019, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "colspan=\u201c2\u201d", "bbox": {"l": 179.80525, "t": 293.93765, "r": 215.61517, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "rowspan=\u201c2\u201d", "bbox": {"l": 217.50886999999997, "t": 293.93765, "r": 255.58945, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": ">", "bbox": {"l": 257.48315, "t": 293.93765, "r": 261.46414, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "</td>", "bbox": {"l": 263.35785, "t": 293.93765, "r": 278.89804, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "<td", "bbox": {"l": 280.79175, "t": 293.93765, "r": 290.4559, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "colspan=\u201c3\u201d", "bbox": {"l": 292.35095, "t": 293.93765, "r": 328.16083, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": ">", "bbox": {"l": 330.05457, "t": 293.93765, "r": 334.03555, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "</td>", "bbox": {"l": 335.92926, "t": 293.93765, "r": 351.46945, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "</tr>", "bbox": {"l": 160.67039, "t": 300.75442999999996, "r": 174.68979, "b": 307.14856, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "<tr>", "bbox": {"l": 160.67039, "t": 307.57122999999996, "r": 172.79608, "b": 313.96536, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "<td>", "bbox": {"l": 168.24603, "t": 314.388, "r": 181.89255, "b": 320.78214, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "</td>", "bbox": {"l": 183.78624, "t": 314.388, "r": 199.32646, "b": 320.78214, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "<td>", "bbox": {"l": 201.22015, "t": 314.388, "r": 214.86666999999997, "b": 320.78214, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "</td>", "bbox": {"l": 216.76038, "t": 314.388, "r": 232.30058, "b": 320.78214, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "<td>", "bbox": {"l": 234.19427000000002, "t": 314.388, "r": 247.84079000000003, "b": 320.78214, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "</td>", "bbox": {"l": 249.73447999999996, "t": 314.388, "r": 265.27469, "b": 320.78214, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "</tr>", "bbox": {"l": 160.67039, "t": 321.20477, "r": 174.68979, "b": 327.59890999999993, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "<tr>", "bbox": {"l": 160.67039, "t": 328.02158, "r": 172.79608, "b": 334.41571000000005, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "<td rowspan=\u201c3\u201d > </td> <td> </td> <td> </td> <td> </td> <td> </td>", "bbox": {"l": 168.24603, "t": 334.83835, "r": 373.09091, "b": 341.23248, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "</tr>", "bbox": {"l": 160.67039, "t": 341.65512, "r": 174.68979, "b": 348.04926, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "<tr>", "bbox": {"l": 160.67039, "t": 348.47159, "r": 172.79608, "b": 354.86572, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "<td>", "bbox": {"l": 168.24603, "t": 355.28836000000007, "r": 181.89255, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "</td>", "bbox": {"l": 183.78624, "t": 355.28836000000007, "r": 199.32646, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "<td>", "bbox": {"l": 201.22015, "t": 355.28836000000007, "r": 214.86666999999997, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "</td>", "bbox": {"l": 216.76038, "t": 355.28836000000007, "r": 232.30058, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "<td>", "bbox": {"l": 234.19427000000002, "t": 355.28836000000007, "r": 247.84079000000003, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "</td>", "bbox": {"l": 249.73447999999996, "t": 355.28836000000007, "r": 265.27469, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "<td>", "bbox": {"l": 267.1684, "t": 355.28836000000007, "r": 280.81488, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "</td>", "bbox": {"l": 282.70862, "t": 355.28836000000007, "r": 298.24881, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "</tr>", "bbox": {"l": 160.67039, "t": 362.10516000000007, "r": 174.68979, "b": 368.49929999999995, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "<tr>", "bbox": {"l": 160.67039, "t": 368.92194, "r": 172.79608, "b": 375.31607, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "<td>", "bbox": {"l": 168.24603, "t": 375.73871, "r": 181.89255, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "</td>", "bbox": {"l": 183.78624, "t": 375.73871, "r": 199.32646, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "<td>", "bbox": {"l": 201.22015, "t": 375.73871, "r": 214.86666999999997, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "</td>", "bbox": {"l": 216.76038, "t": 375.73871, "r": 232.30058, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "<td>", "bbox": {"l": 234.19427000000002, "t": 375.73871, "r": 247.84079000000003, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "</td>", "bbox": {"l": 249.73447999999996, "t": 375.73871, "r": 265.27469, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "<td>", "bbox": {"l": 267.1684, "t": 375.73871, "r": 280.81488, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "</td>", "bbox": {"l": 282.70862, "t": 375.73871, "r": 298.24881, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "</tr>", "bbox": {"l": 160.67039, "t": 382.55551, "r": 174.68979, "b": 388.94965, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "</table>", "bbox": {"l": 153.0947, "t": 389.37228, "r": 177.73259, "b": 395.76642, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "C", "bbox": {"l": 395.06137, "t": 411.33353, "r": 401.62366, "b": 419.85904, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "L", "bbox": {"l": 407.42249, "t": 411.33353, "r": 412.47598, "b": 419.85904, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "U", "bbox": {"l": 418.69287, "t": 411.33353, "r": 425.25516, "b": 419.85904, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "X", "bbox": {"l": 430.5086099999999, "t": 411.33353, "r": 436.5709800000001, "b": 419.85904, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "<table>", "bbox": {"l": 152.36208, "t": 409.77362, "r": 175.10626, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "<tr>", "bbox": {"l": 178.89366, "t": 409.77362, "r": 191.01935, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "</tr>", "bbox": {"l": 194.80676, "t": 409.77362, "r": 208.82614, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "<td>", "bbox": {"l": 212.61354, "t": 409.77362, "r": 226.26003999999998, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "</td>", "bbox": {"l": 230.04745000000003, "t": 409.77362, "r": 245.58765000000002, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "<td", "bbox": {"l": 249.37506000000002, "t": 409.77362, "r": 259.03918, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "colspan=\"2\"", "bbox": {"l": 262.82797, "t": 409.77362, "r": 298.93646, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "colspan=\"3\"", "bbox": {"l": 302.72385, "t": 409.77362, "r": 338.83234, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "rowspan=\"2\"", "bbox": {"l": 152.36208, "t": 418.10522, "r": 190.74123, "b": 424.49936, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "rowspan=\"3\"", "bbox": {"l": 194.52863, "t": 418.10522, "r": 232.90777999999997, "b": 424.49936, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": ">", "bbox": {"l": 236.69518999999997, "t": 418.10522, "r": 240.67617999999996, "b": 424.49936, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "</table>", "bbox": {"l": 244.46358, "t": 418.10522, "r": 269.10144, "b": 424.49936, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "C", "bbox": {"l": 154.50595, "t": 258.60095, "r": 159.62473, "b": 265.70556999999997, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "HTML", "bbox": {"l": 164.74348, "t": 258.60095, "r": 185.21857, "b": 265.70556999999997, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "sequence length:", "bbox": {"l": 164.3548, "t": 266.49707, "r": 222.05352999999997, "b": 273.60168, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "55", "bbox": {"l": 224.15326, "t": 266.49707, "r": 232.57729, "b": 273.60168, "coord_origin": "TOPLEFT"}}], "children": [{"id": 6, "label": "text", "bbox": {"l": 396.41107, "t": 280.98352, "r": 402.97336, "b": 289.50903, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "C", "bbox": {"l": 396.41107, "t": 280.98352, "r": 402.97336, "b": 289.50903, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "text", "bbox": {"l": 418.58682, "t": 280.89792, "r": 425.14911, "b": 289.42343, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "C", "bbox": {"l": 418.58682, "t": 280.89792, "r": 425.14911, "b": 289.42343, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "text", "bbox": {"l": 395.74835, "t": 303.23727, "r": 402.31064, "b": 311.76279, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "C", "bbox": {"l": 395.74835, "t": 303.23727, "r": 402.31064, "b": 311.76279, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 407.54214, "t": 303.36981, "r": 414.10443, "b": 311.89532, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "C", "bbox": {"l": 407.54214, "t": 303.36981, "r": 414.10443, "b": 311.89532, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "text", "bbox": {"l": 407.56335, "t": 314.40619, "r": 414.12564, "b": 322.9317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "C", "bbox": {"l": 407.56335, "t": 314.40619, "r": 414.12564, "b": 322.9317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 418.51108, "t": 292.08502000000004, "r": 425.07336, "b": 300.61053000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "C", "bbox": {"l": 418.51108, "t": 292.08502000000004, "r": 425.07336, "b": 300.61053000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 429.59744, "t": 292.09106, "r": 436.1597300000001, "b": 300.61658, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "C", "bbox": {"l": 429.59744, "t": 292.09106, "r": 436.1597300000001, "b": 300.61658, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 440.68759000000006, "t": 292.01230000000004, "r": 447.24987999999996, "b": 300.53781000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "C", "bbox": {"l": 440.68759000000006, "t": 292.01230000000004, "r": 447.24987999999996, "b": 300.53781000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 418.6232, "t": 303.29483, "r": 425.18549, "b": 311.82034, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "C", "bbox": {"l": 418.6232, "t": 303.29483, "r": 425.18549, "b": 311.82034, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 429.7095299999999, "t": 303.30011, "r": 436.27182, "b": 311.82562, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "C", "bbox": {"l": 429.7095299999999, "t": 303.30011, "r": 436.27182, "b": 311.82562, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 440.7996800000001, "t": 303.22211, "r": 447.36197, "b": 311.74762, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "C", "bbox": {"l": 440.7996800000001, "t": 303.22211, "r": 447.36197, "b": 311.74762, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 418.62546, "t": 314.56903, "r": 425.18774, "b": 323.09454, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "C", "bbox": {"l": 418.62546, "t": 314.56903, "r": 425.18774, "b": 323.09454, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 429.71181999999993, "t": 314.57434, "r": 436.27411, "b": 323.09985, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "C", "bbox": {"l": 429.71181999999993, "t": 314.57434, "r": 436.27411, "b": 323.09985, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 440.80194, "t": 314.49631, "r": 447.36423, "b": 323.02182, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "C", "bbox": {"l": 440.80194, "t": 314.49631, "r": 447.36423, "b": 323.02182, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 407.39746, "t": 325.29031, "r": 413.95975, "b": 333.81583, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "C", "bbox": {"l": 407.39746, "t": 325.29031, "r": 413.95975, "b": 333.81583, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 418.45959, "t": 325.45316, "r": 425.02188, "b": 333.97867, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "C", "bbox": {"l": 418.45959, "t": 325.45316, "r": 425.02188, "b": 333.97867, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 429.54593, "t": 325.4592, "r": 436.10822, "b": 333.98471, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "C", "bbox": {"l": 429.54593, "t": 325.4592, "r": 436.10822, "b": 333.98471, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 440.63608, "t": 325.38043, "r": 447.19836, "b": 333.90594, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "C", "bbox": {"l": 440.63608, "t": 325.38043, "r": 447.19836, "b": 333.90594, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 451.89511000000005, "t": 280.15717, "r": 463.51273000000003, "b": 288.68268, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "NL", "bbox": {"l": 451.89511000000005, "t": 280.15717, "r": 463.51273000000003, "b": 288.68268, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 452.1557, "t": 291.59875000000005, "r": 463.77332, "b": 300.12427, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "NL", "bbox": {"l": 452.1557, "t": 291.59875000000005, "r": 463.77332, "b": 300.12427, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 452.17688000000004, "t": 302.84265, "r": 463.79449000000005, "b": 311.36816, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "NL", "bbox": {"l": 452.17688000000004, "t": 302.84265, "r": 463.79449000000005, "b": 311.36816, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 452.09887999999995, "t": 314.12441999999993, "r": 463.71648999999996, "b": 322.6499299999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "NL", "bbox": {"l": 452.09887999999995, "t": 314.12441999999993, "r": 463.71648999999996, "b": 322.6499299999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 452.29733, "t": 325.46906, "r": 463.91495, "b": 333.99457, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "NL", "bbox": {"l": 452.29733, "t": 325.46906, "r": 463.91495, "b": 333.99457, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 396.09677, "t": 314.49478, "r": 402.65906, "b": 323.02029000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "U", "bbox": {"l": 396.09677, "t": 314.49478, "r": 402.65906, "b": 323.02029000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 395.99829, "t": 325.38876000000005, "r": 402.56058, "b": 333.91428, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "U", "bbox": {"l": 395.99829, "t": 325.38876000000005, "r": 402.56058, "b": 333.91428, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 396.27475, "t": 292.27057, "r": 402.83704, "b": 300.79608, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "U", "bbox": {"l": 396.27475, "t": 292.27057, "r": 402.83704, "b": 300.79608, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 408.54724, "t": 280.96912, "r": 413.60074, "b": 289.49463, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "L", "bbox": {"l": 408.54724, "t": 280.96912, "r": 413.60074, "b": 289.49463, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 430.58966, "t": 280.49725, "r": 435.6431600000001, "b": 289.02277, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "L", "bbox": {"l": 430.58966, "t": 280.49725, "r": 435.6431600000001, "b": 289.02277, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 441.08069, "t": 280.38062, "r": 446.13419, "b": 288.90613, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "L", "bbox": {"l": 441.08069, "t": 280.38062, "r": 446.13419, "b": 288.90613, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 407.97388, "t": 292.13425, "r": 414.03625, "b": 300.65976, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "X", "bbox": {"l": 407.97388, "t": 292.13425, "r": 414.03625, "b": 300.65976, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 441.25640999999996, "t": 411.1807600000001, "r": 452.87402, "b": 419.7062700000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "NL", "bbox": {"l": 441.25640999999996, "t": 411.1807600000001, "r": 452.87402, "b": 419.7062700000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 393.75256, "t": 399.7947700000001, "r": 432.48929, "b": 406.89935, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "vocabulary:", "bbox": {"l": 393.75256, "t": 399.7947700000001, "r": 432.48929, "b": 406.89935, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 434.5896000000001, "t": 399.7947700000001, "r": 438.80083999999994, "b": 406.89935, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "5", "bbox": {"l": 434.5896000000001, "t": 399.7947700000001, "r": 438.80083999999994, "b": 406.89935, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 440.90573, "t": 399.7947700000001, "r": 463.22235, "b": 406.89935, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "tokens", "bbox": {"l": 440.90573, "t": 399.7947700000001, "r": 463.22235, "b": 406.89935, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 384.11816, "t": 258.54718, "r": 413.99307, "b": 265.65179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "D OTSL", "bbox": {"l": 384.11816, "t": 258.54718, "r": 413.99307, "b": 265.65179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 393.75256, "t": 266.67505000000006, "r": 451.45129000000003, "b": 273.77966000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "sequence length:", "bbox": {"l": 393.75256, "t": 266.67505000000006, "r": 451.45129000000003, "b": 273.77966000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 453.55083999999994, "t": 266.67505000000006, "r": 461.97485, "b": 273.77966000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "30", "bbox": {"l": 453.55083999999994, "t": 266.67505000000006, "r": 461.97485, "b": 273.77966000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 151.79318, "t": 399.76016, "r": 233.89371000000003, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "vocabulary for this table:", "bbox": {"l": 151.79318, "t": 399.76016, "r": 233.89371000000003, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 235.99332, "t": 399.76016, "r": 244.41734000000002, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "12", "bbox": {"l": 235.99332, "t": 399.76016, "r": 244.41734000000002, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 246.52222, "t": 399.76016, "r": 268.83884, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "tokens", "bbox": {"l": 246.52222, "t": 399.76016, "r": 268.83884, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 154.3298, "t": 213.57457999999997, "r": 159.79837, "b": 220.67920000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "A", "bbox": {"l": 154.3298, "t": 213.57457999999997, "r": 159.79837, "b": 220.67920000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 321.07053, "t": 213.57457999999997, "r": 326.53909, "b": 220.67920000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "B", "bbox": {"l": 321.07053, "t": 213.57457999999997, "r": 326.53909, "b": 220.67920000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 153.0947, "t": 280.30411, "r": 175.83888, "b": 286.69824, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "<table>", "bbox": {"l": 153.0947, "t": 280.30411, "r": 175.83888, "b": 286.69824, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 160.67039, "t": 287.12088, "r": 172.79608, "b": 293.51501, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "<tr>", "bbox": {"l": 160.67039, "t": 287.12088, "r": 172.79608, "b": 293.51501, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 168.24603, "t": 293.93765, "r": 177.91019, "b": 300.33179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "<td", "bbox": {"l": 168.24603, "t": 293.93765, "r": 177.91019, "b": 300.33179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 179.80525, "t": 293.93765, "r": 215.61517, "b": 300.33179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "colspan=\u201c2\u201d", "bbox": {"l": 179.80525, "t": 293.93765, "r": 215.61517, "b": 300.33179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 217.50886999999997, "t": 293.93765, "r": 255.58945, "b": 300.33179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "rowspan=\u201c2\u201d", "bbox": {"l": 217.50886999999997, "t": 293.93765, "r": 255.58945, "b": 300.33179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 257.48315, "t": 293.93765, "r": 261.46414, "b": 300.33179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": ">", "bbox": {"l": 257.48315, "t": 293.93765, "r": 261.46414, "b": 300.33179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 263.35785, "t": 293.93765, "r": 278.89804, "b": 300.33179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "</td>", "bbox": {"l": 263.35785, "t": 293.93765, "r": 278.89804, "b": 300.33179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 280.79175, "t": 293.93765, "r": 290.4559, "b": 300.33179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "<td", "bbox": {"l": 280.79175, "t": 293.93765, "r": 290.4559, "b": 300.33179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 292.35095, "t": 293.93765, "r": 328.16083, "b": 300.33179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "colspan=\u201c3\u201d", "bbox": {"l": 292.35095, "t": 293.93765, "r": 328.16083, "b": 300.33179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 330.05457, "t": 293.93765, "r": 334.03555, "b": 300.33179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": ">", "bbox": {"l": 330.05457, "t": 293.93765, "r": 334.03555, "b": 300.33179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 335.92926, "t": 293.93765, "r": 351.46945, "b": 300.33179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "</td>", "bbox": {"l": 335.92926, "t": 293.93765, "r": 351.46945, "b": 300.33179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 160.67039, "t": 300.75442999999996, "r": 174.68979, "b": 307.14856, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "</tr>", "bbox": {"l": 160.67039, "t": 300.75442999999996, "r": 174.68979, "b": 307.14856, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 160.67039, "t": 307.57122999999996, "r": 172.79608, "b": 313.96536, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "<tr>", "bbox": {"l": 160.67039, "t": 307.57122999999996, "r": 172.79608, "b": 313.96536, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 168.24603, "t": 314.388, "r": 181.89255, "b": 320.78214, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "<td>", "bbox": {"l": 168.24603, "t": 314.388, "r": 181.89255, "b": 320.78214, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 183.78624, "t": 314.388, "r": 199.32646, "b": 320.78214, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "</td>", "bbox": {"l": 183.78624, "t": 314.388, "r": 199.32646, "b": 320.78214, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 201.22015, "t": 314.388, "r": 214.86666999999997, "b": 320.78214, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "<td>", "bbox": {"l": 201.22015, "t": 314.388, "r": 214.86666999999997, "b": 320.78214, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 216.76038, "t": 314.388, "r": 232.30058, "b": 320.78214, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "</td>", "bbox": {"l": 216.76038, "t": 314.388, "r": 232.30058, "b": 320.78214, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 234.19427000000002, "t": 314.388, "r": 247.84079000000003, "b": 320.78214, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "<td>", "bbox": {"l": 234.19427000000002, "t": 314.388, "r": 247.84079000000003, "b": 320.78214, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 249.73447999999996, "t": 314.388, "r": 265.27469, "b": 320.78214, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "</td>", "bbox": {"l": 249.73447999999996, "t": 314.388, "r": 265.27469, "b": 320.78214, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 160.67039, "t": 321.20477, "r": 174.68979, "b": 327.59890999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "</tr>", "bbox": {"l": 160.67039, "t": 321.20477, "r": 174.68979, "b": 327.59890999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 160.67039, "t": 328.02158, "r": 172.79608, "b": 334.41571000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "<tr>", "bbox": {"l": 160.67039, "t": 328.02158, "r": 172.79608, "b": 334.41571000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 168.24603, "t": 334.83835, "r": 373.09091, "b": 341.23248, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "<td rowspan=\u201c3\u201d > </td> <td> </td> <td> </td> <td> </td> <td> </td>", "bbox": {"l": 168.24603, "t": 334.83835, "r": 373.09091, "b": 341.23248, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 160.67039, "t": 341.65512, "r": 174.68979, "b": 348.04926, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "</tr>", "bbox": {"l": 160.67039, "t": 341.65512, "r": 174.68979, "b": 348.04926, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 160.67039, "t": 348.47159, "r": 172.79608, "b": 354.86572, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "<tr>", "bbox": {"l": 160.67039, "t": 348.47159, "r": 172.79608, "b": 354.86572, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 168.24603, "t": 355.28836000000007, "r": 181.89255, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "<td>", "bbox": {"l": 168.24603, "t": 355.28836000000007, "r": 181.89255, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 183.78624, "t": 355.28836000000007, "r": 199.32646, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "</td>", "bbox": {"l": 183.78624, "t": 355.28836000000007, "r": 199.32646, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 201.22015, "t": 355.28836000000007, "r": 214.86666999999997, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "<td>", "bbox": {"l": 201.22015, "t": 355.28836000000007, "r": 214.86666999999997, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 216.76038, "t": 355.28836000000007, "r": 232.30058, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "</td>", "bbox": {"l": 216.76038, "t": 355.28836000000007, "r": 232.30058, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 234.19427000000002, "t": 355.28836000000007, "r": 247.84079000000003, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "<td>", "bbox": {"l": 234.19427000000002, "t": 355.28836000000007, "r": 247.84079000000003, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 249.73447999999996, "t": 355.28836000000007, "r": 265.27469, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "</td>", "bbox": {"l": 249.73447999999996, "t": 355.28836000000007, "r": 265.27469, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 267.1684, "t": 355.28836000000007, "r": 280.81488, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "<td>", "bbox": {"l": 267.1684, "t": 355.28836000000007, "r": 280.81488, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 282.70862, "t": 355.28836000000007, "r": 298.24881, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "</td>", "bbox": {"l": 282.70862, "t": 355.28836000000007, "r": 298.24881, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 160.67039, "t": 362.10516000000007, "r": 174.68979, "b": 368.49929999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "</tr>", "bbox": {"l": 160.67039, "t": 362.10516000000007, "r": 174.68979, "b": 368.49929999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 160.67039, "t": 368.92194, "r": 172.79608, "b": 375.31607, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "<tr>", "bbox": {"l": 160.67039, "t": 368.92194, "r": 172.79608, "b": 375.31607, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 168.24603, "t": 375.73871, "r": 181.89255, "b": 382.13284, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "<td>", "bbox": {"l": 168.24603, "t": 375.73871, "r": 181.89255, "b": 382.13284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 183.78624, "t": 375.73871, "r": 199.32646, "b": 382.13284, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "</td>", "bbox": {"l": 183.78624, "t": 375.73871, "r": 199.32646, "b": 382.13284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 201.22015, "t": 375.73871, "r": 214.86666999999997, "b": 382.13284, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "<td>", "bbox": {"l": 201.22015, "t": 375.73871, "r": 214.86666999999997, "b": 382.13284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 216.76038, "t": 375.73871, "r": 232.30058, "b": 382.13284, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "</td>", "bbox": {"l": 216.76038, "t": 375.73871, "r": 232.30058, "b": 382.13284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 234.19427000000002, "t": 375.73871, "r": 247.84079000000003, "b": 382.13284, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "<td>", "bbox": {"l": 234.19427000000002, "t": 375.73871, "r": 247.84079000000003, "b": 382.13284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 249.73447999999996, "t": 375.73871, "r": 265.27469, "b": 382.13284, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "</td>", "bbox": {"l": 249.73447999999996, "t": 375.73871, "r": 265.27469, "b": 382.13284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 267.1684, "t": 375.73871, "r": 280.81488, "b": 382.13284, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "<td>", "bbox": {"l": 267.1684, "t": 375.73871, "r": 280.81488, "b": 382.13284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 282.70862, "t": 375.73871, "r": 298.24881, "b": 382.13284, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "</td>", "bbox": {"l": 282.70862, "t": 375.73871, "r": 298.24881, "b": 382.13284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 160.67039, "t": 382.55551, "r": 174.68979, "b": 388.94965, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "</tr>", "bbox": {"l": 160.67039, "t": 382.55551, "r": 174.68979, "b": 388.94965, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 153.0947, "t": 389.37228, "r": 177.73259, "b": 395.76642, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "</table>", "bbox": {"l": 153.0947, "t": 389.37228, "r": 177.73259, "b": 395.76642, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 395.06137, "t": 411.33353, "r": 401.62366, "b": 419.85904, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "C", "bbox": {"l": 395.06137, "t": 411.33353, "r": 401.62366, "b": 419.85904, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 407.42249, "t": 411.33353, "r": 412.47598, "b": 419.85904, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "L", "bbox": {"l": 407.42249, "t": 411.33353, "r": 412.47598, "b": 419.85904, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 418.69287, "t": 411.33353, "r": 425.25516, "b": 419.85904, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "U", "bbox": {"l": 418.69287, "t": 411.33353, "r": 425.25516, "b": 419.85904, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 430.5086099999999, "t": 411.33353, "r": 436.5709800000001, "b": 419.85904, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "X", "bbox": {"l": 430.5086099999999, "t": 411.33353, "r": 436.5709800000001, "b": 419.85904, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 152.36208, "t": 409.77362, "r": 175.10626, "b": 416.16776, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "<table>", "bbox": {"l": 152.36208, "t": 409.77362, "r": 175.10626, "b": 416.16776, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 178.89366, "t": 409.77362, "r": 191.01935, "b": 416.16776, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": "<tr>", "bbox": {"l": 178.89366, "t": 409.77362, "r": 191.01935, "b": 416.16776, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 194.80676, "t": 409.77362, "r": 208.82614, "b": 416.16776, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "</tr>", "bbox": {"l": 194.80676, "t": 409.77362, "r": 208.82614, "b": 416.16776, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 212.61354, "t": 409.77362, "r": 226.26003999999998, "b": 416.16776, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "<td>", "bbox": {"l": 212.61354, "t": 409.77362, "r": 226.26003999999998, "b": 416.16776, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 230.04745000000003, "t": 409.77362, "r": 245.58765000000002, "b": 416.16776, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": "</td>", "bbox": {"l": 230.04745000000003, "t": 409.77362, "r": 245.58765000000002, "b": 416.16776, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 249.37506000000002, "t": 409.77362, "r": 259.03918, "b": 416.16776, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 107, "text": "<td", "bbox": {"l": 249.37506000000002, "t": 409.77362, "r": 259.03918, "b": 416.16776, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 262.82797, "t": 409.77362, "r": 298.93646, "b": 416.16776, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 108, "text": "colspan=\"2\"", "bbox": {"l": 262.82797, "t": 409.77362, "r": 298.93646, "b": 416.16776, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 302.72385, "t": 409.77362, "r": 338.83234, "b": 416.16776, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 109, "text": "colspan=\"3\"", "bbox": {"l": 302.72385, "t": 409.77362, "r": 338.83234, "b": 416.16776, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 152.36208, "t": 418.10522, "r": 190.74123, "b": 424.49936, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 110, "text": "rowspan=\"2\"", "bbox": {"l": 152.36208, "t": 418.10522, "r": 190.74123, "b": 424.49936, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 194.52863, "t": 418.10522, "r": 232.90777999999997, "b": 424.49936, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 111, "text": "rowspan=\"3\"", "bbox": {"l": 194.52863, "t": 418.10522, "r": 232.90777999999997, "b": 424.49936, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 236.69518999999997, "t": 418.10522, "r": 240.67617999999996, "b": 424.49936, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 112, "text": ">", "bbox": {"l": 236.69518999999997, "t": 418.10522, "r": 240.67617999999996, "b": 424.49936, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 244.46358, "t": 418.10522, "r": 269.10144, "b": 424.49936, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 113, "text": "</table>", "bbox": {"l": 244.46358, "t": 418.10522, "r": 269.10144, "b": 424.49936, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 154.50595, "t": 258.60095, "r": 159.62473, "b": 265.70556999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 114, "text": "C", "bbox": {"l": 154.50595, "t": 258.60095, "r": 159.62473, "b": 265.70556999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 164.74348, "t": 258.60095, "r": 185.21857, "b": 265.70556999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 115, "text": "HTML", "bbox": {"l": 164.74348, "t": 258.60095, "r": 185.21857, "b": 265.70556999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 164.3548, "t": 266.49707, "r": 222.05352999999997, "b": 273.60168, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 116, "text": "sequence length:", "bbox": {"l": 164.3548, "t": 266.49707, "r": 222.05352999999997, "b": 273.60168, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 224.15326, "t": 266.49707, "r": 232.57729, "b": 273.60168, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 117, "text": "55", "bbox": {"l": 224.15326, "t": 266.49707, "r": 232.57729, "b": 273.60168, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "text", "id": 2, "page_no": 1, "cluster": {"id": 2, "label": "text", "bbox": {"l": 134.765, "t": 452.31378, "r": 480.59232000000003, "b": 520.88669, "coord_origin": "TOPLEFT"}, "confidence": 0.950499951839447, "cells": [{"id": 118, "text": "today,", "bbox": {"l": 134.765, "t": 452.31378, "r": 161.32928, "b": 461.11075, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "table detection", "bbox": {"l": 164.269, "t": 452.31378, "r": 226.28617999999997, "b": 461.11075, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "in documents is a well understood problem, and the latest", "bbox": {"l": 229.992, "t": 452.31378, "r": 480.59232000000003, "b": 461.11075, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "state-of-the-art (SOTA) object detection methods provide an accuracy compa-", "bbox": {"l": 134.76501, "t": 464.26877, "r": 480.59180000000003, "b": 473.06573, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "rable to human observers [7,8,10,14,23]. On the other hand, the problem of table", "bbox": {"l": 134.76501, "t": 476.22375, "r": 480.58673, "b": 485.02072, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "structure recognition (TSR) is a lot more challenging and remains a very active", "bbox": {"l": 134.76501, "t": 488.17975, "r": 480.58658, "b": 496.97672, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "area of research, in which many novel machine learning algorithms are being", "bbox": {"l": 134.76501, "t": 500.13474, "r": 480.58978, "b": 508.9317, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "explored [3,4,5,9,11,12,13,14,17,18,21,22].", "bbox": {"l": 134.76501, "t": 512.0897199999999, "r": 313.24597, "b": 520.88669, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "today, table detection in documents is a well understood problem, and the latest state-of-the-art (SOTA) object detection methods provide an accuracy comparable to human observers [7,8,10,14,23]. On the other hand, the problem of table structure recognition (TSR) is a lot more challenging and remains a very active area of research, in which many novel machine learning algorithms are being explored [3,4,5,9,11,12,13,14,17,18,21,22]."}, {"label": "text", "id": 0, "page_no": 1, "cluster": {"id": 0, "label": "text", "bbox": {"l": 134.76501, "t": 524.55072, "r": 480.59482, "b": 664.8547, "coord_origin": "TOPLEFT"}, "confidence": 0.9845512509346008, "cells": [{"id": 126, "text": "Recently emerging SOTA methods for table structure recognition employ", "bbox": {"l": 149.70901, "t": 524.55072, "r": 480.58884000000006, "b": 533.3476900000001, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "transformer-based models, in which an image of the table is provided to the net-", "bbox": {"l": 134.76501, "t": 536.50671, "r": 480.5917400000001, "b": 545.30368, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "work in order to predict the structure of the table as a sequence of tokens. These", "bbox": {"l": 134.76501, "t": 548.46172, "r": 480.58868, "b": 557.25868, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "image-to-sequence (Im2Seq) models are extremely powerful, since they allow for", "bbox": {"l": 134.76501, "t": 560.41672, "r": 480.58795, "b": 569.2136800000001, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "a purely data-driven solution. The tokens of the sequence typically belong to a", "bbox": {"l": 134.76501, "t": 572.37172, "r": 480.58978, "b": 581.16869, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "markup language such as HTML, Latex or Markdown, which allow to describe", "bbox": {"l": 134.76501, "t": 584.32672, "r": 480.59479, "b": 593.12369, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "table structure as rows, columns and spanning cells in various configurations.", "bbox": {"l": 134.76501, "t": 596.28271, "r": 480.58678999999995, "b": 605.0796799999999, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "In Figure 1, we illustrate how HTML is used to represent the table-structure", "bbox": {"l": 134.76501, "t": 608.23772, "r": 480.59476, "b": 617.03468, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "of a particular example table. Public table-structure data sets such as PubTab-", "bbox": {"l": 134.76501, "t": 620.19272, "r": 480.5938100000001, "b": 628.98969, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "Net [22], and FinTabNet [21], which were created in a semi-automated way from", "bbox": {"l": 134.76501, "t": 632.1477199999999, "r": 480.59482, "b": 640.94469, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "paired PDF and HTML sources (e.g. PubMed Central), popularized primarily", "bbox": {"l": 134.76501, "t": 644.10272, "r": 480.58771, "b": 652.89969, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "the use of HTML as ground-truth representation format for TSR.", "bbox": {"l": 134.76501, "t": 656.05772, "r": 421.45377, "b": 664.8547, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Recently emerging SOTA methods for table structure recognition employ transformer-based models, in which an image of the table is provided to the network in order to predict the structure of the table as a sequence of tokens. These image-to-sequence (Im2Seq) models are extremely powerful, since they allow for a purely data-driven solution. The tokens of the sequence typically belong to a markup language such as HTML, Latex or Markdown, which allow to describe table structure as rows, columns and spanning cells in various configurations. In Figure 1, we illustrate how HTML is used to represent the table-structure of a particular example table. Public table-structure data sets such as PubTabNet [22], and FinTabNet [21], which were created in a semi-automated way from paired PDF and HTML sources (e.g. PubMed Central), popularized primarily the use of HTML as ground-truth representation format for TSR."}], "headers": [{"label": "page_header", "id": 5, "page_no": 1, "cluster": {"id": 5, "label": "page_header", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8580349683761597, "cells": [{"id": 0, "text": "2", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2"}, {"label": "page_header", "id": 3, "page_no": 1, "cluster": {"id": 3, "label": "page_header", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9076642990112305, "cells": [{"id": 1, "text": "M.", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 178.07675, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37415, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "M. Lysak, et al."}]}}, {"page_no": 2, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "3", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "While the majority of research in TSR is currently focused on the develop-", "bbox": {"l": 149.709, "t": 118.93377999999996, "r": 480.59183, "b": 127.73077, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "ment and application of novel neural model architectures, the table structure", "bbox": {"l": 134.765, "t": 130.88878999999997, "r": 480.58675999999997, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "representation language (e.g. HTML in PubTabNet and FinTabNet) is usually", "bbox": {"l": 134.765, "t": 142.84479, "r": 480.5917400000001, "b": 151.64178000000004, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "adopted", "bbox": {"l": 134.765, "t": 154.7998, "r": 169.62514, "b": 163.59680000000003, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "as is", "bbox": {"l": 173.86099, "t": 154.7998, "r": 194.55531, "b": 163.59680000000003, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "for the sequence tokenization in Im2Seq models. In this paper,", "bbox": {"l": 199.60999, "t": 154.7998, "r": 480.58618, "b": 163.59680000000003, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "we aim for the opposite and investigate the impact of the table structure rep-", "bbox": {"l": 134.76498, "t": 166.75482, "r": 480.59167, "b": 175.55182000000002, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "resentation language with an otherwise unmodified Im2Seq transformer-based", "bbox": {"l": 134.76498, "t": 178.70983999999999, "r": 480.58968999999996, "b": 187.50684, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "architecture. Since the current state-of-the-art Im2Seq model is TableFormer [9],", "bbox": {"l": 134.76498, "t": 190.66485999999998, "r": 480.5917400000001, "b": 199.46185000000003, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "we select this model to perform our experiments.", "bbox": {"l": 134.76498, "t": 202.61987, "r": 348.35519, "b": 211.41687000000002, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "The main contribution of this paper is the introduction of a new optimised ta-", "bbox": {"l": 149.70898, "t": 214.83587999999997, "r": 480.5939, "b": 223.63287000000003, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "ble structure language (OTSL), specifically designed to describe table-structure", "bbox": {"l": 134.76498, "t": 226.79089, "r": 480.5938100000001, "b": 235.58789000000002, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "in an compact and structured way for Im2Seq models. OTSL has a number of", "bbox": {"l": 134.76498, "t": 238.74689, "r": 480.58667, "b": 247.54387999999994, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "key features, which make it very attractive to use in Im2Seq models. Specifically,", "bbox": {"l": 134.76498, "t": 250.70190000000002, "r": 480.5867, "b": 259.49890000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "compared to other languages such as HTML, OTSL has a minimized vocabulary", "bbox": {"l": 134.76498, "t": 262.65692, "r": 480.58771, "b": 271.45392000000004, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "which yields short sequence length, strong inherent structure (e.g. strict rectan-", "bbox": {"l": 134.76498, "t": 274.61194, "r": 480.59572999999995, "b": 283.40891, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "gular layout) and a strict syntax with rules that only look backwards. The latter", "bbox": {"l": 134.76498, "t": 286.56692999999996, "r": 480.59274, "b": 295.36389, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "allows for syntax validation during inference and ensures a syntactically correct", "bbox": {"l": 134.76498, "t": 298.52190999999993, "r": 480.59473, "b": 307.31888, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "table-structure. These OTSL features are illustrated in Figure 1, in comparison", "bbox": {"l": 134.76498, "t": 310.47791, "r": 480.58667, "b": 319.27487, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "to HTML.", "bbox": {"l": 134.76498, "t": 322.43289, "r": 179.72021, "b": 331.22986, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "The paper is structured as follows. In section 2, we give an overview of the", "bbox": {"l": 149.70898, "t": 334.64789, "r": 480.5878000000001, "b": 343.44485000000003, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "latest developments in table-structure reconstruction. In section 3 we review", "bbox": {"l": 134.76498, "t": 346.60388000000006, "r": 480.59375, "b": 355.40085, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "the current HTML table encoding (popularised by PubTabNet and FinTabNet)", "bbox": {"l": 134.76498, "t": 358.55887, "r": 480.58673, "b": 367.3558300000001, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "and discuss its flaws. Subsequently, we introduce OTSL in section 4, which in-", "bbox": {"l": 134.76498, "t": 370.51385, "r": 480.59161, "b": 379.31082, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "cludes the language definition, syntax rules and error-correction procedures. In", "bbox": {"l": 134.76498, "t": 382.46883999999994, "r": 480.59177000000005, "b": 391.26581, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "section 5, we apply OTSL on the TableFormer architecture, compare it to Table-", "bbox": {"l": 134.76498, "t": 394.42383, "r": 480.58774, "b": 403.2207900000001, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Former models trained on HTML and ultimately demonstrate the advantages", "bbox": {"l": 134.76498, "t": 406.37982, "r": 480.59469999999993, "b": 415.17679, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "of using OTSL. Finally, in section 6 we conclude our work and outline next", "bbox": {"l": 134.76498, "t": 418.33481, "r": 480.59567, "b": 427.13177, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "potential steps.", "bbox": {"l": 134.76498, "t": 430.28979, "r": 201.27232, "b": 439.08676, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "2", "bbox": {"l": 134.76498, "t": 462.08795, "r": 141.48859, "b": 472.65634, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Related Work", "bbox": {"l": 154.93819, "t": 462.08795, "r": 236.76912999999996, "b": 472.65634, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "Approaches to formalize the logical structure and layout of tables in electronic", "bbox": {"l": 134.76498, "t": 488.68582, "r": 480.59067, "b": 497.48279, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "documents date back more than two decades [16]. In the recent past, a wide", "bbox": {"l": 134.76498, "t": 500.64081, "r": 480.5917400000001, "b": 509.43777, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "variety of computer vision methods have been explored to tackle the prob-", "bbox": {"l": 134.76498, "t": 512.5957900000001, "r": 480.58971999999994, "b": 521.39276, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "lem of table structure recognition, i.e. the correct identification of columns,", "bbox": {"l": 134.76498, "t": 524.55179, "r": 480.58966, "b": 533.34875, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "rows and spanning cells in a given table. Broadly speaking, the current deep-", "bbox": {"l": 134.76498, "t": 536.50679, "r": 480.5897499999999, "b": 545.30376, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "learning based approaches fall into three categories: object detection (OD) meth-", "bbox": {"l": 134.76498, "t": 548.4617900000001, "r": 480.58862000000005, "b": 557.2587599999999, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "ods, Graph-Neural-Network (GNN) methods and Image-to-Markup-Sequence", "bbox": {"l": 134.76498, "t": 560.41679, "r": 480.59072999999995, "b": 569.21376, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "(Im2Seq) methods. Object-detection based methods [11,12,13,14,21] rely on table-", "bbox": {"l": 134.76498, "t": 572.3718, "r": 484.12047999999993, "b": 581.16876, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "structure annotation using (overlapping) bounding boxes for training, and pro-", "bbox": {"l": 134.76498, "t": 584.3267999999999, "r": 480.59567, "b": 593.12376, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "duce bounding-box predictions to define table cells, rows, and columns on a table", "bbox": {"l": 134.76498, "t": 596.28279, "r": 480.58871, "b": 605.07976, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "image. Graph Neural Network (GNN) based methods [3,6,17,18], as the name", "bbox": {"l": 134.76498, "t": 608.23779, "r": 480.59075999999993, "b": 617.03476, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "suggests, represent tables as graph structures. The graph nodes represent the", "bbox": {"l": 134.76498, "t": 620.1927900000001, "r": 480.58574999999996, "b": 628.9897599999999, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "content of each table cell, an embedding vector from the table image, or geomet-", "bbox": {"l": 134.76498, "t": 632.1478, "r": 480.58875, "b": 640.94476, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "ric coordinates of the table cell. The edges of the graph define the relationship", "bbox": {"l": 134.76498, "t": 644.1028, "r": 480.58875, "b": 652.89977, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "between the nodes, e.g. if they belong to the same column, row, or table cell.", "bbox": {"l": 134.76498, "t": 656.05879, "r": 480.59069999999997, "b": 664.85577, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 5, "label": "page_header", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9325801730155945, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "page_header", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8773486614227295, "cells": [{"id": 1, "text": "3", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 134.76498, "t": 118.93377999999996, "r": 480.59183, "b": 211.41687000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9871802926063538, "cells": [{"id": 2, "text": "While the majority of research in TSR is currently focused on the develop-", "bbox": {"l": 149.709, "t": 118.93377999999996, "r": 480.59183, "b": 127.73077, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "ment and application of novel neural model architectures, the table structure", "bbox": {"l": 134.765, "t": 130.88878999999997, "r": 480.58675999999997, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "representation language (e.g. HTML in PubTabNet and FinTabNet) is usually", "bbox": {"l": 134.765, "t": 142.84479, "r": 480.5917400000001, "b": 151.64178000000004, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "adopted", "bbox": {"l": 134.765, "t": 154.7998, "r": 169.62514, "b": 163.59680000000003, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "as is", "bbox": {"l": 173.86099, "t": 154.7998, "r": 194.55531, "b": 163.59680000000003, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "for the sequence tokenization in Im2Seq models. In this paper,", "bbox": {"l": 199.60999, "t": 154.7998, "r": 480.58618, "b": 163.59680000000003, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "we aim for the opposite and investigate the impact of the table structure rep-", "bbox": {"l": 134.76498, "t": 166.75482, "r": 480.59167, "b": 175.55182000000002, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "resentation language with an otherwise unmodified Im2Seq transformer-based", "bbox": {"l": 134.76498, "t": 178.70983999999999, "r": 480.58968999999996, "b": 187.50684, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "architecture. Since the current state-of-the-art Im2Seq model is TableFormer [9],", "bbox": {"l": 134.76498, "t": 190.66485999999998, "r": 480.5917400000001, "b": 199.46185000000003, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "we select this model to perform our experiments.", "bbox": {"l": 134.76498, "t": 202.61987, "r": 348.35519, "b": 211.41687000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 134.76498, "t": 214.83587999999997, "r": 480.59572999999995, "b": 331.22986, "coord_origin": "TOPLEFT"}, "confidence": 0.9871861338615417, "cells": [{"id": 12, "text": "The main contribution of this paper is the introduction of a new optimised ta-", "bbox": {"l": 149.70898, "t": 214.83587999999997, "r": 480.5939, "b": 223.63287000000003, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "ble structure language (OTSL), specifically designed to describe table-structure", "bbox": {"l": 134.76498, "t": 226.79089, "r": 480.5938100000001, "b": 235.58789000000002, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "in an compact and structured way for Im2Seq models. OTSL has a number of", "bbox": {"l": 134.76498, "t": 238.74689, "r": 480.58667, "b": 247.54387999999994, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "key features, which make it very attractive to use in Im2Seq models. Specifically,", "bbox": {"l": 134.76498, "t": 250.70190000000002, "r": 480.5867, "b": 259.49890000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "compared to other languages such as HTML, OTSL has a minimized vocabulary", "bbox": {"l": 134.76498, "t": 262.65692, "r": 480.58771, "b": 271.45392000000004, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "which yields short sequence length, strong inherent structure (e.g. strict rectan-", "bbox": {"l": 134.76498, "t": 274.61194, "r": 480.59572999999995, "b": 283.40891, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "gular layout) and a strict syntax with rules that only look backwards. The latter", "bbox": {"l": 134.76498, "t": 286.56692999999996, "r": 480.59274, "b": 295.36389, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "allows for syntax validation during inference and ensures a syntactically correct", "bbox": {"l": 134.76498, "t": 298.52190999999993, "r": 480.59473, "b": 307.31888, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "table-structure. These OTSL features are illustrated in Figure 1, in comparison", "bbox": {"l": 134.76498, "t": 310.47791, "r": 480.58667, "b": 319.27487, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "to HTML.", "bbox": {"l": 134.76498, "t": 322.43289, "r": 179.72021, "b": 331.22986, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 134.76498, "t": 334.64789, "r": 480.59567, "b": 439.08676, "coord_origin": "TOPLEFT"}, "confidence": 0.988121747970581, "cells": [{"id": 22, "text": "The paper is structured as follows. In section 2, we give an overview of the", "bbox": {"l": 149.70898, "t": 334.64789, "r": 480.5878000000001, "b": 343.44485000000003, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "latest developments in table-structure reconstruction. In section 3 we review", "bbox": {"l": 134.76498, "t": 346.60388000000006, "r": 480.59375, "b": 355.40085, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "the current HTML table encoding (popularised by PubTabNet and FinTabNet)", "bbox": {"l": 134.76498, "t": 358.55887, "r": 480.58673, "b": 367.3558300000001, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "and discuss its flaws. Subsequently, we introduce OTSL in section 4, which in-", "bbox": {"l": 134.76498, "t": 370.51385, "r": 480.59161, "b": 379.31082, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "cludes the language definition, syntax rules and error-correction procedures. In", "bbox": {"l": 134.76498, "t": 382.46883999999994, "r": 480.59177000000005, "b": 391.26581, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "section 5, we apply OTSL on the TableFormer architecture, compare it to Table-", "bbox": {"l": 134.76498, "t": 394.42383, "r": 480.58774, "b": 403.2207900000001, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Former models trained on HTML and ultimately demonstrate the advantages", "bbox": {"l": 134.76498, "t": 406.37982, "r": 480.59469999999993, "b": 415.17679, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "of using OTSL. Finally, in section 6 we conclude our work and outline next", "bbox": {"l": 134.76498, "t": 418.33481, "r": 480.59567, "b": 427.13177, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "potential steps.", "bbox": {"l": 134.76498, "t": 430.28979, "r": 201.27232, "b": 439.08676, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "section_header", "bbox": {"l": 134.76498, "t": 462.08795, "r": 236.76912999999996, "b": 472.65634, "coord_origin": "TOPLEFT"}, "confidence": 0.9439423680305481, "cells": [{"id": 31, "text": "2", "bbox": {"l": 134.76498, "t": 462.08795, "r": 141.48859, "b": 472.65634, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Related Work", "bbox": {"l": 154.93819, "t": 462.08795, "r": 236.76912999999996, "b": 472.65634, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 134.76498, "t": 488.68582, "r": 484.12047999999993, "b": 664.85577, "coord_origin": "TOPLEFT"}, "confidence": 0.9870182871818542, "cells": [{"id": 33, "text": "Approaches to formalize the logical structure and layout of tables in electronic", "bbox": {"l": 134.76498, "t": 488.68582, "r": 480.59067, "b": 497.48279, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "documents date back more than two decades [16]. In the recent past, a wide", "bbox": {"l": 134.76498, "t": 500.64081, "r": 480.5917400000001, "b": 509.43777, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "variety of computer vision methods have been explored to tackle the prob-", "bbox": {"l": 134.76498, "t": 512.5957900000001, "r": 480.58971999999994, "b": 521.39276, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "lem of table structure recognition, i.e. the correct identification of columns,", "bbox": {"l": 134.76498, "t": 524.55179, "r": 480.58966, "b": 533.34875, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "rows and spanning cells in a given table. Broadly speaking, the current deep-", "bbox": {"l": 134.76498, "t": 536.50679, "r": 480.5897499999999, "b": 545.30376, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "learning based approaches fall into three categories: object detection (OD) meth-", "bbox": {"l": 134.76498, "t": 548.4617900000001, "r": 480.58862000000005, "b": 557.2587599999999, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "ods, Graph-Neural-Network (GNN) methods and Image-to-Markup-Sequence", "bbox": {"l": 134.76498, "t": 560.41679, "r": 480.59072999999995, "b": 569.21376, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "(Im2Seq) methods. Object-detection based methods [11,12,13,14,21] rely on table-", "bbox": {"l": 134.76498, "t": 572.3718, "r": 484.12047999999993, "b": 581.16876, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "structure annotation using (overlapping) bounding boxes for training, and pro-", "bbox": {"l": 134.76498, "t": 584.3267999999999, "r": 480.59567, "b": 593.12376, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "duce bounding-box predictions to define table cells, rows, and columns on a table", "bbox": {"l": 134.76498, "t": 596.28279, "r": 480.58871, "b": 605.07976, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "image. Graph Neural Network (GNN) based methods [3,6,17,18], as the name", "bbox": {"l": 134.76498, "t": 608.23779, "r": 480.59075999999993, "b": 617.03476, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "suggests, represent tables as graph structures. The graph nodes represent the", "bbox": {"l": 134.76498, "t": 620.1927900000001, "r": 480.58574999999996, "b": 628.9897599999999, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "content of each table cell, an embedding vector from the table image, or geomet-", "bbox": {"l": 134.76498, "t": 632.1478, "r": 480.58875, "b": 640.94476, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "ric coordinates of the table cell. The edges of the graph define the relationship", "bbox": {"l": 134.76498, "t": 644.1028, "r": 480.58875, "b": 652.89977, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "between the nodes, e.g. if they belong to the same column, row, or table cell.", "bbox": {"l": 134.76498, "t": 656.05879, "r": 480.59069999999997, "b": 664.85577, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_header", "id": 5, "page_no": 2, "cluster": {"id": 5, "label": "page_header", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9325801730155945, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Optimized Table Tokenization for Table Structure Recognition"}, {"label": "page_header", "id": 6, "page_no": 2, "cluster": {"id": 6, "label": "page_header", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8773486614227295, "cells": [{"id": 1, "text": "3", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3"}, {"label": "text", "id": 2, "page_no": 2, "cluster": {"id": 2, "label": "text", "bbox": {"l": 134.76498, "t": 118.93377999999996, "r": 480.59183, "b": 211.41687000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9871802926063538, "cells": [{"id": 2, "text": "While the majority of research in TSR is currently focused on the develop-", "bbox": {"l": 149.709, "t": 118.93377999999996, "r": 480.59183, "b": 127.73077, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "ment and application of novel neural model architectures, the table structure", "bbox": {"l": 134.765, "t": 130.88878999999997, "r": 480.58675999999997, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "representation language (e.g. HTML in PubTabNet and FinTabNet) is usually", "bbox": {"l": 134.765, "t": 142.84479, "r": 480.5917400000001, "b": 151.64178000000004, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "adopted", "bbox": {"l": 134.765, "t": 154.7998, "r": 169.62514, "b": 163.59680000000003, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "as is", "bbox": {"l": 173.86099, "t": 154.7998, "r": 194.55531, "b": 163.59680000000003, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "for the sequence tokenization in Im2Seq models. In this paper,", "bbox": {"l": 199.60999, "t": 154.7998, "r": 480.58618, "b": 163.59680000000003, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "we aim for the opposite and investigate the impact of the table structure rep-", "bbox": {"l": 134.76498, "t": 166.75482, "r": 480.59167, "b": 175.55182000000002, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "resentation language with an otherwise unmodified Im2Seq transformer-based", "bbox": {"l": 134.76498, "t": 178.70983999999999, "r": 480.58968999999996, "b": 187.50684, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "architecture. Since the current state-of-the-art Im2Seq model is TableFormer [9],", "bbox": {"l": 134.76498, "t": 190.66485999999998, "r": 480.5917400000001, "b": 199.46185000000003, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "we select this model to perform our experiments.", "bbox": {"l": 134.76498, "t": 202.61987, "r": 348.35519, "b": 211.41687000000002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "While the majority of research in TSR is currently focused on the development and application of novel neural model architectures, the table structure representation language (e.g. HTML in PubTabNet and FinTabNet) is usually adopted as is for the sequence tokenization in Im2Seq models. In this paper, we aim for the opposite and investigate the impact of the table structure representation language with an otherwise unmodified Im2Seq transformer-based architecture. Since the current state-of-the-art Im2Seq model is TableFormer [9], we select this model to perform our experiments."}, {"label": "text", "id": 1, "page_no": 2, "cluster": {"id": 1, "label": "text", "bbox": {"l": 134.76498, "t": 214.83587999999997, "r": 480.59572999999995, "b": 331.22986, "coord_origin": "TOPLEFT"}, "confidence": 0.9871861338615417, "cells": [{"id": 12, "text": "The main contribution of this paper is the introduction of a new optimised ta-", "bbox": {"l": 149.70898, "t": 214.83587999999997, "r": 480.5939, "b": 223.63287000000003, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "ble structure language (OTSL), specifically designed to describe table-structure", "bbox": {"l": 134.76498, "t": 226.79089, "r": 480.5938100000001, "b": 235.58789000000002, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "in an compact and structured way for Im2Seq models. OTSL has a number of", "bbox": {"l": 134.76498, "t": 238.74689, "r": 480.58667, "b": 247.54387999999994, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "key features, which make it very attractive to use in Im2Seq models. Specifically,", "bbox": {"l": 134.76498, "t": 250.70190000000002, "r": 480.5867, "b": 259.49890000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "compared to other languages such as HTML, OTSL has a minimized vocabulary", "bbox": {"l": 134.76498, "t": 262.65692, "r": 480.58771, "b": 271.45392000000004, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "which yields short sequence length, strong inherent structure (e.g. strict rectan-", "bbox": {"l": 134.76498, "t": 274.61194, "r": 480.59572999999995, "b": 283.40891, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "gular layout) and a strict syntax with rules that only look backwards. The latter", "bbox": {"l": 134.76498, "t": 286.56692999999996, "r": 480.59274, "b": 295.36389, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "allows for syntax validation during inference and ensures a syntactically correct", "bbox": {"l": 134.76498, "t": 298.52190999999993, "r": 480.59473, "b": 307.31888, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "table-structure. These OTSL features are illustrated in Figure 1, in comparison", "bbox": {"l": 134.76498, "t": 310.47791, "r": 480.58667, "b": 319.27487, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "to HTML.", "bbox": {"l": 134.76498, "t": 322.43289, "r": 179.72021, "b": 331.22986, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The main contribution of this paper is the introduction of a new optimised table structure language (OTSL), specifically designed to describe table-structure in an compact and structured way for Im2Seq models. OTSL has a number of key features, which make it very attractive to use in Im2Seq models. Specifically, compared to other languages such as HTML, OTSL has a minimized vocabulary which yields short sequence length, strong inherent structure (e.g. strict rectangular layout) and a strict syntax with rules that only look backwards. The latter allows for syntax validation during inference and ensures a syntactically correct table-structure. These OTSL features are illustrated in Figure 1, in comparison to HTML."}, {"label": "text", "id": 0, "page_no": 2, "cluster": {"id": 0, "label": "text", "bbox": {"l": 134.76498, "t": 334.64789, "r": 480.59567, "b": 439.08676, "coord_origin": "TOPLEFT"}, "confidence": 0.988121747970581, "cells": [{"id": 22, "text": "The paper is structured as follows. In section 2, we give an overview of the", "bbox": {"l": 149.70898, "t": 334.64789, "r": 480.5878000000001, "b": 343.44485000000003, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "latest developments in table-structure reconstruction. In section 3 we review", "bbox": {"l": 134.76498, "t": 346.60388000000006, "r": 480.59375, "b": 355.40085, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "the current HTML table encoding (popularised by PubTabNet and FinTabNet)", "bbox": {"l": 134.76498, "t": 358.55887, "r": 480.58673, "b": 367.3558300000001, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "and discuss its flaws. Subsequently, we introduce OTSL in section 4, which in-", "bbox": {"l": 134.76498, "t": 370.51385, "r": 480.59161, "b": 379.31082, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "cludes the language definition, syntax rules and error-correction procedures. In", "bbox": {"l": 134.76498, "t": 382.46883999999994, "r": 480.59177000000005, "b": 391.26581, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "section 5, we apply OTSL on the TableFormer architecture, compare it to Table-", "bbox": {"l": 134.76498, "t": 394.42383, "r": 480.58774, "b": 403.2207900000001, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Former models trained on HTML and ultimately demonstrate the advantages", "bbox": {"l": 134.76498, "t": 406.37982, "r": 480.59469999999993, "b": 415.17679, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "of using OTSL. Finally, in section 6 we conclude our work and outline next", "bbox": {"l": 134.76498, "t": 418.33481, "r": 480.59567, "b": 427.13177, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "potential steps.", "bbox": {"l": 134.76498, "t": 430.28979, "r": 201.27232, "b": 439.08676, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The paper is structured as follows. In section 2, we give an overview of the latest developments in table-structure reconstruction. In section 3 we review the current HTML table encoding (popularised by PubTabNet and FinTabNet) and discuss its flaws. Subsequently, we introduce OTSL in section 4, which includes the language definition, syntax rules and error-correction procedures. In section 5, we apply OTSL on the TableFormer architecture, compare it to TableFormer models trained on HTML and ultimately demonstrate the advantages of using OTSL. Finally, in section 6 we conclude our work and outline next potential steps."}, {"label": "section_header", "id": 4, "page_no": 2, "cluster": {"id": 4, "label": "section_header", "bbox": {"l": 134.76498, "t": 462.08795, "r": 236.76912999999996, "b": 472.65634, "coord_origin": "TOPLEFT"}, "confidence": 0.9439423680305481, "cells": [{"id": 31, "text": "2", "bbox": {"l": 134.76498, "t": 462.08795, "r": 141.48859, "b": 472.65634, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Related Work", "bbox": {"l": 154.93819, "t": 462.08795, "r": 236.76912999999996, "b": 472.65634, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2 Related Work"}, {"label": "text", "id": 3, "page_no": 2, "cluster": {"id": 3, "label": "text", "bbox": {"l": 134.76498, "t": 488.68582, "r": 484.12047999999993, "b": 664.85577, "coord_origin": "TOPLEFT"}, "confidence": 0.9870182871818542, "cells": [{"id": 33, "text": "Approaches to formalize the logical structure and layout of tables in electronic", "bbox": {"l": 134.76498, "t": 488.68582, "r": 480.59067, "b": 497.48279, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "documents date back more than two decades [16]. In the recent past, a wide", "bbox": {"l": 134.76498, "t": 500.64081, "r": 480.5917400000001, "b": 509.43777, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "variety of computer vision methods have been explored to tackle the prob-", "bbox": {"l": 134.76498, "t": 512.5957900000001, "r": 480.58971999999994, "b": 521.39276, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "lem of table structure recognition, i.e. the correct identification of columns,", "bbox": {"l": 134.76498, "t": 524.55179, "r": 480.58966, "b": 533.34875, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "rows and spanning cells in a given table. Broadly speaking, the current deep-", "bbox": {"l": 134.76498, "t": 536.50679, "r": 480.5897499999999, "b": 545.30376, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "learning based approaches fall into three categories: object detection (OD) meth-", "bbox": {"l": 134.76498, "t": 548.4617900000001, "r": 480.58862000000005, "b": 557.2587599999999, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "ods, Graph-Neural-Network (GNN) methods and Image-to-Markup-Sequence", "bbox": {"l": 134.76498, "t": 560.41679, "r": 480.59072999999995, "b": 569.21376, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "(Im2Seq) methods. Object-detection based methods [11,12,13,14,21] rely on table-", "bbox": {"l": 134.76498, "t": 572.3718, "r": 484.12047999999993, "b": 581.16876, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "structure annotation using (overlapping) bounding boxes for training, and pro-", "bbox": {"l": 134.76498, "t": 584.3267999999999, "r": 480.59567, "b": 593.12376, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "duce bounding-box predictions to define table cells, rows, and columns on a table", "bbox": {"l": 134.76498, "t": 596.28279, "r": 480.58871, "b": 605.07976, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "image. Graph Neural Network (GNN) based methods [3,6,17,18], as the name", "bbox": {"l": 134.76498, "t": 608.23779, "r": 480.59075999999993, "b": 617.03476, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "suggests, represent tables as graph structures. The graph nodes represent the", "bbox": {"l": 134.76498, "t": 620.1927900000001, "r": 480.58574999999996, "b": 628.9897599999999, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "content of each table cell, an embedding vector from the table image, or geomet-", "bbox": {"l": 134.76498, "t": 632.1478, "r": 480.58875, "b": 640.94476, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "ric coordinates of the table cell. The edges of the graph define the relationship", "bbox": {"l": 134.76498, "t": 644.1028, "r": 480.58875, "b": 652.89977, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "between the nodes, e.g. if they belong to the same column, row, or table cell.", "bbox": {"l": 134.76498, "t": 656.05879, "r": 480.59069999999997, "b": 664.85577, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Approaches to formalize the logical structure and layout of tables in electronic documents date back more than two decades [16]. In the recent past, a wide variety of computer vision methods have been explored to tackle the problem of table structure recognition, i.e. the correct identification of columns, rows and spanning cells in a given table. Broadly speaking, the current deeplearning based approaches fall into three categories: object detection (OD) methods, Graph-Neural-Network (GNN) methods and Image-to-Markup-Sequence (Im2Seq) methods. Object-detection based methods [11,12,13,14,21] rely on tablestructure annotation using (overlapping) bounding boxes for training, and produce bounding-box predictions to define table cells, rows, and columns on a table image. Graph Neural Network (GNN) based methods [3,6,17,18], as the name suggests, represent tables as graph structures. The graph nodes represent the content of each table cell, an embedding vector from the table image, or geometric coordinates of the table cell. The edges of the graph define the relationship between the nodes, e.g. if they belong to the same column, row, or table cell."}], "body": [{"label": "text", "id": 2, "page_no": 2, "cluster": {"id": 2, "label": "text", "bbox": {"l": 134.76498, "t": 118.93377999999996, "r": 480.59183, "b": 211.41687000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9871802926063538, "cells": [{"id": 2, "text": "While the majority of research in TSR is currently focused on the develop-", "bbox": {"l": 149.709, "t": 118.93377999999996, "r": 480.59183, "b": 127.73077, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "ment and application of novel neural model architectures, the table structure", "bbox": {"l": 134.765, "t": 130.88878999999997, "r": 480.58675999999997, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "representation language (e.g. HTML in PubTabNet and FinTabNet) is usually", "bbox": {"l": 134.765, "t": 142.84479, "r": 480.5917400000001, "b": 151.64178000000004, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "adopted", "bbox": {"l": 134.765, "t": 154.7998, "r": 169.62514, "b": 163.59680000000003, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "as is", "bbox": {"l": 173.86099, "t": 154.7998, "r": 194.55531, "b": 163.59680000000003, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "for the sequence tokenization in Im2Seq models. In this paper,", "bbox": {"l": 199.60999, "t": 154.7998, "r": 480.58618, "b": 163.59680000000003, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "we aim for the opposite and investigate the impact of the table structure rep-", "bbox": {"l": 134.76498, "t": 166.75482, "r": 480.59167, "b": 175.55182000000002, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "resentation language with an otherwise unmodified Im2Seq transformer-based", "bbox": {"l": 134.76498, "t": 178.70983999999999, "r": 480.58968999999996, "b": 187.50684, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "architecture. Since the current state-of-the-art Im2Seq model is TableFormer [9],", "bbox": {"l": 134.76498, "t": 190.66485999999998, "r": 480.5917400000001, "b": 199.46185000000003, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "we select this model to perform our experiments.", "bbox": {"l": 134.76498, "t": 202.61987, "r": 348.35519, "b": 211.41687000000002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "While the majority of research in TSR is currently focused on the development and application of novel neural model architectures, the table structure representation language (e.g. HTML in PubTabNet and FinTabNet) is usually adopted as is for the sequence tokenization in Im2Seq models. In this paper, we aim for the opposite and investigate the impact of the table structure representation language with an otherwise unmodified Im2Seq transformer-based architecture. Since the current state-of-the-art Im2Seq model is TableFormer [9], we select this model to perform our experiments."}, {"label": "text", "id": 1, "page_no": 2, "cluster": {"id": 1, "label": "text", "bbox": {"l": 134.76498, "t": 214.83587999999997, "r": 480.59572999999995, "b": 331.22986, "coord_origin": "TOPLEFT"}, "confidence": 0.9871861338615417, "cells": [{"id": 12, "text": "The main contribution of this paper is the introduction of a new optimised ta-", "bbox": {"l": 149.70898, "t": 214.83587999999997, "r": 480.5939, "b": 223.63287000000003, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "ble structure language (OTSL), specifically designed to describe table-structure", "bbox": {"l": 134.76498, "t": 226.79089, "r": 480.5938100000001, "b": 235.58789000000002, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "in an compact and structured way for Im2Seq models. OTSL has a number of", "bbox": {"l": 134.76498, "t": 238.74689, "r": 480.58667, "b": 247.54387999999994, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "key features, which make it very attractive to use in Im2Seq models. Specifically,", "bbox": {"l": 134.76498, "t": 250.70190000000002, "r": 480.5867, "b": 259.49890000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "compared to other languages such as HTML, OTSL has a minimized vocabulary", "bbox": {"l": 134.76498, "t": 262.65692, "r": 480.58771, "b": 271.45392000000004, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "which yields short sequence length, strong inherent structure (e.g. strict rectan-", "bbox": {"l": 134.76498, "t": 274.61194, "r": 480.59572999999995, "b": 283.40891, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "gular layout) and a strict syntax with rules that only look backwards. The latter", "bbox": {"l": 134.76498, "t": 286.56692999999996, "r": 480.59274, "b": 295.36389, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "allows for syntax validation during inference and ensures a syntactically correct", "bbox": {"l": 134.76498, "t": 298.52190999999993, "r": 480.59473, "b": 307.31888, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "table-structure. These OTSL features are illustrated in Figure 1, in comparison", "bbox": {"l": 134.76498, "t": 310.47791, "r": 480.58667, "b": 319.27487, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "to HTML.", "bbox": {"l": 134.76498, "t": 322.43289, "r": 179.72021, "b": 331.22986, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The main contribution of this paper is the introduction of a new optimised table structure language (OTSL), specifically designed to describe table-structure in an compact and structured way for Im2Seq models. OTSL has a number of key features, which make it very attractive to use in Im2Seq models. Specifically, compared to other languages such as HTML, OTSL has a minimized vocabulary which yields short sequence length, strong inherent structure (e.g. strict rectangular layout) and a strict syntax with rules that only look backwards. The latter allows for syntax validation during inference and ensures a syntactically correct table-structure. These OTSL features are illustrated in Figure 1, in comparison to HTML."}, {"label": "text", "id": 0, "page_no": 2, "cluster": {"id": 0, "label": "text", "bbox": {"l": 134.76498, "t": 334.64789, "r": 480.59567, "b": 439.08676, "coord_origin": "TOPLEFT"}, "confidence": 0.988121747970581, "cells": [{"id": 22, "text": "The paper is structured as follows. In section 2, we give an overview of the", "bbox": {"l": 149.70898, "t": 334.64789, "r": 480.5878000000001, "b": 343.44485000000003, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "latest developments in table-structure reconstruction. In section 3 we review", "bbox": {"l": 134.76498, "t": 346.60388000000006, "r": 480.59375, "b": 355.40085, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "the current HTML table encoding (popularised by PubTabNet and FinTabNet)", "bbox": {"l": 134.76498, "t": 358.55887, "r": 480.58673, "b": 367.3558300000001, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "and discuss its flaws. Subsequently, we introduce OTSL in section 4, which in-", "bbox": {"l": 134.76498, "t": 370.51385, "r": 480.59161, "b": 379.31082, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "cludes the language definition, syntax rules and error-correction procedures. In", "bbox": {"l": 134.76498, "t": 382.46883999999994, "r": 480.59177000000005, "b": 391.26581, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "section 5, we apply OTSL on the TableFormer architecture, compare it to Table-", "bbox": {"l": 134.76498, "t": 394.42383, "r": 480.58774, "b": 403.2207900000001, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Former models trained on HTML and ultimately demonstrate the advantages", "bbox": {"l": 134.76498, "t": 406.37982, "r": 480.59469999999993, "b": 415.17679, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "of using OTSL. Finally, in section 6 we conclude our work and outline next", "bbox": {"l": 134.76498, "t": 418.33481, "r": 480.59567, "b": 427.13177, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "potential steps.", "bbox": {"l": 134.76498, "t": 430.28979, "r": 201.27232, "b": 439.08676, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The paper is structured as follows. In section 2, we give an overview of the latest developments in table-structure reconstruction. In section 3 we review the current HTML table encoding (popularised by PubTabNet and FinTabNet) and discuss its flaws. Subsequently, we introduce OTSL in section 4, which includes the language definition, syntax rules and error-correction procedures. In section 5, we apply OTSL on the TableFormer architecture, compare it to TableFormer models trained on HTML and ultimately demonstrate the advantages of using OTSL. Finally, in section 6 we conclude our work and outline next potential steps."}, {"label": "section_header", "id": 4, "page_no": 2, "cluster": {"id": 4, "label": "section_header", "bbox": {"l": 134.76498, "t": 462.08795, "r": 236.76912999999996, "b": 472.65634, "coord_origin": "TOPLEFT"}, "confidence": 0.9439423680305481, "cells": [{"id": 31, "text": "2", "bbox": {"l": 134.76498, "t": 462.08795, "r": 141.48859, "b": 472.65634, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Related Work", "bbox": {"l": 154.93819, "t": 462.08795, "r": 236.76912999999996, "b": 472.65634, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2 Related Work"}, {"label": "text", "id": 3, "page_no": 2, "cluster": {"id": 3, "label": "text", "bbox": {"l": 134.76498, "t": 488.68582, "r": 484.12047999999993, "b": 664.85577, "coord_origin": "TOPLEFT"}, "confidence": 0.9870182871818542, "cells": [{"id": 33, "text": "Approaches to formalize the logical structure and layout of tables in electronic", "bbox": {"l": 134.76498, "t": 488.68582, "r": 480.59067, "b": 497.48279, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "documents date back more than two decades [16]. In the recent past, a wide", "bbox": {"l": 134.76498, "t": 500.64081, "r": 480.5917400000001, "b": 509.43777, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "variety of computer vision methods have been explored to tackle the prob-", "bbox": {"l": 134.76498, "t": 512.5957900000001, "r": 480.58971999999994, "b": 521.39276, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "lem of table structure recognition, i.e. the correct identification of columns,", "bbox": {"l": 134.76498, "t": 524.55179, "r": 480.58966, "b": 533.34875, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "rows and spanning cells in a given table. Broadly speaking, the current deep-", "bbox": {"l": 134.76498, "t": 536.50679, "r": 480.5897499999999, "b": 545.30376, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "learning based approaches fall into three categories: object detection (OD) meth-", "bbox": {"l": 134.76498, "t": 548.4617900000001, "r": 480.58862000000005, "b": 557.2587599999999, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "ods, Graph-Neural-Network (GNN) methods and Image-to-Markup-Sequence", "bbox": {"l": 134.76498, "t": 560.41679, "r": 480.59072999999995, "b": 569.21376, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "(Im2Seq) methods. Object-detection based methods [11,12,13,14,21] rely on table-", "bbox": {"l": 134.76498, "t": 572.3718, "r": 484.12047999999993, "b": 581.16876, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "structure annotation using (overlapping) bounding boxes for training, and pro-", "bbox": {"l": 134.76498, "t": 584.3267999999999, "r": 480.59567, "b": 593.12376, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "duce bounding-box predictions to define table cells, rows, and columns on a table", "bbox": {"l": 134.76498, "t": 596.28279, "r": 480.58871, "b": 605.07976, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "image. Graph Neural Network (GNN) based methods [3,6,17,18], as the name", "bbox": {"l": 134.76498, "t": 608.23779, "r": 480.59075999999993, "b": 617.03476, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "suggests, represent tables as graph structures. The graph nodes represent the", "bbox": {"l": 134.76498, "t": 620.1927900000001, "r": 480.58574999999996, "b": 628.9897599999999, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "content of each table cell, an embedding vector from the table image, or geomet-", "bbox": {"l": 134.76498, "t": 632.1478, "r": 480.58875, "b": 640.94476, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "ric coordinates of the table cell. The edges of the graph define the relationship", "bbox": {"l": 134.76498, "t": 644.1028, "r": 480.58875, "b": 652.89977, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "between the nodes, e.g. if they belong to the same column, row, or table cell.", "bbox": {"l": 134.76498, "t": 656.05879, "r": 480.59069999999997, "b": 664.85577, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Approaches to formalize the logical structure and layout of tables in electronic documents date back more than two decades [16]. In the recent past, a wide variety of computer vision methods have been explored to tackle the problem of table structure recognition, i.e. the correct identification of columns, rows and spanning cells in a given table. Broadly speaking, the current deeplearning based approaches fall into three categories: object detection (OD) methods, Graph-Neural-Network (GNN) methods and Image-to-Markup-Sequence (Im2Seq) methods. Object-detection based methods [11,12,13,14,21] rely on tablestructure annotation using (overlapping) bounding boxes for training, and produce bounding-box predictions to define table cells, rows, and columns on a table image. Graph Neural Network (GNN) based methods [3,6,17,18], as the name suggests, represent tables as graph structures. The graph nodes represent the content of each table cell, an embedding vector from the table image, or geometric coordinates of the table cell. The edges of the graph define the relationship between the nodes, e.g. if they belong to the same column, row, or table cell."}], "headers": [{"label": "page_header", "id": 5, "page_no": 2, "cluster": {"id": 5, "label": "page_header", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9325801730155945, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Optimized Table Tokenization for Table Structure Recognition"}, {"label": "page_header", "id": 6, "page_no": 2, "cluster": {"id": 6, "label": "page_header", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8773486614227295, "cells": [{"id": 1, "text": "3", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3"}]}}, {"page_no": 3, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "4", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "M.", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 178.07675, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37415, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Other work [20] aims at predicting a grid for each table and deciding which cells", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.59375, "b": 127.73077, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "must be merged using an attention network. Im2Seq methods cast the problem", "bbox": {"l": 134.765, "t": 130.88878999999997, "r": 480.58774, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "as a sequence generation task [4,5,9,22], and therefore need an internal table-", "bbox": {"l": 134.765, "t": 142.84479, "r": 480.58675999999997, "b": 151.64178000000004, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "structure representation language, which is often implemented with standard", "bbox": {"l": 134.765, "t": 154.7998, "r": 480.5878000000001, "b": 163.59680000000003, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "markup languages (e.g. HTML, LaTeX, Markdown). In theory, Im2Seq methods", "bbox": {"l": 134.765, "t": 166.75482, "r": 480.59271, "b": 175.55182000000002, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "have a natural advantage over the OD and GNN methods by virtue of directly", "bbox": {"l": 134.765, "t": 178.70983999999999, "r": 480.5957599999999, "b": 187.50684, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "predicting the table-structure. As such, no post-processing or rules are needed", "bbox": {"l": 134.765, "t": 190.66485999999998, "r": 480.59271, "b": 199.46185000000003, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "in order to obtain the table-structure, which is necessary with OD and GNN", "bbox": {"l": 134.765, "t": 202.61987, "r": 480.59378, "b": 211.41687000000002, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "approaches. In practice, this is not entirely true, because a predicted sequence", "bbox": {"l": 134.765, "t": 214.57587, "r": 480.58783000000005, "b": 223.37285999999995, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "of table-structure markup does not necessarily have to be syntactically correct.", "bbox": {"l": 134.765, "t": 226.53088000000002, "r": 480.58978, "b": 235.32788000000005, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Hence, depending on the quality of the predicted sequence, some post-processing", "bbox": {"l": 134.765, "t": 238.48590000000002, "r": 480.59572999999995, "b": 247.28290000000004, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "needs to be performed to ensure a syntactically valid (let alone correct) sequence.", "bbox": {"l": 134.765, "t": 250.44092, "r": 480.59473, "b": 259.23792000000003, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Within the Im2Seq method, we find several popular models, namely the", "bbox": {"l": 149.709, "t": 262.65692, "r": 480.59280000000007, "b": 271.45392000000004, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "encoder-dual-decoder model (EDD) [22], TableFormer [9], Tabsplitter[2] and Ye", "bbox": {"l": 134.765, "t": 274.61194, "r": 480.59167, "b": 283.40891, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "et. al. [19]. EDD uses two consecutive long short-term memory (LSTM) decoders", "bbox": {"l": 134.765, "t": 286.56692999999996, "r": 480.59271, "b": 295.36389, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "to predict a table in HTML representation. The", "bbox": {"l": 134.765, "t": 298.52190999999993, "r": 342.02097, "b": 307.31888, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "tag decoder", "bbox": {"l": 345.064, "t": 298.52190999999993, "r": 393.04684, "b": 307.31888, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "predicts a sequence", "bbox": {"l": 397.16699, "t": 298.52190999999993, "r": 480.59082, "b": 307.31888, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "of HTML tags. For each decoded table cell (", "bbox": {"l": 134.76498, "t": 310.47791, "r": 333.29871, "b": 319.27487, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "<td>", "bbox": {"l": 333.29898, "t": 310.47791, "r": 356.9711, "b": 319.27487, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "), the attention is passed to", "bbox": {"l": 357.08499, "t": 310.47791, "r": 480.59433000000007, "b": 319.27487, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "the", "bbox": {"l": 134.76498, "t": 322.43289, "r": 148.59805, "b": 331.22986, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "cell decoder", "bbox": {"l": 152.27698, "t": 322.43289, "r": 202.1109, "b": 331.22986, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "to predict the content with an embedded OCR approach. The", "bbox": {"l": 206.86398, "t": 322.43289, "r": 480.58743, "b": 331.22986, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "latter makes it susceptible to transcription errors in the cell content of the table.", "bbox": {"l": 134.76498, "t": 334.38788, "r": 480.59476, "b": 343.18484, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "TableFormer address this reliance on OCR and uses two transformer decoders for", "bbox": {"l": 134.76498, "t": 346.34286, "r": 480.58675999999997, "b": 355.13983, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "HTML structure and cell bounding box prediction in an end-to-end architecture.", "bbox": {"l": 134.76498, "t": 358.29785, "r": 480.58868, "b": 367.09482, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "The predicted cell bounding box is then used to extract text tokens from an", "bbox": {"l": 134.76498, "t": 370.25284, "r": 480.58868, "b": 379.0498, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "originating (digital) PDF page, circumventing any need for OCR. TabSplitter", "bbox": {"l": 134.76498, "t": 382.20883, "r": 480.59357000000006, "b": 391.0058, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "[2]", "bbox": {"l": 134.76498, "t": 394.16382, "r": 144.76979, "b": 402.96078, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "proposes a compact double-matrix representation of table rows and columns", "bbox": {"l": 149.50908, "t": 394.16382, "r": 480.58667, "b": 402.96078, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "to do error detection and error correction of HTML structure sequences based", "bbox": {"l": 134.76498, "t": 406.1188, "r": 480.59569999999997, "b": 414.91576999999995, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "on predictions from [19]. This compact double-matrix representation can not be", "bbox": {"l": 134.76498, "t": 418.07379, "r": 480.59180000000003, "b": 426.87076, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "used directly by the Img2seq model training, so the model uses HTML as an", "bbox": {"l": 134.76498, "t": 430.02878, "r": 480.5878000000001, "b": 438.82574, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "intermediate form. Chi et. al. [4] introduce a data set and a baseline method", "bbox": {"l": 134.76498, "t": 441.98376, "r": 480.58868, "b": 450.78073, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "using bidirectional LSTMs to predict LaTeX code. Kayal", "bbox": {"l": 134.76498, "t": 453.93976000000004, "r": 384.5752, "b": 462.73672, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "[5]", "bbox": {"l": 391.55899, "t": 453.93976000000004, "r": 401.73236, "b": 462.73672, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "introduces Gated", "bbox": {"l": 406.55154, "t": 453.93976000000004, "r": 480.58777, "b": 462.73672, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "ResNet transformers to predict LaTeX code, and a separate OCR module to", "bbox": {"l": 134.76498, "t": 465.89474, "r": 480.59079, "b": 474.69171, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "extract content.", "bbox": {"l": 134.76498, "t": 477.84973, "r": 203.68625, "b": 486.6467, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Im2Seq approaches have shown to be well-suited for the TSR task and allow a", "bbox": {"l": 149.70898, "t": 490.06573, "r": 480.59378, "b": 498.8627, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "full end-to-end network design that can output the final table structure without", "bbox": {"l": 134.76498, "t": 502.02072, "r": 480.58871, "b": 510.81769, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "pre- or post-processing logic. Furthermore, Im2Seq models have demonstrated", "bbox": {"l": 134.76498, "t": 513.9757099999999, "r": 480.58675999999997, "b": 522.7726700000001, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "to deliver state-of-the-art prediction accuracy [9]. This motivated the authors", "bbox": {"l": 134.76498, "t": 525.93069, "r": 480.58978, "b": 534.72766, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "to investigate if the performance (both in accuracy and inference time) can", "bbox": {"l": 134.76498, "t": 537.8857, "r": 480.58765, "b": 546.6826599999999, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "be further improved by optimising the table structure representation language.", "bbox": {"l": 134.76498, "t": 549.84169, "r": 480.58971999999994, "b": 558.63866, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "We believe this is a necessary step before further improving neural network", "bbox": {"l": 134.76498, "t": 561.79669, "r": 480.58871, "b": 570.59366, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "architectures for this task.", "bbox": {"l": 134.76498, "t": 573.75169, "r": 249.27811, "b": 582.54866, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "3", "bbox": {"l": 134.76498, "t": 605.54984, "r": 141.48859, "b": 616.11823, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Problem Statement", "bbox": {"l": 154.93819, "t": 605.54984, "r": 269.62442, "b": 616.11823, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "All known Im2Seq based models for TSR fundamentally work in similar ways.", "bbox": {"l": 134.76498, "t": 632.14769, "r": 480.59064, "b": 640.94466, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "Given an image of a table, the Im2Seq model predicts the structure of the table", "bbox": {"l": 134.76498, "t": 644.1026899999999, "r": 480.5867, "b": 652.89966, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "by generating a sequence of tokens. These tokens originate from a finite vocab-", "bbox": {"l": 134.76498, "t": 656.0586900000001, "r": 480.5936899999999, "b": 664.85566, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 6, "label": "page_header", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.7890051603317261, "cells": [{"id": 0, "text": "4", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "page_header", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9045588374137878, "cells": [{"id": 1, "text": "M.", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 178.07675, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37415, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.5957599999999, "b": 259.23792000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9467443823814392, "cells": [{"id": 3, "text": "Other work [20] aims at predicting a grid for each table and deciding which cells", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.59375, "b": 127.73077, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "must be merged using an attention network. Im2Seq methods cast the problem", "bbox": {"l": 134.765, "t": 130.88878999999997, "r": 480.58774, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "as a sequence generation task [4,5,9,22], and therefore need an internal table-", "bbox": {"l": 134.765, "t": 142.84479, "r": 480.58675999999997, "b": 151.64178000000004, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "structure representation language, which is often implemented with standard", "bbox": {"l": 134.765, "t": 154.7998, "r": 480.5878000000001, "b": 163.59680000000003, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "markup languages (e.g. HTML, LaTeX, Markdown). In theory, Im2Seq methods", "bbox": {"l": 134.765, "t": 166.75482, "r": 480.59271, "b": 175.55182000000002, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "have a natural advantage over the OD and GNN methods by virtue of directly", "bbox": {"l": 134.765, "t": 178.70983999999999, "r": 480.5957599999999, "b": 187.50684, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "predicting the table-structure. As such, no post-processing or rules are needed", "bbox": {"l": 134.765, "t": 190.66485999999998, "r": 480.59271, "b": 199.46185000000003, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "in order to obtain the table-structure, which is necessary with OD and GNN", "bbox": {"l": 134.765, "t": 202.61987, "r": 480.59378, "b": 211.41687000000002, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "approaches. In practice, this is not entirely true, because a predicted sequence", "bbox": {"l": 134.765, "t": 214.57587, "r": 480.58783000000005, "b": 223.37285999999995, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "of table-structure markup does not necessarily have to be syntactically correct.", "bbox": {"l": 134.765, "t": 226.53088000000002, "r": 480.58978, "b": 235.32788000000005, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Hence, depending on the quality of the predicted sequence, some post-processing", "bbox": {"l": 134.765, "t": 238.48590000000002, "r": 480.59572999999995, "b": 247.28290000000004, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "needs to be performed to ensure a syntactically valid (let alone correct) sequence.", "bbox": {"l": 134.765, "t": 250.44092, "r": 480.59473, "b": 259.23792000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "text", "bbox": {"l": 134.76498, "t": 262.65692, "r": 480.59569999999997, "b": 486.6467, "coord_origin": "TOPLEFT"}, "confidence": 0.929087221622467, "cells": [{"id": 15, "text": "Within the Im2Seq method, we find several popular models, namely the", "bbox": {"l": 149.709, "t": 262.65692, "r": 480.59280000000007, "b": 271.45392000000004, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "encoder-dual-decoder model (EDD) [22], TableFormer [9], Tabsplitter[2] and Ye", "bbox": {"l": 134.765, "t": 274.61194, "r": 480.59167, "b": 283.40891, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "et. al. [19]. EDD uses two consecutive long short-term memory (LSTM) decoders", "bbox": {"l": 134.765, "t": 286.56692999999996, "r": 480.59271, "b": 295.36389, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "to predict a table in HTML representation. The", "bbox": {"l": 134.765, "t": 298.52190999999993, "r": 342.02097, "b": 307.31888, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "tag decoder", "bbox": {"l": 345.064, "t": 298.52190999999993, "r": 393.04684, "b": 307.31888, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "predicts a sequence", "bbox": {"l": 397.16699, "t": 298.52190999999993, "r": 480.59082, "b": 307.31888, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "of HTML tags. For each decoded table cell (", "bbox": {"l": 134.76498, "t": 310.47791, "r": 333.29871, "b": 319.27487, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "<td>", "bbox": {"l": 333.29898, "t": 310.47791, "r": 356.9711, "b": 319.27487, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "), the attention is passed to", "bbox": {"l": 357.08499, "t": 310.47791, "r": 480.59433000000007, "b": 319.27487, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "the", "bbox": {"l": 134.76498, "t": 322.43289, "r": 148.59805, "b": 331.22986, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "cell decoder", "bbox": {"l": 152.27698, "t": 322.43289, "r": 202.1109, "b": 331.22986, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "to predict the content with an embedded OCR approach. The", "bbox": {"l": 206.86398, "t": 322.43289, "r": 480.58743, "b": 331.22986, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "latter makes it susceptible to transcription errors in the cell content of the table.", "bbox": {"l": 134.76498, "t": 334.38788, "r": 480.59476, "b": 343.18484, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "TableFormer address this reliance on OCR and uses two transformer decoders for", "bbox": {"l": 134.76498, "t": 346.34286, "r": 480.58675999999997, "b": 355.13983, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "HTML structure and cell bounding box prediction in an end-to-end architecture.", "bbox": {"l": 134.76498, "t": 358.29785, "r": 480.58868, "b": 367.09482, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "The predicted cell bounding box is then used to extract text tokens from an", "bbox": {"l": 134.76498, "t": 370.25284, "r": 480.58868, "b": 379.0498, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "originating (digital) PDF page, circumventing any need for OCR. TabSplitter", "bbox": {"l": 134.76498, "t": 382.20883, "r": 480.59357000000006, "b": 391.0058, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "[2]", "bbox": {"l": 134.76498, "t": 394.16382, "r": 144.76979, "b": 402.96078, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "proposes a compact double-matrix representation of table rows and columns", "bbox": {"l": 149.50908, "t": 394.16382, "r": 480.58667, "b": 402.96078, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "to do error detection and error correction of HTML structure sequences based", "bbox": {"l": 134.76498, "t": 406.1188, "r": 480.59569999999997, "b": 414.91576999999995, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "on predictions from [19]. This compact double-matrix representation can not be", "bbox": {"l": 134.76498, "t": 418.07379, "r": 480.59180000000003, "b": 426.87076, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "used directly by the Img2seq model training, so the model uses HTML as an", "bbox": {"l": 134.76498, "t": 430.02878, "r": 480.5878000000001, "b": 438.82574, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "intermediate form. Chi et. al. [4] introduce a data set and a baseline method", "bbox": {"l": 134.76498, "t": 441.98376, "r": 480.58868, "b": 450.78073, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "using bidirectional LSTMs to predict LaTeX code. Kayal", "bbox": {"l": 134.76498, "t": 453.93976000000004, "r": 384.5752, "b": 462.73672, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "[5]", "bbox": {"l": 391.55899, "t": 453.93976000000004, "r": 401.73236, "b": 462.73672, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "introduces Gated", "bbox": {"l": 406.55154, "t": 453.93976000000004, "r": 480.58777, "b": 462.73672, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "ResNet transformers to predict LaTeX code, and a separate OCR module to", "bbox": {"l": 134.76498, "t": 465.89474, "r": 480.59079, "b": 474.69171, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "extract content.", "bbox": {"l": 134.76498, "t": 477.84973, "r": 203.68625, "b": 486.6467, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 134.76498, "t": 490.06573, "r": 480.59378, "b": 582.54866, "coord_origin": "TOPLEFT"}, "confidence": 0.9853583574295044, "cells": [{"id": 43, "text": "Im2Seq approaches have shown to be well-suited for the TSR task and allow a", "bbox": {"l": 149.70898, "t": 490.06573, "r": 480.59378, "b": 498.8627, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "full end-to-end network design that can output the final table structure without", "bbox": {"l": 134.76498, "t": 502.02072, "r": 480.58871, "b": 510.81769, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "pre- or post-processing logic. Furthermore, Im2Seq models have demonstrated", "bbox": {"l": 134.76498, "t": 513.9757099999999, "r": 480.58675999999997, "b": 522.7726700000001, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "to deliver state-of-the-art prediction accuracy [9]. This motivated the authors", "bbox": {"l": 134.76498, "t": 525.93069, "r": 480.58978, "b": 534.72766, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "to investigate if the performance (both in accuracy and inference time) can", "bbox": {"l": 134.76498, "t": 537.8857, "r": 480.58765, "b": 546.6826599999999, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "be further improved by optimising the table structure representation language.", "bbox": {"l": 134.76498, "t": 549.84169, "r": 480.58971999999994, "b": 558.63866, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "We believe this is a necessary step before further improving neural network", "bbox": {"l": 134.76498, "t": 561.79669, "r": 480.58871, "b": 570.59366, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "architectures for this task.", "bbox": {"l": 134.76498, "t": 573.75169, "r": 249.27811, "b": 582.54866, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "section_header", "bbox": {"l": 134.76498, "t": 605.54984, "r": 269.62442, "b": 616.11823, "coord_origin": "TOPLEFT"}, "confidence": 0.9393903017044067, "cells": [{"id": 51, "text": "3", "bbox": {"l": 134.76498, "t": 605.54984, "r": 141.48859, "b": 616.11823, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Problem Statement", "bbox": {"l": 154.93819, "t": 605.54984, "r": 269.62442, "b": 616.11823, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 134.76498, "t": 632.14769, "r": 480.5936899999999, "b": 664.85566, "coord_origin": "TOPLEFT"}, "confidence": 0.9692807197570801, "cells": [{"id": 53, "text": "All known Im2Seq based models for TSR fundamentally work in similar ways.", "bbox": {"l": 134.76498, "t": 632.14769, "r": 480.59064, "b": 640.94466, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "Given an image of a table, the Im2Seq model predicts the structure of the table", "bbox": {"l": 134.76498, "t": 644.1026899999999, "r": 480.5867, "b": 652.89966, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "by generating a sequence of tokens. These tokens originate from a finite vocab-", "bbox": {"l": 134.76498, "t": 656.0586900000001, "r": 480.5936899999999, "b": 664.85566, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_header", "id": 6, "page_no": 3, "cluster": {"id": 6, "label": "page_header", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.7890051603317261, "cells": [{"id": 0, "text": "4", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4"}, {"label": "page_header", "id": 5, "page_no": 3, "cluster": {"id": 5, "label": "page_header", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9045588374137878, "cells": [{"id": 1, "text": "M.", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 178.07675, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37415, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "M. Lysak, et al."}, {"label": "text", "id": 2, "page_no": 3, "cluster": {"id": 2, "label": "text", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.5957599999999, "b": 259.23792000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9467443823814392, "cells": [{"id": 3, "text": "Other work [20] aims at predicting a grid for each table and deciding which cells", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.59375, "b": 127.73077, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "must be merged using an attention network. Im2Seq methods cast the problem", "bbox": {"l": 134.765, "t": 130.88878999999997, "r": 480.58774, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "as a sequence generation task [4,5,9,22], and therefore need an internal table-", "bbox": {"l": 134.765, "t": 142.84479, "r": 480.58675999999997, "b": 151.64178000000004, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "structure representation language, which is often implemented with standard", "bbox": {"l": 134.765, "t": 154.7998, "r": 480.5878000000001, "b": 163.59680000000003, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "markup languages (e.g. HTML, LaTeX, Markdown). In theory, Im2Seq methods", "bbox": {"l": 134.765, "t": 166.75482, "r": 480.59271, "b": 175.55182000000002, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "have a natural advantage over the OD and GNN methods by virtue of directly", "bbox": {"l": 134.765, "t": 178.70983999999999, "r": 480.5957599999999, "b": 187.50684, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "predicting the table-structure. As such, no post-processing or rules are needed", "bbox": {"l": 134.765, "t": 190.66485999999998, "r": 480.59271, "b": 199.46185000000003, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "in order to obtain the table-structure, which is necessary with OD and GNN", "bbox": {"l": 134.765, "t": 202.61987, "r": 480.59378, "b": 211.41687000000002, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "approaches. In practice, this is not entirely true, because a predicted sequence", "bbox": {"l": 134.765, "t": 214.57587, "r": 480.58783000000005, "b": 223.37285999999995, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "of table-structure markup does not necessarily have to be syntactically correct.", "bbox": {"l": 134.765, "t": 226.53088000000002, "r": 480.58978, "b": 235.32788000000005, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Hence, depending on the quality of the predicted sequence, some post-processing", "bbox": {"l": 134.765, "t": 238.48590000000002, "r": 480.59572999999995, "b": 247.28290000000004, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "needs to be performed to ensure a syntactically valid (let alone correct) sequence.", "bbox": {"l": 134.765, "t": 250.44092, "r": 480.59473, "b": 259.23792000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Other work [20] aims at predicting a grid for each table and deciding which cells must be merged using an attention network. Im2Seq methods cast the problem as a sequence generation task [4,5,9,22], and therefore need an internal tablestructure representation language, which is often implemented with standard markup languages (e.g. HTML, LaTeX, Markdown). In theory, Im2Seq methods have a natural advantage over the OD and GNN methods by virtue of directly predicting the table-structure. As such, no post-processing or rules are needed in order to obtain the table-structure, which is necessary with OD and GNN approaches. In practice, this is not entirely true, because a predicted sequence of table-structure markup does not necessarily have to be syntactically correct. Hence, depending on the quality of the predicted sequence, some post-processing needs to be performed to ensure a syntactically valid (let alone correct) sequence."}, {"label": "text", "id": 4, "page_no": 3, "cluster": {"id": 4, "label": "text", "bbox": {"l": 134.76498, "t": 262.65692, "r": 480.59569999999997, "b": 486.6467, "coord_origin": "TOPLEFT"}, "confidence": 0.929087221622467, "cells": [{"id": 15, "text": "Within the Im2Seq method, we find several popular models, namely the", "bbox": {"l": 149.709, "t": 262.65692, "r": 480.59280000000007, "b": 271.45392000000004, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "encoder-dual-decoder model (EDD) [22], TableFormer [9], Tabsplitter[2] and Ye", "bbox": {"l": 134.765, "t": 274.61194, "r": 480.59167, "b": 283.40891, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "et. al. [19]. EDD uses two consecutive long short-term memory (LSTM) decoders", "bbox": {"l": 134.765, "t": 286.56692999999996, "r": 480.59271, "b": 295.36389, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "to predict a table in HTML representation. The", "bbox": {"l": 134.765, "t": 298.52190999999993, "r": 342.02097, "b": 307.31888, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "tag decoder", "bbox": {"l": 345.064, "t": 298.52190999999993, "r": 393.04684, "b": 307.31888, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "predicts a sequence", "bbox": {"l": 397.16699, "t": 298.52190999999993, "r": 480.59082, "b": 307.31888, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "of HTML tags. For each decoded table cell (", "bbox": {"l": 134.76498, "t": 310.47791, "r": 333.29871, "b": 319.27487, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "<td>", "bbox": {"l": 333.29898, "t": 310.47791, "r": 356.9711, "b": 319.27487, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "), the attention is passed to", "bbox": {"l": 357.08499, "t": 310.47791, "r": 480.59433000000007, "b": 319.27487, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "the", "bbox": {"l": 134.76498, "t": 322.43289, "r": 148.59805, "b": 331.22986, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "cell decoder", "bbox": {"l": 152.27698, "t": 322.43289, "r": 202.1109, "b": 331.22986, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "to predict the content with an embedded OCR approach. The", "bbox": {"l": 206.86398, "t": 322.43289, "r": 480.58743, "b": 331.22986, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "latter makes it susceptible to transcription errors in the cell content of the table.", "bbox": {"l": 134.76498, "t": 334.38788, "r": 480.59476, "b": 343.18484, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "TableFormer address this reliance on OCR and uses two transformer decoders for", "bbox": {"l": 134.76498, "t": 346.34286, "r": 480.58675999999997, "b": 355.13983, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "HTML structure and cell bounding box prediction in an end-to-end architecture.", "bbox": {"l": 134.76498, "t": 358.29785, "r": 480.58868, "b": 367.09482, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "The predicted cell bounding box is then used to extract text tokens from an", "bbox": {"l": 134.76498, "t": 370.25284, "r": 480.58868, "b": 379.0498, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "originating (digital) PDF page, circumventing any need for OCR. TabSplitter", "bbox": {"l": 134.76498, "t": 382.20883, "r": 480.59357000000006, "b": 391.0058, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "[2]", "bbox": {"l": 134.76498, "t": 394.16382, "r": 144.76979, "b": 402.96078, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "proposes a compact double-matrix representation of table rows and columns", "bbox": {"l": 149.50908, "t": 394.16382, "r": 480.58667, "b": 402.96078, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "to do error detection and error correction of HTML structure sequences based", "bbox": {"l": 134.76498, "t": 406.1188, "r": 480.59569999999997, "b": 414.91576999999995, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "on predictions from [19]. This compact double-matrix representation can not be", "bbox": {"l": 134.76498, "t": 418.07379, "r": 480.59180000000003, "b": 426.87076, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "used directly by the Img2seq model training, so the model uses HTML as an", "bbox": {"l": 134.76498, "t": 430.02878, "r": 480.5878000000001, "b": 438.82574, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "intermediate form. Chi et. al. [4] introduce a data set and a baseline method", "bbox": {"l": 134.76498, "t": 441.98376, "r": 480.58868, "b": 450.78073, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "using bidirectional LSTMs to predict LaTeX code. Kayal", "bbox": {"l": 134.76498, "t": 453.93976000000004, "r": 384.5752, "b": 462.73672, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "[5]", "bbox": {"l": 391.55899, "t": 453.93976000000004, "r": 401.73236, "b": 462.73672, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "introduces Gated", "bbox": {"l": 406.55154, "t": 453.93976000000004, "r": 480.58777, "b": 462.73672, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "ResNet transformers to predict LaTeX code, and a separate OCR module to", "bbox": {"l": 134.76498, "t": 465.89474, "r": 480.59079, "b": 474.69171, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "extract content.", "bbox": {"l": 134.76498, "t": 477.84973, "r": 203.68625, "b": 486.6467, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Within the Im2Seq method, we find several popular models, namely the encoder-dual-decoder model (EDD) [22], TableFormer [9], Tabsplitter[2] and Ye et. al. [19]. EDD uses two consecutive long short-term memory (LSTM) decoders to predict a table in HTML representation. The tag decoder predicts a sequence of HTML tags. For each decoded table cell ( <td> ), the attention is passed to the cell decoder to predict the content with an embedded OCR approach. The latter makes it susceptible to transcription errors in the cell content of the table. TableFormer address this reliance on OCR and uses two transformer decoders for HTML structure and cell bounding box prediction in an end-to-end architecture. The predicted cell bounding box is then used to extract text tokens from an originating (digital) PDF page, circumventing any need for OCR. TabSplitter [2] proposes a compact double-matrix representation of table rows and columns to do error detection and error correction of HTML structure sequences based on predictions from [19]. This compact double-matrix representation can not be used directly by the Img2seq model training, so the model uses HTML as an intermediate form. Chi et. al. [4] introduce a data set and a baseline method using bidirectional LSTMs to predict LaTeX code. Kayal [5] introduces Gated ResNet transformers to predict LaTeX code, and a separate OCR module to extract content."}, {"label": "text", "id": 0, "page_no": 3, "cluster": {"id": 0, "label": "text", "bbox": {"l": 134.76498, "t": 490.06573, "r": 480.59378, "b": 582.54866, "coord_origin": "TOPLEFT"}, "confidence": 0.9853583574295044, "cells": [{"id": 43, "text": "Im2Seq approaches have shown to be well-suited for the TSR task and allow a", "bbox": {"l": 149.70898, "t": 490.06573, "r": 480.59378, "b": 498.8627, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "full end-to-end network design that can output the final table structure without", "bbox": {"l": 134.76498, "t": 502.02072, "r": 480.58871, "b": 510.81769, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "pre- or post-processing logic. Furthermore, Im2Seq models have demonstrated", "bbox": {"l": 134.76498, "t": 513.9757099999999, "r": 480.58675999999997, "b": 522.7726700000001, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "to deliver state-of-the-art prediction accuracy [9]. This motivated the authors", "bbox": {"l": 134.76498, "t": 525.93069, "r": 480.58978, "b": 534.72766, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "to investigate if the performance (both in accuracy and inference time) can", "bbox": {"l": 134.76498, "t": 537.8857, "r": 480.58765, "b": 546.6826599999999, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "be further improved by optimising the table structure representation language.", "bbox": {"l": 134.76498, "t": 549.84169, "r": 480.58971999999994, "b": 558.63866, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "We believe this is a necessary step before further improving neural network", "bbox": {"l": 134.76498, "t": 561.79669, "r": 480.58871, "b": 570.59366, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "architectures for this task.", "bbox": {"l": 134.76498, "t": 573.75169, "r": 249.27811, "b": 582.54866, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Im2Seq approaches have shown to be well-suited for the TSR task and allow a full end-to-end network design that can output the final table structure without pre- or post-processing logic. Furthermore, Im2Seq models have demonstrated to deliver state-of-the-art prediction accuracy [9]. This motivated the authors to investigate if the performance (both in accuracy and inference time) can be further improved by optimising the table structure representation language. We believe this is a necessary step before further improving neural network architectures for this task."}, {"label": "section_header", "id": 3, "page_no": 3, "cluster": {"id": 3, "label": "section_header", "bbox": {"l": 134.76498, "t": 605.54984, "r": 269.62442, "b": 616.11823, "coord_origin": "TOPLEFT"}, "confidence": 0.9393903017044067, "cells": [{"id": 51, "text": "3", "bbox": {"l": 134.76498, "t": 605.54984, "r": 141.48859, "b": 616.11823, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Problem Statement", "bbox": {"l": 154.93819, "t": 605.54984, "r": 269.62442, "b": 616.11823, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3 Problem Statement"}, {"label": "text", "id": 1, "page_no": 3, "cluster": {"id": 1, "label": "text", "bbox": {"l": 134.76498, "t": 632.14769, "r": 480.5936899999999, "b": 664.85566, "coord_origin": "TOPLEFT"}, "confidence": 0.9692807197570801, "cells": [{"id": 53, "text": "All known Im2Seq based models for TSR fundamentally work in similar ways.", "bbox": {"l": 134.76498, "t": 632.14769, "r": 480.59064, "b": 640.94466, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "Given an image of a table, the Im2Seq model predicts the structure of the table", "bbox": {"l": 134.76498, "t": 644.1026899999999, "r": 480.5867, "b": 652.89966, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "by generating a sequence of tokens. These tokens originate from a finite vocab-", "bbox": {"l": 134.76498, "t": 656.0586900000001, "r": 480.5936899999999, "b": 664.85566, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "All known Im2Seq based models for TSR fundamentally work in similar ways. Given an image of a table, the Im2Seq model predicts the structure of the table by generating a sequence of tokens. These tokens originate from a finite vocab-"}], "body": [{"label": "text", "id": 2, "page_no": 3, "cluster": {"id": 2, "label": "text", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.5957599999999, "b": 259.23792000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9467443823814392, "cells": [{"id": 3, "text": "Other work [20] aims at predicting a grid for each table and deciding which cells", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.59375, "b": 127.73077, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "must be merged using an attention network. Im2Seq methods cast the problem", "bbox": {"l": 134.765, "t": 130.88878999999997, "r": 480.58774, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "as a sequence generation task [4,5,9,22], and therefore need an internal table-", "bbox": {"l": 134.765, "t": 142.84479, "r": 480.58675999999997, "b": 151.64178000000004, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "structure representation language, which is often implemented with standard", "bbox": {"l": 134.765, "t": 154.7998, "r": 480.5878000000001, "b": 163.59680000000003, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "markup languages (e.g. HTML, LaTeX, Markdown). In theory, Im2Seq methods", "bbox": {"l": 134.765, "t": 166.75482, "r": 480.59271, "b": 175.55182000000002, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "have a natural advantage over the OD and GNN methods by virtue of directly", "bbox": {"l": 134.765, "t": 178.70983999999999, "r": 480.5957599999999, "b": 187.50684, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "predicting the table-structure. As such, no post-processing or rules are needed", "bbox": {"l": 134.765, "t": 190.66485999999998, "r": 480.59271, "b": 199.46185000000003, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "in order to obtain the table-structure, which is necessary with OD and GNN", "bbox": {"l": 134.765, "t": 202.61987, "r": 480.59378, "b": 211.41687000000002, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "approaches. In practice, this is not entirely true, because a predicted sequence", "bbox": {"l": 134.765, "t": 214.57587, "r": 480.58783000000005, "b": 223.37285999999995, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "of table-structure markup does not necessarily have to be syntactically correct.", "bbox": {"l": 134.765, "t": 226.53088000000002, "r": 480.58978, "b": 235.32788000000005, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Hence, depending on the quality of the predicted sequence, some post-processing", "bbox": {"l": 134.765, "t": 238.48590000000002, "r": 480.59572999999995, "b": 247.28290000000004, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "needs to be performed to ensure a syntactically valid (let alone correct) sequence.", "bbox": {"l": 134.765, "t": 250.44092, "r": 480.59473, "b": 259.23792000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Other work [20] aims at predicting a grid for each table and deciding which cells must be merged using an attention network. Im2Seq methods cast the problem as a sequence generation task [4,5,9,22], and therefore need an internal tablestructure representation language, which is often implemented with standard markup languages (e.g. HTML, LaTeX, Markdown). In theory, Im2Seq methods have a natural advantage over the OD and GNN methods by virtue of directly predicting the table-structure. As such, no post-processing or rules are needed in order to obtain the table-structure, which is necessary with OD and GNN approaches. In practice, this is not entirely true, because a predicted sequence of table-structure markup does not necessarily have to be syntactically correct. Hence, depending on the quality of the predicted sequence, some post-processing needs to be performed to ensure a syntactically valid (let alone correct) sequence."}, {"label": "text", "id": 4, "page_no": 3, "cluster": {"id": 4, "label": "text", "bbox": {"l": 134.76498, "t": 262.65692, "r": 480.59569999999997, "b": 486.6467, "coord_origin": "TOPLEFT"}, "confidence": 0.929087221622467, "cells": [{"id": 15, "text": "Within the Im2Seq method, we find several popular models, namely the", "bbox": {"l": 149.709, "t": 262.65692, "r": 480.59280000000007, "b": 271.45392000000004, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "encoder-dual-decoder model (EDD) [22], TableFormer [9], Tabsplitter[2] and Ye", "bbox": {"l": 134.765, "t": 274.61194, "r": 480.59167, "b": 283.40891, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "et. al. [19]. EDD uses two consecutive long short-term memory (LSTM) decoders", "bbox": {"l": 134.765, "t": 286.56692999999996, "r": 480.59271, "b": 295.36389, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "to predict a table in HTML representation. The", "bbox": {"l": 134.765, "t": 298.52190999999993, "r": 342.02097, "b": 307.31888, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "tag decoder", "bbox": {"l": 345.064, "t": 298.52190999999993, "r": 393.04684, "b": 307.31888, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "predicts a sequence", "bbox": {"l": 397.16699, "t": 298.52190999999993, "r": 480.59082, "b": 307.31888, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "of HTML tags. For each decoded table cell (", "bbox": {"l": 134.76498, "t": 310.47791, "r": 333.29871, "b": 319.27487, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "<td>", "bbox": {"l": 333.29898, "t": 310.47791, "r": 356.9711, "b": 319.27487, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "), the attention is passed to", "bbox": {"l": 357.08499, "t": 310.47791, "r": 480.59433000000007, "b": 319.27487, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "the", "bbox": {"l": 134.76498, "t": 322.43289, "r": 148.59805, "b": 331.22986, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "cell decoder", "bbox": {"l": 152.27698, "t": 322.43289, "r": 202.1109, "b": 331.22986, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "to predict the content with an embedded OCR approach. The", "bbox": {"l": 206.86398, "t": 322.43289, "r": 480.58743, "b": 331.22986, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "latter makes it susceptible to transcription errors in the cell content of the table.", "bbox": {"l": 134.76498, "t": 334.38788, "r": 480.59476, "b": 343.18484, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "TableFormer address this reliance on OCR and uses two transformer decoders for", "bbox": {"l": 134.76498, "t": 346.34286, "r": 480.58675999999997, "b": 355.13983, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "HTML structure and cell bounding box prediction in an end-to-end architecture.", "bbox": {"l": 134.76498, "t": 358.29785, "r": 480.58868, "b": 367.09482, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "The predicted cell bounding box is then used to extract text tokens from an", "bbox": {"l": 134.76498, "t": 370.25284, "r": 480.58868, "b": 379.0498, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "originating (digital) PDF page, circumventing any need for OCR. TabSplitter", "bbox": {"l": 134.76498, "t": 382.20883, "r": 480.59357000000006, "b": 391.0058, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "[2]", "bbox": {"l": 134.76498, "t": 394.16382, "r": 144.76979, "b": 402.96078, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "proposes a compact double-matrix representation of table rows and columns", "bbox": {"l": 149.50908, "t": 394.16382, "r": 480.58667, "b": 402.96078, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "to do error detection and error correction of HTML structure sequences based", "bbox": {"l": 134.76498, "t": 406.1188, "r": 480.59569999999997, "b": 414.91576999999995, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "on predictions from [19]. This compact double-matrix representation can not be", "bbox": {"l": 134.76498, "t": 418.07379, "r": 480.59180000000003, "b": 426.87076, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "used directly by the Img2seq model training, so the model uses HTML as an", "bbox": {"l": 134.76498, "t": 430.02878, "r": 480.5878000000001, "b": 438.82574, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "intermediate form. Chi et. al. [4] introduce a data set and a baseline method", "bbox": {"l": 134.76498, "t": 441.98376, "r": 480.58868, "b": 450.78073, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "using bidirectional LSTMs to predict LaTeX code. Kayal", "bbox": {"l": 134.76498, "t": 453.93976000000004, "r": 384.5752, "b": 462.73672, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "[5]", "bbox": {"l": 391.55899, "t": 453.93976000000004, "r": 401.73236, "b": 462.73672, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "introduces Gated", "bbox": {"l": 406.55154, "t": 453.93976000000004, "r": 480.58777, "b": 462.73672, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "ResNet transformers to predict LaTeX code, and a separate OCR module to", "bbox": {"l": 134.76498, "t": 465.89474, "r": 480.59079, "b": 474.69171, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "extract content.", "bbox": {"l": 134.76498, "t": 477.84973, "r": 203.68625, "b": 486.6467, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Within the Im2Seq method, we find several popular models, namely the encoder-dual-decoder model (EDD) [22], TableFormer [9], Tabsplitter[2] and Ye et. al. [19]. EDD uses two consecutive long short-term memory (LSTM) decoders to predict a table in HTML representation. The tag decoder predicts a sequence of HTML tags. For each decoded table cell ( <td> ), the attention is passed to the cell decoder to predict the content with an embedded OCR approach. The latter makes it susceptible to transcription errors in the cell content of the table. TableFormer address this reliance on OCR and uses two transformer decoders for HTML structure and cell bounding box prediction in an end-to-end architecture. The predicted cell bounding box is then used to extract text tokens from an originating (digital) PDF page, circumventing any need for OCR. TabSplitter [2] proposes a compact double-matrix representation of table rows and columns to do error detection and error correction of HTML structure sequences based on predictions from [19]. This compact double-matrix representation can not be used directly by the Img2seq model training, so the model uses HTML as an intermediate form. Chi et. al. [4] introduce a data set and a baseline method using bidirectional LSTMs to predict LaTeX code. Kayal [5] introduces Gated ResNet transformers to predict LaTeX code, and a separate OCR module to extract content."}, {"label": "text", "id": 0, "page_no": 3, "cluster": {"id": 0, "label": "text", "bbox": {"l": 134.76498, "t": 490.06573, "r": 480.59378, "b": 582.54866, "coord_origin": "TOPLEFT"}, "confidence": 0.9853583574295044, "cells": [{"id": 43, "text": "Im2Seq approaches have shown to be well-suited for the TSR task and allow a", "bbox": {"l": 149.70898, "t": 490.06573, "r": 480.59378, "b": 498.8627, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "full end-to-end network design that can output the final table structure without", "bbox": {"l": 134.76498, "t": 502.02072, "r": 480.58871, "b": 510.81769, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "pre- or post-processing logic. Furthermore, Im2Seq models have demonstrated", "bbox": {"l": 134.76498, "t": 513.9757099999999, "r": 480.58675999999997, "b": 522.7726700000001, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "to deliver state-of-the-art prediction accuracy [9]. This motivated the authors", "bbox": {"l": 134.76498, "t": 525.93069, "r": 480.58978, "b": 534.72766, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "to investigate if the performance (both in accuracy and inference time) can", "bbox": {"l": 134.76498, "t": 537.8857, "r": 480.58765, "b": 546.6826599999999, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "be further improved by optimising the table structure representation language.", "bbox": {"l": 134.76498, "t": 549.84169, "r": 480.58971999999994, "b": 558.63866, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "We believe this is a necessary step before further improving neural network", "bbox": {"l": 134.76498, "t": 561.79669, "r": 480.58871, "b": 570.59366, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "architectures for this task.", "bbox": {"l": 134.76498, "t": 573.75169, "r": 249.27811, "b": 582.54866, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Im2Seq approaches have shown to be well-suited for the TSR task and allow a full end-to-end network design that can output the final table structure without pre- or post-processing logic. Furthermore, Im2Seq models have demonstrated to deliver state-of-the-art prediction accuracy [9]. This motivated the authors to investigate if the performance (both in accuracy and inference time) can be further improved by optimising the table structure representation language. We believe this is a necessary step before further improving neural network architectures for this task."}, {"label": "section_header", "id": 3, "page_no": 3, "cluster": {"id": 3, "label": "section_header", "bbox": {"l": 134.76498, "t": 605.54984, "r": 269.62442, "b": 616.11823, "coord_origin": "TOPLEFT"}, "confidence": 0.9393903017044067, "cells": [{"id": 51, "text": "3", "bbox": {"l": 134.76498, "t": 605.54984, "r": 141.48859, "b": 616.11823, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Problem Statement", "bbox": {"l": 154.93819, "t": 605.54984, "r": 269.62442, "b": 616.11823, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3 Problem Statement"}, {"label": "text", "id": 1, "page_no": 3, "cluster": {"id": 1, "label": "text", "bbox": {"l": 134.76498, "t": 632.14769, "r": 480.5936899999999, "b": 664.85566, "coord_origin": "TOPLEFT"}, "confidence": 0.9692807197570801, "cells": [{"id": 53, "text": "All known Im2Seq based models for TSR fundamentally work in similar ways.", "bbox": {"l": 134.76498, "t": 632.14769, "r": 480.59064, "b": 640.94466, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "Given an image of a table, the Im2Seq model predicts the structure of the table", "bbox": {"l": 134.76498, "t": 644.1026899999999, "r": 480.5867, "b": 652.89966, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "by generating a sequence of tokens. These tokens originate from a finite vocab-", "bbox": {"l": 134.76498, "t": 656.0586900000001, "r": 480.5936899999999, "b": 664.85566, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "All known Im2Seq based models for TSR fundamentally work in similar ways. Given an image of a table, the Im2Seq model predicts the structure of the table by generating a sequence of tokens. These tokens originate from a finite vocab-"}], "headers": [{"label": "page_header", "id": 6, "page_no": 3, "cluster": {"id": 6, "label": "page_header", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.7890051603317261, "cells": [{"id": 0, "text": "4", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4"}, {"label": "page_header", "id": 5, "page_no": 3, "cluster": {"id": 5, "label": "page_header", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9045588374137878, "cells": [{"id": 1, "text": "M.", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 178.07675, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37415, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "M. Lysak, et al."}]}}, {"page_no": 4, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "5", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "ulary and can be interpreted as a table structure. For example, with the HTML", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.58577999999994, "b": 127.73077, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "tokens", "bbox": {"l": 134.765, "t": 130.88878999999997, "r": 162.48494, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "<table>", "bbox": {"l": 166.368, "t": 130.88878999999997, "r": 201.74918, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": ",", "bbox": {"l": 201.74899, "t": 130.88878999999997, "r": 204.51561, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "</table>", "bbox": {"l": 208.39699, "t": 130.88878999999997, "r": 248.86904999999996, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": ",", "bbox": {"l": 248.86899, "t": 130.88878999999997, "r": 251.6356, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "<tr>", "bbox": {"l": 255.51698, "t": 130.88878999999997, "r": 278.29846, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": ",", "bbox": {"l": 278.29797, "t": 130.88878999999997, "r": 281.06458, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "</tr>", "bbox": {"l": 284.94598, "t": 130.88878999999997, "r": 312.81836, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": ",", "bbox": {"l": 312.81799, "t": 130.88878999999997, "r": 315.58459, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "<td>", "bbox": {"l": 319.466, "t": 130.88878999999997, "r": 343.13812, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "and", "bbox": {"l": 347.13202, "t": 130.88878999999997, "r": 363.17877, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "</td>", "bbox": {"l": 367.06003, "t": 130.88878999999997, "r": 395.82306, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": ", one can construct", "bbox": {"l": 395.82303, "t": 130.88878999999997, "r": 480.59177000000005, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "simple table structures without any spanning cells. In reality though, one needs", "bbox": {"l": 134.76501, "t": 142.84479, "r": 480.59365999999994, "b": 151.64178000000004, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "at least 28 HTML tokens to describe the most common complex tables observed", "bbox": {"l": 134.76501, "t": 154.7998, "r": 480.58577999999994, "b": 163.59680000000003, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "in real-world documents [21,22], due to a variety of spanning cells definitions in", "bbox": {"l": 134.76501, "t": 166.75482, "r": 480.59378, "b": 175.55182000000002, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "the HTML token vocabulary.", "bbox": {"l": 134.76501, "t": 178.70983999999999, "r": 261.92566, "b": 187.50684, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Fig. 2.", "bbox": {"l": 145.60701, "t": 221.07928000000004, "r": 173.48625, "b": 229.00562000000002, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Frequency of tokens in HTML and OTSL as they appear in PubTabNet.", "bbox": {"l": 176.56001, "t": 221.14209000000005, "r": 469.75223000000005, "b": 229.21178999999995, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "Obviously, HTML and other general-purpose markup languages were not de-", "bbox": {"l": 149.709, "t": 368.20679, "r": 480.59283000000005, "b": 377.00375, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "signed for Im2Seq models. As such, they have some serious drawbacks. First, the", "bbox": {"l": 134.765, "t": 380.16177, "r": 480.58664, "b": 388.9587399999999, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "token vocabulary needs to be artificially large in order to describe all plausible", "bbox": {"l": 134.765, "t": 392.11676, "r": 480.59180000000003, "b": 400.91373, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "tabular structures. Since most Im2Seq models use an autoregressive approach,", "bbox": {"l": 134.765, "t": 404.07175, "r": 480.5897499999999, "b": 412.86871, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "they generate the sequence token by token. Therefore, to reduce inference time,", "bbox": {"l": 134.765, "t": 416.02774, "r": 480.58871, "b": 424.82471, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "a shorter sequence length is critical. Every table-cell is represented by at least", "bbox": {"l": 134.765, "t": 427.98273, "r": 480.59265, "b": 436.77969, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "two tokens (", "bbox": {"l": 134.765, "t": 439.9377099999999, "r": 187.93439, "b": 448.73467999999997, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "<td>", "bbox": {"l": 187.931, "t": 439.9377099999999, "r": 211.60313, "b": 448.73467999999997, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "and", "bbox": {"l": 214.75400000000002, "t": 439.9377099999999, "r": 230.80075000000002, "b": 448.73467999999997, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "</td>", "bbox": {"l": 233.83898999999997, "t": 439.9377099999999, "r": 262.60202, "b": 448.73467999999997, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "). Furthermore, when tokenizing the HTML struc-", "bbox": {"l": 262.716, "t": 439.9377099999999, "r": 480.59009, "b": 448.73467999999997, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "ture, one needs to explicitly enumerate possible column-spans and row-spans", "bbox": {"l": 134.76501, "t": 451.8927, "r": 480.58777, "b": 460.68967, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "as words. In practice, this ends up requiring 28 different HTML tokens (when", "bbox": {"l": 134.76501, "t": 463.84769, "r": 480.58681999999993, "b": 472.64465, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "including column- and row-spans up to 10 cells) just to describe every table in", "bbox": {"l": 134.76501, "t": 475.80368, "r": 480.58681999999993, "b": 484.60065, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "the PubTabNet dataset. Clearly, not every token is equally represented, as is", "bbox": {"l": 134.76501, "t": 487.75867, "r": 480.59067, "b": 496.55563, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "depicted in Figure 2. This skewed distribution of tokens in combination with", "bbox": {"l": 134.76501, "t": 499.71365, "r": 480.59277, "b": 508.51062, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "variable token row-length makes it challenging for models to learn the HTML", "bbox": {"l": 134.76501, "t": 511.66864, "r": 480.59476, "b": 520.46561, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "structure.", "bbox": {"l": 134.76501, "t": 523.62363, "r": 176.92873, "b": 532.42059, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "Additionally, it would be desirable if the representation would easily allow", "bbox": {"l": 149.70901, "t": 536.04263, "r": 480.59289999999993, "b": 544.8396, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "an early detection of invalid sequences on-the-go, before the prediction of the", "bbox": {"l": 134.76501, "t": 547.99763, "r": 480.59085, "b": 556.7946000000001, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "entire table structure is completed. HTML is not well-suited for this purpose as", "bbox": {"l": 134.76501, "t": 559.95264, "r": 480.58984, "b": 568.7496, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "the verification of incomplete sequences is non-trivial or even impossible.", "bbox": {"l": 134.76501, "t": 571.90863, "r": 452.18933, "b": 580.7056, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "In a valid HTML table, the token sequence must describe a 2D grid of table", "bbox": {"l": 149.70901, "t": 584.32663, "r": 480.59283000000005, "b": 593.1236, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "cells, serialised in row-major ordering, where each row and each column have", "bbox": {"l": 134.76501, "t": 596.28262, "r": 480.58978, "b": 605.07959, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "the same length (while considering row- and column-spans). Furthermore, every", "bbox": {"l": 134.76501, "t": 608.23763, "r": 480.5936899999999, "b": 617.03459, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "opening tag in HTML needs to be matched by a closing tag in a correct hierar-", "bbox": {"l": 134.76501, "t": 620.19263, "r": 480.59091, "b": 628.98959, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "chical manner. Since the number of tokens for each table row and column can", "bbox": {"l": 134.76501, "t": 632.1476299999999, "r": 480.58582, "b": 640.9446, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "vary significantly, especially for large tables with many row- and column-spans,", "bbox": {"l": 134.76501, "t": 644.10263, "r": 480.59180000000003, "b": 652.8996, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "it is complex to verify the consistency of predicted structures during sequence", "bbox": {"l": 134.76501, "t": 656.05763, "r": 480.59473, "b": 664.85461, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 5, "label": "page_header", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9269194602966309, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "page_header", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8696112036705017, "cells": [{"id": 1, "text": "5", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.59378, "b": 187.50684, "coord_origin": "TOPLEFT"}, "confidence": 0.9857171773910522, "cells": [{"id": 2, "text": "ulary and can be interpreted as a table structure. For example, with the HTML", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.58577999999994, "b": 127.73077, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "tokens", "bbox": {"l": 134.765, "t": 130.88878999999997, "r": 162.48494, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "<table>", "bbox": {"l": 166.368, "t": 130.88878999999997, "r": 201.74918, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": ",", "bbox": {"l": 201.74899, "t": 130.88878999999997, "r": 204.51561, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "</table>", "bbox": {"l": 208.39699, "t": 130.88878999999997, "r": 248.86904999999996, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": ",", "bbox": {"l": 248.86899, "t": 130.88878999999997, "r": 251.6356, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "<tr>", "bbox": {"l": 255.51698, "t": 130.88878999999997, "r": 278.29846, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": ",", "bbox": {"l": 278.29797, "t": 130.88878999999997, "r": 281.06458, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "</tr>", "bbox": {"l": 284.94598, "t": 130.88878999999997, "r": 312.81836, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": ",", "bbox": {"l": 312.81799, "t": 130.88878999999997, "r": 315.58459, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "<td>", "bbox": {"l": 319.466, "t": 130.88878999999997, "r": 343.13812, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "and", "bbox": {"l": 347.13202, "t": 130.88878999999997, "r": 363.17877, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "</td>", "bbox": {"l": 367.06003, "t": 130.88878999999997, "r": 395.82306, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": ", one can construct", "bbox": {"l": 395.82303, "t": 130.88878999999997, "r": 480.59177000000005, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "simple table structures without any spanning cells. In reality though, one needs", "bbox": {"l": 134.76501, "t": 142.84479, "r": 480.59365999999994, "b": 151.64178000000004, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "at least 28 HTML tokens to describe the most common complex tables observed", "bbox": {"l": 134.76501, "t": 154.7998, "r": 480.58577999999994, "b": 163.59680000000003, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "in real-world documents [21,22], due to a variety of spanning cells definitions in", "bbox": {"l": 134.76501, "t": 166.75482, "r": 480.59378, "b": 175.55182000000002, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "the HTML token vocabulary.", "bbox": {"l": 134.76501, "t": 178.70983999999999, "r": 261.92566, "b": 187.50684, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "caption", "bbox": {"l": 145.60701, "t": 221.07928000000004, "r": 469.75223000000005, "b": 229.21178999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.8472551703453064, "cells": [{"id": 20, "text": "Fig. 2.", "bbox": {"l": 145.60701, "t": 221.07928000000004, "r": 173.48625, "b": 229.00562000000002, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Frequency of tokens in HTML and OTSL as they appear in PubTabNet.", "bbox": {"l": 176.56001, "t": 221.14209000000005, "r": 469.75223000000005, "b": 229.21178999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 134.765, "t": 368.20679, "r": 480.59476, "b": 532.42059, "coord_origin": "TOPLEFT"}, "confidence": 0.9844799637794495, "cells": [{"id": 22, "text": "Obviously, HTML and other general-purpose markup languages were not de-", "bbox": {"l": 149.709, "t": 368.20679, "r": 480.59283000000005, "b": 377.00375, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "signed for Im2Seq models. As such, they have some serious drawbacks. First, the", "bbox": {"l": 134.765, "t": 380.16177, "r": 480.58664, "b": 388.9587399999999, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "token vocabulary needs to be artificially large in order to describe all plausible", "bbox": {"l": 134.765, "t": 392.11676, "r": 480.59180000000003, "b": 400.91373, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "tabular structures. Since most Im2Seq models use an autoregressive approach,", "bbox": {"l": 134.765, "t": 404.07175, "r": 480.5897499999999, "b": 412.86871, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "they generate the sequence token by token. Therefore, to reduce inference time,", "bbox": {"l": 134.765, "t": 416.02774, "r": 480.58871, "b": 424.82471, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "a shorter sequence length is critical. Every table-cell is represented by at least", "bbox": {"l": 134.765, "t": 427.98273, "r": 480.59265, "b": 436.77969, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "two tokens (", "bbox": {"l": 134.765, "t": 439.9377099999999, "r": 187.93439, "b": 448.73467999999997, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "<td>", "bbox": {"l": 187.931, "t": 439.9377099999999, "r": 211.60313, "b": 448.73467999999997, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "and", "bbox": {"l": 214.75400000000002, "t": 439.9377099999999, "r": 230.80075000000002, "b": 448.73467999999997, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "</td>", "bbox": {"l": 233.83898999999997, "t": 439.9377099999999, "r": 262.60202, "b": 448.73467999999997, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "). Furthermore, when tokenizing the HTML struc-", "bbox": {"l": 262.716, "t": 439.9377099999999, "r": 480.59009, "b": 448.73467999999997, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "ture, one needs to explicitly enumerate possible column-spans and row-spans", "bbox": {"l": 134.76501, "t": 451.8927, "r": 480.58777, "b": 460.68967, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "as words. In practice, this ends up requiring 28 different HTML tokens (when", "bbox": {"l": 134.76501, "t": 463.84769, "r": 480.58681999999993, "b": 472.64465, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "including column- and row-spans up to 10 cells) just to describe every table in", "bbox": {"l": 134.76501, "t": 475.80368, "r": 480.58681999999993, "b": 484.60065, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "the PubTabNet dataset. Clearly, not every token is equally represented, as is", "bbox": {"l": 134.76501, "t": 487.75867, "r": 480.59067, "b": 496.55563, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "depicted in Figure 2. This skewed distribution of tokens in combination with", "bbox": {"l": 134.76501, "t": 499.71365, "r": 480.59277, "b": 508.51062, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "variable token row-length makes it challenging for models to learn the HTML", "bbox": {"l": 134.76501, "t": 511.66864, "r": 480.59476, "b": 520.46561, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "structure.", "bbox": {"l": 134.76501, "t": 523.62363, "r": 176.92873, "b": 532.42059, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 134.76501, "t": 536.04263, "r": 480.59289999999993, "b": 580.7056, "coord_origin": "TOPLEFT"}, "confidence": 0.978394627571106, "cells": [{"id": 40, "text": "Additionally, it would be desirable if the representation would easily allow", "bbox": {"l": 149.70901, "t": 536.04263, "r": 480.59289999999993, "b": 544.8396, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "an early detection of invalid sequences on-the-go, before the prediction of the", "bbox": {"l": 134.76501, "t": 547.99763, "r": 480.59085, "b": 556.7946000000001, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "entire table structure is completed. HTML is not well-suited for this purpose as", "bbox": {"l": 134.76501, "t": 559.95264, "r": 480.58984, "b": 568.7496, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "the verification of incomplete sequences is non-trivial or even impossible.", "bbox": {"l": 134.76501, "t": 571.90863, "r": 452.18933, "b": 580.7056, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 134.76501, "t": 584.32663, "r": 480.59473, "b": 664.85461, "coord_origin": "TOPLEFT"}, "confidence": 0.9838283061981201, "cells": [{"id": 44, "text": "In a valid HTML table, the token sequence must describe a 2D grid of table", "bbox": {"l": 149.70901, "t": 584.32663, "r": 480.59283000000005, "b": 593.1236, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "cells, serialised in row-major ordering, where each row and each column have", "bbox": {"l": 134.76501, "t": 596.28262, "r": 480.58978, "b": 605.07959, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "the same length (while considering row- and column-spans). Furthermore, every", "bbox": {"l": 134.76501, "t": 608.23763, "r": 480.5936899999999, "b": 617.03459, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "opening tag in HTML needs to be matched by a closing tag in a correct hierar-", "bbox": {"l": 134.76501, "t": 620.19263, "r": 480.59091, "b": 628.98959, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "chical manner. Since the number of tokens for each table row and column can", "bbox": {"l": 134.76501, "t": 632.1476299999999, "r": 480.58582, "b": 640.9446, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "vary significantly, especially for large tables with many row- and column-spans,", "bbox": {"l": 134.76501, "t": 644.10263, "r": 480.59180000000003, "b": 652.8996, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "it is complex to verify the consistency of predicted structures during sequence", "bbox": {"l": 134.76501, "t": 656.05763, "r": 480.59473, "b": 664.85461, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "picture", "bbox": {"l": 137.41448974609375, "t": 233.51231384277344, "r": 476.5608215332031, "b": 340.2304992675781, "coord_origin": "TOPLEFT"}, "confidence": 0.9387977123260498, "cells": [], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_header", "id": 5, "page_no": 4, "cluster": {"id": 5, "label": "page_header", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9269194602966309, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Optimized Table Tokenization for Table Structure Recognition"}, {"label": "page_header", "id": 6, "page_no": 4, "cluster": {"id": 6, "label": "page_header", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8696112036705017, "cells": [{"id": 1, "text": "5", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5"}, {"label": "text", "id": 0, "page_no": 4, "cluster": {"id": 0, "label": "text", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.59378, "b": 187.50684, "coord_origin": "TOPLEFT"}, "confidence": 0.9857171773910522, "cells": [{"id": 2, "text": "ulary and can be interpreted as a table structure. For example, with the HTML", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.58577999999994, "b": 127.73077, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "tokens", "bbox": {"l": 134.765, "t": 130.88878999999997, "r": 162.48494, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "<table>", "bbox": {"l": 166.368, "t": 130.88878999999997, "r": 201.74918, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": ",", "bbox": {"l": 201.74899, "t": 130.88878999999997, "r": 204.51561, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "</table>", "bbox": {"l": 208.39699, "t": 130.88878999999997, "r": 248.86904999999996, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": ",", "bbox": {"l": 248.86899, "t": 130.88878999999997, "r": 251.6356, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "<tr>", "bbox": {"l": 255.51698, "t": 130.88878999999997, "r": 278.29846, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": ",", "bbox": {"l": 278.29797, "t": 130.88878999999997, "r": 281.06458, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "</tr>", "bbox": {"l": 284.94598, "t": 130.88878999999997, "r": 312.81836, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": ",", "bbox": {"l": 312.81799, "t": 130.88878999999997, "r": 315.58459, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "<td>", "bbox": {"l": 319.466, "t": 130.88878999999997, "r": 343.13812, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "and", "bbox": {"l": 347.13202, "t": 130.88878999999997, "r": 363.17877, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "</td>", "bbox": {"l": 367.06003, "t": 130.88878999999997, "r": 395.82306, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": ", one can construct", "bbox": {"l": 395.82303, "t": 130.88878999999997, "r": 480.59177000000005, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "simple table structures without any spanning cells. In reality though, one needs", "bbox": {"l": 134.76501, "t": 142.84479, "r": 480.59365999999994, "b": 151.64178000000004, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "at least 28 HTML tokens to describe the most common complex tables observed", "bbox": {"l": 134.76501, "t": 154.7998, "r": 480.58577999999994, "b": 163.59680000000003, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "in real-world documents [21,22], due to a variety of spanning cells definitions in", "bbox": {"l": 134.76501, "t": 166.75482, "r": 480.59378, "b": 175.55182000000002, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "the HTML token vocabulary.", "bbox": {"l": 134.76501, "t": 178.70983999999999, "r": 261.92566, "b": 187.50684, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "ulary and can be interpreted as a table structure. For example, with the HTML tokens <table> , </table> , <tr> , </tr> , <td> and </td> , one can construct simple table structures without any spanning cells. In reality though, one needs at least 28 HTML tokens to describe the most common complex tables observed in real-world documents [21,22], due to a variety of spanning cells definitions in the HTML token vocabulary."}, {"label": "caption", "id": 7, "page_no": 4, "cluster": {"id": 7, "label": "caption", "bbox": {"l": 145.60701, "t": 221.07928000000004, "r": 469.75223000000005, "b": 229.21178999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.8472551703453064, "cells": [{"id": 20, "text": "Fig. 2.", "bbox": {"l": 145.60701, "t": 221.07928000000004, "r": 173.48625, "b": 229.00562000000002, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Frequency of tokens in HTML and OTSL as they appear in PubTabNet.", "bbox": {"l": 176.56001, "t": 221.14209000000005, "r": 469.75223000000005, "b": 229.21178999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Fig. 2. Frequency of tokens in HTML and OTSL as they appear in PubTabNet."}, {"label": "text", "id": 1, "page_no": 4, "cluster": {"id": 1, "label": "text", "bbox": {"l": 134.765, "t": 368.20679, "r": 480.59476, "b": 532.42059, "coord_origin": "TOPLEFT"}, "confidence": 0.9844799637794495, "cells": [{"id": 22, "text": "Obviously, HTML and other general-purpose markup languages were not de-", "bbox": {"l": 149.709, "t": 368.20679, "r": 480.59283000000005, "b": 377.00375, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "signed for Im2Seq models. As such, they have some serious drawbacks. First, the", "bbox": {"l": 134.765, "t": 380.16177, "r": 480.58664, "b": 388.9587399999999, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "token vocabulary needs to be artificially large in order to describe all plausible", "bbox": {"l": 134.765, "t": 392.11676, "r": 480.59180000000003, "b": 400.91373, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "tabular structures. Since most Im2Seq models use an autoregressive approach,", "bbox": {"l": 134.765, "t": 404.07175, "r": 480.5897499999999, "b": 412.86871, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "they generate the sequence token by token. Therefore, to reduce inference time,", "bbox": {"l": 134.765, "t": 416.02774, "r": 480.58871, "b": 424.82471, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "a shorter sequence length is critical. Every table-cell is represented by at least", "bbox": {"l": 134.765, "t": 427.98273, "r": 480.59265, "b": 436.77969, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "two tokens (", "bbox": {"l": 134.765, "t": 439.9377099999999, "r": 187.93439, "b": 448.73467999999997, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "<td>", "bbox": {"l": 187.931, "t": 439.9377099999999, "r": 211.60313, "b": 448.73467999999997, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "and", "bbox": {"l": 214.75400000000002, "t": 439.9377099999999, "r": 230.80075000000002, "b": 448.73467999999997, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "</td>", "bbox": {"l": 233.83898999999997, "t": 439.9377099999999, "r": 262.60202, "b": 448.73467999999997, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "). Furthermore, when tokenizing the HTML struc-", "bbox": {"l": 262.716, "t": 439.9377099999999, "r": 480.59009, "b": 448.73467999999997, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "ture, one needs to explicitly enumerate possible column-spans and row-spans", "bbox": {"l": 134.76501, "t": 451.8927, "r": 480.58777, "b": 460.68967, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "as words. In practice, this ends up requiring 28 different HTML tokens (when", "bbox": {"l": 134.76501, "t": 463.84769, "r": 480.58681999999993, "b": 472.64465, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "including column- and row-spans up to 10 cells) just to describe every table in", "bbox": {"l": 134.76501, "t": 475.80368, "r": 480.58681999999993, "b": 484.60065, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "the PubTabNet dataset. Clearly, not every token is equally represented, as is", "bbox": {"l": 134.76501, "t": 487.75867, "r": 480.59067, "b": 496.55563, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "depicted in Figure 2. This skewed distribution of tokens in combination with", "bbox": {"l": 134.76501, "t": 499.71365, "r": 480.59277, "b": 508.51062, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "variable token row-length makes it challenging for models to learn the HTML", "bbox": {"l": 134.76501, "t": 511.66864, "r": 480.59476, "b": 520.46561, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "structure.", "bbox": {"l": 134.76501, "t": 523.62363, "r": 176.92873, "b": 532.42059, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Obviously, HTML and other general-purpose markup languages were not designed for Im2Seq models. As such, they have some serious drawbacks. First, the token vocabulary needs to be artificially large in order to describe all plausible tabular structures. Since most Im2Seq models use an autoregressive approach, they generate the sequence token by token. Therefore, to reduce inference time, a shorter sequence length is critical. Every table-cell is represented by at least two tokens ( <td> and </td> ). Furthermore, when tokenizing the HTML structure, one needs to explicitly enumerate possible column-spans and row-spans as words. In practice, this ends up requiring 28 different HTML tokens (when including column- and row-spans up to 10 cells) just to describe every table in the PubTabNet dataset. Clearly, not every token is equally represented, as is depicted in Figure 2. This skewed distribution of tokens in combination with variable token row-length makes it challenging for models to learn the HTML structure."}, {"label": "text", "id": 3, "page_no": 4, "cluster": {"id": 3, "label": "text", "bbox": {"l": 134.76501, "t": 536.04263, "r": 480.59289999999993, "b": 580.7056, "coord_origin": "TOPLEFT"}, "confidence": 0.978394627571106, "cells": [{"id": 40, "text": "Additionally, it would be desirable if the representation would easily allow", "bbox": {"l": 149.70901, "t": 536.04263, "r": 480.59289999999993, "b": 544.8396, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "an early detection of invalid sequences on-the-go, before the prediction of the", "bbox": {"l": 134.76501, "t": 547.99763, "r": 480.59085, "b": 556.7946000000001, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "entire table structure is completed. HTML is not well-suited for this purpose as", "bbox": {"l": 134.76501, "t": 559.95264, "r": 480.58984, "b": 568.7496, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "the verification of incomplete sequences is non-trivial or even impossible.", "bbox": {"l": 134.76501, "t": 571.90863, "r": 452.18933, "b": 580.7056, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Additionally, it would be desirable if the representation would easily allow an early detection of invalid sequences on-the-go, before the prediction of the entire table structure is completed. HTML is not well-suited for this purpose as the verification of incomplete sequences is non-trivial or even impossible."}, {"label": "text", "id": 2, "page_no": 4, "cluster": {"id": 2, "label": "text", "bbox": {"l": 134.76501, "t": 584.32663, "r": 480.59473, "b": 664.85461, "coord_origin": "TOPLEFT"}, "confidence": 0.9838283061981201, "cells": [{"id": 44, "text": "In a valid HTML table, the token sequence must describe a 2D grid of table", "bbox": {"l": 149.70901, "t": 584.32663, "r": 480.59283000000005, "b": 593.1236, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "cells, serialised in row-major ordering, where each row and each column have", "bbox": {"l": 134.76501, "t": 596.28262, "r": 480.58978, "b": 605.07959, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "the same length (while considering row- and column-spans). Furthermore, every", "bbox": {"l": 134.76501, "t": 608.23763, "r": 480.5936899999999, "b": 617.03459, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "opening tag in HTML needs to be matched by a closing tag in a correct hierar-", "bbox": {"l": 134.76501, "t": 620.19263, "r": 480.59091, "b": 628.98959, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "chical manner. Since the number of tokens for each table row and column can", "bbox": {"l": 134.76501, "t": 632.1476299999999, "r": 480.58582, "b": 640.9446, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "vary significantly, especially for large tables with many row- and column-spans,", "bbox": {"l": 134.76501, "t": 644.10263, "r": 480.59180000000003, "b": 652.8996, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "it is complex to verify the consistency of predicted structures during sequence", "bbox": {"l": 134.76501, "t": 656.05763, "r": 480.59473, "b": 664.85461, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In a valid HTML table, the token sequence must describe a 2D grid of table cells, serialised in row-major ordering, where each row and each column have the same length (while considering row- and column-spans). Furthermore, every opening tag in HTML needs to be matched by a closing tag in a correct hierarchical manner. Since the number of tokens for each table row and column can vary significantly, especially for large tables with many row- and column-spans, it is complex to verify the consistency of predicted structures during sequence"}, {"label": "picture", "id": 4, "page_no": 4, "cluster": {"id": 4, "label": "picture", "bbox": {"l": 137.41448974609375, "t": 233.51231384277344, "r": 476.5608215332031, "b": 340.2304992675781, "coord_origin": "TOPLEFT"}, "confidence": 0.9387977123260498, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "body": [{"label": "text", "id": 0, "page_no": 4, "cluster": {"id": 0, "label": "text", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.59378, "b": 187.50684, "coord_origin": "TOPLEFT"}, "confidence": 0.9857171773910522, "cells": [{"id": 2, "text": "ulary and can be interpreted as a table structure. For example, with the HTML", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.58577999999994, "b": 127.73077, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "tokens", "bbox": {"l": 134.765, "t": 130.88878999999997, "r": 162.48494, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "<table>", "bbox": {"l": 166.368, "t": 130.88878999999997, "r": 201.74918, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": ",", "bbox": {"l": 201.74899, "t": 130.88878999999997, "r": 204.51561, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "</table>", "bbox": {"l": 208.39699, "t": 130.88878999999997, "r": 248.86904999999996, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": ",", "bbox": {"l": 248.86899, "t": 130.88878999999997, "r": 251.6356, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "<tr>", "bbox": {"l": 255.51698, "t": 130.88878999999997, "r": 278.29846, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": ",", "bbox": {"l": 278.29797, "t": 130.88878999999997, "r": 281.06458, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "</tr>", "bbox": {"l": 284.94598, "t": 130.88878999999997, "r": 312.81836, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": ",", "bbox": {"l": 312.81799, "t": 130.88878999999997, "r": 315.58459, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "<td>", "bbox": {"l": 319.466, "t": 130.88878999999997, "r": 343.13812, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "and", "bbox": {"l": 347.13202, "t": 130.88878999999997, "r": 363.17877, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "</td>", "bbox": {"l": 367.06003, "t": 130.88878999999997, "r": 395.82306, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": ", one can construct", "bbox": {"l": 395.82303, "t": 130.88878999999997, "r": 480.59177000000005, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "simple table structures without any spanning cells. In reality though, one needs", "bbox": {"l": 134.76501, "t": 142.84479, "r": 480.59365999999994, "b": 151.64178000000004, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "at least 28 HTML tokens to describe the most common complex tables observed", "bbox": {"l": 134.76501, "t": 154.7998, "r": 480.58577999999994, "b": 163.59680000000003, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "in real-world documents [21,22], due to a variety of spanning cells definitions in", "bbox": {"l": 134.76501, "t": 166.75482, "r": 480.59378, "b": 175.55182000000002, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "the HTML token vocabulary.", "bbox": {"l": 134.76501, "t": 178.70983999999999, "r": 261.92566, "b": 187.50684, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "ulary and can be interpreted as a table structure. For example, with the HTML tokens <table> , </table> , <tr> , </tr> , <td> and </td> , one can construct simple table structures without any spanning cells. In reality though, one needs at least 28 HTML tokens to describe the most common complex tables observed in real-world documents [21,22], due to a variety of spanning cells definitions in the HTML token vocabulary."}, {"label": "caption", "id": 7, "page_no": 4, "cluster": {"id": 7, "label": "caption", "bbox": {"l": 145.60701, "t": 221.07928000000004, "r": 469.75223000000005, "b": 229.21178999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.8472551703453064, "cells": [{"id": 20, "text": "Fig. 2.", "bbox": {"l": 145.60701, "t": 221.07928000000004, "r": 173.48625, "b": 229.00562000000002, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Frequency of tokens in HTML and OTSL as they appear in PubTabNet.", "bbox": {"l": 176.56001, "t": 221.14209000000005, "r": 469.75223000000005, "b": 229.21178999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Fig. 2. Frequency of tokens in HTML and OTSL as they appear in PubTabNet."}, {"label": "text", "id": 1, "page_no": 4, "cluster": {"id": 1, "label": "text", "bbox": {"l": 134.765, "t": 368.20679, "r": 480.59476, "b": 532.42059, "coord_origin": "TOPLEFT"}, "confidence": 0.9844799637794495, "cells": [{"id": 22, "text": "Obviously, HTML and other general-purpose markup languages were not de-", "bbox": {"l": 149.709, "t": 368.20679, "r": 480.59283000000005, "b": 377.00375, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "signed for Im2Seq models. As such, they have some serious drawbacks. First, the", "bbox": {"l": 134.765, "t": 380.16177, "r": 480.58664, "b": 388.9587399999999, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "token vocabulary needs to be artificially large in order to describe all plausible", "bbox": {"l": 134.765, "t": 392.11676, "r": 480.59180000000003, "b": 400.91373, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "tabular structures. Since most Im2Seq models use an autoregressive approach,", "bbox": {"l": 134.765, "t": 404.07175, "r": 480.5897499999999, "b": 412.86871, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "they generate the sequence token by token. Therefore, to reduce inference time,", "bbox": {"l": 134.765, "t": 416.02774, "r": 480.58871, "b": 424.82471, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "a shorter sequence length is critical. Every table-cell is represented by at least", "bbox": {"l": 134.765, "t": 427.98273, "r": 480.59265, "b": 436.77969, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "two tokens (", "bbox": {"l": 134.765, "t": 439.9377099999999, "r": 187.93439, "b": 448.73467999999997, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "<td>", "bbox": {"l": 187.931, "t": 439.9377099999999, "r": 211.60313, "b": 448.73467999999997, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "and", "bbox": {"l": 214.75400000000002, "t": 439.9377099999999, "r": 230.80075000000002, "b": 448.73467999999997, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "</td>", "bbox": {"l": 233.83898999999997, "t": 439.9377099999999, "r": 262.60202, "b": 448.73467999999997, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "). Furthermore, when tokenizing the HTML struc-", "bbox": {"l": 262.716, "t": 439.9377099999999, "r": 480.59009, "b": 448.73467999999997, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "ture, one needs to explicitly enumerate possible column-spans and row-spans", "bbox": {"l": 134.76501, "t": 451.8927, "r": 480.58777, "b": 460.68967, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "as words. In practice, this ends up requiring 28 different HTML tokens (when", "bbox": {"l": 134.76501, "t": 463.84769, "r": 480.58681999999993, "b": 472.64465, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "including column- and row-spans up to 10 cells) just to describe every table in", "bbox": {"l": 134.76501, "t": 475.80368, "r": 480.58681999999993, "b": 484.60065, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "the PubTabNet dataset. Clearly, not every token is equally represented, as is", "bbox": {"l": 134.76501, "t": 487.75867, "r": 480.59067, "b": 496.55563, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "depicted in Figure 2. This skewed distribution of tokens in combination with", "bbox": {"l": 134.76501, "t": 499.71365, "r": 480.59277, "b": 508.51062, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "variable token row-length makes it challenging for models to learn the HTML", "bbox": {"l": 134.76501, "t": 511.66864, "r": 480.59476, "b": 520.46561, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "structure.", "bbox": {"l": 134.76501, "t": 523.62363, "r": 176.92873, "b": 532.42059, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Obviously, HTML and other general-purpose markup languages were not designed for Im2Seq models. As such, they have some serious drawbacks. First, the token vocabulary needs to be artificially large in order to describe all plausible tabular structures. Since most Im2Seq models use an autoregressive approach, they generate the sequence token by token. Therefore, to reduce inference time, a shorter sequence length is critical. Every table-cell is represented by at least two tokens ( <td> and </td> ). Furthermore, when tokenizing the HTML structure, one needs to explicitly enumerate possible column-spans and row-spans as words. In practice, this ends up requiring 28 different HTML tokens (when including column- and row-spans up to 10 cells) just to describe every table in the PubTabNet dataset. Clearly, not every token is equally represented, as is depicted in Figure 2. This skewed distribution of tokens in combination with variable token row-length makes it challenging for models to learn the HTML structure."}, {"label": "text", "id": 3, "page_no": 4, "cluster": {"id": 3, "label": "text", "bbox": {"l": 134.76501, "t": 536.04263, "r": 480.59289999999993, "b": 580.7056, "coord_origin": "TOPLEFT"}, "confidence": 0.978394627571106, "cells": [{"id": 40, "text": "Additionally, it would be desirable if the representation would easily allow", "bbox": {"l": 149.70901, "t": 536.04263, "r": 480.59289999999993, "b": 544.8396, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "an early detection of invalid sequences on-the-go, before the prediction of the", "bbox": {"l": 134.76501, "t": 547.99763, "r": 480.59085, "b": 556.7946000000001, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "entire table structure is completed. HTML is not well-suited for this purpose as", "bbox": {"l": 134.76501, "t": 559.95264, "r": 480.58984, "b": 568.7496, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "the verification of incomplete sequences is non-trivial or even impossible.", "bbox": {"l": 134.76501, "t": 571.90863, "r": 452.18933, "b": 580.7056, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Additionally, it would be desirable if the representation would easily allow an early detection of invalid sequences on-the-go, before the prediction of the entire table structure is completed. HTML is not well-suited for this purpose as the verification of incomplete sequences is non-trivial or even impossible."}, {"label": "text", "id": 2, "page_no": 4, "cluster": {"id": 2, "label": "text", "bbox": {"l": 134.76501, "t": 584.32663, "r": 480.59473, "b": 664.85461, "coord_origin": "TOPLEFT"}, "confidence": 0.9838283061981201, "cells": [{"id": 44, "text": "In a valid HTML table, the token sequence must describe a 2D grid of table", "bbox": {"l": 149.70901, "t": 584.32663, "r": 480.59283000000005, "b": 593.1236, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "cells, serialised in row-major ordering, where each row and each column have", "bbox": {"l": 134.76501, "t": 596.28262, "r": 480.58978, "b": 605.07959, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "the same length (while considering row- and column-spans). Furthermore, every", "bbox": {"l": 134.76501, "t": 608.23763, "r": 480.5936899999999, "b": 617.03459, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "opening tag in HTML needs to be matched by a closing tag in a correct hierar-", "bbox": {"l": 134.76501, "t": 620.19263, "r": 480.59091, "b": 628.98959, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "chical manner. Since the number of tokens for each table row and column can", "bbox": {"l": 134.76501, "t": 632.1476299999999, "r": 480.58582, "b": 640.9446, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "vary significantly, especially for large tables with many row- and column-spans,", "bbox": {"l": 134.76501, "t": 644.10263, "r": 480.59180000000003, "b": 652.8996, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "it is complex to verify the consistency of predicted structures during sequence", "bbox": {"l": 134.76501, "t": 656.05763, "r": 480.59473, "b": 664.85461, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In a valid HTML table, the token sequence must describe a 2D grid of table cells, serialised in row-major ordering, where each row and each column have the same length (while considering row- and column-spans). Furthermore, every opening tag in HTML needs to be matched by a closing tag in a correct hierarchical manner. Since the number of tokens for each table row and column can vary significantly, especially for large tables with many row- and column-spans, it is complex to verify the consistency of predicted structures during sequence"}, {"label": "picture", "id": 4, "page_no": 4, "cluster": {"id": 4, "label": "picture", "bbox": {"l": 137.41448974609375, "t": 233.51231384277344, "r": 476.5608215332031, "b": 340.2304992675781, "coord_origin": "TOPLEFT"}, "confidence": 0.9387977123260498, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "headers": [{"label": "page_header", "id": 5, "page_no": 4, "cluster": {"id": 5, "label": "page_header", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9269194602966309, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Optimized Table Tokenization for Table Structure Recognition"}, {"label": "page_header", "id": 6, "page_no": 4, "cluster": {"id": 6, "label": "page_header", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8696112036705017, "cells": [{"id": 1, "text": "5", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5"}]}}, {"page_no": 5, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "6", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "M.", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 178.07675, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37415, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "generation. Implicitly, this also means that Im2Seq models need to learn these", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.59479, "b": 127.73077, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "complex syntax rules, simply to deliver valid output.", "bbox": {"l": 134.765, "t": 130.88878999999997, "r": 364.62503, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "In practice, we observe two major issues with prediction quality when train-", "bbox": {"l": 149.709, "t": 143.48279000000002, "r": 480.58981, "b": 152.27979000000005, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "ing Im2Seq models on HTML table structure generation from images. On the", "bbox": {"l": 134.765, "t": 155.43781, "r": 480.59378, "b": 164.23479999999995, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "one hand, we find that on large tables, the visual attention of the model often", "bbox": {"l": 134.765, "t": 167.39282000000003, "r": 480.5867, "b": 176.18982000000005, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "starts to drift and is not accurately moving forward cell by cell anymore. This", "bbox": {"l": 134.765, "t": 179.34784000000002, "r": 480.59476, "b": 188.14484000000004, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "manifests itself in either in an increasing", "bbox": {"l": 134.765, "t": 191.30286, "r": 314.27805, "b": 200.09984999999995, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "location drift", "bbox": {"l": 318.056, "t": 191.30286, "r": 374.08664, "b": 200.09984999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "for proposed table-cells", "bbox": {"l": 378.80899, "t": 191.30286, "r": 480.58594, "b": 200.09984999999995, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "in later rows on the same column or even complete loss of vertical alignment, as", "bbox": {"l": 134.76498, "t": 203.25885000000005, "r": 480.58771, "b": 212.05584999999996, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "illustrated in Figure 5. Addressing this with post-processing is partially possible,", "bbox": {"l": 134.76498, "t": 215.21387000000004, "r": 480.59569999999997, "b": 224.01085999999998, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "but clearly undesired. On the other hand, we find many instances of predictions", "bbox": {"l": 134.76498, "t": 227.16887999999994, "r": 480.59454, "b": 235.96587999999997, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "with structural inconsistencies or plain invalid HTML output, as shown in Fig-", "bbox": {"l": 134.76498, "t": 239.12390000000005, "r": 480.58759000000003, "b": 247.92089999999996, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "ure 6, which are nearly impossible to properly correct. Both problems seriously", "bbox": {"l": 134.76498, "t": 251.07892000000004, "r": 480.59277, "b": 259.87591999999995, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "impact the TSR model performance, since they reflect not only in the task of", "bbox": {"l": 134.76498, "t": 263.03394000000003, "r": 480.59463999999997, "b": 271.83092999999997, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "pure structure recognition but also in the equally crucial recognition or matching", "bbox": {"l": 134.76498, "t": 274.98992999999996, "r": 480.58978, "b": 283.78693, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "of table cell content.", "bbox": {"l": 134.76498, "t": 286.94495, "r": 223.57262, "b": 295.74191, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "4", "bbox": {"l": 134.76498, "t": 320.6311, "r": 141.48859, "b": 331.19949, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Optimised Table Structure Language", "bbox": {"l": 154.93819, "t": 320.6311, "r": 372.50848, "b": 331.19949, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "To mitigate the issues with HTML in Im2Seq-based TSR models laid out before,", "bbox": {"l": 134.76498, "t": 349.11697, "r": 480.59075999999993, "b": 357.91394, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "we propose here our Optimised Table Structure Language (OTSL). OTSL is", "bbox": {"l": 134.76498, "t": 361.07196000000005, "r": 480.58875, "b": 369.86893, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "designed to express table structure with a minimized vocabulary and a simple", "bbox": {"l": 134.76498, "t": 373.02795, "r": 480.58681999999993, "b": 381.82492, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "set of rules, which are both significantly reduced compared to HTML. At the", "bbox": {"l": 134.76498, "t": 384.98294, "r": 480.58875, "b": 393.77991, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "same time, OTSL enables easy error detection and correction during sequence", "bbox": {"l": 134.76498, "t": 396.93793, "r": 480.58978, "b": 405.73489, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "generation. We further demonstrate how the compact structure representation", "bbox": {"l": 134.76498, "t": 408.89291, "r": 480.59473, "b": 417.68988, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "and minimized sequence length improves prediction accuracy and inference time", "bbox": {"l": 134.76498, "t": 420.8479, "r": 480.58868, "b": 429.64487, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "in the TableFormer architecture.", "bbox": {"l": 134.76498, "t": 432.80289, "r": 276.67325, "b": 441.59985, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "4.1", "bbox": {"l": 134.76498, "t": 465.87192, "r": 149.40204, "b": 474.67886, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Language Definition", "bbox": {"l": 160.85902, "t": 465.87192, "r": 261.80109, "b": 474.67886, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "In Figure 3, we illustrate how the OTSL is defined. In essence, the OTSL defines", "bbox": {"l": 134.76498, "t": 488.99789, "r": 480.58871, "b": 497.79486, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "only 5 tokens that directly describe a tabular structure based on an atomic 2D", "bbox": {"l": 134.76498, "t": 500.95288, "r": 480.5867, "b": 509.74985, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "grid.", "bbox": {"l": 134.76498, "t": 512.90887, "r": 154.7131, "b": 521.7058400000001, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "The OTSL vocabulary is comprised of the following tokens:", "bbox": {"l": 149.70898, "t": 525.5018600000001, "r": 409.31137, "b": 534.29883, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "-", "bbox": {"l": 140.99298, "t": 547.96989, "r": 146.72047, "b": 556.77682, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "\"C\" cell -", "bbox": {"l": 151.70099, "t": 547.97986, "r": 193.20619, "b": 556.77682, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "a new table cell", "bbox": {"l": 196.52199, "t": 547.97986, "r": 263.46564, "b": 556.77682, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "that either has or does not have cell content", "bbox": {"l": 267.815, "t": 547.97986, "r": 460.54443, "b": 556.77682, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "-", "bbox": {"l": 140.99301, "t": 560.5629, "r": 146.7205, "b": 569.36983, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "\"L\" cell -", "bbox": {"l": 151.70102, "t": 560.57286, "r": 194.30011, "b": 569.36983, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "left-looking cell", "bbox": {"l": 198.65903, "t": 560.57286, "r": 264.51779, "b": 569.36983, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": ", merging with the left neighbor cell to create a", "bbox": {"l": 264.51804, "t": 560.57286, "r": 480.59392999999994, "b": 569.36983, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "span", "bbox": {"l": 151.70103, "t": 572.52786, "r": 171.67604, "b": 581.32483, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "-", "bbox": {"l": 140.99304, "t": 585.11189, "r": 146.72054, "b": 593.91882, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "\"U\" cell -", "bbox": {"l": 151.70105, "t": 585.12186, "r": 194.11086, "b": 593.91882, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "up-looking cell", "bbox": {"l": 197.74805, "t": 585.12186, "r": 259.89474, "b": 593.91882, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": ", merging with the upper neighbor cell to create a", "bbox": {"l": 259.89206, "t": 585.12186, "r": 480.58856, "b": 593.91882, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "span", "bbox": {"l": 151.70105, "t": 597.07686, "r": 171.67606, "b": 605.87383, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "-", "bbox": {"l": 140.99304, "t": 609.6599, "r": 146.72054, "b": 618.46683, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "\"X\" cell -", "bbox": {"l": 151.70105, "t": 609.66986, "r": 193.48323, "b": 618.46683, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "cross cell", "bbox": {"l": 196.79904, "t": 609.66986, "r": 236.12042, "b": 618.46683, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": ", to merge with both left and upper neighbor cells", "bbox": {"l": 236.12505, "t": 609.66986, "r": 454.55496, "b": 618.46683, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "-", "bbox": {"l": 140.99304, "t": 622.2538900000001, "r": 146.72054, "b": 631.06082, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "\"NL\" -", "bbox": {"l": 151.70105, "t": 622.26385, "r": 181.99434, "b": 631.06082, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "new-line", "bbox": {"l": 185.31705, "t": 622.26385, "r": 221.46236, "b": 631.06082, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": ", switch to the next row.", "bbox": {"l": 221.46104, "t": 622.26385, "r": 328.61676, "b": 631.06082, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "A notable attribute of OTSL is that it has the capability of achieving lossless", "bbox": {"l": 149.70905, "t": 644.10286, "r": 480.59280000000007, "b": 652.8998300000001, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "conversion to HTML.", "bbox": {"l": 134.76505, "t": 656.05786, "r": 228.22321, "b": 664.85484, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 14, "label": "page_header", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8378868699073792, "cells": [{"id": 0, "text": "6", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "page_header", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8919177651405334, "cells": [{"id": 1, "text": "M.", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 178.07675, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37415, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.59479, "b": 139.68579, "coord_origin": "TOPLEFT"}, "confidence": 0.9633480906486511, "cells": [{"id": 3, "text": "generation. Implicitly, this also means that Im2Seq models need to learn these", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.59479, "b": 127.73077, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "complex syntax rules, simply to deliver valid output.", "bbox": {"l": 134.765, "t": 130.88878999999997, "r": 364.62503, "b": 139.68579, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 134.76498, "t": 143.48279000000002, "r": 480.59569999999997, "b": 295.74191, "coord_origin": "TOPLEFT"}, "confidence": 0.9856827855110168, "cells": [{"id": 5, "text": "In practice, we observe two major issues with prediction quality when train-", "bbox": {"l": 149.709, "t": 143.48279000000002, "r": 480.58981, "b": 152.27979000000005, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "ing Im2Seq models on HTML table structure generation from images. On the", "bbox": {"l": 134.765, "t": 155.43781, "r": 480.59378, "b": 164.23479999999995, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "one hand, we find that on large tables, the visual attention of the model often", "bbox": {"l": 134.765, "t": 167.39282000000003, "r": 480.5867, "b": 176.18982000000005, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "starts to drift and is not accurately moving forward cell by cell anymore. This", "bbox": {"l": 134.765, "t": 179.34784000000002, "r": 480.59476, "b": 188.14484000000004, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "manifests itself in either in an increasing", "bbox": {"l": 134.765, "t": 191.30286, "r": 314.27805, "b": 200.09984999999995, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "location drift", "bbox": {"l": 318.056, "t": 191.30286, "r": 374.08664, "b": 200.09984999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "for proposed table-cells", "bbox": {"l": 378.80899, "t": 191.30286, "r": 480.58594, "b": 200.09984999999995, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "in later rows on the same column or even complete loss of vertical alignment, as", "bbox": {"l": 134.76498, "t": 203.25885000000005, "r": 480.58771, "b": 212.05584999999996, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "illustrated in Figure 5. Addressing this with post-processing is partially possible,", "bbox": {"l": 134.76498, "t": 215.21387000000004, "r": 480.59569999999997, "b": 224.01085999999998, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "but clearly undesired. On the other hand, we find many instances of predictions", "bbox": {"l": 134.76498, "t": 227.16887999999994, "r": 480.59454, "b": 235.96587999999997, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "with structural inconsistencies or plain invalid HTML output, as shown in Fig-", "bbox": {"l": 134.76498, "t": 239.12390000000005, "r": 480.58759000000003, "b": 247.92089999999996, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "ure 6, which are nearly impossible to properly correct. Both problems seriously", "bbox": {"l": 134.76498, "t": 251.07892000000004, "r": 480.59277, "b": 259.87591999999995, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "impact the TSR model performance, since they reflect not only in the task of", "bbox": {"l": 134.76498, "t": 263.03394000000003, "r": 480.59463999999997, "b": 271.83092999999997, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "pure structure recognition but also in the equally crucial recognition or matching", "bbox": {"l": 134.76498, "t": 274.98992999999996, "r": 480.58978, "b": 283.78693, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "of table cell content.", "bbox": {"l": 134.76498, "t": 286.94495, "r": 223.57262, "b": 295.74191, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "section_header", "bbox": {"l": 134.76498, "t": 320.6311, "r": 372.50848, "b": 331.19949, "coord_origin": "TOPLEFT"}, "confidence": 0.957028865814209, "cells": [{"id": 20, "text": "4", "bbox": {"l": 134.76498, "t": 320.6311, "r": 141.48859, "b": 331.19949, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Optimised Table Structure Language", "bbox": {"l": 154.93819, "t": 320.6311, "r": 372.50848, "b": 331.19949, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 134.76498, "t": 349.11697, "r": 480.59473, "b": 441.59985, "coord_origin": "TOPLEFT"}, "confidence": 0.9879323840141296, "cells": [{"id": 22, "text": "To mitigate the issues with HTML in Im2Seq-based TSR models laid out before,", "bbox": {"l": 134.76498, "t": 349.11697, "r": 480.59075999999993, "b": 357.91394, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "we propose here our Optimised Table Structure Language (OTSL). OTSL is", "bbox": {"l": 134.76498, "t": 361.07196000000005, "r": 480.58875, "b": 369.86893, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "designed to express table structure with a minimized vocabulary and a simple", "bbox": {"l": 134.76498, "t": 373.02795, "r": 480.58681999999993, "b": 381.82492, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "set of rules, which are both significantly reduced compared to HTML. At the", "bbox": {"l": 134.76498, "t": 384.98294, "r": 480.58875, "b": 393.77991, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "same time, OTSL enables easy error detection and correction during sequence", "bbox": {"l": 134.76498, "t": 396.93793, "r": 480.58978, "b": 405.73489, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "generation. We further demonstrate how the compact structure representation", "bbox": {"l": 134.76498, "t": 408.89291, "r": 480.59473, "b": 417.68988, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "and minimized sequence length improves prediction accuracy and inference time", "bbox": {"l": 134.76498, "t": 420.8479, "r": 480.58868, "b": 429.64487, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "in the TableFormer architecture.", "bbox": {"l": 134.76498, "t": 432.80289, "r": 276.67325, "b": 441.59985, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "section_header", "bbox": {"l": 134.76498, "t": 465.87192, "r": 261.80109, "b": 474.67886, "coord_origin": "TOPLEFT"}, "confidence": 0.9559652209281921, "cells": [{"id": 30, "text": "4.1", "bbox": {"l": 134.76498, "t": 465.87192, "r": 149.40204, "b": 474.67886, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Language Definition", "bbox": {"l": 160.85902, "t": 465.87192, "r": 261.80109, "b": 474.67886, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 134.76498, "t": 488.99789, "r": 480.58871, "b": 521.7058400000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9671263098716736, "cells": [{"id": 32, "text": "In Figure 3, we illustrate how the OTSL is defined. In essence, the OTSL defines", "bbox": {"l": 134.76498, "t": 488.99789, "r": 480.58871, "b": 497.79486, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "only 5 tokens that directly describe a tabular structure based on an atomic 2D", "bbox": {"l": 134.76498, "t": 500.95288, "r": 480.5867, "b": 509.74985, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "grid.", "bbox": {"l": 134.76498, "t": 512.90887, "r": 154.7131, "b": 521.7058400000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 149.70898, "t": 525.5018600000001, "r": 409.31137, "b": 534.29883, "coord_origin": "TOPLEFT"}, "confidence": 0.8555866479873657, "cells": [{"id": 35, "text": "The OTSL vocabulary is comprised of the following tokens:", "bbox": {"l": 149.70898, "t": 525.5018600000001, "r": 409.31137, "b": 534.29883, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "list_item", "bbox": {"l": 140.99298, "t": 547.96989, "r": 460.54443, "b": 556.77682, "coord_origin": "TOPLEFT"}, "confidence": 0.9184334874153137, "cells": [{"id": 36, "text": "-", "bbox": {"l": 140.99298, "t": 547.96989, "r": 146.72047, "b": 556.77682, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "\"C\" cell -", "bbox": {"l": 151.70099, "t": 547.97986, "r": 193.20619, "b": 556.77682, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "a new table cell", "bbox": {"l": 196.52199, "t": 547.97986, "r": 263.46564, "b": 556.77682, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "that either has or does not have cell content", "bbox": {"l": 267.815, "t": 547.97986, "r": 460.54443, "b": 556.77682, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "list_item", "bbox": {"l": 140.99301, "t": 560.5629, "r": 480.59392999999994, "b": 581.32483, "coord_origin": "TOPLEFT"}, "confidence": 0.9319931268692017, "cells": [{"id": 40, "text": "-", "bbox": {"l": 140.99301, "t": 560.5629, "r": 146.7205, "b": 569.36983, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "\"L\" cell -", "bbox": {"l": 151.70102, "t": 560.57286, "r": 194.30011, "b": 569.36983, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "left-looking cell", "bbox": {"l": 198.65903, "t": 560.57286, "r": 264.51779, "b": 569.36983, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": ", merging with the left neighbor cell to create a", "bbox": {"l": 264.51804, "t": 560.57286, "r": 480.59392999999994, "b": 569.36983, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "span", "bbox": {"l": 151.70103, "t": 572.52786, "r": 171.67604, "b": 581.32483, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "list_item", "bbox": {"l": 140.99304, "t": 585.11189, "r": 480.58856, "b": 605.87383, "coord_origin": "TOPLEFT"}, "confidence": 0.9438967704772949, "cells": [{"id": 45, "text": "-", "bbox": {"l": 140.99304, "t": 585.11189, "r": 146.72054, "b": 593.91882, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "\"U\" cell -", "bbox": {"l": 151.70105, "t": 585.12186, "r": 194.11086, "b": 593.91882, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "up-looking cell", "bbox": {"l": 197.74805, "t": 585.12186, "r": 259.89474, "b": 593.91882, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": ", merging with the upper neighbor cell to create a", "bbox": {"l": 259.89206, "t": 585.12186, "r": 480.58856, "b": 593.91882, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "span", "bbox": {"l": 151.70105, "t": 597.07686, "r": 171.67606, "b": 605.87383, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "list_item", "bbox": {"l": 140.99304, "t": 609.6599, "r": 454.55496, "b": 618.46683, "coord_origin": "TOPLEFT"}, "confidence": 0.9036387801170349, "cells": [{"id": 50, "text": "-", "bbox": {"l": 140.99304, "t": 609.6599, "r": 146.72054, "b": 618.46683, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "\"X\" cell -", "bbox": {"l": 151.70105, "t": 609.66986, "r": 193.48323, "b": 618.46683, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "cross cell", "bbox": {"l": 196.79904, "t": 609.66986, "r": 236.12042, "b": 618.46683, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": ", to merge with both left and upper neighbor cells", "bbox": {"l": 236.12505, "t": 609.66986, "r": 454.55496, "b": 618.46683, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "list_item", "bbox": {"l": 140.99304, "t": 622.2538900000001, "r": 328.61676, "b": 631.06082, "coord_origin": "TOPLEFT"}, "confidence": 0.8636871576309204, "cells": [{"id": 54, "text": "-", "bbox": {"l": 140.99304, "t": 622.2538900000001, "r": 146.72054, "b": 631.06082, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "\"NL\" -", "bbox": {"l": 151.70105, "t": 622.26385, "r": 181.99434, "b": 631.06082, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "new-line", "bbox": {"l": 185.31705, "t": 622.26385, "r": 221.46236, "b": 631.06082, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": ", switch to the next row.", "bbox": {"l": 221.46104, "t": 622.26385, "r": 328.61676, "b": 631.06082, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "text", "bbox": {"l": 134.76505, "t": 644.10286, "r": 480.59280000000007, "b": 664.85484, "coord_origin": "TOPLEFT"}, "confidence": 0.9443338513374329, "cells": [{"id": 58, "text": "A notable attribute of OTSL is that it has the capability of achieving lossless", "bbox": {"l": 149.70905, "t": 644.10286, "r": 480.59280000000007, "b": 652.8998300000001, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "conversion to HTML.", "bbox": {"l": 134.76505, "t": 656.05786, "r": 228.22321, "b": 664.85484, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_header", "id": 14, "page_no": 5, "cluster": {"id": 14, "label": "page_header", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8378868699073792, "cells": [{"id": 0, "text": "6", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "6"}, {"label": "page_header", "id": 11, "page_no": 5, "cluster": {"id": 11, "label": "page_header", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8919177651405334, "cells": [{"id": 1, "text": "M.", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 178.07675, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37415, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "M. Lysak, et al."}, {"label": "text", "id": 3, "page_no": 5, "cluster": {"id": 3, "label": "text", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.59479, "b": 139.68579, "coord_origin": "TOPLEFT"}, "confidence": 0.9633480906486511, "cells": [{"id": 3, "text": "generation. Implicitly, this also means that Im2Seq models need to learn these", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.59479, "b": 127.73077, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "complex syntax rules, simply to deliver valid output.", "bbox": {"l": 134.765, "t": 130.88878999999997, "r": 364.62503, "b": 139.68579, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "generation. Implicitly, this also means that Im2Seq models need to learn these complex syntax rules, simply to deliver valid output."}, {"label": "text", "id": 1, "page_no": 5, "cluster": {"id": 1, "label": "text", "bbox": {"l": 134.76498, "t": 143.48279000000002, "r": 480.59569999999997, "b": 295.74191, "coord_origin": "TOPLEFT"}, "confidence": 0.9856827855110168, "cells": [{"id": 5, "text": "In practice, we observe two major issues with prediction quality when train-", "bbox": {"l": 149.709, "t": 143.48279000000002, "r": 480.58981, "b": 152.27979000000005, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "ing Im2Seq models on HTML table structure generation from images. On the", "bbox": {"l": 134.765, "t": 155.43781, "r": 480.59378, "b": 164.23479999999995, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "one hand, we find that on large tables, the visual attention of the model often", "bbox": {"l": 134.765, "t": 167.39282000000003, "r": 480.5867, "b": 176.18982000000005, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "starts to drift and is not accurately moving forward cell by cell anymore. This", "bbox": {"l": 134.765, "t": 179.34784000000002, "r": 480.59476, "b": 188.14484000000004, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "manifests itself in either in an increasing", "bbox": {"l": 134.765, "t": 191.30286, "r": 314.27805, "b": 200.09984999999995, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "location drift", "bbox": {"l": 318.056, "t": 191.30286, "r": 374.08664, "b": 200.09984999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "for proposed table-cells", "bbox": {"l": 378.80899, "t": 191.30286, "r": 480.58594, "b": 200.09984999999995, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "in later rows on the same column or even complete loss of vertical alignment, as", "bbox": {"l": 134.76498, "t": 203.25885000000005, "r": 480.58771, "b": 212.05584999999996, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "illustrated in Figure 5. Addressing this with post-processing is partially possible,", "bbox": {"l": 134.76498, "t": 215.21387000000004, "r": 480.59569999999997, "b": 224.01085999999998, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "but clearly undesired. On the other hand, we find many instances of predictions", "bbox": {"l": 134.76498, "t": 227.16887999999994, "r": 480.59454, "b": 235.96587999999997, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "with structural inconsistencies or plain invalid HTML output, as shown in Fig-", "bbox": {"l": 134.76498, "t": 239.12390000000005, "r": 480.58759000000003, "b": 247.92089999999996, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "ure 6, which are nearly impossible to properly correct. Both problems seriously", "bbox": {"l": 134.76498, "t": 251.07892000000004, "r": 480.59277, "b": 259.87591999999995, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "impact the TSR model performance, since they reflect not only in the task of", "bbox": {"l": 134.76498, "t": 263.03394000000003, "r": 480.59463999999997, "b": 271.83092999999997, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "pure structure recognition but also in the equally crucial recognition or matching", "bbox": {"l": 134.76498, "t": 274.98992999999996, "r": 480.58978, "b": 283.78693, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "of table cell content.", "bbox": {"l": 134.76498, "t": 286.94495, "r": 223.57262, "b": 295.74191, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In practice, we observe two major issues with prediction quality when training Im2Seq models on HTML table structure generation from images. On the one hand, we find that on large tables, the visual attention of the model often starts to drift and is not accurately moving forward cell by cell anymore. This manifests itself in either in an increasing location drift for proposed table-cells in later rows on the same column or even complete loss of vertical alignment, as illustrated in Figure 5. Addressing this with post-processing is partially possible, but clearly undesired. On the other hand, we find many instances of predictions with structural inconsistencies or plain invalid HTML output, as shown in Figure 6, which are nearly impossible to properly correct. Both problems seriously impact the TSR model performance, since they reflect not only in the task of pure structure recognition but also in the equally crucial recognition or matching of table cell content."}, {"label": "section_header", "id": 4, "page_no": 5, "cluster": {"id": 4, "label": "section_header", "bbox": {"l": 134.76498, "t": 320.6311, "r": 372.50848, "b": 331.19949, "coord_origin": "TOPLEFT"}, "confidence": 0.957028865814209, "cells": [{"id": 20, "text": "4", "bbox": {"l": 134.76498, "t": 320.6311, "r": 141.48859, "b": 331.19949, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Optimised Table Structure Language", "bbox": {"l": 154.93819, "t": 320.6311, "r": 372.50848, "b": 331.19949, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4 Optimised Table Structure Language"}, {"label": "text", "id": 0, "page_no": 5, "cluster": {"id": 0, "label": "text", "bbox": {"l": 134.76498, "t": 349.11697, "r": 480.59473, "b": 441.59985, "coord_origin": "TOPLEFT"}, "confidence": 0.9879323840141296, "cells": [{"id": 22, "text": "To mitigate the issues with HTML in Im2Seq-based TSR models laid out before,", "bbox": {"l": 134.76498, "t": 349.11697, "r": 480.59075999999993, "b": 357.91394, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "we propose here our Optimised Table Structure Language (OTSL). OTSL is", "bbox": {"l": 134.76498, "t": 361.07196000000005, "r": 480.58875, "b": 369.86893, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "designed to express table structure with a minimized vocabulary and a simple", "bbox": {"l": 134.76498, "t": 373.02795, "r": 480.58681999999993, "b": 381.82492, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "set of rules, which are both significantly reduced compared to HTML. At the", "bbox": {"l": 134.76498, "t": 384.98294, "r": 480.58875, "b": 393.77991, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "same time, OTSL enables easy error detection and correction during sequence", "bbox": {"l": 134.76498, "t": 396.93793, "r": 480.58978, "b": 405.73489, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "generation. We further demonstrate how the compact structure representation", "bbox": {"l": 134.76498, "t": 408.89291, "r": 480.59473, "b": 417.68988, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "and minimized sequence length improves prediction accuracy and inference time", "bbox": {"l": 134.76498, "t": 420.8479, "r": 480.58868, "b": 429.64487, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "in the TableFormer architecture.", "bbox": {"l": 134.76498, "t": 432.80289, "r": 276.67325, "b": 441.59985, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "To mitigate the issues with HTML in Im2Seq-based TSR models laid out before, we propose here our Optimised Table Structure Language (OTSL). OTSL is designed to express table structure with a minimized vocabulary and a simple set of rules, which are both significantly reduced compared to HTML. At the same time, OTSL enables easy error detection and correction during sequence generation. We further demonstrate how the compact structure representation and minimized sequence length improves prediction accuracy and inference time in the TableFormer architecture."}, {"label": "section_header", "id": 5, "page_no": 5, "cluster": {"id": 5, "label": "section_header", "bbox": {"l": 134.76498, "t": 465.87192, "r": 261.80109, "b": 474.67886, "coord_origin": "TOPLEFT"}, "confidence": 0.9559652209281921, "cells": [{"id": 30, "text": "4.1", "bbox": {"l": 134.76498, "t": 465.87192, "r": 149.40204, "b": 474.67886, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Language Definition", "bbox": {"l": 160.85902, "t": 465.87192, "r": 261.80109, "b": 474.67886, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4.1 Language Definition"}, {"label": "text", "id": 2, "page_no": 5, "cluster": {"id": 2, "label": "text", "bbox": {"l": 134.76498, "t": 488.99789, "r": 480.58871, "b": 521.7058400000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9671263098716736, "cells": [{"id": 32, "text": "In Figure 3, we illustrate how the OTSL is defined. In essence, the OTSL defines", "bbox": {"l": 134.76498, "t": 488.99789, "r": 480.58871, "b": 497.79486, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "only 5 tokens that directly describe a tabular structure based on an atomic 2D", "bbox": {"l": 134.76498, "t": 500.95288, "r": 480.5867, "b": 509.74985, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "grid.", "bbox": {"l": 134.76498, "t": 512.90887, "r": 154.7131, "b": 521.7058400000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In Figure 3, we illustrate how the OTSL is defined. In essence, the OTSL defines only 5 tokens that directly describe a tabular structure based on an atomic 2D grid."}, {"label": "text", "id": 13, "page_no": 5, "cluster": {"id": 13, "label": "text", "bbox": {"l": 149.70898, "t": 525.5018600000001, "r": 409.31137, "b": 534.29883, "coord_origin": "TOPLEFT"}, "confidence": 0.8555866479873657, "cells": [{"id": 35, "text": "The OTSL vocabulary is comprised of the following tokens:", "bbox": {"l": 149.70898, "t": 525.5018600000001, "r": 409.31137, "b": 534.29883, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The OTSL vocabulary is comprised of the following tokens:"}, {"label": "list_item", "id": 9, "page_no": 5, "cluster": {"id": 9, "label": "list_item", "bbox": {"l": 140.99298, "t": 547.96989, "r": 460.54443, "b": 556.77682, "coord_origin": "TOPLEFT"}, "confidence": 0.9184334874153137, "cells": [{"id": 36, "text": "-", "bbox": {"l": 140.99298, "t": 547.96989, "r": 146.72047, "b": 556.77682, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "\"C\" cell -", "bbox": {"l": 151.70099, "t": 547.97986, "r": 193.20619, "b": 556.77682, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "a new table cell", "bbox": {"l": 196.52199, "t": 547.97986, "r": 263.46564, "b": 556.77682, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "that either has or does not have cell content", "bbox": {"l": 267.815, "t": 547.97986, "r": 460.54443, "b": 556.77682, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "-\"C\" cell a new table cell that either has or does not have cell content"}, {"label": "list_item", "id": 8, "page_no": 5, "cluster": {"id": 8, "label": "list_item", "bbox": {"l": 140.99301, "t": 560.5629, "r": 480.59392999999994, "b": 581.32483, "coord_origin": "TOPLEFT"}, "confidence": 0.9319931268692017, "cells": [{"id": 40, "text": "-", "bbox": {"l": 140.99301, "t": 560.5629, "r": 146.7205, "b": 569.36983, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "\"L\" cell -", "bbox": {"l": 151.70102, "t": 560.57286, "r": 194.30011, "b": 569.36983, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "left-looking cell", "bbox": {"l": 198.65903, "t": 560.57286, "r": 264.51779, "b": 569.36983, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": ", merging with the left neighbor cell to create a", "bbox": {"l": 264.51804, "t": 560.57286, "r": 480.59392999999994, "b": 569.36983, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "span", "bbox": {"l": 151.70103, "t": 572.52786, "r": 171.67604, "b": 581.32483, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "-\"L\" cell left-looking cell , merging with the left neighbor cell to create a span"}, {"label": "list_item", "id": 7, "page_no": 5, "cluster": {"id": 7, "label": "list_item", "bbox": {"l": 140.99304, "t": 585.11189, "r": 480.58856, "b": 605.87383, "coord_origin": "TOPLEFT"}, "confidence": 0.9438967704772949, "cells": [{"id": 45, "text": "-", "bbox": {"l": 140.99304, "t": 585.11189, "r": 146.72054, "b": 593.91882, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "\"U\" cell -", "bbox": {"l": 151.70105, "t": 585.12186, "r": 194.11086, "b": 593.91882, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "up-looking cell", "bbox": {"l": 197.74805, "t": 585.12186, "r": 259.89474, "b": 593.91882, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": ", merging with the upper neighbor cell to create a", "bbox": {"l": 259.89206, "t": 585.12186, "r": 480.58856, "b": 593.91882, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "span", "bbox": {"l": 151.70105, "t": 597.07686, "r": 171.67606, "b": 605.87383, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "-\"U\" cell up-looking cell , merging with the upper neighbor cell to create a span"}, {"label": "list_item", "id": 10, "page_no": 5, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 140.99304, "t": 609.6599, "r": 454.55496, "b": 618.46683, "coord_origin": "TOPLEFT"}, "confidence": 0.9036387801170349, "cells": [{"id": 50, "text": "-", "bbox": {"l": 140.99304, "t": 609.6599, "r": 146.72054, "b": 618.46683, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "\"X\" cell -", "bbox": {"l": 151.70105, "t": 609.66986, "r": 193.48323, "b": 618.46683, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "cross cell", "bbox": {"l": 196.79904, "t": 609.66986, "r": 236.12042, "b": 618.46683, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": ", to merge with both left and upper neighbor cells", "bbox": {"l": 236.12505, "t": 609.66986, "r": 454.55496, "b": 618.46683, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "-\"X\" cell cross cell , to merge with both left and upper neighbor cells"}, {"label": "list_item", "id": 12, "page_no": 5, "cluster": {"id": 12, "label": "list_item", "bbox": {"l": 140.99304, "t": 622.2538900000001, "r": 328.61676, "b": 631.06082, "coord_origin": "TOPLEFT"}, "confidence": 0.8636871576309204, "cells": [{"id": 54, "text": "-", "bbox": {"l": 140.99304, "t": 622.2538900000001, "r": 146.72054, "b": 631.06082, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "\"NL\" -", "bbox": {"l": 151.70105, "t": 622.26385, "r": 181.99434, "b": 631.06082, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "new-line", "bbox": {"l": 185.31705, "t": 622.26385, "r": 221.46236, "b": 631.06082, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": ", switch to the next row.", "bbox": {"l": 221.46104, "t": 622.26385, "r": 328.61676, "b": 631.06082, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "-\"NL\" new-line , switch to the next row."}, {"label": "text", "id": 6, "page_no": 5, "cluster": {"id": 6, "label": "text", "bbox": {"l": 134.76505, "t": 644.10286, "r": 480.59280000000007, "b": 664.85484, "coord_origin": "TOPLEFT"}, "confidence": 0.9443338513374329, "cells": [{"id": 58, "text": "A notable attribute of OTSL is that it has the capability of achieving lossless", "bbox": {"l": 149.70905, "t": 644.10286, "r": 480.59280000000007, "b": 652.8998300000001, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "conversion to HTML.", "bbox": {"l": 134.76505, "t": 656.05786, "r": 228.22321, "b": 664.85484, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "A notable attribute of OTSL is that it has the capability of achieving lossless conversion to HTML."}], "body": [{"label": "text", "id": 3, "page_no": 5, "cluster": {"id": 3, "label": "text", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.59479, "b": 139.68579, "coord_origin": "TOPLEFT"}, "confidence": 0.9633480906486511, "cells": [{"id": 3, "text": "generation. Implicitly, this also means that Im2Seq models need to learn these", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.59479, "b": 127.73077, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "complex syntax rules, simply to deliver valid output.", "bbox": {"l": 134.765, "t": 130.88878999999997, "r": 364.62503, "b": 139.68579, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "generation. Implicitly, this also means that Im2Seq models need to learn these complex syntax rules, simply to deliver valid output."}, {"label": "text", "id": 1, "page_no": 5, "cluster": {"id": 1, "label": "text", "bbox": {"l": 134.76498, "t": 143.48279000000002, "r": 480.59569999999997, "b": 295.74191, "coord_origin": "TOPLEFT"}, "confidence": 0.9856827855110168, "cells": [{"id": 5, "text": "In practice, we observe two major issues with prediction quality when train-", "bbox": {"l": 149.709, "t": 143.48279000000002, "r": 480.58981, "b": 152.27979000000005, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "ing Im2Seq models on HTML table structure generation from images. On the", "bbox": {"l": 134.765, "t": 155.43781, "r": 480.59378, "b": 164.23479999999995, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "one hand, we find that on large tables, the visual attention of the model often", "bbox": {"l": 134.765, "t": 167.39282000000003, "r": 480.5867, "b": 176.18982000000005, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "starts to drift and is not accurately moving forward cell by cell anymore. This", "bbox": {"l": 134.765, "t": 179.34784000000002, "r": 480.59476, "b": 188.14484000000004, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "manifests itself in either in an increasing", "bbox": {"l": 134.765, "t": 191.30286, "r": 314.27805, "b": 200.09984999999995, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "location drift", "bbox": {"l": 318.056, "t": 191.30286, "r": 374.08664, "b": 200.09984999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "for proposed table-cells", "bbox": {"l": 378.80899, "t": 191.30286, "r": 480.58594, "b": 200.09984999999995, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "in later rows on the same column or even complete loss of vertical alignment, as", "bbox": {"l": 134.76498, "t": 203.25885000000005, "r": 480.58771, "b": 212.05584999999996, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "illustrated in Figure 5. Addressing this with post-processing is partially possible,", "bbox": {"l": 134.76498, "t": 215.21387000000004, "r": 480.59569999999997, "b": 224.01085999999998, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "but clearly undesired. On the other hand, we find many instances of predictions", "bbox": {"l": 134.76498, "t": 227.16887999999994, "r": 480.59454, "b": 235.96587999999997, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "with structural inconsistencies or plain invalid HTML output, as shown in Fig-", "bbox": {"l": 134.76498, "t": 239.12390000000005, "r": 480.58759000000003, "b": 247.92089999999996, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "ure 6, which are nearly impossible to properly correct. Both problems seriously", "bbox": {"l": 134.76498, "t": 251.07892000000004, "r": 480.59277, "b": 259.87591999999995, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "impact the TSR model performance, since they reflect not only in the task of", "bbox": {"l": 134.76498, "t": 263.03394000000003, "r": 480.59463999999997, "b": 271.83092999999997, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "pure structure recognition but also in the equally crucial recognition or matching", "bbox": {"l": 134.76498, "t": 274.98992999999996, "r": 480.58978, "b": 283.78693, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "of table cell content.", "bbox": {"l": 134.76498, "t": 286.94495, "r": 223.57262, "b": 295.74191, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In practice, we observe two major issues with prediction quality when training Im2Seq models on HTML table structure generation from images. On the one hand, we find that on large tables, the visual attention of the model often starts to drift and is not accurately moving forward cell by cell anymore. This manifests itself in either in an increasing location drift for proposed table-cells in later rows on the same column or even complete loss of vertical alignment, as illustrated in Figure 5. Addressing this with post-processing is partially possible, but clearly undesired. On the other hand, we find many instances of predictions with structural inconsistencies or plain invalid HTML output, as shown in Figure 6, which are nearly impossible to properly correct. Both problems seriously impact the TSR model performance, since they reflect not only in the task of pure structure recognition but also in the equally crucial recognition or matching of table cell content."}, {"label": "section_header", "id": 4, "page_no": 5, "cluster": {"id": 4, "label": "section_header", "bbox": {"l": 134.76498, "t": 320.6311, "r": 372.50848, "b": 331.19949, "coord_origin": "TOPLEFT"}, "confidence": 0.957028865814209, "cells": [{"id": 20, "text": "4", "bbox": {"l": 134.76498, "t": 320.6311, "r": 141.48859, "b": 331.19949, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Optimised Table Structure Language", "bbox": {"l": 154.93819, "t": 320.6311, "r": 372.50848, "b": 331.19949, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4 Optimised Table Structure Language"}, {"label": "text", "id": 0, "page_no": 5, "cluster": {"id": 0, "label": "text", "bbox": {"l": 134.76498, "t": 349.11697, "r": 480.59473, "b": 441.59985, "coord_origin": "TOPLEFT"}, "confidence": 0.9879323840141296, "cells": [{"id": 22, "text": "To mitigate the issues with HTML in Im2Seq-based TSR models laid out before,", "bbox": {"l": 134.76498, "t": 349.11697, "r": 480.59075999999993, "b": 357.91394, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "we propose here our Optimised Table Structure Language (OTSL). OTSL is", "bbox": {"l": 134.76498, "t": 361.07196000000005, "r": 480.58875, "b": 369.86893, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "designed to express table structure with a minimized vocabulary and a simple", "bbox": {"l": 134.76498, "t": 373.02795, "r": 480.58681999999993, "b": 381.82492, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "set of rules, which are both significantly reduced compared to HTML. At the", "bbox": {"l": 134.76498, "t": 384.98294, "r": 480.58875, "b": 393.77991, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "same time, OTSL enables easy error detection and correction during sequence", "bbox": {"l": 134.76498, "t": 396.93793, "r": 480.58978, "b": 405.73489, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "generation. We further demonstrate how the compact structure representation", "bbox": {"l": 134.76498, "t": 408.89291, "r": 480.59473, "b": 417.68988, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "and minimized sequence length improves prediction accuracy and inference time", "bbox": {"l": 134.76498, "t": 420.8479, "r": 480.58868, "b": 429.64487, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "in the TableFormer architecture.", "bbox": {"l": 134.76498, "t": 432.80289, "r": 276.67325, "b": 441.59985, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "To mitigate the issues with HTML in Im2Seq-based TSR models laid out before, we propose here our Optimised Table Structure Language (OTSL). OTSL is designed to express table structure with a minimized vocabulary and a simple set of rules, which are both significantly reduced compared to HTML. At the same time, OTSL enables easy error detection and correction during sequence generation. We further demonstrate how the compact structure representation and minimized sequence length improves prediction accuracy and inference time in the TableFormer architecture."}, {"label": "section_header", "id": 5, "page_no": 5, "cluster": {"id": 5, "label": "section_header", "bbox": {"l": 134.76498, "t": 465.87192, "r": 261.80109, "b": 474.67886, "coord_origin": "TOPLEFT"}, "confidence": 0.9559652209281921, "cells": [{"id": 30, "text": "4.1", "bbox": {"l": 134.76498, "t": 465.87192, "r": 149.40204, "b": 474.67886, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Language Definition", "bbox": {"l": 160.85902, "t": 465.87192, "r": 261.80109, "b": 474.67886, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4.1 Language Definition"}, {"label": "text", "id": 2, "page_no": 5, "cluster": {"id": 2, "label": "text", "bbox": {"l": 134.76498, "t": 488.99789, "r": 480.58871, "b": 521.7058400000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9671263098716736, "cells": [{"id": 32, "text": "In Figure 3, we illustrate how the OTSL is defined. In essence, the OTSL defines", "bbox": {"l": 134.76498, "t": 488.99789, "r": 480.58871, "b": 497.79486, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "only 5 tokens that directly describe a tabular structure based on an atomic 2D", "bbox": {"l": 134.76498, "t": 500.95288, "r": 480.5867, "b": 509.74985, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "grid.", "bbox": {"l": 134.76498, "t": 512.90887, "r": 154.7131, "b": 521.7058400000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In Figure 3, we illustrate how the OTSL is defined. In essence, the OTSL defines only 5 tokens that directly describe a tabular structure based on an atomic 2D grid."}, {"label": "text", "id": 13, "page_no": 5, "cluster": {"id": 13, "label": "text", "bbox": {"l": 149.70898, "t": 525.5018600000001, "r": 409.31137, "b": 534.29883, "coord_origin": "TOPLEFT"}, "confidence": 0.8555866479873657, "cells": [{"id": 35, "text": "The OTSL vocabulary is comprised of the following tokens:", "bbox": {"l": 149.70898, "t": 525.5018600000001, "r": 409.31137, "b": 534.29883, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The OTSL vocabulary is comprised of the following tokens:"}, {"label": "list_item", "id": 9, "page_no": 5, "cluster": {"id": 9, "label": "list_item", "bbox": {"l": 140.99298, "t": 547.96989, "r": 460.54443, "b": 556.77682, "coord_origin": "TOPLEFT"}, "confidence": 0.9184334874153137, "cells": [{"id": 36, "text": "-", "bbox": {"l": 140.99298, "t": 547.96989, "r": 146.72047, "b": 556.77682, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "\"C\" cell -", "bbox": {"l": 151.70099, "t": 547.97986, "r": 193.20619, "b": 556.77682, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "a new table cell", "bbox": {"l": 196.52199, "t": 547.97986, "r": 263.46564, "b": 556.77682, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "that either has or does not have cell content", "bbox": {"l": 267.815, "t": 547.97986, "r": 460.54443, "b": 556.77682, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "-\"C\" cell a new table cell that either has or does not have cell content"}, {"label": "list_item", "id": 8, "page_no": 5, "cluster": {"id": 8, "label": "list_item", "bbox": {"l": 140.99301, "t": 560.5629, "r": 480.59392999999994, "b": 581.32483, "coord_origin": "TOPLEFT"}, "confidence": 0.9319931268692017, "cells": [{"id": 40, "text": "-", "bbox": {"l": 140.99301, "t": 560.5629, "r": 146.7205, "b": 569.36983, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "\"L\" cell -", "bbox": {"l": 151.70102, "t": 560.57286, "r": 194.30011, "b": 569.36983, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "left-looking cell", "bbox": {"l": 198.65903, "t": 560.57286, "r": 264.51779, "b": 569.36983, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": ", merging with the left neighbor cell to create a", "bbox": {"l": 264.51804, "t": 560.57286, "r": 480.59392999999994, "b": 569.36983, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "span", "bbox": {"l": 151.70103, "t": 572.52786, "r": 171.67604, "b": 581.32483, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "-\"L\" cell left-looking cell , merging with the left neighbor cell to create a span"}, {"label": "list_item", "id": 7, "page_no": 5, "cluster": {"id": 7, "label": "list_item", "bbox": {"l": 140.99304, "t": 585.11189, "r": 480.58856, "b": 605.87383, "coord_origin": "TOPLEFT"}, "confidence": 0.9438967704772949, "cells": [{"id": 45, "text": "-", "bbox": {"l": 140.99304, "t": 585.11189, "r": 146.72054, "b": 593.91882, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "\"U\" cell -", "bbox": {"l": 151.70105, "t": 585.12186, "r": 194.11086, "b": 593.91882, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "up-looking cell", "bbox": {"l": 197.74805, "t": 585.12186, "r": 259.89474, "b": 593.91882, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": ", merging with the upper neighbor cell to create a", "bbox": {"l": 259.89206, "t": 585.12186, "r": 480.58856, "b": 593.91882, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "span", "bbox": {"l": 151.70105, "t": 597.07686, "r": 171.67606, "b": 605.87383, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "-\"U\" cell up-looking cell , merging with the upper neighbor cell to create a span"}, {"label": "list_item", "id": 10, "page_no": 5, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 140.99304, "t": 609.6599, "r": 454.55496, "b": 618.46683, "coord_origin": "TOPLEFT"}, "confidence": 0.9036387801170349, "cells": [{"id": 50, "text": "-", "bbox": {"l": 140.99304, "t": 609.6599, "r": 146.72054, "b": 618.46683, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "\"X\" cell -", "bbox": {"l": 151.70105, "t": 609.66986, "r": 193.48323, "b": 618.46683, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "cross cell", "bbox": {"l": 196.79904, "t": 609.66986, "r": 236.12042, "b": 618.46683, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": ", to merge with both left and upper neighbor cells", "bbox": {"l": 236.12505, "t": 609.66986, "r": 454.55496, "b": 618.46683, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "-\"X\" cell cross cell , to merge with both left and upper neighbor cells"}, {"label": "list_item", "id": 12, "page_no": 5, "cluster": {"id": 12, "label": "list_item", "bbox": {"l": 140.99304, "t": 622.2538900000001, "r": 328.61676, "b": 631.06082, "coord_origin": "TOPLEFT"}, "confidence": 0.8636871576309204, "cells": [{"id": 54, "text": "-", "bbox": {"l": 140.99304, "t": 622.2538900000001, "r": 146.72054, "b": 631.06082, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "\"NL\" -", "bbox": {"l": 151.70105, "t": 622.26385, "r": 181.99434, "b": 631.06082, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "new-line", "bbox": {"l": 185.31705, "t": 622.26385, "r": 221.46236, "b": 631.06082, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": ", switch to the next row.", "bbox": {"l": 221.46104, "t": 622.26385, "r": 328.61676, "b": 631.06082, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "-\"NL\" new-line , switch to the next row."}, {"label": "text", "id": 6, "page_no": 5, "cluster": {"id": 6, "label": "text", "bbox": {"l": 134.76505, "t": 644.10286, "r": 480.59280000000007, "b": 664.85484, "coord_origin": "TOPLEFT"}, "confidence": 0.9443338513374329, "cells": [{"id": 58, "text": "A notable attribute of OTSL is that it has the capability of achieving lossless", "bbox": {"l": 149.70905, "t": 644.10286, "r": 480.59280000000007, "b": 652.8998300000001, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "conversion to HTML.", "bbox": {"l": 134.76505, "t": 656.05786, "r": 228.22321, "b": 664.85484, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "A notable attribute of OTSL is that it has the capability of achieving lossless conversion to HTML."}], "headers": [{"label": "page_header", "id": 14, "page_no": 5, "cluster": {"id": 14, "label": "page_header", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8378868699073792, "cells": [{"id": 0, "text": "6", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "6"}, {"label": "page_header", "id": 11, "page_no": 5, "cluster": {"id": 11, "label": "page_header", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8919177651405334, "cells": [{"id": 1, "text": "M.", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 178.07675, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37415, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "M. Lysak, et al."}]}}, {"page_no": 6, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "7", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Fig. 3.", "bbox": {"l": 134.765, "t": 125.79918999999984, "r": 162.64424, "b": 133.72551999999996, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "OTSL description of table structure: A - table example; B - graphical repre-", "bbox": {"l": 166.276, "t": 125.86200000000008, "r": 480.58675999999997, "b": 133.93169999999998, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "sentation of table structure; C - mapping structure on a grid; D - OTSL structure", "bbox": {"l": 134.765, "t": 136.82097999999996, "r": 480.5874, "b": 144.89068999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "encoding; E - explanation on cell encoding", "bbox": {"l": 134.765, "t": 147.77997000000005, "r": 306.1156, "b": 155.84966999999995, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "C", "bbox": {"l": 374.49326, "t": 168.59362999999996, "r": 381.66843, "b": 177.91540999999995, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "C", "bbox": {"l": 398.74011, "t": 168.50005999999996, "r": 405.91528, "b": 177.82183999999995, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "C", "bbox": {"l": 373.76862, "t": 192.92553999999996, "r": 380.94379, "b": 202.24730999999997, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "C", "bbox": {"l": 386.66388, "t": 193.07061999999996, "r": 393.83905, "b": 202.39239999999995, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "C", "bbox": {"l": 386.68707, "t": 205.13756999999998, "r": 393.86224, "b": 214.45934999999997, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "C", "bbox": {"l": 398.65729, "t": 180.73279000000002, "r": 405.83246, "b": 190.05457, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "C", "bbox": {"l": 410.77908, "t": 180.73859000000004, "r": 417.95425, "b": 190.06035999999995, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "C", "bbox": {"l": 422.90503, "t": 180.65247, "r": 430.08020000000005, "b": 189.97424, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "C", "bbox": {"l": 398.7807, "t": 192.98865, "r": 405.95587, "b": 202.31042000000002, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "C", "bbox": {"l": 410.90164, "t": 192.99487, "r": 418.07681, "b": 202.31664999999998, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "C", "bbox": {"l": 423.02753, "t": 192.909, "r": 430.2027, "b": 202.23077, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "C", "bbox": {"l": 398.78235, "t": 205.31573000000003, "r": 405.95752, "b": 214.63751000000002, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "C", "bbox": {"l": 410.90414, "t": 205.32196, "r": 418.07932, "b": 214.64373999999998, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "C", "bbox": {"l": 423.03003, "t": 205.23614999999995, "r": 430.20520000000005, "b": 214.55791999999997, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "C", "bbox": {"l": 386.50574, "t": 217.03882, "r": 393.68091, "b": 226.36059999999998, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "C", "bbox": {"l": 398.60181, "t": 217.21704, "r": 405.77698, "b": 226.53882, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "C", "bbox": {"l": 410.72275, "t": 217.22321, "r": 417.89792, "b": 226.54498, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "C", "bbox": {"l": 422.84869, "t": 217.13738999999998, "r": 430.02386, "b": 226.45916999999997, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "NL", "bbox": {"l": 435.16009999999994, "t": 167.69011999999998, "r": 447.86273, "b": 177.01189999999997, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "NL", "bbox": {"l": 435.44415, "t": 180.20025999999996, "r": 448.14679, "b": 189.52202999999997, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "NL", "bbox": {"l": 435.46735, "t": 192.49474999999995, "r": 448.16998000000007, "b": 201.81652999999994, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "NL", "bbox": {"l": 435.38202, "t": 204.83025999999995, "r": 448.08466, "b": 214.15204000000006, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "NL", "bbox": {"l": 435.59906, "t": 217.2337, "r": 448.3017, "b": 226.55548, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "U", "bbox": {"l": 374.14957, "t": 205.23492, "r": 381.32474, "b": 214.55669999999998, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "U", "bbox": {"l": 374.0419, "t": 217.14648, "r": 381.21707, "b": 226.46826, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "U", "bbox": {"l": 374.34418, "t": 180.93488000000002, "r": 381.51935, "b": 190.25665000000004, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "L", "bbox": {"l": 387.76285, "t": 168.57788000000005, "r": 393.28833, "b": 177.89966000000004, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "L", "bbox": {"l": 411.86395, "t": 168.06195000000002, "r": 417.38943, "b": 177.38373, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "L", "bbox": {"l": 423.33563, "t": 167.93439, "r": 428.86111, "b": 177.25616000000002, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "X", "bbox": {"l": 387.13593, "t": 180.78576999999996, "r": 393.76453, "b": 190.10753999999997, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "C", "bbox": {"l": 282.2594, "t": 244.50878999999998, "r": 289.43457, "b": 253.83056999999997, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "U", "bbox": {"l": 282.11035, "t": 256.85022000000004, "r": 289.28552, "b": 266.172, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "U", "bbox": {"l": 282.40848, "t": 269.13300000000004, "r": 289.58365, "b": 278.45477000000005, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "L", "bbox": {"l": 295.52902, "t": 244.49347, "r": 301.0545, "b": 253.81525, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "L", "bbox": {"l": 307.46613, "t": 244.57372999999995, "r": 312.99161, "b": 253.89550999999994, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "L", "bbox": {"l": 318.76886, "t": 244.44037000000003, "r": 324.29434, "b": 253.76215000000002, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "X", "bbox": {"l": 294.9021, "t": 256.70154, "r": 301.03976, "b": 266.02332, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "X X", "bbox": {"l": 307.17743, "t": 256.70154, "r": 325.59039, "b": 266.02332, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "X", "bbox": {"l": 294.78949, "t": 269.25420999999994, "r": 300.92715, "b": 278.57599000000005, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "X X", "bbox": {"l": 307.06482, "t": 269.25420999999994, "r": 325.47778, "b": 278.57599000000005, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "C", "bbox": {"l": 195.93939, "t": 268.74798999999996, "r": 203.11456, "b": 278.06976, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "L", "bbox": {"l": 209.20891, "t": 268.73267, "r": 214.73439, "b": 278.05444, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "L", "bbox": {"l": 221.14551, "t": 268.81293000000005, "r": 226.67099, "b": 278.13469999999995, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "L", "bbox": {"l": 232.44858, "t": 268.67957, "r": 237.97405999999998, "b": 278.00134, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "C", "bbox": {"l": 196.21715, "t": 244.53961000000004, "r": 203.39232, "b": 253.86139000000003, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "C", "bbox": {"l": 250.32143, "t": 244.09813999999994, "r": 257.49661, "b": 253.41992000000005, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "U", "bbox": {"l": 250.17235999999997, "t": 256.43951000000004, "r": 257.34753, "b": 265.76129000000003, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "U", "bbox": {"l": 250.47049000000004, "t": 268.72222999999997, "r": 257.64566, "b": 278.04400999999996, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "1", "bbox": {"l": 334.51135, "t": 242.99463000000003, "r": 337.22485, "b": 249.20911, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "- simple cells: \"C\"", "bbox": {"l": 339.93835, "t": 242.99463000000003, "r": 391.49472, "b": 249.20911, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "2", "bbox": {"l": 334.51135, "t": 252.93255999999997, "r": 337.33313, "b": 259.14703, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "- horizontal merges: \"C\", \"L\"", "bbox": {"l": 340.15491, "t": 252.93255999999997, "r": 421.98624, "b": 259.14703, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "3", "bbox": {"l": 334.51135, "t": 262.87048000000004, "r": 337.29868, "b": 269.08496, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "- vertical merges: \"C\", \"U\"", "bbox": {"l": 340.086, "t": 262.87048000000004, "r": 415.34375, "b": 269.08496, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "4", "bbox": {"l": 334.51135, "t": 272.80841, "r": 337.30188, "b": 279.02288999999996, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "- 2d merges: \"C\", \"L\", \"U\", \"X\"", "bbox": {"l": 340.09241, "t": 272.80841, "r": 426.59875, "b": 279.02288999999996, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "1", "bbox": {"l": 185.67178, "t": 244.04224, "r": 189.35544, "b": 250.25671, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "2", "bbox": {"l": 185.96759, "t": 268.34766, "r": 189.65125, "b": 274.56213, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "3", "bbox": {"l": 239.34152, "t": 243.62523999999996, "r": 243.02518, "b": 249.83972000000006, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "4", "bbox": {"l": 271.32852, "t": 243.49390000000005, "r": 275.01218, "b": 249.70836999999995, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "2", "bbox": {"l": 229.81627, "t": 166.51495, "r": 233.49992000000003, "b": 172.72942999999998, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "1", "bbox": {"l": 257.24402, "t": 189.961, "r": 260.92767, "b": 196.17548, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "3", "bbox": {"l": 186.87526, "t": 177.97668, "r": 190.55891, "b": 184.19115999999997, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "4", "bbox": {"l": 196.48746, "t": 169.01520000000005, "r": 200.17111, "b": 175.22968000000003, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "A", "bbox": {"l": 169.74728, "t": 167.88225999999997, "r": 175.72659, "b": 175.65039000000002, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "B", "bbox": {"l": 169.74728, "t": 206.83867999999995, "r": 175.72659, "b": 214.60681, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "C", "bbox": {"l": 274.29419, "t": 168.27972, "r": 280.2735, "b": 176.04785000000004, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "D", "bbox": {"l": 359.56152, "t": 168.27972, "r": 365.54083, "b": 176.04785000000004, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "E", "bbox": {"l": 169.74728, "t": 243.21149000000003, "r": 175.27112, "b": 250.97960999999998, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "4.2", "bbox": {"l": 134.765, "t": 305.29581, "r": 149.40205, "b": 314.10275, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "Language Syntax", "bbox": {"l": 160.85904, "t": 305.29581, "r": 246.65197999999998, "b": 314.10275, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "The OTSL representation follows these syntax rules:", "bbox": {"l": 134.765, "t": 325.24777, "r": 363.79617, "b": 334.04474, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "1.", "bbox": {"l": 138.97299, "t": 347.18079, "r": 146.71991, "b": 355.97775, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "Left-looking cell rule", "bbox": {"l": 151.70099, "t": 347.17081, "r": 257.37927, "b": 355.97775, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": ": The left neighbour of an \"L\" cell must be either", "bbox": {"l": 257.383, "t": 347.18079, "r": 480.58902, "b": 355.97775, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "another \"L\" cell or a \"C\" cell.", "bbox": {"l": 151.70099, "t": 359.13678, "r": 283.59387, "b": 367.93375, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "2.", "bbox": {"l": 138.97299, "t": 371.09479, "r": 146.71991, "b": 379.89175, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "Up-looking cell rule", "bbox": {"l": 151.70099, "t": 371.08481, "r": 252.11203, "b": 379.89175, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": ": The upper neighbour of a \"U\" cell must be either", "bbox": {"l": 252.112, "t": 371.09479, "r": 480.59229000000005, "b": 379.89175, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "another \"U\" cell or a \"C\" cell.", "bbox": {"l": 151.70099, "t": 383.04977, "r": 284.8392, "b": 391.84673999999995, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "3.", "bbox": {"l": 138.97299, "t": 395.0077800000001, "r": 146.71991, "b": 403.80475, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Cross cell rule", "bbox": {"l": 151.70099, "t": 394.99780000000004, "r": 223.3042, "b": 403.80475, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": ":", "bbox": {"l": 223.30699, "t": 395.0077800000001, "r": 226.07360999999997, "b": 403.80475, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "The left neighbour of an \"X\" cell must be either another \"X\" cell or a \"U\"", "bbox": {"l": 151.70099, "t": 406.96677, "r": 480.59238, "b": 415.76373, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "cell, and the upper neighbour of an \"X\" cell must be either another \"X\" cell", "bbox": {"l": 151.70099, "t": 418.9217499999999, "r": 480.59219, "b": 427.71871999999996, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "or an \"L\" cell.", "bbox": {"l": 151.70099, "t": 430.87674, "r": 214.39663999999996, "b": 439.67371, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "4.", "bbox": {"l": 138.97299, "t": 442.83572, "r": 146.71991, "b": 451.63269, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "First row rule", "bbox": {"l": 151.70099, "t": 442.82574, "r": 221.32263, "b": 451.63269, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": ": Only \"L\" cells and \"C\" cells are allowed in the first row.", "bbox": {"l": 221.32700000000003, "t": 442.83572, "r": 474.59018, "b": 451.63269, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "5.", "bbox": {"l": 138.97299, "t": 454.7937299999999, "r": 146.71991, "b": 463.5907, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "First column rule", "bbox": {"l": 151.70099, "t": 454.78375, "r": 240.71982, "b": 463.5907, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": ": Only \"U\" cells and \"C\" cells are allowed in the first", "bbox": {"l": 240.71599, "t": 454.7937299999999, "r": 480.58746, "b": 463.5907, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "column.", "bbox": {"l": 151.70099, "t": 466.74872, "r": 186.0072, "b": 475.54568, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "6.", "bbox": {"l": 138.97299, "t": 478.70673, "r": 146.71991, "b": 487.50369, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "Rectangular rule", "bbox": {"l": 151.70099, "t": 478.69675, "r": 235.15768, "b": 487.50369, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": ": The table representation is always rectangular - all rows", "bbox": {"l": 235.15697999999998, "t": 478.70673, "r": 480.59457, "b": 487.50369, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "must have an equal number of tokens, terminated with \"NL\" token.", "bbox": {"l": 151.70099, "t": 490.66272, "r": 448.04147, "b": 499.45969, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "The application of these rules gives OTSL a set of unique properties. First", "bbox": {"l": 149.70898, "t": 512.59271, "r": 480.59583, "b": 521.38968, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "of all, the OTSL enforces a strictly rectangular structure representation, where", "bbox": {"l": 134.76498, "t": 524.5477000000001, "r": 480.59079, "b": 533.34467, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "every new-line token starts a new row. As a consequence, all rows and all columns", "bbox": {"l": 134.76498, "t": 536.5027, "r": 480.59482, "b": 545.29967, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "have exactly the same number of tokens, irrespective of cell spans. Secondly, the", "bbox": {"l": 134.76498, "t": 548.4586899999999, "r": 480.58865000000003, "b": 557.25566, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "OTSL representation is unambiguous: Every table structure is represented in one", "bbox": {"l": 134.76498, "t": 560.4137000000001, "r": 480.59365999999994, "b": 569.21066, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "way. In this representation every table cell corresponds to a \"C\"-cell token, which", "bbox": {"l": 134.76498, "t": 572.3687, "r": 480.58673, "b": 581.16566, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "in case of spans is always located in the top-left corner of the table cell definition.", "bbox": {"l": 134.76498, "t": 584.3237, "r": 480.59171, "b": 593.12067, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "Third, OTSL syntax rules are only backward-looking. As a consequence, every", "bbox": {"l": 134.76498, "t": 596.2787, "r": 480.59180000000003, "b": 605.07567, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "predicted token can be validated straight during sequence generation by looking", "bbox": {"l": 134.76498, "t": 608.2347, "r": 480.5936899999999, "b": 617.03166, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "at the previously predicted sequence. As such, OTSL can guarantee that every", "bbox": {"l": 134.76498, "t": 620.1897, "r": 480.59072999999995, "b": 628.98666, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "predicted sequence is syntactically valid.", "bbox": {"l": 134.76498, "t": 632.1447000000001, "r": 311.19769, "b": 640.9416699999999, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "These characteristics can be easily learned by sequence generator networks,", "bbox": {"l": 149.70898, "t": 644.1026899999999, "r": 480.59186, "b": 652.89966, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "as we demonstrate further below. We find strong indications that this pattern", "bbox": {"l": 134.76498, "t": 656.05769, "r": 480.59265, "b": 664.8546699999999, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 7, "label": "page_header", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.932651162147522, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "page_header", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8749732375144958, "cells": [{"id": 1, "text": "7", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "caption", "bbox": {"l": 134.765, "t": 125.79918999999984, "r": 480.5874, "b": 155.84966999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9333080053329468, "cells": [{"id": 2, "text": "Fig. 3.", "bbox": {"l": 134.765, "t": 125.79918999999984, "r": 162.64424, "b": 133.72551999999996, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "OTSL description of table structure: A - table example; B - graphical repre-", "bbox": {"l": 166.276, "t": 125.86200000000008, "r": 480.58675999999997, "b": 133.93169999999998, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "sentation of table structure; C - mapping structure on a grid; D - OTSL structure", "bbox": {"l": 134.765, "t": 136.82097999999996, "r": 480.5874, "b": 144.89068999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "encoding; E - explanation on cell encoding", "bbox": {"l": 134.765, "t": 147.77997000000005, "r": 306.1156, "b": 155.84966999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "picture", "bbox": {"l": 164.65028381347656, "t": 163.79708862304688, "r": 449.5505676269531, "b": 280.3409423828125, "coord_origin": "TOPLEFT"}, "confidence": 0.7868534922599792, "cells": [{"id": 6, "text": "C", "bbox": {"l": 374.49326, "t": 168.59362999999996, "r": 381.66843, "b": 177.91540999999995, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "C", "bbox": {"l": 398.74011, "t": 168.50005999999996, "r": 405.91528, "b": 177.82183999999995, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "C", "bbox": {"l": 373.76862, "t": 192.92553999999996, "r": 380.94379, "b": 202.24730999999997, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "C", "bbox": {"l": 386.66388, "t": 193.07061999999996, "r": 393.83905, "b": 202.39239999999995, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "C", "bbox": {"l": 386.68707, "t": 205.13756999999998, "r": 393.86224, "b": 214.45934999999997, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "C", "bbox": {"l": 398.65729, "t": 180.73279000000002, "r": 405.83246, "b": 190.05457, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "C", "bbox": {"l": 410.77908, "t": 180.73859000000004, "r": 417.95425, "b": 190.06035999999995, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "C", "bbox": {"l": 422.90503, "t": 180.65247, "r": 430.08020000000005, "b": 189.97424, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "C", "bbox": {"l": 398.7807, "t": 192.98865, "r": 405.95587, "b": 202.31042000000002, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "C", "bbox": {"l": 410.90164, "t": 192.99487, "r": 418.07681, "b": 202.31664999999998, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "C", "bbox": {"l": 423.02753, "t": 192.909, "r": 430.2027, "b": 202.23077, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "C", "bbox": {"l": 398.78235, "t": 205.31573000000003, "r": 405.95752, "b": 214.63751000000002, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "C", "bbox": {"l": 410.90414, "t": 205.32196, "r": 418.07932, "b": 214.64373999999998, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "C", "bbox": {"l": 423.03003, "t": 205.23614999999995, "r": 430.20520000000005, "b": 214.55791999999997, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "C", "bbox": {"l": 386.50574, "t": 217.03882, "r": 393.68091, "b": 226.36059999999998, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "C", "bbox": {"l": 398.60181, "t": 217.21704, "r": 405.77698, "b": 226.53882, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "C", "bbox": {"l": 410.72275, "t": 217.22321, "r": 417.89792, "b": 226.54498, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "C", "bbox": {"l": 422.84869, "t": 217.13738999999998, "r": 430.02386, "b": 226.45916999999997, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "NL", "bbox": {"l": 435.16009999999994, "t": 167.69011999999998, "r": 447.86273, "b": 177.01189999999997, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "NL", "bbox": {"l": 435.44415, "t": 180.20025999999996, "r": 448.14679, "b": 189.52202999999997, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "NL", "bbox": {"l": 435.46735, "t": 192.49474999999995, "r": 448.16998000000007, "b": 201.81652999999994, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "NL", "bbox": {"l": 435.38202, "t": 204.83025999999995, "r": 448.08466, "b": 214.15204000000006, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "NL", "bbox": {"l": 435.59906, "t": 217.2337, "r": 448.3017, "b": 226.55548, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "U", "bbox": {"l": 374.14957, "t": 205.23492, "r": 381.32474, "b": 214.55669999999998, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "U", "bbox": {"l": 374.0419, "t": 217.14648, "r": 381.21707, "b": 226.46826, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "U", "bbox": {"l": 374.34418, "t": 180.93488000000002, "r": 381.51935, "b": 190.25665000000004, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "L", "bbox": {"l": 387.76285, "t": 168.57788000000005, "r": 393.28833, "b": 177.89966000000004, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "L", "bbox": {"l": 411.86395, "t": 168.06195000000002, "r": 417.38943, "b": 177.38373, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "L", "bbox": {"l": 423.33563, "t": 167.93439, "r": 428.86111, "b": 177.25616000000002, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "X", "bbox": {"l": 387.13593, "t": 180.78576999999996, "r": 393.76453, "b": 190.10753999999997, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "C", "bbox": {"l": 282.2594, "t": 244.50878999999998, "r": 289.43457, "b": 253.83056999999997, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "U", "bbox": {"l": 282.11035, "t": 256.85022000000004, "r": 289.28552, "b": 266.172, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "U", "bbox": {"l": 282.40848, "t": 269.13300000000004, "r": 289.58365, "b": 278.45477000000005, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "L", "bbox": {"l": 295.52902, "t": 244.49347, "r": 301.0545, "b": 253.81525, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "L", "bbox": {"l": 307.46613, "t": 244.57372999999995, "r": 312.99161, "b": 253.89550999999994, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "L", "bbox": {"l": 318.76886, "t": 244.44037000000003, "r": 324.29434, "b": 253.76215000000002, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "X", "bbox": {"l": 294.9021, "t": 256.70154, "r": 301.03976, "b": 266.02332, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "X X", "bbox": {"l": 307.17743, "t": 256.70154, "r": 325.59039, "b": 266.02332, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "X", "bbox": {"l": 294.78949, "t": 269.25420999999994, "r": 300.92715, "b": 278.57599000000005, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "X X", "bbox": {"l": 307.06482, "t": 269.25420999999994, "r": 325.47778, "b": 278.57599000000005, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "C", "bbox": {"l": 195.93939, "t": 268.74798999999996, "r": 203.11456, "b": 278.06976, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "L", "bbox": {"l": 209.20891, "t": 268.73267, "r": 214.73439, "b": 278.05444, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "L", "bbox": {"l": 221.14551, "t": 268.81293000000005, "r": 226.67099, "b": 278.13469999999995, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "L", "bbox": {"l": 232.44858, "t": 268.67957, "r": 237.97405999999998, "b": 278.00134, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "C", "bbox": {"l": 196.21715, "t": 244.53961000000004, "r": 203.39232, "b": 253.86139000000003, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "C", "bbox": {"l": 250.32143, "t": 244.09813999999994, "r": 257.49661, "b": 253.41992000000005, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "U", "bbox": {"l": 250.17235999999997, "t": 256.43951000000004, "r": 257.34753, "b": 265.76129000000003, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "U", "bbox": {"l": 250.47049000000004, "t": 268.72222999999997, "r": 257.64566, "b": 278.04400999999996, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "1", "bbox": {"l": 334.51135, "t": 242.99463000000003, "r": 337.22485, "b": 249.20911, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "- simple cells: \"C\"", "bbox": {"l": 339.93835, "t": 242.99463000000003, "r": 391.49472, "b": 249.20911, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "2", "bbox": {"l": 334.51135, "t": 252.93255999999997, "r": 337.33313, "b": 259.14703, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "- horizontal merges: \"C\", \"L\"", "bbox": {"l": 340.15491, "t": 252.93255999999997, "r": 421.98624, "b": 259.14703, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "3", "bbox": {"l": 334.51135, "t": 262.87048000000004, "r": 337.29868, "b": 269.08496, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "- vertical merges: \"C\", \"U\"", "bbox": {"l": 340.086, "t": 262.87048000000004, "r": 415.34375, "b": 269.08496, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "4", "bbox": {"l": 334.51135, "t": 272.80841, "r": 337.30188, "b": 279.02288999999996, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "- 2d merges: \"C\", \"L\", \"U\", \"X\"", "bbox": {"l": 340.09241, "t": 272.80841, "r": 426.59875, "b": 279.02288999999996, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "1", "bbox": {"l": 185.67178, "t": 244.04224, "r": 189.35544, "b": 250.25671, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "2", "bbox": {"l": 185.96759, "t": 268.34766, "r": 189.65125, "b": 274.56213, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "3", "bbox": {"l": 239.34152, "t": 243.62523999999996, "r": 243.02518, "b": 249.83972000000006, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "4", "bbox": {"l": 271.32852, "t": 243.49390000000005, "r": 275.01218, "b": 249.70836999999995, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "2", "bbox": {"l": 229.81627, "t": 166.51495, "r": 233.49992000000003, "b": 172.72942999999998, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "1", "bbox": {"l": 257.24402, "t": 189.961, "r": 260.92767, "b": 196.17548, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "3", "bbox": {"l": 186.87526, "t": 177.97668, "r": 190.55891, "b": 184.19115999999997, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "4", "bbox": {"l": 196.48746, "t": 169.01520000000005, "r": 200.17111, "b": 175.22968000000003, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "A", "bbox": {"l": 169.74728, "t": 167.88225999999997, "r": 175.72659, "b": 175.65039000000002, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "B", "bbox": {"l": 169.74728, "t": 206.83867999999995, "r": 175.72659, "b": 214.60681, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "C", "bbox": {"l": 274.29419, "t": 168.27972, "r": 280.2735, "b": 176.04785000000004, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "D", "bbox": {"l": 359.56152, "t": 168.27972, "r": 365.54083, "b": 176.04785000000004, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "E", "bbox": {"l": 169.74728, "t": 243.21149000000003, "r": 175.27112, "b": 250.97960999999998, "coord_origin": "TOPLEFT"}}], "children": [{"id": 19, "label": "text", "bbox": {"l": 374.49326, "t": 168.59362999999996, "r": 381.66843, "b": 177.91540999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": "C", "bbox": {"l": 374.49326, "t": 168.59362999999996, "r": 381.66843, "b": 177.91540999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 398.74011, "t": 168.50005999999996, "r": 405.91528, "b": 177.82183999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "C", "bbox": {"l": 398.74011, "t": 168.50005999999996, "r": 405.91528, "b": 177.82183999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 373.76862, "t": 192.92553999999996, "r": 380.94379, "b": 202.24730999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "C", "bbox": {"l": 373.76862, "t": 192.92553999999996, "r": 380.94379, "b": 202.24730999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 386.66388, "t": 193.07061999999996, "r": 393.83905, "b": 202.39239999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "C", "bbox": {"l": 386.66388, "t": 193.07061999999996, "r": 393.83905, "b": 202.39239999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 386.68707, "t": 205.13756999999998, "r": 393.86224, "b": 214.45934999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "C", "bbox": {"l": 386.68707, "t": 205.13756999999998, "r": 393.86224, "b": 214.45934999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 398.65729, "t": 180.73279000000002, "r": 405.83246, "b": 190.05457, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "C", "bbox": {"l": 398.65729, "t": 180.73279000000002, "r": 405.83246, "b": 190.05457, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 410.77908, "t": 180.73859000000004, "r": 417.95425, "b": 190.06035999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "C", "bbox": {"l": 410.77908, "t": 180.73859000000004, "r": 417.95425, "b": 190.06035999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 422.90503, "t": 180.65247, "r": 430.08020000000005, "b": 189.97424, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "C", "bbox": {"l": 422.90503, "t": 180.65247, "r": 430.08020000000005, "b": 189.97424, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 398.7807, "t": 192.98865, "r": 405.95587, "b": 202.31042000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "C", "bbox": {"l": 398.7807, "t": 192.98865, "r": 405.95587, "b": 202.31042000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 410.90164, "t": 192.99487, "r": 418.07681, "b": 202.31664999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "C", "bbox": {"l": 410.90164, "t": 192.99487, "r": 418.07681, "b": 202.31664999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 423.02753, "t": 192.909, "r": 430.2027, "b": 202.23077, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "C", "bbox": {"l": 423.02753, "t": 192.909, "r": 430.2027, "b": 202.23077, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 398.78235, "t": 205.31573000000003, "r": 405.95752, "b": 214.63751000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "C", "bbox": {"l": 398.78235, "t": 205.31573000000003, "r": 405.95752, "b": 214.63751000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 410.90414, "t": 205.32196, "r": 418.07932, "b": 214.64373999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "C", "bbox": {"l": 410.90414, "t": 205.32196, "r": 418.07932, "b": 214.64373999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 423.03003, "t": 205.23614999999995, "r": 430.20520000000005, "b": 214.55791999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "C", "bbox": {"l": 423.03003, "t": 205.23614999999995, "r": 430.20520000000005, "b": 214.55791999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 386.50574, "t": 217.03882, "r": 393.68091, "b": 226.36059999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "C", "bbox": {"l": 386.50574, "t": 217.03882, "r": 393.68091, "b": 226.36059999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 398.60181, "t": 217.21704, "r": 405.77698, "b": 226.53882, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "C", "bbox": {"l": 398.60181, "t": 217.21704, "r": 405.77698, "b": 226.53882, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 410.72275, "t": 217.22321, "r": 417.89792, "b": 226.54498, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "C", "bbox": {"l": 410.72275, "t": 217.22321, "r": 417.89792, "b": 226.54498, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 422.84869, "t": 217.13738999999998, "r": 430.02386, "b": 226.45916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "C", "bbox": {"l": 422.84869, "t": 217.13738999999998, "r": 430.02386, "b": 226.45916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 435.16009999999994, "t": 167.69011999999998, "r": 447.86273, "b": 177.01189999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "NL", "bbox": {"l": 435.16009999999994, "t": 167.69011999999998, "r": 447.86273, "b": 177.01189999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 435.44415, "t": 180.20025999999996, "r": 448.14679, "b": 189.52202999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "NL", "bbox": {"l": 435.44415, "t": 180.20025999999996, "r": 448.14679, "b": 189.52202999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 435.46735, "t": 192.49474999999995, "r": 448.16998000000007, "b": 201.81652999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "NL", "bbox": {"l": 435.46735, "t": 192.49474999999995, "r": 448.16998000000007, "b": 201.81652999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 435.38202, "t": 204.83025999999995, "r": 448.08466, "b": 214.15204000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "NL", "bbox": {"l": 435.38202, "t": 204.83025999999995, "r": 448.08466, "b": 214.15204000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 435.59906, "t": 217.2337, "r": 448.3017, "b": 226.55548, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "NL", "bbox": {"l": 435.59906, "t": 217.2337, "r": 448.3017, "b": 226.55548, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 374.14957, "t": 205.23492, "r": 381.32474, "b": 214.55669999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "U", "bbox": {"l": 374.14957, "t": 205.23492, "r": 381.32474, "b": 214.55669999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 374.0419, "t": 217.14648, "r": 381.21707, "b": 226.46826, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "U", "bbox": {"l": 374.0419, "t": 217.14648, "r": 381.21707, "b": 226.46826, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 374.34418, "t": 180.93488000000002, "r": 381.51935, "b": 190.25665000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "U", "bbox": {"l": 374.34418, "t": 180.93488000000002, "r": 381.51935, "b": 190.25665000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 387.76285, "t": 168.57788000000005, "r": 393.28833, "b": 177.89966000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "L", "bbox": {"l": 387.76285, "t": 168.57788000000005, "r": 393.28833, "b": 177.89966000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 411.86395, "t": 168.06195000000002, "r": 417.38943, "b": 177.38373, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "L", "bbox": {"l": 411.86395, "t": 168.06195000000002, "r": 417.38943, "b": 177.38373, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 423.33563, "t": 167.93439, "r": 428.86111, "b": 177.25616000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "L", "bbox": {"l": 423.33563, "t": 167.93439, "r": 428.86111, "b": 177.25616000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 387.13593, "t": 180.78576999999996, "r": 393.76453, "b": 190.10753999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "X", "bbox": {"l": 387.13593, "t": 180.78576999999996, "r": 393.76453, "b": 190.10753999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 282.2594, "t": 244.50878999999998, "r": 289.43457, "b": 253.83056999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "C", "bbox": {"l": 282.2594, "t": 244.50878999999998, "r": 289.43457, "b": 253.83056999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 282.11035, "t": 256.85022000000004, "r": 289.28552, "b": 266.172, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "U", "bbox": {"l": 282.11035, "t": 256.85022000000004, "r": 289.28552, "b": 266.172, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 282.40848, "t": 269.13300000000004, "r": 289.58365, "b": 278.45477000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "U", "bbox": {"l": 282.40848, "t": 269.13300000000004, "r": 289.58365, "b": 278.45477000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 295.52902, "t": 244.49347, "r": 301.0545, "b": 253.81525, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "L", "bbox": {"l": 295.52902, "t": 244.49347, "r": 301.0545, "b": 253.81525, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 307.46613, "t": 244.57372999999995, "r": 312.99161, "b": 253.89550999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "L", "bbox": {"l": 307.46613, "t": 244.57372999999995, "r": 312.99161, "b": 253.89550999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 318.76886, "t": 244.44037000000003, "r": 324.29434, "b": 253.76215000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "L", "bbox": {"l": 318.76886, "t": 244.44037000000003, "r": 324.29434, "b": 253.76215000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 294.9021, "t": 256.70154, "r": 301.03976, "b": 266.02332, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "X", "bbox": {"l": 294.9021, "t": 256.70154, "r": 301.03976, "b": 266.02332, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 307.17743, "t": 256.70154, "r": 325.59039, "b": 266.02332, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "X X", "bbox": {"l": 307.17743, "t": 256.70154, "r": 325.59039, "b": 266.02332, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 294.78949, "t": 269.25420999999994, "r": 300.92715, "b": 278.57599000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "X", "bbox": {"l": 294.78949, "t": 269.25420999999994, "r": 300.92715, "b": 278.57599000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 307.06482, "t": 269.25420999999994, "r": 325.47778, "b": 278.57599000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "X X", "bbox": {"l": 307.06482, "t": 269.25420999999994, "r": 325.47778, "b": 278.57599000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 195.93939, "t": 268.74798999999996, "r": 203.11456, "b": 278.06976, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "C", "bbox": {"l": 195.93939, "t": 268.74798999999996, "r": 203.11456, "b": 278.06976, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 209.20891, "t": 268.73267, "r": 214.73439, "b": 278.05444, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "L", "bbox": {"l": 209.20891, "t": 268.73267, "r": 214.73439, "b": 278.05444, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 221.14551, "t": 268.81293000000005, "r": 226.67099, "b": 278.13469999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "L", "bbox": {"l": 221.14551, "t": 268.81293000000005, "r": 226.67099, "b": 278.13469999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 232.44858, "t": 268.67957, "r": 237.97405999999998, "b": 278.00134, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "L", "bbox": {"l": 232.44858, "t": 268.67957, "r": 237.97405999999998, "b": 278.00134, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 196.21715, "t": 244.53961000000004, "r": 203.39232, "b": 253.86139000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "C", "bbox": {"l": 196.21715, "t": 244.53961000000004, "r": 203.39232, "b": 253.86139000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 250.32143, "t": 244.09813999999994, "r": 257.49661, "b": 253.41992000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "C", "bbox": {"l": 250.32143, "t": 244.09813999999994, "r": 257.49661, "b": 253.41992000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 250.17235999999997, "t": 256.43951000000004, "r": 257.34753, "b": 265.76129000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "U", "bbox": {"l": 250.17235999999997, "t": 256.43951000000004, "r": 257.34753, "b": 265.76129000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 250.47049000000004, "t": 268.72222999999997, "r": 257.64566, "b": 278.04400999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "U", "bbox": {"l": 250.47049000000004, "t": 268.72222999999997, "r": 257.64566, "b": 278.04400999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 334.51135, "t": 242.99463000000003, "r": 337.22485, "b": 249.20911, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "1", "bbox": {"l": 334.51135, "t": 242.99463000000003, "r": 337.22485, "b": 249.20911, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 339.93835, "t": 242.99463000000003, "r": 391.49472, "b": 249.20911, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "- simple cells: \"C\"", "bbox": {"l": 339.93835, "t": 242.99463000000003, "r": 391.49472, "b": 249.20911, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 334.51135, "t": 252.93255999999997, "r": 337.33313, "b": 259.14703, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "2", "bbox": {"l": 334.51135, "t": 252.93255999999997, "r": 337.33313, "b": 259.14703, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 340.15491, "t": 252.93255999999997, "r": 421.98624, "b": 259.14703, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "- horizontal merges: \"C\", \"L\"", "bbox": {"l": 340.15491, "t": 252.93255999999997, "r": 421.98624, "b": 259.14703, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 334.51135, "t": 262.87048000000004, "r": 337.29868, "b": 269.08496, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "3", "bbox": {"l": 334.51135, "t": 262.87048000000004, "r": 337.29868, "b": 269.08496, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 340.086, "t": 262.87048000000004, "r": 415.34375, "b": 269.08496, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "- vertical merges: \"C\", \"U\"", "bbox": {"l": 340.086, "t": 262.87048000000004, "r": 415.34375, "b": 269.08496, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "list_item", "bbox": {"l": 334.51135, "t": 272.80841, "r": 426.59875, "b": 279.02288999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.5250625610351562, "cells": [{"id": 60, "text": "4", "bbox": {"l": 334.51135, "t": 272.80841, "r": 337.30188, "b": 279.02288999999996, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "- 2d merges: \"C\", \"L\", \"U\", \"X\"", "bbox": {"l": 340.09241, "t": 272.80841, "r": 426.59875, "b": 279.02288999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 185.67178, "t": 244.04224, "r": 189.35544, "b": 250.25671, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "1", "bbox": {"l": 185.67178, "t": 244.04224, "r": 189.35544, "b": 250.25671, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 185.96759, "t": 268.34766, "r": 189.65125, "b": 274.56213, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "2", "bbox": {"l": 185.96759, "t": 268.34766, "r": 189.65125, "b": 274.56213, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 239.34152, "t": 243.62523999999996, "r": 243.02518, "b": 249.83972000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "3", "bbox": {"l": 239.34152, "t": 243.62523999999996, "r": 243.02518, "b": 249.83972000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 271.32852, "t": 243.49390000000005, "r": 275.01218, "b": 249.70836999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "4", "bbox": {"l": 271.32852, "t": 243.49390000000005, "r": 275.01218, "b": 249.70836999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 229.81627, "t": 166.51495, "r": 233.49992000000003, "b": 172.72942999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "2", "bbox": {"l": 229.81627, "t": 166.51495, "r": 233.49992000000003, "b": 172.72942999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 257.24402, "t": 189.961, "r": 260.92767, "b": 196.17548, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "1", "bbox": {"l": 257.24402, "t": 189.961, "r": 260.92767, "b": 196.17548, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 186.87526, "t": 177.97668, "r": 190.55891, "b": 184.19115999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "3", "bbox": {"l": 186.87526, "t": 177.97668, "r": 190.55891, "b": 184.19115999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 196.48746, "t": 169.01520000000005, "r": 200.17111, "b": 175.22968000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "4", "bbox": {"l": 196.48746, "t": 169.01520000000005, "r": 200.17111, "b": 175.22968000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 169.74728, "t": 167.88225999999997, "r": 175.72659, "b": 175.65039000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "A", "bbox": {"l": 169.74728, "t": 167.88225999999997, "r": 175.72659, "b": 175.65039000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 169.74728, "t": 206.83867999999995, "r": 175.72659, "b": 214.60681, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "B", "bbox": {"l": 169.74728, "t": 206.83867999999995, "r": 175.72659, "b": 214.60681, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 274.29419, "t": 168.27972, "r": 280.2735, "b": 176.04785000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "C", "bbox": {"l": 274.29419, "t": 168.27972, "r": 280.2735, "b": 176.04785000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 359.56152, "t": 168.27972, "r": 365.54083, "b": 176.04785000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "D", "bbox": {"l": 359.56152, "t": 168.27972, "r": 365.54083, "b": 176.04785000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 169.74728, "t": 243.21149000000003, "r": 175.27112, "b": 250.97960999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "E", "bbox": {"l": 169.74728, "t": 243.21149000000003, "r": 175.27112, "b": 250.97960999999998, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 9, "label": "section_header", "bbox": {"l": 134.765, "t": 305.29581, "r": 246.65197999999998, "b": 314.10275, "coord_origin": "TOPLEFT"}, "confidence": 0.9233023524284363, "cells": [{"id": 75, "text": "4.2", "bbox": {"l": 134.765, "t": 305.29581, "r": 149.40205, "b": 314.10275, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "Language Syntax", "bbox": {"l": 160.85904, "t": 305.29581, "r": 246.65197999999998, "b": 314.10275, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "text", "bbox": {"l": 134.765, "t": 325.24777, "r": 363.79617, "b": 334.04474, "coord_origin": "TOPLEFT"}, "confidence": 0.9169168472290039, "cells": [{"id": 77, "text": "The OTSL representation follows these syntax rules:", "bbox": {"l": 134.765, "t": 325.24777, "r": 363.79617, "b": 334.04474, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "list_item", "bbox": {"l": 138.97299, "t": 347.17081, "r": 480.58902, "b": 367.93375, "coord_origin": "TOPLEFT"}, "confidence": 0.9588112235069275, "cells": [{"id": 78, "text": "1.", "bbox": {"l": 138.97299, "t": 347.18079, "r": 146.71991, "b": 355.97775, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "Left-looking cell rule", "bbox": {"l": 151.70099, "t": 347.17081, "r": 257.37927, "b": 355.97775, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": ": The left neighbour of an \"L\" cell must be either", "bbox": {"l": 257.383, "t": 347.18079, "r": 480.58902, "b": 355.97775, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "another \"L\" cell or a \"C\" cell.", "bbox": {"l": 151.70099, "t": 359.13678, "r": 283.59387, "b": 367.93375, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "list_item", "bbox": {"l": 138.97299, "t": 371.08481, "r": 480.59229000000005, "b": 391.84673999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9585386514663696, "cells": [{"id": 82, "text": "2.", "bbox": {"l": 138.97299, "t": 371.09479, "r": 146.71991, "b": 379.89175, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "Up-looking cell rule", "bbox": {"l": 151.70099, "t": 371.08481, "r": 252.11203, "b": 379.89175, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": ": The upper neighbour of a \"U\" cell must be either", "bbox": {"l": 252.112, "t": 371.09479, "r": 480.59229000000005, "b": 379.89175, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "another \"U\" cell or a \"C\" cell.", "bbox": {"l": 151.70099, "t": 383.04977, "r": 284.8392, "b": 391.84673999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "section_header", "bbox": {"l": 138.97299, "t": 394.99780000000004, "r": 226.07360999999997, "b": 403.80475, "coord_origin": "TOPLEFT"}, "confidence": 0.6506174206733704, "cells": [{"id": 86, "text": "3.", "bbox": {"l": 138.97299, "t": 395.0077800000001, "r": 146.71991, "b": 403.80475, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Cross cell rule", "bbox": {"l": 151.70099, "t": 394.99780000000004, "r": 223.3042, "b": 403.80475, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": ":", "bbox": {"l": 223.30699, "t": 395.0077800000001, "r": 226.07360999999997, "b": 403.80475, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "list_item", "bbox": {"l": 151.70099, "t": 406.96677, "r": 480.59238, "b": 439.67371, "coord_origin": "TOPLEFT"}, "confidence": 0.7247239947319031, "cells": [{"id": 89, "text": "The left neighbour of an \"X\" cell must be either another \"X\" cell or a \"U\"", "bbox": {"l": 151.70099, "t": 406.96677, "r": 480.59238, "b": 415.76373, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "cell, and the upper neighbour of an \"X\" cell must be either another \"X\" cell", "bbox": {"l": 151.70099, "t": 418.9217499999999, "r": 480.59219, "b": 427.71871999999996, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "or an \"L\" cell.", "bbox": {"l": 151.70099, "t": 430.87674, "r": 214.39663999999996, "b": 439.67371, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "list_item", "bbox": {"l": 138.97299, "t": 442.82574, "r": 474.59018, "b": 451.63269, "coord_origin": "TOPLEFT"}, "confidence": 0.9259927272796631, "cells": [{"id": 92, "text": "4.", "bbox": {"l": 138.97299, "t": 442.83572, "r": 146.71991, "b": 451.63269, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "First row rule", "bbox": {"l": 151.70099, "t": 442.82574, "r": 221.32263, "b": 451.63269, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": ": Only \"L\" cells and \"C\" cells are allowed in the first row.", "bbox": {"l": 221.32700000000003, "t": 442.83572, "r": 474.59018, "b": 451.63269, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "list_item", "bbox": {"l": 138.97299, "t": 454.78375, "r": 480.58746, "b": 475.54568, "coord_origin": "TOPLEFT"}, "confidence": 0.9420599937438965, "cells": [{"id": 95, "text": "5.", "bbox": {"l": 138.97299, "t": 454.7937299999999, "r": 146.71991, "b": 463.5907, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "First column rule", "bbox": {"l": 151.70099, "t": 454.78375, "r": 240.71982, "b": 463.5907, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": ": Only \"U\" cells and \"C\" cells are allowed in the first", "bbox": {"l": 240.71599, "t": 454.7937299999999, "r": 480.58746, "b": 463.5907, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "column.", "bbox": {"l": 151.70099, "t": 466.74872, "r": 186.0072, "b": 475.54568, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "list_item", "bbox": {"l": 138.97299, "t": 478.69675, "r": 480.59457, "b": 499.45969, "coord_origin": "TOPLEFT"}, "confidence": 0.9617829918861389, "cells": [{"id": 99, "text": "6.", "bbox": {"l": 138.97299, "t": 478.70673, "r": 146.71991, "b": 487.50369, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "Rectangular rule", "bbox": {"l": 151.70099, "t": 478.69675, "r": 235.15768, "b": 487.50369, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": ": The table representation is always rectangular - all rows", "bbox": {"l": 235.15697999999998, "t": 478.70673, "r": 480.59457, "b": 487.50369, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "must have an equal number of tokens, terminated with \"NL\" token.", "bbox": {"l": 151.70099, "t": 490.66272, "r": 448.04147, "b": 499.45969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 134.76498, "t": 512.59271, "r": 480.59583, "b": 640.9416699999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9785562753677368, "cells": [{"id": 103, "text": "The application of these rules gives OTSL a set of unique properties. First", "bbox": {"l": 149.70898, "t": 512.59271, "r": 480.59583, "b": 521.38968, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "of all, the OTSL enforces a strictly rectangular structure representation, where", "bbox": {"l": 134.76498, "t": 524.5477000000001, "r": 480.59079, "b": 533.34467, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "every new-line token starts a new row. As a consequence, all rows and all columns", "bbox": {"l": 134.76498, "t": 536.5027, "r": 480.59482, "b": 545.29967, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "have exactly the same number of tokens, irrespective of cell spans. Secondly, the", "bbox": {"l": 134.76498, "t": 548.4586899999999, "r": 480.58865000000003, "b": 557.25566, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "OTSL representation is unambiguous: Every table structure is represented in one", "bbox": {"l": 134.76498, "t": 560.4137000000001, "r": 480.59365999999994, "b": 569.21066, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "way. In this representation every table cell corresponds to a \"C\"-cell token, which", "bbox": {"l": 134.76498, "t": 572.3687, "r": 480.58673, "b": 581.16566, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "in case of spans is always located in the top-left corner of the table cell definition.", "bbox": {"l": 134.76498, "t": 584.3237, "r": 480.59171, "b": 593.12067, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "Third, OTSL syntax rules are only backward-looking. As a consequence, every", "bbox": {"l": 134.76498, "t": 596.2787, "r": 480.59180000000003, "b": 605.07567, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "predicted token can be validated straight during sequence generation by looking", "bbox": {"l": 134.76498, "t": 608.2347, "r": 480.5936899999999, "b": 617.03166, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "at the previously predicted sequence. As such, OTSL can guarantee that every", "bbox": {"l": 134.76498, "t": 620.1897, "r": 480.59072999999995, "b": 628.98666, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "predicted sequence is syntactically valid.", "bbox": {"l": 134.76498, "t": 632.1447000000001, "r": 311.19769, "b": 640.9416699999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 134.76498, "t": 644.1026899999999, "r": 480.59265, "b": 664.8546699999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9590610861778259, "cells": [{"id": 114, "text": "These characteristics can be easily learned by sequence generator networks,", "bbox": {"l": 149.70898, "t": 644.1026899999999, "r": 480.59186, "b": 652.89966, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "as we demonstrate further below. We find strong indications that this pattern", "bbox": {"l": 134.76498, "t": 656.05769, "r": 480.59265, "b": 664.8546699999999, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_header", "id": 7, "page_no": 6, "cluster": {"id": 7, "label": "page_header", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.932651162147522, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Optimized Table Tokenization for Table Structure Recognition"}, {"label": "page_header", "id": 11, "page_no": 6, "cluster": {"id": 11, "label": "page_header", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8749732375144958, "cells": [{"id": 1, "text": "7", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "7"}, {"label": "caption", "id": 6, "page_no": 6, "cluster": {"id": 6, "label": "caption", "bbox": {"l": 134.765, "t": 125.79918999999984, "r": 480.5874, "b": 155.84966999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9333080053329468, "cells": [{"id": 2, "text": "Fig. 3.", "bbox": {"l": 134.765, "t": 125.79918999999984, "r": 162.64424, "b": 133.72551999999996, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "OTSL description of table structure: A - table example; B - graphical repre-", "bbox": {"l": 166.276, "t": 125.86200000000008, "r": 480.58675999999997, "b": 133.93169999999998, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "sentation of table structure; C - mapping structure on a grid; D - OTSL structure", "bbox": {"l": 134.765, "t": 136.82097999999996, "r": 480.5874, "b": 144.89068999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "encoding; E - explanation on cell encoding", "bbox": {"l": 134.765, "t": 147.77997000000005, "r": 306.1156, "b": 155.84966999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Fig. 3. OTSL description of table structure: A - table example; B - graphical representation of table structure; C - mapping structure on a grid; D - OTSL structure encoding; E - explanation on cell encoding"}, {"label": "picture", "id": 12, "page_no": 6, "cluster": {"id": 12, "label": "picture", "bbox": {"l": 164.65028381347656, "t": 163.79708862304688, "r": 449.5505676269531, "b": 280.3409423828125, "coord_origin": "TOPLEFT"}, "confidence": 0.7868534922599792, "cells": [{"id": 6, "text": "C", "bbox": {"l": 374.49326, "t": 168.59362999999996, "r": 381.66843, "b": 177.91540999999995, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "C", "bbox": {"l": 398.74011, "t": 168.50005999999996, "r": 405.91528, "b": 177.82183999999995, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "C", "bbox": {"l": 373.76862, "t": 192.92553999999996, "r": 380.94379, "b": 202.24730999999997, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "C", "bbox": {"l": 386.66388, "t": 193.07061999999996, "r": 393.83905, "b": 202.39239999999995, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "C", "bbox": {"l": 386.68707, "t": 205.13756999999998, "r": 393.86224, "b": 214.45934999999997, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "C", "bbox": {"l": 398.65729, "t": 180.73279000000002, "r": 405.83246, "b": 190.05457, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "C", "bbox": {"l": 410.77908, "t": 180.73859000000004, "r": 417.95425, "b": 190.06035999999995, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "C", "bbox": {"l": 422.90503, "t": 180.65247, "r": 430.08020000000005, "b": 189.97424, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "C", "bbox": {"l": 398.7807, "t": 192.98865, "r": 405.95587, "b": 202.31042000000002, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "C", "bbox": {"l": 410.90164, "t": 192.99487, "r": 418.07681, "b": 202.31664999999998, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "C", "bbox": {"l": 423.02753, "t": 192.909, "r": 430.2027, "b": 202.23077, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "C", "bbox": {"l": 398.78235, "t": 205.31573000000003, "r": 405.95752, "b": 214.63751000000002, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "C", "bbox": {"l": 410.90414, "t": 205.32196, "r": 418.07932, "b": 214.64373999999998, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "C", "bbox": {"l": 423.03003, "t": 205.23614999999995, "r": 430.20520000000005, "b": 214.55791999999997, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "C", "bbox": {"l": 386.50574, "t": 217.03882, "r": 393.68091, "b": 226.36059999999998, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "C", "bbox": {"l": 398.60181, "t": 217.21704, "r": 405.77698, "b": 226.53882, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "C", "bbox": {"l": 410.72275, "t": 217.22321, "r": 417.89792, "b": 226.54498, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "C", "bbox": {"l": 422.84869, "t": 217.13738999999998, "r": 430.02386, "b": 226.45916999999997, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "NL", "bbox": {"l": 435.16009999999994, "t": 167.69011999999998, "r": 447.86273, "b": 177.01189999999997, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "NL", "bbox": {"l": 435.44415, "t": 180.20025999999996, "r": 448.14679, "b": 189.52202999999997, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "NL", "bbox": {"l": 435.46735, "t": 192.49474999999995, "r": 448.16998000000007, "b": 201.81652999999994, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "NL", "bbox": {"l": 435.38202, "t": 204.83025999999995, "r": 448.08466, "b": 214.15204000000006, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "NL", "bbox": {"l": 435.59906, "t": 217.2337, "r": 448.3017, "b": 226.55548, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "U", "bbox": {"l": 374.14957, "t": 205.23492, "r": 381.32474, "b": 214.55669999999998, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "U", "bbox": {"l": 374.0419, "t": 217.14648, "r": 381.21707, "b": 226.46826, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "U", "bbox": {"l": 374.34418, "t": 180.93488000000002, "r": 381.51935, "b": 190.25665000000004, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "L", "bbox": {"l": 387.76285, "t": 168.57788000000005, "r": 393.28833, "b": 177.89966000000004, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "L", "bbox": {"l": 411.86395, "t": 168.06195000000002, "r": 417.38943, "b": 177.38373, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "L", "bbox": {"l": 423.33563, "t": 167.93439, "r": 428.86111, "b": 177.25616000000002, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "X", "bbox": {"l": 387.13593, "t": 180.78576999999996, "r": 393.76453, "b": 190.10753999999997, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "C", "bbox": {"l": 282.2594, "t": 244.50878999999998, "r": 289.43457, "b": 253.83056999999997, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "U", "bbox": {"l": 282.11035, "t": 256.85022000000004, "r": 289.28552, "b": 266.172, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "U", "bbox": {"l": 282.40848, "t": 269.13300000000004, "r": 289.58365, "b": 278.45477000000005, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "L", "bbox": {"l": 295.52902, "t": 244.49347, "r": 301.0545, "b": 253.81525, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "L", "bbox": {"l": 307.46613, "t": 244.57372999999995, "r": 312.99161, "b": 253.89550999999994, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "L", "bbox": {"l": 318.76886, "t": 244.44037000000003, "r": 324.29434, "b": 253.76215000000002, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "X", "bbox": {"l": 294.9021, "t": 256.70154, "r": 301.03976, "b": 266.02332, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "X X", "bbox": {"l": 307.17743, "t": 256.70154, "r": 325.59039, "b": 266.02332, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "X", "bbox": {"l": 294.78949, "t": 269.25420999999994, "r": 300.92715, "b": 278.57599000000005, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "X X", "bbox": {"l": 307.06482, "t": 269.25420999999994, "r": 325.47778, "b": 278.57599000000005, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "C", "bbox": {"l": 195.93939, "t": 268.74798999999996, "r": 203.11456, "b": 278.06976, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "L", "bbox": {"l": 209.20891, "t": 268.73267, "r": 214.73439, "b": 278.05444, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "L", "bbox": {"l": 221.14551, "t": 268.81293000000005, "r": 226.67099, "b": 278.13469999999995, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "L", "bbox": {"l": 232.44858, "t": 268.67957, "r": 237.97405999999998, "b": 278.00134, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "C", "bbox": {"l": 196.21715, "t": 244.53961000000004, "r": 203.39232, "b": 253.86139000000003, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "C", "bbox": {"l": 250.32143, "t": 244.09813999999994, "r": 257.49661, "b": 253.41992000000005, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "U", "bbox": {"l": 250.17235999999997, "t": 256.43951000000004, "r": 257.34753, "b": 265.76129000000003, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "U", "bbox": {"l": 250.47049000000004, "t": 268.72222999999997, "r": 257.64566, "b": 278.04400999999996, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "1", "bbox": {"l": 334.51135, "t": 242.99463000000003, "r": 337.22485, "b": 249.20911, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "- simple cells: \"C\"", "bbox": {"l": 339.93835, "t": 242.99463000000003, "r": 391.49472, "b": 249.20911, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "2", "bbox": {"l": 334.51135, "t": 252.93255999999997, "r": 337.33313, "b": 259.14703, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "- horizontal merges: \"C\", \"L\"", "bbox": {"l": 340.15491, "t": 252.93255999999997, "r": 421.98624, "b": 259.14703, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "3", "bbox": {"l": 334.51135, "t": 262.87048000000004, "r": 337.29868, "b": 269.08496, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "- vertical merges: \"C\", \"U\"", "bbox": {"l": 340.086, "t": 262.87048000000004, "r": 415.34375, "b": 269.08496, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "4", "bbox": {"l": 334.51135, "t": 272.80841, "r": 337.30188, "b": 279.02288999999996, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "- 2d merges: \"C\", \"L\", \"U\", \"X\"", "bbox": {"l": 340.09241, "t": 272.80841, "r": 426.59875, "b": 279.02288999999996, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "1", "bbox": {"l": 185.67178, "t": 244.04224, "r": 189.35544, "b": 250.25671, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "2", "bbox": {"l": 185.96759, "t": 268.34766, "r": 189.65125, "b": 274.56213, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "3", "bbox": {"l": 239.34152, "t": 243.62523999999996, "r": 243.02518, "b": 249.83972000000006, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "4", "bbox": {"l": 271.32852, "t": 243.49390000000005, "r": 275.01218, "b": 249.70836999999995, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "2", "bbox": {"l": 229.81627, "t": 166.51495, "r": 233.49992000000003, "b": 172.72942999999998, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "1", "bbox": {"l": 257.24402, "t": 189.961, "r": 260.92767, "b": 196.17548, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "3", "bbox": {"l": 186.87526, "t": 177.97668, "r": 190.55891, "b": 184.19115999999997, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "4", "bbox": {"l": 196.48746, "t": 169.01520000000005, "r": 200.17111, "b": 175.22968000000003, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "A", "bbox": {"l": 169.74728, "t": 167.88225999999997, "r": 175.72659, "b": 175.65039000000002, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "B", "bbox": {"l": 169.74728, "t": 206.83867999999995, "r": 175.72659, "b": 214.60681, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "C", "bbox": {"l": 274.29419, "t": 168.27972, "r": 280.2735, "b": 176.04785000000004, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "D", "bbox": {"l": 359.56152, "t": 168.27972, "r": 365.54083, "b": 176.04785000000004, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "E", "bbox": {"l": 169.74728, "t": 243.21149000000003, "r": 175.27112, "b": 250.97960999999998, "coord_origin": "TOPLEFT"}}], "children": [{"id": 19, "label": "text", "bbox": {"l": 374.49326, "t": 168.59362999999996, "r": 381.66843, "b": 177.91540999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": "C", "bbox": {"l": 374.49326, "t": 168.59362999999996, "r": 381.66843, "b": 177.91540999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 398.74011, "t": 168.50005999999996, "r": 405.91528, "b": 177.82183999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "C", "bbox": {"l": 398.74011, "t": 168.50005999999996, "r": 405.91528, "b": 177.82183999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 373.76862, "t": 192.92553999999996, "r": 380.94379, "b": 202.24730999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "C", "bbox": {"l": 373.76862, "t": 192.92553999999996, "r": 380.94379, "b": 202.24730999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 386.66388, "t": 193.07061999999996, "r": 393.83905, "b": 202.39239999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "C", "bbox": {"l": 386.66388, "t": 193.07061999999996, "r": 393.83905, "b": 202.39239999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 386.68707, "t": 205.13756999999998, "r": 393.86224, "b": 214.45934999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "C", "bbox": {"l": 386.68707, "t": 205.13756999999998, "r": 393.86224, "b": 214.45934999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 398.65729, "t": 180.73279000000002, "r": 405.83246, "b": 190.05457, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "C", "bbox": {"l": 398.65729, "t": 180.73279000000002, "r": 405.83246, "b": 190.05457, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 410.77908, "t": 180.73859000000004, "r": 417.95425, "b": 190.06035999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "C", "bbox": {"l": 410.77908, "t": 180.73859000000004, "r": 417.95425, "b": 190.06035999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 422.90503, "t": 180.65247, "r": 430.08020000000005, "b": 189.97424, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "C", "bbox": {"l": 422.90503, "t": 180.65247, "r": 430.08020000000005, "b": 189.97424, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 398.7807, "t": 192.98865, "r": 405.95587, "b": 202.31042000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "C", "bbox": {"l": 398.7807, "t": 192.98865, "r": 405.95587, "b": 202.31042000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 410.90164, "t": 192.99487, "r": 418.07681, "b": 202.31664999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "C", "bbox": {"l": 410.90164, "t": 192.99487, "r": 418.07681, "b": 202.31664999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 423.02753, "t": 192.909, "r": 430.2027, "b": 202.23077, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "C", "bbox": {"l": 423.02753, "t": 192.909, "r": 430.2027, "b": 202.23077, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 398.78235, "t": 205.31573000000003, "r": 405.95752, "b": 214.63751000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "C", "bbox": {"l": 398.78235, "t": 205.31573000000003, "r": 405.95752, "b": 214.63751000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 410.90414, "t": 205.32196, "r": 418.07932, "b": 214.64373999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "C", "bbox": {"l": 410.90414, "t": 205.32196, "r": 418.07932, "b": 214.64373999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 423.03003, "t": 205.23614999999995, "r": 430.20520000000005, "b": 214.55791999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "C", "bbox": {"l": 423.03003, "t": 205.23614999999995, "r": 430.20520000000005, "b": 214.55791999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 386.50574, "t": 217.03882, "r": 393.68091, "b": 226.36059999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "C", "bbox": {"l": 386.50574, "t": 217.03882, "r": 393.68091, "b": 226.36059999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 398.60181, "t": 217.21704, "r": 405.77698, "b": 226.53882, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "C", "bbox": {"l": 398.60181, "t": 217.21704, "r": 405.77698, "b": 226.53882, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 410.72275, "t": 217.22321, "r": 417.89792, "b": 226.54498, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "C", "bbox": {"l": 410.72275, "t": 217.22321, "r": 417.89792, "b": 226.54498, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 422.84869, "t": 217.13738999999998, "r": 430.02386, "b": 226.45916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "C", "bbox": {"l": 422.84869, "t": 217.13738999999998, "r": 430.02386, "b": 226.45916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 435.16009999999994, "t": 167.69011999999998, "r": 447.86273, "b": 177.01189999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "NL", "bbox": {"l": 435.16009999999994, "t": 167.69011999999998, "r": 447.86273, "b": 177.01189999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 435.44415, "t": 180.20025999999996, "r": 448.14679, "b": 189.52202999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "NL", "bbox": {"l": 435.44415, "t": 180.20025999999996, "r": 448.14679, "b": 189.52202999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 435.46735, "t": 192.49474999999995, "r": 448.16998000000007, "b": 201.81652999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "NL", "bbox": {"l": 435.46735, "t": 192.49474999999995, "r": 448.16998000000007, "b": 201.81652999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 435.38202, "t": 204.83025999999995, "r": 448.08466, "b": 214.15204000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "NL", "bbox": {"l": 435.38202, "t": 204.83025999999995, "r": 448.08466, "b": 214.15204000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 435.59906, "t": 217.2337, "r": 448.3017, "b": 226.55548, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "NL", "bbox": {"l": 435.59906, "t": 217.2337, "r": 448.3017, "b": 226.55548, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 374.14957, "t": 205.23492, "r": 381.32474, "b": 214.55669999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "U", "bbox": {"l": 374.14957, "t": 205.23492, "r": 381.32474, "b": 214.55669999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 374.0419, "t": 217.14648, "r": 381.21707, "b": 226.46826, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "U", "bbox": {"l": 374.0419, "t": 217.14648, "r": 381.21707, "b": 226.46826, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 374.34418, "t": 180.93488000000002, "r": 381.51935, "b": 190.25665000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "U", "bbox": {"l": 374.34418, "t": 180.93488000000002, "r": 381.51935, "b": 190.25665000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 387.76285, "t": 168.57788000000005, "r": 393.28833, "b": 177.89966000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "L", "bbox": {"l": 387.76285, "t": 168.57788000000005, "r": 393.28833, "b": 177.89966000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 411.86395, "t": 168.06195000000002, "r": 417.38943, "b": 177.38373, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "L", "bbox": {"l": 411.86395, "t": 168.06195000000002, "r": 417.38943, "b": 177.38373, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 423.33563, "t": 167.93439, "r": 428.86111, "b": 177.25616000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "L", "bbox": {"l": 423.33563, "t": 167.93439, "r": 428.86111, "b": 177.25616000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 387.13593, "t": 180.78576999999996, "r": 393.76453, "b": 190.10753999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "X", "bbox": {"l": 387.13593, "t": 180.78576999999996, "r": 393.76453, "b": 190.10753999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 282.2594, "t": 244.50878999999998, "r": 289.43457, "b": 253.83056999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "C", "bbox": {"l": 282.2594, "t": 244.50878999999998, "r": 289.43457, "b": 253.83056999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 282.11035, "t": 256.85022000000004, "r": 289.28552, "b": 266.172, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "U", "bbox": {"l": 282.11035, "t": 256.85022000000004, "r": 289.28552, "b": 266.172, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 282.40848, "t": 269.13300000000004, "r": 289.58365, "b": 278.45477000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "U", "bbox": {"l": 282.40848, "t": 269.13300000000004, "r": 289.58365, "b": 278.45477000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 295.52902, "t": 244.49347, "r": 301.0545, "b": 253.81525, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "L", "bbox": {"l": 295.52902, "t": 244.49347, "r": 301.0545, "b": 253.81525, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 307.46613, "t": 244.57372999999995, "r": 312.99161, "b": 253.89550999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "L", "bbox": {"l": 307.46613, "t": 244.57372999999995, "r": 312.99161, "b": 253.89550999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 318.76886, "t": 244.44037000000003, "r": 324.29434, "b": 253.76215000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "L", "bbox": {"l": 318.76886, "t": 244.44037000000003, "r": 324.29434, "b": 253.76215000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 294.9021, "t": 256.70154, "r": 301.03976, "b": 266.02332, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "X", "bbox": {"l": 294.9021, "t": 256.70154, "r": 301.03976, "b": 266.02332, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 307.17743, "t": 256.70154, "r": 325.59039, "b": 266.02332, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "X X", "bbox": {"l": 307.17743, "t": 256.70154, "r": 325.59039, "b": 266.02332, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 294.78949, "t": 269.25420999999994, "r": 300.92715, "b": 278.57599000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "X", "bbox": {"l": 294.78949, "t": 269.25420999999994, "r": 300.92715, "b": 278.57599000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 307.06482, "t": 269.25420999999994, "r": 325.47778, "b": 278.57599000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "X X", "bbox": {"l": 307.06482, "t": 269.25420999999994, "r": 325.47778, "b": 278.57599000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 195.93939, "t": 268.74798999999996, "r": 203.11456, "b": 278.06976, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "C", "bbox": {"l": 195.93939, "t": 268.74798999999996, "r": 203.11456, "b": 278.06976, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 209.20891, "t": 268.73267, "r": 214.73439, "b": 278.05444, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "L", "bbox": {"l": 209.20891, "t": 268.73267, "r": 214.73439, "b": 278.05444, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 221.14551, "t": 268.81293000000005, "r": 226.67099, "b": 278.13469999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "L", "bbox": {"l": 221.14551, "t": 268.81293000000005, "r": 226.67099, "b": 278.13469999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 232.44858, "t": 268.67957, "r": 237.97405999999998, "b": 278.00134, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "L", "bbox": {"l": 232.44858, "t": 268.67957, "r": 237.97405999999998, "b": 278.00134, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 196.21715, "t": 244.53961000000004, "r": 203.39232, "b": 253.86139000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "C", "bbox": {"l": 196.21715, "t": 244.53961000000004, "r": 203.39232, "b": 253.86139000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 250.32143, "t": 244.09813999999994, "r": 257.49661, "b": 253.41992000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "C", "bbox": {"l": 250.32143, "t": 244.09813999999994, "r": 257.49661, "b": 253.41992000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 250.17235999999997, "t": 256.43951000000004, "r": 257.34753, "b": 265.76129000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "U", "bbox": {"l": 250.17235999999997, "t": 256.43951000000004, "r": 257.34753, "b": 265.76129000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 250.47049000000004, "t": 268.72222999999997, "r": 257.64566, "b": 278.04400999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "U", "bbox": {"l": 250.47049000000004, "t": 268.72222999999997, "r": 257.64566, "b": 278.04400999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 334.51135, "t": 242.99463000000003, "r": 337.22485, "b": 249.20911, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "1", "bbox": {"l": 334.51135, "t": 242.99463000000003, "r": 337.22485, "b": 249.20911, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 339.93835, "t": 242.99463000000003, "r": 391.49472, "b": 249.20911, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "- simple cells: \"C\"", "bbox": {"l": 339.93835, "t": 242.99463000000003, "r": 391.49472, "b": 249.20911, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 334.51135, "t": 252.93255999999997, "r": 337.33313, "b": 259.14703, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "2", "bbox": {"l": 334.51135, "t": 252.93255999999997, "r": 337.33313, "b": 259.14703, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 340.15491, "t": 252.93255999999997, "r": 421.98624, "b": 259.14703, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "- horizontal merges: \"C\", \"L\"", "bbox": {"l": 340.15491, "t": 252.93255999999997, "r": 421.98624, "b": 259.14703, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 334.51135, "t": 262.87048000000004, "r": 337.29868, "b": 269.08496, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "3", "bbox": {"l": 334.51135, "t": 262.87048000000004, "r": 337.29868, "b": 269.08496, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 340.086, "t": 262.87048000000004, "r": 415.34375, "b": 269.08496, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "- vertical merges: \"C\", \"U\"", "bbox": {"l": 340.086, "t": 262.87048000000004, "r": 415.34375, "b": 269.08496, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "list_item", "bbox": {"l": 334.51135, "t": 272.80841, "r": 426.59875, "b": 279.02288999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.5250625610351562, "cells": [{"id": 60, "text": "4", "bbox": {"l": 334.51135, "t": 272.80841, "r": 337.30188, "b": 279.02288999999996, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "- 2d merges: \"C\", \"L\", \"U\", \"X\"", "bbox": {"l": 340.09241, "t": 272.80841, "r": 426.59875, "b": 279.02288999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 185.67178, "t": 244.04224, "r": 189.35544, "b": 250.25671, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "1", "bbox": {"l": 185.67178, "t": 244.04224, "r": 189.35544, "b": 250.25671, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 185.96759, "t": 268.34766, "r": 189.65125, "b": 274.56213, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "2", "bbox": {"l": 185.96759, "t": 268.34766, "r": 189.65125, "b": 274.56213, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 239.34152, "t": 243.62523999999996, "r": 243.02518, "b": 249.83972000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "3", "bbox": {"l": 239.34152, "t": 243.62523999999996, "r": 243.02518, "b": 249.83972000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 271.32852, "t": 243.49390000000005, "r": 275.01218, "b": 249.70836999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "4", "bbox": {"l": 271.32852, "t": 243.49390000000005, "r": 275.01218, "b": 249.70836999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 229.81627, "t": 166.51495, "r": 233.49992000000003, "b": 172.72942999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "2", "bbox": {"l": 229.81627, "t": 166.51495, "r": 233.49992000000003, "b": 172.72942999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 257.24402, "t": 189.961, "r": 260.92767, "b": 196.17548, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "1", "bbox": {"l": 257.24402, "t": 189.961, "r": 260.92767, "b": 196.17548, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 186.87526, "t": 177.97668, "r": 190.55891, "b": 184.19115999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "3", "bbox": {"l": 186.87526, "t": 177.97668, "r": 190.55891, "b": 184.19115999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 196.48746, "t": 169.01520000000005, "r": 200.17111, "b": 175.22968000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "4", "bbox": {"l": 196.48746, "t": 169.01520000000005, "r": 200.17111, "b": 175.22968000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 169.74728, "t": 167.88225999999997, "r": 175.72659, "b": 175.65039000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "A", "bbox": {"l": 169.74728, "t": 167.88225999999997, "r": 175.72659, "b": 175.65039000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 169.74728, "t": 206.83867999999995, "r": 175.72659, "b": 214.60681, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "B", "bbox": {"l": 169.74728, "t": 206.83867999999995, "r": 175.72659, "b": 214.60681, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 274.29419, "t": 168.27972, "r": 280.2735, "b": 176.04785000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "C", "bbox": {"l": 274.29419, "t": 168.27972, "r": 280.2735, "b": 176.04785000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 359.56152, "t": 168.27972, "r": 365.54083, "b": 176.04785000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "D", "bbox": {"l": 359.56152, "t": 168.27972, "r": 365.54083, "b": 176.04785000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 169.74728, "t": 243.21149000000003, "r": 175.27112, "b": 250.97960999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "E", "bbox": {"l": 169.74728, "t": 243.21149000000003, "r": 175.27112, "b": 250.97960999999998, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "section_header", "id": 9, "page_no": 6, "cluster": {"id": 9, "label": "section_header", "bbox": {"l": 134.765, "t": 305.29581, "r": 246.65197999999998, "b": 314.10275, "coord_origin": "TOPLEFT"}, "confidence": 0.9233023524284363, "cells": [{"id": 75, "text": "4.2", "bbox": {"l": 134.765, "t": 305.29581, "r": 149.40205, "b": 314.10275, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "Language Syntax", "bbox": {"l": 160.85904, "t": 305.29581, "r": 246.65197999999998, "b": 314.10275, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4.2 Language Syntax"}, {"label": "text", "id": 10, "page_no": 6, "cluster": {"id": 10, "label": "text", "bbox": {"l": 134.765, "t": 325.24777, "r": 363.79617, "b": 334.04474, "coord_origin": "TOPLEFT"}, "confidence": 0.9169168472290039, "cells": [{"id": 77, "text": "The OTSL representation follows these syntax rules:", "bbox": {"l": 134.765, "t": 325.24777, "r": 363.79617, "b": 334.04474, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The OTSL representation follows these syntax rules:"}, {"label": "list_item", "id": 3, "page_no": 6, "cluster": {"id": 3, "label": "list_item", "bbox": {"l": 138.97299, "t": 347.17081, "r": 480.58902, "b": 367.93375, "coord_origin": "TOPLEFT"}, "confidence": 0.9588112235069275, "cells": [{"id": 78, "text": "1.", "bbox": {"l": 138.97299, "t": 347.18079, "r": 146.71991, "b": 355.97775, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "Left-looking cell rule", "bbox": {"l": 151.70099, "t": 347.17081, "r": 257.37927, "b": 355.97775, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": ": The left neighbour of an \"L\" cell must be either", "bbox": {"l": 257.383, "t": 347.18079, "r": 480.58902, "b": 355.97775, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "another \"L\" cell or a \"C\" cell.", "bbox": {"l": 151.70099, "t": 359.13678, "r": 283.59387, "b": 367.93375, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1. Left-looking cell rule : The left neighbour of an \"L\" cell must be either another \"L\" cell or a \"C\" cell."}, {"label": "list_item", "id": 4, "page_no": 6, "cluster": {"id": 4, "label": "list_item", "bbox": {"l": 138.97299, "t": 371.08481, "r": 480.59229000000005, "b": 391.84673999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9585386514663696, "cells": [{"id": 82, "text": "2.", "bbox": {"l": 138.97299, "t": 371.09479, "r": 146.71991, "b": 379.89175, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "Up-looking cell rule", "bbox": {"l": 151.70099, "t": 371.08481, "r": 252.11203, "b": 379.89175, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": ": The upper neighbour of a \"U\" cell must be either", "bbox": {"l": 252.112, "t": 371.09479, "r": 480.59229000000005, "b": 379.89175, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "another \"U\" cell or a \"C\" cell.", "bbox": {"l": 151.70099, "t": 383.04977, "r": 284.8392, "b": 391.84673999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2. Up-looking cell rule : The upper neighbour of a \"U\" cell must be either another \"U\" cell or a \"C\" cell."}, {"label": "section_header", "id": 14, "page_no": 6, "cluster": {"id": 14, "label": "section_header", "bbox": {"l": 138.97299, "t": 394.99780000000004, "r": 226.07360999999997, "b": 403.80475, "coord_origin": "TOPLEFT"}, "confidence": 0.6506174206733704, "cells": [{"id": 86, "text": "3.", "bbox": {"l": 138.97299, "t": 395.0077800000001, "r": 146.71991, "b": 403.80475, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Cross cell rule", "bbox": {"l": 151.70099, "t": 394.99780000000004, "r": 223.3042, "b": 403.80475, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": ":", "bbox": {"l": 223.30699, "t": 395.0077800000001, "r": 226.07360999999997, "b": 403.80475, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3. Cross cell rule :"}, {"label": "list_item", "id": 13, "page_no": 6, "cluster": {"id": 13, "label": "list_item", "bbox": {"l": 151.70099, "t": 406.96677, "r": 480.59238, "b": 439.67371, "coord_origin": "TOPLEFT"}, "confidence": 0.7247239947319031, "cells": [{"id": 89, "text": "The left neighbour of an \"X\" cell must be either another \"X\" cell or a \"U\"", "bbox": {"l": 151.70099, "t": 406.96677, "r": 480.59238, "b": 415.76373, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "cell, and the upper neighbour of an \"X\" cell must be either another \"X\" cell", "bbox": {"l": 151.70099, "t": 418.9217499999999, "r": 480.59219, "b": 427.71871999999996, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "or an \"L\" cell.", "bbox": {"l": 151.70099, "t": 430.87674, "r": 214.39663999999996, "b": 439.67371, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The left neighbour of an \"X\" cell must be either another \"X\" cell or a \"U\" cell, and the upper neighbour of an \"X\" cell must be either another \"X\" cell or an \"L\" cell."}, {"label": "list_item", "id": 8, "page_no": 6, "cluster": {"id": 8, "label": "list_item", "bbox": {"l": 138.97299, "t": 442.82574, "r": 474.59018, "b": 451.63269, "coord_origin": "TOPLEFT"}, "confidence": 0.9259927272796631, "cells": [{"id": 92, "text": "4.", "bbox": {"l": 138.97299, "t": 442.83572, "r": 146.71991, "b": 451.63269, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "First row rule", "bbox": {"l": 151.70099, "t": 442.82574, "r": 221.32263, "b": 451.63269, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": ": Only \"L\" cells and \"C\" cells are allowed in the first row.", "bbox": {"l": 221.32700000000003, "t": 442.83572, "r": 474.59018, "b": 451.63269, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4. First row rule : Only \"L\" cells and \"C\" cells are allowed in the first row."}, {"label": "list_item", "id": 5, "page_no": 6, "cluster": {"id": 5, "label": "list_item", "bbox": {"l": 138.97299, "t": 454.78375, "r": 480.58746, "b": 475.54568, "coord_origin": "TOPLEFT"}, "confidence": 0.9420599937438965, "cells": [{"id": 95, "text": "5.", "bbox": {"l": 138.97299, "t": 454.7937299999999, "r": 146.71991, "b": 463.5907, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "First column rule", "bbox": {"l": 151.70099, "t": 454.78375, "r": 240.71982, "b": 463.5907, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": ": Only \"U\" cells and \"C\" cells are allowed in the first", "bbox": {"l": 240.71599, "t": 454.7937299999999, "r": 480.58746, "b": 463.5907, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "column.", "bbox": {"l": 151.70099, "t": 466.74872, "r": 186.0072, "b": 475.54568, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5. First column rule : Only \"U\" cells and \"C\" cells are allowed in the first column."}, {"label": "list_item", "id": 1, "page_no": 6, "cluster": {"id": 1, "label": "list_item", "bbox": {"l": 138.97299, "t": 478.69675, "r": 480.59457, "b": 499.45969, "coord_origin": "TOPLEFT"}, "confidence": 0.9617829918861389, "cells": [{"id": 99, "text": "6.", "bbox": {"l": 138.97299, "t": 478.70673, "r": 146.71991, "b": 487.50369, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "Rectangular rule", "bbox": {"l": 151.70099, "t": 478.69675, "r": 235.15768, "b": 487.50369, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": ": The table representation is always rectangular - all rows", "bbox": {"l": 235.15697999999998, "t": 478.70673, "r": 480.59457, "b": 487.50369, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "must have an equal number of tokens, terminated with \"NL\" token.", "bbox": {"l": 151.70099, "t": 490.66272, "r": 448.04147, "b": 499.45969, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "6. Rectangular rule : The table representation is always rectangular - all rows must have an equal number of tokens, terminated with \"NL\" token."}, {"label": "text", "id": 0, "page_no": 6, "cluster": {"id": 0, "label": "text", "bbox": {"l": 134.76498, "t": 512.59271, "r": 480.59583, "b": 640.9416699999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9785562753677368, "cells": [{"id": 103, "text": "The application of these rules gives OTSL a set of unique properties. First", "bbox": {"l": 149.70898, "t": 512.59271, "r": 480.59583, "b": 521.38968, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "of all, the OTSL enforces a strictly rectangular structure representation, where", "bbox": {"l": 134.76498, "t": 524.5477000000001, "r": 480.59079, "b": 533.34467, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "every new-line token starts a new row. As a consequence, all rows and all columns", "bbox": {"l": 134.76498, "t": 536.5027, "r": 480.59482, "b": 545.29967, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "have exactly the same number of tokens, irrespective of cell spans. Secondly, the", "bbox": {"l": 134.76498, "t": 548.4586899999999, "r": 480.58865000000003, "b": 557.25566, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "OTSL representation is unambiguous: Every table structure is represented in one", "bbox": {"l": 134.76498, "t": 560.4137000000001, "r": 480.59365999999994, "b": 569.21066, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "way. In this representation every table cell corresponds to a \"C\"-cell token, which", "bbox": {"l": 134.76498, "t": 572.3687, "r": 480.58673, "b": 581.16566, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "in case of spans is always located in the top-left corner of the table cell definition.", "bbox": {"l": 134.76498, "t": 584.3237, "r": 480.59171, "b": 593.12067, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "Third, OTSL syntax rules are only backward-looking. As a consequence, every", "bbox": {"l": 134.76498, "t": 596.2787, "r": 480.59180000000003, "b": 605.07567, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "predicted token can be validated straight during sequence generation by looking", "bbox": {"l": 134.76498, "t": 608.2347, "r": 480.5936899999999, "b": 617.03166, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "at the previously predicted sequence. As such, OTSL can guarantee that every", "bbox": {"l": 134.76498, "t": 620.1897, "r": 480.59072999999995, "b": 628.98666, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "predicted sequence is syntactically valid.", "bbox": {"l": 134.76498, "t": 632.1447000000001, "r": 311.19769, "b": 640.9416699999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The application of these rules gives OTSL a set of unique properties. First of all, the OTSL enforces a strictly rectangular structure representation, where every new-line token starts a new row. As a consequence, all rows and all columns have exactly the same number of tokens, irrespective of cell spans. Secondly, the OTSL representation is unambiguous: Every table structure is represented in one way. In this representation every table cell corresponds to a \"C\"-cell token, which in case of spans is always located in the top-left corner of the table cell definition. Third, OTSL syntax rules are only backward-looking. As a consequence, every predicted token can be validated straight during sequence generation by looking at the previously predicted sequence. As such, OTSL can guarantee that every predicted sequence is syntactically valid."}, {"label": "text", "id": 2, "page_no": 6, "cluster": {"id": 2, "label": "text", "bbox": {"l": 134.76498, "t": 644.1026899999999, "r": 480.59265, "b": 664.8546699999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9590610861778259, "cells": [{"id": 114, "text": "These characteristics can be easily learned by sequence generator networks,", "bbox": {"l": 149.70898, "t": 644.1026899999999, "r": 480.59186, "b": 652.89966, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "as we demonstrate further below. We find strong indications that this pattern", "bbox": {"l": 134.76498, "t": 656.05769, "r": 480.59265, "b": 664.8546699999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "These characteristics can be easily learned by sequence generator networks, as we demonstrate further below. We find strong indications that this pattern"}], "body": [{"label": "caption", "id": 6, "page_no": 6, "cluster": {"id": 6, "label": "caption", "bbox": {"l": 134.765, "t": 125.79918999999984, "r": 480.5874, "b": 155.84966999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9333080053329468, "cells": [{"id": 2, "text": "Fig. 3.", "bbox": {"l": 134.765, "t": 125.79918999999984, "r": 162.64424, "b": 133.72551999999996, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "OTSL description of table structure: A - table example; B - graphical repre-", "bbox": {"l": 166.276, "t": 125.86200000000008, "r": 480.58675999999997, "b": 133.93169999999998, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "sentation of table structure; C - mapping structure on a grid; D - OTSL structure", "bbox": {"l": 134.765, "t": 136.82097999999996, "r": 480.5874, "b": 144.89068999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "encoding; E - explanation on cell encoding", "bbox": {"l": 134.765, "t": 147.77997000000005, "r": 306.1156, "b": 155.84966999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Fig. 3. OTSL description of table structure: A - table example; B - graphical representation of table structure; C - mapping structure on a grid; D - OTSL structure encoding; E - explanation on cell encoding"}, {"label": "picture", "id": 12, "page_no": 6, "cluster": {"id": 12, "label": "picture", "bbox": {"l": 164.65028381347656, "t": 163.79708862304688, "r": 449.5505676269531, "b": 280.3409423828125, "coord_origin": "TOPLEFT"}, "confidence": 0.7868534922599792, "cells": [{"id": 6, "text": "C", "bbox": {"l": 374.49326, "t": 168.59362999999996, "r": 381.66843, "b": 177.91540999999995, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "C", "bbox": {"l": 398.74011, "t": 168.50005999999996, "r": 405.91528, "b": 177.82183999999995, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "C", "bbox": {"l": 373.76862, "t": 192.92553999999996, "r": 380.94379, "b": 202.24730999999997, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "C", "bbox": {"l": 386.66388, "t": 193.07061999999996, "r": 393.83905, "b": 202.39239999999995, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "C", "bbox": {"l": 386.68707, "t": 205.13756999999998, "r": 393.86224, "b": 214.45934999999997, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "C", "bbox": {"l": 398.65729, "t": 180.73279000000002, "r": 405.83246, "b": 190.05457, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "C", "bbox": {"l": 410.77908, "t": 180.73859000000004, "r": 417.95425, "b": 190.06035999999995, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "C", "bbox": {"l": 422.90503, "t": 180.65247, "r": 430.08020000000005, "b": 189.97424, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "C", "bbox": {"l": 398.7807, "t": 192.98865, "r": 405.95587, "b": 202.31042000000002, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "C", "bbox": {"l": 410.90164, "t": 192.99487, "r": 418.07681, "b": 202.31664999999998, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "C", "bbox": {"l": 423.02753, "t": 192.909, "r": 430.2027, "b": 202.23077, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "C", "bbox": {"l": 398.78235, "t": 205.31573000000003, "r": 405.95752, "b": 214.63751000000002, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "C", "bbox": {"l": 410.90414, "t": 205.32196, "r": 418.07932, "b": 214.64373999999998, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "C", "bbox": {"l": 423.03003, "t": 205.23614999999995, "r": 430.20520000000005, "b": 214.55791999999997, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "C", "bbox": {"l": 386.50574, "t": 217.03882, "r": 393.68091, "b": 226.36059999999998, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "C", "bbox": {"l": 398.60181, "t": 217.21704, "r": 405.77698, "b": 226.53882, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "C", "bbox": {"l": 410.72275, "t": 217.22321, "r": 417.89792, "b": 226.54498, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "C", "bbox": {"l": 422.84869, "t": 217.13738999999998, "r": 430.02386, "b": 226.45916999999997, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "NL", "bbox": {"l": 435.16009999999994, "t": 167.69011999999998, "r": 447.86273, "b": 177.01189999999997, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "NL", "bbox": {"l": 435.44415, "t": 180.20025999999996, "r": 448.14679, "b": 189.52202999999997, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "NL", "bbox": {"l": 435.46735, "t": 192.49474999999995, "r": 448.16998000000007, "b": 201.81652999999994, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "NL", "bbox": {"l": 435.38202, "t": 204.83025999999995, "r": 448.08466, "b": 214.15204000000006, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "NL", "bbox": {"l": 435.59906, "t": 217.2337, "r": 448.3017, "b": 226.55548, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "U", "bbox": {"l": 374.14957, "t": 205.23492, "r": 381.32474, "b": 214.55669999999998, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "U", "bbox": {"l": 374.0419, "t": 217.14648, "r": 381.21707, "b": 226.46826, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "U", "bbox": {"l": 374.34418, "t": 180.93488000000002, "r": 381.51935, "b": 190.25665000000004, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "L", "bbox": {"l": 387.76285, "t": 168.57788000000005, "r": 393.28833, "b": 177.89966000000004, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "L", "bbox": {"l": 411.86395, "t": 168.06195000000002, "r": 417.38943, "b": 177.38373, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "L", "bbox": {"l": 423.33563, "t": 167.93439, "r": 428.86111, "b": 177.25616000000002, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "X", "bbox": {"l": 387.13593, "t": 180.78576999999996, "r": 393.76453, "b": 190.10753999999997, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "C", "bbox": {"l": 282.2594, "t": 244.50878999999998, "r": 289.43457, "b": 253.83056999999997, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "U", "bbox": {"l": 282.11035, "t": 256.85022000000004, "r": 289.28552, "b": 266.172, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "U", "bbox": {"l": 282.40848, "t": 269.13300000000004, "r": 289.58365, "b": 278.45477000000005, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "L", "bbox": {"l": 295.52902, "t": 244.49347, "r": 301.0545, "b": 253.81525, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "L", "bbox": {"l": 307.46613, "t": 244.57372999999995, "r": 312.99161, "b": 253.89550999999994, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "L", "bbox": {"l": 318.76886, "t": 244.44037000000003, "r": 324.29434, "b": 253.76215000000002, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "X", "bbox": {"l": 294.9021, "t": 256.70154, "r": 301.03976, "b": 266.02332, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "X X", "bbox": {"l": 307.17743, "t": 256.70154, "r": 325.59039, "b": 266.02332, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "X", "bbox": {"l": 294.78949, "t": 269.25420999999994, "r": 300.92715, "b": 278.57599000000005, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "X X", "bbox": {"l": 307.06482, "t": 269.25420999999994, "r": 325.47778, "b": 278.57599000000005, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "C", "bbox": {"l": 195.93939, "t": 268.74798999999996, "r": 203.11456, "b": 278.06976, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "L", "bbox": {"l": 209.20891, "t": 268.73267, "r": 214.73439, "b": 278.05444, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "L", "bbox": {"l": 221.14551, "t": 268.81293000000005, "r": 226.67099, "b": 278.13469999999995, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "L", "bbox": {"l": 232.44858, "t": 268.67957, "r": 237.97405999999998, "b": 278.00134, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "C", "bbox": {"l": 196.21715, "t": 244.53961000000004, "r": 203.39232, "b": 253.86139000000003, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "C", "bbox": {"l": 250.32143, "t": 244.09813999999994, "r": 257.49661, "b": 253.41992000000005, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "U", "bbox": {"l": 250.17235999999997, "t": 256.43951000000004, "r": 257.34753, "b": 265.76129000000003, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "U", "bbox": {"l": 250.47049000000004, "t": 268.72222999999997, "r": 257.64566, "b": 278.04400999999996, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "1", "bbox": {"l": 334.51135, "t": 242.99463000000003, "r": 337.22485, "b": 249.20911, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "- simple cells: \"C\"", "bbox": {"l": 339.93835, "t": 242.99463000000003, "r": 391.49472, "b": 249.20911, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "2", "bbox": {"l": 334.51135, "t": 252.93255999999997, "r": 337.33313, "b": 259.14703, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "- horizontal merges: \"C\", \"L\"", "bbox": {"l": 340.15491, "t": 252.93255999999997, "r": 421.98624, "b": 259.14703, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "3", "bbox": {"l": 334.51135, "t": 262.87048000000004, "r": 337.29868, "b": 269.08496, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "- vertical merges: \"C\", \"U\"", "bbox": {"l": 340.086, "t": 262.87048000000004, "r": 415.34375, "b": 269.08496, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "4", "bbox": {"l": 334.51135, "t": 272.80841, "r": 337.30188, "b": 279.02288999999996, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "- 2d merges: \"C\", \"L\", \"U\", \"X\"", "bbox": {"l": 340.09241, "t": 272.80841, "r": 426.59875, "b": 279.02288999999996, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "1", "bbox": {"l": 185.67178, "t": 244.04224, "r": 189.35544, "b": 250.25671, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "2", "bbox": {"l": 185.96759, "t": 268.34766, "r": 189.65125, "b": 274.56213, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "3", "bbox": {"l": 239.34152, "t": 243.62523999999996, "r": 243.02518, "b": 249.83972000000006, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "4", "bbox": {"l": 271.32852, "t": 243.49390000000005, "r": 275.01218, "b": 249.70836999999995, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "2", "bbox": {"l": 229.81627, "t": 166.51495, "r": 233.49992000000003, "b": 172.72942999999998, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "1", "bbox": {"l": 257.24402, "t": 189.961, "r": 260.92767, "b": 196.17548, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "3", "bbox": {"l": 186.87526, "t": 177.97668, "r": 190.55891, "b": 184.19115999999997, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "4", "bbox": {"l": 196.48746, "t": 169.01520000000005, "r": 200.17111, "b": 175.22968000000003, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "A", "bbox": {"l": 169.74728, "t": 167.88225999999997, "r": 175.72659, "b": 175.65039000000002, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "B", "bbox": {"l": 169.74728, "t": 206.83867999999995, "r": 175.72659, "b": 214.60681, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "C", "bbox": {"l": 274.29419, "t": 168.27972, "r": 280.2735, "b": 176.04785000000004, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "D", "bbox": {"l": 359.56152, "t": 168.27972, "r": 365.54083, "b": 176.04785000000004, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "E", "bbox": {"l": 169.74728, "t": 243.21149000000003, "r": 175.27112, "b": 250.97960999999998, "coord_origin": "TOPLEFT"}}], "children": [{"id": 19, "label": "text", "bbox": {"l": 374.49326, "t": 168.59362999999996, "r": 381.66843, "b": 177.91540999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": "C", "bbox": {"l": 374.49326, "t": 168.59362999999996, "r": 381.66843, "b": 177.91540999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 398.74011, "t": 168.50005999999996, "r": 405.91528, "b": 177.82183999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "C", "bbox": {"l": 398.74011, "t": 168.50005999999996, "r": 405.91528, "b": 177.82183999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 373.76862, "t": 192.92553999999996, "r": 380.94379, "b": 202.24730999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "C", "bbox": {"l": 373.76862, "t": 192.92553999999996, "r": 380.94379, "b": 202.24730999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 386.66388, "t": 193.07061999999996, "r": 393.83905, "b": 202.39239999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "C", "bbox": {"l": 386.66388, "t": 193.07061999999996, "r": 393.83905, "b": 202.39239999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 386.68707, "t": 205.13756999999998, "r": 393.86224, "b": 214.45934999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "C", "bbox": {"l": 386.68707, "t": 205.13756999999998, "r": 393.86224, "b": 214.45934999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 398.65729, "t": 180.73279000000002, "r": 405.83246, "b": 190.05457, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "C", "bbox": {"l": 398.65729, "t": 180.73279000000002, "r": 405.83246, "b": 190.05457, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 410.77908, "t": 180.73859000000004, "r": 417.95425, "b": 190.06035999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "C", "bbox": {"l": 410.77908, "t": 180.73859000000004, "r": 417.95425, "b": 190.06035999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 422.90503, "t": 180.65247, "r": 430.08020000000005, "b": 189.97424, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "C", "bbox": {"l": 422.90503, "t": 180.65247, "r": 430.08020000000005, "b": 189.97424, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 398.7807, "t": 192.98865, "r": 405.95587, "b": 202.31042000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "C", "bbox": {"l": 398.7807, "t": 192.98865, "r": 405.95587, "b": 202.31042000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 410.90164, "t": 192.99487, "r": 418.07681, "b": 202.31664999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "C", "bbox": {"l": 410.90164, "t": 192.99487, "r": 418.07681, "b": 202.31664999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 423.02753, "t": 192.909, "r": 430.2027, "b": 202.23077, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "C", "bbox": {"l": 423.02753, "t": 192.909, "r": 430.2027, "b": 202.23077, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 398.78235, "t": 205.31573000000003, "r": 405.95752, "b": 214.63751000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "C", "bbox": {"l": 398.78235, "t": 205.31573000000003, "r": 405.95752, "b": 214.63751000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 410.90414, "t": 205.32196, "r": 418.07932, "b": 214.64373999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "C", "bbox": {"l": 410.90414, "t": 205.32196, "r": 418.07932, "b": 214.64373999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 423.03003, "t": 205.23614999999995, "r": 430.20520000000005, "b": 214.55791999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "C", "bbox": {"l": 423.03003, "t": 205.23614999999995, "r": 430.20520000000005, "b": 214.55791999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 386.50574, "t": 217.03882, "r": 393.68091, "b": 226.36059999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "C", "bbox": {"l": 386.50574, "t": 217.03882, "r": 393.68091, "b": 226.36059999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 398.60181, "t": 217.21704, "r": 405.77698, "b": 226.53882, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "C", "bbox": {"l": 398.60181, "t": 217.21704, "r": 405.77698, "b": 226.53882, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 410.72275, "t": 217.22321, "r": 417.89792, "b": 226.54498, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "C", "bbox": {"l": 410.72275, "t": 217.22321, "r": 417.89792, "b": 226.54498, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 422.84869, "t": 217.13738999999998, "r": 430.02386, "b": 226.45916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "C", "bbox": {"l": 422.84869, "t": 217.13738999999998, "r": 430.02386, "b": 226.45916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 435.16009999999994, "t": 167.69011999999998, "r": 447.86273, "b": 177.01189999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "NL", "bbox": {"l": 435.16009999999994, "t": 167.69011999999998, "r": 447.86273, "b": 177.01189999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 435.44415, "t": 180.20025999999996, "r": 448.14679, "b": 189.52202999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "NL", "bbox": {"l": 435.44415, "t": 180.20025999999996, "r": 448.14679, "b": 189.52202999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 435.46735, "t": 192.49474999999995, "r": 448.16998000000007, "b": 201.81652999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "NL", "bbox": {"l": 435.46735, "t": 192.49474999999995, "r": 448.16998000000007, "b": 201.81652999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 435.38202, "t": 204.83025999999995, "r": 448.08466, "b": 214.15204000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "NL", "bbox": {"l": 435.38202, "t": 204.83025999999995, "r": 448.08466, "b": 214.15204000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 435.59906, "t": 217.2337, "r": 448.3017, "b": 226.55548, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "NL", "bbox": {"l": 435.59906, "t": 217.2337, "r": 448.3017, "b": 226.55548, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 374.14957, "t": 205.23492, "r": 381.32474, "b": 214.55669999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "U", "bbox": {"l": 374.14957, "t": 205.23492, "r": 381.32474, "b": 214.55669999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 374.0419, "t": 217.14648, "r": 381.21707, "b": 226.46826, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "U", "bbox": {"l": 374.0419, "t": 217.14648, "r": 381.21707, "b": 226.46826, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 374.34418, "t": 180.93488000000002, "r": 381.51935, "b": 190.25665000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "U", "bbox": {"l": 374.34418, "t": 180.93488000000002, "r": 381.51935, "b": 190.25665000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 387.76285, "t": 168.57788000000005, "r": 393.28833, "b": 177.89966000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "L", "bbox": {"l": 387.76285, "t": 168.57788000000005, "r": 393.28833, "b": 177.89966000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 411.86395, "t": 168.06195000000002, "r": 417.38943, "b": 177.38373, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "L", "bbox": {"l": 411.86395, "t": 168.06195000000002, "r": 417.38943, "b": 177.38373, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 423.33563, "t": 167.93439, "r": 428.86111, "b": 177.25616000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "L", "bbox": {"l": 423.33563, "t": 167.93439, "r": 428.86111, "b": 177.25616000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 387.13593, "t": 180.78576999999996, "r": 393.76453, "b": 190.10753999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "X", "bbox": {"l": 387.13593, "t": 180.78576999999996, "r": 393.76453, "b": 190.10753999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 282.2594, "t": 244.50878999999998, "r": 289.43457, "b": 253.83056999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "C", "bbox": {"l": 282.2594, "t": 244.50878999999998, "r": 289.43457, "b": 253.83056999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 282.11035, "t": 256.85022000000004, "r": 289.28552, "b": 266.172, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "U", "bbox": {"l": 282.11035, "t": 256.85022000000004, "r": 289.28552, "b": 266.172, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 282.40848, "t": 269.13300000000004, "r": 289.58365, "b": 278.45477000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "U", "bbox": {"l": 282.40848, "t": 269.13300000000004, "r": 289.58365, "b": 278.45477000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 295.52902, "t": 244.49347, "r": 301.0545, "b": 253.81525, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "L", "bbox": {"l": 295.52902, "t": 244.49347, "r": 301.0545, "b": 253.81525, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 307.46613, "t": 244.57372999999995, "r": 312.99161, "b": 253.89550999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "L", "bbox": {"l": 307.46613, "t": 244.57372999999995, "r": 312.99161, "b": 253.89550999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 318.76886, "t": 244.44037000000003, "r": 324.29434, "b": 253.76215000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "L", "bbox": {"l": 318.76886, "t": 244.44037000000003, "r": 324.29434, "b": 253.76215000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 294.9021, "t": 256.70154, "r": 301.03976, "b": 266.02332, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "X", "bbox": {"l": 294.9021, "t": 256.70154, "r": 301.03976, "b": 266.02332, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 307.17743, "t": 256.70154, "r": 325.59039, "b": 266.02332, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "X X", "bbox": {"l": 307.17743, "t": 256.70154, "r": 325.59039, "b": 266.02332, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 294.78949, "t": 269.25420999999994, "r": 300.92715, "b": 278.57599000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "X", "bbox": {"l": 294.78949, "t": 269.25420999999994, "r": 300.92715, "b": 278.57599000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 307.06482, "t": 269.25420999999994, "r": 325.47778, "b": 278.57599000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "X X", "bbox": {"l": 307.06482, "t": 269.25420999999994, "r": 325.47778, "b": 278.57599000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 195.93939, "t": 268.74798999999996, "r": 203.11456, "b": 278.06976, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "C", "bbox": {"l": 195.93939, "t": 268.74798999999996, "r": 203.11456, "b": 278.06976, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 209.20891, "t": 268.73267, "r": 214.73439, "b": 278.05444, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "L", "bbox": {"l": 209.20891, "t": 268.73267, "r": 214.73439, "b": 278.05444, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 221.14551, "t": 268.81293000000005, "r": 226.67099, "b": 278.13469999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "L", "bbox": {"l": 221.14551, "t": 268.81293000000005, "r": 226.67099, "b": 278.13469999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 232.44858, "t": 268.67957, "r": 237.97405999999998, "b": 278.00134, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "L", "bbox": {"l": 232.44858, "t": 268.67957, "r": 237.97405999999998, "b": 278.00134, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 196.21715, "t": 244.53961000000004, "r": 203.39232, "b": 253.86139000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "C", "bbox": {"l": 196.21715, "t": 244.53961000000004, "r": 203.39232, "b": 253.86139000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 250.32143, "t": 244.09813999999994, "r": 257.49661, "b": 253.41992000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "C", "bbox": {"l": 250.32143, "t": 244.09813999999994, "r": 257.49661, "b": 253.41992000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 250.17235999999997, "t": 256.43951000000004, "r": 257.34753, "b": 265.76129000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "U", "bbox": {"l": 250.17235999999997, "t": 256.43951000000004, "r": 257.34753, "b": 265.76129000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 250.47049000000004, "t": 268.72222999999997, "r": 257.64566, "b": 278.04400999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "U", "bbox": {"l": 250.47049000000004, "t": 268.72222999999997, "r": 257.64566, "b": 278.04400999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 334.51135, "t": 242.99463000000003, "r": 337.22485, "b": 249.20911, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "1", "bbox": {"l": 334.51135, "t": 242.99463000000003, "r": 337.22485, "b": 249.20911, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 339.93835, "t": 242.99463000000003, "r": 391.49472, "b": 249.20911, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "- simple cells: \"C\"", "bbox": {"l": 339.93835, "t": 242.99463000000003, "r": 391.49472, "b": 249.20911, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 334.51135, "t": 252.93255999999997, "r": 337.33313, "b": 259.14703, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "2", "bbox": {"l": 334.51135, "t": 252.93255999999997, "r": 337.33313, "b": 259.14703, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 340.15491, "t": 252.93255999999997, "r": 421.98624, "b": 259.14703, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "- horizontal merges: \"C\", \"L\"", "bbox": {"l": 340.15491, "t": 252.93255999999997, "r": 421.98624, "b": 259.14703, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 334.51135, "t": 262.87048000000004, "r": 337.29868, "b": 269.08496, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "3", "bbox": {"l": 334.51135, "t": 262.87048000000004, "r": 337.29868, "b": 269.08496, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 340.086, "t": 262.87048000000004, "r": 415.34375, "b": 269.08496, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "- vertical merges: \"C\", \"U\"", "bbox": {"l": 340.086, "t": 262.87048000000004, "r": 415.34375, "b": 269.08496, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "list_item", "bbox": {"l": 334.51135, "t": 272.80841, "r": 426.59875, "b": 279.02288999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.5250625610351562, "cells": [{"id": 60, "text": "4", "bbox": {"l": 334.51135, "t": 272.80841, "r": 337.30188, "b": 279.02288999999996, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "- 2d merges: \"C\", \"L\", \"U\", \"X\"", "bbox": {"l": 340.09241, "t": 272.80841, "r": 426.59875, "b": 279.02288999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 185.67178, "t": 244.04224, "r": 189.35544, "b": 250.25671, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "1", "bbox": {"l": 185.67178, "t": 244.04224, "r": 189.35544, "b": 250.25671, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 185.96759, "t": 268.34766, "r": 189.65125, "b": 274.56213, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "2", "bbox": {"l": 185.96759, "t": 268.34766, "r": 189.65125, "b": 274.56213, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 239.34152, "t": 243.62523999999996, "r": 243.02518, "b": 249.83972000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "3", "bbox": {"l": 239.34152, "t": 243.62523999999996, "r": 243.02518, "b": 249.83972000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 271.32852, "t": 243.49390000000005, "r": 275.01218, "b": 249.70836999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "4", "bbox": {"l": 271.32852, "t": 243.49390000000005, "r": 275.01218, "b": 249.70836999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 229.81627, "t": 166.51495, "r": 233.49992000000003, "b": 172.72942999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "2", "bbox": {"l": 229.81627, "t": 166.51495, "r": 233.49992000000003, "b": 172.72942999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 257.24402, "t": 189.961, "r": 260.92767, "b": 196.17548, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "1", "bbox": {"l": 257.24402, "t": 189.961, "r": 260.92767, "b": 196.17548, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 186.87526, "t": 177.97668, "r": 190.55891, "b": 184.19115999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "3", "bbox": {"l": 186.87526, "t": 177.97668, "r": 190.55891, "b": 184.19115999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 196.48746, "t": 169.01520000000005, "r": 200.17111, "b": 175.22968000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "4", "bbox": {"l": 196.48746, "t": 169.01520000000005, "r": 200.17111, "b": 175.22968000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 169.74728, "t": 167.88225999999997, "r": 175.72659, "b": 175.65039000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "A", "bbox": {"l": 169.74728, "t": 167.88225999999997, "r": 175.72659, "b": 175.65039000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 169.74728, "t": 206.83867999999995, "r": 175.72659, "b": 214.60681, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "B", "bbox": {"l": 169.74728, "t": 206.83867999999995, "r": 175.72659, "b": 214.60681, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 274.29419, "t": 168.27972, "r": 280.2735, "b": 176.04785000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "C", "bbox": {"l": 274.29419, "t": 168.27972, "r": 280.2735, "b": 176.04785000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 359.56152, "t": 168.27972, "r": 365.54083, "b": 176.04785000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "D", "bbox": {"l": 359.56152, "t": 168.27972, "r": 365.54083, "b": 176.04785000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 169.74728, "t": 243.21149000000003, "r": 175.27112, "b": 250.97960999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "E", "bbox": {"l": 169.74728, "t": 243.21149000000003, "r": 175.27112, "b": 250.97960999999998, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "section_header", "id": 9, "page_no": 6, "cluster": {"id": 9, "label": "section_header", "bbox": {"l": 134.765, "t": 305.29581, "r": 246.65197999999998, "b": 314.10275, "coord_origin": "TOPLEFT"}, "confidence": 0.9233023524284363, "cells": [{"id": 75, "text": "4.2", "bbox": {"l": 134.765, "t": 305.29581, "r": 149.40205, "b": 314.10275, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "Language Syntax", "bbox": {"l": 160.85904, "t": 305.29581, "r": 246.65197999999998, "b": 314.10275, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4.2 Language Syntax"}, {"label": "text", "id": 10, "page_no": 6, "cluster": {"id": 10, "label": "text", "bbox": {"l": 134.765, "t": 325.24777, "r": 363.79617, "b": 334.04474, "coord_origin": "TOPLEFT"}, "confidence": 0.9169168472290039, "cells": [{"id": 77, "text": "The OTSL representation follows these syntax rules:", "bbox": {"l": 134.765, "t": 325.24777, "r": 363.79617, "b": 334.04474, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The OTSL representation follows these syntax rules:"}, {"label": "list_item", "id": 3, "page_no": 6, "cluster": {"id": 3, "label": "list_item", "bbox": {"l": 138.97299, "t": 347.17081, "r": 480.58902, "b": 367.93375, "coord_origin": "TOPLEFT"}, "confidence": 0.9588112235069275, "cells": [{"id": 78, "text": "1.", "bbox": {"l": 138.97299, "t": 347.18079, "r": 146.71991, "b": 355.97775, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "Left-looking cell rule", "bbox": {"l": 151.70099, "t": 347.17081, "r": 257.37927, "b": 355.97775, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": ": The left neighbour of an \"L\" cell must be either", "bbox": {"l": 257.383, "t": 347.18079, "r": 480.58902, "b": 355.97775, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "another \"L\" cell or a \"C\" cell.", "bbox": {"l": 151.70099, "t": 359.13678, "r": 283.59387, "b": 367.93375, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1. Left-looking cell rule : The left neighbour of an \"L\" cell must be either another \"L\" cell or a \"C\" cell."}, {"label": "list_item", "id": 4, "page_no": 6, "cluster": {"id": 4, "label": "list_item", "bbox": {"l": 138.97299, "t": 371.08481, "r": 480.59229000000005, "b": 391.84673999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9585386514663696, "cells": [{"id": 82, "text": "2.", "bbox": {"l": 138.97299, "t": 371.09479, "r": 146.71991, "b": 379.89175, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "Up-looking cell rule", "bbox": {"l": 151.70099, "t": 371.08481, "r": 252.11203, "b": 379.89175, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": ": The upper neighbour of a \"U\" cell must be either", "bbox": {"l": 252.112, "t": 371.09479, "r": 480.59229000000005, "b": 379.89175, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "another \"U\" cell or a \"C\" cell.", "bbox": {"l": 151.70099, "t": 383.04977, "r": 284.8392, "b": 391.84673999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2. Up-looking cell rule : The upper neighbour of a \"U\" cell must be either another \"U\" cell or a \"C\" cell."}, {"label": "section_header", "id": 14, "page_no": 6, "cluster": {"id": 14, "label": "section_header", "bbox": {"l": 138.97299, "t": 394.99780000000004, "r": 226.07360999999997, "b": 403.80475, "coord_origin": "TOPLEFT"}, "confidence": 0.6506174206733704, "cells": [{"id": 86, "text": "3.", "bbox": {"l": 138.97299, "t": 395.0077800000001, "r": 146.71991, "b": 403.80475, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Cross cell rule", "bbox": {"l": 151.70099, "t": 394.99780000000004, "r": 223.3042, "b": 403.80475, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": ":", "bbox": {"l": 223.30699, "t": 395.0077800000001, "r": 226.07360999999997, "b": 403.80475, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3. Cross cell rule :"}, {"label": "list_item", "id": 13, "page_no": 6, "cluster": {"id": 13, "label": "list_item", "bbox": {"l": 151.70099, "t": 406.96677, "r": 480.59238, "b": 439.67371, "coord_origin": "TOPLEFT"}, "confidence": 0.7247239947319031, "cells": [{"id": 89, "text": "The left neighbour of an \"X\" cell must be either another \"X\" cell or a \"U\"", "bbox": {"l": 151.70099, "t": 406.96677, "r": 480.59238, "b": 415.76373, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "cell, and the upper neighbour of an \"X\" cell must be either another \"X\" cell", "bbox": {"l": 151.70099, "t": 418.9217499999999, "r": 480.59219, "b": 427.71871999999996, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "or an \"L\" cell.", "bbox": {"l": 151.70099, "t": 430.87674, "r": 214.39663999999996, "b": 439.67371, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The left neighbour of an \"X\" cell must be either another \"X\" cell or a \"U\" cell, and the upper neighbour of an \"X\" cell must be either another \"X\" cell or an \"L\" cell."}, {"label": "list_item", "id": 8, "page_no": 6, "cluster": {"id": 8, "label": "list_item", "bbox": {"l": 138.97299, "t": 442.82574, "r": 474.59018, "b": 451.63269, "coord_origin": "TOPLEFT"}, "confidence": 0.9259927272796631, "cells": [{"id": 92, "text": "4.", "bbox": {"l": 138.97299, "t": 442.83572, "r": 146.71991, "b": 451.63269, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "First row rule", "bbox": {"l": 151.70099, "t": 442.82574, "r": 221.32263, "b": 451.63269, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": ": Only \"L\" cells and \"C\" cells are allowed in the first row.", "bbox": {"l": 221.32700000000003, "t": 442.83572, "r": 474.59018, "b": 451.63269, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4. First row rule : Only \"L\" cells and \"C\" cells are allowed in the first row."}, {"label": "list_item", "id": 5, "page_no": 6, "cluster": {"id": 5, "label": "list_item", "bbox": {"l": 138.97299, "t": 454.78375, "r": 480.58746, "b": 475.54568, "coord_origin": "TOPLEFT"}, "confidence": 0.9420599937438965, "cells": [{"id": 95, "text": "5.", "bbox": {"l": 138.97299, "t": 454.7937299999999, "r": 146.71991, "b": 463.5907, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "First column rule", "bbox": {"l": 151.70099, "t": 454.78375, "r": 240.71982, "b": 463.5907, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": ": Only \"U\" cells and \"C\" cells are allowed in the first", "bbox": {"l": 240.71599, "t": 454.7937299999999, "r": 480.58746, "b": 463.5907, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "column.", "bbox": {"l": 151.70099, "t": 466.74872, "r": 186.0072, "b": 475.54568, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5. First column rule : Only \"U\" cells and \"C\" cells are allowed in the first column."}, {"label": "list_item", "id": 1, "page_no": 6, "cluster": {"id": 1, "label": "list_item", "bbox": {"l": 138.97299, "t": 478.69675, "r": 480.59457, "b": 499.45969, "coord_origin": "TOPLEFT"}, "confidence": 0.9617829918861389, "cells": [{"id": 99, "text": "6.", "bbox": {"l": 138.97299, "t": 478.70673, "r": 146.71991, "b": 487.50369, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "Rectangular rule", "bbox": {"l": 151.70099, "t": 478.69675, "r": 235.15768, "b": 487.50369, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": ": The table representation is always rectangular - all rows", "bbox": {"l": 235.15697999999998, "t": 478.70673, "r": 480.59457, "b": 487.50369, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "must have an equal number of tokens, terminated with \"NL\" token.", "bbox": {"l": 151.70099, "t": 490.66272, "r": 448.04147, "b": 499.45969, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "6. Rectangular rule : The table representation is always rectangular - all rows must have an equal number of tokens, terminated with \"NL\" token."}, {"label": "text", "id": 0, "page_no": 6, "cluster": {"id": 0, "label": "text", "bbox": {"l": 134.76498, "t": 512.59271, "r": 480.59583, "b": 640.9416699999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9785562753677368, "cells": [{"id": 103, "text": "The application of these rules gives OTSL a set of unique properties. First", "bbox": {"l": 149.70898, "t": 512.59271, "r": 480.59583, "b": 521.38968, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "of all, the OTSL enforces a strictly rectangular structure representation, where", "bbox": {"l": 134.76498, "t": 524.5477000000001, "r": 480.59079, "b": 533.34467, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "every new-line token starts a new row. As a consequence, all rows and all columns", "bbox": {"l": 134.76498, "t": 536.5027, "r": 480.59482, "b": 545.29967, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "have exactly the same number of tokens, irrespective of cell spans. Secondly, the", "bbox": {"l": 134.76498, "t": 548.4586899999999, "r": 480.58865000000003, "b": 557.25566, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "OTSL representation is unambiguous: Every table structure is represented in one", "bbox": {"l": 134.76498, "t": 560.4137000000001, "r": 480.59365999999994, "b": 569.21066, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "way. In this representation every table cell corresponds to a \"C\"-cell token, which", "bbox": {"l": 134.76498, "t": 572.3687, "r": 480.58673, "b": 581.16566, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "in case of spans is always located in the top-left corner of the table cell definition.", "bbox": {"l": 134.76498, "t": 584.3237, "r": 480.59171, "b": 593.12067, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "Third, OTSL syntax rules are only backward-looking. As a consequence, every", "bbox": {"l": 134.76498, "t": 596.2787, "r": 480.59180000000003, "b": 605.07567, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "predicted token can be validated straight during sequence generation by looking", "bbox": {"l": 134.76498, "t": 608.2347, "r": 480.5936899999999, "b": 617.03166, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "at the previously predicted sequence. As such, OTSL can guarantee that every", "bbox": {"l": 134.76498, "t": 620.1897, "r": 480.59072999999995, "b": 628.98666, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "predicted sequence is syntactically valid.", "bbox": {"l": 134.76498, "t": 632.1447000000001, "r": 311.19769, "b": 640.9416699999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The application of these rules gives OTSL a set of unique properties. First of all, the OTSL enforces a strictly rectangular structure representation, where every new-line token starts a new row. As a consequence, all rows and all columns have exactly the same number of tokens, irrespective of cell spans. Secondly, the OTSL representation is unambiguous: Every table structure is represented in one way. In this representation every table cell corresponds to a \"C\"-cell token, which in case of spans is always located in the top-left corner of the table cell definition. Third, OTSL syntax rules are only backward-looking. As a consequence, every predicted token can be validated straight during sequence generation by looking at the previously predicted sequence. As such, OTSL can guarantee that every predicted sequence is syntactically valid."}, {"label": "text", "id": 2, "page_no": 6, "cluster": {"id": 2, "label": "text", "bbox": {"l": 134.76498, "t": 644.1026899999999, "r": 480.59265, "b": 664.8546699999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9590610861778259, "cells": [{"id": 114, "text": "These characteristics can be easily learned by sequence generator networks,", "bbox": {"l": 149.70898, "t": 644.1026899999999, "r": 480.59186, "b": 652.89966, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "as we demonstrate further below. We find strong indications that this pattern", "bbox": {"l": 134.76498, "t": 656.05769, "r": 480.59265, "b": 664.8546699999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "These characteristics can be easily learned by sequence generator networks, as we demonstrate further below. We find strong indications that this pattern"}], "headers": [{"label": "page_header", "id": 7, "page_no": 6, "cluster": {"id": 7, "label": "page_header", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.932651162147522, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Optimized Table Tokenization for Table Structure Recognition"}, {"label": "page_header", "id": 11, "page_no": 6, "cluster": {"id": 11, "label": "page_header", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8749732375144958, "cells": [{"id": 1, "text": "7", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "7"}]}}, {"page_no": 7, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "8", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "M.", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 178.07675, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37415, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "reduces significantly the column drift seen in the HTML based models (see Fig-", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.58884000000006, "b": 127.73077, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "ure 5).", "bbox": {"l": 134.765, "t": 130.88878999999997, "r": 163.56389, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "4.3", "bbox": {"l": 134.765, "t": 161.55682000000002, "r": 149.40205, "b": 170.36377000000005, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Error-detection and -mitigation", "bbox": {"l": 160.85904, "t": 161.55682000000002, "r": 319.34708, "b": 170.36377000000005, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "The design of OTSL allows to validate a table structure easily on an unfinished", "bbox": {"l": 134.765, "t": 182.28179999999998, "r": 480.59572999999995, "b": 191.0788, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "sequence. The detection of an invalid sequence token is a clear indication of a", "bbox": {"l": 134.765, "t": 194.23779000000002, "r": 480.59473, "b": 203.03479000000004, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "prediction mistake, however a valid sequence by itself does not guarantee pre-", "bbox": {"l": 134.765, "t": 206.19281, "r": 480.58678999999995, "b": 214.98981000000003, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "diction correctness. Different heuristics can be used to correct token errors in", "bbox": {"l": 134.765, "t": 218.14783, "r": 480.59177000000005, "b": 226.94482000000005, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "an invalid sequence and thus increase the chances for accurate predictions. Such", "bbox": {"l": 134.765, "t": 230.10284000000001, "r": 480.58768, "b": 238.89984000000004, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "heuristics can be applied either after the prediction of each token, or at the end", "bbox": {"l": 134.765, "t": 242.05786, "r": 480.5867, "b": 250.85486000000003, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "on the entire predicted sequence. For example a simple heuristic which can cor-", "bbox": {"l": 134.765, "t": 254.01288, "r": 480.5938100000001, "b": 262.80988, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "rect the predicted OTSL sequence on-the-fly is to verify if the token with the", "bbox": {"l": 134.765, "t": 265.96887000000004, "r": 480.59069999999997, "b": 274.76586999999995, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "highest prediction confidence invalidates the predicted sequence, and replace it", "bbox": {"l": 134.765, "t": 277.92389000000003, "r": 480.5957599999999, "b": 286.72086, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "by the token with the next highest confidence until OTSL rules are satisfied.", "bbox": {"l": 134.765, "t": 289.8788799999999, "r": 469.40369, "b": 298.67584, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "5", "bbox": {"l": 134.765, "t": 321.164, "r": 141.4886, "b": 331.73239000000007, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Experiments", "bbox": {"l": 154.9382, "t": 321.164, "r": 229.03534, "b": 331.73239000000007, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "To evaluate the impact of OTSL on prediction accuracy and inference times, we", "bbox": {"l": 134.765, "t": 347.24985, "r": 480.59375, "b": 356.04681, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "conducted a series of experiments based on the TableFormer model (Figure 4)", "bbox": {"l": 134.765, "t": 359.2048300000001, "r": 480.59476, "b": 368.0018, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "with two objectives: Firstly we evaluate the prediction quality and performance", "bbox": {"l": 134.765, "t": 371.15982, "r": 480.58786000000003, "b": 379.95679, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "of OTSL vs. HTML after performing Hyper Parameter Optimization (HPO) on", "bbox": {"l": 134.765, "t": 383.11481000000003, "r": 480.58777, "b": 391.91177, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "the", "bbox": {"l": 134.765, "t": 395.06978999999995, "r": 148.59807, "b": 403.86676, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "canonical", "bbox": {"l": 151.627, "t": 395.06978999999995, "r": 191.84703, "b": 403.86676, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "PubTabNet data set. Secondly we pick the best hyper-parameters", "bbox": {"l": 195.90201, "t": 395.06978999999995, "r": 480.59528, "b": 403.86676, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "found in the first step and evaluate how OTSL impacts the performance of", "bbox": {"l": 134.76501, "t": 407.02478, "r": 480.59283000000005, "b": 415.82175, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "TableFormer after training on other publicly available data sets (FinTabNet,", "bbox": {"l": 134.76501, "t": 418.98077, "r": 480.59476, "b": 427.77774, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "PubTables-1M [14]). The ground truth (GT) from all data sets has been con-", "bbox": {"l": 134.76501, "t": 430.93576, "r": 480.59171, "b": 439.73273, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "verted into OTSL format for this purpose, and will be made publicly available.", "bbox": {"l": 134.76501, "t": 442.8907500000001, "r": 479.30258, "b": 451.6877099999999, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Fig. 4.", "bbox": {"l": 134.76501, "t": 484.64813, "r": 162.64424, "b": 492.57443, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Architecture sketch of the TableFormer model, which is a representative for the", "bbox": {"l": 165.19601, "t": 484.71091, "r": 480.59082, "b": 492.78067, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Im2Seq approach.", "bbox": {"l": 134.76501, "t": 495.66989, "r": 206.70245, "b": 503.73965, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "1.", "bbox": {"l": 147.30025, "t": 540.73164, "r": 149.70605, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Item", "bbox": {"l": 150.90895, "t": 540.73164, "r": 155.72055, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "Amount", "bbox": {"l": 162.75987, "t": 535.3938, "r": 172.2963, "b": 537.76224, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Names", "bbox": {"l": 147.63603, "t": 535.3661500000001, "r": 155.91753, "b": 537.73459, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "1000", "bbox": {"l": 158.48466, "t": 540.73164, "r": 164.10178, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "500", "bbox": {"l": 158.48466, "t": 544.67065, "r": 162.69737, "b": 547.03909, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "3500", "bbox": {"l": 158.48466, "t": 548.91264, "r": 164.10178, "b": 551.28108, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "150", "bbox": {"l": 158.48466, "t": 553.15465, "r": 162.69737, "b": 555.52309, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "unit", "bbox": {"l": 168.81696, "t": 540.73164, "r": 172.88876, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "unit", "bbox": {"l": 168.81696, "t": 544.67065, "r": 172.88876, "b": 547.03909, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "unit", "bbox": {"l": 168.81696, "t": 548.91264, "r": 172.88876, "b": 551.28108, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "unit", "bbox": {"l": 168.81696, "t": 553.15465, "r": 172.88876, "b": 555.52309, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "2.", "bbox": {"l": 147.30025, "t": 544.67065, "r": 149.70605, "b": 547.03909, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "Item", "bbox": {"l": 150.90895, "t": 544.67065, "r": 155.72055, "b": 547.03909, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "3.", "bbox": {"l": 147.30025, "t": 548.91264, "r": 149.70605, "b": 551.28108, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Item", "bbox": {"l": 150.90895, "t": 548.91264, "r": 155.72055, "b": 551.28108, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "4.", "bbox": {"l": 147.30025, "t": 553.15465, "r": 149.70605, "b": 555.52309, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Item", "bbox": {"l": 150.90895, "t": 553.15465, "r": 155.72055, "b": 555.52309, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Extracted", "bbox": {"l": 152.05046, "t": 517.0098, "r": 171.24945, "b": 521.27298, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Table Images", "bbox": {"l": 148.13347, "t": 522.3122900000001, "r": 175.16759, "b": 526.57547, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Standardized", "bbox": {"l": 193.53331, "t": 524.51422, "r": 220.31973, "b": 528.7774, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "Images", "bbox": {"l": 199.47311, "t": 529.8167100000001, "r": 214.37889, "b": 534.0799, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "BBox", "bbox": {"l": 273.61066, "t": 509.9053, "r": 284.47275, "b": 514.16849, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Decoder", "bbox": {"l": 270.45187, "t": 513.6928399999999, "r": 287.63242, "b": 517.9560200000001, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "BBoxes", "bbox": {"l": 332.47852, "t": 508.14438, "r": 348.14014, "b": 512.40756, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "BBoxes can be", "bbox": {"l": 376.68622, "t": 521.12024, "r": 407.25497, "b": 525.38342, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "traced back to the", "bbox": {"l": 373.90869, "t": 525.66525, "r": 410.03506, "b": 529.92844, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "original image to", "bbox": {"l": 375.29871, "t": 530.21024, "r": 408.64902, "b": 534.47342, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "extract content", "bbox": {"l": 377.06747, "t": 534.75522, "r": 406.88312, "b": 539.01843, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "Structure Tags sequence", "bbox": {"l": 383.56683, "t": 563.24176, "r": 433.76544, "b": 567.50497, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "provide full description of", "bbox": {"l": 383.52768, "t": 567.78676, "r": 433.80764999999997, "b": 572.04997, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "the table structure", "bbox": {"l": 390.47522, "t": 572.33177, "r": 426.85703, "b": 576.59499, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "Structure Tags", "bbox": {"l": 293.94702, "t": 577.89143, "r": 323.1691, "b": 582.15465, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "in OTSL format", "bbox": {"l": 293.94702, "t": 582.43648, "r": 324.59396, "b": 586.69969, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "BBoxes in sync", "bbox": {"l": 333.07819, "t": 541.82269, "r": 364.14691, "b": 546.08591, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "with tag sequence", "bbox": {"l": 333.07819, "t": 545.6102, "r": 369.71542, "b": 549.87341, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "Encoder", "bbox": {"l": 232.65881000000002, "t": 515.24139, "r": 249.58894000000004, "b": 519.50458, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "Structure", "bbox": {"l": 269.8219, "t": 545.97102, "r": 288.26279, "b": 550.23424, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Decoder", "bbox": {"l": 270.45187, "t": 549.75851, "r": 287.63242, "b": 554.0217299999999, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "[x1, y2, x2, y2]", "bbox": {"l": 332.17676, "t": 515.91205, "r": 358.11206, "b": 520.17523, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "[x1', y2', x2', y2']", "bbox": {"l": 332.17676, "t": 521.9720500000001, "r": 361.58298, "b": 526.23523, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "[x1'', y2'', x2'', y2'']", "bbox": {"l": 332.17676, "t": 528.03204, "r": 364.76474, "b": 532.29523, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "...", "bbox": {"l": 332.17676, "t": 534.09204, "r": 335.96548, "b": 538.35524, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "1", "bbox": {"l": 326.8894, "t": 516.39508, "r": 329.41641, "b": 520.6582599999999, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "2", "bbox": {"l": 327.04089, "t": 522.4247700000001, "r": 329.5679, "b": 526.68796, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "3", "bbox": {"l": 327.04089, "t": 528.51508, "r": 329.5679, "b": 532.77826, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "3", "bbox": {"l": 424.14102, "t": 527.4428399999999, "r": 426.66803, "b": 531.7060200000001, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "2", "bbox": {"l": 453.0018, "t": 517.4539500000001, "r": 455.52881, "b": 521.71713, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "1", "bbox": {"l": 423.85825, "t": 517.06281, "r": 426.38525, "b": 521.32599, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "C", "bbox": {"l": 333.4342, "t": 557.36679, "r": 337.27542, "b": 562.35719, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "C", "bbox": {"l": 340.35397, "t": 557.31679, "r": 344.19519, "b": 562.30719, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "C", "bbox": {"l": 340.30978, "t": 563.8653899999999, "r": 344.151, "b": 568.8557900000001, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "C", "bbox": {"l": 346.79904, "t": 563.8686700000001, "r": 350.64026, "b": 568.85907, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "C", "bbox": {"l": 333.59583, "t": 563.82271, "r": 337.43704, "b": 568.81311, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "C", "bbox": {"l": 340.37543, "t": 570.42673, "r": 344.21664, "b": 575.41713, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "C", "bbox": {"l": 346.86469, "t": 570.43001, "r": 350.7059, "b": 575.42041, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "C", "bbox": {"l": 333.66144, "t": 570.38405, "r": 337.50266, "b": 575.37445, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "C", "bbox": {"l": 340.37671, "t": 577.02606, "r": 344.21793, "b": 582.0164599999999, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "C", "bbox": {"l": 346.86597, "t": 577.02934, "r": 350.70718, "b": 582.01974, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "C", "bbox": {"l": 333.66272, "t": 576.98338, "r": 337.50394, "b": 581.97379, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "C", "bbox": {"l": 340.27948, "t": 583.39737, "r": 344.1207, "b": 588.38777, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "C", "bbox": {"l": 346.76874, "t": 583.40068, "r": 350.60995, "b": 588.39108, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "C", "bbox": {"l": 333.56549, "t": 583.35474, "r": 337.40671, "b": 588.34514, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "NL", "bbox": {"l": 353.03326, "t": 556.8831299999999, "r": 359.83362, "b": 561.87354, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "NL", "bbox": {"l": 353.18604, "t": 563.58044, "r": 359.98639, "b": 568.57085, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "NL", "bbox": {"l": 353.19864, "t": 570.1623500000001, "r": 359.99899, "b": 575.15276, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "NL", "bbox": {"l": 353.1532, "t": 576.76611, "r": 359.95355, "b": 581.75652, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "NL", "bbox": {"l": 353.26935, "t": 583.40628, "r": 360.0697, "b": 588.3966800000001, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "L", "bbox": {"l": 347.37979, "t": 557.08235, "r": 350.33786, "b": 562.07275, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "3", "bbox": {"l": 331.14026, "t": 564.2907700000001, "r": 333.66727, "b": 568.55399, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "2", "bbox": {"l": 340.80972, "t": 554.59312, "r": 343.33673, "b": 558.85634, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "1", "bbox": {"l": 330.97992, "t": 554.83035, "r": 333.50693, "b": 559.09357, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "We rely on standard metrics such as Tree Edit Distance score (TEDs) for", "bbox": {"l": 149.709, "t": 620.19278, "r": 480.58792, "b": 628.98975, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "table structure prediction, and Mean Average Precision (mAP) with 0.75 Inter-", "bbox": {"l": 134.765, "t": 632.14778, "r": 480.58871, "b": 640.94475, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "section Over Union (IOU) threshold for the bounding-box predictions of table", "bbox": {"l": 134.765, "t": 644.1027799999999, "r": 480.5917400000001, "b": 652.89975, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "cells. The predicted OTSL structures were converted back to HTML format in", "bbox": {"l": 134.765, "t": 656.0577900000001, "r": 480.58968999999996, "b": 664.8547599999999, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 9, "label": "page_header", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8301323056221008, "cells": [{"id": 0, "text": "8", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "page_header", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8631826043128967, "cells": [{"id": 1, "text": "M.", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 178.07675, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37415, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "text", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.58884000000006, "b": 139.68579, "coord_origin": "TOPLEFT"}, "confidence": 0.9464744925498962, "cells": [{"id": 3, "text": "reduces significantly the column drift seen in the HTML based models (see Fig-", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.58884000000006, "b": 127.73077, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "ure 5).", "bbox": {"l": 134.765, "t": 130.88878999999997, "r": 163.56389, "b": 139.68579, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "section_header", "bbox": {"l": 134.765, "t": 161.55682000000002, "r": 319.34708, "b": 170.36377000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9549514651298523, "cells": [{"id": 5, "text": "4.3", "bbox": {"l": 134.765, "t": 161.55682000000002, "r": 149.40205, "b": 170.36377000000005, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Error-detection and -mitigation", "bbox": {"l": 160.85904, "t": 161.55682000000002, "r": 319.34708, "b": 170.36377000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 134.765, "t": 182.28179999999998, "r": 480.5957599999999, "b": 298.67584, "coord_origin": "TOPLEFT"}, "confidence": 0.9879790544509888, "cells": [{"id": 7, "text": "The design of OTSL allows to validate a table structure easily on an unfinished", "bbox": {"l": 134.765, "t": 182.28179999999998, "r": 480.59572999999995, "b": 191.0788, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "sequence. The detection of an invalid sequence token is a clear indication of a", "bbox": {"l": 134.765, "t": 194.23779000000002, "r": 480.59473, "b": 203.03479000000004, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "prediction mistake, however a valid sequence by itself does not guarantee pre-", "bbox": {"l": 134.765, "t": 206.19281, "r": 480.58678999999995, "b": 214.98981000000003, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "diction correctness. Different heuristics can be used to correct token errors in", "bbox": {"l": 134.765, "t": 218.14783, "r": 480.59177000000005, "b": 226.94482000000005, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "an invalid sequence and thus increase the chances for accurate predictions. Such", "bbox": {"l": 134.765, "t": 230.10284000000001, "r": 480.58768, "b": 238.89984000000004, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "heuristics can be applied either after the prediction of each token, or at the end", "bbox": {"l": 134.765, "t": 242.05786, "r": 480.5867, "b": 250.85486000000003, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "on the entire predicted sequence. For example a simple heuristic which can cor-", "bbox": {"l": 134.765, "t": 254.01288, "r": 480.5938100000001, "b": 262.80988, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "rect the predicted OTSL sequence on-the-fly is to verify if the token with the", "bbox": {"l": 134.765, "t": 265.96887000000004, "r": 480.59069999999997, "b": 274.76586999999995, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "highest prediction confidence invalidates the predicted sequence, and replace it", "bbox": {"l": 134.765, "t": 277.92389000000003, "r": 480.5957599999999, "b": 286.72086, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "by the token with the next highest confidence until OTSL rules are satisfied.", "bbox": {"l": 134.765, "t": 289.8788799999999, "r": 469.40369, "b": 298.67584, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "section_header", "bbox": {"l": 134.765, "t": 321.164, "r": 229.03534, "b": 331.73239000000007, "coord_origin": "TOPLEFT"}, "confidence": 0.95152747631073, "cells": [{"id": 17, "text": "5", "bbox": {"l": 134.765, "t": 321.164, "r": 141.4886, "b": 331.73239000000007, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Experiments", "bbox": {"l": 154.9382, "t": 321.164, "r": 229.03534, "b": 331.73239000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 134.765, "t": 347.24985, "r": 480.59528, "b": 451.6877099999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9877985119819641, "cells": [{"id": 19, "text": "To evaluate the impact of OTSL on prediction accuracy and inference times, we", "bbox": {"l": 134.765, "t": 347.24985, "r": 480.59375, "b": 356.04681, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "conducted a series of experiments based on the TableFormer model (Figure 4)", "bbox": {"l": 134.765, "t": 359.2048300000001, "r": 480.59476, "b": 368.0018, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "with two objectives: Firstly we evaluate the prediction quality and performance", "bbox": {"l": 134.765, "t": 371.15982, "r": 480.58786000000003, "b": 379.95679, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "of OTSL vs. HTML after performing Hyper Parameter Optimization (HPO) on", "bbox": {"l": 134.765, "t": 383.11481000000003, "r": 480.58777, "b": 391.91177, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "the", "bbox": {"l": 134.765, "t": 395.06978999999995, "r": 148.59807, "b": 403.86676, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "canonical", "bbox": {"l": 151.627, "t": 395.06978999999995, "r": 191.84703, "b": 403.86676, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "PubTabNet data set. Secondly we pick the best hyper-parameters", "bbox": {"l": 195.90201, "t": 395.06978999999995, "r": 480.59528, "b": 403.86676, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "found in the first step and evaluate how OTSL impacts the performance of", "bbox": {"l": 134.76501, "t": 407.02478, "r": 480.59283000000005, "b": 415.82175, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "TableFormer after training on other publicly available data sets (FinTabNet,", "bbox": {"l": 134.76501, "t": 418.98077, "r": 480.59476, "b": 427.77774, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "PubTables-1M [14]). The ground truth (GT) from all data sets has been con-", "bbox": {"l": 134.76501, "t": 430.93576, "r": 480.59171, "b": 439.73273, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "verted into OTSL format for this purpose, and will be made publicly available.", "bbox": {"l": 134.76501, "t": 442.8907500000001, "r": 479.30258, "b": 451.6877099999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "caption", "bbox": {"l": 134.76501, "t": 484.64813, "r": 480.59082, "b": 503.73965, "coord_origin": "TOPLEFT"}, "confidence": 0.9297956228256226, "cells": [{"id": 30, "text": "Fig. 4.", "bbox": {"l": 134.76501, "t": 484.64813, "r": 162.64424, "b": 492.57443, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Architecture sketch of the TableFormer model, which is a representative for the", "bbox": {"l": 165.19601, "t": 484.71091, "r": 480.59082, "b": 492.78067, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Im2Seq approach.", "bbox": {"l": 134.76501, "t": 495.66989, "r": 206.70245, "b": 503.73965, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "picture", "bbox": {"l": 140.70968627929688, "t": 508.0638427734375, "r": 472.73382568359375, "b": 593.6771850585938, "coord_origin": "TOPLEFT"}, "confidence": 0.9303396344184875, "cells": [{"id": 33, "text": "1.", "bbox": {"l": 147.30025, "t": 540.73164, "r": 149.70605, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Item", "bbox": {"l": 150.90895, "t": 540.73164, "r": 155.72055, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "Amount", "bbox": {"l": 162.75987, "t": 535.3938, "r": 172.2963, "b": 537.76224, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Names", "bbox": {"l": 147.63603, "t": 535.3661500000001, "r": 155.91753, "b": 537.73459, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "1000", "bbox": {"l": 158.48466, "t": 540.73164, "r": 164.10178, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "500", "bbox": {"l": 158.48466, "t": 544.67065, "r": 162.69737, "b": 547.03909, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "3500", "bbox": {"l": 158.48466, "t": 548.91264, "r": 164.10178, "b": 551.28108, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "150", "bbox": {"l": 158.48466, "t": 553.15465, "r": 162.69737, "b": 555.52309, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "unit", "bbox": {"l": 168.81696, "t": 540.73164, "r": 172.88876, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "unit", "bbox": {"l": 168.81696, "t": 544.67065, "r": 172.88876, "b": 547.03909, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "unit", "bbox": {"l": 168.81696, "t": 548.91264, "r": 172.88876, "b": 551.28108, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "unit", "bbox": {"l": 168.81696, "t": 553.15465, "r": 172.88876, "b": 555.52309, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "2.", "bbox": {"l": 147.30025, "t": 544.67065, "r": 149.70605, "b": 547.03909, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "Item", "bbox": {"l": 150.90895, "t": 544.67065, "r": 155.72055, "b": 547.03909, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "3.", "bbox": {"l": 147.30025, "t": 548.91264, "r": 149.70605, "b": 551.28108, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Item", "bbox": {"l": 150.90895, "t": 548.91264, "r": 155.72055, "b": 551.28108, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "4.", "bbox": {"l": 147.30025, "t": 553.15465, "r": 149.70605, "b": 555.52309, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Item", "bbox": {"l": 150.90895, "t": 553.15465, "r": 155.72055, "b": 555.52309, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Extracted", "bbox": {"l": 152.05046, "t": 517.0098, "r": 171.24945, "b": 521.27298, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Table Images", "bbox": {"l": 148.13347, "t": 522.3122900000001, "r": 175.16759, "b": 526.57547, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Standardized", "bbox": {"l": 193.53331, "t": 524.51422, "r": 220.31973, "b": 528.7774, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "Images", "bbox": {"l": 199.47311, "t": 529.8167100000001, "r": 214.37889, "b": 534.0799, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "BBox", "bbox": {"l": 273.61066, "t": 509.9053, "r": 284.47275, "b": 514.16849, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Decoder", "bbox": {"l": 270.45187, "t": 513.6928399999999, "r": 287.63242, "b": 517.9560200000001, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "BBoxes", "bbox": {"l": 332.47852, "t": 508.14438, "r": 348.14014, "b": 512.40756, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "BBoxes can be", "bbox": {"l": 376.68622, "t": 521.12024, "r": 407.25497, "b": 525.38342, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "traced back to the", "bbox": {"l": 373.90869, "t": 525.66525, "r": 410.03506, "b": 529.92844, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "original image to", "bbox": {"l": 375.29871, "t": 530.21024, "r": 408.64902, "b": 534.47342, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "extract content", "bbox": {"l": 377.06747, "t": 534.75522, "r": 406.88312, "b": 539.01843, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "Structure Tags sequence", "bbox": {"l": 383.56683, "t": 563.24176, "r": 433.76544, "b": 567.50497, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "provide full description of", "bbox": {"l": 383.52768, "t": 567.78676, "r": 433.80764999999997, "b": 572.04997, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "the table structure", "bbox": {"l": 390.47522, "t": 572.33177, "r": 426.85703, "b": 576.59499, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "Structure Tags", "bbox": {"l": 293.94702, "t": 577.89143, "r": 323.1691, "b": 582.15465, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "in OTSL format", "bbox": {"l": 293.94702, "t": 582.43648, "r": 324.59396, "b": 586.69969, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "BBoxes in sync", "bbox": {"l": 333.07819, "t": 541.82269, "r": 364.14691, "b": 546.08591, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "with tag sequence", "bbox": {"l": 333.07819, "t": 545.6102, "r": 369.71542, "b": 549.87341, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "Encoder", "bbox": {"l": 232.65881000000002, "t": 515.24139, "r": 249.58894000000004, "b": 519.50458, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "Structure", "bbox": {"l": 269.8219, "t": 545.97102, "r": 288.26279, "b": 550.23424, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Decoder", "bbox": {"l": 270.45187, "t": 549.75851, "r": 287.63242, "b": 554.0217299999999, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "[x1, y2, x2, y2]", "bbox": {"l": 332.17676, "t": 515.91205, "r": 358.11206, "b": 520.17523, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "[x1', y2', x2', y2']", "bbox": {"l": 332.17676, "t": 521.9720500000001, "r": 361.58298, "b": 526.23523, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "[x1'', y2'', x2'', y2'']", "bbox": {"l": 332.17676, "t": 528.03204, "r": 364.76474, "b": 532.29523, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "...", "bbox": {"l": 332.17676, "t": 534.09204, "r": 335.96548, "b": 538.35524, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "1", "bbox": {"l": 326.8894, "t": 516.39508, "r": 329.41641, "b": 520.6582599999999, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "2", "bbox": {"l": 327.04089, "t": 522.4247700000001, "r": 329.5679, "b": 526.68796, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "3", "bbox": {"l": 327.04089, "t": 528.51508, "r": 329.5679, "b": 532.77826, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "3", "bbox": {"l": 424.14102, "t": 527.4428399999999, "r": 426.66803, "b": 531.7060200000001, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "2", "bbox": {"l": 453.0018, "t": 517.4539500000001, "r": 455.52881, "b": 521.71713, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "1", "bbox": {"l": 423.85825, "t": 517.06281, "r": 426.38525, "b": 521.32599, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "C", "bbox": {"l": 333.4342, "t": 557.36679, "r": 337.27542, "b": 562.35719, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "C", "bbox": {"l": 340.35397, "t": 557.31679, "r": 344.19519, "b": 562.30719, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "C", "bbox": {"l": 340.30978, "t": 563.8653899999999, "r": 344.151, "b": 568.8557900000001, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "C", "bbox": {"l": 346.79904, "t": 563.8686700000001, "r": 350.64026, "b": 568.85907, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "C", "bbox": {"l": 333.59583, "t": 563.82271, "r": 337.43704, "b": 568.81311, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "C", "bbox": {"l": 340.37543, "t": 570.42673, "r": 344.21664, "b": 575.41713, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "C", "bbox": {"l": 346.86469, "t": 570.43001, "r": 350.7059, "b": 575.42041, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "C", "bbox": {"l": 333.66144, "t": 570.38405, "r": 337.50266, "b": 575.37445, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "C", "bbox": {"l": 340.37671, "t": 577.02606, "r": 344.21793, "b": 582.0164599999999, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "C", "bbox": {"l": 346.86597, "t": 577.02934, "r": 350.70718, "b": 582.01974, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "C", "bbox": {"l": 333.66272, "t": 576.98338, "r": 337.50394, "b": 581.97379, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "C", "bbox": {"l": 340.27948, "t": 583.39737, "r": 344.1207, "b": 588.38777, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "C", "bbox": {"l": 346.76874, "t": 583.40068, "r": 350.60995, "b": 588.39108, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "C", "bbox": {"l": 333.56549, "t": 583.35474, "r": 337.40671, "b": 588.34514, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "NL", "bbox": {"l": 353.03326, "t": 556.8831299999999, "r": 359.83362, "b": 561.87354, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "NL", "bbox": {"l": 353.18604, "t": 563.58044, "r": 359.98639, "b": 568.57085, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "NL", "bbox": {"l": 353.19864, "t": 570.1623500000001, "r": 359.99899, "b": 575.15276, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "NL", "bbox": {"l": 353.1532, "t": 576.76611, "r": 359.95355, "b": 581.75652, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "NL", "bbox": {"l": 353.26935, "t": 583.40628, "r": 360.0697, "b": 588.3966800000001, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "L", "bbox": {"l": 347.37979, "t": 557.08235, "r": 350.33786, "b": 562.07275, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "3", "bbox": {"l": 331.14026, "t": 564.2907700000001, "r": 333.66727, "b": 568.55399, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "2", "bbox": {"l": 340.80972, "t": 554.59312, "r": 343.33673, "b": 558.85634, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "1", "bbox": {"l": 330.97992, "t": 554.83035, "r": 333.50693, "b": 559.09357, "coord_origin": "TOPLEFT"}}], "children": [{"id": 10, "label": "text", "bbox": {"l": 147.30025, "t": 540.73164, "r": 149.70605, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "1.", "bbox": {"l": 147.30025, "t": 540.73164, "r": 149.70605, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 150.90895, "t": 540.73164, "r": 155.72055, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "Item", "bbox": {"l": 150.90895, "t": 540.73164, "r": 155.72055, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 162.75987, "t": 535.3938, "r": 172.2963, "b": 537.76224, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "Amount", "bbox": {"l": 162.75987, "t": 535.3938, "r": 172.2963, "b": 537.76224, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 147.63603, "t": 535.3661500000001, "r": 155.91753, "b": 537.73459, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "Names", "bbox": {"l": 147.63603, "t": 535.3661500000001, "r": 155.91753, "b": 537.73459, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 158.48466, "t": 540.73164, "r": 164.10178, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "1000", "bbox": {"l": 158.48466, "t": 540.73164, "r": 164.10178, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 158.48466, "t": 544.67065, "r": 162.69737, "b": 547.03909, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "500", "bbox": {"l": 158.48466, "t": 544.67065, "r": 162.69737, "b": 547.03909, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 158.48466, "t": 548.91264, "r": 164.10178, "b": 551.28108, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "3500", "bbox": {"l": 158.48466, "t": 548.91264, "r": 164.10178, "b": 551.28108, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 158.48466, "t": 553.15465, "r": 162.69737, "b": 555.52309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "150", "bbox": {"l": 158.48466, "t": 553.15465, "r": 162.69737, "b": 555.52309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 168.81696, "t": 540.73164, "r": 172.88876, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "unit", "bbox": {"l": 168.81696, "t": 540.73164, "r": 172.88876, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 168.81696, "t": 544.67065, "r": 172.88876, "b": 547.03909, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "unit", "bbox": {"l": 168.81696, "t": 544.67065, "r": 172.88876, "b": 547.03909, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 168.81696, "t": 548.91264, "r": 172.88876, "b": 551.28108, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "unit", "bbox": {"l": 168.81696, "t": 548.91264, "r": 172.88876, "b": 551.28108, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 168.81696, "t": 553.15465, "r": 172.88876, "b": 555.52309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "unit", "bbox": {"l": 168.81696, "t": 553.15465, "r": 172.88876, "b": 555.52309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 147.30025, "t": 544.67065, "r": 149.70605, "b": 547.03909, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "2.", "bbox": {"l": 147.30025, "t": 544.67065, "r": 149.70605, "b": 547.03909, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 150.90895, "t": 544.67065, "r": 155.72055, "b": 547.03909, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "Item", "bbox": {"l": 150.90895, "t": 544.67065, "r": 155.72055, "b": 547.03909, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 147.30025, "t": 548.91264, "r": 149.70605, "b": 551.28108, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "3.", "bbox": {"l": 147.30025, "t": 548.91264, "r": 149.70605, "b": 551.28108, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 150.90895, "t": 548.91264, "r": 155.72055, "b": 551.28108, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "Item", "bbox": {"l": 150.90895, "t": 548.91264, "r": 155.72055, "b": 551.28108, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 147.30025, "t": 553.15465, "r": 149.70605, "b": 555.52309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "4.", "bbox": {"l": 147.30025, "t": 553.15465, "r": 149.70605, "b": 555.52309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 150.90895, "t": 553.15465, "r": 155.72055, "b": 555.52309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "Item", "bbox": {"l": 150.90895, "t": 553.15465, "r": 155.72055, "b": 555.52309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 152.05046, "t": 517.0098, "r": 171.24945, "b": 521.27298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "Extracted", "bbox": {"l": 152.05046, "t": 517.0098, "r": 171.24945, "b": 521.27298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 148.13347, "t": 522.3122900000001, "r": 175.16759, "b": 526.57547, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "Table Images", "bbox": {"l": 148.13347, "t": 522.3122900000001, "r": 175.16759, "b": 526.57547, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 193.53331, "t": 524.51422, "r": 220.31973, "b": 528.7774, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "Standardized", "bbox": {"l": 193.53331, "t": 524.51422, "r": 220.31973, "b": 528.7774, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 199.47311, "t": 529.8167100000001, "r": 214.37889, "b": 534.0799, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "Images", "bbox": {"l": 199.47311, "t": 529.8167100000001, "r": 214.37889, "b": 534.0799, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 273.61066, "t": 509.9053, "r": 284.47275, "b": 514.16849, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "BBox", "bbox": {"l": 273.61066, "t": 509.9053, "r": 284.47275, "b": 514.16849, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 270.45187, "t": 513.6928399999999, "r": 287.63242, "b": 517.9560200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "Decoder", "bbox": {"l": 270.45187, "t": 513.6928399999999, "r": 287.63242, "b": 517.9560200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 332.47852, "t": 508.14438, "r": 348.14014, "b": 512.40756, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "BBoxes", "bbox": {"l": 332.47852, "t": 508.14438, "r": 348.14014, "b": 512.40756, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 376.68622, "t": 521.12024, "r": 407.25497, "b": 525.38342, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "BBoxes can be", "bbox": {"l": 376.68622, "t": 521.12024, "r": 407.25497, "b": 525.38342, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 373.90869, "t": 525.66525, "r": 410.03506, "b": 529.92844, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "traced back to the", "bbox": {"l": 373.90869, "t": 525.66525, "r": 410.03506, "b": 529.92844, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 375.29871, "t": 530.21024, "r": 408.64902, "b": 534.47342, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "original image to", "bbox": {"l": 375.29871, "t": 530.21024, "r": 408.64902, "b": 534.47342, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 377.06747, "t": 534.75522, "r": 406.88312, "b": 539.01843, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "extract content", "bbox": {"l": 377.06747, "t": 534.75522, "r": 406.88312, "b": 539.01843, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 383.56683, "t": 563.24176, "r": 433.76544, "b": 567.50497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "Structure Tags sequence", "bbox": {"l": 383.56683, "t": 563.24176, "r": 433.76544, "b": 567.50497, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 383.52768, "t": 567.78676, "r": 433.80764999999997, "b": 572.04997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "provide full description of", "bbox": {"l": 383.52768, "t": 567.78676, "r": 433.80764999999997, "b": 572.04997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 390.47522, "t": 572.33177, "r": 426.85703, "b": 576.59499, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "the table structure", "bbox": {"l": 390.47522, "t": 572.33177, "r": 426.85703, "b": 576.59499, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 293.94702, "t": 577.89143, "r": 323.1691, "b": 582.15465, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "Structure Tags", "bbox": {"l": 293.94702, "t": 577.89143, "r": 323.1691, "b": 582.15465, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 293.94702, "t": 582.43648, "r": 324.59396, "b": 586.69969, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "in OTSL format", "bbox": {"l": 293.94702, "t": 582.43648, "r": 324.59396, "b": 586.69969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 333.07819, "t": 541.82269, "r": 364.14691, "b": 546.08591, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "BBoxes in sync", "bbox": {"l": 333.07819, "t": 541.82269, "r": 364.14691, "b": 546.08591, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 333.07819, "t": 545.6102, "r": 369.71542, "b": 549.87341, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "with tag sequence", "bbox": {"l": 333.07819, "t": 545.6102, "r": 369.71542, "b": 549.87341, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 232.65881000000002, "t": 515.24139, "r": 249.58894000000004, "b": 519.50458, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "Encoder", "bbox": {"l": 232.65881000000002, "t": 515.24139, "r": 249.58894000000004, "b": 519.50458, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 269.8219, "t": 545.97102, "r": 288.26279, "b": 550.23424, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "Structure", "bbox": {"l": 269.8219, "t": 545.97102, "r": 288.26279, "b": 550.23424, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 270.45187, "t": 549.75851, "r": 287.63242, "b": 554.0217299999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "Decoder", "bbox": {"l": 270.45187, "t": 549.75851, "r": 287.63242, "b": 554.0217299999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 332.17676, "t": 515.91205, "r": 358.11206, "b": 520.17523, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "[x1, y2, x2, y2]", "bbox": {"l": 332.17676, "t": 515.91205, "r": 358.11206, "b": 520.17523, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 332.17676, "t": 521.9720500000001, "r": 361.58298, "b": 526.23523, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "[x1', y2', x2', y2']", "bbox": {"l": 332.17676, "t": 521.9720500000001, "r": 361.58298, "b": 526.23523, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 332.17676, "t": 528.03204, "r": 364.76474, "b": 532.29523, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "[x1'', y2'', x2'', y2'']", "bbox": {"l": 332.17676, "t": 528.03204, "r": 364.76474, "b": 532.29523, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 332.17676, "t": 534.09204, "r": 335.96548, "b": 538.35524, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "...", "bbox": {"l": 332.17676, "t": 534.09204, "r": 335.96548, "b": 538.35524, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 326.8894, "t": 516.39508, "r": 329.41641, "b": 520.6582599999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "1", "bbox": {"l": 326.8894, "t": 516.39508, "r": 329.41641, "b": 520.6582599999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 327.04089, "t": 522.4247700000001, "r": 329.5679, "b": 526.68796, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "2", "bbox": {"l": 327.04089, "t": 522.4247700000001, "r": 329.5679, "b": 526.68796, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 327.04089, "t": 528.51508, "r": 329.5679, "b": 532.77826, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "3", "bbox": {"l": 327.04089, "t": 528.51508, "r": 329.5679, "b": 532.77826, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 424.14102, "t": 527.4428399999999, "r": 426.66803, "b": 531.7060200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "3", "bbox": {"l": 424.14102, "t": 527.4428399999999, "r": 426.66803, "b": 531.7060200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 453.0018, "t": 517.4539500000001, "r": 455.52881, "b": 521.71713, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "2", "bbox": {"l": 453.0018, "t": 517.4539500000001, "r": 455.52881, "b": 521.71713, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 423.85825, "t": 517.06281, "r": 426.38525, "b": 521.32599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "1", "bbox": {"l": 423.85825, "t": 517.06281, "r": 426.38525, "b": 521.32599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 333.4342, "t": 557.36679, "r": 337.27542, "b": 562.35719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "C", "bbox": {"l": 333.4342, "t": 557.36679, "r": 337.27542, "b": 562.35719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 340.35397, "t": 557.31679, "r": 344.19519, "b": 562.30719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "C", "bbox": {"l": 340.35397, "t": 557.31679, "r": 344.19519, "b": 562.30719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 340.30978, "t": 563.8653899999999, "r": 344.151, "b": 568.8557900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "C", "bbox": {"l": 340.30978, "t": 563.8653899999999, "r": 344.151, "b": 568.8557900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 346.79904, "t": 563.8686700000001, "r": 350.64026, "b": 568.85907, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "C", "bbox": {"l": 346.79904, "t": 563.8686700000001, "r": 350.64026, "b": 568.85907, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 333.59583, "t": 563.82271, "r": 337.43704, "b": 568.81311, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "C", "bbox": {"l": 333.59583, "t": 563.82271, "r": 337.43704, "b": 568.81311, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 340.37543, "t": 570.42673, "r": 344.21664, "b": 575.41713, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "C", "bbox": {"l": 340.37543, "t": 570.42673, "r": 344.21664, "b": 575.41713, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 346.86469, "t": 570.43001, "r": 350.7059, "b": 575.42041, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "C", "bbox": {"l": 346.86469, "t": 570.43001, "r": 350.7059, "b": 575.42041, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 333.66144, "t": 570.38405, "r": 337.50266, "b": 575.37445, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "C", "bbox": {"l": 333.66144, "t": 570.38405, "r": 337.50266, "b": 575.37445, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 340.37671, "t": 577.02606, "r": 344.21793, "b": 582.0164599999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "C", "bbox": {"l": 340.37671, "t": 577.02606, "r": 344.21793, "b": 582.0164599999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 346.86597, "t": 577.02934, "r": 350.70718, "b": 582.01974, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "C", "bbox": {"l": 346.86597, "t": 577.02934, "r": 350.70718, "b": 582.01974, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 333.66272, "t": 576.98338, "r": 337.50394, "b": 581.97379, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "C", "bbox": {"l": 333.66272, "t": 576.98338, "r": 337.50394, "b": 581.97379, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 340.27948, "t": 583.39737, "r": 344.1207, "b": 588.38777, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "C", "bbox": {"l": 340.27948, "t": 583.39737, "r": 344.1207, "b": 588.38777, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 346.76874, "t": 583.40068, "r": 350.60995, "b": 588.39108, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "C", "bbox": {"l": 346.76874, "t": 583.40068, "r": 350.60995, "b": 588.39108, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 333.56549, "t": 583.35474, "r": 337.40671, "b": 588.34514, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "C", "bbox": {"l": 333.56549, "t": 583.35474, "r": 337.40671, "b": 588.34514, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 353.03326, "t": 556.8831299999999, "r": 359.83362, "b": 561.87354, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "NL", "bbox": {"l": 353.03326, "t": 556.8831299999999, "r": 359.83362, "b": 561.87354, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 353.18604, "t": 563.58044, "r": 359.98639, "b": 568.57085, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "NL", "bbox": {"l": 353.18604, "t": 563.58044, "r": 359.98639, "b": 568.57085, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 353.19864, "t": 570.1623500000001, "r": 359.99899, "b": 575.15276, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "NL", "bbox": {"l": 353.19864, "t": 570.1623500000001, "r": 359.99899, "b": 575.15276, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 353.1532, "t": 576.76611, "r": 359.95355, "b": 581.75652, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "NL", "bbox": {"l": 353.1532, "t": 576.76611, "r": 359.95355, "b": 581.75652, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 353.26935, "t": 583.40628, "r": 360.0697, "b": 588.3966800000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "NL", "bbox": {"l": 353.26935, "t": 583.40628, "r": 360.0697, "b": 588.3966800000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 347.37979, "t": 557.08235, "r": 350.33786, "b": 562.07275, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "L", "bbox": {"l": 347.37979, "t": 557.08235, "r": 350.33786, "b": 562.07275, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 331.14026, "t": 564.2907700000001, "r": 333.66727, "b": 568.55399, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "3", "bbox": {"l": 331.14026, "t": 564.2907700000001, "r": 333.66727, "b": 568.55399, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 340.80972, "t": 554.59312, "r": 343.33673, "b": 558.85634, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": "2", "bbox": {"l": 340.80972, "t": 554.59312, "r": 343.33673, "b": 558.85634, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 330.97992, "t": 554.83035, "r": 333.50693, "b": 559.09357, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "1", "bbox": {"l": 330.97992, "t": 554.83035, "r": 333.50693, "b": 559.09357, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 4, "label": "text", "bbox": {"l": 134.765, "t": 620.19278, "r": 480.5917400000001, "b": 664.8547599999999, "coord_origin": "TOPLEFT"}, "confidence": 0.951270341873169, "cells": [{"id": 105, "text": "We rely on standard metrics such as Tree Edit Distance score (TEDs) for", "bbox": {"l": 149.709, "t": 620.19278, "r": 480.58792, "b": 628.98975, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "table structure prediction, and Mean Average Precision (mAP) with 0.75 Inter-", "bbox": {"l": 134.765, "t": 632.14778, "r": 480.58871, "b": 640.94475, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "section Over Union (IOU) threshold for the bounding-box predictions of table", "bbox": {"l": 134.765, "t": 644.1027799999999, "r": 480.5917400000001, "b": 652.89975, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "cells. The predicted OTSL structures were converted back to HTML format in", "bbox": {"l": 134.765, "t": 656.0577900000001, "r": 480.58968999999996, "b": 664.8547599999999, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_header", "id": 9, "page_no": 7, "cluster": {"id": 9, "label": "page_header", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8301323056221008, "cells": [{"id": 0, "text": "8", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "8"}, {"label": "page_header", "id": 8, "page_no": 7, "cluster": {"id": 8, "label": "page_header", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8631826043128967, "cells": [{"id": 1, "text": "M.", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 178.07675, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37415, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "M. Lysak, et al."}, {"label": "text", "id": 5, "page_no": 7, "cluster": {"id": 5, "label": "text", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.58884000000006, "b": 139.68579, "coord_origin": "TOPLEFT"}, "confidence": 0.9464744925498962, "cells": [{"id": 3, "text": "reduces significantly the column drift seen in the HTML based models (see Fig-", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.58884000000006, "b": 127.73077, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "ure 5).", "bbox": {"l": 134.765, "t": 130.88878999999997, "r": 163.56389, "b": 139.68579, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "reduces significantly the column drift seen in the HTML based models (see Figure 5)."}, {"label": "section_header", "id": 2, "page_no": 7, "cluster": {"id": 2, "label": "section_header", "bbox": {"l": 134.765, "t": 161.55682000000002, "r": 319.34708, "b": 170.36377000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9549514651298523, "cells": [{"id": 5, "text": "4.3", "bbox": {"l": 134.765, "t": 161.55682000000002, "r": 149.40205, "b": 170.36377000000005, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Error-detection and -mitigation", "bbox": {"l": 160.85904, "t": 161.55682000000002, "r": 319.34708, "b": 170.36377000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4.3 Error-detection and -mitigation"}, {"label": "text", "id": 0, "page_no": 7, "cluster": {"id": 0, "label": "text", "bbox": {"l": 134.765, "t": 182.28179999999998, "r": 480.5957599999999, "b": 298.67584, "coord_origin": "TOPLEFT"}, "confidence": 0.9879790544509888, "cells": [{"id": 7, "text": "The design of OTSL allows to validate a table structure easily on an unfinished", "bbox": {"l": 134.765, "t": 182.28179999999998, "r": 480.59572999999995, "b": 191.0788, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "sequence. The detection of an invalid sequence token is a clear indication of a", "bbox": {"l": 134.765, "t": 194.23779000000002, "r": 480.59473, "b": 203.03479000000004, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "prediction mistake, however a valid sequence by itself does not guarantee pre-", "bbox": {"l": 134.765, "t": 206.19281, "r": 480.58678999999995, "b": 214.98981000000003, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "diction correctness. Different heuristics can be used to correct token errors in", "bbox": {"l": 134.765, "t": 218.14783, "r": 480.59177000000005, "b": 226.94482000000005, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "an invalid sequence and thus increase the chances for accurate predictions. Such", "bbox": {"l": 134.765, "t": 230.10284000000001, "r": 480.58768, "b": 238.89984000000004, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "heuristics can be applied either after the prediction of each token, or at the end", "bbox": {"l": 134.765, "t": 242.05786, "r": 480.5867, "b": 250.85486000000003, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "on the entire predicted sequence. For example a simple heuristic which can cor-", "bbox": {"l": 134.765, "t": 254.01288, "r": 480.5938100000001, "b": 262.80988, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "rect the predicted OTSL sequence on-the-fly is to verify if the token with the", "bbox": {"l": 134.765, "t": 265.96887000000004, "r": 480.59069999999997, "b": 274.76586999999995, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "highest prediction confidence invalidates the predicted sequence, and replace it", "bbox": {"l": 134.765, "t": 277.92389000000003, "r": 480.5957599999999, "b": 286.72086, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "by the token with the next highest confidence until OTSL rules are satisfied.", "bbox": {"l": 134.765, "t": 289.8788799999999, "r": 469.40369, "b": 298.67584, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The design of OTSL allows to validate a table structure easily on an unfinished sequence. The detection of an invalid sequence token is a clear indication of a prediction mistake, however a valid sequence by itself does not guarantee prediction correctness. Different heuristics can be used to correct token errors in an invalid sequence and thus increase the chances for accurate predictions. Such heuristics can be applied either after the prediction of each token, or at the end on the entire predicted sequence. For example a simple heuristic which can correct the predicted OTSL sequence on-the-fly is to verify if the token with the highest prediction confidence invalidates the predicted sequence, and replace it by the token with the next highest confidence until OTSL rules are satisfied."}, {"label": "section_header", "id": 3, "page_no": 7, "cluster": {"id": 3, "label": "section_header", "bbox": {"l": 134.765, "t": 321.164, "r": 229.03534, "b": 331.73239000000007, "coord_origin": "TOPLEFT"}, "confidence": 0.95152747631073, "cells": [{"id": 17, "text": "5", "bbox": {"l": 134.765, "t": 321.164, "r": 141.4886, "b": 331.73239000000007, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Experiments", "bbox": {"l": 154.9382, "t": 321.164, "r": 229.03534, "b": 331.73239000000007, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5 Experiments"}, {"label": "text", "id": 1, "page_no": 7, "cluster": {"id": 1, "label": "text", "bbox": {"l": 134.765, "t": 347.24985, "r": 480.59528, "b": 451.6877099999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9877985119819641, "cells": [{"id": 19, "text": "To evaluate the impact of OTSL on prediction accuracy and inference times, we", "bbox": {"l": 134.765, "t": 347.24985, "r": 480.59375, "b": 356.04681, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "conducted a series of experiments based on the TableFormer model (Figure 4)", "bbox": {"l": 134.765, "t": 359.2048300000001, "r": 480.59476, "b": 368.0018, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "with two objectives: Firstly we evaluate the prediction quality and performance", "bbox": {"l": 134.765, "t": 371.15982, "r": 480.58786000000003, "b": 379.95679, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "of OTSL vs. HTML after performing Hyper Parameter Optimization (HPO) on", "bbox": {"l": 134.765, "t": 383.11481000000003, "r": 480.58777, "b": 391.91177, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "the", "bbox": {"l": 134.765, "t": 395.06978999999995, "r": 148.59807, "b": 403.86676, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "canonical", "bbox": {"l": 151.627, "t": 395.06978999999995, "r": 191.84703, "b": 403.86676, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "PubTabNet data set. Secondly we pick the best hyper-parameters", "bbox": {"l": 195.90201, "t": 395.06978999999995, "r": 480.59528, "b": 403.86676, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "found in the first step and evaluate how OTSL impacts the performance of", "bbox": {"l": 134.76501, "t": 407.02478, "r": 480.59283000000005, "b": 415.82175, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "TableFormer after training on other publicly available data sets (FinTabNet,", "bbox": {"l": 134.76501, "t": 418.98077, "r": 480.59476, "b": 427.77774, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "PubTables-1M [14]). The ground truth (GT) from all data sets has been con-", "bbox": {"l": 134.76501, "t": 430.93576, "r": 480.59171, "b": 439.73273, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "verted into OTSL format for this purpose, and will be made publicly available.", "bbox": {"l": 134.76501, "t": 442.8907500000001, "r": 479.30258, "b": 451.6877099999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "To evaluate the impact of OTSL on prediction accuracy and inference times, we conducted a series of experiments based on the TableFormer model (Figure 4) with two objectives: Firstly we evaluate the prediction quality and performance of OTSL vs. HTML after performing Hyper Parameter Optimization (HPO) on the canonical PubTabNet data set. Secondly we pick the best hyper-parameters found in the first step and evaluate how OTSL impacts the performance of TableFormer after training on other publicly available data sets (FinTabNet, PubTables-1M [14]). The ground truth (GT) from all data sets has been converted into OTSL format for this purpose, and will be made publicly available."}, {"label": "caption", "id": 7, "page_no": 7, "cluster": {"id": 7, "label": "caption", "bbox": {"l": 134.76501, "t": 484.64813, "r": 480.59082, "b": 503.73965, "coord_origin": "TOPLEFT"}, "confidence": 0.9297956228256226, "cells": [{"id": 30, "text": "Fig. 4.", "bbox": {"l": 134.76501, "t": 484.64813, "r": 162.64424, "b": 492.57443, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Architecture sketch of the TableFormer model, which is a representative for the", "bbox": {"l": 165.19601, "t": 484.71091, "r": 480.59082, "b": 492.78067, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Im2Seq approach.", "bbox": {"l": 134.76501, "t": 495.66989, "r": 206.70245, "b": 503.73965, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Fig. 4. Architecture sketch of the TableFormer model, which is a representative for the Im2Seq approach."}, {"label": "picture", "id": 6, "page_no": 7, "cluster": {"id": 6, "label": "picture", "bbox": {"l": 140.70968627929688, "t": 508.0638427734375, "r": 472.73382568359375, "b": 593.6771850585938, "coord_origin": "TOPLEFT"}, "confidence": 0.9303396344184875, "cells": [{"id": 33, "text": "1.", "bbox": {"l": 147.30025, "t": 540.73164, "r": 149.70605, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Item", "bbox": {"l": 150.90895, "t": 540.73164, "r": 155.72055, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "Amount", "bbox": {"l": 162.75987, "t": 535.3938, "r": 172.2963, "b": 537.76224, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Names", "bbox": {"l": 147.63603, "t": 535.3661500000001, "r": 155.91753, "b": 537.73459, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "1000", "bbox": {"l": 158.48466, "t": 540.73164, "r": 164.10178, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "500", "bbox": {"l": 158.48466, "t": 544.67065, "r": 162.69737, "b": 547.03909, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "3500", "bbox": {"l": 158.48466, "t": 548.91264, "r": 164.10178, "b": 551.28108, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "150", "bbox": {"l": 158.48466, "t": 553.15465, "r": 162.69737, "b": 555.52309, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "unit", "bbox": {"l": 168.81696, "t": 540.73164, "r": 172.88876, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "unit", "bbox": {"l": 168.81696, "t": 544.67065, "r": 172.88876, "b": 547.03909, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "unit", "bbox": {"l": 168.81696, "t": 548.91264, "r": 172.88876, "b": 551.28108, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "unit", "bbox": {"l": 168.81696, "t": 553.15465, "r": 172.88876, "b": 555.52309, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "2.", "bbox": {"l": 147.30025, "t": 544.67065, "r": 149.70605, "b": 547.03909, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "Item", "bbox": {"l": 150.90895, "t": 544.67065, "r": 155.72055, "b": 547.03909, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "3.", "bbox": {"l": 147.30025, "t": 548.91264, "r": 149.70605, "b": 551.28108, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Item", "bbox": {"l": 150.90895, "t": 548.91264, "r": 155.72055, "b": 551.28108, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "4.", "bbox": {"l": 147.30025, "t": 553.15465, "r": 149.70605, "b": 555.52309, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Item", "bbox": {"l": 150.90895, "t": 553.15465, "r": 155.72055, "b": 555.52309, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Extracted", "bbox": {"l": 152.05046, "t": 517.0098, "r": 171.24945, "b": 521.27298, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Table Images", "bbox": {"l": 148.13347, "t": 522.3122900000001, "r": 175.16759, "b": 526.57547, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Standardized", "bbox": {"l": 193.53331, "t": 524.51422, "r": 220.31973, "b": 528.7774, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "Images", "bbox": {"l": 199.47311, "t": 529.8167100000001, "r": 214.37889, "b": 534.0799, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "BBox", "bbox": {"l": 273.61066, "t": 509.9053, "r": 284.47275, "b": 514.16849, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Decoder", "bbox": {"l": 270.45187, "t": 513.6928399999999, "r": 287.63242, "b": 517.9560200000001, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "BBoxes", "bbox": {"l": 332.47852, "t": 508.14438, "r": 348.14014, "b": 512.40756, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "BBoxes can be", "bbox": {"l": 376.68622, "t": 521.12024, "r": 407.25497, "b": 525.38342, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "traced back to the", "bbox": {"l": 373.90869, "t": 525.66525, "r": 410.03506, "b": 529.92844, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "original image to", "bbox": {"l": 375.29871, "t": 530.21024, "r": 408.64902, "b": 534.47342, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "extract content", "bbox": {"l": 377.06747, "t": 534.75522, "r": 406.88312, "b": 539.01843, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "Structure Tags sequence", "bbox": {"l": 383.56683, "t": 563.24176, "r": 433.76544, "b": 567.50497, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "provide full description of", "bbox": {"l": 383.52768, "t": 567.78676, "r": 433.80764999999997, "b": 572.04997, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "the table structure", "bbox": {"l": 390.47522, "t": 572.33177, "r": 426.85703, "b": 576.59499, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "Structure Tags", "bbox": {"l": 293.94702, "t": 577.89143, "r": 323.1691, "b": 582.15465, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "in OTSL format", "bbox": {"l": 293.94702, "t": 582.43648, "r": 324.59396, "b": 586.69969, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "BBoxes in sync", "bbox": {"l": 333.07819, "t": 541.82269, "r": 364.14691, "b": 546.08591, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "with tag sequence", "bbox": {"l": 333.07819, "t": 545.6102, "r": 369.71542, "b": 549.87341, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "Encoder", "bbox": {"l": 232.65881000000002, "t": 515.24139, "r": 249.58894000000004, "b": 519.50458, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "Structure", "bbox": {"l": 269.8219, "t": 545.97102, "r": 288.26279, "b": 550.23424, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Decoder", "bbox": {"l": 270.45187, "t": 549.75851, "r": 287.63242, "b": 554.0217299999999, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "[x1, y2, x2, y2]", "bbox": {"l": 332.17676, "t": 515.91205, "r": 358.11206, "b": 520.17523, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "[x1', y2', x2', y2']", "bbox": {"l": 332.17676, "t": 521.9720500000001, "r": 361.58298, "b": 526.23523, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "[x1'', y2'', x2'', y2'']", "bbox": {"l": 332.17676, "t": 528.03204, "r": 364.76474, "b": 532.29523, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "...", "bbox": {"l": 332.17676, "t": 534.09204, "r": 335.96548, "b": 538.35524, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "1", "bbox": {"l": 326.8894, "t": 516.39508, "r": 329.41641, "b": 520.6582599999999, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "2", "bbox": {"l": 327.04089, "t": 522.4247700000001, "r": 329.5679, "b": 526.68796, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "3", "bbox": {"l": 327.04089, "t": 528.51508, "r": 329.5679, "b": 532.77826, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "3", "bbox": {"l": 424.14102, "t": 527.4428399999999, "r": 426.66803, "b": 531.7060200000001, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "2", "bbox": {"l": 453.0018, "t": 517.4539500000001, "r": 455.52881, "b": 521.71713, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "1", "bbox": {"l": 423.85825, "t": 517.06281, "r": 426.38525, "b": 521.32599, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "C", "bbox": {"l": 333.4342, "t": 557.36679, "r": 337.27542, "b": 562.35719, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "C", "bbox": {"l": 340.35397, "t": 557.31679, "r": 344.19519, "b": 562.30719, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "C", "bbox": {"l": 340.30978, "t": 563.8653899999999, "r": 344.151, "b": 568.8557900000001, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "C", "bbox": {"l": 346.79904, "t": 563.8686700000001, "r": 350.64026, "b": 568.85907, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "C", "bbox": {"l": 333.59583, "t": 563.82271, "r": 337.43704, "b": 568.81311, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "C", "bbox": {"l": 340.37543, "t": 570.42673, "r": 344.21664, "b": 575.41713, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "C", "bbox": {"l": 346.86469, "t": 570.43001, "r": 350.7059, "b": 575.42041, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "C", "bbox": {"l": 333.66144, "t": 570.38405, "r": 337.50266, "b": 575.37445, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "C", "bbox": {"l": 340.37671, "t": 577.02606, "r": 344.21793, "b": 582.0164599999999, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "C", "bbox": {"l": 346.86597, "t": 577.02934, "r": 350.70718, "b": 582.01974, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "C", "bbox": {"l": 333.66272, "t": 576.98338, "r": 337.50394, "b": 581.97379, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "C", "bbox": {"l": 340.27948, "t": 583.39737, "r": 344.1207, "b": 588.38777, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "C", "bbox": {"l": 346.76874, "t": 583.40068, "r": 350.60995, "b": 588.39108, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "C", "bbox": {"l": 333.56549, "t": 583.35474, "r": 337.40671, "b": 588.34514, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "NL", "bbox": {"l": 353.03326, "t": 556.8831299999999, "r": 359.83362, "b": 561.87354, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "NL", "bbox": {"l": 353.18604, "t": 563.58044, "r": 359.98639, "b": 568.57085, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "NL", "bbox": {"l": 353.19864, "t": 570.1623500000001, "r": 359.99899, "b": 575.15276, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "NL", "bbox": {"l": 353.1532, "t": 576.76611, "r": 359.95355, "b": 581.75652, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "NL", "bbox": {"l": 353.26935, "t": 583.40628, "r": 360.0697, "b": 588.3966800000001, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "L", "bbox": {"l": 347.37979, "t": 557.08235, "r": 350.33786, "b": 562.07275, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "3", "bbox": {"l": 331.14026, "t": 564.2907700000001, "r": 333.66727, "b": 568.55399, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "2", "bbox": {"l": 340.80972, "t": 554.59312, "r": 343.33673, "b": 558.85634, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "1", "bbox": {"l": 330.97992, "t": 554.83035, "r": 333.50693, "b": 559.09357, "coord_origin": "TOPLEFT"}}], "children": [{"id": 10, "label": "text", "bbox": {"l": 147.30025, "t": 540.73164, "r": 149.70605, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "1.", "bbox": {"l": 147.30025, "t": 540.73164, "r": 149.70605, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 150.90895, "t": 540.73164, "r": 155.72055, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "Item", "bbox": {"l": 150.90895, "t": 540.73164, "r": 155.72055, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 162.75987, "t": 535.3938, "r": 172.2963, "b": 537.76224, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "Amount", "bbox": {"l": 162.75987, "t": 535.3938, "r": 172.2963, "b": 537.76224, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 147.63603, "t": 535.3661500000001, "r": 155.91753, "b": 537.73459, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "Names", "bbox": {"l": 147.63603, "t": 535.3661500000001, "r": 155.91753, "b": 537.73459, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 158.48466, "t": 540.73164, "r": 164.10178, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "1000", "bbox": {"l": 158.48466, "t": 540.73164, "r": 164.10178, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 158.48466, "t": 544.67065, "r": 162.69737, "b": 547.03909, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "500", "bbox": {"l": 158.48466, "t": 544.67065, "r": 162.69737, "b": 547.03909, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 158.48466, "t": 548.91264, "r": 164.10178, "b": 551.28108, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "3500", "bbox": {"l": 158.48466, "t": 548.91264, "r": 164.10178, "b": 551.28108, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 158.48466, "t": 553.15465, "r": 162.69737, "b": 555.52309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "150", "bbox": {"l": 158.48466, "t": 553.15465, "r": 162.69737, "b": 555.52309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 168.81696, "t": 540.73164, "r": 172.88876, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "unit", "bbox": {"l": 168.81696, "t": 540.73164, "r": 172.88876, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 168.81696, "t": 544.67065, "r": 172.88876, "b": 547.03909, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "unit", "bbox": {"l": 168.81696, "t": 544.67065, "r": 172.88876, "b": 547.03909, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 168.81696, "t": 548.91264, "r": 172.88876, "b": 551.28108, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "unit", "bbox": {"l": 168.81696, "t": 548.91264, "r": 172.88876, "b": 551.28108, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 168.81696, "t": 553.15465, "r": 172.88876, "b": 555.52309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "unit", "bbox": {"l": 168.81696, "t": 553.15465, "r": 172.88876, "b": 555.52309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 147.30025, "t": 544.67065, "r": 149.70605, "b": 547.03909, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "2.", "bbox": {"l": 147.30025, "t": 544.67065, "r": 149.70605, "b": 547.03909, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 150.90895, "t": 544.67065, "r": 155.72055, "b": 547.03909, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "Item", "bbox": {"l": 150.90895, "t": 544.67065, "r": 155.72055, "b": 547.03909, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 147.30025, "t": 548.91264, "r": 149.70605, "b": 551.28108, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "3.", "bbox": {"l": 147.30025, "t": 548.91264, "r": 149.70605, "b": 551.28108, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 150.90895, "t": 548.91264, "r": 155.72055, "b": 551.28108, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "Item", "bbox": {"l": 150.90895, "t": 548.91264, "r": 155.72055, "b": 551.28108, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 147.30025, "t": 553.15465, "r": 149.70605, "b": 555.52309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "4.", "bbox": {"l": 147.30025, "t": 553.15465, "r": 149.70605, "b": 555.52309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 150.90895, "t": 553.15465, "r": 155.72055, "b": 555.52309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "Item", "bbox": {"l": 150.90895, "t": 553.15465, "r": 155.72055, "b": 555.52309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 152.05046, "t": 517.0098, "r": 171.24945, "b": 521.27298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "Extracted", "bbox": {"l": 152.05046, "t": 517.0098, "r": 171.24945, "b": 521.27298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 148.13347, "t": 522.3122900000001, "r": 175.16759, "b": 526.57547, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "Table Images", "bbox": {"l": 148.13347, "t": 522.3122900000001, "r": 175.16759, "b": 526.57547, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 193.53331, "t": 524.51422, "r": 220.31973, "b": 528.7774, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "Standardized", "bbox": {"l": 193.53331, "t": 524.51422, "r": 220.31973, "b": 528.7774, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 199.47311, "t": 529.8167100000001, "r": 214.37889, "b": 534.0799, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "Images", "bbox": {"l": 199.47311, "t": 529.8167100000001, "r": 214.37889, "b": 534.0799, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 273.61066, "t": 509.9053, "r": 284.47275, "b": 514.16849, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "BBox", "bbox": {"l": 273.61066, "t": 509.9053, "r": 284.47275, "b": 514.16849, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 270.45187, "t": 513.6928399999999, "r": 287.63242, "b": 517.9560200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "Decoder", "bbox": {"l": 270.45187, "t": 513.6928399999999, "r": 287.63242, "b": 517.9560200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 332.47852, "t": 508.14438, "r": 348.14014, "b": 512.40756, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "BBoxes", "bbox": {"l": 332.47852, "t": 508.14438, "r": 348.14014, "b": 512.40756, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 376.68622, "t": 521.12024, "r": 407.25497, "b": 525.38342, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "BBoxes can be", "bbox": {"l": 376.68622, "t": 521.12024, "r": 407.25497, "b": 525.38342, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 373.90869, "t": 525.66525, "r": 410.03506, "b": 529.92844, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "traced back to the", "bbox": {"l": 373.90869, "t": 525.66525, "r": 410.03506, "b": 529.92844, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 375.29871, "t": 530.21024, "r": 408.64902, "b": 534.47342, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "original image to", "bbox": {"l": 375.29871, "t": 530.21024, "r": 408.64902, "b": 534.47342, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 377.06747, "t": 534.75522, "r": 406.88312, "b": 539.01843, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "extract content", "bbox": {"l": 377.06747, "t": 534.75522, "r": 406.88312, "b": 539.01843, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 383.56683, "t": 563.24176, "r": 433.76544, "b": 567.50497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "Structure Tags sequence", "bbox": {"l": 383.56683, "t": 563.24176, "r": 433.76544, "b": 567.50497, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 383.52768, "t": 567.78676, "r": 433.80764999999997, "b": 572.04997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "provide full description of", "bbox": {"l": 383.52768, "t": 567.78676, "r": 433.80764999999997, "b": 572.04997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 390.47522, "t": 572.33177, "r": 426.85703, "b": 576.59499, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "the table structure", "bbox": {"l": 390.47522, "t": 572.33177, "r": 426.85703, "b": 576.59499, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 293.94702, "t": 577.89143, "r": 323.1691, "b": 582.15465, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "Structure Tags", "bbox": {"l": 293.94702, "t": 577.89143, "r": 323.1691, "b": 582.15465, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 293.94702, "t": 582.43648, "r": 324.59396, "b": 586.69969, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "in OTSL format", "bbox": {"l": 293.94702, "t": 582.43648, "r": 324.59396, "b": 586.69969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 333.07819, "t": 541.82269, "r": 364.14691, "b": 546.08591, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "BBoxes in sync", "bbox": {"l": 333.07819, "t": 541.82269, "r": 364.14691, "b": 546.08591, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 333.07819, "t": 545.6102, "r": 369.71542, "b": 549.87341, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "with tag sequence", "bbox": {"l": 333.07819, "t": 545.6102, "r": 369.71542, "b": 549.87341, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 232.65881000000002, "t": 515.24139, "r": 249.58894000000004, "b": 519.50458, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "Encoder", "bbox": {"l": 232.65881000000002, "t": 515.24139, "r": 249.58894000000004, "b": 519.50458, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 269.8219, "t": 545.97102, "r": 288.26279, "b": 550.23424, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "Structure", "bbox": {"l": 269.8219, "t": 545.97102, "r": 288.26279, "b": 550.23424, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 270.45187, "t": 549.75851, "r": 287.63242, "b": 554.0217299999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "Decoder", "bbox": {"l": 270.45187, "t": 549.75851, "r": 287.63242, "b": 554.0217299999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 332.17676, "t": 515.91205, "r": 358.11206, "b": 520.17523, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "[x1, y2, x2, y2]", "bbox": {"l": 332.17676, "t": 515.91205, "r": 358.11206, "b": 520.17523, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 332.17676, "t": 521.9720500000001, "r": 361.58298, "b": 526.23523, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "[x1', y2', x2', y2']", "bbox": {"l": 332.17676, "t": 521.9720500000001, "r": 361.58298, "b": 526.23523, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 332.17676, "t": 528.03204, "r": 364.76474, "b": 532.29523, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "[x1'', y2'', x2'', y2'']", "bbox": {"l": 332.17676, "t": 528.03204, "r": 364.76474, "b": 532.29523, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 332.17676, "t": 534.09204, "r": 335.96548, "b": 538.35524, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "...", "bbox": {"l": 332.17676, "t": 534.09204, "r": 335.96548, "b": 538.35524, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 326.8894, "t": 516.39508, "r": 329.41641, "b": 520.6582599999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "1", "bbox": {"l": 326.8894, "t": 516.39508, "r": 329.41641, "b": 520.6582599999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 327.04089, "t": 522.4247700000001, "r": 329.5679, "b": 526.68796, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "2", "bbox": {"l": 327.04089, "t": 522.4247700000001, "r": 329.5679, "b": 526.68796, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 327.04089, "t": 528.51508, "r": 329.5679, "b": 532.77826, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "3", "bbox": {"l": 327.04089, "t": 528.51508, "r": 329.5679, "b": 532.77826, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 424.14102, "t": 527.4428399999999, "r": 426.66803, "b": 531.7060200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "3", "bbox": {"l": 424.14102, "t": 527.4428399999999, "r": 426.66803, "b": 531.7060200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 453.0018, "t": 517.4539500000001, "r": 455.52881, "b": 521.71713, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "2", "bbox": {"l": 453.0018, "t": 517.4539500000001, "r": 455.52881, "b": 521.71713, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 423.85825, "t": 517.06281, "r": 426.38525, "b": 521.32599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "1", "bbox": {"l": 423.85825, "t": 517.06281, "r": 426.38525, "b": 521.32599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 333.4342, "t": 557.36679, "r": 337.27542, "b": 562.35719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "C", "bbox": {"l": 333.4342, "t": 557.36679, "r": 337.27542, "b": 562.35719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 340.35397, "t": 557.31679, "r": 344.19519, "b": 562.30719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "C", "bbox": {"l": 340.35397, "t": 557.31679, "r": 344.19519, "b": 562.30719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 340.30978, "t": 563.8653899999999, "r": 344.151, "b": 568.8557900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "C", "bbox": {"l": 340.30978, "t": 563.8653899999999, "r": 344.151, "b": 568.8557900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 346.79904, "t": 563.8686700000001, "r": 350.64026, "b": 568.85907, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "C", "bbox": {"l": 346.79904, "t": 563.8686700000001, "r": 350.64026, "b": 568.85907, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 333.59583, "t": 563.82271, "r": 337.43704, "b": 568.81311, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "C", "bbox": {"l": 333.59583, "t": 563.82271, "r": 337.43704, "b": 568.81311, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 340.37543, "t": 570.42673, "r": 344.21664, "b": 575.41713, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "C", "bbox": {"l": 340.37543, "t": 570.42673, "r": 344.21664, "b": 575.41713, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 346.86469, "t": 570.43001, "r": 350.7059, "b": 575.42041, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "C", "bbox": {"l": 346.86469, "t": 570.43001, "r": 350.7059, "b": 575.42041, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 333.66144, "t": 570.38405, "r": 337.50266, "b": 575.37445, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "C", "bbox": {"l": 333.66144, "t": 570.38405, "r": 337.50266, "b": 575.37445, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 340.37671, "t": 577.02606, "r": 344.21793, "b": 582.0164599999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "C", "bbox": {"l": 340.37671, "t": 577.02606, "r": 344.21793, "b": 582.0164599999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 346.86597, "t": 577.02934, "r": 350.70718, "b": 582.01974, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "C", "bbox": {"l": 346.86597, "t": 577.02934, "r": 350.70718, "b": 582.01974, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 333.66272, "t": 576.98338, "r": 337.50394, "b": 581.97379, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "C", "bbox": {"l": 333.66272, "t": 576.98338, "r": 337.50394, "b": 581.97379, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 340.27948, "t": 583.39737, "r": 344.1207, "b": 588.38777, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "C", "bbox": {"l": 340.27948, "t": 583.39737, "r": 344.1207, "b": 588.38777, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 346.76874, "t": 583.40068, "r": 350.60995, "b": 588.39108, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "C", "bbox": {"l": 346.76874, "t": 583.40068, "r": 350.60995, "b": 588.39108, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 333.56549, "t": 583.35474, "r": 337.40671, "b": 588.34514, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "C", "bbox": {"l": 333.56549, "t": 583.35474, "r": 337.40671, "b": 588.34514, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 353.03326, "t": 556.8831299999999, "r": 359.83362, "b": 561.87354, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "NL", "bbox": {"l": 353.03326, "t": 556.8831299999999, "r": 359.83362, "b": 561.87354, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 353.18604, "t": 563.58044, "r": 359.98639, "b": 568.57085, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "NL", "bbox": {"l": 353.18604, "t": 563.58044, "r": 359.98639, "b": 568.57085, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 353.19864, "t": 570.1623500000001, "r": 359.99899, "b": 575.15276, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "NL", "bbox": {"l": 353.19864, "t": 570.1623500000001, "r": 359.99899, "b": 575.15276, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 353.1532, "t": 576.76611, "r": 359.95355, "b": 581.75652, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "NL", "bbox": {"l": 353.1532, "t": 576.76611, "r": 359.95355, "b": 581.75652, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 353.26935, "t": 583.40628, "r": 360.0697, "b": 588.3966800000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "NL", "bbox": {"l": 353.26935, "t": 583.40628, "r": 360.0697, "b": 588.3966800000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 347.37979, "t": 557.08235, "r": 350.33786, "b": 562.07275, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "L", "bbox": {"l": 347.37979, "t": 557.08235, "r": 350.33786, "b": 562.07275, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 331.14026, "t": 564.2907700000001, "r": 333.66727, "b": 568.55399, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "3", "bbox": {"l": 331.14026, "t": 564.2907700000001, "r": 333.66727, "b": 568.55399, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 340.80972, "t": 554.59312, "r": 343.33673, "b": 558.85634, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": "2", "bbox": {"l": 340.80972, "t": 554.59312, "r": 343.33673, "b": 558.85634, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 330.97992, "t": 554.83035, "r": 333.50693, "b": 559.09357, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "1", "bbox": {"l": 330.97992, "t": 554.83035, "r": 333.50693, "b": 559.09357, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "text", "id": 4, "page_no": 7, "cluster": {"id": 4, "label": "text", "bbox": {"l": 134.765, "t": 620.19278, "r": 480.5917400000001, "b": 664.8547599999999, "coord_origin": "TOPLEFT"}, "confidence": 0.951270341873169, "cells": [{"id": 105, "text": "We rely on standard metrics such as Tree Edit Distance score (TEDs) for", "bbox": {"l": 149.709, "t": 620.19278, "r": 480.58792, "b": 628.98975, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "table structure prediction, and Mean Average Precision (mAP) with 0.75 Inter-", "bbox": {"l": 134.765, "t": 632.14778, "r": 480.58871, "b": 640.94475, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "section Over Union (IOU) threshold for the bounding-box predictions of table", "bbox": {"l": 134.765, "t": 644.1027799999999, "r": 480.5917400000001, "b": 652.89975, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "cells. The predicted OTSL structures were converted back to HTML format in", "bbox": {"l": 134.765, "t": 656.0577900000001, "r": 480.58968999999996, "b": 664.8547599999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "We rely on standard metrics such as Tree Edit Distance score (TEDs) for table structure prediction, and Mean Average Precision (mAP) with 0.75 Intersection Over Union (IOU) threshold for the bounding-box predictions of table cells. The predicted OTSL structures were converted back to HTML format in"}], "body": [{"label": "text", "id": 5, "page_no": 7, "cluster": {"id": 5, "label": "text", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.58884000000006, "b": 139.68579, "coord_origin": "TOPLEFT"}, "confidence": 0.9464744925498962, "cells": [{"id": 3, "text": "reduces significantly the column drift seen in the HTML based models (see Fig-", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.58884000000006, "b": 127.73077, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "ure 5).", "bbox": {"l": 134.765, "t": 130.88878999999997, "r": 163.56389, "b": 139.68579, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "reduces significantly the column drift seen in the HTML based models (see Figure 5)."}, {"label": "section_header", "id": 2, "page_no": 7, "cluster": {"id": 2, "label": "section_header", "bbox": {"l": 134.765, "t": 161.55682000000002, "r": 319.34708, "b": 170.36377000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9549514651298523, "cells": [{"id": 5, "text": "4.3", "bbox": {"l": 134.765, "t": 161.55682000000002, "r": 149.40205, "b": 170.36377000000005, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Error-detection and -mitigation", "bbox": {"l": 160.85904, "t": 161.55682000000002, "r": 319.34708, "b": 170.36377000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4.3 Error-detection and -mitigation"}, {"label": "text", "id": 0, "page_no": 7, "cluster": {"id": 0, "label": "text", "bbox": {"l": 134.765, "t": 182.28179999999998, "r": 480.5957599999999, "b": 298.67584, "coord_origin": "TOPLEFT"}, "confidence": 0.9879790544509888, "cells": [{"id": 7, "text": "The design of OTSL allows to validate a table structure easily on an unfinished", "bbox": {"l": 134.765, "t": 182.28179999999998, "r": 480.59572999999995, "b": 191.0788, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "sequence. The detection of an invalid sequence token is a clear indication of a", "bbox": {"l": 134.765, "t": 194.23779000000002, "r": 480.59473, "b": 203.03479000000004, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "prediction mistake, however a valid sequence by itself does not guarantee pre-", "bbox": {"l": 134.765, "t": 206.19281, "r": 480.58678999999995, "b": 214.98981000000003, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "diction correctness. Different heuristics can be used to correct token errors in", "bbox": {"l": 134.765, "t": 218.14783, "r": 480.59177000000005, "b": 226.94482000000005, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "an invalid sequence and thus increase the chances for accurate predictions. Such", "bbox": {"l": 134.765, "t": 230.10284000000001, "r": 480.58768, "b": 238.89984000000004, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "heuristics can be applied either after the prediction of each token, or at the end", "bbox": {"l": 134.765, "t": 242.05786, "r": 480.5867, "b": 250.85486000000003, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "on the entire predicted sequence. For example a simple heuristic which can cor-", "bbox": {"l": 134.765, "t": 254.01288, "r": 480.5938100000001, "b": 262.80988, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "rect the predicted OTSL sequence on-the-fly is to verify if the token with the", "bbox": {"l": 134.765, "t": 265.96887000000004, "r": 480.59069999999997, "b": 274.76586999999995, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "highest prediction confidence invalidates the predicted sequence, and replace it", "bbox": {"l": 134.765, "t": 277.92389000000003, "r": 480.5957599999999, "b": 286.72086, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "by the token with the next highest confidence until OTSL rules are satisfied.", "bbox": {"l": 134.765, "t": 289.8788799999999, "r": 469.40369, "b": 298.67584, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The design of OTSL allows to validate a table structure easily on an unfinished sequence. The detection of an invalid sequence token is a clear indication of a prediction mistake, however a valid sequence by itself does not guarantee prediction correctness. Different heuristics can be used to correct token errors in an invalid sequence and thus increase the chances for accurate predictions. Such heuristics can be applied either after the prediction of each token, or at the end on the entire predicted sequence. For example a simple heuristic which can correct the predicted OTSL sequence on-the-fly is to verify if the token with the highest prediction confidence invalidates the predicted sequence, and replace it by the token with the next highest confidence until OTSL rules are satisfied."}, {"label": "section_header", "id": 3, "page_no": 7, "cluster": {"id": 3, "label": "section_header", "bbox": {"l": 134.765, "t": 321.164, "r": 229.03534, "b": 331.73239000000007, "coord_origin": "TOPLEFT"}, "confidence": 0.95152747631073, "cells": [{"id": 17, "text": "5", "bbox": {"l": 134.765, "t": 321.164, "r": 141.4886, "b": 331.73239000000007, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Experiments", "bbox": {"l": 154.9382, "t": 321.164, "r": 229.03534, "b": 331.73239000000007, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5 Experiments"}, {"label": "text", "id": 1, "page_no": 7, "cluster": {"id": 1, "label": "text", "bbox": {"l": 134.765, "t": 347.24985, "r": 480.59528, "b": 451.6877099999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9877985119819641, "cells": [{"id": 19, "text": "To evaluate the impact of OTSL on prediction accuracy and inference times, we", "bbox": {"l": 134.765, "t": 347.24985, "r": 480.59375, "b": 356.04681, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "conducted a series of experiments based on the TableFormer model (Figure 4)", "bbox": {"l": 134.765, "t": 359.2048300000001, "r": 480.59476, "b": 368.0018, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "with two objectives: Firstly we evaluate the prediction quality and performance", "bbox": {"l": 134.765, "t": 371.15982, "r": 480.58786000000003, "b": 379.95679, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "of OTSL vs. HTML after performing Hyper Parameter Optimization (HPO) on", "bbox": {"l": 134.765, "t": 383.11481000000003, "r": 480.58777, "b": 391.91177, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "the", "bbox": {"l": 134.765, "t": 395.06978999999995, "r": 148.59807, "b": 403.86676, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "canonical", "bbox": {"l": 151.627, "t": 395.06978999999995, "r": 191.84703, "b": 403.86676, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "PubTabNet data set. Secondly we pick the best hyper-parameters", "bbox": {"l": 195.90201, "t": 395.06978999999995, "r": 480.59528, "b": 403.86676, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "found in the first step and evaluate how OTSL impacts the performance of", "bbox": {"l": 134.76501, "t": 407.02478, "r": 480.59283000000005, "b": 415.82175, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "TableFormer after training on other publicly available data sets (FinTabNet,", "bbox": {"l": 134.76501, "t": 418.98077, "r": 480.59476, "b": 427.77774, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "PubTables-1M [14]). The ground truth (GT) from all data sets has been con-", "bbox": {"l": 134.76501, "t": 430.93576, "r": 480.59171, "b": 439.73273, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "verted into OTSL format for this purpose, and will be made publicly available.", "bbox": {"l": 134.76501, "t": 442.8907500000001, "r": 479.30258, "b": 451.6877099999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "To evaluate the impact of OTSL on prediction accuracy and inference times, we conducted a series of experiments based on the TableFormer model (Figure 4) with two objectives: Firstly we evaluate the prediction quality and performance of OTSL vs. HTML after performing Hyper Parameter Optimization (HPO) on the canonical PubTabNet data set. Secondly we pick the best hyper-parameters found in the first step and evaluate how OTSL impacts the performance of TableFormer after training on other publicly available data sets (FinTabNet, PubTables-1M [14]). The ground truth (GT) from all data sets has been converted into OTSL format for this purpose, and will be made publicly available."}, {"label": "caption", "id": 7, "page_no": 7, "cluster": {"id": 7, "label": "caption", "bbox": {"l": 134.76501, "t": 484.64813, "r": 480.59082, "b": 503.73965, "coord_origin": "TOPLEFT"}, "confidence": 0.9297956228256226, "cells": [{"id": 30, "text": "Fig. 4.", "bbox": {"l": 134.76501, "t": 484.64813, "r": 162.64424, "b": 492.57443, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Architecture sketch of the TableFormer model, which is a representative for the", "bbox": {"l": 165.19601, "t": 484.71091, "r": 480.59082, "b": 492.78067, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Im2Seq approach.", "bbox": {"l": 134.76501, "t": 495.66989, "r": 206.70245, "b": 503.73965, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Fig. 4. Architecture sketch of the TableFormer model, which is a representative for the Im2Seq approach."}, {"label": "picture", "id": 6, "page_no": 7, "cluster": {"id": 6, "label": "picture", "bbox": {"l": 140.70968627929688, "t": 508.0638427734375, "r": 472.73382568359375, "b": 593.6771850585938, "coord_origin": "TOPLEFT"}, "confidence": 0.9303396344184875, "cells": [{"id": 33, "text": "1.", "bbox": {"l": 147.30025, "t": 540.73164, "r": 149.70605, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Item", "bbox": {"l": 150.90895, "t": 540.73164, "r": 155.72055, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "Amount", "bbox": {"l": 162.75987, "t": 535.3938, "r": 172.2963, "b": 537.76224, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Names", "bbox": {"l": 147.63603, "t": 535.3661500000001, "r": 155.91753, "b": 537.73459, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "1000", "bbox": {"l": 158.48466, "t": 540.73164, "r": 164.10178, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "500", "bbox": {"l": 158.48466, "t": 544.67065, "r": 162.69737, "b": 547.03909, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "3500", "bbox": {"l": 158.48466, "t": 548.91264, "r": 164.10178, "b": 551.28108, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "150", "bbox": {"l": 158.48466, "t": 553.15465, "r": 162.69737, "b": 555.52309, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "unit", "bbox": {"l": 168.81696, "t": 540.73164, "r": 172.88876, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "unit", "bbox": {"l": 168.81696, "t": 544.67065, "r": 172.88876, "b": 547.03909, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "unit", "bbox": {"l": 168.81696, "t": 548.91264, "r": 172.88876, "b": 551.28108, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "unit", "bbox": {"l": 168.81696, "t": 553.15465, "r": 172.88876, "b": 555.52309, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "2.", "bbox": {"l": 147.30025, "t": 544.67065, "r": 149.70605, "b": 547.03909, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "Item", "bbox": {"l": 150.90895, "t": 544.67065, "r": 155.72055, "b": 547.03909, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "3.", "bbox": {"l": 147.30025, "t": 548.91264, "r": 149.70605, "b": 551.28108, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Item", "bbox": {"l": 150.90895, "t": 548.91264, "r": 155.72055, "b": 551.28108, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "4.", "bbox": {"l": 147.30025, "t": 553.15465, "r": 149.70605, "b": 555.52309, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Item", "bbox": {"l": 150.90895, "t": 553.15465, "r": 155.72055, "b": 555.52309, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Extracted", "bbox": {"l": 152.05046, "t": 517.0098, "r": 171.24945, "b": 521.27298, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Table Images", "bbox": {"l": 148.13347, "t": 522.3122900000001, "r": 175.16759, "b": 526.57547, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Standardized", "bbox": {"l": 193.53331, "t": 524.51422, "r": 220.31973, "b": 528.7774, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "Images", "bbox": {"l": 199.47311, "t": 529.8167100000001, "r": 214.37889, "b": 534.0799, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "BBox", "bbox": {"l": 273.61066, "t": 509.9053, "r": 284.47275, "b": 514.16849, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Decoder", "bbox": {"l": 270.45187, "t": 513.6928399999999, "r": 287.63242, "b": 517.9560200000001, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "BBoxes", "bbox": {"l": 332.47852, "t": 508.14438, "r": 348.14014, "b": 512.40756, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "BBoxes can be", "bbox": {"l": 376.68622, "t": 521.12024, "r": 407.25497, "b": 525.38342, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "traced back to the", "bbox": {"l": 373.90869, "t": 525.66525, "r": 410.03506, "b": 529.92844, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "original image to", "bbox": {"l": 375.29871, "t": 530.21024, "r": 408.64902, "b": 534.47342, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "extract content", "bbox": {"l": 377.06747, "t": 534.75522, "r": 406.88312, "b": 539.01843, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "Structure Tags sequence", "bbox": {"l": 383.56683, "t": 563.24176, "r": 433.76544, "b": 567.50497, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "provide full description of", "bbox": {"l": 383.52768, "t": 567.78676, "r": 433.80764999999997, "b": 572.04997, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "the table structure", "bbox": {"l": 390.47522, "t": 572.33177, "r": 426.85703, "b": 576.59499, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "Structure Tags", "bbox": {"l": 293.94702, "t": 577.89143, "r": 323.1691, "b": 582.15465, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "in OTSL format", "bbox": {"l": 293.94702, "t": 582.43648, "r": 324.59396, "b": 586.69969, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "BBoxes in sync", "bbox": {"l": 333.07819, "t": 541.82269, "r": 364.14691, "b": 546.08591, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "with tag sequence", "bbox": {"l": 333.07819, "t": 545.6102, "r": 369.71542, "b": 549.87341, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "Encoder", "bbox": {"l": 232.65881000000002, "t": 515.24139, "r": 249.58894000000004, "b": 519.50458, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "Structure", "bbox": {"l": 269.8219, "t": 545.97102, "r": 288.26279, "b": 550.23424, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Decoder", "bbox": {"l": 270.45187, "t": 549.75851, "r": 287.63242, "b": 554.0217299999999, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "[x1, y2, x2, y2]", "bbox": {"l": 332.17676, "t": 515.91205, "r": 358.11206, "b": 520.17523, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "[x1', y2', x2', y2']", "bbox": {"l": 332.17676, "t": 521.9720500000001, "r": 361.58298, "b": 526.23523, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "[x1'', y2'', x2'', y2'']", "bbox": {"l": 332.17676, "t": 528.03204, "r": 364.76474, "b": 532.29523, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "...", "bbox": {"l": 332.17676, "t": 534.09204, "r": 335.96548, "b": 538.35524, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "1", "bbox": {"l": 326.8894, "t": 516.39508, "r": 329.41641, "b": 520.6582599999999, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "2", "bbox": {"l": 327.04089, "t": 522.4247700000001, "r": 329.5679, "b": 526.68796, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "3", "bbox": {"l": 327.04089, "t": 528.51508, "r": 329.5679, "b": 532.77826, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "3", "bbox": {"l": 424.14102, "t": 527.4428399999999, "r": 426.66803, "b": 531.7060200000001, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "2", "bbox": {"l": 453.0018, "t": 517.4539500000001, "r": 455.52881, "b": 521.71713, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "1", "bbox": {"l": 423.85825, "t": 517.06281, "r": 426.38525, "b": 521.32599, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "C", "bbox": {"l": 333.4342, "t": 557.36679, "r": 337.27542, "b": 562.35719, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "C", "bbox": {"l": 340.35397, "t": 557.31679, "r": 344.19519, "b": 562.30719, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "C", "bbox": {"l": 340.30978, "t": 563.8653899999999, "r": 344.151, "b": 568.8557900000001, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "C", "bbox": {"l": 346.79904, "t": 563.8686700000001, "r": 350.64026, "b": 568.85907, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "C", "bbox": {"l": 333.59583, "t": 563.82271, "r": 337.43704, "b": 568.81311, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "C", "bbox": {"l": 340.37543, "t": 570.42673, "r": 344.21664, "b": 575.41713, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "C", "bbox": {"l": 346.86469, "t": 570.43001, "r": 350.7059, "b": 575.42041, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "C", "bbox": {"l": 333.66144, "t": 570.38405, "r": 337.50266, "b": 575.37445, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "C", "bbox": {"l": 340.37671, "t": 577.02606, "r": 344.21793, "b": 582.0164599999999, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "C", "bbox": {"l": 346.86597, "t": 577.02934, "r": 350.70718, "b": 582.01974, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "C", "bbox": {"l": 333.66272, "t": 576.98338, "r": 337.50394, "b": 581.97379, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "C", "bbox": {"l": 340.27948, "t": 583.39737, "r": 344.1207, "b": 588.38777, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "C", "bbox": {"l": 346.76874, "t": 583.40068, "r": 350.60995, "b": 588.39108, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "C", "bbox": {"l": 333.56549, "t": 583.35474, "r": 337.40671, "b": 588.34514, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "NL", "bbox": {"l": 353.03326, "t": 556.8831299999999, "r": 359.83362, "b": 561.87354, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "NL", "bbox": {"l": 353.18604, "t": 563.58044, "r": 359.98639, "b": 568.57085, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "NL", "bbox": {"l": 353.19864, "t": 570.1623500000001, "r": 359.99899, "b": 575.15276, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "NL", "bbox": {"l": 353.1532, "t": 576.76611, "r": 359.95355, "b": 581.75652, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "NL", "bbox": {"l": 353.26935, "t": 583.40628, "r": 360.0697, "b": 588.3966800000001, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "L", "bbox": {"l": 347.37979, "t": 557.08235, "r": 350.33786, "b": 562.07275, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "3", "bbox": {"l": 331.14026, "t": 564.2907700000001, "r": 333.66727, "b": 568.55399, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "2", "bbox": {"l": 340.80972, "t": 554.59312, "r": 343.33673, "b": 558.85634, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "1", "bbox": {"l": 330.97992, "t": 554.83035, "r": 333.50693, "b": 559.09357, "coord_origin": "TOPLEFT"}}], "children": [{"id": 10, "label": "text", "bbox": {"l": 147.30025, "t": 540.73164, "r": 149.70605, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "1.", "bbox": {"l": 147.30025, "t": 540.73164, "r": 149.70605, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 150.90895, "t": 540.73164, "r": 155.72055, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "Item", "bbox": {"l": 150.90895, "t": 540.73164, "r": 155.72055, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 162.75987, "t": 535.3938, "r": 172.2963, "b": 537.76224, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "Amount", "bbox": {"l": 162.75987, "t": 535.3938, "r": 172.2963, "b": 537.76224, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 147.63603, "t": 535.3661500000001, "r": 155.91753, "b": 537.73459, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "Names", "bbox": {"l": 147.63603, "t": 535.3661500000001, "r": 155.91753, "b": 537.73459, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 158.48466, "t": 540.73164, "r": 164.10178, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "1000", "bbox": {"l": 158.48466, "t": 540.73164, "r": 164.10178, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 158.48466, "t": 544.67065, "r": 162.69737, "b": 547.03909, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "500", "bbox": {"l": 158.48466, "t": 544.67065, "r": 162.69737, "b": 547.03909, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 158.48466, "t": 548.91264, "r": 164.10178, "b": 551.28108, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "3500", "bbox": {"l": 158.48466, "t": 548.91264, "r": 164.10178, "b": 551.28108, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 158.48466, "t": 553.15465, "r": 162.69737, "b": 555.52309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "150", "bbox": {"l": 158.48466, "t": 553.15465, "r": 162.69737, "b": 555.52309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 168.81696, "t": 540.73164, "r": 172.88876, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "unit", "bbox": {"l": 168.81696, "t": 540.73164, "r": 172.88876, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 168.81696, "t": 544.67065, "r": 172.88876, "b": 547.03909, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "unit", "bbox": {"l": 168.81696, "t": 544.67065, "r": 172.88876, "b": 547.03909, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 168.81696, "t": 548.91264, "r": 172.88876, "b": 551.28108, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "unit", "bbox": {"l": 168.81696, "t": 548.91264, "r": 172.88876, "b": 551.28108, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 168.81696, "t": 553.15465, "r": 172.88876, "b": 555.52309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "unit", "bbox": {"l": 168.81696, "t": 553.15465, "r": 172.88876, "b": 555.52309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 147.30025, "t": 544.67065, "r": 149.70605, "b": 547.03909, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "2.", "bbox": {"l": 147.30025, "t": 544.67065, "r": 149.70605, "b": 547.03909, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 150.90895, "t": 544.67065, "r": 155.72055, "b": 547.03909, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "Item", "bbox": {"l": 150.90895, "t": 544.67065, "r": 155.72055, "b": 547.03909, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 147.30025, "t": 548.91264, "r": 149.70605, "b": 551.28108, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "3.", "bbox": {"l": 147.30025, "t": 548.91264, "r": 149.70605, "b": 551.28108, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 150.90895, "t": 548.91264, "r": 155.72055, "b": 551.28108, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "Item", "bbox": {"l": 150.90895, "t": 548.91264, "r": 155.72055, "b": 551.28108, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 147.30025, "t": 553.15465, "r": 149.70605, "b": 555.52309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "4.", "bbox": {"l": 147.30025, "t": 553.15465, "r": 149.70605, "b": 555.52309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 150.90895, "t": 553.15465, "r": 155.72055, "b": 555.52309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "Item", "bbox": {"l": 150.90895, "t": 553.15465, "r": 155.72055, "b": 555.52309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 152.05046, "t": 517.0098, "r": 171.24945, "b": 521.27298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "Extracted", "bbox": {"l": 152.05046, "t": 517.0098, "r": 171.24945, "b": 521.27298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 148.13347, "t": 522.3122900000001, "r": 175.16759, "b": 526.57547, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "Table Images", "bbox": {"l": 148.13347, "t": 522.3122900000001, "r": 175.16759, "b": 526.57547, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 193.53331, "t": 524.51422, "r": 220.31973, "b": 528.7774, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "Standardized", "bbox": {"l": 193.53331, "t": 524.51422, "r": 220.31973, "b": 528.7774, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 199.47311, "t": 529.8167100000001, "r": 214.37889, "b": 534.0799, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "Images", "bbox": {"l": 199.47311, "t": 529.8167100000001, "r": 214.37889, "b": 534.0799, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 273.61066, "t": 509.9053, "r": 284.47275, "b": 514.16849, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "BBox", "bbox": {"l": 273.61066, "t": 509.9053, "r": 284.47275, "b": 514.16849, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 270.45187, "t": 513.6928399999999, "r": 287.63242, "b": 517.9560200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "Decoder", "bbox": {"l": 270.45187, "t": 513.6928399999999, "r": 287.63242, "b": 517.9560200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 332.47852, "t": 508.14438, "r": 348.14014, "b": 512.40756, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "BBoxes", "bbox": {"l": 332.47852, "t": 508.14438, "r": 348.14014, "b": 512.40756, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 376.68622, "t": 521.12024, "r": 407.25497, "b": 525.38342, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "BBoxes can be", "bbox": {"l": 376.68622, "t": 521.12024, "r": 407.25497, "b": 525.38342, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 373.90869, "t": 525.66525, "r": 410.03506, "b": 529.92844, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "traced back to the", "bbox": {"l": 373.90869, "t": 525.66525, "r": 410.03506, "b": 529.92844, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 375.29871, "t": 530.21024, "r": 408.64902, "b": 534.47342, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "original image to", "bbox": {"l": 375.29871, "t": 530.21024, "r": 408.64902, "b": 534.47342, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 377.06747, "t": 534.75522, "r": 406.88312, "b": 539.01843, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "extract content", "bbox": {"l": 377.06747, "t": 534.75522, "r": 406.88312, "b": 539.01843, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 383.56683, "t": 563.24176, "r": 433.76544, "b": 567.50497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "Structure Tags sequence", "bbox": {"l": 383.56683, "t": 563.24176, "r": 433.76544, "b": 567.50497, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 383.52768, "t": 567.78676, "r": 433.80764999999997, "b": 572.04997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "provide full description of", "bbox": {"l": 383.52768, "t": 567.78676, "r": 433.80764999999997, "b": 572.04997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 390.47522, "t": 572.33177, "r": 426.85703, "b": 576.59499, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "the table structure", "bbox": {"l": 390.47522, "t": 572.33177, "r": 426.85703, "b": 576.59499, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 293.94702, "t": 577.89143, "r": 323.1691, "b": 582.15465, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "Structure Tags", "bbox": {"l": 293.94702, "t": 577.89143, "r": 323.1691, "b": 582.15465, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 293.94702, "t": 582.43648, "r": 324.59396, "b": 586.69969, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "in OTSL format", "bbox": {"l": 293.94702, "t": 582.43648, "r": 324.59396, "b": 586.69969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 333.07819, "t": 541.82269, "r": 364.14691, "b": 546.08591, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "BBoxes in sync", "bbox": {"l": 333.07819, "t": 541.82269, "r": 364.14691, "b": 546.08591, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 333.07819, "t": 545.6102, "r": 369.71542, "b": 549.87341, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "with tag sequence", "bbox": {"l": 333.07819, "t": 545.6102, "r": 369.71542, "b": 549.87341, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 232.65881000000002, "t": 515.24139, "r": 249.58894000000004, "b": 519.50458, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "Encoder", "bbox": {"l": 232.65881000000002, "t": 515.24139, "r": 249.58894000000004, "b": 519.50458, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 269.8219, "t": 545.97102, "r": 288.26279, "b": 550.23424, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "Structure", "bbox": {"l": 269.8219, "t": 545.97102, "r": 288.26279, "b": 550.23424, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 270.45187, "t": 549.75851, "r": 287.63242, "b": 554.0217299999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "Decoder", "bbox": {"l": 270.45187, "t": 549.75851, "r": 287.63242, "b": 554.0217299999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 332.17676, "t": 515.91205, "r": 358.11206, "b": 520.17523, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "[x1, y2, x2, y2]", "bbox": {"l": 332.17676, "t": 515.91205, "r": 358.11206, "b": 520.17523, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 332.17676, "t": 521.9720500000001, "r": 361.58298, "b": 526.23523, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "[x1', y2', x2', y2']", "bbox": {"l": 332.17676, "t": 521.9720500000001, "r": 361.58298, "b": 526.23523, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 332.17676, "t": 528.03204, "r": 364.76474, "b": 532.29523, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "[x1'', y2'', x2'', y2'']", "bbox": {"l": 332.17676, "t": 528.03204, "r": 364.76474, "b": 532.29523, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 332.17676, "t": 534.09204, "r": 335.96548, "b": 538.35524, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "...", "bbox": {"l": 332.17676, "t": 534.09204, "r": 335.96548, "b": 538.35524, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 326.8894, "t": 516.39508, "r": 329.41641, "b": 520.6582599999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "1", "bbox": {"l": 326.8894, "t": 516.39508, "r": 329.41641, "b": 520.6582599999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 327.04089, "t": 522.4247700000001, "r": 329.5679, "b": 526.68796, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "2", "bbox": {"l": 327.04089, "t": 522.4247700000001, "r": 329.5679, "b": 526.68796, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 327.04089, "t": 528.51508, "r": 329.5679, "b": 532.77826, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "3", "bbox": {"l": 327.04089, "t": 528.51508, "r": 329.5679, "b": 532.77826, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 424.14102, "t": 527.4428399999999, "r": 426.66803, "b": 531.7060200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "3", "bbox": {"l": 424.14102, "t": 527.4428399999999, "r": 426.66803, "b": 531.7060200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 453.0018, "t": 517.4539500000001, "r": 455.52881, "b": 521.71713, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "2", "bbox": {"l": 453.0018, "t": 517.4539500000001, "r": 455.52881, "b": 521.71713, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 423.85825, "t": 517.06281, "r": 426.38525, "b": 521.32599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "1", "bbox": {"l": 423.85825, "t": 517.06281, "r": 426.38525, "b": 521.32599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 333.4342, "t": 557.36679, "r": 337.27542, "b": 562.35719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "C", "bbox": {"l": 333.4342, "t": 557.36679, "r": 337.27542, "b": 562.35719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 340.35397, "t": 557.31679, "r": 344.19519, "b": 562.30719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "C", "bbox": {"l": 340.35397, "t": 557.31679, "r": 344.19519, "b": 562.30719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 340.30978, "t": 563.8653899999999, "r": 344.151, "b": 568.8557900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "C", "bbox": {"l": 340.30978, "t": 563.8653899999999, "r": 344.151, "b": 568.8557900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 346.79904, "t": 563.8686700000001, "r": 350.64026, "b": 568.85907, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "C", "bbox": {"l": 346.79904, "t": 563.8686700000001, "r": 350.64026, "b": 568.85907, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 333.59583, "t": 563.82271, "r": 337.43704, "b": 568.81311, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "C", "bbox": {"l": 333.59583, "t": 563.82271, "r": 337.43704, "b": 568.81311, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 340.37543, "t": 570.42673, "r": 344.21664, "b": 575.41713, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "C", "bbox": {"l": 340.37543, "t": 570.42673, "r": 344.21664, "b": 575.41713, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 346.86469, "t": 570.43001, "r": 350.7059, "b": 575.42041, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "C", "bbox": {"l": 346.86469, "t": 570.43001, "r": 350.7059, "b": 575.42041, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 333.66144, "t": 570.38405, "r": 337.50266, "b": 575.37445, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "C", "bbox": {"l": 333.66144, "t": 570.38405, "r": 337.50266, "b": 575.37445, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 340.37671, "t": 577.02606, "r": 344.21793, "b": 582.0164599999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "C", "bbox": {"l": 340.37671, "t": 577.02606, "r": 344.21793, "b": 582.0164599999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 346.86597, "t": 577.02934, "r": 350.70718, "b": 582.01974, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "C", "bbox": {"l": 346.86597, "t": 577.02934, "r": 350.70718, "b": 582.01974, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 333.66272, "t": 576.98338, "r": 337.50394, "b": 581.97379, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "C", "bbox": {"l": 333.66272, "t": 576.98338, "r": 337.50394, "b": 581.97379, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 340.27948, "t": 583.39737, "r": 344.1207, "b": 588.38777, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "C", "bbox": {"l": 340.27948, "t": 583.39737, "r": 344.1207, "b": 588.38777, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 346.76874, "t": 583.40068, "r": 350.60995, "b": 588.39108, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "C", "bbox": {"l": 346.76874, "t": 583.40068, "r": 350.60995, "b": 588.39108, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 333.56549, "t": 583.35474, "r": 337.40671, "b": 588.34514, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "C", "bbox": {"l": 333.56549, "t": 583.35474, "r": 337.40671, "b": 588.34514, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 353.03326, "t": 556.8831299999999, "r": 359.83362, "b": 561.87354, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "NL", "bbox": {"l": 353.03326, "t": 556.8831299999999, "r": 359.83362, "b": 561.87354, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 353.18604, "t": 563.58044, "r": 359.98639, "b": 568.57085, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "NL", "bbox": {"l": 353.18604, "t": 563.58044, "r": 359.98639, "b": 568.57085, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 353.19864, "t": 570.1623500000001, "r": 359.99899, "b": 575.15276, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "NL", "bbox": {"l": 353.19864, "t": 570.1623500000001, "r": 359.99899, "b": 575.15276, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 353.1532, "t": 576.76611, "r": 359.95355, "b": 581.75652, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "NL", "bbox": {"l": 353.1532, "t": 576.76611, "r": 359.95355, "b": 581.75652, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 353.26935, "t": 583.40628, "r": 360.0697, "b": 588.3966800000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "NL", "bbox": {"l": 353.26935, "t": 583.40628, "r": 360.0697, "b": 588.3966800000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 347.37979, "t": 557.08235, "r": 350.33786, "b": 562.07275, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "L", "bbox": {"l": 347.37979, "t": 557.08235, "r": 350.33786, "b": 562.07275, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 331.14026, "t": 564.2907700000001, "r": 333.66727, "b": 568.55399, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "3", "bbox": {"l": 331.14026, "t": 564.2907700000001, "r": 333.66727, "b": 568.55399, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 340.80972, "t": 554.59312, "r": 343.33673, "b": 558.85634, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": "2", "bbox": {"l": 340.80972, "t": 554.59312, "r": 343.33673, "b": 558.85634, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 330.97992, "t": 554.83035, "r": 333.50693, "b": 559.09357, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "1", "bbox": {"l": 330.97992, "t": 554.83035, "r": 333.50693, "b": 559.09357, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "text", "id": 4, "page_no": 7, "cluster": {"id": 4, "label": "text", "bbox": {"l": 134.765, "t": 620.19278, "r": 480.5917400000001, "b": 664.8547599999999, "coord_origin": "TOPLEFT"}, "confidence": 0.951270341873169, "cells": [{"id": 105, "text": "We rely on standard metrics such as Tree Edit Distance score (TEDs) for", "bbox": {"l": 149.709, "t": 620.19278, "r": 480.58792, "b": 628.98975, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "table structure prediction, and Mean Average Precision (mAP) with 0.75 Inter-", "bbox": {"l": 134.765, "t": 632.14778, "r": 480.58871, "b": 640.94475, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "section Over Union (IOU) threshold for the bounding-box predictions of table", "bbox": {"l": 134.765, "t": 644.1027799999999, "r": 480.5917400000001, "b": 652.89975, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "cells. The predicted OTSL structures were converted back to HTML format in", "bbox": {"l": 134.765, "t": 656.0577900000001, "r": 480.58968999999996, "b": 664.8547599999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "We rely on standard metrics such as Tree Edit Distance score (TEDs) for table structure prediction, and Mean Average Precision (mAP) with 0.75 Intersection Over Union (IOU) threshold for the bounding-box predictions of table cells. The predicted OTSL structures were converted back to HTML format in"}], "headers": [{"label": "page_header", "id": 9, "page_no": 7, "cluster": {"id": 9, "label": "page_header", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8301323056221008, "cells": [{"id": 0, "text": "8", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "8"}, {"label": "page_header", "id": 8, "page_no": 7, "cluster": {"id": 8, "label": "page_header", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8631826043128967, "cells": [{"id": 1, "text": "M.", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 178.07675, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37415, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "M. Lysak, et al."}]}}, {"page_no": 8, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "9", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "order to compute the TED score. Inference timing results for all experiments", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.5936899999999, "b": 127.73077, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "were obtained from the same machine on a single core with AMD EPYC 7763", "bbox": {"l": 134.765, "t": 130.88878999999997, "r": 480.59579, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "CPU @2.45 GHz.", "bbox": {"l": 134.765, "t": 142.84479, "r": 210.78462, "b": 151.64178000000004, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "5.1", "bbox": {"l": 134.765, "t": 169.18584999999996, "r": 149.40205, "b": 177.9928, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Hyper Parameter Optimization", "bbox": {"l": 160.85904, "t": 169.18584999999996, "r": 318.44843, "b": 177.9928, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "We have chosen the PubTabNet data set to perform HPO, since it includes a", "bbox": {"l": 134.765, "t": 185.58582, "r": 480.59183, "b": 194.38280999999995, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "highly diverse set of tables. Also we report TED scores separately for simple and", "bbox": {"l": 134.765, "t": 197.54083000000003, "r": 480.59183, "b": 206.33783000000005, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "complex tables (tables with cell spans). Results are presented in Table. 1. It is", "bbox": {"l": 134.765, "t": 209.49585000000002, "r": 480.59177000000005, "b": 218.29285000000004, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "evident that with OTSL, our model achieves the same TED score and slightly", "bbox": {"l": 134.765, "t": 221.45087, "r": 480.59277, "b": 230.24785999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "better mAP scores in comparison to HTML. However OTSL yields a", "bbox": {"l": 134.765, "t": 233.40588000000002, "r": 440.94159, "b": 242.20288000000005, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "2x speed", "bbox": {"l": 444.86798, "t": 233.40588000000002, "r": 480.58786000000003, "b": 242.20288000000005, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "up", "bbox": {"l": 134.76498, "t": 245.36188000000004, "r": 145.20081, "b": 254.15886999999998, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "in the inference runtime over HTML.", "bbox": {"l": 149.14899, "t": 245.36188000000004, "r": 311.21957, "b": 254.15886999999998, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Table", "bbox": {"l": 134.76498, "t": 275.07232999999997, "r": 160.11836, "b": 282.9986, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "1.", "bbox": {"l": 167.34528, "t": 275.07232999999997, "r": 175.59526, "b": 282.9986, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "HPO performed in OTSL and HTML representation on the same", "bbox": {"l": 188.13298, "t": 275.13507000000004, "r": 480.59365999999994, "b": 283.2048300000001, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "transformer-based TableFormer [9] architecture, trained only on PubTabNet [22]. Ef-", "bbox": {"l": 134.76498, "t": 286.09409, "r": 480.59444999999994, "b": 294.16385, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "fects of reducing the # of layers in encoder and decoder stages of the model show that", "bbox": {"l": 134.76498, "t": 297.05307, "r": 480.5954, "b": 305.12283, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "smaller models trained on OTSL perform better, especially in recognizing complex", "bbox": {"l": 134.76498, "t": 308.01205, "r": 480.59451, "b": 316.08182, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "table structures, and maintain a much higher mAP score than the HTML counterpart.", "bbox": {"l": 134.76498, "t": 318.97104, "r": 480.59441999999996, "b": 327.0408, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "#", "bbox": {"l": 160.37, "t": 341.73495, "r": 168.04793, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "enc-layers", "bbox": {"l": 144.592, "t": 354.68594, "r": 183.82806, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "#", "bbox": {"l": 207.974, "t": 341.73495, "r": 215.65193, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "dec-layers", "bbox": {"l": 192.19499, "t": 354.68594, "r": 231.43106, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "Language", "bbox": {"l": 239.79799999999997, "t": 347.21396, "r": 278.31766, "b": 355.28372, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "TEDs", "bbox": {"l": 324.67001, "t": 341.73495, "r": 348.26419, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "mAP", "bbox": {"l": 396.271, "t": 341.73495, "r": 417.12683, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "(0.75)", "bbox": {"l": 394.927, "t": 352.69394000000005, "r": 418.47278, "b": 360.7637, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Inference", "bbox": {"l": 430.771, "t": 341.73495, "r": 467.1423, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "time (secs)", "bbox": {"l": 427.14801, "t": 352.69394000000005, "r": 470.76056, "b": 360.7637, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "simple", "bbox": {"l": 286.686, "t": 354.68594, "r": 312.33261, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "complex", "bbox": {"l": 320.702, "t": 354.68594, "r": 353.71988, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "all", "bbox": {"l": 369.306, "t": 354.68594, "r": 379.03094, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "6", "bbox": {"l": 161.90601, "t": 373.51596, "r": 166.51294, "b": 381.58572, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "6", "bbox": {"l": 209.509, "t": 373.51596, "r": 214.11594, "b": 381.58572, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 368.03595, "r": 271.40527, "b": 376.10571, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "0.965", "bbox": {"l": 289.017, "t": 368.03595, "r": 310.00375, "b": 376.10571, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "0.934", "bbox": {"l": 326.71701, "t": 368.03595, "r": 347.70377, "b": 376.10571, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "0.955", "bbox": {"l": 363.67599, "t": 368.03595, "r": 384.66275, "b": 376.10571, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "0.88", "bbox": {"l": 397.26999, "t": 367.97317999999996, "r": 416.12723, "b": 375.89948, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "2.73", "bbox": {"l": 439.52701, "t": 367.97317999999996, "r": 458.38425, "b": 375.89948, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 380.98795, "r": 272.93954, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "0.969", "bbox": {"l": 289.017, "t": 380.98795, "r": 310.00375, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "0.927", "bbox": {"l": 326.71701, "t": 380.98795, "r": 347.70377, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "0.955", "bbox": {"l": 363.67599, "t": 380.98795, "r": 384.66275, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "0.857", "bbox": {"l": 396.20599, "t": 380.98795, "r": 417.19275, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "5.39", "bbox": {"l": 440.767, "t": 380.98795, "r": 457.14682, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "4", "bbox": {"l": 161.90601, "t": 399.81696, "r": 166.51294, "b": 407.88672, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "4", "bbox": {"l": 209.509, "t": 399.81696, "r": 214.11594, "b": 407.88672, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 394.33795, "r": 271.40527, "b": 402.40771, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "0.938", "bbox": {"l": 289.017, "t": 394.33795, "r": 310.00375, "b": 402.40771, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "0.904", "bbox": {"l": 326.71701, "t": 394.33795, "r": 347.70377, "b": 402.40771, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "0.927", "bbox": {"l": 363.67599, "t": 394.33795, "r": 384.66275, "b": 402.40771, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "0.853", "bbox": {"l": 394.61801, "t": 394.27518, "r": 418.77887, "b": 402.20148, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "1.97", "bbox": {"l": 439.52701, "t": 394.27518, "r": 458.38425, "b": 402.20148, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 407.28894, "r": 272.93954, "b": 415.3587, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "0.952", "bbox": {"l": 289.017, "t": 407.28894, "r": 310.00375, "b": 415.3587, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "0.909", "bbox": {"l": 326.71701, "t": 407.28894, "r": 347.70377, "b": 415.3587, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "0.938", "bbox": {"l": 362.08801, "t": 407.22617, "r": 386.24887, "b": 415.15247, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "0.843", "bbox": {"l": 396.20599, "t": 407.28894, "r": 417.19275, "b": 415.3587, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "3.77", "bbox": {"l": 440.767, "t": 407.28894, "r": 457.14682, "b": 415.3587, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "2", "bbox": {"l": 161.90601, "t": 426.11795, "r": 166.51294, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "4", "bbox": {"l": 209.509, "t": 426.11795, "r": 214.11594, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 420.63895, "r": 271.40527, "b": 428.70871, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "0.923", "bbox": {"l": 289.017, "t": 420.63895, "r": 310.00375, "b": 428.70871, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "0.897", "bbox": {"l": 326.71701, "t": 420.63895, "r": 347.70377, "b": 428.70871, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "0.915", "bbox": {"l": 363.67599, "t": 420.63895, "r": 384.66275, "b": 428.70871, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "0.859", "bbox": {"l": 394.61801, "t": 420.57617, "r": 418.77887, "b": 428.50247, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "1.91", "bbox": {"l": 439.52701, "t": 420.57617, "r": 458.38425, "b": 428.50247, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 433.58994, "r": 272.93954, "b": 441.6597, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "0.945", "bbox": {"l": 289.017, "t": 433.58994, "r": 310.00375, "b": 441.6597, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "0.901", "bbox": {"l": 326.71701, "t": 433.58994, "r": 347.70377, "b": 441.6597, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "0.931", "bbox": {"l": 362.08801, "t": 433.5271599999999, "r": 386.24887, "b": 441.45346, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "0.834", "bbox": {"l": 396.20599, "t": 433.58994, "r": 417.19275, "b": 441.6597, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "3.81", "bbox": {"l": 440.767, "t": 433.58994, "r": 457.14682, "b": 441.6597, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "4", "bbox": {"l": 161.90601, "t": 452.41995, "r": 166.51294, "b": 460.48972, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "2", "bbox": {"l": 209.509, "t": 452.41995, "r": 214.11594, "b": 460.48972, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 446.9399399999999, "r": 271.40527, "b": 455.0097, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "0.952", "bbox": {"l": 289.017, "t": 446.9399399999999, "r": 310.00375, "b": 455.0097, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "0.92", "bbox": {"l": 329.021, "t": 446.9399399999999, "r": 345.40082, "b": 455.0097, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "0.942", "bbox": {"l": 362.08801, "t": 446.87717, "r": 386.24887, "b": 454.80347, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "0.857", "bbox": {"l": 394.61801, "t": 446.87717, "r": 418.77887, "b": 454.80347, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "1.22", "bbox": {"l": 439.52701, "t": 446.87717, "r": 458.38425, "b": 454.80347, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 459.8919399999999, "r": 272.93954, "b": 467.9617, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "0.944", "bbox": {"l": 289.017, "t": 459.8919399999999, "r": 310.00375, "b": 467.9617, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "0.903", "bbox": {"l": 326.71701, "t": 459.8919399999999, "r": 347.70377, "b": 467.9617, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "0.931", "bbox": {"l": 363.67599, "t": 459.8919399999999, "r": 384.66275, "b": 467.9617, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "0.824", "bbox": {"l": 396.20599, "t": 459.8919399999999, "r": 417.19275, "b": 467.9617, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "2", "bbox": {"l": 446.65302, "t": 459.8919399999999, "r": 451.25995, "b": 467.9617, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "5.2", "bbox": {"l": 134.765, "t": 508.15179, "r": 149.40205, "b": 516.95874, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Quantitative Results", "bbox": {"l": 160.85904, "t": 508.15179, "r": 264.40332, "b": 516.95874, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "We picked the model parameter configuration that produced the best prediction", "bbox": {"l": 134.765, "t": 524.55078, "r": 480.59075999999993, "b": 533.34775, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "quality (enc=6, dec=6, heads=8) with PubTabNet alone, then independently", "bbox": {"l": 134.765, "t": 536.50677, "r": 480.58675999999997, "b": 545.3037400000001, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "trained and evaluated it on three publicly available data sets: PubTabNet (395k", "bbox": {"l": 134.765, "t": 548.4617800000001, "r": 480.59572999999995, "b": 557.25874, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "samples), FinTabNet (113k samples) and PubTables-1M (about 1M samples).", "bbox": {"l": 134.765, "t": 560.41678, "r": 480.59177000000005, "b": 569.21375, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "Performance results are presented in Table. 2. It is clearly evident that the model", "bbox": {"l": 134.765, "t": 572.37178, "r": 480.59069999999997, "b": 581.16875, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "trained on OTSL outperforms HTML across the board, keeping high TEDs and", "bbox": {"l": 134.765, "t": 584.32678, "r": 480.5957599999999, "b": 593.12375, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "mAP scores even on difficult financial tables (FinTabNet) that contain sparse", "bbox": {"l": 134.765, "t": 596.28278, "r": 480.58774, "b": 605.07974, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "and large tables.", "bbox": {"l": 134.765, "t": 608.2377799999999, "r": 206.78664, "b": 617.03474, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "Additionally, the results show that OTSL has an advantage over HTML", "bbox": {"l": 149.709, "t": 620.19278, "r": 480.59271, "b": 628.98975, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "when applied on a bigger data set like PubTables-1M and achieves significantly", "bbox": {"l": 134.765, "t": 632.14778, "r": 480.5957599999999, "b": 640.94475, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "improved scores. Finally, OTSL achieves faster inference due to fewer decoding", "bbox": {"l": 134.765, "t": 644.1027799999999, "r": 480.59283000000005, "b": 652.89975, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "steps which is a result of the reduced sequence representation.", "bbox": {"l": 134.765, "t": 656.0577900000001, "r": 405.79651, "b": 664.8547599999999, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 8, "label": "page_header", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9373378753662109, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "page_header", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8857625722885132, "cells": [{"id": 1, "text": "9", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "text", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.59579, "b": 151.64178000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9805440306663513, "cells": [{"id": 2, "text": "order to compute the TED score. Inference timing results for all experiments", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.5936899999999, "b": 127.73077, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "were obtained from the same machine on a single core with AMD EPYC 7763", "bbox": {"l": 134.765, "t": 130.88878999999997, "r": 480.59579, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "CPU @2.45 GHz.", "bbox": {"l": 134.765, "t": 142.84479, "r": 210.78462, "b": 151.64178000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "section_header", "bbox": {"l": 134.765, "t": 169.18584999999996, "r": 318.44843, "b": 177.9928, "coord_origin": "TOPLEFT"}, "confidence": 0.9579681158065796, "cells": [{"id": 5, "text": "5.1", "bbox": {"l": 134.765, "t": 169.18584999999996, "r": 149.40205, "b": 177.9928, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Hyper Parameter Optimization", "bbox": {"l": 160.85904, "t": 169.18584999999996, "r": 318.44843, "b": 177.9928, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 134.76498, "t": 185.58582, "r": 480.59277, "b": 254.15886999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.9842326641082764, "cells": [{"id": 7, "text": "We have chosen the PubTabNet data set to perform HPO, since it includes a", "bbox": {"l": 134.765, "t": 185.58582, "r": 480.59183, "b": 194.38280999999995, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "highly diverse set of tables. Also we report TED scores separately for simple and", "bbox": {"l": 134.765, "t": 197.54083000000003, "r": 480.59183, "b": 206.33783000000005, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "complex tables (tables with cell spans). Results are presented in Table. 1. It is", "bbox": {"l": 134.765, "t": 209.49585000000002, "r": 480.59177000000005, "b": 218.29285000000004, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "evident that with OTSL, our model achieves the same TED score and slightly", "bbox": {"l": 134.765, "t": 221.45087, "r": 480.59277, "b": 230.24785999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "better mAP scores in comparison to HTML. However OTSL yields a", "bbox": {"l": 134.765, "t": 233.40588000000002, "r": 440.94159, "b": 242.20288000000005, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "2x speed", "bbox": {"l": 444.86798, "t": 233.40588000000002, "r": 480.58786000000003, "b": 242.20288000000005, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "up", "bbox": {"l": 134.76498, "t": 245.36188000000004, "r": 145.20081, "b": 254.15886999999998, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "in the inference runtime over HTML.", "bbox": {"l": 149.14899, "t": 245.36188000000004, "r": 311.21957, "b": 254.15886999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "caption", "bbox": {"l": 134.76498, "t": 275.07232999999997, "r": 480.5954, "b": 327.0408, "coord_origin": "TOPLEFT"}, "confidence": 0.9570781588554382, "cells": [{"id": 15, "text": "Table", "bbox": {"l": 134.76498, "t": 275.07232999999997, "r": 160.11836, "b": 282.9986, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "1.", "bbox": {"l": 167.34528, "t": 275.07232999999997, "r": 175.59526, "b": 282.9986, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "HPO performed in OTSL and HTML representation on the same", "bbox": {"l": 188.13298, "t": 275.13507000000004, "r": 480.59365999999994, "b": 283.2048300000001, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "transformer-based TableFormer [9] architecture, trained only on PubTabNet [22]. Ef-", "bbox": {"l": 134.76498, "t": 286.09409, "r": 480.59444999999994, "b": 294.16385, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "fects of reducing the # of layers in encoder and decoder stages of the model show that", "bbox": {"l": 134.76498, "t": 297.05307, "r": 480.5954, "b": 305.12283, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "smaller models trained on OTSL perform better, especially in recognizing complex", "bbox": {"l": 134.76498, "t": 308.01205, "r": 480.59451, "b": 316.08182, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "table structures, and maintain a much higher mAP score than the HTML counterpart.", "bbox": {"l": 134.76498, "t": 318.97104, "r": 480.59441999999996, "b": 327.0408, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "table", "bbox": {"l": 139.66845703125, "t": 337.5747985839844, "r": 475.00372314453125, "b": 469.4721374511719, "coord_origin": "TOPLEFT"}, "confidence": 0.9901032447814941, "cells": [{"id": 22, "text": "#", "bbox": {"l": 160.37, "t": 341.73495, "r": 168.04793, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "enc-layers", "bbox": {"l": 144.592, "t": 354.68594, "r": 183.82806, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "#", "bbox": {"l": 207.974, "t": 341.73495, "r": 215.65193, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "dec-layers", "bbox": {"l": 192.19499, "t": 354.68594, "r": 231.43106, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "Language", "bbox": {"l": 239.79799999999997, "t": 347.21396, "r": 278.31766, "b": 355.28372, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "TEDs", "bbox": {"l": 324.67001, "t": 341.73495, "r": 348.26419, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "mAP", "bbox": {"l": 396.271, "t": 341.73495, "r": 417.12683, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "(0.75)", "bbox": {"l": 394.927, "t": 352.69394000000005, "r": 418.47278, "b": 360.7637, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Inference", "bbox": {"l": 430.771, "t": 341.73495, "r": 467.1423, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "time (secs)", "bbox": {"l": 427.14801, "t": 352.69394000000005, "r": 470.76056, "b": 360.7637, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "simple", "bbox": {"l": 286.686, "t": 354.68594, "r": 312.33261, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "complex", "bbox": {"l": 320.702, "t": 354.68594, "r": 353.71988, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "all", "bbox": {"l": 369.306, "t": 354.68594, "r": 379.03094, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "6", "bbox": {"l": 161.90601, "t": 373.51596, "r": 166.51294, "b": 381.58572, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "6", "bbox": {"l": 209.509, "t": 373.51596, "r": 214.11594, "b": 381.58572, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 368.03595, "r": 271.40527, "b": 376.10571, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "0.965", "bbox": {"l": 289.017, "t": 368.03595, "r": 310.00375, "b": 376.10571, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "0.934", "bbox": {"l": 326.71701, "t": 368.03595, "r": 347.70377, "b": 376.10571, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "0.955", "bbox": {"l": 363.67599, "t": 368.03595, "r": 384.66275, "b": 376.10571, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "0.88", "bbox": {"l": 397.26999, "t": 367.97317999999996, "r": 416.12723, "b": 375.89948, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "2.73", "bbox": {"l": 439.52701, "t": 367.97317999999996, "r": 458.38425, "b": 375.89948, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 380.98795, "r": 272.93954, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "0.969", "bbox": {"l": 289.017, "t": 380.98795, "r": 310.00375, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "0.927", "bbox": {"l": 326.71701, "t": 380.98795, "r": 347.70377, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "0.955", "bbox": {"l": 363.67599, "t": 380.98795, "r": 384.66275, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "0.857", "bbox": {"l": 396.20599, "t": 380.98795, "r": 417.19275, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "5.39", "bbox": {"l": 440.767, "t": 380.98795, "r": 457.14682, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "4", "bbox": {"l": 161.90601, "t": 399.81696, "r": 166.51294, "b": 407.88672, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "4", "bbox": {"l": 209.509, "t": 399.81696, "r": 214.11594, "b": 407.88672, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 394.33795, "r": 271.40527, "b": 402.40771, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "0.938", "bbox": {"l": 289.017, "t": 394.33795, "r": 310.00375, "b": 402.40771, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "0.904", "bbox": {"l": 326.71701, "t": 394.33795, "r": 347.70377, "b": 402.40771, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "0.927", "bbox": {"l": 363.67599, "t": 394.33795, "r": 384.66275, "b": 402.40771, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "0.853", "bbox": {"l": 394.61801, "t": 394.27518, "r": 418.77887, "b": 402.20148, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "1.97", "bbox": {"l": 439.52701, "t": 394.27518, "r": 458.38425, "b": 402.20148, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 407.28894, "r": 272.93954, "b": 415.3587, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "0.952", "bbox": {"l": 289.017, "t": 407.28894, "r": 310.00375, "b": 415.3587, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "0.909", "bbox": {"l": 326.71701, "t": 407.28894, "r": 347.70377, "b": 415.3587, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "0.938", "bbox": {"l": 362.08801, "t": 407.22617, "r": 386.24887, "b": 415.15247, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "0.843", "bbox": {"l": 396.20599, "t": 407.28894, "r": 417.19275, "b": 415.3587, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "3.77", "bbox": {"l": 440.767, "t": 407.28894, "r": 457.14682, "b": 415.3587, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "2", "bbox": {"l": 161.90601, "t": 426.11795, "r": 166.51294, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "4", "bbox": {"l": 209.509, "t": 426.11795, "r": 214.11594, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 420.63895, "r": 271.40527, "b": 428.70871, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "0.923", "bbox": {"l": 289.017, "t": 420.63895, "r": 310.00375, "b": 428.70871, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "0.897", "bbox": {"l": 326.71701, "t": 420.63895, "r": 347.70377, "b": 428.70871, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "0.915", "bbox": {"l": 363.67599, "t": 420.63895, "r": 384.66275, "b": 428.70871, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "0.859", "bbox": {"l": 394.61801, "t": 420.57617, "r": 418.77887, "b": 428.50247, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "1.91", "bbox": {"l": 439.52701, "t": 420.57617, "r": 458.38425, "b": 428.50247, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 433.58994, "r": 272.93954, "b": 441.6597, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "0.945", "bbox": {"l": 289.017, "t": 433.58994, "r": 310.00375, "b": 441.6597, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "0.901", "bbox": {"l": 326.71701, "t": 433.58994, "r": 347.70377, "b": 441.6597, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "0.931", "bbox": {"l": 362.08801, "t": 433.5271599999999, "r": 386.24887, "b": 441.45346, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "0.834", "bbox": {"l": 396.20599, "t": 433.58994, "r": 417.19275, "b": 441.6597, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "3.81", "bbox": {"l": 440.767, "t": 433.58994, "r": 457.14682, "b": 441.6597, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "4", "bbox": {"l": 161.90601, "t": 452.41995, "r": 166.51294, "b": 460.48972, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "2", "bbox": {"l": 209.509, "t": 452.41995, "r": 214.11594, "b": 460.48972, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 446.9399399999999, "r": 271.40527, "b": 455.0097, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "0.952", "bbox": {"l": 289.017, "t": 446.9399399999999, "r": 310.00375, "b": 455.0097, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "0.92", "bbox": {"l": 329.021, "t": 446.9399399999999, "r": 345.40082, "b": 455.0097, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "0.942", "bbox": {"l": 362.08801, "t": 446.87717, "r": 386.24887, "b": 454.80347, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "0.857", "bbox": {"l": 394.61801, "t": 446.87717, "r": 418.77887, "b": 454.80347, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "1.22", "bbox": {"l": 439.52701, "t": 446.87717, "r": 458.38425, "b": 454.80347, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 459.8919399999999, "r": 272.93954, "b": 467.9617, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "0.944", "bbox": {"l": 289.017, "t": 459.8919399999999, "r": 310.00375, "b": 467.9617, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "0.903", "bbox": {"l": 326.71701, "t": 459.8919399999999, "r": 347.70377, "b": 467.9617, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "0.931", "bbox": {"l": 363.67599, "t": 459.8919399999999, "r": 384.66275, "b": 467.9617, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "0.824", "bbox": {"l": 396.20599, "t": 459.8919399999999, "r": 417.19275, "b": 467.9617, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "2", "bbox": {"l": 446.65302, "t": 459.8919399999999, "r": 451.25995, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": [{"id": 10, "label": "text", "bbox": {"l": 160.37, "t": 341.73495, "r": 168.04793, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "#", "bbox": {"l": 160.37, "t": 341.73495, "r": 168.04793, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 144.592, "t": 354.68594, "r": 183.82806, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "enc-layers", "bbox": {"l": 144.592, "t": 354.68594, "r": 183.82806, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 207.974, "t": 341.73495, "r": 215.65193, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "#", "bbox": {"l": 207.974, "t": 341.73495, "r": 215.65193, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 192.19499, "t": 354.68594, "r": 231.43106, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "dec-layers", "bbox": {"l": 192.19499, "t": 354.68594, "r": 231.43106, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 239.79799999999997, "t": 347.21396, "r": 278.31766, "b": 355.28372, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "Language", "bbox": {"l": 239.79799999999997, "t": 347.21396, "r": 278.31766, "b": 355.28372, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 324.67001, "t": 341.73495, "r": 348.26419, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "TEDs", "bbox": {"l": 324.67001, "t": 341.73495, "r": 348.26419, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 396.271, "t": 341.73495, "r": 417.12683, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "mAP", "bbox": {"l": 396.271, "t": 341.73495, "r": 417.12683, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 394.927, "t": 352.69394000000005, "r": 418.47278, "b": 360.7637, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "(0.75)", "bbox": {"l": 394.927, "t": 352.69394000000005, "r": 418.47278, "b": 360.7637, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 430.771, "t": 341.73495, "r": 467.1423, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "Inference", "bbox": {"l": 430.771, "t": 341.73495, "r": 467.1423, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 427.14801, "t": 352.69394000000005, "r": 470.76056, "b": 360.7637, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "time (secs)", "bbox": {"l": 427.14801, "t": 352.69394000000005, "r": 470.76056, "b": 360.7637, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 286.686, "t": 354.68594, "r": 312.33261, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "simple", "bbox": {"l": 286.686, "t": 354.68594, "r": 312.33261, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 320.702, "t": 354.68594, "r": 353.71988, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "complex", "bbox": {"l": 320.702, "t": 354.68594, "r": 353.71988, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 369.306, "t": 354.68594, "r": 379.03094, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "all", "bbox": {"l": 369.306, "t": 354.68594, "r": 379.03094, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 161.90601, "t": 373.51596, "r": 166.51294, "b": 381.58572, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "6", "bbox": {"l": 161.90601, "t": 373.51596, "r": 166.51294, "b": 381.58572, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 209.509, "t": 373.51596, "r": 214.11594, "b": 381.58572, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "6", "bbox": {"l": 209.509, "t": 373.51596, "r": 214.11594, "b": 381.58572, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 246.71000999999998, "t": 368.03595, "r": 271.40527, "b": 376.10571, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 368.03595, "r": 271.40527, "b": 376.10571, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 289.017, "t": 368.03595, "r": 310.00375, "b": 376.10571, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "0.965", "bbox": {"l": 289.017, "t": 368.03595, "r": 310.00375, "b": 376.10571, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 326.71701, "t": 368.03595, "r": 347.70377, "b": 376.10571, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "0.934", "bbox": {"l": 326.71701, "t": 368.03595, "r": 347.70377, "b": 376.10571, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 363.67599, "t": 368.03595, "r": 384.66275, "b": 376.10571, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "0.955", "bbox": {"l": 363.67599, "t": 368.03595, "r": 384.66275, "b": 376.10571, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 397.26999, "t": 367.97317999999996, "r": 416.12723, "b": 375.89948, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "0.88", "bbox": {"l": 397.26999, "t": 367.97317999999996, "r": 416.12723, "b": 375.89948, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 439.52701, "t": 367.97317999999996, "r": 458.38425, "b": 375.89948, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "2.73", "bbox": {"l": 439.52701, "t": 367.97317999999996, "r": 458.38425, "b": 375.89948, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 245.17598999999998, "t": 380.98795, "r": 272.93954, "b": 389.05771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 380.98795, "r": 272.93954, "b": 389.05771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 289.017, "t": 380.98795, "r": 310.00375, "b": 389.05771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "0.969", "bbox": {"l": 289.017, "t": 380.98795, "r": 310.00375, "b": 389.05771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 326.71701, "t": 380.98795, "r": 347.70377, "b": 389.05771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "0.927", "bbox": {"l": 326.71701, "t": 380.98795, "r": 347.70377, "b": 389.05771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 363.67599, "t": 380.98795, "r": 384.66275, "b": 389.05771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "0.955", "bbox": {"l": 363.67599, "t": 380.98795, "r": 384.66275, "b": 389.05771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 396.20599, "t": 380.98795, "r": 417.19275, "b": 389.05771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "0.857", "bbox": {"l": 396.20599, "t": 380.98795, "r": 417.19275, "b": 389.05771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 440.767, "t": 380.98795, "r": 457.14682, "b": 389.05771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "5.39", "bbox": {"l": 440.767, "t": 380.98795, "r": 457.14682, "b": 389.05771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 161.90601, "t": 399.81696, "r": 166.51294, "b": 407.88672, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "4", "bbox": {"l": 161.90601, "t": 399.81696, "r": 166.51294, "b": 407.88672, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 209.509, "t": 399.81696, "r": 214.11594, "b": 407.88672, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "4", "bbox": {"l": 209.509, "t": 399.81696, "r": 214.11594, "b": 407.88672, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 246.71000999999998, "t": 394.33795, "r": 271.40527, "b": 402.40771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 394.33795, "r": 271.40527, "b": 402.40771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 289.017, "t": 394.33795, "r": 310.00375, "b": 402.40771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "0.938", "bbox": {"l": 289.017, "t": 394.33795, "r": 310.00375, "b": 402.40771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 326.71701, "t": 394.33795, "r": 347.70377, "b": 402.40771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "0.904", "bbox": {"l": 326.71701, "t": 394.33795, "r": 347.70377, "b": 402.40771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 363.67599, "t": 394.33795, "r": 384.66275, "b": 402.40771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "0.927", "bbox": {"l": 363.67599, "t": 394.33795, "r": 384.66275, "b": 402.40771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 394.61801, "t": 394.27518, "r": 418.77887, "b": 402.20148, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "0.853", "bbox": {"l": 394.61801, "t": 394.27518, "r": 418.77887, "b": 402.20148, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 439.52701, "t": 394.27518, "r": 458.38425, "b": 402.20148, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "1.97", "bbox": {"l": 439.52701, "t": 394.27518, "r": 458.38425, "b": 402.20148, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 245.17598999999998, "t": 407.28894, "r": 272.93954, "b": 415.3587, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 407.28894, "r": 272.93954, "b": 415.3587, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 289.017, "t": 407.28894, "r": 310.00375, "b": 415.3587, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "0.952", "bbox": {"l": 289.017, "t": 407.28894, "r": 310.00375, "b": 415.3587, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 326.71701, "t": 407.28894, "r": 347.70377, "b": 415.3587, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "0.909", "bbox": {"l": 326.71701, "t": 407.28894, "r": 347.70377, "b": 415.3587, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 362.08801, "t": 407.22617, "r": 386.24887, "b": 415.15247, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "0.938", "bbox": {"l": 362.08801, "t": 407.22617, "r": 386.24887, "b": 415.15247, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 396.20599, "t": 407.28894, "r": 417.19275, "b": 415.3587, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "0.843", "bbox": {"l": 396.20599, "t": 407.28894, "r": 417.19275, "b": 415.3587, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 440.767, "t": 407.28894, "r": 457.14682, "b": 415.3587, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "3.77", "bbox": {"l": 440.767, "t": 407.28894, "r": 457.14682, "b": 415.3587, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 161.90601, "t": 426.11795, "r": 166.51294, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "2", "bbox": {"l": 161.90601, "t": 426.11795, "r": 166.51294, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 209.509, "t": 426.11795, "r": 214.11594, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "4", "bbox": {"l": 209.509, "t": 426.11795, "r": 214.11594, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 246.71000999999998, "t": 420.63895, "r": 271.40527, "b": 428.70871, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 420.63895, "r": 271.40527, "b": 428.70871, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 289.017, "t": 420.63895, "r": 310.00375, "b": 428.70871, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "0.923", "bbox": {"l": 289.017, "t": 420.63895, "r": 310.00375, "b": 428.70871, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 326.71701, "t": 420.63895, "r": 347.70377, "b": 428.70871, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "0.897", "bbox": {"l": 326.71701, "t": 420.63895, "r": 347.70377, "b": 428.70871, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 363.67599, "t": 420.63895, "r": 384.66275, "b": 428.70871, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "0.915", "bbox": {"l": 363.67599, "t": 420.63895, "r": 384.66275, "b": 428.70871, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 394.61801, "t": 420.57617, "r": 418.77887, "b": 428.50247, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "0.859", "bbox": {"l": 394.61801, "t": 420.57617, "r": 418.77887, "b": 428.50247, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 439.52701, "t": 420.57617, "r": 458.38425, "b": 428.50247, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "1.91", "bbox": {"l": 439.52701, "t": 420.57617, "r": 458.38425, "b": 428.50247, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 245.17598999999998, "t": 433.58994, "r": 272.93954, "b": 441.6597, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 433.58994, "r": 272.93954, "b": 441.6597, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 289.017, "t": 433.58994, "r": 310.00375, "b": 441.6597, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "0.945", "bbox": {"l": 289.017, "t": 433.58994, "r": 310.00375, "b": 441.6597, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 326.71701, "t": 433.58994, "r": 347.70377, "b": 441.6597, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "0.901", "bbox": {"l": 326.71701, "t": 433.58994, "r": 347.70377, "b": 441.6597, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 362.08801, "t": 433.5271599999999, "r": 386.24887, "b": 441.45346, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "0.931", "bbox": {"l": 362.08801, "t": 433.5271599999999, "r": 386.24887, "b": 441.45346, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 396.20599, "t": 433.58994, "r": 417.19275, "b": 441.6597, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "0.834", "bbox": {"l": 396.20599, "t": 433.58994, "r": 417.19275, "b": 441.6597, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 440.767, "t": 433.58994, "r": 457.14682, "b": 441.6597, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "3.81", "bbox": {"l": 440.767, "t": 433.58994, "r": 457.14682, "b": 441.6597, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 161.90601, "t": 452.41995, "r": 166.51294, "b": 460.48972, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "4", "bbox": {"l": 161.90601, "t": 452.41995, "r": 166.51294, "b": 460.48972, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 209.509, "t": 452.41995, "r": 214.11594, "b": 460.48972, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "2", "bbox": {"l": 209.509, "t": 452.41995, "r": 214.11594, "b": 460.48972, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 246.71000999999998, "t": 446.9399399999999, "r": 271.40527, "b": 455.0097, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 446.9399399999999, "r": 271.40527, "b": 455.0097, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 289.017, "t": 446.9399399999999, "r": 310.00375, "b": 455.0097, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "0.952", "bbox": {"l": 289.017, "t": 446.9399399999999, "r": 310.00375, "b": 455.0097, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 329.021, "t": 446.9399399999999, "r": 345.40082, "b": 455.0097, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "0.92", "bbox": {"l": 329.021, "t": 446.9399399999999, "r": 345.40082, "b": 455.0097, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 362.08801, "t": 446.87717, "r": 386.24887, "b": 454.80347, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "0.942", "bbox": {"l": 362.08801, "t": 446.87717, "r": 386.24887, "b": 454.80347, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 394.61801, "t": 446.87717, "r": 418.77887, "b": 454.80347, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "0.857", "bbox": {"l": 394.61801, "t": 446.87717, "r": 418.77887, "b": 454.80347, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 439.52701, "t": 446.87717, "r": 458.38425, "b": 454.80347, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "1.22", "bbox": {"l": 439.52701, "t": 446.87717, "r": 458.38425, "b": 454.80347, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 245.17598999999998, "t": 459.8919399999999, "r": 272.93954, "b": 467.9617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 459.8919399999999, "r": 272.93954, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 289.017, "t": 459.8919399999999, "r": 310.00375, "b": 467.9617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "0.944", "bbox": {"l": 289.017, "t": 459.8919399999999, "r": 310.00375, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 326.71701, "t": 459.8919399999999, "r": 347.70377, "b": 467.9617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "0.903", "bbox": {"l": 326.71701, "t": 459.8919399999999, "r": 347.70377, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 363.67599, "t": 459.8919399999999, "r": 384.66275, "b": 467.9617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "0.931", "bbox": {"l": 363.67599, "t": 459.8919399999999, "r": 384.66275, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 396.20599, "t": 459.8919399999999, "r": 417.19275, "b": 467.9617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "0.824", "bbox": {"l": 396.20599, "t": 459.8919399999999, "r": 417.19275, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 446.65302, "t": 459.8919399999999, "r": 451.25995, "b": 467.9617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "2", "bbox": {"l": 446.65302, "t": 459.8919399999999, "r": 451.25995, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 5, "label": "section_header", "bbox": {"l": 134.765, "t": 508.15179, "r": 264.40332, "b": 516.95874, "coord_origin": "TOPLEFT"}, "confidence": 0.9592539668083191, "cells": [{"id": 91, "text": "5.2", "bbox": {"l": 134.765, "t": 508.15179, "r": 149.40205, "b": 516.95874, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Quantitative Results", "bbox": {"l": 160.85904, "t": 508.15179, "r": 264.40332, "b": 516.95874, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 134.765, "t": 524.55078, "r": 480.5957599999999, "b": 617.03474, "coord_origin": "TOPLEFT"}, "confidence": 0.9854757189750671, "cells": [{"id": 93, "text": "We picked the model parameter configuration that produced the best prediction", "bbox": {"l": 134.765, "t": 524.55078, "r": 480.59075999999993, "b": 533.34775, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "quality (enc=6, dec=6, heads=8) with PubTabNet alone, then independently", "bbox": {"l": 134.765, "t": 536.50677, "r": 480.58675999999997, "b": 545.3037400000001, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "trained and evaluated it on three publicly available data sets: PubTabNet (395k", "bbox": {"l": 134.765, "t": 548.4617800000001, "r": 480.59572999999995, "b": 557.25874, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "samples), FinTabNet (113k samples) and PubTables-1M (about 1M samples).", "bbox": {"l": 134.765, "t": 560.41678, "r": 480.59177000000005, "b": 569.21375, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "Performance results are presented in Table. 2. It is clearly evident that the model", "bbox": {"l": 134.765, "t": 572.37178, "r": 480.59069999999997, "b": 581.16875, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "trained on OTSL outperforms HTML across the board, keeping high TEDs and", "bbox": {"l": 134.765, "t": 584.32678, "r": 480.5957599999999, "b": 593.12375, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "mAP scores even on difficult financial tables (FinTabNet) that contain sparse", "bbox": {"l": 134.765, "t": 596.28278, "r": 480.58774, "b": 605.07974, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "and large tables.", "bbox": {"l": 134.765, "t": 608.2377799999999, "r": 206.78664, "b": 617.03474, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 134.765, "t": 620.19278, "r": 480.5957599999999, "b": 664.8547599999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9851234555244446, "cells": [{"id": 101, "text": "Additionally, the results show that OTSL has an advantage over HTML", "bbox": {"l": 149.709, "t": 620.19278, "r": 480.59271, "b": 628.98975, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "when applied on a bigger data set like PubTables-1M and achieves significantly", "bbox": {"l": 134.765, "t": 632.14778, "r": 480.5957599999999, "b": 640.94475, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "improved scores. Finally, OTSL achieves faster inference due to fewer decoding", "bbox": {"l": 134.765, "t": 644.1027799999999, "r": 480.59283000000005, "b": 652.89975, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "steps which is a result of the reduced sequence representation.", "bbox": {"l": 134.765, "t": 656.0577900000001, "r": 405.79651, "b": 664.8547599999999, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {"0": {"label": "table", "id": 0, "page_no": 8, "cluster": {"id": 0, "label": "table", "bbox": {"l": 139.66845703125, "t": 337.5747985839844, "r": 475.00372314453125, "b": 469.4721374511719, "coord_origin": "TOPLEFT"}, "confidence": 0.9901032447814941, "cells": [{"id": 22, "text": "#", "bbox": {"l": 160.37, "t": 341.73495, "r": 168.04793, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "enc-layers", "bbox": {"l": 144.592, "t": 354.68594, "r": 183.82806, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "#", "bbox": {"l": 207.974, "t": 341.73495, "r": 215.65193, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "dec-layers", "bbox": {"l": 192.19499, "t": 354.68594, "r": 231.43106, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "Language", "bbox": {"l": 239.79799999999997, "t": 347.21396, "r": 278.31766, "b": 355.28372, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "TEDs", "bbox": {"l": 324.67001, "t": 341.73495, "r": 348.26419, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "mAP", "bbox": {"l": 396.271, "t": 341.73495, "r": 417.12683, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "(0.75)", "bbox": {"l": 394.927, "t": 352.69394000000005, "r": 418.47278, "b": 360.7637, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Inference", "bbox": {"l": 430.771, "t": 341.73495, "r": 467.1423, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "time (secs)", "bbox": {"l": 427.14801, "t": 352.69394000000005, "r": 470.76056, "b": 360.7637, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "simple", "bbox": {"l": 286.686, "t": 354.68594, "r": 312.33261, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "complex", "bbox": {"l": 320.702, "t": 354.68594, "r": 353.71988, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "all", "bbox": {"l": 369.306, "t": 354.68594, "r": 379.03094, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "6", "bbox": {"l": 161.90601, "t": 373.51596, "r": 166.51294, "b": 381.58572, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "6", "bbox": {"l": 209.509, "t": 373.51596, "r": 214.11594, "b": 381.58572, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 368.03595, "r": 271.40527, "b": 376.10571, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "0.965", "bbox": {"l": 289.017, "t": 368.03595, "r": 310.00375, "b": 376.10571, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "0.934", "bbox": {"l": 326.71701, "t": 368.03595, "r": 347.70377, "b": 376.10571, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "0.955", "bbox": {"l": 363.67599, "t": 368.03595, "r": 384.66275, "b": 376.10571, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "0.88", "bbox": {"l": 397.26999, "t": 367.97317999999996, "r": 416.12723, "b": 375.89948, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "2.73", "bbox": {"l": 439.52701, "t": 367.97317999999996, "r": 458.38425, "b": 375.89948, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 380.98795, "r": 272.93954, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "0.969", "bbox": {"l": 289.017, "t": 380.98795, "r": 310.00375, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "0.927", "bbox": {"l": 326.71701, "t": 380.98795, "r": 347.70377, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "0.955", "bbox": {"l": 363.67599, "t": 380.98795, "r": 384.66275, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "0.857", "bbox": {"l": 396.20599, "t": 380.98795, "r": 417.19275, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "5.39", "bbox": {"l": 440.767, "t": 380.98795, "r": 457.14682, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "4", "bbox": {"l": 161.90601, "t": 399.81696, "r": 166.51294, "b": 407.88672, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "4", "bbox": {"l": 209.509, "t": 399.81696, "r": 214.11594, "b": 407.88672, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 394.33795, "r": 271.40527, "b": 402.40771, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "0.938", "bbox": {"l": 289.017, "t": 394.33795, "r": 310.00375, "b": 402.40771, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "0.904", "bbox": {"l": 326.71701, "t": 394.33795, "r": 347.70377, "b": 402.40771, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "0.927", "bbox": {"l": 363.67599, "t": 394.33795, "r": 384.66275, "b": 402.40771, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "0.853", "bbox": {"l": 394.61801, "t": 394.27518, "r": 418.77887, "b": 402.20148, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "1.97", "bbox": {"l": 439.52701, "t": 394.27518, "r": 458.38425, "b": 402.20148, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 407.28894, "r": 272.93954, "b": 415.3587, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "0.952", "bbox": {"l": 289.017, "t": 407.28894, "r": 310.00375, "b": 415.3587, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "0.909", "bbox": {"l": 326.71701, "t": 407.28894, "r": 347.70377, "b": 415.3587, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "0.938", "bbox": {"l": 362.08801, "t": 407.22617, "r": 386.24887, "b": 415.15247, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "0.843", "bbox": {"l": 396.20599, "t": 407.28894, "r": 417.19275, "b": 415.3587, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "3.77", "bbox": {"l": 440.767, "t": 407.28894, "r": 457.14682, "b": 415.3587, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "2", "bbox": {"l": 161.90601, "t": 426.11795, "r": 166.51294, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "4", "bbox": {"l": 209.509, "t": 426.11795, "r": 214.11594, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 420.63895, "r": 271.40527, "b": 428.70871, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "0.923", "bbox": {"l": 289.017, "t": 420.63895, "r": 310.00375, "b": 428.70871, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "0.897", "bbox": {"l": 326.71701, "t": 420.63895, "r": 347.70377, "b": 428.70871, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "0.915", "bbox": {"l": 363.67599, "t": 420.63895, "r": 384.66275, "b": 428.70871, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "0.859", "bbox": {"l": 394.61801, "t": 420.57617, "r": 418.77887, "b": 428.50247, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "1.91", "bbox": {"l": 439.52701, "t": 420.57617, "r": 458.38425, "b": 428.50247, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 433.58994, "r": 272.93954, "b": 441.6597, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "0.945", "bbox": {"l": 289.017, "t": 433.58994, "r": 310.00375, "b": 441.6597, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "0.901", "bbox": {"l": 326.71701, "t": 433.58994, "r": 347.70377, "b": 441.6597, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "0.931", "bbox": {"l": 362.08801, "t": 433.5271599999999, "r": 386.24887, "b": 441.45346, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "0.834", "bbox": {"l": 396.20599, "t": 433.58994, "r": 417.19275, "b": 441.6597, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "3.81", "bbox": {"l": 440.767, "t": 433.58994, "r": 457.14682, "b": 441.6597, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "4", "bbox": {"l": 161.90601, "t": 452.41995, "r": 166.51294, "b": 460.48972, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "2", "bbox": {"l": 209.509, "t": 452.41995, "r": 214.11594, "b": 460.48972, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 446.9399399999999, "r": 271.40527, "b": 455.0097, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "0.952", "bbox": {"l": 289.017, "t": 446.9399399999999, "r": 310.00375, "b": 455.0097, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "0.92", "bbox": {"l": 329.021, "t": 446.9399399999999, "r": 345.40082, "b": 455.0097, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "0.942", "bbox": {"l": 362.08801, "t": 446.87717, "r": 386.24887, "b": 454.80347, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "0.857", "bbox": {"l": 394.61801, "t": 446.87717, "r": 418.77887, "b": 454.80347, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "1.22", "bbox": {"l": 439.52701, "t": 446.87717, "r": 458.38425, "b": 454.80347, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 459.8919399999999, "r": 272.93954, "b": 467.9617, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "0.944", "bbox": {"l": 289.017, "t": 459.8919399999999, "r": 310.00375, "b": 467.9617, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "0.903", "bbox": {"l": 326.71701, "t": 459.8919399999999, "r": 347.70377, "b": 467.9617, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "0.931", "bbox": {"l": 363.67599, "t": 459.8919399999999, "r": 384.66275, "b": 467.9617, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "0.824", "bbox": {"l": 396.20599, "t": 459.8919399999999, "r": 417.19275, "b": 467.9617, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "2", "bbox": {"l": 446.65302, "t": 459.8919399999999, "r": 451.25995, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": [{"id": 10, "label": "text", "bbox": {"l": 160.37, "t": 341.73495, "r": 168.04793, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "#", "bbox": {"l": 160.37, "t": 341.73495, "r": 168.04793, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 144.592, "t": 354.68594, "r": 183.82806, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "enc-layers", "bbox": {"l": 144.592, "t": 354.68594, "r": 183.82806, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 207.974, "t": 341.73495, "r": 215.65193, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "#", "bbox": {"l": 207.974, "t": 341.73495, "r": 215.65193, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 192.19499, "t": 354.68594, "r": 231.43106, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "dec-layers", "bbox": {"l": 192.19499, "t": 354.68594, "r": 231.43106, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 239.79799999999997, "t": 347.21396, "r": 278.31766, "b": 355.28372, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "Language", "bbox": {"l": 239.79799999999997, "t": 347.21396, "r": 278.31766, "b": 355.28372, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 324.67001, "t": 341.73495, "r": 348.26419, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "TEDs", "bbox": {"l": 324.67001, "t": 341.73495, "r": 348.26419, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 396.271, "t": 341.73495, "r": 417.12683, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "mAP", "bbox": {"l": 396.271, "t": 341.73495, "r": 417.12683, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 394.927, "t": 352.69394000000005, "r": 418.47278, "b": 360.7637, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "(0.75)", "bbox": {"l": 394.927, "t": 352.69394000000005, "r": 418.47278, "b": 360.7637, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 430.771, "t": 341.73495, "r": 467.1423, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "Inference", "bbox": {"l": 430.771, "t": 341.73495, "r": 467.1423, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 427.14801, "t": 352.69394000000005, "r": 470.76056, "b": 360.7637, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "time (secs)", "bbox": {"l": 427.14801, "t": 352.69394000000005, "r": 470.76056, "b": 360.7637, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 286.686, "t": 354.68594, "r": 312.33261, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "simple", "bbox": {"l": 286.686, "t": 354.68594, "r": 312.33261, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 320.702, "t": 354.68594, "r": 353.71988, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "complex", "bbox": {"l": 320.702, "t": 354.68594, "r": 353.71988, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 369.306, "t": 354.68594, "r": 379.03094, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "all", "bbox": {"l": 369.306, "t": 354.68594, "r": 379.03094, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 161.90601, "t": 373.51596, "r": 166.51294, "b": 381.58572, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "6", "bbox": {"l": 161.90601, "t": 373.51596, "r": 166.51294, "b": 381.58572, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 209.509, "t": 373.51596, "r": 214.11594, "b": 381.58572, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "6", "bbox": {"l": 209.509, "t": 373.51596, "r": 214.11594, "b": 381.58572, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 246.71000999999998, "t": 368.03595, "r": 271.40527, "b": 376.10571, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 368.03595, "r": 271.40527, "b": 376.10571, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 289.017, "t": 368.03595, "r": 310.00375, "b": 376.10571, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "0.965", "bbox": {"l": 289.017, "t": 368.03595, "r": 310.00375, "b": 376.10571, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 326.71701, "t": 368.03595, "r": 347.70377, "b": 376.10571, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "0.934", "bbox": {"l": 326.71701, "t": 368.03595, "r": 347.70377, "b": 376.10571, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 363.67599, "t": 368.03595, "r": 384.66275, "b": 376.10571, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "0.955", "bbox": {"l": 363.67599, "t": 368.03595, "r": 384.66275, "b": 376.10571, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 397.26999, "t": 367.97317999999996, "r": 416.12723, "b": 375.89948, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "0.88", "bbox": {"l": 397.26999, "t": 367.97317999999996, "r": 416.12723, "b": 375.89948, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 439.52701, "t": 367.97317999999996, "r": 458.38425, "b": 375.89948, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "2.73", "bbox": {"l": 439.52701, "t": 367.97317999999996, "r": 458.38425, "b": 375.89948, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 245.17598999999998, "t": 380.98795, "r": 272.93954, "b": 389.05771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 380.98795, "r": 272.93954, "b": 389.05771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 289.017, "t": 380.98795, "r": 310.00375, "b": 389.05771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "0.969", "bbox": {"l": 289.017, "t": 380.98795, "r": 310.00375, "b": 389.05771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 326.71701, "t": 380.98795, "r": 347.70377, "b": 389.05771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "0.927", "bbox": {"l": 326.71701, "t": 380.98795, "r": 347.70377, "b": 389.05771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 363.67599, "t": 380.98795, "r": 384.66275, "b": 389.05771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "0.955", "bbox": {"l": 363.67599, "t": 380.98795, "r": 384.66275, "b": 389.05771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 396.20599, "t": 380.98795, "r": 417.19275, "b": 389.05771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "0.857", "bbox": {"l": 396.20599, "t": 380.98795, "r": 417.19275, "b": 389.05771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 440.767, "t": 380.98795, "r": 457.14682, "b": 389.05771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "5.39", "bbox": {"l": 440.767, "t": 380.98795, "r": 457.14682, "b": 389.05771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 161.90601, "t": 399.81696, "r": 166.51294, "b": 407.88672, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "4", "bbox": {"l": 161.90601, "t": 399.81696, "r": 166.51294, "b": 407.88672, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 209.509, "t": 399.81696, "r": 214.11594, "b": 407.88672, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "4", "bbox": {"l": 209.509, "t": 399.81696, "r": 214.11594, "b": 407.88672, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 246.71000999999998, "t": 394.33795, "r": 271.40527, "b": 402.40771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 394.33795, "r": 271.40527, "b": 402.40771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 289.017, "t": 394.33795, "r": 310.00375, "b": 402.40771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "0.938", "bbox": {"l": 289.017, "t": 394.33795, "r": 310.00375, "b": 402.40771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 326.71701, "t": 394.33795, "r": 347.70377, "b": 402.40771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "0.904", "bbox": {"l": 326.71701, "t": 394.33795, "r": 347.70377, "b": 402.40771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 363.67599, "t": 394.33795, "r": 384.66275, "b": 402.40771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "0.927", "bbox": {"l": 363.67599, "t": 394.33795, "r": 384.66275, "b": 402.40771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 394.61801, "t": 394.27518, "r": 418.77887, "b": 402.20148, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "0.853", "bbox": {"l": 394.61801, "t": 394.27518, "r": 418.77887, "b": 402.20148, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 439.52701, "t": 394.27518, "r": 458.38425, "b": 402.20148, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "1.97", "bbox": {"l": 439.52701, "t": 394.27518, "r": 458.38425, "b": 402.20148, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 245.17598999999998, "t": 407.28894, "r": 272.93954, "b": 415.3587, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 407.28894, "r": 272.93954, "b": 415.3587, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 289.017, "t": 407.28894, "r": 310.00375, "b": 415.3587, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "0.952", "bbox": {"l": 289.017, "t": 407.28894, "r": 310.00375, "b": 415.3587, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 326.71701, "t": 407.28894, "r": 347.70377, "b": 415.3587, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "0.909", "bbox": {"l": 326.71701, "t": 407.28894, "r": 347.70377, "b": 415.3587, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 362.08801, "t": 407.22617, "r": 386.24887, "b": 415.15247, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "0.938", "bbox": {"l": 362.08801, "t": 407.22617, "r": 386.24887, "b": 415.15247, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 396.20599, "t": 407.28894, "r": 417.19275, "b": 415.3587, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "0.843", "bbox": {"l": 396.20599, "t": 407.28894, "r": 417.19275, "b": 415.3587, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 440.767, "t": 407.28894, "r": 457.14682, "b": 415.3587, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "3.77", "bbox": {"l": 440.767, "t": 407.28894, "r": 457.14682, "b": 415.3587, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 161.90601, "t": 426.11795, "r": 166.51294, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "2", "bbox": {"l": 161.90601, "t": 426.11795, "r": 166.51294, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 209.509, "t": 426.11795, "r": 214.11594, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "4", "bbox": {"l": 209.509, "t": 426.11795, "r": 214.11594, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 246.71000999999998, "t": 420.63895, "r": 271.40527, "b": 428.70871, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 420.63895, "r": 271.40527, "b": 428.70871, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 289.017, "t": 420.63895, "r": 310.00375, "b": 428.70871, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "0.923", "bbox": {"l": 289.017, "t": 420.63895, "r": 310.00375, "b": 428.70871, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 326.71701, "t": 420.63895, "r": 347.70377, "b": 428.70871, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "0.897", "bbox": {"l": 326.71701, "t": 420.63895, "r": 347.70377, "b": 428.70871, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 363.67599, "t": 420.63895, "r": 384.66275, "b": 428.70871, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "0.915", "bbox": {"l": 363.67599, "t": 420.63895, "r": 384.66275, "b": 428.70871, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 394.61801, "t": 420.57617, "r": 418.77887, "b": 428.50247, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "0.859", "bbox": {"l": 394.61801, "t": 420.57617, "r": 418.77887, "b": 428.50247, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 439.52701, "t": 420.57617, "r": 458.38425, "b": 428.50247, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "1.91", "bbox": {"l": 439.52701, "t": 420.57617, "r": 458.38425, "b": 428.50247, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 245.17598999999998, "t": 433.58994, "r": 272.93954, "b": 441.6597, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 433.58994, "r": 272.93954, "b": 441.6597, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 289.017, "t": 433.58994, "r": 310.00375, "b": 441.6597, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "0.945", "bbox": {"l": 289.017, "t": 433.58994, "r": 310.00375, "b": 441.6597, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 326.71701, "t": 433.58994, "r": 347.70377, "b": 441.6597, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "0.901", "bbox": {"l": 326.71701, "t": 433.58994, "r": 347.70377, "b": 441.6597, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 362.08801, "t": 433.5271599999999, "r": 386.24887, "b": 441.45346, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "0.931", "bbox": {"l": 362.08801, "t": 433.5271599999999, "r": 386.24887, "b": 441.45346, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 396.20599, "t": 433.58994, "r": 417.19275, "b": 441.6597, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "0.834", "bbox": {"l": 396.20599, "t": 433.58994, "r": 417.19275, "b": 441.6597, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 440.767, "t": 433.58994, "r": 457.14682, "b": 441.6597, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "3.81", "bbox": {"l": 440.767, "t": 433.58994, "r": 457.14682, "b": 441.6597, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 161.90601, "t": 452.41995, "r": 166.51294, "b": 460.48972, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "4", "bbox": {"l": 161.90601, "t": 452.41995, "r": 166.51294, "b": 460.48972, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 209.509, "t": 452.41995, "r": 214.11594, "b": 460.48972, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "2", "bbox": {"l": 209.509, "t": 452.41995, "r": 214.11594, "b": 460.48972, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 246.71000999999998, "t": 446.9399399999999, "r": 271.40527, "b": 455.0097, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 446.9399399999999, "r": 271.40527, "b": 455.0097, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 289.017, "t": 446.9399399999999, "r": 310.00375, "b": 455.0097, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "0.952", "bbox": {"l": 289.017, "t": 446.9399399999999, "r": 310.00375, "b": 455.0097, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 329.021, "t": 446.9399399999999, "r": 345.40082, "b": 455.0097, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "0.92", "bbox": {"l": 329.021, "t": 446.9399399999999, "r": 345.40082, "b": 455.0097, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 362.08801, "t": 446.87717, "r": 386.24887, "b": 454.80347, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "0.942", "bbox": {"l": 362.08801, "t": 446.87717, "r": 386.24887, "b": 454.80347, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 394.61801, "t": 446.87717, "r": 418.77887, "b": 454.80347, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "0.857", "bbox": {"l": 394.61801, "t": 446.87717, "r": 418.77887, "b": 454.80347, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 439.52701, "t": 446.87717, "r": 458.38425, "b": 454.80347, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "1.22", "bbox": {"l": 439.52701, "t": 446.87717, "r": 458.38425, "b": 454.80347, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 245.17598999999998, "t": 459.8919399999999, "r": 272.93954, "b": 467.9617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 459.8919399999999, "r": 272.93954, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 289.017, "t": 459.8919399999999, "r": 310.00375, "b": 467.9617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "0.944", "bbox": {"l": 289.017, "t": 459.8919399999999, "r": 310.00375, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 326.71701, "t": 459.8919399999999, "r": 347.70377, "b": 467.9617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "0.903", "bbox": {"l": 326.71701, "t": 459.8919399999999, "r": 347.70377, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 363.67599, "t": 459.8919399999999, "r": 384.66275, "b": 467.9617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "0.931", "bbox": {"l": 363.67599, "t": 459.8919399999999, "r": 384.66275, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 396.20599, "t": 459.8919399999999, "r": 417.19275, "b": 467.9617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "0.824", "bbox": {"l": 396.20599, "t": 459.8919399999999, "r": 417.19275, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 446.65302, "t": 459.8919399999999, "r": 451.25995, "b": 467.9617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "2", "bbox": {"l": 446.65302, "t": 459.8919399999999, "r": 451.25995, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "lcel", "lcel", "ched", "ched", "nl", "ched", "ched", "ucel", "ched", "ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 7, "num_cols": 8, "table_cells": [{"bbox": {"l": 160.37, "t": 341.73495, "r": 168.04793, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "#", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 144.592, "t": 354.68594, "r": 183.82806, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "enc-layers", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 207.974, "t": 341.73495, "r": 215.65193, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "#", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 192.19499, "t": 354.68594, "r": 231.43106, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "dec-layers", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 239.79799999999997, "t": 347.21396, "r": 278.31766, "b": 355.28372, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Language", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 324.67001, "t": 341.73495, "r": 348.26419, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 3, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 6, "text": "TEDs", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 396.271, "t": 341.73495, "r": 417.12683, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "mAP", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 394.927, "t": 352.69394000000005, "r": 418.47278, "b": 360.7637, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "(0.75)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 430.771, "t": 341.73495, "r": 467.1423, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "Inference", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 427.14801, "t": 352.69394000000005, "r": 470.76056, "b": 360.7637, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "time (secs)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 286.686, "t": 354.68594, "r": 312.33261, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "simple", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 320.702, "t": 354.68594, "r": 353.71988, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "complex", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 369.306, "t": 354.68594, "r": 379.03094, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "all", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 161.90601, "t": 373.51596, "r": 166.51294, "b": 381.58572, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 373.51596, "r": 214.11594, "b": 381.58572, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 368.03595, "r": 272.93954, "b": 389.05771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 368.03595, "r": 310.00375, "b": 389.05771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.965 0.969", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 368.03595, "r": 347.70377, "b": 389.05771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.934 0.927", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 363.67599, "t": 368.03595, "r": 384.66275, "b": 389.05771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.955 0.955", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 396.20599, "t": 367.97317999999996, "r": 417.19275, "b": 389.05771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.88 0.857", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 367.97317999999996, "r": 458.38425, "b": 389.05771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "2.73 5.39", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 161.90601, "t": 399.81696, "r": 166.51294, "b": 407.88672, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 399.81696, "r": 214.11594, "b": 407.88672, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 394.33795, "r": 272.93954, "b": 415.3587, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 394.33795, "r": 310.00375, "b": 415.3587, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.938 0.952", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 394.33795, "r": 347.70377, "b": 402.40771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.904", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 363.67599, "t": 394.33795, "r": 384.66275, "b": 402.40771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.927", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.61801, "t": 394.27518, "r": 418.77887, "b": 402.20148, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.853", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 394.27518, "r": 458.38425, "b": 402.20148, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "1.97", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 407.28894, "r": 347.70377, "b": 428.70871, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.909 0.897", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 362.08801, "t": 407.22617, "r": 386.24887, "b": 415.15247, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.938", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 396.20599, "t": 407.28894, "r": 417.19275, "b": 415.3587, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.843", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.767, "t": 407.28894, "r": 457.14682, "b": 415.3587, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "3.77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 161.90601, "t": 426.11795, "r": 166.51294, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 426.11795, "r": 214.11594, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 246.71000999999998, "t": 420.63895, "r": 271.40527, "b": 428.70871, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 420.63895, "r": 310.00375, "b": 441.6597, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.923 0.945", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 362.08801, "t": 420.63895, "r": 386.24887, "b": 441.45346, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.915 0.931", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.61801, "t": 420.57617, "r": 418.77887, "b": 441.6597, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.859 0.834", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 420.57617, "r": 458.38425, "b": 441.6597, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "1.91 3.81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 433.58994, "r": 272.93954, "b": 441.6597, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 433.58994, "r": 347.70377, "b": 441.6597, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.901", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 161.90601, "t": 452.41995, "r": 166.51294, "b": 460.48972, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 452.41995, "r": 214.11594, "b": 460.48972, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 446.9399399999999, "r": 272.93954, "b": 467.9617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 446.9399399999999, "r": 310.00375, "b": 467.9617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.952 0.944", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 446.9399399999999, "r": 347.70377, "b": 467.9617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.92 0.903", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 362.08801, "t": 446.87717, "r": 386.24887, "b": 467.9617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.942 0.931", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.61801, "t": 446.87717, "r": 418.77887, "b": 467.9617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.857 0.824", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 446.87717, "r": 458.38425, "b": 467.9617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "1.22 2", "column_header": false, "row_header": false, "row_section": false}]}}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_header", "id": 8, "page_no": 8, "cluster": {"id": 8, "label": "page_header", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9373378753662109, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Optimized Table Tokenization for Table Structure Recognition"}, {"label": "page_header", "id": 9, "page_no": 8, "cluster": {"id": 9, "label": "page_header", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8857625722885132, "cells": [{"id": 1, "text": "9", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "9"}, {"label": "text", "id": 4, "page_no": 8, "cluster": {"id": 4, "label": "text", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.59579, "b": 151.64178000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9805440306663513, "cells": [{"id": 2, "text": "order to compute the TED score. Inference timing results for all experiments", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.5936899999999, "b": 127.73077, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "were obtained from the same machine on a single core with AMD EPYC 7763", "bbox": {"l": 134.765, "t": 130.88878999999997, "r": 480.59579, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "CPU @2.45 GHz.", "bbox": {"l": 134.765, "t": 142.84479, "r": 210.78462, "b": 151.64178000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "order to compute the TED score. Inference timing results for all experiments were obtained from the same machine on a single core with AMD EPYC 7763 CPU @2.45 GHz."}, {"label": "section_header", "id": 6, "page_no": 8, "cluster": {"id": 6, "label": "section_header", "bbox": {"l": 134.765, "t": 169.18584999999996, "r": 318.44843, "b": 177.9928, "coord_origin": "TOPLEFT"}, "confidence": 0.9579681158065796, "cells": [{"id": 5, "text": "5.1", "bbox": {"l": 134.765, "t": 169.18584999999996, "r": 149.40205, "b": 177.9928, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Hyper Parameter Optimization", "bbox": {"l": 160.85904, "t": 169.18584999999996, "r": 318.44843, "b": 177.9928, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5.1 Hyper Parameter Optimization"}, {"label": "text", "id": 3, "page_no": 8, "cluster": {"id": 3, "label": "text", "bbox": {"l": 134.76498, "t": 185.58582, "r": 480.59277, "b": 254.15886999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.9842326641082764, "cells": [{"id": 7, "text": "We have chosen the PubTabNet data set to perform HPO, since it includes a", "bbox": {"l": 134.765, "t": 185.58582, "r": 480.59183, "b": 194.38280999999995, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "highly diverse set of tables. Also we report TED scores separately for simple and", "bbox": {"l": 134.765, "t": 197.54083000000003, "r": 480.59183, "b": 206.33783000000005, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "complex tables (tables with cell spans). Results are presented in Table. 1. It is", "bbox": {"l": 134.765, "t": 209.49585000000002, "r": 480.59177000000005, "b": 218.29285000000004, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "evident that with OTSL, our model achieves the same TED score and slightly", "bbox": {"l": 134.765, "t": 221.45087, "r": 480.59277, "b": 230.24785999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "better mAP scores in comparison to HTML. However OTSL yields a", "bbox": {"l": 134.765, "t": 233.40588000000002, "r": 440.94159, "b": 242.20288000000005, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "2x speed", "bbox": {"l": 444.86798, "t": 233.40588000000002, "r": 480.58786000000003, "b": 242.20288000000005, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "up", "bbox": {"l": 134.76498, "t": 245.36188000000004, "r": 145.20081, "b": 254.15886999999998, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "in the inference runtime over HTML.", "bbox": {"l": 149.14899, "t": 245.36188000000004, "r": 311.21957, "b": 254.15886999999998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "We have chosen the PubTabNet data set to perform HPO, since it includes a highly diverse set of tables. Also we report TED scores separately for simple and complex tables (tables with cell spans). Results are presented in Table. 1. It is evident that with OTSL, our model achieves the same TED score and slightly better mAP scores in comparison to HTML. However OTSL yields a 2x speed up in the inference runtime over HTML."}, {"label": "caption", "id": 7, "page_no": 8, "cluster": {"id": 7, "label": "caption", "bbox": {"l": 134.76498, "t": 275.07232999999997, "r": 480.5954, "b": 327.0408, "coord_origin": "TOPLEFT"}, "confidence": 0.9570781588554382, "cells": [{"id": 15, "text": "Table", "bbox": {"l": 134.76498, "t": 275.07232999999997, "r": 160.11836, "b": 282.9986, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "1.", "bbox": {"l": 167.34528, "t": 275.07232999999997, "r": 175.59526, "b": 282.9986, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "HPO performed in OTSL and HTML representation on the same", "bbox": {"l": 188.13298, "t": 275.13507000000004, "r": 480.59365999999994, "b": 283.2048300000001, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "transformer-based TableFormer [9] architecture, trained only on PubTabNet [22]. Ef-", "bbox": {"l": 134.76498, "t": 286.09409, "r": 480.59444999999994, "b": 294.16385, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "fects of reducing the # of layers in encoder and decoder stages of the model show that", "bbox": {"l": 134.76498, "t": 297.05307, "r": 480.5954, "b": 305.12283, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "smaller models trained on OTSL perform better, especially in recognizing complex", "bbox": {"l": 134.76498, "t": 308.01205, "r": 480.59451, "b": 316.08182, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "table structures, and maintain a much higher mAP score than the HTML counterpart.", "bbox": {"l": 134.76498, "t": 318.97104, "r": 480.59441999999996, "b": 327.0408, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 1. HPO performed in OTSL and HTML representation on the same transformer-based TableFormer [9] architecture, trained only on PubTabNet [22]. Effects of reducing the # of layers in encoder and decoder stages of the model show that smaller models trained on OTSL perform better, especially in recognizing complex table structures, and maintain a much higher mAP score than the HTML counterpart."}, {"label": "table", "id": 0, "page_no": 8, "cluster": {"id": 0, "label": "table", "bbox": {"l": 139.66845703125, "t": 337.5747985839844, "r": 475.00372314453125, "b": 469.4721374511719, "coord_origin": "TOPLEFT"}, "confidence": 0.9901032447814941, "cells": [{"id": 22, "text": "#", "bbox": {"l": 160.37, "t": 341.73495, "r": 168.04793, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "enc-layers", "bbox": {"l": 144.592, "t": 354.68594, "r": 183.82806, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "#", "bbox": {"l": 207.974, "t": 341.73495, "r": 215.65193, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "dec-layers", "bbox": {"l": 192.19499, "t": 354.68594, "r": 231.43106, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "Language", "bbox": {"l": 239.79799999999997, "t": 347.21396, "r": 278.31766, "b": 355.28372, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "TEDs", "bbox": {"l": 324.67001, "t": 341.73495, "r": 348.26419, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "mAP", "bbox": {"l": 396.271, "t": 341.73495, "r": 417.12683, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "(0.75)", "bbox": {"l": 394.927, "t": 352.69394000000005, "r": 418.47278, "b": 360.7637, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Inference", "bbox": {"l": 430.771, "t": 341.73495, "r": 467.1423, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "time (secs)", "bbox": {"l": 427.14801, "t": 352.69394000000005, "r": 470.76056, "b": 360.7637, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "simple", "bbox": {"l": 286.686, "t": 354.68594, "r": 312.33261, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "complex", "bbox": {"l": 320.702, "t": 354.68594, "r": 353.71988, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "all", "bbox": {"l": 369.306, "t": 354.68594, "r": 379.03094, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "6", "bbox": {"l": 161.90601, "t": 373.51596, "r": 166.51294, "b": 381.58572, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "6", "bbox": {"l": 209.509, "t": 373.51596, "r": 214.11594, "b": 381.58572, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 368.03595, "r": 271.40527, "b": 376.10571, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "0.965", "bbox": {"l": 289.017, "t": 368.03595, "r": 310.00375, "b": 376.10571, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "0.934", "bbox": {"l": 326.71701, "t": 368.03595, "r": 347.70377, "b": 376.10571, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "0.955", "bbox": {"l": 363.67599, "t": 368.03595, "r": 384.66275, "b": 376.10571, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "0.88", "bbox": {"l": 397.26999, "t": 367.97317999999996, "r": 416.12723, "b": 375.89948, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "2.73", "bbox": {"l": 439.52701, "t": 367.97317999999996, "r": 458.38425, "b": 375.89948, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 380.98795, "r": 272.93954, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "0.969", "bbox": {"l": 289.017, "t": 380.98795, "r": 310.00375, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "0.927", "bbox": {"l": 326.71701, "t": 380.98795, "r": 347.70377, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "0.955", "bbox": {"l": 363.67599, "t": 380.98795, "r": 384.66275, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "0.857", "bbox": {"l": 396.20599, "t": 380.98795, "r": 417.19275, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "5.39", "bbox": {"l": 440.767, "t": 380.98795, "r": 457.14682, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "4", "bbox": {"l": 161.90601, "t": 399.81696, "r": 166.51294, "b": 407.88672, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "4", "bbox": {"l": 209.509, "t": 399.81696, "r": 214.11594, "b": 407.88672, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 394.33795, "r": 271.40527, "b": 402.40771, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "0.938", "bbox": {"l": 289.017, "t": 394.33795, "r": 310.00375, "b": 402.40771, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "0.904", "bbox": {"l": 326.71701, "t": 394.33795, "r": 347.70377, "b": 402.40771, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "0.927", "bbox": {"l": 363.67599, "t": 394.33795, "r": 384.66275, "b": 402.40771, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "0.853", "bbox": {"l": 394.61801, "t": 394.27518, "r": 418.77887, "b": 402.20148, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "1.97", "bbox": {"l": 439.52701, "t": 394.27518, "r": 458.38425, "b": 402.20148, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 407.28894, "r": 272.93954, "b": 415.3587, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "0.952", "bbox": {"l": 289.017, "t": 407.28894, "r": 310.00375, "b": 415.3587, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "0.909", "bbox": {"l": 326.71701, "t": 407.28894, "r": 347.70377, "b": 415.3587, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "0.938", "bbox": {"l": 362.08801, "t": 407.22617, "r": 386.24887, "b": 415.15247, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "0.843", "bbox": {"l": 396.20599, "t": 407.28894, "r": 417.19275, "b": 415.3587, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "3.77", "bbox": {"l": 440.767, "t": 407.28894, "r": 457.14682, "b": 415.3587, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "2", "bbox": {"l": 161.90601, "t": 426.11795, "r": 166.51294, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "4", "bbox": {"l": 209.509, "t": 426.11795, "r": 214.11594, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 420.63895, "r": 271.40527, "b": 428.70871, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "0.923", "bbox": {"l": 289.017, "t": 420.63895, "r": 310.00375, "b": 428.70871, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "0.897", "bbox": {"l": 326.71701, "t": 420.63895, "r": 347.70377, "b": 428.70871, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "0.915", "bbox": {"l": 363.67599, "t": 420.63895, "r": 384.66275, "b": 428.70871, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "0.859", "bbox": {"l": 394.61801, "t": 420.57617, "r": 418.77887, "b": 428.50247, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "1.91", "bbox": {"l": 439.52701, "t": 420.57617, "r": 458.38425, "b": 428.50247, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 433.58994, "r": 272.93954, "b": 441.6597, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "0.945", "bbox": {"l": 289.017, "t": 433.58994, "r": 310.00375, "b": 441.6597, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "0.901", "bbox": {"l": 326.71701, "t": 433.58994, "r": 347.70377, "b": 441.6597, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "0.931", "bbox": {"l": 362.08801, "t": 433.5271599999999, "r": 386.24887, "b": 441.45346, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "0.834", "bbox": {"l": 396.20599, "t": 433.58994, "r": 417.19275, "b": 441.6597, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "3.81", "bbox": {"l": 440.767, "t": 433.58994, "r": 457.14682, "b": 441.6597, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "4", "bbox": {"l": 161.90601, "t": 452.41995, "r": 166.51294, "b": 460.48972, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "2", "bbox": {"l": 209.509, "t": 452.41995, "r": 214.11594, "b": 460.48972, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 446.9399399999999, "r": 271.40527, "b": 455.0097, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "0.952", "bbox": {"l": 289.017, "t": 446.9399399999999, "r": 310.00375, "b": 455.0097, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "0.92", "bbox": {"l": 329.021, "t": 446.9399399999999, "r": 345.40082, "b": 455.0097, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "0.942", "bbox": {"l": 362.08801, "t": 446.87717, "r": 386.24887, "b": 454.80347, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "0.857", "bbox": {"l": 394.61801, "t": 446.87717, "r": 418.77887, "b": 454.80347, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "1.22", "bbox": {"l": 439.52701, "t": 446.87717, "r": 458.38425, "b": 454.80347, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 459.8919399999999, "r": 272.93954, "b": 467.9617, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "0.944", "bbox": {"l": 289.017, "t": 459.8919399999999, "r": 310.00375, "b": 467.9617, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "0.903", "bbox": {"l": 326.71701, "t": 459.8919399999999, "r": 347.70377, "b": 467.9617, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "0.931", "bbox": {"l": 363.67599, "t": 459.8919399999999, "r": 384.66275, "b": 467.9617, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "0.824", "bbox": {"l": 396.20599, "t": 459.8919399999999, "r": 417.19275, "b": 467.9617, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "2", "bbox": {"l": 446.65302, "t": 459.8919399999999, "r": 451.25995, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": [{"id": 10, "label": "text", "bbox": {"l": 160.37, "t": 341.73495, "r": 168.04793, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "#", "bbox": {"l": 160.37, "t": 341.73495, "r": 168.04793, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 144.592, "t": 354.68594, "r": 183.82806, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "enc-layers", "bbox": {"l": 144.592, "t": 354.68594, "r": 183.82806, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 207.974, "t": 341.73495, "r": 215.65193, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "#", "bbox": {"l": 207.974, "t": 341.73495, "r": 215.65193, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 192.19499, "t": 354.68594, "r": 231.43106, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "dec-layers", "bbox": {"l": 192.19499, "t": 354.68594, "r": 231.43106, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 239.79799999999997, "t": 347.21396, "r": 278.31766, "b": 355.28372, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "Language", "bbox": {"l": 239.79799999999997, "t": 347.21396, "r": 278.31766, "b": 355.28372, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 324.67001, "t": 341.73495, "r": 348.26419, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "TEDs", "bbox": {"l": 324.67001, "t": 341.73495, "r": 348.26419, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 396.271, "t": 341.73495, "r": 417.12683, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "mAP", "bbox": {"l": 396.271, "t": 341.73495, "r": 417.12683, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 394.927, "t": 352.69394000000005, "r": 418.47278, "b": 360.7637, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "(0.75)", "bbox": {"l": 394.927, "t": 352.69394000000005, "r": 418.47278, "b": 360.7637, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 430.771, "t": 341.73495, "r": 467.1423, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "Inference", "bbox": {"l": 430.771, "t": 341.73495, "r": 467.1423, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 427.14801, "t": 352.69394000000005, "r": 470.76056, "b": 360.7637, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "time (secs)", "bbox": {"l": 427.14801, "t": 352.69394000000005, "r": 470.76056, "b": 360.7637, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 286.686, "t": 354.68594, "r": 312.33261, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "simple", "bbox": {"l": 286.686, "t": 354.68594, "r": 312.33261, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 320.702, "t": 354.68594, "r": 353.71988, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "complex", "bbox": {"l": 320.702, "t": 354.68594, "r": 353.71988, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 369.306, "t": 354.68594, "r": 379.03094, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "all", "bbox": {"l": 369.306, "t": 354.68594, "r": 379.03094, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 161.90601, "t": 373.51596, "r": 166.51294, "b": 381.58572, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "6", "bbox": {"l": 161.90601, "t": 373.51596, "r": 166.51294, "b": 381.58572, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 209.509, "t": 373.51596, "r": 214.11594, "b": 381.58572, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "6", "bbox": {"l": 209.509, "t": 373.51596, "r": 214.11594, "b": 381.58572, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 246.71000999999998, "t": 368.03595, "r": 271.40527, "b": 376.10571, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 368.03595, "r": 271.40527, "b": 376.10571, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 289.017, "t": 368.03595, "r": 310.00375, "b": 376.10571, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "0.965", "bbox": {"l": 289.017, "t": 368.03595, "r": 310.00375, "b": 376.10571, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 326.71701, "t": 368.03595, "r": 347.70377, "b": 376.10571, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "0.934", "bbox": {"l": 326.71701, "t": 368.03595, "r": 347.70377, "b": 376.10571, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 363.67599, "t": 368.03595, "r": 384.66275, "b": 376.10571, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "0.955", "bbox": {"l": 363.67599, "t": 368.03595, "r": 384.66275, "b": 376.10571, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 397.26999, "t": 367.97317999999996, "r": 416.12723, "b": 375.89948, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "0.88", "bbox": {"l": 397.26999, "t": 367.97317999999996, "r": 416.12723, "b": 375.89948, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 439.52701, "t": 367.97317999999996, "r": 458.38425, "b": 375.89948, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "2.73", "bbox": {"l": 439.52701, "t": 367.97317999999996, "r": 458.38425, "b": 375.89948, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 245.17598999999998, "t": 380.98795, "r": 272.93954, "b": 389.05771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 380.98795, "r": 272.93954, "b": 389.05771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 289.017, "t": 380.98795, "r": 310.00375, "b": 389.05771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "0.969", "bbox": {"l": 289.017, "t": 380.98795, "r": 310.00375, "b": 389.05771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 326.71701, "t": 380.98795, "r": 347.70377, "b": 389.05771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "0.927", "bbox": {"l": 326.71701, "t": 380.98795, "r": 347.70377, "b": 389.05771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 363.67599, "t": 380.98795, "r": 384.66275, "b": 389.05771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "0.955", "bbox": {"l": 363.67599, "t": 380.98795, "r": 384.66275, "b": 389.05771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 396.20599, "t": 380.98795, "r": 417.19275, "b": 389.05771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "0.857", "bbox": {"l": 396.20599, "t": 380.98795, "r": 417.19275, "b": 389.05771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 440.767, "t": 380.98795, "r": 457.14682, "b": 389.05771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "5.39", "bbox": {"l": 440.767, "t": 380.98795, "r": 457.14682, "b": 389.05771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 161.90601, "t": 399.81696, "r": 166.51294, "b": 407.88672, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "4", "bbox": {"l": 161.90601, "t": 399.81696, "r": 166.51294, "b": 407.88672, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 209.509, "t": 399.81696, "r": 214.11594, "b": 407.88672, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "4", "bbox": {"l": 209.509, "t": 399.81696, "r": 214.11594, "b": 407.88672, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 246.71000999999998, "t": 394.33795, "r": 271.40527, "b": 402.40771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 394.33795, "r": 271.40527, "b": 402.40771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 289.017, "t": 394.33795, "r": 310.00375, "b": 402.40771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "0.938", "bbox": {"l": 289.017, "t": 394.33795, "r": 310.00375, "b": 402.40771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 326.71701, "t": 394.33795, "r": 347.70377, "b": 402.40771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "0.904", "bbox": {"l": 326.71701, "t": 394.33795, "r": 347.70377, "b": 402.40771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 363.67599, "t": 394.33795, "r": 384.66275, "b": 402.40771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "0.927", "bbox": {"l": 363.67599, "t": 394.33795, "r": 384.66275, "b": 402.40771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 394.61801, "t": 394.27518, "r": 418.77887, "b": 402.20148, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "0.853", "bbox": {"l": 394.61801, "t": 394.27518, "r": 418.77887, "b": 402.20148, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 439.52701, "t": 394.27518, "r": 458.38425, "b": 402.20148, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "1.97", "bbox": {"l": 439.52701, "t": 394.27518, "r": 458.38425, "b": 402.20148, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 245.17598999999998, "t": 407.28894, "r": 272.93954, "b": 415.3587, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 407.28894, "r": 272.93954, "b": 415.3587, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 289.017, "t": 407.28894, "r": 310.00375, "b": 415.3587, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "0.952", "bbox": {"l": 289.017, "t": 407.28894, "r": 310.00375, "b": 415.3587, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 326.71701, "t": 407.28894, "r": 347.70377, "b": 415.3587, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "0.909", "bbox": {"l": 326.71701, "t": 407.28894, "r": 347.70377, "b": 415.3587, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 362.08801, "t": 407.22617, "r": 386.24887, "b": 415.15247, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "0.938", "bbox": {"l": 362.08801, "t": 407.22617, "r": 386.24887, "b": 415.15247, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 396.20599, "t": 407.28894, "r": 417.19275, "b": 415.3587, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "0.843", "bbox": {"l": 396.20599, "t": 407.28894, "r": 417.19275, "b": 415.3587, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 440.767, "t": 407.28894, "r": 457.14682, "b": 415.3587, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "3.77", "bbox": {"l": 440.767, "t": 407.28894, "r": 457.14682, "b": 415.3587, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 161.90601, "t": 426.11795, "r": 166.51294, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "2", "bbox": {"l": 161.90601, "t": 426.11795, "r": 166.51294, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 209.509, "t": 426.11795, "r": 214.11594, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "4", "bbox": {"l": 209.509, "t": 426.11795, "r": 214.11594, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 246.71000999999998, "t": 420.63895, "r": 271.40527, "b": 428.70871, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 420.63895, "r": 271.40527, "b": 428.70871, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 289.017, "t": 420.63895, "r": 310.00375, "b": 428.70871, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "0.923", "bbox": {"l": 289.017, "t": 420.63895, "r": 310.00375, "b": 428.70871, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 326.71701, "t": 420.63895, "r": 347.70377, "b": 428.70871, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "0.897", "bbox": {"l": 326.71701, "t": 420.63895, "r": 347.70377, "b": 428.70871, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 363.67599, "t": 420.63895, "r": 384.66275, "b": 428.70871, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "0.915", "bbox": {"l": 363.67599, "t": 420.63895, "r": 384.66275, "b": 428.70871, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 394.61801, "t": 420.57617, "r": 418.77887, "b": 428.50247, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "0.859", "bbox": {"l": 394.61801, "t": 420.57617, "r": 418.77887, "b": 428.50247, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 439.52701, "t": 420.57617, "r": 458.38425, "b": 428.50247, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "1.91", "bbox": {"l": 439.52701, "t": 420.57617, "r": 458.38425, "b": 428.50247, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 245.17598999999998, "t": 433.58994, "r": 272.93954, "b": 441.6597, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 433.58994, "r": 272.93954, "b": 441.6597, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 289.017, "t": 433.58994, "r": 310.00375, "b": 441.6597, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "0.945", "bbox": {"l": 289.017, "t": 433.58994, "r": 310.00375, "b": 441.6597, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 326.71701, "t": 433.58994, "r": 347.70377, "b": 441.6597, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "0.901", "bbox": {"l": 326.71701, "t": 433.58994, "r": 347.70377, "b": 441.6597, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 362.08801, "t": 433.5271599999999, "r": 386.24887, "b": 441.45346, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "0.931", "bbox": {"l": 362.08801, "t": 433.5271599999999, "r": 386.24887, "b": 441.45346, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 396.20599, "t": 433.58994, "r": 417.19275, "b": 441.6597, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "0.834", "bbox": {"l": 396.20599, "t": 433.58994, "r": 417.19275, "b": 441.6597, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 440.767, "t": 433.58994, "r": 457.14682, "b": 441.6597, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "3.81", "bbox": {"l": 440.767, "t": 433.58994, "r": 457.14682, "b": 441.6597, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 161.90601, "t": 452.41995, "r": 166.51294, "b": 460.48972, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "4", "bbox": {"l": 161.90601, "t": 452.41995, "r": 166.51294, "b": 460.48972, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 209.509, "t": 452.41995, "r": 214.11594, "b": 460.48972, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "2", "bbox": {"l": 209.509, "t": 452.41995, "r": 214.11594, "b": 460.48972, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 246.71000999999998, "t": 446.9399399999999, "r": 271.40527, "b": 455.0097, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 446.9399399999999, "r": 271.40527, "b": 455.0097, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 289.017, "t": 446.9399399999999, "r": 310.00375, "b": 455.0097, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "0.952", "bbox": {"l": 289.017, "t": 446.9399399999999, "r": 310.00375, "b": 455.0097, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 329.021, "t": 446.9399399999999, "r": 345.40082, "b": 455.0097, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "0.92", "bbox": {"l": 329.021, "t": 446.9399399999999, "r": 345.40082, "b": 455.0097, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 362.08801, "t": 446.87717, "r": 386.24887, "b": 454.80347, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "0.942", "bbox": {"l": 362.08801, "t": 446.87717, "r": 386.24887, "b": 454.80347, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 394.61801, "t": 446.87717, "r": 418.77887, "b": 454.80347, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "0.857", "bbox": {"l": 394.61801, "t": 446.87717, "r": 418.77887, "b": 454.80347, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 439.52701, "t": 446.87717, "r": 458.38425, "b": 454.80347, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "1.22", "bbox": {"l": 439.52701, "t": 446.87717, "r": 458.38425, "b": 454.80347, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 245.17598999999998, "t": 459.8919399999999, "r": 272.93954, "b": 467.9617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 459.8919399999999, "r": 272.93954, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 289.017, "t": 459.8919399999999, "r": 310.00375, "b": 467.9617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "0.944", "bbox": {"l": 289.017, "t": 459.8919399999999, "r": 310.00375, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 326.71701, "t": 459.8919399999999, "r": 347.70377, "b": 467.9617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "0.903", "bbox": {"l": 326.71701, "t": 459.8919399999999, "r": 347.70377, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 363.67599, "t": 459.8919399999999, "r": 384.66275, "b": 467.9617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "0.931", "bbox": {"l": 363.67599, "t": 459.8919399999999, "r": 384.66275, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 396.20599, "t": 459.8919399999999, "r": 417.19275, "b": 467.9617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "0.824", "bbox": {"l": 396.20599, "t": 459.8919399999999, "r": 417.19275, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 446.65302, "t": 459.8919399999999, "r": 451.25995, "b": 467.9617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "2", "bbox": {"l": 446.65302, "t": 459.8919399999999, "r": 451.25995, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "lcel", "lcel", "ched", "ched", "nl", "ched", "ched", "ucel", "ched", "ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 7, "num_cols": 8, "table_cells": [{"bbox": {"l": 160.37, "t": 341.73495, "r": 168.04793, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "#", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 144.592, "t": 354.68594, "r": 183.82806, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "enc-layers", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 207.974, "t": 341.73495, "r": 215.65193, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "#", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 192.19499, "t": 354.68594, "r": 231.43106, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "dec-layers", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 239.79799999999997, "t": 347.21396, "r": 278.31766, "b": 355.28372, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Language", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 324.67001, "t": 341.73495, "r": 348.26419, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 3, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 6, "text": "TEDs", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 396.271, "t": 341.73495, "r": 417.12683, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "mAP", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 394.927, "t": 352.69394000000005, "r": 418.47278, "b": 360.7637, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "(0.75)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 430.771, "t": 341.73495, "r": 467.1423, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "Inference", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 427.14801, "t": 352.69394000000005, "r": 470.76056, "b": 360.7637, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "time (secs)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 286.686, "t": 354.68594, "r": 312.33261, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "simple", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 320.702, "t": 354.68594, "r": 353.71988, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "complex", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 369.306, "t": 354.68594, "r": 379.03094, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "all", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 161.90601, "t": 373.51596, "r": 166.51294, "b": 381.58572, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 373.51596, "r": 214.11594, "b": 381.58572, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 368.03595, "r": 272.93954, "b": 389.05771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 368.03595, "r": 310.00375, "b": 389.05771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.965 0.969", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 368.03595, "r": 347.70377, "b": 389.05771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.934 0.927", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 363.67599, "t": 368.03595, "r": 384.66275, "b": 389.05771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.955 0.955", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 396.20599, "t": 367.97317999999996, "r": 417.19275, "b": 389.05771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.88 0.857", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 367.97317999999996, "r": 458.38425, "b": 389.05771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "2.73 5.39", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 161.90601, "t": 399.81696, "r": 166.51294, "b": 407.88672, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 399.81696, "r": 214.11594, "b": 407.88672, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 394.33795, "r": 272.93954, "b": 415.3587, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 394.33795, "r": 310.00375, "b": 415.3587, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.938 0.952", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 394.33795, "r": 347.70377, "b": 402.40771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.904", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 363.67599, "t": 394.33795, "r": 384.66275, "b": 402.40771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.927", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.61801, "t": 394.27518, "r": 418.77887, "b": 402.20148, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.853", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 394.27518, "r": 458.38425, "b": 402.20148, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "1.97", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 407.28894, "r": 347.70377, "b": 428.70871, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.909 0.897", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 362.08801, "t": 407.22617, "r": 386.24887, "b": 415.15247, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.938", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 396.20599, "t": 407.28894, "r": 417.19275, "b": 415.3587, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.843", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.767, "t": 407.28894, "r": 457.14682, "b": 415.3587, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "3.77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 161.90601, "t": 426.11795, "r": 166.51294, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 426.11795, "r": 214.11594, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 246.71000999999998, "t": 420.63895, "r": 271.40527, "b": 428.70871, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 420.63895, "r": 310.00375, "b": 441.6597, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.923 0.945", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 362.08801, "t": 420.63895, "r": 386.24887, "b": 441.45346, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.915 0.931", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.61801, "t": 420.57617, "r": 418.77887, "b": 441.6597, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.859 0.834", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 420.57617, "r": 458.38425, "b": 441.6597, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "1.91 3.81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 433.58994, "r": 272.93954, "b": 441.6597, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 433.58994, "r": 347.70377, "b": 441.6597, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.901", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 161.90601, "t": 452.41995, "r": 166.51294, "b": 460.48972, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 452.41995, "r": 214.11594, "b": 460.48972, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 446.9399399999999, "r": 272.93954, "b": 467.9617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 446.9399399999999, "r": 310.00375, "b": 467.9617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.952 0.944", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 446.9399399999999, "r": 347.70377, "b": 467.9617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.92 0.903", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 362.08801, "t": 446.87717, "r": 386.24887, "b": 467.9617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.942 0.931", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.61801, "t": 446.87717, "r": 418.77887, "b": 467.9617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.857 0.824", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 446.87717, "r": 458.38425, "b": 467.9617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "1.22 2", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "section_header", "id": 5, "page_no": 8, "cluster": {"id": 5, "label": "section_header", "bbox": {"l": 134.765, "t": 508.15179, "r": 264.40332, "b": 516.95874, "coord_origin": "TOPLEFT"}, "confidence": 0.9592539668083191, "cells": [{"id": 91, "text": "5.2", "bbox": {"l": 134.765, "t": 508.15179, "r": 149.40205, "b": 516.95874, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Quantitative Results", "bbox": {"l": 160.85904, "t": 508.15179, "r": 264.40332, "b": 516.95874, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5.2 Quantitative Results"}, {"label": "text", "id": 1, "page_no": 8, "cluster": {"id": 1, "label": "text", "bbox": {"l": 134.765, "t": 524.55078, "r": 480.5957599999999, "b": 617.03474, "coord_origin": "TOPLEFT"}, "confidence": 0.9854757189750671, "cells": [{"id": 93, "text": "We picked the model parameter configuration that produced the best prediction", "bbox": {"l": 134.765, "t": 524.55078, "r": 480.59075999999993, "b": 533.34775, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "quality (enc=6, dec=6, heads=8) with PubTabNet alone, then independently", "bbox": {"l": 134.765, "t": 536.50677, "r": 480.58675999999997, "b": 545.3037400000001, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "trained and evaluated it on three publicly available data sets: PubTabNet (395k", "bbox": {"l": 134.765, "t": 548.4617800000001, "r": 480.59572999999995, "b": 557.25874, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "samples), FinTabNet (113k samples) and PubTables-1M (about 1M samples).", "bbox": {"l": 134.765, "t": 560.41678, "r": 480.59177000000005, "b": 569.21375, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "Performance results are presented in Table. 2. It is clearly evident that the model", "bbox": {"l": 134.765, "t": 572.37178, "r": 480.59069999999997, "b": 581.16875, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "trained on OTSL outperforms HTML across the board, keeping high TEDs and", "bbox": {"l": 134.765, "t": 584.32678, "r": 480.5957599999999, "b": 593.12375, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "mAP scores even on difficult financial tables (FinTabNet) that contain sparse", "bbox": {"l": 134.765, "t": 596.28278, "r": 480.58774, "b": 605.07974, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "and large tables.", "bbox": {"l": 134.765, "t": 608.2377799999999, "r": 206.78664, "b": 617.03474, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "We picked the model parameter configuration that produced the best prediction quality (enc=6, dec=6, heads=8) with PubTabNet alone, then independently trained and evaluated it on three publicly available data sets: PubTabNet (395k samples), FinTabNet (113k samples) and PubTables-1M (about 1M samples). Performance results are presented in Table. 2. It is clearly evident that the model trained on OTSL outperforms HTML across the board, keeping high TEDs and mAP scores even on difficult financial tables (FinTabNet) that contain sparse and large tables."}, {"label": "text", "id": 2, "page_no": 8, "cluster": {"id": 2, "label": "text", "bbox": {"l": 134.765, "t": 620.19278, "r": 480.5957599999999, "b": 664.8547599999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9851234555244446, "cells": [{"id": 101, "text": "Additionally, the results show that OTSL has an advantage over HTML", "bbox": {"l": 149.709, "t": 620.19278, "r": 480.59271, "b": 628.98975, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "when applied on a bigger data set like PubTables-1M and achieves significantly", "bbox": {"l": 134.765, "t": 632.14778, "r": 480.5957599999999, "b": 640.94475, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "improved scores. Finally, OTSL achieves faster inference due to fewer decoding", "bbox": {"l": 134.765, "t": 644.1027799999999, "r": 480.59283000000005, "b": 652.89975, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "steps which is a result of the reduced sequence representation.", "bbox": {"l": 134.765, "t": 656.0577900000001, "r": 405.79651, "b": 664.8547599999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Additionally, the results show that OTSL has an advantage over HTML when applied on a bigger data set like PubTables-1M and achieves significantly improved scores. Finally, OTSL achieves faster inference due to fewer decoding steps which is a result of the reduced sequence representation."}], "body": [{"label": "text", "id": 4, "page_no": 8, "cluster": {"id": 4, "label": "text", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.59579, "b": 151.64178000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9805440306663513, "cells": [{"id": 2, "text": "order to compute the TED score. Inference timing results for all experiments", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.5936899999999, "b": 127.73077, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "were obtained from the same machine on a single core with AMD EPYC 7763", "bbox": {"l": 134.765, "t": 130.88878999999997, "r": 480.59579, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "CPU @2.45 GHz.", "bbox": {"l": 134.765, "t": 142.84479, "r": 210.78462, "b": 151.64178000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "order to compute the TED score. Inference timing results for all experiments were obtained from the same machine on a single core with AMD EPYC 7763 CPU @2.45 GHz."}, {"label": "section_header", "id": 6, "page_no": 8, "cluster": {"id": 6, "label": "section_header", "bbox": {"l": 134.765, "t": 169.18584999999996, "r": 318.44843, "b": 177.9928, "coord_origin": "TOPLEFT"}, "confidence": 0.9579681158065796, "cells": [{"id": 5, "text": "5.1", "bbox": {"l": 134.765, "t": 169.18584999999996, "r": 149.40205, "b": 177.9928, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Hyper Parameter Optimization", "bbox": {"l": 160.85904, "t": 169.18584999999996, "r": 318.44843, "b": 177.9928, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5.1 Hyper Parameter Optimization"}, {"label": "text", "id": 3, "page_no": 8, "cluster": {"id": 3, "label": "text", "bbox": {"l": 134.76498, "t": 185.58582, "r": 480.59277, "b": 254.15886999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.9842326641082764, "cells": [{"id": 7, "text": "We have chosen the PubTabNet data set to perform HPO, since it includes a", "bbox": {"l": 134.765, "t": 185.58582, "r": 480.59183, "b": 194.38280999999995, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "highly diverse set of tables. Also we report TED scores separately for simple and", "bbox": {"l": 134.765, "t": 197.54083000000003, "r": 480.59183, "b": 206.33783000000005, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "complex tables (tables with cell spans). Results are presented in Table. 1. It is", "bbox": {"l": 134.765, "t": 209.49585000000002, "r": 480.59177000000005, "b": 218.29285000000004, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "evident that with OTSL, our model achieves the same TED score and slightly", "bbox": {"l": 134.765, "t": 221.45087, "r": 480.59277, "b": 230.24785999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "better mAP scores in comparison to HTML. However OTSL yields a", "bbox": {"l": 134.765, "t": 233.40588000000002, "r": 440.94159, "b": 242.20288000000005, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "2x speed", "bbox": {"l": 444.86798, "t": 233.40588000000002, "r": 480.58786000000003, "b": 242.20288000000005, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "up", "bbox": {"l": 134.76498, "t": 245.36188000000004, "r": 145.20081, "b": 254.15886999999998, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "in the inference runtime over HTML.", "bbox": {"l": 149.14899, "t": 245.36188000000004, "r": 311.21957, "b": 254.15886999999998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "We have chosen the PubTabNet data set to perform HPO, since it includes a highly diverse set of tables. Also we report TED scores separately for simple and complex tables (tables with cell spans). Results are presented in Table. 1. It is evident that with OTSL, our model achieves the same TED score and slightly better mAP scores in comparison to HTML. However OTSL yields a 2x speed up in the inference runtime over HTML."}, {"label": "caption", "id": 7, "page_no": 8, "cluster": {"id": 7, "label": "caption", "bbox": {"l": 134.76498, "t": 275.07232999999997, "r": 480.5954, "b": 327.0408, "coord_origin": "TOPLEFT"}, "confidence": 0.9570781588554382, "cells": [{"id": 15, "text": "Table", "bbox": {"l": 134.76498, "t": 275.07232999999997, "r": 160.11836, "b": 282.9986, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "1.", "bbox": {"l": 167.34528, "t": 275.07232999999997, "r": 175.59526, "b": 282.9986, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "HPO performed in OTSL and HTML representation on the same", "bbox": {"l": 188.13298, "t": 275.13507000000004, "r": 480.59365999999994, "b": 283.2048300000001, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "transformer-based TableFormer [9] architecture, trained only on PubTabNet [22]. Ef-", "bbox": {"l": 134.76498, "t": 286.09409, "r": 480.59444999999994, "b": 294.16385, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "fects of reducing the # of layers in encoder and decoder stages of the model show that", "bbox": {"l": 134.76498, "t": 297.05307, "r": 480.5954, "b": 305.12283, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "smaller models trained on OTSL perform better, especially in recognizing complex", "bbox": {"l": 134.76498, "t": 308.01205, "r": 480.59451, "b": 316.08182, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "table structures, and maintain a much higher mAP score than the HTML counterpart.", "bbox": {"l": 134.76498, "t": 318.97104, "r": 480.59441999999996, "b": 327.0408, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 1. HPO performed in OTSL and HTML representation on the same transformer-based TableFormer [9] architecture, trained only on PubTabNet [22]. Effects of reducing the # of layers in encoder and decoder stages of the model show that smaller models trained on OTSL perform better, especially in recognizing complex table structures, and maintain a much higher mAP score than the HTML counterpart."}, {"label": "table", "id": 0, "page_no": 8, "cluster": {"id": 0, "label": "table", "bbox": {"l": 139.66845703125, "t": 337.5747985839844, "r": 475.00372314453125, "b": 469.4721374511719, "coord_origin": "TOPLEFT"}, "confidence": 0.9901032447814941, "cells": [{"id": 22, "text": "#", "bbox": {"l": 160.37, "t": 341.73495, "r": 168.04793, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "enc-layers", "bbox": {"l": 144.592, "t": 354.68594, "r": 183.82806, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "#", "bbox": {"l": 207.974, "t": 341.73495, "r": 215.65193, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "dec-layers", "bbox": {"l": 192.19499, "t": 354.68594, "r": 231.43106, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "Language", "bbox": {"l": 239.79799999999997, "t": 347.21396, "r": 278.31766, "b": 355.28372, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "TEDs", "bbox": {"l": 324.67001, "t": 341.73495, "r": 348.26419, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "mAP", "bbox": {"l": 396.271, "t": 341.73495, "r": 417.12683, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "(0.75)", "bbox": {"l": 394.927, "t": 352.69394000000005, "r": 418.47278, "b": 360.7637, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Inference", "bbox": {"l": 430.771, "t": 341.73495, "r": 467.1423, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "time (secs)", "bbox": {"l": 427.14801, "t": 352.69394000000005, "r": 470.76056, "b": 360.7637, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "simple", "bbox": {"l": 286.686, "t": 354.68594, "r": 312.33261, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "complex", "bbox": {"l": 320.702, "t": 354.68594, "r": 353.71988, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "all", "bbox": {"l": 369.306, "t": 354.68594, "r": 379.03094, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "6", "bbox": {"l": 161.90601, "t": 373.51596, "r": 166.51294, "b": 381.58572, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "6", "bbox": {"l": 209.509, "t": 373.51596, "r": 214.11594, "b": 381.58572, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 368.03595, "r": 271.40527, "b": 376.10571, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "0.965", "bbox": {"l": 289.017, "t": 368.03595, "r": 310.00375, "b": 376.10571, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "0.934", "bbox": {"l": 326.71701, "t": 368.03595, "r": 347.70377, "b": 376.10571, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "0.955", "bbox": {"l": 363.67599, "t": 368.03595, "r": 384.66275, "b": 376.10571, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "0.88", "bbox": {"l": 397.26999, "t": 367.97317999999996, "r": 416.12723, "b": 375.89948, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "2.73", "bbox": {"l": 439.52701, "t": 367.97317999999996, "r": 458.38425, "b": 375.89948, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 380.98795, "r": 272.93954, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "0.969", "bbox": {"l": 289.017, "t": 380.98795, "r": 310.00375, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "0.927", "bbox": {"l": 326.71701, "t": 380.98795, "r": 347.70377, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "0.955", "bbox": {"l": 363.67599, "t": 380.98795, "r": 384.66275, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "0.857", "bbox": {"l": 396.20599, "t": 380.98795, "r": 417.19275, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "5.39", "bbox": {"l": 440.767, "t": 380.98795, "r": 457.14682, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "4", "bbox": {"l": 161.90601, "t": 399.81696, "r": 166.51294, "b": 407.88672, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "4", "bbox": {"l": 209.509, "t": 399.81696, "r": 214.11594, "b": 407.88672, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 394.33795, "r": 271.40527, "b": 402.40771, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "0.938", "bbox": {"l": 289.017, "t": 394.33795, "r": 310.00375, "b": 402.40771, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "0.904", "bbox": {"l": 326.71701, "t": 394.33795, "r": 347.70377, "b": 402.40771, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "0.927", "bbox": {"l": 363.67599, "t": 394.33795, "r": 384.66275, "b": 402.40771, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "0.853", "bbox": {"l": 394.61801, "t": 394.27518, "r": 418.77887, "b": 402.20148, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "1.97", "bbox": {"l": 439.52701, "t": 394.27518, "r": 458.38425, "b": 402.20148, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 407.28894, "r": 272.93954, "b": 415.3587, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "0.952", "bbox": {"l": 289.017, "t": 407.28894, "r": 310.00375, "b": 415.3587, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "0.909", "bbox": {"l": 326.71701, "t": 407.28894, "r": 347.70377, "b": 415.3587, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "0.938", "bbox": {"l": 362.08801, "t": 407.22617, "r": 386.24887, "b": 415.15247, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "0.843", "bbox": {"l": 396.20599, "t": 407.28894, "r": 417.19275, "b": 415.3587, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "3.77", "bbox": {"l": 440.767, "t": 407.28894, "r": 457.14682, "b": 415.3587, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "2", "bbox": {"l": 161.90601, "t": 426.11795, "r": 166.51294, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "4", "bbox": {"l": 209.509, "t": 426.11795, "r": 214.11594, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 420.63895, "r": 271.40527, "b": 428.70871, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "0.923", "bbox": {"l": 289.017, "t": 420.63895, "r": 310.00375, "b": 428.70871, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "0.897", "bbox": {"l": 326.71701, "t": 420.63895, "r": 347.70377, "b": 428.70871, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "0.915", "bbox": {"l": 363.67599, "t": 420.63895, "r": 384.66275, "b": 428.70871, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "0.859", "bbox": {"l": 394.61801, "t": 420.57617, "r": 418.77887, "b": 428.50247, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "1.91", "bbox": {"l": 439.52701, "t": 420.57617, "r": 458.38425, "b": 428.50247, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 433.58994, "r": 272.93954, "b": 441.6597, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "0.945", "bbox": {"l": 289.017, "t": 433.58994, "r": 310.00375, "b": 441.6597, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "0.901", "bbox": {"l": 326.71701, "t": 433.58994, "r": 347.70377, "b": 441.6597, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "0.931", "bbox": {"l": 362.08801, "t": 433.5271599999999, "r": 386.24887, "b": 441.45346, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "0.834", "bbox": {"l": 396.20599, "t": 433.58994, "r": 417.19275, "b": 441.6597, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "3.81", "bbox": {"l": 440.767, "t": 433.58994, "r": 457.14682, "b": 441.6597, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "4", "bbox": {"l": 161.90601, "t": 452.41995, "r": 166.51294, "b": 460.48972, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "2", "bbox": {"l": 209.509, "t": 452.41995, "r": 214.11594, "b": 460.48972, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 446.9399399999999, "r": 271.40527, "b": 455.0097, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "0.952", "bbox": {"l": 289.017, "t": 446.9399399999999, "r": 310.00375, "b": 455.0097, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "0.92", "bbox": {"l": 329.021, "t": 446.9399399999999, "r": 345.40082, "b": 455.0097, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "0.942", "bbox": {"l": 362.08801, "t": 446.87717, "r": 386.24887, "b": 454.80347, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "0.857", "bbox": {"l": 394.61801, "t": 446.87717, "r": 418.77887, "b": 454.80347, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "1.22", "bbox": {"l": 439.52701, "t": 446.87717, "r": 458.38425, "b": 454.80347, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 459.8919399999999, "r": 272.93954, "b": 467.9617, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "0.944", "bbox": {"l": 289.017, "t": 459.8919399999999, "r": 310.00375, "b": 467.9617, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "0.903", "bbox": {"l": 326.71701, "t": 459.8919399999999, "r": 347.70377, "b": 467.9617, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "0.931", "bbox": {"l": 363.67599, "t": 459.8919399999999, "r": 384.66275, "b": 467.9617, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "0.824", "bbox": {"l": 396.20599, "t": 459.8919399999999, "r": 417.19275, "b": 467.9617, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "2", "bbox": {"l": 446.65302, "t": 459.8919399999999, "r": 451.25995, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": [{"id": 10, "label": "text", "bbox": {"l": 160.37, "t": 341.73495, "r": 168.04793, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "#", "bbox": {"l": 160.37, "t": 341.73495, "r": 168.04793, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 144.592, "t": 354.68594, "r": 183.82806, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "enc-layers", "bbox": {"l": 144.592, "t": 354.68594, "r": 183.82806, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 207.974, "t": 341.73495, "r": 215.65193, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "#", "bbox": {"l": 207.974, "t": 341.73495, "r": 215.65193, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 192.19499, "t": 354.68594, "r": 231.43106, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "dec-layers", "bbox": {"l": 192.19499, "t": 354.68594, "r": 231.43106, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 239.79799999999997, "t": 347.21396, "r": 278.31766, "b": 355.28372, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "Language", "bbox": {"l": 239.79799999999997, "t": 347.21396, "r": 278.31766, "b": 355.28372, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 324.67001, "t": 341.73495, "r": 348.26419, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "TEDs", "bbox": {"l": 324.67001, "t": 341.73495, "r": 348.26419, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 396.271, "t": 341.73495, "r": 417.12683, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "mAP", "bbox": {"l": 396.271, "t": 341.73495, "r": 417.12683, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 394.927, "t": 352.69394000000005, "r": 418.47278, "b": 360.7637, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "(0.75)", "bbox": {"l": 394.927, "t": 352.69394000000005, "r": 418.47278, "b": 360.7637, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 430.771, "t": 341.73495, "r": 467.1423, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "Inference", "bbox": {"l": 430.771, "t": 341.73495, "r": 467.1423, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 427.14801, "t": 352.69394000000005, "r": 470.76056, "b": 360.7637, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "time (secs)", "bbox": {"l": 427.14801, "t": 352.69394000000005, "r": 470.76056, "b": 360.7637, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 286.686, "t": 354.68594, "r": 312.33261, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "simple", "bbox": {"l": 286.686, "t": 354.68594, "r": 312.33261, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 320.702, "t": 354.68594, "r": 353.71988, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "complex", "bbox": {"l": 320.702, "t": 354.68594, "r": 353.71988, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 369.306, "t": 354.68594, "r": 379.03094, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "all", "bbox": {"l": 369.306, "t": 354.68594, "r": 379.03094, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 161.90601, "t": 373.51596, "r": 166.51294, "b": 381.58572, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "6", "bbox": {"l": 161.90601, "t": 373.51596, "r": 166.51294, "b": 381.58572, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 209.509, "t": 373.51596, "r": 214.11594, "b": 381.58572, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "6", "bbox": {"l": 209.509, "t": 373.51596, "r": 214.11594, "b": 381.58572, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 246.71000999999998, "t": 368.03595, "r": 271.40527, "b": 376.10571, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 368.03595, "r": 271.40527, "b": 376.10571, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 289.017, "t": 368.03595, "r": 310.00375, "b": 376.10571, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "0.965", "bbox": {"l": 289.017, "t": 368.03595, "r": 310.00375, "b": 376.10571, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 326.71701, "t": 368.03595, "r": 347.70377, "b": 376.10571, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "0.934", "bbox": {"l": 326.71701, "t": 368.03595, "r": 347.70377, "b": 376.10571, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 363.67599, "t": 368.03595, "r": 384.66275, "b": 376.10571, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "0.955", "bbox": {"l": 363.67599, "t": 368.03595, "r": 384.66275, "b": 376.10571, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 397.26999, "t": 367.97317999999996, "r": 416.12723, "b": 375.89948, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "0.88", "bbox": {"l": 397.26999, "t": 367.97317999999996, "r": 416.12723, "b": 375.89948, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 439.52701, "t": 367.97317999999996, "r": 458.38425, "b": 375.89948, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "2.73", "bbox": {"l": 439.52701, "t": 367.97317999999996, "r": 458.38425, "b": 375.89948, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 245.17598999999998, "t": 380.98795, "r": 272.93954, "b": 389.05771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 380.98795, "r": 272.93954, "b": 389.05771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 289.017, "t": 380.98795, "r": 310.00375, "b": 389.05771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "0.969", "bbox": {"l": 289.017, "t": 380.98795, "r": 310.00375, "b": 389.05771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 326.71701, "t": 380.98795, "r": 347.70377, "b": 389.05771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "0.927", "bbox": {"l": 326.71701, "t": 380.98795, "r": 347.70377, "b": 389.05771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 363.67599, "t": 380.98795, "r": 384.66275, "b": 389.05771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "0.955", "bbox": {"l": 363.67599, "t": 380.98795, "r": 384.66275, "b": 389.05771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 396.20599, "t": 380.98795, "r": 417.19275, "b": 389.05771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "0.857", "bbox": {"l": 396.20599, "t": 380.98795, "r": 417.19275, "b": 389.05771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 440.767, "t": 380.98795, "r": 457.14682, "b": 389.05771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "5.39", "bbox": {"l": 440.767, "t": 380.98795, "r": 457.14682, "b": 389.05771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 161.90601, "t": 399.81696, "r": 166.51294, "b": 407.88672, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "4", "bbox": {"l": 161.90601, "t": 399.81696, "r": 166.51294, "b": 407.88672, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 209.509, "t": 399.81696, "r": 214.11594, "b": 407.88672, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "4", "bbox": {"l": 209.509, "t": 399.81696, "r": 214.11594, "b": 407.88672, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 246.71000999999998, "t": 394.33795, "r": 271.40527, "b": 402.40771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 394.33795, "r": 271.40527, "b": 402.40771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 289.017, "t": 394.33795, "r": 310.00375, "b": 402.40771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "0.938", "bbox": {"l": 289.017, "t": 394.33795, "r": 310.00375, "b": 402.40771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 326.71701, "t": 394.33795, "r": 347.70377, "b": 402.40771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "0.904", "bbox": {"l": 326.71701, "t": 394.33795, "r": 347.70377, "b": 402.40771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 363.67599, "t": 394.33795, "r": 384.66275, "b": 402.40771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "0.927", "bbox": {"l": 363.67599, "t": 394.33795, "r": 384.66275, "b": 402.40771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 394.61801, "t": 394.27518, "r": 418.77887, "b": 402.20148, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "0.853", "bbox": {"l": 394.61801, "t": 394.27518, "r": 418.77887, "b": 402.20148, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 439.52701, "t": 394.27518, "r": 458.38425, "b": 402.20148, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "1.97", "bbox": {"l": 439.52701, "t": 394.27518, "r": 458.38425, "b": 402.20148, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 245.17598999999998, "t": 407.28894, "r": 272.93954, "b": 415.3587, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 407.28894, "r": 272.93954, "b": 415.3587, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 289.017, "t": 407.28894, "r": 310.00375, "b": 415.3587, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "0.952", "bbox": {"l": 289.017, "t": 407.28894, "r": 310.00375, "b": 415.3587, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 326.71701, "t": 407.28894, "r": 347.70377, "b": 415.3587, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "0.909", "bbox": {"l": 326.71701, "t": 407.28894, "r": 347.70377, "b": 415.3587, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 362.08801, "t": 407.22617, "r": 386.24887, "b": 415.15247, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "0.938", "bbox": {"l": 362.08801, "t": 407.22617, "r": 386.24887, "b": 415.15247, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 396.20599, "t": 407.28894, "r": 417.19275, "b": 415.3587, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "0.843", "bbox": {"l": 396.20599, "t": 407.28894, "r": 417.19275, "b": 415.3587, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 440.767, "t": 407.28894, "r": 457.14682, "b": 415.3587, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "3.77", "bbox": {"l": 440.767, "t": 407.28894, "r": 457.14682, "b": 415.3587, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 161.90601, "t": 426.11795, "r": 166.51294, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "2", "bbox": {"l": 161.90601, "t": 426.11795, "r": 166.51294, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 209.509, "t": 426.11795, "r": 214.11594, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "4", "bbox": {"l": 209.509, "t": 426.11795, "r": 214.11594, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 246.71000999999998, "t": 420.63895, "r": 271.40527, "b": 428.70871, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 420.63895, "r": 271.40527, "b": 428.70871, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 289.017, "t": 420.63895, "r": 310.00375, "b": 428.70871, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "0.923", "bbox": {"l": 289.017, "t": 420.63895, "r": 310.00375, "b": 428.70871, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 326.71701, "t": 420.63895, "r": 347.70377, "b": 428.70871, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "0.897", "bbox": {"l": 326.71701, "t": 420.63895, "r": 347.70377, "b": 428.70871, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 363.67599, "t": 420.63895, "r": 384.66275, "b": 428.70871, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "0.915", "bbox": {"l": 363.67599, "t": 420.63895, "r": 384.66275, "b": 428.70871, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 394.61801, "t": 420.57617, "r": 418.77887, "b": 428.50247, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "0.859", "bbox": {"l": 394.61801, "t": 420.57617, "r": 418.77887, "b": 428.50247, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 439.52701, "t": 420.57617, "r": 458.38425, "b": 428.50247, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "1.91", "bbox": {"l": 439.52701, "t": 420.57617, "r": 458.38425, "b": 428.50247, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 245.17598999999998, "t": 433.58994, "r": 272.93954, "b": 441.6597, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 433.58994, "r": 272.93954, "b": 441.6597, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 289.017, "t": 433.58994, "r": 310.00375, "b": 441.6597, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "0.945", "bbox": {"l": 289.017, "t": 433.58994, "r": 310.00375, "b": 441.6597, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 326.71701, "t": 433.58994, "r": 347.70377, "b": 441.6597, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "0.901", "bbox": {"l": 326.71701, "t": 433.58994, "r": 347.70377, "b": 441.6597, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 362.08801, "t": 433.5271599999999, "r": 386.24887, "b": 441.45346, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "0.931", "bbox": {"l": 362.08801, "t": 433.5271599999999, "r": 386.24887, "b": 441.45346, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 396.20599, "t": 433.58994, "r": 417.19275, "b": 441.6597, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "0.834", "bbox": {"l": 396.20599, "t": 433.58994, "r": 417.19275, "b": 441.6597, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 440.767, "t": 433.58994, "r": 457.14682, "b": 441.6597, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "3.81", "bbox": {"l": 440.767, "t": 433.58994, "r": 457.14682, "b": 441.6597, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 161.90601, "t": 452.41995, "r": 166.51294, "b": 460.48972, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "4", "bbox": {"l": 161.90601, "t": 452.41995, "r": 166.51294, "b": 460.48972, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 209.509, "t": 452.41995, "r": 214.11594, "b": 460.48972, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "2", "bbox": {"l": 209.509, "t": 452.41995, "r": 214.11594, "b": 460.48972, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 246.71000999999998, "t": 446.9399399999999, "r": 271.40527, "b": 455.0097, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 446.9399399999999, "r": 271.40527, "b": 455.0097, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 289.017, "t": 446.9399399999999, "r": 310.00375, "b": 455.0097, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "0.952", "bbox": {"l": 289.017, "t": 446.9399399999999, "r": 310.00375, "b": 455.0097, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 329.021, "t": 446.9399399999999, "r": 345.40082, "b": 455.0097, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "0.92", "bbox": {"l": 329.021, "t": 446.9399399999999, "r": 345.40082, "b": 455.0097, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 362.08801, "t": 446.87717, "r": 386.24887, "b": 454.80347, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "0.942", "bbox": {"l": 362.08801, "t": 446.87717, "r": 386.24887, "b": 454.80347, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 394.61801, "t": 446.87717, "r": 418.77887, "b": 454.80347, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "0.857", "bbox": {"l": 394.61801, "t": 446.87717, "r": 418.77887, "b": 454.80347, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 439.52701, "t": 446.87717, "r": 458.38425, "b": 454.80347, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "1.22", "bbox": {"l": 439.52701, "t": 446.87717, "r": 458.38425, "b": 454.80347, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 245.17598999999998, "t": 459.8919399999999, "r": 272.93954, "b": 467.9617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 459.8919399999999, "r": 272.93954, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 289.017, "t": 459.8919399999999, "r": 310.00375, "b": 467.9617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "0.944", "bbox": {"l": 289.017, "t": 459.8919399999999, "r": 310.00375, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 326.71701, "t": 459.8919399999999, "r": 347.70377, "b": 467.9617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "0.903", "bbox": {"l": 326.71701, "t": 459.8919399999999, "r": 347.70377, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 363.67599, "t": 459.8919399999999, "r": 384.66275, "b": 467.9617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "0.931", "bbox": {"l": 363.67599, "t": 459.8919399999999, "r": 384.66275, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 396.20599, "t": 459.8919399999999, "r": 417.19275, "b": 467.9617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "0.824", "bbox": {"l": 396.20599, "t": 459.8919399999999, "r": 417.19275, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 446.65302, "t": 459.8919399999999, "r": 451.25995, "b": 467.9617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "2", "bbox": {"l": 446.65302, "t": 459.8919399999999, "r": 451.25995, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "lcel", "lcel", "ched", "ched", "nl", "ched", "ched", "ucel", "ched", "ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 7, "num_cols": 8, "table_cells": [{"bbox": {"l": 160.37, "t": 341.73495, "r": 168.04793, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "#", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 144.592, "t": 354.68594, "r": 183.82806, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "enc-layers", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 207.974, "t": 341.73495, "r": 215.65193, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "#", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 192.19499, "t": 354.68594, "r": 231.43106, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "dec-layers", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 239.79799999999997, "t": 347.21396, "r": 278.31766, "b": 355.28372, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Language", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 324.67001, "t": 341.73495, "r": 348.26419, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 3, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 6, "text": "TEDs", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 396.271, "t": 341.73495, "r": 417.12683, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "mAP", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 394.927, "t": 352.69394000000005, "r": 418.47278, "b": 360.7637, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "(0.75)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 430.771, "t": 341.73495, "r": 467.1423, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "Inference", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 427.14801, "t": 352.69394000000005, "r": 470.76056, "b": 360.7637, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "time (secs)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 286.686, "t": 354.68594, "r": 312.33261, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "simple", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 320.702, "t": 354.68594, "r": 353.71988, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "complex", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 369.306, "t": 354.68594, "r": 379.03094, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "all", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 161.90601, "t": 373.51596, "r": 166.51294, "b": 381.58572, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 373.51596, "r": 214.11594, "b": 381.58572, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 368.03595, "r": 272.93954, "b": 389.05771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 368.03595, "r": 310.00375, "b": 389.05771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.965 0.969", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 368.03595, "r": 347.70377, "b": 389.05771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.934 0.927", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 363.67599, "t": 368.03595, "r": 384.66275, "b": 389.05771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.955 0.955", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 396.20599, "t": 367.97317999999996, "r": 417.19275, "b": 389.05771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.88 0.857", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 367.97317999999996, "r": 458.38425, "b": 389.05771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "2.73 5.39", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 161.90601, "t": 399.81696, "r": 166.51294, "b": 407.88672, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 399.81696, "r": 214.11594, "b": 407.88672, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 394.33795, "r": 272.93954, "b": 415.3587, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 394.33795, "r": 310.00375, "b": 415.3587, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.938 0.952", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 394.33795, "r": 347.70377, "b": 402.40771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.904", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 363.67599, "t": 394.33795, "r": 384.66275, "b": 402.40771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.927", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.61801, "t": 394.27518, "r": 418.77887, "b": 402.20148, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.853", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 394.27518, "r": 458.38425, "b": 402.20148, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "1.97", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 407.28894, "r": 347.70377, "b": 428.70871, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.909 0.897", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 362.08801, "t": 407.22617, "r": 386.24887, "b": 415.15247, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.938", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 396.20599, "t": 407.28894, "r": 417.19275, "b": 415.3587, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.843", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.767, "t": 407.28894, "r": 457.14682, "b": 415.3587, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "3.77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 161.90601, "t": 426.11795, "r": 166.51294, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 426.11795, "r": 214.11594, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 246.71000999999998, "t": 420.63895, "r": 271.40527, "b": 428.70871, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 420.63895, "r": 310.00375, "b": 441.6597, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.923 0.945", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 362.08801, "t": 420.63895, "r": 386.24887, "b": 441.45346, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.915 0.931", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.61801, "t": 420.57617, "r": 418.77887, "b": 441.6597, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.859 0.834", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 420.57617, "r": 458.38425, "b": 441.6597, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "1.91 3.81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 433.58994, "r": 272.93954, "b": 441.6597, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 433.58994, "r": 347.70377, "b": 441.6597, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.901", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 161.90601, "t": 452.41995, "r": 166.51294, "b": 460.48972, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 452.41995, "r": 214.11594, "b": 460.48972, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 446.9399399999999, "r": 272.93954, "b": 467.9617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 446.9399399999999, "r": 310.00375, "b": 467.9617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.952 0.944", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 446.9399399999999, "r": 347.70377, "b": 467.9617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.92 0.903", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 362.08801, "t": 446.87717, "r": 386.24887, "b": 467.9617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.942 0.931", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.61801, "t": 446.87717, "r": 418.77887, "b": 467.9617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.857 0.824", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 446.87717, "r": 458.38425, "b": 467.9617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "1.22 2", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "section_header", "id": 5, "page_no": 8, "cluster": {"id": 5, "label": "section_header", "bbox": {"l": 134.765, "t": 508.15179, "r": 264.40332, "b": 516.95874, "coord_origin": "TOPLEFT"}, "confidence": 0.9592539668083191, "cells": [{"id": 91, "text": "5.2", "bbox": {"l": 134.765, "t": 508.15179, "r": 149.40205, "b": 516.95874, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Quantitative Results", "bbox": {"l": 160.85904, "t": 508.15179, "r": 264.40332, "b": 516.95874, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5.2 Quantitative Results"}, {"label": "text", "id": 1, "page_no": 8, "cluster": {"id": 1, "label": "text", "bbox": {"l": 134.765, "t": 524.55078, "r": 480.5957599999999, "b": 617.03474, "coord_origin": "TOPLEFT"}, "confidence": 0.9854757189750671, "cells": [{"id": 93, "text": "We picked the model parameter configuration that produced the best prediction", "bbox": {"l": 134.765, "t": 524.55078, "r": 480.59075999999993, "b": 533.34775, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "quality (enc=6, dec=6, heads=8) with PubTabNet alone, then independently", "bbox": {"l": 134.765, "t": 536.50677, "r": 480.58675999999997, "b": 545.3037400000001, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "trained and evaluated it on three publicly available data sets: PubTabNet (395k", "bbox": {"l": 134.765, "t": 548.4617800000001, "r": 480.59572999999995, "b": 557.25874, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "samples), FinTabNet (113k samples) and PubTables-1M (about 1M samples).", "bbox": {"l": 134.765, "t": 560.41678, "r": 480.59177000000005, "b": 569.21375, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "Performance results are presented in Table. 2. It is clearly evident that the model", "bbox": {"l": 134.765, "t": 572.37178, "r": 480.59069999999997, "b": 581.16875, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "trained on OTSL outperforms HTML across the board, keeping high TEDs and", "bbox": {"l": 134.765, "t": 584.32678, "r": 480.5957599999999, "b": 593.12375, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "mAP scores even on difficult financial tables (FinTabNet) that contain sparse", "bbox": {"l": 134.765, "t": 596.28278, "r": 480.58774, "b": 605.07974, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "and large tables.", "bbox": {"l": 134.765, "t": 608.2377799999999, "r": 206.78664, "b": 617.03474, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "We picked the model parameter configuration that produced the best prediction quality (enc=6, dec=6, heads=8) with PubTabNet alone, then independently trained and evaluated it on three publicly available data sets: PubTabNet (395k samples), FinTabNet (113k samples) and PubTables-1M (about 1M samples). Performance results are presented in Table. 2. It is clearly evident that the model trained on OTSL outperforms HTML across the board, keeping high TEDs and mAP scores even on difficult financial tables (FinTabNet) that contain sparse and large tables."}, {"label": "text", "id": 2, "page_no": 8, "cluster": {"id": 2, "label": "text", "bbox": {"l": 134.765, "t": 620.19278, "r": 480.5957599999999, "b": 664.8547599999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9851234555244446, "cells": [{"id": 101, "text": "Additionally, the results show that OTSL has an advantage over HTML", "bbox": {"l": 149.709, "t": 620.19278, "r": 480.59271, "b": 628.98975, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "when applied on a bigger data set like PubTables-1M and achieves significantly", "bbox": {"l": 134.765, "t": 632.14778, "r": 480.5957599999999, "b": 640.94475, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "improved scores. Finally, OTSL achieves faster inference due to fewer decoding", "bbox": {"l": 134.765, "t": 644.1027799999999, "r": 480.59283000000005, "b": 652.89975, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "steps which is a result of the reduced sequence representation.", "bbox": {"l": 134.765, "t": 656.0577900000001, "r": 405.79651, "b": 664.8547599999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Additionally, the results show that OTSL has an advantage over HTML when applied on a bigger data set like PubTables-1M and achieves significantly improved scores. Finally, OTSL achieves faster inference due to fewer decoding steps which is a result of the reduced sequence representation."}], "headers": [{"label": "page_header", "id": 8, "page_no": 8, "cluster": {"id": 8, "label": "page_header", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9373378753662109, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Optimized Table Tokenization for Table Structure Recognition"}, {"label": "page_header", "id": 9, "page_no": 8, "cluster": {"id": 9, "label": "page_header", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8857625722885132, "cells": [{"id": 1, "text": "9", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "9"}]}}, {"page_no": 9, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "10", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 143.97887, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "M.", "bbox": {"l": 167.82053, "t": 93.77099999999996, "r": 178.08249, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37929, "t": 93.77099999999996, "r": 231.72049000000004, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Table 2.", "bbox": {"l": 134.765, "t": 115.83618000000001, "r": 173.09366, "b": 123.76251000000002, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "TSR and cell detection results compared between OTSL and HTML on", "bbox": {"l": 181.30299, "t": 115.89899000000003, "r": 480.59151999999995, "b": 123.96868999999992, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "the PubTabNet [22], FinTabNet [21] and PubTables-1M [14] data sets using Table-", "bbox": {"l": 134.765, "t": 126.85797000000014, "r": 480.59357000000006, "b": 134.92767000000003, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Former [9] (with enc=6, dec=6, heads=8).", "bbox": {"l": 134.765, "t": 137.81696, "r": 305.95691, "b": 145.88666, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Data set", "bbox": {"l": 160.782, "t": 166.55895999999996, "r": 194.99779, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Language", "bbox": {"l": 215.52499000000003, "t": 166.534, "r": 254.04465, "b": 174.6037, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "TEDs", "bbox": {"l": 300.397, "t": 161.07898, "r": 323.99118, "b": 169.14868, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "mAP(0.75)", "bbox": {"l": 370.345, "t": 166.55895999999996, "r": 414.74661, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Inference", "bbox": {"l": 426.737, "t": 161.07898, "r": 463.10830999999996, "b": 169.14868, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "time (secs)", "bbox": {"l": 423.11401, "t": 172.03796, "r": 466.72656, "b": 180.10766999999998, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "simple", "bbox": {"l": 262.41299, "t": 174.03101000000004, "r": 288.0596, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "complex", "bbox": {"l": 296.42899, "t": 174.03101000000004, "r": 329.44687, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "all", "bbox": {"l": 345.03299, "t": 174.03101000000004, "r": 354.75793, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "PubTabNet", "bbox": {"l": 154.53799, "t": 192.85999000000004, "r": 201.24129, "b": 200.92969000000005, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "OTSL", "bbox": {"l": 222.43700000000004, "t": 187.38098000000002, "r": 247.13226000000003, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "0.965", "bbox": {"l": 264.74399, "t": 187.38098000000002, "r": 285.73074, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "0.934", "bbox": {"l": 302.444, "t": 187.38098000000002, "r": 323.43076, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "0.955", "bbox": {"l": 339.40302, "t": 187.38098000000002, "r": 360.38977, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "0.88", "bbox": {"l": 383.116, "t": 187.31817999999998, "r": 401.97324, "b": 195.24451, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "2.73", "bbox": {"l": 435.49300999999997, "t": 187.31817999999998, "r": 454.35025, "b": 195.24451, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "HTML", "bbox": {"l": 220.903, "t": 200.33196999999996, "r": 248.66655999999998, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "0.969", "bbox": {"l": 264.74399, "t": 200.33196999999996, "r": 285.73074, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "0.927", "bbox": {"l": 302.444, "t": 200.33196999999996, "r": 323.43076, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "0.955", "bbox": {"l": 339.40302, "t": 200.33196999999996, "r": 360.38977, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "0.857", "bbox": {"l": 382.052, "t": 200.33196999999996, "r": 403.03876, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "5.39", "bbox": {"l": 436.73199000000005, "t": 200.33196999999996, "r": 453.11182, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "FinTabNet", "bbox": {"l": 155.94501, "t": 219.16198999999995, "r": 199.83374, "b": 227.23168999999996, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "OTSL", "bbox": {"l": 222.43700000000004, "t": 213.68201, "r": 247.13226000000003, "b": 221.75171, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "0.955", "bbox": {"l": 264.74399, "t": 213.68201, "r": 285.73074, "b": 221.75171, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "0.961", "bbox": {"l": 302.444, "t": 213.68201, "r": 323.43076, "b": 221.75171, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "0.959", "bbox": {"l": 337.815, "t": 213.61919999999998, "r": 361.97586, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "0.862", "bbox": {"l": 380.46399, "t": 213.61919999999998, "r": 404.62485, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "1.85", "bbox": {"l": 435.49300999999997, "t": 213.61919999999998, "r": 454.35025, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "HTML", "bbox": {"l": 220.903, "t": 226.63396999999998, "r": 248.66655999999998, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "0.917", "bbox": {"l": 264.74399, "t": 226.63396999999998, "r": 285.73074, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "0.922", "bbox": {"l": 302.444, "t": 226.63396999999998, "r": 323.43076, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "0.92", "bbox": {"l": 341.70599, "t": 226.63396999999998, "r": 358.08582, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "0.722", "bbox": {"l": 382.052, "t": 226.63396999999998, "r": 403.03876, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "3.26", "bbox": {"l": 436.73199000000005, "t": 226.63396999999998, "r": 453.11182, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "PubTables-1M", "bbox": {"l": 148.62601, "t": 245.46294999999998, "r": 207.1524, "b": 253.53265, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "OTSL", "bbox": {"l": 222.43700000000004, "t": 239.98297000000002, "r": 247.13226000000003, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "0.987", "bbox": {"l": 264.74399, "t": 239.98297000000002, "r": 285.73074, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "0.964", "bbox": {"l": 302.444, "t": 239.98297000000002, "r": 323.43076, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "0.977", "bbox": {"l": 337.815, "t": 239.92016999999998, "r": 361.97586, "b": 247.8465, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "0.896", "bbox": {"l": 380.46399, "t": 239.92016999999998, "r": 404.62485, "b": 247.8465, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "1.79", "bbox": {"l": 435.49300999999997, "t": 239.92016999999998, "r": 454.35025, "b": 247.8465, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "HTML", "bbox": {"l": 220.903, "t": 252.93499999999995, "r": 248.66655999999998, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "0.983", "bbox": {"l": 264.74399, "t": 252.93499999999995, "r": 285.73074, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "0.944", "bbox": {"l": 302.444, "t": 252.93499999999995, "r": 323.43076, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "0.966", "bbox": {"l": 339.40302, "t": 252.93499999999995, "r": 360.38977, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "0.889", "bbox": {"l": 382.052, "t": 252.93499999999995, "r": 403.03876, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "3.26", "bbox": {"l": 436.73199000000005, "t": 252.93499999999995, "r": 453.11182, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "5.3", "bbox": {"l": 134.765, "t": 288.91479, "r": 149.40205, "b": 297.72173999999995, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Qualitative Results", "bbox": {"l": 160.85904, "t": 288.91479, "r": 257.08679, "b": 297.72173999999995, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "To illustrate the qualitative differences between OTSL and HTML, Figure 5", "bbox": {"l": 134.765, "t": 309.86078, "r": 480.58777, "b": 318.65775, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "demonstrates less overlap and more accurate bounding boxes with OTSL. In", "bbox": {"l": 134.765, "t": 321.81577, "r": 480.58889999999997, "b": 330.61273, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Figure 6, OTSL proves to be more effective in handling tables with longer to-", "bbox": {"l": 134.765, "t": 333.77075, "r": 480.58681999999993, "b": 342.56772, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "ken sequences, resulting in even more precise structure prediction and bounding", "bbox": {"l": 134.765, "t": 345.72574, "r": 480.58981, "b": 354.52271, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "boxes.", "bbox": {"l": 134.765, "t": 357.68073, "r": 161.65704, "b": 366.47769, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "Fig. 5.", "bbox": {"l": 134.765, "t": 397.59012, "r": 162.64424, "b": 405.51642, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "The OTSL model produces more accurate bounding boxes with less over-", "bbox": {"l": 167.384, "t": 397.65289, "r": 480.59106, "b": 405.72266, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "lap (E) than the HTML model (D), when predicting the structure of a sparse ta-", "bbox": {"l": 134.765, "t": 408.61190999999997, "r": 480.59106, "b": 416.68167000000005, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "ble (A), at twice the inference speed because of shorter sequence length (B),(C).", "bbox": {"l": 134.765, "t": 419.57089, "r": 480.58838000000003, "b": 427.64066, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "\"PMC2807444_006_00.png\" PubTabNet.", "bbox": {"l": 134.765, "t": 430.52987999999993, "r": 304.69171, "b": 438.59964, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "<table>", "bbox": {"l": 180.12473, "t": 516.2332200000001, "r": 190.62042, "b": 518.94992, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "<tr><td></td><td colspan=\"4\"></td><td colspan=\"6\"></td><td colspan=\"3\"></td></tr>", "bbox": {"l": 183.2438, "t": 520.13208, "r": 304.54797, "b": 522.84879, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 524.03094, "r": 388.42313, "b": 526.74765, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 527.9297799999999, "r": 388.42313, "b": 530.64648, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 531.82861, "r": 388.42313, "b": 534.54532, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 535.72748, "r": 388.42313, "b": 538.44418, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 539.62631, "r": 388.42313, "b": 542.34303, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 543.52516, "r": 388.42313, "b": 546.24188, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 547.42401, "r": 388.42313, "b": 550.14073, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 551.32286, "r": 388.42313, "b": 554.03958, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "</table>", "bbox": {"l": 180.12473, "t": 555.22173, "r": 191.86806, "b": 557.93845, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "C", "bbox": {"l": 407.38348, "t": 518.30042, "r": 408.82025, "b": 521.01712, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "C L L L C L L L L L C L L NL", "bbox": {"l": 410.25699, "t": 518.30042, "r": 450.48605, "b": 521.01712, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "C", "bbox": {"l": 407.38348, "t": 522.19925, "r": 408.82025, "b": 524.9159500000001, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 522.19925, "r": 450.48605, "b": 524.9159500000001, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "C", "bbox": {"l": 407.38348, "t": 526.09808, "r": 408.82025, "b": 528.81479, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 526.09808, "r": 450.48605, "b": 528.81479, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "C", "bbox": {"l": 407.38348, "t": 529.99695, "r": 408.82025, "b": 532.7136499999999, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 529.99695, "r": 450.48605, "b": 532.7136499999999, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "C", "bbox": {"l": 407.38348, "t": 533.8957800000001, "r": 408.82025, "b": 536.6125, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 533.8957800000001, "r": 450.48605, "b": 536.6125, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "C", "bbox": {"l": 407.38348, "t": 537.79463, "r": 408.82025, "b": 540.51135, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 537.79463, "r": 450.48605, "b": 540.51135, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "C", "bbox": {"l": 407.38348, "t": 541.69348, "r": 408.82025, "b": 544.4102, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 541.69348, "r": 450.48605, "b": 544.4102, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "C", "bbox": {"l": 407.38348, "t": 545.59233, "r": 408.82025, "b": 548.3090500000001, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 545.59233, "r": 450.48605, "b": 548.3090500000001, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "C", "bbox": {"l": 407.38348, "t": 549.4911999999999, "r": 408.82025, "b": 552.2079200000001, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 549.4911999999999, "r": 450.48605, "b": 552.2079200000001, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "HTML", "bbox": {"l": 164.52881, "t": 509.45859, "r": 181.8528, "b": 515.31, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "#", "bbox": {"l": 183.58441, "t": 509.45859, "r": 186.3974, "b": 515.31, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "tokens:", "bbox": {"l": 189.2104, "t": 509.45859, "r": 208.90137, "b": 515.31, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "258", "bbox": {"l": 210.63269, "t": 509.45859, "r": 221.04044, "b": 515.31, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "OTSL", "bbox": {"l": 390.20203, "t": 509.60361, "r": 406.83609, "b": 515.45502, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "#", "bbox": {"l": 408.56952, "t": 509.60361, "r": 411.38251, "b": 515.45502, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "tokens:", "bbox": {"l": 414.1955, "t": 509.60361, "r": 433.88647000000003, "b": 515.45502, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "135", "bbox": {"l": 435.61737, "t": 509.60361, "r": 446.02512, "b": 515.45502, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "B", "bbox": {"l": 167.19316, "t": 519.07236, "r": 172.8231, "b": 526.3866, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "A", "bbox": {"l": 187.33745, "t": 448.62485, "r": 192.96739, "b": 455.93909, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "D", "bbox": {"l": 167.38654, "t": 566.0051599999999, "r": 173.01648, "b": 573.3194, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "E", "bbox": {"l": 248.45621000000003, "t": 621.78008, "r": 253.65727, "b": 629.09431, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "C", "bbox": {"l": 395.90057, "t": 519.19946, "r": 401.53052, "b": 526.5137, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "HTML", "bbox": {"l": 171.62886, "t": 580.28853, "r": 177.48148, "b": 597.26784, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "OTSL", "bbox": {"l": 251.05969000000002, "t": 633.63408, "r": 256.91235, "b": 649.92345, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "HTML model shows", "bbox": {"l": 372.14645, "t": 601.45724, "r": 427.0379, "b": 607.30864, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "bounding box drifting", "bbox": {"l": 372.14645, "t": 607.89948, "r": 430.06838999999997, "b": 613.75087, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "OTSL model shows", "bbox": {"l": 176.88042, "t": 642.87209, "r": 231.08191, "b": 648.72348, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "clean bounding box", "bbox": {"l": 176.88042, "t": 649.3143, "r": 230.99271000000002, "b": 655.1657, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "alignment", "bbox": {"l": 176.88042, "t": 655.7565500000001, "r": 203.93219, "b": 661.60794, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "\u2264", "bbox": {"l": 215.93231000000003, "t": 557.56342, "r": 218.4697, "b": 569.15967, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "\u03bc", "bbox": {"l": 229.05689999999998, "t": 557.56342, "r": 231.71908999999997, "b": 569.15967, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "\u03bc", "bbox": {"l": 342.63354, "t": 430.19678, "r": 344.81915, "b": 439.71716, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "S", "bbox": {"l": 261.20892, "t": 448.46124, "r": 263.56973, "b": 451.19727, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "I", "bbox": {"l": 312.33463, "t": 448.46124, "r": 313.6362, "b": 451.19727, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "R", "bbox": {"l": 377.41125, "t": 448.46124, "r": 380.05737, "b": 451.19727, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "ST", "bbox": {"l": 200.63976, "t": 453.33997, "r": 205.82492, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "0.03", "bbox": {"l": 222.20833000000002, "t": 453.33997, "r": 229.76836, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "0.06", "bbox": {"l": 243.26666, "t": 453.33997, "r": 250.82669, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "0.12", "bbox": {"l": 264.29657, "t": 453.33997, "r": 271.84949, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "0.25", "bbox": {"l": 285.31943, "t": 453.33997, "r": 292.87946, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "0.5", "bbox": {"l": 306.37775, "t": 453.33997, "r": 311.77319, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "1", "bbox": {"l": 323.41699, "t": 453.33997, "r": 325.58157, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "2", "bbox": {"l": 334.45807, "t": 453.33997, "r": 336.62265, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "4", "bbox": {"l": 345.52756, "t": 453.33997, "r": 347.69214, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "8", "bbox": {"l": 356.56863, "t": 453.33997, "r": 358.73322, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "16", "bbox": {"l": 367.63812, "t": 453.33997, "r": 371.97089, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "32", "bbox": {"l": 382.6734, "t": 453.33997, "r": 387.00616, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "64", "bbox": {"l": 397.73727, "t": 453.33997, "r": 402.07001, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "\u2265", "bbox": {"l": 412.78879, "t": 447.99298, "r": 414.93463, "b": 457.79964999999993, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": " 128", "bbox": {"l": 414.95697, "t": 453.33997, "r": 422.51746, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "63", "bbox": {"l": 200.63998, "t": 463.92444, "r": 204.57674, "b": 466.66043, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "1", "bbox": {"l": 367.62604, "t": 463.92444, "r": 369.58032, "b": 466.66043, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "1", "bbox": {"l": 382.66132, "t": 463.92444, "r": 384.6156, "b": 466.66043, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "3", "bbox": {"l": 397.72504, "t": 463.92444, "r": 399.67932, "b": 466.66043, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "199", "bbox": {"l": 200.64, "t": 468.80313, "r": 206.51694, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "5", "bbox": {"l": 264.29047, "t": 468.80313, "r": 266.25885, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "1", "bbox": {"l": 306.37213, "t": 468.80313, "r": 308.34052, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "2", "bbox": {"l": 345.51526, "t": 468.80313, "r": 347.48364, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "4", "bbox": {"l": 356.55634, "t": 468.80313, "r": 358.52472, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "1", "bbox": {"l": 367.62582, "t": 468.80313, "r": 369.59418, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "1", "bbox": {"l": 382.66107, "t": 468.80313, "r": 384.62946, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "416", "bbox": {"l": 200.64, "t": 473.68185, "r": 206.51694, "b": 476.41788, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "4", "bbox": {"l": 264.29047, "t": 473.68185, "r": 266.25885, "b": 476.41788, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "230", "bbox": {"l": 200.64, "t": 478.53214, "r": 206.51694, "b": 481.26816, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "1", "bbox": {"l": 243.26373, "t": 478.53214, "r": 245.2321, "b": 481.26816, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "9", "bbox": {"l": 264.29047, "t": 478.53214, "r": 266.25885, "b": 481.26816, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "1", "bbox": {"l": 323.40466, "t": 478.53214, "r": 325.37305, "b": 481.26816, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "1", "bbox": {"l": 397.72519, "t": 478.53214, "r": 399.69354, "b": 481.26816, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "276", "bbox": {"l": 200.64, "t": 483.41086, "r": 206.51694, "b": 486.14688, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "2", "bbox": {"l": 382.66132, "t": 483.41086, "r": 384.61563, "b": 486.14688, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "12", "bbox": {"l": 397.72513, "t": 483.41086, "r": 401.64819, "b": 486.14688, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "1", "bbox": {"l": 412.78928, "t": 483.41086, "r": 414.74359, "b": 486.14688, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "320", "bbox": {"l": 200.64014, "t": 488.28958, "r": 207.14445, "b": 491.0256, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "1", "bbox": {"l": 367.62616, "t": 488.28958, "r": 369.78375, "b": 491.0256, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "4", "bbox": {"l": 382.66141, "t": 488.28958, "r": 384.81897, "b": 491.0256, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "20", "bbox": {"l": 397.7251, "t": 488.28958, "r": 402.05087, "b": 491.0256, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "2013", "bbox": {"l": 200.64032, "t": 493.1683, "r": 208.48566, "b": 495.90433, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "3", "bbox": {"l": 264.29044, "t": 493.1683, "r": 266.25879, "b": 495.90433, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "\u03bc", "bbox": {"l": 227.91466, "t": 665.82603, "r": 230.10028, "b": 675.3464, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "\u2265", "bbox": {"l": 300.58057, "t": 683.62195, "r": 302.72638, "b": 693.428658, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 7, "label": "page_header", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 143.97887, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8309906721115112, "cells": [{"id": 0, "text": "10", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 143.97887, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "page_header", "bbox": {"l": 167.82053, "t": 93.77099999999996, "r": 231.72049000000004, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8367075324058533, "cells": [{"id": 1, "text": "M.", "bbox": {"l": 167.82053, "t": 93.77099999999996, "r": 178.08249, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37929, "t": 93.77099999999996, "r": 231.72049000000004, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "caption", "bbox": {"l": 134.765, "t": 115.83618000000001, "r": 480.59357000000006, "b": 145.88666, "coord_origin": "TOPLEFT"}, "confidence": 0.9512290954589844, "cells": [{"id": 3, "text": "Table 2.", "bbox": {"l": 134.765, "t": 115.83618000000001, "r": 173.09366, "b": 123.76251000000002, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "TSR and cell detection results compared between OTSL and HTML on", "bbox": {"l": 181.30299, "t": 115.89899000000003, "r": 480.59151999999995, "b": 123.96868999999992, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "the PubTabNet [22], FinTabNet [21] and PubTables-1M [14] data sets using Table-", "bbox": {"l": 134.765, "t": 126.85797000000014, "r": 480.59357000000006, "b": 134.92767000000003, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Former [9] (with enc=6, dec=6, heads=8).", "bbox": {"l": 134.765, "t": 137.81696, "r": 305.95691, "b": 145.88666, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "table", "bbox": {"l": 143.6376495361328, "t": 156.3477020263672, "r": 470.8485412597656, "b": 263.2624816894531, "coord_origin": "TOPLEFT"}, "confidence": 0.9884640574455261, "cells": [{"id": 7, "text": "Data set", "bbox": {"l": 160.782, "t": 166.55895999999996, "r": 194.99779, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Language", "bbox": {"l": 215.52499000000003, "t": 166.534, "r": 254.04465, "b": 174.6037, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "TEDs", "bbox": {"l": 300.397, "t": 161.07898, "r": 323.99118, "b": 169.14868, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "mAP(0.75)", "bbox": {"l": 370.345, "t": 166.55895999999996, "r": 414.74661, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Inference", "bbox": {"l": 426.737, "t": 161.07898, "r": 463.10830999999996, "b": 169.14868, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "time (secs)", "bbox": {"l": 423.11401, "t": 172.03796, "r": 466.72656, "b": 180.10766999999998, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "simple", "bbox": {"l": 262.41299, "t": 174.03101000000004, "r": 288.0596, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "complex", "bbox": {"l": 296.42899, "t": 174.03101000000004, "r": 329.44687, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "all", "bbox": {"l": 345.03299, "t": 174.03101000000004, "r": 354.75793, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "PubTabNet", "bbox": {"l": 154.53799, "t": 192.85999000000004, "r": 201.24129, "b": 200.92969000000005, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "OTSL", "bbox": {"l": 222.43700000000004, "t": 187.38098000000002, "r": 247.13226000000003, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "0.965", "bbox": {"l": 264.74399, "t": 187.38098000000002, "r": 285.73074, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "0.934", "bbox": {"l": 302.444, "t": 187.38098000000002, "r": 323.43076, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "0.955", "bbox": {"l": 339.40302, "t": 187.38098000000002, "r": 360.38977, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "0.88", "bbox": {"l": 383.116, "t": 187.31817999999998, "r": 401.97324, "b": 195.24451, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "2.73", "bbox": {"l": 435.49300999999997, "t": 187.31817999999998, "r": 454.35025, "b": 195.24451, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "HTML", "bbox": {"l": 220.903, "t": 200.33196999999996, "r": 248.66655999999998, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "0.969", "bbox": {"l": 264.74399, "t": 200.33196999999996, "r": 285.73074, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "0.927", "bbox": {"l": 302.444, "t": 200.33196999999996, "r": 323.43076, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "0.955", "bbox": {"l": 339.40302, "t": 200.33196999999996, "r": 360.38977, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "0.857", "bbox": {"l": 382.052, "t": 200.33196999999996, "r": 403.03876, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "5.39", "bbox": {"l": 436.73199000000005, "t": 200.33196999999996, "r": 453.11182, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "FinTabNet", "bbox": {"l": 155.94501, "t": 219.16198999999995, "r": 199.83374, "b": 227.23168999999996, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "OTSL", "bbox": {"l": 222.43700000000004, "t": 213.68201, "r": 247.13226000000003, "b": 221.75171, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "0.955", "bbox": {"l": 264.74399, "t": 213.68201, "r": 285.73074, "b": 221.75171, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "0.961", "bbox": {"l": 302.444, "t": 213.68201, "r": 323.43076, "b": 221.75171, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "0.959", "bbox": {"l": 337.815, "t": 213.61919999999998, "r": 361.97586, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "0.862", "bbox": {"l": 380.46399, "t": 213.61919999999998, "r": 404.62485, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "1.85", "bbox": {"l": 435.49300999999997, "t": 213.61919999999998, "r": 454.35025, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "HTML", "bbox": {"l": 220.903, "t": 226.63396999999998, "r": 248.66655999999998, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "0.917", "bbox": {"l": 264.74399, "t": 226.63396999999998, "r": 285.73074, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "0.922", "bbox": {"l": 302.444, "t": 226.63396999999998, "r": 323.43076, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "0.92", "bbox": {"l": 341.70599, "t": 226.63396999999998, "r": 358.08582, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "0.722", "bbox": {"l": 382.052, "t": 226.63396999999998, "r": 403.03876, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "3.26", "bbox": {"l": 436.73199000000005, "t": 226.63396999999998, "r": 453.11182, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "PubTables-1M", "bbox": {"l": 148.62601, "t": 245.46294999999998, "r": 207.1524, "b": 253.53265, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "OTSL", "bbox": {"l": 222.43700000000004, "t": 239.98297000000002, "r": 247.13226000000003, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "0.987", "bbox": {"l": 264.74399, "t": 239.98297000000002, "r": 285.73074, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "0.964", "bbox": {"l": 302.444, "t": 239.98297000000002, "r": 323.43076, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "0.977", "bbox": {"l": 337.815, "t": 239.92016999999998, "r": 361.97586, "b": 247.8465, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "0.896", "bbox": {"l": 380.46399, "t": 239.92016999999998, "r": 404.62485, "b": 247.8465, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "1.79", "bbox": {"l": 435.49300999999997, "t": 239.92016999999998, "r": 454.35025, "b": 247.8465, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "HTML", "bbox": {"l": 220.903, "t": 252.93499999999995, "r": 248.66655999999998, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "0.983", "bbox": {"l": 264.74399, "t": 252.93499999999995, "r": 285.73074, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "0.944", "bbox": {"l": 302.444, "t": 252.93499999999995, "r": 323.43076, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "0.966", "bbox": {"l": 339.40302, "t": 252.93499999999995, "r": 360.38977, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "0.889", "bbox": {"l": 382.052, "t": 252.93499999999995, "r": 403.03876, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "3.26", "bbox": {"l": 436.73199000000005, "t": 252.93499999999995, "r": 453.11182, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": [{"id": 8, "label": "text", "bbox": {"l": 160.782, "t": 166.55895999999996, "r": 194.99779, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "Data set", "bbox": {"l": 160.782, "t": 166.55895999999996, "r": 194.99779, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 215.52499000000003, "t": 166.534, "r": 254.04465, "b": 174.6037, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "Language", "bbox": {"l": 215.52499000000003, "t": 166.534, "r": 254.04465, "b": 174.6037, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "text", "bbox": {"l": 300.397, "t": 161.07898, "r": 323.99118, "b": 169.14868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "TEDs", "bbox": {"l": 300.397, "t": 161.07898, "r": 323.99118, "b": 169.14868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 370.345, "t": 166.55895999999996, "r": 414.74661, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "mAP(0.75)", "bbox": {"l": 370.345, "t": 166.55895999999996, "r": 414.74661, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 426.737, "t": 161.07898, "r": 463.10830999999996, "b": 169.14868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "Inference", "bbox": {"l": 426.737, "t": 161.07898, "r": 463.10830999999996, "b": 169.14868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 423.11401, "t": 172.03796, "r": 466.72656, "b": 180.10766999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "time (secs)", "bbox": {"l": 423.11401, "t": 172.03796, "r": 466.72656, "b": 180.10766999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 262.41299, "t": 174.03101000000004, "r": 288.0596, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "simple", "bbox": {"l": 262.41299, "t": 174.03101000000004, "r": 288.0596, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 296.42899, "t": 174.03101000000004, "r": 329.44687, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "complex", "bbox": {"l": 296.42899, "t": 174.03101000000004, "r": 329.44687, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 345.03299, "t": 174.03101000000004, "r": 354.75793, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "all", "bbox": {"l": 345.03299, "t": 174.03101000000004, "r": 354.75793, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 154.53799, "t": 192.85999000000004, "r": 201.24129, "b": 200.92969000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "PubTabNet", "bbox": {"l": 154.53799, "t": 192.85999000000004, "r": 201.24129, "b": 200.92969000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 222.43700000000004, "t": 187.38098000000002, "r": 247.13226000000003, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "OTSL", "bbox": {"l": 222.43700000000004, "t": 187.38098000000002, "r": 247.13226000000003, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 264.74399, "t": 187.38098000000002, "r": 285.73074, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "0.965", "bbox": {"l": 264.74399, "t": 187.38098000000002, "r": 285.73074, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 302.444, "t": 187.38098000000002, "r": 323.43076, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "0.934", "bbox": {"l": 302.444, "t": 187.38098000000002, "r": 323.43076, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 339.40302, "t": 187.38098000000002, "r": 360.38977, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "0.955", "bbox": {"l": 339.40302, "t": 187.38098000000002, "r": 360.38977, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 383.116, "t": 187.31817999999998, "r": 401.97324, "b": 195.24451, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "0.88", "bbox": {"l": 383.116, "t": 187.31817999999998, "r": 401.97324, "b": 195.24451, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 435.49300999999997, "t": 187.31817999999998, "r": 454.35025, "b": 195.24451, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "2.73", "bbox": {"l": 435.49300999999997, "t": 187.31817999999998, "r": 454.35025, "b": 195.24451, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 220.903, "t": 200.33196999999996, "r": 248.66655999999998, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "HTML", "bbox": {"l": 220.903, "t": 200.33196999999996, "r": 248.66655999999998, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 264.74399, "t": 200.33196999999996, "r": 285.73074, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "0.969", "bbox": {"l": 264.74399, "t": 200.33196999999996, "r": 285.73074, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 302.444, "t": 200.33196999999996, "r": 323.43076, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "0.927", "bbox": {"l": 302.444, "t": 200.33196999999996, "r": 323.43076, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 339.40302, "t": 200.33196999999996, "r": 360.38977, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "0.955", "bbox": {"l": 339.40302, "t": 200.33196999999996, "r": 360.38977, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 382.052, "t": 200.33196999999996, "r": 403.03876, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "0.857", "bbox": {"l": 382.052, "t": 200.33196999999996, "r": 403.03876, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 436.73199000000005, "t": 200.33196999999996, "r": 453.11182, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "5.39", "bbox": {"l": 436.73199000000005, "t": 200.33196999999996, "r": 453.11182, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 155.94501, "t": 219.16198999999995, "r": 199.83374, "b": 227.23168999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "FinTabNet", "bbox": {"l": 155.94501, "t": 219.16198999999995, "r": 199.83374, "b": 227.23168999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 222.43700000000004, "t": 213.68201, "r": 247.13226000000003, "b": 221.75171, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "OTSL", "bbox": {"l": 222.43700000000004, "t": 213.68201, "r": 247.13226000000003, "b": 221.75171, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 264.74399, "t": 213.68201, "r": 285.73074, "b": 221.75171, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "0.955", "bbox": {"l": 264.74399, "t": 213.68201, "r": 285.73074, "b": 221.75171, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 302.444, "t": 213.68201, "r": 323.43076, "b": 221.75171, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "0.961", "bbox": {"l": 302.444, "t": 213.68201, "r": 323.43076, "b": 221.75171, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 337.815, "t": 213.61919999999998, "r": 361.97586, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "0.959", "bbox": {"l": 337.815, "t": 213.61919999999998, "r": 361.97586, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 380.46399, "t": 213.61919999999998, "r": 404.62485, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "0.862", "bbox": {"l": 380.46399, "t": 213.61919999999998, "r": 404.62485, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 435.49300999999997, "t": 213.61919999999998, "r": 454.35025, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "1.85", "bbox": {"l": 435.49300999999997, "t": 213.61919999999998, "r": 454.35025, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 220.903, "t": 226.63396999999998, "r": 248.66655999999998, "b": 234.70367, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "HTML", "bbox": {"l": 220.903, "t": 226.63396999999998, "r": 248.66655999999998, "b": 234.70367, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 264.74399, "t": 226.63396999999998, "r": 285.73074, "b": 234.70367, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "0.917", "bbox": {"l": 264.74399, "t": 226.63396999999998, "r": 285.73074, "b": 234.70367, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 302.444, "t": 226.63396999999998, "r": 323.43076, "b": 234.70367, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "0.922", "bbox": {"l": 302.444, "t": 226.63396999999998, "r": 323.43076, "b": 234.70367, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 341.70599, "t": 226.63396999999998, "r": 358.08582, "b": 234.70367, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "0.92", "bbox": {"l": 341.70599, "t": 226.63396999999998, "r": 358.08582, "b": 234.70367, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 382.052, "t": 226.63396999999998, "r": 403.03876, "b": 234.70367, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "0.722", "bbox": {"l": 382.052, "t": 226.63396999999998, "r": 403.03876, "b": 234.70367, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 436.73199000000005, "t": 226.63396999999998, "r": 453.11182, "b": 234.70367, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "3.26", "bbox": {"l": 436.73199000000005, "t": 226.63396999999998, "r": 453.11182, "b": 234.70367, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 148.62601, "t": 245.46294999999998, "r": 207.1524, "b": 253.53265, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "PubTables-1M", "bbox": {"l": 148.62601, "t": 245.46294999999998, "r": 207.1524, "b": 253.53265, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 222.43700000000004, "t": 239.98297000000002, "r": 247.13226000000003, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "OTSL", "bbox": {"l": 222.43700000000004, "t": 239.98297000000002, "r": 247.13226000000003, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 264.74399, "t": 239.98297000000002, "r": 285.73074, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "0.987", "bbox": {"l": 264.74399, "t": 239.98297000000002, "r": 285.73074, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 302.444, "t": 239.98297000000002, "r": 323.43076, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "0.964", "bbox": {"l": 302.444, "t": 239.98297000000002, "r": 323.43076, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 337.815, "t": 239.92016999999998, "r": 361.97586, "b": 247.8465, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "0.977", "bbox": {"l": 337.815, "t": 239.92016999999998, "r": 361.97586, "b": 247.8465, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 380.46399, "t": 239.92016999999998, "r": 404.62485, "b": 247.8465, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "0.896", "bbox": {"l": 380.46399, "t": 239.92016999999998, "r": 404.62485, "b": 247.8465, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 435.49300999999997, "t": 239.92016999999998, "r": 454.35025, "b": 247.8465, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "1.79", "bbox": {"l": 435.49300999999997, "t": 239.92016999999998, "r": 454.35025, "b": 247.8465, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 220.903, "t": 252.93499999999995, "r": 248.66655999999998, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "HTML", "bbox": {"l": 220.903, "t": 252.93499999999995, "r": 248.66655999999998, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 264.74399, "t": 252.93499999999995, "r": 285.73074, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "0.983", "bbox": {"l": 264.74399, "t": 252.93499999999995, "r": 285.73074, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 302.444, "t": 252.93499999999995, "r": 323.43076, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "0.944", "bbox": {"l": 302.444, "t": 252.93499999999995, "r": 323.43076, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 339.40302, "t": 252.93499999999995, "r": 360.38977, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "0.966", "bbox": {"l": 339.40302, "t": 252.93499999999995, "r": 360.38977, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 382.052, "t": 252.93499999999995, "r": 403.03876, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "0.889", "bbox": {"l": 382.052, "t": 252.93499999999995, "r": 403.03876, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 436.73199000000005, "t": 252.93499999999995, "r": 453.11182, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "3.26", "bbox": {"l": 436.73199000000005, "t": 252.93499999999995, "r": 453.11182, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 3, "label": "section_header", "bbox": {"l": 134.765, "t": 288.91479, "r": 257.08679, "b": 297.72173999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9546447992324829, "cells": [{"id": 55, "text": "5.3", "bbox": {"l": 134.765, "t": 288.91479, "r": 149.40205, "b": 297.72173999999995, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Qualitative Results", "bbox": {"l": 160.85904, "t": 288.91479, "r": 257.08679, "b": 297.72173999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 134.765, "t": 309.86078, "r": 480.58981, "b": 366.47769, "coord_origin": "TOPLEFT"}, "confidence": 0.9834085702896118, "cells": [{"id": 57, "text": "To illustrate the qualitative differences between OTSL and HTML, Figure 5", "bbox": {"l": 134.765, "t": 309.86078, "r": 480.58777, "b": 318.65775, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "demonstrates less overlap and more accurate bounding boxes with OTSL. In", "bbox": {"l": 134.765, "t": 321.81577, "r": 480.58889999999997, "b": 330.61273, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Figure 6, OTSL proves to be more effective in handling tables with longer to-", "bbox": {"l": 134.765, "t": 333.77075, "r": 480.58681999999993, "b": 342.56772, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "ken sequences, resulting in even more precise structure prediction and bounding", "bbox": {"l": 134.765, "t": 345.72574, "r": 480.58981, "b": 354.52271, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "boxes.", "bbox": {"l": 134.765, "t": 357.68073, "r": 161.65704, "b": 366.47769, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "caption", "bbox": {"l": 134.765, "t": 397.59012, "r": 480.59106, "b": 439.71716, "coord_origin": "TOPLEFT"}, "confidence": 0.9482728838920593, "cells": [{"id": 62, "text": "Fig. 5.", "bbox": {"l": 134.765, "t": 397.59012, "r": 162.64424, "b": 405.51642, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "The OTSL model produces more accurate bounding boxes with less over-", "bbox": {"l": 167.384, "t": 397.65289, "r": 480.59106, "b": 405.72266, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "lap (E) than the HTML model (D), when predicting the structure of a sparse ta-", "bbox": {"l": 134.765, "t": 408.61190999999997, "r": 480.59106, "b": 416.68167000000005, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "ble (A), at twice the inference speed because of shorter sequence length (B),(C).", "bbox": {"l": 134.765, "t": 419.57089, "r": 480.58838000000003, "b": 427.64066, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "\"PMC2807444_006_00.png\" PubTabNet.", "bbox": {"l": 134.765, "t": 430.52987999999993, "r": 304.69171, "b": 438.59964, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "\u03bc", "bbox": {"l": 342.63354, "t": 430.19678, "r": 344.81915, "b": 439.71716, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "picture", "bbox": {"l": 162.67430114746094, "t": 444.62255859375, "r": 451.70062255859375, "b": 663.2135620117188, "coord_origin": "TOPLEFT"}, "confidence": 0.9742383360862732, "cells": [{"id": 67, "text": "<table>", "bbox": {"l": 180.12473, "t": 516.2332200000001, "r": 190.62042, "b": 518.94992, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "<tr><td></td><td colspan=\"4\"></td><td colspan=\"6\"></td><td colspan=\"3\"></td></tr>", "bbox": {"l": 183.2438, "t": 520.13208, "r": 304.54797, "b": 522.84879, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 524.03094, "r": 388.42313, "b": 526.74765, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 527.9297799999999, "r": 388.42313, "b": 530.64648, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 531.82861, "r": 388.42313, "b": 534.54532, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 535.72748, "r": 388.42313, "b": 538.44418, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 539.62631, "r": 388.42313, "b": 542.34303, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 543.52516, "r": 388.42313, "b": 546.24188, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 547.42401, "r": 388.42313, "b": 550.14073, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 551.32286, "r": 388.42313, "b": 554.03958, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "</table>", "bbox": {"l": 180.12473, "t": 555.22173, "r": 191.86806, "b": 557.93845, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "C", "bbox": {"l": 407.38348, "t": 518.30042, "r": 408.82025, "b": 521.01712, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "C L L L C L L L L L C L L NL", "bbox": {"l": 410.25699, "t": 518.30042, "r": 450.48605, "b": 521.01712, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "C", "bbox": {"l": 407.38348, "t": 522.19925, "r": 408.82025, "b": 524.9159500000001, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 522.19925, "r": 450.48605, "b": 524.9159500000001, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "C", "bbox": {"l": 407.38348, "t": 526.09808, "r": 408.82025, "b": 528.81479, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 526.09808, "r": 450.48605, "b": 528.81479, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "C", "bbox": {"l": 407.38348, "t": 529.99695, "r": 408.82025, "b": 532.7136499999999, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 529.99695, "r": 450.48605, "b": 532.7136499999999, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "C", "bbox": {"l": 407.38348, "t": 533.8957800000001, "r": 408.82025, "b": 536.6125, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 533.8957800000001, "r": 450.48605, "b": 536.6125, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "C", "bbox": {"l": 407.38348, "t": 537.79463, "r": 408.82025, "b": 540.51135, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 537.79463, "r": 450.48605, "b": 540.51135, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "C", "bbox": {"l": 407.38348, "t": 541.69348, "r": 408.82025, "b": 544.4102, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 541.69348, "r": 450.48605, "b": 544.4102, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "C", "bbox": {"l": 407.38348, "t": 545.59233, "r": 408.82025, "b": 548.3090500000001, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 545.59233, "r": 450.48605, "b": 548.3090500000001, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "C", "bbox": {"l": 407.38348, "t": 549.4911999999999, "r": 408.82025, "b": 552.2079200000001, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 549.4911999999999, "r": 450.48605, "b": 552.2079200000001, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "HTML", "bbox": {"l": 164.52881, "t": 509.45859, "r": 181.8528, "b": 515.31, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "#", "bbox": {"l": 183.58441, "t": 509.45859, "r": 186.3974, "b": 515.31, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "tokens:", "bbox": {"l": 189.2104, "t": 509.45859, "r": 208.90137, "b": 515.31, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "258", "bbox": {"l": 210.63269, "t": 509.45859, "r": 221.04044, "b": 515.31, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "OTSL", "bbox": {"l": 390.20203, "t": 509.60361, "r": 406.83609, "b": 515.45502, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "#", "bbox": {"l": 408.56952, "t": 509.60361, "r": 411.38251, "b": 515.45502, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "tokens:", "bbox": {"l": 414.1955, "t": 509.60361, "r": 433.88647000000003, "b": 515.45502, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "135", "bbox": {"l": 435.61737, "t": 509.60361, "r": 446.02512, "b": 515.45502, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "B", "bbox": {"l": 167.19316, "t": 519.07236, "r": 172.8231, "b": 526.3866, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "A", "bbox": {"l": 187.33745, "t": 448.62485, "r": 192.96739, "b": 455.93909, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "D", "bbox": {"l": 167.38654, "t": 566.0051599999999, "r": 173.01648, "b": 573.3194, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "E", "bbox": {"l": 248.45621000000003, "t": 621.78008, "r": 253.65727, "b": 629.09431, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "C", "bbox": {"l": 395.90057, "t": 519.19946, "r": 401.53052, "b": 526.5137, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "HTML", "bbox": {"l": 171.62886, "t": 580.28853, "r": 177.48148, "b": 597.26784, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "OTSL", "bbox": {"l": 251.05969000000002, "t": 633.63408, "r": 256.91235, "b": 649.92345, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "HTML model shows", "bbox": {"l": 372.14645, "t": 601.45724, "r": 427.0379, "b": 607.30864, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "bounding box drifting", "bbox": {"l": 372.14645, "t": 607.89948, "r": 430.06838999999997, "b": 613.75087, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "OTSL model shows", "bbox": {"l": 176.88042, "t": 642.87209, "r": 231.08191, "b": 648.72348, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "clean bounding box", "bbox": {"l": 176.88042, "t": 649.3143, "r": 230.99271000000002, "b": 655.1657, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "alignment", "bbox": {"l": 176.88042, "t": 655.7565500000001, "r": 203.93219, "b": 661.60794, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "\u2264", "bbox": {"l": 215.93231000000003, "t": 557.56342, "r": 218.4697, "b": 569.15967, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "\u03bc", "bbox": {"l": 229.05689999999998, "t": 557.56342, "r": 231.71908999999997, "b": 569.15967, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "S", "bbox": {"l": 261.20892, "t": 448.46124, "r": 263.56973, "b": 451.19727, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "I", "bbox": {"l": 312.33463, "t": 448.46124, "r": 313.6362, "b": 451.19727, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "R", "bbox": {"l": 377.41125, "t": 448.46124, "r": 380.05737, "b": 451.19727, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "ST", "bbox": {"l": 200.63976, "t": 453.33997, "r": 205.82492, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "0.03", "bbox": {"l": 222.20833000000002, "t": 453.33997, "r": 229.76836, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "0.06", "bbox": {"l": 243.26666, "t": 453.33997, "r": 250.82669, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "0.12", "bbox": {"l": 264.29657, "t": 453.33997, "r": 271.84949, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "0.25", "bbox": {"l": 285.31943, "t": 453.33997, "r": 292.87946, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "0.5", "bbox": {"l": 306.37775, "t": 453.33997, "r": 311.77319, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "1", "bbox": {"l": 323.41699, "t": 453.33997, "r": 325.58157, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "2", "bbox": {"l": 334.45807, "t": 453.33997, "r": 336.62265, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "4", "bbox": {"l": 345.52756, "t": 453.33997, "r": 347.69214, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "8", "bbox": {"l": 356.56863, "t": 453.33997, "r": 358.73322, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "16", "bbox": {"l": 367.63812, "t": 453.33997, "r": 371.97089, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "32", "bbox": {"l": 382.6734, "t": 453.33997, "r": 387.00616, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "64", "bbox": {"l": 397.73727, "t": 453.33997, "r": 402.07001, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "\u2265", "bbox": {"l": 412.78879, "t": 447.99298, "r": 414.93463, "b": 457.79964999999993, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": " 128", "bbox": {"l": 414.95697, "t": 453.33997, "r": 422.51746, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "63", "bbox": {"l": 200.63998, "t": 463.92444, "r": 204.57674, "b": 466.66043, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "1", "bbox": {"l": 367.62604, "t": 463.92444, "r": 369.58032, "b": 466.66043, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "1", "bbox": {"l": 382.66132, "t": 463.92444, "r": 384.6156, "b": 466.66043, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "3", "bbox": {"l": 397.72504, "t": 463.92444, "r": 399.67932, "b": 466.66043, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "199", "bbox": {"l": 200.64, "t": 468.80313, "r": 206.51694, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "5", "bbox": {"l": 264.29047, "t": 468.80313, "r": 266.25885, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "1", "bbox": {"l": 306.37213, "t": 468.80313, "r": 308.34052, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "2", "bbox": {"l": 345.51526, "t": 468.80313, "r": 347.48364, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "4", "bbox": {"l": 356.55634, "t": 468.80313, "r": 358.52472, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "1", "bbox": {"l": 367.62582, "t": 468.80313, "r": 369.59418, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "1", "bbox": {"l": 382.66107, "t": 468.80313, "r": 384.62946, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "416", "bbox": {"l": 200.64, "t": 473.68185, "r": 206.51694, "b": 476.41788, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "4", "bbox": {"l": 264.29047, "t": 473.68185, "r": 266.25885, "b": 476.41788, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "230", "bbox": {"l": 200.64, "t": 478.53214, "r": 206.51694, "b": 481.26816, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "1", "bbox": {"l": 243.26373, "t": 478.53214, "r": 245.2321, "b": 481.26816, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "9", "bbox": {"l": 264.29047, "t": 478.53214, "r": 266.25885, "b": 481.26816, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "1", "bbox": {"l": 323.40466, "t": 478.53214, "r": 325.37305, "b": 481.26816, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "1", "bbox": {"l": 397.72519, "t": 478.53214, "r": 399.69354, "b": 481.26816, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "276", "bbox": {"l": 200.64, "t": 483.41086, "r": 206.51694, "b": 486.14688, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "2", "bbox": {"l": 382.66132, "t": 483.41086, "r": 384.61563, "b": 486.14688, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "12", "bbox": {"l": 397.72513, "t": 483.41086, "r": 401.64819, "b": 486.14688, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "1", "bbox": {"l": 412.78928, "t": 483.41086, "r": 414.74359, "b": 486.14688, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "320", "bbox": {"l": 200.64014, "t": 488.28958, "r": 207.14445, "b": 491.0256, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "1", "bbox": {"l": 367.62616, "t": 488.28958, "r": 369.78375, "b": 491.0256, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "4", "bbox": {"l": 382.66141, "t": 488.28958, "r": 384.81897, "b": 491.0256, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "20", "bbox": {"l": 397.7251, "t": 488.28958, "r": 402.05087, "b": 491.0256, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "2013", "bbox": {"l": 200.64032, "t": 493.1683, "r": 208.48566, "b": 495.90433, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "3", "bbox": {"l": 264.29044, "t": 493.1683, "r": 266.25879, "b": 495.90433, "coord_origin": "TOPLEFT"}}], "children": [{"id": 56, "label": "text", "bbox": {"l": 180.12473, "t": 516.2332200000001, "r": 190.62042, "b": 518.94992, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "<table>", "bbox": {"l": 180.12473, "t": 516.2332200000001, "r": 190.62042, "b": 518.94992, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 183.2438, "t": 520.13208, "r": 304.54797, "b": 522.84879, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "<tr><td></td><td colspan=\"4\"></td><td colspan=\"6\"></td><td colspan=\"3\"></td></tr>", "bbox": {"l": 183.2438, "t": 520.13208, "r": 304.54797, "b": 522.84879, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 183.2438, "t": 524.03094, "r": 388.42313, "b": 526.74765, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 524.03094, "r": 388.42313, "b": 526.74765, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 183.2438, "t": 527.9297799999999, "r": 388.42313, "b": 530.64648, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 527.9297799999999, "r": 388.42313, "b": 530.64648, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 183.2438, "t": 531.82861, "r": 388.42313, "b": 534.54532, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 531.82861, "r": 388.42313, "b": 534.54532, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 183.2438, "t": 535.72748, "r": 388.42313, "b": 538.44418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 535.72748, "r": 388.42313, "b": 538.44418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 183.2438, "t": 539.62631, "r": 388.42313, "b": 542.34303, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 539.62631, "r": 388.42313, "b": 542.34303, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 183.2438, "t": 543.52516, "r": 388.42313, "b": 546.24188, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 543.52516, "r": 388.42313, "b": 546.24188, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 183.2438, "t": 547.42401, "r": 388.42313, "b": 550.14073, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 547.42401, "r": 388.42313, "b": 550.14073, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 183.2438, "t": 551.32286, "r": 388.42313, "b": 554.03958, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 551.32286, "r": 388.42313, "b": 554.03958, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 180.12473, "t": 555.22173, "r": 191.86806, "b": 557.93845, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "</table>", "bbox": {"l": 180.12473, "t": 555.22173, "r": 191.86806, "b": 557.93845, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 407.38348, "t": 518.30042, "r": 408.82025, "b": 521.01712, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "C", "bbox": {"l": 407.38348, "t": 518.30042, "r": 408.82025, "b": 521.01712, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 410.25699, "t": 518.30042, "r": 450.48605, "b": 521.01712, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "C L L L C L L L L L C L L NL", "bbox": {"l": 410.25699, "t": 518.30042, "r": 450.48605, "b": 521.01712, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 407.38348, "t": 522.19925, "r": 408.82025, "b": 524.9159500000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "C", "bbox": {"l": 407.38348, "t": 522.19925, "r": 408.82025, "b": 524.9159500000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 410.25699, "t": 522.19925, "r": 450.48605, "b": 524.9159500000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 522.19925, "r": 450.48605, "b": 524.9159500000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 407.38348, "t": 526.09808, "r": 408.82025, "b": 528.81479, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "C", "bbox": {"l": 407.38348, "t": 526.09808, "r": 408.82025, "b": 528.81479, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 410.25699, "t": 526.09808, "r": 450.48605, "b": 528.81479, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 526.09808, "r": 450.48605, "b": 528.81479, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 407.38348, "t": 529.99695, "r": 408.82025, "b": 532.7136499999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "C", "bbox": {"l": 407.38348, "t": 529.99695, "r": 408.82025, "b": 532.7136499999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 410.25699, "t": 529.99695, "r": 450.48605, "b": 532.7136499999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 529.99695, "r": 450.48605, "b": 532.7136499999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 407.38348, "t": 533.8957800000001, "r": 408.82025, "b": 536.6125, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "C", "bbox": {"l": 407.38348, "t": 533.8957800000001, "r": 408.82025, "b": 536.6125, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 410.25699, "t": 533.8957800000001, "r": 450.48605, "b": 536.6125, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 533.8957800000001, "r": 450.48605, "b": 536.6125, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 407.38348, "t": 537.79463, "r": 408.82025, "b": 540.51135, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "C", "bbox": {"l": 407.38348, "t": 537.79463, "r": 408.82025, "b": 540.51135, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 410.25699, "t": 537.79463, "r": 450.48605, "b": 540.51135, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 537.79463, "r": 450.48605, "b": 540.51135, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 407.38348, "t": 541.69348, "r": 408.82025, "b": 544.4102, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "C", "bbox": {"l": 407.38348, "t": 541.69348, "r": 408.82025, "b": 544.4102, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 410.25699, "t": 541.69348, "r": 450.48605, "b": 544.4102, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 541.69348, "r": 450.48605, "b": 544.4102, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 407.38348, "t": 545.59233, "r": 408.82025, "b": 548.3090500000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "C", "bbox": {"l": 407.38348, "t": 545.59233, "r": 408.82025, "b": 548.3090500000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 410.25699, "t": 545.59233, "r": 450.48605, "b": 548.3090500000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 545.59233, "r": 450.48605, "b": 548.3090500000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 407.38348, "t": 549.4911999999999, "r": 408.82025, "b": 552.2079200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "C", "bbox": {"l": 407.38348, "t": 549.4911999999999, "r": 408.82025, "b": 552.2079200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 410.25699, "t": 549.4911999999999, "r": 450.48605, "b": 552.2079200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 549.4911999999999, "r": 450.48605, "b": 552.2079200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 164.52881, "t": 509.45859, "r": 181.8528, "b": 515.31, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "HTML", "bbox": {"l": 164.52881, "t": 509.45859, "r": 181.8528, "b": 515.31, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 183.58441, "t": 509.45859, "r": 186.3974, "b": 515.31, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "#", "bbox": {"l": 183.58441, "t": 509.45859, "r": 186.3974, "b": 515.31, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 189.2104, "t": 509.45859, "r": 208.90137, "b": 515.31, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "tokens:", "bbox": {"l": 189.2104, "t": 509.45859, "r": 208.90137, "b": 515.31, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 210.63269, "t": 509.45859, "r": 221.04044, "b": 515.31, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "258", "bbox": {"l": 210.63269, "t": 509.45859, "r": 221.04044, "b": 515.31, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 390.20203, "t": 509.60361, "r": 406.83609, "b": 515.45502, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "OTSL", "bbox": {"l": 390.20203, "t": 509.60361, "r": 406.83609, "b": 515.45502, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 408.56952, "t": 509.60361, "r": 411.38251, "b": 515.45502, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "#", "bbox": {"l": 408.56952, "t": 509.60361, "r": 411.38251, "b": 515.45502, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 414.1955, "t": 509.60361, "r": 433.88647000000003, "b": 515.45502, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "tokens:", "bbox": {"l": 414.1955, "t": 509.60361, "r": 433.88647000000003, "b": 515.45502, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 435.61737, "t": 509.60361, "r": 446.02512, "b": 515.45502, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": "135", "bbox": {"l": 435.61737, "t": 509.60361, "r": 446.02512, "b": 515.45502, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 167.19316, "t": 519.07236, "r": 172.8231, "b": 526.3866, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "B", "bbox": {"l": 167.19316, "t": 519.07236, "r": 172.8231, "b": 526.3866, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 187.33745, "t": 448.62485, "r": 192.96739, "b": 455.93909, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "A", "bbox": {"l": 187.33745, "t": 448.62485, "r": 192.96739, "b": 455.93909, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 167.38654, "t": 566.0051599999999, "r": 173.01648, "b": 573.3194, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": "D", "bbox": {"l": 167.38654, "t": 566.0051599999999, "r": 173.01648, "b": 573.3194, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 248.45621000000003, "t": 621.78008, "r": 253.65727, "b": 629.09431, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 107, "text": "E", "bbox": {"l": 248.45621000000003, "t": 621.78008, "r": 253.65727, "b": 629.09431, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 395.90057, "t": 519.19946, "r": 401.53052, "b": 526.5137, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 108, "text": "C", "bbox": {"l": 395.90057, "t": 519.19946, "r": 401.53052, "b": 526.5137, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 171.62886, "t": 580.28853, "r": 177.48148, "b": 597.26784, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 109, "text": "HTML", "bbox": {"l": 171.62886, "t": 580.28853, "r": 177.48148, "b": 597.26784, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 251.05969000000002, "t": 633.63408, "r": 256.91235, "b": 649.92345, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 110, "text": "OTSL", "bbox": {"l": 251.05969000000002, "t": 633.63408, "r": 256.91235, "b": 649.92345, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 372.14645, "t": 601.45724, "r": 427.0379, "b": 607.30864, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 111, "text": "HTML model shows", "bbox": {"l": 372.14645, "t": 601.45724, "r": 427.0379, "b": 607.30864, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 372.14645, "t": 607.89948, "r": 430.06838999999997, "b": 613.75087, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 112, "text": "bounding box drifting", "bbox": {"l": 372.14645, "t": 607.89948, "r": 430.06838999999997, "b": 613.75087, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 176.88042, "t": 642.87209, "r": 231.08191, "b": 648.72348, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 113, "text": "OTSL model shows", "bbox": {"l": 176.88042, "t": 642.87209, "r": 231.08191, "b": 648.72348, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 176.88042, "t": 649.3143, "r": 230.99271000000002, "b": 655.1657, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 114, "text": "clean bounding box", "bbox": {"l": 176.88042, "t": 649.3143, "r": 230.99271000000002, "b": 655.1657, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 176.88042, "t": 655.7565500000001, "r": 203.93219, "b": 661.60794, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 115, "text": "alignment", "bbox": {"l": 176.88042, "t": 655.7565500000001, "r": 203.93219, "b": 661.60794, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 215.93231000000003, "t": 557.56342, "r": 218.4697, "b": 569.15967, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 116, "text": "\u2264", "bbox": {"l": 215.93231000000003, "t": 557.56342, "r": 218.4697, "b": 569.15967, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 229.05689999999998, "t": 557.56342, "r": 231.71908999999997, "b": 569.15967, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 117, "text": "\u03bc", "bbox": {"l": 229.05689999999998, "t": 557.56342, "r": 231.71908999999997, "b": 569.15967, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 261.20892, "t": 448.46124, "r": 263.56973, "b": 451.19727, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 119, "text": "S", "bbox": {"l": 261.20892, "t": 448.46124, "r": 263.56973, "b": 451.19727, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 312.33463, "t": 448.46124, "r": 313.6362, "b": 451.19727, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 120, "text": "I", "bbox": {"l": 312.33463, "t": 448.46124, "r": 313.6362, "b": 451.19727, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 377.41125, "t": 448.46124, "r": 380.05737, "b": 451.19727, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 121, "text": "R", "bbox": {"l": 377.41125, "t": 448.46124, "r": 380.05737, "b": 451.19727, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 200.63976, "t": 453.33997, "r": 205.82492, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 122, "text": "ST", "bbox": {"l": 200.63976, "t": 453.33997, "r": 205.82492, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 222.20833000000002, "t": 453.33997, "r": 229.76836, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 123, "text": "0.03", "bbox": {"l": 222.20833000000002, "t": 453.33997, "r": 229.76836, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 243.26666, "t": 453.33997, "r": 250.82669, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 124, "text": "0.06", "bbox": {"l": 243.26666, "t": 453.33997, "r": 250.82669, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 264.29657, "t": 453.33997, "r": 271.84949, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 125, "text": "0.12", "bbox": {"l": 264.29657, "t": 453.33997, "r": 271.84949, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 114, "label": "text", "bbox": {"l": 285.31943, "t": 453.33997, "r": 292.87946, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 126, "text": "0.25", "bbox": {"l": 285.31943, "t": 453.33997, "r": 292.87946, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 115, "label": "text", "bbox": {"l": 306.37775, "t": 453.33997, "r": 311.77319, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 127, "text": "0.5", "bbox": {"l": 306.37775, "t": 453.33997, "r": 311.77319, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 116, "label": "text", "bbox": {"l": 323.41699, "t": 453.33997, "r": 325.58157, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 128, "text": "1", "bbox": {"l": 323.41699, "t": 453.33997, "r": 325.58157, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 117, "label": "text", "bbox": {"l": 334.45807, "t": 453.33997, "r": 336.62265, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 129, "text": "2", "bbox": {"l": 334.45807, "t": 453.33997, "r": 336.62265, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 118, "label": "text", "bbox": {"l": 345.52756, "t": 453.33997, "r": 347.69214, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 130, "text": "4", "bbox": {"l": 345.52756, "t": 453.33997, "r": 347.69214, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 119, "label": "text", "bbox": {"l": 356.56863, "t": 453.33997, "r": 358.73322, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 131, "text": "8", "bbox": {"l": 356.56863, "t": 453.33997, "r": 358.73322, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 120, "label": "text", "bbox": {"l": 367.63812, "t": 453.33997, "r": 371.97089, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 132, "text": "16", "bbox": {"l": 367.63812, "t": 453.33997, "r": 371.97089, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 121, "label": "text", "bbox": {"l": 382.6734, "t": 453.33997, "r": 387.00616, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 133, "text": "32", "bbox": {"l": 382.6734, "t": 453.33997, "r": 387.00616, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 122, "label": "text", "bbox": {"l": 397.73727, "t": 453.33997, "r": 402.07001, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 134, "text": "64", "bbox": {"l": 397.73727, "t": 453.33997, "r": 402.07001, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 123, "label": "text", "bbox": {"l": 412.78879, "t": 447.99298, "r": 414.93463, "b": 457.79964999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 135, "text": "\u2265", "bbox": {"l": 412.78879, "t": 447.99298, "r": 414.93463, "b": 457.79964999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 124, "label": "text", "bbox": {"l": 414.95697, "t": 453.33997, "r": 422.51746, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 136, "text": " 128", "bbox": {"l": 414.95697, "t": 453.33997, "r": 422.51746, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 125, "label": "text", "bbox": {"l": 200.63998, "t": 463.92444, "r": 204.57674, "b": 466.66043, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 137, "text": "63", "bbox": {"l": 200.63998, "t": 463.92444, "r": 204.57674, "b": 466.66043, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 126, "label": "text", "bbox": {"l": 367.62604, "t": 463.92444, "r": 369.58032, "b": 466.66043, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 138, "text": "1", "bbox": {"l": 367.62604, "t": 463.92444, "r": 369.58032, "b": 466.66043, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 127, "label": "text", "bbox": {"l": 382.66132, "t": 463.92444, "r": 384.6156, "b": 466.66043, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 139, "text": "1", "bbox": {"l": 382.66132, "t": 463.92444, "r": 384.6156, "b": 466.66043, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 128, "label": "text", "bbox": {"l": 397.72504, "t": 463.92444, "r": 399.67932, "b": 466.66043, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 140, "text": "3", "bbox": {"l": 397.72504, "t": 463.92444, "r": 399.67932, "b": 466.66043, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 129, "label": "text", "bbox": {"l": 200.64, "t": 468.80313, "r": 206.51694, "b": 471.53915, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 141, "text": "199", "bbox": {"l": 200.64, "t": 468.80313, "r": 206.51694, "b": 471.53915, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 130, "label": "text", "bbox": {"l": 264.29047, "t": 468.80313, "r": 266.25885, "b": 471.53915, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 142, "text": "5", "bbox": {"l": 264.29047, "t": 468.80313, "r": 266.25885, "b": 471.53915, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 131, "label": "text", "bbox": {"l": 306.37213, "t": 468.80313, "r": 308.34052, "b": 471.53915, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 143, "text": "1", "bbox": {"l": 306.37213, "t": 468.80313, "r": 308.34052, "b": 471.53915, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 132, "label": "text", "bbox": {"l": 345.51526, "t": 468.80313, "r": 347.48364, "b": 471.53915, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 144, "text": "2", "bbox": {"l": 345.51526, "t": 468.80313, "r": 347.48364, "b": 471.53915, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 133, "label": "text", "bbox": {"l": 356.55634, "t": 468.80313, "r": 358.52472, "b": 471.53915, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 145, "text": "4", "bbox": {"l": 356.55634, "t": 468.80313, "r": 358.52472, "b": 471.53915, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 134, "label": "text", "bbox": {"l": 367.62582, "t": 468.80313, "r": 369.59418, "b": 471.53915, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 146, "text": "1", "bbox": {"l": 367.62582, "t": 468.80313, "r": 369.59418, "b": 471.53915, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 135, "label": "text", "bbox": {"l": 382.66107, "t": 468.80313, "r": 384.62946, "b": 471.53915, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 147, "text": "1", "bbox": {"l": 382.66107, "t": 468.80313, "r": 384.62946, "b": 471.53915, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 136, "label": "text", "bbox": {"l": 200.64, "t": 473.68185, "r": 206.51694, "b": 476.41788, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 148, "text": "416", "bbox": {"l": 200.64, "t": 473.68185, "r": 206.51694, "b": 476.41788, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 137, "label": "text", "bbox": {"l": 264.29047, "t": 473.68185, "r": 266.25885, "b": 476.41788, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 149, "text": "4", "bbox": {"l": 264.29047, "t": 473.68185, "r": 266.25885, "b": 476.41788, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 138, "label": "text", "bbox": {"l": 200.64, "t": 478.53214, "r": 206.51694, "b": 481.26816, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 150, "text": "230", "bbox": {"l": 200.64, "t": 478.53214, "r": 206.51694, "b": 481.26816, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 139, "label": "text", "bbox": {"l": 243.26373, "t": 478.53214, "r": 245.2321, "b": 481.26816, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 151, "text": "1", "bbox": {"l": 243.26373, "t": 478.53214, "r": 245.2321, "b": 481.26816, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 140, "label": "text", "bbox": {"l": 264.29047, "t": 478.53214, "r": 266.25885, "b": 481.26816, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 152, "text": "9", "bbox": {"l": 264.29047, "t": 478.53214, "r": 266.25885, "b": 481.26816, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 141, "label": "text", "bbox": {"l": 323.40466, "t": 478.53214, "r": 325.37305, "b": 481.26816, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 153, "text": "1", "bbox": {"l": 323.40466, "t": 478.53214, "r": 325.37305, "b": 481.26816, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 142, "label": "text", "bbox": {"l": 397.72519, "t": 478.53214, "r": 399.69354, "b": 481.26816, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 154, "text": "1", "bbox": {"l": 397.72519, "t": 478.53214, "r": 399.69354, "b": 481.26816, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 143, "label": "text", "bbox": {"l": 200.64, "t": 483.41086, "r": 206.51694, "b": 486.14688, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 155, "text": "276", "bbox": {"l": 200.64, "t": 483.41086, "r": 206.51694, "b": 486.14688, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 144, "label": "text", "bbox": {"l": 382.66132, "t": 483.41086, "r": 384.61563, "b": 486.14688, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 156, "text": "2", "bbox": {"l": 382.66132, "t": 483.41086, "r": 384.61563, "b": 486.14688, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 145, "label": "text", "bbox": {"l": 397.72513, "t": 483.41086, "r": 401.64819, "b": 486.14688, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 157, "text": "12", "bbox": {"l": 397.72513, "t": 483.41086, "r": 401.64819, "b": 486.14688, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 146, "label": "text", "bbox": {"l": 412.78928, "t": 483.41086, "r": 414.74359, "b": 486.14688, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 158, "text": "1", "bbox": {"l": 412.78928, "t": 483.41086, "r": 414.74359, "b": 486.14688, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 147, "label": "text", "bbox": {"l": 200.64014, "t": 488.28958, "r": 207.14445, "b": 491.0256, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 159, "text": "320", "bbox": {"l": 200.64014, "t": 488.28958, "r": 207.14445, "b": 491.0256, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 148, "label": "text", "bbox": {"l": 367.62616, "t": 488.28958, "r": 369.78375, "b": 491.0256, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 160, "text": "1", "bbox": {"l": 367.62616, "t": 488.28958, "r": 369.78375, "b": 491.0256, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 149, "label": "text", "bbox": {"l": 382.66141, "t": 488.28958, "r": 384.81897, "b": 491.0256, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 161, "text": "4", "bbox": {"l": 382.66141, "t": 488.28958, "r": 384.81897, "b": 491.0256, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 150, "label": "text", "bbox": {"l": 397.7251, "t": 488.28958, "r": 402.05087, "b": 491.0256, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 162, "text": "20", "bbox": {"l": 397.7251, "t": 488.28958, "r": 402.05087, "b": 491.0256, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 151, "label": "text", "bbox": {"l": 200.64032, "t": 493.1683, "r": 208.48566, "b": 495.90433, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 163, "text": "2013", "bbox": {"l": 200.64032, "t": 493.1683, "r": 208.48566, "b": 495.90433, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 152, "label": "text", "bbox": {"l": 264.29044, "t": 493.1683, "r": 266.25879, "b": 495.90433, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 164, "text": "3", "bbox": {"l": 264.29044, "t": 493.1683, "r": 266.25879, "b": 495.90433, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 153, "label": "text", "bbox": {"l": 227.91466, "t": 665.82603, "r": 230.10028, "b": 675.3464, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 165, "text": "\u03bc", "bbox": {"l": 227.91466, "t": 665.82603, "r": 230.10028, "b": 675.3464, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 154, "label": "text", "bbox": {"l": 300.58057, "t": 683.62195, "r": 302.72638, "b": 693.428658, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 166, "text": "\u2265", "bbox": {"l": 300.58057, "t": 683.62195, "r": 302.72638, "b": 693.428658, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {"0": {"label": "table", "id": 0, "page_no": 9, "cluster": {"id": 0, "label": "table", "bbox": {"l": 143.6376495361328, "t": 156.3477020263672, "r": 470.8485412597656, "b": 263.2624816894531, "coord_origin": "TOPLEFT"}, "confidence": 0.9884640574455261, "cells": [{"id": 7, "text": "Data set", "bbox": {"l": 160.782, "t": 166.55895999999996, "r": 194.99779, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Language", "bbox": {"l": 215.52499000000003, "t": 166.534, "r": 254.04465, "b": 174.6037, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "TEDs", "bbox": {"l": 300.397, "t": 161.07898, "r": 323.99118, "b": 169.14868, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "mAP(0.75)", "bbox": {"l": 370.345, "t": 166.55895999999996, "r": 414.74661, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Inference", "bbox": {"l": 426.737, "t": 161.07898, "r": 463.10830999999996, "b": 169.14868, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "time (secs)", "bbox": {"l": 423.11401, "t": 172.03796, "r": 466.72656, "b": 180.10766999999998, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "simple", "bbox": {"l": 262.41299, "t": 174.03101000000004, "r": 288.0596, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "complex", "bbox": {"l": 296.42899, "t": 174.03101000000004, "r": 329.44687, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "all", "bbox": {"l": 345.03299, "t": 174.03101000000004, "r": 354.75793, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "PubTabNet", "bbox": {"l": 154.53799, "t": 192.85999000000004, "r": 201.24129, "b": 200.92969000000005, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "OTSL", "bbox": {"l": 222.43700000000004, "t": 187.38098000000002, "r": 247.13226000000003, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "0.965", "bbox": {"l": 264.74399, "t": 187.38098000000002, "r": 285.73074, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "0.934", "bbox": {"l": 302.444, "t": 187.38098000000002, "r": 323.43076, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "0.955", "bbox": {"l": 339.40302, "t": 187.38098000000002, "r": 360.38977, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "0.88", "bbox": {"l": 383.116, "t": 187.31817999999998, "r": 401.97324, "b": 195.24451, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "2.73", "bbox": {"l": 435.49300999999997, "t": 187.31817999999998, "r": 454.35025, "b": 195.24451, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "HTML", "bbox": {"l": 220.903, "t": 200.33196999999996, "r": 248.66655999999998, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "0.969", "bbox": {"l": 264.74399, "t": 200.33196999999996, "r": 285.73074, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "0.927", "bbox": {"l": 302.444, "t": 200.33196999999996, "r": 323.43076, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "0.955", "bbox": {"l": 339.40302, "t": 200.33196999999996, "r": 360.38977, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "0.857", "bbox": {"l": 382.052, "t": 200.33196999999996, "r": 403.03876, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "5.39", "bbox": {"l": 436.73199000000005, "t": 200.33196999999996, "r": 453.11182, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "FinTabNet", "bbox": {"l": 155.94501, "t": 219.16198999999995, "r": 199.83374, "b": 227.23168999999996, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "OTSL", "bbox": {"l": 222.43700000000004, "t": 213.68201, "r": 247.13226000000003, "b": 221.75171, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "0.955", "bbox": {"l": 264.74399, "t": 213.68201, "r": 285.73074, "b": 221.75171, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "0.961", "bbox": {"l": 302.444, "t": 213.68201, "r": 323.43076, "b": 221.75171, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "0.959", "bbox": {"l": 337.815, "t": 213.61919999999998, "r": 361.97586, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "0.862", "bbox": {"l": 380.46399, "t": 213.61919999999998, "r": 404.62485, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "1.85", "bbox": {"l": 435.49300999999997, "t": 213.61919999999998, "r": 454.35025, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "HTML", "bbox": {"l": 220.903, "t": 226.63396999999998, "r": 248.66655999999998, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "0.917", "bbox": {"l": 264.74399, "t": 226.63396999999998, "r": 285.73074, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "0.922", "bbox": {"l": 302.444, "t": 226.63396999999998, "r": 323.43076, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "0.92", "bbox": {"l": 341.70599, "t": 226.63396999999998, "r": 358.08582, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "0.722", "bbox": {"l": 382.052, "t": 226.63396999999998, "r": 403.03876, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "3.26", "bbox": {"l": 436.73199000000005, "t": 226.63396999999998, "r": 453.11182, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "PubTables-1M", "bbox": {"l": 148.62601, "t": 245.46294999999998, "r": 207.1524, "b": 253.53265, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "OTSL", "bbox": {"l": 222.43700000000004, "t": 239.98297000000002, "r": 247.13226000000003, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "0.987", "bbox": {"l": 264.74399, "t": 239.98297000000002, "r": 285.73074, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "0.964", "bbox": {"l": 302.444, "t": 239.98297000000002, "r": 323.43076, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "0.977", "bbox": {"l": 337.815, "t": 239.92016999999998, "r": 361.97586, "b": 247.8465, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "0.896", "bbox": {"l": 380.46399, "t": 239.92016999999998, "r": 404.62485, "b": 247.8465, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "1.79", "bbox": {"l": 435.49300999999997, "t": 239.92016999999998, "r": 454.35025, "b": 247.8465, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "HTML", "bbox": {"l": 220.903, "t": 252.93499999999995, "r": 248.66655999999998, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "0.983", "bbox": {"l": 264.74399, "t": 252.93499999999995, "r": 285.73074, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "0.944", "bbox": {"l": 302.444, "t": 252.93499999999995, "r": 323.43076, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "0.966", "bbox": {"l": 339.40302, "t": 252.93499999999995, "r": 360.38977, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "0.889", "bbox": {"l": 382.052, "t": 252.93499999999995, "r": 403.03876, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "3.26", "bbox": {"l": 436.73199000000005, "t": 252.93499999999995, "r": 453.11182, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": [{"id": 8, "label": "text", "bbox": {"l": 160.782, "t": 166.55895999999996, "r": 194.99779, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "Data set", "bbox": {"l": 160.782, "t": 166.55895999999996, "r": 194.99779, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 215.52499000000003, "t": 166.534, "r": 254.04465, "b": 174.6037, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "Language", "bbox": {"l": 215.52499000000003, "t": 166.534, "r": 254.04465, "b": 174.6037, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "text", "bbox": {"l": 300.397, "t": 161.07898, "r": 323.99118, "b": 169.14868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "TEDs", "bbox": {"l": 300.397, "t": 161.07898, "r": 323.99118, "b": 169.14868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 370.345, "t": 166.55895999999996, "r": 414.74661, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "mAP(0.75)", "bbox": {"l": 370.345, "t": 166.55895999999996, "r": 414.74661, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 426.737, "t": 161.07898, "r": 463.10830999999996, "b": 169.14868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "Inference", "bbox": {"l": 426.737, "t": 161.07898, "r": 463.10830999999996, "b": 169.14868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 423.11401, "t": 172.03796, "r": 466.72656, "b": 180.10766999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "time (secs)", "bbox": {"l": 423.11401, "t": 172.03796, "r": 466.72656, "b": 180.10766999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 262.41299, "t": 174.03101000000004, "r": 288.0596, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "simple", "bbox": {"l": 262.41299, "t": 174.03101000000004, "r": 288.0596, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 296.42899, "t": 174.03101000000004, "r": 329.44687, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "complex", "bbox": {"l": 296.42899, "t": 174.03101000000004, "r": 329.44687, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 345.03299, "t": 174.03101000000004, "r": 354.75793, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "all", "bbox": {"l": 345.03299, "t": 174.03101000000004, "r": 354.75793, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 154.53799, "t": 192.85999000000004, "r": 201.24129, "b": 200.92969000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "PubTabNet", "bbox": {"l": 154.53799, "t": 192.85999000000004, "r": 201.24129, "b": 200.92969000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 222.43700000000004, "t": 187.38098000000002, "r": 247.13226000000003, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "OTSL", "bbox": {"l": 222.43700000000004, "t": 187.38098000000002, "r": 247.13226000000003, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 264.74399, "t": 187.38098000000002, "r": 285.73074, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "0.965", "bbox": {"l": 264.74399, "t": 187.38098000000002, "r": 285.73074, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 302.444, "t": 187.38098000000002, "r": 323.43076, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "0.934", "bbox": {"l": 302.444, "t": 187.38098000000002, "r": 323.43076, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 339.40302, "t": 187.38098000000002, "r": 360.38977, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "0.955", "bbox": {"l": 339.40302, "t": 187.38098000000002, "r": 360.38977, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 383.116, "t": 187.31817999999998, "r": 401.97324, "b": 195.24451, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "0.88", "bbox": {"l": 383.116, "t": 187.31817999999998, "r": 401.97324, "b": 195.24451, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 435.49300999999997, "t": 187.31817999999998, "r": 454.35025, "b": 195.24451, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "2.73", "bbox": {"l": 435.49300999999997, "t": 187.31817999999998, "r": 454.35025, "b": 195.24451, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 220.903, "t": 200.33196999999996, "r": 248.66655999999998, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "HTML", "bbox": {"l": 220.903, "t": 200.33196999999996, "r": 248.66655999999998, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 264.74399, "t": 200.33196999999996, "r": 285.73074, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "0.969", "bbox": {"l": 264.74399, "t": 200.33196999999996, "r": 285.73074, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 302.444, "t": 200.33196999999996, "r": 323.43076, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "0.927", "bbox": {"l": 302.444, "t": 200.33196999999996, "r": 323.43076, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 339.40302, "t": 200.33196999999996, "r": 360.38977, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "0.955", "bbox": {"l": 339.40302, "t": 200.33196999999996, "r": 360.38977, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 382.052, "t": 200.33196999999996, "r": 403.03876, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "0.857", "bbox": {"l": 382.052, "t": 200.33196999999996, "r": 403.03876, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 436.73199000000005, "t": 200.33196999999996, "r": 453.11182, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "5.39", "bbox": {"l": 436.73199000000005, "t": 200.33196999999996, "r": 453.11182, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 155.94501, "t": 219.16198999999995, "r": 199.83374, "b": 227.23168999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "FinTabNet", "bbox": {"l": 155.94501, "t": 219.16198999999995, "r": 199.83374, "b": 227.23168999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 222.43700000000004, "t": 213.68201, "r": 247.13226000000003, "b": 221.75171, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "OTSL", "bbox": {"l": 222.43700000000004, "t": 213.68201, "r": 247.13226000000003, "b": 221.75171, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 264.74399, "t": 213.68201, "r": 285.73074, "b": 221.75171, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "0.955", "bbox": {"l": 264.74399, "t": 213.68201, "r": 285.73074, "b": 221.75171, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 302.444, "t": 213.68201, "r": 323.43076, "b": 221.75171, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "0.961", "bbox": {"l": 302.444, "t": 213.68201, "r": 323.43076, "b": 221.75171, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 337.815, "t": 213.61919999999998, "r": 361.97586, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "0.959", "bbox": {"l": 337.815, "t": 213.61919999999998, "r": 361.97586, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 380.46399, "t": 213.61919999999998, "r": 404.62485, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "0.862", "bbox": {"l": 380.46399, "t": 213.61919999999998, "r": 404.62485, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 435.49300999999997, "t": 213.61919999999998, "r": 454.35025, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "1.85", "bbox": {"l": 435.49300999999997, "t": 213.61919999999998, "r": 454.35025, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 220.903, "t": 226.63396999999998, "r": 248.66655999999998, "b": 234.70367, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "HTML", "bbox": {"l": 220.903, "t": 226.63396999999998, "r": 248.66655999999998, "b": 234.70367, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 264.74399, "t": 226.63396999999998, "r": 285.73074, "b": 234.70367, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "0.917", "bbox": {"l": 264.74399, "t": 226.63396999999998, "r": 285.73074, "b": 234.70367, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 302.444, "t": 226.63396999999998, "r": 323.43076, "b": 234.70367, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "0.922", "bbox": {"l": 302.444, "t": 226.63396999999998, "r": 323.43076, "b": 234.70367, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 341.70599, "t": 226.63396999999998, "r": 358.08582, "b": 234.70367, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "0.92", "bbox": {"l": 341.70599, "t": 226.63396999999998, "r": 358.08582, "b": 234.70367, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 382.052, "t": 226.63396999999998, "r": 403.03876, "b": 234.70367, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "0.722", "bbox": {"l": 382.052, "t": 226.63396999999998, "r": 403.03876, "b": 234.70367, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 436.73199000000005, "t": 226.63396999999998, "r": 453.11182, "b": 234.70367, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "3.26", "bbox": {"l": 436.73199000000005, "t": 226.63396999999998, "r": 453.11182, "b": 234.70367, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 148.62601, "t": 245.46294999999998, "r": 207.1524, "b": 253.53265, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "PubTables-1M", "bbox": {"l": 148.62601, "t": 245.46294999999998, "r": 207.1524, "b": 253.53265, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 222.43700000000004, "t": 239.98297000000002, "r": 247.13226000000003, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "OTSL", "bbox": {"l": 222.43700000000004, "t": 239.98297000000002, "r": 247.13226000000003, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 264.74399, "t": 239.98297000000002, "r": 285.73074, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "0.987", "bbox": {"l": 264.74399, "t": 239.98297000000002, "r": 285.73074, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 302.444, "t": 239.98297000000002, "r": 323.43076, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "0.964", "bbox": {"l": 302.444, "t": 239.98297000000002, "r": 323.43076, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 337.815, "t": 239.92016999999998, "r": 361.97586, "b": 247.8465, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "0.977", "bbox": {"l": 337.815, "t": 239.92016999999998, "r": 361.97586, "b": 247.8465, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 380.46399, "t": 239.92016999999998, "r": 404.62485, "b": 247.8465, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "0.896", "bbox": {"l": 380.46399, "t": 239.92016999999998, "r": 404.62485, "b": 247.8465, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 435.49300999999997, "t": 239.92016999999998, "r": 454.35025, "b": 247.8465, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "1.79", "bbox": {"l": 435.49300999999997, "t": 239.92016999999998, "r": 454.35025, "b": 247.8465, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 220.903, "t": 252.93499999999995, "r": 248.66655999999998, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "HTML", "bbox": {"l": 220.903, "t": 252.93499999999995, "r": 248.66655999999998, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 264.74399, "t": 252.93499999999995, "r": 285.73074, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "0.983", "bbox": {"l": 264.74399, "t": 252.93499999999995, "r": 285.73074, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 302.444, "t": 252.93499999999995, "r": 323.43076, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "0.944", "bbox": {"l": 302.444, "t": 252.93499999999995, "r": 323.43076, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 339.40302, "t": 252.93499999999995, "r": 360.38977, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "0.966", "bbox": {"l": 339.40302, "t": 252.93499999999995, "r": 360.38977, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 382.052, "t": 252.93499999999995, "r": 403.03876, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "0.889", "bbox": {"l": 382.052, "t": 252.93499999999995, "r": 403.03876, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 436.73199000000005, "t": 252.93499999999995, "r": 453.11182, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "3.26", "bbox": {"l": 436.73199000000005, "t": 252.93499999999995, "r": 453.11182, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "lcel", "lcel", "ched", "ched", "nl", "ched", "ucel", "ched", "ched", "ched", "ucel", "ucel", "nl", "rhed", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 8, "num_cols": 7, "table_cells": [{"bbox": {"l": 215.52499000000003, "t": 166.534, "r": 254.04465, "b": 174.6037, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Language", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 300.397, "t": 161.07898, "r": 323.99118, "b": 169.14868, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 3, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 5, "text": "TEDs", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 370.345, "t": 166.55895999999996, "r": 414.74661, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 2, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "mAP(0.75)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 423.11401, "t": 161.07898, "r": 466.72656, "b": 180.10766999999998, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 2, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "Inference time (secs)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 262.41299, "t": 174.03101000000004, "r": 288.0596, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "simple", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 296.42899, "t": 174.03101000000004, "r": 329.44687, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "complex", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 345.03299, "t": 174.03101000000004, "r": 354.75793, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "all", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 154.53799, "t": 192.85999000000004, "r": 201.24129, "b": 200.92969000000005, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PubTabNet", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 222.43700000000004, "t": 187.38098000000002, "r": 247.13226000000003, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "OTSL", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 264.74399, "t": 187.38098000000002, "r": 285.73074, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.965", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 302.444, "t": 187.38098000000002, "r": 323.43076, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.934", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 339.40302, "t": 187.38098000000002, "r": 360.38977, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.955", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 383.116, "t": 187.31817999999998, "r": 401.97324, "b": 195.24451, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 435.49300999999997, "t": 187.31817999999998, "r": 454.35025, "b": 195.24451, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "2.73", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 220.903, "t": 200.33196999999996, "r": 248.66655999999998, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "HTML", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 264.74399, "t": 200.33196999999996, "r": 285.73074, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.969", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 302.444, "t": 200.33196999999996, "r": 323.43076, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.927", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 339.40302, "t": 200.33196999999996, "r": 360.38977, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.955", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 382.052, "t": 200.33196999999996, "r": 403.03876, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.857", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 436.73199000000005, "t": 200.33196999999996, "r": 453.11182, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "5.39", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 155.94501, "t": 219.16198999999995, "r": 199.83374, "b": 227.23168999999996, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "FinTabNet", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 222.43700000000004, "t": 213.68201, "r": 247.13226000000003, "b": 221.75171, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "OTSL", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 264.74399, "t": 213.68201, "r": 285.73074, "b": 221.75171, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.955", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 302.444, "t": 213.68201, "r": 323.43076, "b": 221.75171, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.961", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 337.815, "t": 213.61919999999998, "r": 361.97586, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.959", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 380.46399, "t": 213.61919999999998, "r": 404.62485, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.862", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 435.49300999999997, "t": 213.61919999999998, "r": 454.35025, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "1.85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 220.903, "t": 226.63396999999998, "r": 248.66655999999998, "b": 234.70367, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "HTML", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 264.74399, "t": 226.63396999999998, "r": 285.73074, "b": 234.70367, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.917", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 302.444, "t": 226.63396999999998, "r": 323.43076, "b": 234.70367, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.922", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 341.70599, "t": 226.63396999999998, "r": 358.08582, "b": 234.70367, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.92", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 382.052, "t": 226.63396999999998, "r": 403.03876, "b": 234.70367, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.722", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 436.73199000000005, "t": 226.63396999999998, "r": 453.11182, "b": 234.70367, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "3.26", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 148.62601, "t": 245.46294999999998, "r": 207.1524, "b": 253.53265, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PubTables-1M", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 222.43700000000004, "t": 239.98297000000002, "r": 247.13226000000003, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "OTSL", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 264.74399, "t": 239.98297000000002, "r": 285.73074, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.987", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 302.444, "t": 239.98297000000002, "r": 323.43076, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.964", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 337.815, "t": 239.92016999999998, "r": 361.97586, "b": 247.8465, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.977", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 380.46399, "t": 239.92016999999998, "r": 404.62485, "b": 247.8465, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.896", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 435.49300999999997, "t": 239.92016999999998, "r": 454.35025, "b": 247.8465, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "1.79", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 220.903, "t": 252.93499999999995, "r": 248.66655999999998, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "HTML", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 264.74399, "t": 252.93499999999995, "r": 285.73074, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.983", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 302.444, "t": 252.93499999999995, "r": 323.43076, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.944", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 339.40302, "t": 252.93499999999995, "r": 360.38977, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.966", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 382.052, "t": 252.93499999999995, "r": 403.03876, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.889", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 436.73199000000005, "t": 252.93499999999995, "r": 453.11182, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "3.26", "column_header": false, "row_header": false, "row_section": false}]}}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_header", "id": 7, "page_no": 9, "cluster": {"id": 7, "label": "page_header", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 143.97887, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8309906721115112, "cells": [{"id": 0, "text": "10", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 143.97887, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "10"}, {"label": "page_header", "id": 6, "page_no": 9, "cluster": {"id": 6, "label": "page_header", "bbox": {"l": 167.82053, "t": 93.77099999999996, "r": 231.72049000000004, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8367075324058533, "cells": [{"id": 1, "text": "M.", "bbox": {"l": 167.82053, "t": 93.77099999999996, "r": 178.08249, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37929, "t": 93.77099999999996, "r": 231.72049000000004, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "M. Lysak, et al."}, {"label": "caption", "id": 4, "page_no": 9, "cluster": {"id": 4, "label": "caption", "bbox": {"l": 134.765, "t": 115.83618000000001, "r": 480.59357000000006, "b": 145.88666, "coord_origin": "TOPLEFT"}, "confidence": 0.9512290954589844, "cells": [{"id": 3, "text": "Table 2.", "bbox": {"l": 134.765, "t": 115.83618000000001, "r": 173.09366, "b": 123.76251000000002, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "TSR and cell detection results compared between OTSL and HTML on", "bbox": {"l": 181.30299, "t": 115.89899000000003, "r": 480.59151999999995, "b": 123.96868999999992, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "the PubTabNet [22], FinTabNet [21] and PubTables-1M [14] data sets using Table-", "bbox": {"l": 134.765, "t": 126.85797000000014, "r": 480.59357000000006, "b": 134.92767000000003, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Former [9] (with enc=6, dec=6, heads=8).", "bbox": {"l": 134.765, "t": 137.81696, "r": 305.95691, "b": 145.88666, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 2. TSR and cell detection results compared between OTSL and HTML on the PubTabNet [22], FinTabNet [21] and PubTables-1M [14] data sets using TableFormer [9] (with enc=6, dec=6, heads=8)."}, {"label": "table", "id": 0, "page_no": 9, "cluster": {"id": 0, "label": "table", "bbox": {"l": 143.6376495361328, "t": 156.3477020263672, "r": 470.8485412597656, "b": 263.2624816894531, "coord_origin": "TOPLEFT"}, "confidence": 0.9884640574455261, "cells": [{"id": 7, "text": "Data set", "bbox": {"l": 160.782, "t": 166.55895999999996, "r": 194.99779, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Language", "bbox": {"l": 215.52499000000003, "t": 166.534, "r": 254.04465, "b": 174.6037, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "TEDs", "bbox": {"l": 300.397, "t": 161.07898, "r": 323.99118, "b": 169.14868, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "mAP(0.75)", "bbox": {"l": 370.345, "t": 166.55895999999996, "r": 414.74661, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Inference", "bbox": {"l": 426.737, "t": 161.07898, "r": 463.10830999999996, "b": 169.14868, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "time (secs)", "bbox": {"l": 423.11401, "t": 172.03796, "r": 466.72656, "b": 180.10766999999998, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "simple", "bbox": {"l": 262.41299, "t": 174.03101000000004, "r": 288.0596, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "complex", "bbox": {"l": 296.42899, "t": 174.03101000000004, "r": 329.44687, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "all", "bbox": {"l": 345.03299, "t": 174.03101000000004, "r": 354.75793, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "PubTabNet", "bbox": {"l": 154.53799, "t": 192.85999000000004, "r": 201.24129, "b": 200.92969000000005, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "OTSL", "bbox": {"l": 222.43700000000004, "t": 187.38098000000002, "r": 247.13226000000003, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "0.965", "bbox": {"l": 264.74399, "t": 187.38098000000002, "r": 285.73074, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "0.934", "bbox": {"l": 302.444, "t": 187.38098000000002, "r": 323.43076, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "0.955", "bbox": {"l": 339.40302, "t": 187.38098000000002, "r": 360.38977, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "0.88", "bbox": {"l": 383.116, "t": 187.31817999999998, "r": 401.97324, "b": 195.24451, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "2.73", "bbox": {"l": 435.49300999999997, "t": 187.31817999999998, "r": 454.35025, "b": 195.24451, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "HTML", "bbox": {"l": 220.903, "t": 200.33196999999996, "r": 248.66655999999998, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "0.969", "bbox": {"l": 264.74399, "t": 200.33196999999996, "r": 285.73074, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "0.927", "bbox": {"l": 302.444, "t": 200.33196999999996, "r": 323.43076, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "0.955", "bbox": {"l": 339.40302, "t": 200.33196999999996, "r": 360.38977, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "0.857", "bbox": {"l": 382.052, "t": 200.33196999999996, "r": 403.03876, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "5.39", "bbox": {"l": 436.73199000000005, "t": 200.33196999999996, "r": 453.11182, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "FinTabNet", "bbox": {"l": 155.94501, "t": 219.16198999999995, "r": 199.83374, "b": 227.23168999999996, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "OTSL", "bbox": {"l": 222.43700000000004, "t": 213.68201, "r": 247.13226000000003, "b": 221.75171, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "0.955", "bbox": {"l": 264.74399, "t": 213.68201, "r": 285.73074, "b": 221.75171, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "0.961", "bbox": {"l": 302.444, "t": 213.68201, "r": 323.43076, "b": 221.75171, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "0.959", "bbox": {"l": 337.815, "t": 213.61919999999998, "r": 361.97586, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "0.862", "bbox": {"l": 380.46399, "t": 213.61919999999998, "r": 404.62485, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "1.85", "bbox": {"l": 435.49300999999997, "t": 213.61919999999998, "r": 454.35025, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "HTML", "bbox": {"l": 220.903, "t": 226.63396999999998, "r": 248.66655999999998, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "0.917", "bbox": {"l": 264.74399, "t": 226.63396999999998, "r": 285.73074, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "0.922", "bbox": {"l": 302.444, "t": 226.63396999999998, "r": 323.43076, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "0.92", "bbox": {"l": 341.70599, "t": 226.63396999999998, "r": 358.08582, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "0.722", "bbox": {"l": 382.052, "t": 226.63396999999998, "r": 403.03876, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "3.26", "bbox": {"l": 436.73199000000005, "t": 226.63396999999998, "r": 453.11182, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "PubTables-1M", "bbox": {"l": 148.62601, "t": 245.46294999999998, "r": 207.1524, "b": 253.53265, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "OTSL", "bbox": {"l": 222.43700000000004, "t": 239.98297000000002, "r": 247.13226000000003, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "0.987", "bbox": {"l": 264.74399, "t": 239.98297000000002, "r": 285.73074, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "0.964", "bbox": {"l": 302.444, "t": 239.98297000000002, "r": 323.43076, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "0.977", "bbox": {"l": 337.815, "t": 239.92016999999998, "r": 361.97586, "b": 247.8465, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "0.896", "bbox": {"l": 380.46399, "t": 239.92016999999998, "r": 404.62485, "b": 247.8465, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "1.79", "bbox": {"l": 435.49300999999997, "t": 239.92016999999998, "r": 454.35025, "b": 247.8465, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "HTML", "bbox": {"l": 220.903, "t": 252.93499999999995, "r": 248.66655999999998, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "0.983", "bbox": {"l": 264.74399, "t": 252.93499999999995, "r": 285.73074, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "0.944", "bbox": {"l": 302.444, "t": 252.93499999999995, "r": 323.43076, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "0.966", "bbox": {"l": 339.40302, "t": 252.93499999999995, "r": 360.38977, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "0.889", "bbox": {"l": 382.052, "t": 252.93499999999995, "r": 403.03876, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "3.26", "bbox": {"l": 436.73199000000005, "t": 252.93499999999995, "r": 453.11182, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": [{"id": 8, "label": "text", "bbox": {"l": 160.782, "t": 166.55895999999996, "r": 194.99779, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "Data set", "bbox": {"l": 160.782, "t": 166.55895999999996, "r": 194.99779, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 215.52499000000003, "t": 166.534, "r": 254.04465, "b": 174.6037, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "Language", "bbox": {"l": 215.52499000000003, "t": 166.534, "r": 254.04465, "b": 174.6037, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "text", "bbox": {"l": 300.397, "t": 161.07898, "r": 323.99118, "b": 169.14868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "TEDs", "bbox": {"l": 300.397, "t": 161.07898, "r": 323.99118, "b": 169.14868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 370.345, "t": 166.55895999999996, "r": 414.74661, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "mAP(0.75)", "bbox": {"l": 370.345, "t": 166.55895999999996, "r": 414.74661, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 426.737, "t": 161.07898, "r": 463.10830999999996, "b": 169.14868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "Inference", "bbox": {"l": 426.737, "t": 161.07898, "r": 463.10830999999996, "b": 169.14868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 423.11401, "t": 172.03796, "r": 466.72656, "b": 180.10766999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "time (secs)", "bbox": {"l": 423.11401, "t": 172.03796, "r": 466.72656, "b": 180.10766999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 262.41299, "t": 174.03101000000004, "r": 288.0596, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "simple", "bbox": {"l": 262.41299, "t": 174.03101000000004, "r": 288.0596, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 296.42899, "t": 174.03101000000004, "r": 329.44687, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "complex", "bbox": {"l": 296.42899, "t": 174.03101000000004, "r": 329.44687, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 345.03299, "t": 174.03101000000004, "r": 354.75793, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "all", "bbox": {"l": 345.03299, "t": 174.03101000000004, "r": 354.75793, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 154.53799, "t": 192.85999000000004, "r": 201.24129, "b": 200.92969000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "PubTabNet", "bbox": {"l": 154.53799, "t": 192.85999000000004, "r": 201.24129, "b": 200.92969000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 222.43700000000004, "t": 187.38098000000002, "r": 247.13226000000003, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "OTSL", "bbox": {"l": 222.43700000000004, "t": 187.38098000000002, "r": 247.13226000000003, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 264.74399, "t": 187.38098000000002, "r": 285.73074, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "0.965", "bbox": {"l": 264.74399, "t": 187.38098000000002, "r": 285.73074, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 302.444, "t": 187.38098000000002, "r": 323.43076, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "0.934", "bbox": {"l": 302.444, "t": 187.38098000000002, "r": 323.43076, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 339.40302, "t": 187.38098000000002, "r": 360.38977, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "0.955", "bbox": {"l": 339.40302, "t": 187.38098000000002, "r": 360.38977, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 383.116, "t": 187.31817999999998, "r": 401.97324, "b": 195.24451, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "0.88", "bbox": {"l": 383.116, "t": 187.31817999999998, "r": 401.97324, "b": 195.24451, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 435.49300999999997, "t": 187.31817999999998, "r": 454.35025, "b": 195.24451, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "2.73", "bbox": {"l": 435.49300999999997, "t": 187.31817999999998, "r": 454.35025, "b": 195.24451, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 220.903, "t": 200.33196999999996, "r": 248.66655999999998, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "HTML", "bbox": {"l": 220.903, "t": 200.33196999999996, "r": 248.66655999999998, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 264.74399, "t": 200.33196999999996, "r": 285.73074, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "0.969", "bbox": {"l": 264.74399, "t": 200.33196999999996, "r": 285.73074, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 302.444, "t": 200.33196999999996, "r": 323.43076, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "0.927", "bbox": {"l": 302.444, "t": 200.33196999999996, "r": 323.43076, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 339.40302, "t": 200.33196999999996, "r": 360.38977, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "0.955", "bbox": {"l": 339.40302, "t": 200.33196999999996, "r": 360.38977, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 382.052, "t": 200.33196999999996, "r": 403.03876, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "0.857", "bbox": {"l": 382.052, "t": 200.33196999999996, "r": 403.03876, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 436.73199000000005, "t": 200.33196999999996, "r": 453.11182, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "5.39", "bbox": {"l": 436.73199000000005, "t": 200.33196999999996, "r": 453.11182, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 155.94501, "t": 219.16198999999995, "r": 199.83374, "b": 227.23168999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "FinTabNet", "bbox": {"l": 155.94501, "t": 219.16198999999995, "r": 199.83374, "b": 227.23168999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 222.43700000000004, "t": 213.68201, "r": 247.13226000000003, "b": 221.75171, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "OTSL", "bbox": {"l": 222.43700000000004, "t": 213.68201, "r": 247.13226000000003, "b": 221.75171, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 264.74399, "t": 213.68201, "r": 285.73074, "b": 221.75171, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "0.955", "bbox": {"l": 264.74399, "t": 213.68201, "r": 285.73074, "b": 221.75171, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 302.444, "t": 213.68201, "r": 323.43076, "b": 221.75171, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "0.961", "bbox": {"l": 302.444, "t": 213.68201, "r": 323.43076, "b": 221.75171, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 337.815, "t": 213.61919999999998, "r": 361.97586, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "0.959", "bbox": {"l": 337.815, "t": 213.61919999999998, "r": 361.97586, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 380.46399, "t": 213.61919999999998, "r": 404.62485, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "0.862", "bbox": {"l": 380.46399, "t": 213.61919999999998, "r": 404.62485, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 435.49300999999997, "t": 213.61919999999998, "r": 454.35025, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "1.85", "bbox": {"l": 435.49300999999997, "t": 213.61919999999998, "r": 454.35025, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 220.903, "t": 226.63396999999998, "r": 248.66655999999998, "b": 234.70367, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "HTML", "bbox": {"l": 220.903, "t": 226.63396999999998, "r": 248.66655999999998, "b": 234.70367, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 264.74399, "t": 226.63396999999998, "r": 285.73074, "b": 234.70367, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "0.917", "bbox": {"l": 264.74399, "t": 226.63396999999998, "r": 285.73074, "b": 234.70367, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 302.444, "t": 226.63396999999998, "r": 323.43076, "b": 234.70367, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "0.922", "bbox": {"l": 302.444, "t": 226.63396999999998, "r": 323.43076, "b": 234.70367, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 341.70599, "t": 226.63396999999998, "r": 358.08582, "b": 234.70367, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "0.92", "bbox": {"l": 341.70599, "t": 226.63396999999998, "r": 358.08582, "b": 234.70367, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 382.052, "t": 226.63396999999998, "r": 403.03876, "b": 234.70367, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "0.722", "bbox": {"l": 382.052, "t": 226.63396999999998, "r": 403.03876, "b": 234.70367, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 436.73199000000005, "t": 226.63396999999998, "r": 453.11182, "b": 234.70367, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "3.26", "bbox": {"l": 436.73199000000005, "t": 226.63396999999998, "r": 453.11182, "b": 234.70367, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 148.62601, "t": 245.46294999999998, "r": 207.1524, "b": 253.53265, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "PubTables-1M", "bbox": {"l": 148.62601, "t": 245.46294999999998, "r": 207.1524, "b": 253.53265, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 222.43700000000004, "t": 239.98297000000002, "r": 247.13226000000003, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "OTSL", "bbox": {"l": 222.43700000000004, "t": 239.98297000000002, "r": 247.13226000000003, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 264.74399, "t": 239.98297000000002, "r": 285.73074, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "0.987", "bbox": {"l": 264.74399, "t": 239.98297000000002, "r": 285.73074, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 302.444, "t": 239.98297000000002, "r": 323.43076, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "0.964", "bbox": {"l": 302.444, "t": 239.98297000000002, "r": 323.43076, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 337.815, "t": 239.92016999999998, "r": 361.97586, "b": 247.8465, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "0.977", "bbox": {"l": 337.815, "t": 239.92016999999998, "r": 361.97586, "b": 247.8465, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 380.46399, "t": 239.92016999999998, "r": 404.62485, "b": 247.8465, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "0.896", "bbox": {"l": 380.46399, "t": 239.92016999999998, "r": 404.62485, "b": 247.8465, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 435.49300999999997, "t": 239.92016999999998, "r": 454.35025, "b": 247.8465, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "1.79", "bbox": {"l": 435.49300999999997, "t": 239.92016999999998, "r": 454.35025, "b": 247.8465, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 220.903, "t": 252.93499999999995, "r": 248.66655999999998, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "HTML", "bbox": {"l": 220.903, "t": 252.93499999999995, "r": 248.66655999999998, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 264.74399, "t": 252.93499999999995, "r": 285.73074, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "0.983", "bbox": {"l": 264.74399, "t": 252.93499999999995, "r": 285.73074, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 302.444, "t": 252.93499999999995, "r": 323.43076, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "0.944", "bbox": {"l": 302.444, "t": 252.93499999999995, "r": 323.43076, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 339.40302, "t": 252.93499999999995, "r": 360.38977, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "0.966", "bbox": {"l": 339.40302, "t": 252.93499999999995, "r": 360.38977, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 382.052, "t": 252.93499999999995, "r": 403.03876, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "0.889", "bbox": {"l": 382.052, "t": 252.93499999999995, "r": 403.03876, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 436.73199000000005, "t": 252.93499999999995, "r": 453.11182, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "3.26", "bbox": {"l": 436.73199000000005, "t": 252.93499999999995, "r": 453.11182, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "lcel", "lcel", "ched", "ched", "nl", "ched", "ucel", "ched", "ched", "ched", "ucel", "ucel", "nl", "rhed", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 8, "num_cols": 7, "table_cells": [{"bbox": {"l": 215.52499000000003, "t": 166.534, "r": 254.04465, "b": 174.6037, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Language", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 300.397, "t": 161.07898, "r": 323.99118, "b": 169.14868, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 3, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 5, "text": "TEDs", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 370.345, "t": 166.55895999999996, "r": 414.74661, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 2, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "mAP(0.75)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 423.11401, "t": 161.07898, "r": 466.72656, "b": 180.10766999999998, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 2, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "Inference time (secs)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 262.41299, "t": 174.03101000000004, "r": 288.0596, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "simple", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 296.42899, "t": 174.03101000000004, "r": 329.44687, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "complex", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 345.03299, "t": 174.03101000000004, "r": 354.75793, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "all", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 154.53799, "t": 192.85999000000004, "r": 201.24129, "b": 200.92969000000005, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PubTabNet", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 222.43700000000004, "t": 187.38098000000002, "r": 247.13226000000003, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "OTSL", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 264.74399, "t": 187.38098000000002, "r": 285.73074, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.965", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 302.444, "t": 187.38098000000002, "r": 323.43076, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.934", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 339.40302, "t": 187.38098000000002, "r": 360.38977, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.955", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 383.116, "t": 187.31817999999998, "r": 401.97324, "b": 195.24451, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 435.49300999999997, "t": 187.31817999999998, "r": 454.35025, "b": 195.24451, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "2.73", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 220.903, "t": 200.33196999999996, "r": 248.66655999999998, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "HTML", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 264.74399, "t": 200.33196999999996, "r": 285.73074, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.969", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 302.444, "t": 200.33196999999996, "r": 323.43076, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.927", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 339.40302, "t": 200.33196999999996, "r": 360.38977, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.955", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 382.052, "t": 200.33196999999996, "r": 403.03876, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.857", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 436.73199000000005, "t": 200.33196999999996, "r": 453.11182, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "5.39", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 155.94501, "t": 219.16198999999995, "r": 199.83374, "b": 227.23168999999996, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "FinTabNet", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 222.43700000000004, "t": 213.68201, "r": 247.13226000000003, "b": 221.75171, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "OTSL", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 264.74399, "t": 213.68201, "r": 285.73074, "b": 221.75171, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.955", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 302.444, "t": 213.68201, "r": 323.43076, "b": 221.75171, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.961", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 337.815, "t": 213.61919999999998, "r": 361.97586, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.959", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 380.46399, "t": 213.61919999999998, "r": 404.62485, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.862", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 435.49300999999997, "t": 213.61919999999998, "r": 454.35025, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "1.85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 220.903, "t": 226.63396999999998, "r": 248.66655999999998, "b": 234.70367, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "HTML", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 264.74399, "t": 226.63396999999998, "r": 285.73074, "b": 234.70367, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.917", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 302.444, "t": 226.63396999999998, "r": 323.43076, "b": 234.70367, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.922", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 341.70599, "t": 226.63396999999998, "r": 358.08582, "b": 234.70367, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.92", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 382.052, "t": 226.63396999999998, "r": 403.03876, "b": 234.70367, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.722", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 436.73199000000005, "t": 226.63396999999998, "r": 453.11182, "b": 234.70367, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "3.26", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 148.62601, "t": 245.46294999999998, "r": 207.1524, "b": 253.53265, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PubTables-1M", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 222.43700000000004, "t": 239.98297000000002, "r": 247.13226000000003, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "OTSL", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 264.74399, "t": 239.98297000000002, "r": 285.73074, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.987", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 302.444, "t": 239.98297000000002, "r": 323.43076, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.964", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 337.815, "t": 239.92016999999998, "r": 361.97586, "b": 247.8465, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.977", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 380.46399, "t": 239.92016999999998, "r": 404.62485, "b": 247.8465, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.896", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 435.49300999999997, "t": 239.92016999999998, "r": 454.35025, "b": 247.8465, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "1.79", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 220.903, "t": 252.93499999999995, "r": 248.66655999999998, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "HTML", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 264.74399, "t": 252.93499999999995, "r": 285.73074, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.983", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 302.444, "t": 252.93499999999995, "r": 323.43076, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.944", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 339.40302, "t": 252.93499999999995, "r": 360.38977, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.966", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 382.052, "t": 252.93499999999995, "r": 403.03876, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.889", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 436.73199000000005, "t": 252.93499999999995, "r": 453.11182, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "3.26", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "section_header", "id": 3, "page_no": 9, "cluster": {"id": 3, "label": "section_header", "bbox": {"l": 134.765, "t": 288.91479, "r": 257.08679, "b": 297.72173999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9546447992324829, "cells": [{"id": 55, "text": "5.3", "bbox": {"l": 134.765, "t": 288.91479, "r": 149.40205, "b": 297.72173999999995, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Qualitative Results", "bbox": {"l": 160.85904, "t": 288.91479, "r": 257.08679, "b": 297.72173999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5.3 Qualitative Results"}, {"label": "text", "id": 1, "page_no": 9, "cluster": {"id": 1, "label": "text", "bbox": {"l": 134.765, "t": 309.86078, "r": 480.58981, "b": 366.47769, "coord_origin": "TOPLEFT"}, "confidence": 0.9834085702896118, "cells": [{"id": 57, "text": "To illustrate the qualitative differences between OTSL and HTML, Figure 5", "bbox": {"l": 134.765, "t": 309.86078, "r": 480.58777, "b": 318.65775, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "demonstrates less overlap and more accurate bounding boxes with OTSL. In", "bbox": {"l": 134.765, "t": 321.81577, "r": 480.58889999999997, "b": 330.61273, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Figure 6, OTSL proves to be more effective in handling tables with longer to-", "bbox": {"l": 134.765, "t": 333.77075, "r": 480.58681999999993, "b": 342.56772, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "ken sequences, resulting in even more precise structure prediction and bounding", "bbox": {"l": 134.765, "t": 345.72574, "r": 480.58981, "b": 354.52271, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "boxes.", "bbox": {"l": 134.765, "t": 357.68073, "r": 161.65704, "b": 366.47769, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "To illustrate the qualitative differences between OTSL and HTML, Figure 5 demonstrates less overlap and more accurate bounding boxes with OTSL. In Figure 6, OTSL proves to be more effective in handling tables with longer token sequences, resulting in even more precise structure prediction and bounding boxes."}, {"label": "caption", "id": 5, "page_no": 9, "cluster": {"id": 5, "label": "caption", "bbox": {"l": 134.765, "t": 397.59012, "r": 480.59106, "b": 439.71716, "coord_origin": "TOPLEFT"}, "confidence": 0.9482728838920593, "cells": [{"id": 62, "text": "Fig. 5.", "bbox": {"l": 134.765, "t": 397.59012, "r": 162.64424, "b": 405.51642, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "The OTSL model produces more accurate bounding boxes with less over-", "bbox": {"l": 167.384, "t": 397.65289, "r": 480.59106, "b": 405.72266, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "lap (E) than the HTML model (D), when predicting the structure of a sparse ta-", "bbox": {"l": 134.765, "t": 408.61190999999997, "r": 480.59106, "b": 416.68167000000005, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "ble (A), at twice the inference speed because of shorter sequence length (B),(C).", "bbox": {"l": 134.765, "t": 419.57089, "r": 480.58838000000003, "b": 427.64066, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "\"PMC2807444_006_00.png\" PubTabNet.", "bbox": {"l": 134.765, "t": 430.52987999999993, "r": 304.69171, "b": 438.59964, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "\u03bc", "bbox": {"l": 342.63354, "t": 430.19678, "r": 344.81915, "b": 439.71716, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Fig. 5. The OTSL model produces more accurate bounding boxes with less overlap (E) than the HTML model (D), when predicting the structure of a sparse table (A), at twice the inference speed because of shorter sequence length (B),(C). \"PMC2807444_006_00.png\" PubTabNet. \u03bc"}, {"label": "picture", "id": 2, "page_no": 9, "cluster": {"id": 2, "label": "picture", "bbox": {"l": 162.67430114746094, "t": 444.62255859375, "r": 451.70062255859375, "b": 663.2135620117188, "coord_origin": "TOPLEFT"}, "confidence": 0.9742383360862732, "cells": [{"id": 67, "text": "<table>", "bbox": {"l": 180.12473, "t": 516.2332200000001, "r": 190.62042, "b": 518.94992, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "<tr><td></td><td colspan=\"4\"></td><td colspan=\"6\"></td><td colspan=\"3\"></td></tr>", "bbox": {"l": 183.2438, "t": 520.13208, "r": 304.54797, "b": 522.84879, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 524.03094, "r": 388.42313, "b": 526.74765, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 527.9297799999999, "r": 388.42313, "b": 530.64648, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 531.82861, "r": 388.42313, "b": 534.54532, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 535.72748, "r": 388.42313, "b": 538.44418, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 539.62631, "r": 388.42313, "b": 542.34303, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 543.52516, "r": 388.42313, "b": 546.24188, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 547.42401, "r": 388.42313, "b": 550.14073, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 551.32286, "r": 388.42313, "b": 554.03958, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "</table>", "bbox": {"l": 180.12473, "t": 555.22173, "r": 191.86806, "b": 557.93845, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "C", "bbox": {"l": 407.38348, "t": 518.30042, "r": 408.82025, "b": 521.01712, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "C L L L C L L L L L C L L NL", "bbox": {"l": 410.25699, "t": 518.30042, "r": 450.48605, "b": 521.01712, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "C", "bbox": {"l": 407.38348, "t": 522.19925, "r": 408.82025, "b": 524.9159500000001, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 522.19925, "r": 450.48605, "b": 524.9159500000001, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "C", "bbox": {"l": 407.38348, "t": 526.09808, "r": 408.82025, "b": 528.81479, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 526.09808, "r": 450.48605, "b": 528.81479, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "C", "bbox": {"l": 407.38348, "t": 529.99695, "r": 408.82025, "b": 532.7136499999999, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 529.99695, "r": 450.48605, "b": 532.7136499999999, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "C", "bbox": {"l": 407.38348, "t": 533.8957800000001, "r": 408.82025, "b": 536.6125, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 533.8957800000001, "r": 450.48605, "b": 536.6125, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "C", "bbox": {"l": 407.38348, "t": 537.79463, "r": 408.82025, "b": 540.51135, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 537.79463, "r": 450.48605, "b": 540.51135, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "C", "bbox": {"l": 407.38348, "t": 541.69348, "r": 408.82025, "b": 544.4102, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 541.69348, "r": 450.48605, "b": 544.4102, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "C", "bbox": {"l": 407.38348, "t": 545.59233, "r": 408.82025, "b": 548.3090500000001, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 545.59233, "r": 450.48605, "b": 548.3090500000001, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "C", "bbox": {"l": 407.38348, "t": 549.4911999999999, "r": 408.82025, "b": 552.2079200000001, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 549.4911999999999, "r": 450.48605, "b": 552.2079200000001, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "HTML", "bbox": {"l": 164.52881, "t": 509.45859, "r": 181.8528, "b": 515.31, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "#", "bbox": {"l": 183.58441, "t": 509.45859, "r": 186.3974, "b": 515.31, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "tokens:", "bbox": {"l": 189.2104, "t": 509.45859, "r": 208.90137, "b": 515.31, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "258", "bbox": {"l": 210.63269, "t": 509.45859, "r": 221.04044, "b": 515.31, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "OTSL", "bbox": {"l": 390.20203, "t": 509.60361, "r": 406.83609, "b": 515.45502, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "#", "bbox": {"l": 408.56952, "t": 509.60361, "r": 411.38251, "b": 515.45502, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "tokens:", "bbox": {"l": 414.1955, "t": 509.60361, "r": 433.88647000000003, "b": 515.45502, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "135", "bbox": {"l": 435.61737, "t": 509.60361, "r": 446.02512, "b": 515.45502, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "B", "bbox": {"l": 167.19316, "t": 519.07236, "r": 172.8231, "b": 526.3866, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "A", "bbox": {"l": 187.33745, "t": 448.62485, "r": 192.96739, "b": 455.93909, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "D", "bbox": {"l": 167.38654, "t": 566.0051599999999, "r": 173.01648, "b": 573.3194, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "E", "bbox": {"l": 248.45621000000003, "t": 621.78008, "r": 253.65727, "b": 629.09431, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "C", "bbox": {"l": 395.90057, "t": 519.19946, "r": 401.53052, "b": 526.5137, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "HTML", "bbox": {"l": 171.62886, "t": 580.28853, "r": 177.48148, "b": 597.26784, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "OTSL", "bbox": {"l": 251.05969000000002, "t": 633.63408, "r": 256.91235, "b": 649.92345, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "HTML model shows", "bbox": {"l": 372.14645, "t": 601.45724, "r": 427.0379, "b": 607.30864, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "bounding box drifting", "bbox": {"l": 372.14645, "t": 607.89948, "r": 430.06838999999997, "b": 613.75087, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "OTSL model shows", "bbox": {"l": 176.88042, "t": 642.87209, "r": 231.08191, "b": 648.72348, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "clean bounding box", "bbox": {"l": 176.88042, "t": 649.3143, "r": 230.99271000000002, "b": 655.1657, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "alignment", "bbox": {"l": 176.88042, "t": 655.7565500000001, "r": 203.93219, "b": 661.60794, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "\u2264", "bbox": {"l": 215.93231000000003, "t": 557.56342, "r": 218.4697, "b": 569.15967, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "\u03bc", "bbox": {"l": 229.05689999999998, "t": 557.56342, "r": 231.71908999999997, "b": 569.15967, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "S", "bbox": {"l": 261.20892, "t": 448.46124, "r": 263.56973, "b": 451.19727, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "I", "bbox": {"l": 312.33463, "t": 448.46124, "r": 313.6362, "b": 451.19727, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "R", "bbox": {"l": 377.41125, "t": 448.46124, "r": 380.05737, "b": 451.19727, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "ST", "bbox": {"l": 200.63976, "t": 453.33997, "r": 205.82492, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "0.03", "bbox": {"l": 222.20833000000002, "t": 453.33997, "r": 229.76836, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "0.06", "bbox": {"l": 243.26666, "t": 453.33997, "r": 250.82669, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "0.12", "bbox": {"l": 264.29657, "t": 453.33997, "r": 271.84949, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "0.25", "bbox": {"l": 285.31943, "t": 453.33997, "r": 292.87946, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "0.5", "bbox": {"l": 306.37775, "t": 453.33997, "r": 311.77319, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "1", "bbox": {"l": 323.41699, "t": 453.33997, "r": 325.58157, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "2", "bbox": {"l": 334.45807, "t": 453.33997, "r": 336.62265, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "4", "bbox": {"l": 345.52756, "t": 453.33997, "r": 347.69214, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "8", "bbox": {"l": 356.56863, "t": 453.33997, "r": 358.73322, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "16", "bbox": {"l": 367.63812, "t": 453.33997, "r": 371.97089, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "32", "bbox": {"l": 382.6734, "t": 453.33997, "r": 387.00616, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "64", "bbox": {"l": 397.73727, "t": 453.33997, "r": 402.07001, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "\u2265", "bbox": {"l": 412.78879, "t": 447.99298, "r": 414.93463, "b": 457.79964999999993, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": " 128", "bbox": {"l": 414.95697, "t": 453.33997, "r": 422.51746, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "63", "bbox": {"l": 200.63998, "t": 463.92444, "r": 204.57674, "b": 466.66043, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "1", "bbox": {"l": 367.62604, "t": 463.92444, "r": 369.58032, "b": 466.66043, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "1", "bbox": {"l": 382.66132, "t": 463.92444, "r": 384.6156, "b": 466.66043, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "3", "bbox": {"l": 397.72504, "t": 463.92444, "r": 399.67932, "b": 466.66043, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "199", "bbox": {"l": 200.64, "t": 468.80313, "r": 206.51694, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "5", "bbox": {"l": 264.29047, "t": 468.80313, "r": 266.25885, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "1", "bbox": {"l": 306.37213, "t": 468.80313, "r": 308.34052, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "2", "bbox": {"l": 345.51526, "t": 468.80313, "r": 347.48364, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "4", "bbox": {"l": 356.55634, "t": 468.80313, "r": 358.52472, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "1", "bbox": {"l": 367.62582, "t": 468.80313, "r": 369.59418, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "1", "bbox": {"l": 382.66107, "t": 468.80313, "r": 384.62946, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "416", "bbox": {"l": 200.64, "t": 473.68185, "r": 206.51694, "b": 476.41788, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "4", "bbox": {"l": 264.29047, "t": 473.68185, "r": 266.25885, "b": 476.41788, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "230", "bbox": {"l": 200.64, "t": 478.53214, "r": 206.51694, "b": 481.26816, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "1", "bbox": {"l": 243.26373, "t": 478.53214, "r": 245.2321, "b": 481.26816, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "9", "bbox": {"l": 264.29047, "t": 478.53214, "r": 266.25885, "b": 481.26816, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "1", "bbox": {"l": 323.40466, "t": 478.53214, "r": 325.37305, "b": 481.26816, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "1", "bbox": {"l": 397.72519, "t": 478.53214, "r": 399.69354, "b": 481.26816, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "276", "bbox": {"l": 200.64, "t": 483.41086, "r": 206.51694, "b": 486.14688, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "2", "bbox": {"l": 382.66132, "t": 483.41086, "r": 384.61563, "b": 486.14688, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "12", "bbox": {"l": 397.72513, "t": 483.41086, "r": 401.64819, "b": 486.14688, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "1", "bbox": {"l": 412.78928, "t": 483.41086, "r": 414.74359, "b": 486.14688, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "320", "bbox": {"l": 200.64014, "t": 488.28958, "r": 207.14445, "b": 491.0256, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "1", "bbox": {"l": 367.62616, "t": 488.28958, "r": 369.78375, "b": 491.0256, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "4", "bbox": {"l": 382.66141, "t": 488.28958, "r": 384.81897, "b": 491.0256, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "20", "bbox": {"l": 397.7251, "t": 488.28958, "r": 402.05087, "b": 491.0256, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "2013", "bbox": {"l": 200.64032, "t": 493.1683, "r": 208.48566, "b": 495.90433, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "3", "bbox": {"l": 264.29044, "t": 493.1683, "r": 266.25879, "b": 495.90433, "coord_origin": "TOPLEFT"}}], "children": [{"id": 56, "label": "text", "bbox": {"l": 180.12473, "t": 516.2332200000001, "r": 190.62042, "b": 518.94992, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "<table>", "bbox": {"l": 180.12473, "t": 516.2332200000001, "r": 190.62042, "b": 518.94992, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 183.2438, "t": 520.13208, "r": 304.54797, "b": 522.84879, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "<tr><td></td><td colspan=\"4\"></td><td colspan=\"6\"></td><td colspan=\"3\"></td></tr>", "bbox": {"l": 183.2438, "t": 520.13208, "r": 304.54797, "b": 522.84879, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 183.2438, "t": 524.03094, "r": 388.42313, "b": 526.74765, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 524.03094, "r": 388.42313, "b": 526.74765, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 183.2438, "t": 527.9297799999999, "r": 388.42313, "b": 530.64648, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 527.9297799999999, "r": 388.42313, "b": 530.64648, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 183.2438, "t": 531.82861, "r": 388.42313, "b": 534.54532, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 531.82861, "r": 388.42313, "b": 534.54532, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 183.2438, "t": 535.72748, "r": 388.42313, "b": 538.44418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 535.72748, "r": 388.42313, "b": 538.44418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 183.2438, "t": 539.62631, "r": 388.42313, "b": 542.34303, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 539.62631, "r": 388.42313, "b": 542.34303, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 183.2438, "t": 543.52516, "r": 388.42313, "b": 546.24188, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 543.52516, "r": 388.42313, "b": 546.24188, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 183.2438, "t": 547.42401, "r": 388.42313, "b": 550.14073, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 547.42401, "r": 388.42313, "b": 550.14073, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 183.2438, "t": 551.32286, "r": 388.42313, "b": 554.03958, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 551.32286, "r": 388.42313, "b": 554.03958, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 180.12473, "t": 555.22173, "r": 191.86806, "b": 557.93845, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "</table>", "bbox": {"l": 180.12473, "t": 555.22173, "r": 191.86806, "b": 557.93845, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 407.38348, "t": 518.30042, "r": 408.82025, "b": 521.01712, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "C", "bbox": {"l": 407.38348, "t": 518.30042, "r": 408.82025, "b": 521.01712, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 410.25699, "t": 518.30042, "r": 450.48605, "b": 521.01712, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "C L L L C L L L L L C L L NL", "bbox": {"l": 410.25699, "t": 518.30042, "r": 450.48605, "b": 521.01712, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 407.38348, "t": 522.19925, "r": 408.82025, "b": 524.9159500000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "C", "bbox": {"l": 407.38348, "t": 522.19925, "r": 408.82025, "b": 524.9159500000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 410.25699, "t": 522.19925, "r": 450.48605, "b": 524.9159500000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 522.19925, "r": 450.48605, "b": 524.9159500000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 407.38348, "t": 526.09808, "r": 408.82025, "b": 528.81479, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "C", "bbox": {"l": 407.38348, "t": 526.09808, "r": 408.82025, "b": 528.81479, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 410.25699, "t": 526.09808, "r": 450.48605, "b": 528.81479, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 526.09808, "r": 450.48605, "b": 528.81479, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 407.38348, "t": 529.99695, "r": 408.82025, "b": 532.7136499999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "C", "bbox": {"l": 407.38348, "t": 529.99695, "r": 408.82025, "b": 532.7136499999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 410.25699, "t": 529.99695, "r": 450.48605, "b": 532.7136499999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 529.99695, "r": 450.48605, "b": 532.7136499999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 407.38348, "t": 533.8957800000001, "r": 408.82025, "b": 536.6125, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "C", "bbox": {"l": 407.38348, "t": 533.8957800000001, "r": 408.82025, "b": 536.6125, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 410.25699, "t": 533.8957800000001, "r": 450.48605, "b": 536.6125, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 533.8957800000001, "r": 450.48605, "b": 536.6125, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 407.38348, "t": 537.79463, "r": 408.82025, "b": 540.51135, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "C", "bbox": {"l": 407.38348, "t": 537.79463, "r": 408.82025, "b": 540.51135, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 410.25699, "t": 537.79463, "r": 450.48605, "b": 540.51135, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 537.79463, "r": 450.48605, "b": 540.51135, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 407.38348, "t": 541.69348, "r": 408.82025, "b": 544.4102, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "C", "bbox": {"l": 407.38348, "t": 541.69348, "r": 408.82025, "b": 544.4102, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 410.25699, "t": 541.69348, "r": 450.48605, "b": 544.4102, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 541.69348, "r": 450.48605, "b": 544.4102, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 407.38348, "t": 545.59233, "r": 408.82025, "b": 548.3090500000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "C", "bbox": {"l": 407.38348, "t": 545.59233, "r": 408.82025, "b": 548.3090500000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 410.25699, "t": 545.59233, "r": 450.48605, "b": 548.3090500000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 545.59233, "r": 450.48605, "b": 548.3090500000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 407.38348, "t": 549.4911999999999, "r": 408.82025, "b": 552.2079200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "C", "bbox": {"l": 407.38348, "t": 549.4911999999999, "r": 408.82025, "b": 552.2079200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 410.25699, "t": 549.4911999999999, "r": 450.48605, "b": 552.2079200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 549.4911999999999, "r": 450.48605, "b": 552.2079200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 164.52881, "t": 509.45859, "r": 181.8528, "b": 515.31, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "HTML", "bbox": {"l": 164.52881, "t": 509.45859, "r": 181.8528, "b": 515.31, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 183.58441, "t": 509.45859, "r": 186.3974, "b": 515.31, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "#", "bbox": {"l": 183.58441, "t": 509.45859, "r": 186.3974, "b": 515.31, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 189.2104, "t": 509.45859, "r": 208.90137, "b": 515.31, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "tokens:", "bbox": {"l": 189.2104, "t": 509.45859, "r": 208.90137, "b": 515.31, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 210.63269, "t": 509.45859, "r": 221.04044, "b": 515.31, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "258", "bbox": {"l": 210.63269, "t": 509.45859, "r": 221.04044, "b": 515.31, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 390.20203, "t": 509.60361, "r": 406.83609, "b": 515.45502, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "OTSL", "bbox": {"l": 390.20203, "t": 509.60361, "r": 406.83609, "b": 515.45502, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 408.56952, "t": 509.60361, "r": 411.38251, "b": 515.45502, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "#", "bbox": {"l": 408.56952, "t": 509.60361, "r": 411.38251, "b": 515.45502, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 414.1955, "t": 509.60361, "r": 433.88647000000003, "b": 515.45502, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "tokens:", "bbox": {"l": 414.1955, "t": 509.60361, "r": 433.88647000000003, "b": 515.45502, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 435.61737, "t": 509.60361, "r": 446.02512, "b": 515.45502, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": "135", "bbox": {"l": 435.61737, "t": 509.60361, "r": 446.02512, "b": 515.45502, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 167.19316, "t": 519.07236, "r": 172.8231, "b": 526.3866, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "B", "bbox": {"l": 167.19316, "t": 519.07236, "r": 172.8231, "b": 526.3866, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 187.33745, "t": 448.62485, "r": 192.96739, "b": 455.93909, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "A", "bbox": {"l": 187.33745, "t": 448.62485, "r": 192.96739, "b": 455.93909, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 167.38654, "t": 566.0051599999999, "r": 173.01648, "b": 573.3194, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": "D", "bbox": {"l": 167.38654, "t": 566.0051599999999, "r": 173.01648, "b": 573.3194, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 248.45621000000003, "t": 621.78008, "r": 253.65727, "b": 629.09431, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 107, "text": "E", "bbox": {"l": 248.45621000000003, "t": 621.78008, "r": 253.65727, "b": 629.09431, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 395.90057, "t": 519.19946, "r": 401.53052, "b": 526.5137, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 108, "text": "C", "bbox": {"l": 395.90057, "t": 519.19946, "r": 401.53052, "b": 526.5137, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 171.62886, "t": 580.28853, "r": 177.48148, "b": 597.26784, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 109, "text": "HTML", "bbox": {"l": 171.62886, "t": 580.28853, "r": 177.48148, "b": 597.26784, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 251.05969000000002, "t": 633.63408, "r": 256.91235, "b": 649.92345, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 110, "text": "OTSL", "bbox": {"l": 251.05969000000002, "t": 633.63408, "r": 256.91235, "b": 649.92345, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 372.14645, "t": 601.45724, "r": 427.0379, "b": 607.30864, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 111, "text": "HTML model shows", "bbox": {"l": 372.14645, "t": 601.45724, "r": 427.0379, "b": 607.30864, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 372.14645, "t": 607.89948, "r": 430.06838999999997, "b": 613.75087, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 112, "text": "bounding box drifting", "bbox": {"l": 372.14645, "t": 607.89948, "r": 430.06838999999997, "b": 613.75087, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 176.88042, "t": 642.87209, "r": 231.08191, "b": 648.72348, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 113, "text": "OTSL model shows", "bbox": {"l": 176.88042, "t": 642.87209, "r": 231.08191, "b": 648.72348, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 176.88042, "t": 649.3143, "r": 230.99271000000002, "b": 655.1657, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 114, "text": "clean bounding box", "bbox": {"l": 176.88042, "t": 649.3143, "r": 230.99271000000002, "b": 655.1657, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 176.88042, "t": 655.7565500000001, "r": 203.93219, "b": 661.60794, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 115, "text": "alignment", "bbox": {"l": 176.88042, "t": 655.7565500000001, "r": 203.93219, "b": 661.60794, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 215.93231000000003, "t": 557.56342, "r": 218.4697, "b": 569.15967, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 116, "text": "\u2264", "bbox": {"l": 215.93231000000003, "t": 557.56342, "r": 218.4697, "b": 569.15967, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 229.05689999999998, "t": 557.56342, "r": 231.71908999999997, "b": 569.15967, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 117, "text": "\u03bc", "bbox": {"l": 229.05689999999998, "t": 557.56342, "r": 231.71908999999997, "b": 569.15967, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 261.20892, "t": 448.46124, "r": 263.56973, "b": 451.19727, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 119, "text": "S", "bbox": {"l": 261.20892, "t": 448.46124, "r": 263.56973, "b": 451.19727, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 312.33463, "t": 448.46124, "r": 313.6362, "b": 451.19727, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 120, "text": "I", "bbox": {"l": 312.33463, "t": 448.46124, "r": 313.6362, "b": 451.19727, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 377.41125, "t": 448.46124, "r": 380.05737, "b": 451.19727, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 121, "text": "R", "bbox": {"l": 377.41125, "t": 448.46124, "r": 380.05737, "b": 451.19727, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 200.63976, "t": 453.33997, "r": 205.82492, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 122, "text": "ST", "bbox": {"l": 200.63976, "t": 453.33997, "r": 205.82492, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 222.20833000000002, "t": 453.33997, "r": 229.76836, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 123, "text": "0.03", "bbox": {"l": 222.20833000000002, "t": 453.33997, "r": 229.76836, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 243.26666, "t": 453.33997, "r": 250.82669, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 124, "text": "0.06", "bbox": {"l": 243.26666, "t": 453.33997, "r": 250.82669, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 264.29657, "t": 453.33997, "r": 271.84949, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 125, "text": "0.12", "bbox": {"l": 264.29657, "t": 453.33997, "r": 271.84949, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 114, "label": "text", "bbox": {"l": 285.31943, "t": 453.33997, "r": 292.87946, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 126, "text": "0.25", "bbox": {"l": 285.31943, "t": 453.33997, "r": 292.87946, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 115, "label": "text", "bbox": {"l": 306.37775, "t": 453.33997, "r": 311.77319, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 127, "text": "0.5", "bbox": {"l": 306.37775, "t": 453.33997, "r": 311.77319, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 116, "label": "text", "bbox": {"l": 323.41699, "t": 453.33997, "r": 325.58157, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 128, "text": "1", "bbox": {"l": 323.41699, "t": 453.33997, "r": 325.58157, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 117, "label": "text", "bbox": {"l": 334.45807, "t": 453.33997, "r": 336.62265, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 129, "text": "2", "bbox": {"l": 334.45807, "t": 453.33997, "r": 336.62265, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 118, "label": "text", "bbox": {"l": 345.52756, "t": 453.33997, "r": 347.69214, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 130, "text": "4", "bbox": {"l": 345.52756, "t": 453.33997, "r": 347.69214, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 119, "label": "text", "bbox": {"l": 356.56863, "t": 453.33997, "r": 358.73322, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 131, "text": "8", "bbox": {"l": 356.56863, "t": 453.33997, "r": 358.73322, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 120, "label": "text", "bbox": {"l": 367.63812, "t": 453.33997, "r": 371.97089, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 132, "text": "16", "bbox": {"l": 367.63812, "t": 453.33997, "r": 371.97089, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 121, "label": "text", "bbox": {"l": 382.6734, "t": 453.33997, "r": 387.00616, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 133, "text": "32", "bbox": {"l": 382.6734, "t": 453.33997, "r": 387.00616, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 122, "label": "text", "bbox": {"l": 397.73727, "t": 453.33997, "r": 402.07001, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 134, "text": "64", "bbox": {"l": 397.73727, "t": 453.33997, "r": 402.07001, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 123, "label": "text", "bbox": {"l": 412.78879, "t": 447.99298, "r": 414.93463, "b": 457.79964999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 135, "text": "\u2265", "bbox": {"l": 412.78879, "t": 447.99298, "r": 414.93463, "b": 457.79964999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 124, "label": "text", "bbox": {"l": 414.95697, "t": 453.33997, "r": 422.51746, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 136, "text": " 128", "bbox": {"l": 414.95697, "t": 453.33997, "r": 422.51746, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 125, "label": "text", "bbox": {"l": 200.63998, "t": 463.92444, "r": 204.57674, "b": 466.66043, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 137, "text": "63", "bbox": {"l": 200.63998, "t": 463.92444, "r": 204.57674, "b": 466.66043, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 126, "label": "text", "bbox": {"l": 367.62604, "t": 463.92444, "r": 369.58032, "b": 466.66043, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 138, "text": "1", "bbox": {"l": 367.62604, "t": 463.92444, "r": 369.58032, "b": 466.66043, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 127, "label": "text", "bbox": {"l": 382.66132, "t": 463.92444, "r": 384.6156, "b": 466.66043, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 139, "text": "1", "bbox": {"l": 382.66132, "t": 463.92444, "r": 384.6156, "b": 466.66043, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 128, "label": "text", "bbox": {"l": 397.72504, "t": 463.92444, "r": 399.67932, "b": 466.66043, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 140, "text": "3", "bbox": {"l": 397.72504, "t": 463.92444, "r": 399.67932, "b": 466.66043, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 129, "label": "text", "bbox": {"l": 200.64, "t": 468.80313, "r": 206.51694, "b": 471.53915, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 141, "text": "199", "bbox": {"l": 200.64, "t": 468.80313, "r": 206.51694, "b": 471.53915, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 130, "label": "text", "bbox": {"l": 264.29047, "t": 468.80313, "r": 266.25885, "b": 471.53915, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 142, "text": "5", "bbox": {"l": 264.29047, "t": 468.80313, "r": 266.25885, "b": 471.53915, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 131, "label": "text", "bbox": {"l": 306.37213, "t": 468.80313, "r": 308.34052, "b": 471.53915, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 143, "text": "1", "bbox": {"l": 306.37213, "t": 468.80313, "r": 308.34052, "b": 471.53915, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 132, "label": "text", "bbox": {"l": 345.51526, "t": 468.80313, "r": 347.48364, "b": 471.53915, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 144, "text": "2", "bbox": {"l": 345.51526, "t": 468.80313, "r": 347.48364, "b": 471.53915, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 133, "label": "text", "bbox": {"l": 356.55634, "t": 468.80313, "r": 358.52472, "b": 471.53915, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 145, "text": "4", "bbox": {"l": 356.55634, "t": 468.80313, "r": 358.52472, "b": 471.53915, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 134, "label": "text", "bbox": {"l": 367.62582, "t": 468.80313, "r": 369.59418, "b": 471.53915, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 146, "text": "1", "bbox": {"l": 367.62582, "t": 468.80313, "r": 369.59418, "b": 471.53915, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 135, "label": "text", "bbox": {"l": 382.66107, "t": 468.80313, "r": 384.62946, "b": 471.53915, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 147, "text": "1", "bbox": {"l": 382.66107, "t": 468.80313, "r": 384.62946, "b": 471.53915, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 136, "label": "text", "bbox": {"l": 200.64, "t": 473.68185, "r": 206.51694, "b": 476.41788, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 148, "text": "416", "bbox": {"l": 200.64, "t": 473.68185, "r": 206.51694, "b": 476.41788, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 137, "label": "text", "bbox": {"l": 264.29047, "t": 473.68185, "r": 266.25885, "b": 476.41788, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 149, "text": "4", "bbox": {"l": 264.29047, "t": 473.68185, "r": 266.25885, "b": 476.41788, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 138, "label": "text", "bbox": {"l": 200.64, "t": 478.53214, "r": 206.51694, "b": 481.26816, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 150, "text": "230", "bbox": {"l": 200.64, "t": 478.53214, "r": 206.51694, "b": 481.26816, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 139, "label": "text", "bbox": {"l": 243.26373, "t": 478.53214, "r": 245.2321, "b": 481.26816, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 151, "text": "1", "bbox": {"l": 243.26373, "t": 478.53214, "r": 245.2321, "b": 481.26816, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 140, "label": "text", "bbox": {"l": 264.29047, "t": 478.53214, "r": 266.25885, "b": 481.26816, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 152, "text": "9", "bbox": {"l": 264.29047, "t": 478.53214, "r": 266.25885, "b": 481.26816, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 141, "label": "text", "bbox": {"l": 323.40466, "t": 478.53214, "r": 325.37305, "b": 481.26816, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 153, "text": "1", "bbox": {"l": 323.40466, "t": 478.53214, "r": 325.37305, "b": 481.26816, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 142, "label": "text", "bbox": {"l": 397.72519, "t": 478.53214, "r": 399.69354, "b": 481.26816, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 154, "text": "1", "bbox": {"l": 397.72519, "t": 478.53214, "r": 399.69354, "b": 481.26816, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 143, "label": "text", "bbox": {"l": 200.64, "t": 483.41086, "r": 206.51694, "b": 486.14688, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 155, "text": "276", "bbox": {"l": 200.64, "t": 483.41086, "r": 206.51694, "b": 486.14688, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 144, "label": "text", "bbox": {"l": 382.66132, "t": 483.41086, "r": 384.61563, "b": 486.14688, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 156, "text": "2", "bbox": {"l": 382.66132, "t": 483.41086, "r": 384.61563, "b": 486.14688, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 145, "label": "text", "bbox": {"l": 397.72513, "t": 483.41086, "r": 401.64819, "b": 486.14688, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 157, "text": "12", "bbox": {"l": 397.72513, "t": 483.41086, "r": 401.64819, "b": 486.14688, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 146, "label": "text", "bbox": {"l": 412.78928, "t": 483.41086, "r": 414.74359, "b": 486.14688, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 158, "text": "1", "bbox": {"l": 412.78928, "t": 483.41086, "r": 414.74359, "b": 486.14688, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 147, "label": "text", "bbox": {"l": 200.64014, "t": 488.28958, "r": 207.14445, "b": 491.0256, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 159, "text": "320", "bbox": {"l": 200.64014, "t": 488.28958, "r": 207.14445, "b": 491.0256, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 148, "label": "text", "bbox": {"l": 367.62616, "t": 488.28958, "r": 369.78375, "b": 491.0256, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 160, "text": "1", "bbox": {"l": 367.62616, "t": 488.28958, "r": 369.78375, "b": 491.0256, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 149, "label": "text", "bbox": {"l": 382.66141, "t": 488.28958, "r": 384.81897, "b": 491.0256, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 161, "text": "4", "bbox": {"l": 382.66141, "t": 488.28958, "r": 384.81897, "b": 491.0256, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 150, "label": "text", "bbox": {"l": 397.7251, "t": 488.28958, "r": 402.05087, "b": 491.0256, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 162, "text": "20", "bbox": {"l": 397.7251, "t": 488.28958, "r": 402.05087, "b": 491.0256, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 151, "label": "text", "bbox": {"l": 200.64032, "t": 493.1683, "r": 208.48566, "b": 495.90433, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 163, "text": "2013", "bbox": {"l": 200.64032, "t": 493.1683, "r": 208.48566, "b": 495.90433, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 152, "label": "text", "bbox": {"l": 264.29044, "t": 493.1683, "r": 266.25879, "b": 495.90433, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 164, "text": "3", "bbox": {"l": 264.29044, "t": 493.1683, "r": 266.25879, "b": 495.90433, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "text", "id": 153, "page_no": 9, "cluster": {"id": 153, "label": "text", "bbox": {"l": 227.91466, "t": 665.82603, "r": 230.10028, "b": 675.3464, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 165, "text": "\u03bc", "bbox": {"l": 227.91466, "t": 665.82603, "r": 230.10028, "b": 675.3464, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u03bc"}, {"label": "text", "id": 154, "page_no": 9, "cluster": {"id": 154, "label": "text", "bbox": {"l": 300.58057, "t": 683.62195, "r": 302.72638, "b": 693.428658, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 166, "text": "\u2265", "bbox": {"l": 300.58057, "t": 683.62195, "r": 302.72638, "b": 693.428658, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u2265"}], "body": [{"label": "caption", "id": 4, "page_no": 9, "cluster": {"id": 4, "label": "caption", "bbox": {"l": 134.765, "t": 115.83618000000001, "r": 480.59357000000006, "b": 145.88666, "coord_origin": "TOPLEFT"}, "confidence": 0.9512290954589844, "cells": [{"id": 3, "text": "Table 2.", "bbox": {"l": 134.765, "t": 115.83618000000001, "r": 173.09366, "b": 123.76251000000002, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "TSR and cell detection results compared between OTSL and HTML on", "bbox": {"l": 181.30299, "t": 115.89899000000003, "r": 480.59151999999995, "b": 123.96868999999992, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "the PubTabNet [22], FinTabNet [21] and PubTables-1M [14] data sets using Table-", "bbox": {"l": 134.765, "t": 126.85797000000014, "r": 480.59357000000006, "b": 134.92767000000003, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Former [9] (with enc=6, dec=6, heads=8).", "bbox": {"l": 134.765, "t": 137.81696, "r": 305.95691, "b": 145.88666, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 2. TSR and cell detection results compared between OTSL and HTML on the PubTabNet [22], FinTabNet [21] and PubTables-1M [14] data sets using TableFormer [9] (with enc=6, dec=6, heads=8)."}, {"label": "table", "id": 0, "page_no": 9, "cluster": {"id": 0, "label": "table", "bbox": {"l": 143.6376495361328, "t": 156.3477020263672, "r": 470.8485412597656, "b": 263.2624816894531, "coord_origin": "TOPLEFT"}, "confidence": 0.9884640574455261, "cells": [{"id": 7, "text": "Data set", "bbox": {"l": 160.782, "t": 166.55895999999996, "r": 194.99779, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Language", "bbox": {"l": 215.52499000000003, "t": 166.534, "r": 254.04465, "b": 174.6037, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "TEDs", "bbox": {"l": 300.397, "t": 161.07898, "r": 323.99118, "b": 169.14868, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "mAP(0.75)", "bbox": {"l": 370.345, "t": 166.55895999999996, "r": 414.74661, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Inference", "bbox": {"l": 426.737, "t": 161.07898, "r": 463.10830999999996, "b": 169.14868, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "time (secs)", "bbox": {"l": 423.11401, "t": 172.03796, "r": 466.72656, "b": 180.10766999999998, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "simple", "bbox": {"l": 262.41299, "t": 174.03101000000004, "r": 288.0596, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "complex", "bbox": {"l": 296.42899, "t": 174.03101000000004, "r": 329.44687, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "all", "bbox": {"l": 345.03299, "t": 174.03101000000004, "r": 354.75793, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "PubTabNet", "bbox": {"l": 154.53799, "t": 192.85999000000004, "r": 201.24129, "b": 200.92969000000005, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "OTSL", "bbox": {"l": 222.43700000000004, "t": 187.38098000000002, "r": 247.13226000000003, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "0.965", "bbox": {"l": 264.74399, "t": 187.38098000000002, "r": 285.73074, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "0.934", "bbox": {"l": 302.444, "t": 187.38098000000002, "r": 323.43076, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "0.955", "bbox": {"l": 339.40302, "t": 187.38098000000002, "r": 360.38977, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "0.88", "bbox": {"l": 383.116, "t": 187.31817999999998, "r": 401.97324, "b": 195.24451, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "2.73", "bbox": {"l": 435.49300999999997, "t": 187.31817999999998, "r": 454.35025, "b": 195.24451, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "HTML", "bbox": {"l": 220.903, "t": 200.33196999999996, "r": 248.66655999999998, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "0.969", "bbox": {"l": 264.74399, "t": 200.33196999999996, "r": 285.73074, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "0.927", "bbox": {"l": 302.444, "t": 200.33196999999996, "r": 323.43076, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "0.955", "bbox": {"l": 339.40302, "t": 200.33196999999996, "r": 360.38977, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "0.857", "bbox": {"l": 382.052, "t": 200.33196999999996, "r": 403.03876, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "5.39", "bbox": {"l": 436.73199000000005, "t": 200.33196999999996, "r": 453.11182, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "FinTabNet", "bbox": {"l": 155.94501, "t": 219.16198999999995, "r": 199.83374, "b": 227.23168999999996, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "OTSL", "bbox": {"l": 222.43700000000004, "t": 213.68201, "r": 247.13226000000003, "b": 221.75171, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "0.955", "bbox": {"l": 264.74399, "t": 213.68201, "r": 285.73074, "b": 221.75171, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "0.961", "bbox": {"l": 302.444, "t": 213.68201, "r": 323.43076, "b": 221.75171, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "0.959", "bbox": {"l": 337.815, "t": 213.61919999999998, "r": 361.97586, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "0.862", "bbox": {"l": 380.46399, "t": 213.61919999999998, "r": 404.62485, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "1.85", "bbox": {"l": 435.49300999999997, "t": 213.61919999999998, "r": 454.35025, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "HTML", "bbox": {"l": 220.903, "t": 226.63396999999998, "r": 248.66655999999998, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "0.917", "bbox": {"l": 264.74399, "t": 226.63396999999998, "r": 285.73074, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "0.922", "bbox": {"l": 302.444, "t": 226.63396999999998, "r": 323.43076, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "0.92", "bbox": {"l": 341.70599, "t": 226.63396999999998, "r": 358.08582, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "0.722", "bbox": {"l": 382.052, "t": 226.63396999999998, "r": 403.03876, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "3.26", "bbox": {"l": 436.73199000000005, "t": 226.63396999999998, "r": 453.11182, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "PubTables-1M", "bbox": {"l": 148.62601, "t": 245.46294999999998, "r": 207.1524, "b": 253.53265, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "OTSL", "bbox": {"l": 222.43700000000004, "t": 239.98297000000002, "r": 247.13226000000003, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "0.987", "bbox": {"l": 264.74399, "t": 239.98297000000002, "r": 285.73074, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "0.964", "bbox": {"l": 302.444, "t": 239.98297000000002, "r": 323.43076, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "0.977", "bbox": {"l": 337.815, "t": 239.92016999999998, "r": 361.97586, "b": 247.8465, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "0.896", "bbox": {"l": 380.46399, "t": 239.92016999999998, "r": 404.62485, "b": 247.8465, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "1.79", "bbox": {"l": 435.49300999999997, "t": 239.92016999999998, "r": 454.35025, "b": 247.8465, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "HTML", "bbox": {"l": 220.903, "t": 252.93499999999995, "r": 248.66655999999998, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "0.983", "bbox": {"l": 264.74399, "t": 252.93499999999995, "r": 285.73074, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "0.944", "bbox": {"l": 302.444, "t": 252.93499999999995, "r": 323.43076, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "0.966", "bbox": {"l": 339.40302, "t": 252.93499999999995, "r": 360.38977, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "0.889", "bbox": {"l": 382.052, "t": 252.93499999999995, "r": 403.03876, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "3.26", "bbox": {"l": 436.73199000000005, "t": 252.93499999999995, "r": 453.11182, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": [{"id": 8, "label": "text", "bbox": {"l": 160.782, "t": 166.55895999999996, "r": 194.99779, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "Data set", "bbox": {"l": 160.782, "t": 166.55895999999996, "r": 194.99779, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 215.52499000000003, "t": 166.534, "r": 254.04465, "b": 174.6037, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "Language", "bbox": {"l": 215.52499000000003, "t": 166.534, "r": 254.04465, "b": 174.6037, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "text", "bbox": {"l": 300.397, "t": 161.07898, "r": 323.99118, "b": 169.14868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "TEDs", "bbox": {"l": 300.397, "t": 161.07898, "r": 323.99118, "b": 169.14868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 370.345, "t": 166.55895999999996, "r": 414.74661, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "mAP(0.75)", "bbox": {"l": 370.345, "t": 166.55895999999996, "r": 414.74661, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 426.737, "t": 161.07898, "r": 463.10830999999996, "b": 169.14868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "Inference", "bbox": {"l": 426.737, "t": 161.07898, "r": 463.10830999999996, "b": 169.14868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 423.11401, "t": 172.03796, "r": 466.72656, "b": 180.10766999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "time (secs)", "bbox": {"l": 423.11401, "t": 172.03796, "r": 466.72656, "b": 180.10766999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 262.41299, "t": 174.03101000000004, "r": 288.0596, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "simple", "bbox": {"l": 262.41299, "t": 174.03101000000004, "r": 288.0596, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 296.42899, "t": 174.03101000000004, "r": 329.44687, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "complex", "bbox": {"l": 296.42899, "t": 174.03101000000004, "r": 329.44687, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 345.03299, "t": 174.03101000000004, "r": 354.75793, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "all", "bbox": {"l": 345.03299, "t": 174.03101000000004, "r": 354.75793, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 154.53799, "t": 192.85999000000004, "r": 201.24129, "b": 200.92969000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "PubTabNet", "bbox": {"l": 154.53799, "t": 192.85999000000004, "r": 201.24129, "b": 200.92969000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 222.43700000000004, "t": 187.38098000000002, "r": 247.13226000000003, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "OTSL", "bbox": {"l": 222.43700000000004, "t": 187.38098000000002, "r": 247.13226000000003, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 264.74399, "t": 187.38098000000002, "r": 285.73074, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "0.965", "bbox": {"l": 264.74399, "t": 187.38098000000002, "r": 285.73074, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 302.444, "t": 187.38098000000002, "r": 323.43076, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "0.934", "bbox": {"l": 302.444, "t": 187.38098000000002, "r": 323.43076, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 339.40302, "t": 187.38098000000002, "r": 360.38977, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "0.955", "bbox": {"l": 339.40302, "t": 187.38098000000002, "r": 360.38977, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 383.116, "t": 187.31817999999998, "r": 401.97324, "b": 195.24451, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "0.88", "bbox": {"l": 383.116, "t": 187.31817999999998, "r": 401.97324, "b": 195.24451, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 435.49300999999997, "t": 187.31817999999998, "r": 454.35025, "b": 195.24451, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "2.73", "bbox": {"l": 435.49300999999997, "t": 187.31817999999998, "r": 454.35025, "b": 195.24451, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 220.903, "t": 200.33196999999996, "r": 248.66655999999998, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "HTML", "bbox": {"l": 220.903, "t": 200.33196999999996, "r": 248.66655999999998, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 264.74399, "t": 200.33196999999996, "r": 285.73074, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "0.969", "bbox": {"l": 264.74399, "t": 200.33196999999996, "r": 285.73074, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 302.444, "t": 200.33196999999996, "r": 323.43076, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "0.927", "bbox": {"l": 302.444, "t": 200.33196999999996, "r": 323.43076, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 339.40302, "t": 200.33196999999996, "r": 360.38977, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "0.955", "bbox": {"l": 339.40302, "t": 200.33196999999996, "r": 360.38977, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 382.052, "t": 200.33196999999996, "r": 403.03876, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "0.857", "bbox": {"l": 382.052, "t": 200.33196999999996, "r": 403.03876, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 436.73199000000005, "t": 200.33196999999996, "r": 453.11182, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "5.39", "bbox": {"l": 436.73199000000005, "t": 200.33196999999996, "r": 453.11182, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 155.94501, "t": 219.16198999999995, "r": 199.83374, "b": 227.23168999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "FinTabNet", "bbox": {"l": 155.94501, "t": 219.16198999999995, "r": 199.83374, "b": 227.23168999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 222.43700000000004, "t": 213.68201, "r": 247.13226000000003, "b": 221.75171, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "OTSL", "bbox": {"l": 222.43700000000004, "t": 213.68201, "r": 247.13226000000003, "b": 221.75171, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 264.74399, "t": 213.68201, "r": 285.73074, "b": 221.75171, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "0.955", "bbox": {"l": 264.74399, "t": 213.68201, "r": 285.73074, "b": 221.75171, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 302.444, "t": 213.68201, "r": 323.43076, "b": 221.75171, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "0.961", "bbox": {"l": 302.444, "t": 213.68201, "r": 323.43076, "b": 221.75171, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 337.815, "t": 213.61919999999998, "r": 361.97586, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "0.959", "bbox": {"l": 337.815, "t": 213.61919999999998, "r": 361.97586, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 380.46399, "t": 213.61919999999998, "r": 404.62485, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "0.862", "bbox": {"l": 380.46399, "t": 213.61919999999998, "r": 404.62485, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 435.49300999999997, "t": 213.61919999999998, "r": 454.35025, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "1.85", "bbox": {"l": 435.49300999999997, "t": 213.61919999999998, "r": 454.35025, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 220.903, "t": 226.63396999999998, "r": 248.66655999999998, "b": 234.70367, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "HTML", "bbox": {"l": 220.903, "t": 226.63396999999998, "r": 248.66655999999998, "b": 234.70367, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 264.74399, "t": 226.63396999999998, "r": 285.73074, "b": 234.70367, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "0.917", "bbox": {"l": 264.74399, "t": 226.63396999999998, "r": 285.73074, "b": 234.70367, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 302.444, "t": 226.63396999999998, "r": 323.43076, "b": 234.70367, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "0.922", "bbox": {"l": 302.444, "t": 226.63396999999998, "r": 323.43076, "b": 234.70367, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 341.70599, "t": 226.63396999999998, "r": 358.08582, "b": 234.70367, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "0.92", "bbox": {"l": 341.70599, "t": 226.63396999999998, "r": 358.08582, "b": 234.70367, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 382.052, "t": 226.63396999999998, "r": 403.03876, "b": 234.70367, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "0.722", "bbox": {"l": 382.052, "t": 226.63396999999998, "r": 403.03876, "b": 234.70367, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 436.73199000000005, "t": 226.63396999999998, "r": 453.11182, "b": 234.70367, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "3.26", "bbox": {"l": 436.73199000000005, "t": 226.63396999999998, "r": 453.11182, "b": 234.70367, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 148.62601, "t": 245.46294999999998, "r": 207.1524, "b": 253.53265, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "PubTables-1M", "bbox": {"l": 148.62601, "t": 245.46294999999998, "r": 207.1524, "b": 253.53265, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 222.43700000000004, "t": 239.98297000000002, "r": 247.13226000000003, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "OTSL", "bbox": {"l": 222.43700000000004, "t": 239.98297000000002, "r": 247.13226000000003, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 264.74399, "t": 239.98297000000002, "r": 285.73074, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "0.987", "bbox": {"l": 264.74399, "t": 239.98297000000002, "r": 285.73074, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 302.444, "t": 239.98297000000002, "r": 323.43076, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "0.964", "bbox": {"l": 302.444, "t": 239.98297000000002, "r": 323.43076, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 337.815, "t": 239.92016999999998, "r": 361.97586, "b": 247.8465, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "0.977", "bbox": {"l": 337.815, "t": 239.92016999999998, "r": 361.97586, "b": 247.8465, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 380.46399, "t": 239.92016999999998, "r": 404.62485, "b": 247.8465, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "0.896", "bbox": {"l": 380.46399, "t": 239.92016999999998, "r": 404.62485, "b": 247.8465, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 435.49300999999997, "t": 239.92016999999998, "r": 454.35025, "b": 247.8465, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "1.79", "bbox": {"l": 435.49300999999997, "t": 239.92016999999998, "r": 454.35025, "b": 247.8465, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 220.903, "t": 252.93499999999995, "r": 248.66655999999998, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "HTML", "bbox": {"l": 220.903, "t": 252.93499999999995, "r": 248.66655999999998, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 264.74399, "t": 252.93499999999995, "r": 285.73074, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "0.983", "bbox": {"l": 264.74399, "t": 252.93499999999995, "r": 285.73074, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 302.444, "t": 252.93499999999995, "r": 323.43076, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "0.944", "bbox": {"l": 302.444, "t": 252.93499999999995, "r": 323.43076, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 339.40302, "t": 252.93499999999995, "r": 360.38977, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "0.966", "bbox": {"l": 339.40302, "t": 252.93499999999995, "r": 360.38977, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 382.052, "t": 252.93499999999995, "r": 403.03876, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "0.889", "bbox": {"l": 382.052, "t": 252.93499999999995, "r": 403.03876, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 436.73199000000005, "t": 252.93499999999995, "r": 453.11182, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "3.26", "bbox": {"l": 436.73199000000005, "t": 252.93499999999995, "r": 453.11182, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "lcel", "lcel", "ched", "ched", "nl", "ched", "ucel", "ched", "ched", "ched", "ucel", "ucel", "nl", "rhed", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 8, "num_cols": 7, "table_cells": [{"bbox": {"l": 215.52499000000003, "t": 166.534, "r": 254.04465, "b": 174.6037, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Language", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 300.397, "t": 161.07898, "r": 323.99118, "b": 169.14868, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 3, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 5, "text": "TEDs", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 370.345, "t": 166.55895999999996, "r": 414.74661, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 2, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "mAP(0.75)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 423.11401, "t": 161.07898, "r": 466.72656, "b": 180.10766999999998, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 2, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "Inference time (secs)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 262.41299, "t": 174.03101000000004, "r": 288.0596, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "simple", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 296.42899, "t": 174.03101000000004, "r": 329.44687, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "complex", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 345.03299, "t": 174.03101000000004, "r": 354.75793, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "all", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 154.53799, "t": 192.85999000000004, "r": 201.24129, "b": 200.92969000000005, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PubTabNet", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 222.43700000000004, "t": 187.38098000000002, "r": 247.13226000000003, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "OTSL", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 264.74399, "t": 187.38098000000002, "r": 285.73074, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.965", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 302.444, "t": 187.38098000000002, "r": 323.43076, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.934", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 339.40302, "t": 187.38098000000002, "r": 360.38977, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.955", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 383.116, "t": 187.31817999999998, "r": 401.97324, "b": 195.24451, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 435.49300999999997, "t": 187.31817999999998, "r": 454.35025, "b": 195.24451, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "2.73", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 220.903, "t": 200.33196999999996, "r": 248.66655999999998, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "HTML", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 264.74399, "t": 200.33196999999996, "r": 285.73074, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.969", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 302.444, "t": 200.33196999999996, "r": 323.43076, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.927", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 339.40302, "t": 200.33196999999996, "r": 360.38977, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.955", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 382.052, "t": 200.33196999999996, "r": 403.03876, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.857", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 436.73199000000005, "t": 200.33196999999996, "r": 453.11182, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "5.39", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 155.94501, "t": 219.16198999999995, "r": 199.83374, "b": 227.23168999999996, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "FinTabNet", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 222.43700000000004, "t": 213.68201, "r": 247.13226000000003, "b": 221.75171, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "OTSL", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 264.74399, "t": 213.68201, "r": 285.73074, "b": 221.75171, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.955", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 302.444, "t": 213.68201, "r": 323.43076, "b": 221.75171, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.961", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 337.815, "t": 213.61919999999998, "r": 361.97586, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.959", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 380.46399, "t": 213.61919999999998, "r": 404.62485, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.862", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 435.49300999999997, "t": 213.61919999999998, "r": 454.35025, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "1.85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 220.903, "t": 226.63396999999998, "r": 248.66655999999998, "b": 234.70367, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "HTML", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 264.74399, "t": 226.63396999999998, "r": 285.73074, "b": 234.70367, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.917", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 302.444, "t": 226.63396999999998, "r": 323.43076, "b": 234.70367, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.922", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 341.70599, "t": 226.63396999999998, "r": 358.08582, "b": 234.70367, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.92", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 382.052, "t": 226.63396999999998, "r": 403.03876, "b": 234.70367, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.722", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 436.73199000000005, "t": 226.63396999999998, "r": 453.11182, "b": 234.70367, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "3.26", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 148.62601, "t": 245.46294999999998, "r": 207.1524, "b": 253.53265, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PubTables-1M", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 222.43700000000004, "t": 239.98297000000002, "r": 247.13226000000003, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "OTSL", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 264.74399, "t": 239.98297000000002, "r": 285.73074, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.987", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 302.444, "t": 239.98297000000002, "r": 323.43076, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.964", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 337.815, "t": 239.92016999999998, "r": 361.97586, "b": 247.8465, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.977", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 380.46399, "t": 239.92016999999998, "r": 404.62485, "b": 247.8465, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.896", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 435.49300999999997, "t": 239.92016999999998, "r": 454.35025, "b": 247.8465, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "1.79", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 220.903, "t": 252.93499999999995, "r": 248.66655999999998, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "HTML", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 264.74399, "t": 252.93499999999995, "r": 285.73074, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.983", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 302.444, "t": 252.93499999999995, "r": 323.43076, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.944", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 339.40302, "t": 252.93499999999995, "r": 360.38977, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.966", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 382.052, "t": 252.93499999999995, "r": 403.03876, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.889", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 436.73199000000005, "t": 252.93499999999995, "r": 453.11182, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "3.26", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "section_header", "id": 3, "page_no": 9, "cluster": {"id": 3, "label": "section_header", "bbox": {"l": 134.765, "t": 288.91479, "r": 257.08679, "b": 297.72173999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9546447992324829, "cells": [{"id": 55, "text": "5.3", "bbox": {"l": 134.765, "t": 288.91479, "r": 149.40205, "b": 297.72173999999995, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Qualitative Results", "bbox": {"l": 160.85904, "t": 288.91479, "r": 257.08679, "b": 297.72173999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5.3 Qualitative Results"}, {"label": "text", "id": 1, "page_no": 9, "cluster": {"id": 1, "label": "text", "bbox": {"l": 134.765, "t": 309.86078, "r": 480.58981, "b": 366.47769, "coord_origin": "TOPLEFT"}, "confidence": 0.9834085702896118, "cells": [{"id": 57, "text": "To illustrate the qualitative differences between OTSL and HTML, Figure 5", "bbox": {"l": 134.765, "t": 309.86078, "r": 480.58777, "b": 318.65775, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "demonstrates less overlap and more accurate bounding boxes with OTSL. In", "bbox": {"l": 134.765, "t": 321.81577, "r": 480.58889999999997, "b": 330.61273, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Figure 6, OTSL proves to be more effective in handling tables with longer to-", "bbox": {"l": 134.765, "t": 333.77075, "r": 480.58681999999993, "b": 342.56772, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "ken sequences, resulting in even more precise structure prediction and bounding", "bbox": {"l": 134.765, "t": 345.72574, "r": 480.58981, "b": 354.52271, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "boxes.", "bbox": {"l": 134.765, "t": 357.68073, "r": 161.65704, "b": 366.47769, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "To illustrate the qualitative differences between OTSL and HTML, Figure 5 demonstrates less overlap and more accurate bounding boxes with OTSL. In Figure 6, OTSL proves to be more effective in handling tables with longer token sequences, resulting in even more precise structure prediction and bounding boxes."}, {"label": "caption", "id": 5, "page_no": 9, "cluster": {"id": 5, "label": "caption", "bbox": {"l": 134.765, "t": 397.59012, "r": 480.59106, "b": 439.71716, "coord_origin": "TOPLEFT"}, "confidence": 0.9482728838920593, "cells": [{"id": 62, "text": "Fig. 5.", "bbox": {"l": 134.765, "t": 397.59012, "r": 162.64424, "b": 405.51642, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "The OTSL model produces more accurate bounding boxes with less over-", "bbox": {"l": 167.384, "t": 397.65289, "r": 480.59106, "b": 405.72266, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "lap (E) than the HTML model (D), when predicting the structure of a sparse ta-", "bbox": {"l": 134.765, "t": 408.61190999999997, "r": 480.59106, "b": 416.68167000000005, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "ble (A), at twice the inference speed because of shorter sequence length (B),(C).", "bbox": {"l": 134.765, "t": 419.57089, "r": 480.58838000000003, "b": 427.64066, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "\"PMC2807444_006_00.png\" PubTabNet.", "bbox": {"l": 134.765, "t": 430.52987999999993, "r": 304.69171, "b": 438.59964, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "\u03bc", "bbox": {"l": 342.63354, "t": 430.19678, "r": 344.81915, "b": 439.71716, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Fig. 5. The OTSL model produces more accurate bounding boxes with less overlap (E) than the HTML model (D), when predicting the structure of a sparse table (A), at twice the inference speed because of shorter sequence length (B),(C). \"PMC2807444_006_00.png\" PubTabNet. \u03bc"}, {"label": "picture", "id": 2, "page_no": 9, "cluster": {"id": 2, "label": "picture", "bbox": {"l": 162.67430114746094, "t": 444.62255859375, "r": 451.70062255859375, "b": 663.2135620117188, "coord_origin": "TOPLEFT"}, "confidence": 0.9742383360862732, "cells": [{"id": 67, "text": "<table>", "bbox": {"l": 180.12473, "t": 516.2332200000001, "r": 190.62042, "b": 518.94992, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "<tr><td></td><td colspan=\"4\"></td><td colspan=\"6\"></td><td colspan=\"3\"></td></tr>", "bbox": {"l": 183.2438, "t": 520.13208, "r": 304.54797, "b": 522.84879, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 524.03094, "r": 388.42313, "b": 526.74765, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 527.9297799999999, "r": 388.42313, "b": 530.64648, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 531.82861, "r": 388.42313, "b": 534.54532, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 535.72748, "r": 388.42313, "b": 538.44418, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 539.62631, "r": 388.42313, "b": 542.34303, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 543.52516, "r": 388.42313, "b": 546.24188, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 547.42401, "r": 388.42313, "b": 550.14073, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 551.32286, "r": 388.42313, "b": 554.03958, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "</table>", "bbox": {"l": 180.12473, "t": 555.22173, "r": 191.86806, "b": 557.93845, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "C", "bbox": {"l": 407.38348, "t": 518.30042, "r": 408.82025, "b": 521.01712, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "C L L L C L L L L L C L L NL", "bbox": {"l": 410.25699, "t": 518.30042, "r": 450.48605, "b": 521.01712, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "C", "bbox": {"l": 407.38348, "t": 522.19925, "r": 408.82025, "b": 524.9159500000001, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 522.19925, "r": 450.48605, "b": 524.9159500000001, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "C", "bbox": {"l": 407.38348, "t": 526.09808, "r": 408.82025, "b": 528.81479, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 526.09808, "r": 450.48605, "b": 528.81479, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "C", "bbox": {"l": 407.38348, "t": 529.99695, "r": 408.82025, "b": 532.7136499999999, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 529.99695, "r": 450.48605, "b": 532.7136499999999, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "C", "bbox": {"l": 407.38348, "t": 533.8957800000001, "r": 408.82025, "b": 536.6125, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 533.8957800000001, "r": 450.48605, "b": 536.6125, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "C", "bbox": {"l": 407.38348, "t": 537.79463, "r": 408.82025, "b": 540.51135, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 537.79463, "r": 450.48605, "b": 540.51135, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "C", "bbox": {"l": 407.38348, "t": 541.69348, "r": 408.82025, "b": 544.4102, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 541.69348, "r": 450.48605, "b": 544.4102, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "C", "bbox": {"l": 407.38348, "t": 545.59233, "r": 408.82025, "b": 548.3090500000001, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 545.59233, "r": 450.48605, "b": 548.3090500000001, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "C", "bbox": {"l": 407.38348, "t": 549.4911999999999, "r": 408.82025, "b": 552.2079200000001, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 549.4911999999999, "r": 450.48605, "b": 552.2079200000001, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "HTML", "bbox": {"l": 164.52881, "t": 509.45859, "r": 181.8528, "b": 515.31, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "#", "bbox": {"l": 183.58441, "t": 509.45859, "r": 186.3974, "b": 515.31, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "tokens:", "bbox": {"l": 189.2104, "t": 509.45859, "r": 208.90137, "b": 515.31, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "258", "bbox": {"l": 210.63269, "t": 509.45859, "r": 221.04044, "b": 515.31, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "OTSL", "bbox": {"l": 390.20203, "t": 509.60361, "r": 406.83609, "b": 515.45502, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "#", "bbox": {"l": 408.56952, "t": 509.60361, "r": 411.38251, "b": 515.45502, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "tokens:", "bbox": {"l": 414.1955, "t": 509.60361, "r": 433.88647000000003, "b": 515.45502, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "135", "bbox": {"l": 435.61737, "t": 509.60361, "r": 446.02512, "b": 515.45502, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "B", "bbox": {"l": 167.19316, "t": 519.07236, "r": 172.8231, "b": 526.3866, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "A", "bbox": {"l": 187.33745, "t": 448.62485, "r": 192.96739, "b": 455.93909, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "D", "bbox": {"l": 167.38654, "t": 566.0051599999999, "r": 173.01648, "b": 573.3194, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "E", "bbox": {"l": 248.45621000000003, "t": 621.78008, "r": 253.65727, "b": 629.09431, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "C", "bbox": {"l": 395.90057, "t": 519.19946, "r": 401.53052, "b": 526.5137, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "HTML", "bbox": {"l": 171.62886, "t": 580.28853, "r": 177.48148, "b": 597.26784, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "OTSL", "bbox": {"l": 251.05969000000002, "t": 633.63408, "r": 256.91235, "b": 649.92345, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "HTML model shows", "bbox": {"l": 372.14645, "t": 601.45724, "r": 427.0379, "b": 607.30864, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "bounding box drifting", "bbox": {"l": 372.14645, "t": 607.89948, "r": 430.06838999999997, "b": 613.75087, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "OTSL model shows", "bbox": {"l": 176.88042, "t": 642.87209, "r": 231.08191, "b": 648.72348, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "clean bounding box", "bbox": {"l": 176.88042, "t": 649.3143, "r": 230.99271000000002, "b": 655.1657, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "alignment", "bbox": {"l": 176.88042, "t": 655.7565500000001, "r": 203.93219, "b": 661.60794, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "\u2264", "bbox": {"l": 215.93231000000003, "t": 557.56342, "r": 218.4697, "b": 569.15967, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "\u03bc", "bbox": {"l": 229.05689999999998, "t": 557.56342, "r": 231.71908999999997, "b": 569.15967, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "S", "bbox": {"l": 261.20892, "t": 448.46124, "r": 263.56973, "b": 451.19727, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "I", "bbox": {"l": 312.33463, "t": 448.46124, "r": 313.6362, "b": 451.19727, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "R", "bbox": {"l": 377.41125, "t": 448.46124, "r": 380.05737, "b": 451.19727, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "ST", "bbox": {"l": 200.63976, "t": 453.33997, "r": 205.82492, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "0.03", "bbox": {"l": 222.20833000000002, "t": 453.33997, "r": 229.76836, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "0.06", "bbox": {"l": 243.26666, "t": 453.33997, "r": 250.82669, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "0.12", "bbox": {"l": 264.29657, "t": 453.33997, "r": 271.84949, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "0.25", "bbox": {"l": 285.31943, "t": 453.33997, "r": 292.87946, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "0.5", "bbox": {"l": 306.37775, "t": 453.33997, "r": 311.77319, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "1", "bbox": {"l": 323.41699, "t": 453.33997, "r": 325.58157, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "2", "bbox": {"l": 334.45807, "t": 453.33997, "r": 336.62265, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "4", "bbox": {"l": 345.52756, "t": 453.33997, "r": 347.69214, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "8", "bbox": {"l": 356.56863, "t": 453.33997, "r": 358.73322, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "16", "bbox": {"l": 367.63812, "t": 453.33997, "r": 371.97089, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "32", "bbox": {"l": 382.6734, "t": 453.33997, "r": 387.00616, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "64", "bbox": {"l": 397.73727, "t": 453.33997, "r": 402.07001, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "\u2265", "bbox": {"l": 412.78879, "t": 447.99298, "r": 414.93463, "b": 457.79964999999993, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": " 128", "bbox": {"l": 414.95697, "t": 453.33997, "r": 422.51746, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "63", "bbox": {"l": 200.63998, "t": 463.92444, "r": 204.57674, "b": 466.66043, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "1", "bbox": {"l": 367.62604, "t": 463.92444, "r": 369.58032, "b": 466.66043, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "1", "bbox": {"l": 382.66132, "t": 463.92444, "r": 384.6156, "b": 466.66043, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "3", "bbox": {"l": 397.72504, "t": 463.92444, "r": 399.67932, "b": 466.66043, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "199", "bbox": {"l": 200.64, "t": 468.80313, "r": 206.51694, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "5", "bbox": {"l": 264.29047, "t": 468.80313, "r": 266.25885, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "1", "bbox": {"l": 306.37213, "t": 468.80313, "r": 308.34052, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "2", "bbox": {"l": 345.51526, "t": 468.80313, "r": 347.48364, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "4", "bbox": {"l": 356.55634, "t": 468.80313, "r": 358.52472, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "1", "bbox": {"l": 367.62582, "t": 468.80313, "r": 369.59418, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "1", "bbox": {"l": 382.66107, "t": 468.80313, "r": 384.62946, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "416", "bbox": {"l": 200.64, "t": 473.68185, "r": 206.51694, "b": 476.41788, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "4", "bbox": {"l": 264.29047, "t": 473.68185, "r": 266.25885, "b": 476.41788, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "230", "bbox": {"l": 200.64, "t": 478.53214, "r": 206.51694, "b": 481.26816, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "1", "bbox": {"l": 243.26373, "t": 478.53214, "r": 245.2321, "b": 481.26816, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "9", "bbox": {"l": 264.29047, "t": 478.53214, "r": 266.25885, "b": 481.26816, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "1", "bbox": {"l": 323.40466, "t": 478.53214, "r": 325.37305, "b": 481.26816, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "1", "bbox": {"l": 397.72519, "t": 478.53214, "r": 399.69354, "b": 481.26816, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "276", "bbox": {"l": 200.64, "t": 483.41086, "r": 206.51694, "b": 486.14688, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "2", "bbox": {"l": 382.66132, "t": 483.41086, "r": 384.61563, "b": 486.14688, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "12", "bbox": {"l": 397.72513, "t": 483.41086, "r": 401.64819, "b": 486.14688, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "1", "bbox": {"l": 412.78928, "t": 483.41086, "r": 414.74359, "b": 486.14688, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "320", "bbox": {"l": 200.64014, "t": 488.28958, "r": 207.14445, "b": 491.0256, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "1", "bbox": {"l": 367.62616, "t": 488.28958, "r": 369.78375, "b": 491.0256, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "4", "bbox": {"l": 382.66141, "t": 488.28958, "r": 384.81897, "b": 491.0256, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "20", "bbox": {"l": 397.7251, "t": 488.28958, "r": 402.05087, "b": 491.0256, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "2013", "bbox": {"l": 200.64032, "t": 493.1683, "r": 208.48566, "b": 495.90433, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "3", "bbox": {"l": 264.29044, "t": 493.1683, "r": 266.25879, "b": 495.90433, "coord_origin": "TOPLEFT"}}], "children": [{"id": 56, "label": "text", "bbox": {"l": 180.12473, "t": 516.2332200000001, "r": 190.62042, "b": 518.94992, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "<table>", "bbox": {"l": 180.12473, "t": 516.2332200000001, "r": 190.62042, "b": 518.94992, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 183.2438, "t": 520.13208, "r": 304.54797, "b": 522.84879, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "<tr><td></td><td colspan=\"4\"></td><td colspan=\"6\"></td><td colspan=\"3\"></td></tr>", "bbox": {"l": 183.2438, "t": 520.13208, "r": 304.54797, "b": 522.84879, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 183.2438, "t": 524.03094, "r": 388.42313, "b": 526.74765, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 524.03094, "r": 388.42313, "b": 526.74765, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 183.2438, "t": 527.9297799999999, "r": 388.42313, "b": 530.64648, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 527.9297799999999, "r": 388.42313, "b": 530.64648, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 183.2438, "t": 531.82861, "r": 388.42313, "b": 534.54532, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 531.82861, "r": 388.42313, "b": 534.54532, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 183.2438, "t": 535.72748, "r": 388.42313, "b": 538.44418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 535.72748, "r": 388.42313, "b": 538.44418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 183.2438, "t": 539.62631, "r": 388.42313, "b": 542.34303, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 539.62631, "r": 388.42313, "b": 542.34303, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 183.2438, "t": 543.52516, "r": 388.42313, "b": 546.24188, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 543.52516, "r": 388.42313, "b": 546.24188, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 183.2438, "t": 547.42401, "r": 388.42313, "b": 550.14073, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 547.42401, "r": 388.42313, "b": 550.14073, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 183.2438, "t": 551.32286, "r": 388.42313, "b": 554.03958, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 551.32286, "r": 388.42313, "b": 554.03958, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 180.12473, "t": 555.22173, "r": 191.86806, "b": 557.93845, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "</table>", "bbox": {"l": 180.12473, "t": 555.22173, "r": 191.86806, "b": 557.93845, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 407.38348, "t": 518.30042, "r": 408.82025, "b": 521.01712, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "C", "bbox": {"l": 407.38348, "t": 518.30042, "r": 408.82025, "b": 521.01712, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 410.25699, "t": 518.30042, "r": 450.48605, "b": 521.01712, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "C L L L C L L L L L C L L NL", "bbox": {"l": 410.25699, "t": 518.30042, "r": 450.48605, "b": 521.01712, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 407.38348, "t": 522.19925, "r": 408.82025, "b": 524.9159500000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "C", "bbox": {"l": 407.38348, "t": 522.19925, "r": 408.82025, "b": 524.9159500000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 410.25699, "t": 522.19925, "r": 450.48605, "b": 524.9159500000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 522.19925, "r": 450.48605, "b": 524.9159500000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 407.38348, "t": 526.09808, "r": 408.82025, "b": 528.81479, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "C", "bbox": {"l": 407.38348, "t": 526.09808, "r": 408.82025, "b": 528.81479, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 410.25699, "t": 526.09808, "r": 450.48605, "b": 528.81479, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 526.09808, "r": 450.48605, "b": 528.81479, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 407.38348, "t": 529.99695, "r": 408.82025, "b": 532.7136499999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "C", "bbox": {"l": 407.38348, "t": 529.99695, "r": 408.82025, "b": 532.7136499999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 410.25699, "t": 529.99695, "r": 450.48605, "b": 532.7136499999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 529.99695, "r": 450.48605, "b": 532.7136499999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 407.38348, "t": 533.8957800000001, "r": 408.82025, "b": 536.6125, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "C", "bbox": {"l": 407.38348, "t": 533.8957800000001, "r": 408.82025, "b": 536.6125, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 410.25699, "t": 533.8957800000001, "r": 450.48605, "b": 536.6125, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 533.8957800000001, "r": 450.48605, "b": 536.6125, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 407.38348, "t": 537.79463, "r": 408.82025, "b": 540.51135, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "C", "bbox": {"l": 407.38348, "t": 537.79463, "r": 408.82025, "b": 540.51135, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 410.25699, "t": 537.79463, "r": 450.48605, "b": 540.51135, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 537.79463, "r": 450.48605, "b": 540.51135, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 407.38348, "t": 541.69348, "r": 408.82025, "b": 544.4102, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "C", "bbox": {"l": 407.38348, "t": 541.69348, "r": 408.82025, "b": 544.4102, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 410.25699, "t": 541.69348, "r": 450.48605, "b": 544.4102, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 541.69348, "r": 450.48605, "b": 544.4102, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 407.38348, "t": 545.59233, "r": 408.82025, "b": 548.3090500000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "C", "bbox": {"l": 407.38348, "t": 545.59233, "r": 408.82025, "b": 548.3090500000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 410.25699, "t": 545.59233, "r": 450.48605, "b": 548.3090500000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 545.59233, "r": 450.48605, "b": 548.3090500000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 407.38348, "t": 549.4911999999999, "r": 408.82025, "b": 552.2079200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "C", "bbox": {"l": 407.38348, "t": 549.4911999999999, "r": 408.82025, "b": 552.2079200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 410.25699, "t": 549.4911999999999, "r": 450.48605, "b": 552.2079200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 549.4911999999999, "r": 450.48605, "b": 552.2079200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 164.52881, "t": 509.45859, "r": 181.8528, "b": 515.31, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "HTML", "bbox": {"l": 164.52881, "t": 509.45859, "r": 181.8528, "b": 515.31, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 183.58441, "t": 509.45859, "r": 186.3974, "b": 515.31, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "#", "bbox": {"l": 183.58441, "t": 509.45859, "r": 186.3974, "b": 515.31, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 189.2104, "t": 509.45859, "r": 208.90137, "b": 515.31, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "tokens:", "bbox": {"l": 189.2104, "t": 509.45859, "r": 208.90137, "b": 515.31, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 210.63269, "t": 509.45859, "r": 221.04044, "b": 515.31, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "258", "bbox": {"l": 210.63269, "t": 509.45859, "r": 221.04044, "b": 515.31, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 390.20203, "t": 509.60361, "r": 406.83609, "b": 515.45502, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "OTSL", "bbox": {"l": 390.20203, "t": 509.60361, "r": 406.83609, "b": 515.45502, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 408.56952, "t": 509.60361, "r": 411.38251, "b": 515.45502, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "#", "bbox": {"l": 408.56952, "t": 509.60361, "r": 411.38251, "b": 515.45502, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 414.1955, "t": 509.60361, "r": 433.88647000000003, "b": 515.45502, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "tokens:", "bbox": {"l": 414.1955, "t": 509.60361, "r": 433.88647000000003, "b": 515.45502, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 435.61737, "t": 509.60361, "r": 446.02512, "b": 515.45502, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": "135", "bbox": {"l": 435.61737, "t": 509.60361, "r": 446.02512, "b": 515.45502, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 167.19316, "t": 519.07236, "r": 172.8231, "b": 526.3866, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "B", "bbox": {"l": 167.19316, "t": 519.07236, "r": 172.8231, "b": 526.3866, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 187.33745, "t": 448.62485, "r": 192.96739, "b": 455.93909, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "A", "bbox": {"l": 187.33745, "t": 448.62485, "r": 192.96739, "b": 455.93909, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 167.38654, "t": 566.0051599999999, "r": 173.01648, "b": 573.3194, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": "D", "bbox": {"l": 167.38654, "t": 566.0051599999999, "r": 173.01648, "b": 573.3194, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 248.45621000000003, "t": 621.78008, "r": 253.65727, "b": 629.09431, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 107, "text": "E", "bbox": {"l": 248.45621000000003, "t": 621.78008, "r": 253.65727, "b": 629.09431, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 395.90057, "t": 519.19946, "r": 401.53052, "b": 526.5137, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 108, "text": "C", "bbox": {"l": 395.90057, "t": 519.19946, "r": 401.53052, "b": 526.5137, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 171.62886, "t": 580.28853, "r": 177.48148, "b": 597.26784, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 109, "text": "HTML", "bbox": {"l": 171.62886, "t": 580.28853, "r": 177.48148, "b": 597.26784, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 251.05969000000002, "t": 633.63408, "r": 256.91235, "b": 649.92345, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 110, "text": "OTSL", "bbox": {"l": 251.05969000000002, "t": 633.63408, "r": 256.91235, "b": 649.92345, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 372.14645, "t": 601.45724, "r": 427.0379, "b": 607.30864, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 111, "text": "HTML model shows", "bbox": {"l": 372.14645, "t": 601.45724, "r": 427.0379, "b": 607.30864, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 372.14645, "t": 607.89948, "r": 430.06838999999997, "b": 613.75087, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 112, "text": "bounding box drifting", "bbox": {"l": 372.14645, "t": 607.89948, "r": 430.06838999999997, "b": 613.75087, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 176.88042, "t": 642.87209, "r": 231.08191, "b": 648.72348, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 113, "text": "OTSL model shows", "bbox": {"l": 176.88042, "t": 642.87209, "r": 231.08191, "b": 648.72348, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 176.88042, "t": 649.3143, "r": 230.99271000000002, "b": 655.1657, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 114, "text": "clean bounding box", "bbox": {"l": 176.88042, "t": 649.3143, "r": 230.99271000000002, "b": 655.1657, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 176.88042, "t": 655.7565500000001, "r": 203.93219, "b": 661.60794, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 115, "text": "alignment", "bbox": {"l": 176.88042, "t": 655.7565500000001, "r": 203.93219, "b": 661.60794, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 215.93231000000003, "t": 557.56342, "r": 218.4697, "b": 569.15967, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 116, "text": "\u2264", "bbox": {"l": 215.93231000000003, "t": 557.56342, "r": 218.4697, "b": 569.15967, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 229.05689999999998, "t": 557.56342, "r": 231.71908999999997, "b": 569.15967, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 117, "text": "\u03bc", "bbox": {"l": 229.05689999999998, "t": 557.56342, "r": 231.71908999999997, "b": 569.15967, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 261.20892, "t": 448.46124, "r": 263.56973, "b": 451.19727, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 119, "text": "S", "bbox": {"l": 261.20892, "t": 448.46124, "r": 263.56973, "b": 451.19727, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 312.33463, "t": 448.46124, "r": 313.6362, "b": 451.19727, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 120, "text": "I", "bbox": {"l": 312.33463, "t": 448.46124, "r": 313.6362, "b": 451.19727, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 377.41125, "t": 448.46124, "r": 380.05737, "b": 451.19727, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 121, "text": "R", "bbox": {"l": 377.41125, "t": 448.46124, "r": 380.05737, "b": 451.19727, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 200.63976, "t": 453.33997, "r": 205.82492, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 122, "text": "ST", "bbox": {"l": 200.63976, "t": 453.33997, "r": 205.82492, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 222.20833000000002, "t": 453.33997, "r": 229.76836, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 123, "text": "0.03", "bbox": {"l": 222.20833000000002, "t": 453.33997, "r": 229.76836, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 243.26666, "t": 453.33997, "r": 250.82669, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 124, "text": "0.06", "bbox": {"l": 243.26666, "t": 453.33997, "r": 250.82669, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 264.29657, "t": 453.33997, "r": 271.84949, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 125, "text": "0.12", "bbox": {"l": 264.29657, "t": 453.33997, "r": 271.84949, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 114, "label": "text", "bbox": {"l": 285.31943, "t": 453.33997, "r": 292.87946, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 126, "text": "0.25", "bbox": {"l": 285.31943, "t": 453.33997, "r": 292.87946, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 115, "label": "text", "bbox": {"l": 306.37775, "t": 453.33997, "r": 311.77319, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 127, "text": "0.5", "bbox": {"l": 306.37775, "t": 453.33997, "r": 311.77319, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 116, "label": "text", "bbox": {"l": 323.41699, "t": 453.33997, "r": 325.58157, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 128, "text": "1", "bbox": {"l": 323.41699, "t": 453.33997, "r": 325.58157, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 117, "label": "text", "bbox": {"l": 334.45807, "t": 453.33997, "r": 336.62265, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 129, "text": "2", "bbox": {"l": 334.45807, "t": 453.33997, "r": 336.62265, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 118, "label": "text", "bbox": {"l": 345.52756, "t": 453.33997, "r": 347.69214, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 130, "text": "4", "bbox": {"l": 345.52756, "t": 453.33997, "r": 347.69214, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 119, "label": "text", "bbox": {"l": 356.56863, "t": 453.33997, "r": 358.73322, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 131, "text": "8", "bbox": {"l": 356.56863, "t": 453.33997, "r": 358.73322, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 120, "label": "text", "bbox": {"l": 367.63812, "t": 453.33997, "r": 371.97089, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 132, "text": "16", "bbox": {"l": 367.63812, "t": 453.33997, "r": 371.97089, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 121, "label": "text", "bbox": {"l": 382.6734, "t": 453.33997, "r": 387.00616, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 133, "text": "32", "bbox": {"l": 382.6734, "t": 453.33997, "r": 387.00616, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 122, "label": "text", "bbox": {"l": 397.73727, "t": 453.33997, "r": 402.07001, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 134, "text": "64", "bbox": {"l": 397.73727, "t": 453.33997, "r": 402.07001, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 123, "label": "text", "bbox": {"l": 412.78879, "t": 447.99298, "r": 414.93463, "b": 457.79964999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 135, "text": "\u2265", "bbox": {"l": 412.78879, "t": 447.99298, "r": 414.93463, "b": 457.79964999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 124, "label": "text", "bbox": {"l": 414.95697, "t": 453.33997, "r": 422.51746, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 136, "text": " 128", "bbox": {"l": 414.95697, "t": 453.33997, "r": 422.51746, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 125, "label": "text", "bbox": {"l": 200.63998, "t": 463.92444, "r": 204.57674, "b": 466.66043, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 137, "text": "63", "bbox": {"l": 200.63998, "t": 463.92444, "r": 204.57674, "b": 466.66043, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 126, "label": "text", "bbox": {"l": 367.62604, "t": 463.92444, "r": 369.58032, "b": 466.66043, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 138, "text": "1", "bbox": {"l": 367.62604, "t": 463.92444, "r": 369.58032, "b": 466.66043, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 127, "label": "text", "bbox": {"l": 382.66132, "t": 463.92444, "r": 384.6156, "b": 466.66043, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 139, "text": "1", "bbox": {"l": 382.66132, "t": 463.92444, "r": 384.6156, "b": 466.66043, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 128, "label": "text", "bbox": {"l": 397.72504, "t": 463.92444, "r": 399.67932, "b": 466.66043, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 140, "text": "3", "bbox": {"l": 397.72504, "t": 463.92444, "r": 399.67932, "b": 466.66043, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 129, "label": "text", "bbox": {"l": 200.64, "t": 468.80313, "r": 206.51694, "b": 471.53915, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 141, "text": "199", "bbox": {"l": 200.64, "t": 468.80313, "r": 206.51694, "b": 471.53915, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 130, "label": "text", "bbox": {"l": 264.29047, "t": 468.80313, "r": 266.25885, "b": 471.53915, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 142, "text": "5", "bbox": {"l": 264.29047, "t": 468.80313, "r": 266.25885, "b": 471.53915, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 131, "label": "text", "bbox": {"l": 306.37213, "t": 468.80313, "r": 308.34052, "b": 471.53915, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 143, "text": "1", "bbox": {"l": 306.37213, "t": 468.80313, "r": 308.34052, "b": 471.53915, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 132, "label": "text", "bbox": {"l": 345.51526, "t": 468.80313, "r": 347.48364, "b": 471.53915, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 144, "text": "2", "bbox": {"l": 345.51526, "t": 468.80313, "r": 347.48364, "b": 471.53915, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 133, "label": "text", "bbox": {"l": 356.55634, "t": 468.80313, "r": 358.52472, "b": 471.53915, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 145, "text": "4", "bbox": {"l": 356.55634, "t": 468.80313, "r": 358.52472, "b": 471.53915, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 134, "label": "text", "bbox": {"l": 367.62582, "t": 468.80313, "r": 369.59418, "b": 471.53915, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 146, "text": "1", "bbox": {"l": 367.62582, "t": 468.80313, "r": 369.59418, "b": 471.53915, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 135, "label": "text", "bbox": {"l": 382.66107, "t": 468.80313, "r": 384.62946, "b": 471.53915, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 147, "text": "1", "bbox": {"l": 382.66107, "t": 468.80313, "r": 384.62946, "b": 471.53915, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 136, "label": "text", "bbox": {"l": 200.64, "t": 473.68185, "r": 206.51694, "b": 476.41788, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 148, "text": "416", "bbox": {"l": 200.64, "t": 473.68185, "r": 206.51694, "b": 476.41788, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 137, "label": "text", "bbox": {"l": 264.29047, "t": 473.68185, "r": 266.25885, "b": 476.41788, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 149, "text": "4", "bbox": {"l": 264.29047, "t": 473.68185, "r": 266.25885, "b": 476.41788, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 138, "label": "text", "bbox": {"l": 200.64, "t": 478.53214, "r": 206.51694, "b": 481.26816, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 150, "text": "230", "bbox": {"l": 200.64, "t": 478.53214, "r": 206.51694, "b": 481.26816, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 139, "label": "text", "bbox": {"l": 243.26373, "t": 478.53214, "r": 245.2321, "b": 481.26816, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 151, "text": "1", "bbox": {"l": 243.26373, "t": 478.53214, "r": 245.2321, "b": 481.26816, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 140, "label": "text", "bbox": {"l": 264.29047, "t": 478.53214, "r": 266.25885, "b": 481.26816, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 152, "text": "9", "bbox": {"l": 264.29047, "t": 478.53214, "r": 266.25885, "b": 481.26816, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 141, "label": "text", "bbox": {"l": 323.40466, "t": 478.53214, "r": 325.37305, "b": 481.26816, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 153, "text": "1", "bbox": {"l": 323.40466, "t": 478.53214, "r": 325.37305, "b": 481.26816, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 142, "label": "text", "bbox": {"l": 397.72519, "t": 478.53214, "r": 399.69354, "b": 481.26816, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 154, "text": "1", "bbox": {"l": 397.72519, "t": 478.53214, "r": 399.69354, "b": 481.26816, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 143, "label": "text", "bbox": {"l": 200.64, "t": 483.41086, "r": 206.51694, "b": 486.14688, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 155, "text": "276", "bbox": {"l": 200.64, "t": 483.41086, "r": 206.51694, "b": 486.14688, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 144, "label": "text", "bbox": {"l": 382.66132, "t": 483.41086, "r": 384.61563, "b": 486.14688, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 156, "text": "2", "bbox": {"l": 382.66132, "t": 483.41086, "r": 384.61563, "b": 486.14688, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 145, "label": "text", "bbox": {"l": 397.72513, "t": 483.41086, "r": 401.64819, "b": 486.14688, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 157, "text": "12", "bbox": {"l": 397.72513, "t": 483.41086, "r": 401.64819, "b": 486.14688, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 146, "label": "text", "bbox": {"l": 412.78928, "t": 483.41086, "r": 414.74359, "b": 486.14688, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 158, "text": "1", "bbox": {"l": 412.78928, "t": 483.41086, "r": 414.74359, "b": 486.14688, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 147, "label": "text", "bbox": {"l": 200.64014, "t": 488.28958, "r": 207.14445, "b": 491.0256, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 159, "text": "320", "bbox": {"l": 200.64014, "t": 488.28958, "r": 207.14445, "b": 491.0256, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 148, "label": "text", "bbox": {"l": 367.62616, "t": 488.28958, "r": 369.78375, "b": 491.0256, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 160, "text": "1", "bbox": {"l": 367.62616, "t": 488.28958, "r": 369.78375, "b": 491.0256, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 149, "label": "text", "bbox": {"l": 382.66141, "t": 488.28958, "r": 384.81897, "b": 491.0256, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 161, "text": "4", "bbox": {"l": 382.66141, "t": 488.28958, "r": 384.81897, "b": 491.0256, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 150, "label": "text", "bbox": {"l": 397.7251, "t": 488.28958, "r": 402.05087, "b": 491.0256, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 162, "text": "20", "bbox": {"l": 397.7251, "t": 488.28958, "r": 402.05087, "b": 491.0256, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 151, "label": "text", "bbox": {"l": 200.64032, "t": 493.1683, "r": 208.48566, "b": 495.90433, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 163, "text": "2013", "bbox": {"l": 200.64032, "t": 493.1683, "r": 208.48566, "b": 495.90433, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 152, "label": "text", "bbox": {"l": 264.29044, "t": 493.1683, "r": 266.25879, "b": 495.90433, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 164, "text": "3", "bbox": {"l": 264.29044, "t": 493.1683, "r": 266.25879, "b": 495.90433, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "text", "id": 153, "page_no": 9, "cluster": {"id": 153, "label": "text", "bbox": {"l": 227.91466, "t": 665.82603, "r": 230.10028, "b": 675.3464, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 165, "text": "\u03bc", "bbox": {"l": 227.91466, "t": 665.82603, "r": 230.10028, "b": 675.3464, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u03bc"}, {"label": "text", "id": 154, "page_no": 9, "cluster": {"id": 154, "label": "text", "bbox": {"l": 300.58057, "t": 683.62195, "r": 302.72638, "b": 693.428658, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 166, "text": "\u2265", "bbox": {"l": 300.58057, "t": 683.62195, "r": 302.72638, "b": 693.428658, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u2265"}], "headers": [{"label": "page_header", "id": 7, "page_no": 9, "cluster": {"id": 7, "label": "page_header", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 143.97887, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8309906721115112, "cells": [{"id": 0, "text": "10", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 143.97887, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "10"}, {"label": "page_header", "id": 6, "page_no": 9, "cluster": {"id": 6, "label": "page_header", "bbox": {"l": 167.82053, "t": 93.77099999999996, "r": 231.72049000000004, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8367075324058533, "cells": [{"id": 1, "text": "M.", "bbox": {"l": 167.82053, "t": 93.77099999999996, "r": 178.08249, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37929, "t": 93.77099999999996, "r": 231.72049000000004, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "M. Lysak, et al."}]}}, {"page_no": 10, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "11", "bbox": {"l": 471.37561, "t": 93.77099999999996, "r": 480.5894799999999, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Fig. 6.", "bbox": {"l": 134.765, "t": 125.79918999999984, "r": 162.64424, "b": 133.72551999999996, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Visualization of predicted structure and detected bounding boxes on a complex", "bbox": {"l": 165.215, "t": 125.86200000000008, "r": 480.58752, "b": 133.93169999999998, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "table with many rows. The OTSL model (B) captured repeating pattern of horizontally", "bbox": {"l": 134.765, "t": 136.82097999999996, "r": 480.58823, "b": 144.89068999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "merged cells from the GT (A), unlike the HTML model (C). The HTML model also", "bbox": {"l": 134.765, "t": 147.77997000000005, "r": 480.5881999999999, "b": 155.84966999999995, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "didn\u2019t complete the HTML sequence correctly and displayed a lot more of drift and", "bbox": {"l": 134.765, "t": 158.73895000000005, "r": 480.58838000000003, "b": 166.80864999999994, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "overlap of bounding boxes. \"PMC5406406_003_01.png\" PubTabNet.", "bbox": {"l": 134.765, "t": 169.69794000000002, "r": 415.84454, "b": 177.76764000000003, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "B", "bbox": {"l": 171.5049, "t": 312.45032, "r": 177.59613, "b": 320.36386, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "C", "bbox": {"l": 171.05823, "t": 492.65274, "r": 177.14946, "b": 500.56628, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Incorrect end of HTML sequence", "bbox": {"l": 283.047, "t": 627.48166, "r": 374.96332, "b": 633.4168099999999, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Horizontally merged cells are not present", "bbox": {"l": 283.047, "t": 617.35776, "r": 398.05978, "b": 623.29291, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Repeating pattern is well represented in predictions", "bbox": {"l": 293.64209, "t": 465.59784, "r": 437.50800000000004, "b": 471.53299, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Repeating pattern of", "bbox": {"l": 181.89114, "t": 288.35962000000006, "r": 239.23492, "b": 294.2947700000001, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "horizontally merged cells", "bbox": {"l": 181.89114, "t": 294.89423, "r": 251.52917, "b": 300.82938, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "A", "bbox": {"l": 247.83432, "t": 184.75989000000004, "r": 253.61339, "b": 194.81635000000006, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Bounding box drifting at the end", "bbox": {"l": 292.18976, "t": 607.80609, "r": 381.54663, "b": 613.7412400000001, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "OTSL", "bbox": {"l": 172.27777, "t": 381.36288, "r": 180.18666, "b": 403.40067, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "HTML", "bbox": {"l": 172.27747, "t": 555.7769499999999, "r": 180.18663, "b": 578.7478, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 0, "label": "page_header", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9301655888557434, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "page_header", "bbox": {"l": 471.37561, "t": 93.77099999999996, "r": 480.5894799999999, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9007201790809631, "cells": [{"id": 1, "text": "11", "bbox": {"l": 471.37561, "t": 93.77099999999996, "r": 480.5894799999999, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "caption", "bbox": {"l": 134.765, "t": 125.79918999999984, "r": 480.58838000000003, "b": 177.76764000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.8657060861587524, "cells": [{"id": 2, "text": "Fig. 6.", "bbox": {"l": 134.765, "t": 125.79918999999984, "r": 162.64424, "b": 133.72551999999996, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Visualization of predicted structure and detected bounding boxes on a complex", "bbox": {"l": 165.215, "t": 125.86200000000008, "r": 480.58752, "b": 133.93169999999998, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "table with many rows. The OTSL model (B) captured repeating pattern of horizontally", "bbox": {"l": 134.765, "t": 136.82097999999996, "r": 480.58823, "b": 144.89068999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "merged cells from the GT (A), unlike the HTML model (C). The HTML model also", "bbox": {"l": 134.765, "t": 147.77997000000005, "r": 480.5881999999999, "b": 155.84966999999995, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "didn\u2019t complete the HTML sequence correctly and displayed a lot more of drift and", "bbox": {"l": 134.765, "t": 158.73895000000005, "r": 480.58838000000003, "b": 166.80864999999994, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "overlap of bounding boxes. \"PMC5406406_003_01.png\" PubTabNet.", "bbox": {"l": 134.765, "t": 169.69794000000002, "r": 415.84454, "b": 177.76764000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "picture", "bbox": {"l": 168.39285278320312, "t": 181.9665069580078, "r": 447.35137939453125, "b": 634.0056762695312, "coord_origin": "TOPLEFT"}, "confidence": 0.7612658739089966, "cells": [{"id": 8, "text": "B", "bbox": {"l": 171.5049, "t": 312.45032, "r": 177.59613, "b": 320.36386, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "C", "bbox": {"l": 171.05823, "t": 492.65274, "r": 177.14946, "b": 500.56628, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Incorrect end of HTML sequence", "bbox": {"l": 283.047, "t": 627.48166, "r": 374.96332, "b": 633.4168099999999, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Horizontally merged cells are not present", "bbox": {"l": 283.047, "t": 617.35776, "r": 398.05978, "b": 623.29291, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Repeating pattern is well represented in predictions", "bbox": {"l": 293.64209, "t": 465.59784, "r": 437.50800000000004, "b": 471.53299, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Repeating pattern of", "bbox": {"l": 181.89114, "t": 288.35962000000006, "r": 239.23492, "b": 294.2947700000001, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "horizontally merged cells", "bbox": {"l": 181.89114, "t": 294.89423, "r": 251.52917, "b": 300.82938, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "A", "bbox": {"l": 247.83432, "t": 184.75989000000004, "r": 253.61339, "b": 194.81635000000006, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Bounding box drifting at the end", "bbox": {"l": 292.18976, "t": 607.80609, "r": 381.54663, "b": 613.7412400000001, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "OTSL", "bbox": {"l": 172.27777, "t": 381.36288, "r": 180.18666, "b": 403.40067, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "HTML", "bbox": {"l": 172.27747, "t": 555.7769499999999, "r": 180.18663, "b": 578.7478, "coord_origin": "TOPLEFT"}}], "children": [{"id": 3, "label": "text", "bbox": {"l": 171.5049, "t": 312.45032, "r": 177.59613, "b": 320.36386, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "B", "bbox": {"l": 171.5049, "t": 312.45032, "r": 177.59613, "b": 320.36386, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "text", "bbox": {"l": 171.05823, "t": 492.65274, "r": 177.14946, "b": 500.56628, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "C", "bbox": {"l": 171.05823, "t": 492.65274, "r": 177.14946, "b": 500.56628, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "text", "bbox": {"l": 283.047, "t": 627.48166, "r": 374.96332, "b": 633.4168099999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "Incorrect end of HTML sequence", "bbox": {"l": 283.047, "t": 627.48166, "r": 374.96332, "b": 633.4168099999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "text", "bbox": {"l": 283.047, "t": 617.35776, "r": 398.05978, "b": 623.29291, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "Horizontally merged cells are not present", "bbox": {"l": 283.047, "t": 617.35776, "r": 398.05978, "b": 623.29291, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "text", "bbox": {"l": 293.64209, "t": 465.59784, "r": 437.50800000000004, "b": 471.53299, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "Repeating pattern is well represented in predictions", "bbox": {"l": 293.64209, "t": 465.59784, "r": 437.50800000000004, "b": 471.53299, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "text", "bbox": {"l": 181.89114, "t": 288.35962000000006, "r": 239.23492, "b": 294.2947700000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "Repeating pattern of", "bbox": {"l": 181.89114, "t": 288.35962000000006, "r": 239.23492, "b": 294.2947700000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 181.89114, "t": 294.89423, "r": 251.52917, "b": 300.82938, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "horizontally merged cells", "bbox": {"l": 181.89114, "t": 294.89423, "r": 251.52917, "b": 300.82938, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "text", "bbox": {"l": 247.83432, "t": 184.75989000000004, "r": 253.61339, "b": 194.81635000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "A", "bbox": {"l": 247.83432, "t": 184.75989000000004, "r": 253.61339, "b": 194.81635000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 292.18976, "t": 607.80609, "r": 381.54663, "b": 613.7412400000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "Bounding box drifting at the end", "bbox": {"l": 292.18976, "t": 607.80609, "r": 381.54663, "b": 613.7412400000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 172.27777, "t": 381.36288, "r": 180.18666, "b": 403.40067, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "OTSL", "bbox": {"l": 172.27777, "t": 381.36288, "r": 180.18666, "b": 403.40067, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 172.27747, "t": 555.7769499999999, "r": 180.18663, "b": 578.7478, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "HTML", "bbox": {"l": 172.27747, "t": 555.7769499999999, "r": 180.18663, "b": 578.7478, "coord_origin": "TOPLEFT"}}], "children": []}]}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_header", "id": 0, "page_no": 10, "cluster": {"id": 0, "label": "page_header", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9301655888557434, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Optimized Table Tokenization for Table Structure Recognition"}, {"label": "page_header", "id": 1, "page_no": 10, "cluster": {"id": 1, "label": "page_header", "bbox": {"l": 471.37561, "t": 93.77099999999996, "r": 480.5894799999999, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9007201790809631, "cells": [{"id": 1, "text": "11", "bbox": {"l": 471.37561, "t": 93.77099999999996, "r": 480.5894799999999, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "11"}, {"label": "caption", "id": 2, "page_no": 10, "cluster": {"id": 2, "label": "caption", "bbox": {"l": 134.765, "t": 125.79918999999984, "r": 480.58838000000003, "b": 177.76764000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.8657060861587524, "cells": [{"id": 2, "text": "Fig. 6.", "bbox": {"l": 134.765, "t": 125.79918999999984, "r": 162.64424, "b": 133.72551999999996, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Visualization of predicted structure and detected bounding boxes on a complex", "bbox": {"l": 165.215, "t": 125.86200000000008, "r": 480.58752, "b": 133.93169999999998, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "table with many rows. The OTSL model (B) captured repeating pattern of horizontally", "bbox": {"l": 134.765, "t": 136.82097999999996, "r": 480.58823, "b": 144.89068999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "merged cells from the GT (A), unlike the HTML model (C). The HTML model also", "bbox": {"l": 134.765, "t": 147.77997000000005, "r": 480.5881999999999, "b": 155.84966999999995, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "didn\u2019t complete the HTML sequence correctly and displayed a lot more of drift and", "bbox": {"l": 134.765, "t": 158.73895000000005, "r": 480.58838000000003, "b": 166.80864999999994, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "overlap of bounding boxes. \"PMC5406406_003_01.png\" PubTabNet.", "bbox": {"l": 134.765, "t": 169.69794000000002, "r": 415.84454, "b": 177.76764000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Fig. 6. Visualization of predicted structure and detected bounding boxes on a complex table with many rows. The OTSL model (B) captured repeating pattern of horizontally merged cells from the GT (A), unlike the HTML model (C). The HTML model also didn\u2019t complete the HTML sequence correctly and displayed a lot more of drift and overlap of bounding boxes. \"PMC5406406_003_01.png\" PubTabNet."}, {"label": "picture", "id": 3, "page_no": 10, "cluster": {"id": 3, "label": "picture", "bbox": {"l": 168.39285278320312, "t": 181.9665069580078, "r": 447.35137939453125, "b": 634.0056762695312, "coord_origin": "TOPLEFT"}, "confidence": 0.7612658739089966, "cells": [{"id": 8, "text": "B", "bbox": {"l": 171.5049, "t": 312.45032, "r": 177.59613, "b": 320.36386, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "C", "bbox": {"l": 171.05823, "t": 492.65274, "r": 177.14946, "b": 500.56628, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Incorrect end of HTML sequence", "bbox": {"l": 283.047, "t": 627.48166, "r": 374.96332, "b": 633.4168099999999, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Horizontally merged cells are not present", "bbox": {"l": 283.047, "t": 617.35776, "r": 398.05978, "b": 623.29291, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Repeating pattern is well represented in predictions", "bbox": {"l": 293.64209, "t": 465.59784, "r": 437.50800000000004, "b": 471.53299, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Repeating pattern of", "bbox": {"l": 181.89114, "t": 288.35962000000006, "r": 239.23492, "b": 294.2947700000001, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "horizontally merged cells", "bbox": {"l": 181.89114, "t": 294.89423, "r": 251.52917, "b": 300.82938, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "A", "bbox": {"l": 247.83432, "t": 184.75989000000004, "r": 253.61339, "b": 194.81635000000006, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Bounding box drifting at the end", "bbox": {"l": 292.18976, "t": 607.80609, "r": 381.54663, "b": 613.7412400000001, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "OTSL", "bbox": {"l": 172.27777, "t": 381.36288, "r": 180.18666, "b": 403.40067, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "HTML", "bbox": {"l": 172.27747, "t": 555.7769499999999, "r": 180.18663, "b": 578.7478, "coord_origin": "TOPLEFT"}}], "children": [{"id": 3, "label": "text", "bbox": {"l": 171.5049, "t": 312.45032, "r": 177.59613, "b": 320.36386, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "B", "bbox": {"l": 171.5049, "t": 312.45032, "r": 177.59613, "b": 320.36386, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "text", "bbox": {"l": 171.05823, "t": 492.65274, "r": 177.14946, "b": 500.56628, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "C", "bbox": {"l": 171.05823, "t": 492.65274, "r": 177.14946, "b": 500.56628, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "text", "bbox": {"l": 283.047, "t": 627.48166, "r": 374.96332, "b": 633.4168099999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "Incorrect end of HTML sequence", "bbox": {"l": 283.047, "t": 627.48166, "r": 374.96332, "b": 633.4168099999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "text", "bbox": {"l": 283.047, "t": 617.35776, "r": 398.05978, "b": 623.29291, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "Horizontally merged cells are not present", "bbox": {"l": 283.047, "t": 617.35776, "r": 398.05978, "b": 623.29291, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "text", "bbox": {"l": 293.64209, "t": 465.59784, "r": 437.50800000000004, "b": 471.53299, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "Repeating pattern is well represented in predictions", "bbox": {"l": 293.64209, "t": 465.59784, "r": 437.50800000000004, "b": 471.53299, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "text", "bbox": {"l": 181.89114, "t": 288.35962000000006, "r": 239.23492, "b": 294.2947700000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "Repeating pattern of", "bbox": {"l": 181.89114, "t": 288.35962000000006, "r": 239.23492, "b": 294.2947700000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 181.89114, "t": 294.89423, "r": 251.52917, "b": 300.82938, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "horizontally merged cells", "bbox": {"l": 181.89114, "t": 294.89423, "r": 251.52917, "b": 300.82938, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "text", "bbox": {"l": 247.83432, "t": 184.75989000000004, "r": 253.61339, "b": 194.81635000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "A", "bbox": {"l": 247.83432, "t": 184.75989000000004, "r": 253.61339, "b": 194.81635000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 292.18976, "t": 607.80609, "r": 381.54663, "b": 613.7412400000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "Bounding box drifting at the end", "bbox": {"l": 292.18976, "t": 607.80609, "r": 381.54663, "b": 613.7412400000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 172.27777, "t": 381.36288, "r": 180.18666, "b": 403.40067, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "OTSL", "bbox": {"l": 172.27777, "t": 381.36288, "r": 180.18666, "b": 403.40067, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 172.27747, "t": 555.7769499999999, "r": 180.18663, "b": 578.7478, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "HTML", "bbox": {"l": 172.27747, "t": 555.7769499999999, "r": 180.18663, "b": 578.7478, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "body": [{"label": "caption", "id": 2, "page_no": 10, "cluster": {"id": 2, "label": "caption", "bbox": {"l": 134.765, "t": 125.79918999999984, "r": 480.58838000000003, "b": 177.76764000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.8657060861587524, "cells": [{"id": 2, "text": "Fig. 6.", "bbox": {"l": 134.765, "t": 125.79918999999984, "r": 162.64424, "b": 133.72551999999996, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Visualization of predicted structure and detected bounding boxes on a complex", "bbox": {"l": 165.215, "t": 125.86200000000008, "r": 480.58752, "b": 133.93169999999998, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "table with many rows. The OTSL model (B) captured repeating pattern of horizontally", "bbox": {"l": 134.765, "t": 136.82097999999996, "r": 480.58823, "b": 144.89068999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "merged cells from the GT (A), unlike the HTML model (C). The HTML model also", "bbox": {"l": 134.765, "t": 147.77997000000005, "r": 480.5881999999999, "b": 155.84966999999995, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "didn\u2019t complete the HTML sequence correctly and displayed a lot more of drift and", "bbox": {"l": 134.765, "t": 158.73895000000005, "r": 480.58838000000003, "b": 166.80864999999994, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "overlap of bounding boxes. \"PMC5406406_003_01.png\" PubTabNet.", "bbox": {"l": 134.765, "t": 169.69794000000002, "r": 415.84454, "b": 177.76764000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Fig. 6. Visualization of predicted structure and detected bounding boxes on a complex table with many rows. The OTSL model (B) captured repeating pattern of horizontally merged cells from the GT (A), unlike the HTML model (C). The HTML model also didn\u2019t complete the HTML sequence correctly and displayed a lot more of drift and overlap of bounding boxes. \"PMC5406406_003_01.png\" PubTabNet."}, {"label": "picture", "id": 3, "page_no": 10, "cluster": {"id": 3, "label": "picture", "bbox": {"l": 168.39285278320312, "t": 181.9665069580078, "r": 447.35137939453125, "b": 634.0056762695312, "coord_origin": "TOPLEFT"}, "confidence": 0.7612658739089966, "cells": [{"id": 8, "text": "B", "bbox": {"l": 171.5049, "t": 312.45032, "r": 177.59613, "b": 320.36386, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "C", "bbox": {"l": 171.05823, "t": 492.65274, "r": 177.14946, "b": 500.56628, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Incorrect end of HTML sequence", "bbox": {"l": 283.047, "t": 627.48166, "r": 374.96332, "b": 633.4168099999999, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Horizontally merged cells are not present", "bbox": {"l": 283.047, "t": 617.35776, "r": 398.05978, "b": 623.29291, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Repeating pattern is well represented in predictions", "bbox": {"l": 293.64209, "t": 465.59784, "r": 437.50800000000004, "b": 471.53299, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Repeating pattern of", "bbox": {"l": 181.89114, "t": 288.35962000000006, "r": 239.23492, "b": 294.2947700000001, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "horizontally merged cells", "bbox": {"l": 181.89114, "t": 294.89423, "r": 251.52917, "b": 300.82938, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "A", "bbox": {"l": 247.83432, "t": 184.75989000000004, "r": 253.61339, "b": 194.81635000000006, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Bounding box drifting at the end", "bbox": {"l": 292.18976, "t": 607.80609, "r": 381.54663, "b": 613.7412400000001, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "OTSL", "bbox": {"l": 172.27777, "t": 381.36288, "r": 180.18666, "b": 403.40067, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "HTML", "bbox": {"l": 172.27747, "t": 555.7769499999999, "r": 180.18663, "b": 578.7478, "coord_origin": "TOPLEFT"}}], "children": [{"id": 3, "label": "text", "bbox": {"l": 171.5049, "t": 312.45032, "r": 177.59613, "b": 320.36386, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "B", "bbox": {"l": 171.5049, "t": 312.45032, "r": 177.59613, "b": 320.36386, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "text", "bbox": {"l": 171.05823, "t": 492.65274, "r": 177.14946, "b": 500.56628, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "C", "bbox": {"l": 171.05823, "t": 492.65274, "r": 177.14946, "b": 500.56628, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "text", "bbox": {"l": 283.047, "t": 627.48166, "r": 374.96332, "b": 633.4168099999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "Incorrect end of HTML sequence", "bbox": {"l": 283.047, "t": 627.48166, "r": 374.96332, "b": 633.4168099999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "text", "bbox": {"l": 283.047, "t": 617.35776, "r": 398.05978, "b": 623.29291, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "Horizontally merged cells are not present", "bbox": {"l": 283.047, "t": 617.35776, "r": 398.05978, "b": 623.29291, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "text", "bbox": {"l": 293.64209, "t": 465.59784, "r": 437.50800000000004, "b": 471.53299, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "Repeating pattern is well represented in predictions", "bbox": {"l": 293.64209, "t": 465.59784, "r": 437.50800000000004, "b": 471.53299, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "text", "bbox": {"l": 181.89114, "t": 288.35962000000006, "r": 239.23492, "b": 294.2947700000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "Repeating pattern of", "bbox": {"l": 181.89114, "t": 288.35962000000006, "r": 239.23492, "b": 294.2947700000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 181.89114, "t": 294.89423, "r": 251.52917, "b": 300.82938, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "horizontally merged cells", "bbox": {"l": 181.89114, "t": 294.89423, "r": 251.52917, "b": 300.82938, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "text", "bbox": {"l": 247.83432, "t": 184.75989000000004, "r": 253.61339, "b": 194.81635000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "A", "bbox": {"l": 247.83432, "t": 184.75989000000004, "r": 253.61339, "b": 194.81635000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 292.18976, "t": 607.80609, "r": 381.54663, "b": 613.7412400000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "Bounding box drifting at the end", "bbox": {"l": 292.18976, "t": 607.80609, "r": 381.54663, "b": 613.7412400000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 172.27777, "t": 381.36288, "r": 180.18666, "b": 403.40067, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "OTSL", "bbox": {"l": 172.27777, "t": 381.36288, "r": 180.18666, "b": 403.40067, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 172.27747, "t": 555.7769499999999, "r": 180.18663, "b": 578.7478, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "HTML", "bbox": {"l": 172.27747, "t": 555.7769499999999, "r": 180.18663, "b": 578.7478, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "headers": [{"label": "page_header", "id": 0, "page_no": 10, "cluster": {"id": 0, "label": "page_header", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9301655888557434, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Optimized Table Tokenization for Table Structure Recognition"}, {"label": "page_header", "id": 1, "page_no": 10, "cluster": {"id": 1, "label": "page_header", "bbox": {"l": 471.37561, "t": 93.77099999999996, "r": 480.5894799999999, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9007201790809631, "cells": [{"id": 1, "text": "11", "bbox": {"l": 471.37561, "t": 93.77099999999996, "r": 480.5894799999999, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "11"}]}}, {"page_no": 11, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "12", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 143.97887, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "M.", "bbox": {"l": 167.82053, "t": 93.77099999999996, "r": 178.08249, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37929, "t": 93.77099999999996, "r": 231.72049000000004, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "6", "bbox": {"l": 134.765, "t": 117.54894999999988, "r": 141.4886, "b": 128.11737000000005, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Conclusion", "bbox": {"l": 154.9382, "t": 117.54894999999988, "r": 219.25478999999999, "b": 128.11737000000005, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "We demonstrated that representing tables in HTML for the task of table struc-", "bbox": {"l": 134.765, "t": 146.86377000000005, "r": 480.59476, "b": 155.66076999999996, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "ture recognition with Im2Seq models is ill-suited and has serious limitations.", "bbox": {"l": 134.765, "t": 158.81879000000004, "r": 480.59476, "b": 167.61577999999997, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Furthermore, we presented in this paper an Optimized Table Structure Language", "bbox": {"l": 134.765, "t": 170.77380000000005, "r": 480.58978, "b": 179.57079999999996, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "(OTSL) which, when compared to commonly used general purpose languages,", "bbox": {"l": 134.765, "t": 182.72979999999995, "r": 480.59569999999997, "b": 191.52679, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "has several key benefits.", "bbox": {"l": 134.765, "t": 194.68480999999997, "r": 239.5387, "b": 203.48181, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "First and foremost, given the same network configuration, inference time for", "bbox": {"l": 149.709, "t": 207.44379000000004, "r": 480.59283000000005, "b": 216.24077999999997, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "a table-structure prediction is about 2 times faster compared to the conventional", "bbox": {"l": 134.765, "t": 219.39880000000005, "r": 480.59365999999994, "b": 228.19579999999996, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "HTML approach. This is primarily owed to the shorter sequence length of the", "bbox": {"l": 134.765, "t": 231.35382000000004, "r": 480.59079, "b": 240.15081999999995, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "OTSL representation. Additional performance benefits can be obtained with", "bbox": {"l": 134.765, "t": 243.30884000000003, "r": 480.58786000000003, "b": 252.10582999999997, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "HPO (hyper parameter optimization). As we demonstrate in our experiments,", "bbox": {"l": 134.765, "t": 255.26482999999996, "r": 480.59479, "b": 264.06183, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "models trained on OTSL can be significantly smaller, e.g. by reducing the number", "bbox": {"l": 134.765, "t": 267.21984999999995, "r": 480.5878000000001, "b": 276.01685, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "of encoder and decoder layers, while preserving comparatively good prediction", "bbox": {"l": 134.765, "t": 279.17487000000006, "r": 480.59268, "b": 287.97183, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "quality. This can further improve inference performance, yielding 5-6 times faster", "bbox": {"l": 134.765, "t": 291.12985, "r": 480.58871, "b": 299.92682, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "inference speed in OTSL with prediction quality comparable to models trained", "bbox": {"l": 134.765, "t": 303.08484, "r": 480.59375, "b": 311.88181, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "on HTML (see Table 1).", "bbox": {"l": 134.765, "t": 315.03983, "r": 240.92351000000002, "b": 323.83679, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Secondly, OTSL has more inherent structure and a significantly restricted vo-", "bbox": {"l": 149.709, "t": 327.79883, "r": 480.58984, "b": 336.5957900000001, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "cabulary size. This allows autoregressive models to perform better in the TED", "bbox": {"l": 134.765, "t": 339.75482, "r": 480.59473, "b": 348.55179, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "metric, but especially with regards to prediction accuracy of the table-cell bound-", "bbox": {"l": 134.765, "t": 351.70981, "r": 480.58664, "b": 360.50677, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "ing boxes (see Table 2). As shown in Figure 5, we observe that the OTSL dras-", "bbox": {"l": 134.765, "t": 363.66479, "r": 480.59479, "b": 372.46176, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "tically reduces the drift for table cell bounding boxes at high row count and in", "bbox": {"l": 134.765, "t": 375.61978, "r": 480.58971999999994, "b": 384.41675, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "sparse tables. This leads to more accurate predictions and a significant reduction", "bbox": {"l": 134.765, "t": 387.57477, "r": 480.58673, "b": 396.37173, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "in post-processing complexity, which is an undesired necessity in HTML-based", "bbox": {"l": 134.765, "t": 399.53076, "r": 480.58574999999996, "b": 408.32773, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Im2Seq models. Significant novelty lies in OTSL syntactical rules, which are few,", "bbox": {"l": 134.765, "t": 411.48575, "r": 480.58675999999997, "b": 420.28271, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "simple and always backwards looking. Each new token can be validated only by", "bbox": {"l": 134.765, "t": 423.44073, "r": 480.59482, "b": 432.23769999999996, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "analyzing the sequence of previous tokens, without requiring the entire sequence", "bbox": {"l": 134.765, "t": 435.39572, "r": 480.58777, "b": 444.19269, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "to detect mistakes. This in return allows to perform structural error detection", "bbox": {"l": 134.765, "t": 447.35071, "r": 480.58968999999996, "b": 456.14767, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "and correction on-the-fly during sequence generation.", "bbox": {"l": 134.765, "t": 459.30569, "r": 366.77698, "b": 468.10266, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "References", "bbox": {"l": 134.765, "t": 493.82083, "r": 197.68642, "b": 504.38922, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "1.", "bbox": {"l": 139.371, "t": 522.87985, "r": 146.46127, "b": 530.94962, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Auer, C., Dolfi, M., Carvalho, A., Ramis, C.B., Staar, P.W.J.: Delivering doc-", "bbox": {"l": 151.01955, "t": 522.87985, "r": 480.5920100000001, "b": 530.94962, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "ument conversion as a cloud service with high throughput and responsiveness.", "bbox": {"l": 151.51801, "t": 533.83887, "r": 480.58667, "b": 541.90862, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "CoRR", "bbox": {"l": 151.51801, "t": 544.79785, "r": 176.34149, "b": 552.86761, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "abs/2206.00785", "bbox": {"l": 179.464, "t": 544.73509, "r": 250.67963, "b": 552.66139, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "(2022).", "bbox": {"l": 253.804, "t": 544.79785, "r": 281.9567, "b": 552.86761, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "https://doi.org/10.48550/arXiv.2206.00785", "bbox": {"l": 285.078, "t": 545.44344, "r": 478.03403000000003, "b": 552.91245, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": ",", "bbox": {"l": 478.0319799999999, "t": 544.79785, "r": 480.59099999999995, "b": 552.86761, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "https://doi.org/10.48550/arXiv.2206.00785", "bbox": {"l": 151.51797, "t": 556.4024400000001, "r": 344.474, "b": 563.87144, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "2.", "bbox": {"l": 139.37097, "t": 567.51884, "r": 145.94186, "b": 575.58861, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Chen, B., Peng, D., Zhang, J., Ren, Y., Jin, L.: Complex table structure recognition", "bbox": {"l": 150.16624, "t": 567.51884, "r": 480.58636, "b": 575.58861, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "in the wild using transformer and identity matrix-based augmentation. In: Porwal,", "bbox": {"l": 151.51797, "t": 578.47784, "r": 480.59012, "b": 586.5476100000001, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "U., Forn\u00e9s, A., Shafait, F. (eds.) Frontiers in Handwriting Recognition. pp. 545-", "bbox": {"l": 151.51797, "t": 589.43684, "r": 480.5920100000001, "b": 597.50661, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "561. Springer International Publishing, Cham (2022)", "bbox": {"l": 151.51797, "t": 600.39584, "r": 364.17856, "b": 608.46561, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "3.", "bbox": {"l": 139.37097, "t": 612.1588399999999, "r": 146.4379, "b": 620.22861, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Chi, Z., Huang, H., Xu, H.D., Yu, H., Yin, W., Mao, X.L.: Complicated table", "bbox": {"l": 150.98117, "t": 612.1588399999999, "r": 480.58731000000006, "b": 620.22861, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "structure recognition. arXiv preprint arXiv:1908.04729 (2019)", "bbox": {"l": 151.51797, "t": 623.11784, "r": 400.22525, "b": 631.18761, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "4.", "bbox": {"l": 139.37097, "t": 634.88084, "r": 146.52443, "b": 642.95061, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Deng, Y., Rosenberg, D., Mann, G.: Challenges in end-to-end neural scientific", "bbox": {"l": 151.12335, "t": 634.88084, "r": 480.58826, "b": 642.95061, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "table recognition. In: 2019 International Conference on Document Analysis and", "bbox": {"l": 151.51797, "t": 645.83984, "r": 480.58752, "b": 653.9096099999999, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Recognition (ICDAR). pp. 894-901. IEEE (2019)", "bbox": {"l": 151.51797, "t": 656.79785, "r": 350.11115, "b": 664.86761, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 10, "label": "page_header", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 143.97887, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8610832691192627, "cells": [{"id": 0, "text": "12", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 143.97887, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "page_header", "bbox": {"l": 167.82053, "t": 93.77099999999996, "r": 231.72049000000004, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8927664756774902, "cells": [{"id": 1, "text": "M.", "bbox": {"l": 167.82053, "t": 93.77099999999996, "r": 178.08249, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37929, "t": 93.77099999999996, "r": 231.72049000000004, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "section_header", "bbox": {"l": 134.765, "t": 117.54894999999988, "r": 219.25478999999999, "b": 128.11737000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.915635347366333, "cells": [{"id": 3, "text": "6", "bbox": {"l": 134.765, "t": 117.54894999999988, "r": 141.4886, "b": 128.11737000000005, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Conclusion", "bbox": {"l": 154.9382, "t": 117.54894999999988, "r": 219.25478999999999, "b": 128.11737000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 134.765, "t": 146.86377000000005, "r": 480.59569999999997, "b": 203.48181, "coord_origin": "TOPLEFT"}, "confidence": 0.9806171655654907, "cells": [{"id": 5, "text": "We demonstrated that representing tables in HTML for the task of table struc-", "bbox": {"l": 134.765, "t": 146.86377000000005, "r": 480.59476, "b": 155.66076999999996, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "ture recognition with Im2Seq models is ill-suited and has serious limitations.", "bbox": {"l": 134.765, "t": 158.81879000000004, "r": 480.59476, "b": 167.61577999999997, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Furthermore, we presented in this paper an Optimized Table Structure Language", "bbox": {"l": 134.765, "t": 170.77380000000005, "r": 480.58978, "b": 179.57079999999996, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "(OTSL) which, when compared to commonly used general purpose languages,", "bbox": {"l": 134.765, "t": 182.72979999999995, "r": 480.59569999999997, "b": 191.52679, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "has several key benefits.", "bbox": {"l": 134.765, "t": 194.68480999999997, "r": 239.5387, "b": 203.48181, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 134.765, "t": 207.44379000000004, "r": 480.59479, "b": 323.83679, "coord_origin": "TOPLEFT"}, "confidence": 0.9873476028442383, "cells": [{"id": 10, "text": "First and foremost, given the same network configuration, inference time for", "bbox": {"l": 149.709, "t": 207.44379000000004, "r": 480.59283000000005, "b": 216.24077999999997, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "a table-structure prediction is about 2 times faster compared to the conventional", "bbox": {"l": 134.765, "t": 219.39880000000005, "r": 480.59365999999994, "b": 228.19579999999996, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "HTML approach. This is primarily owed to the shorter sequence length of the", "bbox": {"l": 134.765, "t": 231.35382000000004, "r": 480.59079, "b": 240.15081999999995, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "OTSL representation. Additional performance benefits can be obtained with", "bbox": {"l": 134.765, "t": 243.30884000000003, "r": 480.58786000000003, "b": 252.10582999999997, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "HPO (hyper parameter optimization). As we demonstrate in our experiments,", "bbox": {"l": 134.765, "t": 255.26482999999996, "r": 480.59479, "b": 264.06183, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "models trained on OTSL can be significantly smaller, e.g. by reducing the number", "bbox": {"l": 134.765, "t": 267.21984999999995, "r": 480.5878000000001, "b": 276.01685, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "of encoder and decoder layers, while preserving comparatively good prediction", "bbox": {"l": 134.765, "t": 279.17487000000006, "r": 480.59268, "b": 287.97183, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "quality. This can further improve inference performance, yielding 5-6 times faster", "bbox": {"l": 134.765, "t": 291.12985, "r": 480.58871, "b": 299.92682, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "inference speed in OTSL with prediction quality comparable to models trained", "bbox": {"l": 134.765, "t": 303.08484, "r": 480.59375, "b": 311.88181, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "on HTML (see Table 1).", "bbox": {"l": 134.765, "t": 315.03983, "r": 240.92351000000002, "b": 323.83679, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 134.765, "t": 327.79883, "r": 480.59482, "b": 468.10266, "coord_origin": "TOPLEFT"}, "confidence": 0.9868747591972351, "cells": [{"id": 20, "text": "Secondly, OTSL has more inherent structure and a significantly restricted vo-", "bbox": {"l": 149.709, "t": 327.79883, "r": 480.58984, "b": 336.5957900000001, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "cabulary size. This allows autoregressive models to perform better in the TED", "bbox": {"l": 134.765, "t": 339.75482, "r": 480.59473, "b": 348.55179, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "metric, but especially with regards to prediction accuracy of the table-cell bound-", "bbox": {"l": 134.765, "t": 351.70981, "r": 480.58664, "b": 360.50677, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "ing boxes (see Table 2). As shown in Figure 5, we observe that the OTSL dras-", "bbox": {"l": 134.765, "t": 363.66479, "r": 480.59479, "b": 372.46176, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "tically reduces the drift for table cell bounding boxes at high row count and in", "bbox": {"l": 134.765, "t": 375.61978, "r": 480.58971999999994, "b": 384.41675, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "sparse tables. This leads to more accurate predictions and a significant reduction", "bbox": {"l": 134.765, "t": 387.57477, "r": 480.58673, "b": 396.37173, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "in post-processing complexity, which is an undesired necessity in HTML-based", "bbox": {"l": 134.765, "t": 399.53076, "r": 480.58574999999996, "b": 408.32773, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Im2Seq models. Significant novelty lies in OTSL syntactical rules, which are few,", "bbox": {"l": 134.765, "t": 411.48575, "r": 480.58675999999997, "b": 420.28271, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "simple and always backwards looking. Each new token can be validated only by", "bbox": {"l": 134.765, "t": 423.44073, "r": 480.59482, "b": 432.23769999999996, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "analyzing the sequence of previous tokens, without requiring the entire sequence", "bbox": {"l": 134.765, "t": 435.39572, "r": 480.58777, "b": 444.19269, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "to detect mistakes. This in return allows to perform structural error detection", "bbox": {"l": 134.765, "t": 447.35071, "r": 480.58968999999996, "b": 456.14767, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "and correction on-the-fly during sequence generation.", "bbox": {"l": 134.765, "t": 459.30569, "r": 366.77698, "b": 468.10266, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "section_header", "bbox": {"l": 134.765, "t": 493.82083, "r": 197.68642, "b": 504.38922, "coord_origin": "TOPLEFT"}, "confidence": 0.9403266310691833, "cells": [{"id": 32, "text": "References", "bbox": {"l": 134.765, "t": 493.82083, "r": 197.68642, "b": 504.38922, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "list_item", "bbox": {"l": 139.371, "t": 522.87985, "r": 480.5920100000001, "b": 563.87144, "coord_origin": "TOPLEFT"}, "confidence": 0.9698606729507446, "cells": [{"id": 33, "text": "1.", "bbox": {"l": 139.371, "t": 522.87985, "r": 146.46127, "b": 530.94962, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Auer, C., Dolfi, M., Carvalho, A., Ramis, C.B., Staar, P.W.J.: Delivering doc-", "bbox": {"l": 151.01955, "t": 522.87985, "r": 480.5920100000001, "b": 530.94962, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "ument conversion as a cloud service with high throughput and responsiveness.", "bbox": {"l": 151.51801, "t": 533.83887, "r": 480.58667, "b": 541.90862, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "CoRR", "bbox": {"l": 151.51801, "t": 544.79785, "r": 176.34149, "b": 552.86761, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "abs/2206.00785", "bbox": {"l": 179.464, "t": 544.73509, "r": 250.67963, "b": 552.66139, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "(2022).", "bbox": {"l": 253.804, "t": 544.79785, "r": 281.9567, "b": 552.86761, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "https://doi.org/10.48550/arXiv.2206.00785", "bbox": {"l": 285.078, "t": 545.44344, "r": 478.03403000000003, "b": 552.91245, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": ",", "bbox": {"l": 478.0319799999999, "t": 544.79785, "r": 480.59099999999995, "b": 552.86761, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "https://doi.org/10.48550/arXiv.2206.00785", "bbox": {"l": 151.51797, "t": 556.4024400000001, "r": 344.474, "b": 563.87144, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "list_item", "bbox": {"l": 139.37097, "t": 567.51884, "r": 480.5920100000001, "b": 608.46561, "coord_origin": "TOPLEFT"}, "confidence": 0.9730570316314697, "cells": [{"id": 42, "text": "2.", "bbox": {"l": 139.37097, "t": 567.51884, "r": 145.94186, "b": 575.58861, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Chen, B., Peng, D., Zhang, J., Ren, Y., Jin, L.: Complex table structure recognition", "bbox": {"l": 150.16624, "t": 567.51884, "r": 480.58636, "b": 575.58861, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "in the wild using transformer and identity matrix-based augmentation. In: Porwal,", "bbox": {"l": 151.51797, "t": 578.47784, "r": 480.59012, "b": 586.5476100000001, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "U., Forn\u00e9s, A., Shafait, F. (eds.) Frontiers in Handwriting Recognition. pp. 545-", "bbox": {"l": 151.51797, "t": 589.43684, "r": 480.5920100000001, "b": 597.50661, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "561. Springer International Publishing, Cham (2022)", "bbox": {"l": 151.51797, "t": 600.39584, "r": 364.17856, "b": 608.46561, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "list_item", "bbox": {"l": 139.37097, "t": 612.1588399999999, "r": 480.58731000000006, "b": 631.18761, "coord_origin": "TOPLEFT"}, "confidence": 0.9617196321487427, "cells": [{"id": 47, "text": "3.", "bbox": {"l": 139.37097, "t": 612.1588399999999, "r": 146.4379, "b": 620.22861, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Chi, Z., Huang, H., Xu, H.D., Yu, H., Yin, W., Mao, X.L.: Complicated table", "bbox": {"l": 150.98117, "t": 612.1588399999999, "r": 480.58731000000006, "b": 620.22861, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "structure recognition. arXiv preprint arXiv:1908.04729 (2019)", "bbox": {"l": 151.51797, "t": 623.11784, "r": 400.22525, "b": 631.18761, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "list_item", "bbox": {"l": 139.37097, "t": 634.88084, "r": 480.58826, "b": 664.86761, "coord_origin": "TOPLEFT"}, "confidence": 0.9754673838615417, "cells": [{"id": 50, "text": "4.", "bbox": {"l": 139.37097, "t": 634.88084, "r": 146.52443, "b": 642.95061, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Deng, Y., Rosenberg, D., Mann, G.: Challenges in end-to-end neural scientific", "bbox": {"l": 151.12335, "t": 634.88084, "r": 480.58826, "b": 642.95061, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "table recognition. In: 2019 International Conference on Document Analysis and", "bbox": {"l": 151.51797, "t": 645.83984, "r": 480.58752, "b": 653.9096099999999, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Recognition (ICDAR). pp. 894-901. IEEE (2019)", "bbox": {"l": 151.51797, "t": 656.79785, "r": 350.11115, "b": 664.86761, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_header", "id": 10, "page_no": 11, "cluster": {"id": 10, "label": "page_header", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 143.97887, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8610832691192627, "cells": [{"id": 0, "text": "12", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 143.97887, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "12"}, {"label": "page_header", "id": 9, "page_no": 11, "cluster": {"id": 9, "label": "page_header", "bbox": {"l": 167.82053, "t": 93.77099999999996, "r": 231.72049000000004, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8927664756774902, "cells": [{"id": 1, "text": "M.", "bbox": {"l": 167.82053, "t": 93.77099999999996, "r": 178.08249, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37929, "t": 93.77099999999996, "r": 231.72049000000004, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "M. Lysak, et al."}, {"label": "section_header", "id": 8, "page_no": 11, "cluster": {"id": 8, "label": "section_header", "bbox": {"l": 134.765, "t": 117.54894999999988, "r": 219.25478999999999, "b": 128.11737000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.915635347366333, "cells": [{"id": 3, "text": "6", "bbox": {"l": 134.765, "t": 117.54894999999988, "r": 141.4886, "b": 128.11737000000005, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Conclusion", "bbox": {"l": 154.9382, "t": 117.54894999999988, "r": 219.25478999999999, "b": 128.11737000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "6 Conclusion"}, {"label": "text", "id": 2, "page_no": 11, "cluster": {"id": 2, "label": "text", "bbox": {"l": 134.765, "t": 146.86377000000005, "r": 480.59569999999997, "b": 203.48181, "coord_origin": "TOPLEFT"}, "confidence": 0.9806171655654907, "cells": [{"id": 5, "text": "We demonstrated that representing tables in HTML for the task of table struc-", "bbox": {"l": 134.765, "t": 146.86377000000005, "r": 480.59476, "b": 155.66076999999996, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "ture recognition with Im2Seq models is ill-suited and has serious limitations.", "bbox": {"l": 134.765, "t": 158.81879000000004, "r": 480.59476, "b": 167.61577999999997, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Furthermore, we presented in this paper an Optimized Table Structure Language", "bbox": {"l": 134.765, "t": 170.77380000000005, "r": 480.58978, "b": 179.57079999999996, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "(OTSL) which, when compared to commonly used general purpose languages,", "bbox": {"l": 134.765, "t": 182.72979999999995, "r": 480.59569999999997, "b": 191.52679, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "has several key benefits.", "bbox": {"l": 134.765, "t": 194.68480999999997, "r": 239.5387, "b": 203.48181, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "We demonstrated that representing tables in HTML for the task of table structure recognition with Im2Seq models is ill-suited and has serious limitations. Furthermore, we presented in this paper an Optimized Table Structure Language (OTSL) which, when compared to commonly used general purpose languages, has several key benefits."}, {"label": "text", "id": 0, "page_no": 11, "cluster": {"id": 0, "label": "text", "bbox": {"l": 134.765, "t": 207.44379000000004, "r": 480.59479, "b": 323.83679, "coord_origin": "TOPLEFT"}, "confidence": 0.9873476028442383, "cells": [{"id": 10, "text": "First and foremost, given the same network configuration, inference time for", "bbox": {"l": 149.709, "t": 207.44379000000004, "r": 480.59283000000005, "b": 216.24077999999997, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "a table-structure prediction is about 2 times faster compared to the conventional", "bbox": {"l": 134.765, "t": 219.39880000000005, "r": 480.59365999999994, "b": 228.19579999999996, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "HTML approach. This is primarily owed to the shorter sequence length of the", "bbox": {"l": 134.765, "t": 231.35382000000004, "r": 480.59079, "b": 240.15081999999995, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "OTSL representation. Additional performance benefits can be obtained with", "bbox": {"l": 134.765, "t": 243.30884000000003, "r": 480.58786000000003, "b": 252.10582999999997, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "HPO (hyper parameter optimization). As we demonstrate in our experiments,", "bbox": {"l": 134.765, "t": 255.26482999999996, "r": 480.59479, "b": 264.06183, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "models trained on OTSL can be significantly smaller, e.g. by reducing the number", "bbox": {"l": 134.765, "t": 267.21984999999995, "r": 480.5878000000001, "b": 276.01685, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "of encoder and decoder layers, while preserving comparatively good prediction", "bbox": {"l": 134.765, "t": 279.17487000000006, "r": 480.59268, "b": 287.97183, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "quality. This can further improve inference performance, yielding 5-6 times faster", "bbox": {"l": 134.765, "t": 291.12985, "r": 480.58871, "b": 299.92682, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "inference speed in OTSL with prediction quality comparable to models trained", "bbox": {"l": 134.765, "t": 303.08484, "r": 480.59375, "b": 311.88181, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "on HTML (see Table 1).", "bbox": {"l": 134.765, "t": 315.03983, "r": 240.92351000000002, "b": 323.83679, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "First and foremost, given the same network configuration, inference time for a table-structure prediction is about 2 times faster compared to the conventional HTML approach. This is primarily owed to the shorter sequence length of the OTSL representation. Additional performance benefits can be obtained with HPO (hyper parameter optimization). As we demonstrate in our experiments, models trained on OTSL can be significantly smaller, e.g. by reducing the number of encoder and decoder layers, while preserving comparatively good prediction quality. This can further improve inference performance, yielding 5-6 times faster inference speed in OTSL with prediction quality comparable to models trained on HTML (see Table 1)."}, {"label": "text", "id": 1, "page_no": 11, "cluster": {"id": 1, "label": "text", "bbox": {"l": 134.765, "t": 327.79883, "r": 480.59482, "b": 468.10266, "coord_origin": "TOPLEFT"}, "confidence": 0.9868747591972351, "cells": [{"id": 20, "text": "Secondly, OTSL has more inherent structure and a significantly restricted vo-", "bbox": {"l": 149.709, "t": 327.79883, "r": 480.58984, "b": 336.5957900000001, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "cabulary size. This allows autoregressive models to perform better in the TED", "bbox": {"l": 134.765, "t": 339.75482, "r": 480.59473, "b": 348.55179, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "metric, but especially with regards to prediction accuracy of the table-cell bound-", "bbox": {"l": 134.765, "t": 351.70981, "r": 480.58664, "b": 360.50677, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "ing boxes (see Table 2). As shown in Figure 5, we observe that the OTSL dras-", "bbox": {"l": 134.765, "t": 363.66479, "r": 480.59479, "b": 372.46176, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "tically reduces the drift for table cell bounding boxes at high row count and in", "bbox": {"l": 134.765, "t": 375.61978, "r": 480.58971999999994, "b": 384.41675, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "sparse tables. This leads to more accurate predictions and a significant reduction", "bbox": {"l": 134.765, "t": 387.57477, "r": 480.58673, "b": 396.37173, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "in post-processing complexity, which is an undesired necessity in HTML-based", "bbox": {"l": 134.765, "t": 399.53076, "r": 480.58574999999996, "b": 408.32773, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Im2Seq models. Significant novelty lies in OTSL syntactical rules, which are few,", "bbox": {"l": 134.765, "t": 411.48575, "r": 480.58675999999997, "b": 420.28271, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "simple and always backwards looking. Each new token can be validated only by", "bbox": {"l": 134.765, "t": 423.44073, "r": 480.59482, "b": 432.23769999999996, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "analyzing the sequence of previous tokens, without requiring the entire sequence", "bbox": {"l": 134.765, "t": 435.39572, "r": 480.58777, "b": 444.19269, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "to detect mistakes. This in return allows to perform structural error detection", "bbox": {"l": 134.765, "t": 447.35071, "r": 480.58968999999996, "b": 456.14767, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "and correction on-the-fly during sequence generation.", "bbox": {"l": 134.765, "t": 459.30569, "r": 366.77698, "b": 468.10266, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Secondly, OTSL has more inherent structure and a significantly restricted vocabulary size. This allows autoregressive models to perform better in the TED metric, but especially with regards to prediction accuracy of the table-cell bounding boxes (see Table 2). As shown in Figure 5, we observe that the OTSL drastically reduces the drift for table cell bounding boxes at high row count and in sparse tables. This leads to more accurate predictions and a significant reduction in post-processing complexity, which is an undesired necessity in HTML-based Im2Seq models. Significant novelty lies in OTSL syntactical rules, which are few, simple and always backwards looking. Each new token can be validated only by analyzing the sequence of previous tokens, without requiring the entire sequence to detect mistakes. This in return allows to perform structural error detection and correction on-the-fly during sequence generation."}, {"label": "section_header", "id": 7, "page_no": 11, "cluster": {"id": 7, "label": "section_header", "bbox": {"l": 134.765, "t": 493.82083, "r": 197.68642, "b": 504.38922, "coord_origin": "TOPLEFT"}, "confidence": 0.9403266310691833, "cells": [{"id": 32, "text": "References", "bbox": {"l": 134.765, "t": 493.82083, "r": 197.68642, "b": 504.38922, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "References"}, {"label": "list_item", "id": 5, "page_no": 11, "cluster": {"id": 5, "label": "list_item", "bbox": {"l": 139.371, "t": 522.87985, "r": 480.5920100000001, "b": 563.87144, "coord_origin": "TOPLEFT"}, "confidence": 0.9698606729507446, "cells": [{"id": 33, "text": "1.", "bbox": {"l": 139.371, "t": 522.87985, "r": 146.46127, "b": 530.94962, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Auer, C., Dolfi, M., Carvalho, A., Ramis, C.B., Staar, P.W.J.: Delivering doc-", "bbox": {"l": 151.01955, "t": 522.87985, "r": 480.5920100000001, "b": 530.94962, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "ument conversion as a cloud service with high throughput and responsiveness.", "bbox": {"l": 151.51801, "t": 533.83887, "r": 480.58667, "b": 541.90862, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "CoRR", "bbox": {"l": 151.51801, "t": 544.79785, "r": 176.34149, "b": 552.86761, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "abs/2206.00785", "bbox": {"l": 179.464, "t": 544.73509, "r": 250.67963, "b": 552.66139, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "(2022).", "bbox": {"l": 253.804, "t": 544.79785, "r": 281.9567, "b": 552.86761, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "https://doi.org/10.48550/arXiv.2206.00785", "bbox": {"l": 285.078, "t": 545.44344, "r": 478.03403000000003, "b": 552.91245, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": ",", "bbox": {"l": 478.0319799999999, "t": 544.79785, "r": 480.59099999999995, "b": 552.86761, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "https://doi.org/10.48550/arXiv.2206.00785", "bbox": {"l": 151.51797, "t": 556.4024400000001, "r": 344.474, "b": 563.87144, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1. Auer, C., Dolfi, M., Carvalho, A., Ramis, C.B., Staar, P.W.J.: Delivering document conversion as a cloud service with high throughput and responsiveness. CoRR abs/2206.00785 (2022). https://doi.org/10.48550/arXiv.2206.00785 , https://doi.org/10.48550/arXiv.2206.00785"}, {"label": "list_item", "id": 4, "page_no": 11, "cluster": {"id": 4, "label": "list_item", "bbox": {"l": 139.37097, "t": 567.51884, "r": 480.5920100000001, "b": 608.46561, "coord_origin": "TOPLEFT"}, "confidence": 0.9730570316314697, "cells": [{"id": 42, "text": "2.", "bbox": {"l": 139.37097, "t": 567.51884, "r": 145.94186, "b": 575.58861, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Chen, B., Peng, D., Zhang, J., Ren, Y., Jin, L.: Complex table structure recognition", "bbox": {"l": 150.16624, "t": 567.51884, "r": 480.58636, "b": 575.58861, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "in the wild using transformer and identity matrix-based augmentation. In: Porwal,", "bbox": {"l": 151.51797, "t": 578.47784, "r": 480.59012, "b": 586.5476100000001, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "U., Forn\u00e9s, A., Shafait, F. (eds.) Frontiers in Handwriting Recognition. pp. 545-", "bbox": {"l": 151.51797, "t": 589.43684, "r": 480.5920100000001, "b": 597.50661, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "561. Springer International Publishing, Cham (2022)", "bbox": {"l": 151.51797, "t": 600.39584, "r": 364.17856, "b": 608.46561, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2. Chen, B., Peng, D., Zhang, J., Ren, Y., Jin, L.: Complex table structure recognition in the wild using transformer and identity matrix-based augmentation. In: Porwal, U., Forn\u00e9s, A., Shafait, F. (eds.) Frontiers in Handwriting Recognition. pp. 545561. Springer International Publishing, Cham (2022)"}, {"label": "list_item", "id": 6, "page_no": 11, "cluster": {"id": 6, "label": "list_item", "bbox": {"l": 139.37097, "t": 612.1588399999999, "r": 480.58731000000006, "b": 631.18761, "coord_origin": "TOPLEFT"}, "confidence": 0.9617196321487427, "cells": [{"id": 47, "text": "3.", "bbox": {"l": 139.37097, "t": 612.1588399999999, "r": 146.4379, "b": 620.22861, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Chi, Z., Huang, H., Xu, H.D., Yu, H., Yin, W., Mao, X.L.: Complicated table", "bbox": {"l": 150.98117, "t": 612.1588399999999, "r": 480.58731000000006, "b": 620.22861, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "structure recognition. arXiv preprint arXiv:1908.04729 (2019)", "bbox": {"l": 151.51797, "t": 623.11784, "r": 400.22525, "b": 631.18761, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3. Chi, Z., Huang, H., Xu, H.D., Yu, H., Yin, W., Mao, X.L.: Complicated table structure recognition. arXiv preprint arXiv:1908.04729 (2019)"}, {"label": "list_item", "id": 3, "page_no": 11, "cluster": {"id": 3, "label": "list_item", "bbox": {"l": 139.37097, "t": 634.88084, "r": 480.58826, "b": 664.86761, "coord_origin": "TOPLEFT"}, "confidence": 0.9754673838615417, "cells": [{"id": 50, "text": "4.", "bbox": {"l": 139.37097, "t": 634.88084, "r": 146.52443, "b": 642.95061, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Deng, Y., Rosenberg, D., Mann, G.: Challenges in end-to-end neural scientific", "bbox": {"l": 151.12335, "t": 634.88084, "r": 480.58826, "b": 642.95061, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "table recognition. In: 2019 International Conference on Document Analysis and", "bbox": {"l": 151.51797, "t": 645.83984, "r": 480.58752, "b": 653.9096099999999, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Recognition (ICDAR). pp. 894-901. IEEE (2019)", "bbox": {"l": 151.51797, "t": 656.79785, "r": 350.11115, "b": 664.86761, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4. Deng, Y., Rosenberg, D., Mann, G.: Challenges in end-to-end neural scientific table recognition. In: 2019 International Conference on Document Analysis and Recognition (ICDAR). pp. 894-901. IEEE (2019)"}], "body": [{"label": "section_header", "id": 8, "page_no": 11, "cluster": {"id": 8, "label": "section_header", "bbox": {"l": 134.765, "t": 117.54894999999988, "r": 219.25478999999999, "b": 128.11737000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.915635347366333, "cells": [{"id": 3, "text": "6", "bbox": {"l": 134.765, "t": 117.54894999999988, "r": 141.4886, "b": 128.11737000000005, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Conclusion", "bbox": {"l": 154.9382, "t": 117.54894999999988, "r": 219.25478999999999, "b": 128.11737000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "6 Conclusion"}, {"label": "text", "id": 2, "page_no": 11, "cluster": {"id": 2, "label": "text", "bbox": {"l": 134.765, "t": 146.86377000000005, "r": 480.59569999999997, "b": 203.48181, "coord_origin": "TOPLEFT"}, "confidence": 0.9806171655654907, "cells": [{"id": 5, "text": "We demonstrated that representing tables in HTML for the task of table struc-", "bbox": {"l": 134.765, "t": 146.86377000000005, "r": 480.59476, "b": 155.66076999999996, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "ture recognition with Im2Seq models is ill-suited and has serious limitations.", "bbox": {"l": 134.765, "t": 158.81879000000004, "r": 480.59476, "b": 167.61577999999997, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Furthermore, we presented in this paper an Optimized Table Structure Language", "bbox": {"l": 134.765, "t": 170.77380000000005, "r": 480.58978, "b": 179.57079999999996, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "(OTSL) which, when compared to commonly used general purpose languages,", "bbox": {"l": 134.765, "t": 182.72979999999995, "r": 480.59569999999997, "b": 191.52679, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "has several key benefits.", "bbox": {"l": 134.765, "t": 194.68480999999997, "r": 239.5387, "b": 203.48181, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "We demonstrated that representing tables in HTML for the task of table structure recognition with Im2Seq models is ill-suited and has serious limitations. Furthermore, we presented in this paper an Optimized Table Structure Language (OTSL) which, when compared to commonly used general purpose languages, has several key benefits."}, {"label": "text", "id": 0, "page_no": 11, "cluster": {"id": 0, "label": "text", "bbox": {"l": 134.765, "t": 207.44379000000004, "r": 480.59479, "b": 323.83679, "coord_origin": "TOPLEFT"}, "confidence": 0.9873476028442383, "cells": [{"id": 10, "text": "First and foremost, given the same network configuration, inference time for", "bbox": {"l": 149.709, "t": 207.44379000000004, "r": 480.59283000000005, "b": 216.24077999999997, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "a table-structure prediction is about 2 times faster compared to the conventional", "bbox": {"l": 134.765, "t": 219.39880000000005, "r": 480.59365999999994, "b": 228.19579999999996, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "HTML approach. This is primarily owed to the shorter sequence length of the", "bbox": {"l": 134.765, "t": 231.35382000000004, "r": 480.59079, "b": 240.15081999999995, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "OTSL representation. Additional performance benefits can be obtained with", "bbox": {"l": 134.765, "t": 243.30884000000003, "r": 480.58786000000003, "b": 252.10582999999997, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "HPO (hyper parameter optimization). As we demonstrate in our experiments,", "bbox": {"l": 134.765, "t": 255.26482999999996, "r": 480.59479, "b": 264.06183, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "models trained on OTSL can be significantly smaller, e.g. by reducing the number", "bbox": {"l": 134.765, "t": 267.21984999999995, "r": 480.5878000000001, "b": 276.01685, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "of encoder and decoder layers, while preserving comparatively good prediction", "bbox": {"l": 134.765, "t": 279.17487000000006, "r": 480.59268, "b": 287.97183, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "quality. This can further improve inference performance, yielding 5-6 times faster", "bbox": {"l": 134.765, "t": 291.12985, "r": 480.58871, "b": 299.92682, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "inference speed in OTSL with prediction quality comparable to models trained", "bbox": {"l": 134.765, "t": 303.08484, "r": 480.59375, "b": 311.88181, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "on HTML (see Table 1).", "bbox": {"l": 134.765, "t": 315.03983, "r": 240.92351000000002, "b": 323.83679, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "First and foremost, given the same network configuration, inference time for a table-structure prediction is about 2 times faster compared to the conventional HTML approach. This is primarily owed to the shorter sequence length of the OTSL representation. Additional performance benefits can be obtained with HPO (hyper parameter optimization). As we demonstrate in our experiments, models trained on OTSL can be significantly smaller, e.g. by reducing the number of encoder and decoder layers, while preserving comparatively good prediction quality. This can further improve inference performance, yielding 5-6 times faster inference speed in OTSL with prediction quality comparable to models trained on HTML (see Table 1)."}, {"label": "text", "id": 1, "page_no": 11, "cluster": {"id": 1, "label": "text", "bbox": {"l": 134.765, "t": 327.79883, "r": 480.59482, "b": 468.10266, "coord_origin": "TOPLEFT"}, "confidence": 0.9868747591972351, "cells": [{"id": 20, "text": "Secondly, OTSL has more inherent structure and a significantly restricted vo-", "bbox": {"l": 149.709, "t": 327.79883, "r": 480.58984, "b": 336.5957900000001, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "cabulary size. This allows autoregressive models to perform better in the TED", "bbox": {"l": 134.765, "t": 339.75482, "r": 480.59473, "b": 348.55179, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "metric, but especially with regards to prediction accuracy of the table-cell bound-", "bbox": {"l": 134.765, "t": 351.70981, "r": 480.58664, "b": 360.50677, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "ing boxes (see Table 2). As shown in Figure 5, we observe that the OTSL dras-", "bbox": {"l": 134.765, "t": 363.66479, "r": 480.59479, "b": 372.46176, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "tically reduces the drift for table cell bounding boxes at high row count and in", "bbox": {"l": 134.765, "t": 375.61978, "r": 480.58971999999994, "b": 384.41675, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "sparse tables. This leads to more accurate predictions and a significant reduction", "bbox": {"l": 134.765, "t": 387.57477, "r": 480.58673, "b": 396.37173, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "in post-processing complexity, which is an undesired necessity in HTML-based", "bbox": {"l": 134.765, "t": 399.53076, "r": 480.58574999999996, "b": 408.32773, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Im2Seq models. Significant novelty lies in OTSL syntactical rules, which are few,", "bbox": {"l": 134.765, "t": 411.48575, "r": 480.58675999999997, "b": 420.28271, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "simple and always backwards looking. Each new token can be validated only by", "bbox": {"l": 134.765, "t": 423.44073, "r": 480.59482, "b": 432.23769999999996, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "analyzing the sequence of previous tokens, without requiring the entire sequence", "bbox": {"l": 134.765, "t": 435.39572, "r": 480.58777, "b": 444.19269, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "to detect mistakes. This in return allows to perform structural error detection", "bbox": {"l": 134.765, "t": 447.35071, "r": 480.58968999999996, "b": 456.14767, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "and correction on-the-fly during sequence generation.", "bbox": {"l": 134.765, "t": 459.30569, "r": 366.77698, "b": 468.10266, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Secondly, OTSL has more inherent structure and a significantly restricted vocabulary size. This allows autoregressive models to perform better in the TED metric, but especially with regards to prediction accuracy of the table-cell bounding boxes (see Table 2). As shown in Figure 5, we observe that the OTSL drastically reduces the drift for table cell bounding boxes at high row count and in sparse tables. This leads to more accurate predictions and a significant reduction in post-processing complexity, which is an undesired necessity in HTML-based Im2Seq models. Significant novelty lies in OTSL syntactical rules, which are few, simple and always backwards looking. Each new token can be validated only by analyzing the sequence of previous tokens, without requiring the entire sequence to detect mistakes. This in return allows to perform structural error detection and correction on-the-fly during sequence generation."}, {"label": "section_header", "id": 7, "page_no": 11, "cluster": {"id": 7, "label": "section_header", "bbox": {"l": 134.765, "t": 493.82083, "r": 197.68642, "b": 504.38922, "coord_origin": "TOPLEFT"}, "confidence": 0.9403266310691833, "cells": [{"id": 32, "text": "References", "bbox": {"l": 134.765, "t": 493.82083, "r": 197.68642, "b": 504.38922, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "References"}, {"label": "list_item", "id": 5, "page_no": 11, "cluster": {"id": 5, "label": "list_item", "bbox": {"l": 139.371, "t": 522.87985, "r": 480.5920100000001, "b": 563.87144, "coord_origin": "TOPLEFT"}, "confidence": 0.9698606729507446, "cells": [{"id": 33, "text": "1.", "bbox": {"l": 139.371, "t": 522.87985, "r": 146.46127, "b": 530.94962, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Auer, C., Dolfi, M., Carvalho, A., Ramis, C.B., Staar, P.W.J.: Delivering doc-", "bbox": {"l": 151.01955, "t": 522.87985, "r": 480.5920100000001, "b": 530.94962, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "ument conversion as a cloud service with high throughput and responsiveness.", "bbox": {"l": 151.51801, "t": 533.83887, "r": 480.58667, "b": 541.90862, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "CoRR", "bbox": {"l": 151.51801, "t": 544.79785, "r": 176.34149, "b": 552.86761, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "abs/2206.00785", "bbox": {"l": 179.464, "t": 544.73509, "r": 250.67963, "b": 552.66139, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "(2022).", "bbox": {"l": 253.804, "t": 544.79785, "r": 281.9567, "b": 552.86761, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "https://doi.org/10.48550/arXiv.2206.00785", "bbox": {"l": 285.078, "t": 545.44344, "r": 478.03403000000003, "b": 552.91245, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": ",", "bbox": {"l": 478.0319799999999, "t": 544.79785, "r": 480.59099999999995, "b": 552.86761, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "https://doi.org/10.48550/arXiv.2206.00785", "bbox": {"l": 151.51797, "t": 556.4024400000001, "r": 344.474, "b": 563.87144, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1. Auer, C., Dolfi, M., Carvalho, A., Ramis, C.B., Staar, P.W.J.: Delivering document conversion as a cloud service with high throughput and responsiveness. CoRR abs/2206.00785 (2022). https://doi.org/10.48550/arXiv.2206.00785 , https://doi.org/10.48550/arXiv.2206.00785"}, {"label": "list_item", "id": 4, "page_no": 11, "cluster": {"id": 4, "label": "list_item", "bbox": {"l": 139.37097, "t": 567.51884, "r": 480.5920100000001, "b": 608.46561, "coord_origin": "TOPLEFT"}, "confidence": 0.9730570316314697, "cells": [{"id": 42, "text": "2.", "bbox": {"l": 139.37097, "t": 567.51884, "r": 145.94186, "b": 575.58861, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Chen, B., Peng, D., Zhang, J., Ren, Y., Jin, L.: Complex table structure recognition", "bbox": {"l": 150.16624, "t": 567.51884, "r": 480.58636, "b": 575.58861, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "in the wild using transformer and identity matrix-based augmentation. In: Porwal,", "bbox": {"l": 151.51797, "t": 578.47784, "r": 480.59012, "b": 586.5476100000001, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "U., Forn\u00e9s, A., Shafait, F. (eds.) Frontiers in Handwriting Recognition. pp. 545-", "bbox": {"l": 151.51797, "t": 589.43684, "r": 480.5920100000001, "b": 597.50661, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "561. Springer International Publishing, Cham (2022)", "bbox": {"l": 151.51797, "t": 600.39584, "r": 364.17856, "b": 608.46561, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2. Chen, B., Peng, D., Zhang, J., Ren, Y., Jin, L.: Complex table structure recognition in the wild using transformer and identity matrix-based augmentation. In: Porwal, U., Forn\u00e9s, A., Shafait, F. (eds.) Frontiers in Handwriting Recognition. pp. 545561. Springer International Publishing, Cham (2022)"}, {"label": "list_item", "id": 6, "page_no": 11, "cluster": {"id": 6, "label": "list_item", "bbox": {"l": 139.37097, "t": 612.1588399999999, "r": 480.58731000000006, "b": 631.18761, "coord_origin": "TOPLEFT"}, "confidence": 0.9617196321487427, "cells": [{"id": 47, "text": "3.", "bbox": {"l": 139.37097, "t": 612.1588399999999, "r": 146.4379, "b": 620.22861, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Chi, Z., Huang, H., Xu, H.D., Yu, H., Yin, W., Mao, X.L.: Complicated table", "bbox": {"l": 150.98117, "t": 612.1588399999999, "r": 480.58731000000006, "b": 620.22861, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "structure recognition. arXiv preprint arXiv:1908.04729 (2019)", "bbox": {"l": 151.51797, "t": 623.11784, "r": 400.22525, "b": 631.18761, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3. Chi, Z., Huang, H., Xu, H.D., Yu, H., Yin, W., Mao, X.L.: Complicated table structure recognition. arXiv preprint arXiv:1908.04729 (2019)"}, {"label": "list_item", "id": 3, "page_no": 11, "cluster": {"id": 3, "label": "list_item", "bbox": {"l": 139.37097, "t": 634.88084, "r": 480.58826, "b": 664.86761, "coord_origin": "TOPLEFT"}, "confidence": 0.9754673838615417, "cells": [{"id": 50, "text": "4.", "bbox": {"l": 139.37097, "t": 634.88084, "r": 146.52443, "b": 642.95061, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Deng, Y., Rosenberg, D., Mann, G.: Challenges in end-to-end neural scientific", "bbox": {"l": 151.12335, "t": 634.88084, "r": 480.58826, "b": 642.95061, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "table recognition. In: 2019 International Conference on Document Analysis and", "bbox": {"l": 151.51797, "t": 645.83984, "r": 480.58752, "b": 653.9096099999999, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Recognition (ICDAR). pp. 894-901. IEEE (2019)", "bbox": {"l": 151.51797, "t": 656.79785, "r": 350.11115, "b": 664.86761, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4. Deng, Y., Rosenberg, D., Mann, G.: Challenges in end-to-end neural scientific table recognition. In: 2019 International Conference on Document Analysis and Recognition (ICDAR). pp. 894-901. IEEE (2019)"}], "headers": [{"label": "page_header", "id": 10, "page_no": 11, "cluster": {"id": 10, "label": "page_header", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 143.97887, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8610832691192627, "cells": [{"id": 0, "text": "12", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 143.97887, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "12"}, {"label": "page_header", "id": 9, "page_no": 11, "cluster": {"id": 9, "label": "page_header", "bbox": {"l": 167.82053, "t": 93.77099999999996, "r": 231.72049000000004, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8927664756774902, "cells": [{"id": 1, "text": "M.", "bbox": {"l": 167.82053, "t": 93.77099999999996, "r": 178.08249, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37929, "t": 93.77099999999996, "r": 231.72049000000004, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "M. Lysak, et al."}]}}, {"page_no": 12, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "13", "bbox": {"l": 471.37561, "t": 93.77099999999996, "r": 480.5894799999999, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "5.", "bbox": {"l": 139.371, "t": 119.67400999999995, "r": 146.04857, "b": 127.74370999999985, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Kayal, P., Anand, M., Desai, H., Singh, M.: Tables to latex: structure and content", "bbox": {"l": 150.34157, "t": 119.67400999999995, "r": 480.58826, "b": 127.74370999999985, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "extraction from scientific tables. International Journal on Document Analysis and", "bbox": {"l": 151.51801, "t": 130.63300000000004, "r": 480.59479, "b": 138.70270000000005, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Recognition (IJDAR) pp. 1-10 (2022)", "bbox": {"l": 151.51801, "t": 141.59198000000004, "r": 304.04364, "b": 149.66168000000005, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "6.", "bbox": {"l": 139.371, "t": 152.56195000000002, "r": 145.93991, "b": 160.63165000000004, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Lee, E., Kwon, J., Yang, H., Park, J., Lee, S., Koo, H.I., Cho, N.I.: Table structure", "bbox": {"l": 150.16298, "t": 152.56195000000002, "r": 480.59015, "b": 160.63165000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "recognition based on grid shape graph. In: 2022 Asia-Pacific Signal and Information", "bbox": {"l": 151.51801, "t": 163.52094, "r": 480.5903, "b": 171.59064, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Processing Association Annual Summit and Conference (APSIPA ASC). pp. 1868-", "bbox": {"l": 151.51801, "t": 174.47992, "r": 480.59286000000003, "b": 182.54962, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "1873. IEEE (2022)", "bbox": {"l": 151.51801, "t": 185.4389, "r": 226.37399, "b": 193.50860999999998, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "7.", "bbox": {"l": 139.371, "t": 196.40886999999998, "r": 146.31418, "b": 204.47857999999997, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Li, M., Cui, L., Huang, S., Wei, F., Zhou, M., Li, Z.: Tablebank: A benchmark", "bbox": {"l": 150.77789, "t": 196.40886999999998, "r": 480.59012, "b": 204.47857999999997, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "dataset for table detection and recognition (2019)", "bbox": {"l": 151.51801, "t": 207.36785999999995, "r": 352.01746, "b": 215.43755999999996, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "8.", "bbox": {"l": 139.371, "t": 218.33887000000004, "r": 146.37106, "b": 226.40857000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Livathinos, N., Berrospi, C., Lysak, M., Kuropiatnyk, V., Nassar, A., Carvalho,", "bbox": {"l": 150.87132, "t": 218.33887000000004, "r": 480.58731000000006, "b": 226.40857000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "A., Dolfi, M., Auer, C., Dinkla, K., Staar, P.: Robust pdf document conversion", "bbox": {"l": 151.51801, "t": 229.29785000000004, "r": 480.59020999999996, "b": 237.36755000000005, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "using recurrent neural networks. Proceedings of the AAAI Conference on Artificial", "bbox": {"l": 151.51801, "t": 240.25684, "r": 480.59473, "b": 248.32654000000002, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Intelligence", "bbox": {"l": 151.51801, "t": 251.21582, "r": 197.08617, "b": 259.28552, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "35", "bbox": {"l": 199.40001, "t": 251.15301999999997, "r": 210.00726, "b": 259.07935, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "(17), 15137-15145 (May 2021),", "bbox": {"l": 210.007, "t": 251.21582, "r": 332.37683, "b": 259.28552, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "https://ojs.aaai.org/index.php/", "bbox": {"l": 334.69901, "t": 251.86139000000003, "r": 480.59039000000007, "b": 259.33038, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "AAAI/article/view/17777", "bbox": {"l": 151.51801, "t": 262.8194, "r": 259.75769, "b": 270.28839000000005, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "9.", "bbox": {"l": 139.371, "t": 273.14484000000004, "r": 146.14218, "b": 281.21457, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "Nassar, A., Livathinos, N., Lysak, M., Staar, P.: Tableformer: Table structure un-", "bbox": {"l": 150.49533, "t": 273.14484000000004, "r": 480.5881999999999, "b": 281.21457, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "derstanding with transformers. In: Proceedings of the IEEE/CVF Conference on", "bbox": {"l": 151.51801, "t": 284.10379, "r": 480.59387000000004, "b": 292.17355, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "Computer Vision and Pattern Recognition (CVPR). pp. 4614-4623 (June 2022)", "bbox": {"l": 151.51801, "t": 295.06277, "r": 473.44308000000007, "b": 303.13254, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "10.", "bbox": {"l": 134.76401, "t": 306.03277999999995, "r": 146.49922, "b": 314.10254000000003, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Pfitzmann, B., Auer, C., Dolfi, M., Nassar, A.S., Staar, P.W.J.: Doclaynet: A", "bbox": {"l": 151.09138, "t": 306.03277999999995, "r": 480.58905, "b": 314.10254000000003, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "large human-annotated dataset for document-layout segmentation. In: Zhang, A.,", "bbox": {"l": 151.51801, "t": 316.99179, "r": 480.59015, "b": 325.06155, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Rangwala, H. (eds.) KDD \u201922: The 28th ACM SIGKDD Conference on Knowledge", "bbox": {"l": 151.51801, "t": 327.95078, "r": 480.59113, "b": 336.02054, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Discovery and Data Mining, Washington, DC, USA, August 14 - 18, 2022. pp.", "bbox": {"l": 151.51801, "t": 338.90976, "r": 480.59113, "b": 346.97952, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "3743-3751. ACM (2022).", "bbox": {"l": 151.51801, "t": 349.86874, "r": 251.14098999999996, "b": 357.93851, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "https://doi.org/10.1145/3534678.3539043", "bbox": {"l": 253.99001, "t": 350.5143100000001, "r": 437.53311, "b": 357.98333999999994, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": ",", "bbox": {"l": 437.53201, "t": 349.86874, "r": 440.09102999999993, "b": 357.93851, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "https://", "bbox": {"l": 442.94202000000007, "t": 350.5143100000001, "r": 480.59372, "b": 357.98333999999994, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "doi.org/10.1145/3534678.3539043", "bbox": {"l": 151.51801, "t": 361.47329999999994, "r": 297.40939, "b": 368.94232, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "11.", "bbox": {"l": 134.76401, "t": 371.79773, "r": 146.03854, "b": 379.86749, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "Prasad, D., Gadpal, A., Kapadni, K., Visave, M., Sultanpure, K.: Cascadetabnet:", "bbox": {"l": 150.4505, "t": 371.79773, "r": 480.58914000000004, "b": 379.86749, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "An approach for end to end table detection and structure recognition from image-", "bbox": {"l": 151.51801, "t": 382.7567399999999, "r": 480.59296, "b": 390.82651, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "based documents. In: Proceedings of the IEEE/CVF conference on computer vision", "bbox": {"l": 151.51801, "t": 393.71573, "r": 480.59293, "b": 401.78549, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "and pattern recognition workshops. pp. 572-573 (2020)", "bbox": {"l": 151.51801, "t": 404.67471, "r": 373.82727, "b": 412.74448, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "12.", "bbox": {"l": 134.76401, "t": 415.64471, "r": 145.91106, "b": 423.71448000000004, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Schreiber, S., Agne, S., Wolf, I., Dengel, A., Ahmed, S.: Deepdesrt: Deep learning", "bbox": {"l": 150.27309, "t": 415.64471, "r": 480.5874, "b": 423.71448000000004, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "for detection and structure recognition of tables in document images. In: 2017 14th", "bbox": {"l": 151.51801, "t": 426.60373, "r": 480.59469999999993, "b": 434.67349, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "IAPR international conference on document analysis and recognition (ICDAR).", "bbox": {"l": 151.51801, "t": 437.5627099999999, "r": 480.58844, "b": 445.63248, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "vol. 1, pp. 1162-1167. IEEE (2017)", "bbox": {"l": 151.51801, "t": 448.5217, "r": 292.91455, "b": 456.59146, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "13.", "bbox": {"l": 134.76401, "t": 459.4917, "r": 145.7785, "b": 467.56146, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Siddiqui, S.A., Fateh, I.A., Rizvi, S.T.R., Dengel, A., Ahmed, S.: Deeptabstr: Deep", "bbox": {"l": 150.08871, "t": 459.4917, "r": 480.59006, "b": 467.56146, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "learning based table structure recognition. In: 2019 International Conference on", "bbox": {"l": 151.51801, "t": 470.45071, "r": 480.59116, "b": 478.52048, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Document Analysis and Recognition (ICDAR). pp. 1403-1409 (2019).", "bbox": {"l": 151.51801, "t": 481.4097, "r": 439.05963, "b": 489.47946, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "https://", "bbox": {"l": 442.94202000000007, "t": 482.05527, "r": 480.59372, "b": 489.52429, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "doi.org/10.1109/ICDAR.2019.00226", "bbox": {"l": 151.51801, "t": 493.01425, "r": 302.11584, "b": 500.48328, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "14.", "bbox": {"l": 134.76401, "t": 503.33868, "r": 146.15501, "b": 511.40845, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "Smock, B., Pesala, R., Abraham, R.: PubTables-1M: Towards comprehensive ta-", "bbox": {"l": 150.61252, "t": 503.33868, "r": 480.59088, "b": 511.40845, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "ble extraction from unstructured documents. In: Proceedings of the IEEE/CVF", "bbox": {"l": 151.51801, "t": 514.2977000000001, "r": 480.59286000000003, "b": 522.3674599999999, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Conference on Computer Vision and Pattern Recognition (CVPR). pp. 4634-4642", "bbox": {"l": 151.51801, "t": 525.25668, "r": 480.58838000000003, "b": 533.32645, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "(June 2022)", "bbox": {"l": 151.51801, "t": 536.21568, "r": 199.24704, "b": 544.28545, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "15.", "bbox": {"l": 134.76401, "t": 547.18568, "r": 146.16588, "b": 555.25545, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Staar, P.W.J., Dolfi, M., Auer, C., Bekas, C.: Corpus conversion service: A ma-", "bbox": {"l": 150.62764, "t": 547.18568, "r": 480.58734000000004, "b": 555.25545, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "chine learning platform to ingest documents at scale. In: Proceedings of the 24th", "bbox": {"l": 151.51801, "t": 558.14468, "r": 480.58838000000003, "b": 566.2144499999999, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "ACM SIGKDD International Conference on Knowledge Discovery & Data Min-", "bbox": {"l": 151.51801, "t": 569.1036799999999, "r": 480.59109, "b": 577.17345, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "ing. pp. 774-782. KDD \u201918, Association for Computing Machinery, New York, NY,", "bbox": {"l": 151.51801, "t": 580.06268, "r": 480.59195, "b": 588.1324500000001, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "USA (2018).", "bbox": {"l": 151.51801, "t": 591.0216800000001, "r": 200.75787, "b": 599.09145, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "https://doi.org/10.1145/3219819.3219834", "bbox": {"l": 202.916, "t": 591.66727, "r": 386.45911, "b": 599.1362799999999, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": ",", "bbox": {"l": 386.45801, "t": 591.0216800000001, "r": 389.01703, "b": 599.09145, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "https://doi.org/10.", "bbox": {"l": 391.173, "t": 591.66727, "r": 480.59583, "b": 599.1362799999999, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "1145/3219819.3219834", "bbox": {"l": 151.51801, "t": 602.62627, "r": 245.63831, "b": 610.09528, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "16.", "bbox": {"l": 134.76401, "t": 612.95068, "r": 146.62019, "b": 621.02045, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "Wang, X.: Tabular Abstraction, Editing, and Formatting. Ph.D. thesis, CAN", "bbox": {"l": 151.25977, "t": 612.95068, "r": 480.59542999999996, "b": 621.02045, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "(1996), aAINN09397", "bbox": {"l": 151.51801, "t": 623.90968, "r": 234.43031, "b": 631.97945, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "17.", "bbox": {"l": 134.76401, "t": 634.87968, "r": 146.30539, "b": 642.9494500000001, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "Xue, W., Li, Q., Tao, D.: Res2tim: Reconstruct syntactic structures from table", "bbox": {"l": 150.82175, "t": 634.87968, "r": 480.58731000000006, "b": 642.9494500000001, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "images. In: 2019 International Conference on Document Analysis and Recognition", "bbox": {"l": 151.51801, "t": 645.8386800000001, "r": 480.59119, "b": 653.90845, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "(ICDAR). pp. 749-755. IEEE (2019)", "bbox": {"l": 151.51801, "t": 656.79768, "r": 299.30307, "b": 664.86745, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 13, "label": "page_header", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9163166880607605, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "page_header", "bbox": {"l": 471.37561, "t": 93.77099999999996, "r": 480.5894799999999, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9061064720153809, "cells": [{"id": 1, "text": "13", "bbox": {"l": 471.37561, "t": 93.77099999999996, "r": 480.5894799999999, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "list_item", "bbox": {"l": 139.371, "t": 119.67400999999995, "r": 480.59479, "b": 149.66168000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9677112698554993, "cells": [{"id": 2, "text": "5.", "bbox": {"l": 139.371, "t": 119.67400999999995, "r": 146.04857, "b": 127.74370999999985, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Kayal, P., Anand, M., Desai, H., Singh, M.: Tables to latex: structure and content", "bbox": {"l": 150.34157, "t": 119.67400999999995, "r": 480.58826, "b": 127.74370999999985, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "extraction from scientific tables. International Journal on Document Analysis and", "bbox": {"l": 151.51801, "t": 130.63300000000004, "r": 480.59479, "b": 138.70270000000005, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Recognition (IJDAR) pp. 1-10 (2022)", "bbox": {"l": 151.51801, "t": 141.59198000000004, "r": 304.04364, "b": 149.66168000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "list_item", "bbox": {"l": 139.371, "t": 152.56195000000002, "r": 480.59286000000003, "b": 193.50860999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.973045289516449, "cells": [{"id": 6, "text": "6.", "bbox": {"l": 139.371, "t": 152.56195000000002, "r": 145.93991, "b": 160.63165000000004, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Lee, E., Kwon, J., Yang, H., Park, J., Lee, S., Koo, H.I., Cho, N.I.: Table structure", "bbox": {"l": 150.16298, "t": 152.56195000000002, "r": 480.59015, "b": 160.63165000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "recognition based on grid shape graph. In: 2022 Asia-Pacific Signal and Information", "bbox": {"l": 151.51801, "t": 163.52094, "r": 480.5903, "b": 171.59064, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Processing Association Annual Summit and Conference (APSIPA ASC). pp. 1868-", "bbox": {"l": 151.51801, "t": 174.47992, "r": 480.59286000000003, "b": 182.54962, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "1873. IEEE (2022)", "bbox": {"l": 151.51801, "t": 185.4389, "r": 226.37399, "b": 193.50860999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "list_item", "bbox": {"l": 139.371, "t": 196.40886999999998, "r": 480.59012, "b": 215.43755999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9582491517066956, "cells": [{"id": 11, "text": "7.", "bbox": {"l": 139.371, "t": 196.40886999999998, "r": 146.31418, "b": 204.47857999999997, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Li, M., Cui, L., Huang, S., Wei, F., Zhou, M., Li, Z.: Tablebank: A benchmark", "bbox": {"l": 150.77789, "t": 196.40886999999998, "r": 480.59012, "b": 204.47857999999997, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "dataset for table detection and recognition (2019)", "bbox": {"l": 151.51801, "t": 207.36785999999995, "r": 352.01746, "b": 215.43755999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "list_item", "bbox": {"l": 139.371, "t": 218.33887000000004, "r": 480.59473, "b": 270.28839000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.967814564704895, "cells": [{"id": 14, "text": "8.", "bbox": {"l": 139.371, "t": 218.33887000000004, "r": 146.37106, "b": 226.40857000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Livathinos, N., Berrospi, C., Lysak, M., Kuropiatnyk, V., Nassar, A., Carvalho,", "bbox": {"l": 150.87132, "t": 218.33887000000004, "r": 480.58731000000006, "b": 226.40857000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "A., Dolfi, M., Auer, C., Dinkla, K., Staar, P.: Robust pdf document conversion", "bbox": {"l": 151.51801, "t": 229.29785000000004, "r": 480.59020999999996, "b": 237.36755000000005, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "using recurrent neural networks. Proceedings of the AAAI Conference on Artificial", "bbox": {"l": 151.51801, "t": 240.25684, "r": 480.59473, "b": 248.32654000000002, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Intelligence", "bbox": {"l": 151.51801, "t": 251.21582, "r": 197.08617, "b": 259.28552, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "35", "bbox": {"l": 199.40001, "t": 251.15301999999997, "r": 210.00726, "b": 259.07935, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "(17), 15137-15145 (May 2021),", "bbox": {"l": 210.007, "t": 251.21582, "r": 332.37683, "b": 259.28552, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "https://ojs.aaai.org/index.php/", "bbox": {"l": 334.69901, "t": 251.86139000000003, "r": 480.59039000000007, "b": 259.33038, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "AAAI/article/view/17777", "bbox": {"l": 151.51801, "t": 262.8194, "r": 259.75769, "b": 270.28839000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "list_item", "bbox": {"l": 139.371, "t": 273.14484000000004, "r": 480.59387000000004, "b": 303.13254, "coord_origin": "TOPLEFT"}, "confidence": 0.9557179808616638, "cells": [{"id": 23, "text": "9.", "bbox": {"l": 139.371, "t": 273.14484000000004, "r": 146.14218, "b": 281.21457, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "Nassar, A., Livathinos, N., Lysak, M., Staar, P.: Tableformer: Table structure un-", "bbox": {"l": 150.49533, "t": 273.14484000000004, "r": 480.5881999999999, "b": 281.21457, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "derstanding with transformers. In: Proceedings of the IEEE/CVF Conference on", "bbox": {"l": 151.51801, "t": 284.10379, "r": 480.59387000000004, "b": 292.17355, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "Computer Vision and Pattern Recognition (CVPR). pp. 4614-4623 (June 2022)", "bbox": {"l": 151.51801, "t": 295.06277, "r": 473.44308000000007, "b": 303.13254, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "list_item", "bbox": {"l": 134.76401, "t": 306.03277999999995, "r": 480.59372, "b": 368.94232, "coord_origin": "TOPLEFT"}, "confidence": 0.9639304876327515, "cells": [{"id": 27, "text": "10.", "bbox": {"l": 134.76401, "t": 306.03277999999995, "r": 146.49922, "b": 314.10254000000003, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Pfitzmann, B., Auer, C., Dolfi, M., Nassar, A.S., Staar, P.W.J.: Doclaynet: A", "bbox": {"l": 151.09138, "t": 306.03277999999995, "r": 480.58905, "b": 314.10254000000003, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "large human-annotated dataset for document-layout segmentation. In: Zhang, A.,", "bbox": {"l": 151.51801, "t": 316.99179, "r": 480.59015, "b": 325.06155, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Rangwala, H. (eds.) KDD \u201922: The 28th ACM SIGKDD Conference on Knowledge", "bbox": {"l": 151.51801, "t": 327.95078, "r": 480.59113, "b": 336.02054, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Discovery and Data Mining, Washington, DC, USA, August 14 - 18, 2022. pp.", "bbox": {"l": 151.51801, "t": 338.90976, "r": 480.59113, "b": 346.97952, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "3743-3751. ACM (2022).", "bbox": {"l": 151.51801, "t": 349.86874, "r": 251.14098999999996, "b": 357.93851, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "https://doi.org/10.1145/3534678.3539043", "bbox": {"l": 253.99001, "t": 350.5143100000001, "r": 437.53311, "b": 357.98333999999994, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": ",", "bbox": {"l": 437.53201, "t": 349.86874, "r": 440.09102999999993, "b": 357.93851, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "https://", "bbox": {"l": 442.94202000000007, "t": 350.5143100000001, "r": 480.59372, "b": 357.98333999999994, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "doi.org/10.1145/3534678.3539043", "bbox": {"l": 151.51801, "t": 361.47329999999994, "r": 297.40939, "b": 368.94232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "list_item", "bbox": {"l": 134.76401, "t": 371.79773, "r": 480.59296, "b": 412.74448, "coord_origin": "TOPLEFT"}, "confidence": 0.9752162098884583, "cells": [{"id": 37, "text": "11.", "bbox": {"l": 134.76401, "t": 371.79773, "r": 146.03854, "b": 379.86749, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "Prasad, D., Gadpal, A., Kapadni, K., Visave, M., Sultanpure, K.: Cascadetabnet:", "bbox": {"l": 150.4505, "t": 371.79773, "r": 480.58914000000004, "b": 379.86749, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "An approach for end to end table detection and structure recognition from image-", "bbox": {"l": 151.51801, "t": 382.7567399999999, "r": 480.59296, "b": 390.82651, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "based documents. In: Proceedings of the IEEE/CVF conference on computer vision", "bbox": {"l": 151.51801, "t": 393.71573, "r": 480.59293, "b": 401.78549, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "and pattern recognition workshops. pp. 572-573 (2020)", "bbox": {"l": 151.51801, "t": 404.67471, "r": 373.82727, "b": 412.74448, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "list_item", "bbox": {"l": 134.76401, "t": 415.64471, "r": 480.59469999999993, "b": 456.59146, "coord_origin": "TOPLEFT"}, "confidence": 0.9707236886024475, "cells": [{"id": 42, "text": "12.", "bbox": {"l": 134.76401, "t": 415.64471, "r": 145.91106, "b": 423.71448000000004, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Schreiber, S., Agne, S., Wolf, I., Dengel, A., Ahmed, S.: Deepdesrt: Deep learning", "bbox": {"l": 150.27309, "t": 415.64471, "r": 480.5874, "b": 423.71448000000004, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "for detection and structure recognition of tables in document images. In: 2017 14th", "bbox": {"l": 151.51801, "t": 426.60373, "r": 480.59469999999993, "b": 434.67349, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "IAPR international conference on document analysis and recognition (ICDAR).", "bbox": {"l": 151.51801, "t": 437.5627099999999, "r": 480.58844, "b": 445.63248, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "vol. 1, pp. 1162-1167. IEEE (2017)", "bbox": {"l": 151.51801, "t": 448.5217, "r": 292.91455, "b": 456.59146, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "list_item", "bbox": {"l": 134.76401, "t": 459.4917, "r": 480.59372, "b": 500.48328, "coord_origin": "TOPLEFT"}, "confidence": 0.9658119678497314, "cells": [{"id": 47, "text": "13.", "bbox": {"l": 134.76401, "t": 459.4917, "r": 145.7785, "b": 467.56146, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Siddiqui, S.A., Fateh, I.A., Rizvi, S.T.R., Dengel, A., Ahmed, S.: Deeptabstr: Deep", "bbox": {"l": 150.08871, "t": 459.4917, "r": 480.59006, "b": 467.56146, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "learning based table structure recognition. In: 2019 International Conference on", "bbox": {"l": 151.51801, "t": 470.45071, "r": 480.59116, "b": 478.52048, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Document Analysis and Recognition (ICDAR). pp. 1403-1409 (2019).", "bbox": {"l": 151.51801, "t": 481.4097, "r": 439.05963, "b": 489.47946, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "https://", "bbox": {"l": 442.94202000000007, "t": 482.05527, "r": 480.59372, "b": 489.52429, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "doi.org/10.1109/ICDAR.2019.00226", "bbox": {"l": 151.51801, "t": 493.01425, "r": 302.11584, "b": 500.48328, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "list_item", "bbox": {"l": 134.76401, "t": 503.33868, "r": 480.59286000000003, "b": 544.28545, "coord_origin": "TOPLEFT"}, "confidence": 0.972225546836853, "cells": [{"id": 53, "text": "14.", "bbox": {"l": 134.76401, "t": 503.33868, "r": 146.15501, "b": 511.40845, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "Smock, B., Pesala, R., Abraham, R.: PubTables-1M: Towards comprehensive ta-", "bbox": {"l": 150.61252, "t": 503.33868, "r": 480.59088, "b": 511.40845, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "ble extraction from unstructured documents. In: Proceedings of the IEEE/CVF", "bbox": {"l": 151.51801, "t": 514.2977000000001, "r": 480.59286000000003, "b": 522.3674599999999, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Conference on Computer Vision and Pattern Recognition (CVPR). pp. 4634-4642", "bbox": {"l": 151.51801, "t": 525.25668, "r": 480.58838000000003, "b": 533.32645, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "(June 2022)", "bbox": {"l": 151.51801, "t": 536.21568, "r": 199.24704, "b": 544.28545, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "list_item", "bbox": {"l": 134.76401, "t": 547.18568, "r": 480.59583, "b": 610.09528, "coord_origin": "TOPLEFT"}, "confidence": 0.9674034714698792, "cells": [{"id": 58, "text": "15.", "bbox": {"l": 134.76401, "t": 547.18568, "r": 146.16588, "b": 555.25545, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Staar, P.W.J., Dolfi, M., Auer, C., Bekas, C.: Corpus conversion service: A ma-", "bbox": {"l": 150.62764, "t": 547.18568, "r": 480.58734000000004, "b": 555.25545, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "chine learning platform to ingest documents at scale. In: Proceedings of the 24th", "bbox": {"l": 151.51801, "t": 558.14468, "r": 480.58838000000003, "b": 566.2144499999999, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "ACM SIGKDD International Conference on Knowledge Discovery & Data Min-", "bbox": {"l": 151.51801, "t": 569.1036799999999, "r": 480.59109, "b": 577.17345, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "ing. pp. 774-782. KDD \u201918, Association for Computing Machinery, New York, NY,", "bbox": {"l": 151.51801, "t": 580.06268, "r": 480.59195, "b": 588.1324500000001, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "USA (2018).", "bbox": {"l": 151.51801, "t": 591.0216800000001, "r": 200.75787, "b": 599.09145, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "https://doi.org/10.1145/3219819.3219834", "bbox": {"l": 202.916, "t": 591.66727, "r": 386.45911, "b": 599.1362799999999, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": ",", "bbox": {"l": 386.45801, "t": 591.0216800000001, "r": 389.01703, "b": 599.09145, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "https://doi.org/10.", "bbox": {"l": 391.173, "t": 591.66727, "r": 480.59583, "b": 599.1362799999999, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "1145/3219819.3219834", "bbox": {"l": 151.51801, "t": 602.62627, "r": 245.63831, "b": 610.09528, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "list_item", "bbox": {"l": 134.76401, "t": 612.95068, "r": 480.59542999999996, "b": 631.97945, "coord_origin": "TOPLEFT"}, "confidence": 0.9416429996490479, "cells": [{"id": 68, "text": "16.", "bbox": {"l": 134.76401, "t": 612.95068, "r": 146.62019, "b": 621.02045, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "Wang, X.: Tabular Abstraction, Editing, and Formatting. Ph.D. thesis, CAN", "bbox": {"l": 151.25977, "t": 612.95068, "r": 480.59542999999996, "b": 621.02045, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "(1996), aAINN09397", "bbox": {"l": 151.51801, "t": 623.90968, "r": 234.43031, "b": 631.97945, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "list_item", "bbox": {"l": 134.76401, "t": 634.87968, "r": 480.59119, "b": 664.86745, "coord_origin": "TOPLEFT"}, "confidence": 0.9646382331848145, "cells": [{"id": 71, "text": "17.", "bbox": {"l": 134.76401, "t": 634.87968, "r": 146.30539, "b": 642.9494500000001, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "Xue, W., Li, Q., Tao, D.: Res2tim: Reconstruct syntactic structures from table", "bbox": {"l": 150.82175, "t": 634.87968, "r": 480.58731000000006, "b": 642.9494500000001, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "images. In: 2019 International Conference on Document Analysis and Recognition", "bbox": {"l": 151.51801, "t": 645.8386800000001, "r": 480.59119, "b": 653.90845, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "(ICDAR). pp. 749-755. IEEE (2019)", "bbox": {"l": 151.51801, "t": 656.79768, "r": 299.30307, "b": 664.86745, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_header", "id": 13, "page_no": 12, "cluster": {"id": 13, "label": "page_header", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9163166880607605, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Optimized Table Tokenization for Table Structure Recognition"}, {"label": "page_header", "id": 14, "page_no": 12, "cluster": {"id": 14, "label": "page_header", "bbox": {"l": 471.37561, "t": 93.77099999999996, "r": 480.5894799999999, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9061064720153809, "cells": [{"id": 1, "text": "13", "bbox": {"l": 471.37561, "t": 93.77099999999996, "r": 480.5894799999999, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "13"}, {"label": "list_item", "id": 5, "page_no": 12, "cluster": {"id": 5, "label": "list_item", "bbox": {"l": 139.371, "t": 119.67400999999995, "r": 480.59479, "b": 149.66168000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9677112698554993, "cells": [{"id": 2, "text": "5.", "bbox": {"l": 139.371, "t": 119.67400999999995, "r": 146.04857, "b": 127.74370999999985, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Kayal, P., Anand, M., Desai, H., Singh, M.: Tables to latex: structure and content", "bbox": {"l": 150.34157, "t": 119.67400999999995, "r": 480.58826, "b": 127.74370999999985, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "extraction from scientific tables. International Journal on Document Analysis and", "bbox": {"l": 151.51801, "t": 130.63300000000004, "r": 480.59479, "b": 138.70270000000005, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Recognition (IJDAR) pp. 1-10 (2022)", "bbox": {"l": 151.51801, "t": 141.59198000000004, "r": 304.04364, "b": 149.66168000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5. Kayal, P., Anand, M., Desai, H., Singh, M.: Tables to latex: structure and content extraction from scientific tables. International Journal on Document Analysis and Recognition (IJDAR) pp. 1-10 (2022)"}, {"label": "list_item", "id": 1, "page_no": 12, "cluster": {"id": 1, "label": "list_item", "bbox": {"l": 139.371, "t": 152.56195000000002, "r": 480.59286000000003, "b": 193.50860999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.973045289516449, "cells": [{"id": 6, "text": "6.", "bbox": {"l": 139.371, "t": 152.56195000000002, "r": 145.93991, "b": 160.63165000000004, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Lee, E., Kwon, J., Yang, H., Park, J., Lee, S., Koo, H.I., Cho, N.I.: Table structure", "bbox": {"l": 150.16298, "t": 152.56195000000002, "r": 480.59015, "b": 160.63165000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "recognition based on grid shape graph. In: 2022 Asia-Pacific Signal and Information", "bbox": {"l": 151.51801, "t": 163.52094, "r": 480.5903, "b": 171.59064, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Processing Association Annual Summit and Conference (APSIPA ASC). pp. 1868-", "bbox": {"l": 151.51801, "t": 174.47992, "r": 480.59286000000003, "b": 182.54962, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "1873. IEEE (2022)", "bbox": {"l": 151.51801, "t": 185.4389, "r": 226.37399, "b": 193.50860999999998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "6. Lee, E., Kwon, J., Yang, H., Park, J., Lee, S., Koo, H.I., Cho, N.I.: Table structure recognition based on grid shape graph. In: 2022 Asia-Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC). pp. 18681873. IEEE (2022)"}, {"label": "list_item", "id": 10, "page_no": 12, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 139.371, "t": 196.40886999999998, "r": 480.59012, "b": 215.43755999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9582491517066956, "cells": [{"id": 11, "text": "7.", "bbox": {"l": 139.371, "t": 196.40886999999998, "r": 146.31418, "b": 204.47857999999997, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Li, M., Cui, L., Huang, S., Wei, F., Zhou, M., Li, Z.: Tablebank: A benchmark", "bbox": {"l": 150.77789, "t": 196.40886999999998, "r": 480.59012, "b": 204.47857999999997, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "dataset for table detection and recognition (2019)", "bbox": {"l": 151.51801, "t": 207.36785999999995, "r": 352.01746, "b": 215.43755999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "7. Li, M., Cui, L., Huang, S., Wei, F., Zhou, M., Li, Z.: Tablebank: A benchmark dataset for table detection and recognition (2019)"}, {"label": "list_item", "id": 4, "page_no": 12, "cluster": {"id": 4, "label": "list_item", "bbox": {"l": 139.371, "t": 218.33887000000004, "r": 480.59473, "b": 270.28839000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.967814564704895, "cells": [{"id": 14, "text": "8.", "bbox": {"l": 139.371, "t": 218.33887000000004, "r": 146.37106, "b": 226.40857000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Livathinos, N., Berrospi, C., Lysak, M., Kuropiatnyk, V., Nassar, A., Carvalho,", "bbox": {"l": 150.87132, "t": 218.33887000000004, "r": 480.58731000000006, "b": 226.40857000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "A., Dolfi, M., Auer, C., Dinkla, K., Staar, P.: Robust pdf document conversion", "bbox": {"l": 151.51801, "t": 229.29785000000004, "r": 480.59020999999996, "b": 237.36755000000005, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "using recurrent neural networks. Proceedings of the AAAI Conference on Artificial", "bbox": {"l": 151.51801, "t": 240.25684, "r": 480.59473, "b": 248.32654000000002, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Intelligence", "bbox": {"l": 151.51801, "t": 251.21582, "r": 197.08617, "b": 259.28552, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "35", "bbox": {"l": 199.40001, "t": 251.15301999999997, "r": 210.00726, "b": 259.07935, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "(17), 15137-15145 (May 2021),", "bbox": {"l": 210.007, "t": 251.21582, "r": 332.37683, "b": 259.28552, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "https://ojs.aaai.org/index.php/", "bbox": {"l": 334.69901, "t": 251.86139000000003, "r": 480.59039000000007, "b": 259.33038, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "AAAI/article/view/17777", "bbox": {"l": 151.51801, "t": 262.8194, "r": 259.75769, "b": 270.28839000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "8. Livathinos, N., Berrospi, C., Lysak, M., Kuropiatnyk, V., Nassar, A., Carvalho, A., Dolfi, M., Auer, C., Dinkla, K., Staar, P.: Robust pdf document conversion using recurrent neural networks. Proceedings of the AAAI Conference on Artificial Intelligence 35 (17), 15137-15145 (May 2021), https://ojs.aaai.org/index.php/ AAAI/article/view/17777"}, {"label": "list_item", "id": 11, "page_no": 12, "cluster": {"id": 11, "label": "list_item", "bbox": {"l": 139.371, "t": 273.14484000000004, "r": 480.59387000000004, "b": 303.13254, "coord_origin": "TOPLEFT"}, "confidence": 0.9557179808616638, "cells": [{"id": 23, "text": "9.", "bbox": {"l": 139.371, "t": 273.14484000000004, "r": 146.14218, "b": 281.21457, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "Nassar, A., Livathinos, N., Lysak, M., Staar, P.: Tableformer: Table structure un-", "bbox": {"l": 150.49533, "t": 273.14484000000004, "r": 480.5881999999999, "b": 281.21457, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "derstanding with transformers. In: Proceedings of the IEEE/CVF Conference on", "bbox": {"l": 151.51801, "t": 284.10379, "r": 480.59387000000004, "b": 292.17355, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "Computer Vision and Pattern Recognition (CVPR). pp. 4614-4623 (June 2022)", "bbox": {"l": 151.51801, "t": 295.06277, "r": 473.44308000000007, "b": 303.13254, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "9. Nassar, A., Livathinos, N., Lysak, M., Staar, P.: Tableformer: Table structure understanding with transformers. In: Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). pp. 4614-4623 (June 2022)"}, {"label": "list_item", "id": 9, "page_no": 12, "cluster": {"id": 9, "label": "list_item", "bbox": {"l": 134.76401, "t": 306.03277999999995, "r": 480.59372, "b": 368.94232, "coord_origin": "TOPLEFT"}, "confidence": 0.9639304876327515, "cells": [{"id": 27, "text": "10.", "bbox": {"l": 134.76401, "t": 306.03277999999995, "r": 146.49922, "b": 314.10254000000003, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Pfitzmann, B., Auer, C., Dolfi, M., Nassar, A.S., Staar, P.W.J.: Doclaynet: A", "bbox": {"l": 151.09138, "t": 306.03277999999995, "r": 480.58905, "b": 314.10254000000003, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "large human-annotated dataset for document-layout segmentation. In: Zhang, A.,", "bbox": {"l": 151.51801, "t": 316.99179, "r": 480.59015, "b": 325.06155, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Rangwala, H. (eds.) KDD \u201922: The 28th ACM SIGKDD Conference on Knowledge", "bbox": {"l": 151.51801, "t": 327.95078, "r": 480.59113, "b": 336.02054, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Discovery and Data Mining, Washington, DC, USA, August 14 - 18, 2022. pp.", "bbox": {"l": 151.51801, "t": 338.90976, "r": 480.59113, "b": 346.97952, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "3743-3751. ACM (2022).", "bbox": {"l": 151.51801, "t": 349.86874, "r": 251.14098999999996, "b": 357.93851, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "https://doi.org/10.1145/3534678.3539043", "bbox": {"l": 253.99001, "t": 350.5143100000001, "r": 437.53311, "b": 357.98333999999994, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": ",", "bbox": {"l": 437.53201, "t": 349.86874, "r": 440.09102999999993, "b": 357.93851, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "https://", "bbox": {"l": 442.94202000000007, "t": 350.5143100000001, "r": 480.59372, "b": 357.98333999999994, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "doi.org/10.1145/3534678.3539043", "bbox": {"l": 151.51801, "t": 361.47329999999994, "r": 297.40939, "b": 368.94232, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "10. Pfitzmann, B., Auer, C., Dolfi, M., Nassar, A.S., Staar, P.W.J.: Doclaynet: A large human-annotated dataset for document-layout segmentation. In: Zhang, A., Rangwala, H. (eds.) KDD \u201922: The 28th ACM SIGKDD Conference on Knowledge Discovery and Data Mining, Washington, DC, USA, August 14 - 18, 2022. pp. 3743-3751. ACM (2022). https://doi.org/10.1145/3534678.3539043 , https:// doi.org/10.1145/3534678.3539043"}, {"label": "list_item", "id": 0, "page_no": 12, "cluster": {"id": 0, "label": "list_item", "bbox": {"l": 134.76401, "t": 371.79773, "r": 480.59296, "b": 412.74448, "coord_origin": "TOPLEFT"}, "confidence": 0.9752162098884583, "cells": [{"id": 37, "text": "11.", "bbox": {"l": 134.76401, "t": 371.79773, "r": 146.03854, "b": 379.86749, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "Prasad, D., Gadpal, A., Kapadni, K., Visave, M., Sultanpure, K.: Cascadetabnet:", "bbox": {"l": 150.4505, "t": 371.79773, "r": 480.58914000000004, "b": 379.86749, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "An approach for end to end table detection and structure recognition from image-", "bbox": {"l": 151.51801, "t": 382.7567399999999, "r": 480.59296, "b": 390.82651, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "based documents. In: Proceedings of the IEEE/CVF conference on computer vision", "bbox": {"l": 151.51801, "t": 393.71573, "r": 480.59293, "b": 401.78549, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "and pattern recognition workshops. pp. 572-573 (2020)", "bbox": {"l": 151.51801, "t": 404.67471, "r": 373.82727, "b": 412.74448, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "11. Prasad, D., Gadpal, A., Kapadni, K., Visave, M., Sultanpure, K.: Cascadetabnet: An approach for end to end table detection and structure recognition from imagebased documents. In: Proceedings of the IEEE/CVF conference on computer vision and pattern recognition workshops. pp. 572-573 (2020)"}, {"label": "list_item", "id": 3, "page_no": 12, "cluster": {"id": 3, "label": "list_item", "bbox": {"l": 134.76401, "t": 415.64471, "r": 480.59469999999993, "b": 456.59146, "coord_origin": "TOPLEFT"}, "confidence": 0.9707236886024475, "cells": [{"id": 42, "text": "12.", "bbox": {"l": 134.76401, "t": 415.64471, "r": 145.91106, "b": 423.71448000000004, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Schreiber, S., Agne, S., Wolf, I., Dengel, A., Ahmed, S.: Deepdesrt: Deep learning", "bbox": {"l": 150.27309, "t": 415.64471, "r": 480.5874, "b": 423.71448000000004, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "for detection and structure recognition of tables in document images. In: 2017 14th", "bbox": {"l": 151.51801, "t": 426.60373, "r": 480.59469999999993, "b": 434.67349, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "IAPR international conference on document analysis and recognition (ICDAR).", "bbox": {"l": 151.51801, "t": 437.5627099999999, "r": 480.58844, "b": 445.63248, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "vol. 1, pp. 1162-1167. IEEE (2017)", "bbox": {"l": 151.51801, "t": 448.5217, "r": 292.91455, "b": 456.59146, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "12. Schreiber, S., Agne, S., Wolf, I., Dengel, A., Ahmed, S.: Deepdesrt: Deep learning for detection and structure recognition of tables in document images. In: 2017 14th IAPR international conference on document analysis and recognition (ICDAR). vol. 1, pp. 1162-1167. IEEE (2017)"}, {"label": "list_item", "id": 7, "page_no": 12, "cluster": {"id": 7, "label": "list_item", "bbox": {"l": 134.76401, "t": 459.4917, "r": 480.59372, "b": 500.48328, "coord_origin": "TOPLEFT"}, "confidence": 0.9658119678497314, "cells": [{"id": 47, "text": "13.", "bbox": {"l": 134.76401, "t": 459.4917, "r": 145.7785, "b": 467.56146, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Siddiqui, S.A., Fateh, I.A., Rizvi, S.T.R., Dengel, A., Ahmed, S.: Deeptabstr: Deep", "bbox": {"l": 150.08871, "t": 459.4917, "r": 480.59006, "b": 467.56146, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "learning based table structure recognition. In: 2019 International Conference on", "bbox": {"l": 151.51801, "t": 470.45071, "r": 480.59116, "b": 478.52048, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Document Analysis and Recognition (ICDAR). pp. 1403-1409 (2019).", "bbox": {"l": 151.51801, "t": 481.4097, "r": 439.05963, "b": 489.47946, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "https://", "bbox": {"l": 442.94202000000007, "t": 482.05527, "r": 480.59372, "b": 489.52429, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "doi.org/10.1109/ICDAR.2019.00226", "bbox": {"l": 151.51801, "t": 493.01425, "r": 302.11584, "b": 500.48328, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "13. Siddiqui, S.A., Fateh, I.A., Rizvi, S.T.R., Dengel, A., Ahmed, S.: Deeptabstr: Deep learning based table structure recognition. In: 2019 International Conference on Document Analysis and Recognition (ICDAR). pp. 1403-1409 (2019). https:// doi.org/10.1109/ICDAR.2019.00226"}, {"label": "list_item", "id": 2, "page_no": 12, "cluster": {"id": 2, "label": "list_item", "bbox": {"l": 134.76401, "t": 503.33868, "r": 480.59286000000003, "b": 544.28545, "coord_origin": "TOPLEFT"}, "confidence": 0.972225546836853, "cells": [{"id": 53, "text": "14.", "bbox": {"l": 134.76401, "t": 503.33868, "r": 146.15501, "b": 511.40845, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "Smock, B., Pesala, R., Abraham, R.: PubTables-1M: Towards comprehensive ta-", "bbox": {"l": 150.61252, "t": 503.33868, "r": 480.59088, "b": 511.40845, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "ble extraction from unstructured documents. In: Proceedings of the IEEE/CVF", "bbox": {"l": 151.51801, "t": 514.2977000000001, "r": 480.59286000000003, "b": 522.3674599999999, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Conference on Computer Vision and Pattern Recognition (CVPR). pp. 4634-4642", "bbox": {"l": 151.51801, "t": 525.25668, "r": 480.58838000000003, "b": 533.32645, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "(June 2022)", "bbox": {"l": 151.51801, "t": 536.21568, "r": 199.24704, "b": 544.28545, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "14. Smock, B., Pesala, R., Abraham, R.: PubTables-1M: Towards comprehensive table extraction from unstructured documents. In: Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). pp. 4634-4642 (June 2022)"}, {"label": "list_item", "id": 6, "page_no": 12, "cluster": {"id": 6, "label": "list_item", "bbox": {"l": 134.76401, "t": 547.18568, "r": 480.59583, "b": 610.09528, "coord_origin": "TOPLEFT"}, "confidence": 0.9674034714698792, "cells": [{"id": 58, "text": "15.", "bbox": {"l": 134.76401, "t": 547.18568, "r": 146.16588, "b": 555.25545, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Staar, P.W.J., Dolfi, M., Auer, C., Bekas, C.: Corpus conversion service: A ma-", "bbox": {"l": 150.62764, "t": 547.18568, "r": 480.58734000000004, "b": 555.25545, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "chine learning platform to ingest documents at scale. In: Proceedings of the 24th", "bbox": {"l": 151.51801, "t": 558.14468, "r": 480.58838000000003, "b": 566.2144499999999, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "ACM SIGKDD International Conference on Knowledge Discovery & Data Min-", "bbox": {"l": 151.51801, "t": 569.1036799999999, "r": 480.59109, "b": 577.17345, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "ing. pp. 774-782. KDD \u201918, Association for Computing Machinery, New York, NY,", "bbox": {"l": 151.51801, "t": 580.06268, "r": 480.59195, "b": 588.1324500000001, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "USA (2018).", "bbox": {"l": 151.51801, "t": 591.0216800000001, "r": 200.75787, "b": 599.09145, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "https://doi.org/10.1145/3219819.3219834", "bbox": {"l": 202.916, "t": 591.66727, "r": 386.45911, "b": 599.1362799999999, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": ",", "bbox": {"l": 386.45801, "t": 591.0216800000001, "r": 389.01703, "b": 599.09145, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "https://doi.org/10.", "bbox": {"l": 391.173, "t": 591.66727, "r": 480.59583, "b": 599.1362799999999, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "1145/3219819.3219834", "bbox": {"l": 151.51801, "t": 602.62627, "r": 245.63831, "b": 610.09528, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "15. Staar, P.W.J., Dolfi, M., Auer, C., Bekas, C.: Corpus conversion service: A machine learning platform to ingest documents at scale. In: Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining. pp. 774-782. KDD \u201918, Association for Computing Machinery, New York, NY, USA (2018). https://doi.org/10.1145/3219819.3219834 , https://doi.org/10. 1145/3219819.3219834"}, {"label": "list_item", "id": 12, "page_no": 12, "cluster": {"id": 12, "label": "list_item", "bbox": {"l": 134.76401, "t": 612.95068, "r": 480.59542999999996, "b": 631.97945, "coord_origin": "TOPLEFT"}, "confidence": 0.9416429996490479, "cells": [{"id": 68, "text": "16.", "bbox": {"l": 134.76401, "t": 612.95068, "r": 146.62019, "b": 621.02045, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "Wang, X.: Tabular Abstraction, Editing, and Formatting. Ph.D. thesis, CAN", "bbox": {"l": 151.25977, "t": 612.95068, "r": 480.59542999999996, "b": 621.02045, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "(1996), aAINN09397", "bbox": {"l": 151.51801, "t": 623.90968, "r": 234.43031, "b": 631.97945, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "16. Wang, X.: Tabular Abstraction, Editing, and Formatting. Ph.D. thesis, CAN (1996), aAINN09397"}, {"label": "list_item", "id": 8, "page_no": 12, "cluster": {"id": 8, "label": "list_item", "bbox": {"l": 134.76401, "t": 634.87968, "r": 480.59119, "b": 664.86745, "coord_origin": "TOPLEFT"}, "confidence": 0.9646382331848145, "cells": [{"id": 71, "text": "17.", "bbox": {"l": 134.76401, "t": 634.87968, "r": 146.30539, "b": 642.9494500000001, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "Xue, W., Li, Q., Tao, D.: Res2tim: Reconstruct syntactic structures from table", "bbox": {"l": 150.82175, "t": 634.87968, "r": 480.58731000000006, "b": 642.9494500000001, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "images. In: 2019 International Conference on Document Analysis and Recognition", "bbox": {"l": 151.51801, "t": 645.8386800000001, "r": 480.59119, "b": 653.90845, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "(ICDAR). pp. 749-755. IEEE (2019)", "bbox": {"l": 151.51801, "t": 656.79768, "r": 299.30307, "b": 664.86745, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "17. Xue, W., Li, Q., Tao, D.: Res2tim: Reconstruct syntactic structures from table images. In: 2019 International Conference on Document Analysis and Recognition (ICDAR). pp. 749-755. IEEE (2019)"}], "body": [{"label": "list_item", "id": 5, "page_no": 12, "cluster": {"id": 5, "label": "list_item", "bbox": {"l": 139.371, "t": 119.67400999999995, "r": 480.59479, "b": 149.66168000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9677112698554993, "cells": [{"id": 2, "text": "5.", "bbox": {"l": 139.371, "t": 119.67400999999995, "r": 146.04857, "b": 127.74370999999985, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Kayal, P., Anand, M., Desai, H., Singh, M.: Tables to latex: structure and content", "bbox": {"l": 150.34157, "t": 119.67400999999995, "r": 480.58826, "b": 127.74370999999985, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "extraction from scientific tables. International Journal on Document Analysis and", "bbox": {"l": 151.51801, "t": 130.63300000000004, "r": 480.59479, "b": 138.70270000000005, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Recognition (IJDAR) pp. 1-10 (2022)", "bbox": {"l": 151.51801, "t": 141.59198000000004, "r": 304.04364, "b": 149.66168000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5. Kayal, P., Anand, M., Desai, H., Singh, M.: Tables to latex: structure and content extraction from scientific tables. International Journal on Document Analysis and Recognition (IJDAR) pp. 1-10 (2022)"}, {"label": "list_item", "id": 1, "page_no": 12, "cluster": {"id": 1, "label": "list_item", "bbox": {"l": 139.371, "t": 152.56195000000002, "r": 480.59286000000003, "b": 193.50860999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.973045289516449, "cells": [{"id": 6, "text": "6.", "bbox": {"l": 139.371, "t": 152.56195000000002, "r": 145.93991, "b": 160.63165000000004, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Lee, E., Kwon, J., Yang, H., Park, J., Lee, S., Koo, H.I., Cho, N.I.: Table structure", "bbox": {"l": 150.16298, "t": 152.56195000000002, "r": 480.59015, "b": 160.63165000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "recognition based on grid shape graph. In: 2022 Asia-Pacific Signal and Information", "bbox": {"l": 151.51801, "t": 163.52094, "r": 480.5903, "b": 171.59064, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Processing Association Annual Summit and Conference (APSIPA ASC). pp. 1868-", "bbox": {"l": 151.51801, "t": 174.47992, "r": 480.59286000000003, "b": 182.54962, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "1873. IEEE (2022)", "bbox": {"l": 151.51801, "t": 185.4389, "r": 226.37399, "b": 193.50860999999998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "6. Lee, E., Kwon, J., Yang, H., Park, J., Lee, S., Koo, H.I., Cho, N.I.: Table structure recognition based on grid shape graph. In: 2022 Asia-Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC). pp. 18681873. IEEE (2022)"}, {"label": "list_item", "id": 10, "page_no": 12, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 139.371, "t": 196.40886999999998, "r": 480.59012, "b": 215.43755999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9582491517066956, "cells": [{"id": 11, "text": "7.", "bbox": {"l": 139.371, "t": 196.40886999999998, "r": 146.31418, "b": 204.47857999999997, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Li, M., Cui, L., Huang, S., Wei, F., Zhou, M., Li, Z.: Tablebank: A benchmark", "bbox": {"l": 150.77789, "t": 196.40886999999998, "r": 480.59012, "b": 204.47857999999997, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "dataset for table detection and recognition (2019)", "bbox": {"l": 151.51801, "t": 207.36785999999995, "r": 352.01746, "b": 215.43755999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "7. Li, M., Cui, L., Huang, S., Wei, F., Zhou, M., Li, Z.: Tablebank: A benchmark dataset for table detection and recognition (2019)"}, {"label": "list_item", "id": 4, "page_no": 12, "cluster": {"id": 4, "label": "list_item", "bbox": {"l": 139.371, "t": 218.33887000000004, "r": 480.59473, "b": 270.28839000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.967814564704895, "cells": [{"id": 14, "text": "8.", "bbox": {"l": 139.371, "t": 218.33887000000004, "r": 146.37106, "b": 226.40857000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Livathinos, N., Berrospi, C., Lysak, M., Kuropiatnyk, V., Nassar, A., Carvalho,", "bbox": {"l": 150.87132, "t": 218.33887000000004, "r": 480.58731000000006, "b": 226.40857000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "A., Dolfi, M., Auer, C., Dinkla, K., Staar, P.: Robust pdf document conversion", "bbox": {"l": 151.51801, "t": 229.29785000000004, "r": 480.59020999999996, "b": 237.36755000000005, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "using recurrent neural networks. Proceedings of the AAAI Conference on Artificial", "bbox": {"l": 151.51801, "t": 240.25684, "r": 480.59473, "b": 248.32654000000002, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Intelligence", "bbox": {"l": 151.51801, "t": 251.21582, "r": 197.08617, "b": 259.28552, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "35", "bbox": {"l": 199.40001, "t": 251.15301999999997, "r": 210.00726, "b": 259.07935, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "(17), 15137-15145 (May 2021),", "bbox": {"l": 210.007, "t": 251.21582, "r": 332.37683, "b": 259.28552, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "https://ojs.aaai.org/index.php/", "bbox": {"l": 334.69901, "t": 251.86139000000003, "r": 480.59039000000007, "b": 259.33038, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "AAAI/article/view/17777", "bbox": {"l": 151.51801, "t": 262.8194, "r": 259.75769, "b": 270.28839000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "8. Livathinos, N., Berrospi, C., Lysak, M., Kuropiatnyk, V., Nassar, A., Carvalho, A., Dolfi, M., Auer, C., Dinkla, K., Staar, P.: Robust pdf document conversion using recurrent neural networks. Proceedings of the AAAI Conference on Artificial Intelligence 35 (17), 15137-15145 (May 2021), https://ojs.aaai.org/index.php/ AAAI/article/view/17777"}, {"label": "list_item", "id": 11, "page_no": 12, "cluster": {"id": 11, "label": "list_item", "bbox": {"l": 139.371, "t": 273.14484000000004, "r": 480.59387000000004, "b": 303.13254, "coord_origin": "TOPLEFT"}, "confidence": 0.9557179808616638, "cells": [{"id": 23, "text": "9.", "bbox": {"l": 139.371, "t": 273.14484000000004, "r": 146.14218, "b": 281.21457, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "Nassar, A., Livathinos, N., Lysak, M., Staar, P.: Tableformer: Table structure un-", "bbox": {"l": 150.49533, "t": 273.14484000000004, "r": 480.5881999999999, "b": 281.21457, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "derstanding with transformers. In: Proceedings of the IEEE/CVF Conference on", "bbox": {"l": 151.51801, "t": 284.10379, "r": 480.59387000000004, "b": 292.17355, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "Computer Vision and Pattern Recognition (CVPR). pp. 4614-4623 (June 2022)", "bbox": {"l": 151.51801, "t": 295.06277, "r": 473.44308000000007, "b": 303.13254, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "9. Nassar, A., Livathinos, N., Lysak, M., Staar, P.: Tableformer: Table structure understanding with transformers. In: Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). pp. 4614-4623 (June 2022)"}, {"label": "list_item", "id": 9, "page_no": 12, "cluster": {"id": 9, "label": "list_item", "bbox": {"l": 134.76401, "t": 306.03277999999995, "r": 480.59372, "b": 368.94232, "coord_origin": "TOPLEFT"}, "confidence": 0.9639304876327515, "cells": [{"id": 27, "text": "10.", "bbox": {"l": 134.76401, "t": 306.03277999999995, "r": 146.49922, "b": 314.10254000000003, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Pfitzmann, B., Auer, C., Dolfi, M., Nassar, A.S., Staar, P.W.J.: Doclaynet: A", "bbox": {"l": 151.09138, "t": 306.03277999999995, "r": 480.58905, "b": 314.10254000000003, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "large human-annotated dataset for document-layout segmentation. In: Zhang, A.,", "bbox": {"l": 151.51801, "t": 316.99179, "r": 480.59015, "b": 325.06155, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Rangwala, H. (eds.) KDD \u201922: The 28th ACM SIGKDD Conference on Knowledge", "bbox": {"l": 151.51801, "t": 327.95078, "r": 480.59113, "b": 336.02054, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Discovery and Data Mining, Washington, DC, USA, August 14 - 18, 2022. pp.", "bbox": {"l": 151.51801, "t": 338.90976, "r": 480.59113, "b": 346.97952, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "3743-3751. ACM (2022).", "bbox": {"l": 151.51801, "t": 349.86874, "r": 251.14098999999996, "b": 357.93851, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "https://doi.org/10.1145/3534678.3539043", "bbox": {"l": 253.99001, "t": 350.5143100000001, "r": 437.53311, "b": 357.98333999999994, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": ",", "bbox": {"l": 437.53201, "t": 349.86874, "r": 440.09102999999993, "b": 357.93851, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "https://", "bbox": {"l": 442.94202000000007, "t": 350.5143100000001, "r": 480.59372, "b": 357.98333999999994, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "doi.org/10.1145/3534678.3539043", "bbox": {"l": 151.51801, "t": 361.47329999999994, "r": 297.40939, "b": 368.94232, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "10. Pfitzmann, B., Auer, C., Dolfi, M., Nassar, A.S., Staar, P.W.J.: Doclaynet: A large human-annotated dataset for document-layout segmentation. In: Zhang, A., Rangwala, H. (eds.) KDD \u201922: The 28th ACM SIGKDD Conference on Knowledge Discovery and Data Mining, Washington, DC, USA, August 14 - 18, 2022. pp. 3743-3751. ACM (2022). https://doi.org/10.1145/3534678.3539043 , https:// doi.org/10.1145/3534678.3539043"}, {"label": "list_item", "id": 0, "page_no": 12, "cluster": {"id": 0, "label": "list_item", "bbox": {"l": 134.76401, "t": 371.79773, "r": 480.59296, "b": 412.74448, "coord_origin": "TOPLEFT"}, "confidence": 0.9752162098884583, "cells": [{"id": 37, "text": "11.", "bbox": {"l": 134.76401, "t": 371.79773, "r": 146.03854, "b": 379.86749, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "Prasad, D., Gadpal, A., Kapadni, K., Visave, M., Sultanpure, K.: Cascadetabnet:", "bbox": {"l": 150.4505, "t": 371.79773, "r": 480.58914000000004, "b": 379.86749, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "An approach for end to end table detection and structure recognition from image-", "bbox": {"l": 151.51801, "t": 382.7567399999999, "r": 480.59296, "b": 390.82651, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "based documents. In: Proceedings of the IEEE/CVF conference on computer vision", "bbox": {"l": 151.51801, "t": 393.71573, "r": 480.59293, "b": 401.78549, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "and pattern recognition workshops. pp. 572-573 (2020)", "bbox": {"l": 151.51801, "t": 404.67471, "r": 373.82727, "b": 412.74448, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "11. Prasad, D., Gadpal, A., Kapadni, K., Visave, M., Sultanpure, K.: Cascadetabnet: An approach for end to end table detection and structure recognition from imagebased documents. In: Proceedings of the IEEE/CVF conference on computer vision and pattern recognition workshops. pp. 572-573 (2020)"}, {"label": "list_item", "id": 3, "page_no": 12, "cluster": {"id": 3, "label": "list_item", "bbox": {"l": 134.76401, "t": 415.64471, "r": 480.59469999999993, "b": 456.59146, "coord_origin": "TOPLEFT"}, "confidence": 0.9707236886024475, "cells": [{"id": 42, "text": "12.", "bbox": {"l": 134.76401, "t": 415.64471, "r": 145.91106, "b": 423.71448000000004, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Schreiber, S., Agne, S., Wolf, I., Dengel, A., Ahmed, S.: Deepdesrt: Deep learning", "bbox": {"l": 150.27309, "t": 415.64471, "r": 480.5874, "b": 423.71448000000004, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "for detection and structure recognition of tables in document images. In: 2017 14th", "bbox": {"l": 151.51801, "t": 426.60373, "r": 480.59469999999993, "b": 434.67349, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "IAPR international conference on document analysis and recognition (ICDAR).", "bbox": {"l": 151.51801, "t": 437.5627099999999, "r": 480.58844, "b": 445.63248, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "vol. 1, pp. 1162-1167. IEEE (2017)", "bbox": {"l": 151.51801, "t": 448.5217, "r": 292.91455, "b": 456.59146, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "12. Schreiber, S., Agne, S., Wolf, I., Dengel, A., Ahmed, S.: Deepdesrt: Deep learning for detection and structure recognition of tables in document images. In: 2017 14th IAPR international conference on document analysis and recognition (ICDAR). vol. 1, pp. 1162-1167. IEEE (2017)"}, {"label": "list_item", "id": 7, "page_no": 12, "cluster": {"id": 7, "label": "list_item", "bbox": {"l": 134.76401, "t": 459.4917, "r": 480.59372, "b": 500.48328, "coord_origin": "TOPLEFT"}, "confidence": 0.9658119678497314, "cells": [{"id": 47, "text": "13.", "bbox": {"l": 134.76401, "t": 459.4917, "r": 145.7785, "b": 467.56146, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Siddiqui, S.A., Fateh, I.A., Rizvi, S.T.R., Dengel, A., Ahmed, S.: Deeptabstr: Deep", "bbox": {"l": 150.08871, "t": 459.4917, "r": 480.59006, "b": 467.56146, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "learning based table structure recognition. In: 2019 International Conference on", "bbox": {"l": 151.51801, "t": 470.45071, "r": 480.59116, "b": 478.52048, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Document Analysis and Recognition (ICDAR). pp. 1403-1409 (2019).", "bbox": {"l": 151.51801, "t": 481.4097, "r": 439.05963, "b": 489.47946, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "https://", "bbox": {"l": 442.94202000000007, "t": 482.05527, "r": 480.59372, "b": 489.52429, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "doi.org/10.1109/ICDAR.2019.00226", "bbox": {"l": 151.51801, "t": 493.01425, "r": 302.11584, "b": 500.48328, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "13. Siddiqui, S.A., Fateh, I.A., Rizvi, S.T.R., Dengel, A., Ahmed, S.: Deeptabstr: Deep learning based table structure recognition. In: 2019 International Conference on Document Analysis and Recognition (ICDAR). pp. 1403-1409 (2019). https:// doi.org/10.1109/ICDAR.2019.00226"}, {"label": "list_item", "id": 2, "page_no": 12, "cluster": {"id": 2, "label": "list_item", "bbox": {"l": 134.76401, "t": 503.33868, "r": 480.59286000000003, "b": 544.28545, "coord_origin": "TOPLEFT"}, "confidence": 0.972225546836853, "cells": [{"id": 53, "text": "14.", "bbox": {"l": 134.76401, "t": 503.33868, "r": 146.15501, "b": 511.40845, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "Smock, B., Pesala, R., Abraham, R.: PubTables-1M: Towards comprehensive ta-", "bbox": {"l": 150.61252, "t": 503.33868, "r": 480.59088, "b": 511.40845, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "ble extraction from unstructured documents. In: Proceedings of the IEEE/CVF", "bbox": {"l": 151.51801, "t": 514.2977000000001, "r": 480.59286000000003, "b": 522.3674599999999, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Conference on Computer Vision and Pattern Recognition (CVPR). pp. 4634-4642", "bbox": {"l": 151.51801, "t": 525.25668, "r": 480.58838000000003, "b": 533.32645, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "(June 2022)", "bbox": {"l": 151.51801, "t": 536.21568, "r": 199.24704, "b": 544.28545, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "14. Smock, B., Pesala, R., Abraham, R.: PubTables-1M: Towards comprehensive table extraction from unstructured documents. In: Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). pp. 4634-4642 (June 2022)"}, {"label": "list_item", "id": 6, "page_no": 12, "cluster": {"id": 6, "label": "list_item", "bbox": {"l": 134.76401, "t": 547.18568, "r": 480.59583, "b": 610.09528, "coord_origin": "TOPLEFT"}, "confidence": 0.9674034714698792, "cells": [{"id": 58, "text": "15.", "bbox": {"l": 134.76401, "t": 547.18568, "r": 146.16588, "b": 555.25545, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Staar, P.W.J., Dolfi, M., Auer, C., Bekas, C.: Corpus conversion service: A ma-", "bbox": {"l": 150.62764, "t": 547.18568, "r": 480.58734000000004, "b": 555.25545, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "chine learning platform to ingest documents at scale. In: Proceedings of the 24th", "bbox": {"l": 151.51801, "t": 558.14468, "r": 480.58838000000003, "b": 566.2144499999999, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "ACM SIGKDD International Conference on Knowledge Discovery & Data Min-", "bbox": {"l": 151.51801, "t": 569.1036799999999, "r": 480.59109, "b": 577.17345, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "ing. pp. 774-782. KDD \u201918, Association for Computing Machinery, New York, NY,", "bbox": {"l": 151.51801, "t": 580.06268, "r": 480.59195, "b": 588.1324500000001, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "USA (2018).", "bbox": {"l": 151.51801, "t": 591.0216800000001, "r": 200.75787, "b": 599.09145, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "https://doi.org/10.1145/3219819.3219834", "bbox": {"l": 202.916, "t": 591.66727, "r": 386.45911, "b": 599.1362799999999, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": ",", "bbox": {"l": 386.45801, "t": 591.0216800000001, "r": 389.01703, "b": 599.09145, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "https://doi.org/10.", "bbox": {"l": 391.173, "t": 591.66727, "r": 480.59583, "b": 599.1362799999999, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "1145/3219819.3219834", "bbox": {"l": 151.51801, "t": 602.62627, "r": 245.63831, "b": 610.09528, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "15. Staar, P.W.J., Dolfi, M., Auer, C., Bekas, C.: Corpus conversion service: A machine learning platform to ingest documents at scale. In: Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining. pp. 774-782. KDD \u201918, Association for Computing Machinery, New York, NY, USA (2018). https://doi.org/10.1145/3219819.3219834 , https://doi.org/10. 1145/3219819.3219834"}, {"label": "list_item", "id": 12, "page_no": 12, "cluster": {"id": 12, "label": "list_item", "bbox": {"l": 134.76401, "t": 612.95068, "r": 480.59542999999996, "b": 631.97945, "coord_origin": "TOPLEFT"}, "confidence": 0.9416429996490479, "cells": [{"id": 68, "text": "16.", "bbox": {"l": 134.76401, "t": 612.95068, "r": 146.62019, "b": 621.02045, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "Wang, X.: Tabular Abstraction, Editing, and Formatting. Ph.D. thesis, CAN", "bbox": {"l": 151.25977, "t": 612.95068, "r": 480.59542999999996, "b": 621.02045, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "(1996), aAINN09397", "bbox": {"l": 151.51801, "t": 623.90968, "r": 234.43031, "b": 631.97945, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "16. Wang, X.: Tabular Abstraction, Editing, and Formatting. Ph.D. thesis, CAN (1996), aAINN09397"}, {"label": "list_item", "id": 8, "page_no": 12, "cluster": {"id": 8, "label": "list_item", "bbox": {"l": 134.76401, "t": 634.87968, "r": 480.59119, "b": 664.86745, "coord_origin": "TOPLEFT"}, "confidence": 0.9646382331848145, "cells": [{"id": 71, "text": "17.", "bbox": {"l": 134.76401, "t": 634.87968, "r": 146.30539, "b": 642.9494500000001, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "Xue, W., Li, Q., Tao, D.: Res2tim: Reconstruct syntactic structures from table", "bbox": {"l": 150.82175, "t": 634.87968, "r": 480.58731000000006, "b": 642.9494500000001, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "images. In: 2019 International Conference on Document Analysis and Recognition", "bbox": {"l": 151.51801, "t": 645.8386800000001, "r": 480.59119, "b": 653.90845, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "(ICDAR). pp. 749-755. IEEE (2019)", "bbox": {"l": 151.51801, "t": 656.79768, "r": 299.30307, "b": 664.86745, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "17. Xue, W., Li, Q., Tao, D.: Res2tim: Reconstruct syntactic structures from table images. In: 2019 International Conference on Document Analysis and Recognition (ICDAR). pp. 749-755. IEEE (2019)"}], "headers": [{"label": "page_header", "id": 13, "page_no": 12, "cluster": {"id": 13, "label": "page_header", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9163166880607605, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Optimized Table Tokenization for Table Structure Recognition"}, {"label": "page_header", "id": 14, "page_no": 12, "cluster": {"id": 14, "label": "page_header", "bbox": {"l": 471.37561, "t": 93.77099999999996, "r": 480.5894799999999, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9061064720153809, "cells": [{"id": 1, "text": "13", "bbox": {"l": 471.37561, "t": 93.77099999999996, "r": 480.5894799999999, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "13"}]}}, {"page_no": 13, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "14", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 143.97887, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "M.", "bbox": {"l": 167.82053, "t": 93.77099999999996, "r": 178.08249, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37929, "t": 93.77099999999996, "r": 231.72049000000004, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "18.", "bbox": {"l": 134.765, "t": 119.67400999999995, "r": 146.07936, "b": 127.74370999999985, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Xue, W., Yu, B., Wang, W., Tao, D., Li, Q.: Tgrnet: A table graph reconstruc-", "bbox": {"l": 150.5069, "t": 119.67400999999995, "r": 480.5892, "b": 127.74370999999985, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "tion network for table structure recognition. In: Proceedings of the IEEE/CVF", "bbox": {"l": 151.51801, "t": 130.63300000000004, "r": 480.59113, "b": 138.70270000000005, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "International Conference on Computer Vision. pp. 1295-1304 (2021)", "bbox": {"l": 151.51801, "t": 141.59198000000004, "r": 427.53329, "b": 149.66168000000005, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "19.", "bbox": {"l": 134.765, "t": 152.55096000000003, "r": 146.19109, "b": 160.62067000000002, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Ye, J., Qi, X., He, Y., Chen, Y., Gu, D., Gao, P., Xiao, R.: Pingan-vcgroup\u2019s", "bbox": {"l": 150.66234, "t": 152.55096000000003, "r": 480.5936899999999, "b": 160.62067000000002, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "solution for icdar 2021 competition on scientific literature parsing task b: Ta-", "bbox": {"l": 151.51801, "t": 163.50995, "r": 480.59469999999993, "b": 171.57965000000002, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "ble recognition to html (2021).", "bbox": {"l": 151.51801, "t": 174.46893, "r": 280.64047, "b": 182.53864, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "https://doi.org/10.48550/ARXIV.2105.01848", "bbox": {"l": 285.078, "t": 175.11450000000002, "r": 478.03403000000003, "b": 182.58349999999996, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": ",", "bbox": {"l": 478.0319799999999, "t": 174.46893, "r": 480.59099999999995, "b": 182.53864, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "https://arxiv.org/abs/2105.01848", "bbox": {"l": 151.51797, "t": 186.07349, "r": 302.11584, "b": 193.54247999999995, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "20.", "bbox": {"l": 134.76497, "t": 196.38689999999997, "r": 145.65964, "b": 204.45659999999998, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Zhang, Z., Zhang, J., Du, J., Wang, F.: Split, embed and merge: An accurate table", "bbox": {"l": 149.92294, "t": 196.38689999999997, "r": 480.5935400000001, "b": 204.45659999999998, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "structure recognizer. Pattern Recognition", "bbox": {"l": 151.51797, "t": 207.34491000000003, "r": 318.55124, "b": 215.41461000000004, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "126", "bbox": {"l": 321.62097, "t": 207.2821, "r": 337.53186, "b": 215.20844, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": ", 108565 (2022)", "bbox": {"l": 337.53296, "t": 207.34491000000003, "r": 399.46927, "b": 215.41461000000004, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "21.", "bbox": {"l": 134.76495, "t": 218.30389000000002, "r": 145.7213, "b": 226.3736, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Zheng, X., Burdick, D., Popa, L., Zhong, X., Wang, N.X.R.: Global table extractor", "bbox": {"l": 150.00871, "t": 218.30389000000002, "r": 480.59012, "b": 226.3736, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "(gte): A framework for joint table identification and cell structure recognition using", "bbox": {"l": 151.51796, "t": 229.26288, "r": 480.59102999999993, "b": 237.33258, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "visual context. In: 2021 IEEE Winter Conference on Applications of Computer Vi-", "bbox": {"l": 151.51796, "t": 240.22186, "r": 480.59119, "b": 248.29156, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "sion (WACV). pp. 697-706 (2021).", "bbox": {"l": 151.51796, "t": 251.18084999999996, "r": 293.44086, "b": 259.25055, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "https://doi.org/10.1109/WACV48630.2021.", "bbox": {"l": 297.04996, "t": 251.82641999999998, "r": 480.59305000000006, "b": 259.29540999999995, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "00074", "bbox": {"l": 151.51796, "t": 262.7854, "r": 175.05028, "b": 270.25438999999994, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "22.", "bbox": {"l": 134.76495, "t": 273.09882000000005, "r": 146.36798, "b": 281.16855000000004, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Zhong, X., ShafieiBavani, E., Jimeno Yepes, A.: Image-based table recognition:", "bbox": {"l": 150.90846, "t": 273.09882000000005, "r": 480.59094, "b": 281.16855000000004, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Data, model, and evaluation. In: Vedaldi, A., Bischof, H., Brox, T., Frahm, J.M.", "bbox": {"l": 151.51796, "t": 284.05777, "r": 480.58832000000007, "b": 292.12753, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "(eds.) Computer Vision - ECCV 2020. pp. 564-580. Springer International Pub-", "bbox": {"l": 151.51796, "t": 295.01675, "r": 480.59558, "b": 303.08651999999995, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "lishing, Cham (2020)", "bbox": {"l": 151.51796, "t": 305.97574, "r": 236.02359, "b": 314.0455, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "23.", "bbox": {"l": 134.76495, "t": 316.93472, "r": 145.69547, "b": 325.00449000000003, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Zhong, X., Tang, J., Yepes, A.J.: Publaynet: largest dataset ever for document lay-", "bbox": {"l": 149.97276, "t": 316.93472, "r": 480.59454, "b": 325.00449000000003, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "out analysis. In: 2019 International Conference on Document Analysis and Recog-", "bbox": {"l": 151.51796, "t": 327.8927299999999, "r": 480.59387000000004, "b": 335.96249, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "nition (ICDAR). pp. 1015-1022. IEEE (2019)", "bbox": {"l": 151.51796, "t": 338.85172, "r": 335.13635, "b": 346.92148, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 7, "label": "page_header", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 143.97887, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.7012730240821838, "cells": [{"id": 0, "text": "14", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 143.97887, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "page_header", "bbox": {"l": 167.82053, "t": 93.77099999999996, "r": 231.72049000000004, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.7889755964279175, "cells": [{"id": 1, "text": "M.", "bbox": {"l": 167.82053, "t": 93.77099999999996, "r": 178.08249, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37929, "t": 93.77099999999996, "r": 231.72049000000004, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "list_item", "bbox": {"l": 134.765, "t": 119.67400999999995, "r": 480.59113, "b": 149.66168000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9444757699966431, "cells": [{"id": 3, "text": "18.", "bbox": {"l": 134.765, "t": 119.67400999999995, "r": 146.07936, "b": 127.74370999999985, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Xue, W., Yu, B., Wang, W., Tao, D., Li, Q.: Tgrnet: A table graph reconstruc-", "bbox": {"l": 150.5069, "t": 119.67400999999995, "r": 480.5892, "b": 127.74370999999985, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "tion network for table structure recognition. In: Proceedings of the IEEE/CVF", "bbox": {"l": 151.51801, "t": 130.63300000000004, "r": 480.59113, "b": 138.70270000000005, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "International Conference on Computer Vision. pp. 1295-1304 (2021)", "bbox": {"l": 151.51801, "t": 141.59198000000004, "r": 427.53329, "b": 149.66168000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "list_item", "bbox": {"l": 134.765, "t": 152.55096000000003, "r": 480.59469999999993, "b": 193.54247999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9540892243385315, "cells": [{"id": 7, "text": "19.", "bbox": {"l": 134.765, "t": 152.55096000000003, "r": 146.19109, "b": 160.62067000000002, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Ye, J., Qi, X., He, Y., Chen, Y., Gu, D., Gao, P., Xiao, R.: Pingan-vcgroup\u2019s", "bbox": {"l": 150.66234, "t": 152.55096000000003, "r": 480.5936899999999, "b": 160.62067000000002, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "solution for icdar 2021 competition on scientific literature parsing task b: Ta-", "bbox": {"l": 151.51801, "t": 163.50995, "r": 480.59469999999993, "b": 171.57965000000002, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "ble recognition to html (2021).", "bbox": {"l": 151.51801, "t": 174.46893, "r": 280.64047, "b": 182.53864, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "https://doi.org/10.48550/ARXIV.2105.01848", "bbox": {"l": 285.078, "t": 175.11450000000002, "r": 478.03403000000003, "b": 182.58349999999996, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": ",", "bbox": {"l": 478.0319799999999, "t": 174.46893, "r": 480.59099999999995, "b": 182.53864, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "https://arxiv.org/abs/2105.01848", "bbox": {"l": 151.51797, "t": 186.07349, "r": 302.11584, "b": 193.54247999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "list_item", "bbox": {"l": 134.76497, "t": 196.38689999999997, "r": 480.5935400000001, "b": 215.41461000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9531471729278564, "cells": [{"id": 14, "text": "20.", "bbox": {"l": 134.76497, "t": 196.38689999999997, "r": 145.65964, "b": 204.45659999999998, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Zhang, Z., Zhang, J., Du, J., Wang, F.: Split, embed and merge: An accurate table", "bbox": {"l": 149.92294, "t": 196.38689999999997, "r": 480.5935400000001, "b": 204.45659999999998, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "structure recognizer. Pattern Recognition", "bbox": {"l": 151.51797, "t": 207.34491000000003, "r": 318.55124, "b": 215.41461000000004, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "126", "bbox": {"l": 321.62097, "t": 207.2821, "r": 337.53186, "b": 215.20844, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": ", 108565 (2022)", "bbox": {"l": 337.53296, "t": 207.34491000000003, "r": 399.46927, "b": 215.41461000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "list_item", "bbox": {"l": 134.76495, "t": 218.30389000000002, "r": 480.59305000000006, "b": 270.25438999999994, "coord_origin": "TOPLEFT"}, "confidence": 0.972027063369751, "cells": [{"id": 19, "text": "21.", "bbox": {"l": 134.76495, "t": 218.30389000000002, "r": 145.7213, "b": 226.3736, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Zheng, X., Burdick, D., Popa, L., Zhong, X., Wang, N.X.R.: Global table extractor", "bbox": {"l": 150.00871, "t": 218.30389000000002, "r": 480.59012, "b": 226.3736, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "(gte): A framework for joint table identification and cell structure recognition using", "bbox": {"l": 151.51796, "t": 229.26288, "r": 480.59102999999993, "b": 237.33258, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "visual context. In: 2021 IEEE Winter Conference on Applications of Computer Vi-", "bbox": {"l": 151.51796, "t": 240.22186, "r": 480.59119, "b": 248.29156, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "sion (WACV). pp. 697-706 (2021).", "bbox": {"l": 151.51796, "t": 251.18084999999996, "r": 293.44086, "b": 259.25055, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "https://doi.org/10.1109/WACV48630.2021.", "bbox": {"l": 297.04996, "t": 251.82641999999998, "r": 480.59305000000006, "b": 259.29540999999995, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "00074", "bbox": {"l": 151.51796, "t": 262.7854, "r": 175.05028, "b": 270.25438999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "list_item", "bbox": {"l": 134.76495, "t": 273.09882000000005, "r": 480.59558, "b": 314.0455, "coord_origin": "TOPLEFT"}, "confidence": 0.9685125946998596, "cells": [{"id": 26, "text": "22.", "bbox": {"l": 134.76495, "t": 273.09882000000005, "r": 146.36798, "b": 281.16855000000004, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Zhong, X., ShafieiBavani, E., Jimeno Yepes, A.: Image-based table recognition:", "bbox": {"l": 150.90846, "t": 273.09882000000005, "r": 480.59094, "b": 281.16855000000004, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Data, model, and evaluation. In: Vedaldi, A., Bischof, H., Brox, T., Frahm, J.M.", "bbox": {"l": 151.51796, "t": 284.05777, "r": 480.58832000000007, "b": 292.12753, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "(eds.) Computer Vision - ECCV 2020. pp. 564-580. Springer International Pub-", "bbox": {"l": 151.51796, "t": 295.01675, "r": 480.59558, "b": 303.08651999999995, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "lishing, Cham (2020)", "bbox": {"l": 151.51796, "t": 305.97574, "r": 236.02359, "b": 314.0455, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "list_item", "bbox": {"l": 134.76495, "t": 316.93472, "r": 480.59454, "b": 346.92148, "coord_origin": "TOPLEFT"}, "confidence": 0.9668973684310913, "cells": [{"id": 31, "text": "23.", "bbox": {"l": 134.76495, "t": 316.93472, "r": 145.69547, "b": 325.00449000000003, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Zhong, X., Tang, J., Yepes, A.J.: Publaynet: largest dataset ever for document lay-", "bbox": {"l": 149.97276, "t": 316.93472, "r": 480.59454, "b": 325.00449000000003, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "out analysis. In: 2019 International Conference on Document Analysis and Recog-", "bbox": {"l": 151.51796, "t": 327.8927299999999, "r": 480.59387000000004, "b": 335.96249, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "nition (ICDAR). pp. 1015-1022. IEEE (2019)", "bbox": {"l": 151.51796, "t": 338.85172, "r": 335.13635, "b": 346.92148, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_header", "id": 7, "page_no": 13, "cluster": {"id": 7, "label": "page_header", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 143.97887, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.7012730240821838, "cells": [{"id": 0, "text": "14", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 143.97887, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "14"}, {"label": "page_header", "id": 6, "page_no": 13, "cluster": {"id": 6, "label": "page_header", "bbox": {"l": 167.82053, "t": 93.77099999999996, "r": 231.72049000000004, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.7889755964279175, "cells": [{"id": 1, "text": "M.", "bbox": {"l": 167.82053, "t": 93.77099999999996, "r": 178.08249, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37929, "t": 93.77099999999996, "r": 231.72049000000004, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "M. Lysak, et al."}, {"label": "list_item", "id": 5, "page_no": 13, "cluster": {"id": 5, "label": "list_item", "bbox": {"l": 134.765, "t": 119.67400999999995, "r": 480.59113, "b": 149.66168000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9444757699966431, "cells": [{"id": 3, "text": "18.", "bbox": {"l": 134.765, "t": 119.67400999999995, "r": 146.07936, "b": 127.74370999999985, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Xue, W., Yu, B., Wang, W., Tao, D., Li, Q.: Tgrnet: A table graph reconstruc-", "bbox": {"l": 150.5069, "t": 119.67400999999995, "r": 480.5892, "b": 127.74370999999985, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "tion network for table structure recognition. In: Proceedings of the IEEE/CVF", "bbox": {"l": 151.51801, "t": 130.63300000000004, "r": 480.59113, "b": 138.70270000000005, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "International Conference on Computer Vision. pp. 1295-1304 (2021)", "bbox": {"l": 151.51801, "t": 141.59198000000004, "r": 427.53329, "b": 149.66168000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "18. Xue, W., Yu, B., Wang, W., Tao, D., Li, Q.: Tgrnet: A table graph reconstruction network for table structure recognition. In: Proceedings of the IEEE/CVF International Conference on Computer Vision. pp. 1295-1304 (2021)"}, {"label": "list_item", "id": 3, "page_no": 13, "cluster": {"id": 3, "label": "list_item", "bbox": {"l": 134.765, "t": 152.55096000000003, "r": 480.59469999999993, "b": 193.54247999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9540892243385315, "cells": [{"id": 7, "text": "19.", "bbox": {"l": 134.765, "t": 152.55096000000003, "r": 146.19109, "b": 160.62067000000002, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Ye, J., Qi, X., He, Y., Chen, Y., Gu, D., Gao, P., Xiao, R.: Pingan-vcgroup\u2019s", "bbox": {"l": 150.66234, "t": 152.55096000000003, "r": 480.5936899999999, "b": 160.62067000000002, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "solution for icdar 2021 competition on scientific literature parsing task b: Ta-", "bbox": {"l": 151.51801, "t": 163.50995, "r": 480.59469999999993, "b": 171.57965000000002, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "ble recognition to html (2021).", "bbox": {"l": 151.51801, "t": 174.46893, "r": 280.64047, "b": 182.53864, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "https://doi.org/10.48550/ARXIV.2105.01848", "bbox": {"l": 285.078, "t": 175.11450000000002, "r": 478.03403000000003, "b": 182.58349999999996, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": ",", "bbox": {"l": 478.0319799999999, "t": 174.46893, "r": 480.59099999999995, "b": 182.53864, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "https://arxiv.org/abs/2105.01848", "bbox": {"l": 151.51797, "t": 186.07349, "r": 302.11584, "b": 193.54247999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "19. Ye, J., Qi, X., He, Y., Chen, Y., Gu, D., Gao, P., Xiao, R.: Pingan-vcgroup\u2019s solution for icdar 2021 competition on scientific literature parsing task b: Table recognition to html (2021). https://doi.org/10.48550/ARXIV.2105.01848 , https://arxiv.org/abs/2105.01848"}, {"label": "list_item", "id": 4, "page_no": 13, "cluster": {"id": 4, "label": "list_item", "bbox": {"l": 134.76497, "t": 196.38689999999997, "r": 480.5935400000001, "b": 215.41461000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9531471729278564, "cells": [{"id": 14, "text": "20.", "bbox": {"l": 134.76497, "t": 196.38689999999997, "r": 145.65964, "b": 204.45659999999998, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Zhang, Z., Zhang, J., Du, J., Wang, F.: Split, embed and merge: An accurate table", "bbox": {"l": 149.92294, "t": 196.38689999999997, "r": 480.5935400000001, "b": 204.45659999999998, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "structure recognizer. Pattern Recognition", "bbox": {"l": 151.51797, "t": 207.34491000000003, "r": 318.55124, "b": 215.41461000000004, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "126", "bbox": {"l": 321.62097, "t": 207.2821, "r": 337.53186, "b": 215.20844, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": ", 108565 (2022)", "bbox": {"l": 337.53296, "t": 207.34491000000003, "r": 399.46927, "b": 215.41461000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "20. Zhang, Z., Zhang, J., Du, J., Wang, F.: Split, embed and merge: An accurate table structure recognizer. Pattern Recognition 126 , 108565 (2022)"}, {"label": "list_item", "id": 0, "page_no": 13, "cluster": {"id": 0, "label": "list_item", "bbox": {"l": 134.76495, "t": 218.30389000000002, "r": 480.59305000000006, "b": 270.25438999999994, "coord_origin": "TOPLEFT"}, "confidence": 0.972027063369751, "cells": [{"id": 19, "text": "21.", "bbox": {"l": 134.76495, "t": 218.30389000000002, "r": 145.7213, "b": 226.3736, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Zheng, X., Burdick, D., Popa, L., Zhong, X., Wang, N.X.R.: Global table extractor", "bbox": {"l": 150.00871, "t": 218.30389000000002, "r": 480.59012, "b": 226.3736, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "(gte): A framework for joint table identification and cell structure recognition using", "bbox": {"l": 151.51796, "t": 229.26288, "r": 480.59102999999993, "b": 237.33258, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "visual context. In: 2021 IEEE Winter Conference on Applications of Computer Vi-", "bbox": {"l": 151.51796, "t": 240.22186, "r": 480.59119, "b": 248.29156, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "sion (WACV). pp. 697-706 (2021).", "bbox": {"l": 151.51796, "t": 251.18084999999996, "r": 293.44086, "b": 259.25055, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "https://doi.org/10.1109/WACV48630.2021.", "bbox": {"l": 297.04996, "t": 251.82641999999998, "r": 480.59305000000006, "b": 259.29540999999995, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "00074", "bbox": {"l": 151.51796, "t": 262.7854, "r": 175.05028, "b": 270.25438999999994, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "21. Zheng, X., Burdick, D., Popa, L., Zhong, X., Wang, N.X.R.: Global table extractor (gte): A framework for joint table identification and cell structure recognition using visual context. In: 2021 IEEE Winter Conference on Applications of Computer Vision (WACV). pp. 697-706 (2021). https://doi.org/10.1109/WACV48630.2021. 00074"}, {"label": "list_item", "id": 1, "page_no": 13, "cluster": {"id": 1, "label": "list_item", "bbox": {"l": 134.76495, "t": 273.09882000000005, "r": 480.59558, "b": 314.0455, "coord_origin": "TOPLEFT"}, "confidence": 0.9685125946998596, "cells": [{"id": 26, "text": "22.", "bbox": {"l": 134.76495, "t": 273.09882000000005, "r": 146.36798, "b": 281.16855000000004, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Zhong, X., ShafieiBavani, E., Jimeno Yepes, A.: Image-based table recognition:", "bbox": {"l": 150.90846, "t": 273.09882000000005, "r": 480.59094, "b": 281.16855000000004, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Data, model, and evaluation. In: Vedaldi, A., Bischof, H., Brox, T., Frahm, J.M.", "bbox": {"l": 151.51796, "t": 284.05777, "r": 480.58832000000007, "b": 292.12753, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "(eds.) Computer Vision - ECCV 2020. pp. 564-580. Springer International Pub-", "bbox": {"l": 151.51796, "t": 295.01675, "r": 480.59558, "b": 303.08651999999995, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "lishing, Cham (2020)", "bbox": {"l": 151.51796, "t": 305.97574, "r": 236.02359, "b": 314.0455, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "22. Zhong, X., ShafieiBavani, E., Jimeno Yepes, A.: Image-based table recognition: Data, model, and evaluation. In: Vedaldi, A., Bischof, H., Brox, T., Frahm, J.M. (eds.) Computer Vision - ECCV 2020. pp. 564-580. Springer International Publishing, Cham (2020)"}, {"label": "list_item", "id": 2, "page_no": 13, "cluster": {"id": 2, "label": "list_item", "bbox": {"l": 134.76495, "t": 316.93472, "r": 480.59454, "b": 346.92148, "coord_origin": "TOPLEFT"}, "confidence": 0.9668973684310913, "cells": [{"id": 31, "text": "23.", "bbox": {"l": 134.76495, "t": 316.93472, "r": 145.69547, "b": 325.00449000000003, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Zhong, X., Tang, J., Yepes, A.J.: Publaynet: largest dataset ever for document lay-", "bbox": {"l": 149.97276, "t": 316.93472, "r": 480.59454, "b": 325.00449000000003, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "out analysis. In: 2019 International Conference on Document Analysis and Recog-", "bbox": {"l": 151.51796, "t": 327.8927299999999, "r": 480.59387000000004, "b": 335.96249, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "nition (ICDAR). pp. 1015-1022. IEEE (2019)", "bbox": {"l": 151.51796, "t": 338.85172, "r": 335.13635, "b": 346.92148, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "23. Zhong, X., Tang, J., Yepes, A.J.: Publaynet: largest dataset ever for document layout analysis. In: 2019 International Conference on Document Analysis and Recognition (ICDAR). pp. 1015-1022. IEEE (2019)"}], "body": [{"label": "list_item", "id": 5, "page_no": 13, "cluster": {"id": 5, "label": "list_item", "bbox": {"l": 134.765, "t": 119.67400999999995, "r": 480.59113, "b": 149.66168000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9444757699966431, "cells": [{"id": 3, "text": "18.", "bbox": {"l": 134.765, "t": 119.67400999999995, "r": 146.07936, "b": 127.74370999999985, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Xue, W., Yu, B., Wang, W., Tao, D., Li, Q.: Tgrnet: A table graph reconstruc-", "bbox": {"l": 150.5069, "t": 119.67400999999995, "r": 480.5892, "b": 127.74370999999985, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "tion network for table structure recognition. In: Proceedings of the IEEE/CVF", "bbox": {"l": 151.51801, "t": 130.63300000000004, "r": 480.59113, "b": 138.70270000000005, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "International Conference on Computer Vision. pp. 1295-1304 (2021)", "bbox": {"l": 151.51801, "t": 141.59198000000004, "r": 427.53329, "b": 149.66168000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "18. Xue, W., Yu, B., Wang, W., Tao, D., Li, Q.: Tgrnet: A table graph reconstruction network for table structure recognition. In: Proceedings of the IEEE/CVF International Conference on Computer Vision. pp. 1295-1304 (2021)"}, {"label": "list_item", "id": 3, "page_no": 13, "cluster": {"id": 3, "label": "list_item", "bbox": {"l": 134.765, "t": 152.55096000000003, "r": 480.59469999999993, "b": 193.54247999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9540892243385315, "cells": [{"id": 7, "text": "19.", "bbox": {"l": 134.765, "t": 152.55096000000003, "r": 146.19109, "b": 160.62067000000002, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Ye, J., Qi, X., He, Y., Chen, Y., Gu, D., Gao, P., Xiao, R.: Pingan-vcgroup\u2019s", "bbox": {"l": 150.66234, "t": 152.55096000000003, "r": 480.5936899999999, "b": 160.62067000000002, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "solution for icdar 2021 competition on scientific literature parsing task b: Ta-", "bbox": {"l": 151.51801, "t": 163.50995, "r": 480.59469999999993, "b": 171.57965000000002, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "ble recognition to html (2021).", "bbox": {"l": 151.51801, "t": 174.46893, "r": 280.64047, "b": 182.53864, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "https://doi.org/10.48550/ARXIV.2105.01848", "bbox": {"l": 285.078, "t": 175.11450000000002, "r": 478.03403000000003, "b": 182.58349999999996, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": ",", "bbox": {"l": 478.0319799999999, "t": 174.46893, "r": 480.59099999999995, "b": 182.53864, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "https://arxiv.org/abs/2105.01848", "bbox": {"l": 151.51797, "t": 186.07349, "r": 302.11584, "b": 193.54247999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "19. Ye, J., Qi, X., He, Y., Chen, Y., Gu, D., Gao, P., Xiao, R.: Pingan-vcgroup\u2019s solution for icdar 2021 competition on scientific literature parsing task b: Table recognition to html (2021). https://doi.org/10.48550/ARXIV.2105.01848 , https://arxiv.org/abs/2105.01848"}, {"label": "list_item", "id": 4, "page_no": 13, "cluster": {"id": 4, "label": "list_item", "bbox": {"l": 134.76497, "t": 196.38689999999997, "r": 480.5935400000001, "b": 215.41461000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9531471729278564, "cells": [{"id": 14, "text": "20.", "bbox": {"l": 134.76497, "t": 196.38689999999997, "r": 145.65964, "b": 204.45659999999998, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Zhang, Z., Zhang, J., Du, J., Wang, F.: Split, embed and merge: An accurate table", "bbox": {"l": 149.92294, "t": 196.38689999999997, "r": 480.5935400000001, "b": 204.45659999999998, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "structure recognizer. Pattern Recognition", "bbox": {"l": 151.51797, "t": 207.34491000000003, "r": 318.55124, "b": 215.41461000000004, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "126", "bbox": {"l": 321.62097, "t": 207.2821, "r": 337.53186, "b": 215.20844, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": ", 108565 (2022)", "bbox": {"l": 337.53296, "t": 207.34491000000003, "r": 399.46927, "b": 215.41461000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "20. Zhang, Z., Zhang, J., Du, J., Wang, F.: Split, embed and merge: An accurate table structure recognizer. Pattern Recognition 126 , 108565 (2022)"}, {"label": "list_item", "id": 0, "page_no": 13, "cluster": {"id": 0, "label": "list_item", "bbox": {"l": 134.76495, "t": 218.30389000000002, "r": 480.59305000000006, "b": 270.25438999999994, "coord_origin": "TOPLEFT"}, "confidence": 0.972027063369751, "cells": [{"id": 19, "text": "21.", "bbox": {"l": 134.76495, "t": 218.30389000000002, "r": 145.7213, "b": 226.3736, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Zheng, X., Burdick, D., Popa, L., Zhong, X., Wang, N.X.R.: Global table extractor", "bbox": {"l": 150.00871, "t": 218.30389000000002, "r": 480.59012, "b": 226.3736, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "(gte): A framework for joint table identification and cell structure recognition using", "bbox": {"l": 151.51796, "t": 229.26288, "r": 480.59102999999993, "b": 237.33258, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "visual context. In: 2021 IEEE Winter Conference on Applications of Computer Vi-", "bbox": {"l": 151.51796, "t": 240.22186, "r": 480.59119, "b": 248.29156, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "sion (WACV). pp. 697-706 (2021).", "bbox": {"l": 151.51796, "t": 251.18084999999996, "r": 293.44086, "b": 259.25055, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "https://doi.org/10.1109/WACV48630.2021.", "bbox": {"l": 297.04996, "t": 251.82641999999998, "r": 480.59305000000006, "b": 259.29540999999995, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "00074", "bbox": {"l": 151.51796, "t": 262.7854, "r": 175.05028, "b": 270.25438999999994, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "21. Zheng, X., Burdick, D., Popa, L., Zhong, X., Wang, N.X.R.: Global table extractor (gte): A framework for joint table identification and cell structure recognition using visual context. In: 2021 IEEE Winter Conference on Applications of Computer Vision (WACV). pp. 697-706 (2021). https://doi.org/10.1109/WACV48630.2021. 00074"}, {"label": "list_item", "id": 1, "page_no": 13, "cluster": {"id": 1, "label": "list_item", "bbox": {"l": 134.76495, "t": 273.09882000000005, "r": 480.59558, "b": 314.0455, "coord_origin": "TOPLEFT"}, "confidence": 0.9685125946998596, "cells": [{"id": 26, "text": "22.", "bbox": {"l": 134.76495, "t": 273.09882000000005, "r": 146.36798, "b": 281.16855000000004, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Zhong, X., ShafieiBavani, E., Jimeno Yepes, A.: Image-based table recognition:", "bbox": {"l": 150.90846, "t": 273.09882000000005, "r": 480.59094, "b": 281.16855000000004, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Data, model, and evaluation. In: Vedaldi, A., Bischof, H., Brox, T., Frahm, J.M.", "bbox": {"l": 151.51796, "t": 284.05777, "r": 480.58832000000007, "b": 292.12753, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "(eds.) Computer Vision - ECCV 2020. pp. 564-580. Springer International Pub-", "bbox": {"l": 151.51796, "t": 295.01675, "r": 480.59558, "b": 303.08651999999995, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "lishing, Cham (2020)", "bbox": {"l": 151.51796, "t": 305.97574, "r": 236.02359, "b": 314.0455, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "22. Zhong, X., ShafieiBavani, E., Jimeno Yepes, A.: Image-based table recognition: Data, model, and evaluation. In: Vedaldi, A., Bischof, H., Brox, T., Frahm, J.M. (eds.) Computer Vision - ECCV 2020. pp. 564-580. Springer International Publishing, Cham (2020)"}, {"label": "list_item", "id": 2, "page_no": 13, "cluster": {"id": 2, "label": "list_item", "bbox": {"l": 134.76495, "t": 316.93472, "r": 480.59454, "b": 346.92148, "coord_origin": "TOPLEFT"}, "confidence": 0.9668973684310913, "cells": [{"id": 31, "text": "23.", "bbox": {"l": 134.76495, "t": 316.93472, "r": 145.69547, "b": 325.00449000000003, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Zhong, X., Tang, J., Yepes, A.J.: Publaynet: largest dataset ever for document lay-", "bbox": {"l": 149.97276, "t": 316.93472, "r": 480.59454, "b": 325.00449000000003, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "out analysis. In: 2019 International Conference on Document Analysis and Recog-", "bbox": {"l": 151.51796, "t": 327.8927299999999, "r": 480.59387000000004, "b": 335.96249, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "nition (ICDAR). pp. 1015-1022. IEEE (2019)", "bbox": {"l": 151.51796, "t": 338.85172, "r": 335.13635, "b": 346.92148, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "23. Zhong, X., Tang, J., Yepes, A.J.: Publaynet: largest dataset ever for document layout analysis. In: 2019 International Conference on Document Analysis and Recognition (ICDAR). pp. 1015-1022. IEEE (2019)"}], "headers": [{"label": "page_header", "id": 7, "page_no": 13, "cluster": {"id": 7, "label": "page_header", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 143.97887, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.7012730240821838, "cells": [{"id": 0, "text": "14", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 143.97887, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "14"}, {"label": "page_header", "id": 6, "page_no": 13, "cluster": {"id": 6, "label": "page_header", "bbox": {"l": 167.82053, "t": 93.77099999999996, "r": 231.72049000000004, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.7889755964279175, "cells": [{"id": 1, "text": "M.", "bbox": {"l": 167.82053, "t": 93.77099999999996, "r": 178.08249, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37929, "t": 93.77099999999996, "r": 231.72049000000004, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "M. Lysak, et al."}]}}]
\ No newline at end of file
+[{"page_no": 0, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure", "bbox": {"l": 134.765, "t": 115.89910999999995, "r": 480.59735, "b": 128.58112000000006, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Recognition", "bbox": {"l": 266.67499, "t": 133.83209, "r": 348.68506, "b": 146.51409999999998, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Maksym Lysak", "bbox": {"l": 151.22598, "t": 171.67371000000003, "r": 217.04390999999998, "b": 180.47069999999997, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "[0000", "bbox": {"l": 217.04599, "t": 170.08209, "r": 235.18764, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "\u2212", "bbox": {"l": 235.18598999999998, "t": 169.69159000000002, "r": 241.4129, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "0002", "bbox": {"l": 241.41299000000004, "t": 170.08209, "r": 257.29932, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "\u2212", "bbox": {"l": 257.298, "t": 169.69159000000002, "r": 263.5249, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "3723", "bbox": {"l": 263.52499, "t": 170.08209, "r": 279.41132, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "\u2212", "bbox": {"l": 279.41, "t": 169.69159000000002, "r": 285.6369, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "$^{6960]}$, Ahmed Nassar[0000", "bbox": {"l": 285.63602, "t": 171.67371000000003, "r": 392.27664, "b": 180.47069999999997, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "\u2212", "bbox": {"l": 392.27502, "t": 169.69159000000002, "r": 398.50192, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "0002", "bbox": {"l": 398.50201, "t": 170.08209, "r": 414.38834, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "\u2212", "bbox": {"l": 414.38702, "t": 169.69159000000002, "r": 420.61392, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "9468", "bbox": {"l": 420.61304, "t": 170.08209, "r": 436.49936, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "\u2212", "bbox": {"l": 436.49805000000003, "t": 169.69159000000002, "r": 442.72495000000004, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "$^{0822]}$,", "bbox": {"l": 442.72504, "t": 171.67371000000003, "r": 464.12963999999994, "b": 180.47069999999997, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Nikolaos Livathinos", "bbox": {"l": 139.34305, "t": 183.62872000000004, "r": 224.80720999999997, "b": 192.42571999999996, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "[0000", "bbox": {"l": 224.80704000000003, "t": 182.03814999999997, "r": 242.94868, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "\u2212", "bbox": {"l": 242.94704000000002, "t": 181.64764000000002, "r": 249.17394999999996, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "0001", "bbox": {"l": 249.17404000000002, "t": 182.03814999999997, "r": 265.06036, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "\u2212", "bbox": {"l": 265.05905, "t": 181.64764000000002, "r": 271.28595, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "8513", "bbox": {"l": 271.28506, "t": 182.03814999999997, "r": 287.17139, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "\u2212", "bbox": {"l": 287.17007, "t": 181.64764000000002, "r": 293.39697, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "$^{3491]}$, Christoph Auer[0000", "bbox": {"l": 293.39706, "t": 183.62872000000004, "r": 404.1597, "b": 192.42571999999996, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "\u2212", "bbox": {"l": 404.15808, "t": 181.64764000000002, "r": 410.38498, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "0001", "bbox": {"l": 410.38507, "t": 182.03814999999997, "r": 426.27139, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "\u2212", "bbox": {"l": 426.27008, "t": 181.64764000000002, "r": 432.49697999999995, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "5761", "bbox": {"l": 432.49609, "t": 182.03814999999997, "r": 448.3824200000001, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "\u2212", "bbox": {"l": 448.3811, "t": 181.64764000000002, "r": 454.608, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "$^{0422]}$,", "bbox": {"l": 454.60808999999995, "t": 183.62872000000004, "r": 476.01270000000005, "b": 192.42571999999996, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "and Peter Staar", "bbox": {"l": 229.52109000000002, "t": 195.58374000000003, "r": 298.6087, "b": 204.38073999999995, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "[0000", "bbox": {"l": 298.60608, "t": 193.99316, "r": 316.74771, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "\u2212", "bbox": {"l": 316.74609, "t": 193.60266000000001, "r": 322.97299, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "0002", "bbox": {"l": 322.97308, "t": 193.99316, "r": 338.85941, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "\u2212", "bbox": {"l": 338.85809, "t": 193.60266000000001, "r": 345.08499, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "8088", "bbox": {"l": 345.08508, "t": 193.99316, "r": 360.97141, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "\u2212", "bbox": {"l": 360.97009, "t": 193.60266000000001, "r": 367.19699, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "0823]", "bbox": {"l": 367.19611, "t": 193.99316, "r": 385.33774, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "IBM Research", "bbox": {"l": 279.1051, "t": 217.20398, "r": 336.25153, "b": 225.27368, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "{mly,ahn,nli,cau,taa}@zurich.ibm.com", "bbox": {"l": 222.96609, "t": 228.80853000000002, "r": 392.38983, "b": 236.27752999999996, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "Abstract.", "bbox": {"l": 163.1111, "t": 270.30115, "r": 206.6358, "b": 278.22748, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Extracting tables from documents is a crucial task in any", "bbox": {"l": 211.6171, "t": 270.36395000000005, "r": 452.2447199999999, "b": 278.43364999999994, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "document conversion pipeline. Recently, transformer-based models have", "bbox": {"l": 163.1111, "t": 281.3229099999999, "r": 452.24246, "b": 289.39267, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "demonstrated that table-structure can be recognized with impressive ac-", "bbox": {"l": 163.1111, "t": 292.28189, "r": 452.24792, "b": 300.35165000000006, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "curacy using Image-to-Markup-Sequence (Im2Seq) approaches. Taking", "bbox": {"l": 163.1111, "t": 303.24088, "r": 452.2407799999999, "b": 311.31064, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "only the image of a table, such models predict a sequence of tokens (e.g.", "bbox": {"l": 163.1111, "t": 314.19888, "r": 452.24609, "b": 322.26865, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "in HTML, LaTeX) which represent the structure of the table. Since the", "bbox": {"l": 163.1111, "t": 325.15787, "r": 452.24615000000006, "b": 333.22763, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "token representation of the table structure has a significant impact on", "bbox": {"l": 163.1111, "t": 336.11685, "r": 452.24707, "b": 344.18661, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "the accuracy and run-time performance of any Im2Seq model, we inves-", "bbox": {"l": 163.1111, "t": 347.07584, "r": 452.2459999999999, "b": 355.1456, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "tigate in this paper how table-structure representation can be optimised.", "bbox": {"l": 163.1111, "t": 358.03482, "r": 452.2479900000001, "b": 366.10458, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "We propose a new, optimised table-structure language (OTSL) with a", "bbox": {"l": 163.1111, "t": 368.9938, "r": 452.24609, "b": 377.06357, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "minimized vocabulary and specific rules. The benefits of OTSL are that", "bbox": {"l": 163.1111, "t": 379.95279, "r": 452.2417, "b": 388.02255, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "it reduces the number of tokens to 5 (HTML needs 28+) and shortens", "bbox": {"l": 163.1111, "t": 390.91177, "r": 452.2443200000001, "b": 398.98154, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "the sequence length to half of HTML on average. Consequently, model", "bbox": {"l": 163.1111, "t": 401.87076, "r": 452.24878000000007, "b": 409.94052, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "accuracy improves significantly, inference time is halved compared to", "bbox": {"l": 163.1111, "t": 412.82974, "r": 452.24063000000007, "b": 420.8995100000001, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "HTML-based models, and the predicted table structures are always syn-", "bbox": {"l": 163.1111, "t": 423.78774999999996, "r": 452.24161, "b": 431.85751000000005, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "tactically correct. This in turn eliminates most post-processing needs.", "bbox": {"l": 163.1111, "t": 434.74673, "r": 452.24429, "b": 442.8165, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Popular table structure data-sets will be published in OTSL format to", "bbox": {"l": 163.1111, "t": 445.70572000000004, "r": 452.24603, "b": 453.77547999999996, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "the community.", "bbox": {"l": 163.1111, "t": 456.6647, "r": 225.56116, "b": 464.73447, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Keywords:", "bbox": {"l": 163.1111, "t": 478.69394, "r": 211.94211, "b": 486.62024, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Table Structure Recognition \u00b7 Data Representation \u00b7 Trans-", "bbox": {"l": 216.55208999999996, "t": 478.75671, "r": 452.24158, "b": 486.82648, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "formers \u00b7 Optimization.", "bbox": {"l": 163.11111, "t": 489.71573, "r": 257.64185, "b": 497.78549, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "1", "bbox": {"l": 134.76512, "t": 522.11969, "r": 141.48872, "b": 532.68808, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "Introduction", "bbox": {"l": 154.93832, "t": 522.11969, "r": 228.93384, "b": 532.68808, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "Tables are ubiquitous in documents such as scientific papers, patents, reports,", "bbox": {"l": 134.76512, "t": 548.2865400000001, "r": 480.5939, "b": 557.0835099999999, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "manuals, specification sheets or marketing material. They often encode highly", "bbox": {"l": 134.76512, "t": 560.24254, "r": 480.59180000000003, "b": 569.0395100000001, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "valuable information and therefore need to be extracted with high accuracy.", "bbox": {"l": 134.76512, "t": 572.19754, "r": 480.59283000000005, "b": 580.99451, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "Unfortunately, tables appear in documents in various sizes, styling and struc-", "bbox": {"l": 134.76512, "t": 584.15254, "r": 480.5959500000001, "b": 592.9495099999999, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "ture, making it difficult to recover their correct structure with simple analyt-", "bbox": {"l": 134.76512, "t": 596.10754, "r": 480.58688, "b": 604.90451, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "ical methods. Therefore, accurate table extraction is achieved these days with", "bbox": {"l": 134.76512, "t": 608.06255, "r": 480.59088, "b": 616.85951, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "machine-learning based methods.", "bbox": {"l": 134.76512, "t": 620.01755, "r": 279.32745, "b": 628.81451, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "In modern document understanding systems [1,15], table extraction is typi-", "bbox": {"l": 149.70811, "t": 632.14755, "r": 480.58899, "b": 640.94452, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "cally a two-step process. Firstly, every table on a page is located with a bounding", "bbox": {"l": 134.76512, "t": 644.1025500000001, "r": 480.59583, "b": 652.8995199999999, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "box, and secondly, their logical row and column structure is recognized. As of", "bbox": {"l": 134.76512, "t": 656.05756, "r": 480.59496999999993, "b": 664.85453, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "arXiv:2305.03393v1 [cs.CV] 5 May 2023", "bbox": {"l": 18.340218, "t": 209.47997999999995, "r": 36.339787, "b": 555.00003, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 5, "label": "section_header", "bbox": {"l": 134.765, "t": 115.89910999999995, "r": 480.59735, "b": 146.51409999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.8918349742889404, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure", "bbox": {"l": 134.765, "t": 115.89910999999995, "r": 480.59735, "b": 128.58112000000006, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Recognition", "bbox": {"l": 266.67499, "t": 133.83209, "r": 348.68506, "b": 146.51409999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "key_value_region", "bbox": {"l": 139.34305, "t": 169.69159000000002, "r": 476.01270000000005, "b": 236.27752999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.48445820808410645, "cells": [{"id": 2, "text": "Maksym Lysak", "bbox": {"l": 151.22598, "t": 171.67371000000003, "r": 217.04390999999998, "b": 180.47069999999997, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "[0000", "bbox": {"l": 217.04599, "t": 170.08209, "r": 235.18764, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "\u2212", "bbox": {"l": 235.18598999999998, "t": 169.69159000000002, "r": 241.4129, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "0002", "bbox": {"l": 241.41299000000004, "t": 170.08209, "r": 257.29932, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "\u2212", "bbox": {"l": 257.298, "t": 169.69159000000002, "r": 263.5249, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "3723", "bbox": {"l": 263.52499, "t": 170.08209, "r": 279.41132, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "\u2212", "bbox": {"l": 279.41, "t": 169.69159000000002, "r": 285.6369, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "$^{6960]}$, Ahmed Nassar[0000", "bbox": {"l": 285.63602, "t": 171.67371000000003, "r": 392.27664, "b": 180.47069999999997, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "\u2212", "bbox": {"l": 392.27502, "t": 169.69159000000002, "r": 398.50192, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "0002", "bbox": {"l": 398.50201, "t": 170.08209, "r": 414.38834, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "\u2212", "bbox": {"l": 414.38702, "t": 169.69159000000002, "r": 420.61392, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "9468", "bbox": {"l": 420.61304, "t": 170.08209, "r": 436.49936, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "\u2212", "bbox": {"l": 436.49805000000003, "t": 169.69159000000002, "r": 442.72495000000004, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "$^{0822]}$,", "bbox": {"l": 442.72504, "t": 171.67371000000003, "r": 464.12963999999994, "b": 180.47069999999997, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Nikolaos Livathinos", "bbox": {"l": 139.34305, "t": 183.62872000000004, "r": 224.80720999999997, "b": 192.42571999999996, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "[0000", "bbox": {"l": 224.80704000000003, "t": 182.03814999999997, "r": 242.94868, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "\u2212", "bbox": {"l": 242.94704000000002, "t": 181.64764000000002, "r": 249.17394999999996, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "0001", "bbox": {"l": 249.17404000000002, "t": 182.03814999999997, "r": 265.06036, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "\u2212", "bbox": {"l": 265.05905, "t": 181.64764000000002, "r": 271.28595, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "8513", "bbox": {"l": 271.28506, "t": 182.03814999999997, "r": 287.17139, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "\u2212", "bbox": {"l": 287.17007, "t": 181.64764000000002, "r": 293.39697, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "$^{3491]}$, Christoph Auer[0000", "bbox": {"l": 293.39706, "t": 183.62872000000004, "r": 404.1597, "b": 192.42571999999996, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "\u2212", "bbox": {"l": 404.15808, "t": 181.64764000000002, "r": 410.38498, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "0001", "bbox": {"l": 410.38507, "t": 182.03814999999997, "r": 426.27139, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "\u2212", "bbox": {"l": 426.27008, "t": 181.64764000000002, "r": 432.49697999999995, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "5761", "bbox": {"l": 432.49609, "t": 182.03814999999997, "r": 448.3824200000001, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "\u2212", "bbox": {"l": 448.3811, "t": 181.64764000000002, "r": 454.608, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "$^{0422]}$,", "bbox": {"l": 454.60808999999995, "t": 183.62872000000004, "r": 476.01270000000005, "b": 192.42571999999996, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "and Peter Staar", "bbox": {"l": 229.52109000000002, "t": 195.58374000000003, "r": 298.6087, "b": 204.38073999999995, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "[0000", "bbox": {"l": 298.60608, "t": 193.99316, "r": 316.74771, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "\u2212", "bbox": {"l": 316.74609, "t": 193.60266000000001, "r": 322.97299, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "0002", "bbox": {"l": 322.97308, "t": 193.99316, "r": 338.85941, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "\u2212", "bbox": {"l": 338.85809, "t": 193.60266000000001, "r": 345.08499, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "8088", "bbox": {"l": 345.08508, "t": 193.99316, "r": 360.97141, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "\u2212", "bbox": {"l": 360.97009, "t": 193.60266000000001, "r": 367.19699, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "0823]", "bbox": {"l": 367.19611, "t": 193.99316, "r": 385.33774, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "IBM Research", "bbox": {"l": 279.1051, "t": 217.20398, "r": 336.25153, "b": 225.27368, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "{mly,ahn,nli,cau,taa}@zurich.ibm.com", "bbox": {"l": 222.96609, "t": 228.80853000000002, "r": 392.38983, "b": 236.27752999999996, "coord_origin": "TOPLEFT"}}], "children": [{"id": 7, "label": "text", "bbox": {"l": 139.34305, "t": 169.69159000000002, "r": 476.01270000000005, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.7918068766593933, "cells": [{"id": 2, "text": "Maksym Lysak", "bbox": {"l": 151.22598, "t": 171.67371000000003, "r": 217.04390999999998, "b": 180.47069999999997, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "[0000", "bbox": {"l": 217.04599, "t": 170.08209, "r": 235.18764, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "\u2212", "bbox": {"l": 235.18598999999998, "t": 169.69159000000002, "r": 241.4129, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "0002", "bbox": {"l": 241.41299000000004, "t": 170.08209, "r": 257.29932, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "\u2212", "bbox": {"l": 257.298, "t": 169.69159000000002, "r": 263.5249, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "3723", "bbox": {"l": 263.52499, "t": 170.08209, "r": 279.41132, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "\u2212", "bbox": {"l": 279.41, "t": 169.69159000000002, "r": 285.6369, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "$^{6960]}$, Ahmed Nassar[0000", "bbox": {"l": 285.63602, "t": 171.67371000000003, "r": 392.27664, "b": 180.47069999999997, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "\u2212", "bbox": {"l": 392.27502, "t": 169.69159000000002, "r": 398.50192, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "0002", "bbox": {"l": 398.50201, "t": 170.08209, "r": 414.38834, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "\u2212", "bbox": {"l": 414.38702, "t": 169.69159000000002, "r": 420.61392, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "9468", "bbox": {"l": 420.61304, "t": 170.08209, "r": 436.49936, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "\u2212", "bbox": {"l": 436.49805000000003, "t": 169.69159000000002, "r": 442.72495000000004, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "$^{0822]}$,", "bbox": {"l": 442.72504, "t": 171.67371000000003, "r": 464.12963999999994, "b": 180.47069999999997, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Nikolaos Livathinos", "bbox": {"l": 139.34305, "t": 183.62872000000004, "r": 224.80720999999997, "b": 192.42571999999996, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "[0000", "bbox": {"l": 224.80704000000003, "t": 182.03814999999997, "r": 242.94868, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "\u2212", "bbox": {"l": 242.94704000000002, "t": 181.64764000000002, "r": 249.17394999999996, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "0001", "bbox": {"l": 249.17404000000002, "t": 182.03814999999997, "r": 265.06036, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "\u2212", "bbox": {"l": 265.05905, "t": 181.64764000000002, "r": 271.28595, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "8513", "bbox": {"l": 271.28506, "t": 182.03814999999997, "r": 287.17139, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "\u2212", "bbox": {"l": 287.17007, "t": 181.64764000000002, "r": 293.39697, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "$^{3491]}$, Christoph Auer[0000", "bbox": {"l": 293.39706, "t": 183.62872000000004, "r": 404.1597, "b": 192.42571999999996, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "\u2212", "bbox": {"l": 404.15808, "t": 181.64764000000002, "r": 410.38498, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "0001", "bbox": {"l": 410.38507, "t": 182.03814999999997, "r": 426.27139, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "\u2212", "bbox": {"l": 426.27008, "t": 181.64764000000002, "r": 432.49697999999995, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "5761", "bbox": {"l": 432.49609, "t": 182.03814999999997, "r": 448.3824200000001, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "\u2212", "bbox": {"l": 448.3811, "t": 181.64764000000002, "r": 454.608, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "$^{0422]}$,", "bbox": {"l": 454.60808999999995, "t": 183.62872000000004, "r": 476.01270000000005, "b": 192.42571999999996, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "[0000", "bbox": {"l": 298.60608, "t": 193.99316, "r": 316.74771, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "\u2212", "bbox": {"l": 316.74609, "t": 193.60266000000001, "r": 322.97299, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "0002", "bbox": {"l": 322.97308, "t": 193.99316, "r": 338.85941, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "\u2212", "bbox": {"l": 338.85809, "t": 193.60266000000001, "r": 345.08499, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "8088", "bbox": {"l": 345.08508, "t": 193.99316, "r": 360.97141, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "\u2212", "bbox": {"l": 360.97009, "t": 193.60266000000001, "r": 367.19699, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "0823]", "bbox": {"l": 367.19611, "t": 193.99316, "r": 385.33774, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 229.52109000000002, "t": 195.58374000000003, "r": 298.6087, "b": 204.38073999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.5015263557434082, "cells": [{"id": 30, "text": "and Peter Staar", "bbox": {"l": 229.52109000000002, "t": 195.58374000000003, "r": 298.6087, "b": 204.38073999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 279.1051, "t": 217.20398, "r": 336.25153, "b": 225.27368, "coord_origin": "TOPLEFT"}, "confidence": 0.6310867667198181, "cells": [{"id": 38, "text": "IBM Research", "bbox": {"l": 279.1051, "t": 217.20398, "r": 336.25153, "b": 225.27368, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "text", "bbox": {"l": 222.96609, "t": 228.80853000000002, "r": 392.38983, "b": 236.27752999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.6924149990081787, "cells": [{"id": 39, "text": "{mly,ahn,nli,cau,taa}@zurich.ibm.com", "bbox": {"l": 222.96609, "t": 228.80853000000002, "r": 392.38983, "b": 236.27752999999996, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 1, "label": "text", "bbox": {"l": 163.1111, "t": 270.30115, "r": 452.24878000000007, "b": 464.73447, "coord_origin": "TOPLEFT"}, "confidence": 0.9807654023170471, "cells": [{"id": 40, "text": "Abstract.", "bbox": {"l": 163.1111, "t": 270.30115, "r": 206.6358, "b": 278.22748, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Extracting tables from documents is a crucial task in any", "bbox": {"l": 211.6171, "t": 270.36395000000005, "r": 452.2447199999999, "b": 278.43364999999994, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "document conversion pipeline. Recently, transformer-based models have", "bbox": {"l": 163.1111, "t": 281.3229099999999, "r": 452.24246, "b": 289.39267, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "demonstrated that table-structure can be recognized with impressive ac-", "bbox": {"l": 163.1111, "t": 292.28189, "r": 452.24792, "b": 300.35165000000006, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "curacy using Image-to-Markup-Sequence (Im2Seq) approaches. Taking", "bbox": {"l": 163.1111, "t": 303.24088, "r": 452.2407799999999, "b": 311.31064, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "only the image of a table, such models predict a sequence of tokens (e.g.", "bbox": {"l": 163.1111, "t": 314.19888, "r": 452.24609, "b": 322.26865, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "in HTML, LaTeX) which represent the structure of the table. Since the", "bbox": {"l": 163.1111, "t": 325.15787, "r": 452.24615000000006, "b": 333.22763, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "token representation of the table structure has a significant impact on", "bbox": {"l": 163.1111, "t": 336.11685, "r": 452.24707, "b": 344.18661, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "the accuracy and run-time performance of any Im2Seq model, we inves-", "bbox": {"l": 163.1111, "t": 347.07584, "r": 452.2459999999999, "b": 355.1456, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "tigate in this paper how table-structure representation can be optimised.", "bbox": {"l": 163.1111, "t": 358.03482, "r": 452.2479900000001, "b": 366.10458, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "We propose a new, optimised table-structure language (OTSL) with a", "bbox": {"l": 163.1111, "t": 368.9938, "r": 452.24609, "b": 377.06357, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "minimized vocabulary and specific rules. The benefits of OTSL are that", "bbox": {"l": 163.1111, "t": 379.95279, "r": 452.2417, "b": 388.02255, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "it reduces the number of tokens to 5 (HTML needs 28+) and shortens", "bbox": {"l": 163.1111, "t": 390.91177, "r": 452.2443200000001, "b": 398.98154, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "the sequence length to half of HTML on average. Consequently, model", "bbox": {"l": 163.1111, "t": 401.87076, "r": 452.24878000000007, "b": 409.94052, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "accuracy improves significantly, inference time is halved compared to", "bbox": {"l": 163.1111, "t": 412.82974, "r": 452.24063000000007, "b": 420.8995100000001, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "HTML-based models, and the predicted table structures are always syn-", "bbox": {"l": 163.1111, "t": 423.78774999999996, "r": 452.24161, "b": 431.85751000000005, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "tactically correct. This in turn eliminates most post-processing needs.", "bbox": {"l": 163.1111, "t": 434.74673, "r": 452.24429, "b": 442.8165, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Popular table structure data-sets will be published in OTSL format to", "bbox": {"l": 163.1111, "t": 445.70572000000004, "r": 452.24603, "b": 453.77547999999996, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "the community.", "bbox": {"l": 163.1111, "t": 456.6647, "r": 225.56116, "b": 464.73447, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "text", "bbox": {"l": 163.1111, "t": 478.69394, "r": 452.24158, "b": 497.78549, "coord_origin": "TOPLEFT"}, "confidence": 0.9304055571556091, "cells": [{"id": 59, "text": "Keywords:", "bbox": {"l": 163.1111, "t": 478.69394, "r": 211.94211, "b": 486.62024, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Table Structure Recognition \u00b7 Data Representation \u00b7 Trans-", "bbox": {"l": 216.55208999999996, "t": 478.75671, "r": 452.24158, "b": 486.82648, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "formers \u00b7 Optimization.", "bbox": {"l": 163.11111, "t": 489.71573, "r": 257.64185, "b": 497.78549, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "section_header", "bbox": {"l": 134.76512, "t": 522.11969, "r": 228.93384, "b": 532.68808, "coord_origin": "TOPLEFT"}, "confidence": 0.9392016530036926, "cells": [{"id": 62, "text": "1", "bbox": {"l": 134.76512, "t": 522.11969, "r": 141.48872, "b": 532.68808, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "Introduction", "bbox": {"l": 154.93832, "t": 522.11969, "r": 228.93384, "b": 532.68808, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 134.76512, "t": 548.2865400000001, "r": 480.5959500000001, "b": 628.81451, "coord_origin": "TOPLEFT"}, "confidence": 0.9835679531097412, "cells": [{"id": 64, "text": "Tables are ubiquitous in documents such as scientific papers, patents, reports,", "bbox": {"l": 134.76512, "t": 548.2865400000001, "r": 480.5939, "b": 557.0835099999999, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "manuals, specification sheets or marketing material. They often encode highly", "bbox": {"l": 134.76512, "t": 560.24254, "r": 480.59180000000003, "b": 569.0395100000001, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "valuable information and therefore need to be extracted with high accuracy.", "bbox": {"l": 134.76512, "t": 572.19754, "r": 480.59283000000005, "b": 580.99451, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "Unfortunately, tables appear in documents in various sizes, styling and struc-", "bbox": {"l": 134.76512, "t": 584.15254, "r": 480.5959500000001, "b": 592.9495099999999, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "ture, making it difficult to recover their correct structure with simple analyt-", "bbox": {"l": 134.76512, "t": 596.10754, "r": 480.58688, "b": 604.90451, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "ical methods. Therefore, accurate table extraction is achieved these days with", "bbox": {"l": 134.76512, "t": 608.06255, "r": 480.59088, "b": 616.85951, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "machine-learning based methods.", "bbox": {"l": 134.76512, "t": 620.01755, "r": 279.32745, "b": 628.81451, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 134.76512, "t": 632.14755, "r": 480.59583, "b": 664.85453, "coord_origin": "TOPLEFT"}, "confidence": 0.9696458578109741, "cells": [{"id": 71, "text": "In modern document understanding systems [1,15], table extraction is typi-", "bbox": {"l": 149.70811, "t": 632.14755, "r": 480.58899, "b": 640.94452, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "cally a two-step process. Firstly, every table on a page is located with a bounding", "bbox": {"l": 134.76512, "t": 644.1025500000001, "r": 480.59583, "b": 652.8995199999999, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "box, and secondly, their logical row and column structure is recognized. As of", "bbox": {"l": 134.76512, "t": 656.05756, "r": 480.59496999999993, "b": 664.85453, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "page_header", "bbox": {"l": 18.340218, "t": 209.47997999999995, "r": 36.339787, "b": 555.00003, "coord_origin": "TOPLEFT"}, "confidence": 0.8899643421173096, "cells": [{"id": 74, "text": "arXiv:2305.03393v1 [cs.CV] 5 May 2023", "bbox": {"l": 18.340218, "t": 209.47997999999995, "r": 36.339787, "b": 555.00003, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "section_header", "id": 5, "page_no": 0, "cluster": {"id": 5, "label": "section_header", "bbox": {"l": 134.765, "t": 115.89910999999995, "r": 480.59735, "b": 146.51409999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.8918349742889404, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure", "bbox": {"l": 134.765, "t": 115.89910999999995, "r": 480.59735, "b": 128.58112000000006, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Recognition", "bbox": {"l": 266.67499, "t": 133.83209, "r": 348.68506, "b": 146.51409999999998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Optimized Table Tokenization for Table Structure Recognition"}, {"label": "key_value_region", "id": 16, "page_no": 0, "cluster": {"id": 16, "label": "key_value_region", "bbox": {"l": 139.34305, "t": 169.69159000000002, "r": 476.01270000000005, "b": 236.27752999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.48445820808410645, "cells": [{"id": 2, "text": "Maksym Lysak", "bbox": {"l": 151.22598, "t": 171.67371000000003, "r": 217.04390999999998, "b": 180.47069999999997, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "[0000", "bbox": {"l": 217.04599, "t": 170.08209, "r": 235.18764, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "\u2212", "bbox": {"l": 235.18598999999998, "t": 169.69159000000002, "r": 241.4129, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "0002", "bbox": {"l": 241.41299000000004, "t": 170.08209, "r": 257.29932, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "\u2212", "bbox": {"l": 257.298, "t": 169.69159000000002, "r": 263.5249, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "3723", "bbox": {"l": 263.52499, "t": 170.08209, "r": 279.41132, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "\u2212", "bbox": {"l": 279.41, "t": 169.69159000000002, "r": 285.6369, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "$^{6960]}$, Ahmed Nassar[0000", "bbox": {"l": 285.63602, "t": 171.67371000000003, "r": 392.27664, "b": 180.47069999999997, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "\u2212", "bbox": {"l": 392.27502, "t": 169.69159000000002, "r": 398.50192, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "0002", "bbox": {"l": 398.50201, "t": 170.08209, "r": 414.38834, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "\u2212", "bbox": {"l": 414.38702, "t": 169.69159000000002, "r": 420.61392, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "9468", "bbox": {"l": 420.61304, "t": 170.08209, "r": 436.49936, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "\u2212", "bbox": {"l": 436.49805000000003, "t": 169.69159000000002, "r": 442.72495000000004, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "$^{0822]}$,", "bbox": {"l": 442.72504, "t": 171.67371000000003, "r": 464.12963999999994, "b": 180.47069999999997, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Nikolaos Livathinos", "bbox": {"l": 139.34305, "t": 183.62872000000004, "r": 224.80720999999997, "b": 192.42571999999996, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "[0000", "bbox": {"l": 224.80704000000003, "t": 182.03814999999997, "r": 242.94868, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "\u2212", "bbox": {"l": 242.94704000000002, "t": 181.64764000000002, "r": 249.17394999999996, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "0001", "bbox": {"l": 249.17404000000002, "t": 182.03814999999997, "r": 265.06036, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "\u2212", "bbox": {"l": 265.05905, "t": 181.64764000000002, "r": 271.28595, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "8513", "bbox": {"l": 271.28506, "t": 182.03814999999997, "r": 287.17139, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "\u2212", "bbox": {"l": 287.17007, "t": 181.64764000000002, "r": 293.39697, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "$^{3491]}$, Christoph Auer[0000", "bbox": {"l": 293.39706, "t": 183.62872000000004, "r": 404.1597, "b": 192.42571999999996, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "\u2212", "bbox": {"l": 404.15808, "t": 181.64764000000002, "r": 410.38498, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "0001", "bbox": {"l": 410.38507, "t": 182.03814999999997, "r": 426.27139, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "\u2212", "bbox": {"l": 426.27008, "t": 181.64764000000002, "r": 432.49697999999995, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "5761", "bbox": {"l": 432.49609, "t": 182.03814999999997, "r": 448.3824200000001, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "\u2212", "bbox": {"l": 448.3811, "t": 181.64764000000002, "r": 454.608, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "$^{0422]}$,", "bbox": {"l": 454.60808999999995, "t": 183.62872000000004, "r": 476.01270000000005, "b": 192.42571999999996, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "and Peter Staar", "bbox": {"l": 229.52109000000002, "t": 195.58374000000003, "r": 298.6087, "b": 204.38073999999995, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "[0000", "bbox": {"l": 298.60608, "t": 193.99316, "r": 316.74771, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "\u2212", "bbox": {"l": 316.74609, "t": 193.60266000000001, "r": 322.97299, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "0002", "bbox": {"l": 322.97308, "t": 193.99316, "r": 338.85941, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "\u2212", "bbox": {"l": 338.85809, "t": 193.60266000000001, "r": 345.08499, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "8088", "bbox": {"l": 345.08508, "t": 193.99316, "r": 360.97141, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "\u2212", "bbox": {"l": 360.97009, "t": 193.60266000000001, "r": 367.19699, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "0823]", "bbox": {"l": 367.19611, "t": 193.99316, "r": 385.33774, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "IBM Research", "bbox": {"l": 279.1051, "t": 217.20398, "r": 336.25153, "b": 225.27368, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "{mly,ahn,nli,cau,taa}@zurich.ibm.com", "bbox": {"l": 222.96609, "t": 228.80853000000002, "r": 392.38983, "b": 236.27752999999996, "coord_origin": "TOPLEFT"}}], "children": [{"id": 7, "label": "text", "bbox": {"l": 139.34305, "t": 169.69159000000002, "r": 476.01270000000005, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.7918068766593933, "cells": [{"id": 2, "text": "Maksym Lysak", "bbox": {"l": 151.22598, "t": 171.67371000000003, "r": 217.04390999999998, "b": 180.47069999999997, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "[0000", "bbox": {"l": 217.04599, "t": 170.08209, "r": 235.18764, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "\u2212", "bbox": {"l": 235.18598999999998, "t": 169.69159000000002, "r": 241.4129, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "0002", "bbox": {"l": 241.41299000000004, "t": 170.08209, "r": 257.29932, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "\u2212", "bbox": {"l": 257.298, "t": 169.69159000000002, "r": 263.5249, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "3723", "bbox": {"l": 263.52499, "t": 170.08209, "r": 279.41132, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "\u2212", "bbox": {"l": 279.41, "t": 169.69159000000002, "r": 285.6369, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "$^{6960]}$, Ahmed Nassar[0000", "bbox": {"l": 285.63602, "t": 171.67371000000003, "r": 392.27664, "b": 180.47069999999997, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "\u2212", "bbox": {"l": 392.27502, "t": 169.69159000000002, "r": 398.50192, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "0002", "bbox": {"l": 398.50201, "t": 170.08209, "r": 414.38834, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "\u2212", "bbox": {"l": 414.38702, "t": 169.69159000000002, "r": 420.61392, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "9468", "bbox": {"l": 420.61304, "t": 170.08209, "r": 436.49936, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "\u2212", "bbox": {"l": 436.49805000000003, "t": 169.69159000000002, "r": 442.72495000000004, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "$^{0822]}$,", "bbox": {"l": 442.72504, "t": 171.67371000000003, "r": 464.12963999999994, "b": 180.47069999999997, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Nikolaos Livathinos", "bbox": {"l": 139.34305, "t": 183.62872000000004, "r": 224.80720999999997, "b": 192.42571999999996, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "[0000", "bbox": {"l": 224.80704000000003, "t": 182.03814999999997, "r": 242.94868, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "\u2212", "bbox": {"l": 242.94704000000002, "t": 181.64764000000002, "r": 249.17394999999996, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "0001", "bbox": {"l": 249.17404000000002, "t": 182.03814999999997, "r": 265.06036, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "\u2212", "bbox": {"l": 265.05905, "t": 181.64764000000002, "r": 271.28595, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "8513", "bbox": {"l": 271.28506, "t": 182.03814999999997, "r": 287.17139, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "\u2212", "bbox": {"l": 287.17007, "t": 181.64764000000002, "r": 293.39697, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "$^{3491]}$, Christoph Auer[0000", "bbox": {"l": 293.39706, "t": 183.62872000000004, "r": 404.1597, "b": 192.42571999999996, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "\u2212", "bbox": {"l": 404.15808, "t": 181.64764000000002, "r": 410.38498, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "0001", "bbox": {"l": 410.38507, "t": 182.03814999999997, "r": 426.27139, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "\u2212", "bbox": {"l": 426.27008, "t": 181.64764000000002, "r": 432.49697999999995, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "5761", "bbox": {"l": 432.49609, "t": 182.03814999999997, "r": 448.3824200000001, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "\u2212", "bbox": {"l": 448.3811, "t": 181.64764000000002, "r": 454.608, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "$^{0422]}$,", "bbox": {"l": 454.60808999999995, "t": 183.62872000000004, "r": 476.01270000000005, "b": 192.42571999999996, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "[0000", "bbox": {"l": 298.60608, "t": 193.99316, "r": 316.74771, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "\u2212", "bbox": {"l": 316.74609, "t": 193.60266000000001, "r": 322.97299, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "0002", "bbox": {"l": 322.97308, "t": 193.99316, "r": 338.85941, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "\u2212", "bbox": {"l": 338.85809, "t": 193.60266000000001, "r": 345.08499, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "8088", "bbox": {"l": 345.08508, "t": 193.99316, "r": 360.97141, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "\u2212", "bbox": {"l": 360.97009, "t": 193.60266000000001, "r": 367.19699, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "0823]", "bbox": {"l": 367.19611, "t": 193.99316, "r": 385.33774, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 229.52109000000002, "t": 195.58374000000003, "r": 298.6087, "b": 204.38073999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.5015263557434082, "cells": [{"id": 30, "text": "and Peter Staar", "bbox": {"l": 229.52109000000002, "t": 195.58374000000003, "r": 298.6087, "b": 204.38073999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 279.1051, "t": 217.20398, "r": 336.25153, "b": 225.27368, "coord_origin": "TOPLEFT"}, "confidence": 0.6310867667198181, "cells": [{"id": 38, "text": "IBM Research", "bbox": {"l": 279.1051, "t": 217.20398, "r": 336.25153, "b": 225.27368, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "text", "bbox": {"l": 222.96609, "t": 228.80853000000002, "r": 392.38983, "b": 236.27752999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.6924149990081787, "cells": [{"id": 39, "text": "{mly,ahn,nli,cau,taa}@zurich.ibm.com", "bbox": {"l": 222.96609, "t": 228.80853000000002, "r": 392.38983, "b": 236.27752999999996, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null}, {"label": "text", "id": 1, "page_no": 0, "cluster": {"id": 1, "label": "text", "bbox": {"l": 163.1111, "t": 270.30115, "r": 452.24878000000007, "b": 464.73447, "coord_origin": "TOPLEFT"}, "confidence": 0.9807654023170471, "cells": [{"id": 40, "text": "Abstract.", "bbox": {"l": 163.1111, "t": 270.30115, "r": 206.6358, "b": 278.22748, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Extracting tables from documents is a crucial task in any", "bbox": {"l": 211.6171, "t": 270.36395000000005, "r": 452.2447199999999, "b": 278.43364999999994, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "document conversion pipeline. Recently, transformer-based models have", "bbox": {"l": 163.1111, "t": 281.3229099999999, "r": 452.24246, "b": 289.39267, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "demonstrated that table-structure can be recognized with impressive ac-", "bbox": {"l": 163.1111, "t": 292.28189, "r": 452.24792, "b": 300.35165000000006, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "curacy using Image-to-Markup-Sequence (Im2Seq) approaches. Taking", "bbox": {"l": 163.1111, "t": 303.24088, "r": 452.2407799999999, "b": 311.31064, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "only the image of a table, such models predict a sequence of tokens (e.g.", "bbox": {"l": 163.1111, "t": 314.19888, "r": 452.24609, "b": 322.26865, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "in HTML, LaTeX) which represent the structure of the table. Since the", "bbox": {"l": 163.1111, "t": 325.15787, "r": 452.24615000000006, "b": 333.22763, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "token representation of the table structure has a significant impact on", "bbox": {"l": 163.1111, "t": 336.11685, "r": 452.24707, "b": 344.18661, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "the accuracy and run-time performance of any Im2Seq model, we inves-", "bbox": {"l": 163.1111, "t": 347.07584, "r": 452.2459999999999, "b": 355.1456, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "tigate in this paper how table-structure representation can be optimised.", "bbox": {"l": 163.1111, "t": 358.03482, "r": 452.2479900000001, "b": 366.10458, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "We propose a new, optimised table-structure language (OTSL) with a", "bbox": {"l": 163.1111, "t": 368.9938, "r": 452.24609, "b": 377.06357, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "minimized vocabulary and specific rules. The benefits of OTSL are that", "bbox": {"l": 163.1111, "t": 379.95279, "r": 452.2417, "b": 388.02255, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "it reduces the number of tokens to 5 (HTML needs 28+) and shortens", "bbox": {"l": 163.1111, "t": 390.91177, "r": 452.2443200000001, "b": 398.98154, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "the sequence length to half of HTML on average. Consequently, model", "bbox": {"l": 163.1111, "t": 401.87076, "r": 452.24878000000007, "b": 409.94052, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "accuracy improves significantly, inference time is halved compared to", "bbox": {"l": 163.1111, "t": 412.82974, "r": 452.24063000000007, "b": 420.8995100000001, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "HTML-based models, and the predicted table structures are always syn-", "bbox": {"l": 163.1111, "t": 423.78774999999996, "r": 452.24161, "b": 431.85751000000005, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "tactically correct. This in turn eliminates most post-processing needs.", "bbox": {"l": 163.1111, "t": 434.74673, "r": 452.24429, "b": 442.8165, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Popular table structure data-sets will be published in OTSL format to", "bbox": {"l": 163.1111, "t": 445.70572000000004, "r": 452.24603, "b": 453.77547999999996, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "the community.", "bbox": {"l": 163.1111, "t": 456.6647, "r": 225.56116, "b": 464.73447, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Abstract. Extracting tables from documents is a crucial task in any document conversion pipeline. Recently, transformer-based models have demonstrated that table-structure can be recognized with impressive accuracy using Image-to-Markup-Sequence (Im2Seq) approaches. Taking only the image of a table, such models predict a sequence of tokens (e.g. in HTML, LaTeX) which represent the structure of the table. Since the token representation of the table structure has a significant impact on the accuracy and run-time performance of any Im2Seq model, we investigate in this paper how table-structure representation can be optimised. We propose a new, optimised table-structure language (OTSL) with a minimized vocabulary and specific rules. The benefits of OTSL are that it reduces the number of tokens to 5 (HTML needs 28+) and shortens the sequence length to half of HTML on average. Consequently, model accuracy improves significantly, inference time is halved compared to HTML-based models, and the predicted table structures are always syntactically correct. This in turn eliminates most post-processing needs. Popular table structure data-sets will be published in OTSL format to the community."}, {"label": "text", "id": 4, "page_no": 0, "cluster": {"id": 4, "label": "text", "bbox": {"l": 163.1111, "t": 478.69394, "r": 452.24158, "b": 497.78549, "coord_origin": "TOPLEFT"}, "confidence": 0.9304055571556091, "cells": [{"id": 59, "text": "Keywords:", "bbox": {"l": 163.1111, "t": 478.69394, "r": 211.94211, "b": 486.62024, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Table Structure Recognition \u00b7 Data Representation \u00b7 Trans-", "bbox": {"l": 216.55208999999996, "t": 478.75671, "r": 452.24158, "b": 486.82648, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "formers \u00b7 Optimization.", "bbox": {"l": 163.11111, "t": 489.71573, "r": 257.64185, "b": 497.78549, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Keywords: Table Structure Recognition \u00b7 Data Representation \u00b7 Transformers \u00b7 Optimization."}, {"label": "section_header", "id": 3, "page_no": 0, "cluster": {"id": 3, "label": "section_header", "bbox": {"l": 134.76512, "t": 522.11969, "r": 228.93384, "b": 532.68808, "coord_origin": "TOPLEFT"}, "confidence": 0.9392016530036926, "cells": [{"id": 62, "text": "1", "bbox": {"l": 134.76512, "t": 522.11969, "r": 141.48872, "b": 532.68808, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "Introduction", "bbox": {"l": 154.93832, "t": 522.11969, "r": 228.93384, "b": 532.68808, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1 Introduction"}, {"label": "text", "id": 0, "page_no": 0, "cluster": {"id": 0, "label": "text", "bbox": {"l": 134.76512, "t": 548.2865400000001, "r": 480.5959500000001, "b": 628.81451, "coord_origin": "TOPLEFT"}, "confidence": 0.9835679531097412, "cells": [{"id": 64, "text": "Tables are ubiquitous in documents such as scientific papers, patents, reports,", "bbox": {"l": 134.76512, "t": 548.2865400000001, "r": 480.5939, "b": 557.0835099999999, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "manuals, specification sheets or marketing material. They often encode highly", "bbox": {"l": 134.76512, "t": 560.24254, "r": 480.59180000000003, "b": 569.0395100000001, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "valuable information and therefore need to be extracted with high accuracy.", "bbox": {"l": 134.76512, "t": 572.19754, "r": 480.59283000000005, "b": 580.99451, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "Unfortunately, tables appear in documents in various sizes, styling and struc-", "bbox": {"l": 134.76512, "t": 584.15254, "r": 480.5959500000001, "b": 592.9495099999999, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "ture, making it difficult to recover their correct structure with simple analyt-", "bbox": {"l": 134.76512, "t": 596.10754, "r": 480.58688, "b": 604.90451, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "ical methods. Therefore, accurate table extraction is achieved these days with", "bbox": {"l": 134.76512, "t": 608.06255, "r": 480.59088, "b": 616.85951, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "machine-learning based methods.", "bbox": {"l": 134.76512, "t": 620.01755, "r": 279.32745, "b": 628.81451, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Tables are ubiquitous in documents such as scientific papers, patents, reports, manuals, specification sheets or marketing material. They often encode highly valuable information and therefore need to be extracted with high accuracy. Unfortunately, tables appear in documents in various sizes, styling and structure, making it difficult to recover their correct structure with simple analytical methods. Therefore, accurate table extraction is achieved these days with machine-learning based methods."}, {"label": "text", "id": 2, "page_no": 0, "cluster": {"id": 2, "label": "text", "bbox": {"l": 134.76512, "t": 632.14755, "r": 480.59583, "b": 664.85453, "coord_origin": "TOPLEFT"}, "confidence": 0.9696458578109741, "cells": [{"id": 71, "text": "In modern document understanding systems [1,15], table extraction is typi-", "bbox": {"l": 149.70811, "t": 632.14755, "r": 480.58899, "b": 640.94452, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "cally a two-step process. Firstly, every table on a page is located with a bounding", "bbox": {"l": 134.76512, "t": 644.1025500000001, "r": 480.59583, "b": 652.8995199999999, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "box, and secondly, their logical row and column structure is recognized. As of", "bbox": {"l": 134.76512, "t": 656.05756, "r": 480.59496999999993, "b": 664.85453, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In modern document understanding systems [1,15], table extraction is typically a two-step process. Firstly, every table on a page is located with a bounding box, and secondly, their logical row and column structure is recognized. As of"}, {"label": "page_header", "id": 6, "page_no": 0, "cluster": {"id": 6, "label": "page_header", "bbox": {"l": 18.340218, "t": 209.47997999999995, "r": 36.339787, "b": 555.00003, "coord_origin": "TOPLEFT"}, "confidence": 0.8899643421173096, "cells": [{"id": 74, "text": "arXiv:2305.03393v1 [cs.CV] 5 May 2023", "bbox": {"l": 18.340218, "t": 209.47997999999995, "r": 36.339787, "b": 555.00003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "arXiv:2305.03393v1 [cs.CV] 5 May 2023"}], "body": [{"label": "section_header", "id": 5, "page_no": 0, "cluster": {"id": 5, "label": "section_header", "bbox": {"l": 134.765, "t": 115.89910999999995, "r": 480.59735, "b": 146.51409999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.8918349742889404, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure", "bbox": {"l": 134.765, "t": 115.89910999999995, "r": 480.59735, "b": 128.58112000000006, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Recognition", "bbox": {"l": 266.67499, "t": 133.83209, "r": 348.68506, "b": 146.51409999999998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Optimized Table Tokenization for Table Structure Recognition"}, {"label": "key_value_region", "id": 16, "page_no": 0, "cluster": {"id": 16, "label": "key_value_region", "bbox": {"l": 139.34305, "t": 169.69159000000002, "r": 476.01270000000005, "b": 236.27752999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.48445820808410645, "cells": [{"id": 2, "text": "Maksym Lysak", "bbox": {"l": 151.22598, "t": 171.67371000000003, "r": 217.04390999999998, "b": 180.47069999999997, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "[0000", "bbox": {"l": 217.04599, "t": 170.08209, "r": 235.18764, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "\u2212", "bbox": {"l": 235.18598999999998, "t": 169.69159000000002, "r": 241.4129, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "0002", "bbox": {"l": 241.41299000000004, "t": 170.08209, "r": 257.29932, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "\u2212", "bbox": {"l": 257.298, "t": 169.69159000000002, "r": 263.5249, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "3723", "bbox": {"l": 263.52499, "t": 170.08209, "r": 279.41132, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "\u2212", "bbox": {"l": 279.41, "t": 169.69159000000002, "r": 285.6369, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "$^{6960]}$, Ahmed Nassar[0000", "bbox": {"l": 285.63602, "t": 171.67371000000003, "r": 392.27664, "b": 180.47069999999997, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "\u2212", "bbox": {"l": 392.27502, "t": 169.69159000000002, "r": 398.50192, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "0002", "bbox": {"l": 398.50201, "t": 170.08209, "r": 414.38834, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "\u2212", "bbox": {"l": 414.38702, "t": 169.69159000000002, "r": 420.61392, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "9468", "bbox": {"l": 420.61304, "t": 170.08209, "r": 436.49936, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "\u2212", "bbox": {"l": 436.49805000000003, "t": 169.69159000000002, "r": 442.72495000000004, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "$^{0822]}$,", "bbox": {"l": 442.72504, "t": 171.67371000000003, "r": 464.12963999999994, "b": 180.47069999999997, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Nikolaos Livathinos", "bbox": {"l": 139.34305, "t": 183.62872000000004, "r": 224.80720999999997, "b": 192.42571999999996, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "[0000", "bbox": {"l": 224.80704000000003, "t": 182.03814999999997, "r": 242.94868, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "\u2212", "bbox": {"l": 242.94704000000002, "t": 181.64764000000002, "r": 249.17394999999996, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "0001", "bbox": {"l": 249.17404000000002, "t": 182.03814999999997, "r": 265.06036, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "\u2212", "bbox": {"l": 265.05905, "t": 181.64764000000002, "r": 271.28595, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "8513", "bbox": {"l": 271.28506, "t": 182.03814999999997, "r": 287.17139, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "\u2212", "bbox": {"l": 287.17007, "t": 181.64764000000002, "r": 293.39697, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "$^{3491]}$, Christoph Auer[0000", "bbox": {"l": 293.39706, "t": 183.62872000000004, "r": 404.1597, "b": 192.42571999999996, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "\u2212", "bbox": {"l": 404.15808, "t": 181.64764000000002, "r": 410.38498, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "0001", "bbox": {"l": 410.38507, "t": 182.03814999999997, "r": 426.27139, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "\u2212", "bbox": {"l": 426.27008, "t": 181.64764000000002, "r": 432.49697999999995, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "5761", "bbox": {"l": 432.49609, "t": 182.03814999999997, "r": 448.3824200000001, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "\u2212", "bbox": {"l": 448.3811, "t": 181.64764000000002, "r": 454.608, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "$^{0422]}$,", "bbox": {"l": 454.60808999999995, "t": 183.62872000000004, "r": 476.01270000000005, "b": 192.42571999999996, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "and Peter Staar", "bbox": {"l": 229.52109000000002, "t": 195.58374000000003, "r": 298.6087, "b": 204.38073999999995, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "[0000", "bbox": {"l": 298.60608, "t": 193.99316, "r": 316.74771, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "\u2212", "bbox": {"l": 316.74609, "t": 193.60266000000001, "r": 322.97299, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "0002", "bbox": {"l": 322.97308, "t": 193.99316, "r": 338.85941, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "\u2212", "bbox": {"l": 338.85809, "t": 193.60266000000001, "r": 345.08499, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "8088", "bbox": {"l": 345.08508, "t": 193.99316, "r": 360.97141, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "\u2212", "bbox": {"l": 360.97009, "t": 193.60266000000001, "r": 367.19699, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "0823]", "bbox": {"l": 367.19611, "t": 193.99316, "r": 385.33774, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "IBM Research", "bbox": {"l": 279.1051, "t": 217.20398, "r": 336.25153, "b": 225.27368, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "{mly,ahn,nli,cau,taa}@zurich.ibm.com", "bbox": {"l": 222.96609, "t": 228.80853000000002, "r": 392.38983, "b": 236.27752999999996, "coord_origin": "TOPLEFT"}}], "children": [{"id": 7, "label": "text", "bbox": {"l": 139.34305, "t": 169.69159000000002, "r": 476.01270000000005, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.7918068766593933, "cells": [{"id": 2, "text": "Maksym Lysak", "bbox": {"l": 151.22598, "t": 171.67371000000003, "r": 217.04390999999998, "b": 180.47069999999997, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "[0000", "bbox": {"l": 217.04599, "t": 170.08209, "r": 235.18764, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "\u2212", "bbox": {"l": 235.18598999999998, "t": 169.69159000000002, "r": 241.4129, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "0002", "bbox": {"l": 241.41299000000004, "t": 170.08209, "r": 257.29932, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "\u2212", "bbox": {"l": 257.298, "t": 169.69159000000002, "r": 263.5249, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "3723", "bbox": {"l": 263.52499, "t": 170.08209, "r": 279.41132, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "\u2212", "bbox": {"l": 279.41, "t": 169.69159000000002, "r": 285.6369, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "$^{6960]}$, Ahmed Nassar[0000", "bbox": {"l": 285.63602, "t": 171.67371000000003, "r": 392.27664, "b": 180.47069999999997, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "\u2212", "bbox": {"l": 392.27502, "t": 169.69159000000002, "r": 398.50192, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "0002", "bbox": {"l": 398.50201, "t": 170.08209, "r": 414.38834, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "\u2212", "bbox": {"l": 414.38702, "t": 169.69159000000002, "r": 420.61392, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "9468", "bbox": {"l": 420.61304, "t": 170.08209, "r": 436.49936, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "\u2212", "bbox": {"l": 436.49805000000003, "t": 169.69159000000002, "r": 442.72495000000004, "b": 176.27484000000004, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "$^{0822]}$,", "bbox": {"l": 442.72504, "t": 171.67371000000003, "r": 464.12963999999994, "b": 180.47069999999997, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Nikolaos Livathinos", "bbox": {"l": 139.34305, "t": 183.62872000000004, "r": 224.80720999999997, "b": 192.42571999999996, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "[0000", "bbox": {"l": 224.80704000000003, "t": 182.03814999999997, "r": 242.94868, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "\u2212", "bbox": {"l": 242.94704000000002, "t": 181.64764000000002, "r": 249.17394999999996, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "0001", "bbox": {"l": 249.17404000000002, "t": 182.03814999999997, "r": 265.06036, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "\u2212", "bbox": {"l": 265.05905, "t": 181.64764000000002, "r": 271.28595, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "8513", "bbox": {"l": 271.28506, "t": 182.03814999999997, "r": 287.17139, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "\u2212", "bbox": {"l": 287.17007, "t": 181.64764000000002, "r": 293.39697, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "$^{3491]}$, Christoph Auer[0000", "bbox": {"l": 293.39706, "t": 183.62872000000004, "r": 404.1597, "b": 192.42571999999996, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "\u2212", "bbox": {"l": 404.15808, "t": 181.64764000000002, "r": 410.38498, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "0001", "bbox": {"l": 410.38507, "t": 182.03814999999997, "r": 426.27139, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "\u2212", "bbox": {"l": 426.27008, "t": 181.64764000000002, "r": 432.49697999999995, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "5761", "bbox": {"l": 432.49609, "t": 182.03814999999997, "r": 448.3824200000001, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "\u2212", "bbox": {"l": 448.3811, "t": 181.64764000000002, "r": 454.608, "b": 188.23090000000002, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "$^{0422]}$,", "bbox": {"l": 454.60808999999995, "t": 183.62872000000004, "r": 476.01270000000005, "b": 192.42571999999996, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "[0000", "bbox": {"l": 298.60608, "t": 193.99316, "r": 316.74771, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "\u2212", "bbox": {"l": 316.74609, "t": 193.60266000000001, "r": 322.97299, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "0002", "bbox": {"l": 322.97308, "t": 193.99316, "r": 338.85941, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "\u2212", "bbox": {"l": 338.85809, "t": 193.60266000000001, "r": 345.08499, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "8088", "bbox": {"l": 345.08508, "t": 193.99316, "r": 360.97141, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "\u2212", "bbox": {"l": 360.97009, "t": 193.60266000000001, "r": 367.19699, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "0823]", "bbox": {"l": 367.19611, "t": 193.99316, "r": 385.33774, "b": 200.18591000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 229.52109000000002, "t": 195.58374000000003, "r": 298.6087, "b": 204.38073999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.5015263557434082, "cells": [{"id": 30, "text": "and Peter Staar", "bbox": {"l": 229.52109000000002, "t": 195.58374000000003, "r": 298.6087, "b": 204.38073999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 279.1051, "t": 217.20398, "r": 336.25153, "b": 225.27368, "coord_origin": "TOPLEFT"}, "confidence": 0.6310867667198181, "cells": [{"id": 38, "text": "IBM Research", "bbox": {"l": 279.1051, "t": 217.20398, "r": 336.25153, "b": 225.27368, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "text", "bbox": {"l": 222.96609, "t": 228.80853000000002, "r": 392.38983, "b": 236.27752999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.6924149990081787, "cells": [{"id": 39, "text": "{mly,ahn,nli,cau,taa}@zurich.ibm.com", "bbox": {"l": 222.96609, "t": 228.80853000000002, "r": 392.38983, "b": 236.27752999999996, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null}, {"label": "text", "id": 1, "page_no": 0, "cluster": {"id": 1, "label": "text", "bbox": {"l": 163.1111, "t": 270.30115, "r": 452.24878000000007, "b": 464.73447, "coord_origin": "TOPLEFT"}, "confidence": 0.9807654023170471, "cells": [{"id": 40, "text": "Abstract.", "bbox": {"l": 163.1111, "t": 270.30115, "r": 206.6358, "b": 278.22748, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Extracting tables from documents is a crucial task in any", "bbox": {"l": 211.6171, "t": 270.36395000000005, "r": 452.2447199999999, "b": 278.43364999999994, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "document conversion pipeline. Recently, transformer-based models have", "bbox": {"l": 163.1111, "t": 281.3229099999999, "r": 452.24246, "b": 289.39267, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "demonstrated that table-structure can be recognized with impressive ac-", "bbox": {"l": 163.1111, "t": 292.28189, "r": 452.24792, "b": 300.35165000000006, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "curacy using Image-to-Markup-Sequence (Im2Seq) approaches. Taking", "bbox": {"l": 163.1111, "t": 303.24088, "r": 452.2407799999999, "b": 311.31064, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "only the image of a table, such models predict a sequence of tokens (e.g.", "bbox": {"l": 163.1111, "t": 314.19888, "r": 452.24609, "b": 322.26865, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "in HTML, LaTeX) which represent the structure of the table. Since the", "bbox": {"l": 163.1111, "t": 325.15787, "r": 452.24615000000006, "b": 333.22763, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "token representation of the table structure has a significant impact on", "bbox": {"l": 163.1111, "t": 336.11685, "r": 452.24707, "b": 344.18661, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "the accuracy and run-time performance of any Im2Seq model, we inves-", "bbox": {"l": 163.1111, "t": 347.07584, "r": 452.2459999999999, "b": 355.1456, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "tigate in this paper how table-structure representation can be optimised.", "bbox": {"l": 163.1111, "t": 358.03482, "r": 452.2479900000001, "b": 366.10458, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "We propose a new, optimised table-structure language (OTSL) with a", "bbox": {"l": 163.1111, "t": 368.9938, "r": 452.24609, "b": 377.06357, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "minimized vocabulary and specific rules. The benefits of OTSL are that", "bbox": {"l": 163.1111, "t": 379.95279, "r": 452.2417, "b": 388.02255, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "it reduces the number of tokens to 5 (HTML needs 28+) and shortens", "bbox": {"l": 163.1111, "t": 390.91177, "r": 452.2443200000001, "b": 398.98154, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "the sequence length to half of HTML on average. Consequently, model", "bbox": {"l": 163.1111, "t": 401.87076, "r": 452.24878000000007, "b": 409.94052, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "accuracy improves significantly, inference time is halved compared to", "bbox": {"l": 163.1111, "t": 412.82974, "r": 452.24063000000007, "b": 420.8995100000001, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "HTML-based models, and the predicted table structures are always syn-", "bbox": {"l": 163.1111, "t": 423.78774999999996, "r": 452.24161, "b": 431.85751000000005, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "tactically correct. This in turn eliminates most post-processing needs.", "bbox": {"l": 163.1111, "t": 434.74673, "r": 452.24429, "b": 442.8165, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Popular table structure data-sets will be published in OTSL format to", "bbox": {"l": 163.1111, "t": 445.70572000000004, "r": 452.24603, "b": 453.77547999999996, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "the community.", "bbox": {"l": 163.1111, "t": 456.6647, "r": 225.56116, "b": 464.73447, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Abstract. Extracting tables from documents is a crucial task in any document conversion pipeline. Recently, transformer-based models have demonstrated that table-structure can be recognized with impressive accuracy using Image-to-Markup-Sequence (Im2Seq) approaches. Taking only the image of a table, such models predict a sequence of tokens (e.g. in HTML, LaTeX) which represent the structure of the table. Since the token representation of the table structure has a significant impact on the accuracy and run-time performance of any Im2Seq model, we investigate in this paper how table-structure representation can be optimised. We propose a new, optimised table-structure language (OTSL) with a minimized vocabulary and specific rules. The benefits of OTSL are that it reduces the number of tokens to 5 (HTML needs 28+) and shortens the sequence length to half of HTML on average. Consequently, model accuracy improves significantly, inference time is halved compared to HTML-based models, and the predicted table structures are always syntactically correct. This in turn eliminates most post-processing needs. Popular table structure data-sets will be published in OTSL format to the community."}, {"label": "text", "id": 4, "page_no": 0, "cluster": {"id": 4, "label": "text", "bbox": {"l": 163.1111, "t": 478.69394, "r": 452.24158, "b": 497.78549, "coord_origin": "TOPLEFT"}, "confidence": 0.9304055571556091, "cells": [{"id": 59, "text": "Keywords:", "bbox": {"l": 163.1111, "t": 478.69394, "r": 211.94211, "b": 486.62024, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Table Structure Recognition \u00b7 Data Representation \u00b7 Trans-", "bbox": {"l": 216.55208999999996, "t": 478.75671, "r": 452.24158, "b": 486.82648, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "formers \u00b7 Optimization.", "bbox": {"l": 163.11111, "t": 489.71573, "r": 257.64185, "b": 497.78549, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Keywords: Table Structure Recognition \u00b7 Data Representation \u00b7 Transformers \u00b7 Optimization."}, {"label": "section_header", "id": 3, "page_no": 0, "cluster": {"id": 3, "label": "section_header", "bbox": {"l": 134.76512, "t": 522.11969, "r": 228.93384, "b": 532.68808, "coord_origin": "TOPLEFT"}, "confidence": 0.9392016530036926, "cells": [{"id": 62, "text": "1", "bbox": {"l": 134.76512, "t": 522.11969, "r": 141.48872, "b": 532.68808, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "Introduction", "bbox": {"l": 154.93832, "t": 522.11969, "r": 228.93384, "b": 532.68808, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1 Introduction"}, {"label": "text", "id": 0, "page_no": 0, "cluster": {"id": 0, "label": "text", "bbox": {"l": 134.76512, "t": 548.2865400000001, "r": 480.5959500000001, "b": 628.81451, "coord_origin": "TOPLEFT"}, "confidence": 0.9835679531097412, "cells": [{"id": 64, "text": "Tables are ubiquitous in documents such as scientific papers, patents, reports,", "bbox": {"l": 134.76512, "t": 548.2865400000001, "r": 480.5939, "b": 557.0835099999999, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "manuals, specification sheets or marketing material. They often encode highly", "bbox": {"l": 134.76512, "t": 560.24254, "r": 480.59180000000003, "b": 569.0395100000001, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "valuable information and therefore need to be extracted with high accuracy.", "bbox": {"l": 134.76512, "t": 572.19754, "r": 480.59283000000005, "b": 580.99451, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "Unfortunately, tables appear in documents in various sizes, styling and struc-", "bbox": {"l": 134.76512, "t": 584.15254, "r": 480.5959500000001, "b": 592.9495099999999, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "ture, making it difficult to recover their correct structure with simple analyt-", "bbox": {"l": 134.76512, "t": 596.10754, "r": 480.58688, "b": 604.90451, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "ical methods. Therefore, accurate table extraction is achieved these days with", "bbox": {"l": 134.76512, "t": 608.06255, "r": 480.59088, "b": 616.85951, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "machine-learning based methods.", "bbox": {"l": 134.76512, "t": 620.01755, "r": 279.32745, "b": 628.81451, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Tables are ubiquitous in documents such as scientific papers, patents, reports, manuals, specification sheets or marketing material. They often encode highly valuable information and therefore need to be extracted with high accuracy. Unfortunately, tables appear in documents in various sizes, styling and structure, making it difficult to recover their correct structure with simple analytical methods. Therefore, accurate table extraction is achieved these days with machine-learning based methods."}, {"label": "text", "id": 2, "page_no": 0, "cluster": {"id": 2, "label": "text", "bbox": {"l": 134.76512, "t": 632.14755, "r": 480.59583, "b": 664.85453, "coord_origin": "TOPLEFT"}, "confidence": 0.9696458578109741, "cells": [{"id": 71, "text": "In modern document understanding systems [1,15], table extraction is typi-", "bbox": {"l": 149.70811, "t": 632.14755, "r": 480.58899, "b": 640.94452, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "cally a two-step process. Firstly, every table on a page is located with a bounding", "bbox": {"l": 134.76512, "t": 644.1025500000001, "r": 480.59583, "b": 652.8995199999999, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "box, and secondly, their logical row and column structure is recognized. As of", "bbox": {"l": 134.76512, "t": 656.05756, "r": 480.59496999999993, "b": 664.85453, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In modern document understanding systems [1,15], table extraction is typically a two-step process. Firstly, every table on a page is located with a bounding box, and secondly, their logical row and column structure is recognized. As of"}], "headers": [{"label": "page_header", "id": 6, "page_no": 0, "cluster": {"id": 6, "label": "page_header", "bbox": {"l": 18.340218, "t": 209.47997999999995, "r": 36.339787, "b": 555.00003, "coord_origin": "TOPLEFT"}, "confidence": 0.8899643421173096, "cells": [{"id": 74, "text": "arXiv:2305.03393v1 [cs.CV] 5 May 2023", "bbox": {"l": 18.340218, "t": 209.47997999999995, "r": 36.339787, "b": 555.00003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "arXiv:2305.03393v1 [cs.CV] 5 May 2023"}]}}, {"page_no": 1, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "2", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "M.", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 178.07675, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37415, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Fig. 1.", "bbox": {"l": 134.765, "t": 126.33416999999997, "r": 162.64424, "b": 134.26049999999998, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Comparison between HTML and OTSL table structure representation: (A)", "bbox": {"l": 167.062, "t": 126.39697000000001, "r": 480.59106, "b": 134.46667000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "table-example with complex row and column headers, including a 2D empty span,", "bbox": {"l": 134.765, "t": 137.35595999999998, "r": 480.59018, "b": 145.42566, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "(B)", "bbox": {"l": 134.765, "t": 148.31493999999998, "r": 147.95433, "b": 156.38464, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "minimal graphical representation of table structure using rectangular layout, (C)", "bbox": {"l": 152.39224, "t": 148.31493999999998, "r": 480.59096999999997, "b": 156.38464, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "HTML representation, (D) OTSL representation. This example demonstrates many of", "bbox": {"l": 134.765, "t": 159.27392999999995, "r": 480.59189, "b": 167.34362999999996, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "the key-features of OTSL, namely its reduced vocabulary size (12 versus 5 in this case),", "bbox": {"l": 134.765, "t": 170.23290999999995, "r": 480.58914000000004, "b": 178.30260999999996, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "its reduced sequence length (55 versus 30) and a enhanced internal structure (variable", "bbox": {"l": 134.765, "t": 181.19188999999994, "r": 480.59020999999996, "b": 189.26160000000004, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "token sequence length per row in HTML versus a fixed length of rows in OTSL).", "bbox": {"l": 134.765, "t": 192.15088000000003, "r": 460.87109, "b": 200.22058000000004, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "C", "bbox": {"l": 396.41107, "t": 280.98352, "r": 402.97336, "b": 289.50903, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "C", "bbox": {"l": 418.58682, "t": 280.89792, "r": 425.14911, "b": 289.42343, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "C", "bbox": {"l": 395.74835, "t": 303.23727, "r": 402.31064, "b": 311.76279, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "C", "bbox": {"l": 407.54214, "t": 303.36981, "r": 414.10443, "b": 311.89532, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "C", "bbox": {"l": 407.56335, "t": 314.40619, "r": 414.12564, "b": 322.9317, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "C", "bbox": {"l": 418.51108, "t": 292.08502000000004, "r": 425.07336, "b": 300.61053000000004, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "C", "bbox": {"l": 429.59744, "t": 292.09106, "r": 436.1597300000001, "b": 300.61658, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "C", "bbox": {"l": 440.68759000000006, "t": 292.01230000000004, "r": 447.24987999999996, "b": 300.53781000000004, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "C", "bbox": {"l": 418.6232, "t": 303.29483, "r": 425.18549, "b": 311.82034, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "C", "bbox": {"l": 429.7095299999999, "t": 303.30011, "r": 436.27182, "b": 311.82562, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "C", "bbox": {"l": 440.7996800000001, "t": 303.22211, "r": 447.36197, "b": 311.74762, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "C", "bbox": {"l": 418.62546, "t": 314.56903, "r": 425.18774, "b": 323.09454, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "C", "bbox": {"l": 429.71181999999993, "t": 314.57434, "r": 436.27411, "b": 323.09985, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "C", "bbox": {"l": 440.80194, "t": 314.49631, "r": 447.36423, "b": 323.02182, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "C", "bbox": {"l": 407.39746, "t": 325.29031, "r": 413.95975, "b": 333.81583, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "C", "bbox": {"l": 418.45959, "t": 325.45316, "r": 425.02188, "b": 333.97867, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "C", "bbox": {"l": 429.54593, "t": 325.4592, "r": 436.10822, "b": 333.98471, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "C", "bbox": {"l": 440.63608, "t": 325.38043, "r": 447.19836, "b": 333.90594, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "NL", "bbox": {"l": 451.89511000000005, "t": 280.15717, "r": 463.51273000000003, "b": 288.68268, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "NL", "bbox": {"l": 452.1557, "t": 291.59875000000005, "r": 463.77332, "b": 300.12427, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "NL", "bbox": {"l": 452.17688000000004, "t": 302.84265, "r": 463.79449000000005, "b": 311.36816, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "NL", "bbox": {"l": 452.09887999999995, "t": 314.12441999999993, "r": 463.71648999999996, "b": 322.6499299999999, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "NL", "bbox": {"l": 452.29733, "t": 325.46906, "r": 463.91495, "b": 333.99457, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "U", "bbox": {"l": 396.09677, "t": 314.49478, "r": 402.65906, "b": 323.02029000000005, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "U", "bbox": {"l": 395.99829, "t": 325.38876000000005, "r": 402.56058, "b": 333.91428, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "U", "bbox": {"l": 396.27475, "t": 292.27057, "r": 402.83704, "b": 300.79608, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "L", "bbox": {"l": 408.54724, "t": 280.96912, "r": 413.60074, "b": 289.49463, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "L", "bbox": {"l": 430.58966, "t": 280.49725, "r": 435.6431600000001, "b": 289.02277, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "L", "bbox": {"l": 441.08069, "t": 280.38062, "r": 446.13419, "b": 288.90613, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "X", "bbox": {"l": 407.97388, "t": 292.13425, "r": 414.03625, "b": 300.65976, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "NL", "bbox": {"l": 441.25640999999996, "t": 411.1807600000001, "r": 452.87402, "b": 419.7062700000001, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "vocabulary:", "bbox": {"l": 393.75256, "t": 399.7947700000001, "r": 432.48929, "b": 406.89935, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "5", "bbox": {"l": 434.5896000000001, "t": 399.7947700000001, "r": 438.80083999999994, "b": 406.89935, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "tokens", "bbox": {"l": 440.90573, "t": 399.7947700000001, "r": 463.22235, "b": 406.89935, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "D OTSL", "bbox": {"l": 384.11816, "t": 258.54718, "r": 413.99307, "b": 265.65179, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "sequence length:", "bbox": {"l": 393.75256, "t": 266.67505000000006, "r": 451.45129000000003, "b": 273.77966000000004, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "30", "bbox": {"l": 453.55083999999994, "t": 266.67505000000006, "r": 461.97485, "b": 273.77966000000004, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "vocabulary for this table:", "bbox": {"l": 151.79318, "t": 399.76016, "r": 233.89371000000003, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "12", "bbox": {"l": 235.99332, "t": 399.76016, "r": 244.41734000000002, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "tokens", "bbox": {"l": 246.52222, "t": 399.76016, "r": 268.83884, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "A", "bbox": {"l": 154.3298, "t": 213.57457999999997, "r": 159.79837, "b": 220.67920000000004, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "B", "bbox": {"l": 321.07053, "t": 213.57457999999997, "r": 326.53909, "b": 220.67920000000004, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "<table>", "bbox": {"l": 153.0947, "t": 280.30411, "r": 175.83888, "b": 286.69824, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "<tr>", "bbox": {"l": 160.67039, "t": 287.12088, "r": 172.79608, "b": 293.51501, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "<td", "bbox": {"l": 168.24603, "t": 293.93765, "r": 177.91019, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "colspan=\u201c2\u201d", "bbox": {"l": 179.80525, "t": 293.93765, "r": 215.61517, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "rowspan=\u201c2\u201d", "bbox": {"l": 217.50886999999997, "t": 293.93765, "r": 255.58945, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": ">", "bbox": {"l": 257.48315, "t": 293.93765, "r": 261.46414, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "</td>", "bbox": {"l": 263.35785, "t": 293.93765, "r": 278.89804, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "<td", "bbox": {"l": 280.79175, "t": 293.93765, "r": 290.4559, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "colspan=\u201c3\u201d", "bbox": {"l": 292.35095, "t": 293.93765, "r": 328.16083, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": ">", "bbox": {"l": 330.05457, "t": 293.93765, "r": 334.03555, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "</td>", "bbox": {"l": 335.92926, "t": 293.93765, "r": 351.46945, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "</tr>", "bbox": {"l": 160.67039, "t": 300.75442999999996, "r": 174.68979, "b": 307.14856, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "<tr>", "bbox": {"l": 160.67039, "t": 307.57122999999996, "r": 172.79608, "b": 313.96536, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "<td>", "bbox": {"l": 168.24603, "t": 314.388, "r": 181.89255, "b": 320.78214, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "</td>", "bbox": {"l": 183.78624, "t": 314.388, "r": 199.32646, "b": 320.78214, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "<td>", "bbox": {"l": 201.22015, "t": 314.388, "r": 214.86666999999997, "b": 320.78214, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "</td>", "bbox": {"l": 216.76038, "t": 314.388, "r": 232.30058, "b": 320.78214, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "<td>", "bbox": {"l": 234.19427000000002, "t": 314.388, "r": 247.84079000000003, "b": 320.78214, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "</td>", "bbox": {"l": 249.73447999999996, "t": 314.388, "r": 265.27469, "b": 320.78214, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "</tr>", "bbox": {"l": 160.67039, "t": 321.20477, "r": 174.68979, "b": 327.59890999999993, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "<tr>", "bbox": {"l": 160.67039, "t": 328.02158, "r": 172.79608, "b": 334.41571000000005, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "<td rowspan=\u201c3\u201d > </td> <td> </td> <td> </td> <td> </td> <td> </td>", "bbox": {"l": 168.24603, "t": 334.83835, "r": 373.09091, "b": 341.23248, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "</tr>", "bbox": {"l": 160.67039, "t": 341.65512, "r": 174.68979, "b": 348.04926, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "<tr>", "bbox": {"l": 160.67039, "t": 348.47159, "r": 172.79608, "b": 354.86572, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "<td>", "bbox": {"l": 168.24603, "t": 355.28836000000007, "r": 181.89255, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "</td>", "bbox": {"l": 183.78624, "t": 355.28836000000007, "r": 199.32646, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "<td>", "bbox": {"l": 201.22015, "t": 355.28836000000007, "r": 214.86666999999997, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "</td>", "bbox": {"l": 216.76038, "t": 355.28836000000007, "r": 232.30058, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "<td>", "bbox": {"l": 234.19427000000002, "t": 355.28836000000007, "r": 247.84079000000003, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "</td>", "bbox": {"l": 249.73447999999996, "t": 355.28836000000007, "r": 265.27469, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "<td>", "bbox": {"l": 267.1684, "t": 355.28836000000007, "r": 280.81488, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "</td>", "bbox": {"l": 282.70862, "t": 355.28836000000007, "r": 298.24881, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "</tr>", "bbox": {"l": 160.67039, "t": 362.10516000000007, "r": 174.68979, "b": 368.49929999999995, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "<tr>", "bbox": {"l": 160.67039, "t": 368.92194, "r": 172.79608, "b": 375.31607, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "<td>", "bbox": {"l": 168.24603, "t": 375.73871, "r": 181.89255, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "</td>", "bbox": {"l": 183.78624, "t": 375.73871, "r": 199.32646, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "<td>", "bbox": {"l": 201.22015, "t": 375.73871, "r": 214.86666999999997, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "</td>", "bbox": {"l": 216.76038, "t": 375.73871, "r": 232.30058, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "<td>", "bbox": {"l": 234.19427000000002, "t": 375.73871, "r": 247.84079000000003, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "</td>", "bbox": {"l": 249.73447999999996, "t": 375.73871, "r": 265.27469, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "<td>", "bbox": {"l": 267.1684, "t": 375.73871, "r": 280.81488, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "</td>", "bbox": {"l": 282.70862, "t": 375.73871, "r": 298.24881, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "</tr>", "bbox": {"l": 160.67039, "t": 382.55551, "r": 174.68979, "b": 388.94965, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "</table>", "bbox": {"l": 153.0947, "t": 389.37228, "r": 177.73259, "b": 395.76642, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "C", "bbox": {"l": 395.06137, "t": 411.33353, "r": 401.62366, "b": 419.85904, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "L", "bbox": {"l": 407.42249, "t": 411.33353, "r": 412.47598, "b": 419.85904, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "U", "bbox": {"l": 418.69287, "t": 411.33353, "r": 425.25516, "b": 419.85904, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "X", "bbox": {"l": 430.5086099999999, "t": 411.33353, "r": 436.5709800000001, "b": 419.85904, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "<table>", "bbox": {"l": 152.36208, "t": 409.77362, "r": 175.10626, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "<tr>", "bbox": {"l": 178.89366, "t": 409.77362, "r": 191.01935, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "</tr>", "bbox": {"l": 194.80676, "t": 409.77362, "r": 208.82614, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "<td>", "bbox": {"l": 212.61354, "t": 409.77362, "r": 226.26003999999998, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "</td>", "bbox": {"l": 230.04745000000003, "t": 409.77362, "r": 245.58765000000002, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "<td", "bbox": {"l": 249.37506000000002, "t": 409.77362, "r": 259.03918, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "colspan=\"2\"", "bbox": {"l": 262.82797, "t": 409.77362, "r": 298.93646, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "colspan=\"3\"", "bbox": {"l": 302.72385, "t": 409.77362, "r": 338.83234, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "rowspan=\"2\"", "bbox": {"l": 152.36208, "t": 418.10522, "r": 190.74123, "b": 424.49936, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "rowspan=\"3\"", "bbox": {"l": 194.52863, "t": 418.10522, "r": 232.90777999999997, "b": 424.49936, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": ">", "bbox": {"l": 236.69518999999997, "t": 418.10522, "r": 240.67617999999996, "b": 424.49936, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "</table>", "bbox": {"l": 244.46358, "t": 418.10522, "r": 269.10144, "b": 424.49936, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "C", "bbox": {"l": 154.50595, "t": 258.60095, "r": 159.62473, "b": 265.70556999999997, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "HTML", "bbox": {"l": 164.74348, "t": 258.60095, "r": 185.21857, "b": 265.70556999999997, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "sequence length:", "bbox": {"l": 164.3548, "t": 266.49707, "r": 222.05352999999997, "b": 273.60168, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "55", "bbox": {"l": 224.15326, "t": 266.49707, "r": 232.57729, "b": 273.60168, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "today,", "bbox": {"l": 134.765, "t": 452.31378, "r": 161.32928, "b": 461.11075, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "table detection", "bbox": {"l": 164.269, "t": 452.31378, "r": 226.28617999999997, "b": 461.11075, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "in documents is a well understood problem, and the latest", "bbox": {"l": 229.992, "t": 452.31378, "r": 480.59232000000003, "b": 461.11075, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "state-of-the-art (SOTA) object detection methods provide an accuracy compa-", "bbox": {"l": 134.76501, "t": 464.26877, "r": 480.59180000000003, "b": 473.06573, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "rable to human observers [7,8,10,14,23]. On the other hand, the problem of table", "bbox": {"l": 134.76501, "t": 476.22375, "r": 480.58673, "b": 485.02072, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "structure recognition (TSR) is a lot more challenging and remains a very active", "bbox": {"l": 134.76501, "t": 488.17975, "r": 480.58658, "b": 496.97672, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "area of research, in which many novel machine learning algorithms are being", "bbox": {"l": 134.76501, "t": 500.13474, "r": 480.58978, "b": 508.9317, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "explored [3,4,5,9,11,12,13,14,17,18,21,22].", "bbox": {"l": 134.76501, "t": 512.0897199999999, "r": 313.24597, "b": 520.88669, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "Recently emerging SOTA methods for table structure recognition employ", "bbox": {"l": 149.70901, "t": 524.55072, "r": 480.58884000000006, "b": 533.3476900000001, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "transformer-based models, in which an image of the table is provided to the net-", "bbox": {"l": 134.76501, "t": 536.50671, "r": 480.5917400000001, "b": 545.30368, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "work in order to predict the structure of the table as a sequence of tokens. These", "bbox": {"l": 134.76501, "t": 548.46172, "r": 480.58868, "b": 557.25868, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "image-to-sequence (Im2Seq) models are extremely powerful, since they allow for", "bbox": {"l": 134.76501, "t": 560.41672, "r": 480.58795, "b": 569.2136800000001, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "a purely data-driven solution. The tokens of the sequence typically belong to a", "bbox": {"l": 134.76501, "t": 572.37172, "r": 480.58978, "b": 581.16869, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "markup language such as HTML, Latex or Markdown, which allow to describe", "bbox": {"l": 134.76501, "t": 584.32672, "r": 480.59479, "b": 593.12369, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "table structure as rows, columns and spanning cells in various configurations.", "bbox": {"l": 134.76501, "t": 596.28271, "r": 480.58678999999995, "b": 605.0796799999999, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "In Figure 1, we illustrate how HTML is used to represent the table-structure", "bbox": {"l": 134.76501, "t": 608.23772, "r": 480.59476, "b": 617.03468, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "of a particular example table. Public table-structure data sets such as PubTab-", "bbox": {"l": 134.76501, "t": 620.19272, "r": 480.5938100000001, "b": 628.98969, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "Net [22], and FinTabNet [21], which were created in a semi-automated way from", "bbox": {"l": 134.76501, "t": 632.1477199999999, "r": 480.59482, "b": 640.94469, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "paired PDF and HTML sources (e.g. PubMed Central), popularized primarily", "bbox": {"l": 134.76501, "t": 644.10272, "r": 480.58771, "b": 652.89969, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "the use of HTML as ground-truth representation format for TSR.", "bbox": {"l": 134.76501, "t": 656.05772, "r": 421.45377, "b": 664.8547, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 5, "label": "page_header", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8580349683761597, "cells": [{"id": 0, "text": "2", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "page_header", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9076642990112305, "cells": [{"id": 1, "text": "M.", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 178.07675, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37415, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "caption", "bbox": {"l": 134.765, "t": 126.33416999999997, "r": 480.59189, "b": 200.22058000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.8939083218574524, "cells": [{"id": 3, "text": "Fig. 1.", "bbox": {"l": 134.765, "t": 126.33416999999997, "r": 162.64424, "b": 134.26049999999998, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Comparison between HTML and OTSL table structure representation: (A)", "bbox": {"l": 167.062, "t": 126.39697000000001, "r": 480.59106, "b": 134.46667000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "table-example with complex row and column headers, including a 2D empty span,", "bbox": {"l": 134.765, "t": 137.35595999999998, "r": 480.59018, "b": 145.42566, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "(B)", "bbox": {"l": 134.765, "t": 148.31493999999998, "r": 147.95433, "b": 156.38464, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "minimal graphical representation of table structure using rectangular layout, (C)", "bbox": {"l": 152.39224, "t": 148.31493999999998, "r": 480.59096999999997, "b": 156.38464, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "HTML representation, (D) OTSL representation. This example demonstrates many of", "bbox": {"l": 134.765, "t": 159.27392999999995, "r": 480.59189, "b": 167.34362999999996, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "the key-features of OTSL, namely its reduced vocabulary size (12 versus 5 in this case),", "bbox": {"l": 134.765, "t": 170.23290999999995, "r": 480.58914000000004, "b": 178.30260999999996, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "its reduced sequence length (55 versus 30) and a enhanced internal structure (variable", "bbox": {"l": 134.765, "t": 181.19188999999994, "r": 480.59020999999996, "b": 189.26160000000004, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "token sequence length per row in HTML versus a fixed length of rows in OTSL).", "bbox": {"l": 134.765, "t": 192.15088000000003, "r": 460.87109, "b": 200.22058000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "picture", "bbox": {"l": 148.45364379882812, "t": 208.37423706054688, "r": 464.3608093261719, "b": 425.8462219238281, "coord_origin": "TOPLEFT"}, "confidence": 0.9688959121704102, "cells": [{"id": 12, "text": "C", "bbox": {"l": 396.41107, "t": 280.98352, "r": 402.97336, "b": 289.50903, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "C", "bbox": {"l": 418.58682, "t": 280.89792, "r": 425.14911, "b": 289.42343, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "C", "bbox": {"l": 395.74835, "t": 303.23727, "r": 402.31064, "b": 311.76279, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "C", "bbox": {"l": 407.54214, "t": 303.36981, "r": 414.10443, "b": 311.89532, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "C", "bbox": {"l": 407.56335, "t": 314.40619, "r": 414.12564, "b": 322.9317, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "C", "bbox": {"l": 418.51108, "t": 292.08502000000004, "r": 425.07336, "b": 300.61053000000004, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "C", "bbox": {"l": 429.59744, "t": 292.09106, "r": 436.1597300000001, "b": 300.61658, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "C", "bbox": {"l": 440.68759000000006, "t": 292.01230000000004, "r": 447.24987999999996, "b": 300.53781000000004, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "C", "bbox": {"l": 418.6232, "t": 303.29483, "r": 425.18549, "b": 311.82034, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "C", "bbox": {"l": 429.7095299999999, "t": 303.30011, "r": 436.27182, "b": 311.82562, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "C", "bbox": {"l": 440.7996800000001, "t": 303.22211, "r": 447.36197, "b": 311.74762, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "C", "bbox": {"l": 418.62546, "t": 314.56903, "r": 425.18774, "b": 323.09454, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "C", "bbox": {"l": 429.71181999999993, "t": 314.57434, "r": 436.27411, "b": 323.09985, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "C", "bbox": {"l": 440.80194, "t": 314.49631, "r": 447.36423, "b": 323.02182, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "C", "bbox": {"l": 407.39746, "t": 325.29031, "r": 413.95975, "b": 333.81583, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "C", "bbox": {"l": 418.45959, "t": 325.45316, "r": 425.02188, "b": 333.97867, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "C", "bbox": {"l": 429.54593, "t": 325.4592, "r": 436.10822, "b": 333.98471, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "C", "bbox": {"l": 440.63608, "t": 325.38043, "r": 447.19836, "b": 333.90594, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "NL", "bbox": {"l": 451.89511000000005, "t": 280.15717, "r": 463.51273000000003, "b": 288.68268, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "NL", "bbox": {"l": 452.1557, "t": 291.59875000000005, "r": 463.77332, "b": 300.12427, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "NL", "bbox": {"l": 452.17688000000004, "t": 302.84265, "r": 463.79449000000005, "b": 311.36816, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "NL", "bbox": {"l": 452.09887999999995, "t": 314.12441999999993, "r": 463.71648999999996, "b": 322.6499299999999, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "NL", "bbox": {"l": 452.29733, "t": 325.46906, "r": 463.91495, "b": 333.99457, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "U", "bbox": {"l": 396.09677, "t": 314.49478, "r": 402.65906, "b": 323.02029000000005, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "U", "bbox": {"l": 395.99829, "t": 325.38876000000005, "r": 402.56058, "b": 333.91428, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "U", "bbox": {"l": 396.27475, "t": 292.27057, "r": 402.83704, "b": 300.79608, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "L", "bbox": {"l": 408.54724, "t": 280.96912, "r": 413.60074, "b": 289.49463, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "L", "bbox": {"l": 430.58966, "t": 280.49725, "r": 435.6431600000001, "b": 289.02277, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "L", "bbox": {"l": 441.08069, "t": 280.38062, "r": 446.13419, "b": 288.90613, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "X", "bbox": {"l": 407.97388, "t": 292.13425, "r": 414.03625, "b": 300.65976, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "NL", "bbox": {"l": 441.25640999999996, "t": 411.1807600000001, "r": 452.87402, "b": 419.7062700000001, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "vocabulary:", "bbox": {"l": 393.75256, "t": 399.7947700000001, "r": 432.48929, "b": 406.89935, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "5", "bbox": {"l": 434.5896000000001, "t": 399.7947700000001, "r": 438.80083999999994, "b": 406.89935, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "tokens", "bbox": {"l": 440.90573, "t": 399.7947700000001, "r": 463.22235, "b": 406.89935, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "D OTSL", "bbox": {"l": 384.11816, "t": 258.54718, "r": 413.99307, "b": 265.65179, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "sequence length:", "bbox": {"l": 393.75256, "t": 266.67505000000006, "r": 451.45129000000003, "b": 273.77966000000004, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "30", "bbox": {"l": 453.55083999999994, "t": 266.67505000000006, "r": 461.97485, "b": 273.77966000000004, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "vocabulary for this table:", "bbox": {"l": 151.79318, "t": 399.76016, "r": 233.89371000000003, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "12", "bbox": {"l": 235.99332, "t": 399.76016, "r": 244.41734000000002, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "tokens", "bbox": {"l": 246.52222, "t": 399.76016, "r": 268.83884, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "A", "bbox": {"l": 154.3298, "t": 213.57457999999997, "r": 159.79837, "b": 220.67920000000004, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "B", "bbox": {"l": 321.07053, "t": 213.57457999999997, "r": 326.53909, "b": 220.67920000000004, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "<table>", "bbox": {"l": 153.0947, "t": 280.30411, "r": 175.83888, "b": 286.69824, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "<tr>", "bbox": {"l": 160.67039, "t": 287.12088, "r": 172.79608, "b": 293.51501, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "<td", "bbox": {"l": 168.24603, "t": 293.93765, "r": 177.91019, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "colspan=\u201c2\u201d", "bbox": {"l": 179.80525, "t": 293.93765, "r": 215.61517, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "rowspan=\u201c2\u201d", "bbox": {"l": 217.50886999999997, "t": 293.93765, "r": 255.58945, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": ">", "bbox": {"l": 257.48315, "t": 293.93765, "r": 261.46414, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "</td>", "bbox": {"l": 263.35785, "t": 293.93765, "r": 278.89804, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "<td", "bbox": {"l": 280.79175, "t": 293.93765, "r": 290.4559, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "colspan=\u201c3\u201d", "bbox": {"l": 292.35095, "t": 293.93765, "r": 328.16083, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": ">", "bbox": {"l": 330.05457, "t": 293.93765, "r": 334.03555, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "</td>", "bbox": {"l": 335.92926, "t": 293.93765, "r": 351.46945, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "</tr>", "bbox": {"l": 160.67039, "t": 300.75442999999996, "r": 174.68979, "b": 307.14856, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "<tr>", "bbox": {"l": 160.67039, "t": 307.57122999999996, "r": 172.79608, "b": 313.96536, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "<td>", "bbox": {"l": 168.24603, "t": 314.388, "r": 181.89255, "b": 320.78214, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "</td>", "bbox": {"l": 183.78624, "t": 314.388, "r": 199.32646, "b": 320.78214, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "<td>", "bbox": {"l": 201.22015, "t": 314.388, "r": 214.86666999999997, "b": 320.78214, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "</td>", "bbox": {"l": 216.76038, "t": 314.388, "r": 232.30058, "b": 320.78214, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "<td>", "bbox": {"l": 234.19427000000002, "t": 314.388, "r": 247.84079000000003, "b": 320.78214, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "</td>", "bbox": {"l": 249.73447999999996, "t": 314.388, "r": 265.27469, "b": 320.78214, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "</tr>", "bbox": {"l": 160.67039, "t": 321.20477, "r": 174.68979, "b": 327.59890999999993, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "<tr>", "bbox": {"l": 160.67039, "t": 328.02158, "r": 172.79608, "b": 334.41571000000005, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "<td rowspan=\u201c3\u201d > </td> <td> </td> <td> </td> <td> </td> <td> </td>", "bbox": {"l": 168.24603, "t": 334.83835, "r": 373.09091, "b": 341.23248, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "</tr>", "bbox": {"l": 160.67039, "t": 341.65512, "r": 174.68979, "b": 348.04926, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "<tr>", "bbox": {"l": 160.67039, "t": 348.47159, "r": 172.79608, "b": 354.86572, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "<td>", "bbox": {"l": 168.24603, "t": 355.28836000000007, "r": 181.89255, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "</td>", "bbox": {"l": 183.78624, "t": 355.28836000000007, "r": 199.32646, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "<td>", "bbox": {"l": 201.22015, "t": 355.28836000000007, "r": 214.86666999999997, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "</td>", "bbox": {"l": 216.76038, "t": 355.28836000000007, "r": 232.30058, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "<td>", "bbox": {"l": 234.19427000000002, "t": 355.28836000000007, "r": 247.84079000000003, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "</td>", "bbox": {"l": 249.73447999999996, "t": 355.28836000000007, "r": 265.27469, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "<td>", "bbox": {"l": 267.1684, "t": 355.28836000000007, "r": 280.81488, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "</td>", "bbox": {"l": 282.70862, "t": 355.28836000000007, "r": 298.24881, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "</tr>", "bbox": {"l": 160.67039, "t": 362.10516000000007, "r": 174.68979, "b": 368.49929999999995, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "<tr>", "bbox": {"l": 160.67039, "t": 368.92194, "r": 172.79608, "b": 375.31607, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "<td>", "bbox": {"l": 168.24603, "t": 375.73871, "r": 181.89255, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "</td>", "bbox": {"l": 183.78624, "t": 375.73871, "r": 199.32646, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "<td>", "bbox": {"l": 201.22015, "t": 375.73871, "r": 214.86666999999997, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "</td>", "bbox": {"l": 216.76038, "t": 375.73871, "r": 232.30058, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "<td>", "bbox": {"l": 234.19427000000002, "t": 375.73871, "r": 247.84079000000003, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "</td>", "bbox": {"l": 249.73447999999996, "t": 375.73871, "r": 265.27469, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "<td>", "bbox": {"l": 267.1684, "t": 375.73871, "r": 280.81488, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "</td>", "bbox": {"l": 282.70862, "t": 375.73871, "r": 298.24881, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "</tr>", "bbox": {"l": 160.67039, "t": 382.55551, "r": 174.68979, "b": 388.94965, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "</table>", "bbox": {"l": 153.0947, "t": 389.37228, "r": 177.73259, "b": 395.76642, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "C", "bbox": {"l": 395.06137, "t": 411.33353, "r": 401.62366, "b": 419.85904, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "L", "bbox": {"l": 407.42249, "t": 411.33353, "r": 412.47598, "b": 419.85904, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "U", "bbox": {"l": 418.69287, "t": 411.33353, "r": 425.25516, "b": 419.85904, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "X", "bbox": {"l": 430.5086099999999, "t": 411.33353, "r": 436.5709800000001, "b": 419.85904, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "<table>", "bbox": {"l": 152.36208, "t": 409.77362, "r": 175.10626, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "<tr>", "bbox": {"l": 178.89366, "t": 409.77362, "r": 191.01935, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "</tr>", "bbox": {"l": 194.80676, "t": 409.77362, "r": 208.82614, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "<td>", "bbox": {"l": 212.61354, "t": 409.77362, "r": 226.26003999999998, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "</td>", "bbox": {"l": 230.04745000000003, "t": 409.77362, "r": 245.58765000000002, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "<td", "bbox": {"l": 249.37506000000002, "t": 409.77362, "r": 259.03918, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "colspan=\"2\"", "bbox": {"l": 262.82797, "t": 409.77362, "r": 298.93646, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "colspan=\"3\"", "bbox": {"l": 302.72385, "t": 409.77362, "r": 338.83234, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "rowspan=\"2\"", "bbox": {"l": 152.36208, "t": 418.10522, "r": 190.74123, "b": 424.49936, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "rowspan=\"3\"", "bbox": {"l": 194.52863, "t": 418.10522, "r": 232.90777999999997, "b": 424.49936, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": ">", "bbox": {"l": 236.69518999999997, "t": 418.10522, "r": 240.67617999999996, "b": 424.49936, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "</table>", "bbox": {"l": 244.46358, "t": 418.10522, "r": 269.10144, "b": 424.49936, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "C", "bbox": {"l": 154.50595, "t": 258.60095, "r": 159.62473, "b": 265.70556999999997, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "HTML", "bbox": {"l": 164.74348, "t": 258.60095, "r": 185.21857, "b": 265.70556999999997, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "sequence length:", "bbox": {"l": 164.3548, "t": 266.49707, "r": 222.05352999999997, "b": 273.60168, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "55", "bbox": {"l": 224.15326, "t": 266.49707, "r": 232.57729, "b": 273.60168, "coord_origin": "TOPLEFT"}}], "children": [{"id": 6, "label": "text", "bbox": {"l": 396.41107, "t": 280.98352, "r": 402.97336, "b": 289.50903, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "C", "bbox": {"l": 396.41107, "t": 280.98352, "r": 402.97336, "b": 289.50903, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "text", "bbox": {"l": 418.58682, "t": 280.89792, "r": 425.14911, "b": 289.42343, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "C", "bbox": {"l": 418.58682, "t": 280.89792, "r": 425.14911, "b": 289.42343, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "text", "bbox": {"l": 395.74835, "t": 303.23727, "r": 402.31064, "b": 311.76279, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "C", "bbox": {"l": 395.74835, "t": 303.23727, "r": 402.31064, "b": 311.76279, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 407.54214, "t": 303.36981, "r": 414.10443, "b": 311.89532, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "C", "bbox": {"l": 407.54214, "t": 303.36981, "r": 414.10443, "b": 311.89532, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "text", "bbox": {"l": 407.56335, "t": 314.40619, "r": 414.12564, "b": 322.9317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "C", "bbox": {"l": 407.56335, "t": 314.40619, "r": 414.12564, "b": 322.9317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 418.51108, "t": 292.08502000000004, "r": 425.07336, "b": 300.61053000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "C", "bbox": {"l": 418.51108, "t": 292.08502000000004, "r": 425.07336, "b": 300.61053000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 429.59744, "t": 292.09106, "r": 436.1597300000001, "b": 300.61658, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "C", "bbox": {"l": 429.59744, "t": 292.09106, "r": 436.1597300000001, "b": 300.61658, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 440.68759000000006, "t": 292.01230000000004, "r": 447.24987999999996, "b": 300.53781000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "C", "bbox": {"l": 440.68759000000006, "t": 292.01230000000004, "r": 447.24987999999996, "b": 300.53781000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 418.6232, "t": 303.29483, "r": 425.18549, "b": 311.82034, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "C", "bbox": {"l": 418.6232, "t": 303.29483, "r": 425.18549, "b": 311.82034, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 429.7095299999999, "t": 303.30011, "r": 436.27182, "b": 311.82562, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "C", "bbox": {"l": 429.7095299999999, "t": 303.30011, "r": 436.27182, "b": 311.82562, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 440.7996800000001, "t": 303.22211, "r": 447.36197, "b": 311.74762, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "C", "bbox": {"l": 440.7996800000001, "t": 303.22211, "r": 447.36197, "b": 311.74762, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 418.62546, "t": 314.56903, "r": 425.18774, "b": 323.09454, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "C", "bbox": {"l": 418.62546, "t": 314.56903, "r": 425.18774, "b": 323.09454, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 429.71181999999993, "t": 314.57434, "r": 436.27411, "b": 323.09985, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "C", "bbox": {"l": 429.71181999999993, "t": 314.57434, "r": 436.27411, "b": 323.09985, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 440.80194, "t": 314.49631, "r": 447.36423, "b": 323.02182, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "C", "bbox": {"l": 440.80194, "t": 314.49631, "r": 447.36423, "b": 323.02182, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 407.39746, "t": 325.29031, "r": 413.95975, "b": 333.81583, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "C", "bbox": {"l": 407.39746, "t": 325.29031, "r": 413.95975, "b": 333.81583, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 418.45959, "t": 325.45316, "r": 425.02188, "b": 333.97867, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "C", "bbox": {"l": 418.45959, "t": 325.45316, "r": 425.02188, "b": 333.97867, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 429.54593, "t": 325.4592, "r": 436.10822, "b": 333.98471, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "C", "bbox": {"l": 429.54593, "t": 325.4592, "r": 436.10822, "b": 333.98471, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 440.63608, "t": 325.38043, "r": 447.19836, "b": 333.90594, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "C", "bbox": {"l": 440.63608, "t": 325.38043, "r": 447.19836, "b": 333.90594, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 451.89511000000005, "t": 280.15717, "r": 463.51273000000003, "b": 288.68268, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "NL", "bbox": {"l": 451.89511000000005, "t": 280.15717, "r": 463.51273000000003, "b": 288.68268, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 452.1557, "t": 291.59875000000005, "r": 463.77332, "b": 300.12427, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "NL", "bbox": {"l": 452.1557, "t": 291.59875000000005, "r": 463.77332, "b": 300.12427, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 452.17688000000004, "t": 302.84265, "r": 463.79449000000005, "b": 311.36816, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "NL", "bbox": {"l": 452.17688000000004, "t": 302.84265, "r": 463.79449000000005, "b": 311.36816, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 452.09887999999995, "t": 314.12441999999993, "r": 463.71648999999996, "b": 322.6499299999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "NL", "bbox": {"l": 452.09887999999995, "t": 314.12441999999993, "r": 463.71648999999996, "b": 322.6499299999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 452.29733, "t": 325.46906, "r": 463.91495, "b": 333.99457, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "NL", "bbox": {"l": 452.29733, "t": 325.46906, "r": 463.91495, "b": 333.99457, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 396.09677, "t": 314.49478, "r": 402.65906, "b": 323.02029000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "U", "bbox": {"l": 396.09677, "t": 314.49478, "r": 402.65906, "b": 323.02029000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 395.99829, "t": 325.38876000000005, "r": 402.56058, "b": 333.91428, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "U", "bbox": {"l": 395.99829, "t": 325.38876000000005, "r": 402.56058, "b": 333.91428, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 396.27475, "t": 292.27057, "r": 402.83704, "b": 300.79608, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "U", "bbox": {"l": 396.27475, "t": 292.27057, "r": 402.83704, "b": 300.79608, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 408.54724, "t": 280.96912, "r": 413.60074, "b": 289.49463, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "L", "bbox": {"l": 408.54724, "t": 280.96912, "r": 413.60074, "b": 289.49463, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 430.58966, "t": 280.49725, "r": 435.6431600000001, "b": 289.02277, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "L", "bbox": {"l": 430.58966, "t": 280.49725, "r": 435.6431600000001, "b": 289.02277, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 441.08069, "t": 280.38062, "r": 446.13419, "b": 288.90613, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "L", "bbox": {"l": 441.08069, "t": 280.38062, "r": 446.13419, "b": 288.90613, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 407.97388, "t": 292.13425, "r": 414.03625, "b": 300.65976, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "X", "bbox": {"l": 407.97388, "t": 292.13425, "r": 414.03625, "b": 300.65976, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 441.25640999999996, "t": 411.1807600000001, "r": 452.87402, "b": 419.7062700000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "NL", "bbox": {"l": 441.25640999999996, "t": 411.1807600000001, "r": 452.87402, "b": 419.7062700000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 393.75256, "t": 399.7947700000001, "r": 432.48929, "b": 406.89935, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "vocabulary:", "bbox": {"l": 393.75256, "t": 399.7947700000001, "r": 432.48929, "b": 406.89935, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 434.5896000000001, "t": 399.7947700000001, "r": 438.80083999999994, "b": 406.89935, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "5", "bbox": {"l": 434.5896000000001, "t": 399.7947700000001, "r": 438.80083999999994, "b": 406.89935, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 440.90573, "t": 399.7947700000001, "r": 463.22235, "b": 406.89935, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "tokens", "bbox": {"l": 440.90573, "t": 399.7947700000001, "r": 463.22235, "b": 406.89935, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 384.11816, "t": 258.54718, "r": 413.99307, "b": 265.65179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "D OTSL", "bbox": {"l": 384.11816, "t": 258.54718, "r": 413.99307, "b": 265.65179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 393.75256, "t": 266.67505000000006, "r": 451.45129000000003, "b": 273.77966000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "sequence length:", "bbox": {"l": 393.75256, "t": 266.67505000000006, "r": 451.45129000000003, "b": 273.77966000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 453.55083999999994, "t": 266.67505000000006, "r": 461.97485, "b": 273.77966000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "30", "bbox": {"l": 453.55083999999994, "t": 266.67505000000006, "r": 461.97485, "b": 273.77966000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 151.79318, "t": 399.76016, "r": 233.89371000000003, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "vocabulary for this table:", "bbox": {"l": 151.79318, "t": 399.76016, "r": 233.89371000000003, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 235.99332, "t": 399.76016, "r": 244.41734000000002, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "12", "bbox": {"l": 235.99332, "t": 399.76016, "r": 244.41734000000002, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 246.52222, "t": 399.76016, "r": 268.83884, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "tokens", "bbox": {"l": 246.52222, "t": 399.76016, "r": 268.83884, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 154.3298, "t": 213.57457999999997, "r": 159.79837, "b": 220.67920000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "A", "bbox": {"l": 154.3298, "t": 213.57457999999997, "r": 159.79837, "b": 220.67920000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 321.07053, "t": 213.57457999999997, "r": 326.53909, "b": 220.67920000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "B", "bbox": {"l": 321.07053, "t": 213.57457999999997, "r": 326.53909, "b": 220.67920000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 153.0947, "t": 280.30411, "r": 175.83888, "b": 286.69824, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "<table>", "bbox": {"l": 153.0947, "t": 280.30411, "r": 175.83888, "b": 286.69824, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 160.67039, "t": 287.12088, "r": 172.79608, "b": 293.51501, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "<tr>", "bbox": {"l": 160.67039, "t": 287.12088, "r": 172.79608, "b": 293.51501, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 168.24603, "t": 293.93765, "r": 177.91019, "b": 300.33179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "<td", "bbox": {"l": 168.24603, "t": 293.93765, "r": 177.91019, "b": 300.33179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 179.80525, "t": 293.93765, "r": 215.61517, "b": 300.33179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "colspan=\u201c2\u201d", "bbox": {"l": 179.80525, "t": 293.93765, "r": 215.61517, "b": 300.33179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 217.50886999999997, "t": 293.93765, "r": 255.58945, "b": 300.33179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "rowspan=\u201c2\u201d", "bbox": {"l": 217.50886999999997, "t": 293.93765, "r": 255.58945, "b": 300.33179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 257.48315, "t": 293.93765, "r": 261.46414, "b": 300.33179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": ">", "bbox": {"l": 257.48315, "t": 293.93765, "r": 261.46414, "b": 300.33179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 263.35785, "t": 293.93765, "r": 278.89804, "b": 300.33179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "</td>", "bbox": {"l": 263.35785, "t": 293.93765, "r": 278.89804, "b": 300.33179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 280.79175, "t": 293.93765, "r": 290.4559, "b": 300.33179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "<td", "bbox": {"l": 280.79175, "t": 293.93765, "r": 290.4559, "b": 300.33179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 292.35095, "t": 293.93765, "r": 328.16083, "b": 300.33179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "colspan=\u201c3\u201d", "bbox": {"l": 292.35095, "t": 293.93765, "r": 328.16083, "b": 300.33179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 330.05457, "t": 293.93765, "r": 334.03555, "b": 300.33179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": ">", "bbox": {"l": 330.05457, "t": 293.93765, "r": 334.03555, "b": 300.33179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 335.92926, "t": 293.93765, "r": 351.46945, "b": 300.33179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "</td>", "bbox": {"l": 335.92926, "t": 293.93765, "r": 351.46945, "b": 300.33179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 160.67039, "t": 300.75442999999996, "r": 174.68979, "b": 307.14856, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "</tr>", "bbox": {"l": 160.67039, "t": 300.75442999999996, "r": 174.68979, "b": 307.14856, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 160.67039, "t": 307.57122999999996, "r": 172.79608, "b": 313.96536, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "<tr>", "bbox": {"l": 160.67039, "t": 307.57122999999996, "r": 172.79608, "b": 313.96536, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 168.24603, "t": 314.388, "r": 181.89255, "b": 320.78214, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "<td>", "bbox": {"l": 168.24603, "t": 314.388, "r": 181.89255, "b": 320.78214, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 183.78624, "t": 314.388, "r": 199.32646, "b": 320.78214, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "</td>", "bbox": {"l": 183.78624, "t": 314.388, "r": 199.32646, "b": 320.78214, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 201.22015, "t": 314.388, "r": 214.86666999999997, "b": 320.78214, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "<td>", "bbox": {"l": 201.22015, "t": 314.388, "r": 214.86666999999997, "b": 320.78214, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 216.76038, "t": 314.388, "r": 232.30058, "b": 320.78214, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "</td>", "bbox": {"l": 216.76038, "t": 314.388, "r": 232.30058, "b": 320.78214, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 234.19427000000002, "t": 314.388, "r": 247.84079000000003, "b": 320.78214, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "<td>", "bbox": {"l": 234.19427000000002, "t": 314.388, "r": 247.84079000000003, "b": 320.78214, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 249.73447999999996, "t": 314.388, "r": 265.27469, "b": 320.78214, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "</td>", "bbox": {"l": 249.73447999999996, "t": 314.388, "r": 265.27469, "b": 320.78214, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 160.67039, "t": 321.20477, "r": 174.68979, "b": 327.59890999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "</tr>", "bbox": {"l": 160.67039, "t": 321.20477, "r": 174.68979, "b": 327.59890999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 160.67039, "t": 328.02158, "r": 172.79608, "b": 334.41571000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "<tr>", "bbox": {"l": 160.67039, "t": 328.02158, "r": 172.79608, "b": 334.41571000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 168.24603, "t": 334.83835, "r": 373.09091, "b": 341.23248, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "<td rowspan=\u201c3\u201d > </td> <td> </td> <td> </td> <td> </td> <td> </td>", "bbox": {"l": 168.24603, "t": 334.83835, "r": 373.09091, "b": 341.23248, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 160.67039, "t": 341.65512, "r": 174.68979, "b": 348.04926, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "</tr>", "bbox": {"l": 160.67039, "t": 341.65512, "r": 174.68979, "b": 348.04926, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 160.67039, "t": 348.47159, "r": 172.79608, "b": 354.86572, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "<tr>", "bbox": {"l": 160.67039, "t": 348.47159, "r": 172.79608, "b": 354.86572, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 168.24603, "t": 355.28836000000007, "r": 181.89255, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "<td>", "bbox": {"l": 168.24603, "t": 355.28836000000007, "r": 181.89255, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 183.78624, "t": 355.28836000000007, "r": 199.32646, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "</td>", "bbox": {"l": 183.78624, "t": 355.28836000000007, "r": 199.32646, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 201.22015, "t": 355.28836000000007, "r": 214.86666999999997, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "<td>", "bbox": {"l": 201.22015, "t": 355.28836000000007, "r": 214.86666999999997, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 216.76038, "t": 355.28836000000007, "r": 232.30058, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "</td>", "bbox": {"l": 216.76038, "t": 355.28836000000007, "r": 232.30058, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 234.19427000000002, "t": 355.28836000000007, "r": 247.84079000000003, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "<td>", "bbox": {"l": 234.19427000000002, "t": 355.28836000000007, "r": 247.84079000000003, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 249.73447999999996, "t": 355.28836000000007, "r": 265.27469, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "</td>", "bbox": {"l": 249.73447999999996, "t": 355.28836000000007, "r": 265.27469, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 267.1684, "t": 355.28836000000007, "r": 280.81488, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "<td>", "bbox": {"l": 267.1684, "t": 355.28836000000007, "r": 280.81488, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 282.70862, "t": 355.28836000000007, "r": 298.24881, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "</td>", "bbox": {"l": 282.70862, "t": 355.28836000000007, "r": 298.24881, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 160.67039, "t": 362.10516000000007, "r": 174.68979, "b": 368.49929999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "</tr>", "bbox": {"l": 160.67039, "t": 362.10516000000007, "r": 174.68979, "b": 368.49929999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 160.67039, "t": 368.92194, "r": 172.79608, "b": 375.31607, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "<tr>", "bbox": {"l": 160.67039, "t": 368.92194, "r": 172.79608, "b": 375.31607, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 168.24603, "t": 375.73871, "r": 181.89255, "b": 382.13284, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "<td>", "bbox": {"l": 168.24603, "t": 375.73871, "r": 181.89255, "b": 382.13284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 183.78624, "t": 375.73871, "r": 199.32646, "b": 382.13284, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "</td>", "bbox": {"l": 183.78624, "t": 375.73871, "r": 199.32646, "b": 382.13284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 201.22015, "t": 375.73871, "r": 214.86666999999997, "b": 382.13284, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "<td>", "bbox": {"l": 201.22015, "t": 375.73871, "r": 214.86666999999997, "b": 382.13284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 216.76038, "t": 375.73871, "r": 232.30058, "b": 382.13284, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "</td>", "bbox": {"l": 216.76038, "t": 375.73871, "r": 232.30058, "b": 382.13284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 234.19427000000002, "t": 375.73871, "r": 247.84079000000003, "b": 382.13284, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "<td>", "bbox": {"l": 234.19427000000002, "t": 375.73871, "r": 247.84079000000003, "b": 382.13284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 249.73447999999996, "t": 375.73871, "r": 265.27469, "b": 382.13284, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "</td>", "bbox": {"l": 249.73447999999996, "t": 375.73871, "r": 265.27469, "b": 382.13284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 267.1684, "t": 375.73871, "r": 280.81488, "b": 382.13284, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "<td>", "bbox": {"l": 267.1684, "t": 375.73871, "r": 280.81488, "b": 382.13284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 282.70862, "t": 375.73871, "r": 298.24881, "b": 382.13284, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "</td>", "bbox": {"l": 282.70862, "t": 375.73871, "r": 298.24881, "b": 382.13284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 160.67039, "t": 382.55551, "r": 174.68979, "b": 388.94965, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "</tr>", "bbox": {"l": 160.67039, "t": 382.55551, "r": 174.68979, "b": 388.94965, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 153.0947, "t": 389.37228, "r": 177.73259, "b": 395.76642, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "</table>", "bbox": {"l": 153.0947, "t": 389.37228, "r": 177.73259, "b": 395.76642, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 395.06137, "t": 411.33353, "r": 401.62366, "b": 419.85904, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "C", "bbox": {"l": 395.06137, "t": 411.33353, "r": 401.62366, "b": 419.85904, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 407.42249, "t": 411.33353, "r": 412.47598, "b": 419.85904, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "L", "bbox": {"l": 407.42249, "t": 411.33353, "r": 412.47598, "b": 419.85904, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 418.69287, "t": 411.33353, "r": 425.25516, "b": 419.85904, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "U", "bbox": {"l": 418.69287, "t": 411.33353, "r": 425.25516, "b": 419.85904, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 430.5086099999999, "t": 411.33353, "r": 436.5709800000001, "b": 419.85904, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "X", "bbox": {"l": 430.5086099999999, "t": 411.33353, "r": 436.5709800000001, "b": 419.85904, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 152.36208, "t": 409.77362, "r": 175.10626, "b": 416.16776, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "<table>", "bbox": {"l": 152.36208, "t": 409.77362, "r": 175.10626, "b": 416.16776, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 178.89366, "t": 409.77362, "r": 191.01935, "b": 416.16776, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": "<tr>", "bbox": {"l": 178.89366, "t": 409.77362, "r": 191.01935, "b": 416.16776, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 194.80676, "t": 409.77362, "r": 208.82614, "b": 416.16776, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "</tr>", "bbox": {"l": 194.80676, "t": 409.77362, "r": 208.82614, "b": 416.16776, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 212.61354, "t": 409.77362, "r": 226.26003999999998, "b": 416.16776, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "<td>", "bbox": {"l": 212.61354, "t": 409.77362, "r": 226.26003999999998, "b": 416.16776, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 230.04745000000003, "t": 409.77362, "r": 245.58765000000002, "b": 416.16776, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": "</td>", "bbox": {"l": 230.04745000000003, "t": 409.77362, "r": 245.58765000000002, "b": 416.16776, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 249.37506000000002, "t": 409.77362, "r": 259.03918, "b": 416.16776, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 107, "text": "<td", "bbox": {"l": 249.37506000000002, "t": 409.77362, "r": 259.03918, "b": 416.16776, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 262.82797, "t": 409.77362, "r": 298.93646, "b": 416.16776, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 108, "text": "colspan=\"2\"", "bbox": {"l": 262.82797, "t": 409.77362, "r": 298.93646, "b": 416.16776, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 302.72385, "t": 409.77362, "r": 338.83234, "b": 416.16776, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 109, "text": "colspan=\"3\"", "bbox": {"l": 302.72385, "t": 409.77362, "r": 338.83234, "b": 416.16776, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 152.36208, "t": 418.10522, "r": 190.74123, "b": 424.49936, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 110, "text": "rowspan=\"2\"", "bbox": {"l": 152.36208, "t": 418.10522, "r": 190.74123, "b": 424.49936, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 194.52863, "t": 418.10522, "r": 232.90777999999997, "b": 424.49936, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 111, "text": "rowspan=\"3\"", "bbox": {"l": 194.52863, "t": 418.10522, "r": 232.90777999999997, "b": 424.49936, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 236.69518999999997, "t": 418.10522, "r": 240.67617999999996, "b": 424.49936, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 112, "text": ">", "bbox": {"l": 236.69518999999997, "t": 418.10522, "r": 240.67617999999996, "b": 424.49936, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 244.46358, "t": 418.10522, "r": 269.10144, "b": 424.49936, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 113, "text": "</table>", "bbox": {"l": 244.46358, "t": 418.10522, "r": 269.10144, "b": 424.49936, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 154.50595, "t": 258.60095, "r": 159.62473, "b": 265.70556999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 114, "text": "C", "bbox": {"l": 154.50595, "t": 258.60095, "r": 159.62473, "b": 265.70556999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 164.74348, "t": 258.60095, "r": 185.21857, "b": 265.70556999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 115, "text": "HTML", "bbox": {"l": 164.74348, "t": 258.60095, "r": 185.21857, "b": 265.70556999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 164.3548, "t": 266.49707, "r": 222.05352999999997, "b": 273.60168, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 116, "text": "sequence length:", "bbox": {"l": 164.3548, "t": 266.49707, "r": 222.05352999999997, "b": 273.60168, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 224.15326, "t": 266.49707, "r": 232.57729, "b": 273.60168, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 117, "text": "55", "bbox": {"l": 224.15326, "t": 266.49707, "r": 232.57729, "b": 273.60168, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 2, "label": "text", "bbox": {"l": 134.765, "t": 452.31378, "r": 480.59232000000003, "b": 520.88669, "coord_origin": "TOPLEFT"}, "confidence": 0.950499951839447, "cells": [{"id": 118, "text": "today,", "bbox": {"l": 134.765, "t": 452.31378, "r": 161.32928, "b": 461.11075, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "table detection", "bbox": {"l": 164.269, "t": 452.31378, "r": 226.28617999999997, "b": 461.11075, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "in documents is a well understood problem, and the latest", "bbox": {"l": 229.992, "t": 452.31378, "r": 480.59232000000003, "b": 461.11075, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "state-of-the-art (SOTA) object detection methods provide an accuracy compa-", "bbox": {"l": 134.76501, "t": 464.26877, "r": 480.59180000000003, "b": 473.06573, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "rable to human observers [7,8,10,14,23]. On the other hand, the problem of table", "bbox": {"l": 134.76501, "t": 476.22375, "r": 480.58673, "b": 485.02072, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "structure recognition (TSR) is a lot more challenging and remains a very active", "bbox": {"l": 134.76501, "t": 488.17975, "r": 480.58658, "b": 496.97672, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "area of research, in which many novel machine learning algorithms are being", "bbox": {"l": 134.76501, "t": 500.13474, "r": 480.58978, "b": 508.9317, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "explored [3,4,5,9,11,12,13,14,17,18,21,22].", "bbox": {"l": 134.76501, "t": 512.0897199999999, "r": 313.24597, "b": 520.88669, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 134.76501, "t": 524.55072, "r": 480.59482, "b": 664.8547, "coord_origin": "TOPLEFT"}, "confidence": 0.9845512509346008, "cells": [{"id": 126, "text": "Recently emerging SOTA methods for table structure recognition employ", "bbox": {"l": 149.70901, "t": 524.55072, "r": 480.58884000000006, "b": 533.3476900000001, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "transformer-based models, in which an image of the table is provided to the net-", "bbox": {"l": 134.76501, "t": 536.50671, "r": 480.5917400000001, "b": 545.30368, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "work in order to predict the structure of the table as a sequence of tokens. These", "bbox": {"l": 134.76501, "t": 548.46172, "r": 480.58868, "b": 557.25868, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "image-to-sequence (Im2Seq) models are extremely powerful, since they allow for", "bbox": {"l": 134.76501, "t": 560.41672, "r": 480.58795, "b": 569.2136800000001, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "a purely data-driven solution. The tokens of the sequence typically belong to a", "bbox": {"l": 134.76501, "t": 572.37172, "r": 480.58978, "b": 581.16869, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "markup language such as HTML, Latex or Markdown, which allow to describe", "bbox": {"l": 134.76501, "t": 584.32672, "r": 480.59479, "b": 593.12369, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "table structure as rows, columns and spanning cells in various configurations.", "bbox": {"l": 134.76501, "t": 596.28271, "r": 480.58678999999995, "b": 605.0796799999999, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "In Figure 1, we illustrate how HTML is used to represent the table-structure", "bbox": {"l": 134.76501, "t": 608.23772, "r": 480.59476, "b": 617.03468, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "of a particular example table. Public table-structure data sets such as PubTab-", "bbox": {"l": 134.76501, "t": 620.19272, "r": 480.5938100000001, "b": 628.98969, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "Net [22], and FinTabNet [21], which were created in a semi-automated way from", "bbox": {"l": 134.76501, "t": 632.1477199999999, "r": 480.59482, "b": 640.94469, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "paired PDF and HTML sources (e.g. PubMed Central), popularized primarily", "bbox": {"l": 134.76501, "t": 644.10272, "r": 480.58771, "b": 652.89969, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "the use of HTML as ground-truth representation format for TSR.", "bbox": {"l": 134.76501, "t": 656.05772, "r": 421.45377, "b": 664.8547, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_header", "id": 5, "page_no": 1, "cluster": {"id": 5, "label": "page_header", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8580349683761597, "cells": [{"id": 0, "text": "2", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2"}, {"label": "page_header", "id": 3, "page_no": 1, "cluster": {"id": 3, "label": "page_header", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9076642990112305, "cells": [{"id": 1, "text": "M.", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 178.07675, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37415, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "M. Lysak, et al."}, {"label": "caption", "id": 4, "page_no": 1, "cluster": {"id": 4, "label": "caption", "bbox": {"l": 134.765, "t": 126.33416999999997, "r": 480.59189, "b": 200.22058000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.8939083218574524, "cells": [{"id": 3, "text": "Fig. 1.", "bbox": {"l": 134.765, "t": 126.33416999999997, "r": 162.64424, "b": 134.26049999999998, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Comparison between HTML and OTSL table structure representation: (A)", "bbox": {"l": 167.062, "t": 126.39697000000001, "r": 480.59106, "b": 134.46667000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "table-example with complex row and column headers, including a 2D empty span,", "bbox": {"l": 134.765, "t": 137.35595999999998, "r": 480.59018, "b": 145.42566, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "(B)", "bbox": {"l": 134.765, "t": 148.31493999999998, "r": 147.95433, "b": 156.38464, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "minimal graphical representation of table structure using rectangular layout, (C)", "bbox": {"l": 152.39224, "t": 148.31493999999998, "r": 480.59096999999997, "b": 156.38464, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "HTML representation, (D) OTSL representation. This example demonstrates many of", "bbox": {"l": 134.765, "t": 159.27392999999995, "r": 480.59189, "b": 167.34362999999996, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "the key-features of OTSL, namely its reduced vocabulary size (12 versus 5 in this case),", "bbox": {"l": 134.765, "t": 170.23290999999995, "r": 480.58914000000004, "b": 178.30260999999996, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "its reduced sequence length (55 versus 30) and a enhanced internal structure (variable", "bbox": {"l": 134.765, "t": 181.19188999999994, "r": 480.59020999999996, "b": 189.26160000000004, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "token sequence length per row in HTML versus a fixed length of rows in OTSL).", "bbox": {"l": 134.765, "t": 192.15088000000003, "r": 460.87109, "b": 200.22058000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Fig. 1. Comparison between HTML and OTSL table structure representation: (A) table-example with complex row and column headers, including a 2D empty span, (B) minimal graphical representation of table structure using rectangular layout, (C) HTML representation, (D) OTSL representation. This example demonstrates many of the key-features of OTSL, namely its reduced vocabulary size (12 versus 5 in this case), its reduced sequence length (55 versus 30) and a enhanced internal structure (variable token sequence length per row in HTML versus a fixed length of rows in OTSL)."}, {"label": "picture", "id": 1, "page_no": 1, "cluster": {"id": 1, "label": "picture", "bbox": {"l": 148.45364379882812, "t": 208.37423706054688, "r": 464.3608093261719, "b": 425.8462219238281, "coord_origin": "TOPLEFT"}, "confidence": 0.9688959121704102, "cells": [{"id": 12, "text": "C", "bbox": {"l": 396.41107, "t": 280.98352, "r": 402.97336, "b": 289.50903, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "C", "bbox": {"l": 418.58682, "t": 280.89792, "r": 425.14911, "b": 289.42343, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "C", "bbox": {"l": 395.74835, "t": 303.23727, "r": 402.31064, "b": 311.76279, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "C", "bbox": {"l": 407.54214, "t": 303.36981, "r": 414.10443, "b": 311.89532, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "C", "bbox": {"l": 407.56335, "t": 314.40619, "r": 414.12564, "b": 322.9317, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "C", "bbox": {"l": 418.51108, "t": 292.08502000000004, "r": 425.07336, "b": 300.61053000000004, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "C", "bbox": {"l": 429.59744, "t": 292.09106, "r": 436.1597300000001, "b": 300.61658, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "C", "bbox": {"l": 440.68759000000006, "t": 292.01230000000004, "r": 447.24987999999996, "b": 300.53781000000004, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "C", "bbox": {"l": 418.6232, "t": 303.29483, "r": 425.18549, "b": 311.82034, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "C", "bbox": {"l": 429.7095299999999, "t": 303.30011, "r": 436.27182, "b": 311.82562, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "C", "bbox": {"l": 440.7996800000001, "t": 303.22211, "r": 447.36197, "b": 311.74762, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "C", "bbox": {"l": 418.62546, "t": 314.56903, "r": 425.18774, "b": 323.09454, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "C", "bbox": {"l": 429.71181999999993, "t": 314.57434, "r": 436.27411, "b": 323.09985, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "C", "bbox": {"l": 440.80194, "t": 314.49631, "r": 447.36423, "b": 323.02182, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "C", "bbox": {"l": 407.39746, "t": 325.29031, "r": 413.95975, "b": 333.81583, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "C", "bbox": {"l": 418.45959, "t": 325.45316, "r": 425.02188, "b": 333.97867, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "C", "bbox": {"l": 429.54593, "t": 325.4592, "r": 436.10822, "b": 333.98471, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "C", "bbox": {"l": 440.63608, "t": 325.38043, "r": 447.19836, "b": 333.90594, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "NL", "bbox": {"l": 451.89511000000005, "t": 280.15717, "r": 463.51273000000003, "b": 288.68268, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "NL", "bbox": {"l": 452.1557, "t": 291.59875000000005, "r": 463.77332, "b": 300.12427, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "NL", "bbox": {"l": 452.17688000000004, "t": 302.84265, "r": 463.79449000000005, "b": 311.36816, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "NL", "bbox": {"l": 452.09887999999995, "t": 314.12441999999993, "r": 463.71648999999996, "b": 322.6499299999999, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "NL", "bbox": {"l": 452.29733, "t": 325.46906, "r": 463.91495, "b": 333.99457, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "U", "bbox": {"l": 396.09677, "t": 314.49478, "r": 402.65906, "b": 323.02029000000005, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "U", "bbox": {"l": 395.99829, "t": 325.38876000000005, "r": 402.56058, "b": 333.91428, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "U", "bbox": {"l": 396.27475, "t": 292.27057, "r": 402.83704, "b": 300.79608, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "L", "bbox": {"l": 408.54724, "t": 280.96912, "r": 413.60074, "b": 289.49463, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "L", "bbox": {"l": 430.58966, "t": 280.49725, "r": 435.6431600000001, "b": 289.02277, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "L", "bbox": {"l": 441.08069, "t": 280.38062, "r": 446.13419, "b": 288.90613, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "X", "bbox": {"l": 407.97388, "t": 292.13425, "r": 414.03625, "b": 300.65976, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "NL", "bbox": {"l": 441.25640999999996, "t": 411.1807600000001, "r": 452.87402, "b": 419.7062700000001, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "vocabulary:", "bbox": {"l": 393.75256, "t": 399.7947700000001, "r": 432.48929, "b": 406.89935, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "5", "bbox": {"l": 434.5896000000001, "t": 399.7947700000001, "r": 438.80083999999994, "b": 406.89935, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "tokens", "bbox": {"l": 440.90573, "t": 399.7947700000001, "r": 463.22235, "b": 406.89935, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "D OTSL", "bbox": {"l": 384.11816, "t": 258.54718, "r": 413.99307, "b": 265.65179, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "sequence length:", "bbox": {"l": 393.75256, "t": 266.67505000000006, "r": 451.45129000000003, "b": 273.77966000000004, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "30", "bbox": {"l": 453.55083999999994, "t": 266.67505000000006, "r": 461.97485, "b": 273.77966000000004, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "vocabulary for this table:", "bbox": {"l": 151.79318, "t": 399.76016, "r": 233.89371000000003, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "12", "bbox": {"l": 235.99332, "t": 399.76016, "r": 244.41734000000002, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "tokens", "bbox": {"l": 246.52222, "t": 399.76016, "r": 268.83884, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "A", "bbox": {"l": 154.3298, "t": 213.57457999999997, "r": 159.79837, "b": 220.67920000000004, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "B", "bbox": {"l": 321.07053, "t": 213.57457999999997, "r": 326.53909, "b": 220.67920000000004, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "<table>", "bbox": {"l": 153.0947, "t": 280.30411, "r": 175.83888, "b": 286.69824, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "<tr>", "bbox": {"l": 160.67039, "t": 287.12088, "r": 172.79608, "b": 293.51501, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "<td", "bbox": {"l": 168.24603, "t": 293.93765, "r": 177.91019, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "colspan=\u201c2\u201d", "bbox": {"l": 179.80525, "t": 293.93765, "r": 215.61517, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "rowspan=\u201c2\u201d", "bbox": {"l": 217.50886999999997, "t": 293.93765, "r": 255.58945, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": ">", "bbox": {"l": 257.48315, "t": 293.93765, "r": 261.46414, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "</td>", "bbox": {"l": 263.35785, "t": 293.93765, "r": 278.89804, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "<td", "bbox": {"l": 280.79175, "t": 293.93765, "r": 290.4559, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "colspan=\u201c3\u201d", "bbox": {"l": 292.35095, "t": 293.93765, "r": 328.16083, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": ">", "bbox": {"l": 330.05457, "t": 293.93765, "r": 334.03555, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "</td>", "bbox": {"l": 335.92926, "t": 293.93765, "r": 351.46945, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "</tr>", "bbox": {"l": 160.67039, "t": 300.75442999999996, "r": 174.68979, "b": 307.14856, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "<tr>", "bbox": {"l": 160.67039, "t": 307.57122999999996, "r": 172.79608, "b": 313.96536, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "<td>", "bbox": {"l": 168.24603, "t": 314.388, "r": 181.89255, "b": 320.78214, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "</td>", "bbox": {"l": 183.78624, "t": 314.388, "r": 199.32646, "b": 320.78214, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "<td>", "bbox": {"l": 201.22015, "t": 314.388, "r": 214.86666999999997, "b": 320.78214, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "</td>", "bbox": {"l": 216.76038, "t": 314.388, "r": 232.30058, "b": 320.78214, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "<td>", "bbox": {"l": 234.19427000000002, "t": 314.388, "r": 247.84079000000003, "b": 320.78214, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "</td>", "bbox": {"l": 249.73447999999996, "t": 314.388, "r": 265.27469, "b": 320.78214, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "</tr>", "bbox": {"l": 160.67039, "t": 321.20477, "r": 174.68979, "b": 327.59890999999993, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "<tr>", "bbox": {"l": 160.67039, "t": 328.02158, "r": 172.79608, "b": 334.41571000000005, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "<td rowspan=\u201c3\u201d > </td> <td> </td> <td> </td> <td> </td> <td> </td>", "bbox": {"l": 168.24603, "t": 334.83835, "r": 373.09091, "b": 341.23248, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "</tr>", "bbox": {"l": 160.67039, "t": 341.65512, "r": 174.68979, "b": 348.04926, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "<tr>", "bbox": {"l": 160.67039, "t": 348.47159, "r": 172.79608, "b": 354.86572, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "<td>", "bbox": {"l": 168.24603, "t": 355.28836000000007, "r": 181.89255, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "</td>", "bbox": {"l": 183.78624, "t": 355.28836000000007, "r": 199.32646, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "<td>", "bbox": {"l": 201.22015, "t": 355.28836000000007, "r": 214.86666999999997, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "</td>", "bbox": {"l": 216.76038, "t": 355.28836000000007, "r": 232.30058, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "<td>", "bbox": {"l": 234.19427000000002, "t": 355.28836000000007, "r": 247.84079000000003, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "</td>", "bbox": {"l": 249.73447999999996, "t": 355.28836000000007, "r": 265.27469, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "<td>", "bbox": {"l": 267.1684, "t": 355.28836000000007, "r": 280.81488, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "</td>", "bbox": {"l": 282.70862, "t": 355.28836000000007, "r": 298.24881, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "</tr>", "bbox": {"l": 160.67039, "t": 362.10516000000007, "r": 174.68979, "b": 368.49929999999995, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "<tr>", "bbox": {"l": 160.67039, "t": 368.92194, "r": 172.79608, "b": 375.31607, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "<td>", "bbox": {"l": 168.24603, "t": 375.73871, "r": 181.89255, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "</td>", "bbox": {"l": 183.78624, "t": 375.73871, "r": 199.32646, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "<td>", "bbox": {"l": 201.22015, "t": 375.73871, "r": 214.86666999999997, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "</td>", "bbox": {"l": 216.76038, "t": 375.73871, "r": 232.30058, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "<td>", "bbox": {"l": 234.19427000000002, "t": 375.73871, "r": 247.84079000000003, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "</td>", "bbox": {"l": 249.73447999999996, "t": 375.73871, "r": 265.27469, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "<td>", "bbox": {"l": 267.1684, "t": 375.73871, "r": 280.81488, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "</td>", "bbox": {"l": 282.70862, "t": 375.73871, "r": 298.24881, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "</tr>", "bbox": {"l": 160.67039, "t": 382.55551, "r": 174.68979, "b": 388.94965, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "</table>", "bbox": {"l": 153.0947, "t": 389.37228, "r": 177.73259, "b": 395.76642, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "C", "bbox": {"l": 395.06137, "t": 411.33353, "r": 401.62366, "b": 419.85904, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "L", "bbox": {"l": 407.42249, "t": 411.33353, "r": 412.47598, "b": 419.85904, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "U", "bbox": {"l": 418.69287, "t": 411.33353, "r": 425.25516, "b": 419.85904, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "X", "bbox": {"l": 430.5086099999999, "t": 411.33353, "r": 436.5709800000001, "b": 419.85904, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "<table>", "bbox": {"l": 152.36208, "t": 409.77362, "r": 175.10626, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "<tr>", "bbox": {"l": 178.89366, "t": 409.77362, "r": 191.01935, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "</tr>", "bbox": {"l": 194.80676, "t": 409.77362, "r": 208.82614, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "<td>", "bbox": {"l": 212.61354, "t": 409.77362, "r": 226.26003999999998, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "</td>", "bbox": {"l": 230.04745000000003, "t": 409.77362, "r": 245.58765000000002, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "<td", "bbox": {"l": 249.37506000000002, "t": 409.77362, "r": 259.03918, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "colspan=\"2\"", "bbox": {"l": 262.82797, "t": 409.77362, "r": 298.93646, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "colspan=\"3\"", "bbox": {"l": 302.72385, "t": 409.77362, "r": 338.83234, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "rowspan=\"2\"", "bbox": {"l": 152.36208, "t": 418.10522, "r": 190.74123, "b": 424.49936, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "rowspan=\"3\"", "bbox": {"l": 194.52863, "t": 418.10522, "r": 232.90777999999997, "b": 424.49936, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": ">", "bbox": {"l": 236.69518999999997, "t": 418.10522, "r": 240.67617999999996, "b": 424.49936, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "</table>", "bbox": {"l": 244.46358, "t": 418.10522, "r": 269.10144, "b": 424.49936, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "C", "bbox": {"l": 154.50595, "t": 258.60095, "r": 159.62473, "b": 265.70556999999997, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "HTML", "bbox": {"l": 164.74348, "t": 258.60095, "r": 185.21857, "b": 265.70556999999997, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "sequence length:", "bbox": {"l": 164.3548, "t": 266.49707, "r": 222.05352999999997, "b": 273.60168, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "55", "bbox": {"l": 224.15326, "t": 266.49707, "r": 232.57729, "b": 273.60168, "coord_origin": "TOPLEFT"}}], "children": [{"id": 6, "label": "text", "bbox": {"l": 396.41107, "t": 280.98352, "r": 402.97336, "b": 289.50903, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "C", "bbox": {"l": 396.41107, "t": 280.98352, "r": 402.97336, "b": 289.50903, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "text", "bbox": {"l": 418.58682, "t": 280.89792, "r": 425.14911, "b": 289.42343, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "C", "bbox": {"l": 418.58682, "t": 280.89792, "r": 425.14911, "b": 289.42343, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "text", "bbox": {"l": 395.74835, "t": 303.23727, "r": 402.31064, "b": 311.76279, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "C", "bbox": {"l": 395.74835, "t": 303.23727, "r": 402.31064, "b": 311.76279, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 407.54214, "t": 303.36981, "r": 414.10443, "b": 311.89532, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "C", "bbox": {"l": 407.54214, "t": 303.36981, "r": 414.10443, "b": 311.89532, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "text", "bbox": {"l": 407.56335, "t": 314.40619, "r": 414.12564, "b": 322.9317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "C", "bbox": {"l": 407.56335, "t": 314.40619, "r": 414.12564, "b": 322.9317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 418.51108, "t": 292.08502000000004, "r": 425.07336, "b": 300.61053000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "C", "bbox": {"l": 418.51108, "t": 292.08502000000004, "r": 425.07336, "b": 300.61053000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 429.59744, "t": 292.09106, "r": 436.1597300000001, "b": 300.61658, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "C", "bbox": {"l": 429.59744, "t": 292.09106, "r": 436.1597300000001, "b": 300.61658, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 440.68759000000006, "t": 292.01230000000004, "r": 447.24987999999996, "b": 300.53781000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "C", "bbox": {"l": 440.68759000000006, "t": 292.01230000000004, "r": 447.24987999999996, "b": 300.53781000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 418.6232, "t": 303.29483, "r": 425.18549, "b": 311.82034, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "C", "bbox": {"l": 418.6232, "t": 303.29483, "r": 425.18549, "b": 311.82034, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 429.7095299999999, "t": 303.30011, "r": 436.27182, "b": 311.82562, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "C", "bbox": {"l": 429.7095299999999, "t": 303.30011, "r": 436.27182, "b": 311.82562, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 440.7996800000001, "t": 303.22211, "r": 447.36197, "b": 311.74762, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "C", "bbox": {"l": 440.7996800000001, "t": 303.22211, "r": 447.36197, "b": 311.74762, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 418.62546, "t": 314.56903, "r": 425.18774, "b": 323.09454, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "C", "bbox": {"l": 418.62546, "t": 314.56903, "r": 425.18774, "b": 323.09454, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 429.71181999999993, "t": 314.57434, "r": 436.27411, "b": 323.09985, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "C", "bbox": {"l": 429.71181999999993, "t": 314.57434, "r": 436.27411, "b": 323.09985, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 440.80194, "t": 314.49631, "r": 447.36423, "b": 323.02182, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "C", "bbox": {"l": 440.80194, "t": 314.49631, "r": 447.36423, "b": 323.02182, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 407.39746, "t": 325.29031, "r": 413.95975, "b": 333.81583, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "C", "bbox": {"l": 407.39746, "t": 325.29031, "r": 413.95975, "b": 333.81583, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 418.45959, "t": 325.45316, "r": 425.02188, "b": 333.97867, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "C", "bbox": {"l": 418.45959, "t": 325.45316, "r": 425.02188, "b": 333.97867, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 429.54593, "t": 325.4592, "r": 436.10822, "b": 333.98471, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "C", "bbox": {"l": 429.54593, "t": 325.4592, "r": 436.10822, "b": 333.98471, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 440.63608, "t": 325.38043, "r": 447.19836, "b": 333.90594, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "C", "bbox": {"l": 440.63608, "t": 325.38043, "r": 447.19836, "b": 333.90594, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 451.89511000000005, "t": 280.15717, "r": 463.51273000000003, "b": 288.68268, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "NL", "bbox": {"l": 451.89511000000005, "t": 280.15717, "r": 463.51273000000003, "b": 288.68268, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 452.1557, "t": 291.59875000000005, "r": 463.77332, "b": 300.12427, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "NL", "bbox": {"l": 452.1557, "t": 291.59875000000005, "r": 463.77332, "b": 300.12427, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 452.17688000000004, "t": 302.84265, "r": 463.79449000000005, "b": 311.36816, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "NL", "bbox": {"l": 452.17688000000004, "t": 302.84265, "r": 463.79449000000005, "b": 311.36816, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 452.09887999999995, "t": 314.12441999999993, "r": 463.71648999999996, "b": 322.6499299999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "NL", "bbox": {"l": 452.09887999999995, "t": 314.12441999999993, "r": 463.71648999999996, "b": 322.6499299999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 452.29733, "t": 325.46906, "r": 463.91495, "b": 333.99457, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "NL", "bbox": {"l": 452.29733, "t": 325.46906, "r": 463.91495, "b": 333.99457, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 396.09677, "t": 314.49478, "r": 402.65906, "b": 323.02029000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "U", "bbox": {"l": 396.09677, "t": 314.49478, "r": 402.65906, "b": 323.02029000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 395.99829, "t": 325.38876000000005, "r": 402.56058, "b": 333.91428, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "U", "bbox": {"l": 395.99829, "t": 325.38876000000005, "r": 402.56058, "b": 333.91428, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 396.27475, "t": 292.27057, "r": 402.83704, "b": 300.79608, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "U", "bbox": {"l": 396.27475, "t": 292.27057, "r": 402.83704, "b": 300.79608, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 408.54724, "t": 280.96912, "r": 413.60074, "b": 289.49463, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "L", "bbox": {"l": 408.54724, "t": 280.96912, "r": 413.60074, "b": 289.49463, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 430.58966, "t": 280.49725, "r": 435.6431600000001, "b": 289.02277, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "L", "bbox": {"l": 430.58966, "t": 280.49725, "r": 435.6431600000001, "b": 289.02277, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 441.08069, "t": 280.38062, "r": 446.13419, "b": 288.90613, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "L", "bbox": {"l": 441.08069, "t": 280.38062, "r": 446.13419, "b": 288.90613, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 407.97388, "t": 292.13425, "r": 414.03625, "b": 300.65976, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "X", "bbox": {"l": 407.97388, "t": 292.13425, "r": 414.03625, "b": 300.65976, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 441.25640999999996, "t": 411.1807600000001, "r": 452.87402, "b": 419.7062700000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "NL", "bbox": {"l": 441.25640999999996, "t": 411.1807600000001, "r": 452.87402, "b": 419.7062700000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 393.75256, "t": 399.7947700000001, "r": 432.48929, "b": 406.89935, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "vocabulary:", "bbox": {"l": 393.75256, "t": 399.7947700000001, "r": 432.48929, "b": 406.89935, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 434.5896000000001, "t": 399.7947700000001, "r": 438.80083999999994, "b": 406.89935, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "5", "bbox": {"l": 434.5896000000001, "t": 399.7947700000001, "r": 438.80083999999994, "b": 406.89935, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 440.90573, "t": 399.7947700000001, "r": 463.22235, "b": 406.89935, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "tokens", "bbox": {"l": 440.90573, "t": 399.7947700000001, "r": 463.22235, "b": 406.89935, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 384.11816, "t": 258.54718, "r": 413.99307, "b": 265.65179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "D OTSL", "bbox": {"l": 384.11816, "t": 258.54718, "r": 413.99307, "b": 265.65179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 393.75256, "t": 266.67505000000006, "r": 451.45129000000003, "b": 273.77966000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "sequence length:", "bbox": {"l": 393.75256, "t": 266.67505000000006, "r": 451.45129000000003, "b": 273.77966000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 453.55083999999994, "t": 266.67505000000006, "r": 461.97485, "b": 273.77966000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "30", "bbox": {"l": 453.55083999999994, "t": 266.67505000000006, "r": 461.97485, "b": 273.77966000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 151.79318, "t": 399.76016, "r": 233.89371000000003, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "vocabulary for this table:", "bbox": {"l": 151.79318, "t": 399.76016, "r": 233.89371000000003, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 235.99332, "t": 399.76016, "r": 244.41734000000002, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "12", "bbox": {"l": 235.99332, "t": 399.76016, "r": 244.41734000000002, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 246.52222, "t": 399.76016, "r": 268.83884, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "tokens", "bbox": {"l": 246.52222, "t": 399.76016, "r": 268.83884, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 154.3298, "t": 213.57457999999997, "r": 159.79837, "b": 220.67920000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "A", "bbox": {"l": 154.3298, "t": 213.57457999999997, "r": 159.79837, "b": 220.67920000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 321.07053, "t": 213.57457999999997, "r": 326.53909, "b": 220.67920000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "B", "bbox": {"l": 321.07053, "t": 213.57457999999997, "r": 326.53909, "b": 220.67920000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 153.0947, "t": 280.30411, "r": 175.83888, "b": 286.69824, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "<table>", "bbox": {"l": 153.0947, "t": 280.30411, "r": 175.83888, "b": 286.69824, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 160.67039, "t": 287.12088, "r": 172.79608, "b": 293.51501, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "<tr>", "bbox": {"l": 160.67039, "t": 287.12088, "r": 172.79608, "b": 293.51501, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 168.24603, "t": 293.93765, "r": 177.91019, "b": 300.33179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "<td", "bbox": {"l": 168.24603, "t": 293.93765, "r": 177.91019, "b": 300.33179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 179.80525, "t": 293.93765, "r": 215.61517, "b": 300.33179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "colspan=\u201c2\u201d", "bbox": {"l": 179.80525, "t": 293.93765, "r": 215.61517, "b": 300.33179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 217.50886999999997, "t": 293.93765, "r": 255.58945, "b": 300.33179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "rowspan=\u201c2\u201d", "bbox": {"l": 217.50886999999997, "t": 293.93765, "r": 255.58945, "b": 300.33179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 257.48315, "t": 293.93765, "r": 261.46414, "b": 300.33179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": ">", "bbox": {"l": 257.48315, "t": 293.93765, "r": 261.46414, "b": 300.33179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 263.35785, "t": 293.93765, "r": 278.89804, "b": 300.33179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "</td>", "bbox": {"l": 263.35785, "t": 293.93765, "r": 278.89804, "b": 300.33179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 280.79175, "t": 293.93765, "r": 290.4559, "b": 300.33179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "<td", "bbox": {"l": 280.79175, "t": 293.93765, "r": 290.4559, "b": 300.33179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 292.35095, "t": 293.93765, "r": 328.16083, "b": 300.33179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "colspan=\u201c3\u201d", "bbox": {"l": 292.35095, "t": 293.93765, "r": 328.16083, "b": 300.33179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 330.05457, "t": 293.93765, "r": 334.03555, "b": 300.33179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": ">", "bbox": {"l": 330.05457, "t": 293.93765, "r": 334.03555, "b": 300.33179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 335.92926, "t": 293.93765, "r": 351.46945, "b": 300.33179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "</td>", "bbox": {"l": 335.92926, "t": 293.93765, "r": 351.46945, "b": 300.33179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 160.67039, "t": 300.75442999999996, "r": 174.68979, "b": 307.14856, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "</tr>", "bbox": {"l": 160.67039, "t": 300.75442999999996, "r": 174.68979, "b": 307.14856, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 160.67039, "t": 307.57122999999996, "r": 172.79608, "b": 313.96536, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "<tr>", "bbox": {"l": 160.67039, "t": 307.57122999999996, "r": 172.79608, "b": 313.96536, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 168.24603, "t": 314.388, "r": 181.89255, "b": 320.78214, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "<td>", "bbox": {"l": 168.24603, "t": 314.388, "r": 181.89255, "b": 320.78214, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 183.78624, "t": 314.388, "r": 199.32646, "b": 320.78214, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "</td>", "bbox": {"l": 183.78624, "t": 314.388, "r": 199.32646, "b": 320.78214, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 201.22015, "t": 314.388, "r": 214.86666999999997, "b": 320.78214, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "<td>", "bbox": {"l": 201.22015, "t": 314.388, "r": 214.86666999999997, "b": 320.78214, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 216.76038, "t": 314.388, "r": 232.30058, "b": 320.78214, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "</td>", "bbox": {"l": 216.76038, "t": 314.388, "r": 232.30058, "b": 320.78214, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 234.19427000000002, "t": 314.388, "r": 247.84079000000003, "b": 320.78214, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "<td>", "bbox": {"l": 234.19427000000002, "t": 314.388, "r": 247.84079000000003, "b": 320.78214, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 249.73447999999996, "t": 314.388, "r": 265.27469, "b": 320.78214, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "</td>", "bbox": {"l": 249.73447999999996, "t": 314.388, "r": 265.27469, "b": 320.78214, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 160.67039, "t": 321.20477, "r": 174.68979, "b": 327.59890999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "</tr>", "bbox": {"l": 160.67039, "t": 321.20477, "r": 174.68979, "b": 327.59890999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 160.67039, "t": 328.02158, "r": 172.79608, "b": 334.41571000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "<tr>", "bbox": {"l": 160.67039, "t": 328.02158, "r": 172.79608, "b": 334.41571000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 168.24603, "t": 334.83835, "r": 373.09091, "b": 341.23248, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "<td rowspan=\u201c3\u201d > </td> <td> </td> <td> </td> <td> </td> <td> </td>", "bbox": {"l": 168.24603, "t": 334.83835, "r": 373.09091, "b": 341.23248, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 160.67039, "t": 341.65512, "r": 174.68979, "b": 348.04926, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "</tr>", "bbox": {"l": 160.67039, "t": 341.65512, "r": 174.68979, "b": 348.04926, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 160.67039, "t": 348.47159, "r": 172.79608, "b": 354.86572, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "<tr>", "bbox": {"l": 160.67039, "t": 348.47159, "r": 172.79608, "b": 354.86572, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 168.24603, "t": 355.28836000000007, "r": 181.89255, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "<td>", "bbox": {"l": 168.24603, "t": 355.28836000000007, "r": 181.89255, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 183.78624, "t": 355.28836000000007, "r": 199.32646, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "</td>", "bbox": {"l": 183.78624, "t": 355.28836000000007, "r": 199.32646, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 201.22015, "t": 355.28836000000007, "r": 214.86666999999997, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "<td>", "bbox": {"l": 201.22015, "t": 355.28836000000007, "r": 214.86666999999997, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 216.76038, "t": 355.28836000000007, "r": 232.30058, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "</td>", "bbox": {"l": 216.76038, "t": 355.28836000000007, "r": 232.30058, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 234.19427000000002, "t": 355.28836000000007, "r": 247.84079000000003, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "<td>", "bbox": {"l": 234.19427000000002, "t": 355.28836000000007, "r": 247.84079000000003, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 249.73447999999996, "t": 355.28836000000007, "r": 265.27469, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "</td>", "bbox": {"l": 249.73447999999996, "t": 355.28836000000007, "r": 265.27469, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 267.1684, "t": 355.28836000000007, "r": 280.81488, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "<td>", "bbox": {"l": 267.1684, "t": 355.28836000000007, "r": 280.81488, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 282.70862, "t": 355.28836000000007, "r": 298.24881, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "</td>", "bbox": {"l": 282.70862, "t": 355.28836000000007, "r": 298.24881, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 160.67039, "t": 362.10516000000007, "r": 174.68979, "b": 368.49929999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "</tr>", "bbox": {"l": 160.67039, "t": 362.10516000000007, "r": 174.68979, "b": 368.49929999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 160.67039, "t": 368.92194, "r": 172.79608, "b": 375.31607, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "<tr>", "bbox": {"l": 160.67039, "t": 368.92194, "r": 172.79608, "b": 375.31607, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 168.24603, "t": 375.73871, "r": 181.89255, "b": 382.13284, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "<td>", "bbox": {"l": 168.24603, "t": 375.73871, "r": 181.89255, "b": 382.13284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 183.78624, "t": 375.73871, "r": 199.32646, "b": 382.13284, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "</td>", "bbox": {"l": 183.78624, "t": 375.73871, "r": 199.32646, "b": 382.13284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 201.22015, "t": 375.73871, "r": 214.86666999999997, "b": 382.13284, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "<td>", "bbox": {"l": 201.22015, "t": 375.73871, "r": 214.86666999999997, "b": 382.13284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 216.76038, "t": 375.73871, "r": 232.30058, "b": 382.13284, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "</td>", "bbox": {"l": 216.76038, "t": 375.73871, "r": 232.30058, "b": 382.13284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 234.19427000000002, "t": 375.73871, "r": 247.84079000000003, "b": 382.13284, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "<td>", "bbox": {"l": 234.19427000000002, "t": 375.73871, "r": 247.84079000000003, "b": 382.13284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 249.73447999999996, "t": 375.73871, "r": 265.27469, "b": 382.13284, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "</td>", "bbox": {"l": 249.73447999999996, "t": 375.73871, "r": 265.27469, "b": 382.13284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 267.1684, "t": 375.73871, "r": 280.81488, "b": 382.13284, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "<td>", "bbox": {"l": 267.1684, "t": 375.73871, "r": 280.81488, "b": 382.13284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 282.70862, "t": 375.73871, "r": 298.24881, "b": 382.13284, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "</td>", "bbox": {"l": 282.70862, "t": 375.73871, "r": 298.24881, "b": 382.13284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 160.67039, "t": 382.55551, "r": 174.68979, "b": 388.94965, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "</tr>", "bbox": {"l": 160.67039, "t": 382.55551, "r": 174.68979, "b": 388.94965, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 153.0947, "t": 389.37228, "r": 177.73259, "b": 395.76642, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "</table>", "bbox": {"l": 153.0947, "t": 389.37228, "r": 177.73259, "b": 395.76642, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 395.06137, "t": 411.33353, "r": 401.62366, "b": 419.85904, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "C", "bbox": {"l": 395.06137, "t": 411.33353, "r": 401.62366, "b": 419.85904, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 407.42249, "t": 411.33353, "r": 412.47598, "b": 419.85904, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "L", "bbox": {"l": 407.42249, "t": 411.33353, "r": 412.47598, "b": 419.85904, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 418.69287, "t": 411.33353, "r": 425.25516, "b": 419.85904, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "U", "bbox": {"l": 418.69287, "t": 411.33353, "r": 425.25516, "b": 419.85904, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 430.5086099999999, "t": 411.33353, "r": 436.5709800000001, "b": 419.85904, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "X", "bbox": {"l": 430.5086099999999, "t": 411.33353, "r": 436.5709800000001, "b": 419.85904, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 152.36208, "t": 409.77362, "r": 175.10626, "b": 416.16776, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "<table>", "bbox": {"l": 152.36208, "t": 409.77362, "r": 175.10626, "b": 416.16776, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 178.89366, "t": 409.77362, "r": 191.01935, "b": 416.16776, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": "<tr>", "bbox": {"l": 178.89366, "t": 409.77362, "r": 191.01935, "b": 416.16776, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 194.80676, "t": 409.77362, "r": 208.82614, "b": 416.16776, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "</tr>", "bbox": {"l": 194.80676, "t": 409.77362, "r": 208.82614, "b": 416.16776, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 212.61354, "t": 409.77362, "r": 226.26003999999998, "b": 416.16776, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "<td>", "bbox": {"l": 212.61354, "t": 409.77362, "r": 226.26003999999998, "b": 416.16776, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 230.04745000000003, "t": 409.77362, "r": 245.58765000000002, "b": 416.16776, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": "</td>", "bbox": {"l": 230.04745000000003, "t": 409.77362, "r": 245.58765000000002, "b": 416.16776, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 249.37506000000002, "t": 409.77362, "r": 259.03918, "b": 416.16776, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 107, "text": "<td", "bbox": {"l": 249.37506000000002, "t": 409.77362, "r": 259.03918, "b": 416.16776, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 262.82797, "t": 409.77362, "r": 298.93646, "b": 416.16776, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 108, "text": "colspan=\"2\"", "bbox": {"l": 262.82797, "t": 409.77362, "r": 298.93646, "b": 416.16776, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 302.72385, "t": 409.77362, "r": 338.83234, "b": 416.16776, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 109, "text": "colspan=\"3\"", "bbox": {"l": 302.72385, "t": 409.77362, "r": 338.83234, "b": 416.16776, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 152.36208, "t": 418.10522, "r": 190.74123, "b": 424.49936, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 110, "text": "rowspan=\"2\"", "bbox": {"l": 152.36208, "t": 418.10522, "r": 190.74123, "b": 424.49936, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 194.52863, "t": 418.10522, "r": 232.90777999999997, "b": 424.49936, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 111, "text": "rowspan=\"3\"", "bbox": {"l": 194.52863, "t": 418.10522, "r": 232.90777999999997, "b": 424.49936, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 236.69518999999997, "t": 418.10522, "r": 240.67617999999996, "b": 424.49936, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 112, "text": ">", "bbox": {"l": 236.69518999999997, "t": 418.10522, "r": 240.67617999999996, "b": 424.49936, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 244.46358, "t": 418.10522, "r": 269.10144, "b": 424.49936, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 113, "text": "</table>", "bbox": {"l": 244.46358, "t": 418.10522, "r": 269.10144, "b": 424.49936, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 154.50595, "t": 258.60095, "r": 159.62473, "b": 265.70556999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 114, "text": "C", "bbox": {"l": 154.50595, "t": 258.60095, "r": 159.62473, "b": 265.70556999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 164.74348, "t": 258.60095, "r": 185.21857, "b": 265.70556999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 115, "text": "HTML", "bbox": {"l": 164.74348, "t": 258.60095, "r": 185.21857, "b": 265.70556999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 164.3548, "t": 266.49707, "r": 222.05352999999997, "b": 273.60168, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 116, "text": "sequence length:", "bbox": {"l": 164.3548, "t": 266.49707, "r": 222.05352999999997, "b": 273.60168, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 224.15326, "t": 266.49707, "r": 232.57729, "b": 273.60168, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 117, "text": "55", "bbox": {"l": 224.15326, "t": 266.49707, "r": 232.57729, "b": 273.60168, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "text", "id": 2, "page_no": 1, "cluster": {"id": 2, "label": "text", "bbox": {"l": 134.765, "t": 452.31378, "r": 480.59232000000003, "b": 520.88669, "coord_origin": "TOPLEFT"}, "confidence": 0.950499951839447, "cells": [{"id": 118, "text": "today,", "bbox": {"l": 134.765, "t": 452.31378, "r": 161.32928, "b": 461.11075, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "table detection", "bbox": {"l": 164.269, "t": 452.31378, "r": 226.28617999999997, "b": 461.11075, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "in documents is a well understood problem, and the latest", "bbox": {"l": 229.992, "t": 452.31378, "r": 480.59232000000003, "b": 461.11075, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "state-of-the-art (SOTA) object detection methods provide an accuracy compa-", "bbox": {"l": 134.76501, "t": 464.26877, "r": 480.59180000000003, "b": 473.06573, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "rable to human observers [7,8,10,14,23]. On the other hand, the problem of table", "bbox": {"l": 134.76501, "t": 476.22375, "r": 480.58673, "b": 485.02072, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "structure recognition (TSR) is a lot more challenging and remains a very active", "bbox": {"l": 134.76501, "t": 488.17975, "r": 480.58658, "b": 496.97672, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "area of research, in which many novel machine learning algorithms are being", "bbox": {"l": 134.76501, "t": 500.13474, "r": 480.58978, "b": 508.9317, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "explored [3,4,5,9,11,12,13,14,17,18,21,22].", "bbox": {"l": 134.76501, "t": 512.0897199999999, "r": 313.24597, "b": 520.88669, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "today, table detection in documents is a well understood problem, and the latest state-of-the-art (SOTA) object detection methods provide an accuracy comparable to human observers [7,8,10,14,23]. On the other hand, the problem of table structure recognition (TSR) is a lot more challenging and remains a very active area of research, in which many novel machine learning algorithms are being explored [3,4,5,9,11,12,13,14,17,18,21,22]."}, {"label": "text", "id": 0, "page_no": 1, "cluster": {"id": 0, "label": "text", "bbox": {"l": 134.76501, "t": 524.55072, "r": 480.59482, "b": 664.8547, "coord_origin": "TOPLEFT"}, "confidence": 0.9845512509346008, "cells": [{"id": 126, "text": "Recently emerging SOTA methods for table structure recognition employ", "bbox": {"l": 149.70901, "t": 524.55072, "r": 480.58884000000006, "b": 533.3476900000001, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "transformer-based models, in which an image of the table is provided to the net-", "bbox": {"l": 134.76501, "t": 536.50671, "r": 480.5917400000001, "b": 545.30368, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "work in order to predict the structure of the table as a sequence of tokens. These", "bbox": {"l": 134.76501, "t": 548.46172, "r": 480.58868, "b": 557.25868, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "image-to-sequence (Im2Seq) models are extremely powerful, since they allow for", "bbox": {"l": 134.76501, "t": 560.41672, "r": 480.58795, "b": 569.2136800000001, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "a purely data-driven solution. The tokens of the sequence typically belong to a", "bbox": {"l": 134.76501, "t": 572.37172, "r": 480.58978, "b": 581.16869, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "markup language such as HTML, Latex or Markdown, which allow to describe", "bbox": {"l": 134.76501, "t": 584.32672, "r": 480.59479, "b": 593.12369, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "table structure as rows, columns and spanning cells in various configurations.", "bbox": {"l": 134.76501, "t": 596.28271, "r": 480.58678999999995, "b": 605.0796799999999, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "In Figure 1, we illustrate how HTML is used to represent the table-structure", "bbox": {"l": 134.76501, "t": 608.23772, "r": 480.59476, "b": 617.03468, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "of a particular example table. Public table-structure data sets such as PubTab-", "bbox": {"l": 134.76501, "t": 620.19272, "r": 480.5938100000001, "b": 628.98969, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "Net [22], and FinTabNet [21], which were created in a semi-automated way from", "bbox": {"l": 134.76501, "t": 632.1477199999999, "r": 480.59482, "b": 640.94469, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "paired PDF and HTML sources (e.g. PubMed Central), popularized primarily", "bbox": {"l": 134.76501, "t": 644.10272, "r": 480.58771, "b": 652.89969, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "the use of HTML as ground-truth representation format for TSR.", "bbox": {"l": 134.76501, "t": 656.05772, "r": 421.45377, "b": 664.8547, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Recently emerging SOTA methods for table structure recognition employ transformer-based models, in which an image of the table is provided to the network in order to predict the structure of the table as a sequence of tokens. These image-to-sequence (Im2Seq) models are extremely powerful, since they allow for a purely data-driven solution. The tokens of the sequence typically belong to a markup language such as HTML, Latex or Markdown, which allow to describe table structure as rows, columns and spanning cells in various configurations. In Figure 1, we illustrate how HTML is used to represent the table-structure of a particular example table. Public table-structure data sets such as PubTabNet [22], and FinTabNet [21], which were created in a semi-automated way from paired PDF and HTML sources (e.g. PubMed Central), popularized primarily the use of HTML as ground-truth representation format for TSR."}], "body": [{"label": "caption", "id": 4, "page_no": 1, "cluster": {"id": 4, "label": "caption", "bbox": {"l": 134.765, "t": 126.33416999999997, "r": 480.59189, "b": 200.22058000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.8939083218574524, "cells": [{"id": 3, "text": "Fig. 1.", "bbox": {"l": 134.765, "t": 126.33416999999997, "r": 162.64424, "b": 134.26049999999998, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Comparison between HTML and OTSL table structure representation: (A)", "bbox": {"l": 167.062, "t": 126.39697000000001, "r": 480.59106, "b": 134.46667000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "table-example with complex row and column headers, including a 2D empty span,", "bbox": {"l": 134.765, "t": 137.35595999999998, "r": 480.59018, "b": 145.42566, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "(B)", "bbox": {"l": 134.765, "t": 148.31493999999998, "r": 147.95433, "b": 156.38464, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "minimal graphical representation of table structure using rectangular layout, (C)", "bbox": {"l": 152.39224, "t": 148.31493999999998, "r": 480.59096999999997, "b": 156.38464, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "HTML representation, (D) OTSL representation. This example demonstrates many of", "bbox": {"l": 134.765, "t": 159.27392999999995, "r": 480.59189, "b": 167.34362999999996, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "the key-features of OTSL, namely its reduced vocabulary size (12 versus 5 in this case),", "bbox": {"l": 134.765, "t": 170.23290999999995, "r": 480.58914000000004, "b": 178.30260999999996, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "its reduced sequence length (55 versus 30) and a enhanced internal structure (variable", "bbox": {"l": 134.765, "t": 181.19188999999994, "r": 480.59020999999996, "b": 189.26160000000004, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "token sequence length per row in HTML versus a fixed length of rows in OTSL).", "bbox": {"l": 134.765, "t": 192.15088000000003, "r": 460.87109, "b": 200.22058000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Fig. 1. Comparison between HTML and OTSL table structure representation: (A) table-example with complex row and column headers, including a 2D empty span, (B) minimal graphical representation of table structure using rectangular layout, (C) HTML representation, (D) OTSL representation. This example demonstrates many of the key-features of OTSL, namely its reduced vocabulary size (12 versus 5 in this case), its reduced sequence length (55 versus 30) and a enhanced internal structure (variable token sequence length per row in HTML versus a fixed length of rows in OTSL)."}, {"label": "picture", "id": 1, "page_no": 1, "cluster": {"id": 1, "label": "picture", "bbox": {"l": 148.45364379882812, "t": 208.37423706054688, "r": 464.3608093261719, "b": 425.8462219238281, "coord_origin": "TOPLEFT"}, "confidence": 0.9688959121704102, "cells": [{"id": 12, "text": "C", "bbox": {"l": 396.41107, "t": 280.98352, "r": 402.97336, "b": 289.50903, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "C", "bbox": {"l": 418.58682, "t": 280.89792, "r": 425.14911, "b": 289.42343, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "C", "bbox": {"l": 395.74835, "t": 303.23727, "r": 402.31064, "b": 311.76279, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "C", "bbox": {"l": 407.54214, "t": 303.36981, "r": 414.10443, "b": 311.89532, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "C", "bbox": {"l": 407.56335, "t": 314.40619, "r": 414.12564, "b": 322.9317, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "C", "bbox": {"l": 418.51108, "t": 292.08502000000004, "r": 425.07336, "b": 300.61053000000004, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "C", "bbox": {"l": 429.59744, "t": 292.09106, "r": 436.1597300000001, "b": 300.61658, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "C", "bbox": {"l": 440.68759000000006, "t": 292.01230000000004, "r": 447.24987999999996, "b": 300.53781000000004, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "C", "bbox": {"l": 418.6232, "t": 303.29483, "r": 425.18549, "b": 311.82034, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "C", "bbox": {"l": 429.7095299999999, "t": 303.30011, "r": 436.27182, "b": 311.82562, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "C", "bbox": {"l": 440.7996800000001, "t": 303.22211, "r": 447.36197, "b": 311.74762, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "C", "bbox": {"l": 418.62546, "t": 314.56903, "r": 425.18774, "b": 323.09454, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "C", "bbox": {"l": 429.71181999999993, "t": 314.57434, "r": 436.27411, "b": 323.09985, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "C", "bbox": {"l": 440.80194, "t": 314.49631, "r": 447.36423, "b": 323.02182, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "C", "bbox": {"l": 407.39746, "t": 325.29031, "r": 413.95975, "b": 333.81583, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "C", "bbox": {"l": 418.45959, "t": 325.45316, "r": 425.02188, "b": 333.97867, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "C", "bbox": {"l": 429.54593, "t": 325.4592, "r": 436.10822, "b": 333.98471, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "C", "bbox": {"l": 440.63608, "t": 325.38043, "r": 447.19836, "b": 333.90594, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "NL", "bbox": {"l": 451.89511000000005, "t": 280.15717, "r": 463.51273000000003, "b": 288.68268, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "NL", "bbox": {"l": 452.1557, "t": 291.59875000000005, "r": 463.77332, "b": 300.12427, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "NL", "bbox": {"l": 452.17688000000004, "t": 302.84265, "r": 463.79449000000005, "b": 311.36816, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "NL", "bbox": {"l": 452.09887999999995, "t": 314.12441999999993, "r": 463.71648999999996, "b": 322.6499299999999, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "NL", "bbox": {"l": 452.29733, "t": 325.46906, "r": 463.91495, "b": 333.99457, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "U", "bbox": {"l": 396.09677, "t": 314.49478, "r": 402.65906, "b": 323.02029000000005, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "U", "bbox": {"l": 395.99829, "t": 325.38876000000005, "r": 402.56058, "b": 333.91428, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "U", "bbox": {"l": 396.27475, "t": 292.27057, "r": 402.83704, "b": 300.79608, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "L", "bbox": {"l": 408.54724, "t": 280.96912, "r": 413.60074, "b": 289.49463, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "L", "bbox": {"l": 430.58966, "t": 280.49725, "r": 435.6431600000001, "b": 289.02277, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "L", "bbox": {"l": 441.08069, "t": 280.38062, "r": 446.13419, "b": 288.90613, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "X", "bbox": {"l": 407.97388, "t": 292.13425, "r": 414.03625, "b": 300.65976, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "NL", "bbox": {"l": 441.25640999999996, "t": 411.1807600000001, "r": 452.87402, "b": 419.7062700000001, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "vocabulary:", "bbox": {"l": 393.75256, "t": 399.7947700000001, "r": 432.48929, "b": 406.89935, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "5", "bbox": {"l": 434.5896000000001, "t": 399.7947700000001, "r": 438.80083999999994, "b": 406.89935, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "tokens", "bbox": {"l": 440.90573, "t": 399.7947700000001, "r": 463.22235, "b": 406.89935, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "D OTSL", "bbox": {"l": 384.11816, "t": 258.54718, "r": 413.99307, "b": 265.65179, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "sequence length:", "bbox": {"l": 393.75256, "t": 266.67505000000006, "r": 451.45129000000003, "b": 273.77966000000004, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "30", "bbox": {"l": 453.55083999999994, "t": 266.67505000000006, "r": 461.97485, "b": 273.77966000000004, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "vocabulary for this table:", "bbox": {"l": 151.79318, "t": 399.76016, "r": 233.89371000000003, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "12", "bbox": {"l": 235.99332, "t": 399.76016, "r": 244.41734000000002, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "tokens", "bbox": {"l": 246.52222, "t": 399.76016, "r": 268.83884, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "A", "bbox": {"l": 154.3298, "t": 213.57457999999997, "r": 159.79837, "b": 220.67920000000004, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "B", "bbox": {"l": 321.07053, "t": 213.57457999999997, "r": 326.53909, "b": 220.67920000000004, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "<table>", "bbox": {"l": 153.0947, "t": 280.30411, "r": 175.83888, "b": 286.69824, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "<tr>", "bbox": {"l": 160.67039, "t": 287.12088, "r": 172.79608, "b": 293.51501, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "<td", "bbox": {"l": 168.24603, "t": 293.93765, "r": 177.91019, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "colspan=\u201c2\u201d", "bbox": {"l": 179.80525, "t": 293.93765, "r": 215.61517, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "rowspan=\u201c2\u201d", "bbox": {"l": 217.50886999999997, "t": 293.93765, "r": 255.58945, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": ">", "bbox": {"l": 257.48315, "t": 293.93765, "r": 261.46414, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "</td>", "bbox": {"l": 263.35785, "t": 293.93765, "r": 278.89804, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "<td", "bbox": {"l": 280.79175, "t": 293.93765, "r": 290.4559, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "colspan=\u201c3\u201d", "bbox": {"l": 292.35095, "t": 293.93765, "r": 328.16083, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": ">", "bbox": {"l": 330.05457, "t": 293.93765, "r": 334.03555, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "</td>", "bbox": {"l": 335.92926, "t": 293.93765, "r": 351.46945, "b": 300.33179, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "</tr>", "bbox": {"l": 160.67039, "t": 300.75442999999996, "r": 174.68979, "b": 307.14856, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "<tr>", "bbox": {"l": 160.67039, "t": 307.57122999999996, "r": 172.79608, "b": 313.96536, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "<td>", "bbox": {"l": 168.24603, "t": 314.388, "r": 181.89255, "b": 320.78214, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "</td>", "bbox": {"l": 183.78624, "t": 314.388, "r": 199.32646, "b": 320.78214, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "<td>", "bbox": {"l": 201.22015, "t": 314.388, "r": 214.86666999999997, "b": 320.78214, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "</td>", "bbox": {"l": 216.76038, "t": 314.388, "r": 232.30058, "b": 320.78214, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "<td>", "bbox": {"l": 234.19427000000002, "t": 314.388, "r": 247.84079000000003, "b": 320.78214, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "</td>", "bbox": {"l": 249.73447999999996, "t": 314.388, "r": 265.27469, "b": 320.78214, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "</tr>", "bbox": {"l": 160.67039, "t": 321.20477, "r": 174.68979, "b": 327.59890999999993, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "<tr>", "bbox": {"l": 160.67039, "t": 328.02158, "r": 172.79608, "b": 334.41571000000005, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "<td rowspan=\u201c3\u201d > </td> <td> </td> <td> </td> <td> </td> <td> </td>", "bbox": {"l": 168.24603, "t": 334.83835, "r": 373.09091, "b": 341.23248, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "</tr>", "bbox": {"l": 160.67039, "t": 341.65512, "r": 174.68979, "b": 348.04926, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "<tr>", "bbox": {"l": 160.67039, "t": 348.47159, "r": 172.79608, "b": 354.86572, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "<td>", "bbox": {"l": 168.24603, "t": 355.28836000000007, "r": 181.89255, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "</td>", "bbox": {"l": 183.78624, "t": 355.28836000000007, "r": 199.32646, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "<td>", "bbox": {"l": 201.22015, "t": 355.28836000000007, "r": 214.86666999999997, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "</td>", "bbox": {"l": 216.76038, "t": 355.28836000000007, "r": 232.30058, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "<td>", "bbox": {"l": 234.19427000000002, "t": 355.28836000000007, "r": 247.84079000000003, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "</td>", "bbox": {"l": 249.73447999999996, "t": 355.28836000000007, "r": 265.27469, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "<td>", "bbox": {"l": 267.1684, "t": 355.28836000000007, "r": 280.81488, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "</td>", "bbox": {"l": 282.70862, "t": 355.28836000000007, "r": 298.24881, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "</tr>", "bbox": {"l": 160.67039, "t": 362.10516000000007, "r": 174.68979, "b": 368.49929999999995, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "<tr>", "bbox": {"l": 160.67039, "t": 368.92194, "r": 172.79608, "b": 375.31607, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "<td>", "bbox": {"l": 168.24603, "t": 375.73871, "r": 181.89255, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "</td>", "bbox": {"l": 183.78624, "t": 375.73871, "r": 199.32646, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "<td>", "bbox": {"l": 201.22015, "t": 375.73871, "r": 214.86666999999997, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "</td>", "bbox": {"l": 216.76038, "t": 375.73871, "r": 232.30058, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "<td>", "bbox": {"l": 234.19427000000002, "t": 375.73871, "r": 247.84079000000003, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "</td>", "bbox": {"l": 249.73447999999996, "t": 375.73871, "r": 265.27469, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "<td>", "bbox": {"l": 267.1684, "t": 375.73871, "r": 280.81488, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "</td>", "bbox": {"l": 282.70862, "t": 375.73871, "r": 298.24881, "b": 382.13284, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "</tr>", "bbox": {"l": 160.67039, "t": 382.55551, "r": 174.68979, "b": 388.94965, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "</table>", "bbox": {"l": 153.0947, "t": 389.37228, "r": 177.73259, "b": 395.76642, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "C", "bbox": {"l": 395.06137, "t": 411.33353, "r": 401.62366, "b": 419.85904, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "L", "bbox": {"l": 407.42249, "t": 411.33353, "r": 412.47598, "b": 419.85904, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "U", "bbox": {"l": 418.69287, "t": 411.33353, "r": 425.25516, "b": 419.85904, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "X", "bbox": {"l": 430.5086099999999, "t": 411.33353, "r": 436.5709800000001, "b": 419.85904, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "<table>", "bbox": {"l": 152.36208, "t": 409.77362, "r": 175.10626, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "<tr>", "bbox": {"l": 178.89366, "t": 409.77362, "r": 191.01935, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "</tr>", "bbox": {"l": 194.80676, "t": 409.77362, "r": 208.82614, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "<td>", "bbox": {"l": 212.61354, "t": 409.77362, "r": 226.26003999999998, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "</td>", "bbox": {"l": 230.04745000000003, "t": 409.77362, "r": 245.58765000000002, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "<td", "bbox": {"l": 249.37506000000002, "t": 409.77362, "r": 259.03918, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "colspan=\"2\"", "bbox": {"l": 262.82797, "t": 409.77362, "r": 298.93646, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "colspan=\"3\"", "bbox": {"l": 302.72385, "t": 409.77362, "r": 338.83234, "b": 416.16776, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "rowspan=\"2\"", "bbox": {"l": 152.36208, "t": 418.10522, "r": 190.74123, "b": 424.49936, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "rowspan=\"3\"", "bbox": {"l": 194.52863, "t": 418.10522, "r": 232.90777999999997, "b": 424.49936, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": ">", "bbox": {"l": 236.69518999999997, "t": 418.10522, "r": 240.67617999999996, "b": 424.49936, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "</table>", "bbox": {"l": 244.46358, "t": 418.10522, "r": 269.10144, "b": 424.49936, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "C", "bbox": {"l": 154.50595, "t": 258.60095, "r": 159.62473, "b": 265.70556999999997, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "HTML", "bbox": {"l": 164.74348, "t": 258.60095, "r": 185.21857, "b": 265.70556999999997, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "sequence length:", "bbox": {"l": 164.3548, "t": 266.49707, "r": 222.05352999999997, "b": 273.60168, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "55", "bbox": {"l": 224.15326, "t": 266.49707, "r": 232.57729, "b": 273.60168, "coord_origin": "TOPLEFT"}}], "children": [{"id": 6, "label": "text", "bbox": {"l": 396.41107, "t": 280.98352, "r": 402.97336, "b": 289.50903, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "C", "bbox": {"l": 396.41107, "t": 280.98352, "r": 402.97336, "b": 289.50903, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "text", "bbox": {"l": 418.58682, "t": 280.89792, "r": 425.14911, "b": 289.42343, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "C", "bbox": {"l": 418.58682, "t": 280.89792, "r": 425.14911, "b": 289.42343, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "text", "bbox": {"l": 395.74835, "t": 303.23727, "r": 402.31064, "b": 311.76279, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "C", "bbox": {"l": 395.74835, "t": 303.23727, "r": 402.31064, "b": 311.76279, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 407.54214, "t": 303.36981, "r": 414.10443, "b": 311.89532, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "C", "bbox": {"l": 407.54214, "t": 303.36981, "r": 414.10443, "b": 311.89532, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "text", "bbox": {"l": 407.56335, "t": 314.40619, "r": 414.12564, "b": 322.9317, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "C", "bbox": {"l": 407.56335, "t": 314.40619, "r": 414.12564, "b": 322.9317, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 418.51108, "t": 292.08502000000004, "r": 425.07336, "b": 300.61053000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "C", "bbox": {"l": 418.51108, "t": 292.08502000000004, "r": 425.07336, "b": 300.61053000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 429.59744, "t": 292.09106, "r": 436.1597300000001, "b": 300.61658, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "C", "bbox": {"l": 429.59744, "t": 292.09106, "r": 436.1597300000001, "b": 300.61658, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 440.68759000000006, "t": 292.01230000000004, "r": 447.24987999999996, "b": 300.53781000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "C", "bbox": {"l": 440.68759000000006, "t": 292.01230000000004, "r": 447.24987999999996, "b": 300.53781000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 418.6232, "t": 303.29483, "r": 425.18549, "b": 311.82034, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "C", "bbox": {"l": 418.6232, "t": 303.29483, "r": 425.18549, "b": 311.82034, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 429.7095299999999, "t": 303.30011, "r": 436.27182, "b": 311.82562, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "C", "bbox": {"l": 429.7095299999999, "t": 303.30011, "r": 436.27182, "b": 311.82562, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 440.7996800000001, "t": 303.22211, "r": 447.36197, "b": 311.74762, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "C", "bbox": {"l": 440.7996800000001, "t": 303.22211, "r": 447.36197, "b": 311.74762, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 418.62546, "t": 314.56903, "r": 425.18774, "b": 323.09454, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "C", "bbox": {"l": 418.62546, "t": 314.56903, "r": 425.18774, "b": 323.09454, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 429.71181999999993, "t": 314.57434, "r": 436.27411, "b": 323.09985, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "C", "bbox": {"l": 429.71181999999993, "t": 314.57434, "r": 436.27411, "b": 323.09985, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 440.80194, "t": 314.49631, "r": 447.36423, "b": 323.02182, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "C", "bbox": {"l": 440.80194, "t": 314.49631, "r": 447.36423, "b": 323.02182, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 407.39746, "t": 325.29031, "r": 413.95975, "b": 333.81583, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "C", "bbox": {"l": 407.39746, "t": 325.29031, "r": 413.95975, "b": 333.81583, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 418.45959, "t": 325.45316, "r": 425.02188, "b": 333.97867, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "C", "bbox": {"l": 418.45959, "t": 325.45316, "r": 425.02188, "b": 333.97867, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 429.54593, "t": 325.4592, "r": 436.10822, "b": 333.98471, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "C", "bbox": {"l": 429.54593, "t": 325.4592, "r": 436.10822, "b": 333.98471, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 440.63608, "t": 325.38043, "r": 447.19836, "b": 333.90594, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "C", "bbox": {"l": 440.63608, "t": 325.38043, "r": 447.19836, "b": 333.90594, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 451.89511000000005, "t": 280.15717, "r": 463.51273000000003, "b": 288.68268, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "NL", "bbox": {"l": 451.89511000000005, "t": 280.15717, "r": 463.51273000000003, "b": 288.68268, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 452.1557, "t": 291.59875000000005, "r": 463.77332, "b": 300.12427, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "NL", "bbox": {"l": 452.1557, "t": 291.59875000000005, "r": 463.77332, "b": 300.12427, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 452.17688000000004, "t": 302.84265, "r": 463.79449000000005, "b": 311.36816, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "NL", "bbox": {"l": 452.17688000000004, "t": 302.84265, "r": 463.79449000000005, "b": 311.36816, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 452.09887999999995, "t": 314.12441999999993, "r": 463.71648999999996, "b": 322.6499299999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "NL", "bbox": {"l": 452.09887999999995, "t": 314.12441999999993, "r": 463.71648999999996, "b": 322.6499299999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 452.29733, "t": 325.46906, "r": 463.91495, "b": 333.99457, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "NL", "bbox": {"l": 452.29733, "t": 325.46906, "r": 463.91495, "b": 333.99457, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 396.09677, "t": 314.49478, "r": 402.65906, "b": 323.02029000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "U", "bbox": {"l": 396.09677, "t": 314.49478, "r": 402.65906, "b": 323.02029000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 395.99829, "t": 325.38876000000005, "r": 402.56058, "b": 333.91428, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "U", "bbox": {"l": 395.99829, "t": 325.38876000000005, "r": 402.56058, "b": 333.91428, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 396.27475, "t": 292.27057, "r": 402.83704, "b": 300.79608, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "U", "bbox": {"l": 396.27475, "t": 292.27057, "r": 402.83704, "b": 300.79608, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 408.54724, "t": 280.96912, "r": 413.60074, "b": 289.49463, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "L", "bbox": {"l": 408.54724, "t": 280.96912, "r": 413.60074, "b": 289.49463, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 430.58966, "t": 280.49725, "r": 435.6431600000001, "b": 289.02277, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "L", "bbox": {"l": 430.58966, "t": 280.49725, "r": 435.6431600000001, "b": 289.02277, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 441.08069, "t": 280.38062, "r": 446.13419, "b": 288.90613, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "L", "bbox": {"l": 441.08069, "t": 280.38062, "r": 446.13419, "b": 288.90613, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 407.97388, "t": 292.13425, "r": 414.03625, "b": 300.65976, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "X", "bbox": {"l": 407.97388, "t": 292.13425, "r": 414.03625, "b": 300.65976, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 441.25640999999996, "t": 411.1807600000001, "r": 452.87402, "b": 419.7062700000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "NL", "bbox": {"l": 441.25640999999996, "t": 411.1807600000001, "r": 452.87402, "b": 419.7062700000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 393.75256, "t": 399.7947700000001, "r": 432.48929, "b": 406.89935, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "vocabulary:", "bbox": {"l": 393.75256, "t": 399.7947700000001, "r": 432.48929, "b": 406.89935, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 434.5896000000001, "t": 399.7947700000001, "r": 438.80083999999994, "b": 406.89935, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "5", "bbox": {"l": 434.5896000000001, "t": 399.7947700000001, "r": 438.80083999999994, "b": 406.89935, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 440.90573, "t": 399.7947700000001, "r": 463.22235, "b": 406.89935, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "tokens", "bbox": {"l": 440.90573, "t": 399.7947700000001, "r": 463.22235, "b": 406.89935, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 384.11816, "t": 258.54718, "r": 413.99307, "b": 265.65179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "D OTSL", "bbox": {"l": 384.11816, "t": 258.54718, "r": 413.99307, "b": 265.65179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 393.75256, "t": 266.67505000000006, "r": 451.45129000000003, "b": 273.77966000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "sequence length:", "bbox": {"l": 393.75256, "t": 266.67505000000006, "r": 451.45129000000003, "b": 273.77966000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 453.55083999999994, "t": 266.67505000000006, "r": 461.97485, "b": 273.77966000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "30", "bbox": {"l": 453.55083999999994, "t": 266.67505000000006, "r": 461.97485, "b": 273.77966000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 151.79318, "t": 399.76016, "r": 233.89371000000003, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "vocabulary for this table:", "bbox": {"l": 151.79318, "t": 399.76016, "r": 233.89371000000003, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 235.99332, "t": 399.76016, "r": 244.41734000000002, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "12", "bbox": {"l": 235.99332, "t": 399.76016, "r": 244.41734000000002, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 246.52222, "t": 399.76016, "r": 268.83884, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "tokens", "bbox": {"l": 246.52222, "t": 399.76016, "r": 268.83884, "b": 406.86474999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 154.3298, "t": 213.57457999999997, "r": 159.79837, "b": 220.67920000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "A", "bbox": {"l": 154.3298, "t": 213.57457999999997, "r": 159.79837, "b": 220.67920000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 321.07053, "t": 213.57457999999997, "r": 326.53909, "b": 220.67920000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "B", "bbox": {"l": 321.07053, "t": 213.57457999999997, "r": 326.53909, "b": 220.67920000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 153.0947, "t": 280.30411, "r": 175.83888, "b": 286.69824, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "<table>", "bbox": {"l": 153.0947, "t": 280.30411, "r": 175.83888, "b": 286.69824, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 160.67039, "t": 287.12088, "r": 172.79608, "b": 293.51501, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "<tr>", "bbox": {"l": 160.67039, "t": 287.12088, "r": 172.79608, "b": 293.51501, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 168.24603, "t": 293.93765, "r": 177.91019, "b": 300.33179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "<td", "bbox": {"l": 168.24603, "t": 293.93765, "r": 177.91019, "b": 300.33179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 179.80525, "t": 293.93765, "r": 215.61517, "b": 300.33179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "colspan=\u201c2\u201d", "bbox": {"l": 179.80525, "t": 293.93765, "r": 215.61517, "b": 300.33179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 217.50886999999997, "t": 293.93765, "r": 255.58945, "b": 300.33179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "rowspan=\u201c2\u201d", "bbox": {"l": 217.50886999999997, "t": 293.93765, "r": 255.58945, "b": 300.33179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 257.48315, "t": 293.93765, "r": 261.46414, "b": 300.33179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": ">", "bbox": {"l": 257.48315, "t": 293.93765, "r": 261.46414, "b": 300.33179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 263.35785, "t": 293.93765, "r": 278.89804, "b": 300.33179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "</td>", "bbox": {"l": 263.35785, "t": 293.93765, "r": 278.89804, "b": 300.33179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 280.79175, "t": 293.93765, "r": 290.4559, "b": 300.33179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "<td", "bbox": {"l": 280.79175, "t": 293.93765, "r": 290.4559, "b": 300.33179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 292.35095, "t": 293.93765, "r": 328.16083, "b": 300.33179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "colspan=\u201c3\u201d", "bbox": {"l": 292.35095, "t": 293.93765, "r": 328.16083, "b": 300.33179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 330.05457, "t": 293.93765, "r": 334.03555, "b": 300.33179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": ">", "bbox": {"l": 330.05457, "t": 293.93765, "r": 334.03555, "b": 300.33179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 335.92926, "t": 293.93765, "r": 351.46945, "b": 300.33179, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "</td>", "bbox": {"l": 335.92926, "t": 293.93765, "r": 351.46945, "b": 300.33179, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 160.67039, "t": 300.75442999999996, "r": 174.68979, "b": 307.14856, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "</tr>", "bbox": {"l": 160.67039, "t": 300.75442999999996, "r": 174.68979, "b": 307.14856, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 160.67039, "t": 307.57122999999996, "r": 172.79608, "b": 313.96536, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "<tr>", "bbox": {"l": 160.67039, "t": 307.57122999999996, "r": 172.79608, "b": 313.96536, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 168.24603, "t": 314.388, "r": 181.89255, "b": 320.78214, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "<td>", "bbox": {"l": 168.24603, "t": 314.388, "r": 181.89255, "b": 320.78214, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 183.78624, "t": 314.388, "r": 199.32646, "b": 320.78214, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "</td>", "bbox": {"l": 183.78624, "t": 314.388, "r": 199.32646, "b": 320.78214, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 201.22015, "t": 314.388, "r": 214.86666999999997, "b": 320.78214, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "<td>", "bbox": {"l": 201.22015, "t": 314.388, "r": 214.86666999999997, "b": 320.78214, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 216.76038, "t": 314.388, "r": 232.30058, "b": 320.78214, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "</td>", "bbox": {"l": 216.76038, "t": 314.388, "r": 232.30058, "b": 320.78214, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 234.19427000000002, "t": 314.388, "r": 247.84079000000003, "b": 320.78214, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "<td>", "bbox": {"l": 234.19427000000002, "t": 314.388, "r": 247.84079000000003, "b": 320.78214, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 249.73447999999996, "t": 314.388, "r": 265.27469, "b": 320.78214, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "</td>", "bbox": {"l": 249.73447999999996, "t": 314.388, "r": 265.27469, "b": 320.78214, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 160.67039, "t": 321.20477, "r": 174.68979, "b": 327.59890999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "</tr>", "bbox": {"l": 160.67039, "t": 321.20477, "r": 174.68979, "b": 327.59890999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 160.67039, "t": 328.02158, "r": 172.79608, "b": 334.41571000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "<tr>", "bbox": {"l": 160.67039, "t": 328.02158, "r": 172.79608, "b": 334.41571000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 168.24603, "t": 334.83835, "r": 373.09091, "b": 341.23248, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "<td rowspan=\u201c3\u201d > </td> <td> </td> <td> </td> <td> </td> <td> </td>", "bbox": {"l": 168.24603, "t": 334.83835, "r": 373.09091, "b": 341.23248, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 160.67039, "t": 341.65512, "r": 174.68979, "b": 348.04926, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "</tr>", "bbox": {"l": 160.67039, "t": 341.65512, "r": 174.68979, "b": 348.04926, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 160.67039, "t": 348.47159, "r": 172.79608, "b": 354.86572, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "<tr>", "bbox": {"l": 160.67039, "t": 348.47159, "r": 172.79608, "b": 354.86572, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 168.24603, "t": 355.28836000000007, "r": 181.89255, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "<td>", "bbox": {"l": 168.24603, "t": 355.28836000000007, "r": 181.89255, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 183.78624, "t": 355.28836000000007, "r": 199.32646, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "</td>", "bbox": {"l": 183.78624, "t": 355.28836000000007, "r": 199.32646, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 201.22015, "t": 355.28836000000007, "r": 214.86666999999997, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "<td>", "bbox": {"l": 201.22015, "t": 355.28836000000007, "r": 214.86666999999997, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 216.76038, "t": 355.28836000000007, "r": 232.30058, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "</td>", "bbox": {"l": 216.76038, "t": 355.28836000000007, "r": 232.30058, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 234.19427000000002, "t": 355.28836000000007, "r": 247.84079000000003, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "<td>", "bbox": {"l": 234.19427000000002, "t": 355.28836000000007, "r": 247.84079000000003, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 249.73447999999996, "t": 355.28836000000007, "r": 265.27469, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "</td>", "bbox": {"l": 249.73447999999996, "t": 355.28836000000007, "r": 265.27469, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 267.1684, "t": 355.28836000000007, "r": 280.81488, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "<td>", "bbox": {"l": 267.1684, "t": 355.28836000000007, "r": 280.81488, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 282.70862, "t": 355.28836000000007, "r": 298.24881, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "</td>", "bbox": {"l": 282.70862, "t": 355.28836000000007, "r": 298.24881, "b": 361.68249999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 160.67039, "t": 362.10516000000007, "r": 174.68979, "b": 368.49929999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "</tr>", "bbox": {"l": 160.67039, "t": 362.10516000000007, "r": 174.68979, "b": 368.49929999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 160.67039, "t": 368.92194, "r": 172.79608, "b": 375.31607, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "<tr>", "bbox": {"l": 160.67039, "t": 368.92194, "r": 172.79608, "b": 375.31607, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 168.24603, "t": 375.73871, "r": 181.89255, "b": 382.13284, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "<td>", "bbox": {"l": 168.24603, "t": 375.73871, "r": 181.89255, "b": 382.13284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 183.78624, "t": 375.73871, "r": 199.32646, "b": 382.13284, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "</td>", "bbox": {"l": 183.78624, "t": 375.73871, "r": 199.32646, "b": 382.13284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 201.22015, "t": 375.73871, "r": 214.86666999999997, "b": 382.13284, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "<td>", "bbox": {"l": 201.22015, "t": 375.73871, "r": 214.86666999999997, "b": 382.13284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 216.76038, "t": 375.73871, "r": 232.30058, "b": 382.13284, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "</td>", "bbox": {"l": 216.76038, "t": 375.73871, "r": 232.30058, "b": 382.13284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 234.19427000000002, "t": 375.73871, "r": 247.84079000000003, "b": 382.13284, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "<td>", "bbox": {"l": 234.19427000000002, "t": 375.73871, "r": 247.84079000000003, "b": 382.13284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 249.73447999999996, "t": 375.73871, "r": 265.27469, "b": 382.13284, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "</td>", "bbox": {"l": 249.73447999999996, "t": 375.73871, "r": 265.27469, "b": 382.13284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 267.1684, "t": 375.73871, "r": 280.81488, "b": 382.13284, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "<td>", "bbox": {"l": 267.1684, "t": 375.73871, "r": 280.81488, "b": 382.13284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 282.70862, "t": 375.73871, "r": 298.24881, "b": 382.13284, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "</td>", "bbox": {"l": 282.70862, "t": 375.73871, "r": 298.24881, "b": 382.13284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 160.67039, "t": 382.55551, "r": 174.68979, "b": 388.94965, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "</tr>", "bbox": {"l": 160.67039, "t": 382.55551, "r": 174.68979, "b": 388.94965, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 153.0947, "t": 389.37228, "r": 177.73259, "b": 395.76642, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "</table>", "bbox": {"l": 153.0947, "t": 389.37228, "r": 177.73259, "b": 395.76642, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 395.06137, "t": 411.33353, "r": 401.62366, "b": 419.85904, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "C", "bbox": {"l": 395.06137, "t": 411.33353, "r": 401.62366, "b": 419.85904, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 407.42249, "t": 411.33353, "r": 412.47598, "b": 419.85904, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "L", "bbox": {"l": 407.42249, "t": 411.33353, "r": 412.47598, "b": 419.85904, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 418.69287, "t": 411.33353, "r": 425.25516, "b": 419.85904, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "U", "bbox": {"l": 418.69287, "t": 411.33353, "r": 425.25516, "b": 419.85904, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 430.5086099999999, "t": 411.33353, "r": 436.5709800000001, "b": 419.85904, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "X", "bbox": {"l": 430.5086099999999, "t": 411.33353, "r": 436.5709800000001, "b": 419.85904, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 152.36208, "t": 409.77362, "r": 175.10626, "b": 416.16776, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "<table>", "bbox": {"l": 152.36208, "t": 409.77362, "r": 175.10626, "b": 416.16776, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 178.89366, "t": 409.77362, "r": 191.01935, "b": 416.16776, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": "<tr>", "bbox": {"l": 178.89366, "t": 409.77362, "r": 191.01935, "b": 416.16776, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 194.80676, "t": 409.77362, "r": 208.82614, "b": 416.16776, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "</tr>", "bbox": {"l": 194.80676, "t": 409.77362, "r": 208.82614, "b": 416.16776, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 212.61354, "t": 409.77362, "r": 226.26003999999998, "b": 416.16776, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "<td>", "bbox": {"l": 212.61354, "t": 409.77362, "r": 226.26003999999998, "b": 416.16776, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 230.04745000000003, "t": 409.77362, "r": 245.58765000000002, "b": 416.16776, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": "</td>", "bbox": {"l": 230.04745000000003, "t": 409.77362, "r": 245.58765000000002, "b": 416.16776, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 249.37506000000002, "t": 409.77362, "r": 259.03918, "b": 416.16776, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 107, "text": "<td", "bbox": {"l": 249.37506000000002, "t": 409.77362, "r": 259.03918, "b": 416.16776, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 262.82797, "t": 409.77362, "r": 298.93646, "b": 416.16776, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 108, "text": "colspan=\"2\"", "bbox": {"l": 262.82797, "t": 409.77362, "r": 298.93646, "b": 416.16776, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 302.72385, "t": 409.77362, "r": 338.83234, "b": 416.16776, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 109, "text": "colspan=\"3\"", "bbox": {"l": 302.72385, "t": 409.77362, "r": 338.83234, "b": 416.16776, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 152.36208, "t": 418.10522, "r": 190.74123, "b": 424.49936, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 110, "text": "rowspan=\"2\"", "bbox": {"l": 152.36208, "t": 418.10522, "r": 190.74123, "b": 424.49936, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 194.52863, "t": 418.10522, "r": 232.90777999999997, "b": 424.49936, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 111, "text": "rowspan=\"3\"", "bbox": {"l": 194.52863, "t": 418.10522, "r": 232.90777999999997, "b": 424.49936, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 236.69518999999997, "t": 418.10522, "r": 240.67617999999996, "b": 424.49936, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 112, "text": ">", "bbox": {"l": 236.69518999999997, "t": 418.10522, "r": 240.67617999999996, "b": 424.49936, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 244.46358, "t": 418.10522, "r": 269.10144, "b": 424.49936, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 113, "text": "</table>", "bbox": {"l": 244.46358, "t": 418.10522, "r": 269.10144, "b": 424.49936, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 154.50595, "t": 258.60095, "r": 159.62473, "b": 265.70556999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 114, "text": "C", "bbox": {"l": 154.50595, "t": 258.60095, "r": 159.62473, "b": 265.70556999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 164.74348, "t": 258.60095, "r": 185.21857, "b": 265.70556999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 115, "text": "HTML", "bbox": {"l": 164.74348, "t": 258.60095, "r": 185.21857, "b": 265.70556999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 164.3548, "t": 266.49707, "r": 222.05352999999997, "b": 273.60168, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 116, "text": "sequence length:", "bbox": {"l": 164.3548, "t": 266.49707, "r": 222.05352999999997, "b": 273.60168, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 224.15326, "t": 266.49707, "r": 232.57729, "b": 273.60168, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 117, "text": "55", "bbox": {"l": 224.15326, "t": 266.49707, "r": 232.57729, "b": 273.60168, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "text", "id": 2, "page_no": 1, "cluster": {"id": 2, "label": "text", "bbox": {"l": 134.765, "t": 452.31378, "r": 480.59232000000003, "b": 520.88669, "coord_origin": "TOPLEFT"}, "confidence": 0.950499951839447, "cells": [{"id": 118, "text": "today,", "bbox": {"l": 134.765, "t": 452.31378, "r": 161.32928, "b": 461.11075, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "table detection", "bbox": {"l": 164.269, "t": 452.31378, "r": 226.28617999999997, "b": 461.11075, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "in documents is a well understood problem, and the latest", "bbox": {"l": 229.992, "t": 452.31378, "r": 480.59232000000003, "b": 461.11075, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "state-of-the-art (SOTA) object detection methods provide an accuracy compa-", "bbox": {"l": 134.76501, "t": 464.26877, "r": 480.59180000000003, "b": 473.06573, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "rable to human observers [7,8,10,14,23]. On the other hand, the problem of table", "bbox": {"l": 134.76501, "t": 476.22375, "r": 480.58673, "b": 485.02072, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "structure recognition (TSR) is a lot more challenging and remains a very active", "bbox": {"l": 134.76501, "t": 488.17975, "r": 480.58658, "b": 496.97672, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "area of research, in which many novel machine learning algorithms are being", "bbox": {"l": 134.76501, "t": 500.13474, "r": 480.58978, "b": 508.9317, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "explored [3,4,5,9,11,12,13,14,17,18,21,22].", "bbox": {"l": 134.76501, "t": 512.0897199999999, "r": 313.24597, "b": 520.88669, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "today, table detection in documents is a well understood problem, and the latest state-of-the-art (SOTA) object detection methods provide an accuracy comparable to human observers [7,8,10,14,23]. On the other hand, the problem of table structure recognition (TSR) is a lot more challenging and remains a very active area of research, in which many novel machine learning algorithms are being explored [3,4,5,9,11,12,13,14,17,18,21,22]."}, {"label": "text", "id": 0, "page_no": 1, "cluster": {"id": 0, "label": "text", "bbox": {"l": 134.76501, "t": 524.55072, "r": 480.59482, "b": 664.8547, "coord_origin": "TOPLEFT"}, "confidence": 0.9845512509346008, "cells": [{"id": 126, "text": "Recently emerging SOTA methods for table structure recognition employ", "bbox": {"l": 149.70901, "t": 524.55072, "r": 480.58884000000006, "b": 533.3476900000001, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "transformer-based models, in which an image of the table is provided to the net-", "bbox": {"l": 134.76501, "t": 536.50671, "r": 480.5917400000001, "b": 545.30368, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "work in order to predict the structure of the table as a sequence of tokens. These", "bbox": {"l": 134.76501, "t": 548.46172, "r": 480.58868, "b": 557.25868, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "image-to-sequence (Im2Seq) models are extremely powerful, since they allow for", "bbox": {"l": 134.76501, "t": 560.41672, "r": 480.58795, "b": 569.2136800000001, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "a purely data-driven solution. The tokens of the sequence typically belong to a", "bbox": {"l": 134.76501, "t": 572.37172, "r": 480.58978, "b": 581.16869, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "markup language such as HTML, Latex or Markdown, which allow to describe", "bbox": {"l": 134.76501, "t": 584.32672, "r": 480.59479, "b": 593.12369, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "table structure as rows, columns and spanning cells in various configurations.", "bbox": {"l": 134.76501, "t": 596.28271, "r": 480.58678999999995, "b": 605.0796799999999, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "In Figure 1, we illustrate how HTML is used to represent the table-structure", "bbox": {"l": 134.76501, "t": 608.23772, "r": 480.59476, "b": 617.03468, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "of a particular example table. Public table-structure data sets such as PubTab-", "bbox": {"l": 134.76501, "t": 620.19272, "r": 480.5938100000001, "b": 628.98969, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "Net [22], and FinTabNet [21], which were created in a semi-automated way from", "bbox": {"l": 134.76501, "t": 632.1477199999999, "r": 480.59482, "b": 640.94469, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "paired PDF and HTML sources (e.g. PubMed Central), popularized primarily", "bbox": {"l": 134.76501, "t": 644.10272, "r": 480.58771, "b": 652.89969, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "the use of HTML as ground-truth representation format for TSR.", "bbox": {"l": 134.76501, "t": 656.05772, "r": 421.45377, "b": 664.8547, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Recently emerging SOTA methods for table structure recognition employ transformer-based models, in which an image of the table is provided to the network in order to predict the structure of the table as a sequence of tokens. These image-to-sequence (Im2Seq) models are extremely powerful, since they allow for a purely data-driven solution. The tokens of the sequence typically belong to a markup language such as HTML, Latex or Markdown, which allow to describe table structure as rows, columns and spanning cells in various configurations. In Figure 1, we illustrate how HTML is used to represent the table-structure of a particular example table. Public table-structure data sets such as PubTabNet [22], and FinTabNet [21], which were created in a semi-automated way from paired PDF and HTML sources (e.g. PubMed Central), popularized primarily the use of HTML as ground-truth representation format for TSR."}], "headers": [{"label": "page_header", "id": 5, "page_no": 1, "cluster": {"id": 5, "label": "page_header", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8580349683761597, "cells": [{"id": 0, "text": "2", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2"}, {"label": "page_header", "id": 3, "page_no": 1, "cluster": {"id": 3, "label": "page_header", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9076642990112305, "cells": [{"id": 1, "text": "M.", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 178.07675, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37415, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "M. Lysak, et al."}]}}, {"page_no": 2, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "3", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "While the majority of research in TSR is currently focused on the develop-", "bbox": {"l": 149.709, "t": 118.93377999999996, "r": 480.59183, "b": 127.73077, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "ment and application of novel neural model architectures, the table structure", "bbox": {"l": 134.765, "t": 130.88878999999997, "r": 480.58675999999997, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "representation language (e.g. HTML in PubTabNet and FinTabNet) is usually", "bbox": {"l": 134.765, "t": 142.84479, "r": 480.5917400000001, "b": 151.64178000000004, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "adopted", "bbox": {"l": 134.765, "t": 154.7998, "r": 169.62514, "b": 163.59680000000003, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "as is", "bbox": {"l": 173.86099, "t": 154.7998, "r": 194.55531, "b": 163.59680000000003, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "for the sequence tokenization in Im2Seq models. In this paper,", "bbox": {"l": 199.60999, "t": 154.7998, "r": 480.58618, "b": 163.59680000000003, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "we aim for the opposite and investigate the impact of the table structure rep-", "bbox": {"l": 134.76498, "t": 166.75482, "r": 480.59167, "b": 175.55182000000002, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "resentation language with an otherwise unmodified Im2Seq transformer-based", "bbox": {"l": 134.76498, "t": 178.70983999999999, "r": 480.58968999999996, "b": 187.50684, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "architecture. Since the current state-of-the-art Im2Seq model is TableFormer [9],", "bbox": {"l": 134.76498, "t": 190.66485999999998, "r": 480.5917400000001, "b": 199.46185000000003, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "we select this model to perform our experiments.", "bbox": {"l": 134.76498, "t": 202.61987, "r": 348.35519, "b": 211.41687000000002, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "The main contribution of this paper is the introduction of a new optimised ta-", "bbox": {"l": 149.70898, "t": 214.83587999999997, "r": 480.5939, "b": 223.63287000000003, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "ble structure language (OTSL), specifically designed to describe table-structure", "bbox": {"l": 134.76498, "t": 226.79089, "r": 480.5938100000001, "b": 235.58789000000002, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "in an compact and structured way for Im2Seq models. OTSL has a number of", "bbox": {"l": 134.76498, "t": 238.74689, "r": 480.58667, "b": 247.54387999999994, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "key features, which make it very attractive to use in Im2Seq models. Specifically,", "bbox": {"l": 134.76498, "t": 250.70190000000002, "r": 480.5867, "b": 259.49890000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "compared to other languages such as HTML, OTSL has a minimized vocabulary", "bbox": {"l": 134.76498, "t": 262.65692, "r": 480.58771, "b": 271.45392000000004, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "which yields short sequence length, strong inherent structure (e.g. strict rectan-", "bbox": {"l": 134.76498, "t": 274.61194, "r": 480.59572999999995, "b": 283.40891, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "gular layout) and a strict syntax with rules that only look backwards. The latter", "bbox": {"l": 134.76498, "t": 286.56692999999996, "r": 480.59274, "b": 295.36389, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "allows for syntax validation during inference and ensures a syntactically correct", "bbox": {"l": 134.76498, "t": 298.52190999999993, "r": 480.59473, "b": 307.31888, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "table-structure. These OTSL features are illustrated in Figure 1, in comparison", "bbox": {"l": 134.76498, "t": 310.47791, "r": 480.58667, "b": 319.27487, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "to HTML.", "bbox": {"l": 134.76498, "t": 322.43289, "r": 179.72021, "b": 331.22986, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "The paper is structured as follows. In section 2, we give an overview of the", "bbox": {"l": 149.70898, "t": 334.64789, "r": 480.5878000000001, "b": 343.44485000000003, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "latest developments in table-structure reconstruction. In section 3 we review", "bbox": {"l": 134.76498, "t": 346.60388000000006, "r": 480.59375, "b": 355.40085, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "the current HTML table encoding (popularised by PubTabNet and FinTabNet)", "bbox": {"l": 134.76498, "t": 358.55887, "r": 480.58673, "b": 367.3558300000001, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "and discuss its flaws. Subsequently, we introduce OTSL in section 4, which in-", "bbox": {"l": 134.76498, "t": 370.51385, "r": 480.59161, "b": 379.31082, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "cludes the language definition, syntax rules and error-correction procedures. In", "bbox": {"l": 134.76498, "t": 382.46883999999994, "r": 480.59177000000005, "b": 391.26581, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "section 5, we apply OTSL on the TableFormer architecture, compare it to Table-", "bbox": {"l": 134.76498, "t": 394.42383, "r": 480.58774, "b": 403.2207900000001, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Former models trained on HTML and ultimately demonstrate the advantages", "bbox": {"l": 134.76498, "t": 406.37982, "r": 480.59469999999993, "b": 415.17679, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "of using OTSL. Finally, in section 6 we conclude our work and outline next", "bbox": {"l": 134.76498, "t": 418.33481, "r": 480.59567, "b": 427.13177, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "potential steps.", "bbox": {"l": 134.76498, "t": 430.28979, "r": 201.27232, "b": 439.08676, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "2", "bbox": {"l": 134.76498, "t": 462.08795, "r": 141.48859, "b": 472.65634, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Related Work", "bbox": {"l": 154.93819, "t": 462.08795, "r": 236.76912999999996, "b": 472.65634, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "Approaches to formalize the logical structure and layout of tables in electronic", "bbox": {"l": 134.76498, "t": 488.68582, "r": 480.59067, "b": 497.48279, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "documents date back more than two decades [16]. In the recent past, a wide", "bbox": {"l": 134.76498, "t": 500.64081, "r": 480.5917400000001, "b": 509.43777, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "variety of computer vision methods have been explored to tackle the prob-", "bbox": {"l": 134.76498, "t": 512.5957900000001, "r": 480.58971999999994, "b": 521.39276, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "lem of table structure recognition, i.e. the correct identification of columns,", "bbox": {"l": 134.76498, "t": 524.55179, "r": 480.58966, "b": 533.34875, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "rows and spanning cells in a given table. Broadly speaking, the current deep-", "bbox": {"l": 134.76498, "t": 536.50679, "r": 480.5897499999999, "b": 545.30376, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "learning based approaches fall into three categories: object detection (OD) meth-", "bbox": {"l": 134.76498, "t": 548.4617900000001, "r": 480.58862000000005, "b": 557.2587599999999, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "ods, Graph-Neural-Network (GNN) methods and Image-to-Markup-Sequence", "bbox": {"l": 134.76498, "t": 560.41679, "r": 480.59072999999995, "b": 569.21376, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "(Im2Seq) methods. Object-detection based methods [11,12,13,14,21] rely on table-", "bbox": {"l": 134.76498, "t": 572.3718, "r": 484.12047999999993, "b": 581.16876, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "structure annotation using (overlapping) bounding boxes for training, and pro-", "bbox": {"l": 134.76498, "t": 584.3267999999999, "r": 480.59567, "b": 593.12376, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "duce bounding-box predictions to define table cells, rows, and columns on a table", "bbox": {"l": 134.76498, "t": 596.28279, "r": 480.58871, "b": 605.07976, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "image. Graph Neural Network (GNN) based methods [3,6,17,18], as the name", "bbox": {"l": 134.76498, "t": 608.23779, "r": 480.59075999999993, "b": 617.03476, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "suggests, represent tables as graph structures. The graph nodes represent the", "bbox": {"l": 134.76498, "t": 620.1927900000001, "r": 480.58574999999996, "b": 628.9897599999999, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "content of each table cell, an embedding vector from the table image, or geomet-", "bbox": {"l": 134.76498, "t": 632.1478, "r": 480.58875, "b": 640.94476, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "ric coordinates of the table cell. The edges of the graph define the relationship", "bbox": {"l": 134.76498, "t": 644.1028, "r": 480.58875, "b": 652.89977, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "between the nodes, e.g. if they belong to the same column, row, or table cell.", "bbox": {"l": 134.76498, "t": 656.05879, "r": 480.59069999999997, "b": 664.85577, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 5, "label": "page_header", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9325801730155945, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "page_header", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8773486614227295, "cells": [{"id": 1, "text": "3", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 134.76498, "t": 118.93377999999996, "r": 480.59183, "b": 211.41687000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9871802926063538, "cells": [{"id": 2, "text": "While the majority of research in TSR is currently focused on the develop-", "bbox": {"l": 149.709, "t": 118.93377999999996, "r": 480.59183, "b": 127.73077, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "ment and application of novel neural model architectures, the table structure", "bbox": {"l": 134.765, "t": 130.88878999999997, "r": 480.58675999999997, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "representation language (e.g. HTML in PubTabNet and FinTabNet) is usually", "bbox": {"l": 134.765, "t": 142.84479, "r": 480.5917400000001, "b": 151.64178000000004, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "adopted", "bbox": {"l": 134.765, "t": 154.7998, "r": 169.62514, "b": 163.59680000000003, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "as is", "bbox": {"l": 173.86099, "t": 154.7998, "r": 194.55531, "b": 163.59680000000003, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "for the sequence tokenization in Im2Seq models. In this paper,", "bbox": {"l": 199.60999, "t": 154.7998, "r": 480.58618, "b": 163.59680000000003, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "we aim for the opposite and investigate the impact of the table structure rep-", "bbox": {"l": 134.76498, "t": 166.75482, "r": 480.59167, "b": 175.55182000000002, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "resentation language with an otherwise unmodified Im2Seq transformer-based", "bbox": {"l": 134.76498, "t": 178.70983999999999, "r": 480.58968999999996, "b": 187.50684, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "architecture. Since the current state-of-the-art Im2Seq model is TableFormer [9],", "bbox": {"l": 134.76498, "t": 190.66485999999998, "r": 480.5917400000001, "b": 199.46185000000003, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "we select this model to perform our experiments.", "bbox": {"l": 134.76498, "t": 202.61987, "r": 348.35519, "b": 211.41687000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 134.76498, "t": 214.83587999999997, "r": 480.59572999999995, "b": 331.22986, "coord_origin": "TOPLEFT"}, "confidence": 0.9871861338615417, "cells": [{"id": 12, "text": "The main contribution of this paper is the introduction of a new optimised ta-", "bbox": {"l": 149.70898, "t": 214.83587999999997, "r": 480.5939, "b": 223.63287000000003, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "ble structure language (OTSL), specifically designed to describe table-structure", "bbox": {"l": 134.76498, "t": 226.79089, "r": 480.5938100000001, "b": 235.58789000000002, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "in an compact and structured way for Im2Seq models. OTSL has a number of", "bbox": {"l": 134.76498, "t": 238.74689, "r": 480.58667, "b": 247.54387999999994, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "key features, which make it very attractive to use in Im2Seq models. Specifically,", "bbox": {"l": 134.76498, "t": 250.70190000000002, "r": 480.5867, "b": 259.49890000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "compared to other languages such as HTML, OTSL has a minimized vocabulary", "bbox": {"l": 134.76498, "t": 262.65692, "r": 480.58771, "b": 271.45392000000004, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "which yields short sequence length, strong inherent structure (e.g. strict rectan-", "bbox": {"l": 134.76498, "t": 274.61194, "r": 480.59572999999995, "b": 283.40891, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "gular layout) and a strict syntax with rules that only look backwards. The latter", "bbox": {"l": 134.76498, "t": 286.56692999999996, "r": 480.59274, "b": 295.36389, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "allows for syntax validation during inference and ensures a syntactically correct", "bbox": {"l": 134.76498, "t": 298.52190999999993, "r": 480.59473, "b": 307.31888, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "table-structure. These OTSL features are illustrated in Figure 1, in comparison", "bbox": {"l": 134.76498, "t": 310.47791, "r": 480.58667, "b": 319.27487, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "to HTML.", "bbox": {"l": 134.76498, "t": 322.43289, "r": 179.72021, "b": 331.22986, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 134.76498, "t": 334.64789, "r": 480.59567, "b": 439.08676, "coord_origin": "TOPLEFT"}, "confidence": 0.988121747970581, "cells": [{"id": 22, "text": "The paper is structured as follows. In section 2, we give an overview of the", "bbox": {"l": 149.70898, "t": 334.64789, "r": 480.5878000000001, "b": 343.44485000000003, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "latest developments in table-structure reconstruction. In section 3 we review", "bbox": {"l": 134.76498, "t": 346.60388000000006, "r": 480.59375, "b": 355.40085, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "the current HTML table encoding (popularised by PubTabNet and FinTabNet)", "bbox": {"l": 134.76498, "t": 358.55887, "r": 480.58673, "b": 367.3558300000001, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "and discuss its flaws. Subsequently, we introduce OTSL in section 4, which in-", "bbox": {"l": 134.76498, "t": 370.51385, "r": 480.59161, "b": 379.31082, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "cludes the language definition, syntax rules and error-correction procedures. In", "bbox": {"l": 134.76498, "t": 382.46883999999994, "r": 480.59177000000005, "b": 391.26581, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "section 5, we apply OTSL on the TableFormer architecture, compare it to Table-", "bbox": {"l": 134.76498, "t": 394.42383, "r": 480.58774, "b": 403.2207900000001, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Former models trained on HTML and ultimately demonstrate the advantages", "bbox": {"l": 134.76498, "t": 406.37982, "r": 480.59469999999993, "b": 415.17679, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "of using OTSL. Finally, in section 6 we conclude our work and outline next", "bbox": {"l": 134.76498, "t": 418.33481, "r": 480.59567, "b": 427.13177, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "potential steps.", "bbox": {"l": 134.76498, "t": 430.28979, "r": 201.27232, "b": 439.08676, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "section_header", "bbox": {"l": 134.76498, "t": 462.08795, "r": 236.76912999999996, "b": 472.65634, "coord_origin": "TOPLEFT"}, "confidence": 0.9439423680305481, "cells": [{"id": 31, "text": "2", "bbox": {"l": 134.76498, "t": 462.08795, "r": 141.48859, "b": 472.65634, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Related Work", "bbox": {"l": 154.93819, "t": 462.08795, "r": 236.76912999999996, "b": 472.65634, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 134.76498, "t": 488.68582, "r": 484.12047999999993, "b": 664.85577, "coord_origin": "TOPLEFT"}, "confidence": 0.9870182871818542, "cells": [{"id": 33, "text": "Approaches to formalize the logical structure and layout of tables in electronic", "bbox": {"l": 134.76498, "t": 488.68582, "r": 480.59067, "b": 497.48279, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "documents date back more than two decades [16]. In the recent past, a wide", "bbox": {"l": 134.76498, "t": 500.64081, "r": 480.5917400000001, "b": 509.43777, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "variety of computer vision methods have been explored to tackle the prob-", "bbox": {"l": 134.76498, "t": 512.5957900000001, "r": 480.58971999999994, "b": 521.39276, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "lem of table structure recognition, i.e. the correct identification of columns,", "bbox": {"l": 134.76498, "t": 524.55179, "r": 480.58966, "b": 533.34875, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "rows and spanning cells in a given table. Broadly speaking, the current deep-", "bbox": {"l": 134.76498, "t": 536.50679, "r": 480.5897499999999, "b": 545.30376, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "learning based approaches fall into three categories: object detection (OD) meth-", "bbox": {"l": 134.76498, "t": 548.4617900000001, "r": 480.58862000000005, "b": 557.2587599999999, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "ods, Graph-Neural-Network (GNN) methods and Image-to-Markup-Sequence", "bbox": {"l": 134.76498, "t": 560.41679, "r": 480.59072999999995, "b": 569.21376, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "(Im2Seq) methods. Object-detection based methods [11,12,13,14,21] rely on table-", "bbox": {"l": 134.76498, "t": 572.3718, "r": 484.12047999999993, "b": 581.16876, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "structure annotation using (overlapping) bounding boxes for training, and pro-", "bbox": {"l": 134.76498, "t": 584.3267999999999, "r": 480.59567, "b": 593.12376, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "duce bounding-box predictions to define table cells, rows, and columns on a table", "bbox": {"l": 134.76498, "t": 596.28279, "r": 480.58871, "b": 605.07976, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "image. Graph Neural Network (GNN) based methods [3,6,17,18], as the name", "bbox": {"l": 134.76498, "t": 608.23779, "r": 480.59075999999993, "b": 617.03476, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "suggests, represent tables as graph structures. The graph nodes represent the", "bbox": {"l": 134.76498, "t": 620.1927900000001, "r": 480.58574999999996, "b": 628.9897599999999, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "content of each table cell, an embedding vector from the table image, or geomet-", "bbox": {"l": 134.76498, "t": 632.1478, "r": 480.58875, "b": 640.94476, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "ric coordinates of the table cell. The edges of the graph define the relationship", "bbox": {"l": 134.76498, "t": 644.1028, "r": 480.58875, "b": 652.89977, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "between the nodes, e.g. if they belong to the same column, row, or table cell.", "bbox": {"l": 134.76498, "t": 656.05879, "r": 480.59069999999997, "b": 664.85577, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_header", "id": 5, "page_no": 2, "cluster": {"id": 5, "label": "page_header", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9325801730155945, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Optimized Table Tokenization for Table Structure Recognition"}, {"label": "page_header", "id": 6, "page_no": 2, "cluster": {"id": 6, "label": "page_header", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8773486614227295, "cells": [{"id": 1, "text": "3", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3"}, {"label": "text", "id": 2, "page_no": 2, "cluster": {"id": 2, "label": "text", "bbox": {"l": 134.76498, "t": 118.93377999999996, "r": 480.59183, "b": 211.41687000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9871802926063538, "cells": [{"id": 2, "text": "While the majority of research in TSR is currently focused on the develop-", "bbox": {"l": 149.709, "t": 118.93377999999996, "r": 480.59183, "b": 127.73077, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "ment and application of novel neural model architectures, the table structure", "bbox": {"l": 134.765, "t": 130.88878999999997, "r": 480.58675999999997, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "representation language (e.g. HTML in PubTabNet and FinTabNet) is usually", "bbox": {"l": 134.765, "t": 142.84479, "r": 480.5917400000001, "b": 151.64178000000004, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "adopted", "bbox": {"l": 134.765, "t": 154.7998, "r": 169.62514, "b": 163.59680000000003, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "as is", "bbox": {"l": 173.86099, "t": 154.7998, "r": 194.55531, "b": 163.59680000000003, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "for the sequence tokenization in Im2Seq models. In this paper,", "bbox": {"l": 199.60999, "t": 154.7998, "r": 480.58618, "b": 163.59680000000003, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "we aim for the opposite and investigate the impact of the table structure rep-", "bbox": {"l": 134.76498, "t": 166.75482, "r": 480.59167, "b": 175.55182000000002, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "resentation language with an otherwise unmodified Im2Seq transformer-based", "bbox": {"l": 134.76498, "t": 178.70983999999999, "r": 480.58968999999996, "b": 187.50684, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "architecture. Since the current state-of-the-art Im2Seq model is TableFormer [9],", "bbox": {"l": 134.76498, "t": 190.66485999999998, "r": 480.5917400000001, "b": 199.46185000000003, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "we select this model to perform our experiments.", "bbox": {"l": 134.76498, "t": 202.61987, "r": 348.35519, "b": 211.41687000000002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "While the majority of research in TSR is currently focused on the development and application of novel neural model architectures, the table structure representation language (e.g. HTML in PubTabNet and FinTabNet) is usually adopted as is for the sequence tokenization in Im2Seq models. In this paper, we aim for the opposite and investigate the impact of the table structure representation language with an otherwise unmodified Im2Seq transformer-based architecture. Since the current state-of-the-art Im2Seq model is TableFormer [9], we select this model to perform our experiments."}, {"label": "text", "id": 1, "page_no": 2, "cluster": {"id": 1, "label": "text", "bbox": {"l": 134.76498, "t": 214.83587999999997, "r": 480.59572999999995, "b": 331.22986, "coord_origin": "TOPLEFT"}, "confidence": 0.9871861338615417, "cells": [{"id": 12, "text": "The main contribution of this paper is the introduction of a new optimised ta-", "bbox": {"l": 149.70898, "t": 214.83587999999997, "r": 480.5939, "b": 223.63287000000003, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "ble structure language (OTSL), specifically designed to describe table-structure", "bbox": {"l": 134.76498, "t": 226.79089, "r": 480.5938100000001, "b": 235.58789000000002, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "in an compact and structured way for Im2Seq models. OTSL has a number of", "bbox": {"l": 134.76498, "t": 238.74689, "r": 480.58667, "b": 247.54387999999994, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "key features, which make it very attractive to use in Im2Seq models. Specifically,", "bbox": {"l": 134.76498, "t": 250.70190000000002, "r": 480.5867, "b": 259.49890000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "compared to other languages such as HTML, OTSL has a minimized vocabulary", "bbox": {"l": 134.76498, "t": 262.65692, "r": 480.58771, "b": 271.45392000000004, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "which yields short sequence length, strong inherent structure (e.g. strict rectan-", "bbox": {"l": 134.76498, "t": 274.61194, "r": 480.59572999999995, "b": 283.40891, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "gular layout) and a strict syntax with rules that only look backwards. The latter", "bbox": {"l": 134.76498, "t": 286.56692999999996, "r": 480.59274, "b": 295.36389, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "allows for syntax validation during inference and ensures a syntactically correct", "bbox": {"l": 134.76498, "t": 298.52190999999993, "r": 480.59473, "b": 307.31888, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "table-structure. These OTSL features are illustrated in Figure 1, in comparison", "bbox": {"l": 134.76498, "t": 310.47791, "r": 480.58667, "b": 319.27487, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "to HTML.", "bbox": {"l": 134.76498, "t": 322.43289, "r": 179.72021, "b": 331.22986, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The main contribution of this paper is the introduction of a new optimised table structure language (OTSL), specifically designed to describe table-structure in an compact and structured way for Im2Seq models. OTSL has a number of key features, which make it very attractive to use in Im2Seq models. Specifically, compared to other languages such as HTML, OTSL has a minimized vocabulary which yields short sequence length, strong inherent structure (e.g. strict rectangular layout) and a strict syntax with rules that only look backwards. The latter allows for syntax validation during inference and ensures a syntactically correct table-structure. These OTSL features are illustrated in Figure 1, in comparison to HTML."}, {"label": "text", "id": 0, "page_no": 2, "cluster": {"id": 0, "label": "text", "bbox": {"l": 134.76498, "t": 334.64789, "r": 480.59567, "b": 439.08676, "coord_origin": "TOPLEFT"}, "confidence": 0.988121747970581, "cells": [{"id": 22, "text": "The paper is structured as follows. In section 2, we give an overview of the", "bbox": {"l": 149.70898, "t": 334.64789, "r": 480.5878000000001, "b": 343.44485000000003, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "latest developments in table-structure reconstruction. In section 3 we review", "bbox": {"l": 134.76498, "t": 346.60388000000006, "r": 480.59375, "b": 355.40085, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "the current HTML table encoding (popularised by PubTabNet and FinTabNet)", "bbox": {"l": 134.76498, "t": 358.55887, "r": 480.58673, "b": 367.3558300000001, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "and discuss its flaws. Subsequently, we introduce OTSL in section 4, which in-", "bbox": {"l": 134.76498, "t": 370.51385, "r": 480.59161, "b": 379.31082, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "cludes the language definition, syntax rules and error-correction procedures. In", "bbox": {"l": 134.76498, "t": 382.46883999999994, "r": 480.59177000000005, "b": 391.26581, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "section 5, we apply OTSL on the TableFormer architecture, compare it to Table-", "bbox": {"l": 134.76498, "t": 394.42383, "r": 480.58774, "b": 403.2207900000001, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Former models trained on HTML and ultimately demonstrate the advantages", "bbox": {"l": 134.76498, "t": 406.37982, "r": 480.59469999999993, "b": 415.17679, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "of using OTSL. Finally, in section 6 we conclude our work and outline next", "bbox": {"l": 134.76498, "t": 418.33481, "r": 480.59567, "b": 427.13177, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "potential steps.", "bbox": {"l": 134.76498, "t": 430.28979, "r": 201.27232, "b": 439.08676, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The paper is structured as follows. In section 2, we give an overview of the latest developments in table-structure reconstruction. In section 3 we review the current HTML table encoding (popularised by PubTabNet and FinTabNet) and discuss its flaws. Subsequently, we introduce OTSL in section 4, which includes the language definition, syntax rules and error-correction procedures. In section 5, we apply OTSL on the TableFormer architecture, compare it to TableFormer models trained on HTML and ultimately demonstrate the advantages of using OTSL. Finally, in section 6 we conclude our work and outline next potential steps."}, {"label": "section_header", "id": 4, "page_no": 2, "cluster": {"id": 4, "label": "section_header", "bbox": {"l": 134.76498, "t": 462.08795, "r": 236.76912999999996, "b": 472.65634, "coord_origin": "TOPLEFT"}, "confidence": 0.9439423680305481, "cells": [{"id": 31, "text": "2", "bbox": {"l": 134.76498, "t": 462.08795, "r": 141.48859, "b": 472.65634, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Related Work", "bbox": {"l": 154.93819, "t": 462.08795, "r": 236.76912999999996, "b": 472.65634, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2 Related Work"}, {"label": "text", "id": 3, "page_no": 2, "cluster": {"id": 3, "label": "text", "bbox": {"l": 134.76498, "t": 488.68582, "r": 484.12047999999993, "b": 664.85577, "coord_origin": "TOPLEFT"}, "confidence": 0.9870182871818542, "cells": [{"id": 33, "text": "Approaches to formalize the logical structure and layout of tables in electronic", "bbox": {"l": 134.76498, "t": 488.68582, "r": 480.59067, "b": 497.48279, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "documents date back more than two decades [16]. In the recent past, a wide", "bbox": {"l": 134.76498, "t": 500.64081, "r": 480.5917400000001, "b": 509.43777, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "variety of computer vision methods have been explored to tackle the prob-", "bbox": {"l": 134.76498, "t": 512.5957900000001, "r": 480.58971999999994, "b": 521.39276, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "lem of table structure recognition, i.e. the correct identification of columns,", "bbox": {"l": 134.76498, "t": 524.55179, "r": 480.58966, "b": 533.34875, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "rows and spanning cells in a given table. Broadly speaking, the current deep-", "bbox": {"l": 134.76498, "t": 536.50679, "r": 480.5897499999999, "b": 545.30376, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "learning based approaches fall into three categories: object detection (OD) meth-", "bbox": {"l": 134.76498, "t": 548.4617900000001, "r": 480.58862000000005, "b": 557.2587599999999, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "ods, Graph-Neural-Network (GNN) methods and Image-to-Markup-Sequence", "bbox": {"l": 134.76498, "t": 560.41679, "r": 480.59072999999995, "b": 569.21376, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "(Im2Seq) methods. Object-detection based methods [11,12,13,14,21] rely on table-", "bbox": {"l": 134.76498, "t": 572.3718, "r": 484.12047999999993, "b": 581.16876, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "structure annotation using (overlapping) bounding boxes for training, and pro-", "bbox": {"l": 134.76498, "t": 584.3267999999999, "r": 480.59567, "b": 593.12376, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "duce bounding-box predictions to define table cells, rows, and columns on a table", "bbox": {"l": 134.76498, "t": 596.28279, "r": 480.58871, "b": 605.07976, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "image. Graph Neural Network (GNN) based methods [3,6,17,18], as the name", "bbox": {"l": 134.76498, "t": 608.23779, "r": 480.59075999999993, "b": 617.03476, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "suggests, represent tables as graph structures. The graph nodes represent the", "bbox": {"l": 134.76498, "t": 620.1927900000001, "r": 480.58574999999996, "b": 628.9897599999999, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "content of each table cell, an embedding vector from the table image, or geomet-", "bbox": {"l": 134.76498, "t": 632.1478, "r": 480.58875, "b": 640.94476, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "ric coordinates of the table cell. The edges of the graph define the relationship", "bbox": {"l": 134.76498, "t": 644.1028, "r": 480.58875, "b": 652.89977, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "between the nodes, e.g. if they belong to the same column, row, or table cell.", "bbox": {"l": 134.76498, "t": 656.05879, "r": 480.59069999999997, "b": 664.85577, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Approaches to formalize the logical structure and layout of tables in electronic documents date back more than two decades [16]. In the recent past, a wide variety of computer vision methods have been explored to tackle the problem of table structure recognition, i.e. the correct identification of columns, rows and spanning cells in a given table. Broadly speaking, the current deeplearning based approaches fall into three categories: object detection (OD) methods, Graph-Neural-Network (GNN) methods and Image-to-Markup-Sequence (Im2Seq) methods. Object-detection based methods [11,12,13,14,21] rely on tablestructure annotation using (overlapping) bounding boxes for training, and produce bounding-box predictions to define table cells, rows, and columns on a table image. Graph Neural Network (GNN) based methods [3,6,17,18], as the name suggests, represent tables as graph structures. The graph nodes represent the content of each table cell, an embedding vector from the table image, or geometric coordinates of the table cell. The edges of the graph define the relationship between the nodes, e.g. if they belong to the same column, row, or table cell."}], "body": [{"label": "text", "id": 2, "page_no": 2, "cluster": {"id": 2, "label": "text", "bbox": {"l": 134.76498, "t": 118.93377999999996, "r": 480.59183, "b": 211.41687000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9871802926063538, "cells": [{"id": 2, "text": "While the majority of research in TSR is currently focused on the develop-", "bbox": {"l": 149.709, "t": 118.93377999999996, "r": 480.59183, "b": 127.73077, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "ment and application of novel neural model architectures, the table structure", "bbox": {"l": 134.765, "t": 130.88878999999997, "r": 480.58675999999997, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "representation language (e.g. HTML in PubTabNet and FinTabNet) is usually", "bbox": {"l": 134.765, "t": 142.84479, "r": 480.5917400000001, "b": 151.64178000000004, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "adopted", "bbox": {"l": 134.765, "t": 154.7998, "r": 169.62514, "b": 163.59680000000003, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "as is", "bbox": {"l": 173.86099, "t": 154.7998, "r": 194.55531, "b": 163.59680000000003, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "for the sequence tokenization in Im2Seq models. In this paper,", "bbox": {"l": 199.60999, "t": 154.7998, "r": 480.58618, "b": 163.59680000000003, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "we aim for the opposite and investigate the impact of the table structure rep-", "bbox": {"l": 134.76498, "t": 166.75482, "r": 480.59167, "b": 175.55182000000002, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "resentation language with an otherwise unmodified Im2Seq transformer-based", "bbox": {"l": 134.76498, "t": 178.70983999999999, "r": 480.58968999999996, "b": 187.50684, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "architecture. Since the current state-of-the-art Im2Seq model is TableFormer [9],", "bbox": {"l": 134.76498, "t": 190.66485999999998, "r": 480.5917400000001, "b": 199.46185000000003, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "we select this model to perform our experiments.", "bbox": {"l": 134.76498, "t": 202.61987, "r": 348.35519, "b": 211.41687000000002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "While the majority of research in TSR is currently focused on the development and application of novel neural model architectures, the table structure representation language (e.g. HTML in PubTabNet and FinTabNet) is usually adopted as is for the sequence tokenization in Im2Seq models. In this paper, we aim for the opposite and investigate the impact of the table structure representation language with an otherwise unmodified Im2Seq transformer-based architecture. Since the current state-of-the-art Im2Seq model is TableFormer [9], we select this model to perform our experiments."}, {"label": "text", "id": 1, "page_no": 2, "cluster": {"id": 1, "label": "text", "bbox": {"l": 134.76498, "t": 214.83587999999997, "r": 480.59572999999995, "b": 331.22986, "coord_origin": "TOPLEFT"}, "confidence": 0.9871861338615417, "cells": [{"id": 12, "text": "The main contribution of this paper is the introduction of a new optimised ta-", "bbox": {"l": 149.70898, "t": 214.83587999999997, "r": 480.5939, "b": 223.63287000000003, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "ble structure language (OTSL), specifically designed to describe table-structure", "bbox": {"l": 134.76498, "t": 226.79089, "r": 480.5938100000001, "b": 235.58789000000002, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "in an compact and structured way for Im2Seq models. OTSL has a number of", "bbox": {"l": 134.76498, "t": 238.74689, "r": 480.58667, "b": 247.54387999999994, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "key features, which make it very attractive to use in Im2Seq models. Specifically,", "bbox": {"l": 134.76498, "t": 250.70190000000002, "r": 480.5867, "b": 259.49890000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "compared to other languages such as HTML, OTSL has a minimized vocabulary", "bbox": {"l": 134.76498, "t": 262.65692, "r": 480.58771, "b": 271.45392000000004, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "which yields short sequence length, strong inherent structure (e.g. strict rectan-", "bbox": {"l": 134.76498, "t": 274.61194, "r": 480.59572999999995, "b": 283.40891, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "gular layout) and a strict syntax with rules that only look backwards. The latter", "bbox": {"l": 134.76498, "t": 286.56692999999996, "r": 480.59274, "b": 295.36389, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "allows for syntax validation during inference and ensures a syntactically correct", "bbox": {"l": 134.76498, "t": 298.52190999999993, "r": 480.59473, "b": 307.31888, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "table-structure. These OTSL features are illustrated in Figure 1, in comparison", "bbox": {"l": 134.76498, "t": 310.47791, "r": 480.58667, "b": 319.27487, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "to HTML.", "bbox": {"l": 134.76498, "t": 322.43289, "r": 179.72021, "b": 331.22986, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The main contribution of this paper is the introduction of a new optimised table structure language (OTSL), specifically designed to describe table-structure in an compact and structured way for Im2Seq models. OTSL has a number of key features, which make it very attractive to use in Im2Seq models. Specifically, compared to other languages such as HTML, OTSL has a minimized vocabulary which yields short sequence length, strong inherent structure (e.g. strict rectangular layout) and a strict syntax with rules that only look backwards. The latter allows for syntax validation during inference and ensures a syntactically correct table-structure. These OTSL features are illustrated in Figure 1, in comparison to HTML."}, {"label": "text", "id": 0, "page_no": 2, "cluster": {"id": 0, "label": "text", "bbox": {"l": 134.76498, "t": 334.64789, "r": 480.59567, "b": 439.08676, "coord_origin": "TOPLEFT"}, "confidence": 0.988121747970581, "cells": [{"id": 22, "text": "The paper is structured as follows. In section 2, we give an overview of the", "bbox": {"l": 149.70898, "t": 334.64789, "r": 480.5878000000001, "b": 343.44485000000003, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "latest developments in table-structure reconstruction. In section 3 we review", "bbox": {"l": 134.76498, "t": 346.60388000000006, "r": 480.59375, "b": 355.40085, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "the current HTML table encoding (popularised by PubTabNet and FinTabNet)", "bbox": {"l": 134.76498, "t": 358.55887, "r": 480.58673, "b": 367.3558300000001, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "and discuss its flaws. Subsequently, we introduce OTSL in section 4, which in-", "bbox": {"l": 134.76498, "t": 370.51385, "r": 480.59161, "b": 379.31082, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "cludes the language definition, syntax rules and error-correction procedures. In", "bbox": {"l": 134.76498, "t": 382.46883999999994, "r": 480.59177000000005, "b": 391.26581, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "section 5, we apply OTSL on the TableFormer architecture, compare it to Table-", "bbox": {"l": 134.76498, "t": 394.42383, "r": 480.58774, "b": 403.2207900000001, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Former models trained on HTML and ultimately demonstrate the advantages", "bbox": {"l": 134.76498, "t": 406.37982, "r": 480.59469999999993, "b": 415.17679, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "of using OTSL. Finally, in section 6 we conclude our work and outline next", "bbox": {"l": 134.76498, "t": 418.33481, "r": 480.59567, "b": 427.13177, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "potential steps.", "bbox": {"l": 134.76498, "t": 430.28979, "r": 201.27232, "b": 439.08676, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The paper is structured as follows. In section 2, we give an overview of the latest developments in table-structure reconstruction. In section 3 we review the current HTML table encoding (popularised by PubTabNet and FinTabNet) and discuss its flaws. Subsequently, we introduce OTSL in section 4, which includes the language definition, syntax rules and error-correction procedures. In section 5, we apply OTSL on the TableFormer architecture, compare it to TableFormer models trained on HTML and ultimately demonstrate the advantages of using OTSL. Finally, in section 6 we conclude our work and outline next potential steps."}, {"label": "section_header", "id": 4, "page_no": 2, "cluster": {"id": 4, "label": "section_header", "bbox": {"l": 134.76498, "t": 462.08795, "r": 236.76912999999996, "b": 472.65634, "coord_origin": "TOPLEFT"}, "confidence": 0.9439423680305481, "cells": [{"id": 31, "text": "2", "bbox": {"l": 134.76498, "t": 462.08795, "r": 141.48859, "b": 472.65634, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Related Work", "bbox": {"l": 154.93819, "t": 462.08795, "r": 236.76912999999996, "b": 472.65634, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2 Related Work"}, {"label": "text", "id": 3, "page_no": 2, "cluster": {"id": 3, "label": "text", "bbox": {"l": 134.76498, "t": 488.68582, "r": 484.12047999999993, "b": 664.85577, "coord_origin": "TOPLEFT"}, "confidence": 0.9870182871818542, "cells": [{"id": 33, "text": "Approaches to formalize the logical structure and layout of tables in electronic", "bbox": {"l": 134.76498, "t": 488.68582, "r": 480.59067, "b": 497.48279, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "documents date back more than two decades [16]. In the recent past, a wide", "bbox": {"l": 134.76498, "t": 500.64081, "r": 480.5917400000001, "b": 509.43777, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "variety of computer vision methods have been explored to tackle the prob-", "bbox": {"l": 134.76498, "t": 512.5957900000001, "r": 480.58971999999994, "b": 521.39276, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "lem of table structure recognition, i.e. the correct identification of columns,", "bbox": {"l": 134.76498, "t": 524.55179, "r": 480.58966, "b": 533.34875, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "rows and spanning cells in a given table. Broadly speaking, the current deep-", "bbox": {"l": 134.76498, "t": 536.50679, "r": 480.5897499999999, "b": 545.30376, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "learning based approaches fall into three categories: object detection (OD) meth-", "bbox": {"l": 134.76498, "t": 548.4617900000001, "r": 480.58862000000005, "b": 557.2587599999999, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "ods, Graph-Neural-Network (GNN) methods and Image-to-Markup-Sequence", "bbox": {"l": 134.76498, "t": 560.41679, "r": 480.59072999999995, "b": 569.21376, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "(Im2Seq) methods. Object-detection based methods [11,12,13,14,21] rely on table-", "bbox": {"l": 134.76498, "t": 572.3718, "r": 484.12047999999993, "b": 581.16876, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "structure annotation using (overlapping) bounding boxes for training, and pro-", "bbox": {"l": 134.76498, "t": 584.3267999999999, "r": 480.59567, "b": 593.12376, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "duce bounding-box predictions to define table cells, rows, and columns on a table", "bbox": {"l": 134.76498, "t": 596.28279, "r": 480.58871, "b": 605.07976, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "image. Graph Neural Network (GNN) based methods [3,6,17,18], as the name", "bbox": {"l": 134.76498, "t": 608.23779, "r": 480.59075999999993, "b": 617.03476, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "suggests, represent tables as graph structures. The graph nodes represent the", "bbox": {"l": 134.76498, "t": 620.1927900000001, "r": 480.58574999999996, "b": 628.9897599999999, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "content of each table cell, an embedding vector from the table image, or geomet-", "bbox": {"l": 134.76498, "t": 632.1478, "r": 480.58875, "b": 640.94476, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "ric coordinates of the table cell. The edges of the graph define the relationship", "bbox": {"l": 134.76498, "t": 644.1028, "r": 480.58875, "b": 652.89977, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "between the nodes, e.g. if they belong to the same column, row, or table cell.", "bbox": {"l": 134.76498, "t": 656.05879, "r": 480.59069999999997, "b": 664.85577, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Approaches to formalize the logical structure and layout of tables in electronic documents date back more than two decades [16]. In the recent past, a wide variety of computer vision methods have been explored to tackle the problem of table structure recognition, i.e. the correct identification of columns, rows and spanning cells in a given table. Broadly speaking, the current deeplearning based approaches fall into three categories: object detection (OD) methods, Graph-Neural-Network (GNN) methods and Image-to-Markup-Sequence (Im2Seq) methods. Object-detection based methods [11,12,13,14,21] rely on tablestructure annotation using (overlapping) bounding boxes for training, and produce bounding-box predictions to define table cells, rows, and columns on a table image. Graph Neural Network (GNN) based methods [3,6,17,18], as the name suggests, represent tables as graph structures. The graph nodes represent the content of each table cell, an embedding vector from the table image, or geometric coordinates of the table cell. The edges of the graph define the relationship between the nodes, e.g. if they belong to the same column, row, or table cell."}], "headers": [{"label": "page_header", "id": 5, "page_no": 2, "cluster": {"id": 5, "label": "page_header", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9325801730155945, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Optimized Table Tokenization for Table Structure Recognition"}, {"label": "page_header", "id": 6, "page_no": 2, "cluster": {"id": 6, "label": "page_header", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8773486614227295, "cells": [{"id": 1, "text": "3", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3"}]}}, {"page_no": 3, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "4", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "M.", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 178.07675, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37415, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Other work [20] aims at predicting a grid for each table and deciding which cells", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.59375, "b": 127.73077, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "must be merged using an attention network. Im2Seq methods cast the problem", "bbox": {"l": 134.765, "t": 130.88878999999997, "r": 480.58774, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "as a sequence generation task [4,5,9,22], and therefore need an internal table-", "bbox": {"l": 134.765, "t": 142.84479, "r": 480.58675999999997, "b": 151.64178000000004, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "structure representation language, which is often implemented with standard", "bbox": {"l": 134.765, "t": 154.7998, "r": 480.5878000000001, "b": 163.59680000000003, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "markup languages (e.g. HTML, LaTeX, Markdown). In theory, Im2Seq methods", "bbox": {"l": 134.765, "t": 166.75482, "r": 480.59271, "b": 175.55182000000002, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "have a natural advantage over the OD and GNN methods by virtue of directly", "bbox": {"l": 134.765, "t": 178.70983999999999, "r": 480.5957599999999, "b": 187.50684, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "predicting the table-structure. As such, no post-processing or rules are needed", "bbox": {"l": 134.765, "t": 190.66485999999998, "r": 480.59271, "b": 199.46185000000003, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "in order to obtain the table-structure, which is necessary with OD and GNN", "bbox": {"l": 134.765, "t": 202.61987, "r": 480.59378, "b": 211.41687000000002, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "approaches. In practice, this is not entirely true, because a predicted sequence", "bbox": {"l": 134.765, "t": 214.57587, "r": 480.58783000000005, "b": 223.37285999999995, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "of table-structure markup does not necessarily have to be syntactically correct.", "bbox": {"l": 134.765, "t": 226.53088000000002, "r": 480.58978, "b": 235.32788000000005, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Hence, depending on the quality of the predicted sequence, some post-processing", "bbox": {"l": 134.765, "t": 238.48590000000002, "r": 480.59572999999995, "b": 247.28290000000004, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "needs to be performed to ensure a syntactically valid (let alone correct) sequence.", "bbox": {"l": 134.765, "t": 250.44092, "r": 480.59473, "b": 259.23792000000003, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Within the Im2Seq method, we find several popular models, namely the", "bbox": {"l": 149.709, "t": 262.65692, "r": 480.59280000000007, "b": 271.45392000000004, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "encoder-dual-decoder model (EDD) [22], TableFormer [9], Tabsplitter[2] and Ye", "bbox": {"l": 134.765, "t": 274.61194, "r": 480.59167, "b": 283.40891, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "et. al. [19]. EDD uses two consecutive long short-term memory (LSTM) decoders", "bbox": {"l": 134.765, "t": 286.56692999999996, "r": 480.59271, "b": 295.36389, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "to predict a table in HTML representation. The", "bbox": {"l": 134.765, "t": 298.52190999999993, "r": 342.02097, "b": 307.31888, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "tag decoder", "bbox": {"l": 345.064, "t": 298.52190999999993, "r": 393.04684, "b": 307.31888, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "predicts a sequence", "bbox": {"l": 397.16699, "t": 298.52190999999993, "r": 480.59082, "b": 307.31888, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "of HTML tags. For each decoded table cell (", "bbox": {"l": 134.76498, "t": 310.47791, "r": 333.29871, "b": 319.27487, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "<td>", "bbox": {"l": 333.29898, "t": 310.47791, "r": 356.9711, "b": 319.27487, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "), the attention is passed to", "bbox": {"l": 357.08499, "t": 310.47791, "r": 480.59433000000007, "b": 319.27487, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "the", "bbox": {"l": 134.76498, "t": 322.43289, "r": 148.59805, "b": 331.22986, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "cell decoder", "bbox": {"l": 152.27698, "t": 322.43289, "r": 202.1109, "b": 331.22986, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "to predict the content with an embedded OCR approach. The", "bbox": {"l": 206.86398, "t": 322.43289, "r": 480.58743, "b": 331.22986, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "latter makes it susceptible to transcription errors in the cell content of the table.", "bbox": {"l": 134.76498, "t": 334.38788, "r": 480.59476, "b": 343.18484, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "TableFormer address this reliance on OCR and uses two transformer decoders for", "bbox": {"l": 134.76498, "t": 346.34286, "r": 480.58675999999997, "b": 355.13983, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "HTML structure and cell bounding box prediction in an end-to-end architecture.", "bbox": {"l": 134.76498, "t": 358.29785, "r": 480.58868, "b": 367.09482, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "The predicted cell bounding box is then used to extract text tokens from an", "bbox": {"l": 134.76498, "t": 370.25284, "r": 480.58868, "b": 379.0498, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "originating (digital) PDF page, circumventing any need for OCR. TabSplitter", "bbox": {"l": 134.76498, "t": 382.20883, "r": 480.59357000000006, "b": 391.0058, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "[2]", "bbox": {"l": 134.76498, "t": 394.16382, "r": 144.76979, "b": 402.96078, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "proposes a compact double-matrix representation of table rows and columns", "bbox": {"l": 149.50908, "t": 394.16382, "r": 480.58667, "b": 402.96078, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "to do error detection and error correction of HTML structure sequences based", "bbox": {"l": 134.76498, "t": 406.1188, "r": 480.59569999999997, "b": 414.91576999999995, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "on predictions from [19]. This compact double-matrix representation can not be", "bbox": {"l": 134.76498, "t": 418.07379, "r": 480.59180000000003, "b": 426.87076, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "used directly by the Img2seq model training, so the model uses HTML as an", "bbox": {"l": 134.76498, "t": 430.02878, "r": 480.5878000000001, "b": 438.82574, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "intermediate form. Chi et. al. [4] introduce a data set and a baseline method", "bbox": {"l": 134.76498, "t": 441.98376, "r": 480.58868, "b": 450.78073, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "using bidirectional LSTMs to predict LaTeX code. Kayal", "bbox": {"l": 134.76498, "t": 453.93976000000004, "r": 384.5752, "b": 462.73672, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "[5]", "bbox": {"l": 391.55899, "t": 453.93976000000004, "r": 401.73236, "b": 462.73672, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "introduces Gated", "bbox": {"l": 406.55154, "t": 453.93976000000004, "r": 480.58777, "b": 462.73672, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "ResNet transformers to predict LaTeX code, and a separate OCR module to", "bbox": {"l": 134.76498, "t": 465.89474, "r": 480.59079, "b": 474.69171, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "extract content.", "bbox": {"l": 134.76498, "t": 477.84973, "r": 203.68625, "b": 486.6467, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Im2Seq approaches have shown to be well-suited for the TSR task and allow a", "bbox": {"l": 149.70898, "t": 490.06573, "r": 480.59378, "b": 498.8627, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "full end-to-end network design that can output the final table structure without", "bbox": {"l": 134.76498, "t": 502.02072, "r": 480.58871, "b": 510.81769, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "pre- or post-processing logic. Furthermore, Im2Seq models have demonstrated", "bbox": {"l": 134.76498, "t": 513.9757099999999, "r": 480.58675999999997, "b": 522.7726700000001, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "to deliver state-of-the-art prediction accuracy [9]. This motivated the authors", "bbox": {"l": 134.76498, "t": 525.93069, "r": 480.58978, "b": 534.72766, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "to investigate if the performance (both in accuracy and inference time) can", "bbox": {"l": 134.76498, "t": 537.8857, "r": 480.58765, "b": 546.6826599999999, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "be further improved by optimising the table structure representation language.", "bbox": {"l": 134.76498, "t": 549.84169, "r": 480.58971999999994, "b": 558.63866, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "We believe this is a necessary step before further improving neural network", "bbox": {"l": 134.76498, "t": 561.79669, "r": 480.58871, "b": 570.59366, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "architectures for this task.", "bbox": {"l": 134.76498, "t": 573.75169, "r": 249.27811, "b": 582.54866, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "3", "bbox": {"l": 134.76498, "t": 605.54984, "r": 141.48859, "b": 616.11823, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Problem Statement", "bbox": {"l": 154.93819, "t": 605.54984, "r": 269.62442, "b": 616.11823, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "All known Im2Seq based models for TSR fundamentally work in similar ways.", "bbox": {"l": 134.76498, "t": 632.14769, "r": 480.59064, "b": 640.94466, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "Given an image of a table, the Im2Seq model predicts the structure of the table", "bbox": {"l": 134.76498, "t": 644.1026899999999, "r": 480.5867, "b": 652.89966, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "by generating a sequence of tokens. These tokens originate from a finite vocab-", "bbox": {"l": 134.76498, "t": 656.0586900000001, "r": 480.5936899999999, "b": 664.85566, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 6, "label": "page_header", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.7890051603317261, "cells": [{"id": 0, "text": "4", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "page_header", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9045588374137878, "cells": [{"id": 1, "text": "M.", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 178.07675, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37415, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.5957599999999, "b": 259.23792000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9467443823814392, "cells": [{"id": 3, "text": "Other work [20] aims at predicting a grid for each table and deciding which cells", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.59375, "b": 127.73077, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "must be merged using an attention network. Im2Seq methods cast the problem", "bbox": {"l": 134.765, "t": 130.88878999999997, "r": 480.58774, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "as a sequence generation task [4,5,9,22], and therefore need an internal table-", "bbox": {"l": 134.765, "t": 142.84479, "r": 480.58675999999997, "b": 151.64178000000004, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "structure representation language, which is often implemented with standard", "bbox": {"l": 134.765, "t": 154.7998, "r": 480.5878000000001, "b": 163.59680000000003, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "markup languages (e.g. HTML, LaTeX, Markdown). In theory, Im2Seq methods", "bbox": {"l": 134.765, "t": 166.75482, "r": 480.59271, "b": 175.55182000000002, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "have a natural advantage over the OD and GNN methods by virtue of directly", "bbox": {"l": 134.765, "t": 178.70983999999999, "r": 480.5957599999999, "b": 187.50684, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "predicting the table-structure. As such, no post-processing or rules are needed", "bbox": {"l": 134.765, "t": 190.66485999999998, "r": 480.59271, "b": 199.46185000000003, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "in order to obtain the table-structure, which is necessary with OD and GNN", "bbox": {"l": 134.765, "t": 202.61987, "r": 480.59378, "b": 211.41687000000002, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "approaches. In practice, this is not entirely true, because a predicted sequence", "bbox": {"l": 134.765, "t": 214.57587, "r": 480.58783000000005, "b": 223.37285999999995, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "of table-structure markup does not necessarily have to be syntactically correct.", "bbox": {"l": 134.765, "t": 226.53088000000002, "r": 480.58978, "b": 235.32788000000005, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Hence, depending on the quality of the predicted sequence, some post-processing", "bbox": {"l": 134.765, "t": 238.48590000000002, "r": 480.59572999999995, "b": 247.28290000000004, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "needs to be performed to ensure a syntactically valid (let alone correct) sequence.", "bbox": {"l": 134.765, "t": 250.44092, "r": 480.59473, "b": 259.23792000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "text", "bbox": {"l": 134.76498, "t": 262.65692, "r": 480.59569999999997, "b": 486.6467, "coord_origin": "TOPLEFT"}, "confidence": 0.929087221622467, "cells": [{"id": 15, "text": "Within the Im2Seq method, we find several popular models, namely the", "bbox": {"l": 149.709, "t": 262.65692, "r": 480.59280000000007, "b": 271.45392000000004, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "encoder-dual-decoder model (EDD) [22], TableFormer [9], Tabsplitter[2] and Ye", "bbox": {"l": 134.765, "t": 274.61194, "r": 480.59167, "b": 283.40891, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "et. al. [19]. EDD uses two consecutive long short-term memory (LSTM) decoders", "bbox": {"l": 134.765, "t": 286.56692999999996, "r": 480.59271, "b": 295.36389, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "to predict a table in HTML representation. The", "bbox": {"l": 134.765, "t": 298.52190999999993, "r": 342.02097, "b": 307.31888, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "tag decoder", "bbox": {"l": 345.064, "t": 298.52190999999993, "r": 393.04684, "b": 307.31888, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "predicts a sequence", "bbox": {"l": 397.16699, "t": 298.52190999999993, "r": 480.59082, "b": 307.31888, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "of HTML tags. For each decoded table cell (", "bbox": {"l": 134.76498, "t": 310.47791, "r": 333.29871, "b": 319.27487, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "<td>", "bbox": {"l": 333.29898, "t": 310.47791, "r": 356.9711, "b": 319.27487, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "), the attention is passed to", "bbox": {"l": 357.08499, "t": 310.47791, "r": 480.59433000000007, "b": 319.27487, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "the", "bbox": {"l": 134.76498, "t": 322.43289, "r": 148.59805, "b": 331.22986, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "cell decoder", "bbox": {"l": 152.27698, "t": 322.43289, "r": 202.1109, "b": 331.22986, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "to predict the content with an embedded OCR approach. The", "bbox": {"l": 206.86398, "t": 322.43289, "r": 480.58743, "b": 331.22986, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "latter makes it susceptible to transcription errors in the cell content of the table.", "bbox": {"l": 134.76498, "t": 334.38788, "r": 480.59476, "b": 343.18484, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "TableFormer address this reliance on OCR and uses two transformer decoders for", "bbox": {"l": 134.76498, "t": 346.34286, "r": 480.58675999999997, "b": 355.13983, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "HTML structure and cell bounding box prediction in an end-to-end architecture.", "bbox": {"l": 134.76498, "t": 358.29785, "r": 480.58868, "b": 367.09482, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "The predicted cell bounding box is then used to extract text tokens from an", "bbox": {"l": 134.76498, "t": 370.25284, "r": 480.58868, "b": 379.0498, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "originating (digital) PDF page, circumventing any need for OCR. TabSplitter", "bbox": {"l": 134.76498, "t": 382.20883, "r": 480.59357000000006, "b": 391.0058, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "[2]", "bbox": {"l": 134.76498, "t": 394.16382, "r": 144.76979, "b": 402.96078, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "proposes a compact double-matrix representation of table rows and columns", "bbox": {"l": 149.50908, "t": 394.16382, "r": 480.58667, "b": 402.96078, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "to do error detection and error correction of HTML structure sequences based", "bbox": {"l": 134.76498, "t": 406.1188, "r": 480.59569999999997, "b": 414.91576999999995, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "on predictions from [19]. This compact double-matrix representation can not be", "bbox": {"l": 134.76498, "t": 418.07379, "r": 480.59180000000003, "b": 426.87076, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "used directly by the Img2seq model training, so the model uses HTML as an", "bbox": {"l": 134.76498, "t": 430.02878, "r": 480.5878000000001, "b": 438.82574, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "intermediate form. Chi et. al. [4] introduce a data set and a baseline method", "bbox": {"l": 134.76498, "t": 441.98376, "r": 480.58868, "b": 450.78073, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "using bidirectional LSTMs to predict LaTeX code. Kayal", "bbox": {"l": 134.76498, "t": 453.93976000000004, "r": 384.5752, "b": 462.73672, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "[5]", "bbox": {"l": 391.55899, "t": 453.93976000000004, "r": 401.73236, "b": 462.73672, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "introduces Gated", "bbox": {"l": 406.55154, "t": 453.93976000000004, "r": 480.58777, "b": 462.73672, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "ResNet transformers to predict LaTeX code, and a separate OCR module to", "bbox": {"l": 134.76498, "t": 465.89474, "r": 480.59079, "b": 474.69171, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "extract content.", "bbox": {"l": 134.76498, "t": 477.84973, "r": 203.68625, "b": 486.6467, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 134.76498, "t": 490.06573, "r": 480.59378, "b": 582.54866, "coord_origin": "TOPLEFT"}, "confidence": 0.9853583574295044, "cells": [{"id": 43, "text": "Im2Seq approaches have shown to be well-suited for the TSR task and allow a", "bbox": {"l": 149.70898, "t": 490.06573, "r": 480.59378, "b": 498.8627, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "full end-to-end network design that can output the final table structure without", "bbox": {"l": 134.76498, "t": 502.02072, "r": 480.58871, "b": 510.81769, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "pre- or post-processing logic. Furthermore, Im2Seq models have demonstrated", "bbox": {"l": 134.76498, "t": 513.9757099999999, "r": 480.58675999999997, "b": 522.7726700000001, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "to deliver state-of-the-art prediction accuracy [9]. This motivated the authors", "bbox": {"l": 134.76498, "t": 525.93069, "r": 480.58978, "b": 534.72766, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "to investigate if the performance (both in accuracy and inference time) can", "bbox": {"l": 134.76498, "t": 537.8857, "r": 480.58765, "b": 546.6826599999999, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "be further improved by optimising the table structure representation language.", "bbox": {"l": 134.76498, "t": 549.84169, "r": 480.58971999999994, "b": 558.63866, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "We believe this is a necessary step before further improving neural network", "bbox": {"l": 134.76498, "t": 561.79669, "r": 480.58871, "b": 570.59366, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "architectures for this task.", "bbox": {"l": 134.76498, "t": 573.75169, "r": 249.27811, "b": 582.54866, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "section_header", "bbox": {"l": 134.76498, "t": 605.54984, "r": 269.62442, "b": 616.11823, "coord_origin": "TOPLEFT"}, "confidence": 0.9393903017044067, "cells": [{"id": 51, "text": "3", "bbox": {"l": 134.76498, "t": 605.54984, "r": 141.48859, "b": 616.11823, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Problem Statement", "bbox": {"l": 154.93819, "t": 605.54984, "r": 269.62442, "b": 616.11823, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 134.76498, "t": 632.14769, "r": 480.5936899999999, "b": 664.85566, "coord_origin": "TOPLEFT"}, "confidence": 0.9692807197570801, "cells": [{"id": 53, "text": "All known Im2Seq based models for TSR fundamentally work in similar ways.", "bbox": {"l": 134.76498, "t": 632.14769, "r": 480.59064, "b": 640.94466, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "Given an image of a table, the Im2Seq model predicts the structure of the table", "bbox": {"l": 134.76498, "t": 644.1026899999999, "r": 480.5867, "b": 652.89966, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "by generating a sequence of tokens. These tokens originate from a finite vocab-", "bbox": {"l": 134.76498, "t": 656.0586900000001, "r": 480.5936899999999, "b": 664.85566, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_header", "id": 6, "page_no": 3, "cluster": {"id": 6, "label": "page_header", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.7890051603317261, "cells": [{"id": 0, "text": "4", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4"}, {"label": "page_header", "id": 5, "page_no": 3, "cluster": {"id": 5, "label": "page_header", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9045588374137878, "cells": [{"id": 1, "text": "M.", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 178.07675, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37415, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "M. Lysak, et al."}, {"label": "text", "id": 2, "page_no": 3, "cluster": {"id": 2, "label": "text", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.5957599999999, "b": 259.23792000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9467443823814392, "cells": [{"id": 3, "text": "Other work [20] aims at predicting a grid for each table and deciding which cells", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.59375, "b": 127.73077, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "must be merged using an attention network. Im2Seq methods cast the problem", "bbox": {"l": 134.765, "t": 130.88878999999997, "r": 480.58774, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "as a sequence generation task [4,5,9,22], and therefore need an internal table-", "bbox": {"l": 134.765, "t": 142.84479, "r": 480.58675999999997, "b": 151.64178000000004, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "structure representation language, which is often implemented with standard", "bbox": {"l": 134.765, "t": 154.7998, "r": 480.5878000000001, "b": 163.59680000000003, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "markup languages (e.g. HTML, LaTeX, Markdown). In theory, Im2Seq methods", "bbox": {"l": 134.765, "t": 166.75482, "r": 480.59271, "b": 175.55182000000002, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "have a natural advantage over the OD and GNN methods by virtue of directly", "bbox": {"l": 134.765, "t": 178.70983999999999, "r": 480.5957599999999, "b": 187.50684, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "predicting the table-structure. As such, no post-processing or rules are needed", "bbox": {"l": 134.765, "t": 190.66485999999998, "r": 480.59271, "b": 199.46185000000003, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "in order to obtain the table-structure, which is necessary with OD and GNN", "bbox": {"l": 134.765, "t": 202.61987, "r": 480.59378, "b": 211.41687000000002, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "approaches. In practice, this is not entirely true, because a predicted sequence", "bbox": {"l": 134.765, "t": 214.57587, "r": 480.58783000000005, "b": 223.37285999999995, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "of table-structure markup does not necessarily have to be syntactically correct.", "bbox": {"l": 134.765, "t": 226.53088000000002, "r": 480.58978, "b": 235.32788000000005, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Hence, depending on the quality of the predicted sequence, some post-processing", "bbox": {"l": 134.765, "t": 238.48590000000002, "r": 480.59572999999995, "b": 247.28290000000004, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "needs to be performed to ensure a syntactically valid (let alone correct) sequence.", "bbox": {"l": 134.765, "t": 250.44092, "r": 480.59473, "b": 259.23792000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Other work [20] aims at predicting a grid for each table and deciding which cells must be merged using an attention network. Im2Seq methods cast the problem as a sequence generation task [4,5,9,22], and therefore need an internal tablestructure representation language, which is often implemented with standard markup languages (e.g. HTML, LaTeX, Markdown). In theory, Im2Seq methods have a natural advantage over the OD and GNN methods by virtue of directly predicting the table-structure. As such, no post-processing or rules are needed in order to obtain the table-structure, which is necessary with OD and GNN approaches. In practice, this is not entirely true, because a predicted sequence of table-structure markup does not necessarily have to be syntactically correct. Hence, depending on the quality of the predicted sequence, some post-processing needs to be performed to ensure a syntactically valid (let alone correct) sequence."}, {"label": "text", "id": 4, "page_no": 3, "cluster": {"id": 4, "label": "text", "bbox": {"l": 134.76498, "t": 262.65692, "r": 480.59569999999997, "b": 486.6467, "coord_origin": "TOPLEFT"}, "confidence": 0.929087221622467, "cells": [{"id": 15, "text": "Within the Im2Seq method, we find several popular models, namely the", "bbox": {"l": 149.709, "t": 262.65692, "r": 480.59280000000007, "b": 271.45392000000004, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "encoder-dual-decoder model (EDD) [22], TableFormer [9], Tabsplitter[2] and Ye", "bbox": {"l": 134.765, "t": 274.61194, "r": 480.59167, "b": 283.40891, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "et. al. [19]. EDD uses two consecutive long short-term memory (LSTM) decoders", "bbox": {"l": 134.765, "t": 286.56692999999996, "r": 480.59271, "b": 295.36389, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "to predict a table in HTML representation. The", "bbox": {"l": 134.765, "t": 298.52190999999993, "r": 342.02097, "b": 307.31888, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "tag decoder", "bbox": {"l": 345.064, "t": 298.52190999999993, "r": 393.04684, "b": 307.31888, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "predicts a sequence", "bbox": {"l": 397.16699, "t": 298.52190999999993, "r": 480.59082, "b": 307.31888, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "of HTML tags. For each decoded table cell (", "bbox": {"l": 134.76498, "t": 310.47791, "r": 333.29871, "b": 319.27487, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "<td>", "bbox": {"l": 333.29898, "t": 310.47791, "r": 356.9711, "b": 319.27487, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "), the attention is passed to", "bbox": {"l": 357.08499, "t": 310.47791, "r": 480.59433000000007, "b": 319.27487, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "the", "bbox": {"l": 134.76498, "t": 322.43289, "r": 148.59805, "b": 331.22986, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "cell decoder", "bbox": {"l": 152.27698, "t": 322.43289, "r": 202.1109, "b": 331.22986, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "to predict the content with an embedded OCR approach. The", "bbox": {"l": 206.86398, "t": 322.43289, "r": 480.58743, "b": 331.22986, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "latter makes it susceptible to transcription errors in the cell content of the table.", "bbox": {"l": 134.76498, "t": 334.38788, "r": 480.59476, "b": 343.18484, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "TableFormer address this reliance on OCR and uses two transformer decoders for", "bbox": {"l": 134.76498, "t": 346.34286, "r": 480.58675999999997, "b": 355.13983, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "HTML structure and cell bounding box prediction in an end-to-end architecture.", "bbox": {"l": 134.76498, "t": 358.29785, "r": 480.58868, "b": 367.09482, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "The predicted cell bounding box is then used to extract text tokens from an", "bbox": {"l": 134.76498, "t": 370.25284, "r": 480.58868, "b": 379.0498, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "originating (digital) PDF page, circumventing any need for OCR. TabSplitter", "bbox": {"l": 134.76498, "t": 382.20883, "r": 480.59357000000006, "b": 391.0058, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "[2]", "bbox": {"l": 134.76498, "t": 394.16382, "r": 144.76979, "b": 402.96078, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "proposes a compact double-matrix representation of table rows and columns", "bbox": {"l": 149.50908, "t": 394.16382, "r": 480.58667, "b": 402.96078, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "to do error detection and error correction of HTML structure sequences based", "bbox": {"l": 134.76498, "t": 406.1188, "r": 480.59569999999997, "b": 414.91576999999995, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "on predictions from [19]. This compact double-matrix representation can not be", "bbox": {"l": 134.76498, "t": 418.07379, "r": 480.59180000000003, "b": 426.87076, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "used directly by the Img2seq model training, so the model uses HTML as an", "bbox": {"l": 134.76498, "t": 430.02878, "r": 480.5878000000001, "b": 438.82574, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "intermediate form. Chi et. al. [4] introduce a data set and a baseline method", "bbox": {"l": 134.76498, "t": 441.98376, "r": 480.58868, "b": 450.78073, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "using bidirectional LSTMs to predict LaTeX code. Kayal", "bbox": {"l": 134.76498, "t": 453.93976000000004, "r": 384.5752, "b": 462.73672, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "[5]", "bbox": {"l": 391.55899, "t": 453.93976000000004, "r": 401.73236, "b": 462.73672, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "introduces Gated", "bbox": {"l": 406.55154, "t": 453.93976000000004, "r": 480.58777, "b": 462.73672, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "ResNet transformers to predict LaTeX code, and a separate OCR module to", "bbox": {"l": 134.76498, "t": 465.89474, "r": 480.59079, "b": 474.69171, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "extract content.", "bbox": {"l": 134.76498, "t": 477.84973, "r": 203.68625, "b": 486.6467, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Within the Im2Seq method, we find several popular models, namely the encoder-dual-decoder model (EDD) [22], TableFormer [9], Tabsplitter[2] and Ye et. al. [19]. EDD uses two consecutive long short-term memory (LSTM) decoders to predict a table in HTML representation. The tag decoder predicts a sequence of HTML tags. For each decoded table cell ( <td> ), the attention is passed to the cell decoder to predict the content with an embedded OCR approach. The latter makes it susceptible to transcription errors in the cell content of the table. TableFormer address this reliance on OCR and uses two transformer decoders for HTML structure and cell bounding box prediction in an end-to-end architecture. The predicted cell bounding box is then used to extract text tokens from an originating (digital) PDF page, circumventing any need for OCR. TabSplitter [2] proposes a compact double-matrix representation of table rows and columns to do error detection and error correction of HTML structure sequences based on predictions from [19]. This compact double-matrix representation can not be used directly by the Img2seq model training, so the model uses HTML as an intermediate form. Chi et. al. [4] introduce a data set and a baseline method using bidirectional LSTMs to predict LaTeX code. Kayal [5] introduces Gated ResNet transformers to predict LaTeX code, and a separate OCR module to extract content."}, {"label": "text", "id": 0, "page_no": 3, "cluster": {"id": 0, "label": "text", "bbox": {"l": 134.76498, "t": 490.06573, "r": 480.59378, "b": 582.54866, "coord_origin": "TOPLEFT"}, "confidence": 0.9853583574295044, "cells": [{"id": 43, "text": "Im2Seq approaches have shown to be well-suited for the TSR task and allow a", "bbox": {"l": 149.70898, "t": 490.06573, "r": 480.59378, "b": 498.8627, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "full end-to-end network design that can output the final table structure without", "bbox": {"l": 134.76498, "t": 502.02072, "r": 480.58871, "b": 510.81769, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "pre- or post-processing logic. Furthermore, Im2Seq models have demonstrated", "bbox": {"l": 134.76498, "t": 513.9757099999999, "r": 480.58675999999997, "b": 522.7726700000001, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "to deliver state-of-the-art prediction accuracy [9]. This motivated the authors", "bbox": {"l": 134.76498, "t": 525.93069, "r": 480.58978, "b": 534.72766, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "to investigate if the performance (both in accuracy and inference time) can", "bbox": {"l": 134.76498, "t": 537.8857, "r": 480.58765, "b": 546.6826599999999, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "be further improved by optimising the table structure representation language.", "bbox": {"l": 134.76498, "t": 549.84169, "r": 480.58971999999994, "b": 558.63866, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "We believe this is a necessary step before further improving neural network", "bbox": {"l": 134.76498, "t": 561.79669, "r": 480.58871, "b": 570.59366, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "architectures for this task.", "bbox": {"l": 134.76498, "t": 573.75169, "r": 249.27811, "b": 582.54866, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Im2Seq approaches have shown to be well-suited for the TSR task and allow a full end-to-end network design that can output the final table structure without pre- or post-processing logic. Furthermore, Im2Seq models have demonstrated to deliver state-of-the-art prediction accuracy [9]. This motivated the authors to investigate if the performance (both in accuracy and inference time) can be further improved by optimising the table structure representation language. We believe this is a necessary step before further improving neural network architectures for this task."}, {"label": "section_header", "id": 3, "page_no": 3, "cluster": {"id": 3, "label": "section_header", "bbox": {"l": 134.76498, "t": 605.54984, "r": 269.62442, "b": 616.11823, "coord_origin": "TOPLEFT"}, "confidence": 0.9393903017044067, "cells": [{"id": 51, "text": "3", "bbox": {"l": 134.76498, "t": 605.54984, "r": 141.48859, "b": 616.11823, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Problem Statement", "bbox": {"l": 154.93819, "t": 605.54984, "r": 269.62442, "b": 616.11823, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3 Problem Statement"}, {"label": "text", "id": 1, "page_no": 3, "cluster": {"id": 1, "label": "text", "bbox": {"l": 134.76498, "t": 632.14769, "r": 480.5936899999999, "b": 664.85566, "coord_origin": "TOPLEFT"}, "confidence": 0.9692807197570801, "cells": [{"id": 53, "text": "All known Im2Seq based models for TSR fundamentally work in similar ways.", "bbox": {"l": 134.76498, "t": 632.14769, "r": 480.59064, "b": 640.94466, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "Given an image of a table, the Im2Seq model predicts the structure of the table", "bbox": {"l": 134.76498, "t": 644.1026899999999, "r": 480.5867, "b": 652.89966, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "by generating a sequence of tokens. These tokens originate from a finite vocab-", "bbox": {"l": 134.76498, "t": 656.0586900000001, "r": 480.5936899999999, "b": 664.85566, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "All known Im2Seq based models for TSR fundamentally work in similar ways. Given an image of a table, the Im2Seq model predicts the structure of the table by generating a sequence of tokens. These tokens originate from a finite vocab-"}], "body": [{"label": "text", "id": 2, "page_no": 3, "cluster": {"id": 2, "label": "text", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.5957599999999, "b": 259.23792000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9467443823814392, "cells": [{"id": 3, "text": "Other work [20] aims at predicting a grid for each table and deciding which cells", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.59375, "b": 127.73077, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "must be merged using an attention network. Im2Seq methods cast the problem", "bbox": {"l": 134.765, "t": 130.88878999999997, "r": 480.58774, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "as a sequence generation task [4,5,9,22], and therefore need an internal table-", "bbox": {"l": 134.765, "t": 142.84479, "r": 480.58675999999997, "b": 151.64178000000004, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "structure representation language, which is often implemented with standard", "bbox": {"l": 134.765, "t": 154.7998, "r": 480.5878000000001, "b": 163.59680000000003, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "markup languages (e.g. HTML, LaTeX, Markdown). In theory, Im2Seq methods", "bbox": {"l": 134.765, "t": 166.75482, "r": 480.59271, "b": 175.55182000000002, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "have a natural advantage over the OD and GNN methods by virtue of directly", "bbox": {"l": 134.765, "t": 178.70983999999999, "r": 480.5957599999999, "b": 187.50684, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "predicting the table-structure. As such, no post-processing or rules are needed", "bbox": {"l": 134.765, "t": 190.66485999999998, "r": 480.59271, "b": 199.46185000000003, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "in order to obtain the table-structure, which is necessary with OD and GNN", "bbox": {"l": 134.765, "t": 202.61987, "r": 480.59378, "b": 211.41687000000002, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "approaches. In practice, this is not entirely true, because a predicted sequence", "bbox": {"l": 134.765, "t": 214.57587, "r": 480.58783000000005, "b": 223.37285999999995, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "of table-structure markup does not necessarily have to be syntactically correct.", "bbox": {"l": 134.765, "t": 226.53088000000002, "r": 480.58978, "b": 235.32788000000005, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Hence, depending on the quality of the predicted sequence, some post-processing", "bbox": {"l": 134.765, "t": 238.48590000000002, "r": 480.59572999999995, "b": 247.28290000000004, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "needs to be performed to ensure a syntactically valid (let alone correct) sequence.", "bbox": {"l": 134.765, "t": 250.44092, "r": 480.59473, "b": 259.23792000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Other work [20] aims at predicting a grid for each table and deciding which cells must be merged using an attention network. Im2Seq methods cast the problem as a sequence generation task [4,5,9,22], and therefore need an internal tablestructure representation language, which is often implemented with standard markup languages (e.g. HTML, LaTeX, Markdown). In theory, Im2Seq methods have a natural advantage over the OD and GNN methods by virtue of directly predicting the table-structure. As such, no post-processing or rules are needed in order to obtain the table-structure, which is necessary with OD and GNN approaches. In practice, this is not entirely true, because a predicted sequence of table-structure markup does not necessarily have to be syntactically correct. Hence, depending on the quality of the predicted sequence, some post-processing needs to be performed to ensure a syntactically valid (let alone correct) sequence."}, {"label": "text", "id": 4, "page_no": 3, "cluster": {"id": 4, "label": "text", "bbox": {"l": 134.76498, "t": 262.65692, "r": 480.59569999999997, "b": 486.6467, "coord_origin": "TOPLEFT"}, "confidence": 0.929087221622467, "cells": [{"id": 15, "text": "Within the Im2Seq method, we find several popular models, namely the", "bbox": {"l": 149.709, "t": 262.65692, "r": 480.59280000000007, "b": 271.45392000000004, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "encoder-dual-decoder model (EDD) [22], TableFormer [9], Tabsplitter[2] and Ye", "bbox": {"l": 134.765, "t": 274.61194, "r": 480.59167, "b": 283.40891, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "et. al. [19]. EDD uses two consecutive long short-term memory (LSTM) decoders", "bbox": {"l": 134.765, "t": 286.56692999999996, "r": 480.59271, "b": 295.36389, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "to predict a table in HTML representation. The", "bbox": {"l": 134.765, "t": 298.52190999999993, "r": 342.02097, "b": 307.31888, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "tag decoder", "bbox": {"l": 345.064, "t": 298.52190999999993, "r": 393.04684, "b": 307.31888, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "predicts a sequence", "bbox": {"l": 397.16699, "t": 298.52190999999993, "r": 480.59082, "b": 307.31888, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "of HTML tags. For each decoded table cell (", "bbox": {"l": 134.76498, "t": 310.47791, "r": 333.29871, "b": 319.27487, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "<td>", "bbox": {"l": 333.29898, "t": 310.47791, "r": 356.9711, "b": 319.27487, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "), the attention is passed to", "bbox": {"l": 357.08499, "t": 310.47791, "r": 480.59433000000007, "b": 319.27487, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "the", "bbox": {"l": 134.76498, "t": 322.43289, "r": 148.59805, "b": 331.22986, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "cell decoder", "bbox": {"l": 152.27698, "t": 322.43289, "r": 202.1109, "b": 331.22986, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "to predict the content with an embedded OCR approach. The", "bbox": {"l": 206.86398, "t": 322.43289, "r": 480.58743, "b": 331.22986, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "latter makes it susceptible to transcription errors in the cell content of the table.", "bbox": {"l": 134.76498, "t": 334.38788, "r": 480.59476, "b": 343.18484, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "TableFormer address this reliance on OCR and uses two transformer decoders for", "bbox": {"l": 134.76498, "t": 346.34286, "r": 480.58675999999997, "b": 355.13983, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "HTML structure and cell bounding box prediction in an end-to-end architecture.", "bbox": {"l": 134.76498, "t": 358.29785, "r": 480.58868, "b": 367.09482, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "The predicted cell bounding box is then used to extract text tokens from an", "bbox": {"l": 134.76498, "t": 370.25284, "r": 480.58868, "b": 379.0498, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "originating (digital) PDF page, circumventing any need for OCR. TabSplitter", "bbox": {"l": 134.76498, "t": 382.20883, "r": 480.59357000000006, "b": 391.0058, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "[2]", "bbox": {"l": 134.76498, "t": 394.16382, "r": 144.76979, "b": 402.96078, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "proposes a compact double-matrix representation of table rows and columns", "bbox": {"l": 149.50908, "t": 394.16382, "r": 480.58667, "b": 402.96078, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "to do error detection and error correction of HTML structure sequences based", "bbox": {"l": 134.76498, "t": 406.1188, "r": 480.59569999999997, "b": 414.91576999999995, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "on predictions from [19]. This compact double-matrix representation can not be", "bbox": {"l": 134.76498, "t": 418.07379, "r": 480.59180000000003, "b": 426.87076, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "used directly by the Img2seq model training, so the model uses HTML as an", "bbox": {"l": 134.76498, "t": 430.02878, "r": 480.5878000000001, "b": 438.82574, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "intermediate form. Chi et. al. [4] introduce a data set and a baseline method", "bbox": {"l": 134.76498, "t": 441.98376, "r": 480.58868, "b": 450.78073, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "using bidirectional LSTMs to predict LaTeX code. Kayal", "bbox": {"l": 134.76498, "t": 453.93976000000004, "r": 384.5752, "b": 462.73672, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "[5]", "bbox": {"l": 391.55899, "t": 453.93976000000004, "r": 401.73236, "b": 462.73672, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "introduces Gated", "bbox": {"l": 406.55154, "t": 453.93976000000004, "r": 480.58777, "b": 462.73672, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "ResNet transformers to predict LaTeX code, and a separate OCR module to", "bbox": {"l": 134.76498, "t": 465.89474, "r": 480.59079, "b": 474.69171, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "extract content.", "bbox": {"l": 134.76498, "t": 477.84973, "r": 203.68625, "b": 486.6467, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Within the Im2Seq method, we find several popular models, namely the encoder-dual-decoder model (EDD) [22], TableFormer [9], Tabsplitter[2] and Ye et. al. [19]. EDD uses two consecutive long short-term memory (LSTM) decoders to predict a table in HTML representation. The tag decoder predicts a sequence of HTML tags. For each decoded table cell ( <td> ), the attention is passed to the cell decoder to predict the content with an embedded OCR approach. The latter makes it susceptible to transcription errors in the cell content of the table. TableFormer address this reliance on OCR and uses two transformer decoders for HTML structure and cell bounding box prediction in an end-to-end architecture. The predicted cell bounding box is then used to extract text tokens from an originating (digital) PDF page, circumventing any need for OCR. TabSplitter [2] proposes a compact double-matrix representation of table rows and columns to do error detection and error correction of HTML structure sequences based on predictions from [19]. This compact double-matrix representation can not be used directly by the Img2seq model training, so the model uses HTML as an intermediate form. Chi et. al. [4] introduce a data set and a baseline method using bidirectional LSTMs to predict LaTeX code. Kayal [5] introduces Gated ResNet transformers to predict LaTeX code, and a separate OCR module to extract content."}, {"label": "text", "id": 0, "page_no": 3, "cluster": {"id": 0, "label": "text", "bbox": {"l": 134.76498, "t": 490.06573, "r": 480.59378, "b": 582.54866, "coord_origin": "TOPLEFT"}, "confidence": 0.9853583574295044, "cells": [{"id": 43, "text": "Im2Seq approaches have shown to be well-suited for the TSR task and allow a", "bbox": {"l": 149.70898, "t": 490.06573, "r": 480.59378, "b": 498.8627, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "full end-to-end network design that can output the final table structure without", "bbox": {"l": 134.76498, "t": 502.02072, "r": 480.58871, "b": 510.81769, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "pre- or post-processing logic. Furthermore, Im2Seq models have demonstrated", "bbox": {"l": 134.76498, "t": 513.9757099999999, "r": 480.58675999999997, "b": 522.7726700000001, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "to deliver state-of-the-art prediction accuracy [9]. This motivated the authors", "bbox": {"l": 134.76498, "t": 525.93069, "r": 480.58978, "b": 534.72766, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "to investigate if the performance (both in accuracy and inference time) can", "bbox": {"l": 134.76498, "t": 537.8857, "r": 480.58765, "b": 546.6826599999999, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "be further improved by optimising the table structure representation language.", "bbox": {"l": 134.76498, "t": 549.84169, "r": 480.58971999999994, "b": 558.63866, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "We believe this is a necessary step before further improving neural network", "bbox": {"l": 134.76498, "t": 561.79669, "r": 480.58871, "b": 570.59366, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "architectures for this task.", "bbox": {"l": 134.76498, "t": 573.75169, "r": 249.27811, "b": 582.54866, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Im2Seq approaches have shown to be well-suited for the TSR task and allow a full end-to-end network design that can output the final table structure without pre- or post-processing logic. Furthermore, Im2Seq models have demonstrated to deliver state-of-the-art prediction accuracy [9]. This motivated the authors to investigate if the performance (both in accuracy and inference time) can be further improved by optimising the table structure representation language. We believe this is a necessary step before further improving neural network architectures for this task."}, {"label": "section_header", "id": 3, "page_no": 3, "cluster": {"id": 3, "label": "section_header", "bbox": {"l": 134.76498, "t": 605.54984, "r": 269.62442, "b": 616.11823, "coord_origin": "TOPLEFT"}, "confidence": 0.9393903017044067, "cells": [{"id": 51, "text": "3", "bbox": {"l": 134.76498, "t": 605.54984, "r": 141.48859, "b": 616.11823, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Problem Statement", "bbox": {"l": 154.93819, "t": 605.54984, "r": 269.62442, "b": 616.11823, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3 Problem Statement"}, {"label": "text", "id": 1, "page_no": 3, "cluster": {"id": 1, "label": "text", "bbox": {"l": 134.76498, "t": 632.14769, "r": 480.5936899999999, "b": 664.85566, "coord_origin": "TOPLEFT"}, "confidence": 0.9692807197570801, "cells": [{"id": 53, "text": "All known Im2Seq based models for TSR fundamentally work in similar ways.", "bbox": {"l": 134.76498, "t": 632.14769, "r": 480.59064, "b": 640.94466, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "Given an image of a table, the Im2Seq model predicts the structure of the table", "bbox": {"l": 134.76498, "t": 644.1026899999999, "r": 480.5867, "b": 652.89966, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "by generating a sequence of tokens. These tokens originate from a finite vocab-", "bbox": {"l": 134.76498, "t": 656.0586900000001, "r": 480.5936899999999, "b": 664.85566, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "All known Im2Seq based models for TSR fundamentally work in similar ways. Given an image of a table, the Im2Seq model predicts the structure of the table by generating a sequence of tokens. These tokens originate from a finite vocab-"}], "headers": [{"label": "page_header", "id": 6, "page_no": 3, "cluster": {"id": 6, "label": "page_header", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.7890051603317261, "cells": [{"id": 0, "text": "4", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4"}, {"label": "page_header", "id": 5, "page_no": 3, "cluster": {"id": 5, "label": "page_header", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9045588374137878, "cells": [{"id": 1, "text": "M.", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 178.07675, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37415, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "M. Lysak, et al."}]}}, {"page_no": 4, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "5", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "ulary and can be interpreted as a table structure. For example, with the HTML", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.58577999999994, "b": 127.73077, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "tokens", "bbox": {"l": 134.765, "t": 130.88878999999997, "r": 162.48494, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "<table>", "bbox": {"l": 166.368, "t": 130.88878999999997, "r": 201.74918, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": ",", "bbox": {"l": 201.74899, "t": 130.88878999999997, "r": 204.51561, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "</table>", "bbox": {"l": 208.39699, "t": 130.88878999999997, "r": 248.86904999999996, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": ",", "bbox": {"l": 248.86899, "t": 130.88878999999997, "r": 251.6356, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "<tr>", "bbox": {"l": 255.51698, "t": 130.88878999999997, "r": 278.29846, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": ",", "bbox": {"l": 278.29797, "t": 130.88878999999997, "r": 281.06458, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "</tr>", "bbox": {"l": 284.94598, "t": 130.88878999999997, "r": 312.81836, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": ",", "bbox": {"l": 312.81799, "t": 130.88878999999997, "r": 315.58459, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "<td>", "bbox": {"l": 319.466, "t": 130.88878999999997, "r": 343.13812, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "and", "bbox": {"l": 347.13202, "t": 130.88878999999997, "r": 363.17877, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "</td>", "bbox": {"l": 367.06003, "t": 130.88878999999997, "r": 395.82306, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": ", one can construct", "bbox": {"l": 395.82303, "t": 130.88878999999997, "r": 480.59177000000005, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "simple table structures without any spanning cells. In reality though, one needs", "bbox": {"l": 134.76501, "t": 142.84479, "r": 480.59365999999994, "b": 151.64178000000004, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "at least 28 HTML tokens to describe the most common complex tables observed", "bbox": {"l": 134.76501, "t": 154.7998, "r": 480.58577999999994, "b": 163.59680000000003, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "in real-world documents [21,22], due to a variety of spanning cells definitions in", "bbox": {"l": 134.76501, "t": 166.75482, "r": 480.59378, "b": 175.55182000000002, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "the HTML token vocabulary.", "bbox": {"l": 134.76501, "t": 178.70983999999999, "r": 261.92566, "b": 187.50684, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Fig. 2.", "bbox": {"l": 145.60701, "t": 221.07928000000004, "r": 173.48625, "b": 229.00562000000002, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Frequency of tokens in HTML and OTSL as they appear in PubTabNet.", "bbox": {"l": 176.56001, "t": 221.14209000000005, "r": 469.75223000000005, "b": 229.21178999999995, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "Obviously, HTML and other general-purpose markup languages were not de-", "bbox": {"l": 149.709, "t": 368.20679, "r": 480.59283000000005, "b": 377.00375, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "signed for Im2Seq models. As such, they have some serious drawbacks. First, the", "bbox": {"l": 134.765, "t": 380.16177, "r": 480.58664, "b": 388.9587399999999, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "token vocabulary needs to be artificially large in order to describe all plausible", "bbox": {"l": 134.765, "t": 392.11676, "r": 480.59180000000003, "b": 400.91373, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "tabular structures. Since most Im2Seq models use an autoregressive approach,", "bbox": {"l": 134.765, "t": 404.07175, "r": 480.5897499999999, "b": 412.86871, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "they generate the sequence token by token. Therefore, to reduce inference time,", "bbox": {"l": 134.765, "t": 416.02774, "r": 480.58871, "b": 424.82471, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "a shorter sequence length is critical. Every table-cell is represented by at least", "bbox": {"l": 134.765, "t": 427.98273, "r": 480.59265, "b": 436.77969, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "two tokens (", "bbox": {"l": 134.765, "t": 439.9377099999999, "r": 187.93439, "b": 448.73467999999997, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "<td>", "bbox": {"l": 187.931, "t": 439.9377099999999, "r": 211.60313, "b": 448.73467999999997, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "and", "bbox": {"l": 214.75400000000002, "t": 439.9377099999999, "r": 230.80075000000002, "b": 448.73467999999997, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "</td>", "bbox": {"l": 233.83898999999997, "t": 439.9377099999999, "r": 262.60202, "b": 448.73467999999997, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "). Furthermore, when tokenizing the HTML struc-", "bbox": {"l": 262.716, "t": 439.9377099999999, "r": 480.59009, "b": 448.73467999999997, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "ture, one needs to explicitly enumerate possible column-spans and row-spans", "bbox": {"l": 134.76501, "t": 451.8927, "r": 480.58777, "b": 460.68967, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "as words. In practice, this ends up requiring 28 different HTML tokens (when", "bbox": {"l": 134.76501, "t": 463.84769, "r": 480.58681999999993, "b": 472.64465, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "including column- and row-spans up to 10 cells) just to describe every table in", "bbox": {"l": 134.76501, "t": 475.80368, "r": 480.58681999999993, "b": 484.60065, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "the PubTabNet dataset. Clearly, not every token is equally represented, as is", "bbox": {"l": 134.76501, "t": 487.75867, "r": 480.59067, "b": 496.55563, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "depicted in Figure 2. This skewed distribution of tokens in combination with", "bbox": {"l": 134.76501, "t": 499.71365, "r": 480.59277, "b": 508.51062, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "variable token row-length makes it challenging for models to learn the HTML", "bbox": {"l": 134.76501, "t": 511.66864, "r": 480.59476, "b": 520.46561, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "structure.", "bbox": {"l": 134.76501, "t": 523.62363, "r": 176.92873, "b": 532.42059, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "Additionally, it would be desirable if the representation would easily allow", "bbox": {"l": 149.70901, "t": 536.04263, "r": 480.59289999999993, "b": 544.8396, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "an early detection of invalid sequences on-the-go, before the prediction of the", "bbox": {"l": 134.76501, "t": 547.99763, "r": 480.59085, "b": 556.7946000000001, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "entire table structure is completed. HTML is not well-suited for this purpose as", "bbox": {"l": 134.76501, "t": 559.95264, "r": 480.58984, "b": 568.7496, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "the verification of incomplete sequences is non-trivial or even impossible.", "bbox": {"l": 134.76501, "t": 571.90863, "r": 452.18933, "b": 580.7056, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "In a valid HTML table, the token sequence must describe a 2D grid of table", "bbox": {"l": 149.70901, "t": 584.32663, "r": 480.59283000000005, "b": 593.1236, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "cells, serialised in row-major ordering, where each row and each column have", "bbox": {"l": 134.76501, "t": 596.28262, "r": 480.58978, "b": 605.07959, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "the same length (while considering row- and column-spans). Furthermore, every", "bbox": {"l": 134.76501, "t": 608.23763, "r": 480.5936899999999, "b": 617.03459, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "opening tag in HTML needs to be matched by a closing tag in a correct hierar-", "bbox": {"l": 134.76501, "t": 620.19263, "r": 480.59091, "b": 628.98959, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "chical manner. Since the number of tokens for each table row and column can", "bbox": {"l": 134.76501, "t": 632.1476299999999, "r": 480.58582, "b": 640.9446, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "vary significantly, especially for large tables with many row- and column-spans,", "bbox": {"l": 134.76501, "t": 644.10263, "r": 480.59180000000003, "b": 652.8996, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "it is complex to verify the consistency of predicted structures during sequence", "bbox": {"l": 134.76501, "t": 656.05763, "r": 480.59473, "b": 664.85461, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 5, "label": "page_header", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9269194602966309, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "page_header", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8696112036705017, "cells": [{"id": 1, "text": "5", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.59378, "b": 187.50684, "coord_origin": "TOPLEFT"}, "confidence": 0.9857171773910522, "cells": [{"id": 2, "text": "ulary and can be interpreted as a table structure. For example, with the HTML", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.58577999999994, "b": 127.73077, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "tokens", "bbox": {"l": 134.765, "t": 130.88878999999997, "r": 162.48494, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "<table>", "bbox": {"l": 166.368, "t": 130.88878999999997, "r": 201.74918, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": ",", "bbox": {"l": 201.74899, "t": 130.88878999999997, "r": 204.51561, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "</table>", "bbox": {"l": 208.39699, "t": 130.88878999999997, "r": 248.86904999999996, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": ",", "bbox": {"l": 248.86899, "t": 130.88878999999997, "r": 251.6356, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "<tr>", "bbox": {"l": 255.51698, "t": 130.88878999999997, "r": 278.29846, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": ",", "bbox": {"l": 278.29797, "t": 130.88878999999997, "r": 281.06458, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "</tr>", "bbox": {"l": 284.94598, "t": 130.88878999999997, "r": 312.81836, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": ",", "bbox": {"l": 312.81799, "t": 130.88878999999997, "r": 315.58459, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "<td>", "bbox": {"l": 319.466, "t": 130.88878999999997, "r": 343.13812, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "and", "bbox": {"l": 347.13202, "t": 130.88878999999997, "r": 363.17877, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "</td>", "bbox": {"l": 367.06003, "t": 130.88878999999997, "r": 395.82306, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": ", one can construct", "bbox": {"l": 395.82303, "t": 130.88878999999997, "r": 480.59177000000005, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "simple table structures without any spanning cells. In reality though, one needs", "bbox": {"l": 134.76501, "t": 142.84479, "r": 480.59365999999994, "b": 151.64178000000004, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "at least 28 HTML tokens to describe the most common complex tables observed", "bbox": {"l": 134.76501, "t": 154.7998, "r": 480.58577999999994, "b": 163.59680000000003, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "in real-world documents [21,22], due to a variety of spanning cells definitions in", "bbox": {"l": 134.76501, "t": 166.75482, "r": 480.59378, "b": 175.55182000000002, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "the HTML token vocabulary.", "bbox": {"l": 134.76501, "t": 178.70983999999999, "r": 261.92566, "b": 187.50684, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "caption", "bbox": {"l": 145.60701, "t": 221.07928000000004, "r": 469.75223000000005, "b": 229.21178999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.8472551703453064, "cells": [{"id": 20, "text": "Fig. 2.", "bbox": {"l": 145.60701, "t": 221.07928000000004, "r": 173.48625, "b": 229.00562000000002, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Frequency of tokens in HTML and OTSL as they appear in PubTabNet.", "bbox": {"l": 176.56001, "t": 221.14209000000005, "r": 469.75223000000005, "b": 229.21178999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 134.765, "t": 368.20679, "r": 480.59476, "b": 532.42059, "coord_origin": "TOPLEFT"}, "confidence": 0.9844799637794495, "cells": [{"id": 22, "text": "Obviously, HTML and other general-purpose markup languages were not de-", "bbox": {"l": 149.709, "t": 368.20679, "r": 480.59283000000005, "b": 377.00375, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "signed for Im2Seq models. As such, they have some serious drawbacks. First, the", "bbox": {"l": 134.765, "t": 380.16177, "r": 480.58664, "b": 388.9587399999999, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "token vocabulary needs to be artificially large in order to describe all plausible", "bbox": {"l": 134.765, "t": 392.11676, "r": 480.59180000000003, "b": 400.91373, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "tabular structures. Since most Im2Seq models use an autoregressive approach,", "bbox": {"l": 134.765, "t": 404.07175, "r": 480.5897499999999, "b": 412.86871, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "they generate the sequence token by token. Therefore, to reduce inference time,", "bbox": {"l": 134.765, "t": 416.02774, "r": 480.58871, "b": 424.82471, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "a shorter sequence length is critical. Every table-cell is represented by at least", "bbox": {"l": 134.765, "t": 427.98273, "r": 480.59265, "b": 436.77969, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "two tokens (", "bbox": {"l": 134.765, "t": 439.9377099999999, "r": 187.93439, "b": 448.73467999999997, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "<td>", "bbox": {"l": 187.931, "t": 439.9377099999999, "r": 211.60313, "b": 448.73467999999997, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "and", "bbox": {"l": 214.75400000000002, "t": 439.9377099999999, "r": 230.80075000000002, "b": 448.73467999999997, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "</td>", "bbox": {"l": 233.83898999999997, "t": 439.9377099999999, "r": 262.60202, "b": 448.73467999999997, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "). Furthermore, when tokenizing the HTML struc-", "bbox": {"l": 262.716, "t": 439.9377099999999, "r": 480.59009, "b": 448.73467999999997, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "ture, one needs to explicitly enumerate possible column-spans and row-spans", "bbox": {"l": 134.76501, "t": 451.8927, "r": 480.58777, "b": 460.68967, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "as words. In practice, this ends up requiring 28 different HTML tokens (when", "bbox": {"l": 134.76501, "t": 463.84769, "r": 480.58681999999993, "b": 472.64465, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "including column- and row-spans up to 10 cells) just to describe every table in", "bbox": {"l": 134.76501, "t": 475.80368, "r": 480.58681999999993, "b": 484.60065, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "the PubTabNet dataset. Clearly, not every token is equally represented, as is", "bbox": {"l": 134.76501, "t": 487.75867, "r": 480.59067, "b": 496.55563, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "depicted in Figure 2. This skewed distribution of tokens in combination with", "bbox": {"l": 134.76501, "t": 499.71365, "r": 480.59277, "b": 508.51062, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "variable token row-length makes it challenging for models to learn the HTML", "bbox": {"l": 134.76501, "t": 511.66864, "r": 480.59476, "b": 520.46561, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "structure.", "bbox": {"l": 134.76501, "t": 523.62363, "r": 176.92873, "b": 532.42059, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 134.76501, "t": 536.04263, "r": 480.59289999999993, "b": 580.7056, "coord_origin": "TOPLEFT"}, "confidence": 0.978394627571106, "cells": [{"id": 40, "text": "Additionally, it would be desirable if the representation would easily allow", "bbox": {"l": 149.70901, "t": 536.04263, "r": 480.59289999999993, "b": 544.8396, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "an early detection of invalid sequences on-the-go, before the prediction of the", "bbox": {"l": 134.76501, "t": 547.99763, "r": 480.59085, "b": 556.7946000000001, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "entire table structure is completed. HTML is not well-suited for this purpose as", "bbox": {"l": 134.76501, "t": 559.95264, "r": 480.58984, "b": 568.7496, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "the verification of incomplete sequences is non-trivial or even impossible.", "bbox": {"l": 134.76501, "t": 571.90863, "r": 452.18933, "b": 580.7056, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 134.76501, "t": 584.32663, "r": 480.59473, "b": 664.85461, "coord_origin": "TOPLEFT"}, "confidence": 0.9838283061981201, "cells": [{"id": 44, "text": "In a valid HTML table, the token sequence must describe a 2D grid of table", "bbox": {"l": 149.70901, "t": 584.32663, "r": 480.59283000000005, "b": 593.1236, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "cells, serialised in row-major ordering, where each row and each column have", "bbox": {"l": 134.76501, "t": 596.28262, "r": 480.58978, "b": 605.07959, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "the same length (while considering row- and column-spans). Furthermore, every", "bbox": {"l": 134.76501, "t": 608.23763, "r": 480.5936899999999, "b": 617.03459, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "opening tag in HTML needs to be matched by a closing tag in a correct hierar-", "bbox": {"l": 134.76501, "t": 620.19263, "r": 480.59091, "b": 628.98959, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "chical manner. Since the number of tokens for each table row and column can", "bbox": {"l": 134.76501, "t": 632.1476299999999, "r": 480.58582, "b": 640.9446, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "vary significantly, especially for large tables with many row- and column-spans,", "bbox": {"l": 134.76501, "t": 644.10263, "r": 480.59180000000003, "b": 652.8996, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "it is complex to verify the consistency of predicted structures during sequence", "bbox": {"l": 134.76501, "t": 656.05763, "r": 480.59473, "b": 664.85461, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "picture", "bbox": {"l": 137.41448974609375, "t": 233.51231384277344, "r": 476.5608215332031, "b": 340.2304992675781, "coord_origin": "TOPLEFT"}, "confidence": 0.9387977123260498, "cells": [], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_header", "id": 5, "page_no": 4, "cluster": {"id": 5, "label": "page_header", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9269194602966309, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Optimized Table Tokenization for Table Structure Recognition"}, {"label": "page_header", "id": 6, "page_no": 4, "cluster": {"id": 6, "label": "page_header", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8696112036705017, "cells": [{"id": 1, "text": "5", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5"}, {"label": "text", "id": 0, "page_no": 4, "cluster": {"id": 0, "label": "text", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.59378, "b": 187.50684, "coord_origin": "TOPLEFT"}, "confidence": 0.9857171773910522, "cells": [{"id": 2, "text": "ulary and can be interpreted as a table structure. For example, with the HTML", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.58577999999994, "b": 127.73077, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "tokens", "bbox": {"l": 134.765, "t": 130.88878999999997, "r": 162.48494, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "<table>", "bbox": {"l": 166.368, "t": 130.88878999999997, "r": 201.74918, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": ",", "bbox": {"l": 201.74899, "t": 130.88878999999997, "r": 204.51561, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "</table>", "bbox": {"l": 208.39699, "t": 130.88878999999997, "r": 248.86904999999996, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": ",", "bbox": {"l": 248.86899, "t": 130.88878999999997, "r": 251.6356, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "<tr>", "bbox": {"l": 255.51698, "t": 130.88878999999997, "r": 278.29846, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": ",", "bbox": {"l": 278.29797, "t": 130.88878999999997, "r": 281.06458, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "</tr>", "bbox": {"l": 284.94598, "t": 130.88878999999997, "r": 312.81836, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": ",", "bbox": {"l": 312.81799, "t": 130.88878999999997, "r": 315.58459, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "<td>", "bbox": {"l": 319.466, "t": 130.88878999999997, "r": 343.13812, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "and", "bbox": {"l": 347.13202, "t": 130.88878999999997, "r": 363.17877, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "</td>", "bbox": {"l": 367.06003, "t": 130.88878999999997, "r": 395.82306, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": ", one can construct", "bbox": {"l": 395.82303, "t": 130.88878999999997, "r": 480.59177000000005, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "simple table structures without any spanning cells. In reality though, one needs", "bbox": {"l": 134.76501, "t": 142.84479, "r": 480.59365999999994, "b": 151.64178000000004, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "at least 28 HTML tokens to describe the most common complex tables observed", "bbox": {"l": 134.76501, "t": 154.7998, "r": 480.58577999999994, "b": 163.59680000000003, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "in real-world documents [21,22], due to a variety of spanning cells definitions in", "bbox": {"l": 134.76501, "t": 166.75482, "r": 480.59378, "b": 175.55182000000002, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "the HTML token vocabulary.", "bbox": {"l": 134.76501, "t": 178.70983999999999, "r": 261.92566, "b": 187.50684, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "ulary and can be interpreted as a table structure. For example, with the HTML tokens <table> , </table> , <tr> , </tr> , <td> and </td> , one can construct simple table structures without any spanning cells. In reality though, one needs at least 28 HTML tokens to describe the most common complex tables observed in real-world documents [21,22], due to a variety of spanning cells definitions in the HTML token vocabulary."}, {"label": "caption", "id": 7, "page_no": 4, "cluster": {"id": 7, "label": "caption", "bbox": {"l": 145.60701, "t": 221.07928000000004, "r": 469.75223000000005, "b": 229.21178999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.8472551703453064, "cells": [{"id": 20, "text": "Fig. 2.", "bbox": {"l": 145.60701, "t": 221.07928000000004, "r": 173.48625, "b": 229.00562000000002, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Frequency of tokens in HTML and OTSL as they appear in PubTabNet.", "bbox": {"l": 176.56001, "t": 221.14209000000005, "r": 469.75223000000005, "b": 229.21178999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Fig. 2. Frequency of tokens in HTML and OTSL as they appear in PubTabNet."}, {"label": "text", "id": 1, "page_no": 4, "cluster": {"id": 1, "label": "text", "bbox": {"l": 134.765, "t": 368.20679, "r": 480.59476, "b": 532.42059, "coord_origin": "TOPLEFT"}, "confidence": 0.9844799637794495, "cells": [{"id": 22, "text": "Obviously, HTML and other general-purpose markup languages were not de-", "bbox": {"l": 149.709, "t": 368.20679, "r": 480.59283000000005, "b": 377.00375, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "signed for Im2Seq models. As such, they have some serious drawbacks. First, the", "bbox": {"l": 134.765, "t": 380.16177, "r": 480.58664, "b": 388.9587399999999, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "token vocabulary needs to be artificially large in order to describe all plausible", "bbox": {"l": 134.765, "t": 392.11676, "r": 480.59180000000003, "b": 400.91373, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "tabular structures. Since most Im2Seq models use an autoregressive approach,", "bbox": {"l": 134.765, "t": 404.07175, "r": 480.5897499999999, "b": 412.86871, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "they generate the sequence token by token. Therefore, to reduce inference time,", "bbox": {"l": 134.765, "t": 416.02774, "r": 480.58871, "b": 424.82471, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "a shorter sequence length is critical. Every table-cell is represented by at least", "bbox": {"l": 134.765, "t": 427.98273, "r": 480.59265, "b": 436.77969, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "two tokens (", "bbox": {"l": 134.765, "t": 439.9377099999999, "r": 187.93439, "b": 448.73467999999997, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "<td>", "bbox": {"l": 187.931, "t": 439.9377099999999, "r": 211.60313, "b": 448.73467999999997, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "and", "bbox": {"l": 214.75400000000002, "t": 439.9377099999999, "r": 230.80075000000002, "b": 448.73467999999997, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "</td>", "bbox": {"l": 233.83898999999997, "t": 439.9377099999999, "r": 262.60202, "b": 448.73467999999997, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "). Furthermore, when tokenizing the HTML struc-", "bbox": {"l": 262.716, "t": 439.9377099999999, "r": 480.59009, "b": 448.73467999999997, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "ture, one needs to explicitly enumerate possible column-spans and row-spans", "bbox": {"l": 134.76501, "t": 451.8927, "r": 480.58777, "b": 460.68967, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "as words. In practice, this ends up requiring 28 different HTML tokens (when", "bbox": {"l": 134.76501, "t": 463.84769, "r": 480.58681999999993, "b": 472.64465, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "including column- and row-spans up to 10 cells) just to describe every table in", "bbox": {"l": 134.76501, "t": 475.80368, "r": 480.58681999999993, "b": 484.60065, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "the PubTabNet dataset. Clearly, not every token is equally represented, as is", "bbox": {"l": 134.76501, "t": 487.75867, "r": 480.59067, "b": 496.55563, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "depicted in Figure 2. This skewed distribution of tokens in combination with", "bbox": {"l": 134.76501, "t": 499.71365, "r": 480.59277, "b": 508.51062, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "variable token row-length makes it challenging for models to learn the HTML", "bbox": {"l": 134.76501, "t": 511.66864, "r": 480.59476, "b": 520.46561, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "structure.", "bbox": {"l": 134.76501, "t": 523.62363, "r": 176.92873, "b": 532.42059, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Obviously, HTML and other general-purpose markup languages were not designed for Im2Seq models. As such, they have some serious drawbacks. First, the token vocabulary needs to be artificially large in order to describe all plausible tabular structures. Since most Im2Seq models use an autoregressive approach, they generate the sequence token by token. Therefore, to reduce inference time, a shorter sequence length is critical. Every table-cell is represented by at least two tokens ( <td> and </td> ). Furthermore, when tokenizing the HTML structure, one needs to explicitly enumerate possible column-spans and row-spans as words. In practice, this ends up requiring 28 different HTML tokens (when including column- and row-spans up to 10 cells) just to describe every table in the PubTabNet dataset. Clearly, not every token is equally represented, as is depicted in Figure 2. This skewed distribution of tokens in combination with variable token row-length makes it challenging for models to learn the HTML structure."}, {"label": "text", "id": 3, "page_no": 4, "cluster": {"id": 3, "label": "text", "bbox": {"l": 134.76501, "t": 536.04263, "r": 480.59289999999993, "b": 580.7056, "coord_origin": "TOPLEFT"}, "confidence": 0.978394627571106, "cells": [{"id": 40, "text": "Additionally, it would be desirable if the representation would easily allow", "bbox": {"l": 149.70901, "t": 536.04263, "r": 480.59289999999993, "b": 544.8396, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "an early detection of invalid sequences on-the-go, before the prediction of the", "bbox": {"l": 134.76501, "t": 547.99763, "r": 480.59085, "b": 556.7946000000001, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "entire table structure is completed. HTML is not well-suited for this purpose as", "bbox": {"l": 134.76501, "t": 559.95264, "r": 480.58984, "b": 568.7496, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "the verification of incomplete sequences is non-trivial or even impossible.", "bbox": {"l": 134.76501, "t": 571.90863, "r": 452.18933, "b": 580.7056, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Additionally, it would be desirable if the representation would easily allow an early detection of invalid sequences on-the-go, before the prediction of the entire table structure is completed. HTML is not well-suited for this purpose as the verification of incomplete sequences is non-trivial or even impossible."}, {"label": "text", "id": 2, "page_no": 4, "cluster": {"id": 2, "label": "text", "bbox": {"l": 134.76501, "t": 584.32663, "r": 480.59473, "b": 664.85461, "coord_origin": "TOPLEFT"}, "confidence": 0.9838283061981201, "cells": [{"id": 44, "text": "In a valid HTML table, the token sequence must describe a 2D grid of table", "bbox": {"l": 149.70901, "t": 584.32663, "r": 480.59283000000005, "b": 593.1236, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "cells, serialised in row-major ordering, where each row and each column have", "bbox": {"l": 134.76501, "t": 596.28262, "r": 480.58978, "b": 605.07959, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "the same length (while considering row- and column-spans). Furthermore, every", "bbox": {"l": 134.76501, "t": 608.23763, "r": 480.5936899999999, "b": 617.03459, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "opening tag in HTML needs to be matched by a closing tag in a correct hierar-", "bbox": {"l": 134.76501, "t": 620.19263, "r": 480.59091, "b": 628.98959, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "chical manner. Since the number of tokens for each table row and column can", "bbox": {"l": 134.76501, "t": 632.1476299999999, "r": 480.58582, "b": 640.9446, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "vary significantly, especially for large tables with many row- and column-spans,", "bbox": {"l": 134.76501, "t": 644.10263, "r": 480.59180000000003, "b": 652.8996, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "it is complex to verify the consistency of predicted structures during sequence", "bbox": {"l": 134.76501, "t": 656.05763, "r": 480.59473, "b": 664.85461, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In a valid HTML table, the token sequence must describe a 2D grid of table cells, serialised in row-major ordering, where each row and each column have the same length (while considering row- and column-spans). Furthermore, every opening tag in HTML needs to be matched by a closing tag in a correct hierarchical manner. Since the number of tokens for each table row and column can vary significantly, especially for large tables with many row- and column-spans, it is complex to verify the consistency of predicted structures during sequence"}, {"label": "picture", "id": 4, "page_no": 4, "cluster": {"id": 4, "label": "picture", "bbox": {"l": 137.41448974609375, "t": 233.51231384277344, "r": 476.5608215332031, "b": 340.2304992675781, "coord_origin": "TOPLEFT"}, "confidence": 0.9387977123260498, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "body": [{"label": "text", "id": 0, "page_no": 4, "cluster": {"id": 0, "label": "text", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.59378, "b": 187.50684, "coord_origin": "TOPLEFT"}, "confidence": 0.9857171773910522, "cells": [{"id": 2, "text": "ulary and can be interpreted as a table structure. For example, with the HTML", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.58577999999994, "b": 127.73077, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "tokens", "bbox": {"l": 134.765, "t": 130.88878999999997, "r": 162.48494, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "<table>", "bbox": {"l": 166.368, "t": 130.88878999999997, "r": 201.74918, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": ",", "bbox": {"l": 201.74899, "t": 130.88878999999997, "r": 204.51561, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "</table>", "bbox": {"l": 208.39699, "t": 130.88878999999997, "r": 248.86904999999996, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": ",", "bbox": {"l": 248.86899, "t": 130.88878999999997, "r": 251.6356, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "<tr>", "bbox": {"l": 255.51698, "t": 130.88878999999997, "r": 278.29846, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": ",", "bbox": {"l": 278.29797, "t": 130.88878999999997, "r": 281.06458, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "</tr>", "bbox": {"l": 284.94598, "t": 130.88878999999997, "r": 312.81836, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": ",", "bbox": {"l": 312.81799, "t": 130.88878999999997, "r": 315.58459, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "<td>", "bbox": {"l": 319.466, "t": 130.88878999999997, "r": 343.13812, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "and", "bbox": {"l": 347.13202, "t": 130.88878999999997, "r": 363.17877, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "</td>", "bbox": {"l": 367.06003, "t": 130.88878999999997, "r": 395.82306, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": ", one can construct", "bbox": {"l": 395.82303, "t": 130.88878999999997, "r": 480.59177000000005, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "simple table structures without any spanning cells. In reality though, one needs", "bbox": {"l": 134.76501, "t": 142.84479, "r": 480.59365999999994, "b": 151.64178000000004, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "at least 28 HTML tokens to describe the most common complex tables observed", "bbox": {"l": 134.76501, "t": 154.7998, "r": 480.58577999999994, "b": 163.59680000000003, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "in real-world documents [21,22], due to a variety of spanning cells definitions in", "bbox": {"l": 134.76501, "t": 166.75482, "r": 480.59378, "b": 175.55182000000002, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "the HTML token vocabulary.", "bbox": {"l": 134.76501, "t": 178.70983999999999, "r": 261.92566, "b": 187.50684, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "ulary and can be interpreted as a table structure. For example, with the HTML tokens <table> , </table> , <tr> , </tr> , <td> and </td> , one can construct simple table structures without any spanning cells. In reality though, one needs at least 28 HTML tokens to describe the most common complex tables observed in real-world documents [21,22], due to a variety of spanning cells definitions in the HTML token vocabulary."}, {"label": "caption", "id": 7, "page_no": 4, "cluster": {"id": 7, "label": "caption", "bbox": {"l": 145.60701, "t": 221.07928000000004, "r": 469.75223000000005, "b": 229.21178999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.8472551703453064, "cells": [{"id": 20, "text": "Fig. 2.", "bbox": {"l": 145.60701, "t": 221.07928000000004, "r": 173.48625, "b": 229.00562000000002, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Frequency of tokens in HTML and OTSL as they appear in PubTabNet.", "bbox": {"l": 176.56001, "t": 221.14209000000005, "r": 469.75223000000005, "b": 229.21178999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Fig. 2. Frequency of tokens in HTML and OTSL as they appear in PubTabNet."}, {"label": "text", "id": 1, "page_no": 4, "cluster": {"id": 1, "label": "text", "bbox": {"l": 134.765, "t": 368.20679, "r": 480.59476, "b": 532.42059, "coord_origin": "TOPLEFT"}, "confidence": 0.9844799637794495, "cells": [{"id": 22, "text": "Obviously, HTML and other general-purpose markup languages were not de-", "bbox": {"l": 149.709, "t": 368.20679, "r": 480.59283000000005, "b": 377.00375, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "signed for Im2Seq models. As such, they have some serious drawbacks. First, the", "bbox": {"l": 134.765, "t": 380.16177, "r": 480.58664, "b": 388.9587399999999, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "token vocabulary needs to be artificially large in order to describe all plausible", "bbox": {"l": 134.765, "t": 392.11676, "r": 480.59180000000003, "b": 400.91373, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "tabular structures. Since most Im2Seq models use an autoregressive approach,", "bbox": {"l": 134.765, "t": 404.07175, "r": 480.5897499999999, "b": 412.86871, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "they generate the sequence token by token. Therefore, to reduce inference time,", "bbox": {"l": 134.765, "t": 416.02774, "r": 480.58871, "b": 424.82471, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "a shorter sequence length is critical. Every table-cell is represented by at least", "bbox": {"l": 134.765, "t": 427.98273, "r": 480.59265, "b": 436.77969, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "two tokens (", "bbox": {"l": 134.765, "t": 439.9377099999999, "r": 187.93439, "b": 448.73467999999997, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "<td>", "bbox": {"l": 187.931, "t": 439.9377099999999, "r": 211.60313, "b": 448.73467999999997, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "and", "bbox": {"l": 214.75400000000002, "t": 439.9377099999999, "r": 230.80075000000002, "b": 448.73467999999997, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "</td>", "bbox": {"l": 233.83898999999997, "t": 439.9377099999999, "r": 262.60202, "b": 448.73467999999997, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "). Furthermore, when tokenizing the HTML struc-", "bbox": {"l": 262.716, "t": 439.9377099999999, "r": 480.59009, "b": 448.73467999999997, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "ture, one needs to explicitly enumerate possible column-spans and row-spans", "bbox": {"l": 134.76501, "t": 451.8927, "r": 480.58777, "b": 460.68967, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "as words. In practice, this ends up requiring 28 different HTML tokens (when", "bbox": {"l": 134.76501, "t": 463.84769, "r": 480.58681999999993, "b": 472.64465, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "including column- and row-spans up to 10 cells) just to describe every table in", "bbox": {"l": 134.76501, "t": 475.80368, "r": 480.58681999999993, "b": 484.60065, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "the PubTabNet dataset. Clearly, not every token is equally represented, as is", "bbox": {"l": 134.76501, "t": 487.75867, "r": 480.59067, "b": 496.55563, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "depicted in Figure 2. This skewed distribution of tokens in combination with", "bbox": {"l": 134.76501, "t": 499.71365, "r": 480.59277, "b": 508.51062, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "variable token row-length makes it challenging for models to learn the HTML", "bbox": {"l": 134.76501, "t": 511.66864, "r": 480.59476, "b": 520.46561, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "structure.", "bbox": {"l": 134.76501, "t": 523.62363, "r": 176.92873, "b": 532.42059, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Obviously, HTML and other general-purpose markup languages were not designed for Im2Seq models. As such, they have some serious drawbacks. First, the token vocabulary needs to be artificially large in order to describe all plausible tabular structures. Since most Im2Seq models use an autoregressive approach, they generate the sequence token by token. Therefore, to reduce inference time, a shorter sequence length is critical. Every table-cell is represented by at least two tokens ( <td> and </td> ). Furthermore, when tokenizing the HTML structure, one needs to explicitly enumerate possible column-spans and row-spans as words. In practice, this ends up requiring 28 different HTML tokens (when including column- and row-spans up to 10 cells) just to describe every table in the PubTabNet dataset. Clearly, not every token is equally represented, as is depicted in Figure 2. This skewed distribution of tokens in combination with variable token row-length makes it challenging for models to learn the HTML structure."}, {"label": "text", "id": 3, "page_no": 4, "cluster": {"id": 3, "label": "text", "bbox": {"l": 134.76501, "t": 536.04263, "r": 480.59289999999993, "b": 580.7056, "coord_origin": "TOPLEFT"}, "confidence": 0.978394627571106, "cells": [{"id": 40, "text": "Additionally, it would be desirable if the representation would easily allow", "bbox": {"l": 149.70901, "t": 536.04263, "r": 480.59289999999993, "b": 544.8396, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "an early detection of invalid sequences on-the-go, before the prediction of the", "bbox": {"l": 134.76501, "t": 547.99763, "r": 480.59085, "b": 556.7946000000001, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "entire table structure is completed. HTML is not well-suited for this purpose as", "bbox": {"l": 134.76501, "t": 559.95264, "r": 480.58984, "b": 568.7496, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "the verification of incomplete sequences is non-trivial or even impossible.", "bbox": {"l": 134.76501, "t": 571.90863, "r": 452.18933, "b": 580.7056, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Additionally, it would be desirable if the representation would easily allow an early detection of invalid sequences on-the-go, before the prediction of the entire table structure is completed. HTML is not well-suited for this purpose as the verification of incomplete sequences is non-trivial or even impossible."}, {"label": "text", "id": 2, "page_no": 4, "cluster": {"id": 2, "label": "text", "bbox": {"l": 134.76501, "t": 584.32663, "r": 480.59473, "b": 664.85461, "coord_origin": "TOPLEFT"}, "confidence": 0.9838283061981201, "cells": [{"id": 44, "text": "In a valid HTML table, the token sequence must describe a 2D grid of table", "bbox": {"l": 149.70901, "t": 584.32663, "r": 480.59283000000005, "b": 593.1236, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "cells, serialised in row-major ordering, where each row and each column have", "bbox": {"l": 134.76501, "t": 596.28262, "r": 480.58978, "b": 605.07959, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "the same length (while considering row- and column-spans). Furthermore, every", "bbox": {"l": 134.76501, "t": 608.23763, "r": 480.5936899999999, "b": 617.03459, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "opening tag in HTML needs to be matched by a closing tag in a correct hierar-", "bbox": {"l": 134.76501, "t": 620.19263, "r": 480.59091, "b": 628.98959, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "chical manner. Since the number of tokens for each table row and column can", "bbox": {"l": 134.76501, "t": 632.1476299999999, "r": 480.58582, "b": 640.9446, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "vary significantly, especially for large tables with many row- and column-spans,", "bbox": {"l": 134.76501, "t": 644.10263, "r": 480.59180000000003, "b": 652.8996, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "it is complex to verify the consistency of predicted structures during sequence", "bbox": {"l": 134.76501, "t": 656.05763, "r": 480.59473, "b": 664.85461, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In a valid HTML table, the token sequence must describe a 2D grid of table cells, serialised in row-major ordering, where each row and each column have the same length (while considering row- and column-spans). Furthermore, every opening tag in HTML needs to be matched by a closing tag in a correct hierarchical manner. Since the number of tokens for each table row and column can vary significantly, especially for large tables with many row- and column-spans, it is complex to verify the consistency of predicted structures during sequence"}, {"label": "picture", "id": 4, "page_no": 4, "cluster": {"id": 4, "label": "picture", "bbox": {"l": 137.41448974609375, "t": 233.51231384277344, "r": 476.5608215332031, "b": 340.2304992675781, "coord_origin": "TOPLEFT"}, "confidence": 0.9387977123260498, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "headers": [{"label": "page_header", "id": 5, "page_no": 4, "cluster": {"id": 5, "label": "page_header", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9269194602966309, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Optimized Table Tokenization for Table Structure Recognition"}, {"label": "page_header", "id": 6, "page_no": 4, "cluster": {"id": 6, "label": "page_header", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8696112036705017, "cells": [{"id": 1, "text": "5", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5"}]}}, {"page_no": 5, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "6", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "M.", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 178.07675, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37415, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "generation. Implicitly, this also means that Im2Seq models need to learn these", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.59479, "b": 127.73077, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "complex syntax rules, simply to deliver valid output.", "bbox": {"l": 134.765, "t": 130.88878999999997, "r": 364.62503, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "In practice, we observe two major issues with prediction quality when train-", "bbox": {"l": 149.709, "t": 143.48279000000002, "r": 480.58981, "b": 152.27979000000005, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "ing Im2Seq models on HTML table structure generation from images. On the", "bbox": {"l": 134.765, "t": 155.43781, "r": 480.59378, "b": 164.23479999999995, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "one hand, we find that on large tables, the visual attention of the model often", "bbox": {"l": 134.765, "t": 167.39282000000003, "r": 480.5867, "b": 176.18982000000005, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "starts to drift and is not accurately moving forward cell by cell anymore. This", "bbox": {"l": 134.765, "t": 179.34784000000002, "r": 480.59476, "b": 188.14484000000004, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "manifests itself in either in an increasing", "bbox": {"l": 134.765, "t": 191.30286, "r": 314.27805, "b": 200.09984999999995, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "location drift", "bbox": {"l": 318.056, "t": 191.30286, "r": 374.08664, "b": 200.09984999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "for proposed table-cells", "bbox": {"l": 378.80899, "t": 191.30286, "r": 480.58594, "b": 200.09984999999995, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "in later rows on the same column or even complete loss of vertical alignment, as", "bbox": {"l": 134.76498, "t": 203.25885000000005, "r": 480.58771, "b": 212.05584999999996, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "illustrated in Figure 5. Addressing this with post-processing is partially possible,", "bbox": {"l": 134.76498, "t": 215.21387000000004, "r": 480.59569999999997, "b": 224.01085999999998, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "but clearly undesired. On the other hand, we find many instances of predictions", "bbox": {"l": 134.76498, "t": 227.16887999999994, "r": 480.59454, "b": 235.96587999999997, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "with structural inconsistencies or plain invalid HTML output, as shown in Fig-", "bbox": {"l": 134.76498, "t": 239.12390000000005, "r": 480.58759000000003, "b": 247.92089999999996, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "ure 6, which are nearly impossible to properly correct. Both problems seriously", "bbox": {"l": 134.76498, "t": 251.07892000000004, "r": 480.59277, "b": 259.87591999999995, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "impact the TSR model performance, since they reflect not only in the task of", "bbox": {"l": 134.76498, "t": 263.03394000000003, "r": 480.59463999999997, "b": 271.83092999999997, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "pure structure recognition but also in the equally crucial recognition or matching", "bbox": {"l": 134.76498, "t": 274.98992999999996, "r": 480.58978, "b": 283.78693, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "of table cell content.", "bbox": {"l": 134.76498, "t": 286.94495, "r": 223.57262, "b": 295.74191, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "4", "bbox": {"l": 134.76498, "t": 320.6311, "r": 141.48859, "b": 331.19949, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Optimised Table Structure Language", "bbox": {"l": 154.93819, "t": 320.6311, "r": 372.50848, "b": 331.19949, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "To mitigate the issues with HTML in Im2Seq-based TSR models laid out before,", "bbox": {"l": 134.76498, "t": 349.11697, "r": 480.59075999999993, "b": 357.91394, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "we propose here our Optimised Table Structure Language (OTSL). OTSL is", "bbox": {"l": 134.76498, "t": 361.07196000000005, "r": 480.58875, "b": 369.86893, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "designed to express table structure with a minimized vocabulary and a simple", "bbox": {"l": 134.76498, "t": 373.02795, "r": 480.58681999999993, "b": 381.82492, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "set of rules, which are both significantly reduced compared to HTML. At the", "bbox": {"l": 134.76498, "t": 384.98294, "r": 480.58875, "b": 393.77991, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "same time, OTSL enables easy error detection and correction during sequence", "bbox": {"l": 134.76498, "t": 396.93793, "r": 480.58978, "b": 405.73489, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "generation. We further demonstrate how the compact structure representation", "bbox": {"l": 134.76498, "t": 408.89291, "r": 480.59473, "b": 417.68988, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "and minimized sequence length improves prediction accuracy and inference time", "bbox": {"l": 134.76498, "t": 420.8479, "r": 480.58868, "b": 429.64487, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "in the TableFormer architecture.", "bbox": {"l": 134.76498, "t": 432.80289, "r": 276.67325, "b": 441.59985, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "4.1", "bbox": {"l": 134.76498, "t": 465.87192, "r": 149.40204, "b": 474.67886, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Language Definition", "bbox": {"l": 160.85902, "t": 465.87192, "r": 261.80109, "b": 474.67886, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "In Figure 3, we illustrate how the OTSL is defined. In essence, the OTSL defines", "bbox": {"l": 134.76498, "t": 488.99789, "r": 480.58871, "b": 497.79486, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "only 5 tokens that directly describe a tabular structure based on an atomic 2D", "bbox": {"l": 134.76498, "t": 500.95288, "r": 480.5867, "b": 509.74985, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "grid.", "bbox": {"l": 134.76498, "t": 512.90887, "r": 154.7131, "b": 521.7058400000001, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "The OTSL vocabulary is comprised of the following tokens:", "bbox": {"l": 149.70898, "t": 525.5018600000001, "r": 409.31137, "b": 534.29883, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "-", "bbox": {"l": 140.99298, "t": 547.96989, "r": 146.72047, "b": 556.77682, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "\"C\" cell -", "bbox": {"l": 151.70099, "t": 547.97986, "r": 193.20619, "b": 556.77682, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "a new table cell", "bbox": {"l": 196.52199, "t": 547.97986, "r": 263.46564, "b": 556.77682, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "that either has or does not have cell content", "bbox": {"l": 267.815, "t": 547.97986, "r": 460.54443, "b": 556.77682, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "-", "bbox": {"l": 140.99301, "t": 560.5629, "r": 146.7205, "b": 569.36983, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "\"L\" cell -", "bbox": {"l": 151.70102, "t": 560.57286, "r": 194.30011, "b": 569.36983, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "left-looking cell", "bbox": {"l": 198.65903, "t": 560.57286, "r": 264.51779, "b": 569.36983, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": ", merging with the left neighbor cell to create a", "bbox": {"l": 264.51804, "t": 560.57286, "r": 480.59392999999994, "b": 569.36983, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "span", "bbox": {"l": 151.70103, "t": 572.52786, "r": 171.67604, "b": 581.32483, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "-", "bbox": {"l": 140.99304, "t": 585.11189, "r": 146.72054, "b": 593.91882, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "\"U\" cell -", "bbox": {"l": 151.70105, "t": 585.12186, "r": 194.11086, "b": 593.91882, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "up-looking cell", "bbox": {"l": 197.74805, "t": 585.12186, "r": 259.89474, "b": 593.91882, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": ", merging with the upper neighbor cell to create a", "bbox": {"l": 259.89206, "t": 585.12186, "r": 480.58856, "b": 593.91882, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "span", "bbox": {"l": 151.70105, "t": 597.07686, "r": 171.67606, "b": 605.87383, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "-", "bbox": {"l": 140.99304, "t": 609.6599, "r": 146.72054, "b": 618.46683, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "\"X\" cell -", "bbox": {"l": 151.70105, "t": 609.66986, "r": 193.48323, "b": 618.46683, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "cross cell", "bbox": {"l": 196.79904, "t": 609.66986, "r": 236.12042, "b": 618.46683, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": ", to merge with both left and upper neighbor cells", "bbox": {"l": 236.12505, "t": 609.66986, "r": 454.55496, "b": 618.46683, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "-", "bbox": {"l": 140.99304, "t": 622.2538900000001, "r": 146.72054, "b": 631.06082, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "\"NL\" -", "bbox": {"l": 151.70105, "t": 622.26385, "r": 181.99434, "b": 631.06082, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "new-line", "bbox": {"l": 185.31705, "t": 622.26385, "r": 221.46236, "b": 631.06082, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": ", switch to the next row.", "bbox": {"l": 221.46104, "t": 622.26385, "r": 328.61676, "b": 631.06082, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "A notable attribute of OTSL is that it has the capability of achieving lossless", "bbox": {"l": 149.70905, "t": 644.10286, "r": 480.59280000000007, "b": 652.8998300000001, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "conversion to HTML.", "bbox": {"l": 134.76505, "t": 656.05786, "r": 228.22321, "b": 664.85484, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 14, "label": "page_header", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8378868699073792, "cells": [{"id": 0, "text": "6", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "page_header", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8919177651405334, "cells": [{"id": 1, "text": "M.", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 178.07675, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37415, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.59479, "b": 139.68579, "coord_origin": "TOPLEFT"}, "confidence": 0.9633480906486511, "cells": [{"id": 3, "text": "generation. Implicitly, this also means that Im2Seq models need to learn these", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.59479, "b": 127.73077, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "complex syntax rules, simply to deliver valid output.", "bbox": {"l": 134.765, "t": 130.88878999999997, "r": 364.62503, "b": 139.68579, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 134.76498, "t": 143.48279000000002, "r": 480.59569999999997, "b": 295.74191, "coord_origin": "TOPLEFT"}, "confidence": 0.9856827855110168, "cells": [{"id": 5, "text": "In practice, we observe two major issues with prediction quality when train-", "bbox": {"l": 149.709, "t": 143.48279000000002, "r": 480.58981, "b": 152.27979000000005, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "ing Im2Seq models on HTML table structure generation from images. On the", "bbox": {"l": 134.765, "t": 155.43781, "r": 480.59378, "b": 164.23479999999995, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "one hand, we find that on large tables, the visual attention of the model often", "bbox": {"l": 134.765, "t": 167.39282000000003, "r": 480.5867, "b": 176.18982000000005, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "starts to drift and is not accurately moving forward cell by cell anymore. This", "bbox": {"l": 134.765, "t": 179.34784000000002, "r": 480.59476, "b": 188.14484000000004, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "manifests itself in either in an increasing", "bbox": {"l": 134.765, "t": 191.30286, "r": 314.27805, "b": 200.09984999999995, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "location drift", "bbox": {"l": 318.056, "t": 191.30286, "r": 374.08664, "b": 200.09984999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "for proposed table-cells", "bbox": {"l": 378.80899, "t": 191.30286, "r": 480.58594, "b": 200.09984999999995, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "in later rows on the same column or even complete loss of vertical alignment, as", "bbox": {"l": 134.76498, "t": 203.25885000000005, "r": 480.58771, "b": 212.05584999999996, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "illustrated in Figure 5. Addressing this with post-processing is partially possible,", "bbox": {"l": 134.76498, "t": 215.21387000000004, "r": 480.59569999999997, "b": 224.01085999999998, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "but clearly undesired. On the other hand, we find many instances of predictions", "bbox": {"l": 134.76498, "t": 227.16887999999994, "r": 480.59454, "b": 235.96587999999997, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "with structural inconsistencies or plain invalid HTML output, as shown in Fig-", "bbox": {"l": 134.76498, "t": 239.12390000000005, "r": 480.58759000000003, "b": 247.92089999999996, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "ure 6, which are nearly impossible to properly correct. Both problems seriously", "bbox": {"l": 134.76498, "t": 251.07892000000004, "r": 480.59277, "b": 259.87591999999995, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "impact the TSR model performance, since they reflect not only in the task of", "bbox": {"l": 134.76498, "t": 263.03394000000003, "r": 480.59463999999997, "b": 271.83092999999997, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "pure structure recognition but also in the equally crucial recognition or matching", "bbox": {"l": 134.76498, "t": 274.98992999999996, "r": 480.58978, "b": 283.78693, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "of table cell content.", "bbox": {"l": 134.76498, "t": 286.94495, "r": 223.57262, "b": 295.74191, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "section_header", "bbox": {"l": 134.76498, "t": 320.6311, "r": 372.50848, "b": 331.19949, "coord_origin": "TOPLEFT"}, "confidence": 0.957028865814209, "cells": [{"id": 20, "text": "4", "bbox": {"l": 134.76498, "t": 320.6311, "r": 141.48859, "b": 331.19949, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Optimised Table Structure Language", "bbox": {"l": 154.93819, "t": 320.6311, "r": 372.50848, "b": 331.19949, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 134.76498, "t": 349.11697, "r": 480.59473, "b": 441.59985, "coord_origin": "TOPLEFT"}, "confidence": 0.9879323840141296, "cells": [{"id": 22, "text": "To mitigate the issues with HTML in Im2Seq-based TSR models laid out before,", "bbox": {"l": 134.76498, "t": 349.11697, "r": 480.59075999999993, "b": 357.91394, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "we propose here our Optimised Table Structure Language (OTSL). OTSL is", "bbox": {"l": 134.76498, "t": 361.07196000000005, "r": 480.58875, "b": 369.86893, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "designed to express table structure with a minimized vocabulary and a simple", "bbox": {"l": 134.76498, "t": 373.02795, "r": 480.58681999999993, "b": 381.82492, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "set of rules, which are both significantly reduced compared to HTML. At the", "bbox": {"l": 134.76498, "t": 384.98294, "r": 480.58875, "b": 393.77991, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "same time, OTSL enables easy error detection and correction during sequence", "bbox": {"l": 134.76498, "t": 396.93793, "r": 480.58978, "b": 405.73489, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "generation. We further demonstrate how the compact structure representation", "bbox": {"l": 134.76498, "t": 408.89291, "r": 480.59473, "b": 417.68988, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "and minimized sequence length improves prediction accuracy and inference time", "bbox": {"l": 134.76498, "t": 420.8479, "r": 480.58868, "b": 429.64487, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "in the TableFormer architecture.", "bbox": {"l": 134.76498, "t": 432.80289, "r": 276.67325, "b": 441.59985, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "section_header", "bbox": {"l": 134.76498, "t": 465.87192, "r": 261.80109, "b": 474.67886, "coord_origin": "TOPLEFT"}, "confidence": 0.9559652209281921, "cells": [{"id": 30, "text": "4.1", "bbox": {"l": 134.76498, "t": 465.87192, "r": 149.40204, "b": 474.67886, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Language Definition", "bbox": {"l": 160.85902, "t": 465.87192, "r": 261.80109, "b": 474.67886, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 134.76498, "t": 488.99789, "r": 480.58871, "b": 521.7058400000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9671263098716736, "cells": [{"id": 32, "text": "In Figure 3, we illustrate how the OTSL is defined. In essence, the OTSL defines", "bbox": {"l": 134.76498, "t": 488.99789, "r": 480.58871, "b": 497.79486, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "only 5 tokens that directly describe a tabular structure based on an atomic 2D", "bbox": {"l": 134.76498, "t": 500.95288, "r": 480.5867, "b": 509.74985, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "grid.", "bbox": {"l": 134.76498, "t": 512.90887, "r": 154.7131, "b": 521.7058400000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 149.70898, "t": 525.5018600000001, "r": 409.31137, "b": 534.29883, "coord_origin": "TOPLEFT"}, "confidence": 0.8555866479873657, "cells": [{"id": 35, "text": "The OTSL vocabulary is comprised of the following tokens:", "bbox": {"l": 149.70898, "t": 525.5018600000001, "r": 409.31137, "b": 534.29883, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "list_item", "bbox": {"l": 140.99298, "t": 547.96989, "r": 460.54443, "b": 556.77682, "coord_origin": "TOPLEFT"}, "confidence": 0.9184334874153137, "cells": [{"id": 36, "text": "-", "bbox": {"l": 140.99298, "t": 547.96989, "r": 146.72047, "b": 556.77682, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "\"C\" cell -", "bbox": {"l": 151.70099, "t": 547.97986, "r": 193.20619, "b": 556.77682, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "a new table cell", "bbox": {"l": 196.52199, "t": 547.97986, "r": 263.46564, "b": 556.77682, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "that either has or does not have cell content", "bbox": {"l": 267.815, "t": 547.97986, "r": 460.54443, "b": 556.77682, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "list_item", "bbox": {"l": 140.99301, "t": 560.5629, "r": 480.59392999999994, "b": 581.32483, "coord_origin": "TOPLEFT"}, "confidence": 0.9319931268692017, "cells": [{"id": 40, "text": "-", "bbox": {"l": 140.99301, "t": 560.5629, "r": 146.7205, "b": 569.36983, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "\"L\" cell -", "bbox": {"l": 151.70102, "t": 560.57286, "r": 194.30011, "b": 569.36983, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "left-looking cell", "bbox": {"l": 198.65903, "t": 560.57286, "r": 264.51779, "b": 569.36983, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": ", merging with the left neighbor cell to create a", "bbox": {"l": 264.51804, "t": 560.57286, "r": 480.59392999999994, "b": 569.36983, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "span", "bbox": {"l": 151.70103, "t": 572.52786, "r": 171.67604, "b": 581.32483, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "list_item", "bbox": {"l": 140.99304, "t": 585.11189, "r": 480.58856, "b": 605.87383, "coord_origin": "TOPLEFT"}, "confidence": 0.9438967704772949, "cells": [{"id": 45, "text": "-", "bbox": {"l": 140.99304, "t": 585.11189, "r": 146.72054, "b": 593.91882, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "\"U\" cell -", "bbox": {"l": 151.70105, "t": 585.12186, "r": 194.11086, "b": 593.91882, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "up-looking cell", "bbox": {"l": 197.74805, "t": 585.12186, "r": 259.89474, "b": 593.91882, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": ", merging with the upper neighbor cell to create a", "bbox": {"l": 259.89206, "t": 585.12186, "r": 480.58856, "b": 593.91882, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "span", "bbox": {"l": 151.70105, "t": 597.07686, "r": 171.67606, "b": 605.87383, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "list_item", "bbox": {"l": 140.99304, "t": 609.6599, "r": 454.55496, "b": 618.46683, "coord_origin": "TOPLEFT"}, "confidence": 0.9036387801170349, "cells": [{"id": 50, "text": "-", "bbox": {"l": 140.99304, "t": 609.6599, "r": 146.72054, "b": 618.46683, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "\"X\" cell -", "bbox": {"l": 151.70105, "t": 609.66986, "r": 193.48323, "b": 618.46683, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "cross cell", "bbox": {"l": 196.79904, "t": 609.66986, "r": 236.12042, "b": 618.46683, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": ", to merge with both left and upper neighbor cells", "bbox": {"l": 236.12505, "t": 609.66986, "r": 454.55496, "b": 618.46683, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "list_item", "bbox": {"l": 140.99304, "t": 622.2538900000001, "r": 328.61676, "b": 631.06082, "coord_origin": "TOPLEFT"}, "confidence": 0.8636871576309204, "cells": [{"id": 54, "text": "-", "bbox": {"l": 140.99304, "t": 622.2538900000001, "r": 146.72054, "b": 631.06082, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "\"NL\" -", "bbox": {"l": 151.70105, "t": 622.26385, "r": 181.99434, "b": 631.06082, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "new-line", "bbox": {"l": 185.31705, "t": 622.26385, "r": 221.46236, "b": 631.06082, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": ", switch to the next row.", "bbox": {"l": 221.46104, "t": 622.26385, "r": 328.61676, "b": 631.06082, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "text", "bbox": {"l": 134.76505, "t": 644.10286, "r": 480.59280000000007, "b": 664.85484, "coord_origin": "TOPLEFT"}, "confidence": 0.9443338513374329, "cells": [{"id": 58, "text": "A notable attribute of OTSL is that it has the capability of achieving lossless", "bbox": {"l": 149.70905, "t": 644.10286, "r": 480.59280000000007, "b": 652.8998300000001, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "conversion to HTML.", "bbox": {"l": 134.76505, "t": 656.05786, "r": 228.22321, "b": 664.85484, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_header", "id": 14, "page_no": 5, "cluster": {"id": 14, "label": "page_header", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8378868699073792, "cells": [{"id": 0, "text": "6", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "6"}, {"label": "page_header", "id": 11, "page_no": 5, "cluster": {"id": 11, "label": "page_header", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8919177651405334, "cells": [{"id": 1, "text": "M.", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 178.07675, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37415, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "M. Lysak, et al."}, {"label": "text", "id": 3, "page_no": 5, "cluster": {"id": 3, "label": "text", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.59479, "b": 139.68579, "coord_origin": "TOPLEFT"}, "confidence": 0.9633480906486511, "cells": [{"id": 3, "text": "generation. Implicitly, this also means that Im2Seq models need to learn these", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.59479, "b": 127.73077, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "complex syntax rules, simply to deliver valid output.", "bbox": {"l": 134.765, "t": 130.88878999999997, "r": 364.62503, "b": 139.68579, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "generation. Implicitly, this also means that Im2Seq models need to learn these complex syntax rules, simply to deliver valid output."}, {"label": "text", "id": 1, "page_no": 5, "cluster": {"id": 1, "label": "text", "bbox": {"l": 134.76498, "t": 143.48279000000002, "r": 480.59569999999997, "b": 295.74191, "coord_origin": "TOPLEFT"}, "confidence": 0.9856827855110168, "cells": [{"id": 5, "text": "In practice, we observe two major issues with prediction quality when train-", "bbox": {"l": 149.709, "t": 143.48279000000002, "r": 480.58981, "b": 152.27979000000005, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "ing Im2Seq models on HTML table structure generation from images. On the", "bbox": {"l": 134.765, "t": 155.43781, "r": 480.59378, "b": 164.23479999999995, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "one hand, we find that on large tables, the visual attention of the model often", "bbox": {"l": 134.765, "t": 167.39282000000003, "r": 480.5867, "b": 176.18982000000005, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "starts to drift and is not accurately moving forward cell by cell anymore. This", "bbox": {"l": 134.765, "t": 179.34784000000002, "r": 480.59476, "b": 188.14484000000004, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "manifests itself in either in an increasing", "bbox": {"l": 134.765, "t": 191.30286, "r": 314.27805, "b": 200.09984999999995, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "location drift", "bbox": {"l": 318.056, "t": 191.30286, "r": 374.08664, "b": 200.09984999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "for proposed table-cells", "bbox": {"l": 378.80899, "t": 191.30286, "r": 480.58594, "b": 200.09984999999995, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "in later rows on the same column or even complete loss of vertical alignment, as", "bbox": {"l": 134.76498, "t": 203.25885000000005, "r": 480.58771, "b": 212.05584999999996, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "illustrated in Figure 5. Addressing this with post-processing is partially possible,", "bbox": {"l": 134.76498, "t": 215.21387000000004, "r": 480.59569999999997, "b": 224.01085999999998, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "but clearly undesired. On the other hand, we find many instances of predictions", "bbox": {"l": 134.76498, "t": 227.16887999999994, "r": 480.59454, "b": 235.96587999999997, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "with structural inconsistencies or plain invalid HTML output, as shown in Fig-", "bbox": {"l": 134.76498, "t": 239.12390000000005, "r": 480.58759000000003, "b": 247.92089999999996, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "ure 6, which are nearly impossible to properly correct. Both problems seriously", "bbox": {"l": 134.76498, "t": 251.07892000000004, "r": 480.59277, "b": 259.87591999999995, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "impact the TSR model performance, since they reflect not only in the task of", "bbox": {"l": 134.76498, "t": 263.03394000000003, "r": 480.59463999999997, "b": 271.83092999999997, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "pure structure recognition but also in the equally crucial recognition or matching", "bbox": {"l": 134.76498, "t": 274.98992999999996, "r": 480.58978, "b": 283.78693, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "of table cell content.", "bbox": {"l": 134.76498, "t": 286.94495, "r": 223.57262, "b": 295.74191, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In practice, we observe two major issues with prediction quality when training Im2Seq models on HTML table structure generation from images. On the one hand, we find that on large tables, the visual attention of the model often starts to drift and is not accurately moving forward cell by cell anymore. This manifests itself in either in an increasing location drift for proposed table-cells in later rows on the same column or even complete loss of vertical alignment, as illustrated in Figure 5. Addressing this with post-processing is partially possible, but clearly undesired. On the other hand, we find many instances of predictions with structural inconsistencies or plain invalid HTML output, as shown in Figure 6, which are nearly impossible to properly correct. Both problems seriously impact the TSR model performance, since they reflect not only in the task of pure structure recognition but also in the equally crucial recognition or matching of table cell content."}, {"label": "section_header", "id": 4, "page_no": 5, "cluster": {"id": 4, "label": "section_header", "bbox": {"l": 134.76498, "t": 320.6311, "r": 372.50848, "b": 331.19949, "coord_origin": "TOPLEFT"}, "confidence": 0.957028865814209, "cells": [{"id": 20, "text": "4", "bbox": {"l": 134.76498, "t": 320.6311, "r": 141.48859, "b": 331.19949, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Optimised Table Structure Language", "bbox": {"l": 154.93819, "t": 320.6311, "r": 372.50848, "b": 331.19949, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4 Optimised Table Structure Language"}, {"label": "text", "id": 0, "page_no": 5, "cluster": {"id": 0, "label": "text", "bbox": {"l": 134.76498, "t": 349.11697, "r": 480.59473, "b": 441.59985, "coord_origin": "TOPLEFT"}, "confidence": 0.9879323840141296, "cells": [{"id": 22, "text": "To mitigate the issues with HTML in Im2Seq-based TSR models laid out before,", "bbox": {"l": 134.76498, "t": 349.11697, "r": 480.59075999999993, "b": 357.91394, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "we propose here our Optimised Table Structure Language (OTSL). OTSL is", "bbox": {"l": 134.76498, "t": 361.07196000000005, "r": 480.58875, "b": 369.86893, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "designed to express table structure with a minimized vocabulary and a simple", "bbox": {"l": 134.76498, "t": 373.02795, "r": 480.58681999999993, "b": 381.82492, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "set of rules, which are both significantly reduced compared to HTML. At the", "bbox": {"l": 134.76498, "t": 384.98294, "r": 480.58875, "b": 393.77991, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "same time, OTSL enables easy error detection and correction during sequence", "bbox": {"l": 134.76498, "t": 396.93793, "r": 480.58978, "b": 405.73489, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "generation. We further demonstrate how the compact structure representation", "bbox": {"l": 134.76498, "t": 408.89291, "r": 480.59473, "b": 417.68988, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "and minimized sequence length improves prediction accuracy and inference time", "bbox": {"l": 134.76498, "t": 420.8479, "r": 480.58868, "b": 429.64487, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "in the TableFormer architecture.", "bbox": {"l": 134.76498, "t": 432.80289, "r": 276.67325, "b": 441.59985, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "To mitigate the issues with HTML in Im2Seq-based TSR models laid out before, we propose here our Optimised Table Structure Language (OTSL). OTSL is designed to express table structure with a minimized vocabulary and a simple set of rules, which are both significantly reduced compared to HTML. At the same time, OTSL enables easy error detection and correction during sequence generation. We further demonstrate how the compact structure representation and minimized sequence length improves prediction accuracy and inference time in the TableFormer architecture."}, {"label": "section_header", "id": 5, "page_no": 5, "cluster": {"id": 5, "label": "section_header", "bbox": {"l": 134.76498, "t": 465.87192, "r": 261.80109, "b": 474.67886, "coord_origin": "TOPLEFT"}, "confidence": 0.9559652209281921, "cells": [{"id": 30, "text": "4.1", "bbox": {"l": 134.76498, "t": 465.87192, "r": 149.40204, "b": 474.67886, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Language Definition", "bbox": {"l": 160.85902, "t": 465.87192, "r": 261.80109, "b": 474.67886, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4.1 Language Definition"}, {"label": "text", "id": 2, "page_no": 5, "cluster": {"id": 2, "label": "text", "bbox": {"l": 134.76498, "t": 488.99789, "r": 480.58871, "b": 521.7058400000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9671263098716736, "cells": [{"id": 32, "text": "In Figure 3, we illustrate how the OTSL is defined. In essence, the OTSL defines", "bbox": {"l": 134.76498, "t": 488.99789, "r": 480.58871, "b": 497.79486, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "only 5 tokens that directly describe a tabular structure based on an atomic 2D", "bbox": {"l": 134.76498, "t": 500.95288, "r": 480.5867, "b": 509.74985, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "grid.", "bbox": {"l": 134.76498, "t": 512.90887, "r": 154.7131, "b": 521.7058400000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In Figure 3, we illustrate how the OTSL is defined. In essence, the OTSL defines only 5 tokens that directly describe a tabular structure based on an atomic 2D grid."}, {"label": "text", "id": 13, "page_no": 5, "cluster": {"id": 13, "label": "text", "bbox": {"l": 149.70898, "t": 525.5018600000001, "r": 409.31137, "b": 534.29883, "coord_origin": "TOPLEFT"}, "confidence": 0.8555866479873657, "cells": [{"id": 35, "text": "The OTSL vocabulary is comprised of the following tokens:", "bbox": {"l": 149.70898, "t": 525.5018600000001, "r": 409.31137, "b": 534.29883, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The OTSL vocabulary is comprised of the following tokens:"}, {"label": "list_item", "id": 9, "page_no": 5, "cluster": {"id": 9, "label": "list_item", "bbox": {"l": 140.99298, "t": 547.96989, "r": 460.54443, "b": 556.77682, "coord_origin": "TOPLEFT"}, "confidence": 0.9184334874153137, "cells": [{"id": 36, "text": "-", "bbox": {"l": 140.99298, "t": 547.96989, "r": 146.72047, "b": 556.77682, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "\"C\" cell -", "bbox": {"l": 151.70099, "t": 547.97986, "r": 193.20619, "b": 556.77682, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "a new table cell", "bbox": {"l": 196.52199, "t": 547.97986, "r": 263.46564, "b": 556.77682, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "that either has or does not have cell content", "bbox": {"l": 267.815, "t": 547.97986, "r": 460.54443, "b": 556.77682, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "-\"C\" cell a new table cell that either has or does not have cell content"}, {"label": "list_item", "id": 8, "page_no": 5, "cluster": {"id": 8, "label": "list_item", "bbox": {"l": 140.99301, "t": 560.5629, "r": 480.59392999999994, "b": 581.32483, "coord_origin": "TOPLEFT"}, "confidence": 0.9319931268692017, "cells": [{"id": 40, "text": "-", "bbox": {"l": 140.99301, "t": 560.5629, "r": 146.7205, "b": 569.36983, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "\"L\" cell -", "bbox": {"l": 151.70102, "t": 560.57286, "r": 194.30011, "b": 569.36983, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "left-looking cell", "bbox": {"l": 198.65903, "t": 560.57286, "r": 264.51779, "b": 569.36983, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": ", merging with the left neighbor cell to create a", "bbox": {"l": 264.51804, "t": 560.57286, "r": 480.59392999999994, "b": 569.36983, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "span", "bbox": {"l": 151.70103, "t": 572.52786, "r": 171.67604, "b": 581.32483, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "-\"L\" cell left-looking cell , merging with the left neighbor cell to create a span"}, {"label": "list_item", "id": 7, "page_no": 5, "cluster": {"id": 7, "label": "list_item", "bbox": {"l": 140.99304, "t": 585.11189, "r": 480.58856, "b": 605.87383, "coord_origin": "TOPLEFT"}, "confidence": 0.9438967704772949, "cells": [{"id": 45, "text": "-", "bbox": {"l": 140.99304, "t": 585.11189, "r": 146.72054, "b": 593.91882, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "\"U\" cell -", "bbox": {"l": 151.70105, "t": 585.12186, "r": 194.11086, "b": 593.91882, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "up-looking cell", "bbox": {"l": 197.74805, "t": 585.12186, "r": 259.89474, "b": 593.91882, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": ", merging with the upper neighbor cell to create a", "bbox": {"l": 259.89206, "t": 585.12186, "r": 480.58856, "b": 593.91882, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "span", "bbox": {"l": 151.70105, "t": 597.07686, "r": 171.67606, "b": 605.87383, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "-\"U\" cell up-looking cell , merging with the upper neighbor cell to create a span"}, {"label": "list_item", "id": 10, "page_no": 5, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 140.99304, "t": 609.6599, "r": 454.55496, "b": 618.46683, "coord_origin": "TOPLEFT"}, "confidence": 0.9036387801170349, "cells": [{"id": 50, "text": "-", "bbox": {"l": 140.99304, "t": 609.6599, "r": 146.72054, "b": 618.46683, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "\"X\" cell -", "bbox": {"l": 151.70105, "t": 609.66986, "r": 193.48323, "b": 618.46683, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "cross cell", "bbox": {"l": 196.79904, "t": 609.66986, "r": 236.12042, "b": 618.46683, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": ", to merge with both left and upper neighbor cells", "bbox": {"l": 236.12505, "t": 609.66986, "r": 454.55496, "b": 618.46683, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "-\"X\" cell cross cell , to merge with both left and upper neighbor cells"}, {"label": "list_item", "id": 12, "page_no": 5, "cluster": {"id": 12, "label": "list_item", "bbox": {"l": 140.99304, "t": 622.2538900000001, "r": 328.61676, "b": 631.06082, "coord_origin": "TOPLEFT"}, "confidence": 0.8636871576309204, "cells": [{"id": 54, "text": "-", "bbox": {"l": 140.99304, "t": 622.2538900000001, "r": 146.72054, "b": 631.06082, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "\"NL\" -", "bbox": {"l": 151.70105, "t": 622.26385, "r": 181.99434, "b": 631.06082, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "new-line", "bbox": {"l": 185.31705, "t": 622.26385, "r": 221.46236, "b": 631.06082, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": ", switch to the next row.", "bbox": {"l": 221.46104, "t": 622.26385, "r": 328.61676, "b": 631.06082, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "-\"NL\" new-line , switch to the next row."}, {"label": "text", "id": 6, "page_no": 5, "cluster": {"id": 6, "label": "text", "bbox": {"l": 134.76505, "t": 644.10286, "r": 480.59280000000007, "b": 664.85484, "coord_origin": "TOPLEFT"}, "confidence": 0.9443338513374329, "cells": [{"id": 58, "text": "A notable attribute of OTSL is that it has the capability of achieving lossless", "bbox": {"l": 149.70905, "t": 644.10286, "r": 480.59280000000007, "b": 652.8998300000001, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "conversion to HTML.", "bbox": {"l": 134.76505, "t": 656.05786, "r": 228.22321, "b": 664.85484, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "A notable attribute of OTSL is that it has the capability of achieving lossless conversion to HTML."}], "body": [{"label": "text", "id": 3, "page_no": 5, "cluster": {"id": 3, "label": "text", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.59479, "b": 139.68579, "coord_origin": "TOPLEFT"}, "confidence": 0.9633480906486511, "cells": [{"id": 3, "text": "generation. Implicitly, this also means that Im2Seq models need to learn these", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.59479, "b": 127.73077, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "complex syntax rules, simply to deliver valid output.", "bbox": {"l": 134.765, "t": 130.88878999999997, "r": 364.62503, "b": 139.68579, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "generation. Implicitly, this also means that Im2Seq models need to learn these complex syntax rules, simply to deliver valid output."}, {"label": "text", "id": 1, "page_no": 5, "cluster": {"id": 1, "label": "text", "bbox": {"l": 134.76498, "t": 143.48279000000002, "r": 480.59569999999997, "b": 295.74191, "coord_origin": "TOPLEFT"}, "confidence": 0.9856827855110168, "cells": [{"id": 5, "text": "In practice, we observe two major issues with prediction quality when train-", "bbox": {"l": 149.709, "t": 143.48279000000002, "r": 480.58981, "b": 152.27979000000005, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "ing Im2Seq models on HTML table structure generation from images. On the", "bbox": {"l": 134.765, "t": 155.43781, "r": 480.59378, "b": 164.23479999999995, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "one hand, we find that on large tables, the visual attention of the model often", "bbox": {"l": 134.765, "t": 167.39282000000003, "r": 480.5867, "b": 176.18982000000005, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "starts to drift and is not accurately moving forward cell by cell anymore. This", "bbox": {"l": 134.765, "t": 179.34784000000002, "r": 480.59476, "b": 188.14484000000004, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "manifests itself in either in an increasing", "bbox": {"l": 134.765, "t": 191.30286, "r": 314.27805, "b": 200.09984999999995, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "location drift", "bbox": {"l": 318.056, "t": 191.30286, "r": 374.08664, "b": 200.09984999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "for proposed table-cells", "bbox": {"l": 378.80899, "t": 191.30286, "r": 480.58594, "b": 200.09984999999995, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "in later rows on the same column or even complete loss of vertical alignment, as", "bbox": {"l": 134.76498, "t": 203.25885000000005, "r": 480.58771, "b": 212.05584999999996, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "illustrated in Figure 5. Addressing this with post-processing is partially possible,", "bbox": {"l": 134.76498, "t": 215.21387000000004, "r": 480.59569999999997, "b": 224.01085999999998, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "but clearly undesired. On the other hand, we find many instances of predictions", "bbox": {"l": 134.76498, "t": 227.16887999999994, "r": 480.59454, "b": 235.96587999999997, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "with structural inconsistencies or plain invalid HTML output, as shown in Fig-", "bbox": {"l": 134.76498, "t": 239.12390000000005, "r": 480.58759000000003, "b": 247.92089999999996, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "ure 6, which are nearly impossible to properly correct. Both problems seriously", "bbox": {"l": 134.76498, "t": 251.07892000000004, "r": 480.59277, "b": 259.87591999999995, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "impact the TSR model performance, since they reflect not only in the task of", "bbox": {"l": 134.76498, "t": 263.03394000000003, "r": 480.59463999999997, "b": 271.83092999999997, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "pure structure recognition but also in the equally crucial recognition or matching", "bbox": {"l": 134.76498, "t": 274.98992999999996, "r": 480.58978, "b": 283.78693, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "of table cell content.", "bbox": {"l": 134.76498, "t": 286.94495, "r": 223.57262, "b": 295.74191, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In practice, we observe two major issues with prediction quality when training Im2Seq models on HTML table structure generation from images. On the one hand, we find that on large tables, the visual attention of the model often starts to drift and is not accurately moving forward cell by cell anymore. This manifests itself in either in an increasing location drift for proposed table-cells in later rows on the same column or even complete loss of vertical alignment, as illustrated in Figure 5. Addressing this with post-processing is partially possible, but clearly undesired. On the other hand, we find many instances of predictions with structural inconsistencies or plain invalid HTML output, as shown in Figure 6, which are nearly impossible to properly correct. Both problems seriously impact the TSR model performance, since they reflect not only in the task of pure structure recognition but also in the equally crucial recognition or matching of table cell content."}, {"label": "section_header", "id": 4, "page_no": 5, "cluster": {"id": 4, "label": "section_header", "bbox": {"l": 134.76498, "t": 320.6311, "r": 372.50848, "b": 331.19949, "coord_origin": "TOPLEFT"}, "confidence": 0.957028865814209, "cells": [{"id": 20, "text": "4", "bbox": {"l": 134.76498, "t": 320.6311, "r": 141.48859, "b": 331.19949, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Optimised Table Structure Language", "bbox": {"l": 154.93819, "t": 320.6311, "r": 372.50848, "b": 331.19949, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4 Optimised Table Structure Language"}, {"label": "text", "id": 0, "page_no": 5, "cluster": {"id": 0, "label": "text", "bbox": {"l": 134.76498, "t": 349.11697, "r": 480.59473, "b": 441.59985, "coord_origin": "TOPLEFT"}, "confidence": 0.9879323840141296, "cells": [{"id": 22, "text": "To mitigate the issues with HTML in Im2Seq-based TSR models laid out before,", "bbox": {"l": 134.76498, "t": 349.11697, "r": 480.59075999999993, "b": 357.91394, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "we propose here our Optimised Table Structure Language (OTSL). OTSL is", "bbox": {"l": 134.76498, "t": 361.07196000000005, "r": 480.58875, "b": 369.86893, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "designed to express table structure with a minimized vocabulary and a simple", "bbox": {"l": 134.76498, "t": 373.02795, "r": 480.58681999999993, "b": 381.82492, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "set of rules, which are both significantly reduced compared to HTML. At the", "bbox": {"l": 134.76498, "t": 384.98294, "r": 480.58875, "b": 393.77991, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "same time, OTSL enables easy error detection and correction during sequence", "bbox": {"l": 134.76498, "t": 396.93793, "r": 480.58978, "b": 405.73489, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "generation. We further demonstrate how the compact structure representation", "bbox": {"l": 134.76498, "t": 408.89291, "r": 480.59473, "b": 417.68988, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "and minimized sequence length improves prediction accuracy and inference time", "bbox": {"l": 134.76498, "t": 420.8479, "r": 480.58868, "b": 429.64487, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "in the TableFormer architecture.", "bbox": {"l": 134.76498, "t": 432.80289, "r": 276.67325, "b": 441.59985, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "To mitigate the issues with HTML in Im2Seq-based TSR models laid out before, we propose here our Optimised Table Structure Language (OTSL). OTSL is designed to express table structure with a minimized vocabulary and a simple set of rules, which are both significantly reduced compared to HTML. At the same time, OTSL enables easy error detection and correction during sequence generation. We further demonstrate how the compact structure representation and minimized sequence length improves prediction accuracy and inference time in the TableFormer architecture."}, {"label": "section_header", "id": 5, "page_no": 5, "cluster": {"id": 5, "label": "section_header", "bbox": {"l": 134.76498, "t": 465.87192, "r": 261.80109, "b": 474.67886, "coord_origin": "TOPLEFT"}, "confidence": 0.9559652209281921, "cells": [{"id": 30, "text": "4.1", "bbox": {"l": 134.76498, "t": 465.87192, "r": 149.40204, "b": 474.67886, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Language Definition", "bbox": {"l": 160.85902, "t": 465.87192, "r": 261.80109, "b": 474.67886, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4.1 Language Definition"}, {"label": "text", "id": 2, "page_no": 5, "cluster": {"id": 2, "label": "text", "bbox": {"l": 134.76498, "t": 488.99789, "r": 480.58871, "b": 521.7058400000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9671263098716736, "cells": [{"id": 32, "text": "In Figure 3, we illustrate how the OTSL is defined. In essence, the OTSL defines", "bbox": {"l": 134.76498, "t": 488.99789, "r": 480.58871, "b": 497.79486, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "only 5 tokens that directly describe a tabular structure based on an atomic 2D", "bbox": {"l": 134.76498, "t": 500.95288, "r": 480.5867, "b": 509.74985, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "grid.", "bbox": {"l": 134.76498, "t": 512.90887, "r": 154.7131, "b": 521.7058400000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In Figure 3, we illustrate how the OTSL is defined. In essence, the OTSL defines only 5 tokens that directly describe a tabular structure based on an atomic 2D grid."}, {"label": "text", "id": 13, "page_no": 5, "cluster": {"id": 13, "label": "text", "bbox": {"l": 149.70898, "t": 525.5018600000001, "r": 409.31137, "b": 534.29883, "coord_origin": "TOPLEFT"}, "confidence": 0.8555866479873657, "cells": [{"id": 35, "text": "The OTSL vocabulary is comprised of the following tokens:", "bbox": {"l": 149.70898, "t": 525.5018600000001, "r": 409.31137, "b": 534.29883, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The OTSL vocabulary is comprised of the following tokens:"}, {"label": "list_item", "id": 9, "page_no": 5, "cluster": {"id": 9, "label": "list_item", "bbox": {"l": 140.99298, "t": 547.96989, "r": 460.54443, "b": 556.77682, "coord_origin": "TOPLEFT"}, "confidence": 0.9184334874153137, "cells": [{"id": 36, "text": "-", "bbox": {"l": 140.99298, "t": 547.96989, "r": 146.72047, "b": 556.77682, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "\"C\" cell -", "bbox": {"l": 151.70099, "t": 547.97986, "r": 193.20619, "b": 556.77682, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "a new table cell", "bbox": {"l": 196.52199, "t": 547.97986, "r": 263.46564, "b": 556.77682, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "that either has or does not have cell content", "bbox": {"l": 267.815, "t": 547.97986, "r": 460.54443, "b": 556.77682, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "-\"C\" cell a new table cell that either has or does not have cell content"}, {"label": "list_item", "id": 8, "page_no": 5, "cluster": {"id": 8, "label": "list_item", "bbox": {"l": 140.99301, "t": 560.5629, "r": 480.59392999999994, "b": 581.32483, "coord_origin": "TOPLEFT"}, "confidence": 0.9319931268692017, "cells": [{"id": 40, "text": "-", "bbox": {"l": 140.99301, "t": 560.5629, "r": 146.7205, "b": 569.36983, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "\"L\" cell -", "bbox": {"l": 151.70102, "t": 560.57286, "r": 194.30011, "b": 569.36983, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "left-looking cell", "bbox": {"l": 198.65903, "t": 560.57286, "r": 264.51779, "b": 569.36983, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": ", merging with the left neighbor cell to create a", "bbox": {"l": 264.51804, "t": 560.57286, "r": 480.59392999999994, "b": 569.36983, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "span", "bbox": {"l": 151.70103, "t": 572.52786, "r": 171.67604, "b": 581.32483, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "-\"L\" cell left-looking cell , merging with the left neighbor cell to create a span"}, {"label": "list_item", "id": 7, "page_no": 5, "cluster": {"id": 7, "label": "list_item", "bbox": {"l": 140.99304, "t": 585.11189, "r": 480.58856, "b": 605.87383, "coord_origin": "TOPLEFT"}, "confidence": 0.9438967704772949, "cells": [{"id": 45, "text": "-", "bbox": {"l": 140.99304, "t": 585.11189, "r": 146.72054, "b": 593.91882, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "\"U\" cell -", "bbox": {"l": 151.70105, "t": 585.12186, "r": 194.11086, "b": 593.91882, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "up-looking cell", "bbox": {"l": 197.74805, "t": 585.12186, "r": 259.89474, "b": 593.91882, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": ", merging with the upper neighbor cell to create a", "bbox": {"l": 259.89206, "t": 585.12186, "r": 480.58856, "b": 593.91882, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "span", "bbox": {"l": 151.70105, "t": 597.07686, "r": 171.67606, "b": 605.87383, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "-\"U\" cell up-looking cell , merging with the upper neighbor cell to create a span"}, {"label": "list_item", "id": 10, "page_no": 5, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 140.99304, "t": 609.6599, "r": 454.55496, "b": 618.46683, "coord_origin": "TOPLEFT"}, "confidence": 0.9036387801170349, "cells": [{"id": 50, "text": "-", "bbox": {"l": 140.99304, "t": 609.6599, "r": 146.72054, "b": 618.46683, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "\"X\" cell -", "bbox": {"l": 151.70105, "t": 609.66986, "r": 193.48323, "b": 618.46683, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "cross cell", "bbox": {"l": 196.79904, "t": 609.66986, "r": 236.12042, "b": 618.46683, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": ", to merge with both left and upper neighbor cells", "bbox": {"l": 236.12505, "t": 609.66986, "r": 454.55496, "b": 618.46683, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "-\"X\" cell cross cell , to merge with both left and upper neighbor cells"}, {"label": "list_item", "id": 12, "page_no": 5, "cluster": {"id": 12, "label": "list_item", "bbox": {"l": 140.99304, "t": 622.2538900000001, "r": 328.61676, "b": 631.06082, "coord_origin": "TOPLEFT"}, "confidence": 0.8636871576309204, "cells": [{"id": 54, "text": "-", "bbox": {"l": 140.99304, "t": 622.2538900000001, "r": 146.72054, "b": 631.06082, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "\"NL\" -", "bbox": {"l": 151.70105, "t": 622.26385, "r": 181.99434, "b": 631.06082, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "new-line", "bbox": {"l": 185.31705, "t": 622.26385, "r": 221.46236, "b": 631.06082, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": ", switch to the next row.", "bbox": {"l": 221.46104, "t": 622.26385, "r": 328.61676, "b": 631.06082, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "-\"NL\" new-line , switch to the next row."}, {"label": "text", "id": 6, "page_no": 5, "cluster": {"id": 6, "label": "text", "bbox": {"l": 134.76505, "t": 644.10286, "r": 480.59280000000007, "b": 664.85484, "coord_origin": "TOPLEFT"}, "confidence": 0.9443338513374329, "cells": [{"id": 58, "text": "A notable attribute of OTSL is that it has the capability of achieving lossless", "bbox": {"l": 149.70905, "t": 644.10286, "r": 480.59280000000007, "b": 652.8998300000001, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "conversion to HTML.", "bbox": {"l": 134.76505, "t": 656.05786, "r": 228.22321, "b": 664.85484, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "A notable attribute of OTSL is that it has the capability of achieving lossless conversion to HTML."}], "headers": [{"label": "page_header", "id": 14, "page_no": 5, "cluster": {"id": 14, "label": "page_header", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8378868699073792, "cells": [{"id": 0, "text": "6", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "6"}, {"label": "page_header", "id": 11, "page_no": 5, "cluster": {"id": 11, "label": "page_header", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8919177651405334, "cells": [{"id": 1, "text": "M.", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 178.07675, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37415, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "M. Lysak, et al."}]}}, {"page_no": 6, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "7", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Fig. 3.", "bbox": {"l": 134.765, "t": 125.79918999999984, "r": 162.64424, "b": 133.72551999999996, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "OTSL description of table structure: A - table example; B - graphical repre-", "bbox": {"l": 166.276, "t": 125.86200000000008, "r": 480.58675999999997, "b": 133.93169999999998, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "sentation of table structure; C - mapping structure on a grid; D - OTSL structure", "bbox": {"l": 134.765, "t": 136.82097999999996, "r": 480.5874, "b": 144.89068999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "encoding; E - explanation on cell encoding", "bbox": {"l": 134.765, "t": 147.77997000000005, "r": 306.1156, "b": 155.84966999999995, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "C", "bbox": {"l": 374.49326, "t": 168.59362999999996, "r": 381.66843, "b": 177.91540999999995, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "C", "bbox": {"l": 398.74011, "t": 168.50005999999996, "r": 405.91528, "b": 177.82183999999995, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "C", "bbox": {"l": 373.76862, "t": 192.92553999999996, "r": 380.94379, "b": 202.24730999999997, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "C", "bbox": {"l": 386.66388, "t": 193.07061999999996, "r": 393.83905, "b": 202.39239999999995, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "C", "bbox": {"l": 386.68707, "t": 205.13756999999998, "r": 393.86224, "b": 214.45934999999997, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "C", "bbox": {"l": 398.65729, "t": 180.73279000000002, "r": 405.83246, "b": 190.05457, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "C", "bbox": {"l": 410.77908, "t": 180.73859000000004, "r": 417.95425, "b": 190.06035999999995, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "C", "bbox": {"l": 422.90503, "t": 180.65247, "r": 430.08020000000005, "b": 189.97424, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "C", "bbox": {"l": 398.7807, "t": 192.98865, "r": 405.95587, "b": 202.31042000000002, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "C", "bbox": {"l": 410.90164, "t": 192.99487, "r": 418.07681, "b": 202.31664999999998, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "C", "bbox": {"l": 423.02753, "t": 192.909, "r": 430.2027, "b": 202.23077, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "C", "bbox": {"l": 398.78235, "t": 205.31573000000003, "r": 405.95752, "b": 214.63751000000002, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "C", "bbox": {"l": 410.90414, "t": 205.32196, "r": 418.07932, "b": 214.64373999999998, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "C", "bbox": {"l": 423.03003, "t": 205.23614999999995, "r": 430.20520000000005, "b": 214.55791999999997, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "C", "bbox": {"l": 386.50574, "t": 217.03882, "r": 393.68091, "b": 226.36059999999998, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "C", "bbox": {"l": 398.60181, "t": 217.21704, "r": 405.77698, "b": 226.53882, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "C", "bbox": {"l": 410.72275, "t": 217.22321, "r": 417.89792, "b": 226.54498, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "C", "bbox": {"l": 422.84869, "t": 217.13738999999998, "r": 430.02386, "b": 226.45916999999997, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "NL", "bbox": {"l": 435.16009999999994, "t": 167.69011999999998, "r": 447.86273, "b": 177.01189999999997, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "NL", "bbox": {"l": 435.44415, "t": 180.20025999999996, "r": 448.14679, "b": 189.52202999999997, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "NL", "bbox": {"l": 435.46735, "t": 192.49474999999995, "r": 448.16998000000007, "b": 201.81652999999994, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "NL", "bbox": {"l": 435.38202, "t": 204.83025999999995, "r": 448.08466, "b": 214.15204000000006, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "NL", "bbox": {"l": 435.59906, "t": 217.2337, "r": 448.3017, "b": 226.55548, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "U", "bbox": {"l": 374.14957, "t": 205.23492, "r": 381.32474, "b": 214.55669999999998, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "U", "bbox": {"l": 374.0419, "t": 217.14648, "r": 381.21707, "b": 226.46826, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "U", "bbox": {"l": 374.34418, "t": 180.93488000000002, "r": 381.51935, "b": 190.25665000000004, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "L", "bbox": {"l": 387.76285, "t": 168.57788000000005, "r": 393.28833, "b": 177.89966000000004, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "L", "bbox": {"l": 411.86395, "t": 168.06195000000002, "r": 417.38943, "b": 177.38373, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "L", "bbox": {"l": 423.33563, "t": 167.93439, "r": 428.86111, "b": 177.25616000000002, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "X", "bbox": {"l": 387.13593, "t": 180.78576999999996, "r": 393.76453, "b": 190.10753999999997, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "C", "bbox": {"l": 282.2594, "t": 244.50878999999998, "r": 289.43457, "b": 253.83056999999997, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "U", "bbox": {"l": 282.11035, "t": 256.85022000000004, "r": 289.28552, "b": 266.172, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "U", "bbox": {"l": 282.40848, "t": 269.13300000000004, "r": 289.58365, "b": 278.45477000000005, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "L", "bbox": {"l": 295.52902, "t": 244.49347, "r": 301.0545, "b": 253.81525, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "L", "bbox": {"l": 307.46613, "t": 244.57372999999995, "r": 312.99161, "b": 253.89550999999994, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "L", "bbox": {"l": 318.76886, "t": 244.44037000000003, "r": 324.29434, "b": 253.76215000000002, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "X", "bbox": {"l": 294.9021, "t": 256.70154, "r": 301.03976, "b": 266.02332, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "X X", "bbox": {"l": 307.17743, "t": 256.70154, "r": 325.59039, "b": 266.02332, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "X", "bbox": {"l": 294.78949, "t": 269.25420999999994, "r": 300.92715, "b": 278.57599000000005, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "X X", "bbox": {"l": 307.06482, "t": 269.25420999999994, "r": 325.47778, "b": 278.57599000000005, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "C", "bbox": {"l": 195.93939, "t": 268.74798999999996, "r": 203.11456, "b": 278.06976, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "L", "bbox": {"l": 209.20891, "t": 268.73267, "r": 214.73439, "b": 278.05444, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "L", "bbox": {"l": 221.14551, "t": 268.81293000000005, "r": 226.67099, "b": 278.13469999999995, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "L", "bbox": {"l": 232.44858, "t": 268.67957, "r": 237.97405999999998, "b": 278.00134, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "C", "bbox": {"l": 196.21715, "t": 244.53961000000004, "r": 203.39232, "b": 253.86139000000003, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "C", "bbox": {"l": 250.32143, "t": 244.09813999999994, "r": 257.49661, "b": 253.41992000000005, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "U", "bbox": {"l": 250.17235999999997, "t": 256.43951000000004, "r": 257.34753, "b": 265.76129000000003, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "U", "bbox": {"l": 250.47049000000004, "t": 268.72222999999997, "r": 257.64566, "b": 278.04400999999996, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "1", "bbox": {"l": 334.51135, "t": 242.99463000000003, "r": 337.22485, "b": 249.20911, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "- simple cells: \"C\"", "bbox": {"l": 339.93835, "t": 242.99463000000003, "r": 391.49472, "b": 249.20911, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "2", "bbox": {"l": 334.51135, "t": 252.93255999999997, "r": 337.33313, "b": 259.14703, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "- horizontal merges: \"C\", \"L\"", "bbox": {"l": 340.15491, "t": 252.93255999999997, "r": 421.98624, "b": 259.14703, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "3", "bbox": {"l": 334.51135, "t": 262.87048000000004, "r": 337.29868, "b": 269.08496, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "- vertical merges: \"C\", \"U\"", "bbox": {"l": 340.086, "t": 262.87048000000004, "r": 415.34375, "b": 269.08496, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "4", "bbox": {"l": 334.51135, "t": 272.80841, "r": 337.30188, "b": 279.02288999999996, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "- 2d merges: \"C\", \"L\", \"U\", \"X\"", "bbox": {"l": 340.09241, "t": 272.80841, "r": 426.59875, "b": 279.02288999999996, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "1", "bbox": {"l": 185.67178, "t": 244.04224, "r": 189.35544, "b": 250.25671, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "2", "bbox": {"l": 185.96759, "t": 268.34766, "r": 189.65125, "b": 274.56213, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "3", "bbox": {"l": 239.34152, "t": 243.62523999999996, "r": 243.02518, "b": 249.83972000000006, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "4", "bbox": {"l": 271.32852, "t": 243.49390000000005, "r": 275.01218, "b": 249.70836999999995, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "2", "bbox": {"l": 229.81627, "t": 166.51495, "r": 233.49992000000003, "b": 172.72942999999998, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "1", "bbox": {"l": 257.24402, "t": 189.961, "r": 260.92767, "b": 196.17548, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "3", "bbox": {"l": 186.87526, "t": 177.97668, "r": 190.55891, "b": 184.19115999999997, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "4", "bbox": {"l": 196.48746, "t": 169.01520000000005, "r": 200.17111, "b": 175.22968000000003, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "A", "bbox": {"l": 169.74728, "t": 167.88225999999997, "r": 175.72659, "b": 175.65039000000002, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "B", "bbox": {"l": 169.74728, "t": 206.83867999999995, "r": 175.72659, "b": 214.60681, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "C", "bbox": {"l": 274.29419, "t": 168.27972, "r": 280.2735, "b": 176.04785000000004, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "D", "bbox": {"l": 359.56152, "t": 168.27972, "r": 365.54083, "b": 176.04785000000004, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "E", "bbox": {"l": 169.74728, "t": 243.21149000000003, "r": 175.27112, "b": 250.97960999999998, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "4.2", "bbox": {"l": 134.765, "t": 305.29581, "r": 149.40205, "b": 314.10275, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "Language Syntax", "bbox": {"l": 160.85904, "t": 305.29581, "r": 246.65197999999998, "b": 314.10275, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "The OTSL representation follows these syntax rules:", "bbox": {"l": 134.765, "t": 325.24777, "r": 363.79617, "b": 334.04474, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "1.", "bbox": {"l": 138.97299, "t": 347.18079, "r": 146.71991, "b": 355.97775, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "Left-looking cell rule", "bbox": {"l": 151.70099, "t": 347.17081, "r": 257.37927, "b": 355.97775, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": ": The left neighbour of an \"L\" cell must be either", "bbox": {"l": 257.383, "t": 347.18079, "r": 480.58902, "b": 355.97775, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "another \"L\" cell or a \"C\" cell.", "bbox": {"l": 151.70099, "t": 359.13678, "r": 283.59387, "b": 367.93375, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "2.", "bbox": {"l": 138.97299, "t": 371.09479, "r": 146.71991, "b": 379.89175, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "Up-looking cell rule", "bbox": {"l": 151.70099, "t": 371.08481, "r": 252.11203, "b": 379.89175, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": ": The upper neighbour of a \"U\" cell must be either", "bbox": {"l": 252.112, "t": 371.09479, "r": 480.59229000000005, "b": 379.89175, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "another \"U\" cell or a \"C\" cell.", "bbox": {"l": 151.70099, "t": 383.04977, "r": 284.8392, "b": 391.84673999999995, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "3.", "bbox": {"l": 138.97299, "t": 395.0077800000001, "r": 146.71991, "b": 403.80475, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Cross cell rule", "bbox": {"l": 151.70099, "t": 394.99780000000004, "r": 223.3042, "b": 403.80475, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": ":", "bbox": {"l": 223.30699, "t": 395.0077800000001, "r": 226.07360999999997, "b": 403.80475, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "The left neighbour of an \"X\" cell must be either another \"X\" cell or a \"U\"", "bbox": {"l": 151.70099, "t": 406.96677, "r": 480.59238, "b": 415.76373, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "cell, and the upper neighbour of an \"X\" cell must be either another \"X\" cell", "bbox": {"l": 151.70099, "t": 418.9217499999999, "r": 480.59219, "b": 427.71871999999996, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "or an \"L\" cell.", "bbox": {"l": 151.70099, "t": 430.87674, "r": 214.39663999999996, "b": 439.67371, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "4.", "bbox": {"l": 138.97299, "t": 442.83572, "r": 146.71991, "b": 451.63269, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "First row rule", "bbox": {"l": 151.70099, "t": 442.82574, "r": 221.32263, "b": 451.63269, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": ": Only \"L\" cells and \"C\" cells are allowed in the first row.", "bbox": {"l": 221.32700000000003, "t": 442.83572, "r": 474.59018, "b": 451.63269, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "5.", "bbox": {"l": 138.97299, "t": 454.7937299999999, "r": 146.71991, "b": 463.5907, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "First column rule", "bbox": {"l": 151.70099, "t": 454.78375, "r": 240.71982, "b": 463.5907, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": ": Only \"U\" cells and \"C\" cells are allowed in the first", "bbox": {"l": 240.71599, "t": 454.7937299999999, "r": 480.58746, "b": 463.5907, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "column.", "bbox": {"l": 151.70099, "t": 466.74872, "r": 186.0072, "b": 475.54568, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "6.", "bbox": {"l": 138.97299, "t": 478.70673, "r": 146.71991, "b": 487.50369, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "Rectangular rule", "bbox": {"l": 151.70099, "t": 478.69675, "r": 235.15768, "b": 487.50369, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": ": The table representation is always rectangular - all rows", "bbox": {"l": 235.15697999999998, "t": 478.70673, "r": 480.59457, "b": 487.50369, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "must have an equal number of tokens, terminated with \"NL\" token.", "bbox": {"l": 151.70099, "t": 490.66272, "r": 448.04147, "b": 499.45969, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "The application of these rules gives OTSL a set of unique properties. First", "bbox": {"l": 149.70898, "t": 512.59271, "r": 480.59583, "b": 521.38968, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "of all, the OTSL enforces a strictly rectangular structure representation, where", "bbox": {"l": 134.76498, "t": 524.5477000000001, "r": 480.59079, "b": 533.34467, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "every new-line token starts a new row. As a consequence, all rows and all columns", "bbox": {"l": 134.76498, "t": 536.5027, "r": 480.59482, "b": 545.29967, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "have exactly the same number of tokens, irrespective of cell spans. Secondly, the", "bbox": {"l": 134.76498, "t": 548.4586899999999, "r": 480.58865000000003, "b": 557.25566, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "OTSL representation is unambiguous: Every table structure is represented in one", "bbox": {"l": 134.76498, "t": 560.4137000000001, "r": 480.59365999999994, "b": 569.21066, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "way. In this representation every table cell corresponds to a \"C\"-cell token, which", "bbox": {"l": 134.76498, "t": 572.3687, "r": 480.58673, "b": 581.16566, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "in case of spans is always located in the top-left corner of the table cell definition.", "bbox": {"l": 134.76498, "t": 584.3237, "r": 480.59171, "b": 593.12067, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "Third, OTSL syntax rules are only backward-looking. As a consequence, every", "bbox": {"l": 134.76498, "t": 596.2787, "r": 480.59180000000003, "b": 605.07567, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "predicted token can be validated straight during sequence generation by looking", "bbox": {"l": 134.76498, "t": 608.2347, "r": 480.5936899999999, "b": 617.03166, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "at the previously predicted sequence. As such, OTSL can guarantee that every", "bbox": {"l": 134.76498, "t": 620.1897, "r": 480.59072999999995, "b": 628.98666, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "predicted sequence is syntactically valid.", "bbox": {"l": 134.76498, "t": 632.1447000000001, "r": 311.19769, "b": 640.9416699999999, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "These characteristics can be easily learned by sequence generator networks,", "bbox": {"l": 149.70898, "t": 644.1026899999999, "r": 480.59186, "b": 652.89966, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "as we demonstrate further below. We find strong indications that this pattern", "bbox": {"l": 134.76498, "t": 656.05769, "r": 480.59265, "b": 664.8546699999999, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 7, "label": "page_header", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.932651162147522, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "page_header", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8749732375144958, "cells": [{"id": 1, "text": "7", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "caption", "bbox": {"l": 134.765, "t": 125.79918999999984, "r": 480.5874, "b": 155.84966999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9333080053329468, "cells": [{"id": 2, "text": "Fig. 3.", "bbox": {"l": 134.765, "t": 125.79918999999984, "r": 162.64424, "b": 133.72551999999996, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "OTSL description of table structure: A - table example; B - graphical repre-", "bbox": {"l": 166.276, "t": 125.86200000000008, "r": 480.58675999999997, "b": 133.93169999999998, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "sentation of table structure; C - mapping structure on a grid; D - OTSL structure", "bbox": {"l": 134.765, "t": 136.82097999999996, "r": 480.5874, "b": 144.89068999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "encoding; E - explanation on cell encoding", "bbox": {"l": 134.765, "t": 147.77997000000005, "r": 306.1156, "b": 155.84966999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "picture", "bbox": {"l": 164.65028381347656, "t": 163.79708862304688, "r": 449.5505676269531, "b": 280.3409423828125, "coord_origin": "TOPLEFT"}, "confidence": 0.7868534922599792, "cells": [{"id": 6, "text": "C", "bbox": {"l": 374.49326, "t": 168.59362999999996, "r": 381.66843, "b": 177.91540999999995, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "C", "bbox": {"l": 398.74011, "t": 168.50005999999996, "r": 405.91528, "b": 177.82183999999995, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "C", "bbox": {"l": 373.76862, "t": 192.92553999999996, "r": 380.94379, "b": 202.24730999999997, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "C", "bbox": {"l": 386.66388, "t": 193.07061999999996, "r": 393.83905, "b": 202.39239999999995, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "C", "bbox": {"l": 386.68707, "t": 205.13756999999998, "r": 393.86224, "b": 214.45934999999997, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "C", "bbox": {"l": 398.65729, "t": 180.73279000000002, "r": 405.83246, "b": 190.05457, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "C", "bbox": {"l": 410.77908, "t": 180.73859000000004, "r": 417.95425, "b": 190.06035999999995, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "C", "bbox": {"l": 422.90503, "t": 180.65247, "r": 430.08020000000005, "b": 189.97424, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "C", "bbox": {"l": 398.7807, "t": 192.98865, "r": 405.95587, "b": 202.31042000000002, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "C", "bbox": {"l": 410.90164, "t": 192.99487, "r": 418.07681, "b": 202.31664999999998, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "C", "bbox": {"l": 423.02753, "t": 192.909, "r": 430.2027, "b": 202.23077, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "C", "bbox": {"l": 398.78235, "t": 205.31573000000003, "r": 405.95752, "b": 214.63751000000002, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "C", "bbox": {"l": 410.90414, "t": 205.32196, "r": 418.07932, "b": 214.64373999999998, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "C", "bbox": {"l": 423.03003, "t": 205.23614999999995, "r": 430.20520000000005, "b": 214.55791999999997, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "C", "bbox": {"l": 386.50574, "t": 217.03882, "r": 393.68091, "b": 226.36059999999998, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "C", "bbox": {"l": 398.60181, "t": 217.21704, "r": 405.77698, "b": 226.53882, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "C", "bbox": {"l": 410.72275, "t": 217.22321, "r": 417.89792, "b": 226.54498, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "C", "bbox": {"l": 422.84869, "t": 217.13738999999998, "r": 430.02386, "b": 226.45916999999997, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "NL", "bbox": {"l": 435.16009999999994, "t": 167.69011999999998, "r": 447.86273, "b": 177.01189999999997, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "NL", "bbox": {"l": 435.44415, "t": 180.20025999999996, "r": 448.14679, "b": 189.52202999999997, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "NL", "bbox": {"l": 435.46735, "t": 192.49474999999995, "r": 448.16998000000007, "b": 201.81652999999994, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "NL", "bbox": {"l": 435.38202, "t": 204.83025999999995, "r": 448.08466, "b": 214.15204000000006, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "NL", "bbox": {"l": 435.59906, "t": 217.2337, "r": 448.3017, "b": 226.55548, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "U", "bbox": {"l": 374.14957, "t": 205.23492, "r": 381.32474, "b": 214.55669999999998, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "U", "bbox": {"l": 374.0419, "t": 217.14648, "r": 381.21707, "b": 226.46826, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "U", "bbox": {"l": 374.34418, "t": 180.93488000000002, "r": 381.51935, "b": 190.25665000000004, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "L", "bbox": {"l": 387.76285, "t": 168.57788000000005, "r": 393.28833, "b": 177.89966000000004, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "L", "bbox": {"l": 411.86395, "t": 168.06195000000002, "r": 417.38943, "b": 177.38373, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "L", "bbox": {"l": 423.33563, "t": 167.93439, "r": 428.86111, "b": 177.25616000000002, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "X", "bbox": {"l": 387.13593, "t": 180.78576999999996, "r": 393.76453, "b": 190.10753999999997, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "C", "bbox": {"l": 282.2594, "t": 244.50878999999998, "r": 289.43457, "b": 253.83056999999997, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "U", "bbox": {"l": 282.11035, "t": 256.85022000000004, "r": 289.28552, "b": 266.172, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "U", "bbox": {"l": 282.40848, "t": 269.13300000000004, "r": 289.58365, "b": 278.45477000000005, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "L", "bbox": {"l": 295.52902, "t": 244.49347, "r": 301.0545, "b": 253.81525, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "L", "bbox": {"l": 307.46613, "t": 244.57372999999995, "r": 312.99161, "b": 253.89550999999994, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "L", "bbox": {"l": 318.76886, "t": 244.44037000000003, "r": 324.29434, "b": 253.76215000000002, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "X", "bbox": {"l": 294.9021, "t": 256.70154, "r": 301.03976, "b": 266.02332, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "X X", "bbox": {"l": 307.17743, "t": 256.70154, "r": 325.59039, "b": 266.02332, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "X", "bbox": {"l": 294.78949, "t": 269.25420999999994, "r": 300.92715, "b": 278.57599000000005, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "X X", "bbox": {"l": 307.06482, "t": 269.25420999999994, "r": 325.47778, "b": 278.57599000000005, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "C", "bbox": {"l": 195.93939, "t": 268.74798999999996, "r": 203.11456, "b": 278.06976, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "L", "bbox": {"l": 209.20891, "t": 268.73267, "r": 214.73439, "b": 278.05444, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "L", "bbox": {"l": 221.14551, "t": 268.81293000000005, "r": 226.67099, "b": 278.13469999999995, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "L", "bbox": {"l": 232.44858, "t": 268.67957, "r": 237.97405999999998, "b": 278.00134, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "C", "bbox": {"l": 196.21715, "t": 244.53961000000004, "r": 203.39232, "b": 253.86139000000003, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "C", "bbox": {"l": 250.32143, "t": 244.09813999999994, "r": 257.49661, "b": 253.41992000000005, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "U", "bbox": {"l": 250.17235999999997, "t": 256.43951000000004, "r": 257.34753, "b": 265.76129000000003, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "U", "bbox": {"l": 250.47049000000004, "t": 268.72222999999997, "r": 257.64566, "b": 278.04400999999996, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "1", "bbox": {"l": 334.51135, "t": 242.99463000000003, "r": 337.22485, "b": 249.20911, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "- simple cells: \"C\"", "bbox": {"l": 339.93835, "t": 242.99463000000003, "r": 391.49472, "b": 249.20911, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "2", "bbox": {"l": 334.51135, "t": 252.93255999999997, "r": 337.33313, "b": 259.14703, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "- horizontal merges: \"C\", \"L\"", "bbox": {"l": 340.15491, "t": 252.93255999999997, "r": 421.98624, "b": 259.14703, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "3", "bbox": {"l": 334.51135, "t": 262.87048000000004, "r": 337.29868, "b": 269.08496, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "- vertical merges: \"C\", \"U\"", "bbox": {"l": 340.086, "t": 262.87048000000004, "r": 415.34375, "b": 269.08496, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "4", "bbox": {"l": 334.51135, "t": 272.80841, "r": 337.30188, "b": 279.02288999999996, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "- 2d merges: \"C\", \"L\", \"U\", \"X\"", "bbox": {"l": 340.09241, "t": 272.80841, "r": 426.59875, "b": 279.02288999999996, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "1", "bbox": {"l": 185.67178, "t": 244.04224, "r": 189.35544, "b": 250.25671, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "2", "bbox": {"l": 185.96759, "t": 268.34766, "r": 189.65125, "b": 274.56213, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "3", "bbox": {"l": 239.34152, "t": 243.62523999999996, "r": 243.02518, "b": 249.83972000000006, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "4", "bbox": {"l": 271.32852, "t": 243.49390000000005, "r": 275.01218, "b": 249.70836999999995, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "2", "bbox": {"l": 229.81627, "t": 166.51495, "r": 233.49992000000003, "b": 172.72942999999998, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "1", "bbox": {"l": 257.24402, "t": 189.961, "r": 260.92767, "b": 196.17548, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "3", "bbox": {"l": 186.87526, "t": 177.97668, "r": 190.55891, "b": 184.19115999999997, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "4", "bbox": {"l": 196.48746, "t": 169.01520000000005, "r": 200.17111, "b": 175.22968000000003, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "A", "bbox": {"l": 169.74728, "t": 167.88225999999997, "r": 175.72659, "b": 175.65039000000002, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "B", "bbox": {"l": 169.74728, "t": 206.83867999999995, "r": 175.72659, "b": 214.60681, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "C", "bbox": {"l": 274.29419, "t": 168.27972, "r": 280.2735, "b": 176.04785000000004, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "D", "bbox": {"l": 359.56152, "t": 168.27972, "r": 365.54083, "b": 176.04785000000004, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "E", "bbox": {"l": 169.74728, "t": 243.21149000000003, "r": 175.27112, "b": 250.97960999999998, "coord_origin": "TOPLEFT"}}], "children": [{"id": 19, "label": "text", "bbox": {"l": 374.49326, "t": 168.59362999999996, "r": 381.66843, "b": 177.91540999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": "C", "bbox": {"l": 374.49326, "t": 168.59362999999996, "r": 381.66843, "b": 177.91540999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 398.74011, "t": 168.50005999999996, "r": 405.91528, "b": 177.82183999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "C", "bbox": {"l": 398.74011, "t": 168.50005999999996, "r": 405.91528, "b": 177.82183999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 373.76862, "t": 192.92553999999996, "r": 380.94379, "b": 202.24730999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "C", "bbox": {"l": 373.76862, "t": 192.92553999999996, "r": 380.94379, "b": 202.24730999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 386.66388, "t": 193.07061999999996, "r": 393.83905, "b": 202.39239999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "C", "bbox": {"l": 386.66388, "t": 193.07061999999996, "r": 393.83905, "b": 202.39239999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 386.68707, "t": 205.13756999999998, "r": 393.86224, "b": 214.45934999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "C", "bbox": {"l": 386.68707, "t": 205.13756999999998, "r": 393.86224, "b": 214.45934999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 398.65729, "t": 180.73279000000002, "r": 405.83246, "b": 190.05457, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "C", "bbox": {"l": 398.65729, "t": 180.73279000000002, "r": 405.83246, "b": 190.05457, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 410.77908, "t": 180.73859000000004, "r": 417.95425, "b": 190.06035999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "C", "bbox": {"l": 410.77908, "t": 180.73859000000004, "r": 417.95425, "b": 190.06035999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 422.90503, "t": 180.65247, "r": 430.08020000000005, "b": 189.97424, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "C", "bbox": {"l": 422.90503, "t": 180.65247, "r": 430.08020000000005, "b": 189.97424, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 398.7807, "t": 192.98865, "r": 405.95587, "b": 202.31042000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "C", "bbox": {"l": 398.7807, "t": 192.98865, "r": 405.95587, "b": 202.31042000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 410.90164, "t": 192.99487, "r": 418.07681, "b": 202.31664999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "C", "bbox": {"l": 410.90164, "t": 192.99487, "r": 418.07681, "b": 202.31664999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 423.02753, "t": 192.909, "r": 430.2027, "b": 202.23077, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "C", "bbox": {"l": 423.02753, "t": 192.909, "r": 430.2027, "b": 202.23077, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 398.78235, "t": 205.31573000000003, "r": 405.95752, "b": 214.63751000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "C", "bbox": {"l": 398.78235, "t": 205.31573000000003, "r": 405.95752, "b": 214.63751000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 410.90414, "t": 205.32196, "r": 418.07932, "b": 214.64373999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "C", "bbox": {"l": 410.90414, "t": 205.32196, "r": 418.07932, "b": 214.64373999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 423.03003, "t": 205.23614999999995, "r": 430.20520000000005, "b": 214.55791999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "C", "bbox": {"l": 423.03003, "t": 205.23614999999995, "r": 430.20520000000005, "b": 214.55791999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 386.50574, "t": 217.03882, "r": 393.68091, "b": 226.36059999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "C", "bbox": {"l": 386.50574, "t": 217.03882, "r": 393.68091, "b": 226.36059999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 398.60181, "t": 217.21704, "r": 405.77698, "b": 226.53882, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "C", "bbox": {"l": 398.60181, "t": 217.21704, "r": 405.77698, "b": 226.53882, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 410.72275, "t": 217.22321, "r": 417.89792, "b": 226.54498, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "C", "bbox": {"l": 410.72275, "t": 217.22321, "r": 417.89792, "b": 226.54498, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 422.84869, "t": 217.13738999999998, "r": 430.02386, "b": 226.45916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "C", "bbox": {"l": 422.84869, "t": 217.13738999999998, "r": 430.02386, "b": 226.45916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 435.16009999999994, "t": 167.69011999999998, "r": 447.86273, "b": 177.01189999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "NL", "bbox": {"l": 435.16009999999994, "t": 167.69011999999998, "r": 447.86273, "b": 177.01189999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 435.44415, "t": 180.20025999999996, "r": 448.14679, "b": 189.52202999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "NL", "bbox": {"l": 435.44415, "t": 180.20025999999996, "r": 448.14679, "b": 189.52202999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 435.46735, "t": 192.49474999999995, "r": 448.16998000000007, "b": 201.81652999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "NL", "bbox": {"l": 435.46735, "t": 192.49474999999995, "r": 448.16998000000007, "b": 201.81652999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 435.38202, "t": 204.83025999999995, "r": 448.08466, "b": 214.15204000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "NL", "bbox": {"l": 435.38202, "t": 204.83025999999995, "r": 448.08466, "b": 214.15204000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 435.59906, "t": 217.2337, "r": 448.3017, "b": 226.55548, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "NL", "bbox": {"l": 435.59906, "t": 217.2337, "r": 448.3017, "b": 226.55548, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 374.14957, "t": 205.23492, "r": 381.32474, "b": 214.55669999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "U", "bbox": {"l": 374.14957, "t": 205.23492, "r": 381.32474, "b": 214.55669999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 374.0419, "t": 217.14648, "r": 381.21707, "b": 226.46826, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "U", "bbox": {"l": 374.0419, "t": 217.14648, "r": 381.21707, "b": 226.46826, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 374.34418, "t": 180.93488000000002, "r": 381.51935, "b": 190.25665000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "U", "bbox": {"l": 374.34418, "t": 180.93488000000002, "r": 381.51935, "b": 190.25665000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 387.76285, "t": 168.57788000000005, "r": 393.28833, "b": 177.89966000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "L", "bbox": {"l": 387.76285, "t": 168.57788000000005, "r": 393.28833, "b": 177.89966000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 411.86395, "t": 168.06195000000002, "r": 417.38943, "b": 177.38373, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "L", "bbox": {"l": 411.86395, "t": 168.06195000000002, "r": 417.38943, "b": 177.38373, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 423.33563, "t": 167.93439, "r": 428.86111, "b": 177.25616000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "L", "bbox": {"l": 423.33563, "t": 167.93439, "r": 428.86111, "b": 177.25616000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 387.13593, "t": 180.78576999999996, "r": 393.76453, "b": 190.10753999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "X", "bbox": {"l": 387.13593, "t": 180.78576999999996, "r": 393.76453, "b": 190.10753999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 282.2594, "t": 244.50878999999998, "r": 289.43457, "b": 253.83056999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "C", "bbox": {"l": 282.2594, "t": 244.50878999999998, "r": 289.43457, "b": 253.83056999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 282.11035, "t": 256.85022000000004, "r": 289.28552, "b": 266.172, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "U", "bbox": {"l": 282.11035, "t": 256.85022000000004, "r": 289.28552, "b": 266.172, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 282.40848, "t": 269.13300000000004, "r": 289.58365, "b": 278.45477000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "U", "bbox": {"l": 282.40848, "t": 269.13300000000004, "r": 289.58365, "b": 278.45477000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 295.52902, "t": 244.49347, "r": 301.0545, "b": 253.81525, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "L", "bbox": {"l": 295.52902, "t": 244.49347, "r": 301.0545, "b": 253.81525, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 307.46613, "t": 244.57372999999995, "r": 312.99161, "b": 253.89550999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "L", "bbox": {"l": 307.46613, "t": 244.57372999999995, "r": 312.99161, "b": 253.89550999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 318.76886, "t": 244.44037000000003, "r": 324.29434, "b": 253.76215000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "L", "bbox": {"l": 318.76886, "t": 244.44037000000003, "r": 324.29434, "b": 253.76215000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 294.9021, "t": 256.70154, "r": 301.03976, "b": 266.02332, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "X", "bbox": {"l": 294.9021, "t": 256.70154, "r": 301.03976, "b": 266.02332, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 307.17743, "t": 256.70154, "r": 325.59039, "b": 266.02332, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "X X", "bbox": {"l": 307.17743, "t": 256.70154, "r": 325.59039, "b": 266.02332, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 294.78949, "t": 269.25420999999994, "r": 300.92715, "b": 278.57599000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "X", "bbox": {"l": 294.78949, "t": 269.25420999999994, "r": 300.92715, "b": 278.57599000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 307.06482, "t": 269.25420999999994, "r": 325.47778, "b": 278.57599000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "X X", "bbox": {"l": 307.06482, "t": 269.25420999999994, "r": 325.47778, "b": 278.57599000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 195.93939, "t": 268.74798999999996, "r": 203.11456, "b": 278.06976, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "C", "bbox": {"l": 195.93939, "t": 268.74798999999996, "r": 203.11456, "b": 278.06976, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 209.20891, "t": 268.73267, "r": 214.73439, "b": 278.05444, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "L", "bbox": {"l": 209.20891, "t": 268.73267, "r": 214.73439, "b": 278.05444, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 221.14551, "t": 268.81293000000005, "r": 226.67099, "b": 278.13469999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "L", "bbox": {"l": 221.14551, "t": 268.81293000000005, "r": 226.67099, "b": 278.13469999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 232.44858, "t": 268.67957, "r": 237.97405999999998, "b": 278.00134, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "L", "bbox": {"l": 232.44858, "t": 268.67957, "r": 237.97405999999998, "b": 278.00134, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 196.21715, "t": 244.53961000000004, "r": 203.39232, "b": 253.86139000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "C", "bbox": {"l": 196.21715, "t": 244.53961000000004, "r": 203.39232, "b": 253.86139000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 250.32143, "t": 244.09813999999994, "r": 257.49661, "b": 253.41992000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "C", "bbox": {"l": 250.32143, "t": 244.09813999999994, "r": 257.49661, "b": 253.41992000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 250.17235999999997, "t": 256.43951000000004, "r": 257.34753, "b": 265.76129000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "U", "bbox": {"l": 250.17235999999997, "t": 256.43951000000004, "r": 257.34753, "b": 265.76129000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 250.47049000000004, "t": 268.72222999999997, "r": 257.64566, "b": 278.04400999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "U", "bbox": {"l": 250.47049000000004, "t": 268.72222999999997, "r": 257.64566, "b": 278.04400999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 334.51135, "t": 242.99463000000003, "r": 337.22485, "b": 249.20911, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "1", "bbox": {"l": 334.51135, "t": 242.99463000000003, "r": 337.22485, "b": 249.20911, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 339.93835, "t": 242.99463000000003, "r": 391.49472, "b": 249.20911, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "- simple cells: \"C\"", "bbox": {"l": 339.93835, "t": 242.99463000000003, "r": 391.49472, "b": 249.20911, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 334.51135, "t": 252.93255999999997, "r": 337.33313, "b": 259.14703, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "2", "bbox": {"l": 334.51135, "t": 252.93255999999997, "r": 337.33313, "b": 259.14703, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 340.15491, "t": 252.93255999999997, "r": 421.98624, "b": 259.14703, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "- horizontal merges: \"C\", \"L\"", "bbox": {"l": 340.15491, "t": 252.93255999999997, "r": 421.98624, "b": 259.14703, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 334.51135, "t": 262.87048000000004, "r": 337.29868, "b": 269.08496, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "3", "bbox": {"l": 334.51135, "t": 262.87048000000004, "r": 337.29868, "b": 269.08496, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 340.086, "t": 262.87048000000004, "r": 415.34375, "b": 269.08496, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "- vertical merges: \"C\", \"U\"", "bbox": {"l": 340.086, "t": 262.87048000000004, "r": 415.34375, "b": 269.08496, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "list_item", "bbox": {"l": 334.51135, "t": 272.80841, "r": 426.59875, "b": 279.02288999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.5250625610351562, "cells": [{"id": 60, "text": "4", "bbox": {"l": 334.51135, "t": 272.80841, "r": 337.30188, "b": 279.02288999999996, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "- 2d merges: \"C\", \"L\", \"U\", \"X\"", "bbox": {"l": 340.09241, "t": 272.80841, "r": 426.59875, "b": 279.02288999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 185.67178, "t": 244.04224, "r": 189.35544, "b": 250.25671, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "1", "bbox": {"l": 185.67178, "t": 244.04224, "r": 189.35544, "b": 250.25671, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 185.96759, "t": 268.34766, "r": 189.65125, "b": 274.56213, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "2", "bbox": {"l": 185.96759, "t": 268.34766, "r": 189.65125, "b": 274.56213, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 239.34152, "t": 243.62523999999996, "r": 243.02518, "b": 249.83972000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "3", "bbox": {"l": 239.34152, "t": 243.62523999999996, "r": 243.02518, "b": 249.83972000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 271.32852, "t": 243.49390000000005, "r": 275.01218, "b": 249.70836999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "4", "bbox": {"l": 271.32852, "t": 243.49390000000005, "r": 275.01218, "b": 249.70836999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 229.81627, "t": 166.51495, "r": 233.49992000000003, "b": 172.72942999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "2", "bbox": {"l": 229.81627, "t": 166.51495, "r": 233.49992000000003, "b": 172.72942999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 257.24402, "t": 189.961, "r": 260.92767, "b": 196.17548, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "1", "bbox": {"l": 257.24402, "t": 189.961, "r": 260.92767, "b": 196.17548, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 186.87526, "t": 177.97668, "r": 190.55891, "b": 184.19115999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "3", "bbox": {"l": 186.87526, "t": 177.97668, "r": 190.55891, "b": 184.19115999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 196.48746, "t": 169.01520000000005, "r": 200.17111, "b": 175.22968000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "4", "bbox": {"l": 196.48746, "t": 169.01520000000005, "r": 200.17111, "b": 175.22968000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 169.74728, "t": 167.88225999999997, "r": 175.72659, "b": 175.65039000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "A", "bbox": {"l": 169.74728, "t": 167.88225999999997, "r": 175.72659, "b": 175.65039000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 169.74728, "t": 206.83867999999995, "r": 175.72659, "b": 214.60681, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "B", "bbox": {"l": 169.74728, "t": 206.83867999999995, "r": 175.72659, "b": 214.60681, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 274.29419, "t": 168.27972, "r": 280.2735, "b": 176.04785000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "C", "bbox": {"l": 274.29419, "t": 168.27972, "r": 280.2735, "b": 176.04785000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 359.56152, "t": 168.27972, "r": 365.54083, "b": 176.04785000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "D", "bbox": {"l": 359.56152, "t": 168.27972, "r": 365.54083, "b": 176.04785000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 169.74728, "t": 243.21149000000003, "r": 175.27112, "b": 250.97960999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "E", "bbox": {"l": 169.74728, "t": 243.21149000000003, "r": 175.27112, "b": 250.97960999999998, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 9, "label": "section_header", "bbox": {"l": 134.765, "t": 305.29581, "r": 246.65197999999998, "b": 314.10275, "coord_origin": "TOPLEFT"}, "confidence": 0.9233023524284363, "cells": [{"id": 75, "text": "4.2", "bbox": {"l": 134.765, "t": 305.29581, "r": 149.40205, "b": 314.10275, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "Language Syntax", "bbox": {"l": 160.85904, "t": 305.29581, "r": 246.65197999999998, "b": 314.10275, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "text", "bbox": {"l": 134.765, "t": 325.24777, "r": 363.79617, "b": 334.04474, "coord_origin": "TOPLEFT"}, "confidence": 0.9169168472290039, "cells": [{"id": 77, "text": "The OTSL representation follows these syntax rules:", "bbox": {"l": 134.765, "t": 325.24777, "r": 363.79617, "b": 334.04474, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "list_item", "bbox": {"l": 138.97299, "t": 347.17081, "r": 480.58902, "b": 367.93375, "coord_origin": "TOPLEFT"}, "confidence": 0.9588112235069275, "cells": [{"id": 78, "text": "1.", "bbox": {"l": 138.97299, "t": 347.18079, "r": 146.71991, "b": 355.97775, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "Left-looking cell rule", "bbox": {"l": 151.70099, "t": 347.17081, "r": 257.37927, "b": 355.97775, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": ": The left neighbour of an \"L\" cell must be either", "bbox": {"l": 257.383, "t": 347.18079, "r": 480.58902, "b": 355.97775, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "another \"L\" cell or a \"C\" cell.", "bbox": {"l": 151.70099, "t": 359.13678, "r": 283.59387, "b": 367.93375, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "list_item", "bbox": {"l": 138.97299, "t": 371.08481, "r": 480.59229000000005, "b": 391.84673999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9585386514663696, "cells": [{"id": 82, "text": "2.", "bbox": {"l": 138.97299, "t": 371.09479, "r": 146.71991, "b": 379.89175, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "Up-looking cell rule", "bbox": {"l": 151.70099, "t": 371.08481, "r": 252.11203, "b": 379.89175, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": ": The upper neighbour of a \"U\" cell must be either", "bbox": {"l": 252.112, "t": 371.09479, "r": 480.59229000000005, "b": 379.89175, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "another \"U\" cell or a \"C\" cell.", "bbox": {"l": 151.70099, "t": 383.04977, "r": 284.8392, "b": 391.84673999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "section_header", "bbox": {"l": 138.97299, "t": 394.99780000000004, "r": 226.07360999999997, "b": 403.80475, "coord_origin": "TOPLEFT"}, "confidence": 0.6506174206733704, "cells": [{"id": 86, "text": "3.", "bbox": {"l": 138.97299, "t": 395.0077800000001, "r": 146.71991, "b": 403.80475, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Cross cell rule", "bbox": {"l": 151.70099, "t": 394.99780000000004, "r": 223.3042, "b": 403.80475, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": ":", "bbox": {"l": 223.30699, "t": 395.0077800000001, "r": 226.07360999999997, "b": 403.80475, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "list_item", "bbox": {"l": 151.70099, "t": 406.96677, "r": 480.59238, "b": 439.67371, "coord_origin": "TOPLEFT"}, "confidence": 0.7247239947319031, "cells": [{"id": 89, "text": "The left neighbour of an \"X\" cell must be either another \"X\" cell or a \"U\"", "bbox": {"l": 151.70099, "t": 406.96677, "r": 480.59238, "b": 415.76373, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "cell, and the upper neighbour of an \"X\" cell must be either another \"X\" cell", "bbox": {"l": 151.70099, "t": 418.9217499999999, "r": 480.59219, "b": 427.71871999999996, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "or an \"L\" cell.", "bbox": {"l": 151.70099, "t": 430.87674, "r": 214.39663999999996, "b": 439.67371, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "list_item", "bbox": {"l": 138.97299, "t": 442.82574, "r": 474.59018, "b": 451.63269, "coord_origin": "TOPLEFT"}, "confidence": 0.9259927272796631, "cells": [{"id": 92, "text": "4.", "bbox": {"l": 138.97299, "t": 442.83572, "r": 146.71991, "b": 451.63269, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "First row rule", "bbox": {"l": 151.70099, "t": 442.82574, "r": 221.32263, "b": 451.63269, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": ": Only \"L\" cells and \"C\" cells are allowed in the first row.", "bbox": {"l": 221.32700000000003, "t": 442.83572, "r": 474.59018, "b": 451.63269, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "list_item", "bbox": {"l": 138.97299, "t": 454.78375, "r": 480.58746, "b": 475.54568, "coord_origin": "TOPLEFT"}, "confidence": 0.9420599937438965, "cells": [{"id": 95, "text": "5.", "bbox": {"l": 138.97299, "t": 454.7937299999999, "r": 146.71991, "b": 463.5907, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "First column rule", "bbox": {"l": 151.70099, "t": 454.78375, "r": 240.71982, "b": 463.5907, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": ": Only \"U\" cells and \"C\" cells are allowed in the first", "bbox": {"l": 240.71599, "t": 454.7937299999999, "r": 480.58746, "b": 463.5907, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "column.", "bbox": {"l": 151.70099, "t": 466.74872, "r": 186.0072, "b": 475.54568, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "list_item", "bbox": {"l": 138.97299, "t": 478.69675, "r": 480.59457, "b": 499.45969, "coord_origin": "TOPLEFT"}, "confidence": 0.9617829918861389, "cells": [{"id": 99, "text": "6.", "bbox": {"l": 138.97299, "t": 478.70673, "r": 146.71991, "b": 487.50369, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "Rectangular rule", "bbox": {"l": 151.70099, "t": 478.69675, "r": 235.15768, "b": 487.50369, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": ": The table representation is always rectangular - all rows", "bbox": {"l": 235.15697999999998, "t": 478.70673, "r": 480.59457, "b": 487.50369, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "must have an equal number of tokens, terminated with \"NL\" token.", "bbox": {"l": 151.70099, "t": 490.66272, "r": 448.04147, "b": 499.45969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 134.76498, "t": 512.59271, "r": 480.59583, "b": 640.9416699999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9785562753677368, "cells": [{"id": 103, "text": "The application of these rules gives OTSL a set of unique properties. First", "bbox": {"l": 149.70898, "t": 512.59271, "r": 480.59583, "b": 521.38968, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "of all, the OTSL enforces a strictly rectangular structure representation, where", "bbox": {"l": 134.76498, "t": 524.5477000000001, "r": 480.59079, "b": 533.34467, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "every new-line token starts a new row. As a consequence, all rows and all columns", "bbox": {"l": 134.76498, "t": 536.5027, "r": 480.59482, "b": 545.29967, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "have exactly the same number of tokens, irrespective of cell spans. Secondly, the", "bbox": {"l": 134.76498, "t": 548.4586899999999, "r": 480.58865000000003, "b": 557.25566, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "OTSL representation is unambiguous: Every table structure is represented in one", "bbox": {"l": 134.76498, "t": 560.4137000000001, "r": 480.59365999999994, "b": 569.21066, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "way. In this representation every table cell corresponds to a \"C\"-cell token, which", "bbox": {"l": 134.76498, "t": 572.3687, "r": 480.58673, "b": 581.16566, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "in case of spans is always located in the top-left corner of the table cell definition.", "bbox": {"l": 134.76498, "t": 584.3237, "r": 480.59171, "b": 593.12067, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "Third, OTSL syntax rules are only backward-looking. As a consequence, every", "bbox": {"l": 134.76498, "t": 596.2787, "r": 480.59180000000003, "b": 605.07567, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "predicted token can be validated straight during sequence generation by looking", "bbox": {"l": 134.76498, "t": 608.2347, "r": 480.5936899999999, "b": 617.03166, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "at the previously predicted sequence. As such, OTSL can guarantee that every", "bbox": {"l": 134.76498, "t": 620.1897, "r": 480.59072999999995, "b": 628.98666, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "predicted sequence is syntactically valid.", "bbox": {"l": 134.76498, "t": 632.1447000000001, "r": 311.19769, "b": 640.9416699999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 134.76498, "t": 644.1026899999999, "r": 480.59265, "b": 664.8546699999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9590610861778259, "cells": [{"id": 114, "text": "These characteristics can be easily learned by sequence generator networks,", "bbox": {"l": 149.70898, "t": 644.1026899999999, "r": 480.59186, "b": 652.89966, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "as we demonstrate further below. We find strong indications that this pattern", "bbox": {"l": 134.76498, "t": 656.05769, "r": 480.59265, "b": 664.8546699999999, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_header", "id": 7, "page_no": 6, "cluster": {"id": 7, "label": "page_header", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.932651162147522, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Optimized Table Tokenization for Table Structure Recognition"}, {"label": "page_header", "id": 11, "page_no": 6, "cluster": {"id": 11, "label": "page_header", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8749732375144958, "cells": [{"id": 1, "text": "7", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "7"}, {"label": "caption", "id": 6, "page_no": 6, "cluster": {"id": 6, "label": "caption", "bbox": {"l": 134.765, "t": 125.79918999999984, "r": 480.5874, "b": 155.84966999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9333080053329468, "cells": [{"id": 2, "text": "Fig. 3.", "bbox": {"l": 134.765, "t": 125.79918999999984, "r": 162.64424, "b": 133.72551999999996, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "OTSL description of table structure: A - table example; B - graphical repre-", "bbox": {"l": 166.276, "t": 125.86200000000008, "r": 480.58675999999997, "b": 133.93169999999998, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "sentation of table structure; C - mapping structure on a grid; D - OTSL structure", "bbox": {"l": 134.765, "t": 136.82097999999996, "r": 480.5874, "b": 144.89068999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "encoding; E - explanation on cell encoding", "bbox": {"l": 134.765, "t": 147.77997000000005, "r": 306.1156, "b": 155.84966999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Fig. 3. OTSL description of table structure: A - table example; B - graphical representation of table structure; C - mapping structure on a grid; D - OTSL structure encoding; E - explanation on cell encoding"}, {"label": "picture", "id": 12, "page_no": 6, "cluster": {"id": 12, "label": "picture", "bbox": {"l": 164.65028381347656, "t": 163.79708862304688, "r": 449.5505676269531, "b": 280.3409423828125, "coord_origin": "TOPLEFT"}, "confidence": 0.7868534922599792, "cells": [{"id": 6, "text": "C", "bbox": {"l": 374.49326, "t": 168.59362999999996, "r": 381.66843, "b": 177.91540999999995, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "C", "bbox": {"l": 398.74011, "t": 168.50005999999996, "r": 405.91528, "b": 177.82183999999995, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "C", "bbox": {"l": 373.76862, "t": 192.92553999999996, "r": 380.94379, "b": 202.24730999999997, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "C", "bbox": {"l": 386.66388, "t": 193.07061999999996, "r": 393.83905, "b": 202.39239999999995, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "C", "bbox": {"l": 386.68707, "t": 205.13756999999998, "r": 393.86224, "b": 214.45934999999997, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "C", "bbox": {"l": 398.65729, "t": 180.73279000000002, "r": 405.83246, "b": 190.05457, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "C", "bbox": {"l": 410.77908, "t": 180.73859000000004, "r": 417.95425, "b": 190.06035999999995, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "C", "bbox": {"l": 422.90503, "t": 180.65247, "r": 430.08020000000005, "b": 189.97424, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "C", "bbox": {"l": 398.7807, "t": 192.98865, "r": 405.95587, "b": 202.31042000000002, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "C", "bbox": {"l": 410.90164, "t": 192.99487, "r": 418.07681, "b": 202.31664999999998, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "C", "bbox": {"l": 423.02753, "t": 192.909, "r": 430.2027, "b": 202.23077, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "C", "bbox": {"l": 398.78235, "t": 205.31573000000003, "r": 405.95752, "b": 214.63751000000002, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "C", "bbox": {"l": 410.90414, "t": 205.32196, "r": 418.07932, "b": 214.64373999999998, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "C", "bbox": {"l": 423.03003, "t": 205.23614999999995, "r": 430.20520000000005, "b": 214.55791999999997, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "C", "bbox": {"l": 386.50574, "t": 217.03882, "r": 393.68091, "b": 226.36059999999998, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "C", "bbox": {"l": 398.60181, "t": 217.21704, "r": 405.77698, "b": 226.53882, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "C", "bbox": {"l": 410.72275, "t": 217.22321, "r": 417.89792, "b": 226.54498, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "C", "bbox": {"l": 422.84869, "t": 217.13738999999998, "r": 430.02386, "b": 226.45916999999997, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "NL", "bbox": {"l": 435.16009999999994, "t": 167.69011999999998, "r": 447.86273, "b": 177.01189999999997, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "NL", "bbox": {"l": 435.44415, "t": 180.20025999999996, "r": 448.14679, "b": 189.52202999999997, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "NL", "bbox": {"l": 435.46735, "t": 192.49474999999995, "r": 448.16998000000007, "b": 201.81652999999994, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "NL", "bbox": {"l": 435.38202, "t": 204.83025999999995, "r": 448.08466, "b": 214.15204000000006, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "NL", "bbox": {"l": 435.59906, "t": 217.2337, "r": 448.3017, "b": 226.55548, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "U", "bbox": {"l": 374.14957, "t": 205.23492, "r": 381.32474, "b": 214.55669999999998, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "U", "bbox": {"l": 374.0419, "t": 217.14648, "r": 381.21707, "b": 226.46826, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "U", "bbox": {"l": 374.34418, "t": 180.93488000000002, "r": 381.51935, "b": 190.25665000000004, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "L", "bbox": {"l": 387.76285, "t": 168.57788000000005, "r": 393.28833, "b": 177.89966000000004, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "L", "bbox": {"l": 411.86395, "t": 168.06195000000002, "r": 417.38943, "b": 177.38373, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "L", "bbox": {"l": 423.33563, "t": 167.93439, "r": 428.86111, "b": 177.25616000000002, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "X", "bbox": {"l": 387.13593, "t": 180.78576999999996, "r": 393.76453, "b": 190.10753999999997, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "C", "bbox": {"l": 282.2594, "t": 244.50878999999998, "r": 289.43457, "b": 253.83056999999997, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "U", "bbox": {"l": 282.11035, "t": 256.85022000000004, "r": 289.28552, "b": 266.172, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "U", "bbox": {"l": 282.40848, "t": 269.13300000000004, "r": 289.58365, "b": 278.45477000000005, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "L", "bbox": {"l": 295.52902, "t": 244.49347, "r": 301.0545, "b": 253.81525, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "L", "bbox": {"l": 307.46613, "t": 244.57372999999995, "r": 312.99161, "b": 253.89550999999994, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "L", "bbox": {"l": 318.76886, "t": 244.44037000000003, "r": 324.29434, "b": 253.76215000000002, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "X", "bbox": {"l": 294.9021, "t": 256.70154, "r": 301.03976, "b": 266.02332, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "X X", "bbox": {"l": 307.17743, "t": 256.70154, "r": 325.59039, "b": 266.02332, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "X", "bbox": {"l": 294.78949, "t": 269.25420999999994, "r": 300.92715, "b": 278.57599000000005, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "X X", "bbox": {"l": 307.06482, "t": 269.25420999999994, "r": 325.47778, "b": 278.57599000000005, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "C", "bbox": {"l": 195.93939, "t": 268.74798999999996, "r": 203.11456, "b": 278.06976, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "L", "bbox": {"l": 209.20891, "t": 268.73267, "r": 214.73439, "b": 278.05444, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "L", "bbox": {"l": 221.14551, "t": 268.81293000000005, "r": 226.67099, "b": 278.13469999999995, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "L", "bbox": {"l": 232.44858, "t": 268.67957, "r": 237.97405999999998, "b": 278.00134, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "C", "bbox": {"l": 196.21715, "t": 244.53961000000004, "r": 203.39232, "b": 253.86139000000003, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "C", "bbox": {"l": 250.32143, "t": 244.09813999999994, "r": 257.49661, "b": 253.41992000000005, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "U", "bbox": {"l": 250.17235999999997, "t": 256.43951000000004, "r": 257.34753, "b": 265.76129000000003, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "U", "bbox": {"l": 250.47049000000004, "t": 268.72222999999997, "r": 257.64566, "b": 278.04400999999996, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "1", "bbox": {"l": 334.51135, "t": 242.99463000000003, "r": 337.22485, "b": 249.20911, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "- simple cells: \"C\"", "bbox": {"l": 339.93835, "t": 242.99463000000003, "r": 391.49472, "b": 249.20911, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "2", "bbox": {"l": 334.51135, "t": 252.93255999999997, "r": 337.33313, "b": 259.14703, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "- horizontal merges: \"C\", \"L\"", "bbox": {"l": 340.15491, "t": 252.93255999999997, "r": 421.98624, "b": 259.14703, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "3", "bbox": {"l": 334.51135, "t": 262.87048000000004, "r": 337.29868, "b": 269.08496, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "- vertical merges: \"C\", \"U\"", "bbox": {"l": 340.086, "t": 262.87048000000004, "r": 415.34375, "b": 269.08496, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "4", "bbox": {"l": 334.51135, "t": 272.80841, "r": 337.30188, "b": 279.02288999999996, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "- 2d merges: \"C\", \"L\", \"U\", \"X\"", "bbox": {"l": 340.09241, "t": 272.80841, "r": 426.59875, "b": 279.02288999999996, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "1", "bbox": {"l": 185.67178, "t": 244.04224, "r": 189.35544, "b": 250.25671, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "2", "bbox": {"l": 185.96759, "t": 268.34766, "r": 189.65125, "b": 274.56213, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "3", "bbox": {"l": 239.34152, "t": 243.62523999999996, "r": 243.02518, "b": 249.83972000000006, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "4", "bbox": {"l": 271.32852, "t": 243.49390000000005, "r": 275.01218, "b": 249.70836999999995, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "2", "bbox": {"l": 229.81627, "t": 166.51495, "r": 233.49992000000003, "b": 172.72942999999998, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "1", "bbox": {"l": 257.24402, "t": 189.961, "r": 260.92767, "b": 196.17548, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "3", "bbox": {"l": 186.87526, "t": 177.97668, "r": 190.55891, "b": 184.19115999999997, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "4", "bbox": {"l": 196.48746, "t": 169.01520000000005, "r": 200.17111, "b": 175.22968000000003, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "A", "bbox": {"l": 169.74728, "t": 167.88225999999997, "r": 175.72659, "b": 175.65039000000002, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "B", "bbox": {"l": 169.74728, "t": 206.83867999999995, "r": 175.72659, "b": 214.60681, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "C", "bbox": {"l": 274.29419, "t": 168.27972, "r": 280.2735, "b": 176.04785000000004, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "D", "bbox": {"l": 359.56152, "t": 168.27972, "r": 365.54083, "b": 176.04785000000004, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "E", "bbox": {"l": 169.74728, "t": 243.21149000000003, "r": 175.27112, "b": 250.97960999999998, "coord_origin": "TOPLEFT"}}], "children": [{"id": 19, "label": "text", "bbox": {"l": 374.49326, "t": 168.59362999999996, "r": 381.66843, "b": 177.91540999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": "C", "bbox": {"l": 374.49326, "t": 168.59362999999996, "r": 381.66843, "b": 177.91540999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 398.74011, "t": 168.50005999999996, "r": 405.91528, "b": 177.82183999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "C", "bbox": {"l": 398.74011, "t": 168.50005999999996, "r": 405.91528, "b": 177.82183999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 373.76862, "t": 192.92553999999996, "r": 380.94379, "b": 202.24730999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "C", "bbox": {"l": 373.76862, "t": 192.92553999999996, "r": 380.94379, "b": 202.24730999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 386.66388, "t": 193.07061999999996, "r": 393.83905, "b": 202.39239999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "C", "bbox": {"l": 386.66388, "t": 193.07061999999996, "r": 393.83905, "b": 202.39239999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 386.68707, "t": 205.13756999999998, "r": 393.86224, "b": 214.45934999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "C", "bbox": {"l": 386.68707, "t": 205.13756999999998, "r": 393.86224, "b": 214.45934999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 398.65729, "t": 180.73279000000002, "r": 405.83246, "b": 190.05457, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "C", "bbox": {"l": 398.65729, "t": 180.73279000000002, "r": 405.83246, "b": 190.05457, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 410.77908, "t": 180.73859000000004, "r": 417.95425, "b": 190.06035999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "C", "bbox": {"l": 410.77908, "t": 180.73859000000004, "r": 417.95425, "b": 190.06035999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 422.90503, "t": 180.65247, "r": 430.08020000000005, "b": 189.97424, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "C", "bbox": {"l": 422.90503, "t": 180.65247, "r": 430.08020000000005, "b": 189.97424, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 398.7807, "t": 192.98865, "r": 405.95587, "b": 202.31042000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "C", "bbox": {"l": 398.7807, "t": 192.98865, "r": 405.95587, "b": 202.31042000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 410.90164, "t": 192.99487, "r": 418.07681, "b": 202.31664999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "C", "bbox": {"l": 410.90164, "t": 192.99487, "r": 418.07681, "b": 202.31664999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 423.02753, "t": 192.909, "r": 430.2027, "b": 202.23077, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "C", "bbox": {"l": 423.02753, "t": 192.909, "r": 430.2027, "b": 202.23077, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 398.78235, "t": 205.31573000000003, "r": 405.95752, "b": 214.63751000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "C", "bbox": {"l": 398.78235, "t": 205.31573000000003, "r": 405.95752, "b": 214.63751000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 410.90414, "t": 205.32196, "r": 418.07932, "b": 214.64373999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "C", "bbox": {"l": 410.90414, "t": 205.32196, "r": 418.07932, "b": 214.64373999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 423.03003, "t": 205.23614999999995, "r": 430.20520000000005, "b": 214.55791999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "C", "bbox": {"l": 423.03003, "t": 205.23614999999995, "r": 430.20520000000005, "b": 214.55791999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 386.50574, "t": 217.03882, "r": 393.68091, "b": 226.36059999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "C", "bbox": {"l": 386.50574, "t": 217.03882, "r": 393.68091, "b": 226.36059999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 398.60181, "t": 217.21704, "r": 405.77698, "b": 226.53882, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "C", "bbox": {"l": 398.60181, "t": 217.21704, "r": 405.77698, "b": 226.53882, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 410.72275, "t": 217.22321, "r": 417.89792, "b": 226.54498, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "C", "bbox": {"l": 410.72275, "t": 217.22321, "r": 417.89792, "b": 226.54498, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 422.84869, "t": 217.13738999999998, "r": 430.02386, "b": 226.45916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "C", "bbox": {"l": 422.84869, "t": 217.13738999999998, "r": 430.02386, "b": 226.45916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 435.16009999999994, "t": 167.69011999999998, "r": 447.86273, "b": 177.01189999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "NL", "bbox": {"l": 435.16009999999994, "t": 167.69011999999998, "r": 447.86273, "b": 177.01189999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 435.44415, "t": 180.20025999999996, "r": 448.14679, "b": 189.52202999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "NL", "bbox": {"l": 435.44415, "t": 180.20025999999996, "r": 448.14679, "b": 189.52202999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 435.46735, "t": 192.49474999999995, "r": 448.16998000000007, "b": 201.81652999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "NL", "bbox": {"l": 435.46735, "t": 192.49474999999995, "r": 448.16998000000007, "b": 201.81652999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 435.38202, "t": 204.83025999999995, "r": 448.08466, "b": 214.15204000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "NL", "bbox": {"l": 435.38202, "t": 204.83025999999995, "r": 448.08466, "b": 214.15204000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 435.59906, "t": 217.2337, "r": 448.3017, "b": 226.55548, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "NL", "bbox": {"l": 435.59906, "t": 217.2337, "r": 448.3017, "b": 226.55548, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 374.14957, "t": 205.23492, "r": 381.32474, "b": 214.55669999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "U", "bbox": {"l": 374.14957, "t": 205.23492, "r": 381.32474, "b": 214.55669999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 374.0419, "t": 217.14648, "r": 381.21707, "b": 226.46826, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "U", "bbox": {"l": 374.0419, "t": 217.14648, "r": 381.21707, "b": 226.46826, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 374.34418, "t": 180.93488000000002, "r": 381.51935, "b": 190.25665000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "U", "bbox": {"l": 374.34418, "t": 180.93488000000002, "r": 381.51935, "b": 190.25665000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 387.76285, "t": 168.57788000000005, "r": 393.28833, "b": 177.89966000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "L", "bbox": {"l": 387.76285, "t": 168.57788000000005, "r": 393.28833, "b": 177.89966000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 411.86395, "t": 168.06195000000002, "r": 417.38943, "b": 177.38373, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "L", "bbox": {"l": 411.86395, "t": 168.06195000000002, "r": 417.38943, "b": 177.38373, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 423.33563, "t": 167.93439, "r": 428.86111, "b": 177.25616000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "L", "bbox": {"l": 423.33563, "t": 167.93439, "r": 428.86111, "b": 177.25616000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 387.13593, "t": 180.78576999999996, "r": 393.76453, "b": 190.10753999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "X", "bbox": {"l": 387.13593, "t": 180.78576999999996, "r": 393.76453, "b": 190.10753999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 282.2594, "t": 244.50878999999998, "r": 289.43457, "b": 253.83056999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "C", "bbox": {"l": 282.2594, "t": 244.50878999999998, "r": 289.43457, "b": 253.83056999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 282.11035, "t": 256.85022000000004, "r": 289.28552, "b": 266.172, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "U", "bbox": {"l": 282.11035, "t": 256.85022000000004, "r": 289.28552, "b": 266.172, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 282.40848, "t": 269.13300000000004, "r": 289.58365, "b": 278.45477000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "U", "bbox": {"l": 282.40848, "t": 269.13300000000004, "r": 289.58365, "b": 278.45477000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 295.52902, "t": 244.49347, "r": 301.0545, "b": 253.81525, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "L", "bbox": {"l": 295.52902, "t": 244.49347, "r": 301.0545, "b": 253.81525, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 307.46613, "t": 244.57372999999995, "r": 312.99161, "b": 253.89550999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "L", "bbox": {"l": 307.46613, "t": 244.57372999999995, "r": 312.99161, "b": 253.89550999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 318.76886, "t": 244.44037000000003, "r": 324.29434, "b": 253.76215000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "L", "bbox": {"l": 318.76886, "t": 244.44037000000003, "r": 324.29434, "b": 253.76215000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 294.9021, "t": 256.70154, "r": 301.03976, "b": 266.02332, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "X", "bbox": {"l": 294.9021, "t": 256.70154, "r": 301.03976, "b": 266.02332, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 307.17743, "t": 256.70154, "r": 325.59039, "b": 266.02332, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "X X", "bbox": {"l": 307.17743, "t": 256.70154, "r": 325.59039, "b": 266.02332, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 294.78949, "t": 269.25420999999994, "r": 300.92715, "b": 278.57599000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "X", "bbox": {"l": 294.78949, "t": 269.25420999999994, "r": 300.92715, "b": 278.57599000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 307.06482, "t": 269.25420999999994, "r": 325.47778, "b": 278.57599000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "X X", "bbox": {"l": 307.06482, "t": 269.25420999999994, "r": 325.47778, "b": 278.57599000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 195.93939, "t": 268.74798999999996, "r": 203.11456, "b": 278.06976, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "C", "bbox": {"l": 195.93939, "t": 268.74798999999996, "r": 203.11456, "b": 278.06976, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 209.20891, "t": 268.73267, "r": 214.73439, "b": 278.05444, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "L", "bbox": {"l": 209.20891, "t": 268.73267, "r": 214.73439, "b": 278.05444, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 221.14551, "t": 268.81293000000005, "r": 226.67099, "b": 278.13469999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "L", "bbox": {"l": 221.14551, "t": 268.81293000000005, "r": 226.67099, "b": 278.13469999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 232.44858, "t": 268.67957, "r": 237.97405999999998, "b": 278.00134, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "L", "bbox": {"l": 232.44858, "t": 268.67957, "r": 237.97405999999998, "b": 278.00134, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 196.21715, "t": 244.53961000000004, "r": 203.39232, "b": 253.86139000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "C", "bbox": {"l": 196.21715, "t": 244.53961000000004, "r": 203.39232, "b": 253.86139000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 250.32143, "t": 244.09813999999994, "r": 257.49661, "b": 253.41992000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "C", "bbox": {"l": 250.32143, "t": 244.09813999999994, "r": 257.49661, "b": 253.41992000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 250.17235999999997, "t": 256.43951000000004, "r": 257.34753, "b": 265.76129000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "U", "bbox": {"l": 250.17235999999997, "t": 256.43951000000004, "r": 257.34753, "b": 265.76129000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 250.47049000000004, "t": 268.72222999999997, "r": 257.64566, "b": 278.04400999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "U", "bbox": {"l": 250.47049000000004, "t": 268.72222999999997, "r": 257.64566, "b": 278.04400999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 334.51135, "t": 242.99463000000003, "r": 337.22485, "b": 249.20911, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "1", "bbox": {"l": 334.51135, "t": 242.99463000000003, "r": 337.22485, "b": 249.20911, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 339.93835, "t": 242.99463000000003, "r": 391.49472, "b": 249.20911, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "- simple cells: \"C\"", "bbox": {"l": 339.93835, "t": 242.99463000000003, "r": 391.49472, "b": 249.20911, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 334.51135, "t": 252.93255999999997, "r": 337.33313, "b": 259.14703, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "2", "bbox": {"l": 334.51135, "t": 252.93255999999997, "r": 337.33313, "b": 259.14703, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 340.15491, "t": 252.93255999999997, "r": 421.98624, "b": 259.14703, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "- horizontal merges: \"C\", \"L\"", "bbox": {"l": 340.15491, "t": 252.93255999999997, "r": 421.98624, "b": 259.14703, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 334.51135, "t": 262.87048000000004, "r": 337.29868, "b": 269.08496, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "3", "bbox": {"l": 334.51135, "t": 262.87048000000004, "r": 337.29868, "b": 269.08496, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 340.086, "t": 262.87048000000004, "r": 415.34375, "b": 269.08496, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "- vertical merges: \"C\", \"U\"", "bbox": {"l": 340.086, "t": 262.87048000000004, "r": 415.34375, "b": 269.08496, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "list_item", "bbox": {"l": 334.51135, "t": 272.80841, "r": 426.59875, "b": 279.02288999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.5250625610351562, "cells": [{"id": 60, "text": "4", "bbox": {"l": 334.51135, "t": 272.80841, "r": 337.30188, "b": 279.02288999999996, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "- 2d merges: \"C\", \"L\", \"U\", \"X\"", "bbox": {"l": 340.09241, "t": 272.80841, "r": 426.59875, "b": 279.02288999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 185.67178, "t": 244.04224, "r": 189.35544, "b": 250.25671, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "1", "bbox": {"l": 185.67178, "t": 244.04224, "r": 189.35544, "b": 250.25671, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 185.96759, "t": 268.34766, "r": 189.65125, "b": 274.56213, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "2", "bbox": {"l": 185.96759, "t": 268.34766, "r": 189.65125, "b": 274.56213, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 239.34152, "t": 243.62523999999996, "r": 243.02518, "b": 249.83972000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "3", "bbox": {"l": 239.34152, "t": 243.62523999999996, "r": 243.02518, "b": 249.83972000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 271.32852, "t": 243.49390000000005, "r": 275.01218, "b": 249.70836999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "4", "bbox": {"l": 271.32852, "t": 243.49390000000005, "r": 275.01218, "b": 249.70836999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 229.81627, "t": 166.51495, "r": 233.49992000000003, "b": 172.72942999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "2", "bbox": {"l": 229.81627, "t": 166.51495, "r": 233.49992000000003, "b": 172.72942999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 257.24402, "t": 189.961, "r": 260.92767, "b": 196.17548, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "1", "bbox": {"l": 257.24402, "t": 189.961, "r": 260.92767, "b": 196.17548, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 186.87526, "t": 177.97668, "r": 190.55891, "b": 184.19115999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "3", "bbox": {"l": 186.87526, "t": 177.97668, "r": 190.55891, "b": 184.19115999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 196.48746, "t": 169.01520000000005, "r": 200.17111, "b": 175.22968000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "4", "bbox": {"l": 196.48746, "t": 169.01520000000005, "r": 200.17111, "b": 175.22968000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 169.74728, "t": 167.88225999999997, "r": 175.72659, "b": 175.65039000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "A", "bbox": {"l": 169.74728, "t": 167.88225999999997, "r": 175.72659, "b": 175.65039000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 169.74728, "t": 206.83867999999995, "r": 175.72659, "b": 214.60681, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "B", "bbox": {"l": 169.74728, "t": 206.83867999999995, "r": 175.72659, "b": 214.60681, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 274.29419, "t": 168.27972, "r": 280.2735, "b": 176.04785000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "C", "bbox": {"l": 274.29419, "t": 168.27972, "r": 280.2735, "b": 176.04785000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 359.56152, "t": 168.27972, "r": 365.54083, "b": 176.04785000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "D", "bbox": {"l": 359.56152, "t": 168.27972, "r": 365.54083, "b": 176.04785000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 169.74728, "t": 243.21149000000003, "r": 175.27112, "b": 250.97960999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "E", "bbox": {"l": 169.74728, "t": 243.21149000000003, "r": 175.27112, "b": 250.97960999999998, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "section_header", "id": 9, "page_no": 6, "cluster": {"id": 9, "label": "section_header", "bbox": {"l": 134.765, "t": 305.29581, "r": 246.65197999999998, "b": 314.10275, "coord_origin": "TOPLEFT"}, "confidence": 0.9233023524284363, "cells": [{"id": 75, "text": "4.2", "bbox": {"l": 134.765, "t": 305.29581, "r": 149.40205, "b": 314.10275, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "Language Syntax", "bbox": {"l": 160.85904, "t": 305.29581, "r": 246.65197999999998, "b": 314.10275, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4.2 Language Syntax"}, {"label": "text", "id": 10, "page_no": 6, "cluster": {"id": 10, "label": "text", "bbox": {"l": 134.765, "t": 325.24777, "r": 363.79617, "b": 334.04474, "coord_origin": "TOPLEFT"}, "confidence": 0.9169168472290039, "cells": [{"id": 77, "text": "The OTSL representation follows these syntax rules:", "bbox": {"l": 134.765, "t": 325.24777, "r": 363.79617, "b": 334.04474, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The OTSL representation follows these syntax rules:"}, {"label": "list_item", "id": 3, "page_no": 6, "cluster": {"id": 3, "label": "list_item", "bbox": {"l": 138.97299, "t": 347.17081, "r": 480.58902, "b": 367.93375, "coord_origin": "TOPLEFT"}, "confidence": 0.9588112235069275, "cells": [{"id": 78, "text": "1.", "bbox": {"l": 138.97299, "t": 347.18079, "r": 146.71991, "b": 355.97775, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "Left-looking cell rule", "bbox": {"l": 151.70099, "t": 347.17081, "r": 257.37927, "b": 355.97775, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": ": The left neighbour of an \"L\" cell must be either", "bbox": {"l": 257.383, "t": 347.18079, "r": 480.58902, "b": 355.97775, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "another \"L\" cell or a \"C\" cell.", "bbox": {"l": 151.70099, "t": 359.13678, "r": 283.59387, "b": 367.93375, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1. Left-looking cell rule : The left neighbour of an \"L\" cell must be either another \"L\" cell or a \"C\" cell."}, {"label": "list_item", "id": 4, "page_no": 6, "cluster": {"id": 4, "label": "list_item", "bbox": {"l": 138.97299, "t": 371.08481, "r": 480.59229000000005, "b": 391.84673999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9585386514663696, "cells": [{"id": 82, "text": "2.", "bbox": {"l": 138.97299, "t": 371.09479, "r": 146.71991, "b": 379.89175, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "Up-looking cell rule", "bbox": {"l": 151.70099, "t": 371.08481, "r": 252.11203, "b": 379.89175, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": ": The upper neighbour of a \"U\" cell must be either", "bbox": {"l": 252.112, "t": 371.09479, "r": 480.59229000000005, "b": 379.89175, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "another \"U\" cell or a \"C\" cell.", "bbox": {"l": 151.70099, "t": 383.04977, "r": 284.8392, "b": 391.84673999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2. Up-looking cell rule : The upper neighbour of a \"U\" cell must be either another \"U\" cell or a \"C\" cell."}, {"label": "section_header", "id": 14, "page_no": 6, "cluster": {"id": 14, "label": "section_header", "bbox": {"l": 138.97299, "t": 394.99780000000004, "r": 226.07360999999997, "b": 403.80475, "coord_origin": "TOPLEFT"}, "confidence": 0.6506174206733704, "cells": [{"id": 86, "text": "3.", "bbox": {"l": 138.97299, "t": 395.0077800000001, "r": 146.71991, "b": 403.80475, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Cross cell rule", "bbox": {"l": 151.70099, "t": 394.99780000000004, "r": 223.3042, "b": 403.80475, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": ":", "bbox": {"l": 223.30699, "t": 395.0077800000001, "r": 226.07360999999997, "b": 403.80475, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3. Cross cell rule :"}, {"label": "list_item", "id": 13, "page_no": 6, "cluster": {"id": 13, "label": "list_item", "bbox": {"l": 151.70099, "t": 406.96677, "r": 480.59238, "b": 439.67371, "coord_origin": "TOPLEFT"}, "confidence": 0.7247239947319031, "cells": [{"id": 89, "text": "The left neighbour of an \"X\" cell must be either another \"X\" cell or a \"U\"", "bbox": {"l": 151.70099, "t": 406.96677, "r": 480.59238, "b": 415.76373, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "cell, and the upper neighbour of an \"X\" cell must be either another \"X\" cell", "bbox": {"l": 151.70099, "t": 418.9217499999999, "r": 480.59219, "b": 427.71871999999996, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "or an \"L\" cell.", "bbox": {"l": 151.70099, "t": 430.87674, "r": 214.39663999999996, "b": 439.67371, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The left neighbour of an \"X\" cell must be either another \"X\" cell or a \"U\" cell, and the upper neighbour of an \"X\" cell must be either another \"X\" cell or an \"L\" cell."}, {"label": "list_item", "id": 8, "page_no": 6, "cluster": {"id": 8, "label": "list_item", "bbox": {"l": 138.97299, "t": 442.82574, "r": 474.59018, "b": 451.63269, "coord_origin": "TOPLEFT"}, "confidence": 0.9259927272796631, "cells": [{"id": 92, "text": "4.", "bbox": {"l": 138.97299, "t": 442.83572, "r": 146.71991, "b": 451.63269, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "First row rule", "bbox": {"l": 151.70099, "t": 442.82574, "r": 221.32263, "b": 451.63269, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": ": Only \"L\" cells and \"C\" cells are allowed in the first row.", "bbox": {"l": 221.32700000000003, "t": 442.83572, "r": 474.59018, "b": 451.63269, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4. First row rule : Only \"L\" cells and \"C\" cells are allowed in the first row."}, {"label": "list_item", "id": 5, "page_no": 6, "cluster": {"id": 5, "label": "list_item", "bbox": {"l": 138.97299, "t": 454.78375, "r": 480.58746, "b": 475.54568, "coord_origin": "TOPLEFT"}, "confidence": 0.9420599937438965, "cells": [{"id": 95, "text": "5.", "bbox": {"l": 138.97299, "t": 454.7937299999999, "r": 146.71991, "b": 463.5907, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "First column rule", "bbox": {"l": 151.70099, "t": 454.78375, "r": 240.71982, "b": 463.5907, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": ": Only \"U\" cells and \"C\" cells are allowed in the first", "bbox": {"l": 240.71599, "t": 454.7937299999999, "r": 480.58746, "b": 463.5907, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "column.", "bbox": {"l": 151.70099, "t": 466.74872, "r": 186.0072, "b": 475.54568, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5. First column rule : Only \"U\" cells and \"C\" cells are allowed in the first column."}, {"label": "list_item", "id": 1, "page_no": 6, "cluster": {"id": 1, "label": "list_item", "bbox": {"l": 138.97299, "t": 478.69675, "r": 480.59457, "b": 499.45969, "coord_origin": "TOPLEFT"}, "confidence": 0.9617829918861389, "cells": [{"id": 99, "text": "6.", "bbox": {"l": 138.97299, "t": 478.70673, "r": 146.71991, "b": 487.50369, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "Rectangular rule", "bbox": {"l": 151.70099, "t": 478.69675, "r": 235.15768, "b": 487.50369, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": ": The table representation is always rectangular - all rows", "bbox": {"l": 235.15697999999998, "t": 478.70673, "r": 480.59457, "b": 487.50369, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "must have an equal number of tokens, terminated with \"NL\" token.", "bbox": {"l": 151.70099, "t": 490.66272, "r": 448.04147, "b": 499.45969, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "6. Rectangular rule : The table representation is always rectangular - all rows must have an equal number of tokens, terminated with \"NL\" token."}, {"label": "text", "id": 0, "page_no": 6, "cluster": {"id": 0, "label": "text", "bbox": {"l": 134.76498, "t": 512.59271, "r": 480.59583, "b": 640.9416699999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9785562753677368, "cells": [{"id": 103, "text": "The application of these rules gives OTSL a set of unique properties. First", "bbox": {"l": 149.70898, "t": 512.59271, "r": 480.59583, "b": 521.38968, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "of all, the OTSL enforces a strictly rectangular structure representation, where", "bbox": {"l": 134.76498, "t": 524.5477000000001, "r": 480.59079, "b": 533.34467, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "every new-line token starts a new row. As a consequence, all rows and all columns", "bbox": {"l": 134.76498, "t": 536.5027, "r": 480.59482, "b": 545.29967, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "have exactly the same number of tokens, irrespective of cell spans. Secondly, the", "bbox": {"l": 134.76498, "t": 548.4586899999999, "r": 480.58865000000003, "b": 557.25566, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "OTSL representation is unambiguous: Every table structure is represented in one", "bbox": {"l": 134.76498, "t": 560.4137000000001, "r": 480.59365999999994, "b": 569.21066, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "way. In this representation every table cell corresponds to a \"C\"-cell token, which", "bbox": {"l": 134.76498, "t": 572.3687, "r": 480.58673, "b": 581.16566, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "in case of spans is always located in the top-left corner of the table cell definition.", "bbox": {"l": 134.76498, "t": 584.3237, "r": 480.59171, "b": 593.12067, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "Third, OTSL syntax rules are only backward-looking. As a consequence, every", "bbox": {"l": 134.76498, "t": 596.2787, "r": 480.59180000000003, "b": 605.07567, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "predicted token can be validated straight during sequence generation by looking", "bbox": {"l": 134.76498, "t": 608.2347, "r": 480.5936899999999, "b": 617.03166, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "at the previously predicted sequence. As such, OTSL can guarantee that every", "bbox": {"l": 134.76498, "t": 620.1897, "r": 480.59072999999995, "b": 628.98666, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "predicted sequence is syntactically valid.", "bbox": {"l": 134.76498, "t": 632.1447000000001, "r": 311.19769, "b": 640.9416699999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The application of these rules gives OTSL a set of unique properties. First of all, the OTSL enforces a strictly rectangular structure representation, where every new-line token starts a new row. As a consequence, all rows and all columns have exactly the same number of tokens, irrespective of cell spans. Secondly, the OTSL representation is unambiguous: Every table structure is represented in one way. In this representation every table cell corresponds to a \"C\"-cell token, which in case of spans is always located in the top-left corner of the table cell definition. Third, OTSL syntax rules are only backward-looking. As a consequence, every predicted token can be validated straight during sequence generation by looking at the previously predicted sequence. As such, OTSL can guarantee that every predicted sequence is syntactically valid."}, {"label": "text", "id": 2, "page_no": 6, "cluster": {"id": 2, "label": "text", "bbox": {"l": 134.76498, "t": 644.1026899999999, "r": 480.59265, "b": 664.8546699999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9590610861778259, "cells": [{"id": 114, "text": "These characteristics can be easily learned by sequence generator networks,", "bbox": {"l": 149.70898, "t": 644.1026899999999, "r": 480.59186, "b": 652.89966, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "as we demonstrate further below. We find strong indications that this pattern", "bbox": {"l": 134.76498, "t": 656.05769, "r": 480.59265, "b": 664.8546699999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "These characteristics can be easily learned by sequence generator networks, as we demonstrate further below. We find strong indications that this pattern"}], "body": [{"label": "caption", "id": 6, "page_no": 6, "cluster": {"id": 6, "label": "caption", "bbox": {"l": 134.765, "t": 125.79918999999984, "r": 480.5874, "b": 155.84966999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9333080053329468, "cells": [{"id": 2, "text": "Fig. 3.", "bbox": {"l": 134.765, "t": 125.79918999999984, "r": 162.64424, "b": 133.72551999999996, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "OTSL description of table structure: A - table example; B - graphical repre-", "bbox": {"l": 166.276, "t": 125.86200000000008, "r": 480.58675999999997, "b": 133.93169999999998, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "sentation of table structure; C - mapping structure on a grid; D - OTSL structure", "bbox": {"l": 134.765, "t": 136.82097999999996, "r": 480.5874, "b": 144.89068999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "encoding; E - explanation on cell encoding", "bbox": {"l": 134.765, "t": 147.77997000000005, "r": 306.1156, "b": 155.84966999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Fig. 3. OTSL description of table structure: A - table example; B - graphical representation of table structure; C - mapping structure on a grid; D - OTSL structure encoding; E - explanation on cell encoding"}, {"label": "picture", "id": 12, "page_no": 6, "cluster": {"id": 12, "label": "picture", "bbox": {"l": 164.65028381347656, "t": 163.79708862304688, "r": 449.5505676269531, "b": 280.3409423828125, "coord_origin": "TOPLEFT"}, "confidence": 0.7868534922599792, "cells": [{"id": 6, "text": "C", "bbox": {"l": 374.49326, "t": 168.59362999999996, "r": 381.66843, "b": 177.91540999999995, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "C", "bbox": {"l": 398.74011, "t": 168.50005999999996, "r": 405.91528, "b": 177.82183999999995, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "C", "bbox": {"l": 373.76862, "t": 192.92553999999996, "r": 380.94379, "b": 202.24730999999997, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "C", "bbox": {"l": 386.66388, "t": 193.07061999999996, "r": 393.83905, "b": 202.39239999999995, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "C", "bbox": {"l": 386.68707, "t": 205.13756999999998, "r": 393.86224, "b": 214.45934999999997, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "C", "bbox": {"l": 398.65729, "t": 180.73279000000002, "r": 405.83246, "b": 190.05457, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "C", "bbox": {"l": 410.77908, "t": 180.73859000000004, "r": 417.95425, "b": 190.06035999999995, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "C", "bbox": {"l": 422.90503, "t": 180.65247, "r": 430.08020000000005, "b": 189.97424, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "C", "bbox": {"l": 398.7807, "t": 192.98865, "r": 405.95587, "b": 202.31042000000002, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "C", "bbox": {"l": 410.90164, "t": 192.99487, "r": 418.07681, "b": 202.31664999999998, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "C", "bbox": {"l": 423.02753, "t": 192.909, "r": 430.2027, "b": 202.23077, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "C", "bbox": {"l": 398.78235, "t": 205.31573000000003, "r": 405.95752, "b": 214.63751000000002, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "C", "bbox": {"l": 410.90414, "t": 205.32196, "r": 418.07932, "b": 214.64373999999998, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "C", "bbox": {"l": 423.03003, "t": 205.23614999999995, "r": 430.20520000000005, "b": 214.55791999999997, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "C", "bbox": {"l": 386.50574, "t": 217.03882, "r": 393.68091, "b": 226.36059999999998, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "C", "bbox": {"l": 398.60181, "t": 217.21704, "r": 405.77698, "b": 226.53882, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "C", "bbox": {"l": 410.72275, "t": 217.22321, "r": 417.89792, "b": 226.54498, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "C", "bbox": {"l": 422.84869, "t": 217.13738999999998, "r": 430.02386, "b": 226.45916999999997, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "NL", "bbox": {"l": 435.16009999999994, "t": 167.69011999999998, "r": 447.86273, "b": 177.01189999999997, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "NL", "bbox": {"l": 435.44415, "t": 180.20025999999996, "r": 448.14679, "b": 189.52202999999997, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "NL", "bbox": {"l": 435.46735, "t": 192.49474999999995, "r": 448.16998000000007, "b": 201.81652999999994, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "NL", "bbox": {"l": 435.38202, "t": 204.83025999999995, "r": 448.08466, "b": 214.15204000000006, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "NL", "bbox": {"l": 435.59906, "t": 217.2337, "r": 448.3017, "b": 226.55548, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "U", "bbox": {"l": 374.14957, "t": 205.23492, "r": 381.32474, "b": 214.55669999999998, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "U", "bbox": {"l": 374.0419, "t": 217.14648, "r": 381.21707, "b": 226.46826, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "U", "bbox": {"l": 374.34418, "t": 180.93488000000002, "r": 381.51935, "b": 190.25665000000004, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "L", "bbox": {"l": 387.76285, "t": 168.57788000000005, "r": 393.28833, "b": 177.89966000000004, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "L", "bbox": {"l": 411.86395, "t": 168.06195000000002, "r": 417.38943, "b": 177.38373, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "L", "bbox": {"l": 423.33563, "t": 167.93439, "r": 428.86111, "b": 177.25616000000002, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "X", "bbox": {"l": 387.13593, "t": 180.78576999999996, "r": 393.76453, "b": 190.10753999999997, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "C", "bbox": {"l": 282.2594, "t": 244.50878999999998, "r": 289.43457, "b": 253.83056999999997, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "U", "bbox": {"l": 282.11035, "t": 256.85022000000004, "r": 289.28552, "b": 266.172, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "U", "bbox": {"l": 282.40848, "t": 269.13300000000004, "r": 289.58365, "b": 278.45477000000005, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "L", "bbox": {"l": 295.52902, "t": 244.49347, "r": 301.0545, "b": 253.81525, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "L", "bbox": {"l": 307.46613, "t": 244.57372999999995, "r": 312.99161, "b": 253.89550999999994, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "L", "bbox": {"l": 318.76886, "t": 244.44037000000003, "r": 324.29434, "b": 253.76215000000002, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "X", "bbox": {"l": 294.9021, "t": 256.70154, "r": 301.03976, "b": 266.02332, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "X X", "bbox": {"l": 307.17743, "t": 256.70154, "r": 325.59039, "b": 266.02332, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "X", "bbox": {"l": 294.78949, "t": 269.25420999999994, "r": 300.92715, "b": 278.57599000000005, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "X X", "bbox": {"l": 307.06482, "t": 269.25420999999994, "r": 325.47778, "b": 278.57599000000005, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "C", "bbox": {"l": 195.93939, "t": 268.74798999999996, "r": 203.11456, "b": 278.06976, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "L", "bbox": {"l": 209.20891, "t": 268.73267, "r": 214.73439, "b": 278.05444, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "L", "bbox": {"l": 221.14551, "t": 268.81293000000005, "r": 226.67099, "b": 278.13469999999995, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "L", "bbox": {"l": 232.44858, "t": 268.67957, "r": 237.97405999999998, "b": 278.00134, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "C", "bbox": {"l": 196.21715, "t": 244.53961000000004, "r": 203.39232, "b": 253.86139000000003, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "C", "bbox": {"l": 250.32143, "t": 244.09813999999994, "r": 257.49661, "b": 253.41992000000005, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "U", "bbox": {"l": 250.17235999999997, "t": 256.43951000000004, "r": 257.34753, "b": 265.76129000000003, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "U", "bbox": {"l": 250.47049000000004, "t": 268.72222999999997, "r": 257.64566, "b": 278.04400999999996, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "1", "bbox": {"l": 334.51135, "t": 242.99463000000003, "r": 337.22485, "b": 249.20911, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "- simple cells: \"C\"", "bbox": {"l": 339.93835, "t": 242.99463000000003, "r": 391.49472, "b": 249.20911, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "2", "bbox": {"l": 334.51135, "t": 252.93255999999997, "r": 337.33313, "b": 259.14703, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "- horizontal merges: \"C\", \"L\"", "bbox": {"l": 340.15491, "t": 252.93255999999997, "r": 421.98624, "b": 259.14703, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "3", "bbox": {"l": 334.51135, "t": 262.87048000000004, "r": 337.29868, "b": 269.08496, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "- vertical merges: \"C\", \"U\"", "bbox": {"l": 340.086, "t": 262.87048000000004, "r": 415.34375, "b": 269.08496, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "4", "bbox": {"l": 334.51135, "t": 272.80841, "r": 337.30188, "b": 279.02288999999996, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "- 2d merges: \"C\", \"L\", \"U\", \"X\"", "bbox": {"l": 340.09241, "t": 272.80841, "r": 426.59875, "b": 279.02288999999996, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "1", "bbox": {"l": 185.67178, "t": 244.04224, "r": 189.35544, "b": 250.25671, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "2", "bbox": {"l": 185.96759, "t": 268.34766, "r": 189.65125, "b": 274.56213, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "3", "bbox": {"l": 239.34152, "t": 243.62523999999996, "r": 243.02518, "b": 249.83972000000006, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "4", "bbox": {"l": 271.32852, "t": 243.49390000000005, "r": 275.01218, "b": 249.70836999999995, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "2", "bbox": {"l": 229.81627, "t": 166.51495, "r": 233.49992000000003, "b": 172.72942999999998, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "1", "bbox": {"l": 257.24402, "t": 189.961, "r": 260.92767, "b": 196.17548, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "3", "bbox": {"l": 186.87526, "t": 177.97668, "r": 190.55891, "b": 184.19115999999997, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "4", "bbox": {"l": 196.48746, "t": 169.01520000000005, "r": 200.17111, "b": 175.22968000000003, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "A", "bbox": {"l": 169.74728, "t": 167.88225999999997, "r": 175.72659, "b": 175.65039000000002, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "B", "bbox": {"l": 169.74728, "t": 206.83867999999995, "r": 175.72659, "b": 214.60681, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "C", "bbox": {"l": 274.29419, "t": 168.27972, "r": 280.2735, "b": 176.04785000000004, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "D", "bbox": {"l": 359.56152, "t": 168.27972, "r": 365.54083, "b": 176.04785000000004, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "E", "bbox": {"l": 169.74728, "t": 243.21149000000003, "r": 175.27112, "b": 250.97960999999998, "coord_origin": "TOPLEFT"}}], "children": [{"id": 19, "label": "text", "bbox": {"l": 374.49326, "t": 168.59362999999996, "r": 381.66843, "b": 177.91540999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": "C", "bbox": {"l": 374.49326, "t": 168.59362999999996, "r": 381.66843, "b": 177.91540999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 398.74011, "t": 168.50005999999996, "r": 405.91528, "b": 177.82183999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "C", "bbox": {"l": 398.74011, "t": 168.50005999999996, "r": 405.91528, "b": 177.82183999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 373.76862, "t": 192.92553999999996, "r": 380.94379, "b": 202.24730999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "C", "bbox": {"l": 373.76862, "t": 192.92553999999996, "r": 380.94379, "b": 202.24730999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 386.66388, "t": 193.07061999999996, "r": 393.83905, "b": 202.39239999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "C", "bbox": {"l": 386.66388, "t": 193.07061999999996, "r": 393.83905, "b": 202.39239999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 386.68707, "t": 205.13756999999998, "r": 393.86224, "b": 214.45934999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "C", "bbox": {"l": 386.68707, "t": 205.13756999999998, "r": 393.86224, "b": 214.45934999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 398.65729, "t": 180.73279000000002, "r": 405.83246, "b": 190.05457, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "C", "bbox": {"l": 398.65729, "t": 180.73279000000002, "r": 405.83246, "b": 190.05457, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 410.77908, "t": 180.73859000000004, "r": 417.95425, "b": 190.06035999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "C", "bbox": {"l": 410.77908, "t": 180.73859000000004, "r": 417.95425, "b": 190.06035999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 422.90503, "t": 180.65247, "r": 430.08020000000005, "b": 189.97424, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "C", "bbox": {"l": 422.90503, "t": 180.65247, "r": 430.08020000000005, "b": 189.97424, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 398.7807, "t": 192.98865, "r": 405.95587, "b": 202.31042000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "C", "bbox": {"l": 398.7807, "t": 192.98865, "r": 405.95587, "b": 202.31042000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 410.90164, "t": 192.99487, "r": 418.07681, "b": 202.31664999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "C", "bbox": {"l": 410.90164, "t": 192.99487, "r": 418.07681, "b": 202.31664999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 423.02753, "t": 192.909, "r": 430.2027, "b": 202.23077, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "C", "bbox": {"l": 423.02753, "t": 192.909, "r": 430.2027, "b": 202.23077, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 398.78235, "t": 205.31573000000003, "r": 405.95752, "b": 214.63751000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "C", "bbox": {"l": 398.78235, "t": 205.31573000000003, "r": 405.95752, "b": 214.63751000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 410.90414, "t": 205.32196, "r": 418.07932, "b": 214.64373999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "C", "bbox": {"l": 410.90414, "t": 205.32196, "r": 418.07932, "b": 214.64373999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 423.03003, "t": 205.23614999999995, "r": 430.20520000000005, "b": 214.55791999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "C", "bbox": {"l": 423.03003, "t": 205.23614999999995, "r": 430.20520000000005, "b": 214.55791999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 386.50574, "t": 217.03882, "r": 393.68091, "b": 226.36059999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "C", "bbox": {"l": 386.50574, "t": 217.03882, "r": 393.68091, "b": 226.36059999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 398.60181, "t": 217.21704, "r": 405.77698, "b": 226.53882, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "C", "bbox": {"l": 398.60181, "t": 217.21704, "r": 405.77698, "b": 226.53882, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 410.72275, "t": 217.22321, "r": 417.89792, "b": 226.54498, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "C", "bbox": {"l": 410.72275, "t": 217.22321, "r": 417.89792, "b": 226.54498, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 422.84869, "t": 217.13738999999998, "r": 430.02386, "b": 226.45916999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "C", "bbox": {"l": 422.84869, "t": 217.13738999999998, "r": 430.02386, "b": 226.45916999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 435.16009999999994, "t": 167.69011999999998, "r": 447.86273, "b": 177.01189999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "NL", "bbox": {"l": 435.16009999999994, "t": 167.69011999999998, "r": 447.86273, "b": 177.01189999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 435.44415, "t": 180.20025999999996, "r": 448.14679, "b": 189.52202999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "NL", "bbox": {"l": 435.44415, "t": 180.20025999999996, "r": 448.14679, "b": 189.52202999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 435.46735, "t": 192.49474999999995, "r": 448.16998000000007, "b": 201.81652999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "NL", "bbox": {"l": 435.46735, "t": 192.49474999999995, "r": 448.16998000000007, "b": 201.81652999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 435.38202, "t": 204.83025999999995, "r": 448.08466, "b": 214.15204000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "NL", "bbox": {"l": 435.38202, "t": 204.83025999999995, "r": 448.08466, "b": 214.15204000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 435.59906, "t": 217.2337, "r": 448.3017, "b": 226.55548, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "NL", "bbox": {"l": 435.59906, "t": 217.2337, "r": 448.3017, "b": 226.55548, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 374.14957, "t": 205.23492, "r": 381.32474, "b": 214.55669999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "U", "bbox": {"l": 374.14957, "t": 205.23492, "r": 381.32474, "b": 214.55669999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 374.0419, "t": 217.14648, "r": 381.21707, "b": 226.46826, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "U", "bbox": {"l": 374.0419, "t": 217.14648, "r": 381.21707, "b": 226.46826, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 374.34418, "t": 180.93488000000002, "r": 381.51935, "b": 190.25665000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "U", "bbox": {"l": 374.34418, "t": 180.93488000000002, "r": 381.51935, "b": 190.25665000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 387.76285, "t": 168.57788000000005, "r": 393.28833, "b": 177.89966000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "L", "bbox": {"l": 387.76285, "t": 168.57788000000005, "r": 393.28833, "b": 177.89966000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 411.86395, "t": 168.06195000000002, "r": 417.38943, "b": 177.38373, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "L", "bbox": {"l": 411.86395, "t": 168.06195000000002, "r": 417.38943, "b": 177.38373, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 423.33563, "t": 167.93439, "r": 428.86111, "b": 177.25616000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "L", "bbox": {"l": 423.33563, "t": 167.93439, "r": 428.86111, "b": 177.25616000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 387.13593, "t": 180.78576999999996, "r": 393.76453, "b": 190.10753999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "X", "bbox": {"l": 387.13593, "t": 180.78576999999996, "r": 393.76453, "b": 190.10753999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 282.2594, "t": 244.50878999999998, "r": 289.43457, "b": 253.83056999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "C", "bbox": {"l": 282.2594, "t": 244.50878999999998, "r": 289.43457, "b": 253.83056999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 282.11035, "t": 256.85022000000004, "r": 289.28552, "b": 266.172, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "U", "bbox": {"l": 282.11035, "t": 256.85022000000004, "r": 289.28552, "b": 266.172, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 282.40848, "t": 269.13300000000004, "r": 289.58365, "b": 278.45477000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "U", "bbox": {"l": 282.40848, "t": 269.13300000000004, "r": 289.58365, "b": 278.45477000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 295.52902, "t": 244.49347, "r": 301.0545, "b": 253.81525, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "L", "bbox": {"l": 295.52902, "t": 244.49347, "r": 301.0545, "b": 253.81525, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 307.46613, "t": 244.57372999999995, "r": 312.99161, "b": 253.89550999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "L", "bbox": {"l": 307.46613, "t": 244.57372999999995, "r": 312.99161, "b": 253.89550999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 318.76886, "t": 244.44037000000003, "r": 324.29434, "b": 253.76215000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "L", "bbox": {"l": 318.76886, "t": 244.44037000000003, "r": 324.29434, "b": 253.76215000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 294.9021, "t": 256.70154, "r": 301.03976, "b": 266.02332, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "X", "bbox": {"l": 294.9021, "t": 256.70154, "r": 301.03976, "b": 266.02332, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 307.17743, "t": 256.70154, "r": 325.59039, "b": 266.02332, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "X X", "bbox": {"l": 307.17743, "t": 256.70154, "r": 325.59039, "b": 266.02332, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 294.78949, "t": 269.25420999999994, "r": 300.92715, "b": 278.57599000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "X", "bbox": {"l": 294.78949, "t": 269.25420999999994, "r": 300.92715, "b": 278.57599000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 307.06482, "t": 269.25420999999994, "r": 325.47778, "b": 278.57599000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "X X", "bbox": {"l": 307.06482, "t": 269.25420999999994, "r": 325.47778, "b": 278.57599000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 195.93939, "t": 268.74798999999996, "r": 203.11456, "b": 278.06976, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "C", "bbox": {"l": 195.93939, "t": 268.74798999999996, "r": 203.11456, "b": 278.06976, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 209.20891, "t": 268.73267, "r": 214.73439, "b": 278.05444, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "L", "bbox": {"l": 209.20891, "t": 268.73267, "r": 214.73439, "b": 278.05444, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 221.14551, "t": 268.81293000000005, "r": 226.67099, "b": 278.13469999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "L", "bbox": {"l": 221.14551, "t": 268.81293000000005, "r": 226.67099, "b": 278.13469999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 232.44858, "t": 268.67957, "r": 237.97405999999998, "b": 278.00134, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "L", "bbox": {"l": 232.44858, "t": 268.67957, "r": 237.97405999999998, "b": 278.00134, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 196.21715, "t": 244.53961000000004, "r": 203.39232, "b": 253.86139000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "C", "bbox": {"l": 196.21715, "t": 244.53961000000004, "r": 203.39232, "b": 253.86139000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 250.32143, "t": 244.09813999999994, "r": 257.49661, "b": 253.41992000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "C", "bbox": {"l": 250.32143, "t": 244.09813999999994, "r": 257.49661, "b": 253.41992000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 250.17235999999997, "t": 256.43951000000004, "r": 257.34753, "b": 265.76129000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "U", "bbox": {"l": 250.17235999999997, "t": 256.43951000000004, "r": 257.34753, "b": 265.76129000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 250.47049000000004, "t": 268.72222999999997, "r": 257.64566, "b": 278.04400999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "U", "bbox": {"l": 250.47049000000004, "t": 268.72222999999997, "r": 257.64566, "b": 278.04400999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 334.51135, "t": 242.99463000000003, "r": 337.22485, "b": 249.20911, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "1", "bbox": {"l": 334.51135, "t": 242.99463000000003, "r": 337.22485, "b": 249.20911, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 339.93835, "t": 242.99463000000003, "r": 391.49472, "b": 249.20911, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "- simple cells: \"C\"", "bbox": {"l": 339.93835, "t": 242.99463000000003, "r": 391.49472, "b": 249.20911, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 334.51135, "t": 252.93255999999997, "r": 337.33313, "b": 259.14703, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "2", "bbox": {"l": 334.51135, "t": 252.93255999999997, "r": 337.33313, "b": 259.14703, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 340.15491, "t": 252.93255999999997, "r": 421.98624, "b": 259.14703, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "- horizontal merges: \"C\", \"L\"", "bbox": {"l": 340.15491, "t": 252.93255999999997, "r": 421.98624, "b": 259.14703, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 334.51135, "t": 262.87048000000004, "r": 337.29868, "b": 269.08496, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "3", "bbox": {"l": 334.51135, "t": 262.87048000000004, "r": 337.29868, "b": 269.08496, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 340.086, "t": 262.87048000000004, "r": 415.34375, "b": 269.08496, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "- vertical merges: \"C\", \"U\"", "bbox": {"l": 340.086, "t": 262.87048000000004, "r": 415.34375, "b": 269.08496, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "list_item", "bbox": {"l": 334.51135, "t": 272.80841, "r": 426.59875, "b": 279.02288999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.5250625610351562, "cells": [{"id": 60, "text": "4", "bbox": {"l": 334.51135, "t": 272.80841, "r": 337.30188, "b": 279.02288999999996, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "- 2d merges: \"C\", \"L\", \"U\", \"X\"", "bbox": {"l": 340.09241, "t": 272.80841, "r": 426.59875, "b": 279.02288999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 185.67178, "t": 244.04224, "r": 189.35544, "b": 250.25671, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "1", "bbox": {"l": 185.67178, "t": 244.04224, "r": 189.35544, "b": 250.25671, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 185.96759, "t": 268.34766, "r": 189.65125, "b": 274.56213, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "2", "bbox": {"l": 185.96759, "t": 268.34766, "r": 189.65125, "b": 274.56213, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 239.34152, "t": 243.62523999999996, "r": 243.02518, "b": 249.83972000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "3", "bbox": {"l": 239.34152, "t": 243.62523999999996, "r": 243.02518, "b": 249.83972000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 271.32852, "t": 243.49390000000005, "r": 275.01218, "b": 249.70836999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "4", "bbox": {"l": 271.32852, "t": 243.49390000000005, "r": 275.01218, "b": 249.70836999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 229.81627, "t": 166.51495, "r": 233.49992000000003, "b": 172.72942999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "2", "bbox": {"l": 229.81627, "t": 166.51495, "r": 233.49992000000003, "b": 172.72942999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 257.24402, "t": 189.961, "r": 260.92767, "b": 196.17548, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "1", "bbox": {"l": 257.24402, "t": 189.961, "r": 260.92767, "b": 196.17548, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 186.87526, "t": 177.97668, "r": 190.55891, "b": 184.19115999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "3", "bbox": {"l": 186.87526, "t": 177.97668, "r": 190.55891, "b": 184.19115999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 196.48746, "t": 169.01520000000005, "r": 200.17111, "b": 175.22968000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "4", "bbox": {"l": 196.48746, "t": 169.01520000000005, "r": 200.17111, "b": 175.22968000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 169.74728, "t": 167.88225999999997, "r": 175.72659, "b": 175.65039000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "A", "bbox": {"l": 169.74728, "t": 167.88225999999997, "r": 175.72659, "b": 175.65039000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 169.74728, "t": 206.83867999999995, "r": 175.72659, "b": 214.60681, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "B", "bbox": {"l": 169.74728, "t": 206.83867999999995, "r": 175.72659, "b": 214.60681, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 274.29419, "t": 168.27972, "r": 280.2735, "b": 176.04785000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "C", "bbox": {"l": 274.29419, "t": 168.27972, "r": 280.2735, "b": 176.04785000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 359.56152, "t": 168.27972, "r": 365.54083, "b": 176.04785000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "D", "bbox": {"l": 359.56152, "t": 168.27972, "r": 365.54083, "b": 176.04785000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 169.74728, "t": 243.21149000000003, "r": 175.27112, "b": 250.97960999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "E", "bbox": {"l": 169.74728, "t": 243.21149000000003, "r": 175.27112, "b": 250.97960999999998, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "section_header", "id": 9, "page_no": 6, "cluster": {"id": 9, "label": "section_header", "bbox": {"l": 134.765, "t": 305.29581, "r": 246.65197999999998, "b": 314.10275, "coord_origin": "TOPLEFT"}, "confidence": 0.9233023524284363, "cells": [{"id": 75, "text": "4.2", "bbox": {"l": 134.765, "t": 305.29581, "r": 149.40205, "b": 314.10275, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "Language Syntax", "bbox": {"l": 160.85904, "t": 305.29581, "r": 246.65197999999998, "b": 314.10275, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4.2 Language Syntax"}, {"label": "text", "id": 10, "page_no": 6, "cluster": {"id": 10, "label": "text", "bbox": {"l": 134.765, "t": 325.24777, "r": 363.79617, "b": 334.04474, "coord_origin": "TOPLEFT"}, "confidence": 0.9169168472290039, "cells": [{"id": 77, "text": "The OTSL representation follows these syntax rules:", "bbox": {"l": 134.765, "t": 325.24777, "r": 363.79617, "b": 334.04474, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The OTSL representation follows these syntax rules:"}, {"label": "list_item", "id": 3, "page_no": 6, "cluster": {"id": 3, "label": "list_item", "bbox": {"l": 138.97299, "t": 347.17081, "r": 480.58902, "b": 367.93375, "coord_origin": "TOPLEFT"}, "confidence": 0.9588112235069275, "cells": [{"id": 78, "text": "1.", "bbox": {"l": 138.97299, "t": 347.18079, "r": 146.71991, "b": 355.97775, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "Left-looking cell rule", "bbox": {"l": 151.70099, "t": 347.17081, "r": 257.37927, "b": 355.97775, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": ": The left neighbour of an \"L\" cell must be either", "bbox": {"l": 257.383, "t": 347.18079, "r": 480.58902, "b": 355.97775, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "another \"L\" cell or a \"C\" cell.", "bbox": {"l": 151.70099, "t": 359.13678, "r": 283.59387, "b": 367.93375, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1. Left-looking cell rule : The left neighbour of an \"L\" cell must be either another \"L\" cell or a \"C\" cell."}, {"label": "list_item", "id": 4, "page_no": 6, "cluster": {"id": 4, "label": "list_item", "bbox": {"l": 138.97299, "t": 371.08481, "r": 480.59229000000005, "b": 391.84673999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9585386514663696, "cells": [{"id": 82, "text": "2.", "bbox": {"l": 138.97299, "t": 371.09479, "r": 146.71991, "b": 379.89175, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "Up-looking cell rule", "bbox": {"l": 151.70099, "t": 371.08481, "r": 252.11203, "b": 379.89175, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": ": The upper neighbour of a \"U\" cell must be either", "bbox": {"l": 252.112, "t": 371.09479, "r": 480.59229000000005, "b": 379.89175, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "another \"U\" cell or a \"C\" cell.", "bbox": {"l": 151.70099, "t": 383.04977, "r": 284.8392, "b": 391.84673999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2. Up-looking cell rule : The upper neighbour of a \"U\" cell must be either another \"U\" cell or a \"C\" cell."}, {"label": "section_header", "id": 14, "page_no": 6, "cluster": {"id": 14, "label": "section_header", "bbox": {"l": 138.97299, "t": 394.99780000000004, "r": 226.07360999999997, "b": 403.80475, "coord_origin": "TOPLEFT"}, "confidence": 0.6506174206733704, "cells": [{"id": 86, "text": "3.", "bbox": {"l": 138.97299, "t": 395.0077800000001, "r": 146.71991, "b": 403.80475, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Cross cell rule", "bbox": {"l": 151.70099, "t": 394.99780000000004, "r": 223.3042, "b": 403.80475, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": ":", "bbox": {"l": 223.30699, "t": 395.0077800000001, "r": 226.07360999999997, "b": 403.80475, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3. Cross cell rule :"}, {"label": "list_item", "id": 13, "page_no": 6, "cluster": {"id": 13, "label": "list_item", "bbox": {"l": 151.70099, "t": 406.96677, "r": 480.59238, "b": 439.67371, "coord_origin": "TOPLEFT"}, "confidence": 0.7247239947319031, "cells": [{"id": 89, "text": "The left neighbour of an \"X\" cell must be either another \"X\" cell or a \"U\"", "bbox": {"l": 151.70099, "t": 406.96677, "r": 480.59238, "b": 415.76373, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "cell, and the upper neighbour of an \"X\" cell must be either another \"X\" cell", "bbox": {"l": 151.70099, "t": 418.9217499999999, "r": 480.59219, "b": 427.71871999999996, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "or an \"L\" cell.", "bbox": {"l": 151.70099, "t": 430.87674, "r": 214.39663999999996, "b": 439.67371, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The left neighbour of an \"X\" cell must be either another \"X\" cell or a \"U\" cell, and the upper neighbour of an \"X\" cell must be either another \"X\" cell or an \"L\" cell."}, {"label": "list_item", "id": 8, "page_no": 6, "cluster": {"id": 8, "label": "list_item", "bbox": {"l": 138.97299, "t": 442.82574, "r": 474.59018, "b": 451.63269, "coord_origin": "TOPLEFT"}, "confidence": 0.9259927272796631, "cells": [{"id": 92, "text": "4.", "bbox": {"l": 138.97299, "t": 442.83572, "r": 146.71991, "b": 451.63269, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "First row rule", "bbox": {"l": 151.70099, "t": 442.82574, "r": 221.32263, "b": 451.63269, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": ": Only \"L\" cells and \"C\" cells are allowed in the first row.", "bbox": {"l": 221.32700000000003, "t": 442.83572, "r": 474.59018, "b": 451.63269, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4. First row rule : Only \"L\" cells and \"C\" cells are allowed in the first row."}, {"label": "list_item", "id": 5, "page_no": 6, "cluster": {"id": 5, "label": "list_item", "bbox": {"l": 138.97299, "t": 454.78375, "r": 480.58746, "b": 475.54568, "coord_origin": "TOPLEFT"}, "confidence": 0.9420599937438965, "cells": [{"id": 95, "text": "5.", "bbox": {"l": 138.97299, "t": 454.7937299999999, "r": 146.71991, "b": 463.5907, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "First column rule", "bbox": {"l": 151.70099, "t": 454.78375, "r": 240.71982, "b": 463.5907, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": ": Only \"U\" cells and \"C\" cells are allowed in the first", "bbox": {"l": 240.71599, "t": 454.7937299999999, "r": 480.58746, "b": 463.5907, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "column.", "bbox": {"l": 151.70099, "t": 466.74872, "r": 186.0072, "b": 475.54568, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5. First column rule : Only \"U\" cells and \"C\" cells are allowed in the first column."}, {"label": "list_item", "id": 1, "page_no": 6, "cluster": {"id": 1, "label": "list_item", "bbox": {"l": 138.97299, "t": 478.69675, "r": 480.59457, "b": 499.45969, "coord_origin": "TOPLEFT"}, "confidence": 0.9617829918861389, "cells": [{"id": 99, "text": "6.", "bbox": {"l": 138.97299, "t": 478.70673, "r": 146.71991, "b": 487.50369, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "Rectangular rule", "bbox": {"l": 151.70099, "t": 478.69675, "r": 235.15768, "b": 487.50369, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": ": The table representation is always rectangular - all rows", "bbox": {"l": 235.15697999999998, "t": 478.70673, "r": 480.59457, "b": 487.50369, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "must have an equal number of tokens, terminated with \"NL\" token.", "bbox": {"l": 151.70099, "t": 490.66272, "r": 448.04147, "b": 499.45969, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "6. Rectangular rule : The table representation is always rectangular - all rows must have an equal number of tokens, terminated with \"NL\" token."}, {"label": "text", "id": 0, "page_no": 6, "cluster": {"id": 0, "label": "text", "bbox": {"l": 134.76498, "t": 512.59271, "r": 480.59583, "b": 640.9416699999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9785562753677368, "cells": [{"id": 103, "text": "The application of these rules gives OTSL a set of unique properties. First", "bbox": {"l": 149.70898, "t": 512.59271, "r": 480.59583, "b": 521.38968, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "of all, the OTSL enforces a strictly rectangular structure representation, where", "bbox": {"l": 134.76498, "t": 524.5477000000001, "r": 480.59079, "b": 533.34467, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "every new-line token starts a new row. As a consequence, all rows and all columns", "bbox": {"l": 134.76498, "t": 536.5027, "r": 480.59482, "b": 545.29967, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "have exactly the same number of tokens, irrespective of cell spans. Secondly, the", "bbox": {"l": 134.76498, "t": 548.4586899999999, "r": 480.58865000000003, "b": 557.25566, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "OTSL representation is unambiguous: Every table structure is represented in one", "bbox": {"l": 134.76498, "t": 560.4137000000001, "r": 480.59365999999994, "b": 569.21066, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "way. In this representation every table cell corresponds to a \"C\"-cell token, which", "bbox": {"l": 134.76498, "t": 572.3687, "r": 480.58673, "b": 581.16566, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "in case of spans is always located in the top-left corner of the table cell definition.", "bbox": {"l": 134.76498, "t": 584.3237, "r": 480.59171, "b": 593.12067, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "Third, OTSL syntax rules are only backward-looking. As a consequence, every", "bbox": {"l": 134.76498, "t": 596.2787, "r": 480.59180000000003, "b": 605.07567, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "predicted token can be validated straight during sequence generation by looking", "bbox": {"l": 134.76498, "t": 608.2347, "r": 480.5936899999999, "b": 617.03166, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "at the previously predicted sequence. As such, OTSL can guarantee that every", "bbox": {"l": 134.76498, "t": 620.1897, "r": 480.59072999999995, "b": 628.98666, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "predicted sequence is syntactically valid.", "bbox": {"l": 134.76498, "t": 632.1447000000001, "r": 311.19769, "b": 640.9416699999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The application of these rules gives OTSL a set of unique properties. First of all, the OTSL enforces a strictly rectangular structure representation, where every new-line token starts a new row. As a consequence, all rows and all columns have exactly the same number of tokens, irrespective of cell spans. Secondly, the OTSL representation is unambiguous: Every table structure is represented in one way. In this representation every table cell corresponds to a \"C\"-cell token, which in case of spans is always located in the top-left corner of the table cell definition. Third, OTSL syntax rules are only backward-looking. As a consequence, every predicted token can be validated straight during sequence generation by looking at the previously predicted sequence. As such, OTSL can guarantee that every predicted sequence is syntactically valid."}, {"label": "text", "id": 2, "page_no": 6, "cluster": {"id": 2, "label": "text", "bbox": {"l": 134.76498, "t": 644.1026899999999, "r": 480.59265, "b": 664.8546699999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9590610861778259, "cells": [{"id": 114, "text": "These characteristics can be easily learned by sequence generator networks,", "bbox": {"l": 149.70898, "t": 644.1026899999999, "r": 480.59186, "b": 652.89966, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "as we demonstrate further below. We find strong indications that this pattern", "bbox": {"l": 134.76498, "t": 656.05769, "r": 480.59265, "b": 664.8546699999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "These characteristics can be easily learned by sequence generator networks, as we demonstrate further below. We find strong indications that this pattern"}], "headers": [{"label": "page_header", "id": 7, "page_no": 6, "cluster": {"id": 7, "label": "page_header", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.932651162147522, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Optimized Table Tokenization for Table Structure Recognition"}, {"label": "page_header", "id": 11, "page_no": 6, "cluster": {"id": 11, "label": "page_header", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8749732375144958, "cells": [{"id": 1, "text": "7", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "7"}]}}, {"page_no": 7, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "8", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "M.", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 178.07675, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37415, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "reduces significantly the column drift seen in the HTML based models (see Fig-", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.58884000000006, "b": 127.73077, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "ure 5).", "bbox": {"l": 134.765, "t": 130.88878999999997, "r": 163.56389, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "4.3", "bbox": {"l": 134.765, "t": 161.55682000000002, "r": 149.40205, "b": 170.36377000000005, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Error-detection and -mitigation", "bbox": {"l": 160.85904, "t": 161.55682000000002, "r": 319.34708, "b": 170.36377000000005, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "The design of OTSL allows to validate a table structure easily on an unfinished", "bbox": {"l": 134.765, "t": 182.28179999999998, "r": 480.59572999999995, "b": 191.0788, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "sequence. The detection of an invalid sequence token is a clear indication of a", "bbox": {"l": 134.765, "t": 194.23779000000002, "r": 480.59473, "b": 203.03479000000004, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "prediction mistake, however a valid sequence by itself does not guarantee pre-", "bbox": {"l": 134.765, "t": 206.19281, "r": 480.58678999999995, "b": 214.98981000000003, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "diction correctness. Different heuristics can be used to correct token errors in", "bbox": {"l": 134.765, "t": 218.14783, "r": 480.59177000000005, "b": 226.94482000000005, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "an invalid sequence and thus increase the chances for accurate predictions. Such", "bbox": {"l": 134.765, "t": 230.10284000000001, "r": 480.58768, "b": 238.89984000000004, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "heuristics can be applied either after the prediction of each token, or at the end", "bbox": {"l": 134.765, "t": 242.05786, "r": 480.5867, "b": 250.85486000000003, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "on the entire predicted sequence. For example a simple heuristic which can cor-", "bbox": {"l": 134.765, "t": 254.01288, "r": 480.5938100000001, "b": 262.80988, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "rect the predicted OTSL sequence on-the-fly is to verify if the token with the", "bbox": {"l": 134.765, "t": 265.96887000000004, "r": 480.59069999999997, "b": 274.76586999999995, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "highest prediction confidence invalidates the predicted sequence, and replace it", "bbox": {"l": 134.765, "t": 277.92389000000003, "r": 480.5957599999999, "b": 286.72086, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "by the token with the next highest confidence until OTSL rules are satisfied.", "bbox": {"l": 134.765, "t": 289.8788799999999, "r": 469.40369, "b": 298.67584, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "5", "bbox": {"l": 134.765, "t": 321.164, "r": 141.4886, "b": 331.73239000000007, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Experiments", "bbox": {"l": 154.9382, "t": 321.164, "r": 229.03534, "b": 331.73239000000007, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "To evaluate the impact of OTSL on prediction accuracy and inference times, we", "bbox": {"l": 134.765, "t": 347.24985, "r": 480.59375, "b": 356.04681, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "conducted a series of experiments based on the TableFormer model (Figure 4)", "bbox": {"l": 134.765, "t": 359.2048300000001, "r": 480.59476, "b": 368.0018, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "with two objectives: Firstly we evaluate the prediction quality and performance", "bbox": {"l": 134.765, "t": 371.15982, "r": 480.58786000000003, "b": 379.95679, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "of OTSL vs. HTML after performing Hyper Parameter Optimization (HPO) on", "bbox": {"l": 134.765, "t": 383.11481000000003, "r": 480.58777, "b": 391.91177, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "the", "bbox": {"l": 134.765, "t": 395.06978999999995, "r": 148.59807, "b": 403.86676, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "canonical", "bbox": {"l": 151.627, "t": 395.06978999999995, "r": 191.84703, "b": 403.86676, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "PubTabNet data set. Secondly we pick the best hyper-parameters", "bbox": {"l": 195.90201, "t": 395.06978999999995, "r": 480.59528, "b": 403.86676, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "found in the first step and evaluate how OTSL impacts the performance of", "bbox": {"l": 134.76501, "t": 407.02478, "r": 480.59283000000005, "b": 415.82175, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "TableFormer after training on other publicly available data sets (FinTabNet,", "bbox": {"l": 134.76501, "t": 418.98077, "r": 480.59476, "b": 427.77774, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "PubTables-1M [14]). The ground truth (GT) from all data sets has been con-", "bbox": {"l": 134.76501, "t": 430.93576, "r": 480.59171, "b": 439.73273, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "verted into OTSL format for this purpose, and will be made publicly available.", "bbox": {"l": 134.76501, "t": 442.8907500000001, "r": 479.30258, "b": 451.6877099999999, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Fig. 4.", "bbox": {"l": 134.76501, "t": 484.64813, "r": 162.64424, "b": 492.57443, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Architecture sketch of the TableFormer model, which is a representative for the", "bbox": {"l": 165.19601, "t": 484.71091, "r": 480.59082, "b": 492.78067, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Im2Seq approach.", "bbox": {"l": 134.76501, "t": 495.66989, "r": 206.70245, "b": 503.73965, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "1.", "bbox": {"l": 147.30025, "t": 540.73164, "r": 149.70605, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Item", "bbox": {"l": 150.90895, "t": 540.73164, "r": 155.72055, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "Amount", "bbox": {"l": 162.75987, "t": 535.3938, "r": 172.2963, "b": 537.76224, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Names", "bbox": {"l": 147.63603, "t": 535.3661500000001, "r": 155.91753, "b": 537.73459, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "1000", "bbox": {"l": 158.48466, "t": 540.73164, "r": 164.10178, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "500", "bbox": {"l": 158.48466, "t": 544.67065, "r": 162.69737, "b": 547.03909, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "3500", "bbox": {"l": 158.48466, "t": 548.91264, "r": 164.10178, "b": 551.28108, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "150", "bbox": {"l": 158.48466, "t": 553.15465, "r": 162.69737, "b": 555.52309, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "unit", "bbox": {"l": 168.81696, "t": 540.73164, "r": 172.88876, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "unit", "bbox": {"l": 168.81696, "t": 544.67065, "r": 172.88876, "b": 547.03909, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "unit", "bbox": {"l": 168.81696, "t": 548.91264, "r": 172.88876, "b": 551.28108, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "unit", "bbox": {"l": 168.81696, "t": 553.15465, "r": 172.88876, "b": 555.52309, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "2.", "bbox": {"l": 147.30025, "t": 544.67065, "r": 149.70605, "b": 547.03909, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "Item", "bbox": {"l": 150.90895, "t": 544.67065, "r": 155.72055, "b": 547.03909, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "3.", "bbox": {"l": 147.30025, "t": 548.91264, "r": 149.70605, "b": 551.28108, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Item", "bbox": {"l": 150.90895, "t": 548.91264, "r": 155.72055, "b": 551.28108, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "4.", "bbox": {"l": 147.30025, "t": 553.15465, "r": 149.70605, "b": 555.52309, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Item", "bbox": {"l": 150.90895, "t": 553.15465, "r": 155.72055, "b": 555.52309, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Extracted", "bbox": {"l": 152.05046, "t": 517.0098, "r": 171.24945, "b": 521.27298, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Table Images", "bbox": {"l": 148.13347, "t": 522.3122900000001, "r": 175.16759, "b": 526.57547, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Standardized", "bbox": {"l": 193.53331, "t": 524.51422, "r": 220.31973, "b": 528.7774, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "Images", "bbox": {"l": 199.47311, "t": 529.8167100000001, "r": 214.37889, "b": 534.0799, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "BBox", "bbox": {"l": 273.61066, "t": 509.9053, "r": 284.47275, "b": 514.16849, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Decoder", "bbox": {"l": 270.45187, "t": 513.6928399999999, "r": 287.63242, "b": 517.9560200000001, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "BBoxes", "bbox": {"l": 332.47852, "t": 508.14438, "r": 348.14014, "b": 512.40756, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "BBoxes can be", "bbox": {"l": 376.68622, "t": 521.12024, "r": 407.25497, "b": 525.38342, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "traced back to the", "bbox": {"l": 373.90869, "t": 525.66525, "r": 410.03506, "b": 529.92844, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "original image to", "bbox": {"l": 375.29871, "t": 530.21024, "r": 408.64902, "b": 534.47342, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "extract content", "bbox": {"l": 377.06747, "t": 534.75522, "r": 406.88312, "b": 539.01843, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "Structure Tags sequence", "bbox": {"l": 383.56683, "t": 563.24176, "r": 433.76544, "b": 567.50497, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "provide full description of", "bbox": {"l": 383.52768, "t": 567.78676, "r": 433.80764999999997, "b": 572.04997, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "the table structure", "bbox": {"l": 390.47522, "t": 572.33177, "r": 426.85703, "b": 576.59499, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "Structure Tags", "bbox": {"l": 293.94702, "t": 577.89143, "r": 323.1691, "b": 582.15465, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "in OTSL format", "bbox": {"l": 293.94702, "t": 582.43648, "r": 324.59396, "b": 586.69969, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "BBoxes in sync", "bbox": {"l": 333.07819, "t": 541.82269, "r": 364.14691, "b": 546.08591, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "with tag sequence", "bbox": {"l": 333.07819, "t": 545.6102, "r": 369.71542, "b": 549.87341, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "Encoder", "bbox": {"l": 232.65881000000002, "t": 515.24139, "r": 249.58894000000004, "b": 519.50458, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "Structure", "bbox": {"l": 269.8219, "t": 545.97102, "r": 288.26279, "b": 550.23424, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Decoder", "bbox": {"l": 270.45187, "t": 549.75851, "r": 287.63242, "b": 554.0217299999999, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "[x1, y2, x2, y2]", "bbox": {"l": 332.17676, "t": 515.91205, "r": 358.11206, "b": 520.17523, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "[x1', y2', x2', y2']", "bbox": {"l": 332.17676, "t": 521.9720500000001, "r": 361.58298, "b": 526.23523, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "[x1'', y2'', x2'', y2'']", "bbox": {"l": 332.17676, "t": 528.03204, "r": 364.76474, "b": 532.29523, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "...", "bbox": {"l": 332.17676, "t": 534.09204, "r": 335.96548, "b": 538.35524, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "1", "bbox": {"l": 326.8894, "t": 516.39508, "r": 329.41641, "b": 520.6582599999999, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "2", "bbox": {"l": 327.04089, "t": 522.4247700000001, "r": 329.5679, "b": 526.68796, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "3", "bbox": {"l": 327.04089, "t": 528.51508, "r": 329.5679, "b": 532.77826, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "3", "bbox": {"l": 424.14102, "t": 527.4428399999999, "r": 426.66803, "b": 531.7060200000001, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "2", "bbox": {"l": 453.0018, "t": 517.4539500000001, "r": 455.52881, "b": 521.71713, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "1", "bbox": {"l": 423.85825, "t": 517.06281, "r": 426.38525, "b": 521.32599, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "C", "bbox": {"l": 333.4342, "t": 557.36679, "r": 337.27542, "b": 562.35719, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "C", "bbox": {"l": 340.35397, "t": 557.31679, "r": 344.19519, "b": 562.30719, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "C", "bbox": {"l": 340.30978, "t": 563.8653899999999, "r": 344.151, "b": 568.8557900000001, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "C", "bbox": {"l": 346.79904, "t": 563.8686700000001, "r": 350.64026, "b": 568.85907, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "C", "bbox": {"l": 333.59583, "t": 563.82271, "r": 337.43704, "b": 568.81311, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "C", "bbox": {"l": 340.37543, "t": 570.42673, "r": 344.21664, "b": 575.41713, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "C", "bbox": {"l": 346.86469, "t": 570.43001, "r": 350.7059, "b": 575.42041, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "C", "bbox": {"l": 333.66144, "t": 570.38405, "r": 337.50266, "b": 575.37445, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "C", "bbox": {"l": 340.37671, "t": 577.02606, "r": 344.21793, "b": 582.0164599999999, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "C", "bbox": {"l": 346.86597, "t": 577.02934, "r": 350.70718, "b": 582.01974, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "C", "bbox": {"l": 333.66272, "t": 576.98338, "r": 337.50394, "b": 581.97379, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "C", "bbox": {"l": 340.27948, "t": 583.39737, "r": 344.1207, "b": 588.38777, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "C", "bbox": {"l": 346.76874, "t": 583.40068, "r": 350.60995, "b": 588.39108, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "C", "bbox": {"l": 333.56549, "t": 583.35474, "r": 337.40671, "b": 588.34514, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "NL", "bbox": {"l": 353.03326, "t": 556.8831299999999, "r": 359.83362, "b": 561.87354, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "NL", "bbox": {"l": 353.18604, "t": 563.58044, "r": 359.98639, "b": 568.57085, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "NL", "bbox": {"l": 353.19864, "t": 570.1623500000001, "r": 359.99899, "b": 575.15276, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "NL", "bbox": {"l": 353.1532, "t": 576.76611, "r": 359.95355, "b": 581.75652, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "NL", "bbox": {"l": 353.26935, "t": 583.40628, "r": 360.0697, "b": 588.3966800000001, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "L", "bbox": {"l": 347.37979, "t": 557.08235, "r": 350.33786, "b": 562.07275, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "3", "bbox": {"l": 331.14026, "t": 564.2907700000001, "r": 333.66727, "b": 568.55399, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "2", "bbox": {"l": 340.80972, "t": 554.59312, "r": 343.33673, "b": 558.85634, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "1", "bbox": {"l": 330.97992, "t": 554.83035, "r": 333.50693, "b": 559.09357, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "We rely on standard metrics such as Tree Edit Distance score (TEDs) for", "bbox": {"l": 149.709, "t": 620.19278, "r": 480.58792, "b": 628.98975, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "table structure prediction, and Mean Average Precision (mAP) with 0.75 Inter-", "bbox": {"l": 134.765, "t": 632.14778, "r": 480.58871, "b": 640.94475, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "section Over Union (IOU) threshold for the bounding-box predictions of table", "bbox": {"l": 134.765, "t": 644.1027799999999, "r": 480.5917400000001, "b": 652.89975, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "cells. The predicted OTSL structures were converted back to HTML format in", "bbox": {"l": 134.765, "t": 656.0577900000001, "r": 480.58968999999996, "b": 664.8547599999999, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 9, "label": "page_header", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8301323056221008, "cells": [{"id": 0, "text": "8", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "page_header", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8631826043128967, "cells": [{"id": 1, "text": "M.", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 178.07675, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37415, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "text", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.58884000000006, "b": 139.68579, "coord_origin": "TOPLEFT"}, "confidence": 0.9464744925498962, "cells": [{"id": 3, "text": "reduces significantly the column drift seen in the HTML based models (see Fig-", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.58884000000006, "b": 127.73077, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "ure 5).", "bbox": {"l": 134.765, "t": 130.88878999999997, "r": 163.56389, "b": 139.68579, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "section_header", "bbox": {"l": 134.765, "t": 161.55682000000002, "r": 319.34708, "b": 170.36377000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9549514651298523, "cells": [{"id": 5, "text": "4.3", "bbox": {"l": 134.765, "t": 161.55682000000002, "r": 149.40205, "b": 170.36377000000005, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Error-detection and -mitigation", "bbox": {"l": 160.85904, "t": 161.55682000000002, "r": 319.34708, "b": 170.36377000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 134.765, "t": 182.28179999999998, "r": 480.5957599999999, "b": 298.67584, "coord_origin": "TOPLEFT"}, "confidence": 0.9879790544509888, "cells": [{"id": 7, "text": "The design of OTSL allows to validate a table structure easily on an unfinished", "bbox": {"l": 134.765, "t": 182.28179999999998, "r": 480.59572999999995, "b": 191.0788, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "sequence. The detection of an invalid sequence token is a clear indication of a", "bbox": {"l": 134.765, "t": 194.23779000000002, "r": 480.59473, "b": 203.03479000000004, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "prediction mistake, however a valid sequence by itself does not guarantee pre-", "bbox": {"l": 134.765, "t": 206.19281, "r": 480.58678999999995, "b": 214.98981000000003, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "diction correctness. Different heuristics can be used to correct token errors in", "bbox": {"l": 134.765, "t": 218.14783, "r": 480.59177000000005, "b": 226.94482000000005, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "an invalid sequence and thus increase the chances for accurate predictions. Such", "bbox": {"l": 134.765, "t": 230.10284000000001, "r": 480.58768, "b": 238.89984000000004, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "heuristics can be applied either after the prediction of each token, or at the end", "bbox": {"l": 134.765, "t": 242.05786, "r": 480.5867, "b": 250.85486000000003, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "on the entire predicted sequence. For example a simple heuristic which can cor-", "bbox": {"l": 134.765, "t": 254.01288, "r": 480.5938100000001, "b": 262.80988, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "rect the predicted OTSL sequence on-the-fly is to verify if the token with the", "bbox": {"l": 134.765, "t": 265.96887000000004, "r": 480.59069999999997, "b": 274.76586999999995, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "highest prediction confidence invalidates the predicted sequence, and replace it", "bbox": {"l": 134.765, "t": 277.92389000000003, "r": 480.5957599999999, "b": 286.72086, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "by the token with the next highest confidence until OTSL rules are satisfied.", "bbox": {"l": 134.765, "t": 289.8788799999999, "r": 469.40369, "b": 298.67584, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "section_header", "bbox": {"l": 134.765, "t": 321.164, "r": 229.03534, "b": 331.73239000000007, "coord_origin": "TOPLEFT"}, "confidence": 0.95152747631073, "cells": [{"id": 17, "text": "5", "bbox": {"l": 134.765, "t": 321.164, "r": 141.4886, "b": 331.73239000000007, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Experiments", "bbox": {"l": 154.9382, "t": 321.164, "r": 229.03534, "b": 331.73239000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 134.765, "t": 347.24985, "r": 480.59528, "b": 451.6877099999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9877985119819641, "cells": [{"id": 19, "text": "To evaluate the impact of OTSL on prediction accuracy and inference times, we", "bbox": {"l": 134.765, "t": 347.24985, "r": 480.59375, "b": 356.04681, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "conducted a series of experiments based on the TableFormer model (Figure 4)", "bbox": {"l": 134.765, "t": 359.2048300000001, "r": 480.59476, "b": 368.0018, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "with two objectives: Firstly we evaluate the prediction quality and performance", "bbox": {"l": 134.765, "t": 371.15982, "r": 480.58786000000003, "b": 379.95679, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "of OTSL vs. HTML after performing Hyper Parameter Optimization (HPO) on", "bbox": {"l": 134.765, "t": 383.11481000000003, "r": 480.58777, "b": 391.91177, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "the", "bbox": {"l": 134.765, "t": 395.06978999999995, "r": 148.59807, "b": 403.86676, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "canonical", "bbox": {"l": 151.627, "t": 395.06978999999995, "r": 191.84703, "b": 403.86676, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "PubTabNet data set. Secondly we pick the best hyper-parameters", "bbox": {"l": 195.90201, "t": 395.06978999999995, "r": 480.59528, "b": 403.86676, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "found in the first step and evaluate how OTSL impacts the performance of", "bbox": {"l": 134.76501, "t": 407.02478, "r": 480.59283000000005, "b": 415.82175, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "TableFormer after training on other publicly available data sets (FinTabNet,", "bbox": {"l": 134.76501, "t": 418.98077, "r": 480.59476, "b": 427.77774, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "PubTables-1M [14]). The ground truth (GT) from all data sets has been con-", "bbox": {"l": 134.76501, "t": 430.93576, "r": 480.59171, "b": 439.73273, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "verted into OTSL format for this purpose, and will be made publicly available.", "bbox": {"l": 134.76501, "t": 442.8907500000001, "r": 479.30258, "b": 451.6877099999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "caption", "bbox": {"l": 134.76501, "t": 484.64813, "r": 480.59082, "b": 503.73965, "coord_origin": "TOPLEFT"}, "confidence": 0.9297956228256226, "cells": [{"id": 30, "text": "Fig. 4.", "bbox": {"l": 134.76501, "t": 484.64813, "r": 162.64424, "b": 492.57443, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Architecture sketch of the TableFormer model, which is a representative for the", "bbox": {"l": 165.19601, "t": 484.71091, "r": 480.59082, "b": 492.78067, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Im2Seq approach.", "bbox": {"l": 134.76501, "t": 495.66989, "r": 206.70245, "b": 503.73965, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "picture", "bbox": {"l": 140.70968627929688, "t": 508.0638427734375, "r": 472.73382568359375, "b": 593.6771850585938, "coord_origin": "TOPLEFT"}, "confidence": 0.9303396344184875, "cells": [{"id": 33, "text": "1.", "bbox": {"l": 147.30025, "t": 540.73164, "r": 149.70605, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Item", "bbox": {"l": 150.90895, "t": 540.73164, "r": 155.72055, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "Amount", "bbox": {"l": 162.75987, "t": 535.3938, "r": 172.2963, "b": 537.76224, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Names", "bbox": {"l": 147.63603, "t": 535.3661500000001, "r": 155.91753, "b": 537.73459, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "1000", "bbox": {"l": 158.48466, "t": 540.73164, "r": 164.10178, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "500", "bbox": {"l": 158.48466, "t": 544.67065, "r": 162.69737, "b": 547.03909, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "3500", "bbox": {"l": 158.48466, "t": 548.91264, "r": 164.10178, "b": 551.28108, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "150", "bbox": {"l": 158.48466, "t": 553.15465, "r": 162.69737, "b": 555.52309, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "unit", "bbox": {"l": 168.81696, "t": 540.73164, "r": 172.88876, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "unit", "bbox": {"l": 168.81696, "t": 544.67065, "r": 172.88876, "b": 547.03909, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "unit", "bbox": {"l": 168.81696, "t": 548.91264, "r": 172.88876, "b": 551.28108, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "unit", "bbox": {"l": 168.81696, "t": 553.15465, "r": 172.88876, "b": 555.52309, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "2.", "bbox": {"l": 147.30025, "t": 544.67065, "r": 149.70605, "b": 547.03909, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "Item", "bbox": {"l": 150.90895, "t": 544.67065, "r": 155.72055, "b": 547.03909, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "3.", "bbox": {"l": 147.30025, "t": 548.91264, "r": 149.70605, "b": 551.28108, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Item", "bbox": {"l": 150.90895, "t": 548.91264, "r": 155.72055, "b": 551.28108, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "4.", "bbox": {"l": 147.30025, "t": 553.15465, "r": 149.70605, "b": 555.52309, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Item", "bbox": {"l": 150.90895, "t": 553.15465, "r": 155.72055, "b": 555.52309, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Extracted", "bbox": {"l": 152.05046, "t": 517.0098, "r": 171.24945, "b": 521.27298, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Table Images", "bbox": {"l": 148.13347, "t": 522.3122900000001, "r": 175.16759, "b": 526.57547, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Standardized", "bbox": {"l": 193.53331, "t": 524.51422, "r": 220.31973, "b": 528.7774, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "Images", "bbox": {"l": 199.47311, "t": 529.8167100000001, "r": 214.37889, "b": 534.0799, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "BBox", "bbox": {"l": 273.61066, "t": 509.9053, "r": 284.47275, "b": 514.16849, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Decoder", "bbox": {"l": 270.45187, "t": 513.6928399999999, "r": 287.63242, "b": 517.9560200000001, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "BBoxes", "bbox": {"l": 332.47852, "t": 508.14438, "r": 348.14014, "b": 512.40756, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "BBoxes can be", "bbox": {"l": 376.68622, "t": 521.12024, "r": 407.25497, "b": 525.38342, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "traced back to the", "bbox": {"l": 373.90869, "t": 525.66525, "r": 410.03506, "b": 529.92844, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "original image to", "bbox": {"l": 375.29871, "t": 530.21024, "r": 408.64902, "b": 534.47342, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "extract content", "bbox": {"l": 377.06747, "t": 534.75522, "r": 406.88312, "b": 539.01843, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "Structure Tags sequence", "bbox": {"l": 383.56683, "t": 563.24176, "r": 433.76544, "b": 567.50497, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "provide full description of", "bbox": {"l": 383.52768, "t": 567.78676, "r": 433.80764999999997, "b": 572.04997, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "the table structure", "bbox": {"l": 390.47522, "t": 572.33177, "r": 426.85703, "b": 576.59499, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "Structure Tags", "bbox": {"l": 293.94702, "t": 577.89143, "r": 323.1691, "b": 582.15465, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "in OTSL format", "bbox": {"l": 293.94702, "t": 582.43648, "r": 324.59396, "b": 586.69969, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "BBoxes in sync", "bbox": {"l": 333.07819, "t": 541.82269, "r": 364.14691, "b": 546.08591, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "with tag sequence", "bbox": {"l": 333.07819, "t": 545.6102, "r": 369.71542, "b": 549.87341, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "Encoder", "bbox": {"l": 232.65881000000002, "t": 515.24139, "r": 249.58894000000004, "b": 519.50458, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "Structure", "bbox": {"l": 269.8219, "t": 545.97102, "r": 288.26279, "b": 550.23424, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Decoder", "bbox": {"l": 270.45187, "t": 549.75851, "r": 287.63242, "b": 554.0217299999999, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "[x1, y2, x2, y2]", "bbox": {"l": 332.17676, "t": 515.91205, "r": 358.11206, "b": 520.17523, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "[x1', y2', x2', y2']", "bbox": {"l": 332.17676, "t": 521.9720500000001, "r": 361.58298, "b": 526.23523, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "[x1'', y2'', x2'', y2'']", "bbox": {"l": 332.17676, "t": 528.03204, "r": 364.76474, "b": 532.29523, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "...", "bbox": {"l": 332.17676, "t": 534.09204, "r": 335.96548, "b": 538.35524, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "1", "bbox": {"l": 326.8894, "t": 516.39508, "r": 329.41641, "b": 520.6582599999999, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "2", "bbox": {"l": 327.04089, "t": 522.4247700000001, "r": 329.5679, "b": 526.68796, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "3", "bbox": {"l": 327.04089, "t": 528.51508, "r": 329.5679, "b": 532.77826, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "3", "bbox": {"l": 424.14102, "t": 527.4428399999999, "r": 426.66803, "b": 531.7060200000001, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "2", "bbox": {"l": 453.0018, "t": 517.4539500000001, "r": 455.52881, "b": 521.71713, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "1", "bbox": {"l": 423.85825, "t": 517.06281, "r": 426.38525, "b": 521.32599, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "C", "bbox": {"l": 333.4342, "t": 557.36679, "r": 337.27542, "b": 562.35719, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "C", "bbox": {"l": 340.35397, "t": 557.31679, "r": 344.19519, "b": 562.30719, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "C", "bbox": {"l": 340.30978, "t": 563.8653899999999, "r": 344.151, "b": 568.8557900000001, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "C", "bbox": {"l": 346.79904, "t": 563.8686700000001, "r": 350.64026, "b": 568.85907, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "C", "bbox": {"l": 333.59583, "t": 563.82271, "r": 337.43704, "b": 568.81311, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "C", "bbox": {"l": 340.37543, "t": 570.42673, "r": 344.21664, "b": 575.41713, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "C", "bbox": {"l": 346.86469, "t": 570.43001, "r": 350.7059, "b": 575.42041, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "C", "bbox": {"l": 333.66144, "t": 570.38405, "r": 337.50266, "b": 575.37445, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "C", "bbox": {"l": 340.37671, "t": 577.02606, "r": 344.21793, "b": 582.0164599999999, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "C", "bbox": {"l": 346.86597, "t": 577.02934, "r": 350.70718, "b": 582.01974, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "C", "bbox": {"l": 333.66272, "t": 576.98338, "r": 337.50394, "b": 581.97379, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "C", "bbox": {"l": 340.27948, "t": 583.39737, "r": 344.1207, "b": 588.38777, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "C", "bbox": {"l": 346.76874, "t": 583.40068, "r": 350.60995, "b": 588.39108, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "C", "bbox": {"l": 333.56549, "t": 583.35474, "r": 337.40671, "b": 588.34514, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "NL", "bbox": {"l": 353.03326, "t": 556.8831299999999, "r": 359.83362, "b": 561.87354, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "NL", "bbox": {"l": 353.18604, "t": 563.58044, "r": 359.98639, "b": 568.57085, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "NL", "bbox": {"l": 353.19864, "t": 570.1623500000001, "r": 359.99899, "b": 575.15276, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "NL", "bbox": {"l": 353.1532, "t": 576.76611, "r": 359.95355, "b": 581.75652, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "NL", "bbox": {"l": 353.26935, "t": 583.40628, "r": 360.0697, "b": 588.3966800000001, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "L", "bbox": {"l": 347.37979, "t": 557.08235, "r": 350.33786, "b": 562.07275, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "3", "bbox": {"l": 331.14026, "t": 564.2907700000001, "r": 333.66727, "b": 568.55399, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "2", "bbox": {"l": 340.80972, "t": 554.59312, "r": 343.33673, "b": 558.85634, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "1", "bbox": {"l": 330.97992, "t": 554.83035, "r": 333.50693, "b": 559.09357, "coord_origin": "TOPLEFT"}}], "children": [{"id": 10, "label": "text", "bbox": {"l": 147.30025, "t": 540.73164, "r": 149.70605, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "1.", "bbox": {"l": 147.30025, "t": 540.73164, "r": 149.70605, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 150.90895, "t": 540.73164, "r": 155.72055, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "Item", "bbox": {"l": 150.90895, "t": 540.73164, "r": 155.72055, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 162.75987, "t": 535.3938, "r": 172.2963, "b": 537.76224, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "Amount", "bbox": {"l": 162.75987, "t": 535.3938, "r": 172.2963, "b": 537.76224, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 147.63603, "t": 535.3661500000001, "r": 155.91753, "b": 537.73459, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "Names", "bbox": {"l": 147.63603, "t": 535.3661500000001, "r": 155.91753, "b": 537.73459, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 158.48466, "t": 540.73164, "r": 164.10178, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "1000", "bbox": {"l": 158.48466, "t": 540.73164, "r": 164.10178, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 158.48466, "t": 544.67065, "r": 162.69737, "b": 547.03909, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "500", "bbox": {"l": 158.48466, "t": 544.67065, "r": 162.69737, "b": 547.03909, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 158.48466, "t": 548.91264, "r": 164.10178, "b": 551.28108, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "3500", "bbox": {"l": 158.48466, "t": 548.91264, "r": 164.10178, "b": 551.28108, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 158.48466, "t": 553.15465, "r": 162.69737, "b": 555.52309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "150", "bbox": {"l": 158.48466, "t": 553.15465, "r": 162.69737, "b": 555.52309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 168.81696, "t": 540.73164, "r": 172.88876, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "unit", "bbox": {"l": 168.81696, "t": 540.73164, "r": 172.88876, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 168.81696, "t": 544.67065, "r": 172.88876, "b": 547.03909, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "unit", "bbox": {"l": 168.81696, "t": 544.67065, "r": 172.88876, "b": 547.03909, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 168.81696, "t": 548.91264, "r": 172.88876, "b": 551.28108, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "unit", "bbox": {"l": 168.81696, "t": 548.91264, "r": 172.88876, "b": 551.28108, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 168.81696, "t": 553.15465, "r": 172.88876, "b": 555.52309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "unit", "bbox": {"l": 168.81696, "t": 553.15465, "r": 172.88876, "b": 555.52309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 147.30025, "t": 544.67065, "r": 149.70605, "b": 547.03909, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "2.", "bbox": {"l": 147.30025, "t": 544.67065, "r": 149.70605, "b": 547.03909, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 150.90895, "t": 544.67065, "r": 155.72055, "b": 547.03909, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "Item", "bbox": {"l": 150.90895, "t": 544.67065, "r": 155.72055, "b": 547.03909, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 147.30025, "t": 548.91264, "r": 149.70605, "b": 551.28108, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "3.", "bbox": {"l": 147.30025, "t": 548.91264, "r": 149.70605, "b": 551.28108, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 150.90895, "t": 548.91264, "r": 155.72055, "b": 551.28108, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "Item", "bbox": {"l": 150.90895, "t": 548.91264, "r": 155.72055, "b": 551.28108, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 147.30025, "t": 553.15465, "r": 149.70605, "b": 555.52309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "4.", "bbox": {"l": 147.30025, "t": 553.15465, "r": 149.70605, "b": 555.52309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 150.90895, "t": 553.15465, "r": 155.72055, "b": 555.52309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "Item", "bbox": {"l": 150.90895, "t": 553.15465, "r": 155.72055, "b": 555.52309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 152.05046, "t": 517.0098, "r": 171.24945, "b": 521.27298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "Extracted", "bbox": {"l": 152.05046, "t": 517.0098, "r": 171.24945, "b": 521.27298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 148.13347, "t": 522.3122900000001, "r": 175.16759, "b": 526.57547, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "Table Images", "bbox": {"l": 148.13347, "t": 522.3122900000001, "r": 175.16759, "b": 526.57547, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 193.53331, "t": 524.51422, "r": 220.31973, "b": 528.7774, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "Standardized", "bbox": {"l": 193.53331, "t": 524.51422, "r": 220.31973, "b": 528.7774, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 199.47311, "t": 529.8167100000001, "r": 214.37889, "b": 534.0799, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "Images", "bbox": {"l": 199.47311, "t": 529.8167100000001, "r": 214.37889, "b": 534.0799, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 273.61066, "t": 509.9053, "r": 284.47275, "b": 514.16849, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "BBox", "bbox": {"l": 273.61066, "t": 509.9053, "r": 284.47275, "b": 514.16849, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 270.45187, "t": 513.6928399999999, "r": 287.63242, "b": 517.9560200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "Decoder", "bbox": {"l": 270.45187, "t": 513.6928399999999, "r": 287.63242, "b": 517.9560200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 332.47852, "t": 508.14438, "r": 348.14014, "b": 512.40756, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "BBoxes", "bbox": {"l": 332.47852, "t": 508.14438, "r": 348.14014, "b": 512.40756, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 376.68622, "t": 521.12024, "r": 407.25497, "b": 525.38342, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "BBoxes can be", "bbox": {"l": 376.68622, "t": 521.12024, "r": 407.25497, "b": 525.38342, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 373.90869, "t": 525.66525, "r": 410.03506, "b": 529.92844, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "traced back to the", "bbox": {"l": 373.90869, "t": 525.66525, "r": 410.03506, "b": 529.92844, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 375.29871, "t": 530.21024, "r": 408.64902, "b": 534.47342, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "original image to", "bbox": {"l": 375.29871, "t": 530.21024, "r": 408.64902, "b": 534.47342, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 377.06747, "t": 534.75522, "r": 406.88312, "b": 539.01843, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "extract content", "bbox": {"l": 377.06747, "t": 534.75522, "r": 406.88312, "b": 539.01843, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 383.56683, "t": 563.24176, "r": 433.76544, "b": 567.50497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "Structure Tags sequence", "bbox": {"l": 383.56683, "t": 563.24176, "r": 433.76544, "b": 567.50497, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 383.52768, "t": 567.78676, "r": 433.80764999999997, "b": 572.04997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "provide full description of", "bbox": {"l": 383.52768, "t": 567.78676, "r": 433.80764999999997, "b": 572.04997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 390.47522, "t": 572.33177, "r": 426.85703, "b": 576.59499, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "the table structure", "bbox": {"l": 390.47522, "t": 572.33177, "r": 426.85703, "b": 576.59499, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 293.94702, "t": 577.89143, "r": 323.1691, "b": 582.15465, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "Structure Tags", "bbox": {"l": 293.94702, "t": 577.89143, "r": 323.1691, "b": 582.15465, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 293.94702, "t": 582.43648, "r": 324.59396, "b": 586.69969, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "in OTSL format", "bbox": {"l": 293.94702, "t": 582.43648, "r": 324.59396, "b": 586.69969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 333.07819, "t": 541.82269, "r": 364.14691, "b": 546.08591, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "BBoxes in sync", "bbox": {"l": 333.07819, "t": 541.82269, "r": 364.14691, "b": 546.08591, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 333.07819, "t": 545.6102, "r": 369.71542, "b": 549.87341, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "with tag sequence", "bbox": {"l": 333.07819, "t": 545.6102, "r": 369.71542, "b": 549.87341, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 232.65881000000002, "t": 515.24139, "r": 249.58894000000004, "b": 519.50458, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "Encoder", "bbox": {"l": 232.65881000000002, "t": 515.24139, "r": 249.58894000000004, "b": 519.50458, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 269.8219, "t": 545.97102, "r": 288.26279, "b": 550.23424, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "Structure", "bbox": {"l": 269.8219, "t": 545.97102, "r": 288.26279, "b": 550.23424, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 270.45187, "t": 549.75851, "r": 287.63242, "b": 554.0217299999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "Decoder", "bbox": {"l": 270.45187, "t": 549.75851, "r": 287.63242, "b": 554.0217299999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 332.17676, "t": 515.91205, "r": 358.11206, "b": 520.17523, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "[x1, y2, x2, y2]", "bbox": {"l": 332.17676, "t": 515.91205, "r": 358.11206, "b": 520.17523, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 332.17676, "t": 521.9720500000001, "r": 361.58298, "b": 526.23523, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "[x1', y2', x2', y2']", "bbox": {"l": 332.17676, "t": 521.9720500000001, "r": 361.58298, "b": 526.23523, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 332.17676, "t": 528.03204, "r": 364.76474, "b": 532.29523, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "[x1'', y2'', x2'', y2'']", "bbox": {"l": 332.17676, "t": 528.03204, "r": 364.76474, "b": 532.29523, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 332.17676, "t": 534.09204, "r": 335.96548, "b": 538.35524, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "...", "bbox": {"l": 332.17676, "t": 534.09204, "r": 335.96548, "b": 538.35524, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 326.8894, "t": 516.39508, "r": 329.41641, "b": 520.6582599999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "1", "bbox": {"l": 326.8894, "t": 516.39508, "r": 329.41641, "b": 520.6582599999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 327.04089, "t": 522.4247700000001, "r": 329.5679, "b": 526.68796, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "2", "bbox": {"l": 327.04089, "t": 522.4247700000001, "r": 329.5679, "b": 526.68796, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 327.04089, "t": 528.51508, "r": 329.5679, "b": 532.77826, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "3", "bbox": {"l": 327.04089, "t": 528.51508, "r": 329.5679, "b": 532.77826, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 424.14102, "t": 527.4428399999999, "r": 426.66803, "b": 531.7060200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "3", "bbox": {"l": 424.14102, "t": 527.4428399999999, "r": 426.66803, "b": 531.7060200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 453.0018, "t": 517.4539500000001, "r": 455.52881, "b": 521.71713, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "2", "bbox": {"l": 453.0018, "t": 517.4539500000001, "r": 455.52881, "b": 521.71713, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 423.85825, "t": 517.06281, "r": 426.38525, "b": 521.32599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "1", "bbox": {"l": 423.85825, "t": 517.06281, "r": 426.38525, "b": 521.32599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 333.4342, "t": 557.36679, "r": 337.27542, "b": 562.35719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "C", "bbox": {"l": 333.4342, "t": 557.36679, "r": 337.27542, "b": 562.35719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 340.35397, "t": 557.31679, "r": 344.19519, "b": 562.30719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "C", "bbox": {"l": 340.35397, "t": 557.31679, "r": 344.19519, "b": 562.30719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 340.30978, "t": 563.8653899999999, "r": 344.151, "b": 568.8557900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "C", "bbox": {"l": 340.30978, "t": 563.8653899999999, "r": 344.151, "b": 568.8557900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 346.79904, "t": 563.8686700000001, "r": 350.64026, "b": 568.85907, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "C", "bbox": {"l": 346.79904, "t": 563.8686700000001, "r": 350.64026, "b": 568.85907, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 333.59583, "t": 563.82271, "r": 337.43704, "b": 568.81311, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "C", "bbox": {"l": 333.59583, "t": 563.82271, "r": 337.43704, "b": 568.81311, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 340.37543, "t": 570.42673, "r": 344.21664, "b": 575.41713, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "C", "bbox": {"l": 340.37543, "t": 570.42673, "r": 344.21664, "b": 575.41713, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 346.86469, "t": 570.43001, "r": 350.7059, "b": 575.42041, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "C", "bbox": {"l": 346.86469, "t": 570.43001, "r": 350.7059, "b": 575.42041, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 333.66144, "t": 570.38405, "r": 337.50266, "b": 575.37445, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "C", "bbox": {"l": 333.66144, "t": 570.38405, "r": 337.50266, "b": 575.37445, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 340.37671, "t": 577.02606, "r": 344.21793, "b": 582.0164599999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "C", "bbox": {"l": 340.37671, "t": 577.02606, "r": 344.21793, "b": 582.0164599999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 346.86597, "t": 577.02934, "r": 350.70718, "b": 582.01974, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "C", "bbox": {"l": 346.86597, "t": 577.02934, "r": 350.70718, "b": 582.01974, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 333.66272, "t": 576.98338, "r": 337.50394, "b": 581.97379, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "C", "bbox": {"l": 333.66272, "t": 576.98338, "r": 337.50394, "b": 581.97379, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 340.27948, "t": 583.39737, "r": 344.1207, "b": 588.38777, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "C", "bbox": {"l": 340.27948, "t": 583.39737, "r": 344.1207, "b": 588.38777, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 346.76874, "t": 583.40068, "r": 350.60995, "b": 588.39108, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "C", "bbox": {"l": 346.76874, "t": 583.40068, "r": 350.60995, "b": 588.39108, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 333.56549, "t": 583.35474, "r": 337.40671, "b": 588.34514, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "C", "bbox": {"l": 333.56549, "t": 583.35474, "r": 337.40671, "b": 588.34514, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 353.03326, "t": 556.8831299999999, "r": 359.83362, "b": 561.87354, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "NL", "bbox": {"l": 353.03326, "t": 556.8831299999999, "r": 359.83362, "b": 561.87354, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 353.18604, "t": 563.58044, "r": 359.98639, "b": 568.57085, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "NL", "bbox": {"l": 353.18604, "t": 563.58044, "r": 359.98639, "b": 568.57085, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 353.19864, "t": 570.1623500000001, "r": 359.99899, "b": 575.15276, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "NL", "bbox": {"l": 353.19864, "t": 570.1623500000001, "r": 359.99899, "b": 575.15276, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 353.1532, "t": 576.76611, "r": 359.95355, "b": 581.75652, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "NL", "bbox": {"l": 353.1532, "t": 576.76611, "r": 359.95355, "b": 581.75652, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 353.26935, "t": 583.40628, "r": 360.0697, "b": 588.3966800000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "NL", "bbox": {"l": 353.26935, "t": 583.40628, "r": 360.0697, "b": 588.3966800000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 347.37979, "t": 557.08235, "r": 350.33786, "b": 562.07275, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "L", "bbox": {"l": 347.37979, "t": 557.08235, "r": 350.33786, "b": 562.07275, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 331.14026, "t": 564.2907700000001, "r": 333.66727, "b": 568.55399, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "3", "bbox": {"l": 331.14026, "t": 564.2907700000001, "r": 333.66727, "b": 568.55399, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 340.80972, "t": 554.59312, "r": 343.33673, "b": 558.85634, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": "2", "bbox": {"l": 340.80972, "t": 554.59312, "r": 343.33673, "b": 558.85634, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 330.97992, "t": 554.83035, "r": 333.50693, "b": 559.09357, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "1", "bbox": {"l": 330.97992, "t": 554.83035, "r": 333.50693, "b": 559.09357, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 4, "label": "text", "bbox": {"l": 134.765, "t": 620.19278, "r": 480.5917400000001, "b": 664.8547599999999, "coord_origin": "TOPLEFT"}, "confidence": 0.951270341873169, "cells": [{"id": 105, "text": "We rely on standard metrics such as Tree Edit Distance score (TEDs) for", "bbox": {"l": 149.709, "t": 620.19278, "r": 480.58792, "b": 628.98975, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "table structure prediction, and Mean Average Precision (mAP) with 0.75 Inter-", "bbox": {"l": 134.765, "t": 632.14778, "r": 480.58871, "b": 640.94475, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "section Over Union (IOU) threshold for the bounding-box predictions of table", "bbox": {"l": 134.765, "t": 644.1027799999999, "r": 480.5917400000001, "b": 652.89975, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "cells. The predicted OTSL structures were converted back to HTML format in", "bbox": {"l": 134.765, "t": 656.0577900000001, "r": 480.58968999999996, "b": 664.8547599999999, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_header", "id": 9, "page_no": 7, "cluster": {"id": 9, "label": "page_header", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8301323056221008, "cells": [{"id": 0, "text": "8", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "8"}, {"label": "page_header", "id": 8, "page_no": 7, "cluster": {"id": 8, "label": "page_header", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8631826043128967, "cells": [{"id": 1, "text": "M.", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 178.07675, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37415, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "M. Lysak, et al."}, {"label": "text", "id": 5, "page_no": 7, "cluster": {"id": 5, "label": "text", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.58884000000006, "b": 139.68579, "coord_origin": "TOPLEFT"}, "confidence": 0.9464744925498962, "cells": [{"id": 3, "text": "reduces significantly the column drift seen in the HTML based models (see Fig-", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.58884000000006, "b": 127.73077, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "ure 5).", "bbox": {"l": 134.765, "t": 130.88878999999997, "r": 163.56389, "b": 139.68579, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "reduces significantly the column drift seen in the HTML based models (see Figure 5)."}, {"label": "section_header", "id": 2, "page_no": 7, "cluster": {"id": 2, "label": "section_header", "bbox": {"l": 134.765, "t": 161.55682000000002, "r": 319.34708, "b": 170.36377000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9549514651298523, "cells": [{"id": 5, "text": "4.3", "bbox": {"l": 134.765, "t": 161.55682000000002, "r": 149.40205, "b": 170.36377000000005, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Error-detection and -mitigation", "bbox": {"l": 160.85904, "t": 161.55682000000002, "r": 319.34708, "b": 170.36377000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4.3 Error-detection and -mitigation"}, {"label": "text", "id": 0, "page_no": 7, "cluster": {"id": 0, "label": "text", "bbox": {"l": 134.765, "t": 182.28179999999998, "r": 480.5957599999999, "b": 298.67584, "coord_origin": "TOPLEFT"}, "confidence": 0.9879790544509888, "cells": [{"id": 7, "text": "The design of OTSL allows to validate a table structure easily on an unfinished", "bbox": {"l": 134.765, "t": 182.28179999999998, "r": 480.59572999999995, "b": 191.0788, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "sequence. The detection of an invalid sequence token is a clear indication of a", "bbox": {"l": 134.765, "t": 194.23779000000002, "r": 480.59473, "b": 203.03479000000004, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "prediction mistake, however a valid sequence by itself does not guarantee pre-", "bbox": {"l": 134.765, "t": 206.19281, "r": 480.58678999999995, "b": 214.98981000000003, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "diction correctness. Different heuristics can be used to correct token errors in", "bbox": {"l": 134.765, "t": 218.14783, "r": 480.59177000000005, "b": 226.94482000000005, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "an invalid sequence and thus increase the chances for accurate predictions. Such", "bbox": {"l": 134.765, "t": 230.10284000000001, "r": 480.58768, "b": 238.89984000000004, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "heuristics can be applied either after the prediction of each token, or at the end", "bbox": {"l": 134.765, "t": 242.05786, "r": 480.5867, "b": 250.85486000000003, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "on the entire predicted sequence. For example a simple heuristic which can cor-", "bbox": {"l": 134.765, "t": 254.01288, "r": 480.5938100000001, "b": 262.80988, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "rect the predicted OTSL sequence on-the-fly is to verify if the token with the", "bbox": {"l": 134.765, "t": 265.96887000000004, "r": 480.59069999999997, "b": 274.76586999999995, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "highest prediction confidence invalidates the predicted sequence, and replace it", "bbox": {"l": 134.765, "t": 277.92389000000003, "r": 480.5957599999999, "b": 286.72086, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "by the token with the next highest confidence until OTSL rules are satisfied.", "bbox": {"l": 134.765, "t": 289.8788799999999, "r": 469.40369, "b": 298.67584, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The design of OTSL allows to validate a table structure easily on an unfinished sequence. The detection of an invalid sequence token is a clear indication of a prediction mistake, however a valid sequence by itself does not guarantee prediction correctness. Different heuristics can be used to correct token errors in an invalid sequence and thus increase the chances for accurate predictions. Such heuristics can be applied either after the prediction of each token, or at the end on the entire predicted sequence. For example a simple heuristic which can correct the predicted OTSL sequence on-the-fly is to verify if the token with the highest prediction confidence invalidates the predicted sequence, and replace it by the token with the next highest confidence until OTSL rules are satisfied."}, {"label": "section_header", "id": 3, "page_no": 7, "cluster": {"id": 3, "label": "section_header", "bbox": {"l": 134.765, "t": 321.164, "r": 229.03534, "b": 331.73239000000007, "coord_origin": "TOPLEFT"}, "confidence": 0.95152747631073, "cells": [{"id": 17, "text": "5", "bbox": {"l": 134.765, "t": 321.164, "r": 141.4886, "b": 331.73239000000007, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Experiments", "bbox": {"l": 154.9382, "t": 321.164, "r": 229.03534, "b": 331.73239000000007, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5 Experiments"}, {"label": "text", "id": 1, "page_no": 7, "cluster": {"id": 1, "label": "text", "bbox": {"l": 134.765, "t": 347.24985, "r": 480.59528, "b": 451.6877099999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9877985119819641, "cells": [{"id": 19, "text": "To evaluate the impact of OTSL on prediction accuracy and inference times, we", "bbox": {"l": 134.765, "t": 347.24985, "r": 480.59375, "b": 356.04681, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "conducted a series of experiments based on the TableFormer model (Figure 4)", "bbox": {"l": 134.765, "t": 359.2048300000001, "r": 480.59476, "b": 368.0018, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "with two objectives: Firstly we evaluate the prediction quality and performance", "bbox": {"l": 134.765, "t": 371.15982, "r": 480.58786000000003, "b": 379.95679, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "of OTSL vs. HTML after performing Hyper Parameter Optimization (HPO) on", "bbox": {"l": 134.765, "t": 383.11481000000003, "r": 480.58777, "b": 391.91177, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "the", "bbox": {"l": 134.765, "t": 395.06978999999995, "r": 148.59807, "b": 403.86676, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "canonical", "bbox": {"l": 151.627, "t": 395.06978999999995, "r": 191.84703, "b": 403.86676, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "PubTabNet data set. Secondly we pick the best hyper-parameters", "bbox": {"l": 195.90201, "t": 395.06978999999995, "r": 480.59528, "b": 403.86676, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "found in the first step and evaluate how OTSL impacts the performance of", "bbox": {"l": 134.76501, "t": 407.02478, "r": 480.59283000000005, "b": 415.82175, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "TableFormer after training on other publicly available data sets (FinTabNet,", "bbox": {"l": 134.76501, "t": 418.98077, "r": 480.59476, "b": 427.77774, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "PubTables-1M [14]). The ground truth (GT) from all data sets has been con-", "bbox": {"l": 134.76501, "t": 430.93576, "r": 480.59171, "b": 439.73273, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "verted into OTSL format for this purpose, and will be made publicly available.", "bbox": {"l": 134.76501, "t": 442.8907500000001, "r": 479.30258, "b": 451.6877099999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "To evaluate the impact of OTSL on prediction accuracy and inference times, we conducted a series of experiments based on the TableFormer model (Figure 4) with two objectives: Firstly we evaluate the prediction quality and performance of OTSL vs. HTML after performing Hyper Parameter Optimization (HPO) on the canonical PubTabNet data set. Secondly we pick the best hyper-parameters found in the first step and evaluate how OTSL impacts the performance of TableFormer after training on other publicly available data sets (FinTabNet, PubTables-1M [14]). The ground truth (GT) from all data sets has been converted into OTSL format for this purpose, and will be made publicly available."}, {"label": "caption", "id": 7, "page_no": 7, "cluster": {"id": 7, "label": "caption", "bbox": {"l": 134.76501, "t": 484.64813, "r": 480.59082, "b": 503.73965, "coord_origin": "TOPLEFT"}, "confidence": 0.9297956228256226, "cells": [{"id": 30, "text": "Fig. 4.", "bbox": {"l": 134.76501, "t": 484.64813, "r": 162.64424, "b": 492.57443, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Architecture sketch of the TableFormer model, which is a representative for the", "bbox": {"l": 165.19601, "t": 484.71091, "r": 480.59082, "b": 492.78067, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Im2Seq approach.", "bbox": {"l": 134.76501, "t": 495.66989, "r": 206.70245, "b": 503.73965, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Fig. 4. Architecture sketch of the TableFormer model, which is a representative for the Im2Seq approach."}, {"label": "picture", "id": 6, "page_no": 7, "cluster": {"id": 6, "label": "picture", "bbox": {"l": 140.70968627929688, "t": 508.0638427734375, "r": 472.73382568359375, "b": 593.6771850585938, "coord_origin": "TOPLEFT"}, "confidence": 0.9303396344184875, "cells": [{"id": 33, "text": "1.", "bbox": {"l": 147.30025, "t": 540.73164, "r": 149.70605, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Item", "bbox": {"l": 150.90895, "t": 540.73164, "r": 155.72055, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "Amount", "bbox": {"l": 162.75987, "t": 535.3938, "r": 172.2963, "b": 537.76224, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Names", "bbox": {"l": 147.63603, "t": 535.3661500000001, "r": 155.91753, "b": 537.73459, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "1000", "bbox": {"l": 158.48466, "t": 540.73164, "r": 164.10178, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "500", "bbox": {"l": 158.48466, "t": 544.67065, "r": 162.69737, "b": 547.03909, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "3500", "bbox": {"l": 158.48466, "t": 548.91264, "r": 164.10178, "b": 551.28108, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "150", "bbox": {"l": 158.48466, "t": 553.15465, "r": 162.69737, "b": 555.52309, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "unit", "bbox": {"l": 168.81696, "t": 540.73164, "r": 172.88876, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "unit", "bbox": {"l": 168.81696, "t": 544.67065, "r": 172.88876, "b": 547.03909, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "unit", "bbox": {"l": 168.81696, "t": 548.91264, "r": 172.88876, "b": 551.28108, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "unit", "bbox": {"l": 168.81696, "t": 553.15465, "r": 172.88876, "b": 555.52309, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "2.", "bbox": {"l": 147.30025, "t": 544.67065, "r": 149.70605, "b": 547.03909, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "Item", "bbox": {"l": 150.90895, "t": 544.67065, "r": 155.72055, "b": 547.03909, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "3.", "bbox": {"l": 147.30025, "t": 548.91264, "r": 149.70605, "b": 551.28108, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Item", "bbox": {"l": 150.90895, "t": 548.91264, "r": 155.72055, "b": 551.28108, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "4.", "bbox": {"l": 147.30025, "t": 553.15465, "r": 149.70605, "b": 555.52309, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Item", "bbox": {"l": 150.90895, "t": 553.15465, "r": 155.72055, "b": 555.52309, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Extracted", "bbox": {"l": 152.05046, "t": 517.0098, "r": 171.24945, "b": 521.27298, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Table Images", "bbox": {"l": 148.13347, "t": 522.3122900000001, "r": 175.16759, "b": 526.57547, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Standardized", "bbox": {"l": 193.53331, "t": 524.51422, "r": 220.31973, "b": 528.7774, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "Images", "bbox": {"l": 199.47311, "t": 529.8167100000001, "r": 214.37889, "b": 534.0799, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "BBox", "bbox": {"l": 273.61066, "t": 509.9053, "r": 284.47275, "b": 514.16849, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Decoder", "bbox": {"l": 270.45187, "t": 513.6928399999999, "r": 287.63242, "b": 517.9560200000001, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "BBoxes", "bbox": {"l": 332.47852, "t": 508.14438, "r": 348.14014, "b": 512.40756, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "BBoxes can be", "bbox": {"l": 376.68622, "t": 521.12024, "r": 407.25497, "b": 525.38342, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "traced back to the", "bbox": {"l": 373.90869, "t": 525.66525, "r": 410.03506, "b": 529.92844, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "original image to", "bbox": {"l": 375.29871, "t": 530.21024, "r": 408.64902, "b": 534.47342, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "extract content", "bbox": {"l": 377.06747, "t": 534.75522, "r": 406.88312, "b": 539.01843, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "Structure Tags sequence", "bbox": {"l": 383.56683, "t": 563.24176, "r": 433.76544, "b": 567.50497, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "provide full description of", "bbox": {"l": 383.52768, "t": 567.78676, "r": 433.80764999999997, "b": 572.04997, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "the table structure", "bbox": {"l": 390.47522, "t": 572.33177, "r": 426.85703, "b": 576.59499, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "Structure Tags", "bbox": {"l": 293.94702, "t": 577.89143, "r": 323.1691, "b": 582.15465, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "in OTSL format", "bbox": {"l": 293.94702, "t": 582.43648, "r": 324.59396, "b": 586.69969, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "BBoxes in sync", "bbox": {"l": 333.07819, "t": 541.82269, "r": 364.14691, "b": 546.08591, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "with tag sequence", "bbox": {"l": 333.07819, "t": 545.6102, "r": 369.71542, "b": 549.87341, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "Encoder", "bbox": {"l": 232.65881000000002, "t": 515.24139, "r": 249.58894000000004, "b": 519.50458, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "Structure", "bbox": {"l": 269.8219, "t": 545.97102, "r": 288.26279, "b": 550.23424, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Decoder", "bbox": {"l": 270.45187, "t": 549.75851, "r": 287.63242, "b": 554.0217299999999, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "[x1, y2, x2, y2]", "bbox": {"l": 332.17676, "t": 515.91205, "r": 358.11206, "b": 520.17523, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "[x1', y2', x2', y2']", "bbox": {"l": 332.17676, "t": 521.9720500000001, "r": 361.58298, "b": 526.23523, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "[x1'', y2'', x2'', y2'']", "bbox": {"l": 332.17676, "t": 528.03204, "r": 364.76474, "b": 532.29523, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "...", "bbox": {"l": 332.17676, "t": 534.09204, "r": 335.96548, "b": 538.35524, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "1", "bbox": {"l": 326.8894, "t": 516.39508, "r": 329.41641, "b": 520.6582599999999, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "2", "bbox": {"l": 327.04089, "t": 522.4247700000001, "r": 329.5679, "b": 526.68796, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "3", "bbox": {"l": 327.04089, "t": 528.51508, "r": 329.5679, "b": 532.77826, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "3", "bbox": {"l": 424.14102, "t": 527.4428399999999, "r": 426.66803, "b": 531.7060200000001, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "2", "bbox": {"l": 453.0018, "t": 517.4539500000001, "r": 455.52881, "b": 521.71713, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "1", "bbox": {"l": 423.85825, "t": 517.06281, "r": 426.38525, "b": 521.32599, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "C", "bbox": {"l": 333.4342, "t": 557.36679, "r": 337.27542, "b": 562.35719, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "C", "bbox": {"l": 340.35397, "t": 557.31679, "r": 344.19519, "b": 562.30719, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "C", "bbox": {"l": 340.30978, "t": 563.8653899999999, "r": 344.151, "b": 568.8557900000001, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "C", "bbox": {"l": 346.79904, "t": 563.8686700000001, "r": 350.64026, "b": 568.85907, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "C", "bbox": {"l": 333.59583, "t": 563.82271, "r": 337.43704, "b": 568.81311, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "C", "bbox": {"l": 340.37543, "t": 570.42673, "r": 344.21664, "b": 575.41713, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "C", "bbox": {"l": 346.86469, "t": 570.43001, "r": 350.7059, "b": 575.42041, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "C", "bbox": {"l": 333.66144, "t": 570.38405, "r": 337.50266, "b": 575.37445, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "C", "bbox": {"l": 340.37671, "t": 577.02606, "r": 344.21793, "b": 582.0164599999999, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "C", "bbox": {"l": 346.86597, "t": 577.02934, "r": 350.70718, "b": 582.01974, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "C", "bbox": {"l": 333.66272, "t": 576.98338, "r": 337.50394, "b": 581.97379, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "C", "bbox": {"l": 340.27948, "t": 583.39737, "r": 344.1207, "b": 588.38777, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "C", "bbox": {"l": 346.76874, "t": 583.40068, "r": 350.60995, "b": 588.39108, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "C", "bbox": {"l": 333.56549, "t": 583.35474, "r": 337.40671, "b": 588.34514, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "NL", "bbox": {"l": 353.03326, "t": 556.8831299999999, "r": 359.83362, "b": 561.87354, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "NL", "bbox": {"l": 353.18604, "t": 563.58044, "r": 359.98639, "b": 568.57085, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "NL", "bbox": {"l": 353.19864, "t": 570.1623500000001, "r": 359.99899, "b": 575.15276, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "NL", "bbox": {"l": 353.1532, "t": 576.76611, "r": 359.95355, "b": 581.75652, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "NL", "bbox": {"l": 353.26935, "t": 583.40628, "r": 360.0697, "b": 588.3966800000001, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "L", "bbox": {"l": 347.37979, "t": 557.08235, "r": 350.33786, "b": 562.07275, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "3", "bbox": {"l": 331.14026, "t": 564.2907700000001, "r": 333.66727, "b": 568.55399, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "2", "bbox": {"l": 340.80972, "t": 554.59312, "r": 343.33673, "b": 558.85634, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "1", "bbox": {"l": 330.97992, "t": 554.83035, "r": 333.50693, "b": 559.09357, "coord_origin": "TOPLEFT"}}], "children": [{"id": 10, "label": "text", "bbox": {"l": 147.30025, "t": 540.73164, "r": 149.70605, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "1.", "bbox": {"l": 147.30025, "t": 540.73164, "r": 149.70605, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 150.90895, "t": 540.73164, "r": 155.72055, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "Item", "bbox": {"l": 150.90895, "t": 540.73164, "r": 155.72055, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 162.75987, "t": 535.3938, "r": 172.2963, "b": 537.76224, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "Amount", "bbox": {"l": 162.75987, "t": 535.3938, "r": 172.2963, "b": 537.76224, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 147.63603, "t": 535.3661500000001, "r": 155.91753, "b": 537.73459, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "Names", "bbox": {"l": 147.63603, "t": 535.3661500000001, "r": 155.91753, "b": 537.73459, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 158.48466, "t": 540.73164, "r": 164.10178, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "1000", "bbox": {"l": 158.48466, "t": 540.73164, "r": 164.10178, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 158.48466, "t": 544.67065, "r": 162.69737, "b": 547.03909, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "500", "bbox": {"l": 158.48466, "t": 544.67065, "r": 162.69737, "b": 547.03909, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 158.48466, "t": 548.91264, "r": 164.10178, "b": 551.28108, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "3500", "bbox": {"l": 158.48466, "t": 548.91264, "r": 164.10178, "b": 551.28108, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 158.48466, "t": 553.15465, "r": 162.69737, "b": 555.52309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "150", "bbox": {"l": 158.48466, "t": 553.15465, "r": 162.69737, "b": 555.52309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 168.81696, "t": 540.73164, "r": 172.88876, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "unit", "bbox": {"l": 168.81696, "t": 540.73164, "r": 172.88876, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 168.81696, "t": 544.67065, "r": 172.88876, "b": 547.03909, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "unit", "bbox": {"l": 168.81696, "t": 544.67065, "r": 172.88876, "b": 547.03909, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 168.81696, "t": 548.91264, "r": 172.88876, "b": 551.28108, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "unit", "bbox": {"l": 168.81696, "t": 548.91264, "r": 172.88876, "b": 551.28108, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 168.81696, "t": 553.15465, "r": 172.88876, "b": 555.52309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "unit", "bbox": {"l": 168.81696, "t": 553.15465, "r": 172.88876, "b": 555.52309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 147.30025, "t": 544.67065, "r": 149.70605, "b": 547.03909, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "2.", "bbox": {"l": 147.30025, "t": 544.67065, "r": 149.70605, "b": 547.03909, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 150.90895, "t": 544.67065, "r": 155.72055, "b": 547.03909, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "Item", "bbox": {"l": 150.90895, "t": 544.67065, "r": 155.72055, "b": 547.03909, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 147.30025, "t": 548.91264, "r": 149.70605, "b": 551.28108, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "3.", "bbox": {"l": 147.30025, "t": 548.91264, "r": 149.70605, "b": 551.28108, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 150.90895, "t": 548.91264, "r": 155.72055, "b": 551.28108, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "Item", "bbox": {"l": 150.90895, "t": 548.91264, "r": 155.72055, "b": 551.28108, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 147.30025, "t": 553.15465, "r": 149.70605, "b": 555.52309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "4.", "bbox": {"l": 147.30025, "t": 553.15465, "r": 149.70605, "b": 555.52309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 150.90895, "t": 553.15465, "r": 155.72055, "b": 555.52309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "Item", "bbox": {"l": 150.90895, "t": 553.15465, "r": 155.72055, "b": 555.52309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 152.05046, "t": 517.0098, "r": 171.24945, "b": 521.27298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "Extracted", "bbox": {"l": 152.05046, "t": 517.0098, "r": 171.24945, "b": 521.27298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 148.13347, "t": 522.3122900000001, "r": 175.16759, "b": 526.57547, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "Table Images", "bbox": {"l": 148.13347, "t": 522.3122900000001, "r": 175.16759, "b": 526.57547, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 193.53331, "t": 524.51422, "r": 220.31973, "b": 528.7774, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "Standardized", "bbox": {"l": 193.53331, "t": 524.51422, "r": 220.31973, "b": 528.7774, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 199.47311, "t": 529.8167100000001, "r": 214.37889, "b": 534.0799, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "Images", "bbox": {"l": 199.47311, "t": 529.8167100000001, "r": 214.37889, "b": 534.0799, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 273.61066, "t": 509.9053, "r": 284.47275, "b": 514.16849, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "BBox", "bbox": {"l": 273.61066, "t": 509.9053, "r": 284.47275, "b": 514.16849, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 270.45187, "t": 513.6928399999999, "r": 287.63242, "b": 517.9560200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "Decoder", "bbox": {"l": 270.45187, "t": 513.6928399999999, "r": 287.63242, "b": 517.9560200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 332.47852, "t": 508.14438, "r": 348.14014, "b": 512.40756, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "BBoxes", "bbox": {"l": 332.47852, "t": 508.14438, "r": 348.14014, "b": 512.40756, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 376.68622, "t": 521.12024, "r": 407.25497, "b": 525.38342, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "BBoxes can be", "bbox": {"l": 376.68622, "t": 521.12024, "r": 407.25497, "b": 525.38342, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 373.90869, "t": 525.66525, "r": 410.03506, "b": 529.92844, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "traced back to the", "bbox": {"l": 373.90869, "t": 525.66525, "r": 410.03506, "b": 529.92844, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 375.29871, "t": 530.21024, "r": 408.64902, "b": 534.47342, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "original image to", "bbox": {"l": 375.29871, "t": 530.21024, "r": 408.64902, "b": 534.47342, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 377.06747, "t": 534.75522, "r": 406.88312, "b": 539.01843, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "extract content", "bbox": {"l": 377.06747, "t": 534.75522, "r": 406.88312, "b": 539.01843, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 383.56683, "t": 563.24176, "r": 433.76544, "b": 567.50497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "Structure Tags sequence", "bbox": {"l": 383.56683, "t": 563.24176, "r": 433.76544, "b": 567.50497, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 383.52768, "t": 567.78676, "r": 433.80764999999997, "b": 572.04997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "provide full description of", "bbox": {"l": 383.52768, "t": 567.78676, "r": 433.80764999999997, "b": 572.04997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 390.47522, "t": 572.33177, "r": 426.85703, "b": 576.59499, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "the table structure", "bbox": {"l": 390.47522, "t": 572.33177, "r": 426.85703, "b": 576.59499, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 293.94702, "t": 577.89143, "r": 323.1691, "b": 582.15465, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "Structure Tags", "bbox": {"l": 293.94702, "t": 577.89143, "r": 323.1691, "b": 582.15465, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 293.94702, "t": 582.43648, "r": 324.59396, "b": 586.69969, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "in OTSL format", "bbox": {"l": 293.94702, "t": 582.43648, "r": 324.59396, "b": 586.69969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 333.07819, "t": 541.82269, "r": 364.14691, "b": 546.08591, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "BBoxes in sync", "bbox": {"l": 333.07819, "t": 541.82269, "r": 364.14691, "b": 546.08591, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 333.07819, "t": 545.6102, "r": 369.71542, "b": 549.87341, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "with tag sequence", "bbox": {"l": 333.07819, "t": 545.6102, "r": 369.71542, "b": 549.87341, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 232.65881000000002, "t": 515.24139, "r": 249.58894000000004, "b": 519.50458, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "Encoder", "bbox": {"l": 232.65881000000002, "t": 515.24139, "r": 249.58894000000004, "b": 519.50458, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 269.8219, "t": 545.97102, "r": 288.26279, "b": 550.23424, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "Structure", "bbox": {"l": 269.8219, "t": 545.97102, "r": 288.26279, "b": 550.23424, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 270.45187, "t": 549.75851, "r": 287.63242, "b": 554.0217299999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "Decoder", "bbox": {"l": 270.45187, "t": 549.75851, "r": 287.63242, "b": 554.0217299999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 332.17676, "t": 515.91205, "r": 358.11206, "b": 520.17523, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "[x1, y2, x2, y2]", "bbox": {"l": 332.17676, "t": 515.91205, "r": 358.11206, "b": 520.17523, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 332.17676, "t": 521.9720500000001, "r": 361.58298, "b": 526.23523, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "[x1', y2', x2', y2']", "bbox": {"l": 332.17676, "t": 521.9720500000001, "r": 361.58298, "b": 526.23523, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 332.17676, "t": 528.03204, "r": 364.76474, "b": 532.29523, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "[x1'', y2'', x2'', y2'']", "bbox": {"l": 332.17676, "t": 528.03204, "r": 364.76474, "b": 532.29523, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 332.17676, "t": 534.09204, "r": 335.96548, "b": 538.35524, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "...", "bbox": {"l": 332.17676, "t": 534.09204, "r": 335.96548, "b": 538.35524, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 326.8894, "t": 516.39508, "r": 329.41641, "b": 520.6582599999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "1", "bbox": {"l": 326.8894, "t": 516.39508, "r": 329.41641, "b": 520.6582599999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 327.04089, "t": 522.4247700000001, "r": 329.5679, "b": 526.68796, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "2", "bbox": {"l": 327.04089, "t": 522.4247700000001, "r": 329.5679, "b": 526.68796, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 327.04089, "t": 528.51508, "r": 329.5679, "b": 532.77826, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "3", "bbox": {"l": 327.04089, "t": 528.51508, "r": 329.5679, "b": 532.77826, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 424.14102, "t": 527.4428399999999, "r": 426.66803, "b": 531.7060200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "3", "bbox": {"l": 424.14102, "t": 527.4428399999999, "r": 426.66803, "b": 531.7060200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 453.0018, "t": 517.4539500000001, "r": 455.52881, "b": 521.71713, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "2", "bbox": {"l": 453.0018, "t": 517.4539500000001, "r": 455.52881, "b": 521.71713, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 423.85825, "t": 517.06281, "r": 426.38525, "b": 521.32599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "1", "bbox": {"l": 423.85825, "t": 517.06281, "r": 426.38525, "b": 521.32599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 333.4342, "t": 557.36679, "r": 337.27542, "b": 562.35719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "C", "bbox": {"l": 333.4342, "t": 557.36679, "r": 337.27542, "b": 562.35719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 340.35397, "t": 557.31679, "r": 344.19519, "b": 562.30719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "C", "bbox": {"l": 340.35397, "t": 557.31679, "r": 344.19519, "b": 562.30719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 340.30978, "t": 563.8653899999999, "r": 344.151, "b": 568.8557900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "C", "bbox": {"l": 340.30978, "t": 563.8653899999999, "r": 344.151, "b": 568.8557900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 346.79904, "t": 563.8686700000001, "r": 350.64026, "b": 568.85907, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "C", "bbox": {"l": 346.79904, "t": 563.8686700000001, "r": 350.64026, "b": 568.85907, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 333.59583, "t": 563.82271, "r": 337.43704, "b": 568.81311, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "C", "bbox": {"l": 333.59583, "t": 563.82271, "r": 337.43704, "b": 568.81311, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 340.37543, "t": 570.42673, "r": 344.21664, "b": 575.41713, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "C", "bbox": {"l": 340.37543, "t": 570.42673, "r": 344.21664, "b": 575.41713, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 346.86469, "t": 570.43001, "r": 350.7059, "b": 575.42041, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "C", "bbox": {"l": 346.86469, "t": 570.43001, "r": 350.7059, "b": 575.42041, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 333.66144, "t": 570.38405, "r": 337.50266, "b": 575.37445, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "C", "bbox": {"l": 333.66144, "t": 570.38405, "r": 337.50266, "b": 575.37445, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 340.37671, "t": 577.02606, "r": 344.21793, "b": 582.0164599999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "C", "bbox": {"l": 340.37671, "t": 577.02606, "r": 344.21793, "b": 582.0164599999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 346.86597, "t": 577.02934, "r": 350.70718, "b": 582.01974, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "C", "bbox": {"l": 346.86597, "t": 577.02934, "r": 350.70718, "b": 582.01974, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 333.66272, "t": 576.98338, "r": 337.50394, "b": 581.97379, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "C", "bbox": {"l": 333.66272, "t": 576.98338, "r": 337.50394, "b": 581.97379, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 340.27948, "t": 583.39737, "r": 344.1207, "b": 588.38777, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "C", "bbox": {"l": 340.27948, "t": 583.39737, "r": 344.1207, "b": 588.38777, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 346.76874, "t": 583.40068, "r": 350.60995, "b": 588.39108, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "C", "bbox": {"l": 346.76874, "t": 583.40068, "r": 350.60995, "b": 588.39108, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 333.56549, "t": 583.35474, "r": 337.40671, "b": 588.34514, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "C", "bbox": {"l": 333.56549, "t": 583.35474, "r": 337.40671, "b": 588.34514, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 353.03326, "t": 556.8831299999999, "r": 359.83362, "b": 561.87354, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "NL", "bbox": {"l": 353.03326, "t": 556.8831299999999, "r": 359.83362, "b": 561.87354, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 353.18604, "t": 563.58044, "r": 359.98639, "b": 568.57085, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "NL", "bbox": {"l": 353.18604, "t": 563.58044, "r": 359.98639, "b": 568.57085, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 353.19864, "t": 570.1623500000001, "r": 359.99899, "b": 575.15276, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "NL", "bbox": {"l": 353.19864, "t": 570.1623500000001, "r": 359.99899, "b": 575.15276, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 353.1532, "t": 576.76611, "r": 359.95355, "b": 581.75652, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "NL", "bbox": {"l": 353.1532, "t": 576.76611, "r": 359.95355, "b": 581.75652, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 353.26935, "t": 583.40628, "r": 360.0697, "b": 588.3966800000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "NL", "bbox": {"l": 353.26935, "t": 583.40628, "r": 360.0697, "b": 588.3966800000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 347.37979, "t": 557.08235, "r": 350.33786, "b": 562.07275, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "L", "bbox": {"l": 347.37979, "t": 557.08235, "r": 350.33786, "b": 562.07275, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 331.14026, "t": 564.2907700000001, "r": 333.66727, "b": 568.55399, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "3", "bbox": {"l": 331.14026, "t": 564.2907700000001, "r": 333.66727, "b": 568.55399, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 340.80972, "t": 554.59312, "r": 343.33673, "b": 558.85634, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": "2", "bbox": {"l": 340.80972, "t": 554.59312, "r": 343.33673, "b": 558.85634, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 330.97992, "t": 554.83035, "r": 333.50693, "b": 559.09357, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "1", "bbox": {"l": 330.97992, "t": 554.83035, "r": 333.50693, "b": 559.09357, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "text", "id": 4, "page_no": 7, "cluster": {"id": 4, "label": "text", "bbox": {"l": 134.765, "t": 620.19278, "r": 480.5917400000001, "b": 664.8547599999999, "coord_origin": "TOPLEFT"}, "confidence": 0.951270341873169, "cells": [{"id": 105, "text": "We rely on standard metrics such as Tree Edit Distance score (TEDs) for", "bbox": {"l": 149.709, "t": 620.19278, "r": 480.58792, "b": 628.98975, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "table structure prediction, and Mean Average Precision (mAP) with 0.75 Inter-", "bbox": {"l": 134.765, "t": 632.14778, "r": 480.58871, "b": 640.94475, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "section Over Union (IOU) threshold for the bounding-box predictions of table", "bbox": {"l": 134.765, "t": 644.1027799999999, "r": 480.5917400000001, "b": 652.89975, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "cells. The predicted OTSL structures were converted back to HTML format in", "bbox": {"l": 134.765, "t": 656.0577900000001, "r": 480.58968999999996, "b": 664.8547599999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "We rely on standard metrics such as Tree Edit Distance score (TEDs) for table structure prediction, and Mean Average Precision (mAP) with 0.75 Intersection Over Union (IOU) threshold for the bounding-box predictions of table cells. The predicted OTSL structures were converted back to HTML format in"}], "body": [{"label": "text", "id": 5, "page_no": 7, "cluster": {"id": 5, "label": "text", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.58884000000006, "b": 139.68579, "coord_origin": "TOPLEFT"}, "confidence": 0.9464744925498962, "cells": [{"id": 3, "text": "reduces significantly the column drift seen in the HTML based models (see Fig-", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.58884000000006, "b": 127.73077, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "ure 5).", "bbox": {"l": 134.765, "t": 130.88878999999997, "r": 163.56389, "b": 139.68579, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "reduces significantly the column drift seen in the HTML based models (see Figure 5)."}, {"label": "section_header", "id": 2, "page_no": 7, "cluster": {"id": 2, "label": "section_header", "bbox": {"l": 134.765, "t": 161.55682000000002, "r": 319.34708, "b": 170.36377000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9549514651298523, "cells": [{"id": 5, "text": "4.3", "bbox": {"l": 134.765, "t": 161.55682000000002, "r": 149.40205, "b": 170.36377000000005, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Error-detection and -mitigation", "bbox": {"l": 160.85904, "t": 161.55682000000002, "r": 319.34708, "b": 170.36377000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4.3 Error-detection and -mitigation"}, {"label": "text", "id": 0, "page_no": 7, "cluster": {"id": 0, "label": "text", "bbox": {"l": 134.765, "t": 182.28179999999998, "r": 480.5957599999999, "b": 298.67584, "coord_origin": "TOPLEFT"}, "confidence": 0.9879790544509888, "cells": [{"id": 7, "text": "The design of OTSL allows to validate a table structure easily on an unfinished", "bbox": {"l": 134.765, "t": 182.28179999999998, "r": 480.59572999999995, "b": 191.0788, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "sequence. The detection of an invalid sequence token is a clear indication of a", "bbox": {"l": 134.765, "t": 194.23779000000002, "r": 480.59473, "b": 203.03479000000004, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "prediction mistake, however a valid sequence by itself does not guarantee pre-", "bbox": {"l": 134.765, "t": 206.19281, "r": 480.58678999999995, "b": 214.98981000000003, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "diction correctness. Different heuristics can be used to correct token errors in", "bbox": {"l": 134.765, "t": 218.14783, "r": 480.59177000000005, "b": 226.94482000000005, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "an invalid sequence and thus increase the chances for accurate predictions. Such", "bbox": {"l": 134.765, "t": 230.10284000000001, "r": 480.58768, "b": 238.89984000000004, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "heuristics can be applied either after the prediction of each token, or at the end", "bbox": {"l": 134.765, "t": 242.05786, "r": 480.5867, "b": 250.85486000000003, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "on the entire predicted sequence. For example a simple heuristic which can cor-", "bbox": {"l": 134.765, "t": 254.01288, "r": 480.5938100000001, "b": 262.80988, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "rect the predicted OTSL sequence on-the-fly is to verify if the token with the", "bbox": {"l": 134.765, "t": 265.96887000000004, "r": 480.59069999999997, "b": 274.76586999999995, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "highest prediction confidence invalidates the predicted sequence, and replace it", "bbox": {"l": 134.765, "t": 277.92389000000003, "r": 480.5957599999999, "b": 286.72086, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "by the token with the next highest confidence until OTSL rules are satisfied.", "bbox": {"l": 134.765, "t": 289.8788799999999, "r": 469.40369, "b": 298.67584, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The design of OTSL allows to validate a table structure easily on an unfinished sequence. The detection of an invalid sequence token is a clear indication of a prediction mistake, however a valid sequence by itself does not guarantee prediction correctness. Different heuristics can be used to correct token errors in an invalid sequence and thus increase the chances for accurate predictions. Such heuristics can be applied either after the prediction of each token, or at the end on the entire predicted sequence. For example a simple heuristic which can correct the predicted OTSL sequence on-the-fly is to verify if the token with the highest prediction confidence invalidates the predicted sequence, and replace it by the token with the next highest confidence until OTSL rules are satisfied."}, {"label": "section_header", "id": 3, "page_no": 7, "cluster": {"id": 3, "label": "section_header", "bbox": {"l": 134.765, "t": 321.164, "r": 229.03534, "b": 331.73239000000007, "coord_origin": "TOPLEFT"}, "confidence": 0.95152747631073, "cells": [{"id": 17, "text": "5", "bbox": {"l": 134.765, "t": 321.164, "r": 141.4886, "b": 331.73239000000007, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Experiments", "bbox": {"l": 154.9382, "t": 321.164, "r": 229.03534, "b": 331.73239000000007, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5 Experiments"}, {"label": "text", "id": 1, "page_no": 7, "cluster": {"id": 1, "label": "text", "bbox": {"l": 134.765, "t": 347.24985, "r": 480.59528, "b": 451.6877099999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9877985119819641, "cells": [{"id": 19, "text": "To evaluate the impact of OTSL on prediction accuracy and inference times, we", "bbox": {"l": 134.765, "t": 347.24985, "r": 480.59375, "b": 356.04681, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "conducted a series of experiments based on the TableFormer model (Figure 4)", "bbox": {"l": 134.765, "t": 359.2048300000001, "r": 480.59476, "b": 368.0018, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "with two objectives: Firstly we evaluate the prediction quality and performance", "bbox": {"l": 134.765, "t": 371.15982, "r": 480.58786000000003, "b": 379.95679, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "of OTSL vs. HTML after performing Hyper Parameter Optimization (HPO) on", "bbox": {"l": 134.765, "t": 383.11481000000003, "r": 480.58777, "b": 391.91177, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "the", "bbox": {"l": 134.765, "t": 395.06978999999995, "r": 148.59807, "b": 403.86676, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "canonical", "bbox": {"l": 151.627, "t": 395.06978999999995, "r": 191.84703, "b": 403.86676, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "PubTabNet data set. Secondly we pick the best hyper-parameters", "bbox": {"l": 195.90201, "t": 395.06978999999995, "r": 480.59528, "b": 403.86676, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "found in the first step and evaluate how OTSL impacts the performance of", "bbox": {"l": 134.76501, "t": 407.02478, "r": 480.59283000000005, "b": 415.82175, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "TableFormer after training on other publicly available data sets (FinTabNet,", "bbox": {"l": 134.76501, "t": 418.98077, "r": 480.59476, "b": 427.77774, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "PubTables-1M [14]). The ground truth (GT) from all data sets has been con-", "bbox": {"l": 134.76501, "t": 430.93576, "r": 480.59171, "b": 439.73273, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "verted into OTSL format for this purpose, and will be made publicly available.", "bbox": {"l": 134.76501, "t": 442.8907500000001, "r": 479.30258, "b": 451.6877099999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "To evaluate the impact of OTSL on prediction accuracy and inference times, we conducted a series of experiments based on the TableFormer model (Figure 4) with two objectives: Firstly we evaluate the prediction quality and performance of OTSL vs. HTML after performing Hyper Parameter Optimization (HPO) on the canonical PubTabNet data set. Secondly we pick the best hyper-parameters found in the first step and evaluate how OTSL impacts the performance of TableFormer after training on other publicly available data sets (FinTabNet, PubTables-1M [14]). The ground truth (GT) from all data sets has been converted into OTSL format for this purpose, and will be made publicly available."}, {"label": "caption", "id": 7, "page_no": 7, "cluster": {"id": 7, "label": "caption", "bbox": {"l": 134.76501, "t": 484.64813, "r": 480.59082, "b": 503.73965, "coord_origin": "TOPLEFT"}, "confidence": 0.9297956228256226, "cells": [{"id": 30, "text": "Fig. 4.", "bbox": {"l": 134.76501, "t": 484.64813, "r": 162.64424, "b": 492.57443, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Architecture sketch of the TableFormer model, which is a representative for the", "bbox": {"l": 165.19601, "t": 484.71091, "r": 480.59082, "b": 492.78067, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Im2Seq approach.", "bbox": {"l": 134.76501, "t": 495.66989, "r": 206.70245, "b": 503.73965, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Fig. 4. Architecture sketch of the TableFormer model, which is a representative for the Im2Seq approach."}, {"label": "picture", "id": 6, "page_no": 7, "cluster": {"id": 6, "label": "picture", "bbox": {"l": 140.70968627929688, "t": 508.0638427734375, "r": 472.73382568359375, "b": 593.6771850585938, "coord_origin": "TOPLEFT"}, "confidence": 0.9303396344184875, "cells": [{"id": 33, "text": "1.", "bbox": {"l": 147.30025, "t": 540.73164, "r": 149.70605, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Item", "bbox": {"l": 150.90895, "t": 540.73164, "r": 155.72055, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "Amount", "bbox": {"l": 162.75987, "t": 535.3938, "r": 172.2963, "b": 537.76224, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Names", "bbox": {"l": 147.63603, "t": 535.3661500000001, "r": 155.91753, "b": 537.73459, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "1000", "bbox": {"l": 158.48466, "t": 540.73164, "r": 164.10178, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "500", "bbox": {"l": 158.48466, "t": 544.67065, "r": 162.69737, "b": 547.03909, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "3500", "bbox": {"l": 158.48466, "t": 548.91264, "r": 164.10178, "b": 551.28108, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "150", "bbox": {"l": 158.48466, "t": 553.15465, "r": 162.69737, "b": 555.52309, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "unit", "bbox": {"l": 168.81696, "t": 540.73164, "r": 172.88876, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "unit", "bbox": {"l": 168.81696, "t": 544.67065, "r": 172.88876, "b": 547.03909, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "unit", "bbox": {"l": 168.81696, "t": 548.91264, "r": 172.88876, "b": 551.28108, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "unit", "bbox": {"l": 168.81696, "t": 553.15465, "r": 172.88876, "b": 555.52309, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "2.", "bbox": {"l": 147.30025, "t": 544.67065, "r": 149.70605, "b": 547.03909, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "Item", "bbox": {"l": 150.90895, "t": 544.67065, "r": 155.72055, "b": 547.03909, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "3.", "bbox": {"l": 147.30025, "t": 548.91264, "r": 149.70605, "b": 551.28108, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Item", "bbox": {"l": 150.90895, "t": 548.91264, "r": 155.72055, "b": 551.28108, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "4.", "bbox": {"l": 147.30025, "t": 553.15465, "r": 149.70605, "b": 555.52309, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Item", "bbox": {"l": 150.90895, "t": 553.15465, "r": 155.72055, "b": 555.52309, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Extracted", "bbox": {"l": 152.05046, "t": 517.0098, "r": 171.24945, "b": 521.27298, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Table Images", "bbox": {"l": 148.13347, "t": 522.3122900000001, "r": 175.16759, "b": 526.57547, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Standardized", "bbox": {"l": 193.53331, "t": 524.51422, "r": 220.31973, "b": 528.7774, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "Images", "bbox": {"l": 199.47311, "t": 529.8167100000001, "r": 214.37889, "b": 534.0799, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "BBox", "bbox": {"l": 273.61066, "t": 509.9053, "r": 284.47275, "b": 514.16849, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Decoder", "bbox": {"l": 270.45187, "t": 513.6928399999999, "r": 287.63242, "b": 517.9560200000001, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "BBoxes", "bbox": {"l": 332.47852, "t": 508.14438, "r": 348.14014, "b": 512.40756, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "BBoxes can be", "bbox": {"l": 376.68622, "t": 521.12024, "r": 407.25497, "b": 525.38342, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "traced back to the", "bbox": {"l": 373.90869, "t": 525.66525, "r": 410.03506, "b": 529.92844, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "original image to", "bbox": {"l": 375.29871, "t": 530.21024, "r": 408.64902, "b": 534.47342, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "extract content", "bbox": {"l": 377.06747, "t": 534.75522, "r": 406.88312, "b": 539.01843, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "Structure Tags sequence", "bbox": {"l": 383.56683, "t": 563.24176, "r": 433.76544, "b": 567.50497, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "provide full description of", "bbox": {"l": 383.52768, "t": 567.78676, "r": 433.80764999999997, "b": 572.04997, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "the table structure", "bbox": {"l": 390.47522, "t": 572.33177, "r": 426.85703, "b": 576.59499, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "Structure Tags", "bbox": {"l": 293.94702, "t": 577.89143, "r": 323.1691, "b": 582.15465, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "in OTSL format", "bbox": {"l": 293.94702, "t": 582.43648, "r": 324.59396, "b": 586.69969, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "BBoxes in sync", "bbox": {"l": 333.07819, "t": 541.82269, "r": 364.14691, "b": 546.08591, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "with tag sequence", "bbox": {"l": 333.07819, "t": 545.6102, "r": 369.71542, "b": 549.87341, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "Encoder", "bbox": {"l": 232.65881000000002, "t": 515.24139, "r": 249.58894000000004, "b": 519.50458, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "Structure", "bbox": {"l": 269.8219, "t": 545.97102, "r": 288.26279, "b": 550.23424, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Decoder", "bbox": {"l": 270.45187, "t": 549.75851, "r": 287.63242, "b": 554.0217299999999, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "[x1, y2, x2, y2]", "bbox": {"l": 332.17676, "t": 515.91205, "r": 358.11206, "b": 520.17523, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "[x1', y2', x2', y2']", "bbox": {"l": 332.17676, "t": 521.9720500000001, "r": 361.58298, "b": 526.23523, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "[x1'', y2'', x2'', y2'']", "bbox": {"l": 332.17676, "t": 528.03204, "r": 364.76474, "b": 532.29523, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "...", "bbox": {"l": 332.17676, "t": 534.09204, "r": 335.96548, "b": 538.35524, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "1", "bbox": {"l": 326.8894, "t": 516.39508, "r": 329.41641, "b": 520.6582599999999, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "2", "bbox": {"l": 327.04089, "t": 522.4247700000001, "r": 329.5679, "b": 526.68796, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "3", "bbox": {"l": 327.04089, "t": 528.51508, "r": 329.5679, "b": 532.77826, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "3", "bbox": {"l": 424.14102, "t": 527.4428399999999, "r": 426.66803, "b": 531.7060200000001, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "2", "bbox": {"l": 453.0018, "t": 517.4539500000001, "r": 455.52881, "b": 521.71713, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "1", "bbox": {"l": 423.85825, "t": 517.06281, "r": 426.38525, "b": 521.32599, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "C", "bbox": {"l": 333.4342, "t": 557.36679, "r": 337.27542, "b": 562.35719, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "C", "bbox": {"l": 340.35397, "t": 557.31679, "r": 344.19519, "b": 562.30719, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "C", "bbox": {"l": 340.30978, "t": 563.8653899999999, "r": 344.151, "b": 568.8557900000001, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "C", "bbox": {"l": 346.79904, "t": 563.8686700000001, "r": 350.64026, "b": 568.85907, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "C", "bbox": {"l": 333.59583, "t": 563.82271, "r": 337.43704, "b": 568.81311, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "C", "bbox": {"l": 340.37543, "t": 570.42673, "r": 344.21664, "b": 575.41713, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "C", "bbox": {"l": 346.86469, "t": 570.43001, "r": 350.7059, "b": 575.42041, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "C", "bbox": {"l": 333.66144, "t": 570.38405, "r": 337.50266, "b": 575.37445, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "C", "bbox": {"l": 340.37671, "t": 577.02606, "r": 344.21793, "b": 582.0164599999999, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "C", "bbox": {"l": 346.86597, "t": 577.02934, "r": 350.70718, "b": 582.01974, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "C", "bbox": {"l": 333.66272, "t": 576.98338, "r": 337.50394, "b": 581.97379, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "C", "bbox": {"l": 340.27948, "t": 583.39737, "r": 344.1207, "b": 588.38777, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "C", "bbox": {"l": 346.76874, "t": 583.40068, "r": 350.60995, "b": 588.39108, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "C", "bbox": {"l": 333.56549, "t": 583.35474, "r": 337.40671, "b": 588.34514, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "NL", "bbox": {"l": 353.03326, "t": 556.8831299999999, "r": 359.83362, "b": 561.87354, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "NL", "bbox": {"l": 353.18604, "t": 563.58044, "r": 359.98639, "b": 568.57085, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "NL", "bbox": {"l": 353.19864, "t": 570.1623500000001, "r": 359.99899, "b": 575.15276, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "NL", "bbox": {"l": 353.1532, "t": 576.76611, "r": 359.95355, "b": 581.75652, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "NL", "bbox": {"l": 353.26935, "t": 583.40628, "r": 360.0697, "b": 588.3966800000001, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "L", "bbox": {"l": 347.37979, "t": 557.08235, "r": 350.33786, "b": 562.07275, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "3", "bbox": {"l": 331.14026, "t": 564.2907700000001, "r": 333.66727, "b": 568.55399, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "2", "bbox": {"l": 340.80972, "t": 554.59312, "r": 343.33673, "b": 558.85634, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "1", "bbox": {"l": 330.97992, "t": 554.83035, "r": 333.50693, "b": 559.09357, "coord_origin": "TOPLEFT"}}], "children": [{"id": 10, "label": "text", "bbox": {"l": 147.30025, "t": 540.73164, "r": 149.70605, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "1.", "bbox": {"l": 147.30025, "t": 540.73164, "r": 149.70605, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 150.90895, "t": 540.73164, "r": 155.72055, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "Item", "bbox": {"l": 150.90895, "t": 540.73164, "r": 155.72055, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 162.75987, "t": 535.3938, "r": 172.2963, "b": 537.76224, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "Amount", "bbox": {"l": 162.75987, "t": 535.3938, "r": 172.2963, "b": 537.76224, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 147.63603, "t": 535.3661500000001, "r": 155.91753, "b": 537.73459, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "Names", "bbox": {"l": 147.63603, "t": 535.3661500000001, "r": 155.91753, "b": 537.73459, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 158.48466, "t": 540.73164, "r": 164.10178, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "1000", "bbox": {"l": 158.48466, "t": 540.73164, "r": 164.10178, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 158.48466, "t": 544.67065, "r": 162.69737, "b": 547.03909, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "500", "bbox": {"l": 158.48466, "t": 544.67065, "r": 162.69737, "b": 547.03909, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 158.48466, "t": 548.91264, "r": 164.10178, "b": 551.28108, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "3500", "bbox": {"l": 158.48466, "t": 548.91264, "r": 164.10178, "b": 551.28108, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 158.48466, "t": 553.15465, "r": 162.69737, "b": 555.52309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "150", "bbox": {"l": 158.48466, "t": 553.15465, "r": 162.69737, "b": 555.52309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 168.81696, "t": 540.73164, "r": 172.88876, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "unit", "bbox": {"l": 168.81696, "t": 540.73164, "r": 172.88876, "b": 543.1000799999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 168.81696, "t": 544.67065, "r": 172.88876, "b": 547.03909, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "unit", "bbox": {"l": 168.81696, "t": 544.67065, "r": 172.88876, "b": 547.03909, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 168.81696, "t": 548.91264, "r": 172.88876, "b": 551.28108, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "unit", "bbox": {"l": 168.81696, "t": 548.91264, "r": 172.88876, "b": 551.28108, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 168.81696, "t": 553.15465, "r": 172.88876, "b": 555.52309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "unit", "bbox": {"l": 168.81696, "t": 553.15465, "r": 172.88876, "b": 555.52309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 147.30025, "t": 544.67065, "r": 149.70605, "b": 547.03909, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "2.", "bbox": {"l": 147.30025, "t": 544.67065, "r": 149.70605, "b": 547.03909, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 150.90895, "t": 544.67065, "r": 155.72055, "b": 547.03909, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "Item", "bbox": {"l": 150.90895, "t": 544.67065, "r": 155.72055, "b": 547.03909, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 147.30025, "t": 548.91264, "r": 149.70605, "b": 551.28108, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "3.", "bbox": {"l": 147.30025, "t": 548.91264, "r": 149.70605, "b": 551.28108, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 150.90895, "t": 548.91264, "r": 155.72055, "b": 551.28108, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "Item", "bbox": {"l": 150.90895, "t": 548.91264, "r": 155.72055, "b": 551.28108, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 147.30025, "t": 553.15465, "r": 149.70605, "b": 555.52309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "4.", "bbox": {"l": 147.30025, "t": 553.15465, "r": 149.70605, "b": 555.52309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 150.90895, "t": 553.15465, "r": 155.72055, "b": 555.52309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "Item", "bbox": {"l": 150.90895, "t": 553.15465, "r": 155.72055, "b": 555.52309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 152.05046, "t": 517.0098, "r": 171.24945, "b": 521.27298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "Extracted", "bbox": {"l": 152.05046, "t": 517.0098, "r": 171.24945, "b": 521.27298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 148.13347, "t": 522.3122900000001, "r": 175.16759, "b": 526.57547, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "Table Images", "bbox": {"l": 148.13347, "t": 522.3122900000001, "r": 175.16759, "b": 526.57547, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 193.53331, "t": 524.51422, "r": 220.31973, "b": 528.7774, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "Standardized", "bbox": {"l": 193.53331, "t": 524.51422, "r": 220.31973, "b": 528.7774, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 199.47311, "t": 529.8167100000001, "r": 214.37889, "b": 534.0799, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "Images", "bbox": {"l": 199.47311, "t": 529.8167100000001, "r": 214.37889, "b": 534.0799, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 273.61066, "t": 509.9053, "r": 284.47275, "b": 514.16849, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "BBox", "bbox": {"l": 273.61066, "t": 509.9053, "r": 284.47275, "b": 514.16849, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 270.45187, "t": 513.6928399999999, "r": 287.63242, "b": 517.9560200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "Decoder", "bbox": {"l": 270.45187, "t": 513.6928399999999, "r": 287.63242, "b": 517.9560200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 332.47852, "t": 508.14438, "r": 348.14014, "b": 512.40756, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "BBoxes", "bbox": {"l": 332.47852, "t": 508.14438, "r": 348.14014, "b": 512.40756, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 376.68622, "t": 521.12024, "r": 407.25497, "b": 525.38342, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "BBoxes can be", "bbox": {"l": 376.68622, "t": 521.12024, "r": 407.25497, "b": 525.38342, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 373.90869, "t": 525.66525, "r": 410.03506, "b": 529.92844, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "traced back to the", "bbox": {"l": 373.90869, "t": 525.66525, "r": 410.03506, "b": 529.92844, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 375.29871, "t": 530.21024, "r": 408.64902, "b": 534.47342, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "original image to", "bbox": {"l": 375.29871, "t": 530.21024, "r": 408.64902, "b": 534.47342, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 377.06747, "t": 534.75522, "r": 406.88312, "b": 539.01843, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "extract content", "bbox": {"l": 377.06747, "t": 534.75522, "r": 406.88312, "b": 539.01843, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 383.56683, "t": 563.24176, "r": 433.76544, "b": 567.50497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "Structure Tags sequence", "bbox": {"l": 383.56683, "t": 563.24176, "r": 433.76544, "b": 567.50497, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 383.52768, "t": 567.78676, "r": 433.80764999999997, "b": 572.04997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "provide full description of", "bbox": {"l": 383.52768, "t": 567.78676, "r": 433.80764999999997, "b": 572.04997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 390.47522, "t": 572.33177, "r": 426.85703, "b": 576.59499, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "the table structure", "bbox": {"l": 390.47522, "t": 572.33177, "r": 426.85703, "b": 576.59499, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 293.94702, "t": 577.89143, "r": 323.1691, "b": 582.15465, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "Structure Tags", "bbox": {"l": 293.94702, "t": 577.89143, "r": 323.1691, "b": 582.15465, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 293.94702, "t": 582.43648, "r": 324.59396, "b": 586.69969, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "in OTSL format", "bbox": {"l": 293.94702, "t": 582.43648, "r": 324.59396, "b": 586.69969, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 333.07819, "t": 541.82269, "r": 364.14691, "b": 546.08591, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "BBoxes in sync", "bbox": {"l": 333.07819, "t": 541.82269, "r": 364.14691, "b": 546.08591, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 333.07819, "t": 545.6102, "r": 369.71542, "b": 549.87341, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "with tag sequence", "bbox": {"l": 333.07819, "t": 545.6102, "r": 369.71542, "b": 549.87341, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 232.65881000000002, "t": 515.24139, "r": 249.58894000000004, "b": 519.50458, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "Encoder", "bbox": {"l": 232.65881000000002, "t": 515.24139, "r": 249.58894000000004, "b": 519.50458, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 269.8219, "t": 545.97102, "r": 288.26279, "b": 550.23424, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "Structure", "bbox": {"l": 269.8219, "t": 545.97102, "r": 288.26279, "b": 550.23424, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 270.45187, "t": 549.75851, "r": 287.63242, "b": 554.0217299999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "Decoder", "bbox": {"l": 270.45187, "t": 549.75851, "r": 287.63242, "b": 554.0217299999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 332.17676, "t": 515.91205, "r": 358.11206, "b": 520.17523, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "[x1, y2, x2, y2]", "bbox": {"l": 332.17676, "t": 515.91205, "r": 358.11206, "b": 520.17523, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 332.17676, "t": 521.9720500000001, "r": 361.58298, "b": 526.23523, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "[x1', y2', x2', y2']", "bbox": {"l": 332.17676, "t": 521.9720500000001, "r": 361.58298, "b": 526.23523, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 332.17676, "t": 528.03204, "r": 364.76474, "b": 532.29523, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "[x1'', y2'', x2'', y2'']", "bbox": {"l": 332.17676, "t": 528.03204, "r": 364.76474, "b": 532.29523, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 332.17676, "t": 534.09204, "r": 335.96548, "b": 538.35524, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "...", "bbox": {"l": 332.17676, "t": 534.09204, "r": 335.96548, "b": 538.35524, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 326.8894, "t": 516.39508, "r": 329.41641, "b": 520.6582599999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "1", "bbox": {"l": 326.8894, "t": 516.39508, "r": 329.41641, "b": 520.6582599999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 327.04089, "t": 522.4247700000001, "r": 329.5679, "b": 526.68796, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "2", "bbox": {"l": 327.04089, "t": 522.4247700000001, "r": 329.5679, "b": 526.68796, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 327.04089, "t": 528.51508, "r": 329.5679, "b": 532.77826, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "3", "bbox": {"l": 327.04089, "t": 528.51508, "r": 329.5679, "b": 532.77826, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 424.14102, "t": 527.4428399999999, "r": 426.66803, "b": 531.7060200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "3", "bbox": {"l": 424.14102, "t": 527.4428399999999, "r": 426.66803, "b": 531.7060200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 453.0018, "t": 517.4539500000001, "r": 455.52881, "b": 521.71713, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "2", "bbox": {"l": 453.0018, "t": 517.4539500000001, "r": 455.52881, "b": 521.71713, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 423.85825, "t": 517.06281, "r": 426.38525, "b": 521.32599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "1", "bbox": {"l": 423.85825, "t": 517.06281, "r": 426.38525, "b": 521.32599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 333.4342, "t": 557.36679, "r": 337.27542, "b": 562.35719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "C", "bbox": {"l": 333.4342, "t": 557.36679, "r": 337.27542, "b": 562.35719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 340.35397, "t": 557.31679, "r": 344.19519, "b": 562.30719, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "C", "bbox": {"l": 340.35397, "t": 557.31679, "r": 344.19519, "b": 562.30719, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 340.30978, "t": 563.8653899999999, "r": 344.151, "b": 568.8557900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "C", "bbox": {"l": 340.30978, "t": 563.8653899999999, "r": 344.151, "b": 568.8557900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 346.79904, "t": 563.8686700000001, "r": 350.64026, "b": 568.85907, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "C", "bbox": {"l": 346.79904, "t": 563.8686700000001, "r": 350.64026, "b": 568.85907, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 333.59583, "t": 563.82271, "r": 337.43704, "b": 568.81311, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "C", "bbox": {"l": 333.59583, "t": 563.82271, "r": 337.43704, "b": 568.81311, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 340.37543, "t": 570.42673, "r": 344.21664, "b": 575.41713, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "C", "bbox": {"l": 340.37543, "t": 570.42673, "r": 344.21664, "b": 575.41713, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 346.86469, "t": 570.43001, "r": 350.7059, "b": 575.42041, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "C", "bbox": {"l": 346.86469, "t": 570.43001, "r": 350.7059, "b": 575.42041, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 333.66144, "t": 570.38405, "r": 337.50266, "b": 575.37445, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "C", "bbox": {"l": 333.66144, "t": 570.38405, "r": 337.50266, "b": 575.37445, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 340.37671, "t": 577.02606, "r": 344.21793, "b": 582.0164599999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "C", "bbox": {"l": 340.37671, "t": 577.02606, "r": 344.21793, "b": 582.0164599999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 346.86597, "t": 577.02934, "r": 350.70718, "b": 582.01974, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "C", "bbox": {"l": 346.86597, "t": 577.02934, "r": 350.70718, "b": 582.01974, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 333.66272, "t": 576.98338, "r": 337.50394, "b": 581.97379, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "C", "bbox": {"l": 333.66272, "t": 576.98338, "r": 337.50394, "b": 581.97379, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 340.27948, "t": 583.39737, "r": 344.1207, "b": 588.38777, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "C", "bbox": {"l": 340.27948, "t": 583.39737, "r": 344.1207, "b": 588.38777, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 346.76874, "t": 583.40068, "r": 350.60995, "b": 588.39108, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "C", "bbox": {"l": 346.76874, "t": 583.40068, "r": 350.60995, "b": 588.39108, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 333.56549, "t": 583.35474, "r": 337.40671, "b": 588.34514, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "C", "bbox": {"l": 333.56549, "t": 583.35474, "r": 337.40671, "b": 588.34514, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 353.03326, "t": 556.8831299999999, "r": 359.83362, "b": 561.87354, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "NL", "bbox": {"l": 353.03326, "t": 556.8831299999999, "r": 359.83362, "b": 561.87354, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 353.18604, "t": 563.58044, "r": 359.98639, "b": 568.57085, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "NL", "bbox": {"l": 353.18604, "t": 563.58044, "r": 359.98639, "b": 568.57085, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 353.19864, "t": 570.1623500000001, "r": 359.99899, "b": 575.15276, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "NL", "bbox": {"l": 353.19864, "t": 570.1623500000001, "r": 359.99899, "b": 575.15276, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 353.1532, "t": 576.76611, "r": 359.95355, "b": 581.75652, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "NL", "bbox": {"l": 353.1532, "t": 576.76611, "r": 359.95355, "b": 581.75652, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 353.26935, "t": 583.40628, "r": 360.0697, "b": 588.3966800000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "NL", "bbox": {"l": 353.26935, "t": 583.40628, "r": 360.0697, "b": 588.3966800000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 347.37979, "t": 557.08235, "r": 350.33786, "b": 562.07275, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "L", "bbox": {"l": 347.37979, "t": 557.08235, "r": 350.33786, "b": 562.07275, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 331.14026, "t": 564.2907700000001, "r": 333.66727, "b": 568.55399, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "3", "bbox": {"l": 331.14026, "t": 564.2907700000001, "r": 333.66727, "b": 568.55399, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 340.80972, "t": 554.59312, "r": 343.33673, "b": 558.85634, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": "2", "bbox": {"l": 340.80972, "t": 554.59312, "r": 343.33673, "b": 558.85634, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 330.97992, "t": 554.83035, "r": 333.50693, "b": 559.09357, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "1", "bbox": {"l": 330.97992, "t": 554.83035, "r": 333.50693, "b": 559.09357, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "text", "id": 4, "page_no": 7, "cluster": {"id": 4, "label": "text", "bbox": {"l": 134.765, "t": 620.19278, "r": 480.5917400000001, "b": 664.8547599999999, "coord_origin": "TOPLEFT"}, "confidence": 0.951270341873169, "cells": [{"id": 105, "text": "We rely on standard metrics such as Tree Edit Distance score (TEDs) for", "bbox": {"l": 149.709, "t": 620.19278, "r": 480.58792, "b": 628.98975, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "table structure prediction, and Mean Average Precision (mAP) with 0.75 Inter-", "bbox": {"l": 134.765, "t": 632.14778, "r": 480.58871, "b": 640.94475, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "section Over Union (IOU) threshold for the bounding-box predictions of table", "bbox": {"l": 134.765, "t": 644.1027799999999, "r": 480.5917400000001, "b": 652.89975, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "cells. The predicted OTSL structures were converted back to HTML format in", "bbox": {"l": 134.765, "t": 656.0577900000001, "r": 480.58968999999996, "b": 664.8547599999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "We rely on standard metrics such as Tree Edit Distance score (TEDs) for table structure prediction, and Mean Average Precision (mAP) with 0.75 Intersection Over Union (IOU) threshold for the bounding-box predictions of table cells. The predicted OTSL structures were converted back to HTML format in"}], "headers": [{"label": "page_header", "id": 9, "page_no": 7, "cluster": {"id": 9, "label": "page_header", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8301323056221008, "cells": [{"id": 0, "text": "8", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 139.37193, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "8"}, {"label": "page_header", "id": 8, "page_no": 7, "cluster": {"id": 8, "label": "page_header", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8631826043128967, "cells": [{"id": 1, "text": "M.", "bbox": {"l": 167.81335, "t": 93.77099999999996, "r": 178.07675, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37415, "t": 93.77099999999996, "r": 231.72227, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "M. Lysak, et al."}]}}, {"page_no": 8, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "9", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "order to compute the TED score. Inference timing results for all experiments", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.5936899999999, "b": 127.73077, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "were obtained from the same machine on a single core with AMD EPYC 7763", "bbox": {"l": 134.765, "t": 130.88878999999997, "r": 480.59579, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "CPU @2.45 GHz.", "bbox": {"l": 134.765, "t": 142.84479, "r": 210.78462, "b": 151.64178000000004, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "5.1", "bbox": {"l": 134.765, "t": 169.18584999999996, "r": 149.40205, "b": 177.9928, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Hyper Parameter Optimization", "bbox": {"l": 160.85904, "t": 169.18584999999996, "r": 318.44843, "b": 177.9928, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "We have chosen the PubTabNet data set to perform HPO, since it includes a", "bbox": {"l": 134.765, "t": 185.58582, "r": 480.59183, "b": 194.38280999999995, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "highly diverse set of tables. Also we report TED scores separately for simple and", "bbox": {"l": 134.765, "t": 197.54083000000003, "r": 480.59183, "b": 206.33783000000005, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "complex tables (tables with cell spans). Results are presented in Table. 1. It is", "bbox": {"l": 134.765, "t": 209.49585000000002, "r": 480.59177000000005, "b": 218.29285000000004, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "evident that with OTSL, our model achieves the same TED score and slightly", "bbox": {"l": 134.765, "t": 221.45087, "r": 480.59277, "b": 230.24785999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "better mAP scores in comparison to HTML. However OTSL yields a", "bbox": {"l": 134.765, "t": 233.40588000000002, "r": 440.94159, "b": 242.20288000000005, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "2x speed", "bbox": {"l": 444.86798, "t": 233.40588000000002, "r": 480.58786000000003, "b": 242.20288000000005, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "up", "bbox": {"l": 134.76498, "t": 245.36188000000004, "r": 145.20081, "b": 254.15886999999998, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "in the inference runtime over HTML.", "bbox": {"l": 149.14899, "t": 245.36188000000004, "r": 311.21957, "b": 254.15886999999998, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Table", "bbox": {"l": 134.76498, "t": 275.07232999999997, "r": 160.11836, "b": 282.9986, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "1.", "bbox": {"l": 167.34528, "t": 275.07232999999997, "r": 175.59526, "b": 282.9986, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "HPO performed in OTSL and HTML representation on the same", "bbox": {"l": 188.13298, "t": 275.13507000000004, "r": 480.59365999999994, "b": 283.2048300000001, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "transformer-based TableFormer [9] architecture, trained only on PubTabNet [22]. Ef-", "bbox": {"l": 134.76498, "t": 286.09409, "r": 480.59444999999994, "b": 294.16385, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "fects of reducing the # of layers in encoder and decoder stages of the model show that", "bbox": {"l": 134.76498, "t": 297.05307, "r": 480.5954, "b": 305.12283, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "smaller models trained on OTSL perform better, especially in recognizing complex", "bbox": {"l": 134.76498, "t": 308.01205, "r": 480.59451, "b": 316.08182, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "table structures, and maintain a much higher mAP score than the HTML counterpart.", "bbox": {"l": 134.76498, "t": 318.97104, "r": 480.59441999999996, "b": 327.0408, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "#", "bbox": {"l": 160.37, "t": 341.73495, "r": 168.04793, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "enc-layers", "bbox": {"l": 144.592, "t": 354.68594, "r": 183.82806, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "#", "bbox": {"l": 207.974, "t": 341.73495, "r": 215.65193, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "dec-layers", "bbox": {"l": 192.19499, "t": 354.68594, "r": 231.43106, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "Language", "bbox": {"l": 239.79799999999997, "t": 347.21396, "r": 278.31766, "b": 355.28372, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "TEDs", "bbox": {"l": 324.67001, "t": 341.73495, "r": 348.26419, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "mAP", "bbox": {"l": 396.271, "t": 341.73495, "r": 417.12683, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "(0.75)", "bbox": {"l": 394.927, "t": 352.69394000000005, "r": 418.47278, "b": 360.7637, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Inference", "bbox": {"l": 430.771, "t": 341.73495, "r": 467.1423, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "time (secs)", "bbox": {"l": 427.14801, "t": 352.69394000000005, "r": 470.76056, "b": 360.7637, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "simple", "bbox": {"l": 286.686, "t": 354.68594, "r": 312.33261, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "complex", "bbox": {"l": 320.702, "t": 354.68594, "r": 353.71988, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "all", "bbox": {"l": 369.306, "t": 354.68594, "r": 379.03094, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "6", "bbox": {"l": 161.90601, "t": 373.51596, "r": 166.51294, "b": 381.58572, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "6", "bbox": {"l": 209.509, "t": 373.51596, "r": 214.11594, "b": 381.58572, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 368.03595, "r": 271.40527, "b": 376.10571, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "0.965", "bbox": {"l": 289.017, "t": 368.03595, "r": 310.00375, "b": 376.10571, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "0.934", "bbox": {"l": 326.71701, "t": 368.03595, "r": 347.70377, "b": 376.10571, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "0.955", "bbox": {"l": 363.67599, "t": 368.03595, "r": 384.66275, "b": 376.10571, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "0.88", "bbox": {"l": 397.26999, "t": 367.97317999999996, "r": 416.12723, "b": 375.89948, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "2.73", "bbox": {"l": 439.52701, "t": 367.97317999999996, "r": 458.38425, "b": 375.89948, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 380.98795, "r": 272.93954, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "0.969", "bbox": {"l": 289.017, "t": 380.98795, "r": 310.00375, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "0.927", "bbox": {"l": 326.71701, "t": 380.98795, "r": 347.70377, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "0.955", "bbox": {"l": 363.67599, "t": 380.98795, "r": 384.66275, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "0.857", "bbox": {"l": 396.20599, "t": 380.98795, "r": 417.19275, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "5.39", "bbox": {"l": 440.767, "t": 380.98795, "r": 457.14682, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "4", "bbox": {"l": 161.90601, "t": 399.81696, "r": 166.51294, "b": 407.88672, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "4", "bbox": {"l": 209.509, "t": 399.81696, "r": 214.11594, "b": 407.88672, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 394.33795, "r": 271.40527, "b": 402.40771, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "0.938", "bbox": {"l": 289.017, "t": 394.33795, "r": 310.00375, "b": 402.40771, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "0.904", "bbox": {"l": 326.71701, "t": 394.33795, "r": 347.70377, "b": 402.40771, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "0.927", "bbox": {"l": 363.67599, "t": 394.33795, "r": 384.66275, "b": 402.40771, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "0.853", "bbox": {"l": 394.61801, "t": 394.27518, "r": 418.77887, "b": 402.20148, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "1.97", "bbox": {"l": 439.52701, "t": 394.27518, "r": 458.38425, "b": 402.20148, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 407.28894, "r": 272.93954, "b": 415.3587, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "0.952", "bbox": {"l": 289.017, "t": 407.28894, "r": 310.00375, "b": 415.3587, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "0.909", "bbox": {"l": 326.71701, "t": 407.28894, "r": 347.70377, "b": 415.3587, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "0.938", "bbox": {"l": 362.08801, "t": 407.22617, "r": 386.24887, "b": 415.15247, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "0.843", "bbox": {"l": 396.20599, "t": 407.28894, "r": 417.19275, "b": 415.3587, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "3.77", "bbox": {"l": 440.767, "t": 407.28894, "r": 457.14682, "b": 415.3587, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "2", "bbox": {"l": 161.90601, "t": 426.11795, "r": 166.51294, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "4", "bbox": {"l": 209.509, "t": 426.11795, "r": 214.11594, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 420.63895, "r": 271.40527, "b": 428.70871, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "0.923", "bbox": {"l": 289.017, "t": 420.63895, "r": 310.00375, "b": 428.70871, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "0.897", "bbox": {"l": 326.71701, "t": 420.63895, "r": 347.70377, "b": 428.70871, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "0.915", "bbox": {"l": 363.67599, "t": 420.63895, "r": 384.66275, "b": 428.70871, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "0.859", "bbox": {"l": 394.61801, "t": 420.57617, "r": 418.77887, "b": 428.50247, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "1.91", "bbox": {"l": 439.52701, "t": 420.57617, "r": 458.38425, "b": 428.50247, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 433.58994, "r": 272.93954, "b": 441.6597, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "0.945", "bbox": {"l": 289.017, "t": 433.58994, "r": 310.00375, "b": 441.6597, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "0.901", "bbox": {"l": 326.71701, "t": 433.58994, "r": 347.70377, "b": 441.6597, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "0.931", "bbox": {"l": 362.08801, "t": 433.5271599999999, "r": 386.24887, "b": 441.45346, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "0.834", "bbox": {"l": 396.20599, "t": 433.58994, "r": 417.19275, "b": 441.6597, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "3.81", "bbox": {"l": 440.767, "t": 433.58994, "r": 457.14682, "b": 441.6597, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "4", "bbox": {"l": 161.90601, "t": 452.41995, "r": 166.51294, "b": 460.48972, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "2", "bbox": {"l": 209.509, "t": 452.41995, "r": 214.11594, "b": 460.48972, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 446.9399399999999, "r": 271.40527, "b": 455.0097, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "0.952", "bbox": {"l": 289.017, "t": 446.9399399999999, "r": 310.00375, "b": 455.0097, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "0.92", "bbox": {"l": 329.021, "t": 446.9399399999999, "r": 345.40082, "b": 455.0097, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "0.942", "bbox": {"l": 362.08801, "t": 446.87717, "r": 386.24887, "b": 454.80347, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "0.857", "bbox": {"l": 394.61801, "t": 446.87717, "r": 418.77887, "b": 454.80347, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "1.22", "bbox": {"l": 439.52701, "t": 446.87717, "r": 458.38425, "b": 454.80347, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 459.8919399999999, "r": 272.93954, "b": 467.9617, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "0.944", "bbox": {"l": 289.017, "t": 459.8919399999999, "r": 310.00375, "b": 467.9617, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "0.903", "bbox": {"l": 326.71701, "t": 459.8919399999999, "r": 347.70377, "b": 467.9617, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "0.931", "bbox": {"l": 363.67599, "t": 459.8919399999999, "r": 384.66275, "b": 467.9617, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "0.824", "bbox": {"l": 396.20599, "t": 459.8919399999999, "r": 417.19275, "b": 467.9617, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "2", "bbox": {"l": 446.65302, "t": 459.8919399999999, "r": 451.25995, "b": 467.9617, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "5.2", "bbox": {"l": 134.765, "t": 508.15179, "r": 149.40205, "b": 516.95874, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Quantitative Results", "bbox": {"l": 160.85904, "t": 508.15179, "r": 264.40332, "b": 516.95874, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "We picked the model parameter configuration that produced the best prediction", "bbox": {"l": 134.765, "t": 524.55078, "r": 480.59075999999993, "b": 533.34775, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "quality (enc=6, dec=6, heads=8) with PubTabNet alone, then independently", "bbox": {"l": 134.765, "t": 536.50677, "r": 480.58675999999997, "b": 545.3037400000001, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "trained and evaluated it on three publicly available data sets: PubTabNet (395k", "bbox": {"l": 134.765, "t": 548.4617800000001, "r": 480.59572999999995, "b": 557.25874, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "samples), FinTabNet (113k samples) and PubTables-1M (about 1M samples).", "bbox": {"l": 134.765, "t": 560.41678, "r": 480.59177000000005, "b": 569.21375, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "Performance results are presented in Table. 2. It is clearly evident that the model", "bbox": {"l": 134.765, "t": 572.37178, "r": 480.59069999999997, "b": 581.16875, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "trained on OTSL outperforms HTML across the board, keeping high TEDs and", "bbox": {"l": 134.765, "t": 584.32678, "r": 480.5957599999999, "b": 593.12375, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "mAP scores even on difficult financial tables (FinTabNet) that contain sparse", "bbox": {"l": 134.765, "t": 596.28278, "r": 480.58774, "b": 605.07974, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "and large tables.", "bbox": {"l": 134.765, "t": 608.2377799999999, "r": 206.78664, "b": 617.03474, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "Additionally, the results show that OTSL has an advantage over HTML", "bbox": {"l": 149.709, "t": 620.19278, "r": 480.59271, "b": 628.98975, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "when applied on a bigger data set like PubTables-1M and achieves significantly", "bbox": {"l": 134.765, "t": 632.14778, "r": 480.5957599999999, "b": 640.94475, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "improved scores. Finally, OTSL achieves faster inference due to fewer decoding", "bbox": {"l": 134.765, "t": 644.1027799999999, "r": 480.59283000000005, "b": 652.89975, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "steps which is a result of the reduced sequence representation.", "bbox": {"l": 134.765, "t": 656.0577900000001, "r": 405.79651, "b": 664.8547599999999, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 8, "label": "page_header", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9373378753662109, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "page_header", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8857625722885132, "cells": [{"id": 1, "text": "9", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "text", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.59579, "b": 151.64178000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9805440306663513, "cells": [{"id": 2, "text": "order to compute the TED score. Inference timing results for all experiments", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.5936899999999, "b": 127.73077, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "were obtained from the same machine on a single core with AMD EPYC 7763", "bbox": {"l": 134.765, "t": 130.88878999999997, "r": 480.59579, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "CPU @2.45 GHz.", "bbox": {"l": 134.765, "t": 142.84479, "r": 210.78462, "b": 151.64178000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "section_header", "bbox": {"l": 134.765, "t": 169.18584999999996, "r": 318.44843, "b": 177.9928, "coord_origin": "TOPLEFT"}, "confidence": 0.9579681158065796, "cells": [{"id": 5, "text": "5.1", "bbox": {"l": 134.765, "t": 169.18584999999996, "r": 149.40205, "b": 177.9928, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Hyper Parameter Optimization", "bbox": {"l": 160.85904, "t": 169.18584999999996, "r": 318.44843, "b": 177.9928, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 134.76498, "t": 185.58582, "r": 480.59277, "b": 254.15886999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.9842326641082764, "cells": [{"id": 7, "text": "We have chosen the PubTabNet data set to perform HPO, since it includes a", "bbox": {"l": 134.765, "t": 185.58582, "r": 480.59183, "b": 194.38280999999995, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "highly diverse set of tables. Also we report TED scores separately for simple and", "bbox": {"l": 134.765, "t": 197.54083000000003, "r": 480.59183, "b": 206.33783000000005, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "complex tables (tables with cell spans). Results are presented in Table. 1. It is", "bbox": {"l": 134.765, "t": 209.49585000000002, "r": 480.59177000000005, "b": 218.29285000000004, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "evident that with OTSL, our model achieves the same TED score and slightly", "bbox": {"l": 134.765, "t": 221.45087, "r": 480.59277, "b": 230.24785999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "better mAP scores in comparison to HTML. However OTSL yields a", "bbox": {"l": 134.765, "t": 233.40588000000002, "r": 440.94159, "b": 242.20288000000005, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "2x speed", "bbox": {"l": 444.86798, "t": 233.40588000000002, "r": 480.58786000000003, "b": 242.20288000000005, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "up", "bbox": {"l": 134.76498, "t": 245.36188000000004, "r": 145.20081, "b": 254.15886999999998, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "in the inference runtime over HTML.", "bbox": {"l": 149.14899, "t": 245.36188000000004, "r": 311.21957, "b": 254.15886999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "caption", "bbox": {"l": 134.76498, "t": 275.07232999999997, "r": 480.5954, "b": 327.0408, "coord_origin": "TOPLEFT"}, "confidence": 0.9570781588554382, "cells": [{"id": 15, "text": "Table", "bbox": {"l": 134.76498, "t": 275.07232999999997, "r": 160.11836, "b": 282.9986, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "1.", "bbox": {"l": 167.34528, "t": 275.07232999999997, "r": 175.59526, "b": 282.9986, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "HPO performed in OTSL and HTML representation on the same", "bbox": {"l": 188.13298, "t": 275.13507000000004, "r": 480.59365999999994, "b": 283.2048300000001, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "transformer-based TableFormer [9] architecture, trained only on PubTabNet [22]. Ef-", "bbox": {"l": 134.76498, "t": 286.09409, "r": 480.59444999999994, "b": 294.16385, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "fects of reducing the # of layers in encoder and decoder stages of the model show that", "bbox": {"l": 134.76498, "t": 297.05307, "r": 480.5954, "b": 305.12283, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "smaller models trained on OTSL perform better, especially in recognizing complex", "bbox": {"l": 134.76498, "t": 308.01205, "r": 480.59451, "b": 316.08182, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "table structures, and maintain a much higher mAP score than the HTML counterpart.", "bbox": {"l": 134.76498, "t": 318.97104, "r": 480.59441999999996, "b": 327.0408, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "table", "bbox": {"l": 139.66845703125, "t": 337.5747985839844, "r": 475.00372314453125, "b": 469.4721374511719, "coord_origin": "TOPLEFT"}, "confidence": 0.9901032447814941, "cells": [{"id": 22, "text": "#", "bbox": {"l": 160.37, "t": 341.73495, "r": 168.04793, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "enc-layers", "bbox": {"l": 144.592, "t": 354.68594, "r": 183.82806, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "#", "bbox": {"l": 207.974, "t": 341.73495, "r": 215.65193, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "dec-layers", "bbox": {"l": 192.19499, "t": 354.68594, "r": 231.43106, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "Language", "bbox": {"l": 239.79799999999997, "t": 347.21396, "r": 278.31766, "b": 355.28372, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "TEDs", "bbox": {"l": 324.67001, "t": 341.73495, "r": 348.26419, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "mAP", "bbox": {"l": 396.271, "t": 341.73495, "r": 417.12683, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "(0.75)", "bbox": {"l": 394.927, "t": 352.69394000000005, "r": 418.47278, "b": 360.7637, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Inference", "bbox": {"l": 430.771, "t": 341.73495, "r": 467.1423, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "time (secs)", "bbox": {"l": 427.14801, "t": 352.69394000000005, "r": 470.76056, "b": 360.7637, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "simple", "bbox": {"l": 286.686, "t": 354.68594, "r": 312.33261, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "complex", "bbox": {"l": 320.702, "t": 354.68594, "r": 353.71988, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "all", "bbox": {"l": 369.306, "t": 354.68594, "r": 379.03094, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "6", "bbox": {"l": 161.90601, "t": 373.51596, "r": 166.51294, "b": 381.58572, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "6", "bbox": {"l": 209.509, "t": 373.51596, "r": 214.11594, "b": 381.58572, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 368.03595, "r": 271.40527, "b": 376.10571, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "0.965", "bbox": {"l": 289.017, "t": 368.03595, "r": 310.00375, "b": 376.10571, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "0.934", "bbox": {"l": 326.71701, "t": 368.03595, "r": 347.70377, "b": 376.10571, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "0.955", "bbox": {"l": 363.67599, "t": 368.03595, "r": 384.66275, "b": 376.10571, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "0.88", "bbox": {"l": 397.26999, "t": 367.97317999999996, "r": 416.12723, "b": 375.89948, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "2.73", "bbox": {"l": 439.52701, "t": 367.97317999999996, "r": 458.38425, "b": 375.89948, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 380.98795, "r": 272.93954, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "0.969", "bbox": {"l": 289.017, "t": 380.98795, "r": 310.00375, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "0.927", "bbox": {"l": 326.71701, "t": 380.98795, "r": 347.70377, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "0.955", "bbox": {"l": 363.67599, "t": 380.98795, "r": 384.66275, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "0.857", "bbox": {"l": 396.20599, "t": 380.98795, "r": 417.19275, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "5.39", "bbox": {"l": 440.767, "t": 380.98795, "r": 457.14682, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "4", "bbox": {"l": 161.90601, "t": 399.81696, "r": 166.51294, "b": 407.88672, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "4", "bbox": {"l": 209.509, "t": 399.81696, "r": 214.11594, "b": 407.88672, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 394.33795, "r": 271.40527, "b": 402.40771, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "0.938", "bbox": {"l": 289.017, "t": 394.33795, "r": 310.00375, "b": 402.40771, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "0.904", "bbox": {"l": 326.71701, "t": 394.33795, "r": 347.70377, "b": 402.40771, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "0.927", "bbox": {"l": 363.67599, "t": 394.33795, "r": 384.66275, "b": 402.40771, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "0.853", "bbox": {"l": 394.61801, "t": 394.27518, "r": 418.77887, "b": 402.20148, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "1.97", "bbox": {"l": 439.52701, "t": 394.27518, "r": 458.38425, "b": 402.20148, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 407.28894, "r": 272.93954, "b": 415.3587, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "0.952", "bbox": {"l": 289.017, "t": 407.28894, "r": 310.00375, "b": 415.3587, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "0.909", "bbox": {"l": 326.71701, "t": 407.28894, "r": 347.70377, "b": 415.3587, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "0.938", "bbox": {"l": 362.08801, "t": 407.22617, "r": 386.24887, "b": 415.15247, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "0.843", "bbox": {"l": 396.20599, "t": 407.28894, "r": 417.19275, "b": 415.3587, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "3.77", "bbox": {"l": 440.767, "t": 407.28894, "r": 457.14682, "b": 415.3587, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "2", "bbox": {"l": 161.90601, "t": 426.11795, "r": 166.51294, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "4", "bbox": {"l": 209.509, "t": 426.11795, "r": 214.11594, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 420.63895, "r": 271.40527, "b": 428.70871, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "0.923", "bbox": {"l": 289.017, "t": 420.63895, "r": 310.00375, "b": 428.70871, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "0.897", "bbox": {"l": 326.71701, "t": 420.63895, "r": 347.70377, "b": 428.70871, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "0.915", "bbox": {"l": 363.67599, "t": 420.63895, "r": 384.66275, "b": 428.70871, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "0.859", "bbox": {"l": 394.61801, "t": 420.57617, "r": 418.77887, "b": 428.50247, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "1.91", "bbox": {"l": 439.52701, "t": 420.57617, "r": 458.38425, "b": 428.50247, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 433.58994, "r": 272.93954, "b": 441.6597, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "0.945", "bbox": {"l": 289.017, "t": 433.58994, "r": 310.00375, "b": 441.6597, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "0.901", "bbox": {"l": 326.71701, "t": 433.58994, "r": 347.70377, "b": 441.6597, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "0.931", "bbox": {"l": 362.08801, "t": 433.5271599999999, "r": 386.24887, "b": 441.45346, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "0.834", "bbox": {"l": 396.20599, "t": 433.58994, "r": 417.19275, "b": 441.6597, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "3.81", "bbox": {"l": 440.767, "t": 433.58994, "r": 457.14682, "b": 441.6597, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "4", "bbox": {"l": 161.90601, "t": 452.41995, "r": 166.51294, "b": 460.48972, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "2", "bbox": {"l": 209.509, "t": 452.41995, "r": 214.11594, "b": 460.48972, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 446.9399399999999, "r": 271.40527, "b": 455.0097, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "0.952", "bbox": {"l": 289.017, "t": 446.9399399999999, "r": 310.00375, "b": 455.0097, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "0.92", "bbox": {"l": 329.021, "t": 446.9399399999999, "r": 345.40082, "b": 455.0097, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "0.942", "bbox": {"l": 362.08801, "t": 446.87717, "r": 386.24887, "b": 454.80347, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "0.857", "bbox": {"l": 394.61801, "t": 446.87717, "r": 418.77887, "b": 454.80347, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "1.22", "bbox": {"l": 439.52701, "t": 446.87717, "r": 458.38425, "b": 454.80347, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 459.8919399999999, "r": 272.93954, "b": 467.9617, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "0.944", "bbox": {"l": 289.017, "t": 459.8919399999999, "r": 310.00375, "b": 467.9617, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "0.903", "bbox": {"l": 326.71701, "t": 459.8919399999999, "r": 347.70377, "b": 467.9617, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "0.931", "bbox": {"l": 363.67599, "t": 459.8919399999999, "r": 384.66275, "b": 467.9617, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "0.824", "bbox": {"l": 396.20599, "t": 459.8919399999999, "r": 417.19275, "b": 467.9617, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "2", "bbox": {"l": 446.65302, "t": 459.8919399999999, "r": 451.25995, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": [{"id": 10, "label": "text", "bbox": {"l": 160.37, "t": 341.73495, "r": 168.04793, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "#", "bbox": {"l": 160.37, "t": 341.73495, "r": 168.04793, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 144.592, "t": 354.68594, "r": 183.82806, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "enc-layers", "bbox": {"l": 144.592, "t": 354.68594, "r": 183.82806, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 207.974, "t": 341.73495, "r": 215.65193, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "#", "bbox": {"l": 207.974, "t": 341.73495, "r": 215.65193, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 192.19499, "t": 354.68594, "r": 231.43106, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "dec-layers", "bbox": {"l": 192.19499, "t": 354.68594, "r": 231.43106, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 239.79799999999997, "t": 347.21396, "r": 278.31766, "b": 355.28372, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "Language", "bbox": {"l": 239.79799999999997, "t": 347.21396, "r": 278.31766, "b": 355.28372, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 324.67001, "t": 341.73495, "r": 348.26419, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "TEDs", "bbox": {"l": 324.67001, "t": 341.73495, "r": 348.26419, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 396.271, "t": 341.73495, "r": 417.12683, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "mAP", "bbox": {"l": 396.271, "t": 341.73495, "r": 417.12683, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 394.927, "t": 352.69394000000005, "r": 418.47278, "b": 360.7637, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "(0.75)", "bbox": {"l": 394.927, "t": 352.69394000000005, "r": 418.47278, "b": 360.7637, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 430.771, "t": 341.73495, "r": 467.1423, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "Inference", "bbox": {"l": 430.771, "t": 341.73495, "r": 467.1423, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 427.14801, "t": 352.69394000000005, "r": 470.76056, "b": 360.7637, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "time (secs)", "bbox": {"l": 427.14801, "t": 352.69394000000005, "r": 470.76056, "b": 360.7637, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 286.686, "t": 354.68594, "r": 312.33261, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "simple", "bbox": {"l": 286.686, "t": 354.68594, "r": 312.33261, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 320.702, "t": 354.68594, "r": 353.71988, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "complex", "bbox": {"l": 320.702, "t": 354.68594, "r": 353.71988, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 369.306, "t": 354.68594, "r": 379.03094, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "all", "bbox": {"l": 369.306, "t": 354.68594, "r": 379.03094, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 161.90601, "t": 373.51596, "r": 166.51294, "b": 381.58572, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "6", "bbox": {"l": 161.90601, "t": 373.51596, "r": 166.51294, "b": 381.58572, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 209.509, "t": 373.51596, "r": 214.11594, "b": 381.58572, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "6", "bbox": {"l": 209.509, "t": 373.51596, "r": 214.11594, "b": 381.58572, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 246.71000999999998, "t": 368.03595, "r": 271.40527, "b": 376.10571, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 368.03595, "r": 271.40527, "b": 376.10571, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 289.017, "t": 368.03595, "r": 310.00375, "b": 376.10571, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "0.965", "bbox": {"l": 289.017, "t": 368.03595, "r": 310.00375, "b": 376.10571, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 326.71701, "t": 368.03595, "r": 347.70377, "b": 376.10571, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "0.934", "bbox": {"l": 326.71701, "t": 368.03595, "r": 347.70377, "b": 376.10571, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 363.67599, "t": 368.03595, "r": 384.66275, "b": 376.10571, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "0.955", "bbox": {"l": 363.67599, "t": 368.03595, "r": 384.66275, "b": 376.10571, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 397.26999, "t": 367.97317999999996, "r": 416.12723, "b": 375.89948, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "0.88", "bbox": {"l": 397.26999, "t": 367.97317999999996, "r": 416.12723, "b": 375.89948, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 439.52701, "t": 367.97317999999996, "r": 458.38425, "b": 375.89948, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "2.73", "bbox": {"l": 439.52701, "t": 367.97317999999996, "r": 458.38425, "b": 375.89948, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 245.17598999999998, "t": 380.98795, "r": 272.93954, "b": 389.05771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 380.98795, "r": 272.93954, "b": 389.05771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 289.017, "t": 380.98795, "r": 310.00375, "b": 389.05771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "0.969", "bbox": {"l": 289.017, "t": 380.98795, "r": 310.00375, "b": 389.05771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 326.71701, "t": 380.98795, "r": 347.70377, "b": 389.05771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "0.927", "bbox": {"l": 326.71701, "t": 380.98795, "r": 347.70377, "b": 389.05771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 363.67599, "t": 380.98795, "r": 384.66275, "b": 389.05771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "0.955", "bbox": {"l": 363.67599, "t": 380.98795, "r": 384.66275, "b": 389.05771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 396.20599, "t": 380.98795, "r": 417.19275, "b": 389.05771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "0.857", "bbox": {"l": 396.20599, "t": 380.98795, "r": 417.19275, "b": 389.05771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 440.767, "t": 380.98795, "r": 457.14682, "b": 389.05771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "5.39", "bbox": {"l": 440.767, "t": 380.98795, "r": 457.14682, "b": 389.05771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 161.90601, "t": 399.81696, "r": 166.51294, "b": 407.88672, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "4", "bbox": {"l": 161.90601, "t": 399.81696, "r": 166.51294, "b": 407.88672, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 209.509, "t": 399.81696, "r": 214.11594, "b": 407.88672, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "4", "bbox": {"l": 209.509, "t": 399.81696, "r": 214.11594, "b": 407.88672, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 246.71000999999998, "t": 394.33795, "r": 271.40527, "b": 402.40771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 394.33795, "r": 271.40527, "b": 402.40771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 289.017, "t": 394.33795, "r": 310.00375, "b": 402.40771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "0.938", "bbox": {"l": 289.017, "t": 394.33795, "r": 310.00375, "b": 402.40771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 326.71701, "t": 394.33795, "r": 347.70377, "b": 402.40771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "0.904", "bbox": {"l": 326.71701, "t": 394.33795, "r": 347.70377, "b": 402.40771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 363.67599, "t": 394.33795, "r": 384.66275, "b": 402.40771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "0.927", "bbox": {"l": 363.67599, "t": 394.33795, "r": 384.66275, "b": 402.40771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 394.61801, "t": 394.27518, "r": 418.77887, "b": 402.20148, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "0.853", "bbox": {"l": 394.61801, "t": 394.27518, "r": 418.77887, "b": 402.20148, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 439.52701, "t": 394.27518, "r": 458.38425, "b": 402.20148, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "1.97", "bbox": {"l": 439.52701, "t": 394.27518, "r": 458.38425, "b": 402.20148, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 245.17598999999998, "t": 407.28894, "r": 272.93954, "b": 415.3587, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 407.28894, "r": 272.93954, "b": 415.3587, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 289.017, "t": 407.28894, "r": 310.00375, "b": 415.3587, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "0.952", "bbox": {"l": 289.017, "t": 407.28894, "r": 310.00375, "b": 415.3587, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 326.71701, "t": 407.28894, "r": 347.70377, "b": 415.3587, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "0.909", "bbox": {"l": 326.71701, "t": 407.28894, "r": 347.70377, "b": 415.3587, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 362.08801, "t": 407.22617, "r": 386.24887, "b": 415.15247, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "0.938", "bbox": {"l": 362.08801, "t": 407.22617, "r": 386.24887, "b": 415.15247, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 396.20599, "t": 407.28894, "r": 417.19275, "b": 415.3587, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "0.843", "bbox": {"l": 396.20599, "t": 407.28894, "r": 417.19275, "b": 415.3587, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 440.767, "t": 407.28894, "r": 457.14682, "b": 415.3587, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "3.77", "bbox": {"l": 440.767, "t": 407.28894, "r": 457.14682, "b": 415.3587, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 161.90601, "t": 426.11795, "r": 166.51294, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "2", "bbox": {"l": 161.90601, "t": 426.11795, "r": 166.51294, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 209.509, "t": 426.11795, "r": 214.11594, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "4", "bbox": {"l": 209.509, "t": 426.11795, "r": 214.11594, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 246.71000999999998, "t": 420.63895, "r": 271.40527, "b": 428.70871, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 420.63895, "r": 271.40527, "b": 428.70871, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 289.017, "t": 420.63895, "r": 310.00375, "b": 428.70871, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "0.923", "bbox": {"l": 289.017, "t": 420.63895, "r": 310.00375, "b": 428.70871, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 326.71701, "t": 420.63895, "r": 347.70377, "b": 428.70871, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "0.897", "bbox": {"l": 326.71701, "t": 420.63895, "r": 347.70377, "b": 428.70871, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 363.67599, "t": 420.63895, "r": 384.66275, "b": 428.70871, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "0.915", "bbox": {"l": 363.67599, "t": 420.63895, "r": 384.66275, "b": 428.70871, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 394.61801, "t": 420.57617, "r": 418.77887, "b": 428.50247, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "0.859", "bbox": {"l": 394.61801, "t": 420.57617, "r": 418.77887, "b": 428.50247, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 439.52701, "t": 420.57617, "r": 458.38425, "b": 428.50247, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "1.91", "bbox": {"l": 439.52701, "t": 420.57617, "r": 458.38425, "b": 428.50247, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 245.17598999999998, "t": 433.58994, "r": 272.93954, "b": 441.6597, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 433.58994, "r": 272.93954, "b": 441.6597, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 289.017, "t": 433.58994, "r": 310.00375, "b": 441.6597, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "0.945", "bbox": {"l": 289.017, "t": 433.58994, "r": 310.00375, "b": 441.6597, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 326.71701, "t": 433.58994, "r": 347.70377, "b": 441.6597, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "0.901", "bbox": {"l": 326.71701, "t": 433.58994, "r": 347.70377, "b": 441.6597, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 362.08801, "t": 433.5271599999999, "r": 386.24887, "b": 441.45346, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "0.931", "bbox": {"l": 362.08801, "t": 433.5271599999999, "r": 386.24887, "b": 441.45346, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 396.20599, "t": 433.58994, "r": 417.19275, "b": 441.6597, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "0.834", "bbox": {"l": 396.20599, "t": 433.58994, "r": 417.19275, "b": 441.6597, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 440.767, "t": 433.58994, "r": 457.14682, "b": 441.6597, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "3.81", "bbox": {"l": 440.767, "t": 433.58994, "r": 457.14682, "b": 441.6597, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 161.90601, "t": 452.41995, "r": 166.51294, "b": 460.48972, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "4", "bbox": {"l": 161.90601, "t": 452.41995, "r": 166.51294, "b": 460.48972, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 209.509, "t": 452.41995, "r": 214.11594, "b": 460.48972, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "2", "bbox": {"l": 209.509, "t": 452.41995, "r": 214.11594, "b": 460.48972, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 246.71000999999998, "t": 446.9399399999999, "r": 271.40527, "b": 455.0097, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 446.9399399999999, "r": 271.40527, "b": 455.0097, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 289.017, "t": 446.9399399999999, "r": 310.00375, "b": 455.0097, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "0.952", "bbox": {"l": 289.017, "t": 446.9399399999999, "r": 310.00375, "b": 455.0097, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 329.021, "t": 446.9399399999999, "r": 345.40082, "b": 455.0097, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "0.92", "bbox": {"l": 329.021, "t": 446.9399399999999, "r": 345.40082, "b": 455.0097, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 362.08801, "t": 446.87717, "r": 386.24887, "b": 454.80347, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "0.942", "bbox": {"l": 362.08801, "t": 446.87717, "r": 386.24887, "b": 454.80347, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 394.61801, "t": 446.87717, "r": 418.77887, "b": 454.80347, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "0.857", "bbox": {"l": 394.61801, "t": 446.87717, "r": 418.77887, "b": 454.80347, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 439.52701, "t": 446.87717, "r": 458.38425, "b": 454.80347, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "1.22", "bbox": {"l": 439.52701, "t": 446.87717, "r": 458.38425, "b": 454.80347, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 245.17598999999998, "t": 459.8919399999999, "r": 272.93954, "b": 467.9617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 459.8919399999999, "r": 272.93954, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 289.017, "t": 459.8919399999999, "r": 310.00375, "b": 467.9617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "0.944", "bbox": {"l": 289.017, "t": 459.8919399999999, "r": 310.00375, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 326.71701, "t": 459.8919399999999, "r": 347.70377, "b": 467.9617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "0.903", "bbox": {"l": 326.71701, "t": 459.8919399999999, "r": 347.70377, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 363.67599, "t": 459.8919399999999, "r": 384.66275, "b": 467.9617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "0.931", "bbox": {"l": 363.67599, "t": 459.8919399999999, "r": 384.66275, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 396.20599, "t": 459.8919399999999, "r": 417.19275, "b": 467.9617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "0.824", "bbox": {"l": 396.20599, "t": 459.8919399999999, "r": 417.19275, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 446.65302, "t": 459.8919399999999, "r": 451.25995, "b": 467.9617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "2", "bbox": {"l": 446.65302, "t": 459.8919399999999, "r": 451.25995, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 5, "label": "section_header", "bbox": {"l": 134.765, "t": 508.15179, "r": 264.40332, "b": 516.95874, "coord_origin": "TOPLEFT"}, "confidence": 0.9592539668083191, "cells": [{"id": 91, "text": "5.2", "bbox": {"l": 134.765, "t": 508.15179, "r": 149.40205, "b": 516.95874, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Quantitative Results", "bbox": {"l": 160.85904, "t": 508.15179, "r": 264.40332, "b": 516.95874, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 134.765, "t": 524.55078, "r": 480.5957599999999, "b": 617.03474, "coord_origin": "TOPLEFT"}, "confidence": 0.9854757189750671, "cells": [{"id": 93, "text": "We picked the model parameter configuration that produced the best prediction", "bbox": {"l": 134.765, "t": 524.55078, "r": 480.59075999999993, "b": 533.34775, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "quality (enc=6, dec=6, heads=8) with PubTabNet alone, then independently", "bbox": {"l": 134.765, "t": 536.50677, "r": 480.58675999999997, "b": 545.3037400000001, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "trained and evaluated it on three publicly available data sets: PubTabNet (395k", "bbox": {"l": 134.765, "t": 548.4617800000001, "r": 480.59572999999995, "b": 557.25874, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "samples), FinTabNet (113k samples) and PubTables-1M (about 1M samples).", "bbox": {"l": 134.765, "t": 560.41678, "r": 480.59177000000005, "b": 569.21375, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "Performance results are presented in Table. 2. It is clearly evident that the model", "bbox": {"l": 134.765, "t": 572.37178, "r": 480.59069999999997, "b": 581.16875, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "trained on OTSL outperforms HTML across the board, keeping high TEDs and", "bbox": {"l": 134.765, "t": 584.32678, "r": 480.5957599999999, "b": 593.12375, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "mAP scores even on difficult financial tables (FinTabNet) that contain sparse", "bbox": {"l": 134.765, "t": 596.28278, "r": 480.58774, "b": 605.07974, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "and large tables.", "bbox": {"l": 134.765, "t": 608.2377799999999, "r": 206.78664, "b": 617.03474, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 134.765, "t": 620.19278, "r": 480.5957599999999, "b": 664.8547599999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9851234555244446, "cells": [{"id": 101, "text": "Additionally, the results show that OTSL has an advantage over HTML", "bbox": {"l": 149.709, "t": 620.19278, "r": 480.59271, "b": 628.98975, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "when applied on a bigger data set like PubTables-1M and achieves significantly", "bbox": {"l": 134.765, "t": 632.14778, "r": 480.5957599999999, "b": 640.94475, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "improved scores. Finally, OTSL achieves faster inference due to fewer decoding", "bbox": {"l": 134.765, "t": 644.1027799999999, "r": 480.59283000000005, "b": 652.89975, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "steps which is a result of the reduced sequence representation.", "bbox": {"l": 134.765, "t": 656.0577900000001, "r": 405.79651, "b": 664.8547599999999, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {"0": {"label": "table", "id": 0, "page_no": 8, "cluster": {"id": 0, "label": "table", "bbox": {"l": 139.66845703125, "t": 337.5747985839844, "r": 475.00372314453125, "b": 469.4721374511719, "coord_origin": "TOPLEFT"}, "confidence": 0.9901032447814941, "cells": [{"id": 22, "text": "#", "bbox": {"l": 160.37, "t": 341.73495, "r": 168.04793, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "enc-layers", "bbox": {"l": 144.592, "t": 354.68594, "r": 183.82806, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "#", "bbox": {"l": 207.974, "t": 341.73495, "r": 215.65193, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "dec-layers", "bbox": {"l": 192.19499, "t": 354.68594, "r": 231.43106, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "Language", "bbox": {"l": 239.79799999999997, "t": 347.21396, "r": 278.31766, "b": 355.28372, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "TEDs", "bbox": {"l": 324.67001, "t": 341.73495, "r": 348.26419, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "mAP", "bbox": {"l": 396.271, "t": 341.73495, "r": 417.12683, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "(0.75)", "bbox": {"l": 394.927, "t": 352.69394000000005, "r": 418.47278, "b": 360.7637, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Inference", "bbox": {"l": 430.771, "t": 341.73495, "r": 467.1423, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "time (secs)", "bbox": {"l": 427.14801, "t": 352.69394000000005, "r": 470.76056, "b": 360.7637, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "simple", "bbox": {"l": 286.686, "t": 354.68594, "r": 312.33261, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "complex", "bbox": {"l": 320.702, "t": 354.68594, "r": 353.71988, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "all", "bbox": {"l": 369.306, "t": 354.68594, "r": 379.03094, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "6", "bbox": {"l": 161.90601, "t": 373.51596, "r": 166.51294, "b": 381.58572, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "6", "bbox": {"l": 209.509, "t": 373.51596, "r": 214.11594, "b": 381.58572, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 368.03595, "r": 271.40527, "b": 376.10571, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "0.965", "bbox": {"l": 289.017, "t": 368.03595, "r": 310.00375, "b": 376.10571, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "0.934", "bbox": {"l": 326.71701, "t": 368.03595, "r": 347.70377, "b": 376.10571, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "0.955", "bbox": {"l": 363.67599, "t": 368.03595, "r": 384.66275, "b": 376.10571, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "0.88", "bbox": {"l": 397.26999, "t": 367.97317999999996, "r": 416.12723, "b": 375.89948, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "2.73", "bbox": {"l": 439.52701, "t": 367.97317999999996, "r": 458.38425, "b": 375.89948, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 380.98795, "r": 272.93954, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "0.969", "bbox": {"l": 289.017, "t": 380.98795, "r": 310.00375, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "0.927", "bbox": {"l": 326.71701, "t": 380.98795, "r": 347.70377, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "0.955", "bbox": {"l": 363.67599, "t": 380.98795, "r": 384.66275, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "0.857", "bbox": {"l": 396.20599, "t": 380.98795, "r": 417.19275, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "5.39", "bbox": {"l": 440.767, "t": 380.98795, "r": 457.14682, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "4", "bbox": {"l": 161.90601, "t": 399.81696, "r": 166.51294, "b": 407.88672, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "4", "bbox": {"l": 209.509, "t": 399.81696, "r": 214.11594, "b": 407.88672, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 394.33795, "r": 271.40527, "b": 402.40771, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "0.938", "bbox": {"l": 289.017, "t": 394.33795, "r": 310.00375, "b": 402.40771, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "0.904", "bbox": {"l": 326.71701, "t": 394.33795, "r": 347.70377, "b": 402.40771, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "0.927", "bbox": {"l": 363.67599, "t": 394.33795, "r": 384.66275, "b": 402.40771, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "0.853", "bbox": {"l": 394.61801, "t": 394.27518, "r": 418.77887, "b": 402.20148, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "1.97", "bbox": {"l": 439.52701, "t": 394.27518, "r": 458.38425, "b": 402.20148, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 407.28894, "r": 272.93954, "b": 415.3587, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "0.952", "bbox": {"l": 289.017, "t": 407.28894, "r": 310.00375, "b": 415.3587, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "0.909", "bbox": {"l": 326.71701, "t": 407.28894, "r": 347.70377, "b": 415.3587, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "0.938", "bbox": {"l": 362.08801, "t": 407.22617, "r": 386.24887, "b": 415.15247, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "0.843", "bbox": {"l": 396.20599, "t": 407.28894, "r": 417.19275, "b": 415.3587, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "3.77", "bbox": {"l": 440.767, "t": 407.28894, "r": 457.14682, "b": 415.3587, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "2", "bbox": {"l": 161.90601, "t": 426.11795, "r": 166.51294, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "4", "bbox": {"l": 209.509, "t": 426.11795, "r": 214.11594, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 420.63895, "r": 271.40527, "b": 428.70871, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "0.923", "bbox": {"l": 289.017, "t": 420.63895, "r": 310.00375, "b": 428.70871, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "0.897", "bbox": {"l": 326.71701, "t": 420.63895, "r": 347.70377, "b": 428.70871, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "0.915", "bbox": {"l": 363.67599, "t": 420.63895, "r": 384.66275, "b": 428.70871, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "0.859", "bbox": {"l": 394.61801, "t": 420.57617, "r": 418.77887, "b": 428.50247, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "1.91", "bbox": {"l": 439.52701, "t": 420.57617, "r": 458.38425, "b": 428.50247, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 433.58994, "r": 272.93954, "b": 441.6597, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "0.945", "bbox": {"l": 289.017, "t": 433.58994, "r": 310.00375, "b": 441.6597, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "0.901", "bbox": {"l": 326.71701, "t": 433.58994, "r": 347.70377, "b": 441.6597, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "0.931", "bbox": {"l": 362.08801, "t": 433.5271599999999, "r": 386.24887, "b": 441.45346, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "0.834", "bbox": {"l": 396.20599, "t": 433.58994, "r": 417.19275, "b": 441.6597, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "3.81", "bbox": {"l": 440.767, "t": 433.58994, "r": 457.14682, "b": 441.6597, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "4", "bbox": {"l": 161.90601, "t": 452.41995, "r": 166.51294, "b": 460.48972, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "2", "bbox": {"l": 209.509, "t": 452.41995, "r": 214.11594, "b": 460.48972, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 446.9399399999999, "r": 271.40527, "b": 455.0097, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "0.952", "bbox": {"l": 289.017, "t": 446.9399399999999, "r": 310.00375, "b": 455.0097, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "0.92", "bbox": {"l": 329.021, "t": 446.9399399999999, "r": 345.40082, "b": 455.0097, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "0.942", "bbox": {"l": 362.08801, "t": 446.87717, "r": 386.24887, "b": 454.80347, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "0.857", "bbox": {"l": 394.61801, "t": 446.87717, "r": 418.77887, "b": 454.80347, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "1.22", "bbox": {"l": 439.52701, "t": 446.87717, "r": 458.38425, "b": 454.80347, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 459.8919399999999, "r": 272.93954, "b": 467.9617, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "0.944", "bbox": {"l": 289.017, "t": 459.8919399999999, "r": 310.00375, "b": 467.9617, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "0.903", "bbox": {"l": 326.71701, "t": 459.8919399999999, "r": 347.70377, "b": 467.9617, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "0.931", "bbox": {"l": 363.67599, "t": 459.8919399999999, "r": 384.66275, "b": 467.9617, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "0.824", "bbox": {"l": 396.20599, "t": 459.8919399999999, "r": 417.19275, "b": 467.9617, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "2", "bbox": {"l": 446.65302, "t": 459.8919399999999, "r": 451.25995, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": [{"id": 10, "label": "text", "bbox": {"l": 160.37, "t": 341.73495, "r": 168.04793, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "#", "bbox": {"l": 160.37, "t": 341.73495, "r": 168.04793, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 144.592, "t": 354.68594, "r": 183.82806, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "enc-layers", "bbox": {"l": 144.592, "t": 354.68594, "r": 183.82806, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 207.974, "t": 341.73495, "r": 215.65193, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "#", "bbox": {"l": 207.974, "t": 341.73495, "r": 215.65193, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 192.19499, "t": 354.68594, "r": 231.43106, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "dec-layers", "bbox": {"l": 192.19499, "t": 354.68594, "r": 231.43106, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 239.79799999999997, "t": 347.21396, "r": 278.31766, "b": 355.28372, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "Language", "bbox": {"l": 239.79799999999997, "t": 347.21396, "r": 278.31766, "b": 355.28372, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 324.67001, "t": 341.73495, "r": 348.26419, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "TEDs", "bbox": {"l": 324.67001, "t": 341.73495, "r": 348.26419, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 396.271, "t": 341.73495, "r": 417.12683, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "mAP", "bbox": {"l": 396.271, "t": 341.73495, "r": 417.12683, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 394.927, "t": 352.69394000000005, "r": 418.47278, "b": 360.7637, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "(0.75)", "bbox": {"l": 394.927, "t": 352.69394000000005, "r": 418.47278, "b": 360.7637, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 430.771, "t": 341.73495, "r": 467.1423, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "Inference", "bbox": {"l": 430.771, "t": 341.73495, "r": 467.1423, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 427.14801, "t": 352.69394000000005, "r": 470.76056, "b": 360.7637, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "time (secs)", "bbox": {"l": 427.14801, "t": 352.69394000000005, "r": 470.76056, "b": 360.7637, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 286.686, "t": 354.68594, "r": 312.33261, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "simple", "bbox": {"l": 286.686, "t": 354.68594, "r": 312.33261, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 320.702, "t": 354.68594, "r": 353.71988, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "complex", "bbox": {"l": 320.702, "t": 354.68594, "r": 353.71988, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 369.306, "t": 354.68594, "r": 379.03094, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "all", "bbox": {"l": 369.306, "t": 354.68594, "r": 379.03094, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 161.90601, "t": 373.51596, "r": 166.51294, "b": 381.58572, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "6", "bbox": {"l": 161.90601, "t": 373.51596, "r": 166.51294, "b": 381.58572, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 209.509, "t": 373.51596, "r": 214.11594, "b": 381.58572, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "6", "bbox": {"l": 209.509, "t": 373.51596, "r": 214.11594, "b": 381.58572, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 246.71000999999998, "t": 368.03595, "r": 271.40527, "b": 376.10571, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 368.03595, "r": 271.40527, "b": 376.10571, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 289.017, "t": 368.03595, "r": 310.00375, "b": 376.10571, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "0.965", "bbox": {"l": 289.017, "t": 368.03595, "r": 310.00375, "b": 376.10571, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 326.71701, "t": 368.03595, "r": 347.70377, "b": 376.10571, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "0.934", "bbox": {"l": 326.71701, "t": 368.03595, "r": 347.70377, "b": 376.10571, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 363.67599, "t": 368.03595, "r": 384.66275, "b": 376.10571, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "0.955", "bbox": {"l": 363.67599, "t": 368.03595, "r": 384.66275, "b": 376.10571, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 397.26999, "t": 367.97317999999996, "r": 416.12723, "b": 375.89948, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "0.88", "bbox": {"l": 397.26999, "t": 367.97317999999996, "r": 416.12723, "b": 375.89948, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 439.52701, "t": 367.97317999999996, "r": 458.38425, "b": 375.89948, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "2.73", "bbox": {"l": 439.52701, "t": 367.97317999999996, "r": 458.38425, "b": 375.89948, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 245.17598999999998, "t": 380.98795, "r": 272.93954, "b": 389.05771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 380.98795, "r": 272.93954, "b": 389.05771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 289.017, "t": 380.98795, "r": 310.00375, "b": 389.05771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "0.969", "bbox": {"l": 289.017, "t": 380.98795, "r": 310.00375, "b": 389.05771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 326.71701, "t": 380.98795, "r": 347.70377, "b": 389.05771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "0.927", "bbox": {"l": 326.71701, "t": 380.98795, "r": 347.70377, "b": 389.05771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 363.67599, "t": 380.98795, "r": 384.66275, "b": 389.05771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "0.955", "bbox": {"l": 363.67599, "t": 380.98795, "r": 384.66275, "b": 389.05771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 396.20599, "t": 380.98795, "r": 417.19275, "b": 389.05771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "0.857", "bbox": {"l": 396.20599, "t": 380.98795, "r": 417.19275, "b": 389.05771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 440.767, "t": 380.98795, "r": 457.14682, "b": 389.05771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "5.39", "bbox": {"l": 440.767, "t": 380.98795, "r": 457.14682, "b": 389.05771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 161.90601, "t": 399.81696, "r": 166.51294, "b": 407.88672, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "4", "bbox": {"l": 161.90601, "t": 399.81696, "r": 166.51294, "b": 407.88672, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 209.509, "t": 399.81696, "r": 214.11594, "b": 407.88672, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "4", "bbox": {"l": 209.509, "t": 399.81696, "r": 214.11594, "b": 407.88672, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 246.71000999999998, "t": 394.33795, "r": 271.40527, "b": 402.40771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 394.33795, "r": 271.40527, "b": 402.40771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 289.017, "t": 394.33795, "r": 310.00375, "b": 402.40771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "0.938", "bbox": {"l": 289.017, "t": 394.33795, "r": 310.00375, "b": 402.40771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 326.71701, "t": 394.33795, "r": 347.70377, "b": 402.40771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "0.904", "bbox": {"l": 326.71701, "t": 394.33795, "r": 347.70377, "b": 402.40771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 363.67599, "t": 394.33795, "r": 384.66275, "b": 402.40771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "0.927", "bbox": {"l": 363.67599, "t": 394.33795, "r": 384.66275, "b": 402.40771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 394.61801, "t": 394.27518, "r": 418.77887, "b": 402.20148, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "0.853", "bbox": {"l": 394.61801, "t": 394.27518, "r": 418.77887, "b": 402.20148, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 439.52701, "t": 394.27518, "r": 458.38425, "b": 402.20148, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "1.97", "bbox": {"l": 439.52701, "t": 394.27518, "r": 458.38425, "b": 402.20148, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 245.17598999999998, "t": 407.28894, "r": 272.93954, "b": 415.3587, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 407.28894, "r": 272.93954, "b": 415.3587, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 289.017, "t": 407.28894, "r": 310.00375, "b": 415.3587, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "0.952", "bbox": {"l": 289.017, "t": 407.28894, "r": 310.00375, "b": 415.3587, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 326.71701, "t": 407.28894, "r": 347.70377, "b": 415.3587, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "0.909", "bbox": {"l": 326.71701, "t": 407.28894, "r": 347.70377, "b": 415.3587, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 362.08801, "t": 407.22617, "r": 386.24887, "b": 415.15247, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "0.938", "bbox": {"l": 362.08801, "t": 407.22617, "r": 386.24887, "b": 415.15247, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 396.20599, "t": 407.28894, "r": 417.19275, "b": 415.3587, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "0.843", "bbox": {"l": 396.20599, "t": 407.28894, "r": 417.19275, "b": 415.3587, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 440.767, "t": 407.28894, "r": 457.14682, "b": 415.3587, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "3.77", "bbox": {"l": 440.767, "t": 407.28894, "r": 457.14682, "b": 415.3587, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 161.90601, "t": 426.11795, "r": 166.51294, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "2", "bbox": {"l": 161.90601, "t": 426.11795, "r": 166.51294, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 209.509, "t": 426.11795, "r": 214.11594, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "4", "bbox": {"l": 209.509, "t": 426.11795, "r": 214.11594, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 246.71000999999998, "t": 420.63895, "r": 271.40527, "b": 428.70871, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 420.63895, "r": 271.40527, "b": 428.70871, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 289.017, "t": 420.63895, "r": 310.00375, "b": 428.70871, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "0.923", "bbox": {"l": 289.017, "t": 420.63895, "r": 310.00375, "b": 428.70871, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 326.71701, "t": 420.63895, "r": 347.70377, "b": 428.70871, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "0.897", "bbox": {"l": 326.71701, "t": 420.63895, "r": 347.70377, "b": 428.70871, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 363.67599, "t": 420.63895, "r": 384.66275, "b": 428.70871, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "0.915", "bbox": {"l": 363.67599, "t": 420.63895, "r": 384.66275, "b": 428.70871, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 394.61801, "t": 420.57617, "r": 418.77887, "b": 428.50247, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "0.859", "bbox": {"l": 394.61801, "t": 420.57617, "r": 418.77887, "b": 428.50247, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 439.52701, "t": 420.57617, "r": 458.38425, "b": 428.50247, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "1.91", "bbox": {"l": 439.52701, "t": 420.57617, "r": 458.38425, "b": 428.50247, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 245.17598999999998, "t": 433.58994, "r": 272.93954, "b": 441.6597, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 433.58994, "r": 272.93954, "b": 441.6597, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 289.017, "t": 433.58994, "r": 310.00375, "b": 441.6597, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "0.945", "bbox": {"l": 289.017, "t": 433.58994, "r": 310.00375, "b": 441.6597, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 326.71701, "t": 433.58994, "r": 347.70377, "b": 441.6597, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "0.901", "bbox": {"l": 326.71701, "t": 433.58994, "r": 347.70377, "b": 441.6597, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 362.08801, "t": 433.5271599999999, "r": 386.24887, "b": 441.45346, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "0.931", "bbox": {"l": 362.08801, "t": 433.5271599999999, "r": 386.24887, "b": 441.45346, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 396.20599, "t": 433.58994, "r": 417.19275, "b": 441.6597, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "0.834", "bbox": {"l": 396.20599, "t": 433.58994, "r": 417.19275, "b": 441.6597, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 440.767, "t": 433.58994, "r": 457.14682, "b": 441.6597, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "3.81", "bbox": {"l": 440.767, "t": 433.58994, "r": 457.14682, "b": 441.6597, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 161.90601, "t": 452.41995, "r": 166.51294, "b": 460.48972, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "4", "bbox": {"l": 161.90601, "t": 452.41995, "r": 166.51294, "b": 460.48972, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 209.509, "t": 452.41995, "r": 214.11594, "b": 460.48972, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "2", "bbox": {"l": 209.509, "t": 452.41995, "r": 214.11594, "b": 460.48972, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 246.71000999999998, "t": 446.9399399999999, "r": 271.40527, "b": 455.0097, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 446.9399399999999, "r": 271.40527, "b": 455.0097, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 289.017, "t": 446.9399399999999, "r": 310.00375, "b": 455.0097, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "0.952", "bbox": {"l": 289.017, "t": 446.9399399999999, "r": 310.00375, "b": 455.0097, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 329.021, "t": 446.9399399999999, "r": 345.40082, "b": 455.0097, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "0.92", "bbox": {"l": 329.021, "t": 446.9399399999999, "r": 345.40082, "b": 455.0097, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 362.08801, "t": 446.87717, "r": 386.24887, "b": 454.80347, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "0.942", "bbox": {"l": 362.08801, "t": 446.87717, "r": 386.24887, "b": 454.80347, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 394.61801, "t": 446.87717, "r": 418.77887, "b": 454.80347, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "0.857", "bbox": {"l": 394.61801, "t": 446.87717, "r": 418.77887, "b": 454.80347, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 439.52701, "t": 446.87717, "r": 458.38425, "b": 454.80347, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "1.22", "bbox": {"l": 439.52701, "t": 446.87717, "r": 458.38425, "b": 454.80347, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 245.17598999999998, "t": 459.8919399999999, "r": 272.93954, "b": 467.9617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 459.8919399999999, "r": 272.93954, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 289.017, "t": 459.8919399999999, "r": 310.00375, "b": 467.9617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "0.944", "bbox": {"l": 289.017, "t": 459.8919399999999, "r": 310.00375, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 326.71701, "t": 459.8919399999999, "r": 347.70377, "b": 467.9617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "0.903", "bbox": {"l": 326.71701, "t": 459.8919399999999, "r": 347.70377, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 363.67599, "t": 459.8919399999999, "r": 384.66275, "b": 467.9617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "0.931", "bbox": {"l": 363.67599, "t": 459.8919399999999, "r": 384.66275, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 396.20599, "t": 459.8919399999999, "r": 417.19275, "b": 467.9617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "0.824", "bbox": {"l": 396.20599, "t": 459.8919399999999, "r": 417.19275, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 446.65302, "t": 459.8919399999999, "r": 451.25995, "b": 467.9617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "2", "bbox": {"l": 446.65302, "t": 459.8919399999999, "r": 451.25995, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "lcel", "lcel", "ched", "ched", "nl", "ched", "ched", "ucel", "ched", "ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 7, "num_cols": 8, "table_cells": [{"bbox": {"l": 160.37, "t": 341.73495, "r": 168.04793, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "#", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 144.592, "t": 354.68594, "r": 183.82806, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "enc-layers", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 207.974, "t": 341.73495, "r": 215.65193, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "#", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 192.19499, "t": 354.68594, "r": 231.43106, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "dec-layers", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 239.79799999999997, "t": 347.21396, "r": 278.31766, "b": 355.28372, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Language", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 324.67001, "t": 341.73495, "r": 348.26419, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 3, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 6, "text": "TEDs", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 396.271, "t": 341.73495, "r": 417.12683, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "mAP", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 394.927, "t": 352.69394000000005, "r": 418.47278, "b": 360.7637, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "(0.75)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 430.771, "t": 341.73495, "r": 467.1423, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "Inference", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 427.14801, "t": 352.69394000000005, "r": 470.76056, "b": 360.7637, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "time (secs)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 286.686, "t": 354.68594, "r": 312.33261, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "simple", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 320.702, "t": 354.68594, "r": 353.71988, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "complex", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 369.306, "t": 354.68594, "r": 379.03094, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "all", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 161.90601, "t": 373.51596, "r": 166.51294, "b": 381.58572, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 373.51596, "r": 214.11594, "b": 381.58572, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 368.03595, "r": 272.93954, "b": 389.05771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 368.03595, "r": 310.00375, "b": 389.05771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.965 0.969", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 368.03595, "r": 347.70377, "b": 389.05771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.934 0.927", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 363.67599, "t": 368.03595, "r": 384.66275, "b": 389.05771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.955 0.955", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 396.20599, "t": 367.97317999999996, "r": 417.19275, "b": 389.05771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.88 0.857", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 367.97317999999996, "r": 458.38425, "b": 389.05771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "2.73 5.39", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 161.90601, "t": 399.81696, "r": 166.51294, "b": 407.88672, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 399.81696, "r": 214.11594, "b": 407.88672, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 394.33795, "r": 272.93954, "b": 415.3587, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 394.33795, "r": 310.00375, "b": 415.3587, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.938 0.952", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 394.33795, "r": 347.70377, "b": 402.40771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.904", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 363.67599, "t": 394.33795, "r": 384.66275, "b": 402.40771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.927", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.61801, "t": 394.27518, "r": 418.77887, "b": 402.20148, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.853", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 394.27518, "r": 458.38425, "b": 402.20148, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "1.97", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 407.28894, "r": 347.70377, "b": 428.70871, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.909 0.897", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 362.08801, "t": 407.22617, "r": 386.24887, "b": 415.15247, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.938", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 396.20599, "t": 407.28894, "r": 417.19275, "b": 415.3587, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.843", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.767, "t": 407.28894, "r": 457.14682, "b": 415.3587, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "3.77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 161.90601, "t": 426.11795, "r": 166.51294, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 426.11795, "r": 214.11594, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 246.71000999999998, "t": 420.63895, "r": 271.40527, "b": 428.70871, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 420.63895, "r": 310.00375, "b": 441.6597, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.923 0.945", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 362.08801, "t": 420.63895, "r": 386.24887, "b": 441.45346, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.915 0.931", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.61801, "t": 420.57617, "r": 418.77887, "b": 441.6597, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.859 0.834", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 420.57617, "r": 458.38425, "b": 441.6597, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "1.91 3.81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 433.58994, "r": 272.93954, "b": 441.6597, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 433.58994, "r": 347.70377, "b": 441.6597, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.901", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 161.90601, "t": 452.41995, "r": 166.51294, "b": 460.48972, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 452.41995, "r": 214.11594, "b": 460.48972, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 446.9399399999999, "r": 272.93954, "b": 467.9617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 446.9399399999999, "r": 310.00375, "b": 467.9617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.952 0.944", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 446.9399399999999, "r": 347.70377, "b": 467.9617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.92 0.903", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 362.08801, "t": 446.87717, "r": 386.24887, "b": 467.9617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.942 0.931", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.61801, "t": 446.87717, "r": 418.77887, "b": 467.9617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.857 0.824", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 446.87717, "r": 458.38425, "b": 467.9617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "1.22 2", "column_header": false, "row_header": false, "row_section": false}]}}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_header", "id": 8, "page_no": 8, "cluster": {"id": 8, "label": "page_header", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9373378753662109, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Optimized Table Tokenization for Table Structure Recognition"}, {"label": "page_header", "id": 9, "page_no": 8, "cluster": {"id": 9, "label": "page_header", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8857625722885132, "cells": [{"id": 1, "text": "9", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "9"}, {"label": "text", "id": 4, "page_no": 8, "cluster": {"id": 4, "label": "text", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.59579, "b": 151.64178000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9805440306663513, "cells": [{"id": 2, "text": "order to compute the TED score. Inference timing results for all experiments", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.5936899999999, "b": 127.73077, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "were obtained from the same machine on a single core with AMD EPYC 7763", "bbox": {"l": 134.765, "t": 130.88878999999997, "r": 480.59579, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "CPU @2.45 GHz.", "bbox": {"l": 134.765, "t": 142.84479, "r": 210.78462, "b": 151.64178000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "order to compute the TED score. Inference timing results for all experiments were obtained from the same machine on a single core with AMD EPYC 7763 CPU @2.45 GHz."}, {"label": "section_header", "id": 6, "page_no": 8, "cluster": {"id": 6, "label": "section_header", "bbox": {"l": 134.765, "t": 169.18584999999996, "r": 318.44843, "b": 177.9928, "coord_origin": "TOPLEFT"}, "confidence": 0.9579681158065796, "cells": [{"id": 5, "text": "5.1", "bbox": {"l": 134.765, "t": 169.18584999999996, "r": 149.40205, "b": 177.9928, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Hyper Parameter Optimization", "bbox": {"l": 160.85904, "t": 169.18584999999996, "r": 318.44843, "b": 177.9928, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5.1 Hyper Parameter Optimization"}, {"label": "text", "id": 3, "page_no": 8, "cluster": {"id": 3, "label": "text", "bbox": {"l": 134.76498, "t": 185.58582, "r": 480.59277, "b": 254.15886999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.9842326641082764, "cells": [{"id": 7, "text": "We have chosen the PubTabNet data set to perform HPO, since it includes a", "bbox": {"l": 134.765, "t": 185.58582, "r": 480.59183, "b": 194.38280999999995, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "highly diverse set of tables. Also we report TED scores separately for simple and", "bbox": {"l": 134.765, "t": 197.54083000000003, "r": 480.59183, "b": 206.33783000000005, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "complex tables (tables with cell spans). Results are presented in Table. 1. It is", "bbox": {"l": 134.765, "t": 209.49585000000002, "r": 480.59177000000005, "b": 218.29285000000004, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "evident that with OTSL, our model achieves the same TED score and slightly", "bbox": {"l": 134.765, "t": 221.45087, "r": 480.59277, "b": 230.24785999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "better mAP scores in comparison to HTML. However OTSL yields a", "bbox": {"l": 134.765, "t": 233.40588000000002, "r": 440.94159, "b": 242.20288000000005, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "2x speed", "bbox": {"l": 444.86798, "t": 233.40588000000002, "r": 480.58786000000003, "b": 242.20288000000005, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "up", "bbox": {"l": 134.76498, "t": 245.36188000000004, "r": 145.20081, "b": 254.15886999999998, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "in the inference runtime over HTML.", "bbox": {"l": 149.14899, "t": 245.36188000000004, "r": 311.21957, "b": 254.15886999999998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "We have chosen the PubTabNet data set to perform HPO, since it includes a highly diverse set of tables. Also we report TED scores separately for simple and complex tables (tables with cell spans). Results are presented in Table. 1. It is evident that with OTSL, our model achieves the same TED score and slightly better mAP scores in comparison to HTML. However OTSL yields a 2x speed up in the inference runtime over HTML."}, {"label": "caption", "id": 7, "page_no": 8, "cluster": {"id": 7, "label": "caption", "bbox": {"l": 134.76498, "t": 275.07232999999997, "r": 480.5954, "b": 327.0408, "coord_origin": "TOPLEFT"}, "confidence": 0.9570781588554382, "cells": [{"id": 15, "text": "Table", "bbox": {"l": 134.76498, "t": 275.07232999999997, "r": 160.11836, "b": 282.9986, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "1.", "bbox": {"l": 167.34528, "t": 275.07232999999997, "r": 175.59526, "b": 282.9986, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "HPO performed in OTSL and HTML representation on the same", "bbox": {"l": 188.13298, "t": 275.13507000000004, "r": 480.59365999999994, "b": 283.2048300000001, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "transformer-based TableFormer [9] architecture, trained only on PubTabNet [22]. Ef-", "bbox": {"l": 134.76498, "t": 286.09409, "r": 480.59444999999994, "b": 294.16385, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "fects of reducing the # of layers in encoder and decoder stages of the model show that", "bbox": {"l": 134.76498, "t": 297.05307, "r": 480.5954, "b": 305.12283, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "smaller models trained on OTSL perform better, especially in recognizing complex", "bbox": {"l": 134.76498, "t": 308.01205, "r": 480.59451, "b": 316.08182, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "table structures, and maintain a much higher mAP score than the HTML counterpart.", "bbox": {"l": 134.76498, "t": 318.97104, "r": 480.59441999999996, "b": 327.0408, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 1. HPO performed in OTSL and HTML representation on the same transformer-based TableFormer [9] architecture, trained only on PubTabNet [22]. Effects of reducing the # of layers in encoder and decoder stages of the model show that smaller models trained on OTSL perform better, especially in recognizing complex table structures, and maintain a much higher mAP score than the HTML counterpart."}, {"label": "table", "id": 0, "page_no": 8, "cluster": {"id": 0, "label": "table", "bbox": {"l": 139.66845703125, "t": 337.5747985839844, "r": 475.00372314453125, "b": 469.4721374511719, "coord_origin": "TOPLEFT"}, "confidence": 0.9901032447814941, "cells": [{"id": 22, "text": "#", "bbox": {"l": 160.37, "t": 341.73495, "r": 168.04793, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "enc-layers", "bbox": {"l": 144.592, "t": 354.68594, "r": 183.82806, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "#", "bbox": {"l": 207.974, "t": 341.73495, "r": 215.65193, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "dec-layers", "bbox": {"l": 192.19499, "t": 354.68594, "r": 231.43106, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "Language", "bbox": {"l": 239.79799999999997, "t": 347.21396, "r": 278.31766, "b": 355.28372, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "TEDs", "bbox": {"l": 324.67001, "t": 341.73495, "r": 348.26419, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "mAP", "bbox": {"l": 396.271, "t": 341.73495, "r": 417.12683, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "(0.75)", "bbox": {"l": 394.927, "t": 352.69394000000005, "r": 418.47278, "b": 360.7637, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Inference", "bbox": {"l": 430.771, "t": 341.73495, "r": 467.1423, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "time (secs)", "bbox": {"l": 427.14801, "t": 352.69394000000005, "r": 470.76056, "b": 360.7637, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "simple", "bbox": {"l": 286.686, "t": 354.68594, "r": 312.33261, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "complex", "bbox": {"l": 320.702, "t": 354.68594, "r": 353.71988, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "all", "bbox": {"l": 369.306, "t": 354.68594, "r": 379.03094, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "6", "bbox": {"l": 161.90601, "t": 373.51596, "r": 166.51294, "b": 381.58572, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "6", "bbox": {"l": 209.509, "t": 373.51596, "r": 214.11594, "b": 381.58572, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 368.03595, "r": 271.40527, "b": 376.10571, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "0.965", "bbox": {"l": 289.017, "t": 368.03595, "r": 310.00375, "b": 376.10571, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "0.934", "bbox": {"l": 326.71701, "t": 368.03595, "r": 347.70377, "b": 376.10571, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "0.955", "bbox": {"l": 363.67599, "t": 368.03595, "r": 384.66275, "b": 376.10571, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "0.88", "bbox": {"l": 397.26999, "t": 367.97317999999996, "r": 416.12723, "b": 375.89948, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "2.73", "bbox": {"l": 439.52701, "t": 367.97317999999996, "r": 458.38425, "b": 375.89948, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 380.98795, "r": 272.93954, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "0.969", "bbox": {"l": 289.017, "t": 380.98795, "r": 310.00375, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "0.927", "bbox": {"l": 326.71701, "t": 380.98795, "r": 347.70377, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "0.955", "bbox": {"l": 363.67599, "t": 380.98795, "r": 384.66275, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "0.857", "bbox": {"l": 396.20599, "t": 380.98795, "r": 417.19275, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "5.39", "bbox": {"l": 440.767, "t": 380.98795, "r": 457.14682, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "4", "bbox": {"l": 161.90601, "t": 399.81696, "r": 166.51294, "b": 407.88672, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "4", "bbox": {"l": 209.509, "t": 399.81696, "r": 214.11594, "b": 407.88672, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 394.33795, "r": 271.40527, "b": 402.40771, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "0.938", "bbox": {"l": 289.017, "t": 394.33795, "r": 310.00375, "b": 402.40771, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "0.904", "bbox": {"l": 326.71701, "t": 394.33795, "r": 347.70377, "b": 402.40771, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "0.927", "bbox": {"l": 363.67599, "t": 394.33795, "r": 384.66275, "b": 402.40771, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "0.853", "bbox": {"l": 394.61801, "t": 394.27518, "r": 418.77887, "b": 402.20148, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "1.97", "bbox": {"l": 439.52701, "t": 394.27518, "r": 458.38425, "b": 402.20148, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 407.28894, "r": 272.93954, "b": 415.3587, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "0.952", "bbox": {"l": 289.017, "t": 407.28894, "r": 310.00375, "b": 415.3587, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "0.909", "bbox": {"l": 326.71701, "t": 407.28894, "r": 347.70377, "b": 415.3587, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "0.938", "bbox": {"l": 362.08801, "t": 407.22617, "r": 386.24887, "b": 415.15247, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "0.843", "bbox": {"l": 396.20599, "t": 407.28894, "r": 417.19275, "b": 415.3587, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "3.77", "bbox": {"l": 440.767, "t": 407.28894, "r": 457.14682, "b": 415.3587, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "2", "bbox": {"l": 161.90601, "t": 426.11795, "r": 166.51294, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "4", "bbox": {"l": 209.509, "t": 426.11795, "r": 214.11594, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 420.63895, "r": 271.40527, "b": 428.70871, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "0.923", "bbox": {"l": 289.017, "t": 420.63895, "r": 310.00375, "b": 428.70871, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "0.897", "bbox": {"l": 326.71701, "t": 420.63895, "r": 347.70377, "b": 428.70871, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "0.915", "bbox": {"l": 363.67599, "t": 420.63895, "r": 384.66275, "b": 428.70871, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "0.859", "bbox": {"l": 394.61801, "t": 420.57617, "r": 418.77887, "b": 428.50247, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "1.91", "bbox": {"l": 439.52701, "t": 420.57617, "r": 458.38425, "b": 428.50247, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 433.58994, "r": 272.93954, "b": 441.6597, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "0.945", "bbox": {"l": 289.017, "t": 433.58994, "r": 310.00375, "b": 441.6597, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "0.901", "bbox": {"l": 326.71701, "t": 433.58994, "r": 347.70377, "b": 441.6597, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "0.931", "bbox": {"l": 362.08801, "t": 433.5271599999999, "r": 386.24887, "b": 441.45346, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "0.834", "bbox": {"l": 396.20599, "t": 433.58994, "r": 417.19275, "b": 441.6597, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "3.81", "bbox": {"l": 440.767, "t": 433.58994, "r": 457.14682, "b": 441.6597, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "4", "bbox": {"l": 161.90601, "t": 452.41995, "r": 166.51294, "b": 460.48972, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "2", "bbox": {"l": 209.509, "t": 452.41995, "r": 214.11594, "b": 460.48972, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 446.9399399999999, "r": 271.40527, "b": 455.0097, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "0.952", "bbox": {"l": 289.017, "t": 446.9399399999999, "r": 310.00375, "b": 455.0097, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "0.92", "bbox": {"l": 329.021, "t": 446.9399399999999, "r": 345.40082, "b": 455.0097, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "0.942", "bbox": {"l": 362.08801, "t": 446.87717, "r": 386.24887, "b": 454.80347, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "0.857", "bbox": {"l": 394.61801, "t": 446.87717, "r": 418.77887, "b": 454.80347, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "1.22", "bbox": {"l": 439.52701, "t": 446.87717, "r": 458.38425, "b": 454.80347, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 459.8919399999999, "r": 272.93954, "b": 467.9617, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "0.944", "bbox": {"l": 289.017, "t": 459.8919399999999, "r": 310.00375, "b": 467.9617, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "0.903", "bbox": {"l": 326.71701, "t": 459.8919399999999, "r": 347.70377, "b": 467.9617, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "0.931", "bbox": {"l": 363.67599, "t": 459.8919399999999, "r": 384.66275, "b": 467.9617, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "0.824", "bbox": {"l": 396.20599, "t": 459.8919399999999, "r": 417.19275, "b": 467.9617, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "2", "bbox": {"l": 446.65302, "t": 459.8919399999999, "r": 451.25995, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": [{"id": 10, "label": "text", "bbox": {"l": 160.37, "t": 341.73495, "r": 168.04793, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "#", "bbox": {"l": 160.37, "t": 341.73495, "r": 168.04793, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 144.592, "t": 354.68594, "r": 183.82806, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "enc-layers", "bbox": {"l": 144.592, "t": 354.68594, "r": 183.82806, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 207.974, "t": 341.73495, "r": 215.65193, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "#", "bbox": {"l": 207.974, "t": 341.73495, "r": 215.65193, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 192.19499, "t": 354.68594, "r": 231.43106, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "dec-layers", "bbox": {"l": 192.19499, "t": 354.68594, "r": 231.43106, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 239.79799999999997, "t": 347.21396, "r": 278.31766, "b": 355.28372, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "Language", "bbox": {"l": 239.79799999999997, "t": 347.21396, "r": 278.31766, "b": 355.28372, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 324.67001, "t": 341.73495, "r": 348.26419, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "TEDs", "bbox": {"l": 324.67001, "t": 341.73495, "r": 348.26419, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 396.271, "t": 341.73495, "r": 417.12683, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "mAP", "bbox": {"l": 396.271, "t": 341.73495, "r": 417.12683, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 394.927, "t": 352.69394000000005, "r": 418.47278, "b": 360.7637, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "(0.75)", "bbox": {"l": 394.927, "t": 352.69394000000005, "r": 418.47278, "b": 360.7637, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 430.771, "t": 341.73495, "r": 467.1423, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "Inference", "bbox": {"l": 430.771, "t": 341.73495, "r": 467.1423, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 427.14801, "t": 352.69394000000005, "r": 470.76056, "b": 360.7637, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "time (secs)", "bbox": {"l": 427.14801, "t": 352.69394000000005, "r": 470.76056, "b": 360.7637, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 286.686, "t": 354.68594, "r": 312.33261, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "simple", "bbox": {"l": 286.686, "t": 354.68594, "r": 312.33261, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 320.702, "t": 354.68594, "r": 353.71988, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "complex", "bbox": {"l": 320.702, "t": 354.68594, "r": 353.71988, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 369.306, "t": 354.68594, "r": 379.03094, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "all", "bbox": {"l": 369.306, "t": 354.68594, "r": 379.03094, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 161.90601, "t": 373.51596, "r": 166.51294, "b": 381.58572, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "6", "bbox": {"l": 161.90601, "t": 373.51596, "r": 166.51294, "b": 381.58572, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 209.509, "t": 373.51596, "r": 214.11594, "b": 381.58572, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "6", "bbox": {"l": 209.509, "t": 373.51596, "r": 214.11594, "b": 381.58572, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 246.71000999999998, "t": 368.03595, "r": 271.40527, "b": 376.10571, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 368.03595, "r": 271.40527, "b": 376.10571, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 289.017, "t": 368.03595, "r": 310.00375, "b": 376.10571, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "0.965", "bbox": {"l": 289.017, "t": 368.03595, "r": 310.00375, "b": 376.10571, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 326.71701, "t": 368.03595, "r": 347.70377, "b": 376.10571, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "0.934", "bbox": {"l": 326.71701, "t": 368.03595, "r": 347.70377, "b": 376.10571, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 363.67599, "t": 368.03595, "r": 384.66275, "b": 376.10571, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "0.955", "bbox": {"l": 363.67599, "t": 368.03595, "r": 384.66275, "b": 376.10571, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 397.26999, "t": 367.97317999999996, "r": 416.12723, "b": 375.89948, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "0.88", "bbox": {"l": 397.26999, "t": 367.97317999999996, "r": 416.12723, "b": 375.89948, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 439.52701, "t": 367.97317999999996, "r": 458.38425, "b": 375.89948, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "2.73", "bbox": {"l": 439.52701, "t": 367.97317999999996, "r": 458.38425, "b": 375.89948, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 245.17598999999998, "t": 380.98795, "r": 272.93954, "b": 389.05771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 380.98795, "r": 272.93954, "b": 389.05771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 289.017, "t": 380.98795, "r": 310.00375, "b": 389.05771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "0.969", "bbox": {"l": 289.017, "t": 380.98795, "r": 310.00375, "b": 389.05771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 326.71701, "t": 380.98795, "r": 347.70377, "b": 389.05771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "0.927", "bbox": {"l": 326.71701, "t": 380.98795, "r": 347.70377, "b": 389.05771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 363.67599, "t": 380.98795, "r": 384.66275, "b": 389.05771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "0.955", "bbox": {"l": 363.67599, "t": 380.98795, "r": 384.66275, "b": 389.05771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 396.20599, "t": 380.98795, "r": 417.19275, "b": 389.05771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "0.857", "bbox": {"l": 396.20599, "t": 380.98795, "r": 417.19275, "b": 389.05771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 440.767, "t": 380.98795, "r": 457.14682, "b": 389.05771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "5.39", "bbox": {"l": 440.767, "t": 380.98795, "r": 457.14682, "b": 389.05771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 161.90601, "t": 399.81696, "r": 166.51294, "b": 407.88672, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "4", "bbox": {"l": 161.90601, "t": 399.81696, "r": 166.51294, "b": 407.88672, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 209.509, "t": 399.81696, "r": 214.11594, "b": 407.88672, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "4", "bbox": {"l": 209.509, "t": 399.81696, "r": 214.11594, "b": 407.88672, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 246.71000999999998, "t": 394.33795, "r": 271.40527, "b": 402.40771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 394.33795, "r": 271.40527, "b": 402.40771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 289.017, "t": 394.33795, "r": 310.00375, "b": 402.40771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "0.938", "bbox": {"l": 289.017, "t": 394.33795, "r": 310.00375, "b": 402.40771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 326.71701, "t": 394.33795, "r": 347.70377, "b": 402.40771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "0.904", "bbox": {"l": 326.71701, "t": 394.33795, "r": 347.70377, "b": 402.40771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 363.67599, "t": 394.33795, "r": 384.66275, "b": 402.40771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "0.927", "bbox": {"l": 363.67599, "t": 394.33795, "r": 384.66275, "b": 402.40771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 394.61801, "t": 394.27518, "r": 418.77887, "b": 402.20148, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "0.853", "bbox": {"l": 394.61801, "t": 394.27518, "r": 418.77887, "b": 402.20148, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 439.52701, "t": 394.27518, "r": 458.38425, "b": 402.20148, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "1.97", "bbox": {"l": 439.52701, "t": 394.27518, "r": 458.38425, "b": 402.20148, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 245.17598999999998, "t": 407.28894, "r": 272.93954, "b": 415.3587, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 407.28894, "r": 272.93954, "b": 415.3587, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 289.017, "t": 407.28894, "r": 310.00375, "b": 415.3587, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "0.952", "bbox": {"l": 289.017, "t": 407.28894, "r": 310.00375, "b": 415.3587, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 326.71701, "t": 407.28894, "r": 347.70377, "b": 415.3587, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "0.909", "bbox": {"l": 326.71701, "t": 407.28894, "r": 347.70377, "b": 415.3587, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 362.08801, "t": 407.22617, "r": 386.24887, "b": 415.15247, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "0.938", "bbox": {"l": 362.08801, "t": 407.22617, "r": 386.24887, "b": 415.15247, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 396.20599, "t": 407.28894, "r": 417.19275, "b": 415.3587, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "0.843", "bbox": {"l": 396.20599, "t": 407.28894, "r": 417.19275, "b": 415.3587, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 440.767, "t": 407.28894, "r": 457.14682, "b": 415.3587, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "3.77", "bbox": {"l": 440.767, "t": 407.28894, "r": 457.14682, "b": 415.3587, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 161.90601, "t": 426.11795, "r": 166.51294, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "2", "bbox": {"l": 161.90601, "t": 426.11795, "r": 166.51294, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 209.509, "t": 426.11795, "r": 214.11594, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "4", "bbox": {"l": 209.509, "t": 426.11795, "r": 214.11594, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 246.71000999999998, "t": 420.63895, "r": 271.40527, "b": 428.70871, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 420.63895, "r": 271.40527, "b": 428.70871, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 289.017, "t": 420.63895, "r": 310.00375, "b": 428.70871, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "0.923", "bbox": {"l": 289.017, "t": 420.63895, "r": 310.00375, "b": 428.70871, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 326.71701, "t": 420.63895, "r": 347.70377, "b": 428.70871, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "0.897", "bbox": {"l": 326.71701, "t": 420.63895, "r": 347.70377, "b": 428.70871, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 363.67599, "t": 420.63895, "r": 384.66275, "b": 428.70871, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "0.915", "bbox": {"l": 363.67599, "t": 420.63895, "r": 384.66275, "b": 428.70871, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 394.61801, "t": 420.57617, "r": 418.77887, "b": 428.50247, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "0.859", "bbox": {"l": 394.61801, "t": 420.57617, "r": 418.77887, "b": 428.50247, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 439.52701, "t": 420.57617, "r": 458.38425, "b": 428.50247, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "1.91", "bbox": {"l": 439.52701, "t": 420.57617, "r": 458.38425, "b": 428.50247, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 245.17598999999998, "t": 433.58994, "r": 272.93954, "b": 441.6597, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 433.58994, "r": 272.93954, "b": 441.6597, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 289.017, "t": 433.58994, "r": 310.00375, "b": 441.6597, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "0.945", "bbox": {"l": 289.017, "t": 433.58994, "r": 310.00375, "b": 441.6597, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 326.71701, "t": 433.58994, "r": 347.70377, "b": 441.6597, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "0.901", "bbox": {"l": 326.71701, "t": 433.58994, "r": 347.70377, "b": 441.6597, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 362.08801, "t": 433.5271599999999, "r": 386.24887, "b": 441.45346, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "0.931", "bbox": {"l": 362.08801, "t": 433.5271599999999, "r": 386.24887, "b": 441.45346, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 396.20599, "t": 433.58994, "r": 417.19275, "b": 441.6597, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "0.834", "bbox": {"l": 396.20599, "t": 433.58994, "r": 417.19275, "b": 441.6597, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 440.767, "t": 433.58994, "r": 457.14682, "b": 441.6597, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "3.81", "bbox": {"l": 440.767, "t": 433.58994, "r": 457.14682, "b": 441.6597, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 161.90601, "t": 452.41995, "r": 166.51294, "b": 460.48972, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "4", "bbox": {"l": 161.90601, "t": 452.41995, "r": 166.51294, "b": 460.48972, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 209.509, "t": 452.41995, "r": 214.11594, "b": 460.48972, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "2", "bbox": {"l": 209.509, "t": 452.41995, "r": 214.11594, "b": 460.48972, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 246.71000999999998, "t": 446.9399399999999, "r": 271.40527, "b": 455.0097, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 446.9399399999999, "r": 271.40527, "b": 455.0097, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 289.017, "t": 446.9399399999999, "r": 310.00375, "b": 455.0097, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "0.952", "bbox": {"l": 289.017, "t": 446.9399399999999, "r": 310.00375, "b": 455.0097, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 329.021, "t": 446.9399399999999, "r": 345.40082, "b": 455.0097, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "0.92", "bbox": {"l": 329.021, "t": 446.9399399999999, "r": 345.40082, "b": 455.0097, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 362.08801, "t": 446.87717, "r": 386.24887, "b": 454.80347, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "0.942", "bbox": {"l": 362.08801, "t": 446.87717, "r": 386.24887, "b": 454.80347, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 394.61801, "t": 446.87717, "r": 418.77887, "b": 454.80347, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "0.857", "bbox": {"l": 394.61801, "t": 446.87717, "r": 418.77887, "b": 454.80347, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 439.52701, "t": 446.87717, "r": 458.38425, "b": 454.80347, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "1.22", "bbox": {"l": 439.52701, "t": 446.87717, "r": 458.38425, "b": 454.80347, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 245.17598999999998, "t": 459.8919399999999, "r": 272.93954, "b": 467.9617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 459.8919399999999, "r": 272.93954, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 289.017, "t": 459.8919399999999, "r": 310.00375, "b": 467.9617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "0.944", "bbox": {"l": 289.017, "t": 459.8919399999999, "r": 310.00375, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 326.71701, "t": 459.8919399999999, "r": 347.70377, "b": 467.9617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "0.903", "bbox": {"l": 326.71701, "t": 459.8919399999999, "r": 347.70377, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 363.67599, "t": 459.8919399999999, "r": 384.66275, "b": 467.9617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "0.931", "bbox": {"l": 363.67599, "t": 459.8919399999999, "r": 384.66275, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 396.20599, "t": 459.8919399999999, "r": 417.19275, "b": 467.9617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "0.824", "bbox": {"l": 396.20599, "t": 459.8919399999999, "r": 417.19275, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 446.65302, "t": 459.8919399999999, "r": 451.25995, "b": 467.9617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "2", "bbox": {"l": 446.65302, "t": 459.8919399999999, "r": 451.25995, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "lcel", "lcel", "ched", "ched", "nl", "ched", "ched", "ucel", "ched", "ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 7, "num_cols": 8, "table_cells": [{"bbox": {"l": 160.37, "t": 341.73495, "r": 168.04793, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "#", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 144.592, "t": 354.68594, "r": 183.82806, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "enc-layers", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 207.974, "t": 341.73495, "r": 215.65193, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "#", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 192.19499, "t": 354.68594, "r": 231.43106, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "dec-layers", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 239.79799999999997, "t": 347.21396, "r": 278.31766, "b": 355.28372, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Language", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 324.67001, "t": 341.73495, "r": 348.26419, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 3, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 6, "text": "TEDs", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 396.271, "t": 341.73495, "r": 417.12683, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "mAP", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 394.927, "t": 352.69394000000005, "r": 418.47278, "b": 360.7637, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "(0.75)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 430.771, "t": 341.73495, "r": 467.1423, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "Inference", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 427.14801, "t": 352.69394000000005, "r": 470.76056, "b": 360.7637, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "time (secs)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 286.686, "t": 354.68594, "r": 312.33261, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "simple", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 320.702, "t": 354.68594, "r": 353.71988, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "complex", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 369.306, "t": 354.68594, "r": 379.03094, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "all", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 161.90601, "t": 373.51596, "r": 166.51294, "b": 381.58572, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 373.51596, "r": 214.11594, "b": 381.58572, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 368.03595, "r": 272.93954, "b": 389.05771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 368.03595, "r": 310.00375, "b": 389.05771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.965 0.969", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 368.03595, "r": 347.70377, "b": 389.05771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.934 0.927", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 363.67599, "t": 368.03595, "r": 384.66275, "b": 389.05771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.955 0.955", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 396.20599, "t": 367.97317999999996, "r": 417.19275, "b": 389.05771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.88 0.857", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 367.97317999999996, "r": 458.38425, "b": 389.05771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "2.73 5.39", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 161.90601, "t": 399.81696, "r": 166.51294, "b": 407.88672, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 399.81696, "r": 214.11594, "b": 407.88672, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 394.33795, "r": 272.93954, "b": 415.3587, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 394.33795, "r": 310.00375, "b": 415.3587, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.938 0.952", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 394.33795, "r": 347.70377, "b": 402.40771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.904", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 363.67599, "t": 394.33795, "r": 384.66275, "b": 402.40771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.927", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.61801, "t": 394.27518, "r": 418.77887, "b": 402.20148, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.853", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 394.27518, "r": 458.38425, "b": 402.20148, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "1.97", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 407.28894, "r": 347.70377, "b": 428.70871, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.909 0.897", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 362.08801, "t": 407.22617, "r": 386.24887, "b": 415.15247, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.938", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 396.20599, "t": 407.28894, "r": 417.19275, "b": 415.3587, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.843", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.767, "t": 407.28894, "r": 457.14682, "b": 415.3587, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "3.77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 161.90601, "t": 426.11795, "r": 166.51294, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 426.11795, "r": 214.11594, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 246.71000999999998, "t": 420.63895, "r": 271.40527, "b": 428.70871, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 420.63895, "r": 310.00375, "b": 441.6597, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.923 0.945", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 362.08801, "t": 420.63895, "r": 386.24887, "b": 441.45346, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.915 0.931", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.61801, "t": 420.57617, "r": 418.77887, "b": 441.6597, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.859 0.834", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 420.57617, "r": 458.38425, "b": 441.6597, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "1.91 3.81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 433.58994, "r": 272.93954, "b": 441.6597, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 433.58994, "r": 347.70377, "b": 441.6597, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.901", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 161.90601, "t": 452.41995, "r": 166.51294, "b": 460.48972, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 452.41995, "r": 214.11594, "b": 460.48972, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 446.9399399999999, "r": 272.93954, "b": 467.9617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 446.9399399999999, "r": 310.00375, "b": 467.9617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.952 0.944", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 446.9399399999999, "r": 347.70377, "b": 467.9617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.92 0.903", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 362.08801, "t": 446.87717, "r": 386.24887, "b": 467.9617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.942 0.931", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.61801, "t": 446.87717, "r": 418.77887, "b": 467.9617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.857 0.824", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 446.87717, "r": 458.38425, "b": 467.9617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "1.22 2", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "section_header", "id": 5, "page_no": 8, "cluster": {"id": 5, "label": "section_header", "bbox": {"l": 134.765, "t": 508.15179, "r": 264.40332, "b": 516.95874, "coord_origin": "TOPLEFT"}, "confidence": 0.9592539668083191, "cells": [{"id": 91, "text": "5.2", "bbox": {"l": 134.765, "t": 508.15179, "r": 149.40205, "b": 516.95874, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Quantitative Results", "bbox": {"l": 160.85904, "t": 508.15179, "r": 264.40332, "b": 516.95874, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5.2 Quantitative Results"}, {"label": "text", "id": 1, "page_no": 8, "cluster": {"id": 1, "label": "text", "bbox": {"l": 134.765, "t": 524.55078, "r": 480.5957599999999, "b": 617.03474, "coord_origin": "TOPLEFT"}, "confidence": 0.9854757189750671, "cells": [{"id": 93, "text": "We picked the model parameter configuration that produced the best prediction", "bbox": {"l": 134.765, "t": 524.55078, "r": 480.59075999999993, "b": 533.34775, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "quality (enc=6, dec=6, heads=8) with PubTabNet alone, then independently", "bbox": {"l": 134.765, "t": 536.50677, "r": 480.58675999999997, "b": 545.3037400000001, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "trained and evaluated it on three publicly available data sets: PubTabNet (395k", "bbox": {"l": 134.765, "t": 548.4617800000001, "r": 480.59572999999995, "b": 557.25874, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "samples), FinTabNet (113k samples) and PubTables-1M (about 1M samples).", "bbox": {"l": 134.765, "t": 560.41678, "r": 480.59177000000005, "b": 569.21375, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "Performance results are presented in Table. 2. It is clearly evident that the model", "bbox": {"l": 134.765, "t": 572.37178, "r": 480.59069999999997, "b": 581.16875, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "trained on OTSL outperforms HTML across the board, keeping high TEDs and", "bbox": {"l": 134.765, "t": 584.32678, "r": 480.5957599999999, "b": 593.12375, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "mAP scores even on difficult financial tables (FinTabNet) that contain sparse", "bbox": {"l": 134.765, "t": 596.28278, "r": 480.58774, "b": 605.07974, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "and large tables.", "bbox": {"l": 134.765, "t": 608.2377799999999, "r": 206.78664, "b": 617.03474, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "We picked the model parameter configuration that produced the best prediction quality (enc=6, dec=6, heads=8) with PubTabNet alone, then independently trained and evaluated it on three publicly available data sets: PubTabNet (395k samples), FinTabNet (113k samples) and PubTables-1M (about 1M samples). Performance results are presented in Table. 2. It is clearly evident that the model trained on OTSL outperforms HTML across the board, keeping high TEDs and mAP scores even on difficult financial tables (FinTabNet) that contain sparse and large tables."}, {"label": "text", "id": 2, "page_no": 8, "cluster": {"id": 2, "label": "text", "bbox": {"l": 134.765, "t": 620.19278, "r": 480.5957599999999, "b": 664.8547599999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9851234555244446, "cells": [{"id": 101, "text": "Additionally, the results show that OTSL has an advantage over HTML", "bbox": {"l": 149.709, "t": 620.19278, "r": 480.59271, "b": 628.98975, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "when applied on a bigger data set like PubTables-1M and achieves significantly", "bbox": {"l": 134.765, "t": 632.14778, "r": 480.5957599999999, "b": 640.94475, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "improved scores. Finally, OTSL achieves faster inference due to fewer decoding", "bbox": {"l": 134.765, "t": 644.1027799999999, "r": 480.59283000000005, "b": 652.89975, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "steps which is a result of the reduced sequence representation.", "bbox": {"l": 134.765, "t": 656.0577900000001, "r": 405.79651, "b": 664.8547599999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Additionally, the results show that OTSL has an advantage over HTML when applied on a bigger data set like PubTables-1M and achieves significantly improved scores. Finally, OTSL achieves faster inference due to fewer decoding steps which is a result of the reduced sequence representation."}], "body": [{"label": "text", "id": 4, "page_no": 8, "cluster": {"id": 4, "label": "text", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.59579, "b": 151.64178000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9805440306663513, "cells": [{"id": 2, "text": "order to compute the TED score. Inference timing results for all experiments", "bbox": {"l": 134.765, "t": 118.93377999999996, "r": 480.5936899999999, "b": 127.73077, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "were obtained from the same machine on a single core with AMD EPYC 7763", "bbox": {"l": 134.765, "t": 130.88878999999997, "r": 480.59579, "b": 139.68579, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "CPU @2.45 GHz.", "bbox": {"l": 134.765, "t": 142.84479, "r": 210.78462, "b": 151.64178000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "order to compute the TED score. Inference timing results for all experiments were obtained from the same machine on a single core with AMD EPYC 7763 CPU @2.45 GHz."}, {"label": "section_header", "id": 6, "page_no": 8, "cluster": {"id": 6, "label": "section_header", "bbox": {"l": 134.765, "t": 169.18584999999996, "r": 318.44843, "b": 177.9928, "coord_origin": "TOPLEFT"}, "confidence": 0.9579681158065796, "cells": [{"id": 5, "text": "5.1", "bbox": {"l": 134.765, "t": 169.18584999999996, "r": 149.40205, "b": 177.9928, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Hyper Parameter Optimization", "bbox": {"l": 160.85904, "t": 169.18584999999996, "r": 318.44843, "b": 177.9928, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5.1 Hyper Parameter Optimization"}, {"label": "text", "id": 3, "page_no": 8, "cluster": {"id": 3, "label": "text", "bbox": {"l": 134.76498, "t": 185.58582, "r": 480.59277, "b": 254.15886999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.9842326641082764, "cells": [{"id": 7, "text": "We have chosen the PubTabNet data set to perform HPO, since it includes a", "bbox": {"l": 134.765, "t": 185.58582, "r": 480.59183, "b": 194.38280999999995, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "highly diverse set of tables. Also we report TED scores separately for simple and", "bbox": {"l": 134.765, "t": 197.54083000000003, "r": 480.59183, "b": 206.33783000000005, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "complex tables (tables with cell spans). Results are presented in Table. 1. It is", "bbox": {"l": 134.765, "t": 209.49585000000002, "r": 480.59177000000005, "b": 218.29285000000004, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "evident that with OTSL, our model achieves the same TED score and slightly", "bbox": {"l": 134.765, "t": 221.45087, "r": 480.59277, "b": 230.24785999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "better mAP scores in comparison to HTML. However OTSL yields a", "bbox": {"l": 134.765, "t": 233.40588000000002, "r": 440.94159, "b": 242.20288000000005, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "2x speed", "bbox": {"l": 444.86798, "t": 233.40588000000002, "r": 480.58786000000003, "b": 242.20288000000005, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "up", "bbox": {"l": 134.76498, "t": 245.36188000000004, "r": 145.20081, "b": 254.15886999999998, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "in the inference runtime over HTML.", "bbox": {"l": 149.14899, "t": 245.36188000000004, "r": 311.21957, "b": 254.15886999999998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "We have chosen the PubTabNet data set to perform HPO, since it includes a highly diverse set of tables. Also we report TED scores separately for simple and complex tables (tables with cell spans). Results are presented in Table. 1. It is evident that with OTSL, our model achieves the same TED score and slightly better mAP scores in comparison to HTML. However OTSL yields a 2x speed up in the inference runtime over HTML."}, {"label": "caption", "id": 7, "page_no": 8, "cluster": {"id": 7, "label": "caption", "bbox": {"l": 134.76498, "t": 275.07232999999997, "r": 480.5954, "b": 327.0408, "coord_origin": "TOPLEFT"}, "confidence": 0.9570781588554382, "cells": [{"id": 15, "text": "Table", "bbox": {"l": 134.76498, "t": 275.07232999999997, "r": 160.11836, "b": 282.9986, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "1.", "bbox": {"l": 167.34528, "t": 275.07232999999997, "r": 175.59526, "b": 282.9986, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "HPO performed in OTSL and HTML representation on the same", "bbox": {"l": 188.13298, "t": 275.13507000000004, "r": 480.59365999999994, "b": 283.2048300000001, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "transformer-based TableFormer [9] architecture, trained only on PubTabNet [22]. Ef-", "bbox": {"l": 134.76498, "t": 286.09409, "r": 480.59444999999994, "b": 294.16385, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "fects of reducing the # of layers in encoder and decoder stages of the model show that", "bbox": {"l": 134.76498, "t": 297.05307, "r": 480.5954, "b": 305.12283, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "smaller models trained on OTSL perform better, especially in recognizing complex", "bbox": {"l": 134.76498, "t": 308.01205, "r": 480.59451, "b": 316.08182, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "table structures, and maintain a much higher mAP score than the HTML counterpart.", "bbox": {"l": 134.76498, "t": 318.97104, "r": 480.59441999999996, "b": 327.0408, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 1. HPO performed in OTSL and HTML representation on the same transformer-based TableFormer [9] architecture, trained only on PubTabNet [22]. Effects of reducing the # of layers in encoder and decoder stages of the model show that smaller models trained on OTSL perform better, especially in recognizing complex table structures, and maintain a much higher mAP score than the HTML counterpart."}, {"label": "table", "id": 0, "page_no": 8, "cluster": {"id": 0, "label": "table", "bbox": {"l": 139.66845703125, "t": 337.5747985839844, "r": 475.00372314453125, "b": 469.4721374511719, "coord_origin": "TOPLEFT"}, "confidence": 0.9901032447814941, "cells": [{"id": 22, "text": "#", "bbox": {"l": 160.37, "t": 341.73495, "r": 168.04793, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "enc-layers", "bbox": {"l": 144.592, "t": 354.68594, "r": 183.82806, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "#", "bbox": {"l": 207.974, "t": 341.73495, "r": 215.65193, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "dec-layers", "bbox": {"l": 192.19499, "t": 354.68594, "r": 231.43106, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "Language", "bbox": {"l": 239.79799999999997, "t": 347.21396, "r": 278.31766, "b": 355.28372, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "TEDs", "bbox": {"l": 324.67001, "t": 341.73495, "r": 348.26419, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "mAP", "bbox": {"l": 396.271, "t": 341.73495, "r": 417.12683, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "(0.75)", "bbox": {"l": 394.927, "t": 352.69394000000005, "r": 418.47278, "b": 360.7637, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Inference", "bbox": {"l": 430.771, "t": 341.73495, "r": 467.1423, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "time (secs)", "bbox": {"l": 427.14801, "t": 352.69394000000005, "r": 470.76056, "b": 360.7637, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "simple", "bbox": {"l": 286.686, "t": 354.68594, "r": 312.33261, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "complex", "bbox": {"l": 320.702, "t": 354.68594, "r": 353.71988, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "all", "bbox": {"l": 369.306, "t": 354.68594, "r": 379.03094, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "6", "bbox": {"l": 161.90601, "t": 373.51596, "r": 166.51294, "b": 381.58572, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "6", "bbox": {"l": 209.509, "t": 373.51596, "r": 214.11594, "b": 381.58572, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 368.03595, "r": 271.40527, "b": 376.10571, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "0.965", "bbox": {"l": 289.017, "t": 368.03595, "r": 310.00375, "b": 376.10571, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "0.934", "bbox": {"l": 326.71701, "t": 368.03595, "r": 347.70377, "b": 376.10571, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "0.955", "bbox": {"l": 363.67599, "t": 368.03595, "r": 384.66275, "b": 376.10571, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "0.88", "bbox": {"l": 397.26999, "t": 367.97317999999996, "r": 416.12723, "b": 375.89948, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "2.73", "bbox": {"l": 439.52701, "t": 367.97317999999996, "r": 458.38425, "b": 375.89948, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 380.98795, "r": 272.93954, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "0.969", "bbox": {"l": 289.017, "t": 380.98795, "r": 310.00375, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "0.927", "bbox": {"l": 326.71701, "t": 380.98795, "r": 347.70377, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "0.955", "bbox": {"l": 363.67599, "t": 380.98795, "r": 384.66275, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "0.857", "bbox": {"l": 396.20599, "t": 380.98795, "r": 417.19275, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "5.39", "bbox": {"l": 440.767, "t": 380.98795, "r": 457.14682, "b": 389.05771, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "4", "bbox": {"l": 161.90601, "t": 399.81696, "r": 166.51294, "b": 407.88672, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "4", "bbox": {"l": 209.509, "t": 399.81696, "r": 214.11594, "b": 407.88672, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 394.33795, "r": 271.40527, "b": 402.40771, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "0.938", "bbox": {"l": 289.017, "t": 394.33795, "r": 310.00375, "b": 402.40771, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "0.904", "bbox": {"l": 326.71701, "t": 394.33795, "r": 347.70377, "b": 402.40771, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "0.927", "bbox": {"l": 363.67599, "t": 394.33795, "r": 384.66275, "b": 402.40771, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "0.853", "bbox": {"l": 394.61801, "t": 394.27518, "r": 418.77887, "b": 402.20148, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "1.97", "bbox": {"l": 439.52701, "t": 394.27518, "r": 458.38425, "b": 402.20148, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 407.28894, "r": 272.93954, "b": 415.3587, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "0.952", "bbox": {"l": 289.017, "t": 407.28894, "r": 310.00375, "b": 415.3587, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "0.909", "bbox": {"l": 326.71701, "t": 407.28894, "r": 347.70377, "b": 415.3587, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "0.938", "bbox": {"l": 362.08801, "t": 407.22617, "r": 386.24887, "b": 415.15247, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "0.843", "bbox": {"l": 396.20599, "t": 407.28894, "r": 417.19275, "b": 415.3587, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "3.77", "bbox": {"l": 440.767, "t": 407.28894, "r": 457.14682, "b": 415.3587, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "2", "bbox": {"l": 161.90601, "t": 426.11795, "r": 166.51294, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "4", "bbox": {"l": 209.509, "t": 426.11795, "r": 214.11594, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 420.63895, "r": 271.40527, "b": 428.70871, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "0.923", "bbox": {"l": 289.017, "t": 420.63895, "r": 310.00375, "b": 428.70871, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "0.897", "bbox": {"l": 326.71701, "t": 420.63895, "r": 347.70377, "b": 428.70871, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "0.915", "bbox": {"l": 363.67599, "t": 420.63895, "r": 384.66275, "b": 428.70871, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "0.859", "bbox": {"l": 394.61801, "t": 420.57617, "r": 418.77887, "b": 428.50247, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "1.91", "bbox": {"l": 439.52701, "t": 420.57617, "r": 458.38425, "b": 428.50247, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 433.58994, "r": 272.93954, "b": 441.6597, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "0.945", "bbox": {"l": 289.017, "t": 433.58994, "r": 310.00375, "b": 441.6597, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "0.901", "bbox": {"l": 326.71701, "t": 433.58994, "r": 347.70377, "b": 441.6597, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "0.931", "bbox": {"l": 362.08801, "t": 433.5271599999999, "r": 386.24887, "b": 441.45346, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "0.834", "bbox": {"l": 396.20599, "t": 433.58994, "r": 417.19275, "b": 441.6597, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "3.81", "bbox": {"l": 440.767, "t": 433.58994, "r": 457.14682, "b": 441.6597, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "4", "bbox": {"l": 161.90601, "t": 452.41995, "r": 166.51294, "b": 460.48972, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "2", "bbox": {"l": 209.509, "t": 452.41995, "r": 214.11594, "b": 460.48972, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 446.9399399999999, "r": 271.40527, "b": 455.0097, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "0.952", "bbox": {"l": 289.017, "t": 446.9399399999999, "r": 310.00375, "b": 455.0097, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "0.92", "bbox": {"l": 329.021, "t": 446.9399399999999, "r": 345.40082, "b": 455.0097, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "0.942", "bbox": {"l": 362.08801, "t": 446.87717, "r": 386.24887, "b": 454.80347, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "0.857", "bbox": {"l": 394.61801, "t": 446.87717, "r": 418.77887, "b": 454.80347, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "1.22", "bbox": {"l": 439.52701, "t": 446.87717, "r": 458.38425, "b": 454.80347, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 459.8919399999999, "r": 272.93954, "b": 467.9617, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "0.944", "bbox": {"l": 289.017, "t": 459.8919399999999, "r": 310.00375, "b": 467.9617, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "0.903", "bbox": {"l": 326.71701, "t": 459.8919399999999, "r": 347.70377, "b": 467.9617, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "0.931", "bbox": {"l": 363.67599, "t": 459.8919399999999, "r": 384.66275, "b": 467.9617, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "0.824", "bbox": {"l": 396.20599, "t": 459.8919399999999, "r": 417.19275, "b": 467.9617, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "2", "bbox": {"l": 446.65302, "t": 459.8919399999999, "r": 451.25995, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": [{"id": 10, "label": "text", "bbox": {"l": 160.37, "t": 341.73495, "r": 168.04793, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "#", "bbox": {"l": 160.37, "t": 341.73495, "r": 168.04793, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 144.592, "t": 354.68594, "r": 183.82806, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "enc-layers", "bbox": {"l": 144.592, "t": 354.68594, "r": 183.82806, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 207.974, "t": 341.73495, "r": 215.65193, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "#", "bbox": {"l": 207.974, "t": 341.73495, "r": 215.65193, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 192.19499, "t": 354.68594, "r": 231.43106, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "dec-layers", "bbox": {"l": 192.19499, "t": 354.68594, "r": 231.43106, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 239.79799999999997, "t": 347.21396, "r": 278.31766, "b": 355.28372, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "Language", "bbox": {"l": 239.79799999999997, "t": 347.21396, "r": 278.31766, "b": 355.28372, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 324.67001, "t": 341.73495, "r": 348.26419, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "TEDs", "bbox": {"l": 324.67001, "t": 341.73495, "r": 348.26419, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 396.271, "t": 341.73495, "r": 417.12683, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "mAP", "bbox": {"l": 396.271, "t": 341.73495, "r": 417.12683, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 394.927, "t": 352.69394000000005, "r": 418.47278, "b": 360.7637, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "(0.75)", "bbox": {"l": 394.927, "t": 352.69394000000005, "r": 418.47278, "b": 360.7637, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 430.771, "t": 341.73495, "r": 467.1423, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "Inference", "bbox": {"l": 430.771, "t": 341.73495, "r": 467.1423, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 427.14801, "t": 352.69394000000005, "r": 470.76056, "b": 360.7637, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "time (secs)", "bbox": {"l": 427.14801, "t": 352.69394000000005, "r": 470.76056, "b": 360.7637, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 286.686, "t": 354.68594, "r": 312.33261, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "simple", "bbox": {"l": 286.686, "t": 354.68594, "r": 312.33261, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 320.702, "t": 354.68594, "r": 353.71988, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "complex", "bbox": {"l": 320.702, "t": 354.68594, "r": 353.71988, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 369.306, "t": 354.68594, "r": 379.03094, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "all", "bbox": {"l": 369.306, "t": 354.68594, "r": 379.03094, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 161.90601, "t": 373.51596, "r": 166.51294, "b": 381.58572, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "6", "bbox": {"l": 161.90601, "t": 373.51596, "r": 166.51294, "b": 381.58572, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 209.509, "t": 373.51596, "r": 214.11594, "b": 381.58572, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "6", "bbox": {"l": 209.509, "t": 373.51596, "r": 214.11594, "b": 381.58572, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 246.71000999999998, "t": 368.03595, "r": 271.40527, "b": 376.10571, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 368.03595, "r": 271.40527, "b": 376.10571, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 289.017, "t": 368.03595, "r": 310.00375, "b": 376.10571, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "0.965", "bbox": {"l": 289.017, "t": 368.03595, "r": 310.00375, "b": 376.10571, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 326.71701, "t": 368.03595, "r": 347.70377, "b": 376.10571, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "0.934", "bbox": {"l": 326.71701, "t": 368.03595, "r": 347.70377, "b": 376.10571, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 363.67599, "t": 368.03595, "r": 384.66275, "b": 376.10571, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "0.955", "bbox": {"l": 363.67599, "t": 368.03595, "r": 384.66275, "b": 376.10571, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 397.26999, "t": 367.97317999999996, "r": 416.12723, "b": 375.89948, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "0.88", "bbox": {"l": 397.26999, "t": 367.97317999999996, "r": 416.12723, "b": 375.89948, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 439.52701, "t": 367.97317999999996, "r": 458.38425, "b": 375.89948, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "2.73", "bbox": {"l": 439.52701, "t": 367.97317999999996, "r": 458.38425, "b": 375.89948, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 245.17598999999998, "t": 380.98795, "r": 272.93954, "b": 389.05771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 380.98795, "r": 272.93954, "b": 389.05771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 289.017, "t": 380.98795, "r": 310.00375, "b": 389.05771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "0.969", "bbox": {"l": 289.017, "t": 380.98795, "r": 310.00375, "b": 389.05771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 326.71701, "t": 380.98795, "r": 347.70377, "b": 389.05771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "0.927", "bbox": {"l": 326.71701, "t": 380.98795, "r": 347.70377, "b": 389.05771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 363.67599, "t": 380.98795, "r": 384.66275, "b": 389.05771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "0.955", "bbox": {"l": 363.67599, "t": 380.98795, "r": 384.66275, "b": 389.05771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 396.20599, "t": 380.98795, "r": 417.19275, "b": 389.05771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "0.857", "bbox": {"l": 396.20599, "t": 380.98795, "r": 417.19275, "b": 389.05771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 440.767, "t": 380.98795, "r": 457.14682, "b": 389.05771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "5.39", "bbox": {"l": 440.767, "t": 380.98795, "r": 457.14682, "b": 389.05771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 161.90601, "t": 399.81696, "r": 166.51294, "b": 407.88672, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "4", "bbox": {"l": 161.90601, "t": 399.81696, "r": 166.51294, "b": 407.88672, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 209.509, "t": 399.81696, "r": 214.11594, "b": 407.88672, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "4", "bbox": {"l": 209.509, "t": 399.81696, "r": 214.11594, "b": 407.88672, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 246.71000999999998, "t": 394.33795, "r": 271.40527, "b": 402.40771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 394.33795, "r": 271.40527, "b": 402.40771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 289.017, "t": 394.33795, "r": 310.00375, "b": 402.40771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "0.938", "bbox": {"l": 289.017, "t": 394.33795, "r": 310.00375, "b": 402.40771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 326.71701, "t": 394.33795, "r": 347.70377, "b": 402.40771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "0.904", "bbox": {"l": 326.71701, "t": 394.33795, "r": 347.70377, "b": 402.40771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 363.67599, "t": 394.33795, "r": 384.66275, "b": 402.40771, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "0.927", "bbox": {"l": 363.67599, "t": 394.33795, "r": 384.66275, "b": 402.40771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 394.61801, "t": 394.27518, "r": 418.77887, "b": 402.20148, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "0.853", "bbox": {"l": 394.61801, "t": 394.27518, "r": 418.77887, "b": 402.20148, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 439.52701, "t": 394.27518, "r": 458.38425, "b": 402.20148, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "1.97", "bbox": {"l": 439.52701, "t": 394.27518, "r": 458.38425, "b": 402.20148, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 245.17598999999998, "t": 407.28894, "r": 272.93954, "b": 415.3587, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 407.28894, "r": 272.93954, "b": 415.3587, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 289.017, "t": 407.28894, "r": 310.00375, "b": 415.3587, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "0.952", "bbox": {"l": 289.017, "t": 407.28894, "r": 310.00375, "b": 415.3587, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 326.71701, "t": 407.28894, "r": 347.70377, "b": 415.3587, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "0.909", "bbox": {"l": 326.71701, "t": 407.28894, "r": 347.70377, "b": 415.3587, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 362.08801, "t": 407.22617, "r": 386.24887, "b": 415.15247, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "0.938", "bbox": {"l": 362.08801, "t": 407.22617, "r": 386.24887, "b": 415.15247, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 396.20599, "t": 407.28894, "r": 417.19275, "b": 415.3587, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "0.843", "bbox": {"l": 396.20599, "t": 407.28894, "r": 417.19275, "b": 415.3587, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 440.767, "t": 407.28894, "r": 457.14682, "b": 415.3587, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "3.77", "bbox": {"l": 440.767, "t": 407.28894, "r": 457.14682, "b": 415.3587, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 161.90601, "t": 426.11795, "r": 166.51294, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "2", "bbox": {"l": 161.90601, "t": 426.11795, "r": 166.51294, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 209.509, "t": 426.11795, "r": 214.11594, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "4", "bbox": {"l": 209.509, "t": 426.11795, "r": 214.11594, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 246.71000999999998, "t": 420.63895, "r": 271.40527, "b": 428.70871, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 420.63895, "r": 271.40527, "b": 428.70871, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 289.017, "t": 420.63895, "r": 310.00375, "b": 428.70871, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "0.923", "bbox": {"l": 289.017, "t": 420.63895, "r": 310.00375, "b": 428.70871, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 326.71701, "t": 420.63895, "r": 347.70377, "b": 428.70871, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "0.897", "bbox": {"l": 326.71701, "t": 420.63895, "r": 347.70377, "b": 428.70871, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 363.67599, "t": 420.63895, "r": 384.66275, "b": 428.70871, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "0.915", "bbox": {"l": 363.67599, "t": 420.63895, "r": 384.66275, "b": 428.70871, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 394.61801, "t": 420.57617, "r": 418.77887, "b": 428.50247, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "0.859", "bbox": {"l": 394.61801, "t": 420.57617, "r": 418.77887, "b": 428.50247, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 439.52701, "t": 420.57617, "r": 458.38425, "b": 428.50247, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "1.91", "bbox": {"l": 439.52701, "t": 420.57617, "r": 458.38425, "b": 428.50247, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 245.17598999999998, "t": 433.58994, "r": 272.93954, "b": 441.6597, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 433.58994, "r": 272.93954, "b": 441.6597, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 289.017, "t": 433.58994, "r": 310.00375, "b": 441.6597, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "0.945", "bbox": {"l": 289.017, "t": 433.58994, "r": 310.00375, "b": 441.6597, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 326.71701, "t": 433.58994, "r": 347.70377, "b": 441.6597, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "0.901", "bbox": {"l": 326.71701, "t": 433.58994, "r": 347.70377, "b": 441.6597, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 362.08801, "t": 433.5271599999999, "r": 386.24887, "b": 441.45346, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "0.931", "bbox": {"l": 362.08801, "t": 433.5271599999999, "r": 386.24887, "b": 441.45346, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 396.20599, "t": 433.58994, "r": 417.19275, "b": 441.6597, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "0.834", "bbox": {"l": 396.20599, "t": 433.58994, "r": 417.19275, "b": 441.6597, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 440.767, "t": 433.58994, "r": 457.14682, "b": 441.6597, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "3.81", "bbox": {"l": 440.767, "t": 433.58994, "r": 457.14682, "b": 441.6597, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 161.90601, "t": 452.41995, "r": 166.51294, "b": 460.48972, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "4", "bbox": {"l": 161.90601, "t": 452.41995, "r": 166.51294, "b": 460.48972, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 209.509, "t": 452.41995, "r": 214.11594, "b": 460.48972, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "2", "bbox": {"l": 209.509, "t": 452.41995, "r": 214.11594, "b": 460.48972, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 246.71000999999998, "t": 446.9399399999999, "r": 271.40527, "b": 455.0097, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "OTSL", "bbox": {"l": 246.71000999999998, "t": 446.9399399999999, "r": 271.40527, "b": 455.0097, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 289.017, "t": 446.9399399999999, "r": 310.00375, "b": 455.0097, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "0.952", "bbox": {"l": 289.017, "t": 446.9399399999999, "r": 310.00375, "b": 455.0097, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 329.021, "t": 446.9399399999999, "r": 345.40082, "b": 455.0097, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "0.92", "bbox": {"l": 329.021, "t": 446.9399399999999, "r": 345.40082, "b": 455.0097, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 362.08801, "t": 446.87717, "r": 386.24887, "b": 454.80347, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "0.942", "bbox": {"l": 362.08801, "t": 446.87717, "r": 386.24887, "b": 454.80347, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 394.61801, "t": 446.87717, "r": 418.77887, "b": 454.80347, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "0.857", "bbox": {"l": 394.61801, "t": 446.87717, "r": 418.77887, "b": 454.80347, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 439.52701, "t": 446.87717, "r": 458.38425, "b": 454.80347, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "1.22", "bbox": {"l": 439.52701, "t": 446.87717, "r": 458.38425, "b": 454.80347, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 245.17598999999998, "t": 459.8919399999999, "r": 272.93954, "b": 467.9617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "HTML", "bbox": {"l": 245.17598999999998, "t": 459.8919399999999, "r": 272.93954, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 289.017, "t": 459.8919399999999, "r": 310.00375, "b": 467.9617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "0.944", "bbox": {"l": 289.017, "t": 459.8919399999999, "r": 310.00375, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 326.71701, "t": 459.8919399999999, "r": 347.70377, "b": 467.9617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "0.903", "bbox": {"l": 326.71701, "t": 459.8919399999999, "r": 347.70377, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 363.67599, "t": 459.8919399999999, "r": 384.66275, "b": 467.9617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "0.931", "bbox": {"l": 363.67599, "t": 459.8919399999999, "r": 384.66275, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 396.20599, "t": 459.8919399999999, "r": 417.19275, "b": 467.9617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "0.824", "bbox": {"l": 396.20599, "t": 459.8919399999999, "r": 417.19275, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 446.65302, "t": 459.8919399999999, "r": 451.25995, "b": 467.9617, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "2", "bbox": {"l": 446.65302, "t": 459.8919399999999, "r": 451.25995, "b": 467.9617, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "ched", "lcel", "lcel", "ched", "ched", "nl", "ched", "ched", "ucel", "ched", "ched", "ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 7, "num_cols": 8, "table_cells": [{"bbox": {"l": 160.37, "t": 341.73495, "r": 168.04793, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "#", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 144.592, "t": 354.68594, "r": 183.82806, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "enc-layers", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 207.974, "t": 341.73495, "r": 215.65193, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "#", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 192.19499, "t": 354.68594, "r": 231.43106, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "dec-layers", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 239.79799999999997, "t": 347.21396, "r": 278.31766, "b": 355.28372, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Language", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 324.67001, "t": 341.73495, "r": 348.26419, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 3, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 6, "text": "TEDs", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 396.271, "t": 341.73495, "r": 417.12683, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "mAP", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 394.927, "t": 352.69394000000005, "r": 418.47278, "b": 360.7637, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "(0.75)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 430.771, "t": 341.73495, "r": 467.1423, "b": 349.8047199999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "Inference", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 427.14801, "t": 352.69394000000005, "r": 470.76056, "b": 360.7637, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "time (secs)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 286.686, "t": 354.68594, "r": 312.33261, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "simple", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 320.702, "t": 354.68594, "r": 353.71988, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "complex", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 369.306, "t": 354.68594, "r": 379.03094, "b": 362.75570999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "all", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 161.90601, "t": 373.51596, "r": 166.51294, "b": 381.58572, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 373.51596, "r": 214.11594, "b": 381.58572, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "6", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 368.03595, "r": 272.93954, "b": 389.05771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 368.03595, "r": 310.00375, "b": 389.05771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.965 0.969", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 368.03595, "r": 347.70377, "b": 389.05771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.934 0.927", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 363.67599, "t": 368.03595, "r": 384.66275, "b": 389.05771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.955 0.955", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 396.20599, "t": 367.97317999999996, "r": 417.19275, "b": 389.05771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.88 0.857", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 367.97317999999996, "r": 458.38425, "b": 389.05771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "2.73 5.39", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 161.90601, "t": 399.81696, "r": 166.51294, "b": 407.88672, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 399.81696, "r": 214.11594, "b": 407.88672, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 394.33795, "r": 272.93954, "b": 415.3587, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 394.33795, "r": 310.00375, "b": 415.3587, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.938 0.952", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 394.33795, "r": 347.70377, "b": 402.40771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.904", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 363.67599, "t": 394.33795, "r": 384.66275, "b": 402.40771, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.927", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.61801, "t": 394.27518, "r": 418.77887, "b": 402.20148, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.853", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 394.27518, "r": 458.38425, "b": 402.20148, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "1.97", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 407.28894, "r": 347.70377, "b": 428.70871, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.909 0.897", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 362.08801, "t": 407.22617, "r": 386.24887, "b": 415.15247, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.938", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 396.20599, "t": 407.28894, "r": 417.19275, "b": 415.3587, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.843", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 440.767, "t": 407.28894, "r": 457.14682, "b": 415.3587, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "3.77", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 161.90601, "t": 426.11795, "r": 166.51294, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 426.11795, "r": 214.11594, "b": 434.1877099999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 246.71000999999998, "t": 420.63895, "r": 271.40527, "b": 428.70871, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 420.63895, "r": 310.00375, "b": 441.6597, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.923 0.945", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 362.08801, "t": 420.63895, "r": 386.24887, "b": 441.45346, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.915 0.931", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.61801, "t": 420.57617, "r": 418.77887, "b": 441.6597, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.859 0.834", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 420.57617, "r": 458.38425, "b": 441.6597, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "1.91 3.81", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 433.58994, "r": 272.93954, "b": 441.6597, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 433.58994, "r": 347.70377, "b": 441.6597, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.901", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 161.90601, "t": 452.41995, "r": 166.51294, "b": 460.48972, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 209.509, "t": 452.41995, "r": 214.11594, "b": 460.48972, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 245.17598999999998, "t": 446.9399399999999, "r": 272.93954, "b": 467.9617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "OTSL HTML", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.017, "t": 446.9399399999999, "r": 310.00375, "b": 467.9617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.952 0.944", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 326.71701, "t": 446.9399399999999, "r": 347.70377, "b": 467.9617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.92 0.903", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 362.08801, "t": 446.87717, "r": 386.24887, "b": 467.9617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.942 0.931", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 394.61801, "t": 446.87717, "r": 418.77887, "b": 467.9617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "0.857 0.824", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 439.52701, "t": 446.87717, "r": 458.38425, "b": 467.9617, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 7, "end_col_offset_idx": 8, "text": "1.22 2", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "section_header", "id": 5, "page_no": 8, "cluster": {"id": 5, "label": "section_header", "bbox": {"l": 134.765, "t": 508.15179, "r": 264.40332, "b": 516.95874, "coord_origin": "TOPLEFT"}, "confidence": 0.9592539668083191, "cells": [{"id": 91, "text": "5.2", "bbox": {"l": 134.765, "t": 508.15179, "r": 149.40205, "b": 516.95874, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Quantitative Results", "bbox": {"l": 160.85904, "t": 508.15179, "r": 264.40332, "b": 516.95874, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5.2 Quantitative Results"}, {"label": "text", "id": 1, "page_no": 8, "cluster": {"id": 1, "label": "text", "bbox": {"l": 134.765, "t": 524.55078, "r": 480.5957599999999, "b": 617.03474, "coord_origin": "TOPLEFT"}, "confidence": 0.9854757189750671, "cells": [{"id": 93, "text": "We picked the model parameter configuration that produced the best prediction", "bbox": {"l": 134.765, "t": 524.55078, "r": 480.59075999999993, "b": 533.34775, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "quality (enc=6, dec=6, heads=8) with PubTabNet alone, then independently", "bbox": {"l": 134.765, "t": 536.50677, "r": 480.58675999999997, "b": 545.3037400000001, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "trained and evaluated it on three publicly available data sets: PubTabNet (395k", "bbox": {"l": 134.765, "t": 548.4617800000001, "r": 480.59572999999995, "b": 557.25874, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "samples), FinTabNet (113k samples) and PubTables-1M (about 1M samples).", "bbox": {"l": 134.765, "t": 560.41678, "r": 480.59177000000005, "b": 569.21375, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "Performance results are presented in Table. 2. It is clearly evident that the model", "bbox": {"l": 134.765, "t": 572.37178, "r": 480.59069999999997, "b": 581.16875, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "trained on OTSL outperforms HTML across the board, keeping high TEDs and", "bbox": {"l": 134.765, "t": 584.32678, "r": 480.5957599999999, "b": 593.12375, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "mAP scores even on difficult financial tables (FinTabNet) that contain sparse", "bbox": {"l": 134.765, "t": 596.28278, "r": 480.58774, "b": 605.07974, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "and large tables.", "bbox": {"l": 134.765, "t": 608.2377799999999, "r": 206.78664, "b": 617.03474, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "We picked the model parameter configuration that produced the best prediction quality (enc=6, dec=6, heads=8) with PubTabNet alone, then independently trained and evaluated it on three publicly available data sets: PubTabNet (395k samples), FinTabNet (113k samples) and PubTables-1M (about 1M samples). Performance results are presented in Table. 2. It is clearly evident that the model trained on OTSL outperforms HTML across the board, keeping high TEDs and mAP scores even on difficult financial tables (FinTabNet) that contain sparse and large tables."}, {"label": "text", "id": 2, "page_no": 8, "cluster": {"id": 2, "label": "text", "bbox": {"l": 134.765, "t": 620.19278, "r": 480.5957599999999, "b": 664.8547599999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9851234555244446, "cells": [{"id": 101, "text": "Additionally, the results show that OTSL has an advantage over HTML", "bbox": {"l": 149.709, "t": 620.19278, "r": 480.59271, "b": 628.98975, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "when applied on a bigger data set like PubTables-1M and achieves significantly", "bbox": {"l": 134.765, "t": 632.14778, "r": 480.5957599999999, "b": 640.94475, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "improved scores. Finally, OTSL achieves faster inference due to fewer decoding", "bbox": {"l": 134.765, "t": 644.1027799999999, "r": 480.59283000000005, "b": 652.89975, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "steps which is a result of the reduced sequence representation.", "bbox": {"l": 134.765, "t": 656.0577900000001, "r": 405.79651, "b": 664.8547599999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Additionally, the results show that OTSL has an advantage over HTML when applied on a bigger data set like PubTables-1M and achieves significantly improved scores. Finally, OTSL achieves faster inference due to fewer decoding steps which is a result of the reduced sequence representation."}], "headers": [{"label": "page_header", "id": 8, "page_no": 8, "cluster": {"id": 8, "label": "page_header", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9373378753662109, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Optimized Table Tokenization for Table Structure Recognition"}, {"label": "page_header", "id": 9, "page_no": 8, "cluster": {"id": 9, "label": "page_header", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8857625722885132, "cells": [{"id": 1, "text": "9", "bbox": {"l": 475.98431, "t": 93.77099999999996, "r": 480.59125000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "9"}]}}, {"page_no": 9, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "10", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 143.97887, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "M.", "bbox": {"l": 167.82053, "t": 93.77099999999996, "r": 178.08249, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37929, "t": 93.77099999999996, "r": 231.72049000000004, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Table 2.", "bbox": {"l": 134.765, "t": 115.83618000000001, "r": 173.09366, "b": 123.76251000000002, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "TSR and cell detection results compared between OTSL and HTML on", "bbox": {"l": 181.30299, "t": 115.89899000000003, "r": 480.59151999999995, "b": 123.96868999999992, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "the PubTabNet [22], FinTabNet [21] and PubTables-1M [14] data sets using Table-", "bbox": {"l": 134.765, "t": 126.85797000000014, "r": 480.59357000000006, "b": 134.92767000000003, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Former [9] (with enc=6, dec=6, heads=8).", "bbox": {"l": 134.765, "t": 137.81696, "r": 305.95691, "b": 145.88666, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Data set", "bbox": {"l": 160.782, "t": 166.55895999999996, "r": 194.99779, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Language", "bbox": {"l": 215.52499000000003, "t": 166.534, "r": 254.04465, "b": 174.6037, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "TEDs", "bbox": {"l": 300.397, "t": 161.07898, "r": 323.99118, "b": 169.14868, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "mAP(0.75)", "bbox": {"l": 370.345, "t": 166.55895999999996, "r": 414.74661, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Inference", "bbox": {"l": 426.737, "t": 161.07898, "r": 463.10830999999996, "b": 169.14868, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "time (secs)", "bbox": {"l": 423.11401, "t": 172.03796, "r": 466.72656, "b": 180.10766999999998, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "simple", "bbox": {"l": 262.41299, "t": 174.03101000000004, "r": 288.0596, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "complex", "bbox": {"l": 296.42899, "t": 174.03101000000004, "r": 329.44687, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "all", "bbox": {"l": 345.03299, "t": 174.03101000000004, "r": 354.75793, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "PubTabNet", "bbox": {"l": 154.53799, "t": 192.85999000000004, "r": 201.24129, "b": 200.92969000000005, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "OTSL", "bbox": {"l": 222.43700000000004, "t": 187.38098000000002, "r": 247.13226000000003, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "0.965", "bbox": {"l": 264.74399, "t": 187.38098000000002, "r": 285.73074, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "0.934", "bbox": {"l": 302.444, "t": 187.38098000000002, "r": 323.43076, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "0.955", "bbox": {"l": 339.40302, "t": 187.38098000000002, "r": 360.38977, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "0.88", "bbox": {"l": 383.116, "t": 187.31817999999998, "r": 401.97324, "b": 195.24451, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "2.73", "bbox": {"l": 435.49300999999997, "t": 187.31817999999998, "r": 454.35025, "b": 195.24451, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "HTML", "bbox": {"l": 220.903, "t": 200.33196999999996, "r": 248.66655999999998, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "0.969", "bbox": {"l": 264.74399, "t": 200.33196999999996, "r": 285.73074, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "0.927", "bbox": {"l": 302.444, "t": 200.33196999999996, "r": 323.43076, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "0.955", "bbox": {"l": 339.40302, "t": 200.33196999999996, "r": 360.38977, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "0.857", "bbox": {"l": 382.052, "t": 200.33196999999996, "r": 403.03876, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "5.39", "bbox": {"l": 436.73199000000005, "t": 200.33196999999996, "r": 453.11182, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "FinTabNet", "bbox": {"l": 155.94501, "t": 219.16198999999995, "r": 199.83374, "b": 227.23168999999996, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "OTSL", "bbox": {"l": 222.43700000000004, "t": 213.68201, "r": 247.13226000000003, "b": 221.75171, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "0.955", "bbox": {"l": 264.74399, "t": 213.68201, "r": 285.73074, "b": 221.75171, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "0.961", "bbox": {"l": 302.444, "t": 213.68201, "r": 323.43076, "b": 221.75171, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "0.959", "bbox": {"l": 337.815, "t": 213.61919999999998, "r": 361.97586, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "0.862", "bbox": {"l": 380.46399, "t": 213.61919999999998, "r": 404.62485, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "1.85", "bbox": {"l": 435.49300999999997, "t": 213.61919999999998, "r": 454.35025, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "HTML", "bbox": {"l": 220.903, "t": 226.63396999999998, "r": 248.66655999999998, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "0.917", "bbox": {"l": 264.74399, "t": 226.63396999999998, "r": 285.73074, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "0.922", "bbox": {"l": 302.444, "t": 226.63396999999998, "r": 323.43076, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "0.92", "bbox": {"l": 341.70599, "t": 226.63396999999998, "r": 358.08582, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "0.722", "bbox": {"l": 382.052, "t": 226.63396999999998, "r": 403.03876, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "3.26", "bbox": {"l": 436.73199000000005, "t": 226.63396999999998, "r": 453.11182, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "PubTables-1M", "bbox": {"l": 148.62601, "t": 245.46294999999998, "r": 207.1524, "b": 253.53265, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "OTSL", "bbox": {"l": 222.43700000000004, "t": 239.98297000000002, "r": 247.13226000000003, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "0.987", "bbox": {"l": 264.74399, "t": 239.98297000000002, "r": 285.73074, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "0.964", "bbox": {"l": 302.444, "t": 239.98297000000002, "r": 323.43076, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "0.977", "bbox": {"l": 337.815, "t": 239.92016999999998, "r": 361.97586, "b": 247.8465, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "0.896", "bbox": {"l": 380.46399, "t": 239.92016999999998, "r": 404.62485, "b": 247.8465, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "1.79", "bbox": {"l": 435.49300999999997, "t": 239.92016999999998, "r": 454.35025, "b": 247.8465, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "HTML", "bbox": {"l": 220.903, "t": 252.93499999999995, "r": 248.66655999999998, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "0.983", "bbox": {"l": 264.74399, "t": 252.93499999999995, "r": 285.73074, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "0.944", "bbox": {"l": 302.444, "t": 252.93499999999995, "r": 323.43076, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "0.966", "bbox": {"l": 339.40302, "t": 252.93499999999995, "r": 360.38977, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "0.889", "bbox": {"l": 382.052, "t": 252.93499999999995, "r": 403.03876, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "3.26", "bbox": {"l": 436.73199000000005, "t": 252.93499999999995, "r": 453.11182, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "5.3", "bbox": {"l": 134.765, "t": 288.91479, "r": 149.40205, "b": 297.72173999999995, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Qualitative Results", "bbox": {"l": 160.85904, "t": 288.91479, "r": 257.08679, "b": 297.72173999999995, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "To illustrate the qualitative differences between OTSL and HTML, Figure 5", "bbox": {"l": 134.765, "t": 309.86078, "r": 480.58777, "b": 318.65775, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "demonstrates less overlap and more accurate bounding boxes with OTSL. In", "bbox": {"l": 134.765, "t": 321.81577, "r": 480.58889999999997, "b": 330.61273, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Figure 6, OTSL proves to be more effective in handling tables with longer to-", "bbox": {"l": 134.765, "t": 333.77075, "r": 480.58681999999993, "b": 342.56772, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "ken sequences, resulting in even more precise structure prediction and bounding", "bbox": {"l": 134.765, "t": 345.72574, "r": 480.58981, "b": 354.52271, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "boxes.", "bbox": {"l": 134.765, "t": 357.68073, "r": 161.65704, "b": 366.47769, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "Fig. 5.", "bbox": {"l": 134.765, "t": 397.59012, "r": 162.64424, "b": 405.51642, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "The OTSL model produces more accurate bounding boxes with less over-", "bbox": {"l": 167.384, "t": 397.65289, "r": 480.59106, "b": 405.72266, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "lap (E) than the HTML model (D), when predicting the structure of a sparse ta-", "bbox": {"l": 134.765, "t": 408.61190999999997, "r": 480.59106, "b": 416.68167000000005, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "ble (A), at twice the inference speed because of shorter sequence length (B),(C).", "bbox": {"l": 134.765, "t": 419.57089, "r": 480.58838000000003, "b": 427.64066, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "\"PMC2807444_006_00.png\" PubTabNet.", "bbox": {"l": 134.765, "t": 430.52987999999993, "r": 304.69171, "b": 438.59964, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "<table>", "bbox": {"l": 180.12473, "t": 516.2332200000001, "r": 190.62042, "b": 518.94992, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "<tr><td></td><td colspan=\"4\"></td><td colspan=\"6\"></td><td colspan=\"3\"></td></tr>", "bbox": {"l": 183.2438, "t": 520.13208, "r": 304.54797, "b": 522.84879, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 524.03094, "r": 388.42313, "b": 526.74765, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 527.9297799999999, "r": 388.42313, "b": 530.64648, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 531.82861, "r": 388.42313, "b": 534.54532, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 535.72748, "r": 388.42313, "b": 538.44418, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 539.62631, "r": 388.42313, "b": 542.34303, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 543.52516, "r": 388.42313, "b": 546.24188, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 547.42401, "r": 388.42313, "b": 550.14073, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 551.32286, "r": 388.42313, "b": 554.03958, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "</table>", "bbox": {"l": 180.12473, "t": 555.22173, "r": 191.86806, "b": 557.93845, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "C", "bbox": {"l": 407.38348, "t": 518.30042, "r": 408.82025, "b": 521.01712, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "C L L L C L L L L L C L L NL", "bbox": {"l": 410.25699, "t": 518.30042, "r": 450.48605, "b": 521.01712, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "C", "bbox": {"l": 407.38348, "t": 522.19925, "r": 408.82025, "b": 524.9159500000001, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 522.19925, "r": 450.48605, "b": 524.9159500000001, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "C", "bbox": {"l": 407.38348, "t": 526.09808, "r": 408.82025, "b": 528.81479, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 526.09808, "r": 450.48605, "b": 528.81479, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "C", "bbox": {"l": 407.38348, "t": 529.99695, "r": 408.82025, "b": 532.7136499999999, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 529.99695, "r": 450.48605, "b": 532.7136499999999, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "C", "bbox": {"l": 407.38348, "t": 533.8957800000001, "r": 408.82025, "b": 536.6125, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 533.8957800000001, "r": 450.48605, "b": 536.6125, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "C", "bbox": {"l": 407.38348, "t": 537.79463, "r": 408.82025, "b": 540.51135, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 537.79463, "r": 450.48605, "b": 540.51135, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "C", "bbox": {"l": 407.38348, "t": 541.69348, "r": 408.82025, "b": 544.4102, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 541.69348, "r": 450.48605, "b": 544.4102, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "C", "bbox": {"l": 407.38348, "t": 545.59233, "r": 408.82025, "b": 548.3090500000001, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 545.59233, "r": 450.48605, "b": 548.3090500000001, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "C", "bbox": {"l": 407.38348, "t": 549.4911999999999, "r": 408.82025, "b": 552.2079200000001, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 549.4911999999999, "r": 450.48605, "b": 552.2079200000001, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "HTML", "bbox": {"l": 164.52881, "t": 509.45859, "r": 181.8528, "b": 515.31, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "#", "bbox": {"l": 183.58441, "t": 509.45859, "r": 186.3974, "b": 515.31, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "tokens:", "bbox": {"l": 189.2104, "t": 509.45859, "r": 208.90137, "b": 515.31, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "258", "bbox": {"l": 210.63269, "t": 509.45859, "r": 221.04044, "b": 515.31, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "OTSL", "bbox": {"l": 390.20203, "t": 509.60361, "r": 406.83609, "b": 515.45502, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "#", "bbox": {"l": 408.56952, "t": 509.60361, "r": 411.38251, "b": 515.45502, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "tokens:", "bbox": {"l": 414.1955, "t": 509.60361, "r": 433.88647000000003, "b": 515.45502, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "135", "bbox": {"l": 435.61737, "t": 509.60361, "r": 446.02512, "b": 515.45502, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "B", "bbox": {"l": 167.19316, "t": 519.07236, "r": 172.8231, "b": 526.3866, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "A", "bbox": {"l": 187.33745, "t": 448.62485, "r": 192.96739, "b": 455.93909, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "D", "bbox": {"l": 167.38654, "t": 566.0051599999999, "r": 173.01648, "b": 573.3194, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "E", "bbox": {"l": 248.45621000000003, "t": 621.78008, "r": 253.65727, "b": 629.09431, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "C", "bbox": {"l": 395.90057, "t": 519.19946, "r": 401.53052, "b": 526.5137, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "HTML", "bbox": {"l": 171.62886, "t": 580.28853, "r": 177.48148, "b": 597.26784, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "OTSL", "bbox": {"l": 251.05969000000002, "t": 633.63408, "r": 256.91235, "b": 649.92345, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "HTML model shows", "bbox": {"l": 372.14645, "t": 601.45724, "r": 427.0379, "b": 607.30864, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "bounding box drifting", "bbox": {"l": 372.14645, "t": 607.89948, "r": 430.06838999999997, "b": 613.75087, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "OTSL model shows", "bbox": {"l": 176.88042, "t": 642.87209, "r": 231.08191, "b": 648.72348, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "clean bounding box", "bbox": {"l": 176.88042, "t": 649.3143, "r": 230.99271000000002, "b": 655.1657, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "alignment", "bbox": {"l": 176.88042, "t": 655.7565500000001, "r": 203.93219, "b": 661.60794, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "\u2264", "bbox": {"l": 215.93231000000003, "t": 557.56342, "r": 218.4697, "b": 569.15967, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "\u03bc", "bbox": {"l": 229.05689999999998, "t": 557.56342, "r": 231.71908999999997, "b": 569.15967, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "\u03bc", "bbox": {"l": 342.63354, "t": 430.19678, "r": 344.81915, "b": 439.71716, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "S", "bbox": {"l": 261.20892, "t": 448.46124, "r": 263.56973, "b": 451.19727, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "I", "bbox": {"l": 312.33463, "t": 448.46124, "r": 313.6362, "b": 451.19727, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "R", "bbox": {"l": 377.41125, "t": 448.46124, "r": 380.05737, "b": 451.19727, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "ST", "bbox": {"l": 200.63976, "t": 453.33997, "r": 205.82492, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "0.03", "bbox": {"l": 222.20833000000002, "t": 453.33997, "r": 229.76836, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "0.06", "bbox": {"l": 243.26666, "t": 453.33997, "r": 250.82669, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "0.12", "bbox": {"l": 264.29657, "t": 453.33997, "r": 271.84949, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "0.25", "bbox": {"l": 285.31943, "t": 453.33997, "r": 292.87946, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "0.5", "bbox": {"l": 306.37775, "t": 453.33997, "r": 311.77319, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "1", "bbox": {"l": 323.41699, "t": 453.33997, "r": 325.58157, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "2", "bbox": {"l": 334.45807, "t": 453.33997, "r": 336.62265, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "4", "bbox": {"l": 345.52756, "t": 453.33997, "r": 347.69214, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "8", "bbox": {"l": 356.56863, "t": 453.33997, "r": 358.73322, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "16", "bbox": {"l": 367.63812, "t": 453.33997, "r": 371.97089, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "32", "bbox": {"l": 382.6734, "t": 453.33997, "r": 387.00616, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "64", "bbox": {"l": 397.73727, "t": 453.33997, "r": 402.07001, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "\u2265", "bbox": {"l": 412.78879, "t": 447.99298, "r": 414.93463, "b": 457.79964999999993, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": " 128", "bbox": {"l": 414.95697, "t": 453.33997, "r": 422.51746, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "63", "bbox": {"l": 200.63998, "t": 463.92444, "r": 204.57674, "b": 466.66043, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "1", "bbox": {"l": 367.62604, "t": 463.92444, "r": 369.58032, "b": 466.66043, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "1", "bbox": {"l": 382.66132, "t": 463.92444, "r": 384.6156, "b": 466.66043, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "3", "bbox": {"l": 397.72504, "t": 463.92444, "r": 399.67932, "b": 466.66043, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "199", "bbox": {"l": 200.64, "t": 468.80313, "r": 206.51694, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "5", "bbox": {"l": 264.29047, "t": 468.80313, "r": 266.25885, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "1", "bbox": {"l": 306.37213, "t": 468.80313, "r": 308.34052, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "2", "bbox": {"l": 345.51526, "t": 468.80313, "r": 347.48364, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "4", "bbox": {"l": 356.55634, "t": 468.80313, "r": 358.52472, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "1", "bbox": {"l": 367.62582, "t": 468.80313, "r": 369.59418, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "1", "bbox": {"l": 382.66107, "t": 468.80313, "r": 384.62946, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "416", "bbox": {"l": 200.64, "t": 473.68185, "r": 206.51694, "b": 476.41788, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "4", "bbox": {"l": 264.29047, "t": 473.68185, "r": 266.25885, "b": 476.41788, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "230", "bbox": {"l": 200.64, "t": 478.53214, "r": 206.51694, "b": 481.26816, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "1", "bbox": {"l": 243.26373, "t": 478.53214, "r": 245.2321, "b": 481.26816, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "9", "bbox": {"l": 264.29047, "t": 478.53214, "r": 266.25885, "b": 481.26816, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "1", "bbox": {"l": 323.40466, "t": 478.53214, "r": 325.37305, "b": 481.26816, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "1", "bbox": {"l": 397.72519, "t": 478.53214, "r": 399.69354, "b": 481.26816, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "276", "bbox": {"l": 200.64, "t": 483.41086, "r": 206.51694, "b": 486.14688, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "2", "bbox": {"l": 382.66132, "t": 483.41086, "r": 384.61563, "b": 486.14688, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "12", "bbox": {"l": 397.72513, "t": 483.41086, "r": 401.64819, "b": 486.14688, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "1", "bbox": {"l": 412.78928, "t": 483.41086, "r": 414.74359, "b": 486.14688, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "320", "bbox": {"l": 200.64014, "t": 488.28958, "r": 207.14445, "b": 491.0256, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "1", "bbox": {"l": 367.62616, "t": 488.28958, "r": 369.78375, "b": 491.0256, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "4", "bbox": {"l": 382.66141, "t": 488.28958, "r": 384.81897, "b": 491.0256, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "20", "bbox": {"l": 397.7251, "t": 488.28958, "r": 402.05087, "b": 491.0256, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "2013", "bbox": {"l": 200.64032, "t": 493.1683, "r": 208.48566, "b": 495.90433, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "3", "bbox": {"l": 264.29044, "t": 493.1683, "r": 266.25879, "b": 495.90433, "coord_origin": "TOPLEFT"}}, {"id": 165, "text": "\u03bc", "bbox": {"l": 227.91466, "t": 665.82603, "r": 230.10028, "b": 675.3464, "coord_origin": "TOPLEFT"}}, {"id": 166, "text": "\u2265", "bbox": {"l": 300.58057, "t": 683.62195, "r": 302.72638, "b": 693.428658, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 7, "label": "page_header", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 143.97887, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8309906721115112, "cells": [{"id": 0, "text": "10", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 143.97887, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "page_header", "bbox": {"l": 167.82053, "t": 93.77099999999996, "r": 231.72049000000004, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8367075324058533, "cells": [{"id": 1, "text": "M.", "bbox": {"l": 167.82053, "t": 93.77099999999996, "r": 178.08249, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37929, "t": 93.77099999999996, "r": 231.72049000000004, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "caption", "bbox": {"l": 134.765, "t": 115.83618000000001, "r": 480.59357000000006, "b": 145.88666, "coord_origin": "TOPLEFT"}, "confidence": 0.9512290954589844, "cells": [{"id": 3, "text": "Table 2.", "bbox": {"l": 134.765, "t": 115.83618000000001, "r": 173.09366, "b": 123.76251000000002, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "TSR and cell detection results compared between OTSL and HTML on", "bbox": {"l": 181.30299, "t": 115.89899000000003, "r": 480.59151999999995, "b": 123.96868999999992, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "the PubTabNet [22], FinTabNet [21] and PubTables-1M [14] data sets using Table-", "bbox": {"l": 134.765, "t": 126.85797000000014, "r": 480.59357000000006, "b": 134.92767000000003, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Former [9] (with enc=6, dec=6, heads=8).", "bbox": {"l": 134.765, "t": 137.81696, "r": 305.95691, "b": 145.88666, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "table", "bbox": {"l": 143.6376495361328, "t": 156.3477020263672, "r": 470.8485412597656, "b": 263.2624816894531, "coord_origin": "TOPLEFT"}, "confidence": 0.9884640574455261, "cells": [{"id": 7, "text": "Data set", "bbox": {"l": 160.782, "t": 166.55895999999996, "r": 194.99779, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Language", "bbox": {"l": 215.52499000000003, "t": 166.534, "r": 254.04465, "b": 174.6037, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "TEDs", "bbox": {"l": 300.397, "t": 161.07898, "r": 323.99118, "b": 169.14868, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "mAP(0.75)", "bbox": {"l": 370.345, "t": 166.55895999999996, "r": 414.74661, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Inference", "bbox": {"l": 426.737, "t": 161.07898, "r": 463.10830999999996, "b": 169.14868, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "time (secs)", "bbox": {"l": 423.11401, "t": 172.03796, "r": 466.72656, "b": 180.10766999999998, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "simple", "bbox": {"l": 262.41299, "t": 174.03101000000004, "r": 288.0596, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "complex", "bbox": {"l": 296.42899, "t": 174.03101000000004, "r": 329.44687, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "all", "bbox": {"l": 345.03299, "t": 174.03101000000004, "r": 354.75793, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "PubTabNet", "bbox": {"l": 154.53799, "t": 192.85999000000004, "r": 201.24129, "b": 200.92969000000005, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "OTSL", "bbox": {"l": 222.43700000000004, "t": 187.38098000000002, "r": 247.13226000000003, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "0.965", "bbox": {"l": 264.74399, "t": 187.38098000000002, "r": 285.73074, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "0.934", "bbox": {"l": 302.444, "t": 187.38098000000002, "r": 323.43076, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "0.955", "bbox": {"l": 339.40302, "t": 187.38098000000002, "r": 360.38977, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "0.88", "bbox": {"l": 383.116, "t": 187.31817999999998, "r": 401.97324, "b": 195.24451, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "2.73", "bbox": {"l": 435.49300999999997, "t": 187.31817999999998, "r": 454.35025, "b": 195.24451, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "HTML", "bbox": {"l": 220.903, "t": 200.33196999999996, "r": 248.66655999999998, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "0.969", "bbox": {"l": 264.74399, "t": 200.33196999999996, "r": 285.73074, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "0.927", "bbox": {"l": 302.444, "t": 200.33196999999996, "r": 323.43076, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "0.955", "bbox": {"l": 339.40302, "t": 200.33196999999996, "r": 360.38977, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "0.857", "bbox": {"l": 382.052, "t": 200.33196999999996, "r": 403.03876, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "5.39", "bbox": {"l": 436.73199000000005, "t": 200.33196999999996, "r": 453.11182, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "FinTabNet", "bbox": {"l": 155.94501, "t": 219.16198999999995, "r": 199.83374, "b": 227.23168999999996, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "OTSL", "bbox": {"l": 222.43700000000004, "t": 213.68201, "r": 247.13226000000003, "b": 221.75171, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "0.955", "bbox": {"l": 264.74399, "t": 213.68201, "r": 285.73074, "b": 221.75171, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "0.961", "bbox": {"l": 302.444, "t": 213.68201, "r": 323.43076, "b": 221.75171, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "0.959", "bbox": {"l": 337.815, "t": 213.61919999999998, "r": 361.97586, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "0.862", "bbox": {"l": 380.46399, "t": 213.61919999999998, "r": 404.62485, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "1.85", "bbox": {"l": 435.49300999999997, "t": 213.61919999999998, "r": 454.35025, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "HTML", "bbox": {"l": 220.903, "t": 226.63396999999998, "r": 248.66655999999998, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "0.917", "bbox": {"l": 264.74399, "t": 226.63396999999998, "r": 285.73074, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "0.922", "bbox": {"l": 302.444, "t": 226.63396999999998, "r": 323.43076, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "0.92", "bbox": {"l": 341.70599, "t": 226.63396999999998, "r": 358.08582, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "0.722", "bbox": {"l": 382.052, "t": 226.63396999999998, "r": 403.03876, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "3.26", "bbox": {"l": 436.73199000000005, "t": 226.63396999999998, "r": 453.11182, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "PubTables-1M", "bbox": {"l": 148.62601, "t": 245.46294999999998, "r": 207.1524, "b": 253.53265, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "OTSL", "bbox": {"l": 222.43700000000004, "t": 239.98297000000002, "r": 247.13226000000003, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "0.987", "bbox": {"l": 264.74399, "t": 239.98297000000002, "r": 285.73074, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "0.964", "bbox": {"l": 302.444, "t": 239.98297000000002, "r": 323.43076, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "0.977", "bbox": {"l": 337.815, "t": 239.92016999999998, "r": 361.97586, "b": 247.8465, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "0.896", "bbox": {"l": 380.46399, "t": 239.92016999999998, "r": 404.62485, "b": 247.8465, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "1.79", "bbox": {"l": 435.49300999999997, "t": 239.92016999999998, "r": 454.35025, "b": 247.8465, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "HTML", "bbox": {"l": 220.903, "t": 252.93499999999995, "r": 248.66655999999998, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "0.983", "bbox": {"l": 264.74399, "t": 252.93499999999995, "r": 285.73074, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "0.944", "bbox": {"l": 302.444, "t": 252.93499999999995, "r": 323.43076, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "0.966", "bbox": {"l": 339.40302, "t": 252.93499999999995, "r": 360.38977, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "0.889", "bbox": {"l": 382.052, "t": 252.93499999999995, "r": 403.03876, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "3.26", "bbox": {"l": 436.73199000000005, "t": 252.93499999999995, "r": 453.11182, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": [{"id": 8, "label": "text", "bbox": {"l": 160.782, "t": 166.55895999999996, "r": 194.99779, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "Data set", "bbox": {"l": 160.782, "t": 166.55895999999996, "r": 194.99779, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 215.52499000000003, "t": 166.534, "r": 254.04465, "b": 174.6037, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "Language", "bbox": {"l": 215.52499000000003, "t": 166.534, "r": 254.04465, "b": 174.6037, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "text", "bbox": {"l": 300.397, "t": 161.07898, "r": 323.99118, "b": 169.14868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "TEDs", "bbox": {"l": 300.397, "t": 161.07898, "r": 323.99118, "b": 169.14868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 370.345, "t": 166.55895999999996, "r": 414.74661, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "mAP(0.75)", "bbox": {"l": 370.345, "t": 166.55895999999996, "r": 414.74661, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 426.737, "t": 161.07898, "r": 463.10830999999996, "b": 169.14868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "Inference", "bbox": {"l": 426.737, "t": 161.07898, "r": 463.10830999999996, "b": 169.14868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 423.11401, "t": 172.03796, "r": 466.72656, "b": 180.10766999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "time (secs)", "bbox": {"l": 423.11401, "t": 172.03796, "r": 466.72656, "b": 180.10766999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 262.41299, "t": 174.03101000000004, "r": 288.0596, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "simple", "bbox": {"l": 262.41299, "t": 174.03101000000004, "r": 288.0596, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 296.42899, "t": 174.03101000000004, "r": 329.44687, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "complex", "bbox": {"l": 296.42899, "t": 174.03101000000004, "r": 329.44687, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 345.03299, "t": 174.03101000000004, "r": 354.75793, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "all", "bbox": {"l": 345.03299, "t": 174.03101000000004, "r": 354.75793, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 154.53799, "t": 192.85999000000004, "r": 201.24129, "b": 200.92969000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "PubTabNet", "bbox": {"l": 154.53799, "t": 192.85999000000004, "r": 201.24129, "b": 200.92969000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 222.43700000000004, "t": 187.38098000000002, "r": 247.13226000000003, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "OTSL", "bbox": {"l": 222.43700000000004, "t": 187.38098000000002, "r": 247.13226000000003, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 264.74399, "t": 187.38098000000002, "r": 285.73074, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "0.965", "bbox": {"l": 264.74399, "t": 187.38098000000002, "r": 285.73074, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 302.444, "t": 187.38098000000002, "r": 323.43076, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "0.934", "bbox": {"l": 302.444, "t": 187.38098000000002, "r": 323.43076, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 339.40302, "t": 187.38098000000002, "r": 360.38977, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "0.955", "bbox": {"l": 339.40302, "t": 187.38098000000002, "r": 360.38977, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 383.116, "t": 187.31817999999998, "r": 401.97324, "b": 195.24451, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "0.88", "bbox": {"l": 383.116, "t": 187.31817999999998, "r": 401.97324, "b": 195.24451, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 435.49300999999997, "t": 187.31817999999998, "r": 454.35025, "b": 195.24451, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "2.73", "bbox": {"l": 435.49300999999997, "t": 187.31817999999998, "r": 454.35025, "b": 195.24451, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 220.903, "t": 200.33196999999996, "r": 248.66655999999998, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "HTML", "bbox": {"l": 220.903, "t": 200.33196999999996, "r": 248.66655999999998, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 264.74399, "t": 200.33196999999996, "r": 285.73074, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "0.969", "bbox": {"l": 264.74399, "t": 200.33196999999996, "r": 285.73074, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 302.444, "t": 200.33196999999996, "r": 323.43076, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "0.927", "bbox": {"l": 302.444, "t": 200.33196999999996, "r": 323.43076, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 339.40302, "t": 200.33196999999996, "r": 360.38977, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "0.955", "bbox": {"l": 339.40302, "t": 200.33196999999996, "r": 360.38977, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 382.052, "t": 200.33196999999996, "r": 403.03876, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "0.857", "bbox": {"l": 382.052, "t": 200.33196999999996, "r": 403.03876, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 436.73199000000005, "t": 200.33196999999996, "r": 453.11182, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "5.39", "bbox": {"l": 436.73199000000005, "t": 200.33196999999996, "r": 453.11182, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 155.94501, "t": 219.16198999999995, "r": 199.83374, "b": 227.23168999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "FinTabNet", "bbox": {"l": 155.94501, "t": 219.16198999999995, "r": 199.83374, "b": 227.23168999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 222.43700000000004, "t": 213.68201, "r": 247.13226000000003, "b": 221.75171, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "OTSL", "bbox": {"l": 222.43700000000004, "t": 213.68201, "r": 247.13226000000003, "b": 221.75171, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 264.74399, "t": 213.68201, "r": 285.73074, "b": 221.75171, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "0.955", "bbox": {"l": 264.74399, "t": 213.68201, "r": 285.73074, "b": 221.75171, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 302.444, "t": 213.68201, "r": 323.43076, "b": 221.75171, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "0.961", "bbox": {"l": 302.444, "t": 213.68201, "r": 323.43076, "b": 221.75171, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 337.815, "t": 213.61919999999998, "r": 361.97586, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "0.959", "bbox": {"l": 337.815, "t": 213.61919999999998, "r": 361.97586, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 380.46399, "t": 213.61919999999998, "r": 404.62485, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "0.862", "bbox": {"l": 380.46399, "t": 213.61919999999998, "r": 404.62485, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 435.49300999999997, "t": 213.61919999999998, "r": 454.35025, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "1.85", "bbox": {"l": 435.49300999999997, "t": 213.61919999999998, "r": 454.35025, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 220.903, "t": 226.63396999999998, "r": 248.66655999999998, "b": 234.70367, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "HTML", "bbox": {"l": 220.903, "t": 226.63396999999998, "r": 248.66655999999998, "b": 234.70367, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 264.74399, "t": 226.63396999999998, "r": 285.73074, "b": 234.70367, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "0.917", "bbox": {"l": 264.74399, "t": 226.63396999999998, "r": 285.73074, "b": 234.70367, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 302.444, "t": 226.63396999999998, "r": 323.43076, "b": 234.70367, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "0.922", "bbox": {"l": 302.444, "t": 226.63396999999998, "r": 323.43076, "b": 234.70367, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 341.70599, "t": 226.63396999999998, "r": 358.08582, "b": 234.70367, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "0.92", "bbox": {"l": 341.70599, "t": 226.63396999999998, "r": 358.08582, "b": 234.70367, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 382.052, "t": 226.63396999999998, "r": 403.03876, "b": 234.70367, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "0.722", "bbox": {"l": 382.052, "t": 226.63396999999998, "r": 403.03876, "b": 234.70367, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 436.73199000000005, "t": 226.63396999999998, "r": 453.11182, "b": 234.70367, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "3.26", "bbox": {"l": 436.73199000000005, "t": 226.63396999999998, "r": 453.11182, "b": 234.70367, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 148.62601, "t": 245.46294999999998, "r": 207.1524, "b": 253.53265, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "PubTables-1M", "bbox": {"l": 148.62601, "t": 245.46294999999998, "r": 207.1524, "b": 253.53265, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 222.43700000000004, "t": 239.98297000000002, "r": 247.13226000000003, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "OTSL", "bbox": {"l": 222.43700000000004, "t": 239.98297000000002, "r": 247.13226000000003, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 264.74399, "t": 239.98297000000002, "r": 285.73074, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "0.987", "bbox": {"l": 264.74399, "t": 239.98297000000002, "r": 285.73074, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 302.444, "t": 239.98297000000002, "r": 323.43076, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "0.964", "bbox": {"l": 302.444, "t": 239.98297000000002, "r": 323.43076, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 337.815, "t": 239.92016999999998, "r": 361.97586, "b": 247.8465, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "0.977", "bbox": {"l": 337.815, "t": 239.92016999999998, "r": 361.97586, "b": 247.8465, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 380.46399, "t": 239.92016999999998, "r": 404.62485, "b": 247.8465, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "0.896", "bbox": {"l": 380.46399, "t": 239.92016999999998, "r": 404.62485, "b": 247.8465, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 435.49300999999997, "t": 239.92016999999998, "r": 454.35025, "b": 247.8465, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "1.79", "bbox": {"l": 435.49300999999997, "t": 239.92016999999998, "r": 454.35025, "b": 247.8465, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 220.903, "t": 252.93499999999995, "r": 248.66655999999998, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "HTML", "bbox": {"l": 220.903, "t": 252.93499999999995, "r": 248.66655999999998, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 264.74399, "t": 252.93499999999995, "r": 285.73074, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "0.983", "bbox": {"l": 264.74399, "t": 252.93499999999995, "r": 285.73074, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 302.444, "t": 252.93499999999995, "r": 323.43076, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "0.944", "bbox": {"l": 302.444, "t": 252.93499999999995, "r": 323.43076, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 339.40302, "t": 252.93499999999995, "r": 360.38977, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "0.966", "bbox": {"l": 339.40302, "t": 252.93499999999995, "r": 360.38977, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 382.052, "t": 252.93499999999995, "r": 403.03876, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "0.889", "bbox": {"l": 382.052, "t": 252.93499999999995, "r": 403.03876, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 436.73199000000005, "t": 252.93499999999995, "r": 453.11182, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "3.26", "bbox": {"l": 436.73199000000005, "t": 252.93499999999995, "r": 453.11182, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 3, "label": "section_header", "bbox": {"l": 134.765, "t": 288.91479, "r": 257.08679, "b": 297.72173999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9546447992324829, "cells": [{"id": 55, "text": "5.3", "bbox": {"l": 134.765, "t": 288.91479, "r": 149.40205, "b": 297.72173999999995, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Qualitative Results", "bbox": {"l": 160.85904, "t": 288.91479, "r": 257.08679, "b": 297.72173999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 134.765, "t": 309.86078, "r": 480.58981, "b": 366.47769, "coord_origin": "TOPLEFT"}, "confidence": 0.9834085702896118, "cells": [{"id": 57, "text": "To illustrate the qualitative differences between OTSL and HTML, Figure 5", "bbox": {"l": 134.765, "t": 309.86078, "r": 480.58777, "b": 318.65775, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "demonstrates less overlap and more accurate bounding boxes with OTSL. In", "bbox": {"l": 134.765, "t": 321.81577, "r": 480.58889999999997, "b": 330.61273, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Figure 6, OTSL proves to be more effective in handling tables with longer to-", "bbox": {"l": 134.765, "t": 333.77075, "r": 480.58681999999993, "b": 342.56772, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "ken sequences, resulting in even more precise structure prediction and bounding", "bbox": {"l": 134.765, "t": 345.72574, "r": 480.58981, "b": 354.52271, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "boxes.", "bbox": {"l": 134.765, "t": 357.68073, "r": 161.65704, "b": 366.47769, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "caption", "bbox": {"l": 134.765, "t": 397.59012, "r": 480.59106, "b": 439.71716, "coord_origin": "TOPLEFT"}, "confidence": 0.9482728838920593, "cells": [{"id": 62, "text": "Fig. 5.", "bbox": {"l": 134.765, "t": 397.59012, "r": 162.64424, "b": 405.51642, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "The OTSL model produces more accurate bounding boxes with less over-", "bbox": {"l": 167.384, "t": 397.65289, "r": 480.59106, "b": 405.72266, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "lap (E) than the HTML model (D), when predicting the structure of a sparse ta-", "bbox": {"l": 134.765, "t": 408.61190999999997, "r": 480.59106, "b": 416.68167000000005, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "ble (A), at twice the inference speed because of shorter sequence length (B),(C).", "bbox": {"l": 134.765, "t": 419.57089, "r": 480.58838000000003, "b": 427.64066, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "\"PMC2807444_006_00.png\" PubTabNet.", "bbox": {"l": 134.765, "t": 430.52987999999993, "r": 304.69171, "b": 438.59964, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "\u03bc", "bbox": {"l": 342.63354, "t": 430.19678, "r": 344.81915, "b": 439.71716, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "picture", "bbox": {"l": 162.67430114746094, "t": 444.62255859375, "r": 451.70062255859375, "b": 663.2135620117188, "coord_origin": "TOPLEFT"}, "confidence": 0.9742383360862732, "cells": [{"id": 67, "text": "<table>", "bbox": {"l": 180.12473, "t": 516.2332200000001, "r": 190.62042, "b": 518.94992, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "<tr><td></td><td colspan=\"4\"></td><td colspan=\"6\"></td><td colspan=\"3\"></td></tr>", "bbox": {"l": 183.2438, "t": 520.13208, "r": 304.54797, "b": 522.84879, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 524.03094, "r": 388.42313, "b": 526.74765, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 527.9297799999999, "r": 388.42313, "b": 530.64648, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 531.82861, "r": 388.42313, "b": 534.54532, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 535.72748, "r": 388.42313, "b": 538.44418, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 539.62631, "r": 388.42313, "b": 542.34303, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 543.52516, "r": 388.42313, "b": 546.24188, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 547.42401, "r": 388.42313, "b": 550.14073, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 551.32286, "r": 388.42313, "b": 554.03958, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "</table>", "bbox": {"l": 180.12473, "t": 555.22173, "r": 191.86806, "b": 557.93845, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "C", "bbox": {"l": 407.38348, "t": 518.30042, "r": 408.82025, "b": 521.01712, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "C L L L C L L L L L C L L NL", "bbox": {"l": 410.25699, "t": 518.30042, "r": 450.48605, "b": 521.01712, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "C", "bbox": {"l": 407.38348, "t": 522.19925, "r": 408.82025, "b": 524.9159500000001, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 522.19925, "r": 450.48605, "b": 524.9159500000001, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "C", "bbox": {"l": 407.38348, "t": 526.09808, "r": 408.82025, "b": 528.81479, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 526.09808, "r": 450.48605, "b": 528.81479, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "C", "bbox": {"l": 407.38348, "t": 529.99695, "r": 408.82025, "b": 532.7136499999999, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 529.99695, "r": 450.48605, "b": 532.7136499999999, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "C", "bbox": {"l": 407.38348, "t": 533.8957800000001, "r": 408.82025, "b": 536.6125, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 533.8957800000001, "r": 450.48605, "b": 536.6125, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "C", "bbox": {"l": 407.38348, "t": 537.79463, "r": 408.82025, "b": 540.51135, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 537.79463, "r": 450.48605, "b": 540.51135, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "C", "bbox": {"l": 407.38348, "t": 541.69348, "r": 408.82025, "b": 544.4102, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 541.69348, "r": 450.48605, "b": 544.4102, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "C", "bbox": {"l": 407.38348, "t": 545.59233, "r": 408.82025, "b": 548.3090500000001, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 545.59233, "r": 450.48605, "b": 548.3090500000001, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "C", "bbox": {"l": 407.38348, "t": 549.4911999999999, "r": 408.82025, "b": 552.2079200000001, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 549.4911999999999, "r": 450.48605, "b": 552.2079200000001, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "HTML", "bbox": {"l": 164.52881, "t": 509.45859, "r": 181.8528, "b": 515.31, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "#", "bbox": {"l": 183.58441, "t": 509.45859, "r": 186.3974, "b": 515.31, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "tokens:", "bbox": {"l": 189.2104, "t": 509.45859, "r": 208.90137, "b": 515.31, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "258", "bbox": {"l": 210.63269, "t": 509.45859, "r": 221.04044, "b": 515.31, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "OTSL", "bbox": {"l": 390.20203, "t": 509.60361, "r": 406.83609, "b": 515.45502, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "#", "bbox": {"l": 408.56952, "t": 509.60361, "r": 411.38251, "b": 515.45502, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "tokens:", "bbox": {"l": 414.1955, "t": 509.60361, "r": 433.88647000000003, "b": 515.45502, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "135", "bbox": {"l": 435.61737, "t": 509.60361, "r": 446.02512, "b": 515.45502, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "B", "bbox": {"l": 167.19316, "t": 519.07236, "r": 172.8231, "b": 526.3866, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "A", "bbox": {"l": 187.33745, "t": 448.62485, "r": 192.96739, "b": 455.93909, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "D", "bbox": {"l": 167.38654, "t": 566.0051599999999, "r": 173.01648, "b": 573.3194, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "E", "bbox": {"l": 248.45621000000003, "t": 621.78008, "r": 253.65727, "b": 629.09431, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "C", "bbox": {"l": 395.90057, "t": 519.19946, "r": 401.53052, "b": 526.5137, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "HTML", "bbox": {"l": 171.62886, "t": 580.28853, "r": 177.48148, "b": 597.26784, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "OTSL", "bbox": {"l": 251.05969000000002, "t": 633.63408, "r": 256.91235, "b": 649.92345, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "HTML model shows", "bbox": {"l": 372.14645, "t": 601.45724, "r": 427.0379, "b": 607.30864, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "bounding box drifting", "bbox": {"l": 372.14645, "t": 607.89948, "r": 430.06838999999997, "b": 613.75087, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "OTSL model shows", "bbox": {"l": 176.88042, "t": 642.87209, "r": 231.08191, "b": 648.72348, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "clean bounding box", "bbox": {"l": 176.88042, "t": 649.3143, "r": 230.99271000000002, "b": 655.1657, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "alignment", "bbox": {"l": 176.88042, "t": 655.7565500000001, "r": 203.93219, "b": 661.60794, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "\u2264", "bbox": {"l": 215.93231000000003, "t": 557.56342, "r": 218.4697, "b": 569.15967, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "\u03bc", "bbox": {"l": 229.05689999999998, "t": 557.56342, "r": 231.71908999999997, "b": 569.15967, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "S", "bbox": {"l": 261.20892, "t": 448.46124, "r": 263.56973, "b": 451.19727, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "I", "bbox": {"l": 312.33463, "t": 448.46124, "r": 313.6362, "b": 451.19727, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "R", "bbox": {"l": 377.41125, "t": 448.46124, "r": 380.05737, "b": 451.19727, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "ST", "bbox": {"l": 200.63976, "t": 453.33997, "r": 205.82492, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "0.03", "bbox": {"l": 222.20833000000002, "t": 453.33997, "r": 229.76836, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "0.06", "bbox": {"l": 243.26666, "t": 453.33997, "r": 250.82669, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "0.12", "bbox": {"l": 264.29657, "t": 453.33997, "r": 271.84949, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "0.25", "bbox": {"l": 285.31943, "t": 453.33997, "r": 292.87946, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "0.5", "bbox": {"l": 306.37775, "t": 453.33997, "r": 311.77319, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "1", "bbox": {"l": 323.41699, "t": 453.33997, "r": 325.58157, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "2", "bbox": {"l": 334.45807, "t": 453.33997, "r": 336.62265, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "4", "bbox": {"l": 345.52756, "t": 453.33997, "r": 347.69214, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "8", "bbox": {"l": 356.56863, "t": 453.33997, "r": 358.73322, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "16", "bbox": {"l": 367.63812, "t": 453.33997, "r": 371.97089, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "32", "bbox": {"l": 382.6734, "t": 453.33997, "r": 387.00616, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "64", "bbox": {"l": 397.73727, "t": 453.33997, "r": 402.07001, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "\u2265", "bbox": {"l": 412.78879, "t": 447.99298, "r": 414.93463, "b": 457.79964999999993, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": " 128", "bbox": {"l": 414.95697, "t": 453.33997, "r": 422.51746, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "63", "bbox": {"l": 200.63998, "t": 463.92444, "r": 204.57674, "b": 466.66043, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "1", "bbox": {"l": 367.62604, "t": 463.92444, "r": 369.58032, "b": 466.66043, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "1", "bbox": {"l": 382.66132, "t": 463.92444, "r": 384.6156, "b": 466.66043, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "3", "bbox": {"l": 397.72504, "t": 463.92444, "r": 399.67932, "b": 466.66043, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "199", "bbox": {"l": 200.64, "t": 468.80313, "r": 206.51694, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "5", "bbox": {"l": 264.29047, "t": 468.80313, "r": 266.25885, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "1", "bbox": {"l": 306.37213, "t": 468.80313, "r": 308.34052, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "2", "bbox": {"l": 345.51526, "t": 468.80313, "r": 347.48364, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "4", "bbox": {"l": 356.55634, "t": 468.80313, "r": 358.52472, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "1", "bbox": {"l": 367.62582, "t": 468.80313, "r": 369.59418, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "1", "bbox": {"l": 382.66107, "t": 468.80313, "r": 384.62946, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "416", "bbox": {"l": 200.64, "t": 473.68185, "r": 206.51694, "b": 476.41788, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "4", "bbox": {"l": 264.29047, "t": 473.68185, "r": 266.25885, "b": 476.41788, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "230", "bbox": {"l": 200.64, "t": 478.53214, "r": 206.51694, "b": 481.26816, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "1", "bbox": {"l": 243.26373, "t": 478.53214, "r": 245.2321, "b": 481.26816, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "9", "bbox": {"l": 264.29047, "t": 478.53214, "r": 266.25885, "b": 481.26816, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "1", "bbox": {"l": 323.40466, "t": 478.53214, "r": 325.37305, "b": 481.26816, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "1", "bbox": {"l": 397.72519, "t": 478.53214, "r": 399.69354, "b": 481.26816, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "276", "bbox": {"l": 200.64, "t": 483.41086, "r": 206.51694, "b": 486.14688, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "2", "bbox": {"l": 382.66132, "t": 483.41086, "r": 384.61563, "b": 486.14688, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "12", "bbox": {"l": 397.72513, "t": 483.41086, "r": 401.64819, "b": 486.14688, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "1", "bbox": {"l": 412.78928, "t": 483.41086, "r": 414.74359, "b": 486.14688, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "320", "bbox": {"l": 200.64014, "t": 488.28958, "r": 207.14445, "b": 491.0256, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "1", "bbox": {"l": 367.62616, "t": 488.28958, "r": 369.78375, "b": 491.0256, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "4", "bbox": {"l": 382.66141, "t": 488.28958, "r": 384.81897, "b": 491.0256, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "20", "bbox": {"l": 397.7251, "t": 488.28958, "r": 402.05087, "b": 491.0256, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "2013", "bbox": {"l": 200.64032, "t": 493.1683, "r": 208.48566, "b": 495.90433, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "3", "bbox": {"l": 264.29044, "t": 493.1683, "r": 266.25879, "b": 495.90433, "coord_origin": "TOPLEFT"}}], "children": [{"id": 56, "label": "text", "bbox": {"l": 180.12473, "t": 516.2332200000001, "r": 190.62042, "b": 518.94992, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "<table>", "bbox": {"l": 180.12473, "t": 516.2332200000001, "r": 190.62042, "b": 518.94992, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 183.2438, "t": 520.13208, "r": 304.54797, "b": 522.84879, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "<tr><td></td><td colspan=\"4\"></td><td colspan=\"6\"></td><td colspan=\"3\"></td></tr>", "bbox": {"l": 183.2438, "t": 520.13208, "r": 304.54797, "b": 522.84879, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 183.2438, "t": 524.03094, "r": 388.42313, "b": 526.74765, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 524.03094, "r": 388.42313, "b": 526.74765, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 183.2438, "t": 527.9297799999999, "r": 388.42313, "b": 530.64648, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 527.9297799999999, "r": 388.42313, "b": 530.64648, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 183.2438, "t": 531.82861, "r": 388.42313, "b": 534.54532, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 531.82861, "r": 388.42313, "b": 534.54532, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 183.2438, "t": 535.72748, "r": 388.42313, "b": 538.44418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 535.72748, "r": 388.42313, "b": 538.44418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 183.2438, "t": 539.62631, "r": 388.42313, "b": 542.34303, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 539.62631, "r": 388.42313, "b": 542.34303, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 183.2438, "t": 543.52516, "r": 388.42313, "b": 546.24188, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 543.52516, "r": 388.42313, "b": 546.24188, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 183.2438, "t": 547.42401, "r": 388.42313, "b": 550.14073, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 547.42401, "r": 388.42313, "b": 550.14073, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 183.2438, "t": 551.32286, "r": 388.42313, "b": 554.03958, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 551.32286, "r": 388.42313, "b": 554.03958, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 180.12473, "t": 555.22173, "r": 191.86806, "b": 557.93845, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "</table>", "bbox": {"l": 180.12473, "t": 555.22173, "r": 191.86806, "b": 557.93845, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 407.38348, "t": 518.30042, "r": 408.82025, "b": 521.01712, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "C", "bbox": {"l": 407.38348, "t": 518.30042, "r": 408.82025, "b": 521.01712, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 410.25699, "t": 518.30042, "r": 450.48605, "b": 521.01712, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "C L L L C L L L L L C L L NL", "bbox": {"l": 410.25699, "t": 518.30042, "r": 450.48605, "b": 521.01712, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 407.38348, "t": 522.19925, "r": 408.82025, "b": 524.9159500000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "C", "bbox": {"l": 407.38348, "t": 522.19925, "r": 408.82025, "b": 524.9159500000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 410.25699, "t": 522.19925, "r": 450.48605, "b": 524.9159500000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 522.19925, "r": 450.48605, "b": 524.9159500000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 407.38348, "t": 526.09808, "r": 408.82025, "b": 528.81479, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "C", "bbox": {"l": 407.38348, "t": 526.09808, "r": 408.82025, "b": 528.81479, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 410.25699, "t": 526.09808, "r": 450.48605, "b": 528.81479, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 526.09808, "r": 450.48605, "b": 528.81479, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 407.38348, "t": 529.99695, "r": 408.82025, "b": 532.7136499999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "C", "bbox": {"l": 407.38348, "t": 529.99695, "r": 408.82025, "b": 532.7136499999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 410.25699, "t": 529.99695, "r": 450.48605, "b": 532.7136499999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 529.99695, "r": 450.48605, "b": 532.7136499999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 407.38348, "t": 533.8957800000001, "r": 408.82025, "b": 536.6125, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "C", "bbox": {"l": 407.38348, "t": 533.8957800000001, "r": 408.82025, "b": 536.6125, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 410.25699, "t": 533.8957800000001, "r": 450.48605, "b": 536.6125, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 533.8957800000001, "r": 450.48605, "b": 536.6125, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 407.38348, "t": 537.79463, "r": 408.82025, "b": 540.51135, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "C", "bbox": {"l": 407.38348, "t": 537.79463, "r": 408.82025, "b": 540.51135, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 410.25699, "t": 537.79463, "r": 450.48605, "b": 540.51135, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 537.79463, "r": 450.48605, "b": 540.51135, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 407.38348, "t": 541.69348, "r": 408.82025, "b": 544.4102, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "C", "bbox": {"l": 407.38348, "t": 541.69348, "r": 408.82025, "b": 544.4102, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 410.25699, "t": 541.69348, "r": 450.48605, "b": 544.4102, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 541.69348, "r": 450.48605, "b": 544.4102, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 407.38348, "t": 545.59233, "r": 408.82025, "b": 548.3090500000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "C", "bbox": {"l": 407.38348, "t": 545.59233, "r": 408.82025, "b": 548.3090500000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 410.25699, "t": 545.59233, "r": 450.48605, "b": 548.3090500000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 545.59233, "r": 450.48605, "b": 548.3090500000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 407.38348, "t": 549.4911999999999, "r": 408.82025, "b": 552.2079200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "C", "bbox": {"l": 407.38348, "t": 549.4911999999999, "r": 408.82025, "b": 552.2079200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 410.25699, "t": 549.4911999999999, "r": 450.48605, "b": 552.2079200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 549.4911999999999, "r": 450.48605, "b": 552.2079200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 164.52881, "t": 509.45859, "r": 181.8528, "b": 515.31, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "HTML", "bbox": {"l": 164.52881, "t": 509.45859, "r": 181.8528, "b": 515.31, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 183.58441, "t": 509.45859, "r": 186.3974, "b": 515.31, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "#", "bbox": {"l": 183.58441, "t": 509.45859, "r": 186.3974, "b": 515.31, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 189.2104, "t": 509.45859, "r": 208.90137, "b": 515.31, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "tokens:", "bbox": {"l": 189.2104, "t": 509.45859, "r": 208.90137, "b": 515.31, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 210.63269, "t": 509.45859, "r": 221.04044, "b": 515.31, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "258", "bbox": {"l": 210.63269, "t": 509.45859, "r": 221.04044, "b": 515.31, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 390.20203, "t": 509.60361, "r": 406.83609, "b": 515.45502, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "OTSL", "bbox": {"l": 390.20203, "t": 509.60361, "r": 406.83609, "b": 515.45502, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 408.56952, "t": 509.60361, "r": 411.38251, "b": 515.45502, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "#", "bbox": {"l": 408.56952, "t": 509.60361, "r": 411.38251, "b": 515.45502, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 414.1955, "t": 509.60361, "r": 433.88647000000003, "b": 515.45502, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "tokens:", "bbox": {"l": 414.1955, "t": 509.60361, "r": 433.88647000000003, "b": 515.45502, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 435.61737, "t": 509.60361, "r": 446.02512, "b": 515.45502, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": "135", "bbox": {"l": 435.61737, "t": 509.60361, "r": 446.02512, "b": 515.45502, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 167.19316, "t": 519.07236, "r": 172.8231, "b": 526.3866, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "B", "bbox": {"l": 167.19316, "t": 519.07236, "r": 172.8231, "b": 526.3866, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 187.33745, "t": 448.62485, "r": 192.96739, "b": 455.93909, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "A", "bbox": {"l": 187.33745, "t": 448.62485, "r": 192.96739, "b": 455.93909, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 167.38654, "t": 566.0051599999999, "r": 173.01648, "b": 573.3194, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": "D", "bbox": {"l": 167.38654, "t": 566.0051599999999, "r": 173.01648, "b": 573.3194, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 248.45621000000003, "t": 621.78008, "r": 253.65727, "b": 629.09431, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 107, "text": "E", "bbox": {"l": 248.45621000000003, "t": 621.78008, "r": 253.65727, "b": 629.09431, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 395.90057, "t": 519.19946, "r": 401.53052, "b": 526.5137, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 108, "text": "C", "bbox": {"l": 395.90057, "t": 519.19946, "r": 401.53052, "b": 526.5137, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 171.62886, "t": 580.28853, "r": 177.48148, "b": 597.26784, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 109, "text": "HTML", "bbox": {"l": 171.62886, "t": 580.28853, "r": 177.48148, "b": 597.26784, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 251.05969000000002, "t": 633.63408, "r": 256.91235, "b": 649.92345, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 110, "text": "OTSL", "bbox": {"l": 251.05969000000002, "t": 633.63408, "r": 256.91235, "b": 649.92345, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 372.14645, "t": 601.45724, "r": 427.0379, "b": 607.30864, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 111, "text": "HTML model shows", "bbox": {"l": 372.14645, "t": 601.45724, "r": 427.0379, "b": 607.30864, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 372.14645, "t": 607.89948, "r": 430.06838999999997, "b": 613.75087, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 112, "text": "bounding box drifting", "bbox": {"l": 372.14645, "t": 607.89948, "r": 430.06838999999997, "b": 613.75087, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 176.88042, "t": 642.87209, "r": 231.08191, "b": 648.72348, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 113, "text": "OTSL model shows", "bbox": {"l": 176.88042, "t": 642.87209, "r": 231.08191, "b": 648.72348, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 176.88042, "t": 649.3143, "r": 230.99271000000002, "b": 655.1657, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 114, "text": "clean bounding box", "bbox": {"l": 176.88042, "t": 649.3143, "r": 230.99271000000002, "b": 655.1657, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 176.88042, "t": 655.7565500000001, "r": 203.93219, "b": 661.60794, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 115, "text": "alignment", "bbox": {"l": 176.88042, "t": 655.7565500000001, "r": 203.93219, "b": 661.60794, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 215.93231000000003, "t": 557.56342, "r": 218.4697, "b": 569.15967, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 116, "text": "\u2264", "bbox": {"l": 215.93231000000003, "t": 557.56342, "r": 218.4697, "b": 569.15967, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 229.05689999999998, "t": 557.56342, "r": 231.71908999999997, "b": 569.15967, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 117, "text": "\u03bc", "bbox": {"l": 229.05689999999998, "t": 557.56342, "r": 231.71908999999997, "b": 569.15967, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 261.20892, "t": 448.46124, "r": 263.56973, "b": 451.19727, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 119, "text": "S", "bbox": {"l": 261.20892, "t": 448.46124, "r": 263.56973, "b": 451.19727, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 312.33463, "t": 448.46124, "r": 313.6362, "b": 451.19727, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 120, "text": "I", "bbox": {"l": 312.33463, "t": 448.46124, "r": 313.6362, "b": 451.19727, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 377.41125, "t": 448.46124, "r": 380.05737, "b": 451.19727, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 121, "text": "R", "bbox": {"l": 377.41125, "t": 448.46124, "r": 380.05737, "b": 451.19727, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 200.63976, "t": 453.33997, "r": 205.82492, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 122, "text": "ST", "bbox": {"l": 200.63976, "t": 453.33997, "r": 205.82492, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 222.20833000000002, "t": 453.33997, "r": 229.76836, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 123, "text": "0.03", "bbox": {"l": 222.20833000000002, "t": 453.33997, "r": 229.76836, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 243.26666, "t": 453.33997, "r": 250.82669, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 124, "text": "0.06", "bbox": {"l": 243.26666, "t": 453.33997, "r": 250.82669, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 264.29657, "t": 453.33997, "r": 271.84949, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 125, "text": "0.12", "bbox": {"l": 264.29657, "t": 453.33997, "r": 271.84949, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 114, "label": "text", "bbox": {"l": 285.31943, "t": 453.33997, "r": 292.87946, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 126, "text": "0.25", "bbox": {"l": 285.31943, "t": 453.33997, "r": 292.87946, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 115, "label": "text", "bbox": {"l": 306.37775, "t": 453.33997, "r": 311.77319, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 127, "text": "0.5", "bbox": {"l": 306.37775, "t": 453.33997, "r": 311.77319, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 116, "label": "text", "bbox": {"l": 323.41699, "t": 453.33997, "r": 325.58157, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 128, "text": "1", "bbox": {"l": 323.41699, "t": 453.33997, "r": 325.58157, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 117, "label": "text", "bbox": {"l": 334.45807, "t": 453.33997, "r": 336.62265, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 129, "text": "2", "bbox": {"l": 334.45807, "t": 453.33997, "r": 336.62265, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 118, "label": "text", "bbox": {"l": 345.52756, "t": 453.33997, "r": 347.69214, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 130, "text": "4", "bbox": {"l": 345.52756, "t": 453.33997, "r": 347.69214, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 119, "label": "text", "bbox": {"l": 356.56863, "t": 453.33997, "r": 358.73322, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 131, "text": "8", "bbox": {"l": 356.56863, "t": 453.33997, "r": 358.73322, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 120, "label": "text", "bbox": {"l": 367.63812, "t": 453.33997, "r": 371.97089, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 132, "text": "16", "bbox": {"l": 367.63812, "t": 453.33997, "r": 371.97089, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 121, "label": "text", "bbox": {"l": 382.6734, "t": 453.33997, "r": 387.00616, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 133, "text": "32", "bbox": {"l": 382.6734, "t": 453.33997, "r": 387.00616, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 122, "label": "text", "bbox": {"l": 397.73727, "t": 453.33997, "r": 402.07001, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 134, "text": "64", "bbox": {"l": 397.73727, "t": 453.33997, "r": 402.07001, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 123, "label": "text", "bbox": {"l": 412.78879, "t": 447.99298, "r": 414.93463, "b": 457.79964999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 135, "text": "\u2265", "bbox": {"l": 412.78879, "t": 447.99298, "r": 414.93463, "b": 457.79964999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 124, "label": "text", "bbox": {"l": 414.95697, "t": 453.33997, "r": 422.51746, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 136, "text": " 128", "bbox": {"l": 414.95697, "t": 453.33997, "r": 422.51746, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 125, "label": "text", "bbox": {"l": 200.63998, "t": 463.92444, "r": 204.57674, "b": 466.66043, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 137, "text": "63", "bbox": {"l": 200.63998, "t": 463.92444, "r": 204.57674, "b": 466.66043, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 126, "label": "text", "bbox": {"l": 367.62604, "t": 463.92444, "r": 369.58032, "b": 466.66043, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 138, "text": "1", "bbox": {"l": 367.62604, "t": 463.92444, "r": 369.58032, "b": 466.66043, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 127, "label": "text", "bbox": {"l": 382.66132, "t": 463.92444, "r": 384.6156, "b": 466.66043, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 139, "text": "1", "bbox": {"l": 382.66132, "t": 463.92444, "r": 384.6156, "b": 466.66043, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 128, "label": "text", "bbox": {"l": 397.72504, "t": 463.92444, "r": 399.67932, "b": 466.66043, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 140, "text": "3", "bbox": {"l": 397.72504, "t": 463.92444, "r": 399.67932, "b": 466.66043, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 129, "label": "text", "bbox": {"l": 200.64, "t": 468.80313, "r": 206.51694, "b": 471.53915, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 141, "text": "199", "bbox": {"l": 200.64, "t": 468.80313, "r": 206.51694, "b": 471.53915, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 130, "label": "text", "bbox": {"l": 264.29047, "t": 468.80313, "r": 266.25885, "b": 471.53915, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 142, "text": "5", "bbox": {"l": 264.29047, "t": 468.80313, "r": 266.25885, "b": 471.53915, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 131, "label": "text", "bbox": {"l": 306.37213, "t": 468.80313, "r": 308.34052, "b": 471.53915, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 143, "text": "1", "bbox": {"l": 306.37213, "t": 468.80313, "r": 308.34052, "b": 471.53915, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 132, "label": "text", "bbox": {"l": 345.51526, "t": 468.80313, "r": 347.48364, "b": 471.53915, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 144, "text": "2", "bbox": {"l": 345.51526, "t": 468.80313, "r": 347.48364, "b": 471.53915, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 133, "label": "text", "bbox": {"l": 356.55634, "t": 468.80313, "r": 358.52472, "b": 471.53915, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 145, "text": "4", "bbox": {"l": 356.55634, "t": 468.80313, "r": 358.52472, "b": 471.53915, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 134, "label": "text", "bbox": {"l": 367.62582, "t": 468.80313, "r": 369.59418, "b": 471.53915, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 146, "text": "1", "bbox": {"l": 367.62582, "t": 468.80313, "r": 369.59418, "b": 471.53915, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 135, "label": "text", "bbox": {"l": 382.66107, "t": 468.80313, "r": 384.62946, "b": 471.53915, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 147, "text": "1", "bbox": {"l": 382.66107, "t": 468.80313, "r": 384.62946, "b": 471.53915, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 136, "label": "text", "bbox": {"l": 200.64, "t": 473.68185, "r": 206.51694, "b": 476.41788, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 148, "text": "416", "bbox": {"l": 200.64, "t": 473.68185, "r": 206.51694, "b": 476.41788, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 137, "label": "text", "bbox": {"l": 264.29047, "t": 473.68185, "r": 266.25885, "b": 476.41788, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 149, "text": "4", "bbox": {"l": 264.29047, "t": 473.68185, "r": 266.25885, "b": 476.41788, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 138, "label": "text", "bbox": {"l": 200.64, "t": 478.53214, "r": 206.51694, "b": 481.26816, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 150, "text": "230", "bbox": {"l": 200.64, "t": 478.53214, "r": 206.51694, "b": 481.26816, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 139, "label": "text", "bbox": {"l": 243.26373, "t": 478.53214, "r": 245.2321, "b": 481.26816, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 151, "text": "1", "bbox": {"l": 243.26373, "t": 478.53214, "r": 245.2321, "b": 481.26816, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 140, "label": "text", "bbox": {"l": 264.29047, "t": 478.53214, "r": 266.25885, "b": 481.26816, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 152, "text": "9", "bbox": {"l": 264.29047, "t": 478.53214, "r": 266.25885, "b": 481.26816, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 141, "label": "text", "bbox": {"l": 323.40466, "t": 478.53214, "r": 325.37305, "b": 481.26816, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 153, "text": "1", "bbox": {"l": 323.40466, "t": 478.53214, "r": 325.37305, "b": 481.26816, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 142, "label": "text", "bbox": {"l": 397.72519, "t": 478.53214, "r": 399.69354, "b": 481.26816, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 154, "text": "1", "bbox": {"l": 397.72519, "t": 478.53214, "r": 399.69354, "b": 481.26816, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 143, "label": "text", "bbox": {"l": 200.64, "t": 483.41086, "r": 206.51694, "b": 486.14688, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 155, "text": "276", "bbox": {"l": 200.64, "t": 483.41086, "r": 206.51694, "b": 486.14688, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 144, "label": "text", "bbox": {"l": 382.66132, "t": 483.41086, "r": 384.61563, "b": 486.14688, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 156, "text": "2", "bbox": {"l": 382.66132, "t": 483.41086, "r": 384.61563, "b": 486.14688, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 145, "label": "text", "bbox": {"l": 397.72513, "t": 483.41086, "r": 401.64819, "b": 486.14688, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 157, "text": "12", "bbox": {"l": 397.72513, "t": 483.41086, "r": 401.64819, "b": 486.14688, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 146, "label": "text", "bbox": {"l": 412.78928, "t": 483.41086, "r": 414.74359, "b": 486.14688, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 158, "text": "1", "bbox": {"l": 412.78928, "t": 483.41086, "r": 414.74359, "b": 486.14688, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 147, "label": "text", "bbox": {"l": 200.64014, "t": 488.28958, "r": 207.14445, "b": 491.0256, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 159, "text": "320", "bbox": {"l": 200.64014, "t": 488.28958, "r": 207.14445, "b": 491.0256, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 148, "label": "text", "bbox": {"l": 367.62616, "t": 488.28958, "r": 369.78375, "b": 491.0256, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 160, "text": "1", "bbox": {"l": 367.62616, "t": 488.28958, "r": 369.78375, "b": 491.0256, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 149, "label": "text", "bbox": {"l": 382.66141, "t": 488.28958, "r": 384.81897, "b": 491.0256, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 161, "text": "4", "bbox": {"l": 382.66141, "t": 488.28958, "r": 384.81897, "b": 491.0256, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 150, "label": "text", "bbox": {"l": 397.7251, "t": 488.28958, "r": 402.05087, "b": 491.0256, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 162, "text": "20", "bbox": {"l": 397.7251, "t": 488.28958, "r": 402.05087, "b": 491.0256, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 151, "label": "text", "bbox": {"l": 200.64032, "t": 493.1683, "r": 208.48566, "b": 495.90433, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 163, "text": "2013", "bbox": {"l": 200.64032, "t": 493.1683, "r": 208.48566, "b": 495.90433, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 152, "label": "text", "bbox": {"l": 264.29044, "t": 493.1683, "r": 266.25879, "b": 495.90433, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 164, "text": "3", "bbox": {"l": 264.29044, "t": 493.1683, "r": 266.25879, "b": 495.90433, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 153, "label": "text", "bbox": {"l": 227.91466, "t": 665.82603, "r": 230.10028, "b": 675.3464, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 165, "text": "\u03bc", "bbox": {"l": 227.91466, "t": 665.82603, "r": 230.10028, "b": 675.3464, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 154, "label": "text", "bbox": {"l": 300.58057, "t": 683.62195, "r": 302.72638, "b": 693.428658, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 166, "text": "\u2265", "bbox": {"l": 300.58057, "t": 683.62195, "r": 302.72638, "b": 693.428658, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {"0": {"label": "table", "id": 0, "page_no": 9, "cluster": {"id": 0, "label": "table", "bbox": {"l": 143.6376495361328, "t": 156.3477020263672, "r": 470.8485412597656, "b": 263.2624816894531, "coord_origin": "TOPLEFT"}, "confidence": 0.9884640574455261, "cells": [{"id": 7, "text": "Data set", "bbox": {"l": 160.782, "t": 166.55895999999996, "r": 194.99779, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Language", "bbox": {"l": 215.52499000000003, "t": 166.534, "r": 254.04465, "b": 174.6037, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "TEDs", "bbox": {"l": 300.397, "t": 161.07898, "r": 323.99118, "b": 169.14868, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "mAP(0.75)", "bbox": {"l": 370.345, "t": 166.55895999999996, "r": 414.74661, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Inference", "bbox": {"l": 426.737, "t": 161.07898, "r": 463.10830999999996, "b": 169.14868, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "time (secs)", "bbox": {"l": 423.11401, "t": 172.03796, "r": 466.72656, "b": 180.10766999999998, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "simple", "bbox": {"l": 262.41299, "t": 174.03101000000004, "r": 288.0596, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "complex", "bbox": {"l": 296.42899, "t": 174.03101000000004, "r": 329.44687, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "all", "bbox": {"l": 345.03299, "t": 174.03101000000004, "r": 354.75793, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "PubTabNet", "bbox": {"l": 154.53799, "t": 192.85999000000004, "r": 201.24129, "b": 200.92969000000005, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "OTSL", "bbox": {"l": 222.43700000000004, "t": 187.38098000000002, "r": 247.13226000000003, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "0.965", "bbox": {"l": 264.74399, "t": 187.38098000000002, "r": 285.73074, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "0.934", "bbox": {"l": 302.444, "t": 187.38098000000002, "r": 323.43076, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "0.955", "bbox": {"l": 339.40302, "t": 187.38098000000002, "r": 360.38977, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "0.88", "bbox": {"l": 383.116, "t": 187.31817999999998, "r": 401.97324, "b": 195.24451, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "2.73", "bbox": {"l": 435.49300999999997, "t": 187.31817999999998, "r": 454.35025, "b": 195.24451, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "HTML", "bbox": {"l": 220.903, "t": 200.33196999999996, "r": 248.66655999999998, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "0.969", "bbox": {"l": 264.74399, "t": 200.33196999999996, "r": 285.73074, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "0.927", "bbox": {"l": 302.444, "t": 200.33196999999996, "r": 323.43076, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "0.955", "bbox": {"l": 339.40302, "t": 200.33196999999996, "r": 360.38977, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "0.857", "bbox": {"l": 382.052, "t": 200.33196999999996, "r": 403.03876, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "5.39", "bbox": {"l": 436.73199000000005, "t": 200.33196999999996, "r": 453.11182, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "FinTabNet", "bbox": {"l": 155.94501, "t": 219.16198999999995, "r": 199.83374, "b": 227.23168999999996, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "OTSL", "bbox": {"l": 222.43700000000004, "t": 213.68201, "r": 247.13226000000003, "b": 221.75171, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "0.955", "bbox": {"l": 264.74399, "t": 213.68201, "r": 285.73074, "b": 221.75171, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "0.961", "bbox": {"l": 302.444, "t": 213.68201, "r": 323.43076, "b": 221.75171, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "0.959", "bbox": {"l": 337.815, "t": 213.61919999999998, "r": 361.97586, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "0.862", "bbox": {"l": 380.46399, "t": 213.61919999999998, "r": 404.62485, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "1.85", "bbox": {"l": 435.49300999999997, "t": 213.61919999999998, "r": 454.35025, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "HTML", "bbox": {"l": 220.903, "t": 226.63396999999998, "r": 248.66655999999998, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "0.917", "bbox": {"l": 264.74399, "t": 226.63396999999998, "r": 285.73074, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "0.922", "bbox": {"l": 302.444, "t": 226.63396999999998, "r": 323.43076, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "0.92", "bbox": {"l": 341.70599, "t": 226.63396999999998, "r": 358.08582, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "0.722", "bbox": {"l": 382.052, "t": 226.63396999999998, "r": 403.03876, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "3.26", "bbox": {"l": 436.73199000000005, "t": 226.63396999999998, "r": 453.11182, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "PubTables-1M", "bbox": {"l": 148.62601, "t": 245.46294999999998, "r": 207.1524, "b": 253.53265, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "OTSL", "bbox": {"l": 222.43700000000004, "t": 239.98297000000002, "r": 247.13226000000003, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "0.987", "bbox": {"l": 264.74399, "t": 239.98297000000002, "r": 285.73074, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "0.964", "bbox": {"l": 302.444, "t": 239.98297000000002, "r": 323.43076, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "0.977", "bbox": {"l": 337.815, "t": 239.92016999999998, "r": 361.97586, "b": 247.8465, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "0.896", "bbox": {"l": 380.46399, "t": 239.92016999999998, "r": 404.62485, "b": 247.8465, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "1.79", "bbox": {"l": 435.49300999999997, "t": 239.92016999999998, "r": 454.35025, "b": 247.8465, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "HTML", "bbox": {"l": 220.903, "t": 252.93499999999995, "r": 248.66655999999998, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "0.983", "bbox": {"l": 264.74399, "t": 252.93499999999995, "r": 285.73074, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "0.944", "bbox": {"l": 302.444, "t": 252.93499999999995, "r": 323.43076, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "0.966", "bbox": {"l": 339.40302, "t": 252.93499999999995, "r": 360.38977, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "0.889", "bbox": {"l": 382.052, "t": 252.93499999999995, "r": 403.03876, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "3.26", "bbox": {"l": 436.73199000000005, "t": 252.93499999999995, "r": 453.11182, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": [{"id": 8, "label": "text", "bbox": {"l": 160.782, "t": 166.55895999999996, "r": 194.99779, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "Data set", "bbox": {"l": 160.782, "t": 166.55895999999996, "r": 194.99779, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 215.52499000000003, "t": 166.534, "r": 254.04465, "b": 174.6037, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "Language", "bbox": {"l": 215.52499000000003, "t": 166.534, "r": 254.04465, "b": 174.6037, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "text", "bbox": {"l": 300.397, "t": 161.07898, "r": 323.99118, "b": 169.14868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "TEDs", "bbox": {"l": 300.397, "t": 161.07898, "r": 323.99118, "b": 169.14868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 370.345, "t": 166.55895999999996, "r": 414.74661, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "mAP(0.75)", "bbox": {"l": 370.345, "t": 166.55895999999996, "r": 414.74661, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 426.737, "t": 161.07898, "r": 463.10830999999996, "b": 169.14868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "Inference", "bbox": {"l": 426.737, "t": 161.07898, "r": 463.10830999999996, "b": 169.14868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 423.11401, "t": 172.03796, "r": 466.72656, "b": 180.10766999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "time (secs)", "bbox": {"l": 423.11401, "t": 172.03796, "r": 466.72656, "b": 180.10766999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 262.41299, "t": 174.03101000000004, "r": 288.0596, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "simple", "bbox": {"l": 262.41299, "t": 174.03101000000004, "r": 288.0596, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 296.42899, "t": 174.03101000000004, "r": 329.44687, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "complex", "bbox": {"l": 296.42899, "t": 174.03101000000004, "r": 329.44687, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 345.03299, "t": 174.03101000000004, "r": 354.75793, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "all", "bbox": {"l": 345.03299, "t": 174.03101000000004, "r": 354.75793, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 154.53799, "t": 192.85999000000004, "r": 201.24129, "b": 200.92969000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "PubTabNet", "bbox": {"l": 154.53799, "t": 192.85999000000004, "r": 201.24129, "b": 200.92969000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 222.43700000000004, "t": 187.38098000000002, "r": 247.13226000000003, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "OTSL", "bbox": {"l": 222.43700000000004, "t": 187.38098000000002, "r": 247.13226000000003, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 264.74399, "t": 187.38098000000002, "r": 285.73074, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "0.965", "bbox": {"l": 264.74399, "t": 187.38098000000002, "r": 285.73074, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 302.444, "t": 187.38098000000002, "r": 323.43076, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "0.934", "bbox": {"l": 302.444, "t": 187.38098000000002, "r": 323.43076, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 339.40302, "t": 187.38098000000002, "r": 360.38977, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "0.955", "bbox": {"l": 339.40302, "t": 187.38098000000002, "r": 360.38977, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 383.116, "t": 187.31817999999998, "r": 401.97324, "b": 195.24451, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "0.88", "bbox": {"l": 383.116, "t": 187.31817999999998, "r": 401.97324, "b": 195.24451, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 435.49300999999997, "t": 187.31817999999998, "r": 454.35025, "b": 195.24451, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "2.73", "bbox": {"l": 435.49300999999997, "t": 187.31817999999998, "r": 454.35025, "b": 195.24451, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 220.903, "t": 200.33196999999996, "r": 248.66655999999998, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "HTML", "bbox": {"l": 220.903, "t": 200.33196999999996, "r": 248.66655999999998, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 264.74399, "t": 200.33196999999996, "r": 285.73074, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "0.969", "bbox": {"l": 264.74399, "t": 200.33196999999996, "r": 285.73074, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 302.444, "t": 200.33196999999996, "r": 323.43076, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "0.927", "bbox": {"l": 302.444, "t": 200.33196999999996, "r": 323.43076, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 339.40302, "t": 200.33196999999996, "r": 360.38977, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "0.955", "bbox": {"l": 339.40302, "t": 200.33196999999996, "r": 360.38977, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 382.052, "t": 200.33196999999996, "r": 403.03876, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "0.857", "bbox": {"l": 382.052, "t": 200.33196999999996, "r": 403.03876, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 436.73199000000005, "t": 200.33196999999996, "r": 453.11182, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "5.39", "bbox": {"l": 436.73199000000005, "t": 200.33196999999996, "r": 453.11182, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 155.94501, "t": 219.16198999999995, "r": 199.83374, "b": 227.23168999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "FinTabNet", "bbox": {"l": 155.94501, "t": 219.16198999999995, "r": 199.83374, "b": 227.23168999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 222.43700000000004, "t": 213.68201, "r": 247.13226000000003, "b": 221.75171, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "OTSL", "bbox": {"l": 222.43700000000004, "t": 213.68201, "r": 247.13226000000003, "b": 221.75171, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 264.74399, "t": 213.68201, "r": 285.73074, "b": 221.75171, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "0.955", "bbox": {"l": 264.74399, "t": 213.68201, "r": 285.73074, "b": 221.75171, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 302.444, "t": 213.68201, "r": 323.43076, "b": 221.75171, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "0.961", "bbox": {"l": 302.444, "t": 213.68201, "r": 323.43076, "b": 221.75171, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 337.815, "t": 213.61919999999998, "r": 361.97586, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "0.959", "bbox": {"l": 337.815, "t": 213.61919999999998, "r": 361.97586, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 380.46399, "t": 213.61919999999998, "r": 404.62485, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "0.862", "bbox": {"l": 380.46399, "t": 213.61919999999998, "r": 404.62485, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 435.49300999999997, "t": 213.61919999999998, "r": 454.35025, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "1.85", "bbox": {"l": 435.49300999999997, "t": 213.61919999999998, "r": 454.35025, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 220.903, "t": 226.63396999999998, "r": 248.66655999999998, "b": 234.70367, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "HTML", "bbox": {"l": 220.903, "t": 226.63396999999998, "r": 248.66655999999998, "b": 234.70367, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 264.74399, "t": 226.63396999999998, "r": 285.73074, "b": 234.70367, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "0.917", "bbox": {"l": 264.74399, "t": 226.63396999999998, "r": 285.73074, "b": 234.70367, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 302.444, "t": 226.63396999999998, "r": 323.43076, "b": 234.70367, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "0.922", "bbox": {"l": 302.444, "t": 226.63396999999998, "r": 323.43076, "b": 234.70367, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 341.70599, "t": 226.63396999999998, "r": 358.08582, "b": 234.70367, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "0.92", "bbox": {"l": 341.70599, "t": 226.63396999999998, "r": 358.08582, "b": 234.70367, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 382.052, "t": 226.63396999999998, "r": 403.03876, "b": 234.70367, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "0.722", "bbox": {"l": 382.052, "t": 226.63396999999998, "r": 403.03876, "b": 234.70367, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 436.73199000000005, "t": 226.63396999999998, "r": 453.11182, "b": 234.70367, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "3.26", "bbox": {"l": 436.73199000000005, "t": 226.63396999999998, "r": 453.11182, "b": 234.70367, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 148.62601, "t": 245.46294999999998, "r": 207.1524, "b": 253.53265, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "PubTables-1M", "bbox": {"l": 148.62601, "t": 245.46294999999998, "r": 207.1524, "b": 253.53265, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 222.43700000000004, "t": 239.98297000000002, "r": 247.13226000000003, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "OTSL", "bbox": {"l": 222.43700000000004, "t": 239.98297000000002, "r": 247.13226000000003, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 264.74399, "t": 239.98297000000002, "r": 285.73074, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "0.987", "bbox": {"l": 264.74399, "t": 239.98297000000002, "r": 285.73074, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 302.444, "t": 239.98297000000002, "r": 323.43076, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "0.964", "bbox": {"l": 302.444, "t": 239.98297000000002, "r": 323.43076, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 337.815, "t": 239.92016999999998, "r": 361.97586, "b": 247.8465, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "0.977", "bbox": {"l": 337.815, "t": 239.92016999999998, "r": 361.97586, "b": 247.8465, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 380.46399, "t": 239.92016999999998, "r": 404.62485, "b": 247.8465, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "0.896", "bbox": {"l": 380.46399, "t": 239.92016999999998, "r": 404.62485, "b": 247.8465, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 435.49300999999997, "t": 239.92016999999998, "r": 454.35025, "b": 247.8465, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "1.79", "bbox": {"l": 435.49300999999997, "t": 239.92016999999998, "r": 454.35025, "b": 247.8465, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 220.903, "t": 252.93499999999995, "r": 248.66655999999998, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "HTML", "bbox": {"l": 220.903, "t": 252.93499999999995, "r": 248.66655999999998, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 264.74399, "t": 252.93499999999995, "r": 285.73074, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "0.983", "bbox": {"l": 264.74399, "t": 252.93499999999995, "r": 285.73074, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 302.444, "t": 252.93499999999995, "r": 323.43076, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "0.944", "bbox": {"l": 302.444, "t": 252.93499999999995, "r": 323.43076, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 339.40302, "t": 252.93499999999995, "r": 360.38977, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "0.966", "bbox": {"l": 339.40302, "t": 252.93499999999995, "r": 360.38977, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 382.052, "t": 252.93499999999995, "r": 403.03876, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "0.889", "bbox": {"l": 382.052, "t": 252.93499999999995, "r": 403.03876, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 436.73199000000005, "t": 252.93499999999995, "r": 453.11182, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "3.26", "bbox": {"l": 436.73199000000005, "t": 252.93499999999995, "r": 453.11182, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "lcel", "lcel", "ched", "ched", "nl", "ched", "ucel", "ched", "ched", "ched", "ucel", "ucel", "nl", "rhed", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 8, "num_cols": 7, "table_cells": [{"bbox": {"l": 215.52499000000003, "t": 166.534, "r": 254.04465, "b": 174.6037, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Language", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 300.397, "t": 161.07898, "r": 323.99118, "b": 169.14868, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 3, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 5, "text": "TEDs", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 370.345, "t": 166.55895999999996, "r": 414.74661, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 2, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "mAP(0.75)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 423.11401, "t": 161.07898, "r": 466.72656, "b": 180.10766999999998, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 2, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "Inference time (secs)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 262.41299, "t": 174.03101000000004, "r": 288.0596, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "simple", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 296.42899, "t": 174.03101000000004, "r": 329.44687, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "complex", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 345.03299, "t": 174.03101000000004, "r": 354.75793, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "all", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 154.53799, "t": 192.85999000000004, "r": 201.24129, "b": 200.92969000000005, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PubTabNet", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 222.43700000000004, "t": 187.38098000000002, "r": 247.13226000000003, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "OTSL", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 264.74399, "t": 187.38098000000002, "r": 285.73074, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.965", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 302.444, "t": 187.38098000000002, "r": 323.43076, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.934", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 339.40302, "t": 187.38098000000002, "r": 360.38977, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.955", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 383.116, "t": 187.31817999999998, "r": 401.97324, "b": 195.24451, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 435.49300999999997, "t": 187.31817999999998, "r": 454.35025, "b": 195.24451, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "2.73", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 220.903, "t": 200.33196999999996, "r": 248.66655999999998, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "HTML", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 264.74399, "t": 200.33196999999996, "r": 285.73074, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.969", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 302.444, "t": 200.33196999999996, "r": 323.43076, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.927", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 339.40302, "t": 200.33196999999996, "r": 360.38977, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.955", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 382.052, "t": 200.33196999999996, "r": 403.03876, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.857", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 436.73199000000005, "t": 200.33196999999996, "r": 453.11182, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "5.39", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 155.94501, "t": 219.16198999999995, "r": 199.83374, "b": 227.23168999999996, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "FinTabNet", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 222.43700000000004, "t": 213.68201, "r": 247.13226000000003, "b": 221.75171, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "OTSL", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 264.74399, "t": 213.68201, "r": 285.73074, "b": 221.75171, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.955", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 302.444, "t": 213.68201, "r": 323.43076, "b": 221.75171, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.961", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 337.815, "t": 213.61919999999998, "r": 361.97586, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.959", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 380.46399, "t": 213.61919999999998, "r": 404.62485, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.862", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 435.49300999999997, "t": 213.61919999999998, "r": 454.35025, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "1.85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 220.903, "t": 226.63396999999998, "r": 248.66655999999998, "b": 234.70367, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "HTML", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 264.74399, "t": 226.63396999999998, "r": 285.73074, "b": 234.70367, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.917", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 302.444, "t": 226.63396999999998, "r": 323.43076, "b": 234.70367, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.922", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 341.70599, "t": 226.63396999999998, "r": 358.08582, "b": 234.70367, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.92", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 382.052, "t": 226.63396999999998, "r": 403.03876, "b": 234.70367, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.722", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 436.73199000000005, "t": 226.63396999999998, "r": 453.11182, "b": 234.70367, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "3.26", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 148.62601, "t": 245.46294999999998, "r": 207.1524, "b": 253.53265, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PubTables-1M", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 222.43700000000004, "t": 239.98297000000002, "r": 247.13226000000003, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "OTSL", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 264.74399, "t": 239.98297000000002, "r": 285.73074, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.987", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 302.444, "t": 239.98297000000002, "r": 323.43076, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.964", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 337.815, "t": 239.92016999999998, "r": 361.97586, "b": 247.8465, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.977", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 380.46399, "t": 239.92016999999998, "r": 404.62485, "b": 247.8465, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.896", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 435.49300999999997, "t": 239.92016999999998, "r": 454.35025, "b": 247.8465, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "1.79", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 220.903, "t": 252.93499999999995, "r": 248.66655999999998, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "HTML", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 264.74399, "t": 252.93499999999995, "r": 285.73074, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.983", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 302.444, "t": 252.93499999999995, "r": 323.43076, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.944", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 339.40302, "t": 252.93499999999995, "r": 360.38977, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.966", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 382.052, "t": 252.93499999999995, "r": 403.03876, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.889", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 436.73199000000005, "t": 252.93499999999995, "r": 453.11182, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "3.26", "column_header": false, "row_header": false, "row_section": false}]}}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_header", "id": 7, "page_no": 9, "cluster": {"id": 7, "label": "page_header", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 143.97887, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8309906721115112, "cells": [{"id": 0, "text": "10", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 143.97887, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "10"}, {"label": "page_header", "id": 6, "page_no": 9, "cluster": {"id": 6, "label": "page_header", "bbox": {"l": 167.82053, "t": 93.77099999999996, "r": 231.72049000000004, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8367075324058533, "cells": [{"id": 1, "text": "M.", "bbox": {"l": 167.82053, "t": 93.77099999999996, "r": 178.08249, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37929, "t": 93.77099999999996, "r": 231.72049000000004, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "M. Lysak, et al."}, {"label": "caption", "id": 4, "page_no": 9, "cluster": {"id": 4, "label": "caption", "bbox": {"l": 134.765, "t": 115.83618000000001, "r": 480.59357000000006, "b": 145.88666, "coord_origin": "TOPLEFT"}, "confidence": 0.9512290954589844, "cells": [{"id": 3, "text": "Table 2.", "bbox": {"l": 134.765, "t": 115.83618000000001, "r": 173.09366, "b": 123.76251000000002, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "TSR and cell detection results compared between OTSL and HTML on", "bbox": {"l": 181.30299, "t": 115.89899000000003, "r": 480.59151999999995, "b": 123.96868999999992, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "the PubTabNet [22], FinTabNet [21] and PubTables-1M [14] data sets using Table-", "bbox": {"l": 134.765, "t": 126.85797000000014, "r": 480.59357000000006, "b": 134.92767000000003, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Former [9] (with enc=6, dec=6, heads=8).", "bbox": {"l": 134.765, "t": 137.81696, "r": 305.95691, "b": 145.88666, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 2. TSR and cell detection results compared between OTSL and HTML on the PubTabNet [22], FinTabNet [21] and PubTables-1M [14] data sets using TableFormer [9] (with enc=6, dec=6, heads=8)."}, {"label": "table", "id": 0, "page_no": 9, "cluster": {"id": 0, "label": "table", "bbox": {"l": 143.6376495361328, "t": 156.3477020263672, "r": 470.8485412597656, "b": 263.2624816894531, "coord_origin": "TOPLEFT"}, "confidence": 0.9884640574455261, "cells": [{"id": 7, "text": "Data set", "bbox": {"l": 160.782, "t": 166.55895999999996, "r": 194.99779, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Language", "bbox": {"l": 215.52499000000003, "t": 166.534, "r": 254.04465, "b": 174.6037, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "TEDs", "bbox": {"l": 300.397, "t": 161.07898, "r": 323.99118, "b": 169.14868, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "mAP(0.75)", "bbox": {"l": 370.345, "t": 166.55895999999996, "r": 414.74661, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Inference", "bbox": {"l": 426.737, "t": 161.07898, "r": 463.10830999999996, "b": 169.14868, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "time (secs)", "bbox": {"l": 423.11401, "t": 172.03796, "r": 466.72656, "b": 180.10766999999998, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "simple", "bbox": {"l": 262.41299, "t": 174.03101000000004, "r": 288.0596, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "complex", "bbox": {"l": 296.42899, "t": 174.03101000000004, "r": 329.44687, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "all", "bbox": {"l": 345.03299, "t": 174.03101000000004, "r": 354.75793, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "PubTabNet", "bbox": {"l": 154.53799, "t": 192.85999000000004, "r": 201.24129, "b": 200.92969000000005, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "OTSL", "bbox": {"l": 222.43700000000004, "t": 187.38098000000002, "r": 247.13226000000003, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "0.965", "bbox": {"l": 264.74399, "t": 187.38098000000002, "r": 285.73074, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "0.934", "bbox": {"l": 302.444, "t": 187.38098000000002, "r": 323.43076, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "0.955", "bbox": {"l": 339.40302, "t": 187.38098000000002, "r": 360.38977, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "0.88", "bbox": {"l": 383.116, "t": 187.31817999999998, "r": 401.97324, "b": 195.24451, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "2.73", "bbox": {"l": 435.49300999999997, "t": 187.31817999999998, "r": 454.35025, "b": 195.24451, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "HTML", "bbox": {"l": 220.903, "t": 200.33196999999996, "r": 248.66655999999998, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "0.969", "bbox": {"l": 264.74399, "t": 200.33196999999996, "r": 285.73074, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "0.927", "bbox": {"l": 302.444, "t": 200.33196999999996, "r": 323.43076, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "0.955", "bbox": {"l": 339.40302, "t": 200.33196999999996, "r": 360.38977, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "0.857", "bbox": {"l": 382.052, "t": 200.33196999999996, "r": 403.03876, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "5.39", "bbox": {"l": 436.73199000000005, "t": 200.33196999999996, "r": 453.11182, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "FinTabNet", "bbox": {"l": 155.94501, "t": 219.16198999999995, "r": 199.83374, "b": 227.23168999999996, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "OTSL", "bbox": {"l": 222.43700000000004, "t": 213.68201, "r": 247.13226000000003, "b": 221.75171, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "0.955", "bbox": {"l": 264.74399, "t": 213.68201, "r": 285.73074, "b": 221.75171, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "0.961", "bbox": {"l": 302.444, "t": 213.68201, "r": 323.43076, "b": 221.75171, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "0.959", "bbox": {"l": 337.815, "t": 213.61919999999998, "r": 361.97586, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "0.862", "bbox": {"l": 380.46399, "t": 213.61919999999998, "r": 404.62485, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "1.85", "bbox": {"l": 435.49300999999997, "t": 213.61919999999998, "r": 454.35025, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "HTML", "bbox": {"l": 220.903, "t": 226.63396999999998, "r": 248.66655999999998, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "0.917", "bbox": {"l": 264.74399, "t": 226.63396999999998, "r": 285.73074, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "0.922", "bbox": {"l": 302.444, "t": 226.63396999999998, "r": 323.43076, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "0.92", "bbox": {"l": 341.70599, "t": 226.63396999999998, "r": 358.08582, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "0.722", "bbox": {"l": 382.052, "t": 226.63396999999998, "r": 403.03876, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "3.26", "bbox": {"l": 436.73199000000005, "t": 226.63396999999998, "r": 453.11182, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "PubTables-1M", "bbox": {"l": 148.62601, "t": 245.46294999999998, "r": 207.1524, "b": 253.53265, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "OTSL", "bbox": {"l": 222.43700000000004, "t": 239.98297000000002, "r": 247.13226000000003, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "0.987", "bbox": {"l": 264.74399, "t": 239.98297000000002, "r": 285.73074, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "0.964", "bbox": {"l": 302.444, "t": 239.98297000000002, "r": 323.43076, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "0.977", "bbox": {"l": 337.815, "t": 239.92016999999998, "r": 361.97586, "b": 247.8465, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "0.896", "bbox": {"l": 380.46399, "t": 239.92016999999998, "r": 404.62485, "b": 247.8465, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "1.79", "bbox": {"l": 435.49300999999997, "t": 239.92016999999998, "r": 454.35025, "b": 247.8465, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "HTML", "bbox": {"l": 220.903, "t": 252.93499999999995, "r": 248.66655999999998, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "0.983", "bbox": {"l": 264.74399, "t": 252.93499999999995, "r": 285.73074, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "0.944", "bbox": {"l": 302.444, "t": 252.93499999999995, "r": 323.43076, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "0.966", "bbox": {"l": 339.40302, "t": 252.93499999999995, "r": 360.38977, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "0.889", "bbox": {"l": 382.052, "t": 252.93499999999995, "r": 403.03876, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "3.26", "bbox": {"l": 436.73199000000005, "t": 252.93499999999995, "r": 453.11182, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": [{"id": 8, "label": "text", "bbox": {"l": 160.782, "t": 166.55895999999996, "r": 194.99779, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "Data set", "bbox": {"l": 160.782, "t": 166.55895999999996, "r": 194.99779, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 215.52499000000003, "t": 166.534, "r": 254.04465, "b": 174.6037, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "Language", "bbox": {"l": 215.52499000000003, "t": 166.534, "r": 254.04465, "b": 174.6037, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "text", "bbox": {"l": 300.397, "t": 161.07898, "r": 323.99118, "b": 169.14868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "TEDs", "bbox": {"l": 300.397, "t": 161.07898, "r": 323.99118, "b": 169.14868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 370.345, "t": 166.55895999999996, "r": 414.74661, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "mAP(0.75)", "bbox": {"l": 370.345, "t": 166.55895999999996, "r": 414.74661, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 426.737, "t": 161.07898, "r": 463.10830999999996, "b": 169.14868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "Inference", "bbox": {"l": 426.737, "t": 161.07898, "r": 463.10830999999996, "b": 169.14868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 423.11401, "t": 172.03796, "r": 466.72656, "b": 180.10766999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "time (secs)", "bbox": {"l": 423.11401, "t": 172.03796, "r": 466.72656, "b": 180.10766999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 262.41299, "t": 174.03101000000004, "r": 288.0596, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "simple", "bbox": {"l": 262.41299, "t": 174.03101000000004, "r": 288.0596, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 296.42899, "t": 174.03101000000004, "r": 329.44687, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "complex", "bbox": {"l": 296.42899, "t": 174.03101000000004, "r": 329.44687, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 345.03299, "t": 174.03101000000004, "r": 354.75793, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "all", "bbox": {"l": 345.03299, "t": 174.03101000000004, "r": 354.75793, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 154.53799, "t": 192.85999000000004, "r": 201.24129, "b": 200.92969000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "PubTabNet", "bbox": {"l": 154.53799, "t": 192.85999000000004, "r": 201.24129, "b": 200.92969000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 222.43700000000004, "t": 187.38098000000002, "r": 247.13226000000003, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "OTSL", "bbox": {"l": 222.43700000000004, "t": 187.38098000000002, "r": 247.13226000000003, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 264.74399, "t": 187.38098000000002, "r": 285.73074, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "0.965", "bbox": {"l": 264.74399, "t": 187.38098000000002, "r": 285.73074, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 302.444, "t": 187.38098000000002, "r": 323.43076, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "0.934", "bbox": {"l": 302.444, "t": 187.38098000000002, "r": 323.43076, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 339.40302, "t": 187.38098000000002, "r": 360.38977, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "0.955", "bbox": {"l": 339.40302, "t": 187.38098000000002, "r": 360.38977, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 383.116, "t": 187.31817999999998, "r": 401.97324, "b": 195.24451, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "0.88", "bbox": {"l": 383.116, "t": 187.31817999999998, "r": 401.97324, "b": 195.24451, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 435.49300999999997, "t": 187.31817999999998, "r": 454.35025, "b": 195.24451, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "2.73", "bbox": {"l": 435.49300999999997, "t": 187.31817999999998, "r": 454.35025, "b": 195.24451, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 220.903, "t": 200.33196999999996, "r": 248.66655999999998, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "HTML", "bbox": {"l": 220.903, "t": 200.33196999999996, "r": 248.66655999999998, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 264.74399, "t": 200.33196999999996, "r": 285.73074, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "0.969", "bbox": {"l": 264.74399, "t": 200.33196999999996, "r": 285.73074, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 302.444, "t": 200.33196999999996, "r": 323.43076, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "0.927", "bbox": {"l": 302.444, "t": 200.33196999999996, "r": 323.43076, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 339.40302, "t": 200.33196999999996, "r": 360.38977, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "0.955", "bbox": {"l": 339.40302, "t": 200.33196999999996, "r": 360.38977, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 382.052, "t": 200.33196999999996, "r": 403.03876, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "0.857", "bbox": {"l": 382.052, "t": 200.33196999999996, "r": 403.03876, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 436.73199000000005, "t": 200.33196999999996, "r": 453.11182, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "5.39", "bbox": {"l": 436.73199000000005, "t": 200.33196999999996, "r": 453.11182, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 155.94501, "t": 219.16198999999995, "r": 199.83374, "b": 227.23168999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "FinTabNet", "bbox": {"l": 155.94501, "t": 219.16198999999995, "r": 199.83374, "b": 227.23168999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 222.43700000000004, "t": 213.68201, "r": 247.13226000000003, "b": 221.75171, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "OTSL", "bbox": {"l": 222.43700000000004, "t": 213.68201, "r": 247.13226000000003, "b": 221.75171, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 264.74399, "t": 213.68201, "r": 285.73074, "b": 221.75171, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "0.955", "bbox": {"l": 264.74399, "t": 213.68201, "r": 285.73074, "b": 221.75171, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 302.444, "t": 213.68201, "r": 323.43076, "b": 221.75171, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "0.961", "bbox": {"l": 302.444, "t": 213.68201, "r": 323.43076, "b": 221.75171, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 337.815, "t": 213.61919999999998, "r": 361.97586, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "0.959", "bbox": {"l": 337.815, "t": 213.61919999999998, "r": 361.97586, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 380.46399, "t": 213.61919999999998, "r": 404.62485, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "0.862", "bbox": {"l": 380.46399, "t": 213.61919999999998, "r": 404.62485, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 435.49300999999997, "t": 213.61919999999998, "r": 454.35025, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "1.85", "bbox": {"l": 435.49300999999997, "t": 213.61919999999998, "r": 454.35025, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 220.903, "t": 226.63396999999998, "r": 248.66655999999998, "b": 234.70367, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "HTML", "bbox": {"l": 220.903, "t": 226.63396999999998, "r": 248.66655999999998, "b": 234.70367, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 264.74399, "t": 226.63396999999998, "r": 285.73074, "b": 234.70367, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "0.917", "bbox": {"l": 264.74399, "t": 226.63396999999998, "r": 285.73074, "b": 234.70367, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 302.444, "t": 226.63396999999998, "r": 323.43076, "b": 234.70367, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "0.922", "bbox": {"l": 302.444, "t": 226.63396999999998, "r": 323.43076, "b": 234.70367, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 341.70599, "t": 226.63396999999998, "r": 358.08582, "b": 234.70367, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "0.92", "bbox": {"l": 341.70599, "t": 226.63396999999998, "r": 358.08582, "b": 234.70367, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 382.052, "t": 226.63396999999998, "r": 403.03876, "b": 234.70367, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "0.722", "bbox": {"l": 382.052, "t": 226.63396999999998, "r": 403.03876, "b": 234.70367, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 436.73199000000005, "t": 226.63396999999998, "r": 453.11182, "b": 234.70367, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "3.26", "bbox": {"l": 436.73199000000005, "t": 226.63396999999998, "r": 453.11182, "b": 234.70367, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 148.62601, "t": 245.46294999999998, "r": 207.1524, "b": 253.53265, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "PubTables-1M", "bbox": {"l": 148.62601, "t": 245.46294999999998, "r": 207.1524, "b": 253.53265, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 222.43700000000004, "t": 239.98297000000002, "r": 247.13226000000003, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "OTSL", "bbox": {"l": 222.43700000000004, "t": 239.98297000000002, "r": 247.13226000000003, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 264.74399, "t": 239.98297000000002, "r": 285.73074, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "0.987", "bbox": {"l": 264.74399, "t": 239.98297000000002, "r": 285.73074, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 302.444, "t": 239.98297000000002, "r": 323.43076, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "0.964", "bbox": {"l": 302.444, "t": 239.98297000000002, "r": 323.43076, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 337.815, "t": 239.92016999999998, "r": 361.97586, "b": 247.8465, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "0.977", "bbox": {"l": 337.815, "t": 239.92016999999998, "r": 361.97586, "b": 247.8465, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 380.46399, "t": 239.92016999999998, "r": 404.62485, "b": 247.8465, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "0.896", "bbox": {"l": 380.46399, "t": 239.92016999999998, "r": 404.62485, "b": 247.8465, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 435.49300999999997, "t": 239.92016999999998, "r": 454.35025, "b": 247.8465, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "1.79", "bbox": {"l": 435.49300999999997, "t": 239.92016999999998, "r": 454.35025, "b": 247.8465, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 220.903, "t": 252.93499999999995, "r": 248.66655999999998, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "HTML", "bbox": {"l": 220.903, "t": 252.93499999999995, "r": 248.66655999999998, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 264.74399, "t": 252.93499999999995, "r": 285.73074, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "0.983", "bbox": {"l": 264.74399, "t": 252.93499999999995, "r": 285.73074, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 302.444, "t": 252.93499999999995, "r": 323.43076, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "0.944", "bbox": {"l": 302.444, "t": 252.93499999999995, "r": 323.43076, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 339.40302, "t": 252.93499999999995, "r": 360.38977, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "0.966", "bbox": {"l": 339.40302, "t": 252.93499999999995, "r": 360.38977, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 382.052, "t": 252.93499999999995, "r": 403.03876, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "0.889", "bbox": {"l": 382.052, "t": 252.93499999999995, "r": 403.03876, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 436.73199000000005, "t": 252.93499999999995, "r": 453.11182, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "3.26", "bbox": {"l": 436.73199000000005, "t": 252.93499999999995, "r": 453.11182, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "lcel", "lcel", "ched", "ched", "nl", "ched", "ucel", "ched", "ched", "ched", "ucel", "ucel", "nl", "rhed", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 8, "num_cols": 7, "table_cells": [{"bbox": {"l": 215.52499000000003, "t": 166.534, "r": 254.04465, "b": 174.6037, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Language", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 300.397, "t": 161.07898, "r": 323.99118, "b": 169.14868, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 3, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 5, "text": "TEDs", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 370.345, "t": 166.55895999999996, "r": 414.74661, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 2, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "mAP(0.75)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 423.11401, "t": 161.07898, "r": 466.72656, "b": 180.10766999999998, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 2, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "Inference time (secs)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 262.41299, "t": 174.03101000000004, "r": 288.0596, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "simple", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 296.42899, "t": 174.03101000000004, "r": 329.44687, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "complex", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 345.03299, "t": 174.03101000000004, "r": 354.75793, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "all", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 154.53799, "t": 192.85999000000004, "r": 201.24129, "b": 200.92969000000005, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PubTabNet", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 222.43700000000004, "t": 187.38098000000002, "r": 247.13226000000003, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "OTSL", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 264.74399, "t": 187.38098000000002, "r": 285.73074, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.965", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 302.444, "t": 187.38098000000002, "r": 323.43076, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.934", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 339.40302, "t": 187.38098000000002, "r": 360.38977, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.955", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 383.116, "t": 187.31817999999998, "r": 401.97324, "b": 195.24451, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 435.49300999999997, "t": 187.31817999999998, "r": 454.35025, "b": 195.24451, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "2.73", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 220.903, "t": 200.33196999999996, "r": 248.66655999999998, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "HTML", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 264.74399, "t": 200.33196999999996, "r": 285.73074, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.969", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 302.444, "t": 200.33196999999996, "r": 323.43076, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.927", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 339.40302, "t": 200.33196999999996, "r": 360.38977, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.955", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 382.052, "t": 200.33196999999996, "r": 403.03876, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.857", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 436.73199000000005, "t": 200.33196999999996, "r": 453.11182, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "5.39", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 155.94501, "t": 219.16198999999995, "r": 199.83374, "b": 227.23168999999996, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "FinTabNet", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 222.43700000000004, "t": 213.68201, "r": 247.13226000000003, "b": 221.75171, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "OTSL", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 264.74399, "t": 213.68201, "r": 285.73074, "b": 221.75171, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.955", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 302.444, "t": 213.68201, "r": 323.43076, "b": 221.75171, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.961", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 337.815, "t": 213.61919999999998, "r": 361.97586, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.959", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 380.46399, "t": 213.61919999999998, "r": 404.62485, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.862", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 435.49300999999997, "t": 213.61919999999998, "r": 454.35025, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "1.85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 220.903, "t": 226.63396999999998, "r": 248.66655999999998, "b": 234.70367, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "HTML", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 264.74399, "t": 226.63396999999998, "r": 285.73074, "b": 234.70367, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.917", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 302.444, "t": 226.63396999999998, "r": 323.43076, "b": 234.70367, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.922", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 341.70599, "t": 226.63396999999998, "r": 358.08582, "b": 234.70367, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.92", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 382.052, "t": 226.63396999999998, "r": 403.03876, "b": 234.70367, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.722", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 436.73199000000005, "t": 226.63396999999998, "r": 453.11182, "b": 234.70367, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "3.26", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 148.62601, "t": 245.46294999999998, "r": 207.1524, "b": 253.53265, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PubTables-1M", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 222.43700000000004, "t": 239.98297000000002, "r": 247.13226000000003, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "OTSL", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 264.74399, "t": 239.98297000000002, "r": 285.73074, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.987", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 302.444, "t": 239.98297000000002, "r": 323.43076, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.964", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 337.815, "t": 239.92016999999998, "r": 361.97586, "b": 247.8465, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.977", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 380.46399, "t": 239.92016999999998, "r": 404.62485, "b": 247.8465, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.896", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 435.49300999999997, "t": 239.92016999999998, "r": 454.35025, "b": 247.8465, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "1.79", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 220.903, "t": 252.93499999999995, "r": 248.66655999999998, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "HTML", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 264.74399, "t": 252.93499999999995, "r": 285.73074, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.983", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 302.444, "t": 252.93499999999995, "r": 323.43076, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.944", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 339.40302, "t": 252.93499999999995, "r": 360.38977, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.966", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 382.052, "t": 252.93499999999995, "r": 403.03876, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.889", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 436.73199000000005, "t": 252.93499999999995, "r": 453.11182, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "3.26", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "section_header", "id": 3, "page_no": 9, "cluster": {"id": 3, "label": "section_header", "bbox": {"l": 134.765, "t": 288.91479, "r": 257.08679, "b": 297.72173999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9546447992324829, "cells": [{"id": 55, "text": "5.3", "bbox": {"l": 134.765, "t": 288.91479, "r": 149.40205, "b": 297.72173999999995, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Qualitative Results", "bbox": {"l": 160.85904, "t": 288.91479, "r": 257.08679, "b": 297.72173999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5.3 Qualitative Results"}, {"label": "text", "id": 1, "page_no": 9, "cluster": {"id": 1, "label": "text", "bbox": {"l": 134.765, "t": 309.86078, "r": 480.58981, "b": 366.47769, "coord_origin": "TOPLEFT"}, "confidence": 0.9834085702896118, "cells": [{"id": 57, "text": "To illustrate the qualitative differences between OTSL and HTML, Figure 5", "bbox": {"l": 134.765, "t": 309.86078, "r": 480.58777, "b": 318.65775, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "demonstrates less overlap and more accurate bounding boxes with OTSL. In", "bbox": {"l": 134.765, "t": 321.81577, "r": 480.58889999999997, "b": 330.61273, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Figure 6, OTSL proves to be more effective in handling tables with longer to-", "bbox": {"l": 134.765, "t": 333.77075, "r": 480.58681999999993, "b": 342.56772, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "ken sequences, resulting in even more precise structure prediction and bounding", "bbox": {"l": 134.765, "t": 345.72574, "r": 480.58981, "b": 354.52271, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "boxes.", "bbox": {"l": 134.765, "t": 357.68073, "r": 161.65704, "b": 366.47769, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "To illustrate the qualitative differences between OTSL and HTML, Figure 5 demonstrates less overlap and more accurate bounding boxes with OTSL. In Figure 6, OTSL proves to be more effective in handling tables with longer token sequences, resulting in even more precise structure prediction and bounding boxes."}, {"label": "caption", "id": 5, "page_no": 9, "cluster": {"id": 5, "label": "caption", "bbox": {"l": 134.765, "t": 397.59012, "r": 480.59106, "b": 439.71716, "coord_origin": "TOPLEFT"}, "confidence": 0.9482728838920593, "cells": [{"id": 62, "text": "Fig. 5.", "bbox": {"l": 134.765, "t": 397.59012, "r": 162.64424, "b": 405.51642, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "The OTSL model produces more accurate bounding boxes with less over-", "bbox": {"l": 167.384, "t": 397.65289, "r": 480.59106, "b": 405.72266, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "lap (E) than the HTML model (D), when predicting the structure of a sparse ta-", "bbox": {"l": 134.765, "t": 408.61190999999997, "r": 480.59106, "b": 416.68167000000005, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "ble (A), at twice the inference speed because of shorter sequence length (B),(C).", "bbox": {"l": 134.765, "t": 419.57089, "r": 480.58838000000003, "b": 427.64066, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "\"PMC2807444_006_00.png\" PubTabNet.", "bbox": {"l": 134.765, "t": 430.52987999999993, "r": 304.69171, "b": 438.59964, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "\u03bc", "bbox": {"l": 342.63354, "t": 430.19678, "r": 344.81915, "b": 439.71716, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Fig. 5. The OTSL model produces more accurate bounding boxes with less overlap (E) than the HTML model (D), when predicting the structure of a sparse table (A), at twice the inference speed because of shorter sequence length (B),(C). \"PMC2807444_006_00.png\" PubTabNet. \u03bc"}, {"label": "picture", "id": 2, "page_no": 9, "cluster": {"id": 2, "label": "picture", "bbox": {"l": 162.67430114746094, "t": 444.62255859375, "r": 451.70062255859375, "b": 663.2135620117188, "coord_origin": "TOPLEFT"}, "confidence": 0.9742383360862732, "cells": [{"id": 67, "text": "<table>", "bbox": {"l": 180.12473, "t": 516.2332200000001, "r": 190.62042, "b": 518.94992, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "<tr><td></td><td colspan=\"4\"></td><td colspan=\"6\"></td><td colspan=\"3\"></td></tr>", "bbox": {"l": 183.2438, "t": 520.13208, "r": 304.54797, "b": 522.84879, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 524.03094, "r": 388.42313, "b": 526.74765, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 527.9297799999999, "r": 388.42313, "b": 530.64648, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 531.82861, "r": 388.42313, "b": 534.54532, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 535.72748, "r": 388.42313, "b": 538.44418, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 539.62631, "r": 388.42313, "b": 542.34303, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 543.52516, "r": 388.42313, "b": 546.24188, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 547.42401, "r": 388.42313, "b": 550.14073, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 551.32286, "r": 388.42313, "b": 554.03958, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "</table>", "bbox": {"l": 180.12473, "t": 555.22173, "r": 191.86806, "b": 557.93845, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "C", "bbox": {"l": 407.38348, "t": 518.30042, "r": 408.82025, "b": 521.01712, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "C L L L C L L L L L C L L NL", "bbox": {"l": 410.25699, "t": 518.30042, "r": 450.48605, "b": 521.01712, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "C", "bbox": {"l": 407.38348, "t": 522.19925, "r": 408.82025, "b": 524.9159500000001, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 522.19925, "r": 450.48605, "b": 524.9159500000001, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "C", "bbox": {"l": 407.38348, "t": 526.09808, "r": 408.82025, "b": 528.81479, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 526.09808, "r": 450.48605, "b": 528.81479, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "C", "bbox": {"l": 407.38348, "t": 529.99695, "r": 408.82025, "b": 532.7136499999999, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 529.99695, "r": 450.48605, "b": 532.7136499999999, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "C", "bbox": {"l": 407.38348, "t": 533.8957800000001, "r": 408.82025, "b": 536.6125, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 533.8957800000001, "r": 450.48605, "b": 536.6125, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "C", "bbox": {"l": 407.38348, "t": 537.79463, "r": 408.82025, "b": 540.51135, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 537.79463, "r": 450.48605, "b": 540.51135, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "C", "bbox": {"l": 407.38348, "t": 541.69348, "r": 408.82025, "b": 544.4102, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 541.69348, "r": 450.48605, "b": 544.4102, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "C", "bbox": {"l": 407.38348, "t": 545.59233, "r": 408.82025, "b": 548.3090500000001, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 545.59233, "r": 450.48605, "b": 548.3090500000001, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "C", "bbox": {"l": 407.38348, "t": 549.4911999999999, "r": 408.82025, "b": 552.2079200000001, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 549.4911999999999, "r": 450.48605, "b": 552.2079200000001, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "HTML", "bbox": {"l": 164.52881, "t": 509.45859, "r": 181.8528, "b": 515.31, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "#", "bbox": {"l": 183.58441, "t": 509.45859, "r": 186.3974, "b": 515.31, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "tokens:", "bbox": {"l": 189.2104, "t": 509.45859, "r": 208.90137, "b": 515.31, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "258", "bbox": {"l": 210.63269, "t": 509.45859, "r": 221.04044, "b": 515.31, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "OTSL", "bbox": {"l": 390.20203, "t": 509.60361, "r": 406.83609, "b": 515.45502, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "#", "bbox": {"l": 408.56952, "t": 509.60361, "r": 411.38251, "b": 515.45502, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "tokens:", "bbox": {"l": 414.1955, "t": 509.60361, "r": 433.88647000000003, "b": 515.45502, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "135", "bbox": {"l": 435.61737, "t": 509.60361, "r": 446.02512, "b": 515.45502, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "B", "bbox": {"l": 167.19316, "t": 519.07236, "r": 172.8231, "b": 526.3866, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "A", "bbox": {"l": 187.33745, "t": 448.62485, "r": 192.96739, "b": 455.93909, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "D", "bbox": {"l": 167.38654, "t": 566.0051599999999, "r": 173.01648, "b": 573.3194, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "E", "bbox": {"l": 248.45621000000003, "t": 621.78008, "r": 253.65727, "b": 629.09431, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "C", "bbox": {"l": 395.90057, "t": 519.19946, "r": 401.53052, "b": 526.5137, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "HTML", "bbox": {"l": 171.62886, "t": 580.28853, "r": 177.48148, "b": 597.26784, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "OTSL", "bbox": {"l": 251.05969000000002, "t": 633.63408, "r": 256.91235, "b": 649.92345, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "HTML model shows", "bbox": {"l": 372.14645, "t": 601.45724, "r": 427.0379, "b": 607.30864, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "bounding box drifting", "bbox": {"l": 372.14645, "t": 607.89948, "r": 430.06838999999997, "b": 613.75087, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "OTSL model shows", "bbox": {"l": 176.88042, "t": 642.87209, "r": 231.08191, "b": 648.72348, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "clean bounding box", "bbox": {"l": 176.88042, "t": 649.3143, "r": 230.99271000000002, "b": 655.1657, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "alignment", "bbox": {"l": 176.88042, "t": 655.7565500000001, "r": 203.93219, "b": 661.60794, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "\u2264", "bbox": {"l": 215.93231000000003, "t": 557.56342, "r": 218.4697, "b": 569.15967, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "\u03bc", "bbox": {"l": 229.05689999999998, "t": 557.56342, "r": 231.71908999999997, "b": 569.15967, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "S", "bbox": {"l": 261.20892, "t": 448.46124, "r": 263.56973, "b": 451.19727, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "I", "bbox": {"l": 312.33463, "t": 448.46124, "r": 313.6362, "b": 451.19727, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "R", "bbox": {"l": 377.41125, "t": 448.46124, "r": 380.05737, "b": 451.19727, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "ST", "bbox": {"l": 200.63976, "t": 453.33997, "r": 205.82492, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "0.03", "bbox": {"l": 222.20833000000002, "t": 453.33997, "r": 229.76836, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "0.06", "bbox": {"l": 243.26666, "t": 453.33997, "r": 250.82669, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "0.12", "bbox": {"l": 264.29657, "t": 453.33997, "r": 271.84949, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "0.25", "bbox": {"l": 285.31943, "t": 453.33997, "r": 292.87946, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "0.5", "bbox": {"l": 306.37775, "t": 453.33997, "r": 311.77319, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "1", "bbox": {"l": 323.41699, "t": 453.33997, "r": 325.58157, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "2", "bbox": {"l": 334.45807, "t": 453.33997, "r": 336.62265, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "4", "bbox": {"l": 345.52756, "t": 453.33997, "r": 347.69214, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "8", "bbox": {"l": 356.56863, "t": 453.33997, "r": 358.73322, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "16", "bbox": {"l": 367.63812, "t": 453.33997, "r": 371.97089, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "32", "bbox": {"l": 382.6734, "t": 453.33997, "r": 387.00616, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "64", "bbox": {"l": 397.73727, "t": 453.33997, "r": 402.07001, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "\u2265", "bbox": {"l": 412.78879, "t": 447.99298, "r": 414.93463, "b": 457.79964999999993, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": " 128", "bbox": {"l": 414.95697, "t": 453.33997, "r": 422.51746, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "63", "bbox": {"l": 200.63998, "t": 463.92444, "r": 204.57674, "b": 466.66043, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "1", "bbox": {"l": 367.62604, "t": 463.92444, "r": 369.58032, "b": 466.66043, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "1", "bbox": {"l": 382.66132, "t": 463.92444, "r": 384.6156, "b": 466.66043, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "3", "bbox": {"l": 397.72504, "t": 463.92444, "r": 399.67932, "b": 466.66043, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "199", "bbox": {"l": 200.64, "t": 468.80313, "r": 206.51694, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "5", "bbox": {"l": 264.29047, "t": 468.80313, "r": 266.25885, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "1", "bbox": {"l": 306.37213, "t": 468.80313, "r": 308.34052, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "2", "bbox": {"l": 345.51526, "t": 468.80313, "r": 347.48364, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "4", "bbox": {"l": 356.55634, "t": 468.80313, "r": 358.52472, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "1", "bbox": {"l": 367.62582, "t": 468.80313, "r": 369.59418, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "1", "bbox": {"l": 382.66107, "t": 468.80313, "r": 384.62946, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "416", "bbox": {"l": 200.64, "t": 473.68185, "r": 206.51694, "b": 476.41788, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "4", "bbox": {"l": 264.29047, "t": 473.68185, "r": 266.25885, "b": 476.41788, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "230", "bbox": {"l": 200.64, "t": 478.53214, "r": 206.51694, "b": 481.26816, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "1", "bbox": {"l": 243.26373, "t": 478.53214, "r": 245.2321, "b": 481.26816, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "9", "bbox": {"l": 264.29047, "t": 478.53214, "r": 266.25885, "b": 481.26816, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "1", "bbox": {"l": 323.40466, "t": 478.53214, "r": 325.37305, "b": 481.26816, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "1", "bbox": {"l": 397.72519, "t": 478.53214, "r": 399.69354, "b": 481.26816, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "276", "bbox": {"l": 200.64, "t": 483.41086, "r": 206.51694, "b": 486.14688, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "2", "bbox": {"l": 382.66132, "t": 483.41086, "r": 384.61563, "b": 486.14688, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "12", "bbox": {"l": 397.72513, "t": 483.41086, "r": 401.64819, "b": 486.14688, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "1", "bbox": {"l": 412.78928, "t": 483.41086, "r": 414.74359, "b": 486.14688, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "320", "bbox": {"l": 200.64014, "t": 488.28958, "r": 207.14445, "b": 491.0256, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "1", "bbox": {"l": 367.62616, "t": 488.28958, "r": 369.78375, "b": 491.0256, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "4", "bbox": {"l": 382.66141, "t": 488.28958, "r": 384.81897, "b": 491.0256, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "20", "bbox": {"l": 397.7251, "t": 488.28958, "r": 402.05087, "b": 491.0256, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "2013", "bbox": {"l": 200.64032, "t": 493.1683, "r": 208.48566, "b": 495.90433, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "3", "bbox": {"l": 264.29044, "t": 493.1683, "r": 266.25879, "b": 495.90433, "coord_origin": "TOPLEFT"}}], "children": [{"id": 56, "label": "text", "bbox": {"l": 180.12473, "t": 516.2332200000001, "r": 190.62042, "b": 518.94992, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "<table>", "bbox": {"l": 180.12473, "t": 516.2332200000001, "r": 190.62042, "b": 518.94992, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 183.2438, "t": 520.13208, "r": 304.54797, "b": 522.84879, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "<tr><td></td><td colspan=\"4\"></td><td colspan=\"6\"></td><td colspan=\"3\"></td></tr>", "bbox": {"l": 183.2438, "t": 520.13208, "r": 304.54797, "b": 522.84879, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 183.2438, "t": 524.03094, "r": 388.42313, "b": 526.74765, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 524.03094, "r": 388.42313, "b": 526.74765, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 183.2438, "t": 527.9297799999999, "r": 388.42313, "b": 530.64648, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 527.9297799999999, "r": 388.42313, "b": 530.64648, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 183.2438, "t": 531.82861, "r": 388.42313, "b": 534.54532, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 531.82861, "r": 388.42313, "b": 534.54532, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 183.2438, "t": 535.72748, "r": 388.42313, "b": 538.44418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 535.72748, "r": 388.42313, "b": 538.44418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 183.2438, "t": 539.62631, "r": 388.42313, "b": 542.34303, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 539.62631, "r": 388.42313, "b": 542.34303, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 183.2438, "t": 543.52516, "r": 388.42313, "b": 546.24188, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 543.52516, "r": 388.42313, "b": 546.24188, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 183.2438, "t": 547.42401, "r": 388.42313, "b": 550.14073, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 547.42401, "r": 388.42313, "b": 550.14073, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 183.2438, "t": 551.32286, "r": 388.42313, "b": 554.03958, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 551.32286, "r": 388.42313, "b": 554.03958, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 180.12473, "t": 555.22173, "r": 191.86806, "b": 557.93845, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "</table>", "bbox": {"l": 180.12473, "t": 555.22173, "r": 191.86806, "b": 557.93845, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 407.38348, "t": 518.30042, "r": 408.82025, "b": 521.01712, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "C", "bbox": {"l": 407.38348, "t": 518.30042, "r": 408.82025, "b": 521.01712, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 410.25699, "t": 518.30042, "r": 450.48605, "b": 521.01712, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "C L L L C L L L L L C L L NL", "bbox": {"l": 410.25699, "t": 518.30042, "r": 450.48605, "b": 521.01712, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 407.38348, "t": 522.19925, "r": 408.82025, "b": 524.9159500000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "C", "bbox": {"l": 407.38348, "t": 522.19925, "r": 408.82025, "b": 524.9159500000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 410.25699, "t": 522.19925, "r": 450.48605, "b": 524.9159500000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 522.19925, "r": 450.48605, "b": 524.9159500000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 407.38348, "t": 526.09808, "r": 408.82025, "b": 528.81479, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "C", "bbox": {"l": 407.38348, "t": 526.09808, "r": 408.82025, "b": 528.81479, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 410.25699, "t": 526.09808, "r": 450.48605, "b": 528.81479, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 526.09808, "r": 450.48605, "b": 528.81479, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 407.38348, "t": 529.99695, "r": 408.82025, "b": 532.7136499999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "C", "bbox": {"l": 407.38348, "t": 529.99695, "r": 408.82025, "b": 532.7136499999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 410.25699, "t": 529.99695, "r": 450.48605, "b": 532.7136499999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 529.99695, "r": 450.48605, "b": 532.7136499999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 407.38348, "t": 533.8957800000001, "r": 408.82025, "b": 536.6125, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "C", "bbox": {"l": 407.38348, "t": 533.8957800000001, "r": 408.82025, "b": 536.6125, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 410.25699, "t": 533.8957800000001, "r": 450.48605, "b": 536.6125, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 533.8957800000001, "r": 450.48605, "b": 536.6125, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 407.38348, "t": 537.79463, "r": 408.82025, "b": 540.51135, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "C", "bbox": {"l": 407.38348, "t": 537.79463, "r": 408.82025, "b": 540.51135, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 410.25699, "t": 537.79463, "r": 450.48605, "b": 540.51135, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 537.79463, "r": 450.48605, "b": 540.51135, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 407.38348, "t": 541.69348, "r": 408.82025, "b": 544.4102, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "C", "bbox": {"l": 407.38348, "t": 541.69348, "r": 408.82025, "b": 544.4102, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 410.25699, "t": 541.69348, "r": 450.48605, "b": 544.4102, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 541.69348, "r": 450.48605, "b": 544.4102, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 407.38348, "t": 545.59233, "r": 408.82025, "b": 548.3090500000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "C", "bbox": {"l": 407.38348, "t": 545.59233, "r": 408.82025, "b": 548.3090500000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 410.25699, "t": 545.59233, "r": 450.48605, "b": 548.3090500000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 545.59233, "r": 450.48605, "b": 548.3090500000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 407.38348, "t": 549.4911999999999, "r": 408.82025, "b": 552.2079200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "C", "bbox": {"l": 407.38348, "t": 549.4911999999999, "r": 408.82025, "b": 552.2079200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 410.25699, "t": 549.4911999999999, "r": 450.48605, "b": 552.2079200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 549.4911999999999, "r": 450.48605, "b": 552.2079200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 164.52881, "t": 509.45859, "r": 181.8528, "b": 515.31, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "HTML", "bbox": {"l": 164.52881, "t": 509.45859, "r": 181.8528, "b": 515.31, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 183.58441, "t": 509.45859, "r": 186.3974, "b": 515.31, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "#", "bbox": {"l": 183.58441, "t": 509.45859, "r": 186.3974, "b": 515.31, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 189.2104, "t": 509.45859, "r": 208.90137, "b": 515.31, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "tokens:", "bbox": {"l": 189.2104, "t": 509.45859, "r": 208.90137, "b": 515.31, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 210.63269, "t": 509.45859, "r": 221.04044, "b": 515.31, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "258", "bbox": {"l": 210.63269, "t": 509.45859, "r": 221.04044, "b": 515.31, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 390.20203, "t": 509.60361, "r": 406.83609, "b": 515.45502, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "OTSL", "bbox": {"l": 390.20203, "t": 509.60361, "r": 406.83609, "b": 515.45502, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 408.56952, "t": 509.60361, "r": 411.38251, "b": 515.45502, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "#", "bbox": {"l": 408.56952, "t": 509.60361, "r": 411.38251, "b": 515.45502, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 414.1955, "t": 509.60361, "r": 433.88647000000003, "b": 515.45502, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "tokens:", "bbox": {"l": 414.1955, "t": 509.60361, "r": 433.88647000000003, "b": 515.45502, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 435.61737, "t": 509.60361, "r": 446.02512, "b": 515.45502, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": "135", "bbox": {"l": 435.61737, "t": 509.60361, "r": 446.02512, "b": 515.45502, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 167.19316, "t": 519.07236, "r": 172.8231, "b": 526.3866, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "B", "bbox": {"l": 167.19316, "t": 519.07236, "r": 172.8231, "b": 526.3866, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 187.33745, "t": 448.62485, "r": 192.96739, "b": 455.93909, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "A", "bbox": {"l": 187.33745, "t": 448.62485, "r": 192.96739, "b": 455.93909, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 167.38654, "t": 566.0051599999999, "r": 173.01648, "b": 573.3194, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": "D", "bbox": {"l": 167.38654, "t": 566.0051599999999, "r": 173.01648, "b": 573.3194, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 248.45621000000003, "t": 621.78008, "r": 253.65727, "b": 629.09431, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 107, "text": "E", "bbox": {"l": 248.45621000000003, "t": 621.78008, "r": 253.65727, "b": 629.09431, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 395.90057, "t": 519.19946, "r": 401.53052, "b": 526.5137, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 108, "text": "C", "bbox": {"l": 395.90057, "t": 519.19946, "r": 401.53052, "b": 526.5137, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 171.62886, "t": 580.28853, "r": 177.48148, "b": 597.26784, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 109, "text": "HTML", "bbox": {"l": 171.62886, "t": 580.28853, "r": 177.48148, "b": 597.26784, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 251.05969000000002, "t": 633.63408, "r": 256.91235, "b": 649.92345, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 110, "text": "OTSL", "bbox": {"l": 251.05969000000002, "t": 633.63408, "r": 256.91235, "b": 649.92345, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 372.14645, "t": 601.45724, "r": 427.0379, "b": 607.30864, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 111, "text": "HTML model shows", "bbox": {"l": 372.14645, "t": 601.45724, "r": 427.0379, "b": 607.30864, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 372.14645, "t": 607.89948, "r": 430.06838999999997, "b": 613.75087, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 112, "text": "bounding box drifting", "bbox": {"l": 372.14645, "t": 607.89948, "r": 430.06838999999997, "b": 613.75087, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 176.88042, "t": 642.87209, "r": 231.08191, "b": 648.72348, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 113, "text": "OTSL model shows", "bbox": {"l": 176.88042, "t": 642.87209, "r": 231.08191, "b": 648.72348, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 176.88042, "t": 649.3143, "r": 230.99271000000002, "b": 655.1657, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 114, "text": "clean bounding box", "bbox": {"l": 176.88042, "t": 649.3143, "r": 230.99271000000002, "b": 655.1657, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 176.88042, "t": 655.7565500000001, "r": 203.93219, "b": 661.60794, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 115, "text": "alignment", "bbox": {"l": 176.88042, "t": 655.7565500000001, "r": 203.93219, "b": 661.60794, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 215.93231000000003, "t": 557.56342, "r": 218.4697, "b": 569.15967, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 116, "text": "\u2264", "bbox": {"l": 215.93231000000003, "t": 557.56342, "r": 218.4697, "b": 569.15967, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 229.05689999999998, "t": 557.56342, "r": 231.71908999999997, "b": 569.15967, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 117, "text": "\u03bc", "bbox": {"l": 229.05689999999998, "t": 557.56342, "r": 231.71908999999997, "b": 569.15967, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 261.20892, "t": 448.46124, "r": 263.56973, "b": 451.19727, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 119, "text": "S", "bbox": {"l": 261.20892, "t": 448.46124, "r": 263.56973, "b": 451.19727, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 312.33463, "t": 448.46124, "r": 313.6362, "b": 451.19727, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 120, "text": "I", "bbox": {"l": 312.33463, "t": 448.46124, "r": 313.6362, "b": 451.19727, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 377.41125, "t": 448.46124, "r": 380.05737, "b": 451.19727, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 121, "text": "R", "bbox": {"l": 377.41125, "t": 448.46124, "r": 380.05737, "b": 451.19727, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 200.63976, "t": 453.33997, "r": 205.82492, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 122, "text": "ST", "bbox": {"l": 200.63976, "t": 453.33997, "r": 205.82492, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 222.20833000000002, "t": 453.33997, "r": 229.76836, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 123, "text": "0.03", "bbox": {"l": 222.20833000000002, "t": 453.33997, "r": 229.76836, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 243.26666, "t": 453.33997, "r": 250.82669, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 124, "text": "0.06", "bbox": {"l": 243.26666, "t": 453.33997, "r": 250.82669, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 264.29657, "t": 453.33997, "r": 271.84949, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 125, "text": "0.12", "bbox": {"l": 264.29657, "t": 453.33997, "r": 271.84949, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 114, "label": "text", "bbox": {"l": 285.31943, "t": 453.33997, "r": 292.87946, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 126, "text": "0.25", "bbox": {"l": 285.31943, "t": 453.33997, "r": 292.87946, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 115, "label": "text", "bbox": {"l": 306.37775, "t": 453.33997, "r": 311.77319, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 127, "text": "0.5", "bbox": {"l": 306.37775, "t": 453.33997, "r": 311.77319, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 116, "label": "text", "bbox": {"l": 323.41699, "t": 453.33997, "r": 325.58157, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 128, "text": "1", "bbox": {"l": 323.41699, "t": 453.33997, "r": 325.58157, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 117, "label": "text", "bbox": {"l": 334.45807, "t": 453.33997, "r": 336.62265, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 129, "text": "2", "bbox": {"l": 334.45807, "t": 453.33997, "r": 336.62265, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 118, "label": "text", "bbox": {"l": 345.52756, "t": 453.33997, "r": 347.69214, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 130, "text": "4", "bbox": {"l": 345.52756, "t": 453.33997, "r": 347.69214, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 119, "label": "text", "bbox": {"l": 356.56863, "t": 453.33997, "r": 358.73322, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 131, "text": "8", "bbox": {"l": 356.56863, "t": 453.33997, "r": 358.73322, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 120, "label": "text", "bbox": {"l": 367.63812, "t": 453.33997, "r": 371.97089, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 132, "text": "16", "bbox": {"l": 367.63812, "t": 453.33997, "r": 371.97089, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 121, "label": "text", "bbox": {"l": 382.6734, "t": 453.33997, "r": 387.00616, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 133, "text": "32", "bbox": {"l": 382.6734, "t": 453.33997, "r": 387.00616, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 122, "label": "text", "bbox": {"l": 397.73727, "t": 453.33997, "r": 402.07001, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 134, "text": "64", "bbox": {"l": 397.73727, "t": 453.33997, "r": 402.07001, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 123, "label": "text", "bbox": {"l": 412.78879, "t": 447.99298, "r": 414.93463, "b": 457.79964999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 135, "text": "\u2265", "bbox": {"l": 412.78879, "t": 447.99298, "r": 414.93463, "b": 457.79964999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 124, "label": "text", "bbox": {"l": 414.95697, "t": 453.33997, "r": 422.51746, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 136, "text": " 128", "bbox": {"l": 414.95697, "t": 453.33997, "r": 422.51746, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 125, "label": "text", "bbox": {"l": 200.63998, "t": 463.92444, "r": 204.57674, "b": 466.66043, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 137, "text": "63", "bbox": {"l": 200.63998, "t": 463.92444, "r": 204.57674, "b": 466.66043, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 126, "label": "text", "bbox": {"l": 367.62604, "t": 463.92444, "r": 369.58032, "b": 466.66043, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 138, "text": "1", "bbox": {"l": 367.62604, "t": 463.92444, "r": 369.58032, "b": 466.66043, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 127, "label": "text", "bbox": {"l": 382.66132, "t": 463.92444, "r": 384.6156, "b": 466.66043, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 139, "text": "1", "bbox": {"l": 382.66132, "t": 463.92444, "r": 384.6156, "b": 466.66043, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 128, "label": "text", "bbox": {"l": 397.72504, "t": 463.92444, "r": 399.67932, "b": 466.66043, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 140, "text": "3", "bbox": {"l": 397.72504, "t": 463.92444, "r": 399.67932, "b": 466.66043, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 129, "label": "text", "bbox": {"l": 200.64, "t": 468.80313, "r": 206.51694, "b": 471.53915, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 141, "text": "199", "bbox": {"l": 200.64, "t": 468.80313, "r": 206.51694, "b": 471.53915, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 130, "label": "text", "bbox": {"l": 264.29047, "t": 468.80313, "r": 266.25885, "b": 471.53915, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 142, "text": "5", "bbox": {"l": 264.29047, "t": 468.80313, "r": 266.25885, "b": 471.53915, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 131, "label": "text", "bbox": {"l": 306.37213, "t": 468.80313, "r": 308.34052, "b": 471.53915, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 143, "text": "1", "bbox": {"l": 306.37213, "t": 468.80313, "r": 308.34052, "b": 471.53915, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 132, "label": "text", "bbox": {"l": 345.51526, "t": 468.80313, "r": 347.48364, "b": 471.53915, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 144, "text": "2", "bbox": {"l": 345.51526, "t": 468.80313, "r": 347.48364, "b": 471.53915, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 133, "label": "text", "bbox": {"l": 356.55634, "t": 468.80313, "r": 358.52472, "b": 471.53915, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 145, "text": "4", "bbox": {"l": 356.55634, "t": 468.80313, "r": 358.52472, "b": 471.53915, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 134, "label": "text", "bbox": {"l": 367.62582, "t": 468.80313, "r": 369.59418, "b": 471.53915, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 146, "text": "1", "bbox": {"l": 367.62582, "t": 468.80313, "r": 369.59418, "b": 471.53915, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 135, "label": "text", "bbox": {"l": 382.66107, "t": 468.80313, "r": 384.62946, "b": 471.53915, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 147, "text": "1", "bbox": {"l": 382.66107, "t": 468.80313, "r": 384.62946, "b": 471.53915, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 136, "label": "text", "bbox": {"l": 200.64, "t": 473.68185, "r": 206.51694, "b": 476.41788, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 148, "text": "416", "bbox": {"l": 200.64, "t": 473.68185, "r": 206.51694, "b": 476.41788, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 137, "label": "text", "bbox": {"l": 264.29047, "t": 473.68185, "r": 266.25885, "b": 476.41788, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 149, "text": "4", "bbox": {"l": 264.29047, "t": 473.68185, "r": 266.25885, "b": 476.41788, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 138, "label": "text", "bbox": {"l": 200.64, "t": 478.53214, "r": 206.51694, "b": 481.26816, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 150, "text": "230", "bbox": {"l": 200.64, "t": 478.53214, "r": 206.51694, "b": 481.26816, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 139, "label": "text", "bbox": {"l": 243.26373, "t": 478.53214, "r": 245.2321, "b": 481.26816, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 151, "text": "1", "bbox": {"l": 243.26373, "t": 478.53214, "r": 245.2321, "b": 481.26816, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 140, "label": "text", "bbox": {"l": 264.29047, "t": 478.53214, "r": 266.25885, "b": 481.26816, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 152, "text": "9", "bbox": {"l": 264.29047, "t": 478.53214, "r": 266.25885, "b": 481.26816, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 141, "label": "text", "bbox": {"l": 323.40466, "t": 478.53214, "r": 325.37305, "b": 481.26816, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 153, "text": "1", "bbox": {"l": 323.40466, "t": 478.53214, "r": 325.37305, "b": 481.26816, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 142, "label": "text", "bbox": {"l": 397.72519, "t": 478.53214, "r": 399.69354, "b": 481.26816, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 154, "text": "1", "bbox": {"l": 397.72519, "t": 478.53214, "r": 399.69354, "b": 481.26816, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 143, "label": "text", "bbox": {"l": 200.64, "t": 483.41086, "r": 206.51694, "b": 486.14688, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 155, "text": "276", "bbox": {"l": 200.64, "t": 483.41086, "r": 206.51694, "b": 486.14688, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 144, "label": "text", "bbox": {"l": 382.66132, "t": 483.41086, "r": 384.61563, "b": 486.14688, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 156, "text": "2", "bbox": {"l": 382.66132, "t": 483.41086, "r": 384.61563, "b": 486.14688, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 145, "label": "text", "bbox": {"l": 397.72513, "t": 483.41086, "r": 401.64819, "b": 486.14688, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 157, "text": "12", "bbox": {"l": 397.72513, "t": 483.41086, "r": 401.64819, "b": 486.14688, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 146, "label": "text", "bbox": {"l": 412.78928, "t": 483.41086, "r": 414.74359, "b": 486.14688, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 158, "text": "1", "bbox": {"l": 412.78928, "t": 483.41086, "r": 414.74359, "b": 486.14688, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 147, "label": "text", "bbox": {"l": 200.64014, "t": 488.28958, "r": 207.14445, "b": 491.0256, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 159, "text": "320", "bbox": {"l": 200.64014, "t": 488.28958, "r": 207.14445, "b": 491.0256, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 148, "label": "text", "bbox": {"l": 367.62616, "t": 488.28958, "r": 369.78375, "b": 491.0256, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 160, "text": "1", "bbox": {"l": 367.62616, "t": 488.28958, "r": 369.78375, "b": 491.0256, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 149, "label": "text", "bbox": {"l": 382.66141, "t": 488.28958, "r": 384.81897, "b": 491.0256, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 161, "text": "4", "bbox": {"l": 382.66141, "t": 488.28958, "r": 384.81897, "b": 491.0256, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 150, "label": "text", "bbox": {"l": 397.7251, "t": 488.28958, "r": 402.05087, "b": 491.0256, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 162, "text": "20", "bbox": {"l": 397.7251, "t": 488.28958, "r": 402.05087, "b": 491.0256, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 151, "label": "text", "bbox": {"l": 200.64032, "t": 493.1683, "r": 208.48566, "b": 495.90433, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 163, "text": "2013", "bbox": {"l": 200.64032, "t": 493.1683, "r": 208.48566, "b": 495.90433, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 152, "label": "text", "bbox": {"l": 264.29044, "t": 493.1683, "r": 266.25879, "b": 495.90433, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 164, "text": "3", "bbox": {"l": 264.29044, "t": 493.1683, "r": 266.25879, "b": 495.90433, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "text", "id": 153, "page_no": 9, "cluster": {"id": 153, "label": "text", "bbox": {"l": 227.91466, "t": 665.82603, "r": 230.10028, "b": 675.3464, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 165, "text": "\u03bc", "bbox": {"l": 227.91466, "t": 665.82603, "r": 230.10028, "b": 675.3464, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u03bc"}, {"label": "text", "id": 154, "page_no": 9, "cluster": {"id": 154, "label": "text", "bbox": {"l": 300.58057, "t": 683.62195, "r": 302.72638, "b": 693.428658, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 166, "text": "\u2265", "bbox": {"l": 300.58057, "t": 683.62195, "r": 302.72638, "b": 693.428658, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u2265"}], "body": [{"label": "caption", "id": 4, "page_no": 9, "cluster": {"id": 4, "label": "caption", "bbox": {"l": 134.765, "t": 115.83618000000001, "r": 480.59357000000006, "b": 145.88666, "coord_origin": "TOPLEFT"}, "confidence": 0.9512290954589844, "cells": [{"id": 3, "text": "Table 2.", "bbox": {"l": 134.765, "t": 115.83618000000001, "r": 173.09366, "b": 123.76251000000002, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "TSR and cell detection results compared between OTSL and HTML on", "bbox": {"l": 181.30299, "t": 115.89899000000003, "r": 480.59151999999995, "b": 123.96868999999992, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "the PubTabNet [22], FinTabNet [21] and PubTables-1M [14] data sets using Table-", "bbox": {"l": 134.765, "t": 126.85797000000014, "r": 480.59357000000006, "b": 134.92767000000003, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Former [9] (with enc=6, dec=6, heads=8).", "bbox": {"l": 134.765, "t": 137.81696, "r": 305.95691, "b": 145.88666, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 2. TSR and cell detection results compared between OTSL and HTML on the PubTabNet [22], FinTabNet [21] and PubTables-1M [14] data sets using TableFormer [9] (with enc=6, dec=6, heads=8)."}, {"label": "table", "id": 0, "page_no": 9, "cluster": {"id": 0, "label": "table", "bbox": {"l": 143.6376495361328, "t": 156.3477020263672, "r": 470.8485412597656, "b": 263.2624816894531, "coord_origin": "TOPLEFT"}, "confidence": 0.9884640574455261, "cells": [{"id": 7, "text": "Data set", "bbox": {"l": 160.782, "t": 166.55895999999996, "r": 194.99779, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Language", "bbox": {"l": 215.52499000000003, "t": 166.534, "r": 254.04465, "b": 174.6037, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "TEDs", "bbox": {"l": 300.397, "t": 161.07898, "r": 323.99118, "b": 169.14868, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "mAP(0.75)", "bbox": {"l": 370.345, "t": 166.55895999999996, "r": 414.74661, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Inference", "bbox": {"l": 426.737, "t": 161.07898, "r": 463.10830999999996, "b": 169.14868, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "time (secs)", "bbox": {"l": 423.11401, "t": 172.03796, "r": 466.72656, "b": 180.10766999999998, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "simple", "bbox": {"l": 262.41299, "t": 174.03101000000004, "r": 288.0596, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "complex", "bbox": {"l": 296.42899, "t": 174.03101000000004, "r": 329.44687, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "all", "bbox": {"l": 345.03299, "t": 174.03101000000004, "r": 354.75793, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "PubTabNet", "bbox": {"l": 154.53799, "t": 192.85999000000004, "r": 201.24129, "b": 200.92969000000005, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "OTSL", "bbox": {"l": 222.43700000000004, "t": 187.38098000000002, "r": 247.13226000000003, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "0.965", "bbox": {"l": 264.74399, "t": 187.38098000000002, "r": 285.73074, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "0.934", "bbox": {"l": 302.444, "t": 187.38098000000002, "r": 323.43076, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "0.955", "bbox": {"l": 339.40302, "t": 187.38098000000002, "r": 360.38977, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "0.88", "bbox": {"l": 383.116, "t": 187.31817999999998, "r": 401.97324, "b": 195.24451, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "2.73", "bbox": {"l": 435.49300999999997, "t": 187.31817999999998, "r": 454.35025, "b": 195.24451, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "HTML", "bbox": {"l": 220.903, "t": 200.33196999999996, "r": 248.66655999999998, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "0.969", "bbox": {"l": 264.74399, "t": 200.33196999999996, "r": 285.73074, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "0.927", "bbox": {"l": 302.444, "t": 200.33196999999996, "r": 323.43076, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "0.955", "bbox": {"l": 339.40302, "t": 200.33196999999996, "r": 360.38977, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "0.857", "bbox": {"l": 382.052, "t": 200.33196999999996, "r": 403.03876, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "5.39", "bbox": {"l": 436.73199000000005, "t": 200.33196999999996, "r": 453.11182, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "FinTabNet", "bbox": {"l": 155.94501, "t": 219.16198999999995, "r": 199.83374, "b": 227.23168999999996, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "OTSL", "bbox": {"l": 222.43700000000004, "t": 213.68201, "r": 247.13226000000003, "b": 221.75171, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "0.955", "bbox": {"l": 264.74399, "t": 213.68201, "r": 285.73074, "b": 221.75171, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "0.961", "bbox": {"l": 302.444, "t": 213.68201, "r": 323.43076, "b": 221.75171, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "0.959", "bbox": {"l": 337.815, "t": 213.61919999999998, "r": 361.97586, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "0.862", "bbox": {"l": 380.46399, "t": 213.61919999999998, "r": 404.62485, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "1.85", "bbox": {"l": 435.49300999999997, "t": 213.61919999999998, "r": 454.35025, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "HTML", "bbox": {"l": 220.903, "t": 226.63396999999998, "r": 248.66655999999998, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "0.917", "bbox": {"l": 264.74399, "t": 226.63396999999998, "r": 285.73074, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "0.922", "bbox": {"l": 302.444, "t": 226.63396999999998, "r": 323.43076, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "0.92", "bbox": {"l": 341.70599, "t": 226.63396999999998, "r": 358.08582, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "0.722", "bbox": {"l": 382.052, "t": 226.63396999999998, "r": 403.03876, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "3.26", "bbox": {"l": 436.73199000000005, "t": 226.63396999999998, "r": 453.11182, "b": 234.70367, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "PubTables-1M", "bbox": {"l": 148.62601, "t": 245.46294999999998, "r": 207.1524, "b": 253.53265, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "OTSL", "bbox": {"l": 222.43700000000004, "t": 239.98297000000002, "r": 247.13226000000003, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "0.987", "bbox": {"l": 264.74399, "t": 239.98297000000002, "r": 285.73074, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "0.964", "bbox": {"l": 302.444, "t": 239.98297000000002, "r": 323.43076, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "0.977", "bbox": {"l": 337.815, "t": 239.92016999999998, "r": 361.97586, "b": 247.8465, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "0.896", "bbox": {"l": 380.46399, "t": 239.92016999999998, "r": 404.62485, "b": 247.8465, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "1.79", "bbox": {"l": 435.49300999999997, "t": 239.92016999999998, "r": 454.35025, "b": 247.8465, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "HTML", "bbox": {"l": 220.903, "t": 252.93499999999995, "r": 248.66655999999998, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "0.983", "bbox": {"l": 264.74399, "t": 252.93499999999995, "r": 285.73074, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "0.944", "bbox": {"l": 302.444, "t": 252.93499999999995, "r": 323.43076, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "0.966", "bbox": {"l": 339.40302, "t": 252.93499999999995, "r": 360.38977, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "0.889", "bbox": {"l": 382.052, "t": 252.93499999999995, "r": 403.03876, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "3.26", "bbox": {"l": 436.73199000000005, "t": 252.93499999999995, "r": 453.11182, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": [{"id": 8, "label": "text", "bbox": {"l": 160.782, "t": 166.55895999999996, "r": 194.99779, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "Data set", "bbox": {"l": 160.782, "t": 166.55895999999996, "r": 194.99779, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 215.52499000000003, "t": 166.534, "r": 254.04465, "b": 174.6037, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "Language", "bbox": {"l": 215.52499000000003, "t": 166.534, "r": 254.04465, "b": 174.6037, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "text", "bbox": {"l": 300.397, "t": 161.07898, "r": 323.99118, "b": 169.14868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "TEDs", "bbox": {"l": 300.397, "t": 161.07898, "r": 323.99118, "b": 169.14868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 370.345, "t": 166.55895999999996, "r": 414.74661, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "mAP(0.75)", "bbox": {"l": 370.345, "t": 166.55895999999996, "r": 414.74661, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 426.737, "t": 161.07898, "r": 463.10830999999996, "b": 169.14868, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "Inference", "bbox": {"l": 426.737, "t": 161.07898, "r": 463.10830999999996, "b": 169.14868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 423.11401, "t": 172.03796, "r": 466.72656, "b": 180.10766999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "time (secs)", "bbox": {"l": 423.11401, "t": 172.03796, "r": 466.72656, "b": 180.10766999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 262.41299, "t": 174.03101000000004, "r": 288.0596, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "simple", "bbox": {"l": 262.41299, "t": 174.03101000000004, "r": 288.0596, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 296.42899, "t": 174.03101000000004, "r": 329.44687, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "complex", "bbox": {"l": 296.42899, "t": 174.03101000000004, "r": 329.44687, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 345.03299, "t": 174.03101000000004, "r": 354.75793, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "all", "bbox": {"l": 345.03299, "t": 174.03101000000004, "r": 354.75793, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 154.53799, "t": 192.85999000000004, "r": 201.24129, "b": 200.92969000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "PubTabNet", "bbox": {"l": 154.53799, "t": 192.85999000000004, "r": 201.24129, "b": 200.92969000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 222.43700000000004, "t": 187.38098000000002, "r": 247.13226000000003, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "OTSL", "bbox": {"l": 222.43700000000004, "t": 187.38098000000002, "r": 247.13226000000003, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 264.74399, "t": 187.38098000000002, "r": 285.73074, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "0.965", "bbox": {"l": 264.74399, "t": 187.38098000000002, "r": 285.73074, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 302.444, "t": 187.38098000000002, "r": 323.43076, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "0.934", "bbox": {"l": 302.444, "t": 187.38098000000002, "r": 323.43076, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 339.40302, "t": 187.38098000000002, "r": 360.38977, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "0.955", "bbox": {"l": 339.40302, "t": 187.38098000000002, "r": 360.38977, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 383.116, "t": 187.31817999999998, "r": 401.97324, "b": 195.24451, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "0.88", "bbox": {"l": 383.116, "t": 187.31817999999998, "r": 401.97324, "b": 195.24451, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 435.49300999999997, "t": 187.31817999999998, "r": 454.35025, "b": 195.24451, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "2.73", "bbox": {"l": 435.49300999999997, "t": 187.31817999999998, "r": 454.35025, "b": 195.24451, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 220.903, "t": 200.33196999999996, "r": 248.66655999999998, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "HTML", "bbox": {"l": 220.903, "t": 200.33196999999996, "r": 248.66655999999998, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 264.74399, "t": 200.33196999999996, "r": 285.73074, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "0.969", "bbox": {"l": 264.74399, "t": 200.33196999999996, "r": 285.73074, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 302.444, "t": 200.33196999999996, "r": 323.43076, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "0.927", "bbox": {"l": 302.444, "t": 200.33196999999996, "r": 323.43076, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 339.40302, "t": 200.33196999999996, "r": 360.38977, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "0.955", "bbox": {"l": 339.40302, "t": 200.33196999999996, "r": 360.38977, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 382.052, "t": 200.33196999999996, "r": 403.03876, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "0.857", "bbox": {"l": 382.052, "t": 200.33196999999996, "r": 403.03876, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 436.73199000000005, "t": 200.33196999999996, "r": 453.11182, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "5.39", "bbox": {"l": 436.73199000000005, "t": 200.33196999999996, "r": 453.11182, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 155.94501, "t": 219.16198999999995, "r": 199.83374, "b": 227.23168999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "FinTabNet", "bbox": {"l": 155.94501, "t": 219.16198999999995, "r": 199.83374, "b": 227.23168999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 222.43700000000004, "t": 213.68201, "r": 247.13226000000003, "b": 221.75171, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "OTSL", "bbox": {"l": 222.43700000000004, "t": 213.68201, "r": 247.13226000000003, "b": 221.75171, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 264.74399, "t": 213.68201, "r": 285.73074, "b": 221.75171, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "0.955", "bbox": {"l": 264.74399, "t": 213.68201, "r": 285.73074, "b": 221.75171, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 302.444, "t": 213.68201, "r": 323.43076, "b": 221.75171, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "0.961", "bbox": {"l": 302.444, "t": 213.68201, "r": 323.43076, "b": 221.75171, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 337.815, "t": 213.61919999999998, "r": 361.97586, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "0.959", "bbox": {"l": 337.815, "t": 213.61919999999998, "r": 361.97586, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 380.46399, "t": 213.61919999999998, "r": 404.62485, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "0.862", "bbox": {"l": 380.46399, "t": 213.61919999999998, "r": 404.62485, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 435.49300999999997, "t": 213.61919999999998, "r": 454.35025, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "1.85", "bbox": {"l": 435.49300999999997, "t": 213.61919999999998, "r": 454.35025, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 220.903, "t": 226.63396999999998, "r": 248.66655999999998, "b": 234.70367, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "HTML", "bbox": {"l": 220.903, "t": 226.63396999999998, "r": 248.66655999999998, "b": 234.70367, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 264.74399, "t": 226.63396999999998, "r": 285.73074, "b": 234.70367, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "0.917", "bbox": {"l": 264.74399, "t": 226.63396999999998, "r": 285.73074, "b": 234.70367, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 302.444, "t": 226.63396999999998, "r": 323.43076, "b": 234.70367, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "0.922", "bbox": {"l": 302.444, "t": 226.63396999999998, "r": 323.43076, "b": 234.70367, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 341.70599, "t": 226.63396999999998, "r": 358.08582, "b": 234.70367, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "0.92", "bbox": {"l": 341.70599, "t": 226.63396999999998, "r": 358.08582, "b": 234.70367, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 382.052, "t": 226.63396999999998, "r": 403.03876, "b": 234.70367, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "0.722", "bbox": {"l": 382.052, "t": 226.63396999999998, "r": 403.03876, "b": 234.70367, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 436.73199000000005, "t": 226.63396999999998, "r": 453.11182, "b": 234.70367, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "3.26", "bbox": {"l": 436.73199000000005, "t": 226.63396999999998, "r": 453.11182, "b": 234.70367, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 148.62601, "t": 245.46294999999998, "r": 207.1524, "b": 253.53265, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "PubTables-1M", "bbox": {"l": 148.62601, "t": 245.46294999999998, "r": 207.1524, "b": 253.53265, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 222.43700000000004, "t": 239.98297000000002, "r": 247.13226000000003, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "OTSL", "bbox": {"l": 222.43700000000004, "t": 239.98297000000002, "r": 247.13226000000003, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 264.74399, "t": 239.98297000000002, "r": 285.73074, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "0.987", "bbox": {"l": 264.74399, "t": 239.98297000000002, "r": 285.73074, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 302.444, "t": 239.98297000000002, "r": 323.43076, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "0.964", "bbox": {"l": 302.444, "t": 239.98297000000002, "r": 323.43076, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 337.815, "t": 239.92016999999998, "r": 361.97586, "b": 247.8465, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "0.977", "bbox": {"l": 337.815, "t": 239.92016999999998, "r": 361.97586, "b": 247.8465, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 380.46399, "t": 239.92016999999998, "r": 404.62485, "b": 247.8465, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "0.896", "bbox": {"l": 380.46399, "t": 239.92016999999998, "r": 404.62485, "b": 247.8465, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 435.49300999999997, "t": 239.92016999999998, "r": 454.35025, "b": 247.8465, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "1.79", "bbox": {"l": 435.49300999999997, "t": 239.92016999999998, "r": 454.35025, "b": 247.8465, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 220.903, "t": 252.93499999999995, "r": 248.66655999999998, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "HTML", "bbox": {"l": 220.903, "t": 252.93499999999995, "r": 248.66655999999998, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 264.74399, "t": 252.93499999999995, "r": 285.73074, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "0.983", "bbox": {"l": 264.74399, "t": 252.93499999999995, "r": 285.73074, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 302.444, "t": 252.93499999999995, "r": 323.43076, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "0.944", "bbox": {"l": 302.444, "t": 252.93499999999995, "r": 323.43076, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 339.40302, "t": 252.93499999999995, "r": 360.38977, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "0.966", "bbox": {"l": 339.40302, "t": 252.93499999999995, "r": 360.38977, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 382.052, "t": 252.93499999999995, "r": 403.03876, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "0.889", "bbox": {"l": 382.052, "t": 252.93499999999995, "r": 403.03876, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 436.73199000000005, "t": 252.93499999999995, "r": 453.11182, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "3.26", "bbox": {"l": 436.73199000000005, "t": 252.93499999999995, "r": 453.11182, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "lcel", "lcel", "ched", "ched", "nl", "ched", "ucel", "ched", "ched", "ched", "ucel", "ucel", "nl", "rhed", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "ucel", "rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl"], "num_rows": 8, "num_cols": 7, "table_cells": [{"bbox": {"l": 215.52499000000003, "t": 166.534, "r": 254.04465, "b": 174.6037, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Language", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 300.397, "t": 161.07898, "r": 323.99118, "b": 169.14868, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 3, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 5, "text": "TEDs", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 370.345, "t": 166.55895999999996, "r": 414.74661, "b": 174.62865999999997, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 2, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "mAP(0.75)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 423.11401, "t": 161.07898, "r": 466.72656, "b": 180.10766999999998, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 2, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "Inference time (secs)", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 262.41299, "t": 174.03101000000004, "r": 288.0596, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "simple", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 296.42899, "t": 174.03101000000004, "r": 329.44687, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "complex", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 345.03299, "t": 174.03101000000004, "r": 354.75793, "b": 182.10071000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "all", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 154.53799, "t": 192.85999000000004, "r": 201.24129, "b": 200.92969000000005, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PubTabNet", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 222.43700000000004, "t": 187.38098000000002, "r": 247.13226000000003, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "OTSL", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 264.74399, "t": 187.38098000000002, "r": 285.73074, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.965", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 302.444, "t": 187.38098000000002, "r": 323.43076, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.934", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 339.40302, "t": 187.38098000000002, "r": 360.38977, "b": 195.45068000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.955", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 383.116, "t": 187.31817999999998, "r": 401.97324, "b": 195.24451, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.88", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 435.49300999999997, "t": 187.31817999999998, "r": 454.35025, "b": 195.24451, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "2.73", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 220.903, "t": 200.33196999999996, "r": 248.66655999999998, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "HTML", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 264.74399, "t": 200.33196999999996, "r": 285.73074, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.969", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 302.444, "t": 200.33196999999996, "r": 323.43076, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.927", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 339.40302, "t": 200.33196999999996, "r": 360.38977, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.955", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 382.052, "t": 200.33196999999996, "r": 403.03876, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.857", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 436.73199000000005, "t": 200.33196999999996, "r": 453.11182, "b": 208.40166999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "5.39", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 155.94501, "t": 219.16198999999995, "r": 199.83374, "b": 227.23168999999996, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "FinTabNet", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 222.43700000000004, "t": 213.68201, "r": 247.13226000000003, "b": 221.75171, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "OTSL", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 264.74399, "t": 213.68201, "r": 285.73074, "b": 221.75171, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.955", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 302.444, "t": 213.68201, "r": 323.43076, "b": 221.75171, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.961", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 337.815, "t": 213.61919999999998, "r": 361.97586, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.959", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 380.46399, "t": 213.61919999999998, "r": 404.62485, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.862", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 435.49300999999997, "t": 213.61919999999998, "r": 454.35025, "b": 221.54552999999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "1.85", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 220.903, "t": 226.63396999999998, "r": 248.66655999999998, "b": 234.70367, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "HTML", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 264.74399, "t": 226.63396999999998, "r": 285.73074, "b": 234.70367, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.917", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 302.444, "t": 226.63396999999998, "r": 323.43076, "b": 234.70367, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.922", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 341.70599, "t": 226.63396999999998, "r": 358.08582, "b": 234.70367, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.92", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 382.052, "t": 226.63396999999998, "r": 403.03876, "b": 234.70367, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.722", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 436.73199000000005, "t": 226.63396999999998, "r": 453.11182, "b": 234.70367, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "3.26", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 148.62601, "t": 245.46294999999998, "r": 207.1524, "b": 253.53265, "coord_origin": "TOPLEFT"}, "row_span": 2, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PubTables-1M", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 222.43700000000004, "t": 239.98297000000002, "r": 247.13226000000003, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "OTSL", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 264.74399, "t": 239.98297000000002, "r": 285.73074, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.987", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 302.444, "t": 239.98297000000002, "r": 323.43076, "b": 248.05267000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.964", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 337.815, "t": 239.92016999999998, "r": 361.97586, "b": 247.8465, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.977", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 380.46399, "t": 239.92016999999998, "r": 404.62485, "b": 247.8465, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.896", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 435.49300999999997, "t": 239.92016999999998, "r": 454.35025, "b": 247.8465, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "1.79", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 220.903, "t": 252.93499999999995, "r": 248.66655999999998, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "HTML", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 264.74399, "t": 252.93499999999995, "r": 285.73074, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "0.983", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 302.444, "t": 252.93499999999995, "r": 323.43076, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "0.944", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 339.40302, "t": 252.93499999999995, "r": 360.38977, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "0.966", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 382.052, "t": 252.93499999999995, "r": 403.03876, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "0.889", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 436.73199000000005, "t": 252.93499999999995, "r": 453.11182, "b": 261.00469999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 6, "end_col_offset_idx": 7, "text": "3.26", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "section_header", "id": 3, "page_no": 9, "cluster": {"id": 3, "label": "section_header", "bbox": {"l": 134.765, "t": 288.91479, "r": 257.08679, "b": 297.72173999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9546447992324829, "cells": [{"id": 55, "text": "5.3", "bbox": {"l": 134.765, "t": 288.91479, "r": 149.40205, "b": 297.72173999999995, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Qualitative Results", "bbox": {"l": 160.85904, "t": 288.91479, "r": 257.08679, "b": 297.72173999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5.3 Qualitative Results"}, {"label": "text", "id": 1, "page_no": 9, "cluster": {"id": 1, "label": "text", "bbox": {"l": 134.765, "t": 309.86078, "r": 480.58981, "b": 366.47769, "coord_origin": "TOPLEFT"}, "confidence": 0.9834085702896118, "cells": [{"id": 57, "text": "To illustrate the qualitative differences between OTSL and HTML, Figure 5", "bbox": {"l": 134.765, "t": 309.86078, "r": 480.58777, "b": 318.65775, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "demonstrates less overlap and more accurate bounding boxes with OTSL. In", "bbox": {"l": 134.765, "t": 321.81577, "r": 480.58889999999997, "b": 330.61273, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Figure 6, OTSL proves to be more effective in handling tables with longer to-", "bbox": {"l": 134.765, "t": 333.77075, "r": 480.58681999999993, "b": 342.56772, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "ken sequences, resulting in even more precise structure prediction and bounding", "bbox": {"l": 134.765, "t": 345.72574, "r": 480.58981, "b": 354.52271, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "boxes.", "bbox": {"l": 134.765, "t": 357.68073, "r": 161.65704, "b": 366.47769, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "To illustrate the qualitative differences between OTSL and HTML, Figure 5 demonstrates less overlap and more accurate bounding boxes with OTSL. In Figure 6, OTSL proves to be more effective in handling tables with longer token sequences, resulting in even more precise structure prediction and bounding boxes."}, {"label": "caption", "id": 5, "page_no": 9, "cluster": {"id": 5, "label": "caption", "bbox": {"l": 134.765, "t": 397.59012, "r": 480.59106, "b": 439.71716, "coord_origin": "TOPLEFT"}, "confidence": 0.9482728838920593, "cells": [{"id": 62, "text": "Fig. 5.", "bbox": {"l": 134.765, "t": 397.59012, "r": 162.64424, "b": 405.51642, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "The OTSL model produces more accurate bounding boxes with less over-", "bbox": {"l": 167.384, "t": 397.65289, "r": 480.59106, "b": 405.72266, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "lap (E) than the HTML model (D), when predicting the structure of a sparse ta-", "bbox": {"l": 134.765, "t": 408.61190999999997, "r": 480.59106, "b": 416.68167000000005, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "ble (A), at twice the inference speed because of shorter sequence length (B),(C).", "bbox": {"l": 134.765, "t": 419.57089, "r": 480.58838000000003, "b": 427.64066, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "\"PMC2807444_006_00.png\" PubTabNet.", "bbox": {"l": 134.765, "t": 430.52987999999993, "r": 304.69171, "b": 438.59964, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "\u03bc", "bbox": {"l": 342.63354, "t": 430.19678, "r": 344.81915, "b": 439.71716, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Fig. 5. The OTSL model produces more accurate bounding boxes with less overlap (E) than the HTML model (D), when predicting the structure of a sparse table (A), at twice the inference speed because of shorter sequence length (B),(C). \"PMC2807444_006_00.png\" PubTabNet. \u03bc"}, {"label": "picture", "id": 2, "page_no": 9, "cluster": {"id": 2, "label": "picture", "bbox": {"l": 162.67430114746094, "t": 444.62255859375, "r": 451.70062255859375, "b": 663.2135620117188, "coord_origin": "TOPLEFT"}, "confidence": 0.9742383360862732, "cells": [{"id": 67, "text": "<table>", "bbox": {"l": 180.12473, "t": 516.2332200000001, "r": 190.62042, "b": 518.94992, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "<tr><td></td><td colspan=\"4\"></td><td colspan=\"6\"></td><td colspan=\"3\"></td></tr>", "bbox": {"l": 183.2438, "t": 520.13208, "r": 304.54797, "b": 522.84879, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 524.03094, "r": 388.42313, "b": 526.74765, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 527.9297799999999, "r": 388.42313, "b": 530.64648, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 531.82861, "r": 388.42313, "b": 534.54532, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 535.72748, "r": 388.42313, "b": 538.44418, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 539.62631, "r": 388.42313, "b": 542.34303, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 543.52516, "r": 388.42313, "b": 546.24188, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 547.42401, "r": 388.42313, "b": 550.14073, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 551.32286, "r": 388.42313, "b": 554.03958, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "</table>", "bbox": {"l": 180.12473, "t": 555.22173, "r": 191.86806, "b": 557.93845, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "C", "bbox": {"l": 407.38348, "t": 518.30042, "r": 408.82025, "b": 521.01712, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "C L L L C L L L L L C L L NL", "bbox": {"l": 410.25699, "t": 518.30042, "r": 450.48605, "b": 521.01712, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "C", "bbox": {"l": 407.38348, "t": 522.19925, "r": 408.82025, "b": 524.9159500000001, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 522.19925, "r": 450.48605, "b": 524.9159500000001, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "C", "bbox": {"l": 407.38348, "t": 526.09808, "r": 408.82025, "b": 528.81479, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 526.09808, "r": 450.48605, "b": 528.81479, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "C", "bbox": {"l": 407.38348, "t": 529.99695, "r": 408.82025, "b": 532.7136499999999, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 529.99695, "r": 450.48605, "b": 532.7136499999999, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "C", "bbox": {"l": 407.38348, "t": 533.8957800000001, "r": 408.82025, "b": 536.6125, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 533.8957800000001, "r": 450.48605, "b": 536.6125, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "C", "bbox": {"l": 407.38348, "t": 537.79463, "r": 408.82025, "b": 540.51135, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 537.79463, "r": 450.48605, "b": 540.51135, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "C", "bbox": {"l": 407.38348, "t": 541.69348, "r": 408.82025, "b": 544.4102, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 541.69348, "r": 450.48605, "b": 544.4102, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "C", "bbox": {"l": 407.38348, "t": 545.59233, "r": 408.82025, "b": 548.3090500000001, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 545.59233, "r": 450.48605, "b": 548.3090500000001, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "C", "bbox": {"l": 407.38348, "t": 549.4911999999999, "r": 408.82025, "b": 552.2079200000001, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 549.4911999999999, "r": 450.48605, "b": 552.2079200000001, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "HTML", "bbox": {"l": 164.52881, "t": 509.45859, "r": 181.8528, "b": 515.31, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "#", "bbox": {"l": 183.58441, "t": 509.45859, "r": 186.3974, "b": 515.31, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "tokens:", "bbox": {"l": 189.2104, "t": 509.45859, "r": 208.90137, "b": 515.31, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "258", "bbox": {"l": 210.63269, "t": 509.45859, "r": 221.04044, "b": 515.31, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "OTSL", "bbox": {"l": 390.20203, "t": 509.60361, "r": 406.83609, "b": 515.45502, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "#", "bbox": {"l": 408.56952, "t": 509.60361, "r": 411.38251, "b": 515.45502, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "tokens:", "bbox": {"l": 414.1955, "t": 509.60361, "r": 433.88647000000003, "b": 515.45502, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "135", "bbox": {"l": 435.61737, "t": 509.60361, "r": 446.02512, "b": 515.45502, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "B", "bbox": {"l": 167.19316, "t": 519.07236, "r": 172.8231, "b": 526.3866, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "A", "bbox": {"l": 187.33745, "t": 448.62485, "r": 192.96739, "b": 455.93909, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "D", "bbox": {"l": 167.38654, "t": 566.0051599999999, "r": 173.01648, "b": 573.3194, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "E", "bbox": {"l": 248.45621000000003, "t": 621.78008, "r": 253.65727, "b": 629.09431, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "C", "bbox": {"l": 395.90057, "t": 519.19946, "r": 401.53052, "b": 526.5137, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "HTML", "bbox": {"l": 171.62886, "t": 580.28853, "r": 177.48148, "b": 597.26784, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "OTSL", "bbox": {"l": 251.05969000000002, "t": 633.63408, "r": 256.91235, "b": 649.92345, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "HTML model shows", "bbox": {"l": 372.14645, "t": 601.45724, "r": 427.0379, "b": 607.30864, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "bounding box drifting", "bbox": {"l": 372.14645, "t": 607.89948, "r": 430.06838999999997, "b": 613.75087, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "OTSL model shows", "bbox": {"l": 176.88042, "t": 642.87209, "r": 231.08191, "b": 648.72348, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "clean bounding box", "bbox": {"l": 176.88042, "t": 649.3143, "r": 230.99271000000002, "b": 655.1657, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "alignment", "bbox": {"l": 176.88042, "t": 655.7565500000001, "r": 203.93219, "b": 661.60794, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "\u2264", "bbox": {"l": 215.93231000000003, "t": 557.56342, "r": 218.4697, "b": 569.15967, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "\u03bc", "bbox": {"l": 229.05689999999998, "t": 557.56342, "r": 231.71908999999997, "b": 569.15967, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "S", "bbox": {"l": 261.20892, "t": 448.46124, "r": 263.56973, "b": 451.19727, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "I", "bbox": {"l": 312.33463, "t": 448.46124, "r": 313.6362, "b": 451.19727, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "R", "bbox": {"l": 377.41125, "t": 448.46124, "r": 380.05737, "b": 451.19727, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "ST", "bbox": {"l": 200.63976, "t": 453.33997, "r": 205.82492, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": "0.03", "bbox": {"l": 222.20833000000002, "t": 453.33997, "r": 229.76836, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "0.06", "bbox": {"l": 243.26666, "t": 453.33997, "r": 250.82669, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "0.12", "bbox": {"l": 264.29657, "t": 453.33997, "r": 271.84949, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "0.25", "bbox": {"l": 285.31943, "t": 453.33997, "r": 292.87946, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "0.5", "bbox": {"l": 306.37775, "t": 453.33997, "r": 311.77319, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "1", "bbox": {"l": 323.41699, "t": 453.33997, "r": 325.58157, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "2", "bbox": {"l": 334.45807, "t": 453.33997, "r": 336.62265, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "4", "bbox": {"l": 345.52756, "t": 453.33997, "r": 347.69214, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "8", "bbox": {"l": 356.56863, "t": 453.33997, "r": 358.73322, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "16", "bbox": {"l": 367.63812, "t": 453.33997, "r": 371.97089, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": "32", "bbox": {"l": 382.6734, "t": 453.33997, "r": 387.00616, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": "64", "bbox": {"l": 397.73727, "t": 453.33997, "r": 402.07001, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "\u2265", "bbox": {"l": 412.78879, "t": 447.99298, "r": 414.93463, "b": 457.79964999999993, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": " 128", "bbox": {"l": 414.95697, "t": 453.33997, "r": 422.51746, "b": 456.07599, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "63", "bbox": {"l": 200.63998, "t": 463.92444, "r": 204.57674, "b": 466.66043, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "1", "bbox": {"l": 367.62604, "t": 463.92444, "r": 369.58032, "b": 466.66043, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "1", "bbox": {"l": 382.66132, "t": 463.92444, "r": 384.6156, "b": 466.66043, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "3", "bbox": {"l": 397.72504, "t": 463.92444, "r": 399.67932, "b": 466.66043, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": "199", "bbox": {"l": 200.64, "t": 468.80313, "r": 206.51694, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "5", "bbox": {"l": 264.29047, "t": 468.80313, "r": 266.25885, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "1", "bbox": {"l": 306.37213, "t": 468.80313, "r": 308.34052, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": "2", "bbox": {"l": 345.51526, "t": 468.80313, "r": 347.48364, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "4", "bbox": {"l": 356.55634, "t": 468.80313, "r": 358.52472, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "1", "bbox": {"l": 367.62582, "t": 468.80313, "r": 369.59418, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "1", "bbox": {"l": 382.66107, "t": 468.80313, "r": 384.62946, "b": 471.53915, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": "416", "bbox": {"l": 200.64, "t": 473.68185, "r": 206.51694, "b": 476.41788, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "4", "bbox": {"l": 264.29047, "t": 473.68185, "r": 266.25885, "b": 476.41788, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "230", "bbox": {"l": 200.64, "t": 478.53214, "r": 206.51694, "b": 481.26816, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "1", "bbox": {"l": 243.26373, "t": 478.53214, "r": 245.2321, "b": 481.26816, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "9", "bbox": {"l": 264.29047, "t": 478.53214, "r": 266.25885, "b": 481.26816, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "1", "bbox": {"l": 323.40466, "t": 478.53214, "r": 325.37305, "b": 481.26816, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "1", "bbox": {"l": 397.72519, "t": 478.53214, "r": 399.69354, "b": 481.26816, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "276", "bbox": {"l": 200.64, "t": 483.41086, "r": 206.51694, "b": 486.14688, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": "2", "bbox": {"l": 382.66132, "t": 483.41086, "r": 384.61563, "b": 486.14688, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "12", "bbox": {"l": 397.72513, "t": 483.41086, "r": 401.64819, "b": 486.14688, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "1", "bbox": {"l": 412.78928, "t": 483.41086, "r": 414.74359, "b": 486.14688, "coord_origin": "TOPLEFT"}}, {"id": 159, "text": "320", "bbox": {"l": 200.64014, "t": 488.28958, "r": 207.14445, "b": 491.0256, "coord_origin": "TOPLEFT"}}, {"id": 160, "text": "1", "bbox": {"l": 367.62616, "t": 488.28958, "r": 369.78375, "b": 491.0256, "coord_origin": "TOPLEFT"}}, {"id": 161, "text": "4", "bbox": {"l": 382.66141, "t": 488.28958, "r": 384.81897, "b": 491.0256, "coord_origin": "TOPLEFT"}}, {"id": 162, "text": "20", "bbox": {"l": 397.7251, "t": 488.28958, "r": 402.05087, "b": 491.0256, "coord_origin": "TOPLEFT"}}, {"id": 163, "text": "2013", "bbox": {"l": 200.64032, "t": 493.1683, "r": 208.48566, "b": 495.90433, "coord_origin": "TOPLEFT"}}, {"id": 164, "text": "3", "bbox": {"l": 264.29044, "t": 493.1683, "r": 266.25879, "b": 495.90433, "coord_origin": "TOPLEFT"}}], "children": [{"id": 56, "label": "text", "bbox": {"l": 180.12473, "t": 516.2332200000001, "r": 190.62042, "b": 518.94992, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "<table>", "bbox": {"l": 180.12473, "t": 516.2332200000001, "r": 190.62042, "b": 518.94992, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 183.2438, "t": 520.13208, "r": 304.54797, "b": 522.84879, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "<tr><td></td><td colspan=\"4\"></td><td colspan=\"6\"></td><td colspan=\"3\"></td></tr>", "bbox": {"l": 183.2438, "t": 520.13208, "r": 304.54797, "b": 522.84879, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 183.2438, "t": 524.03094, "r": 388.42313, "b": 526.74765, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 524.03094, "r": 388.42313, "b": 526.74765, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 183.2438, "t": 527.9297799999999, "r": 388.42313, "b": 530.64648, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 527.9297799999999, "r": 388.42313, "b": 530.64648, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 183.2438, "t": 531.82861, "r": 388.42313, "b": 534.54532, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 531.82861, "r": 388.42313, "b": 534.54532, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 183.2438, "t": 535.72748, "r": 388.42313, "b": 538.44418, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 535.72748, "r": 388.42313, "b": 538.44418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 183.2438, "t": 539.62631, "r": 388.42313, "b": 542.34303, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 539.62631, "r": 388.42313, "b": 542.34303, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 183.2438, "t": 543.52516, "r": 388.42313, "b": 546.24188, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 543.52516, "r": 388.42313, "b": 546.24188, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 183.2438, "t": 547.42401, "r": 388.42313, "b": 550.14073, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 547.42401, "r": 388.42313, "b": 550.14073, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 183.2438, "t": 551.32286, "r": 388.42313, "b": 554.03958, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "<tr><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td><td></td></tr>", "bbox": {"l": 183.2438, "t": 551.32286, "r": 388.42313, "b": 554.03958, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 180.12473, "t": 555.22173, "r": 191.86806, "b": 557.93845, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "</table>", "bbox": {"l": 180.12473, "t": 555.22173, "r": 191.86806, "b": 557.93845, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 407.38348, "t": 518.30042, "r": 408.82025, "b": 521.01712, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "C", "bbox": {"l": 407.38348, "t": 518.30042, "r": 408.82025, "b": 521.01712, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 410.25699, "t": 518.30042, "r": 450.48605, "b": 521.01712, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "C L L L C L L L L L C L L NL", "bbox": {"l": 410.25699, "t": 518.30042, "r": 450.48605, "b": 521.01712, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 407.38348, "t": 522.19925, "r": 408.82025, "b": 524.9159500000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "C", "bbox": {"l": 407.38348, "t": 522.19925, "r": 408.82025, "b": 524.9159500000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 410.25699, "t": 522.19925, "r": 450.48605, "b": 524.9159500000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 522.19925, "r": 450.48605, "b": 524.9159500000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 407.38348, "t": 526.09808, "r": 408.82025, "b": 528.81479, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "C", "bbox": {"l": 407.38348, "t": 526.09808, "r": 408.82025, "b": 528.81479, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 410.25699, "t": 526.09808, "r": 450.48605, "b": 528.81479, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 526.09808, "r": 450.48605, "b": 528.81479, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 407.38348, "t": 529.99695, "r": 408.82025, "b": 532.7136499999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "C", "bbox": {"l": 407.38348, "t": 529.99695, "r": 408.82025, "b": 532.7136499999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 410.25699, "t": 529.99695, "r": 450.48605, "b": 532.7136499999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 529.99695, "r": 450.48605, "b": 532.7136499999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 407.38348, "t": 533.8957800000001, "r": 408.82025, "b": 536.6125, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "C", "bbox": {"l": 407.38348, "t": 533.8957800000001, "r": 408.82025, "b": 536.6125, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 410.25699, "t": 533.8957800000001, "r": 450.48605, "b": 536.6125, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 533.8957800000001, "r": 450.48605, "b": 536.6125, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 407.38348, "t": 537.79463, "r": 408.82025, "b": 540.51135, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "C", "bbox": {"l": 407.38348, "t": 537.79463, "r": 408.82025, "b": 540.51135, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 410.25699, "t": 537.79463, "r": 450.48605, "b": 540.51135, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 537.79463, "r": 450.48605, "b": 540.51135, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 407.38348, "t": 541.69348, "r": 408.82025, "b": 544.4102, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "C", "bbox": {"l": 407.38348, "t": 541.69348, "r": 408.82025, "b": 544.4102, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 410.25699, "t": 541.69348, "r": 450.48605, "b": 544.4102, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 541.69348, "r": 450.48605, "b": 544.4102, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 407.38348, "t": 545.59233, "r": 408.82025, "b": 548.3090500000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "C", "bbox": {"l": 407.38348, "t": 545.59233, "r": 408.82025, "b": 548.3090500000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 410.25699, "t": 545.59233, "r": 450.48605, "b": 548.3090500000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 545.59233, "r": 450.48605, "b": 548.3090500000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 407.38348, "t": 549.4911999999999, "r": 408.82025, "b": 552.2079200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "C", "bbox": {"l": 407.38348, "t": 549.4911999999999, "r": 408.82025, "b": 552.2079200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 410.25699, "t": 549.4911999999999, "r": 450.48605, "b": 552.2079200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "C C C C C C C C C C C C C NL", "bbox": {"l": 410.25699, "t": 549.4911999999999, "r": 450.48605, "b": 552.2079200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 164.52881, "t": 509.45859, "r": 181.8528, "b": 515.31, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "HTML", "bbox": {"l": 164.52881, "t": 509.45859, "r": 181.8528, "b": 515.31, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 183.58441, "t": 509.45859, "r": 186.3974, "b": 515.31, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": "#", "bbox": {"l": 183.58441, "t": 509.45859, "r": 186.3974, "b": 515.31, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 189.2104, "t": 509.45859, "r": 208.90137, "b": 515.31, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "tokens:", "bbox": {"l": 189.2104, "t": 509.45859, "r": 208.90137, "b": 515.31, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 210.63269, "t": 509.45859, "r": 221.04044, "b": 515.31, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "258", "bbox": {"l": 210.63269, "t": 509.45859, "r": 221.04044, "b": 515.31, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 390.20203, "t": 509.60361, "r": 406.83609, "b": 515.45502, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "OTSL", "bbox": {"l": 390.20203, "t": 509.60361, "r": 406.83609, "b": 515.45502, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 408.56952, "t": 509.60361, "r": 411.38251, "b": 515.45502, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "#", "bbox": {"l": 408.56952, "t": 509.60361, "r": 411.38251, "b": 515.45502, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 414.1955, "t": 509.60361, "r": 433.88647000000003, "b": 515.45502, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "tokens:", "bbox": {"l": 414.1955, "t": 509.60361, "r": 433.88647000000003, "b": 515.45502, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 435.61737, "t": 509.60361, "r": 446.02512, "b": 515.45502, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": "135", "bbox": {"l": 435.61737, "t": 509.60361, "r": 446.02512, "b": 515.45502, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 167.19316, "t": 519.07236, "r": 172.8231, "b": 526.3866, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "B", "bbox": {"l": 167.19316, "t": 519.07236, "r": 172.8231, "b": 526.3866, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 187.33745, "t": 448.62485, "r": 192.96739, "b": 455.93909, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "A", "bbox": {"l": 187.33745, "t": 448.62485, "r": 192.96739, "b": 455.93909, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 167.38654, "t": 566.0051599999999, "r": 173.01648, "b": 573.3194, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": "D", "bbox": {"l": 167.38654, "t": 566.0051599999999, "r": 173.01648, "b": 573.3194, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 248.45621000000003, "t": 621.78008, "r": 253.65727, "b": 629.09431, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 107, "text": "E", "bbox": {"l": 248.45621000000003, "t": 621.78008, "r": 253.65727, "b": 629.09431, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 395.90057, "t": 519.19946, "r": 401.53052, "b": 526.5137, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 108, "text": "C", "bbox": {"l": 395.90057, "t": 519.19946, "r": 401.53052, "b": 526.5137, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 171.62886, "t": 580.28853, "r": 177.48148, "b": 597.26784, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 109, "text": "HTML", "bbox": {"l": 171.62886, "t": 580.28853, "r": 177.48148, "b": 597.26784, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 251.05969000000002, "t": 633.63408, "r": 256.91235, "b": 649.92345, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 110, "text": "OTSL", "bbox": {"l": 251.05969000000002, "t": 633.63408, "r": 256.91235, "b": 649.92345, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 372.14645, "t": 601.45724, "r": 427.0379, "b": 607.30864, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 111, "text": "HTML model shows", "bbox": {"l": 372.14645, "t": 601.45724, "r": 427.0379, "b": 607.30864, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 372.14645, "t": 607.89948, "r": 430.06838999999997, "b": 613.75087, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 112, "text": "bounding box drifting", "bbox": {"l": 372.14645, "t": 607.89948, "r": 430.06838999999997, "b": 613.75087, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 176.88042, "t": 642.87209, "r": 231.08191, "b": 648.72348, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 113, "text": "OTSL model shows", "bbox": {"l": 176.88042, "t": 642.87209, "r": 231.08191, "b": 648.72348, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 176.88042, "t": 649.3143, "r": 230.99271000000002, "b": 655.1657, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 114, "text": "clean bounding box", "bbox": {"l": 176.88042, "t": 649.3143, "r": 230.99271000000002, "b": 655.1657, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 176.88042, "t": 655.7565500000001, "r": 203.93219, "b": 661.60794, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 115, "text": "alignment", "bbox": {"l": 176.88042, "t": 655.7565500000001, "r": 203.93219, "b": 661.60794, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 215.93231000000003, "t": 557.56342, "r": 218.4697, "b": 569.15967, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 116, "text": "\u2264", "bbox": {"l": 215.93231000000003, "t": 557.56342, "r": 218.4697, "b": 569.15967, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 229.05689999999998, "t": 557.56342, "r": 231.71908999999997, "b": 569.15967, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 117, "text": "\u03bc", "bbox": {"l": 229.05689999999998, "t": 557.56342, "r": 231.71908999999997, "b": 569.15967, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 261.20892, "t": 448.46124, "r": 263.56973, "b": 451.19727, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 119, "text": "S", "bbox": {"l": 261.20892, "t": 448.46124, "r": 263.56973, "b": 451.19727, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 312.33463, "t": 448.46124, "r": 313.6362, "b": 451.19727, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 120, "text": "I", "bbox": {"l": 312.33463, "t": 448.46124, "r": 313.6362, "b": 451.19727, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 377.41125, "t": 448.46124, "r": 380.05737, "b": 451.19727, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 121, "text": "R", "bbox": {"l": 377.41125, "t": 448.46124, "r": 380.05737, "b": 451.19727, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 200.63976, "t": 453.33997, "r": 205.82492, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 122, "text": "ST", "bbox": {"l": 200.63976, "t": 453.33997, "r": 205.82492, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 222.20833000000002, "t": 453.33997, "r": 229.76836, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 123, "text": "0.03", "bbox": {"l": 222.20833000000002, "t": 453.33997, "r": 229.76836, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 243.26666, "t": 453.33997, "r": 250.82669, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 124, "text": "0.06", "bbox": {"l": 243.26666, "t": 453.33997, "r": 250.82669, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 264.29657, "t": 453.33997, "r": 271.84949, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 125, "text": "0.12", "bbox": {"l": 264.29657, "t": 453.33997, "r": 271.84949, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 114, "label": "text", "bbox": {"l": 285.31943, "t": 453.33997, "r": 292.87946, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 126, "text": "0.25", "bbox": {"l": 285.31943, "t": 453.33997, "r": 292.87946, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 115, "label": "text", "bbox": {"l": 306.37775, "t": 453.33997, "r": 311.77319, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 127, "text": "0.5", "bbox": {"l": 306.37775, "t": 453.33997, "r": 311.77319, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 116, "label": "text", "bbox": {"l": 323.41699, "t": 453.33997, "r": 325.58157, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 128, "text": "1", "bbox": {"l": 323.41699, "t": 453.33997, "r": 325.58157, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 117, "label": "text", "bbox": {"l": 334.45807, "t": 453.33997, "r": 336.62265, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 129, "text": "2", "bbox": {"l": 334.45807, "t": 453.33997, "r": 336.62265, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 118, "label": "text", "bbox": {"l": 345.52756, "t": 453.33997, "r": 347.69214, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 130, "text": "4", "bbox": {"l": 345.52756, "t": 453.33997, "r": 347.69214, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 119, "label": "text", "bbox": {"l": 356.56863, "t": 453.33997, "r": 358.73322, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 131, "text": "8", "bbox": {"l": 356.56863, "t": 453.33997, "r": 358.73322, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 120, "label": "text", "bbox": {"l": 367.63812, "t": 453.33997, "r": 371.97089, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 132, "text": "16", "bbox": {"l": 367.63812, "t": 453.33997, "r": 371.97089, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 121, "label": "text", "bbox": {"l": 382.6734, "t": 453.33997, "r": 387.00616, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 133, "text": "32", "bbox": {"l": 382.6734, "t": 453.33997, "r": 387.00616, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 122, "label": "text", "bbox": {"l": 397.73727, "t": 453.33997, "r": 402.07001, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 134, "text": "64", "bbox": {"l": 397.73727, "t": 453.33997, "r": 402.07001, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 123, "label": "text", "bbox": {"l": 412.78879, "t": 447.99298, "r": 414.93463, "b": 457.79964999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 135, "text": "\u2265", "bbox": {"l": 412.78879, "t": 447.99298, "r": 414.93463, "b": 457.79964999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 124, "label": "text", "bbox": {"l": 414.95697, "t": 453.33997, "r": 422.51746, "b": 456.07599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 136, "text": " 128", "bbox": {"l": 414.95697, "t": 453.33997, "r": 422.51746, "b": 456.07599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 125, "label": "text", "bbox": {"l": 200.63998, "t": 463.92444, "r": 204.57674, "b": 466.66043, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 137, "text": "63", "bbox": {"l": 200.63998, "t": 463.92444, "r": 204.57674, "b": 466.66043, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 126, "label": "text", "bbox": {"l": 367.62604, "t": 463.92444, "r": 369.58032, "b": 466.66043, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 138, "text": "1", "bbox": {"l": 367.62604, "t": 463.92444, "r": 369.58032, "b": 466.66043, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 127, "label": "text", "bbox": {"l": 382.66132, "t": 463.92444, "r": 384.6156, "b": 466.66043, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 139, "text": "1", "bbox": {"l": 382.66132, "t": 463.92444, "r": 384.6156, "b": 466.66043, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 128, "label": "text", "bbox": {"l": 397.72504, "t": 463.92444, "r": 399.67932, "b": 466.66043, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 140, "text": "3", "bbox": {"l": 397.72504, "t": 463.92444, "r": 399.67932, "b": 466.66043, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 129, "label": "text", "bbox": {"l": 200.64, "t": 468.80313, "r": 206.51694, "b": 471.53915, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 141, "text": "199", "bbox": {"l": 200.64, "t": 468.80313, "r": 206.51694, "b": 471.53915, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 130, "label": "text", "bbox": {"l": 264.29047, "t": 468.80313, "r": 266.25885, "b": 471.53915, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 142, "text": "5", "bbox": {"l": 264.29047, "t": 468.80313, "r": 266.25885, "b": 471.53915, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 131, "label": "text", "bbox": {"l": 306.37213, "t": 468.80313, "r": 308.34052, "b": 471.53915, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 143, "text": "1", "bbox": {"l": 306.37213, "t": 468.80313, "r": 308.34052, "b": 471.53915, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 132, "label": "text", "bbox": {"l": 345.51526, "t": 468.80313, "r": 347.48364, "b": 471.53915, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 144, "text": "2", "bbox": {"l": 345.51526, "t": 468.80313, "r": 347.48364, "b": 471.53915, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 133, "label": "text", "bbox": {"l": 356.55634, "t": 468.80313, "r": 358.52472, "b": 471.53915, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 145, "text": "4", "bbox": {"l": 356.55634, "t": 468.80313, "r": 358.52472, "b": 471.53915, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 134, "label": "text", "bbox": {"l": 367.62582, "t": 468.80313, "r": 369.59418, "b": 471.53915, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 146, "text": "1", "bbox": {"l": 367.62582, "t": 468.80313, "r": 369.59418, "b": 471.53915, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 135, "label": "text", "bbox": {"l": 382.66107, "t": 468.80313, "r": 384.62946, "b": 471.53915, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 147, "text": "1", "bbox": {"l": 382.66107, "t": 468.80313, "r": 384.62946, "b": 471.53915, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 136, "label": "text", "bbox": {"l": 200.64, "t": 473.68185, "r": 206.51694, "b": 476.41788, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 148, "text": "416", "bbox": {"l": 200.64, "t": 473.68185, "r": 206.51694, "b": 476.41788, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 137, "label": "text", "bbox": {"l": 264.29047, "t": 473.68185, "r": 266.25885, "b": 476.41788, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 149, "text": "4", "bbox": {"l": 264.29047, "t": 473.68185, "r": 266.25885, "b": 476.41788, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 138, "label": "text", "bbox": {"l": 200.64, "t": 478.53214, "r": 206.51694, "b": 481.26816, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 150, "text": "230", "bbox": {"l": 200.64, "t": 478.53214, "r": 206.51694, "b": 481.26816, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 139, "label": "text", "bbox": {"l": 243.26373, "t": 478.53214, "r": 245.2321, "b": 481.26816, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 151, "text": "1", "bbox": {"l": 243.26373, "t": 478.53214, "r": 245.2321, "b": 481.26816, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 140, "label": "text", "bbox": {"l": 264.29047, "t": 478.53214, "r": 266.25885, "b": 481.26816, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 152, "text": "9", "bbox": {"l": 264.29047, "t": 478.53214, "r": 266.25885, "b": 481.26816, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 141, "label": "text", "bbox": {"l": 323.40466, "t": 478.53214, "r": 325.37305, "b": 481.26816, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 153, "text": "1", "bbox": {"l": 323.40466, "t": 478.53214, "r": 325.37305, "b": 481.26816, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 142, "label": "text", "bbox": {"l": 397.72519, "t": 478.53214, "r": 399.69354, "b": 481.26816, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 154, "text": "1", "bbox": {"l": 397.72519, "t": 478.53214, "r": 399.69354, "b": 481.26816, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 143, "label": "text", "bbox": {"l": 200.64, "t": 483.41086, "r": 206.51694, "b": 486.14688, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 155, "text": "276", "bbox": {"l": 200.64, "t": 483.41086, "r": 206.51694, "b": 486.14688, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 144, "label": "text", "bbox": {"l": 382.66132, "t": 483.41086, "r": 384.61563, "b": 486.14688, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 156, "text": "2", "bbox": {"l": 382.66132, "t": 483.41086, "r": 384.61563, "b": 486.14688, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 145, "label": "text", "bbox": {"l": 397.72513, "t": 483.41086, "r": 401.64819, "b": 486.14688, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 157, "text": "12", "bbox": {"l": 397.72513, "t": 483.41086, "r": 401.64819, "b": 486.14688, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 146, "label": "text", "bbox": {"l": 412.78928, "t": 483.41086, "r": 414.74359, "b": 486.14688, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 158, "text": "1", "bbox": {"l": 412.78928, "t": 483.41086, "r": 414.74359, "b": 486.14688, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 147, "label": "text", "bbox": {"l": 200.64014, "t": 488.28958, "r": 207.14445, "b": 491.0256, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 159, "text": "320", "bbox": {"l": 200.64014, "t": 488.28958, "r": 207.14445, "b": 491.0256, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 148, "label": "text", "bbox": {"l": 367.62616, "t": 488.28958, "r": 369.78375, "b": 491.0256, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 160, "text": "1", "bbox": {"l": 367.62616, "t": 488.28958, "r": 369.78375, "b": 491.0256, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 149, "label": "text", "bbox": {"l": 382.66141, "t": 488.28958, "r": 384.81897, "b": 491.0256, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 161, "text": "4", "bbox": {"l": 382.66141, "t": 488.28958, "r": 384.81897, "b": 491.0256, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 150, "label": "text", "bbox": {"l": 397.7251, "t": 488.28958, "r": 402.05087, "b": 491.0256, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 162, "text": "20", "bbox": {"l": 397.7251, "t": 488.28958, "r": 402.05087, "b": 491.0256, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 151, "label": "text", "bbox": {"l": 200.64032, "t": 493.1683, "r": 208.48566, "b": 495.90433, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 163, "text": "2013", "bbox": {"l": 200.64032, "t": 493.1683, "r": 208.48566, "b": 495.90433, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 152, "label": "text", "bbox": {"l": 264.29044, "t": 493.1683, "r": 266.25879, "b": 495.90433, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 164, "text": "3", "bbox": {"l": 264.29044, "t": 493.1683, "r": 266.25879, "b": 495.90433, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "text", "id": 153, "page_no": 9, "cluster": {"id": 153, "label": "text", "bbox": {"l": 227.91466, "t": 665.82603, "r": 230.10028, "b": 675.3464, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 165, "text": "\u03bc", "bbox": {"l": 227.91466, "t": 665.82603, "r": 230.10028, "b": 675.3464, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u03bc"}, {"label": "text", "id": 154, "page_no": 9, "cluster": {"id": 154, "label": "text", "bbox": {"l": 300.58057, "t": 683.62195, "r": 302.72638, "b": 693.428658, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 166, "text": "\u2265", "bbox": {"l": 300.58057, "t": 683.62195, "r": 302.72638, "b": 693.428658, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u2265"}], "headers": [{"label": "page_header", "id": 7, "page_no": 9, "cluster": {"id": 7, "label": "page_header", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 143.97887, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8309906721115112, "cells": [{"id": 0, "text": "10", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 143.97887, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "10"}, {"label": "page_header", "id": 6, "page_no": 9, "cluster": {"id": 6, "label": "page_header", "bbox": {"l": 167.82053, "t": 93.77099999999996, "r": 231.72049000000004, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8367075324058533, "cells": [{"id": 1, "text": "M.", "bbox": {"l": 167.82053, "t": 93.77099999999996, "r": 178.08249, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37929, "t": 93.77099999999996, "r": 231.72049000000004, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "M. Lysak, et al."}]}}, {"page_no": 10, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "11", "bbox": {"l": 471.37561, "t": 93.77099999999996, "r": 480.5894799999999, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Fig. 6.", "bbox": {"l": 134.765, "t": 125.79918999999984, "r": 162.64424, "b": 133.72551999999996, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Visualization of predicted structure and detected bounding boxes on a complex", "bbox": {"l": 165.215, "t": 125.86200000000008, "r": 480.58752, "b": 133.93169999999998, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "table with many rows. The OTSL model (B) captured repeating pattern of horizontally", "bbox": {"l": 134.765, "t": 136.82097999999996, "r": 480.58823, "b": 144.89068999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "merged cells from the GT (A), unlike the HTML model (C). The HTML model also", "bbox": {"l": 134.765, "t": 147.77997000000005, "r": 480.5881999999999, "b": 155.84966999999995, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "didn\u2019t complete the HTML sequence correctly and displayed a lot more of drift and", "bbox": {"l": 134.765, "t": 158.73895000000005, "r": 480.58838000000003, "b": 166.80864999999994, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "overlap of bounding boxes. \"PMC5406406_003_01.png\" PubTabNet.", "bbox": {"l": 134.765, "t": 169.69794000000002, "r": 415.84454, "b": 177.76764000000003, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "B", "bbox": {"l": 171.5049, "t": 312.45032, "r": 177.59613, "b": 320.36386, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "C", "bbox": {"l": 171.05823, "t": 492.65274, "r": 177.14946, "b": 500.56628, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Incorrect end of HTML sequence", "bbox": {"l": 283.047, "t": 627.48166, "r": 374.96332, "b": 633.4168099999999, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Horizontally merged cells are not present", "bbox": {"l": 283.047, "t": 617.35776, "r": 398.05978, "b": 623.29291, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Repeating pattern is well represented in predictions", "bbox": {"l": 293.64209, "t": 465.59784, "r": 437.50800000000004, "b": 471.53299, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Repeating pattern of", "bbox": {"l": 181.89114, "t": 288.35962000000006, "r": 239.23492, "b": 294.2947700000001, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "horizontally merged cells", "bbox": {"l": 181.89114, "t": 294.89423, "r": 251.52917, "b": 300.82938, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "A", "bbox": {"l": 247.83432, "t": 184.75989000000004, "r": 253.61339, "b": 194.81635000000006, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Bounding box drifting at the end", "bbox": {"l": 292.18976, "t": 607.80609, "r": 381.54663, "b": 613.7412400000001, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "OTSL", "bbox": {"l": 172.27777, "t": 381.36288, "r": 180.18666, "b": 403.40067, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "HTML", "bbox": {"l": 172.27747, "t": 555.7769499999999, "r": 180.18663, "b": 578.7478, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 0, "label": "page_header", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9301655888557434, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "page_header", "bbox": {"l": 471.37561, "t": 93.77099999999996, "r": 480.5894799999999, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9007201790809631, "cells": [{"id": 1, "text": "11", "bbox": {"l": 471.37561, "t": 93.77099999999996, "r": 480.5894799999999, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "caption", "bbox": {"l": 134.765, "t": 125.79918999999984, "r": 480.58838000000003, "b": 177.76764000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.8657060861587524, "cells": [{"id": 2, "text": "Fig. 6.", "bbox": {"l": 134.765, "t": 125.79918999999984, "r": 162.64424, "b": 133.72551999999996, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Visualization of predicted structure and detected bounding boxes on a complex", "bbox": {"l": 165.215, "t": 125.86200000000008, "r": 480.58752, "b": 133.93169999999998, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "table with many rows. The OTSL model (B) captured repeating pattern of horizontally", "bbox": {"l": 134.765, "t": 136.82097999999996, "r": 480.58823, "b": 144.89068999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "merged cells from the GT (A), unlike the HTML model (C). The HTML model also", "bbox": {"l": 134.765, "t": 147.77997000000005, "r": 480.5881999999999, "b": 155.84966999999995, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "didn\u2019t complete the HTML sequence correctly and displayed a lot more of drift and", "bbox": {"l": 134.765, "t": 158.73895000000005, "r": 480.58838000000003, "b": 166.80864999999994, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "overlap of bounding boxes. \"PMC5406406_003_01.png\" PubTabNet.", "bbox": {"l": 134.765, "t": 169.69794000000002, "r": 415.84454, "b": 177.76764000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "picture", "bbox": {"l": 168.39285278320312, "t": 181.9665069580078, "r": 447.35137939453125, "b": 634.0056762695312, "coord_origin": "TOPLEFT"}, "confidence": 0.7612658739089966, "cells": [{"id": 8, "text": "B", "bbox": {"l": 171.5049, "t": 312.45032, "r": 177.59613, "b": 320.36386, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "C", "bbox": {"l": 171.05823, "t": 492.65274, "r": 177.14946, "b": 500.56628, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Incorrect end of HTML sequence", "bbox": {"l": 283.047, "t": 627.48166, "r": 374.96332, "b": 633.4168099999999, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Horizontally merged cells are not present", "bbox": {"l": 283.047, "t": 617.35776, "r": 398.05978, "b": 623.29291, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Repeating pattern is well represented in predictions", "bbox": {"l": 293.64209, "t": 465.59784, "r": 437.50800000000004, "b": 471.53299, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Repeating pattern of", "bbox": {"l": 181.89114, "t": 288.35962000000006, "r": 239.23492, "b": 294.2947700000001, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "horizontally merged cells", "bbox": {"l": 181.89114, "t": 294.89423, "r": 251.52917, "b": 300.82938, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "A", "bbox": {"l": 247.83432, "t": 184.75989000000004, "r": 253.61339, "b": 194.81635000000006, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Bounding box drifting at the end", "bbox": {"l": 292.18976, "t": 607.80609, "r": 381.54663, "b": 613.7412400000001, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "OTSL", "bbox": {"l": 172.27777, "t": 381.36288, "r": 180.18666, "b": 403.40067, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "HTML", "bbox": {"l": 172.27747, "t": 555.7769499999999, "r": 180.18663, "b": 578.7478, "coord_origin": "TOPLEFT"}}], "children": [{"id": 3, "label": "text", "bbox": {"l": 171.5049, "t": 312.45032, "r": 177.59613, "b": 320.36386, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "B", "bbox": {"l": 171.5049, "t": 312.45032, "r": 177.59613, "b": 320.36386, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "text", "bbox": {"l": 171.05823, "t": 492.65274, "r": 177.14946, "b": 500.56628, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "C", "bbox": {"l": 171.05823, "t": 492.65274, "r": 177.14946, "b": 500.56628, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "text", "bbox": {"l": 283.047, "t": 627.48166, "r": 374.96332, "b": 633.4168099999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "Incorrect end of HTML sequence", "bbox": {"l": 283.047, "t": 627.48166, "r": 374.96332, "b": 633.4168099999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "text", "bbox": {"l": 283.047, "t": 617.35776, "r": 398.05978, "b": 623.29291, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "Horizontally merged cells are not present", "bbox": {"l": 283.047, "t": 617.35776, "r": 398.05978, "b": 623.29291, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "text", "bbox": {"l": 293.64209, "t": 465.59784, "r": 437.50800000000004, "b": 471.53299, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "Repeating pattern is well represented in predictions", "bbox": {"l": 293.64209, "t": 465.59784, "r": 437.50800000000004, "b": 471.53299, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "text", "bbox": {"l": 181.89114, "t": 288.35962000000006, "r": 239.23492, "b": 294.2947700000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "Repeating pattern of", "bbox": {"l": 181.89114, "t": 288.35962000000006, "r": 239.23492, "b": 294.2947700000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 181.89114, "t": 294.89423, "r": 251.52917, "b": 300.82938, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "horizontally merged cells", "bbox": {"l": 181.89114, "t": 294.89423, "r": 251.52917, "b": 300.82938, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "text", "bbox": {"l": 247.83432, "t": 184.75989000000004, "r": 253.61339, "b": 194.81635000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "A", "bbox": {"l": 247.83432, "t": 184.75989000000004, "r": 253.61339, "b": 194.81635000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 292.18976, "t": 607.80609, "r": 381.54663, "b": 613.7412400000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "Bounding box drifting at the end", "bbox": {"l": 292.18976, "t": 607.80609, "r": 381.54663, "b": 613.7412400000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 172.27777, "t": 381.36288, "r": 180.18666, "b": 403.40067, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "OTSL", "bbox": {"l": 172.27777, "t": 381.36288, "r": 180.18666, "b": 403.40067, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 172.27747, "t": 555.7769499999999, "r": 180.18663, "b": 578.7478, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "HTML", "bbox": {"l": 172.27747, "t": 555.7769499999999, "r": 180.18663, "b": 578.7478, "coord_origin": "TOPLEFT"}}], "children": []}]}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_header", "id": 0, "page_no": 10, "cluster": {"id": 0, "label": "page_header", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9301655888557434, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Optimized Table Tokenization for Table Structure Recognition"}, {"label": "page_header", "id": 1, "page_no": 10, "cluster": {"id": 1, "label": "page_header", "bbox": {"l": 471.37561, "t": 93.77099999999996, "r": 480.5894799999999, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9007201790809631, "cells": [{"id": 1, "text": "11", "bbox": {"l": 471.37561, "t": 93.77099999999996, "r": 480.5894799999999, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "11"}, {"label": "caption", "id": 2, "page_no": 10, "cluster": {"id": 2, "label": "caption", "bbox": {"l": 134.765, "t": 125.79918999999984, "r": 480.58838000000003, "b": 177.76764000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.8657060861587524, "cells": [{"id": 2, "text": "Fig. 6.", "bbox": {"l": 134.765, "t": 125.79918999999984, "r": 162.64424, "b": 133.72551999999996, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Visualization of predicted structure and detected bounding boxes on a complex", "bbox": {"l": 165.215, "t": 125.86200000000008, "r": 480.58752, "b": 133.93169999999998, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "table with many rows. The OTSL model (B) captured repeating pattern of horizontally", "bbox": {"l": 134.765, "t": 136.82097999999996, "r": 480.58823, "b": 144.89068999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "merged cells from the GT (A), unlike the HTML model (C). The HTML model also", "bbox": {"l": 134.765, "t": 147.77997000000005, "r": 480.5881999999999, "b": 155.84966999999995, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "didn\u2019t complete the HTML sequence correctly and displayed a lot more of drift and", "bbox": {"l": 134.765, "t": 158.73895000000005, "r": 480.58838000000003, "b": 166.80864999999994, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "overlap of bounding boxes. \"PMC5406406_003_01.png\" PubTabNet.", "bbox": {"l": 134.765, "t": 169.69794000000002, "r": 415.84454, "b": 177.76764000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Fig. 6. Visualization of predicted structure and detected bounding boxes on a complex table with many rows. The OTSL model (B) captured repeating pattern of horizontally merged cells from the GT (A), unlike the HTML model (C). The HTML model also didn't complete the HTML sequence correctly and displayed a lot more of drift and overlap of bounding boxes. \"PMC5406406_003_01.png\" PubTabNet."}, {"label": "picture", "id": 3, "page_no": 10, "cluster": {"id": 3, "label": "picture", "bbox": {"l": 168.39285278320312, "t": 181.9665069580078, "r": 447.35137939453125, "b": 634.0056762695312, "coord_origin": "TOPLEFT"}, "confidence": 0.7612658739089966, "cells": [{"id": 8, "text": "B", "bbox": {"l": 171.5049, "t": 312.45032, "r": 177.59613, "b": 320.36386, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "C", "bbox": {"l": 171.05823, "t": 492.65274, "r": 177.14946, "b": 500.56628, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Incorrect end of HTML sequence", "bbox": {"l": 283.047, "t": 627.48166, "r": 374.96332, "b": 633.4168099999999, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Horizontally merged cells are not present", "bbox": {"l": 283.047, "t": 617.35776, "r": 398.05978, "b": 623.29291, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Repeating pattern is well represented in predictions", "bbox": {"l": 293.64209, "t": 465.59784, "r": 437.50800000000004, "b": 471.53299, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Repeating pattern of", "bbox": {"l": 181.89114, "t": 288.35962000000006, "r": 239.23492, "b": 294.2947700000001, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "horizontally merged cells", "bbox": {"l": 181.89114, "t": 294.89423, "r": 251.52917, "b": 300.82938, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "A", "bbox": {"l": 247.83432, "t": 184.75989000000004, "r": 253.61339, "b": 194.81635000000006, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Bounding box drifting at the end", "bbox": {"l": 292.18976, "t": 607.80609, "r": 381.54663, "b": 613.7412400000001, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "OTSL", "bbox": {"l": 172.27777, "t": 381.36288, "r": 180.18666, "b": 403.40067, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "HTML", "bbox": {"l": 172.27747, "t": 555.7769499999999, "r": 180.18663, "b": 578.7478, "coord_origin": "TOPLEFT"}}], "children": [{"id": 3, "label": "text", "bbox": {"l": 171.5049, "t": 312.45032, "r": 177.59613, "b": 320.36386, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "B", "bbox": {"l": 171.5049, "t": 312.45032, "r": 177.59613, "b": 320.36386, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "text", "bbox": {"l": 171.05823, "t": 492.65274, "r": 177.14946, "b": 500.56628, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "C", "bbox": {"l": 171.05823, "t": 492.65274, "r": 177.14946, "b": 500.56628, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "text", "bbox": {"l": 283.047, "t": 627.48166, "r": 374.96332, "b": 633.4168099999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "Incorrect end of HTML sequence", "bbox": {"l": 283.047, "t": 627.48166, "r": 374.96332, "b": 633.4168099999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "text", "bbox": {"l": 283.047, "t": 617.35776, "r": 398.05978, "b": 623.29291, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "Horizontally merged cells are not present", "bbox": {"l": 283.047, "t": 617.35776, "r": 398.05978, "b": 623.29291, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "text", "bbox": {"l": 293.64209, "t": 465.59784, "r": 437.50800000000004, "b": 471.53299, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "Repeating pattern is well represented in predictions", "bbox": {"l": 293.64209, "t": 465.59784, "r": 437.50800000000004, "b": 471.53299, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "text", "bbox": {"l": 181.89114, "t": 288.35962000000006, "r": 239.23492, "b": 294.2947700000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "Repeating pattern of", "bbox": {"l": 181.89114, "t": 288.35962000000006, "r": 239.23492, "b": 294.2947700000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 181.89114, "t": 294.89423, "r": 251.52917, "b": 300.82938, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "horizontally merged cells", "bbox": {"l": 181.89114, "t": 294.89423, "r": 251.52917, "b": 300.82938, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "text", "bbox": {"l": 247.83432, "t": 184.75989000000004, "r": 253.61339, "b": 194.81635000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "A", "bbox": {"l": 247.83432, "t": 184.75989000000004, "r": 253.61339, "b": 194.81635000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 292.18976, "t": 607.80609, "r": 381.54663, "b": 613.7412400000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "Bounding box drifting at the end", "bbox": {"l": 292.18976, "t": 607.80609, "r": 381.54663, "b": 613.7412400000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 172.27777, "t": 381.36288, "r": 180.18666, "b": 403.40067, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "OTSL", "bbox": {"l": 172.27777, "t": 381.36288, "r": 180.18666, "b": 403.40067, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 172.27747, "t": 555.7769499999999, "r": 180.18663, "b": 578.7478, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "HTML", "bbox": {"l": 172.27747, "t": 555.7769499999999, "r": 180.18663, "b": 578.7478, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "body": [{"label": "caption", "id": 2, "page_no": 10, "cluster": {"id": 2, "label": "caption", "bbox": {"l": 134.765, "t": 125.79918999999984, "r": 480.58838000000003, "b": 177.76764000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.8657060861587524, "cells": [{"id": 2, "text": "Fig. 6.", "bbox": {"l": 134.765, "t": 125.79918999999984, "r": 162.64424, "b": 133.72551999999996, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Visualization of predicted structure and detected bounding boxes on a complex", "bbox": {"l": 165.215, "t": 125.86200000000008, "r": 480.58752, "b": 133.93169999999998, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "table with many rows. The OTSL model (B) captured repeating pattern of horizontally", "bbox": {"l": 134.765, "t": 136.82097999999996, "r": 480.58823, "b": 144.89068999999995, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "merged cells from the GT (A), unlike the HTML model (C). The HTML model also", "bbox": {"l": 134.765, "t": 147.77997000000005, "r": 480.5881999999999, "b": 155.84966999999995, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "didn\u2019t complete the HTML sequence correctly and displayed a lot more of drift and", "bbox": {"l": 134.765, "t": 158.73895000000005, "r": 480.58838000000003, "b": 166.80864999999994, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "overlap of bounding boxes. \"PMC5406406_003_01.png\" PubTabNet.", "bbox": {"l": 134.765, "t": 169.69794000000002, "r": 415.84454, "b": 177.76764000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Fig. 6. Visualization of predicted structure and detected bounding boxes on a complex table with many rows. The OTSL model (B) captured repeating pattern of horizontally merged cells from the GT (A), unlike the HTML model (C). The HTML model also didn't complete the HTML sequence correctly and displayed a lot more of drift and overlap of bounding boxes. \"PMC5406406_003_01.png\" PubTabNet."}, {"label": "picture", "id": 3, "page_no": 10, "cluster": {"id": 3, "label": "picture", "bbox": {"l": 168.39285278320312, "t": 181.9665069580078, "r": 447.35137939453125, "b": 634.0056762695312, "coord_origin": "TOPLEFT"}, "confidence": 0.7612658739089966, "cells": [{"id": 8, "text": "B", "bbox": {"l": 171.5049, "t": 312.45032, "r": 177.59613, "b": 320.36386, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "C", "bbox": {"l": 171.05823, "t": 492.65274, "r": 177.14946, "b": 500.56628, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Incorrect end of HTML sequence", "bbox": {"l": 283.047, "t": 627.48166, "r": 374.96332, "b": 633.4168099999999, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Horizontally merged cells are not present", "bbox": {"l": 283.047, "t": 617.35776, "r": 398.05978, "b": 623.29291, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Repeating pattern is well represented in predictions", "bbox": {"l": 293.64209, "t": 465.59784, "r": 437.50800000000004, "b": 471.53299, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Repeating pattern of", "bbox": {"l": 181.89114, "t": 288.35962000000006, "r": 239.23492, "b": 294.2947700000001, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "horizontally merged cells", "bbox": {"l": 181.89114, "t": 294.89423, "r": 251.52917, "b": 300.82938, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "A", "bbox": {"l": 247.83432, "t": 184.75989000000004, "r": 253.61339, "b": 194.81635000000006, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Bounding box drifting at the end", "bbox": {"l": 292.18976, "t": 607.80609, "r": 381.54663, "b": 613.7412400000001, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "OTSL", "bbox": {"l": 172.27777, "t": 381.36288, "r": 180.18666, "b": 403.40067, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "HTML", "bbox": {"l": 172.27747, "t": 555.7769499999999, "r": 180.18663, "b": 578.7478, "coord_origin": "TOPLEFT"}}], "children": [{"id": 3, "label": "text", "bbox": {"l": 171.5049, "t": 312.45032, "r": 177.59613, "b": 320.36386, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "B", "bbox": {"l": 171.5049, "t": 312.45032, "r": 177.59613, "b": 320.36386, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "text", "bbox": {"l": 171.05823, "t": 492.65274, "r": 177.14946, "b": 500.56628, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": "C", "bbox": {"l": 171.05823, "t": 492.65274, "r": 177.14946, "b": 500.56628, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "text", "bbox": {"l": 283.047, "t": 627.48166, "r": 374.96332, "b": 633.4168099999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "Incorrect end of HTML sequence", "bbox": {"l": 283.047, "t": 627.48166, "r": 374.96332, "b": 633.4168099999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "text", "bbox": {"l": 283.047, "t": 617.35776, "r": 398.05978, "b": 623.29291, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "Horizontally merged cells are not present", "bbox": {"l": 283.047, "t": 617.35776, "r": 398.05978, "b": 623.29291, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "text", "bbox": {"l": 293.64209, "t": 465.59784, "r": 437.50800000000004, "b": 471.53299, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "Repeating pattern is well represented in predictions", "bbox": {"l": 293.64209, "t": 465.59784, "r": 437.50800000000004, "b": 471.53299, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "text", "bbox": {"l": 181.89114, "t": 288.35962000000006, "r": 239.23492, "b": 294.2947700000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "Repeating pattern of", "bbox": {"l": 181.89114, "t": 288.35962000000006, "r": 239.23492, "b": 294.2947700000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 181.89114, "t": 294.89423, "r": 251.52917, "b": 300.82938, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "horizontally merged cells", "bbox": {"l": 181.89114, "t": 294.89423, "r": 251.52917, "b": 300.82938, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "text", "bbox": {"l": 247.83432, "t": 184.75989000000004, "r": 253.61339, "b": 194.81635000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "A", "bbox": {"l": 247.83432, "t": 184.75989000000004, "r": 253.61339, "b": 194.81635000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 292.18976, "t": 607.80609, "r": 381.54663, "b": 613.7412400000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "Bounding box drifting at the end", "bbox": {"l": 292.18976, "t": 607.80609, "r": 381.54663, "b": 613.7412400000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 172.27777, "t": 381.36288, "r": 180.18666, "b": 403.40067, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "OTSL", "bbox": {"l": 172.27777, "t": 381.36288, "r": 180.18666, "b": 403.40067, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 172.27747, "t": 555.7769499999999, "r": 180.18663, "b": 578.7478, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "HTML", "bbox": {"l": 172.27747, "t": 555.7769499999999, "r": 180.18663, "b": 578.7478, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "headers": [{"label": "page_header", "id": 0, "page_no": 10, "cluster": {"id": 0, "label": "page_header", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9301655888557434, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Optimized Table Tokenization for Table Structure Recognition"}, {"label": "page_header", "id": 1, "page_no": 10, "cluster": {"id": 1, "label": "page_header", "bbox": {"l": 471.37561, "t": 93.77099999999996, "r": 480.5894799999999, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9007201790809631, "cells": [{"id": 1, "text": "11", "bbox": {"l": 471.37561, "t": 93.77099999999996, "r": 480.5894799999999, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "11"}]}}, {"page_no": 11, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "12", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 143.97887, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "M.", "bbox": {"l": 167.82053, "t": 93.77099999999996, "r": 178.08249, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37929, "t": 93.77099999999996, "r": 231.72049000000004, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "6", "bbox": {"l": 134.765, "t": 117.54894999999988, "r": 141.4886, "b": 128.11737000000005, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Conclusion", "bbox": {"l": 154.9382, "t": 117.54894999999988, "r": 219.25478999999999, "b": 128.11737000000005, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "We demonstrated that representing tables in HTML for the task of table struc-", "bbox": {"l": 134.765, "t": 146.86377000000005, "r": 480.59476, "b": 155.66076999999996, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "ture recognition with Im2Seq models is ill-suited and has serious limitations.", "bbox": {"l": 134.765, "t": 158.81879000000004, "r": 480.59476, "b": 167.61577999999997, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Furthermore, we presented in this paper an Optimized Table Structure Language", "bbox": {"l": 134.765, "t": 170.77380000000005, "r": 480.58978, "b": 179.57079999999996, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "(OTSL) which, when compared to commonly used general purpose languages,", "bbox": {"l": 134.765, "t": 182.72979999999995, "r": 480.59569999999997, "b": 191.52679, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "has several key benefits.", "bbox": {"l": 134.765, "t": 194.68480999999997, "r": 239.5387, "b": 203.48181, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "First and foremost, given the same network configuration, inference time for", "bbox": {"l": 149.709, "t": 207.44379000000004, "r": 480.59283000000005, "b": 216.24077999999997, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "a table-structure prediction is about 2 times faster compared to the conventional", "bbox": {"l": 134.765, "t": 219.39880000000005, "r": 480.59365999999994, "b": 228.19579999999996, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "HTML approach. This is primarily owed to the shorter sequence length of the", "bbox": {"l": 134.765, "t": 231.35382000000004, "r": 480.59079, "b": 240.15081999999995, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "OTSL representation. Additional performance benefits can be obtained with", "bbox": {"l": 134.765, "t": 243.30884000000003, "r": 480.58786000000003, "b": 252.10582999999997, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "HPO (hyper parameter optimization). As we demonstrate in our experiments,", "bbox": {"l": 134.765, "t": 255.26482999999996, "r": 480.59479, "b": 264.06183, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "models trained on OTSL can be significantly smaller, e.g. by reducing the number", "bbox": {"l": 134.765, "t": 267.21984999999995, "r": 480.5878000000001, "b": 276.01685, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "of encoder and decoder layers, while preserving comparatively good prediction", "bbox": {"l": 134.765, "t": 279.17487000000006, "r": 480.59268, "b": 287.97183, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "quality. This can further improve inference performance, yielding 5-6 times faster", "bbox": {"l": 134.765, "t": 291.12985, "r": 480.58871, "b": 299.92682, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "inference speed in OTSL with prediction quality comparable to models trained", "bbox": {"l": 134.765, "t": 303.08484, "r": 480.59375, "b": 311.88181, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "on HTML (see Table 1).", "bbox": {"l": 134.765, "t": 315.03983, "r": 240.92351000000002, "b": 323.83679, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Secondly, OTSL has more inherent structure and a significantly restricted vo-", "bbox": {"l": 149.709, "t": 327.79883, "r": 480.58984, "b": 336.5957900000001, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "cabulary size. This allows autoregressive models to perform better in the TED", "bbox": {"l": 134.765, "t": 339.75482, "r": 480.59473, "b": 348.55179, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "metric, but especially with regards to prediction accuracy of the table-cell bound-", "bbox": {"l": 134.765, "t": 351.70981, "r": 480.58664, "b": 360.50677, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "ing boxes (see Table 2). As shown in Figure 5, we observe that the OTSL dras-", "bbox": {"l": 134.765, "t": 363.66479, "r": 480.59479, "b": 372.46176, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "tically reduces the drift for table cell bounding boxes at high row count and in", "bbox": {"l": 134.765, "t": 375.61978, "r": 480.58971999999994, "b": 384.41675, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "sparse tables. This leads to more accurate predictions and a significant reduction", "bbox": {"l": 134.765, "t": 387.57477, "r": 480.58673, "b": 396.37173, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "in post-processing complexity, which is an undesired necessity in HTML-based", "bbox": {"l": 134.765, "t": 399.53076, "r": 480.58574999999996, "b": 408.32773, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Im2Seq models. Significant novelty lies in OTSL syntactical rules, which are few,", "bbox": {"l": 134.765, "t": 411.48575, "r": 480.58675999999997, "b": 420.28271, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "simple and always backwards looking. Each new token can be validated only by", "bbox": {"l": 134.765, "t": 423.44073, "r": 480.59482, "b": 432.23769999999996, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "analyzing the sequence of previous tokens, without requiring the entire sequence", "bbox": {"l": 134.765, "t": 435.39572, "r": 480.58777, "b": 444.19269, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "to detect mistakes. This in return allows to perform structural error detection", "bbox": {"l": 134.765, "t": 447.35071, "r": 480.58968999999996, "b": 456.14767, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "and correction on-the-fly during sequence generation.", "bbox": {"l": 134.765, "t": 459.30569, "r": 366.77698, "b": 468.10266, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "References", "bbox": {"l": 134.765, "t": 493.82083, "r": 197.68642, "b": 504.38922, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "1.", "bbox": {"l": 139.371, "t": 522.87985, "r": 146.46127, "b": 530.94962, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Auer, C., Dolfi, M., Carvalho, A., Ramis, C.B., Staar, P.W.J.: Delivering doc-", "bbox": {"l": 151.01955, "t": 522.87985, "r": 480.5920100000001, "b": 530.94962, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "ument conversion as a cloud service with high throughput and responsiveness.", "bbox": {"l": 151.51801, "t": 533.83887, "r": 480.58667, "b": 541.90862, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "CoRR", "bbox": {"l": 151.51801, "t": 544.79785, "r": 176.34149, "b": 552.86761, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "abs/2206.00785", "bbox": {"l": 179.464, "t": 544.73509, "r": 250.67963, "b": 552.66139, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "(2022).", "bbox": {"l": 253.804, "t": 544.79785, "r": 281.9567, "b": 552.86761, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "https://doi.org/10.48550/arXiv.2206.00785", "bbox": {"l": 285.078, "t": 545.44344, "r": 478.03403000000003, "b": 552.91245, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": ",", "bbox": {"l": 478.0319799999999, "t": 544.79785, "r": 480.59099999999995, "b": 552.86761, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "https://doi.org/10.48550/arXiv.2206.00785", "bbox": {"l": 151.51797, "t": 556.4024400000001, "r": 344.474, "b": 563.87144, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "2.", "bbox": {"l": 139.37097, "t": 567.51884, "r": 145.94186, "b": 575.58861, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Chen, B., Peng, D., Zhang, J., Ren, Y., Jin, L.: Complex table structure recognition", "bbox": {"l": 150.16624, "t": 567.51884, "r": 480.58636, "b": 575.58861, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "in the wild using transformer and identity matrix-based augmentation. In: Porwal,", "bbox": {"l": 151.51797, "t": 578.47784, "r": 480.59012, "b": 586.5476100000001, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "U., Forn\u00e9s, A., Shafait, F. (eds.) Frontiers in Handwriting Recognition. pp. 545-", "bbox": {"l": 151.51797, "t": 589.43684, "r": 480.5920100000001, "b": 597.50661, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "561. Springer International Publishing, Cham (2022)", "bbox": {"l": 151.51797, "t": 600.39584, "r": 364.17856, "b": 608.46561, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "3.", "bbox": {"l": 139.37097, "t": 612.1588399999999, "r": 146.4379, "b": 620.22861, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Chi, Z., Huang, H., Xu, H.D., Yu, H., Yin, W., Mao, X.L.: Complicated table", "bbox": {"l": 150.98117, "t": 612.1588399999999, "r": 480.58731000000006, "b": 620.22861, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "structure recognition. arXiv preprint arXiv:1908.04729 (2019)", "bbox": {"l": 151.51797, "t": 623.11784, "r": 400.22525, "b": 631.18761, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "4.", "bbox": {"l": 139.37097, "t": 634.88084, "r": 146.52443, "b": 642.95061, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Deng, Y., Rosenberg, D., Mann, G.: Challenges in end-to-end neural scientific", "bbox": {"l": 151.12335, "t": 634.88084, "r": 480.58826, "b": 642.95061, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "table recognition. In: 2019 International Conference on Document Analysis and", "bbox": {"l": 151.51797, "t": 645.83984, "r": 480.58752, "b": 653.9096099999999, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Recognition (ICDAR). pp. 894-901. IEEE (2019)", "bbox": {"l": 151.51797, "t": 656.79785, "r": 350.11115, "b": 664.86761, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 10, "label": "page_header", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 143.97887, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8610832691192627, "cells": [{"id": 0, "text": "12", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 143.97887, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "page_header", "bbox": {"l": 167.82053, "t": 93.77099999999996, "r": 231.72049000000004, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8927664756774902, "cells": [{"id": 1, "text": "M.", "bbox": {"l": 167.82053, "t": 93.77099999999996, "r": 178.08249, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37929, "t": 93.77099999999996, "r": 231.72049000000004, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "section_header", "bbox": {"l": 134.765, "t": 117.54894999999988, "r": 219.25478999999999, "b": 128.11737000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.915635347366333, "cells": [{"id": 3, "text": "6", "bbox": {"l": 134.765, "t": 117.54894999999988, "r": 141.4886, "b": 128.11737000000005, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Conclusion", "bbox": {"l": 154.9382, "t": 117.54894999999988, "r": 219.25478999999999, "b": 128.11737000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 134.765, "t": 146.86377000000005, "r": 480.59569999999997, "b": 203.48181, "coord_origin": "TOPLEFT"}, "confidence": 0.9806171655654907, "cells": [{"id": 5, "text": "We demonstrated that representing tables in HTML for the task of table struc-", "bbox": {"l": 134.765, "t": 146.86377000000005, "r": 480.59476, "b": 155.66076999999996, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "ture recognition with Im2Seq models is ill-suited and has serious limitations.", "bbox": {"l": 134.765, "t": 158.81879000000004, "r": 480.59476, "b": 167.61577999999997, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Furthermore, we presented in this paper an Optimized Table Structure Language", "bbox": {"l": 134.765, "t": 170.77380000000005, "r": 480.58978, "b": 179.57079999999996, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "(OTSL) which, when compared to commonly used general purpose languages,", "bbox": {"l": 134.765, "t": 182.72979999999995, "r": 480.59569999999997, "b": 191.52679, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "has several key benefits.", "bbox": {"l": 134.765, "t": 194.68480999999997, "r": 239.5387, "b": 203.48181, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 134.765, "t": 207.44379000000004, "r": 480.59479, "b": 323.83679, "coord_origin": "TOPLEFT"}, "confidence": 0.9873476028442383, "cells": [{"id": 10, "text": "First and foremost, given the same network configuration, inference time for", "bbox": {"l": 149.709, "t": 207.44379000000004, "r": 480.59283000000005, "b": 216.24077999999997, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "a table-structure prediction is about 2 times faster compared to the conventional", "bbox": {"l": 134.765, "t": 219.39880000000005, "r": 480.59365999999994, "b": 228.19579999999996, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "HTML approach. This is primarily owed to the shorter sequence length of the", "bbox": {"l": 134.765, "t": 231.35382000000004, "r": 480.59079, "b": 240.15081999999995, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "OTSL representation. Additional performance benefits can be obtained with", "bbox": {"l": 134.765, "t": 243.30884000000003, "r": 480.58786000000003, "b": 252.10582999999997, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "HPO (hyper parameter optimization). As we demonstrate in our experiments,", "bbox": {"l": 134.765, "t": 255.26482999999996, "r": 480.59479, "b": 264.06183, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "models trained on OTSL can be significantly smaller, e.g. by reducing the number", "bbox": {"l": 134.765, "t": 267.21984999999995, "r": 480.5878000000001, "b": 276.01685, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "of encoder and decoder layers, while preserving comparatively good prediction", "bbox": {"l": 134.765, "t": 279.17487000000006, "r": 480.59268, "b": 287.97183, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "quality. This can further improve inference performance, yielding 5-6 times faster", "bbox": {"l": 134.765, "t": 291.12985, "r": 480.58871, "b": 299.92682, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "inference speed in OTSL with prediction quality comparable to models trained", "bbox": {"l": 134.765, "t": 303.08484, "r": 480.59375, "b": 311.88181, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "on HTML (see Table 1).", "bbox": {"l": 134.765, "t": 315.03983, "r": 240.92351000000002, "b": 323.83679, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 134.765, "t": 327.79883, "r": 480.59482, "b": 468.10266, "coord_origin": "TOPLEFT"}, "confidence": 0.9868747591972351, "cells": [{"id": 20, "text": "Secondly, OTSL has more inherent structure and a significantly restricted vo-", "bbox": {"l": 149.709, "t": 327.79883, "r": 480.58984, "b": 336.5957900000001, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "cabulary size. This allows autoregressive models to perform better in the TED", "bbox": {"l": 134.765, "t": 339.75482, "r": 480.59473, "b": 348.55179, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "metric, but especially with regards to prediction accuracy of the table-cell bound-", "bbox": {"l": 134.765, "t": 351.70981, "r": 480.58664, "b": 360.50677, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "ing boxes (see Table 2). As shown in Figure 5, we observe that the OTSL dras-", "bbox": {"l": 134.765, "t": 363.66479, "r": 480.59479, "b": 372.46176, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "tically reduces the drift for table cell bounding boxes at high row count and in", "bbox": {"l": 134.765, "t": 375.61978, "r": 480.58971999999994, "b": 384.41675, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "sparse tables. This leads to more accurate predictions and a significant reduction", "bbox": {"l": 134.765, "t": 387.57477, "r": 480.58673, "b": 396.37173, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "in post-processing complexity, which is an undesired necessity in HTML-based", "bbox": {"l": 134.765, "t": 399.53076, "r": 480.58574999999996, "b": 408.32773, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Im2Seq models. Significant novelty lies in OTSL syntactical rules, which are few,", "bbox": {"l": 134.765, "t": 411.48575, "r": 480.58675999999997, "b": 420.28271, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "simple and always backwards looking. Each new token can be validated only by", "bbox": {"l": 134.765, "t": 423.44073, "r": 480.59482, "b": 432.23769999999996, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "analyzing the sequence of previous tokens, without requiring the entire sequence", "bbox": {"l": 134.765, "t": 435.39572, "r": 480.58777, "b": 444.19269, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "to detect mistakes. This in return allows to perform structural error detection", "bbox": {"l": 134.765, "t": 447.35071, "r": 480.58968999999996, "b": 456.14767, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "and correction on-the-fly during sequence generation.", "bbox": {"l": 134.765, "t": 459.30569, "r": 366.77698, "b": 468.10266, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "section_header", "bbox": {"l": 134.765, "t": 493.82083, "r": 197.68642, "b": 504.38922, "coord_origin": "TOPLEFT"}, "confidence": 0.9403266310691833, "cells": [{"id": 32, "text": "References", "bbox": {"l": 134.765, "t": 493.82083, "r": 197.68642, "b": 504.38922, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "list_item", "bbox": {"l": 139.371, "t": 522.87985, "r": 480.5920100000001, "b": 563.87144, "coord_origin": "TOPLEFT"}, "confidence": 0.9698606729507446, "cells": [{"id": 33, "text": "1.", "bbox": {"l": 139.371, "t": 522.87985, "r": 146.46127, "b": 530.94962, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Auer, C., Dolfi, M., Carvalho, A., Ramis, C.B., Staar, P.W.J.: Delivering doc-", "bbox": {"l": 151.01955, "t": 522.87985, "r": 480.5920100000001, "b": 530.94962, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "ument conversion as a cloud service with high throughput and responsiveness.", "bbox": {"l": 151.51801, "t": 533.83887, "r": 480.58667, "b": 541.90862, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "CoRR", "bbox": {"l": 151.51801, "t": 544.79785, "r": 176.34149, "b": 552.86761, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "abs/2206.00785", "bbox": {"l": 179.464, "t": 544.73509, "r": 250.67963, "b": 552.66139, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "(2022).", "bbox": {"l": 253.804, "t": 544.79785, "r": 281.9567, "b": 552.86761, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "https://doi.org/10.48550/arXiv.2206.00785", "bbox": {"l": 285.078, "t": 545.44344, "r": 478.03403000000003, "b": 552.91245, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": ",", "bbox": {"l": 478.0319799999999, "t": 544.79785, "r": 480.59099999999995, "b": 552.86761, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "https://doi.org/10.48550/arXiv.2206.00785", "bbox": {"l": 151.51797, "t": 556.4024400000001, "r": 344.474, "b": 563.87144, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "list_item", "bbox": {"l": 139.37097, "t": 567.51884, "r": 480.5920100000001, "b": 608.46561, "coord_origin": "TOPLEFT"}, "confidence": 0.9730570316314697, "cells": [{"id": 42, "text": "2.", "bbox": {"l": 139.37097, "t": 567.51884, "r": 145.94186, "b": 575.58861, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Chen, B., Peng, D., Zhang, J., Ren, Y., Jin, L.: Complex table structure recognition", "bbox": {"l": 150.16624, "t": 567.51884, "r": 480.58636, "b": 575.58861, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "in the wild using transformer and identity matrix-based augmentation. In: Porwal,", "bbox": {"l": 151.51797, "t": 578.47784, "r": 480.59012, "b": 586.5476100000001, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "U., Forn\u00e9s, A., Shafait, F. (eds.) Frontiers in Handwriting Recognition. pp. 545-", "bbox": {"l": 151.51797, "t": 589.43684, "r": 480.5920100000001, "b": 597.50661, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "561. Springer International Publishing, Cham (2022)", "bbox": {"l": 151.51797, "t": 600.39584, "r": 364.17856, "b": 608.46561, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "list_item", "bbox": {"l": 139.37097, "t": 612.1588399999999, "r": 480.58731000000006, "b": 631.18761, "coord_origin": "TOPLEFT"}, "confidence": 0.9617196321487427, "cells": [{"id": 47, "text": "3.", "bbox": {"l": 139.37097, "t": 612.1588399999999, "r": 146.4379, "b": 620.22861, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Chi, Z., Huang, H., Xu, H.D., Yu, H., Yin, W., Mao, X.L.: Complicated table", "bbox": {"l": 150.98117, "t": 612.1588399999999, "r": 480.58731000000006, "b": 620.22861, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "structure recognition. arXiv preprint arXiv:1908.04729 (2019)", "bbox": {"l": 151.51797, "t": 623.11784, "r": 400.22525, "b": 631.18761, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "list_item", "bbox": {"l": 139.37097, "t": 634.88084, "r": 480.58826, "b": 664.86761, "coord_origin": "TOPLEFT"}, "confidence": 0.9754673838615417, "cells": [{"id": 50, "text": "4.", "bbox": {"l": 139.37097, "t": 634.88084, "r": 146.52443, "b": 642.95061, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Deng, Y., Rosenberg, D., Mann, G.: Challenges in end-to-end neural scientific", "bbox": {"l": 151.12335, "t": 634.88084, "r": 480.58826, "b": 642.95061, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "table recognition. In: 2019 International Conference on Document Analysis and", "bbox": {"l": 151.51797, "t": 645.83984, "r": 480.58752, "b": 653.9096099999999, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Recognition (ICDAR). pp. 894-901. IEEE (2019)", "bbox": {"l": 151.51797, "t": 656.79785, "r": 350.11115, "b": 664.86761, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_header", "id": 10, "page_no": 11, "cluster": {"id": 10, "label": "page_header", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 143.97887, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8610832691192627, "cells": [{"id": 0, "text": "12", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 143.97887, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "12"}, {"label": "page_header", "id": 9, "page_no": 11, "cluster": {"id": 9, "label": "page_header", "bbox": {"l": 167.82053, "t": 93.77099999999996, "r": 231.72049000000004, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8927664756774902, "cells": [{"id": 1, "text": "M.", "bbox": {"l": 167.82053, "t": 93.77099999999996, "r": 178.08249, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37929, "t": 93.77099999999996, "r": 231.72049000000004, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "M. Lysak, et al."}, {"label": "section_header", "id": 8, "page_no": 11, "cluster": {"id": 8, "label": "section_header", "bbox": {"l": 134.765, "t": 117.54894999999988, "r": 219.25478999999999, "b": 128.11737000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.915635347366333, "cells": [{"id": 3, "text": "6", "bbox": {"l": 134.765, "t": 117.54894999999988, "r": 141.4886, "b": 128.11737000000005, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Conclusion", "bbox": {"l": 154.9382, "t": 117.54894999999988, "r": 219.25478999999999, "b": 128.11737000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "6 Conclusion"}, {"label": "text", "id": 2, "page_no": 11, "cluster": {"id": 2, "label": "text", "bbox": {"l": 134.765, "t": 146.86377000000005, "r": 480.59569999999997, "b": 203.48181, "coord_origin": "TOPLEFT"}, "confidence": 0.9806171655654907, "cells": [{"id": 5, "text": "We demonstrated that representing tables in HTML for the task of table struc-", "bbox": {"l": 134.765, "t": 146.86377000000005, "r": 480.59476, "b": 155.66076999999996, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "ture recognition with Im2Seq models is ill-suited and has serious limitations.", "bbox": {"l": 134.765, "t": 158.81879000000004, "r": 480.59476, "b": 167.61577999999997, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Furthermore, we presented in this paper an Optimized Table Structure Language", "bbox": {"l": 134.765, "t": 170.77380000000005, "r": 480.58978, "b": 179.57079999999996, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "(OTSL) which, when compared to commonly used general purpose languages,", "bbox": {"l": 134.765, "t": 182.72979999999995, "r": 480.59569999999997, "b": 191.52679, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "has several key benefits.", "bbox": {"l": 134.765, "t": 194.68480999999997, "r": 239.5387, "b": 203.48181, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "We demonstrated that representing tables in HTML for the task of table structure recognition with Im2Seq models is ill-suited and has serious limitations. Furthermore, we presented in this paper an Optimized Table Structure Language (OTSL) which, when compared to commonly used general purpose languages, has several key benefits."}, {"label": "text", "id": 0, "page_no": 11, "cluster": {"id": 0, "label": "text", "bbox": {"l": 134.765, "t": 207.44379000000004, "r": 480.59479, "b": 323.83679, "coord_origin": "TOPLEFT"}, "confidence": 0.9873476028442383, "cells": [{"id": 10, "text": "First and foremost, given the same network configuration, inference time for", "bbox": {"l": 149.709, "t": 207.44379000000004, "r": 480.59283000000005, "b": 216.24077999999997, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "a table-structure prediction is about 2 times faster compared to the conventional", "bbox": {"l": 134.765, "t": 219.39880000000005, "r": 480.59365999999994, "b": 228.19579999999996, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "HTML approach. This is primarily owed to the shorter sequence length of the", "bbox": {"l": 134.765, "t": 231.35382000000004, "r": 480.59079, "b": 240.15081999999995, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "OTSL representation. Additional performance benefits can be obtained with", "bbox": {"l": 134.765, "t": 243.30884000000003, "r": 480.58786000000003, "b": 252.10582999999997, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "HPO (hyper parameter optimization). As we demonstrate in our experiments,", "bbox": {"l": 134.765, "t": 255.26482999999996, "r": 480.59479, "b": 264.06183, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "models trained on OTSL can be significantly smaller, e.g. by reducing the number", "bbox": {"l": 134.765, "t": 267.21984999999995, "r": 480.5878000000001, "b": 276.01685, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "of encoder and decoder layers, while preserving comparatively good prediction", "bbox": {"l": 134.765, "t": 279.17487000000006, "r": 480.59268, "b": 287.97183, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "quality. This can further improve inference performance, yielding 5-6 times faster", "bbox": {"l": 134.765, "t": 291.12985, "r": 480.58871, "b": 299.92682, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "inference speed in OTSL with prediction quality comparable to models trained", "bbox": {"l": 134.765, "t": 303.08484, "r": 480.59375, "b": 311.88181, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "on HTML (see Table 1).", "bbox": {"l": 134.765, "t": 315.03983, "r": 240.92351000000002, "b": 323.83679, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "First and foremost, given the same network configuration, inference time for a table-structure prediction is about 2 times faster compared to the conventional HTML approach. This is primarily owed to the shorter sequence length of the OTSL representation. Additional performance benefits can be obtained with HPO (hyper parameter optimization). As we demonstrate in our experiments, models trained on OTSL can be significantly smaller, e.g. by reducing the number of encoder and decoder layers, while preserving comparatively good prediction quality. This can further improve inference performance, yielding 5-6 times faster inference speed in OTSL with prediction quality comparable to models trained on HTML (see Table 1)."}, {"label": "text", "id": 1, "page_no": 11, "cluster": {"id": 1, "label": "text", "bbox": {"l": 134.765, "t": 327.79883, "r": 480.59482, "b": 468.10266, "coord_origin": "TOPLEFT"}, "confidence": 0.9868747591972351, "cells": [{"id": 20, "text": "Secondly, OTSL has more inherent structure and a significantly restricted vo-", "bbox": {"l": 149.709, "t": 327.79883, "r": 480.58984, "b": 336.5957900000001, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "cabulary size. This allows autoregressive models to perform better in the TED", "bbox": {"l": 134.765, "t": 339.75482, "r": 480.59473, "b": 348.55179, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "metric, but especially with regards to prediction accuracy of the table-cell bound-", "bbox": {"l": 134.765, "t": 351.70981, "r": 480.58664, "b": 360.50677, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "ing boxes (see Table 2). As shown in Figure 5, we observe that the OTSL dras-", "bbox": {"l": 134.765, "t": 363.66479, "r": 480.59479, "b": 372.46176, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "tically reduces the drift for table cell bounding boxes at high row count and in", "bbox": {"l": 134.765, "t": 375.61978, "r": 480.58971999999994, "b": 384.41675, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "sparse tables. This leads to more accurate predictions and a significant reduction", "bbox": {"l": 134.765, "t": 387.57477, "r": 480.58673, "b": 396.37173, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "in post-processing complexity, which is an undesired necessity in HTML-based", "bbox": {"l": 134.765, "t": 399.53076, "r": 480.58574999999996, "b": 408.32773, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Im2Seq models. Significant novelty lies in OTSL syntactical rules, which are few,", "bbox": {"l": 134.765, "t": 411.48575, "r": 480.58675999999997, "b": 420.28271, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "simple and always backwards looking. Each new token can be validated only by", "bbox": {"l": 134.765, "t": 423.44073, "r": 480.59482, "b": 432.23769999999996, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "analyzing the sequence of previous tokens, without requiring the entire sequence", "bbox": {"l": 134.765, "t": 435.39572, "r": 480.58777, "b": 444.19269, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "to detect mistakes. This in return allows to perform structural error detection", "bbox": {"l": 134.765, "t": 447.35071, "r": 480.58968999999996, "b": 456.14767, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "and correction on-the-fly during sequence generation.", "bbox": {"l": 134.765, "t": 459.30569, "r": 366.77698, "b": 468.10266, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Secondly, OTSL has more inherent structure and a significantly restricted vocabulary size. This allows autoregressive models to perform better in the TED metric, but especially with regards to prediction accuracy of the table-cell bounding boxes (see Table 2). As shown in Figure 5, we observe that the OTSL drastically reduces the drift for table cell bounding boxes at high row count and in sparse tables. This leads to more accurate predictions and a significant reduction in post-processing complexity, which is an undesired necessity in HTML-based Im2Seq models. Significant novelty lies in OTSL syntactical rules, which are few, simple and always backwards looking. Each new token can be validated only by analyzing the sequence of previous tokens, without requiring the entire sequence to detect mistakes. This in return allows to perform structural error detection and correction on-the-fly during sequence generation."}, {"label": "section_header", "id": 7, "page_no": 11, "cluster": {"id": 7, "label": "section_header", "bbox": {"l": 134.765, "t": 493.82083, "r": 197.68642, "b": 504.38922, "coord_origin": "TOPLEFT"}, "confidence": 0.9403266310691833, "cells": [{"id": 32, "text": "References", "bbox": {"l": 134.765, "t": 493.82083, "r": 197.68642, "b": 504.38922, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "References"}, {"label": "list_item", "id": 5, "page_no": 11, "cluster": {"id": 5, "label": "list_item", "bbox": {"l": 139.371, "t": 522.87985, "r": 480.5920100000001, "b": 563.87144, "coord_origin": "TOPLEFT"}, "confidence": 0.9698606729507446, "cells": [{"id": 33, "text": "1.", "bbox": {"l": 139.371, "t": 522.87985, "r": 146.46127, "b": 530.94962, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Auer, C., Dolfi, M., Carvalho, A., Ramis, C.B., Staar, P.W.J.: Delivering doc-", "bbox": {"l": 151.01955, "t": 522.87985, "r": 480.5920100000001, "b": 530.94962, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "ument conversion as a cloud service with high throughput and responsiveness.", "bbox": {"l": 151.51801, "t": 533.83887, "r": 480.58667, "b": 541.90862, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "CoRR", "bbox": {"l": 151.51801, "t": 544.79785, "r": 176.34149, "b": 552.86761, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "abs/2206.00785", "bbox": {"l": 179.464, "t": 544.73509, "r": 250.67963, "b": 552.66139, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "(2022).", "bbox": {"l": 253.804, "t": 544.79785, "r": 281.9567, "b": 552.86761, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "https://doi.org/10.48550/arXiv.2206.00785", "bbox": {"l": 285.078, "t": 545.44344, "r": 478.03403000000003, "b": 552.91245, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": ",", "bbox": {"l": 478.0319799999999, "t": 544.79785, "r": 480.59099999999995, "b": 552.86761, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "https://doi.org/10.48550/arXiv.2206.00785", "bbox": {"l": 151.51797, "t": 556.4024400000001, "r": 344.474, "b": 563.87144, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1. Auer, C., Dolfi, M., Carvalho, A., Ramis, C.B., Staar, P.W.J.: Delivering document conversion as a cloud service with high throughput and responsiveness. CoRR abs/2206.00785 (2022). https://doi.org/10.48550/arXiv.2206.00785 , https://doi.org/10.48550/arXiv.2206.00785"}, {"label": "list_item", "id": 4, "page_no": 11, "cluster": {"id": 4, "label": "list_item", "bbox": {"l": 139.37097, "t": 567.51884, "r": 480.5920100000001, "b": 608.46561, "coord_origin": "TOPLEFT"}, "confidence": 0.9730570316314697, "cells": [{"id": 42, "text": "2.", "bbox": {"l": 139.37097, "t": 567.51884, "r": 145.94186, "b": 575.58861, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Chen, B., Peng, D., Zhang, J., Ren, Y., Jin, L.: Complex table structure recognition", "bbox": {"l": 150.16624, "t": 567.51884, "r": 480.58636, "b": 575.58861, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "in the wild using transformer and identity matrix-based augmentation. In: Porwal,", "bbox": {"l": 151.51797, "t": 578.47784, "r": 480.59012, "b": 586.5476100000001, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "U., Forn\u00e9s, A., Shafait, F. (eds.) Frontiers in Handwriting Recognition. pp. 545-", "bbox": {"l": 151.51797, "t": 589.43684, "r": 480.5920100000001, "b": 597.50661, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "561. Springer International Publishing, Cham (2022)", "bbox": {"l": 151.51797, "t": 600.39584, "r": 364.17856, "b": 608.46561, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2. Chen, B., Peng, D., Zhang, J., Ren, Y., Jin, L.: Complex table structure recognition in the wild using transformer and identity matrix-based augmentation. In: Porwal, U., Forn\u00e9s, A., Shafait, F. (eds.) Frontiers in Handwriting Recognition. pp. 545561. Springer International Publishing, Cham (2022)"}, {"label": "list_item", "id": 6, "page_no": 11, "cluster": {"id": 6, "label": "list_item", "bbox": {"l": 139.37097, "t": 612.1588399999999, "r": 480.58731000000006, "b": 631.18761, "coord_origin": "TOPLEFT"}, "confidence": 0.9617196321487427, "cells": [{"id": 47, "text": "3.", "bbox": {"l": 139.37097, "t": 612.1588399999999, "r": 146.4379, "b": 620.22861, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Chi, Z., Huang, H., Xu, H.D., Yu, H., Yin, W., Mao, X.L.: Complicated table", "bbox": {"l": 150.98117, "t": 612.1588399999999, "r": 480.58731000000006, "b": 620.22861, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "structure recognition. arXiv preprint arXiv:1908.04729 (2019)", "bbox": {"l": 151.51797, "t": 623.11784, "r": 400.22525, "b": 631.18761, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3. Chi, Z., Huang, H., Xu, H.D., Yu, H., Yin, W., Mao, X.L.: Complicated table structure recognition. arXiv preprint arXiv:1908.04729 (2019)"}, {"label": "list_item", "id": 3, "page_no": 11, "cluster": {"id": 3, "label": "list_item", "bbox": {"l": 139.37097, "t": 634.88084, "r": 480.58826, "b": 664.86761, "coord_origin": "TOPLEFT"}, "confidence": 0.9754673838615417, "cells": [{"id": 50, "text": "4.", "bbox": {"l": 139.37097, "t": 634.88084, "r": 146.52443, "b": 642.95061, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Deng, Y., Rosenberg, D., Mann, G.: Challenges in end-to-end neural scientific", "bbox": {"l": 151.12335, "t": 634.88084, "r": 480.58826, "b": 642.95061, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "table recognition. In: 2019 International Conference on Document Analysis and", "bbox": {"l": 151.51797, "t": 645.83984, "r": 480.58752, "b": 653.9096099999999, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Recognition (ICDAR). pp. 894-901. IEEE (2019)", "bbox": {"l": 151.51797, "t": 656.79785, "r": 350.11115, "b": 664.86761, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4. Deng, Y., Rosenberg, D., Mann, G.: Challenges in end-to-end neural scientific table recognition. In: 2019 International Conference on Document Analysis and Recognition (ICDAR). pp. 894-901. IEEE (2019)"}], "body": [{"label": "section_header", "id": 8, "page_no": 11, "cluster": {"id": 8, "label": "section_header", "bbox": {"l": 134.765, "t": 117.54894999999988, "r": 219.25478999999999, "b": 128.11737000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.915635347366333, "cells": [{"id": 3, "text": "6", "bbox": {"l": 134.765, "t": 117.54894999999988, "r": 141.4886, "b": 128.11737000000005, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Conclusion", "bbox": {"l": 154.9382, "t": 117.54894999999988, "r": 219.25478999999999, "b": 128.11737000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "6 Conclusion"}, {"label": "text", "id": 2, "page_no": 11, "cluster": {"id": 2, "label": "text", "bbox": {"l": 134.765, "t": 146.86377000000005, "r": 480.59569999999997, "b": 203.48181, "coord_origin": "TOPLEFT"}, "confidence": 0.9806171655654907, "cells": [{"id": 5, "text": "We demonstrated that representing tables in HTML for the task of table struc-", "bbox": {"l": 134.765, "t": 146.86377000000005, "r": 480.59476, "b": 155.66076999999996, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "ture recognition with Im2Seq models is ill-suited and has serious limitations.", "bbox": {"l": 134.765, "t": 158.81879000000004, "r": 480.59476, "b": 167.61577999999997, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Furthermore, we presented in this paper an Optimized Table Structure Language", "bbox": {"l": 134.765, "t": 170.77380000000005, "r": 480.58978, "b": 179.57079999999996, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "(OTSL) which, when compared to commonly used general purpose languages,", "bbox": {"l": 134.765, "t": 182.72979999999995, "r": 480.59569999999997, "b": 191.52679, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "has several key benefits.", "bbox": {"l": 134.765, "t": 194.68480999999997, "r": 239.5387, "b": 203.48181, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "We demonstrated that representing tables in HTML for the task of table structure recognition with Im2Seq models is ill-suited and has serious limitations. Furthermore, we presented in this paper an Optimized Table Structure Language (OTSL) which, when compared to commonly used general purpose languages, has several key benefits."}, {"label": "text", "id": 0, "page_no": 11, "cluster": {"id": 0, "label": "text", "bbox": {"l": 134.765, "t": 207.44379000000004, "r": 480.59479, "b": 323.83679, "coord_origin": "TOPLEFT"}, "confidence": 0.9873476028442383, "cells": [{"id": 10, "text": "First and foremost, given the same network configuration, inference time for", "bbox": {"l": 149.709, "t": 207.44379000000004, "r": 480.59283000000005, "b": 216.24077999999997, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "a table-structure prediction is about 2 times faster compared to the conventional", "bbox": {"l": 134.765, "t": 219.39880000000005, "r": 480.59365999999994, "b": 228.19579999999996, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "HTML approach. This is primarily owed to the shorter sequence length of the", "bbox": {"l": 134.765, "t": 231.35382000000004, "r": 480.59079, "b": 240.15081999999995, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "OTSL representation. Additional performance benefits can be obtained with", "bbox": {"l": 134.765, "t": 243.30884000000003, "r": 480.58786000000003, "b": 252.10582999999997, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "HPO (hyper parameter optimization). As we demonstrate in our experiments,", "bbox": {"l": 134.765, "t": 255.26482999999996, "r": 480.59479, "b": 264.06183, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "models trained on OTSL can be significantly smaller, e.g. by reducing the number", "bbox": {"l": 134.765, "t": 267.21984999999995, "r": 480.5878000000001, "b": 276.01685, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "of encoder and decoder layers, while preserving comparatively good prediction", "bbox": {"l": 134.765, "t": 279.17487000000006, "r": 480.59268, "b": 287.97183, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "quality. This can further improve inference performance, yielding 5-6 times faster", "bbox": {"l": 134.765, "t": 291.12985, "r": 480.58871, "b": 299.92682, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "inference speed in OTSL with prediction quality comparable to models trained", "bbox": {"l": 134.765, "t": 303.08484, "r": 480.59375, "b": 311.88181, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "on HTML (see Table 1).", "bbox": {"l": 134.765, "t": 315.03983, "r": 240.92351000000002, "b": 323.83679, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "First and foremost, given the same network configuration, inference time for a table-structure prediction is about 2 times faster compared to the conventional HTML approach. This is primarily owed to the shorter sequence length of the OTSL representation. Additional performance benefits can be obtained with HPO (hyper parameter optimization). As we demonstrate in our experiments, models trained on OTSL can be significantly smaller, e.g. by reducing the number of encoder and decoder layers, while preserving comparatively good prediction quality. This can further improve inference performance, yielding 5-6 times faster inference speed in OTSL with prediction quality comparable to models trained on HTML (see Table 1)."}, {"label": "text", "id": 1, "page_no": 11, "cluster": {"id": 1, "label": "text", "bbox": {"l": 134.765, "t": 327.79883, "r": 480.59482, "b": 468.10266, "coord_origin": "TOPLEFT"}, "confidence": 0.9868747591972351, "cells": [{"id": 20, "text": "Secondly, OTSL has more inherent structure and a significantly restricted vo-", "bbox": {"l": 149.709, "t": 327.79883, "r": 480.58984, "b": 336.5957900000001, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "cabulary size. This allows autoregressive models to perform better in the TED", "bbox": {"l": 134.765, "t": 339.75482, "r": 480.59473, "b": 348.55179, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "metric, but especially with regards to prediction accuracy of the table-cell bound-", "bbox": {"l": 134.765, "t": 351.70981, "r": 480.58664, "b": 360.50677, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "ing boxes (see Table 2). As shown in Figure 5, we observe that the OTSL dras-", "bbox": {"l": 134.765, "t": 363.66479, "r": 480.59479, "b": 372.46176, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "tically reduces the drift for table cell bounding boxes at high row count and in", "bbox": {"l": 134.765, "t": 375.61978, "r": 480.58971999999994, "b": 384.41675, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "sparse tables. This leads to more accurate predictions and a significant reduction", "bbox": {"l": 134.765, "t": 387.57477, "r": 480.58673, "b": 396.37173, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "in post-processing complexity, which is an undesired necessity in HTML-based", "bbox": {"l": 134.765, "t": 399.53076, "r": 480.58574999999996, "b": 408.32773, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Im2Seq models. Significant novelty lies in OTSL syntactical rules, which are few,", "bbox": {"l": 134.765, "t": 411.48575, "r": 480.58675999999997, "b": 420.28271, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "simple and always backwards looking. Each new token can be validated only by", "bbox": {"l": 134.765, "t": 423.44073, "r": 480.59482, "b": 432.23769999999996, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "analyzing the sequence of previous tokens, without requiring the entire sequence", "bbox": {"l": 134.765, "t": 435.39572, "r": 480.58777, "b": 444.19269, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "to detect mistakes. This in return allows to perform structural error detection", "bbox": {"l": 134.765, "t": 447.35071, "r": 480.58968999999996, "b": 456.14767, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "and correction on-the-fly during sequence generation.", "bbox": {"l": 134.765, "t": 459.30569, "r": 366.77698, "b": 468.10266, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Secondly, OTSL has more inherent structure and a significantly restricted vocabulary size. This allows autoregressive models to perform better in the TED metric, but especially with regards to prediction accuracy of the table-cell bounding boxes (see Table 2). As shown in Figure 5, we observe that the OTSL drastically reduces the drift for table cell bounding boxes at high row count and in sparse tables. This leads to more accurate predictions and a significant reduction in post-processing complexity, which is an undesired necessity in HTML-based Im2Seq models. Significant novelty lies in OTSL syntactical rules, which are few, simple and always backwards looking. Each new token can be validated only by analyzing the sequence of previous tokens, without requiring the entire sequence to detect mistakes. This in return allows to perform structural error detection and correction on-the-fly during sequence generation."}, {"label": "section_header", "id": 7, "page_no": 11, "cluster": {"id": 7, "label": "section_header", "bbox": {"l": 134.765, "t": 493.82083, "r": 197.68642, "b": 504.38922, "coord_origin": "TOPLEFT"}, "confidence": 0.9403266310691833, "cells": [{"id": 32, "text": "References", "bbox": {"l": 134.765, "t": 493.82083, "r": 197.68642, "b": 504.38922, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "References"}, {"label": "list_item", "id": 5, "page_no": 11, "cluster": {"id": 5, "label": "list_item", "bbox": {"l": 139.371, "t": 522.87985, "r": 480.5920100000001, "b": 563.87144, "coord_origin": "TOPLEFT"}, "confidence": 0.9698606729507446, "cells": [{"id": 33, "text": "1.", "bbox": {"l": 139.371, "t": 522.87985, "r": 146.46127, "b": 530.94962, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Auer, C., Dolfi, M., Carvalho, A., Ramis, C.B., Staar, P.W.J.: Delivering doc-", "bbox": {"l": 151.01955, "t": 522.87985, "r": 480.5920100000001, "b": 530.94962, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "ument conversion as a cloud service with high throughput and responsiveness.", "bbox": {"l": 151.51801, "t": 533.83887, "r": 480.58667, "b": 541.90862, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "CoRR", "bbox": {"l": 151.51801, "t": 544.79785, "r": 176.34149, "b": 552.86761, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "abs/2206.00785", "bbox": {"l": 179.464, "t": 544.73509, "r": 250.67963, "b": 552.66139, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "(2022).", "bbox": {"l": 253.804, "t": 544.79785, "r": 281.9567, "b": 552.86761, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "https://doi.org/10.48550/arXiv.2206.00785", "bbox": {"l": 285.078, "t": 545.44344, "r": 478.03403000000003, "b": 552.91245, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": ",", "bbox": {"l": 478.0319799999999, "t": 544.79785, "r": 480.59099999999995, "b": 552.86761, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "https://doi.org/10.48550/arXiv.2206.00785", "bbox": {"l": 151.51797, "t": 556.4024400000001, "r": 344.474, "b": 563.87144, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1. Auer, C., Dolfi, M., Carvalho, A., Ramis, C.B., Staar, P.W.J.: Delivering document conversion as a cloud service with high throughput and responsiveness. CoRR abs/2206.00785 (2022). https://doi.org/10.48550/arXiv.2206.00785 , https://doi.org/10.48550/arXiv.2206.00785"}, {"label": "list_item", "id": 4, "page_no": 11, "cluster": {"id": 4, "label": "list_item", "bbox": {"l": 139.37097, "t": 567.51884, "r": 480.5920100000001, "b": 608.46561, "coord_origin": "TOPLEFT"}, "confidence": 0.9730570316314697, "cells": [{"id": 42, "text": "2.", "bbox": {"l": 139.37097, "t": 567.51884, "r": 145.94186, "b": 575.58861, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Chen, B., Peng, D., Zhang, J., Ren, Y., Jin, L.: Complex table structure recognition", "bbox": {"l": 150.16624, "t": 567.51884, "r": 480.58636, "b": 575.58861, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "in the wild using transformer and identity matrix-based augmentation. In: Porwal,", "bbox": {"l": 151.51797, "t": 578.47784, "r": 480.59012, "b": 586.5476100000001, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "U., Forn\u00e9s, A., Shafait, F. (eds.) Frontiers in Handwriting Recognition. pp. 545-", "bbox": {"l": 151.51797, "t": 589.43684, "r": 480.5920100000001, "b": 597.50661, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "561. Springer International Publishing, Cham (2022)", "bbox": {"l": 151.51797, "t": 600.39584, "r": 364.17856, "b": 608.46561, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2. Chen, B., Peng, D., Zhang, J., Ren, Y., Jin, L.: Complex table structure recognition in the wild using transformer and identity matrix-based augmentation. In: Porwal, U., Forn\u00e9s, A., Shafait, F. (eds.) Frontiers in Handwriting Recognition. pp. 545561. Springer International Publishing, Cham (2022)"}, {"label": "list_item", "id": 6, "page_no": 11, "cluster": {"id": 6, "label": "list_item", "bbox": {"l": 139.37097, "t": 612.1588399999999, "r": 480.58731000000006, "b": 631.18761, "coord_origin": "TOPLEFT"}, "confidence": 0.9617196321487427, "cells": [{"id": 47, "text": "3.", "bbox": {"l": 139.37097, "t": 612.1588399999999, "r": 146.4379, "b": 620.22861, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Chi, Z., Huang, H., Xu, H.D., Yu, H., Yin, W., Mao, X.L.: Complicated table", "bbox": {"l": 150.98117, "t": 612.1588399999999, "r": 480.58731000000006, "b": 620.22861, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "structure recognition. arXiv preprint arXiv:1908.04729 (2019)", "bbox": {"l": 151.51797, "t": 623.11784, "r": 400.22525, "b": 631.18761, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3. Chi, Z., Huang, H., Xu, H.D., Yu, H., Yin, W., Mao, X.L.: Complicated table structure recognition. arXiv preprint arXiv:1908.04729 (2019)"}, {"label": "list_item", "id": 3, "page_no": 11, "cluster": {"id": 3, "label": "list_item", "bbox": {"l": 139.37097, "t": 634.88084, "r": 480.58826, "b": 664.86761, "coord_origin": "TOPLEFT"}, "confidence": 0.9754673838615417, "cells": [{"id": 50, "text": "4.", "bbox": {"l": 139.37097, "t": 634.88084, "r": 146.52443, "b": 642.95061, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "Deng, Y., Rosenberg, D., Mann, G.: Challenges in end-to-end neural scientific", "bbox": {"l": 151.12335, "t": 634.88084, "r": 480.58826, "b": 642.95061, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "table recognition. In: 2019 International Conference on Document Analysis and", "bbox": {"l": 151.51797, "t": 645.83984, "r": 480.58752, "b": 653.9096099999999, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Recognition (ICDAR). pp. 894-901. IEEE (2019)", "bbox": {"l": 151.51797, "t": 656.79785, "r": 350.11115, "b": 664.86761, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4. Deng, Y., Rosenberg, D., Mann, G.: Challenges in end-to-end neural scientific table recognition. In: 2019 International Conference on Document Analysis and Recognition (ICDAR). pp. 894-901. IEEE (2019)"}], "headers": [{"label": "page_header", "id": 10, "page_no": 11, "cluster": {"id": 10, "label": "page_header", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 143.97887, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8610832691192627, "cells": [{"id": 0, "text": "12", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 143.97887, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "12"}, {"label": "page_header", "id": 9, "page_no": 11, "cluster": {"id": 9, "label": "page_header", "bbox": {"l": 167.82053, "t": 93.77099999999996, "r": 231.72049000000004, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.8927664756774902, "cells": [{"id": 1, "text": "M.", "bbox": {"l": 167.82053, "t": 93.77099999999996, "r": 178.08249, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37929, "t": 93.77099999999996, "r": 231.72049000000004, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "M. Lysak, et al."}]}}, {"page_no": 12, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "13", "bbox": {"l": 471.37561, "t": 93.77099999999996, "r": 480.5894799999999, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "5.", "bbox": {"l": 139.371, "t": 119.67400999999995, "r": 146.04857, "b": 127.74370999999985, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Kayal, P., Anand, M., Desai, H., Singh, M.: Tables to latex: structure and content", "bbox": {"l": 150.34157, "t": 119.67400999999995, "r": 480.58826, "b": 127.74370999999985, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "extraction from scientific tables. International Journal on Document Analysis and", "bbox": {"l": 151.51801, "t": 130.63300000000004, "r": 480.59479, "b": 138.70270000000005, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Recognition (IJDAR) pp. 1-10 (2022)", "bbox": {"l": 151.51801, "t": 141.59198000000004, "r": 304.04364, "b": 149.66168000000005, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "6.", "bbox": {"l": 139.371, "t": 152.56195000000002, "r": 145.93991, "b": 160.63165000000004, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Lee, E., Kwon, J., Yang, H., Park, J., Lee, S., Koo, H.I., Cho, N.I.: Table structure", "bbox": {"l": 150.16298, "t": 152.56195000000002, "r": 480.59015, "b": 160.63165000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "recognition based on grid shape graph. In: 2022 Asia-Pacific Signal and Information", "bbox": {"l": 151.51801, "t": 163.52094, "r": 480.5903, "b": 171.59064, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Processing Association Annual Summit and Conference (APSIPA ASC). pp. 1868-", "bbox": {"l": 151.51801, "t": 174.47992, "r": 480.59286000000003, "b": 182.54962, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "1873. IEEE (2022)", "bbox": {"l": 151.51801, "t": 185.4389, "r": 226.37399, "b": 193.50860999999998, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "7.", "bbox": {"l": 139.371, "t": 196.40886999999998, "r": 146.31418, "b": 204.47857999999997, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Li, M., Cui, L., Huang, S., Wei, F., Zhou, M., Li, Z.: Tablebank: A benchmark", "bbox": {"l": 150.77789, "t": 196.40886999999998, "r": 480.59012, "b": 204.47857999999997, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "dataset for table detection and recognition (2019)", "bbox": {"l": 151.51801, "t": 207.36785999999995, "r": 352.01746, "b": 215.43755999999996, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "8.", "bbox": {"l": 139.371, "t": 218.33887000000004, "r": 146.37106, "b": 226.40857000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Livathinos, N., Berrospi, C., Lysak, M., Kuropiatnyk, V., Nassar, A., Carvalho,", "bbox": {"l": 150.87132, "t": 218.33887000000004, "r": 480.58731000000006, "b": 226.40857000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "A., Dolfi, M., Auer, C., Dinkla, K., Staar, P.: Robust pdf document conversion", "bbox": {"l": 151.51801, "t": 229.29785000000004, "r": 480.59020999999996, "b": 237.36755000000005, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "using recurrent neural networks. Proceedings of the AAAI Conference on Artificial", "bbox": {"l": 151.51801, "t": 240.25684, "r": 480.59473, "b": 248.32654000000002, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Intelligence", "bbox": {"l": 151.51801, "t": 251.21582, "r": 197.08617, "b": 259.28552, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "35", "bbox": {"l": 199.40001, "t": 251.15301999999997, "r": 210.00726, "b": 259.07935, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "(17), 15137-15145 (May 2021),", "bbox": {"l": 210.007, "t": 251.21582, "r": 332.37683, "b": 259.28552, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "https://ojs.aaai.org/index.php/", "bbox": {"l": 334.69901, "t": 251.86139000000003, "r": 480.59039000000007, "b": 259.33038, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "AAAI/article/view/17777", "bbox": {"l": 151.51801, "t": 262.8194, "r": 259.75769, "b": 270.28839000000005, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "9.", "bbox": {"l": 139.371, "t": 273.14484000000004, "r": 146.14218, "b": 281.21457, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "Nassar, A., Livathinos, N., Lysak, M., Staar, P.: Tableformer: Table structure un-", "bbox": {"l": 150.49533, "t": 273.14484000000004, "r": 480.5881999999999, "b": 281.21457, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "derstanding with transformers. In: Proceedings of the IEEE/CVF Conference on", "bbox": {"l": 151.51801, "t": 284.10379, "r": 480.59387000000004, "b": 292.17355, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "Computer Vision and Pattern Recognition (CVPR). pp. 4614-4623 (June 2022)", "bbox": {"l": 151.51801, "t": 295.06277, "r": 473.44308000000007, "b": 303.13254, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "10.", "bbox": {"l": 134.76401, "t": 306.03277999999995, "r": 146.49922, "b": 314.10254000000003, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Pfitzmann, B., Auer, C., Dolfi, M., Nassar, A.S., Staar, P.W.J.: Doclaynet: A", "bbox": {"l": 151.09138, "t": 306.03277999999995, "r": 480.58905, "b": 314.10254000000003, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "large human-annotated dataset for document-layout segmentation. In: Zhang, A.,", "bbox": {"l": 151.51801, "t": 316.99179, "r": 480.59015, "b": 325.06155, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Rangwala, H. (eds.) KDD \u201922: The 28th ACM SIGKDD Conference on Knowledge", "bbox": {"l": 151.51801, "t": 327.95078, "r": 480.59113, "b": 336.02054, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Discovery and Data Mining, Washington, DC, USA, August 14 - 18, 2022. pp.", "bbox": {"l": 151.51801, "t": 338.90976, "r": 480.59113, "b": 346.97952, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "3743-3751. ACM (2022).", "bbox": {"l": 151.51801, "t": 349.86874, "r": 251.14098999999996, "b": 357.93851, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "https://doi.org/10.1145/3534678.3539043", "bbox": {"l": 253.99001, "t": 350.5143100000001, "r": 437.53311, "b": 357.98333999999994, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": ",", "bbox": {"l": 437.53201, "t": 349.86874, "r": 440.09102999999993, "b": 357.93851, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "https://", "bbox": {"l": 442.94202000000007, "t": 350.5143100000001, "r": 480.59372, "b": 357.98333999999994, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "doi.org/10.1145/3534678.3539043", "bbox": {"l": 151.51801, "t": 361.47329999999994, "r": 297.40939, "b": 368.94232, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "11.", "bbox": {"l": 134.76401, "t": 371.79773, "r": 146.03854, "b": 379.86749, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "Prasad, D., Gadpal, A., Kapadni, K., Visave, M., Sultanpure, K.: Cascadetabnet:", "bbox": {"l": 150.4505, "t": 371.79773, "r": 480.58914000000004, "b": 379.86749, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "An approach for end to end table detection and structure recognition from image-", "bbox": {"l": 151.51801, "t": 382.7567399999999, "r": 480.59296, "b": 390.82651, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "based documents. In: Proceedings of the IEEE/CVF conference on computer vision", "bbox": {"l": 151.51801, "t": 393.71573, "r": 480.59293, "b": 401.78549, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "and pattern recognition workshops. pp. 572-573 (2020)", "bbox": {"l": 151.51801, "t": 404.67471, "r": 373.82727, "b": 412.74448, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "12.", "bbox": {"l": 134.76401, "t": 415.64471, "r": 145.91106, "b": 423.71448000000004, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Schreiber, S., Agne, S., Wolf, I., Dengel, A., Ahmed, S.: Deepdesrt: Deep learning", "bbox": {"l": 150.27309, "t": 415.64471, "r": 480.5874, "b": 423.71448000000004, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "for detection and structure recognition of tables in document images. In: 2017 14th", "bbox": {"l": 151.51801, "t": 426.60373, "r": 480.59469999999993, "b": 434.67349, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "IAPR international conference on document analysis and recognition (ICDAR).", "bbox": {"l": 151.51801, "t": 437.5627099999999, "r": 480.58844, "b": 445.63248, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "vol. 1, pp. 1162-1167. IEEE (2017)", "bbox": {"l": 151.51801, "t": 448.5217, "r": 292.91455, "b": 456.59146, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "13.", "bbox": {"l": 134.76401, "t": 459.4917, "r": 145.7785, "b": 467.56146, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Siddiqui, S.A., Fateh, I.A., Rizvi, S.T.R., Dengel, A., Ahmed, S.: Deeptabstr: Deep", "bbox": {"l": 150.08871, "t": 459.4917, "r": 480.59006, "b": 467.56146, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "learning based table structure recognition. In: 2019 International Conference on", "bbox": {"l": 151.51801, "t": 470.45071, "r": 480.59116, "b": 478.52048, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Document Analysis and Recognition (ICDAR). pp. 1403-1409 (2019).", "bbox": {"l": 151.51801, "t": 481.4097, "r": 439.05963, "b": 489.47946, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "https://", "bbox": {"l": 442.94202000000007, "t": 482.05527, "r": 480.59372, "b": 489.52429, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "doi.org/10.1109/ICDAR.2019.00226", "bbox": {"l": 151.51801, "t": 493.01425, "r": 302.11584, "b": 500.48328, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "14.", "bbox": {"l": 134.76401, "t": 503.33868, "r": 146.15501, "b": 511.40845, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "Smock, B., Pesala, R., Abraham, R.: PubTables-1M: Towards comprehensive ta-", "bbox": {"l": 150.61252, "t": 503.33868, "r": 480.59088, "b": 511.40845, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "ble extraction from unstructured documents. In: Proceedings of the IEEE/CVF", "bbox": {"l": 151.51801, "t": 514.2977000000001, "r": 480.59286000000003, "b": 522.3674599999999, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Conference on Computer Vision and Pattern Recognition (CVPR). pp. 4634-4642", "bbox": {"l": 151.51801, "t": 525.25668, "r": 480.58838000000003, "b": 533.32645, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "(June 2022)", "bbox": {"l": 151.51801, "t": 536.21568, "r": 199.24704, "b": 544.28545, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "15.", "bbox": {"l": 134.76401, "t": 547.18568, "r": 146.16588, "b": 555.25545, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Staar, P.W.J., Dolfi, M., Auer, C., Bekas, C.: Corpus conversion service: A ma-", "bbox": {"l": 150.62764, "t": 547.18568, "r": 480.58734000000004, "b": 555.25545, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "chine learning platform to ingest documents at scale. In: Proceedings of the 24th", "bbox": {"l": 151.51801, "t": 558.14468, "r": 480.58838000000003, "b": 566.2144499999999, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "ACM SIGKDD International Conference on Knowledge Discovery & Data Min-", "bbox": {"l": 151.51801, "t": 569.1036799999999, "r": 480.59109, "b": 577.17345, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "ing. pp. 774-782. KDD \u201918, Association for Computing Machinery, New York, NY,", "bbox": {"l": 151.51801, "t": 580.06268, "r": 480.59195, "b": 588.1324500000001, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "USA (2018).", "bbox": {"l": 151.51801, "t": 591.0216800000001, "r": 200.75787, "b": 599.09145, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "https://doi.org/10.1145/3219819.3219834", "bbox": {"l": 202.916, "t": 591.66727, "r": 386.45911, "b": 599.1362799999999, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": ",", "bbox": {"l": 386.45801, "t": 591.0216800000001, "r": 389.01703, "b": 599.09145, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "https://doi.org/10.", "bbox": {"l": 391.173, "t": 591.66727, "r": 480.59583, "b": 599.1362799999999, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "1145/3219819.3219834", "bbox": {"l": 151.51801, "t": 602.62627, "r": 245.63831, "b": 610.09528, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "16.", "bbox": {"l": 134.76401, "t": 612.95068, "r": 146.62019, "b": 621.02045, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "Wang, X.: Tabular Abstraction, Editing, and Formatting. Ph.D. thesis, CAN", "bbox": {"l": 151.25977, "t": 612.95068, "r": 480.59542999999996, "b": 621.02045, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "(1996), aAINN09397", "bbox": {"l": 151.51801, "t": 623.90968, "r": 234.43031, "b": 631.97945, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "17.", "bbox": {"l": 134.76401, "t": 634.87968, "r": 146.30539, "b": 642.9494500000001, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "Xue, W., Li, Q., Tao, D.: Res2tim: Reconstruct syntactic structures from table", "bbox": {"l": 150.82175, "t": 634.87968, "r": 480.58731000000006, "b": 642.9494500000001, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "images. In: 2019 International Conference on Document Analysis and Recognition", "bbox": {"l": 151.51801, "t": 645.8386800000001, "r": 480.59119, "b": 653.90845, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "(ICDAR). pp. 749-755. IEEE (2019)", "bbox": {"l": 151.51801, "t": 656.79768, "r": 299.30307, "b": 664.86745, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 13, "label": "page_header", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9163166880607605, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "page_header", "bbox": {"l": 471.37561, "t": 93.77099999999996, "r": 480.5894799999999, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9061064720153809, "cells": [{"id": 1, "text": "13", "bbox": {"l": 471.37561, "t": 93.77099999999996, "r": 480.5894799999999, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "list_item", "bbox": {"l": 139.371, "t": 119.67400999999995, "r": 480.59479, "b": 149.66168000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9677112698554993, "cells": [{"id": 2, "text": "5.", "bbox": {"l": 139.371, "t": 119.67400999999995, "r": 146.04857, "b": 127.74370999999985, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Kayal, P., Anand, M., Desai, H., Singh, M.: Tables to latex: structure and content", "bbox": {"l": 150.34157, "t": 119.67400999999995, "r": 480.58826, "b": 127.74370999999985, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "extraction from scientific tables. International Journal on Document Analysis and", "bbox": {"l": 151.51801, "t": 130.63300000000004, "r": 480.59479, "b": 138.70270000000005, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Recognition (IJDAR) pp. 1-10 (2022)", "bbox": {"l": 151.51801, "t": 141.59198000000004, "r": 304.04364, "b": 149.66168000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "list_item", "bbox": {"l": 139.371, "t": 152.56195000000002, "r": 480.59286000000003, "b": 193.50860999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.973045289516449, "cells": [{"id": 6, "text": "6.", "bbox": {"l": 139.371, "t": 152.56195000000002, "r": 145.93991, "b": 160.63165000000004, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Lee, E., Kwon, J., Yang, H., Park, J., Lee, S., Koo, H.I., Cho, N.I.: Table structure", "bbox": {"l": 150.16298, "t": 152.56195000000002, "r": 480.59015, "b": 160.63165000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "recognition based on grid shape graph. In: 2022 Asia-Pacific Signal and Information", "bbox": {"l": 151.51801, "t": 163.52094, "r": 480.5903, "b": 171.59064, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Processing Association Annual Summit and Conference (APSIPA ASC). pp. 1868-", "bbox": {"l": 151.51801, "t": 174.47992, "r": 480.59286000000003, "b": 182.54962, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "1873. IEEE (2022)", "bbox": {"l": 151.51801, "t": 185.4389, "r": 226.37399, "b": 193.50860999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "list_item", "bbox": {"l": 139.371, "t": 196.40886999999998, "r": 480.59012, "b": 215.43755999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9582491517066956, "cells": [{"id": 11, "text": "7.", "bbox": {"l": 139.371, "t": 196.40886999999998, "r": 146.31418, "b": 204.47857999999997, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Li, M., Cui, L., Huang, S., Wei, F., Zhou, M., Li, Z.: Tablebank: A benchmark", "bbox": {"l": 150.77789, "t": 196.40886999999998, "r": 480.59012, "b": 204.47857999999997, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "dataset for table detection and recognition (2019)", "bbox": {"l": 151.51801, "t": 207.36785999999995, "r": 352.01746, "b": 215.43755999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "list_item", "bbox": {"l": 139.371, "t": 218.33887000000004, "r": 480.59473, "b": 270.28839000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.967814564704895, "cells": [{"id": 14, "text": "8.", "bbox": {"l": 139.371, "t": 218.33887000000004, "r": 146.37106, "b": 226.40857000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Livathinos, N., Berrospi, C., Lysak, M., Kuropiatnyk, V., Nassar, A., Carvalho,", "bbox": {"l": 150.87132, "t": 218.33887000000004, "r": 480.58731000000006, "b": 226.40857000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "A., Dolfi, M., Auer, C., Dinkla, K., Staar, P.: Robust pdf document conversion", "bbox": {"l": 151.51801, "t": 229.29785000000004, "r": 480.59020999999996, "b": 237.36755000000005, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "using recurrent neural networks. Proceedings of the AAAI Conference on Artificial", "bbox": {"l": 151.51801, "t": 240.25684, "r": 480.59473, "b": 248.32654000000002, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Intelligence", "bbox": {"l": 151.51801, "t": 251.21582, "r": 197.08617, "b": 259.28552, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "35", "bbox": {"l": 199.40001, "t": 251.15301999999997, "r": 210.00726, "b": 259.07935, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "(17), 15137-15145 (May 2021),", "bbox": {"l": 210.007, "t": 251.21582, "r": 332.37683, "b": 259.28552, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "https://ojs.aaai.org/index.php/", "bbox": {"l": 334.69901, "t": 251.86139000000003, "r": 480.59039000000007, "b": 259.33038, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "AAAI/article/view/17777", "bbox": {"l": 151.51801, "t": 262.8194, "r": 259.75769, "b": 270.28839000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "list_item", "bbox": {"l": 139.371, "t": 273.14484000000004, "r": 480.59387000000004, "b": 303.13254, "coord_origin": "TOPLEFT"}, "confidence": 0.9557179808616638, "cells": [{"id": 23, "text": "9.", "bbox": {"l": 139.371, "t": 273.14484000000004, "r": 146.14218, "b": 281.21457, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "Nassar, A., Livathinos, N., Lysak, M., Staar, P.: Tableformer: Table structure un-", "bbox": {"l": 150.49533, "t": 273.14484000000004, "r": 480.5881999999999, "b": 281.21457, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "derstanding with transformers. In: Proceedings of the IEEE/CVF Conference on", "bbox": {"l": 151.51801, "t": 284.10379, "r": 480.59387000000004, "b": 292.17355, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "Computer Vision and Pattern Recognition (CVPR). pp. 4614-4623 (June 2022)", "bbox": {"l": 151.51801, "t": 295.06277, "r": 473.44308000000007, "b": 303.13254, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "list_item", "bbox": {"l": 134.76401, "t": 306.03277999999995, "r": 480.59372, "b": 368.94232, "coord_origin": "TOPLEFT"}, "confidence": 0.9639304876327515, "cells": [{"id": 27, "text": "10.", "bbox": {"l": 134.76401, "t": 306.03277999999995, "r": 146.49922, "b": 314.10254000000003, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Pfitzmann, B., Auer, C., Dolfi, M., Nassar, A.S., Staar, P.W.J.: Doclaynet: A", "bbox": {"l": 151.09138, "t": 306.03277999999995, "r": 480.58905, "b": 314.10254000000003, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "large human-annotated dataset for document-layout segmentation. In: Zhang, A.,", "bbox": {"l": 151.51801, "t": 316.99179, "r": 480.59015, "b": 325.06155, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Rangwala, H. (eds.) KDD \u201922: The 28th ACM SIGKDD Conference on Knowledge", "bbox": {"l": 151.51801, "t": 327.95078, "r": 480.59113, "b": 336.02054, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Discovery and Data Mining, Washington, DC, USA, August 14 - 18, 2022. pp.", "bbox": {"l": 151.51801, "t": 338.90976, "r": 480.59113, "b": 346.97952, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "3743-3751. ACM (2022).", "bbox": {"l": 151.51801, "t": 349.86874, "r": 251.14098999999996, "b": 357.93851, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "https://doi.org/10.1145/3534678.3539043", "bbox": {"l": 253.99001, "t": 350.5143100000001, "r": 437.53311, "b": 357.98333999999994, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": ",", "bbox": {"l": 437.53201, "t": 349.86874, "r": 440.09102999999993, "b": 357.93851, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "https://", "bbox": {"l": 442.94202000000007, "t": 350.5143100000001, "r": 480.59372, "b": 357.98333999999994, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "doi.org/10.1145/3534678.3539043", "bbox": {"l": 151.51801, "t": 361.47329999999994, "r": 297.40939, "b": 368.94232, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "list_item", "bbox": {"l": 134.76401, "t": 371.79773, "r": 480.59296, "b": 412.74448, "coord_origin": "TOPLEFT"}, "confidence": 0.9752162098884583, "cells": [{"id": 37, "text": "11.", "bbox": {"l": 134.76401, "t": 371.79773, "r": 146.03854, "b": 379.86749, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "Prasad, D., Gadpal, A., Kapadni, K., Visave, M., Sultanpure, K.: Cascadetabnet:", "bbox": {"l": 150.4505, "t": 371.79773, "r": 480.58914000000004, "b": 379.86749, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "An approach for end to end table detection and structure recognition from image-", "bbox": {"l": 151.51801, "t": 382.7567399999999, "r": 480.59296, "b": 390.82651, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "based documents. In: Proceedings of the IEEE/CVF conference on computer vision", "bbox": {"l": 151.51801, "t": 393.71573, "r": 480.59293, "b": 401.78549, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "and pattern recognition workshops. pp. 572-573 (2020)", "bbox": {"l": 151.51801, "t": 404.67471, "r": 373.82727, "b": 412.74448, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "list_item", "bbox": {"l": 134.76401, "t": 415.64471, "r": 480.59469999999993, "b": 456.59146, "coord_origin": "TOPLEFT"}, "confidence": 0.9707236886024475, "cells": [{"id": 42, "text": "12.", "bbox": {"l": 134.76401, "t": 415.64471, "r": 145.91106, "b": 423.71448000000004, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Schreiber, S., Agne, S., Wolf, I., Dengel, A., Ahmed, S.: Deepdesrt: Deep learning", "bbox": {"l": 150.27309, "t": 415.64471, "r": 480.5874, "b": 423.71448000000004, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "for detection and structure recognition of tables in document images. In: 2017 14th", "bbox": {"l": 151.51801, "t": 426.60373, "r": 480.59469999999993, "b": 434.67349, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "IAPR international conference on document analysis and recognition (ICDAR).", "bbox": {"l": 151.51801, "t": 437.5627099999999, "r": 480.58844, "b": 445.63248, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "vol. 1, pp. 1162-1167. IEEE (2017)", "bbox": {"l": 151.51801, "t": 448.5217, "r": 292.91455, "b": 456.59146, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "list_item", "bbox": {"l": 134.76401, "t": 459.4917, "r": 480.59372, "b": 500.48328, "coord_origin": "TOPLEFT"}, "confidence": 0.9658119678497314, "cells": [{"id": 47, "text": "13.", "bbox": {"l": 134.76401, "t": 459.4917, "r": 145.7785, "b": 467.56146, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Siddiqui, S.A., Fateh, I.A., Rizvi, S.T.R., Dengel, A., Ahmed, S.: Deeptabstr: Deep", "bbox": {"l": 150.08871, "t": 459.4917, "r": 480.59006, "b": 467.56146, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "learning based table structure recognition. In: 2019 International Conference on", "bbox": {"l": 151.51801, "t": 470.45071, "r": 480.59116, "b": 478.52048, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Document Analysis and Recognition (ICDAR). pp. 1403-1409 (2019).", "bbox": {"l": 151.51801, "t": 481.4097, "r": 439.05963, "b": 489.47946, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "https://", "bbox": {"l": 442.94202000000007, "t": 482.05527, "r": 480.59372, "b": 489.52429, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "doi.org/10.1109/ICDAR.2019.00226", "bbox": {"l": 151.51801, "t": 493.01425, "r": 302.11584, "b": 500.48328, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "list_item", "bbox": {"l": 134.76401, "t": 503.33868, "r": 480.59286000000003, "b": 544.28545, "coord_origin": "TOPLEFT"}, "confidence": 0.972225546836853, "cells": [{"id": 53, "text": "14.", "bbox": {"l": 134.76401, "t": 503.33868, "r": 146.15501, "b": 511.40845, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "Smock, B., Pesala, R., Abraham, R.: PubTables-1M: Towards comprehensive ta-", "bbox": {"l": 150.61252, "t": 503.33868, "r": 480.59088, "b": 511.40845, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "ble extraction from unstructured documents. In: Proceedings of the IEEE/CVF", "bbox": {"l": 151.51801, "t": 514.2977000000001, "r": 480.59286000000003, "b": 522.3674599999999, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Conference on Computer Vision and Pattern Recognition (CVPR). pp. 4634-4642", "bbox": {"l": 151.51801, "t": 525.25668, "r": 480.58838000000003, "b": 533.32645, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "(June 2022)", "bbox": {"l": 151.51801, "t": 536.21568, "r": 199.24704, "b": 544.28545, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "list_item", "bbox": {"l": 134.76401, "t": 547.18568, "r": 480.59583, "b": 610.09528, "coord_origin": "TOPLEFT"}, "confidence": 0.9674034714698792, "cells": [{"id": 58, "text": "15.", "bbox": {"l": 134.76401, "t": 547.18568, "r": 146.16588, "b": 555.25545, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Staar, P.W.J., Dolfi, M., Auer, C., Bekas, C.: Corpus conversion service: A ma-", "bbox": {"l": 150.62764, "t": 547.18568, "r": 480.58734000000004, "b": 555.25545, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "chine learning platform to ingest documents at scale. In: Proceedings of the 24th", "bbox": {"l": 151.51801, "t": 558.14468, "r": 480.58838000000003, "b": 566.2144499999999, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "ACM SIGKDD International Conference on Knowledge Discovery & Data Min-", "bbox": {"l": 151.51801, "t": 569.1036799999999, "r": 480.59109, "b": 577.17345, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "ing. pp. 774-782. KDD \u201918, Association for Computing Machinery, New York, NY,", "bbox": {"l": 151.51801, "t": 580.06268, "r": 480.59195, "b": 588.1324500000001, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "USA (2018).", "bbox": {"l": 151.51801, "t": 591.0216800000001, "r": 200.75787, "b": 599.09145, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "https://doi.org/10.1145/3219819.3219834", "bbox": {"l": 202.916, "t": 591.66727, "r": 386.45911, "b": 599.1362799999999, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": ",", "bbox": {"l": 386.45801, "t": 591.0216800000001, "r": 389.01703, "b": 599.09145, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "https://doi.org/10.", "bbox": {"l": 391.173, "t": 591.66727, "r": 480.59583, "b": 599.1362799999999, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "1145/3219819.3219834", "bbox": {"l": 151.51801, "t": 602.62627, "r": 245.63831, "b": 610.09528, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "list_item", "bbox": {"l": 134.76401, "t": 612.95068, "r": 480.59542999999996, "b": 631.97945, "coord_origin": "TOPLEFT"}, "confidence": 0.9416429996490479, "cells": [{"id": 68, "text": "16.", "bbox": {"l": 134.76401, "t": 612.95068, "r": 146.62019, "b": 621.02045, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "Wang, X.: Tabular Abstraction, Editing, and Formatting. Ph.D. thesis, CAN", "bbox": {"l": 151.25977, "t": 612.95068, "r": 480.59542999999996, "b": 621.02045, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "(1996), aAINN09397", "bbox": {"l": 151.51801, "t": 623.90968, "r": 234.43031, "b": 631.97945, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "list_item", "bbox": {"l": 134.76401, "t": 634.87968, "r": 480.59119, "b": 664.86745, "coord_origin": "TOPLEFT"}, "confidence": 0.9646382331848145, "cells": [{"id": 71, "text": "17.", "bbox": {"l": 134.76401, "t": 634.87968, "r": 146.30539, "b": 642.9494500000001, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "Xue, W., Li, Q., Tao, D.: Res2tim: Reconstruct syntactic structures from table", "bbox": {"l": 150.82175, "t": 634.87968, "r": 480.58731000000006, "b": 642.9494500000001, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "images. In: 2019 International Conference on Document Analysis and Recognition", "bbox": {"l": 151.51801, "t": 645.8386800000001, "r": 480.59119, "b": 653.90845, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "(ICDAR). pp. 749-755. IEEE (2019)", "bbox": {"l": 151.51801, "t": 656.79768, "r": 299.30307, "b": 664.86745, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_header", "id": 13, "page_no": 12, "cluster": {"id": 13, "label": "page_header", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9163166880607605, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Optimized Table Tokenization for Table Structure Recognition"}, {"label": "page_header", "id": 14, "page_no": 12, "cluster": {"id": 14, "label": "page_header", "bbox": {"l": 471.37561, "t": 93.77099999999996, "r": 480.5894799999999, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9061064720153809, "cells": [{"id": 1, "text": "13", "bbox": {"l": 471.37561, "t": 93.77099999999996, "r": 480.5894799999999, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "13"}, {"label": "list_item", "id": 5, "page_no": 12, "cluster": {"id": 5, "label": "list_item", "bbox": {"l": 139.371, "t": 119.67400999999995, "r": 480.59479, "b": 149.66168000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9677112698554993, "cells": [{"id": 2, "text": "5.", "bbox": {"l": 139.371, "t": 119.67400999999995, "r": 146.04857, "b": 127.74370999999985, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Kayal, P., Anand, M., Desai, H., Singh, M.: Tables to latex: structure and content", "bbox": {"l": 150.34157, "t": 119.67400999999995, "r": 480.58826, "b": 127.74370999999985, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "extraction from scientific tables. International Journal on Document Analysis and", "bbox": {"l": 151.51801, "t": 130.63300000000004, "r": 480.59479, "b": 138.70270000000005, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Recognition (IJDAR) pp. 1-10 (2022)", "bbox": {"l": 151.51801, "t": 141.59198000000004, "r": 304.04364, "b": 149.66168000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5. Kayal, P., Anand, M., Desai, H., Singh, M.: Tables to latex: structure and content extraction from scientific tables. International Journal on Document Analysis and Recognition (IJDAR) pp. 1-10 (2022)"}, {"label": "list_item", "id": 1, "page_no": 12, "cluster": {"id": 1, "label": "list_item", "bbox": {"l": 139.371, "t": 152.56195000000002, "r": 480.59286000000003, "b": 193.50860999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.973045289516449, "cells": [{"id": 6, "text": "6.", "bbox": {"l": 139.371, "t": 152.56195000000002, "r": 145.93991, "b": 160.63165000000004, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Lee, E., Kwon, J., Yang, H., Park, J., Lee, S., Koo, H.I., Cho, N.I.: Table structure", "bbox": {"l": 150.16298, "t": 152.56195000000002, "r": 480.59015, "b": 160.63165000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "recognition based on grid shape graph. In: 2022 Asia-Pacific Signal and Information", "bbox": {"l": 151.51801, "t": 163.52094, "r": 480.5903, "b": 171.59064, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Processing Association Annual Summit and Conference (APSIPA ASC). pp. 1868-", "bbox": {"l": 151.51801, "t": 174.47992, "r": 480.59286000000003, "b": 182.54962, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "1873. IEEE (2022)", "bbox": {"l": 151.51801, "t": 185.4389, "r": 226.37399, "b": 193.50860999999998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "6. Lee, E., Kwon, J., Yang, H., Park, J., Lee, S., Koo, H.I., Cho, N.I.: Table structure recognition based on grid shape graph. In: 2022 Asia-Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC). pp. 18681873. IEEE (2022)"}, {"label": "list_item", "id": 10, "page_no": 12, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 139.371, "t": 196.40886999999998, "r": 480.59012, "b": 215.43755999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9582491517066956, "cells": [{"id": 11, "text": "7.", "bbox": {"l": 139.371, "t": 196.40886999999998, "r": 146.31418, "b": 204.47857999999997, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Li, M., Cui, L., Huang, S., Wei, F., Zhou, M., Li, Z.: Tablebank: A benchmark", "bbox": {"l": 150.77789, "t": 196.40886999999998, "r": 480.59012, "b": 204.47857999999997, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "dataset for table detection and recognition (2019)", "bbox": {"l": 151.51801, "t": 207.36785999999995, "r": 352.01746, "b": 215.43755999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "7. Li, M., Cui, L., Huang, S., Wei, F., Zhou, M., Li, Z.: Tablebank: A benchmark dataset for table detection and recognition (2019)"}, {"label": "list_item", "id": 4, "page_no": 12, "cluster": {"id": 4, "label": "list_item", "bbox": {"l": 139.371, "t": 218.33887000000004, "r": 480.59473, "b": 270.28839000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.967814564704895, "cells": [{"id": 14, "text": "8.", "bbox": {"l": 139.371, "t": 218.33887000000004, "r": 146.37106, "b": 226.40857000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Livathinos, N., Berrospi, C., Lysak, M., Kuropiatnyk, V., Nassar, A., Carvalho,", "bbox": {"l": 150.87132, "t": 218.33887000000004, "r": 480.58731000000006, "b": 226.40857000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "A., Dolfi, M., Auer, C., Dinkla, K., Staar, P.: Robust pdf document conversion", "bbox": {"l": 151.51801, "t": 229.29785000000004, "r": 480.59020999999996, "b": 237.36755000000005, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "using recurrent neural networks. Proceedings of the AAAI Conference on Artificial", "bbox": {"l": 151.51801, "t": 240.25684, "r": 480.59473, "b": 248.32654000000002, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Intelligence", "bbox": {"l": 151.51801, "t": 251.21582, "r": 197.08617, "b": 259.28552, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "35", "bbox": {"l": 199.40001, "t": 251.15301999999997, "r": 210.00726, "b": 259.07935, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "(17), 15137-15145 (May 2021),", "bbox": {"l": 210.007, "t": 251.21582, "r": 332.37683, "b": 259.28552, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "https://ojs.aaai.org/index.php/", "bbox": {"l": 334.69901, "t": 251.86139000000003, "r": 480.59039000000007, "b": 259.33038, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "AAAI/article/view/17777", "bbox": {"l": 151.51801, "t": 262.8194, "r": 259.75769, "b": 270.28839000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "8. Livathinos, N., Berrospi, C., Lysak, M., Kuropiatnyk, V., Nassar, A., Carvalho, A., Dolfi, M., Auer, C., Dinkla, K., Staar, P.: Robust pdf document conversion using recurrent neural networks. Proceedings of the AAAI Conference on Artificial Intelligence 35 (17), 15137-15145 (May 2021), https://ojs.aaai.org/index.php/ AAAI/article/view/17777"}, {"label": "list_item", "id": 11, "page_no": 12, "cluster": {"id": 11, "label": "list_item", "bbox": {"l": 139.371, "t": 273.14484000000004, "r": 480.59387000000004, "b": 303.13254, "coord_origin": "TOPLEFT"}, "confidence": 0.9557179808616638, "cells": [{"id": 23, "text": "9.", "bbox": {"l": 139.371, "t": 273.14484000000004, "r": 146.14218, "b": 281.21457, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "Nassar, A., Livathinos, N., Lysak, M., Staar, P.: Tableformer: Table structure un-", "bbox": {"l": 150.49533, "t": 273.14484000000004, "r": 480.5881999999999, "b": 281.21457, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "derstanding with transformers. In: Proceedings of the IEEE/CVF Conference on", "bbox": {"l": 151.51801, "t": 284.10379, "r": 480.59387000000004, "b": 292.17355, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "Computer Vision and Pattern Recognition (CVPR). pp. 4614-4623 (June 2022)", "bbox": {"l": 151.51801, "t": 295.06277, "r": 473.44308000000007, "b": 303.13254, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "9. Nassar, A., Livathinos, N., Lysak, M., Staar, P.: Tableformer: Table structure understanding with transformers. In: Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). pp. 4614-4623 (June 2022)"}, {"label": "list_item", "id": 9, "page_no": 12, "cluster": {"id": 9, "label": "list_item", "bbox": {"l": 134.76401, "t": 306.03277999999995, "r": 480.59372, "b": 368.94232, "coord_origin": "TOPLEFT"}, "confidence": 0.9639304876327515, "cells": [{"id": 27, "text": "10.", "bbox": {"l": 134.76401, "t": 306.03277999999995, "r": 146.49922, "b": 314.10254000000003, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Pfitzmann, B., Auer, C., Dolfi, M., Nassar, A.S., Staar, P.W.J.: Doclaynet: A", "bbox": {"l": 151.09138, "t": 306.03277999999995, "r": 480.58905, "b": 314.10254000000003, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "large human-annotated dataset for document-layout segmentation. In: Zhang, A.,", "bbox": {"l": 151.51801, "t": 316.99179, "r": 480.59015, "b": 325.06155, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Rangwala, H. (eds.) KDD \u201922: The 28th ACM SIGKDD Conference on Knowledge", "bbox": {"l": 151.51801, "t": 327.95078, "r": 480.59113, "b": 336.02054, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Discovery and Data Mining, Washington, DC, USA, August 14 - 18, 2022. pp.", "bbox": {"l": 151.51801, "t": 338.90976, "r": 480.59113, "b": 346.97952, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "3743-3751. ACM (2022).", "bbox": {"l": 151.51801, "t": 349.86874, "r": 251.14098999999996, "b": 357.93851, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "https://doi.org/10.1145/3534678.3539043", "bbox": {"l": 253.99001, "t": 350.5143100000001, "r": 437.53311, "b": 357.98333999999994, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": ",", "bbox": {"l": 437.53201, "t": 349.86874, "r": 440.09102999999993, "b": 357.93851, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "https://", "bbox": {"l": 442.94202000000007, "t": 350.5143100000001, "r": 480.59372, "b": 357.98333999999994, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "doi.org/10.1145/3534678.3539043", "bbox": {"l": 151.51801, "t": 361.47329999999994, "r": 297.40939, "b": 368.94232, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "10. Pfitzmann, B., Auer, C., Dolfi, M., Nassar, A.S., Staar, P.W.J.: Doclaynet: A large human-annotated dataset for document-layout segmentation. In: Zhang, A., Rangwala, H. (eds.) KDD '22: The 28th ACM SIGKDD Conference on Knowledge Discovery and Data Mining, Washington, DC, USA, August 14 - 18, 2022. pp. 3743-3751. ACM (2022). https://doi.org/10.1145/3534678.3539043 , https:// doi.org/10.1145/3534678.3539043"}, {"label": "list_item", "id": 0, "page_no": 12, "cluster": {"id": 0, "label": "list_item", "bbox": {"l": 134.76401, "t": 371.79773, "r": 480.59296, "b": 412.74448, "coord_origin": "TOPLEFT"}, "confidence": 0.9752162098884583, "cells": [{"id": 37, "text": "11.", "bbox": {"l": 134.76401, "t": 371.79773, "r": 146.03854, "b": 379.86749, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "Prasad, D., Gadpal, A., Kapadni, K., Visave, M., Sultanpure, K.: Cascadetabnet:", "bbox": {"l": 150.4505, "t": 371.79773, "r": 480.58914000000004, "b": 379.86749, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "An approach for end to end table detection and structure recognition from image-", "bbox": {"l": 151.51801, "t": 382.7567399999999, "r": 480.59296, "b": 390.82651, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "based documents. In: Proceedings of the IEEE/CVF conference on computer vision", "bbox": {"l": 151.51801, "t": 393.71573, "r": 480.59293, "b": 401.78549, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "and pattern recognition workshops. pp. 572-573 (2020)", "bbox": {"l": 151.51801, "t": 404.67471, "r": 373.82727, "b": 412.74448, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "11. Prasad, D., Gadpal, A., Kapadni, K., Visave, M., Sultanpure, K.: Cascadetabnet: An approach for end to end table detection and structure recognition from imagebased documents. In: Proceedings of the IEEE/CVF conference on computer vision and pattern recognition workshops. pp. 572-573 (2020)"}, {"label": "list_item", "id": 3, "page_no": 12, "cluster": {"id": 3, "label": "list_item", "bbox": {"l": 134.76401, "t": 415.64471, "r": 480.59469999999993, "b": 456.59146, "coord_origin": "TOPLEFT"}, "confidence": 0.9707236886024475, "cells": [{"id": 42, "text": "12.", "bbox": {"l": 134.76401, "t": 415.64471, "r": 145.91106, "b": 423.71448000000004, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Schreiber, S., Agne, S., Wolf, I., Dengel, A., Ahmed, S.: Deepdesrt: Deep learning", "bbox": {"l": 150.27309, "t": 415.64471, "r": 480.5874, "b": 423.71448000000004, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "for detection and structure recognition of tables in document images. In: 2017 14th", "bbox": {"l": 151.51801, "t": 426.60373, "r": 480.59469999999993, "b": 434.67349, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "IAPR international conference on document analysis and recognition (ICDAR).", "bbox": {"l": 151.51801, "t": 437.5627099999999, "r": 480.58844, "b": 445.63248, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "vol. 1, pp. 1162-1167. IEEE (2017)", "bbox": {"l": 151.51801, "t": 448.5217, "r": 292.91455, "b": 456.59146, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "12. Schreiber, S., Agne, S., Wolf, I., Dengel, A., Ahmed, S.: Deepdesrt: Deep learning for detection and structure recognition of tables in document images. In: 2017 14th IAPR international conference on document analysis and recognition (ICDAR). vol. 1, pp. 1162-1167. IEEE (2017)"}, {"label": "list_item", "id": 7, "page_no": 12, "cluster": {"id": 7, "label": "list_item", "bbox": {"l": 134.76401, "t": 459.4917, "r": 480.59372, "b": 500.48328, "coord_origin": "TOPLEFT"}, "confidence": 0.9658119678497314, "cells": [{"id": 47, "text": "13.", "bbox": {"l": 134.76401, "t": 459.4917, "r": 145.7785, "b": 467.56146, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Siddiqui, S.A., Fateh, I.A., Rizvi, S.T.R., Dengel, A., Ahmed, S.: Deeptabstr: Deep", "bbox": {"l": 150.08871, "t": 459.4917, "r": 480.59006, "b": 467.56146, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "learning based table structure recognition. In: 2019 International Conference on", "bbox": {"l": 151.51801, "t": 470.45071, "r": 480.59116, "b": 478.52048, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Document Analysis and Recognition (ICDAR). pp. 1403-1409 (2019).", "bbox": {"l": 151.51801, "t": 481.4097, "r": 439.05963, "b": 489.47946, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "https://", "bbox": {"l": 442.94202000000007, "t": 482.05527, "r": 480.59372, "b": 489.52429, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "doi.org/10.1109/ICDAR.2019.00226", "bbox": {"l": 151.51801, "t": 493.01425, "r": 302.11584, "b": 500.48328, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "13. Siddiqui, S.A., Fateh, I.A., Rizvi, S.T.R., Dengel, A., Ahmed, S.: Deeptabstr: Deep learning based table structure recognition. In: 2019 International Conference on Document Analysis and Recognition (ICDAR). pp. 1403-1409 (2019). https:// doi.org/10.1109/ICDAR.2019.00226"}, {"label": "list_item", "id": 2, "page_no": 12, "cluster": {"id": 2, "label": "list_item", "bbox": {"l": 134.76401, "t": 503.33868, "r": 480.59286000000003, "b": 544.28545, "coord_origin": "TOPLEFT"}, "confidence": 0.972225546836853, "cells": [{"id": 53, "text": "14.", "bbox": {"l": 134.76401, "t": 503.33868, "r": 146.15501, "b": 511.40845, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "Smock, B., Pesala, R., Abraham, R.: PubTables-1M: Towards comprehensive ta-", "bbox": {"l": 150.61252, "t": 503.33868, "r": 480.59088, "b": 511.40845, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "ble extraction from unstructured documents. In: Proceedings of the IEEE/CVF", "bbox": {"l": 151.51801, "t": 514.2977000000001, "r": 480.59286000000003, "b": 522.3674599999999, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Conference on Computer Vision and Pattern Recognition (CVPR). pp. 4634-4642", "bbox": {"l": 151.51801, "t": 525.25668, "r": 480.58838000000003, "b": 533.32645, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "(June 2022)", "bbox": {"l": 151.51801, "t": 536.21568, "r": 199.24704, "b": 544.28545, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "14. Smock, B., Pesala, R., Abraham, R.: PubTables-1M: Towards comprehensive table extraction from unstructured documents. In: Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). pp. 4634-4642 (June 2022)"}, {"label": "list_item", "id": 6, "page_no": 12, "cluster": {"id": 6, "label": "list_item", "bbox": {"l": 134.76401, "t": 547.18568, "r": 480.59583, "b": 610.09528, "coord_origin": "TOPLEFT"}, "confidence": 0.9674034714698792, "cells": [{"id": 58, "text": "15.", "bbox": {"l": 134.76401, "t": 547.18568, "r": 146.16588, "b": 555.25545, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Staar, P.W.J., Dolfi, M., Auer, C., Bekas, C.: Corpus conversion service: A ma-", "bbox": {"l": 150.62764, "t": 547.18568, "r": 480.58734000000004, "b": 555.25545, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "chine learning platform to ingest documents at scale. In: Proceedings of the 24th", "bbox": {"l": 151.51801, "t": 558.14468, "r": 480.58838000000003, "b": 566.2144499999999, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "ACM SIGKDD International Conference on Knowledge Discovery & Data Min-", "bbox": {"l": 151.51801, "t": 569.1036799999999, "r": 480.59109, "b": 577.17345, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "ing. pp. 774-782. KDD \u201918, Association for Computing Machinery, New York, NY,", "bbox": {"l": 151.51801, "t": 580.06268, "r": 480.59195, "b": 588.1324500000001, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "USA (2018).", "bbox": {"l": 151.51801, "t": 591.0216800000001, "r": 200.75787, "b": 599.09145, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "https://doi.org/10.1145/3219819.3219834", "bbox": {"l": 202.916, "t": 591.66727, "r": 386.45911, "b": 599.1362799999999, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": ",", "bbox": {"l": 386.45801, "t": 591.0216800000001, "r": 389.01703, "b": 599.09145, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "https://doi.org/10.", "bbox": {"l": 391.173, "t": 591.66727, "r": 480.59583, "b": 599.1362799999999, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "1145/3219819.3219834", "bbox": {"l": 151.51801, "t": 602.62627, "r": 245.63831, "b": 610.09528, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "15. Staar, P.W.J., Dolfi, M., Auer, C., Bekas, C.: Corpus conversion service: A machine learning platform to ingest documents at scale. In: Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining. pp. 774-782. KDD '18, Association for Computing Machinery, New York, NY, USA (2018). https://doi.org/10.1145/3219819.3219834 , https://doi.org/10. 1145/3219819.3219834"}, {"label": "list_item", "id": 12, "page_no": 12, "cluster": {"id": 12, "label": "list_item", "bbox": {"l": 134.76401, "t": 612.95068, "r": 480.59542999999996, "b": 631.97945, "coord_origin": "TOPLEFT"}, "confidence": 0.9416429996490479, "cells": [{"id": 68, "text": "16.", "bbox": {"l": 134.76401, "t": 612.95068, "r": 146.62019, "b": 621.02045, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "Wang, X.: Tabular Abstraction, Editing, and Formatting. Ph.D. thesis, CAN", "bbox": {"l": 151.25977, "t": 612.95068, "r": 480.59542999999996, "b": 621.02045, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "(1996), aAINN09397", "bbox": {"l": 151.51801, "t": 623.90968, "r": 234.43031, "b": 631.97945, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "16. Wang, X.: Tabular Abstraction, Editing, and Formatting. Ph.D. thesis, CAN (1996), aAINN09397"}, {"label": "list_item", "id": 8, "page_no": 12, "cluster": {"id": 8, "label": "list_item", "bbox": {"l": 134.76401, "t": 634.87968, "r": 480.59119, "b": 664.86745, "coord_origin": "TOPLEFT"}, "confidence": 0.9646382331848145, "cells": [{"id": 71, "text": "17.", "bbox": {"l": 134.76401, "t": 634.87968, "r": 146.30539, "b": 642.9494500000001, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "Xue, W., Li, Q., Tao, D.: Res2tim: Reconstruct syntactic structures from table", "bbox": {"l": 150.82175, "t": 634.87968, "r": 480.58731000000006, "b": 642.9494500000001, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "images. In: 2019 International Conference on Document Analysis and Recognition", "bbox": {"l": 151.51801, "t": 645.8386800000001, "r": 480.59119, "b": 653.90845, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "(ICDAR). pp. 749-755. IEEE (2019)", "bbox": {"l": 151.51801, "t": 656.79768, "r": 299.30307, "b": 664.86745, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "17. Xue, W., Li, Q., Tao, D.: Res2tim: Reconstruct syntactic structures from table images. In: 2019 International Conference on Document Analysis and Recognition (ICDAR). pp. 749-755. IEEE (2019)"}], "body": [{"label": "list_item", "id": 5, "page_no": 12, "cluster": {"id": 5, "label": "list_item", "bbox": {"l": 139.371, "t": 119.67400999999995, "r": 480.59479, "b": 149.66168000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9677112698554993, "cells": [{"id": 2, "text": "5.", "bbox": {"l": 139.371, "t": 119.67400999999995, "r": 146.04857, "b": 127.74370999999985, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Kayal, P., Anand, M., Desai, H., Singh, M.: Tables to latex: structure and content", "bbox": {"l": 150.34157, "t": 119.67400999999995, "r": 480.58826, "b": 127.74370999999985, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "extraction from scientific tables. International Journal on Document Analysis and", "bbox": {"l": 151.51801, "t": 130.63300000000004, "r": 480.59479, "b": 138.70270000000005, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Recognition (IJDAR) pp. 1-10 (2022)", "bbox": {"l": 151.51801, "t": 141.59198000000004, "r": 304.04364, "b": 149.66168000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "5. Kayal, P., Anand, M., Desai, H., Singh, M.: Tables to latex: structure and content extraction from scientific tables. International Journal on Document Analysis and Recognition (IJDAR) pp. 1-10 (2022)"}, {"label": "list_item", "id": 1, "page_no": 12, "cluster": {"id": 1, "label": "list_item", "bbox": {"l": 139.371, "t": 152.56195000000002, "r": 480.59286000000003, "b": 193.50860999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.973045289516449, "cells": [{"id": 6, "text": "6.", "bbox": {"l": 139.371, "t": 152.56195000000002, "r": 145.93991, "b": 160.63165000000004, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Lee, E., Kwon, J., Yang, H., Park, J., Lee, S., Koo, H.I., Cho, N.I.: Table structure", "bbox": {"l": 150.16298, "t": 152.56195000000002, "r": 480.59015, "b": 160.63165000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "recognition based on grid shape graph. In: 2022 Asia-Pacific Signal and Information", "bbox": {"l": 151.51801, "t": 163.52094, "r": 480.5903, "b": 171.59064, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Processing Association Annual Summit and Conference (APSIPA ASC). pp. 1868-", "bbox": {"l": 151.51801, "t": 174.47992, "r": 480.59286000000003, "b": 182.54962, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "1873. IEEE (2022)", "bbox": {"l": 151.51801, "t": 185.4389, "r": 226.37399, "b": 193.50860999999998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "6. Lee, E., Kwon, J., Yang, H., Park, J., Lee, S., Koo, H.I., Cho, N.I.: Table structure recognition based on grid shape graph. In: 2022 Asia-Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC). pp. 18681873. IEEE (2022)"}, {"label": "list_item", "id": 10, "page_no": 12, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 139.371, "t": 196.40886999999998, "r": 480.59012, "b": 215.43755999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9582491517066956, "cells": [{"id": 11, "text": "7.", "bbox": {"l": 139.371, "t": 196.40886999999998, "r": 146.31418, "b": 204.47857999999997, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Li, M., Cui, L., Huang, S., Wei, F., Zhou, M., Li, Z.: Tablebank: A benchmark", "bbox": {"l": 150.77789, "t": 196.40886999999998, "r": 480.59012, "b": 204.47857999999997, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "dataset for table detection and recognition (2019)", "bbox": {"l": 151.51801, "t": 207.36785999999995, "r": 352.01746, "b": 215.43755999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "7. Li, M., Cui, L., Huang, S., Wei, F., Zhou, M., Li, Z.: Tablebank: A benchmark dataset for table detection and recognition (2019)"}, {"label": "list_item", "id": 4, "page_no": 12, "cluster": {"id": 4, "label": "list_item", "bbox": {"l": 139.371, "t": 218.33887000000004, "r": 480.59473, "b": 270.28839000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.967814564704895, "cells": [{"id": 14, "text": "8.", "bbox": {"l": 139.371, "t": 218.33887000000004, "r": 146.37106, "b": 226.40857000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Livathinos, N., Berrospi, C., Lysak, M., Kuropiatnyk, V., Nassar, A., Carvalho,", "bbox": {"l": 150.87132, "t": 218.33887000000004, "r": 480.58731000000006, "b": 226.40857000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "A., Dolfi, M., Auer, C., Dinkla, K., Staar, P.: Robust pdf document conversion", "bbox": {"l": 151.51801, "t": 229.29785000000004, "r": 480.59020999999996, "b": 237.36755000000005, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "using recurrent neural networks. Proceedings of the AAAI Conference on Artificial", "bbox": {"l": 151.51801, "t": 240.25684, "r": 480.59473, "b": 248.32654000000002, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Intelligence", "bbox": {"l": 151.51801, "t": 251.21582, "r": 197.08617, "b": 259.28552, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "35", "bbox": {"l": 199.40001, "t": 251.15301999999997, "r": 210.00726, "b": 259.07935, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "(17), 15137-15145 (May 2021),", "bbox": {"l": 210.007, "t": 251.21582, "r": 332.37683, "b": 259.28552, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "https://ojs.aaai.org/index.php/", "bbox": {"l": 334.69901, "t": 251.86139000000003, "r": 480.59039000000007, "b": 259.33038, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "AAAI/article/view/17777", "bbox": {"l": 151.51801, "t": 262.8194, "r": 259.75769, "b": 270.28839000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "8. Livathinos, N., Berrospi, C., Lysak, M., Kuropiatnyk, V., Nassar, A., Carvalho, A., Dolfi, M., Auer, C., Dinkla, K., Staar, P.: Robust pdf document conversion using recurrent neural networks. Proceedings of the AAAI Conference on Artificial Intelligence 35 (17), 15137-15145 (May 2021), https://ojs.aaai.org/index.php/ AAAI/article/view/17777"}, {"label": "list_item", "id": 11, "page_no": 12, "cluster": {"id": 11, "label": "list_item", "bbox": {"l": 139.371, "t": 273.14484000000004, "r": 480.59387000000004, "b": 303.13254, "coord_origin": "TOPLEFT"}, "confidence": 0.9557179808616638, "cells": [{"id": 23, "text": "9.", "bbox": {"l": 139.371, "t": 273.14484000000004, "r": 146.14218, "b": 281.21457, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "Nassar, A., Livathinos, N., Lysak, M., Staar, P.: Tableformer: Table structure un-", "bbox": {"l": 150.49533, "t": 273.14484000000004, "r": 480.5881999999999, "b": 281.21457, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "derstanding with transformers. In: Proceedings of the IEEE/CVF Conference on", "bbox": {"l": 151.51801, "t": 284.10379, "r": 480.59387000000004, "b": 292.17355, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "Computer Vision and Pattern Recognition (CVPR). pp. 4614-4623 (June 2022)", "bbox": {"l": 151.51801, "t": 295.06277, "r": 473.44308000000007, "b": 303.13254, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "9. Nassar, A., Livathinos, N., Lysak, M., Staar, P.: Tableformer: Table structure understanding with transformers. In: Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). pp. 4614-4623 (June 2022)"}, {"label": "list_item", "id": 9, "page_no": 12, "cluster": {"id": 9, "label": "list_item", "bbox": {"l": 134.76401, "t": 306.03277999999995, "r": 480.59372, "b": 368.94232, "coord_origin": "TOPLEFT"}, "confidence": 0.9639304876327515, "cells": [{"id": 27, "text": "10.", "bbox": {"l": 134.76401, "t": 306.03277999999995, "r": 146.49922, "b": 314.10254000000003, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Pfitzmann, B., Auer, C., Dolfi, M., Nassar, A.S., Staar, P.W.J.: Doclaynet: A", "bbox": {"l": 151.09138, "t": 306.03277999999995, "r": 480.58905, "b": 314.10254000000003, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "large human-annotated dataset for document-layout segmentation. In: Zhang, A.,", "bbox": {"l": 151.51801, "t": 316.99179, "r": 480.59015, "b": 325.06155, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Rangwala, H. (eds.) KDD \u201922: The 28th ACM SIGKDD Conference on Knowledge", "bbox": {"l": 151.51801, "t": 327.95078, "r": 480.59113, "b": 336.02054, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Discovery and Data Mining, Washington, DC, USA, August 14 - 18, 2022. pp.", "bbox": {"l": 151.51801, "t": 338.90976, "r": 480.59113, "b": 346.97952, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "3743-3751. ACM (2022).", "bbox": {"l": 151.51801, "t": 349.86874, "r": 251.14098999999996, "b": 357.93851, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "https://doi.org/10.1145/3534678.3539043", "bbox": {"l": 253.99001, "t": 350.5143100000001, "r": 437.53311, "b": 357.98333999999994, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": ",", "bbox": {"l": 437.53201, "t": 349.86874, "r": 440.09102999999993, "b": 357.93851, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "https://", "bbox": {"l": 442.94202000000007, "t": 350.5143100000001, "r": 480.59372, "b": 357.98333999999994, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "doi.org/10.1145/3534678.3539043", "bbox": {"l": 151.51801, "t": 361.47329999999994, "r": 297.40939, "b": 368.94232, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "10. Pfitzmann, B., Auer, C., Dolfi, M., Nassar, A.S., Staar, P.W.J.: Doclaynet: A large human-annotated dataset for document-layout segmentation. In: Zhang, A., Rangwala, H. (eds.) KDD '22: The 28th ACM SIGKDD Conference on Knowledge Discovery and Data Mining, Washington, DC, USA, August 14 - 18, 2022. pp. 3743-3751. ACM (2022). https://doi.org/10.1145/3534678.3539043 , https:// doi.org/10.1145/3534678.3539043"}, {"label": "list_item", "id": 0, "page_no": 12, "cluster": {"id": 0, "label": "list_item", "bbox": {"l": 134.76401, "t": 371.79773, "r": 480.59296, "b": 412.74448, "coord_origin": "TOPLEFT"}, "confidence": 0.9752162098884583, "cells": [{"id": 37, "text": "11.", "bbox": {"l": 134.76401, "t": 371.79773, "r": 146.03854, "b": 379.86749, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "Prasad, D., Gadpal, A., Kapadni, K., Visave, M., Sultanpure, K.: Cascadetabnet:", "bbox": {"l": 150.4505, "t": 371.79773, "r": 480.58914000000004, "b": 379.86749, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "An approach for end to end table detection and structure recognition from image-", "bbox": {"l": 151.51801, "t": 382.7567399999999, "r": 480.59296, "b": 390.82651, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "based documents. In: Proceedings of the IEEE/CVF conference on computer vision", "bbox": {"l": 151.51801, "t": 393.71573, "r": 480.59293, "b": 401.78549, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "and pattern recognition workshops. pp. 572-573 (2020)", "bbox": {"l": 151.51801, "t": 404.67471, "r": 373.82727, "b": 412.74448, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "11. Prasad, D., Gadpal, A., Kapadni, K., Visave, M., Sultanpure, K.: Cascadetabnet: An approach for end to end table detection and structure recognition from imagebased documents. In: Proceedings of the IEEE/CVF conference on computer vision and pattern recognition workshops. pp. 572-573 (2020)"}, {"label": "list_item", "id": 3, "page_no": 12, "cluster": {"id": 3, "label": "list_item", "bbox": {"l": 134.76401, "t": 415.64471, "r": 480.59469999999993, "b": 456.59146, "coord_origin": "TOPLEFT"}, "confidence": 0.9707236886024475, "cells": [{"id": 42, "text": "12.", "bbox": {"l": 134.76401, "t": 415.64471, "r": 145.91106, "b": 423.71448000000004, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Schreiber, S., Agne, S., Wolf, I., Dengel, A., Ahmed, S.: Deepdesrt: Deep learning", "bbox": {"l": 150.27309, "t": 415.64471, "r": 480.5874, "b": 423.71448000000004, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "for detection and structure recognition of tables in document images. In: 2017 14th", "bbox": {"l": 151.51801, "t": 426.60373, "r": 480.59469999999993, "b": 434.67349, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "IAPR international conference on document analysis and recognition (ICDAR).", "bbox": {"l": 151.51801, "t": 437.5627099999999, "r": 480.58844, "b": 445.63248, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "vol. 1, pp. 1162-1167. IEEE (2017)", "bbox": {"l": 151.51801, "t": 448.5217, "r": 292.91455, "b": 456.59146, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "12. Schreiber, S., Agne, S., Wolf, I., Dengel, A., Ahmed, S.: Deepdesrt: Deep learning for detection and structure recognition of tables in document images. In: 2017 14th IAPR international conference on document analysis and recognition (ICDAR). vol. 1, pp. 1162-1167. IEEE (2017)"}, {"label": "list_item", "id": 7, "page_no": 12, "cluster": {"id": 7, "label": "list_item", "bbox": {"l": 134.76401, "t": 459.4917, "r": 480.59372, "b": 500.48328, "coord_origin": "TOPLEFT"}, "confidence": 0.9658119678497314, "cells": [{"id": 47, "text": "13.", "bbox": {"l": 134.76401, "t": 459.4917, "r": 145.7785, "b": 467.56146, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Siddiqui, S.A., Fateh, I.A., Rizvi, S.T.R., Dengel, A., Ahmed, S.: Deeptabstr: Deep", "bbox": {"l": 150.08871, "t": 459.4917, "r": 480.59006, "b": 467.56146, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "learning based table structure recognition. In: 2019 International Conference on", "bbox": {"l": 151.51801, "t": 470.45071, "r": 480.59116, "b": 478.52048, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Document Analysis and Recognition (ICDAR). pp. 1403-1409 (2019).", "bbox": {"l": 151.51801, "t": 481.4097, "r": 439.05963, "b": 489.47946, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "https://", "bbox": {"l": 442.94202000000007, "t": 482.05527, "r": 480.59372, "b": 489.52429, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "doi.org/10.1109/ICDAR.2019.00226", "bbox": {"l": 151.51801, "t": 493.01425, "r": 302.11584, "b": 500.48328, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "13. Siddiqui, S.A., Fateh, I.A., Rizvi, S.T.R., Dengel, A., Ahmed, S.: Deeptabstr: Deep learning based table structure recognition. In: 2019 International Conference on Document Analysis and Recognition (ICDAR). pp. 1403-1409 (2019). https:// doi.org/10.1109/ICDAR.2019.00226"}, {"label": "list_item", "id": 2, "page_no": 12, "cluster": {"id": 2, "label": "list_item", "bbox": {"l": 134.76401, "t": 503.33868, "r": 480.59286000000003, "b": 544.28545, "coord_origin": "TOPLEFT"}, "confidence": 0.972225546836853, "cells": [{"id": 53, "text": "14.", "bbox": {"l": 134.76401, "t": 503.33868, "r": 146.15501, "b": 511.40845, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "Smock, B., Pesala, R., Abraham, R.: PubTables-1M: Towards comprehensive ta-", "bbox": {"l": 150.61252, "t": 503.33868, "r": 480.59088, "b": 511.40845, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "ble extraction from unstructured documents. In: Proceedings of the IEEE/CVF", "bbox": {"l": 151.51801, "t": 514.2977000000001, "r": 480.59286000000003, "b": 522.3674599999999, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Conference on Computer Vision and Pattern Recognition (CVPR). pp. 4634-4642", "bbox": {"l": 151.51801, "t": 525.25668, "r": 480.58838000000003, "b": 533.32645, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "(June 2022)", "bbox": {"l": 151.51801, "t": 536.21568, "r": 199.24704, "b": 544.28545, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "14. Smock, B., Pesala, R., Abraham, R.: PubTables-1M: Towards comprehensive table extraction from unstructured documents. In: Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). pp. 4634-4642 (June 2022)"}, {"label": "list_item", "id": 6, "page_no": 12, "cluster": {"id": 6, "label": "list_item", "bbox": {"l": 134.76401, "t": 547.18568, "r": 480.59583, "b": 610.09528, "coord_origin": "TOPLEFT"}, "confidence": 0.9674034714698792, "cells": [{"id": 58, "text": "15.", "bbox": {"l": 134.76401, "t": 547.18568, "r": 146.16588, "b": 555.25545, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Staar, P.W.J., Dolfi, M., Auer, C., Bekas, C.: Corpus conversion service: A ma-", "bbox": {"l": 150.62764, "t": 547.18568, "r": 480.58734000000004, "b": 555.25545, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "chine learning platform to ingest documents at scale. In: Proceedings of the 24th", "bbox": {"l": 151.51801, "t": 558.14468, "r": 480.58838000000003, "b": 566.2144499999999, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "ACM SIGKDD International Conference on Knowledge Discovery & Data Min-", "bbox": {"l": 151.51801, "t": 569.1036799999999, "r": 480.59109, "b": 577.17345, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "ing. pp. 774-782. KDD \u201918, Association for Computing Machinery, New York, NY,", "bbox": {"l": 151.51801, "t": 580.06268, "r": 480.59195, "b": 588.1324500000001, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "USA (2018).", "bbox": {"l": 151.51801, "t": 591.0216800000001, "r": 200.75787, "b": 599.09145, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "https://doi.org/10.1145/3219819.3219834", "bbox": {"l": 202.916, "t": 591.66727, "r": 386.45911, "b": 599.1362799999999, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": ",", "bbox": {"l": 386.45801, "t": 591.0216800000001, "r": 389.01703, "b": 599.09145, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "https://doi.org/10.", "bbox": {"l": 391.173, "t": 591.66727, "r": 480.59583, "b": 599.1362799999999, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "1145/3219819.3219834", "bbox": {"l": 151.51801, "t": 602.62627, "r": 245.63831, "b": 610.09528, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "15. Staar, P.W.J., Dolfi, M., Auer, C., Bekas, C.: Corpus conversion service: A machine learning platform to ingest documents at scale. In: Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining. pp. 774-782. KDD '18, Association for Computing Machinery, New York, NY, USA (2018). https://doi.org/10.1145/3219819.3219834 , https://doi.org/10. 1145/3219819.3219834"}, {"label": "list_item", "id": 12, "page_no": 12, "cluster": {"id": 12, "label": "list_item", "bbox": {"l": 134.76401, "t": 612.95068, "r": 480.59542999999996, "b": 631.97945, "coord_origin": "TOPLEFT"}, "confidence": 0.9416429996490479, "cells": [{"id": 68, "text": "16.", "bbox": {"l": 134.76401, "t": 612.95068, "r": 146.62019, "b": 621.02045, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "Wang, X.: Tabular Abstraction, Editing, and Formatting. Ph.D. thesis, CAN", "bbox": {"l": 151.25977, "t": 612.95068, "r": 480.59542999999996, "b": 621.02045, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "(1996), aAINN09397", "bbox": {"l": 151.51801, "t": 623.90968, "r": 234.43031, "b": 631.97945, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "16. Wang, X.: Tabular Abstraction, Editing, and Formatting. Ph.D. thesis, CAN (1996), aAINN09397"}, {"label": "list_item", "id": 8, "page_no": 12, "cluster": {"id": 8, "label": "list_item", "bbox": {"l": 134.76401, "t": 634.87968, "r": 480.59119, "b": 664.86745, "coord_origin": "TOPLEFT"}, "confidence": 0.9646382331848145, "cells": [{"id": 71, "text": "17.", "bbox": {"l": 134.76401, "t": 634.87968, "r": 146.30539, "b": 642.9494500000001, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "Xue, W., Li, Q., Tao, D.: Res2tim: Reconstruct syntactic structures from table", "bbox": {"l": 150.82175, "t": 634.87968, "r": 480.58731000000006, "b": 642.9494500000001, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "images. In: 2019 International Conference on Document Analysis and Recognition", "bbox": {"l": 151.51801, "t": 645.8386800000001, "r": 480.59119, "b": 653.90845, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "(ICDAR). pp. 749-755. IEEE (2019)", "bbox": {"l": 151.51801, "t": 656.79768, "r": 299.30307, "b": 664.86745, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "17. Xue, W., Li, Q., Tao, D.: Res2tim: Reconstruct syntactic structures from table images. In: 2019 International Conference on Document Analysis and Recognition (ICDAR). pp. 749-755. IEEE (2019)"}], "headers": [{"label": "page_header", "id": 13, "page_no": 12, "cluster": {"id": 13, "label": "page_header", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9163166880607605, "cells": [{"id": 0, "text": "Optimized Table Tokenization for Table Structure Recognition", "bbox": {"l": 194.478, "t": 93.77099999999996, "r": 447.54291000000006, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Optimized Table Tokenization for Table Structure Recognition"}, {"label": "page_header", "id": 14, "page_no": 12, "cluster": {"id": 14, "label": "page_header", "bbox": {"l": 471.37561, "t": 93.77099999999996, "r": 480.5894799999999, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.9061064720153809, "cells": [{"id": 1, "text": "13", "bbox": {"l": 471.37561, "t": 93.77099999999996, "r": 480.5894799999999, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "13"}]}}, {"page_no": 13, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "14", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 143.97887, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "M.", "bbox": {"l": 167.82053, "t": 93.77099999999996, "r": 178.08249, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37929, "t": 93.77099999999996, "r": 231.72049000000004, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "18.", "bbox": {"l": 134.765, "t": 119.67400999999995, "r": 146.07936, "b": 127.74370999999985, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Xue, W., Yu, B., Wang, W., Tao, D., Li, Q.: Tgrnet: A table graph reconstruc-", "bbox": {"l": 150.5069, "t": 119.67400999999995, "r": 480.5892, "b": 127.74370999999985, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "tion network for table structure recognition. In: Proceedings of the IEEE/CVF", "bbox": {"l": 151.51801, "t": 130.63300000000004, "r": 480.59113, "b": 138.70270000000005, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "International Conference on Computer Vision. pp. 1295-1304 (2021)", "bbox": {"l": 151.51801, "t": 141.59198000000004, "r": 427.53329, "b": 149.66168000000005, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "19.", "bbox": {"l": 134.765, "t": 152.55096000000003, "r": 146.19109, "b": 160.62067000000002, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Ye, J., Qi, X., He, Y., Chen, Y., Gu, D., Gao, P., Xiao, R.: Pingan-vcgroup\u2019s", "bbox": {"l": 150.66234, "t": 152.55096000000003, "r": 480.5936899999999, "b": 160.62067000000002, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "solution for icdar 2021 competition on scientific literature parsing task b: Ta-", "bbox": {"l": 151.51801, "t": 163.50995, "r": 480.59469999999993, "b": 171.57965000000002, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "ble recognition to html (2021).", "bbox": {"l": 151.51801, "t": 174.46893, "r": 280.64047, "b": 182.53864, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "https://doi.org/10.48550/ARXIV.2105.01848", "bbox": {"l": 285.078, "t": 175.11450000000002, "r": 478.03403000000003, "b": 182.58349999999996, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": ",", "bbox": {"l": 478.0319799999999, "t": 174.46893, "r": 480.59099999999995, "b": 182.53864, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "https://arxiv.org/abs/2105.01848", "bbox": {"l": 151.51797, "t": 186.07349, "r": 302.11584, "b": 193.54247999999995, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "20.", "bbox": {"l": 134.76497, "t": 196.38689999999997, "r": 145.65964, "b": 204.45659999999998, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Zhang, Z., Zhang, J., Du, J., Wang, F.: Split, embed and merge: An accurate table", "bbox": {"l": 149.92294, "t": 196.38689999999997, "r": 480.5935400000001, "b": 204.45659999999998, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "structure recognizer. Pattern Recognition", "bbox": {"l": 151.51797, "t": 207.34491000000003, "r": 318.55124, "b": 215.41461000000004, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "126", "bbox": {"l": 321.62097, "t": 207.2821, "r": 337.53186, "b": 215.20844, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": ", 108565 (2022)", "bbox": {"l": 337.53296, "t": 207.34491000000003, "r": 399.46927, "b": 215.41461000000004, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "21.", "bbox": {"l": 134.76495, "t": 218.30389000000002, "r": 145.7213, "b": 226.3736, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Zheng, X., Burdick, D., Popa, L., Zhong, X., Wang, N.X.R.: Global table extractor", "bbox": {"l": 150.00871, "t": 218.30389000000002, "r": 480.59012, "b": 226.3736, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "(gte): A framework for joint table identification and cell structure recognition using", "bbox": {"l": 151.51796, "t": 229.26288, "r": 480.59102999999993, "b": 237.33258, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "visual context. In: 2021 IEEE Winter Conference on Applications of Computer Vi-", "bbox": {"l": 151.51796, "t": 240.22186, "r": 480.59119, "b": 248.29156, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "sion (WACV). pp. 697-706 (2021).", "bbox": {"l": 151.51796, "t": 251.18084999999996, "r": 293.44086, "b": 259.25055, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "https://doi.org/10.1109/WACV48630.2021.", "bbox": {"l": 297.04996, "t": 251.82641999999998, "r": 480.59305000000006, "b": 259.29540999999995, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "00074", "bbox": {"l": 151.51796, "t": 262.7854, "r": 175.05028, "b": 270.25438999999994, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "22.", "bbox": {"l": 134.76495, "t": 273.09882000000005, "r": 146.36798, "b": 281.16855000000004, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Zhong, X., ShafieiBavani, E., Jimeno Yepes, A.: Image-based table recognition:", "bbox": {"l": 150.90846, "t": 273.09882000000005, "r": 480.59094, "b": 281.16855000000004, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Data, model, and evaluation. In: Vedaldi, A., Bischof, H., Brox, T., Frahm, J.M.", "bbox": {"l": 151.51796, "t": 284.05777, "r": 480.58832000000007, "b": 292.12753, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "(eds.) Computer Vision - ECCV 2020. pp. 564-580. Springer International Pub-", "bbox": {"l": 151.51796, "t": 295.01675, "r": 480.59558, "b": 303.08651999999995, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "lishing, Cham (2020)", "bbox": {"l": 151.51796, "t": 305.97574, "r": 236.02359, "b": 314.0455, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "23.", "bbox": {"l": 134.76495, "t": 316.93472, "r": 145.69547, "b": 325.00449000000003, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Zhong, X., Tang, J., Yepes, A.J.: Publaynet: largest dataset ever for document lay-", "bbox": {"l": 149.97276, "t": 316.93472, "r": 480.59454, "b": 325.00449000000003, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "out analysis. In: 2019 International Conference on Document Analysis and Recog-", "bbox": {"l": 151.51796, "t": 327.8927299999999, "r": 480.59387000000004, "b": 335.96249, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "nition (ICDAR). pp. 1015-1022. IEEE (2019)", "bbox": {"l": 151.51796, "t": 338.85172, "r": 335.13635, "b": 346.92148, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 7, "label": "page_header", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 143.97887, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.7012730240821838, "cells": [{"id": 0, "text": "14", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 143.97887, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "page_header", "bbox": {"l": 167.82053, "t": 93.77099999999996, "r": 231.72049000000004, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.7889755964279175, "cells": [{"id": 1, "text": "M.", "bbox": {"l": 167.82053, "t": 93.77099999999996, "r": 178.08249, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37929, "t": 93.77099999999996, "r": 231.72049000000004, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "list_item", "bbox": {"l": 134.765, "t": 119.67400999999995, "r": 480.59113, "b": 149.66168000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9444757699966431, "cells": [{"id": 3, "text": "18.", "bbox": {"l": 134.765, "t": 119.67400999999995, "r": 146.07936, "b": 127.74370999999985, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Xue, W., Yu, B., Wang, W., Tao, D., Li, Q.: Tgrnet: A table graph reconstruc-", "bbox": {"l": 150.5069, "t": 119.67400999999995, "r": 480.5892, "b": 127.74370999999985, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "tion network for table structure recognition. In: Proceedings of the IEEE/CVF", "bbox": {"l": 151.51801, "t": 130.63300000000004, "r": 480.59113, "b": 138.70270000000005, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "International Conference on Computer Vision. pp. 1295-1304 (2021)", "bbox": {"l": 151.51801, "t": 141.59198000000004, "r": 427.53329, "b": 149.66168000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "list_item", "bbox": {"l": 134.765, "t": 152.55096000000003, "r": 480.59469999999993, "b": 193.54247999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9540892243385315, "cells": [{"id": 7, "text": "19.", "bbox": {"l": 134.765, "t": 152.55096000000003, "r": 146.19109, "b": 160.62067000000002, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Ye, J., Qi, X., He, Y., Chen, Y., Gu, D., Gao, P., Xiao, R.: Pingan-vcgroup\u2019s", "bbox": {"l": 150.66234, "t": 152.55096000000003, "r": 480.5936899999999, "b": 160.62067000000002, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "solution for icdar 2021 competition on scientific literature parsing task b: Ta-", "bbox": {"l": 151.51801, "t": 163.50995, "r": 480.59469999999993, "b": 171.57965000000002, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "ble recognition to html (2021).", "bbox": {"l": 151.51801, "t": 174.46893, "r": 280.64047, "b": 182.53864, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "https://doi.org/10.48550/ARXIV.2105.01848", "bbox": {"l": 285.078, "t": 175.11450000000002, "r": 478.03403000000003, "b": 182.58349999999996, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": ",", "bbox": {"l": 478.0319799999999, "t": 174.46893, "r": 480.59099999999995, "b": 182.53864, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "https://arxiv.org/abs/2105.01848", "bbox": {"l": 151.51797, "t": 186.07349, "r": 302.11584, "b": 193.54247999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "list_item", "bbox": {"l": 134.76497, "t": 196.38689999999997, "r": 480.5935400000001, "b": 215.41461000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9531471729278564, "cells": [{"id": 14, "text": "20.", "bbox": {"l": 134.76497, "t": 196.38689999999997, "r": 145.65964, "b": 204.45659999999998, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Zhang, Z., Zhang, J., Du, J., Wang, F.: Split, embed and merge: An accurate table", "bbox": {"l": 149.92294, "t": 196.38689999999997, "r": 480.5935400000001, "b": 204.45659999999998, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "structure recognizer. Pattern Recognition", "bbox": {"l": 151.51797, "t": 207.34491000000003, "r": 318.55124, "b": 215.41461000000004, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "126", "bbox": {"l": 321.62097, "t": 207.2821, "r": 337.53186, "b": 215.20844, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": ", 108565 (2022)", "bbox": {"l": 337.53296, "t": 207.34491000000003, "r": 399.46927, "b": 215.41461000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "list_item", "bbox": {"l": 134.76495, "t": 218.30389000000002, "r": 480.59305000000006, "b": 270.25438999999994, "coord_origin": "TOPLEFT"}, "confidence": 0.972027063369751, "cells": [{"id": 19, "text": "21.", "bbox": {"l": 134.76495, "t": 218.30389000000002, "r": 145.7213, "b": 226.3736, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Zheng, X., Burdick, D., Popa, L., Zhong, X., Wang, N.X.R.: Global table extractor", "bbox": {"l": 150.00871, "t": 218.30389000000002, "r": 480.59012, "b": 226.3736, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "(gte): A framework for joint table identification and cell structure recognition using", "bbox": {"l": 151.51796, "t": 229.26288, "r": 480.59102999999993, "b": 237.33258, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "visual context. In: 2021 IEEE Winter Conference on Applications of Computer Vi-", "bbox": {"l": 151.51796, "t": 240.22186, "r": 480.59119, "b": 248.29156, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "sion (WACV). pp. 697-706 (2021).", "bbox": {"l": 151.51796, "t": 251.18084999999996, "r": 293.44086, "b": 259.25055, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "https://doi.org/10.1109/WACV48630.2021.", "bbox": {"l": 297.04996, "t": 251.82641999999998, "r": 480.59305000000006, "b": 259.29540999999995, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "00074", "bbox": {"l": 151.51796, "t": 262.7854, "r": 175.05028, "b": 270.25438999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "list_item", "bbox": {"l": 134.76495, "t": 273.09882000000005, "r": 480.59558, "b": 314.0455, "coord_origin": "TOPLEFT"}, "confidence": 0.9685125946998596, "cells": [{"id": 26, "text": "22.", "bbox": {"l": 134.76495, "t": 273.09882000000005, "r": 146.36798, "b": 281.16855000000004, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Zhong, X., ShafieiBavani, E., Jimeno Yepes, A.: Image-based table recognition:", "bbox": {"l": 150.90846, "t": 273.09882000000005, "r": 480.59094, "b": 281.16855000000004, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Data, model, and evaluation. In: Vedaldi, A., Bischof, H., Brox, T., Frahm, J.M.", "bbox": {"l": 151.51796, "t": 284.05777, "r": 480.58832000000007, "b": 292.12753, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "(eds.) Computer Vision - ECCV 2020. pp. 564-580. Springer International Pub-", "bbox": {"l": 151.51796, "t": 295.01675, "r": 480.59558, "b": 303.08651999999995, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "lishing, Cham (2020)", "bbox": {"l": 151.51796, "t": 305.97574, "r": 236.02359, "b": 314.0455, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "list_item", "bbox": {"l": 134.76495, "t": 316.93472, "r": 480.59454, "b": 346.92148, "coord_origin": "TOPLEFT"}, "confidence": 0.9668973684310913, "cells": [{"id": 31, "text": "23.", "bbox": {"l": 134.76495, "t": 316.93472, "r": 145.69547, "b": 325.00449000000003, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Zhong, X., Tang, J., Yepes, A.J.: Publaynet: largest dataset ever for document lay-", "bbox": {"l": 149.97276, "t": 316.93472, "r": 480.59454, "b": 325.00449000000003, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "out analysis. In: 2019 International Conference on Document Analysis and Recog-", "bbox": {"l": 151.51796, "t": 327.8927299999999, "r": 480.59387000000004, "b": 335.96249, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "nition (ICDAR). pp. 1015-1022. IEEE (2019)", "bbox": {"l": 151.51796, "t": 338.85172, "r": 335.13635, "b": 346.92148, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_header", "id": 7, "page_no": 13, "cluster": {"id": 7, "label": "page_header", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 143.97887, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.7012730240821838, "cells": [{"id": 0, "text": "14", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 143.97887, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "14"}, {"label": "page_header", "id": 6, "page_no": 13, "cluster": {"id": 6, "label": "page_header", "bbox": {"l": 167.82053, "t": 93.77099999999996, "r": 231.72049000000004, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.7889755964279175, "cells": [{"id": 1, "text": "M.", "bbox": {"l": 167.82053, "t": 93.77099999999996, "r": 178.08249, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37929, "t": 93.77099999999996, "r": 231.72049000000004, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "M. Lysak, et al."}, {"label": "list_item", "id": 5, "page_no": 13, "cluster": {"id": 5, "label": "list_item", "bbox": {"l": 134.765, "t": 119.67400999999995, "r": 480.59113, "b": 149.66168000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9444757699966431, "cells": [{"id": 3, "text": "18.", "bbox": {"l": 134.765, "t": 119.67400999999995, "r": 146.07936, "b": 127.74370999999985, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Xue, W., Yu, B., Wang, W., Tao, D., Li, Q.: Tgrnet: A table graph reconstruc-", "bbox": {"l": 150.5069, "t": 119.67400999999995, "r": 480.5892, "b": 127.74370999999985, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "tion network for table structure recognition. In: Proceedings of the IEEE/CVF", "bbox": {"l": 151.51801, "t": 130.63300000000004, "r": 480.59113, "b": 138.70270000000005, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "International Conference on Computer Vision. pp. 1295-1304 (2021)", "bbox": {"l": 151.51801, "t": 141.59198000000004, "r": 427.53329, "b": 149.66168000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "18. Xue, W., Yu, B., Wang, W., Tao, D., Li, Q.: Tgrnet: A table graph reconstruction network for table structure recognition. In: Proceedings of the IEEE/CVF International Conference on Computer Vision. pp. 1295-1304 (2021)"}, {"label": "list_item", "id": 3, "page_no": 13, "cluster": {"id": 3, "label": "list_item", "bbox": {"l": 134.765, "t": 152.55096000000003, "r": 480.59469999999993, "b": 193.54247999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9540892243385315, "cells": [{"id": 7, "text": "19.", "bbox": {"l": 134.765, "t": 152.55096000000003, "r": 146.19109, "b": 160.62067000000002, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Ye, J., Qi, X., He, Y., Chen, Y., Gu, D., Gao, P., Xiao, R.: Pingan-vcgroup\u2019s", "bbox": {"l": 150.66234, "t": 152.55096000000003, "r": 480.5936899999999, "b": 160.62067000000002, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "solution for icdar 2021 competition on scientific literature parsing task b: Ta-", "bbox": {"l": 151.51801, "t": 163.50995, "r": 480.59469999999993, "b": 171.57965000000002, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "ble recognition to html (2021).", "bbox": {"l": 151.51801, "t": 174.46893, "r": 280.64047, "b": 182.53864, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "https://doi.org/10.48550/ARXIV.2105.01848", "bbox": {"l": 285.078, "t": 175.11450000000002, "r": 478.03403000000003, "b": 182.58349999999996, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": ",", "bbox": {"l": 478.0319799999999, "t": 174.46893, "r": 480.59099999999995, "b": 182.53864, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "https://arxiv.org/abs/2105.01848", "bbox": {"l": 151.51797, "t": 186.07349, "r": 302.11584, "b": 193.54247999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "19. Ye, J., Qi, X., He, Y., Chen, Y., Gu, D., Gao, P., Xiao, R.: Pingan-vcgroup's solution for icdar 2021 competition on scientific literature parsing task b: Table recognition to html (2021). https://doi.org/10.48550/ARXIV.2105.01848 , https://arxiv.org/abs/2105.01848"}, {"label": "list_item", "id": 4, "page_no": 13, "cluster": {"id": 4, "label": "list_item", "bbox": {"l": 134.76497, "t": 196.38689999999997, "r": 480.5935400000001, "b": 215.41461000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9531471729278564, "cells": [{"id": 14, "text": "20.", "bbox": {"l": 134.76497, "t": 196.38689999999997, "r": 145.65964, "b": 204.45659999999998, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Zhang, Z., Zhang, J., Du, J., Wang, F.: Split, embed and merge: An accurate table", "bbox": {"l": 149.92294, "t": 196.38689999999997, "r": 480.5935400000001, "b": 204.45659999999998, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "structure recognizer. Pattern Recognition", "bbox": {"l": 151.51797, "t": 207.34491000000003, "r": 318.55124, "b": 215.41461000000004, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "126", "bbox": {"l": 321.62097, "t": 207.2821, "r": 337.53186, "b": 215.20844, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": ", 108565 (2022)", "bbox": {"l": 337.53296, "t": 207.34491000000003, "r": 399.46927, "b": 215.41461000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "20. Zhang, Z., Zhang, J., Du, J., Wang, F.: Split, embed and merge: An accurate table structure recognizer. Pattern Recognition 126 , 108565 (2022)"}, {"label": "list_item", "id": 0, "page_no": 13, "cluster": {"id": 0, "label": "list_item", "bbox": {"l": 134.76495, "t": 218.30389000000002, "r": 480.59305000000006, "b": 270.25438999999994, "coord_origin": "TOPLEFT"}, "confidence": 0.972027063369751, "cells": [{"id": 19, "text": "21.", "bbox": {"l": 134.76495, "t": 218.30389000000002, "r": 145.7213, "b": 226.3736, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Zheng, X., Burdick, D., Popa, L., Zhong, X., Wang, N.X.R.: Global table extractor", "bbox": {"l": 150.00871, "t": 218.30389000000002, "r": 480.59012, "b": 226.3736, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "(gte): A framework for joint table identification and cell structure recognition using", "bbox": {"l": 151.51796, "t": 229.26288, "r": 480.59102999999993, "b": 237.33258, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "visual context. In: 2021 IEEE Winter Conference on Applications of Computer Vi-", "bbox": {"l": 151.51796, "t": 240.22186, "r": 480.59119, "b": 248.29156, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "sion (WACV). pp. 697-706 (2021).", "bbox": {"l": 151.51796, "t": 251.18084999999996, "r": 293.44086, "b": 259.25055, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "https://doi.org/10.1109/WACV48630.2021.", "bbox": {"l": 297.04996, "t": 251.82641999999998, "r": 480.59305000000006, "b": 259.29540999999995, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "00074", "bbox": {"l": 151.51796, "t": 262.7854, "r": 175.05028, "b": 270.25438999999994, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "21. Zheng, X., Burdick, D., Popa, L., Zhong, X., Wang, N.X.R.: Global table extractor (gte): A framework for joint table identification and cell structure recognition using visual context. In: 2021 IEEE Winter Conference on Applications of Computer Vision (WACV). pp. 697-706 (2021). https://doi.org/10.1109/WACV48630.2021. 00074"}, {"label": "list_item", "id": 1, "page_no": 13, "cluster": {"id": 1, "label": "list_item", "bbox": {"l": 134.76495, "t": 273.09882000000005, "r": 480.59558, "b": 314.0455, "coord_origin": "TOPLEFT"}, "confidence": 0.9685125946998596, "cells": [{"id": 26, "text": "22.", "bbox": {"l": 134.76495, "t": 273.09882000000005, "r": 146.36798, "b": 281.16855000000004, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Zhong, X., ShafieiBavani, E., Jimeno Yepes, A.: Image-based table recognition:", "bbox": {"l": 150.90846, "t": 273.09882000000005, "r": 480.59094, "b": 281.16855000000004, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Data, model, and evaluation. In: Vedaldi, A., Bischof, H., Brox, T., Frahm, J.M.", "bbox": {"l": 151.51796, "t": 284.05777, "r": 480.58832000000007, "b": 292.12753, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "(eds.) Computer Vision - ECCV 2020. pp. 564-580. Springer International Pub-", "bbox": {"l": 151.51796, "t": 295.01675, "r": 480.59558, "b": 303.08651999999995, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "lishing, Cham (2020)", "bbox": {"l": 151.51796, "t": 305.97574, "r": 236.02359, "b": 314.0455, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "22. Zhong, X., ShafieiBavani, E., Jimeno Yepes, A.: Image-based table recognition: Data, model, and evaluation. In: Vedaldi, A., Bischof, H., Brox, T., Frahm, J.M. (eds.) Computer Vision - ECCV 2020. pp. 564-580. Springer International Publishing, Cham (2020)"}, {"label": "list_item", "id": 2, "page_no": 13, "cluster": {"id": 2, "label": "list_item", "bbox": {"l": 134.76495, "t": 316.93472, "r": 480.59454, "b": 346.92148, "coord_origin": "TOPLEFT"}, "confidence": 0.9668973684310913, "cells": [{"id": 31, "text": "23.", "bbox": {"l": 134.76495, "t": 316.93472, "r": 145.69547, "b": 325.00449000000003, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Zhong, X., Tang, J., Yepes, A.J.: Publaynet: largest dataset ever for document lay-", "bbox": {"l": 149.97276, "t": 316.93472, "r": 480.59454, "b": 325.00449000000003, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "out analysis. In: 2019 International Conference on Document Analysis and Recog-", "bbox": {"l": 151.51796, "t": 327.8927299999999, "r": 480.59387000000004, "b": 335.96249, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "nition (ICDAR). pp. 1015-1022. IEEE (2019)", "bbox": {"l": 151.51796, "t": 338.85172, "r": 335.13635, "b": 346.92148, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "23. Zhong, X., Tang, J., Yepes, A.J.: Publaynet: largest dataset ever for document layout analysis. In: 2019 International Conference on Document Analysis and Recognition (ICDAR). pp. 1015-1022. IEEE (2019)"}], "body": [{"label": "list_item", "id": 5, "page_no": 13, "cluster": {"id": 5, "label": "list_item", "bbox": {"l": 134.765, "t": 119.67400999999995, "r": 480.59113, "b": 149.66168000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9444757699966431, "cells": [{"id": 3, "text": "18.", "bbox": {"l": 134.765, "t": 119.67400999999995, "r": 146.07936, "b": 127.74370999999985, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Xue, W., Yu, B., Wang, W., Tao, D., Li, Q.: Tgrnet: A table graph reconstruc-", "bbox": {"l": 150.5069, "t": 119.67400999999995, "r": 480.5892, "b": 127.74370999999985, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "tion network for table structure recognition. In: Proceedings of the IEEE/CVF", "bbox": {"l": 151.51801, "t": 130.63300000000004, "r": 480.59113, "b": 138.70270000000005, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "International Conference on Computer Vision. pp. 1295-1304 (2021)", "bbox": {"l": 151.51801, "t": 141.59198000000004, "r": 427.53329, "b": 149.66168000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "18. Xue, W., Yu, B., Wang, W., Tao, D., Li, Q.: Tgrnet: A table graph reconstruction network for table structure recognition. In: Proceedings of the IEEE/CVF International Conference on Computer Vision. pp. 1295-1304 (2021)"}, {"label": "list_item", "id": 3, "page_no": 13, "cluster": {"id": 3, "label": "list_item", "bbox": {"l": 134.765, "t": 152.55096000000003, "r": 480.59469999999993, "b": 193.54247999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9540892243385315, "cells": [{"id": 7, "text": "19.", "bbox": {"l": 134.765, "t": 152.55096000000003, "r": 146.19109, "b": 160.62067000000002, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Ye, J., Qi, X., He, Y., Chen, Y., Gu, D., Gao, P., Xiao, R.: Pingan-vcgroup\u2019s", "bbox": {"l": 150.66234, "t": 152.55096000000003, "r": 480.5936899999999, "b": 160.62067000000002, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "solution for icdar 2021 competition on scientific literature parsing task b: Ta-", "bbox": {"l": 151.51801, "t": 163.50995, "r": 480.59469999999993, "b": 171.57965000000002, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "ble recognition to html (2021).", "bbox": {"l": 151.51801, "t": 174.46893, "r": 280.64047, "b": 182.53864, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "https://doi.org/10.48550/ARXIV.2105.01848", "bbox": {"l": 285.078, "t": 175.11450000000002, "r": 478.03403000000003, "b": 182.58349999999996, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": ",", "bbox": {"l": 478.0319799999999, "t": 174.46893, "r": 480.59099999999995, "b": 182.53864, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "https://arxiv.org/abs/2105.01848", "bbox": {"l": 151.51797, "t": 186.07349, "r": 302.11584, "b": 193.54247999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "19. Ye, J., Qi, X., He, Y., Chen, Y., Gu, D., Gao, P., Xiao, R.: Pingan-vcgroup's solution for icdar 2021 competition on scientific literature parsing task b: Table recognition to html (2021). https://doi.org/10.48550/ARXIV.2105.01848 , https://arxiv.org/abs/2105.01848"}, {"label": "list_item", "id": 4, "page_no": 13, "cluster": {"id": 4, "label": "list_item", "bbox": {"l": 134.76497, "t": 196.38689999999997, "r": 480.5935400000001, "b": 215.41461000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9531471729278564, "cells": [{"id": 14, "text": "20.", "bbox": {"l": 134.76497, "t": 196.38689999999997, "r": 145.65964, "b": 204.45659999999998, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Zhang, Z., Zhang, J., Du, J., Wang, F.: Split, embed and merge: An accurate table", "bbox": {"l": 149.92294, "t": 196.38689999999997, "r": 480.5935400000001, "b": 204.45659999999998, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "structure recognizer. Pattern Recognition", "bbox": {"l": 151.51797, "t": 207.34491000000003, "r": 318.55124, "b": 215.41461000000004, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "126", "bbox": {"l": 321.62097, "t": 207.2821, "r": 337.53186, "b": 215.20844, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": ", 108565 (2022)", "bbox": {"l": 337.53296, "t": 207.34491000000003, "r": 399.46927, "b": 215.41461000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "20. Zhang, Z., Zhang, J., Du, J., Wang, F.: Split, embed and merge: An accurate table structure recognizer. Pattern Recognition 126 , 108565 (2022)"}, {"label": "list_item", "id": 0, "page_no": 13, "cluster": {"id": 0, "label": "list_item", "bbox": {"l": 134.76495, "t": 218.30389000000002, "r": 480.59305000000006, "b": 270.25438999999994, "coord_origin": "TOPLEFT"}, "confidence": 0.972027063369751, "cells": [{"id": 19, "text": "21.", "bbox": {"l": 134.76495, "t": 218.30389000000002, "r": 145.7213, "b": 226.3736, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Zheng, X., Burdick, D., Popa, L., Zhong, X., Wang, N.X.R.: Global table extractor", "bbox": {"l": 150.00871, "t": 218.30389000000002, "r": 480.59012, "b": 226.3736, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "(gte): A framework for joint table identification and cell structure recognition using", "bbox": {"l": 151.51796, "t": 229.26288, "r": 480.59102999999993, "b": 237.33258, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "visual context. In: 2021 IEEE Winter Conference on Applications of Computer Vi-", "bbox": {"l": 151.51796, "t": 240.22186, "r": 480.59119, "b": 248.29156, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "sion (WACV). pp. 697-706 (2021).", "bbox": {"l": 151.51796, "t": 251.18084999999996, "r": 293.44086, "b": 259.25055, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "https://doi.org/10.1109/WACV48630.2021.", "bbox": {"l": 297.04996, "t": 251.82641999999998, "r": 480.59305000000006, "b": 259.29540999999995, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "00074", "bbox": {"l": 151.51796, "t": 262.7854, "r": 175.05028, "b": 270.25438999999994, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "21. Zheng, X., Burdick, D., Popa, L., Zhong, X., Wang, N.X.R.: Global table extractor (gte): A framework for joint table identification and cell structure recognition using visual context. In: 2021 IEEE Winter Conference on Applications of Computer Vision (WACV). pp. 697-706 (2021). https://doi.org/10.1109/WACV48630.2021. 00074"}, {"label": "list_item", "id": 1, "page_no": 13, "cluster": {"id": 1, "label": "list_item", "bbox": {"l": 134.76495, "t": 273.09882000000005, "r": 480.59558, "b": 314.0455, "coord_origin": "TOPLEFT"}, "confidence": 0.9685125946998596, "cells": [{"id": 26, "text": "22.", "bbox": {"l": 134.76495, "t": 273.09882000000005, "r": 146.36798, "b": 281.16855000000004, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Zhong, X., ShafieiBavani, E., Jimeno Yepes, A.: Image-based table recognition:", "bbox": {"l": 150.90846, "t": 273.09882000000005, "r": 480.59094, "b": 281.16855000000004, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Data, model, and evaluation. In: Vedaldi, A., Bischof, H., Brox, T., Frahm, J.M.", "bbox": {"l": 151.51796, "t": 284.05777, "r": 480.58832000000007, "b": 292.12753, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "(eds.) Computer Vision - ECCV 2020. pp. 564-580. Springer International Pub-", "bbox": {"l": 151.51796, "t": 295.01675, "r": 480.59558, "b": 303.08651999999995, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "lishing, Cham (2020)", "bbox": {"l": 151.51796, "t": 305.97574, "r": 236.02359, "b": 314.0455, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "22. Zhong, X., ShafieiBavani, E., Jimeno Yepes, A.: Image-based table recognition: Data, model, and evaluation. In: Vedaldi, A., Bischof, H., Brox, T., Frahm, J.M. (eds.) Computer Vision - ECCV 2020. pp. 564-580. Springer International Publishing, Cham (2020)"}, {"label": "list_item", "id": 2, "page_no": 13, "cluster": {"id": 2, "label": "list_item", "bbox": {"l": 134.76495, "t": 316.93472, "r": 480.59454, "b": 346.92148, "coord_origin": "TOPLEFT"}, "confidence": 0.9668973684310913, "cells": [{"id": 31, "text": "23.", "bbox": {"l": 134.76495, "t": 316.93472, "r": 145.69547, "b": 325.00449000000003, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Zhong, X., Tang, J., Yepes, A.J.: Publaynet: largest dataset ever for document lay-", "bbox": {"l": 149.97276, "t": 316.93472, "r": 480.59454, "b": 325.00449000000003, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "out analysis. In: 2019 International Conference on Document Analysis and Recog-", "bbox": {"l": 151.51796, "t": 327.8927299999999, "r": 480.59387000000004, "b": 335.96249, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "nition (ICDAR). pp. 1015-1022. IEEE (2019)", "bbox": {"l": 151.51796, "t": 338.85172, "r": 335.13635, "b": 346.92148, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "23. Zhong, X., Tang, J., Yepes, A.J.: Publaynet: largest dataset ever for document layout analysis. In: 2019 International Conference on Document Analysis and Recognition (ICDAR). pp. 1015-1022. IEEE (2019)"}], "headers": [{"label": "page_header", "id": 7, "page_no": 13, "cluster": {"id": 7, "label": "page_header", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 143.97887, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.7012730240821838, "cells": [{"id": 0, "text": "14", "bbox": {"l": 134.765, "t": 93.77099999999996, "r": 143.97887, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "14"}, {"label": "page_header", "id": 6, "page_no": 13, "cluster": {"id": 6, "label": "page_header", "bbox": {"l": 167.82053, "t": 93.77099999999996, "r": 231.72049000000004, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.7889755964279175, "cells": [{"id": 1, "text": "M.", "bbox": {"l": 167.82053, "t": 93.77099999999996, "r": 178.08249, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Lysak, et al.", "bbox": {"l": 182.37929, "t": 93.77099999999996, "r": 231.72049000000004, "b": 101.84069999999997, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "M. Lysak, et al."}]}}]
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v2/amt_handbook_sample.doctags.txt b/tests/data/groundtruth/docling_v2/amt_handbook_sample.doctags.txt
index 2053f5e4..50a68404 100644
--- a/tests/data/groundtruth/docling_v2/amt_handbook_sample.doctags.txt
+++ b/tests/data/groundtruth/docling_v2/amt_handbook_sample.doctags.txt
@@ -1,23 +1,17 @@
-<document>
-<text><location><page_1><loc_12><loc_88><loc_53><loc_94></location>pulleys, provided the inner race of the bearing is clamped to the supporting structure by the nut and bolt. Plates must be attached to the structure in a positive manner to eliminate rotation or misalignment when tightening the bolts or screws.</text>
-<text><location><page_1><loc_12><loc_77><loc_53><loc_86></location>The two general types of self-locking nuts currently in use are the all-metal type and the fiber lock type. For the sake of simplicity, only three typical kinds of self-locking nuts are considered in this handbook: the Boots self-locking and the stainless steel self-locking nuts, representing the all-metal types; and the elastic stop nut, representing the fiber insert type.</text>
-<section_header_level_1><location><page_1><loc_12><loc_73><loc_28><loc_75></location>Boots Self-Locking Nut</section_header_level_1>
-<text><location><page_1><loc_12><loc_64><loc_54><loc_73></location>The Boots self-locking nut is of one piece, all-metal construction designed to hold tight despite severe vibration. Note in Figure 7-26 that it has two sections and is essentially two nuts in one: a locking nut and a load-carrying nut. The two sections are connected with a spring, which is an integral part of the nut.</text>
-<text><location><page_1><loc_12><loc_52><loc_53><loc_62></location>The spring keeps the locking and load-carrying sections such a distance apart that the two sets of threads are out of phase or spaced so that a bolt, which has been screwed through the load-carrying section, must push the locking section outward against the force of the spring to engage the threads of the locking section properly.</text>
-<text><location><page_1><loc_12><loc_38><loc_54><loc_50></location>The spring, through the medium of the locking section, exerts a constant locking force on the bolt in the same direction as a force that would tighten the nut. In this nut, the load-carrying section has the thread strength of a standard nut of comparable size, while the locking section presses against the threads of the bolt and locks the nut firmly in position. Only a wrench applied to the nut loosens it. The nut can be removed and reused without impairing its efficiency.</text>
-<text><location><page_1><loc_12><loc_33><loc_53><loc_36></location>Boots self-locking nuts are made with three different spring styles and in various shapes and sizes. The wing type that is</text>
-<figure>
-<location><page_1><loc_12><loc_10><loc_52><loc_31></location>
-<caption>Figure 7-26. Self-locking nuts.</caption>
-</figure>
-<text><location><page_1><loc_54><loc_85><loc_95><loc_94></location>the most common ranges in size for No. 6 up to 1 / 4 inch, the Rol-top ranges from 1 / 4 inch to 1 / 6 inch, and the bellows type ranges in size from No. 8 up to 3 / 8 inch. Wing-type nuts are made of anodized aluminum alloy, cadmium-plated carbon steel, or stainless steel. The Rol-top nut is cadmium-plated steel, and the bellows type is made of aluminum alloy only.</text>
-<text><location><page_1><loc_54><loc_83><loc_55><loc_85></location>.</text>
-<section_header_level_1><location><page_1><loc_54><loc_82><loc_76><loc_83></location>Stainless Steel Self-Locking Nut</section_header_level_1>
-<text><location><page_1><loc_54><loc_54><loc_96><loc_81></location>The stainless steel self-locking nut may be spun on and off by hand as its locking action takes places only when the nut is seated against a solid surface and tightened. The nut consists of two parts: a case with a beveled locking shoulder and key and a thread insert with a locking shoulder and slotted keyway. Until the nut is tightened, it spins on the bolt easily, because the threaded insert is the proper size for the bolt. However, when the nut is seated against a solid surface and tightened, the locking shoulder of the insert is pulled downward and wedged against the locking shoulder of the case. This action compresses the threaded insert and causes it to clench the bolt tightly. The cross-sectional view in Figure 7-27 shows how the key of the case fits into the slotted keyway of the insert so that when the case is turned, the threaded insert is turned with it. Note that the slot is wider than the key. This permits the slot to be narrowed and the insert to be compressed when the nut is tightened.</text>
-<section_header_level_1><location><page_1><loc_54><loc_51><loc_65><loc_52></location>Elastic Stop Nut</section_header_level_1>
-<text><location><page_1><loc_54><loc_47><loc_93><loc_50></location>The elastic stop nut is a standard nut with the height increased to accommodate a fiber locking collar. This</text>
-<figure>
-<location><page_1><loc_54><loc_11><loc_94><loc_46></location>
-<caption>Figure 7-27. Stainless steel self-locking nut.</caption>
-</figure>
-</document>
\ No newline at end of file
+<doctag><text><loc_61><loc_28><loc_264><loc_60>pulleys, provided the inner race of the bearing is clamped to the supporting structure by the nut and bolt. Plates must be attached to the structure in a positive manner to eliminate rotation or misalignment when tightening the bolts or screws.</text>
+<text><loc_61><loc_69><loc_264><loc_116>The two general types of self-locking nuts currently in use are the all-metal type and the fiber lock type. For the sake of simplicity, only three typical kinds of self-locking nuts are considered in this handbook: the Boots self-locking and the stainless steel self-locking nuts, representing the all-metal types; and the elastic stop nut, representing the fiber insert type.</text>
+<section_header_level_1><loc_61><loc_125><loc_141><loc_133>Boots Self-Locking Nut</section_header_level_1>
+<text><loc_61><loc_134><loc_268><loc_182>The Boots self-locking nut is of one piece, all-metal construction designed to hold tight despite severe vibration. Note in Figure 7-26 that it has two sections and is essentially two nuts in one: a locking nut and a load-carrying nut. The two sections are connected with a spring, which is an integral part of the nut.</text>
+<text><loc_61><loc_191><loc_267><loc_239>The spring keeps the locking and load-carrying sections such a distance apart that the two sets of threads are out of phase or spaced so that a bolt, which has been screwed through the load-carrying section, must push the locking section outward against the force of the spring to engage the threads of the locking section properly.</text>
+<text><loc_61><loc_248><loc_268><loc_311>The spring, through the medium of the locking section, exerts a constant locking force on the bolt in the same direction as a force that would tighten the nut. In this nut, the load-carrying section has the thread strength of a standard nut of comparable size, while the locking section presses against the threads of the bolt and locks the nut firmly in position. Only a wrench applied to the nut loosens it. The nut can be removed and reused without impairing its efficiency.</text>
+<text><loc_61><loc_320><loc_264><loc_336>Boots self-locking nuts are made with three different spring styles and in various shapes and sizes. The wing type that is</text>
+<picture><loc_59><loc_343><loc_261><loc_449><caption><loc_61><loc_454><loc_155><loc_461>Figure 7-26. Self-locking nuts.</caption></picture>
+<text><loc_270><loc_28><loc_473><loc_76>the most common ranges in size for No. 6 up to 1 / 4 inch, the Rol-top ranges from 1 / 4 inch to 1 / 6 inch, and the bellows type ranges in size from No. 8 up to 3 / 8 inch. Wing-type nuts are made of anodized aluminum alloy, cadmium-plated carbon steel, or stainless steel. The Rol-top nut is cadmium-plated steel, and the bellows type is made of aluminum alloy only.</text>
+<text><loc_270><loc_77><loc_274><loc_84>.</text>
+<section_header_level_1><loc_270><loc_85><loc_380><loc_92>Stainless Steel Self-Locking Nut</section_header_level_1>
+<text><loc_270><loc_94><loc_478><loc_231>The stainless steel self-locking nut may be spun on and off by hand as its locking action takes places only when the nut is seated against a solid surface and tightened. The nut consists of two parts: a case with a beveled locking shoulder and key and a thread insert with a locking shoulder and slotted keyway. Until the nut is tightened, it spins on the bolt easily, because the threaded insert is the proper size for the bolt. However, when the nut is seated against a solid surface and tightened, the locking shoulder of the insert is pulled downward and wedged against the locking shoulder of the case. This action compresses the threaded insert and causes it to clench the bolt tightly. The cross-sectional view in Figure 7-27 shows how the key of the case fits into the slotted keyway of the insert so that when the case is turned, the threaded insert is turned with it. Note that the slot is wider than the key. This permits the slot to be narrowed and the insert to be compressed when the nut is tightened.</text>
+<section_header_level_1><loc_270><loc_240><loc_327><loc_247>Elastic Stop Nut</section_header_level_1>
+<text><loc_270><loc_249><loc_465><loc_264>The elastic stop nut is a standard nut with the height increased to accommodate a fiber locking collar. This</text>
+<picture><loc_270><loc_272><loc_470><loc_447><caption><loc_270><loc_452><loc_405><loc_459>Figure 7-27. Stainless steel self-locking nut.</caption></picture>
+<page_footer><loc_453><loc_470><loc_472><loc_478>7-45</page_footer>
+</doctag>
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v2/amt_handbook_sample.json b/tests/data/groundtruth/docling_v2/amt_handbook_sample.json
index 2be08f06..4b5842c2 100644
--- a/tests/data/groundtruth/docling_v2/amt_handbook_sample.json
+++ b/tests/data/groundtruth/docling_v2/amt_handbook_sample.json
@@ -1 +1 @@
-{"schema_name": "DoclingDocument", "version": "1.0.0", "name": "amt_handbook_sample", "origin": {"mimetype": "application/pdf", "binary_hash": 10189692113572347872, "filename": "amt_handbook_sample.pdf", "uri": null}, "furniture": {"self_ref": "#/furniture", "parent": null, "children": [], "name": "_root_", "label": "unspecified"}, "body": {"self_ref": "#/body", "parent": null, "children": [{"cref": "#/texts/0"}, {"cref": "#/texts/1"}, {"cref": "#/texts/2"}, {"cref": "#/texts/3"}, {"cref": "#/texts/4"}, {"cref": "#/texts/5"}, {"cref": "#/texts/6"}, {"cref": "#/texts/7"}, {"cref": "#/pictures/0"}, {"cref": "#/texts/13"}, {"cref": "#/texts/14"}, {"cref": "#/texts/15"}, {"cref": "#/texts/16"}, {"cref": "#/texts/17"}, {"cref": "#/texts/18"}, {"cref": "#/texts/19"}, {"cref": "#/pictures/1"}, {"cref": "#/texts/26"}], "name": "_root_", "label": "unspecified"}, "groups": [], "texts": [{"self_ref": "#/texts/0", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 71.99212646484375, "t": 730.3163452148438, "r": 314.11212158203125, "b": 681.3463745117188, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 244]}], "orig": "pulleys, provided the inner race of the bearing is clamped to the supporting structure by the nut and bolt. Plates must be attached to the structure in a positive manner to eliminate rotation or misalignment when tightening the bolts or screws.", "text": "pulleys, provided the inner race of the bearing is clamped to the supporting structure by the nut and bolt. Plates must be attached to the structure in a positive manner to eliminate rotation or misalignment when tightening the bolts or screws."}, {"self_ref": "#/texts/1", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 71.99230194091797, "t": 667.8163452148438, "r": 313.15460205078125, "b": 593.8463745117188, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 376]}], "orig": "The two general types of self-locking nuts currently in use are the all-metal type and the fiber lock type. For the sake of simplicity, only three typical kinds of self-locking nuts are considered in this handbook: the Boots self-locking and the stainless steel self-locking nuts, representing the all-metal types; and the elastic stop nut, representing the fiber insert type.", "text": "The two general types of self-locking nuts currently in use are the all-metal type and the fiber lock type. For the sake of simplicity, only three typical kinds of self-locking nuts are considered in this handbook: the Boots self-locking and the stainless steel self-locking nuts, representing the all-metal types; and the elastic stop nut, representing the fiber insert type."}, {"self_ref": "#/texts/2", "parent": {"cref": "#/body"}, "children": [], "label": "section_header", "prov": [{"page_no": 1, "bbox": {"l": 71.99230194091797, "t": 580.1864013671875, "r": 167.27230834960938, "b": 568.8463745117188, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 22]}], "orig": "Boots Self-Locking Nut", "text": "Boots Self-Locking Nut", "level": 1}, {"self_ref": "#/texts/3", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 71.99229431152344, "t": 565.8163452148438, "r": 318.49224853515625, "b": 491.84637451171875, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 319]}], "orig": "The Boots self-locking nut is of one piece, all-metal construction designed to hold tight despite severe vibration. Note in Figure 7-26 that it has two sections and is essentially two nuts in one: a locking nut and a load-carrying nut. The two sections are connected with a spring, which is an integral part of the nut.", "text": "The Boots self-locking nut is of one piece, all-metal construction designed to hold tight despite severe vibration. Note in Figure 7-26 that it has two sections and is essentially two nuts in one: a locking nut and a load-carrying nut. The two sections are connected with a spring, which is an integral part of the nut."}, {"self_ref": "#/texts/4", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 71.99229431152344, "t": 478.3163757324219, "r": 316.65728759765625, "b": 404.34637451171875, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 332]}], "orig": "The spring keeps the locking and load-carrying sections such a distance apart that the two sets of threads are out of phase or spaced so that a bolt, which has been screwed through the load-carrying section, must push the locking section outward against the force of the spring to engage the threads of the locking section properly.", "text": "The spring keeps the locking and load-carrying sections such a distance apart that the two sets of threads are out of phase or spaced so that a bolt, which has been screwed through the load-carrying section, must push the locking section outward against the force of the spring to engage the threads of the locking section properly."}, {"self_ref": "#/texts/5", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 71.99229431152344, "t": 390.8163757324219, "r": 318.8122863769531, "b": 291.84637451171875, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 477]}], "orig": "The spring, through the medium of the locking section, exerts a constant locking force on the bolt in the same direction as a force that would tighten the nut. In this nut, the load-carrying section has the thread strength of a standard nut of comparable size, while the locking section presses against the threads of the bolt and locks the nut firmly in position. Only a wrench applied to the nut loosens it. The nut can be removed and reused without impairing its efficiency.", "text": "The spring, through the medium of the locking section, exerts a constant locking force on the bolt in the same direction as a force that would tighten the nut. In this nut, the load-carrying section has the thread strength of a standard nut of comparable size, while the locking section presses against the threads of the bolt and locks the nut firmly in position. Only a wrench applied to the nut loosens it. The nut can be removed and reused without impairing its efficiency."}, {"self_ref": "#/texts/6", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 71.99229431152344, "t": 278.3163757324219, "r": 313.91229248046875, "b": 254.34637451171875, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 122]}], "orig": "Boots self-locking nuts are made with three different spring styles and in various shapes and sizes. The wing type that is", "text": "Boots self-locking nuts are made with three different spring styles and in various shapes and sizes. The wing type that is"}, {"self_ref": "#/texts/7", "parent": {"cref": "#/body"}, "children": [], "label": "caption", "prov": [{"page_no": 1, "bbox": {"l": 72.0, "t": 71.80239868164062, "r": 184.14828491210938, "b": 60.99040222167969, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 31]}], "orig": "Figure 7-26. Self-locking nuts.", "text": "Figure 7-26. Self-locking nuts."}, {"self_ref": "#/texts/8", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 102.4155, "t": 186.23509, "r": 161.3187, "b": 176.61909000000003, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 18]}], "orig": "Boots aircraft nut", "text": "Boots aircraft nut"}, {"self_ref": "#/texts/9", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 91.685997, "t": 94.690201, "r": 129.77399, "b": 85.07420300000001, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 11]}], "orig": "Flexloc nut", "text": "Flexloc nut"}, {"self_ref": "#/texts/10", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 162.48109, "t": 94.690201, "r": 207.85629, "b": 85.07420300000001, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 13]}], "orig": "Fiber locknut", "text": "Fiber locknut"}, {"self_ref": "#/texts/11", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 237.31379999999996, "t": 94.690201, "r": 289.561, "b": 85.07420300000001, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 16]}], "orig": "Elastic stop nut", "text": "Elastic stop nut"}, {"self_ref": "#/texts/12", "parent": {"cref": "#/pictures/0"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 216.9326, "t": 186.23509, "r": 277.7966, "b": 176.61909000000003, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 18]}], "orig": "Elastic anchor nut", "text": "Elastic anchor nut"}, {"self_ref": "#/texts/13", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 320.9923095703125, "t": 730.3163452148438, "r": 561.808349609375, "b": 656.3463745117188, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 368]}], "orig": "the most common ranges in size for No. 6 up to 1 / 4 inch, the Rol-top ranges from 1 / 4 inch to 1 / 6 inch, and the bellows type ranges in size from No. 8 up to 3 / 8 inch. Wing-type nuts are made of anodized aluminum alloy, cadmium-plated carbon steel, or stainless steel. The Rol-top nut is cadmium-plated steel, and the bellows type is made of aluminum alloy only.", "text": "the most common ranges in size for No. 6 up to 1 / 4 inch, the Rol-top ranges from 1 / 4 inch to 1 / 6 inch, and the bellows type ranges in size from No. 8 up to 3 / 8 inch. Wing-type nuts are made of anodized aluminum alloy, cadmium-plated carbon steel, or stainless steel. The Rol-top nut is cadmium-plated steel, and the bellows type is made of aluminum alloy only."}, {"self_ref": "#/texts/14", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 320.99542236328125, "t": 655.3163452148438, "r": 325.99542236328125, "b": 643.8463745117188, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": ".", "text": "."}, {"self_ref": "#/texts/15", "parent": {"cref": "#/body"}, "children": [], "label": "section_header", "prov": [{"page_no": 1, "bbox": {"l": 320.99542236328125, "t": 642.6864013671875, "r": 450.99542236328125, "b": 631.3463745117188, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 32]}], "orig": "Stainless Steel Self-Locking Nut", "text": "Stainless Steel Self-Locking Nut", "level": 1}, {"self_ref": "#/texts/16", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 320.99542236328125, "t": 628.3163452148438, "r": 568.00439453125, "b": 416.84637451171875, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1015]}], "orig": "The stainless steel self-locking nut may be spun on and off by hand as its locking action takes places only when the nut is seated against a solid surface and tightened. The nut consists of two parts: a case with a beveled locking shoulder and key and a thread insert with a locking shoulder and slotted keyway. Until the nut is tightened, it spins on the bolt easily, because the threaded insert is the proper size for the bolt. However, when the nut is seated against a solid surface and tightened, the locking shoulder of the insert is pulled downward and wedged against the locking shoulder of the case. This action compresses the threaded insert and causes it to clench the bolt tightly. The cross-sectional view in Figure 7-27 shows how the key of the case fits into the slotted keyway of the insert so that when the case is turned, the threaded insert is turned with it. Note that the slot is wider than the key. This permits the slot to be narrowed and the insert to be compressed when the nut is tightened.", "text": "The stainless steel self-locking nut may be spun on and off by hand as its locking action takes places only when the nut is seated against a solid surface and tightened. The nut consists of two parts: a case with a beveled locking shoulder and key and a thread insert with a locking shoulder and slotted keyway. Until the nut is tightened, it spins on the bolt easily, because the threaded insert is the proper size for the bolt. However, when the nut is seated against a solid surface and tightened, the locking shoulder of the insert is pulled downward and wedged against the locking shoulder of the case. This action compresses the threaded insert and causes it to clench the bolt tightly. The cross-sectional view in Figure 7-27 shows how the key of the case fits into the slotted keyway of the insert so that when the case is turned, the threaded insert is turned with it. Note that the slot is wider than the key. This permits the slot to be narrowed and the insert to be compressed when the nut is tightened."}, {"self_ref": "#/texts/17", "parent": {"cref": "#/body"}, "children": [], "label": "section_header", "prov": [{"page_no": 1, "bbox": {"l": 320.99542236328125, "t": 403.1863708496094, "r": 388.50543212890625, "b": 391.84637451171875, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 16]}], "orig": "Elastic Stop Nut", "text": "Elastic Stop Nut", "level": 1}, {"self_ref": "#/texts/18", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 320.99542236328125, "t": 388.8163757324219, "r": 552.351318359375, "b": 364.84637451171875, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 108]}], "orig": "The elastic stop nut is a standard nut with the height increased to accommodate a fiber locking collar. This", "text": "The elastic stop nut is a standard nut with the height increased to accommodate a fiber locking collar. This"}, {"self_ref": "#/texts/19", "parent": {"cref": "#/body"}, "children": [], "label": "caption", "prov": [{"page_no": 1, "bbox": {"l": 321.0, "t": 73.82240295410156, "r": 481.6493225097656, "b": 63.01040267944336, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 46]}], "orig": "Figure 7-27. Stainless steel self-locking nut.", "text": "Figure 7-27. Stainless steel self-locking nut."}, {"self_ref": "#/texts/20", "parent": {"cref": "#/pictures/1"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 479.1354999999999, "t": 101.2654, "r": 531.16748, "b": 91.35340099999996, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 13]}], "orig": "Tightened nut", "text": "Tightened nut"}, {"self_ref": "#/texts/21", "parent": {"cref": "#/pictures/1"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 474.3699, "t": 242.1082, "r": 535.23389, "b": 232.1962000000001, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 15]}], "orig": "Untightened nut", "text": "Untightened nut"}, {"self_ref": "#/texts/22", "parent": {"cref": "#/pictures/1"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 456.7558900000001, "t": 342.00259, "r": 487.08388999999994, "b": 332.3866, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 8]}], "orig": "Nut case", "text": "Nut case"}, {"self_ref": "#/texts/23", "parent": {"cref": "#/pictures/1"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 434.62299, "t": 196.17650000000003, "r": 497.47183000000007, "b": 186.56050000000005, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 17]}], "orig": "Threaded nut core", "text": "Threaded nut core"}, {"self_ref": "#/texts/24", "parent": {"cref": "#/pictures/1"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 448.55081, "t": 220.6794, "r": 507.686, "b": 211.0634, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 16]}], "orig": "Locking shoulder", "text": "Locking shoulder"}, {"self_ref": "#/texts/25", "parent": {"cref": "#/pictures/1"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 424.78421, "t": 109.88840000000005, "r": 452.10339000000005, "b": 100.27240000000006, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 6]}], "orig": "Keyway", "text": "Keyway"}, {"self_ref": "#/texts/26", "parent": {"cref": "#/body"}, "children": [], "label": "page_footer", "prov": [{"page_no": 1, "bbox": {"l": 537.9854125976562, "t": 46.01969909667969, "r": 560.775390625, "b": 33.70970153808594, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "7-45", "text": "7-45"}], "pictures": [{"self_ref": "#/pictures/0", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/8"}, {"cref": "#/texts/9"}, {"cref": "#/texts/10"}, {"cref": "#/texts/11"}, {"cref": "#/texts/12"}], "label": "picture", "prov": [{"page_no": 1, "bbox": {"l": 70.59269714355469, "t": 242.77777099609375, "r": 309.863037109375, "b": 79.6090087890625, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 31]}], "captions": [{"cref": "#/texts/7"}], "references": [], "footnotes": [], "image": null, "annotations": []}, {"self_ref": "#/pictures/1", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/20"}, {"cref": "#/texts/21"}, {"cref": "#/texts/22"}, {"cref": "#/texts/23"}, {"cref": "#/texts/24"}, {"cref": "#/texts/25"}], "label": "picture", "prov": [{"page_no": 1, "bbox": {"l": 320.4467468261719, "t": 352.359375, "r": 558.8576049804688, "b": 81.689208984375, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 46]}], "captions": [{"cref": "#/texts/19"}], "references": [], "footnotes": [], "image": null, "annotations": []}], "tables": [], "key_value_items": [], "pages": {"1": {"size": {"width": 594.0, "height": 774.0}, "image": null, "page_no": 1}}}
\ No newline at end of file
+{"schema_name": "DoclingDocument", "version": "1.1.0", "name": "amt_handbook_sample", "origin": {"mimetype": "application/pdf", "binary_hash": 10189692113572347872, "filename": "amt_handbook_sample.pdf", "uri": null}, "furniture": {"self_ref": "#/furniture", "parent": null, "children": [], "content_layer": "furniture", "name": "_root_", "label": "unspecified"}, "body": {"self_ref": "#/body", "parent": null, "children": [{"cref": "#/texts/0"}, {"cref": "#/texts/1"}, {"cref": "#/texts/2"}, {"cref": "#/texts/3"}, {"cref": "#/texts/4"}, {"cref": "#/texts/5"}, {"cref": "#/texts/6"}, {"cref": "#/pictures/0"}, {"cref": "#/texts/13"}, {"cref": "#/texts/14"}, {"cref": "#/texts/15"}, {"cref": "#/texts/16"}, {"cref": "#/texts/17"}, {"cref": "#/texts/18"}, {"cref": "#/pictures/1"}, {"cref": "#/texts/26"}], "content_layer": "body", "name": "_root_", "label": "unspecified"}, "groups": [], "texts": [{"self_ref": "#/texts/0", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 71.992126, "t": 730.31635, "r": 314.11212, "b": 681.34637, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 244]}], "orig": "pulleys, provided the inner race of the bearing is clamped to the supporting structure by the nut and bolt. Plates must be attached to the structure in a positive manner to eliminate rotation or misalignment when tightening the bolts or screws.", "text": "pulleys, provided the inner race of the bearing is clamped to the supporting structure by the nut and bolt. Plates must be attached to the structure in a positive manner to eliminate rotation or misalignment when tightening the bolts or screws."}, {"self_ref": "#/texts/1", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 71.992302, "t": 667.81635, "r": 313.1546, "b": 593.84637, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 376]}], "orig": "The two general types of self-locking nuts currently in use are the all-metal type and the fiber lock type. For the sake of simplicity, only three typical kinds of self-locking nuts are considered in this handbook: the Boots self-locking and the stainless steel self-locking nuts, representing the all-metal types; and the elastic stop nut, representing the fiber insert type.", "text": "The two general types of self-locking nuts currently in use are the all-metal type and the fiber lock type. For the sake of simplicity, only three typical kinds of self-locking nuts are considered in this handbook: the Boots self-locking and the stainless steel self-locking nuts, representing the all-metal types; and the elastic stop nut, representing the fiber insert type."}, {"self_ref": "#/texts/2", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "section_header", "prov": [{"page_no": 1, "bbox": {"l": 71.992302, "t": 580.1864, "r": 167.27231, "b": 568.84637, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 22]}], "orig": "Boots Self-Locking Nut", "text": "Boots Self-Locking Nut", "level": 1}, {"self_ref": "#/texts/3", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 71.992294, "t": 565.81635, "r": 318.49225, "b": 491.84637000000004, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 319]}], "orig": "The Boots self-locking nut is of one piece, all-metal construction designed to hold tight despite severe vibration. Note in Figure 7-26 that it has two sections and is essentially two nuts in one: a locking nut and a load-carrying nut. The two sections are connected with a spring, which is an integral part of the nut.", "text": "The Boots self-locking nut is of one piece, all-metal construction designed to hold tight despite severe vibration. Note in Figure 7-26 that it has two sections and is essentially two nuts in one: a locking nut and a load-carrying nut. The two sections are connected with a spring, which is an integral part of the nut."}, {"self_ref": "#/texts/4", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 71.992294, "t": 478.31638000000004, "r": 316.65729, "b": 404.34637000000004, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 332]}], "orig": "The spring keeps the locking and load-carrying sections such a distance apart that the two sets of threads are out of phase or spaced so that a bolt, which has been screwed through the load-carrying section, must push the locking section outward against the force of the spring to engage the threads of the locking section properly.", "text": "The spring keeps the locking and load-carrying sections such a distance apart that the two sets of threads are out of phase or spaced so that a bolt, which has been screwed through the load-carrying section, must push the locking section outward against the force of the spring to engage the threads of the locking section properly."}, {"self_ref": "#/texts/5", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 71.992294, "t": 390.81638000000004, "r": 318.81229, "b": 291.84637, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 477]}], "orig": "The spring, through the medium of the locking section, exerts a constant locking force on the bolt in the same direction as a force that would tighten the nut. In this nut, the load-carrying section has the thread strength of a standard nut of comparable size, while the locking section presses against the threads of the bolt and locks the nut firmly in position. Only a wrench applied to the nut loosens it. The nut can be removed and reused without impairing its efficiency.", "text": "The spring, through the medium of the locking section, exerts a constant locking force on the bolt in the same direction as a force that would tighten the nut. In this nut, the load-carrying section has the thread strength of a standard nut of comparable size, while the locking section presses against the threads of the bolt and locks the nut firmly in position. Only a wrench applied to the nut loosens it. The nut can be removed and reused without impairing its efficiency."}, {"self_ref": "#/texts/6", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 71.992294, "t": 278.31638, "r": 313.91229, "b": 254.34636999999998, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 122]}], "orig": "Boots self-locking nuts are made with three different spring styles and in various shapes and sizes. The wing type that is", "text": "Boots self-locking nuts are made with three different spring styles and in various shapes and sizes. The wing type that is"}, {"self_ref": "#/texts/7", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "caption", "prov": [{"page_no": 1, "bbox": {"l": 72.0, "t": 71.80239900000004, "r": 184.14828, "b": 60.99040200000002, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 31]}], "orig": "Figure 7-26. Self-locking nuts.", "text": "Figure 7-26. Self-locking nuts."}, {"self_ref": "#/texts/8", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 102.4155, "t": 186.23509, "r": 161.3187, "b": 176.61909000000003, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 18]}], "orig": "Boots aircraft nut", "text": "Boots aircraft nut"}, {"self_ref": "#/texts/9", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 91.685997, "t": 94.690201, "r": 129.77399, "b": 85.07420300000001, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 11]}], "orig": "Flexloc nut", "text": "Flexloc nut"}, {"self_ref": "#/texts/10", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 162.48109, "t": 94.690201, "r": 207.85629, "b": 85.07420300000001, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 13]}], "orig": "Fiber locknut", "text": "Fiber locknut"}, {"self_ref": "#/texts/11", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 237.31379999999996, "t": 94.690201, "r": 289.561, "b": 85.07420300000001, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 16]}], "orig": "Elastic stop nut", "text": "Elastic stop nut"}, {"self_ref": "#/texts/12", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 216.9326, "t": 186.23509, "r": 277.7966, "b": 176.61909000000003, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 18]}], "orig": "Elastic anchor nut", "text": "Elastic anchor nut"}, {"self_ref": "#/texts/13", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 320.99231, "t": 730.31635, "r": 561.80835, "b": 656.34637, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 368]}], "orig": "the most common ranges in size for No. 6 up to 1 / 4 inch, the Rol-top ranges from 1 / 4 inch to 1 / 6 inch, and the bellows type ranges in size from No. 8 up to 3 / 8 inch. Wing-type nuts are made of anodized aluminum alloy, cadmium-plated carbon steel, or stainless steel. The Rol-top nut is cadmium-plated steel, and the bellows type is made of aluminum alloy only.", "text": "the most common ranges in size for No. 6 up to 1 / 4 inch, the Rol-top ranges from 1 / 4 inch to 1 / 6 inch, and the bellows type ranges in size from No. 8 up to 3 / 8 inch. Wing-type nuts are made of anodized aluminum alloy, cadmium-plated carbon steel, or stainless steel. The Rol-top nut is cadmium-plated steel, and the bellows type is made of aluminum alloy only."}, {"self_ref": "#/texts/14", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 320.99542, "t": 655.31635, "r": 325.99542, "b": 643.84637, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": ".", "text": "."}, {"self_ref": "#/texts/15", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "section_header", "prov": [{"page_no": 1, "bbox": {"l": 320.99542, "t": 642.6864, "r": 450.99542, "b": 631.34637, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 32]}], "orig": "Stainless Steel Self-Locking Nut", "text": "Stainless Steel Self-Locking Nut", "level": 1}, {"self_ref": "#/texts/16", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 320.99542, "t": 628.31635, "r": 568.00439, "b": 416.84637000000004, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1015]}], "orig": "The stainless steel self-locking nut may be spun on and off by hand as its locking action takes places only when the nut is seated against a solid surface and tightened. The nut consists of two parts: a case with a beveled locking shoulder and key and a thread insert with a locking shoulder and slotted keyway. Until the nut is tightened, it spins on the bolt easily, because the threaded insert is the proper size for the bolt. However, when the nut is seated against a solid surface and tightened, the locking shoulder of the insert is pulled downward and wedged against the locking shoulder of the case. This action compresses the threaded insert and causes it to clench the bolt tightly. The cross-sectional view in Figure 7-27 shows how the key of the case fits into the slotted keyway of the insert so that when the case is turned, the threaded insert is turned with it. Note that the slot is wider than the key. This permits the slot to be narrowed and the insert to be compressed when the nut is tightened.", "text": "The stainless steel self-locking nut may be spun on and off by hand as its locking action takes places only when the nut is seated against a solid surface and tightened. The nut consists of two parts: a case with a beveled locking shoulder and key and a thread insert with a locking shoulder and slotted keyway. Until the nut is tightened, it spins on the bolt easily, because the threaded insert is the proper size for the bolt. However, when the nut is seated against a solid surface and tightened, the locking shoulder of the insert is pulled downward and wedged against the locking shoulder of the case. This action compresses the threaded insert and causes it to clench the bolt tightly. The cross-sectional view in Figure 7-27 shows how the key of the case fits into the slotted keyway of the insert so that when the case is turned, the threaded insert is turned with it. Note that the slot is wider than the key. This permits the slot to be narrowed and the insert to be compressed when the nut is tightened."}, {"self_ref": "#/texts/17", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "section_header", "prov": [{"page_no": 1, "bbox": {"l": 320.99542, "t": 403.18636999999995, "r": 388.50543, "b": 391.84637000000004, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 16]}], "orig": "Elastic Stop Nut", "text": "Elastic Stop Nut", "level": 1}, {"self_ref": "#/texts/18", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 320.99542, "t": 388.81638000000004, "r": 552.35132, "b": 364.84637000000004, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 108]}], "orig": "The elastic stop nut is a standard nut with the height increased to accommodate a fiber locking collar. This", "text": "The elastic stop nut is a standard nut with the height increased to accommodate a fiber locking collar. This"}, {"self_ref": "#/texts/19", "parent": {"cref": "#/pictures/1"}, "children": [], "content_layer": "body", "label": "caption", "prov": [{"page_no": 1, "bbox": {"l": 321.0, "t": 73.82240300000001, "r": 481.64931999999993, "b": 63.010403, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 46]}], "orig": "Figure 7-27. Stainless steel self-locking nut.", "text": "Figure 7-27. Stainless steel self-locking nut."}, {"self_ref": "#/texts/20", "parent": {"cref": "#/pictures/1"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 479.1354999999999, "t": 101.2654, "r": 531.16748, "b": 91.35340099999996, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 13]}], "orig": "Tightened nut", "text": "Tightened nut"}, {"self_ref": "#/texts/21", "parent": {"cref": "#/pictures/1"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 474.3699, "t": 242.1082, "r": 535.23389, "b": 232.1962000000001, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 15]}], "orig": "Untightened nut", "text": "Untightened nut"}, {"self_ref": "#/texts/22", "parent": {"cref": "#/pictures/1"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 456.7558900000001, "t": 342.00259, "r": 487.08388999999994, "b": 332.3866, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 8]}], "orig": "Nut case", "text": "Nut case"}, {"self_ref": "#/texts/23", "parent": {"cref": "#/pictures/1"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 434.62299, "t": 196.17650000000003, "r": 497.47183000000007, "b": 186.56050000000005, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 17]}], "orig": "Threaded nut core", "text": "Threaded nut core"}, {"self_ref": "#/texts/24", "parent": {"cref": "#/pictures/1"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 448.55081, "t": 220.6794, "r": 507.686, "b": 211.0634, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 16]}], "orig": "Locking shoulder", "text": "Locking shoulder"}, {"self_ref": "#/texts/25", "parent": {"cref": "#/pictures/1"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 424.78421, "t": 109.88840000000005, "r": 452.10339000000005, "b": 100.27240000000006, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 6]}], "orig": "Keyway", "text": "Keyway"}, {"self_ref": "#/texts/26", "parent": {"cref": "#/body"}, "children": [], "content_layer": "furniture", "label": "page_footer", "prov": [{"page_no": 1, "bbox": {"l": 537.98541, "t": 46.019698999999946, "r": 560.77539, "b": 33.70970199999999, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "7-45", "text": "7-45"}], "pictures": [{"self_ref": "#/pictures/0", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/7"}, {"cref": "#/texts/8"}, {"cref": "#/texts/9"}, {"cref": "#/texts/10"}, {"cref": "#/texts/11"}, {"cref": "#/texts/12"}], "content_layer": "body", "label": "picture", "prov": [{"page_no": 1, "bbox": {"l": 70.59269714355469, "t": 242.77777099609375, "r": 309.863037109375, "b": 79.6090087890625, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [{"cref": "#/texts/7"}], "references": [], "footnotes": [], "image": null, "annotations": []}, {"self_ref": "#/pictures/1", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/19"}, {"cref": "#/texts/20"}, {"cref": "#/texts/21"}, {"cref": "#/texts/22"}, {"cref": "#/texts/23"}, {"cref": "#/texts/24"}, {"cref": "#/texts/25"}], "content_layer": "body", "label": "picture", "prov": [{"page_no": 1, "bbox": {"l": 320.4467468261719, "t": 352.359375, "r": 558.8576049804688, "b": 81.689208984375, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [{"cref": "#/texts/19"}], "references": [], "footnotes": [], "image": null, "annotations": []}], "tables": [], "key_value_items": [], "form_items": [], "pages": {"1": {"size": {"width": 594.0, "height": 774.0}, "image": null, "page_no": 1}}}
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v2/amt_handbook_sample.pages.json b/tests/data/groundtruth/docling_v2/amt_handbook_sample.pages.json
index e47c4d50..7586ceaf 100644
--- a/tests/data/groundtruth/docling_v2/amt_handbook_sample.pages.json
+++ b/tests/data/groundtruth/docling_v2/amt_handbook_sample.pages.json
@@ -1 +1 @@
-[{"page_no": 0, "size": {"width": 594.0, "height": 774.0}, "cells": [{"id": 0, "text": "pulleys, provided the inner race of the bearing is clamped ", "bbox": {"l": 71.992126, "t": 43.68364999999994, "r": 300.23203, "b": 55.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "to the supporting structure by the nut and bolt. Plates must ", "bbox": {"l": 71.992126, "t": 56.18364999999994, "r": 302.00214, "b": 67.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "be attached to the structure in a positive manner to eliminate ", "bbox": {"l": 71.992126, "t": 68.68364999999994, "r": 309.82214, "b": 80.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "rotation or misalignment when tightening the bolts or screws. ", "bbox": {"l": 71.992126, "t": 81.18364999999994, "r": 314.11212, "b": 92.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "The two general types of self-locking nuts currently in use ", "bbox": {"l": 71.992302, "t": 106.18364999999994, "r": 305.15311, "b": 117.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "are the all-metal type and the fiber lock type. For the sake of ", "bbox": {"l": 71.993103, "t": 118.68364999999994, "r": 309.98309, "b": 130.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "simplicity, only three typical kinds of self-locking nuts are ", "bbox": {"l": 71.993103, "t": 131.18364999999994, "r": 302.44312, "b": 142.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "considered in this handbook: the Boots self-locking and the ", "bbox": {"l": 71.993103, "t": 143.68364999999994, "r": 306.25311, "b": 155.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "stainless steel self-locking nuts, representing the all-metal ", "bbox": {"l": 71.993103, "t": 156.18364999999994, "r": 303.9931, "b": 167.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "types; and the elastic stop nut, representing ", "bbox": {"l": 71.993103, "t": 168.68364999999994, "r": 238.6723, "b": 180.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "the fiber insert type. ", "bbox": {"l": 234.26460000000003, "t": 168.68364999999994, "r": 313.1546, "b": 180.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Boots Self-Locking Nut ", "bbox": {"l": 71.992302, "t": 193.81359999999995, "r": 167.27231, "b": 205.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "The Boots self-locking nut is of one piece, all-metal ", "bbox": {"l": 71.992302, "t": 208.18364999999994, "r": 302.27719, "b": 219.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "construction designed to hold tight despite severe vibration. ", "bbox": {"l": 71.992294, "t": 220.68364999999994, "r": 313.33026, "b": 232.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Note in ", "bbox": {"l": 71.992294, "t": 233.18364999999994, "r": 104.12231, "b": 244.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Figure 7-26", "bbox": {"l": 104.12231, "t": 233.31359999999995, "r": 152.05231, "b": 244.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": " that it has two sections and is essentially ", "bbox": {"l": 152.05231, "t": 233.18364999999994, "r": 318.49225, "b": 244.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "two nuts in one: a locking nut and a load-carrying nut. The ", "bbox": {"l": 71.992294, "t": 245.68364999999994, "r": 309.42929, "b": 257.15363, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "two sections are connected with a spring, which is an integral ", "bbox": {"l": 71.992294, "t": 258.18364999999994, "r": 317.76227, "b": 269.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "part of the nut. ", "bbox": {"l": 71.992294, "t": 270.68361999999996, "r": 133.3723, "b": 282.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "The spring keeps the locking and load-carrying sections such ", "bbox": {"l": 71.992294, "t": 295.68361999999996, "r": 316.41028, "b": 307.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "a distance apart that the two sets of threads are out of phase ", "bbox": {"l": 71.992294, "t": 308.18361999999996, "r": 312.20731, "b": 319.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "or spaced so that a bolt, which has been screwed through the ", "bbox": {"l": 71.992294, "t": 320.68361999999996, "r": 316.65729, "b": 332.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "load-carrying section, must push the locking section outward ", "bbox": {"l": 71.992294, "t": 333.18361999999996, "r": 315.91229, "b": 344.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "against the force of the spring to engage the threads of the ", "bbox": {"l": 71.992294, "t": 345.68361999999996, "r": 306.34927, "b": 357.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "locking section properly. ", "bbox": {"l": 71.992294, "t": 358.18361999999996, "r": 174.2023, "b": 369.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "The spring, through the medium of the locking section, exerts ", "bbox": {"l": 71.992294, "t": 383.18361999999996, "r": 317.07227, "b": 394.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "a constant locking force on the bolt in the same direction as a ", "bbox": {"l": 71.992294, "t": 395.68361999999996, "r": 318.81229, "b": 407.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "force that would tighten the nut. In this nut, the load-carrying ", "bbox": {"l": 71.992294, "t": 408.18361999999996, "r": 317.5123, "b": 419.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "section has the thread strength of a standard nut of comparable ", "bbox": {"l": 71.992294, "t": 420.68361999999996, "r": 317.31229, "b": 432.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "size, while the locking section presses against the threads of ", "bbox": {"l": 71.992294, "t": 433.18361999999996, "r": 314.45929, "b": 444.65363, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "the bolt and locks the nut firmly in position. Only a wrench ", "bbox": {"l": 71.992294, "t": 445.68362, "r": 311.7023, "b": 457.15363, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "applied to the nut loosens it. The nut can be removed and ", "bbox": {"l": 71.992294, "t": 458.18362, "r": 303.35229, "b": 469.65363, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "reused without impairing its efficiency. ", "bbox": {"l": 71.992294, "t": 470.68362, "r": 231.97228999999996, "b": 482.15363, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Boots self-locking nuts are made with three different spring ", "bbox": {"l": 71.992294, "t": 495.68362, "r": 313.34229, "b": 507.15363, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "styles and in various shapes and sizes. The wing type that is ", "bbox": {"l": 71.992294, "t": 508.18362, "r": 313.91229, "b": 519.65363, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "the most common ranges in size for No. 6 up to ", "bbox": {"l": 320.99231, "t": 43.68364999999994, "r": 513.74628, "b": 55.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "1", "bbox": {"l": 514.06342, "t": 44.52013999999997, "r": 516.81342, "b": 50.828610000000026, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "\u2044", "bbox": {"l": 516.81342, "t": 43.68364999999994, "r": 518.4834, "b": 55.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "4", "bbox": {"l": 518.25842, "t": 47.72014999999999, "r": 523.00525, "b": 54.02863000000002, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "inch, the ", "bbox": {"l": 525.37872, "t": 47.72014999999999, "r": 560.44843, "b": 54.02863000000002, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Rol-top ranges from ", "bbox": {"l": 320.99841, "t": 56.18364999999994, "r": 404.58441, "b": 67.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "1", "bbox": {"l": 404.48981, "t": 57.02013999999997, "r": 407.23981, "b": 63.328610000000026, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "\u2044", "bbox": {"l": 407.23981, "t": 56.18364999999994, "r": 408.90982, "b": 67.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "4", "bbox": {"l": 408.68481, "t": 60.22014999999999, "r": 413.38376, "b": 66.52863000000002, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "inch to ", "bbox": {"l": 415.73322, "t": 60.22014999999999, "r": 443.92681999999996, "b": 66.52863000000002, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "1", "bbox": {"l": 443.82598999999993, "t": 57.02013999999997, "r": 446.57598999999993, "b": 63.328610000000026, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "\u2044", "bbox": {"l": 446.57598999999993, "t": 56.18364999999994, "r": 448.24600000000004, "b": 67.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "6", "bbox": {"l": 448.22588999999994, "t": 60.22014999999999, "r": 453.12659, "b": 66.52863000000002, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "inch, and the bellows type ", "bbox": {"l": 455.57697, "t": 60.22014999999999, "r": 560.6579, "b": 66.52863000000002, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "ranges in size from No. 8 up to ", "bbox": {"l": 320.99591, "t": 68.68364999999994, "r": 447.36591000000004, "b": 80.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "3", "bbox": {"l": 448.79668999999996, "t": 69.52013999999997, "r": 451.54668999999996, "b": 75.82861000000003, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "\u2044", "bbox": {"l": 451.50549, "t": 68.68364999999994, "r": 453.17551, "b": 80.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "8", "bbox": {"l": 453.17542000000003, "t": 72.72014999999999, "r": 458.07175000000007, "b": 79.02863000000002, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "inch. Wing-type nuts are ", "bbox": {"l": 460.51993, "t": 72.72014999999999, "r": 559.78839, "b": 79.02863000000002, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "made of anodized aluminum alloy, cadmium-plated carbon ", "bbox": {"l": 320.99542, "t": 81.18364999999994, "r": 559.77844, "b": 92.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "steel, or stainless steel. The Rol-top nut is cadmium-plated ", "bbox": {"l": 320.99542, "t": 93.68364999999994, "r": 557.87738, "b": 105.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "steel, and the bellows type is made of aluminum alloy only. ", "bbox": {"l": 320.99542, "t": 106.18364999999994, "r": 561.80835, "b": 117.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": ". ", "bbox": {"l": 320.99542, "t": 118.68364999999994, "r": 325.99542, "b": 130.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Stainless Steel Self-Locking Nut ", "bbox": {"l": 320.99542, "t": 131.31359999999995, "r": 450.99542, "b": 142.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "The stainless steel self-locking nut may be spun on and off ", "bbox": {"l": 320.99542, "t": 145.68364999999994, "r": 558.39838, "b": 157.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "by hand as its locking action takes places only when the ", "bbox": {"l": 320.99542, "t": 158.18364999999994, "r": 547.92542, "b": 169.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "nut is seated against a solid surface and tightened. The nut ", "bbox": {"l": 320.99542, "t": 170.68364999999994, "r": 556.50842, "b": 182.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "consists of two parts: a case with a beveled locking shoulder ", "bbox": {"l": 320.99542, "t": 183.18364999999994, "r": 565.11346, "b": 194.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "and key and a thread insert with a locking shoulder and ", "bbox": {"l": 320.99542, "t": 195.68364999999994, "r": 547.93744, "b": 207.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "slotted keyway. Until the nut is tightened, it spins on the ", "bbox": {"l": 320.99542, "t": 208.18364999999994, "r": 549.00647, "b": 219.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "bolt easily, because the threaded insert is the proper size ", "bbox": {"l": 320.99542, "t": 220.68364999999994, "r": 549.0755, "b": 232.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "for the bolt. However, when the nut is seated against a solid ", "bbox": {"l": 320.99542, "t": 233.18364999999994, "r": 562.60242, "b": 244.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "surface and tightened, the locking shoulder of the insert is ", "bbox": {"l": 320.99542, "t": 245.68364999999994, "r": 555.11243, "b": 257.15363, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "pulled downward and wedged against the locking shoulder ", "bbox": {"l": 320.99542, "t": 258.18364999999994, "r": 558.74146, "b": 269.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "of the case. This action compresses the threaded insert and ", "bbox": {"l": 320.99542, "t": 270.68361999999996, "r": 557.88538, "b": 282.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "causes it to clench the bolt tightly. The cross-sectional view ", "bbox": {"l": 320.99542, "t": 283.18361999999996, "r": 562.3114, "b": 294.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "in ", "bbox": {"l": 320.99542, "t": 295.68361999999996, "r": 331.27542, "b": 307.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "Figure 7-27", "bbox": {"l": 331.81543, "t": 295.81363000000005, "r": 379.86542, "b": 307.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": " shows how the key of the case fits into the ", "bbox": {"l": 379.86542, "t": 295.68361999999996, "r": 554.56543, "b": 307.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "slotted keyway of the insert so that when the case is turned, ", "bbox": {"l": 320.99542, "t": 308.18361999999996, "r": 561.16339, "b": 319.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "the threaded insert is turned with it. Note that the slot is wider ", "bbox": {"l": 320.99542, "t": 320.68361999999996, "r": 568.00439, "b": 332.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "than the key. This permits the slot to be narrowed and the ", "bbox": {"l": 320.99542, "t": 333.18361999999996, "r": 553.46545, "b": 344.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "insert to be compressed when the nut is tightened. ", "bbox": {"l": 320.99542, "t": 345.68361999999996, "r": 523.19543, "b": 357.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "Elastic Stop Nut ", "bbox": {"l": 320.99542, "t": 370.81363000000005, "r": 388.50543, "b": 382.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "The elastic stop nut is a standard nut with the height ", "bbox": {"l": 320.99542, "t": 385.18361999999996, "r": 548.72437, "b": 396.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "increased to accommodate a fiber locking collar. This ", "bbox": {"l": 320.99542, "t": 397.68361999999996, "r": 552.35132, "b": 409.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "Tightened nut ", "bbox": {"l": 479.1354999999999, "t": 672.7346, "r": 531.16748, "b": 682.646599, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "Untightened nut ", "bbox": {"l": 474.3699, "t": 531.8918, "r": 535.23389, "b": 541.8037999999999, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "Nut case ", "bbox": {"l": 456.7558900000001, "t": 431.99741, "r": 487.08388999999994, "b": 441.6134, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "Threaded nut core ", "bbox": {"l": 434.62299, "t": 577.8235, "r": 497.47183000000007, "b": 587.4395, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Locking shoulder ", "bbox": {"l": 448.55081, "t": 553.3206, "r": 507.686, "b": 562.9366, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Keyway ", "bbox": {"l": 424.78421, "t": 664.1116, "r": 452.10339000000005, "b": 673.7275999999999, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "Boots aircraft nut ", "bbox": {"l": 102.4155, "t": 587.76491, "r": 161.3187, "b": 597.38091, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "Flexloc nut ", "bbox": {"l": 91.685997, "t": 679.309799, "r": 129.77399, "b": 688.925797, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "Fiber locknut ", "bbox": {"l": 162.48109, "t": 679.309799, "r": 207.85629, "b": 688.925797, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "Elastic stop nut ", "bbox": {"l": 237.31379999999996, "t": 679.309799, "r": 289.561, "b": 688.925797, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Elastic anchor nut ", "bbox": {"l": 216.9326, "t": 587.76491, "r": 277.7966, "b": 597.38091, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "Figure 7-26. ", "bbox": {"l": 72.0, "t": 702.457596, "r": 119.12800000000001, "b": 713.009598, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "Self-locking nuts. ", "bbox": {"l": 119.4023, "t": 702.197601, "r": 184.14828, "b": 712.403599, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "Figure 7-27. ", "bbox": {"l": 321.0, "t": 700.437599, "r": 368.12799, "b": 710.989597, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "Stainless steel self-locking nut. ", "bbox": {"l": 368.40231, "t": 700.177597, "r": 481.64931999999993, "b": 710.383598, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "7-45 ", "bbox": {"l": 537.98541, "t": 727.980301, "r": 560.77539, "b": 740.290298, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 8, "label": "text", "bbox": {"l": 71.992126, "t": 43.68364999999994, "r": 314.11212, "b": 92.65363000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9851651191711426, "cells": [{"id": 0, "text": "pulleys, provided the inner race of the bearing is clamped ", "bbox": {"l": 71.992126, "t": 43.68364999999994, "r": 300.23203, "b": 55.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "to the supporting structure by the nut and bolt. Plates must ", "bbox": {"l": 71.992126, "t": 56.18364999999994, "r": 302.00214, "b": 67.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "be attached to the structure in a positive manner to eliminate ", "bbox": {"l": 71.992126, "t": 68.68364999999994, "r": 309.82214, "b": 80.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "rotation or misalignment when tightening the bolts or screws. ", "bbox": {"l": 71.992126, "t": 81.18364999999994, "r": 314.11212, "b": 92.65363000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "text", "bbox": {"l": 71.992302, "t": 106.18364999999994, "r": 313.1546, "b": 180.15363000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9873439073562622, "cells": [{"id": 4, "text": "The two general types of self-locking nuts currently in use ", "bbox": {"l": 71.992302, "t": 106.18364999999994, "r": 305.15311, "b": 117.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "are the all-metal type and the fiber lock type. For the sake of ", "bbox": {"l": 71.993103, "t": 118.68364999999994, "r": 309.98309, "b": 130.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "simplicity, only three typical kinds of self-locking nuts are ", "bbox": {"l": 71.993103, "t": 131.18364999999994, "r": 302.44312, "b": 142.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "considered in this handbook: the Boots self-locking and the ", "bbox": {"l": 71.993103, "t": 143.68364999999994, "r": 306.25311, "b": 155.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "stainless steel self-locking nuts, representing the all-metal ", "bbox": {"l": 71.993103, "t": 156.18364999999994, "r": 303.9931, "b": 167.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "types; and the elastic stop nut, representing ", "bbox": {"l": 71.993103, "t": 168.68364999999994, "r": 238.6723, "b": 180.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "the fiber insert type. ", "bbox": {"l": 234.26460000000003, "t": 168.68364999999994, "r": 313.1546, "b": 180.15363000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "section_header", "bbox": {"l": 71.992302, "t": 193.81359999999995, "r": 167.27231, "b": 205.15363000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9309079647064209, "cells": [{"id": 11, "text": "Boots Self-Locking Nut ", "bbox": {"l": 71.992302, "t": 193.81359999999995, "r": 167.27231, "b": 205.15363000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "text", "bbox": {"l": 71.992294, "t": 208.18364999999994, "r": 318.49225, "b": 282.15362999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9866572022438049, "cells": [{"id": 12, "text": "The Boots self-locking nut is of one piece, all-metal ", "bbox": {"l": 71.992302, "t": 208.18364999999994, "r": 302.27719, "b": 219.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "construction designed to hold tight despite severe vibration. ", "bbox": {"l": 71.992294, "t": 220.68364999999994, "r": 313.33026, "b": 232.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Note in ", "bbox": {"l": 71.992294, "t": 233.18364999999994, "r": 104.12231, "b": 244.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Figure 7-26", "bbox": {"l": 104.12231, "t": 233.31359999999995, "r": 152.05231, "b": 244.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": " that it has two sections and is essentially ", "bbox": {"l": 152.05231, "t": 233.18364999999994, "r": 318.49225, "b": 244.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "two nuts in one: a locking nut and a load-carrying nut. The ", "bbox": {"l": 71.992294, "t": 245.68364999999994, "r": 309.42929, "b": 257.15363, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "two sections are connected with a spring, which is an integral ", "bbox": {"l": 71.992294, "t": 258.18364999999994, "r": 317.76227, "b": 269.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "part of the nut. ", "bbox": {"l": 71.992294, "t": 270.68361999999996, "r": 133.3723, "b": 282.15362999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 71.992294, "t": 295.68361999999996, "r": 316.65729, "b": 369.65362999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9881331324577332, "cells": [{"id": 20, "text": "The spring keeps the locking and load-carrying sections such ", "bbox": {"l": 71.992294, "t": 295.68361999999996, "r": 316.41028, "b": 307.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "a distance apart that the two sets of threads are out of phase ", "bbox": {"l": 71.992294, "t": 308.18361999999996, "r": 312.20731, "b": 319.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "or spaced so that a bolt, which has been screwed through the ", "bbox": {"l": 71.992294, "t": 320.68361999999996, "r": 316.65729, "b": 332.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "load-carrying section, must push the locking section outward ", "bbox": {"l": 71.992294, "t": 333.18361999999996, "r": 315.91229, "b": 344.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "against the force of the spring to engage the threads of the ", "bbox": {"l": 71.992294, "t": 345.68361999999996, "r": 306.34927, "b": 357.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "locking section properly. ", "bbox": {"l": 71.992294, "t": 358.18361999999996, "r": 174.2023, "b": 369.65362999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 71.992294, "t": 383.18361999999996, "r": 318.81229, "b": 482.15363, "coord_origin": "TOPLEFT"}, "confidence": 0.9882921576499939, "cells": [{"id": 26, "text": "The spring, through the medium of the locking section, exerts ", "bbox": {"l": 71.992294, "t": 383.18361999999996, "r": 317.07227, "b": 394.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "a constant locking force on the bolt in the same direction as a ", "bbox": {"l": 71.992294, "t": 395.68361999999996, "r": 318.81229, "b": 407.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "force that would tighten the nut. In this nut, the load-carrying ", "bbox": {"l": 71.992294, "t": 408.18361999999996, "r": 317.5123, "b": 419.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "section has the thread strength of a standard nut of comparable ", "bbox": {"l": 71.992294, "t": 420.68361999999996, "r": 317.31229, "b": 432.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "size, while the locking section presses against the threads of ", "bbox": {"l": 71.992294, "t": 433.18361999999996, "r": 314.45929, "b": 444.65363, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "the bolt and locks the nut firmly in position. Only a wrench ", "bbox": {"l": 71.992294, "t": 445.68362, "r": 311.7023, "b": 457.15363, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "applied to the nut loosens it. The nut can be removed and ", "bbox": {"l": 71.992294, "t": 458.18362, "r": 303.35229, "b": 469.65363, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "reused without impairing its efficiency. ", "bbox": {"l": 71.992294, "t": 470.68362, "r": 231.97228999999996, "b": 482.15363, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 71.992294, "t": 495.68362, "r": 313.91229, "b": 519.65363, "coord_origin": "TOPLEFT"}, "confidence": 0.9695363640785217, "cells": [{"id": 34, "text": "Boots self-locking nuts are made with three different spring ", "bbox": {"l": 71.992294, "t": 495.68362, "r": 313.34229, "b": 507.15363, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "styles and in various shapes and sizes. The wing type that is ", "bbox": {"l": 71.992294, "t": 508.18362, "r": 313.91229, "b": 519.65363, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "text", "bbox": {"l": 320.99231, "t": 43.68364999999994, "r": 561.80835, "b": 117.65363000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9870070219039917, "cells": [{"id": 36, "text": "the most common ranges in size for No. 6 up to ", "bbox": {"l": 320.99231, "t": 43.68364999999994, "r": 513.74628, "b": 55.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "1", "bbox": {"l": 514.06342, "t": 44.52013999999997, "r": 516.81342, "b": 50.828610000000026, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "\u2044", "bbox": {"l": 516.81342, "t": 43.68364999999994, "r": 518.4834, "b": 55.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "4", "bbox": {"l": 518.25842, "t": 47.72014999999999, "r": 523.00525, "b": 54.02863000000002, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "inch, the ", "bbox": {"l": 525.37872, "t": 47.72014999999999, "r": 560.44843, "b": 54.02863000000002, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Rol-top ranges from ", "bbox": {"l": 320.99841, "t": 56.18364999999994, "r": 404.58441, "b": 67.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "1", "bbox": {"l": 404.48981, "t": 57.02013999999997, "r": 407.23981, "b": 63.328610000000026, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "\u2044", "bbox": {"l": 407.23981, "t": 56.18364999999994, "r": 408.90982, "b": 67.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "4", "bbox": {"l": 408.68481, "t": 60.22014999999999, "r": 413.38376, "b": 66.52863000000002, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "inch to ", "bbox": {"l": 415.73322, "t": 60.22014999999999, "r": 443.92681999999996, "b": 66.52863000000002, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "1", "bbox": {"l": 443.82598999999993, "t": 57.02013999999997, "r": 446.57598999999993, "b": 63.328610000000026, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "\u2044", "bbox": {"l": 446.57598999999993, "t": 56.18364999999994, "r": 448.24600000000004, "b": 67.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "6", "bbox": {"l": 448.22588999999994, "t": 60.22014999999999, "r": 453.12659, "b": 66.52863000000002, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "inch, and the bellows type ", "bbox": {"l": 455.57697, "t": 60.22014999999999, "r": 560.6579, "b": 66.52863000000002, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "ranges in size from No. 8 up to ", "bbox": {"l": 320.99591, "t": 68.68364999999994, "r": 447.36591000000004, "b": 80.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "3", "bbox": {"l": 448.79668999999996, "t": 69.52013999999997, "r": 451.54668999999996, "b": 75.82861000000003, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "\u2044", "bbox": {"l": 451.50549, "t": 68.68364999999994, "r": 453.17551, "b": 80.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "8", "bbox": {"l": 453.17542000000003, "t": 72.72014999999999, "r": 458.07175000000007, "b": 79.02863000000002, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "inch. Wing-type nuts are ", "bbox": {"l": 460.51993, "t": 72.72014999999999, "r": 559.78839, "b": 79.02863000000002, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "made of anodized aluminum alloy, cadmium-plated carbon ", "bbox": {"l": 320.99542, "t": 81.18364999999994, "r": 559.77844, "b": 92.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "steel, or stainless steel. The Rol-top nut is cadmium-plated ", "bbox": {"l": 320.99542, "t": 93.68364999999994, "r": 557.87738, "b": 105.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "steel, and the bellows type is made of aluminum alloy only. ", "bbox": {"l": 320.99542, "t": 106.18364999999994, "r": 561.80835, "b": 117.65363000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 320.99542, "t": 118.68364999999994, "r": 325.99542, "b": 130.15363000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": ". ", "bbox": {"l": 320.99542, "t": 118.68364999999994, "r": 325.99542, "b": 130.15363000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "section_header", "bbox": {"l": 320.99542, "t": 131.31359999999995, "r": 450.99542, "b": 142.65363000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9263731241226196, "cells": [{"id": 59, "text": "Stainless Steel Self-Locking Nut ", "bbox": {"l": 320.99542, "t": 131.31359999999995, "r": 450.99542, "b": 142.65363000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 320.99542, "t": 145.68364999999994, "r": 568.00439, "b": 357.15362999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9879258871078491, "cells": [{"id": 60, "text": "The stainless steel self-locking nut may be spun on and off ", "bbox": {"l": 320.99542, "t": 145.68364999999994, "r": 558.39838, "b": 157.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "by hand as its locking action takes places only when the ", "bbox": {"l": 320.99542, "t": 158.18364999999994, "r": 547.92542, "b": 169.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "nut is seated against a solid surface and tightened. The nut ", "bbox": {"l": 320.99542, "t": 170.68364999999994, "r": 556.50842, "b": 182.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "consists of two parts: a case with a beveled locking shoulder ", "bbox": {"l": 320.99542, "t": 183.18364999999994, "r": 565.11346, "b": 194.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "and key and a thread insert with a locking shoulder and ", "bbox": {"l": 320.99542, "t": 195.68364999999994, "r": 547.93744, "b": 207.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "slotted keyway. Until the nut is tightened, it spins on the ", "bbox": {"l": 320.99542, "t": 208.18364999999994, "r": 549.00647, "b": 219.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "bolt easily, because the threaded insert is the proper size ", "bbox": {"l": 320.99542, "t": 220.68364999999994, "r": 549.0755, "b": 232.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "for the bolt. However, when the nut is seated against a solid ", "bbox": {"l": 320.99542, "t": 233.18364999999994, "r": 562.60242, "b": 244.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "surface and tightened, the locking shoulder of the insert is ", "bbox": {"l": 320.99542, "t": 245.68364999999994, "r": 555.11243, "b": 257.15363, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "pulled downward and wedged against the locking shoulder ", "bbox": {"l": 320.99542, "t": 258.18364999999994, "r": 558.74146, "b": 269.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "of the case. This action compresses the threaded insert and ", "bbox": {"l": 320.99542, "t": 270.68361999999996, "r": 557.88538, "b": 282.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "causes it to clench the bolt tightly. The cross-sectional view ", "bbox": {"l": 320.99542, "t": 283.18361999999996, "r": 562.3114, "b": 294.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "in ", "bbox": {"l": 320.99542, "t": 295.68361999999996, "r": 331.27542, "b": 307.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "Figure 7-27", "bbox": {"l": 331.81543, "t": 295.81363000000005, "r": 379.86542, "b": 307.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": " shows how the key of the case fits into the ", "bbox": {"l": 379.86542, "t": 295.68361999999996, "r": 554.56543, "b": 307.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "slotted keyway of the insert so that when the case is turned, ", "bbox": {"l": 320.99542, "t": 308.18361999999996, "r": 561.16339, "b": 319.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "the threaded insert is turned with it. Note that the slot is wider ", "bbox": {"l": 320.99542, "t": 320.68361999999996, "r": 568.00439, "b": 332.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "than the key. This permits the slot to be narrowed and the ", "bbox": {"l": 320.99542, "t": 333.18361999999996, "r": 553.46545, "b": 344.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "insert to be compressed when the nut is tightened. ", "bbox": {"l": 320.99542, "t": 345.68361999999996, "r": 523.19543, "b": 357.15362999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "section_header", "bbox": {"l": 320.99542, "t": 370.81363000000005, "r": 388.50543, "b": 382.15362999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9253152012825012, "cells": [{"id": 79, "text": "Elastic Stop Nut ", "bbox": {"l": 320.99542, "t": 370.81363000000005, "r": 388.50543, "b": 382.15362999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "text", "bbox": {"l": 320.99542, "t": 385.18361999999996, "r": 552.35132, "b": 409.15362999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9676451683044434, "cells": [{"id": 80, "text": "The elastic stop nut is a standard nut with the height ", "bbox": {"l": 320.99542, "t": 385.18361999999996, "r": 548.72437, "b": 396.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "increased to accommodate a fiber locking collar. This ", "bbox": {"l": 320.99542, "t": 397.68361999999996, "r": 552.35132, "b": 409.15362999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "picture", "bbox": {"l": 320.4467468261719, "t": 421.640625, "r": 558.8576049804688, "b": 692.310791015625, "coord_origin": "TOPLEFT"}, "confidence": 0.9881086945533752, "cells": [{"id": 82, "text": "Tightened nut ", "bbox": {"l": 479.1354999999999, "t": 672.7346, "r": 531.16748, "b": 682.646599, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "Untightened nut ", "bbox": {"l": 474.3699, "t": 531.8918, "r": 535.23389, "b": 541.8037999999999, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "Nut case ", "bbox": {"l": 456.7558900000001, "t": 431.99741, "r": 487.08388999999994, "b": 441.6134, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "Threaded nut core ", "bbox": {"l": 434.62299, "t": 577.8235, "r": 497.47183000000007, "b": 587.4395, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Locking shoulder ", "bbox": {"l": 448.55081, "t": 553.3206, "r": 507.686, "b": 562.9366, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Keyway ", "bbox": {"l": 424.78421, "t": 664.1116, "r": 452.10339000000005, "b": 673.7275999999999, "coord_origin": "TOPLEFT"}}], "children": [{"id": 18, "label": "text", "bbox": {"l": 479.1354999999999, "t": 672.7346, "r": 531.16748, "b": 682.646599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "Tightened nut ", "bbox": {"l": 479.1354999999999, "t": 672.7346, "r": 531.16748, "b": 682.646599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 474.3699, "t": 531.8918, "r": 535.23389, "b": 541.8037999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "Untightened nut ", "bbox": {"l": 474.3699, "t": 531.8918, "r": 535.23389, "b": 541.8037999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 456.7558900000001, "t": 431.99741, "r": 487.08388999999994, "b": 441.6134, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "Nut case ", "bbox": {"l": 456.7558900000001, "t": 431.99741, "r": 487.08388999999994, "b": 441.6134, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 434.62299, "t": 577.8235, "r": 497.47183000000007, "b": 587.4395, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "Threaded nut core ", "bbox": {"l": 434.62299, "t": 577.8235, "r": 497.47183000000007, "b": 587.4395, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 448.55081, "t": 553.3206, "r": 507.686, "b": 562.9366, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "Locking shoulder ", "bbox": {"l": 448.55081, "t": 553.3206, "r": 507.686, "b": 562.9366, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 424.78421, "t": 664.1116, "r": 452.10339000000005, "b": 673.7275999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "Keyway ", "bbox": {"l": 424.78421, "t": 664.1116, "r": 452.10339000000005, "b": 673.7275999999999, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 7, "label": "picture", "bbox": {"l": 70.59269714355469, "t": 531.2222290039062, "r": 309.863037109375, "b": 694.3909912109375, "coord_origin": "TOPLEFT"}, "confidence": 0.9858751893043518, "cells": [{"id": 88, "text": "Boots aircraft nut ", "bbox": {"l": 102.4155, "t": 587.76491, "r": 161.3187, "b": 597.38091, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "Flexloc nut ", "bbox": {"l": 91.685997, "t": 679.309799, "r": 129.77399, "b": 688.925797, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "Fiber locknut ", "bbox": {"l": 162.48109, "t": 679.309799, "r": 207.85629, "b": 688.925797, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "Elastic stop nut ", "bbox": {"l": 237.31379999999996, "t": 679.309799, "r": 289.561, "b": 688.925797, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Elastic anchor nut ", "bbox": {"l": 216.9326, "t": 587.76491, "r": 277.7966, "b": 597.38091, "coord_origin": "TOPLEFT"}}], "children": [{"id": 24, "label": "text", "bbox": {"l": 102.4155, "t": 587.76491, "r": 161.3187, "b": 597.38091, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "Boots aircraft nut ", "bbox": {"l": 102.4155, "t": 587.76491, "r": 161.3187, "b": 597.38091, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 91.685997, "t": 679.309799, "r": 129.77399, "b": 688.925797, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "Flexloc nut ", "bbox": {"l": 91.685997, "t": 679.309799, "r": 129.77399, "b": 688.925797, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 162.48109, "t": 679.309799, "r": 207.85629, "b": 688.925797, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "Fiber locknut ", "bbox": {"l": 162.48109, "t": 679.309799, "r": 207.85629, "b": 688.925797, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 237.31379999999996, "t": 679.309799, "r": 289.561, "b": 688.925797, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "Elastic stop nut ", "bbox": {"l": 237.31379999999996, "t": 679.309799, "r": 289.561, "b": 688.925797, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 216.9326, "t": 587.76491, "r": 277.7966, "b": 597.38091, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "Elastic anchor nut ", "bbox": {"l": 216.9326, "t": 587.76491, "r": 277.7966, "b": 597.38091, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 12, "label": "caption", "bbox": {"l": 72.0, "t": 702.197601, "r": 184.14828, "b": 713.009598, "coord_origin": "TOPLEFT"}, "confidence": 0.9449448585510254, "cells": [{"id": 93, "text": "Figure 7-26. ", "bbox": {"l": 72.0, "t": 702.457596, "r": 119.12800000000001, "b": 713.009598, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "Self-locking nuts. ", "bbox": {"l": 119.4023, "t": 702.197601, "r": 184.14828, "b": 712.403599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "caption", "bbox": {"l": 321.0, "t": 700.177597, "r": 481.64931999999993, "b": 710.989597, "coord_origin": "TOPLEFT"}, "confidence": 0.9497622847557068, "cells": [{"id": 95, "text": "Figure 7-27. ", "bbox": {"l": 321.0, "t": 700.437599, "r": 368.12799, "b": 710.989597, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "Stainless steel self-locking nut. ", "bbox": {"l": 368.40231, "t": 700.177597, "r": 481.64931999999993, "b": 710.383598, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "page_footer", "bbox": {"l": 537.98541, "t": 727.980301, "r": 560.77539, "b": 740.290298, "coord_origin": "TOPLEFT"}, "confidence": 0.9368568658828735, "cells": [{"id": 97, "text": "7-45 ", "bbox": {"l": 537.98541, "t": 727.980301, "r": 560.77539, "b": 740.290298, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "text", "id": 8, "page_no": 0, "cluster": {"id": 8, "label": "text", "bbox": {"l": 71.992126, "t": 43.68364999999994, "r": 314.11212, "b": 92.65363000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9851651191711426, "cells": [{"id": 0, "text": "pulleys, provided the inner race of the bearing is clamped ", "bbox": {"l": 71.992126, "t": 43.68364999999994, "r": 300.23203, "b": 55.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "to the supporting structure by the nut and bolt. Plates must ", "bbox": {"l": 71.992126, "t": 56.18364999999994, "r": 302.00214, "b": 67.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "be attached to the structure in a positive manner to eliminate ", "bbox": {"l": 71.992126, "t": 68.68364999999994, "r": 309.82214, "b": 80.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "rotation or misalignment when tightening the bolts or screws. ", "bbox": {"l": 71.992126, "t": 81.18364999999994, "r": 314.11212, "b": 92.65363000000002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "pulleys, provided the inner race of the bearing is clamped to the supporting structure by the nut and bolt. Plates must be attached to the structure in a positive manner to eliminate rotation or misalignment when tightening the bolts or screws."}, {"label": "text", "id": 4, "page_no": 0, "cluster": {"id": 4, "label": "text", "bbox": {"l": 71.992302, "t": 106.18364999999994, "r": 313.1546, "b": 180.15363000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9873439073562622, "cells": [{"id": 4, "text": "The two general types of self-locking nuts currently in use ", "bbox": {"l": 71.992302, "t": 106.18364999999994, "r": 305.15311, "b": 117.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "are the all-metal type and the fiber lock type. For the sake of ", "bbox": {"l": 71.993103, "t": 118.68364999999994, "r": 309.98309, "b": 130.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "simplicity, only three typical kinds of self-locking nuts are ", "bbox": {"l": 71.993103, "t": 131.18364999999994, "r": 302.44312, "b": 142.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "considered in this handbook: the Boots self-locking and the ", "bbox": {"l": 71.993103, "t": 143.68364999999994, "r": 306.25311, "b": 155.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "stainless steel self-locking nuts, representing the all-metal ", "bbox": {"l": 71.993103, "t": 156.18364999999994, "r": 303.9931, "b": 167.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "types; and the elastic stop nut, representing ", "bbox": {"l": 71.993103, "t": 168.68364999999994, "r": 238.6723, "b": 180.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "the fiber insert type. ", "bbox": {"l": 234.26460000000003, "t": 168.68364999999994, "r": 313.1546, "b": 180.15363000000002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The two general types of self-locking nuts currently in use are the all-metal type and the fiber lock type. For the sake of simplicity, only three typical kinds of self-locking nuts are considered in this handbook: the Boots self-locking and the stainless steel self-locking nuts, representing the all-metal types; and the elastic stop nut, representing the fiber insert type."}, {"label": "section_header", "id": 14, "page_no": 0, "cluster": {"id": 14, "label": "section_header", "bbox": {"l": 71.992302, "t": 193.81359999999995, "r": 167.27231, "b": 205.15363000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9309079647064209, "cells": [{"id": 11, "text": "Boots Self-Locking Nut ", "bbox": {"l": 71.992302, "t": 193.81359999999995, "r": 167.27231, "b": 205.15363000000002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Boots Self-Locking Nut"}, {"label": "text", "id": 6, "page_no": 0, "cluster": {"id": 6, "label": "text", "bbox": {"l": 71.992294, "t": 208.18364999999994, "r": 318.49225, "b": 282.15362999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9866572022438049, "cells": [{"id": 12, "text": "The Boots self-locking nut is of one piece, all-metal ", "bbox": {"l": 71.992302, "t": 208.18364999999994, "r": 302.27719, "b": 219.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "construction designed to hold tight despite severe vibration. ", "bbox": {"l": 71.992294, "t": 220.68364999999994, "r": 313.33026, "b": 232.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Note in ", "bbox": {"l": 71.992294, "t": 233.18364999999994, "r": 104.12231, "b": 244.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Figure 7-26", "bbox": {"l": 104.12231, "t": 233.31359999999995, "r": 152.05231, "b": 244.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": " that it has two sections and is essentially ", "bbox": {"l": 152.05231, "t": 233.18364999999994, "r": 318.49225, "b": 244.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "two nuts in one: a locking nut and a load-carrying nut. The ", "bbox": {"l": 71.992294, "t": 245.68364999999994, "r": 309.42929, "b": 257.15363, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "two sections are connected with a spring, which is an integral ", "bbox": {"l": 71.992294, "t": 258.18364999999994, "r": 317.76227, "b": 269.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "part of the nut. ", "bbox": {"l": 71.992294, "t": 270.68361999999996, "r": 133.3723, "b": 282.15362999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The Boots self-locking nut is of one piece, all-metal construction designed to hold tight despite severe vibration. Note in Figure 7-26 that it has two sections and is essentially two nuts in one: a locking nut and a load-carrying nut. The two sections are connected with a spring, which is an integral part of the nut."}, {"label": "text", "id": 1, "page_no": 0, "cluster": {"id": 1, "label": "text", "bbox": {"l": 71.992294, "t": 295.68361999999996, "r": 316.65729, "b": 369.65362999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9881331324577332, "cells": [{"id": 20, "text": "The spring keeps the locking and load-carrying sections such ", "bbox": {"l": 71.992294, "t": 295.68361999999996, "r": 316.41028, "b": 307.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "a distance apart that the two sets of threads are out of phase ", "bbox": {"l": 71.992294, "t": 308.18361999999996, "r": 312.20731, "b": 319.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "or spaced so that a bolt, which has been screwed through the ", "bbox": {"l": 71.992294, "t": 320.68361999999996, "r": 316.65729, "b": 332.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "load-carrying section, must push the locking section outward ", "bbox": {"l": 71.992294, "t": 333.18361999999996, "r": 315.91229, "b": 344.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "against the force of the spring to engage the threads of the ", "bbox": {"l": 71.992294, "t": 345.68361999999996, "r": 306.34927, "b": 357.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "locking section properly. ", "bbox": {"l": 71.992294, "t": 358.18361999999996, "r": 174.2023, "b": 369.65362999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The spring keeps the locking and load-carrying sections such a distance apart that the two sets of threads are out of phase or spaced so that a bolt, which has been screwed through the load-carrying section, must push the locking section outward against the force of the spring to engage the threads of the locking section properly."}, {"label": "text", "id": 0, "page_no": 0, "cluster": {"id": 0, "label": "text", "bbox": {"l": 71.992294, "t": 383.18361999999996, "r": 318.81229, "b": 482.15363, "coord_origin": "TOPLEFT"}, "confidence": 0.9882921576499939, "cells": [{"id": 26, "text": "The spring, through the medium of the locking section, exerts ", "bbox": {"l": 71.992294, "t": 383.18361999999996, "r": 317.07227, "b": 394.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "a constant locking force on the bolt in the same direction as a ", "bbox": {"l": 71.992294, "t": 395.68361999999996, "r": 318.81229, "b": 407.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "force that would tighten the nut. In this nut, the load-carrying ", "bbox": {"l": 71.992294, "t": 408.18361999999996, "r": 317.5123, "b": 419.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "section has the thread strength of a standard nut of comparable ", "bbox": {"l": 71.992294, "t": 420.68361999999996, "r": 317.31229, "b": 432.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "size, while the locking section presses against the threads of ", "bbox": {"l": 71.992294, "t": 433.18361999999996, "r": 314.45929, "b": 444.65363, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "the bolt and locks the nut firmly in position. Only a wrench ", "bbox": {"l": 71.992294, "t": 445.68362, "r": 311.7023, "b": 457.15363, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "applied to the nut loosens it. The nut can be removed and ", "bbox": {"l": 71.992294, "t": 458.18362, "r": 303.35229, "b": 469.65363, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "reused without impairing its efficiency. ", "bbox": {"l": 71.992294, "t": 470.68362, "r": 231.97228999999996, "b": 482.15363, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The spring, through the medium of the locking section, exerts a constant locking force on the bolt in the same direction as a force that would tighten the nut. In this nut, the load-carrying section has the thread strength of a standard nut of comparable size, while the locking section presses against the threads of the bolt and locks the nut firmly in position. Only a wrench applied to the nut loosens it. The nut can be removed and reused without impairing its efficiency."}, {"label": "text", "id": 9, "page_no": 0, "cluster": {"id": 9, "label": "text", "bbox": {"l": 71.992294, "t": 495.68362, "r": 313.91229, "b": 519.65363, "coord_origin": "TOPLEFT"}, "confidence": 0.9695363640785217, "cells": [{"id": 34, "text": "Boots self-locking nuts are made with three different spring ", "bbox": {"l": 71.992294, "t": 495.68362, "r": 313.34229, "b": 507.15363, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "styles and in various shapes and sizes. The wing type that is ", "bbox": {"l": 71.992294, "t": 508.18362, "r": 313.91229, "b": 519.65363, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Boots self-locking nuts are made with three different spring styles and in various shapes and sizes. The wing type that is"}, {"label": "text", "id": 5, "page_no": 0, "cluster": {"id": 5, "label": "text", "bbox": {"l": 320.99231, "t": 43.68364999999994, "r": 561.80835, "b": 117.65363000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9870070219039917, "cells": [{"id": 36, "text": "the most common ranges in size for No. 6 up to ", "bbox": {"l": 320.99231, "t": 43.68364999999994, "r": 513.74628, "b": 55.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "1", "bbox": {"l": 514.06342, "t": 44.52013999999997, "r": 516.81342, "b": 50.828610000000026, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "\u2044", "bbox": {"l": 516.81342, "t": 43.68364999999994, "r": 518.4834, "b": 55.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "4", "bbox": {"l": 518.25842, "t": 47.72014999999999, "r": 523.00525, "b": 54.02863000000002, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "inch, the ", "bbox": {"l": 525.37872, "t": 47.72014999999999, "r": 560.44843, "b": 54.02863000000002, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Rol-top ranges from ", "bbox": {"l": 320.99841, "t": 56.18364999999994, "r": 404.58441, "b": 67.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "1", "bbox": {"l": 404.48981, "t": 57.02013999999997, "r": 407.23981, "b": 63.328610000000026, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "\u2044", "bbox": {"l": 407.23981, "t": 56.18364999999994, "r": 408.90982, "b": 67.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "4", "bbox": {"l": 408.68481, "t": 60.22014999999999, "r": 413.38376, "b": 66.52863000000002, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "inch to ", "bbox": {"l": 415.73322, "t": 60.22014999999999, "r": 443.92681999999996, "b": 66.52863000000002, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "1", "bbox": {"l": 443.82598999999993, "t": 57.02013999999997, "r": 446.57598999999993, "b": 63.328610000000026, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "\u2044", "bbox": {"l": 446.57598999999993, "t": 56.18364999999994, "r": 448.24600000000004, "b": 67.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "6", "bbox": {"l": 448.22588999999994, "t": 60.22014999999999, "r": 453.12659, "b": 66.52863000000002, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "inch, and the bellows type ", "bbox": {"l": 455.57697, "t": 60.22014999999999, "r": 560.6579, "b": 66.52863000000002, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "ranges in size from No. 8 up to ", "bbox": {"l": 320.99591, "t": 68.68364999999994, "r": 447.36591000000004, "b": 80.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "3", "bbox": {"l": 448.79668999999996, "t": 69.52013999999997, "r": 451.54668999999996, "b": 75.82861000000003, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "\u2044", "bbox": {"l": 451.50549, "t": 68.68364999999994, "r": 453.17551, "b": 80.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "8", "bbox": {"l": 453.17542000000003, "t": 72.72014999999999, "r": 458.07175000000007, "b": 79.02863000000002, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "inch. Wing-type nuts are ", "bbox": {"l": 460.51993, "t": 72.72014999999999, "r": 559.78839, "b": 79.02863000000002, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "made of anodized aluminum alloy, cadmium-plated carbon ", "bbox": {"l": 320.99542, "t": 81.18364999999994, "r": 559.77844, "b": 92.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "steel, or stainless steel. The Rol-top nut is cadmium-plated ", "bbox": {"l": 320.99542, "t": 93.68364999999994, "r": 557.87738, "b": 105.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "steel, and the bellows type is made of aluminum alloy only. ", "bbox": {"l": 320.99542, "t": 106.18364999999994, "r": 561.80835, "b": 117.65363000000002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "the most common ranges in size for No. 6 up to 1 \u2044 4 inch, the Rol-top ranges from 1 \u2044 4 inch to 1 \u2044 6 inch, and the bellows type ranges in size from No. 8 up to 3 \u2044 8 inch. Wing-type nuts are made of anodized aluminum alloy, cadmium-plated carbon steel, or stainless steel. The Rol-top nut is cadmium-plated steel, and the bellows type is made of aluminum alloy only."}, {"label": "text", "id": 17, "page_no": 0, "cluster": {"id": 17, "label": "text", "bbox": {"l": 320.99542, "t": 118.68364999999994, "r": 325.99542, "b": 130.15363000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": ". ", "bbox": {"l": 320.99542, "t": 118.68364999999994, "r": 325.99542, "b": 130.15363000000002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "."}, {"label": "section_header", "id": 15, "page_no": 0, "cluster": {"id": 15, "label": "section_header", "bbox": {"l": 320.99542, "t": 131.31359999999995, "r": 450.99542, "b": 142.65363000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9263731241226196, "cells": [{"id": 59, "text": "Stainless Steel Self-Locking Nut ", "bbox": {"l": 320.99542, "t": 131.31359999999995, "r": 450.99542, "b": 142.65363000000002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Stainless Steel Self-Locking Nut"}, {"label": "text", "id": 3, "page_no": 0, "cluster": {"id": 3, "label": "text", "bbox": {"l": 320.99542, "t": 145.68364999999994, "r": 568.00439, "b": 357.15362999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9879258871078491, "cells": [{"id": 60, "text": "The stainless steel self-locking nut may be spun on and off ", "bbox": {"l": 320.99542, "t": 145.68364999999994, "r": 558.39838, "b": 157.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "by hand as its locking action takes places only when the ", "bbox": {"l": 320.99542, "t": 158.18364999999994, "r": 547.92542, "b": 169.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "nut is seated against a solid surface and tightened. The nut ", "bbox": {"l": 320.99542, "t": 170.68364999999994, "r": 556.50842, "b": 182.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "consists of two parts: a case with a beveled locking shoulder ", "bbox": {"l": 320.99542, "t": 183.18364999999994, "r": 565.11346, "b": 194.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "and key and a thread insert with a locking shoulder and ", "bbox": {"l": 320.99542, "t": 195.68364999999994, "r": 547.93744, "b": 207.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "slotted keyway. Until the nut is tightened, it spins on the ", "bbox": {"l": 320.99542, "t": 208.18364999999994, "r": 549.00647, "b": 219.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "bolt easily, because the threaded insert is the proper size ", "bbox": {"l": 320.99542, "t": 220.68364999999994, "r": 549.0755, "b": 232.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "for the bolt. However, when the nut is seated against a solid ", "bbox": {"l": 320.99542, "t": 233.18364999999994, "r": 562.60242, "b": 244.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "surface and tightened, the locking shoulder of the insert is ", "bbox": {"l": 320.99542, "t": 245.68364999999994, "r": 555.11243, "b": 257.15363, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "pulled downward and wedged against the locking shoulder ", "bbox": {"l": 320.99542, "t": 258.18364999999994, "r": 558.74146, "b": 269.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "of the case. This action compresses the threaded insert and ", "bbox": {"l": 320.99542, "t": 270.68361999999996, "r": 557.88538, "b": 282.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "causes it to clench the bolt tightly. The cross-sectional view ", "bbox": {"l": 320.99542, "t": 283.18361999999996, "r": 562.3114, "b": 294.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "in ", "bbox": {"l": 320.99542, "t": 295.68361999999996, "r": 331.27542, "b": 307.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "Figure 7-27", "bbox": {"l": 331.81543, "t": 295.81363000000005, "r": 379.86542, "b": 307.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": " shows how the key of the case fits into the ", "bbox": {"l": 379.86542, "t": 295.68361999999996, "r": 554.56543, "b": 307.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "slotted keyway of the insert so that when the case is turned, ", "bbox": {"l": 320.99542, "t": 308.18361999999996, "r": 561.16339, "b": 319.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "the threaded insert is turned with it. Note that the slot is wider ", "bbox": {"l": 320.99542, "t": 320.68361999999996, "r": 568.00439, "b": 332.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "than the key. This permits the slot to be narrowed and the ", "bbox": {"l": 320.99542, "t": 333.18361999999996, "r": 553.46545, "b": 344.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "insert to be compressed when the nut is tightened. ", "bbox": {"l": 320.99542, "t": 345.68361999999996, "r": 523.19543, "b": 357.15362999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The stainless steel self-locking nut may be spun on and off by hand as its locking action takes places only when the nut is seated against a solid surface and tightened. The nut consists of two parts: a case with a beveled locking shoulder and key and a thread insert with a locking shoulder and slotted keyway. Until the nut is tightened, it spins on the bolt easily, because the threaded insert is the proper size for the bolt. However, when the nut is seated against a solid surface and tightened, the locking shoulder of the insert is pulled downward and wedged against the locking shoulder of the case. This action compresses the threaded insert and causes it to clench the bolt tightly. The cross-sectional view in Figure 7-27 shows how the key of the case fits into the slotted keyway of the insert so that when the case is turned, the threaded insert is turned with it. Note that the slot is wider than the key. This permits the slot to be narrowed and the insert to be compressed when the nut is tightened."}, {"label": "section_header", "id": 16, "page_no": 0, "cluster": {"id": 16, "label": "section_header", "bbox": {"l": 320.99542, "t": 370.81363000000005, "r": 388.50543, "b": 382.15362999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9253152012825012, "cells": [{"id": 79, "text": "Elastic Stop Nut ", "bbox": {"l": 320.99542, "t": 370.81363000000005, "r": 388.50543, "b": 382.15362999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Elastic Stop Nut"}, {"label": "text", "id": 10, "page_no": 0, "cluster": {"id": 10, "label": "text", "bbox": {"l": 320.99542, "t": 385.18361999999996, "r": 552.35132, "b": 409.15362999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9676451683044434, "cells": [{"id": 80, "text": "The elastic stop nut is a standard nut with the height ", "bbox": {"l": 320.99542, "t": 385.18361999999996, "r": 548.72437, "b": 396.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "increased to accommodate a fiber locking collar. This ", "bbox": {"l": 320.99542, "t": 397.68361999999996, "r": 552.35132, "b": 409.15362999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The elastic stop nut is a standard nut with the height increased to accommodate a fiber locking collar. This"}, {"label": "picture", "id": 2, "page_no": 0, "cluster": {"id": 2, "label": "picture", "bbox": {"l": 320.4467468261719, "t": 421.640625, "r": 558.8576049804688, "b": 692.310791015625, "coord_origin": "TOPLEFT"}, "confidence": 0.9881086945533752, "cells": [{"id": 82, "text": "Tightened nut ", "bbox": {"l": 479.1354999999999, "t": 672.7346, "r": 531.16748, "b": 682.646599, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "Untightened nut ", "bbox": {"l": 474.3699, "t": 531.8918, "r": 535.23389, "b": 541.8037999999999, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "Nut case ", "bbox": {"l": 456.7558900000001, "t": 431.99741, "r": 487.08388999999994, "b": 441.6134, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "Threaded nut core ", "bbox": {"l": 434.62299, "t": 577.8235, "r": 497.47183000000007, "b": 587.4395, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Locking shoulder ", "bbox": {"l": 448.55081, "t": 553.3206, "r": 507.686, "b": 562.9366, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Keyway ", "bbox": {"l": 424.78421, "t": 664.1116, "r": 452.10339000000005, "b": 673.7275999999999, "coord_origin": "TOPLEFT"}}], "children": [{"id": 18, "label": "text", "bbox": {"l": 479.1354999999999, "t": 672.7346, "r": 531.16748, "b": 682.646599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "Tightened nut ", "bbox": {"l": 479.1354999999999, "t": 672.7346, "r": 531.16748, "b": 682.646599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 474.3699, "t": 531.8918, "r": 535.23389, "b": 541.8037999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "Untightened nut ", "bbox": {"l": 474.3699, "t": 531.8918, "r": 535.23389, "b": 541.8037999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 456.7558900000001, "t": 431.99741, "r": 487.08388999999994, "b": 441.6134, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "Nut case ", "bbox": {"l": 456.7558900000001, "t": 431.99741, "r": 487.08388999999994, "b": 441.6134, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 434.62299, "t": 577.8235, "r": 497.47183000000007, "b": 587.4395, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "Threaded nut core ", "bbox": {"l": 434.62299, "t": 577.8235, "r": 497.47183000000007, "b": 587.4395, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 448.55081, "t": 553.3206, "r": 507.686, "b": 562.9366, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "Locking shoulder ", "bbox": {"l": 448.55081, "t": 553.3206, "r": 507.686, "b": 562.9366, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 424.78421, "t": 664.1116, "r": 452.10339000000005, "b": 673.7275999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "Keyway ", "bbox": {"l": 424.78421, "t": 664.1116, "r": 452.10339000000005, "b": 673.7275999999999, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "picture", "id": 7, "page_no": 0, "cluster": {"id": 7, "label": "picture", "bbox": {"l": 70.59269714355469, "t": 531.2222290039062, "r": 309.863037109375, "b": 694.3909912109375, "coord_origin": "TOPLEFT"}, "confidence": 0.9858751893043518, "cells": [{"id": 88, "text": "Boots aircraft nut ", "bbox": {"l": 102.4155, "t": 587.76491, "r": 161.3187, "b": 597.38091, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "Flexloc nut ", "bbox": {"l": 91.685997, "t": 679.309799, "r": 129.77399, "b": 688.925797, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "Fiber locknut ", "bbox": {"l": 162.48109, "t": 679.309799, "r": 207.85629, "b": 688.925797, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "Elastic stop nut ", "bbox": {"l": 237.31379999999996, "t": 679.309799, "r": 289.561, "b": 688.925797, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Elastic anchor nut ", "bbox": {"l": 216.9326, "t": 587.76491, "r": 277.7966, "b": 597.38091, "coord_origin": "TOPLEFT"}}], "children": [{"id": 24, "label": "text", "bbox": {"l": 102.4155, "t": 587.76491, "r": 161.3187, "b": 597.38091, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "Boots aircraft nut ", "bbox": {"l": 102.4155, "t": 587.76491, "r": 161.3187, "b": 597.38091, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 91.685997, "t": 679.309799, "r": 129.77399, "b": 688.925797, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "Flexloc nut ", "bbox": {"l": 91.685997, "t": 679.309799, "r": 129.77399, "b": 688.925797, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 162.48109, "t": 679.309799, "r": 207.85629, "b": 688.925797, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "Fiber locknut ", "bbox": {"l": 162.48109, "t": 679.309799, "r": 207.85629, "b": 688.925797, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 237.31379999999996, "t": 679.309799, "r": 289.561, "b": 688.925797, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "Elastic stop nut ", "bbox": {"l": 237.31379999999996, "t": 679.309799, "r": 289.561, "b": 688.925797, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 216.9326, "t": 587.76491, "r": 277.7966, "b": 597.38091, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "Elastic anchor nut ", "bbox": {"l": 216.9326, "t": 587.76491, "r": 277.7966, "b": 597.38091, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "caption", "id": 12, "page_no": 0, "cluster": {"id": 12, "label": "caption", "bbox": {"l": 72.0, "t": 702.197601, "r": 184.14828, "b": 713.009598, "coord_origin": "TOPLEFT"}, "confidence": 0.9449448585510254, "cells": [{"id": 93, "text": "Figure 7-26. ", "bbox": {"l": 72.0, "t": 702.457596, "r": 119.12800000000001, "b": 713.009598, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "Self-locking nuts. ", "bbox": {"l": 119.4023, "t": 702.197601, "r": 184.14828, "b": 712.403599, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 7-26. Self-locking nuts."}, {"label": "caption", "id": 11, "page_no": 0, "cluster": {"id": 11, "label": "caption", "bbox": {"l": 321.0, "t": 700.177597, "r": 481.64931999999993, "b": 710.989597, "coord_origin": "TOPLEFT"}, "confidence": 0.9497622847557068, "cells": [{"id": 95, "text": "Figure 7-27. ", "bbox": {"l": 321.0, "t": 700.437599, "r": 368.12799, "b": 710.989597, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "Stainless steel self-locking nut. ", "bbox": {"l": 368.40231, "t": 700.177597, "r": 481.64931999999993, "b": 710.383598, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 7-27. Stainless steel self-locking nut."}, {"label": "page_footer", "id": 13, "page_no": 0, "cluster": {"id": 13, "label": "page_footer", "bbox": {"l": 537.98541, "t": 727.980301, "r": 560.77539, "b": 740.290298, "coord_origin": "TOPLEFT"}, "confidence": 0.9368568658828735, "cells": [{"id": 97, "text": "7-45 ", "bbox": {"l": 537.98541, "t": 727.980301, "r": 560.77539, "b": 740.290298, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "7-45"}], "body": [{"label": "text", "id": 8, "page_no": 0, "cluster": {"id": 8, "label": "text", "bbox": {"l": 71.992126, "t": 43.68364999999994, "r": 314.11212, "b": 92.65363000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9851651191711426, "cells": [{"id": 0, "text": "pulleys, provided the inner race of the bearing is clamped ", "bbox": {"l": 71.992126, "t": 43.68364999999994, "r": 300.23203, "b": 55.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "to the supporting structure by the nut and bolt. Plates must ", "bbox": {"l": 71.992126, "t": 56.18364999999994, "r": 302.00214, "b": 67.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "be attached to the structure in a positive manner to eliminate ", "bbox": {"l": 71.992126, "t": 68.68364999999994, "r": 309.82214, "b": 80.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "rotation or misalignment when tightening the bolts or screws. ", "bbox": {"l": 71.992126, "t": 81.18364999999994, "r": 314.11212, "b": 92.65363000000002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "pulleys, provided the inner race of the bearing is clamped to the supporting structure by the nut and bolt. Plates must be attached to the structure in a positive manner to eliminate rotation or misalignment when tightening the bolts or screws."}, {"label": "text", "id": 4, "page_no": 0, "cluster": {"id": 4, "label": "text", "bbox": {"l": 71.992302, "t": 106.18364999999994, "r": 313.1546, "b": 180.15363000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9873439073562622, "cells": [{"id": 4, "text": "The two general types of self-locking nuts currently in use ", "bbox": {"l": 71.992302, "t": 106.18364999999994, "r": 305.15311, "b": 117.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "are the all-metal type and the fiber lock type. For the sake of ", "bbox": {"l": 71.993103, "t": 118.68364999999994, "r": 309.98309, "b": 130.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "simplicity, only three typical kinds of self-locking nuts are ", "bbox": {"l": 71.993103, "t": 131.18364999999994, "r": 302.44312, "b": 142.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "considered in this handbook: the Boots self-locking and the ", "bbox": {"l": 71.993103, "t": 143.68364999999994, "r": 306.25311, "b": 155.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "stainless steel self-locking nuts, representing the all-metal ", "bbox": {"l": 71.993103, "t": 156.18364999999994, "r": 303.9931, "b": 167.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "types; and the elastic stop nut, representing ", "bbox": {"l": 71.993103, "t": 168.68364999999994, "r": 238.6723, "b": 180.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "the fiber insert type. ", "bbox": {"l": 234.26460000000003, "t": 168.68364999999994, "r": 313.1546, "b": 180.15363000000002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The two general types of self-locking nuts currently in use are the all-metal type and the fiber lock type. For the sake of simplicity, only three typical kinds of self-locking nuts are considered in this handbook: the Boots self-locking and the stainless steel self-locking nuts, representing the all-metal types; and the elastic stop nut, representing the fiber insert type."}, {"label": "section_header", "id": 14, "page_no": 0, "cluster": {"id": 14, "label": "section_header", "bbox": {"l": 71.992302, "t": 193.81359999999995, "r": 167.27231, "b": 205.15363000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9309079647064209, "cells": [{"id": 11, "text": "Boots Self-Locking Nut ", "bbox": {"l": 71.992302, "t": 193.81359999999995, "r": 167.27231, "b": 205.15363000000002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Boots Self-Locking Nut"}, {"label": "text", "id": 6, "page_no": 0, "cluster": {"id": 6, "label": "text", "bbox": {"l": 71.992294, "t": 208.18364999999994, "r": 318.49225, "b": 282.15362999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9866572022438049, "cells": [{"id": 12, "text": "The Boots self-locking nut is of one piece, all-metal ", "bbox": {"l": 71.992302, "t": 208.18364999999994, "r": 302.27719, "b": 219.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "construction designed to hold tight despite severe vibration. ", "bbox": {"l": 71.992294, "t": 220.68364999999994, "r": 313.33026, "b": 232.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Note in ", "bbox": {"l": 71.992294, "t": 233.18364999999994, "r": 104.12231, "b": 244.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Figure 7-26", "bbox": {"l": 104.12231, "t": 233.31359999999995, "r": 152.05231, "b": 244.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": " that it has two sections and is essentially ", "bbox": {"l": 152.05231, "t": 233.18364999999994, "r": 318.49225, "b": 244.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "two nuts in one: a locking nut and a load-carrying nut. The ", "bbox": {"l": 71.992294, "t": 245.68364999999994, "r": 309.42929, "b": 257.15363, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "two sections are connected with a spring, which is an integral ", "bbox": {"l": 71.992294, "t": 258.18364999999994, "r": 317.76227, "b": 269.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "part of the nut. ", "bbox": {"l": 71.992294, "t": 270.68361999999996, "r": 133.3723, "b": 282.15362999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The Boots self-locking nut is of one piece, all-metal construction designed to hold tight despite severe vibration. Note in Figure 7-26 that it has two sections and is essentially two nuts in one: a locking nut and a load-carrying nut. The two sections are connected with a spring, which is an integral part of the nut."}, {"label": "text", "id": 1, "page_no": 0, "cluster": {"id": 1, "label": "text", "bbox": {"l": 71.992294, "t": 295.68361999999996, "r": 316.65729, "b": 369.65362999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9881331324577332, "cells": [{"id": 20, "text": "The spring keeps the locking and load-carrying sections such ", "bbox": {"l": 71.992294, "t": 295.68361999999996, "r": 316.41028, "b": 307.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "a distance apart that the two sets of threads are out of phase ", "bbox": {"l": 71.992294, "t": 308.18361999999996, "r": 312.20731, "b": 319.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "or spaced so that a bolt, which has been screwed through the ", "bbox": {"l": 71.992294, "t": 320.68361999999996, "r": 316.65729, "b": 332.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "load-carrying section, must push the locking section outward ", "bbox": {"l": 71.992294, "t": 333.18361999999996, "r": 315.91229, "b": 344.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "against the force of the spring to engage the threads of the ", "bbox": {"l": 71.992294, "t": 345.68361999999996, "r": 306.34927, "b": 357.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "locking section properly. ", "bbox": {"l": 71.992294, "t": 358.18361999999996, "r": 174.2023, "b": 369.65362999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The spring keeps the locking and load-carrying sections such a distance apart that the two sets of threads are out of phase or spaced so that a bolt, which has been screwed through the load-carrying section, must push the locking section outward against the force of the spring to engage the threads of the locking section properly."}, {"label": "text", "id": 0, "page_no": 0, "cluster": {"id": 0, "label": "text", "bbox": {"l": 71.992294, "t": 383.18361999999996, "r": 318.81229, "b": 482.15363, "coord_origin": "TOPLEFT"}, "confidence": 0.9882921576499939, "cells": [{"id": 26, "text": "The spring, through the medium of the locking section, exerts ", "bbox": {"l": 71.992294, "t": 383.18361999999996, "r": 317.07227, "b": 394.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "a constant locking force on the bolt in the same direction as a ", "bbox": {"l": 71.992294, "t": 395.68361999999996, "r": 318.81229, "b": 407.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "force that would tighten the nut. In this nut, the load-carrying ", "bbox": {"l": 71.992294, "t": 408.18361999999996, "r": 317.5123, "b": 419.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "section has the thread strength of a standard nut of comparable ", "bbox": {"l": 71.992294, "t": 420.68361999999996, "r": 317.31229, "b": 432.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "size, while the locking section presses against the threads of ", "bbox": {"l": 71.992294, "t": 433.18361999999996, "r": 314.45929, "b": 444.65363, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "the bolt and locks the nut firmly in position. Only a wrench ", "bbox": {"l": 71.992294, "t": 445.68362, "r": 311.7023, "b": 457.15363, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "applied to the nut loosens it. The nut can be removed and ", "bbox": {"l": 71.992294, "t": 458.18362, "r": 303.35229, "b": 469.65363, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "reused without impairing its efficiency. ", "bbox": {"l": 71.992294, "t": 470.68362, "r": 231.97228999999996, "b": 482.15363, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The spring, through the medium of the locking section, exerts a constant locking force on the bolt in the same direction as a force that would tighten the nut. In this nut, the load-carrying section has the thread strength of a standard nut of comparable size, while the locking section presses against the threads of the bolt and locks the nut firmly in position. Only a wrench applied to the nut loosens it. The nut can be removed and reused without impairing its efficiency."}, {"label": "text", "id": 9, "page_no": 0, "cluster": {"id": 9, "label": "text", "bbox": {"l": 71.992294, "t": 495.68362, "r": 313.91229, "b": 519.65363, "coord_origin": "TOPLEFT"}, "confidence": 0.9695363640785217, "cells": [{"id": 34, "text": "Boots self-locking nuts are made with three different spring ", "bbox": {"l": 71.992294, "t": 495.68362, "r": 313.34229, "b": 507.15363, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "styles and in various shapes and sizes. The wing type that is ", "bbox": {"l": 71.992294, "t": 508.18362, "r": 313.91229, "b": 519.65363, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Boots self-locking nuts are made with three different spring styles and in various shapes and sizes. The wing type that is"}, {"label": "text", "id": 5, "page_no": 0, "cluster": {"id": 5, "label": "text", "bbox": {"l": 320.99231, "t": 43.68364999999994, "r": 561.80835, "b": 117.65363000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9870070219039917, "cells": [{"id": 36, "text": "the most common ranges in size for No. 6 up to ", "bbox": {"l": 320.99231, "t": 43.68364999999994, "r": 513.74628, "b": 55.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "1", "bbox": {"l": 514.06342, "t": 44.52013999999997, "r": 516.81342, "b": 50.828610000000026, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "\u2044", "bbox": {"l": 516.81342, "t": 43.68364999999994, "r": 518.4834, "b": 55.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "4", "bbox": {"l": 518.25842, "t": 47.72014999999999, "r": 523.00525, "b": 54.02863000000002, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "inch, the ", "bbox": {"l": 525.37872, "t": 47.72014999999999, "r": 560.44843, "b": 54.02863000000002, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Rol-top ranges from ", "bbox": {"l": 320.99841, "t": 56.18364999999994, "r": 404.58441, "b": 67.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "1", "bbox": {"l": 404.48981, "t": 57.02013999999997, "r": 407.23981, "b": 63.328610000000026, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "\u2044", "bbox": {"l": 407.23981, "t": 56.18364999999994, "r": 408.90982, "b": 67.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "4", "bbox": {"l": 408.68481, "t": 60.22014999999999, "r": 413.38376, "b": 66.52863000000002, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "inch to ", "bbox": {"l": 415.73322, "t": 60.22014999999999, "r": 443.92681999999996, "b": 66.52863000000002, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "1", "bbox": {"l": 443.82598999999993, "t": 57.02013999999997, "r": 446.57598999999993, "b": 63.328610000000026, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "\u2044", "bbox": {"l": 446.57598999999993, "t": 56.18364999999994, "r": 448.24600000000004, "b": 67.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "6", "bbox": {"l": 448.22588999999994, "t": 60.22014999999999, "r": 453.12659, "b": 66.52863000000002, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "inch, and the bellows type ", "bbox": {"l": 455.57697, "t": 60.22014999999999, "r": 560.6579, "b": 66.52863000000002, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "ranges in size from No. 8 up to ", "bbox": {"l": 320.99591, "t": 68.68364999999994, "r": 447.36591000000004, "b": 80.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "3", "bbox": {"l": 448.79668999999996, "t": 69.52013999999997, "r": 451.54668999999996, "b": 75.82861000000003, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "\u2044", "bbox": {"l": 451.50549, "t": 68.68364999999994, "r": 453.17551, "b": 80.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "8", "bbox": {"l": 453.17542000000003, "t": 72.72014999999999, "r": 458.07175000000007, "b": 79.02863000000002, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "inch. Wing-type nuts are ", "bbox": {"l": 460.51993, "t": 72.72014999999999, "r": 559.78839, "b": 79.02863000000002, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "made of anodized aluminum alloy, cadmium-plated carbon ", "bbox": {"l": 320.99542, "t": 81.18364999999994, "r": 559.77844, "b": 92.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "steel, or stainless steel. The Rol-top nut is cadmium-plated ", "bbox": {"l": 320.99542, "t": 93.68364999999994, "r": 557.87738, "b": 105.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "steel, and the bellows type is made of aluminum alloy only. ", "bbox": {"l": 320.99542, "t": 106.18364999999994, "r": 561.80835, "b": 117.65363000000002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "the most common ranges in size for No. 6 up to 1 \u2044 4 inch, the Rol-top ranges from 1 \u2044 4 inch to 1 \u2044 6 inch, and the bellows type ranges in size from No. 8 up to 3 \u2044 8 inch. Wing-type nuts are made of anodized aluminum alloy, cadmium-plated carbon steel, or stainless steel. The Rol-top nut is cadmium-plated steel, and the bellows type is made of aluminum alloy only."}, {"label": "text", "id": 17, "page_no": 0, "cluster": {"id": 17, "label": "text", "bbox": {"l": 320.99542, "t": 118.68364999999994, "r": 325.99542, "b": 130.15363000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": ". ", "bbox": {"l": 320.99542, "t": 118.68364999999994, "r": 325.99542, "b": 130.15363000000002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "."}, {"label": "section_header", "id": 15, "page_no": 0, "cluster": {"id": 15, "label": "section_header", "bbox": {"l": 320.99542, "t": 131.31359999999995, "r": 450.99542, "b": 142.65363000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9263731241226196, "cells": [{"id": 59, "text": "Stainless Steel Self-Locking Nut ", "bbox": {"l": 320.99542, "t": 131.31359999999995, "r": 450.99542, "b": 142.65363000000002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Stainless Steel Self-Locking Nut"}, {"label": "text", "id": 3, "page_no": 0, "cluster": {"id": 3, "label": "text", "bbox": {"l": 320.99542, "t": 145.68364999999994, "r": 568.00439, "b": 357.15362999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9879258871078491, "cells": [{"id": 60, "text": "The stainless steel self-locking nut may be spun on and off ", "bbox": {"l": 320.99542, "t": 145.68364999999994, "r": 558.39838, "b": 157.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "by hand as its locking action takes places only when the ", "bbox": {"l": 320.99542, "t": 158.18364999999994, "r": 547.92542, "b": 169.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "nut is seated against a solid surface and tightened. The nut ", "bbox": {"l": 320.99542, "t": 170.68364999999994, "r": 556.50842, "b": 182.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "consists of two parts: a case with a beveled locking shoulder ", "bbox": {"l": 320.99542, "t": 183.18364999999994, "r": 565.11346, "b": 194.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "and key and a thread insert with a locking shoulder and ", "bbox": {"l": 320.99542, "t": 195.68364999999994, "r": 547.93744, "b": 207.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "slotted keyway. Until the nut is tightened, it spins on the ", "bbox": {"l": 320.99542, "t": 208.18364999999994, "r": 549.00647, "b": 219.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "bolt easily, because the threaded insert is the proper size ", "bbox": {"l": 320.99542, "t": 220.68364999999994, "r": 549.0755, "b": 232.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "for the bolt. However, when the nut is seated against a solid ", "bbox": {"l": 320.99542, "t": 233.18364999999994, "r": 562.60242, "b": 244.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "surface and tightened, the locking shoulder of the insert is ", "bbox": {"l": 320.99542, "t": 245.68364999999994, "r": 555.11243, "b": 257.15363, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "pulled downward and wedged against the locking shoulder ", "bbox": {"l": 320.99542, "t": 258.18364999999994, "r": 558.74146, "b": 269.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "of the case. This action compresses the threaded insert and ", "bbox": {"l": 320.99542, "t": 270.68361999999996, "r": 557.88538, "b": 282.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "causes it to clench the bolt tightly. The cross-sectional view ", "bbox": {"l": 320.99542, "t": 283.18361999999996, "r": 562.3114, "b": 294.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "in ", "bbox": {"l": 320.99542, "t": 295.68361999999996, "r": 331.27542, "b": 307.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "Figure 7-27", "bbox": {"l": 331.81543, "t": 295.81363000000005, "r": 379.86542, "b": 307.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": " shows how the key of the case fits into the ", "bbox": {"l": 379.86542, "t": 295.68361999999996, "r": 554.56543, "b": 307.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "slotted keyway of the insert so that when the case is turned, ", "bbox": {"l": 320.99542, "t": 308.18361999999996, "r": 561.16339, "b": 319.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "the threaded insert is turned with it. Note that the slot is wider ", "bbox": {"l": 320.99542, "t": 320.68361999999996, "r": 568.00439, "b": 332.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "than the key. This permits the slot to be narrowed and the ", "bbox": {"l": 320.99542, "t": 333.18361999999996, "r": 553.46545, "b": 344.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "insert to be compressed when the nut is tightened. ", "bbox": {"l": 320.99542, "t": 345.68361999999996, "r": 523.19543, "b": 357.15362999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The stainless steel self-locking nut may be spun on and off by hand as its locking action takes places only when the nut is seated against a solid surface and tightened. The nut consists of two parts: a case with a beveled locking shoulder and key and a thread insert with a locking shoulder and slotted keyway. Until the nut is tightened, it spins on the bolt easily, because the threaded insert is the proper size for the bolt. However, when the nut is seated against a solid surface and tightened, the locking shoulder of the insert is pulled downward and wedged against the locking shoulder of the case. This action compresses the threaded insert and causes it to clench the bolt tightly. The cross-sectional view in Figure 7-27 shows how the key of the case fits into the slotted keyway of the insert so that when the case is turned, the threaded insert is turned with it. Note that the slot is wider than the key. This permits the slot to be narrowed and the insert to be compressed when the nut is tightened."}, {"label": "section_header", "id": 16, "page_no": 0, "cluster": {"id": 16, "label": "section_header", "bbox": {"l": 320.99542, "t": 370.81363000000005, "r": 388.50543, "b": 382.15362999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9253152012825012, "cells": [{"id": 79, "text": "Elastic Stop Nut ", "bbox": {"l": 320.99542, "t": 370.81363000000005, "r": 388.50543, "b": 382.15362999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Elastic Stop Nut"}, {"label": "text", "id": 10, "page_no": 0, "cluster": {"id": 10, "label": "text", "bbox": {"l": 320.99542, "t": 385.18361999999996, "r": 552.35132, "b": 409.15362999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9676451683044434, "cells": [{"id": 80, "text": "The elastic stop nut is a standard nut with the height ", "bbox": {"l": 320.99542, "t": 385.18361999999996, "r": 548.72437, "b": 396.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "increased to accommodate a fiber locking collar. This ", "bbox": {"l": 320.99542, "t": 397.68361999999996, "r": 552.35132, "b": 409.15362999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The elastic stop nut is a standard nut with the height increased to accommodate a fiber locking collar. This"}, {"label": "picture", "id": 2, "page_no": 0, "cluster": {"id": 2, "label": "picture", "bbox": {"l": 320.4467468261719, "t": 421.640625, "r": 558.8576049804688, "b": 692.310791015625, "coord_origin": "TOPLEFT"}, "confidence": 0.9881086945533752, "cells": [{"id": 82, "text": "Tightened nut ", "bbox": {"l": 479.1354999999999, "t": 672.7346, "r": 531.16748, "b": 682.646599, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "Untightened nut ", "bbox": {"l": 474.3699, "t": 531.8918, "r": 535.23389, "b": 541.8037999999999, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "Nut case ", "bbox": {"l": 456.7558900000001, "t": 431.99741, "r": 487.08388999999994, "b": 441.6134, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "Threaded nut core ", "bbox": {"l": 434.62299, "t": 577.8235, "r": 497.47183000000007, "b": 587.4395, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Locking shoulder ", "bbox": {"l": 448.55081, "t": 553.3206, "r": 507.686, "b": 562.9366, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Keyway ", "bbox": {"l": 424.78421, "t": 664.1116, "r": 452.10339000000005, "b": 673.7275999999999, "coord_origin": "TOPLEFT"}}], "children": [{"id": 18, "label": "text", "bbox": {"l": 479.1354999999999, "t": 672.7346, "r": 531.16748, "b": 682.646599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "Tightened nut ", "bbox": {"l": 479.1354999999999, "t": 672.7346, "r": 531.16748, "b": 682.646599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 474.3699, "t": 531.8918, "r": 535.23389, "b": 541.8037999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "Untightened nut ", "bbox": {"l": 474.3699, "t": 531.8918, "r": 535.23389, "b": 541.8037999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 456.7558900000001, "t": 431.99741, "r": 487.08388999999994, "b": 441.6134, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "Nut case ", "bbox": {"l": 456.7558900000001, "t": 431.99741, "r": 487.08388999999994, "b": 441.6134, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 434.62299, "t": 577.8235, "r": 497.47183000000007, "b": 587.4395, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "Threaded nut core ", "bbox": {"l": 434.62299, "t": 577.8235, "r": 497.47183000000007, "b": 587.4395, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 448.55081, "t": 553.3206, "r": 507.686, "b": 562.9366, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "Locking shoulder ", "bbox": {"l": 448.55081, "t": 553.3206, "r": 507.686, "b": 562.9366, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 424.78421, "t": 664.1116, "r": 452.10339000000005, "b": 673.7275999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "Keyway ", "bbox": {"l": 424.78421, "t": 664.1116, "r": 452.10339000000005, "b": 673.7275999999999, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "picture", "id": 7, "page_no": 0, "cluster": {"id": 7, "label": "picture", "bbox": {"l": 70.59269714355469, "t": 531.2222290039062, "r": 309.863037109375, "b": 694.3909912109375, "coord_origin": "TOPLEFT"}, "confidence": 0.9858751893043518, "cells": [{"id": 88, "text": "Boots aircraft nut ", "bbox": {"l": 102.4155, "t": 587.76491, "r": 161.3187, "b": 597.38091, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "Flexloc nut ", "bbox": {"l": 91.685997, "t": 679.309799, "r": 129.77399, "b": 688.925797, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "Fiber locknut ", "bbox": {"l": 162.48109, "t": 679.309799, "r": 207.85629, "b": 688.925797, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "Elastic stop nut ", "bbox": {"l": 237.31379999999996, "t": 679.309799, "r": 289.561, "b": 688.925797, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Elastic anchor nut ", "bbox": {"l": 216.9326, "t": 587.76491, "r": 277.7966, "b": 597.38091, "coord_origin": "TOPLEFT"}}], "children": [{"id": 24, "label": "text", "bbox": {"l": 102.4155, "t": 587.76491, "r": 161.3187, "b": 597.38091, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "Boots aircraft nut ", "bbox": {"l": 102.4155, "t": 587.76491, "r": 161.3187, "b": 597.38091, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 91.685997, "t": 679.309799, "r": 129.77399, "b": 688.925797, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "Flexloc nut ", "bbox": {"l": 91.685997, "t": 679.309799, "r": 129.77399, "b": 688.925797, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 162.48109, "t": 679.309799, "r": 207.85629, "b": 688.925797, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "Fiber locknut ", "bbox": {"l": 162.48109, "t": 679.309799, "r": 207.85629, "b": 688.925797, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 237.31379999999996, "t": 679.309799, "r": 289.561, "b": 688.925797, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "Elastic stop nut ", "bbox": {"l": 237.31379999999996, "t": 679.309799, "r": 289.561, "b": 688.925797, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 216.9326, "t": 587.76491, "r": 277.7966, "b": 597.38091, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "Elastic anchor nut ", "bbox": {"l": 216.9326, "t": 587.76491, "r": 277.7966, "b": 597.38091, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "caption", "id": 12, "page_no": 0, "cluster": {"id": 12, "label": "caption", "bbox": {"l": 72.0, "t": 702.197601, "r": 184.14828, "b": 713.009598, "coord_origin": "TOPLEFT"}, "confidence": 0.9449448585510254, "cells": [{"id": 93, "text": "Figure 7-26. ", "bbox": {"l": 72.0, "t": 702.457596, "r": 119.12800000000001, "b": 713.009598, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "Self-locking nuts. ", "bbox": {"l": 119.4023, "t": 702.197601, "r": 184.14828, "b": 712.403599, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 7-26. Self-locking nuts."}, {"label": "caption", "id": 11, "page_no": 0, "cluster": {"id": 11, "label": "caption", "bbox": {"l": 321.0, "t": 700.177597, "r": 481.64931999999993, "b": 710.989597, "coord_origin": "TOPLEFT"}, "confidence": 0.9497622847557068, "cells": [{"id": 95, "text": "Figure 7-27. ", "bbox": {"l": 321.0, "t": 700.437599, "r": 368.12799, "b": 710.989597, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "Stainless steel self-locking nut. ", "bbox": {"l": 368.40231, "t": 700.177597, "r": 481.64931999999993, "b": 710.383598, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 7-27. Stainless steel self-locking nut."}], "headers": [{"label": "page_footer", "id": 13, "page_no": 0, "cluster": {"id": 13, "label": "page_footer", "bbox": {"l": 537.98541, "t": 727.980301, "r": 560.77539, "b": 740.290298, "coord_origin": "TOPLEFT"}, "confidence": 0.9368568658828735, "cells": [{"id": 97, "text": "7-45 ", "bbox": {"l": 537.98541, "t": 727.980301, "r": 560.77539, "b": 740.290298, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "7-45"}]}}]
\ No newline at end of file
+[{"page_no": 0, "size": {"width": 594.0, "height": 774.0}, "cells": [{"id": 0, "text": "pulleys, provided the inner race of the bearing is clamped ", "bbox": {"l": 71.992126, "t": 43.68364999999994, "r": 300.23203, "b": 55.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "to the supporting structure by the nut and bolt. Plates must ", "bbox": {"l": 71.992126, "t": 56.18364999999994, "r": 302.00214, "b": 67.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "be attached to the structure in a positive manner to eliminate ", "bbox": {"l": 71.992126, "t": 68.68364999999994, "r": 309.82214, "b": 80.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "rotation or misalignment when tightening the bolts or screws. ", "bbox": {"l": 71.992126, "t": 81.18364999999994, "r": 314.11212, "b": 92.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "The two general types of self-locking nuts currently in use ", "bbox": {"l": 71.992302, "t": 106.18364999999994, "r": 305.15311, "b": 117.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "are the all-metal type and the fiber lock type. For the sake of ", "bbox": {"l": 71.993103, "t": 118.68364999999994, "r": 309.98309, "b": 130.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "simplicity, only three typical kinds of self-locking nuts are ", "bbox": {"l": 71.993103, "t": 131.18364999999994, "r": 302.44312, "b": 142.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "considered in this handbook: the Boots self-locking and the ", "bbox": {"l": 71.993103, "t": 143.68364999999994, "r": 306.25311, "b": 155.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "stainless steel self-locking nuts, representing the all-metal ", "bbox": {"l": 71.993103, "t": 156.18364999999994, "r": 303.9931, "b": 167.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "types; and the elastic stop nut, representing ", "bbox": {"l": 71.993103, "t": 168.68364999999994, "r": 238.6723, "b": 180.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "the fiber insert type. ", "bbox": {"l": 234.26460000000003, "t": 168.68364999999994, "r": 313.1546, "b": 180.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Boots Self-Locking Nut ", "bbox": {"l": 71.992302, "t": 193.81359999999995, "r": 167.27231, "b": 205.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "The Boots self-locking nut is of one piece, all-metal ", "bbox": {"l": 71.992302, "t": 208.18364999999994, "r": 302.27719, "b": 219.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "construction designed to hold tight despite severe vibration. ", "bbox": {"l": 71.992294, "t": 220.68364999999994, "r": 313.33026, "b": 232.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Note in ", "bbox": {"l": 71.992294, "t": 233.18364999999994, "r": 104.12231, "b": 244.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Figure 7-26", "bbox": {"l": 104.12231, "t": 233.31359999999995, "r": 152.05231, "b": 244.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": " that it has two sections and is essentially ", "bbox": {"l": 152.05231, "t": 233.18364999999994, "r": 318.49225, "b": 244.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "two nuts in one: a locking nut and a load-carrying nut. The ", "bbox": {"l": 71.992294, "t": 245.68364999999994, "r": 309.42929, "b": 257.15363, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "two sections are connected with a spring, which is an integral ", "bbox": {"l": 71.992294, "t": 258.18364999999994, "r": 317.76227, "b": 269.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "part of the nut. ", "bbox": {"l": 71.992294, "t": 270.68361999999996, "r": 133.3723, "b": 282.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "The spring keeps the locking and load-carrying sections such ", "bbox": {"l": 71.992294, "t": 295.68361999999996, "r": 316.41028, "b": 307.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "a distance apart that the two sets of threads are out of phase ", "bbox": {"l": 71.992294, "t": 308.18361999999996, "r": 312.20731, "b": 319.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "or spaced so that a bolt, which has been screwed through the ", "bbox": {"l": 71.992294, "t": 320.68361999999996, "r": 316.65729, "b": 332.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "load-carrying section, must push the locking section outward ", "bbox": {"l": 71.992294, "t": 333.18361999999996, "r": 315.91229, "b": 344.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "against the force of the spring to engage the threads of the ", "bbox": {"l": 71.992294, "t": 345.68361999999996, "r": 306.34927, "b": 357.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "locking section properly. ", "bbox": {"l": 71.992294, "t": 358.18361999999996, "r": 174.2023, "b": 369.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "The spring, through the medium of the locking section, exerts ", "bbox": {"l": 71.992294, "t": 383.18361999999996, "r": 317.07227, "b": 394.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "a constant locking force on the bolt in the same direction as a ", "bbox": {"l": 71.992294, "t": 395.68361999999996, "r": 318.81229, "b": 407.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "force that would tighten the nut. In this nut, the load-carrying ", "bbox": {"l": 71.992294, "t": 408.18361999999996, "r": 317.5123, "b": 419.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "section has the thread strength of a standard nut of comparable ", "bbox": {"l": 71.992294, "t": 420.68361999999996, "r": 317.31229, "b": 432.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "size, while the locking section presses against the threads of ", "bbox": {"l": 71.992294, "t": 433.18361999999996, "r": 314.45929, "b": 444.65363, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "the bolt and locks the nut firmly in position. Only a wrench ", "bbox": {"l": 71.992294, "t": 445.68362, "r": 311.7023, "b": 457.15363, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "applied to the nut loosens it. The nut can be removed and ", "bbox": {"l": 71.992294, "t": 458.18362, "r": 303.35229, "b": 469.65363, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "reused without impairing its efficiency. ", "bbox": {"l": 71.992294, "t": 470.68362, "r": 231.97228999999996, "b": 482.15363, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Boots self-locking nuts are made with three different spring ", "bbox": {"l": 71.992294, "t": 495.68362, "r": 313.34229, "b": 507.15363, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "styles and in various shapes and sizes. The wing type that is ", "bbox": {"l": 71.992294, "t": 508.18362, "r": 313.91229, "b": 519.65363, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "the most common ranges in size for No. 6 up to ", "bbox": {"l": 320.99231, "t": 43.68364999999994, "r": 513.74628, "b": 55.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "1", "bbox": {"l": 514.06342, "t": 44.52013999999997, "r": 516.81342, "b": 50.828610000000026, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "\u2044", "bbox": {"l": 516.81342, "t": 43.68364999999994, "r": 518.4834, "b": 55.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "4", "bbox": {"l": 518.25842, "t": 47.72014999999999, "r": 523.00525, "b": 54.02863000000002, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "inch, the ", "bbox": {"l": 525.37872, "t": 47.72014999999999, "r": 560.44843, "b": 54.02863000000002, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Rol-top ranges from ", "bbox": {"l": 320.99841, "t": 56.18364999999994, "r": 404.58441, "b": 67.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "1", "bbox": {"l": 404.48981, "t": 57.02013999999997, "r": 407.23981, "b": 63.328610000000026, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "\u2044", "bbox": {"l": 407.23981, "t": 56.18364999999994, "r": 408.90982, "b": 67.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "4", "bbox": {"l": 408.68481, "t": 60.22014999999999, "r": 413.38376, "b": 66.52863000000002, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "inch to ", "bbox": {"l": 415.73322, "t": 60.22014999999999, "r": 443.92681999999996, "b": 66.52863000000002, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "1", "bbox": {"l": 443.82598999999993, "t": 57.02013999999997, "r": 446.57598999999993, "b": 63.328610000000026, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "\u2044", "bbox": {"l": 446.57598999999993, "t": 56.18364999999994, "r": 448.24600000000004, "b": 67.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "6", "bbox": {"l": 448.22588999999994, "t": 60.22014999999999, "r": 453.12659, "b": 66.52863000000002, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "inch, and the bellows type ", "bbox": {"l": 455.57697, "t": 60.22014999999999, "r": 560.6579, "b": 66.52863000000002, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "ranges in size from No. 8 up to ", "bbox": {"l": 320.99591, "t": 68.68364999999994, "r": 447.36591000000004, "b": 80.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "3", "bbox": {"l": 448.79668999999996, "t": 69.52013999999997, "r": 451.54668999999996, "b": 75.82861000000003, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "\u2044", "bbox": {"l": 451.50549, "t": 68.68364999999994, "r": 453.17551, "b": 80.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "8", "bbox": {"l": 453.17542000000003, "t": 72.72014999999999, "r": 458.07175000000007, "b": 79.02863000000002, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "inch. Wing-type nuts are ", "bbox": {"l": 460.51993, "t": 72.72014999999999, "r": 559.78839, "b": 79.02863000000002, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "made of anodized aluminum alloy, cadmium-plated carbon ", "bbox": {"l": 320.99542, "t": 81.18364999999994, "r": 559.77844, "b": 92.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "steel, or stainless steel. The Rol-top nut is cadmium-plated ", "bbox": {"l": 320.99542, "t": 93.68364999999994, "r": 557.87738, "b": 105.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "steel, and the bellows type is made of aluminum alloy only. ", "bbox": {"l": 320.99542, "t": 106.18364999999994, "r": 561.80835, "b": 117.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": ". ", "bbox": {"l": 320.99542, "t": 118.68364999999994, "r": 325.99542, "b": 130.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "Stainless Steel Self-Locking Nut ", "bbox": {"l": 320.99542, "t": 131.31359999999995, "r": 450.99542, "b": 142.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "The stainless steel self-locking nut may be spun on and off ", "bbox": {"l": 320.99542, "t": 145.68364999999994, "r": 558.39838, "b": 157.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "by hand as its locking action takes places only when the ", "bbox": {"l": 320.99542, "t": 158.18364999999994, "r": 547.92542, "b": 169.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "nut is seated against a solid surface and tightened. The nut ", "bbox": {"l": 320.99542, "t": 170.68364999999994, "r": 556.50842, "b": 182.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "consists of two parts: a case with a beveled locking shoulder ", "bbox": {"l": 320.99542, "t": 183.18364999999994, "r": 565.11346, "b": 194.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "and key and a thread insert with a locking shoulder and ", "bbox": {"l": 320.99542, "t": 195.68364999999994, "r": 547.93744, "b": 207.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "slotted keyway. Until the nut is tightened, it spins on the ", "bbox": {"l": 320.99542, "t": 208.18364999999994, "r": 549.00647, "b": 219.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "bolt easily, because the threaded insert is the proper size ", "bbox": {"l": 320.99542, "t": 220.68364999999994, "r": 549.0755, "b": 232.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "for the bolt. However, when the nut is seated against a solid ", "bbox": {"l": 320.99542, "t": 233.18364999999994, "r": 562.60242, "b": 244.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "surface and tightened, the locking shoulder of the insert is ", "bbox": {"l": 320.99542, "t": 245.68364999999994, "r": 555.11243, "b": 257.15363, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "pulled downward and wedged against the locking shoulder ", "bbox": {"l": 320.99542, "t": 258.18364999999994, "r": 558.74146, "b": 269.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "of the case. This action compresses the threaded insert and ", "bbox": {"l": 320.99542, "t": 270.68361999999996, "r": 557.88538, "b": 282.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "causes it to clench the bolt tightly. The cross-sectional view ", "bbox": {"l": 320.99542, "t": 283.18361999999996, "r": 562.3114, "b": 294.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "in ", "bbox": {"l": 320.99542, "t": 295.68361999999996, "r": 331.27542, "b": 307.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "Figure 7-27", "bbox": {"l": 331.81543, "t": 295.81363000000005, "r": 379.86542, "b": 307.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": " shows how the key of the case fits into the ", "bbox": {"l": 379.86542, "t": 295.68361999999996, "r": 554.56543, "b": 307.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "slotted keyway of the insert so that when the case is turned, ", "bbox": {"l": 320.99542, "t": 308.18361999999996, "r": 561.16339, "b": 319.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "the threaded insert is turned with it. Note that the slot is wider ", "bbox": {"l": 320.99542, "t": 320.68361999999996, "r": 568.00439, "b": 332.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "than the key. This permits the slot to be narrowed and the ", "bbox": {"l": 320.99542, "t": 333.18361999999996, "r": 553.46545, "b": 344.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "insert to be compressed when the nut is tightened. ", "bbox": {"l": 320.99542, "t": 345.68361999999996, "r": 523.19543, "b": 357.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "Elastic Stop Nut ", "bbox": {"l": 320.99542, "t": 370.81363000000005, "r": 388.50543, "b": 382.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "The elastic stop nut is a standard nut with the height ", "bbox": {"l": 320.99542, "t": 385.18361999999996, "r": 548.72437, "b": 396.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "increased to accommodate a fiber locking collar. This ", "bbox": {"l": 320.99542, "t": 397.68361999999996, "r": 552.35132, "b": 409.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "Tightened nut ", "bbox": {"l": 479.1354999999999, "t": 672.7346, "r": 531.16748, "b": 682.646599, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "Untightened nut ", "bbox": {"l": 474.3699, "t": 531.8918, "r": 535.23389, "b": 541.8037999999999, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "Nut case ", "bbox": {"l": 456.7558900000001, "t": 431.99741, "r": 487.08388999999994, "b": 441.6134, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "Threaded nut core ", "bbox": {"l": 434.62299, "t": 577.8235, "r": 497.47183000000007, "b": 587.4395, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Locking shoulder ", "bbox": {"l": 448.55081, "t": 553.3206, "r": 507.686, "b": 562.9366, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Keyway ", "bbox": {"l": 424.78421, "t": 664.1116, "r": 452.10339000000005, "b": 673.7275999999999, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "Boots aircraft nut ", "bbox": {"l": 102.4155, "t": 587.76491, "r": 161.3187, "b": 597.38091, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "Flexloc nut ", "bbox": {"l": 91.685997, "t": 679.309799, "r": 129.77399, "b": 688.925797, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "Fiber locknut ", "bbox": {"l": 162.48109, "t": 679.309799, "r": 207.85629, "b": 688.925797, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "Elastic stop nut ", "bbox": {"l": 237.31379999999996, "t": 679.309799, "r": 289.561, "b": 688.925797, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Elastic anchor nut ", "bbox": {"l": 216.9326, "t": 587.76491, "r": 277.7966, "b": 597.38091, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "Figure 7-26. ", "bbox": {"l": 72.0, "t": 702.457596, "r": 119.12800000000001, "b": 713.009598, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "Self-locking nuts. ", "bbox": {"l": 119.4023, "t": 702.197601, "r": 184.14828, "b": 712.403599, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "Figure 7-27. ", "bbox": {"l": 321.0, "t": 700.437599, "r": 368.12799, "b": 710.989597, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "Stainless steel self-locking nut. ", "bbox": {"l": 368.40231, "t": 700.177597, "r": 481.64931999999993, "b": 710.383598, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "7-45 ", "bbox": {"l": 537.98541, "t": 727.980301, "r": 560.77539, "b": 740.290298, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 8, "label": "text", "bbox": {"l": 71.992126, "t": 43.68364999999994, "r": 314.11212, "b": 92.65363000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9851651191711426, "cells": [{"id": 0, "text": "pulleys, provided the inner race of the bearing is clamped ", "bbox": {"l": 71.992126, "t": 43.68364999999994, "r": 300.23203, "b": 55.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "to the supporting structure by the nut and bolt. Plates must ", "bbox": {"l": 71.992126, "t": 56.18364999999994, "r": 302.00214, "b": 67.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "be attached to the structure in a positive manner to eliminate ", "bbox": {"l": 71.992126, "t": 68.68364999999994, "r": 309.82214, "b": 80.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "rotation or misalignment when tightening the bolts or screws. ", "bbox": {"l": 71.992126, "t": 81.18364999999994, "r": 314.11212, "b": 92.65363000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "text", "bbox": {"l": 71.992302, "t": 106.18364999999994, "r": 313.1546, "b": 180.15363000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9873439073562622, "cells": [{"id": 4, "text": "The two general types of self-locking nuts currently in use ", "bbox": {"l": 71.992302, "t": 106.18364999999994, "r": 305.15311, "b": 117.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "are the all-metal type and the fiber lock type. For the sake of ", "bbox": {"l": 71.993103, "t": 118.68364999999994, "r": 309.98309, "b": 130.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "simplicity, only three typical kinds of self-locking nuts are ", "bbox": {"l": 71.993103, "t": 131.18364999999994, "r": 302.44312, "b": 142.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "considered in this handbook: the Boots self-locking and the ", "bbox": {"l": 71.993103, "t": 143.68364999999994, "r": 306.25311, "b": 155.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "stainless steel self-locking nuts, representing the all-metal ", "bbox": {"l": 71.993103, "t": 156.18364999999994, "r": 303.9931, "b": 167.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "types; and the elastic stop nut, representing ", "bbox": {"l": 71.993103, "t": 168.68364999999994, "r": 238.6723, "b": 180.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "the fiber insert type. ", "bbox": {"l": 234.26460000000003, "t": 168.68364999999994, "r": 313.1546, "b": 180.15363000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "section_header", "bbox": {"l": 71.992302, "t": 193.81359999999995, "r": 167.27231, "b": 205.15363000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9309079647064209, "cells": [{"id": 11, "text": "Boots Self-Locking Nut ", "bbox": {"l": 71.992302, "t": 193.81359999999995, "r": 167.27231, "b": 205.15363000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "text", "bbox": {"l": 71.992294, "t": 208.18364999999994, "r": 318.49225, "b": 282.15362999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9866572022438049, "cells": [{"id": 12, "text": "The Boots self-locking nut is of one piece, all-metal ", "bbox": {"l": 71.992302, "t": 208.18364999999994, "r": 302.27719, "b": 219.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "construction designed to hold tight despite severe vibration. ", "bbox": {"l": 71.992294, "t": 220.68364999999994, "r": 313.33026, "b": 232.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Note in ", "bbox": {"l": 71.992294, "t": 233.18364999999994, "r": 104.12231, "b": 244.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Figure 7-26", "bbox": {"l": 104.12231, "t": 233.31359999999995, "r": 152.05231, "b": 244.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": " that it has two sections and is essentially ", "bbox": {"l": 152.05231, "t": 233.18364999999994, "r": 318.49225, "b": 244.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "two nuts in one: a locking nut and a load-carrying nut. The ", "bbox": {"l": 71.992294, "t": 245.68364999999994, "r": 309.42929, "b": 257.15363, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "two sections are connected with a spring, which is an integral ", "bbox": {"l": 71.992294, "t": 258.18364999999994, "r": 317.76227, "b": 269.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "part of the nut. ", "bbox": {"l": 71.992294, "t": 270.68361999999996, "r": 133.3723, "b": 282.15362999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 71.992294, "t": 295.68361999999996, "r": 316.65729, "b": 369.65362999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9881331324577332, "cells": [{"id": 20, "text": "The spring keeps the locking and load-carrying sections such ", "bbox": {"l": 71.992294, "t": 295.68361999999996, "r": 316.41028, "b": 307.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "a distance apart that the two sets of threads are out of phase ", "bbox": {"l": 71.992294, "t": 308.18361999999996, "r": 312.20731, "b": 319.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "or spaced so that a bolt, which has been screwed through the ", "bbox": {"l": 71.992294, "t": 320.68361999999996, "r": 316.65729, "b": 332.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "load-carrying section, must push the locking section outward ", "bbox": {"l": 71.992294, "t": 333.18361999999996, "r": 315.91229, "b": 344.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "against the force of the spring to engage the threads of the ", "bbox": {"l": 71.992294, "t": 345.68361999999996, "r": 306.34927, "b": 357.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "locking section properly. ", "bbox": {"l": 71.992294, "t": 358.18361999999996, "r": 174.2023, "b": 369.65362999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 71.992294, "t": 383.18361999999996, "r": 318.81229, "b": 482.15363, "coord_origin": "TOPLEFT"}, "confidence": 0.9882921576499939, "cells": [{"id": 26, "text": "The spring, through the medium of the locking section, exerts ", "bbox": {"l": 71.992294, "t": 383.18361999999996, "r": 317.07227, "b": 394.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "a constant locking force on the bolt in the same direction as a ", "bbox": {"l": 71.992294, "t": 395.68361999999996, "r": 318.81229, "b": 407.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "force that would tighten the nut. In this nut, the load-carrying ", "bbox": {"l": 71.992294, "t": 408.18361999999996, "r": 317.5123, "b": 419.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "section has the thread strength of a standard nut of comparable ", "bbox": {"l": 71.992294, "t": 420.68361999999996, "r": 317.31229, "b": 432.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "size, while the locking section presses against the threads of ", "bbox": {"l": 71.992294, "t": 433.18361999999996, "r": 314.45929, "b": 444.65363, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "the bolt and locks the nut firmly in position. Only a wrench ", "bbox": {"l": 71.992294, "t": 445.68362, "r": 311.7023, "b": 457.15363, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "applied to the nut loosens it. The nut can be removed and ", "bbox": {"l": 71.992294, "t": 458.18362, "r": 303.35229, "b": 469.65363, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "reused without impairing its efficiency. ", "bbox": {"l": 71.992294, "t": 470.68362, "r": 231.97228999999996, "b": 482.15363, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 71.992294, "t": 495.68362, "r": 313.91229, "b": 519.65363, "coord_origin": "TOPLEFT"}, "confidence": 0.9695363640785217, "cells": [{"id": 34, "text": "Boots self-locking nuts are made with three different spring ", "bbox": {"l": 71.992294, "t": 495.68362, "r": 313.34229, "b": 507.15363, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "styles and in various shapes and sizes. The wing type that is ", "bbox": {"l": 71.992294, "t": 508.18362, "r": 313.91229, "b": 519.65363, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "text", "bbox": {"l": 320.99231, "t": 43.68364999999994, "r": 561.80835, "b": 117.65363000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9870070219039917, "cells": [{"id": 36, "text": "the most common ranges in size for No. 6 up to ", "bbox": {"l": 320.99231, "t": 43.68364999999994, "r": 513.74628, "b": 55.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "1", "bbox": {"l": 514.06342, "t": 44.52013999999997, "r": 516.81342, "b": 50.828610000000026, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "\u2044", "bbox": {"l": 516.81342, "t": 43.68364999999994, "r": 518.4834, "b": 55.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "4", "bbox": {"l": 518.25842, "t": 47.72014999999999, "r": 523.00525, "b": 54.02863000000002, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "inch, the ", "bbox": {"l": 525.37872, "t": 47.72014999999999, "r": 560.44843, "b": 54.02863000000002, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Rol-top ranges from ", "bbox": {"l": 320.99841, "t": 56.18364999999994, "r": 404.58441, "b": 67.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "1", "bbox": {"l": 404.48981, "t": 57.02013999999997, "r": 407.23981, "b": 63.328610000000026, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "\u2044", "bbox": {"l": 407.23981, "t": 56.18364999999994, "r": 408.90982, "b": 67.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "4", "bbox": {"l": 408.68481, "t": 60.22014999999999, "r": 413.38376, "b": 66.52863000000002, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "inch to ", "bbox": {"l": 415.73322, "t": 60.22014999999999, "r": 443.92681999999996, "b": 66.52863000000002, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "1", "bbox": {"l": 443.82598999999993, "t": 57.02013999999997, "r": 446.57598999999993, "b": 63.328610000000026, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "\u2044", "bbox": {"l": 446.57598999999993, "t": 56.18364999999994, "r": 448.24600000000004, "b": 67.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "6", "bbox": {"l": 448.22588999999994, "t": 60.22014999999999, "r": 453.12659, "b": 66.52863000000002, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "inch, and the bellows type ", "bbox": {"l": 455.57697, "t": 60.22014999999999, "r": 560.6579, "b": 66.52863000000002, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "ranges in size from No. 8 up to ", "bbox": {"l": 320.99591, "t": 68.68364999999994, "r": 447.36591000000004, "b": 80.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "3", "bbox": {"l": 448.79668999999996, "t": 69.52013999999997, "r": 451.54668999999996, "b": 75.82861000000003, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "\u2044", "bbox": {"l": 451.50549, "t": 68.68364999999994, "r": 453.17551, "b": 80.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "8", "bbox": {"l": 453.17542000000003, "t": 72.72014999999999, "r": 458.07175000000007, "b": 79.02863000000002, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "inch. Wing-type nuts are ", "bbox": {"l": 460.51993, "t": 72.72014999999999, "r": 559.78839, "b": 79.02863000000002, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "made of anodized aluminum alloy, cadmium-plated carbon ", "bbox": {"l": 320.99542, "t": 81.18364999999994, "r": 559.77844, "b": 92.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "steel, or stainless steel. The Rol-top nut is cadmium-plated ", "bbox": {"l": 320.99542, "t": 93.68364999999994, "r": 557.87738, "b": 105.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "steel, and the bellows type is made of aluminum alloy only. ", "bbox": {"l": 320.99542, "t": 106.18364999999994, "r": 561.80835, "b": 117.65363000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 320.99542, "t": 118.68364999999994, "r": 325.99542, "b": 130.15363000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": ". ", "bbox": {"l": 320.99542, "t": 118.68364999999994, "r": 325.99542, "b": 130.15363000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "section_header", "bbox": {"l": 320.99542, "t": 131.31359999999995, "r": 450.99542, "b": 142.65363000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9263731241226196, "cells": [{"id": 59, "text": "Stainless Steel Self-Locking Nut ", "bbox": {"l": 320.99542, "t": 131.31359999999995, "r": 450.99542, "b": 142.65363000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 320.99542, "t": 145.68364999999994, "r": 568.00439, "b": 357.15362999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9879258871078491, "cells": [{"id": 60, "text": "The stainless steel self-locking nut may be spun on and off ", "bbox": {"l": 320.99542, "t": 145.68364999999994, "r": 558.39838, "b": 157.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "by hand as its locking action takes places only when the ", "bbox": {"l": 320.99542, "t": 158.18364999999994, "r": 547.92542, "b": 169.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "nut is seated against a solid surface and tightened. The nut ", "bbox": {"l": 320.99542, "t": 170.68364999999994, "r": 556.50842, "b": 182.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "consists of two parts: a case with a beveled locking shoulder ", "bbox": {"l": 320.99542, "t": 183.18364999999994, "r": 565.11346, "b": 194.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "and key and a thread insert with a locking shoulder and ", "bbox": {"l": 320.99542, "t": 195.68364999999994, "r": 547.93744, "b": 207.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "slotted keyway. Until the nut is tightened, it spins on the ", "bbox": {"l": 320.99542, "t": 208.18364999999994, "r": 549.00647, "b": 219.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "bolt easily, because the threaded insert is the proper size ", "bbox": {"l": 320.99542, "t": 220.68364999999994, "r": 549.0755, "b": 232.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "for the bolt. However, when the nut is seated against a solid ", "bbox": {"l": 320.99542, "t": 233.18364999999994, "r": 562.60242, "b": 244.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "surface and tightened, the locking shoulder of the insert is ", "bbox": {"l": 320.99542, "t": 245.68364999999994, "r": 555.11243, "b": 257.15363, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "pulled downward and wedged against the locking shoulder ", "bbox": {"l": 320.99542, "t": 258.18364999999994, "r": 558.74146, "b": 269.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "of the case. This action compresses the threaded insert and ", "bbox": {"l": 320.99542, "t": 270.68361999999996, "r": 557.88538, "b": 282.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "causes it to clench the bolt tightly. The cross-sectional view ", "bbox": {"l": 320.99542, "t": 283.18361999999996, "r": 562.3114, "b": 294.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "in ", "bbox": {"l": 320.99542, "t": 295.68361999999996, "r": 331.27542, "b": 307.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "Figure 7-27", "bbox": {"l": 331.81543, "t": 295.81363000000005, "r": 379.86542, "b": 307.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": " shows how the key of the case fits into the ", "bbox": {"l": 379.86542, "t": 295.68361999999996, "r": 554.56543, "b": 307.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "slotted keyway of the insert so that when the case is turned, ", "bbox": {"l": 320.99542, "t": 308.18361999999996, "r": 561.16339, "b": 319.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "the threaded insert is turned with it. Note that the slot is wider ", "bbox": {"l": 320.99542, "t": 320.68361999999996, "r": 568.00439, "b": 332.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "than the key. This permits the slot to be narrowed and the ", "bbox": {"l": 320.99542, "t": 333.18361999999996, "r": 553.46545, "b": 344.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "insert to be compressed when the nut is tightened. ", "bbox": {"l": 320.99542, "t": 345.68361999999996, "r": 523.19543, "b": 357.15362999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "section_header", "bbox": {"l": 320.99542, "t": 370.81363000000005, "r": 388.50543, "b": 382.15362999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9253152012825012, "cells": [{"id": 79, "text": "Elastic Stop Nut ", "bbox": {"l": 320.99542, "t": 370.81363000000005, "r": 388.50543, "b": 382.15362999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "text", "bbox": {"l": 320.99542, "t": 385.18361999999996, "r": 552.35132, "b": 409.15362999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9676451683044434, "cells": [{"id": 80, "text": "The elastic stop nut is a standard nut with the height ", "bbox": {"l": 320.99542, "t": 385.18361999999996, "r": 548.72437, "b": 396.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "increased to accommodate a fiber locking collar. This ", "bbox": {"l": 320.99542, "t": 397.68361999999996, "r": 552.35132, "b": 409.15362999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "picture", "bbox": {"l": 320.4467468261719, "t": 421.640625, "r": 558.8576049804688, "b": 692.310791015625, "coord_origin": "TOPLEFT"}, "confidence": 0.9881086945533752, "cells": [{"id": 82, "text": "Tightened nut ", "bbox": {"l": 479.1354999999999, "t": 672.7346, "r": 531.16748, "b": 682.646599, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "Untightened nut ", "bbox": {"l": 474.3699, "t": 531.8918, "r": 535.23389, "b": 541.8037999999999, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "Nut case ", "bbox": {"l": 456.7558900000001, "t": 431.99741, "r": 487.08388999999994, "b": 441.6134, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "Threaded nut core ", "bbox": {"l": 434.62299, "t": 577.8235, "r": 497.47183000000007, "b": 587.4395, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Locking shoulder ", "bbox": {"l": 448.55081, "t": 553.3206, "r": 507.686, "b": 562.9366, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Keyway ", "bbox": {"l": 424.78421, "t": 664.1116, "r": 452.10339000000005, "b": 673.7275999999999, "coord_origin": "TOPLEFT"}}], "children": [{"id": 18, "label": "text", "bbox": {"l": 479.1354999999999, "t": 672.7346, "r": 531.16748, "b": 682.646599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "Tightened nut ", "bbox": {"l": 479.1354999999999, "t": 672.7346, "r": 531.16748, "b": 682.646599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 474.3699, "t": 531.8918, "r": 535.23389, "b": 541.8037999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "Untightened nut ", "bbox": {"l": 474.3699, "t": 531.8918, "r": 535.23389, "b": 541.8037999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 456.7558900000001, "t": 431.99741, "r": 487.08388999999994, "b": 441.6134, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "Nut case ", "bbox": {"l": 456.7558900000001, "t": 431.99741, "r": 487.08388999999994, "b": 441.6134, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 434.62299, "t": 577.8235, "r": 497.47183000000007, "b": 587.4395, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "Threaded nut core ", "bbox": {"l": 434.62299, "t": 577.8235, "r": 497.47183000000007, "b": 587.4395, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 448.55081, "t": 553.3206, "r": 507.686, "b": 562.9366, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "Locking shoulder ", "bbox": {"l": 448.55081, "t": 553.3206, "r": 507.686, "b": 562.9366, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 424.78421, "t": 664.1116, "r": 452.10339000000005, "b": 673.7275999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "Keyway ", "bbox": {"l": 424.78421, "t": 664.1116, "r": 452.10339000000005, "b": 673.7275999999999, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 7, "label": "picture", "bbox": {"l": 70.59269714355469, "t": 531.2222290039062, "r": 309.863037109375, "b": 694.3909912109375, "coord_origin": "TOPLEFT"}, "confidence": 0.9858751893043518, "cells": [{"id": 88, "text": "Boots aircraft nut ", "bbox": {"l": 102.4155, "t": 587.76491, "r": 161.3187, "b": 597.38091, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "Flexloc nut ", "bbox": {"l": 91.685997, "t": 679.309799, "r": 129.77399, "b": 688.925797, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "Fiber locknut ", "bbox": {"l": 162.48109, "t": 679.309799, "r": 207.85629, "b": 688.925797, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "Elastic stop nut ", "bbox": {"l": 237.31379999999996, "t": 679.309799, "r": 289.561, "b": 688.925797, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Elastic anchor nut ", "bbox": {"l": 216.9326, "t": 587.76491, "r": 277.7966, "b": 597.38091, "coord_origin": "TOPLEFT"}}], "children": [{"id": 24, "label": "text", "bbox": {"l": 102.4155, "t": 587.76491, "r": 161.3187, "b": 597.38091, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "Boots aircraft nut ", "bbox": {"l": 102.4155, "t": 587.76491, "r": 161.3187, "b": 597.38091, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 91.685997, "t": 679.309799, "r": 129.77399, "b": 688.925797, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "Flexloc nut ", "bbox": {"l": 91.685997, "t": 679.309799, "r": 129.77399, "b": 688.925797, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 162.48109, "t": 679.309799, "r": 207.85629, "b": 688.925797, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "Fiber locknut ", "bbox": {"l": 162.48109, "t": 679.309799, "r": 207.85629, "b": 688.925797, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 237.31379999999996, "t": 679.309799, "r": 289.561, "b": 688.925797, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "Elastic stop nut ", "bbox": {"l": 237.31379999999996, "t": 679.309799, "r": 289.561, "b": 688.925797, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 216.9326, "t": 587.76491, "r": 277.7966, "b": 597.38091, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "Elastic anchor nut ", "bbox": {"l": 216.9326, "t": 587.76491, "r": 277.7966, "b": 597.38091, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 12, "label": "caption", "bbox": {"l": 72.0, "t": 702.197601, "r": 184.14828, "b": 713.009598, "coord_origin": "TOPLEFT"}, "confidence": 0.9449448585510254, "cells": [{"id": 93, "text": "Figure 7-26. ", "bbox": {"l": 72.0, "t": 702.457596, "r": 119.12800000000001, "b": 713.009598, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "Self-locking nuts. ", "bbox": {"l": 119.4023, "t": 702.197601, "r": 184.14828, "b": 712.403599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "caption", "bbox": {"l": 321.0, "t": 700.177597, "r": 481.64931999999993, "b": 710.989597, "coord_origin": "TOPLEFT"}, "confidence": 0.9497622847557068, "cells": [{"id": 95, "text": "Figure 7-27. ", "bbox": {"l": 321.0, "t": 700.437599, "r": 368.12799, "b": 710.989597, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "Stainless steel self-locking nut. ", "bbox": {"l": 368.40231, "t": 700.177597, "r": 481.64931999999993, "b": 710.383598, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "page_footer", "bbox": {"l": 537.98541, "t": 727.980301, "r": 560.77539, "b": 740.290298, "coord_origin": "TOPLEFT"}, "confidence": 0.9368568658828735, "cells": [{"id": 97, "text": "7-45 ", "bbox": {"l": 537.98541, "t": 727.980301, "r": 560.77539, "b": 740.290298, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "text", "id": 8, "page_no": 0, "cluster": {"id": 8, "label": "text", "bbox": {"l": 71.992126, "t": 43.68364999999994, "r": 314.11212, "b": 92.65363000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9851651191711426, "cells": [{"id": 0, "text": "pulleys, provided the inner race of the bearing is clamped ", "bbox": {"l": 71.992126, "t": 43.68364999999994, "r": 300.23203, "b": 55.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "to the supporting structure by the nut and bolt. Plates must ", "bbox": {"l": 71.992126, "t": 56.18364999999994, "r": 302.00214, "b": 67.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "be attached to the structure in a positive manner to eliminate ", "bbox": {"l": 71.992126, "t": 68.68364999999994, "r": 309.82214, "b": 80.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "rotation or misalignment when tightening the bolts or screws. ", "bbox": {"l": 71.992126, "t": 81.18364999999994, "r": 314.11212, "b": 92.65363000000002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "pulleys, provided the inner race of the bearing is clamped to the supporting structure by the nut and bolt. Plates must be attached to the structure in a positive manner to eliminate rotation or misalignment when tightening the bolts or screws."}, {"label": "text", "id": 4, "page_no": 0, "cluster": {"id": 4, "label": "text", "bbox": {"l": 71.992302, "t": 106.18364999999994, "r": 313.1546, "b": 180.15363000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9873439073562622, "cells": [{"id": 4, "text": "The two general types of self-locking nuts currently in use ", "bbox": {"l": 71.992302, "t": 106.18364999999994, "r": 305.15311, "b": 117.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "are the all-metal type and the fiber lock type. For the sake of ", "bbox": {"l": 71.993103, "t": 118.68364999999994, "r": 309.98309, "b": 130.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "simplicity, only three typical kinds of self-locking nuts are ", "bbox": {"l": 71.993103, "t": 131.18364999999994, "r": 302.44312, "b": 142.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "considered in this handbook: the Boots self-locking and the ", "bbox": {"l": 71.993103, "t": 143.68364999999994, "r": 306.25311, "b": 155.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "stainless steel self-locking nuts, representing the all-metal ", "bbox": {"l": 71.993103, "t": 156.18364999999994, "r": 303.9931, "b": 167.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "types; and the elastic stop nut, representing ", "bbox": {"l": 71.993103, "t": 168.68364999999994, "r": 238.6723, "b": 180.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "the fiber insert type. ", "bbox": {"l": 234.26460000000003, "t": 168.68364999999994, "r": 313.1546, "b": 180.15363000000002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The two general types of self-locking nuts currently in use are the all-metal type and the fiber lock type. For the sake of simplicity, only three typical kinds of self-locking nuts are considered in this handbook: the Boots self-locking and the stainless steel self-locking nuts, representing the all-metal types; and the elastic stop nut, representing the fiber insert type."}, {"label": "section_header", "id": 14, "page_no": 0, "cluster": {"id": 14, "label": "section_header", "bbox": {"l": 71.992302, "t": 193.81359999999995, "r": 167.27231, "b": 205.15363000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9309079647064209, "cells": [{"id": 11, "text": "Boots Self-Locking Nut ", "bbox": {"l": 71.992302, "t": 193.81359999999995, "r": 167.27231, "b": 205.15363000000002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Boots Self-Locking Nut"}, {"label": "text", "id": 6, "page_no": 0, "cluster": {"id": 6, "label": "text", "bbox": {"l": 71.992294, "t": 208.18364999999994, "r": 318.49225, "b": 282.15362999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9866572022438049, "cells": [{"id": 12, "text": "The Boots self-locking nut is of one piece, all-metal ", "bbox": {"l": 71.992302, "t": 208.18364999999994, "r": 302.27719, "b": 219.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "construction designed to hold tight despite severe vibration. ", "bbox": {"l": 71.992294, "t": 220.68364999999994, "r": 313.33026, "b": 232.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Note in ", "bbox": {"l": 71.992294, "t": 233.18364999999994, "r": 104.12231, "b": 244.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Figure 7-26", "bbox": {"l": 104.12231, "t": 233.31359999999995, "r": 152.05231, "b": 244.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": " that it has two sections and is essentially ", "bbox": {"l": 152.05231, "t": 233.18364999999994, "r": 318.49225, "b": 244.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "two nuts in one: a locking nut and a load-carrying nut. The ", "bbox": {"l": 71.992294, "t": 245.68364999999994, "r": 309.42929, "b": 257.15363, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "two sections are connected with a spring, which is an integral ", "bbox": {"l": 71.992294, "t": 258.18364999999994, "r": 317.76227, "b": 269.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "part of the nut. ", "bbox": {"l": 71.992294, "t": 270.68361999999996, "r": 133.3723, "b": 282.15362999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The Boots self-locking nut is of one piece, all-metal construction designed to hold tight despite severe vibration. Note in Figure 7-26 that it has two sections and is essentially two nuts in one: a locking nut and a load-carrying nut. The two sections are connected with a spring, which is an integral part of the nut."}, {"label": "text", "id": 1, "page_no": 0, "cluster": {"id": 1, "label": "text", "bbox": {"l": 71.992294, "t": 295.68361999999996, "r": 316.65729, "b": 369.65362999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9881331324577332, "cells": [{"id": 20, "text": "The spring keeps the locking and load-carrying sections such ", "bbox": {"l": 71.992294, "t": 295.68361999999996, "r": 316.41028, "b": 307.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "a distance apart that the two sets of threads are out of phase ", "bbox": {"l": 71.992294, "t": 308.18361999999996, "r": 312.20731, "b": 319.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "or spaced so that a bolt, which has been screwed through the ", "bbox": {"l": 71.992294, "t": 320.68361999999996, "r": 316.65729, "b": 332.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "load-carrying section, must push the locking section outward ", "bbox": {"l": 71.992294, "t": 333.18361999999996, "r": 315.91229, "b": 344.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "against the force of the spring to engage the threads of the ", "bbox": {"l": 71.992294, "t": 345.68361999999996, "r": 306.34927, "b": 357.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "locking section properly. ", "bbox": {"l": 71.992294, "t": 358.18361999999996, "r": 174.2023, "b": 369.65362999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The spring keeps the locking and load-carrying sections such a distance apart that the two sets of threads are out of phase or spaced so that a bolt, which has been screwed through the load-carrying section, must push the locking section outward against the force of the spring to engage the threads of the locking section properly."}, {"label": "text", "id": 0, "page_no": 0, "cluster": {"id": 0, "label": "text", "bbox": {"l": 71.992294, "t": 383.18361999999996, "r": 318.81229, "b": 482.15363, "coord_origin": "TOPLEFT"}, "confidence": 0.9882921576499939, "cells": [{"id": 26, "text": "The spring, through the medium of the locking section, exerts ", "bbox": {"l": 71.992294, "t": 383.18361999999996, "r": 317.07227, "b": 394.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "a constant locking force on the bolt in the same direction as a ", "bbox": {"l": 71.992294, "t": 395.68361999999996, "r": 318.81229, "b": 407.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "force that would tighten the nut. In this nut, the load-carrying ", "bbox": {"l": 71.992294, "t": 408.18361999999996, "r": 317.5123, "b": 419.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "section has the thread strength of a standard nut of comparable ", "bbox": {"l": 71.992294, "t": 420.68361999999996, "r": 317.31229, "b": 432.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "size, while the locking section presses against the threads of ", "bbox": {"l": 71.992294, "t": 433.18361999999996, "r": 314.45929, "b": 444.65363, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "the bolt and locks the nut firmly in position. Only a wrench ", "bbox": {"l": 71.992294, "t": 445.68362, "r": 311.7023, "b": 457.15363, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "applied to the nut loosens it. The nut can be removed and ", "bbox": {"l": 71.992294, "t": 458.18362, "r": 303.35229, "b": 469.65363, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "reused without impairing its efficiency. ", "bbox": {"l": 71.992294, "t": 470.68362, "r": 231.97228999999996, "b": 482.15363, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The spring, through the medium of the locking section, exerts a constant locking force on the bolt in the same direction as a force that would tighten the nut. In this nut, the load-carrying section has the thread strength of a standard nut of comparable size, while the locking section presses against the threads of the bolt and locks the nut firmly in position. Only a wrench applied to the nut loosens it. The nut can be removed and reused without impairing its efficiency."}, {"label": "text", "id": 9, "page_no": 0, "cluster": {"id": 9, "label": "text", "bbox": {"l": 71.992294, "t": 495.68362, "r": 313.91229, "b": 519.65363, "coord_origin": "TOPLEFT"}, "confidence": 0.9695363640785217, "cells": [{"id": 34, "text": "Boots self-locking nuts are made with three different spring ", "bbox": {"l": 71.992294, "t": 495.68362, "r": 313.34229, "b": 507.15363, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "styles and in various shapes and sizes. The wing type that is ", "bbox": {"l": 71.992294, "t": 508.18362, "r": 313.91229, "b": 519.65363, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Boots self-locking nuts are made with three different spring styles and in various shapes and sizes. The wing type that is"}, {"label": "text", "id": 5, "page_no": 0, "cluster": {"id": 5, "label": "text", "bbox": {"l": 320.99231, "t": 43.68364999999994, "r": 561.80835, "b": 117.65363000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9870070219039917, "cells": [{"id": 36, "text": "the most common ranges in size for No. 6 up to ", "bbox": {"l": 320.99231, "t": 43.68364999999994, "r": 513.74628, "b": 55.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "1", "bbox": {"l": 514.06342, "t": 44.52013999999997, "r": 516.81342, "b": 50.828610000000026, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "\u2044", "bbox": {"l": 516.81342, "t": 43.68364999999994, "r": 518.4834, "b": 55.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "4", "bbox": {"l": 518.25842, "t": 47.72014999999999, "r": 523.00525, "b": 54.02863000000002, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "inch, the ", "bbox": {"l": 525.37872, "t": 47.72014999999999, "r": 560.44843, "b": 54.02863000000002, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Rol-top ranges from ", "bbox": {"l": 320.99841, "t": 56.18364999999994, "r": 404.58441, "b": 67.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "1", "bbox": {"l": 404.48981, "t": 57.02013999999997, "r": 407.23981, "b": 63.328610000000026, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "\u2044", "bbox": {"l": 407.23981, "t": 56.18364999999994, "r": 408.90982, "b": 67.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "4", "bbox": {"l": 408.68481, "t": 60.22014999999999, "r": 413.38376, "b": 66.52863000000002, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "inch to ", "bbox": {"l": 415.73322, "t": 60.22014999999999, "r": 443.92681999999996, "b": 66.52863000000002, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "1", "bbox": {"l": 443.82598999999993, "t": 57.02013999999997, "r": 446.57598999999993, "b": 63.328610000000026, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "\u2044", "bbox": {"l": 446.57598999999993, "t": 56.18364999999994, "r": 448.24600000000004, "b": 67.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "6", "bbox": {"l": 448.22588999999994, "t": 60.22014999999999, "r": 453.12659, "b": 66.52863000000002, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "inch, and the bellows type ", "bbox": {"l": 455.57697, "t": 60.22014999999999, "r": 560.6579, "b": 66.52863000000002, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "ranges in size from No. 8 up to ", "bbox": {"l": 320.99591, "t": 68.68364999999994, "r": 447.36591000000004, "b": 80.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "3", "bbox": {"l": 448.79668999999996, "t": 69.52013999999997, "r": 451.54668999999996, "b": 75.82861000000003, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "\u2044", "bbox": {"l": 451.50549, "t": 68.68364999999994, "r": 453.17551, "b": 80.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "8", "bbox": {"l": 453.17542000000003, "t": 72.72014999999999, "r": 458.07175000000007, "b": 79.02863000000002, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "inch. Wing-type nuts are ", "bbox": {"l": 460.51993, "t": 72.72014999999999, "r": 559.78839, "b": 79.02863000000002, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "made of anodized aluminum alloy, cadmium-plated carbon ", "bbox": {"l": 320.99542, "t": 81.18364999999994, "r": 559.77844, "b": 92.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "steel, or stainless steel. The Rol-top nut is cadmium-plated ", "bbox": {"l": 320.99542, "t": 93.68364999999994, "r": 557.87738, "b": 105.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "steel, and the bellows type is made of aluminum alloy only. ", "bbox": {"l": 320.99542, "t": 106.18364999999994, "r": 561.80835, "b": 117.65363000000002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "the most common ranges in size for No. 6 up to 1 / 4 inch, the Rol-top ranges from 1 / 4 inch to 1 / 6 inch, and the bellows type ranges in size from No. 8 up to 3 / 8 inch. Wing-type nuts are made of anodized aluminum alloy, cadmium-plated carbon steel, or stainless steel. The Rol-top nut is cadmium-plated steel, and the bellows type is made of aluminum alloy only."}, {"label": "text", "id": 17, "page_no": 0, "cluster": {"id": 17, "label": "text", "bbox": {"l": 320.99542, "t": 118.68364999999994, "r": 325.99542, "b": 130.15363000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": ". ", "bbox": {"l": 320.99542, "t": 118.68364999999994, "r": 325.99542, "b": 130.15363000000002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "."}, {"label": "section_header", "id": 15, "page_no": 0, "cluster": {"id": 15, "label": "section_header", "bbox": {"l": 320.99542, "t": 131.31359999999995, "r": 450.99542, "b": 142.65363000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9263731241226196, "cells": [{"id": 59, "text": "Stainless Steel Self-Locking Nut ", "bbox": {"l": 320.99542, "t": 131.31359999999995, "r": 450.99542, "b": 142.65363000000002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Stainless Steel Self-Locking Nut"}, {"label": "text", "id": 3, "page_no": 0, "cluster": {"id": 3, "label": "text", "bbox": {"l": 320.99542, "t": 145.68364999999994, "r": 568.00439, "b": 357.15362999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9879258871078491, "cells": [{"id": 60, "text": "The stainless steel self-locking nut may be spun on and off ", "bbox": {"l": 320.99542, "t": 145.68364999999994, "r": 558.39838, "b": 157.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "by hand as its locking action takes places only when the ", "bbox": {"l": 320.99542, "t": 158.18364999999994, "r": 547.92542, "b": 169.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "nut is seated against a solid surface and tightened. The nut ", "bbox": {"l": 320.99542, "t": 170.68364999999994, "r": 556.50842, "b": 182.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "consists of two parts: a case with a beveled locking shoulder ", "bbox": {"l": 320.99542, "t": 183.18364999999994, "r": 565.11346, "b": 194.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "and key and a thread insert with a locking shoulder and ", "bbox": {"l": 320.99542, "t": 195.68364999999994, "r": 547.93744, "b": 207.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "slotted keyway. Until the nut is tightened, it spins on the ", "bbox": {"l": 320.99542, "t": 208.18364999999994, "r": 549.00647, "b": 219.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "bolt easily, because the threaded insert is the proper size ", "bbox": {"l": 320.99542, "t": 220.68364999999994, "r": 549.0755, "b": 232.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "for the bolt. However, when the nut is seated against a solid ", "bbox": {"l": 320.99542, "t": 233.18364999999994, "r": 562.60242, "b": 244.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "surface and tightened, the locking shoulder of the insert is ", "bbox": {"l": 320.99542, "t": 245.68364999999994, "r": 555.11243, "b": 257.15363, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "pulled downward and wedged against the locking shoulder ", "bbox": {"l": 320.99542, "t": 258.18364999999994, "r": 558.74146, "b": 269.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "of the case. This action compresses the threaded insert and ", "bbox": {"l": 320.99542, "t": 270.68361999999996, "r": 557.88538, "b": 282.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "causes it to clench the bolt tightly. The cross-sectional view ", "bbox": {"l": 320.99542, "t": 283.18361999999996, "r": 562.3114, "b": 294.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "in ", "bbox": {"l": 320.99542, "t": 295.68361999999996, "r": 331.27542, "b": 307.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "Figure 7-27", "bbox": {"l": 331.81543, "t": 295.81363000000005, "r": 379.86542, "b": 307.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": " shows how the key of the case fits into the ", "bbox": {"l": 379.86542, "t": 295.68361999999996, "r": 554.56543, "b": 307.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "slotted keyway of the insert so that when the case is turned, ", "bbox": {"l": 320.99542, "t": 308.18361999999996, "r": 561.16339, "b": 319.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "the threaded insert is turned with it. Note that the slot is wider ", "bbox": {"l": 320.99542, "t": 320.68361999999996, "r": 568.00439, "b": 332.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "than the key. This permits the slot to be narrowed and the ", "bbox": {"l": 320.99542, "t": 333.18361999999996, "r": 553.46545, "b": 344.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "insert to be compressed when the nut is tightened. ", "bbox": {"l": 320.99542, "t": 345.68361999999996, "r": 523.19543, "b": 357.15362999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The stainless steel self-locking nut may be spun on and off by hand as its locking action takes places only when the nut is seated against a solid surface and tightened. The nut consists of two parts: a case with a beveled locking shoulder and key and a thread insert with a locking shoulder and slotted keyway. Until the nut is tightened, it spins on the bolt easily, because the threaded insert is the proper size for the bolt. However, when the nut is seated against a solid surface and tightened, the locking shoulder of the insert is pulled downward and wedged against the locking shoulder of the case. This action compresses the threaded insert and causes it to clench the bolt tightly. The cross-sectional view in Figure 7-27 shows how the key of the case fits into the slotted keyway of the insert so that when the case is turned, the threaded insert is turned with it. Note that the slot is wider than the key. This permits the slot to be narrowed and the insert to be compressed when the nut is tightened."}, {"label": "section_header", "id": 16, "page_no": 0, "cluster": {"id": 16, "label": "section_header", "bbox": {"l": 320.99542, "t": 370.81363000000005, "r": 388.50543, "b": 382.15362999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9253152012825012, "cells": [{"id": 79, "text": "Elastic Stop Nut ", "bbox": {"l": 320.99542, "t": 370.81363000000005, "r": 388.50543, "b": 382.15362999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Elastic Stop Nut"}, {"label": "text", "id": 10, "page_no": 0, "cluster": {"id": 10, "label": "text", "bbox": {"l": 320.99542, "t": 385.18361999999996, "r": 552.35132, "b": 409.15362999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9676451683044434, "cells": [{"id": 80, "text": "The elastic stop nut is a standard nut with the height ", "bbox": {"l": 320.99542, "t": 385.18361999999996, "r": 548.72437, "b": 396.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "increased to accommodate a fiber locking collar. This ", "bbox": {"l": 320.99542, "t": 397.68361999999996, "r": 552.35132, "b": 409.15362999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The elastic stop nut is a standard nut with the height increased to accommodate a fiber locking collar. This"}, {"label": "picture", "id": 2, "page_no": 0, "cluster": {"id": 2, "label": "picture", "bbox": {"l": 320.4467468261719, "t": 421.640625, "r": 558.8576049804688, "b": 692.310791015625, "coord_origin": "TOPLEFT"}, "confidence": 0.9881086945533752, "cells": [{"id": 82, "text": "Tightened nut ", "bbox": {"l": 479.1354999999999, "t": 672.7346, "r": 531.16748, "b": 682.646599, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "Untightened nut ", "bbox": {"l": 474.3699, "t": 531.8918, "r": 535.23389, "b": 541.8037999999999, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "Nut case ", "bbox": {"l": 456.7558900000001, "t": 431.99741, "r": 487.08388999999994, "b": 441.6134, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "Threaded nut core ", "bbox": {"l": 434.62299, "t": 577.8235, "r": 497.47183000000007, "b": 587.4395, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Locking shoulder ", "bbox": {"l": 448.55081, "t": 553.3206, "r": 507.686, "b": 562.9366, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Keyway ", "bbox": {"l": 424.78421, "t": 664.1116, "r": 452.10339000000005, "b": 673.7275999999999, "coord_origin": "TOPLEFT"}}], "children": [{"id": 18, "label": "text", "bbox": {"l": 479.1354999999999, "t": 672.7346, "r": 531.16748, "b": 682.646599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "Tightened nut ", "bbox": {"l": 479.1354999999999, "t": 672.7346, "r": 531.16748, "b": 682.646599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 474.3699, "t": 531.8918, "r": 535.23389, "b": 541.8037999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "Untightened nut ", "bbox": {"l": 474.3699, "t": 531.8918, "r": 535.23389, "b": 541.8037999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 456.7558900000001, "t": 431.99741, "r": 487.08388999999994, "b": 441.6134, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "Nut case ", "bbox": {"l": 456.7558900000001, "t": 431.99741, "r": 487.08388999999994, "b": 441.6134, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 434.62299, "t": 577.8235, "r": 497.47183000000007, "b": 587.4395, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "Threaded nut core ", "bbox": {"l": 434.62299, "t": 577.8235, "r": 497.47183000000007, "b": 587.4395, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 448.55081, "t": 553.3206, "r": 507.686, "b": 562.9366, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "Locking shoulder ", "bbox": {"l": 448.55081, "t": 553.3206, "r": 507.686, "b": 562.9366, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 424.78421, "t": 664.1116, "r": 452.10339000000005, "b": 673.7275999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "Keyway ", "bbox": {"l": 424.78421, "t": 664.1116, "r": 452.10339000000005, "b": 673.7275999999999, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "picture", "id": 7, "page_no": 0, "cluster": {"id": 7, "label": "picture", "bbox": {"l": 70.59269714355469, "t": 531.2222290039062, "r": 309.863037109375, "b": 694.3909912109375, "coord_origin": "TOPLEFT"}, "confidence": 0.9858751893043518, "cells": [{"id": 88, "text": "Boots aircraft nut ", "bbox": {"l": 102.4155, "t": 587.76491, "r": 161.3187, "b": 597.38091, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "Flexloc nut ", "bbox": {"l": 91.685997, "t": 679.309799, "r": 129.77399, "b": 688.925797, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "Fiber locknut ", "bbox": {"l": 162.48109, "t": 679.309799, "r": 207.85629, "b": 688.925797, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "Elastic stop nut ", "bbox": {"l": 237.31379999999996, "t": 679.309799, "r": 289.561, "b": 688.925797, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Elastic anchor nut ", "bbox": {"l": 216.9326, "t": 587.76491, "r": 277.7966, "b": 597.38091, "coord_origin": "TOPLEFT"}}], "children": [{"id": 24, "label": "text", "bbox": {"l": 102.4155, "t": 587.76491, "r": 161.3187, "b": 597.38091, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "Boots aircraft nut ", "bbox": {"l": 102.4155, "t": 587.76491, "r": 161.3187, "b": 597.38091, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 91.685997, "t": 679.309799, "r": 129.77399, "b": 688.925797, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "Flexloc nut ", "bbox": {"l": 91.685997, "t": 679.309799, "r": 129.77399, "b": 688.925797, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 162.48109, "t": 679.309799, "r": 207.85629, "b": 688.925797, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "Fiber locknut ", "bbox": {"l": 162.48109, "t": 679.309799, "r": 207.85629, "b": 688.925797, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 237.31379999999996, "t": 679.309799, "r": 289.561, "b": 688.925797, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "Elastic stop nut ", "bbox": {"l": 237.31379999999996, "t": 679.309799, "r": 289.561, "b": 688.925797, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 216.9326, "t": 587.76491, "r": 277.7966, "b": 597.38091, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "Elastic anchor nut ", "bbox": {"l": 216.9326, "t": 587.76491, "r": 277.7966, "b": 597.38091, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "caption", "id": 12, "page_no": 0, "cluster": {"id": 12, "label": "caption", "bbox": {"l": 72.0, "t": 702.197601, "r": 184.14828, "b": 713.009598, "coord_origin": "TOPLEFT"}, "confidence": 0.9449448585510254, "cells": [{"id": 93, "text": "Figure 7-26. ", "bbox": {"l": 72.0, "t": 702.457596, "r": 119.12800000000001, "b": 713.009598, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "Self-locking nuts. ", "bbox": {"l": 119.4023, "t": 702.197601, "r": 184.14828, "b": 712.403599, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 7-26. Self-locking nuts."}, {"label": "caption", "id": 11, "page_no": 0, "cluster": {"id": 11, "label": "caption", "bbox": {"l": 321.0, "t": 700.177597, "r": 481.64931999999993, "b": 710.989597, "coord_origin": "TOPLEFT"}, "confidence": 0.9497622847557068, "cells": [{"id": 95, "text": "Figure 7-27. ", "bbox": {"l": 321.0, "t": 700.437599, "r": 368.12799, "b": 710.989597, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "Stainless steel self-locking nut. ", "bbox": {"l": 368.40231, "t": 700.177597, "r": 481.64931999999993, "b": 710.383598, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 7-27. Stainless steel self-locking nut."}, {"label": "page_footer", "id": 13, "page_no": 0, "cluster": {"id": 13, "label": "page_footer", "bbox": {"l": 537.98541, "t": 727.980301, "r": 560.77539, "b": 740.290298, "coord_origin": "TOPLEFT"}, "confidence": 0.9368568658828735, "cells": [{"id": 97, "text": "7-45 ", "bbox": {"l": 537.98541, "t": 727.980301, "r": 560.77539, "b": 740.290298, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "7-45"}], "body": [{"label": "text", "id": 8, "page_no": 0, "cluster": {"id": 8, "label": "text", "bbox": {"l": 71.992126, "t": 43.68364999999994, "r": 314.11212, "b": 92.65363000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9851651191711426, "cells": [{"id": 0, "text": "pulleys, provided the inner race of the bearing is clamped ", "bbox": {"l": 71.992126, "t": 43.68364999999994, "r": 300.23203, "b": 55.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "to the supporting structure by the nut and bolt. Plates must ", "bbox": {"l": 71.992126, "t": 56.18364999999994, "r": 302.00214, "b": 67.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "be attached to the structure in a positive manner to eliminate ", "bbox": {"l": 71.992126, "t": 68.68364999999994, "r": 309.82214, "b": 80.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "rotation or misalignment when tightening the bolts or screws. ", "bbox": {"l": 71.992126, "t": 81.18364999999994, "r": 314.11212, "b": 92.65363000000002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "pulleys, provided the inner race of the bearing is clamped to the supporting structure by the nut and bolt. Plates must be attached to the structure in a positive manner to eliminate rotation or misalignment when tightening the bolts or screws."}, {"label": "text", "id": 4, "page_no": 0, "cluster": {"id": 4, "label": "text", "bbox": {"l": 71.992302, "t": 106.18364999999994, "r": 313.1546, "b": 180.15363000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9873439073562622, "cells": [{"id": 4, "text": "The two general types of self-locking nuts currently in use ", "bbox": {"l": 71.992302, "t": 106.18364999999994, "r": 305.15311, "b": 117.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "are the all-metal type and the fiber lock type. For the sake of ", "bbox": {"l": 71.993103, "t": 118.68364999999994, "r": 309.98309, "b": 130.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "simplicity, only three typical kinds of self-locking nuts are ", "bbox": {"l": 71.993103, "t": 131.18364999999994, "r": 302.44312, "b": 142.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "considered in this handbook: the Boots self-locking and the ", "bbox": {"l": 71.993103, "t": 143.68364999999994, "r": 306.25311, "b": 155.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "stainless steel self-locking nuts, representing the all-metal ", "bbox": {"l": 71.993103, "t": 156.18364999999994, "r": 303.9931, "b": 167.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "types; and the elastic stop nut, representing ", "bbox": {"l": 71.993103, "t": 168.68364999999994, "r": 238.6723, "b": 180.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "the fiber insert type. ", "bbox": {"l": 234.26460000000003, "t": 168.68364999999994, "r": 313.1546, "b": 180.15363000000002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The two general types of self-locking nuts currently in use are the all-metal type and the fiber lock type. For the sake of simplicity, only three typical kinds of self-locking nuts are considered in this handbook: the Boots self-locking and the stainless steel self-locking nuts, representing the all-metal types; and the elastic stop nut, representing the fiber insert type."}, {"label": "section_header", "id": 14, "page_no": 0, "cluster": {"id": 14, "label": "section_header", "bbox": {"l": 71.992302, "t": 193.81359999999995, "r": 167.27231, "b": 205.15363000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9309079647064209, "cells": [{"id": 11, "text": "Boots Self-Locking Nut ", "bbox": {"l": 71.992302, "t": 193.81359999999995, "r": 167.27231, "b": 205.15363000000002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Boots Self-Locking Nut"}, {"label": "text", "id": 6, "page_no": 0, "cluster": {"id": 6, "label": "text", "bbox": {"l": 71.992294, "t": 208.18364999999994, "r": 318.49225, "b": 282.15362999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9866572022438049, "cells": [{"id": 12, "text": "The Boots self-locking nut is of one piece, all-metal ", "bbox": {"l": 71.992302, "t": 208.18364999999994, "r": 302.27719, "b": 219.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "construction designed to hold tight despite severe vibration. ", "bbox": {"l": 71.992294, "t": 220.68364999999994, "r": 313.33026, "b": 232.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Note in ", "bbox": {"l": 71.992294, "t": 233.18364999999994, "r": 104.12231, "b": 244.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Figure 7-26", "bbox": {"l": 104.12231, "t": 233.31359999999995, "r": 152.05231, "b": 244.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": " that it has two sections and is essentially ", "bbox": {"l": 152.05231, "t": 233.18364999999994, "r": 318.49225, "b": 244.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "two nuts in one: a locking nut and a load-carrying nut. The ", "bbox": {"l": 71.992294, "t": 245.68364999999994, "r": 309.42929, "b": 257.15363, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "two sections are connected with a spring, which is an integral ", "bbox": {"l": 71.992294, "t": 258.18364999999994, "r": 317.76227, "b": 269.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "part of the nut. ", "bbox": {"l": 71.992294, "t": 270.68361999999996, "r": 133.3723, "b": 282.15362999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The Boots self-locking nut is of one piece, all-metal construction designed to hold tight despite severe vibration. Note in Figure 7-26 that it has two sections and is essentially two nuts in one: a locking nut and a load-carrying nut. The two sections are connected with a spring, which is an integral part of the nut."}, {"label": "text", "id": 1, "page_no": 0, "cluster": {"id": 1, "label": "text", "bbox": {"l": 71.992294, "t": 295.68361999999996, "r": 316.65729, "b": 369.65362999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9881331324577332, "cells": [{"id": 20, "text": "The spring keeps the locking and load-carrying sections such ", "bbox": {"l": 71.992294, "t": 295.68361999999996, "r": 316.41028, "b": 307.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "a distance apart that the two sets of threads are out of phase ", "bbox": {"l": 71.992294, "t": 308.18361999999996, "r": 312.20731, "b": 319.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "or spaced so that a bolt, which has been screwed through the ", "bbox": {"l": 71.992294, "t": 320.68361999999996, "r": 316.65729, "b": 332.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "load-carrying section, must push the locking section outward ", "bbox": {"l": 71.992294, "t": 333.18361999999996, "r": 315.91229, "b": 344.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "against the force of the spring to engage the threads of the ", "bbox": {"l": 71.992294, "t": 345.68361999999996, "r": 306.34927, "b": 357.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "locking section properly. ", "bbox": {"l": 71.992294, "t": 358.18361999999996, "r": 174.2023, "b": 369.65362999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The spring keeps the locking and load-carrying sections such a distance apart that the two sets of threads are out of phase or spaced so that a bolt, which has been screwed through the load-carrying section, must push the locking section outward against the force of the spring to engage the threads of the locking section properly."}, {"label": "text", "id": 0, "page_no": 0, "cluster": {"id": 0, "label": "text", "bbox": {"l": 71.992294, "t": 383.18361999999996, "r": 318.81229, "b": 482.15363, "coord_origin": "TOPLEFT"}, "confidence": 0.9882921576499939, "cells": [{"id": 26, "text": "The spring, through the medium of the locking section, exerts ", "bbox": {"l": 71.992294, "t": 383.18361999999996, "r": 317.07227, "b": 394.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "a constant locking force on the bolt in the same direction as a ", "bbox": {"l": 71.992294, "t": 395.68361999999996, "r": 318.81229, "b": 407.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "force that would tighten the nut. In this nut, the load-carrying ", "bbox": {"l": 71.992294, "t": 408.18361999999996, "r": 317.5123, "b": 419.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "section has the thread strength of a standard nut of comparable ", "bbox": {"l": 71.992294, "t": 420.68361999999996, "r": 317.31229, "b": 432.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "size, while the locking section presses against the threads of ", "bbox": {"l": 71.992294, "t": 433.18361999999996, "r": 314.45929, "b": 444.65363, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "the bolt and locks the nut firmly in position. Only a wrench ", "bbox": {"l": 71.992294, "t": 445.68362, "r": 311.7023, "b": 457.15363, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "applied to the nut loosens it. The nut can be removed and ", "bbox": {"l": 71.992294, "t": 458.18362, "r": 303.35229, "b": 469.65363, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "reused without impairing its efficiency. ", "bbox": {"l": 71.992294, "t": 470.68362, "r": 231.97228999999996, "b": 482.15363, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The spring, through the medium of the locking section, exerts a constant locking force on the bolt in the same direction as a force that would tighten the nut. In this nut, the load-carrying section has the thread strength of a standard nut of comparable size, while the locking section presses against the threads of the bolt and locks the nut firmly in position. Only a wrench applied to the nut loosens it. The nut can be removed and reused without impairing its efficiency."}, {"label": "text", "id": 9, "page_no": 0, "cluster": {"id": 9, "label": "text", "bbox": {"l": 71.992294, "t": 495.68362, "r": 313.91229, "b": 519.65363, "coord_origin": "TOPLEFT"}, "confidence": 0.9695363640785217, "cells": [{"id": 34, "text": "Boots self-locking nuts are made with three different spring ", "bbox": {"l": 71.992294, "t": 495.68362, "r": 313.34229, "b": 507.15363, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "styles and in various shapes and sizes. The wing type that is ", "bbox": {"l": 71.992294, "t": 508.18362, "r": 313.91229, "b": 519.65363, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Boots self-locking nuts are made with three different spring styles and in various shapes and sizes. The wing type that is"}, {"label": "text", "id": 5, "page_no": 0, "cluster": {"id": 5, "label": "text", "bbox": {"l": 320.99231, "t": 43.68364999999994, "r": 561.80835, "b": 117.65363000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9870070219039917, "cells": [{"id": 36, "text": "the most common ranges in size for No. 6 up to ", "bbox": {"l": 320.99231, "t": 43.68364999999994, "r": 513.74628, "b": 55.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "1", "bbox": {"l": 514.06342, "t": 44.52013999999997, "r": 516.81342, "b": 50.828610000000026, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "\u2044", "bbox": {"l": 516.81342, "t": 43.68364999999994, "r": 518.4834, "b": 55.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "4", "bbox": {"l": 518.25842, "t": 47.72014999999999, "r": 523.00525, "b": 54.02863000000002, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "inch, the ", "bbox": {"l": 525.37872, "t": 47.72014999999999, "r": 560.44843, "b": 54.02863000000002, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Rol-top ranges from ", "bbox": {"l": 320.99841, "t": 56.18364999999994, "r": 404.58441, "b": 67.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "1", "bbox": {"l": 404.48981, "t": 57.02013999999997, "r": 407.23981, "b": 63.328610000000026, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "\u2044", "bbox": {"l": 407.23981, "t": 56.18364999999994, "r": 408.90982, "b": 67.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "4", "bbox": {"l": 408.68481, "t": 60.22014999999999, "r": 413.38376, "b": 66.52863000000002, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "inch to ", "bbox": {"l": 415.73322, "t": 60.22014999999999, "r": 443.92681999999996, "b": 66.52863000000002, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "1", "bbox": {"l": 443.82598999999993, "t": 57.02013999999997, "r": 446.57598999999993, "b": 63.328610000000026, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "\u2044", "bbox": {"l": 446.57598999999993, "t": 56.18364999999994, "r": 448.24600000000004, "b": 67.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "6", "bbox": {"l": 448.22588999999994, "t": 60.22014999999999, "r": 453.12659, "b": 66.52863000000002, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "inch, and the bellows type ", "bbox": {"l": 455.57697, "t": 60.22014999999999, "r": 560.6579, "b": 66.52863000000002, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "ranges in size from No. 8 up to ", "bbox": {"l": 320.99591, "t": 68.68364999999994, "r": 447.36591000000004, "b": 80.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "3", "bbox": {"l": 448.79668999999996, "t": 69.52013999999997, "r": 451.54668999999996, "b": 75.82861000000003, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "\u2044", "bbox": {"l": 451.50549, "t": 68.68364999999994, "r": 453.17551, "b": 80.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "8", "bbox": {"l": 453.17542000000003, "t": 72.72014999999999, "r": 458.07175000000007, "b": 79.02863000000002, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "inch. Wing-type nuts are ", "bbox": {"l": 460.51993, "t": 72.72014999999999, "r": 559.78839, "b": 79.02863000000002, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "made of anodized aluminum alloy, cadmium-plated carbon ", "bbox": {"l": 320.99542, "t": 81.18364999999994, "r": 559.77844, "b": 92.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "steel, or stainless steel. The Rol-top nut is cadmium-plated ", "bbox": {"l": 320.99542, "t": 93.68364999999994, "r": 557.87738, "b": 105.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "steel, and the bellows type is made of aluminum alloy only. ", "bbox": {"l": 320.99542, "t": 106.18364999999994, "r": 561.80835, "b": 117.65363000000002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "the most common ranges in size for No. 6 up to 1 / 4 inch, the Rol-top ranges from 1 / 4 inch to 1 / 6 inch, and the bellows type ranges in size from No. 8 up to 3 / 8 inch. Wing-type nuts are made of anodized aluminum alloy, cadmium-plated carbon steel, or stainless steel. The Rol-top nut is cadmium-plated steel, and the bellows type is made of aluminum alloy only."}, {"label": "text", "id": 17, "page_no": 0, "cluster": {"id": 17, "label": "text", "bbox": {"l": 320.99542, "t": 118.68364999999994, "r": 325.99542, "b": 130.15363000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": ". ", "bbox": {"l": 320.99542, "t": 118.68364999999994, "r": 325.99542, "b": 130.15363000000002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "."}, {"label": "section_header", "id": 15, "page_no": 0, "cluster": {"id": 15, "label": "section_header", "bbox": {"l": 320.99542, "t": 131.31359999999995, "r": 450.99542, "b": 142.65363000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9263731241226196, "cells": [{"id": 59, "text": "Stainless Steel Self-Locking Nut ", "bbox": {"l": 320.99542, "t": 131.31359999999995, "r": 450.99542, "b": 142.65363000000002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Stainless Steel Self-Locking Nut"}, {"label": "text", "id": 3, "page_no": 0, "cluster": {"id": 3, "label": "text", "bbox": {"l": 320.99542, "t": 145.68364999999994, "r": 568.00439, "b": 357.15362999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9879258871078491, "cells": [{"id": 60, "text": "The stainless steel self-locking nut may be spun on and off ", "bbox": {"l": 320.99542, "t": 145.68364999999994, "r": 558.39838, "b": 157.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "by hand as its locking action takes places only when the ", "bbox": {"l": 320.99542, "t": 158.18364999999994, "r": 547.92542, "b": 169.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "nut is seated against a solid surface and tightened. The nut ", "bbox": {"l": 320.99542, "t": 170.68364999999994, "r": 556.50842, "b": 182.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "consists of two parts: a case with a beveled locking shoulder ", "bbox": {"l": 320.99542, "t": 183.18364999999994, "r": 565.11346, "b": 194.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "and key and a thread insert with a locking shoulder and ", "bbox": {"l": 320.99542, "t": 195.68364999999994, "r": 547.93744, "b": 207.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "slotted keyway. Until the nut is tightened, it spins on the ", "bbox": {"l": 320.99542, "t": 208.18364999999994, "r": 549.00647, "b": 219.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "bolt easily, because the threaded insert is the proper size ", "bbox": {"l": 320.99542, "t": 220.68364999999994, "r": 549.0755, "b": 232.15363000000002, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "for the bolt. However, when the nut is seated against a solid ", "bbox": {"l": 320.99542, "t": 233.18364999999994, "r": 562.60242, "b": 244.65363000000002, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "surface and tightened, the locking shoulder of the insert is ", "bbox": {"l": 320.99542, "t": 245.68364999999994, "r": 555.11243, "b": 257.15363, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "pulled downward and wedged against the locking shoulder ", "bbox": {"l": 320.99542, "t": 258.18364999999994, "r": 558.74146, "b": 269.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "of the case. This action compresses the threaded insert and ", "bbox": {"l": 320.99542, "t": 270.68361999999996, "r": 557.88538, "b": 282.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "causes it to clench the bolt tightly. The cross-sectional view ", "bbox": {"l": 320.99542, "t": 283.18361999999996, "r": 562.3114, "b": 294.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "in ", "bbox": {"l": 320.99542, "t": 295.68361999999996, "r": 331.27542, "b": 307.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "Figure 7-27", "bbox": {"l": 331.81543, "t": 295.81363000000005, "r": 379.86542, "b": 307.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": " shows how the key of the case fits into the ", "bbox": {"l": 379.86542, "t": 295.68361999999996, "r": 554.56543, "b": 307.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "slotted keyway of the insert so that when the case is turned, ", "bbox": {"l": 320.99542, "t": 308.18361999999996, "r": 561.16339, "b": 319.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "the threaded insert is turned with it. Note that the slot is wider ", "bbox": {"l": 320.99542, "t": 320.68361999999996, "r": 568.00439, "b": 332.15362999999996, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "than the key. This permits the slot to be narrowed and the ", "bbox": {"l": 320.99542, "t": 333.18361999999996, "r": 553.46545, "b": 344.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "insert to be compressed when the nut is tightened. ", "bbox": {"l": 320.99542, "t": 345.68361999999996, "r": 523.19543, "b": 357.15362999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The stainless steel self-locking nut may be spun on and off by hand as its locking action takes places only when the nut is seated against a solid surface and tightened. The nut consists of two parts: a case with a beveled locking shoulder and key and a thread insert with a locking shoulder and slotted keyway. Until the nut is tightened, it spins on the bolt easily, because the threaded insert is the proper size for the bolt. However, when the nut is seated against a solid surface and tightened, the locking shoulder of the insert is pulled downward and wedged against the locking shoulder of the case. This action compresses the threaded insert and causes it to clench the bolt tightly. The cross-sectional view in Figure 7-27 shows how the key of the case fits into the slotted keyway of the insert so that when the case is turned, the threaded insert is turned with it. Note that the slot is wider than the key. This permits the slot to be narrowed and the insert to be compressed when the nut is tightened."}, {"label": "section_header", "id": 16, "page_no": 0, "cluster": {"id": 16, "label": "section_header", "bbox": {"l": 320.99542, "t": 370.81363000000005, "r": 388.50543, "b": 382.15362999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9253152012825012, "cells": [{"id": 79, "text": "Elastic Stop Nut ", "bbox": {"l": 320.99542, "t": 370.81363000000005, "r": 388.50543, "b": 382.15362999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Elastic Stop Nut"}, {"label": "text", "id": 10, "page_no": 0, "cluster": {"id": 10, "label": "text", "bbox": {"l": 320.99542, "t": 385.18361999999996, "r": 552.35132, "b": 409.15362999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9676451683044434, "cells": [{"id": 80, "text": "The elastic stop nut is a standard nut with the height ", "bbox": {"l": 320.99542, "t": 385.18361999999996, "r": 548.72437, "b": 396.65362999999996, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "increased to accommodate a fiber locking collar. This ", "bbox": {"l": 320.99542, "t": 397.68361999999996, "r": 552.35132, "b": 409.15362999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The elastic stop nut is a standard nut with the height increased to accommodate a fiber locking collar. This"}, {"label": "picture", "id": 2, "page_no": 0, "cluster": {"id": 2, "label": "picture", "bbox": {"l": 320.4467468261719, "t": 421.640625, "r": 558.8576049804688, "b": 692.310791015625, "coord_origin": "TOPLEFT"}, "confidence": 0.9881086945533752, "cells": [{"id": 82, "text": "Tightened nut ", "bbox": {"l": 479.1354999999999, "t": 672.7346, "r": 531.16748, "b": 682.646599, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "Untightened nut ", "bbox": {"l": 474.3699, "t": 531.8918, "r": 535.23389, "b": 541.8037999999999, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "Nut case ", "bbox": {"l": 456.7558900000001, "t": 431.99741, "r": 487.08388999999994, "b": 441.6134, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "Threaded nut core ", "bbox": {"l": 434.62299, "t": 577.8235, "r": 497.47183000000007, "b": 587.4395, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "Locking shoulder ", "bbox": {"l": 448.55081, "t": 553.3206, "r": 507.686, "b": 562.9366, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Keyway ", "bbox": {"l": 424.78421, "t": 664.1116, "r": 452.10339000000005, "b": 673.7275999999999, "coord_origin": "TOPLEFT"}}], "children": [{"id": 18, "label": "text", "bbox": {"l": 479.1354999999999, "t": 672.7346, "r": 531.16748, "b": 682.646599, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "Tightened nut ", "bbox": {"l": 479.1354999999999, "t": 672.7346, "r": 531.16748, "b": 682.646599, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 474.3699, "t": 531.8918, "r": 535.23389, "b": 541.8037999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "Untightened nut ", "bbox": {"l": 474.3699, "t": 531.8918, "r": 535.23389, "b": 541.8037999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 456.7558900000001, "t": 431.99741, "r": 487.08388999999994, "b": 441.6134, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "Nut case ", "bbox": {"l": 456.7558900000001, "t": 431.99741, "r": 487.08388999999994, "b": 441.6134, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 434.62299, "t": 577.8235, "r": 497.47183000000007, "b": 587.4395, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "Threaded nut core ", "bbox": {"l": 434.62299, "t": 577.8235, "r": 497.47183000000007, "b": 587.4395, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 448.55081, "t": 553.3206, "r": 507.686, "b": 562.9366, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "Locking shoulder ", "bbox": {"l": 448.55081, "t": 553.3206, "r": 507.686, "b": 562.9366, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 424.78421, "t": 664.1116, "r": 452.10339000000005, "b": 673.7275999999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "Keyway ", "bbox": {"l": 424.78421, "t": 664.1116, "r": 452.10339000000005, "b": 673.7275999999999, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "picture", "id": 7, "page_no": 0, "cluster": {"id": 7, "label": "picture", "bbox": {"l": 70.59269714355469, "t": 531.2222290039062, "r": 309.863037109375, "b": 694.3909912109375, "coord_origin": "TOPLEFT"}, "confidence": 0.9858751893043518, "cells": [{"id": 88, "text": "Boots aircraft nut ", "bbox": {"l": 102.4155, "t": 587.76491, "r": 161.3187, "b": 597.38091, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "Flexloc nut ", "bbox": {"l": 91.685997, "t": 679.309799, "r": 129.77399, "b": 688.925797, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "Fiber locknut ", "bbox": {"l": 162.48109, "t": 679.309799, "r": 207.85629, "b": 688.925797, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "Elastic stop nut ", "bbox": {"l": 237.31379999999996, "t": 679.309799, "r": 289.561, "b": 688.925797, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "Elastic anchor nut ", "bbox": {"l": 216.9326, "t": 587.76491, "r": 277.7966, "b": 597.38091, "coord_origin": "TOPLEFT"}}], "children": [{"id": 24, "label": "text", "bbox": {"l": 102.4155, "t": 587.76491, "r": 161.3187, "b": 597.38091, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "Boots aircraft nut ", "bbox": {"l": 102.4155, "t": 587.76491, "r": 161.3187, "b": 597.38091, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 91.685997, "t": 679.309799, "r": 129.77399, "b": 688.925797, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "Flexloc nut ", "bbox": {"l": 91.685997, "t": 679.309799, "r": 129.77399, "b": 688.925797, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 162.48109, "t": 679.309799, "r": 207.85629, "b": 688.925797, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "Fiber locknut ", "bbox": {"l": 162.48109, "t": 679.309799, "r": 207.85629, "b": 688.925797, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 237.31379999999996, "t": 679.309799, "r": 289.561, "b": 688.925797, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "Elastic stop nut ", "bbox": {"l": 237.31379999999996, "t": 679.309799, "r": 289.561, "b": 688.925797, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 216.9326, "t": 587.76491, "r": 277.7966, "b": 597.38091, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "Elastic anchor nut ", "bbox": {"l": 216.9326, "t": 587.76491, "r": 277.7966, "b": 597.38091, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "caption", "id": 12, "page_no": 0, "cluster": {"id": 12, "label": "caption", "bbox": {"l": 72.0, "t": 702.197601, "r": 184.14828, "b": 713.009598, "coord_origin": "TOPLEFT"}, "confidence": 0.9449448585510254, "cells": [{"id": 93, "text": "Figure 7-26. ", "bbox": {"l": 72.0, "t": 702.457596, "r": 119.12800000000001, "b": 713.009598, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "Self-locking nuts. ", "bbox": {"l": 119.4023, "t": 702.197601, "r": 184.14828, "b": 712.403599, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 7-26. Self-locking nuts."}, {"label": "caption", "id": 11, "page_no": 0, "cluster": {"id": 11, "label": "caption", "bbox": {"l": 321.0, "t": 700.177597, "r": 481.64931999999993, "b": 710.989597, "coord_origin": "TOPLEFT"}, "confidence": 0.9497622847557068, "cells": [{"id": 95, "text": "Figure 7-27. ", "bbox": {"l": 321.0, "t": 700.437599, "r": 368.12799, "b": 710.989597, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "Stainless steel self-locking nut. ", "bbox": {"l": 368.40231, "t": 700.177597, "r": 481.64931999999993, "b": 710.383598, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 7-27. Stainless steel self-locking nut."}], "headers": [{"label": "page_footer", "id": 13, "page_no": 0, "cluster": {"id": 13, "label": "page_footer", "bbox": {"l": 537.98541, "t": 727.980301, "r": 560.77539, "b": 740.290298, "coord_origin": "TOPLEFT"}, "confidence": 0.9368568658828735, "cells": [{"id": 97, "text": "7-45 ", "bbox": {"l": 537.98541, "t": 727.980301, "r": 560.77539, "b": 740.290298, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "7-45"}]}}]
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v2/bmj_sample.xml.itxt b/tests/data/groundtruth/docling_v2/bmj_sample.xml.itxt
new file mode 100644
index 00000000..88a44483
--- /dev/null
+++ b/tests/data/groundtruth/docling_v2/bmj_sample.xml.itxt
@@ -0,0 +1,70 @@
+item-0 at level 0: unspecified: group _root_
+  item-1 at level 1: title: Evolving general practice consul ...  Britain: issues of length and context
+    item-2 at level 2: paragraph: George K Freeman, John P Horder, ... on P Hill, Nayan C Shah, Andrew Wilson
+    item-3 at level 2: paragraph: Centre for Primary Care and Soci ... ersity of Leicester, Leicester LE5 4PW
+    item-4 at level 2: text: In 1999 Shah1 and others said th ...  per consultation in general practice?
+    item-5 at level 2: text: We report on the outcome of exte ...  review identified 14 relevant papers.
+    item-6 at level 2: section_header: Summary points
+      item-7 at level 3: list: group list
+        item-8 at level 4: list_item: Longer consultations are associa ... ith a range of better patient outcomes
+        item-9 at level 4: list_item: Modern consultations in general  ... th more serious and chronic conditions
+        item-10 at level 4: list_item: Increasing patient participation ...  interaction, which demands extra time
+        item-11 at level 4: list_item: Difficulties with access and wit ... e and lead to further pressure on time
+        item-12 at level 4: list_item: Longer consultations should be a ... t to maximise interpersonal continuity
+        item-13 at level 4: list_item: Research on implementation is needed
+    item-14 at level 2: section_header: Longer consultations: benefits for patients
+      item-15 at level 3: text: The systematic review consistent ... ther some doctors insist on more time.
+      item-16 at level 3: text: A national survey in 1998 report ... s the effects of their own experience.
+    item-17 at level 2: section_header: Context of modern consultations
+      item-18 at level 3: text: Shorter consultations were more  ...  potential length of the consultation.
+    item-19 at level 2: section_header: Participatory consultation style
+      item-20 at level 3: text: The most effective consultations ... style usually lengthens consultations.
+    item-21 at level 2: section_header: Extended professional agenda
+      item-22 at level 3: text: The traditional consultation in  ... agerial expectations of good practice.
+      item-23 at level 3: text: Adequate time is essential. It m ...  inevitably leads to pressure on time.
+    item-24 at level 2: section_header: Access problems
+      item-25 at level 3: text: In a service free at the point o ... ort notice squeeze consultation times.
+      item-26 at level 3: text: While appointment systems can an ...  for the inadequate access to doctors.
+      item-27 at level 3: text: In response to perception of del ... ntation is currently being negotiated.
+      item-28 at level 3: text: Virtually all patients think tha ... e that is free at the point of access.
+      item-29 at level 3: text: A further government initiative  ... ealth advice and first line treatment.
+    item-30 at level 2: section_header: Loss of interpersonal continuity
+      item-31 at level 3: text: If a patient has to consult seve ... unning and professional frustration.18
+      item-32 at level 3: text: Mechanic described how loss of l ... patient and professional satisfaction.
+    item-33 at level 2: section_header: Health service reforms
+      item-34 at level 3: text: Finally, for the past 15 years t ... ents and staff) and what is delivered.
+    item-35 at level 2: section_header: The future
+      item-36 at level 3: text: We think that the way ahead must ... p further the care of chronic disease.
+      item-37 at level 3: text: The challenge posed to general p ... ermedicalisation need to be exploited.
+      item-38 at level 3: text: We must ensure better communicat ... between planned and ad hoc consulting.
+    item-39 at level 2: section_header: Next steps
+      item-40 at level 3: text: General practitioners do not beh ... ailable time in complex consultations.
+      item-41 at level 3: text: Devising appropriate incentives  ... and interpersonal knowledge and trust.
+    item-42 at level 2: section_header: Acknowledgments
+      item-43 at level 3: text: We thank the other members of th ... Practitioners for administrative help.
+    item-44 at level 2: section_header: References
+      item-45 at level 3: list: group list
+        item-46 at level 4: list_item: Shah NC. Viewpoint: Consultation ... y men!”. Br J Gen Pract 49:497 (1999).
+        item-47 at level 4: list_item: Mechanic D. How should hamsters  ... BMJ 323:266–268 (2001). PMID: 11485957
+        item-48 at level 4: list_item: Howie JGR, Porter AMD, Heaney DJ ... n Pract 41:48–54 (1991). PMID: 2031735
+        item-49 at level 4: list_item: Howie JGR, Heaney DJ, Maxwell M, ... BMJ 319:738–743 (1999). PMID: 10487999
+        item-50 at level 4: list_item: Kaplan SH, Greenfield S, Ware JE ... c disease. Med Care 27:110–125 (1989).
+        item-51 at level 4: list_item: Airey C, Erens B. National surve ... e, 1998. London: NHS Executive (1999).
+        item-52 at level 4: list_item: Hart JT. Expectations of health  ... h Expect 1:3–13 (1998). PMID: 11281857
+        item-53 at level 4: list_item: Tuckett D, Boulton M, Olson C, W ... London: Tavistock Publications (1985).
+        item-54 at level 4: list_item: General Medical Council. Draft r ... ctors/index.htm (accessed 2 Jan 2002).
+        item-55 at level 4: list_item: Balint M. The doctor, his patien ... the illness. London: Tavistock (1957).
+        item-56 at level 4: list_item: Stott NCH, Davies RH. The except ...  J R Coll Gen Pract 29:210–205 (1979).
+        item-57 at level 4: list_item: Hill AP, Hill AP. Challenges for ... nium. London: King's Fund75–86 (2000).
+        item-58 at level 4: list_item: National service framework for c ... . London: Department of Health (2000).
+        item-59 at level 4: list_item: Hart JT. A new kind of doctor: t ... ommunity. London: Merlin Press (1988).
+        item-60 at level 4: list_item: Morrison I, Smith R. Hamster hea ... J 321:1541–1542 (2000). PMID: 11124164
+        item-61 at level 4: list_item: Arber S, Sawyer L. Do appointmen ...  BMJ 284:478–480 (1982). PMID: 6800503
+        item-62 at level 4: list_item: Hjortdahl P, Borchgrevink CF. Co ... MJ 303:1181–1184 (1991). PMID: 1747619
+        item-63 at level 4: list_item: Howie JGR, Hopton JL, Heaney DJ, ... Pract 42:181–185 (1992). PMID: 1389427
+        item-64 at level 4: list_item: Freeman G, Shepperd S, Robinson  ... ), Summer 2000. London: NCCSDO (2001).
+        item-65 at level 4: list_item: Wilson A, McDonald P, Hayes L, C ... Pract 41:184–187 (1991). PMID: 1878267
+        item-66 at level 4: list_item: De Maeseneer J, Hjortdahl P, Sta ... J 320:1616–1617 (2000). PMID: 10856043
+        item-67 at level 4: list_item: Freeman G, Hjortdahl P. What fut ... MJ 314:1870–1873 (1997). PMID: 9224130
+        item-68 at level 4: list_item: Kibbe DC, Bentz E, McLaughlin CP ... Pract 36:304–308 (1993). PMID: 8454977
+        item-69 at level 4: list_item: Williams M, Neal RD. Time for a  ... ct 48:1783–1786 (1998). PMID: 10198490
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v2/bmj_sample.xml.json b/tests/data/groundtruth/docling_v2/bmj_sample.xml.json
new file mode 100644
index 00000000..cd98e064
--- /dev/null
+++ b/tests/data/groundtruth/docling_v2/bmj_sample.xml.json
@@ -0,0 +1,1080 @@
+{
+  "schema_name": "DoclingDocument",
+  "version": "1.0.0",
+  "name": "bmj_sample",
+  "origin": {
+    "mimetype": "application/xml",
+    "binary_hash": 2961779396863376371,
+    "filename": "bmj_sample.xml"
+  },
+  "furniture": {
+    "self_ref": "#/furniture",
+    "children": [],
+    "name": "_root_",
+    "label": "unspecified"
+  },
+  "body": {
+    "self_ref": "#/body",
+    "children": [
+      {
+        "$ref": "#/texts/0"
+      }
+    ],
+    "name": "_root_",
+    "label": "unspecified"
+  },
+  "groups": [
+    {
+      "self_ref": "#/groups/0",
+      "parent": {
+        "$ref": "#/texts/5"
+      },
+      "children": [
+        {
+          "$ref": "#/texts/6"
+        },
+        {
+          "$ref": "#/texts/7"
+        },
+        {
+          "$ref": "#/texts/8"
+        },
+        {
+          "$ref": "#/texts/9"
+        },
+        {
+          "$ref": "#/texts/10"
+        },
+        {
+          "$ref": "#/texts/11"
+        }
+      ],
+      "name": "list",
+      "label": "list"
+    },
+    {
+      "self_ref": "#/groups/1",
+      "parent": {
+        "$ref": "#/texts/42"
+      },
+      "children": [
+        {
+          "$ref": "#/texts/43"
+        },
+        {
+          "$ref": "#/texts/44"
+        },
+        {
+          "$ref": "#/texts/45"
+        },
+        {
+          "$ref": "#/texts/46"
+        },
+        {
+          "$ref": "#/texts/47"
+        },
+        {
+          "$ref": "#/texts/48"
+        },
+        {
+          "$ref": "#/texts/49"
+        },
+        {
+          "$ref": "#/texts/50"
+        },
+        {
+          "$ref": "#/texts/51"
+        },
+        {
+          "$ref": "#/texts/52"
+        },
+        {
+          "$ref": "#/texts/53"
+        },
+        {
+          "$ref": "#/texts/54"
+        },
+        {
+          "$ref": "#/texts/55"
+        },
+        {
+          "$ref": "#/texts/56"
+        },
+        {
+          "$ref": "#/texts/57"
+        },
+        {
+          "$ref": "#/texts/58"
+        },
+        {
+          "$ref": "#/texts/59"
+        },
+        {
+          "$ref": "#/texts/60"
+        },
+        {
+          "$ref": "#/texts/61"
+        },
+        {
+          "$ref": "#/texts/62"
+        },
+        {
+          "$ref": "#/texts/63"
+        },
+        {
+          "$ref": "#/texts/64"
+        },
+        {
+          "$ref": "#/texts/65"
+        },
+        {
+          "$ref": "#/texts/66"
+        }
+      ],
+      "name": "list",
+      "label": "list"
+    }
+  ],
+  "texts": [
+    {
+      "self_ref": "#/texts/0",
+      "parent": {
+        "$ref": "#/body"
+      },
+      "children": [
+        {
+          "$ref": "#/texts/1"
+        },
+        {
+          "$ref": "#/texts/2"
+        },
+        {
+          "$ref": "#/texts/3"
+        },
+        {
+          "$ref": "#/texts/4"
+        },
+        {
+          "$ref": "#/texts/5"
+        },
+        {
+          "$ref": "#/texts/12"
+        },
+        {
+          "$ref": "#/texts/15"
+        },
+        {
+          "$ref": "#/texts/17"
+        },
+        {
+          "$ref": "#/texts/19"
+        },
+        {
+          "$ref": "#/texts/22"
+        },
+        {
+          "$ref": "#/texts/28"
+        },
+        {
+          "$ref": "#/texts/31"
+        },
+        {
+          "$ref": "#/texts/33"
+        },
+        {
+          "$ref": "#/texts/37"
+        },
+        {
+          "$ref": "#/texts/40"
+        },
+        {
+          "$ref": "#/texts/42"
+        }
+      ],
+      "label": "title",
+      "prov": [],
+      "orig": "Evolving general practice consultation in Britain: issues of length and context",
+      "text": "Evolving general practice consultation in Britain: issues of length and context"
+    },
+    {
+      "self_ref": "#/texts/1",
+      "parent": {
+        "$ref": "#/texts/0"
+      },
+      "children": [],
+      "label": "paragraph",
+      "prov": [],
+      "orig": "George K Freeman, John P Horder, John G R Howie, A Pali Hungin, Alison P Hill, Nayan C Shah, Andrew Wilson",
+      "text": "George K Freeman, John P Horder, John G R Howie, A Pali Hungin, Alison P Hill, Nayan C Shah, Andrew Wilson"
+    },
+    {
+      "self_ref": "#/texts/2",
+      "parent": {
+        "$ref": "#/texts/0"
+      },
+      "children": [],
+      "label": "paragraph",
+      "prov": [],
+      "orig": "Centre for Primary Care and Social Medicine, Imperial College of Science, Technology and Medicine, London W6 8RP; Royal College of General Practitioners, London SW7 1PU; Department of General Practice, University of Edinburgh, Edinburgh EH8 9DX; Centre for Health Studies, University of Durham, Durham DH1 3HN; Kilburn Park Medical Centre, London NW6; Department of General Practice and Primary Health Care, University of Leicester, Leicester LE5 4PW",
+      "text": "Centre for Primary Care and Social Medicine, Imperial College of Science, Technology and Medicine, London W6 8RP; Royal College of General Practitioners, London SW7 1PU; Department of General Practice, University of Edinburgh, Edinburgh EH8 9DX; Centre for Health Studies, University of Durham, Durham DH1 3HN; Kilburn Park Medical Centre, London NW6; Department of General Practice and Primary Health Care, University of Leicester, Leicester LE5 4PW"
+    },
+    {
+      "self_ref": "#/texts/3",
+      "parent": {
+        "$ref": "#/texts/0"
+      },
+      "children": [],
+      "label": "text",
+      "prov": [],
+      "orig": "In 1999 Shah1 and others said that the Royal College of General Practitioners should advocate longer consultations in general practice as a matter of policy. The college set up a working group chaired by A P Hungin, and a systematic review of literature on consultation length in general practice was commissioned. The working group agreed that the available evidence would be hard to interpret without discussion of the changing context within which consultations now take place. For many years general practitioners and those who have surveyed patients' opinions in the United Kingdom have complained about short consultation time, despite a steady increase in actual mean length. Recently Mechanic pointed out that this is also true in the United States.2 Is there any justification for a further increase in mean time allocated per consultation in general practice?",
+      "text": "In 1999 Shah1 and others said that the Royal College of General Practitioners should advocate longer consultations in general practice as a matter of policy. The college set up a working group chaired by A P Hungin, and a systematic review of literature on consultation length in general practice was commissioned. The working group agreed that the available evidence would be hard to interpret without discussion of the changing context within which consultations now take place. For many years general practitioners and those who have surveyed patients' opinions in the United Kingdom have complained about short consultation time, despite a steady increase in actual mean length. Recently Mechanic pointed out that this is also true in the United States.2 Is there any justification for a further increase in mean time allocated per consultation in general practice?"
+    },
+    {
+      "self_ref": "#/texts/4",
+      "parent": {
+        "$ref": "#/texts/0"
+      },
+      "children": [],
+      "label": "text",
+      "prov": [],
+      "orig": "We report on the outcome of extensive debate among a group of general practitioners with an interest in the process of care, with reference to the interim findings of the commissioned systematic review and our personal databases. The review identified 14 relevant papers.",
+      "text": "We report on the outcome of extensive debate among a group of general practitioners with an interest in the process of care, with reference to the interim findings of the commissioned systematic review and our personal databases. The review identified 14 relevant papers."
+    },
+    {
+      "self_ref": "#/texts/5",
+      "parent": {
+        "$ref": "#/texts/0"
+      },
+      "children": [
+        {
+          "$ref": "#/groups/0"
+        }
+      ],
+      "label": "section_header",
+      "prov": [],
+      "orig": "Summary points",
+      "text": "Summary points",
+      "level": 1
+    },
+    {
+      "self_ref": "#/texts/6",
+      "parent": {
+        "$ref": "#/groups/0"
+      },
+      "children": [],
+      "label": "list_item",
+      "prov": [],
+      "orig": "Longer consultations are associated with a range of better patient outcomes",
+      "text": "Longer consultations are associated with a range of better patient outcomes",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/7",
+      "parent": {
+        "$ref": "#/groups/0"
+      },
+      "children": [],
+      "label": "list_item",
+      "prov": [],
+      "orig": "Modern consultations in general practice deal with patients with more serious and chronic conditions",
+      "text": "Modern consultations in general practice deal with patients with more serious and chronic conditions",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/8",
+      "parent": {
+        "$ref": "#/groups/0"
+      },
+      "children": [],
+      "label": "list_item",
+      "prov": [],
+      "orig": "Increasing patient participation means more complex interaction, which demands extra time",
+      "text": "Increasing patient participation means more complex interaction, which demands extra time",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/9",
+      "parent": {
+        "$ref": "#/groups/0"
+      },
+      "children": [],
+      "label": "list_item",
+      "prov": [],
+      "orig": "Difficulties with access and with loss of continuity add to perceived stress and poor performance and lead to further pressure on time",
+      "text": "Difficulties with access and with loss of continuity add to perceived stress and poor performance and lead to further pressure on time",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/10",
+      "parent": {
+        "$ref": "#/groups/0"
+      },
+      "children": [],
+      "label": "list_item",
+      "prov": [],
+      "orig": "Longer consultations should be a professional priority, combined with increased use of technology and more flexible practice management to maximise interpersonal continuity",
+      "text": "Longer consultations should be a professional priority, combined with increased use of technology and more flexible practice management to maximise interpersonal continuity",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/11",
+      "parent": {
+        "$ref": "#/groups/0"
+      },
+      "children": [],
+      "label": "list_item",
+      "prov": [],
+      "orig": "Research on implementation is needed",
+      "text": "Research on implementation is needed",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/12",
+      "parent": {
+        "$ref": "#/texts/0"
+      },
+      "children": [
+        {
+          "$ref": "#/texts/13"
+        },
+        {
+          "$ref": "#/texts/14"
+        }
+      ],
+      "label": "section_header",
+      "prov": [],
+      "orig": "Longer consultations: benefits for patients",
+      "text": "Longer consultations: benefits for patients",
+      "level": 1
+    },
+    {
+      "self_ref": "#/texts/13",
+      "parent": {
+        "$ref": "#/texts/12"
+      },
+      "children": [],
+      "label": "text",
+      "prov": [],
+      "orig": "The systematic review consistently showed that doctors with longer consultation times prescribe less and offer more advice on lifestyle and other health promoting activities. Longer consultations have been significantly associated with better recognition and handling of psychosocial problems3 and with better patient enablement.4 Also clinical care for some chronic illnesses is better in practices with longer booked intervals between one appointment and the next.5 It is not clear whether time is itself the main influence or whether some doctors insist on more time.",
+      "text": "The systematic review consistently showed that doctors with longer consultation times prescribe less and offer more advice on lifestyle and other health promoting activities. Longer consultations have been significantly associated with better recognition and handling of psychosocial problems3 and with better patient enablement.4 Also clinical care for some chronic illnesses is better in practices with longer booked intervals between one appointment and the next.5 It is not clear whether time is itself the main influence or whether some doctors insist on more time."
+    },
+    {
+      "self_ref": "#/texts/14",
+      "parent": {
+        "$ref": "#/texts/12"
+      },
+      "children": [],
+      "label": "text",
+      "prov": [],
+      "orig": "A national survey in 1998 reported that most (87%) patients were satisfied with the length of their most recent consultation.6 Satisfaction with any service will be high if expectations are met or exceeded. But expectations are modified by previous experience.7 The result is that primary care patients are likely to be satisfied with what they are used to unless the context modifies the effects of their own experience.",
+      "text": "A national survey in 1998 reported that most (87%) patients were satisfied with the length of their most recent consultation.6 Satisfaction with any service will be high if expectations are met or exceeded. But expectations are modified by previous experience.7 The result is that primary care patients are likely to be satisfied with what they are used to unless the context modifies the effects of their own experience."
+    },
+    {
+      "self_ref": "#/texts/15",
+      "parent": {
+        "$ref": "#/texts/0"
+      },
+      "children": [
+        {
+          "$ref": "#/texts/16"
+        }
+      ],
+      "label": "section_header",
+      "prov": [],
+      "orig": "Context of modern consultations",
+      "text": "Context of modern consultations",
+      "level": 1
+    },
+    {
+      "self_ref": "#/texts/16",
+      "parent": {
+        "$ref": "#/texts/15"
+      },
+      "children": [],
+      "label": "text",
+      "prov": [],
+      "orig": "Shorter consultations were more appropriate when the population was younger, when even a brief absence from employment due to sickness required a doctor's note, and when many simple remedies were available only on prescription. Recently at least five important influences have increased the content and hence the potential length of the consultation.",
+      "text": "Shorter consultations were more appropriate when the population was younger, when even a brief absence from employment due to sickness required a doctor's note, and when many simple remedies were available only on prescription. Recently at least five important influences have increased the content and hence the potential length of the consultation."
+    },
+    {
+      "self_ref": "#/texts/17",
+      "parent": {
+        "$ref": "#/texts/0"
+      },
+      "children": [
+        {
+          "$ref": "#/texts/18"
+        }
+      ],
+      "label": "section_header",
+      "prov": [],
+      "orig": "Participatory consultation style",
+      "text": "Participatory consultation style",
+      "level": 1
+    },
+    {
+      "self_ref": "#/texts/18",
+      "parent": {
+        "$ref": "#/texts/17"
+      },
+      "children": [],
+      "label": "text",
+      "prov": [],
+      "orig": "The most effective consultations are those in which doctors most directly acknowledge and perhaps respond to patients' problems and concerns. In addition, for patients to be committed to taking advantage of medical advice they must agree with both the goals and methods proposed. A landmark publication in the United Kingdom was Meetings Between Experts, which argued that while doctors are the experts about medical problems in general patients are the experts on how they themselves experience these problems.8 New emphasis on teaching consulting skills in general practice advocated specific attention to the patient's agenda, beliefs, understanding, and agreement. Currently the General Medical Council, aware that communication difficulties underlie many complaints about doctors, has further emphasised the importance of involving patients in consultations in its revised guidance to medical schools.9 More patient involvement should give a better outcome, but this participatory style usually lengthens consultations.",
+      "text": "The most effective consultations are those in which doctors most directly acknowledge and perhaps respond to patients' problems and concerns. In addition, for patients to be committed to taking advantage of medical advice they must agree with both the goals and methods proposed. A landmark publication in the United Kingdom was Meetings Between Experts, which argued that while doctors are the experts about medical problems in general patients are the experts on how they themselves experience these problems.8 New emphasis on teaching consulting skills in general practice advocated specific attention to the patient's agenda, beliefs, understanding, and agreement. Currently the General Medical Council, aware that communication difficulties underlie many complaints about doctors, has further emphasised the importance of involving patients in consultations in its revised guidance to medical schools.9 More patient involvement should give a better outcome, but this participatory style usually lengthens consultations."
+    },
+    {
+      "self_ref": "#/texts/19",
+      "parent": {
+        "$ref": "#/texts/0"
+      },
+      "children": [
+        {
+          "$ref": "#/texts/20"
+        },
+        {
+          "$ref": "#/texts/21"
+        }
+      ],
+      "label": "section_header",
+      "prov": [],
+      "orig": "Extended professional agenda",
+      "text": "Extended professional agenda",
+      "level": 1
+    },
+    {
+      "self_ref": "#/texts/20",
+      "parent": {
+        "$ref": "#/texts/19"
+      },
+      "children": [],
+      "label": "text",
+      "prov": [],
+      "orig": "The traditional consultation in general practice was brief.2 The patient presented symptoms and the doctor prescribed treatment. In 1957 Balint gave new insights into the meaning of symptoms.10 By 1979 an enhanced model of consultation was presented, in which the doctors dealt with ongoing as well as presenting problems and added health promotion and education about future appropriate use of services.11 Now, with an ageing population and more community care of chronic illness, there are more issues to be considered at each consultation. Ideas of what constitutes good general practice are more complex.12 Good practice now includes both extended care of chronic medical problems\u2014for example, coronary heart disease13\u2014and a public health role. At first this model was restricted to those who lead change (\u201cearly adopters\u201d) and enthusiasts14 but now it is embedded in professional and managerial expectations of good practice.",
+      "text": "The traditional consultation in general practice was brief.2 The patient presented symptoms and the doctor prescribed treatment. In 1957 Balint gave new insights into the meaning of symptoms.10 By 1979 an enhanced model of consultation was presented, in which the doctors dealt with ongoing as well as presenting problems and added health promotion and education about future appropriate use of services.11 Now, with an ageing population and more community care of chronic illness, there are more issues to be considered at each consultation. Ideas of what constitutes good general practice are more complex.12 Good practice now includes both extended care of chronic medical problems\u2014for example, coronary heart disease13\u2014and a public health role. At first this model was restricted to those who lead change (\u201cearly adopters\u201d) and enthusiasts14 but now it is embedded in professional and managerial expectations of good practice."
+    },
+    {
+      "self_ref": "#/texts/21",
+      "parent": {
+        "$ref": "#/texts/19"
+      },
+      "children": [],
+      "label": "text",
+      "prov": [],
+      "orig": "Adequate time is essential. It may be difficult for an elderly patient with several active problems to undress, be examined, and get adequate professional consideration in under 15 minutes. Here the doctor is faced with the choice of curtailing the consultation or of reducing the time available for the next patient. Having to cope with these situations often contributes to professional dissatisfaction.15 This combination of more care, more options, and more genuine discussion of those options with informed patient choice inevitably leads to pressure on time.",
+      "text": "Adequate time is essential. It may be difficult for an elderly patient with several active problems to undress, be examined, and get adequate professional consideration in under 15 minutes. Here the doctor is faced with the choice of curtailing the consultation or of reducing the time available for the next patient. Having to cope with these situations often contributes to professional dissatisfaction.15 This combination of more care, more options, and more genuine discussion of those options with informed patient choice inevitably leads to pressure on time."
+    },
+    {
+      "self_ref": "#/texts/22",
+      "parent": {
+        "$ref": "#/texts/0"
+      },
+      "children": [
+        {
+          "$ref": "#/texts/23"
+        },
+        {
+          "$ref": "#/texts/24"
+        },
+        {
+          "$ref": "#/texts/25"
+        },
+        {
+          "$ref": "#/texts/26"
+        },
+        {
+          "$ref": "#/texts/27"
+        }
+      ],
+      "label": "section_header",
+      "prov": [],
+      "orig": "Access problems",
+      "text": "Access problems",
+      "level": 1
+    },
+    {
+      "self_ref": "#/texts/23",
+      "parent": {
+        "$ref": "#/texts/22"
+      },
+      "children": [],
+      "label": "text",
+      "prov": [],
+      "orig": "In a service free at the point of access, rising demand will tend to increase rationing by delay. But attempts to improve access by offering more consultations at short notice squeeze consultation times.",
+      "text": "In a service free at the point of access, rising demand will tend to increase rationing by delay. But attempts to improve access by offering more consultations at short notice squeeze consultation times."
+    },
+    {
+      "self_ref": "#/texts/24",
+      "parent": {
+        "$ref": "#/texts/22"
+      },
+      "children": [],
+      "label": "text",
+      "prov": [],
+      "orig": "While appointment systems can and should reduce queuing time for consultations, they have long tended to be used as a brake on total demand.16 This may seriously erode patients' confidence in being able to see their doctor or nurse when they need to. Patients are offered appointments further ahead but may keep these even if their symptoms have remitted \u201cjust in case.\u201d Availability of consultations is thus blocked. Receptionists are then inappropriately blamed for the inadequate access to doctors.",
+      "text": "While appointment systems can and should reduce queuing time for consultations, they have long tended to be used as a brake on total demand.16 This may seriously erode patients' confidence in being able to see their doctor or nurse when they need to. Patients are offered appointments further ahead but may keep these even if their symptoms have remitted \u201cjust in case.\u201d Availability of consultations is thus blocked. Receptionists are then inappropriately blamed for the inadequate access to doctors."
+    },
+    {
+      "self_ref": "#/texts/25",
+      "parent": {
+        "$ref": "#/texts/22"
+      },
+      "children": [],
+      "label": "text",
+      "prov": [],
+      "orig": "In response to perception of delay, the government has set targets in the NHS plan of \u201cguaranteed access to a primary care professional within 24 hours and to a primary care doctor within 48 hours.\u201d Implementation is currently being negotiated.",
+      "text": "In response to perception of delay, the government has set targets in the NHS plan of \u201cguaranteed access to a primary care professional within 24 hours and to a primary care doctor within 48 hours.\u201d Implementation is currently being negotiated."
+    },
+    {
+      "self_ref": "#/texts/26",
+      "parent": {
+        "$ref": "#/texts/22"
+      },
+      "children": [],
+      "label": "text",
+      "prov": [],
+      "orig": "Virtually all patients think that they would not consult unless it was absolutely necessary. They do not think they are wasting NHS time and do not like being made to feel so. But underlying general practitioners' willingness to make patients wait several days is their perception that few of the problems are urgent. Patients and general practitioners evidently do not agree about the urgency of so called minor problems. To some extent general practice in the United Kingdom may have scored an \u201cown goal\u201d by setting up perceived access barriers (appointment systems and out of hours cooperatives) in the attempt to increase professional standards and control demand in a service that is free at the point of access.",
+      "text": "Virtually all patients think that they would not consult unless it was absolutely necessary. They do not think they are wasting NHS time and do not like being made to feel so. But underlying general practitioners' willingness to make patients wait several days is their perception that few of the problems are urgent. Patients and general practitioners evidently do not agree about the urgency of so called minor problems. To some extent general practice in the United Kingdom may have scored an \u201cown goal\u201d by setting up perceived access barriers (appointment systems and out of hours cooperatives) in the attempt to increase professional standards and control demand in a service that is free at the point of access."
+    },
+    {
+      "self_ref": "#/texts/27",
+      "parent": {
+        "$ref": "#/texts/22"
+      },
+      "children": [],
+      "label": "text",
+      "prov": [],
+      "orig": "A further government initiative has been to bypass general practice with new services\u2014notably, walk-in centres (primary care clinics in which no appointment is needed) and NHS Direct (a professional telephone helpline giving advice on simple remedies and access to services). Introduced widely and rapidly, these services each potentially provide significant features of primary care\u2014namely, quick access to skilled health advice and first line treatment.",
+      "text": "A further government initiative has been to bypass general practice with new services\u2014notably, walk-in centres (primary care clinics in which no appointment is needed) and NHS Direct (a professional telephone helpline giving advice on simple remedies and access to services). Introduced widely and rapidly, these services each potentially provide significant features of primary care\u2014namely, quick access to skilled health advice and first line treatment."
+    },
+    {
+      "self_ref": "#/texts/28",
+      "parent": {
+        "$ref": "#/texts/0"
+      },
+      "children": [
+        {
+          "$ref": "#/texts/29"
+        },
+        {
+          "$ref": "#/texts/30"
+        }
+      ],
+      "label": "section_header",
+      "prov": [],
+      "orig": "Loss of interpersonal continuity",
+      "text": "Loss of interpersonal continuity",
+      "level": 1
+    },
+    {
+      "self_ref": "#/texts/29",
+      "parent": {
+        "$ref": "#/texts/28"
+      },
+      "children": [],
+      "label": "text",
+      "prov": [],
+      "orig": "If a patient has to consult several different professionals, particularly over a short period of time, there is inevitable duplication of stories, risk of naive diagnoses, potential for conflicting advice, and perhaps loss of trust. Trust is essential if patients are to accept the \u201cwait and see\u201d management policy which is, or should be, an important part of the management of self limiting conditions, which are often on the boundary between illness and non-illness.17 Such duplication again increases pressure for more extra (unscheduled) consultations resulting in late running and professional frustration.18",
+      "text": "If a patient has to consult several different professionals, particularly over a short period of time, there is inevitable duplication of stories, risk of naive diagnoses, potential for conflicting advice, and perhaps loss of trust. Trust is essential if patients are to accept the \u201cwait and see\u201d management policy which is, or should be, an important part of the management of self limiting conditions, which are often on the boundary between illness and non-illness.17 Such duplication again increases pressure for more extra (unscheduled) consultations resulting in late running and professional frustration.18"
+    },
+    {
+      "self_ref": "#/texts/30",
+      "parent": {
+        "$ref": "#/texts/28"
+      },
+      "children": [],
+      "label": "text",
+      "prov": [],
+      "orig": "Mechanic described how loss of longitudinal (and perhaps personal and relational19) continuity influences the perception and use of time through an inability to build on previous consultations.2 Knowing the doctor well, particularly in smaller practices, is associated with enhanced patient enablement in shorter time.4 Though Mechanic pointed out that three quarters of UK patients have been registered with their general practitioner five years or more, this may be misleading. Practices are growing, with larger teams and more registered patients. Being registered with a doctor in a larger practice is usually no guarantee that the patient will be able to see the same doctor or the doctor of his or her choice, who may be different. Thus the system does not encourage adequate personal continuity. This adds to pressure on time and reduces both patient and professional satisfaction.",
+      "text": "Mechanic described how loss of longitudinal (and perhaps personal and relational19) continuity influences the perception and use of time through an inability to build on previous consultations.2 Knowing the doctor well, particularly in smaller practices, is associated with enhanced patient enablement in shorter time.4 Though Mechanic pointed out that three quarters of UK patients have been registered with their general practitioner five years or more, this may be misleading. Practices are growing, with larger teams and more registered patients. Being registered with a doctor in a larger practice is usually no guarantee that the patient will be able to see the same doctor or the doctor of his or her choice, who may be different. Thus the system does not encourage adequate personal continuity. This adds to pressure on time and reduces both patient and professional satisfaction."
+    },
+    {
+      "self_ref": "#/texts/31",
+      "parent": {
+        "$ref": "#/texts/0"
+      },
+      "children": [
+        {
+          "$ref": "#/texts/32"
+        }
+      ],
+      "label": "section_header",
+      "prov": [],
+      "orig": "Health service reforms",
+      "text": "Health service reforms",
+      "level": 1
+    },
+    {
+      "self_ref": "#/texts/32",
+      "parent": {
+        "$ref": "#/texts/31"
+      },
+      "children": [],
+      "label": "text",
+      "prov": [],
+      "orig": "Finally, for the past 15 years the NHS has experienced unprecedented change with a succession of major administrative reforms. Recent reforms have focused on an NHS led by primary care, including the aim of shifting care from the secondary specialist sector to primary care. One consequence is increased demand for primary care of patients with more serious and less stable problems. With the limited piloting of reforms we do not know whether such major redirection can be achieved without greatly altering the delicate balance between expectations (of both patients and staff) and what is delivered.",
+      "text": "Finally, for the past 15 years the NHS has experienced unprecedented change with a succession of major administrative reforms. Recent reforms have focused on an NHS led by primary care, including the aim of shifting care from the secondary specialist sector to primary care. One consequence is increased demand for primary care of patients with more serious and less stable problems. With the limited piloting of reforms we do not know whether such major redirection can be achieved without greatly altering the delicate balance between expectations (of both patients and staff) and what is delivered."
+    },
+    {
+      "self_ref": "#/texts/33",
+      "parent": {
+        "$ref": "#/texts/0"
+      },
+      "children": [
+        {
+          "$ref": "#/texts/34"
+        },
+        {
+          "$ref": "#/texts/35"
+        },
+        {
+          "$ref": "#/texts/36"
+        }
+      ],
+      "label": "section_header",
+      "prov": [],
+      "orig": "The future",
+      "text": "The future",
+      "level": 1
+    },
+    {
+      "self_ref": "#/texts/34",
+      "parent": {
+        "$ref": "#/texts/33"
+      },
+      "children": [],
+      "label": "text",
+      "prov": [],
+      "orig": "We think that the way ahead must embrace both longer mean consultation times and more flexibility. More time is needed for high quality consultations with patients with major and complex problems of all kinds. But patients also need access to simpler services and advice. This should be more appropriate (and cost less) when it is given by professionals who know the patient and his or her medical history and social circumstances. For doctors, the higher quality associated with longer consultations may lead to greater professional satisfaction and, if these longer consultations are combined with more realistic scheduling, to reduced levels of stress.20 They will also find it easier to develop further the care of chronic disease.",
+      "text": "We think that the way ahead must embrace both longer mean consultation times and more flexibility. More time is needed for high quality consultations with patients with major and complex problems of all kinds. But patients also need access to simpler services and advice. This should be more appropriate (and cost less) when it is given by professionals who know the patient and his or her medical history and social circumstances. For doctors, the higher quality associated with longer consultations may lead to greater professional satisfaction and, if these longer consultations are combined with more realistic scheduling, to reduced levels of stress.20 They will also find it easier to develop further the care of chronic disease."
+    },
+    {
+      "self_ref": "#/texts/35",
+      "parent": {
+        "$ref": "#/texts/33"
+      },
+      "children": [],
+      "label": "text",
+      "prov": [],
+      "orig": "The challenge posed to general practice by walk-in centres and NHS Direct is considerable, and the diversion of funding from primary care is large. The risk of waste and duplication increases as more layers of complexity are added to a primary care service that started out as something familiar, simple, and local and which is still envied in other developed countries.21 Access needs to be simple, and the advantages of personal knowledge and trust in minimising duplication and overmedicalisation need to be exploited.",
+      "text": "The challenge posed to general practice by walk-in centres and NHS Direct is considerable, and the diversion of funding from primary care is large. The risk of waste and duplication increases as more layers of complexity are added to a primary care service that started out as something familiar, simple, and local and which is still envied in other developed countries.21 Access needs to be simple, and the advantages of personal knowledge and trust in minimising duplication and overmedicalisation need to be exploited."
+    },
+    {
+      "self_ref": "#/texts/36",
+      "parent": {
+        "$ref": "#/texts/33"
+      },
+      "children": [],
+      "label": "text",
+      "prov": [],
+      "orig": "We must ensure better communication and access so that patients can more easily deal with minor issues and queries with someone they know and trust and avoid the formality and inconvenience of a full face to face consultation. Too often this has to be with a different professional, unfamiliar with the nuances of the case. There should be far more managerial emphasis on helping patients to interact with their chosen practitioner22; such a programme has been described.23 Modern information systems make it much easier to record which doctor(s) a patient prefers to see and to monitor how often this is achieved. The telephone is hardly modern but is underused. Email avoids the problems inherent in arranging simultaneous availability necessary for telephone consultations but at the cost of reducing the communication of emotions. There is a place for both.2 Access without prior appointment is a valued feature of primary care, and we need to know more about the right balance between planned and ad hoc consulting.",
+      "text": "We must ensure better communication and access so that patients can more easily deal with minor issues and queries with someone they know and trust and avoid the formality and inconvenience of a full face to face consultation. Too often this has to be with a different professional, unfamiliar with the nuances of the case. There should be far more managerial emphasis on helping patients to interact with their chosen practitioner22; such a programme has been described.23 Modern information systems make it much easier to record which doctor(s) a patient prefers to see and to monitor how often this is achieved. The telephone is hardly modern but is underused. Email avoids the problems inherent in arranging simultaneous availability necessary for telephone consultations but at the cost of reducing the communication of emotions. There is a place for both.2 Access without prior appointment is a valued feature of primary care, and we need to know more about the right balance between planned and ad hoc consulting."
+    },
+    {
+      "self_ref": "#/texts/37",
+      "parent": {
+        "$ref": "#/texts/0"
+      },
+      "children": [
+        {
+          "$ref": "#/texts/38"
+        },
+        {
+          "$ref": "#/texts/39"
+        }
+      ],
+      "label": "section_header",
+      "prov": [],
+      "orig": "Next steps",
+      "text": "Next steps",
+      "level": 1
+    },
+    {
+      "self_ref": "#/texts/38",
+      "parent": {
+        "$ref": "#/texts/37"
+      },
+      "children": [],
+      "label": "text",
+      "prov": [],
+      "orig": "General practitioners do not behave in a uniform way. They can be categorised as slow, medium, and fast and react in different ways to changes in consulting speed.18 They are likely to have differing views about a widespread move to lengthen consultation time. We do not need further confirmation that longer consultations are desirable and necessary, but research could show us the best way to learn how to introduce them with minimal disruption to the way in which patients and practices like primary care to be provided.24 We also need to learn how to make the most of available time in complex consultations.",
+      "text": "General practitioners do not behave in a uniform way. They can be categorised as slow, medium, and fast and react in different ways to changes in consulting speed.18 They are likely to have differing views about a widespread move to lengthen consultation time. We do not need further confirmation that longer consultations are desirable and necessary, but research could show us the best way to learn how to introduce them with minimal disruption to the way in which patients and practices like primary care to be provided.24 We also need to learn how to make the most of available time in complex consultations."
+    },
+    {
+      "self_ref": "#/texts/39",
+      "parent": {
+        "$ref": "#/texts/37"
+      },
+      "children": [],
+      "label": "text",
+      "prov": [],
+      "orig": "Devising appropriate incentives and helping practices move beyond just reacting to demand in the traditional way by working harder and faster is perhaps our greatest challenge in the United Kingdom. The new primary are trusts need to work together with the growing primary care research networks to carry out the necessary development work. In particular, research is needed on how a primary care team can best provide the right balance of quick access and interpersonal knowledge and trust.",
+      "text": "Devising appropriate incentives and helping practices move beyond just reacting to demand in the traditional way by working harder and faster is perhaps our greatest challenge in the United Kingdom. The new primary are trusts need to work together with the growing primary care research networks to carry out the necessary development work. In particular, research is needed on how a primary care team can best provide the right balance of quick access and interpersonal knowledge and trust."
+    },
+    {
+      "self_ref": "#/texts/40",
+      "parent": {
+        "$ref": "#/texts/0"
+      },
+      "children": [
+        {
+          "$ref": "#/texts/41"
+        }
+      ],
+      "label": "section_header",
+      "prov": [],
+      "orig": "Acknowledgments",
+      "text": "Acknowledgments",
+      "level": 1
+    },
+    {
+      "self_ref": "#/texts/41",
+      "parent": {
+        "$ref": "#/texts/40"
+      },
+      "children": [],
+      "label": "text",
+      "prov": [],
+      "orig": "We thank the other members of the working group: Susan Childs, Paul Freeling, Iona Heath, Marshall Marinker, and Bonnie Sibbald. We also thank Fenny Green of the Royal College of General Practitioners for administrative help.",
+      "text": "We thank the other members of the working group: Susan Childs, Paul Freeling, Iona Heath, Marshall Marinker, and Bonnie Sibbald. We also thank Fenny Green of the Royal College of General Practitioners for administrative help."
+    },
+    {
+      "self_ref": "#/texts/42",
+      "parent": {
+        "$ref": "#/texts/0"
+      },
+      "children": [
+        {
+          "$ref": "#/groups/1"
+        }
+      ],
+      "label": "section_header",
+      "prov": [],
+      "orig": "References",
+      "text": "References",
+      "level": 1
+    },
+    {
+      "self_ref": "#/texts/43",
+      "parent": {
+        "$ref": "#/groups/1"
+      },
+      "children": [],
+      "label": "list_item",
+      "prov": [],
+      "orig": "Shah NC. Viewpoint: Consultation time\u2014time for a change? Still the \u201cperfunctory work of perfunctory men!\u201d. Br J Gen Pract 49:497 (1999).",
+      "text": "Shah NC. Viewpoint: Consultation time\u2014time for a change? Still the \u201cperfunctory work of perfunctory men!\u201d. Br J Gen Pract 49:497 (1999).",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/44",
+      "parent": {
+        "$ref": "#/groups/1"
+      },
+      "children": [],
+      "label": "list_item",
+      "prov": [],
+      "orig": "Mechanic D. How should hamsters run? Some observations about sufficient patient time in primary care. BMJ 323:266\u2013268 (2001). PMID: 11485957",
+      "text": "Mechanic D. How should hamsters run? Some observations about sufficient patient time in primary care. BMJ 323:266\u2013268 (2001). PMID: 11485957",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/45",
+      "parent": {
+        "$ref": "#/groups/1"
+      },
+      "children": [],
+      "label": "list_item",
+      "prov": [],
+      "orig": "Howie JGR, Porter AMD, Heaney DJ, Hopton JL. Long to short consultation ratio: a proxy measure of quality of care for general practice. Br J Gen Pract 41:48\u201354 (1991). PMID: 2031735",
+      "text": "Howie JGR, Porter AMD, Heaney DJ, Hopton JL. Long to short consultation ratio: a proxy measure of quality of care for general practice. Br J Gen Pract 41:48\u201354 (1991). PMID: 2031735",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/46",
+      "parent": {
+        "$ref": "#/groups/1"
+      },
+      "children": [],
+      "label": "list_item",
+      "prov": [],
+      "orig": "Howie JGR, Heaney DJ, Maxwell M, Walker JJ, Freeman GK, Rai H. Quality at general practice consultations: cross-sectional survey. BMJ 319:738\u2013743 (1999). PMID: 10487999",
+      "text": "Howie JGR, Heaney DJ, Maxwell M, Walker JJ, Freeman GK, Rai H. Quality at general practice consultations: cross-sectional survey. BMJ 319:738\u2013743 (1999). PMID: 10487999",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/47",
+      "parent": {
+        "$ref": "#/groups/1"
+      },
+      "children": [],
+      "label": "list_item",
+      "prov": [],
+      "orig": "Kaplan SH, Greenfield S, Ware JE. Assessing the effects of physician-patient interactions on the outcome of chronic disease. Med Care 27:110\u2013125 (1989).",
+      "text": "Kaplan SH, Greenfield S, Ware JE. Assessing the effects of physician-patient interactions on the outcome of chronic disease. Med Care 27:110\u2013125 (1989).",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/48",
+      "parent": {
+        "$ref": "#/groups/1"
+      },
+      "children": [],
+      "label": "list_item",
+      "prov": [],
+      "orig": "Airey C, Erens B. National surveys of NHS patients: general practice, 1998. London: NHS Executive (1999).",
+      "text": "Airey C, Erens B. National surveys of NHS patients: general practice, 1998. London: NHS Executive (1999).",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/49",
+      "parent": {
+        "$ref": "#/groups/1"
+      },
+      "children": [],
+      "label": "list_item",
+      "prov": [],
+      "orig": "Hart JT. Expectations of health care: promoted, managed or shared?. Health Expect 1:3\u201313 (1998). PMID: 11281857",
+      "text": "Hart JT. Expectations of health care: promoted, managed or shared?. Health Expect 1:3\u201313 (1998). PMID: 11281857",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/50",
+      "parent": {
+        "$ref": "#/groups/1"
+      },
+      "children": [],
+      "label": "list_item",
+      "prov": [],
+      "orig": "Tuckett D, Boulton M, Olson C, Williams A. Meetings between experts: an approach to sharing ideas in medical consultations. London: Tavistock Publications (1985).",
+      "text": "Tuckett D, Boulton M, Olson C, Williams A. Meetings between experts: an approach to sharing ideas in medical consultations. London: Tavistock Publications (1985).",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/51",
+      "parent": {
+        "$ref": "#/groups/1"
+      },
+      "children": [],
+      "label": "list_item",
+      "prov": [],
+      "orig": "General Medical Council. Draft recommendations on undergraduate medical education. July 2001. www.gmc-uk.org/med_ed/tomorrowsdoctors/index.htm (accessed 2 Jan 2002).",
+      "text": "General Medical Council. Draft recommendations on undergraduate medical education. July 2001. www.gmc-uk.org/med_ed/tomorrowsdoctors/index.htm (accessed 2 Jan 2002).",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/52",
+      "parent": {
+        "$ref": "#/groups/1"
+      },
+      "children": [],
+      "label": "list_item",
+      "prov": [],
+      "orig": "Balint M. The doctor, his patient and the illness. London: Tavistock (1957).",
+      "text": "Balint M. The doctor, his patient and the illness. London: Tavistock (1957).",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/53",
+      "parent": {
+        "$ref": "#/groups/1"
+      },
+      "children": [],
+      "label": "list_item",
+      "prov": [],
+      "orig": "Stott NCH, Davies RH. The exceptional potential in each primary care consultation. J R Coll Gen Pract 29:210\u2013205 (1979).",
+      "text": "Stott NCH, Davies RH. The exceptional potential in each primary care consultation. J R Coll Gen Pract 29:210\u2013205 (1979).",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/54",
+      "parent": {
+        "$ref": "#/groups/1"
+      },
+      "children": [],
+      "label": "list_item",
+      "prov": [],
+      "orig": "Hill AP, Hill AP. Challenges for primary care. What's gone wrong with health care? Challenges for the new millennium. London: King's Fund75\u201386 (2000).",
+      "text": "Hill AP, Hill AP. Challenges for primary care. What's gone wrong with health care? Challenges for the new millennium. London: King's Fund75\u201386 (2000).",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/55",
+      "parent": {
+        "$ref": "#/groups/1"
+      },
+      "children": [],
+      "label": "list_item",
+      "prov": [],
+      "orig": "National service framework for coronary heart disease. London: Department of Health (2000).",
+      "text": "National service framework for coronary heart disease. London: Department of Health (2000).",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/56",
+      "parent": {
+        "$ref": "#/groups/1"
+      },
+      "children": [],
+      "label": "list_item",
+      "prov": [],
+      "orig": "Hart JT. A new kind of doctor: the general practitioner's part in the health of the community. London: Merlin Press (1988).",
+      "text": "Hart JT. A new kind of doctor: the general practitioner's part in the health of the community. London: Merlin Press (1988).",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/57",
+      "parent": {
+        "$ref": "#/groups/1"
+      },
+      "children": [],
+      "label": "list_item",
+      "prov": [],
+      "orig": "Morrison I, Smith R. Hamster health care. BMJ 321:1541\u20131542 (2000). PMID: 11124164",
+      "text": "Morrison I, Smith R. Hamster health care. BMJ 321:1541\u20131542 (2000). PMID: 11124164",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/58",
+      "parent": {
+        "$ref": "#/groups/1"
+      },
+      "children": [],
+      "label": "list_item",
+      "prov": [],
+      "orig": "Arber S, Sawyer L. Do appointment systems work?. BMJ 284:478\u2013480 (1982). PMID: 6800503",
+      "text": "Arber S, Sawyer L. Do appointment systems work?. BMJ 284:478\u2013480 (1982). PMID: 6800503",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/59",
+      "parent": {
+        "$ref": "#/groups/1"
+      },
+      "children": [],
+      "label": "list_item",
+      "prov": [],
+      "orig": "Hjortdahl P, Borchgrevink CF. Continuity of care: influence of general practitioners' knowledge about their patients on use of resources in consultations. BMJ 303:1181\u20131184 (1991). PMID: 1747619",
+      "text": "Hjortdahl P, Borchgrevink CF. Continuity of care: influence of general practitioners' knowledge about their patients on use of resources in consultations. BMJ 303:1181\u20131184 (1991). PMID: 1747619",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/60",
+      "parent": {
+        "$ref": "#/groups/1"
+      },
+      "children": [],
+      "label": "list_item",
+      "prov": [],
+      "orig": "Howie JGR, Hopton JL, Heaney DJ, Porter AMD. Attitudes to medical care, the organization of work, and stress among general practitioners. Br J Gen Pract 42:181\u2013185 (1992). PMID: 1389427",
+      "text": "Howie JGR, Hopton JL, Heaney DJ, Porter AMD. Attitudes to medical care, the organization of work, and stress among general practitioners. Br J Gen Pract 42:181\u2013185 (1992). PMID: 1389427",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/61",
+      "parent": {
+        "$ref": "#/groups/1"
+      },
+      "children": [],
+      "label": "list_item",
+      "prov": [],
+      "orig": "Freeman G, Shepperd S, Robinson I, Ehrich K, Richards SC, Pitman P. Continuity of care: report of a scoping exercise for the national co-ordinating centre for NHS Service Delivery and Organisation R&D (NCCSDO), Summer 2000. London: NCCSDO (2001).",
+      "text": "Freeman G, Shepperd S, Robinson I, Ehrich K, Richards SC, Pitman P. Continuity of care: report of a scoping exercise for the national co-ordinating centre for NHS Service Delivery and Organisation R&D (NCCSDO), Summer 2000. London: NCCSDO (2001).",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/62",
+      "parent": {
+        "$ref": "#/groups/1"
+      },
+      "children": [],
+      "label": "list_item",
+      "prov": [],
+      "orig": "Wilson A, McDonald P, Hayes L, Cooney J. Longer booking intervals in general practice: effects on doctors' stress and arousal. Br J Gen Pract 41:184\u2013187 (1991). PMID: 1878267",
+      "text": "Wilson A, McDonald P, Hayes L, Cooney J. Longer booking intervals in general practice: effects on doctors' stress and arousal. Br J Gen Pract 41:184\u2013187 (1991). PMID: 1878267",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/63",
+      "parent": {
+        "$ref": "#/groups/1"
+      },
+      "children": [],
+      "label": "list_item",
+      "prov": [],
+      "orig": "De Maeseneer J, Hjortdahl P, Starfield B. Fix what's wrong, not what's right, with general practice in Britain. BMJ 320:1616\u20131617 (2000). PMID: 10856043",
+      "text": "De Maeseneer J, Hjortdahl P, Starfield B. Fix what's wrong, not what's right, with general practice in Britain. BMJ 320:1616\u20131617 (2000). PMID: 10856043",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/64",
+      "parent": {
+        "$ref": "#/groups/1"
+      },
+      "children": [],
+      "label": "list_item",
+      "prov": [],
+      "orig": "Freeman G, Hjortdahl P. What future for continuity of care in general practice?. BMJ 314:1870\u20131873 (1997). PMID: 9224130",
+      "text": "Freeman G, Hjortdahl P. What future for continuity of care in general practice?. BMJ 314:1870\u20131873 (1997). PMID: 9224130",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/65",
+      "parent": {
+        "$ref": "#/groups/1"
+      },
+      "children": [],
+      "label": "list_item",
+      "prov": [],
+      "orig": "Kibbe DC, Bentz E, McLaughlin CP. Continuous quality improvement for continuity of care. J Fam Pract 36:304\u2013308 (1993). PMID: 8454977",
+      "text": "Kibbe DC, Bentz E, McLaughlin CP. Continuous quality improvement for continuity of care. J Fam Pract 36:304\u2013308 (1993). PMID: 8454977",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/66",
+      "parent": {
+        "$ref": "#/groups/1"
+      },
+      "children": [],
+      "label": "list_item",
+      "prov": [],
+      "orig": "Williams M, Neal RD. Time for a change? The process of lengthening booking intervals in general practice. Br J Gen Pract 48:1783\u20131786 (1998). PMID: 10198490",
+      "text": "Williams M, Neal RD. Time for a change? The process of lengthening booking intervals in general practice. Br J Gen Pract 48:1783\u20131786 (1998). PMID: 10198490",
+      "enumerated": false,
+      "marker": "-"
+    }
+  ],
+  "pictures": [],
+  "tables": [],
+  "key_value_items": [],
+  "pages": {}
+}
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v2/bmj_sample.xml.md b/tests/data/groundtruth/docling_v2/bmj_sample.xml.md
new file mode 100644
index 00000000..fd3d3739
--- /dev/null
+++ b/tests/data/groundtruth/docling_v2/bmj_sample.xml.md
@@ -0,0 +1,105 @@
+# Evolving general practice consultation in Britain: issues of length and context
+
+George K Freeman, John P Horder, John G R Howie, A Pali Hungin, Alison P Hill, Nayan C Shah, Andrew Wilson
+
+Centre for Primary Care and Social Medicine, Imperial College of Science, Technology and Medicine, London W6 8RP; Royal College of General Practitioners, London SW7 1PU; Department of General Practice, University of Edinburgh, Edinburgh EH8 9DX; Centre for Health Studies, University of Durham, Durham DH1 3HN; Kilburn Park Medical Centre, London NW6; Department of General Practice and Primary Health Care, University of Leicester, Leicester LE5 4PW
+
+In 1999 Shah1 and others said that the Royal College of General Practitioners should advocate longer consultations in general practice as a matter of policy. The college set up a working group chaired by A P Hungin, and a systematic review of literature on consultation length in general practice was commissioned. The working group agreed that the available evidence would be hard to interpret without discussion of the changing context within which consultations now take place. For many years general practitioners and those who have surveyed patients' opinions in the United Kingdom have complained about short consultation time, despite a steady increase in actual mean length. Recently Mechanic pointed out that this is also true in the United States.2 Is there any justification for a further increase in mean time allocated per consultation in general practice?
+
+We report on the outcome of extensive debate among a group of general practitioners with an interest in the process of care, with reference to the interim findings of the commissioned systematic review and our personal databases. The review identified 14 relevant papers.
+
+## Summary points
+
+- Longer consultations are associated with a range of better patient outcomes
+- Modern consultations in general practice deal with patients with more serious and chronic conditions
+- Increasing patient participation means more complex interaction, which demands extra time
+- Difficulties with access and with loss of continuity add to perceived stress and poor performance and lead to further pressure on time
+- Longer consultations should be a professional priority, combined with increased use of technology and more flexible practice management to maximise interpersonal continuity
+- Research on implementation is needed
+
+## Longer consultations: benefits for patients
+
+The systematic review consistently showed that doctors with longer consultation times prescribe less and offer more advice on lifestyle and other health promoting activities. Longer consultations have been significantly associated with better recognition and handling of psychosocial problems3 and with better patient enablement.4 Also clinical care for some chronic illnesses is better in practices with longer booked intervals between one appointment and the next.5 It is not clear whether time is itself the main influence or whether some doctors insist on more time.
+
+A national survey in 1998 reported that most (87%) patients were satisfied with the length of their most recent consultation.6 Satisfaction with any service will be high if expectations are met or exceeded. But expectations are modified by previous experience.7 The result is that primary care patients are likely to be satisfied with what they are used to unless the context modifies the effects of their own experience.
+
+## Context of modern consultations
+
+Shorter consultations were more appropriate when the population was younger, when even a brief absence from employment due to sickness required a doctor's note, and when many simple remedies were available only on prescription. Recently at least five important influences have increased the content and hence the potential length of the consultation.
+
+## Participatory consultation style
+
+The most effective consultations are those in which doctors most directly acknowledge and perhaps respond to patients' problems and concerns. In addition, for patients to be committed to taking advantage of medical advice they must agree with both the goals and methods proposed. A landmark publication in the United Kingdom was Meetings Between Experts, which argued that while doctors are the experts about medical problems in general patients are the experts on how they themselves experience these problems.8 New emphasis on teaching consulting skills in general practice advocated specific attention to the patient's agenda, beliefs, understanding, and agreement. Currently the General Medical Council, aware that communication difficulties underlie many complaints about doctors, has further emphasised the importance of involving patients in consultations in its revised guidance to medical schools.9 More patient involvement should give a better outcome, but this participatory style usually lengthens consultations.
+
+## Extended professional agenda
+
+The traditional consultation in general practice was brief.2 The patient presented symptoms and the doctor prescribed treatment. In 1957 Balint gave new insights into the meaning of symptoms.10 By 1979 an enhanced model of consultation was presented, in which the doctors dealt with ongoing as well as presenting problems and added health promotion and education about future appropriate use of services.11 Now, with an ageing population and more community care of chronic illness, there are more issues to be considered at each consultation. Ideas of what constitutes good general practice are more complex.12 Good practice now includes both extended care of chronic medical problems—for example, coronary heart disease13—and a public health role. At first this model was restricted to those who lead change (“early adopters”) and enthusiasts14 but now it is embedded in professional and managerial expectations of good practice.
+
+Adequate time is essential. It may be difficult for an elderly patient with several active problems to undress, be examined, and get adequate professional consideration in under 15 minutes. Here the doctor is faced with the choice of curtailing the consultation or of reducing the time available for the next patient. Having to cope with these situations often contributes to professional dissatisfaction.15 This combination of more care, more options, and more genuine discussion of those options with informed patient choice inevitably leads to pressure on time.
+
+## Access problems
+
+In a service free at the point of access, rising demand will tend to increase rationing by delay. But attempts to improve access by offering more consultations at short notice squeeze consultation times.
+
+While appointment systems can and should reduce queuing time for consultations, they have long tended to be used as a brake on total demand.16 This may seriously erode patients' confidence in being able to see their doctor or nurse when they need to. Patients are offered appointments further ahead but may keep these even if their symptoms have remitted “just in case.” Availability of consultations is thus blocked. Receptionists are then inappropriately blamed for the inadequate access to doctors.
+
+In response to perception of delay, the government has set targets in the NHS plan of “guaranteed access to a primary care professional within 24 hours and to a primary care doctor within 48 hours.” Implementation is currently being negotiated.
+
+Virtually all patients think that they would not consult unless it was absolutely necessary. They do not think they are wasting NHS time and do not like being made to feel so. But underlying general practitioners' willingness to make patients wait several days is their perception that few of the problems are urgent. Patients and general practitioners evidently do not agree about the urgency of so called minor problems. To some extent general practice in the United Kingdom may have scored an “own goal” by setting up perceived access barriers (appointment systems and out of hours cooperatives) in the attempt to increase professional standards and control demand in a service that is free at the point of access.
+
+A further government initiative has been to bypass general practice with new services—notably, walk-in centres (primary care clinics in which no appointment is needed) and NHS Direct (a professional telephone helpline giving advice on simple remedies and access to services). Introduced widely and rapidly, these services each potentially provide significant features of primary care—namely, quick access to skilled health advice and first line treatment.
+
+## Loss of interpersonal continuity
+
+If a patient has to consult several different professionals, particularly over a short period of time, there is inevitable duplication of stories, risk of naive diagnoses, potential for conflicting advice, and perhaps loss of trust. Trust is essential if patients are to accept the “wait and see” management policy which is, or should be, an important part of the management of self limiting conditions, which are often on the boundary between illness and non-illness.17 Such duplication again increases pressure for more extra (unscheduled) consultations resulting in late running and professional frustration.18
+
+Mechanic described how loss of longitudinal (and perhaps personal and relational19) continuity influences the perception and use of time through an inability to build on previous consultations.2 Knowing the doctor well, particularly in smaller practices, is associated with enhanced patient enablement in shorter time.4 Though Mechanic pointed out that three quarters of UK patients have been registered with their general practitioner five years or more, this may be misleading. Practices are growing, with larger teams and more registered patients. Being registered with a doctor in a larger practice is usually no guarantee that the patient will be able to see the same doctor or the doctor of his or her choice, who may be different. Thus the system does not encourage adequate personal continuity. This adds to pressure on time and reduces both patient and professional satisfaction.
+
+## Health service reforms
+
+Finally, for the past 15 years the NHS has experienced unprecedented change with a succession of major administrative reforms. Recent reforms have focused on an NHS led by primary care, including the aim of shifting care from the secondary specialist sector to primary care. One consequence is increased demand for primary care of patients with more serious and less stable problems. With the limited piloting of reforms we do not know whether such major redirection can be achieved without greatly altering the delicate balance between expectations (of both patients and staff) and what is delivered.
+
+## The future
+
+We think that the way ahead must embrace both longer mean consultation times and more flexibility. More time is needed for high quality consultations with patients with major and complex problems of all kinds. But patients also need access to simpler services and advice. This should be more appropriate (and cost less) when it is given by professionals who know the patient and his or her medical history and social circumstances. For doctors, the higher quality associated with longer consultations may lead to greater professional satisfaction and, if these longer consultations are combined with more realistic scheduling, to reduced levels of stress.20 They will also find it easier to develop further the care of chronic disease.
+
+The challenge posed to general practice by walk-in centres and NHS Direct is considerable, and the diversion of funding from primary care is large. The risk of waste and duplication increases as more layers of complexity are added to a primary care service that started out as something familiar, simple, and local and which is still envied in other developed countries.21 Access needs to be simple, and the advantages of personal knowledge and trust in minimising duplication and overmedicalisation need to be exploited.
+
+We must ensure better communication and access so that patients can more easily deal with minor issues and queries with someone they know and trust and avoid the formality and inconvenience of a full face to face consultation. Too often this has to be with a different professional, unfamiliar with the nuances of the case. There should be far more managerial emphasis on helping patients to interact with their chosen practitioner22; such a programme has been described.23 Modern information systems make it much easier to record which doctor(s) a patient prefers to see and to monitor how often this is achieved. The telephone is hardly modern but is underused. Email avoids the problems inherent in arranging simultaneous availability necessary for telephone consultations but at the cost of reducing the communication of emotions. There is a place for both.2 Access without prior appointment is a valued feature of primary care, and we need to know more about the right balance between planned and ad hoc consulting.
+
+## Next steps
+
+General practitioners do not behave in a uniform way. They can be categorised as slow, medium, and fast and react in different ways to changes in consulting speed.18 They are likely to have differing views about a widespread move to lengthen consultation time. We do not need further confirmation that longer consultations are desirable and necessary, but research could show us the best way to learn how to introduce them with minimal disruption to the way in which patients and practices like primary care to be provided.24 We also need to learn how to make the most of available time in complex consultations.
+
+Devising appropriate incentives and helping practices move beyond just reacting to demand in the traditional way by working harder and faster is perhaps our greatest challenge in the United Kingdom. The new primary are trusts need to work together with the growing primary care research networks to carry out the necessary development work. In particular, research is needed on how a primary care team can best provide the right balance of quick access and interpersonal knowledge and trust.
+
+## Acknowledgments
+
+We thank the other members of the working group: Susan Childs, Paul Freeling, Iona Heath, Marshall Marinker, and Bonnie Sibbald. We also thank Fenny Green of the Royal College of General Practitioners for administrative help.
+
+## References
+
+- Shah NC. Viewpoint: Consultation time—time for a change? Still the “perfunctory work of perfunctory men!”. Br J Gen Pract 49:497 (1999).
+- Mechanic D. How should hamsters run? Some observations about sufficient patient time in primary care. BMJ 323:266–268 (2001). PMID: 11485957
+- Howie JGR, Porter AMD, Heaney DJ, Hopton JL. Long to short consultation ratio: a proxy measure of quality of care for general practice. Br J Gen Pract 41:48–54 (1991). PMID: 2031735
+- Howie JGR, Heaney DJ, Maxwell M, Walker JJ, Freeman GK, Rai H. Quality at general practice consultations: cross-sectional survey. BMJ 319:738–743 (1999). PMID: 10487999
+- Kaplan SH, Greenfield S, Ware JE. Assessing the effects of physician-patient interactions on the outcome of chronic disease. Med Care 27:110–125 (1989).
+- Airey C, Erens B. National surveys of NHS patients: general practice, 1998. London: NHS Executive (1999).
+- Hart JT. Expectations of health care: promoted, managed or shared?. Health Expect 1:3–13 (1998). PMID: 11281857
+- Tuckett D, Boulton M, Olson C, Williams A. Meetings between experts: an approach to sharing ideas in medical consultations. London: Tavistock Publications (1985).
+- General Medical Council. Draft recommendations on undergraduate medical education. July 2001. www.gmc-uk.org/med\_ed/tomorrowsdoctors/index.htm (accessed 2 Jan 2002).
+- Balint M. The doctor, his patient and the illness. London: Tavistock (1957).
+- Stott NCH, Davies RH. The exceptional potential in each primary care consultation. J R Coll Gen Pract 29:210–205 (1979).
+- Hill AP, Hill AP. Challenges for primary care. What's gone wrong with health care? Challenges for the new millennium. London: King's Fund75–86 (2000).
+- National service framework for coronary heart disease. London: Department of Health (2000).
+- Hart JT. A new kind of doctor: the general practitioner's part in the health of the community. London: Merlin Press (1988).
+- Morrison I, Smith R. Hamster health care. BMJ 321:1541–1542 (2000). PMID: 11124164
+- Arber S, Sawyer L. Do appointment systems work?. BMJ 284:478–480 (1982). PMID: 6800503
+- Hjortdahl P, Borchgrevink CF. Continuity of care: influence of general practitioners' knowledge about their patients on use of resources in consultations. BMJ 303:1181–1184 (1991). PMID: 1747619
+- Howie JGR, Hopton JL, Heaney DJ, Porter AMD. Attitudes to medical care, the organization of work, and stress among general practitioners. Br J Gen Pract 42:181–185 (1992). PMID: 1389427
+- Freeman G, Shepperd S, Robinson I, Ehrich K, Richards SC, Pitman P. Continuity of care: report of a scoping exercise for the national co-ordinating centre for NHS Service Delivery and Organisation R&amp;D (NCCSDO), Summer 2000. London: NCCSDO (2001).
+- Wilson A, McDonald P, Hayes L, Cooney J. Longer booking intervals in general practice: effects on doctors' stress and arousal. Br J Gen Pract 41:184–187 (1991). PMID: 1878267
+- De Maeseneer J, Hjortdahl P, Starfield B. Fix what's wrong, not what's right, with general practice in Britain. BMJ 320:1616–1617 (2000). PMID: 10856043
+- Freeman G, Hjortdahl P. What future for continuity of care in general practice?. BMJ 314:1870–1873 (1997). PMID: 9224130
+- Kibbe DC, Bentz E, McLaughlin CP. Continuous quality improvement for continuity of care. J Fam Pract 36:304–308 (1993). PMID: 8454977
+- Williams M, Neal RD. Time for a change? The process of lengthening booking intervals in general practice. Br J Gen Pract 48:1783–1786 (1998). PMID: 10198490
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v2/code_and_formula.doctags.txt b/tests/data/groundtruth/docling_v2/code_and_formula.doctags.txt
index ad417540..f2f34c08 100644
--- a/tests/data/groundtruth/docling_v2/code_and_formula.doctags.txt
+++ b/tests/data/groundtruth/docling_v2/code_and_formula.doctags.txt
@@ -1,14 +1,18 @@
-<document>
-<section_header_level_1><location><page_1><loc_22><loc_83><loc_45><loc_84></location>Java Code Example</section_header_level_1>
-<text><location><page_1><loc_22><loc_63><loc_78><loc_81></location>Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet.</text>
-<paragraph><location><page_1><loc_39><loc_61><loc_61><loc_62></location>Listing 1: Simple Java Program</paragraph>
-<code><location><page_1><loc_22><loc_56><loc_55><loc_60></location>public static void print() { System.out.println( "Java Code" ); }</code>
-<text><location><page_1><loc_22><loc_37><loc_78><loc_55></location>Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet.</text>
-<section_header_level_1><location><page_2><loc_22><loc_84><loc_32><loc_85></location>Formula</section_header_level_1>
-<text><location><page_2><loc_22><loc_65><loc_80><loc_82></location>Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet.</text>
-<text><location><page_2><loc_22><loc_58><loc_80><loc_65></location>Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore te feugait nulla facilisi. Lorem ipsum dolor sit amet, consectetuer adipiscing elit, sed diam nonummy nibh euismod tincidunt.</text>
-<formula><location><page_2><loc_47><loc_56><loc_56><loc_57></location>a 2 + 8 = 12</formula>
-<text><location><page_2><loc_22><loc_38><loc_80><loc_55></location>Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet.</text>
-<text><location><page_2><loc_22><loc_29><loc_80><loc_38></location>Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore te feugait nulla facilisi. Lorem ipsum dolor sit amet, consectetuer adipiscing elit, sed diam nonummy nibh euismod tincidunt ut laoreet dolore magna aliquam erat volutpat.</text>
-<text><location><page_2><loc_22><loc_21><loc_80><loc_29></location>Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore te feugait nulla facilisi. Lorem ipsum dolor sit amet, consectetuer adipiscing elit, sed diam nonummy nibh euismod tincidunt ut laoreet dolore magna aliquam erat volutpat.</text>
-</document>
\ No newline at end of file
+<doctag><section_header_level_1><loc_109><loc_79><loc_258><loc_87>JavaScript Code Example</section_header_level_1>
+<text><loc_109><loc_94><loc_390><loc_183>Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet.</text>
+<text><loc_109><loc_185><loc_390><loc_213>Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore te feugait nulla facilisi. Lorem ipsum dolor sit amet,</text>
+<code<loc_110><loc_231><loc_215><loc_257><_unknown_>function add(a, b) { return a + b; } console.log(add(3, 5));</code
+<caption><loc_182><loc_221><loc_317><loc_226>Listing 1: Simple JavaScript Program</caption>
+<text><loc_109><loc_265><loc_390><loc_353>Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet.</text>
+<text><loc_109><loc_355><loc_390><loc_383>Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore te feugait nulla facilisi. Lorem ipsum dolor sit amet,</text>
+<page_footer><loc_248><loc_439><loc_252><loc_445>1</page_footer>
+<page_break>
+<section_header_level_1><loc_112><loc_74><loc_161><loc_82>Formula</section_header_level_1>
+<text><loc_112><loc_89><loc_401><loc_172>Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet.</text>
+<text><loc_112><loc_174><loc_401><loc_208>Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore te feugait nulla facilisi. Lorem ipsum dolor sit amet, consectetuer adipiscing elit, sed diam nonummy nibh euismod tincidunt.</text>
+<formula><loc_236><loc_215><loc_278><loc_222></formula>
+<text><loc_112><loc_227><loc_401><loc_311>Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet.</text>
+<text><loc_112><loc_313><loc_401><loc_353>Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore te feugait nulla facilisi. Lorem ipsum dolor sit amet, consectetuer adipiscing elit, sed diam nonummy nibh euismod tincidunt ut laoreet dolore magna aliquam erat volutpat.</text>
+<text><loc_112><loc_355><loc_401><loc_396>Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore te feugait nulla facilisi. Lorem ipsum dolor sit amet, consectetuer adipiscing elit, sed diam nonummy nibh euismod tincidunt ut laoreet dolore magna aliquam erat volutpat.</text>
+<page_footer><loc_255><loc_413><loc_259><loc_418>1</page_footer>
+</doctag>
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v2/code_and_formula.json b/tests/data/groundtruth/docling_v2/code_and_formula.json
index adcc14d1..374d0e7a 100644
--- a/tests/data/groundtruth/docling_v2/code_and_formula.json
+++ b/tests/data/groundtruth/docling_v2/code_and_formula.json
@@ -1 +1 @@
-{"schema_name": "DoclingDocument", "version": "1.0.0", "name": "code_and_formula", "origin": {"mimetype": "application/pdf", "binary_hash": 2394749058180317456, "filename": "code_and_formula.pdf", "uri": null}, "furniture": {"self_ref": "#/furniture", "parent": null, "children": [], "name": "_root_", "label": "unspecified"}, "body": {"self_ref": "#/body", "parent": null, "children": [{"cref": "#/texts/0"}, {"cref": "#/texts/1"}, {"cref": "#/texts/2"}, {"cref": "#/texts/3"}, {"cref": "#/texts/4"}, {"cref": "#/texts/5"}, {"cref": "#/texts/6"}, {"cref": "#/texts/7"}, {"cref": "#/texts/8"}, {"cref": "#/texts/9"}, {"cref": "#/texts/10"}, {"cref": "#/texts/11"}, {"cref": "#/texts/12"}, {"cref": "#/texts/13"}], "name": "_root_", "label": "unspecified"}, "groups": [], "texts": [{"self_ref": "#/texts/0", "parent": {"cref": "#/body"}, "children": [], "label": "section_header", "prov": [{"page_no": 1, "bbox": {"l": 133.76800537109375, "t": 667.99462890625, "r": 273.4540100097656, "b": 653.6340942382812, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 17]}], "orig": "Java Code Example", "text": "Java Code Example", "level": 1}, {"self_ref": "#/texts/1", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 133.76800537109375, "t": 642.8859252929688, "r": 477.48065185546875, "b": 501.4163513183594, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 887]}], "orig": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet.", "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet."}, {"self_ref": "#/texts/2", "parent": {"cref": "#/body"}, "children": [], "label": "paragraph", "prov": [{"page_no": 1, "bbox": {"l": 236.17599487304688, "t": 490.45794677734375, "r": 375.069580078125, "b": 480.4953308105469, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 30]}], "orig": "Listing 1: Simple Java Program", "text": "Listing 1: Simple Java Program"}, {"self_ref": "#/texts/3", "parent": {"cref": "#/body"}, "children": [], "label": "code", "prov": [{"page_no": 1, "bbox": {"l": 134.23899841308594, "t": 474.2005310058594, "r": 337.5928649902344, "b": 443.9358215332031, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 65]}], "orig": "public static void print() { System.out.println( \"Java Code\" ); }", "text": "public static void print() { System.out.println( \"Java Code\" ); }", "code_language": "unknown"}, {"self_ref": "#/texts/4", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 133.76800537109375, "t": 432.27593994140625, "r": 477.47589111328125, "b": 290.80633544921875, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 887]}], "orig": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet.", "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet."}, {"self_ref": "#/texts/5", "parent": {"cref": "#/body"}, "children": [], "label": "page_footer", "prov": [{"page_no": 1, "bbox": {"l": 303.13299560546875, "t": 96.83694458007812, "r": 308.1142883300781, "b": 86.87435150146484, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "1", "text": "1"}, {"self_ref": "#/texts/6", "parent": {"cref": "#/body"}, "children": [], "label": "section_header", "prov": [{"page_no": 2, "bbox": {"l": 133.76800537109375, "t": 717.8846435546875, "r": 191.51429748535156, "b": 703.5241088867188, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 7]}], "orig": "Formula", "text": "Formula", "level": 1}, {"self_ref": "#/texts/7", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 133.76800537109375, "t": 692.7759399414062, "r": 477.48065185546875, "b": 551.3063354492188, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 887]}], "orig": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet.", "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet."}, {"self_ref": "#/texts/8", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 133.76800537109375, "t": 549.3139038085938, "r": 477.4748229980469, "b": 491.53033447265625, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 369]}], "orig": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore te feugait nulla facilisi. Lorem ipsum dolor sit amet, consectetuer adipiscing elit, sed diam nonummy nibh euismod tincidunt.", "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore te feugait nulla facilisi. Lorem ipsum dolor sit amet, consectetuer adipiscing elit, sed diam nonummy nibh euismod tincidunt."}, {"self_ref": "#/texts/9", "parent": {"cref": "#/body"}, "children": [], "label": "formula", "prov": [{"page_no": 2, "bbox": {"l": 280.5539855957031, "t": 479.4553527832031, "r": 330.69659423828125, "b": 467.6203308105469, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 12]}], "orig": "a 2 + 8 = 12", "text": "a 2 + 8 = 12"}, {"self_ref": "#/texts/10", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 133.76800537109375, "t": 459.64996337890625, "r": 477.47589111328125, "b": 318.1803283691406, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 887]}], "orig": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet.", "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet."}, {"self_ref": "#/texts/11", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 133.76800537109375, "t": 316.1879577636719, "r": 477.4748229980469, "b": 246.44935607910156, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 415]}], "orig": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore te feugait nulla facilisi. Lorem ipsum dolor sit amet, consectetuer adipiscing elit, sed diam nonummy nibh euismod tincidunt ut laoreet dolore magna aliquam erat volutpat.", "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore te feugait nulla facilisi. Lorem ipsum dolor sit amet, consectetuer adipiscing elit, sed diam nonummy nibh euismod tincidunt ut laoreet dolore magna aliquam erat volutpat."}, {"self_ref": "#/texts/12", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 133.76800537109375, "t": 244.4569549560547, "r": 477.4748229980469, "b": 174.71835327148438, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 415]}], "orig": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore te feugait nulla facilisi. Lorem ipsum dolor sit amet, consectetuer adipiscing elit, sed diam nonummy nibh euismod tincidunt ut laoreet dolore magna aliquam erat volutpat.", "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore te feugait nulla facilisi. Lorem ipsum dolor sit amet, consectetuer adipiscing elit, sed diam nonummy nibh euismod tincidunt ut laoreet dolore magna aliquam erat volutpat."}, {"self_ref": "#/texts/13", "parent": {"cref": "#/body"}, "children": [], "label": "page_footer", "prov": [{"page_no": 2, "bbox": {"l": 303.13299560546875, "t": 146.7259521484375, "r": 308.1142883300781, "b": 136.7633514404297, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "1", "text": "1"}], "pictures": [], "tables": [], "key_value_items": [], "pages": {"1": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 1}, "2": {"size": {"width": 595.2760009765625, "height": 841.8900146484375}, "image": null, "page_no": 2}}}
\ No newline at end of file
+{"schema_name": "DoclingDocument", "version": "1.1.0", "name": "code_and_formula", "origin": {"mimetype": "application/pdf", "binary_hash": 8967166443255744998, "filename": "code_and_formula.pdf", "uri": null}, "furniture": {"self_ref": "#/furniture", "parent": null, "children": [], "content_layer": "furniture", "name": "_root_", "label": "unspecified"}, "body": {"self_ref": "#/body", "parent": null, "children": [{"cref": "#/texts/0"}, {"cref": "#/texts/1"}, {"cref": "#/texts/2"}, {"cref": "#/texts/3"}, {"cref": "#/texts/5"}, {"cref": "#/texts/6"}, {"cref": "#/texts/7"}, {"cref": "#/texts/8"}, {"cref": "#/texts/9"}, {"cref": "#/texts/10"}, {"cref": "#/texts/11"}, {"cref": "#/texts/12"}, {"cref": "#/texts/13"}, {"cref": "#/texts/14"}, {"cref": "#/texts/15"}], "content_layer": "body", "name": "_root_", "label": "unspecified"}, "groups": [], "texts": [{"self_ref": "#/texts/0", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "section_header", "prov": [{"page_no": 1, "bbox": {"l": 133.76801, "t": 667.19122, "r": 315.91595, "b": 654.45184, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 23]}], "orig": "JavaScript Code Example", "text": "JavaScript Code Example", "level": 1}, {"self_ref": "#/texts/1", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 133.76801, "t": 642.32806, "r": 477.48276, "b": 501.97412, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 887]}], "orig": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet.", "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet."}, {"self_ref": "#/texts/2", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 133.76801, "t": 498.86591, "r": 477.47876, "b": 454.15417, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 298]}], "orig": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore te feugait nulla facilisi. Lorem ipsum dolor sit amet,", "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore te feugait nulla facilisi. Lorem ipsum dolor sit amet,"}, {"self_ref": "#/texts/3", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/4"}], "content_layer": "body", "label": "code", "prov": [{"page_no": 1, "bbox": {"l": 134.239, "t": 425.6004899999999, "r": 263.22409, "b": 385.25446, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 60]}], "orig": "function add(a, b) { return a + b; } console.log(add(3, 5));", "text": "function add(a, b) { return a + b; } console.log(add(3, 5));", "captions": [{"cref": "#/texts/4"}], "references": [], "footnotes": [], "image": null, "code_language": "unknown"}, {"self_ref": "#/texts/4", "parent": {"cref": "#/texts/3"}, "children": [], "content_layer": "body", "label": "caption", "prov": [{"page_no": 1, "bbox": {"l": 223.15500000000003, "t": 442.07895, "r": 388.09375, "b": 433.23218, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 36]}], "orig": "Listing 1: Simple JavaScript Program", "text": "Listing 1: Simple JavaScript Program"}, {"self_ref": "#/texts/5", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 133.76801, "t": 372.93902999999995, "r": 477.48172000000005, "b": 232.58536000000004, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 887]}], "orig": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet.", "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet."}, {"self_ref": "#/texts/6", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 133.76801, "t": 229.47713999999996, "r": 477.47876, "b": 184.76436, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 298]}], "orig": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore te feugait nulla facilisi. Lorem ipsum dolor sit amet,", "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore te feugait nulla facilisi. Lorem ipsum dolor sit amet,"}, {"self_ref": "#/texts/7", "parent": {"cref": "#/body"}, "children": [], "content_layer": "furniture", "label": "page_footer", "prov": [{"page_no": 1, "bbox": {"l": 303.133, "t": 96.27914399999997, "r": 308.11429, "b": 87.43235000000004, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "1", "text": "1"}, {"self_ref": "#/texts/8", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "section_header", "prov": [{"page_no": 2, "bbox": {"l": 133.76801021944917, "t": 717.0812439593145, "r": 191.5272403142044, "b": 704.341863888975, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 7]}], "orig": "Formula", "text": "Formula", "level": 1}, {"self_ref": "#/texts/9", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 133.76801021944917, "t": 692.2180838220343, "r": 477.48276078332026, "b": 551.8641430470798, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 887]}], "orig": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet.", "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet."}, {"self_ref": "#/texts/10", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 133.76801021944917, "t": 548.7559230299179, "r": 477.48163078331845, "b": 492.0881027170305, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 369]}], "orig": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore te feugait nulla facilisi. Lorem ipsum dolor sit amet, consectetuer adipiscing elit, sed diam nonummy nibh euismod tincidunt.", "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore te feugait nulla facilisi. Lorem ipsum dolor sit amet, consectetuer adipiscing elit, sed diam nonummy nibh euismod tincidunt."}, {"self_ref": "#/texts/11", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "formula", "prov": [{"page_no": 2, "bbox": {"l": 280.5540204602546, "t": 479.06467264512247, "r": 330.6965605425145, "b": 468.178102585013, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 12]}], "orig": "a 2 + 8 = 12", "text": ""}, {"self_ref": "#/texts/12", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 133.76799021944913, "t": 459.091862534844, "r": 477.4816907833186, "b": 318.7382217598911, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 887]}], "orig": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet.", "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet."}, {"self_ref": "#/texts/13", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 133.76799021944913, "t": 315.6300017427293, "r": 477.48370078332186, "b": 247.0072913638337, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 415]}], "orig": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore te feugait nulla facilisi. Lorem ipsum dolor sit amet, consectetuer adipiscing elit, sed diam nonummy nibh euismod tincidunt ut laoreet dolore magna aliquam erat volutpat.", "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore te feugait nulla facilisi. Lorem ipsum dolor sit amet, consectetuer adipiscing elit, sed diam nonummy nibh euismod tincidunt ut laoreet dolore magna aliquam erat volutpat."}, {"self_ref": "#/texts/14", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 133.76799021944913, "t": 243.8990813466719, "r": 477.48370078332186, "b": 175.27629096777594, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 415]}], "orig": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore te feugait nulla facilisi. Lorem ipsum dolor sit amet, consectetuer adipiscing elit, sed diam nonummy nibh euismod tincidunt ut laoreet dolore magna aliquam erat volutpat.", "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore te feugait nulla facilisi. Lorem ipsum dolor sit amet, consectetuer adipiscing elit, sed diam nonummy nibh euismod tincidunt ut laoreet dolore magna aliquam erat volutpat."}, {"self_ref": "#/texts/15", "parent": {"cref": "#/body"}, "children": [], "content_layer": "furniture", "label": "page_footer", "prov": [{"page_no": 2, "bbox": {"l": 303.13300049729594, "t": 146.16808080705698, "r": 308.1142905054678, "b": 137.32129075821, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "1", "text": "1"}], "pictures": [], "tables": [], "key_value_items": [], "form_items": [], "pages": {"1": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 1}, "2": {"size": {"width": 595.2760009765625, "height": 841.8900146484375}, "image": null, "page_no": 2}}}
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v2/code_and_formula.md b/tests/data/groundtruth/docling_v2/code_and_formula.md
index 5a2ad9c8..e1bd20e0 100644
--- a/tests/data/groundtruth/docling_v2/code_and_formula.md
+++ b/tests/data/groundtruth/docling_v2/code_and_formula.md
@@ -1,22 +1,24 @@
-## Java Code Example
+## JavaScript Code Example
 
 Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet.
 
-Listing 1: Simple Java Program
+Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore te feugait nulla facilisi. Lorem ipsum dolor sit amet,
 
 ```
-public static void print() { System.out.println( "Java Code" ); }
+function add(a, b) { return a + b; } console.log(add(3, 5));
 ```
 
 Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet.
 
+Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore te feugait nulla facilisi. Lorem ipsum dolor sit amet,
+
 ## Formula
 
 Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet.
 
 Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore te feugait nulla facilisi. Lorem ipsum dolor sit amet, consectetuer adipiscing elit, sed diam nonummy nibh euismod tincidunt.
 
-$$a 2 + 8 = 12$$
+<!-- formula-not-decoded -->
 
 Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet.
 
diff --git a/tests/data/groundtruth/docling_v2/code_and_formula.pages.json b/tests/data/groundtruth/docling_v2/code_and_formula.pages.json
index 066a802d..a2e04507 100644
--- a/tests/data/groundtruth/docling_v2/code_and_formula.pages.json
+++ b/tests/data/groundtruth/docling_v2/code_and_formula.pages.json
@@ -1 +1 @@
-[{"page_no": 0, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "Java Code Example", "bbox": {"l": 133.76801, "t": 124.00536999999997, "r": 273.45401, "b": 138.36590999999999, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eir-", "bbox": {"l": 133.76801, "t": 149.11406999999997, "r": 477.47687, "b": 159.07665999999995, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "mod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam volup-", "bbox": {"l": 133.76801, "t": 161.06908999999996, "r": 477.47781000000003, "b": 171.03168000000005, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "tua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd", "bbox": {"l": 133.76801, "t": 173.02405, "r": 477.46985, "b": 182.98663, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ip-", "bbox": {"l": 133.76801, "t": 184.97906, "r": 477.47186, "b": 194.94164999999998, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "sum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor", "bbox": {"l": 133.76801, "t": 196.93408, "r": 477.46993999999995, "b": 206.89666999999997, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero", "bbox": {"l": 133.76801, "t": 208.88909999999998, "r": 477.4806500000001, "b": 218.85168, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "eos et accusam et justo duo dolores et ea rebum.", "bbox": {"l": 133.76801, "t": 220.84509000000003, "r": 355.20087, "b": 230.80768, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Stet clita kasd gubergren,", "bbox": {"l": 362.60107, "t": 220.84509000000003, "r": 477.47495000000004, "b": 230.80768, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor", "bbox": {"l": 133.76801, "t": 232.80005000000006, "r": 477.47083, "b": 242.76262999999994, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt", "bbox": {"l": 133.76801, "t": 244.75507000000005, "r": 477.47092, "b": 254.71765000000005, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et", "bbox": {"l": 133.76801, "t": 256.71007999999995, "r": 477.46588, "b": 266.67267000000004, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea", "bbox": {"l": 133.76801, "t": 268.66510000000005, "r": 477.47586, "b": 278.62769000000003, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "takimata sanctus est Lorem ipsum dolor sit amet.", "bbox": {"l": 133.76801, "t": 280.62103, "r": 351.47672, "b": 290.58365, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Listing 1: Simple Java Program", "bbox": {"l": 236.17598999999998, "t": 301.54204999999996, "r": 375.06958, "b": 311.50467, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "public static void", "bbox": {"l": 134.575, "t": 317.79947000000004, "r": 235.44695, "b": 326.14719, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "print() {", "bbox": {"l": 241.8759, "t": 317.79947000000004, "r": 292.24908, "b": 326.14719, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "System.out.println(", "bbox": {"l": 157.17101, "t": 328.75745, "r": 264.02368, "b": 337.10516000000007, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "\"Java Code\"", "bbox": {"l": 264.15811, "t": 328.75745, "r": 325.35376, "b": 337.10516000000007, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": ");", "bbox": {"l": 326.2952, "t": 328.75745, "r": 337.59286, "b": 337.10516000000007, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "}", "bbox": {"l": 134.239, "t": 339.71646, "r": 138.94637, "b": 348.06418, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy", "bbox": {"l": 148.71201, "t": 359.72406, "r": 477.46985, "b": 369.68667999999997, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam", "bbox": {"l": 133.76801, "t": 371.67905, "r": 477.4758, "b": 381.64166000000006, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita", "bbox": {"l": 133.76801, "t": 383.63403, "r": 477.4758, "b": 393.59665, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem", "bbox": {"l": 133.76801, "t": 395.58905, "r": 477.47284, "b": 405.55167, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod", "bbox": {"l": 133.76801, "t": 407.54404, "r": 477.47589, "b": 417.50665, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At", "bbox": {"l": 133.76801, "t": 419.50003000000004, "r": 477.47177000000005, "b": 429.46265, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren,", "bbox": {"l": 133.76801, "t": 431.45505, "r": 477.47387999999995, "b": 441.41766000000007, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor", "bbox": {"l": 133.76801, "t": 443.41003, "r": 477.47083, "b": 453.37265, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt", "bbox": {"l": 133.76801, "t": 455.36505, "r": 477.47092, "b": 465.32767, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et", "bbox": {"l": 133.76801, "t": 467.32004, "r": 477.46585, "b": 477.28265, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea", "bbox": {"l": 133.76801, "t": 479.27603, "r": 477.47586, "b": 489.23865, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "takimata sanctus est Lorem ipsum dolor sit amet.", "bbox": {"l": 133.76801, "t": 491.23105, "r": 351.47672, "b": 501.19366, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "1", "bbox": {"l": 303.133, "t": 695.163055, "r": 308.11429, "b": 705.125648, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 2, "label": "section_header", "bbox": {"l": 133.76801, "t": 124.00536999999997, "r": 273.45401, "b": 138.36590999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9581766128540039, "cells": [{"id": 0, "text": "Java Code Example", "bbox": {"l": 133.76801, "t": 124.00536999999997, "r": 273.45401, "b": 138.36590999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 133.76801, "t": 149.11406999999997, "r": 477.4806500000001, "b": 290.58365, "coord_origin": "TOPLEFT"}, "confidence": 0.9872456789016724, "cells": [{"id": 1, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eir-", "bbox": {"l": 133.76801, "t": 149.11406999999997, "r": 477.47687, "b": 159.07665999999995, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "mod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam volup-", "bbox": {"l": 133.76801, "t": 161.06908999999996, "r": 477.47781000000003, "b": 171.03168000000005, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "tua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd", "bbox": {"l": 133.76801, "t": 173.02405, "r": 477.46985, "b": 182.98663, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ip-", "bbox": {"l": 133.76801, "t": 184.97906, "r": 477.47186, "b": 194.94164999999998, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "sum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor", "bbox": {"l": 133.76801, "t": 196.93408, "r": 477.46993999999995, "b": 206.89666999999997, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero", "bbox": {"l": 133.76801, "t": 208.88909999999998, "r": 477.4806500000001, "b": 218.85168, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "eos et accusam et justo duo dolores et ea rebum.", "bbox": {"l": 133.76801, "t": 220.84509000000003, "r": 355.20087, "b": 230.80768, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Stet clita kasd gubergren,", "bbox": {"l": 362.60107, "t": 220.84509000000003, "r": 477.47495000000004, "b": 230.80768, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor", "bbox": {"l": 133.76801, "t": 232.80005000000006, "r": 477.47083, "b": 242.76262999999994, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt", "bbox": {"l": 133.76801, "t": 244.75507000000005, "r": 477.47092, "b": 254.71765000000005, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et", "bbox": {"l": 133.76801, "t": 256.71007999999995, "r": 477.46588, "b": 266.67267000000004, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea", "bbox": {"l": 133.76801, "t": 268.66510000000005, "r": 477.47586, "b": 278.62769000000003, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "takimata sanctus est Lorem ipsum dolor sit amet.", "bbox": {"l": 133.76801, "t": 280.62103, "r": 351.47672, "b": 290.58365, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "caption", "bbox": {"l": 236.17598999999998, "t": 301.54204999999996, "r": 375.06958, "b": 311.50467, "coord_origin": "TOPLEFT"}, "confidence": 0.5425280332565308, "cells": [{"id": 14, "text": "Listing 1: Simple Java Program", "bbox": {"l": 236.17598999999998, "t": 301.54204999999996, "r": 375.06958, "b": 311.50467, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "code", "bbox": {"l": 134.239, "t": 317.79947000000004, "r": 337.59286, "b": 348.06418, "coord_origin": "TOPLEFT"}, "confidence": 0.6383118033409119, "cells": [{"id": 15, "text": "public static void", "bbox": {"l": 134.575, "t": 317.79947000000004, "r": 235.44695, "b": 326.14719, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "print() {", "bbox": {"l": 241.8759, "t": 317.79947000000004, "r": 292.24908, "b": 326.14719, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "System.out.println(", "bbox": {"l": 157.17101, "t": 328.75745, "r": 264.02368, "b": 337.10516000000007, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "\"Java Code\"", "bbox": {"l": 264.15811, "t": 328.75745, "r": 325.35376, "b": 337.10516000000007, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": ");", "bbox": {"l": 326.2952, "t": 328.75745, "r": 337.59286, "b": 337.10516000000007, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "}", "bbox": {"l": 134.239, "t": 339.71646, "r": 138.94637, "b": 348.06418, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 133.76801, "t": 359.72406, "r": 477.47589, "b": 501.19366, "coord_origin": "TOPLEFT"}, "confidence": 0.9869542717933655, "cells": [{"id": 21, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy", "bbox": {"l": 148.71201, "t": 359.72406, "r": 477.46985, "b": 369.68667999999997, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam", "bbox": {"l": 133.76801, "t": 371.67905, "r": 477.4758, "b": 381.64166000000006, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita", "bbox": {"l": 133.76801, "t": 383.63403, "r": 477.4758, "b": 393.59665, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem", "bbox": {"l": 133.76801, "t": 395.58905, "r": 477.47284, "b": 405.55167, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod", "bbox": {"l": 133.76801, "t": 407.54404, "r": 477.47589, "b": 417.50665, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At", "bbox": {"l": 133.76801, "t": 419.50003000000004, "r": 477.47177000000005, "b": 429.46265, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren,", "bbox": {"l": 133.76801, "t": 431.45505, "r": 477.47387999999995, "b": 441.41766000000007, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor", "bbox": {"l": 133.76801, "t": 443.41003, "r": 477.47083, "b": 453.37265, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt", "bbox": {"l": 133.76801, "t": 455.36505, "r": 477.47092, "b": 465.32767, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et", "bbox": {"l": 133.76801, "t": 467.32004, "r": 477.46585, "b": 477.28265, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea", "bbox": {"l": 133.76801, "t": 479.27603, "r": 477.47586, "b": 489.23865, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "takimata sanctus est Lorem ipsum dolor sit amet.", "bbox": {"l": 133.76801, "t": 491.23105, "r": 351.47672, "b": 501.19366, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "page_footer", "bbox": {"l": 303.133, "t": 695.163055, "r": 308.11429, "b": 705.125648, "coord_origin": "TOPLEFT"}, "confidence": 0.8374727964401245, "cells": [{"id": 33, "text": "1", "bbox": {"l": 303.133, "t": 695.163055, "r": 308.11429, "b": 705.125648, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "section_header", "id": 2, "page_no": 0, "cluster": {"id": 2, "label": "section_header", "bbox": {"l": 133.76801, "t": 124.00536999999997, "r": 273.45401, "b": 138.36590999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9581766128540039, "cells": [{"id": 0, "text": "Java Code Example", "bbox": {"l": 133.76801, "t": 124.00536999999997, "r": 273.45401, "b": 138.36590999999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Java Code Example"}, {"label": "text", "id": 0, "page_no": 0, "cluster": {"id": 0, "label": "text", "bbox": {"l": 133.76801, "t": 149.11406999999997, "r": 477.4806500000001, "b": 290.58365, "coord_origin": "TOPLEFT"}, "confidence": 0.9872456789016724, "cells": [{"id": 1, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eir-", "bbox": {"l": 133.76801, "t": 149.11406999999997, "r": 477.47687, "b": 159.07665999999995, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "mod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam volup-", "bbox": {"l": 133.76801, "t": 161.06908999999996, "r": 477.47781000000003, "b": 171.03168000000005, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "tua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd", "bbox": {"l": 133.76801, "t": 173.02405, "r": 477.46985, "b": 182.98663, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ip-", "bbox": {"l": 133.76801, "t": 184.97906, "r": 477.47186, "b": 194.94164999999998, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "sum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor", "bbox": {"l": 133.76801, "t": 196.93408, "r": 477.46993999999995, "b": 206.89666999999997, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero", "bbox": {"l": 133.76801, "t": 208.88909999999998, "r": 477.4806500000001, "b": 218.85168, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "eos et accusam et justo duo dolores et ea rebum.", "bbox": {"l": 133.76801, "t": 220.84509000000003, "r": 355.20087, "b": 230.80768, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Stet clita kasd gubergren,", "bbox": {"l": 362.60107, "t": 220.84509000000003, "r": 477.47495000000004, "b": 230.80768, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor", "bbox": {"l": 133.76801, "t": 232.80005000000006, "r": 477.47083, "b": 242.76262999999994, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt", "bbox": {"l": 133.76801, "t": 244.75507000000005, "r": 477.47092, "b": 254.71765000000005, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et", "bbox": {"l": 133.76801, "t": 256.71007999999995, "r": 477.46588, "b": 266.67267000000004, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea", "bbox": {"l": 133.76801, "t": 268.66510000000005, "r": 477.47586, "b": 278.62769000000003, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "takimata sanctus est Lorem ipsum dolor sit amet.", "bbox": {"l": 133.76801, "t": 280.62103, "r": 351.47672, "b": 290.58365, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet."}, {"label": "caption", "id": 5, "page_no": 0, "cluster": {"id": 5, "label": "caption", "bbox": {"l": 236.17598999999998, "t": 301.54204999999996, "r": 375.06958, "b": 311.50467, "coord_origin": "TOPLEFT"}, "confidence": 0.5425280332565308, "cells": [{"id": 14, "text": "Listing 1: Simple Java Program", "bbox": {"l": 236.17598999999998, "t": 301.54204999999996, "r": 375.06958, "b": 311.50467, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Listing 1: Simple Java Program"}, {"label": "code", "id": 4, "page_no": 0, "cluster": {"id": 4, "label": "code", "bbox": {"l": 134.239, "t": 317.79947000000004, "r": 337.59286, "b": 348.06418, "coord_origin": "TOPLEFT"}, "confidence": 0.6383118033409119, "cells": [{"id": 15, "text": "public static void", "bbox": {"l": 134.575, "t": 317.79947000000004, "r": 235.44695, "b": 326.14719, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "print() {", "bbox": {"l": 241.8759, "t": 317.79947000000004, "r": 292.24908, "b": 326.14719, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "System.out.println(", "bbox": {"l": 157.17101, "t": 328.75745, "r": 264.02368, "b": 337.10516000000007, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "\"Java Code\"", "bbox": {"l": 264.15811, "t": 328.75745, "r": 325.35376, "b": 337.10516000000007, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": ");", "bbox": {"l": 326.2952, "t": 328.75745, "r": 337.59286, "b": 337.10516000000007, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "}", "bbox": {"l": 134.239, "t": 339.71646, "r": 138.94637, "b": 348.06418, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "public static void print() { System.out.println( \"Java Code\" ); }"}, {"label": "text", "id": 1, "page_no": 0, "cluster": {"id": 1, "label": "text", "bbox": {"l": 133.76801, "t": 359.72406, "r": 477.47589, "b": 501.19366, "coord_origin": "TOPLEFT"}, "confidence": 0.9869542717933655, "cells": [{"id": 21, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy", "bbox": {"l": 148.71201, "t": 359.72406, "r": 477.46985, "b": 369.68667999999997, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam", "bbox": {"l": 133.76801, "t": 371.67905, "r": 477.4758, "b": 381.64166000000006, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita", "bbox": {"l": 133.76801, "t": 383.63403, "r": 477.4758, "b": 393.59665, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem", "bbox": {"l": 133.76801, "t": 395.58905, "r": 477.47284, "b": 405.55167, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod", "bbox": {"l": 133.76801, "t": 407.54404, "r": 477.47589, "b": 417.50665, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At", "bbox": {"l": 133.76801, "t": 419.50003000000004, "r": 477.47177000000005, "b": 429.46265, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren,", "bbox": {"l": 133.76801, "t": 431.45505, "r": 477.47387999999995, "b": 441.41766000000007, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor", "bbox": {"l": 133.76801, "t": 443.41003, "r": 477.47083, "b": 453.37265, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt", "bbox": {"l": 133.76801, "t": 455.36505, "r": 477.47092, "b": 465.32767, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et", "bbox": {"l": 133.76801, "t": 467.32004, "r": 477.46585, "b": 477.28265, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea", "bbox": {"l": 133.76801, "t": 479.27603, "r": 477.47586, "b": 489.23865, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "takimata sanctus est Lorem ipsum dolor sit amet.", "bbox": {"l": 133.76801, "t": 491.23105, "r": 351.47672, "b": 501.19366, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet."}, {"label": "page_footer", "id": 3, "page_no": 0, "cluster": {"id": 3, "label": "page_footer", "bbox": {"l": 303.133, "t": 695.163055, "r": 308.11429, "b": 705.125648, "coord_origin": "TOPLEFT"}, "confidence": 0.8374727964401245, "cells": [{"id": 33, "text": "1", "bbox": {"l": 303.133, "t": 695.163055, "r": 308.11429, "b": 705.125648, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1"}], "body": [{"label": "section_header", "id": 2, "page_no": 0, "cluster": {"id": 2, "label": "section_header", "bbox": {"l": 133.76801, "t": 124.00536999999997, "r": 273.45401, "b": 138.36590999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9581766128540039, "cells": [{"id": 0, "text": "Java Code Example", "bbox": {"l": 133.76801, "t": 124.00536999999997, "r": 273.45401, "b": 138.36590999999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Java Code Example"}, {"label": "text", "id": 0, "page_no": 0, "cluster": {"id": 0, "label": "text", "bbox": {"l": 133.76801, "t": 149.11406999999997, "r": 477.4806500000001, "b": 290.58365, "coord_origin": "TOPLEFT"}, "confidence": 0.9872456789016724, "cells": [{"id": 1, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eir-", "bbox": {"l": 133.76801, "t": 149.11406999999997, "r": 477.47687, "b": 159.07665999999995, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "mod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam volup-", "bbox": {"l": 133.76801, "t": 161.06908999999996, "r": 477.47781000000003, "b": 171.03168000000005, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "tua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd", "bbox": {"l": 133.76801, "t": 173.02405, "r": 477.46985, "b": 182.98663, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ip-", "bbox": {"l": 133.76801, "t": 184.97906, "r": 477.47186, "b": 194.94164999999998, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "sum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor", "bbox": {"l": 133.76801, "t": 196.93408, "r": 477.46993999999995, "b": 206.89666999999997, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero", "bbox": {"l": 133.76801, "t": 208.88909999999998, "r": 477.4806500000001, "b": 218.85168, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "eos et accusam et justo duo dolores et ea rebum.", "bbox": {"l": 133.76801, "t": 220.84509000000003, "r": 355.20087, "b": 230.80768, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Stet clita kasd gubergren,", "bbox": {"l": 362.60107, "t": 220.84509000000003, "r": 477.47495000000004, "b": 230.80768, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor", "bbox": {"l": 133.76801, "t": 232.80005000000006, "r": 477.47083, "b": 242.76262999999994, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt", "bbox": {"l": 133.76801, "t": 244.75507000000005, "r": 477.47092, "b": 254.71765000000005, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et", "bbox": {"l": 133.76801, "t": 256.71007999999995, "r": 477.46588, "b": 266.67267000000004, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea", "bbox": {"l": 133.76801, "t": 268.66510000000005, "r": 477.47586, "b": 278.62769000000003, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "takimata sanctus est Lorem ipsum dolor sit amet.", "bbox": {"l": 133.76801, "t": 280.62103, "r": 351.47672, "b": 290.58365, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet."}, {"label": "caption", "id": 5, "page_no": 0, "cluster": {"id": 5, "label": "caption", "bbox": {"l": 236.17598999999998, "t": 301.54204999999996, "r": 375.06958, "b": 311.50467, "coord_origin": "TOPLEFT"}, "confidence": 0.5425280332565308, "cells": [{"id": 14, "text": "Listing 1: Simple Java Program", "bbox": {"l": 236.17598999999998, "t": 301.54204999999996, "r": 375.06958, "b": 311.50467, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Listing 1: Simple Java Program"}, {"label": "code", "id": 4, "page_no": 0, "cluster": {"id": 4, "label": "code", "bbox": {"l": 134.239, "t": 317.79947000000004, "r": 337.59286, "b": 348.06418, "coord_origin": "TOPLEFT"}, "confidence": 0.6383118033409119, "cells": [{"id": 15, "text": "public static void", "bbox": {"l": 134.575, "t": 317.79947000000004, "r": 235.44695, "b": 326.14719, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "print() {", "bbox": {"l": 241.8759, "t": 317.79947000000004, "r": 292.24908, "b": 326.14719, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "System.out.println(", "bbox": {"l": 157.17101, "t": 328.75745, "r": 264.02368, "b": 337.10516000000007, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "\"Java Code\"", "bbox": {"l": 264.15811, "t": 328.75745, "r": 325.35376, "b": 337.10516000000007, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": ");", "bbox": {"l": 326.2952, "t": 328.75745, "r": 337.59286, "b": 337.10516000000007, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "}", "bbox": {"l": 134.239, "t": 339.71646, "r": 138.94637, "b": 348.06418, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "public static void print() { System.out.println( \"Java Code\" ); }"}, {"label": "text", "id": 1, "page_no": 0, "cluster": {"id": 1, "label": "text", "bbox": {"l": 133.76801, "t": 359.72406, "r": 477.47589, "b": 501.19366, "coord_origin": "TOPLEFT"}, "confidence": 0.9869542717933655, "cells": [{"id": 21, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy", "bbox": {"l": 148.71201, "t": 359.72406, "r": 477.46985, "b": 369.68667999999997, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam", "bbox": {"l": 133.76801, "t": 371.67905, "r": 477.4758, "b": 381.64166000000006, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita", "bbox": {"l": 133.76801, "t": 383.63403, "r": 477.4758, "b": 393.59665, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem", "bbox": {"l": 133.76801, "t": 395.58905, "r": 477.47284, "b": 405.55167, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod", "bbox": {"l": 133.76801, "t": 407.54404, "r": 477.47589, "b": 417.50665, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At", "bbox": {"l": 133.76801, "t": 419.50003000000004, "r": 477.47177000000005, "b": 429.46265, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren,", "bbox": {"l": 133.76801, "t": 431.45505, "r": 477.47387999999995, "b": 441.41766000000007, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor", "bbox": {"l": 133.76801, "t": 443.41003, "r": 477.47083, "b": 453.37265, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt", "bbox": {"l": 133.76801, "t": 455.36505, "r": 477.47092, "b": 465.32767, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et", "bbox": {"l": 133.76801, "t": 467.32004, "r": 477.46585, "b": 477.28265, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea", "bbox": {"l": 133.76801, "t": 479.27603, "r": 477.47586, "b": 489.23865, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "takimata sanctus est Lorem ipsum dolor sit amet.", "bbox": {"l": 133.76801, "t": 491.23105, "r": 351.47672, "b": 501.19366, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet."}], "headers": [{"label": "page_footer", "id": 3, "page_no": 0, "cluster": {"id": 3, "label": "page_footer", "bbox": {"l": 303.133, "t": 695.163055, "r": 308.11429, "b": 705.125648, "coord_origin": "TOPLEFT"}, "confidence": 0.8374727964401245, "cells": [{"id": 33, "text": "1", "bbox": {"l": 303.133, "t": 695.163055, "r": 308.11429, "b": 705.125648, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1"}]}}, {"page_no": 1, "size": {"width": 595.2760009765625, "height": 841.8900146484375}, "cells": [{"id": 0, "text": "Formula", "bbox": {"l": 133.76801021944917, "t": 124.00537068468714, "r": 191.51430031418315, "b": 138.36590076397772, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eir-", "bbox": {"l": 133.76801021944917, "t": 149.114070823323, "r": 477.47687078331063, "b": 159.0766608783307, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "mod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam volup-", "bbox": {"l": 133.76801021944917, "t": 161.06909088933185, "r": 477.4778107833122, "b": 171.03167094433945, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "tua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd", "bbox": {"l": 133.76801021944917, "t": 173.0241009553406, "r": 477.46985078329914, "b": 182.9866910103483, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ip-", "bbox": {"l": 133.76801021944917, "t": 184.97906102134914, "r": 477.4718607833024, "b": 194.94165107635683, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "sum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor", "bbox": {"l": 133.76801021944917, "t": 196.93511108736357, "r": 477.4699407832993, "b": 206.89770114237137, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero", "bbox": {"l": 133.76801021944917, "t": 208.890071153372, "r": 477.4806507833169, "b": 218.8526612083799, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "eos et accusam et justo duo dolores et ea rebum.", "bbox": {"l": 133.76801021944917, "t": 220.84509121938083, "r": 355.20087058271434, "b": 230.80767127438855, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Stet clita kasd gubergren,", "bbox": {"l": 362.6010705948545, "t": 220.84509121938083, "r": 477.4749507833075, "b": 230.80767127438855, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor", "bbox": {"l": 133.76801021944917, "t": 232.8001112853898, "r": 477.4708307833007, "b": 242.76269134039728, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt", "bbox": {"l": 133.76801021944917, "t": 244.75506135139813, "r": 477.4709207833008, "b": 254.71765140640582, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et", "bbox": {"l": 133.76801021944917, "t": 256.71008141740685, "r": 477.4658807832926, "b": 266.6726614724146, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea", "bbox": {"l": 133.76801021944917, "t": 268.6660714834211, "r": 477.47586078330903, "b": 278.6286615384289, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "takimata sanctus est Lorem ipsum dolor sit amet.", "bbox": {"l": 133.76801021944917, "t": 280.62109154942993, "r": 351.4767205766048, "b": 290.58367160443765, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie", "bbox": {"l": 148.71201024396512, "t": 292.5761116154388, "r": 477.4710707833011, "b": 302.5386916704465, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et", "bbox": {"l": 133.76801021944917, "t": 304.5310616814471, "r": 477.47293078330415, "b": 314.4936517364549, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore", "bbox": {"l": 133.76801021944917, "t": 316.48608174745607, "r": 477.47482078330734, "b": 326.4486618024637, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "te feugait nulla facilisi. Lorem ipsum dolor sit amet, consectetuer adipiscing elit,", "bbox": {"l": 133.76801021944917, "t": 328.4411018134648, "r": 477.472810783304, "b": 338.40368186847246, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "sed diam nonummy nibh euismod tincidunt.", "bbox": {"l": 133.76801021944917, "t": 340.3970618794788, "r": 326.20752053515014, "b": 350.3596819344868, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "a", "bbox": {"l": 280.5539904602546, "t": 364.3070620114962, "r": 285.8142404688841, "b": 374.2696820665041, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "2", "bbox": {"l": 285.8200104688936, "t": 362.4346620011579, "r": 289.78809047540335, "b": 369.40844203966316, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "+ 8 = 12", "bbox": {"l": 292.50400047985886, "t": 364.3070620114962, "r": 330.6965905425146, "b": 374.2696820665041, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy", "bbox": {"l": 148.71201024396512, "t": 382.24005211051195, "r": 477.4698807832991, "b": 392.2026621655199, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam", "bbox": {"l": 133.76801021944917, "t": 394.19506217652076, "r": 477.47580078330884, "b": 404.15768223152867, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita", "bbox": {"l": 133.76801021944917, "t": 406.15005224252945, "r": 477.47580078330884, "b": 416.1126722975373, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem", "bbox": {"l": 133.76801021944917, "t": 418.10507230853824, "r": 477.47284078330404, "b": 428.06768236354606, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod", "bbox": {"l": 133.76801021944917, "t": 430.0600523745468, "r": 477.47589078330907, "b": 440.0226724295547, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At", "bbox": {"l": 133.76801021944917, "t": 442.01605244056105, "r": 477.4717707833023, "b": 451.97866249556887, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren,", "bbox": {"l": 133.76801021944917, "t": 453.9710625065698, "r": 477.47388078330573, "b": 463.93368256157777, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor", "bbox": {"l": 133.76801021944917, "t": 465.9260525725785, "r": 477.4708307833007, "b": 475.88867262758635, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt", "bbox": {"l": 133.76801021944917, "t": 477.8810726385873, "r": 477.4709207833008, "b": 487.84368269359516, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et", "bbox": {"l": 133.76801021944917, "t": 489.8360527045959, "r": 477.4658807832926, "b": 499.7986727596038, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea", "bbox": {"l": 133.76801021944917, "t": 501.7910427706045, "r": 477.47586078330903, "b": 511.7536628256125, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "takimata sanctus est Lorem ipsum dolor sit amet.", "bbox": {"l": 133.76801021944917, "t": 513.7470728366188, "r": 351.4767205766048, "b": 523.7096828916267, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie", "bbox": {"l": 148.71201024396512, "t": 525.7020529026275, "r": 477.4710707833011, "b": 535.6646729576354, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et", "bbox": {"l": 133.76801021944917, "t": 537.6570729686364, "r": 477.47293078330415, "b": 547.6196930236442, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore", "bbox": {"l": 133.76801021944917, "t": 549.612063034645, "r": 477.47482078330734, "b": 559.5746730896528, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "te feugait nulla facilisi. Lorem ipsum dolor sit amet, consectetuer adipiscing elit,", "bbox": {"l": 133.76801021944917, "t": 561.5670431006536, "r": 477.472810783304, "b": 571.5296631556615, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "sed diam nonummy nibh euismod tincidunt ut laoreet dolore magna aliquam erat", "bbox": {"l": 133.76801021944917, "t": 573.5220631666624, "r": 477.47479078330724, "b": 583.4846832216704, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "volutpat.", "bbox": {"l": 133.76801021944917, "t": 585.4780532326765, "r": 173.0565202839028, "b": 595.4406532876844, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie", "bbox": {"l": 148.71201024396512, "t": 597.4330632986853, "r": 477.4710707833011, "b": 607.3956633536932, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et", "bbox": {"l": 133.76801021944917, "t": 609.3880633646941, "r": 477.47293078330415, "b": 619.3506634197018, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore", "bbox": {"l": 133.76801021944917, "t": 621.3430634307027, "r": 477.47482078330734, "b": 631.3056634857105, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "te feugait nulla facilisi. Lorem ipsum dolor sit amet, consectetuer adipiscing elit,", "bbox": {"l": 133.76801021944917, "t": 633.2980634967114, "r": 477.472810783304, "b": 643.2606635517193, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "sed diam nonummy nibh euismod tincidunt ut laoreet dolore magna aliquam erat", "bbox": {"l": 133.76801021944917, "t": 645.2540535627256, "r": 477.47479078330724, "b": 655.2166536177334, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "volutpat.", "bbox": {"l": 133.76801021944917, "t": 657.2090636287344, "r": 173.0565202839028, "b": 667.1716636837423, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "1", "bbox": {"l": 303.13300049729594, "t": 695.1640638383003, "r": 308.1142905054678, "b": 705.1266638933081, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 5, "label": "section_header", "bbox": {"l": 133.76801021944917, "t": 124.00537068468714, "r": 191.51430031418315, "b": 138.36590076397772, "coord_origin": "TOPLEFT"}, "confidence": 0.95060133934021, "cells": [{"id": 0, "text": "Formula", "bbox": {"l": 133.76801021944917, "t": 124.00537068468714, "r": 191.51430031418315, "b": 138.36590076397772, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 133.76801021944917, "t": 149.114070823323, "r": 477.4806507833169, "b": 290.58367160443765, "coord_origin": "TOPLEFT"}, "confidence": 0.9878178238868713, "cells": [{"id": 1, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eir-", "bbox": {"l": 133.76801021944917, "t": 149.114070823323, "r": 477.47687078331063, "b": 159.0766608783307, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "mod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam volup-", "bbox": {"l": 133.76801021944917, "t": 161.06909088933185, "r": 477.4778107833122, "b": 171.03167094433945, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "tua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd", "bbox": {"l": 133.76801021944917, "t": 173.0241009553406, "r": 477.46985078329914, "b": 182.9866910103483, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ip-", "bbox": {"l": 133.76801021944917, "t": 184.97906102134914, "r": 477.4718607833024, "b": 194.94165107635683, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "sum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor", "bbox": {"l": 133.76801021944917, "t": 196.93511108736357, "r": 477.4699407832993, "b": 206.89770114237137, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero", "bbox": {"l": 133.76801021944917, "t": 208.890071153372, "r": 477.4806507833169, "b": 218.8526612083799, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "eos et accusam et justo duo dolores et ea rebum.", "bbox": {"l": 133.76801021944917, "t": 220.84509121938083, "r": 355.20087058271434, "b": 230.80767127438855, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Stet clita kasd gubergren,", "bbox": {"l": 362.6010705948545, "t": 220.84509121938083, "r": 477.4749507833075, "b": 230.80767127438855, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor", "bbox": {"l": 133.76801021944917, "t": 232.8001112853898, "r": 477.4708307833007, "b": 242.76269134039728, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt", "bbox": {"l": 133.76801021944917, "t": 244.75506135139813, "r": 477.4709207833008, "b": 254.71765140640582, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et", "bbox": {"l": 133.76801021944917, "t": 256.71008141740685, "r": 477.4658807832926, "b": 266.6726614724146, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea", "bbox": {"l": 133.76801021944917, "t": 268.6660714834211, "r": 477.47586078330903, "b": 278.6286615384289, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "takimata sanctus est Lorem ipsum dolor sit amet.", "bbox": {"l": 133.76801021944917, "t": 280.62109154942993, "r": 351.4767205766048, "b": 290.58367160443765, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 133.76801021944917, "t": 292.5761116154388, "r": 477.47482078330734, "b": 350.3596819344868, "coord_origin": "TOPLEFT"}, "confidence": 0.9855858683586121, "cells": [{"id": 14, "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie", "bbox": {"l": 148.71201024396512, "t": 292.5761116154388, "r": 477.4710707833011, "b": 302.5386916704465, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et", "bbox": {"l": 133.76801021944917, "t": 304.5310616814471, "r": 477.47293078330415, "b": 314.4936517364549, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore", "bbox": {"l": 133.76801021944917, "t": 316.48608174745607, "r": 477.47482078330734, "b": 326.4486618024637, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "te feugait nulla facilisi. Lorem ipsum dolor sit amet, consectetuer adipiscing elit,", "bbox": {"l": 133.76801021944917, "t": 328.4411018134648, "r": 477.472810783304, "b": 338.40368186847246, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "sed diam nonummy nibh euismod tincidunt.", "bbox": {"l": 133.76801021944917, "t": 340.3970618794788, "r": 326.20752053515014, "b": 350.3596819344868, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "formula", "bbox": {"l": 280.5539904602546, "t": 362.4346620011579, "r": 330.6965905425146, "b": 374.2696820665041, "coord_origin": "TOPLEFT"}, "confidence": 0.8711630702018738, "cells": [{"id": 19, "text": "a", "bbox": {"l": 280.5539904602546, "t": 364.3070620114962, "r": 285.8142404688841, "b": 374.2696820665041, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "2", "bbox": {"l": 285.8200104688936, "t": 362.4346620011579, "r": 289.78809047540335, "b": 369.40844203966316, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "+ 8 = 12", "bbox": {"l": 292.50400047985886, "t": 364.3070620114962, "r": 330.6965905425146, "b": 374.2696820665041, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 133.76801021944917, "t": 382.24005211051195, "r": 477.47589078330907, "b": 523.7096828916267, "coord_origin": "TOPLEFT"}, "confidence": 0.9880034923553467, "cells": [{"id": 22, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy", "bbox": {"l": 148.71201024396512, "t": 382.24005211051195, "r": 477.4698807832991, "b": 392.2026621655199, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam", "bbox": {"l": 133.76801021944917, "t": 394.19506217652076, "r": 477.47580078330884, "b": 404.15768223152867, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita", "bbox": {"l": 133.76801021944917, "t": 406.15005224252945, "r": 477.47580078330884, "b": 416.1126722975373, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem", "bbox": {"l": 133.76801021944917, "t": 418.10507230853824, "r": 477.47284078330404, "b": 428.06768236354606, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod", "bbox": {"l": 133.76801021944917, "t": 430.0600523745468, "r": 477.47589078330907, "b": 440.0226724295547, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At", "bbox": {"l": 133.76801021944917, "t": 442.01605244056105, "r": 477.4717707833023, "b": 451.97866249556887, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren,", "bbox": {"l": 133.76801021944917, "t": 453.9710625065698, "r": 477.47388078330573, "b": 463.93368256157777, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor", "bbox": {"l": 133.76801021944917, "t": 465.9260525725785, "r": 477.4708307833007, "b": 475.88867262758635, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt", "bbox": {"l": 133.76801021944917, "t": 477.8810726385873, "r": 477.4709207833008, "b": 487.84368269359516, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et", "bbox": {"l": 133.76801021944917, "t": 489.8360527045959, "r": 477.4658807832926, "b": 499.7986727596038, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea", "bbox": {"l": 133.76801021944917, "t": 501.7910427706045, "r": 477.47586078330903, "b": 511.7536628256125, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "takimata sanctus est Lorem ipsum dolor sit amet.", "bbox": {"l": 133.76801021944917, "t": 513.7470728366188, "r": 351.4767205766048, "b": 523.7096828916267, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "text", "bbox": {"l": 133.76801021944917, "t": 525.7020529026275, "r": 477.47482078330734, "b": 595.4406532876844, "coord_origin": "TOPLEFT"}, "confidence": 0.9844802021980286, "cells": [{"id": 34, "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie", "bbox": {"l": 148.71201024396512, "t": 525.7020529026275, "r": 477.4710707833011, "b": 535.6646729576354, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et", "bbox": {"l": 133.76801021944917, "t": 537.6570729686364, "r": 477.47293078330415, "b": 547.6196930236442, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore", "bbox": {"l": 133.76801021944917, "t": 549.612063034645, "r": 477.47482078330734, "b": 559.5746730896528, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "te feugait nulla facilisi. Lorem ipsum dolor sit amet, consectetuer adipiscing elit,", "bbox": {"l": 133.76801021944917, "t": 561.5670431006536, "r": 477.472810783304, "b": 571.5296631556615, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "sed diam nonummy nibh euismod tincidunt ut laoreet dolore magna aliquam erat", "bbox": {"l": 133.76801021944917, "t": 573.5220631666624, "r": 477.47479078330724, "b": 583.4846832216704, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "volutpat.", "bbox": {"l": 133.76801021944917, "t": 585.4780532326765, "r": 173.0565202839028, "b": 595.4406532876844, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 133.76801021944917, "t": 597.4330632986853, "r": 477.47482078330734, "b": 667.1716636837423, "coord_origin": "TOPLEFT"}, "confidence": 0.9872003793716431, "cells": [{"id": 40, "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie", "bbox": {"l": 148.71201024396512, "t": 597.4330632986853, "r": 477.4710707833011, "b": 607.3956633536932, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et", "bbox": {"l": 133.76801021944917, "t": 609.3880633646941, "r": 477.47293078330415, "b": 619.3506634197018, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore", "bbox": {"l": 133.76801021944917, "t": 621.3430634307027, "r": 477.47482078330734, "b": 631.3056634857105, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "te feugait nulla facilisi. Lorem ipsum dolor sit amet, consectetuer adipiscing elit,", "bbox": {"l": 133.76801021944917, "t": 633.2980634967114, "r": 477.472810783304, "b": 643.2606635517193, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "sed diam nonummy nibh euismod tincidunt ut laoreet dolore magna aliquam erat", "bbox": {"l": 133.76801021944917, "t": 645.2540535627256, "r": 477.47479078330724, "b": 655.2166536177334, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "volutpat.", "bbox": {"l": 133.76801021944917, "t": 657.2090636287344, "r": 173.0565202839028, "b": 667.1716636837423, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "page_footer", "bbox": {"l": 303.13300049729594, "t": 695.1640638383003, "r": 308.1142905054678, "b": 705.1266638933081, "coord_origin": "TOPLEFT"}, "confidence": 0.8502804636955261, "cells": [{"id": 46, "text": "1", "bbox": {"l": 303.13300049729594, "t": 695.1640638383003, "r": 308.1142905054678, "b": 705.1266638933081, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "section_header", "id": 5, "page_no": 1, "cluster": {"id": 5, "label": "section_header", "bbox": {"l": 133.76801021944917, "t": 124.00537068468714, "r": 191.51430031418315, "b": 138.36590076397772, "coord_origin": "TOPLEFT"}, "confidence": 0.95060133934021, "cells": [{"id": 0, "text": "Formula", "bbox": {"l": 133.76801021944917, "t": 124.00537068468714, "r": 191.51430031418315, "b": 138.36590076397772, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Formula"}, {"label": "text", "id": 1, "page_no": 1, "cluster": {"id": 1, "label": "text", "bbox": {"l": 133.76801021944917, "t": 149.114070823323, "r": 477.4806507833169, "b": 290.58367160443765, "coord_origin": "TOPLEFT"}, "confidence": 0.9878178238868713, "cells": [{"id": 1, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eir-", "bbox": {"l": 133.76801021944917, "t": 149.114070823323, "r": 477.47687078331063, "b": 159.0766608783307, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "mod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam volup-", "bbox": {"l": 133.76801021944917, "t": 161.06909088933185, "r": 477.4778107833122, "b": 171.03167094433945, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "tua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd", "bbox": {"l": 133.76801021944917, "t": 173.0241009553406, "r": 477.46985078329914, "b": 182.9866910103483, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ip-", "bbox": {"l": 133.76801021944917, "t": 184.97906102134914, "r": 477.4718607833024, "b": 194.94165107635683, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "sum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor", "bbox": {"l": 133.76801021944917, "t": 196.93511108736357, "r": 477.4699407832993, "b": 206.89770114237137, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero", "bbox": {"l": 133.76801021944917, "t": 208.890071153372, "r": 477.4806507833169, "b": 218.8526612083799, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "eos et accusam et justo duo dolores et ea rebum.", "bbox": {"l": 133.76801021944917, "t": 220.84509121938083, "r": 355.20087058271434, "b": 230.80767127438855, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Stet clita kasd gubergren,", "bbox": {"l": 362.6010705948545, "t": 220.84509121938083, "r": 477.4749507833075, "b": 230.80767127438855, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor", "bbox": {"l": 133.76801021944917, "t": 232.8001112853898, "r": 477.4708307833007, "b": 242.76269134039728, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt", "bbox": {"l": 133.76801021944917, "t": 244.75506135139813, "r": 477.4709207833008, "b": 254.71765140640582, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et", "bbox": {"l": 133.76801021944917, "t": 256.71008141740685, "r": 477.4658807832926, "b": 266.6726614724146, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea", "bbox": {"l": 133.76801021944917, "t": 268.6660714834211, "r": 477.47586078330903, "b": 278.6286615384289, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "takimata sanctus est Lorem ipsum dolor sit amet.", "bbox": {"l": 133.76801021944917, "t": 280.62109154942993, "r": 351.4767205766048, "b": 290.58367160443765, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet."}, {"label": "text", "id": 3, "page_no": 1, "cluster": {"id": 3, "label": "text", "bbox": {"l": 133.76801021944917, "t": 292.5761116154388, "r": 477.47482078330734, "b": 350.3596819344868, "coord_origin": "TOPLEFT"}, "confidence": 0.9855858683586121, "cells": [{"id": 14, "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie", "bbox": {"l": 148.71201024396512, "t": 292.5761116154388, "r": 477.4710707833011, "b": 302.5386916704465, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et", "bbox": {"l": 133.76801021944917, "t": 304.5310616814471, "r": 477.47293078330415, "b": 314.4936517364549, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore", "bbox": {"l": 133.76801021944917, "t": 316.48608174745607, "r": 477.47482078330734, "b": 326.4486618024637, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "te feugait nulla facilisi. Lorem ipsum dolor sit amet, consectetuer adipiscing elit,", "bbox": {"l": 133.76801021944917, "t": 328.4411018134648, "r": 477.472810783304, "b": 338.40368186847246, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "sed diam nonummy nibh euismod tincidunt.", "bbox": {"l": 133.76801021944917, "t": 340.3970618794788, "r": 326.20752053515014, "b": 350.3596819344868, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore te feugait nulla facilisi. Lorem ipsum dolor sit amet, consectetuer adipiscing elit, sed diam nonummy nibh euismod tincidunt."}, {"label": "formula", "id": 6, "page_no": 1, "cluster": {"id": 6, "label": "formula", "bbox": {"l": 280.5539904602546, "t": 362.4346620011579, "r": 330.6965905425146, "b": 374.2696820665041, "coord_origin": "TOPLEFT"}, "confidence": 0.8711630702018738, "cells": [{"id": 19, "text": "a", "bbox": {"l": 280.5539904602546, "t": 364.3070620114962, "r": 285.8142404688841, "b": 374.2696820665041, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "2", "bbox": {"l": 285.8200104688936, "t": 362.4346620011579, "r": 289.78809047540335, "b": 369.40844203966316, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "+ 8 = 12", "bbox": {"l": 292.50400047985886, "t": 364.3070620114962, "r": 330.6965905425146, "b": 374.2696820665041, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "a 2 + 8 = 12"}, {"label": "text", "id": 0, "page_no": 1, "cluster": {"id": 0, "label": "text", "bbox": {"l": 133.76801021944917, "t": 382.24005211051195, "r": 477.47589078330907, "b": 523.7096828916267, "coord_origin": "TOPLEFT"}, "confidence": 0.9880034923553467, "cells": [{"id": 22, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy", "bbox": {"l": 148.71201024396512, "t": 382.24005211051195, "r": 477.4698807832991, "b": 392.2026621655199, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam", "bbox": {"l": 133.76801021944917, "t": 394.19506217652076, "r": 477.47580078330884, "b": 404.15768223152867, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita", "bbox": {"l": 133.76801021944917, "t": 406.15005224252945, "r": 477.47580078330884, "b": 416.1126722975373, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem", "bbox": {"l": 133.76801021944917, "t": 418.10507230853824, "r": 477.47284078330404, "b": 428.06768236354606, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod", "bbox": {"l": 133.76801021944917, "t": 430.0600523745468, "r": 477.47589078330907, "b": 440.0226724295547, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At", "bbox": {"l": 133.76801021944917, "t": 442.01605244056105, "r": 477.4717707833023, "b": 451.97866249556887, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren,", "bbox": {"l": 133.76801021944917, "t": 453.9710625065698, "r": 477.47388078330573, "b": 463.93368256157777, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor", "bbox": {"l": 133.76801021944917, "t": 465.9260525725785, "r": 477.4708307833007, "b": 475.88867262758635, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt", "bbox": {"l": 133.76801021944917, "t": 477.8810726385873, "r": 477.4709207833008, "b": 487.84368269359516, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et", "bbox": {"l": 133.76801021944917, "t": 489.8360527045959, "r": 477.4658807832926, "b": 499.7986727596038, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea", "bbox": {"l": 133.76801021944917, "t": 501.7910427706045, "r": 477.47586078330903, "b": 511.7536628256125, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "takimata sanctus est Lorem ipsum dolor sit amet.", "bbox": {"l": 133.76801021944917, "t": 513.7470728366188, "r": 351.4767205766048, "b": 523.7096828916267, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet."}, {"label": "text", "id": 4, "page_no": 1, "cluster": {"id": 4, "label": "text", "bbox": {"l": 133.76801021944917, "t": 525.7020529026275, "r": 477.47482078330734, "b": 595.4406532876844, "coord_origin": "TOPLEFT"}, "confidence": 0.9844802021980286, "cells": [{"id": 34, "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie", "bbox": {"l": 148.71201024396512, "t": 525.7020529026275, "r": 477.4710707833011, "b": 535.6646729576354, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et", "bbox": {"l": 133.76801021944917, "t": 537.6570729686364, "r": 477.47293078330415, "b": 547.6196930236442, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore", "bbox": {"l": 133.76801021944917, "t": 549.612063034645, "r": 477.47482078330734, "b": 559.5746730896528, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "te feugait nulla facilisi. Lorem ipsum dolor sit amet, consectetuer adipiscing elit,", "bbox": {"l": 133.76801021944917, "t": 561.5670431006536, "r": 477.472810783304, "b": 571.5296631556615, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "sed diam nonummy nibh euismod tincidunt ut laoreet dolore magna aliquam erat", "bbox": {"l": 133.76801021944917, "t": 573.5220631666624, "r": 477.47479078330724, "b": 583.4846832216704, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "volutpat.", "bbox": {"l": 133.76801021944917, "t": 585.4780532326765, "r": 173.0565202839028, "b": 595.4406532876844, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore te feugait nulla facilisi. Lorem ipsum dolor sit amet, consectetuer adipiscing elit, sed diam nonummy nibh euismod tincidunt ut laoreet dolore magna aliquam erat volutpat."}, {"label": "text", "id": 2, "page_no": 1, "cluster": {"id": 2, "label": "text", "bbox": {"l": 133.76801021944917, "t": 597.4330632986853, "r": 477.47482078330734, "b": 667.1716636837423, "coord_origin": "TOPLEFT"}, "confidence": 0.9872003793716431, "cells": [{"id": 40, "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie", "bbox": {"l": 148.71201024396512, "t": 597.4330632986853, "r": 477.4710707833011, "b": 607.3956633536932, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et", "bbox": {"l": 133.76801021944917, "t": 609.3880633646941, "r": 477.47293078330415, "b": 619.3506634197018, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore", "bbox": {"l": 133.76801021944917, "t": 621.3430634307027, "r": 477.47482078330734, "b": 631.3056634857105, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "te feugait nulla facilisi. Lorem ipsum dolor sit amet, consectetuer adipiscing elit,", "bbox": {"l": 133.76801021944917, "t": 633.2980634967114, "r": 477.472810783304, "b": 643.2606635517193, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "sed diam nonummy nibh euismod tincidunt ut laoreet dolore magna aliquam erat", "bbox": {"l": 133.76801021944917, "t": 645.2540535627256, "r": 477.47479078330724, "b": 655.2166536177334, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "volutpat.", "bbox": {"l": 133.76801021944917, "t": 657.2090636287344, "r": 173.0565202839028, "b": 667.1716636837423, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore te feugait nulla facilisi. Lorem ipsum dolor sit amet, consectetuer adipiscing elit, sed diam nonummy nibh euismod tincidunt ut laoreet dolore magna aliquam erat volutpat."}, {"label": "page_footer", "id": 7, "page_no": 1, "cluster": {"id": 7, "label": "page_footer", "bbox": {"l": 303.13300049729594, "t": 695.1640638383003, "r": 308.1142905054678, "b": 705.1266638933081, "coord_origin": "TOPLEFT"}, "confidence": 0.8502804636955261, "cells": [{"id": 46, "text": "1", "bbox": {"l": 303.13300049729594, "t": 695.1640638383003, "r": 308.1142905054678, "b": 705.1266638933081, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1"}], "body": [{"label": "section_header", "id": 5, "page_no": 1, "cluster": {"id": 5, "label": "section_header", "bbox": {"l": 133.76801021944917, "t": 124.00537068468714, "r": 191.51430031418315, "b": 138.36590076397772, "coord_origin": "TOPLEFT"}, "confidence": 0.95060133934021, "cells": [{"id": 0, "text": "Formula", "bbox": {"l": 133.76801021944917, "t": 124.00537068468714, "r": 191.51430031418315, "b": 138.36590076397772, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Formula"}, {"label": "text", "id": 1, "page_no": 1, "cluster": {"id": 1, "label": "text", "bbox": {"l": 133.76801021944917, "t": 149.114070823323, "r": 477.4806507833169, "b": 290.58367160443765, "coord_origin": "TOPLEFT"}, "confidence": 0.9878178238868713, "cells": [{"id": 1, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eir-", "bbox": {"l": 133.76801021944917, "t": 149.114070823323, "r": 477.47687078331063, "b": 159.0766608783307, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "mod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam volup-", "bbox": {"l": 133.76801021944917, "t": 161.06909088933185, "r": 477.4778107833122, "b": 171.03167094433945, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "tua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd", "bbox": {"l": 133.76801021944917, "t": 173.0241009553406, "r": 477.46985078329914, "b": 182.9866910103483, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ip-", "bbox": {"l": 133.76801021944917, "t": 184.97906102134914, "r": 477.4718607833024, "b": 194.94165107635683, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "sum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor", "bbox": {"l": 133.76801021944917, "t": 196.93511108736357, "r": 477.4699407832993, "b": 206.89770114237137, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero", "bbox": {"l": 133.76801021944917, "t": 208.890071153372, "r": 477.4806507833169, "b": 218.8526612083799, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "eos et accusam et justo duo dolores et ea rebum.", "bbox": {"l": 133.76801021944917, "t": 220.84509121938083, "r": 355.20087058271434, "b": 230.80767127438855, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Stet clita kasd gubergren,", "bbox": {"l": 362.6010705948545, "t": 220.84509121938083, "r": 477.4749507833075, "b": 230.80767127438855, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor", "bbox": {"l": 133.76801021944917, "t": 232.8001112853898, "r": 477.4708307833007, "b": 242.76269134039728, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt", "bbox": {"l": 133.76801021944917, "t": 244.75506135139813, "r": 477.4709207833008, "b": 254.71765140640582, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et", "bbox": {"l": 133.76801021944917, "t": 256.71008141740685, "r": 477.4658807832926, "b": 266.6726614724146, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea", "bbox": {"l": 133.76801021944917, "t": 268.6660714834211, "r": 477.47586078330903, "b": 278.6286615384289, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "takimata sanctus est Lorem ipsum dolor sit amet.", "bbox": {"l": 133.76801021944917, "t": 280.62109154942993, "r": 351.4767205766048, "b": 290.58367160443765, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet."}, {"label": "text", "id": 3, "page_no": 1, "cluster": {"id": 3, "label": "text", "bbox": {"l": 133.76801021944917, "t": 292.5761116154388, "r": 477.47482078330734, "b": 350.3596819344868, "coord_origin": "TOPLEFT"}, "confidence": 0.9855858683586121, "cells": [{"id": 14, "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie", "bbox": {"l": 148.71201024396512, "t": 292.5761116154388, "r": 477.4710707833011, "b": 302.5386916704465, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et", "bbox": {"l": 133.76801021944917, "t": 304.5310616814471, "r": 477.47293078330415, "b": 314.4936517364549, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore", "bbox": {"l": 133.76801021944917, "t": 316.48608174745607, "r": 477.47482078330734, "b": 326.4486618024637, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "te feugait nulla facilisi. Lorem ipsum dolor sit amet, consectetuer adipiscing elit,", "bbox": {"l": 133.76801021944917, "t": 328.4411018134648, "r": 477.472810783304, "b": 338.40368186847246, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "sed diam nonummy nibh euismod tincidunt.", "bbox": {"l": 133.76801021944917, "t": 340.3970618794788, "r": 326.20752053515014, "b": 350.3596819344868, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore te feugait nulla facilisi. Lorem ipsum dolor sit amet, consectetuer adipiscing elit, sed diam nonummy nibh euismod tincidunt."}, {"label": "formula", "id": 6, "page_no": 1, "cluster": {"id": 6, "label": "formula", "bbox": {"l": 280.5539904602546, "t": 362.4346620011579, "r": 330.6965905425146, "b": 374.2696820665041, "coord_origin": "TOPLEFT"}, "confidence": 0.8711630702018738, "cells": [{"id": 19, "text": "a", "bbox": {"l": 280.5539904602546, "t": 364.3070620114962, "r": 285.8142404688841, "b": 374.2696820665041, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "2", "bbox": {"l": 285.8200104688936, "t": 362.4346620011579, "r": 289.78809047540335, "b": 369.40844203966316, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "+ 8 = 12", "bbox": {"l": 292.50400047985886, "t": 364.3070620114962, "r": 330.6965905425146, "b": 374.2696820665041, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "a 2 + 8 = 12"}, {"label": "text", "id": 0, "page_no": 1, "cluster": {"id": 0, "label": "text", "bbox": {"l": 133.76801021944917, "t": 382.24005211051195, "r": 477.47589078330907, "b": 523.7096828916267, "coord_origin": "TOPLEFT"}, "confidence": 0.9880034923553467, "cells": [{"id": 22, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy", "bbox": {"l": 148.71201024396512, "t": 382.24005211051195, "r": 477.4698807832991, "b": 392.2026621655199, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam", "bbox": {"l": 133.76801021944917, "t": 394.19506217652076, "r": 477.47580078330884, "b": 404.15768223152867, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita", "bbox": {"l": 133.76801021944917, "t": 406.15005224252945, "r": 477.47580078330884, "b": 416.1126722975373, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem", "bbox": {"l": 133.76801021944917, "t": 418.10507230853824, "r": 477.47284078330404, "b": 428.06768236354606, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod", "bbox": {"l": 133.76801021944917, "t": 430.0600523745468, "r": 477.47589078330907, "b": 440.0226724295547, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At", "bbox": {"l": 133.76801021944917, "t": 442.01605244056105, "r": 477.4717707833023, "b": 451.97866249556887, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren,", "bbox": {"l": 133.76801021944917, "t": 453.9710625065698, "r": 477.47388078330573, "b": 463.93368256157777, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor", "bbox": {"l": 133.76801021944917, "t": 465.9260525725785, "r": 477.4708307833007, "b": 475.88867262758635, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt", "bbox": {"l": 133.76801021944917, "t": 477.8810726385873, "r": 477.4709207833008, "b": 487.84368269359516, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et", "bbox": {"l": 133.76801021944917, "t": 489.8360527045959, "r": 477.4658807832926, "b": 499.7986727596038, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea", "bbox": {"l": 133.76801021944917, "t": 501.7910427706045, "r": 477.47586078330903, "b": 511.7536628256125, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "takimata sanctus est Lorem ipsum dolor sit amet.", "bbox": {"l": 133.76801021944917, "t": 513.7470728366188, "r": 351.4767205766048, "b": 523.7096828916267, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet."}, {"label": "text", "id": 4, "page_no": 1, "cluster": {"id": 4, "label": "text", "bbox": {"l": 133.76801021944917, "t": 525.7020529026275, "r": 477.47482078330734, "b": 595.4406532876844, "coord_origin": "TOPLEFT"}, "confidence": 0.9844802021980286, "cells": [{"id": 34, "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie", "bbox": {"l": 148.71201024396512, "t": 525.7020529026275, "r": 477.4710707833011, "b": 535.6646729576354, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et", "bbox": {"l": 133.76801021944917, "t": 537.6570729686364, "r": 477.47293078330415, "b": 547.6196930236442, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore", "bbox": {"l": 133.76801021944917, "t": 549.612063034645, "r": 477.47482078330734, "b": 559.5746730896528, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "te feugait nulla facilisi. Lorem ipsum dolor sit amet, consectetuer adipiscing elit,", "bbox": {"l": 133.76801021944917, "t": 561.5670431006536, "r": 477.472810783304, "b": 571.5296631556615, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "sed diam nonummy nibh euismod tincidunt ut laoreet dolore magna aliquam erat", "bbox": {"l": 133.76801021944917, "t": 573.5220631666624, "r": 477.47479078330724, "b": 583.4846832216704, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "volutpat.", "bbox": {"l": 133.76801021944917, "t": 585.4780532326765, "r": 173.0565202839028, "b": 595.4406532876844, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore te feugait nulla facilisi. Lorem ipsum dolor sit amet, consectetuer adipiscing elit, sed diam nonummy nibh euismod tincidunt ut laoreet dolore magna aliquam erat volutpat."}, {"label": "text", "id": 2, "page_no": 1, "cluster": {"id": 2, "label": "text", "bbox": {"l": 133.76801021944917, "t": 597.4330632986853, "r": 477.47482078330734, "b": 667.1716636837423, "coord_origin": "TOPLEFT"}, "confidence": 0.9872003793716431, "cells": [{"id": 40, "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie", "bbox": {"l": 148.71201024396512, "t": 597.4330632986853, "r": 477.4710707833011, "b": 607.3956633536932, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et", "bbox": {"l": 133.76801021944917, "t": 609.3880633646941, "r": 477.47293078330415, "b": 619.3506634197018, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore", "bbox": {"l": 133.76801021944917, "t": 621.3430634307027, "r": 477.47482078330734, "b": 631.3056634857105, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "te feugait nulla facilisi. Lorem ipsum dolor sit amet, consectetuer adipiscing elit,", "bbox": {"l": 133.76801021944917, "t": 633.2980634967114, "r": 477.472810783304, "b": 643.2606635517193, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "sed diam nonummy nibh euismod tincidunt ut laoreet dolore magna aliquam erat", "bbox": {"l": 133.76801021944917, "t": 645.2540535627256, "r": 477.47479078330724, "b": 655.2166536177334, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "volutpat.", "bbox": {"l": 133.76801021944917, "t": 657.2090636287344, "r": 173.0565202839028, "b": 667.1716636837423, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore te feugait nulla facilisi. Lorem ipsum dolor sit amet, consectetuer adipiscing elit, sed diam nonummy nibh euismod tincidunt ut laoreet dolore magna aliquam erat volutpat."}], "headers": [{"label": "page_footer", "id": 7, "page_no": 1, "cluster": {"id": 7, "label": "page_footer", "bbox": {"l": 303.13300049729594, "t": 695.1640638383003, "r": 308.1142905054678, "b": 705.1266638933081, "coord_origin": "TOPLEFT"}, "confidence": 0.8502804636955261, "cells": [{"id": 46, "text": "1", "bbox": {"l": 303.13300049729594, "t": 695.1640638383003, "r": 308.1142905054678, "b": 705.1266638933081, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1"}]}}]
\ No newline at end of file
+[{"page_no": 0, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "JavaScript Code Example", "bbox": {"l": 133.76801, "t": 124.80877999999996, "r": 315.91595, "b": 137.54816000000005, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eir-", "bbox": {"l": 133.76801, "t": 149.67193999999995, "r": 477.47971, "b": 158.51873999999998, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "mod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam volup-", "bbox": {"l": 133.76801, "t": 161.62694999999997, "r": 477.4806500000001, "b": 170.47375, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "tua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd", "bbox": {"l": 133.76801, "t": 173.58196999999996, "r": 477.47571000000005, "b": 182.42877, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ip-", "bbox": {"l": 133.76801, "t": 185.53698999999995, "r": 477.47466999999995, "b": 194.38378999999998, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "sum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor", "bbox": {"l": 133.76801, "t": 197.49199999999996, "r": 477.47668, "b": 206.33880999999997, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero", "bbox": {"l": 133.76801, "t": 209.44701999999995, "r": 477.48068000000006, "b": 218.29381999999998, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "eos et accusam et justo duo dolores et ea rebum.", "bbox": {"l": 133.76801, "t": 221.40301999999997, "r": 355.20874, "b": 230.24982, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Stet clita kasd gubergren,", "bbox": {"l": 362.60098, "t": 221.40301999999997, "r": 477.48276, "b": 230.24982, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor", "bbox": {"l": 133.76801, "t": 233.35802999999999, "r": 477.47772, "b": 242.20483000000002, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt", "bbox": {"l": 133.76801, "t": 245.31304999999998, "r": 477.47971, "b": 254.15985, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et", "bbox": {"l": 133.76801, "t": 257.26806999999997, "r": 477.47473, "b": 266.11487, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea", "bbox": {"l": 133.76801, "t": 269.22308, "r": 477.47571000000005, "b": 278.06989, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "takimata sanctus est Lorem ipsum dolor sit amet.", "bbox": {"l": 133.76801, "t": 281.17911, "r": 351.48471, "b": 290.02588, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie", "bbox": {"l": 148.71201, "t": 293.13409, "r": 477.47479, "b": 301.98087, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan", "bbox": {"l": 133.76801, "t": 305.08908, "r": 477.47876, "b": 313.9358500000001, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "et iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis", "bbox": {"l": 133.76801, "t": 317.04407, "r": 477.47668, "b": 325.89084, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "dolore te feugait nulla facilisi. Lorem ipsum dolor sit amet,", "bbox": {"l": 133.76801, "t": 328.99905, "r": 391.79935, "b": 337.84583, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Listing 1: Simple JavaScript Program", "bbox": {"l": 223.15500000000003, "t": 349.92105, "r": 388.09375, "b": 358.76782, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "function", "bbox": {"l": 134.605, "t": 366.3995100000001, "r": 178.11899, "b": 373.86853, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "add(a, b) {", "bbox": {"l": 185.31004, "t": 366.3995100000001, "r": 246.27264000000002, "b": 373.86853, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "return a + b;", "bbox": {"l": 157.17101, "t": 377.35852, "r": 229.32368, "b": 384.82755, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "}", "bbox": {"l": 134.239, "t": 388.31750000000005, "r": 138.94637, "b": 395.78653, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "console.log(add(3, 5));", "bbox": {"l": 134.592, "t": 399.27652, "r": 263.22409, "b": 406.74554, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy", "bbox": {"l": 148.71201, "t": 419.06097000000005, "r": 477.47786999999994, "b": 427.90775, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam", "bbox": {"l": 133.76801, "t": 431.01697, "r": 477.47860999999995, "b": 439.86374, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita", "bbox": {"l": 133.76801, "t": 442.97195, "r": 477.47571000000005, "b": 451.81873, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem", "bbox": {"l": 133.76801, "t": 454.92694, "r": 477.47559, "b": 463.77371, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod", "bbox": {"l": 133.76801, "t": 466.88193, "r": 477.48169000000007, "b": 475.7287, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At", "bbox": {"l": 133.76801, "t": 478.83691, "r": 477.48062, "b": 487.68369, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren,", "bbox": {"l": 133.76801, "t": 490.7919, "r": 477.48172000000005, "b": 499.63867, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor", "bbox": {"l": 133.76801, "t": 502.74789, "r": 477.47772, "b": 511.59467, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt", "bbox": {"l": 133.76801, "t": 514.70288, "r": 477.47971, "b": 523.5496499999999, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et", "bbox": {"l": 133.76801, "t": 526.65787, "r": 477.47473, "b": 535.50464, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea", "bbox": {"l": 133.76801, "t": 538.61285, "r": 477.47571000000005, "b": 547.45964, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "takimata sanctus est Lorem ipsum dolor sit amet.", "bbox": {"l": 133.76801, "t": 550.56786, "r": 351.48471, "b": 559.41464, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie", "bbox": {"l": 148.71201, "t": 562.52286, "r": 477.47479, "b": 571.36964, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan", "bbox": {"l": 133.76801, "t": 574.47885, "r": 477.47876, "b": 583.32564, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "et iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis", "bbox": {"l": 133.76801, "t": 586.43385, "r": 477.47668, "b": 595.28064, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "dolore te feugait nulla facilisi. Lorem ipsum dolor sit amet,", "bbox": {"l": 133.76801, "t": 598.38885, "r": 391.79935, "b": 607.23564, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "1", "bbox": {"l": 303.133, "t": 695.720856, "r": 308.11429, "b": 704.56765, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 4, "label": "section_header", "bbox": {"l": 133.76801, "t": 124.80877999999996, "r": 315.91595, "b": 137.54816000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9606584310531616, "cells": [{"id": 0, "text": "JavaScript Code Example", "bbox": {"l": 133.76801, "t": 124.80877999999996, "r": 315.91595, "b": 137.54816000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 133.76801, "t": 149.67193999999995, "r": 477.48276, "b": 290.02588, "coord_origin": "TOPLEFT"}, "confidence": 0.9871246814727783, "cells": [{"id": 1, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eir-", "bbox": {"l": 133.76801, "t": 149.67193999999995, "r": 477.47971, "b": 158.51873999999998, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "mod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam volup-", "bbox": {"l": 133.76801, "t": 161.62694999999997, "r": 477.4806500000001, "b": 170.47375, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "tua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd", "bbox": {"l": 133.76801, "t": 173.58196999999996, "r": 477.47571000000005, "b": 182.42877, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ip-", "bbox": {"l": 133.76801, "t": 185.53698999999995, "r": 477.47466999999995, "b": 194.38378999999998, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "sum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor", "bbox": {"l": 133.76801, "t": 197.49199999999996, "r": 477.47668, "b": 206.33880999999997, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero", "bbox": {"l": 133.76801, "t": 209.44701999999995, "r": 477.48068000000006, "b": 218.29381999999998, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "eos et accusam et justo duo dolores et ea rebum.", "bbox": {"l": 133.76801, "t": 221.40301999999997, "r": 355.20874, "b": 230.24982, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Stet clita kasd gubergren,", "bbox": {"l": 362.60098, "t": 221.40301999999997, "r": 477.48276, "b": 230.24982, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor", "bbox": {"l": 133.76801, "t": 233.35802999999999, "r": 477.47772, "b": 242.20483000000002, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt", "bbox": {"l": 133.76801, "t": 245.31304999999998, "r": 477.47971, "b": 254.15985, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et", "bbox": {"l": 133.76801, "t": 257.26806999999997, "r": 477.47473, "b": 266.11487, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea", "bbox": {"l": 133.76801, "t": 269.22308, "r": 477.47571000000005, "b": 278.06989, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "takimata sanctus est Lorem ipsum dolor sit amet.", "bbox": {"l": 133.76801, "t": 281.17911, "r": 351.48471, "b": 290.02588, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 133.76801, "t": 293.13409, "r": 477.47876, "b": 337.84583, "coord_origin": "TOPLEFT"}, "confidence": 0.9834160804748535, "cells": [{"id": 14, "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie", "bbox": {"l": 148.71201, "t": 293.13409, "r": 477.47479, "b": 301.98087, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan", "bbox": {"l": 133.76801, "t": 305.08908, "r": 477.47876, "b": 313.9358500000001, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "et iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis", "bbox": {"l": 133.76801, "t": 317.04407, "r": 477.47668, "b": 325.89084, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "dolore te feugait nulla facilisi. Lorem ipsum dolor sit amet,", "bbox": {"l": 133.76801, "t": 328.99905, "r": 391.79935, "b": 337.84583, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "caption", "bbox": {"l": 223.15500000000003, "t": 349.92105, "r": 388.09375, "b": 358.76782, "coord_origin": "TOPLEFT"}, "confidence": 0.5588350296020508, "cells": [{"id": 18, "text": "Listing 1: Simple JavaScript Program", "bbox": {"l": 223.15500000000003, "t": 349.92105, "r": 388.09375, "b": 358.76782, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "code", "bbox": {"l": 134.239, "t": 366.3995100000001, "r": 263.22409, "b": 406.74554, "coord_origin": "TOPLEFT"}, "confidence": 0.6312209963798523, "cells": [{"id": 19, "text": "function", "bbox": {"l": 134.605, "t": 366.3995100000001, "r": 178.11899, "b": 373.86853, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "add(a, b) {", "bbox": {"l": 185.31004, "t": 366.3995100000001, "r": 246.27264000000002, "b": 373.86853, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "return a + b;", "bbox": {"l": 157.17101, "t": 377.35852, "r": 229.32368, "b": 384.82755, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "}", "bbox": {"l": 134.239, "t": 388.31750000000005, "r": 138.94637, "b": 395.78653, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "console.log(add(3, 5));", "bbox": {"l": 134.592, "t": 399.27652, "r": 263.22409, "b": 406.74554, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 133.76801, "t": 419.06097000000005, "r": 477.48172000000005, "b": 559.41464, "coord_origin": "TOPLEFT"}, "confidence": 0.987352728843689, "cells": [{"id": 24, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy", "bbox": {"l": 148.71201, "t": 419.06097000000005, "r": 477.47786999999994, "b": 427.90775, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam", "bbox": {"l": 133.76801, "t": 431.01697, "r": 477.47860999999995, "b": 439.86374, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita", "bbox": {"l": 133.76801, "t": 442.97195, "r": 477.47571000000005, "b": 451.81873, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem", "bbox": {"l": 133.76801, "t": 454.92694, "r": 477.47559, "b": 463.77371, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod", "bbox": {"l": 133.76801, "t": 466.88193, "r": 477.48169000000007, "b": 475.7287, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At", "bbox": {"l": 133.76801, "t": 478.83691, "r": 477.48062, "b": 487.68369, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren,", "bbox": {"l": 133.76801, "t": 490.7919, "r": 477.48172000000005, "b": 499.63867, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor", "bbox": {"l": 133.76801, "t": 502.74789, "r": 477.47772, "b": 511.59467, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt", "bbox": {"l": 133.76801, "t": 514.70288, "r": 477.47971, "b": 523.5496499999999, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et", "bbox": {"l": 133.76801, "t": 526.65787, "r": 477.47473, "b": 535.50464, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea", "bbox": {"l": 133.76801, "t": 538.61285, "r": 477.47571000000005, "b": 547.45964, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "takimata sanctus est Lorem ipsum dolor sit amet.", "bbox": {"l": 133.76801, "t": 550.56786, "r": 351.48471, "b": 559.41464, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 133.76801, "t": 562.52286, "r": 477.47876, "b": 607.23564, "coord_origin": "TOPLEFT"}, "confidence": 0.9843751788139343, "cells": [{"id": 36, "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie", "bbox": {"l": 148.71201, "t": 562.52286, "r": 477.47479, "b": 571.36964, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan", "bbox": {"l": 133.76801, "t": 574.47885, "r": 477.47876, "b": 583.32564, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "et iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis", "bbox": {"l": 133.76801, "t": 586.43385, "r": 477.47668, "b": 595.28064, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "dolore te feugait nulla facilisi. Lorem ipsum dolor sit amet,", "bbox": {"l": 133.76801, "t": 598.38885, "r": 391.79935, "b": 607.23564, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "page_footer", "bbox": {"l": 303.133, "t": 695.720856, "r": 308.11429, "b": 704.56765, "coord_origin": "TOPLEFT"}, "confidence": 0.8444077372550964, "cells": [{"id": 40, "text": "1", "bbox": {"l": 303.133, "t": 695.720856, "r": 308.11429, "b": 704.56765, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "section_header", "id": 4, "page_no": 0, "cluster": {"id": 4, "label": "section_header", "bbox": {"l": 133.76801, "t": 124.80877999999996, "r": 315.91595, "b": 137.54816000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9606584310531616, "cells": [{"id": 0, "text": "JavaScript Code Example", "bbox": {"l": 133.76801, "t": 124.80877999999996, "r": 315.91595, "b": 137.54816000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "JavaScript Code Example"}, {"label": "text", "id": 1, "page_no": 0, "cluster": {"id": 1, "label": "text", "bbox": {"l": 133.76801, "t": 149.67193999999995, "r": 477.48276, "b": 290.02588, "coord_origin": "TOPLEFT"}, "confidence": 0.9871246814727783, "cells": [{"id": 1, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eir-", "bbox": {"l": 133.76801, "t": 149.67193999999995, "r": 477.47971, "b": 158.51873999999998, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "mod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam volup-", "bbox": {"l": 133.76801, "t": 161.62694999999997, "r": 477.4806500000001, "b": 170.47375, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "tua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd", "bbox": {"l": 133.76801, "t": 173.58196999999996, "r": 477.47571000000005, "b": 182.42877, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ip-", "bbox": {"l": 133.76801, "t": 185.53698999999995, "r": 477.47466999999995, "b": 194.38378999999998, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "sum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor", "bbox": {"l": 133.76801, "t": 197.49199999999996, "r": 477.47668, "b": 206.33880999999997, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero", "bbox": {"l": 133.76801, "t": 209.44701999999995, "r": 477.48068000000006, "b": 218.29381999999998, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "eos et accusam et justo duo dolores et ea rebum.", "bbox": {"l": 133.76801, "t": 221.40301999999997, "r": 355.20874, "b": 230.24982, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Stet clita kasd gubergren,", "bbox": {"l": 362.60098, "t": 221.40301999999997, "r": 477.48276, "b": 230.24982, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor", "bbox": {"l": 133.76801, "t": 233.35802999999999, "r": 477.47772, "b": 242.20483000000002, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt", "bbox": {"l": 133.76801, "t": 245.31304999999998, "r": 477.47971, "b": 254.15985, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et", "bbox": {"l": 133.76801, "t": 257.26806999999997, "r": 477.47473, "b": 266.11487, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea", "bbox": {"l": 133.76801, "t": 269.22308, "r": 477.47571000000005, "b": 278.06989, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "takimata sanctus est Lorem ipsum dolor sit amet.", "bbox": {"l": 133.76801, "t": 281.17911, "r": 351.48471, "b": 290.02588, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet."}, {"label": "text", "id": 3, "page_no": 0, "cluster": {"id": 3, "label": "text", "bbox": {"l": 133.76801, "t": 293.13409, "r": 477.47876, "b": 337.84583, "coord_origin": "TOPLEFT"}, "confidence": 0.9834160804748535, "cells": [{"id": 14, "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie", "bbox": {"l": 148.71201, "t": 293.13409, "r": 477.47479, "b": 301.98087, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan", "bbox": {"l": 133.76801, "t": 305.08908, "r": 477.47876, "b": 313.9358500000001, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "et iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis", "bbox": {"l": 133.76801, "t": 317.04407, "r": 477.47668, "b": 325.89084, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "dolore te feugait nulla facilisi. Lorem ipsum dolor sit amet,", "bbox": {"l": 133.76801, "t": 328.99905, "r": 391.79935, "b": 337.84583, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore te feugait nulla facilisi. Lorem ipsum dolor sit amet,"}, {"label": "caption", "id": 7, "page_no": 0, "cluster": {"id": 7, "label": "caption", "bbox": {"l": 223.15500000000003, "t": 349.92105, "r": 388.09375, "b": 358.76782, "coord_origin": "TOPLEFT"}, "confidence": 0.5588350296020508, "cells": [{"id": 18, "text": "Listing 1: Simple JavaScript Program", "bbox": {"l": 223.15500000000003, "t": 349.92105, "r": 388.09375, "b": 358.76782, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Listing 1: Simple JavaScript Program"}, {"label": "code", "id": 6, "page_no": 0, "cluster": {"id": 6, "label": "code", "bbox": {"l": 134.239, "t": 366.3995100000001, "r": 263.22409, "b": 406.74554, "coord_origin": "TOPLEFT"}, "confidence": 0.6312209963798523, "cells": [{"id": 19, "text": "function", "bbox": {"l": 134.605, "t": 366.3995100000001, "r": 178.11899, "b": 373.86853, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "add(a, b) {", "bbox": {"l": 185.31004, "t": 366.3995100000001, "r": 246.27264000000002, "b": 373.86853, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "return a + b;", "bbox": {"l": 157.17101, "t": 377.35852, "r": 229.32368, "b": 384.82755, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "}", "bbox": {"l": 134.239, "t": 388.31750000000005, "r": 138.94637, "b": 395.78653, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "console.log(add(3, 5));", "bbox": {"l": 134.592, "t": 399.27652, "r": 263.22409, "b": 406.74554, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "function add(a, b) { return a + b; } console.log(add(3, 5));"}, {"label": "text", "id": 0, "page_no": 0, "cluster": {"id": 0, "label": "text", "bbox": {"l": 133.76801, "t": 419.06097000000005, "r": 477.48172000000005, "b": 559.41464, "coord_origin": "TOPLEFT"}, "confidence": 0.987352728843689, "cells": [{"id": 24, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy", "bbox": {"l": 148.71201, "t": 419.06097000000005, "r": 477.47786999999994, "b": 427.90775, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam", "bbox": {"l": 133.76801, "t": 431.01697, "r": 477.47860999999995, "b": 439.86374, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita", "bbox": {"l": 133.76801, "t": 442.97195, "r": 477.47571000000005, "b": 451.81873, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem", "bbox": {"l": 133.76801, "t": 454.92694, "r": 477.47559, "b": 463.77371, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod", "bbox": {"l": 133.76801, "t": 466.88193, "r": 477.48169000000007, "b": 475.7287, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At", "bbox": {"l": 133.76801, "t": 478.83691, "r": 477.48062, "b": 487.68369, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren,", "bbox": {"l": 133.76801, "t": 490.7919, "r": 477.48172000000005, "b": 499.63867, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor", "bbox": {"l": 133.76801, "t": 502.74789, "r": 477.47772, "b": 511.59467, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt", "bbox": {"l": 133.76801, "t": 514.70288, "r": 477.47971, "b": 523.5496499999999, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et", "bbox": {"l": 133.76801, "t": 526.65787, "r": 477.47473, "b": 535.50464, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea", "bbox": {"l": 133.76801, "t": 538.61285, "r": 477.47571000000005, "b": 547.45964, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "takimata sanctus est Lorem ipsum dolor sit amet.", "bbox": {"l": 133.76801, "t": 550.56786, "r": 351.48471, "b": 559.41464, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet."}, {"label": "text", "id": 2, "page_no": 0, "cluster": {"id": 2, "label": "text", "bbox": {"l": 133.76801, "t": 562.52286, "r": 477.47876, "b": 607.23564, "coord_origin": "TOPLEFT"}, "confidence": 0.9843751788139343, "cells": [{"id": 36, "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie", "bbox": {"l": 148.71201, "t": 562.52286, "r": 477.47479, "b": 571.36964, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan", "bbox": {"l": 133.76801, "t": 574.47885, "r": 477.47876, "b": 583.32564, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "et iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis", "bbox": {"l": 133.76801, "t": 586.43385, "r": 477.47668, "b": 595.28064, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "dolore te feugait nulla facilisi. Lorem ipsum dolor sit amet,", "bbox": {"l": 133.76801, "t": 598.38885, "r": 391.79935, "b": 607.23564, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore te feugait nulla facilisi. Lorem ipsum dolor sit amet,"}, {"label": "page_footer", "id": 5, "page_no": 0, "cluster": {"id": 5, "label": "page_footer", "bbox": {"l": 303.133, "t": 695.720856, "r": 308.11429, "b": 704.56765, "coord_origin": "TOPLEFT"}, "confidence": 0.8444077372550964, "cells": [{"id": 40, "text": "1", "bbox": {"l": 303.133, "t": 695.720856, "r": 308.11429, "b": 704.56765, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1"}], "body": [{"label": "section_header", "id": 4, "page_no": 0, "cluster": {"id": 4, "label": "section_header", "bbox": {"l": 133.76801, "t": 124.80877999999996, "r": 315.91595, "b": 137.54816000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9606584310531616, "cells": [{"id": 0, "text": "JavaScript Code Example", "bbox": {"l": 133.76801, "t": 124.80877999999996, "r": 315.91595, "b": 137.54816000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "JavaScript Code Example"}, {"label": "text", "id": 1, "page_no": 0, "cluster": {"id": 1, "label": "text", "bbox": {"l": 133.76801, "t": 149.67193999999995, "r": 477.48276, "b": 290.02588, "coord_origin": "TOPLEFT"}, "confidence": 0.9871246814727783, "cells": [{"id": 1, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eir-", "bbox": {"l": 133.76801, "t": 149.67193999999995, "r": 477.47971, "b": 158.51873999999998, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "mod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam volup-", "bbox": {"l": 133.76801, "t": 161.62694999999997, "r": 477.4806500000001, "b": 170.47375, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "tua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd", "bbox": {"l": 133.76801, "t": 173.58196999999996, "r": 477.47571000000005, "b": 182.42877, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ip-", "bbox": {"l": 133.76801, "t": 185.53698999999995, "r": 477.47466999999995, "b": 194.38378999999998, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "sum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor", "bbox": {"l": 133.76801, "t": 197.49199999999996, "r": 477.47668, "b": 206.33880999999997, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero", "bbox": {"l": 133.76801, "t": 209.44701999999995, "r": 477.48068000000006, "b": 218.29381999999998, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "eos et accusam et justo duo dolores et ea rebum.", "bbox": {"l": 133.76801, "t": 221.40301999999997, "r": 355.20874, "b": 230.24982, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Stet clita kasd gubergren,", "bbox": {"l": 362.60098, "t": 221.40301999999997, "r": 477.48276, "b": 230.24982, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor", "bbox": {"l": 133.76801, "t": 233.35802999999999, "r": 477.47772, "b": 242.20483000000002, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt", "bbox": {"l": 133.76801, "t": 245.31304999999998, "r": 477.47971, "b": 254.15985, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et", "bbox": {"l": 133.76801, "t": 257.26806999999997, "r": 477.47473, "b": 266.11487, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea", "bbox": {"l": 133.76801, "t": 269.22308, "r": 477.47571000000005, "b": 278.06989, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "takimata sanctus est Lorem ipsum dolor sit amet.", "bbox": {"l": 133.76801, "t": 281.17911, "r": 351.48471, "b": 290.02588, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet."}, {"label": "text", "id": 3, "page_no": 0, "cluster": {"id": 3, "label": "text", "bbox": {"l": 133.76801, "t": 293.13409, "r": 477.47876, "b": 337.84583, "coord_origin": "TOPLEFT"}, "confidence": 0.9834160804748535, "cells": [{"id": 14, "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie", "bbox": {"l": 148.71201, "t": 293.13409, "r": 477.47479, "b": 301.98087, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan", "bbox": {"l": 133.76801, "t": 305.08908, "r": 477.47876, "b": 313.9358500000001, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "et iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis", "bbox": {"l": 133.76801, "t": 317.04407, "r": 477.47668, "b": 325.89084, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "dolore te feugait nulla facilisi. Lorem ipsum dolor sit amet,", "bbox": {"l": 133.76801, "t": 328.99905, "r": 391.79935, "b": 337.84583, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore te feugait nulla facilisi. Lorem ipsum dolor sit amet,"}, {"label": "caption", "id": 7, "page_no": 0, "cluster": {"id": 7, "label": "caption", "bbox": {"l": 223.15500000000003, "t": 349.92105, "r": 388.09375, "b": 358.76782, "coord_origin": "TOPLEFT"}, "confidence": 0.5588350296020508, "cells": [{"id": 18, "text": "Listing 1: Simple JavaScript Program", "bbox": {"l": 223.15500000000003, "t": 349.92105, "r": 388.09375, "b": 358.76782, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Listing 1: Simple JavaScript Program"}, {"label": "code", "id": 6, "page_no": 0, "cluster": {"id": 6, "label": "code", "bbox": {"l": 134.239, "t": 366.3995100000001, "r": 263.22409, "b": 406.74554, "coord_origin": "TOPLEFT"}, "confidence": 0.6312209963798523, "cells": [{"id": 19, "text": "function", "bbox": {"l": 134.605, "t": 366.3995100000001, "r": 178.11899, "b": 373.86853, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "add(a, b) {", "bbox": {"l": 185.31004, "t": 366.3995100000001, "r": 246.27264000000002, "b": 373.86853, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "return a + b;", "bbox": {"l": 157.17101, "t": 377.35852, "r": 229.32368, "b": 384.82755, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "}", "bbox": {"l": 134.239, "t": 388.31750000000005, "r": 138.94637, "b": 395.78653, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "console.log(add(3, 5));", "bbox": {"l": 134.592, "t": 399.27652, "r": 263.22409, "b": 406.74554, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "function add(a, b) { return a + b; } console.log(add(3, 5));"}, {"label": "text", "id": 0, "page_no": 0, "cluster": {"id": 0, "label": "text", "bbox": {"l": 133.76801, "t": 419.06097000000005, "r": 477.48172000000005, "b": 559.41464, "coord_origin": "TOPLEFT"}, "confidence": 0.987352728843689, "cells": [{"id": 24, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy", "bbox": {"l": 148.71201, "t": 419.06097000000005, "r": 477.47786999999994, "b": 427.90775, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam", "bbox": {"l": 133.76801, "t": 431.01697, "r": 477.47860999999995, "b": 439.86374, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita", "bbox": {"l": 133.76801, "t": 442.97195, "r": 477.47571000000005, "b": 451.81873, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem", "bbox": {"l": 133.76801, "t": 454.92694, "r": 477.47559, "b": 463.77371, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod", "bbox": {"l": 133.76801, "t": 466.88193, "r": 477.48169000000007, "b": 475.7287, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At", "bbox": {"l": 133.76801, "t": 478.83691, "r": 477.48062, "b": 487.68369, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren,", "bbox": {"l": 133.76801, "t": 490.7919, "r": 477.48172000000005, "b": 499.63867, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor", "bbox": {"l": 133.76801, "t": 502.74789, "r": 477.47772, "b": 511.59467, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt", "bbox": {"l": 133.76801, "t": 514.70288, "r": 477.47971, "b": 523.5496499999999, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et", "bbox": {"l": 133.76801, "t": 526.65787, "r": 477.47473, "b": 535.50464, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea", "bbox": {"l": 133.76801, "t": 538.61285, "r": 477.47571000000005, "b": 547.45964, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "takimata sanctus est Lorem ipsum dolor sit amet.", "bbox": {"l": 133.76801, "t": 550.56786, "r": 351.48471, "b": 559.41464, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet."}, {"label": "text", "id": 2, "page_no": 0, "cluster": {"id": 2, "label": "text", "bbox": {"l": 133.76801, "t": 562.52286, "r": 477.47876, "b": 607.23564, "coord_origin": "TOPLEFT"}, "confidence": 0.9843751788139343, "cells": [{"id": 36, "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie", "bbox": {"l": 148.71201, "t": 562.52286, "r": 477.47479, "b": 571.36964, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan", "bbox": {"l": 133.76801, "t": 574.47885, "r": 477.47876, "b": 583.32564, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "et iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis", "bbox": {"l": 133.76801, "t": 586.43385, "r": 477.47668, "b": 595.28064, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "dolore te feugait nulla facilisi. Lorem ipsum dolor sit amet,", "bbox": {"l": 133.76801, "t": 598.38885, "r": 391.79935, "b": 607.23564, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore te feugait nulla facilisi. Lorem ipsum dolor sit amet,"}], "headers": [{"label": "page_footer", "id": 5, "page_no": 0, "cluster": {"id": 5, "label": "page_footer", "bbox": {"l": 303.133, "t": 695.720856, "r": 308.11429, "b": 704.56765, "coord_origin": "TOPLEFT"}, "confidence": 0.8444077372550964, "cells": [{"id": 40, "text": "1", "bbox": {"l": 303.133, "t": 695.720856, "r": 308.11429, "b": 704.56765, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1"}]}}, {"page_no": 1, "size": {"width": 595.2760009765625, "height": 841.8900146484375}, "cells": [{"id": 0, "text": "Formula", "bbox": {"l": 133.76801021944917, "t": 124.80877068912298, "r": 191.5272403142044, "b": 137.5481507594625, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eir-", "bbox": {"l": 133.76801021944917, "t": 149.67193082640324, "r": 477.47971078331534, "b": 158.5187308752503, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "mod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam volup-", "bbox": {"l": 133.76801021944917, "t": 161.62695089241197, "r": 477.4806507833169, "b": 170.47375094125903, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "tua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd", "bbox": {"l": 133.76801021944917, "t": 173.5819709584208, "r": 477.4757107833087, "b": 182.42877100726787, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ip-", "bbox": {"l": 133.76801021944917, "t": 185.53698102442956, "r": 477.47467078330703, "b": 194.38378107327662, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "sum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor", "bbox": {"l": 133.76801021944917, "t": 197.4929810904439, "r": 477.4766807833103, "b": 206.33978113929084, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero", "bbox": {"l": 133.76801021944917, "t": 209.44799115645253, "r": 477.48068078331687, "b": 218.29480120529956, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "eos et accusam et justo duo dolores et ea rebum.", "bbox": {"l": 133.76801021944917, "t": 221.40301122246137, "r": 355.2087405827272, "b": 230.24981127130832, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Stet clita kasd gubergren,", "bbox": {"l": 362.6009805948544, "t": 221.40301122246137, "r": 477.48276078332026, "b": 230.24981127130832, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor", "bbox": {"l": 133.76801021944917, "t": 233.35803128847022, "r": 477.47772078331195, "b": 242.20483133731727, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt", "bbox": {"l": 133.76801021944917, "t": 245.31304135447897, "r": 477.47971078331534, "b": 254.159851403326, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et", "bbox": {"l": 133.76801021944917, "t": 257.2680614204878, "r": 477.47473078330717, "b": 266.11486146933476, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea", "bbox": {"l": 133.76801021944917, "t": 269.22406148650214, "r": 477.4757107833087, "b": 278.07086153534897, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "takimata sanctus est Lorem ipsum dolor sit amet.", "bbox": {"l": 133.76801021944917, "t": 281.17907155251066, "r": 351.48471057661794, "b": 290.0258716013577, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie", "bbox": {"l": 148.71201024396512, "t": 293.1340916185196, "r": 477.47479078330724, "b": 301.98089166736656, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et", "bbox": {"l": 133.76801021944917, "t": 305.08911168452846, "r": 477.48163078331845, "b": 313.9359117333753, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore", "bbox": {"l": 133.76801021944917, "t": 317.0441217505371, "r": 477.47867078331365, "b": 325.89093179938413, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "te feugait nulla facilisi. Lorem ipsum dolor sit amet, consectetuer adipiscing elit,", "bbox": {"l": 133.76801021944917, "t": 328.99914181654606, "r": 477.48071078331697, "b": 337.8459118653928, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "sed diam nonummy nibh euismod tincidunt.", "bbox": {"l": 133.76801021944917, "t": 340.9551318825601, "r": 326.21555053516335, "b": 349.801911931407, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "a", "bbox": {"l": 280.5540204602546, "t": 364.8651420145776, "r": 285.820250468894, "b": 373.7119120634245, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "2", "bbox": {"l": 285.8200104688936, "t": 362.82534200331503, "r": 289.7916004754091, "b": 369.0180620375076, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "+ 8 = 12", "bbox": {"l": 292.50400047985886, "t": 364.8651420145776, "r": 330.6965605425145, "b": 373.7119120634245, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy", "bbox": {"l": 148.71199024396506, "t": 382.7981521135935, "r": 477.47787078331226, "b": 391.6449221624403, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam", "bbox": {"l": 133.76799021944913, "t": 394.75314217960215, "r": 477.4786107833135, "b": 403.599912228449, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita", "bbox": {"l": 133.76799021944913, "t": 406.70813224561084, "r": 477.4756507833086, "b": 415.55490229445763, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem", "bbox": {"l": 133.76799021944913, "t": 418.6631123116194, "r": 477.4755607833085, "b": 427.50988236046624, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod", "bbox": {"l": 133.76799021944913, "t": 430.618102377628, "r": 477.4816907833186, "b": 439.4648724264749, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At", "bbox": {"l": 133.76799021944913, "t": 442.5740924436422, "r": 477.48062078331674, "b": 451.42086249248905, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren,", "bbox": {"l": 133.76799021944913, "t": 454.5290825096509, "r": 477.48166078331843, "b": 463.3758525584977, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor", "bbox": {"l": 133.76799021944913, "t": 466.4840725756595, "r": 477.47772078331195, "b": 475.3308426245064, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt", "bbox": {"l": 133.76799021944913, "t": 478.43905264166807, "r": 477.47968078331525, "b": 487.285822690515, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et", "bbox": {"l": 133.76799021944913, "t": 490.39404270767676, "r": 477.47473078330717, "b": 499.2408127565236, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea", "bbox": {"l": 133.76799021944913, "t": 502.34902277368536, "r": 477.4756507833086, "b": 511.1958028225323, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "takimata sanctus est Lorem ipsum dolor sit amet.", "bbox": {"l": 133.76799021944913, "t": 514.3050228396996, "r": 351.48471057661794, "b": 523.1517928885464, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie", "bbox": {"l": 148.71199024396506, "t": 526.2600129057082, "r": 477.47479078330724, "b": 535.1067829545551, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et", "bbox": {"l": 133.76799021944913, "t": 538.2149929717168, "r": 477.48163078331845, "b": 547.0617630205636, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore", "bbox": {"l": 133.76799021944913, "t": 550.1699830377255, "r": 477.47864078331355, "b": 559.0167530865724, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "te feugait nulla facilisi. Lorem ipsum dolor sit amet, consectetuer adipiscing elit,", "bbox": {"l": 133.76799021944913, "t": 562.1249631037342, "r": 477.48071078331697, "b": 570.971743152581, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "sed diam nonummy nibh euismod tincidunt ut laoreet dolore magna aliquam erat", "bbox": {"l": 133.76799021944913, "t": 574.0799531697428, "r": 477.48370078332186, "b": 582.9267232185896, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "volutpat.", "bbox": {"l": 133.76799021944913, "t": 586.0359332357568, "r": 173.06447028391582, "b": 594.8827232846038, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie", "bbox": {"l": 148.71199024396506, "t": 597.9909333017656, "r": 477.47479078330724, "b": 606.8377233506126, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et", "bbox": {"l": 133.76799021944913, "t": 609.9459333677743, "r": 477.48163078331845, "b": 618.7927234166212, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore", "bbox": {"l": 133.76799021944913, "t": 621.900943433783, "r": 477.47864078331355, "b": 630.7477234826299, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "te feugait nulla facilisi. Lorem ipsum dolor sit amet, consectetuer adipiscing elit,", "bbox": {"l": 133.76799021944913, "t": 633.8559434997917, "r": 477.48071078331697, "b": 642.7027235486387, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "sed diam nonummy nibh euismod tincidunt ut laoreet dolore magna aliquam erat", "bbox": {"l": 133.76799021944913, "t": 645.8119335658059, "r": 477.48370078332186, "b": 654.6587236146529, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "volutpat.", "bbox": {"l": 133.76799021944913, "t": 657.7669336318146, "r": 173.06447028391582, "b": 666.6137236806616, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "1", "bbox": {"l": 303.13300049729594, "t": 695.7219338413805, "r": 308.1142905054678, "b": 704.5687238902275, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 5, "label": "section_header", "bbox": {"l": 133.76801021944917, "t": 124.80877068912298, "r": 191.5272403142044, "b": 137.5481507594625, "coord_origin": "TOPLEFT"}, "confidence": 0.950506865978241, "cells": [{"id": 0, "text": "Formula", "bbox": {"l": 133.76801021944917, "t": 124.80877068912298, "r": 191.5272403142044, "b": 137.5481507594625, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 133.76801021944917, "t": 149.67193082640324, "r": 477.48276078332026, "b": 290.0258716013577, "coord_origin": "TOPLEFT"}, "confidence": 0.9877254366874695, "cells": [{"id": 1, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eir-", "bbox": {"l": 133.76801021944917, "t": 149.67193082640324, "r": 477.47971078331534, "b": 158.5187308752503, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "mod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam volup-", "bbox": {"l": 133.76801021944917, "t": 161.62695089241197, "r": 477.4806507833169, "b": 170.47375094125903, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "tua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd", "bbox": {"l": 133.76801021944917, "t": 173.5819709584208, "r": 477.4757107833087, "b": 182.42877100726787, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ip-", "bbox": {"l": 133.76801021944917, "t": 185.53698102442956, "r": 477.47467078330703, "b": 194.38378107327662, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "sum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor", "bbox": {"l": 133.76801021944917, "t": 197.4929810904439, "r": 477.4766807833103, "b": 206.33978113929084, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero", "bbox": {"l": 133.76801021944917, "t": 209.44799115645253, "r": 477.48068078331687, "b": 218.29480120529956, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "eos et accusam et justo duo dolores et ea rebum.", "bbox": {"l": 133.76801021944917, "t": 221.40301122246137, "r": 355.2087405827272, "b": 230.24981127130832, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Stet clita kasd gubergren,", "bbox": {"l": 362.6009805948544, "t": 221.40301122246137, "r": 477.48276078332026, "b": 230.24981127130832, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor", "bbox": {"l": 133.76801021944917, "t": 233.35803128847022, "r": 477.47772078331195, "b": 242.20483133731727, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt", "bbox": {"l": 133.76801021944917, "t": 245.31304135447897, "r": 477.47971078331534, "b": 254.159851403326, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et", "bbox": {"l": 133.76801021944917, "t": 257.2680614204878, "r": 477.47473078330717, "b": 266.11486146933476, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea", "bbox": {"l": 133.76801021944917, "t": 269.22406148650214, "r": 477.4757107833087, "b": 278.07086153534897, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "takimata sanctus est Lorem ipsum dolor sit amet.", "bbox": {"l": 133.76801021944917, "t": 281.17907155251066, "r": 351.48471057661794, "b": 290.0258716013577, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 133.76801021944917, "t": 293.1340916185196, "r": 477.48163078331845, "b": 349.801911931407, "coord_origin": "TOPLEFT"}, "confidence": 0.9853153228759766, "cells": [{"id": 14, "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie", "bbox": {"l": 148.71201024396512, "t": 293.1340916185196, "r": 477.47479078330724, "b": 301.98089166736656, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et", "bbox": {"l": 133.76801021944917, "t": 305.08911168452846, "r": 477.48163078331845, "b": 313.9359117333753, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore", "bbox": {"l": 133.76801021944917, "t": 317.0441217505371, "r": 477.47867078331365, "b": 325.89093179938413, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "te feugait nulla facilisi. Lorem ipsum dolor sit amet, consectetuer adipiscing elit,", "bbox": {"l": 133.76801021944917, "t": 328.99914181654606, "r": 477.48071078331697, "b": 337.8459118653928, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "sed diam nonummy nibh euismod tincidunt.", "bbox": {"l": 133.76801021944917, "t": 340.9551318825601, "r": 326.21555053516335, "b": 349.801911931407, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "formula", "bbox": {"l": 280.5540204602546, "t": 362.82534200331503, "r": 330.6965605425145, "b": 373.7119120634245, "coord_origin": "TOPLEFT"}, "confidence": 0.8727474808692932, "cells": [{"id": 19, "text": "a", "bbox": {"l": 280.5540204602546, "t": 364.8651420145776, "r": 285.820250468894, "b": 373.7119120634245, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "2", "bbox": {"l": 285.8200104688936, "t": 362.82534200331503, "r": 289.7916004754091, "b": 369.0180620375076, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "+ 8 = 12", "bbox": {"l": 292.50400047985886, "t": 364.8651420145776, "r": 330.6965605425145, "b": 373.7119120634245, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 133.76799021944913, "t": 382.7981521135935, "r": 477.4816907833186, "b": 523.1517928885464, "coord_origin": "TOPLEFT"}, "confidence": 0.9879696369171143, "cells": [{"id": 22, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy", "bbox": {"l": 148.71199024396506, "t": 382.7981521135935, "r": 477.47787078331226, "b": 391.6449221624403, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam", "bbox": {"l": 133.76799021944913, "t": 394.75314217960215, "r": 477.4786107833135, "b": 403.599912228449, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita", "bbox": {"l": 133.76799021944913, "t": 406.70813224561084, "r": 477.4756507833086, "b": 415.55490229445763, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem", "bbox": {"l": 133.76799021944913, "t": 418.6631123116194, "r": 477.4755607833085, "b": 427.50988236046624, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod", "bbox": {"l": 133.76799021944913, "t": 430.618102377628, "r": 477.4816907833186, "b": 439.4648724264749, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At", "bbox": {"l": 133.76799021944913, "t": 442.5740924436422, "r": 477.48062078331674, "b": 451.42086249248905, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren,", "bbox": {"l": 133.76799021944913, "t": 454.5290825096509, "r": 477.48166078331843, "b": 463.3758525584977, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor", "bbox": {"l": 133.76799021944913, "t": 466.4840725756595, "r": 477.47772078331195, "b": 475.3308426245064, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt", "bbox": {"l": 133.76799021944913, "t": 478.43905264166807, "r": 477.47968078331525, "b": 487.285822690515, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et", "bbox": {"l": 133.76799021944913, "t": 490.39404270767676, "r": 477.47473078330717, "b": 499.2408127565236, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea", "bbox": {"l": 133.76799021944913, "t": 502.34902277368536, "r": 477.4756507833086, "b": 511.1958028225323, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "takimata sanctus est Lorem ipsum dolor sit amet.", "bbox": {"l": 133.76799021944913, "t": 514.3050228396996, "r": 351.48471057661794, "b": 523.1517928885464, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "text", "bbox": {"l": 133.76799021944913, "t": 526.2600129057082, "r": 477.48370078332186, "b": 594.8827232846038, "coord_origin": "TOPLEFT"}, "confidence": 0.9845718145370483, "cells": [{"id": 34, "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie", "bbox": {"l": 148.71199024396506, "t": 526.2600129057082, "r": 477.47479078330724, "b": 535.1067829545551, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et", "bbox": {"l": 133.76799021944913, "t": 538.2149929717168, "r": 477.48163078331845, "b": 547.0617630205636, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore", "bbox": {"l": 133.76799021944913, "t": 550.1699830377255, "r": 477.47864078331355, "b": 559.0167530865724, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "te feugait nulla facilisi. Lorem ipsum dolor sit amet, consectetuer adipiscing elit,", "bbox": {"l": 133.76799021944913, "t": 562.1249631037342, "r": 477.48071078331697, "b": 570.971743152581, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "sed diam nonummy nibh euismod tincidunt ut laoreet dolore magna aliquam erat", "bbox": {"l": 133.76799021944913, "t": 574.0799531697428, "r": 477.48370078332186, "b": 582.9267232185896, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "volutpat.", "bbox": {"l": 133.76799021944913, "t": 586.0359332357568, "r": 173.06447028391582, "b": 594.8827232846038, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 133.76799021944913, "t": 597.9909333017656, "r": 477.48370078332186, "b": 666.6137236806616, "coord_origin": "TOPLEFT"}, "confidence": 0.98720782995224, "cells": [{"id": 40, "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie", "bbox": {"l": 148.71199024396506, "t": 597.9909333017656, "r": 477.47479078330724, "b": 606.8377233506126, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et", "bbox": {"l": 133.76799021944913, "t": 609.9459333677743, "r": 477.48163078331845, "b": 618.7927234166212, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore", "bbox": {"l": 133.76799021944913, "t": 621.900943433783, "r": 477.47864078331355, "b": 630.7477234826299, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "te feugait nulla facilisi. Lorem ipsum dolor sit amet, consectetuer adipiscing elit,", "bbox": {"l": 133.76799021944913, "t": 633.8559434997917, "r": 477.48071078331697, "b": 642.7027235486387, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "sed diam nonummy nibh euismod tincidunt ut laoreet dolore magna aliquam erat", "bbox": {"l": 133.76799021944913, "t": 645.8119335658059, "r": 477.48370078332186, "b": 654.6587236146529, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "volutpat.", "bbox": {"l": 133.76799021944913, "t": 657.7669336318146, "r": 173.06447028391582, "b": 666.6137236806616, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "page_footer", "bbox": {"l": 303.13300049729594, "t": 695.7219338413805, "r": 308.1142905054678, "b": 704.5687238902275, "coord_origin": "TOPLEFT"}, "confidence": 0.8504500389099121, "cells": [{"id": 46, "text": "1", "bbox": {"l": 303.13300049729594, "t": 695.7219338413805, "r": 308.1142905054678, "b": 704.5687238902275, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "section_header", "id": 5, "page_no": 1, "cluster": {"id": 5, "label": "section_header", "bbox": {"l": 133.76801021944917, "t": 124.80877068912298, "r": 191.5272403142044, "b": 137.5481507594625, "coord_origin": "TOPLEFT"}, "confidence": 0.950506865978241, "cells": [{"id": 0, "text": "Formula", "bbox": {"l": 133.76801021944917, "t": 124.80877068912298, "r": 191.5272403142044, "b": 137.5481507594625, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Formula"}, {"label": "text", "id": 1, "page_no": 1, "cluster": {"id": 1, "label": "text", "bbox": {"l": 133.76801021944917, "t": 149.67193082640324, "r": 477.48276078332026, "b": 290.0258716013577, "coord_origin": "TOPLEFT"}, "confidence": 0.9877254366874695, "cells": [{"id": 1, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eir-", "bbox": {"l": 133.76801021944917, "t": 149.67193082640324, "r": 477.47971078331534, "b": 158.5187308752503, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "mod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam volup-", "bbox": {"l": 133.76801021944917, "t": 161.62695089241197, "r": 477.4806507833169, "b": 170.47375094125903, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "tua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd", "bbox": {"l": 133.76801021944917, "t": 173.5819709584208, "r": 477.4757107833087, "b": 182.42877100726787, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ip-", "bbox": {"l": 133.76801021944917, "t": 185.53698102442956, "r": 477.47467078330703, "b": 194.38378107327662, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "sum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor", "bbox": {"l": 133.76801021944917, "t": 197.4929810904439, "r": 477.4766807833103, "b": 206.33978113929084, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero", "bbox": {"l": 133.76801021944917, "t": 209.44799115645253, "r": 477.48068078331687, "b": 218.29480120529956, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "eos et accusam et justo duo dolores et ea rebum.", "bbox": {"l": 133.76801021944917, "t": 221.40301122246137, "r": 355.2087405827272, "b": 230.24981127130832, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Stet clita kasd gubergren,", "bbox": {"l": 362.6009805948544, "t": 221.40301122246137, "r": 477.48276078332026, "b": 230.24981127130832, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor", "bbox": {"l": 133.76801021944917, "t": 233.35803128847022, "r": 477.47772078331195, "b": 242.20483133731727, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt", "bbox": {"l": 133.76801021944917, "t": 245.31304135447897, "r": 477.47971078331534, "b": 254.159851403326, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et", "bbox": {"l": 133.76801021944917, "t": 257.2680614204878, "r": 477.47473078330717, "b": 266.11486146933476, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea", "bbox": {"l": 133.76801021944917, "t": 269.22406148650214, "r": 477.4757107833087, "b": 278.07086153534897, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "takimata sanctus est Lorem ipsum dolor sit amet.", "bbox": {"l": 133.76801021944917, "t": 281.17907155251066, "r": 351.48471057661794, "b": 290.0258716013577, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet."}, {"label": "text", "id": 3, "page_no": 1, "cluster": {"id": 3, "label": "text", "bbox": {"l": 133.76801021944917, "t": 293.1340916185196, "r": 477.48163078331845, "b": 349.801911931407, "coord_origin": "TOPLEFT"}, "confidence": 0.9853153228759766, "cells": [{"id": 14, "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie", "bbox": {"l": 148.71201024396512, "t": 293.1340916185196, "r": 477.47479078330724, "b": 301.98089166736656, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et", "bbox": {"l": 133.76801021944917, "t": 305.08911168452846, "r": 477.48163078331845, "b": 313.9359117333753, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore", "bbox": {"l": 133.76801021944917, "t": 317.0441217505371, "r": 477.47867078331365, "b": 325.89093179938413, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "te feugait nulla facilisi. Lorem ipsum dolor sit amet, consectetuer adipiscing elit,", "bbox": {"l": 133.76801021944917, "t": 328.99914181654606, "r": 477.48071078331697, "b": 337.8459118653928, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "sed diam nonummy nibh euismod tincidunt.", "bbox": {"l": 133.76801021944917, "t": 340.9551318825601, "r": 326.21555053516335, "b": 349.801911931407, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore te feugait nulla facilisi. Lorem ipsum dolor sit amet, consectetuer adipiscing elit, sed diam nonummy nibh euismod tincidunt."}, {"label": "formula", "id": 6, "page_no": 1, "cluster": {"id": 6, "label": "formula", "bbox": {"l": 280.5540204602546, "t": 362.82534200331503, "r": 330.6965605425145, "b": 373.7119120634245, "coord_origin": "TOPLEFT"}, "confidence": 0.8727474808692932, "cells": [{"id": 19, "text": "a", "bbox": {"l": 280.5540204602546, "t": 364.8651420145776, "r": 285.820250468894, "b": 373.7119120634245, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "2", "bbox": {"l": 285.8200104688936, "t": 362.82534200331503, "r": 289.7916004754091, "b": 369.0180620375076, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "+ 8 = 12", "bbox": {"l": 292.50400047985886, "t": 364.8651420145776, "r": 330.6965605425145, "b": 373.7119120634245, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "a 2 + 8 = 12"}, {"label": "text", "id": 0, "page_no": 1, "cluster": {"id": 0, "label": "text", "bbox": {"l": 133.76799021944913, "t": 382.7981521135935, "r": 477.4816907833186, "b": 523.1517928885464, "coord_origin": "TOPLEFT"}, "confidence": 0.9879696369171143, "cells": [{"id": 22, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy", "bbox": {"l": 148.71199024396506, "t": 382.7981521135935, "r": 477.47787078331226, "b": 391.6449221624403, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam", "bbox": {"l": 133.76799021944913, "t": 394.75314217960215, "r": 477.4786107833135, "b": 403.599912228449, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita", "bbox": {"l": 133.76799021944913, "t": 406.70813224561084, "r": 477.4756507833086, "b": 415.55490229445763, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem", "bbox": {"l": 133.76799021944913, "t": 418.6631123116194, "r": 477.4755607833085, "b": 427.50988236046624, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod", "bbox": {"l": 133.76799021944913, "t": 430.618102377628, "r": 477.4816907833186, "b": 439.4648724264749, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At", "bbox": {"l": 133.76799021944913, "t": 442.5740924436422, "r": 477.48062078331674, "b": 451.42086249248905, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren,", "bbox": {"l": 133.76799021944913, "t": 454.5290825096509, "r": 477.48166078331843, "b": 463.3758525584977, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor", "bbox": {"l": 133.76799021944913, "t": 466.4840725756595, "r": 477.47772078331195, "b": 475.3308426245064, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt", "bbox": {"l": 133.76799021944913, "t": 478.43905264166807, "r": 477.47968078331525, "b": 487.285822690515, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et", "bbox": {"l": 133.76799021944913, "t": 490.39404270767676, "r": 477.47473078330717, "b": 499.2408127565236, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea", "bbox": {"l": 133.76799021944913, "t": 502.34902277368536, "r": 477.4756507833086, "b": 511.1958028225323, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "takimata sanctus est Lorem ipsum dolor sit amet.", "bbox": {"l": 133.76799021944913, "t": 514.3050228396996, "r": 351.48471057661794, "b": 523.1517928885464, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet."}, {"label": "text", "id": 4, "page_no": 1, "cluster": {"id": 4, "label": "text", "bbox": {"l": 133.76799021944913, "t": 526.2600129057082, "r": 477.48370078332186, "b": 594.8827232846038, "coord_origin": "TOPLEFT"}, "confidence": 0.9845718145370483, "cells": [{"id": 34, "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie", "bbox": {"l": 148.71199024396506, "t": 526.2600129057082, "r": 477.47479078330724, "b": 535.1067829545551, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et", "bbox": {"l": 133.76799021944913, "t": 538.2149929717168, "r": 477.48163078331845, "b": 547.0617630205636, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore", "bbox": {"l": 133.76799021944913, "t": 550.1699830377255, "r": 477.47864078331355, "b": 559.0167530865724, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "te feugait nulla facilisi. Lorem ipsum dolor sit amet, consectetuer adipiscing elit,", "bbox": {"l": 133.76799021944913, "t": 562.1249631037342, "r": 477.48071078331697, "b": 570.971743152581, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "sed diam nonummy nibh euismod tincidunt ut laoreet dolore magna aliquam erat", "bbox": {"l": 133.76799021944913, "t": 574.0799531697428, "r": 477.48370078332186, "b": 582.9267232185896, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "volutpat.", "bbox": {"l": 133.76799021944913, "t": 586.0359332357568, "r": 173.06447028391582, "b": 594.8827232846038, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore te feugait nulla facilisi. Lorem ipsum dolor sit amet, consectetuer adipiscing elit, sed diam nonummy nibh euismod tincidunt ut laoreet dolore magna aliquam erat volutpat."}, {"label": "text", "id": 2, "page_no": 1, "cluster": {"id": 2, "label": "text", "bbox": {"l": 133.76799021944913, "t": 597.9909333017656, "r": 477.48370078332186, "b": 666.6137236806616, "coord_origin": "TOPLEFT"}, "confidence": 0.98720782995224, "cells": [{"id": 40, "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie", "bbox": {"l": 148.71199024396506, "t": 597.9909333017656, "r": 477.47479078330724, "b": 606.8377233506126, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et", "bbox": {"l": 133.76799021944913, "t": 609.9459333677743, "r": 477.48163078331845, "b": 618.7927234166212, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore", "bbox": {"l": 133.76799021944913, "t": 621.900943433783, "r": 477.47864078331355, "b": 630.7477234826299, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "te feugait nulla facilisi. Lorem ipsum dolor sit amet, consectetuer adipiscing elit,", "bbox": {"l": 133.76799021944913, "t": 633.8559434997917, "r": 477.48071078331697, "b": 642.7027235486387, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "sed diam nonummy nibh euismod tincidunt ut laoreet dolore magna aliquam erat", "bbox": {"l": 133.76799021944913, "t": 645.8119335658059, "r": 477.48370078332186, "b": 654.6587236146529, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "volutpat.", "bbox": {"l": 133.76799021944913, "t": 657.7669336318146, "r": 173.06447028391582, "b": 666.6137236806616, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore te feugait nulla facilisi. Lorem ipsum dolor sit amet, consectetuer adipiscing elit, sed diam nonummy nibh euismod tincidunt ut laoreet dolore magna aliquam erat volutpat."}, {"label": "page_footer", "id": 7, "page_no": 1, "cluster": {"id": 7, "label": "page_footer", "bbox": {"l": 303.13300049729594, "t": 695.7219338413805, "r": 308.1142905054678, "b": 704.5687238902275, "coord_origin": "TOPLEFT"}, "confidence": 0.8504500389099121, "cells": [{"id": 46, "text": "1", "bbox": {"l": 303.13300049729594, "t": 695.7219338413805, "r": 308.1142905054678, "b": 704.5687238902275, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1"}], "body": [{"label": "section_header", "id": 5, "page_no": 1, "cluster": {"id": 5, "label": "section_header", "bbox": {"l": 133.76801021944917, "t": 124.80877068912298, "r": 191.5272403142044, "b": 137.5481507594625, "coord_origin": "TOPLEFT"}, "confidence": 0.950506865978241, "cells": [{"id": 0, "text": "Formula", "bbox": {"l": 133.76801021944917, "t": 124.80877068912298, "r": 191.5272403142044, "b": 137.5481507594625, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Formula"}, {"label": "text", "id": 1, "page_no": 1, "cluster": {"id": 1, "label": "text", "bbox": {"l": 133.76801021944917, "t": 149.67193082640324, "r": 477.48276078332026, "b": 290.0258716013577, "coord_origin": "TOPLEFT"}, "confidence": 0.9877254366874695, "cells": [{"id": 1, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eir-", "bbox": {"l": 133.76801021944917, "t": 149.67193082640324, "r": 477.47971078331534, "b": 158.5187308752503, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "mod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam volup-", "bbox": {"l": 133.76801021944917, "t": 161.62695089241197, "r": 477.4806507833169, "b": 170.47375094125903, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "tua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd", "bbox": {"l": 133.76801021944917, "t": 173.5819709584208, "r": 477.4757107833087, "b": 182.42877100726787, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ip-", "bbox": {"l": 133.76801021944917, "t": 185.53698102442956, "r": 477.47467078330703, "b": 194.38378107327662, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "sum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor", "bbox": {"l": 133.76801021944917, "t": 197.4929810904439, "r": 477.4766807833103, "b": 206.33978113929084, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero", "bbox": {"l": 133.76801021944917, "t": 209.44799115645253, "r": 477.48068078331687, "b": 218.29480120529956, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "eos et accusam et justo duo dolores et ea rebum.", "bbox": {"l": 133.76801021944917, "t": 221.40301122246137, "r": 355.2087405827272, "b": 230.24981127130832, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Stet clita kasd gubergren,", "bbox": {"l": 362.6009805948544, "t": 221.40301122246137, "r": 477.48276078332026, "b": 230.24981127130832, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor", "bbox": {"l": 133.76801021944917, "t": 233.35803128847022, "r": 477.47772078331195, "b": 242.20483133731727, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt", "bbox": {"l": 133.76801021944917, "t": 245.31304135447897, "r": 477.47971078331534, "b": 254.159851403326, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et", "bbox": {"l": 133.76801021944917, "t": 257.2680614204878, "r": 477.47473078330717, "b": 266.11486146933476, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea", "bbox": {"l": 133.76801021944917, "t": 269.22406148650214, "r": 477.4757107833087, "b": 278.07086153534897, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "takimata sanctus est Lorem ipsum dolor sit amet.", "bbox": {"l": 133.76801021944917, "t": 281.17907155251066, "r": 351.48471057661794, "b": 290.0258716013577, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet."}, {"label": "text", "id": 3, "page_no": 1, "cluster": {"id": 3, "label": "text", "bbox": {"l": 133.76801021944917, "t": 293.1340916185196, "r": 477.48163078331845, "b": 349.801911931407, "coord_origin": "TOPLEFT"}, "confidence": 0.9853153228759766, "cells": [{"id": 14, "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie", "bbox": {"l": 148.71201024396512, "t": 293.1340916185196, "r": 477.47479078330724, "b": 301.98089166736656, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et", "bbox": {"l": 133.76801021944917, "t": 305.08911168452846, "r": 477.48163078331845, "b": 313.9359117333753, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore", "bbox": {"l": 133.76801021944917, "t": 317.0441217505371, "r": 477.47867078331365, "b": 325.89093179938413, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "te feugait nulla facilisi. Lorem ipsum dolor sit amet, consectetuer adipiscing elit,", "bbox": {"l": 133.76801021944917, "t": 328.99914181654606, "r": 477.48071078331697, "b": 337.8459118653928, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "sed diam nonummy nibh euismod tincidunt.", "bbox": {"l": 133.76801021944917, "t": 340.9551318825601, "r": 326.21555053516335, "b": 349.801911931407, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore te feugait nulla facilisi. Lorem ipsum dolor sit amet, consectetuer adipiscing elit, sed diam nonummy nibh euismod tincidunt."}, {"label": "formula", "id": 6, "page_no": 1, "cluster": {"id": 6, "label": "formula", "bbox": {"l": 280.5540204602546, "t": 362.82534200331503, "r": 330.6965605425145, "b": 373.7119120634245, "coord_origin": "TOPLEFT"}, "confidence": 0.8727474808692932, "cells": [{"id": 19, "text": "a", "bbox": {"l": 280.5540204602546, "t": 364.8651420145776, "r": 285.820250468894, "b": 373.7119120634245, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "2", "bbox": {"l": 285.8200104688936, "t": 362.82534200331503, "r": 289.7916004754091, "b": 369.0180620375076, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "+ 8 = 12", "bbox": {"l": 292.50400047985886, "t": 364.8651420145776, "r": 330.6965605425145, "b": 373.7119120634245, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "a 2 + 8 = 12"}, {"label": "text", "id": 0, "page_no": 1, "cluster": {"id": 0, "label": "text", "bbox": {"l": 133.76799021944913, "t": 382.7981521135935, "r": 477.4816907833186, "b": 523.1517928885464, "coord_origin": "TOPLEFT"}, "confidence": 0.9879696369171143, "cells": [{"id": 22, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy", "bbox": {"l": 148.71199024396506, "t": 382.7981521135935, "r": 477.47787078331226, "b": 391.6449221624403, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam", "bbox": {"l": 133.76799021944913, "t": 394.75314217960215, "r": 477.4786107833135, "b": 403.599912228449, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita", "bbox": {"l": 133.76799021944913, "t": 406.70813224561084, "r": 477.4756507833086, "b": 415.55490229445763, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem", "bbox": {"l": 133.76799021944913, "t": 418.6631123116194, "r": 477.4755607833085, "b": 427.50988236046624, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod", "bbox": {"l": 133.76799021944913, "t": 430.618102377628, "r": 477.4816907833186, "b": 439.4648724264749, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At", "bbox": {"l": 133.76799021944913, "t": 442.5740924436422, "r": 477.48062078331674, "b": 451.42086249248905, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren,", "bbox": {"l": 133.76799021944913, "t": 454.5290825096509, "r": 477.48166078331843, "b": 463.3758525584977, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor", "bbox": {"l": 133.76799021944913, "t": 466.4840725756595, "r": 477.47772078331195, "b": 475.3308426245064, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt", "bbox": {"l": 133.76799021944913, "t": 478.43905264166807, "r": 477.47968078331525, "b": 487.285822690515, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et", "bbox": {"l": 133.76799021944913, "t": 490.39404270767676, "r": 477.47473078330717, "b": 499.2408127565236, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea", "bbox": {"l": 133.76799021944913, "t": 502.34902277368536, "r": 477.4756507833086, "b": 511.1958028225323, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "takimata sanctus est Lorem ipsum dolor sit amet.", "bbox": {"l": 133.76799021944913, "t": 514.3050228396996, "r": 351.48471057661794, "b": 523.1517928885464, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet."}, {"label": "text", "id": 4, "page_no": 1, "cluster": {"id": 4, "label": "text", "bbox": {"l": 133.76799021944913, "t": 526.2600129057082, "r": 477.48370078332186, "b": 594.8827232846038, "coord_origin": "TOPLEFT"}, "confidence": 0.9845718145370483, "cells": [{"id": 34, "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie", "bbox": {"l": 148.71199024396506, "t": 526.2600129057082, "r": 477.47479078330724, "b": 535.1067829545551, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et", "bbox": {"l": 133.76799021944913, "t": 538.2149929717168, "r": 477.48163078331845, "b": 547.0617630205636, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore", "bbox": {"l": 133.76799021944913, "t": 550.1699830377255, "r": 477.47864078331355, "b": 559.0167530865724, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "te feugait nulla facilisi. Lorem ipsum dolor sit amet, consectetuer adipiscing elit,", "bbox": {"l": 133.76799021944913, "t": 562.1249631037342, "r": 477.48071078331697, "b": 570.971743152581, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "sed diam nonummy nibh euismod tincidunt ut laoreet dolore magna aliquam erat", "bbox": {"l": 133.76799021944913, "t": 574.0799531697428, "r": 477.48370078332186, "b": 582.9267232185896, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "volutpat.", "bbox": {"l": 133.76799021944913, "t": 586.0359332357568, "r": 173.06447028391582, "b": 594.8827232846038, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore te feugait nulla facilisi. Lorem ipsum dolor sit amet, consectetuer adipiscing elit, sed diam nonummy nibh euismod tincidunt ut laoreet dolore magna aliquam erat volutpat."}, {"label": "text", "id": 2, "page_no": 1, "cluster": {"id": 2, "label": "text", "bbox": {"l": 133.76799021944913, "t": 597.9909333017656, "r": 477.48370078332186, "b": 666.6137236806616, "coord_origin": "TOPLEFT"}, "confidence": 0.98720782995224, "cells": [{"id": 40, "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie", "bbox": {"l": 148.71199024396506, "t": 597.9909333017656, "r": 477.47479078330724, "b": 606.8377233506126, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et", "bbox": {"l": 133.76799021944913, "t": 609.9459333677743, "r": 477.48163078331845, "b": 618.7927234166212, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore", "bbox": {"l": 133.76799021944913, "t": 621.900943433783, "r": 477.47864078331355, "b": 630.7477234826299, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "te feugait nulla facilisi. Lorem ipsum dolor sit amet, consectetuer adipiscing elit,", "bbox": {"l": 133.76799021944913, "t": 633.8559434997917, "r": 477.48071078331697, "b": 642.7027235486387, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "sed diam nonummy nibh euismod tincidunt ut laoreet dolore magna aliquam erat", "bbox": {"l": 133.76799021944913, "t": 645.8119335658059, "r": 477.48370078332186, "b": 654.6587236146529, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "volutpat.", "bbox": {"l": 133.76799021944913, "t": 657.7669336318146, "r": 173.06447028391582, "b": 666.6137236806616, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore te feugait nulla facilisi. Lorem ipsum dolor sit amet, consectetuer adipiscing elit, sed diam nonummy nibh euismod tincidunt ut laoreet dolore magna aliquam erat volutpat."}], "headers": [{"label": "page_footer", "id": 7, "page_no": 1, "cluster": {"id": 7, "label": "page_footer", "bbox": {"l": 303.13300049729594, "t": 695.7219338413805, "r": 308.1142905054678, "b": 704.5687238902275, "coord_origin": "TOPLEFT"}, "confidence": 0.8504500389099121, "cells": [{"id": 46, "text": "1", "bbox": {"l": 303.13300049729594, "t": 695.7219338413805, "r": 308.1142905054678, "b": 704.5687238902275, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1"}]}}]
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v2/csv-comma-in-cell.csv.itxt b/tests/data/groundtruth/docling_v2/csv-comma-in-cell.csv.itxt
new file mode 100644
index 00000000..e4b7895f
--- /dev/null
+++ b/tests/data/groundtruth/docling_v2/csv-comma-in-cell.csv.itxt
@@ -0,0 +1,2 @@
+item-0 at level 0: unspecified: group _root_
+  item-1 at level 1: table with [5x4]
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v2/csv-comma-in-cell.csv.json b/tests/data/groundtruth/docling_v2/csv-comma-in-cell.csv.json
new file mode 100644
index 00000000..310d5c84
--- /dev/null
+++ b/tests/data/groundtruth/docling_v2/csv-comma-in-cell.csv.json
@@ -0,0 +1,547 @@
+{
+  "schema_name": "DoclingDocument",
+  "version": "1.1.0",
+  "name": "csv-comma-in-cell",
+  "origin": {
+    "mimetype": "text/csv",
+    "binary_hash": 17599039665518552414,
+    "filename": "csv-comma-in-cell.csv"
+  },
+  "furniture": {
+    "self_ref": "#/furniture",
+    "children": [],
+    "content_layer": "furniture",
+    "name": "_root_",
+    "label": "unspecified"
+  },
+  "body": {
+    "self_ref": "#/body",
+    "children": [
+      {
+        "$ref": "#/tables/0"
+      }
+    ],
+    "content_layer": "body",
+    "name": "_root_",
+    "label": "unspecified"
+  },
+  "groups": [],
+  "texts": [],
+  "pictures": [],
+  "tables": [
+    {
+      "self_ref": "#/tables/0",
+      "parent": {
+        "$ref": "#/body"
+      },
+      "children": [],
+      "content_layer": "body",
+      "label": "table",
+      "prov": [],
+      "captions": [],
+      "references": [],
+      "footnotes": [],
+      "data": {
+        "table_cells": [
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 0,
+            "end_row_offset_idx": 1,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 1,
+            "text": "1",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 0,
+            "end_row_offset_idx": 1,
+            "start_col_offset_idx": 1,
+            "end_col_offset_idx": 2,
+            "text": "2",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 0,
+            "end_row_offset_idx": 1,
+            "start_col_offset_idx": 2,
+            "end_col_offset_idx": 3,
+            "text": "3",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 0,
+            "end_row_offset_idx": 1,
+            "start_col_offset_idx": 3,
+            "end_col_offset_idx": 4,
+            "text": "4",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 1,
+            "end_row_offset_idx": 2,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 1,
+            "text": "a",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 1,
+            "end_row_offset_idx": 2,
+            "start_col_offset_idx": 1,
+            "end_col_offset_idx": 2,
+            "text": "b",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 1,
+            "end_row_offset_idx": 2,
+            "start_col_offset_idx": 2,
+            "end_col_offset_idx": 3,
+            "text": "c",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 1,
+            "end_row_offset_idx": 2,
+            "start_col_offset_idx": 3,
+            "end_col_offset_idx": 4,
+            "text": "d",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 2,
+            "end_row_offset_idx": 3,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 1,
+            "text": "a",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 2,
+            "end_row_offset_idx": 3,
+            "start_col_offset_idx": 1,
+            "end_col_offset_idx": 2,
+            "text": ",",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 2,
+            "end_row_offset_idx": 3,
+            "start_col_offset_idx": 2,
+            "end_col_offset_idx": 3,
+            "text": "c",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 2,
+            "end_row_offset_idx": 3,
+            "start_col_offset_idx": 3,
+            "end_col_offset_idx": 4,
+            "text": "d",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 3,
+            "end_row_offset_idx": 4,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 1,
+            "text": "a",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 3,
+            "end_row_offset_idx": 4,
+            "start_col_offset_idx": 1,
+            "end_col_offset_idx": 2,
+            "text": "b",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 3,
+            "end_row_offset_idx": 4,
+            "start_col_offset_idx": 2,
+            "end_col_offset_idx": 3,
+            "text": "c",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 3,
+            "end_row_offset_idx": 4,
+            "start_col_offset_idx": 3,
+            "end_col_offset_idx": 4,
+            "text": "d",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 4,
+            "end_row_offset_idx": 5,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 1,
+            "text": "a",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 4,
+            "end_row_offset_idx": 5,
+            "start_col_offset_idx": 1,
+            "end_col_offset_idx": 2,
+            "text": "b",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 4,
+            "end_row_offset_idx": 5,
+            "start_col_offset_idx": 2,
+            "end_col_offset_idx": 3,
+            "text": "c",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 4,
+            "end_row_offset_idx": 5,
+            "start_col_offset_idx": 3,
+            "end_col_offset_idx": 4,
+            "text": "d",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          }
+        ],
+        "num_rows": 5,
+        "num_cols": 4,
+        "grid": [
+          [
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 0,
+              "end_row_offset_idx": 1,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "1",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 0,
+              "end_row_offset_idx": 1,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 2,
+              "text": "2",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 0,
+              "end_row_offset_idx": 1,
+              "start_col_offset_idx": 2,
+              "end_col_offset_idx": 3,
+              "text": "3",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 0,
+              "end_row_offset_idx": 1,
+              "start_col_offset_idx": 3,
+              "end_col_offset_idx": 4,
+              "text": "4",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ],
+          [
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 1,
+              "end_row_offset_idx": 2,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "a",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 1,
+              "end_row_offset_idx": 2,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 2,
+              "text": "b",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 1,
+              "end_row_offset_idx": 2,
+              "start_col_offset_idx": 2,
+              "end_col_offset_idx": 3,
+              "text": "c",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 1,
+              "end_row_offset_idx": 2,
+              "start_col_offset_idx": 3,
+              "end_col_offset_idx": 4,
+              "text": "d",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ],
+          [
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 2,
+              "end_row_offset_idx": 3,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "a",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 2,
+              "end_row_offset_idx": 3,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 2,
+              "text": ",",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 2,
+              "end_row_offset_idx": 3,
+              "start_col_offset_idx": 2,
+              "end_col_offset_idx": 3,
+              "text": "c",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 2,
+              "end_row_offset_idx": 3,
+              "start_col_offset_idx": 3,
+              "end_col_offset_idx": 4,
+              "text": "d",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ],
+          [
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 3,
+              "end_row_offset_idx": 4,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "a",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 3,
+              "end_row_offset_idx": 4,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 2,
+              "text": "b",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 3,
+              "end_row_offset_idx": 4,
+              "start_col_offset_idx": 2,
+              "end_col_offset_idx": 3,
+              "text": "c",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 3,
+              "end_row_offset_idx": 4,
+              "start_col_offset_idx": 3,
+              "end_col_offset_idx": 4,
+              "text": "d",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ],
+          [
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 4,
+              "end_row_offset_idx": 5,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "a",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 4,
+              "end_row_offset_idx": 5,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 2,
+              "text": "b",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 4,
+              "end_row_offset_idx": 5,
+              "start_col_offset_idx": 2,
+              "end_col_offset_idx": 3,
+              "text": "c",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 4,
+              "end_row_offset_idx": 5,
+              "start_col_offset_idx": 3,
+              "end_col_offset_idx": 4,
+              "text": "d",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ]
+        ]
+      }
+    }
+  ],
+  "key_value_items": [],
+  "form_items": [],
+  "pages": {}
+}
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v2/csv-comma-in-cell.csv.md b/tests/data/groundtruth/docling_v2/csv-comma-in-cell.csv.md
new file mode 100644
index 00000000..d70e3e7b
--- /dev/null
+++ b/tests/data/groundtruth/docling_v2/csv-comma-in-cell.csv.md
@@ -0,0 +1,6 @@
+| 1   | 2   | 3   | 4   |
+|-----|-----|-----|-----|
+| a   | b   | c   | d   |
+| a   | ,   | c   | d   |
+| a   | b   | c   | d   |
+| a   | b   | c   | d   |
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v2/csv-comma.csv.itxt b/tests/data/groundtruth/docling_v2/csv-comma.csv.itxt
new file mode 100644
index 00000000..6debed5d
--- /dev/null
+++ b/tests/data/groundtruth/docling_v2/csv-comma.csv.itxt
@@ -0,0 +1,2 @@
+item-0 at level 0: unspecified: group _root_
+  item-1 at level 1: table with [6x12]
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v2/csv-comma.csv.json b/tests/data/groundtruth/docling_v2/csv-comma.csv.json
new file mode 100644
index 00000000..4e7f6df9
--- /dev/null
+++ b/tests/data/groundtruth/docling_v2/csv-comma.csv.json
@@ -0,0 +1,1797 @@
+{
+  "schema_name": "DoclingDocument",
+  "version": "1.1.0",
+  "name": "csv-comma",
+  "origin": {
+    "mimetype": "text/csv",
+    "binary_hash": 297933764223584292,
+    "filename": "csv-comma.csv"
+  },
+  "furniture": {
+    "self_ref": "#/furniture",
+    "children": [],
+    "content_layer": "furniture",
+    "name": "_root_",
+    "label": "unspecified"
+  },
+  "body": {
+    "self_ref": "#/body",
+    "children": [
+      {
+        "$ref": "#/tables/0"
+      }
+    ],
+    "content_layer": "body",
+    "name": "_root_",
+    "label": "unspecified"
+  },
+  "groups": [],
+  "texts": [],
+  "pictures": [],
+  "tables": [
+    {
+      "self_ref": "#/tables/0",
+      "parent": {
+        "$ref": "#/body"
+      },
+      "children": [],
+      "content_layer": "body",
+      "label": "table",
+      "prov": [],
+      "captions": [],
+      "references": [],
+      "footnotes": [],
+      "data": {
+        "table_cells": [
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 0,
+            "end_row_offset_idx": 1,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 1,
+            "text": "Index",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 0,
+            "end_row_offset_idx": 1,
+            "start_col_offset_idx": 1,
+            "end_col_offset_idx": 2,
+            "text": "Customer Id",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 0,
+            "end_row_offset_idx": 1,
+            "start_col_offset_idx": 2,
+            "end_col_offset_idx": 3,
+            "text": "First Name",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 0,
+            "end_row_offset_idx": 1,
+            "start_col_offset_idx": 3,
+            "end_col_offset_idx": 4,
+            "text": "Last Name",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 0,
+            "end_row_offset_idx": 1,
+            "start_col_offset_idx": 4,
+            "end_col_offset_idx": 5,
+            "text": "Company",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 0,
+            "end_row_offset_idx": 1,
+            "start_col_offset_idx": 5,
+            "end_col_offset_idx": 6,
+            "text": "City",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 0,
+            "end_row_offset_idx": 1,
+            "start_col_offset_idx": 6,
+            "end_col_offset_idx": 7,
+            "text": "Country",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 0,
+            "end_row_offset_idx": 1,
+            "start_col_offset_idx": 7,
+            "end_col_offset_idx": 8,
+            "text": "Phone 1",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 0,
+            "end_row_offset_idx": 1,
+            "start_col_offset_idx": 8,
+            "end_col_offset_idx": 9,
+            "text": "Phone 2",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 0,
+            "end_row_offset_idx": 1,
+            "start_col_offset_idx": 9,
+            "end_col_offset_idx": 10,
+            "text": "Email",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 0,
+            "end_row_offset_idx": 1,
+            "start_col_offset_idx": 10,
+            "end_col_offset_idx": 11,
+            "text": "Subscription Date",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 0,
+            "end_row_offset_idx": 1,
+            "start_col_offset_idx": 11,
+            "end_col_offset_idx": 12,
+            "text": "Website",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 1,
+            "end_row_offset_idx": 2,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 1,
+            "text": "1",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 1,
+            "end_row_offset_idx": 2,
+            "start_col_offset_idx": 1,
+            "end_col_offset_idx": 2,
+            "text": "DD37Cf93aecA6Dc",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 1,
+            "end_row_offset_idx": 2,
+            "start_col_offset_idx": 2,
+            "end_col_offset_idx": 3,
+            "text": "Sheryl",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 1,
+            "end_row_offset_idx": 2,
+            "start_col_offset_idx": 3,
+            "end_col_offset_idx": 4,
+            "text": "Baxter",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 1,
+            "end_row_offset_idx": 2,
+            "start_col_offset_idx": 4,
+            "end_col_offset_idx": 5,
+            "text": "Rasmussen Group",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 1,
+            "end_row_offset_idx": 2,
+            "start_col_offset_idx": 5,
+            "end_col_offset_idx": 6,
+            "text": "East Leonard",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 1,
+            "end_row_offset_idx": 2,
+            "start_col_offset_idx": 6,
+            "end_col_offset_idx": 7,
+            "text": "Chile",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 1,
+            "end_row_offset_idx": 2,
+            "start_col_offset_idx": 7,
+            "end_col_offset_idx": 8,
+            "text": "229.077.5154",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 1,
+            "end_row_offset_idx": 2,
+            "start_col_offset_idx": 8,
+            "end_col_offset_idx": 9,
+            "text": "397.884.0519x718",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 1,
+            "end_row_offset_idx": 2,
+            "start_col_offset_idx": 9,
+            "end_col_offset_idx": 10,
+            "text": "zunigavanessa@smith.info",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 1,
+            "end_row_offset_idx": 2,
+            "start_col_offset_idx": 10,
+            "end_col_offset_idx": 11,
+            "text": "2020-08-24",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 1,
+            "end_row_offset_idx": 2,
+            "start_col_offset_idx": 11,
+            "end_col_offset_idx": 12,
+            "text": "http://www.stephenson.com/",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 2,
+            "end_row_offset_idx": 3,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 1,
+            "text": "2",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 2,
+            "end_row_offset_idx": 3,
+            "start_col_offset_idx": 1,
+            "end_col_offset_idx": 2,
+            "text": "1Ef7b82A4CAAD10",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 2,
+            "end_row_offset_idx": 3,
+            "start_col_offset_idx": 2,
+            "end_col_offset_idx": 3,
+            "text": "Preston",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 2,
+            "end_row_offset_idx": 3,
+            "start_col_offset_idx": 3,
+            "end_col_offset_idx": 4,
+            "text": "Lozano, Dr",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 2,
+            "end_row_offset_idx": 3,
+            "start_col_offset_idx": 4,
+            "end_col_offset_idx": 5,
+            "text": "Vega-Gentry",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 2,
+            "end_row_offset_idx": 3,
+            "start_col_offset_idx": 5,
+            "end_col_offset_idx": 6,
+            "text": "East Jimmychester",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 2,
+            "end_row_offset_idx": 3,
+            "start_col_offset_idx": 6,
+            "end_col_offset_idx": 7,
+            "text": "Djibouti",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 2,
+            "end_row_offset_idx": 3,
+            "start_col_offset_idx": 7,
+            "end_col_offset_idx": 8,
+            "text": "5153435776",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 2,
+            "end_row_offset_idx": 3,
+            "start_col_offset_idx": 8,
+            "end_col_offset_idx": 9,
+            "text": "686-620-1820x944",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 2,
+            "end_row_offset_idx": 3,
+            "start_col_offset_idx": 9,
+            "end_col_offset_idx": 10,
+            "text": "vmata@colon.com",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 2,
+            "end_row_offset_idx": 3,
+            "start_col_offset_idx": 10,
+            "end_col_offset_idx": 11,
+            "text": "2021-04-23",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 2,
+            "end_row_offset_idx": 3,
+            "start_col_offset_idx": 11,
+            "end_col_offset_idx": 12,
+            "text": "http://www.hobbs.com/",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 3,
+            "end_row_offset_idx": 4,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 1,
+            "text": "3",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 3,
+            "end_row_offset_idx": 4,
+            "start_col_offset_idx": 1,
+            "end_col_offset_idx": 2,
+            "text": "6F94879bDAfE5a6",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 3,
+            "end_row_offset_idx": 4,
+            "start_col_offset_idx": 2,
+            "end_col_offset_idx": 3,
+            "text": "Roy",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 3,
+            "end_row_offset_idx": 4,
+            "start_col_offset_idx": 3,
+            "end_col_offset_idx": 4,
+            "text": "Berry",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 3,
+            "end_row_offset_idx": 4,
+            "start_col_offset_idx": 4,
+            "end_col_offset_idx": 5,
+            "text": "Murillo-Perry",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 3,
+            "end_row_offset_idx": 4,
+            "start_col_offset_idx": 5,
+            "end_col_offset_idx": 6,
+            "text": "Isabelborough",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 3,
+            "end_row_offset_idx": 4,
+            "start_col_offset_idx": 6,
+            "end_col_offset_idx": 7,
+            "text": "Antigua and Barbuda",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 3,
+            "end_row_offset_idx": 4,
+            "start_col_offset_idx": 7,
+            "end_col_offset_idx": 8,
+            "text": "+1-539-402-0259",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 3,
+            "end_row_offset_idx": 4,
+            "start_col_offset_idx": 8,
+            "end_col_offset_idx": 9,
+            "text": "(496)978-3969x58947",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 3,
+            "end_row_offset_idx": 4,
+            "start_col_offset_idx": 9,
+            "end_col_offset_idx": 10,
+            "text": "beckycarr@hogan.com",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 3,
+            "end_row_offset_idx": 4,
+            "start_col_offset_idx": 10,
+            "end_col_offset_idx": 11,
+            "text": "2020-03-25",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 3,
+            "end_row_offset_idx": 4,
+            "start_col_offset_idx": 11,
+            "end_col_offset_idx": 12,
+            "text": "http://www.lawrence.com/",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 4,
+            "end_row_offset_idx": 5,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 1,
+            "text": "4",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 4,
+            "end_row_offset_idx": 5,
+            "start_col_offset_idx": 1,
+            "end_col_offset_idx": 2,
+            "text": "5Cef8BFA16c5e3c",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 4,
+            "end_row_offset_idx": 5,
+            "start_col_offset_idx": 2,
+            "end_col_offset_idx": 3,
+            "text": "Linda",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 4,
+            "end_row_offset_idx": 5,
+            "start_col_offset_idx": 3,
+            "end_col_offset_idx": 4,
+            "text": "Olsen",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 4,
+            "end_row_offset_idx": 5,
+            "start_col_offset_idx": 4,
+            "end_col_offset_idx": 5,
+            "text": "Dominguez, Mcmillan and Donovan",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 4,
+            "end_row_offset_idx": 5,
+            "start_col_offset_idx": 5,
+            "end_col_offset_idx": 6,
+            "text": "Bensonview",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 4,
+            "end_row_offset_idx": 5,
+            "start_col_offset_idx": 6,
+            "end_col_offset_idx": 7,
+            "text": "Dominican Republic",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 4,
+            "end_row_offset_idx": 5,
+            "start_col_offset_idx": 7,
+            "end_col_offset_idx": 8,
+            "text": "001-808-617-6467x12895",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 4,
+            "end_row_offset_idx": 5,
+            "start_col_offset_idx": 8,
+            "end_col_offset_idx": 9,
+            "text": "+1-813-324-8756",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 4,
+            "end_row_offset_idx": 5,
+            "start_col_offset_idx": 9,
+            "end_col_offset_idx": 10,
+            "text": "stanleyblackwell@benson.org",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 4,
+            "end_row_offset_idx": 5,
+            "start_col_offset_idx": 10,
+            "end_col_offset_idx": 11,
+            "text": "2020-06-02",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 4,
+            "end_row_offset_idx": 5,
+            "start_col_offset_idx": 11,
+            "end_col_offset_idx": 12,
+            "text": "http://www.good-lyons.com/",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 5,
+            "end_row_offset_idx": 6,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 1,
+            "text": "5",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 5,
+            "end_row_offset_idx": 6,
+            "start_col_offset_idx": 1,
+            "end_col_offset_idx": 2,
+            "text": "053d585Ab6b3159",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 5,
+            "end_row_offset_idx": 6,
+            "start_col_offset_idx": 2,
+            "end_col_offset_idx": 3,
+            "text": "Joanna",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 5,
+            "end_row_offset_idx": 6,
+            "start_col_offset_idx": 3,
+            "end_col_offset_idx": 4,
+            "text": "Bender",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 5,
+            "end_row_offset_idx": 6,
+            "start_col_offset_idx": 4,
+            "end_col_offset_idx": 5,
+            "text": "Martin, Lang and Andrade",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 5,
+            "end_row_offset_idx": 6,
+            "start_col_offset_idx": 5,
+            "end_col_offset_idx": 6,
+            "text": "West Priscilla",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 5,
+            "end_row_offset_idx": 6,
+            "start_col_offset_idx": 6,
+            "end_col_offset_idx": 7,
+            "text": "Slovakia (Slovak Republic)",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 5,
+            "end_row_offset_idx": 6,
+            "start_col_offset_idx": 7,
+            "end_col_offset_idx": 8,
+            "text": "001-234-203-0635x76146",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 5,
+            "end_row_offset_idx": 6,
+            "start_col_offset_idx": 8,
+            "end_col_offset_idx": 9,
+            "text": "001-199-446-3860x3486",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 5,
+            "end_row_offset_idx": 6,
+            "start_col_offset_idx": 9,
+            "end_col_offset_idx": 10,
+            "text": "colinalvarado@miles.net",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 5,
+            "end_row_offset_idx": 6,
+            "start_col_offset_idx": 10,
+            "end_col_offset_idx": 11,
+            "text": "2021-04-17",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 5,
+            "end_row_offset_idx": 6,
+            "start_col_offset_idx": 11,
+            "end_col_offset_idx": 12,
+            "text": "https://goodwin-ingram.com/",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          }
+        ],
+        "num_rows": 6,
+        "num_cols": 12,
+        "grid": [
+          [
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 0,
+              "end_row_offset_idx": 1,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "Index",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 0,
+              "end_row_offset_idx": 1,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 2,
+              "text": "Customer Id",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 0,
+              "end_row_offset_idx": 1,
+              "start_col_offset_idx": 2,
+              "end_col_offset_idx": 3,
+              "text": "First Name",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 0,
+              "end_row_offset_idx": 1,
+              "start_col_offset_idx": 3,
+              "end_col_offset_idx": 4,
+              "text": "Last Name",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 0,
+              "end_row_offset_idx": 1,
+              "start_col_offset_idx": 4,
+              "end_col_offset_idx": 5,
+              "text": "Company",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 0,
+              "end_row_offset_idx": 1,
+              "start_col_offset_idx": 5,
+              "end_col_offset_idx": 6,
+              "text": "City",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 0,
+              "end_row_offset_idx": 1,
+              "start_col_offset_idx": 6,
+              "end_col_offset_idx": 7,
+              "text": "Country",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 0,
+              "end_row_offset_idx": 1,
+              "start_col_offset_idx": 7,
+              "end_col_offset_idx": 8,
+              "text": "Phone 1",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 0,
+              "end_row_offset_idx": 1,
+              "start_col_offset_idx": 8,
+              "end_col_offset_idx": 9,
+              "text": "Phone 2",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 0,
+              "end_row_offset_idx": 1,
+              "start_col_offset_idx": 9,
+              "end_col_offset_idx": 10,
+              "text": "Email",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 0,
+              "end_row_offset_idx": 1,
+              "start_col_offset_idx": 10,
+              "end_col_offset_idx": 11,
+              "text": "Subscription Date",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 0,
+              "end_row_offset_idx": 1,
+              "start_col_offset_idx": 11,
+              "end_col_offset_idx": 12,
+              "text": "Website",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ],
+          [
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 1,
+              "end_row_offset_idx": 2,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "1",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 1,
+              "end_row_offset_idx": 2,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 2,
+              "text": "DD37Cf93aecA6Dc",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 1,
+              "end_row_offset_idx": 2,
+              "start_col_offset_idx": 2,
+              "end_col_offset_idx": 3,
+              "text": "Sheryl",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 1,
+              "end_row_offset_idx": 2,
+              "start_col_offset_idx": 3,
+              "end_col_offset_idx": 4,
+              "text": "Baxter",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 1,
+              "end_row_offset_idx": 2,
+              "start_col_offset_idx": 4,
+              "end_col_offset_idx": 5,
+              "text": "Rasmussen Group",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 1,
+              "end_row_offset_idx": 2,
+              "start_col_offset_idx": 5,
+              "end_col_offset_idx": 6,
+              "text": "East Leonard",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 1,
+              "end_row_offset_idx": 2,
+              "start_col_offset_idx": 6,
+              "end_col_offset_idx": 7,
+              "text": "Chile",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 1,
+              "end_row_offset_idx": 2,
+              "start_col_offset_idx": 7,
+              "end_col_offset_idx": 8,
+              "text": "229.077.5154",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 1,
+              "end_row_offset_idx": 2,
+              "start_col_offset_idx": 8,
+              "end_col_offset_idx": 9,
+              "text": "397.884.0519x718",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 1,
+              "end_row_offset_idx": 2,
+              "start_col_offset_idx": 9,
+              "end_col_offset_idx": 10,
+              "text": "zunigavanessa@smith.info",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 1,
+              "end_row_offset_idx": 2,
+              "start_col_offset_idx": 10,
+              "end_col_offset_idx": 11,
+              "text": "2020-08-24",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 1,
+              "end_row_offset_idx": 2,
+              "start_col_offset_idx": 11,
+              "end_col_offset_idx": 12,
+              "text": "http://www.stephenson.com/",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ],
+          [
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 2,
+              "end_row_offset_idx": 3,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "2",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 2,
+              "end_row_offset_idx": 3,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 2,
+              "text": "1Ef7b82A4CAAD10",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 2,
+              "end_row_offset_idx": 3,
+              "start_col_offset_idx": 2,
+              "end_col_offset_idx": 3,
+              "text": "Preston",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 2,
+              "end_row_offset_idx": 3,
+              "start_col_offset_idx": 3,
+              "end_col_offset_idx": 4,
+              "text": "Lozano, Dr",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 2,
+              "end_row_offset_idx": 3,
+              "start_col_offset_idx": 4,
+              "end_col_offset_idx": 5,
+              "text": "Vega-Gentry",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 2,
+              "end_row_offset_idx": 3,
+              "start_col_offset_idx": 5,
+              "end_col_offset_idx": 6,
+              "text": "East Jimmychester",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 2,
+              "end_row_offset_idx": 3,
+              "start_col_offset_idx": 6,
+              "end_col_offset_idx": 7,
+              "text": "Djibouti",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 2,
+              "end_row_offset_idx": 3,
+              "start_col_offset_idx": 7,
+              "end_col_offset_idx": 8,
+              "text": "5153435776",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 2,
+              "end_row_offset_idx": 3,
+              "start_col_offset_idx": 8,
+              "end_col_offset_idx": 9,
+              "text": "686-620-1820x944",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 2,
+              "end_row_offset_idx": 3,
+              "start_col_offset_idx": 9,
+              "end_col_offset_idx": 10,
+              "text": "vmata@colon.com",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 2,
+              "end_row_offset_idx": 3,
+              "start_col_offset_idx": 10,
+              "end_col_offset_idx": 11,
+              "text": "2021-04-23",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 2,
+              "end_row_offset_idx": 3,
+              "start_col_offset_idx": 11,
+              "end_col_offset_idx": 12,
+              "text": "http://www.hobbs.com/",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ],
+          [
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 3,
+              "end_row_offset_idx": 4,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "3",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 3,
+              "end_row_offset_idx": 4,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 2,
+              "text": "6F94879bDAfE5a6",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 3,
+              "end_row_offset_idx": 4,
+              "start_col_offset_idx": 2,
+              "end_col_offset_idx": 3,
+              "text": "Roy",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 3,
+              "end_row_offset_idx": 4,
+              "start_col_offset_idx": 3,
+              "end_col_offset_idx": 4,
+              "text": "Berry",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 3,
+              "end_row_offset_idx": 4,
+              "start_col_offset_idx": 4,
+              "end_col_offset_idx": 5,
+              "text": "Murillo-Perry",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 3,
+              "end_row_offset_idx": 4,
+              "start_col_offset_idx": 5,
+              "end_col_offset_idx": 6,
+              "text": "Isabelborough",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 3,
+              "end_row_offset_idx": 4,
+              "start_col_offset_idx": 6,
+              "end_col_offset_idx": 7,
+              "text": "Antigua and Barbuda",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 3,
+              "end_row_offset_idx": 4,
+              "start_col_offset_idx": 7,
+              "end_col_offset_idx": 8,
+              "text": "+1-539-402-0259",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 3,
+              "end_row_offset_idx": 4,
+              "start_col_offset_idx": 8,
+              "end_col_offset_idx": 9,
+              "text": "(496)978-3969x58947",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 3,
+              "end_row_offset_idx": 4,
+              "start_col_offset_idx": 9,
+              "end_col_offset_idx": 10,
+              "text": "beckycarr@hogan.com",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 3,
+              "end_row_offset_idx": 4,
+              "start_col_offset_idx": 10,
+              "end_col_offset_idx": 11,
+              "text": "2020-03-25",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 3,
+              "end_row_offset_idx": 4,
+              "start_col_offset_idx": 11,
+              "end_col_offset_idx": 12,
+              "text": "http://www.lawrence.com/",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ],
+          [
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 4,
+              "end_row_offset_idx": 5,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "4",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 4,
+              "end_row_offset_idx": 5,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 2,
+              "text": "5Cef8BFA16c5e3c",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 4,
+              "end_row_offset_idx": 5,
+              "start_col_offset_idx": 2,
+              "end_col_offset_idx": 3,
+              "text": "Linda",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 4,
+              "end_row_offset_idx": 5,
+              "start_col_offset_idx": 3,
+              "end_col_offset_idx": 4,
+              "text": "Olsen",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 4,
+              "end_row_offset_idx": 5,
+              "start_col_offset_idx": 4,
+              "end_col_offset_idx": 5,
+              "text": "Dominguez, Mcmillan and Donovan",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 4,
+              "end_row_offset_idx": 5,
+              "start_col_offset_idx": 5,
+              "end_col_offset_idx": 6,
+              "text": "Bensonview",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 4,
+              "end_row_offset_idx": 5,
+              "start_col_offset_idx": 6,
+              "end_col_offset_idx": 7,
+              "text": "Dominican Republic",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 4,
+              "end_row_offset_idx": 5,
+              "start_col_offset_idx": 7,
+              "end_col_offset_idx": 8,
+              "text": "001-808-617-6467x12895",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 4,
+              "end_row_offset_idx": 5,
+              "start_col_offset_idx": 8,
+              "end_col_offset_idx": 9,
+              "text": "+1-813-324-8756",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 4,
+              "end_row_offset_idx": 5,
+              "start_col_offset_idx": 9,
+              "end_col_offset_idx": 10,
+              "text": "stanleyblackwell@benson.org",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 4,
+              "end_row_offset_idx": 5,
+              "start_col_offset_idx": 10,
+              "end_col_offset_idx": 11,
+              "text": "2020-06-02",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 4,
+              "end_row_offset_idx": 5,
+              "start_col_offset_idx": 11,
+              "end_col_offset_idx": 12,
+              "text": "http://www.good-lyons.com/",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ],
+          [
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 5,
+              "end_row_offset_idx": 6,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "5",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 5,
+              "end_row_offset_idx": 6,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 2,
+              "text": "053d585Ab6b3159",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 5,
+              "end_row_offset_idx": 6,
+              "start_col_offset_idx": 2,
+              "end_col_offset_idx": 3,
+              "text": "Joanna",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 5,
+              "end_row_offset_idx": 6,
+              "start_col_offset_idx": 3,
+              "end_col_offset_idx": 4,
+              "text": "Bender",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 5,
+              "end_row_offset_idx": 6,
+              "start_col_offset_idx": 4,
+              "end_col_offset_idx": 5,
+              "text": "Martin, Lang and Andrade",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 5,
+              "end_row_offset_idx": 6,
+              "start_col_offset_idx": 5,
+              "end_col_offset_idx": 6,
+              "text": "West Priscilla",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 5,
+              "end_row_offset_idx": 6,
+              "start_col_offset_idx": 6,
+              "end_col_offset_idx": 7,
+              "text": "Slovakia (Slovak Republic)",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 5,
+              "end_row_offset_idx": 6,
+              "start_col_offset_idx": 7,
+              "end_col_offset_idx": 8,
+              "text": "001-234-203-0635x76146",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 5,
+              "end_row_offset_idx": 6,
+              "start_col_offset_idx": 8,
+              "end_col_offset_idx": 9,
+              "text": "001-199-446-3860x3486",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 5,
+              "end_row_offset_idx": 6,
+              "start_col_offset_idx": 9,
+              "end_col_offset_idx": 10,
+              "text": "colinalvarado@miles.net",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 5,
+              "end_row_offset_idx": 6,
+              "start_col_offset_idx": 10,
+              "end_col_offset_idx": 11,
+              "text": "2021-04-17",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 5,
+              "end_row_offset_idx": 6,
+              "start_col_offset_idx": 11,
+              "end_col_offset_idx": 12,
+              "text": "https://goodwin-ingram.com/",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ]
+        ]
+      }
+    }
+  ],
+  "key_value_items": [],
+  "form_items": [],
+  "pages": {}
+}
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v2/csv-comma.csv.md b/tests/data/groundtruth/docling_v2/csv-comma.csv.md
new file mode 100644
index 00000000..826384c4
--- /dev/null
+++ b/tests/data/groundtruth/docling_v2/csv-comma.csv.md
@@ -0,0 +1,7 @@
+|   Index | Customer Id     | First Name   | Last Name   | Company                         | City              | Country                    | Phone 1                | Phone 2               | Email                       | Subscription Date   | Website                     |
+|---------|-----------------|--------------|-------------|---------------------------------|-------------------|----------------------------|------------------------|-----------------------|-----------------------------|---------------------|-----------------------------|
+|       1 | DD37Cf93aecA6Dc | Sheryl       | Baxter      | Rasmussen Group                 | East Leonard      | Chile                      | 229.077.5154           | 397.884.0519x718      | zunigavanessa@smith.info    | 2020-08-24          | http://www.stephenson.com/  |
+|       2 | 1Ef7b82A4CAAD10 | Preston      | Lozano, Dr  | Vega-Gentry                     | East Jimmychester | Djibouti                   | 5153435776             | 686-620-1820x944      | vmata@colon.com             | 2021-04-23          | http://www.hobbs.com/       |
+|       3 | 6F94879bDAfE5a6 | Roy          | Berry       | Murillo-Perry                   | Isabelborough     | Antigua and Barbuda        | +1-539-402-0259        | (496)978-3969x58947   | beckycarr@hogan.com         | 2020-03-25          | http://www.lawrence.com/    |
+|       4 | 5Cef8BFA16c5e3c | Linda        | Olsen       | Dominguez, Mcmillan and Donovan | Bensonview        | Dominican Republic         | 001-808-617-6467x12895 | +1-813-324-8756       | stanleyblackwell@benson.org | 2020-06-02          | http://www.good-lyons.com/  |
+|       5 | 053d585Ab6b3159 | Joanna       | Bender      | Martin, Lang and Andrade        | West Priscilla    | Slovakia (Slovak Republic) | 001-234-203-0635x76146 | 001-199-446-3860x3486 | colinalvarado@miles.net     | 2021-04-17          | https://goodwin-ingram.com/ |
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v2/csv-inconsistent-header.csv.itxt b/tests/data/groundtruth/docling_v2/csv-inconsistent-header.csv.itxt
new file mode 100644
index 00000000..e4b7895f
--- /dev/null
+++ b/tests/data/groundtruth/docling_v2/csv-inconsistent-header.csv.itxt
@@ -0,0 +1,2 @@
+item-0 at level 0: unspecified: group _root_
+  item-1 at level 1: table with [5x4]
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v2/csv-inconsistent-header.csv.json b/tests/data/groundtruth/docling_v2/csv-inconsistent-header.csv.json
new file mode 100644
index 00000000..daa2844a
--- /dev/null
+++ b/tests/data/groundtruth/docling_v2/csv-inconsistent-header.csv.json
@@ -0,0 +1,535 @@
+{
+  "schema_name": "DoclingDocument",
+  "version": "1.1.0",
+  "name": "csv-inconsistent-header",
+  "origin": {
+    "mimetype": "text/csv",
+    "binary_hash": 5480400768780756370,
+    "filename": "csv-inconsistent-header.csv"
+  },
+  "furniture": {
+    "self_ref": "#/furniture",
+    "children": [],
+    "content_layer": "furniture",
+    "name": "_root_",
+    "label": "unspecified"
+  },
+  "body": {
+    "self_ref": "#/body",
+    "children": [
+      {
+        "$ref": "#/tables/0"
+      }
+    ],
+    "content_layer": "body",
+    "name": "_root_",
+    "label": "unspecified"
+  },
+  "groups": [],
+  "texts": [],
+  "pictures": [],
+  "tables": [
+    {
+      "self_ref": "#/tables/0",
+      "parent": {
+        "$ref": "#/body"
+      },
+      "children": [],
+      "content_layer": "body",
+      "label": "table",
+      "prov": [],
+      "captions": [],
+      "references": [],
+      "footnotes": [],
+      "data": {
+        "table_cells": [
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 0,
+            "end_row_offset_idx": 1,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 1,
+            "text": "1",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 0,
+            "end_row_offset_idx": 1,
+            "start_col_offset_idx": 1,
+            "end_col_offset_idx": 2,
+            "text": "2",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 0,
+            "end_row_offset_idx": 1,
+            "start_col_offset_idx": 2,
+            "end_col_offset_idx": 3,
+            "text": "3",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 1,
+            "end_row_offset_idx": 2,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 1,
+            "text": "a",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 1,
+            "end_row_offset_idx": 2,
+            "start_col_offset_idx": 1,
+            "end_col_offset_idx": 2,
+            "text": "b",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 1,
+            "end_row_offset_idx": 2,
+            "start_col_offset_idx": 2,
+            "end_col_offset_idx": 3,
+            "text": "c",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 1,
+            "end_row_offset_idx": 2,
+            "start_col_offset_idx": 3,
+            "end_col_offset_idx": 4,
+            "text": "d",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 2,
+            "end_row_offset_idx": 3,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 1,
+            "text": "a",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 2,
+            "end_row_offset_idx": 3,
+            "start_col_offset_idx": 1,
+            "end_col_offset_idx": 2,
+            "text": "b",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 2,
+            "end_row_offset_idx": 3,
+            "start_col_offset_idx": 2,
+            "end_col_offset_idx": 3,
+            "text": "c",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 2,
+            "end_row_offset_idx": 3,
+            "start_col_offset_idx": 3,
+            "end_col_offset_idx": 4,
+            "text": "d",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 3,
+            "end_row_offset_idx": 4,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 1,
+            "text": "a",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 3,
+            "end_row_offset_idx": 4,
+            "start_col_offset_idx": 1,
+            "end_col_offset_idx": 2,
+            "text": "b",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 3,
+            "end_row_offset_idx": 4,
+            "start_col_offset_idx": 2,
+            "end_col_offset_idx": 3,
+            "text": "c",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 3,
+            "end_row_offset_idx": 4,
+            "start_col_offset_idx": 3,
+            "end_col_offset_idx": 4,
+            "text": "d",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 4,
+            "end_row_offset_idx": 5,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 1,
+            "text": "a",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 4,
+            "end_row_offset_idx": 5,
+            "start_col_offset_idx": 1,
+            "end_col_offset_idx": 2,
+            "text": "b",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 4,
+            "end_row_offset_idx": 5,
+            "start_col_offset_idx": 2,
+            "end_col_offset_idx": 3,
+            "text": "c",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 4,
+            "end_row_offset_idx": 5,
+            "start_col_offset_idx": 3,
+            "end_col_offset_idx": 4,
+            "text": "d",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          }
+        ],
+        "num_rows": 5,
+        "num_cols": 4,
+        "grid": [
+          [
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 0,
+              "end_row_offset_idx": 1,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "1",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 0,
+              "end_row_offset_idx": 1,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 2,
+              "text": "2",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 0,
+              "end_row_offset_idx": 1,
+              "start_col_offset_idx": 2,
+              "end_col_offset_idx": 3,
+              "text": "3",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 0,
+              "end_row_offset_idx": 1,
+              "start_col_offset_idx": 3,
+              "end_col_offset_idx": 4,
+              "text": "",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ],
+          [
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 1,
+              "end_row_offset_idx": 2,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "a",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 1,
+              "end_row_offset_idx": 2,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 2,
+              "text": "b",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 1,
+              "end_row_offset_idx": 2,
+              "start_col_offset_idx": 2,
+              "end_col_offset_idx": 3,
+              "text": "c",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 1,
+              "end_row_offset_idx": 2,
+              "start_col_offset_idx": 3,
+              "end_col_offset_idx": 4,
+              "text": "d",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ],
+          [
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 2,
+              "end_row_offset_idx": 3,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "a",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 2,
+              "end_row_offset_idx": 3,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 2,
+              "text": "b",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 2,
+              "end_row_offset_idx": 3,
+              "start_col_offset_idx": 2,
+              "end_col_offset_idx": 3,
+              "text": "c",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 2,
+              "end_row_offset_idx": 3,
+              "start_col_offset_idx": 3,
+              "end_col_offset_idx": 4,
+              "text": "d",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ],
+          [
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 3,
+              "end_row_offset_idx": 4,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "a",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 3,
+              "end_row_offset_idx": 4,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 2,
+              "text": "b",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 3,
+              "end_row_offset_idx": 4,
+              "start_col_offset_idx": 2,
+              "end_col_offset_idx": 3,
+              "text": "c",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 3,
+              "end_row_offset_idx": 4,
+              "start_col_offset_idx": 3,
+              "end_col_offset_idx": 4,
+              "text": "d",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ],
+          [
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 4,
+              "end_row_offset_idx": 5,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "a",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 4,
+              "end_row_offset_idx": 5,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 2,
+              "text": "b",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 4,
+              "end_row_offset_idx": 5,
+              "start_col_offset_idx": 2,
+              "end_col_offset_idx": 3,
+              "text": "c",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 4,
+              "end_row_offset_idx": 5,
+              "start_col_offset_idx": 3,
+              "end_col_offset_idx": 4,
+              "text": "d",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ]
+        ]
+      }
+    }
+  ],
+  "key_value_items": [],
+  "form_items": [],
+  "pages": {}
+}
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v2/csv-inconsistent-header.csv.md b/tests/data/groundtruth/docling_v2/csv-inconsistent-header.csv.md
new file mode 100644
index 00000000..e666a4d6
--- /dev/null
+++ b/tests/data/groundtruth/docling_v2/csv-inconsistent-header.csv.md
@@ -0,0 +1,6 @@
+| 1   | 2   | 3   |    |
+|-----|-----|-----|----|
+| a   | b   | c   | d  |
+| a   | b   | c   | d  |
+| a   | b   | c   | d  |
+| a   | b   | c   | d  |
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v2/csv-pipe.csv.itxt b/tests/data/groundtruth/docling_v2/csv-pipe.csv.itxt
new file mode 100644
index 00000000..6debed5d
--- /dev/null
+++ b/tests/data/groundtruth/docling_v2/csv-pipe.csv.itxt
@@ -0,0 +1,2 @@
+item-0 at level 0: unspecified: group _root_
+  item-1 at level 1: table with [6x12]
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v2/csv-pipe.csv.json b/tests/data/groundtruth/docling_v2/csv-pipe.csv.json
new file mode 100644
index 00000000..753fa138
--- /dev/null
+++ b/tests/data/groundtruth/docling_v2/csv-pipe.csv.json
@@ -0,0 +1,1797 @@
+{
+  "schema_name": "DoclingDocument",
+  "version": "1.1.0",
+  "name": "csv-pipe",
+  "origin": {
+    "mimetype": "text/csv",
+    "binary_hash": 5776554378334527221,
+    "filename": "csv-pipe.csv"
+  },
+  "furniture": {
+    "self_ref": "#/furniture",
+    "children": [],
+    "content_layer": "furniture",
+    "name": "_root_",
+    "label": "unspecified"
+  },
+  "body": {
+    "self_ref": "#/body",
+    "children": [
+      {
+        "$ref": "#/tables/0"
+      }
+    ],
+    "content_layer": "body",
+    "name": "_root_",
+    "label": "unspecified"
+  },
+  "groups": [],
+  "texts": [],
+  "pictures": [],
+  "tables": [
+    {
+      "self_ref": "#/tables/0",
+      "parent": {
+        "$ref": "#/body"
+      },
+      "children": [],
+      "content_layer": "body",
+      "label": "table",
+      "prov": [],
+      "captions": [],
+      "references": [],
+      "footnotes": [],
+      "data": {
+        "table_cells": [
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 0,
+            "end_row_offset_idx": 1,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 1,
+            "text": "Index",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 0,
+            "end_row_offset_idx": 1,
+            "start_col_offset_idx": 1,
+            "end_col_offset_idx": 2,
+            "text": "Customer Id",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 0,
+            "end_row_offset_idx": 1,
+            "start_col_offset_idx": 2,
+            "end_col_offset_idx": 3,
+            "text": "First Name",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 0,
+            "end_row_offset_idx": 1,
+            "start_col_offset_idx": 3,
+            "end_col_offset_idx": 4,
+            "text": "Last Name",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 0,
+            "end_row_offset_idx": 1,
+            "start_col_offset_idx": 4,
+            "end_col_offset_idx": 5,
+            "text": "Company",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 0,
+            "end_row_offset_idx": 1,
+            "start_col_offset_idx": 5,
+            "end_col_offset_idx": 6,
+            "text": "City",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 0,
+            "end_row_offset_idx": 1,
+            "start_col_offset_idx": 6,
+            "end_col_offset_idx": 7,
+            "text": "Country",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 0,
+            "end_row_offset_idx": 1,
+            "start_col_offset_idx": 7,
+            "end_col_offset_idx": 8,
+            "text": "Phone 1",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 0,
+            "end_row_offset_idx": 1,
+            "start_col_offset_idx": 8,
+            "end_col_offset_idx": 9,
+            "text": "Phone 2",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 0,
+            "end_row_offset_idx": 1,
+            "start_col_offset_idx": 9,
+            "end_col_offset_idx": 10,
+            "text": "Email",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 0,
+            "end_row_offset_idx": 1,
+            "start_col_offset_idx": 10,
+            "end_col_offset_idx": 11,
+            "text": "Subscription Date",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 0,
+            "end_row_offset_idx": 1,
+            "start_col_offset_idx": 11,
+            "end_col_offset_idx": 12,
+            "text": "Website",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 1,
+            "end_row_offset_idx": 2,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 1,
+            "text": "1",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 1,
+            "end_row_offset_idx": 2,
+            "start_col_offset_idx": 1,
+            "end_col_offset_idx": 2,
+            "text": "DD37Cf93aecA6Dc",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 1,
+            "end_row_offset_idx": 2,
+            "start_col_offset_idx": 2,
+            "end_col_offset_idx": 3,
+            "text": "Sheryl",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 1,
+            "end_row_offset_idx": 2,
+            "start_col_offset_idx": 3,
+            "end_col_offset_idx": 4,
+            "text": "Baxter",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 1,
+            "end_row_offset_idx": 2,
+            "start_col_offset_idx": 4,
+            "end_col_offset_idx": 5,
+            "text": "Rasmussen Group",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 1,
+            "end_row_offset_idx": 2,
+            "start_col_offset_idx": 5,
+            "end_col_offset_idx": 6,
+            "text": "East Leonard",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 1,
+            "end_row_offset_idx": 2,
+            "start_col_offset_idx": 6,
+            "end_col_offset_idx": 7,
+            "text": "Chile",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 1,
+            "end_row_offset_idx": 2,
+            "start_col_offset_idx": 7,
+            "end_col_offset_idx": 8,
+            "text": "229.077.5154",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 1,
+            "end_row_offset_idx": 2,
+            "start_col_offset_idx": 8,
+            "end_col_offset_idx": 9,
+            "text": "397.884.0519x718",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 1,
+            "end_row_offset_idx": 2,
+            "start_col_offset_idx": 9,
+            "end_col_offset_idx": 10,
+            "text": "zunigavanessa@smith.info",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 1,
+            "end_row_offset_idx": 2,
+            "start_col_offset_idx": 10,
+            "end_col_offset_idx": 11,
+            "text": "2020-08-24",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 1,
+            "end_row_offset_idx": 2,
+            "start_col_offset_idx": 11,
+            "end_col_offset_idx": 12,
+            "text": "http://www.stephenson.com/",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 2,
+            "end_row_offset_idx": 3,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 1,
+            "text": "2",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 2,
+            "end_row_offset_idx": 3,
+            "start_col_offset_idx": 1,
+            "end_col_offset_idx": 2,
+            "text": "1Ef7b82A4CAAD10",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 2,
+            "end_row_offset_idx": 3,
+            "start_col_offset_idx": 2,
+            "end_col_offset_idx": 3,
+            "text": "Preston",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 2,
+            "end_row_offset_idx": 3,
+            "start_col_offset_idx": 3,
+            "end_col_offset_idx": 4,
+            "text": "Lozano",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 2,
+            "end_row_offset_idx": 3,
+            "start_col_offset_idx": 4,
+            "end_col_offset_idx": 5,
+            "text": "Vega-Gentry",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 2,
+            "end_row_offset_idx": 3,
+            "start_col_offset_idx": 5,
+            "end_col_offset_idx": 6,
+            "text": "East Jimmychester",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 2,
+            "end_row_offset_idx": 3,
+            "start_col_offset_idx": 6,
+            "end_col_offset_idx": 7,
+            "text": "Djibouti",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 2,
+            "end_row_offset_idx": 3,
+            "start_col_offset_idx": 7,
+            "end_col_offset_idx": 8,
+            "text": "5153435776",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 2,
+            "end_row_offset_idx": 3,
+            "start_col_offset_idx": 8,
+            "end_col_offset_idx": 9,
+            "text": "686-620-1820x944",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 2,
+            "end_row_offset_idx": 3,
+            "start_col_offset_idx": 9,
+            "end_col_offset_idx": 10,
+            "text": "vmata@colon.com",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 2,
+            "end_row_offset_idx": 3,
+            "start_col_offset_idx": 10,
+            "end_col_offset_idx": 11,
+            "text": "2021-04-23",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 2,
+            "end_row_offset_idx": 3,
+            "start_col_offset_idx": 11,
+            "end_col_offset_idx": 12,
+            "text": "http://www.hobbs.com/",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 3,
+            "end_row_offset_idx": 4,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 1,
+            "text": "3",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 3,
+            "end_row_offset_idx": 4,
+            "start_col_offset_idx": 1,
+            "end_col_offset_idx": 2,
+            "text": "6F94879bDAfE5a6",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 3,
+            "end_row_offset_idx": 4,
+            "start_col_offset_idx": 2,
+            "end_col_offset_idx": 3,
+            "text": "Roy",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 3,
+            "end_row_offset_idx": 4,
+            "start_col_offset_idx": 3,
+            "end_col_offset_idx": 4,
+            "text": "Berry",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 3,
+            "end_row_offset_idx": 4,
+            "start_col_offset_idx": 4,
+            "end_col_offset_idx": 5,
+            "text": "Murillo-Perry",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 3,
+            "end_row_offset_idx": 4,
+            "start_col_offset_idx": 5,
+            "end_col_offset_idx": 6,
+            "text": "Isabelborough",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 3,
+            "end_row_offset_idx": 4,
+            "start_col_offset_idx": 6,
+            "end_col_offset_idx": 7,
+            "text": "Antigua and Barbuda",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 3,
+            "end_row_offset_idx": 4,
+            "start_col_offset_idx": 7,
+            "end_col_offset_idx": 8,
+            "text": "+1-539-402-0259",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 3,
+            "end_row_offset_idx": 4,
+            "start_col_offset_idx": 8,
+            "end_col_offset_idx": 9,
+            "text": "(496)978-3969x58947",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 3,
+            "end_row_offset_idx": 4,
+            "start_col_offset_idx": 9,
+            "end_col_offset_idx": 10,
+            "text": "beckycarr@hogan.com",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 3,
+            "end_row_offset_idx": 4,
+            "start_col_offset_idx": 10,
+            "end_col_offset_idx": 11,
+            "text": "2020-03-25",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 3,
+            "end_row_offset_idx": 4,
+            "start_col_offset_idx": 11,
+            "end_col_offset_idx": 12,
+            "text": "http://www.lawrence.com/",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 4,
+            "end_row_offset_idx": 5,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 1,
+            "text": "4",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 4,
+            "end_row_offset_idx": 5,
+            "start_col_offset_idx": 1,
+            "end_col_offset_idx": 2,
+            "text": "5Cef8BFA16c5e3c",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 4,
+            "end_row_offset_idx": 5,
+            "start_col_offset_idx": 2,
+            "end_col_offset_idx": 3,
+            "text": "Linda",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 4,
+            "end_row_offset_idx": 5,
+            "start_col_offset_idx": 3,
+            "end_col_offset_idx": 4,
+            "text": "Olsen",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 4,
+            "end_row_offset_idx": 5,
+            "start_col_offset_idx": 4,
+            "end_col_offset_idx": 5,
+            "text": "Dominguez|Mcmillan and Donovan",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 4,
+            "end_row_offset_idx": 5,
+            "start_col_offset_idx": 5,
+            "end_col_offset_idx": 6,
+            "text": "Bensonview",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 4,
+            "end_row_offset_idx": 5,
+            "start_col_offset_idx": 6,
+            "end_col_offset_idx": 7,
+            "text": "Dominican Republic",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 4,
+            "end_row_offset_idx": 5,
+            "start_col_offset_idx": 7,
+            "end_col_offset_idx": 8,
+            "text": "001-808-617-6467x12895",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 4,
+            "end_row_offset_idx": 5,
+            "start_col_offset_idx": 8,
+            "end_col_offset_idx": 9,
+            "text": "+1-813-324-8756",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 4,
+            "end_row_offset_idx": 5,
+            "start_col_offset_idx": 9,
+            "end_col_offset_idx": 10,
+            "text": "stanleyblackwell@benson.org",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 4,
+            "end_row_offset_idx": 5,
+            "start_col_offset_idx": 10,
+            "end_col_offset_idx": 11,
+            "text": "2020-06-02",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 4,
+            "end_row_offset_idx": 5,
+            "start_col_offset_idx": 11,
+            "end_col_offset_idx": 12,
+            "text": "http://www.good-lyons.com/",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 5,
+            "end_row_offset_idx": 6,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 1,
+            "text": "5",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 5,
+            "end_row_offset_idx": 6,
+            "start_col_offset_idx": 1,
+            "end_col_offset_idx": 2,
+            "text": "053d585Ab6b3159",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 5,
+            "end_row_offset_idx": 6,
+            "start_col_offset_idx": 2,
+            "end_col_offset_idx": 3,
+            "text": "Joanna",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 5,
+            "end_row_offset_idx": 6,
+            "start_col_offset_idx": 3,
+            "end_col_offset_idx": 4,
+            "text": "Bender",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 5,
+            "end_row_offset_idx": 6,
+            "start_col_offset_idx": 4,
+            "end_col_offset_idx": 5,
+            "text": "Martin|Lang and Andrade",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 5,
+            "end_row_offset_idx": 6,
+            "start_col_offset_idx": 5,
+            "end_col_offset_idx": 6,
+            "text": "West Priscilla",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 5,
+            "end_row_offset_idx": 6,
+            "start_col_offset_idx": 6,
+            "end_col_offset_idx": 7,
+            "text": "Slovakia (Slovak Republic)",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 5,
+            "end_row_offset_idx": 6,
+            "start_col_offset_idx": 7,
+            "end_col_offset_idx": 8,
+            "text": "001-234-203-0635x76146",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 5,
+            "end_row_offset_idx": 6,
+            "start_col_offset_idx": 8,
+            "end_col_offset_idx": 9,
+            "text": "001-199-446-3860x3486",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 5,
+            "end_row_offset_idx": 6,
+            "start_col_offset_idx": 9,
+            "end_col_offset_idx": 10,
+            "text": "colinalvarado@miles.net",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 5,
+            "end_row_offset_idx": 6,
+            "start_col_offset_idx": 10,
+            "end_col_offset_idx": 11,
+            "text": "2021-04-17",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 5,
+            "end_row_offset_idx": 6,
+            "start_col_offset_idx": 11,
+            "end_col_offset_idx": 12,
+            "text": "https://goodwin-ingram.com/",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          }
+        ],
+        "num_rows": 6,
+        "num_cols": 12,
+        "grid": [
+          [
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 0,
+              "end_row_offset_idx": 1,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "Index",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 0,
+              "end_row_offset_idx": 1,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 2,
+              "text": "Customer Id",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 0,
+              "end_row_offset_idx": 1,
+              "start_col_offset_idx": 2,
+              "end_col_offset_idx": 3,
+              "text": "First Name",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 0,
+              "end_row_offset_idx": 1,
+              "start_col_offset_idx": 3,
+              "end_col_offset_idx": 4,
+              "text": "Last Name",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 0,
+              "end_row_offset_idx": 1,
+              "start_col_offset_idx": 4,
+              "end_col_offset_idx": 5,
+              "text": "Company",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 0,
+              "end_row_offset_idx": 1,
+              "start_col_offset_idx": 5,
+              "end_col_offset_idx": 6,
+              "text": "City",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 0,
+              "end_row_offset_idx": 1,
+              "start_col_offset_idx": 6,
+              "end_col_offset_idx": 7,
+              "text": "Country",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 0,
+              "end_row_offset_idx": 1,
+              "start_col_offset_idx": 7,
+              "end_col_offset_idx": 8,
+              "text": "Phone 1",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 0,
+              "end_row_offset_idx": 1,
+              "start_col_offset_idx": 8,
+              "end_col_offset_idx": 9,
+              "text": "Phone 2",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 0,
+              "end_row_offset_idx": 1,
+              "start_col_offset_idx": 9,
+              "end_col_offset_idx": 10,
+              "text": "Email",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 0,
+              "end_row_offset_idx": 1,
+              "start_col_offset_idx": 10,
+              "end_col_offset_idx": 11,
+              "text": "Subscription Date",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 0,
+              "end_row_offset_idx": 1,
+              "start_col_offset_idx": 11,
+              "end_col_offset_idx": 12,
+              "text": "Website",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ],
+          [
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 1,
+              "end_row_offset_idx": 2,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "1",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 1,
+              "end_row_offset_idx": 2,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 2,
+              "text": "DD37Cf93aecA6Dc",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 1,
+              "end_row_offset_idx": 2,
+              "start_col_offset_idx": 2,
+              "end_col_offset_idx": 3,
+              "text": "Sheryl",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 1,
+              "end_row_offset_idx": 2,
+              "start_col_offset_idx": 3,
+              "end_col_offset_idx": 4,
+              "text": "Baxter",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 1,
+              "end_row_offset_idx": 2,
+              "start_col_offset_idx": 4,
+              "end_col_offset_idx": 5,
+              "text": "Rasmussen Group",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 1,
+              "end_row_offset_idx": 2,
+              "start_col_offset_idx": 5,
+              "end_col_offset_idx": 6,
+              "text": "East Leonard",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 1,
+              "end_row_offset_idx": 2,
+              "start_col_offset_idx": 6,
+              "end_col_offset_idx": 7,
+              "text": "Chile",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 1,
+              "end_row_offset_idx": 2,
+              "start_col_offset_idx": 7,
+              "end_col_offset_idx": 8,
+              "text": "229.077.5154",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 1,
+              "end_row_offset_idx": 2,
+              "start_col_offset_idx": 8,
+              "end_col_offset_idx": 9,
+              "text": "397.884.0519x718",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 1,
+              "end_row_offset_idx": 2,
+              "start_col_offset_idx": 9,
+              "end_col_offset_idx": 10,
+              "text": "zunigavanessa@smith.info",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 1,
+              "end_row_offset_idx": 2,
+              "start_col_offset_idx": 10,
+              "end_col_offset_idx": 11,
+              "text": "2020-08-24",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 1,
+              "end_row_offset_idx": 2,
+              "start_col_offset_idx": 11,
+              "end_col_offset_idx": 12,
+              "text": "http://www.stephenson.com/",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ],
+          [
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 2,
+              "end_row_offset_idx": 3,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "2",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 2,
+              "end_row_offset_idx": 3,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 2,
+              "text": "1Ef7b82A4CAAD10",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 2,
+              "end_row_offset_idx": 3,
+              "start_col_offset_idx": 2,
+              "end_col_offset_idx": 3,
+              "text": "Preston",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 2,
+              "end_row_offset_idx": 3,
+              "start_col_offset_idx": 3,
+              "end_col_offset_idx": 4,
+              "text": "Lozano",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 2,
+              "end_row_offset_idx": 3,
+              "start_col_offset_idx": 4,
+              "end_col_offset_idx": 5,
+              "text": "Vega-Gentry",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 2,
+              "end_row_offset_idx": 3,
+              "start_col_offset_idx": 5,
+              "end_col_offset_idx": 6,
+              "text": "East Jimmychester",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 2,
+              "end_row_offset_idx": 3,
+              "start_col_offset_idx": 6,
+              "end_col_offset_idx": 7,
+              "text": "Djibouti",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 2,
+              "end_row_offset_idx": 3,
+              "start_col_offset_idx": 7,
+              "end_col_offset_idx": 8,
+              "text": "5153435776",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 2,
+              "end_row_offset_idx": 3,
+              "start_col_offset_idx": 8,
+              "end_col_offset_idx": 9,
+              "text": "686-620-1820x944",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 2,
+              "end_row_offset_idx": 3,
+              "start_col_offset_idx": 9,
+              "end_col_offset_idx": 10,
+              "text": "vmata@colon.com",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 2,
+              "end_row_offset_idx": 3,
+              "start_col_offset_idx": 10,
+              "end_col_offset_idx": 11,
+              "text": "2021-04-23",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 2,
+              "end_row_offset_idx": 3,
+              "start_col_offset_idx": 11,
+              "end_col_offset_idx": 12,
+              "text": "http://www.hobbs.com/",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ],
+          [
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 3,
+              "end_row_offset_idx": 4,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "3",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 3,
+              "end_row_offset_idx": 4,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 2,
+              "text": "6F94879bDAfE5a6",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 3,
+              "end_row_offset_idx": 4,
+              "start_col_offset_idx": 2,
+              "end_col_offset_idx": 3,
+              "text": "Roy",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 3,
+              "end_row_offset_idx": 4,
+              "start_col_offset_idx": 3,
+              "end_col_offset_idx": 4,
+              "text": "Berry",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 3,
+              "end_row_offset_idx": 4,
+              "start_col_offset_idx": 4,
+              "end_col_offset_idx": 5,
+              "text": "Murillo-Perry",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 3,
+              "end_row_offset_idx": 4,
+              "start_col_offset_idx": 5,
+              "end_col_offset_idx": 6,
+              "text": "Isabelborough",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 3,
+              "end_row_offset_idx": 4,
+              "start_col_offset_idx": 6,
+              "end_col_offset_idx": 7,
+              "text": "Antigua and Barbuda",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 3,
+              "end_row_offset_idx": 4,
+              "start_col_offset_idx": 7,
+              "end_col_offset_idx": 8,
+              "text": "+1-539-402-0259",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 3,
+              "end_row_offset_idx": 4,
+              "start_col_offset_idx": 8,
+              "end_col_offset_idx": 9,
+              "text": "(496)978-3969x58947",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 3,
+              "end_row_offset_idx": 4,
+              "start_col_offset_idx": 9,
+              "end_col_offset_idx": 10,
+              "text": "beckycarr@hogan.com",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 3,
+              "end_row_offset_idx": 4,
+              "start_col_offset_idx": 10,
+              "end_col_offset_idx": 11,
+              "text": "2020-03-25",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 3,
+              "end_row_offset_idx": 4,
+              "start_col_offset_idx": 11,
+              "end_col_offset_idx": 12,
+              "text": "http://www.lawrence.com/",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ],
+          [
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 4,
+              "end_row_offset_idx": 5,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "4",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 4,
+              "end_row_offset_idx": 5,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 2,
+              "text": "5Cef8BFA16c5e3c",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 4,
+              "end_row_offset_idx": 5,
+              "start_col_offset_idx": 2,
+              "end_col_offset_idx": 3,
+              "text": "Linda",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 4,
+              "end_row_offset_idx": 5,
+              "start_col_offset_idx": 3,
+              "end_col_offset_idx": 4,
+              "text": "Olsen",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 4,
+              "end_row_offset_idx": 5,
+              "start_col_offset_idx": 4,
+              "end_col_offset_idx": 5,
+              "text": "Dominguez|Mcmillan and Donovan",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 4,
+              "end_row_offset_idx": 5,
+              "start_col_offset_idx": 5,
+              "end_col_offset_idx": 6,
+              "text": "Bensonview",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 4,
+              "end_row_offset_idx": 5,
+              "start_col_offset_idx": 6,
+              "end_col_offset_idx": 7,
+              "text": "Dominican Republic",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 4,
+              "end_row_offset_idx": 5,
+              "start_col_offset_idx": 7,
+              "end_col_offset_idx": 8,
+              "text": "001-808-617-6467x12895",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 4,
+              "end_row_offset_idx": 5,
+              "start_col_offset_idx": 8,
+              "end_col_offset_idx": 9,
+              "text": "+1-813-324-8756",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 4,
+              "end_row_offset_idx": 5,
+              "start_col_offset_idx": 9,
+              "end_col_offset_idx": 10,
+              "text": "stanleyblackwell@benson.org",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 4,
+              "end_row_offset_idx": 5,
+              "start_col_offset_idx": 10,
+              "end_col_offset_idx": 11,
+              "text": "2020-06-02",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 4,
+              "end_row_offset_idx": 5,
+              "start_col_offset_idx": 11,
+              "end_col_offset_idx": 12,
+              "text": "http://www.good-lyons.com/",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ],
+          [
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 5,
+              "end_row_offset_idx": 6,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "5",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 5,
+              "end_row_offset_idx": 6,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 2,
+              "text": "053d585Ab6b3159",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 5,
+              "end_row_offset_idx": 6,
+              "start_col_offset_idx": 2,
+              "end_col_offset_idx": 3,
+              "text": "Joanna",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 5,
+              "end_row_offset_idx": 6,
+              "start_col_offset_idx": 3,
+              "end_col_offset_idx": 4,
+              "text": "Bender",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 5,
+              "end_row_offset_idx": 6,
+              "start_col_offset_idx": 4,
+              "end_col_offset_idx": 5,
+              "text": "Martin|Lang and Andrade",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 5,
+              "end_row_offset_idx": 6,
+              "start_col_offset_idx": 5,
+              "end_col_offset_idx": 6,
+              "text": "West Priscilla",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 5,
+              "end_row_offset_idx": 6,
+              "start_col_offset_idx": 6,
+              "end_col_offset_idx": 7,
+              "text": "Slovakia (Slovak Republic)",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 5,
+              "end_row_offset_idx": 6,
+              "start_col_offset_idx": 7,
+              "end_col_offset_idx": 8,
+              "text": "001-234-203-0635x76146",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 5,
+              "end_row_offset_idx": 6,
+              "start_col_offset_idx": 8,
+              "end_col_offset_idx": 9,
+              "text": "001-199-446-3860x3486",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 5,
+              "end_row_offset_idx": 6,
+              "start_col_offset_idx": 9,
+              "end_col_offset_idx": 10,
+              "text": "colinalvarado@miles.net",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 5,
+              "end_row_offset_idx": 6,
+              "start_col_offset_idx": 10,
+              "end_col_offset_idx": 11,
+              "text": "2021-04-17",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 5,
+              "end_row_offset_idx": 6,
+              "start_col_offset_idx": 11,
+              "end_col_offset_idx": 12,
+              "text": "https://goodwin-ingram.com/",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ]
+        ]
+      }
+    }
+  ],
+  "key_value_items": [],
+  "form_items": [],
+  "pages": {}
+}
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v2/csv-pipe.csv.md b/tests/data/groundtruth/docling_v2/csv-pipe.csv.md
new file mode 100644
index 00000000..144e35e1
--- /dev/null
+++ b/tests/data/groundtruth/docling_v2/csv-pipe.csv.md
@@ -0,0 +1,7 @@
+|   Index | Customer Id     | First Name   | Last Name   | Company                        | City              | Country                    | Phone 1                | Phone 2               | Email                       | Subscription Date   | Website                     |
+|---------|-----------------|--------------|-------------|--------------------------------|-------------------|----------------------------|------------------------|-----------------------|-----------------------------|---------------------|-----------------------------|
+|       1 | DD37Cf93aecA6Dc | Sheryl       | Baxter      | Rasmussen Group                | East Leonard      | Chile                      | 229.077.5154           | 397.884.0519x718      | zunigavanessa@smith.info    | 2020-08-24          | http://www.stephenson.com/  |
+|       2 | 1Ef7b82A4CAAD10 | Preston      | Lozano      | Vega-Gentry                    | East Jimmychester | Djibouti                   | 5153435776             | 686-620-1820x944      | vmata@colon.com             | 2021-04-23          | http://www.hobbs.com/       |
+|       3 | 6F94879bDAfE5a6 | Roy          | Berry       | Murillo-Perry                  | Isabelborough     | Antigua and Barbuda        | +1-539-402-0259        | (496)978-3969x58947   | beckycarr@hogan.com         | 2020-03-25          | http://www.lawrence.com/    |
+|       4 | 5Cef8BFA16c5e3c | Linda        | Olsen       | Dominguez|Mcmillan and Donovan | Bensonview        | Dominican Republic         | 001-808-617-6467x12895 | +1-813-324-8756       | stanleyblackwell@benson.org | 2020-06-02          | http://www.good-lyons.com/  |
+|       5 | 053d585Ab6b3159 | Joanna       | Bender      | Martin|Lang and Andrade        | West Priscilla    | Slovakia (Slovak Republic) | 001-234-203-0635x76146 | 001-199-446-3860x3486 | colinalvarado@miles.net     | 2021-04-17          | https://goodwin-ingram.com/ |
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v2/csv-semicolon.csv.itxt b/tests/data/groundtruth/docling_v2/csv-semicolon.csv.itxt
new file mode 100644
index 00000000..6debed5d
--- /dev/null
+++ b/tests/data/groundtruth/docling_v2/csv-semicolon.csv.itxt
@@ -0,0 +1,2 @@
+item-0 at level 0: unspecified: group _root_
+  item-1 at level 1: table with [6x12]
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v2/csv-semicolon.csv.json b/tests/data/groundtruth/docling_v2/csv-semicolon.csv.json
new file mode 100644
index 00000000..a429ceeb
--- /dev/null
+++ b/tests/data/groundtruth/docling_v2/csv-semicolon.csv.json
@@ -0,0 +1,1797 @@
+{
+  "schema_name": "DoclingDocument",
+  "version": "1.1.0",
+  "name": "csv-semicolon",
+  "origin": {
+    "mimetype": "text/csv",
+    "binary_hash": 16766370328456054409,
+    "filename": "csv-semicolon.csv"
+  },
+  "furniture": {
+    "self_ref": "#/furniture",
+    "children": [],
+    "content_layer": "furniture",
+    "name": "_root_",
+    "label": "unspecified"
+  },
+  "body": {
+    "self_ref": "#/body",
+    "children": [
+      {
+        "$ref": "#/tables/0"
+      }
+    ],
+    "content_layer": "body",
+    "name": "_root_",
+    "label": "unspecified"
+  },
+  "groups": [],
+  "texts": [],
+  "pictures": [],
+  "tables": [
+    {
+      "self_ref": "#/tables/0",
+      "parent": {
+        "$ref": "#/body"
+      },
+      "children": [],
+      "content_layer": "body",
+      "label": "table",
+      "prov": [],
+      "captions": [],
+      "references": [],
+      "footnotes": [],
+      "data": {
+        "table_cells": [
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 0,
+            "end_row_offset_idx": 1,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 1,
+            "text": "Index",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 0,
+            "end_row_offset_idx": 1,
+            "start_col_offset_idx": 1,
+            "end_col_offset_idx": 2,
+            "text": "Customer Id",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 0,
+            "end_row_offset_idx": 1,
+            "start_col_offset_idx": 2,
+            "end_col_offset_idx": 3,
+            "text": "First Name",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 0,
+            "end_row_offset_idx": 1,
+            "start_col_offset_idx": 3,
+            "end_col_offset_idx": 4,
+            "text": "Last Name",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 0,
+            "end_row_offset_idx": 1,
+            "start_col_offset_idx": 4,
+            "end_col_offset_idx": 5,
+            "text": "Company",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 0,
+            "end_row_offset_idx": 1,
+            "start_col_offset_idx": 5,
+            "end_col_offset_idx": 6,
+            "text": "City",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 0,
+            "end_row_offset_idx": 1,
+            "start_col_offset_idx": 6,
+            "end_col_offset_idx": 7,
+            "text": "Country",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 0,
+            "end_row_offset_idx": 1,
+            "start_col_offset_idx": 7,
+            "end_col_offset_idx": 8,
+            "text": "Phone 1",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 0,
+            "end_row_offset_idx": 1,
+            "start_col_offset_idx": 8,
+            "end_col_offset_idx": 9,
+            "text": "Phone 2",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 0,
+            "end_row_offset_idx": 1,
+            "start_col_offset_idx": 9,
+            "end_col_offset_idx": 10,
+            "text": "Email",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 0,
+            "end_row_offset_idx": 1,
+            "start_col_offset_idx": 10,
+            "end_col_offset_idx": 11,
+            "text": "Subscription Date",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 0,
+            "end_row_offset_idx": 1,
+            "start_col_offset_idx": 11,
+            "end_col_offset_idx": 12,
+            "text": "Website",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 1,
+            "end_row_offset_idx": 2,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 1,
+            "text": "1",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 1,
+            "end_row_offset_idx": 2,
+            "start_col_offset_idx": 1,
+            "end_col_offset_idx": 2,
+            "text": "DD37Cf93aecA6Dc",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 1,
+            "end_row_offset_idx": 2,
+            "start_col_offset_idx": 2,
+            "end_col_offset_idx": 3,
+            "text": "Sheryl",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 1,
+            "end_row_offset_idx": 2,
+            "start_col_offset_idx": 3,
+            "end_col_offset_idx": 4,
+            "text": "Baxter",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 1,
+            "end_row_offset_idx": 2,
+            "start_col_offset_idx": 4,
+            "end_col_offset_idx": 5,
+            "text": "Rasmussen Group",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 1,
+            "end_row_offset_idx": 2,
+            "start_col_offset_idx": 5,
+            "end_col_offset_idx": 6,
+            "text": "East Leonard",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 1,
+            "end_row_offset_idx": 2,
+            "start_col_offset_idx": 6,
+            "end_col_offset_idx": 7,
+            "text": "Chile",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 1,
+            "end_row_offset_idx": 2,
+            "start_col_offset_idx": 7,
+            "end_col_offset_idx": 8,
+            "text": "229.077.5154",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 1,
+            "end_row_offset_idx": 2,
+            "start_col_offset_idx": 8,
+            "end_col_offset_idx": 9,
+            "text": "397.884.0519x718",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 1,
+            "end_row_offset_idx": 2,
+            "start_col_offset_idx": 9,
+            "end_col_offset_idx": 10,
+            "text": "zunigavanessa@smith.info",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 1,
+            "end_row_offset_idx": 2,
+            "start_col_offset_idx": 10,
+            "end_col_offset_idx": 11,
+            "text": "2020-08-24",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 1,
+            "end_row_offset_idx": 2,
+            "start_col_offset_idx": 11,
+            "end_col_offset_idx": 12,
+            "text": "http://www.stephenson.com/",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 2,
+            "end_row_offset_idx": 3,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 1,
+            "text": "2",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 2,
+            "end_row_offset_idx": 3,
+            "start_col_offset_idx": 1,
+            "end_col_offset_idx": 2,
+            "text": "1Ef7b82A4CAAD10",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 2,
+            "end_row_offset_idx": 3,
+            "start_col_offset_idx": 2,
+            "end_col_offset_idx": 3,
+            "text": "Preston",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 2,
+            "end_row_offset_idx": 3,
+            "start_col_offset_idx": 3,
+            "end_col_offset_idx": 4,
+            "text": "Lozano",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 2,
+            "end_row_offset_idx": 3,
+            "start_col_offset_idx": 4,
+            "end_col_offset_idx": 5,
+            "text": "Vega-Gentry",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 2,
+            "end_row_offset_idx": 3,
+            "start_col_offset_idx": 5,
+            "end_col_offset_idx": 6,
+            "text": "East Jimmychester",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 2,
+            "end_row_offset_idx": 3,
+            "start_col_offset_idx": 6,
+            "end_col_offset_idx": 7,
+            "text": "Djibouti",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 2,
+            "end_row_offset_idx": 3,
+            "start_col_offset_idx": 7,
+            "end_col_offset_idx": 8,
+            "text": "5153435776",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 2,
+            "end_row_offset_idx": 3,
+            "start_col_offset_idx": 8,
+            "end_col_offset_idx": 9,
+            "text": "686-620-1820x944",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 2,
+            "end_row_offset_idx": 3,
+            "start_col_offset_idx": 9,
+            "end_col_offset_idx": 10,
+            "text": "vmata@colon.com",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 2,
+            "end_row_offset_idx": 3,
+            "start_col_offset_idx": 10,
+            "end_col_offset_idx": 11,
+            "text": "2021-04-23",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 2,
+            "end_row_offset_idx": 3,
+            "start_col_offset_idx": 11,
+            "end_col_offset_idx": 12,
+            "text": "http://www.hobbs.com/",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 3,
+            "end_row_offset_idx": 4,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 1,
+            "text": "3",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 3,
+            "end_row_offset_idx": 4,
+            "start_col_offset_idx": 1,
+            "end_col_offset_idx": 2,
+            "text": "6F94879bDAfE5a6",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 3,
+            "end_row_offset_idx": 4,
+            "start_col_offset_idx": 2,
+            "end_col_offset_idx": 3,
+            "text": "Roy",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 3,
+            "end_row_offset_idx": 4,
+            "start_col_offset_idx": 3,
+            "end_col_offset_idx": 4,
+            "text": "Berry",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 3,
+            "end_row_offset_idx": 4,
+            "start_col_offset_idx": 4,
+            "end_col_offset_idx": 5,
+            "text": "Murillo-Perry",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 3,
+            "end_row_offset_idx": 4,
+            "start_col_offset_idx": 5,
+            "end_col_offset_idx": 6,
+            "text": "Isabelborough",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 3,
+            "end_row_offset_idx": 4,
+            "start_col_offset_idx": 6,
+            "end_col_offset_idx": 7,
+            "text": "Antigua and Barbuda",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 3,
+            "end_row_offset_idx": 4,
+            "start_col_offset_idx": 7,
+            "end_col_offset_idx": 8,
+            "text": "+1-539-402-0259",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 3,
+            "end_row_offset_idx": 4,
+            "start_col_offset_idx": 8,
+            "end_col_offset_idx": 9,
+            "text": "(496)978-3969x58947",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 3,
+            "end_row_offset_idx": 4,
+            "start_col_offset_idx": 9,
+            "end_col_offset_idx": 10,
+            "text": "beckycarr@hogan.com",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 3,
+            "end_row_offset_idx": 4,
+            "start_col_offset_idx": 10,
+            "end_col_offset_idx": 11,
+            "text": "2020-03-25",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 3,
+            "end_row_offset_idx": 4,
+            "start_col_offset_idx": 11,
+            "end_col_offset_idx": 12,
+            "text": "http://www.lawrence.com/",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 4,
+            "end_row_offset_idx": 5,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 1,
+            "text": "4",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 4,
+            "end_row_offset_idx": 5,
+            "start_col_offset_idx": 1,
+            "end_col_offset_idx": 2,
+            "text": "5Cef8BFA16c5e3c",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 4,
+            "end_row_offset_idx": 5,
+            "start_col_offset_idx": 2,
+            "end_col_offset_idx": 3,
+            "text": "Linda",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 4,
+            "end_row_offset_idx": 5,
+            "start_col_offset_idx": 3,
+            "end_col_offset_idx": 4,
+            "text": "Olsen",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 4,
+            "end_row_offset_idx": 5,
+            "start_col_offset_idx": 4,
+            "end_col_offset_idx": 5,
+            "text": "Dominguez;Mcmillan and Donovan",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 4,
+            "end_row_offset_idx": 5,
+            "start_col_offset_idx": 5,
+            "end_col_offset_idx": 6,
+            "text": "Bensonview",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 4,
+            "end_row_offset_idx": 5,
+            "start_col_offset_idx": 6,
+            "end_col_offset_idx": 7,
+            "text": "Dominican Republic",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 4,
+            "end_row_offset_idx": 5,
+            "start_col_offset_idx": 7,
+            "end_col_offset_idx": 8,
+            "text": "001-808-617-6467x12895",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 4,
+            "end_row_offset_idx": 5,
+            "start_col_offset_idx": 8,
+            "end_col_offset_idx": 9,
+            "text": "+1-813-324-8756",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 4,
+            "end_row_offset_idx": 5,
+            "start_col_offset_idx": 9,
+            "end_col_offset_idx": 10,
+            "text": "stanleyblackwell@benson.org",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 4,
+            "end_row_offset_idx": 5,
+            "start_col_offset_idx": 10,
+            "end_col_offset_idx": 11,
+            "text": "2020-06-02",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 4,
+            "end_row_offset_idx": 5,
+            "start_col_offset_idx": 11,
+            "end_col_offset_idx": 12,
+            "text": "http://www.good-lyons.com/",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 5,
+            "end_row_offset_idx": 6,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 1,
+            "text": "5",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 5,
+            "end_row_offset_idx": 6,
+            "start_col_offset_idx": 1,
+            "end_col_offset_idx": 2,
+            "text": "053d585Ab6b3159",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 5,
+            "end_row_offset_idx": 6,
+            "start_col_offset_idx": 2,
+            "end_col_offset_idx": 3,
+            "text": "Joanna",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 5,
+            "end_row_offset_idx": 6,
+            "start_col_offset_idx": 3,
+            "end_col_offset_idx": 4,
+            "text": "Bender",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 5,
+            "end_row_offset_idx": 6,
+            "start_col_offset_idx": 4,
+            "end_col_offset_idx": 5,
+            "text": "Martin;Lang and Andrade",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 5,
+            "end_row_offset_idx": 6,
+            "start_col_offset_idx": 5,
+            "end_col_offset_idx": 6,
+            "text": "West Priscilla",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 5,
+            "end_row_offset_idx": 6,
+            "start_col_offset_idx": 6,
+            "end_col_offset_idx": 7,
+            "text": "Slovakia (Slovak Republic)",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 5,
+            "end_row_offset_idx": 6,
+            "start_col_offset_idx": 7,
+            "end_col_offset_idx": 8,
+            "text": "001-234-203-0635x76146",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 5,
+            "end_row_offset_idx": 6,
+            "start_col_offset_idx": 8,
+            "end_col_offset_idx": 9,
+            "text": "001-199-446-3860x3486",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 5,
+            "end_row_offset_idx": 6,
+            "start_col_offset_idx": 9,
+            "end_col_offset_idx": 10,
+            "text": "colinalvarado@miles.net",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 5,
+            "end_row_offset_idx": 6,
+            "start_col_offset_idx": 10,
+            "end_col_offset_idx": 11,
+            "text": "2021-04-17",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 5,
+            "end_row_offset_idx": 6,
+            "start_col_offset_idx": 11,
+            "end_col_offset_idx": 12,
+            "text": "https://goodwin-ingram.com/",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          }
+        ],
+        "num_rows": 6,
+        "num_cols": 12,
+        "grid": [
+          [
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 0,
+              "end_row_offset_idx": 1,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "Index",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 0,
+              "end_row_offset_idx": 1,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 2,
+              "text": "Customer Id",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 0,
+              "end_row_offset_idx": 1,
+              "start_col_offset_idx": 2,
+              "end_col_offset_idx": 3,
+              "text": "First Name",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 0,
+              "end_row_offset_idx": 1,
+              "start_col_offset_idx": 3,
+              "end_col_offset_idx": 4,
+              "text": "Last Name",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 0,
+              "end_row_offset_idx": 1,
+              "start_col_offset_idx": 4,
+              "end_col_offset_idx": 5,
+              "text": "Company",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 0,
+              "end_row_offset_idx": 1,
+              "start_col_offset_idx": 5,
+              "end_col_offset_idx": 6,
+              "text": "City",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 0,
+              "end_row_offset_idx": 1,
+              "start_col_offset_idx": 6,
+              "end_col_offset_idx": 7,
+              "text": "Country",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 0,
+              "end_row_offset_idx": 1,
+              "start_col_offset_idx": 7,
+              "end_col_offset_idx": 8,
+              "text": "Phone 1",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 0,
+              "end_row_offset_idx": 1,
+              "start_col_offset_idx": 8,
+              "end_col_offset_idx": 9,
+              "text": "Phone 2",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 0,
+              "end_row_offset_idx": 1,
+              "start_col_offset_idx": 9,
+              "end_col_offset_idx": 10,
+              "text": "Email",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 0,
+              "end_row_offset_idx": 1,
+              "start_col_offset_idx": 10,
+              "end_col_offset_idx": 11,
+              "text": "Subscription Date",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 0,
+              "end_row_offset_idx": 1,
+              "start_col_offset_idx": 11,
+              "end_col_offset_idx": 12,
+              "text": "Website",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ],
+          [
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 1,
+              "end_row_offset_idx": 2,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "1",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 1,
+              "end_row_offset_idx": 2,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 2,
+              "text": "DD37Cf93aecA6Dc",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 1,
+              "end_row_offset_idx": 2,
+              "start_col_offset_idx": 2,
+              "end_col_offset_idx": 3,
+              "text": "Sheryl",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 1,
+              "end_row_offset_idx": 2,
+              "start_col_offset_idx": 3,
+              "end_col_offset_idx": 4,
+              "text": "Baxter",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 1,
+              "end_row_offset_idx": 2,
+              "start_col_offset_idx": 4,
+              "end_col_offset_idx": 5,
+              "text": "Rasmussen Group",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 1,
+              "end_row_offset_idx": 2,
+              "start_col_offset_idx": 5,
+              "end_col_offset_idx": 6,
+              "text": "East Leonard",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 1,
+              "end_row_offset_idx": 2,
+              "start_col_offset_idx": 6,
+              "end_col_offset_idx": 7,
+              "text": "Chile",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 1,
+              "end_row_offset_idx": 2,
+              "start_col_offset_idx": 7,
+              "end_col_offset_idx": 8,
+              "text": "229.077.5154",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 1,
+              "end_row_offset_idx": 2,
+              "start_col_offset_idx": 8,
+              "end_col_offset_idx": 9,
+              "text": "397.884.0519x718",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 1,
+              "end_row_offset_idx": 2,
+              "start_col_offset_idx": 9,
+              "end_col_offset_idx": 10,
+              "text": "zunigavanessa@smith.info",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 1,
+              "end_row_offset_idx": 2,
+              "start_col_offset_idx": 10,
+              "end_col_offset_idx": 11,
+              "text": "2020-08-24",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 1,
+              "end_row_offset_idx": 2,
+              "start_col_offset_idx": 11,
+              "end_col_offset_idx": 12,
+              "text": "http://www.stephenson.com/",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ],
+          [
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 2,
+              "end_row_offset_idx": 3,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "2",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 2,
+              "end_row_offset_idx": 3,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 2,
+              "text": "1Ef7b82A4CAAD10",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 2,
+              "end_row_offset_idx": 3,
+              "start_col_offset_idx": 2,
+              "end_col_offset_idx": 3,
+              "text": "Preston",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 2,
+              "end_row_offset_idx": 3,
+              "start_col_offset_idx": 3,
+              "end_col_offset_idx": 4,
+              "text": "Lozano",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 2,
+              "end_row_offset_idx": 3,
+              "start_col_offset_idx": 4,
+              "end_col_offset_idx": 5,
+              "text": "Vega-Gentry",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 2,
+              "end_row_offset_idx": 3,
+              "start_col_offset_idx": 5,
+              "end_col_offset_idx": 6,
+              "text": "East Jimmychester",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 2,
+              "end_row_offset_idx": 3,
+              "start_col_offset_idx": 6,
+              "end_col_offset_idx": 7,
+              "text": "Djibouti",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 2,
+              "end_row_offset_idx": 3,
+              "start_col_offset_idx": 7,
+              "end_col_offset_idx": 8,
+              "text": "5153435776",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 2,
+              "end_row_offset_idx": 3,
+              "start_col_offset_idx": 8,
+              "end_col_offset_idx": 9,
+              "text": "686-620-1820x944",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 2,
+              "end_row_offset_idx": 3,
+              "start_col_offset_idx": 9,
+              "end_col_offset_idx": 10,
+              "text": "vmata@colon.com",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 2,
+              "end_row_offset_idx": 3,
+              "start_col_offset_idx": 10,
+              "end_col_offset_idx": 11,
+              "text": "2021-04-23",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 2,
+              "end_row_offset_idx": 3,
+              "start_col_offset_idx": 11,
+              "end_col_offset_idx": 12,
+              "text": "http://www.hobbs.com/",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ],
+          [
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 3,
+              "end_row_offset_idx": 4,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "3",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 3,
+              "end_row_offset_idx": 4,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 2,
+              "text": "6F94879bDAfE5a6",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 3,
+              "end_row_offset_idx": 4,
+              "start_col_offset_idx": 2,
+              "end_col_offset_idx": 3,
+              "text": "Roy",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 3,
+              "end_row_offset_idx": 4,
+              "start_col_offset_idx": 3,
+              "end_col_offset_idx": 4,
+              "text": "Berry",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 3,
+              "end_row_offset_idx": 4,
+              "start_col_offset_idx": 4,
+              "end_col_offset_idx": 5,
+              "text": "Murillo-Perry",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 3,
+              "end_row_offset_idx": 4,
+              "start_col_offset_idx": 5,
+              "end_col_offset_idx": 6,
+              "text": "Isabelborough",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 3,
+              "end_row_offset_idx": 4,
+              "start_col_offset_idx": 6,
+              "end_col_offset_idx": 7,
+              "text": "Antigua and Barbuda",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 3,
+              "end_row_offset_idx": 4,
+              "start_col_offset_idx": 7,
+              "end_col_offset_idx": 8,
+              "text": "+1-539-402-0259",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 3,
+              "end_row_offset_idx": 4,
+              "start_col_offset_idx": 8,
+              "end_col_offset_idx": 9,
+              "text": "(496)978-3969x58947",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 3,
+              "end_row_offset_idx": 4,
+              "start_col_offset_idx": 9,
+              "end_col_offset_idx": 10,
+              "text": "beckycarr@hogan.com",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 3,
+              "end_row_offset_idx": 4,
+              "start_col_offset_idx": 10,
+              "end_col_offset_idx": 11,
+              "text": "2020-03-25",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 3,
+              "end_row_offset_idx": 4,
+              "start_col_offset_idx": 11,
+              "end_col_offset_idx": 12,
+              "text": "http://www.lawrence.com/",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ],
+          [
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 4,
+              "end_row_offset_idx": 5,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "4",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 4,
+              "end_row_offset_idx": 5,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 2,
+              "text": "5Cef8BFA16c5e3c",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 4,
+              "end_row_offset_idx": 5,
+              "start_col_offset_idx": 2,
+              "end_col_offset_idx": 3,
+              "text": "Linda",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 4,
+              "end_row_offset_idx": 5,
+              "start_col_offset_idx": 3,
+              "end_col_offset_idx": 4,
+              "text": "Olsen",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 4,
+              "end_row_offset_idx": 5,
+              "start_col_offset_idx": 4,
+              "end_col_offset_idx": 5,
+              "text": "Dominguez;Mcmillan and Donovan",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 4,
+              "end_row_offset_idx": 5,
+              "start_col_offset_idx": 5,
+              "end_col_offset_idx": 6,
+              "text": "Bensonview",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 4,
+              "end_row_offset_idx": 5,
+              "start_col_offset_idx": 6,
+              "end_col_offset_idx": 7,
+              "text": "Dominican Republic",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 4,
+              "end_row_offset_idx": 5,
+              "start_col_offset_idx": 7,
+              "end_col_offset_idx": 8,
+              "text": "001-808-617-6467x12895",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 4,
+              "end_row_offset_idx": 5,
+              "start_col_offset_idx": 8,
+              "end_col_offset_idx": 9,
+              "text": "+1-813-324-8756",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 4,
+              "end_row_offset_idx": 5,
+              "start_col_offset_idx": 9,
+              "end_col_offset_idx": 10,
+              "text": "stanleyblackwell@benson.org",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 4,
+              "end_row_offset_idx": 5,
+              "start_col_offset_idx": 10,
+              "end_col_offset_idx": 11,
+              "text": "2020-06-02",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 4,
+              "end_row_offset_idx": 5,
+              "start_col_offset_idx": 11,
+              "end_col_offset_idx": 12,
+              "text": "http://www.good-lyons.com/",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ],
+          [
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 5,
+              "end_row_offset_idx": 6,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "5",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 5,
+              "end_row_offset_idx": 6,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 2,
+              "text": "053d585Ab6b3159",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 5,
+              "end_row_offset_idx": 6,
+              "start_col_offset_idx": 2,
+              "end_col_offset_idx": 3,
+              "text": "Joanna",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 5,
+              "end_row_offset_idx": 6,
+              "start_col_offset_idx": 3,
+              "end_col_offset_idx": 4,
+              "text": "Bender",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 5,
+              "end_row_offset_idx": 6,
+              "start_col_offset_idx": 4,
+              "end_col_offset_idx": 5,
+              "text": "Martin;Lang and Andrade",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 5,
+              "end_row_offset_idx": 6,
+              "start_col_offset_idx": 5,
+              "end_col_offset_idx": 6,
+              "text": "West Priscilla",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 5,
+              "end_row_offset_idx": 6,
+              "start_col_offset_idx": 6,
+              "end_col_offset_idx": 7,
+              "text": "Slovakia (Slovak Republic)",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 5,
+              "end_row_offset_idx": 6,
+              "start_col_offset_idx": 7,
+              "end_col_offset_idx": 8,
+              "text": "001-234-203-0635x76146",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 5,
+              "end_row_offset_idx": 6,
+              "start_col_offset_idx": 8,
+              "end_col_offset_idx": 9,
+              "text": "001-199-446-3860x3486",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 5,
+              "end_row_offset_idx": 6,
+              "start_col_offset_idx": 9,
+              "end_col_offset_idx": 10,
+              "text": "colinalvarado@miles.net",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 5,
+              "end_row_offset_idx": 6,
+              "start_col_offset_idx": 10,
+              "end_col_offset_idx": 11,
+              "text": "2021-04-17",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 5,
+              "end_row_offset_idx": 6,
+              "start_col_offset_idx": 11,
+              "end_col_offset_idx": 12,
+              "text": "https://goodwin-ingram.com/",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ]
+        ]
+      }
+    }
+  ],
+  "key_value_items": [],
+  "form_items": [],
+  "pages": {}
+}
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v2/csv-semicolon.csv.md b/tests/data/groundtruth/docling_v2/csv-semicolon.csv.md
new file mode 100644
index 00000000..43ada12c
--- /dev/null
+++ b/tests/data/groundtruth/docling_v2/csv-semicolon.csv.md
@@ -0,0 +1,7 @@
+|   Index | Customer Id     | First Name   | Last Name   | Company                        | City              | Country                    | Phone 1                | Phone 2               | Email                       | Subscription Date   | Website                     |
+|---------|-----------------|--------------|-------------|--------------------------------|-------------------|----------------------------|------------------------|-----------------------|-----------------------------|---------------------|-----------------------------|
+|       1 | DD37Cf93aecA6Dc | Sheryl       | Baxter      | Rasmussen Group                | East Leonard      | Chile                      | 229.077.5154           | 397.884.0519x718      | zunigavanessa@smith.info    | 2020-08-24          | http://www.stephenson.com/  |
+|       2 | 1Ef7b82A4CAAD10 | Preston      | Lozano      | Vega-Gentry                    | East Jimmychester | Djibouti                   | 5153435776             | 686-620-1820x944      | vmata@colon.com             | 2021-04-23          | http://www.hobbs.com/       |
+|       3 | 6F94879bDAfE5a6 | Roy          | Berry       | Murillo-Perry                  | Isabelborough     | Antigua and Barbuda        | +1-539-402-0259        | (496)978-3969x58947   | beckycarr@hogan.com         | 2020-03-25          | http://www.lawrence.com/    |
+|       4 | 5Cef8BFA16c5e3c | Linda        | Olsen       | Dominguez;Mcmillan and Donovan | Bensonview        | Dominican Republic         | 001-808-617-6467x12895 | +1-813-324-8756       | stanleyblackwell@benson.org | 2020-06-02          | http://www.good-lyons.com/  |
+|       5 | 053d585Ab6b3159 | Joanna       | Bender      | Martin;Lang and Andrade        | West Priscilla    | Slovakia (Slovak Republic) | 001-234-203-0635x76146 | 001-199-446-3860x3486 | colinalvarado@miles.net     | 2021-04-17          | https://goodwin-ingram.com/ |
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v2/csv-tab.csv.itxt b/tests/data/groundtruth/docling_v2/csv-tab.csv.itxt
new file mode 100644
index 00000000..6debed5d
--- /dev/null
+++ b/tests/data/groundtruth/docling_v2/csv-tab.csv.itxt
@@ -0,0 +1,2 @@
+item-0 at level 0: unspecified: group _root_
+  item-1 at level 1: table with [6x12]
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v2/csv-tab.csv.json b/tests/data/groundtruth/docling_v2/csv-tab.csv.json
new file mode 100644
index 00000000..5f6d4ac5
--- /dev/null
+++ b/tests/data/groundtruth/docling_v2/csv-tab.csv.json
@@ -0,0 +1,1797 @@
+{
+  "schema_name": "DoclingDocument",
+  "version": "1.1.0",
+  "name": "csv-tab",
+  "origin": {
+    "mimetype": "text/csv",
+    "binary_hash": 9191019080503276679,
+    "filename": "csv-tab.csv"
+  },
+  "furniture": {
+    "self_ref": "#/furniture",
+    "children": [],
+    "content_layer": "furniture",
+    "name": "_root_",
+    "label": "unspecified"
+  },
+  "body": {
+    "self_ref": "#/body",
+    "children": [
+      {
+        "$ref": "#/tables/0"
+      }
+    ],
+    "content_layer": "body",
+    "name": "_root_",
+    "label": "unspecified"
+  },
+  "groups": [],
+  "texts": [],
+  "pictures": [],
+  "tables": [
+    {
+      "self_ref": "#/tables/0",
+      "parent": {
+        "$ref": "#/body"
+      },
+      "children": [],
+      "content_layer": "body",
+      "label": "table",
+      "prov": [],
+      "captions": [],
+      "references": [],
+      "footnotes": [],
+      "data": {
+        "table_cells": [
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 0,
+            "end_row_offset_idx": 1,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 1,
+            "text": "Index",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 0,
+            "end_row_offset_idx": 1,
+            "start_col_offset_idx": 1,
+            "end_col_offset_idx": 2,
+            "text": "Customer Id",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 0,
+            "end_row_offset_idx": 1,
+            "start_col_offset_idx": 2,
+            "end_col_offset_idx": 3,
+            "text": "First Name",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 0,
+            "end_row_offset_idx": 1,
+            "start_col_offset_idx": 3,
+            "end_col_offset_idx": 4,
+            "text": "Last Name",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 0,
+            "end_row_offset_idx": 1,
+            "start_col_offset_idx": 4,
+            "end_col_offset_idx": 5,
+            "text": "Company",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 0,
+            "end_row_offset_idx": 1,
+            "start_col_offset_idx": 5,
+            "end_col_offset_idx": 6,
+            "text": "City",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 0,
+            "end_row_offset_idx": 1,
+            "start_col_offset_idx": 6,
+            "end_col_offset_idx": 7,
+            "text": "Country",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 0,
+            "end_row_offset_idx": 1,
+            "start_col_offset_idx": 7,
+            "end_col_offset_idx": 8,
+            "text": "Phone 1",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 0,
+            "end_row_offset_idx": 1,
+            "start_col_offset_idx": 8,
+            "end_col_offset_idx": 9,
+            "text": "Phone 2",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 0,
+            "end_row_offset_idx": 1,
+            "start_col_offset_idx": 9,
+            "end_col_offset_idx": 10,
+            "text": "Email",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 0,
+            "end_row_offset_idx": 1,
+            "start_col_offset_idx": 10,
+            "end_col_offset_idx": 11,
+            "text": "Subscription Date",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 0,
+            "end_row_offset_idx": 1,
+            "start_col_offset_idx": 11,
+            "end_col_offset_idx": 12,
+            "text": "Website",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 1,
+            "end_row_offset_idx": 2,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 1,
+            "text": "1",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 1,
+            "end_row_offset_idx": 2,
+            "start_col_offset_idx": 1,
+            "end_col_offset_idx": 2,
+            "text": "DD37Cf93aecA6Dc",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 1,
+            "end_row_offset_idx": 2,
+            "start_col_offset_idx": 2,
+            "end_col_offset_idx": 3,
+            "text": "Sheryl",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 1,
+            "end_row_offset_idx": 2,
+            "start_col_offset_idx": 3,
+            "end_col_offset_idx": 4,
+            "text": "Baxter",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 1,
+            "end_row_offset_idx": 2,
+            "start_col_offset_idx": 4,
+            "end_col_offset_idx": 5,
+            "text": "Rasmussen Group",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 1,
+            "end_row_offset_idx": 2,
+            "start_col_offset_idx": 5,
+            "end_col_offset_idx": 6,
+            "text": "East Leonard",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 1,
+            "end_row_offset_idx": 2,
+            "start_col_offset_idx": 6,
+            "end_col_offset_idx": 7,
+            "text": "Chile",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 1,
+            "end_row_offset_idx": 2,
+            "start_col_offset_idx": 7,
+            "end_col_offset_idx": 8,
+            "text": "229.077.5154",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 1,
+            "end_row_offset_idx": 2,
+            "start_col_offset_idx": 8,
+            "end_col_offset_idx": 9,
+            "text": "397.884.0519x718",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 1,
+            "end_row_offset_idx": 2,
+            "start_col_offset_idx": 9,
+            "end_col_offset_idx": 10,
+            "text": "zunigavanessa@smith.info",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 1,
+            "end_row_offset_idx": 2,
+            "start_col_offset_idx": 10,
+            "end_col_offset_idx": 11,
+            "text": "2020-08-24",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 1,
+            "end_row_offset_idx": 2,
+            "start_col_offset_idx": 11,
+            "end_col_offset_idx": 12,
+            "text": "http://www.stephenson.com/",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 2,
+            "end_row_offset_idx": 3,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 1,
+            "text": "2",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 2,
+            "end_row_offset_idx": 3,
+            "start_col_offset_idx": 1,
+            "end_col_offset_idx": 2,
+            "text": "1Ef7b82A4CAAD10",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 2,
+            "end_row_offset_idx": 3,
+            "start_col_offset_idx": 2,
+            "end_col_offset_idx": 3,
+            "text": "Preston",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 2,
+            "end_row_offset_idx": 3,
+            "start_col_offset_idx": 3,
+            "end_col_offset_idx": 4,
+            "text": "Lozano",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 2,
+            "end_row_offset_idx": 3,
+            "start_col_offset_idx": 4,
+            "end_col_offset_idx": 5,
+            "text": "Vega-Gentry",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 2,
+            "end_row_offset_idx": 3,
+            "start_col_offset_idx": 5,
+            "end_col_offset_idx": 6,
+            "text": "East Jimmychester",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 2,
+            "end_row_offset_idx": 3,
+            "start_col_offset_idx": 6,
+            "end_col_offset_idx": 7,
+            "text": "Djibouti",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 2,
+            "end_row_offset_idx": 3,
+            "start_col_offset_idx": 7,
+            "end_col_offset_idx": 8,
+            "text": "5153435776",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 2,
+            "end_row_offset_idx": 3,
+            "start_col_offset_idx": 8,
+            "end_col_offset_idx": 9,
+            "text": "686-620-1820x944",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 2,
+            "end_row_offset_idx": 3,
+            "start_col_offset_idx": 9,
+            "end_col_offset_idx": 10,
+            "text": "vmata@colon.com",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 2,
+            "end_row_offset_idx": 3,
+            "start_col_offset_idx": 10,
+            "end_col_offset_idx": 11,
+            "text": "2021-04-23",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 2,
+            "end_row_offset_idx": 3,
+            "start_col_offset_idx": 11,
+            "end_col_offset_idx": 12,
+            "text": "http://www.hobbs.com/",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 3,
+            "end_row_offset_idx": 4,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 1,
+            "text": "3",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 3,
+            "end_row_offset_idx": 4,
+            "start_col_offset_idx": 1,
+            "end_col_offset_idx": 2,
+            "text": "6F94879bDAfE5a6",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 3,
+            "end_row_offset_idx": 4,
+            "start_col_offset_idx": 2,
+            "end_col_offset_idx": 3,
+            "text": "Roy",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 3,
+            "end_row_offset_idx": 4,
+            "start_col_offset_idx": 3,
+            "end_col_offset_idx": 4,
+            "text": "Berry",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 3,
+            "end_row_offset_idx": 4,
+            "start_col_offset_idx": 4,
+            "end_col_offset_idx": 5,
+            "text": "Murillo-Perry",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 3,
+            "end_row_offset_idx": 4,
+            "start_col_offset_idx": 5,
+            "end_col_offset_idx": 6,
+            "text": "Isabelborough",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 3,
+            "end_row_offset_idx": 4,
+            "start_col_offset_idx": 6,
+            "end_col_offset_idx": 7,
+            "text": "Antigua and Barbuda",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 3,
+            "end_row_offset_idx": 4,
+            "start_col_offset_idx": 7,
+            "end_col_offset_idx": 8,
+            "text": "+1-539-402-0259",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 3,
+            "end_row_offset_idx": 4,
+            "start_col_offset_idx": 8,
+            "end_col_offset_idx": 9,
+            "text": "(496)978-3969x58947",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 3,
+            "end_row_offset_idx": 4,
+            "start_col_offset_idx": 9,
+            "end_col_offset_idx": 10,
+            "text": "beckycarr@hogan.com",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 3,
+            "end_row_offset_idx": 4,
+            "start_col_offset_idx": 10,
+            "end_col_offset_idx": 11,
+            "text": "2020-03-25",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 3,
+            "end_row_offset_idx": 4,
+            "start_col_offset_idx": 11,
+            "end_col_offset_idx": 12,
+            "text": "http://www.lawrence.com/",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 4,
+            "end_row_offset_idx": 5,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 1,
+            "text": "4",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 4,
+            "end_row_offset_idx": 5,
+            "start_col_offset_idx": 1,
+            "end_col_offset_idx": 2,
+            "text": "5Cef8BFA16c5e3c",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 4,
+            "end_row_offset_idx": 5,
+            "start_col_offset_idx": 2,
+            "end_col_offset_idx": 3,
+            "text": "Linda",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 4,
+            "end_row_offset_idx": 5,
+            "start_col_offset_idx": 3,
+            "end_col_offset_idx": 4,
+            "text": "Olsen",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 4,
+            "end_row_offset_idx": 5,
+            "start_col_offset_idx": 4,
+            "end_col_offset_idx": 5,
+            "text": "Dominguez\tMcmillan and Donovan",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 4,
+            "end_row_offset_idx": 5,
+            "start_col_offset_idx": 5,
+            "end_col_offset_idx": 6,
+            "text": "Bensonview",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 4,
+            "end_row_offset_idx": 5,
+            "start_col_offset_idx": 6,
+            "end_col_offset_idx": 7,
+            "text": "Dominican Republic",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 4,
+            "end_row_offset_idx": 5,
+            "start_col_offset_idx": 7,
+            "end_col_offset_idx": 8,
+            "text": "001-808-617-6467x12895",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 4,
+            "end_row_offset_idx": 5,
+            "start_col_offset_idx": 8,
+            "end_col_offset_idx": 9,
+            "text": "+1-813-324-8756",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 4,
+            "end_row_offset_idx": 5,
+            "start_col_offset_idx": 9,
+            "end_col_offset_idx": 10,
+            "text": "stanleyblackwell@benson.org",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 4,
+            "end_row_offset_idx": 5,
+            "start_col_offset_idx": 10,
+            "end_col_offset_idx": 11,
+            "text": "2020-06-02",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 4,
+            "end_row_offset_idx": 5,
+            "start_col_offset_idx": 11,
+            "end_col_offset_idx": 12,
+            "text": "http://www.good-lyons.com/",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 5,
+            "end_row_offset_idx": 6,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 1,
+            "text": "5",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 5,
+            "end_row_offset_idx": 6,
+            "start_col_offset_idx": 1,
+            "end_col_offset_idx": 2,
+            "text": "053d585Ab6b3159",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 5,
+            "end_row_offset_idx": 6,
+            "start_col_offset_idx": 2,
+            "end_col_offset_idx": 3,
+            "text": "Joanna",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 5,
+            "end_row_offset_idx": 6,
+            "start_col_offset_idx": 3,
+            "end_col_offset_idx": 4,
+            "text": "Bender",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 5,
+            "end_row_offset_idx": 6,
+            "start_col_offset_idx": 4,
+            "end_col_offset_idx": 5,
+            "text": "Martin\tLang and Andrade",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 5,
+            "end_row_offset_idx": 6,
+            "start_col_offset_idx": 5,
+            "end_col_offset_idx": 6,
+            "text": "West Priscilla",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 5,
+            "end_row_offset_idx": 6,
+            "start_col_offset_idx": 6,
+            "end_col_offset_idx": 7,
+            "text": "Slovakia (Slovak Republic)",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 5,
+            "end_row_offset_idx": 6,
+            "start_col_offset_idx": 7,
+            "end_col_offset_idx": 8,
+            "text": "001-234-203-0635x76146",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 5,
+            "end_row_offset_idx": 6,
+            "start_col_offset_idx": 8,
+            "end_col_offset_idx": 9,
+            "text": "001-199-446-3860x3486",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 5,
+            "end_row_offset_idx": 6,
+            "start_col_offset_idx": 9,
+            "end_col_offset_idx": 10,
+            "text": "colinalvarado@miles.net",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 5,
+            "end_row_offset_idx": 6,
+            "start_col_offset_idx": 10,
+            "end_col_offset_idx": 11,
+            "text": "2021-04-17",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 5,
+            "end_row_offset_idx": 6,
+            "start_col_offset_idx": 11,
+            "end_col_offset_idx": 12,
+            "text": "https://goodwin-ingram.com/",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          }
+        ],
+        "num_rows": 6,
+        "num_cols": 12,
+        "grid": [
+          [
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 0,
+              "end_row_offset_idx": 1,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "Index",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 0,
+              "end_row_offset_idx": 1,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 2,
+              "text": "Customer Id",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 0,
+              "end_row_offset_idx": 1,
+              "start_col_offset_idx": 2,
+              "end_col_offset_idx": 3,
+              "text": "First Name",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 0,
+              "end_row_offset_idx": 1,
+              "start_col_offset_idx": 3,
+              "end_col_offset_idx": 4,
+              "text": "Last Name",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 0,
+              "end_row_offset_idx": 1,
+              "start_col_offset_idx": 4,
+              "end_col_offset_idx": 5,
+              "text": "Company",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 0,
+              "end_row_offset_idx": 1,
+              "start_col_offset_idx": 5,
+              "end_col_offset_idx": 6,
+              "text": "City",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 0,
+              "end_row_offset_idx": 1,
+              "start_col_offset_idx": 6,
+              "end_col_offset_idx": 7,
+              "text": "Country",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 0,
+              "end_row_offset_idx": 1,
+              "start_col_offset_idx": 7,
+              "end_col_offset_idx": 8,
+              "text": "Phone 1",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 0,
+              "end_row_offset_idx": 1,
+              "start_col_offset_idx": 8,
+              "end_col_offset_idx": 9,
+              "text": "Phone 2",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 0,
+              "end_row_offset_idx": 1,
+              "start_col_offset_idx": 9,
+              "end_col_offset_idx": 10,
+              "text": "Email",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 0,
+              "end_row_offset_idx": 1,
+              "start_col_offset_idx": 10,
+              "end_col_offset_idx": 11,
+              "text": "Subscription Date",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 0,
+              "end_row_offset_idx": 1,
+              "start_col_offset_idx": 11,
+              "end_col_offset_idx": 12,
+              "text": "Website",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ],
+          [
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 1,
+              "end_row_offset_idx": 2,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "1",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 1,
+              "end_row_offset_idx": 2,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 2,
+              "text": "DD37Cf93aecA6Dc",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 1,
+              "end_row_offset_idx": 2,
+              "start_col_offset_idx": 2,
+              "end_col_offset_idx": 3,
+              "text": "Sheryl",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 1,
+              "end_row_offset_idx": 2,
+              "start_col_offset_idx": 3,
+              "end_col_offset_idx": 4,
+              "text": "Baxter",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 1,
+              "end_row_offset_idx": 2,
+              "start_col_offset_idx": 4,
+              "end_col_offset_idx": 5,
+              "text": "Rasmussen Group",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 1,
+              "end_row_offset_idx": 2,
+              "start_col_offset_idx": 5,
+              "end_col_offset_idx": 6,
+              "text": "East Leonard",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 1,
+              "end_row_offset_idx": 2,
+              "start_col_offset_idx": 6,
+              "end_col_offset_idx": 7,
+              "text": "Chile",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 1,
+              "end_row_offset_idx": 2,
+              "start_col_offset_idx": 7,
+              "end_col_offset_idx": 8,
+              "text": "229.077.5154",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 1,
+              "end_row_offset_idx": 2,
+              "start_col_offset_idx": 8,
+              "end_col_offset_idx": 9,
+              "text": "397.884.0519x718",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 1,
+              "end_row_offset_idx": 2,
+              "start_col_offset_idx": 9,
+              "end_col_offset_idx": 10,
+              "text": "zunigavanessa@smith.info",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 1,
+              "end_row_offset_idx": 2,
+              "start_col_offset_idx": 10,
+              "end_col_offset_idx": 11,
+              "text": "2020-08-24",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 1,
+              "end_row_offset_idx": 2,
+              "start_col_offset_idx": 11,
+              "end_col_offset_idx": 12,
+              "text": "http://www.stephenson.com/",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ],
+          [
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 2,
+              "end_row_offset_idx": 3,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "2",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 2,
+              "end_row_offset_idx": 3,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 2,
+              "text": "1Ef7b82A4CAAD10",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 2,
+              "end_row_offset_idx": 3,
+              "start_col_offset_idx": 2,
+              "end_col_offset_idx": 3,
+              "text": "Preston",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 2,
+              "end_row_offset_idx": 3,
+              "start_col_offset_idx": 3,
+              "end_col_offset_idx": 4,
+              "text": "Lozano",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 2,
+              "end_row_offset_idx": 3,
+              "start_col_offset_idx": 4,
+              "end_col_offset_idx": 5,
+              "text": "Vega-Gentry",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 2,
+              "end_row_offset_idx": 3,
+              "start_col_offset_idx": 5,
+              "end_col_offset_idx": 6,
+              "text": "East Jimmychester",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 2,
+              "end_row_offset_idx": 3,
+              "start_col_offset_idx": 6,
+              "end_col_offset_idx": 7,
+              "text": "Djibouti",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 2,
+              "end_row_offset_idx": 3,
+              "start_col_offset_idx": 7,
+              "end_col_offset_idx": 8,
+              "text": "5153435776",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 2,
+              "end_row_offset_idx": 3,
+              "start_col_offset_idx": 8,
+              "end_col_offset_idx": 9,
+              "text": "686-620-1820x944",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 2,
+              "end_row_offset_idx": 3,
+              "start_col_offset_idx": 9,
+              "end_col_offset_idx": 10,
+              "text": "vmata@colon.com",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 2,
+              "end_row_offset_idx": 3,
+              "start_col_offset_idx": 10,
+              "end_col_offset_idx": 11,
+              "text": "2021-04-23",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 2,
+              "end_row_offset_idx": 3,
+              "start_col_offset_idx": 11,
+              "end_col_offset_idx": 12,
+              "text": "http://www.hobbs.com/",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ],
+          [
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 3,
+              "end_row_offset_idx": 4,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "3",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 3,
+              "end_row_offset_idx": 4,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 2,
+              "text": "6F94879bDAfE5a6",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 3,
+              "end_row_offset_idx": 4,
+              "start_col_offset_idx": 2,
+              "end_col_offset_idx": 3,
+              "text": "Roy",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 3,
+              "end_row_offset_idx": 4,
+              "start_col_offset_idx": 3,
+              "end_col_offset_idx": 4,
+              "text": "Berry",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 3,
+              "end_row_offset_idx": 4,
+              "start_col_offset_idx": 4,
+              "end_col_offset_idx": 5,
+              "text": "Murillo-Perry",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 3,
+              "end_row_offset_idx": 4,
+              "start_col_offset_idx": 5,
+              "end_col_offset_idx": 6,
+              "text": "Isabelborough",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 3,
+              "end_row_offset_idx": 4,
+              "start_col_offset_idx": 6,
+              "end_col_offset_idx": 7,
+              "text": "Antigua and Barbuda",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 3,
+              "end_row_offset_idx": 4,
+              "start_col_offset_idx": 7,
+              "end_col_offset_idx": 8,
+              "text": "+1-539-402-0259",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 3,
+              "end_row_offset_idx": 4,
+              "start_col_offset_idx": 8,
+              "end_col_offset_idx": 9,
+              "text": "(496)978-3969x58947",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 3,
+              "end_row_offset_idx": 4,
+              "start_col_offset_idx": 9,
+              "end_col_offset_idx": 10,
+              "text": "beckycarr@hogan.com",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 3,
+              "end_row_offset_idx": 4,
+              "start_col_offset_idx": 10,
+              "end_col_offset_idx": 11,
+              "text": "2020-03-25",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 3,
+              "end_row_offset_idx": 4,
+              "start_col_offset_idx": 11,
+              "end_col_offset_idx": 12,
+              "text": "http://www.lawrence.com/",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ],
+          [
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 4,
+              "end_row_offset_idx": 5,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "4",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 4,
+              "end_row_offset_idx": 5,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 2,
+              "text": "5Cef8BFA16c5e3c",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 4,
+              "end_row_offset_idx": 5,
+              "start_col_offset_idx": 2,
+              "end_col_offset_idx": 3,
+              "text": "Linda",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 4,
+              "end_row_offset_idx": 5,
+              "start_col_offset_idx": 3,
+              "end_col_offset_idx": 4,
+              "text": "Olsen",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 4,
+              "end_row_offset_idx": 5,
+              "start_col_offset_idx": 4,
+              "end_col_offset_idx": 5,
+              "text": "Dominguez\tMcmillan and Donovan",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 4,
+              "end_row_offset_idx": 5,
+              "start_col_offset_idx": 5,
+              "end_col_offset_idx": 6,
+              "text": "Bensonview",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 4,
+              "end_row_offset_idx": 5,
+              "start_col_offset_idx": 6,
+              "end_col_offset_idx": 7,
+              "text": "Dominican Republic",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 4,
+              "end_row_offset_idx": 5,
+              "start_col_offset_idx": 7,
+              "end_col_offset_idx": 8,
+              "text": "001-808-617-6467x12895",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 4,
+              "end_row_offset_idx": 5,
+              "start_col_offset_idx": 8,
+              "end_col_offset_idx": 9,
+              "text": "+1-813-324-8756",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 4,
+              "end_row_offset_idx": 5,
+              "start_col_offset_idx": 9,
+              "end_col_offset_idx": 10,
+              "text": "stanleyblackwell@benson.org",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 4,
+              "end_row_offset_idx": 5,
+              "start_col_offset_idx": 10,
+              "end_col_offset_idx": 11,
+              "text": "2020-06-02",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 4,
+              "end_row_offset_idx": 5,
+              "start_col_offset_idx": 11,
+              "end_col_offset_idx": 12,
+              "text": "http://www.good-lyons.com/",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ],
+          [
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 5,
+              "end_row_offset_idx": 6,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "5",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 5,
+              "end_row_offset_idx": 6,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 2,
+              "text": "053d585Ab6b3159",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 5,
+              "end_row_offset_idx": 6,
+              "start_col_offset_idx": 2,
+              "end_col_offset_idx": 3,
+              "text": "Joanna",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 5,
+              "end_row_offset_idx": 6,
+              "start_col_offset_idx": 3,
+              "end_col_offset_idx": 4,
+              "text": "Bender",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 5,
+              "end_row_offset_idx": 6,
+              "start_col_offset_idx": 4,
+              "end_col_offset_idx": 5,
+              "text": "Martin\tLang and Andrade",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 5,
+              "end_row_offset_idx": 6,
+              "start_col_offset_idx": 5,
+              "end_col_offset_idx": 6,
+              "text": "West Priscilla",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 5,
+              "end_row_offset_idx": 6,
+              "start_col_offset_idx": 6,
+              "end_col_offset_idx": 7,
+              "text": "Slovakia (Slovak Republic)",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 5,
+              "end_row_offset_idx": 6,
+              "start_col_offset_idx": 7,
+              "end_col_offset_idx": 8,
+              "text": "001-234-203-0635x76146",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 5,
+              "end_row_offset_idx": 6,
+              "start_col_offset_idx": 8,
+              "end_col_offset_idx": 9,
+              "text": "001-199-446-3860x3486",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 5,
+              "end_row_offset_idx": 6,
+              "start_col_offset_idx": 9,
+              "end_col_offset_idx": 10,
+              "text": "colinalvarado@miles.net",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 5,
+              "end_row_offset_idx": 6,
+              "start_col_offset_idx": 10,
+              "end_col_offset_idx": 11,
+              "text": "2021-04-17",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 5,
+              "end_row_offset_idx": 6,
+              "start_col_offset_idx": 11,
+              "end_col_offset_idx": 12,
+              "text": "https://goodwin-ingram.com/",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ]
+        ]
+      }
+    }
+  ],
+  "key_value_items": [],
+  "form_items": [],
+  "pages": {}
+}
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v2/csv-tab.csv.md b/tests/data/groundtruth/docling_v2/csv-tab.csv.md
new file mode 100644
index 00000000..12274691
--- /dev/null
+++ b/tests/data/groundtruth/docling_v2/csv-tab.csv.md
@@ -0,0 +1,7 @@
+|   Index | Customer Id     | First Name   | Last Name   | Company         | City              | Country                    | Phone 1                | Phone 2               | Email                       | Subscription Date   | Website                     |
+|---------|-----------------|--------------|-------------|-----------------|-------------------|----------------------------|------------------------|-----------------------|-----------------------------|---------------------|-----------------------------|
+|       1 | DD37Cf93aecA6Dc | Sheryl       | Baxter      | Rasmussen Group | East Leonard      | Chile                      | 229.077.5154           | 397.884.0519x718      | zunigavanessa@smith.info    | 2020-08-24          | http://www.stephenson.com/  |
+|       2 | 1Ef7b82A4CAAD10 | Preston      | Lozano      | Vega-Gentry     | East Jimmychester | Djibouti                   | 5153435776             | 686-620-1820x944      | vmata@colon.com             | 2021-04-23          | http://www.hobbs.com/       |
+|       3 | 6F94879bDAfE5a6 | Roy          | Berry       | Murillo-Perry   | Isabelborough     | Antigua and Barbuda        | +1-539-402-0259        | (496)978-3969x58947   | beckycarr@hogan.com         | 2020-03-25          | http://www.lawrence.com/    |
+|       4 | 5Cef8BFA16c5e3c | Linda        | Olsen       | Dominguez	Mcmillan and Donovan                 | Bensonview        | Dominican Republic         | 001-808-617-6467x12895 | +1-813-324-8756       | stanleyblackwell@benson.org | 2020-06-02          | http://www.good-lyons.com/  |
+|       5 | 053d585Ab6b3159 | Joanna       | Bender      | Martin	Lang and Andrade                 | West Priscilla    | Slovakia (Slovak Republic) | 001-234-203-0635x76146 | 001-199-446-3860x3486 | colinalvarado@miles.net     | 2021-04-17          | https://goodwin-ingram.com/ |
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v2/csv-too-few-columns.csv.itxt b/tests/data/groundtruth/docling_v2/csv-too-few-columns.csv.itxt
new file mode 100644
index 00000000..e4b7895f
--- /dev/null
+++ b/tests/data/groundtruth/docling_v2/csv-too-few-columns.csv.itxt
@@ -0,0 +1,2 @@
+item-0 at level 0: unspecified: group _root_
+  item-1 at level 1: table with [5x4]
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v2/csv-too-few-columns.csv.json b/tests/data/groundtruth/docling_v2/csv-too-few-columns.csv.json
new file mode 100644
index 00000000..e1275895
--- /dev/null
+++ b/tests/data/groundtruth/docling_v2/csv-too-few-columns.csv.json
@@ -0,0 +1,535 @@
+{
+  "schema_name": "DoclingDocument",
+  "version": "1.1.0",
+  "name": "csv-too-few-columns",
+  "origin": {
+    "mimetype": "text/csv",
+    "binary_hash": 6079936590967298763,
+    "filename": "csv-too-few-columns.csv"
+  },
+  "furniture": {
+    "self_ref": "#/furniture",
+    "children": [],
+    "content_layer": "furniture",
+    "name": "_root_",
+    "label": "unspecified"
+  },
+  "body": {
+    "self_ref": "#/body",
+    "children": [
+      {
+        "$ref": "#/tables/0"
+      }
+    ],
+    "content_layer": "body",
+    "name": "_root_",
+    "label": "unspecified"
+  },
+  "groups": [],
+  "texts": [],
+  "pictures": [],
+  "tables": [
+    {
+      "self_ref": "#/tables/0",
+      "parent": {
+        "$ref": "#/body"
+      },
+      "children": [],
+      "content_layer": "body",
+      "label": "table",
+      "prov": [],
+      "captions": [],
+      "references": [],
+      "footnotes": [],
+      "data": {
+        "table_cells": [
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 0,
+            "end_row_offset_idx": 1,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 1,
+            "text": "1",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 0,
+            "end_row_offset_idx": 1,
+            "start_col_offset_idx": 1,
+            "end_col_offset_idx": 2,
+            "text": "2",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 0,
+            "end_row_offset_idx": 1,
+            "start_col_offset_idx": 2,
+            "end_col_offset_idx": 3,
+            "text": "3",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 0,
+            "end_row_offset_idx": 1,
+            "start_col_offset_idx": 3,
+            "end_col_offset_idx": 4,
+            "text": "4",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 1,
+            "end_row_offset_idx": 2,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 1,
+            "text": "a",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 1,
+            "end_row_offset_idx": 2,
+            "start_col_offset_idx": 1,
+            "end_col_offset_idx": 2,
+            "text": "'b'",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 1,
+            "end_row_offset_idx": 2,
+            "start_col_offset_idx": 2,
+            "end_col_offset_idx": 3,
+            "text": "c",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 1,
+            "end_row_offset_idx": 2,
+            "start_col_offset_idx": 3,
+            "end_col_offset_idx": 4,
+            "text": "d",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 2,
+            "end_row_offset_idx": 3,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 1,
+            "text": "a",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 2,
+            "end_row_offset_idx": 3,
+            "start_col_offset_idx": 1,
+            "end_col_offset_idx": 2,
+            "text": "b",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 2,
+            "end_row_offset_idx": 3,
+            "start_col_offset_idx": 2,
+            "end_col_offset_idx": 3,
+            "text": "c",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 3,
+            "end_row_offset_idx": 4,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 1,
+            "text": "a",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 3,
+            "end_row_offset_idx": 4,
+            "start_col_offset_idx": 1,
+            "end_col_offset_idx": 2,
+            "text": "b",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 3,
+            "end_row_offset_idx": 4,
+            "start_col_offset_idx": 2,
+            "end_col_offset_idx": 3,
+            "text": "c",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 3,
+            "end_row_offset_idx": 4,
+            "start_col_offset_idx": 3,
+            "end_col_offset_idx": 4,
+            "text": "d",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 4,
+            "end_row_offset_idx": 5,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 1,
+            "text": "a",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 4,
+            "end_row_offset_idx": 5,
+            "start_col_offset_idx": 1,
+            "end_col_offset_idx": 2,
+            "text": "b",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 4,
+            "end_row_offset_idx": 5,
+            "start_col_offset_idx": 2,
+            "end_col_offset_idx": 3,
+            "text": "c",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 4,
+            "end_row_offset_idx": 5,
+            "start_col_offset_idx": 3,
+            "end_col_offset_idx": 4,
+            "text": "d",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          }
+        ],
+        "num_rows": 5,
+        "num_cols": 4,
+        "grid": [
+          [
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 0,
+              "end_row_offset_idx": 1,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "1",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 0,
+              "end_row_offset_idx": 1,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 2,
+              "text": "2",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 0,
+              "end_row_offset_idx": 1,
+              "start_col_offset_idx": 2,
+              "end_col_offset_idx": 3,
+              "text": "3",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 0,
+              "end_row_offset_idx": 1,
+              "start_col_offset_idx": 3,
+              "end_col_offset_idx": 4,
+              "text": "4",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ],
+          [
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 1,
+              "end_row_offset_idx": 2,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "a",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 1,
+              "end_row_offset_idx": 2,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 2,
+              "text": "'b'",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 1,
+              "end_row_offset_idx": 2,
+              "start_col_offset_idx": 2,
+              "end_col_offset_idx": 3,
+              "text": "c",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 1,
+              "end_row_offset_idx": 2,
+              "start_col_offset_idx": 3,
+              "end_col_offset_idx": 4,
+              "text": "d",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ],
+          [
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 2,
+              "end_row_offset_idx": 3,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "a",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 2,
+              "end_row_offset_idx": 3,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 2,
+              "text": "b",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 2,
+              "end_row_offset_idx": 3,
+              "start_col_offset_idx": 2,
+              "end_col_offset_idx": 3,
+              "text": "c",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 2,
+              "end_row_offset_idx": 3,
+              "start_col_offset_idx": 3,
+              "end_col_offset_idx": 4,
+              "text": "",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ],
+          [
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 3,
+              "end_row_offset_idx": 4,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "a",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 3,
+              "end_row_offset_idx": 4,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 2,
+              "text": "b",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 3,
+              "end_row_offset_idx": 4,
+              "start_col_offset_idx": 2,
+              "end_col_offset_idx": 3,
+              "text": "c",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 3,
+              "end_row_offset_idx": 4,
+              "start_col_offset_idx": 3,
+              "end_col_offset_idx": 4,
+              "text": "d",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ],
+          [
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 4,
+              "end_row_offset_idx": 5,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "a",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 4,
+              "end_row_offset_idx": 5,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 2,
+              "text": "b",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 4,
+              "end_row_offset_idx": 5,
+              "start_col_offset_idx": 2,
+              "end_col_offset_idx": 3,
+              "text": "c",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 4,
+              "end_row_offset_idx": 5,
+              "start_col_offset_idx": 3,
+              "end_col_offset_idx": 4,
+              "text": "d",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ]
+        ]
+      }
+    }
+  ],
+  "key_value_items": [],
+  "form_items": [],
+  "pages": {}
+}
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v2/csv-too-few-columns.csv.md b/tests/data/groundtruth/docling_v2/csv-too-few-columns.csv.md
new file mode 100644
index 00000000..7c113cb5
--- /dev/null
+++ b/tests/data/groundtruth/docling_v2/csv-too-few-columns.csv.md
@@ -0,0 +1,6 @@
+| 1   | 2   | 3   | 4   |
+|-----|-----|-----|-----|
+| a   | 'b' | c   | d   |
+| a   | b   | c   |     |
+| a   | b   | c   | d   |
+| a   | b   | c   | d   |
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v2/csv-too-many-columns.csv.itxt b/tests/data/groundtruth/docling_v2/csv-too-many-columns.csv.itxt
new file mode 100644
index 00000000..694a52eb
--- /dev/null
+++ b/tests/data/groundtruth/docling_v2/csv-too-many-columns.csv.itxt
@@ -0,0 +1,2 @@
+item-0 at level 0: unspecified: group _root_
+  item-1 at level 1: table with [5x5]
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v2/csv-too-many-columns.csv.json b/tests/data/groundtruth/docling_v2/csv-too-many-columns.csv.json
new file mode 100644
index 00000000..6df1ac90
--- /dev/null
+++ b/tests/data/groundtruth/docling_v2/csv-too-many-columns.csv.json
@@ -0,0 +1,619 @@
+{
+  "schema_name": "DoclingDocument",
+  "version": "1.1.0",
+  "name": "csv-too-many-columns",
+  "origin": {
+    "mimetype": "text/csv",
+    "binary_hash": 10142252432152444595,
+    "filename": "csv-too-many-columns.csv"
+  },
+  "furniture": {
+    "self_ref": "#/furniture",
+    "children": [],
+    "content_layer": "furniture",
+    "name": "_root_",
+    "label": "unspecified"
+  },
+  "body": {
+    "self_ref": "#/body",
+    "children": [
+      {
+        "$ref": "#/tables/0"
+      }
+    ],
+    "content_layer": "body",
+    "name": "_root_",
+    "label": "unspecified"
+  },
+  "groups": [],
+  "texts": [],
+  "pictures": [],
+  "tables": [
+    {
+      "self_ref": "#/tables/0",
+      "parent": {
+        "$ref": "#/body"
+      },
+      "children": [],
+      "content_layer": "body",
+      "label": "table",
+      "prov": [],
+      "captions": [],
+      "references": [],
+      "footnotes": [],
+      "data": {
+        "table_cells": [
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 0,
+            "end_row_offset_idx": 1,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 1,
+            "text": "1",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 0,
+            "end_row_offset_idx": 1,
+            "start_col_offset_idx": 1,
+            "end_col_offset_idx": 2,
+            "text": "2",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 0,
+            "end_row_offset_idx": 1,
+            "start_col_offset_idx": 2,
+            "end_col_offset_idx": 3,
+            "text": "3",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 0,
+            "end_row_offset_idx": 1,
+            "start_col_offset_idx": 3,
+            "end_col_offset_idx": 4,
+            "text": "4",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 1,
+            "end_row_offset_idx": 2,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 1,
+            "text": "a",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 1,
+            "end_row_offset_idx": 2,
+            "start_col_offset_idx": 1,
+            "end_col_offset_idx": 2,
+            "text": "b",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 1,
+            "end_row_offset_idx": 2,
+            "start_col_offset_idx": 2,
+            "end_col_offset_idx": 3,
+            "text": "c",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 1,
+            "end_row_offset_idx": 2,
+            "start_col_offset_idx": 3,
+            "end_col_offset_idx": 4,
+            "text": "d",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 2,
+            "end_row_offset_idx": 3,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 1,
+            "text": "a",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 2,
+            "end_row_offset_idx": 3,
+            "start_col_offset_idx": 1,
+            "end_col_offset_idx": 2,
+            "text": "b",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 2,
+            "end_row_offset_idx": 3,
+            "start_col_offset_idx": 2,
+            "end_col_offset_idx": 3,
+            "text": "c",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 2,
+            "end_row_offset_idx": 3,
+            "start_col_offset_idx": 3,
+            "end_col_offset_idx": 4,
+            "text": "d",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 2,
+            "end_row_offset_idx": 3,
+            "start_col_offset_idx": 4,
+            "end_col_offset_idx": 5,
+            "text": "e",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 3,
+            "end_row_offset_idx": 4,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 1,
+            "text": "a",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 3,
+            "end_row_offset_idx": 4,
+            "start_col_offset_idx": 1,
+            "end_col_offset_idx": 2,
+            "text": "b",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 3,
+            "end_row_offset_idx": 4,
+            "start_col_offset_idx": 2,
+            "end_col_offset_idx": 3,
+            "text": "c",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 3,
+            "end_row_offset_idx": 4,
+            "start_col_offset_idx": 3,
+            "end_col_offset_idx": 4,
+            "text": "d",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 4,
+            "end_row_offset_idx": 5,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 1,
+            "text": "a",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 4,
+            "end_row_offset_idx": 5,
+            "start_col_offset_idx": 1,
+            "end_col_offset_idx": 2,
+            "text": "b",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 4,
+            "end_row_offset_idx": 5,
+            "start_col_offset_idx": 2,
+            "end_col_offset_idx": 3,
+            "text": "c",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 4,
+            "end_row_offset_idx": 5,
+            "start_col_offset_idx": 3,
+            "end_col_offset_idx": 4,
+            "text": "d",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          }
+        ],
+        "num_rows": 5,
+        "num_cols": 5,
+        "grid": [
+          [
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 0,
+              "end_row_offset_idx": 1,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "1",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 0,
+              "end_row_offset_idx": 1,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 2,
+              "text": "2",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 0,
+              "end_row_offset_idx": 1,
+              "start_col_offset_idx": 2,
+              "end_col_offset_idx": 3,
+              "text": "3",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 0,
+              "end_row_offset_idx": 1,
+              "start_col_offset_idx": 3,
+              "end_col_offset_idx": 4,
+              "text": "4",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 0,
+              "end_row_offset_idx": 1,
+              "start_col_offset_idx": 4,
+              "end_col_offset_idx": 5,
+              "text": "",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ],
+          [
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 1,
+              "end_row_offset_idx": 2,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "a",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 1,
+              "end_row_offset_idx": 2,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 2,
+              "text": "b",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 1,
+              "end_row_offset_idx": 2,
+              "start_col_offset_idx": 2,
+              "end_col_offset_idx": 3,
+              "text": "c",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 1,
+              "end_row_offset_idx": 2,
+              "start_col_offset_idx": 3,
+              "end_col_offset_idx": 4,
+              "text": "d",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 1,
+              "end_row_offset_idx": 2,
+              "start_col_offset_idx": 4,
+              "end_col_offset_idx": 5,
+              "text": "",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ],
+          [
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 2,
+              "end_row_offset_idx": 3,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "a",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 2,
+              "end_row_offset_idx": 3,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 2,
+              "text": "b",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 2,
+              "end_row_offset_idx": 3,
+              "start_col_offset_idx": 2,
+              "end_col_offset_idx": 3,
+              "text": "c",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 2,
+              "end_row_offset_idx": 3,
+              "start_col_offset_idx": 3,
+              "end_col_offset_idx": 4,
+              "text": "d",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 2,
+              "end_row_offset_idx": 3,
+              "start_col_offset_idx": 4,
+              "end_col_offset_idx": 5,
+              "text": "e",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ],
+          [
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 3,
+              "end_row_offset_idx": 4,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "a",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 3,
+              "end_row_offset_idx": 4,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 2,
+              "text": "b",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 3,
+              "end_row_offset_idx": 4,
+              "start_col_offset_idx": 2,
+              "end_col_offset_idx": 3,
+              "text": "c",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 3,
+              "end_row_offset_idx": 4,
+              "start_col_offset_idx": 3,
+              "end_col_offset_idx": 4,
+              "text": "d",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 3,
+              "end_row_offset_idx": 4,
+              "start_col_offset_idx": 4,
+              "end_col_offset_idx": 5,
+              "text": "",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ],
+          [
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 4,
+              "end_row_offset_idx": 5,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "a",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 4,
+              "end_row_offset_idx": 5,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 2,
+              "text": "b",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 4,
+              "end_row_offset_idx": 5,
+              "start_col_offset_idx": 2,
+              "end_col_offset_idx": 3,
+              "text": "c",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 4,
+              "end_row_offset_idx": 5,
+              "start_col_offset_idx": 3,
+              "end_col_offset_idx": 4,
+              "text": "d",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 4,
+              "end_row_offset_idx": 5,
+              "start_col_offset_idx": 4,
+              "end_col_offset_idx": 5,
+              "text": "",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ]
+        ]
+      }
+    }
+  ],
+  "key_value_items": [],
+  "form_items": [],
+  "pages": {}
+}
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v2/csv-too-many-columns.csv.md b/tests/data/groundtruth/docling_v2/csv-too-many-columns.csv.md
new file mode 100644
index 00000000..57416116
--- /dev/null
+++ b/tests/data/groundtruth/docling_v2/csv-too-many-columns.csv.md
@@ -0,0 +1,6 @@
+| 1   | 2   | 3   | 4   |    |
+|-----|-----|-----|-----|----|
+| a   | b   | c   | d   |    |
+| a   | b   | c   | d   | e  |
+| a   | b   | c   | d   |    |
+| a   | b   | c   | d   |    |
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v2/elife-56337.xml.itxt b/tests/data/groundtruth/docling_v2/elife-56337.xml.itxt
index 5c0dec30..0ae8a87f 100644
--- a/tests/data/groundtruth/docling_v2/elife-56337.xml.itxt
+++ b/tests/data/groundtruth/docling_v2/elife-56337.xml.itxt
@@ -1,165 +1,149 @@
 item-0 at level 0: unspecified: group _root_
   item-1 at level 1: title: KRAB-zinc finger protein gene ex ... retrotransposons in the murine lineage
-    item-2 at level 2: paragraph: Wolf Gernot; 1: The Eunice Kenne ... tes of Health: Bethesda: United States
-    item-3 at level 2: section_header: Abstract
-      item-4 at level 3: text: The Krüppel-associated box zinc  ... edundant role restricting TE activity.
-    item-5 at level 2: section_header: Introduction
-      item-6 at level 3: text: Nearly half of the human and mou ... s are active beyond early development.
-      item-7 at level 3: text: TEs, especially long terminal re ... f evolutionarily young KRAB-ZFP genes.
-    item-8 at level 2: section_header: Results
-      item-9 at level 3: section_header: Mouse KRAB-ZFPs target retrotransposons
-        item-10 at level 4: text: We analyzed the RNA expression p ... duplications (Kauzlaric et al., 2017).
-        item-11 at level 4: text: To determine the binding sites o ... ctive in the early embryo (Figure 1A).
-        item-12 at level 4: text: We generally observed that KRAB- ... responsible for this silencing effect.
-        item-13 at level 4: text: To further test the hypothesis t ... t easily evade repression by mutation.
-        item-14 at level 4: text: Our KRAB-ZFP ChIP-seq dataset al ... ntirely shift the mode of DNA binding.
-      item-15 at level 3: section_header: Genetic deletion of KRAB-ZFP gen ...  leads to retrotransposon reactivation
-        item-16 at level 4: text: The majority of KRAB-ZFP genes a ... ung et al., 2014; Deniz et al., 2018).
-      item-17 at level 3: section_header: KRAB-ZFP cluster deletions license TE-borne enhancers
-        item-18 at level 4: text: We next used our RNA-seq dataset ... vating effects of TEs on nearby genes.
-        item-19 at level 4: text: While we generally observed that ... he internal region and not on the LTR.
-      item-20 at level 3: section_header: ETn retrotransposition in Chr4-cl KO and WT mice
-        item-21 at level 4: text: IAP, ETn/ETnERV and MuLV/RLTR4 r ... s may contribute to reduced viability.
-        item-22 at level 4: text: We reasoned that retrotransposon ... Tn insertions at a high recovery rate.
-        item-23 at level 4: text: Using this dataset, we first con ... nsertions in our pedigree (Figure 4A).
-        item-24 at level 4: text: To validate some of the novel ET ... ess might have truncated this element.
-        item-25 at level 4: text: Besides novel ETn insertions tha ... tions (Figure 4—figure supplement 3D).
-        item-26 at level 4: text: Finally, we asked whether there  ... s clearly also play an important role.
-    item-27 at level 2: section_header: Discussion
-      item-28 at level 3: text: C2H2 zinc finger proteins, about ... ) depending upon their insertion site.
-      item-29 at level 3: text: Despite a lack of widespread ETn ... ion of the majority of KRAB-ZFP genes.
-    item-30 at level 2: section_header: Materials and methods
-      item-31 at level 3: section_header: Cell lines and transgenic mice
-        item-32 at level 4: text: Mouse ES cells and F9 EC cells w ... KO/KO and KO/WT (B6/129 F2) offspring.
-      item-33 at level 3: section_header: Generation of KRAB-ZFP expressing cell lines
-        item-34 at level 4: text: KRAB-ZFP ORFs were PCR-amplified ... led and further expanded for ChIP-seq.
-      item-35 at level 3: section_header: CRISPR/Cas9 mediated deletion of KRAB-ZFP clusters and an MMETn insertion
-        item-36 at level 4: text: All gRNAs were expressed from th ... PCR genotyping (Supplementary file 3).
-      item-37 at level 3: section_header: ChIP-seq analysis
-        item-38 at level 4: text: For ChIP-seq analysis of KRAB-ZF ... 010 or Khil et al., 2012 respectively.
-        item-39 at level 4: text: ChIP-seq libraries were construc ...  were re-mapped using Bowtie (--best).
-      item-40 at level 3: section_header: Luciferase reporter assays
-        item-41 at level 4: text: For KRAB-ZFP repression assays,  ... after transfection as described above.
-      item-42 at level 3: section_header: RNA-seq analysis
-        item-43 at level 4: text: Whole RNA was purified using RNe ... lemented in the R function p.adjust().
-      item-44 at level 3: section_header: Reduced representation bisulfite sequencing (RRBS-seq)
-        item-45 at level 4: text: For RRBS-seq analysis, Chr4-cl W ... h sample were considered for analysis.
-      item-46 at level 3: section_header: Retrotransposition assay
-        item-47 at level 4: text: The retrotransposition vectors p ... were stained with Amido Black (Sigma).
-      item-48 at level 3: section_header: Capture-seq screen
-        item-49 at level 4: text: To identify novel retrotransposo ... assembly using the Unicycler software.
-    item-50 at level 2: section_header: Tables
-      item-51 at level 3: table with [9x5]
-        item-51 at level 4: caption: Table 1.: * Number of protein-coding KRAB-ZFP genes identified in a previously published screen (Imbeault et al., 2017) and the ChIP-seq data column indicates the number of KRAB-ZFPs for which ChIP-seq was performed in this study.
-      item-52 at level 3: table with [31x5]
-        item-52 at level 4: caption: Key resources table: 
-    item-53 at level 2: section_header: Figures
-      item-54 at level 3: picture
-        item-54 at level 4: caption: Figure 1.: Genome-wide binding patterns of mouse KRAB-ZFPs.
-(A) Probability heatmap of KRAB-ZFP binding to TEs. Blue color intensity (main field) corresponds to -log10 (adjusted p-value) enrichment of ChIP-seq peak overlap with TE groups (Fisher’s exact test). The green/red color intensity (top panel) represents mean KAP1 (GEO accession: GSM1406445) and H3K9me3 (GEO accession: GSM1327148) enrichment (respectively) at peaks overlapping significantly targeted TEs (adjusted p-value<1e-5) in WT ES cells. (B) Summarized ChIP-seq signal for indicated KRAB-ZFPs and previously published KAP1 and H3K9me3 in WT ES cells across 127 intact ETn elements. (C) Heatmaps of KRAB-ZFP ChIP-seq signal at ChIP-seq peaks. For better comparison, peaks for all three KRAB-ZFPs were called with the same parameters (p<1e-10, peak enrichment >20). The top panel shows a schematic of the arrangement of the contact amino acid composition of each zinc finger. Zinc fingers are grouped and colored according to similarity, with amino acid differences relative to the five consensus fingers highlighted in white.
-Figure 1—source data 1.KRAB-ZFP expression in 40 mouse tissues and cell lines (ENCODE).Mean values of replicates are shown as log2 transcripts per million.
-Figure 1—source data 2.Probability heatmap of KRAB-ZFP binding to TEs.Values corresponds to -log10 (adjusted p-value) enrichment of ChIP-seq peak overlap with TE groups (Fisher’s exact test).
-      item-55 at level 3: picture
-        item-55 at level 4: caption: Figure 1—figure supplement 1.: ES cell-specific expression of KRAB-ZFP gene clusters.
-(A) Heatmap showing expression patterns of mouse KRAB-ZFPs in 40 mouse tissues and cell lines (ENCODE). Heatmap colors indicate gene expression levels in log2 transcripts per million (TPM). The asterisk indicates a group of 30 KRAB-ZFPs that are exclusively expressed in ES cells. (B) Physical location of the genes encoding for the 30 KRAB-ZFPs that are exclusively expressed in ES cells. (C) Phylogenetic (Maximum likelihood) tree of the KRAB domains of mouse KRAB-ZFPs. KRAB-ZFPs encoded on the gene clusters on chromosome 2 and 4 are highlighted. The scale bar at the bottom indicates amino acid substitutions per site.
-      item-56 at level 3: picture
-        item-56 at level 4: caption: Figure 1—figure supplement 2.: KRAB-ZFP binding motifs and their repression activity.
-(A) Comparison of computationally predicted (bottom) and experimentally determined (top) KRAB-ZFP binding motifs. Only significant pairs are shown (FDR < 0.1). (B) Luciferase reporter assays to confirm KRAB-ZFP repression of the identified target sites. Bars show the luciferase activity (normalized to Renilla luciferase) of reporter plasmids containing the indicated target sites cloned upstream of the SV40 promoter. Reporter plasmids were co-transfected into 293 T cells with a Renilla luciferase plasmid for normalization and plasmids expressing the targeting KRAB-ZFP. Normalized mean luciferase activity (from three replicates) is shown relative to luciferase activity of the reporter plasmid co-transfected with an empty pcDNA3.1 vector.
-      item-57 at level 3: picture
-        item-57 at level 4: caption: Figure 1—figure supplement 3.: KRAB-ZFP binding to ETn retrotransposons.
-(A) Comparison of the PBSLys1,2 sequence with Zfp961 binding motifs in nonrepetitive peaks (Nonrep) and peaks at ETn elements. (B) Retrotransposition assays of original (ETnI1-neoTNF and MusD2-neoTNF Ribet et al., 2004) and modified reporter vectors where the Rex2 or Gm13051 binding motifs where removed. Schematic of reporter vectors are displayed at the top. HeLa cells were transfected as described in the Materials and Methods section and neo-resistant colonies, indicating retrotransposition events, were selected and stained. (C) Stem-loop structure of the ETn RNA export signal, the Gm13051 motif on the corresponding DNA is marked with red circles, the part of the motif that was deleted is indicated with grey crosses (adapted from Legiewicz et al., 2010).
-      item-58 at level 3: picture
-        item-58 at level 4: caption: Figure 2.: Retrotransposon reactivation in KRAB-ZFP cluster KO ES cells.
-(A) RNA-seq analysis of TE expression in five KRAB-ZFP cluster KO ES cells. Green and grey squares on top of the panel represent KRAB-ZFPs with or without ChIP-seq data, respectively, within each deleted gene cluster. Reactivated TEs that are bound by one or several KRAB-ZFPs are indicated by green squares in the panel. Significantly up- and downregulated elements (adjusted p-value<0.05) are highlighted in red and green, respectively. (B) Differential KAP1 binding and H3K9me3 enrichment at TE groups (summarized across all insertions) in Chr2-cl and Chr4-cl KO ES cells. TE groups targeted by one or several KRAB-ZFPs encoded within the deleted clusters are highlighted in blue (differential enrichment over the entire TE sequences) and red (differential enrichment at TE regions that overlap with KRAB-ZFP ChIP-seq peaks). (C) DNA methylation status of CpG sites at indicated TE groups in WT and Chr4-cl KO ES cells grown in serum containing media or in hypomethylation-inducing media (2i + Vitamin C). P-values were calculated using paired t-test.
-Figure 2—source data 1.Differential H3K9me3 and KAP1 distribution in WT and KRAB-ZFP cluster KO ES cells at TE families and KRAB-ZFP bound TE insertions.Differential read counts and statistical testing were determined by DESeq2.
-      item-59 at level 3: picture
-        item-59 at level 4: caption: Figure 2—figure supplement 1.: Epigenetic changes at TEs and TE-borne enhancers in KRAB-ZFP cluster KO ES cells.
-(A) Differential analysis of summative (all individual insertions combined) H3K9me3 enrichment at TE groups in Chr10-cl, Chr13.1-cl and Chr13.2-cl KO ES cells. TE groups targeted by one or several KRAB-ZFPs encoded within the deleted clusters are highlighted in orange (differential enrichment over the entire TE sequences) and red (differential enrichment at TE regions that overlap with KRAB-ZFP ChIP-seq peaks). (B) Top: Schematic view of the Cd59a/Cd59b locus with a 5’ truncated ETn insertion. ChIP-seq (Input subtracted from ChIP) data for overexpressed epitope-tagged Gm13051 (a Chr4-cl KRAB-ZFP) in F9 EC cells, and re-mapped KAP1 (GEO accession: GSM1406445) and H3K9me3 (GEO accession: GSM1327148) in WT ES cells are shown together with RNA-seq data from Chr4-cl WT and KO ES cells (mapped using Bowtie (-a -m 1 --strata -v 2) to exclude reads that cannot be uniquely mapped). Bottom: Transcriptional activity of a 5 kb fragment with or without fragments of the ETn insertion was tested by luciferase reporter assay in Chr4-cl WT and KO ES cells.
-      item-60 at level 3: picture
-        item-60 at level 4: caption: Figure 3.: TE-dependent gene activation in KRAB-ZFP cluster KO ES cells.
-(A) Differential gene expression in Chr2-cl and Chr4-cl KO ES cells. Significantly up- and downregulated genes (adjusted p-value<0.05) are highlighted in red and green, respectively, KRAB-ZFP genes within the deleted clusters are shown in blue. (B) Correlation of TEs and gene deregulation. Plots show enrichment of TE groups within 100 kb of up- and downregulated genes relative to all genes. Significantly overrepresented LTR and LINE groups (adjusted p-value<0.1) are highlighted in blue and red, respectively. (C) Schematic view of the downstream region of Chst1 where a 5’ truncated ETn insertion is located. ChIP-seq (Input subtracted from ChIP) data for overexpressed epitope-tagged Gm13051 (a Chr4-cl KRAB-ZFP) in F9 EC cells, and re-mapped KAP1 (GEO accession: GSM1406445) and H3K9me3 (GEO accession: GSM1327148) in WT ES cells are shown together with RNA-seq data from Chr4-cl WT and KO ES cells (mapped using Bowtie (-a -m 1 --strata -v 2) to exclude reads that cannot be uniquely mapped). (D) RT-qPCR analysis of Chst1 mRNA expression in Chr4-cl WT and KO ES cells with or without the CRISPR/Cas9 deleted ETn insertion near Chst1. Values represent mean expression (normalized to Gapdh) from three biological replicates per sample (each performed in three technical replicates) in arbitrary units. Error bars represent standard deviation and asterisks indicate significance (p<0.01, Student’s t-test). n.s.: not significant. (E) Mean coverage of ChIP-seq data (Input subtracted from ChIP) in Chr4-cl WT and KO ES cells over 127 full-length ETn insertions. The binding sites of the Chr4-cl KRAB-ZFPs Rex2 and Gm13051 are indicated by dashed lines.
-      item-61 at level 3: picture
-        item-61 at level 4: caption: Figure 4.: ETn retrotransposition in Chr4-cl KO mice.
-(A) Pedigree of mice used for transposon insertion screening by capture-seq in mice of different strain backgrounds. The number of novel ETn insertions (only present in one animal) are indicated. For animals whose direct ancestors have not been screened, the ETn insertions are shown in parentheses since parental inheritance cannot be excluded in that case. Germ line insertions are indicated by asterisks. All DNA samples were prepared from tail tissues unless noted (-S: spleen, -E: ear, -B:Blood) (B) Statistical analysis of ETn insertion frequency in tail tissue from 30 Chr4-cl KO, KO/WT and WT mice that were derived from one Chr4-c KO x KO/WT and two Chr4-cl KO/WT x KO/WT matings. Only DNA samples that were collected from juvenile tails were considered for this analysis. P-values were calculated using one-sided Wilcoxon Rank Sum Test. In the last panel, KO, WT and KO/WT mice derived from all matings were combined for the statistical analysis.
-Figure 4—source data 1.Coordinates of identified novel ETn insertions and supporting capture-seq read counts.Genomic regions indicate cluster of supporting reads.
-Figure 4—source data 2.Sequences of capture-seq probes used to enrich genomic DNA for ETn and MuLV (RLTR4) insertions.
-      item-62 at level 3: picture
-        item-62 at level 4: caption: Figure 4—figure supplement 1.: Birth statistics of KRAB-ZFP cluster KO mice and TE reactivation in adult tissues.
-(A) Birth statistics of Chr4- and Chr2-cl mice derived from KO/WT x KO/WT matings in different strain backgrounds. (B) RNA-seq analysis of TE expression in Chr2- (left) and Chr4-cl (right) KO tissues. TE groups with the highest reactivation phenotype in ES cells are shown separately. Significantly up- and downregulated elements (adjusted p-value<0.05) are highlighted in red and green, respectively. Experiments were performed in at least two biological replicates.
-      item-63 at level 3: picture
-        item-63 at level 4: caption: Figure 4—figure supplement 2.: Identification of polymorphic ETn and MuLV retrotransposon insertions in Chr4-cl KO and WT mice.
-Heatmaps show normalized capture-seq read counts in RPM (Read Per Million) for identified polymorphic ETn (A) and MuLV (B) loci in different mouse strains. Only loci with strong support for germ line ETn or MuLV insertions (at least 100 or 3000 ETn or MuLV RPM, respectively) in at least two animals are shown. Non-polymorphic insertion loci with high read counts in all screened mice were excluded for better visibility. The sample information (sample name and cell type/tissue) is annotated at the bottom, with the strain information indicated by color at the top. The color gradient indicates log10(RPM+1).
-      item-64 at level 3: picture
-        item-64 at level 4: caption: Figure 4—figure supplement 3.: Confirmation of novel ETn insertions identified by capture-seq.
-(A) PCR validation of novel ETn insertions in genomic DNA of three littermates (IDs: T09673, T09674 and T00436) and their parents (T3913 and T3921). Primer sequences are shown in Supplementary file 3. (B) ETn capture-seq read counts (RPM) at putative novel somatic (loci identified exclusively in one single animal), novel germ line (loci identified in several littermates) insertions, and at B6 reference ETn elements. (C) Heatmap shows capture-seq read counts (RPM) of a Chr4-cl KO mouse (ID: C6733) as determined in different tissues. Each row represents a novel ETn locus that was identified in at least one tissue. The color gradient indicates log10(RPM+1). (D) Heatmap shows the capture-seq RPM in technical replicates using the same Chr4-cl KO DNA sample (rep1/rep2) or replicates with DNA samples prepared from different sections of the tail from the same mouse at different ages (tail1/tail2). Each row represents a novel ETn locus that was identified in at least one of the displayed samples. The color gradient indicates log10(RPM+1).
-    item-65 at level 2: section_header: References
-      item-66 at level 3: list: group list
-        item-67 at level 4: list_item: TL Bailey; M Boden; FA Buske; M  ... arching. Nucleic Acids Research (2009)
-        item-68 at level 4: list_item: C Baust; L Gagnier; GJ Baillie;  ...  the mouse. Journal of Virology (2003)
-        item-69 at level 4: list_item: K Blaschke; KT Ebata; MM Karimi; ... -like state in ES cells. Nature (2013)
-        item-70 at level 4: list_item: A Brodziak; E Ziółko; M Muc-Wier ... erimental and Clinical Research (2012)
-        item-71 at level 4: list_item: N Castro-Diaz; G Ecco; A Colucci ... stem cells. Genes & Development (2014)
-        item-72 at level 4: list_item: EB Chuong; NC Elde; C Feschotte. ... ndogenous retroviruses. Science (2016)
-        item-73 at level 4: list_item: J Dan; Y Liu; N Liu; M Chiourea; ... n silencing. Developmental Cell (2014)
-        item-74 at level 4: list_item: A De Iaco; E Planet; A Coluccio; ... cental mammals. Nature Genetics (2017)
-        item-75 at level 4: list_item: Ö Deniz; L de la Rica; KCL Cheng ... onic stem cells. Genome Biology (2018)
-        item-76 at level 4: list_item: M Dewannieux; T Heidmann. Endoge ... rs. Current Opinion in Virology (2013)
-        item-77 at level 4: list_item: G Ecco; M Cassano; A Kauzlaric;  ... ult tissues. Developmental Cell (2016)
-        item-78 at level 4: list_item: G Ecco; M Imbeault; D Trono. KRAB zinc finger proteins. Development (2017)
-        item-79 at level 4: list_item: JA Frank; C Feschotte. Co-option ... on. Current Opinion in Virology (2017)
-        item-80 at level 4: list_item: L Gagnier; VP Belancio; DL Mager ... ansposon insertions. Mobile DNA (2019)
-        item-81 at level 4: list_item: AC Groner; S Meylan; A Ciuffi; N ... omatin spreading. PLOS Genetics (2010)
-        item-82 at level 4: list_item: DC Hancks; HH Kazazian. Roles fo ... ns in human disease. Mobile DNA (2016)
-        item-83 at level 4: list_item: M Imbeault; PY Helleboid; D Tron ... ene regulatory networks. Nature (2017)
-        item-84 at level 4: list_item: FM Jacobs; D Greenberg; N Nguyen ... SVA/L1 retrotransposons. Nature (2014)
-        item-85 at level 4: list_item: H Kano; H Kurahashi; T Toda. Gen ... e dactylaplasia phenotype. PNAS (2007)
-        item-86 at level 4: list_item: MM Karimi; P Goyal; IA Maksakova ... cripts in mESCs. Cell Stem Cell (2011)
-        item-87 at level 4: list_item: A Kauzlaric; G Ecco; M Cassano;  ... related genetic units. PLOS ONE (2017)
-        item-88 at level 4: list_item: PP Khil; F Smagulova; KM Brick;  ... ction of ssDNA. Genome Research (2012)
-        item-89 at level 4: list_item: F Krueger; SR Andrews. Bismark:  ... eq applications. Bioinformatics (2011)
-        item-90 at level 4: list_item: B Langmead; SL Salzberg. Fast ga ... t with bowtie 2. Nature Methods (2012)
-        item-91 at level 4: list_item: M Legiewicz; AS Zolotukhin; GR P ... Journal of Biological Chemistry (2010)
-        item-92 at level 4: list_item: JA Lehoczky; PE Thomas; KM Patri ... n Polypodia mice. PLOS Genetics (2013)
-        item-93 at level 4: list_item: D Leung; T Du; U Wagner; W Xie;  ...  methyltransferase Setdb1. PNAS (2014)
-        item-94 at level 4: list_item: J Lilue; AG Doran; IT Fiddes; M  ... unctional loci. Nature Genetics (2018)
-        item-95 at level 4: list_item: S Liu; J Brind'Amour; MM Karimi; ... germ cells. Genes & Development (2014)
-        item-96 at level 4: list_item: MI Love; W Huber; S Anders. Mode ... ata with DESeq2. Genome Biology (2014)
-        item-97 at level 4: list_item: F Lugani; R Arora; N Papeta; A P ... short tail mouse. PLOS Genetics (2013)
-        item-98 at level 4: list_item: TS Macfarlan; WD Gifford; S Dris ... ous retrovirus activity. Nature (2012)
-        item-99 at level 4: list_item: IA Maksakova; MT Romanish; L Gag ...  mouse germ line. PLOS Genetics (2006)
-        item-100 at level 4: list_item: T Matsui; D Leung; H Miyashita;  ...  methyltransferase ESET. Nature (2010)
-        item-101 at level 4: list_item: HS Najafabadi; S Mnaimneh; FW Sc ... y lexicon. Nature Biotechnology (2015)
-        item-102 at level 4: list_item: C Nellåker; TM Keane; B Yalcin;  ... 8 mouse strains. Genome Biology (2012)
-        item-103 at level 4: list_item: H O'Geen; S Frietze; PJ Farnham. ... s. Methods in Molecular Biology (2010)
-        item-104 at level 4: list_item: A Patel; P Yang; M Tinkham; M Pr ... ndem zinc finger proteins. Cell (2018)
-        item-105 at level 4: list_item: D Ribet; M Dewannieux; T Heidman ... s-mobilization. Genome Research (2004)
-        item-106 at level 4: list_item: SR Richardson; P Gerdes; DJ Gerh ... d early embryo. Genome Research (2017)
-        item-107 at level 4: list_item: HM Rowe; J Jakobsson; D Mesnard; ... in embryonic stem cells. Nature (2010)
-        item-108 at level 4: list_item: HM Rowe; A Kapopoulou; A Corsino ... nic stem cells. Genome Research (2013)
-        item-109 at level 4: list_item: SN Schauer; PE Carreira; R Shukl ... carcinogenesis. Genome Research (2018)
-        item-110 at level 4: list_item: DC Schultz; K Ayyanathan; D Nego ... r proteins. Genes & Development (2002)
-        item-111 at level 4: list_item: K Semba; K Araki; K Matsumoto; H ...  short tail mice. PLOS Genetics (2013)
-        item-112 at level 4: list_item: SP Sripathy; J Stevens; DC Schul ...  Molecular and Cellular Biology (2006)
-        item-113 at level 4: list_item: JH Thomas; S Schneider. Coevolut ... c finger genes. Genome Research (2011)
-        item-114 at level 4: list_item: PJ Thompson; TS Macfarlan; MC Lo ... tory repertoire. Molecular Cell (2016)
-        item-115 at level 4: list_item: RS Treger; SD Pope; Y Kong; M To ... irus expression SNERV. Immunity (2019)
-        item-116 at level 4: list_item: CN Vlangos; AN Siuniak; D Robins ... Ptf1a expression. PLOS Genetics (2013)
-        item-117 at level 4: list_item: J Wang; G Xie; M Singh; AT Ghanb ... s naive-like stem cells. Nature (2014)
-        item-118 at level 4: list_item: D Wolf; K Hug; SP Goff. TRIM28 m ... iruses in embryonic cells. PNAS (2008)
-        item-119 at level 4: list_item: G Wolf; D Greenberg; TS Macfarla ... ger protein family. Mobile DNA (2015a)
-        item-120 at level 4: list_item: G Wolf; P Yang; AC Füchtbauer; E ... roviruses. Genes & Development (2015b)
-        item-121 at level 4: list_item: M Yamauchi; B Freitag; C Khan; B ...  silencers. Journal of Virology (1995)
-        item-122 at level 4: list_item: Y Zhang; T Liu; CA Meyer; J Eeck ... ChIP-Seq (MACS). Genome Biology (2008)
-  item-123 at level 1: caption: Table 1.: * Number of protein-co ...  ChIP-seq was performed in this study.
-  item-124 at level 1: caption: Key resources table: 
-  item-125 at level 1: caption: Figure 1.: Genome-wide binding p ...  with TE groups (Fisher’s exact test).
-  item-126 at level 1: caption: Figure 1—figure supplement 1.: E ... tes amino acid substitutions per site.
-  item-127 at level 1: caption: Figure 1—figure supplement 2.: K ... sfected with an empty pcDNA3.1 vector.
-  item-128 at level 1: caption: Figure 1—figure supplement 3.: K ... (adapted from Legiewicz et al., 2010).
-  item-129 at level 1: caption: Figure 2.: Retrotransposon react ... cal testing were determined by DESeq2.
-  item-130 at level 1: caption: Figure 2—figure supplement 1.: E ... r assay in Chr4-cl WT and KO ES cells.
-  item-131 at level 1: caption: Figure 3.: TE-dependent gene act ... Gm13051 are indicated by dashed lines.
-  item-132 at level 1: caption: Figure 4.: ETn retrotranspositio ... A for ETn and MuLV (RLTR4) insertions.
-  item-133 at level 1: caption: Figure 4—figure supplement 1.: B ... in at least two biological replicates.
-  item-134 at level 1: caption: Figure 4—figure supplement 2.: I ... color gradient indicates log10(RPM+1).
-  item-135 at level 1: caption: Figure 4—figure supplement 3.: C ... color gradient indicates log10(RPM+1).
\ No newline at end of file
+    item-2 at level 2: paragraph: Gernot Wolf, Alberto de Iaco, Mi ...  Ralls, Didier Trono, Todd S Macfarlan
+    item-3 at level 2: paragraph: The Eunice Kennedy Shriver Natio ... Lausanne (EPFL), Lausanne, Switzerland
+    item-4 at level 2: section_header: Abstract
+      item-5 at level 3: text: The Krüppel-associated box zinc  ... edundant role restricting TE activity.
+    item-6 at level 2: section_header: Introduction
+      item-7 at level 3: text: Nearly half of the human and mou ... s are active beyond early development.
+      item-8 at level 3: text: TEs, especially long terminal re ... f evolutionarily young KRAB-ZFP genes.
+    item-9 at level 2: section_header: Results
+      item-10 at level 3: section_header: Mouse KRAB-ZFPs target retrotransposons
+        item-11 at level 4: text: We analyzed the RNA expression p ... duplications (Kauzlaric et al., 2017).
+        item-12 at level 4: text: To determine the binding sites o ... ctive in the early embryo (Figure 1A).
+        item-13 at level 4: picture
+          item-13 at level 5: caption: Figure 1. Genome-wide binding patterns of mouse KRAB-ZFPs. (A) Probability heatmap of KRAB-ZFP binding to TEs. Blue color intensity (main field) corresponds to -log10 (adjusted p-value) enrichment of ChIP-seq peak overlap with TE groups (Fisher’s exact test). The green/red color intensity (top panel) represents mean KAP1 (GEO accession: GSM1406445) and H3K9me3 (GEO accession: GSM1327148) enrichment (respectively) at peaks overlapping significantly targeted TEs (adjusted p-value<1e-5) in WT ES cells. (B) Summarized ChIP-seq signal for indicated KRAB-ZFPs and previously published KAP1 and H3K9me3 in WT ES cells across 127 intact ETn elements. (C) Heatmaps of KRAB-ZFP ChIP-seq signal at ChIP-seq peaks. For better comparison, peaks for all three KRAB-ZFPs were called with the same parameters (p<1e-10, peak enrichment >20). The top panel shows a schematic of the arrangement of the contact amino acid composition of each zinc finger. Zinc fingers are grouped and colored according to similarity, with amino acid differences relative to the five consensus fingers highlighted in white.
+        item-14 at level 4: table with [9x5]
+          item-14 at level 5: caption: Table 1. KRAB-ZFP genes clusters in the mouse genome that were investigated in this study. * Number of protein-coding KRAB-ZFP genes identified in a previously published screen (Imbeault et al., 2017) and the ChIP-seq data column indicates the number of KRAB-ZFPs for which ChIP-seq was performed in this study.
+        item-15 at level 4: text: We generally observed that KRAB- ... responsible for this silencing effect.
+        item-16 at level 4: text: To further test the hypothesis t ... t easily evade repression by mutation.
+        item-17 at level 4: text: Our KRAB-ZFP ChIP-seq dataset al ... ntirely shift the mode of DNA binding.
+      item-18 at level 3: section_header: Genetic deletion of KRAB-ZFP gen ...  leads to retrotransposon reactivation
+        item-19 at level 4: text: The majority of KRAB-ZFP genes a ... ung et al., 2014; Deniz et al., 2018).
+        item-20 at level 4: picture
+          item-20 at level 5: caption: Figure 2. Retrotransposon reactivation in KRAB-ZFP cluster KO ES cells. (A) RNA-seq analysis of TE expression in five KRAB-ZFP cluster KO ES cells. Green and grey squares on top of the panel represent KRAB-ZFPs with or without ChIP-seq data, respectively, within each deleted gene cluster. Reactivated TEs that are bound by one or several KRAB-ZFPs are indicated by green squares in the panel. Significantly up- and downregulated elements (adjusted p-value<0.05) are highlighted in red and green, respectively. (B) Differential KAP1 binding and H3K9me3 enrichment at TE groups (summarized across all insertions) in Chr2-cl and Chr4-cl KO ES cells. TE groups targeted by one or several KRAB-ZFPs encoded within the deleted clusters are highlighted in blue (differential enrichment over the entire TE sequences) and red (differential enrichment at TE regions that overlap with KRAB-ZFP ChIP-seq peaks). (C) DNA methylation status of CpG sites at indicated TE groups in WT and Chr4-cl KO ES cells grown in serum containing media or in hypomethylation-inducing media (2i + Vitamin C). P-values were calculated using paired t-test.
+      item-21 at level 3: section_header: KRAB-ZFP cluster deletions license TE-borne enhancers
+        item-22 at level 4: text: We next used our RNA-seq dataset ... vating effects of TEs on nearby genes.
+        item-23 at level 4: picture
+          item-23 at level 5: caption: Figure 3. TE-dependent gene activation in KRAB-ZFP cluster KO ES cells. (A) Differential gene expression in Chr2-cl and Chr4-cl KO ES cells. Significantly up- and downregulated genes (adjusted p-value<0.05) are highlighted in red and green, respectively, KRAB-ZFP genes within the deleted clusters are shown in blue. (B) Correlation of TEs and gene deregulation. Plots show enrichment of TE groups within 100 kb of up- and downregulated genes relative to all genes. Significantly overrepresented LTR and LINE groups (adjusted p-value<0.1) are highlighted in blue and red, respectively. (C) Schematic view of the downstream region of Chst1 where a 5’ truncated ETn insertion is located. ChIP-seq (Input subtracted from ChIP) data for overexpressed epitope-tagged Gm13051 (a Chr4-cl KRAB-ZFP) in F9 EC cells, and re-mapped KAP1 (GEO accession: GSM1406445) and H3K9me3 (GEO accession: GSM1327148) in WT ES cells are shown together with RNA-seq data from Chr4-cl WT and KO ES cells (mapped using Bowtie (-a -m 1 --strata -v 2) to exclude reads that cannot be uniquely mapped). (D) RT-qPCR analysis of Chst1 mRNA expression in Chr4-cl WT and KO ES cells with or without the CRISPR/Cas9 deleted ETn insertion near Chst1. Values represent mean expression (normalized to Gapdh) from three biological replicates per sample (each performed in three technical replicates) in arbitrary units. Error bars represent standard deviation and asterisks indicate significance (p<0.01, Student’s t-test). n.s.: not significant. (E) Mean coverage of ChIP-seq data (Input subtracted from ChIP) in Chr4-cl WT and KO ES cells over 127 full-length ETn insertions. The binding sites of the Chr4-cl KRAB-ZFPs Rex2 and Gm13051 are indicated by dashed lines.
+        item-24 at level 4: text: While we generally observed that ... he internal region and not on the LTR.
+      item-25 at level 3: section_header: ETn retrotransposition in Chr4-cl KO and WT mice
+        item-26 at level 4: text: IAP, ETn/ETnERV and MuLV/RLTR4 r ... s may contribute to reduced viability.
+        item-27 at level 4: text: We reasoned that retrotransposon ... Tn insertions at a high recovery rate.
+        item-28 at level 4: text: Using this dataset, we first con ... nsertions in our pedigree (Figure 4A).
+        item-29 at level 4: picture
+          item-29 at level 5: caption: Figure 4. ETn retrotransposition in Chr4-cl KO mice. (A) Pedigree of mice used for transposon insertion screening by capture-seq in mice of different strain backgrounds. The number of novel ETn insertions (only present in one animal) are indicated. For animals whose direct ancestors have not been screened, the ETn insertions are shown in parentheses since parental inheritance cannot be excluded in that case. Germ line insertions are indicated by asterisks. All DNA samples were prepared from tail tissues unless noted (-S: spleen, -E: ear, -B:Blood) (B) Statistical analysis of ETn insertion frequency in tail tissue from 30 Chr4-cl KO, KO/WT and WT mice that were derived from one Chr4-c KO x KO/WT and two Chr4-cl KO/WT x KO/WT matings. Only DNA samples that were collected from juvenile tails were considered for this analysis. P-values were calculated using one-sided Wilcoxon Rank Sum Test. In the last panel, KO, WT and KO/WT mice derived from all matings were combined for the statistical analysis.
+        item-30 at level 4: text: To validate some of the novel ET ... ess might have truncated this element.
+        item-31 at level 4: text: Besides novel ETn insertions tha ... tions (Figure 4—figure supplement 3D).
+        item-32 at level 4: text: Finally, we asked whether there  ... s clearly also play an important role.
+    item-33 at level 2: section_header: Discussion
+      item-34 at level 3: text: C2H2 zinc finger proteins, about ... ) depending upon their insertion site.
+      item-35 at level 3: text: Despite a lack of widespread ETn ... ion of the majority of KRAB-ZFP genes.
+    item-36 at level 2: section_header: Materials and methods
+      item-37 at level 3: table with [31x5]
+        item-37 at level 4: caption: Key resources table
+      item-38 at level 3: section_header: Cell lines and transgenic mice
+        item-39 at level 4: text: Mouse ES cells and F9 EC cells w ... KO/KO and KO/WT (B6/129 F2) offspring.
+      item-40 at level 3: section_header: Generation of KRAB-ZFP expressing cell lines
+        item-41 at level 4: text: KRAB-ZFP ORFs were PCR-amplified ... led and further expanded for ChIP-seq.
+      item-42 at level 3: section_header: CRISPR/Cas9 mediated deletion of KRAB-ZFP clusters and an MMETn insertion
+        item-43 at level 4: text: All gRNAs were expressed from th ... PCR genotyping (Supplementary file 3).
+      item-44 at level 3: section_header: ChIP-seq analysis
+        item-45 at level 4: text: For ChIP-seq analysis of KRAB-ZF ... 010 or Khil et al., 2012 respectively.
+        item-46 at level 4: text: ChIP-seq libraries were construc ...  were re-mapped using Bowtie (--best).
+      item-47 at level 3: section_header: Luciferase reporter assays
+        item-48 at level 4: text: For KRAB-ZFP repression assays,  ... after transfection as described above.
+      item-49 at level 3: section_header: RNA-seq analysis
+        item-50 at level 4: text: Whole RNA was purified using RNe ... lemented in the R function p.adjust().
+      item-51 at level 3: section_header: Reduced representation bisulfite sequencing (RRBS-seq)
+        item-52 at level 4: text: For RRBS-seq analysis, Chr4-cl W ... h sample were considered for analysis.
+      item-53 at level 3: section_header: Retrotransposition assay
+        item-54 at level 4: text: The retrotransposition vectors p ... were stained with Amido Black (Sigma).
+      item-55 at level 3: section_header: Capture-seq screen
+        item-56 at level 4: text: To identify novel retrotransposo ... assembly using the Unicycler software.
+    item-57 at level 2: section_header: Funding Information
+      item-58 at level 3: text: This paper was supported by the following grants:
+      item-59 at level 3: list: group list
+        item-60 at level 4: list_item: http://dx.doi.org/10.13039/10000 ... ment 1ZIAHD008933 to Todd S Macfarlan.
+        item-61 at level 4: list_item: http://dx.doi.org/10.13039/50110 ... ndation 310030_152879 to Didier Trono.
+        item-62 at level 4: list_item: http://dx.doi.org/10.13039/50110 ... dation 310030B_173337 to Didier Trono.
+        item-63 at level 4: list_item: http://dx.doi.org/10.13039/50110 ... ch Council No. 268721 to Didier Trono.
+        item-64 at level 4: list_item: http://dx.doi.org/10.13039/50110 ... rch Council No 694658 to Didier Trono.
+    item-65 at level 2: section_header: Acknowledgements
+      item-66 at level 3: text: We thank Alex Grinberg, Jeanne Y ...  268721; Transpos-X, No. 694658) (DT).
+    item-67 at level 2: section_header: Additional information
+    item-68 at level 2: section_header: Additional files
+    item-69 at level 2: section_header: Data availability
+      item-70 at level 3: text: All NGS data has been deposited  ... GenBank database (MH449667- MH449669).
+      item-71 at level 3: text: The following datasets were generated:
+      item-72 at level 3: text: Wolf G. Retrotransposon reactiva ... ession Omnibus (2019). NCBI: GSE115291
+      item-73 at level 3: text: Wolf G. Mus musculus musculus st ... e. NCBI GenBank (2019). NCBI: MH449667
+      item-74 at level 3: text: Wolf G. Mus musculus musculus st ... e. NCBI GenBank (2019). NCBI: MH449668
+      item-75 at level 3: text: Wolf G. Mus musculus musculus st ... e. NCBI GenBank (2019). NCBI: MH449669
+      item-76 at level 3: text: The following previously published datasets were used:
+      item-77 at level 3: text: Castro-Diaz N, Ecco G, Coluccio  ... ssion Omnibus (2014). NCBI: GSM1406445
+      item-78 at level 3: text: Andrew ZX. H3K9me3_ChIPSeq (Ctrl ... ssion Omnibus (2014). NCBI: GSM1327148
+    item-79 at level 2: section_header: References
+      item-80 at level 3: list: group list
+        item-81 at level 4: list_item: Bailey TL, Boden M, Buske FA, Fr ... OI: 10.1093/nar/gkp335, PMID: 19458158
+        item-82 at level 4: list_item: Baust C, Gagnier L, Baillie GJ,  ... 77.21.11448-11458.2003, PMID: 14557630
+        item-83 at level 4: list_item: Blaschke K, Ebata KT, Karimi MM, ... I: 10.1038/nature12362, PMID: 23812591
+        item-84 at level 4: list_item: Brodziak A, Ziółko E, Muc-Wierzg ... I: 10.12659/msm.882892, PMID: 22648263
+        item-85 at level 4: list_item: Castro-Diaz N, Ecco G, Coluccio  ... 10.1101/gad.241661.114, PMID: 24939876
+        item-86 at level 4: list_item: Chuong EB, Elde NC, Feschotte C. ... 0.1126/science.aad5497, PMID: 26941318
+        item-87 at level 4: list_item: Dan J, Liu Y, Liu N, Chiourea M, ... 6/j.devcel.2014.03.004, PMID: 24735877
+        item-88 at level 4: list_item: De Iaco A, Planet E, Coluccio A, ... . DOI: 10.1038/ng.3858, PMID: 28459456
+        item-89 at level 4: list_item: Deniz Ö, de la Rica L, Cheng KCL ... 1186/s13059-017-1376-y, PMID: 29351814
+        item-90 at level 4: list_item: Dewannieux M, Heidmann T. Endoge ... 6/j.coviro.2013.08.005, PMID: 24004725
+        item-91 at level 4: list_item: Ecco G, Cassano M, Kauzlaric A,  ... 6/j.devcel.2016.02.024, PMID: 27003935
+        item-92 at level 4: list_item: Ecco G, Imbeault M, Trono D. KRA ... OI: 10.1242/dev.132605, PMID: 28765213
+        item-93 at level 4: list_item: Frank JA, Feschotte C. Co-option ... 6/j.coviro.2017.07.021, PMID: 28818736
+        item-94 at level 4: list_item: Gagnier L, Belancio VP, Mager DL ... 1186/s13100-019-0157-4, PMID: 31011371
+        item-95 at level 4: list_item: Groner AC, Meylan S, Ciuffi A, Z ... 1/journal.pgen.1000869, PMID: 20221260
+        item-96 at level 4: list_item: Hancks DC, Kazazian HH. Roles fo ... 1186/s13100-016-0065-9, PMID: 27158268
+        item-97 at level 4: list_item: Imbeault M, Helleboid PY, Trono  ... I: 10.1038/nature21683, PMID: 28273063
+        item-98 at level 4: list_item: Jacobs FM, Greenberg D, Nguyen N ... I: 10.1038/nature13760, PMID: 25274305
+        item-99 at level 4: list_item: Kano H, Kurahashi H, Toda T. Gen ... 0.1073/pnas.0705483104, PMID: 17984064
+        item-100 at level 4: list_item: Karimi MM, Goyal P, Maksakova IA ... 016/j.stem.2011.04.004, PMID: 21624812
+        item-101 at level 4: list_item: Kauzlaric A, Ecco G, Cassano M,  ... 1/journal.pone.0173746, PMID: 28334004
+        item-102 at level 4: list_item: Khil PP, Smagulova F, Brick KM,  ...  10.1101/gr.130583.111, PMID: 22367190
+        item-103 at level 4: list_item: Krueger F, Andrews SR. Bismark:  ... /bioinformatics/btr167, PMID: 21493656
+        item-104 at level 4: list_item: Langmead B, Salzberg SL. Fast ga ... OI: 10.1038/nmeth.1923, PMID: 22388286
+        item-105 at level 4: list_item: Legiewicz M, Zolotukhin AS, Pilk ... 0.1074/jbc.M110.182840, PMID: 20978285
+        item-106 at level 4: list_item: Lehoczky JA, Thomas PE, Patrie K ... 1/journal.pgen.1003967, PMID: 24339789
+        item-107 at level 4: list_item: Leung D, Du T, Wagner U, Xie W,  ... 0.1073/pnas.1322273111, PMID: 24757056
+        item-108 at level 4: list_item: Lilue J, Doran AG, Fiddes IT, Ab ... 1038/s41588-018-0223-8, PMID: 30275530
+        item-109 at level 4: list_item: Liu S, Brind'Amour J, Karimi MM, ... 10.1101/gad.244848.114, PMID: 25228647
+        item-110 at level 4: list_item: Love MI, Huber W, Anders S. Mode ... 1186/s13059-014-0550-8, PMID: 25516281
+        item-111 at level 4: list_item: Lugani F, Arora R, Papeta N, Pat ... 1/journal.pgen.1003206, PMID: 23437001
+        item-112 at level 4: list_item: Macfarlan TS, Gifford WD, Drisco ... I: 10.1038/nature11244, PMID: 22722858
+        item-113 at level 4: list_item: Maksakova IA, Romanish MT, Gagni ... 1/journal.pgen.0020002, PMID: 16440055
+        item-114 at level 4: list_item: Matsui T, Leung D, Miyashita H,  ... I: 10.1038/nature08858, PMID: 20164836
+        item-115 at level 4: list_item: Najafabadi HS, Mnaimneh S, Schmi ...  DOI: 10.1038/nbt.3128, PMID: 25690854
+        item-116 at level 4: list_item: Nellåker C, Keane TM, Yalcin B,  ... .1186/gb-2012-13-6-r45, PMID: 22703977
+        item-117 at level 4: list_item: O'Geen H, Frietze S, Farnham PJ. ... 7/978-1-60761-753-2_27, PMID: 20680851
+        item-118 at level 4: list_item: Patel A, Yang P, Tinkham M, Prad ... 016/j.cell.2018.02.058, PMID: 29551271
+        item-119 at level 4: list_item: Ribet D, Dewannieux M, Heidmann  ... OI: 10.1101/gr.2924904, PMID: 15479948
+        item-120 at level 4: list_item: Richardson SR, Gerdes P, Gerhard ...  10.1101/gr.219022.116, PMID: 28483779
+        item-121 at level 4: list_item: Rowe HM, Jakobsson J, Mesnard D, ... I: 10.1038/nature08674, PMID: 20075919
+        item-122 at level 4: list_item: Rowe HM, Kapopoulou A, Corsinott ...  10.1101/gr.147678.112, PMID: 23233547
+        item-123 at level 4: list_item: Schauer SN, Carreira PE, Shukla  ...  10.1101/gr.226993.117, PMID: 29643204
+        item-124 at level 4: list_item: Schultz DC, Ayyanathan K, Negore ... OI: 10.1101/gad.973302, PMID: 11959841
+        item-125 at level 4: list_item: Semba K, Araki K, Matsumoto K, S ... 1/journal.pgen.1003204, PMID: 23436999
+        item-126 at level 4: list_item: Sripathy SP, Stevens J, Schultz  ... : 10.1128/MCB.00487-06, PMID: 16954381
+        item-127 at level 4: list_item: Thomas JH, Schneider S. Coevolut ...  10.1101/gr.121749.111, PMID: 21784874
+        item-128 at level 4: list_item: Thompson PJ, Macfarlan TS, Lorin ... 6/j.molcel.2016.03.029, PMID: 27259207
+        item-129 at level 4: list_item: Treger RS, Pope SD, Kong Y, Toku ... 6/j.immuni.2018.12.022, PMID: 30709743
+        item-130 at level 4: list_item: Vlangos CN, Siuniak AN, Robinson ... 1/journal.pgen.1003205, PMID: 23437000
+        item-131 at level 4: list_item: Wang J, Xie G, Singh M, Ghanbari ... I: 10.1038/nature13804, PMID: 25317556
+        item-132 at level 4: list_item: Wolf D, Hug K, Goff SP. TRIM28 m ... 0.1073/pnas.0805540105, PMID: 18713861
+        item-133 at level 4: list_item: Wolf G, Greenberg D, Macfarlan T ... 1186/s13100-015-0050-8, PMID: 26435754
+        item-134 at level 4: list_item: Wolf G, Yang P, Füchtbauer AC, F ... 10.1101/gad.252767.114, PMID: 25737282
+        item-135 at level 4: list_item: Yamauchi M, Freitag B, Khan C, B ... JVI.69.2.1142-1149.1995, PMID: 7529329
+        item-136 at level 4: list_item: Zhang Y, Liu T, Meyer CA, Eeckho ... .1186/gb-2008-9-9-r137, PMID: 18798982
+  item-137 at level 1: caption: Figure 1. Genome-wide binding pa ... onsensus fingers highlighted in white.
+  item-138 at level 1: caption: Table 1. KRAB-ZFP genes clusters ...  ChIP-seq was performed in this study.
+  item-139 at level 1: caption: Figure 2. Retrotransposon reacti ... s were calculated using paired t-test.
+  item-140 at level 1: caption: Figure 3. TE-dependent gene acti ... Gm13051 are indicated by dashed lines.
+  item-141 at level 1: caption: Figure 4. ETn retrotransposition ... combined for the statistical analysis.
+  item-142 at level 1: caption: Key resources table
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v2/elife-56337.xml.json b/tests/data/groundtruth/docling_v2/elife-56337.xml.json
deleted file mode 100644
index 63b89d7a..00000000
--- a/tests/data/groundtruth/docling_v2/elife-56337.xml.json
+++ /dev/null
@@ -1,7049 +0,0 @@
-{
-  "schema_name": "DoclingDocument",
-  "version": "1.0.0",
-  "name": "elife-56337",
-  "origin": {
-    "mimetype": "application/xml",
-    "binary_hash": 16010266569878923058,
-    "filename": "elife-56337.xml"
-  },
-  "furniture": {
-    "self_ref": "#/furniture",
-    "children": [],
-    "name": "_root_",
-    "label": "unspecified"
-  },
-  "body": {
-    "self_ref": "#/body",
-    "children": [
-      {
-        "$ref": "#/texts/0"
-      },
-      {
-        "$ref": "#/texts/50"
-      },
-      {
-        "$ref": "#/texts/51"
-      },
-      {
-        "$ref": "#/texts/53"
-      },
-      {
-        "$ref": "#/texts/54"
-      },
-      {
-        "$ref": "#/texts/55"
-      },
-      {
-        "$ref": "#/texts/56"
-      },
-      {
-        "$ref": "#/texts/57"
-      },
-      {
-        "$ref": "#/texts/58"
-      },
-      {
-        "$ref": "#/texts/59"
-      },
-      {
-        "$ref": "#/texts/60"
-      },
-      {
-        "$ref": "#/texts/61"
-      },
-      {
-        "$ref": "#/texts/62"
-      },
-      {
-        "$ref": "#/texts/63"
-      }
-    ],
-    "name": "_root_",
-    "label": "unspecified"
-  },
-  "groups": [
-    {
-      "self_ref": "#/groups/0",
-      "parent": {
-        "$ref": "#/texts/64"
-      },
-      "children": [
-        {
-          "$ref": "#/texts/65"
-        },
-        {
-          "$ref": "#/texts/66"
-        },
-        {
-          "$ref": "#/texts/67"
-        },
-        {
-          "$ref": "#/texts/68"
-        },
-        {
-          "$ref": "#/texts/69"
-        },
-        {
-          "$ref": "#/texts/70"
-        },
-        {
-          "$ref": "#/texts/71"
-        },
-        {
-          "$ref": "#/texts/72"
-        },
-        {
-          "$ref": "#/texts/73"
-        },
-        {
-          "$ref": "#/texts/74"
-        },
-        {
-          "$ref": "#/texts/75"
-        },
-        {
-          "$ref": "#/texts/76"
-        },
-        {
-          "$ref": "#/texts/77"
-        },
-        {
-          "$ref": "#/texts/78"
-        },
-        {
-          "$ref": "#/texts/79"
-        },
-        {
-          "$ref": "#/texts/80"
-        },
-        {
-          "$ref": "#/texts/81"
-        },
-        {
-          "$ref": "#/texts/82"
-        },
-        {
-          "$ref": "#/texts/83"
-        },
-        {
-          "$ref": "#/texts/84"
-        },
-        {
-          "$ref": "#/texts/85"
-        },
-        {
-          "$ref": "#/texts/86"
-        },
-        {
-          "$ref": "#/texts/87"
-        },
-        {
-          "$ref": "#/texts/88"
-        },
-        {
-          "$ref": "#/texts/89"
-        },
-        {
-          "$ref": "#/texts/90"
-        },
-        {
-          "$ref": "#/texts/91"
-        },
-        {
-          "$ref": "#/texts/92"
-        },
-        {
-          "$ref": "#/texts/93"
-        },
-        {
-          "$ref": "#/texts/94"
-        },
-        {
-          "$ref": "#/texts/95"
-        },
-        {
-          "$ref": "#/texts/96"
-        },
-        {
-          "$ref": "#/texts/97"
-        },
-        {
-          "$ref": "#/texts/98"
-        },
-        {
-          "$ref": "#/texts/99"
-        },
-        {
-          "$ref": "#/texts/100"
-        },
-        {
-          "$ref": "#/texts/101"
-        },
-        {
-          "$ref": "#/texts/102"
-        },
-        {
-          "$ref": "#/texts/103"
-        },
-        {
-          "$ref": "#/texts/104"
-        },
-        {
-          "$ref": "#/texts/105"
-        },
-        {
-          "$ref": "#/texts/106"
-        },
-        {
-          "$ref": "#/texts/107"
-        },
-        {
-          "$ref": "#/texts/108"
-        },
-        {
-          "$ref": "#/texts/109"
-        },
-        {
-          "$ref": "#/texts/110"
-        },
-        {
-          "$ref": "#/texts/111"
-        },
-        {
-          "$ref": "#/texts/112"
-        },
-        {
-          "$ref": "#/texts/113"
-        },
-        {
-          "$ref": "#/texts/114"
-        },
-        {
-          "$ref": "#/texts/115"
-        },
-        {
-          "$ref": "#/texts/116"
-        },
-        {
-          "$ref": "#/texts/117"
-        },
-        {
-          "$ref": "#/texts/118"
-        },
-        {
-          "$ref": "#/texts/119"
-        },
-        {
-          "$ref": "#/texts/120"
-        }
-      ],
-      "name": "list",
-      "label": "list"
-    }
-  ],
-  "texts": [
-    {
-      "self_ref": "#/texts/0",
-      "parent": {
-        "$ref": "#/body"
-      },
-      "children": [
-        {
-          "$ref": "#/texts/1"
-        },
-        {
-          "$ref": "#/texts/2"
-        },
-        {
-          "$ref": "#/texts/4"
-        },
-        {
-          "$ref": "#/texts/7"
-        },
-        {
-          "$ref": "#/texts/26"
-        },
-        {
-          "$ref": "#/texts/29"
-        },
-        {
-          "$ref": "#/texts/49"
-        },
-        {
-          "$ref": "#/texts/52"
-        },
-        {
-          "$ref": "#/texts/64"
-        }
-      ],
-      "label": "title",
-      "prov": [],
-      "orig": "KRAB-zinc finger protein gene expansion in response to active retrotransposons in the murine lineage",
-      "text": "KRAB-zinc finger protein gene expansion in response to active retrotransposons in the murine lineage"
-    },
-    {
-      "self_ref": "#/texts/1",
-      "parent": {
-        "$ref": "#/texts/0"
-      },
-      "children": [],
-      "label": "paragraph",
-      "prov": [],
-      "orig": "Wolf Gernot; 1: The Eunice Kennedy Shriver National Institute of Child Health and Human Development, The National Institutes of Health: Bethesda: United States; de Iaco Alberto; 2: School of Life Sciences, \u00c9cole Polytechnique F\u00e9d\u00e9rale de Lausanne (EPFL): Lausanne: Switzerland; Sun Ming-An; 1: The Eunice Kennedy Shriver National Institute of Child Health and Human Development, The National Institutes of Health: Bethesda: United States; Bruno Melania; 1: The Eunice Kennedy Shriver National Institute of Child Health and Human Development, The National Institutes of Health: Bethesda: United States; Tinkham Matthew; 1: The Eunice Kennedy Shriver National Institute of Child Health and Human Development, The National Institutes of Health: Bethesda: United States; Hoang Don; 1: The Eunice Kennedy Shriver National Institute of Child Health and Human Development, The National Institutes of Health: Bethesda: United States; Mitra Apratim; 1: The Eunice Kennedy Shriver National Institute of Child Health and Human Development, The National Institutes of Health: Bethesda: United States; Ralls Sherry; 1: The Eunice Kennedy Shriver National Institute of Child Health and Human Development, The National Institutes of Health: Bethesda: United States; Trono Didier; 2: School of Life Sciences, \u00c9cole Polytechnique F\u00e9d\u00e9rale de Lausanne (EPFL): Lausanne: Switzerland; Macfarlan Todd S; 1: The Eunice Kennedy Shriver National Institute of Child Health and Human Development, The National Institutes of Health: Bethesda: United States",
-      "text": "Wolf Gernot; 1: The Eunice Kennedy Shriver National Institute of Child Health and Human Development, The National Institutes of Health: Bethesda: United States; de Iaco Alberto; 2: School of Life Sciences, \u00c9cole Polytechnique F\u00e9d\u00e9rale de Lausanne (EPFL): Lausanne: Switzerland; Sun Ming-An; 1: The Eunice Kennedy Shriver National Institute of Child Health and Human Development, The National Institutes of Health: Bethesda: United States; Bruno Melania; 1: The Eunice Kennedy Shriver National Institute of Child Health and Human Development, The National Institutes of Health: Bethesda: United States; Tinkham Matthew; 1: The Eunice Kennedy Shriver National Institute of Child Health and Human Development, The National Institutes of Health: Bethesda: United States; Hoang Don; 1: The Eunice Kennedy Shriver National Institute of Child Health and Human Development, The National Institutes of Health: Bethesda: United States; Mitra Apratim; 1: The Eunice Kennedy Shriver National Institute of Child Health and Human Development, The National Institutes of Health: Bethesda: United States; Ralls Sherry; 1: The Eunice Kennedy Shriver National Institute of Child Health and Human Development, The National Institutes of Health: Bethesda: United States; Trono Didier; 2: School of Life Sciences, \u00c9cole Polytechnique F\u00e9d\u00e9rale de Lausanne (EPFL): Lausanne: Switzerland; Macfarlan Todd S; 1: The Eunice Kennedy Shriver National Institute of Child Health and Human Development, The National Institutes of Health: Bethesda: United States"
-    },
-    {
-      "self_ref": "#/texts/2",
-      "parent": {
-        "$ref": "#/texts/0"
-      },
-      "children": [
-        {
-          "$ref": "#/texts/3"
-        }
-      ],
-      "label": "section_header",
-      "prov": [],
-      "orig": "Abstract",
-      "text": "Abstract",
-      "level": 1
-    },
-    {
-      "self_ref": "#/texts/3",
-      "parent": {
-        "$ref": "#/texts/2"
-      },
-      "children": [],
-      "label": "text",
-      "prov": [],
-      "orig": "The Kr\u00fcppel-associated box zinc finger protein (KRAB-ZFP) family diversified in mammals. The majority of human KRAB-ZFPs bind transposable elements (TEs), however, since most TEs are inactive in humans it is unclear whether KRAB-ZFPs emerged to suppress TEs. We demonstrate that many recently emerged murine KRAB-ZFPs also bind to TEs, including the active ETn, IAP, and L1 families. Using a CRISPR/Cas9-based engineering approach, we genetically deleted five large clusters of KRAB-ZFPs and demonstrate that target TEs are de-repressed, unleashing TE-encoded enhancers. Homozygous knockout mice lacking one of two KRAB-ZFP gene clusters on chromosome 2 and chromosome 4 were nonetheless viable. In pedigrees of chromosome 4 cluster KRAB-ZFP mutants, we identified numerous novel ETn insertions with a modest increase in mutants. Our data strongly support the current model that recent waves of retrotransposon activity drove the expansion of KRAB-ZFP genes in mice and that many KRAB-ZFPs play a redundant role restricting TE activity.",
-      "text": "The Kr\u00fcppel-associated box zinc finger protein (KRAB-ZFP) family diversified in mammals. The majority of human KRAB-ZFPs bind transposable elements (TEs), however, since most TEs are inactive in humans it is unclear whether KRAB-ZFPs emerged to suppress TEs. We demonstrate that many recently emerged murine KRAB-ZFPs also bind to TEs, including the active ETn, IAP, and L1 families. Using a CRISPR/Cas9-based engineering approach, we genetically deleted five large clusters of KRAB-ZFPs and demonstrate that target TEs are de-repressed, unleashing TE-encoded enhancers. Homozygous knockout mice lacking one of two KRAB-ZFP gene clusters on chromosome 2 and chromosome 4 were nonetheless viable. In pedigrees of chromosome 4 cluster KRAB-ZFP mutants, we identified numerous novel ETn insertions with a modest increase in mutants. Our data strongly support the current model that recent waves of retrotransposon activity drove the expansion of KRAB-ZFP genes in mice and that many KRAB-ZFPs play a redundant role restricting TE activity."
-    },
-    {
-      "self_ref": "#/texts/4",
-      "parent": {
-        "$ref": "#/texts/0"
-      },
-      "children": [
-        {
-          "$ref": "#/texts/5"
-        },
-        {
-          "$ref": "#/texts/6"
-        }
-      ],
-      "label": "section_header",
-      "prov": [],
-      "orig": "Introduction",
-      "text": "Introduction",
-      "level": 1
-    },
-    {
-      "self_ref": "#/texts/5",
-      "parent": {
-        "$ref": "#/texts/4"
-      },
-      "children": [],
-      "label": "text",
-      "prov": [],
-      "orig": "Nearly half of the human and mouse genomes consist of transposable elements (TEs). TEs shape the evolution of species, serving as a source for genetic innovation (Chuong et al., 2016; Frank and Feschotte, 2017). However, TEs also potentially harm their hosts by insertional mutagenesis, gene deregulation and activation of innate immunity (Maksakova et al., 2006; Kano et al., 2007; Brodziak et al., 2012; Hancks and Kazazian, 2016). To protect themselves from TE activity, host organisms have developed a wide range of defense mechanisms targeting virtually all steps of the TE life cycle (Dewannieux and Heidmann, 2013). In tetrapods, KRAB zinc finger protein (KRAB-ZFP) genes have amplified and diversified, likely in response to TE colonization (Thomas and Schneider, 2011; Najafabadi et al., 2015; Wolf et al., 2015a; Wolf et al., 2015b; Imbeault et al., 2017). Conventional ZFPs bind DNA using tandem arrays of C2H2 zinc finger domains, each capable of specifically interacting with three nucleotides, whereas some zinc fingers can bind two or four nucleotides and include DNA backbone interactions depending on target DNA structure (Patel et al., 2018). This allows KRAB-ZFPs to flexibly bind to large stretches of DNA with high affinity. The KRAB domain binds the corepressor KAP1, which in turn recruits histone modifying enzymes including the NuRD histone deacetylase complex and the H3K9-specific methylase SETDB1 (Schultz et al., 2002; Sripathy et al., 2006), which induces persistent and heritable gene silencing (Groner et al., 2010). Deletion of KAP1 (Rowe et al., 2010) or SETDB1 (Matsui et al., 2010) in mouse embryonic stem (ES) cells induces TE reactivation and cell death, but only minor phenotypes in differentiated cells, suggesting KRAB-ZFPs are most important during early embryogenesis where they mark TEs for stable epigenetic silencing that persists through development. However, SETDB1-containing complexes are also required to repress TEs in primordial germ cells (Liu et al., 2014) and adult tissues (Ecco et al., 2016), indicating KRAB-ZFPs are active beyond early development.",
-      "text": "Nearly half of the human and mouse genomes consist of transposable elements (TEs). TEs shape the evolution of species, serving as a source for genetic innovation (Chuong et al., 2016; Frank and Feschotte, 2017). However, TEs also potentially harm their hosts by insertional mutagenesis, gene deregulation and activation of innate immunity (Maksakova et al., 2006; Kano et al., 2007; Brodziak et al., 2012; Hancks and Kazazian, 2016). To protect themselves from TE activity, host organisms have developed a wide range of defense mechanisms targeting virtually all steps of the TE life cycle (Dewannieux and Heidmann, 2013). In tetrapods, KRAB zinc finger protein (KRAB-ZFP) genes have amplified and diversified, likely in response to TE colonization (Thomas and Schneider, 2011; Najafabadi et al., 2015; Wolf et al., 2015a; Wolf et al., 2015b; Imbeault et al., 2017). Conventional ZFPs bind DNA using tandem arrays of C2H2 zinc finger domains, each capable of specifically interacting with three nucleotides, whereas some zinc fingers can bind two or four nucleotides and include DNA backbone interactions depending on target DNA structure (Patel et al., 2018). This allows KRAB-ZFPs to flexibly bind to large stretches of DNA with high affinity. The KRAB domain binds the corepressor KAP1, which in turn recruits histone modifying enzymes including the NuRD histone deacetylase complex and the H3K9-specific methylase SETDB1 (Schultz et al., 2002; Sripathy et al., 2006), which induces persistent and heritable gene silencing (Groner et al., 2010). Deletion of KAP1 (Rowe et al., 2010) or SETDB1 (Matsui et al., 2010) in mouse embryonic stem (ES) cells induces TE reactivation and cell death, but only minor phenotypes in differentiated cells, suggesting KRAB-ZFPs are most important during early embryogenesis where they mark TEs for stable epigenetic silencing that persists through development. However, SETDB1-containing complexes are also required to repress TEs in primordial germ cells (Liu et al., 2014) and adult tissues (Ecco et al., 2016), indicating KRAB-ZFPs are active beyond early development."
-    },
-    {
-      "self_ref": "#/texts/6",
-      "parent": {
-        "$ref": "#/texts/4"
-      },
-      "children": [],
-      "label": "text",
-      "prov": [],
-      "orig": "TEs, especially long terminal repeat (LTR) retrotransposons, also known as endogenous retroviruses (ERVs), can affect expression of neighboring genes through their promoter and enhancer functions (Macfarlan et al., 2012; Wang et al., 2014; Thompson et al., 2016). KAP1 deletion in mouse ES cells causes rapid gene deregulation (Rowe et al., 2013), indicating that KRAB-ZFPs may regulate gene expression by recruiting KAP1 to TEs. Indeed, Zfp809 knock-out (KO) in mice resulted in transcriptional activation of a handful of genes in various tissues adjacent to ZFP809-targeted VL30-Pro elements (Wolf et al., 2015b). It has therefore been speculated that KRAB-ZFPs bind to TE sequences to domesticate them for gene regulatory innovation (Ecco et al., 2017). This idea is supported by the observation that many human KRAB-ZFPs target TE groups that have lost their coding potential millions of years ago and that KRAB-ZFP target sequences within TEs are in some cases under purifying selection (Imbeault et al., 2017). However, there are also clear signs of an evolutionary arms-race between human TEs and KRAB-ZFPs (Jacobs et al., 2014), indicating that some KRAB-ZFPs may limit TE mobility for stretches of evolutionary time, prior to their ultimate loss from the genome or adaptation for other regulatory functions. Here we use the laboratory mouse, which has undergone a recent expansion of the KRAB-ZFP family, to determine the in vivo requirement of the majority of evolutionarily young KRAB-ZFP genes.",
-      "text": "TEs, especially long terminal repeat (LTR) retrotransposons, also known as endogenous retroviruses (ERVs), can affect expression of neighboring genes through their promoter and enhancer functions (Macfarlan et al., 2012; Wang et al., 2014; Thompson et al., 2016). KAP1 deletion in mouse ES cells causes rapid gene deregulation (Rowe et al., 2013), indicating that KRAB-ZFPs may regulate gene expression by recruiting KAP1 to TEs. Indeed, Zfp809 knock-out (KO) in mice resulted in transcriptional activation of a handful of genes in various tissues adjacent to ZFP809-targeted VL30-Pro elements (Wolf et al., 2015b). It has therefore been speculated that KRAB-ZFPs bind to TE sequences to domesticate them for gene regulatory innovation (Ecco et al., 2017). This idea is supported by the observation that many human KRAB-ZFPs target TE groups that have lost their coding potential millions of years ago and that KRAB-ZFP target sequences within TEs are in some cases under purifying selection (Imbeault et al., 2017). However, there are also clear signs of an evolutionary arms-race between human TEs and KRAB-ZFPs (Jacobs et al., 2014), indicating that some KRAB-ZFPs may limit TE mobility for stretches of evolutionary time, prior to their ultimate loss from the genome or adaptation for other regulatory functions. Here we use the laboratory mouse, which has undergone a recent expansion of the KRAB-ZFP family, to determine the in vivo requirement of the majority of evolutionarily young KRAB-ZFP genes."
-    },
-    {
-      "self_ref": "#/texts/7",
-      "parent": {
-        "$ref": "#/texts/0"
-      },
-      "children": [
-        {
-          "$ref": "#/texts/8"
-        },
-        {
-          "$ref": "#/texts/14"
-        },
-        {
-          "$ref": "#/texts/16"
-        },
-        {
-          "$ref": "#/texts/19"
-        }
-      ],
-      "label": "section_header",
-      "prov": [],
-      "orig": "Results",
-      "text": "Results",
-      "level": 1
-    },
-    {
-      "self_ref": "#/texts/8",
-      "parent": {
-        "$ref": "#/texts/7"
-      },
-      "children": [
-        {
-          "$ref": "#/texts/9"
-        },
-        {
-          "$ref": "#/texts/10"
-        },
-        {
-          "$ref": "#/texts/11"
-        },
-        {
-          "$ref": "#/texts/12"
-        },
-        {
-          "$ref": "#/texts/13"
-        }
-      ],
-      "label": "section_header",
-      "prov": [],
-      "orig": "Mouse KRAB-ZFPs target retrotransposons",
-      "text": "Mouse KRAB-ZFPs target retrotransposons",
-      "level": 1
-    },
-    {
-      "self_ref": "#/texts/9",
-      "parent": {
-        "$ref": "#/texts/8"
-      },
-      "children": [],
-      "label": "text",
-      "prov": [],
-      "orig": "We analyzed the RNA expression profiles of mouse KRAB-ZFPs across a wide range of tissues to identify candidates active in early embryos/ES cells. While the majority of KRAB-ZFPs are expressed at low levels and uniformly across tissues, a group of KRAB-ZFPs are highly and almost exclusively expressed in ES cells (Figure 1\u2014figure supplement 1A). About two thirds of these KRAB-ZFPs are physically linked in two clusters on chromosome 2 (Chr2-cl) and 4 (Chr4-cl) (Figure 1\u2014figure supplement 1B). These two clusters encode 40 and 21 KRAB-ZFP annotated genes, respectively, which, with one exception on Chr4-cl, do not have orthologues in rat or any other sequenced mammals (Supplementary file 1). The KRAB-ZFPs within these two genomic clusters also group together phylogenetically (Figure 1\u2014figure supplement 1C), indicating these gene clusters arose by a series of recent segmental gene duplications (Kauzlaric et al., 2017).",
-      "text": "We analyzed the RNA expression profiles of mouse KRAB-ZFPs across a wide range of tissues to identify candidates active in early embryos/ES cells. While the majority of KRAB-ZFPs are expressed at low levels and uniformly across tissues, a group of KRAB-ZFPs are highly and almost exclusively expressed in ES cells (Figure 1\u2014figure supplement 1A). About two thirds of these KRAB-ZFPs are physically linked in two clusters on chromosome 2 (Chr2-cl) and 4 (Chr4-cl) (Figure 1\u2014figure supplement 1B). These two clusters encode 40 and 21 KRAB-ZFP annotated genes, respectively, which, with one exception on Chr4-cl, do not have orthologues in rat or any other sequenced mammals (Supplementary file 1). The KRAB-ZFPs within these two genomic clusters also group together phylogenetically (Figure 1\u2014figure supplement 1C), indicating these gene clusters arose by a series of recent segmental gene duplications (Kauzlaric et al., 2017)."
-    },
-    {
-      "self_ref": "#/texts/10",
-      "parent": {
-        "$ref": "#/texts/8"
-      },
-      "children": [],
-      "label": "text",
-      "prov": [],
-      "orig": "To determine the binding sites of the KRAB-ZFPs within these and other gene clusters, we expressed epitope-tagged KRAB-ZFPs using stably integrating vectors in mouse embryonic carcinoma (EC) or ES cells (Table 1, Supplementary file 1) and performed chromatin immunoprecipitation followed by deep sequencing (ChIP-seq). We then determined whether the identified binding sites are significantly enriched over annotated TEs and used the non-repetitive peak fraction to identify binding motifs. We discarded 7 of 68 ChIP-seq datasets because we could not obtain a binding motif or a target TE and manual inspection confirmed low signal to noise ratio. Of the remaining 61 KRAB-ZFPs, 51 significantly overlapped at least one TE subfamily (adjusted p-value<1e-5). Altogether, 81 LTR retrotransposon, 18 LINE, 10 SINE and one DNA transposon subfamilies were targeted by at least one of the 51 KRAB-ZFPs (Figure 1A and Supplementary file 1). Chr2-cl KRAB-ZFPs preferably bound IAPEz retrotransposons and L1-type LINEs, while Chr4-cl KRAB-ZFPs targeted various retrotransposons, including the closely related MMETn (hereafter referred to as ETn) and ETnERV (also known as MusD) elements (Figure 1A). ETn elements are non-autonomous LTR retrotransposons that require trans-complementation by the fully coding ETnERV elements that contain Gag, Pro and Pol genes (Ribet et al., 2004). These elements have accumulated to\u00a0~240 and~100 copies in the reference C57BL/6 genome, respectively, with\u00a0~550 solitary LTRs (Baust et al., 2003). Both ETn and ETnERVs are still active, generating polymorphisms and mutations in several mouse strains (Gagnier et al., 2019). The validity of our ChIP-seq screen was confirmed by the identification of binding motifs - which often resembled the computationally predicted motifs (Figure 1\u2014figure supplement 2A) - for the majority of screened KRAB-ZFPs (Supplementary file 1). Moreover, predicted and experimentally determined motifs were found in targeted TEs in most cases (Supplementary file 1), and reporter repression assays confirmed KRAB-ZFP induced silencing for all the tested sequences (Figure 1\u2014figure supplement 2B). Finally, we observed KAP1 and H3K9me3 enrichment at most of the targeted TEs in wild type ES cells, indicating that most of these KRAB-ZFPs are functionally active in the early embryo (Figure 1A).",
-      "text": "To determine the binding sites of the KRAB-ZFPs within these and other gene clusters, we expressed epitope-tagged KRAB-ZFPs using stably integrating vectors in mouse embryonic carcinoma (EC) or ES cells (Table 1, Supplementary file 1) and performed chromatin immunoprecipitation followed by deep sequencing (ChIP-seq). We then determined whether the identified binding sites are significantly enriched over annotated TEs and used the non-repetitive peak fraction to identify binding motifs. We discarded 7 of 68 ChIP-seq datasets because we could not obtain a binding motif or a target TE and manual inspection confirmed low signal to noise ratio. Of the remaining 61 KRAB-ZFPs, 51 significantly overlapped at least one TE subfamily (adjusted p-value<1e-5). Altogether, 81 LTR retrotransposon, 18 LINE, 10 SINE and one DNA transposon subfamilies were targeted by at least one of the 51 KRAB-ZFPs (Figure 1A and Supplementary file 1). Chr2-cl KRAB-ZFPs preferably bound IAPEz retrotransposons and L1-type LINEs, while Chr4-cl KRAB-ZFPs targeted various retrotransposons, including the closely related MMETn (hereafter referred to as ETn) and ETnERV (also known as MusD) elements (Figure 1A). ETn elements are non-autonomous LTR retrotransposons that require trans-complementation by the fully coding ETnERV elements that contain Gag, Pro and Pol genes (Ribet et al., 2004). These elements have accumulated to\u00a0~240 and~100 copies in the reference C57BL/6 genome, respectively, with\u00a0~550 solitary LTRs (Baust et al., 2003). Both ETn and ETnERVs are still active, generating polymorphisms and mutations in several mouse strains (Gagnier et al., 2019). The validity of our ChIP-seq screen was confirmed by the identification of binding motifs - which often resembled the computationally predicted motifs (Figure 1\u2014figure supplement 2A) - for the majority of screened KRAB-ZFPs (Supplementary file 1). Moreover, predicted and experimentally determined motifs were found in targeted TEs in most cases (Supplementary file 1), and reporter repression assays confirmed KRAB-ZFP induced silencing for all the tested sequences (Figure 1\u2014figure supplement 2B). Finally, we observed KAP1 and H3K9me3 enrichment at most of the targeted TEs in wild type ES cells, indicating that most of these KRAB-ZFPs are functionally active in the early embryo (Figure 1A)."
-    },
-    {
-      "self_ref": "#/texts/11",
-      "parent": {
-        "$ref": "#/texts/8"
-      },
-      "children": [],
-      "label": "text",
-      "prov": [],
-      "orig": "We generally observed that KRAB-ZFPs present exclusively in mouse target TEs that are restricted to the mouse genome, indicating KRAB-ZFPs and their targets emerged together. For example, several mouse-specific KRAB-ZFPs in Chr2-cl and Chr4-cl target IAP and ETn elements which are only found in the mouse genome and are highly active. This is the strongest data to date supporting that recent KRAB-ZFP expansions in these young clusters is a response to recent TE activity. Likewise, ZFP599 and ZFP617, both conserved in Muroidea, bind to various ORR1-type LTRs which are present in the rat genome (Supplementary file 1). However, ZFP961, a KRAB-ZFP encoded on a small gene cluster on chromosome 8 that is conserved in Muroidea targets TEs that are only found in the mouse genome (e.g. ETn), a paradox we have previously observed with ZFP809, which also targets TEs that are evolutionarily younger than itself (Wolf et al., 2015b). The ZFP961 binding site is located at the 5\u2019 end of the internal region of ETn and ETnERV elements, a sequence that usually contains the primer binding site (PBS), which is required to prime retroviral reverse transcription. Indeed, the ZFP961 motif closely resembles the PBSLys1,2 (Figure 1\u2014figure supplement 3A), which had been previously identified as a KAP1-dependent target of retroviral repression (Yamauchi et al., 1995; Wolf et al., 2008). Repression of the PBSLys1,2 by ZFP961 was also confirmed in reporter assays (Figure 1\u2014figure supplement 2B), indicating that ZFP961 is likely responsible for this silencing effect.",
-      "text": "We generally observed that KRAB-ZFPs present exclusively in mouse target TEs that are restricted to the mouse genome, indicating KRAB-ZFPs and their targets emerged together. For example, several mouse-specific KRAB-ZFPs in Chr2-cl and Chr4-cl target IAP and ETn elements which are only found in the mouse genome and are highly active. This is the strongest data to date supporting that recent KRAB-ZFP expansions in these young clusters is a response to recent TE activity. Likewise, ZFP599 and ZFP617, both conserved in Muroidea, bind to various ORR1-type LTRs which are present in the rat genome (Supplementary file 1). However, ZFP961, a KRAB-ZFP encoded on a small gene cluster on chromosome 8 that is conserved in Muroidea targets TEs that are only found in the mouse genome (e.g. ETn), a paradox we have previously observed with ZFP809, which also targets TEs that are evolutionarily younger than itself (Wolf et al., 2015b). The ZFP961 binding site is located at the 5\u2019 end of the internal region of ETn and ETnERV elements, a sequence that usually contains the primer binding site (PBS), which is required to prime retroviral reverse transcription. Indeed, the ZFP961 motif closely resembles the PBSLys1,2 (Figure 1\u2014figure supplement 3A), which had been previously identified as a KAP1-dependent target of retroviral repression (Yamauchi et al., 1995; Wolf et al., 2008). Repression of the PBSLys1,2 by ZFP961 was also confirmed in reporter assays (Figure 1\u2014figure supplement 2B), indicating that ZFP961 is likely responsible for this silencing effect."
-    },
-    {
-      "self_ref": "#/texts/12",
-      "parent": {
-        "$ref": "#/texts/8"
-      },
-      "children": [],
-      "label": "text",
-      "prov": [],
-      "orig": "To further test the hypothesis that KRAB-ZFPs target sites necessary for retrotransposition, we utilized previously generated ETn and ETnERV retrotransposition reporters in which we mutated KRAB-ZFP binding sites (Ribet et al., 2004). Whereas the ETnERV reporters are sufficient for retrotransposition, the ETn reporter requires ETnERV genes supplied in trans. We tested and confirmed that the REX2/ZFP600 and GM13051 binding sites within these TEs are required for efficient retrotransposition (Figure 1\u2014figure supplement 3B). REX2 and ZFP600 both bind a target about 200 bp from the start of the internal region (Figure 1B), a region that often encodes the packaging signal. GM13051 binds a target coding for part of a highly structured mRNA export signal (Legiewicz et al., 2010) near the 3\u2019 end of the internal region of ETn (Figure 1\u2014figure supplement 3C). Both signals are characterized by stem-loop intramolecular base-pairing in which a single mutation can disrupt loop formation. This indicates that at least some KRAB-ZFPs evolved to bind functionally essential target sequences which cannot easily evade repression by mutation.",
-      "text": "To further test the hypothesis that KRAB-ZFPs target sites necessary for retrotransposition, we utilized previously generated ETn and ETnERV retrotransposition reporters in which we mutated KRAB-ZFP binding sites (Ribet et al., 2004). Whereas the ETnERV reporters are sufficient for retrotransposition, the ETn reporter requires ETnERV genes supplied in trans. We tested and confirmed that the REX2/ZFP600 and GM13051 binding sites within these TEs are required for efficient retrotransposition (Figure 1\u2014figure supplement 3B). REX2 and ZFP600 both bind a target about 200 bp from the start of the internal region (Figure 1B), a region that often encodes the packaging signal. GM13051 binds a target coding for part of a highly structured mRNA export signal (Legiewicz et al., 2010) near the 3\u2019 end of the internal region of ETn (Figure 1\u2014figure supplement 3C). Both signals are characterized by stem-loop intramolecular base-pairing in which a single mutation can disrupt loop formation. This indicates that at least some KRAB-ZFPs evolved to bind functionally essential target sequences which cannot easily evade repression by mutation."
-    },
-    {
-      "self_ref": "#/texts/13",
-      "parent": {
-        "$ref": "#/texts/8"
-      },
-      "children": [],
-      "label": "text",
-      "prov": [],
-      "orig": "Our KRAB-ZFP ChIP-seq dataset also provided unique insights into the emergence of new KRAB-ZFPs and binding patterns. The Chr4-cl KRAB-ZFPs REX2 and ZFP600 bind to the same target within ETn but with varying affinity (Figure 1C). Comparison of the amino acids responsible for DNA contact revealed a high similarity between REX2 and ZFP600, with the main differences at the most C-terminal zinc fingers. Additionally, we found that GM30910, another KRAB-ZFP encoded in the Chr4-cl, also shows a strong similarity to both KRAB-ZFPs yet targets entirely different groups of TEs (Figure 1C and Supplementary file 1). Together with previously shown data (Ecco et al., 2016), this example highlights how addition of a few new zinc fingers to an existing array can entirely shift the mode of DNA binding.",
-      "text": "Our KRAB-ZFP ChIP-seq dataset also provided unique insights into the emergence of new KRAB-ZFPs and binding patterns. The Chr4-cl KRAB-ZFPs REX2 and ZFP600 bind to the same target within ETn but with varying affinity (Figure 1C). Comparison of the amino acids responsible for DNA contact revealed a high similarity between REX2 and ZFP600, with the main differences at the most C-terminal zinc fingers. Additionally, we found that GM30910, another KRAB-ZFP encoded in the Chr4-cl, also shows a strong similarity to both KRAB-ZFPs yet targets entirely different groups of TEs (Figure 1C and Supplementary file 1). Together with previously shown data (Ecco et al., 2016), this example highlights how addition of a few new zinc fingers to an existing array can entirely shift the mode of DNA binding."
-    },
-    {
-      "self_ref": "#/texts/14",
-      "parent": {
-        "$ref": "#/texts/7"
-      },
-      "children": [
-        {
-          "$ref": "#/texts/15"
-        }
-      ],
-      "label": "section_header",
-      "prov": [],
-      "orig": "Genetic deletion of KRAB-ZFP gene clusters leads to retrotransposon reactivation",
-      "text": "Genetic deletion of KRAB-ZFP gene clusters leads to retrotransposon reactivation",
-      "level": 1
-    },
-    {
-      "self_ref": "#/texts/15",
-      "parent": {
-        "$ref": "#/texts/14"
-      },
-      "children": [],
-      "label": "text",
-      "prov": [],
-      "orig": "The majority of KRAB-ZFP genes are harbored in large, highly repetitive clusters that have formed by successive complex segmental duplications (Kauzlaric et al., 2017), rendering them inaccessible to conventional gene targeting. We therefore developed a strategy to delete entire KRAB-ZFP gene clusters in ES cells (including the Chr2-cl and Chr4-cl as well as two clusters on chromosome 13 and a cluster on chromosome 10) using two CRISPR/Cas9 gRNAs targeting unique regions flanking each cluster, and short single-stranded repair oligos with homologies to both sides of the projected cut sites. Using this approach, we generated five cluster KO ES cell lines in at least two biological replicates and performed RNA sequencing (RNA-seq) to determine TE expression levels. Strikingly, four of the five cluster KO ES cells exhibited distinct TE reactivation phenotypes (Figure 2A). Chr2-cl KO resulted in reactivation of several L1 subfamilies as well as RLTR10 (up to more than 100-fold as compared to WT) and IAPEz ERVs. In contrast, the most strongly upregulated TEs in Chr4-cl KO cells were ETn/ETnERV (up to 10-fold as compared to WT), with several other ERV groups modestly reactivated. ETn/ETnERV elements were also upregulated in Chr13.2-cl KO ES cells while the only upregulated ERVs in Chr13.1-cl KO ES cells were MMERVK10C elements (Figure 2A). Most reactivated retrotransposons were targeted by at least one KRAB-ZFP that was encoded in the deleted cluster (Figure 2A and Supplementary file 1), indicating a direct effect of these KRAB-ZFPs on TE expression levels. Furthermore, we observed a loss of KAP1 binding and H3K9me3 at several TE subfamilies that are targeted by at least one KRAB-ZFP within the deleted Chr2-cl and Chr4-cl (Figure 2B, Figure 2\u2014figure supplement 1A), including L1, ETn and IAPEz elements. Using reduced representation bisulfite sequencing (RRBS-seq), we found that a subset of KRAB-ZFP bound TEs were partially hypomethylated in Chr4-cl KO ES cells, but only when grown in genome-wide hypomethylation-inducing conditions (Blaschke et al., 2013; Figure 2C and Supplementary file 2). These data are consistent with the hypothesis that KRAB-ZFPs/KAP1 are not required to establish DNA methylation, but under certain conditions they protect specific TEs and imprint control regions from genome-wide demethylation (Leung et al., 2014; Deniz et al., 2018).",
-      "text": "The majority of KRAB-ZFP genes are harbored in large, highly repetitive clusters that have formed by successive complex segmental duplications (Kauzlaric et al., 2017), rendering them inaccessible to conventional gene targeting. We therefore developed a strategy to delete entire KRAB-ZFP gene clusters in ES cells (including the Chr2-cl and Chr4-cl as well as two clusters on chromosome 13 and a cluster on chromosome 10) using two CRISPR/Cas9 gRNAs targeting unique regions flanking each cluster, and short single-stranded repair oligos with homologies to both sides of the projected cut sites. Using this approach, we generated five cluster KO ES cell lines in at least two biological replicates and performed RNA sequencing (RNA-seq) to determine TE expression levels. Strikingly, four of the five cluster KO ES cells exhibited distinct TE reactivation phenotypes (Figure 2A). Chr2-cl KO resulted in reactivation of several L1 subfamilies as well as RLTR10 (up to more than 100-fold as compared to WT) and IAPEz ERVs. In contrast, the most strongly upregulated TEs in Chr4-cl KO cells were ETn/ETnERV (up to 10-fold as compared to WT), with several other ERV groups modestly reactivated. ETn/ETnERV elements were also upregulated in Chr13.2-cl KO ES cells while the only upregulated ERVs in Chr13.1-cl KO ES cells were MMERVK10C elements (Figure 2A). Most reactivated retrotransposons were targeted by at least one KRAB-ZFP that was encoded in the deleted cluster (Figure 2A and Supplementary file 1), indicating a direct effect of these KRAB-ZFPs on TE expression levels. Furthermore, we observed a loss of KAP1 binding and H3K9me3 at several TE subfamilies that are targeted by at least one KRAB-ZFP within the deleted Chr2-cl and Chr4-cl (Figure 2B, Figure 2\u2014figure supplement 1A), including L1, ETn and IAPEz elements. Using reduced representation bisulfite sequencing (RRBS-seq), we found that a subset of KRAB-ZFP bound TEs were partially hypomethylated in Chr4-cl KO ES cells, but only when grown in genome-wide hypomethylation-inducing conditions (Blaschke et al., 2013; Figure 2C and Supplementary file 2). These data are consistent with the hypothesis that KRAB-ZFPs/KAP1 are not required to establish DNA methylation, but under certain conditions they protect specific TEs and imprint control regions from genome-wide demethylation (Leung et al., 2014; Deniz et al., 2018)."
-    },
-    {
-      "self_ref": "#/texts/16",
-      "parent": {
-        "$ref": "#/texts/7"
-      },
-      "children": [
-        {
-          "$ref": "#/texts/17"
-        },
-        {
-          "$ref": "#/texts/18"
-        }
-      ],
-      "label": "section_header",
-      "prov": [],
-      "orig": "KRAB-ZFP cluster deletions license TE-borne enhancers",
-      "text": "KRAB-ZFP cluster deletions license TE-borne enhancers",
-      "level": 1
-    },
-    {
-      "self_ref": "#/texts/17",
-      "parent": {
-        "$ref": "#/texts/16"
-      },
-      "children": [],
-      "label": "text",
-      "prov": [],
-      "orig": "We next used our RNA-seq datasets to determine the effect of KRAB-ZFP cluster deletions on gene expression. We identified 195 significantly upregulated and 130 downregulated genes in Chr4-cl KO ES cells, and 108 upregulated and 59 downregulated genes in Chr2-cl KO ES cells (excluding genes on the deleted cluster) (Figure 3A). To address whether gene deregulation in Chr2-cl and Chr4-cl KO ES cells is caused by nearby TE reactivation, we determined whether genes near certain TE subfamilies are more frequently deregulated than random genes. We found a strong correlation of gene upregulation and TE proximity for several TE subfamilies, of which many became transcriptionally activated themselves (Figure 3B). For example, nearly 10% of genes that are located within 100 kb (up- or downstream of the TSS) of an ETn element are upregulated in Chr4-cl KO ES cells, as compared to 0.8% of all genes. In Chr2-cl KO ES cells, upregulated genes were significantly enriched near various LINE groups but also IAPEz-int and RLTR10-int elements, indicating that TE-binding KRAB-ZFPs in these clusters limit the potential activating effects of TEs on nearby genes.",
-      "text": "We next used our RNA-seq datasets to determine the effect of KRAB-ZFP cluster deletions on gene expression. We identified 195 significantly upregulated and 130 downregulated genes in Chr4-cl KO ES cells, and 108 upregulated and 59 downregulated genes in Chr2-cl KO ES cells (excluding genes on the deleted cluster) (Figure 3A). To address whether gene deregulation in Chr2-cl and Chr4-cl KO ES cells is caused by nearby TE reactivation, we determined whether genes near certain TE subfamilies are more frequently deregulated than random genes. We found a strong correlation of gene upregulation and TE proximity for several TE subfamilies, of which many became transcriptionally activated themselves (Figure 3B). For example, nearly 10% of genes that are located within 100 kb (up- or downstream of the TSS) of an ETn element are upregulated in Chr4-cl KO ES cells, as compared to 0.8% of all genes. In Chr2-cl KO ES cells, upregulated genes were significantly enriched near various LINE groups but also IAPEz-int and RLTR10-int elements, indicating that TE-binding KRAB-ZFPs in these clusters limit the potential activating effects of TEs on nearby genes."
-    },
-    {
-      "self_ref": "#/texts/18",
-      "parent": {
-        "$ref": "#/texts/16"
-      },
-      "children": [],
-      "label": "text",
-      "prov": [],
-      "orig": "While we generally observed that TE-associated gene reactivation is not caused by elongated or spliced transcription starting at the retrotransposons, we did observe that the strength of the effect of ETn elements on gene expression is stronger on genes in closer proximity. About 25% of genes located within 20 kb of an ETn element, but only 5% of genes located at a distance between 50 and 100 kb from the nearest ETn insertion, become upregulated in Chr4-cl KO ES cells. Importantly however, the correlation is still significant for genes that are located at distances between 50 and 100 kb from the nearest ETn insertion, indicating that ETn elements can act as long-range enhancers of gene expression in the absence of KRAB-ZFPs that target them. To confirm that Chr4-cl KRAB-ZFPs such as GM13051 block ETn-borne enhancers, we tested the ability of a putative ETn enhancer to activate transcription in a reporter assay. For this purpose, we cloned a 5 kb fragment spanning from the GM13051 binding site within the internal region of a truncated ETn insertion to the first exon of the Cd59a gene, which is strongly activated in Chr4-cl KO ES cells (Figure 2\u2014figure supplement 1B). We observed strong transcriptional activity of this fragment which was significantly higher in Chr4-cl KO ES cells. Surprisingly, this activity was reduced to background when the internal segment of the ETn element was not included in the fragment, suggesting the internal segment of the ETn element, but not its LTR, contains a Chr4-cl KRAB-ZFP sensitive enhancer. To further corroborate these findings, we genetically deleted an ETn element that is located about 60 kb from the TSS of Chst1, one of the top-upregulated genes in Chr4-cl KO ES cells (Figure 3C). RT-qPCR analysis revealed that the Chst1 upregulation phenotype in Chr4-cl KO ES cells diminishes when the ETn insertion is absent, providing direct evidence that a KRAB-ZFP controlled ETn-borne enhancer regulates Chst1 expression (Figure 3D). Furthermore, ChIP-seq confirmed a general increase of H3K4me3, H3K4me1 and H3K27ac marks at ETn elements in Chr4-cl KO ES cells (Figure 3E). Notably, enhancer marks were most pronounced around the GM13051 binding site near the 3\u2019 end of the internal region, confirming that the enhancer activity of ETn is located on the internal region and not on the LTR.",
-      "text": "While we generally observed that TE-associated gene reactivation is not caused by elongated or spliced transcription starting at the retrotransposons, we did observe that the strength of the effect of ETn elements on gene expression is stronger on genes in closer proximity. About 25% of genes located within 20 kb of an ETn element, but only 5% of genes located at a distance between 50 and 100 kb from the nearest ETn insertion, become upregulated in Chr4-cl KO ES cells. Importantly however, the correlation is still significant for genes that are located at distances between 50 and 100 kb from the nearest ETn insertion, indicating that ETn elements can act as long-range enhancers of gene expression in the absence of KRAB-ZFPs that target them. To confirm that Chr4-cl KRAB-ZFPs such as GM13051 block ETn-borne enhancers, we tested the ability of a putative ETn enhancer to activate transcription in a reporter assay. For this purpose, we cloned a 5 kb fragment spanning from the GM13051 binding site within the internal region of a truncated ETn insertion to the first exon of the Cd59a gene, which is strongly activated in Chr4-cl KO ES cells (Figure 2\u2014figure supplement 1B). We observed strong transcriptional activity of this fragment which was significantly higher in Chr4-cl KO ES cells. Surprisingly, this activity was reduced to background when the internal segment of the ETn element was not included in the fragment, suggesting the internal segment of the ETn element, but not its LTR, contains a Chr4-cl KRAB-ZFP sensitive enhancer. To further corroborate these findings, we genetically deleted an ETn element that is located about 60 kb from the TSS of Chst1, one of the top-upregulated genes in Chr4-cl KO ES cells (Figure 3C). RT-qPCR analysis revealed that the Chst1 upregulation phenotype in Chr4-cl KO ES cells diminishes when the ETn insertion is absent, providing direct evidence that a KRAB-ZFP controlled ETn-borne enhancer regulates Chst1 expression (Figure 3D). Furthermore, ChIP-seq confirmed a general increase of H3K4me3, H3K4me1 and H3K27ac marks at ETn elements in Chr4-cl KO ES cells (Figure 3E). Notably, enhancer marks were most pronounced around the GM13051 binding site near the 3\u2019 end of the internal region, confirming that the enhancer activity of ETn is located on the internal region and not on the LTR."
-    },
-    {
-      "self_ref": "#/texts/19",
-      "parent": {
-        "$ref": "#/texts/7"
-      },
-      "children": [
-        {
-          "$ref": "#/texts/20"
-        },
-        {
-          "$ref": "#/texts/21"
-        },
-        {
-          "$ref": "#/texts/22"
-        },
-        {
-          "$ref": "#/texts/23"
-        },
-        {
-          "$ref": "#/texts/24"
-        },
-        {
-          "$ref": "#/texts/25"
-        }
-      ],
-      "label": "section_header",
-      "prov": [],
-      "orig": "ETn retrotransposition in Chr4-cl KO and WT mice",
-      "text": "ETn retrotransposition in Chr4-cl KO and WT mice",
-      "level": 1
-    },
-    {
-      "self_ref": "#/texts/20",
-      "parent": {
-        "$ref": "#/texts/19"
-      },
-      "children": [],
-      "label": "text",
-      "prov": [],
-      "orig": "IAP, ETn/ETnERV and MuLV/RLTR4 retrotransposons are highly polymorphic in inbred mouse strains (Nell\u00e5ker et al., 2012), indicating that these elements are able to mobilize in the germ line. Since these retrotransposons are upregulated in Chr2-cl and Chr4-cl KO ES cells, we speculated that these KRAB-ZFP clusters evolved to minimize the risks of insertional mutagenesis by retrotransposition. To test this, we generated Chr2-cl and Chr4-cl KO mice via ES cell injection into blastocysts, and after germ line transmission we genotyped the offspring of heterozygous breeding pairs. While the offspring of Chr4-cl KO/WT parents were born close to Mendelian ratios in pure C57BL/6 and mixed C57BL/6 129Sv matings, one Chr4-cl KO/WT breeding pair gave birth to significantly fewer KO mice than expected (p-value=0.022) (Figure 4\u2014figure supplement 1A). Likewise, two out of four Chr2-cl KO breeding pairs on mixed C57BL/6 129Sv matings failed to give birth to a single KO offspring (p-value<0.01) while the two other mating pairs produced KO offspring at near Mendelian ratios (Figure 4\u2014figure supplement 1A). Altogether, these data indicate that KRAB-ZFP clusters are not absolutely essential in mice, but that genetic and/or epigenetic factors may contribute to reduced viability.",
-      "text": "IAP, ETn/ETnERV and MuLV/RLTR4 retrotransposons are highly polymorphic in inbred mouse strains (Nell\u00e5ker et al., 2012), indicating that these elements are able to mobilize in the germ line. Since these retrotransposons are upregulated in Chr2-cl and Chr4-cl KO ES cells, we speculated that these KRAB-ZFP clusters evolved to minimize the risks of insertional mutagenesis by retrotransposition. To test this, we generated Chr2-cl and Chr4-cl KO mice via ES cell injection into blastocysts, and after germ line transmission we genotyped the offspring of heterozygous breeding pairs. While the offspring of Chr4-cl KO/WT parents were born close to Mendelian ratios in pure C57BL/6 and mixed C57BL/6 129Sv matings, one Chr4-cl KO/WT breeding pair gave birth to significantly fewer KO mice than expected (p-value=0.022) (Figure 4\u2014figure supplement 1A). Likewise, two out of four Chr2-cl KO breeding pairs on mixed C57BL/6 129Sv matings failed to give birth to a single KO offspring (p-value<0.01) while the two other mating pairs produced KO offspring at near Mendelian ratios (Figure 4\u2014figure supplement 1A). Altogether, these data indicate that KRAB-ZFP clusters are not absolutely essential in mice, but that genetic and/or epigenetic factors may contribute to reduced viability."
-    },
-    {
-      "self_ref": "#/texts/21",
-      "parent": {
-        "$ref": "#/texts/19"
-      },
-      "children": [],
-      "label": "text",
-      "prov": [],
-      "orig": "We reasoned that retrotransposon activation could account for the reduced viability of Chr2-cl and Chr4-cl KO mice in some matings. However, since only rare matings produced non-viable KO embryos, we instead turned to the viable KO mice to assay for increased transposon activity. RNA-seq in blood, brain and testis revealed that, with a few exceptions, retrotransposons upregulated in Chr2 and Chr4 KRAB-ZFP cluster KO ES cells are not expressed at higher levels in adult tissues (Figure 4\u2014figure supplement 1B). Likewise, no strong transcriptional TE reactivation phenotype was observed in liver and kidney of Chr4-cl KO mice (data not shown) and ChIP-seq with antibodies against H3K4me1, H3K4me3 and H3K27ac in testis of Chr4-cl WT and KO mice revealed no increase of active histone marks at ETn elements or other TEs (data not shown). This indicates that Chr2-cl and Chr4-cl KRAB-ZFPs are primarily required for TE repression during early development. This is consistent with the high expression of these KRAB-ZFPs uniquely in ES cells (Figure 1\u2014figure supplement 1A). To determine whether retrotransposition occurs at a higher frequency in Chr4-cl KO mice during development, we screened for novel ETn (ETn/ETnERV) and MuLV (MuLV/RLTR4_MM) insertions in viable Chr4-cl KO mice. For this purpose, we developed a capture-sequencing approach to enrich for ETn/MuLV DNA and flanking sequences from genomic DNA using probes that hybridize with the 5\u2019 and 3\u2019 ends of ETn and MuLV LTRs prior to deep sequencing. We screened genomic DNA samples from a total of 76 mice, including 54 mice from ancestry-controlled Chr4-cl KO matings in various strain backgrounds, the two ES cell lines the Chr4-cl KO mice were generated from, and eight mice from a Chr2-cl KO mating which served as a control (since ETn and MuLVs are not activated in Chr2-cl KO ES cells) (Supplementary file 4). Using this approach, we were able to enrich reads mapping to ETn/MuLV LTRs about 2,000-fold compared to genome sequencing without capture. ETn/MuLV insertions were determined by counting uniquely mapped reads that were paired with reads mapping to ETn/MuLV elements (see materials and methods for details). To assess the efficiency of the capture approach, we determined what proportion of a set of 309 largely intact (two LTRs flanking an internal sequence) reference ETn elements could be identified using our sequencing data. 95% of these insertions were called with high confidence in the majority of our samples (data not shown), indicating that we are able to identify ETn insertions at a high recovery rate.",
-      "text": "We reasoned that retrotransposon activation could account for the reduced viability of Chr2-cl and Chr4-cl KO mice in some matings. However, since only rare matings produced non-viable KO embryos, we instead turned to the viable KO mice to assay for increased transposon activity. RNA-seq in blood, brain and testis revealed that, with a few exceptions, retrotransposons upregulated in Chr2 and Chr4 KRAB-ZFP cluster KO ES cells are not expressed at higher levels in adult tissues (Figure 4\u2014figure supplement 1B). Likewise, no strong transcriptional TE reactivation phenotype was observed in liver and kidney of Chr4-cl KO mice (data not shown) and ChIP-seq with antibodies against H3K4me1, H3K4me3 and H3K27ac in testis of Chr4-cl WT and KO mice revealed no increase of active histone marks at ETn elements or other TEs (data not shown). This indicates that Chr2-cl and Chr4-cl KRAB-ZFPs are primarily required for TE repression during early development. This is consistent with the high expression of these KRAB-ZFPs uniquely in ES cells (Figure 1\u2014figure supplement 1A). To determine whether retrotransposition occurs at a higher frequency in Chr4-cl KO mice during development, we screened for novel ETn (ETn/ETnERV) and MuLV (MuLV/RLTR4_MM) insertions in viable Chr4-cl KO mice. For this purpose, we developed a capture-sequencing approach to enrich for ETn/MuLV DNA and flanking sequences from genomic DNA using probes that hybridize with the 5\u2019 and 3\u2019 ends of ETn and MuLV LTRs prior to deep sequencing. We screened genomic DNA samples from a total of 76 mice, including 54 mice from ancestry-controlled Chr4-cl KO matings in various strain backgrounds, the two ES cell lines the Chr4-cl KO mice were generated from, and eight mice from a Chr2-cl KO mating which served as a control (since ETn and MuLVs are not activated in Chr2-cl KO ES cells) (Supplementary file 4). Using this approach, we were able to enrich reads mapping to ETn/MuLV LTRs about 2,000-fold compared to genome sequencing without capture. ETn/MuLV insertions were determined by counting uniquely mapped reads that were paired with reads mapping to ETn/MuLV elements (see materials and methods for details). To assess the efficiency of the capture approach, we determined what proportion of a set of 309 largely intact (two LTRs flanking an internal sequence) reference ETn elements could be identified using our sequencing data. 95% of these insertions were called with high confidence in the majority of our samples (data not shown), indicating that we are able to identify ETn insertions at a high recovery rate."
-    },
-    {
-      "self_ref": "#/texts/22",
-      "parent": {
-        "$ref": "#/texts/19"
-      },
-      "children": [],
-      "label": "text",
-      "prov": [],
-      "orig": "Using this dataset, we first confirmed the polymorphic nature of both ETn and MuLV retrotransposons in laboratory mouse strains (Figure 4\u2014figure supplement 2A), highlighting the potential of these elements to retrotranspose. To identify novel insertions, we filtered out insertions that were supported by ETn/MuLV-paired reads in more than one animal. While none of the 54 ancestry-controlled mice showed a single novel MuLV insertion, we observed greatly varying numbers of up to 80 novel ETn insertions in our pedigree (Figure 4A).",
-      "text": "Using this dataset, we first confirmed the polymorphic nature of both ETn and MuLV retrotransposons in laboratory mouse strains (Figure 4\u2014figure supplement 2A), highlighting the potential of these elements to retrotranspose. To identify novel insertions, we filtered out insertions that were supported by ETn/MuLV-paired reads in more than one animal. While none of the 54 ancestry-controlled mice showed a single novel MuLV insertion, we observed greatly varying numbers of up to 80 novel ETn insertions in our pedigree (Figure 4A)."
-    },
-    {
-      "self_ref": "#/texts/23",
-      "parent": {
-        "$ref": "#/texts/19"
-      },
-      "children": [],
-      "label": "text",
-      "prov": [],
-      "orig": "To validate some of the novel ETn insertions, we designed specific PCR primers for five of the insertions and screened genomic DNA of the mice in which they were identified as well as their parents. For all tested insertions, we were able to amplify their flanking sequence and show that these insertions are absent in their parents (Figure 4\u2014figure supplement 3A). To confirm their identity, we amplified and sequenced three of the novel full-length ETn insertions. Two of these elements (Genbank accession: MH449667-68) resembled typical ETnII elements with identical 5\u2019 and 3\u2019 LTRs and target site duplications (TSD) of 4 or 6 bp, respectively. The third sequenced element (MH449669) represented a hybrid element that contains both ETnI and MusD (ETnERV) sequences. Similar insertions can be found in the B6 reference genome; however, the identified novel insertion has a 2.5 kb deletion of the 5\u2019 end of the internal region. Additionally, the 5\u2019 and 3\u2019 LTR of this element differ in one nucleotide near the start site and contain an unusually large 248 bp TSD (containing a SINE repeat) indicating that an improper integration process might have truncated this element.",
-      "text": "To validate some of the novel ETn insertions, we designed specific PCR primers for five of the insertions and screened genomic DNA of the mice in which they were identified as well as their parents. For all tested insertions, we were able to amplify their flanking sequence and show that these insertions are absent in their parents (Figure 4\u2014figure supplement 3A). To confirm their identity, we amplified and sequenced three of the novel full-length ETn insertions. Two of these elements (Genbank accession: MH449667-68) resembled typical ETnII elements with identical 5\u2019 and 3\u2019 LTRs and target site duplications (TSD) of 4 or 6 bp, respectively. The third sequenced element (MH449669) represented a hybrid element that contains both ETnI and MusD (ETnERV) sequences. Similar insertions can be found in the B6 reference genome; however, the identified novel insertion has a 2.5 kb deletion of the 5\u2019 end of the internal region. Additionally, the 5\u2019 and 3\u2019 LTR of this element differ in one nucleotide near the start site and contain an unusually large 248 bp TSD (containing a SINE repeat) indicating that an improper integration process might have truncated this element."
-    },
-    {
-      "self_ref": "#/texts/24",
-      "parent": {
-        "$ref": "#/texts/19"
-      },
-      "children": [],
-      "label": "text",
-      "prov": [],
-      "orig": "Besides novel ETn insertions that were only identified in one specific animal, we also observed three ETn insertions that could be detected in several siblings but not in their parents or any of the other screened mice. This strongly indicates that these retrotransposition events occurred in the germ line of the parents from which they were passed on to some of their offspring. One of these germ line insertions was evidently passed on from the offspring to the next generation (Figure 4A). As expected, the read numbers supporting these novel germ line insertions were comparable to the read numbers that were found in the flanking regions of annotated B6 ETn insertions (Figure 4\u2014figure supplement 3B). In contrast, virtually all novel insertions that were only found in one animal were supported by significantly fewer reads (Figure 4\u2014figure supplement 3B). This indicates that these elements resulted from retrotransposition events in the developing embryo and not in the zygote or parental germ cells. Indeed, we detected different sets of insertions in various tissues from the same animal (Figure 4\u2014figure supplement 3C). Even between tail samples that were collected from the same animal at different ages, only a fraction of the new insertions were present in both samples, while technical replicates from the same genomic DNA samples showed a nearly complete overlap in insertions (Figure 4\u2014figure supplement 3D).",
-      "text": "Besides novel ETn insertions that were only identified in one specific animal, we also observed three ETn insertions that could be detected in several siblings but not in their parents or any of the other screened mice. This strongly indicates that these retrotransposition events occurred in the germ line of the parents from which they were passed on to some of their offspring. One of these germ line insertions was evidently passed on from the offspring to the next generation (Figure 4A). As expected, the read numbers supporting these novel germ line insertions were comparable to the read numbers that were found in the flanking regions of annotated B6 ETn insertions (Figure 4\u2014figure supplement 3B). In contrast, virtually all novel insertions that were only found in one animal were supported by significantly fewer reads (Figure 4\u2014figure supplement 3B). This indicates that these elements resulted from retrotransposition events in the developing embryo and not in the zygote or parental germ cells. Indeed, we detected different sets of insertions in various tissues from the same animal (Figure 4\u2014figure supplement 3C). Even between tail samples that were collected from the same animal at different ages, only a fraction of the new insertions were present in both samples, while technical replicates from the same genomic DNA samples showed a nearly complete overlap in insertions (Figure 4\u2014figure supplement 3D)."
-    },
-    {
-      "self_ref": "#/texts/25",
-      "parent": {
-        "$ref": "#/texts/19"
-      },
-      "children": [],
-      "label": "text",
-      "prov": [],
-      "orig": "Finally, we asked whether there were more novel ETn insertions in mice lacking the Chr4-cl relative to their wild type and heterozygous littermates in our pedigree. Interestingly, only one out of the eight Chr4-cl KO mice in a pure C57BL/6 strain background and none of the eight offspring from a Chr2-cl mating carried a single novel ETn insertion (Figure 4A). When crossing into a 129Sv background for a single generation before intercrossing heterozygous mice (F1), we observed 4 out of 8 Chr4-cl KO mice that contained at least one new ETn insertion, whereas none of 3 heterozygous mice contained any insertions. After crossing to the 129Sv background for a second generation (F2), we determined the number of novel ETn insertions in the offspring of one KO/WT x KO and two KO/WT x KO/WT matings, excluding all samples that were not derived from juvenile tail tissue. Only in the offspring of the KO/WT x KO mating, we observed a statistically significant higher average number of ETn insertions in KO vs. KO/WT animals (7.3 vs. 29.6, p=0.045, Figure 4B). Other than that, only a non-significant trend towards greater average numbers of ETn insertions in KO (11 vs. 27.8, p=0.192, Figure 4B) was apparent in one of the WT/KO x KO/WT matings whereas no difference in ETn insertion numbers between WT and KO mice could be observed in the second mating WT/KO x KO/WT (26 vs. 31, p=0.668, Figure 4B). When comparing all KO with all WT and WT/KO mice from these three matings, a trend towards more ETn insertions in KO remained but was not supported by strong significance (26 vs. 13, p=0.057, Figure 4B). Altogether, we observed a high variability in the number of new ETn insertions in both KO and WT but our data suggest that the Chr4-cl KRAB-ZFPs may have a modest effect on ETn retrotransposition rates in some mouse strains but other genetic and epigenetic effects clearly also play an important role.",
-      "text": "Finally, we asked whether there were more novel ETn insertions in mice lacking the Chr4-cl relative to their wild type and heterozygous littermates in our pedigree. Interestingly, only one out of the eight Chr4-cl KO mice in a pure C57BL/6 strain background and none of the eight offspring from a Chr2-cl mating carried a single novel ETn insertion (Figure 4A). When crossing into a 129Sv background for a single generation before intercrossing heterozygous mice (F1), we observed 4 out of 8 Chr4-cl KO mice that contained at least one new ETn insertion, whereas none of 3 heterozygous mice contained any insertions. After crossing to the 129Sv background for a second generation (F2), we determined the number of novel ETn insertions in the offspring of one KO/WT x KO and two KO/WT x KO/WT matings, excluding all samples that were not derived from juvenile tail tissue. Only in the offspring of the KO/WT x KO mating, we observed a statistically significant higher average number of ETn insertions in KO vs. KO/WT animals (7.3 vs. 29.6, p=0.045, Figure 4B). Other than that, only a non-significant trend towards greater average numbers of ETn insertions in KO (11 vs. 27.8, p=0.192, Figure 4B) was apparent in one of the WT/KO x KO/WT matings whereas no difference in ETn insertion numbers between WT and KO mice could be observed in the second mating WT/KO x KO/WT (26 vs. 31, p=0.668, Figure 4B). When comparing all KO with all WT and WT/KO mice from these three matings, a trend towards more ETn insertions in KO remained but was not supported by strong significance (26 vs. 13, p=0.057, Figure 4B). Altogether, we observed a high variability in the number of new ETn insertions in both KO and WT but our data suggest that the Chr4-cl KRAB-ZFPs may have a modest effect on ETn retrotransposition rates in some mouse strains but other genetic and epigenetic effects clearly also play an important role."
-    },
-    {
-      "self_ref": "#/texts/26",
-      "parent": {
-        "$ref": "#/texts/0"
-      },
-      "children": [
-        {
-          "$ref": "#/texts/27"
-        },
-        {
-          "$ref": "#/texts/28"
-        }
-      ],
-      "label": "section_header",
-      "prov": [],
-      "orig": "Discussion",
-      "text": "Discussion",
-      "level": 1
-    },
-    {
-      "self_ref": "#/texts/27",
-      "parent": {
-        "$ref": "#/texts/26"
-      },
-      "children": [],
-      "label": "text",
-      "prov": [],
-      "orig": "C2H2 zinc finger proteins, about half of which contain a KRAB repressor domain, represent the largest DNA-binding protein family in mammals. Nevertheless, most of these factors have not been investigated using loss-of-function studies. The most comprehensive characterization of human KRAB-ZFPs revealed a strong preference to bind TEs (Imbeault et al., 2017;\u00a0Najafabadi et al., 2015) yet their function remains unknown. In humans, very few TEs are capable of retrotransposition yet many of them, often tens of million years old, are bound by KRAB-ZFPs. While this suggests that human KRAB-ZFPs mainly serve to control TE-borne enhancers and may have potentially transcription-independent functions, we were interested in the biological significance of KRAB-ZFPs in restricting potentially active TEs. The mouse is an ideal model for such studies since the mouse genome contains several active TE families, including IAP, ETn and L1 elements. We found that many of the young KRAB-ZFPs present in the genomic clusters of KRAB-ZFPs on chromosomes 2 and 4, which are highly expressed in a restricted pattern in ES cells, bound redundantly to these three active TE families. In several cases, KRAB-ZFPs bound to functionally constrained sequence elements we and others have demonstrated to be necessary for retrotransposition, including PBS and viral packaging signals. Targeting such sequences may help the host defense system keep pace with rapidly evolving mouse transposons. This provides strong evidence that many young KRAB-ZFPs are indeed expanding in response to TE activity. But do these young KRAB-ZFP genes limit the mobilization of TEs? Despite the large number of polymorphic ETn elements in mouse strains (Nell\u00e5ker et al., 2012) and several reports of phenotype-causing novel ETn germ line insertions, no new ETn insertions were reported in recent screens of C57BL/6 mouse genomes (Richardson et al., 2017; Gagnier et al., 2019), indicating that the overall rate of ETn germ line mobilization in inbred mice is rather low. We have demonstrated that Chr4-cl KRAB-ZFPs control ETn/ETnERV expression in ES cells, but this does not lead to widespread ETn mobility in viable C57BL/6 mice. In contrast, we found numerous novel, including several germ line, ETn insertions in both WT and Chr4-cl KO mice in a C57BL/6 129Sv mixed genetic background, with generally more insertions in KO mice and in mice with more 129Sv DNA. This is consistent with a report detecting ETn insertions in FVB.129 mice (Schauer et al., 2018). Notably, there was a large variation in the number of new insertions in these mice, possibly caused by hyperactive polymorphic ETn insertions that varied from individual to individual, epigenetic variation at ETn insertions between individuals and/or the general stochastic nature of ETn mobilization. Furthermore, recent reports have suggested that KRAB-ZFP gene content is distinct in different strains of laboratory mice (Lilue et al., 2018; Treger et al., 2019), and reduced KRAB-ZFP gene content could contribute to increased activity in individual mice. Although we have yet to find obvious phenotypes in the mice carrying new insertions, novel ETn germ line insertions have been shown to cause phenotypes from short tails (Lugani et al., 2013; Semba et al., 2013; Vlangos et al., 2013) to limb malformation (Kano et al., 2007) and severe morphogenetic defects including polypodia (Lehoczky et al., 2013) depending upon their insertion site.",
-      "text": "C2H2 zinc finger proteins, about half of which contain a KRAB repressor domain, represent the largest DNA-binding protein family in mammals. Nevertheless, most of these factors have not been investigated using loss-of-function studies. The most comprehensive characterization of human KRAB-ZFPs revealed a strong preference to bind TEs (Imbeault et al., 2017;\u00a0Najafabadi et al., 2015) yet their function remains unknown. In humans, very few TEs are capable of retrotransposition yet many of them, often tens of million years old, are bound by KRAB-ZFPs. While this suggests that human KRAB-ZFPs mainly serve to control TE-borne enhancers and may have potentially transcription-independent functions, we were interested in the biological significance of KRAB-ZFPs in restricting potentially active TEs. The mouse is an ideal model for such studies since the mouse genome contains several active TE families, including IAP, ETn and L1 elements. We found that many of the young KRAB-ZFPs present in the genomic clusters of KRAB-ZFPs on chromosomes 2 and 4, which are highly expressed in a restricted pattern in ES cells, bound redundantly to these three active TE families. In several cases, KRAB-ZFPs bound to functionally constrained sequence elements we and others have demonstrated to be necessary for retrotransposition, including PBS and viral packaging signals. Targeting such sequences may help the host defense system keep pace with rapidly evolving mouse transposons. This provides strong evidence that many young KRAB-ZFPs are indeed expanding in response to TE activity. But do these young KRAB-ZFP genes limit the mobilization of TEs? Despite the large number of polymorphic ETn elements in mouse strains (Nell\u00e5ker et al., 2012) and several reports of phenotype-causing novel ETn germ line insertions, no new ETn insertions were reported in recent screens of C57BL/6 mouse genomes (Richardson et al., 2017; Gagnier et al., 2019), indicating that the overall rate of ETn germ line mobilization in inbred mice is rather low. We have demonstrated that Chr4-cl KRAB-ZFPs control ETn/ETnERV expression in ES cells, but this does not lead to widespread ETn mobility in viable C57BL/6 mice. In contrast, we found numerous novel, including several germ line, ETn insertions in both WT and Chr4-cl KO mice in a C57BL/6 129Sv mixed genetic background, with generally more insertions in KO mice and in mice with more 129Sv DNA. This is consistent with a report detecting ETn insertions in FVB.129 mice (Schauer et al., 2018). Notably, there was a large variation in the number of new insertions in these mice, possibly caused by hyperactive polymorphic ETn insertions that varied from individual to individual, epigenetic variation at ETn insertions between individuals and/or the general stochastic nature of ETn mobilization. Furthermore, recent reports have suggested that KRAB-ZFP gene content is distinct in different strains of laboratory mice (Lilue et al., 2018; Treger et al., 2019), and reduced KRAB-ZFP gene content could contribute to increased activity in individual mice. Although we have yet to find obvious phenotypes in the mice carrying new insertions, novel ETn germ line insertions have been shown to cause phenotypes from short tails (Lugani et al., 2013; Semba et al., 2013; Vlangos et al., 2013) to limb malformation (Kano et al., 2007) and severe morphogenetic defects including polypodia (Lehoczky et al., 2013) depending upon their insertion site."
-    },
-    {
-      "self_ref": "#/texts/28",
-      "parent": {
-        "$ref": "#/texts/26"
-      },
-      "children": [],
-      "label": "text",
-      "prov": [],
-      "orig": "Despite a lack of widespread ETn activation in Chr4-cl KO mice, it still remains to be determined whether other TEs, like L1, IAP or other LTR retrotransposons are activated in any of the KRAB-ZFP cluster KO mice, which will require the development of additional capture-seq based assays. Notably, two of the heterozygous matings from Chr2-cl KO mice failed to produce viable knockout offspring, which could indicate a TE-reactivation phenotype. It may also be necessary to generate compound homozygous mutants of distinct KRAB-ZFP clusters to eliminate redundancy before TEs become unleashed. The KRAB-ZFP cluster knockouts produced here will be useful reagents to test such hypotheses. In sum, our data supports that a major driver of KRAB-ZFP gene expansion in mice is recent retrotransposon insertions, and that redundancy within the KRAB-ZFP gene family and with other TE restriction pathways provides protection against widespread TE mobility, explaining the non-essential function of the majority of KRAB-ZFP genes.",
-      "text": "Despite a lack of widespread ETn activation in Chr4-cl KO mice, it still remains to be determined whether other TEs, like L1, IAP or other LTR retrotransposons are activated in any of the KRAB-ZFP cluster KO mice, which will require the development of additional capture-seq based assays. Notably, two of the heterozygous matings from Chr2-cl KO mice failed to produce viable knockout offspring, which could indicate a TE-reactivation phenotype. It may also be necessary to generate compound homozygous mutants of distinct KRAB-ZFP clusters to eliminate redundancy before TEs become unleashed. The KRAB-ZFP cluster knockouts produced here will be useful reagents to test such hypotheses. In sum, our data supports that a major driver of KRAB-ZFP gene expansion in mice is recent retrotransposon insertions, and that redundancy within the KRAB-ZFP gene family and with other TE restriction pathways provides protection against widespread TE mobility, explaining the non-essential function of the majority of KRAB-ZFP genes."
-    },
-    {
-      "self_ref": "#/texts/29",
-      "parent": {
-        "$ref": "#/texts/0"
-      },
-      "children": [
-        {
-          "$ref": "#/texts/30"
-        },
-        {
-          "$ref": "#/texts/32"
-        },
-        {
-          "$ref": "#/texts/34"
-        },
-        {
-          "$ref": "#/texts/36"
-        },
-        {
-          "$ref": "#/texts/39"
-        },
-        {
-          "$ref": "#/texts/41"
-        },
-        {
-          "$ref": "#/texts/43"
-        },
-        {
-          "$ref": "#/texts/45"
-        },
-        {
-          "$ref": "#/texts/47"
-        }
-      ],
-      "label": "section_header",
-      "prov": [],
-      "orig": "Materials and methods",
-      "text": "Materials and methods",
-      "level": 1
-    },
-    {
-      "self_ref": "#/texts/30",
-      "parent": {
-        "$ref": "#/texts/29"
-      },
-      "children": [
-        {
-          "$ref": "#/texts/31"
-        }
-      ],
-      "label": "section_header",
-      "prov": [],
-      "orig": "Cell lines and transgenic mice",
-      "text": "Cell lines and transgenic mice",
-      "level": 1
-    },
-    {
-      "self_ref": "#/texts/31",
-      "parent": {
-        "$ref": "#/texts/30"
-      },
-      "children": [],
-      "label": "text",
-      "prov": [],
-      "orig": "Mouse ES cells and F9 EC cells were cultivated as described previously (Wolf et al., 2015b) unless stated otherwise. Chr4-cl KO ES cells originate from B6;129\u2010 Gt(ROSA)26Sortm1(cre/ERT)Nat/J mice (Jackson lab), all other KRAB-ZFP cluster KO ES cell lines originate from JM8A3.N1 C57BL/6N-Atm1Brd ES cells (KOMP Repository). Chr2-cl KO and WT ES cells were initially grown in serum-containing media (Wolf et al., 2015b) but changed to 2i media (De Iaco et al., 2017) for several weeks before analysis. To generate Chr4-cl and Chr2-cl KO mice, the cluster deletions were repeated in B6 ES (KOMP repository) or R1 (Nagy lab) ES cells, respectively, and heterozygous clones were injected into B6 albino blastocysts. Chr2-cl KO mice were therefore kept on a mixed B6/Svx129/Sv-CP strain background while Chr4-cl KO mice were initially derived on a pure C57BL/6 background. For capture-seq screens, Chr4-cl KO mice were crossed with 129 \u00d7 1/SvJ mice (Jackson lab) to produce the founder mice for Chr4-cl KO and WT (B6/129 F1) offspring. Chr4-cl KO/WT (B6/129 F1) were also crossed with 129 \u00d7 1/SvJ mice to get Chr4-cl KO/WT (B6/129 F1) mice, which were intercrossed to give rise to the parents of Chr4-cl KO/KO and KO/WT (B6/129 F2) offspring.",
-      "text": "Mouse ES cells and F9 EC cells were cultivated as described previously (Wolf et al., 2015b) unless stated otherwise. Chr4-cl KO ES cells originate from B6;129\u2010 Gt(ROSA)26Sortm1(cre/ERT)Nat/J mice (Jackson lab), all other KRAB-ZFP cluster KO ES cell lines originate from JM8A3.N1 C57BL/6N-Atm1Brd ES cells (KOMP Repository). Chr2-cl KO and WT ES cells were initially grown in serum-containing media (Wolf et al., 2015b) but changed to 2i media (De Iaco et al., 2017) for several weeks before analysis. To generate Chr4-cl and Chr2-cl KO mice, the cluster deletions were repeated in B6 ES (KOMP repository) or R1 (Nagy lab) ES cells, respectively, and heterozygous clones were injected into B6 albino blastocysts. Chr2-cl KO mice were therefore kept on a mixed B6/Svx129/Sv-CP strain background while Chr4-cl KO mice were initially derived on a pure C57BL/6 background. For capture-seq screens, Chr4-cl KO mice were crossed with 129 \u00d7 1/SvJ mice (Jackson lab) to produce the founder mice for Chr4-cl KO and WT (B6/129 F1) offspring. Chr4-cl KO/WT (B6/129 F1) were also crossed with 129 \u00d7 1/SvJ mice to get Chr4-cl KO/WT (B6/129 F1) mice, which were intercrossed to give rise to the parents of Chr4-cl KO/KO and KO/WT (B6/129 F2) offspring."
-    },
-    {
-      "self_ref": "#/texts/32",
-      "parent": {
-        "$ref": "#/texts/29"
-      },
-      "children": [
-        {
-          "$ref": "#/texts/33"
-        }
-      ],
-      "label": "section_header",
-      "prov": [],
-      "orig": "Generation of KRAB-ZFP expressing cell lines",
-      "text": "Generation of KRAB-ZFP expressing cell lines",
-      "level": 1
-    },
-    {
-      "self_ref": "#/texts/33",
-      "parent": {
-        "$ref": "#/texts/32"
-      },
-      "children": [],
-      "label": "text",
-      "prov": [],
-      "orig": "KRAB-ZFP ORFs were PCR-amplified from cDNA or synthesized with codon-optimization (Supplementary file 1), and stably expressed with 3XFLAG or 3XHA tags in F9 EC or ES cells using Sleeping beauty transposon-based (Wolf et al., 2015b) or lentiviral expression vectors (Imbeault et al., 2017; Supplementary file 1). Cells were selected with puromycin (1 \u00b5g/ml) and resistant clones were pooled and further expanded for ChIP-seq.",
-      "text": "KRAB-ZFP ORFs were PCR-amplified from cDNA or synthesized with codon-optimization (Supplementary file 1), and stably expressed with 3XFLAG or 3XHA tags in F9 EC or ES cells using Sleeping beauty transposon-based (Wolf et al., 2015b) or lentiviral expression vectors (Imbeault et al., 2017; Supplementary file 1). Cells were selected with puromycin (1 \u00b5g/ml) and resistant clones were pooled and further expanded for ChIP-seq."
-    },
-    {
-      "self_ref": "#/texts/34",
-      "parent": {
-        "$ref": "#/texts/29"
-      },
-      "children": [
-        {
-          "$ref": "#/texts/35"
-        }
-      ],
-      "label": "section_header",
-      "prov": [],
-      "orig": "CRISPR/Cas9 mediated deletion of KRAB-ZFP clusters and an MMETn insertion",
-      "text": "CRISPR/Cas9 mediated deletion of KRAB-ZFP clusters and an MMETn insertion",
-      "level": 1
-    },
-    {
-      "self_ref": "#/texts/35",
-      "parent": {
-        "$ref": "#/texts/34"
-      },
-      "children": [],
-      "label": "text",
-      "prov": [],
-      "orig": "All gRNAs were expressed from the pX330-U6-Chimeric_BB-CBh-hSpCas9 vector (RRID:Addgene_42230) and nucleofected into 106 ES cells using Amaxa nucleofection in the following amounts: 5 \u00b5g of each pX330-gRNA plasmid, 1 \u00b5g pPGK-puro and 500 pmoles single-stranded repair oligos (Supplementary file 3). One day after nucleofection, cells were kept under puromycin selection (1 \u00b5g/ml) for 24 hr. Individual KO and WT clones were picked 7\u20138 days after nucleofection and expanded for PCR genotyping (Supplementary file 3).",
-      "text": "All gRNAs were expressed from the pX330-U6-Chimeric_BB-CBh-hSpCas9 vector (RRID:Addgene_42230) and nucleofected into 106 ES cells using Amaxa nucleofection in the following amounts: 5 \u00b5g of each pX330-gRNA plasmid, 1 \u00b5g pPGK-puro and 500 pmoles single-stranded repair oligos (Supplementary file 3). One day after nucleofection, cells were kept under puromycin selection (1 \u00b5g/ml) for 24 hr. Individual KO and WT clones were picked 7\u20138 days after nucleofection and expanded for PCR genotyping (Supplementary file 3)."
-    },
-    {
-      "self_ref": "#/texts/36",
-      "parent": {
-        "$ref": "#/texts/29"
-      },
-      "children": [
-        {
-          "$ref": "#/texts/37"
-        },
-        {
-          "$ref": "#/texts/38"
-        }
-      ],
-      "label": "section_header",
-      "prov": [],
-      "orig": "ChIP-seq analysis",
-      "text": "ChIP-seq analysis",
-      "level": 1
-    },
-    {
-      "self_ref": "#/texts/37",
-      "parent": {
-        "$ref": "#/texts/36"
-      },
-      "children": [],
-      "label": "text",
-      "prov": [],
-      "orig": "For ChIP-seq analysis of KRAB-ZFP expressing cells, 5\u201310 \u00d7 107 cells were crosslinked and immunoprecipitated with anti-FLAG (Sigma-Aldrich Cat# F1804, RRID:AB_262044) or anti-HA (Abcam Cat# ab9110, RRID:AB_307019 or Covance Cat# MMS-101P-200, RRID:AB_10064068) antibody using one of two previously described protocols (O'Geen et al., 2010; Imbeault et al., 2017) as indicated in Supplementary file 1. H3K9me3 distribution in Chr4-cl, Chr10-cl, Chr13.1-cl and Chr13.2-cl KO ES cells was determined by native ChIP-seq with anti-H3K9me3 serum (Active Motif Cat# 39161, RRID:AB_2532132) as described previously (Karimi et al., 2011). In Chr2-cl KO ES cells, H3K9me3 and KAP1 ChIP-seq was performed as previously described (Ecco et al., 2016). In Chr4-cl KO and WT ES cells KAP1 binding was determined by endogenous tagging of KAP1 with C-terminal GFP (Supplementary file 3), followed by FACS to enrich for GFP-positive cells and ChIP with anti-GFP (Thermo Fisher Scientific Cat# A-11122, RRID:AB_221569) using a previously described protocol (O'Geen et al., 2010). For ChIP-seq analysis of active histone marks, cross-linked chromatin from ES cells or testis (from two-week old mice) was immunoprecipitated with antibodies against H3K4me3 (Abcam Cat# ab8580, RRID:AB_306649), H3K4me1 (Abcam Cat# ab8895, RRID:AB_306847) and H3K27ac (Abcam Cat# ab4729, RRID:AB_2118291) following the protocol developed by O'Geen et al., 2010 or Khil et al., 2012 respectively.",
-      "text": "For ChIP-seq analysis of KRAB-ZFP expressing cells, 5\u201310 \u00d7 107 cells were crosslinked and immunoprecipitated with anti-FLAG (Sigma-Aldrich Cat# F1804, RRID:AB_262044) or anti-HA (Abcam Cat# ab9110, RRID:AB_307019 or Covance Cat# MMS-101P-200, RRID:AB_10064068) antibody using one of two previously described protocols (O'Geen et al., 2010; Imbeault et al., 2017) as indicated in Supplementary file 1. H3K9me3 distribution in Chr4-cl, Chr10-cl, Chr13.1-cl and Chr13.2-cl KO ES cells was determined by native ChIP-seq with anti-H3K9me3 serum (Active Motif Cat# 39161, RRID:AB_2532132) as described previously (Karimi et al., 2011). In Chr2-cl KO ES cells, H3K9me3 and KAP1 ChIP-seq was performed as previously described (Ecco et al., 2016). In Chr4-cl KO and WT ES cells KAP1 binding was determined by endogenous tagging of KAP1 with C-terminal GFP (Supplementary file 3), followed by FACS to enrich for GFP-positive cells and ChIP with anti-GFP (Thermo Fisher Scientific Cat# A-11122, RRID:AB_221569) using a previously described protocol (O'Geen et al., 2010). For ChIP-seq analysis of active histone marks, cross-linked chromatin from ES cells or testis (from two-week old mice) was immunoprecipitated with antibodies against H3K4me3 (Abcam Cat# ab8580, RRID:AB_306649), H3K4me1 (Abcam Cat# ab8895, RRID:AB_306847) and H3K27ac (Abcam Cat# ab4729, RRID:AB_2118291) following the protocol developed by O'Geen et al., 2010 or Khil et al., 2012 respectively."
-    },
-    {
-      "self_ref": "#/texts/38",
-      "parent": {
-        "$ref": "#/texts/36"
-      },
-      "children": [],
-      "label": "text",
-      "prov": [],
-      "orig": "ChIP-seq libraries were constructed and sequenced as indicated in Supplementary file 4. Reads were mapped to the mm9 genome using Bowtie (RRID:SCR_005476; settings: --best) or Bowtie2 (Langmead and Salzberg, 2012) as indicated in Supplementary file 4. Under these settings, reads that map to multiple genomic regions are assigned to the top-scored match and, if a set of equally good choices is encountered, a pseudo-random number is used to choose one location. Peaks were called using MACS14 (RRID:SCR_013291) under high stringency settings (p<1e-10, peak enrichment\u00a0>20) (Zhang et al., 2008). Peaks were called both over the Input control and a FLAG or HA control ChIP (unless otherwise stated in Supplementary file 4) and only peaks that were called in both settings were kept for further analysis. In cases when the stringency settings did not result in at least 50 peaks, the settings were changed to medium (p<1e-10, peak enrichment\u00a0>10) or low (p<1e-5, peak enrichment\u00a0>10) stringency (Supplementary file 4). For further analysis, all peaks were scaled to 200 bp regions centered around the peak summits. The overlap of the scaled peaks to each repeat element in UCSC Genome Browser (RRID:SCR_005780) were calculated by using the bedfisher function (settings: -f 0.25) from BEDTools (RRID:SCR_006646). The right-tailed p-values between pair-wise comparison of each ChIP-seq peak and repeat element were extracted, and then adjusted using the Benjamini-Hochberg approach implemented in the R function p.adjust(). Binding motifs were determined using only nonrepetitive (<10% repeat content) peaks with MEME (Bailey et al., 2009). MEME motifs were compared with in silico predicted motifs (Najafabadi et al., 2015) using Tomtom (Bailey et al., 2009) and considered as significantly overlapping with a False Discovery Rate (FDR) below 0.1. To find MEME and predicted motifs in repetitive peaks, we used FIMO (Bailey et al., 2009). Differential H3K9me3 and KAP1 distribution in WT and Chr2-cl or Chr4-cl KO ES cells at TEs was determined by counting ChIP-seq reads overlapping annotated insertions of each TE group using BEDTools (MultiCovBed). Additionally, ChIP-seq reads were counted at the TE fraction that was bound by Chr2-cl or Chr4-cl KRAB-ZFPs (overlapping with 200 bp peaks). Count tables were concatenated and analyzed using DESeq2 (Love et al., 2014). The previously published ChIP-seq datasets for KAP1 (Castro-Diaz et al., 2014) and H3K9me3 (Dan et al., 2014) were re-mapped using Bowtie (--best).",
-      "text": "ChIP-seq libraries were constructed and sequenced as indicated in Supplementary file 4. Reads were mapped to the mm9 genome using Bowtie (RRID:SCR_005476; settings: --best) or Bowtie2 (Langmead and Salzberg, 2012) as indicated in Supplementary file 4. Under these settings, reads that map to multiple genomic regions are assigned to the top-scored match and, if a set of equally good choices is encountered, a pseudo-random number is used to choose one location. Peaks were called using MACS14 (RRID:SCR_013291) under high stringency settings (p<1e-10, peak enrichment\u00a0>20) (Zhang et al., 2008). Peaks were called both over the Input control and a FLAG or HA control ChIP (unless otherwise stated in Supplementary file 4) and only peaks that were called in both settings were kept for further analysis. In cases when the stringency settings did not result in at least 50 peaks, the settings were changed to medium (p<1e-10, peak enrichment\u00a0>10) or low (p<1e-5, peak enrichment\u00a0>10) stringency (Supplementary file 4). For further analysis, all peaks were scaled to 200 bp regions centered around the peak summits. The overlap of the scaled peaks to each repeat element in UCSC Genome Browser (RRID:SCR_005780) were calculated by using the bedfisher function (settings: -f 0.25) from BEDTools (RRID:SCR_006646). The right-tailed p-values between pair-wise comparison of each ChIP-seq peak and repeat element were extracted, and then adjusted using the Benjamini-Hochberg approach implemented in the R function p.adjust(). Binding motifs were determined using only nonrepetitive (<10% repeat content) peaks with MEME (Bailey et al., 2009). MEME motifs were compared with in silico predicted motifs (Najafabadi et al., 2015) using Tomtom (Bailey et al., 2009) and considered as significantly overlapping with a False Discovery Rate (FDR) below 0.1. To find MEME and predicted motifs in repetitive peaks, we used FIMO (Bailey et al., 2009). Differential H3K9me3 and KAP1 distribution in WT and Chr2-cl or Chr4-cl KO ES cells at TEs was determined by counting ChIP-seq reads overlapping annotated insertions of each TE group using BEDTools (MultiCovBed). Additionally, ChIP-seq reads were counted at the TE fraction that was bound by Chr2-cl or Chr4-cl KRAB-ZFPs (overlapping with 200 bp peaks). Count tables were concatenated and analyzed using DESeq2 (Love et al., 2014). The previously published ChIP-seq datasets for KAP1 (Castro-Diaz et al., 2014) and H3K9me3 (Dan et al., 2014) were re-mapped using Bowtie (--best)."
-    },
-    {
-      "self_ref": "#/texts/39",
-      "parent": {
-        "$ref": "#/texts/29"
-      },
-      "children": [
-        {
-          "$ref": "#/texts/40"
-        }
-      ],
-      "label": "section_header",
-      "prov": [],
-      "orig": "Luciferase reporter assays",
-      "text": "Luciferase reporter assays",
-      "level": 1
-    },
-    {
-      "self_ref": "#/texts/40",
-      "parent": {
-        "$ref": "#/texts/39"
-      },
-      "children": [],
-      "label": "text",
-      "prov": [],
-      "orig": "For KRAB-ZFP repression assays, double-stranded DNA oligos containing KRAB-ZFP target sequences (Supplementary file 3) were cloned upstream of the SV40 promoter of the pGL3-Promoter vector (Promega) between the restriction sites for NheI and XhoI. 33 ng of reporter vectors were co-transfected (Lipofectamine 2000, Thermofisher) with 33 ng pRL-SV40 (Promega) for normalization and 33 ng of transient KRAB-ZFP expression vectors (in pcDNA3.1) or empty pcDNA3.1 into 293 T cells seeded one day earlier in 96-well plates. Cells were lysed 48 hr after transfection and luciferase/Renilla luciferase activity was measured using the Dual-Luciferase Reporter Assay System (Promega). To measure the transcriptional activity of the MMETn element upstream of the Cd59a gene, fragments of varying sizes (Supplementary file 3) were cloned into the promoter-less pGL3-basic vector (Promega) using NheI and NcoI sites. 70 ng of reporter vectors were cotransfected with 30 ng pRL-SV40 into feeder-depleted Chr4-cl WT and KO ES cells, seeded into a gelatinized 96-well plate 2 hr before transfection. Luciferase activity was measured 48 hr after transfection as described above.",
-      "text": "For KRAB-ZFP repression assays, double-stranded DNA oligos containing KRAB-ZFP target sequences (Supplementary file 3) were cloned upstream of the SV40 promoter of the pGL3-Promoter vector (Promega) between the restriction sites for NheI and XhoI. 33 ng of reporter vectors were co-transfected (Lipofectamine 2000, Thermofisher) with 33 ng pRL-SV40 (Promega) for normalization and 33 ng of transient KRAB-ZFP expression vectors (in pcDNA3.1) or empty pcDNA3.1 into 293 T cells seeded one day earlier in 96-well plates. Cells were lysed 48 hr after transfection and luciferase/Renilla luciferase activity was measured using the Dual-Luciferase Reporter Assay System (Promega). To measure the transcriptional activity of the MMETn element upstream of the Cd59a gene, fragments of varying sizes (Supplementary file 3) were cloned into the promoter-less pGL3-basic vector (Promega) using NheI and NcoI sites. 70 ng of reporter vectors were cotransfected with 30 ng pRL-SV40 into feeder-depleted Chr4-cl WT and KO ES cells, seeded into a gelatinized 96-well plate 2 hr before transfection. Luciferase activity was measured 48 hr after transfection as described above."
-    },
-    {
-      "self_ref": "#/texts/41",
-      "parent": {
-        "$ref": "#/texts/29"
-      },
-      "children": [
-        {
-          "$ref": "#/texts/42"
-        }
-      ],
-      "label": "section_header",
-      "prov": [],
-      "orig": "RNA-seq analysis",
-      "text": "RNA-seq analysis",
-      "level": 1
-    },
-    {
-      "self_ref": "#/texts/42",
-      "parent": {
-        "$ref": "#/texts/41"
-      },
-      "children": [],
-      "label": "text",
-      "prov": [],
-      "orig": "Whole RNA was purified using RNeasy columns (Qiagen) with on column DNase treatment or the High Pure RNA Isolation Kit (Roche) (Supplementary file 4). Tissues were first lysed in TRIzol reagent (ThermoFisher) and RNA was purified after the isopropanol precipitation step using RNeasy columns (Qiagen) with on column DNase treatment. Libraries were generated using the SureSelect Strand-Specific RNA Library Prep kit (Agilent) or Illumina\u2019s TruSeq RNA Library Prep Kit (with polyA selection) and sequenced as 50 or 100 bp paired-end reads on an Illumina HiSeq2500 (RRID:SCR_016383) or HiSeq3000 (RRID:SCR_016386) machine (Supplementary file 4). RNA-seq reads were mapped to the mouse genome (mm9) using Tophat (RRID:SCR_013035; settings: --I 200000 g 1) unless otherwise stated. These settings allow each mappable read to be reported once, in case the read maps to multiple locations equally well, one match is randomly chosen. For differential transposon expression, mapped reads that overlap with TEs annotated in Repeatmasker (RRID:SCR_012954) were counted using BEDTools MultiCovBed (setting: -split). Reads mapping to multiple fragments that belong to the same TE insertion (as indicated by the repeat ID) were summed up. Only transposons with a total of at least 20 (for two biological replicates) or 30 (for three biological replicates) mapped reads across WT and KO samples were considered for differential expression analysis. Transposons within the deleted KRAB-ZFP cluster were excluded from the analysis. Read count tables were used for differential expression analysis with DESeq2 (RRID:SCR_015687). For differential gene expression analysis, reads overlapping with gene exons were counted using HTSeq-count and analyzed using DESeq2. To test if KRAB-ZFP peaks are significantly enriched near up- or down-regulated genes, a binomial test was performed. Briefly, the proportion of the peaks that are located within a certain distance up- or downstream to the TSS of genes was determined using the windowBed function of BED tools. The probability p in the binomial distribution was estimated as the fraction of all genes overlapped with KRAB-ZFP peaks. Then, given n which is the number of specific groups of genes, and x which is the number of this group of genes overlapped with peaks, the R function binom.test() was used to estimate the p-value based on right-tailed Binomial test. Finally, the adjusted p-values were determined separately for LTR and LINE retrotransposon groups using the Benjamini-Hochberg approach implemented in the R function p.adjust().",
-      "text": "Whole RNA was purified using RNeasy columns (Qiagen) with on column DNase treatment or the High Pure RNA Isolation Kit (Roche) (Supplementary file 4). Tissues were first lysed in TRIzol reagent (ThermoFisher) and RNA was purified after the isopropanol precipitation step using RNeasy columns (Qiagen) with on column DNase treatment. Libraries were generated using the SureSelect Strand-Specific RNA Library Prep kit (Agilent) or Illumina\u2019s TruSeq RNA Library Prep Kit (with polyA selection) and sequenced as 50 or 100 bp paired-end reads on an Illumina HiSeq2500 (RRID:SCR_016383) or HiSeq3000 (RRID:SCR_016386) machine (Supplementary file 4). RNA-seq reads were mapped to the mouse genome (mm9) using Tophat (RRID:SCR_013035; settings: --I 200000 g 1) unless otherwise stated. These settings allow each mappable read to be reported once, in case the read maps to multiple locations equally well, one match is randomly chosen. For differential transposon expression, mapped reads that overlap with TEs annotated in Repeatmasker (RRID:SCR_012954) were counted using BEDTools MultiCovBed (setting: -split). Reads mapping to multiple fragments that belong to the same TE insertion (as indicated by the repeat ID) were summed up. Only transposons with a total of at least 20 (for two biological replicates) or 30 (for three biological replicates) mapped reads across WT and KO samples were considered for differential expression analysis. Transposons within the deleted KRAB-ZFP cluster were excluded from the analysis. Read count tables were used for differential expression analysis with DESeq2 (RRID:SCR_015687). For differential gene expression analysis, reads overlapping with gene exons were counted using HTSeq-count and analyzed using DESeq2. To test if KRAB-ZFP peaks are significantly enriched near up- or down-regulated genes, a binomial test was performed. Briefly, the proportion of the peaks that are located within a certain distance up- or downstream to the TSS of genes was determined using the windowBed function of BED tools. The probability p in the binomial distribution was estimated as the fraction of all genes overlapped with KRAB-ZFP peaks. Then, given n which is the number of specific groups of genes, and x which is the number of this group of genes overlapped with peaks, the R function binom.test() was used to estimate the p-value based on right-tailed Binomial test. Finally, the adjusted p-values were determined separately for LTR and LINE retrotransposon groups using the Benjamini-Hochberg approach implemented in the R function p.adjust()."
-    },
-    {
-      "self_ref": "#/texts/43",
-      "parent": {
-        "$ref": "#/texts/29"
-      },
-      "children": [
-        {
-          "$ref": "#/texts/44"
-        }
-      ],
-      "label": "section_header",
-      "prov": [],
-      "orig": "Reduced representation bisulfite sequencing (RRBS-seq)",
-      "text": "Reduced representation bisulfite sequencing (RRBS-seq)",
-      "level": 1
-    },
-    {
-      "self_ref": "#/texts/44",
-      "parent": {
-        "$ref": "#/texts/43"
-      },
-      "children": [],
-      "label": "text",
-      "prov": [],
-      "orig": "For RRBS-seq analysis, Chr4-cl WT and KO ES cells were grown in either standard ES cell media containing FCS or for one week in 2i media containing vitamin C as described previously (Blaschke et al., 2013). Genomic DNA was purified from WT and Chr4-cl KO ES cells using the Quick-gDNA purification kit (Zymo Research) and bisulfite-converted with the NEXTflex Bisulfite-Seq Kit (Bio Scientific) using Msp1 digestion to fragment DNA. Libraries were sequenced as 50 bp paired-end reads on an Illumina HiSeq. The reads were processed using Trim Galore (--illumina --paired \u2013rrbs) to trim poor quality bases and adaptors. Additionally, the first 5 nt of R2 and the last 3 nt of R1 and R2 were trimmed. Reads were then mapped to the reference genome (mm9) using Bismark (Krueger and Andrews, 2011) to extract methylation calling results. The CpG methylation pattern for each covered CpG dyads (two complementary CG dinucleotides) was calculated using a custom script (Source code 1: get_CpG_ML.pl). For comparison of CpG methylation between WT and Chr4-cl KO ES cells (in serum or 2i + Vitamin C conditions) only CpG sites with at least 10-fold coverage in each sample were considered for analysis.",
-      "text": "For RRBS-seq analysis, Chr4-cl WT and KO ES cells were grown in either standard ES cell media containing FCS or for one week in 2i media containing vitamin C as described previously (Blaschke et al., 2013). Genomic DNA was purified from WT and Chr4-cl KO ES cells using the Quick-gDNA purification kit (Zymo Research) and bisulfite-converted with the NEXTflex Bisulfite-Seq Kit (Bio Scientific) using Msp1 digestion to fragment DNA. Libraries were sequenced as 50 bp paired-end reads on an Illumina HiSeq. The reads were processed using Trim Galore (--illumina --paired \u2013rrbs) to trim poor quality bases and adaptors. Additionally, the first 5 nt of R2 and the last 3 nt of R1 and R2 were trimmed. Reads were then mapped to the reference genome (mm9) using Bismark (Krueger and Andrews, 2011) to extract methylation calling results. The CpG methylation pattern for each covered CpG dyads (two complementary CG dinucleotides) was calculated using a custom script (Source code 1: get_CpG_ML.pl). For comparison of CpG methylation between WT and Chr4-cl KO ES cells (in serum or 2i + Vitamin C conditions) only CpG sites with at least 10-fold coverage in each sample were considered for analysis."
-    },
-    {
-      "self_ref": "#/texts/45",
-      "parent": {
-        "$ref": "#/texts/29"
-      },
-      "children": [
-        {
-          "$ref": "#/texts/46"
-        }
-      ],
-      "label": "section_header",
-      "prov": [],
-      "orig": "Retrotransposition assay",
-      "text": "Retrotransposition assay",
-      "level": 1
-    },
-    {
-      "self_ref": "#/texts/46",
-      "parent": {
-        "$ref": "#/texts/45"
-      },
-      "children": [],
-      "label": "text",
-      "prov": [],
-      "orig": "The retrotransposition vectors pCMV-MusD2, pCMV-MusD2-neoTNF and pCMV-ETnI1-neoTNF (Ribet et al., 2004) were a kind gift from Dixie Mager. To partially delete the Gm13051 binding site within pCMV-MusD2-neoTNF, the vector was cut with KpnI and re-ligated using a repair oligo, leaving a 24 bp deletion within the Gm13051 binding site. The Rex2 binding site in pCMV-ETnI1-neoTNF was deleted by cutting the vector with EcoRI and XbaI followed by re-ligation using two overlapping PCR products, leaving a 45 bp deletion while maintaining the rest of the vector unchanged (see Supplementary file 3 for primer sequences). For MusD retrotransposition assays, 5 \u00d7 104 HeLa cells (ATCC CCL-2) were transfected in a 24-well dish with 100 ng pCMV-MusD2-neoTNF or pCMV-MusD2-neoTNF (\u0394Gm13051-m) using Lipofectamine 2000. For ETn retrotransposition assays, 50 ng of pCMV-ETnI1-neoTNF or pCMV-ETnI1-neoTNF (\u0394Rex2) vectors were cotransfected with 50 ng pCMV-MusD2 to provide gag and pol proteins in trans. G418 (0.6 mg/ml) was added five days after transfection and cells were grown under selection until colonies were readily visible by eye. G418-resistant colonies were stained with Amido Black (Sigma).",
-      "text": "The retrotransposition vectors pCMV-MusD2, pCMV-MusD2-neoTNF and pCMV-ETnI1-neoTNF (Ribet et al., 2004) were a kind gift from Dixie Mager. To partially delete the Gm13051 binding site within pCMV-MusD2-neoTNF, the vector was cut with KpnI and re-ligated using a repair oligo, leaving a 24 bp deletion within the Gm13051 binding site. The Rex2 binding site in pCMV-ETnI1-neoTNF was deleted by cutting the vector with EcoRI and XbaI followed by re-ligation using two overlapping PCR products, leaving a 45 bp deletion while maintaining the rest of the vector unchanged (see Supplementary file 3 for primer sequences). For MusD retrotransposition assays, 5 \u00d7 104 HeLa cells (ATCC CCL-2) were transfected in a 24-well dish with 100 ng pCMV-MusD2-neoTNF or pCMV-MusD2-neoTNF (\u0394Gm13051-m) using Lipofectamine 2000. For ETn retrotransposition assays, 50 ng of pCMV-ETnI1-neoTNF or pCMV-ETnI1-neoTNF (\u0394Rex2) vectors were cotransfected with 50 ng pCMV-MusD2 to provide gag and pol proteins in trans. G418 (0.6 mg/ml) was added five days after transfection and cells were grown under selection until colonies were readily visible by eye. G418-resistant colonies were stained with Amido Black (Sigma)."
-    },
-    {
-      "self_ref": "#/texts/47",
-      "parent": {
-        "$ref": "#/texts/29"
-      },
-      "children": [
-        {
-          "$ref": "#/texts/48"
-        }
-      ],
-      "label": "section_header",
-      "prov": [],
-      "orig": "Capture-seq screen",
-      "text": "Capture-seq screen",
-      "level": 1
-    },
-    {
-      "self_ref": "#/texts/48",
-      "parent": {
-        "$ref": "#/texts/47"
-      },
-      "children": [],
-      "label": "text",
-      "prov": [],
-      "orig": "To identify novel retrotransposon insertions, genomic DNA from various tissues (Supplementary file 4) was purified and used for library construction with target enrichment using the SureSelectQXT Target Enrichment kit (Agilent). Custom RNA capture probes were designed to hybridize with the 120 bp 5\u2019 ends of the 5\u2019 LTRs and the 120 bp 3\u2019 ends of the 3\u2019 LTR of about 600 intact (internal region flanked by two LTRs) MMETn/RLTRETN retrotransposons or of 140 RLTR4_MM/RLTR4 retrotransposons that were upregulated in Chr4-cl KO ES cells (Figure 4\u2014source data 2). Enriched libraries were sequenced on an Illumina HiSeq as paired-end 50 bp reads. R1 and R2 reads were mapped to the mm9 genome separately, using settings that only allow non-duplicated, uniquely mappable reads (Bowtie -m 1 --best --strata; samtools rmdup -s) and under settings that allow multimapping and duplicated reads (Bowtie --best). Of the latter, only reads that overlap (min. 50% of read) with RLTRETN, MMETn-int, ETnERV-int, ETnERV2-int or ETnERV3-int repeats (ETn) or RLTR4, RLTR4_MM-int or MuLV-int repeats (RLTR4) were kept. Only uniquely mappable reads whose paired reads were overlapping with the repeats mentioned above were used for further analysis. All ETn- and RLTR4-paired reads were then clustered (as bed files) using BEDTools (bedtools merge -i -n -d 1000) to receive a list of all potential annotated and non-annotated new ETn or RLTR4 insertion sites and all overlapping ETn- or RLTR4-paired reads were counted for each sample at each locus. Finally, all regions that were located within 1 kb of an annotated RLTRETN, MMETn-int, ETnERV-int, ETnERV2-int or ETnERV3-int repeat as well as regions overlapping with previously identified polymorphic ETn elements (Nell\u00e5ker et al., 2012) were removed. Genomic loci with at least 10 reads per million unique ETn- or RLTR4-paired reads were considered as insertion sites. To qualify for a de-novo insertion, we allowed no called insertions in any of the other screened mice at the locus and not a single read at the locus in the ancestors of the mouse. Insertions at the same locus in at least two siblings from the same offspring were considered as germ line insertions, if the insertion was absent in the parents and mice who were not direct descendants from these siblings. Full-length sequencing of new ETn insertions was done by Sanger sequencing of short PCR products in combination with Illumina sequencing of a large PCR product (Supplementary file 3), followed by de-novo assembly using the Unicycler software.",
-      "text": "To identify novel retrotransposon insertions, genomic DNA from various tissues (Supplementary file 4) was purified and used for library construction with target enrichment using the SureSelectQXT Target Enrichment kit (Agilent). Custom RNA capture probes were designed to hybridize with the 120 bp 5\u2019 ends of the 5\u2019 LTRs and the 120 bp 3\u2019 ends of the 3\u2019 LTR of about 600 intact (internal region flanked by two LTRs) MMETn/RLTRETN retrotransposons or of 140 RLTR4_MM/RLTR4 retrotransposons that were upregulated in Chr4-cl KO ES cells (Figure 4\u2014source data 2). Enriched libraries were sequenced on an Illumina HiSeq as paired-end 50 bp reads. R1 and R2 reads were mapped to the mm9 genome separately, using settings that only allow non-duplicated, uniquely mappable reads (Bowtie -m 1 --best --strata; samtools rmdup -s) and under settings that allow multimapping and duplicated reads (Bowtie --best). Of the latter, only reads that overlap (min. 50% of read) with RLTRETN, MMETn-int, ETnERV-int, ETnERV2-int or ETnERV3-int repeats (ETn) or RLTR4, RLTR4_MM-int or MuLV-int repeats (RLTR4) were kept. Only uniquely mappable reads whose paired reads were overlapping with the repeats mentioned above were used for further analysis. All ETn- and RLTR4-paired reads were then clustered (as bed files) using BEDTools (bedtools merge -i -n -d 1000) to receive a list of all potential annotated and non-annotated new ETn or RLTR4 insertion sites and all overlapping ETn- or RLTR4-paired reads were counted for each sample at each locus. Finally, all regions that were located within 1 kb of an annotated RLTRETN, MMETn-int, ETnERV-int, ETnERV2-int or ETnERV3-int repeat as well as regions overlapping with previously identified polymorphic ETn elements (Nell\u00e5ker et al., 2012) were removed. Genomic loci with at least 10 reads per million unique ETn- or RLTR4-paired reads were considered as insertion sites. To qualify for a de-novo insertion, we allowed no called insertions in any of the other screened mice at the locus and not a single read at the locus in the ancestors of the mouse. Insertions at the same locus in at least two siblings from the same offspring were considered as germ line insertions, if the insertion was absent in the parents and mice who were not direct descendants from these siblings. Full-length sequencing of new ETn insertions was done by Sanger sequencing of short PCR products in combination with Illumina sequencing of a large PCR product (Supplementary file 3), followed by de-novo assembly using the Unicycler software."
-    },
-    {
-      "self_ref": "#/texts/49",
-      "parent": {
-        "$ref": "#/texts/0"
-      },
-      "children": [
-        {
-          "$ref": "#/tables/0"
-        },
-        {
-          "$ref": "#/tables/1"
-        }
-      ],
-      "label": "section_header",
-      "prov": [],
-      "orig": "Tables",
-      "text": "Tables",
-      "level": 1
-    },
-    {
-      "self_ref": "#/texts/50",
-      "parent": {
-        "$ref": "#/body"
-      },
-      "children": [],
-      "label": "caption",
-      "prov": [],
-      "orig": "Table 1.: * Number of protein-coding KRAB-ZFP genes identified in a previously published screen (Imbeault et al., 2017) and the ChIP-seq data column indicates the number of KRAB-ZFPs for which ChIP-seq was performed in this study.",
-      "text": "Table 1.: * Number of protein-coding KRAB-ZFP genes identified in a previously published screen (Imbeault et al., 2017) and the ChIP-seq data column indicates the number of KRAB-ZFPs for which ChIP-seq was performed in this study."
-    },
-    {
-      "self_ref": "#/texts/51",
-      "parent": {
-        "$ref": "#/body"
-      },
-      "children": [],
-      "label": "caption",
-      "prov": [],
-      "orig": "Key resources table: ",
-      "text": "Key resources table: "
-    },
-    {
-      "self_ref": "#/texts/52",
-      "parent": {
-        "$ref": "#/texts/0"
-      },
-      "children": [
-        {
-          "$ref": "#/pictures/0"
-        },
-        {
-          "$ref": "#/pictures/1"
-        },
-        {
-          "$ref": "#/pictures/2"
-        },
-        {
-          "$ref": "#/pictures/3"
-        },
-        {
-          "$ref": "#/pictures/4"
-        },
-        {
-          "$ref": "#/pictures/5"
-        },
-        {
-          "$ref": "#/pictures/6"
-        },
-        {
-          "$ref": "#/pictures/7"
-        },
-        {
-          "$ref": "#/pictures/8"
-        },
-        {
-          "$ref": "#/pictures/9"
-        },
-        {
-          "$ref": "#/pictures/10"
-        }
-      ],
-      "label": "section_header",
-      "prov": [],
-      "orig": "Figures",
-      "text": "Figures",
-      "level": 1
-    },
-    {
-      "self_ref": "#/texts/53",
-      "parent": {
-        "$ref": "#/body"
-      },
-      "children": [],
-      "label": "caption",
-      "prov": [],
-      "orig": "Figure 1.: Genome-wide binding patterns of mouse KRAB-ZFPs.\n(A) Probability heatmap of KRAB-ZFP binding to TEs. Blue color intensity (main field) corresponds to -log10 (adjusted p-value) enrichment of ChIP-seq peak overlap with TE groups (Fisher\u2019s exact test). The green/red color intensity (top panel) represents mean KAP1 (GEO accession: GSM1406445) and H3K9me3 (GEO accession: GSM1327148) enrichment (respectively) at peaks overlapping significantly targeted TEs (adjusted p-value<1e-5) in WT ES cells. (B) Summarized ChIP-seq signal for indicated KRAB-ZFPs and previously published KAP1 and H3K9me3 in WT ES cells across 127 intact ETn elements. (C) Heatmaps of KRAB-ZFP ChIP-seq signal at ChIP-seq peaks. For better comparison, peaks for all three KRAB-ZFPs were called with the same parameters (p<1e-10, peak enrichment\u00a0>20). The top panel shows a schematic of the arrangement of the contact amino acid composition of each zinc finger. Zinc fingers are grouped and colored according to similarity, with amino acid differences relative to the five consensus fingers highlighted in white.\nFigure 1\u2014source data 1.KRAB-ZFP expression in 40 mouse tissues and cell lines (ENCODE).Mean values of replicates are shown as log2 transcripts per million.\nFigure 1\u2014source data 2.Probability heatmap of KRAB-ZFP binding to TEs.Values corresponds to -log10 (adjusted p-value) enrichment of ChIP-seq peak overlap with TE groups (Fisher\u2019s exact test).",
-      "text": "Figure 1.: Genome-wide binding patterns of mouse KRAB-ZFPs.\n(A) Probability heatmap of KRAB-ZFP binding to TEs. Blue color intensity (main field) corresponds to -log10 (adjusted p-value) enrichment of ChIP-seq peak overlap with TE groups (Fisher\u2019s exact test). The green/red color intensity (top panel) represents mean KAP1 (GEO accession: GSM1406445) and H3K9me3 (GEO accession: GSM1327148) enrichment (respectively) at peaks overlapping significantly targeted TEs (adjusted p-value<1e-5) in WT ES cells. (B) Summarized ChIP-seq signal for indicated KRAB-ZFPs and previously published KAP1 and H3K9me3 in WT ES cells across 127 intact ETn elements. (C) Heatmaps of KRAB-ZFP ChIP-seq signal at ChIP-seq peaks. For better comparison, peaks for all three KRAB-ZFPs were called with the same parameters (p<1e-10, peak enrichment\u00a0>20). The top panel shows a schematic of the arrangement of the contact amino acid composition of each zinc finger. Zinc fingers are grouped and colored according to similarity, with amino acid differences relative to the five consensus fingers highlighted in white.\nFigure 1\u2014source data 1.KRAB-ZFP expression in 40 mouse tissues and cell lines (ENCODE).Mean values of replicates are shown as log2 transcripts per million.\nFigure 1\u2014source data 2.Probability heatmap of KRAB-ZFP binding to TEs.Values corresponds to -log10 (adjusted p-value) enrichment of ChIP-seq peak overlap with TE groups (Fisher\u2019s exact test)."
-    },
-    {
-      "self_ref": "#/texts/54",
-      "parent": {
-        "$ref": "#/body"
-      },
-      "children": [],
-      "label": "caption",
-      "prov": [],
-      "orig": "Figure 1\u2014figure supplement 1.: ES cell-specific expression of KRAB-ZFP gene clusters.\n(A) Heatmap showing expression patterns of mouse KRAB-ZFPs in 40 mouse tissues and cell lines (ENCODE). Heatmap colors indicate gene expression levels in log2 transcripts per million (TPM). The asterisk indicates a group of 30 KRAB-ZFPs that are exclusively expressed in ES cells. (B) Physical location of the genes encoding for the 30 KRAB-ZFPs that are exclusively expressed in ES cells. (C) Phylogenetic (Maximum likelihood) tree of the KRAB domains of mouse KRAB-ZFPs. KRAB-ZFPs encoded on the gene clusters on chromosome 2 and 4 are highlighted. The scale bar at the bottom indicates amino acid substitutions per site.",
-      "text": "Figure 1\u2014figure supplement 1.: ES cell-specific expression of KRAB-ZFP gene clusters.\n(A) Heatmap showing expression patterns of mouse KRAB-ZFPs in 40 mouse tissues and cell lines (ENCODE). Heatmap colors indicate gene expression levels in log2 transcripts per million (TPM). The asterisk indicates a group of 30 KRAB-ZFPs that are exclusively expressed in ES cells. (B) Physical location of the genes encoding for the 30 KRAB-ZFPs that are exclusively expressed in ES cells. (C) Phylogenetic (Maximum likelihood) tree of the KRAB domains of mouse KRAB-ZFPs. KRAB-ZFPs encoded on the gene clusters on chromosome 2 and 4 are highlighted. The scale bar at the bottom indicates amino acid substitutions per site."
-    },
-    {
-      "self_ref": "#/texts/55",
-      "parent": {
-        "$ref": "#/body"
-      },
-      "children": [],
-      "label": "caption",
-      "prov": [],
-      "orig": "Figure 1\u2014figure supplement 2.: KRAB-ZFP binding motifs and their repression activity.\n(A) Comparison of computationally predicted (bottom) and experimentally determined (top) KRAB-ZFP binding motifs. Only significant pairs are shown (FDR\u00a0<\u00a00.1). (B) Luciferase reporter assays to confirm KRAB-ZFP repression of the identified target sites. Bars show the luciferase activity (normalized to Renilla luciferase) of reporter plasmids containing the indicated target sites cloned upstream of the SV40 promoter. Reporter plasmids were co-transfected into 293 T cells with a Renilla luciferase plasmid for normalization and plasmids expressing the targeting KRAB-ZFP. Normalized mean luciferase activity (from three replicates) is shown relative to luciferase activity of the reporter plasmid co-transfected with an empty pcDNA3.1 vector.",
-      "text": "Figure 1\u2014figure supplement 2.: KRAB-ZFP binding motifs and their repression activity.\n(A) Comparison of computationally predicted (bottom) and experimentally determined (top) KRAB-ZFP binding motifs. Only significant pairs are shown (FDR\u00a0<\u00a00.1). (B) Luciferase reporter assays to confirm KRAB-ZFP repression of the identified target sites. Bars show the luciferase activity (normalized to Renilla luciferase) of reporter plasmids containing the indicated target sites cloned upstream of the SV40 promoter. Reporter plasmids were co-transfected into 293 T cells with a Renilla luciferase plasmid for normalization and plasmids expressing the targeting KRAB-ZFP. Normalized mean luciferase activity (from three replicates) is shown relative to luciferase activity of the reporter plasmid co-transfected with an empty pcDNA3.1 vector."
-    },
-    {
-      "self_ref": "#/texts/56",
-      "parent": {
-        "$ref": "#/body"
-      },
-      "children": [],
-      "label": "caption",
-      "prov": [],
-      "orig": "Figure 1\u2014figure supplement 3.: KRAB-ZFP binding to ETn retrotransposons.\n(A) Comparison of the PBSLys1,2 sequence with Zfp961 binding motifs in nonrepetitive peaks (Nonrep) and peaks at ETn elements. (B) Retrotransposition assays of original (ETnI1-neoTNF and MusD2-neoTNF Ribet et al., 2004) and modified reporter vectors where the Rex2 or Gm13051 binding motifs where removed. Schematic of reporter vectors are displayed at the top. HeLa cells were transfected as described in the Materials and Methods section and neo-resistant colonies, indicating retrotransposition events, were selected and stained. (C) Stem-loop structure of the ETn RNA export signal, the Gm13051 motif on the corresponding DNA is marked with red circles, the part of the motif that was deleted is indicated with grey crosses (adapted from Legiewicz et al., 2010).",
-      "text": "Figure 1\u2014figure supplement 3.: KRAB-ZFP binding to ETn retrotransposons.\n(A) Comparison of the PBSLys1,2 sequence with Zfp961 binding motifs in nonrepetitive peaks (Nonrep) and peaks at ETn elements. (B) Retrotransposition assays of original (ETnI1-neoTNF and MusD2-neoTNF Ribet et al., 2004) and modified reporter vectors where the Rex2 or Gm13051 binding motifs where removed. Schematic of reporter vectors are displayed at the top. HeLa cells were transfected as described in the Materials and Methods section and neo-resistant colonies, indicating retrotransposition events, were selected and stained. (C) Stem-loop structure of the ETn RNA export signal, the Gm13051 motif on the corresponding DNA is marked with red circles, the part of the motif that was deleted is indicated with grey crosses (adapted from Legiewicz et al., 2010)."
-    },
-    {
-      "self_ref": "#/texts/57",
-      "parent": {
-        "$ref": "#/body"
-      },
-      "children": [],
-      "label": "caption",
-      "prov": [],
-      "orig": "Figure 2.: Retrotransposon reactivation in KRAB-ZFP cluster KO ES cells.\n(A) RNA-seq analysis of TE expression in five KRAB-ZFP cluster KO ES cells. Green and grey squares on top of the panel represent KRAB-ZFPs with or without ChIP-seq data, respectively, within each deleted gene cluster. Reactivated TEs that are bound by one or several KRAB-ZFPs are indicated by green squares in the panel. Significantly up- and downregulated elements (adjusted p-value<0.05) are highlighted in red and green, respectively. (B) Differential KAP1 binding and H3K9me3 enrichment at TE groups (summarized across all insertions) in Chr2-cl and Chr4-cl KO ES cells. TE groups targeted by one or several KRAB-ZFPs encoded within the deleted clusters are highlighted in blue (differential enrichment over the entire TE sequences) and red (differential enrichment at TE regions that overlap with KRAB-ZFP ChIP-seq peaks). (C) DNA methylation status of CpG sites at indicated TE groups in WT and Chr4-cl KO ES cells grown in serum containing media or in hypomethylation-inducing media (2i + Vitamin C). P-values were calculated using paired t-test.\nFigure 2\u2014source data 1.Differential H3K9me3 and KAP1 distribution in WT and KRAB-ZFP cluster KO ES cells at TE families and KRAB-ZFP bound TE insertions.Differential read counts and statistical testing were determined by DESeq2.",
-      "text": "Figure 2.: Retrotransposon reactivation in KRAB-ZFP cluster KO ES cells.\n(A) RNA-seq analysis of TE expression in five KRAB-ZFP cluster KO ES cells. Green and grey squares on top of the panel represent KRAB-ZFPs with or without ChIP-seq data, respectively, within each deleted gene cluster. Reactivated TEs that are bound by one or several KRAB-ZFPs are indicated by green squares in the panel. Significantly up- and downregulated elements (adjusted p-value<0.05) are highlighted in red and green, respectively. (B) Differential KAP1 binding and H3K9me3 enrichment at TE groups (summarized across all insertions) in Chr2-cl and Chr4-cl KO ES cells. TE groups targeted by one or several KRAB-ZFPs encoded within the deleted clusters are highlighted in blue (differential enrichment over the entire TE sequences) and red (differential enrichment at TE regions that overlap with KRAB-ZFP ChIP-seq peaks). (C) DNA methylation status of CpG sites at indicated TE groups in WT and Chr4-cl KO ES cells grown in serum containing media or in hypomethylation-inducing media (2i + Vitamin C). P-values were calculated using paired t-test.\nFigure 2\u2014source data 1.Differential H3K9me3 and KAP1 distribution in WT and KRAB-ZFP cluster KO ES cells at TE families and KRAB-ZFP bound TE insertions.Differential read counts and statistical testing were determined by DESeq2."
-    },
-    {
-      "self_ref": "#/texts/58",
-      "parent": {
-        "$ref": "#/body"
-      },
-      "children": [],
-      "label": "caption",
-      "prov": [],
-      "orig": "Figure 2\u2014figure supplement 1.: Epigenetic changes at TEs and TE-borne enhancers in KRAB-ZFP cluster KO ES cells.\n(A) Differential analysis of summative (all individual insertions combined) H3K9me3 enrichment at TE groups in Chr10-cl, Chr13.1-cl and Chr13.2-cl KO ES cells.\u00a0TE groups targeted by one or several KRAB-ZFPs encoded within the deleted clusters are highlighted in orange (differential enrichment over the entire TE sequences) and red (differential enrichment at TE regions that overlap with KRAB-ZFP ChIP-seq peaks). (B) Top: Schematic view of the Cd59a/Cd59b locus with a 5\u2019 truncated ETn insertion. ChIP-seq (Input subtracted from ChIP) data for overexpressed epitope-tagged Gm13051 (a Chr4-cl KRAB-ZFP) in F9 EC cells, and re-mapped KAP1 (GEO accession: GSM1406445) and H3K9me3 (GEO accession: GSM1327148) in WT ES cells are shown together with RNA-seq data from Chr4-cl WT and KO ES cells (mapped using Bowtie (-a -m 1 --strata -v 2) to exclude reads that cannot be uniquely mapped). Bottom: Transcriptional activity of a 5 kb fragment with or without fragments of the ETn insertion was tested by luciferase reporter assay in Chr4-cl WT and KO ES cells.",
-      "text": "Figure 2\u2014figure supplement 1.: Epigenetic changes at TEs and TE-borne enhancers in KRAB-ZFP cluster KO ES cells.\n(A) Differential analysis of summative (all individual insertions combined) H3K9me3 enrichment at TE groups in Chr10-cl, Chr13.1-cl and Chr13.2-cl KO ES cells.\u00a0TE groups targeted by one or several KRAB-ZFPs encoded within the deleted clusters are highlighted in orange (differential enrichment over the entire TE sequences) and red (differential enrichment at TE regions that overlap with KRAB-ZFP ChIP-seq peaks). (B) Top: Schematic view of the Cd59a/Cd59b locus with a 5\u2019 truncated ETn insertion. ChIP-seq (Input subtracted from ChIP) data for overexpressed epitope-tagged Gm13051 (a Chr4-cl KRAB-ZFP) in F9 EC cells, and re-mapped KAP1 (GEO accession: GSM1406445) and H3K9me3 (GEO accession: GSM1327148) in WT ES cells are shown together with RNA-seq data from Chr4-cl WT and KO ES cells (mapped using Bowtie (-a -m 1 --strata -v 2) to exclude reads that cannot be uniquely mapped). Bottom: Transcriptional activity of a 5 kb fragment with or without fragments of the ETn insertion was tested by luciferase reporter assay in Chr4-cl WT and KO ES cells."
-    },
-    {
-      "self_ref": "#/texts/59",
-      "parent": {
-        "$ref": "#/body"
-      },
-      "children": [],
-      "label": "caption",
-      "prov": [],
-      "orig": "Figure 3.: TE-dependent gene activation in KRAB-ZFP cluster KO ES cells.\n(A) Differential gene expression in Chr2-cl and Chr4-cl KO ES cells. Significantly up- and downregulated genes (adjusted p-value<0.05) are highlighted in red and green, respectively, KRAB-ZFP genes within the deleted clusters are shown in blue. (B) Correlation of TEs and gene deregulation. Plots show enrichment of TE groups within 100 kb of up- and downregulated genes relative to all genes. Significantly overrepresented LTR and LINE groups (adjusted p-value<0.1) are highlighted in blue and red, respectively. (C) Schematic view of the downstream region of Chst1 where a 5\u2019 truncated ETn insertion is located. ChIP-seq (Input subtracted from ChIP) data for overexpressed epitope-tagged Gm13051 (a Chr4-cl KRAB-ZFP) in F9 EC cells, and re-mapped KAP1 (GEO accession: GSM1406445) and H3K9me3 (GEO accession: GSM1327148) in WT ES cells are shown together with RNA-seq data from Chr4-cl WT and KO ES cells (mapped using Bowtie (-a -m 1 --strata -v 2) to exclude reads that cannot be uniquely mapped). (D) RT-qPCR analysis of Chst1 mRNA expression in Chr4-cl WT and KO ES cells with or without the CRISPR/Cas9 deleted ETn insertion near Chst1. Values represent mean expression (normalized to Gapdh) from three biological replicates per sample (each performed in three technical replicates) in arbitrary units. Error bars represent standard deviation and asterisks indicate significance (p<0.01, Student\u2019s t-test). n.s.: not significant. (E) Mean coverage of ChIP-seq data (Input subtracted from ChIP) in Chr4-cl WT and KO ES cells over 127 full-length ETn insertions. The binding sites of the Chr4-cl KRAB-ZFPs Rex2 and Gm13051 are indicated by dashed lines.",
-      "text": "Figure 3.: TE-dependent gene activation in KRAB-ZFP cluster KO ES cells.\n(A) Differential gene expression in Chr2-cl and Chr4-cl KO ES cells. Significantly up- and downregulated genes (adjusted p-value<0.05) are highlighted in red and green, respectively, KRAB-ZFP genes within the deleted clusters are shown in blue. (B) Correlation of TEs and gene deregulation. Plots show enrichment of TE groups within 100 kb of up- and downregulated genes relative to all genes. Significantly overrepresented LTR and LINE groups (adjusted p-value<0.1) are highlighted in blue and red, respectively. (C) Schematic view of the downstream region of Chst1 where a 5\u2019 truncated ETn insertion is located. ChIP-seq (Input subtracted from ChIP) data for overexpressed epitope-tagged Gm13051 (a Chr4-cl KRAB-ZFP) in F9 EC cells, and re-mapped KAP1 (GEO accession: GSM1406445) and H3K9me3 (GEO accession: GSM1327148) in WT ES cells are shown together with RNA-seq data from Chr4-cl WT and KO ES cells (mapped using Bowtie (-a -m 1 --strata -v 2) to exclude reads that cannot be uniquely mapped). (D) RT-qPCR analysis of Chst1 mRNA expression in Chr4-cl WT and KO ES cells with or without the CRISPR/Cas9 deleted ETn insertion near Chst1. Values represent mean expression (normalized to Gapdh) from three biological replicates per sample (each performed in three technical replicates) in arbitrary units. Error bars represent standard deviation and asterisks indicate significance (p<0.01, Student\u2019s t-test). n.s.: not significant. (E) Mean coverage of ChIP-seq data (Input subtracted from ChIP) in Chr4-cl WT and KO ES cells over 127 full-length ETn insertions. The binding sites of the Chr4-cl KRAB-ZFPs Rex2 and Gm13051 are indicated by dashed lines."
-    },
-    {
-      "self_ref": "#/texts/60",
-      "parent": {
-        "$ref": "#/body"
-      },
-      "children": [],
-      "label": "caption",
-      "prov": [],
-      "orig": "Figure 4.: ETn retrotransposition in Chr4-cl KO mice.\n(A) Pedigree of mice used for transposon insertion screening by capture-seq in mice of different strain backgrounds. The number of novel ETn insertions (only present in one animal) are indicated. For animals whose direct ancestors have not been screened, the ETn insertions are shown in parentheses since parental inheritance cannot be excluded in that case. Germ line insertions are indicated by asterisks. All DNA samples were prepared from tail tissues unless noted (-S: spleen, -E: ear, -B:Blood) (B) Statistical analysis of ETn insertion frequency in tail tissue from 30 Chr4-cl KO, KO/WT and WT mice that were derived from one Chr4-c KO x KO/WT and two Chr4-cl KO/WT x KO/WT matings. Only DNA samples that were collected from juvenile tails were considered for this analysis. P-values were calculated using one-sided Wilcoxon Rank Sum Test. In the last panel, KO, WT and KO/WT mice derived from all matings were combined for the statistical analysis.\nFigure 4\u2014source data 1.Coordinates of identified novel ETn insertions and supporting capture-seq read counts.Genomic regions indicate cluster of supporting reads.\nFigure 4\u2014source data 2.Sequences of capture-seq probes used to enrich genomic DNA for ETn and MuLV (RLTR4) insertions.",
-      "text": "Figure 4.: ETn retrotransposition in Chr4-cl KO mice.\n(A) Pedigree of mice used for transposon insertion screening by capture-seq in mice of different strain backgrounds. The number of novel ETn insertions (only present in one animal) are indicated. For animals whose direct ancestors have not been screened, the ETn insertions are shown in parentheses since parental inheritance cannot be excluded in that case. Germ line insertions are indicated by asterisks. All DNA samples were prepared from tail tissues unless noted (-S: spleen, -E: ear, -B:Blood) (B) Statistical analysis of ETn insertion frequency in tail tissue from 30 Chr4-cl KO, KO/WT and WT mice that were derived from one Chr4-c KO x KO/WT and two Chr4-cl KO/WT x KO/WT matings. Only DNA samples that were collected from juvenile tails were considered for this analysis. P-values were calculated using one-sided Wilcoxon Rank Sum Test. In the last panel, KO, WT and KO/WT mice derived from all matings were combined for the statistical analysis.\nFigure 4\u2014source data 1.Coordinates of identified novel ETn insertions and supporting capture-seq read counts.Genomic regions indicate cluster of supporting reads.\nFigure 4\u2014source data 2.Sequences of capture-seq probes used to enrich genomic DNA for ETn and MuLV (RLTR4) insertions."
-    },
-    {
-      "self_ref": "#/texts/61",
-      "parent": {
-        "$ref": "#/body"
-      },
-      "children": [],
-      "label": "caption",
-      "prov": [],
-      "orig": "Figure 4\u2014figure supplement 1.: Birth statistics of KRAB-ZFP cluster KO mice and TE reactivation in adult tissues.\n(A) Birth statistics of Chr4- and Chr2-cl mice derived from KO/WT x KO/WT matings in different strain backgrounds.\u00a0(B) RNA-seq analysis of TE expression in Chr2- (left) and Chr4-cl (right) KO tissues. TE groups with the highest reactivation phenotype in ES cells are shown separately. Significantly up- and downregulated elements (adjusted p-value<0.05) are highlighted in red and green, respectively. Experiments were performed in at least two biological replicates.",
-      "text": "Figure 4\u2014figure supplement 1.: Birth statistics of KRAB-ZFP cluster KO mice and TE reactivation in adult tissues.\n(A) Birth statistics of Chr4- and Chr2-cl mice derived from KO/WT x KO/WT matings in different strain backgrounds.\u00a0(B) RNA-seq analysis of TE expression in Chr2- (left) and Chr4-cl (right) KO tissues. TE groups with the highest reactivation phenotype in ES cells are shown separately. Significantly up- and downregulated elements (adjusted p-value<0.05) are highlighted in red and green, respectively. Experiments were performed in at least two biological replicates."
-    },
-    {
-      "self_ref": "#/texts/62",
-      "parent": {
-        "$ref": "#/body"
-      },
-      "children": [],
-      "label": "caption",
-      "prov": [],
-      "orig": "Figure 4\u2014figure supplement 2.: Identification of polymorphic ETn and MuLV retrotransposon insertions in Chr4-cl KO and WT mice.\nHeatmaps show normalized capture-seq read counts in RPM (Read Per Million) for identified polymorphic ETn (A) and MuLV (B) loci in different mouse strains. Only loci with strong support for germ line ETn or MuLV insertions (at least 100 or 3000 ETn or MuLV RPM, respectively) in at least two animals are shown. Non-polymorphic insertion loci with high read counts in all screened mice were excluded for better visibility. The sample information (sample name and cell type/tissue) is annotated at the bottom, with the strain information indicated by color at the top. The color gradient indicates log10(RPM+1).",
-      "text": "Figure 4\u2014figure supplement 2.: Identification of polymorphic ETn and MuLV retrotransposon insertions in Chr4-cl KO and WT mice.\nHeatmaps show normalized capture-seq read counts in RPM (Read Per Million) for identified polymorphic ETn (A) and MuLV (B) loci in different mouse strains. Only loci with strong support for germ line ETn or MuLV insertions (at least 100 or 3000 ETn or MuLV RPM, respectively) in at least two animals are shown. Non-polymorphic insertion loci with high read counts in all screened mice were excluded for better visibility. The sample information (sample name and cell type/tissue) is annotated at the bottom, with the strain information indicated by color at the top. The color gradient indicates log10(RPM+1)."
-    },
-    {
-      "self_ref": "#/texts/63",
-      "parent": {
-        "$ref": "#/body"
-      },
-      "children": [],
-      "label": "caption",
-      "prov": [],
-      "orig": "Figure 4\u2014figure supplement 3.: Confirmation of novel ETn insertions identified by capture-seq.\n(A) PCR validation of novel ETn insertions in genomic DNA of three littermates (IDs: T09673, T09674 and T00436) and their parents (T3913 and T3921). Primer sequences are shown in Supplementary file 3. (B) ETn capture-seq read counts (RPM) at putative novel somatic (loci identified exclusively in one single animal), novel germ line (loci identified in several littermates) insertions, and at B6 reference ETn elements. (C) Heatmap shows capture-seq read counts (RPM) of a Chr4-cl KO mouse (ID: C6733) as determined in different tissues. Each row represents a novel ETn locus that was identified in at least one tissue. The color gradient indicates log10(RPM+1). (D) Heatmap shows the capture-seq RPM in technical replicates using the same Chr4-cl KO DNA sample (rep1/rep2) or replicates with DNA samples prepared from different sections of the tail from the same mouse at different ages (tail1/tail2). Each row represents a novel ETn locus that was identified in at least one of the displayed samples. The color gradient indicates log10(RPM+1).",
-      "text": "Figure 4\u2014figure supplement 3.: Confirmation of novel ETn insertions identified by capture-seq.\n(A) PCR validation of novel ETn insertions in genomic DNA of three littermates (IDs: T09673, T09674 and T00436) and their parents (T3913 and T3921). Primer sequences are shown in Supplementary file 3. (B) ETn capture-seq read counts (RPM) at putative novel somatic (loci identified exclusively in one single animal), novel germ line (loci identified in several littermates) insertions, and at B6 reference ETn elements. (C) Heatmap shows capture-seq read counts (RPM) of a Chr4-cl KO mouse (ID: C6733) as determined in different tissues. Each row represents a novel ETn locus that was identified in at least one tissue. The color gradient indicates log10(RPM+1). (D) Heatmap shows the capture-seq RPM in technical replicates using the same Chr4-cl KO DNA sample (rep1/rep2) or replicates with DNA samples prepared from different sections of the tail from the same mouse at different ages (tail1/tail2). Each row represents a novel ETn locus that was identified in at least one of the displayed samples. The color gradient indicates log10(RPM+1)."
-    },
-    {
-      "self_ref": "#/texts/64",
-      "parent": {
-        "$ref": "#/texts/0"
-      },
-      "children": [
-        {
-          "$ref": "#/groups/0"
-        }
-      ],
-      "label": "section_header",
-      "prov": [],
-      "orig": "References",
-      "text": "References",
-      "level": 1
-    },
-    {
-      "self_ref": "#/texts/65",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "TL Bailey; M Boden; FA Buske; M Frith; CE Grant; L Clementi; J Ren; WW Li; WS Noble. MEME SUITE: tools for motif discovery and searching. Nucleic Acids Research (2009)",
-      "text": "TL Bailey; M Boden; FA Buske; M Frith; CE Grant; L Clementi; J Ren; WW Li; WS Noble. MEME SUITE: tools for motif discovery and searching. Nucleic Acids Research (2009)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/66",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "C Baust; L Gagnier; GJ Baillie; MJ Harris; DM Juriloff; DL Mager. Structure and expression of mobile ETnII retroelements and their coding-competent MusD relatives in the mouse. Journal of Virology (2003)",
-      "text": "C Baust; L Gagnier; GJ Baillie; MJ Harris; DM Juriloff; DL Mager. Structure and expression of mobile ETnII retroelements and their coding-competent MusD relatives in the mouse. Journal of Virology (2003)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/67",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "K Blaschke; KT Ebata; MM Karimi; JA Zepeda-Mart\u00ednez; P Goyal; S Mahapatra; A Tam; DJ Laird; M Hirst; A Rao; MC Lorincz; M Ramalho-Santos. Vitamin C induces Tet-dependent DNA demethylation and a blastocyst-like state in ES cells. Nature (2013)",
-      "text": "K Blaschke; KT Ebata; MM Karimi; JA Zepeda-Mart\u00ednez; P Goyal; S Mahapatra; A Tam; DJ Laird; M Hirst; A Rao; MC Lorincz; M Ramalho-Santos. Vitamin C induces Tet-dependent DNA demethylation and a blastocyst-like state in ES cells. Nature (2013)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/68",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "A Brodziak; E Zi\u00f3\u0142ko; M Muc-Wierzgo\u0144; E Nowakowska-Zajdel; T Kokot; K Klakla. The role of human endogenous retroviruses in the pathogenesis of autoimmune diseases. Medical Science Monitor : International Medical Journal of Experimental and Clinical Research (2012)",
-      "text": "A Brodziak; E Zi\u00f3\u0142ko; M Muc-Wierzgo\u0144; E Nowakowska-Zajdel; T Kokot; K Klakla. The role of human endogenous retroviruses in the pathogenesis of autoimmune diseases. Medical Science Monitor : International Medical Journal of Experimental and Clinical Research (2012)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/69",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "N Castro-Diaz; G Ecco; A Coluccio; A Kapopoulou; B Yazdanpanah; M Friedli; J Duc; SM Jang; P Turelli; D Trono. Evolutionally dynamic L1 regulation in embryonic stem cells. Genes & Development (2014)",
-      "text": "N Castro-Diaz; G Ecco; A Coluccio; A Kapopoulou; B Yazdanpanah; M Friedli; J Duc; SM Jang; P Turelli; D Trono. Evolutionally dynamic L1 regulation in embryonic stem cells. Genes & Development (2014)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/70",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "EB Chuong; NC Elde; C Feschotte. Regulatory evolution of innate immunity through co-option of endogenous retroviruses. Science (2016)",
-      "text": "EB Chuong; NC Elde; C Feschotte. Regulatory evolution of innate immunity through co-option of endogenous retroviruses. Science (2016)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/71",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "J Dan; Y Liu; N Liu; M Chiourea; M Okuka; T Wu; X Ye; C Mou; L Wang; L Wang; Y Yin; J Yuan; B Zuo; F Wang; Z Li; X Pan; Z Yin; L Chen; DL Keefe; S Gagos; A Xiao; L Liu. Rif1 maintains telomere length homeostasis of ESCs by mediating heterochromatin silencing. Developmental Cell (2014)",
-      "text": "J Dan; Y Liu; N Liu; M Chiourea; M Okuka; T Wu; X Ye; C Mou; L Wang; L Wang; Y Yin; J Yuan; B Zuo; F Wang; Z Li; X Pan; Z Yin; L Chen; DL Keefe; S Gagos; A Xiao; L Liu. Rif1 maintains telomere length homeostasis of ESCs by mediating heterochromatin silencing. Developmental Cell (2014)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/72",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "A De Iaco; E Planet; A Coluccio; S Verp; J Duc; D Trono. DUX-family transcription factors regulate zygotic genome activation in placental mammals. Nature Genetics (2017)",
-      "text": "A De Iaco; E Planet; A Coluccio; S Verp; J Duc; D Trono. DUX-family transcription factors regulate zygotic genome activation in placental mammals. Nature Genetics (2017)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/73",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "\u00d6 Deniz; L de la Rica; KCL Cheng; D Spensberger; MR Branco. SETDB1 prevents TET2-dependent activation of IAP retroelements in na\u00efve embryonic stem cells. Genome Biology (2018)",
-      "text": "\u00d6 Deniz; L de la Rica; KCL Cheng; D Spensberger; MR Branco. SETDB1 prevents TET2-dependent activation of IAP retroelements in na\u00efve embryonic stem cells. Genome Biology (2018)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/74",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "M Dewannieux; T Heidmann. Endogenous retroviruses: acquisition, amplification and taming of genome invaders. Current Opinion in Virology (2013)",
-      "text": "M Dewannieux; T Heidmann. Endogenous retroviruses: acquisition, amplification and taming of genome invaders. Current Opinion in Virology (2013)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/75",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "G Ecco; M Cassano; A Kauzlaric; J Duc; A Coluccio; S Offner; M Imbeault; HM Rowe; P Turelli; D Trono. Transposable elements and their KRAB-ZFP controllers regulate gene expression in adult tissues. Developmental Cell (2016)",
-      "text": "G Ecco; M Cassano; A Kauzlaric; J Duc; A Coluccio; S Offner; M Imbeault; HM Rowe; P Turelli; D Trono. Transposable elements and their KRAB-ZFP controllers regulate gene expression in adult tissues. Developmental Cell (2016)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/76",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "G Ecco; M Imbeault; D Trono. KRAB zinc finger proteins. Development (2017)",
-      "text": "G Ecco; M Imbeault; D Trono. KRAB zinc finger proteins. Development (2017)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/77",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "JA Frank; C Feschotte. Co-option of endogenous viral sequences for host cell function. Current Opinion in Virology (2017)",
-      "text": "JA Frank; C Feschotte. Co-option of endogenous viral sequences for host cell function. Current Opinion in Virology (2017)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/78",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "L Gagnier; VP Belancio; DL Mager. Mouse germ line mutations due to retrotransposon insertions. Mobile DNA (2019)",
-      "text": "L Gagnier; VP Belancio; DL Mager. Mouse germ line mutations due to retrotransposon insertions. Mobile DNA (2019)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/79",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "AC Groner; S Meylan; A Ciuffi; N Zangger; G Ambrosini; N D\u00e9nervaud; P Bucher; D Trono. KRAB-zinc finger proteins and KAP1 can mediate long-range transcriptional repression through heterochromatin spreading. PLOS Genetics (2010)",
-      "text": "AC Groner; S Meylan; A Ciuffi; N Zangger; G Ambrosini; N D\u00e9nervaud; P Bucher; D Trono. KRAB-zinc finger proteins and KAP1 can mediate long-range transcriptional repression through heterochromatin spreading. PLOS Genetics (2010)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/80",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "DC Hancks; HH Kazazian. Roles for retrotransposon insertions in human disease. Mobile DNA (2016)",
-      "text": "DC Hancks; HH Kazazian. Roles for retrotransposon insertions in human disease. Mobile DNA (2016)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/81",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "M Imbeault; PY Helleboid; D Trono. KRAB zinc-finger proteins contribute to the evolution of gene regulatory networks. Nature (2017)",
-      "text": "M Imbeault; PY Helleboid; D Trono. KRAB zinc-finger proteins contribute to the evolution of gene regulatory networks. Nature (2017)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/82",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "FM Jacobs; D Greenberg; N Nguyen; M Haeussler; AD Ewing; S Katzman; B Paten; SR Salama; D Haussler. An evolutionary arms race between KRAB zinc-finger genes ZNF91/93 and SVA/L1 retrotransposons. Nature (2014)",
-      "text": "FM Jacobs; D Greenberg; N Nguyen; M Haeussler; AD Ewing; S Katzman; B Paten; SR Salama; D Haussler. An evolutionary arms race between KRAB zinc-finger genes ZNF91/93 and SVA/L1 retrotransposons. Nature (2014)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/83",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "H Kano; H Kurahashi; T Toda. Genetically regulated epigenetic transcriptional activation of retrotransposon insertion confers mouse dactylaplasia phenotype. PNAS (2007)",
-      "text": "H Kano; H Kurahashi; T Toda. Genetically regulated epigenetic transcriptional activation of retrotransposon insertion confers mouse dactylaplasia phenotype. PNAS (2007)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/84",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "MM Karimi; P Goyal; IA Maksakova; M Bilenky; D Leung; JX Tang; Y Shinkai; DL Mager; S Jones; M Hirst; MC Lorincz. DNA methylation and SETDB1/H3K9me3 regulate predominantly distinct sets of genes, retroelements, and chimeric transcripts in mESCs. Cell Stem Cell (2011)",
-      "text": "MM Karimi; P Goyal; IA Maksakova; M Bilenky; D Leung; JX Tang; Y Shinkai; DL Mager; S Jones; M Hirst; MC Lorincz. DNA methylation and SETDB1/H3K9me3 regulate predominantly distinct sets of genes, retroelements, and chimeric transcripts in mESCs. Cell Stem Cell (2011)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/85",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "A Kauzlaric; G Ecco; M Cassano; J Duc; M Imbeault; D Trono. The mouse genome displays highly dynamic populations of KRAB-zinc finger protein genes and related genetic units. PLOS ONE (2017)",
-      "text": "A Kauzlaric; G Ecco; M Cassano; J Duc; M Imbeault; D Trono. The mouse genome displays highly dynamic populations of KRAB-zinc finger protein genes and related genetic units. PLOS ONE (2017)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/86",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "PP Khil; F Smagulova; KM Brick; RD Camerini-Otero; GV Petukhova. Sensitive mapping of recombination hotspots using sequencing-based detection of ssDNA. Genome Research (2012)",
-      "text": "PP Khil; F Smagulova; KM Brick; RD Camerini-Otero; GV Petukhova. Sensitive mapping of recombination hotspots using sequencing-based detection of ssDNA. Genome Research (2012)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/87",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "F Krueger; SR Andrews. Bismark: a flexible aligner and methylation caller for Bisulfite-Seq applications. Bioinformatics (2011)",
-      "text": "F Krueger; SR Andrews. Bismark: a flexible aligner and methylation caller for Bisulfite-Seq applications. Bioinformatics (2011)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/88",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "B Langmead; SL Salzberg. Fast gapped-read alignment with bowtie 2. Nature Methods (2012)",
-      "text": "B Langmead; SL Salzberg. Fast gapped-read alignment with bowtie 2. Nature Methods (2012)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/89",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "M Legiewicz; AS Zolotukhin; GR Pilkington; KJ Purzycka; M Mitchell; H Uranishi; J Bear; GN Pavlakis; SF Le Grice; BK Felber. The RNA transport element of the murine  musD  retrotransposon requires long-range intramolecular interactions for function. Journal of Biological Chemistry (2010)",
-      "text": "M Legiewicz; AS Zolotukhin; GR Pilkington; KJ Purzycka; M Mitchell; H Uranishi; J Bear; GN Pavlakis; SF Le Grice; BK Felber. The RNA transport element of the murine  musD  retrotransposon requires long-range intramolecular interactions for function. Journal of Biological Chemistry (2010)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/90",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "JA Lehoczky; PE Thomas; KM Patrie; KM Owens; LM Villarreal; K Galbraith; J Washburn; CN Johnson; B Gavino; AD Borowsky; KJ Millen; P Wakenight; W Law; ML Van Keuren; G Gavrilina; ED Hughes; TL Saunders; L Brihn; JH Nadeau; JW Innis. A novel intergenic ETnII-\u03b2 insertion mutation causes multiple malformations in Polypodia mice. PLOS Genetics (2013)",
-      "text": "JA Lehoczky; PE Thomas; KM Patrie; KM Owens; LM Villarreal; K Galbraith; J Washburn; CN Johnson; B Gavino; AD Borowsky; KJ Millen; P Wakenight; W Law; ML Van Keuren; G Gavrilina; ED Hughes; TL Saunders; L Brihn; JH Nadeau; JW Innis. A novel intergenic ETnII-\u03b2 insertion mutation causes multiple malformations in Polypodia mice. PLOS Genetics (2013)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/91",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "D Leung; T Du; U Wagner; W Xie; AY Lee; P Goyal; Y Li; KE Szulwach; P Jin; MC Lorincz; B Ren. Regulation of DNA methylation turnover at LTR retrotransposons and imprinted loci by the histone methyltransferase Setdb1. PNAS (2014)",
-      "text": "D Leung; T Du; U Wagner; W Xie; AY Lee; P Goyal; Y Li; KE Szulwach; P Jin; MC Lorincz; B Ren. Regulation of DNA methylation turnover at LTR retrotransposons and imprinted loci by the histone methyltransferase Setdb1. PNAS (2014)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/92",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "J Lilue; AG Doran; IT Fiddes; M Abrudan; J Armstrong; R Bennett; W Chow; J Collins; S Collins; A Czechanski; P Danecek; M Diekhans; DD Dolle; M Dunn; R Durbin; D Earl; A Ferguson-Smith; P Flicek; J Flint; A Frankish; B Fu; M Gerstein; J Gilbert; L Goodstadt; J Harrow; K Howe; X Ibarra-Soria; M Kolmogorov; CJ Lelliott; DW Logan; J Loveland; CE Mathews; R Mott; P Muir; S Nachtweide; FCP Navarro; DT Odom; N Park; S Pelan; SK Pham; M Quail; L Reinholdt; L Romoth; L Shirley; C Sisu; M Sjoberg-Herrera; M Stanke; C Steward; M Thomas; G Threadgold; D Thybert; J Torrance; K Wong; J Wood; B Yalcin; F Yang; DJ Adams; B Paten; TM Keane. Sixteen diverse laboratory mouse reference genomes define strain-specific haplotypes and novel functional loci. Nature Genetics (2018)",
-      "text": "J Lilue; AG Doran; IT Fiddes; M Abrudan; J Armstrong; R Bennett; W Chow; J Collins; S Collins; A Czechanski; P Danecek; M Diekhans; DD Dolle; M Dunn; R Durbin; D Earl; A Ferguson-Smith; P Flicek; J Flint; A Frankish; B Fu; M Gerstein; J Gilbert; L Goodstadt; J Harrow; K Howe; X Ibarra-Soria; M Kolmogorov; CJ Lelliott; DW Logan; J Loveland; CE Mathews; R Mott; P Muir; S Nachtweide; FCP Navarro; DT Odom; N Park; S Pelan; SK Pham; M Quail; L Reinholdt; L Romoth; L Shirley; C Sisu; M Sjoberg-Herrera; M Stanke; C Steward; M Thomas; G Threadgold; D Thybert; J Torrance; K Wong; J Wood; B Yalcin; F Yang; DJ Adams; B Paten; TM Keane. Sixteen diverse laboratory mouse reference genomes define strain-specific haplotypes and novel functional loci. Nature Genetics (2018)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/93",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "S Liu; J Brind'Amour; MM Karimi; K Shirane; A Bogutz; L Lefebvre; H Sasaki; Y Shinkai; MC Lorincz. Setdb1  is required for germline development and silencing of H3K9me3-marked endogenous retroviruses in primordial germ cells. Genes & Development (2014)",
-      "text": "S Liu; J Brind'Amour; MM Karimi; K Shirane; A Bogutz; L Lefebvre; H Sasaki; Y Shinkai; MC Lorincz. Setdb1  is required for germline development and silencing of H3K9me3-marked endogenous retroviruses in primordial germ cells. Genes & Development (2014)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/94",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "MI Love; W Huber; S Anders. Moderated estimation of fold change and dispersion for RNA-seq data with DESeq2. Genome Biology (2014)",
-      "text": "MI Love; W Huber; S Anders. Moderated estimation of fold change and dispersion for RNA-seq data with DESeq2. Genome Biology (2014)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/95",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "F Lugani; R Arora; N Papeta; A Patel; Z Zheng; R Sterken; RA Singer; G Caridi; C Mendelsohn; L Sussel; VE Papaioannou; AG Gharavi. A retrotransposon insertion in the 5' regulatory domain of Ptf1a results in ectopic gene expression and multiple congenital defects in Danforth's short tail mouse. PLOS Genetics (2013)",
-      "text": "F Lugani; R Arora; N Papeta; A Patel; Z Zheng; R Sterken; RA Singer; G Caridi; C Mendelsohn; L Sussel; VE Papaioannou; AG Gharavi. A retrotransposon insertion in the 5' regulatory domain of Ptf1a results in ectopic gene expression and multiple congenital defects in Danforth's short tail mouse. PLOS Genetics (2013)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/96",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "TS Macfarlan; WD Gifford; S Driscoll; K Lettieri; HM Rowe; D Bonanomi; A Firth; O Singer; D Trono; SL Pfaff. Embryonic stem cell potency fluctuates with endogenous retrovirus activity. Nature (2012)",
-      "text": "TS Macfarlan; WD Gifford; S Driscoll; K Lettieri; HM Rowe; D Bonanomi; A Firth; O Singer; D Trono; SL Pfaff. Embryonic stem cell potency fluctuates with endogenous retrovirus activity. Nature (2012)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/97",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "IA Maksakova; MT Romanish; L Gagnier; CA Dunn; LN van de Lagemaat; DL Mager. Retroviral elements and their hosts: insertional mutagenesis in the mouse germ line. PLOS Genetics (2006)",
-      "text": "IA Maksakova; MT Romanish; L Gagnier; CA Dunn; LN van de Lagemaat; DL Mager. Retroviral elements and their hosts: insertional mutagenesis in the mouse germ line. PLOS Genetics (2006)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/98",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "T Matsui; D Leung; H Miyashita; IA Maksakova; H Miyachi; H Kimura; M Tachibana; MC Lorincz; Y Shinkai. Proviral silencing in embryonic stem cells requires the histone methyltransferase ESET. Nature (2010)",
-      "text": "T Matsui; D Leung; H Miyashita; IA Maksakova; H Miyachi; H Kimura; M Tachibana; MC Lorincz; Y Shinkai. Proviral silencing in embryonic stem cells requires the histone methyltransferase ESET. Nature (2010)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/99",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "HS Najafabadi; S Mnaimneh; FW Schmitges; M Garton; KN Lam; A Yang; M Albu; MT Weirauch; E Radovani; PM Kim; J Greenblatt; BJ Frey; TR Hughes. C2H2 zinc finger proteins greatly expand the human regulatory lexicon. Nature Biotechnology (2015)",
-      "text": "HS Najafabadi; S Mnaimneh; FW Schmitges; M Garton; KN Lam; A Yang; M Albu; MT Weirauch; E Radovani; PM Kim; J Greenblatt; BJ Frey; TR Hughes. C2H2 zinc finger proteins greatly expand the human regulatory lexicon. Nature Biotechnology (2015)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/100",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "C Nell\u00e5ker; TM Keane; B Yalcin; K Wong; A Agam; TG Belgard; J Flint; DJ Adams; WN Frankel; CP Ponting. The genomic landscape shaped by selection on transposable elements across 18 mouse strains. Genome Biology (2012)",
-      "text": "C Nell\u00e5ker; TM Keane; B Yalcin; K Wong; A Agam; TG Belgard; J Flint; DJ Adams; WN Frankel; CP Ponting. The genomic landscape shaped by selection on transposable elements across 18 mouse strains. Genome Biology (2012)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/101",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "H O'Geen; S Frietze; PJ Farnham. Using ChIP-seq technology to identify targets of zinc finger transcription factors. Methods in Molecular Biology (2010)",
-      "text": "H O'Geen; S Frietze; PJ Farnham. Using ChIP-seq technology to identify targets of zinc finger transcription factors. Methods in Molecular Biology (2010)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/102",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "A Patel; P Yang; M Tinkham; M Pradhan; M-A Sun; Y Wang; D Hoang; G Wolf; JR Horton; X Zhang; T Macfarlan; X Cheng. DNA conformation induces adaptable binding by tandem zinc finger proteins. Cell (2018)",
-      "text": "A Patel; P Yang; M Tinkham; M Pradhan; M-A Sun; Y Wang; D Hoang; G Wolf; JR Horton; X Zhang; T Macfarlan; X Cheng. DNA conformation induces adaptable binding by tandem zinc finger proteins. Cell (2018)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/103",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "D Ribet; M Dewannieux; T Heidmann. An active murine transposon family pair: retrotransposition of \"master\" MusD copies and ETn trans-mobilization. Genome Research (2004)",
-      "text": "D Ribet; M Dewannieux; T Heidmann. An active murine transposon family pair: retrotransposition of \"master\" MusD copies and ETn trans-mobilization. Genome Research (2004)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/104",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "SR Richardson; P Gerdes; DJ Gerhardt; FJ Sanchez-Luque; GO Bodea; M Mu\u00f1oz-Lopez; JS Jesuadian; MHC Kempen; PE Carreira; JA Jeddeloh; JL Garcia-Perez; HH Kazazian; AD Ewing; GJ Faulkner. Heritable L1 retrotransposition in the mouse primordial germline and early embryo. Genome Research (2017)",
-      "text": "SR Richardson; P Gerdes; DJ Gerhardt; FJ Sanchez-Luque; GO Bodea; M Mu\u00f1oz-Lopez; JS Jesuadian; MHC Kempen; PE Carreira; JA Jeddeloh; JL Garcia-Perez; HH Kazazian; AD Ewing; GJ Faulkner. Heritable L1 retrotransposition in the mouse primordial germline and early embryo. Genome Research (2017)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/105",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "HM Rowe; J Jakobsson; D Mesnard; J Rougemont; S Reynard; T Aktas; PV Maillard; H Layard-Liesching; S Verp; J Marquis; F Spitz; DB Constam; D Trono. KAP1 controls endogenous retroviruses in embryonic stem cells. Nature (2010)",
-      "text": "HM Rowe; J Jakobsson; D Mesnard; J Rougemont; S Reynard; T Aktas; PV Maillard; H Layard-Liesching; S Verp; J Marquis; F Spitz; DB Constam; D Trono. KAP1 controls endogenous retroviruses in embryonic stem cells. Nature (2010)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/106",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "HM Rowe; A Kapopoulou; A Corsinotti; L Fasching; TS Macfarlan; Y Tarabay; S Viville; J Jakobsson; SL Pfaff; D Trono. TRIM28 repression of retrotransposon-based enhancers is necessary to preserve transcriptional dynamics in embryonic stem cells. Genome Research (2013)",
-      "text": "HM Rowe; A Kapopoulou; A Corsinotti; L Fasching; TS Macfarlan; Y Tarabay; S Viville; J Jakobsson; SL Pfaff; D Trono. TRIM28 repression of retrotransposon-based enhancers is necessary to preserve transcriptional dynamics in embryonic stem cells. Genome Research (2013)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/107",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "SN Schauer; PE Carreira; R Shukla; DJ Gerhardt; P Gerdes; FJ Sanchez-Luque; P Nicoli; M Kindlova; S Ghisletti; AD Santos; D Rapoud; D Samuel; J Faivre; AD Ewing; SR Richardson; GJ Faulkner. L1 retrotransposition is a common feature of mammalian hepatocarcinogenesis. Genome Research (2018)",
-      "text": "SN Schauer; PE Carreira; R Shukla; DJ Gerhardt; P Gerdes; FJ Sanchez-Luque; P Nicoli; M Kindlova; S Ghisletti; AD Santos; D Rapoud; D Samuel; J Faivre; AD Ewing; SR Richardson; GJ Faulkner. L1 retrotransposition is a common feature of mammalian hepatocarcinogenesis. Genome Research (2018)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/108",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "DC Schultz; K Ayyanathan; D Negorev; GG Maul; FJ Rauscher. SETDB1: a novel KAP-1-associated histone H3, lysine 9-specific methyltransferase that contributes to HP1-mediated silencing of euchromatic genes by KRAB zinc-finger proteins. Genes & Development (2002)",
-      "text": "DC Schultz; K Ayyanathan; D Negorev; GG Maul; FJ Rauscher. SETDB1: a novel KAP-1-associated histone H3, lysine 9-specific methyltransferase that contributes to HP1-mediated silencing of euchromatic genes by KRAB zinc-finger proteins. Genes & Development (2002)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/109",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "K Semba; K Araki; K Matsumoto; H Suda; T Ando; A Sei; H Mizuta; K Takagi; M Nakahara; M Muta; G Yamada; N Nakagata; A Iida; S Ikegawa; Y Nakamura; M Araki; K Abe; K Yamamura. Ectopic expression of Ptf1a induces spinal defects, urogenital defects, and anorectal malformations in Danforth's short tail mice. PLOS Genetics (2013)",
-      "text": "K Semba; K Araki; K Matsumoto; H Suda; T Ando; A Sei; H Mizuta; K Takagi; M Nakahara; M Muta; G Yamada; N Nakagata; A Iida; S Ikegawa; Y Nakamura; M Araki; K Abe; K Yamamura. Ectopic expression of Ptf1a induces spinal defects, urogenital defects, and anorectal malformations in Danforth's short tail mice. PLOS Genetics (2013)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/110",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "SP Sripathy; J Stevens; DC Schultz. The KAP1 corepressor functions to coordinate the assembly of de novo HP1-demarcated microenvironments of heterochromatin required for KRAB zinc finger protein-mediated transcriptional repression. Molecular and Cellular Biology (2006)",
-      "text": "SP Sripathy; J Stevens; DC Schultz. The KAP1 corepressor functions to coordinate the assembly of de novo HP1-demarcated microenvironments of heterochromatin required for KRAB zinc finger protein-mediated transcriptional repression. Molecular and Cellular Biology (2006)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/111",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "JH Thomas; S Schneider. Coevolution of retroelements and tandem zinc finger genes. Genome Research (2011)",
-      "text": "JH Thomas; S Schneider. Coevolution of retroelements and tandem zinc finger genes. Genome Research (2011)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/112",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "PJ Thompson; TS Macfarlan; MC Lorincz. Long terminal repeats: from parasitic elements to building blocks of the transcriptional regulatory repertoire. Molecular Cell (2016)",
-      "text": "PJ Thompson; TS Macfarlan; MC Lorincz. Long terminal repeats: from parasitic elements to building blocks of the transcriptional regulatory repertoire. Molecular Cell (2016)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/113",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "RS Treger; SD Pope; Y Kong; M Tokuyama; M Taura; A Iwasaki. The lupus susceptibility locus Sgp3 encodes the suppressor of endogenous retrovirus expression SNERV. Immunity (2019)",
-      "text": "RS Treger; SD Pope; Y Kong; M Tokuyama; M Taura; A Iwasaki. The lupus susceptibility locus Sgp3 encodes the suppressor of endogenous retrovirus expression SNERV. Immunity (2019)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/114",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "CN Vlangos; AN Siuniak; D Robinson; AM Chinnaiyan; RH Lyons; JD Cavalcoli; CE Keegan. Next-generation sequencing identifies the Danforth's short tail mouse mutation as a retrotransposon insertion affecting Ptf1a expression. PLOS Genetics (2013)",
-      "text": "CN Vlangos; AN Siuniak; D Robinson; AM Chinnaiyan; RH Lyons; JD Cavalcoli; CE Keegan. Next-generation sequencing identifies the Danforth's short tail mouse mutation as a retrotransposon insertion affecting Ptf1a expression. PLOS Genetics (2013)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/115",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "J Wang; G Xie; M Singh; AT Ghanbarian; T Rask\u00f3; A Szvetnik; H Cai; D Besser; A Prigione; NV Fuchs; GG Schumann; W Chen; MC Lorincz; Z Ivics; LD Hurst; Z Izsv\u00e1k. Primate-specific endogenous retrovirus-driven transcription defines naive-like stem cells. Nature (2014)",
-      "text": "J Wang; G Xie; M Singh; AT Ghanbarian; T Rask\u00f3; A Szvetnik; H Cai; D Besser; A Prigione; NV Fuchs; GG Schumann; W Chen; MC Lorincz; Z Ivics; LD Hurst; Z Izsv\u00e1k. Primate-specific endogenous retrovirus-driven transcription defines naive-like stem cells. Nature (2014)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/116",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "D Wolf; K Hug; SP Goff. TRIM28 mediates primer binding site-targeted silencing of Lys1,2 tRNA-utilizing retroviruses in embryonic cells. PNAS (2008)",
-      "text": "D Wolf; K Hug; SP Goff. TRIM28 mediates primer binding site-targeted silencing of Lys1,2 tRNA-utilizing retroviruses in embryonic cells. PNAS (2008)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/117",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "G Wolf; D Greenberg; TS Macfarlan. Spotting the enemy within: targeted silencing of foreign DNA in mammalian genomes by the Kr\u00fcppel-associated box zinc finger protein family. Mobile DNA (2015a)",
-      "text": "G Wolf; D Greenberg; TS Macfarlan. Spotting the enemy within: targeted silencing of foreign DNA in mammalian genomes by the Kr\u00fcppel-associated box zinc finger protein family. Mobile DNA (2015a)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/118",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "G Wolf; P Yang; AC F\u00fcchtbauer; EM F\u00fcchtbauer; AM Silva; C Park; W Wu; AL Nielsen; FS Pedersen; TS Macfarlan. The KRAB zinc finger protein ZFP809 is required to initiate epigenetic silencing of endogenous retroviruses. Genes & Development (2015b)",
-      "text": "G Wolf; P Yang; AC F\u00fcchtbauer; EM F\u00fcchtbauer; AM Silva; C Park; W Wu; AL Nielsen; FS Pedersen; TS Macfarlan. The KRAB zinc finger protein ZFP809 is required to initiate epigenetic silencing of endogenous retroviruses. Genes & Development (2015b)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/119",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "M Yamauchi; B Freitag; C Khan; B Berwin; E Barklis. Stem cell factor binding to retrovirus primer binding site silencers. Journal of Virology (1995)",
-      "text": "M Yamauchi; B Freitag; C Khan; B Berwin; E Barklis. Stem cell factor binding to retrovirus primer binding site silencers. Journal of Virology (1995)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/120",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Y Zhang; T Liu; CA Meyer; J Eeckhoute; DS Johnson; BE Bernstein; C Nusbaum; RM Myers; M Brown; W Li; XS Liu. Model-based analysis of ChIP-Seq (MACS). Genome Biology (2008)",
-      "text": "Y Zhang; T Liu; CA Meyer; J Eeckhoute; DS Johnson; BE Bernstein; C Nusbaum; RM Myers; M Brown; W Li; XS Liu. Model-based analysis of ChIP-Seq (MACS). Genome Biology (2008)",
-      "enumerated": false,
-      "marker": "-"
-    }
-  ],
-  "pictures": [
-    {
-      "self_ref": "#/pictures/0",
-      "parent": {
-        "$ref": "#/texts/52"
-      },
-      "children": [],
-      "label": "picture",
-      "prov": [],
-      "captions": [
-        {
-          "$ref": "#/texts/53"
-        }
-      ],
-      "references": [],
-      "footnotes": [],
-      "annotations": []
-    },
-    {
-      "self_ref": "#/pictures/1",
-      "parent": {
-        "$ref": "#/texts/52"
-      },
-      "children": [],
-      "label": "picture",
-      "prov": [],
-      "captions": [
-        {
-          "$ref": "#/texts/54"
-        }
-      ],
-      "references": [],
-      "footnotes": [],
-      "annotations": []
-    },
-    {
-      "self_ref": "#/pictures/2",
-      "parent": {
-        "$ref": "#/texts/52"
-      },
-      "children": [],
-      "label": "picture",
-      "prov": [],
-      "captions": [
-        {
-          "$ref": "#/texts/55"
-        }
-      ],
-      "references": [],
-      "footnotes": [],
-      "annotations": []
-    },
-    {
-      "self_ref": "#/pictures/3",
-      "parent": {
-        "$ref": "#/texts/52"
-      },
-      "children": [],
-      "label": "picture",
-      "prov": [],
-      "captions": [
-        {
-          "$ref": "#/texts/56"
-        }
-      ],
-      "references": [],
-      "footnotes": [],
-      "annotations": []
-    },
-    {
-      "self_ref": "#/pictures/4",
-      "parent": {
-        "$ref": "#/texts/52"
-      },
-      "children": [],
-      "label": "picture",
-      "prov": [],
-      "captions": [
-        {
-          "$ref": "#/texts/57"
-        }
-      ],
-      "references": [],
-      "footnotes": [],
-      "annotations": []
-    },
-    {
-      "self_ref": "#/pictures/5",
-      "parent": {
-        "$ref": "#/texts/52"
-      },
-      "children": [],
-      "label": "picture",
-      "prov": [],
-      "captions": [
-        {
-          "$ref": "#/texts/58"
-        }
-      ],
-      "references": [],
-      "footnotes": [],
-      "annotations": []
-    },
-    {
-      "self_ref": "#/pictures/6",
-      "parent": {
-        "$ref": "#/texts/52"
-      },
-      "children": [],
-      "label": "picture",
-      "prov": [],
-      "captions": [
-        {
-          "$ref": "#/texts/59"
-        }
-      ],
-      "references": [],
-      "footnotes": [],
-      "annotations": []
-    },
-    {
-      "self_ref": "#/pictures/7",
-      "parent": {
-        "$ref": "#/texts/52"
-      },
-      "children": [],
-      "label": "picture",
-      "prov": [],
-      "captions": [
-        {
-          "$ref": "#/texts/60"
-        }
-      ],
-      "references": [],
-      "footnotes": [],
-      "annotations": []
-    },
-    {
-      "self_ref": "#/pictures/8",
-      "parent": {
-        "$ref": "#/texts/52"
-      },
-      "children": [],
-      "label": "picture",
-      "prov": [],
-      "captions": [
-        {
-          "$ref": "#/texts/61"
-        }
-      ],
-      "references": [],
-      "footnotes": [],
-      "annotations": []
-    },
-    {
-      "self_ref": "#/pictures/9",
-      "parent": {
-        "$ref": "#/texts/52"
-      },
-      "children": [],
-      "label": "picture",
-      "prov": [],
-      "captions": [
-        {
-          "$ref": "#/texts/62"
-        }
-      ],
-      "references": [],
-      "footnotes": [],
-      "annotations": []
-    },
-    {
-      "self_ref": "#/pictures/10",
-      "parent": {
-        "$ref": "#/texts/52"
-      },
-      "children": [],
-      "label": "picture",
-      "prov": [],
-      "captions": [
-        {
-          "$ref": "#/texts/63"
-        }
-      ],
-      "references": [],
-      "footnotes": [],
-      "annotations": []
-    }
-  ],
-  "tables": [
-    {
-      "self_ref": "#/tables/0",
-      "parent": {
-        "$ref": "#/texts/49"
-      },
-      "children": [],
-      "label": "table",
-      "prov": [],
-      "captions": [
-        {
-          "$ref": "#/texts/50"
-        }
-      ],
-      "references": [],
-      "footnotes": [],
-      "data": {
-        "table_cells": [
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 0,
-            "end_row_offset_idx": 1,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "Cluster",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 0,
-            "end_row_offset_idx": 1,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "Location",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 0,
-            "end_row_offset_idx": 1,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "Size (Mb)",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 0,
-            "end_row_offset_idx": 1,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "# of KRAB-ZFPs*",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 0,
-            "end_row_offset_idx": 1,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "ChIP-seq data",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 1,
-            "end_row_offset_idx": 2,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "Chr2",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 1,
-            "end_row_offset_idx": 2,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "Chr2 qH4",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 1,
-            "end_row_offset_idx": 2,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "3.1",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 1,
-            "end_row_offset_idx": 2,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "40",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 1,
-            "end_row_offset_idx": 2,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "17",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 2,
-            "end_row_offset_idx": 3,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "Chr4",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 2,
-            "end_row_offset_idx": 3,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "Chr4 qE1",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 2,
-            "end_row_offset_idx": 3,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "2.3",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 2,
-            "end_row_offset_idx": 3,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "21",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 2,
-            "end_row_offset_idx": 3,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "19",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 3,
-            "end_row_offset_idx": 4,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "Chr10",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 3,
-            "end_row_offset_idx": 4,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "Chr10 qC1",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 3,
-            "end_row_offset_idx": 4,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "0.6",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 3,
-            "end_row_offset_idx": 4,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "6",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 3,
-            "end_row_offset_idx": 4,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "1",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 4,
-            "end_row_offset_idx": 5,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "Chr13.1",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 4,
-            "end_row_offset_idx": 5,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "Chr13 qB3",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 4,
-            "end_row_offset_idx": 5,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "1.2",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 4,
-            "end_row_offset_idx": 5,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "6",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 4,
-            "end_row_offset_idx": 5,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "2",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 5,
-            "end_row_offset_idx": 6,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "Chr13.2",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 5,
-            "end_row_offset_idx": 6,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "Chr13 qB3",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 5,
-            "end_row_offset_idx": 6,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "0.8",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 5,
-            "end_row_offset_idx": 6,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "26",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 5,
-            "end_row_offset_idx": 6,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "12",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 6,
-            "end_row_offset_idx": 7,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "Chr8",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 6,
-            "end_row_offset_idx": 7,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "Chr8 qB3.3",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 6,
-            "end_row_offset_idx": 7,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "0.1",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 6,
-            "end_row_offset_idx": 7,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "4",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 6,
-            "end_row_offset_idx": 7,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "4",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 7,
-            "end_row_offset_idx": 8,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "Chr9",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 7,
-            "end_row_offset_idx": 8,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "Chr9 qA3",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 7,
-            "end_row_offset_idx": 8,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "0.1",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 7,
-            "end_row_offset_idx": 8,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "4",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 7,
-            "end_row_offset_idx": 8,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "2",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 8,
-            "end_row_offset_idx": 9,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "Other",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 8,
-            "end_row_offset_idx": 9,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "-",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 8,
-            "end_row_offset_idx": 9,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "-",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 8,
-            "end_row_offset_idx": 9,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "248",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 8,
-            "end_row_offset_idx": 9,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "4",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          }
-        ],
-        "num_rows": 9,
-        "num_cols": 5,
-        "grid": [
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 0,
-              "end_row_offset_idx": 1,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "Cluster",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 0,
-              "end_row_offset_idx": 1,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "Location",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 0,
-              "end_row_offset_idx": 1,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "Size (Mb)",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 0,
-              "end_row_offset_idx": 1,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "# of KRAB-ZFPs*",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 0,
-              "end_row_offset_idx": 1,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "ChIP-seq data",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 1,
-              "end_row_offset_idx": 2,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "Chr2",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 1,
-              "end_row_offset_idx": 2,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "Chr2 qH4",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 1,
-              "end_row_offset_idx": 2,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "3.1",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 1,
-              "end_row_offset_idx": 2,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "40",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 1,
-              "end_row_offset_idx": 2,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "17",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 2,
-              "end_row_offset_idx": 3,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "Chr4",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 2,
-              "end_row_offset_idx": 3,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "Chr4 qE1",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 2,
-              "end_row_offset_idx": 3,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "2.3",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 2,
-              "end_row_offset_idx": 3,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "21",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 2,
-              "end_row_offset_idx": 3,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "19",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 3,
-              "end_row_offset_idx": 4,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "Chr10",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 3,
-              "end_row_offset_idx": 4,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "Chr10 qC1",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 3,
-              "end_row_offset_idx": 4,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "0.6",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 3,
-              "end_row_offset_idx": 4,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "6",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 3,
-              "end_row_offset_idx": 4,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "1",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 4,
-              "end_row_offset_idx": 5,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "Chr13.1",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 4,
-              "end_row_offset_idx": 5,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "Chr13 qB3",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 4,
-              "end_row_offset_idx": 5,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "1.2",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 4,
-              "end_row_offset_idx": 5,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "6",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 4,
-              "end_row_offset_idx": 5,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "2",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 5,
-              "end_row_offset_idx": 6,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "Chr13.2",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 5,
-              "end_row_offset_idx": 6,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "Chr13 qB3",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 5,
-              "end_row_offset_idx": 6,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "0.8",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 5,
-              "end_row_offset_idx": 6,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "26",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 5,
-              "end_row_offset_idx": 6,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "12",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 6,
-              "end_row_offset_idx": 7,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "Chr8",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 6,
-              "end_row_offset_idx": 7,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "Chr8 qB3.3",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 6,
-              "end_row_offset_idx": 7,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "0.1",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 6,
-              "end_row_offset_idx": 7,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "4",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 6,
-              "end_row_offset_idx": 7,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "4",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 7,
-              "end_row_offset_idx": 8,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "Chr9",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 7,
-              "end_row_offset_idx": 8,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "Chr9 qA3",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 7,
-              "end_row_offset_idx": 8,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "0.1",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 7,
-              "end_row_offset_idx": 8,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "4",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 7,
-              "end_row_offset_idx": 8,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "2",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 8,
-              "end_row_offset_idx": 9,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "Other",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 8,
-              "end_row_offset_idx": 9,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "-",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 8,
-              "end_row_offset_idx": 9,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "-",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 8,
-              "end_row_offset_idx": 9,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "248",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 8,
-              "end_row_offset_idx": 9,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "4",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ]
-        ]
-      }
-    },
-    {
-      "self_ref": "#/tables/1",
-      "parent": {
-        "$ref": "#/texts/49"
-      },
-      "children": [],
-      "label": "table",
-      "prov": [],
-      "captions": [
-        {
-          "$ref": "#/texts/51"
-        }
-      ],
-      "references": [],
-      "footnotes": [],
-      "data": {
-        "table_cells": [
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 0,
-            "end_row_offset_idx": 1,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "Reagent type (species) or resource",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 0,
-            "end_row_offset_idx": 1,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "Designation",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 0,
-            "end_row_offset_idx": 1,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "Source or reference",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 0,
-            "end_row_offset_idx": 1,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "Identifiers",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 0,
-            "end_row_offset_idx": 1,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "Additional information",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 1,
-            "end_row_offset_idx": 2,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "Strain, strain background (Mus musculus)",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 1,
-            "end_row_offset_idx": 2,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "129 \u00d7 1/SvJ",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 1,
-            "end_row_offset_idx": 2,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "The Jackson Laboratory",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 1,
-            "end_row_offset_idx": 2,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "000691",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 1,
-            "end_row_offset_idx": 2,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "Mice used to generate mixed strain Chr4-cl KO mice",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 2,
-            "end_row_offset_idx": 3,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "Cell line (Homo-sapiens)",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 2,
-            "end_row_offset_idx": 3,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "HeLa",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 2,
-            "end_row_offset_idx": 3,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "ATCC",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 2,
-            "end_row_offset_idx": 3,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "ATCC CCL-2",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 2,
-            "end_row_offset_idx": 3,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 3,
-            "end_row_offset_idx": 4,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "Cell line (Mus musculus)",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 3,
-            "end_row_offset_idx": 4,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "JM8A3.N1 C57BL/6N-Atm1Brd",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 3,
-            "end_row_offset_idx": 4,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "KOMP Repository",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 3,
-            "end_row_offset_idx": 4,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "PL236745",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 3,
-            "end_row_offset_idx": 4,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "B6 ES cells used to generate KO cell lines and mice",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 4,
-            "end_row_offset_idx": 5,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "Cell line (Mus musculus)",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 4,
-            "end_row_offset_idx": 5,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "B6;129\u2010 Gt(ROSA)26Sortm1(cre/ERT)Nat/J",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 4,
-            "end_row_offset_idx": 5,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "The Jackson Laboratory",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 4,
-            "end_row_offset_idx": 5,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "004847",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 4,
-            "end_row_offset_idx": 5,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "ES cells used to generate KO cell lines and mice",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 5,
-            "end_row_offset_idx": 6,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "Cell line (Mus musculus)",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 5,
-            "end_row_offset_idx": 6,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "R1 ES cells",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 5,
-            "end_row_offset_idx": 6,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "Andras Nagy lab",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 5,
-            "end_row_offset_idx": 6,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "R1",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 5,
-            "end_row_offset_idx": 6,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "129 ES cells used to generate KO cell lines and mice",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 6,
-            "end_row_offset_idx": 7,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "Cell line (Mus musculus)",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 6,
-            "end_row_offset_idx": 7,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "F9 Embryonic carcinoma cells",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 6,
-            "end_row_offset_idx": 7,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "ATCC",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 6,
-            "end_row_offset_idx": 7,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "ATCC CRL-1720",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 6,
-            "end_row_offset_idx": 7,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 7,
-            "end_row_offset_idx": 8,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "Antibody",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 7,
-            "end_row_offset_idx": 8,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "Mouse monoclonal ANTI-FLAG M2 antibody",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 7,
-            "end_row_offset_idx": 8,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "Sigma-Aldrich",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 7,
-            "end_row_offset_idx": 8,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "Cat# F1804, RRID:AB_262044",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 7,
-            "end_row_offset_idx": 8,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "ChIP (1 \u00b5g/107 cells)",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 8,
-            "end_row_offset_idx": 9,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "Antibody",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 8,
-            "end_row_offset_idx": 9,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "Rabbit polyclonal anti-HA",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 8,
-            "end_row_offset_idx": 9,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "Abcam",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 8,
-            "end_row_offset_idx": 9,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "Cat# ab9110, RRID:AB_307019",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 8,
-            "end_row_offset_idx": 9,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "ChIP (1 \u00b5g/107 cells)",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 9,
-            "end_row_offset_idx": 10,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "Antibody",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 9,
-            "end_row_offset_idx": 10,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "Mouse monoclonal anti-HA",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 9,
-            "end_row_offset_idx": 10,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "Covance",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 9,
-            "end_row_offset_idx": 10,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "Cat# MMS-101P-200, RRID:AB_10064068",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 9,
-            "end_row_offset_idx": 10,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 10,
-            "end_row_offset_idx": 11,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "Antibody",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 10,
-            "end_row_offset_idx": 11,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "Rabbit polyclonal anti-H3K9me3",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 10,
-            "end_row_offset_idx": 11,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "Active Motif",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 10,
-            "end_row_offset_idx": 11,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "Cat# 39161, RRID:AB_2532132",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 10,
-            "end_row_offset_idx": 11,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "ChIP (3 \u00b5l/107 cells)",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 11,
-            "end_row_offset_idx": 12,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "Antibody",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 11,
-            "end_row_offset_idx": 12,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "Rabbit polyclonal anti-GFP",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 11,
-            "end_row_offset_idx": 12,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "Thermo Fisher Scientific",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 11,
-            "end_row_offset_idx": 12,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "Cat# A-11122, RRID:AB_221569",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 11,
-            "end_row_offset_idx": 12,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "ChIP (1 \u00b5g/107 cells)",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 12,
-            "end_row_offset_idx": 13,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "Antibody",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 12,
-            "end_row_offset_idx": 13,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "Rabbit polyclonal anti- H3K4me3",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 12,
-            "end_row_offset_idx": 13,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "Abcam",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 12,
-            "end_row_offset_idx": 13,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "Cat# ab8580, RRID:AB_306649",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 12,
-            "end_row_offset_idx": 13,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "ChIP (1 \u00b5g/107 cells)",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 13,
-            "end_row_offset_idx": 14,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "Antibody",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 13,
-            "end_row_offset_idx": 14,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "Rabbit polyclonal anti- H3K4me1",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 13,
-            "end_row_offset_idx": 14,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "Abcam",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 13,
-            "end_row_offset_idx": 14,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "Cat# ab8895, RRID:AB_306847",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 13,
-            "end_row_offset_idx": 14,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "ChIP (1 \u00b5g/107 cells)",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 14,
-            "end_row_offset_idx": 15,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "Antibody",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 14,
-            "end_row_offset_idx": 15,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "Rabbit polyclonal anti- H3K27ac",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 14,
-            "end_row_offset_idx": 15,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "Abcam",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 14,
-            "end_row_offset_idx": 15,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "Cat# ab4729, RRID:AB_2118291",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 14,
-            "end_row_offset_idx": 15,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "ChIP (1 \u00b5g/107 cells)",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 15,
-            "end_row_offset_idx": 16,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "Recombinant DNA reagent",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 15,
-            "end_row_offset_idx": 16,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "pCW57.1",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 15,
-            "end_row_offset_idx": 16,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "Addgene",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 15,
-            "end_row_offset_idx": 16,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "RRID:Addgene_41393",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 15,
-            "end_row_offset_idx": 16,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "Inducible lentiviral expression vector",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 16,
-            "end_row_offset_idx": 17,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "Recombinant DNA reagent",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 16,
-            "end_row_offset_idx": 17,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "pX330-U6-Chimeric_BB-CBh-hSpCas9",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 16,
-            "end_row_offset_idx": 17,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "Addgene",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 16,
-            "end_row_offset_idx": 17,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "RRID:Addgene_42230",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 16,
-            "end_row_offset_idx": 17,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "CRISPR/Cas9 expression construct",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 17,
-            "end_row_offset_idx": 18,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "Sequence-based reagent",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 17,
-            "end_row_offset_idx": 18,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "Chr2-cl KO gRNA.1",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 17,
-            "end_row_offset_idx": 18,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "This paper",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 17,
-            "end_row_offset_idx": 18,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "Cas9 gRNA",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 17,
-            "end_row_offset_idx": 18,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "GCCGTTGCTCAGTCCAAATG",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 18,
-            "end_row_offset_idx": 19,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "Sequenced-based reagent",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 18,
-            "end_row_offset_idx": 19,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "Chr2-cl KO gRNA.2",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 18,
-            "end_row_offset_idx": 19,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "This paper",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 18,
-            "end_row_offset_idx": 19,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "Cas9 gRNA",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 18,
-            "end_row_offset_idx": 19,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "GATACCAGAGGTGGCCGCAAG",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 19,
-            "end_row_offset_idx": 20,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "Sequenced-based reagent",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 19,
-            "end_row_offset_idx": 20,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "Chr4-cl KO gRNA.1",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 19,
-            "end_row_offset_idx": 20,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "This paper",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 19,
-            "end_row_offset_idx": 20,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "Cas9 gRNA",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 19,
-            "end_row_offset_idx": 20,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "GCAAAGGGGCTCCTCGATGGA",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 20,
-            "end_row_offset_idx": 21,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "Sequence-based reagent",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 20,
-            "end_row_offset_idx": 21,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "Chr4-cl KO gRNA.2",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 20,
-            "end_row_offset_idx": 21,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "This paper",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 20,
-            "end_row_offset_idx": 21,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "Cas9 gRNA",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 20,
-            "end_row_offset_idx": 21,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "GTTTATGGCCGTGCTAAGGTC",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 21,
-            "end_row_offset_idx": 22,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "Sequenced-based reagent",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 21,
-            "end_row_offset_idx": 22,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "Chr10-cl KO gRNA.1",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 21,
-            "end_row_offset_idx": 22,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "This paper",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 21,
-            "end_row_offset_idx": 22,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "Cas9 gRNA",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 21,
-            "end_row_offset_idx": 22,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "GTTGCCTTCATCCCACCGTG",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 22,
-            "end_row_offset_idx": 23,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "Sequenced-based reagent",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 22,
-            "end_row_offset_idx": 23,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "Chr10-cl KO gRNA.2",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 22,
-            "end_row_offset_idx": 23,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "This paper",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 22,
-            "end_row_offset_idx": 23,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "Cas9 gRNA",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 22,
-            "end_row_offset_idx": 23,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "GAAGTTCGACTTGGACGGGCT",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 23,
-            "end_row_offset_idx": 24,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "Sequenced-based reagent",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 23,
-            "end_row_offset_idx": 24,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "Chr13.1-cl KO gRNA.1",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 23,
-            "end_row_offset_idx": 24,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "This paper",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 23,
-            "end_row_offset_idx": 24,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "Cas9 gRNA",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 23,
-            "end_row_offset_idx": 24,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "GTAACCCATCATGGGCCCTAC",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 24,
-            "end_row_offset_idx": 25,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "Sequenced-based reagent",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 24,
-            "end_row_offset_idx": 25,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "Chr13.1-cl KO gRNA.2",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 24,
-            "end_row_offset_idx": 25,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "This paper",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 24,
-            "end_row_offset_idx": 25,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "Cas9 gRNA",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 24,
-            "end_row_offset_idx": 25,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "GGACAGGTTATAGGTTTGAT",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 25,
-            "end_row_offset_idx": 26,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "Sequenced-based reagent",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 25,
-            "end_row_offset_idx": 26,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "Chr13.2-cl KO gRNA.1",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 25,
-            "end_row_offset_idx": 26,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "This paper",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 25,
-            "end_row_offset_idx": 26,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "Cas9 gRNA",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 25,
-            "end_row_offset_idx": 26,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "GGGTTTCTGAGAAACGTGTA",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 26,
-            "end_row_offset_idx": 27,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "Sequenced-based reagent",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 26,
-            "end_row_offset_idx": 27,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "Chr13.2-cl KO gRNA.2",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 26,
-            "end_row_offset_idx": 27,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "This paper",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 26,
-            "end_row_offset_idx": 27,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "Cas9 gRNA",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 26,
-            "end_row_offset_idx": 27,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "GTGTAATGAGTTCTTATATC",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 27,
-            "end_row_offset_idx": 28,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "Commercial assay or kit",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 27,
-            "end_row_offset_idx": 28,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "SureSelectQXT Target Enrichment kit",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 27,
-            "end_row_offset_idx": 28,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "Agilent",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 27,
-            "end_row_offset_idx": 28,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "G9681-90000",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 27,
-            "end_row_offset_idx": 28,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 28,
-            "end_row_offset_idx": 29,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "Software, algorithm",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 28,
-            "end_row_offset_idx": 29,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "Bowtie",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 28,
-            "end_row_offset_idx": 29,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "http://bowtie-bio.sourceforge.net",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 28,
-            "end_row_offset_idx": 29,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "RRID:SCR_005476",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 28,
-            "end_row_offset_idx": 29,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 29,
-            "end_row_offset_idx": 30,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "Software, algorithm",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 29,
-            "end_row_offset_idx": 30,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "MACS14",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 29,
-            "end_row_offset_idx": 30,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "https://bio.tools/macs",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 29,
-            "end_row_offset_idx": 30,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "RRID:SCR_013291",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 29,
-            "end_row_offset_idx": 30,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 30,
-            "end_row_offset_idx": 31,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "Software, algorithm",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 30,
-            "end_row_offset_idx": 31,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "Tophat",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 30,
-            "end_row_offset_idx": 31,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "https://ccb.jhu.edu",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 30,
-            "end_row_offset_idx": 31,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "RRID:SCR_013035",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 30,
-            "end_row_offset_idx": 31,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          }
-        ],
-        "num_rows": 31,
-        "num_cols": 5,
-        "grid": [
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 0,
-              "end_row_offset_idx": 1,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "Reagent type (species) or resource",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 0,
-              "end_row_offset_idx": 1,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "Designation",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 0,
-              "end_row_offset_idx": 1,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "Source or reference",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 0,
-              "end_row_offset_idx": 1,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "Identifiers",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 0,
-              "end_row_offset_idx": 1,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "Additional information",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 1,
-              "end_row_offset_idx": 2,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "Strain, strain background (Mus musculus)",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 1,
-              "end_row_offset_idx": 2,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "129 \u00d7 1/SvJ",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 1,
-              "end_row_offset_idx": 2,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "The Jackson Laboratory",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 1,
-              "end_row_offset_idx": 2,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "000691",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 1,
-              "end_row_offset_idx": 2,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "Mice used to generate mixed strain Chr4-cl KO mice",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 2,
-              "end_row_offset_idx": 3,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "Cell line (Homo-sapiens)",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 2,
-              "end_row_offset_idx": 3,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "HeLa",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 2,
-              "end_row_offset_idx": 3,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "ATCC",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 2,
-              "end_row_offset_idx": 3,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "ATCC CCL-2",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 2,
-              "end_row_offset_idx": 3,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 3,
-              "end_row_offset_idx": 4,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "Cell line (Mus musculus)",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 3,
-              "end_row_offset_idx": 4,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "JM8A3.N1 C57BL/6N-Atm1Brd",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 3,
-              "end_row_offset_idx": 4,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "KOMP Repository",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 3,
-              "end_row_offset_idx": 4,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "PL236745",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 3,
-              "end_row_offset_idx": 4,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "B6 ES cells used to generate KO cell lines and mice",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 4,
-              "end_row_offset_idx": 5,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "Cell line (Mus musculus)",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 4,
-              "end_row_offset_idx": 5,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "B6;129\u2010 Gt(ROSA)26Sortm1(cre/ERT)Nat/J",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 4,
-              "end_row_offset_idx": 5,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "The Jackson Laboratory",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 4,
-              "end_row_offset_idx": 5,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "004847",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 4,
-              "end_row_offset_idx": 5,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "ES cells used to generate KO cell lines and mice",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 5,
-              "end_row_offset_idx": 6,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "Cell line (Mus musculus)",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 5,
-              "end_row_offset_idx": 6,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "R1 ES cells",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 5,
-              "end_row_offset_idx": 6,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "Andras Nagy lab",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 5,
-              "end_row_offset_idx": 6,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "R1",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 5,
-              "end_row_offset_idx": 6,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "129 ES cells used to generate KO cell lines and mice",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 6,
-              "end_row_offset_idx": 7,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "Cell line (Mus musculus)",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 6,
-              "end_row_offset_idx": 7,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "F9 Embryonic carcinoma cells",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 6,
-              "end_row_offset_idx": 7,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "ATCC",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 6,
-              "end_row_offset_idx": 7,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "ATCC CRL-1720",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 6,
-              "end_row_offset_idx": 7,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 7,
-              "end_row_offset_idx": 8,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "Antibody",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 7,
-              "end_row_offset_idx": 8,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "Mouse monoclonal ANTI-FLAG M2 antibody",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 7,
-              "end_row_offset_idx": 8,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "Sigma-Aldrich",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 7,
-              "end_row_offset_idx": 8,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "Cat# F1804, RRID:AB_262044",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 7,
-              "end_row_offset_idx": 8,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "ChIP (1 \u00b5g/107 cells)",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 8,
-              "end_row_offset_idx": 9,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "Antibody",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 8,
-              "end_row_offset_idx": 9,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "Rabbit polyclonal anti-HA",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 8,
-              "end_row_offset_idx": 9,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "Abcam",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 8,
-              "end_row_offset_idx": 9,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "Cat# ab9110, RRID:AB_307019",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 8,
-              "end_row_offset_idx": 9,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "ChIP (1 \u00b5g/107 cells)",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 9,
-              "end_row_offset_idx": 10,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "Antibody",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 9,
-              "end_row_offset_idx": 10,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "Mouse monoclonal anti-HA",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 9,
-              "end_row_offset_idx": 10,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "Covance",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 9,
-              "end_row_offset_idx": 10,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "Cat# MMS-101P-200, RRID:AB_10064068",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 9,
-              "end_row_offset_idx": 10,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 10,
-              "end_row_offset_idx": 11,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "Antibody",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 10,
-              "end_row_offset_idx": 11,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "Rabbit polyclonal anti-H3K9me3",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 10,
-              "end_row_offset_idx": 11,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "Active Motif",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 10,
-              "end_row_offset_idx": 11,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "Cat# 39161, RRID:AB_2532132",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 10,
-              "end_row_offset_idx": 11,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "ChIP (3 \u00b5l/107 cells)",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 11,
-              "end_row_offset_idx": 12,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "Antibody",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 11,
-              "end_row_offset_idx": 12,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "Rabbit polyclonal anti-GFP",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 11,
-              "end_row_offset_idx": 12,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "Thermo Fisher Scientific",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 11,
-              "end_row_offset_idx": 12,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "Cat# A-11122, RRID:AB_221569",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 11,
-              "end_row_offset_idx": 12,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "ChIP (1 \u00b5g/107 cells)",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 12,
-              "end_row_offset_idx": 13,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "Antibody",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 12,
-              "end_row_offset_idx": 13,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "Rabbit polyclonal anti- H3K4me3",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 12,
-              "end_row_offset_idx": 13,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "Abcam",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 12,
-              "end_row_offset_idx": 13,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "Cat# ab8580, RRID:AB_306649",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 12,
-              "end_row_offset_idx": 13,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "ChIP (1 \u00b5g/107 cells)",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 13,
-              "end_row_offset_idx": 14,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "Antibody",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 13,
-              "end_row_offset_idx": 14,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "Rabbit polyclonal anti- H3K4me1",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 13,
-              "end_row_offset_idx": 14,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "Abcam",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 13,
-              "end_row_offset_idx": 14,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "Cat# ab8895, RRID:AB_306847",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 13,
-              "end_row_offset_idx": 14,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "ChIP (1 \u00b5g/107 cells)",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 14,
-              "end_row_offset_idx": 15,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "Antibody",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 14,
-              "end_row_offset_idx": 15,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "Rabbit polyclonal anti- H3K27ac",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 14,
-              "end_row_offset_idx": 15,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "Abcam",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 14,
-              "end_row_offset_idx": 15,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "Cat# ab4729, RRID:AB_2118291",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 14,
-              "end_row_offset_idx": 15,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "ChIP (1 \u00b5g/107 cells)",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 15,
-              "end_row_offset_idx": 16,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "Recombinant DNA reagent",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 15,
-              "end_row_offset_idx": 16,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "pCW57.1",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 15,
-              "end_row_offset_idx": 16,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "Addgene",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 15,
-              "end_row_offset_idx": 16,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "RRID:Addgene_41393",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 15,
-              "end_row_offset_idx": 16,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "Inducible lentiviral expression vector",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 16,
-              "end_row_offset_idx": 17,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "Recombinant DNA reagent",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 16,
-              "end_row_offset_idx": 17,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "pX330-U6-Chimeric_BB-CBh-hSpCas9",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 16,
-              "end_row_offset_idx": 17,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "Addgene",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 16,
-              "end_row_offset_idx": 17,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "RRID:Addgene_42230",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 16,
-              "end_row_offset_idx": 17,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "CRISPR/Cas9 expression construct",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 17,
-              "end_row_offset_idx": 18,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "Sequence-based reagent",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 17,
-              "end_row_offset_idx": 18,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "Chr2-cl KO gRNA.1",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 17,
-              "end_row_offset_idx": 18,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "This paper",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 17,
-              "end_row_offset_idx": 18,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "Cas9 gRNA",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 17,
-              "end_row_offset_idx": 18,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "GCCGTTGCTCAGTCCAAATG",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 18,
-              "end_row_offset_idx": 19,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "Sequenced-based reagent",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 18,
-              "end_row_offset_idx": 19,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "Chr2-cl KO gRNA.2",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 18,
-              "end_row_offset_idx": 19,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "This paper",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 18,
-              "end_row_offset_idx": 19,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "Cas9 gRNA",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 18,
-              "end_row_offset_idx": 19,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "GATACCAGAGGTGGCCGCAAG",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 19,
-              "end_row_offset_idx": 20,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "Sequenced-based reagent",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 19,
-              "end_row_offset_idx": 20,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "Chr4-cl KO gRNA.1",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 19,
-              "end_row_offset_idx": 20,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "This paper",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 19,
-              "end_row_offset_idx": 20,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "Cas9 gRNA",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 19,
-              "end_row_offset_idx": 20,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "GCAAAGGGGCTCCTCGATGGA",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 20,
-              "end_row_offset_idx": 21,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "Sequence-based reagent",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 20,
-              "end_row_offset_idx": 21,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "Chr4-cl KO gRNA.2",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 20,
-              "end_row_offset_idx": 21,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "This paper",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 20,
-              "end_row_offset_idx": 21,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "Cas9 gRNA",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 20,
-              "end_row_offset_idx": 21,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "GTTTATGGCCGTGCTAAGGTC",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 21,
-              "end_row_offset_idx": 22,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "Sequenced-based reagent",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 21,
-              "end_row_offset_idx": 22,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "Chr10-cl KO gRNA.1",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 21,
-              "end_row_offset_idx": 22,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "This paper",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 21,
-              "end_row_offset_idx": 22,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "Cas9 gRNA",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 21,
-              "end_row_offset_idx": 22,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "GTTGCCTTCATCCCACCGTG",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 22,
-              "end_row_offset_idx": 23,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "Sequenced-based reagent",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 22,
-              "end_row_offset_idx": 23,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "Chr10-cl KO gRNA.2",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 22,
-              "end_row_offset_idx": 23,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "This paper",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 22,
-              "end_row_offset_idx": 23,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "Cas9 gRNA",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 22,
-              "end_row_offset_idx": 23,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "GAAGTTCGACTTGGACGGGCT",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 23,
-              "end_row_offset_idx": 24,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "Sequenced-based reagent",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 23,
-              "end_row_offset_idx": 24,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "Chr13.1-cl KO gRNA.1",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 23,
-              "end_row_offset_idx": 24,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "This paper",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 23,
-              "end_row_offset_idx": 24,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "Cas9 gRNA",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 23,
-              "end_row_offset_idx": 24,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "GTAACCCATCATGGGCCCTAC",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 24,
-              "end_row_offset_idx": 25,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "Sequenced-based reagent",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 24,
-              "end_row_offset_idx": 25,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "Chr13.1-cl KO gRNA.2",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 24,
-              "end_row_offset_idx": 25,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "This paper",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 24,
-              "end_row_offset_idx": 25,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "Cas9 gRNA",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 24,
-              "end_row_offset_idx": 25,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "GGACAGGTTATAGGTTTGAT",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 25,
-              "end_row_offset_idx": 26,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "Sequenced-based reagent",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 25,
-              "end_row_offset_idx": 26,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "Chr13.2-cl KO gRNA.1",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 25,
-              "end_row_offset_idx": 26,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "This paper",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 25,
-              "end_row_offset_idx": 26,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "Cas9 gRNA",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 25,
-              "end_row_offset_idx": 26,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "GGGTTTCTGAGAAACGTGTA",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 26,
-              "end_row_offset_idx": 27,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "Sequenced-based reagent",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 26,
-              "end_row_offset_idx": 27,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "Chr13.2-cl KO gRNA.2",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 26,
-              "end_row_offset_idx": 27,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "This paper",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 26,
-              "end_row_offset_idx": 27,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "Cas9 gRNA",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 26,
-              "end_row_offset_idx": 27,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "GTGTAATGAGTTCTTATATC",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 27,
-              "end_row_offset_idx": 28,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "Commercial assay or kit",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 27,
-              "end_row_offset_idx": 28,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "SureSelectQXT Target Enrichment kit",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 27,
-              "end_row_offset_idx": 28,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "Agilent",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 27,
-              "end_row_offset_idx": 28,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "G9681-90000",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 27,
-              "end_row_offset_idx": 28,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 28,
-              "end_row_offset_idx": 29,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "Software, algorithm",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 28,
-              "end_row_offset_idx": 29,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "Bowtie",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 28,
-              "end_row_offset_idx": 29,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "http://bowtie-bio.sourceforge.net",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 28,
-              "end_row_offset_idx": 29,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "RRID:SCR_005476",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 28,
-              "end_row_offset_idx": 29,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 29,
-              "end_row_offset_idx": 30,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "Software, algorithm",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 29,
-              "end_row_offset_idx": 30,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "MACS14",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 29,
-              "end_row_offset_idx": 30,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "https://bio.tools/macs",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 29,
-              "end_row_offset_idx": 30,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "RRID:SCR_013291",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 29,
-              "end_row_offset_idx": 30,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 30,
-              "end_row_offset_idx": 31,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "Software, algorithm",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 30,
-              "end_row_offset_idx": 31,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "Tophat",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 30,
-              "end_row_offset_idx": 31,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "https://ccb.jhu.edu",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 30,
-              "end_row_offset_idx": 31,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "RRID:SCR_013035",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 30,
-              "end_row_offset_idx": 31,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ]
-        ]
-      }
-    }
-  ],
-  "key_value_items": [],
-  "pages": {}
-}
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v2/elife-56337.xml.md b/tests/data/groundtruth/docling_v2/elife-56337.xml.md
index 7ff34bbf..e28a28b3 100644
--- a/tests/data/groundtruth/docling_v2/elife-56337.xml.md
+++ b/tests/data/groundtruth/docling_v2/elife-56337.xml.md
@@ -1,6 +1,8 @@
 # KRAB-zinc finger protein gene expansion in response to active retrotransposons in the murine lineage
 
-Wolf Gernot; 1: The Eunice Kennedy Shriver National Institute of Child Health and Human Development, The National Institutes of Health: Bethesda: United States; de Iaco Alberto; 2: School of Life Sciences, École Polytechnique Fédérale de Lausanne (EPFL): Lausanne: Switzerland; Sun Ming-An; 1: The Eunice Kennedy Shriver National Institute of Child Health and Human Development, The National Institutes of Health: Bethesda: United States; Bruno Melania; 1: The Eunice Kennedy Shriver National Institute of Child Health and Human Development, The National Institutes of Health: Bethesda: United States; Tinkham Matthew; 1: The Eunice Kennedy Shriver National Institute of Child Health and Human Development, The National Institutes of Health: Bethesda: United States; Hoang Don; 1: The Eunice Kennedy Shriver National Institute of Child Health and Human Development, The National Institutes of Health: Bethesda: United States; Mitra Apratim; 1: The Eunice Kennedy Shriver National Institute of Child Health and Human Development, The National Institutes of Health: Bethesda: United States; Ralls Sherry; 1: The Eunice Kennedy Shriver National Institute of Child Health and Human Development, The National Institutes of Health: Bethesda: United States; Trono Didier; 2: School of Life Sciences, École Polytechnique Fédérale de Lausanne (EPFL): Lausanne: Switzerland; Macfarlan Todd S; 1: The Eunice Kennedy Shriver National Institute of Child Health and Human Development, The National Institutes of Health: Bethesda: United States
+Gernot Wolf, Alberto de Iaco, Ming-An Sun, Melania Bruno, Matthew Tinkham, Don Hoang, Apratim Mitra, Sherry Ralls, Didier Trono, Todd S Macfarlan
+
+The Eunice Kennedy Shriver National Institute of Child Health and Human Development, The National Institutes of Health, Bethesda, United States; School of Life Sciences, École Polytechnique Fédérale de Lausanne (EPFL), Lausanne, Switzerland
 
 ## Abstract
 
@@ -18,7 +20,24 @@ TEs, especially long terminal repeat (LTR) retrotransposons, also known as endog
 
 We analyzed the RNA expression profiles of mouse KRAB-ZFPs across a wide range of tissues to identify candidates active in early embryos/ES cells. While the majority of KRAB-ZFPs are expressed at low levels and uniformly across tissues, a group of KRAB-ZFPs are highly and almost exclusively expressed in ES cells (Figure 1—figure supplement 1A). About two thirds of these KRAB-ZFPs are physically linked in two clusters on chromosome 2 (Chr2-cl) and 4 (Chr4-cl) (Figure 1—figure supplement 1B). These two clusters encode 40 and 21 KRAB-ZFP annotated genes, respectively, which, with one exception on Chr4-cl, do not have orthologues in rat or any other sequenced mammals (Supplementary file 1). The KRAB-ZFPs within these two genomic clusters also group together phylogenetically (Figure 1—figure supplement 1C), indicating these gene clusters arose by a series of recent segmental gene duplications (Kauzlaric et al., 2017).
 
-To determine the binding sites of the KRAB-ZFPs within these and other gene clusters, we expressed epitope-tagged KRAB-ZFPs using stably integrating vectors in mouse embryonic carcinoma (EC) or ES cells (Table 1, Supplementary file 1) and performed chromatin immunoprecipitation followed by deep sequencing (ChIP-seq). We then determined whether the identified binding sites are significantly enriched over annotated TEs and used the non-repetitive peak fraction to identify binding motifs. We discarded 7 of 68 ChIP-seq datasets because we could not obtain a binding motif or a target TE and manual inspection confirmed low signal to noise ratio. Of the remaining 61 KRAB-ZFPs, 51 significantly overlapped at least one TE subfamily (adjusted p-value<1e-5). Altogether, 81 LTR retrotransposon, 18 LINE, 10 SINE and one DNA transposon subfamilies were targeted by at least one of the 51 KRAB-ZFPs (Figure 1A and Supplementary file 1). Chr2-cl KRAB-ZFPs preferably bound IAPEz retrotransposons and L1-type LINEs, while Chr4-cl KRAB-ZFPs targeted various retrotransposons, including the closely related MMETn (hereafter referred to as ETn) and ETnERV (also known as MusD) elements (Figure 1A). ETn elements are non-autonomous LTR retrotransposons that require trans-complementation by the fully coding ETnERV elements that contain Gag, Pro and Pol genes (Ribet et al., 2004). These elements have accumulated to ~240 and~100 copies in the reference C57BL/6 genome, respectively, with ~550 solitary LTRs (Baust et al., 2003). Both ETn and ETnERVs are still active, generating polymorphisms and mutations in several mouse strains (Gagnier et al., 2019). The validity of our ChIP-seq screen was confirmed by the identification of binding motifs - which often resembled the computationally predicted motifs (Figure 1—figure supplement 2A) - for the majority of screened KRAB-ZFPs (Supplementary file 1). Moreover, predicted and experimentally determined motifs were found in targeted TEs in most cases (Supplementary file 1), and reporter repression assays confirmed KRAB-ZFP induced silencing for all the tested sequences (Figure 1—figure supplement 2B). Finally, we observed KAP1 and H3K9me3 enrichment at most of the targeted TEs in wild type ES cells, indicating that most of these KRAB-ZFPs are functionally active in the early embryo (Figure 1A).
+To determine the binding sites of the KRAB-ZFPs within these and other gene clusters, we expressed epitope-tagged KRAB-ZFPs using stably integrating vectors in mouse embryonic carcinoma (EC) or ES cells (Table 1, Supplementary file 1) and performed chromatin immunoprecipitation followed by deep sequencing (ChIP-seq). We then determined whether the identified binding sites are significantly enriched over annotated TEs and used the non-repetitive peak fraction to identify binding motifs. We discarded 7 of 68 ChIP-seq datasets because we could not obtain a binding motif or a target TE and manual inspection confirmed low signal to noise ratio. Of the remaining 61 KRAB-ZFPs, 51 significantly overlapped at least one TE subfamily (adjusted p-value&lt;1e-5). Altogether, 81 LTR retrotransposon, 18 LINE, 10 SINE and one DNA transposon subfamilies were targeted by at least one of the 51 KRAB-ZFPs (Figure 1A and Supplementary file 1). Chr2-cl KRAB-ZFPs preferably bound IAPEz retrotransposons and L1-type LINEs, while Chr4-cl KRAB-ZFPs targeted various retrotransposons, including the closely related MMETn (hereafter referred to as ETn) and ETnERV (also known as MusD) elements (Figure 1A). ETn elements are non-autonomous LTR retrotransposons that require trans-complementation by the fully coding ETnERV elements that contain Gag, Pro and Pol genes (Ribet et al., 2004). These elements have accumulated to ~240 and~100 copies in the reference C57BL/6 genome, respectively, with ~550 solitary LTRs (Baust et al., 2003). Both ETn and ETnERVs are still active, generating polymorphisms and mutations in several mouse strains (Gagnier et al., 2019). The validity of our ChIP-seq screen was confirmed by the identification of binding motifs - which often resembled the computationally predicted motifs (Figure 1—figure supplement 2A) - for the majority of screened KRAB-ZFPs (Supplementary file 1). Moreover, predicted and experimentally determined motifs were found in targeted TEs in most cases (Supplementary file 1), and reporter repression assays confirmed KRAB-ZFP induced silencing for all the tested sequences (Figure 1—figure supplement 2B). Finally, we observed KAP1 and H3K9me3 enrichment at most of the targeted TEs in wild type ES cells, indicating that most of these KRAB-ZFPs are functionally active in the early embryo (Figure 1A).
+
+Figure 1. Genome-wide binding patterns of mouse KRAB-ZFPs. (A) Probability heatmap of KRAB-ZFP binding to TEs. Blue color intensity (main field) corresponds to -log10 (adjusted p-value) enrichment of ChIP-seq peak overlap with TE groups (Fisher’s exact test). The green/red color intensity (top panel) represents mean KAP1 (GEO accession: GSM1406445) and H3K9me3 (GEO accession: GSM1327148) enrichment (respectively) at peaks overlapping significantly targeted TEs (adjusted p-value&lt;1e-5) in WT ES cells. (B) Summarized ChIP-seq signal for indicated KRAB-ZFPs and previously published KAP1 and H3K9me3 in WT ES cells across 127 intact ETn elements. (C) Heatmaps of KRAB-ZFP ChIP-seq signal at ChIP-seq peaks. For better comparison, peaks for all three KRAB-ZFPs were called with the same parameters (p&lt;1e-10, peak enrichment &gt;20). The top panel shows a schematic of the arrangement of the contact amino acid composition of each zinc finger. Zinc fingers are grouped and colored according to similarity, with amino acid differences relative to the five consensus fingers highlighted in white.
+
+<!-- image -->
+
+Table 1. KRAB-ZFP genes clusters in the mouse genome that were investigated in this study. * Number of protein-coding KRAB-ZFP genes identified in a previously published screen (Imbeault et al., 2017) and the ChIP-seq data column indicates the number of KRAB-ZFPs for which ChIP-seq was performed in this study.
+
+| Cluster   | Location   | Size (Mb)   |   # of KRAB-ZFPs* |   ChIP-seq data |
+|-----------|------------|-------------|-------------------|-----------------|
+| Chr2      | Chr2 qH4   | 3.1         |                40 |              17 |
+| Chr4      | Chr4 qE1   | 2.3         |                21 |              19 |
+| Chr10     | Chr10 qC1  | 0.6         |                 6 |               1 |
+| Chr13.1   | Chr13 qB3  | 1.2         |                 6 |               2 |
+| Chr13.2   | Chr13 qB3  | 0.8         |                26 |              12 |
+| Chr8      | Chr8 qB3.3 | 0.1         |                 4 |               4 |
+| Chr9      | Chr9 qA3   | 0.1         |                 4 |               2 |
+| Other     | -          | -           |               248 |               4 |
 
 We generally observed that KRAB-ZFPs present exclusively in mouse target TEs that are restricted to the mouse genome, indicating KRAB-ZFPs and their targets emerged together. For example, several mouse-specific KRAB-ZFPs in Chr2-cl and Chr4-cl target IAP and ETn elements which are only found in the mouse genome and are highly active. This is the strongest data to date supporting that recent KRAB-ZFP expansions in these young clusters is a response to recent TE activity. Likewise, ZFP599 and ZFP617, both conserved in Muroidea, bind to various ORR1-type LTRs which are present in the rat genome (Supplementary file 1). However, ZFP961, a KRAB-ZFP encoded on a small gene cluster on chromosome 8 that is conserved in Muroidea targets TEs that are only found in the mouse genome (e.g. ETn), a paradox we have previously observed with ZFP809, which also targets TEs that are evolutionarily younger than itself (Wolf et al., 2015b). The ZFP961 binding site is located at the 5’ end of the internal region of ETn and ETnERV elements, a sequence that usually contains the primer binding site (PBS), which is required to prime retroviral reverse transcription. Indeed, the ZFP961 motif closely resembles the PBSLys1,2 (Figure 1—figure supplement 3A), which had been previously identified as a KAP1-dependent target of retroviral repression (Yamauchi et al., 1995; Wolf et al., 2008). Repression of the PBSLys1,2 by ZFP961 was also confirmed in reporter assays (Figure 1—figure supplement 2B), indicating that ZFP961 is likely responsible for this silencing effect.
 
@@ -30,20 +49,32 @@ Our KRAB-ZFP ChIP-seq dataset also provided unique insights into the emergence o
 
 The majority of KRAB-ZFP genes are harbored in large, highly repetitive clusters that have formed by successive complex segmental duplications (Kauzlaric et al., 2017), rendering them inaccessible to conventional gene targeting. We therefore developed a strategy to delete entire KRAB-ZFP gene clusters in ES cells (including the Chr2-cl and Chr4-cl as well as two clusters on chromosome 13 and a cluster on chromosome 10) using two CRISPR/Cas9 gRNAs targeting unique regions flanking each cluster, and short single-stranded repair oligos with homologies to both sides of the projected cut sites. Using this approach, we generated five cluster KO ES cell lines in at least two biological replicates and performed RNA sequencing (RNA-seq) to determine TE expression levels. Strikingly, four of the five cluster KO ES cells exhibited distinct TE reactivation phenotypes (Figure 2A). Chr2-cl KO resulted in reactivation of several L1 subfamilies as well as RLTR10 (up to more than 100-fold as compared to WT) and IAPEz ERVs. In contrast, the most strongly upregulated TEs in Chr4-cl KO cells were ETn/ETnERV (up to 10-fold as compared to WT), with several other ERV groups modestly reactivated. ETn/ETnERV elements were also upregulated in Chr13.2-cl KO ES cells while the only upregulated ERVs in Chr13.1-cl KO ES cells were MMERVK10C elements (Figure 2A). Most reactivated retrotransposons were targeted by at least one KRAB-ZFP that was encoded in the deleted cluster (Figure 2A and Supplementary file 1), indicating a direct effect of these KRAB-ZFPs on TE expression levels. Furthermore, we observed a loss of KAP1 binding and H3K9me3 at several TE subfamilies that are targeted by at least one KRAB-ZFP within the deleted Chr2-cl and Chr4-cl (Figure 2B, Figure 2—figure supplement 1A), including L1, ETn and IAPEz elements. Using reduced representation bisulfite sequencing (RRBS-seq), we found that a subset of KRAB-ZFP bound TEs were partially hypomethylated in Chr4-cl KO ES cells, but only when grown in genome-wide hypomethylation-inducing conditions (Blaschke et al., 2013; Figure 2C and Supplementary file 2). These data are consistent with the hypothesis that KRAB-ZFPs/KAP1 are not required to establish DNA methylation, but under certain conditions they protect specific TEs and imprint control regions from genome-wide demethylation (Leung et al., 2014; Deniz et al., 2018).
 
+Figure 2. Retrotransposon reactivation in KRAB-ZFP cluster KO ES cells. (A) RNA-seq analysis of TE expression in five KRAB-ZFP cluster KO ES cells. Green and grey squares on top of the panel represent KRAB-ZFPs with or without ChIP-seq data, respectively, within each deleted gene cluster. Reactivated TEs that are bound by one or several KRAB-ZFPs are indicated by green squares in the panel. Significantly up- and downregulated elements (adjusted p-value&lt;0.05) are highlighted in red and green, respectively. (B) Differential KAP1 binding and H3K9me3 enrichment at TE groups (summarized across all insertions) in Chr2-cl and Chr4-cl KO ES cells. TE groups targeted by one or several KRAB-ZFPs encoded within the deleted clusters are highlighted in blue (differential enrichment over the entire TE sequences) and red (differential enrichment at TE regions that overlap with KRAB-ZFP ChIP-seq peaks). (C) DNA methylation status of CpG sites at indicated TE groups in WT and Chr4-cl KO ES cells grown in serum containing media or in hypomethylation-inducing media (2i + Vitamin C). P-values were calculated using paired t-test.
+
+<!-- image -->
+
 ### KRAB-ZFP cluster deletions license TE-borne enhancers
 
 We next used our RNA-seq datasets to determine the effect of KRAB-ZFP cluster deletions on gene expression. We identified 195 significantly upregulated and 130 downregulated genes in Chr4-cl KO ES cells, and 108 upregulated and 59 downregulated genes in Chr2-cl KO ES cells (excluding genes on the deleted cluster) (Figure 3A). To address whether gene deregulation in Chr2-cl and Chr4-cl KO ES cells is caused by nearby TE reactivation, we determined whether genes near certain TE subfamilies are more frequently deregulated than random genes. We found a strong correlation of gene upregulation and TE proximity for several TE subfamilies, of which many became transcriptionally activated themselves (Figure 3B). For example, nearly 10% of genes that are located within 100 kb (up- or downstream of the TSS) of an ETn element are upregulated in Chr4-cl KO ES cells, as compared to 0.8% of all genes. In Chr2-cl KO ES cells, upregulated genes were significantly enriched near various LINE groups but also IAPEz-int and RLTR10-int elements, indicating that TE-binding KRAB-ZFPs in these clusters limit the potential activating effects of TEs on nearby genes.
 
+Figure 3. TE-dependent gene activation in KRAB-ZFP cluster KO ES cells. (A) Differential gene expression in Chr2-cl and Chr4-cl KO ES cells. Significantly up- and downregulated genes (adjusted p-value&lt;0.05) are highlighted in red and green, respectively, KRAB-ZFP genes within the deleted clusters are shown in blue. (B) Correlation of TEs and gene deregulation. Plots show enrichment of TE groups within 100 kb of up- and downregulated genes relative to all genes. Significantly overrepresented LTR and LINE groups (adjusted p-value&lt;0.1) are highlighted in blue and red, respectively. (C) Schematic view of the downstream region of Chst1 where a 5’ truncated ETn insertion is located. ChIP-seq (Input subtracted from ChIP) data for overexpressed epitope-tagged Gm13051 (a Chr4-cl KRAB-ZFP) in F9 EC cells, and re-mapped KAP1 (GEO accession: GSM1406445) and H3K9me3 (GEO accession: GSM1327148) in WT ES cells are shown together with RNA-seq data from Chr4-cl WT and KO ES cells (mapped using Bowtie (-a -m 1 --strata -v 2) to exclude reads that cannot be uniquely mapped). (D) RT-qPCR analysis of Chst1 mRNA expression in Chr4-cl WT and KO ES cells with or without the CRISPR/Cas9 deleted ETn insertion near Chst1. Values represent mean expression (normalized to Gapdh) from three biological replicates per sample (each performed in three technical replicates) in arbitrary units. Error bars represent standard deviation and asterisks indicate significance (p&lt;0.01, Student’s t-test). n.s.: not significant. (E) Mean coverage of ChIP-seq data (Input subtracted from ChIP) in Chr4-cl WT and KO ES cells over 127 full-length ETn insertions. The binding sites of the Chr4-cl KRAB-ZFPs Rex2 and Gm13051 are indicated by dashed lines.
+
+<!-- image -->
+
 While we generally observed that TE-associated gene reactivation is not caused by elongated or spliced transcription starting at the retrotransposons, we did observe that the strength of the effect of ETn elements on gene expression is stronger on genes in closer proximity. About 25% of genes located within 20 kb of an ETn element, but only 5% of genes located at a distance between 50 and 100 kb from the nearest ETn insertion, become upregulated in Chr4-cl KO ES cells. Importantly however, the correlation is still significant for genes that are located at distances between 50 and 100 kb from the nearest ETn insertion, indicating that ETn elements can act as long-range enhancers of gene expression in the absence of KRAB-ZFPs that target them. To confirm that Chr4-cl KRAB-ZFPs such as GM13051 block ETn-borne enhancers, we tested the ability of a putative ETn enhancer to activate transcription in a reporter assay. For this purpose, we cloned a 5 kb fragment spanning from the GM13051 binding site within the internal region of a truncated ETn insertion to the first exon of the Cd59a gene, which is strongly activated in Chr4-cl KO ES cells (Figure 2—figure supplement 1B). We observed strong transcriptional activity of this fragment which was significantly higher in Chr4-cl KO ES cells. Surprisingly, this activity was reduced to background when the internal segment of the ETn element was not included in the fragment, suggesting the internal segment of the ETn element, but not its LTR, contains a Chr4-cl KRAB-ZFP sensitive enhancer. To further corroborate these findings, we genetically deleted an ETn element that is located about 60 kb from the TSS of Chst1, one of the top-upregulated genes in Chr4-cl KO ES cells (Figure 3C). RT-qPCR analysis revealed that the Chst1 upregulation phenotype in Chr4-cl KO ES cells diminishes when the ETn insertion is absent, providing direct evidence that a KRAB-ZFP controlled ETn-borne enhancer regulates Chst1 expression (Figure 3D). Furthermore, ChIP-seq confirmed a general increase of H3K4me3, H3K4me1 and H3K27ac marks at ETn elements in Chr4-cl KO ES cells (Figure 3E). Notably, enhancer marks were most pronounced around the GM13051 binding site near the 3’ end of the internal region, confirming that the enhancer activity of ETn is located on the internal region and not on the LTR.
 
 ### ETn retrotransposition in Chr4-cl KO and WT mice
 
-IAP, ETn/ETnERV and MuLV/RLTR4 retrotransposons are highly polymorphic in inbred mouse strains (Nellåker et al., 2012), indicating that these elements are able to mobilize in the germ line. Since these retrotransposons are upregulated in Chr2-cl and Chr4-cl KO ES cells, we speculated that these KRAB-ZFP clusters evolved to minimize the risks of insertional mutagenesis by retrotransposition. To test this, we generated Chr2-cl and Chr4-cl KO mice via ES cell injection into blastocysts, and after germ line transmission we genotyped the offspring of heterozygous breeding pairs. While the offspring of Chr4-cl KO/WT parents were born close to Mendelian ratios in pure C57BL/6 and mixed C57BL/6 129Sv matings, one Chr4-cl KO/WT breeding pair gave birth to significantly fewer KO mice than expected (p-value=0.022) (Figure 4—figure supplement 1A). Likewise, two out of four Chr2-cl KO breeding pairs on mixed C57BL/6 129Sv matings failed to give birth to a single KO offspring (p-value<0.01) while the two other mating pairs produced KO offspring at near Mendelian ratios (Figure 4—figure supplement 1A). Altogether, these data indicate that KRAB-ZFP clusters are not absolutely essential in mice, but that genetic and/or epigenetic factors may contribute to reduced viability.
+IAP, ETn/ETnERV and MuLV/RLTR4 retrotransposons are highly polymorphic in inbred mouse strains (Nellåker et al., 2012), indicating that these elements are able to mobilize in the germ line. Since these retrotransposons are upregulated in Chr2-cl and Chr4-cl KO ES cells, we speculated that these KRAB-ZFP clusters evolved to minimize the risks of insertional mutagenesis by retrotransposition. To test this, we generated Chr2-cl and Chr4-cl KO mice via ES cell injection into blastocysts, and after germ line transmission we genotyped the offspring of heterozygous breeding pairs. While the offspring of Chr4-cl KO/WT parents were born close to Mendelian ratios in pure C57BL/6 and mixed C57BL/6 129Sv matings, one Chr4-cl KO/WT breeding pair gave birth to significantly fewer KO mice than expected (p-value=0.022) (Figure 4—figure supplement 1A). Likewise, two out of four Chr2-cl KO breeding pairs on mixed C57BL/6 129Sv matings failed to give birth to a single KO offspring (p-value&lt;0.01) while the two other mating pairs produced KO offspring at near Mendelian ratios (Figure 4—figure supplement 1A). Altogether, these data indicate that KRAB-ZFP clusters are not absolutely essential in mice, but that genetic and/or epigenetic factors may contribute to reduced viability.
 
 We reasoned that retrotransposon activation could account for the reduced viability of Chr2-cl and Chr4-cl KO mice in some matings. However, since only rare matings produced non-viable KO embryos, we instead turned to the viable KO mice to assay for increased transposon activity. RNA-seq in blood, brain and testis revealed that, with a few exceptions, retrotransposons upregulated in Chr2 and Chr4 KRAB-ZFP cluster KO ES cells are not expressed at higher levels in adult tissues (Figure 4—figure supplement 1B). Likewise, no strong transcriptional TE reactivation phenotype was observed in liver and kidney of Chr4-cl KO mice (data not shown) and ChIP-seq with antibodies against H3K4me1, H3K4me3 and H3K27ac in testis of Chr4-cl WT and KO mice revealed no increase of active histone marks at ETn elements or other TEs (data not shown). This indicates that Chr2-cl and Chr4-cl KRAB-ZFPs are primarily required for TE repression during early development. This is consistent with the high expression of these KRAB-ZFPs uniquely in ES cells (Figure 1—figure supplement 1A). To determine whether retrotransposition occurs at a higher frequency in Chr4-cl KO mice during development, we screened for novel ETn (ETn/ETnERV) and MuLV (MuLV/RLTR4\_MM) insertions in viable Chr4-cl KO mice. For this purpose, we developed a capture-sequencing approach to enrich for ETn/MuLV DNA and flanking sequences from genomic DNA using probes that hybridize with the 5’ and 3’ ends of ETn and MuLV LTRs prior to deep sequencing. We screened genomic DNA samples from a total of 76 mice, including 54 mice from ancestry-controlled Chr4-cl KO matings in various strain backgrounds, the two ES cell lines the Chr4-cl KO mice were generated from, and eight mice from a Chr2-cl KO mating which served as a control (since ETn and MuLVs are not activated in Chr2-cl KO ES cells) (Supplementary file 4). Using this approach, we were able to enrich reads mapping to ETn/MuLV LTRs about 2,000-fold compared to genome sequencing without capture. ETn/MuLV insertions were determined by counting uniquely mapped reads that were paired with reads mapping to ETn/MuLV elements (see materials and methods for details). To assess the efficiency of the capture approach, we determined what proportion of a set of 309 largely intact (two LTRs flanking an internal sequence) reference ETn elements could be identified using our sequencing data. 95% of these insertions were called with high confidence in the majority of our samples (data not shown), indicating that we are able to identify ETn insertions at a high recovery rate.
 
 Using this dataset, we first confirmed the polymorphic nature of both ETn and MuLV retrotransposons in laboratory mouse strains (Figure 4—figure supplement 2A), highlighting the potential of these elements to retrotranspose. To identify novel insertions, we filtered out insertions that were supported by ETn/MuLV-paired reads in more than one animal. While none of the 54 ancestry-controlled mice showed a single novel MuLV insertion, we observed greatly varying numbers of up to 80 novel ETn insertions in our pedigree (Figure 4A).
 
+Figure 4. ETn retrotransposition in Chr4-cl KO mice. (A) Pedigree of mice used for transposon insertion screening by capture-seq in mice of different strain backgrounds. The number of novel ETn insertions (only present in one animal) are indicated. For animals whose direct ancestors have not been screened, the ETn insertions are shown in parentheses since parental inheritance cannot be excluded in that case. Germ line insertions are indicated by asterisks. All DNA samples were prepared from tail tissues unless noted (-S: spleen, -E: ear, -B:Blood) (B) Statistical analysis of ETn insertion frequency in tail tissue from 30 Chr4-cl KO, KO/WT and WT mice that were derived from one Chr4-c KO x KO/WT and two Chr4-cl KO/WT x KO/WT matings. Only DNA samples that were collected from juvenile tails were considered for this analysis. P-values were calculated using one-sided Wilcoxon Rank Sum Test. In the last panel, KO, WT and KO/WT mice derived from all matings were combined for the statistical analysis.
+
+<!-- image -->
+
 To validate some of the novel ETn insertions, we designed specific PCR primers for five of the insertions and screened genomic DNA of the mice in which they were identified as well as their parents. For all tested insertions, we were able to amplify their flanking sequence and show that these insertions are absent in their parents (Figure 4—figure supplement 3A). To confirm their identity, we amplified and sequenced three of the novel full-length ETn insertions. Two of these elements (Genbank accession: MH449667-68) resembled typical ETnII elements with identical 5’ and 3’ LTRs and target site duplications (TSD) of 4 or 6 bp, respectively. The third sequenced element (MH449669) represented a hybrid element that contains both ETnI and MusD (ETnERV) sequences. Similar insertions can be found in the B6 reference genome; however, the identified novel insertion has a 2.5 kb deletion of the 5’ end of the internal region. Additionally, the 5’ and 3’ LTR of this element differ in one nucleotide near the start site and contain an unusually large 248 bp TSD (containing a SINE repeat) indicating that an improper integration process might have truncated this element.
 
 Besides novel ETn insertions that were only identified in one specific animal, we also observed three ETn insertions that could be detected in several siblings but not in their parents or any of the other screened mice. This strongly indicates that these retrotransposition events occurred in the germ line of the parents from which they were passed on to some of their offspring. One of these germ line insertions was evidently passed on from the offspring to the next generation (Figure 4A). As expected, the read numbers supporting these novel germ line insertions were comparable to the read numbers that were found in the flanking regions of annotated B6 ETn insertions (Figure 4—figure supplement 3B). In contrast, virtually all novel insertions that were only found in one animal were supported by significantly fewer reads (Figure 4—figure supplement 3B). This indicates that these elements resulted from retrotransposition events in the developing embryo and not in the zygote or parental germ cells. Indeed, we detected different sets of insertions in various tissues from the same animal (Figure 4—figure supplement 3C). Even between tail samples that were collected from the same animal at different ages, only a fraction of the new insertions were present in both samples, while technical replicates from the same genomic DNA samples showed a nearly complete overlap in insertions (Figure 4—figure supplement 3D).
@@ -58,60 +89,7 @@ Despite a lack of widespread ETn activation in Chr4-cl KO mice, it still remains
 
 ## Materials and methods
 
-### Cell lines and transgenic mice
-
-Mouse ES cells and F9 EC cells were cultivated as described previously (Wolf et al., 2015b) unless stated otherwise. Chr4-cl KO ES cells originate from B6;129‐ Gt(ROSA)26Sortm1(cre/ERT)Nat/J mice (Jackson lab), all other KRAB-ZFP cluster KO ES cell lines originate from JM8A3.N1 C57BL/6N-Atm1Brd ES cells (KOMP Repository). Chr2-cl KO and WT ES cells were initially grown in serum-containing media (Wolf et al., 2015b) but changed to 2i media (De Iaco et al., 2017) for several weeks before analysis. To generate Chr4-cl and Chr2-cl KO mice, the cluster deletions were repeated in B6 ES (KOMP repository) or R1 (Nagy lab) ES cells, respectively, and heterozygous clones were injected into B6 albino blastocysts. Chr2-cl KO mice were therefore kept on a mixed B6/Svx129/Sv-CP strain background while Chr4-cl KO mice were initially derived on a pure C57BL/6 background. For capture-seq screens, Chr4-cl KO mice were crossed with 129 × 1/SvJ mice (Jackson lab) to produce the founder mice for Chr4-cl KO and WT (B6/129 F1) offspring. Chr4-cl KO/WT (B6/129 F1) were also crossed with 129 × 1/SvJ mice to get Chr4-cl KO/WT (B6/129 F1) mice, which were intercrossed to give rise to the parents of Chr4-cl KO/KO and KO/WT (B6/129 F2) offspring.
-
-### Generation of KRAB-ZFP expressing cell lines
-
-KRAB-ZFP ORFs were PCR-amplified from cDNA or synthesized with codon-optimization (Supplementary file 1), and stably expressed with 3XFLAG or 3XHA tags in F9 EC or ES cells using Sleeping beauty transposon-based (Wolf et al., 2015b) or lentiviral expression vectors (Imbeault et al., 2017; Supplementary file 1). Cells were selected with puromycin (1 µg/ml) and resistant clones were pooled and further expanded for ChIP-seq.
-
-### CRISPR/Cas9 mediated deletion of KRAB-ZFP clusters and an MMETn insertion
-
-All gRNAs were expressed from the pX330-U6-Chimeric\_BB-CBh-hSpCas9 vector (RRID:Addgene\_42230) and nucleofected into 106 ES cells using Amaxa nucleofection in the following amounts: 5 µg of each pX330-gRNA plasmid, 1 µg pPGK-puro and 500 pmoles single-stranded repair oligos (Supplementary file 3). One day after nucleofection, cells were kept under puromycin selection (1 µg/ml) for 24 hr. Individual KO and WT clones were picked 7–8 days after nucleofection and expanded for PCR genotyping (Supplementary file 3).
-
-### ChIP-seq analysis
-
-For ChIP-seq analysis of KRAB-ZFP expressing cells, 5–10 × 107 cells were crosslinked and immunoprecipitated with anti-FLAG (Sigma-Aldrich Cat# F1804, RRID:AB\_262044) or anti-HA (Abcam Cat# ab9110, RRID:AB\_307019 or Covance Cat# MMS-101P-200, RRID:AB\_10064068) antibody using one of two previously described protocols (O'Geen et al., 2010; Imbeault et al., 2017) as indicated in Supplementary file 1. H3K9me3 distribution in Chr4-cl, Chr10-cl, Chr13.1-cl and Chr13.2-cl KO ES cells was determined by native ChIP-seq with anti-H3K9me3 serum (Active Motif Cat# 39161, RRID:AB\_2532132) as described previously (Karimi et al., 2011). In Chr2-cl KO ES cells, H3K9me3 and KAP1 ChIP-seq was performed as previously described (Ecco et al., 2016). In Chr4-cl KO and WT ES cells KAP1 binding was determined by endogenous tagging of KAP1 with C-terminal GFP (Supplementary file 3), followed by FACS to enrich for GFP-positive cells and ChIP with anti-GFP (Thermo Fisher Scientific Cat# A-11122, RRID:AB\_221569) using a previously described protocol (O'Geen et al., 2010). For ChIP-seq analysis of active histone marks, cross-linked chromatin from ES cells or testis (from two-week old mice) was immunoprecipitated with antibodies against H3K4me3 (Abcam Cat# ab8580, RRID:AB\_306649), H3K4me1 (Abcam Cat# ab8895, RRID:AB\_306847) and H3K27ac (Abcam Cat# ab4729, RRID:AB\_2118291) following the protocol developed by O'Geen et al., 2010 or Khil et al., 2012 respectively.
-
-ChIP-seq libraries were constructed and sequenced as indicated in Supplementary file 4. Reads were mapped to the mm9 genome using Bowtie (RRID:SCR\_005476; settings: --best) or Bowtie2 (Langmead and Salzberg, 2012) as indicated in Supplementary file 4. Under these settings, reads that map to multiple genomic regions are assigned to the top-scored match and, if a set of equally good choices is encountered, a pseudo-random number is used to choose one location. Peaks were called using MACS14 (RRID:SCR\_013291) under high stringency settings (p<1e-10, peak enrichment >20) (Zhang et al., 2008). Peaks were called both over the Input control and a FLAG or HA control ChIP (unless otherwise stated in Supplementary file 4) and only peaks that were called in both settings were kept for further analysis. In cases when the stringency settings did not result in at least 50 peaks, the settings were changed to medium (p<1e-10, peak enrichment >10) or low (p<1e-5, peak enrichment >10) stringency (Supplementary file 4). For further analysis, all peaks were scaled to 200 bp regions centered around the peak summits. The overlap of the scaled peaks to each repeat element in UCSC Genome Browser (RRID:SCR\_005780) were calculated by using the bedfisher function (settings: -f 0.25) from BEDTools (RRID:SCR\_006646). The right-tailed p-values between pair-wise comparison of each ChIP-seq peak and repeat element were extracted, and then adjusted using the Benjamini-Hochberg approach implemented in the R function p.adjust(). Binding motifs were determined using only nonrepetitive (<10% repeat content) peaks with MEME (Bailey et al., 2009). MEME motifs were compared with in silico predicted motifs (Najafabadi et al., 2015) using Tomtom (Bailey et al., 2009) and considered as significantly overlapping with a False Discovery Rate (FDR) below 0.1. To find MEME and predicted motifs in repetitive peaks, we used FIMO (Bailey et al., 2009). Differential H3K9me3 and KAP1 distribution in WT and Chr2-cl or Chr4-cl KO ES cells at TEs was determined by counting ChIP-seq reads overlapping annotated insertions of each TE group using BEDTools (MultiCovBed). Additionally, ChIP-seq reads were counted at the TE fraction that was bound by Chr2-cl or Chr4-cl KRAB-ZFPs (overlapping with 200 bp peaks). Count tables were concatenated and analyzed using DESeq2 (Love et al., 2014). The previously published ChIP-seq datasets for KAP1 (Castro-Diaz et al., 2014) and H3K9me3 (Dan et al., 2014) were re-mapped using Bowtie (--best).
-
-### Luciferase reporter assays
-
-For KRAB-ZFP repression assays, double-stranded DNA oligos containing KRAB-ZFP target sequences (Supplementary file 3) were cloned upstream of the SV40 promoter of the pGL3-Promoter vector (Promega) between the restriction sites for NheI and XhoI. 33 ng of reporter vectors were co-transfected (Lipofectamine 2000, Thermofisher) with 33 ng pRL-SV40 (Promega) for normalization and 33 ng of transient KRAB-ZFP expression vectors (in pcDNA3.1) or empty pcDNA3.1 into 293 T cells seeded one day earlier in 96-well plates. Cells were lysed 48 hr after transfection and luciferase/Renilla luciferase activity was measured using the Dual-Luciferase Reporter Assay System (Promega). To measure the transcriptional activity of the MMETn element upstream of the Cd59a gene, fragments of varying sizes (Supplementary file 3) were cloned into the promoter-less pGL3-basic vector (Promega) using NheI and NcoI sites. 70 ng of reporter vectors were cotransfected with 30 ng pRL-SV40 into feeder-depleted Chr4-cl WT and KO ES cells, seeded into a gelatinized 96-well plate 2 hr before transfection. Luciferase activity was measured 48 hr after transfection as described above.
-
-### RNA-seq analysis
-
-Whole RNA was purified using RNeasy columns (Qiagen) with on column DNase treatment or the High Pure RNA Isolation Kit (Roche) (Supplementary file 4). Tissues were first lysed in TRIzol reagent (ThermoFisher) and RNA was purified after the isopropanol precipitation step using RNeasy columns (Qiagen) with on column DNase treatment. Libraries were generated using the SureSelect Strand-Specific RNA Library Prep kit (Agilent) or Illumina’s TruSeq RNA Library Prep Kit (with polyA selection) and sequenced as 50 or 100 bp paired-end reads on an Illumina HiSeq2500 (RRID:SCR\_016383) or HiSeq3000 (RRID:SCR\_016386) machine (Supplementary file 4). RNA-seq reads were mapped to the mouse genome (mm9) using Tophat (RRID:SCR\_013035; settings: --I 200000 g 1) unless otherwise stated. These settings allow each mappable read to be reported once, in case the read maps to multiple locations equally well, one match is randomly chosen. For differential transposon expression, mapped reads that overlap with TEs annotated in Repeatmasker (RRID:SCR\_012954) were counted using BEDTools MultiCovBed (setting: -split). Reads mapping to multiple fragments that belong to the same TE insertion (as indicated by the repeat ID) were summed up. Only transposons with a total of at least 20 (for two biological replicates) or 30 (for three biological replicates) mapped reads across WT and KO samples were considered for differential expression analysis. Transposons within the deleted KRAB-ZFP cluster were excluded from the analysis. Read count tables were used for differential expression analysis with DESeq2 (RRID:SCR\_015687). For differential gene expression analysis, reads overlapping with gene exons were counted using HTSeq-count and analyzed using DESeq2. To test if KRAB-ZFP peaks are significantly enriched near up- or down-regulated genes, a binomial test was performed. Briefly, the proportion of the peaks that are located within a certain distance up- or downstream to the TSS of genes was determined using the windowBed function of BED tools. The probability p in the binomial distribution was estimated as the fraction of all genes overlapped with KRAB-ZFP peaks. Then, given n which is the number of specific groups of genes, and x which is the number of this group of genes overlapped with peaks, the R function binom.test() was used to estimate the p-value based on right-tailed Binomial test. Finally, the adjusted p-values were determined separately for LTR and LINE retrotransposon groups using the Benjamini-Hochberg approach implemented in the R function p.adjust().
-
-### Reduced representation bisulfite sequencing (RRBS-seq)
-
-For RRBS-seq analysis, Chr4-cl WT and KO ES cells were grown in either standard ES cell media containing FCS or for one week in 2i media containing vitamin C as described previously (Blaschke et al., 2013). Genomic DNA was purified from WT and Chr4-cl KO ES cells using the Quick-gDNA purification kit (Zymo Research) and bisulfite-converted with the NEXTflex Bisulfite-Seq Kit (Bio Scientific) using Msp1 digestion to fragment DNA. Libraries were sequenced as 50 bp paired-end reads on an Illumina HiSeq. The reads were processed using Trim Galore (--illumina --paired –rrbs) to trim poor quality bases and adaptors. Additionally, the first 5 nt of R2 and the last 3 nt of R1 and R2 were trimmed. Reads were then mapped to the reference genome (mm9) using Bismark (Krueger and Andrews, 2011) to extract methylation calling results. The CpG methylation pattern for each covered CpG dyads (two complementary CG dinucleotides) was calculated using a custom script (Source code 1: get\_CpG\_ML.pl). For comparison of CpG methylation between WT and Chr4-cl KO ES cells (in serum or 2i + Vitamin C conditions) only CpG sites with at least 10-fold coverage in each sample were considered for analysis.
-
-### Retrotransposition assay
-
-The retrotransposition vectors pCMV-MusD2, pCMV-MusD2-neoTNF and pCMV-ETnI1-neoTNF (Ribet et al., 2004) were a kind gift from Dixie Mager. To partially delete the Gm13051 binding site within pCMV-MusD2-neoTNF, the vector was cut with KpnI and re-ligated using a repair oligo, leaving a 24 bp deletion within the Gm13051 binding site. The Rex2 binding site in pCMV-ETnI1-neoTNF was deleted by cutting the vector with EcoRI and XbaI followed by re-ligation using two overlapping PCR products, leaving a 45 bp deletion while maintaining the rest of the vector unchanged (see Supplementary file 3 for primer sequences). For MusD retrotransposition assays, 5 × 104 HeLa cells (ATCC CCL-2) were transfected in a 24-well dish with 100 ng pCMV-MusD2-neoTNF or pCMV-MusD2-neoTNF (ΔGm13051-m) using Lipofectamine 2000. For ETn retrotransposition assays, 50 ng of pCMV-ETnI1-neoTNF or pCMV-ETnI1-neoTNF (ΔRex2) vectors were cotransfected with 50 ng pCMV-MusD2 to provide gag and pol proteins in trans. G418 (0.6 mg/ml) was added five days after transfection and cells were grown under selection until colonies were readily visible by eye. G418-resistant colonies were stained with Amido Black (Sigma).
-
-### Capture-seq screen
-
-To identify novel retrotransposon insertions, genomic DNA from various tissues (Supplementary file 4) was purified and used for library construction with target enrichment using the SureSelectQXT Target Enrichment kit (Agilent). Custom RNA capture probes were designed to hybridize with the 120 bp 5’ ends of the 5’ LTRs and the 120 bp 3’ ends of the 3’ LTR of about 600 intact (internal region flanked by two LTRs) MMETn/RLTRETN retrotransposons or of 140 RLTR4\_MM/RLTR4 retrotransposons that were upregulated in Chr4-cl KO ES cells (Figure 4—source data 2). Enriched libraries were sequenced on an Illumina HiSeq as paired-end 50 bp reads. R1 and R2 reads were mapped to the mm9 genome separately, using settings that only allow non-duplicated, uniquely mappable reads (Bowtie -m 1 --best --strata; samtools rmdup -s) and under settings that allow multimapping and duplicated reads (Bowtie --best). Of the latter, only reads that overlap (min. 50% of read) with RLTRETN, MMETn-int, ETnERV-int, ETnERV2-int or ETnERV3-int repeats (ETn) or RLTR4, RLTR4\_MM-int or MuLV-int repeats (RLTR4) were kept. Only uniquely mappable reads whose paired reads were overlapping with the repeats mentioned above were used for further analysis. All ETn- and RLTR4-paired reads were then clustered (as bed files) using BEDTools (bedtools merge -i -n -d 1000) to receive a list of all potential annotated and non-annotated new ETn or RLTR4 insertion sites and all overlapping ETn- or RLTR4-paired reads were counted for each sample at each locus. Finally, all regions that were located within 1 kb of an annotated RLTRETN, MMETn-int, ETnERV-int, ETnERV2-int or ETnERV3-int repeat as well as regions overlapping with previously identified polymorphic ETn elements (Nellåker et al., 2012) were removed. Genomic loci with at least 10 reads per million unique ETn- or RLTR4-paired reads were considered as insertion sites. To qualify for a de-novo insertion, we allowed no called insertions in any of the other screened mice at the locus and not a single read at the locus in the ancestors of the mouse. Insertions at the same locus in at least two siblings from the same offspring were considered as germ line insertions, if the insertion was absent in the parents and mice who were not direct descendants from these siblings. Full-length sequencing of new ETn insertions was done by Sanger sequencing of short PCR products in combination with Illumina sequencing of a large PCR product (Supplementary file 3), followed by de-novo assembly using the Unicycler software.
-
-## Tables
-
-Table 1.: * Number of protein-coding KRAB-ZFP genes identified in a previously published screen (Imbeault et al., 2017) and the ChIP-seq data column indicates the number of KRAB-ZFPs for which ChIP-seq was performed in this study.
-
-| Cluster   | Location   | Size (Mb)   |   # of KRAB-ZFPs* |   ChIP-seq data |
-|-----------|------------|-------------|-------------------|-----------------|
-| Chr2      | Chr2 qH4   | 3.1         |                40 |              17 |
-| Chr4      | Chr4 qE1   | 2.3         |                21 |              19 |
-| Chr10     | Chr10 qC1  | 0.6         |                 6 |               1 |
-| Chr13.1   | Chr13 qB3  | 1.2         |                 6 |               2 |
-| Chr13.2   | Chr13 qB3  | 0.8         |                26 |              12 |
-| Chr8      | Chr8 qB3.3 | 0.1         |                 4 |               4 |
-| Chr9      | Chr9 qA3   | 0.1         |                 4 |               2 |
-| Other     | -          | -           |               248 |               4 |
-
-Key resources table: 
+Key resources table
 
 | Reagent type (species) or resource       | Designation                            | Source or reference               | Identifiers                         | Additional information                               |
 |------------------------------------------|----------------------------------------|-----------------------------------|-------------------------------------|------------------------------------------------------|
@@ -146,123 +124,137 @@ Key resources table:
 | Software, algorithm                      | MACS14                                 | https://bio.tools/macs            | RRID:SCR\_013291                     |                                                      |
 | Software, algorithm                      | Tophat                                 | https://ccb.jhu.edu               | RRID:SCR\_013035                     |                                                      |
 
-## Figures
+### Cell lines and transgenic mice
 
-Figure 1.: Genome-wide binding patterns of mouse KRAB-ZFPs.
-(A) Probability heatmap of KRAB-ZFP binding to TEs. Blue color intensity (main field) corresponds to -log10 (adjusted p-value) enrichment of ChIP-seq peak overlap with TE groups (Fisher’s exact test). The green/red color intensity (top panel) represents mean KAP1 (GEO accession: GSM1406445) and H3K9me3 (GEO accession: GSM1327148) enrichment (respectively) at peaks overlapping significantly targeted TEs (adjusted p-value<1e-5) in WT ES cells. (B) Summarized ChIP-seq signal for indicated KRAB-ZFPs and previously published KAP1 and H3K9me3 in WT ES cells across 127 intact ETn elements. (C) Heatmaps of KRAB-ZFP ChIP-seq signal at ChIP-seq peaks. For better comparison, peaks for all three KRAB-ZFPs were called with the same parameters (p<1e-10, peak enrichment >20). The top panel shows a schematic of the arrangement of the contact amino acid composition of each zinc finger. Zinc fingers are grouped and colored according to similarity, with amino acid differences relative to the five consensus fingers highlighted in white.
-Figure 1—source data 1.KRAB-ZFP expression in 40 mouse tissues and cell lines (ENCODE).Mean values of replicates are shown as log2 transcripts per million.
-Figure 1—source data 2.Probability heatmap of KRAB-ZFP binding to TEs.Values corresponds to -log10 (adjusted p-value) enrichment of ChIP-seq peak overlap with TE groups (Fisher’s exact test).
+Mouse ES cells and F9 EC cells were cultivated as described previously (Wolf et al., 2015b) unless stated otherwise. Chr4-cl KO ES cells originate from B6;129‐ Gt(ROSA)26Sortm1(cre/ERT)Nat/J mice (Jackson lab), all other KRAB-ZFP cluster KO ES cell lines originate from JM8A3.N1 C57BL/6N-Atm1Brd ES cells (KOMP Repository). Chr2-cl KO and WT ES cells were initially grown in serum-containing media (Wolf et al., 2015b) but changed to 2i media (De Iaco et al., 2017) for several weeks before analysis. To generate Chr4-cl and Chr2-cl KO mice, the cluster deletions were repeated in B6 ES (KOMP repository) or R1 (Nagy lab) ES cells, respectively, and heterozygous clones were injected into B6 albino blastocysts. Chr2-cl KO mice were therefore kept on a mixed B6/Svx129/Sv-CP strain background while Chr4-cl KO mice were initially derived on a pure C57BL/6 background. For capture-seq screens, Chr4-cl KO mice were crossed with 129 × 1/SvJ mice (Jackson lab) to produce the founder mice for Chr4-cl KO and WT (B6/129 F1) offspring. Chr4-cl KO/WT (B6/129 F1) were also crossed with 129 × 1/SvJ mice to get Chr4-cl KO/WT (B6/129 F1) mice, which were intercrossed to give rise to the parents of Chr4-cl KO/KO and KO/WT (B6/129 F2) offspring.
 
-<!-- image -->
+### Generation of KRAB-ZFP expressing cell lines
 
-Figure 1—figure supplement 1.: ES cell-specific expression of KRAB-ZFP gene clusters.
-(A) Heatmap showing expression patterns of mouse KRAB-ZFPs in 40 mouse tissues and cell lines (ENCODE). Heatmap colors indicate gene expression levels in log2 transcripts per million (TPM). The asterisk indicates a group of 30 KRAB-ZFPs that are exclusively expressed in ES cells. (B) Physical location of the genes encoding for the 30 KRAB-ZFPs that are exclusively expressed in ES cells. (C) Phylogenetic (Maximum likelihood) tree of the KRAB domains of mouse KRAB-ZFPs. KRAB-ZFPs encoded on the gene clusters on chromosome 2 and 4 are highlighted. The scale bar at the bottom indicates amino acid substitutions per site.
+KRAB-ZFP ORFs were PCR-amplified from cDNA or synthesized with codon-optimization (Supplementary file 1), and stably expressed with 3XFLAG or 3XHA tags in F9 EC or ES cells using Sleeping beauty transposon-based (Wolf et al., 2015b) or lentiviral expression vectors (Imbeault et al., 2017; Supplementary file 1). Cells were selected with puromycin (1 µg/ml) and resistant clones were pooled and further expanded for ChIP-seq.
 
-<!-- image -->
+### CRISPR/Cas9 mediated deletion of KRAB-ZFP clusters and an MMETn insertion
 
-Figure 1—figure supplement 2.: KRAB-ZFP binding motifs and their repression activity.
-(A) Comparison of computationally predicted (bottom) and experimentally determined (top) KRAB-ZFP binding motifs. Only significant pairs are shown (FDR < 0.1). (B) Luciferase reporter assays to confirm KRAB-ZFP repression of the identified target sites. Bars show the luciferase activity (normalized to Renilla luciferase) of reporter plasmids containing the indicated target sites cloned upstream of the SV40 promoter. Reporter plasmids were co-transfected into 293 T cells with a Renilla luciferase plasmid for normalization and plasmids expressing the targeting KRAB-ZFP. Normalized mean luciferase activity (from three replicates) is shown relative to luciferase activity of the reporter plasmid co-transfected with an empty pcDNA3.1 vector.
+All gRNAs were expressed from the pX330-U6-Chimeric\_BB-CBh-hSpCas9 vector (RRID:Addgene\_42230) and nucleofected into 106 ES cells using Amaxa nucleofection in the following amounts: 5 µg of each pX330-gRNA plasmid, 1 µg pPGK-puro and 500 pmoles single-stranded repair oligos (Supplementary file 3). One day after nucleofection, cells were kept under puromycin selection (1 µg/ml) for 24 hr. Individual KO and WT clones were picked 7–8 days after nucleofection and expanded for PCR genotyping (Supplementary file 3).
 
-<!-- image -->
+### ChIP-seq analysis
 
-Figure 1—figure supplement 3.: KRAB-ZFP binding to ETn retrotransposons.
-(A) Comparison of the PBSLys1,2 sequence with Zfp961 binding motifs in nonrepetitive peaks (Nonrep) and peaks at ETn elements. (B) Retrotransposition assays of original (ETnI1-neoTNF and MusD2-neoTNF Ribet et al., 2004) and modified reporter vectors where the Rex2 or Gm13051 binding motifs where removed. Schematic of reporter vectors are displayed at the top. HeLa cells were transfected as described in the Materials and Methods section and neo-resistant colonies, indicating retrotransposition events, were selected and stained. (C) Stem-loop structure of the ETn RNA export signal, the Gm13051 motif on the corresponding DNA is marked with red circles, the part of the motif that was deleted is indicated with grey crosses (adapted from Legiewicz et al., 2010).
+For ChIP-seq analysis of KRAB-ZFP expressing cells, 5–10 × 107 cells were crosslinked and immunoprecipitated with anti-FLAG (Sigma-Aldrich Cat# F1804, RRID:AB\_262044) or anti-HA (Abcam Cat# ab9110, RRID:AB\_307019 or Covance Cat# MMS-101P-200, RRID:AB\_10064068) antibody using one of two previously described protocols (O'Geen et al., 2010; Imbeault et al., 2017) as indicated in Supplementary file 1. H3K9me3 distribution in Chr4-cl, Chr10-cl, Chr13.1-cl and Chr13.2-cl KO ES cells was determined by native ChIP-seq with anti-H3K9me3 serum (Active Motif Cat# 39161, RRID:AB\_2532132) as described previously (Karimi et al., 2011). In Chr2-cl KO ES cells, H3K9me3 and KAP1 ChIP-seq was performed as previously described (Ecco et al., 2016). In Chr4-cl KO and WT ES cells KAP1 binding was determined by endogenous tagging of KAP1 with C-terminal GFP (Supplementary file 3), followed by FACS to enrich for GFP-positive cells and ChIP with anti-GFP (Thermo Fisher Scientific Cat# A-11122, RRID:AB\_221569) using a previously described protocol (O'Geen et al., 2010). For ChIP-seq analysis of active histone marks, cross-linked chromatin from ES cells or testis (from two-week old mice) was immunoprecipitated with antibodies against H3K4me3 (Abcam Cat# ab8580, RRID:AB\_306649), H3K4me1 (Abcam Cat# ab8895, RRID:AB\_306847) and H3K27ac (Abcam Cat# ab4729, RRID:AB\_2118291) following the protocol developed by O'Geen et al., 2010 or Khil et al., 2012 respectively.
 
-<!-- image -->
+ChIP-seq libraries were constructed and sequenced as indicated in Supplementary file 4. Reads were mapped to the mm9 genome using Bowtie (RRID:SCR\_005476; settings: --best) or Bowtie2 (Langmead and Salzberg, 2012) as indicated in Supplementary file 4. Under these settings, reads that map to multiple genomic regions are assigned to the top-scored match and, if a set of equally good choices is encountered, a pseudo-random number is used to choose one location. Peaks were called using MACS14 (RRID:SCR\_013291) under high stringency settings (p&lt;1e-10, peak enrichment &gt;20) (Zhang et al., 2008). Peaks were called both over the Input control and a FLAG or HA control ChIP (unless otherwise stated in Supplementary file 4) and only peaks that were called in both settings were kept for further analysis. In cases when the stringency settings did not result in at least 50 peaks, the settings were changed to medium (p&lt;1e-10, peak enrichment &gt;10) or low (p&lt;1e-5, peak enrichment &gt;10) stringency (Supplementary file 4). For further analysis, all peaks were scaled to 200 bp regions centered around the peak summits. The overlap of the scaled peaks to each repeat element in UCSC Genome Browser (RRID:SCR\_005780) were calculated by using the bedfisher function (settings: -f 0.25) from BEDTools (RRID:SCR\_006646). The right-tailed p-values between pair-wise comparison of each ChIP-seq peak and repeat element were extracted, and then adjusted using the Benjamini-Hochberg approach implemented in the R function p.adjust(). Binding motifs were determined using only nonrepetitive (&lt;10% repeat content) peaks with MEME (Bailey et al., 2009). MEME motifs were compared with in silico predicted motifs (Najafabadi et al., 2015) using Tomtom (Bailey et al., 2009) and considered as significantly overlapping with a False Discovery Rate (FDR) below 0.1. To find MEME and predicted motifs in repetitive peaks, we used FIMO (Bailey et al., 2009). Differential H3K9me3 and KAP1 distribution in WT and Chr2-cl or Chr4-cl KO ES cells at TEs was determined by counting ChIP-seq reads overlapping annotated insertions of each TE group using BEDTools (MultiCovBed). Additionally, ChIP-seq reads were counted at the TE fraction that was bound by Chr2-cl or Chr4-cl KRAB-ZFPs (overlapping with 200 bp peaks). Count tables were concatenated and analyzed using DESeq2 (Love et al., 2014). The previously published ChIP-seq datasets for KAP1 (Castro-Diaz et al., 2014) and H3K9me3 (Dan et al., 2014) were re-mapped using Bowtie (--best).
 
-Figure 2.: Retrotransposon reactivation in KRAB-ZFP cluster KO ES cells.
-(A) RNA-seq analysis of TE expression in five KRAB-ZFP cluster KO ES cells. Green and grey squares on top of the panel represent KRAB-ZFPs with or without ChIP-seq data, respectively, within each deleted gene cluster. Reactivated TEs that are bound by one or several KRAB-ZFPs are indicated by green squares in the panel. Significantly up- and downregulated elements (adjusted p-value<0.05) are highlighted in red and green, respectively. (B) Differential KAP1 binding and H3K9me3 enrichment at TE groups (summarized across all insertions) in Chr2-cl and Chr4-cl KO ES cells. TE groups targeted by one or several KRAB-ZFPs encoded within the deleted clusters are highlighted in blue (differential enrichment over the entire TE sequences) and red (differential enrichment at TE regions that overlap with KRAB-ZFP ChIP-seq peaks). (C) DNA methylation status of CpG sites at indicated TE groups in WT and Chr4-cl KO ES cells grown in serum containing media or in hypomethylation-inducing media (2i + Vitamin C). P-values were calculated using paired t-test.
-Figure 2—source data 1.Differential H3K9me3 and KAP1 distribution in WT and KRAB-ZFP cluster KO ES cells at TE families and KRAB-ZFP bound TE insertions.Differential read counts and statistical testing were determined by DESeq2.
+### Luciferase reporter assays
 
-<!-- image -->
+For KRAB-ZFP repression assays, double-stranded DNA oligos containing KRAB-ZFP target sequences (Supplementary file 3) were cloned upstream of the SV40 promoter of the pGL3-Promoter vector (Promega) between the restriction sites for NheI and XhoI. 33 ng of reporter vectors were co-transfected (Lipofectamine 2000, Thermofisher) with 33 ng pRL-SV40 (Promega) for normalization and 33 ng of transient KRAB-ZFP expression vectors (in pcDNA3.1) or empty pcDNA3.1 into 293 T cells seeded one day earlier in 96-well plates. Cells were lysed 48 hr after transfection and luciferase/Renilla luciferase activity was measured using the Dual-Luciferase Reporter Assay System (Promega). To measure the transcriptional activity of the MMETn element upstream of the Cd59a gene, fragments of varying sizes (Supplementary file 3) were cloned into the promoter-less pGL3-basic vector (Promega) using NheI and NcoI sites. 70 ng of reporter vectors were cotransfected with 30 ng pRL-SV40 into feeder-depleted Chr4-cl WT and KO ES cells, seeded into a gelatinized 96-well plate 2 hr before transfection. Luciferase activity was measured 48 hr after transfection as described above.
 
-Figure 2—figure supplement 1.: Epigenetic changes at TEs and TE-borne enhancers in KRAB-ZFP cluster KO ES cells.
-(A) Differential analysis of summative (all individual insertions combined) H3K9me3 enrichment at TE groups in Chr10-cl, Chr13.1-cl and Chr13.2-cl KO ES cells. TE groups targeted by one or several KRAB-ZFPs encoded within the deleted clusters are highlighted in orange (differential enrichment over the entire TE sequences) and red (differential enrichment at TE regions that overlap with KRAB-ZFP ChIP-seq peaks). (B) Top: Schematic view of the Cd59a/Cd59b locus with a 5’ truncated ETn insertion. ChIP-seq (Input subtracted from ChIP) data for overexpressed epitope-tagged Gm13051 (a Chr4-cl KRAB-ZFP) in F9 EC cells, and re-mapped KAP1 (GEO accession: GSM1406445) and H3K9me3 (GEO accession: GSM1327148) in WT ES cells are shown together with RNA-seq data from Chr4-cl WT and KO ES cells (mapped using Bowtie (-a -m 1 --strata -v 2) to exclude reads that cannot be uniquely mapped). Bottom: Transcriptional activity of a 5 kb fragment with or without fragments of the ETn insertion was tested by luciferase reporter assay in Chr4-cl WT and KO ES cells.
+### RNA-seq analysis
 
-<!-- image -->
+Whole RNA was purified using RNeasy columns (Qiagen) with on column DNase treatment or the High Pure RNA Isolation Kit (Roche) (Supplementary file 4). Tissues were first lysed in TRIzol reagent (ThermoFisher) and RNA was purified after the isopropanol precipitation step using RNeasy columns (Qiagen) with on column DNase treatment. Libraries were generated using the SureSelect Strand-Specific RNA Library Prep kit (Agilent) or Illumina’s TruSeq RNA Library Prep Kit (with polyA selection) and sequenced as 50 or 100 bp paired-end reads on an Illumina HiSeq2500 (RRID:SCR\_016383) or HiSeq3000 (RRID:SCR\_016386) machine (Supplementary file 4). RNA-seq reads were mapped to the mouse genome (mm9) using Tophat (RRID:SCR\_013035; settings: --I 200000 g 1) unless otherwise stated. These settings allow each mappable read to be reported once, in case the read maps to multiple locations equally well, one match is randomly chosen. For differential transposon expression, mapped reads that overlap with TEs annotated in Repeatmasker (RRID:SCR\_012954) were counted using BEDTools MultiCovBed (setting: -split). Reads mapping to multiple fragments that belong to the same TE insertion (as indicated by the repeat ID) were summed up. Only transposons with a total of at least 20 (for two biological replicates) or 30 (for three biological replicates) mapped reads across WT and KO samples were considered for differential expression analysis. Transposons within the deleted KRAB-ZFP cluster were excluded from the analysis. Read count tables were used for differential expression analysis with DESeq2 (RRID:SCR\_015687). For differential gene expression analysis, reads overlapping with gene exons were counted using HTSeq-count and analyzed using DESeq2. To test if KRAB-ZFP peaks are significantly enriched near up- or down-regulated genes, a binomial test was performed. Briefly, the proportion of the peaks that are located within a certain distance up- or downstream to the TSS of genes was determined using the windowBed function of BED tools. The probability p in the binomial distribution was estimated as the fraction of all genes overlapped with KRAB-ZFP peaks. Then, given n which is the number of specific groups of genes, and x which is the number of this group of genes overlapped with peaks, the R function binom.test() was used to estimate the p-value based on right-tailed Binomial test. Finally, the adjusted p-values were determined separately for LTR and LINE retrotransposon groups using the Benjamini-Hochberg approach implemented in the R function p.adjust().
 
-Figure 3.: TE-dependent gene activation in KRAB-ZFP cluster KO ES cells.
-(A) Differential gene expression in Chr2-cl and Chr4-cl KO ES cells. Significantly up- and downregulated genes (adjusted p-value<0.05) are highlighted in red and green, respectively, KRAB-ZFP genes within the deleted clusters are shown in blue. (B) Correlation of TEs and gene deregulation. Plots show enrichment of TE groups within 100 kb of up- and downregulated genes relative to all genes. Significantly overrepresented LTR and LINE groups (adjusted p-value<0.1) are highlighted in blue and red, respectively. (C) Schematic view of the downstream region of Chst1 where a 5’ truncated ETn insertion is located. ChIP-seq (Input subtracted from ChIP) data for overexpressed epitope-tagged Gm13051 (a Chr4-cl KRAB-ZFP) in F9 EC cells, and re-mapped KAP1 (GEO accession: GSM1406445) and H3K9me3 (GEO accession: GSM1327148) in WT ES cells are shown together with RNA-seq data from Chr4-cl WT and KO ES cells (mapped using Bowtie (-a -m 1 --strata -v 2) to exclude reads that cannot be uniquely mapped). (D) RT-qPCR analysis of Chst1 mRNA expression in Chr4-cl WT and KO ES cells with or without the CRISPR/Cas9 deleted ETn insertion near Chst1. Values represent mean expression (normalized to Gapdh) from three biological replicates per sample (each performed in three technical replicates) in arbitrary units. Error bars represent standard deviation and asterisks indicate significance (p<0.01, Student’s t-test). n.s.: not significant. (E) Mean coverage of ChIP-seq data (Input subtracted from ChIP) in Chr4-cl WT and KO ES cells over 127 full-length ETn insertions. The binding sites of the Chr4-cl KRAB-ZFPs Rex2 and Gm13051 are indicated by dashed lines.
+### Reduced representation bisulfite sequencing (RRBS-seq)
 
-<!-- image -->
+For RRBS-seq analysis, Chr4-cl WT and KO ES cells were grown in either standard ES cell media containing FCS or for one week in 2i media containing vitamin C as described previously (Blaschke et al., 2013). Genomic DNA was purified from WT and Chr4-cl KO ES cells using the Quick-gDNA purification kit (Zymo Research) and bisulfite-converted with the NEXTflex Bisulfite-Seq Kit (Bio Scientific) using Msp1 digestion to fragment DNA. Libraries were sequenced as 50 bp paired-end reads on an Illumina HiSeq. The reads were processed using Trim Galore (--illumina --paired –rrbs) to trim poor quality bases and adaptors. Additionally, the first 5 nt of R2 and the last 3 nt of R1 and R2 were trimmed. Reads were then mapped to the reference genome (mm9) using Bismark (Krueger and Andrews, 2011) to extract methylation calling results. The CpG methylation pattern for each covered CpG dyads (two complementary CG dinucleotides) was calculated using a custom script (Source code 1: get\_CpG\_ML.pl). For comparison of CpG methylation between WT and Chr4-cl KO ES cells (in serum or 2i + Vitamin C conditions) only CpG sites with at least 10-fold coverage in each sample were considered for analysis.
 
-Figure 4.: ETn retrotransposition in Chr4-cl KO mice.
-(A) Pedigree of mice used for transposon insertion screening by capture-seq in mice of different strain backgrounds. The number of novel ETn insertions (only present in one animal) are indicated. For animals whose direct ancestors have not been screened, the ETn insertions are shown in parentheses since parental inheritance cannot be excluded in that case. Germ line insertions are indicated by asterisks. All DNA samples were prepared from tail tissues unless noted (-S: spleen, -E: ear, -B:Blood) (B) Statistical analysis of ETn insertion frequency in tail tissue from 30 Chr4-cl KO, KO/WT and WT mice that were derived from one Chr4-c KO x KO/WT and two Chr4-cl KO/WT x KO/WT matings. Only DNA samples that were collected from juvenile tails were considered for this analysis. P-values were calculated using one-sided Wilcoxon Rank Sum Test. In the last panel, KO, WT and KO/WT mice derived from all matings were combined for the statistical analysis.
-Figure 4—source data 1.Coordinates of identified novel ETn insertions and supporting capture-seq read counts.Genomic regions indicate cluster of supporting reads.
-Figure 4—source data 2.Sequences of capture-seq probes used to enrich genomic DNA for ETn and MuLV (RLTR4) insertions.
+### Retrotransposition assay
 
-<!-- image -->
+The retrotransposition vectors pCMV-MusD2, pCMV-MusD2-neoTNF and pCMV-ETnI1-neoTNF (Ribet et al., 2004) were a kind gift from Dixie Mager. To partially delete the Gm13051 binding site within pCMV-MusD2-neoTNF, the vector was cut with KpnI and re-ligated using a repair oligo, leaving a 24 bp deletion within the Gm13051 binding site. The Rex2 binding site in pCMV-ETnI1-neoTNF was deleted by cutting the vector with EcoRI and XbaI followed by re-ligation using two overlapping PCR products, leaving a 45 bp deletion while maintaining the rest of the vector unchanged (see Supplementary file 3 for primer sequences). For MusD retrotransposition assays, 5 × 104 HeLa cells (ATCC CCL-2) were transfected in a 24-well dish with 100 ng pCMV-MusD2-neoTNF or pCMV-MusD2-neoTNF (ΔGm13051-m) using Lipofectamine 2000. For ETn retrotransposition assays, 50 ng of pCMV-ETnI1-neoTNF or pCMV-ETnI1-neoTNF (ΔRex2) vectors were cotransfected with 50 ng pCMV-MusD2 to provide gag and pol proteins in trans. G418 (0.6 mg/ml) was added five days after transfection and cells were grown under selection until colonies were readily visible by eye. G418-resistant colonies were stained with Amido Black (Sigma).
 
-Figure 4—figure supplement 1.: Birth statistics of KRAB-ZFP cluster KO mice and TE reactivation in adult tissues.
-(A) Birth statistics of Chr4- and Chr2-cl mice derived from KO/WT x KO/WT matings in different strain backgrounds. (B) RNA-seq analysis of TE expression in Chr2- (left) and Chr4-cl (right) KO tissues. TE groups with the highest reactivation phenotype in ES cells are shown separately. Significantly up- and downregulated elements (adjusted p-value<0.05) are highlighted in red and green, respectively. Experiments were performed in at least two biological replicates.
+### Capture-seq screen
 
-<!-- image -->
+To identify novel retrotransposon insertions, genomic DNA from various tissues (Supplementary file 4) was purified and used for library construction with target enrichment using the SureSelectQXT Target Enrichment kit (Agilent). Custom RNA capture probes were designed to hybridize with the 120 bp 5’ ends of the 5’ LTRs and the 120 bp 3’ ends of the 3’ LTR of about 600 intact (internal region flanked by two LTRs) MMETn/RLTRETN retrotransposons or of 140 RLTR4\_MM/RLTR4 retrotransposons that were upregulated in Chr4-cl KO ES cells (Figure 4—source data 2). Enriched libraries were sequenced on an Illumina HiSeq as paired-end 50 bp reads. R1 and R2 reads were mapped to the mm9 genome separately, using settings that only allow non-duplicated, uniquely mappable reads (Bowtie -m 1 --best --strata; samtools rmdup -s) and under settings that allow multimapping and duplicated reads (Bowtie --best). Of the latter, only reads that overlap (min. 50% of read) with RLTRETN, MMETn-int, ETnERV-int, ETnERV2-int or ETnERV3-int repeats (ETn) or RLTR4, RLTR4\_MM-int or MuLV-int repeats (RLTR4) were kept. Only uniquely mappable reads whose paired reads were overlapping with the repeats mentioned above were used for further analysis. All ETn- and RLTR4-paired reads were then clustered (as bed files) using BEDTools (bedtools merge -i -n -d 1000) to receive a list of all potential annotated and non-annotated new ETn or RLTR4 insertion sites and all overlapping ETn- or RLTR4-paired reads were counted for each sample at each locus. Finally, all regions that were located within 1 kb of an annotated RLTRETN, MMETn-int, ETnERV-int, ETnERV2-int or ETnERV3-int repeat as well as regions overlapping with previously identified polymorphic ETn elements (Nellåker et al., 2012) were removed. Genomic loci with at least 10 reads per million unique ETn- or RLTR4-paired reads were considered as insertion sites. To qualify for a de-novo insertion, we allowed no called insertions in any of the other screened mice at the locus and not a single read at the locus in the ancestors of the mouse. Insertions at the same locus in at least two siblings from the same offspring were considered as germ line insertions, if the insertion was absent in the parents and mice who were not direct descendants from these siblings. Full-length sequencing of new ETn insertions was done by Sanger sequencing of short PCR products in combination with Illumina sequencing of a large PCR product (Supplementary file 3), followed by de-novo assembly using the Unicycler software.
 
-Figure 4—figure supplement 2.: Identification of polymorphic ETn and MuLV retrotransposon insertions in Chr4-cl KO and WT mice.
-Heatmaps show normalized capture-seq read counts in RPM (Read Per Million) for identified polymorphic ETn (A) and MuLV (B) loci in different mouse strains. Only loci with strong support for germ line ETn or MuLV insertions (at least 100 or 3000 ETn or MuLV RPM, respectively) in at least two animals are shown. Non-polymorphic insertion loci with high read counts in all screened mice were excluded for better visibility. The sample information (sample name and cell type/tissue) is annotated at the bottom, with the strain information indicated by color at the top. The color gradient indicates log10(RPM+1).
+## Funding Information
 
-<!-- image -->
+This paper was supported by the following grants:
 
-Figure 4—figure supplement 3.: Confirmation of novel ETn insertions identified by capture-seq.
-(A) PCR validation of novel ETn insertions in genomic DNA of three littermates (IDs: T09673, T09674 and T00436) and their parents (T3913 and T3921). Primer sequences are shown in Supplementary file 3. (B) ETn capture-seq read counts (RPM) at putative novel somatic (loci identified exclusively in one single animal), novel germ line (loci identified in several littermates) insertions, and at B6 reference ETn elements. (C) Heatmap shows capture-seq read counts (RPM) of a Chr4-cl KO mouse (ID: C6733) as determined in different tissues. Each row represents a novel ETn locus that was identified in at least one tissue. The color gradient indicates log10(RPM+1). (D) Heatmap shows the capture-seq RPM in technical replicates using the same Chr4-cl KO DNA sample (rep1/rep2) or replicates with DNA samples prepared from different sections of the tail from the same mouse at different ages (tail1/tail2). Each row represents a novel ETn locus that was identified in at least one of the displayed samples. The color gradient indicates log10(RPM+1).
+- http://dx.doi.org/10.13039/100009633Eunice Kennedy Shriver National Institute of Child Health and Human Development 1ZIAHD008933 to Todd S Macfarlan.
+- http://dx.doi.org/10.13039/501100001711Swiss National Science Foundation 310030\_152879 to Didier Trono.
+- http://dx.doi.org/10.13039/501100001711Swiss National Science Foundation 310030B\_173337 to Didier Trono.
+- http://dx.doi.org/10.13039/501100000781European Research Council No. 268721 to Didier Trono.
+- http://dx.doi.org/10.13039/501100000781European Research Council No 694658 to Didier Trono.
 
-<!-- image -->
+## Acknowledgements
+
+We thank Alex Grinberg, Jeanne Yimdjo and Victoria Carter for generating and maintaining transgenic mice. We also thank members of the Macfarlan and Trono labs for useful discussion, Steven Coon, James Iben, Tianwei Li and Anna Malawska for NGS and computational support. This work was supported by NIH grant 1ZIAHD008933 and the NIH DDIR Innovation Award program (TSM), and by subsidies from the Swiss National Science Foundation (310030\_152879 and 310030B\_173337) and the European Research Council (KRABnKAP, No. 268721; Transpos-X, No. 694658) (DT).
+
+## Additional information
+
+## Additional files
+
+## Data availability
+
+All NGS data has been deposited in GEO (GSE115291). Sequences of full-length de novo ETn insertions have been deposited in the GenBank database (MH449667- MH449669).
+
+The following datasets were generated:
+
+Wolf G. Retrotransposon reactivation and mobilization upon deletions of megabase scale KRAB zinc finger gene clusters in mice. NCBI Gene Expression Omnibus (2019). NCBI: GSE115291
+
+Wolf G. Mus musculus musculus strain C57BL/6x129X1/SvJ retrotransposon MMETn-int, complete sequence. NCBI GenBank (2019). NCBI: MH449667
+
+Wolf G. Mus musculus musculus strain C57BL/6x129X1/SvJ retrotransposon MMETn-int, complete sequence. NCBI GenBank (2019). NCBI: MH449668
+
+Wolf G. Mus musculus musculus strain C57BL/6x129X1/SvJ retrotransposon MMETn-int, complete sequence. NCBI GenBank (2019). NCBI: MH449669
+
+The following previously published datasets were used:
+
+Castro-Diaz N, Ecco G, Coluccio A, Kapopoulou A, Duc J, Trono D. Evollutionally dynamic L1 regulation in embryonic stem cells. NCBI Gene Expression Omnibus (2014). NCBI: GSM1406445
+
+Andrew ZX. H3K9me3\_ChIPSeq (Ctrl). NCBI Gene Expression Omnibus (2014). NCBI: GSM1327148
 
 ## References
 
-- TL Bailey; M Boden; FA Buske; M Frith; CE Grant; L Clementi; J Ren; WW Li; WS Noble. MEME SUITE: tools for motif discovery and searching. Nucleic Acids Research (2009)
-- C Baust; L Gagnier; GJ Baillie; MJ Harris; DM Juriloff; DL Mager. Structure and expression of mobile ETnII retroelements and their coding-competent MusD relatives in the mouse. Journal of Virology (2003)
-- K Blaschke; KT Ebata; MM Karimi; JA Zepeda-Martínez; P Goyal; S Mahapatra; A Tam; DJ Laird; M Hirst; A Rao; MC Lorincz; M Ramalho-Santos. Vitamin C induces Tet-dependent DNA demethylation and a blastocyst-like state in ES cells. Nature (2013)
-- A Brodziak; E Ziółko; M Muc-Wierzgoń; E Nowakowska-Zajdel; T Kokot; K Klakla. The role of human endogenous retroviruses in the pathogenesis of autoimmune diseases. Medical Science Monitor : International Medical Journal of Experimental and Clinical Research (2012)
-- N Castro-Diaz; G Ecco; A Coluccio; A Kapopoulou; B Yazdanpanah; M Friedli; J Duc; SM Jang; P Turelli; D Trono. Evolutionally dynamic L1 regulation in embryonic stem cells. Genes & Development (2014)
-- EB Chuong; NC Elde; C Feschotte. Regulatory evolution of innate immunity through co-option of endogenous retroviruses. Science (2016)
-- J Dan; Y Liu; N Liu; M Chiourea; M Okuka; T Wu; X Ye; C Mou; L Wang; L Wang; Y Yin; J Yuan; B Zuo; F Wang; Z Li; X Pan; Z Yin; L Chen; DL Keefe; S Gagos; A Xiao; L Liu. Rif1 maintains telomere length homeostasis of ESCs by mediating heterochromatin silencing. Developmental Cell (2014)
-- A De Iaco; E Planet; A Coluccio; S Verp; J Duc; D Trono. DUX-family transcription factors regulate zygotic genome activation in placental mammals. Nature Genetics (2017)
-- Ö Deniz; L de la Rica; KCL Cheng; D Spensberger; MR Branco. SETDB1 prevents TET2-dependent activation of IAP retroelements in naïve embryonic stem cells. Genome Biology (2018)
-- M Dewannieux; T Heidmann. Endogenous retroviruses: acquisition, amplification and taming of genome invaders. Current Opinion in Virology (2013)
-- G Ecco; M Cassano; A Kauzlaric; J Duc; A Coluccio; S Offner; M Imbeault; HM Rowe; P Turelli; D Trono. Transposable elements and their KRAB-ZFP controllers regulate gene expression in adult tissues. Developmental Cell (2016)
-- G Ecco; M Imbeault; D Trono. KRAB zinc finger proteins. Development (2017)
-- JA Frank; C Feschotte. Co-option of endogenous viral sequences for host cell function. Current Opinion in Virology (2017)
-- L Gagnier; VP Belancio; DL Mager. Mouse germ line mutations due to retrotransposon insertions. Mobile DNA (2019)
-- AC Groner; S Meylan; A Ciuffi; N Zangger; G Ambrosini; N Dénervaud; P Bucher; D Trono. KRAB-zinc finger proteins and KAP1 can mediate long-range transcriptional repression through heterochromatin spreading. PLOS Genetics (2010)
-- DC Hancks; HH Kazazian. Roles for retrotransposon insertions in human disease. Mobile DNA (2016)
-- M Imbeault; PY Helleboid; D Trono. KRAB zinc-finger proteins contribute to the evolution of gene regulatory networks. Nature (2017)
-- FM Jacobs; D Greenberg; N Nguyen; M Haeussler; AD Ewing; S Katzman; B Paten; SR Salama; D Haussler. An evolutionary arms race between KRAB zinc-finger genes ZNF91/93 and SVA/L1 retrotransposons. Nature (2014)
-- H Kano; H Kurahashi; T Toda. Genetically regulated epigenetic transcriptional activation of retrotransposon insertion confers mouse dactylaplasia phenotype. PNAS (2007)
-- MM Karimi; P Goyal; IA Maksakova; M Bilenky; D Leung; JX Tang; Y Shinkai; DL Mager; S Jones; M Hirst; MC Lorincz. DNA methylation and SETDB1/H3K9me3 regulate predominantly distinct sets of genes, retroelements, and chimeric transcripts in mESCs. Cell Stem Cell (2011)
-- A Kauzlaric; G Ecco; M Cassano; J Duc; M Imbeault; D Trono. The mouse genome displays highly dynamic populations of KRAB-zinc finger protein genes and related genetic units. PLOS ONE (2017)
-- PP Khil; F Smagulova; KM Brick; RD Camerini-Otero; GV Petukhova. Sensitive mapping of recombination hotspots using sequencing-based detection of ssDNA. Genome Research (2012)
-- F Krueger; SR Andrews. Bismark: a flexible aligner and methylation caller for Bisulfite-Seq applications. Bioinformatics (2011)
-- B Langmead; SL Salzberg. Fast gapped-read alignment with bowtie 2. Nature Methods (2012)
-- M Legiewicz; AS Zolotukhin; GR Pilkington; KJ Purzycka; M Mitchell; H Uranishi; J Bear; GN Pavlakis; SF Le Grice; BK Felber. The RNA transport element of the murine  musD  retrotransposon requires long-range intramolecular interactions for function. Journal of Biological Chemistry (2010)
-- JA Lehoczky; PE Thomas; KM Patrie; KM Owens; LM Villarreal; K Galbraith; J Washburn; CN Johnson; B Gavino; AD Borowsky; KJ Millen; P Wakenight; W Law; ML Van Keuren; G Gavrilina; ED Hughes; TL Saunders; L Brihn; JH Nadeau; JW Innis. A novel intergenic ETnII-β insertion mutation causes multiple malformations in Polypodia mice. PLOS Genetics (2013)
-- D Leung; T Du; U Wagner; W Xie; AY Lee; P Goyal; Y Li; KE Szulwach; P Jin; MC Lorincz; B Ren. Regulation of DNA methylation turnover at LTR retrotransposons and imprinted loci by the histone methyltransferase Setdb1. PNAS (2014)
-- J Lilue; AG Doran; IT Fiddes; M Abrudan; J Armstrong; R Bennett; W Chow; J Collins; S Collins; A Czechanski; P Danecek; M Diekhans; DD Dolle; M Dunn; R Durbin; D Earl; A Ferguson-Smith; P Flicek; J Flint; A Frankish; B Fu; M Gerstein; J Gilbert; L Goodstadt; J Harrow; K Howe; X Ibarra-Soria; M Kolmogorov; CJ Lelliott; DW Logan; J Loveland; CE Mathews; R Mott; P Muir; S Nachtweide; FCP Navarro; DT Odom; N Park; S Pelan; SK Pham; M Quail; L Reinholdt; L Romoth; L Shirley; C Sisu; M Sjoberg-Herrera; M Stanke; C Steward; M Thomas; G Threadgold; D Thybert; J Torrance; K Wong; J Wood; B Yalcin; F Yang; DJ Adams; B Paten; TM Keane. Sixteen diverse laboratory mouse reference genomes define strain-specific haplotypes and novel functional loci. Nature Genetics (2018)
-- S Liu; J Brind'Amour; MM Karimi; K Shirane; A Bogutz; L Lefebvre; H Sasaki; Y Shinkai; MC Lorincz. Setdb1  is required for germline development and silencing of H3K9me3-marked endogenous retroviruses in primordial germ cells. Genes & Development (2014)
-- MI Love; W Huber; S Anders. Moderated estimation of fold change and dispersion for RNA-seq data with DESeq2. Genome Biology (2014)
-- F Lugani; R Arora; N Papeta; A Patel; Z Zheng; R Sterken; RA Singer; G Caridi; C Mendelsohn; L Sussel; VE Papaioannou; AG Gharavi. A retrotransposon insertion in the 5' regulatory domain of Ptf1a results in ectopic gene expression and multiple congenital defects in Danforth's short tail mouse. PLOS Genetics (2013)
-- TS Macfarlan; WD Gifford; S Driscoll; K Lettieri; HM Rowe; D Bonanomi; A Firth; O Singer; D Trono; SL Pfaff. Embryonic stem cell potency fluctuates with endogenous retrovirus activity. Nature (2012)
-- IA Maksakova; MT Romanish; L Gagnier; CA Dunn; LN van de Lagemaat; DL Mager. Retroviral elements and their hosts: insertional mutagenesis in the mouse germ line. PLOS Genetics (2006)
-- T Matsui; D Leung; H Miyashita; IA Maksakova; H Miyachi; H Kimura; M Tachibana; MC Lorincz; Y Shinkai. Proviral silencing in embryonic stem cells requires the histone methyltransferase ESET. Nature (2010)
-- HS Najafabadi; S Mnaimneh; FW Schmitges; M Garton; KN Lam; A Yang; M Albu; MT Weirauch; E Radovani; PM Kim; J Greenblatt; BJ Frey; TR Hughes. C2H2 zinc finger proteins greatly expand the human regulatory lexicon. Nature Biotechnology (2015)
-- C Nellåker; TM Keane; B Yalcin; K Wong; A Agam; TG Belgard; J Flint; DJ Adams; WN Frankel; CP Ponting. The genomic landscape shaped by selection on transposable elements across 18 mouse strains. Genome Biology (2012)
-- H O'Geen; S Frietze; PJ Farnham. Using ChIP-seq technology to identify targets of zinc finger transcription factors. Methods in Molecular Biology (2010)
-- A Patel; P Yang; M Tinkham; M Pradhan; M-A Sun; Y Wang; D Hoang; G Wolf; JR Horton; X Zhang; T Macfarlan; X Cheng. DNA conformation induces adaptable binding by tandem zinc finger proteins. Cell (2018)
-- D Ribet; M Dewannieux; T Heidmann. An active murine transposon family pair: retrotransposition of "master" MusD copies and ETn trans-mobilization. Genome Research (2004)
-- SR Richardson; P Gerdes; DJ Gerhardt; FJ Sanchez-Luque; GO Bodea; M Muñoz-Lopez; JS Jesuadian; MHC Kempen; PE Carreira; JA Jeddeloh; JL Garcia-Perez; HH Kazazian; AD Ewing; GJ Faulkner. Heritable L1 retrotransposition in the mouse primordial germline and early embryo. Genome Research (2017)
-- HM Rowe; J Jakobsson; D Mesnard; J Rougemont; S Reynard; T Aktas; PV Maillard; H Layard-Liesching; S Verp; J Marquis; F Spitz; DB Constam; D Trono. KAP1 controls endogenous retroviruses in embryonic stem cells. Nature (2010)
-- HM Rowe; A Kapopoulou; A Corsinotti; L Fasching; TS Macfarlan; Y Tarabay; S Viville; J Jakobsson; SL Pfaff; D Trono. TRIM28 repression of retrotransposon-based enhancers is necessary to preserve transcriptional dynamics in embryonic stem cells. Genome Research (2013)
-- SN Schauer; PE Carreira; R Shukla; DJ Gerhardt; P Gerdes; FJ Sanchez-Luque; P Nicoli; M Kindlova; S Ghisletti; AD Santos; D Rapoud; D Samuel; J Faivre; AD Ewing; SR Richardson; GJ Faulkner. L1 retrotransposition is a common feature of mammalian hepatocarcinogenesis. Genome Research (2018)
-- DC Schultz; K Ayyanathan; D Negorev; GG Maul; FJ Rauscher. SETDB1: a novel KAP-1-associated histone H3, lysine 9-specific methyltransferase that contributes to HP1-mediated silencing of euchromatic genes by KRAB zinc-finger proteins. Genes & Development (2002)
-- K Semba; K Araki; K Matsumoto; H Suda; T Ando; A Sei; H Mizuta; K Takagi; M Nakahara; M Muta; G Yamada; N Nakagata; A Iida; S Ikegawa; Y Nakamura; M Araki; K Abe; K Yamamura. Ectopic expression of Ptf1a induces spinal defects, urogenital defects, and anorectal malformations in Danforth's short tail mice. PLOS Genetics (2013)
-- SP Sripathy; J Stevens; DC Schultz. The KAP1 corepressor functions to coordinate the assembly of de novo HP1-demarcated microenvironments of heterochromatin required for KRAB zinc finger protein-mediated transcriptional repression. Molecular and Cellular Biology (2006)
-- JH Thomas; S Schneider. Coevolution of retroelements and tandem zinc finger genes. Genome Research (2011)
-- PJ Thompson; TS Macfarlan; MC Lorincz. Long terminal repeats: from parasitic elements to building blocks of the transcriptional regulatory repertoire. Molecular Cell (2016)
-- RS Treger; SD Pope; Y Kong; M Tokuyama; M Taura; A Iwasaki. The lupus susceptibility locus Sgp3 encodes the suppressor of endogenous retrovirus expression SNERV. Immunity (2019)
-- CN Vlangos; AN Siuniak; D Robinson; AM Chinnaiyan; RH Lyons; JD Cavalcoli; CE Keegan. Next-generation sequencing identifies the Danforth's short tail mouse mutation as a retrotransposon insertion affecting Ptf1a expression. PLOS Genetics (2013)
-- J Wang; G Xie; M Singh; AT Ghanbarian; T Raskó; A Szvetnik; H Cai; D Besser; A Prigione; NV Fuchs; GG Schumann; W Chen; MC Lorincz; Z Ivics; LD Hurst; Z Izsvák. Primate-specific endogenous retrovirus-driven transcription defines naive-like stem cells. Nature (2014)
-- D Wolf; K Hug; SP Goff. TRIM28 mediates primer binding site-targeted silencing of Lys1,2 tRNA-utilizing retroviruses in embryonic cells. PNAS (2008)
-- G Wolf; D Greenberg; TS Macfarlan. Spotting the enemy within: targeted silencing of foreign DNA in mammalian genomes by the Krüppel-associated box zinc finger protein family. Mobile DNA (2015a)
-- G Wolf; P Yang; AC Füchtbauer; EM Füchtbauer; AM Silva; C Park; W Wu; AL Nielsen; FS Pedersen; TS Macfarlan. The KRAB zinc finger protein ZFP809 is required to initiate epigenetic silencing of endogenous retroviruses. Genes & Development (2015b)
-- M Yamauchi; B Freitag; C Khan; B Berwin; E Barklis. Stem cell factor binding to retrovirus primer binding site silencers. Journal of Virology (1995)
-- Y Zhang; T Liu; CA Meyer; J Eeckhoute; DS Johnson; BE Bernstein; C Nusbaum; RM Myers; M Brown; W Li; XS Liu. Model-based analysis of ChIP-Seq (MACS). Genome Biology (2008)
\ No newline at end of file
+- Bailey TL, Boden M, Buske FA, Frith M, Grant CE, Clementi L, Ren J, Li WW, Noble WS. MEME SUITE: tools for motif discovery and searching. Nucleic Acids Research 37:W202–W208 (2009). DOI: 10.1093/nar/gkp335, PMID: 19458158
+- Baust C, Gagnier L, Baillie GJ, Harris MJ, Juriloff DM, Mager DL. Structure and expression of mobile ETnII retroelements and their coding-competent MusD relatives in the mouse. Journal of Virology 77:11448–11458 (2003). DOI: 10.1128/JVI.77.21.11448-11458.2003, PMID: 14557630
+- Blaschke K, Ebata KT, Karimi MM, Zepeda-Martínez JA, Goyal P, Mahapatra S, Tam A, Laird DJ, Hirst M, Rao A, Lorincz MC, Ramalho-Santos M. Vitamin C induces Tet-dependent DNA demethylation and a blastocyst-like state in ES cells. Nature 500:222–226 (2013). DOI: 10.1038/nature12362, PMID: 23812591
+- Brodziak A, Ziółko E, Muc-Wierzgoń M, Nowakowska-Zajdel E, Kokot T, Klakla K. The role of human endogenous retroviruses in the pathogenesis of autoimmune diseases. Medical Science Monitor : International Medical Journal of Experimental and Clinical Research 18:RA80–RA88 (2012). DOI: 10.12659/msm.882892, PMID: 22648263
+- Castro-Diaz N, Ecco G, Coluccio A, Kapopoulou A, Yazdanpanah B, Friedli M, Duc J, Jang SM, Turelli P, Trono D. Evolutionally dynamic L1 regulation in embryonic stem cells. Genes &amp; Development 28:1397–1409 (2014). DOI: 10.1101/gad.241661.114, PMID: 24939876
+- Chuong EB, Elde NC, Feschotte C. Regulatory evolution of innate immunity through co-option of endogenous retroviruses. Science 351:1083–1087 (2016). DOI: 10.1126/science.aad5497, PMID: 26941318
+- Dan J, Liu Y, Liu N, Chiourea M, Okuka M, Wu T, Ye X, Mou C, Wang L, Wang L, Yin Y, Yuan J, Zuo B, Wang F, Li Z, Pan X, Yin Z, Chen L, Keefe DL, Gagos S, Xiao A, Liu L. Rif1 maintains telomere length homeostasis of ESCs by mediating heterochromatin silencing. Developmental Cell 29:7–19 (2014). DOI: 10.1016/j.devcel.2014.03.004, PMID: 24735877
+- De Iaco A, Planet E, Coluccio A, Verp S, Duc J, Trono D. DUX-family transcription factors regulate zygotic genome activation in placental mammals. Nature Genetics 49:941–945 (2017). DOI: 10.1038/ng.3858, PMID: 28459456
+- Deniz Ö, de la Rica L, Cheng KCL, Spensberger D, Branco MR. SETDB1 prevents TET2-dependent activation of IAP retroelements in naïve embryonic stem cells. Genome Biology 19:6 (2018). DOI: 10.1186/s13059-017-1376-y, PMID: 29351814
+- Dewannieux M, Heidmann T. Endogenous retroviruses: acquisition, amplification and taming of genome invaders. Current Opinion in Virology 3:646–656 (2013). DOI: 10.1016/j.coviro.2013.08.005, PMID: 24004725
+- Ecco G, Cassano M, Kauzlaric A, Duc J, Coluccio A, Offner S, Imbeault M, Rowe HM, Turelli P, Trono D. Transposable elements and their KRAB-ZFP controllers regulate gene expression in adult tissues. Developmental Cell 36:611–623 (2016). DOI: 10.1016/j.devcel.2016.02.024, PMID: 27003935
+- Ecco G, Imbeault M, Trono D. KRAB zinc finger proteins. Development 144:2719–2729 (2017). DOI: 10.1242/dev.132605, PMID: 28765213
+- Frank JA, Feschotte C. Co-option of endogenous viral sequences for host cell function. Current Opinion in Virology 25:81–89 (2017). DOI: 10.1016/j.coviro.2017.07.021, PMID: 28818736
+- Gagnier L, Belancio VP, Mager DL. Mouse germ line mutations due to retrotransposon insertions. Mobile DNA 10:15 (2019). DOI: 10.1186/s13100-019-0157-4, PMID: 31011371
+- Groner AC, Meylan S, Ciuffi A, Zangger N, Ambrosini G, Dénervaud N, Bucher P, Trono D. KRAB-zinc finger proteins and KAP1 can mediate long-range transcriptional repression through heterochromatin spreading. PLOS Genetics 6:e1000869 (2010). DOI: 10.1371/journal.pgen.1000869, PMID: 20221260
+- Hancks DC, Kazazian HH. Roles for retrotransposon insertions in human disease. Mobile DNA 7:9 (2016). DOI: 10.1186/s13100-016-0065-9, PMID: 27158268
+- Imbeault M, Helleboid PY, Trono D. KRAB zinc-finger proteins contribute to the evolution of gene regulatory networks. Nature 543:550–554 (2017). DOI: 10.1038/nature21683, PMID: 28273063
+- Jacobs FM, Greenberg D, Nguyen N, Haeussler M, Ewing AD, Katzman S, Paten B, Salama SR, Haussler D. An evolutionary arms race between KRAB zinc-finger genes ZNF91/93 and SVA/L1 retrotransposons. Nature 516:242–245 (2014). DOI: 10.1038/nature13760, PMID: 25274305
+- Kano H, Kurahashi H, Toda T. Genetically regulated epigenetic transcriptional activation of retrotransposon insertion confers mouse dactylaplasia phenotype. PNAS 104:19034–19039 (2007). DOI: 10.1073/pnas.0705483104, PMID: 17984064
+- Karimi MM, Goyal P, Maksakova IA, Bilenky M, Leung D, Tang JX, Shinkai Y, Mager DL, Jones S, Hirst M, Lorincz MC. DNA methylation and SETDB1/H3K9me3 regulate predominantly distinct sets of genes, retroelements, and chimeric transcripts in mESCs. Cell Stem Cell 8:676–687 (2011). DOI: 10.1016/j.stem.2011.04.004, PMID: 21624812
+- Kauzlaric A, Ecco G, Cassano M, Duc J, Imbeault M, Trono D. The mouse genome displays highly dynamic populations of KRAB-zinc finger protein genes and related genetic units. PLOS ONE 12:e0173746 (2017). DOI: 10.1371/journal.pone.0173746, PMID: 28334004
+- Khil PP, Smagulova F, Brick KM, Camerini-Otero RD, Petukhova GV. Sensitive mapping of recombination hotspots using sequencing-based detection of ssDNA. Genome Research 22:957–965 (2012). DOI: 10.1101/gr.130583.111, PMID: 22367190
+- Krueger F, Andrews SR. Bismark: a flexible aligner and methylation caller for Bisulfite-Seq applications. Bioinformatics 27:1571–1572 (2011). DOI: 10.1093/bioinformatics/btr167, PMID: 21493656
+- Langmead B, Salzberg SL. Fast gapped-read alignment with bowtie 2. Nature Methods 9:357–359 (2012). DOI: 10.1038/nmeth.1923, PMID: 22388286
+- Legiewicz M, Zolotukhin AS, Pilkington GR, Purzycka KJ, Mitchell M, Uranishi H, Bear J, Pavlakis GN, Le Grice SF, Felber BK. The RNA transport element of the murine musD retrotransposon requires long-range intramolecular interactions for function. Journal of Biological Chemistry 285:42097–42104 (2010). DOI: 10.1074/jbc.M110.182840, PMID: 20978285
+- Lehoczky JA, Thomas PE, Patrie KM, Owens KM, Villarreal LM, Galbraith K, Washburn J, Johnson CN, Gavino B, Borowsky AD, Millen KJ, Wakenight P, Law W, Van Keuren ML, Gavrilina G, Hughes ED, Saunders TL, Brihn L, Nadeau JH, Innis JW. A novel intergenic ETnII-β insertion mutation causes multiple malformations in Polypodia mice. PLOS Genetics 9:e1003967 (2013). DOI: 10.1371/journal.pgen.1003967, PMID: 24339789
+- Leung D, Du T, Wagner U, Xie W, Lee AY, Goyal P, Li Y, Szulwach KE, Jin P, Lorincz MC, Ren B. Regulation of DNA methylation turnover at LTR retrotransposons and imprinted loci by the histone methyltransferase Setdb1. PNAS 111:6690–6695 (2014). DOI: 10.1073/pnas.1322273111, PMID: 24757056
+- Lilue J, Doran AG, Fiddes IT, Abrudan M, Armstrong J, Bennett R, Chow W, Collins J, Collins S, Czechanski A, Danecek P, Diekhans M, Dolle DD, Dunn M, Durbin R, Earl D, Ferguson-Smith A, Flicek P, Flint J, Frankish A, Fu B, Gerstein M, Gilbert J, Goodstadt L, Harrow J, Howe K, Ibarra-Soria X, Kolmogorov M, Lelliott CJ, Logan DW, Loveland J, Mathews CE, Mott R, Muir P, Nachtweide S, Navarro FCP, Odom DT, Park N, Pelan S, Pham SK, Quail M, Reinholdt L, Romoth L, Shirley L, Sisu C, Sjoberg-Herrera M, Stanke M, Steward C, Thomas M, Threadgold G, Thybert D, Torrance J, Wong K, Wood J, Yalcin B, Yang F, Adams DJ, Paten B, Keane TM. Sixteen diverse laboratory mouse reference genomes define strain-specific haplotypes and novel functional loci. Nature Genetics 50:1574–1583 (2018). DOI: 10.1038/s41588-018-0223-8, PMID: 30275530
+- Liu S, Brind'Amour J, Karimi MM, Shirane K, Bogutz A, Lefebvre L, Sasaki H, Shinkai Y, Lorincz MC. Setdb1 is required for germline development and silencing of H3K9me3-marked endogenous retroviruses in primordial germ cells. Genes &amp; Development 28:2041–2055 (2014). DOI: 10.1101/gad.244848.114, PMID: 25228647
+- Love MI, Huber W, Anders S. Moderated estimation of fold change and dispersion for RNA-seq data with DESeq2. Genome Biology 15:550 (2014). DOI: 10.1186/s13059-014-0550-8, PMID: 25516281
+- Lugani F, Arora R, Papeta N, Patel A, Zheng Z, Sterken R, Singer RA, Caridi G, Mendelsohn C, Sussel L, Papaioannou VE, Gharavi AG. A retrotransposon insertion in the 5' regulatory domain of Ptf1a results in ectopic gene expression and multiple congenital defects in Danforth's short tail mouse. PLOS Genetics 9:e1003206 (2013). DOI: 10.1371/journal.pgen.1003206, PMID: 23437001
+- Macfarlan TS, Gifford WD, Driscoll S, Lettieri K, Rowe HM, Bonanomi D, Firth A, Singer O, Trono D, Pfaff SL. Embryonic stem cell potency fluctuates with endogenous retrovirus activity. Nature 487:57–63 (2012). DOI: 10.1038/nature11244, PMID: 22722858
+- Maksakova IA, Romanish MT, Gagnier L, Dunn CA, van de Lagemaat LN, Mager DL. Retroviral elements and their hosts: insertional mutagenesis in the mouse germ line. PLOS Genetics 2:e2 (2006). DOI: 10.1371/journal.pgen.0020002, PMID: 16440055
+- Matsui T, Leung D, Miyashita H, Maksakova IA, Miyachi H, Kimura H, Tachibana M, Lorincz MC, Shinkai Y. Proviral silencing in embryonic stem cells requires the histone methyltransferase ESET. Nature 464:927–931 (2010). DOI: 10.1038/nature08858, PMID: 20164836
+- Najafabadi HS, Mnaimneh S, Schmitges FW, Garton M, Lam KN, Yang A, Albu M, Weirauch MT, Radovani E, Kim PM, Greenblatt J, Frey BJ, Hughes TR. C2H2 zinc finger proteins greatly expand the human regulatory lexicon. Nature Biotechnology 33:555–562 (2015). DOI: 10.1038/nbt.3128, PMID: 25690854
+- Nellåker C, Keane TM, Yalcin B, Wong K, Agam A, Belgard TG, Flint J, Adams DJ, Frankel WN, Ponting CP. The genomic landscape shaped by selection on transposable elements across 18 mouse strains. Genome Biology 13:R45 (2012). DOI: 10.1186/gb-2012-13-6-r45, PMID: 22703977
+- O'Geen H, Frietze S, Farnham PJ. Using ChIP-seq technology to identify targets of zinc finger transcription factors. Methods in Molecular Biology 649:437–455 (2010). DOI: 10.1007/978-1-60761-753-2\_27, PMID: 20680851
+- Patel A, Yang P, Tinkham M, Pradhan M, Sun M-A, Wang Y, Hoang D, Wolf G, Horton JR, Zhang X, Macfarlan T, Cheng X. DNA conformation induces adaptable binding by tandem zinc finger proteins. Cell 173:221–233 (2018). DOI: 10.1016/j.cell.2018.02.058, PMID: 29551271
+- Ribet D, Dewannieux M, Heidmann T. An active murine transposon family pair: retrotransposition of "master" MusD copies and ETn trans-mobilization. Genome Research 14:2261–2267 (2004). DOI: 10.1101/gr.2924904, PMID: 15479948
+- Richardson SR, Gerdes P, Gerhardt DJ, Sanchez-Luque FJ, Bodea GO, Muñoz-Lopez M, Jesuadian JS, Kempen MHC, Carreira PE, Jeddeloh JA, Garcia-Perez JL, Kazazian HH, Ewing AD, Faulkner GJ. Heritable L1 retrotransposition in the mouse primordial germline and early embryo. Genome Research 27:1395–1405 (2017). DOI: 10.1101/gr.219022.116, PMID: 28483779
+- Rowe HM, Jakobsson J, Mesnard D, Rougemont J, Reynard S, Aktas T, Maillard PV, Layard-Liesching H, Verp S, Marquis J, Spitz F, Constam DB, Trono D. KAP1 controls endogenous retroviruses in embryonic stem cells. Nature 463:237–240 (2010). DOI: 10.1038/nature08674, PMID: 20075919
+- Rowe HM, Kapopoulou A, Corsinotti A, Fasching L, Macfarlan TS, Tarabay Y, Viville S, Jakobsson J, Pfaff SL, Trono D. TRIM28 repression of retrotransposon-based enhancers is necessary to preserve transcriptional dynamics in embryonic stem cells. Genome Research 23:452–461 (2013). DOI: 10.1101/gr.147678.112, PMID: 23233547
+- Schauer SN, Carreira PE, Shukla R, Gerhardt DJ, Gerdes P, Sanchez-Luque FJ, Nicoli P, Kindlova M, Ghisletti S, Santos AD, Rapoud D, Samuel D, Faivre J, Ewing AD, Richardson SR, Faulkner GJ. L1 retrotransposition is a common feature of mammalian hepatocarcinogenesis. Genome Research 28:639–653 (2018). DOI: 10.1101/gr.226993.117, PMID: 29643204
+- Schultz DC, Ayyanathan K, Negorev D, Maul GG, Rauscher FJ. SETDB1: a novel KAP-1-associated histone H3, lysine 9-specific methyltransferase that contributes to HP1-mediated silencing of euchromatic genes by KRAB zinc-finger proteins. Genes &amp; Development 16:919–932 (2002). DOI: 10.1101/gad.973302, PMID: 11959841
+- Semba K, Araki K, Matsumoto K, Suda H, Ando T, Sei A, Mizuta H, Takagi K, Nakahara M, Muta M, Yamada G, Nakagata N, Iida A, Ikegawa S, Nakamura Y, Araki M, Abe K, Yamamura K. Ectopic expression of Ptf1a induces spinal defects, urogenital defects, and anorectal malformations in Danforth's short tail mice. PLOS Genetics 9:e1003204 (2013). DOI: 10.1371/journal.pgen.1003204, PMID: 23436999
+- Sripathy SP, Stevens J, Schultz DC. The KAP1 corepressor functions to coordinate the assembly of de novo HP1-demarcated microenvironments of heterochromatin required for KRAB zinc finger protein-mediated transcriptional repression. Molecular and Cellular Biology 26:8623–8638 (2006). DOI: 10.1128/MCB.00487-06, PMID: 16954381
+- Thomas JH, Schneider S. Coevolution of retroelements and tandem zinc finger genes. Genome Research 21:1800–1812 (2011). DOI: 10.1101/gr.121749.111, PMID: 21784874
+- Thompson PJ, Macfarlan TS, Lorincz MC. Long terminal repeats: from parasitic elements to building blocks of the transcriptional regulatory repertoire. Molecular Cell 62:766–776 (2016). DOI: 10.1016/j.molcel.2016.03.029, PMID: 27259207
+- Treger RS, Pope SD, Kong Y, Tokuyama M, Taura M, Iwasaki A. The lupus susceptibility locus Sgp3 encodes the suppressor of endogenous retrovirus expression SNERV. Immunity 50:334–347 (2019). DOI: 10.1016/j.immuni.2018.12.022, PMID: 30709743
+- Vlangos CN, Siuniak AN, Robinson D, Chinnaiyan AM, Lyons RH, Cavalcoli JD, Keegan CE. Next-generation sequencing identifies the Danforth's short tail mouse mutation as a retrotransposon insertion affecting Ptf1a expression. PLOS Genetics 9:e1003205 (2013). DOI: 10.1371/journal.pgen.1003205, PMID: 23437000
+- Wang J, Xie G, Singh M, Ghanbarian AT, Raskó T, Szvetnik A, Cai H, Besser D, Prigione A, Fuchs NV, Schumann GG, Chen W, Lorincz MC, Ivics Z, Hurst LD, Izsvák Z. Primate-specific endogenous retrovirus-driven transcription defines naive-like stem cells. Nature 516:405–409 (2014). DOI: 10.1038/nature13804, PMID: 25317556
+- Wolf D, Hug K, Goff SP. TRIM28 mediates primer binding site-targeted silencing of Lys1,2 tRNA-utilizing retroviruses in embryonic cells. PNAS 105:12521–12526 (2008). DOI: 10.1073/pnas.0805540105, PMID: 18713861
+- Wolf G, Greenberg D, Macfarlan TS. Spotting the enemy within: targeted silencing of foreign DNA in mammalian genomes by the Krüppel-associated box zinc finger protein family. Mobile DNA 6:17 (2015a). DOI: 10.1186/s13100-015-0050-8, PMID: 26435754
+- Wolf G, Yang P, Füchtbauer AC, Füchtbauer EM, Silva AM, Park C, Wu W, Nielsen AL, Pedersen FS, Macfarlan TS. The KRAB zinc finger protein ZFP809 is required to initiate epigenetic silencing of endogenous retroviruses. Genes &amp; Development 29:538–554 (2015b). DOI: 10.1101/gad.252767.114, PMID: 25737282
+- Yamauchi M, Freitag B, Khan C, Berwin B, Barklis E. Stem cell factor binding to retrovirus primer binding site silencers. Journal of Virology 69:1142–1149 (1995). DOI: 10.1128/JVI.69.2.1142-1149.1995, PMID: 7529329
+- Zhang Y, Liu T, Meyer CA, Eeckhoute J, Johnson DS, Bernstein BE, Nusbaum C, Myers RM, Brown M, Li W, Liu XS. Model-based analysis of ChIP-Seq (MACS). Genome Biology 9:R137 (2008). DOI: 10.1186/gb-2008-9-9-r137, PMID: 18798982
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v2/ending_with_table.md.md b/tests/data/groundtruth/docling_v2/ending_with_table.md.md
new file mode 100644
index 00000000..9c179fe0
--- /dev/null
+++ b/tests/data/groundtruth/docling_v2/ending_with_table.md.md
@@ -0,0 +1,6 @@
+| Character      | Name in German   | Name in French   | Name in Italian   |
+|----------------|------------------|------------------|-------------------|
+| Scrooge McDuck | Dagobert Duck    | Balthazar Picsou | Paperone          |
+| Huey           | Tick             | Riri             | Qui               |
+| Dewey          | Trick            | Fifi             | Quo               |
+| Louie          | Track            | Loulou           | Qua               |
diff --git a/tests/data/groundtruth/docling_v2/example_01.html.itxt b/tests/data/groundtruth/docling_v2/example_01.html.itxt
index 9b2277a3..fbd75125 100644
--- a/tests/data/groundtruth/docling_v2/example_01.html.itxt
+++ b/tests/data/groundtruth/docling_v2/example_01.html.itxt
@@ -1,8 +1,8 @@
 item-0 at level 0: unspecified: group _root_
   item-1 at level 1: title: Introduction
-    item-2 at level 2: paragraph: This is the first paragraph of the introduction.
+    item-2 at level 2: text: This is the first paragraph of the introduction.
     item-3 at level 2: section_header: Background
-      item-4 at level 3: paragraph: Some background information here.
+      item-4 at level 3: text: Some background information here.
       item-5 at level 3: picture
       item-6 at level 3: list: group list
         item-7 at level 4: list_item: First item in unordered list
diff --git a/tests/data/groundtruth/docling_v2/example_01.html.json b/tests/data/groundtruth/docling_v2/example_01.html.json
index 044287c1..d5617892 100644
--- a/tests/data/groundtruth/docling_v2/example_01.html.json
+++ b/tests/data/groundtruth/docling_v2/example_01.html.json
@@ -1,6 +1,6 @@
 {
   "schema_name": "DoclingDocument",
-  "version": "1.0.0",
+  "version": "1.1.0",
   "name": "example_01",
   "origin": {
     "mimetype": "text/html",
@@ -10,6 +10,7 @@
   "furniture": {
     "self_ref": "#/furniture",
     "children": [],
+    "content_layer": "furniture",
     "name": "_root_",
     "label": "unspecified"
   },
@@ -20,6 +21,7 @@
         "$ref": "#/texts/0"
       }
     ],
+    "content_layer": "body",
     "name": "_root_",
     "label": "unspecified"
   },
@@ -37,6 +39,7 @@
           "$ref": "#/texts/5"
         }
       ],
+      "content_layer": "body",
       "name": "list",
       "label": "list"
     },
@@ -53,6 +56,7 @@
           "$ref": "#/texts/7"
         }
       ],
+      "content_layer": "body",
       "name": "ordered list",
       "label": "ordered_list"
     }
@@ -71,6 +75,7 @@
           "$ref": "#/texts/2"
         }
       ],
+      "content_layer": "body",
       "label": "title",
       "prov": [],
       "orig": "Introduction",
@@ -82,7 +87,8 @@
         "$ref": "#/texts/0"
       },
       "children": [],
-      "label": "paragraph",
+      "content_layer": "body",
+      "label": "text",
       "prov": [],
       "orig": "This is the first paragraph of the introduction.",
       "text": "This is the first paragraph of the introduction."
@@ -106,6 +112,7 @@
           "$ref": "#/groups/1"
         }
       ],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
       "orig": "Background",
@@ -118,7 +125,8 @@
         "$ref": "#/texts/2"
       },
       "children": [],
-      "label": "paragraph",
+      "content_layer": "body",
+      "label": "text",
       "prov": [],
       "orig": "Some background information here.",
       "text": "Some background information here."
@@ -129,6 +137,7 @@
         "$ref": "#/groups/0"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "First item in unordered list",
@@ -142,6 +151,7 @@
         "$ref": "#/groups/0"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "Second item in unordered list",
@@ -155,6 +165,7 @@
         "$ref": "#/groups/1"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "First item in ordered list",
@@ -168,6 +179,7 @@
         "$ref": "#/groups/1"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "Second item in ordered list",
@@ -183,6 +195,7 @@
         "$ref": "#/texts/2"
       },
       "children": [],
+      "content_layer": "body",
       "label": "picture",
       "prov": [],
       "captions": [],
@@ -193,5 +206,6 @@
   ],
   "tables": [],
   "key_value_items": [],
+  "form_items": [],
   "pages": {}
 }
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v2/example_02.html.itxt b/tests/data/groundtruth/docling_v2/example_02.html.itxt
index 93f0352e..49ea71e8 100644
--- a/tests/data/groundtruth/docling_v2/example_02.html.itxt
+++ b/tests/data/groundtruth/docling_v2/example_02.html.itxt
@@ -1,8 +1,8 @@
 item-0 at level 0: unspecified: group _root_
   item-1 at level 1: title: Introduction
-    item-2 at level 2: paragraph: This is the first paragraph of the introduction.
+    item-2 at level 2: text: This is the first paragraph of the introduction.
     item-3 at level 2: section_header: Background
-      item-4 at level 3: paragraph: Some background information here.
+      item-4 at level 3: text: Some background information here.
       item-5 at level 3: list: group list
         item-6 at level 4: list_item: First item in unordered list
         item-7 at level 4: list_item: Second item in unordered list
diff --git a/tests/data/groundtruth/docling_v2/example_02.html.json b/tests/data/groundtruth/docling_v2/example_02.html.json
index 0dbff9f3..ebd5fb63 100644
--- a/tests/data/groundtruth/docling_v2/example_02.html.json
+++ b/tests/data/groundtruth/docling_v2/example_02.html.json
@@ -1,6 +1,6 @@
 {
   "schema_name": "DoclingDocument",
-  "version": "1.0.0",
+  "version": "1.1.0",
   "name": "example_02",
   "origin": {
     "mimetype": "text/html",
@@ -10,6 +10,7 @@
   "furniture": {
     "self_ref": "#/furniture",
     "children": [],
+    "content_layer": "furniture",
     "name": "_root_",
     "label": "unspecified"
   },
@@ -20,6 +21,7 @@
         "$ref": "#/texts/0"
       }
     ],
+    "content_layer": "body",
     "name": "_root_",
     "label": "unspecified"
   },
@@ -37,6 +39,7 @@
           "$ref": "#/texts/5"
         }
       ],
+      "content_layer": "body",
       "name": "list",
       "label": "list"
     },
@@ -53,6 +56,7 @@
           "$ref": "#/texts/7"
         }
       ],
+      "content_layer": "body",
       "name": "ordered list",
       "label": "ordered_list"
     }
@@ -71,6 +75,7 @@
           "$ref": "#/texts/2"
         }
       ],
+      "content_layer": "body",
       "label": "title",
       "prov": [],
       "orig": "Introduction",
@@ -82,7 +87,8 @@
         "$ref": "#/texts/0"
       },
       "children": [],
-      "label": "paragraph",
+      "content_layer": "body",
+      "label": "text",
       "prov": [],
       "orig": "This is the first paragraph of the introduction.",
       "text": "This is the first paragraph of the introduction."
@@ -103,6 +109,7 @@
           "$ref": "#/groups/1"
         }
       ],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
       "orig": "Background",
@@ -115,7 +122,8 @@
         "$ref": "#/texts/2"
       },
       "children": [],
-      "label": "paragraph",
+      "content_layer": "body",
+      "label": "text",
       "prov": [],
       "orig": "Some background information here.",
       "text": "Some background information here."
@@ -126,6 +134,7 @@
         "$ref": "#/groups/0"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "First item in unordered list",
@@ -139,6 +148,7 @@
         "$ref": "#/groups/0"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "Second item in unordered list",
@@ -152,6 +162,7 @@
         "$ref": "#/groups/1"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "First item in ordered list",
@@ -165,6 +176,7 @@
         "$ref": "#/groups/1"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "Second item in ordered list",
@@ -176,5 +188,6 @@
   "pictures": [],
   "tables": [],
   "key_value_items": [],
+  "form_items": [],
   "pages": {}
 }
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v2/example_03.html.itxt b/tests/data/groundtruth/docling_v2/example_03.html.itxt
index 5fce9389..5b31bf82 100644
--- a/tests/data/groundtruth/docling_v2/example_03.html.itxt
+++ b/tests/data/groundtruth/docling_v2/example_03.html.itxt
@@ -1,9 +1,9 @@
 item-0 at level 0: unspecified: group _root_
   item-1 at level 1: title: Example Document
     item-2 at level 2: section_header: Introduction
-      item-3 at level 3: paragraph: This is the first paragraph of the introduction.
+      item-3 at level 3: text: This is the first paragraph of the introduction.
     item-4 at level 2: section_header: Background
-      item-5 at level 3: paragraph: Some background information here.
+      item-5 at level 3: text: Some background information here.
       item-6 at level 3: list: group list
         item-7 at level 4: list_item: First item in unordered list
           item-8 at level 5: list: group list
diff --git a/tests/data/groundtruth/docling_v2/example_03.html.json b/tests/data/groundtruth/docling_v2/example_03.html.json
index 206048da..74b2837e 100644
--- a/tests/data/groundtruth/docling_v2/example_03.html.json
+++ b/tests/data/groundtruth/docling_v2/example_03.html.json
@@ -1,6 +1,6 @@
 {
   "schema_name": "DoclingDocument",
-  "version": "1.0.0",
+  "version": "1.1.0",
   "name": "example_03",
   "origin": {
     "mimetype": "text/html",
@@ -10,6 +10,7 @@
   "furniture": {
     "self_ref": "#/furniture",
     "children": [],
+    "content_layer": "furniture",
     "name": "_root_",
     "label": "unspecified"
   },
@@ -20,6 +21,7 @@
         "$ref": "#/texts/0"
       }
     ],
+    "content_layer": "body",
     "name": "_root_",
     "label": "unspecified"
   },
@@ -37,6 +39,7 @@
           "$ref": "#/texts/8"
         }
       ],
+      "content_layer": "body",
       "name": "list",
       "label": "list"
     },
@@ -53,6 +56,7 @@
           "$ref": "#/texts/7"
         }
       ],
+      "content_layer": "body",
       "name": "list",
       "label": "list"
     },
@@ -69,6 +73,7 @@
           "$ref": "#/texts/12"
         }
       ],
+      "content_layer": "body",
       "name": "ordered list",
       "label": "ordered_list"
     },
@@ -85,6 +90,7 @@
           "$ref": "#/texts/11"
         }
       ],
+      "content_layer": "body",
       "name": "ordered list",
       "label": "ordered_list"
     }
@@ -106,6 +112,7 @@
           "$ref": "#/texts/13"
         }
       ],
+      "content_layer": "body",
       "label": "title",
       "prov": [],
       "orig": "Example Document",
@@ -121,6 +128,7 @@
           "$ref": "#/texts/2"
         }
       ],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
       "orig": "Introduction",
@@ -133,7 +141,8 @@
         "$ref": "#/texts/1"
       },
       "children": [],
-      "label": "paragraph",
+      "content_layer": "body",
+      "label": "text",
       "prov": [],
       "orig": "This is the first paragraph of the introduction.",
       "text": "This is the first paragraph of the introduction."
@@ -154,6 +163,7 @@
           "$ref": "#/groups/2"
         }
       ],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
       "orig": "Background",
@@ -166,7 +176,8 @@
         "$ref": "#/texts/3"
       },
       "children": [],
-      "label": "paragraph",
+      "content_layer": "body",
+      "label": "text",
       "prov": [],
       "orig": "Some background information here.",
       "text": "Some background information here."
@@ -181,6 +192,7 @@
           "$ref": "#/groups/1"
         }
       ],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "First item in unordered list",
@@ -194,6 +206,7 @@
         "$ref": "#/groups/1"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "Nested item 1",
@@ -207,6 +220,7 @@
         "$ref": "#/groups/1"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "Nested item 2",
@@ -220,6 +234,7 @@
         "$ref": "#/groups/0"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "Second item in unordered list",
@@ -237,6 +252,7 @@
           "$ref": "#/groups/3"
         }
       ],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "First item in ordered list",
@@ -250,6 +266,7 @@
         "$ref": "#/groups/3"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "Nested ordered item 1",
@@ -263,6 +280,7 @@
         "$ref": "#/groups/3"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "Nested ordered item 2",
@@ -276,6 +294,7 @@
         "$ref": "#/groups/2"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "Second item in ordered list",
@@ -293,6 +312,7 @@
           "$ref": "#/tables/0"
         }
       ],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
       "orig": "Data Table",
@@ -308,6 +328,7 @@
         "$ref": "#/texts/13"
       },
       "children": [],
+      "content_layer": "body",
       "label": "table",
       "prov": [],
       "captions": [],
@@ -620,5 +641,6 @@
     }
   ],
   "key_value_items": [],
+  "form_items": [],
   "pages": {}
 }
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v2/example_04.html.json b/tests/data/groundtruth/docling_v2/example_04.html.json
index c7d6af05..4de7cd7f 100644
--- a/tests/data/groundtruth/docling_v2/example_04.html.json
+++ b/tests/data/groundtruth/docling_v2/example_04.html.json
@@ -1,6 +1,6 @@
 {
   "schema_name": "DoclingDocument",
-  "version": "1.0.0",
+  "version": "1.1.0",
   "name": "example_04",
   "origin": {
     "mimetype": "text/html",
@@ -10,6 +10,7 @@
   "furniture": {
     "self_ref": "#/furniture",
     "children": [],
+    "content_layer": "furniture",
     "name": "_root_",
     "label": "unspecified"
   },
@@ -20,6 +21,7 @@
         "$ref": "#/texts/0"
       }
     ],
+    "content_layer": "body",
     "name": "_root_",
     "label": "unspecified"
   },
@@ -35,6 +37,7 @@
           "$ref": "#/tables/0"
         }
       ],
+      "content_layer": "body",
       "label": "title",
       "prov": [],
       "orig": "Data Table with Rowspan and Colspan",
@@ -49,6 +52,7 @@
         "$ref": "#/texts/0"
       },
       "children": [],
+      "content_layer": "body",
       "label": "table",
       "prov": [],
       "captions": [],
@@ -325,5 +329,6 @@
     }
   ],
   "key_value_items": [],
+  "form_items": [],
   "pages": {}
 }
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v2/example_04.html.md b/tests/data/groundtruth/docling_v2/example_04.html.md
index e620a999..f204a12a 100644
--- a/tests/data/groundtruth/docling_v2/example_04.html.md
+++ b/tests/data/groundtruth/docling_v2/example_04.html.md
@@ -1,7 +1,7 @@
 # Data Table with Rowspan and Colspan
 
-| Header 1                   | Header 2 & 3 (colspan)     | Header 2 & 3 (colspan)     |
+| Header 1                   | Header 2 &amp; 3 (colspan)     | Header 2 &amp; 3 (colspan)     |
 |----------------------------|----------------------------|----------------------------|
-| Row 1 & 2, Col 1 (rowspan) | Row 1, Col 2               | Row 1, Col 3               |
-| Row 1 & 2, Col 1 (rowspan) | Row 2, Col 2 & 3 (colspan) | Row 2, Col 2 & 3 (colspan) |
+| Row 1 &amp; 2, Col 1 (rowspan) | Row 1, Col 2               | Row 1, Col 3               |
+| Row 1 &amp; 2, Col 1 (rowspan) | Row 2, Col 2 &amp; 3 (colspan) | Row 2, Col 2 &amp; 3 (colspan) |
 | Row 3, Col 1               | Row 3, Col 2               | Row 3, Col 3               |
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v2/example_05.html.json b/tests/data/groundtruth/docling_v2/example_05.html.json
index ae311397..936a0f9b 100644
--- a/tests/data/groundtruth/docling_v2/example_05.html.json
+++ b/tests/data/groundtruth/docling_v2/example_05.html.json
@@ -1,6 +1,6 @@
 {
   "schema_name": "DoclingDocument",
-  "version": "1.0.0",
+  "version": "1.1.0",
   "name": "example_05",
   "origin": {
     "mimetype": "text/html",
@@ -10,6 +10,7 @@
   "furniture": {
     "self_ref": "#/furniture",
     "children": [],
+    "content_layer": "furniture",
     "name": "_root_",
     "label": "unspecified"
   },
@@ -20,6 +21,7 @@
         "$ref": "#/texts/0"
       }
     ],
+    "content_layer": "body",
     "name": "_root_",
     "label": "unspecified"
   },
@@ -35,6 +37,7 @@
           "$ref": "#/tables/0"
         }
       ],
+      "content_layer": "body",
       "label": "title",
       "prov": [],
       "orig": "Omitted html and body tags",
@@ -49,6 +52,7 @@
         "$ref": "#/texts/0"
       },
       "children": [],
+      "content_layer": "body",
       "label": "table",
       "prov": [],
       "captions": [],
@@ -325,5 +329,6 @@
     }
   ],
   "key_value_items": [],
+  "form_items": [],
   "pages": {}
 }
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v2/example_05.html.md b/tests/data/groundtruth/docling_v2/example_05.html.md
index 787f6d23..fbb24b62 100644
--- a/tests/data/groundtruth/docling_v2/example_05.html.md
+++ b/tests/data/groundtruth/docling_v2/example_05.html.md
@@ -1,7 +1,7 @@
 # Omitted html and body tags
 
-| Header 1                   | Header 2 & 3 (colspan)     | Header 2 & 3 (colspan)     |
+| Header 1                   | Header 2 &amp; 3 (colspan)     | Header 2 &amp; 3 (colspan)     |
 |----------------------------|----------------------------|----------------------------|
-| Row 1 & 2, Col 1 (rowspan) | Row 1, Col 2               | Row 1, Col 3               |
-| Row 1 & 2, Col 1 (rowspan) | Row 2, Col 2 & 3 (colspan) | Row 2, Col 2 & 3 (colspan) |
+| Row 1 &amp; 2, Col 1 (rowspan) | Row 1, Col 2               | Row 1, Col 3               |
+| Row 1 &amp; 2, Col 1 (rowspan) | Row 2, Col 2 &amp; 3 (colspan) | Row 2, Col 2 &amp; 3 (colspan) |
 | Row 3, Col 1               | Row 3, Col 2               | Row 3, Col 3               |
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v2/example_06.html.itxt b/tests/data/groundtruth/docling_v2/example_06.html.itxt
new file mode 100644
index 00000000..0cbdcf4e
--- /dev/null
+++ b/tests/data/groundtruth/docling_v2/example_06.html.itxt
@@ -0,0 +1,7 @@
+item-0 at level 0: unspecified: group _root_
+  item-1 at level 1: text: This is a div with text.
+  item-2 at level 1: text: This is another div with text.
+  item-3 at level 1: text: This is a regular paragraph.
+  item-4 at level 1: text: This is a third div
+with a new line.
+  item-5 at level 1: text: This is a fourth div with a bold paragraph.
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v2/example_06.html.json b/tests/data/groundtruth/docling_v2/example_06.html.json
new file mode 100644
index 00000000..5873774e
--- /dev/null
+++ b/tests/data/groundtruth/docling_v2/example_06.html.json
@@ -0,0 +1,108 @@
+{
+  "schema_name": "DoclingDocument",
+  "version": "1.1.0",
+  "name": "example_06",
+  "origin": {
+    "mimetype": "text/html",
+    "binary_hash": 14574683870626799530,
+    "filename": "example_06.html"
+  },
+  "furniture": {
+    "self_ref": "#/furniture",
+    "children": [],
+    "content_layer": "furniture",
+    "name": "_root_",
+    "label": "unspecified"
+  },
+  "body": {
+    "self_ref": "#/body",
+    "children": [
+      {
+        "$ref": "#/texts/0"
+      },
+      {
+        "$ref": "#/texts/1"
+      },
+      {
+        "$ref": "#/texts/2"
+      },
+      {
+        "$ref": "#/texts/3"
+      },
+      {
+        "$ref": "#/texts/4"
+      }
+    ],
+    "content_layer": "body",
+    "name": "_root_",
+    "label": "unspecified"
+  },
+  "groups": [],
+  "texts": [
+    {
+      "self_ref": "#/texts/0",
+      "parent": {
+        "$ref": "#/body"
+      },
+      "children": [],
+      "content_layer": "body",
+      "label": "text",
+      "prov": [],
+      "orig": "This is a div with text.",
+      "text": "This is a div with text."
+    },
+    {
+      "self_ref": "#/texts/1",
+      "parent": {
+        "$ref": "#/body"
+      },
+      "children": [],
+      "content_layer": "body",
+      "label": "text",
+      "prov": [],
+      "orig": "This is another div with text.",
+      "text": "This is another div with text."
+    },
+    {
+      "self_ref": "#/texts/2",
+      "parent": {
+        "$ref": "#/body"
+      },
+      "children": [],
+      "content_layer": "body",
+      "label": "text",
+      "prov": [],
+      "orig": "This is a regular paragraph.",
+      "text": "This is a regular paragraph."
+    },
+    {
+      "self_ref": "#/texts/3",
+      "parent": {
+        "$ref": "#/body"
+      },
+      "children": [],
+      "content_layer": "body",
+      "label": "text",
+      "prov": [],
+      "orig": "This is a third div\nwith a new line.",
+      "text": "This is a third div\nwith a new line."
+    },
+    {
+      "self_ref": "#/texts/4",
+      "parent": {
+        "$ref": "#/body"
+      },
+      "children": [],
+      "content_layer": "body",
+      "label": "text",
+      "prov": [],
+      "orig": "This is a fourth div with a bold paragraph.",
+      "text": "This is a fourth div with a bold paragraph."
+    }
+  ],
+  "pictures": [],
+  "tables": [],
+  "key_value_items": [],
+  "form_items": [],
+  "pages": {}
+}
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v2/example_06.html.md b/tests/data/groundtruth/docling_v2/example_06.html.md
new file mode 100644
index 00000000..ed105e65
--- /dev/null
+++ b/tests/data/groundtruth/docling_v2/example_06.html.md
@@ -0,0 +1,10 @@
+This is a div with text.
+
+This is another div with text.
+
+This is a regular paragraph.
+
+This is a third div
+with a new line.
+
+This is a fourth div with a bold paragraph.
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v2/ipa20180000016.json b/tests/data/groundtruth/docling_v2/ipa20180000016.json
index d5d0d3ec..9692e485 100644
--- a/tests/data/groundtruth/docling_v2/ipa20180000016.json
+++ b/tests/data/groundtruth/docling_v2/ipa20180000016.json
@@ -1,6 +1,6 @@
 {
   "schema_name": "DoclingDocument",
-  "version": "1.0.0",
+  "version": "1.1.0",
   "name": "ipa20180000016.xml",
   "origin": {
     "mimetype": "application/xml",
@@ -10,6 +10,7 @@
   "furniture": {
     "self_ref": "#/furniture",
     "children": [],
+    "content_layer": "furniture",
     "name": "_root_",
     "label": "unspecified"
   },
@@ -20,6 +21,7 @@
         "$ref": "#/texts/0"
       }
     ],
+    "content_layer": "body",
     "name": "_root_",
     "label": "unspecified"
   },
@@ -68,6 +70,7 @@
           "$ref": "#/texts/171"
         }
       ],
+      "content_layer": "body",
       "label": "title",
       "prov": [],
       "orig": "LIGHT EMITTING DEVICE AND PLANT CULTIVATION METHOD",
@@ -83,6 +86,7 @@
           "$ref": "#/texts/2"
         }
       ],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
       "orig": "ABSTRACT",
@@ -95,6 +99,7 @@
         "$ref": "#/texts/1"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Provided is a light emitting device that includes a light emitting element having a light emission peak wavelength ranging from 380 nm to 490 nm, and a fluorescent material excited by light from the light emitting element and emitting light having at a light emission peak wavelength ranging from 580 nm or more to less than 680 nm. The light emitting device emits light having a ratio R/B of a photon flux density R to a photon flux density B ranging from 2.0 to 4.0 and a ratio R/FR of the photon flux density R to a photon flux density FR ranging from 0.7 to 13.0, the photon flux density R being in a wavelength range of 620 nm or more and less than 700 nm, the photon flux density B being in a wavelength range of 380 nm or more and 490 nm or less, and the photon flux density FR being in a wavelength range of 700 nm or more and 780 nm or less.",
@@ -110,6 +115,7 @@
           "$ref": "#/texts/4"
         }
       ],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
       "orig": "CROSS-REFERENCE TO RELATED APPLICATION",
@@ -122,6 +128,7 @@
         "$ref": "#/texts/3"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "The application claims benefit of Japanese Patent Application No. 2016-128835 filed on Jun. 29, 2016, the entire disclosure of which is hereby incorporated by reference in its entirety.",
@@ -133,6 +140,7 @@
         "$ref": "#/texts/0"
       },
       "children": [],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
       "orig": "BACKGROUND",
@@ -149,6 +157,7 @@
           "$ref": "#/texts/7"
         }
       ],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
       "orig": "Technical Field",
@@ -161,6 +170,7 @@
         "$ref": "#/texts/6"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "The present disclosure relates to a light emitting device and a plant cultivation method.",
@@ -188,6 +198,7 @@
           "$ref": "#/texts/13"
         }
       ],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
       "orig": "Description of Related Art",
@@ -200,6 +211,7 @@
         "$ref": "#/texts/8"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "With environmental changes due to climate change and other artificial disruptions, plant factories are expected to increase production efficiency of vegetables and be capable of adjusting production in order to make it possible to stably supply vegetables. Plant factories that are capable of artificial management can stably supply clean and safe vegetables to markets, and therefore are expected to be the next-generation industries.",
@@ -211,6 +223,7 @@
         "$ref": "#/texts/8"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Plant factories that are completely isolated from external environment make it possible to artificially control and collect various data such as growth method, growth rate data, yield data, depending on classification of plants. Based on those data, plant factories are able to plan production according to the balance between supply and demand in markets, and supply plants such as vegetables without depending on surrounding conditions such as climatic environment. Particularly, an increase in food production is indispensable with world population growth. If plants can be systematically produced without the influence by surrounding conditions such as climatic environment, vegetables produced in plant factories can be stably supplied within a country, and additionally can be exported abroad as viable products.",
@@ -222,6 +235,7 @@
         "$ref": "#/texts/8"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "In general, vegetables that are grown outdoors get sunlight, grow while conducting photosynthesis, and are gathered. On the other hand, vegetables that are grown in plant factories are required to be harvested in a short period of time, or are required to grow in larger than normal sizes even in an ordinary growth period.",
@@ -233,6 +247,7 @@
         "$ref": "#/texts/8"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "In plant factories, the light source used in place of sunlight affect a growth period, growth of plants. LED lighting is being used in place of conventional fluorescent lamps, from a standpoint of power consumption reduction.",
@@ -244,6 +259,7 @@
         "$ref": "#/texts/8"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "For example, Japanese Unexamined Patent Publication No. 2009-125007 discloses a plant growth method. In this method, the plants is irradiated with light emitted from a first LED light emitting element and/or a second LED light emitting element at predetermined timings using a lighting apparatus including the first LED light emitting element emitting light having a wavelength region of 625 to 690 nm and the second LED light emitting element emitting light having a wavelength region of 420 to 490 nm in order to emit lights having sufficient intensities and different wavelengths from each other.",
@@ -274,6 +290,7 @@
           "$ref": "#/texts/20"
         }
       ],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
       "orig": "SUMMARY",
@@ -286,6 +303,7 @@
         "$ref": "#/texts/14"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "However, even though plants are merely irradiated with lights having different wavelengths as in the plant growth method disclosed in Japanese Unexamined Patent Publication No. 2009-125007, the effect of promoting plant growth is not sufficient. Further improvement is required in promotion of plant growth.",
@@ -297,6 +315,7 @@
         "$ref": "#/texts/14"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Accordingly, an object of the present disclosure is to provide a light emitting device capable of promoting growth of plants and a plant cultivation method.",
@@ -308,6 +327,7 @@
         "$ref": "#/texts/14"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Means for solving the above problems are as follows, and the present disclosure includes the following embodiments.",
@@ -319,6 +339,7 @@
         "$ref": "#/texts/14"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "A first embodiment of the present disclosure is a light emitting device including a light emitting element having a light emission peak wavelength in a range of 380 nm or more and 490 nm or less, and a fluorescent material that is excited by light from the light emitting element and emits light having at least one light emission peak wavelength in a range of 580 nm or more and less than 680 nm. The light emitting device emits light having a ratio R/B of a photon flux density R to a photon flux density B within a range of 2.0 or more and 4.0 or less, and a ratio R/FR of a photon flux density R to a photon flux density FR within a range of 0.7 or more and 13.0 or less, where the photon flux density R is the number of light quanta (\u03bcmol\u00b7m\u207b\u00b2\u00b7g\u207b\u00b9) incident per unit time and unit area in a wavelength range of 620 nm or more and less than 700 nm, the photon flux density B is the number of light quanta (\u03bcmol\u00b7m\u207b\u00b2\u00b7g\u207b\u00b9) incident per unit time and unit area in a wavelength range of 380 nm or more and 490 nm or less, and the photon flux density FR is the number of light quanta (\u03bcmol\u00b7m\u207b\u00b2\u00b7g\u207b\u00b9) incident per unit time and unit area in a wavelength range of 700 nm or more and 780 nm or less.",
@@ -330,6 +351,7 @@
         "$ref": "#/texts/14"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "A second embodiment of the present disclosure is a plant cultivation method including irradiating plants with light from the light emitting device.",
@@ -341,6 +363,7 @@
         "$ref": "#/texts/14"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "According to embodiments of the present disclosure, a light emitting device capable of promoting growth of plants and a plant cultivation method can be provided.",
@@ -365,6 +388,7 @@
           "$ref": "#/texts/25"
         }
       ],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
       "orig": "BRIEF DESCRIPTION OF THE DRAWINGS",
@@ -377,6 +401,7 @@
         "$ref": "#/texts/21"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "FIG. 1 is a schematic cross sectional view of a light emitting device according to an embodiment of the present disclosure.",
@@ -388,6 +413,7 @@
         "$ref": "#/texts/21"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "FIG. 2 is a diagram showing spectra of wavelengths and relative photon flux densities of exemplary light emitting devices according to embodiments of the present disclosure and a comparative light emitting devices.",
@@ -399,6 +425,7 @@
         "$ref": "#/texts/21"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "FIG. 3 is a graph showing fresh weight (edible part) at the harvest time of each plant grown by irradiating the plant with light from exemplary light emitting devices according to embodiments of the present disclosure and a comparative light emitting device.",
@@ -410,6 +437,7 @@
         "$ref": "#/texts/21"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "FIG. 4 is a graph showing nitrate nitrogen content in each plant grown by irradiating the plant with light from exemplary light emitting devices according to embodiments of the present disclosure and a comparative light emitting device.",
@@ -458,6 +486,7 @@
           "$ref": "#/texts/126"
         }
       ],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
       "orig": "DETAILED DESCRIPTION",
@@ -470,6 +499,7 @@
         "$ref": "#/texts/26"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "A light emitting device and a plant cultivation method according to the present invention will be described below based on an embodiment. However, the embodiment described below only exemplifies the technical concept of the present invention, and the present invention is not limited to the light emitting device and plant cultivation method described below. In the present specification, the relationship between the color name and the chromaticity coordinate, the relationship between the wavelength range of light and the color name of monochromatic light follows JIS Z8110.",
@@ -524,6 +554,7 @@
           "$ref": "#/texts/42"
         }
       ],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
       "orig": "Light Emitting Device",
@@ -536,6 +567,7 @@
         "$ref": "#/texts/28"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "An embodiment of the present disclosure is a light emitting device including a light emitting element having a light emission peak wavelength in a range of 380 nm or more and 490 nm or less (hereinafter sometimes referred to as a \u201cregion of from near ultraviolet to blue color\u201d), and a first fluorescent material emitting light having at least one light emission peak wavelength in a range of 580 nm or more and less than 680 nm by being excited by light from the light emitting element. The light emitting device emits light having a ratio R/B of a photon flux density R to a photon flux density B within a range of 2.0 or more and 4.0 or less, and a ratio R/FR of the photon flux density R to a photon flux density FR within a range of 0.7 or more and 13.0 or less, where the photon flux density R is the number of light quanta (\u03bcmol\u00b7m\u207b\u00b2\u00b7g\u207b\u00b9) incident per unit time and unit area in a wavelength range of 620 nm or more and less than 700 nm, the photon flux density B is the number of light quanta (\u03bcmol\u00b7m\u207b\u00b2\u00b7g\u207b\u00b9) incident per unit time and unit area in a wavelength range of 380 nm or more and 490 nm or less, and the photon flux density FR is the number of light quanta (\u03bcmol\u00b7m\u207b\u00b2\u00b7g\u207b\u00b9) incident per unit time and unit area in a wavelength range of 700 nm or more and 780 nm or less.",
@@ -547,6 +579,7 @@
         "$ref": "#/texts/28"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "An example of the light emitting device according to one embodiment of the present disclosure is described below based on the drawings. FIG. 1 is a schematic cross sectional view showing a light emitting device 100 according to an embodiment of the present disclosure.",
@@ -558,6 +591,7 @@
         "$ref": "#/texts/28"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "The light emitting device 100 includes a molded article 40, a light emitting element 10 and a fluorescent member 50, as shown in FIG. 1. The molded article 40 includes a first lead 20 and a second lead 30 that are integrally molded with a resin portion 42 containing a thermoplastic resin or a thermosetting resin. The molded article 40 forms a depression having a bottom and sides, and the light emitting element 10 is placed on the bottom of the depression. The light emitting element 10 has a pair of an anode and a cathode, and the anode and the cathode are electrically connected to the first lead 20 and the second lead 30 respectively through the respective wires 60. The light emitting element 10 is covered with the fluorescent member 50. The fluorescent member 50 includes, for example, a fluorescent material 70 performing wavelength conversion of light from the light emitting element 10, and a resin. The fluorescent material 70 includes a first fluorescent material 71 and a second fluorescent material 72. A part of the first lead 20 and the second lead 30 that are connected to a pair of the anode and the cathode of the light emitting element 10 is exposed toward outside a package constituting the light emitting element 100. The light emitting device 100 can emit light by receiving electric power supply from the outside through the first lead 20 and the second lead 30.",
@@ -569,6 +603,7 @@
         "$ref": "#/texts/28"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "The fluorescent member 50 not only performs wavelength conversion of light emitted from the light emitting element 10, but functions as a member for protecting the light emitting element 10 from the external environment. In FIG. 1, the fluorescent material 70 is localized in the fluorescent member 50 in the state that the first fluorescent material 71 and the second fluorescent material 72 are mixed with each other, and is arranged adjacent to the light emitting element 10. This constitution can efficiently perform the wavelength conversion of light from the light emitting element 10 in the fluorescent material 70, and as a result, can provide a light emitting device having excellent light emission efficiency. The arrangement of the fluorescent member 50 containing the fluorescent material 70, and the light emitting element 10 is not limited to the embodiment that the fluorescent material 70 is arranged adjacent to the light emitting element 10 as shown in FIG. 1, and considering the influence of heat generated from the light emitting element 10, the fluorescent material 70 can be arranged separated from the light emitting element 10 in the fluorescent member 50. Furthermore, light having suppressed color unevenness can be emitted from the light emitting device 100 by arranging the fluorescent material 70 almost evenly in the fluorescent member 50. In FIG. 1, the fluorescent material 70 is arranged in the state that the first fluorescent material 71 and the second fluorescent material 72 are mixed with each other. However, for example, the first fluorescent material 71 may be arranged in a layer state and the second fluorescent material 72 may be arranged thereon in another layer state. Alternatively, the second fluorescent material 72 may be arranged in a layer state and the first fluorescent material 71 may be arranged thereon in another layer state.",
@@ -580,6 +615,7 @@
         "$ref": "#/texts/28"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "The light emitting device 100 includes the first fluorescent material 71 having at least one light emission peak wavelength in a range of 580 nm or more and less than 680 nm by being excited by light from the light emitting element 10, and preferably further includes the second fluorescent material 72 having at least one light emission peak wavelength in a range of 680 nm or more and 800 nm or less by being excited by light from the light emitting element 10.",
@@ -591,6 +627,7 @@
         "$ref": "#/texts/28"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "The first fluorescent material 71 and the second fluorescent material 72 are contained in, for example, the fluorescent member 50 covering the light emitting element 10. The light emitting device 100 in which the light emitting element 10 has been covered with the fluorescent member 50 containing the first fluorescent material 71 and the second fluorescent material 72 emits light having at least one light emission peak wavelength in a range of 580 nm or more and less than 680 nm by a part of light emission of the light emitting element 10 that is absorbed in the first fluorescent material 71. Furthermore, the light emitting device 100 emits light having at least one light emission peak wavelength in a range of 680 nm or more and 800 nm or less by a part of light emission of the light emitting element 10 that is absorbed in the second fluorescent material 72.",
@@ -602,6 +639,7 @@
         "$ref": "#/texts/28"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Plants grow when a pigment (chlorophyll a and chlorophyll b) present in chlorophyll thereof absorbs light and additionally takes carbon dioxide gas and water therein, and these are converted to carbohydrates (saccharides) by photosynthesis. Chlorophyll a and chlorophyll b used in growth promotion of plants particularly have absorption peaks in a red region of 625 nm or more and 675 nm or less and a blue region of 425 nm or more and 475 nm or less. The action of photosynthesis by chlorophylls of plants mainly occurs in a wavelength range of 400 nm or more and 700 nm or less, but chlorophyll a and chlorophyll b further have local absorption peaks in a region of 700 nm or more and 800 nm or less.",
@@ -613,6 +651,7 @@
         "$ref": "#/texts/28"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "For example, when plants are irradiated with light having longer wavelength than and absorption peak (in the vicinity of 680 nm) in a red region of chlorophyll a, a phenomenon called red drop, in which activity of photosynthesis rapidly decreases, occurs. However, it is known that when plants are irradiated with light containing near infrared region together with light of red region, photosynthesis is accelerated by a synergistic effect of those two kinds of lights. This phenomenon is called the Emerson effect.",
@@ -624,6 +663,7 @@
         "$ref": "#/texts/28"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Intensity of light with which plants are irradiated is represented by photon flux density. The photon flux density (\u03bcmol\u00b7m\u207b\u00b2\u00b7s\u207b\u00b9) is the number of photons reaching a unit area per unit time. The amount of photosynthesis depends on the number of photons, and therefore does not depend on other optical characteristics if the photon flux density is the same. However, wavelength dependency activating photosynthesis differs depending on photosynthetic pigment. Intensity of light necessary for photosynthesis of plants is sometimes represented by Photosynthetic Photon Flux Density (PPFD).",
@@ -635,6 +675,7 @@
         "$ref": "#/texts/28"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "The light emitting device 100 emits light having a ratio R/B of a photon flux density R to a photon flux density B within a range of 2.0 or more and 4.0 or less, and a ratio R/FR of the photon flux density R to a photon flux density FR within a range of 0.7 or more and 13.0 or less, where the photon flux density R is the number of light quanta (\u03bcmol\u00b7m\u207b\u00b2\u00b7g\u207b\u00b9) incident per unit time and unit area in a wavelength range of 620 nm or more and less than 700 nm, the photon flux density B is the number of light quanta (\u03bcmol\u00b7m\u207b\u00b2\u00b7g\u207b\u00b9) incident per unit time and unit area in a wavelength range of 380 nm or more and 490 nm or less, and the photon flux density FR is the number of light quanta (\u03bcmol\u00b7m\u207b\u00b2\u00b7g\u207b\u00b9) incident per unit time and unit area in a wavelength range of 700 nm or more and 780 nm or less.",
@@ -646,6 +687,7 @@
         "$ref": "#/texts/28"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "It is estimated that in plants, which are irradiated with light containing the photon flux density FR from the light emitting device 100, photosynthesis is activated by Emerson effect, and as a result, growth of plants can be promoted. Furthermore, when plants are irradiated with light containing the photon flux density FR, growth of the plants can be promoted by a reversible reaction between red light irradiation, to which chlorophyll as chromoprotein contained in plants has participated, and far infrared light irradiation.",
@@ -657,6 +699,7 @@
         "$ref": "#/texts/28"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Examples of nutrients necessary for growth of plants include nitrogen, phosphoric acid, and potassium. Of those nutrients, nitrogen is absorbed in plants as nitrate nitrogen (nitrate ion: NO\u2083\u207b). The nitrate nitrogen changes into nitrite ion (NO\u2082\u207b) by a reduction reaction, and when the nitrite ion is further reacted with fatty acid amine, nitrosoamine is formed. It is known that nitrite ion acts to hemoglobin in blood, and it is known that a nitroso compound sometimes affects health of a human body. Mechanism of converting nitrate nitrogen into nitrite ion in vivo is complicated, and the relationship between the amount of intake of nitrate nitrogen and the influence to health of a human body is not clarified. However, it is desired that the content of nitrate nitrogen having a possibility of affecting health of a human body is smaller.",
@@ -668,6 +711,7 @@
         "$ref": "#/texts/28"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "For the above reasons, nitrogen is one of nutrients necessary for growth of plants, but it is preferred that the content of nitrate nitrogen in food plants be reduced to a range that does not disturb the growth of plants.",
@@ -679,6 +723,7 @@
         "$ref": "#/texts/28"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "It is preferred that the light emitting device 100 further include the second fluorescent material 72 having at least one light emission peak wavelength in a range of 680 nm or more and 800 nm or less by being excited by light from the light emitting element 10, wherein the R/FR ratio is within a range of 0.7 or more and 5.0 or less. The R/FR ratio is more preferably within a range of 0.7 or more and 2.0 or less.",
@@ -700,6 +745,7 @@
           "$ref": "#/texts/46"
         }
       ],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
       "orig": "Light Emitting Element",
@@ -712,6 +758,7 @@
         "$ref": "#/texts/43"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "The light emitting element 10 is used as an excitation light source, and is a light emitting element emitting light having a light emission peak wavelength in a range of 380 nm or more and 490 nm or less. As a result, a stable light emitting device having high efficiency, high linearity of output to input and strong mechanical impacts can be obtained.",
@@ -723,6 +770,7 @@
         "$ref": "#/texts/43"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "The range of the light emission peak wavelength of the light emitting element 10 is preferably in a range of 390 nm or more and 480 nm or less, more preferably in a range of 420 nm or more and 470 nm or less, and still more preferably in a range of 440 nm or more and 460 nm or less, and particularly preferably in a range of 445 nm or more and 455 nm or less. A light emitting element including a nitride semiconductor (In\u2093AlyGa\u2081\u208b\u2093\u208byN, 0\u2266X, 0\u2266Y and X+Y\u22661) is preferably used as the light emitting element 10.",
@@ -734,6 +782,7 @@
         "$ref": "#/texts/43"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "The half value width of emission spectrum of the light emitting element 10 can be, for example, 30 nm or less.",
@@ -755,6 +804,7 @@
           "$ref": "#/texts/50"
         }
       ],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
       "orig": "Fluorescent Member",
@@ -767,6 +817,7 @@
         "$ref": "#/texts/47"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "The fluorescent member 50 used in the light emitting device 100 preferably includes the first fluorescent material 71 and a sealing material, and more preferably further includes the second fluorescent material 72. A thermoplastic resin and a thermosetting resin can be used as the sealing material. The fluorescent member 50 may contain other components such as a filler, a light stabilizer and a colorant, in addition to the fluorescent material and the sealing material. Examples of the filler include silica, barium titanate, titanium oxide and aluminum oxide.",
@@ -778,6 +829,7 @@
         "$ref": "#/texts/47"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "The content of other components other than the fluorescent material 70 and the sealing material in the fluorescent member 50 is preferably in a range of 0.01 parts by mass or more and 20 parts by mass or less, per 100 parts by mass of the sealing material.",
@@ -789,6 +841,7 @@
         "$ref": "#/texts/47"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "The total content of the fluorescent material 70 in the fluorescent member 50 can be, for example, 5 parts by mass or more and 300 parts by mass or less, per 100 parts by mass of the sealing material. The total content is preferably 10 parts by mass or more and 250 parts by mass or less, more preferably 15 parts by mass or more and 230 parts by mass or less, and still more preferably 15 parts by mass or more and 200 parts by mass or less. When the total content of the fluorescent material 70 in the fluorescent member 50 is within the above range, the light emitted from the light emitting element 10 can be efficiently subjected to wavelength conversion in the fluorescent material 70.",
@@ -855,6 +908,7 @@
           "$ref": "#/texts/69"
         }
       ],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
       "orig": "First Fluorescent Material",
@@ -867,6 +921,7 @@
         "$ref": "#/texts/51"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "The first fluorescent material 71 is a fluorescent material that is excited by light from the light emitting element 10 and emits light having at least one light emission peak wavelength in a range of 580 nm or more and less than 680 nm. Examples of the first fluorescent material 71 include an Mn\u2074\u207a-activated fluorogermanate fluorescent material, an Eu\u00b2\u207a-activated nitride fluorescent material, an Eu\u00b2\u207a-activated alkaline earth sulfide fluorescent material and an Mn\u2074\u207a-activated halide fluorescent material. The first fluorescent material 71 may use one selected from those fluorescent materials and may use a combination of two or more thereof. The first fluorescent material preferably contains an Eu\u00b2\u207a-activated nitride fluorescent material and an Mn\u2074\u207a-activated fluorogermanate fluorescent material.",
@@ -878,6 +933,7 @@
         "$ref": "#/texts/51"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "The Eu\u00b2\u207a-activated nitride fluorescent material is preferably a fluorescent material that has a composition including at least one element selected from Sr and Ca, and Al and contains silicon nitride that is activated by Eu\u00b2\u207a, or a fluorescent material that has a composition including at least one element selected from the group consisting of alkaline earth metal elements and at least one element selected from the group consisting of alkali metal elements and contains aluminum nitride that is activated by Eu\u00b2\u207a.",
@@ -889,6 +945,7 @@
         "$ref": "#/texts/51"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "The halide fluorescent material that is activated by Mn\u2074\u207a is preferably a fluorescent material that has a composition including at least one element or ion selected from the group consisting of alkali metal elements and an ammonium ion (NH\u2074\u207a) and at least one element selected from the group consisting of Group 4 elements and Group 14 elements and contains a fluoride that is activated by Mn\u2074\u207a.",
@@ -900,6 +957,7 @@
         "$ref": "#/texts/51"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Examples of the first fluorescent material 71 specifically include fluorescent materials having any one composition of the following formulae (I) to (VI).",
@@ -911,6 +969,7 @@
         "$ref": "#/texts/51"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "(i\u2212j)MgO.(j/2)Sc\u2082O\u2083.kMgF\u2082.mCaF\u2082.(1\u2212n)GeO\u2082.(n/2)Mt\u2082O\u2083:zMn\u2074\u207a (I)",
@@ -922,6 +981,7 @@
         "$ref": "#/texts/51"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "wherein Mt is at least one selected from the group consisting of Al, Ga, and In, and j, k, m, n, and z are numbers satisfying 2\u2266i\u22664, 0\u2266j<0.5, 0<k<1.5, 0\u2266m<1.5, 0<n<0.5, and 0<z<0.05, respectively.",
@@ -933,6 +993,7 @@
         "$ref": "#/texts/51"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "(Ca\u2081\u208bp\u208bqSrpEuq)AlSiN\u2083 (II)",
@@ -944,6 +1005,7 @@
         "$ref": "#/texts/51"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "wherein p and q are numbers satisfying 0\u2266p\u22661.0, 0<q<1.0, and p+q<1.0.",
@@ -955,6 +1017,7 @@
         "$ref": "#/texts/51"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "M\u00aavMbwMcfAl\u2083\u208bgSigNh (III)",
@@ -966,6 +1029,7 @@
         "$ref": "#/texts/51"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "wherein M\u00aa is at least one element selected from the group consisting of Ca, Sr, Ba, and Mg, Mb is at least one element selected from the group consisting of Li, Na, and K, Mc is at least one element selected from the group consisting of Eu, Ce, Tb, and Mn, v, w, f, g, and h are numbers satisfying 0.80\u2266v\u22661.05, 0.80\u2266w\u22661.05, 0.001<f\u22660.1, 0\u2266g\u22660.5, and 3.0\u2266h\u22665.0, respectively.",
@@ -977,6 +1041,7 @@
         "$ref": "#/texts/51"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "(Ca\u2081\u208br\u208bs\u208btSrrBasEut)\u2082Si\u2085N\u2088 (IV)",
@@ -988,6 +1053,7 @@
         "$ref": "#/texts/51"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "wherein r, s, and t are numbers satisfying 0\u2266r\u22661.0, 0\u2266s\u22661.0, 0<t<1.0, and r+s+t\u22661.0.",
@@ -999,6 +1065,7 @@
         "$ref": "#/texts/51"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "(Ca,Sr)S:Eu (V)",
@@ -1010,6 +1077,7 @@
         "$ref": "#/texts/51"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "A\u2082[M\u00b9\u2081\u208buMn\u2074\u207auF\u2086] (VI)",
@@ -1021,6 +1089,7 @@
         "$ref": "#/texts/51"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "wherein A is at least one selected from the group consisting of K, Li, Na, Rb, Cs, and NH\u2084\u207a, M\u00b9 is at least one element selected from the group consisting of Group 4 elements and Group 14 elements, and u is the number satisfying 0<u<0.2.",
@@ -1032,6 +1101,7 @@
         "$ref": "#/texts/51"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "The content of the first fluorescent material 71 in the fluorescent member 50 is not particularly limited as long as the R/B ratio is within a range of 2.0 or more and 4.0 or less. The content of the first fluorescent material 71 in the fluorescent member 50 is, for example, 1 part by mass or more, preferably 5 parts by mass or more, and more preferably 8 parts by mass or more, per 100 parts by mass of the sealing material, and is preferably 200 parts by mass or less, more preferably 150 parts by mass or less, and still more preferably 100 parts by mass or less, per 100 parts by mass of the sealing material. When the content of the first fluorescent material 71 in the fluorescent member 50 is within the aforementioned range, the light emitted from the light emitting element 10 can be efficiently subjected to wavelength conversion, and light capable of promoting growth of plant can be emitted from the light emitting device 100.",
@@ -1043,6 +1113,7 @@
         "$ref": "#/texts/51"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "The first fluorescent material 71 preferably contains at least two fluorescent materials, and in the case of containing at least two fluorescent materials, the first fluorescent material preferably contains a fluorogermanate fluorescent material that is activated by Mn\u2074\u207a (hereinafter referred to as \u201cMGF fluorescent material\u201d), and a fluorescent material that has a composition including at least one element selected from Sr and Ca, and Al, and contains silicon nitride that is activated by Eu\u00b2\u207a (hereinafter referred to as \u201cCASN fluorescent material\u201d).",
@@ -1054,6 +1125,7 @@
         "$ref": "#/texts/51"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "In the case where the first fluorescent material 71 contains at least two fluorescent materials and two fluorescent materials are a MGF fluorescent material and a CASN fluorescent material, where a compounding ratio thereof (MGF fluorescent material:CASN fluorescent material) is preferably in a range of 50:50 or more and 99:1 or less, more preferably in a range of 60:40 or more and 97:3 or less, and still more preferably in a range of 70:30 or more and 96:4 or less, in mass ratio. In the case where the first fluorescent material contains two fluorescent materials, when those fluorescent materials are a MGF fluorescent material and a CASN fluorescent material and the mass ratio thereof is within the aforementioned range, the light emitted from the light emitting element 10 can be efficiently subjected to wavelength conversion in the first fluorescent material 71. In addition, the R/B ratio can be adjusted to within a range of 2.0 or more and 4.0 or less, and the R/FR ratio is easy to be adjusted to within a range of 0.7 or more and 13.0 or less.",
@@ -1096,6 +1168,7 @@
           "$ref": "#/texts/80"
         }
       ],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
       "orig": "Second Fluorescent Material",
@@ -1108,6 +1181,7 @@
         "$ref": "#/texts/70"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "The second fluorescent material 72 is a fluorescent material that is excited by the light from the light emitting element 10 and emits light having at least one light emission peak wavelength in a range of 680 nm or more and 800 nm or less.",
@@ -1119,6 +1193,7 @@
         "$ref": "#/texts/70"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "The second fluorescent material 72 used in the light emitting device according to one embodiment of the present disclosure is a fluorescent material that contains a first element Ln containing at least one element selected from the group consisting of rare earth elements excluding Ce, a second element M containing at least one element selected from the group consisting of Al, Ga, In, Ce, and Cr, and has a composition of an aluminate fluorescent material. When a molar ratio of the second element M is taken as 5, it is preferred that a molar ratio of Ce be a product of a value of a parameter x and 3, and a molar ratio of Cr be a product of a value of a parameter y and 3, wherein the value of the parameter x is in a range of exceeding 0.0002 and less than 0.50, and the value of the parameter y is in a range of exceeding 0.0001 and less than 0.05.",
@@ -1130,6 +1205,7 @@
         "$ref": "#/texts/70"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "The second fluorescent material 72 is preferably a fluorescent material having the composition represented by the following formula (1):",
@@ -1141,6 +1217,7 @@
         "$ref": "#/texts/70"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "(Ln\u2081\u208b\u2093\u208byCe\u2093Cry)\u2083M\u2085O\u2081\u2082 (1)",
@@ -1152,6 +1229,7 @@
         "$ref": "#/texts/70"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "wherein Ln is at least one rare earth element selected from the group consisting of rare earth elements excluding Ce, M is at least one element selected from the group consisting of Al, Ga, and In, and x and y are numbers satisfying 0.0002<x<0.50 and 0.0001<y<0.05, respectively.",
@@ -1163,6 +1241,7 @@
         "$ref": "#/texts/70"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "In this case, the second fluorescent material 72 has a composition constituting a garnet structure, and therefore is tough against heat, light, and water, has an absorption peak wavelength of excited absorption spectrum in the vicinity of 420 nm or more and 470 nm or less, and sufficiently absorbs the light from the light emitting element 10, thereby enhancing light emitting intensity of the second fluorescent material 72, which is preferred. Furthermore, the second fluorescent material 72 is excited by light having light emission peak wavelength in a range of 380 nm or more and 490 nm or less and emits light having at least one light emission peak wavelength in a range of 680 nm or more and 800 nm or less.",
@@ -1174,6 +1253,7 @@
         "$ref": "#/texts/70"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "In the second fluorescent material 72, from the standpoint of stability of a crystal structure, Ln is preferably at least one rare earth element selected from the group consisting of Y, Gd, Lu, La, Tb, and Pr, and M is preferably Al or Ga.",
@@ -1185,6 +1265,7 @@
         "$ref": "#/texts/70"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "In the second fluorescent material 72, the value of the parameter x is more preferably in a range of 0.0005 or more and 0.400 or less (0.0005\u2266x\u22660.400), and still more preferably in a range of 0.001 or more and 0.350 or less (0.001\u2266x\u22660.350).",
@@ -1196,6 +1277,7 @@
         "$ref": "#/texts/70"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "In the second fluorescent material 72, the value of the parameter y is preferably in a range of exceeding 0.0005 and less than 0.040 (0.0005<y<0.040), and more preferably in a range of 0.001 or more and 0.026 or less (0.001\u2266y\u22660.026).",
@@ -1207,6 +1289,7 @@
         "$ref": "#/texts/70"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "The parameter x is an activation amount of Ce and the value of the parameter x is in a range of exceeding 0.0002 and less than 0.50 (0.0002<x<0.50), and the parameter y is an activation amount of Cr. When the value of the parameter y is in a range of exceeding 0.0001 and less than 0.05 (0.0001<y<0.05), the activation amount of Ce and the activation amount of Cr that are light emission centers contained in the crystal structure of the fluorescent material are within optimum ranges, the decrease of light emission intensity due to the decrease of light emission center can be suppressed, the decrease of light emission intensity due to concentration quenching caused by the increase of the activation amount can be suppressed, and light emission intensity can be enhanced.",
@@ -1225,6 +1308,7 @@
           "$ref": "#/texts/83"
         }
       ],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
       "orig": "Production Method of Second Fluorescent Material",
@@ -1237,6 +1321,7 @@
         "$ref": "#/texts/81"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "A method for producing the second fluorescent material 72 includes the following method.",
@@ -1248,6 +1333,7 @@
         "$ref": "#/texts/81"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "A compound containing at least one rare earth element Ln selected from the group consisting of rare earth elements excluding Ce, a compound containing at least one element M selected from the group consisting of Al, Ga, and In, a compound containing Ce and a compound containing Cr are mixed such that, when the total molar composition ratio of the M is taken as 5 as the standard, in the case where the total molar composition ratio of Ln, Ce, and Nd is 3, the molar ratio of Ce is a product of 3 and a value of a parameter x, and the molar ratio of Cr is a product of 3 and a value of a parameter y, the value of the parameter x is in a range of exceeding 0.0002 and less than 0.50 and the value of the parameter y is in a range of exceeding 0.0001 and less than 0.05, thereby obtaining a raw material mixture, the raw material mixture is heat-treated, followed by classification and the like, thereby obtaining the second fluorescent material.",
@@ -1266,6 +1352,7 @@
           "$ref": "#/texts/86"
         }
       ],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
       "orig": "Compound Containing Rare Earth Element Ln",
@@ -1278,6 +1365,7 @@
         "$ref": "#/texts/84"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Examples of the compound containing rare earth element Ln include oxides, hydroxides, nitrides, oxynitrides, fluorides, and chlorides, that contain at least one rare earth element Ln selected from the group consisting of rare earth elements excluding Ce. Those compounds may be hydrates. At least a part of the compounds containing rare earth element may use a metal simple substance or an alloy containing rare earth element. The compound containing rare earth element is preferably a compound containing at least one rare earth element Ln selected from the group consisting of Y, Gd, Lu, La, Tb, and Pr. The compound containing rare earth element may be used alone or may be used as a combination of at least two compounds containing rare earth element.",
@@ -1289,6 +1377,7 @@
         "$ref": "#/texts/84"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "The compound containing rare earth element is preferably an oxide that does not contain elements other than the target composition, as compared with other materials. Examples of the oxide specifically include Y\u2082O\u2083, Gd\u2082O\u2083, Lu\u2082O\u2083, La\u2082O\u2083, Tb\u2084O\u2087 and Pr\u2086O\u2081\u2081.",
@@ -1307,6 +1396,7 @@
           "$ref": "#/texts/89"
         }
       ],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
       "orig": "Compound Containing M",
@@ -1319,6 +1409,7 @@
         "$ref": "#/texts/87"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Examples of the compound containing at least one element M selected from the group consisting of Al, Ga, and In include oxides, hydroxides, nitrides, oxynitrides, fluorides, and chlorides, that contain Al, Ga, or In. Those compounds may be hydrates. Furthermore, Al metal simple substance, Ga metal simple substance, In metal simple substance, Al alloy, Ga alloy or In alloy may be used, and metal simple substance or an alloy may be used in place of at least a part of the compound. The compound containing Al, Ga, or In may be used alone or may be used as a combination of two or more thereof. The compound containing at least one element selected from the group consisting of Al, Ga, and In is preferably an oxide. The reason for this is that an oxide that does not contain elements other than the target composition, as compared with other materials, and a fluorescent material having a target composition are easy to be obtained. When a compound containing elements other than the target composition has been used, residual impurity elements are sometimes present in the fluorescent material obtained. The residual impurity element becomes a killer factor in light emission, leading to the possibility of remarkable decrease of light emission intensity.",
@@ -1330,6 +1421,7 @@
         "$ref": "#/texts/87"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Examples of the compound containing Al, Ga, or In specifically include Al\u2082O\u2083, Ga\u2082O\u2083, and In\u2082O\u2083.",
@@ -1378,6 +1470,7 @@
           "$ref": "#/texts/102"
         }
       ],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
       "orig": "Compound Containing Ce and Compound Containing Cr",
@@ -1390,6 +1483,7 @@
         "$ref": "#/texts/90"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Examples of the compound containing Ce or the compound containing Cr include oxides, hydroxides, nitrides, fluorides, and chlorides, that contain cerium (Ce) or chromium (Cr). Those compounds may be hydrates. Ce metal simple substance, Ce alloy, Cr metal simple substance, or Cr alloy may be used, and a metal simple substance or an alloy may be used in place of a part of the compound. The compound containing Ce or the compound containing Cr may be used alone or may be used as a combination of two or more thereof. The compound containing Ce or the compound containing Cr is preferably an oxide. The reason for this is that an oxide that does not contain elements other than the target composition, as compared with other materials, and a fluorescent material having a target composition are easy to be obtained. When a compound containing elements other than the target composition has been used, residual impurity elements are sometimes present in the fluorescent material obtained. The residual impurity element becomes a killer factor in light emission, leading to the possibility of remarkable decrease of light emission intensity.",
@@ -1401,6 +1495,7 @@
         "$ref": "#/texts/90"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Example of the compound containing Ce specifically includes CeO\u2082, and example of the compound containing Cr specifically includes Cr\u2082O\u2083.",
@@ -1412,6 +1507,7 @@
         "$ref": "#/texts/90"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "The raw material mixture may contain a flux such as a halide, as necessary. When a flux is contained in the raw material mixture, reaction of raw materials with each other is accelerated, and a solid phase reaction is easy to proceed further uniformly. It is considered that a temperature for heat-treating the raw material mixture is almost the same as a formation temperature of a liquid phase of a halide used as a flux or is a temperature higher than the formation temperature, and, as a result, the reaction is accelerated.",
@@ -1423,6 +1519,7 @@
         "$ref": "#/texts/90"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Examples of the halide include fluorides, chlorides of rare earth metals, alkali earth metals, and alkali metals. When a halide of rare earth metal is used as the flux, the flux can be added as a compound so as to achieve a target composition. Examples of the flux specifically include BaF\u2082 and CaF\u2082. Of those, BaF\u2082 is preferably used. When barium fluoride is used as the flux, a garnet crystal structure is stabilized and a composition of a garnet crystal structure is easy to be formed.",
@@ -1434,6 +1531,7 @@
         "$ref": "#/texts/90"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "When the raw material mixture contains a flux, the content of the flux is preferably 20 mass % or less, and more preferably 10 mass % or less, and is preferably 0.1 mass % or more, on the basis of the raw material mixture (100 mass %). When the flux content is within the aforementioned range, the problem that it is difficult to form a garnet crystal structure due to the insufficiency of particle growth by small amount of the flux is prevented, and furthermore, the problem that it is difficult to form a garnet crystal structure due to too large amount of the flux is prevented.",
@@ -1445,6 +1543,7 @@
         "$ref": "#/texts/90"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "The raw material mixture is prepared, for example, as follows. Each of raw materials is weighed so as to be a compounding ratio. Thereafter, the raw materials are subjected to mixed grinding using a dry grinding machine such as ball mill, are subjected to mixed grinding using a mortar and a pestle, are subjected to mixing using a mixing machine such as a ribbon blender, for example, or are subjected to mixed grinding using both a dry grinding machine and a mixing machine. As necessary, the raw material mixture may be classified using a wet separator such as a setting tank generally used industrially, or a dry classifier such as a cyclone. The mixing may be conducted by dry mixing or may be conducted by wet mixing by adding a solvent. The mixing is preferably dry mixing. The reason for this is that dry mixing can shorten a processing time as compared with wet drying, and this leads to the improvement of productivity.",
@@ -1456,6 +1555,7 @@
         "$ref": "#/texts/90"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "The raw material mixture after mixing each raw material is dissolved in an acid, the resulting solution is co-precipitated in oxalic acid, a product formed by the co-precipitation is baked to obtain an oxide, and the oxide may be used as the raw material mixture.",
@@ -1467,6 +1567,7 @@
         "$ref": "#/texts/90"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "The raw material mixture can be heat-treated by placing it in a crucible, a boat made of a carbon material (such as graphite), boron nitride (BN), aluminum oxide (alumina), tungsten (W) or molybdenum (Mo).",
@@ -1478,6 +1579,7 @@
         "$ref": "#/texts/90"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "From the standpoint of stability of a crystal structure, the temperature for heat-treating the raw material mixture is preferably in a range of 1,000\u00b0 C. or higher and 2,100\u00b0 C. or lower, more preferably in a range of 1,100\u00b0 C. or higher and 2,000\u00b0 C. or lower, still more preferably in a range of 1,200\u00b0 C. or higher and 1,900\u00b0 C. or lower, and particularly preferably in a range of 1,300\u00b0 C. or higher and 1,800\u00b0 C. or lower. The heat treatment can use an electric furnace or a gas furnace.",
@@ -1489,6 +1591,7 @@
         "$ref": "#/texts/90"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "The heat treatment time varies depending on a temperature rising rate, a heat treatment atmosphere. The heat treatment time after reaching the heat treatment temperature is preferably 1 hour or more, more preferably 2 hours or more, and still more preferably 3 hours or more, and is preferably 20 hours or less, more preferably 18 hours or less and still more preferably 15 hours or less.",
@@ -1500,6 +1603,7 @@
         "$ref": "#/texts/90"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "The atmosphere for heat-treating the raw material mixture is an inert atmosphere such as argon or nitrogen, a reducing atmosphere containing hydrogen, or an oxidizing atmosphere such as the air. The raw material mixture may be subjected to a two-stage heat treatment of a first heat treatment of heat-treating in the air or a weakly reducing atmosphere from the standpoint of, for example, prevention of blackening, and a second heat treatment of heat-treating in a reducing atmosphere from the standpoint of enhancing absorption efficiency of light having a specific light emission peak wavelength. The fluorescent material constituting a garnet structure is that reactivity of the raw material mixture is improved in an atmosphere having high reducing power such as a reducing atmosphere. Therefore, the fluorescent material can be heat-treated under the atmospheric pressure without pressurizing. For example, the heat treatment can be conducted by the method disclosed in Japanese Patent Application No. 2014-260421.",
@@ -1511,6 +1615,7 @@
         "$ref": "#/texts/90"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "The fluorescent material obtained may be subjected to post-treatment steps such as a solid-liquid separation by a method such as cleaning or filtration, drying by a method such as vacuum drying, and classification by dry sieving. After those post-treatment steps, a fluorescent material having a desired average particle diameter is obtained.",
@@ -1589,6 +1694,7 @@
           "$ref": "#/texts/125"
         }
       ],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
       "orig": "Other Fluorescent Materials",
@@ -1601,6 +1707,7 @@
         "$ref": "#/texts/103"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "The light emitting device 100 may contain other kinds of fluorescent materials, in addition to the first fluorescent material 71.",
@@ -1612,6 +1719,7 @@
         "$ref": "#/texts/103"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Examples of other kinds of fluorescent materials include a green fluorescent material emitting green color by absorbing a part of the light emitted from the light emitting element 10, a yellow fluorescent material emitting yellow color, and a fluorescent material having a light emission peak wavelength in a wavelength range exceeding 680 nm.",
@@ -1623,6 +1731,7 @@
         "$ref": "#/texts/103"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Examples of the green fluorescent material specifically include fluorescent materials having any one of compositions represented by the following formulae (i) to (iii).",
@@ -1634,6 +1743,7 @@
         "$ref": "#/texts/103"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "M\u00b9\u00b9\u2088MgSi\u2084O\u2081\u2086X\u00b9\u00b9:Eu (i)",
@@ -1645,6 +1755,7 @@
         "$ref": "#/texts/103"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "wherein M\u00b9\u00b9 is at least one selected from the group consisting of Ca, Sr, Ba, and Zn, and X\u00b9\u00b9 is at least one selected from the group consisting of F, Cl, Br, and I.",
@@ -1656,6 +1767,7 @@
         "$ref": "#/texts/103"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Si\u2086\u208bbAlbObN\u2088\u208bb:Eu (ii)",
@@ -1667,6 +1779,7 @@
         "$ref": "#/texts/103"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "wherein b satisfies 0<b<4.2.",
@@ -1678,6 +1791,7 @@
         "$ref": "#/texts/103"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "M\u00b9\u00b3Ga\u2082S\u2084:Eu (iii)",
@@ -1689,6 +1803,7 @@
         "$ref": "#/texts/103"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "wherein M\u00b9\u00b3 is at least one selected from the group consisting of Mg, Ca, Sr, and",
@@ -1700,6 +1815,7 @@
         "$ref": "#/texts/103"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Ba.",
@@ -1711,6 +1827,7 @@
         "$ref": "#/texts/103"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Examples of the yellow fluorescent material specifically include fluorescent materials having any one of compositions represented by the following formulae (iv) to (v).",
@@ -1722,6 +1839,7 @@
         "$ref": "#/texts/103"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "M\u00b9\u2074c/dSi\u2081\u2082\u208b\u208dc\u208ad\u208eAl\u208dc\u208ad\u208eOdN\u208d\u2081\u2086\u208bd\u208e:Eu (iv)",
@@ -1733,6 +1851,7 @@
         "$ref": "#/texts/103"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "wherein M\u00b9\u2074 is at least one selected from the group consisting of Sr, Ca, Li, and Y. A value of a parameter c is in a range of 0.5 to 5, a value of a parameter d is in a range of 0 to 2.5, and the parameter d is an electrical charge of M\u00b9\u2074.",
@@ -1744,6 +1863,7 @@
         "$ref": "#/texts/103"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "M\u00b9\u2075\u2083Al\u2085O\u2081\u2082:Ce (v)",
@@ -1755,6 +1875,7 @@
         "$ref": "#/texts/103"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "wherein M\u00b9\u2075 is at least one selected from the group consisting of Y and Lu.",
@@ -1766,6 +1887,7 @@
         "$ref": "#/texts/103"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Examples of the fluorescent material having light emission peak wavelength in a wavelength range exceeding 680 nm specifically include fluorescent materials having any one of compositions represented by the following formulae (vi) to (x).",
@@ -1777,6 +1899,7 @@
         "$ref": "#/texts/103"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Al\u2082O\u2083:Cr (vi)",
@@ -1788,6 +1911,7 @@
         "$ref": "#/texts/103"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "CaYAlO\u2084:Mn (vii)",
@@ -1799,6 +1923,7 @@
         "$ref": "#/texts/103"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "LiAlO\u2082:Fe (viii)",
@@ -1810,6 +1935,7 @@
         "$ref": "#/texts/103"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "CdS:Ag (ix)",
@@ -1821,6 +1947,7 @@
         "$ref": "#/texts/103"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "GdAlO\u2083:Cr (x)",
@@ -1832,6 +1959,7 @@
         "$ref": "#/texts/103"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "The light emitting device 100 can be utilized as a light emitting device for plant cultivation that can activate photosynthesis of plants and promote growth of plants so as to have favorable form and weight.",
@@ -1847,6 +1975,7 @@
           "$ref": "#/texts/127"
         }
       ],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
       "orig": "Plant Cultivation Method",
@@ -1859,6 +1988,7 @@
         "$ref": "#/texts/126"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "The plant cultivation method of one embodiment of the present disclosure is a method for cultivating plants, including irradiating plants with light emitted from the light emitting device 100. In the plant cultivation method, plants can be irradiated with light from the light emitting device 100 in plant factories that are completely isolated from external environment and make it possible for artificial control. The kind of plants is not particularly limited. However, the light emitting device 100 of one embodiment of the present disclosure can activate photosynthesis of plants and promote growth of plants such that a stem, a leaf, a root, a fruit have favorable form and weight, and therefore is preferably applied to cultivation of vegetables, flowers that contain much chlorophyll performing photosynthesis. Examples of the vegetables include lettuces such as garden lettuce, curl lettuce, Lamb's lettuce, Romaine lettuce, endive, Lollo Rosso, Rucola lettuce, and frill lettuce; Asteraceae vegetables such as \u201cshungiku\u201d (chrysanthemum coronarium); morning glory vegetables such as spinach; Rosaceae vegetables such as strawberry; and flowers such as chrysanthemum, gerbera, rose, and tulip.",
@@ -1874,6 +2004,7 @@
           "$ref": "#/texts/129"
         }
       ],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
       "orig": "EXAMPLES",
@@ -1886,6 +2017,7 @@
         "$ref": "#/texts/128"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "The present invention is further specifically described below by Examples and Comparative Examples.",
@@ -1907,6 +2039,7 @@
           "$ref": "#/texts/137"
         }
       ],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
       "orig": "Examples 1 to 5",
@@ -1923,6 +2056,7 @@
           "$ref": "#/texts/132"
         }
       ],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
       "orig": "First Fluorescent Material",
@@ -1935,6 +2069,7 @@
         "$ref": "#/texts/131"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Two fluorescent materials of fluorogarmanate fluorescent material that is activated by Mn\u2074\u207a, having a light emission peak at 660 nm and fluorescent material containing silicon nitride that are activated by Eu\u00b2\u207a, having a light emission peak at 660 nm were used as the first fluorescent material 71. In the first fluorescent material 71, a mass ratio of a MGF fluorescent material to a CASN fluorescent material (MGF:CASN) was 95:5.",
@@ -1956,6 +2091,7 @@
           "$ref": "#/texts/136"
         }
       ],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
       "orig": "Second Fluorescent Material",
@@ -1968,6 +2104,7 @@
         "$ref": "#/texts/133"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Fluorescent material that is obtained by the following production method was used as the second fluorescent material 72.",
@@ -1979,6 +2116,7 @@
         "$ref": "#/texts/133"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "55.73 g of Y\u2082O\u2083 (Y\u2082O\u2083 content: 100 mass %), 0.78 g of CeO\u2082 (CeO\u2082 content: 100 mass %), 0.54 g of Cr\u2082O\u2083 (Cr\u2082O\u2083 content: 100 mass %,) and 42.95 g of Al\u2082O\u2083 (Al\u2082O\u2083 content: 100 mass %) were weighed as raw materials, and 5.00 g of BaF\u2082 as a flux was added to the mixture. The resulting raw materials were dry mixed for 1 hour by a ball mill. Thus, a raw material mixture was obtained.",
@@ -1990,6 +2128,7 @@
         "$ref": "#/texts/133"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "The raw material mixture obtained was placed in an alumina crucible, and a lid was put on the alumina crucible. The raw material mixture was heat-treated at 1,500\u00b0 C. for 10 hours in a reducing atmosphere of H\u2082: 3 vol % and N\u2082: 97 vol %. Thus, a calcined product was obtained. The calcined product was passed through a dry sieve to obtain a second fluorescent material. The second fluorescent material obtained was subjected to composition analysis by ICP-AES emission spectrometry using an inductively coupled plasma emission analyzer (manufactured by Perkin Elmer). The composition of the second fluorescent material obtained was (Y\u2080.\u2089\u2087\u2087Ce\u2080.\u2080\u2080\u2089Cr\u2080.\u2080\u2081\u2084)\u2083Al\u2085O\u2081\u2082 (hereinafter referred to as \u201cYAG: Ce, Cr\u201d).",
@@ -2011,6 +2150,7 @@
           "$ref": "#/texts/140"
         }
       ],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
       "orig": "Light Emitting Device",
@@ -2023,6 +2163,7 @@
         "$ref": "#/texts/137"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Nitride semiconductor having a light emission peak wavelength of 450 nm was used as the light emitting element 10 in the light emitting device 100.",
@@ -2034,6 +2175,7 @@
         "$ref": "#/texts/137"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Silicone resin was used as a sealing material constituting the fluorescent member 50, the first fluorescent material 71 and/or the second fluorescent material 72 was added to 100 parts by mass of the silicone resin in the compounding ratio (parts by mass) shown in Table 1, and 15 parts by mass of silica filler were further added thereto, followed by mixing and dispersing. The resulting mixture was degassed to obtain a resin composition constituting a fluorescent member. In each of resin compositions of Examples 1 to 5, the compounding ratio of the first fluorescent material 71 and the second fluorescent material 72 was adjusted as shown in Table 1, and those materials are compounded such that the R/B ratio is within a range of 2.0 or more and 2.4 or less, and the R/FR ratio is within a range of 1.4 or more and 6.0 or less.",
@@ -2045,6 +2187,7 @@
         "$ref": "#/texts/137"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "The resin composition was poured on the light emitting element 10 of a depressed portion of the molded article 40 to fill the depressed portion, and heated at 150\u00b0 C. for 4 hours to cure the resin composition, thereby forming the fluorescent member 50. Thus, the light emitting device 100 as shown in FIG. 1 was produced in each of Examples 1 to 5.",
@@ -2081,6 +2224,7 @@
           "$ref": "#/texts/161"
         }
       ],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
       "orig": "Comparative Example 1",
@@ -2093,6 +2237,7 @@
         "$ref": "#/texts/141"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "A light emitting device X including a semiconductor light emitting element having a light emission peak wavelength of 450 nm and a light emitting device Y including a semiconductor light emitting element having a light emission peak length of 660 nm were used, and the R/B ratio was adjusted to 2.5.",
@@ -2104,6 +2249,7 @@
         "$ref": "#/texts/141"
       },
       "children": [],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
       "orig": "Evaluation",
@@ -2120,6 +2266,7 @@
           "$ref": "#/texts/145"
         }
       ],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
       "orig": "Photon Flux Density",
@@ -2132,6 +2279,7 @@
         "$ref": "#/texts/144"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Photon flux densities of lights emitted from the light emitting device 100 used in Examples 1 to 5 and the light emitting devices X and Y used in Comparative Example 1 were measured using a photon measuring device (LI-250A, manufactured by Li-COR). The photon flux density B, the photon flux density R, and the photon flux density FR of lights emitted from the light emitting devices used in each of the Examples and Comparative Example; the R/B ratio; and the R/FR ratio are shown in Table 1. FIG. 2 shows spectra showing the relationship between a wavelength and a relative photon flux density, in the light emitting devices used in each Example and Comparative Example.",
@@ -2165,6 +2313,7 @@
           "$ref": "#/texts/153"
         }
       ],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
       "orig": "Plant Cultivation Test",
@@ -2177,6 +2326,7 @@
         "$ref": "#/texts/146"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "The plant cultivation method includes a method of conducting by \u201cgrowth period by RGB light source (hereinafter referred to as a first growth period)\u201d and \u201cgrowth period by light source for plant growth (hereinafter referred to as a second growth period)\u201d using a light emitting device according to an embodiment of the present disclosure as a light source.",
@@ -2188,6 +2338,7 @@
         "$ref": "#/texts/146"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "The first growth period uses RGB light source, and RGB type LED generally known can be used as the RGB light source. The reason for irradiating plants with RGB type LED in the initial stage of the plant growth is that length of a stem and the number and size of true leaves in the initial stage of plant growth are made equal, thereby clarifying the influence by the difference of light quality in the second growth period.",
@@ -2199,6 +2350,7 @@
         "$ref": "#/texts/146"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "The first growth period is preferably about 2 weeks. In the case where the first growth period is shorter than 2 weeks, it is necessary to confirm that two true leaves develop and a root reaches length that can surely absorb water in the second growth period. In the case where the first growth period exceeds 2 weeks, variation in the second growth period tends to increase. The variation is easy to be controlled by RGB light source by which stem extension is inhibitory, rather than a fluorescent lamp by which stem extension is easy to occur.",
@@ -2210,6 +2362,7 @@
         "$ref": "#/texts/146"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "After completion of the first growth period, the second growth period immediately proceeds. It is preferred that plants are irradiated with light emitted from a light emitting device according to an embodiment of the present disclosure. Photosynthesis of plants is activated by irradiating plants with light emitted from the light emitting device according to an embodiment of the present disclosure, and the growth of plants can be promoted so as to have favorable form and weight.",
@@ -2221,6 +2374,7 @@
         "$ref": "#/texts/146"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "The total growth period of the first growth period and the second growth period is about 4 to 6 weeks, and it is preferred that shippable plants can be obtained within the period.",
@@ -2232,6 +2386,7 @@
         "$ref": "#/texts/146"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "The cultivation test was specifically conducted by the following method.",
@@ -2243,6 +2398,7 @@
         "$ref": "#/texts/146"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Romaine lettuce (green romaine, produced by Nakahara Seed Co., Ltd.) was used as cultivation plant.",
@@ -2258,6 +2414,7 @@
           "$ref": "#/texts/155"
         }
       ],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
       "orig": "First Growth Period",
@@ -2270,6 +2427,7 @@
         "$ref": "#/texts/154"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Urethane sponges (salad urethane, manufactured by M Hydroponic Research Co., Ltd.) having Romaine lettuce seeded therein were placed side by side on a plastic tray, and were irradiated with light from RGB-LED light source (manufactured by Shibasaki Inc.) to cultivate plants. The plants were cultivated for 16 days under the conditions of room temperature: 22 to 23\u00b0 C., humidity: 50 to 60%, photon flux density from light emitting device: 100 \u03bcmol\u00b7m\u207b\u00b2\u00b7s\u207b\u00b9 and daytime hour: 16 hours/day. Only water was given until germination, and after the germination (about 4 days later), a solution obtained by mixing Otsuka House #1 (manufactured by Otsuka Chemical Co., Ltd.) and Otsuka House #2 (manufactured by Otsuka Chemical Co., Ltd.) in a mass ratio of 3:2 and dissolving the mixture in water was used as a nutrient solution (Otsuka Formulation A). Conductivity of the nutrient was 1.5 ms\u00b7cm\u207b\u00b9.",
@@ -2288,6 +2446,7 @@
           "$ref": "#/texts/158"
         }
       ],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
       "orig": "Second Growth Period",
@@ -2300,6 +2459,7 @@
         "$ref": "#/texts/156"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "After the first growth period, the plants were irradiated with light from the light emitting devices of Examples 1 to 5 and Comparative Example 1, and were subjected to hydroponics.",
@@ -2311,6 +2471,7 @@
         "$ref": "#/texts/156"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "The plants were cultivated for 19 days under the conditions of room temperature: 22 to 24\u00b0 C., humidity: 60 to 70%, CO\u2082 concentration: 600 to 700 ppm, photon flux density from light emitting device: 125 \u03bcmol\u00b7m\u207b\u00b2\u00b7s\u207b\u00b9 and daytime hour: 16 hours/day. Otsuka Formulation A was used as the nutrient solution. Conductivity of the nutrient was 1.5 ms\u00b7cm\u207b\u00b9. The values of the R/B and R/FR ratios of light for plant irradiation from each light emitting device in the second growth period are shown in Table 1.",
@@ -2326,6 +2487,7 @@
           "$ref": "#/texts/160"
         }
       ],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
       "orig": "Measurement of Fresh Weight (Edible Part)",
@@ -2338,6 +2500,7 @@
         "$ref": "#/texts/159"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "The plants after cultivation were harvested, and wet weights of a terrestrial part and a root were measured. The wet weight of a terrestrial part of each of 6 cultivated plants having been subjected to hydroponics by irradiating with light from the light emitting devices of Examples 1 to 5 and Comparative Example 1 was measured as a fresh weight (edible part) (g). The results obtained are shown in Table 1 and FIG. 3.",
@@ -2380,6 +2543,7 @@
           "$ref": "#/texts/170"
         }
       ],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
       "orig": "Measurement of Nitrate Nitrogen Content",
@@ -2392,6 +2556,7 @@
         "$ref": "#/texts/161"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "The edible part (about 20 g) of each of the cultivated plants, from which a foot about 5 cm had been removed, was frozen with liquid nitrogen and crushed with a juice mixer (laboratory mixer LM-PLUS, manufactured by Osaka Chemical Co., Ltd.) for 1 minute. The resulting liquid was filtered with Miracloth (manufactured by Milipore), and the filtrate was centrifuged at 4\u00b0 C. and 15,000 rpm for 5 minutes. The nitrate nitrogen content (mg/100 g) in the cultivated plant in the supernatant was measured using a portable reflection photometer system (product name: RQ flex system, manufactured by Merck) and a test paper (product name: Reflectoquant (registered trade mark), manufactured by Kanto Chemical Co., Inc.). The results are shown in Table 1 and FIG. 4.",
@@ -2403,6 +2568,7 @@
         "$ref": "#/texts/161"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "As shown in Table 1, for the light emitting devices in Examples 1 to 5, the R/B ratios are within a range of 2.0 or more and 4.0 or less and the R/FR ratios are within the range of 0.7 or more and 13.0 or less. For Romaine lettuce cultivated by irradiating with light from the light emitting device in Examples 1 to 5, the fresh weight (edible part) was increased as compared with Romaine lettuce cultivated by irradiating with light from the light emitting device used in Comparative Example 1. Therefore, cultivation of plants was promoted, as shown in Table 1 and FIG. 3.",
@@ -2414,6 +2580,7 @@
         "$ref": "#/texts/161"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "As shown in FIG. 2, the light emitting device 100 in Example 1 had at least one maximum value of the relative photon flux density in a range of 380 nm or more and 490 nm or less and in a range of 580 nm or more and less than 680 nm. The light emitting devices 100 in Examples 2 to 5 had at least one maximum value of relative photon flux density in a range of 380 nm or more and 490 nm or less, in a range of 580 nm or more and less than 680 nm and in a range of 680 nm or more and 800 nm or less, respectively. The maximum value of the relative photon flux density in a range of 380 nm or more and 490 nm or less is due to the light emission of the light emitting element having light emission peak wavelength in a range of 380 nm or more and 490 nm or less, the maximum value of the relative photon flux density in a range of 580 nm or more and less than 680 nm is due to the first fluorescent material emitting the light having at least one light emission peak wavelength in a range of 580 nm or more and less than 680 nm, and the maximum value of the relative photon flux density in a range of 680 nm or more and 800 nm or less is due to the second fluorescent material emitting the light having at least one light emission peak wavelength in a range of 680 nm or more and 800 nm or less.",
@@ -2425,6 +2592,7 @@
         "$ref": "#/texts/161"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "As shown in Table 1, for the light emitting devices 100 in Examples 4 and 5, the R/B ratios are 2.0 and 2.3, respectively, and the R/FR ratios are 1.6 and 1.4, respectively. The R/B ratios are within a range of 2.0 or more and 4.0 or less, and the R/FR ratios are within a range of 0.7 or more and 2.0 or less. For Romaine lettuces cultivated by irradiating with lights from the light emitting devices 100, the nitrate nitrogen content is decreased as compared with Comparative Example 1. Plants, in which the nitrate nitrogen content having the possibility of adversely affecting health of human body had been reduced to a range that does not inhibit the cultivation of plants, could be cultivated, as shown in Table 1 and FIG. 4.",
@@ -2436,6 +2604,7 @@
         "$ref": "#/texts/161"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "The light emitting device according to an embodiment of the present disclosure can be utilized as a light emitting device for plant cultivation that can activate photosynthesis and is capable of promoting growth of plants. Furthermore, the plant cultivation method, in which plants are irradiated with the light emitted from the light emitting device according to an embodiment of the present disclosure, can cultivate plants that can be harvested in a relatively short period of time and can be used in a plant factory.",
@@ -2447,6 +2616,7 @@
         "$ref": "#/texts/161"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Although the present disclosure has been described with reference to several exemplary embodiments, it shall be understood that the words that have been used are words of description and illustration, rather than words of limitation. Changes may be made within the purview of the appended claims, as presently stated and as amended, without departing from the scope and spirit of the disclosure in its aspects. Although the disclosure has been described with reference to particular examples, means, and embodiments, the disclosure may be not intended to be limited to the particulars disclosed; rather the disclosure extends to all functionally equivalent structures, methods, and uses such as are within the scope of the appended claims.",
@@ -2458,6 +2628,7 @@
         "$ref": "#/texts/161"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "One or more examples or embodiments of the disclosure may be referred to herein, individually and/or collectively, by the term \u201cdisclosure\u201d merely for convenience and without intending to voluntarily limit the scope of this application to any particular disclosure or inventive concept. Moreover, although specific examples and embodiments have been illustrated and described herein, it should be appreciated that any subsequent arrangement designed to achieve the same or similar purpose may be substituted for the specific examples or embodiments shown. This disclosure may be intended to cover any and all subsequent adaptations or variations of various examples and embodiments. Combinations of the above examples and embodiments, and other examples and embodiments not specifically described herein, will be apparent to those of skill in the art upon reviewing the description.",
@@ -2469,6 +2640,7 @@
         "$ref": "#/texts/161"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "In addition, in the foregoing Detailed Description, various features may be grouped together or described in a single embodiment for the purpose of streamlining the disclosure. This disclosure may be not to be interpreted as reflecting an intention that the claimed embodiments require more features than are expressly recited in each claim. Rather, as the following claims reflect, inventive subject matter may be directed to less than all of the features of any of the disclosed embodiments. Thus, the following claims are incorporated into the Detailed Description, with each claim standing on its own as defining separately claimed subject matter.",
@@ -2480,6 +2652,7 @@
         "$ref": "#/texts/161"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "The above disclosed subject matter shall be considered illustrative, and not restrictive, and the appended claims are intended to cover all such modifications, enhancements, and other embodiments which fall within the true spirit and scope of the present disclosure. Thus, to the maximum extent allowed by law, the scope of the present disclosure may be determined by the broadest permissible interpretation of the following claims and their equivalents, and shall not be restricted or limited by the foregoing detailed description.",
@@ -2525,6 +2698,7 @@
           "$ref": "#/texts/182"
         }
       ],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
       "orig": "CLAIMS",
@@ -2537,6 +2711,7 @@
         "$ref": "#/texts/171"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "1. A light emitting device comprising: a light emitting element having a light emission peak wavelength in a range of 380 nm or more and 490 nm or less; and a fluorescent material that is excited by light from the light emitting element and emits light having at least one light emission peak wavelength in a range of 580 nm or more and less than 680 nm, wherein the light emitting device emits light having a ratio R/B of a photon flux density R to a photon flux density B within a range of 2.0 or more and 4.0 or less, and a ratio R/FR of the photon flux density R to a photon flux density FR within a range of 0.7 or more and 13.0 or less, wherein the photon flux density R is in a wavelength range of 620 nm or more and less than 700 nm, the photon flux density B is in a wavelength range of 380 nm or more and 490 nm or less, and the photon flux density FR is in a wavelength range of 700 nm or more and 780 nm or less.",
@@ -2548,6 +2723,7 @@
         "$ref": "#/texts/171"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "2. The light emitting device according to claim 1, further comprising another fluorescent material that is excited by light from the light emitting element and emits light having at least one light emission peak wavelength in a range of 680 nm or more and 800 nm or less, wherein the ratio R/FR is within a range of 0.7 or more and 5.0 or less.",
@@ -2559,6 +2735,7 @@
         "$ref": "#/texts/171"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "3. The light emitting device according to claim 2, wherein the ratio R/FR is within a range of 0.7 or more and 2.0 or less.",
@@ -2570,6 +2747,7 @@
         "$ref": "#/texts/171"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "4. The light emitting device according to claim 2, wherein the another fluorescent material contains a first element Ln containing at least one element selected from the group consisting of rare earth elements excluding Ce, a second element M containing at least one element selected from the group consisting of Al, Ga and In, Ce, and Cr, and has a composition of an aluminate fluorescent material, and when a molar ratio of the second element M is taken as 5, a molar ratio of Ce is a product of a value of a parameter x and 3, and a molar ratio of Cr is a product of a value of a parameter y and 3, the value of the parameter x being in a range of exceeding 0.0002 and less than 0.50, and the value of the parameter y being in a range of exceeding 0.0001 and less than 0.05.",
@@ -2581,6 +2759,7 @@
         "$ref": "#/texts/171"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "5. The light emitting device according to claim 2, wherein the another fluorescent material has the composition represented by the following formula (I): (Ln\u2081\u208b\u2093\u208byCe\u2093Cry)\u2083M\u2085O\u2081\u2082 (I) wherein Ln is at least one rare earth element selected from the group consisting of rare earth elements excluding Ce, M is at least one element selected from the group consisting of Al, Ga, and In, and x and y are numbers satisfying 0.0002<x<0.50 and 0.0001<y<0.05.",
@@ -2592,6 +2771,7 @@
         "$ref": "#/texts/171"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "6. The light emitting device according to claim 2, the light emitting device being used in plant cultivation.",
@@ -2603,6 +2783,7 @@
         "$ref": "#/texts/171"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "7. The light emitting device according to claim 1, wherein the fluorescent material is at least one selected from the group consisting of: a fluorogermanate fluorescent material that is activated by Mn\u2074\u207a, a fluorescent material that has a composition containing at least one element selected from Sr and Ca, and Al, and contains silicon nitride that is activated by Eu\u00b2\u207a, a fluorescent material that has a composition containing at least one element selected from the group consisting of alkaline earth metal elements and at least one element selected from the group consisting of alkali metal elements, and contains aluminum nitride that is activated by Eu\u00b2\u207a, a fluorescent material containing a sulfide of Ca or Sr that is activated by Eu\u00b2\u207a, and a fluorescent material that has a composition containing at least one element or ion selected from the group consisting of alkali metal elements, and an ammonium ion (NH\u2084\u207a), and at least one element selected from the group consisting of Group 4 elements and Group 14 elements, and contains a fluoride that is activated by Mn\u2074\u207a.",
@@ -2614,6 +2795,7 @@
         "$ref": "#/texts/171"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "8. The light emitting device according to claim 1, wherein the fluorescent material contains: a fluorogermanate fluorescent material that is activated by Mn\u2074\u207a, and a fluorescent material that has a composition containing at least one element selected from Sr and Ca, and Al, and contains silicon nitride that is activated by Eu\u00b2\u207a, wherein the compounding ratio between the fluorogermanate fluorescent material and the fluorescent material containing silicon nitride (fluorogermanate fluorescent material:fluorescent material containing silicon nitride) is in a range of 50:50 or more and 99:1 or less.",
@@ -2625,6 +2807,7 @@
         "$ref": "#/texts/171"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "9. The light emitting device according to claim 1, the light emitting device being used in plant cultivation.",
@@ -2636,6 +2819,7 @@
         "$ref": "#/texts/171"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "10. A plant cultivation method comprising irradiating plants with light emitted from the light emitting device according to claim 1.",
@@ -2647,6 +2831,7 @@
         "$ref": "#/texts/171"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "11. A plant cultivation method comprising irradiating plants with light emitted from the light emitting device according to claim 2.",
@@ -2661,6 +2846,7 @@
         "$ref": "#/texts/161"
       },
       "children": [],
+      "content_layer": "body",
       "label": "table",
       "prov": [],
       "captions": [],
@@ -5823,5 +6009,6 @@
     }
   ],
   "key_value_items": [],
+  "form_items": [],
   "pages": {}
 }
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v2/ipa20180000016.md b/tests/data/groundtruth/docling_v2/ipa20180000016.md
index d02144c6..d1cd8c0b 100644
--- a/tests/data/groundtruth/docling_v2/ipa20180000016.md
+++ b/tests/data/groundtruth/docling_v2/ipa20180000016.md
@@ -112,25 +112,25 @@ Examples of the first fluorescent material 71 specifically include fluorescent m
 
 (i−j)MgO.(j/2)Sc₂O₃.kMgF₂.mCaF₂.(1−n)GeO₂.(n/2)Mt₂O₃:zMn⁴⁺ (I)
 
-wherein Mt is at least one selected from the group consisting of Al, Ga, and In, and j, k, m, n, and z are numbers satisfying 2≦i≦4, 0≦j<0.5, 0<k<1.5, 0≦m<1.5, 0<n<0.5, and 0<z<0.05, respectively.
+wherein Mt is at least one selected from the group consisting of Al, Ga, and In, and j, k, m, n, and z are numbers satisfying 2≦i≦4, 0≦j&lt;0.5, 0&lt;k&lt;1.5, 0≦m&lt;1.5, 0&lt;n&lt;0.5, and 0&lt;z&lt;0.05, respectively.
 
 (Ca₁₋p₋qSrpEuq)AlSiN₃ (II)
 
-wherein p and q are numbers satisfying 0≦p≦1.0, 0<q<1.0, and p+q<1.0.
+wherein p and q are numbers satisfying 0≦p≦1.0, 0&lt;q&lt;1.0, and p+q&lt;1.0.
 
 MªvMbwMcfAl₃₋gSigNh (III)
 
-wherein Mª is at least one element selected from the group consisting of Ca, Sr, Ba, and Mg, Mb is at least one element selected from the group consisting of Li, Na, and K, Mc is at least one element selected from the group consisting of Eu, Ce, Tb, and Mn, v, w, f, g, and h are numbers satisfying 0.80≦v≦1.05, 0.80≦w≦1.05, 0.001<f≦0.1, 0≦g≦0.5, and 3.0≦h≦5.0, respectively.
+wherein Mª is at least one element selected from the group consisting of Ca, Sr, Ba, and Mg, Mb is at least one element selected from the group consisting of Li, Na, and K, Mc is at least one element selected from the group consisting of Eu, Ce, Tb, and Mn, v, w, f, g, and h are numbers satisfying 0.80≦v≦1.05, 0.80≦w≦1.05, 0.001&lt;f≦0.1, 0≦g≦0.5, and 3.0≦h≦5.0, respectively.
 
 (Ca₁₋r₋s₋tSrrBasEut)₂Si₅N₈ (IV)
 
-wherein r, s, and t are numbers satisfying 0≦r≦1.0, 0≦s≦1.0, 0<t<1.0, and r+s+t≦1.0.
+wherein r, s, and t are numbers satisfying 0≦r≦1.0, 0≦s≦1.0, 0&lt;t&lt;1.0, and r+s+t≦1.0.
 
 (Ca,Sr)S:Eu (V)
 
 A₂[M¹₁₋uMn⁴⁺uF₆] (VI)
 
-wherein A is at least one selected from the group consisting of K, Li, Na, Rb, Cs, and NH₄⁺, M¹ is at least one element selected from the group consisting of Group 4 elements and Group 14 elements, and u is the number satisfying 0<u<0.2.
+wherein A is at least one selected from the group consisting of K, Li, Na, Rb, Cs, and NH₄⁺, M¹ is at least one element selected from the group consisting of Group 4 elements and Group 14 elements, and u is the number satisfying 0&lt;u&lt;0.2.
 
 The content of the first fluorescent material 71 in the fluorescent member 50 is not particularly limited as long as the R/B ratio is within a range of 2.0 or more and 4.0 or less. The content of the first fluorescent material 71 in the fluorescent member 50 is, for example, 1 part by mass or more, preferably 5 parts by mass or more, and more preferably 8 parts by mass or more, per 100 parts by mass of the sealing material, and is preferably 200 parts by mass or less, more preferably 150 parts by mass or less, and still more preferably 100 parts by mass or less, per 100 parts by mass of the sealing material. When the content of the first fluorescent material 71 in the fluorescent member 50 is within the aforementioned range, the light emitted from the light emitting element 10 can be efficiently subjected to wavelength conversion, and light capable of promoting growth of plant can be emitted from the light emitting device 100.
 
@@ -148,7 +148,7 @@ The second fluorescent material 72 is preferably a fluorescent material having t
 
 (Ln₁₋ₓ₋yCeₓCry)₃M₅O₁₂ (1)
 
-wherein Ln is at least one rare earth element selected from the group consisting of rare earth elements excluding Ce, M is at least one element selected from the group consisting of Al, Ga, and In, and x and y are numbers satisfying 0.0002<x<0.50 and 0.0001<y<0.05, respectively.
+wherein Ln is at least one rare earth element selected from the group consisting of rare earth elements excluding Ce, M is at least one element selected from the group consisting of Al, Ga, and In, and x and y are numbers satisfying 0.0002&lt;x&lt;0.50 and 0.0001&lt;y&lt;0.05, respectively.
 
 In this case, the second fluorescent material 72 has a composition constituting a garnet structure, and therefore is tough against heat, light, and water, has an absorption peak wavelength of excited absorption spectrum in the vicinity of 420 nm or more and 470 nm or less, and sufficiently absorbs the light from the light emitting element 10, thereby enhancing light emitting intensity of the second fluorescent material 72, which is preferred. Furthermore, the second fluorescent material 72 is excited by light having light emission peak wavelength in a range of 380 nm or more and 490 nm or less and emits light having at least one light emission peak wavelength in a range of 680 nm or more and 800 nm or less.
 
@@ -156,9 +156,9 @@ In the second fluorescent material 72, from the standpoint of stability of a cry
 
 In the second fluorescent material 72, the value of the parameter x is more preferably in a range of 0.0005 or more and 0.400 or less (0.0005≦x≦0.400), and still more preferably in a range of 0.001 or more and 0.350 or less (0.001≦x≦0.350).
 
-In the second fluorescent material 72, the value of the parameter y is preferably in a range of exceeding 0.0005 and less than 0.040 (0.0005<y<0.040), and more preferably in a range of 0.001 or more and 0.026 or less (0.001≦y≦0.026).
+In the second fluorescent material 72, the value of the parameter y is preferably in a range of exceeding 0.0005 and less than 0.040 (0.0005&lt;y&lt;0.040), and more preferably in a range of 0.001 or more and 0.026 or less (0.001≦y≦0.026).
 
-The parameter x is an activation amount of Ce and the value of the parameter x is in a range of exceeding 0.0002 and less than 0.50 (0.0002<x<0.50), and the parameter y is an activation amount of Cr. When the value of the parameter y is in a range of exceeding 0.0001 and less than 0.05 (0.0001<y<0.05), the activation amount of Ce and the activation amount of Cr that are light emission centers contained in the crystal structure of the fluorescent material are within optimum ranges, the decrease of light emission intensity due to the decrease of light emission center can be suppressed, the decrease of light emission intensity due to concentration quenching caused by the increase of the activation amount can be suppressed, and light emission intensity can be enhanced.
+The parameter x is an activation amount of Ce and the value of the parameter x is in a range of exceeding 0.0002 and less than 0.50 (0.0002&lt;x&lt;0.50), and the parameter y is an activation amount of Cr. When the value of the parameter y is in a range of exceeding 0.0001 and less than 0.05 (0.0001&lt;y&lt;0.05), the activation amount of Ce and the activation amount of Cr that are light emission centers contained in the crystal structure of the fluorescent material are within optimum ranges, the decrease of light emission intensity due to the decrease of light emission center can be suppressed, the decrease of light emission intensity due to concentration quenching caused by the increase of the activation amount can be suppressed, and light emission intensity can be enhanced.
 
 ### Production Method of Second Fluorescent Material
 
@@ -218,7 +218,7 @@ wherein M¹¹ is at least one selected from the group consisting of Ca, Sr, Ba,
 
 Si₆₋bAlbObN₈₋b:Eu (ii)
 
-wherein b satisfies 0<b<4.2.
+wherein b satisfies 0&lt;b&lt;4.2.
 
 M¹³Ga₂S₄:Eu (iii)
 
@@ -365,7 +365,7 @@ The above disclosed subject matter shall be considered illustrative, and not res
 
 4. The light emitting device according to claim 2, wherein the another fluorescent material contains a first element Ln containing at least one element selected from the group consisting of rare earth elements excluding Ce, a second element M containing at least one element selected from the group consisting of Al, Ga and In, Ce, and Cr, and has a composition of an aluminate fluorescent material, and when a molar ratio of the second element M is taken as 5, a molar ratio of Ce is a product of a value of a parameter x and 3, and a molar ratio of Cr is a product of a value of a parameter y and 3, the value of the parameter x being in a range of exceeding 0.0002 and less than 0.50, and the value of the parameter y being in a range of exceeding 0.0001 and less than 0.05.
 
-5. The light emitting device according to claim 2, wherein the another fluorescent material has the composition represented by the following formula (I): (Ln₁₋ₓ₋yCeₓCry)₃M₅O₁₂ (I) wherein Ln is at least one rare earth element selected from the group consisting of rare earth elements excluding Ce, M is at least one element selected from the group consisting of Al, Ga, and In, and x and y are numbers satisfying 0.0002<x<0.50 and 0.0001<y<0.05.
+5. The light emitting device according to claim 2, wherein the another fluorescent material has the composition represented by the following formula (I): (Ln₁₋ₓ₋yCeₓCry)₃M₅O₁₂ (I) wherein Ln is at least one rare earth element selected from the group consisting of rare earth elements excluding Ce, M is at least one element selected from the group consisting of Al, Ga, and In, and x and y are numbers satisfying 0.0002&lt;x&lt;0.50 and 0.0001&lt;y&lt;0.05.
 
 6. The light emitting device according to claim 2, the light emitting device being used in plant cultivation.
 
diff --git a/tests/data/groundtruth/docling_v2/ipa20200022300.json b/tests/data/groundtruth/docling_v2/ipa20200022300.json
index 8b37ceca..628fbe7b 100644
--- a/tests/data/groundtruth/docling_v2/ipa20200022300.json
+++ b/tests/data/groundtruth/docling_v2/ipa20200022300.json
@@ -1,6 +1,6 @@
 {
   "schema_name": "DoclingDocument",
-  "version": "1.0.0",
+  "version": "1.1.0",
   "name": "ipa20200022300.xml",
   "origin": {
     "mimetype": "application/xml",
@@ -10,6 +10,7 @@
   "furniture": {
     "self_ref": "#/furniture",
     "children": [],
+    "content_layer": "furniture",
     "name": "_root_",
     "label": "unspecified"
   },
@@ -20,6 +21,7 @@
         "$ref": "#/texts/0"
       }
     ],
+    "content_layer": "body",
     "name": "_root_",
     "label": "unspecified"
   },
@@ -53,6 +55,7 @@
           "$ref": "#/texts/58"
         }
       ],
+      "content_layer": "body",
       "label": "title",
       "prov": [],
       "orig": "SYSTEM FOR CONTROLLING THE OPERATION OF AN ACTUATOR MOUNTED ON A SEED PLANTING IMPLEMENT",
@@ -68,6 +71,7 @@
           "$ref": "#/texts/2"
         }
       ],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
       "orig": "ABSTRACT",
@@ -80,6 +84,7 @@
         "$ref": "#/texts/1"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "In one aspect, a system for controlling an operation of an actuator mounted on a seed planting implement may include an actuator configured to adjust a position of a row unit of the seed planting implement relative to a toolbar of the seed planting implement. The system may also include a flow restrictor fluidly coupled to a fluid chamber of the actuator, with the flow restrictor being configured to reduce a rate at which fluid is permitted to exit the fluid chamber in a manner that provides damping to the row unit. Furthermore, the system may include a valve fluidly coupled to the flow restrictor in a parallel relationship such that the valve is configured to permit the fluid exiting the fluid chamber to flow through the flow restrictor and the fluid entering the fluid chamber to bypass the flow restrictor.",
@@ -95,6 +100,7 @@
           "$ref": "#/texts/4"
         }
       ],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
       "orig": "FIELD",
@@ -107,6 +113,7 @@
         "$ref": "#/texts/3"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "The present disclosure generally relates to seed planting implements and, more particularly, to systems for controlling the operation of an actuator mounted on a seed planting implement in a manner that provides damping to one or more components of the seed planting implement.",
@@ -128,6 +135,7 @@
           "$ref": "#/texts/8"
         }
       ],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
       "orig": "BACKGROUND",
@@ -140,6 +148,7 @@
         "$ref": "#/texts/5"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Modern farming practices strive to increase yields of agricultural fields. In this respect, seed planting implements are towed behind a tractor or other work vehicle to deposit seeds in a field. For example, seed planting implements typically include one or more ground engaging tools or openers that form a furrow or trench in the soil. One or more dispensing devices of the seed planting implement may, in turn, deposit seeds into the furrow(s). After deposition of the seeds, a packer wheel may pack the soil on top of the deposited seeds.",
@@ -151,6 +160,7 @@
         "$ref": "#/texts/5"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "In certain instances, the packer wheel may also control the penetration depth of the furrow. In this regard, the position of the packer wheel may be moved vertically relative to the associated opener(s) to adjust the depth of the furrow. Additionally, the seed planting implement includes an actuator configured to exert a downward force on the opener(s) to ensure that the opener(s) is able to penetrate the soil to the depth set by the packer wheel. However, the seed planting implement may bounce or chatter when traveling at high speeds and/or when the opener(s) encounters hard or compacted soil. As such, operators generally operate the seed planting implement with the actuator exerting more downward force on the opener(s) than is necessary in order to prevent such bouncing or chatter. Operation of the seed planting implement with excessive down pressure applied to the opener(s), however, reduces the overall stability of the seed planting implement.",
@@ -162,6 +172,7 @@
         "$ref": "#/texts/5"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Accordingly, an improved system for controlling the operation of an actuator mounted on s seed planting implement to enhance the overall operation of the implement would be welcomed in the technology.",
@@ -189,6 +200,7 @@
           "$ref": "#/texts/14"
         }
       ],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
       "orig": "BRIEF DESCRIPTION",
@@ -201,6 +213,7 @@
         "$ref": "#/texts/9"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Aspects and advantages of the technology will be set forth in part in the following description, or may be obvious from the description, or may be learned through practice of the technology.",
@@ -212,6 +225,7 @@
         "$ref": "#/texts/9"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "In one aspect, the present subject matter is directed to a system for controlling an operation of an actuator mounted on a seed planting implement. The system may include a toolbar and a row unit adjustably mounted on the toolbar. The system may also include a fluid-driven actuator configured to adjust a position of the row unit relative to the toolbar, with the fluid-driven actuator defining first and second fluid chambers. Furthermore, the system may include a flow restrictor fluidly coupled to the first fluid chamber, with the flow restrictor being configured to reduce a rate at which fluid is permitted to exit the first fluid chamber in a manner that provides viscous damping to the row unit. Additionally, the system may include a valve fluidly coupled to the first fluid chamber. The valve may further be fluidly coupled to the flow restrictor in a parallel relationship such that the valve is configured to permit the fluid exiting the first fluid chamber to flow through the flow restrictor and the fluid entering the first fluid chamber to bypass the flow restrictor.",
@@ -223,6 +237,7 @@
         "$ref": "#/texts/9"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "In another aspect, the present subject matter is directed to a seed planting implement including a toolbar and a plurality of row units adjustably coupled to the toolbar. Each row unit may include a ground engaging tool configured to form a furrow in the soil. The seed planting implement may also include plurality of fluid-driven actuators, with each fluid-driven actuator being coupled between the toolbar and a corresponding row unit of the plurality of row units. As such, each fluid-driven actuator may be configured to adjust a position of the corresponding row unit relative to the toolbar. Moreover, each fluid-driven actuator may define first and second fluid chambers. Furthermore, the seed planting implement may include a flow restrictor fluidly coupled to the first fluid chamber of a first fluid-driven actuator of the plurality of fluid-driven actuators. The flow restrictor may be configured to reduce a rate at which fluid is permitted to exit the first fluid chamber of the first fluid-driven actuator in a manner that provides viscous damping to the corresponding row unit. Additionally, the seed planting implement may include a valve fluidly coupled to the first fluid chamber of the first fluid-driven actuator. The valve further may be fluidly coupled to the flow restrictor in a parallel relationship such that the valve is configured to permit the fluid exiting the first fluid chamber to flow through the flow restrictor and the fluid entering the first fluid chamber to bypass the flow restrictor.",
@@ -234,6 +249,7 @@
         "$ref": "#/texts/9"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "In a further aspect, the present subject matter is directed to a system for providing damping to a row unit of a seed planting implement. The system may include a toolbar, a row unit adjustably mounted on the toolbar, and a fluid-driven actuator configured to adjust a position of the row unit relative to the toolbar. As such, the fluid-driven actuator may define a fluid chamber. The system may also include a flow restrictor fluidly coupled to the fluid chamber. The flow restrictor may define an adjustable throat configured to reduce a rate at which fluid is permitted to exit the fluid chamber. In this regard, the throat may be adjustable between a first size configured to provide a first damping rate to the row unit and a second size configured to provide a second damping rate to the row unit, with the first and second damping rates being different.",
@@ -245,6 +261,7 @@
         "$ref": "#/texts/9"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "These and other features, aspects and advantages of the present technology will become better understood with reference to the following description and appended claims. The accompanying drawings, which are incorporated in and constitute a part of this specification, illustrate embodiments of the technology and, together with the description, serve to explain the principles of the technology.",
@@ -290,6 +307,7 @@
           "$ref": "#/texts/26"
         }
       ],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
       "orig": "BRIEF DESCRIPTION OF THE DRAWINGS",
@@ -302,6 +320,7 @@
         "$ref": "#/texts/15"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "A full and enabling disclosure of the present technology, including the best mode thereof, directed to one of ordinary skill in the art, is set forth in the specification, which makes reference to the appended figures, in which:",
@@ -313,6 +332,7 @@
         "$ref": "#/texts/15"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "FIG. 1 illustrates a perspective view of one embodiment of a seed planting implement in accordance with aspects of the present subject matter;",
@@ -324,6 +344,7 @@
         "$ref": "#/texts/15"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "FIG. 2 illustrates a side view of one embodiment of a row unit suitable for use with a seed planting implement in accordance with aspects of the present subject matter;",
@@ -335,6 +356,7 @@
         "$ref": "#/texts/15"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "FIG. 3 illustrates a schematic view of one embodiment of a system for controlling the operation of an actuator mounted on a seed planting implement in accordance with aspects of the present subject matter;",
@@ -346,6 +368,7 @@
         "$ref": "#/texts/15"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "FIG. 4 illustrates a cross-sectional view of one embodiment of a flow restrictor suitable for use in the system shown in FIG. 3, particularly illustrating the flow restrictor defining a throat having a fixed size in accordance with aspects of the present subject matter;",
@@ -357,6 +380,7 @@
         "$ref": "#/texts/15"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "FIG. 5 illustrates a cross-sectional view of another embodiment of a flow restrictor suitable for use in the system shown in FIG. 3, particularly illustrating the flow restrictor defining a throat having an adjustable size in accordance with aspects of the present subject matter;",
@@ -368,6 +392,7 @@
         "$ref": "#/texts/15"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "FIG. 6 illustrates a simplified cross-sectional view of the flow restrictor shown in FIG. 5, particularly illustrating the throat having a first size configured to provide a first damping rate in accordance with aspects of the present subject matter;",
@@ -379,6 +404,7 @@
         "$ref": "#/texts/15"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "FIG. 7 illustrates a simplified cross-sectional view of the flow restrictor shown in FIG. 5, particularly illustrating the throat having a second size configured to provide a second damping rate in accordance with aspects of the present subject matter;",
@@ -390,6 +416,7 @@
         "$ref": "#/texts/15"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "FIG. 8 illustrates a cross-sectional view of another embodiment of a system for controlling the operation of an actuator mounted on a seed planting implement in accordance with aspects of the present subject matter, particularly illustrating the system including a fluidly actuated check valve; and",
@@ -401,6 +428,7 @@
         "$ref": "#/texts/15"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "FIG. 9 illustrates a cross-sectional view of a further embodiment of a system for controlling the operation of an actuator mounted on a seed planting implement in accordance with aspects of the present subject matter, particularly illustrating the system including an electrically actuated check valve.",
@@ -412,6 +440,7 @@
         "$ref": "#/texts/15"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Repeat use of reference characters in the present specification and drawings is intended to represent the same or analogous features or elements of the present technology.",
@@ -514,6 +543,7 @@
           "$ref": "#/texts/57"
         }
       ],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
       "orig": "DETAILED DESCRIPTION",
@@ -526,6 +556,7 @@
         "$ref": "#/texts/27"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Reference now will be made in detail to embodiments of the invention, one or more examples of which are illustrated in the drawings. Each example is provided by way of explanation of the invention, not limitation of the invention. In fact, it will be apparent to those skilled in the art that various modifications and variations can be made in the present invention without departing from the scope or spirit of the invention. For instance, features illustrated or described as part of one embodiment can be used with another embodiment to yield a still further embodiment. Thus, it is intended that the present invention covers such modifications and variations as come within the scope of the appended claims and their equivalents.",
@@ -537,6 +568,7 @@
         "$ref": "#/texts/27"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "In general, the present subject matter is directed to systems for controlling the operation of an actuator mounted on a seed planting implement. Specifically, the disclosed systems may be configured to control the operation of the actuator in a manner that provides damping to one or more components of the seed planting implement. For example, in several embodiments, the seed planting implement may include a toolbar and one or more row units adjustably coupled to the toolbar. One or more fluid-driven actuators of the seed planting implement may be configured to control and/or adjust the position of the row unit(s) relative to the toolbar. Furthermore, a flow restrictor may be fluidly coupled to a fluid chamber of the actuator and configured to reduce the rate at which fluid is permitted to exit the fluid chamber so as to provide viscous damping to the row unit(s). In this regard, when the row unit(s) moves relative to the toolbar (e.g., when the row unit contacts a rock or other impediment in the soil), the flow restrictor may be configured to reduce the relative speed and/or displacement of such movement, thereby damping the movement of the row unit(s) relative to the toolbar.",
@@ -548,6 +580,7 @@
         "$ref": "#/texts/27"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "In one embodiment, the flow restrictor may be configured to provide a variable damping rate to the component(s) of the seed planting implement. Specifically, in such embodiment, the flow restrictor may be configured as an adjustable valve having one or more components that may be adjusted to change the size of a fluid passage or throat defined by the valve. In this regard, changing the throat size of the valve varies the rate at which the fluid may exit the fluid chamber of the actuator, thereby adjusting the damping rate provided by the disclosed system. For example, adjusting the valve so as to increase the size of the throat may allow the fluid to exit the fluid chamber more quickly, thereby reducing the damping rate of the system. Conversely, adjusting the valve so as to decrease the size of the throat may allow the fluid to exit the fluid chamber more slowly, thereby increasing the damping rate of the system.",
@@ -559,6 +592,7 @@
         "$ref": "#/texts/27"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "In accordance with aspects of the present subject matter, the system may further include a check valve fluidly coupled to the fluid chamber of the actuator. Specifically, in several embodiments, the check valve may also be fluidly coupled to the flow restrictor in a parallel relationship. As such, the check valve may be configured to direct the fluid exiting the fluid chamber of the actuator (e.g., when one of the row units hits a rock) to flow through the flow restrictor, thereby reducing the relative speed and/or displacement between the row unit(s) in the toolbar. Furthermore, the check valve may be configured to permit the fluid entering the fluid chamber to bypass the flow restrictor. For example, the fluid may return to the fluid chamber as the row unit(s) returns to its initial position following contact with the rock. In this regard, allowing the returning fluid to bypass the flow restrictor may increase the rate at which the fluid flows back into the fluid chamber, thereby further increasing the damping provided by the disclosed system.",
@@ -570,6 +604,7 @@
         "$ref": "#/texts/27"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Referring now to FIG. 1, a perspective view of one embodiment of a seed planting implement 10 is illustrated in accordance with aspects of the present subject matter. As shown in FIG. 1, the implement 10 may include a laterally extending toolbar or frame assembly 12 connected at its middle to a forwardly extending tow bar 14 to allow the implement 10 to be towed by a work vehicle (not shown), such as an agricultural tractor, in a direction of travel (e.g., as indicated by arrow 16). The toolbar 12 may generally be configured to support a plurality of tool frames 18. Each tool frame 18 may, in turn, be configured to support a plurality of row units 20. As will be described below, each row unit 20 may include one or more ground engaging tools configured to excavate a furrow or trench in the soil.",
@@ -581,6 +616,7 @@
         "$ref": "#/texts/27"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "It should be appreciated that, for purposes of illustration, only a portion of the row units 20 of the implement 10 have been shown in FIG. 1. In general, the implement 10 may include any number of row units 20, such as six, eight, twelve, sixteen, twenty-four, thirty-two, or thirty-six row units. In addition, it should be appreciated that the lateral spacing between row units 20 may be selected based on the type of crop being planted. For example, the row units 20 may be spaced approximately thirty inches from one another for planting corn, and approximately fifteen inches from one another for planting soybeans.",
@@ -592,6 +628,7 @@
         "$ref": "#/texts/27"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "It should also be appreciated that the configuration of the implement 10 described above and shown in FIG. 1 is provided only to place the present subject matter in an exemplary field of use. Thus, it should be appreciated that the present subject matter may be readily adaptable to any manner of implement configuration.",
@@ -603,6 +640,7 @@
         "$ref": "#/texts/27"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Referring now to FIG. 2, a side view of one embodiment of a row unit 20 is illustrated in accordance with aspects of the present subject matter. As shown, the row unit 20 is configured as a hoe opener row unit. However, it should be appreciated that, in alternative embodiments, the row unit 20 may be configured as a disc opener row unit or any other suitable type of seed planting unit. Furthermore, it should be appreciated that, although the row unit 20 will generally be described in the context of the implement 10 shown in FIG. 1, the row unit 20 may generally be configured to be installed on any suitable seed planting implement having any suitable implement configuration.",
@@ -614,6 +652,7 @@
         "$ref": "#/texts/27"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "As shown, the row unit 20 may be adjustably coupled to one of the tool frames 18 of the implement 10 by a suitable linkage assembly 22. For example, in one embodiment, the linkage assembly 22 may include a mounting bracket 24 coupled to the tool frame 18. Furthermore, the linkage assembly 22 may include first and second linkage members 26, 28. One end of each linkage member 26, 28 may be pivotably coupled to the mounting bracket 24, while an opposed end of each linkage member 26, 28 may be pivotally coupled to a support member 30 of the row unit 20. In this regard, the linkage assembly 22 may form a four bar linkage with the support member 30 that permits relative pivotable movement between the row unit 20 and the associated tool frame 18. However, it should be appreciated that, in alternative embodiments, the row unit 20 may be adjustably coupled to the tool frame 18 or the toolbar 12 via any other suitable linkage assembly. Furthermore, it should be appreciated that, in further embodiments the linkage assembly 22 may couple the row unit 20 directly to the toolbar 12.",
@@ -625,6 +664,7 @@
         "$ref": "#/texts/27"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Furthermore, the support member 30 may be configured to support one or more components of the row unit 20. For example, in several embodiments, a ground engaging shank 32 may be mounted or otherwise supported on support member 22. As shown, the shank 32 may include an opener 34 configured to excavate a furrow or trench in the soil as the implement 10 moves in the direction of travel 12 to facilitate deposition of a flowable granular or particulate-type agricultural product, such as seed, fertilizer, and/or the like. Moreover, the row unit 20 may include a packer wheel 36 configured to roll along the soil and close the furrow after deposition of the agricultural product. In one embodiment, the packer wheel 36 may be coupled to the support member 30 by an arm 38. It should be appreciated that, in alternative embodiments, any other suitable component(s) may be supported on or otherwise coupled to the support member 30. For example, the row unit 20 may include a ground engaging disc opener (not shown) in lieu of the ground engaging shank 32.",
@@ -636,6 +676,7 @@
         "$ref": "#/texts/27"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Additionally, in several embodiments, a fluid-driven actuator 102 of the implement 10 may be configured to adjust the position of one or more components of the row unit 20 relative to the tool frame 18. For example, in one embodiment, a rod 104 of the actuator 102 may be coupled to the shank 32 (e.g., the end of the shank 32 opposed from the opener 34), while a cylinder 106 of the actuator 102 may be coupled to the mounting bracket 24. As such, the rod 104 may be configured to extend and/or retract relative to the cylinder 106 to adjust the position of the shank 32 relative to the tool frame 18, which, in turn, adjusts the force being applied to the shank 32. However, it should be appreciated that, in alternative embodiments, the rod 104 may be coupled to the mounting bracket 24, while the cylinder 106 may be coupled to the shank 32. Furthermore, it should be appreciated that, in further embodiments, the actuator 102 may be coupled to any other suitable component of the row unit 20 and/or directly to the toolbar 12.",
@@ -647,6 +688,7 @@
         "$ref": "#/texts/27"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Moreover, it should be appreciated that the configuration of the row unit 20 described above and shown in FIG. 2 is provided only to place the present subject matter in an exemplary field of use. Thus, it should be appreciated that the present subject matter may be readily adaptable to any manner of seed planting unit configuration.",
@@ -658,6 +700,7 @@
         "$ref": "#/texts/27"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Referring now to FIG. 3, a schematic view of one embodiment of a system 100 for controlling the operation of an actuator mounted on a seed planting implement is illustrated in accordance with aspects of the present subject matter. In general, the system 100 will be described herein with reference to the seed planting implement 10 and the row unit 20 described above with reference to FIGS. 1 and 2. However, it should be appreciated by those of ordinary skill in the art that the disclosed system 100 may generally be utilized with seed planting implements having any other suitable implement configuration and/or seed planting units having any other suitable unit configuration.",
@@ -669,6 +712,7 @@
         "$ref": "#/texts/27"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "As shown in FIG. 3, the system 100 may include a fluid-driven actuator, such as the actuator 102 of the row unit 20 described above with reference to FIG. 2. As shown, the actuator 102 may correspond to a hydraulic actuator. Thus, in several embodiments, the actuator 102 may include a piston 108 housed within the cylinder 106. One end of the rod 104 may be coupled to the piston 108, while an opposed end of the rod 104 may extend outwardly from the cylinder 106. Additionally, the actuator 102 may include a cap-side chamber 110 and a rod-side chamber 112 defined within the cylinder 106. As is generally understood, by regulating the pressure of the fluid supplied to one or both of the cylinder chambers 110, 112, the actuation of the rod 104 may be controlled. However, it should be appreciated that, in alternative embodiments, the actuator 102 may be configured as any other suitable type of actuator, such as a pneumatic actuator. Furthermore, it should be appreciated that, in further embodiments, the system 100 may include any other suitable number of fluid-driven actuators, such as additional actuators 102 mounted on the implement 10.",
@@ -680,6 +724,7 @@
         "$ref": "#/texts/27"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Furthermore, the system 100 may include various components configured to provide fluid (e.g., hydraulic oil) to the cylinder chambers 110, 112 of the actuator 102. For example, in several embodiments, the system 100 may include a fluid reservoir 114 and first and second fluid conduits 116, 118. As shown, a first fluid conduit 116 may extend between and fluidly couple the reservoir 114 and the rod-side chamber 112 of the actuator 102. Similarly, a second fluid conduit 118 may extend between and fluidly couple the reservoir 114 and the cap-side chamber 110 of the actuator 102. Additionally, a pump 115 and a remote switch 117 or other valve(s) may be configured to control the flow of the fluid between the reservoir 114 and the cylinder chambers 110, 112 of the actuator 102. In one embodiment, the reservoir 114, the pump 115, and the remote switch 117 may be mounted on the work vehicle (not shown) configured to tow the implement 10. However, it should be appreciated that, in alternative embodiments, the reservoir 114, the pump 115, and/or the remote switch 117 may be mounted on the implement 10. Furthermore, it should be appreciated that the system 100 may include any other suit component(s) configured to control the flow of fluid between the reservoir and the actuator 102.",
@@ -691,6 +736,7 @@
         "$ref": "#/texts/27"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "In several embodiments, the system 100 may also include a flow restrictor 120 that is fluidly coupled to the cap-side chamber 110. As such, the flow restrictor 120 may be provided in series with the second fluid conduit 118. As will be described below, the flow restrictor 120 may be configured to reduce the flow rate of the fluid exiting the cap-side chamber 110 in a manner that provides damping to one or more components of the implement 10. However, it should be appreciated that, in alternative embodiments, the flow restrictor 120 may be fluidly coupled to the rod-side chamber 120 such that the flow restrictor 120 is provided in series with the first fluid conduit 116.",
@@ -702,6 +748,7 @@
         "$ref": "#/texts/27"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Additionally, in several embodiments, the system 100 may include a check valve 122 that is fluidly coupled to the cap-side chamber 110 and provided in series with the second fluid conduit 118. As shown, the check valve 122 may be fluidly coupled to the flow restrictor 120 in parallel. In this regard, the check valve 122 may be provided in series with a first branch 124 of the second fluid conduit 118, while the flow restrictor 120 may be provided in series with a second branch 126 of the second fluid conduit 118. As such, the check valve 122 may be configured to allow the fluid to flow through the first branch 124 of the second fluid conduit 118 from the reservoir 114 to the cap-side chamber 110. However, the check valve 122 may be configured to occlude or prevent the fluid from flowing through the first branch 124 of the second fluid conduit 118 from the cap-side chamber 110 to the reservoir 114. In this regard, the check valve 122 directs all of the fluid exiting the cap-side chamber 110 into the flow restrictor 120. Conversely, the check valve 122 permits the fluid flowing to the cap-side chamber 110 to bypass the flow restrictor 120. As will be described below, such configuration facilitates damping of one or more components of the implement 10. However, it should be appreciated that, in alternative embodiments, the check valve 122 may be fluidly coupled to the rod-side chamber 112 in combination with the flow restrictor 120 such that the check valve 122 is provided in series with the first fluid conduit 116.",
@@ -713,6 +760,7 @@
         "$ref": "#/texts/27"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "As indicated above, the system 100 may generally be configured to provide viscous damping to one or more components of the implement 10. For example, when a ground engaging tool of the implement 10, such as the shank 32, contacts a rock or other impediment in the soil, the corresponding row unit 20 may pivot relative to the corresponding tool frame 18 and/or the toolbar 12 against the down pressure load applied to the row unit 20 by the corresponding actuator 102. In several embodiments, such movement may cause the rod 104 of the actuator 102 to retract into the cylinder 106, thereby moving the piston 108 in a manner that decreases the volume of the cap-side chamber 110. In such instances, some of the fluid present within the cap-side chamber 110 may exit and flow into the second fluid conduit 118 toward the reservoir 114. The check valve 122 may prevent the fluid exiting the cap-side chamber 110 from flowing through the first branch 124 of the second fluid conduit 118. As such, all fluid exiting the cap-side chamber 110 may be directed into the second branch 126 and through the flow restrictor 120. As indicated above, the flow restrictor 120 reduces or limits the rate at which the fluid may flow through the second fluid conduit 118 so as to reduce the rate at which the fluid may exit the cap-side chamber 110. In this regard, the speed at which and/or the amount that the rod 104 retracts into the cylinder 106 when the shank 32 contacts a soil impediment may be reduced (e.g., because of the reduced rate at which the fluid is discharged from the cap-side chamber 110), thereby damping the movement of the row unit 20 relative to the corresponding tool frame 18 and/or the toolbar 12. Furthermore, after the initial retraction of the rod 104 into the cylinder 106, the piston 108 may then move in a manner that increases the volume of the cap-side chamber 110, thereby extending the rod 104 from the cylinder 106. In such instances, fluid present within the reservoir 114 and the second fluid conduit 118 may be drawn back into the cap-side chamber 110. As indicated above, the check valve 122 may permit the fluid within the second fluid conduit 118 to bypass the flow restrictor 120 and flow unobstructed through the first branch 124, thereby maximizing the rate at which the fluid returns to the cap-side chamber 110. Increasing the rate at which the fluid returns to the cap-side chamber 110 may decrease the time that the row unit 20 is displaced relative to the tool frame 18, thereby further damping of the row unit 20 relative to the corresponding tool frame 18 and/or the toolbar 12.",
@@ -724,6 +772,7 @@
         "$ref": "#/texts/27"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Referring now to FIG. 4, a cross-sectional view of one embodiment of the flow restrictor 120 is illustrated in accordance with aspects of the present subject matter. For example, in the illustrated embodiment, the flow restrictor 120 may include a restrictor body 128 coupled to the second branch 126 of the second fluid conduit 118, with the restrictor body 128, in turn, defining a fluid passage 130 extending therethrough. Furthermore, the flow restrictor 120 may include an orifice plate 132 extending inward from the restrictor body 128 into the fluid passage 130. As shown, the orifice plate 132 may define a central aperture or throat 134 extending therethrough. In general, the size (e.g., the area, diameter, etc.) of the throat 134 may be smaller than the size of the fluid passage 130 so as to reduce the flow rate of the fluid through the flow restrictor 120. It should be appreciated that, in the illustrated embodiment, the throat 134 has a fixed size such that the throat 134 provides a fixed or constant backpressure for a given fluid flow rate. In this regard, in such embodiment, a fixed or constant damping rate is provided by the system 100. However, it should be appreciated that, in alternative embodiments, the flow restrictor 120 may have any other suitable configuration that reduces the flow rate of the fluid flowing therethrough.",
@@ -735,6 +784,7 @@
         "$ref": "#/texts/27"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Referring now to FIG. 5, a cross-sectional view of another embodiment of the flow restrictor 120 is illustrated in accordance with aspects of the present subject matter. As shown, the flow restrictor 120 may generally be configured the same as or similar to that described above with reference to FIG. 4. For instance, the flow restrictor 120 may define the throat 134, which is configured to reduce the flow rate of the fluid through the flow restrictor 120. However, as shown in FIG. 5, unlike the above-describe embodiment, the size (e.g., the area, diameter, etc.) of the throat 134 is adjustable. For example, in such embodiment, the flow restrictor 120 may be configured as an adjustable valve 136. As shown, the valve 136 may include a valve body 138 coupled to the second branch 126 of the second fluid conduit 118, a shaft 140 rotatably coupled to the valve body 138, a disc 142 coupled to the shaft 140, and an actuator 144 (e.g., a suitable electric motor) coupled to the shaft 140. As such, the actuator 144 may be configured to rotate the shaft 140 and the disc 142 relative to the valve body 138 (e.g., as indicated by arrow 146 in FIG. 5) to change the size of the throat 134 defined between the disc 142 and the valve body 138. Although the valve 136 is configured as a butterfly valve in FIG. 5, it should be appreciated that, in alternative embodiments, the valve 136 may be configured as any other suitable type of valve or adjustable flow restrictor. For example, in one embodiment, the valve 136 may be configured as a suitable ball valve.",
@@ -746,6 +796,7 @@
         "$ref": "#/texts/27"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "In accordance with aspects of the present disclosure, by adjusting the size of the throat 134, the system 100 may be able to provide variable damping rates. In general, the size of the throat 134 may be indicative of the amount of damping provided by the system 100. For example, in several embodiments, the disc 142 may be adjustable between a first position shown in FIG. 6 and a second position shown in FIG. 7. More specifically, when the disc 142 is at the first position, the throat 134 defines a first size (e.g., as indicated by arrow 148 in FIG. 6), thereby providing a first damping rate. Conversely, when the disc 142 is at the second position, the throat 134 defines a second size (e.g., as indicated by arrow 150 in FIG. 7), thereby providing a second damping rate. As shown in FIGS. 6 and 7, the first distance 148 is larger than the second distance 150. In such instance, the system 100 provides greater damping when the throat 134 is adjusted to the first size than when the throat 134 is adjusted to the second size. It should be appreciated that, in alternative embodiments, the disc 142 may be adjustable between any other suitable positions that provide any other suitable damping rates. For example, the disc 142 may be adjustable to a plurality of different positions defined between the fully opened and fully closed positions of the valve, thereby providing for a corresponding number of different damping rates. Furthermore, it should be appreciated that the disc 142 may be continuously adjustable or adjustable between various discrete positions.",
@@ -757,6 +808,7 @@
         "$ref": "#/texts/27"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Referring back to FIG. 5, a controller 152 of the system 100 may be configured to electronically control the operation of one or more components of the valve 138, such as the actuator 144. In general, the controller 152 may comprise any suitable processor-based device known in the art, such as a computing device or any suitable combination of computing devices. Thus, in several embodiments, the controller 152 may include one or more processor(s) 154 and associated memory device(s) 156 configured to perform a variety of computer-implemented functions. As used herein, the term \u201cprocessor\u201d refers not only to integrated circuits referred to in the art as being included in a computer, but also refers to a controller, a microcontroller, a microcomputer, a programmable logic controller (PLC), an application specific integrated circuit, and other programmable circuits. Additionally, the memory device(s) 156 of the controller 152 may generally comprise memory element(s) including, but not limited to, a computer readable medium (e.g., random access memory (RAM)), a computer readable non-volatile medium (e.g., a flash memory), a floppy disk, a compact disc-read only memory (CD-ROM), a magneto-optical disk (MOD), a digital versatile disc (DVD) and/or other suitable memory elements. Such memory device(s) 156 may generally be configured to store suitable computer-readable instructions that, when implemented by the processor(s) 154, configure the controller 152 to perform various computer-implemented functions. In addition, the controller 152 may also include various other suitable components, such as a communications circuit or module, one or more input/output channels, a data/control bus and/or the like.",
@@ -768,6 +820,7 @@
         "$ref": "#/texts/27"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "It should be appreciated that the controller 152 may correspond to an existing controller of the implement 10 or associated work vehicle (not shown) or the controller 152 may correspond to a separate processing device. For instance, in one embodiment, the controller 152 may form all or part of a separate plug-in module that may be installed within the implement 10 or associated work vehicle to allow for the disclosed system and method to be implemented without requiring additional software to be uploaded onto existing control devices of the implement 10 or associated work vehicle.",
@@ -779,6 +832,7 @@
         "$ref": "#/texts/27"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Furthermore, in one embodiment, a user interface 158 of the system 100 may be communicatively coupled to the controller 152 via a wired or wireless connection to allow feedback signals (e.g., as indicated by dashed line 160 in FIG. 5) to be transmitted from the controller 152 to the user interface 158. More specifically, the user interface 158 may be configured to receive an input from an operator of the implement 10 or the associated work vehicle, such as an input associated with a desired damping characteristic(s) to be provided by the system 100. As such, the user interface 158 may include one or more input devices (not shown), such as touchscreens, keypads, touchpads, knobs, buttons, sliders, switches, mice, microphones, and/or the like. In addition, some embodiments of the user interface 158 may include one or more one or more feedback devices (not shown), such as display screens, speakers, warning lights, and/or the like, which are configured to communicate such feedback from the controller 152 to the operator of the implement 10. However, in alternative embodiments, the user interface 158 may have any suitable configuration.",
@@ -790,6 +844,7 @@
         "$ref": "#/texts/27"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Moreover, in one embodiment, one or more sensors 162 of the system 100 may be communicatively coupled to the controller 152 via a wired or wireless connection to allow sensor data (e.g., as indicated by dashed line 164 in FIG. 5) to be transmitted from the sensor(s) 162 to the controller 152. For example, in one embodiment, the sensor(s) 162 may include a location sensor, such as a GNSS-based sensor, that is configured to detect a parameter associated with the location of the implement 10 or associated work vehicle within the field. In another embodiment, the sensor(s) 162 may include a speed sensor, such as a Hall Effect sensor, that is configured to detect a parameter associated with the speed at which the implement 10 is moved across the field. However, it should be appreciated that, in alternative embodiments, the sensor(s) 162 may include any suitable sensing device(s) configured to detect any suitable operating parameter of the implement 10 and/or the associated work vehicle.",
@@ -801,6 +856,7 @@
         "$ref": "#/texts/27"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "In several embodiments, the controller 152 may be configured to control the operation of the valve 136 based on the feedback signals 160 received from the user interface 158 and/or the sensor data 164 received from the sensor(s) 162. Specifically, as shown in FIG. 5, the controller 152 may be communicatively coupled to the actuator 144 of the valve 136 via a wired or wireless connection to allow control signals (e.g., indicated by dashed lines 166 in FIG. 5) to be transmitted from the controller 152 to the actuator 144. Such control signals 166 may be configured to regulate the operation of the actuator 144 to adjust the position of the disc 142 relative to the valve body 138, such as by moving the disc 142 along the direction 146 between the first position (FIG. 6) and the second position (FIG. 7). For example, the feedback signals 116 received by the controller 152 may be indicative that the operator desires to adjust the damping provided by the system 100. Furthermore, upon receipt of the sensor data 164 (e.g., data indicative of the location and/or speed of the implement 10), the controller 152 may be configured to determine that the damping rate of the system 100 should be adjusted. In either instance, the controller 152 may be configured to transmit the control signals 166 to the actuator 144, with such control signals 166 being configured to control the operation of the actuator 144 to adjust the position of the disc 142 to provide the desired damping rate. However, it should be appreciated that, in alternative embodiments, the controller 152 may be configured to control the operation of the valve 136 based on any other suitable input(s) and/or parameter(s).",
@@ -812,6 +868,7 @@
         "$ref": "#/texts/27"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Referring now to FIG. 8, a schematic view of another embodiment of the system 100 is illustrated in accordance with aspects of the present subject matter. As shown, the system 100 may generally be configured the same as or similar to that described above with reference to FIG. 3. For instance, the system 100 may include the flow restrictor 120 and the check valve 122 fluidly coupled to the cap-side chamber 110 of the actuator 102 via the second fluid conduit 118. Furthermore, the flow restrictor 120 and the check valve 122 may be fluidly coupled together in parallel. However, as shown in FIG. 8, unlike the above-describe embodiment, the check valve 122 may be configured as a pilot-operated or fluid actuated three-way valve that is fluidly coupled to the first fluid conduit 116 by a pilot conduit 168.",
@@ -823,6 +880,7 @@
         "$ref": "#/texts/27"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "In general, when the row unit 20 is lifted from an operational position relative to the ground to a raised position relative to the ground, it may be desirable for fluid to exit the cap-side chamber 110 without its flow rate being limited by the flow restrictor 120. For example, permitting such fluid to bypass the flow restrictor 120 may reduce the time required to lift the row unit 20 from the operational position to the raised position. More specifically, when lifting the row unit 20 from the operational position to the raised position, a pump (not shown) may pump fluid through the first fluid conduit 116 from the reservoir 114 to the rod-side chamber 112 of the actuator 102, thereby retracting the rod 104 into the cylinder 106. This may, in turn, discharge fluid from the cap-side chamber 110 into the second fluid conduit 118. As described above, the check valve 122 may generally be configured to direct all fluid exiting the cap-side chamber 110 into the flow restrictor 120. However, in the configuration of the system 100 shown in FIG. 8, when lifting the row unit 20 to the raised position, the pilot conduit 168 supplies fluid flowing through the first fluid conduit 116 to the check valve 122. The fluid received from the pilot conduit 168 may, in turn, actuate suitable component(s) of the check valve 122 (e.g., a diaphragm(s), a spring(s), and/or the like) in a manner that causes the check valve 122 to open, thereby permitting the fluid exiting the cap-side chamber 110 to bypass the flow restrictor 120 and flow unobstructed through the check valve 122 toward the reservoir 114. Conversely, when the row unit 20 is at the operational position, the check valve 122 may be closed, thereby directing all fluid exiting the cap-side chamber 110 into the flow restrictor 120.",
@@ -834,6 +892,7 @@
         "$ref": "#/texts/27"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Referring now to FIG. 9, a schematic view of a further embodiment of the system 100 is illustrated in accordance with aspects of the present subject matter. As shown, the system 100 may generally be configured the same as or similar to that described above with reference to FIGS. 3 and 8. For instance, the system 100 may include the flow restrictor 120 and the check valve 122 fluidly coupled to the cap-side chamber 110 of the actuator 102 via the second fluid conduit 118. Furthermore, the flow restrictor 120 and the check valve 122 may be fluidly coupled together in parallel. However, as shown in FIG. 9, unlike the above-describe embodiments, the check valve 122 may be configured as an electrically actuated valve. Specifically, as shown, the controller 152 may be communicatively coupled to the check valve 122 via a wired or wireless connection to allow control signals (e.g., indicated by dashed lines 170 in FIG. 9) to be transmitted from the controller 152 to the check valve 122. In this regard, when the row unit 20 is lifted from the operational position to the raised position, the control signals 170 may be configured to instruct the check valve 122 to open in a manner that permits the fluid exiting the cap-side chamber 110 to bypass the flow restrictor 120 and flow unobstructed through the check valve 122 toward the reservoir 114. Conversely, when the row unit 20 is at the operational position, the control signals 170 may be configured to instruct the check valve 122 to close, thereby directing all fluid exiting the cap-side chamber 110 into the flow restrictor 120.",
@@ -845,6 +904,7 @@
         "$ref": "#/texts/27"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "This written description uses examples to disclose the technology, including the best mode, and also to enable any person skilled in the art to practice the technology, including making and using any devices or systems and performing any incorporated methods. The patentable scope of the technology is defined by the claims, and may include other examples that occur to those skilled in the art. Such other examples are intended to be within the scope of the claims if they include structural elements that do not differ from the literal language of the claims, or if they include equivalent structural elements with insubstantial differences from the literal language of the claims.",
@@ -914,6 +974,7 @@
           "$ref": "#/texts/77"
         }
       ],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
       "orig": "CLAIMS",
@@ -926,6 +987,7 @@
         "$ref": "#/texts/58"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "1. A system for controlling an operation of an actuator mounted on a seed planting implement, the system comprising: a toolbar; a row unit adjustably mounted on the toolbar; a fluid-driven actuator configured to adjust a position of the row unit relative to the toolbar, the fluid-driven actuator defining first and second fluid chambers; a flow restrictor fluidly coupled to the first fluid chamber, the flow restrictor being configured to reduce a rate at which fluid is permitted to exit the first fluid chamber in a manner that provides damping to the row unit; and a valve fluidly coupled to the first fluid chamber, the valve further being fluidly coupled to the flow restrictor in a parallel relationship such that the valve is configured to permit the fluid exiting the first fluid chamber to flow through the flow restrictor and the fluid entering the first fluid chamber to bypass the flow restrictor.",
@@ -937,6 +999,7 @@
         "$ref": "#/texts/58"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "2. The system of claim 1, wherein, when fluid is supplied to the second fluid chamber, the valve is configured to permit fluid exiting the first fluid chamber to bypass the flow restrictor.",
@@ -948,6 +1011,7 @@
         "$ref": "#/texts/58"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "3. The system of claim 1, wherein the valve is fluidly actuated.",
@@ -959,6 +1023,7 @@
         "$ref": "#/texts/58"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "4. The system of claim 3, further comprising: a fluid line configured to supply the fluid to the second fluid chamber, the fluid line being fluidly coupled to the valve such that, when the fluid flows through the fluid line to the second fluid chamber, the valve opens in a manner that permits the fluid exiting first fluid chamber to bypass the flow restrictor.",
@@ -970,6 +1035,7 @@
         "$ref": "#/texts/58"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "5. The system of claim 1, wherein the valve is electrically actuated.",
@@ -981,6 +1047,7 @@
         "$ref": "#/texts/58"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "6. The system of claim 1, wherein the flow restrictor defines a throat having a fixed size.",
@@ -992,6 +1059,7 @@
         "$ref": "#/texts/58"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "7. The system of claim 1, wherein the flow restrictor defines a throat having an adjustable size.",
@@ -1003,6 +1071,7 @@
         "$ref": "#/texts/58"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "8. A seed planting implement, comprising: a toolbar; a plurality of row units adjustably coupled to the toolbar, each row unit including a ground engaging tool configured to form a furrow in the soil; a plurality of fluid-driven actuators, each fluid-driven actuator being coupled between the toolbar and a corresponding row unit of the plurality of row units, each fluid-driven actuator being configured to adjust a position of the corresponding row unit relative to the toolbar, each fluid-driven actuator defining first and second fluid chambers; a flow restrictor fluidly coupled to the first fluid chamber of a first fluid-driven actuator of the plurality of fluid-driven actuators, the flow restrictor being configured to reduce a rate at which fluid is permitted to exit the first fluid chamber of the first fluid-driven actuator in a manner that provides damping to the corresponding row unit; and a valve fluidly coupled to the first fluid chamber of the first fluid-driven actuator, the valve further being fluidly coupled to the flow restrictor in a parallel relationship such that the valve is configured to permit the fluid exiting the first fluid chamber to flow through the flow restrictor and the fluid entering the first fluid chamber to bypass the flow restrictor.",
@@ -1014,6 +1083,7 @@
         "$ref": "#/texts/58"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "9. The seed planting implement of claim 8, wherein, when fluid is supplied to the second fluid chamber of the first fluid-driven actuator, the valve is configured to permit fluid exiting the first fluid chamber of the first fluid-driven actuator to bypass the flow restrictor.",
@@ -1025,6 +1095,7 @@
         "$ref": "#/texts/58"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "10. The seed planting implement of claim 8, wherein the valve is fluidly actuated.",
@@ -1036,6 +1107,7 @@
         "$ref": "#/texts/58"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "11. The seed planting implement of claim 10, further comprising: a fluid line configured to supply fluid to the second fluid chamber of the first fluid-driven actuator, the fluid line being fluidly coupled to the valve such that, when fluid flows through the fluid line to the second fluid chamber of the first fluid-driven actuator, the valve opens in a manner that permits the fluid exiting first fluid chamber of the first fluid-driven actuator to bypass the flow restrictor.",
@@ -1047,6 +1119,7 @@
         "$ref": "#/texts/58"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "12. The seed planting implement of claim 8, wherein the valve is electrically actuated.",
@@ -1058,6 +1131,7 @@
         "$ref": "#/texts/58"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "13. The seed planting implement of claim 8, wherein the flow restrictor defines a throat having a fixed size.",
@@ -1069,6 +1143,7 @@
         "$ref": "#/texts/58"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "14. The seed planting implement of claim 8, wherein the flow restrictor defines a throat having an adjustable size.",
@@ -1080,6 +1155,7 @@
         "$ref": "#/texts/58"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "15. A system for providing damping to a row unit of a seed planting implement, the system comprising: a toolbar; a row unit adjustably mounted on the toolbar; a fluid-driven actuator configured to adjust a position of the row unit relative to the toolbar, the fluid-driven actuator defining a fluid chamber; and a flow restrictor fluidly coupled to the fluid chamber, the flow restrictor defining an adjustable throat configured to reduce a rate at which fluid is permitted to exit the fluid chamber, the throat being adjustable between a first size configured to provide a first damping rate to the row unit and a second size configured to provide a second damping rate to the row unit, the first and second damping rates being different.",
@@ -1091,6 +1167,7 @@
         "$ref": "#/texts/58"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "16. The system of claim 15, wherein the throat is adjustable between the first and second damping rates based on an operator input.",
@@ -1102,6 +1179,7 @@
         "$ref": "#/texts/58"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "17. The system of claim 15, wherein the throat is adjustable between the first and second damping rates based on data received from one or more sensors on the seed planting implement.",
@@ -1113,6 +1191,7 @@
         "$ref": "#/texts/58"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "18. The system of claim 15, further comprising: a valve fluidly coupled to the fluid chamber, the valve being configured to selectively occlude the flow of fluid such that fluid exiting the fluid chamber flows through the flow restrictor and fluid entering the fluid chamber bypasses the flow restrictor.",
@@ -1124,6 +1203,7 @@
         "$ref": "#/texts/58"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "19. The system of claim 18, wherein the flow restrictor and the valve are fluidly coupled in a parallel relationship.",
@@ -1133,5 +1213,6 @@
   "pictures": [],
   "tables": [],
   "key_value_items": [],
+  "form_items": [],
   "pages": {}
 }
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v2/lorem_ipsum.docx.json b/tests/data/groundtruth/docling_v2/lorem_ipsum.docx.json
index 02bd2123..8678ff79 100644
--- a/tests/data/groundtruth/docling_v2/lorem_ipsum.docx.json
+++ b/tests/data/groundtruth/docling_v2/lorem_ipsum.docx.json
@@ -1,6 +1,6 @@
 {
   "schema_name": "DoclingDocument",
-  "version": "1.0.0",
+  "version": "1.1.0",
   "name": "lorem_ipsum",
   "origin": {
     "mimetype": "application/vnd.openxmlformats-officedocument.wordprocessingml.document",
@@ -10,6 +10,7 @@
   "furniture": {
     "self_ref": "#/furniture",
     "children": [],
+    "content_layer": "furniture",
     "name": "_root_",
     "label": "unspecified"
   },
@@ -44,6 +45,7 @@
         "$ref": "#/texts/8"
       }
     ],
+    "content_layer": "body",
     "name": "_root_",
     "label": "unspecified"
   },
@@ -55,6 +57,7 @@
         "$ref": "#/body"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Lorem ipsum dolor sit amet, consectetur adipiscing elit. Proin elit mi, fermentum vitae dolor facilisis, porttitor mollis quam. Cras quam massa, venenatis faucibus libero vel, euismod sollicitudin ipsum. Aliquam semper sapien leo, ac ultrices nibh mollis congue. Cras luctus ultrices est, ut scelerisque eros euismod ut. Curabitur ac tincidunt felis, non scelerisque lectus. Praesent sollicitudin vulputate est id consequat. Vestibulum pharetra ligula sit amet varius porttitor. Sed eros diam, gravida non varius at, scelerisque in libero. Ut auctor finibus mauris sit amet ornare. Sed facilisis leo at urna rhoncus, in facilisis arcu eleifend. Sed tincidunt lacinia fermentum. Cras non purus fringilla, semper quam non, sodales sem. Nulla facilisi.",
@@ -66,6 +69,7 @@
         "$ref": "#/body"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "",
@@ -77,6 +81,7 @@
         "$ref": "#/body"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Duis condimentum dui eget ullamcorper maximus. Nulla tortor lectus, hendrerit at diam fermentum, euismod ornare orci. Integer ac mauris sed augue ultricies pellentesque. Etiam condimentum turpis a risus dictum, sed tempor arcu vestibulum. Quisque at venenatis tellus. Morbi id lobortis elit. In gravida metus at ornare suscipit. Donec euismod nibh sit amet commodo porttitor. Integer commodo sit amet nisi vel accumsan. Donec lacinia posuere porta. Pellentesque vulputate porta risus, vel consectetur nisl gravida sit amet. Nam scelerisque enim sodales lacus tempor, et tristique ante aliquet.",
@@ -88,6 +93,7 @@
         "$ref": "#/body"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "",
@@ -99,6 +105,7 @@
         "$ref": "#/body"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Maecenas id neque pharetra, eleifend lectus a, vehicula sapien. Aliquam erat volutpat. Ut arcu erat, blandit id elementum at, aliquet pretium mauris. Nulla at semper orci. Nunc sed maximus metus. Duis eget tristique arcu. Phasellus fringilla augue est, ut bibendum est bibendum vitae. Nam et urna interdum, egestas velit a, consectetur metus. Pellentesque facilisis vehicula orci, eu posuere justo imperdiet non. Vestibulum tincidunt orci ac lorem consequat semper. Fusce semper sollicitudin orci, id lacinia nulla faucibus eu. Donec ut nisl metus.",
@@ -110,6 +117,7 @@
         "$ref": "#/body"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "",
@@ -121,6 +129,7 @@
         "$ref": "#/body"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Duis ac tellus sed turpis feugiat aliquam sed vel justo. Fusce sit amet volutpat massa. Duis tristique finibus metus quis tincidunt. Etiam dapibus fringilla diam at pharetra. Vivamus dolor est, hendrerit ac ligula nec, pharetra lacinia sapien. Phasellus at malesuada orci. Maecenas est justo, mollis non ultrices ut, sagittis commodo odio. Integer viverra mauris pellentesque bibendum vestibulum. Sed eu felis mattis, efficitur justo non, finibus lorem. Phasellus viverra diam et sapien imperdiet interdum. Cras a convallis libero. Integer maximus dui vel lorem hendrerit, sit amet convallis ligula lobortis. Duis eu lacus elementum, scelerisque nunc eget, dignissim libero. Suspendisse mi quam, vehicula sit amet pellentesque rhoncus, blandit eu nisl.",
@@ -132,6 +141,7 @@
         "$ref": "#/body"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "",
@@ -143,6 +153,7 @@
         "$ref": "#/body"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Nunc vehicula mattis erat ac consectetur. Etiam pharetra mauris ut tempor pellentesque. Sed vel libero vitae ante tempus sagittis vel sit amet dolor. Etiam faucibus viverra sodales. Pellentesque ullamcorper magna libero, non malesuada dui bibendum quis. Donec sed dolor non sem luctus volutpat. Morbi vel diam ut urna euismod gravida a id lectus. Vestibulum vel mauris eu tellus hendrerit dapibus. Etiam scelerisque lacus vel ante ultricies vulputate. In ullamcorper malesuada justo, vel scelerisque nisl lacinia at. Donec sodales interdum ipsum, ac bibendum ipsum pharetra interdum. Vivamus condimentum ac ante vel aliquam. Ut consectetur eu nibh nec gravida. Vestibulum accumsan, purus at mollis rutrum, sapien tortor accumsan purus, vitae fermentum urna mauris ut lacus. Fusce vitae leo sollicitudin, vehicula turpis eu, tempus nibh.",
diff --git a/tests/data/groundtruth/docling_v2/mixed.md.md b/tests/data/groundtruth/docling_v2/mixed.md.md
new file mode 100644
index 00000000..6cd5d52b
--- /dev/null
+++ b/tests/data/groundtruth/docling_v2/mixed.md.md
@@ -0,0 +1,25 @@
+# Title
+
+Some text
+
+## Famous ducks
+
+Here is a table:
+
+| Character      | Name in German   | Name in French   | Name in Italian   |
+|----------------|------------------|------------------|-------------------|
+| Scrooge McDuck | Dagobert Duck    | Balthazar Picsou | Paperone          |
+| Huey           | Tick             | Riri             | Qui               |
+| Dewey          | Trick            | Fifi             | Quo               |
+| Louie          | Track            | Loulou           | Qua               |
+
+And here is more HTML:
+
+Some paragraph.
+
+Now a div — almost there...
+
+- foo
+- bar
+
+The end!
diff --git a/tests/data/groundtruth/docling_v2/nested.md.md b/tests/data/groundtruth/docling_v2/nested.md.md
new file mode 100644
index 00000000..6e430e0c
--- /dev/null
+++ b/tests/data/groundtruth/docling_v2/nested.md.md
@@ -0,0 +1,31 @@
+# Nesting
+
+A list featuring nesting:
+
+- abc
+    - abc123
+        - abc1234
+            - abc12345
+                - a.
+                - b.
+        - abcd1234：
+            - abcd12345：
+                - a.
+                - b.
+- def：
+    - def1234：
+        - def12345。
+- after one empty line
+    - foo
+- afer two empty lines
+    - bar
+
+- changing symbol
+
+A nested HTML list:
+
+- First item
+- Second item with subitems:
+    - Subitem 1
+    - Subitem 2
+- Last list item
diff --git a/tests/data/groundtruth/docling_v2/pa20010031492.json b/tests/data/groundtruth/docling_v2/pa20010031492.json
index 1dcc8306..771dd7d4 100644
--- a/tests/data/groundtruth/docling_v2/pa20010031492.json
+++ b/tests/data/groundtruth/docling_v2/pa20010031492.json
@@ -1,6 +1,6 @@
 {
   "schema_name": "DoclingDocument",
-  "version": "1.0.0",
+  "version": "1.1.0",
   "name": "pa20010031492.xml",
   "origin": {
     "mimetype": "application/xml",
@@ -10,6 +10,7 @@
   "furniture": {
     "self_ref": "#/furniture",
     "children": [],
+    "content_layer": "furniture",
     "name": "_root_",
     "label": "unspecified"
   },
@@ -23,6 +24,7 @@
         "$ref": "#/texts/102"
       }
     ],
+    "content_layer": "body",
     "name": "_root_",
     "label": "unspecified"
   },
@@ -167,6 +169,7 @@
           "$ref": "#/texts/84"
         }
       ],
+      "content_layer": "body",
       "label": "title",
       "prov": [],
       "orig": "Assay reagent",
@@ -182,6 +185,7 @@
           "$ref": "#/texts/2"
         }
       ],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
       "orig": "ABSTRACT",
@@ -194,6 +198,7 @@
         "$ref": "#/texts/1"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "A cell-derived assay reagent prepared from cells which have been killed by treatment with an antibiotic selected from the bleomycin-phleomycin family of antibiotics but which retain a signal-generating metabolic activity such as bioluminescence. ",
@@ -205,6 +210,7 @@
         "$ref": "#/texts/0"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "This application is a continuation of PCT/GB99/01730, filed Jun. 1, 1999 designating the United States (the disclosure of which is incorporated herein by reference) and claiming priority from British application serial no. 9811845.8, filed Jun. 2, 1998.",
@@ -216,6 +222,7 @@
         "$ref": "#/texts/0"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "The invention relates to a cell-derived assay reagent, in particular to an assay reagent prepared from cells which have been killed but which retain a signal-generating metabolic activity such as bioluminescence and also to assay methods using the cell-derived reagent such as, for example, toxicity testing methods.",
@@ -227,6 +234,7 @@
         "$ref": "#/texts/0"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "The use of bacteria with a signal-generating metabolic activity as indicators of toxicity is well established. UK patent number GB 2005018 describes a method of assaying a liquid sample for toxic substances which involves contacting a suspension of bioluminescent microorganisms with a sample suspected of containing a toxic substance and observing the change in the light output of the bioluminescent organisms as a result of contact with the suspected toxic substance. Furthermore, a toxicity monitoring system embodying the same assay principle, which is manufactured and sold under the Trade Mark Microtox\u00ae, is in routine use in both environmental laboratories and for a variety of industrial applications. An improved toxicity assay method using bioluminescent bacteria, which can be used in a wider range of test conditions than the method of GB 2005018, is described in International patent application number WO 95/10767.",
@@ -238,6 +246,7 @@
         "$ref": "#/texts/0"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "The assay methods known in the prior art may utilize naturally occurring bioluminescent organisms, including Photobacterium phosphoreum and Vibrio fischeri. However, recent interest has focused on the use of genetically modified microorganisms which have been engineered to express bioluminescence. These genetically modified bioluminescent microorganisms usually express lux genes, encoding the enzyme luciferase, which have been cloned from a naturally occurring bioluminescent microorganism (E. A. Meighen (1994) Genetics of Bacterial Bioluminescence. Ann. Rev. Genet. 28: 117-139; Stewart, G. S. A. B. Jassin, S. A. A. and Denyer, S. P. (1993), Engineering Microbial bioluminescence and biosensor applications. In Molecular Diagnosis. Eds R. Rapley and M. R. Walker Blackwell Scientific Pubs/Oxford). A process for producing genetically modified bioluminescent microorganisms expressing lux genes cloned from Vibrio harveyi is described in U.S. Pat. No. 4,581,335.",
@@ -249,6 +258,7 @@
         "$ref": "#/texts/0"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "The use of genetically modified bioluminescent microorganisms in toxicity testing applications has several advantages over the use of naturally occurring microorganisms. For example, it is possible to engineer microorganisms with different sensitivities to a range of different toxic substances or to a single toxic substance. However, genetically modified microorganisms are subject to marketing restrictions as a result of government legislation and there is major concern relating to the deliberate release of genetically modified microorganisms into the environment as components of commercial products. This is particularly relevant with regard to toxicity testing which is often performed in the field rather than within the laboratory. The potential risk from release of potentially pathogenic genetically modified microorganisms into the environment where they may continue to grow in an uncontrollable manner has led to the introduction of legal restrictions on the use of genetically modified organisms in the field in many countries.",
@@ -260,6 +270,7 @@
         "$ref": "#/texts/0"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "It has been suggested, to avoid the problems discussed above, to use genetically modified bioluminescent microorganisms which have been treated so that they retain the metabolic function of bioluminescence but an no longer reproduce. The use of radiation (gamma-radiation), X-rays or an electron beam) to kill bioluminescent cells whilst retaining the metabolic function of bioluminescence is demonstrated in International patent application number WO 95/07346. It is an object of the present invention to provide an alternative method of killing bioluminescent cells whilst retaining the metabolic function of bioluminescence which does not require the use of radiation and, as such, can be easily carried out without the need for specialized radiation equipment and containment facilities and without the risk to laboratory personnel associated with the use of radiation.",
@@ -271,6 +282,7 @@
         "$ref": "#/texts/0"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Accordingly, in a first aspect the invention provides a method of making a non-viable preparation of prokaryotic or eukaryotic cells, which preparation has a signal-generating metabolic activity, which method comprises contacting a viable culture of cells with signal-generating metabolic activity with a member of the bleomycin/phleomycin family of antibiotics.",
@@ -282,6 +294,7 @@
         "$ref": "#/texts/0"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Bleomycin and phleomycin are closely related glycopeptide antibiotics that are isolated in the form of copper chelates from cultures of Streptomyces verticillus. They represent a group of proteins with molecular weights ranging from 1000 to 1000 kda that are potent antibiotics and anti-tumour agents. So far more than 200 members of the bleomycin/phleomycin family have been isolated and characterised as complex basic glycopeptides. Family members resemble each other with respect to their physicochemical properties and their structure, indicating that functionally they all behave in the same manner. Furthermore, the chemical structure of the active moiety is conserved between family members and consists of 5 amino acids, L-glucose, 3-O-carbamoyl-D-mannose and a terminal cation. The various different bleomycin/phleomycin family members differ from each other in the nature of the terminal cation moiety, which is usually an amine. A preferred bleomycin/phleomycin antibiotic for use in the method of the invention is phleomycin D1, sold under the trade name Zeocin\u2122.",
@@ -293,6 +306,7 @@
         "$ref": "#/texts/0"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Bleomycin and phleomycin are strong, selective inhibitors of DNA synthesis in intact bacteria and in mammalian cells. Bleomycin can be observed to attack purified DNA in vitro when incubated under appropriate conditions and analysis of the bleomycin damaged DNA shows that both single-stranded and double-stranded cleavages occur, the latter being the result of staggered single strand breaks formed approximately two base pairs apart in the complementary strands.",
@@ -304,6 +318,7 @@
         "$ref": "#/texts/0"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "In in vivo systems, after being taken up by the cell, bleomycin enters the cell nucleus, binds to DNA (by virtue of the interaction between its positively charged terminal amine moiety and a negatively charged phosphate group of the DNA backbone) and causes strand scission. Bleomycin causes strand scission of DNA in viruses, bacteria and eukaryotic cell systems.",
@@ -315,6 +330,7 @@
         "$ref": "#/texts/0"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "The present inventors have surprisingly found that treatment of a culture of cells with signal-generating metabolic activity with a bleomycin/phleomycin antibiotic renders the culture non-viable whilst retaining a level of signal-generating metabolic activity suitable for use in toxicity testing applications. In the context of this application the term non-viable is taken to mean that the cells are unable to reproduce. The process of rendering cells non-viable whilst retaining signal-generating metabolic activity may hereinafter be referred to as \u2018inactivation\u2019 and cells which have been rendered non-viable according to the method of the invention may be referred to as \u2018inactivated\u2019.",
@@ -326,6 +342,7 @@
         "$ref": "#/texts/0"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Because of the broad spectrum of action of the bleomycin/phleomycin family of antibiotics the method of the invention is equally applicable to bacterial cells and to eukaryotic cells with signal generating metabolic activity. Preferably the signal-generating metabolic activity is bioluminescence but other signal-generating metabolic activities which are reporters of toxic damage could be used with equivalent effect.",
@@ -337,6 +354,7 @@
         "$ref": "#/texts/0"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "The method of the invention is preferred for use with bacteria or eukaryotic cells that have been genetically modified to express a signal-generating metabolic activity. The examples given below relate to E. coil which have been engineered to express bioluminescence by transformation with a plasmid carrying lux genes. The eukaryotic equivalent would be cells transfected with a vector containing nucleic acid encoding a eukaryotic luciferase enzyme (abbreviated luc) such as, for example, luciferase from the firefly Photinus pyralis. A suitable plasmid vector containing cDNA encoding firefly luciferase under the control of an SV40 viral promoter is available from Promega Corporation, Madison Wis., USA. However, in connection with the present invention it is advantageous to use recombinant cells containing the entire eukaryotic luc operon so as to avoid the need to add an exogenous substrate ( e.g. luciferin) in order to generate light output.",
@@ -348,6 +366,7 @@
         "$ref": "#/texts/0"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "The optimum concentration of bleomycin/phleomycin antibiotic and contact time required to render a culture of cells non-viable whilst retaining a useful level of signal-generating metabolic activity may vary according to the cell type but can be readily determined by routine experiment. In general, the lower the concentration of antibiotic used the longer the contact time required for cell inactivation. In connection with the production of assay reagents for use in toxicity testing applications, it is generally advantageous to keep the concentration of antibiotic low (e.g. around 1-1.5 mg/ml) and increase the contact time for inactivation. As will be shown in Example 1, treatment with Zeocin\u2122 at a concentration of 1.5 mg/ml for 3 to 5 hours is sufficient to completely inactivate a culture of recombinant E. coli.",
@@ -359,6 +378,7 @@
         "$ref": "#/texts/0"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "In the case of bacteria, the contact time required to inactivate a culture of bacterial cells is found to vary according to the stage of growth of the bacterial culture at the time the antibiotic is administered. Although the method of the invention can be used on bacteria at all stages of growth it is generally preferable to perform the method on bacterial cells in an exponential growth phase because the optimum antibiotic contact time has been observed to be shortest when the antibiotic is administered to bacterial cells in an exponential growth phase.",
@@ -370,6 +390,7 @@
         "$ref": "#/texts/0"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Following treatment with bleomycin/phleomycin antibiotic the non-viable preparation of cells is preferably stabilised for ease of storage or shipment. The cells can be stabilised using known techniques such as, for example, freeze drying (lyophilization) or other cell preservation techniques known in the art. Stabilization by freeze drying has the added advantage that the freeze drying procedure itself can render cells non-viable. Thus, any cells in the preparation which remain viable after treatment of the culture with bleomycin/phleomycin antibiotic will be rendered non-viable by freeze drying. It is thought that freeze drying inactivates any remaining viable cells by enhancing the effect of antibiotic, such that sub-lethally injured cells in the culture are more sensitive to the stresses applied during freeze drying.",
@@ -381,6 +402,7 @@
         "$ref": "#/texts/0"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Prior to use the stabilised cell preparation is reconstituted using a reconstitution buffer to form an assay reagent. This reconstituted assay reagent may then be used directly in assays for analytes, for example in toxicity testing applications. It is preferable that the stabilised (i.e. freeze dried) assay reagent be reconstituted immediately prior to use, but after reconstitution it is generally necessary to allow sufficient time prior to use for the reconstituted reagent to reach a stable, high level of signal-generating activity. Suitable reconstitution buffers preferably contain an osmotically potent non-salt compound such as sucrose, dextran or polyethylene glycol, although salt based stabilisers may also be used.",
@@ -392,6 +414,7 @@
         "$ref": "#/texts/0"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Whilst the assay reagent of the invention is particularly suitable for use in toxicity testing applications it is to be understood that the invention is not limited to assay reagents for use in toxicity testing. The cell inactivation method of the invention can be used to inactivate any recombinant cells (prokaryotic or eukaryotic) with a signal generating metabolic activity that is not dependent upon cell viability.",
@@ -403,6 +426,7 @@
         "$ref": "#/texts/0"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "In a further aspect the invention provides a method of assaying a potentially toxic analyte comprising the steps of,",
@@ -414,6 +438,7 @@
         "$ref": "#/texts/0"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "(a) contacting a sample to be assayed for the analyte with a sample of assay reagent comprising a non-viable preparation of cells with a signal-generating metabolic activity;",
@@ -425,6 +450,7 @@
         "$ref": "#/texts/0"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "(b) measuring the level of signal generated; and",
@@ -436,6 +462,7 @@
         "$ref": "#/texts/0"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "(c) using the measurement obtained as an indicator of the toxicity of the analyte.",
@@ -447,6 +474,7 @@
         "$ref": "#/texts/0"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "In a still further aspect, the invention provides a kit for performing the above-stated assay comprising an assay reagent with signal generating metabolic activity and means for contacting the assay reagent with a sample to be assayed for an analyte.",
@@ -458,6 +486,7 @@
         "$ref": "#/texts/0"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "The analytes tested using the assay of the invention are usually toxic substances, but it is to be understood that the precise nature of the analyte to be tested is not material to the invention.",
@@ -469,6 +498,7 @@
         "$ref": "#/texts/0"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Toxicity is a general term used to describe an adverse effect on biological system and the term \u2018toxic substances\u2019 includes both toxicants (synthetic chemicals that are toxic) and toxins (natural poisons). Toxicity is usually expressed as an effective concentration (EC) or inhibitory concentration (IC) value. The EC/IC value is usually denoted as a percentage response e.g. EC\u2085\u2080, EC\u2081\u2080 which denotes the concentration (dose) of a particular substance which affects the designated criteria for assessing toxicity (i.e. a behavioural trait or death) in the indicated proportion of the population tested. For example, an EC\u2085\u2080 of 10 ppm indicates that 50% of the population will be affected by a concentration of 10 ppm. In the case of a toxicity assay based on the use of a bioluminescent assay reagent, the EC\u2085\u2080 value is usually the concentration of sample substance causing a 50% change in light output.",
@@ -480,6 +510,7 @@
         "$ref": "#/texts/0"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "The present invention will be further understood by way of the following Examples with reference to the accompanying Figures in which:",
@@ -491,6 +522,7 @@
         "$ref": "#/texts/0"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "FIG. 1 is a graph to show the effect of Zeocin\u2122 treatment on viable count and light output of recombinant bioluminescent E. coil cells.",
@@ -502,6 +534,7 @@
         "$ref": "#/texts/0"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "FIG. 2 is a graph to show the light output from five separate vials of reconstituted assay reagent. The assay reagent was prepared from recombinant bioluminescent E. coil exposed to 1.5 mg/ml Zeocin\u2122 for 300 minutes. Five vials were used to reduce discrepancies resulting from vial to vial variation.",
@@ -513,6 +546,7 @@
         "$ref": "#/texts/0"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "FIGS. 3 to 8 are graphs to show the effect of Zeocin\u2122 treatment on the sensitivity of bioluminescent assay reagent to toxicant (ZnSO\u2084):",
@@ -524,6 +558,7 @@
         "$ref": "#/texts/0"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "FIG. 3: Control cells, lag phase.",
@@ -535,6 +570,7 @@
         "$ref": "#/texts/0"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "FIG. 4: Zeocin\u2122 treated cells, lag phase.",
@@ -546,6 +582,7 @@
         "$ref": "#/texts/0"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "FIG. 5: Control cells, mid-exponential growth.",
@@ -557,6 +594,7 @@
         "$ref": "#/texts/0"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "FIG. 6: Zeocin\u2122 treated cells, mid-exponential growth.",
@@ -568,6 +606,7 @@
         "$ref": "#/texts/0"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "FIG. 7: Control cells, stationary phase.",
@@ -579,6 +618,7 @@
         "$ref": "#/texts/0"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "FIG. 8: Zeocin\u2122 treated cells, stationary phase.",
@@ -590,6 +630,7 @@
         "$ref": "#/texts/0"
       },
       "children": [],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
       "orig": "EXAMPLE 1",
@@ -621,6 +662,7 @@
           "$ref": "#/texts/45"
         }
       ],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
       "orig": "(A) Inactivation of Bioluminescent E. coil Method",
@@ -633,6 +675,7 @@
         "$ref": "#/texts/39"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "1. Bioluminescent genetically modified E. coil strain HB101 (E. coli HB101 made bioluminescent by transformation with a plasmid carrying the lux operon of Vibrio fischeri constructed by the method of Shaw and Kado, as described in Biotechnology 4: 560-564) were grown from a frozen stock in 5 ml of low salt medium (LB (5 g/ml NaCl)+glycerol+MgSO\u2084) for 24 hours.",
@@ -644,6 +687,7 @@
         "$ref": "#/texts/39"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "2. 1 ml of the 5 ml culture was then used to inoculate 200 ml of low salt medium in a shaker flask and the resultant culture grown to an OD\u2086\u2083\u2080 of 0.407 (exponential growth phase).",
@@ -655,6 +699,7 @@
         "$ref": "#/texts/39"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "3. 50 ml of this culture was removed to a fresh sterile shaker flask (control cells).",
@@ -666,6 +711,7 @@
         "$ref": "#/texts/39"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "4. Zeocin\u2122 was added to the 150 ml of culture in the original shaker flash, to a final concentration of 1.5 mg/ml. At the same time, an equivalent volume of water was added to the 50 ml culture removed from the original flask (control cells).",
@@ -677,6 +723,7 @@
         "$ref": "#/texts/39"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "5. The time course of cell inactivation was monitored by removing samples from the culture at 5, 60, 120, 180, 240 and 300 minutes after the addition of Zeocin\u2122 and taking measurements of both light output (measured using a Deltatox luminometer) and viable count (per ml, determined using the method given in Example 3 below) for each of the samples. Samples of the control cells were removed at 5 and 300 minutes after the addition of water and measurements of light output and viable count taken as for the Zeocin\u2122 treated cells.",
@@ -688,6 +735,7 @@
         "$ref": "#/texts/39"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "FIG. 1 shows the effect of Zeocin\u2122 treatment on the light output and viable count (per ml) of recombinant bioluminescent E. coil. Zeocin\u2122 was added to a final concentration of 1.5 mg/ml at time zero. The number of viable cells in the culture was observed to decrease with increasing contact cells with Zeocin\u2122, the culture being completely inactivated after 3 hours. The light output from the culture was observed to decrease gradually with increasing Zeocin\u2122 contact time.",
@@ -709,6 +757,7 @@
           "$ref": "#/texts/49"
         }
       ],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
       "orig": "(B) Production of Assay Reagent",
@@ -721,6 +770,7 @@
         "$ref": "#/texts/46"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Five hours after the addition of Zeocin\u2122 or water the remaining bacterial cells in the Zeocin\u2122 treated and control cultures were harvested by the centrifugation, washed (to remove traces of Zeocin\u2122 from the Zeocin\u2122 treated culture), re-centrifuged and resuspended in cryoprotectant to an OD\u2086\u2083\u2080 of 0.25. 200 \u03bcl aliquots of the cells in cryoprotectant were dispensed into single shot vials, and freeze dried. Freeze dried samples of the Zeocin\u2122 treated cells and control cells were reconstituted in 0.2M sucrose to form assay reagents and the light output of the assay reagents measured at various times after reconstitution.",
@@ -732,6 +782,7 @@
         "$ref": "#/texts/46"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "The light output from assay reagent prepared from cells exposed to 1.5 mg/ml Zeocin\u2122 for 5 hours was not significantly different to the light output from assay reagent prepared from control (Zeocin\u2122 untreated) cells, indicating that Zeocin\u2122 treatment does not affect the light output of the reconstituted freeze dried assay reagent. Both Zeocin\u2122 treated and Zeocin\u2122 untreated assay reagents produced stable light output 15 minutes after reconstitution.",
@@ -743,6 +794,7 @@
         "$ref": "#/texts/46"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "FIG. 2 shows the light output from five separate vials of reconstituted Zeocin\u2122 treated assay reagent inactivated according to the method of Example 1(A) and processed into assay reagent as described in Example 1(B). Reconstitution solution was added at time zero and thereafter light output was observed to increase steadily before stabilising out at around 15 minutes after reconstitution. All five vials were observed to give similar light profiles after reconstitution.",
@@ -754,6 +806,7 @@
         "$ref": "#/texts/0"
       },
       "children": [],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
       "orig": "EXAMPLE 2",
@@ -845,6 +898,7 @@
           "$ref": "#/texts/76"
         }
       ],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
       "orig": "Sensitivity of Zeocin\u2122 Treated Assay Reagent to Toxicant Method",
@@ -857,6 +911,7 @@
         "$ref": "#/texts/51"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "1. Bioluminescent genetically modified E. coil strain HB101 (E. coli HB101 made bioluminescent by transformation with a plasmid carrying the lux operon of vibrio fischeri constructed by the method of Shaw and Kado, as described in Biotechnology 4: 560-564) was grown in fermenter as a batch culture in low salt medium (LB(5 g/ml NaCl)+glycerol+MgSO\u2084).",
@@ -868,6 +923,7 @@
         "$ref": "#/texts/51"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "2. Two aliquots of the culture were removed from the fermenter into separate sterile shaker flasks at each of three different stages of growth i.e. at OD\u2086\u2083\u2080 values of 0.038 (lag phase growth), 1.31 (mid-exponential phase growth) and 2.468 (stationary phase growth).",
@@ -879,6 +935,7 @@
         "$ref": "#/texts/51"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "3. One aliquot of culture for each of the three growth stages was inactivated by contact with Zeocin\u2122 (1 mg Zeocin\u2122 added per 2.5\u00d710\u2076 cells, i.e. the concentration of Zeocin\u2122 per cell is kept constant) for 300 minutes and then processed into assay reagent by freeze drying and reconstitution, as described in part (B) of Example 1.",
@@ -890,6 +947,7 @@
         "$ref": "#/texts/51"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "4. An equal volume of water was added to the second aliquot of culture for each of the three growth stages and the cultures processed into assay reagent as described above.",
@@ -901,6 +959,7 @@
         "$ref": "#/texts/51"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "5. Samples of each of the three Zeocin\u2122 treated and three control assay reagents were then evaluated for sensitivity to toxicant (ZnSO\u2084) according to the following assay protocol:",
@@ -912,6 +971,7 @@
         "$ref": "#/texts/51"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "ZnSO\u2084 Sensitivity Assay",
@@ -923,6 +983,7 @@
         "$ref": "#/texts/51"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "1. ZnSO\u2084 solutions were prepared in pure water at 30, 10, 3, 1, 0.3 and 0.1 ppm. Pure water was also used as a control.",
@@ -934,6 +995,7 @@
         "$ref": "#/texts/51"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "2. Seven vials of each of the three Zeocin\u2122 treated and each of the three control assay reagents (i.e. one for each of the six ZnSO\u2084 solutions and one for the pure water control) were reconstituted using 0.5 ml of reconstitution solution (eg 0.2M sucrose) and then left to stand at room temperature for 15 minutes to allow the light output to stabilize. Base line (time zero) readings of light output were then measured for each of the reconstituted reagents.",
@@ -945,6 +1007,7 @@
         "$ref": "#/texts/51"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "3. 0.5 ml aliquots of each of the six ZnSO\u2084 solutions and the pure water control were added to separate vials of reconstituted assay reagent. This was repeated for each of the different Zeocin\u2122 treated and control assay reagents.",
@@ -956,6 +1019,7 @@
         "$ref": "#/texts/51"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "4. The vials were incubated at room temperature and light output readings were taken 5, 10, 15, 20, 25 and 30 minutes after addition of ZnSO\u2084 solution.",
@@ -967,6 +1031,7 @@
         "$ref": "#/texts/51"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "5. The % toxic effect for each sample was calculated as follows:",
@@ -978,6 +1043,7 @@
         "$ref": "#/texts/51"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "where: C\u2092=light in control at time zero",
@@ -989,6 +1055,7 @@
         "$ref": "#/texts/51"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Ct=light in control at reading time",
@@ -1000,6 +1067,7 @@
         "$ref": "#/texts/51"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "S\u2092=light in sample at time zero",
@@ -1011,6 +1079,7 @@
         "$ref": "#/texts/51"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "St=light in sample at reading time",
@@ -1022,6 +1091,7 @@
         "$ref": "#/texts/51"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "The results of toxicity assays for sensitivity to ZnSO\u2084 for all the Zeocin\u2122 treated and control assay reagents are shown in FIGS. 3 to 8:",
@@ -1033,6 +1103,7 @@
         "$ref": "#/texts/51"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "FIG. 3: Control cells, lag phase.",
@@ -1044,6 +1115,7 @@
         "$ref": "#/texts/51"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "FIG. 4: Zeocin\u2122 treated cells, lag phase.",
@@ -1055,6 +1127,7 @@
         "$ref": "#/texts/51"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "FIG. 5: Control cells, mid-exponential growth.",
@@ -1066,6 +1139,7 @@
         "$ref": "#/texts/51"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "FIG. 6: Zeocin\u2122 treated cells, mid-exponential growth.",
@@ -1077,6 +1151,7 @@
         "$ref": "#/texts/51"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "FIG. 7: Control cells, stationary phase.",
@@ -1088,6 +1163,7 @@
         "$ref": "#/texts/51"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "FIG. 8: Zeocin\u2122 treated cells, stationary phase.",
@@ -1099,6 +1175,7 @@
         "$ref": "#/texts/51"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "In each case, separate graphs of % toxic effect against log\u2081\u2080 concentration of ZnSO\u2084 were plotted on the same axes for each value of time (minutes) after addition of Zeocin\u2122 or water. The sensitivities of the various reagents, expressed as an EC\u2085\u2080 value for 15 minutes exposed to ZnSO\u2084, are summarised in Table 1 below.",
@@ -1110,6 +1187,7 @@
         "$ref": "#/texts/51"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Table 1: Sensitivity of the different assay reagents to ZnSo\u2084 expressed as EC\u2085\u2080 values for 15 minutes exposure to ZNSO\u2084.",
@@ -1121,6 +1199,7 @@
         "$ref": "#/texts/51"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "The results of the toxicity assays indicate that Zeocin\u2122 treatment does not significantly affect the sensitivity of a recombinant bioluminescent E. coli derived assay reagent to ZnSO\u2084. Similar results could be expected with other toxic substances which have an effect on signal-generating metabolic activities.",
@@ -1132,6 +1211,7 @@
         "$ref": "#/texts/0"
       },
       "children": [],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
       "orig": "EXAMPLE 3",
@@ -1160,6 +1240,7 @@
           "$ref": "#/texts/83"
         }
       ],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
       "orig": "Method to Determine Viable Count",
@@ -1172,6 +1253,7 @@
         "$ref": "#/texts/78"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "1. Samples of bacterial culture to be assayed for viable count were centrifuged at 10,000 rpm for 5 minutes to pellet the bacterial cells.",
@@ -1183,6 +1265,7 @@
         "$ref": "#/texts/78"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "2. Bacterial cells were washed by resuspending in 1 ml of M9 medium, re-centrifuged at 10,000 rpm for 5 minutes and finally re-suspended in 1 ml of M9 medium.",
@@ -1194,6 +1277,7 @@
         "$ref": "#/texts/78"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "3. Serial dilutions of the bacterial cell suspension from 10\u207b\u00b9 to 10\u207b\u2077 were prepared in M9 medium.",
@@ -1205,6 +1289,7 @@
         "$ref": "#/texts/78"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "4. Three separate 10 \u03bcl aliquots of each of the serial dilutions were plated out on standard agar plates and the plates incubated at 37\u00b0 C.",
@@ -1216,6 +1301,7 @@
         "$ref": "#/texts/78"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "5. The number of bacterial colonies present for each of the three aliquots at each of the serial dilutions were counted and the values averaged. Viable count was calculated per ml of bacterial culture.",
@@ -1279,6 +1365,7 @@
           "$ref": "#/texts/101"
         }
       ],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
       "orig": "CLAIMS",
@@ -1291,6 +1378,7 @@
         "$ref": "#/texts/84"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "1. A method of making a non-viable preparation of prokaryotic or eukaryotic cells, which preparation has a signal-generating metabolic activity, which method comprises contacting a viable culture of said cells having signal-generating metabolic activity with an antibiotic selected from the bleomycin/phleomycin family of antibiotics.",
@@ -1302,6 +1390,7 @@
         "$ref": "#/texts/84"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "2. The method as claimed in claim 1 wherein following contact with antibiotic, said cells are subjected to a stabilization step.",
@@ -1313,6 +1402,7 @@
         "$ref": "#/texts/84"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "3. The method as claimed in claim 2 wherein said stabilization step comprises freeze drying.",
@@ -1324,6 +1414,7 @@
         "$ref": "#/texts/84"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "4. The method as claimed in claim 1 wherein said antibiotic is phleomycin D1.",
@@ -1335,6 +1426,7 @@
         "$ref": "#/texts/84"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "5. The method as claimed in claim 5 wherein said signal-generating metabolic activity is bioluminescence.",
@@ -1346,6 +1438,7 @@
         "$ref": "#/texts/84"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "6. The method as claimed in claim 5 wherein said cells are bacteria.",
@@ -1357,6 +1450,7 @@
         "$ref": "#/texts/84"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "7. The method as claimed in claim 6 wherein said bacteria are in an exponential growth phase when contacted with said antibiotic.",
@@ -1368,6 +1462,7 @@
         "$ref": "#/texts/84"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "8. The method as claimed in claim 6 wherein said bacteria are genetically modified.",
@@ -1379,6 +1474,7 @@
         "$ref": "#/texts/84"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "9. The method as claimed in claim 8 wherein said genetically modified bacteria contain nucleic acid encoding luciferase.",
@@ -1390,6 +1486,7 @@
         "$ref": "#/texts/84"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "10. The method as claimed in claim 9 wherein said bacteria are E. coli.",
@@ -1401,6 +1498,7 @@
         "$ref": "#/texts/84"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "11. The method as claimed in claim 5 wherein said cells are eukaryotic cells.",
@@ -1412,6 +1510,7 @@
         "$ref": "#/texts/84"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "12. The method as claimed in claim 11 wherein said eukaryotic cells are genetically modified.",
@@ -1423,6 +1522,7 @@
         "$ref": "#/texts/84"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "13. The method as claimed in claim 12 wherein said genetically modified eukaryotic cells contain nucleic acid encoding luciferase.",
@@ -1434,6 +1534,7 @@
         "$ref": "#/texts/84"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "14. A method of making a non-viable preparation of prokaryotic cells, which preparation has a signal-generating metabolic activity, which method comprises contacting a viable culture of a genetically modified E. coli strain made bioluminescent by transformation with a plasmid carrying the lux operon of Vibrio fischeri with an antibiotic selected from the bleomycin/phleomycin family of antibiotics.",
@@ -1445,6 +1546,7 @@
         "$ref": "#/texts/84"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "15. The method as claimed in claim 14 wherein said cells are contacted with phleomycin D1 at a concentration of at least about 1.5 mg/ml.",
@@ -1456,6 +1558,7 @@
         "$ref": "#/texts/84"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "16. The method as claimed in claim 15 wherein said contact is maintained for at least about 3 hours.",
@@ -1467,6 +1570,7 @@
         "$ref": "#/texts/84"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "17. The method as claimed in claim 16 wherein said antibiotic-treated cells are harvested, washed and freeze-dried.",
@@ -1478,6 +1582,7 @@
         "$ref": "#/body"
       },
       "children": [],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
       "orig": "Drawings",
@@ -1493,6 +1598,7 @@
         "$ref": "#/texts/51"
       },
       "children": [],
+      "content_layer": "body",
       "label": "table",
       "prov": [],
       "captions": [],
@@ -2025,5 +2131,6 @@
     }
   ],
   "key_value_items": [],
+  "form_items": [],
   "pages": {}
 }
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v2/pftaps057006474.json b/tests/data/groundtruth/docling_v2/pftaps057006474.json
index e27e9985..abdb474f 100644
--- a/tests/data/groundtruth/docling_v2/pftaps057006474.json
+++ b/tests/data/groundtruth/docling_v2/pftaps057006474.json
@@ -1,6 +1,6 @@
 {
   "schema_name": "DoclingDocument",
-  "version": "1.0.0",
+  "version": "1.1.0",
   "name": "pftaps057006474.txt",
   "origin": {
     "mimetype": "text/plain",
@@ -10,6 +10,7 @@
   "furniture": {
     "self_ref": "#/furniture",
     "children": [],
+    "content_layer": "furniture",
     "name": "_root_",
     "label": "unspecified"
   },
@@ -20,6 +21,7 @@
         "$ref": "#/texts/0"
       }
     ],
+    "content_layer": "body",
     "name": "_root_",
     "label": "unspecified"
   },
@@ -50,6 +52,7 @@
           "$ref": "#/texts/54"
         }
       ],
+      "content_layer": "body",
       "label": "title",
       "prov": [],
       "orig": "Carbocation containing cyanine-type dye",
@@ -65,6 +68,7 @@
           "$ref": "#/texts/2"
         }
       ],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
       "orig": "ABSTRACT",
@@ -77,6 +81,7 @@
         "$ref": "#/texts/1"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "To provide a reagent with excellent stability under storage, which can detect a subject compound to be measured with higher specificity and sensitibity.",
@@ -119,6 +124,7 @@
           "$ref": "#/texts/13"
         }
       ],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
       "orig": "BACKGROUND OF THE INVENTION",
@@ -131,6 +137,7 @@
         "$ref": "#/texts/3"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "1. Field of the Invention",
@@ -142,6 +149,7 @@
         "$ref": "#/texts/3"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "The present invention relates to a labeled complex for microassay using near-infrared radiation. More specifically, the present invention relates to a labeled complex capable of specifically detecting a certain particular component in a complex mixture with a higher sensitivity.",
@@ -153,6 +161,7 @@
         "$ref": "#/texts/3"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "2. Related Background Art",
@@ -164,6 +173,7 @@
         "$ref": "#/texts/3"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "On irradiating a laser beam on a trace substance labeled with dyes and the like, information due to the substance is generated such as scattered light, absorption light, fluorescent light and furthermore light acoustics. It is widely known in the field of analysis using lasers, to detect such information so as to practice microassays rapidly with a higher precision.",
@@ -175,6 +185,7 @@
         "$ref": "#/texts/3"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "A gas laser represented by an argon laser and a helium laser has conventionally been used exclusively as a laser source. In recent years, however, a semi-conductor laser has been developed, and based on the characteristic features thereof such as inexpensive cost, small scale and easy output control, it is now desired to use the semiconductor laser as a light source.",
@@ -186,6 +197,7 @@
         "$ref": "#/texts/3"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "If diagnostically useful substances from living organisms are assayed by means of the wave-length in ultraviolet and visible regions as has conventionally been used, the background (blank) via the intrinsic fluorescence of naturally occurring products, such as flavin, pyridine coenzyme and serum proteins, which are generally contained in samples, is likely to increase. Only if a light source in a near-infrared region can be used, such background from naturally occurring products can be eliminated so that the sensitivity to substances to be measured might be enhanced, consequently.",
@@ -197,6 +209,7 @@
         "$ref": "#/texts/3"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "However, the oscillation wavelength of a semiconductor laser is generally in red and near-infrared regions (670 to 830 nm), where not too many dyes generate fluorescence via absorption or excitation. A representative example of such dyes is polymethine-type dye having a longer conjugated chain. Examples of labeling substances from living organisms with a polymethine-type dye and using the labeled substances for microanalysis are reported by K. Sauda, T. Imasaka, et al. in the report in Anal. Chem., 58, 2649-2653 (1986), such that plasma protein is labeled with a cyanine dye having a sulfonate group (for example, Indocyanine Green) for the analysis by high-performance liquid chromatography.",
@@ -208,6 +221,7 @@
         "$ref": "#/texts/3"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Japanese Patent Application Laid-open No. 2-191674 discloses that various cyanine dyes having sulfonic acid groups or sulfonate groups are used for labeling substances from living organisms and for detecting the fluorescence.",
@@ -219,6 +233,7 @@
         "$ref": "#/texts/3"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "However, these known cyanine dyes emitting fluorescence via absorption or excitation in the near-infrared region are generally not particularly stable under light or heat.",
@@ -230,6 +245,7 @@
         "$ref": "#/texts/3"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "If the dyes are used as labeling agents and bonded to substances from living organisms such as antibodies for preparing complexes, the complexes are likely to be oxidized easily by environmental factors such as light, heat, moisture, atmospheric oxygen and the like or to be subjected to modification such as generating cross-links. Particularly in water, a modification such as hydrolysis is further accelerated, disadvantageously. Therefore, the practical use of these complexes as detecting reagents in carrying out the microassay of the components of living organisms has encountered difficulties because of their poor stability under storage.",
@@ -257,6 +273,7 @@
           "$ref": "#/texts/19"
         }
       ],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
       "orig": "SUMMARY OF THE INVENTION",
@@ -269,6 +286,7 @@
         "$ref": "#/texts/14"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "The present inventors have made various investigations so as to solve the above problems, and have found that a dye of a particular structure, more specifically a particular polymethine dye, and among others, a dye having an azulene skelton, are extremely stable even after the immobilization thereof as a labeling agent onto substances from living organisms. Thus, the inventors have achieved the present invention. It is an object of the present invention to provide a labeled complex with excellent storage stability which can overcome the above problems.",
@@ -280,6 +298,7 @@
         "$ref": "#/texts/14"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "According to an aspect of the present invention, there is provided a labeled complex for detecting a subject compound to be analyzed by means of optical means using near-infrared radiation which complex comprises a substance from a living organism and a labeling agent fixed onto the substance and is bonded to the subject compound to be analyzed, wherein the labeling agent comprises a compound represented by the general formula (I), (II) or (III): wherein R.sub.1 through R.sub.7 are independently selected from the group consisting of hydrogen atom, halogen atom, alkyl group, aryl group, aralkyl group, sulfonate group, amino group, styryl group, nitro group, hydroxyl group, carboxyl group, cyano group, or arylazo group; R.sub.1 through R.sub.7 may be bonded to each other to form a substituted or an unsubstituted condensed ring; R.sub.1 represents a divalent organic residue; and X.sub.1.sup..crclbar. represents an anion; wherein R.sub.8 through R14 are independently selected from the group consisting of hydrogen atom, halogen atom, alkyl group, aryl group, aralkyl group, sulfonate group, amino group, styryl group, nitro group, hydroxyl group, carboxyl group, cyano group, or arylazo group; R.sub.8 through R14 may be bonded to each other to form a substituted or an unsubstituted condensed ring; and R.sub.A represents a divalent organic residue; wherein R.sub.15 through R.sub.21 are independently selected from the group consisting of hydrogen atom, halogen atom, alkyl group, aryl group, a substituted or an unsubstituted aralkyl group, a substituted or an unsubstituted amino group, a substituted or an unsubstituted styryl group, nitro group, sulfonate group, hydroxyl group, carboxyl group, cyano group, or arylazo group; R.sub.15 through R.sub.21 may or may not be bonded to each other to form a substituted or an unsubstituted condensed ring; R.sub.B represents a divalent organic residue; and X.sub.1.sup..crclbar. represents an anion.",
@@ -291,6 +310,7 @@
         "$ref": "#/texts/14"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "According to another aspect of the present invention, there is provided a labeled complex for detecting a subject compound to be analyzed by means of optical means using near-infrared radiation which complex comprises a substance from a living organism and a labeling agent fixed onto the substance and is bonded to the subject compound to be analyzed, wherein the labeling agent comprises a compound represented by the general formula (IV): wherein A, B, D and E are independently selected from the group consisting of hydrogen atom, a substituted or an unsubstituted alkyl group having two or more carbon atoms, alkenyl group, aralkyl group, aryl group, styryl group and heterocyclic group; r.sub.1 ' and r.sub.2 ' are individually selected from the group consisting of hydrogen atom, a substituted or an unsubstituted alkyl group, cyclic alkyl group, alkenyl group, aralkyl group and aryl group; k is 0 or 1; 1 is 0, 1 or 2; and X.sub.2.sup..crclbar.  represents an anion.",
@@ -302,6 +322,7 @@
         "$ref": "#/texts/14"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "According to another aspect of the present invention, there is provided a method of detecting a subject compound to be analyzed by means of optical means which method comprises using a labeled complex comprised of a substance from a living organism and a labeling agent fixed onto the substance and bonding the complex to the subject compound to be analyzed, wherein the labeling agent comprises a compound represented by the general formula (I), (II) or (III).",
@@ -313,6 +334,7 @@
         "$ref": "#/texts/14"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "According to still another aspect of the present invention, there is provided a method of detecting a subject compound to be analyzed by means of optical means which method comprises using a labeled complex comprised of a substance from a living organism and a labeling agent fixed onto the substance and bonding the complex to the subject compound to be analyzed, wherein the labeling agent comprises a compound represented by the general formula (iv).",
@@ -328,6 +350,7 @@
           "$ref": "#/texts/21"
         }
       ],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
       "orig": "BRIEF DESCRIPTION OF THE DRAWINGS",
@@ -340,6 +363,7 @@
         "$ref": "#/texts/20"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "FIG. 1 depicts one example of fluorescence emitting wave form of a labeling agent.",
@@ -445,6 +469,7 @@
           "$ref": "#/texts/53"
         }
       ],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
       "orig": "DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS",
@@ -457,6 +482,7 @@
         "$ref": "#/texts/22"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "The present invention will now be explained in detail hereinbelow.",
@@ -468,6 +494,7 @@
         "$ref": "#/texts/22"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "In accordance with the present invention, the compound of the general formula (I), (II) or (III) is employed as a labeling agent, wherein R.sub.1 to R.sub.21 individually represent hydrogen atom, halogen atom (chlorine atom, bromine atom, and iodine atom) or a monovalent organic residue, and other such functional groups described above. The monovalent organic residue can be selected from a wide variety of such residues.",
@@ -479,6 +506,7 @@
         "$ref": "#/texts/22"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "The alkyl group is preferably in straight chain or branched chain, having a carbon number of 1 to 12, such as for example methyl group, ethyl group, n-propyl group, iso-propyl group, n-butyl group, sec-butyl group, iso-butyl group, t-butyl group, n-amyl group, t-amyl group, n-hexyl group, n-octyl group, t-octyl group and the like.",
@@ -490,6 +518,7 @@
         "$ref": "#/texts/22"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "The aryl group preferably has a carbon number of 6 to 20, such as for example phenyl group, naphthyl group, methoxyphenyl group, diethylaminophenyl group, dimethylaminophenyl group and the like.",
@@ -501,6 +530,7 @@
         "$ref": "#/texts/22"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "The substituted aralkyl group preferably has a carbon number of 7 to 19, such as for example carboxybenzyl group, sulfobenzyl group, hydroxybenzyl group and the like.",
@@ -512,6 +542,7 @@
         "$ref": "#/texts/22"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "The unsubstituted aralkyl group preferably has a carbon number of 7 to 19, such as for example benzyl group, phenethyl group, .alpha.-naphthylmethyl group, .beta.-naphthylmethyl group and the like.",
@@ -523,6 +554,7 @@
         "$ref": "#/texts/22"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "The substituted or unsubstituted amino group preferably has a carbon number of 10 or less, such as for example amino group, dimethylamino group, diethylamino group, dipropylamino group, acetylamino group, benzoylamino group and the like.",
@@ -534,6 +566,7 @@
         "$ref": "#/texts/22"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "The substituted or unsubstituted styryl group preferably has a carbon number of 8 to 14, such as for example styryl group, dimethylaminostyryl group, diethylaminostyryl group, dipropylaminostyryl group, methoxystyryl group, ethoxystyryl group, methylstyryl group and the like.",
@@ -545,6 +578,7 @@
         "$ref": "#/texts/22"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "The aryl azo group preferably has a carbon number of 6 to 14, such as for example phenylazo group, .alpha.-naphthylazo group, .beta.-naphthylazo group, dimethylaminophenylazo group, chlorophenylazo group, nitrophenylazo group, methoxyphenylazo group and the like.",
@@ -556,6 +590,7 @@
         "$ref": "#/texts/22"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Of the combinations of R.sub.1 and R.sub.2, R.sub.2 and R.sub.3, R.sub.3 and R.sub.4, R.sub.4 and R.sub.5, R.sub.5 and R.sub.6, and R.sub.6 and R.sub.7 of the general formula (I), at least one combination may form a substituted or an unsubstituted condensed ring. The condensed ring may be five, six or seven membered, including aromatic ring (benzene, naphthalene, chlorobenzene, bromobenzene, methyl benzene, ethyl benzene, methoxybenzene, ethoxybenzene and the like); heterocyclic ring (furan ring, benzofuran ring, pyrrole ring, thiophene ring, pyridine ring, quinoline ring, thiazole ring and the like); and aliphatic ring (dimethylene, trimethylene, tetramethylene and the like). This is the case with the general formulas (II) and (III).",
@@ -567,6 +602,7 @@
         "$ref": "#/texts/22"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "For the general formula (II), at least one combination among the combinations of R.sub.8 and R.sub.9, R.sub.9 and R.sub.10, R.sub.10 and R.sub.11, R.sub.11 and R.sub.12, R.sub.12 and R.sub.13, and R.sub.13 and R.sub.14, may form a substituted or an unsubstituted condensed ring.",
@@ -578,6 +614,7 @@
         "$ref": "#/texts/22"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Also for the general formula (III), at least one combination of the combinations of R.sub.15 and R.sub.16, R.sub.16 and R.sub.17, R.sub.17 and R.sub.18, R.sub.18 and R.sub.19, R.sub.19 and R.sub.20, and R.sub.20 and R.sub.21, may form a substituted or an unsubstituted condensed ring.",
@@ -589,6 +626,7 @@
         "$ref": "#/texts/22"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "In the general formulas (I) to (IV) described above, the general formula (I) is specifically preferable; preference is also given individually to hydrogen atom, alkyl group and sulfonate group in the case of R.sub.1 to R.sub.7 ; hydrogen atom, alkyl group and sulfonate group in the case of R.sub.8 to R.sub.14 ; hydrogen atom, alkyl group and sulfonate group in the case of R.sub.15 to R.sub.21 ; alkyl group and aryl group in the case of A, B, D and E; hydrogen atom and alkyl group in the case Of r.sub.1 ' to r.sub.2 '.",
@@ -600,6 +638,7 @@
         "$ref": "#/texts/22"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "In the general formula (I), R represents a divalent organic residue bonded via a double bond. Specific examples of a compound containing such R to be used in the present invention, include those represented by the following general formulas (1) to (12), wherein Q.sup..sym. represents the following azulenium salt nucleus and the right side excluding Q.sup..sym. represents R. wherein the relation between the azulenium salt nucleus represented by Q.sup..crclbar.  and the azulene salt nucleus on the right side in the formula (3) may be symmetric or asymmetric. In the above formulas (1) to (12) as in the case of R.sub.1 to R.sub.7, R.sub.1 ' to R.sub.7 ' and R.sub.1 \" to R.sub.7 \" independently represent hydrogen atom, halogen atom, alkyl group, aryl group, aralkyl group, amino group, styryl group, nitro group, hydroxyl group, carboxyl group, cyano group or aryl azo group, while R.sub.1 ' to R.sub.7 ' and R.sub.1 \" to R.sub.7 \" independently may form a substituted or an unsubstituted condensed ring; n is 0, 1 or 2; r is an integer of 1 to 8; S represents 0 or 1; and t represents 1 or 2.",
@@ -611,6 +650,7 @@
         "$ref": "#/texts/22"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "M.sub.2 represents a non-metallic atom group required for the completion of a nitrogen-containing heterocyclic ring.",
@@ -622,6 +662,7 @@
         "$ref": "#/texts/22"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Specific examples of M.sub.2 are atom groups required for the completion of a nitrogen-containing heterocyclic ring, including pyridine, thiazole, benzothiazole, naphthothiazole, oxazole, benzoxazole, naphthoxazole, imidazole, benzimidazole, naphthoimidazole, 2-quinoline, 4-quinoline, isoquinoline or indole, and may be substituted by halogen atom (chlorine atom, bromine atom, iodine atom and the like), alkyl group (methyl, ethyl, propyl, butyl and the like), aryl group (phenyl, tolyl, xylyl and the like), and aralkyl (benzene, p-trimethyl, and the like).",
@@ -633,6 +674,7 @@
         "$ref": "#/texts/22"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "R.sub.22 represents hydrogen atom, nitro group, sulfonate group, cyano group, alkyl group (methyl, ethyl, propyl, butyl and the like), or aryl group (phenyl, tolyl, xylyl and the like). R.sub.23 represents alkyl group (methyl, ethyl, propyl, butyl and the like), a substituted alkyl group (2-hydroxyethyl, 2-methoxyethyl, 2-ethoxyethyl, 3-hydroxypropyl, 3-methoxypropyl, 3-ethoxypropyl, 3-chloropropyl, 3-bromopropyl, 3-carboxylpropyl and the like ), a cyclic alkyl group (cyclohexyl, cyclopropyl), aryl aralkyl group (benzene, 2-phenylethyl, 3-phenylpropyl, 3-phenylbutyl, 4-phenylbutyl, .alpha.-naphthylmethyl, .beta.-naphthylmethyl), a substituted aralkyl group (methylbenzyl, ethylbenzyl, dimethylbenzyl, trimethylbenzyl, chlorobenzyl, bromobenzyl and the like), aryl group (phenyl, tolyl, xylyl, .alpha.-naphtyl, .beta.-naphthyl) or a substituted aryl group (chlorophenyl, dichlorophenyl, trichlorophenyl, ethylphenyl, methoxydiphenyl, dimethoxyphenyl, aminophenyl, sulfonate phenyl, nitrophenyl, hydroxyphenyl and the like).",
@@ -644,6 +686,7 @@
         "$ref": "#/texts/22"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "R.sub.24 represents a substituted or an unsubstituted aryl group or the cation group thereof, specifically including a substituted or an unsubstituted aryl group (phenyl, tolyl, xylyl, biphenyl, aminophenyl, .alpha.-naphthyl, .beta.-napthyl, anthranyl, pyrenyl, methoxyphenyl, dimethoxyphenyl, trimethoxyphenyl, ethoxyphenyl, diethoxyphenyl, chlorophenyl, dichlorophenyl, trichlorophenyl, bromophenyl, dibromophenyl, tribromophenyl, ethylphenyl, diethylphenyl, nitrophenyl, aminophenyl, dimethylaminophenyl, diethylaminophenyl, dibenzylaminophenyl, dipropylaminophenyl, morpholinophenyl, piperidinylphenyl, piperidinophenyl, diphenylaminophenyl, acetylaminophenyl, benzoylaminophenyl, acetylphenyl, benzoylphenyl, cyanophenyl, sulfonate phenyl, carboxylate phenyl and the like).",
@@ -655,6 +698,7 @@
         "$ref": "#/texts/22"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "R.sub.25 represents a heterocyclic ring or the cation group thereof, specifically including a monovalent heterocyclic ring derived from cyclic rings, such as furan, thiophene, benzofuran, thionaphthene, dibenzofuran, carbazole, phenothiazine phenoxazine, pyridine and the like.",
@@ -666,6 +710,7 @@
         "$ref": "#/texts/22"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "R.sub.26 represents hydrogen atom, alkyl group (methyl, ethyl, propyl, butyl and the like), or a substituted or an unsubstituted aryl group (phenyl, tolyl, xylyl, biphenyl, ethylphenyl, chlorophenyl, methoxyphenyl, ethoxyphenyl, nitrophenyl, aminophenyl, dimethylaminophenyl, diethylaminophenyl, acetylaminophenyl, .alpha.-naphthyl, .beta.-naphthyl, anthraryl, pyrenyl, sulfonate phenyl, carboxylate phenyl and the like. In the formula, Z.sub.7 represents an atom group required for the completion of pyran, thiapyran, selenapyran, telluropyran, benzopyran, benzothiapyran, benzoselenapyran, benzotelluropyran, naphthopyran, naphthothiapyran, or naphthoselenapyran, or naphthotelluropyran.",
@@ -677,6 +722,7 @@
         "$ref": "#/texts/22"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "L.sub.7 represents sulfur atom, oxygen atom or selenium atom or tellurium atom.",
@@ -688,6 +734,7 @@
         "$ref": "#/texts/22"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "R.sub.27 and R.sub.28 individually represent hydrogen atom, alkoxy group, a substituted or an unsubstituted aryl group, alkenyl group and a heterocyclic group,",
@@ -699,6 +746,7 @@
         "$ref": "#/texts/22"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "More specifically, R.sub.27 and R.sub.28 individually represent hydrogen atom, alkyl group (methyl, ethyl, propyl, butyl and the like), alkyl sulfonate group, alkoxyl group (methoxy, ethoxy, propoxy, ethoxyethyl, methoxyethyl and the like), aryl group (phenyl, tolyl, xylyl, sulfonate phenyl, chlorophenyl, biphenyl, methoxyphenyl and the like), a substituted or an unsubstituted styryl group (styryl, p-methylstyryl, o-chlorostyryl, p-methoxystyryl and the like), a substituted or an unsubstituted 4-phenyl, 1,3-butadienyl group (r-phenyl, 1,3-butadienyl, 4-(p-methylphenyl), 1,3-butadienyl and the like), or a substituted or an unsubstituted heterocyclic group (quinolyl, pyridyl, carbazoyl, furyl and the like).",
@@ -710,6 +758,7 @@
         "$ref": "#/texts/22"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "As in the case of R, the same is true with R.sub.A and R.sub.B of the general formulas (II) and (III), respectively.",
@@ -721,6 +770,7 @@
         "$ref": "#/texts/22"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Then, in R, the symbols R.sub.8 ' to R.sub.14 ' individually correspond to R.sub.1 ' to R.sub.7 '; R.sub.8 \" to R.sub.14 \" individually correspond to R.sub.1 \" to R.sub.7 \"; in R.sub.B, R.sub.14 ' to R.sub.21 \" individually correspond to R.sub.1 ' to R.sub.7 '; R.sub.14 \" to R.sub.21 \" individually correspond to R.sub.1 \" to R.sub.7 \".",
@@ -732,6 +782,7 @@
         "$ref": "#/texts/22"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "In the azulenium nucleus of the (1) to (12), described above, those represented by the formulas (3), (9) and (10) are more preferably used; and particularly, the formula (3) is preferable.",
@@ -743,6 +794,7 @@
         "$ref": "#/texts/22"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "R.sub.1 to R.sub.28, R.sub.1 ' to R.sub.21 ' and R.sub.1 \" to R.sub.21 \" preferably contain one or more well-known polar groups in order to impart water solubility to a compound (labeling agent) represented by the general formula (I), (II) or (III). The polar groups include, for example, hydroxyl group, alkylhydroxyl group, sulfonate group, alkylsulfonate group, carboxylate group, alkylcarboxylate group, tetra-ammonium base and the like. R.sub.1 to R.sub.28, R.sub.1 ' to R.sub.21 ', and R.sub.1 \" to R.sub.21 \" preferably contain one or more well-known reactive groups in order that the compound of the general formula (I) can form a covalent bond with a substance from a living organism.",
@@ -754,6 +806,7 @@
         "$ref": "#/texts/22"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "The reactive groups include the reactive sites of isocyanate, isothiocyanate, succinimide ester, sulfosuccinimide ester, imide ester, hydrazine, nitroaryl halide, piperidine disulfide, maleimide, thiophthalimide, acid halide, sulfonyl halide, aziridine, azide nitrophenyl, azide amino, 3-(2-pyridyldithio) propionamide and the like. In these reactive sites, the following spacer groups (n=0, 1 to 6) may be interposed in order to prevent steric hindrance during on the bonding of a labeling agent and a substance from a living organism.",
@@ -765,6 +818,7 @@
         "$ref": "#/texts/22"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Preferable such reactive groups include isothiocyanate, sulfosuccinimide ester, succinimide ester maleimide and the like X.sub.1.sup..sym. represents an anion, including chloride ion, bromide ion, iodide ion, perchlorate ion, benzenesulfonate ion, p-toluene sulfonate ion, methylsulfate ion, ethylsulfate ion, propylsulfate ion, tetrafluoroborate ion, tetraphenylborate ion, hexafluorophosphate ion, benzenesulfinic acid salt ion, acetate ion, trifluoroacetate ion, propionate ion, benzoate ion, oxalate ion, succinate ion, malonate ion, oleate ion, stearate ion, citrate ion, monohydrogen diphosphate ion, dihydrogen monophosphate ion, pentachlorostannate ion, chlorosulfonate ion, fluorosulfonate ion, trifluoromethane sulfonate ion, hexafluoroantimonate ion, molybdate ion, tungstate ion, titanate ion, zirconate ion and the like.",
@@ -776,6 +830,7 @@
         "$ref": "#/texts/22"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Specific examples of these labeling agents are illustrated in Tables 1, 2 and 3, but are not limited thereto.",
@@ -787,6 +842,7 @@
         "$ref": "#/texts/22"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "The synthetic method of these azulene dyes is described in U.S. Pat. No. 4,738,908.",
@@ -859,6 +915,7 @@
           "$ref": "#/texts/74"
         }
       ],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
       "orig": "CLAIMS",
@@ -871,6 +928,7 @@
         "$ref": "#/texts/54"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "",
@@ -882,6 +940,7 @@
         "$ref": "#/texts/54"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "",
@@ -893,6 +952,7 @@
         "$ref": "#/texts/54"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "",
@@ -904,6 +964,7 @@
         "$ref": "#/texts/54"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "",
@@ -915,6 +976,7 @@
         "$ref": "#/texts/54"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "",
@@ -926,6 +988,7 @@
         "$ref": "#/texts/54"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "",
@@ -937,6 +1000,7 @@
         "$ref": "#/texts/54"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "",
@@ -948,6 +1012,7 @@
         "$ref": "#/texts/54"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "",
@@ -959,6 +1024,7 @@
         "$ref": "#/texts/54"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "",
@@ -970,6 +1036,7 @@
         "$ref": "#/texts/54"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "",
@@ -981,6 +1048,7 @@
         "$ref": "#/texts/54"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "",
@@ -992,6 +1060,7 @@
         "$ref": "#/texts/54"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "",
@@ -1003,6 +1072,7 @@
         "$ref": "#/texts/54"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "",
@@ -1014,6 +1084,7 @@
         "$ref": "#/texts/54"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "",
@@ -1025,6 +1096,7 @@
         "$ref": "#/texts/54"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "",
@@ -1036,6 +1108,7 @@
         "$ref": "#/texts/54"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "",
@@ -1047,6 +1120,7 @@
         "$ref": "#/texts/54"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "",
@@ -1058,6 +1132,7 @@
         "$ref": "#/texts/54"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "",
@@ -1069,6 +1144,7 @@
         "$ref": "#/texts/54"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "",
@@ -1080,6 +1156,7 @@
         "$ref": "#/texts/54"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "",
@@ -1089,5 +1166,6 @@
   "pictures": [],
   "tables": [],
   "key_value_items": [],
+  "form_items": [],
   "pages": {}
 }
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v2/pg06442728.json b/tests/data/groundtruth/docling_v2/pg06442728.json
index 4b5f4f32..8c870a8a 100644
--- a/tests/data/groundtruth/docling_v2/pg06442728.json
+++ b/tests/data/groundtruth/docling_v2/pg06442728.json
@@ -1,6 +1,6 @@
 {
   "schema_name": "DoclingDocument",
-  "version": "1.0.0",
+  "version": "1.1.0",
   "name": "pg06442728.xml",
   "origin": {
     "mimetype": "application/xml",
@@ -10,6 +10,7 @@
   "furniture": {
     "self_ref": "#/furniture",
     "children": [],
+    "content_layer": "furniture",
     "name": "_root_",
     "label": "unspecified"
   },
@@ -20,6 +21,7 @@
         "$ref": "#/texts/0"
       }
     ],
+    "content_layer": "body",
     "name": "_root_",
     "label": "unspecified"
   },
@@ -56,6 +58,7 @@
           "$ref": "#/texts/72"
         }
       ],
+      "content_layer": "body",
       "label": "title",
       "prov": [],
       "orig": "Methods and apparatus for turbo code",
@@ -71,6 +74,7 @@
           "$ref": "#/texts/2"
         }
       ],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
       "orig": "ABSTRACT",
@@ -83,6 +87,7 @@
         "$ref": "#/texts/1"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "An interleaver receives incoming data frames of size N. The interleaver indexes the elements of the frame with an N\u2081\u00d7N\u2082 index array. The interleaver then effectively rearranges (permutes) the data by permuting the rows of the index array. The interleaver employs the equation I(j,k)=I(j,\u03b1jk+\u03b2j)modP) to permute the columns (indexed by k) of each row (indexed by j). P is at least equal to N\u2082, \u03b2j is a constant which may be different for each row, and each \u03b1j is a relative prime number relative to P. After permuting, the interleaver outputs the data in a different order than received (e.g., receives sequentially row by row, outputs sequentially each column by column).",
@@ -98,6 +103,7 @@
           "$ref": "#/texts/4"
         }
       ],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
       "orig": "CROSS-REFERENCE TO RELATED APPLICATIONS",
@@ -110,6 +116,7 @@
         "$ref": "#/texts/3"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "This application claims the benefit of U.S. Provisional Application No. 60/115,394 filed Jan. 11, 1999.",
@@ -125,6 +132,7 @@
           "$ref": "#/texts/6"
         }
       ],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
       "orig": "FIELD OF THE INVENTION",
@@ -137,6 +145,7 @@
         "$ref": "#/texts/5"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "This invention relates generally to communication systems and, more particularly, to interleavers for performing code modulation.",
@@ -179,6 +188,7 @@
           "$ref": "#/texts/17"
         }
       ],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
       "orig": "BACKGROUND OF THE INVENTION",
@@ -191,6 +201,7 @@
         "$ref": "#/texts/7"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Techniques for encoding communication channels, known as coded modulation, have been found to improve the bit error rate (BER) of electronic communication systems such as modem and wireless communication systems. Turbo coded modulation has proven to be a practical, power-efficient, and bandwidth-efficient modulation method for \u201crandom-error\u201d channels characterized by additive white Gaussian noise (AWGN) or fading. These random-error channels can be found, for example, in the code division multiple access (CDMA) environment. Since the capacity of a CDMA environment is dependent upon the operating signal to noise ratio, improved performance translates into higher capacity.",
@@ -202,6 +213,7 @@
         "$ref": "#/texts/7"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "An aspect of turbo coders which makes them so effective is an interleaver which permutes the original received or transmitted data frame before it is input to a second encoder. The permuting is accomplished by randomizing portions of the signal based upon one or more randomizing algorithms. Combining the permuted data frames with the original data frames has been shown to achieve low BERs in AWGN and fading channels. The interleaving process increases the diversity in the data such that if the modulated symbol is distorted in transmission the error may be recoverable with the use of error correcting algorithms in the decoder.",
@@ -213,6 +225,7 @@
         "$ref": "#/texts/7"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "A conventional interleaver collects, or frames, the signal points to be transmitted into an array, where the array is sequentially filled up row by row. After a predefined number of signal points have been framed, the interleaver is emptied by sequentially reading out the columns of the array for transmission. As a result, signal points in the same row of the array that were near each other in the original signal point flow are separated by a number of signal points equal to the number of rows in the array. Ideally, the number of columns and rows would be picked such that interdependent signal points, after transmission, would be separated by more than the expected length of an error burst for the channel.",
@@ -224,6 +237,7 @@
         "$ref": "#/texts/7"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Non-uniform interleaving achieves \u201cmaximum scattering\u201d of data and \u201cmaximum disorder\u201d of the output sequence. Thus the redundancy introduced by the two convolutional encoders is more equally spread in the output sequence of the turbo encoder. The minimum distance is increased to much higher values than for uniform interleaving. A persistent problem for non-uniform interleaving is how to practically implement the interleaving while achieving sufficient \u201cnon-uniformity,\u201d and minimizing delay compensations which limit the use for applications with real-time requirements.",
@@ -235,6 +249,7 @@
         "$ref": "#/texts/7"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Finding an effective interleaver is a current topic in the third generation CDMA standard activities. It has been determined and generally agreed that, as the frame size approaches infinity, the most effective interleaver is the random interleaver. However, for finite frame sizes, the decision as to the most effective interleaver is still open for discussion.",
@@ -246,6 +261,7 @@
         "$ref": "#/texts/7"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Accordingly there exists a need for systems and methods of interleaving codes that improve non-uniformity for finite frame sizes.",
@@ -257,6 +273,7 @@
         "$ref": "#/texts/7"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "There also exists a need for such systems and methods of interleaving codes which are relatively simple to implement.",
@@ -268,6 +285,7 @@
         "$ref": "#/texts/7"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "It is thus an object of the present invention to provide systems and methods of interleaving codes that improve non-uniformity for finite frame sizes.",
@@ -279,6 +297,7 @@
         "$ref": "#/texts/7"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "It is also an object of the present invention to provide systems and methods of interleaving codes which are relatively simple to implement.",
@@ -290,6 +309,7 @@
         "$ref": "#/texts/7"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "These and other objects of the invention will become apparent to those skilled in the art from the following description thereof.",
@@ -314,6 +334,7 @@
           "$ref": "#/texts/22"
         }
       ],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
       "orig": "SUMMARY OF THE INVENTION",
@@ -326,6 +347,7 @@
         "$ref": "#/texts/18"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "The foregoing objects, and others, may be accomplished by the present invention, which interleaves a data frame, where the data frame has a predetermined size and is made up of portions. An embodiment of the invention includes an interleaver for interleaving these data frames. The interleaver includes an input memory configured to store a received data frame as an array organized into rows and columns, a processor connected to the input memory and configured to permute the received data frame in accordance with the equation D(j,k)=D (j, (\u03b1jk+\u03b2j)modP), and a working memory in electrical communication with the processor and configured to store a permuted version of the data frame. The elements of the equation are as follows: D is the data frame, j and k are indexes to the rows and columns, respectively, in the data frame, \u03b1 and \u03b2 are sets of constants selected according to the current row, and P and each \u03b1j are relative prime numbers. (\u201cRelative prime numbers\u201d connotes a set of numbers that have no common divisor other than 1. Members of a set of relative prime numbers, considered by themselves, need not be prime numbers.)",
@@ -337,6 +359,7 @@
         "$ref": "#/texts/18"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Another embodiment of the invention includes a method of storing a data frame and indexing it by an N\u2081\u00d7N\u2082 index array I, where the product of N\u2081 and N\u2082 is at least equal to N. The elements of the index array indicate positions of the elements of the data frame. The data frame elements may be stored in any convenient manner and need not be organized as an array. The method further includes permuting the index array according to I(j,k)=I(j,(\u03b1jk+\u03b2j)modP), wherein I is the index array, and as above j and k are indexes to the rows and columns, respectively, in the index array, \u03b1 and \u03b2 are sets of constants selected according to the current row, and P and each \u03b1j are relative prime numbers. The data frame, as indexed by the permuted index array I, is effectively permuted.",
@@ -348,6 +371,7 @@
         "$ref": "#/texts/18"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Still another embodiment of the invention includes an interleaver which includes a storage device for storing a data frame and for storing an N\u2081\u00d7N\u2082 index array I, where the product of N\u2081 and N\u2082 is at least equal to N. The elements of the index array indicate positions of the elements of the data frame. The data frame elements may be stored in any convenient manner and need not be organized as an array. The interleaver further includes a permuting device for permuting the index array according to I(j,k)=I(j,(\u03b1jk+\u03b2j)modP), wherein I is the index array, and as above j and k are indexes to the rows and columns, respectively, in the index array, \u03b1 and \u03b2 are sets of constants selected according to the current row, and P and each \u03b1j are relative prime numbers. The data frame, as indexed by the permuted index array I, is effectively permuted.",
@@ -359,6 +383,7 @@
         "$ref": "#/texts/18"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "The invention will next be described in connection with certain illustrated embodiments and practices. However, it will be clear to those skilled in the art that various modifications, additions and subtractions can be made without departing from the spirit or scope of the claims.",
@@ -389,6 +414,7 @@
           "$ref": "#/texts/29"
         }
       ],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
       "orig": "BRIEF DESCRIPTION OF THE DRAWINGS",
@@ -401,6 +427,7 @@
         "$ref": "#/texts/23"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "The invention will be more clearly understood by reference to the following detailed description of an exemplary embodiment in conjunction with the accompanying drawings, in which:",
@@ -412,6 +439,7 @@
         "$ref": "#/texts/23"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "FIG. 1 depicts a diagram of a conventional turbo encoder.",
@@ -423,6 +451,7 @@
         "$ref": "#/texts/23"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "FIG. 2 depicts a block diagram of the interleaver illustrated in FIG. 1;",
@@ -434,6 +463,7 @@
         "$ref": "#/texts/23"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "FIG. 3 depicts an array containing a data frame, and permutation of that array;",
@@ -445,6 +475,7 @@
         "$ref": "#/texts/23"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "FIG. 4 depicts a data frame stored in consecutive storage locations;",
@@ -456,6 +487,7 @@
         "$ref": "#/texts/23"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "FIG. 5 depicts an index array for indexing the data frame shown in FIG. 4, and permutation of the index array.",
@@ -591,6 +623,7 @@
           "$ref": "#/texts/71"
         }
       ],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
       "orig": "DETAILED DESCRIPTION OF THE INVENTION",
@@ -603,6 +636,7 @@
         "$ref": "#/texts/30"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "FIG. 1 illustrates a conventional turbo encoder. As illustrated, conventional turbo encoders include two encoders 20 and an interleaver 100. An interleaver 100 in accordance with the present invention receives incoming data frames 110 of size N, where N is the number of bits, number of bytes, or the number of some other portion the frame may be separated into, which are regarded as frame elements. The interleaver 100 separates the N frame elements into sets of data, such as rows. The interleaver then rearranges (permutes) the data in each set (row) in a pseudo-random fashion. The interleaver 100 may employ different methods for rearranging the data of the different sets. However, those skilled in the art will recognize that one or more of the methods could be reused on one or more of the sets without departing from the scope of the invention. After permuting the data in each of the sets, the interleaver outputs the data in a different order than received.",
@@ -614,6 +648,7 @@
         "$ref": "#/texts/30"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "The interleaver 100 may store the data frame 110 in an array of size N\u2081\u00d7N\u2082 such that N\u2081*N\u2082=N. An example depicted in FIG. 3 shows an array 350 having 3 rows (N\u2081=3) of 6 columns (N\u2082=6)for storing a data frame 110 having 18 elements, denoted Frame Element 00 (FE00) through FE17 (N=18). While this is the preferred method, the array may also be designed such that N\u2081*N\u2082 is a fraction of N such that one or more of the smaller arrays is/are operated on in accordance with the present invention and the results from each of the smaller arrays are later combined.",
@@ -625,6 +660,7 @@
         "$ref": "#/texts/30"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "To permute array 350 according to the present invention, each row j of array 350 is individually operated on, to permute the columns k of each row according to the equation:",
@@ -636,6 +672,7 @@
         "$ref": "#/texts/30"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "D\u2081(j,k)=D(j,(\u03b1k+\u03b2)modP)",
@@ -647,6 +684,7 @@
         "$ref": "#/texts/30"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "where:",
@@ -658,6 +696,7 @@
         "$ref": "#/texts/30"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "j and k are row and column indices, respectively, in array 350;",
@@ -669,6 +708,7 @@
         "$ref": "#/texts/30"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "P is a number greater than or equal to N\u2082;",
@@ -680,6 +720,7 @@
         "$ref": "#/texts/30"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "\u03b1j and P arc relative prime numbers (one or both can be non-prime numbers, but the only divisor that they have in common is 1);",
@@ -691,6 +732,7 @@
         "$ref": "#/texts/30"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "\u03b2j is a constant, one value associated with each row.",
@@ -702,6 +744,7 @@
         "$ref": "#/texts/30"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Once the data for all of the rows are permuted, the new array is read out column by column. Also, once the rows have been permuted, it is possible (but not required) to permute the data grouped by column before outputting the data. In the event that both the rows and columns are permuted, the rows, the columns or both may be permuted in accordance with the present invention. It is also possible to transpose rows of array, for example by transposing bits in the binary representation of the row index j. (In a four-row array, for example, the second and third rows would be transposed under this scheme.) It is also possible that either the rows or the columns, but not both may be permuted in accordance with a different method of permuting. Those skilled in the art will recognize that the system could be rearranged to store the data column by column, permute each set of data in a column and read out the results row by row without departing from the scope of the invention.",
@@ -713,6 +756,7 @@
         "$ref": "#/texts/30"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "These methods of interleaving are based on number theory and may be implemented in software and/or hardware (i.e. application specific integrated circuits (ASIC), programmable logic arrays (PLA), or any other suitable logic devices). Further, a single pseudo random sequence generator (i.e. m-sequence, M-sequence, Gold sequence, Kasami sequence . . . ) can be employed as the interleaver.",
@@ -724,6 +768,7 @@
         "$ref": "#/texts/30"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "In the example depicted in FIG. 3, the value selected for P is 6, the values of \u03b1 are 5 for all three rows, and the values of \u03b2 are 1, 2, and 3 respectively for the three rows. (These are merely exemplary. Other numbers may be chosen to achieve different permutation results.) The values of \u03b1 (5) are each relative prime numbers relative to the value of P (6), as stipulated above.",
@@ -735,6 +780,7 @@
         "$ref": "#/texts/30"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Calculating the specified equation with the specified values for permuting row 0 of array D 350 into row 0 of array D\u2081 360 proceeds as:",
@@ -746,6 +792,7 @@
         "$ref": "#/texts/30"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "and the permuted data frame is contained in array D\u2081 360 shown in FIG. 3. Outputting the array column by column outputs the frame elements in the order:",
@@ -757,6 +804,7 @@
         "$ref": "#/texts/30"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "1,8,15,0,7,14,5,6,13,4,11,12,3,10,17,2,9,16.",
@@ -768,6 +816,7 @@
         "$ref": "#/texts/30"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "In an alternative practice of the invention, data frame 110 is stored in consecutive storage locations, not as an array or matrix, and a separate index array is stored to index the elements of the data frame, the index array is permuted according to the equations of the present invention, and the data frame is output as indexed by the permuted index array.",
@@ -779,6 +828,7 @@
         "$ref": "#/texts/30"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "FIG. 4 depicts a block 400 of storage 32 elements in length (thus having offsets of 0 through 31 from a starting storage location). A data frame 110, taken in this example to be 22 elements long and thus to consist of elements FE00 through FE21, occupies offset locations 00 through 21 within block 400. Offset locations 22 through 31 of block 400 contain unknown contents. A frame length of 22 elements is merely exemplary, and other lengths could be chosen. Also, storage of the frame elements in consecutive locations is exemplary, and non-consecutive locations could be employed.",
@@ -790,6 +840,7 @@
         "$ref": "#/texts/30"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "FIG. 5 depicts index array I 550 for indexing storage block 400. It is organized as 4 rows of 8 columns each (N\u2081=4, N\u2082=8, N=N\u2081*N\u2082=32). Initial contents are filled in to array I 550 as shown in FIG. 5 sequentially. This sequential initialization yields the same effect as a row-by-row read-in of data frame 110.",
@@ -801,6 +852,7 @@
         "$ref": "#/texts/30"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "The index array is permuted according to",
@@ -812,6 +864,7 @@
         "$ref": "#/texts/30"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "I\u2081(j,k)=I(j,(\u03b1j*k+\u03b2j)modP)",
@@ -823,6 +876,7 @@
         "$ref": "#/texts/30"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "where",
@@ -834,6 +888,7 @@
         "$ref": "#/texts/30"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "\u03b1=1, 3, 5, 7",
@@ -845,6 +900,7 @@
         "$ref": "#/texts/30"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "\u03b2=0, 0, 0, 0",
@@ -856,6 +912,7 @@
         "$ref": "#/texts/30"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "P=8",
@@ -867,6 +924,7 @@
         "$ref": "#/texts/30"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "These numbers are exemplary and other numbers could be chosen, as long as the stipulations are observed that P is at least equal to N\u2082 and that each value of \u03b1 is a relative prime number relative to the chosen value of P.",
@@ -878,6 +936,7 @@
         "$ref": "#/texts/30"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "If the equation is applied to the columns of row 2, for example, it yields:",
@@ -889,6 +948,7 @@
         "$ref": "#/texts/30"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Applying the equation comparably to rows 0, 1, and 3 produces the permuted index array I\u2081 560 shown in FIG. 5.",
@@ -900,6 +960,7 @@
         "$ref": "#/texts/30"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "The data frame 110 is read out of storage block 400 and output in the order specified in the permuted index array I\u2081 560 taken column by column. This would output storage locations in offset order:",
@@ -911,6 +972,7 @@
         "$ref": "#/texts/30"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "0,8,16,24,1,11,21,31,2,14,18,30,3,9,23,29,4,12,20,28,5,15,17,27,6,10,22,26,7,13,19,25.",
@@ -922,6 +984,7 @@
         "$ref": "#/texts/30"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "However, the example assumed a frame length of 22 elements, with offset locations 22-31 in block 400 not being part of the data frame. Accordingly, when outputting the data frame it would be punctured or pruned to a length of 22; i.e., offset locations greater than 21 are ignored. The data frame is thus output with an element order of 0,8,16,1,11,21,2,14,18,3,9,4,12,20,5,15,17,6,10,7,13,19.",
@@ -933,6 +996,7 @@
         "$ref": "#/texts/30"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "In one aspect of the invention, rows of the array may be transposed prior to outputting, for example by reversing the bits in the binary representations of row index j.",
@@ -944,6 +1008,7 @@
         "$ref": "#/texts/30"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "There are a number of different ways to implement the interleavers 100 of the present invention. FIG. 2 illustrates an embodiment of the invention wherein the interleaver 100 includes an input memory 300 for receiving and storing the data frame 110. This memory 300 may include shift registers, RAM or the like. The interleaver 100 may also include a working memory 310 which may also include RAM, shift registers or the like. The interleaver includes a processor 320 (e.g., a microprocessor, ASIC, etc.) which may be configured to process I(j,k) in real time according to the above-identified equation or to access a table which includes the results of I(j,k) already stored therein. Those skilled in the art will recognize that memory 300 and memory 310 may be the same memory or they may be separate memories.",
@@ -955,6 +1020,7 @@
         "$ref": "#/texts/30"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "For real-time determinations of I(j,k), the first row of the index array is permuted and the bytes corresponding to the permuted index are stored in the working memory. Then the next row is permuted and stored, etc. until all rows have been permuted and stored. The permutation of rows may be done sequentially or in parallel.",
@@ -966,6 +1032,7 @@
         "$ref": "#/texts/30"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Whether the permuted I(j,k) is determined in real time or by lookup, the data may be stored in the working memory in a number of different ways. It can be stored by selecting the data from the input memory in the same order as the I(j,k)s in the permuted index array (i.e., indexing the input memory with the permuting function) and placing them in the working memory in sequential available memory locations. It may also be stored by selecting the bytes in the sequence they were stored in the input memory (i.e., FIFO) and storing them in the working memory directly into the location determined by the permuted I(j,k)s (i.e., indexing the working memory with the permuting function). Once this is done, the data may be read out of the working memory column by column based upon the permuted index array. As stated above, the data could be subjected to another round of permuting after it is stored in the working memory based upon columns rather than on rows to achieve different results.",
@@ -977,6 +1044,7 @@
         "$ref": "#/texts/30"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "If the system is sufficiently fast, one of the memories could be eliminated and as a data element is received it could be placed into the working memory, in real time or by table lookup, in the order corresponding to the permuted index array.",
@@ -988,6 +1056,7 @@
         "$ref": "#/texts/30"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "The disclosed interleavers are compatible with existing turbo code structures. These interleavers offer superior performance without increasing system complexity.",
@@ -999,6 +1068,7 @@
         "$ref": "#/texts/30"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "In addition, those skilled in the art will realize that de-interleavers can be used to decode the interleaved data frames. The construction of de-interleavers used in decoding turbo codes is well known in the art. As such they are not further discussed herein. However, a de-interleaver corresponding to the embodiments can be constructed using the permuted sequences discussed above.",
@@ -1010,6 +1080,7 @@
         "$ref": "#/texts/30"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Although the embodiment described above is a turbo encoder such as is found in a CDMA system, those skilled in the art realize that the practice of the invention is not limited thereto and that the invention may be practiced for any type of interleaving and de-interleaving in any communication system.",
@@ -1021,6 +1092,7 @@
         "$ref": "#/texts/30"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "It will thus be seen that the invention efficiently attains the objects set forth above, among those made apparent from the preceding description. In particular, the invention provides improved apparatus and methods of interleaving codes of finite length while minimizing the complexity of the implementation.",
@@ -1032,6 +1104,7 @@
         "$ref": "#/texts/30"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "It will be understood that changes may be made in the above construction and in the foregoing sequences of operation without departing from the scope of the invention. It is accordingly intended that all matter contained in the above description or shown in the accompanying drawings be interpreted as illustrative rather than in a limiting sense.",
@@ -1043,6 +1116,7 @@
         "$ref": "#/texts/30"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "It is also to be understood that the following claims are intended to cover all of the generic and specific features of the invention as described herein, and all statements of the scope of the invention which, as a matter of language, might be said to fall therebetween.",
@@ -1160,6 +1234,7 @@
           "$ref": "#/texts/107"
         }
       ],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
       "orig": "CLAIMS",
@@ -1172,6 +1247,7 @@
         "$ref": "#/texts/72"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "1. A method of interleaving elements of frames of signal data communication channel, the method comprising; storing a frame of signal data comprising a plurality of elements as an array D having N\u2081 rows enumerated as 0, 1, . . . N\u2081\u22121; and N\u2082 columns enumerated as 0, 1, . . . N\u2082\u22121, wherein N\u2081 and N\u2082 are positive integers greater than 1; and permuting array D into array D\u2081 according to D\u2081(\ud835\udc57,\ud835\udc58)=D(\ud835\udc57,(\u03b1j\ud835\udc58+\u03b2j)\ud835\udc5a\ud835\udc5c\ud835\udc51\ud835\udc43)  wherein j is an index through the rows of arrays D and D\u2081; k is an index through the columns of arrays D and D\u2081; \u03b1j and \u03b2j are integers predetermined for each row j; P is an integer at least equal to N\u2082; and each \u03b1j is a relative prime number relative to P.",
@@ -1183,6 +1259,7 @@
         "$ref": "#/texts/72"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "2. The method according to claim 1 wherein said elements of array D are stored in accordance with a first order and wherein said elements of array D\u2081 are output in accordance with a second order.",
@@ -1194,6 +1271,7 @@
         "$ref": "#/texts/72"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "3. The method according to claim 2 wherein elements of array D are stored row by row and elements of array D\u2081 are output column by column.",
@@ -1205,6 +1283,7 @@
         "$ref": "#/texts/72"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "4. The method according to claim 1 further including outputting of array D\u2081 and wherein the product of N\u2081 and N\u2082 is greater than the number of elements in the frame and the frame is punctured during outputting to the number of elements in the frame.",
@@ -1216,6 +1295,7 @@
         "$ref": "#/texts/72"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "5. A method of interleaving elements of frames of signal data communication channel, the method comprising; creating and storing an index array I having N\u2081 rows enumerated as 0, 1, . . . N\u2081\u22121; and N\u2082 columns enumerated as 0, 1, . . . N\u2082\u22121, wherein N\u2081 and N\u2082 are positive integers greater than 1, storing elements of a frame of signal data in each of a plurality of storage locations; storing in row-by-row sequential positions in array I values indicative of corresponding locations of frame elements; and permuting array I into array I\u2081 according to I\u2081(\ud835\udc57,\ud835\udc58)=I(\ud835\udc57,(\u03b1j\ud835\udc58+\u03b2j)\ud835\udc5a\ud835\udc5c\ud835\udc51\ud835\udc43)  wherein j is an index through the rows of arrays I and I\u2081; k is an index through the columns of arrays I and I\u2081; \u03b1j and \u03b2j are integers predetermined for each row j; P is an integer at least equal to N\u2082; and each \u03b1j is a relative prime number relative to P, whereby the frame of signal data as indexed by array I\u2081 is effectively permuted.",
@@ -1227,6 +1307,7 @@
         "$ref": "#/texts/72"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "6. The method according to claim 5 further including permuting said stored elements according to said permuted index array I\u2081.",
@@ -1238,6 +1319,7 @@
         "$ref": "#/texts/72"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "7. The method according to claim 5 wherein said elements of the frame of data are output as indexed by entries of array I\u2081 taken other than row by row.",
@@ -1249,6 +1331,7 @@
         "$ref": "#/texts/72"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "8. The method according to claim 7 wherein elements of the frame of data are output as indexed by entries of array I\u2081 taken column by column.",
@@ -1260,6 +1343,7 @@
         "$ref": "#/texts/72"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "9. The method according to claim 5 including the step of transposing rows of array I prior to the step of permuting array I.",
@@ -1271,6 +1355,7 @@
         "$ref": "#/texts/72"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "10. The method according to claim 5 wherein N\u2081 is equal to 4, N\u2082 is equal to 8, P is equal to 8, and the values of \u03b1j are different for each row and are chosen from a group consisting of 1, 3, 5, and 7.",
@@ -1282,6 +1367,7 @@
         "$ref": "#/texts/72"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "11. The method according to claim 10 wherein the values of \u03b1j are 1, 3, 5, and 7 for j=0, 1, 2, and 3 respectively.",
@@ -1293,6 +1379,7 @@
         "$ref": "#/texts/72"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "12. The method according to claim 11 wherein all values of \u03b2 are zero.",
@@ -1304,6 +1391,7 @@
         "$ref": "#/texts/72"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "13. The method according to claim 10 wherein the values of \u03b1j are 1, 5, 3, and 7 for j=0, 1, 2, and 3 respectively.",
@@ -1315,6 +1403,7 @@
         "$ref": "#/texts/72"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "14. The method according to claim 13 wherein all values of \u03b2 are zero.",
@@ -1326,6 +1415,7 @@
         "$ref": "#/texts/72"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "15. The method according to claim 5 wherein all values of \u03b2 are zero.",
@@ -1337,6 +1427,7 @@
         "$ref": "#/texts/72"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "16. The method according to claim 5 wherein at least two values of \u03b2 are the same.",
@@ -1348,6 +1439,7 @@
         "$ref": "#/texts/72"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "17. The method according to claim 5 further including outputting of the frame of data and wherein the product of N\u2081 and N\u2082 is greater than the number of elements in the frame of data and the frame of data is punctured during outputting to the number of elements in the frame of data.",
@@ -1359,6 +1451,7 @@
         "$ref": "#/texts/72"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "18. An interleaver for interleaving elements of frames of data, the interleaver comprising; storage means for storing a frame of data comprising a plurality of elements as an array D having N\u2081 rows enumerated as 0, 1, . . . N\u2082\u22121; and N\u2082 columns enumerated as 0, 1, . . . N\u2082\u22121, wherein N\u2081 and N\u2082 are positive integers greater than 1, and permuting means for permuting array D into array D\u2081 according to D\u2081(\ud835\udc57,\ud835\udc58)=D(\ud835\udc57,(\u03b1j\ud835\udc58+\u03b2j)\ud835\udc5a\ud835\udc5c\ud835\udc51\ud835\udc43)  wherein j is an index through the rows of arrays D and D\u2081; k is an index through the columns of arrays D and D\u2081; \u03b1j and \u03b2j are integers predetermined for each row j; P is an integer at least equal to N\u2082; and each \u03b1j is a relative prime number relative to P.",
@@ -1370,6 +1463,7 @@
         "$ref": "#/texts/72"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "19. The interleaver according to claim 18 including means for storing said elements of array D in accordance with a first order and means for outputting said elements of array D\u2081 in accordance with a second order.",
@@ -1381,6 +1475,7 @@
         "$ref": "#/texts/72"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "20. The interleaver according to claim 19 wherein said means for storing said elements of array D stores row by row and said means for outputting elements of array D\u2081 outputs column by column.",
@@ -1392,6 +1487,7 @@
         "$ref": "#/texts/72"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "21. The interleaver according to claim 18 including means for outputting said array D\u2081 and for puncturing said array D\u2081 to the number of elements in the frame when the product of N\u2081 and N\u2082 is greater than the number of elements in the frame.",
@@ -1403,6 +1499,7 @@
         "$ref": "#/texts/72"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "22. An interleaver for interleaving elements of frames of data, the interleaver comprising; means for storing an index array I having N\u2081 rows enumerated as 0, 1, . . . N\u2081\u22121; and N\u2082 columns enumerated as 0, 1, . . . N\u2082\u22121, wherein N\u2081 and N\u2082 are positive integers greater than 1, and means for receiving a frame of data and storing elements of the frame of data in each of a plurality of storage locations; means for storing in row-by-row sequential positions in array I values indicative of corresponding locations of frame elements; and means for permuting array I into array I\u2081 according to: I\u2081(\ud835\udc57,\ud835\udc58)=I(\ud835\udc57,(\u03b1j\ud835\udc58+\u03b2j)\ud835\udc5a\ud835\udc5c\ud835\udc51\ud835\udc43)  wherein j is an index through the rows of arrays I and I\u2081; k is an index through the columns of arrays I and I\u2081; \u03b1j and \u03b2j are integers predetermined for each row j; P is an integer at least equal to N\u2082; and each \u03b1j is a relative prime number relative to P, whereby the frame of data as indexed by array I\u2081 is effectively permuted.",
@@ -1414,6 +1511,7 @@
         "$ref": "#/texts/72"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "23. The interleaver according to claim 22 further including means for permuting said stored elements according to said permuted index array I\u2081.",
@@ -1425,6 +1523,7 @@
         "$ref": "#/texts/72"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "24. The interleaver according to claim 22 including means for outputting frame elements as indexed by entries of array I\u2081 taken other than row by row.",
@@ -1436,6 +1535,7 @@
         "$ref": "#/texts/72"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "25. The interleaver according to claim 24 including means for outputting frame elements as indexed by entries of array I\u2081 taken column by column.",
@@ -1447,6 +1547,7 @@
         "$ref": "#/texts/72"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "26. The interleaver according to claim 22 wherein the product of N\u2081 and N\u2082 is greater than the number of elements in the frame and the frame is punctured by the means for outputting to the number of elements in the frame.",
@@ -1458,6 +1559,7 @@
         "$ref": "#/texts/72"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "27. An interleaver for interleaving elements of frames of data, the interleaver comprising; an input memory for storing a received frame of data comprising a plurality of elements as an array D having N\u2081 rows enumerated as 0, 1, . . . N\u2081\u22121; and N\u2082 columns enumerated as 0, 1, . . . N\u2082\u22121, wherein N\u2081 and N\u2082 are positive integers greater than 1; a processor coupled to said input memory for permuting array D into array D\u2081 according to D\u2081(\ud835\udc57,\ud835\udc58)=D(\ud835\udc57,(\u03b1j\ud835\udc58+\u03b2j)\ud835\udc5a\ud835\udc5c\ud835\udc51\ud835\udc43)  wherein j is an index through the rows of arrays D and D\u2081; k is an index through the columns of arrays D and D\u2081; \u03b1j and \u03b2j are integers predetermined for each row j; P is an integer at least equal to N\u2082; and each \u03b1j is a relative prime number relative to P, and a working memory coupled to said processor and configured to store the permuted array D\u2081.",
@@ -1469,6 +1571,7 @@
         "$ref": "#/texts/72"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "28. The interlcavcr according to claim 27 wherein said input memory stores said elements of array D in accordance with a first order and said working memory outputs said elements of array D\u2081 in accordance with a second order.",
@@ -1480,6 +1583,7 @@
         "$ref": "#/texts/72"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "29. The interleaver according to claim 28 wherein said input memory stores elements of array D row by row and said working memory outputs elements of array D\u2081 column by column.",
@@ -1491,6 +1595,7 @@
         "$ref": "#/texts/72"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "30. The interleaver according to claim 27 said working memory punctures said array D\u2081 to the number of elements in the frame when the product of N\u2081 and N\u2082 is greater than the number of elements in the frame.",
@@ -1502,6 +1607,7 @@
         "$ref": "#/texts/72"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "31. An interleaver for interleaving elements of frames of data, the interleaver comprising; a memory for storing an index array I having N\u2081 rows enumerated as 0, 1, . . . N\u2081\u22121; and N\u2082 columns enumerated as 0, 1, . . . N\u2082\u22121, wherein N\u2081 and N\u2082 are positive integers greater than 1, and said memory also for storing elements of a received frame of data in each of a plurality of storage locations; a processor coupled to said memory for storing in row-by-row sequential positions in array I values indicative of corresponding locations of frame elements; and said processor also for permuting array I into array I\u2081 stored in said memory according to: I\u2081(\ud835\udc57,\ud835\udc58)=I(\ud835\udc57,(\u03b1j\ud835\udc58+\u03b2j)\ud835\udc5a\ud835\udc5c\ud835\udc51\ud835\udc43)  wherein j is an index through the rows of arrays I and I\u2081; k is an index through the columns of arrays I and I\u2081; \u03b1j and \u03b2j are integers predetermined for each row j; P is an integer at least equal to N\u2082; and each \u03b1j is a relative prime number relative to P, and whereby the frame of data as indexed by array I\u2081 is effectively permuted.",
@@ -1513,6 +1619,7 @@
         "$ref": "#/texts/72"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "32. The interleaver according to claim 31 wherein said processor permutes said stored elements according to said permuted index array I\u2081.",
@@ -1524,6 +1631,7 @@
         "$ref": "#/texts/72"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "33. The interleaver according to claim 31 wherein said memory outputs frame elements as indexed by entries of array I\u2081 taken other than row by row.",
@@ -1535,6 +1643,7 @@
         "$ref": "#/texts/72"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "34. The interleaver according to claim 33 wherein said memory outputs frame elements as indexed by entries of array I\u2081 taken column by column.",
@@ -1546,6 +1655,7 @@
         "$ref": "#/texts/72"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "35. The interleaver according to claim 31 wherein said memory punctures the frame of data to the number of elements in the frame of data when the product of N\u2081 and N\u2082 is greater than the number of elements in the frame of data.",
@@ -1555,5 +1665,6 @@
   "pictures": [],
   "tables": [],
   "key_value_items": [],
+  "form_items": [],
   "pages": {}
 }
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v2/picture_classification.doctags.txt b/tests/data/groundtruth/docling_v2/picture_classification.doctags.txt
index a86cbe7b..f95f9563 100644
--- a/tests/data/groundtruth/docling_v2/picture_classification.doctags.txt
+++ b/tests/data/groundtruth/docling_v2/picture_classification.doctags.txt
@@ -1,15 +1,11 @@
-<document>
-<section_header_level_1><location><page_1><loc_22><loc_83><loc_41><loc_84></location>Figures Example</section_header_level_1>
-<text><location><page_1><loc_22><loc_63><loc_78><loc_81></location>Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet.</text>
-<figure>
-<location><page_1><loc_22><loc_36><loc_78><loc_62></location>
-<caption>Figure 1: This is an example image.</caption>
-</figure>
-<text><location><page_1><loc_22><loc_15><loc_78><loc_30></location>Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua.</text>
-<text><location><page_2><loc_22><loc_66><loc_78><loc_84></location>Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet.</text>
-<figure>
-<location><page_2><loc_36><loc_36><loc_64><loc_65></location>
-<caption>Figure 2: This is an example image.</caption>
-</figure>
-<text><location><page_2><loc_22><loc_15><loc_78><loc_31></location>Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum.</text>
-</document>
\ No newline at end of file
+<doctag><section_header_level_1><loc_109><loc_79><loc_206><loc_87>Figures Example</section_header_level_1>
+<text><loc_109><loc_94><loc_390><loc_183>Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet.</text>
+<picture><loc_110><loc_192><loc_389><loc_322><caption><loc_185><loc_334><loc_314><loc_340>Figure 1: This is an example image.</caption></picture>
+<text><loc_109><loc_349><loc_390><loc_423>Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua.</text>
+<page_footer><loc_248><loc_439><loc_252><loc_445>1</page_footer>
+<page_break>
+<text><loc_109><loc_81><loc_390><loc_169>Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet.</text>
+<picture><loc_179><loc_176><loc_320><loc_321><caption><loc_185><loc_330><loc_314><loc_336>Figure 2: This is an example image.</caption></picture>
+<text><loc_109><loc_345><loc_390><loc_426>Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum.</text>
+<page_footer><loc_248><loc_439><loc_252><loc_445>2</page_footer>
+</doctag>
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v2/picture_classification.json b/tests/data/groundtruth/docling_v2/picture_classification.json
index 424bdca1..aadfbd4d 100644
--- a/tests/data/groundtruth/docling_v2/picture_classification.json
+++ b/tests/data/groundtruth/docling_v2/picture_classification.json
@@ -1 +1 @@
-{"schema_name": "DoclingDocument", "version": "1.0.0", "name": "picture_classification", "origin": {"mimetype": "application/pdf", "binary_hash": 6445357065749877499, "filename": "picture_classification.pdf", "uri": null}, "furniture": {"self_ref": "#/furniture", "parent": null, "children": [], "name": "_root_", "label": "unspecified"}, "body": {"self_ref": "#/body", "parent": null, "children": [{"cref": "#/texts/0"}, {"cref": "#/texts/1"}, {"cref": "#/texts/2"}, {"cref": "#/pictures/0"}, {"cref": "#/texts/3"}, {"cref": "#/texts/4"}, {"cref": "#/texts/5"}, {"cref": "#/texts/6"}, {"cref": "#/pictures/1"}, {"cref": "#/texts/7"}, {"cref": "#/texts/8"}], "name": "_root_", "label": "unspecified"}, "groups": [], "texts": [{"self_ref": "#/texts/0", "parent": {"cref": "#/body"}, "children": [], "label": "section_header", "prov": [{"page_no": 1, "bbox": {"l": 133.76800537109375, "t": 667.1912231445312, "r": 252.35513305664062, "b": 654.4518432617188, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 15]}], "orig": "Figures Example", "text": "Figures Example", "level": 1}, {"self_ref": "#/texts/1", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 133.76800537109375, "t": 642.3280639648438, "r": 477.4827575683594, "b": 501.97412109375, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 887]}], "orig": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet.", "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet."}, {"self_ref": "#/texts/2", "parent": {"cref": "#/body"}, "children": [], "label": "caption", "prov": [{"page_no": 1, "bbox": {"l": 226.89100646972656, "t": 262.86505126953125, "r": 384.35479736328125, "b": 254.0182647705078, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 35]}], "orig": "Figure 1: This is an example image.", "text": "Figure 1: This is an example image."}, {"self_ref": "#/texts/3", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 133.76800537109375, "t": 238.95504760742188, "r": 477.4817199707031, "b": 122.51225280761719, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 747]}], "orig": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua.", "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua."}, {"self_ref": "#/texts/4", "parent": {"cref": "#/body"}, "children": [], "label": "page_footer", "prov": [{"page_no": 1, "bbox": {"l": 303.13299560546875, "t": 96.27903747558594, "r": 308.1142883300781, "b": 87.43224334716797, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "1", "text": "1"}, {"self_ref": "#/texts/5", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 133.76800537109375, "t": 664.1490478515625, "r": 477.4817199707031, "b": 523.7951049804688, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 887]}], "orig": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet.", "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet."}, {"self_ref": "#/texts/6", "parent": {"cref": "#/body"}, "children": [], "label": "caption", "prov": [{"page_no": 2, "bbox": {"l": 226.89100646972656, "t": 268.7890319824219, "r": 384.35479736328125, "b": 259.9422607421875, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 35]}], "orig": "Figure 2: This is an example image.", "text": "Figure 2: This is an example image."}, {"self_ref": "#/texts/7", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 133.76800537109375, "t": 245.71804809570312, "r": 477.4817199707031, "b": 117.32023620605469, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 804]}], "orig": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum.", "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum."}, {"self_ref": "#/texts/8", "parent": {"cref": "#/body"}, "children": [], "label": "page_footer", "prov": [{"page_no": 2, "bbox": {"l": 303.13299560546875, "t": 96.27903747558594, "r": 308.1142883300781, "b": 87.43224334716797, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "2", "text": "2"}], "pictures": [{"self_ref": "#/pictures/0", "parent": {"cref": "#/body"}, "children": [], "label": "picture", "prov": [{"page_no": 1, "bbox": {"l": 134.9200439453125, "t": 487.109375, "r": 475.6635437011719, "b": 281.78173828125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 35]}], "captions": [{"cref": "#/texts/2"}], "references": [], "footnotes": [], "image": null, "annotations": []}, {"self_ref": "#/pictures/1", "parent": {"cref": "#/body"}, "children": [], "label": "picture", "prov": [{"page_no": 2, "bbox": {"l": 218.8155517578125, "t": 513.984619140625, "r": 391.96246337890625, "b": 283.10589599609375, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 35]}], "captions": [{"cref": "#/texts/6"}], "references": [], "footnotes": [], "image": null, "annotations": []}], "tables": [], "key_value_items": [], "pages": {"1": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 1}, "2": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 2}}}
\ No newline at end of file
+{"schema_name": "DoclingDocument", "version": "1.1.0", "name": "picture_classification", "origin": {"mimetype": "application/pdf", "binary_hash": 6445357065749877499, "filename": "picture_classification.pdf", "uri": null}, "furniture": {"self_ref": "#/furniture", "parent": null, "children": [], "content_layer": "furniture", "name": "_root_", "label": "unspecified"}, "body": {"self_ref": "#/body", "parent": null, "children": [{"cref": "#/texts/0"}, {"cref": "#/texts/1"}, {"cref": "#/pictures/0"}, {"cref": "#/texts/3"}, {"cref": "#/texts/4"}, {"cref": "#/texts/5"}, {"cref": "#/pictures/1"}, {"cref": "#/texts/7"}, {"cref": "#/texts/8"}], "content_layer": "body", "name": "_root_", "label": "unspecified"}, "groups": [], "texts": [{"self_ref": "#/texts/0", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "section_header", "prov": [{"page_no": 1, "bbox": {"l": 133.76801, "t": 667.19122, "r": 252.35513, "b": 654.45184, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 15]}], "orig": "Figures Example", "text": "Figures Example", "level": 1}, {"self_ref": "#/texts/1", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 133.76801, "t": 642.32806, "r": 477.48276, "b": 501.97412, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 887]}], "orig": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet.", "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet."}, {"self_ref": "#/texts/2", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "caption", "prov": [{"page_no": 1, "bbox": {"l": 226.89101, "t": 262.86505, "r": 384.3548, "b": 254.01826000000005, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 35]}], "orig": "Figure 1: This is an example image.", "text": "Figure 1: This is an example image."}, {"self_ref": "#/texts/3", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 133.76801, "t": 238.95505000000003, "r": 477.48172000000005, "b": 122.51225, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 747]}], "orig": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua.", "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua."}, {"self_ref": "#/texts/4", "parent": {"cref": "#/body"}, "children": [], "content_layer": "furniture", "label": "page_footer", "prov": [{"page_no": 1, "bbox": {"l": 303.133, "t": 96.27903700000002, "r": 308.11429, "b": 87.43224299999997, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "1", "text": "1"}, {"self_ref": "#/texts/5", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 133.76801, "t": 664.1490499999999, "r": 477.48172000000005, "b": 523.7951, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 887]}], "orig": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet.", "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet."}, {"self_ref": "#/texts/6", "parent": {"cref": "#/pictures/1"}, "children": [], "content_layer": "body", "label": "caption", "prov": [{"page_no": 2, "bbox": {"l": 226.89101, "t": 268.78903, "r": 384.3548, "b": 259.94226000000003, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 35]}], "orig": "Figure 2: This is an example image.", "text": "Figure 2: This is an example image."}, {"self_ref": "#/texts/7", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 2, "bbox": {"l": 133.76801, "t": 245.71804999999995, "r": 477.48172000000005, "b": 117.32024000000001, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 804]}], "orig": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum.", "text": "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren, no sea takimata sanctus est Lorem ipsum dolor sit amet. Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At vero eos et accusam et justo duo dolores et ea rebum."}, {"self_ref": "#/texts/8", "parent": {"cref": "#/body"}, "children": [], "content_layer": "furniture", "label": "page_footer", "prov": [{"page_no": 2, "bbox": {"l": 303.133, "t": 96.27903700000002, "r": 308.11429, "b": 87.43224299999997, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "2", "text": "2"}], "pictures": [{"self_ref": "#/pictures/0", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/2"}], "content_layer": "body", "label": "picture", "prov": [{"page_no": 1, "bbox": {"l": 134.9200439453125, "t": 487.109375, "r": 475.6635437011719, "b": 281.78173828125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [{"cref": "#/texts/2"}], "references": [], "footnotes": [], "image": null, "annotations": []}, {"self_ref": "#/pictures/1", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/6"}], "content_layer": "body", "label": "picture", "prov": [{"page_no": 2, "bbox": {"l": 218.8155517578125, "t": 513.9846496582031, "r": 391.96246337890625, "b": 283.10589599609375, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [{"cref": "#/texts/6"}], "references": [], "footnotes": [], "image": null, "annotations": []}], "tables": [], "key_value_items": [], "form_items": [], "pages": {"1": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 1}, "2": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 2}}}
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v2/pnas_sample.xml.itxt b/tests/data/groundtruth/docling_v2/pnas_sample.xml.itxt
new file mode 100644
index 00000000..e330362d
--- /dev/null
+++ b/tests/data/groundtruth/docling_v2/pnas_sample.xml.itxt
@@ -0,0 +1,148 @@
+item-0 at level 0: unspecified: group _root_
+  item-1 at level 1: title: The coreceptor mutation CCR5Δ32  ... V epidemics and is selected for by HIV
+    item-2 at level 2: paragraph: Amy D. Sullivan, Janis Wigginton, Denise Kirschner
+    item-3 at level 2: paragraph: Department of Microbiology and I ... dical School, Ann Arbor, MI 48109-0620
+    item-4 at level 2: section_header: Abstract
+      item-5 at level 3: text: We explore the impact of a host  ... creasing the frequency of this allele.
+    item-6 at level 2: text: Nineteen million people have die ...  factors such as host genetics (4, 5).
+    item-7 at level 2: text: To exemplify the contribution of ...  follow the CCR5Δ32 allelic frequency.
+    item-8 at level 2: text: We hypothesize that CCR5Δ32 limi ... g the frequency of this mutant allele.
+    item-9 at level 2: text: CCR5 is a host-cell chemokine re ... iral strain (such as X4 or R5X4) (30).
+    item-10 at level 2: section_header: The Model
+      item-11 at level 3: text: Because we are most concerned wi ... t both economic and social conditions.
+      item-12 at level 3: picture
+        item-12 at level 4: caption: Figure 1 A schematic representation of the basic compartmental HIV epidemic model. The criss-cross lines indicate the sexual mixing between different compartments. Each of these interactions has a positive probability of taking place; they also incorporate individual rates of transmission indicated as λ, but in full notation is λ î,,→i,j, where i,j,k is the phenotype of the infected partner and î, is the phenotype of the susceptible partner. Also shown are the different rates of disease progression, γ i,j,k , that vary according to genotype, gender, and stage. Thus, the interactions between different genotypes, genders, and stages are associated with a unique probability of HIV infection. M, male; F, female.
+      item-13 at level 3: table with [6x5]
+        item-13 at level 4: caption: Table 1 Children's genotype
+      item-14 at level 3: section_header: Parameter Estimates for the Model.
+        item-15 at level 4: text: Estimates for rates that govern  ... d in Fig. 1 are summarized as follows:
+        item-16 at level 4: formula:  \frac{dS_{i,j}(t)}{dt}={\chi}_{ ... ,\hat {k}{\rightarrow}i,j}S_{i,j}(t), 
+        item-17 at level 4: formula:  \hspace{1em}\hspace{1em}\hspace ... j,A}(t)-{\gamma}_{i,j,A}I_{i,j,A}(t), 
+        item-18 at level 4: formula:  \frac{dI_{i,j,B}(t)}{dt}={\gamm ... j,B}(t)-{\gamma}_{i,j,B}I_{i,j,B}(t), 
+        item-19 at level 4: formula:  \frac{dA(t)}{dt}={\gamma}_{i,j, ...  \right) -{\mu}_{A}A(t)-{\delta}A(t), 
+        item-20 at level 4: text: where, in addition to previously ... on of the infected partner, and j ≠ .
+        item-21 at level 4: table with [14x5]
+          item-21 at level 5: caption: Table 2 Transmission probabilities
+        item-22 at level 4: table with [8x3]
+          item-22 at level 5: caption: Table 3 Progression rates
+        item-23 at level 4: table with [20x3]
+          item-23 at level 5: caption: Table 4 Parameter values
+        item-24 at level 4: text: The effects of the CCR5 W/Δ32 an ... nting this probability of infection is
+        item-25 at level 4: formula:  {\lambda}_{\hat {i},\hat {j},\h ... \hat {i},\hat {j},\hat {k}} \right] , 
+        item-26 at level 4: text: where j ≠  is either male or fe ... e those with AIDS in the simulations).
+        item-27 at level 4: text: The average rate of partner acqu ... owing the male rates to vary (36, 37).
+        item-28 at level 4: section_header: Transmission probabilities.
+          item-29 at level 5: text: The effect of a genetic factor i ... reported; ref. 42) (ref. 43, Table 2).
+          item-30 at level 5: text: Given the assumption of no treat ... ases during the end stage of disease).
+        item-31 at level 4: section_header: Disease progression.
+          item-32 at level 5: text: We assume three stages of HIV in ... ssion rates are summarized in Table 3.
+      item-33 at level 3: section_header: Demographic Setting.
+        item-34 at level 4: text: Demographic parameters are based ... [suppressing (t) notation]: χ1,j 1,j =
+        item-35 at level 4: formula:  B_{r}\hspace{.167em}{ \,\substa ... }+I_{2,M,k})}{N_{M}} \right] + \right 
+        item-36 at level 4: formula:  p_{v} \left \left( \frac{(I_{1, ... ght] \right) \right] ,\hspace{.167em} 
+        item-37 at level 4: text: where the probability of HIV ver ... heir values are summarized in Table 4.
+    item-38 at level 2: section_header: Prevalence of HIV
+      item-39 at level 3: section_header: Demographics and Model Validation.
+        item-40 at level 4: text: The model was validated by using ... 5% to capture early epidemic behavior.
+        item-41 at level 4: text: In deciding on our initial value ... n within given subpopulations (2, 49).
+        item-42 at level 4: text: In the absence of HIV infection, ... those predicted by our model (Fig. 2).
+        item-43 at level 4: picture
+          item-43 at level 5: caption: Figure 2 Model simulation of HIV infection in a population lacking the protective CCR5Δ32 allele compared with national data from Kenya (healthy adults) and Mozambique (blood donors, ref. 17). The simulated population incorporates parameter estimates from sub-Saharan African demographics. Note the two outlier points from the Mozambique data were likely caused by underreporting in the early stages of the epidemic.
+      item-44 at level 3: section_header: Effects of the Allele on Prevalence.
+        item-45 at level 4: text: After validating the model in th ... among adults for total HIV/AIDS cases.
+        item-46 at level 4: text: Although CCR5Δ32/Δ32 homozygosit ... frequency of the mutation as 0.105573.
+        item-47 at level 4: text: Fig. 3 shows the prevalence of H ... mic, reaching 18% before leveling off.
+        item-48 at level 4: picture
+          item-48 at level 5: caption: Figure 3 Prevalence of HIV/AIDS in the adult population as predicted by the model. The top curve (○) indicates prevalence in a population lacking the protective allele. We compare that to a population with 19% heterozygous and 1% homozygous for the allele (implying an allelic frequency of 0.105573. Confidence interval bands (light gray) are shown around the median simulation () providing a range of uncertainty in evaluating parameters for the effect of the mutation on the infectivity and the duration of asymptomatic HIV for heterozygotes.
+        item-49 at level 4: text: In contrast, when a proportion o ... gins to decline slowly after 70 years.
+        item-50 at level 4: text: In the above simulations we assu ...  in the presence of the CCR5 mutation.
+        item-51 at level 4: text: Because some parameters (e.g., r ... s a major influence on disease spread.
+    item-52 at level 2: section_header: HIV Induces Selective Pressure on Genotype Frequency
+      item-53 at level 3: text: To observe changes in the freque ...  for ≈1,600 years before leveling off.
+      item-54 at level 3: picture
+        item-54 at level 4: caption: Figure 4 Effects of HIV-1 on selection of the CCR5Δ32 allele. The Hardy-Weinberg equilibrium level is represented in the no-infection simulation (solid lines) for each population. Divergence from the original Hardy-Weinberg equilibrium is shown to occur in the simulations that include HIV infection (dashed lines). Fraction of the total subpopulations are presented: (A) wild types (W/W), (B) heterozygotes (W/Δ32), and (C) homozygotes (Δ32/Δ32). Note that we initiate this simulation with a much lower allelic frequency (0.00105) than used in the rest of the study to better exemplify the actual selective effect over a 1,000-year time scale. (D) The allelic selection effect over a 2,000-year time scale.
+    item-55 at level 2: section_header: Discussion
+      item-56 at level 3: text: This study illustrates how popul ... pulations where the allele is present.
+      item-57 at level 3: text: We also observed that HIV can pr ... is) have been present for much longer.
+      item-58 at level 3: text: Two mathematical models have con ... ce of the pathogen constant over time.
+      item-59 at level 3: text: Even within our focus on host pr ... f a protective allele such as CCR5Δ32.
+      item-60 at level 3: text: Although our models demonstrate  ... f the population to epidemic HIV (16).
+      item-61 at level 3: text: In assessing the HIV/AIDS epidem ... for education and prevention programs.
+    item-62 at level 2: section_header: Acknowledgments
+      item-63 at level 3: text: We thank Mark Krosky, Katia Koel ... ers for extremely insightful comments.
+    item-64 at level 2: section_header: References
+      item-65 at level 3: list: group list
+        item-66 at level 4: list_item: Weiss HA, Hawkes S. Leprosy Rev 72:92–98 (2001). PMID: 11355525
+        item-67 at level 4: list_item: Taha TE, Dallabetta GA, Hoover D ...  AIDS 12:197–203 (1998). PMID: 9468369
+        item-68 at level 4: list_item: AIDS Epidemic Update. Geneva: World Health Organization1–17 (1998).
+        item-69 at level 4: list_item: D'Souza MP, Harden VA. Nat Med 2:1293–1300 (1996). PMID: 8946819
+        item-70 at level 4: list_item: Martinson JJ, Chapman NH, Rees D ... Genet 16:100–103 (1997). PMID: 9140404
+        item-71 at level 4: list_item: Roos MTL, Lange JMA, deGoede REY ...  Dis 165:427–432 (1992). PMID: 1347054
+        item-72 at level 4: list_item: Garred P, Eugen-Olsen J, Iversen ...  Lancet 349:1884 (1997). PMID: 9217763
+        item-73 at level 4: list_item: Katzenstein TL, Eugen-Olsen J, H ... rovirol 16:10–14 (1997). PMID: 9377119
+        item-74 at level 4: list_item: deRoda H, Meyer K, Katzenstain W ... ce 273:1856–1862 (1996). PMID: 8791590
+        item-75 at level 4: list_item: Meyer L, Magierowska M, Hubert J ...  AIDS 11:F73–F78 (1997). PMID: 9302436
+        item-76 at level 4: list_item: Smith MW, Dean M, Carrington M,  ... ence 277:959–965 (1997). PMID: 9252328
+        item-77 at level 4: list_item: Samson M, Libert F, Doranz BJ, R ... don) 382:722–725 (1996). PMID: 8751444
+        item-78 at level 4: list_item: McNicholl JM, Smith DK, Qari SH, ... ct Dis 3:261–271 (1997). PMID: 9284370
+        item-79 at level 4: list_item: Michael NL, Chang G, Louie LG, M ... at Med 3:338–340 (1997). PMID: 9055864
+        item-80 at level 4: list_item: Mayaud P, Mosha F, Todd J, Balir ... IDS 11:1873–1880 (1997). PMID: 9412707
+        item-81 at level 4: list_item: Hoffman IF, Jere CS, Taylor TE,  ... li P, Dyer JR. AIDS 13:487–494 (1998).
+        item-82 at level 4: list_item: HIV/AIDS Surveillance Database.  ...  International Programs Center (1999).
+        item-83 at level 4: list_item: Anderson RM, May RM, McLean AR.  ... don) 332:228–234 (1988). PMID: 3279320
+        item-84 at level 4: list_item: Berger EA, Doms RW, Fenyo EM, Ko ... (London) 391:240 (1998). PMID: 9440686
+        item-85 at level 4: list_item: Alkhatib G, Broder CC, Berger EA ... rol 70:5487–5494 (1996). PMID: 8764060
+        item-86 at level 4: list_item: Choe H, Farzan M, Sun Y, Sulliva ... ell 85:1135–1148 (1996). PMID: 8674119
+        item-87 at level 4: list_item: Deng H, Liu R, Ellmeier W, Choe  ... don) 381:661–666 (1996). PMID: 8649511
+        item-88 at level 4: list_item: Doranz BJ, Rucker J, Yi Y, Smyth ... ell 85:1149–1158 (1996). PMID: 8674120
+        item-89 at level 4: list_item: Dragic T, Litwin V, Allaway GP,  ... don) 381:667–673 (1996). PMID: 8649512
+        item-90 at level 4: list_item: Zhu T, Mo H, Wang N, Nam DS, Cao ... ce 261:1179–1181 (1993). PMID: 8356453
+        item-91 at level 4: list_item: Bjorndal A, Deng H, Jansson M, F ... rol 71:7478–7487 (1997). PMID: 9311827
+        item-92 at level 4: list_item: Conner RI, Sheridan KE, Ceradini ...  Med 185:621–628 (1997). PMID: 9034141
+        item-93 at level 4: list_item: Liu R, Paxton WA, Choe S, Ceradi ...  Cell 86:367–377 (1996). PMID: 8756719
+        item-94 at level 4: list_item: Mussico M, Lazzarin A, Nicolosi  ... w) 154:1971–1976 (1994). PMID: 8074601
+        item-95 at level 4: list_item: Michael NL, Nelson JA, KewalRama ... rol 72:6040–6047 (1998). PMID: 9621067
+        item-96 at level 4: list_item: Hethcote HW, Yorke JA. Gonorrhea ...  and Control. Berlin: Springer (1984).
+        item-97 at level 4: list_item: Anderson RM, May RM. Nature (London) 333:514–522 (1988). PMID: 3374601
+        item-98 at level 4: list_item: Asiimwe-Okiror G, Opio AA, Musin ... IDS 11:1757–1763 (1997). PMID: 9386811
+        item-99 at level 4: list_item: Carael M, Cleland J, Deheneffe J ... AIDS 9:1171–1175 (1995). PMID: 8519454
+        item-100 at level 4: list_item: Blower SM, Boe C. J AIDS 6:1347–1352 (1993). PMID: 8254474
+        item-101 at level 4: list_item: Kirschner D. J Appl Math 56:143–166 (1996).
+        item-102 at level 4: list_item: Le Pont F, Blower S. J AIDS 4:987–999 (1991). PMID: 1890608
+        item-103 at level 4: list_item: Kim MY, Lagakos SW. Ann Epidemiol 1:117–128 (1990). PMID: 1669741
+        item-104 at level 4: list_item: Anderson RM, May RM. Infectious  ... ol. Oxford: Oxford Univ. Press (1992).
+        item-105 at level 4: list_item: Ragni MV, Faruki H, Kingsley LA. ... ed Immune Defic Syndr 17:42–45 (1998).
+        item-106 at level 4: list_item: Kaplan JE, Khabbaz RF, Murphy EL ... virol 12:193–201 (1996). PMID: 8680892
+        item-107 at level 4: list_item: Padian NS, Shiboski SC, Glass SO ... nghoff E. Am J Edu 146:350–357 (1997).
+        item-108 at level 4: list_item: Leynaert B, Downs AM, de Vincenzi I. Am J Edu 148:88–96 (1998).
+        item-109 at level 4: list_item: Garnett GP, Anderson RM. J Acquired Immune Defic Syndr 9:500–513 (1995).
+        item-110 at level 4: list_item: Stigum H, Magnus P, Harris JR, S ... eteig LS. Am J Edu 145:636–643 (1997).
+        item-111 at level 4: list_item: Ho DD, Neumann AU, Perelson AS,  ... don) 373:123–126 (1995). PMID: 7816094
+        item-112 at level 4: list_item: World Resources (1998–1999). Oxford: Oxford Univ. Press (1999).
+        item-113 at level 4: list_item: Kostrikis LG, Neumann AU, Thomso ...  73:10264–10271 (1999). PMID: 10559343
+        item-114 at level 4: list_item: Low-Beer D, Stoneburner RL, Muku ... at Med 3:553–557 (1997). PMID: 9142126
+        item-115 at level 4: list_item: Grosskurth H, Mosha F, Todd J, S ... . AIDS 9:927–934 (1995). PMID: 7576329
+        item-116 at level 4: list_item: Melo J, Beby-Defaux A, Faria C,  ... AIDS 23:203–204 (2000). PMID: 10737436
+        item-117 at level 4: list_item: Iman RL, Helton JC, Campbell JE. J Quality Technol 13:174–183 (1981).
+        item-118 at level 4: list_item: Iman RL, Helton JC, Campbell JE. J Quality Technol 13:232–240 (1981).
+        item-119 at level 4: list_item: Blower SM, Dowlatabadi H. Int Stat Rev 62:229–243 (1994).
+        item-120 at level 4: list_item: Porco TC, Blower SM. Theor Popul Biol 54:117–132 (1998). PMID: 9733654
+        item-121 at level 4: list_item: Blower SM, Porco TC, Darby G. Nat Med 4:673–678 (1998). PMID: 9623975
+        item-122 at level 4: list_item: Libert F, Cochaux P, Beckman G,  ...  Genet 7:399–406 (1998). PMID: 9466996
+        item-123 at level 4: list_item: Lalani AS, Masters J, Zeng W, Ba ... e 286:1968–1971 (1999). PMID: 10583963
+        item-124 at level 4: list_item: Kermack WO, McKendrick AG. Proc R Soc London 261:700–721 (1927).
+        item-125 at level 4: list_item: Gupta S, Hill AVS. Proc R Soc London Ser B 260:271–277 (1995).
+        item-126 at level 4: list_item: Ruwende C, Khoo SC, Snow RW, Yat ... don) 376:246–249 (1995). PMID: 7617034
+        item-127 at level 4: list_item: McDermott DH, Zimmerman PA, Guig ... ncet 352:866–870 (1998). PMID: 9742978
+        item-128 at level 4: list_item: Kostrikis LG, Huang Y, Moore JP, ... at Med 4:350–353 (1998). PMID: 9500612
+        item-129 at level 4: list_item: Winkler C, Modi W, Smith MW, Nel ... ence 279:389–393 (1998). PMID: 9430590
+        item-130 at level 4: list_item: Martinson JJ, Hong L, Karanicola ... AIDS 14:483–489 (2000). PMID: 10780710
+        item-131 at level 4: list_item: Vernazza PL, Eron JJ, Fiscus SA, ... AIDS 13:155–166 (1999). PMID: 10202821
+  item-132 at level 1: caption: Figure 1 A schematic representat ...  of HIV infection. M, male; F, female.
+  item-133 at level 1: caption: Table 1 Children's genotype
+  item-134 at level 1: caption: Table 2 Transmission probabilities
+  item-135 at level 1: caption: Table 3 Progression rates
+  item-136 at level 1: caption: Table 4 Parameter values
+  item-137 at level 1: caption: Figure 2 Model simulation of HIV ... g in the early stages of the epidemic.
+  item-138 at level 1: caption: Figure 3 Prevalence of HIV/AIDS  ... of asymptomatic HIV for heterozygotes.
+  item-139 at level 1: caption: Figure 4 Effects of HIV-1 on sel ... n effect over a 2,000-year time scale.
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v2/pnas_sample.xml.json b/tests/data/groundtruth/docling_v2/pnas_sample.xml.json
new file mode 100644
index 00000000..8e494af4
--- /dev/null
+++ b/tests/data/groundtruth/docling_v2/pnas_sample.xml.json
@@ -0,0 +1,6353 @@
+{
+  "schema_name": "DoclingDocument",
+  "version": "1.0.0",
+  "name": "pnas_sample",
+  "origin": {
+    "mimetype": "application/xml",
+    "binary_hash": 3457590109795003070,
+    "filename": "pnas_sample.xml"
+  },
+  "furniture": {
+    "self_ref": "#/furniture",
+    "children": [],
+    "name": "_root_",
+    "label": "unspecified"
+  },
+  "body": {
+    "self_ref": "#/body",
+    "children": [
+      {
+        "$ref": "#/texts/0"
+      },
+      {
+        "$ref": "#/texts/11"
+      },
+      {
+        "$ref": "#/texts/12"
+      },
+      {
+        "$ref": "#/texts/20"
+      },
+      {
+        "$ref": "#/texts/21"
+      },
+      {
+        "$ref": "#/texts/22"
+      },
+      {
+        "$ref": "#/texts/42"
+      },
+      {
+        "$ref": "#/texts/47"
+      },
+      {
+        "$ref": "#/texts/53"
+      }
+    ],
+    "name": "_root_",
+    "label": "unspecified"
+  },
+  "groups": [
+    {
+      "self_ref": "#/groups/0",
+      "parent": {
+        "$ref": "#/texts/63"
+      },
+      "children": [
+        {
+          "$ref": "#/texts/64"
+        },
+        {
+          "$ref": "#/texts/65"
+        },
+        {
+          "$ref": "#/texts/66"
+        },
+        {
+          "$ref": "#/texts/67"
+        },
+        {
+          "$ref": "#/texts/68"
+        },
+        {
+          "$ref": "#/texts/69"
+        },
+        {
+          "$ref": "#/texts/70"
+        },
+        {
+          "$ref": "#/texts/71"
+        },
+        {
+          "$ref": "#/texts/72"
+        },
+        {
+          "$ref": "#/texts/73"
+        },
+        {
+          "$ref": "#/texts/74"
+        },
+        {
+          "$ref": "#/texts/75"
+        },
+        {
+          "$ref": "#/texts/76"
+        },
+        {
+          "$ref": "#/texts/77"
+        },
+        {
+          "$ref": "#/texts/78"
+        },
+        {
+          "$ref": "#/texts/79"
+        },
+        {
+          "$ref": "#/texts/80"
+        },
+        {
+          "$ref": "#/texts/81"
+        },
+        {
+          "$ref": "#/texts/82"
+        },
+        {
+          "$ref": "#/texts/83"
+        },
+        {
+          "$ref": "#/texts/84"
+        },
+        {
+          "$ref": "#/texts/85"
+        },
+        {
+          "$ref": "#/texts/86"
+        },
+        {
+          "$ref": "#/texts/87"
+        },
+        {
+          "$ref": "#/texts/88"
+        },
+        {
+          "$ref": "#/texts/89"
+        },
+        {
+          "$ref": "#/texts/90"
+        },
+        {
+          "$ref": "#/texts/91"
+        },
+        {
+          "$ref": "#/texts/92"
+        },
+        {
+          "$ref": "#/texts/93"
+        },
+        {
+          "$ref": "#/texts/94"
+        },
+        {
+          "$ref": "#/texts/95"
+        },
+        {
+          "$ref": "#/texts/96"
+        },
+        {
+          "$ref": "#/texts/97"
+        },
+        {
+          "$ref": "#/texts/98"
+        },
+        {
+          "$ref": "#/texts/99"
+        },
+        {
+          "$ref": "#/texts/100"
+        },
+        {
+          "$ref": "#/texts/101"
+        },
+        {
+          "$ref": "#/texts/102"
+        },
+        {
+          "$ref": "#/texts/103"
+        },
+        {
+          "$ref": "#/texts/104"
+        },
+        {
+          "$ref": "#/texts/105"
+        },
+        {
+          "$ref": "#/texts/106"
+        },
+        {
+          "$ref": "#/texts/107"
+        },
+        {
+          "$ref": "#/texts/108"
+        },
+        {
+          "$ref": "#/texts/109"
+        },
+        {
+          "$ref": "#/texts/110"
+        },
+        {
+          "$ref": "#/texts/111"
+        },
+        {
+          "$ref": "#/texts/112"
+        },
+        {
+          "$ref": "#/texts/113"
+        },
+        {
+          "$ref": "#/texts/114"
+        },
+        {
+          "$ref": "#/texts/115"
+        },
+        {
+          "$ref": "#/texts/116"
+        },
+        {
+          "$ref": "#/texts/117"
+        },
+        {
+          "$ref": "#/texts/118"
+        },
+        {
+          "$ref": "#/texts/119"
+        },
+        {
+          "$ref": "#/texts/120"
+        },
+        {
+          "$ref": "#/texts/121"
+        },
+        {
+          "$ref": "#/texts/122"
+        },
+        {
+          "$ref": "#/texts/123"
+        },
+        {
+          "$ref": "#/texts/124"
+        },
+        {
+          "$ref": "#/texts/125"
+        },
+        {
+          "$ref": "#/texts/126"
+        },
+        {
+          "$ref": "#/texts/127"
+        },
+        {
+          "$ref": "#/texts/128"
+        },
+        {
+          "$ref": "#/texts/129"
+        }
+      ],
+      "name": "list",
+      "label": "list"
+    }
+  ],
+  "texts": [
+    {
+      "self_ref": "#/texts/0",
+      "parent": {
+        "$ref": "#/body"
+      },
+      "children": [
+        {
+          "$ref": "#/texts/1"
+        },
+        {
+          "$ref": "#/texts/2"
+        },
+        {
+          "$ref": "#/texts/3"
+        },
+        {
+          "$ref": "#/texts/5"
+        },
+        {
+          "$ref": "#/texts/6"
+        },
+        {
+          "$ref": "#/texts/7"
+        },
+        {
+          "$ref": "#/texts/8"
+        },
+        {
+          "$ref": "#/texts/9"
+        },
+        {
+          "$ref": "#/texts/37"
+        },
+        {
+          "$ref": "#/texts/51"
+        },
+        {
+          "$ref": "#/texts/54"
+        },
+        {
+          "$ref": "#/texts/61"
+        },
+        {
+          "$ref": "#/texts/63"
+        }
+      ],
+      "label": "title",
+      "prov": [],
+      "orig": "The coreceptor mutation CCR5\u039432 influences the dynamics of HIV epidemics and is selected for by HIV",
+      "text": "The coreceptor mutation CCR5\u039432 influences the dynamics of HIV epidemics and is selected for by HIV"
+    },
+    {
+      "self_ref": "#/texts/1",
+      "parent": {
+        "$ref": "#/texts/0"
+      },
+      "children": [],
+      "label": "paragraph",
+      "prov": [],
+      "orig": "Amy D. Sullivan, Janis Wigginton, Denise Kirschner",
+      "text": "Amy D. Sullivan, Janis Wigginton, Denise Kirschner"
+    },
+    {
+      "self_ref": "#/texts/2",
+      "parent": {
+        "$ref": "#/texts/0"
+      },
+      "children": [],
+      "label": "paragraph",
+      "prov": [],
+      "orig": "Department of Microbiology and Immunology, University  of Michigan Medical School, Ann Arbor, MI 48109-0620",
+      "text": "Department of Microbiology and Immunology, University  of Michigan Medical School, Ann Arbor, MI 48109-0620"
+    },
+    {
+      "self_ref": "#/texts/3",
+      "parent": {
+        "$ref": "#/texts/0"
+      },
+      "children": [
+        {
+          "$ref": "#/texts/4"
+        }
+      ],
+      "label": "section_header",
+      "prov": [],
+      "orig": "Abstract",
+      "text": "Abstract",
+      "level": 1
+    },
+    {
+      "self_ref": "#/texts/4",
+      "parent": {
+        "$ref": "#/texts/3"
+      },
+      "children": [],
+      "label": "text",
+      "prov": [],
+      "orig": "We explore the impact of a host genetic factor on heterosexual HIV epidemics by using a deterministic mathematical model. A protective allele unequally distributed across populations is exemplified in our models by the 32-bp deletion in the host-cell chemokine receptor CCR5, CCR5\u039432. Individuals homozygous for CCR5\u039432 are protected against HIV infection whereas those heterozygous for CCR5\u039432 have lower pre-AIDS viral loads and delayed progression to AIDS. CCR5\u039432 may limit HIV spread by decreasing the probability of both risk of infection and infectiousness. In this work, we characterize epidemic HIV within three dynamic subpopulations: CCR5/CCR5 (homozygous, wild type), CCR5/CCR5\u039432 (heterozygous), and CCR5\u039432/CCR5\u039432 (homozygous, mutant). Our results indicate that prevalence of HIV/AIDS is greater in populations lacking the CCR5\u039432 alleles (homozygous wild types only) as compared with populations that include people heterozygous or homozygous for CCR5\u039432. Also, we show that HIV can provide selective pressure for CCR5\u039432, increasing the frequency of this allele.",
+      "text": "We explore the impact of a host genetic factor on heterosexual HIV epidemics by using a deterministic mathematical model. A protective allele unequally distributed across populations is exemplified in our models by the 32-bp deletion in the host-cell chemokine receptor CCR5, CCR5\u039432. Individuals homozygous for CCR5\u039432 are protected against HIV infection whereas those heterozygous for CCR5\u039432 have lower pre-AIDS viral loads and delayed progression to AIDS. CCR5\u039432 may limit HIV spread by decreasing the probability of both risk of infection and infectiousness. In this work, we characterize epidemic HIV within three dynamic subpopulations: CCR5/CCR5 (homozygous, wild type), CCR5/CCR5\u039432 (heterozygous), and CCR5\u039432/CCR5\u039432 (homozygous, mutant). Our results indicate that prevalence of HIV/AIDS is greater in populations lacking the CCR5\u039432 alleles (homozygous wild types only) as compared with populations that include people heterozygous or homozygous for CCR5\u039432. Also, we show that HIV can provide selective pressure for CCR5\u039432, increasing the frequency of this allele."
+    },
+    {
+      "self_ref": "#/texts/5",
+      "parent": {
+        "$ref": "#/texts/0"
+      },
+      "children": [],
+      "label": "text",
+      "prov": [],
+      "orig": "Nineteen million people have died of AIDS since the discovery of HIV in the 1980s. In 1999 alone, 5.4 million people were newly infected with HIV (ref. 1 and http://www.unaids.org/epidemicupdate/report/Epireport.html). (For brevity, HIV-1 is referred to as HIV in this paper.) Sub-Saharan Africa has been hardest hit, with more than 20% of the general population HIV-positive in some countries (2, 3). In comparison, heterosexual epidemics in developed, market-economy countries have not reached such severe levels. Factors contributing to the severity of the epidemic in economically developing countries abound, including economic, health, and social differences such as high levels of sexually transmitted diseases and a lack of prevention programs. However, the staggering rate at which the epidemic has spread in sub-Saharan Africa has not been adequately explained. The rate and severity of this epidemic also could indicate a greater underlying susceptibility to HIV attributable not only to sexually transmitted disease, economics, etc., but also to other more ubiquitous factors such as host genetics (4, 5).",
+      "text": "Nineteen million people have died of AIDS since the discovery of HIV in the 1980s. In 1999 alone, 5.4 million people were newly infected with HIV (ref. 1 and http://www.unaids.org/epidemicupdate/report/Epireport.html). (For brevity, HIV-1 is referred to as HIV in this paper.) Sub-Saharan Africa has been hardest hit, with more than 20% of the general population HIV-positive in some countries (2, 3). In comparison, heterosexual epidemics in developed, market-economy countries have not reached such severe levels. Factors contributing to the severity of the epidemic in economically developing countries abound, including economic, health, and social differences such as high levels of sexually transmitted diseases and a lack of prevention programs. However, the staggering rate at which the epidemic has spread in sub-Saharan Africa has not been adequately explained. The rate and severity of this epidemic also could indicate a greater underlying susceptibility to HIV attributable not only to sexually transmitted disease, economics, etc., but also to other more ubiquitous factors such as host genetics (4, 5)."
+    },
+    {
+      "self_ref": "#/texts/6",
+      "parent": {
+        "$ref": "#/texts/0"
+      },
+      "children": [],
+      "label": "text",
+      "prov": [],
+      "orig": "To exemplify the contribution of such a host genetic factor to HIV prevalence trends, we consider a well-characterized 32-bp deletion in the host-cell chemokine receptor CCR5, CCR5\u039432. When HIV binds to host cells, it uses the CD4 receptor on the surface of host immune cells together with a coreceptor, mainly the CCR5 and CXCR4 chemokine receptors (6). Homozygous mutations for this 32-bp deletion offer almost complete protection from HIV infection, and heterozygous mutations are associated with lower pre-AIDS viral loads and delayed progression to AIDS (7\u201314). CCR5\u039432 generally is found in populations of European descent, with allelic frequencies ranging from 0 to 0.29 (13). African and Asian populations studied outside the United States or Europe appear to lack the CCR5\u039432 allele, with an allelic frequency of almost zero (5, 13). Thus, to understand the effects of a protective allele, we use a mathematical model to track prevalence of HIV in populations with or without CCR5\u039432 heterozygous and homozygous people and also to follow the CCR5\u039432 allelic frequency.",
+      "text": "To exemplify the contribution of such a host genetic factor to HIV prevalence trends, we consider a well-characterized 32-bp deletion in the host-cell chemokine receptor CCR5, CCR5\u039432. When HIV binds to host cells, it uses the CD4 receptor on the surface of host immune cells together with a coreceptor, mainly the CCR5 and CXCR4 chemokine receptors (6). Homozygous mutations for this 32-bp deletion offer almost complete protection from HIV infection, and heterozygous mutations are associated with lower pre-AIDS viral loads and delayed progression to AIDS (7\u201314). CCR5\u039432 generally is found in populations of European descent, with allelic frequencies ranging from 0 to 0.29 (13). African and Asian populations studied outside the United States or Europe appear to lack the CCR5\u039432 allele, with an allelic frequency of almost zero (5, 13). Thus, to understand the effects of a protective allele, we use a mathematical model to track prevalence of HIV in populations with or without CCR5\u039432 heterozygous and homozygous people and also to follow the CCR5\u039432 allelic frequency."
+    },
+    {
+      "self_ref": "#/texts/7",
+      "parent": {
+        "$ref": "#/texts/0"
+      },
+      "children": [],
+      "label": "text",
+      "prov": [],
+      "orig": "We hypothesize that CCR5\u039432 limits epidemic HIV by decreasing infection rates, and we evaluate the relative contributions to this by the probability of infection and duration of infectivity. To capture HIV infection as a chronic infectious disease together with vertical transmission occurring in untreated mothers, we model a dynamic population (i.e., populations that vary in growth rates because of fluctuations in birth or death rates) based on realistic demographic characteristics (18). This scenario also allows tracking of the allelic frequencies over time. This work considers how a specific host genetic factor affecting HIV infectivity and viremia at the individual level might influence the epidemic in a dynamic population and how HIV exerts selective pressure, altering the frequency of this mutant allele.",
+      "text": "We hypothesize that CCR5\u039432 limits epidemic HIV by decreasing infection rates, and we evaluate the relative contributions to this by the probability of infection and duration of infectivity. To capture HIV infection as a chronic infectious disease together with vertical transmission occurring in untreated mothers, we model a dynamic population (i.e., populations that vary in growth rates because of fluctuations in birth or death rates) based on realistic demographic characteristics (18). This scenario also allows tracking of the allelic frequencies over time. This work considers how a specific host genetic factor affecting HIV infectivity and viremia at the individual level might influence the epidemic in a dynamic population and how HIV exerts selective pressure, altering the frequency of this mutant allele."
+    },
+    {
+      "self_ref": "#/texts/8",
+      "parent": {
+        "$ref": "#/texts/0"
+      },
+      "children": [],
+      "label": "text",
+      "prov": [],
+      "orig": "CCR5 is a host-cell chemokine receptor, which is also used as a coreceptor by R5 strains of HIV that are generally acquired during sexual transmission (6, 19\u201325). As infection progresses to AIDS the virus expands its repertoire of potential coreceptors to include other CC-family and CXC-family receptors in roughly 50% of patients (19, 26, 27). CCR5\u039432 was identified in HIV-resistant people (28). Benefits to individuals from the mutation in this allele are as follows. Persons homozygous for the CCR5\u039432 mutation are almost nonexistent in HIV-infected populations (11, 12) (see ref. 13 for review). Persons heterozygous for the mutant allele (CCR5 W/\u039432) tend to have lower pre-AIDS viral loads. Aside from the beneficial effects that lower viral loads may have for individuals, there is also an altruistic effect, as transmission rates are reduced for individuals with low viral loads (as compared with, for example, AZT and other studies; ref. 29). Finally, individuals heterozygous for the mutant allele (CCR5 W/\u039432) also have a slower progression to AIDS than those homozygous for the wild-type allele (CCR5 W/W) (7\u201310), remaining in the population 2 years longer, on average. Interestingly, the dearth of information on HIV disease progression in people homozygous for the CCR5\u039432 allele (CCR5 \u039432/\u039432) stems from the rarity of HIV infection in this group (4, 12, 28). However, in case reports of HIV-infected CCR5 \u039432/\u039432 homozygotes, a rapid decline in CD4+ T cells and a high viremia are observed, likely because of initial infection with a more aggressive viral strain (such as X4 or R5X4) (30).",
+      "text": "CCR5 is a host-cell chemokine receptor, which is also used as a coreceptor by R5 strains of HIV that are generally acquired during sexual transmission (6, 19\u201325). As infection progresses to AIDS the virus expands its repertoire of potential coreceptors to include other CC-family and CXC-family receptors in roughly 50% of patients (19, 26, 27). CCR5\u039432 was identified in HIV-resistant people (28). Benefits to individuals from the mutation in this allele are as follows. Persons homozygous for the CCR5\u039432 mutation are almost nonexistent in HIV-infected populations (11, 12) (see ref. 13 for review). Persons heterozygous for the mutant allele (CCR5 W/\u039432) tend to have lower pre-AIDS viral loads. Aside from the beneficial effects that lower viral loads may have for individuals, there is also an altruistic effect, as transmission rates are reduced for individuals with low viral loads (as compared with, for example, AZT and other studies; ref. 29). Finally, individuals heterozygous for the mutant allele (CCR5 W/\u039432) also have a slower progression to AIDS than those homozygous for the wild-type allele (CCR5 W/W) (7\u201310), remaining in the population 2 years longer, on average. Interestingly, the dearth of information on HIV disease progression in people homozygous for the CCR5\u039432 allele (CCR5 \u039432/\u039432) stems from the rarity of HIV infection in this group (4, 12, 28). However, in case reports of HIV-infected CCR5 \u039432/\u039432 homozygotes, a rapid decline in CD4+ T cells and a high viremia are observed, likely because of initial infection with a more aggressive viral strain (such as X4 or R5X4) (30)."
+    },
+    {
+      "self_ref": "#/texts/9",
+      "parent": {
+        "$ref": "#/texts/0"
+      },
+      "children": [
+        {
+          "$ref": "#/texts/10"
+        },
+        {
+          "$ref": "#/pictures/0"
+        },
+        {
+          "$ref": "#/tables/0"
+        },
+        {
+          "$ref": "#/texts/13"
+        },
+        {
+          "$ref": "#/texts/32"
+        }
+      ],
+      "label": "section_header",
+      "prov": [],
+      "orig": "The Model",
+      "text": "The Model",
+      "level": 1
+    },
+    {
+      "self_ref": "#/texts/10",
+      "parent": {
+        "$ref": "#/texts/9"
+      },
+      "children": [],
+      "label": "text",
+      "prov": [],
+      "orig": "Because we are most concerned with understanding the severity of the epidemic in developing countries where the majority of infection is heterosexual, we consider a purely heterosexual model. To model the effects of the allele in the population, we examine the rate of HIV spread by using an enhanced susceptible-infected-AIDS model of epidemic HIV (for review see ref. 31). Our model compares two population scenarios: a CCR5 wild-type population and one with CCR5\u039432 heterozygotes and homozygotes in addition to the wild type. To model the scenario where there are only wild-type individuals present in the population (i.e., CCR5 W/W), we track the sexually active susceptibles at time t [Si,j (t)], where i = 1 refers to genotype (CCR5 W/W only in this case) and j is either the male or female subpopulation. We also track those who are HIV-positive at time t not yet having AIDS in Ii,j,k (t) where k refers to stage of HIV infection [primary (A) or asymptomatic (B)]. The total number of individuals with AIDS at time t are tracked in A(t). The source population are children, \u03c7 i,j (t), who mature into the sexually active population at time t (Fig. 1, Table 1). We compare the model of a population lacking the CCR5\u039432 allele to a demographically similar population with a high frequency of the allele. When genetic heterogeneity is included, male and female subpopulations are each further divided into three distinct genotypic groups, yielding six susceptible subpopulations, [Si,j (t), where i ranges from 1 to 3, where 1 = CCR5W/W; 2 = CCR5 W/\u039432; 3 = CCR5 \u039432/\u039432]. The infected classes, Ii,j,k (t), also increase in number to account for these new genotype compartments. In both settings we assume there is no treatment available and no knowledge of HIV status by people in the early acute and middle asymptomatic stages (both conditions exist in much of sub-Saharan Africa). In addition, we assume that sexual mixing in the population occurs randomly with respect to genotype and HIV disease status, all HIV-infected people eventually progress to AIDS, and no barrier contraceptives are used. These last assumptions reflect both economic and social conditions.",
+      "text": "Because we are most concerned with understanding the severity of the epidemic in developing countries where the majority of infection is heterosexual, we consider a purely heterosexual model. To model the effects of the allele in the population, we examine the rate of HIV spread by using an enhanced susceptible-infected-AIDS model of epidemic HIV (for review see ref. 31). Our model compares two population scenarios: a CCR5 wild-type population and one with CCR5\u039432 heterozygotes and homozygotes in addition to the wild type. To model the scenario where there are only wild-type individuals present in the population (i.e., CCR5 W/W), we track the sexually active susceptibles at time t [Si,j (t)], where i = 1 refers to genotype (CCR5 W/W only in this case) and j is either the male or female subpopulation. We also track those who are HIV-positive at time t not yet having AIDS in Ii,j,k (t) where k refers to stage of HIV infection [primary (A) or asymptomatic (B)]. The total number of individuals with AIDS at time t are tracked in A(t). The source population are children, \u03c7 i,j (t), who mature into the sexually active population at time t (Fig. 1, Table 1). We compare the model of a population lacking the CCR5\u039432 allele to a demographically similar population with a high frequency of the allele. When genetic heterogeneity is included, male and female subpopulations are each further divided into three distinct genotypic groups, yielding six susceptible subpopulations, [Si,j (t), where i ranges from 1 to 3, where 1 = CCR5W/W; 2 = CCR5 W/\u039432; 3 = CCR5 \u039432/\u039432]. The infected classes, Ii,j,k (t), also increase in number to account for these new genotype compartments. In both settings we assume there is no treatment available and no knowledge of HIV status by people in the early acute and middle asymptomatic stages (both conditions exist in much of sub-Saharan Africa). In addition, we assume that sexual mixing in the population occurs randomly with respect to genotype and HIV disease status, all HIV-infected people eventually progress to AIDS, and no barrier contraceptives are used. These last assumptions reflect both economic and social conditions."
+    },
+    {
+      "self_ref": "#/texts/11",
+      "parent": {
+        "$ref": "#/body"
+      },
+      "children": [],
+      "label": "caption",
+      "prov": [],
+      "orig": "Figure 1 A schematic representation of the basic compartmental HIV epidemic model. The criss-cross lines indicate the sexual mixing between different compartments. Each of these interactions has a positive probability of taking place; they also incorporate individual rates of transmission indicated as \u03bb, but in full notation is \u03bb \u00ee,\ueb30,\uea50\u2192i,j, where i,j,k is the phenotype of the infected partner and \u00ee,\ueb30 is the phenotype of the susceptible partner. Also shown are the different rates of disease progression, \u03b3 i,j,k , that vary according to genotype, gender, and stage. Thus, the interactions between different genotypes, genders, and stages are associated with a unique probability of HIV infection. M, male; F, female.",
+      "text": "Figure 1 A schematic representation of the basic compartmental HIV epidemic model. The criss-cross lines indicate the sexual mixing between different compartments. Each of these interactions has a positive probability of taking place; they also incorporate individual rates of transmission indicated as \u03bb, but in full notation is \u03bb \u00ee,\ueb30,\uea50\u2192i,j, where i,j,k is the phenotype of the infected partner and \u00ee,\ueb30 is the phenotype of the susceptible partner. Also shown are the different rates of disease progression, \u03b3 i,j,k , that vary according to genotype, gender, and stage. Thus, the interactions between different genotypes, genders, and stages are associated with a unique probability of HIV infection. M, male; F, female."
+    },
+    {
+      "self_ref": "#/texts/12",
+      "parent": {
+        "$ref": "#/body"
+      },
+      "children": [],
+      "label": "caption",
+      "prov": [],
+      "orig": "Table 1 Children's genotype",
+      "text": "Table 1 Children's genotype"
+    },
+    {
+      "self_ref": "#/texts/13",
+      "parent": {
+        "$ref": "#/texts/9"
+      },
+      "children": [
+        {
+          "$ref": "#/texts/14"
+        },
+        {
+          "$ref": "#/texts/15"
+        },
+        {
+          "$ref": "#/texts/16"
+        },
+        {
+          "$ref": "#/texts/17"
+        },
+        {
+          "$ref": "#/texts/18"
+        },
+        {
+          "$ref": "#/texts/19"
+        },
+        {
+          "$ref": "#/tables/1"
+        },
+        {
+          "$ref": "#/tables/2"
+        },
+        {
+          "$ref": "#/tables/3"
+        },
+        {
+          "$ref": "#/texts/23"
+        },
+        {
+          "$ref": "#/texts/24"
+        },
+        {
+          "$ref": "#/texts/25"
+        },
+        {
+          "$ref": "#/texts/26"
+        },
+        {
+          "$ref": "#/texts/27"
+        },
+        {
+          "$ref": "#/texts/30"
+        }
+      ],
+      "label": "section_header",
+      "prov": [],
+      "orig": "Parameter Estimates for the Model.",
+      "text": "Parameter Estimates for the Model.",
+      "level": 1
+    },
+    {
+      "self_ref": "#/texts/14",
+      "parent": {
+        "$ref": "#/texts/13"
+      },
+      "children": [],
+      "label": "text",
+      "prov": [],
+      "orig": "Estimates for rates that govern the interactions depicted in Fig. 1 were derived from the extensive literature on HIV. Our parameters and their estimates are summarized in Tables 2\u20134. The general form of the equations describing the rates of transition between population classes as depicted in Fig. 1 are summarized as follows:",
+      "text": "Estimates for rates that govern the interactions depicted in Fig. 1 were derived from the extensive literature on HIV. Our parameters and their estimates are summarized in Tables 2\u20134. The general form of the equations describing the rates of transition between population classes as depicted in Fig. 1 are summarized as follows:"
+    },
+    {
+      "self_ref": "#/texts/15",
+      "parent": {
+        "$ref": "#/texts/13"
+      },
+      "children": [],
+      "label": "formula",
+      "prov": [],
+      "orig": " \\frac{dS_{i,j}(t)}{dt}={\\chi}_{i,j}(t)-{\\mu}_{j}S_{i,j}(t)-{\\lambda}_{\\hat {\\imath},\\hat {},\\hat {k}{\\rightarrow}i,j}S_{i,j}(t), ",
+      "text": " \\frac{dS_{i,j}(t)}{dt}={\\chi}_{i,j}(t)-{\\mu}_{j}S_{i,j}(t)-{\\lambda}_{\\hat {\\imath},\\hat {},\\hat {k}{\\rightarrow}i,j}S_{i,j}(t), "
+    },
+    {
+      "self_ref": "#/texts/16",
+      "parent": {
+        "$ref": "#/texts/13"
+      },
+      "children": [],
+      "label": "formula",
+      "prov": [],
+      "orig": " \\hspace{1em}\\hspace{1em}\\hspace{.167em}\\frac{dI_{i,j,A}(t)}{dt}={\\lambda}_{\\hat {\\imath},\\hat {},\\hat {k}{\\rightarrow}i,j}S_{i,j}(t)-{\\mu}_{j}I_{i,j,A}(t)-{\\gamma}_{i,j,A}I_{i,j,A}(t), ",
+      "text": " \\hspace{1em}\\hspace{1em}\\hspace{.167em}\\frac{dI_{i,j,A}(t)}{dt}={\\lambda}_{\\hat {\\imath},\\hat {},\\hat {k}{\\rightarrow}i,j}S_{i,j}(t)-{\\mu}_{j}I_{i,j,A}(t)-{\\gamma}_{i,j,A}I_{i,j,A}(t), "
+    },
+    {
+      "self_ref": "#/texts/17",
+      "parent": {
+        "$ref": "#/texts/13"
+      },
+      "children": [],
+      "label": "formula",
+      "prov": [],
+      "orig": " \\frac{dI_{i,j,B}(t)}{dt}={\\gamma}_{i,j,A}I_{i,j,A}(t)-{\\mu}_{j}I_{i,j,B}(t)-{\\gamma}_{i,j,B}I_{i,j,B}(t), ",
+      "text": " \\frac{dI_{i,j,B}(t)}{dt}={\\gamma}_{i,j,A}I_{i,j,A}(t)-{\\mu}_{j}I_{i,j,B}(t)-{\\gamma}_{i,j,B}I_{i,j,B}(t), "
+    },
+    {
+      "self_ref": "#/texts/18",
+      "parent": {
+        "$ref": "#/texts/13"
+      },
+      "children": [],
+      "label": "formula",
+      "prov": [],
+      "orig": " \\frac{dA(t)}{dt}={\\gamma}_{i,j,B} \\left( { \\,\\substack{ ^{3} \\\\ {\\sum} \\\\ _{i=1} }\\, }I_{i,F,B}(t)+I_{i,M,B}(t) \\right) -{\\mu}_{A}A(t)-{\\delta}A(t), ",
+      "text": " \\frac{dA(t)}{dt}={\\gamma}_{i,j,B} \\left( { \\,\\substack{ ^{3} \\\\ {\\sum} \\\\ _{i=1} }\\, }I_{i,F,B}(t)+I_{i,M,B}(t) \\right) -{\\mu}_{A}A(t)-{\\delta}A(t), "
+    },
+    {
+      "self_ref": "#/texts/19",
+      "parent": {
+        "$ref": "#/texts/13"
+      },
+      "children": [],
+      "label": "text",
+      "prov": [],
+      "orig": "where, in addition to previously defined populations and rates (with i equals genotype, j equals gender, and k equals stage of infection, either A or B), \u03bc j , represents the non-AIDS (natural) death rate for males and females respectively, and \u03bcA is estimated by the average (\u03bcF + \u03bcM/2). This approximation allows us to simplify the model (only one AIDS compartment) without compromising the results, as most people with AIDS die of AIDS (\u03b4AIDS) and very few of other causes (\u03bcA). These estimates include values that affect infectivity (\u03bb \u00ee,\ueb30,\uea50\u2192i,j ), transmission (\u03b2 \u00ee,\ueb30,\uea50\u2192i,j ), and disease progression (\u03b3 i  ,  j  ,  k ) where the \u00ee,\ueb30,\uea50 notation represents the genotype, gender, and stage of infection of the infected partner, and j \u2260 \ueb30.",
+      "text": "where, in addition to previously defined populations and rates (with i equals genotype, j equals gender, and k equals stage of infection, either A or B), \u03bc j , represents the non-AIDS (natural) death rate for males and females respectively, and \u03bcA is estimated by the average (\u03bcF + \u03bcM/2). This approximation allows us to simplify the model (only one AIDS compartment) without compromising the results, as most people with AIDS die of AIDS (\u03b4AIDS) and very few of other causes (\u03bcA). These estimates include values that affect infectivity (\u03bb \u00ee,\ueb30,\uea50\u2192i,j ), transmission (\u03b2 \u00ee,\ueb30,\uea50\u2192i,j ), and disease progression (\u03b3 i  ,  j  ,  k ) where the \u00ee,\ueb30,\uea50 notation represents the genotype, gender, and stage of infection of the infected partner, and j \u2260 \ueb30."
+    },
+    {
+      "self_ref": "#/texts/20",
+      "parent": {
+        "$ref": "#/body"
+      },
+      "children": [],
+      "label": "caption",
+      "prov": [],
+      "orig": "Table 2 Transmission probabilities",
+      "text": "Table 2 Transmission probabilities"
+    },
+    {
+      "self_ref": "#/texts/21",
+      "parent": {
+        "$ref": "#/body"
+      },
+      "children": [],
+      "label": "caption",
+      "prov": [],
+      "orig": "Table 3 Progression rates",
+      "text": "Table 3 Progression rates"
+    },
+    {
+      "self_ref": "#/texts/22",
+      "parent": {
+        "$ref": "#/body"
+      },
+      "children": [],
+      "label": "caption",
+      "prov": [],
+      "orig": "Table 4 Parameter values",
+      "text": "Table 4 Parameter values"
+    },
+    {
+      "self_ref": "#/texts/23",
+      "parent": {
+        "$ref": "#/texts/13"
+      },
+      "children": [],
+      "label": "text",
+      "prov": [],
+      "orig": "The effects of the CCR5 W/\u039432 and CCR5 \u039432/\u039432 genotypes are included in our model through both the per-capita probabilities of infection, \u03bb \u00ee,\ueb30,\uea50\u2192i,j , and the progression rates, \u03b3 i  ,  j  ,  k . The infectivity coefficients, \u03bb \u00ee,\ueb30,\uea50\u2192i,j , are calculated for each population subgroup based on the following: likelihood of HIV transmission in a sexual encounter between a susceptible and an infected (\u03b2\u00ee\u0131\u0131^^,j,\uea50k k^^\u2192i,j ) person; formation of new partnerships (c  j  j); number of contacts in a given partnership (\u03d5 j ); and probability of encountering an infected individual (I  \u00ee,\ueb30,\uea50 /N  \ueb30 ). The formula representing this probability of infection is",
+      "text": "The effects of the CCR5 W/\u039432 and CCR5 \u039432/\u039432 genotypes are included in our model through both the per-capita probabilities of infection, \u03bb \u00ee,\ueb30,\uea50\u2192i,j , and the progression rates, \u03b3 i  ,  j  ,  k . The infectivity coefficients, \u03bb \u00ee,\ueb30,\uea50\u2192i,j , are calculated for each population subgroup based on the following: likelihood of HIV transmission in a sexual encounter between a susceptible and an infected (\u03b2\u00ee\u0131\u0131^^,j,\uea50k k^^\u2192i,j ) person; formation of new partnerships (c  j  j); number of contacts in a given partnership (\u03d5 j ); and probability of encountering an infected individual (I  \u00ee,\ueb30,\uea50 /N  \ueb30 ). The formula representing this probability of infection is"
+    },
+    {
+      "self_ref": "#/texts/24",
+      "parent": {
+        "$ref": "#/texts/13"
+      },
+      "children": [],
+      "label": "formula",
+      "prov": [],
+      "orig": " {\\lambda}_{\\hat {i},\\hat {j},\\hat {k}{\\rightarrow}i,j}=\\frac{C_{j}{\\cdot}{\\phi}_{j}}{N_{\\hat {j}}}\\hspace{.167em} \\left[ { \\,\\substack{ \\\\ {\\sum} \\\\ _{\\hat {i},\\hat {k}} }\\, }{\\beta}_{\\hat {i},\\hat {j},\\hat {k}{\\rightarrow}i,j}{\\cdot}I_{\\hat {i},\\hat {j},\\hat {k}} \\right] , ",
+      "text": " {\\lambda}_{\\hat {i},\\hat {j},\\hat {k}{\\rightarrow}i,j}=\\frac{C_{j}{\\cdot}{\\phi}_{j}}{N_{\\hat {j}}}\\hspace{.167em} \\left[ { \\,\\substack{ \\\\ {\\sum} \\\\ _{\\hat {i},\\hat {k}} }\\, }{\\beta}_{\\hat {i},\\hat {j},\\hat {k}{\\rightarrow}i,j}{\\cdot}I_{\\hat {i},\\hat {j},\\hat {k}} \\right] , "
+    },
+    {
+      "self_ref": "#/texts/25",
+      "parent": {
+        "$ref": "#/texts/13"
+      },
+      "children": [],
+      "label": "text",
+      "prov": [],
+      "orig": "where j \u2260 \ueb30 is either male or female. N  \ueb30  represents the total population of gender \ueb30 (this does not include those with AIDS in the simulations).",
+      "text": "where j \u2260 \ueb30 is either male or female. N  \ueb30  represents the total population of gender \ueb30 (this does not include those with AIDS in the simulations)."
+    },
+    {
+      "self_ref": "#/texts/26",
+      "parent": {
+        "$ref": "#/texts/13"
+      },
+      "children": [],
+      "label": "text",
+      "prov": [],
+      "orig": "The average rate of partner acquisition, cj , includes the mean plus the variance to mean ratio of the relevant distribution of partner-change rates to capture the small number of high-risk people: cj  = mj  + (\u03c2/m j) where the mean (mj ) and variance (\u03c2) are annual figures for new partnerships only (32). These means are estimated from Ugandan data for the number of heterosexual partners in the past year (33) and the number of nonregular heterosexual partners (i.e., spouses or long-term partners) in the past year (34). In these sexual activity surveys, men invariably have more new partnerships; thus, we assumed that they would have fewer average contacts per partnership than women (a higher rate of new partner acquisition means fewer sexual contacts with a given partner; ref. 35). To incorporate this assumption in our model, the male contacts/partnership, \u03d5 M , was reduced by 20%. In a given population, the numbers of heterosexual interactions must equate between males and females. The balancing equation applied here is SA F\u00b7m F\u00b7N F = SA M\u00b7m M\u00b7N M, where SAj  are the percent sexually active and Nj  are the total in the populations for gender j. To specify changes in partner acquisition, we apply a male flexibility mechanism, holding the female rate of acquisition constant and allowing the male rates to vary (36, 37).",
+      "text": "The average rate of partner acquisition, cj , includes the mean plus the variance to mean ratio of the relevant distribution of partner-change rates to capture the small number of high-risk people: cj  = mj  + (\u03c2/m j) where the mean (mj ) and variance (\u03c2) are annual figures for new partnerships only (32). These means are estimated from Ugandan data for the number of heterosexual partners in the past year (33) and the number of nonregular heterosexual partners (i.e., spouses or long-term partners) in the past year (34). In these sexual activity surveys, men invariably have more new partnerships; thus, we assumed that they would have fewer average contacts per partnership than women (a higher rate of new partner acquisition means fewer sexual contacts with a given partner; ref. 35). To incorporate this assumption in our model, the male contacts/partnership, \u03d5 M , was reduced by 20%. In a given population, the numbers of heterosexual interactions must equate between males and females. The balancing equation applied here is SA F\u00b7m F\u00b7N F = SA M\u00b7m M\u00b7N M, where SAj  are the percent sexually active and Nj  are the total in the populations for gender j. To specify changes in partner acquisition, we apply a male flexibility mechanism, holding the female rate of acquisition constant and allowing the male rates to vary (36, 37)."
+    },
+    {
+      "self_ref": "#/texts/27",
+      "parent": {
+        "$ref": "#/texts/13"
+      },
+      "children": [
+        {
+          "$ref": "#/texts/28"
+        },
+        {
+          "$ref": "#/texts/29"
+        }
+      ],
+      "label": "section_header",
+      "prov": [],
+      "orig": "Transmission probabilities.",
+      "text": "Transmission probabilities.",
+      "level": 1
+    },
+    {
+      "self_ref": "#/texts/28",
+      "parent": {
+        "$ref": "#/texts/27"
+      },
+      "children": [],
+      "label": "text",
+      "prov": [],
+      "orig": "The effect of a genetic factor in a model of HIV transmission can be included by reducing the transmission coefficient. The probabilities of transmission per contact with an infected partner, \u03b2\u00ee\u0131\u0131^^,\ueb30\ue2d4\ue2d4^^,\uea50k k^^\u2192i,j , have been estimated in the literature (see ref. 38 for estimates in minimally treated groups). We want to capture a decreased risk in transmission based on genotype (ref. 39, Table 2). No studies have directly evaluated differences in infectivity between HIV-infected CCR5 W/\u039432 heterozygotes and HIV-infected CCR5 wild types. Thus, we base estimates for reduced transmission on studies of groups with various HIV serum viral loads (40), HTLV-I/II viral loads (41), and a study of the effect of AZT treatment on transmission (29). We decrease transmission probabilities for infecting CCR5\u039432/\u039432 persons by 100-fold to reflect the rarity of infections in these persons. However, we assume that infected CCR5\u039432/\u039432 homozygotes can infect susceptibles at a rate similar to CCR5W/W homozygotes, as the former generally have high viremias (ref. 30, Table 2). We also assume that male-to-female transmission is twice as efficient as female-to-male transmission (up to a 9-fold difference has been reported; ref. 42) (ref. 43, Table 2).",
+      "text": "The effect of a genetic factor in a model of HIV transmission can be included by reducing the transmission coefficient. The probabilities of transmission per contact with an infected partner, \u03b2\u00ee\u0131\u0131^^,\ueb30\ue2d4\ue2d4^^,\uea50k k^^\u2192i,j , have been estimated in the literature (see ref. 38 for estimates in minimally treated groups). We want to capture a decreased risk in transmission based on genotype (ref. 39, Table 2). No studies have directly evaluated differences in infectivity between HIV-infected CCR5 W/\u039432 heterozygotes and HIV-infected CCR5 wild types. Thus, we base estimates for reduced transmission on studies of groups with various HIV serum viral loads (40), HTLV-I/II viral loads (41), and a study of the effect of AZT treatment on transmission (29). We decrease transmission probabilities for infecting CCR5\u039432/\u039432 persons by 100-fold to reflect the rarity of infections in these persons. However, we assume that infected CCR5\u039432/\u039432 homozygotes can infect susceptibles at a rate similar to CCR5W/W homozygotes, as the former generally have high viremias (ref. 30, Table 2). We also assume that male-to-female transmission is twice as efficient as female-to-male transmission (up to a 9-fold difference has been reported; ref. 42) (ref. 43, Table 2)."
+    },
+    {
+      "self_ref": "#/texts/29",
+      "parent": {
+        "$ref": "#/texts/27"
+      },
+      "children": [],
+      "label": "text",
+      "prov": [],
+      "orig": "Given the assumption of no treatment, the high burden of disease in people with AIDS is assumed to greatly limit their sexual activity. Our initial model excludes people with AIDS from the sexually active groups. Subsequently, we allow persons with AIDS to be sexually active, fixing their transmission rates (\u03b2AIDS) to be the same across all CCR5 genotypes, and lower than transmission rates for primary-stage infection (as the viral burden on average is not as high as during the acute phase), and larger than transmission rates for asymptomatic-stage infection (as the viral burden characteristically increases during the end stage of disease).",
+      "text": "Given the assumption of no treatment, the high burden of disease in people with AIDS is assumed to greatly limit their sexual activity. Our initial model excludes people with AIDS from the sexually active groups. Subsequently, we allow persons with AIDS to be sexually active, fixing their transmission rates (\u03b2AIDS) to be the same across all CCR5 genotypes, and lower than transmission rates for primary-stage infection (as the viral burden on average is not as high as during the acute phase), and larger than transmission rates for asymptomatic-stage infection (as the viral burden characteristically increases during the end stage of disease)."
+    },
+    {
+      "self_ref": "#/texts/30",
+      "parent": {
+        "$ref": "#/texts/13"
+      },
+      "children": [
+        {
+          "$ref": "#/texts/31"
+        }
+      ],
+      "label": "section_header",
+      "prov": [],
+      "orig": "Disease progression.",
+      "text": "Disease progression.",
+      "level": 1
+    },
+    {
+      "self_ref": "#/texts/31",
+      "parent": {
+        "$ref": "#/texts/30"
+      },
+      "children": [],
+      "label": "text",
+      "prov": [],
+      "orig": "We assume three stages of HIV infection: primary (acute, stage A), asymptomatic HIV (stage B), and AIDS. The rates of transition through the first two stages are denoted by \u03b3 i,j,k  i,j,k, where i represents genotype, j is male/female, and k represents either stage A or stage B. Transition rates through each of these stages are assumed to be inversely proportional to the duration of that stage; however, other distributions are possible (31, 44, 45). Although viral loads generally peak in the first 2 months of infection, steady-state viral loads are established several months beyond this (46). For group A, the primary HIV-infecteds, duration is assumed to be 3.5 months. Based on results from European cohort studies (7\u201310), the beneficial effects of the CCR5 W/\u039432 genotype are observed mainly in the asymptomatic years of HIV infection; \u22487 years after seroconversion survival rates appear to be quite similar between heterozygous and homozygous individuals. We also assume that CCR5\u039432/\u039432-infected individuals and wild-type individuals progress similarly, and that men and women progress through each disease stage at the same rate. Given these observations, and that survival after infection may be shorter in untreated populations, we choose the duration time in stage B to be 6 years for wild-type individuals and 8 years for heterozygous individuals. Transition through AIDS, \u03b4AIDS, is inversely proportional to the duration of AIDS. We estimate this value to be 1 year for the time from onset of AIDS to death. The progression rates are summarized in Table 3.",
+      "text": "We assume three stages of HIV infection: primary (acute, stage A), asymptomatic HIV (stage B), and AIDS. The rates of transition through the first two stages are denoted by \u03b3 i,j,k  i,j,k, where i represents genotype, j is male/female, and k represents either stage A or stage B. Transition rates through each of these stages are assumed to be inversely proportional to the duration of that stage; however, other distributions are possible (31, 44, 45). Although viral loads generally peak in the first 2 months of infection, steady-state viral loads are established several months beyond this (46). For group A, the primary HIV-infecteds, duration is assumed to be 3.5 months. Based on results from European cohort studies (7\u201310), the beneficial effects of the CCR5 W/\u039432 genotype are observed mainly in the asymptomatic years of HIV infection; \u22487 years after seroconversion survival rates appear to be quite similar between heterozygous and homozygous individuals. We also assume that CCR5\u039432/\u039432-infected individuals and wild-type individuals progress similarly, and that men and women progress through each disease stage at the same rate. Given these observations, and that survival after infection may be shorter in untreated populations, we choose the duration time in stage B to be 6 years for wild-type individuals and 8 years for heterozygous individuals. Transition through AIDS, \u03b4AIDS, is inversely proportional to the duration of AIDS. We estimate this value to be 1 year for the time from onset of AIDS to death. The progression rates are summarized in Table 3."
+    },
+    {
+      "self_ref": "#/texts/32",
+      "parent": {
+        "$ref": "#/texts/9"
+      },
+      "children": [
+        {
+          "$ref": "#/texts/33"
+        },
+        {
+          "$ref": "#/texts/34"
+        },
+        {
+          "$ref": "#/texts/35"
+        },
+        {
+          "$ref": "#/texts/36"
+        }
+      ],
+      "label": "section_header",
+      "prov": [],
+      "orig": "Demographic Setting.",
+      "text": "Demographic Setting.",
+      "level": 1
+    },
+    {
+      "self_ref": "#/texts/33",
+      "parent": {
+        "$ref": "#/texts/32"
+      },
+      "children": [],
+      "label": "text",
+      "prov": [],
+      "orig": "Demographic parameters are based on data from Malawi, Zimbabwe, and Botswana (3, 47). Estimated birth and child mortality rates are used to calculate the annual numbers of children (\u03c7 i,j  i,j) maturing into the potentially sexually active, susceptible group at the age of 15 years (3). For example, in the case where the mother is CCR5 wild type and the father is CCR5 wild type or heterozygous, the number of CCR5 W/W children is calculated as follows [suppressing (t) notation]: \u03c71,j 1,j =",
+      "text": "Demographic parameters are based on data from Malawi, Zimbabwe, and Botswana (3, 47). Estimated birth and child mortality rates are used to calculate the annual numbers of children (\u03c7 i,j  i,j) maturing into the potentially sexually active, susceptible group at the age of 15 years (3). For example, in the case where the mother is CCR5 wild type and the father is CCR5 wild type or heterozygous, the number of CCR5 W/W children is calculated as follows [suppressing (t) notation]: \u03c71,j 1,j ="
+    },
+    {
+      "self_ref": "#/texts/34",
+      "parent": {
+        "$ref": "#/texts/32"
+      },
+      "children": [],
+      "label": "formula",
+      "prov": [],
+      "orig": " B_{r}\\hspace{.167em}{ \\,\\substack{ \\\\ {\\sum} \\\\ _{k} }\\, } \\left[ S_{1,F}\\frac{(S_{1,M}+I_{1,M,k})}{N_{M}}+ \\left[ (0.5)S_{1,F}\\frac{(S_{2,M}+I_{2,M,k})}{N_{M}} \\right] + \\right ",
+      "text": " B_{r}\\hspace{.167em}{ \\,\\substack{ \\\\ {\\sum} \\\\ _{k} }\\, } \\left[ S_{1,F}\\frac{(S_{1,M}+I_{1,M,k})}{N_{M}}+ \\left[ (0.5)S_{1,F}\\frac{(S_{2,M}+I_{2,M,k})}{N_{M}} \\right] + \\right "
+    },
+    {
+      "self_ref": "#/texts/35",
+      "parent": {
+        "$ref": "#/texts/32"
+      },
+      "children": [],
+      "label": "formula",
+      "prov": [],
+      "orig": " p_{v} \\left \\left( \\frac{(I_{1,F,k}(S_{1,M}+I_{1,M,k}))}{N_{M}}+ \\left[ (0.5)I_{1,F,k}\\frac{(S_{2,M}+I_{2,M,k})}{N_{M}} \\right] \\right) \\right] ,\\hspace{.167em} ",
+      "text": " p_{v} \\left \\left( \\frac{(I_{1,F,k}(S_{1,M}+I_{1,M,k}))}{N_{M}}+ \\left[ (0.5)I_{1,F,k}\\frac{(S_{2,M}+I_{2,M,k})}{N_{M}} \\right] \\right) \\right] ,\\hspace{.167em} "
+    },
+    {
+      "self_ref": "#/texts/36",
+      "parent": {
+        "$ref": "#/texts/32"
+      },
+      "children": [],
+      "label": "text",
+      "prov": [],
+      "orig": "where the probability of HIV vertical transmission, 1 \u2212 pv , and the birthrate, Br , are both included in the equations together with the Mendelian inheritance values as presented in Table 1. The generalized version of this equation (i.e., \u03c7 i,j  i,j) can account for six categories of children (including gender and genotype). We assume that all children of all genotypes are at risk, although we can relax this condition if data become available to support vertical protection (e.g., ref. 48). All infected children are assumed to die before age 15. Before entering the susceptible group at age 15, there is additional loss because of mortality from all non-AIDS causes occurring less than 15 years of age at a rate of \u03bc\u03c7\u03c7 \u00d7 \u03c7 i,j  i,j (where \u03bc\u03c7 is the mortality under 15 years of age). Children then enter the population as susceptibles at an annual rate, \u03c2 j  j \u00d7 \u03c7 i,j  i,j/15, where \u03c2 j  distributes the children 51% females and 49% males. All parameters and their values are summarized in Table 4.",
+      "text": "where the probability of HIV vertical transmission, 1 \u2212 pv , and the birthrate, Br , are both included in the equations together with the Mendelian inheritance values as presented in Table 1. The generalized version of this equation (i.e., \u03c7 i,j  i,j) can account for six categories of children (including gender and genotype). We assume that all children of all genotypes are at risk, although we can relax this condition if data become available to support vertical protection (e.g., ref. 48). All infected children are assumed to die before age 15. Before entering the susceptible group at age 15, there is additional loss because of mortality from all non-AIDS causes occurring less than 15 years of age at a rate of \u03bc\u03c7\u03c7 \u00d7 \u03c7 i,j  i,j (where \u03bc\u03c7 is the mortality under 15 years of age). Children then enter the population as susceptibles at an annual rate, \u03c2 j  j \u00d7 \u03c7 i,j  i,j/15, where \u03c2 j  distributes the children 51% females and 49% males. All parameters and their values are summarized in Table 4."
+    },
+    {
+      "self_ref": "#/texts/37",
+      "parent": {
+        "$ref": "#/texts/0"
+      },
+      "children": [
+        {
+          "$ref": "#/texts/38"
+        },
+        {
+          "$ref": "#/texts/43"
+        }
+      ],
+      "label": "section_header",
+      "prov": [],
+      "orig": "Prevalence of HIV",
+      "text": "Prevalence of HIV",
+      "level": 1
+    },
+    {
+      "self_ref": "#/texts/38",
+      "parent": {
+        "$ref": "#/texts/37"
+      },
+      "children": [
+        {
+          "$ref": "#/texts/39"
+        },
+        {
+          "$ref": "#/texts/40"
+        },
+        {
+          "$ref": "#/texts/41"
+        },
+        {
+          "$ref": "#/pictures/1"
+        }
+      ],
+      "label": "section_header",
+      "prov": [],
+      "orig": "Demographics and Model Validation.",
+      "text": "Demographics and Model Validation.",
+      "level": 1
+    },
+    {
+      "self_ref": "#/texts/39",
+      "parent": {
+        "$ref": "#/texts/38"
+      },
+      "children": [],
+      "label": "text",
+      "prov": [],
+      "orig": "The model was validated by using parameters estimated from available demographic data. Simulations were run in the absence of HIV infection to compare the model with known population growth rates. Infection was subsequently introduced with an initial low HIV prevalence of 0.5% to capture early epidemic behavior.",
+      "text": "The model was validated by using parameters estimated from available demographic data. Simulations were run in the absence of HIV infection to compare the model with known population growth rates. Infection was subsequently introduced with an initial low HIV prevalence of 0.5% to capture early epidemic behavior."
+    },
+    {
+      "self_ref": "#/texts/40",
+      "parent": {
+        "$ref": "#/texts/38"
+      },
+      "children": [],
+      "label": "text",
+      "prov": [],
+      "orig": "In deciding on our initial values for parameters during infection, we use Joint United Nations Programme on HIV/AIDS national prevalence data for Malawi, Zimbabwe, and Botswana. Nationwide seroprevalence of HIV in these countries varies from \u224811% to over 20% (3), although there may be considerable variation within given subpopulations (2, 49).",
+      "text": "In deciding on our initial values for parameters during infection, we use Joint United Nations Programme on HIV/AIDS national prevalence data for Malawi, Zimbabwe, and Botswana. Nationwide seroprevalence of HIV in these countries varies from \u224811% to over 20% (3), although there may be considerable variation within given subpopulations (2, 49)."
+    },
+    {
+      "self_ref": "#/texts/41",
+      "parent": {
+        "$ref": "#/texts/38"
+      },
+      "children": [],
+      "label": "text",
+      "prov": [],
+      "orig": "In the absence of HIV infection, the annual percent population growth rate in the model is \u22482.5%, predicting the present-day values for an average of sub-Saharan African cities (data not shown). To validate the model with HIV infection, we compare our simulation of the HIV epidemic to existing prevalence data for Kenya and Mozambique (http://www.who.int/emc-hiv/fact-sheets/pdfs/kenya.pdf and ref. 51). Prevalence data collected from these countries follow similar trajectories to those predicted by our model (Fig. 2).",
+      "text": "In the absence of HIV infection, the annual percent population growth rate in the model is \u22482.5%, predicting the present-day values for an average of sub-Saharan African cities (data not shown). To validate the model with HIV infection, we compare our simulation of the HIV epidemic to existing prevalence data for Kenya and Mozambique (http://www.who.int/emc-hiv/fact-sheets/pdfs/kenya.pdf and ref. 51). Prevalence data collected from these countries follow similar trajectories to those predicted by our model (Fig. 2)."
+    },
+    {
+      "self_ref": "#/texts/42",
+      "parent": {
+        "$ref": "#/body"
+      },
+      "children": [],
+      "label": "caption",
+      "prov": [],
+      "orig": "Figure 2 Model simulation of HIV infection in a population lacking the protective CCR5\u039432 allele compared with national data from Kenya (healthy adults) and Mozambique (blood donors, ref. 17). The simulated population incorporates parameter estimates from sub-Saharan African demographics. Note the two outlier points from the Mozambique data were likely caused by underreporting in the early stages of the epidemic.",
+      "text": "Figure 2 Model simulation of HIV infection in a population lacking the protective CCR5\u039432 allele compared with national data from Kenya (healthy adults) and Mozambique (blood donors, ref. 17). The simulated population incorporates parameter estimates from sub-Saharan African demographics. Note the two outlier points from the Mozambique data were likely caused by underreporting in the early stages of the epidemic."
+    },
+    {
+      "self_ref": "#/texts/43",
+      "parent": {
+        "$ref": "#/texts/37"
+      },
+      "children": [
+        {
+          "$ref": "#/texts/44"
+        },
+        {
+          "$ref": "#/texts/45"
+        },
+        {
+          "$ref": "#/texts/46"
+        },
+        {
+          "$ref": "#/pictures/2"
+        },
+        {
+          "$ref": "#/texts/48"
+        },
+        {
+          "$ref": "#/texts/49"
+        },
+        {
+          "$ref": "#/texts/50"
+        }
+      ],
+      "label": "section_header",
+      "prov": [],
+      "orig": "Effects of the Allele on Prevalence.",
+      "text": "Effects of the Allele on Prevalence.",
+      "level": 1
+    },
+    {
+      "self_ref": "#/texts/44",
+      "parent": {
+        "$ref": "#/texts/43"
+      },
+      "children": [],
+      "label": "text",
+      "prov": [],
+      "orig": "After validating the model in the wild type-only population, both CCR5\u039432 heterozygous and homozygous people are included. Parameter values for HIV transmission, duration of illness, and numbers of contacts per partner are assumed to be the same within both settings. We then calculate HIV/AIDS prevalence among adults for total HIV/AIDS cases.",
+      "text": "After validating the model in the wild type-only population, both CCR5\u039432 heterozygous and homozygous people are included. Parameter values for HIV transmission, duration of illness, and numbers of contacts per partner are assumed to be the same within both settings. We then calculate HIV/AIDS prevalence among adults for total HIV/AIDS cases."
+    },
+    {
+      "self_ref": "#/texts/45",
+      "parent": {
+        "$ref": "#/texts/43"
+      },
+      "children": [],
+      "label": "text",
+      "prov": [],
+      "orig": "Although CCR5\u039432/\u039432 homozygosity is rarely seen in HIV-positive populations (prevalence ranges between 0 and 0.004%), 1\u201320% of people in HIV-negative populations of European descent are homozygous. Thus, to evaluate the potential impact of CCR5\u039432, we estimate there are 19% CCR5 W/\u039432 heterozygous and 1% CCR5 \u039432/\u039432 homozygous people in our population. These values are in Hardy-Weinberg equilibrium with an allelic frequency of the mutation as 0.105573.",
+      "text": "Although CCR5\u039432/\u039432 homozygosity is rarely seen in HIV-positive populations (prevalence ranges between 0 and 0.004%), 1\u201320% of people in HIV-negative populations of European descent are homozygous. Thus, to evaluate the potential impact of CCR5\u039432, we estimate there are 19% CCR5 W/\u039432 heterozygous and 1% CCR5 \u039432/\u039432 homozygous people in our population. These values are in Hardy-Weinberg equilibrium with an allelic frequency of the mutation as 0.105573."
+    },
+    {
+      "self_ref": "#/texts/46",
+      "parent": {
+        "$ref": "#/texts/43"
+      },
+      "children": [],
+      "label": "text",
+      "prov": [],
+      "orig": "Fig. 3 shows the prevalence of HIV in two populations: one lacking the mutant CCR5 allele and another carrying that allele. In the population lacking the protective mutation, prevalence increases logarithmically for the first 35 years of the epidemic, reaching 18% before leveling off.",
+      "text": "Fig. 3 shows the prevalence of HIV in two populations: one lacking the mutant CCR5 allele and another carrying that allele. In the population lacking the protective mutation, prevalence increases logarithmically for the first 35 years of the epidemic, reaching 18% before leveling off."
+    },
+    {
+      "self_ref": "#/texts/47",
+      "parent": {
+        "$ref": "#/body"
+      },
+      "children": [],
+      "label": "caption",
+      "prov": [],
+      "orig": "Figure 3 Prevalence of HIV/AIDS in the adult population as predicted by the model. The top curve (\u25cb) indicates prevalence in a population lacking the protective allele. We compare that to a population with 19% heterozygous and 1% homozygous for the allele (implying an allelic frequency of 0.105573. Confidence interval bands (light gray) are shown around the median simulation (\ue80b) providing a range of uncertainty in evaluating parameters for the effect of the mutation on the infectivity and the duration of asymptomatic HIV for heterozygotes.",
+      "text": "Figure 3 Prevalence of HIV/AIDS in the adult population as predicted by the model. The top curve (\u25cb) indicates prevalence in a population lacking the protective allele. We compare that to a population with 19% heterozygous and 1% homozygous for the allele (implying an allelic frequency of 0.105573. Confidence interval bands (light gray) are shown around the median simulation (\ue80b) providing a range of uncertainty in evaluating parameters for the effect of the mutation on the infectivity and the duration of asymptomatic HIV for heterozygotes."
+    },
+    {
+      "self_ref": "#/texts/48",
+      "parent": {
+        "$ref": "#/texts/43"
+      },
+      "children": [],
+      "label": "text",
+      "prov": [],
+      "orig": "In contrast, when a proportion of the population carries the CCR5\u039432 allele, the epidemic increases more slowly, but still logarithmically, for the first 50 years, and HIV/AIDS prevalence reaches \u224812% (Fig. 3). Prevalence begins to decline slowly after 70 years.",
+      "text": "In contrast, when a proportion of the population carries the CCR5\u039432 allele, the epidemic increases more slowly, but still logarithmically, for the first 50 years, and HIV/AIDS prevalence reaches \u224812% (Fig. 3). Prevalence begins to decline slowly after 70 years."
+    },
+    {
+      "self_ref": "#/texts/49",
+      "parent": {
+        "$ref": "#/texts/43"
+      },
+      "children": [],
+      "label": "text",
+      "prov": [],
+      "orig": "In the above simulations we assume that people with AIDS are not sexually active. However, when these individuals are included in the sexually active population the severity of the epidemic increases considerably (data not shown). Consistent with our initial simulations, prevalences are still relatively lower in the presence of the CCR5 mutation.",
+      "text": "In the above simulations we assume that people with AIDS are not sexually active. However, when these individuals are included in the sexually active population the severity of the epidemic increases considerably (data not shown). Consistent with our initial simulations, prevalences are still relatively lower in the presence of the CCR5 mutation."
+    },
+    {
+      "self_ref": "#/texts/50",
+      "parent": {
+        "$ref": "#/texts/43"
+      },
+      "children": [],
+      "label": "text",
+      "prov": [],
+      "orig": "Because some parameters (e.g., rate constants) are difficult to estimate based on available data, we implement an uncertainty analysis to assess the variability in the model outcomes caused by any inaccuracies in estimates of the parameter values with regard to the effect of the allelic mutation. For these analyses we use Latin hypercube sampling, as described in refs. 52\u201356, Our uncertainty and sensitivity analyses focus on infectivity vs. duration of infectiousness. To this end, we assess the effects on the dynamics of the epidemic for a range of values of the parameters governing transmission and progression rates: \u03b2\u00ee\u0131\u0131^^,\ueb30\ue2d4\ue2d4^^,\uea50k k^^\u2192i,j  and \u03b3 i,j,k  i,j,k. All other parameters are held constant. These results are presented as an interval band about the average simulation for the population carrying the CCR5\u039432 allele (Fig. 3). Although there is variability in the model outcomes, the analysis indicates that the overall model predictions are consistent for a wide range of transmission and progression rates. Further, most of the variation observed in the outcome is because of the transmission rates for both heterosexual males and females in the primary stage of infection (\u03b22,M,A \u2192  i  ,F, \u03b22,F,A \u2192  i  ,M). As mentioned above, we assume lower viral loads correlate with reduced infectivity; thus, the reduction in viral load in heterozygotes has a major influence on disease spread.",
+      "text": "Because some parameters (e.g., rate constants) are difficult to estimate based on available data, we implement an uncertainty analysis to assess the variability in the model outcomes caused by any inaccuracies in estimates of the parameter values with regard to the effect of the allelic mutation. For these analyses we use Latin hypercube sampling, as described in refs. 52\u201356, Our uncertainty and sensitivity analyses focus on infectivity vs. duration of infectiousness. To this end, we assess the effects on the dynamics of the epidemic for a range of values of the parameters governing transmission and progression rates: \u03b2\u00ee\u0131\u0131^^,\ueb30\ue2d4\ue2d4^^,\uea50k k^^\u2192i,j  and \u03b3 i,j,k  i,j,k. All other parameters are held constant. These results are presented as an interval band about the average simulation for the population carrying the CCR5\u039432 allele (Fig. 3). Although there is variability in the model outcomes, the analysis indicates that the overall model predictions are consistent for a wide range of transmission and progression rates. Further, most of the variation observed in the outcome is because of the transmission rates for both heterosexual males and females in the primary stage of infection (\u03b22,M,A \u2192  i  ,F, \u03b22,F,A \u2192  i  ,M). As mentioned above, we assume lower viral loads correlate with reduced infectivity; thus, the reduction in viral load in heterozygotes has a major influence on disease spread."
+    },
+    {
+      "self_ref": "#/texts/51",
+      "parent": {
+        "$ref": "#/texts/0"
+      },
+      "children": [
+        {
+          "$ref": "#/texts/52"
+        },
+        {
+          "$ref": "#/pictures/3"
+        }
+      ],
+      "label": "section_header",
+      "prov": [],
+      "orig": "HIV Induces Selective Pressure on Genotype Frequency",
+      "text": "HIV Induces Selective Pressure on Genotype Frequency",
+      "level": 1
+    },
+    {
+      "self_ref": "#/texts/52",
+      "parent": {
+        "$ref": "#/texts/51"
+      },
+      "children": [],
+      "label": "text",
+      "prov": [],
+      "orig": "To observe changes in the frequency of the CCR5\u039432 allele in a setting with HIV infection as compared with the Hardy-Weinberg equilibrium in the absence of HIV, we follow changes in the total number of CCR5\u039432 heterozygotes and homozygotes over 1,000 years (Fig. 4). We initially perform simulations in the absence of HIV infection as a negative control to show there is not significant selection of the allele in the absence of infection. To determine how long it would take for the allelic frequency to reach present-day levels (e.g., q = 0.105573), we initiate this simulation for 1,000 years with a very small allelic frequency (q = 0.00105). In the absence of HIV, the allelic frequency is maintained in equilibrium as shown by the constant proportions of CCR5\u039432 heterozygotes and homozygotes (Fig. 4, solid lines). The selection for CCR5\u039432 in the presence of HIV is seen in comparison (Fig. 4, dashed lines). We expand the time frame of this simulation to 2,000 years to view the point at which the frequency reaches present levels (where q \u223c0.105573 at year = 1200). Note that the allelic frequency increases for \u22481,600 years before leveling off.",
+      "text": "To observe changes in the frequency of the CCR5\u039432 allele in a setting with HIV infection as compared with the Hardy-Weinberg equilibrium in the absence of HIV, we follow changes in the total number of CCR5\u039432 heterozygotes and homozygotes over 1,000 years (Fig. 4). We initially perform simulations in the absence of HIV infection as a negative control to show there is not significant selection of the allele in the absence of infection. To determine how long it would take for the allelic frequency to reach present-day levels (e.g., q = 0.105573), we initiate this simulation for 1,000 years with a very small allelic frequency (q = 0.00105). In the absence of HIV, the allelic frequency is maintained in equilibrium as shown by the constant proportions of CCR5\u039432 heterozygotes and homozygotes (Fig. 4, solid lines). The selection for CCR5\u039432 in the presence of HIV is seen in comparison (Fig. 4, dashed lines). We expand the time frame of this simulation to 2,000 years to view the point at which the frequency reaches present levels (where q \u223c0.105573 at year = 1200). Note that the allelic frequency increases for \u22481,600 years before leveling off."
+    },
+    {
+      "self_ref": "#/texts/53",
+      "parent": {
+        "$ref": "#/body"
+      },
+      "children": [],
+      "label": "caption",
+      "prov": [],
+      "orig": "Figure 4 Effects of HIV-1 on selection of the CCR5\u039432 allele. The Hardy-Weinberg equilibrium level is represented in the no-infection simulation (solid lines) for each population. Divergence from the original Hardy-Weinberg equilibrium is shown to occur in the simulations that include HIV infection (dashed lines). Fraction of the total subpopulations are presented: (A) wild types (W/W), (B) heterozygotes (W/\u039432), and (C) homozygotes (\u039432/\u039432). Note that we initiate this simulation with a much lower allelic frequency (0.00105) than used in the rest of the study to better exemplify the actual selective effect over a 1,000-year time scale. (D) The allelic selection effect over a 2,000-year time scale.",
+      "text": "Figure 4 Effects of HIV-1 on selection of the CCR5\u039432 allele. The Hardy-Weinberg equilibrium level is represented in the no-infection simulation (solid lines) for each population. Divergence from the original Hardy-Weinberg equilibrium is shown to occur in the simulations that include HIV infection (dashed lines). Fraction of the total subpopulations are presented: (A) wild types (W/W), (B) heterozygotes (W/\u039432), and (C) homozygotes (\u039432/\u039432). Note that we initiate this simulation with a much lower allelic frequency (0.00105) than used in the rest of the study to better exemplify the actual selective effect over a 1,000-year time scale. (D) The allelic selection effect over a 2,000-year time scale."
+    },
+    {
+      "self_ref": "#/texts/54",
+      "parent": {
+        "$ref": "#/texts/0"
+      },
+      "children": [
+        {
+          "$ref": "#/texts/55"
+        },
+        {
+          "$ref": "#/texts/56"
+        },
+        {
+          "$ref": "#/texts/57"
+        },
+        {
+          "$ref": "#/texts/58"
+        },
+        {
+          "$ref": "#/texts/59"
+        },
+        {
+          "$ref": "#/texts/60"
+        }
+      ],
+      "label": "section_header",
+      "prov": [],
+      "orig": "Discussion",
+      "text": "Discussion",
+      "level": 1
+    },
+    {
+      "self_ref": "#/texts/55",
+      "parent": {
+        "$ref": "#/texts/54"
+      },
+      "children": [],
+      "label": "text",
+      "prov": [],
+      "orig": "This study illustrates how populations can differ in susceptibility to epidemic HIV/AIDS depending on a ubiquitous attribute such as a prevailing genotype. We have examined heterosexual HIV epidemics by using mathematical models to assess HIV transmission in dynamic populations either with or without CCR5\u039432 heterozygous and homozygous persons. The most susceptible population lacks the protective mutation in CCR5. In less susceptible populations, the majority of persons carrying the CCR5\u039432 allele are heterozygotes. We explore the hypothesis that lower viral loads (CCR5\u039432 heterozygotes) or resistance to infection (CCR5\u039432 homozygotes) observed in persons with this coreceptor mutation ultimately can influence HIV epidemic trends. Two contrasting influences of the protective CCR5 allele are conceivable: it may limit the epidemic by decreasing the probability of infection because of lower viral loads in infected heterozygotes, or it may exacerbate the epidemic by extending the time that infectious individuals remain in the sexually active population. Our results strongly suggest the former. Thus, the absence of this allele in Africa could explain the severity of HIV disease as compared with populations where the allele is present.",
+      "text": "This study illustrates how populations can differ in susceptibility to epidemic HIV/AIDS depending on a ubiquitous attribute such as a prevailing genotype. We have examined heterosexual HIV epidemics by using mathematical models to assess HIV transmission in dynamic populations either with or without CCR5\u039432 heterozygous and homozygous persons. The most susceptible population lacks the protective mutation in CCR5. In less susceptible populations, the majority of persons carrying the CCR5\u039432 allele are heterozygotes. We explore the hypothesis that lower viral loads (CCR5\u039432 heterozygotes) or resistance to infection (CCR5\u039432 homozygotes) observed in persons with this coreceptor mutation ultimately can influence HIV epidemic trends. Two contrasting influences of the protective CCR5 allele are conceivable: it may limit the epidemic by decreasing the probability of infection because of lower viral loads in infected heterozygotes, or it may exacerbate the epidemic by extending the time that infectious individuals remain in the sexually active population. Our results strongly suggest the former. Thus, the absence of this allele in Africa could explain the severity of HIV disease as compared with populations where the allele is present."
+    },
+    {
+      "self_ref": "#/texts/56",
+      "parent": {
+        "$ref": "#/texts/54"
+      },
+      "children": [],
+      "label": "text",
+      "prov": [],
+      "orig": "We also observed that HIV can provide selective pressure for the CCR5\u039432 allele within a population, increasing the allelic frequency. Other influences may have additionally selected for this allele. Infectious diseases such as plague and small pox have been postulated to select for CCR5\u039432 (57, 58). For plague, relatively high levels of CCR5\u039432 are believed to have arisen within \u22484,000 years, accounting for the prevalence of the mutation only in populations of European descent. Smallpox virus uses the CC-coreceptor, indicating that direct selection for mutations in CCR5 may have offered resistance to smallpox. Given the differences in the epidemic rates of plague (59), smallpox, and HIV, it is difficult to directly compare our results to these findings. However, our model suggests that the CCR5\u039432 mutation could have reached its present allelic frequency in Northern Europe within this time frame if selected for by a disease with virulence patterns similar to HIV. Our results further support the idea that HIV has been only recently introduced as a pathogen into African populations, as the frequency of the protective allele is almost zero, and our model predicts that selection of the mutant allele in this population by HIV alone takes at least 1,000 years. This prediction is distinct from the frequency of the CCR5\u039432 allele in European populations, where pathogens that may have influenced its frequency (e.g., Yersinia pestis) have been present for much longer.",
+      "text": "We also observed that HIV can provide selective pressure for the CCR5\u039432 allele within a population, increasing the allelic frequency. Other influences may have additionally selected for this allele. Infectious diseases such as plague and small pox have been postulated to select for CCR5\u039432 (57, 58). For plague, relatively high levels of CCR5\u039432 are believed to have arisen within \u22484,000 years, accounting for the prevalence of the mutation only in populations of European descent. Smallpox virus uses the CC-coreceptor, indicating that direct selection for mutations in CCR5 may have offered resistance to smallpox. Given the differences in the epidemic rates of plague (59), smallpox, and HIV, it is difficult to directly compare our results to these findings. However, our model suggests that the CCR5\u039432 mutation could have reached its present allelic frequency in Northern Europe within this time frame if selected for by a disease with virulence patterns similar to HIV. Our results further support the idea that HIV has been only recently introduced as a pathogen into African populations, as the frequency of the protective allele is almost zero, and our model predicts that selection of the mutant allele in this population by HIV alone takes at least 1,000 years. This prediction is distinct from the frequency of the CCR5\u039432 allele in European populations, where pathogens that may have influenced its frequency (e.g., Yersinia pestis) have been present for much longer."
+    },
+    {
+      "self_ref": "#/texts/57",
+      "parent": {
+        "$ref": "#/texts/54"
+      },
+      "children": [],
+      "label": "text",
+      "prov": [],
+      "orig": "Two mathematical models have considered the role of parasite and host genetic heterogeneity with regard to susceptibility to another pathogen, namely malaria (60, 61). In each it was determined that heterogeneity of host resistance facilitates the maintenance of diversity in parasite virulence. Given our underlying interest in the coevolution of pathogen and host, we focus on changes in a host protective mutation, holding the virulence of the pathogen constant over time.",
+      "text": "Two mathematical models have considered the role of parasite and host genetic heterogeneity with regard to susceptibility to another pathogen, namely malaria (60, 61). In each it was determined that heterogeneity of host resistance facilitates the maintenance of diversity in parasite virulence. Given our underlying interest in the coevolution of pathogen and host, we focus on changes in a host protective mutation, holding the virulence of the pathogen constant over time."
+    },
+    {
+      "self_ref": "#/texts/58",
+      "parent": {
+        "$ref": "#/texts/54"
+      },
+      "children": [],
+      "label": "text",
+      "prov": [],
+      "orig": "Even within our focus on host protective mutations, numerous genetic factors, beneficial or detrimental, could potentially influence epidemics. Other genetically determined host factors affecting HIV susceptibility and disease progression include a CCR5 A/A to G/G promoter polymorphism (62), a CCR2 point mutation (11, 63), and a mutation in the CXCR4 ligand (64). The CCR2b mutation, CCR264I, is found in linkage with at least one CCR5 promoter polymorphism (65) and is prevalent in populations where CCR5\u039432 is nonexistent, such as sub-Saharan Africa (63). However, as none of these mutations have been consistently shown to be as protective as the CCR5\u039432 allele, we simplified our model to incorporate only the effect of CCR5\u039432. Subsequent models could be constructed from our model to account for the complexity of multiple protective alleles. It is interesting to note that our model predicts that even if CCR264I is present at high frequencies in Africa, its protective effects may not augment the lack of a protective allele such as CCR5\u039432.",
+      "text": "Even within our focus on host protective mutations, numerous genetic factors, beneficial or detrimental, could potentially influence epidemics. Other genetically determined host factors affecting HIV susceptibility and disease progression include a CCR5 A/A to G/G promoter polymorphism (62), a CCR2 point mutation (11, 63), and a mutation in the CXCR4 ligand (64). The CCR2b mutation, CCR264I, is found in linkage with at least one CCR5 promoter polymorphism (65) and is prevalent in populations where CCR5\u039432 is nonexistent, such as sub-Saharan Africa (63). However, as none of these mutations have been consistently shown to be as protective as the CCR5\u039432 allele, we simplified our model to incorporate only the effect of CCR5\u039432. Subsequent models could be constructed from our model to account for the complexity of multiple protective alleles. It is interesting to note that our model predicts that even if CCR264I is present at high frequencies in Africa, its protective effects may not augment the lack of a protective allele such as CCR5\u039432."
+    },
+    {
+      "self_ref": "#/texts/59",
+      "parent": {
+        "$ref": "#/texts/54"
+      },
+      "children": [],
+      "label": "text",
+      "prov": [],
+      "orig": "Although our models demonstrate that genetic factors can contribute to the high prevalence of HIV in sub-Saharan Africa, demographic factors are also clearly important in this region. Our models explicitly incorporated such factors, for example, lack of treatment availability. Additional factors were implicitly controlled for by varying only the presence of the CCR5\u039432 allele. More complex models eventually could include interactions with infectious diseases that serve as cofactors in HIV transmission. The role of high sexually transmitted disease prevalences in HIV infection has long been discussed, especially in relation to core populations (15, 50, 66). Malaria, too, might influence HIV transmission, as it is associated with transient increases in semen HIV viral loads and thus could increase the susceptibility of the population to epidemic HIV (16).",
+      "text": "Although our models demonstrate that genetic factors can contribute to the high prevalence of HIV in sub-Saharan Africa, demographic factors are also clearly important in this region. Our models explicitly incorporated such factors, for example, lack of treatment availability. Additional factors were implicitly controlled for by varying only the presence of the CCR5\u039432 allele. More complex models eventually could include interactions with infectious diseases that serve as cofactors in HIV transmission. The role of high sexually transmitted disease prevalences in HIV infection has long been discussed, especially in relation to core populations (15, 50, 66). Malaria, too, might influence HIV transmission, as it is associated with transient increases in semen HIV viral loads and thus could increase the susceptibility of the population to epidemic HIV (16)."
+    },
+    {
+      "self_ref": "#/texts/60",
+      "parent": {
+        "$ref": "#/texts/54"
+      },
+      "children": [],
+      "label": "text",
+      "prov": [],
+      "orig": "In assessing the HIV/AIDS epidemic, considerable attention has been paid to the influence of core groups in driving sexually transmitted disease epidemics. Our results also highlight how characteristics more uniformly distributed in a population can affect susceptibility. We observed that the genotypic profile of a population affects its susceptibility to epidemic HIV/AIDS. Additional studies are needed to better characterize the influence of these genetic determinants on HIV transmission, as they may be crucial in estimating the severity of the epidemic in some populations. This information can influence the design of treatment strategies as well as point to the urgency for education and prevention programs.",
+      "text": "In assessing the HIV/AIDS epidemic, considerable attention has been paid to the influence of core groups in driving sexually transmitted disease epidemics. Our results also highlight how characteristics more uniformly distributed in a population can affect susceptibility. We observed that the genotypic profile of a population affects its susceptibility to epidemic HIV/AIDS. Additional studies are needed to better characterize the influence of these genetic determinants on HIV transmission, as they may be crucial in estimating the severity of the epidemic in some populations. This information can influence the design of treatment strategies as well as point to the urgency for education and prevention programs."
+    },
+    {
+      "self_ref": "#/texts/61",
+      "parent": {
+        "$ref": "#/texts/0"
+      },
+      "children": [
+        {
+          "$ref": "#/texts/62"
+        }
+      ],
+      "label": "section_header",
+      "prov": [],
+      "orig": "Acknowledgments",
+      "text": "Acknowledgments",
+      "level": 1
+    },
+    {
+      "self_ref": "#/texts/62",
+      "parent": {
+        "$ref": "#/texts/61"
+      },
+      "children": [],
+      "label": "text",
+      "prov": [],
+      "orig": "We thank Mark Krosky, Katia Koelle, and Kevin Chung for programming and technical assistance. We also thank Drs. V. J. DiRita, P. Kazanjian, and S. M. Blower for helpful comments and discussions. We thank the reviewers for extremely insightful comments.",
+      "text": "We thank Mark Krosky, Katia Koelle, and Kevin Chung for programming and technical assistance. We also thank Drs. V. J. DiRita, P. Kazanjian, and S. M. Blower for helpful comments and discussions. We thank the reviewers for extremely insightful comments."
+    },
+    {
+      "self_ref": "#/texts/63",
+      "parent": {
+        "$ref": "#/texts/0"
+      },
+      "children": [
+        {
+          "$ref": "#/groups/0"
+        }
+      ],
+      "label": "section_header",
+      "prov": [],
+      "orig": "References",
+      "text": "References",
+      "level": 1
+    },
+    {
+      "self_ref": "#/texts/64",
+      "parent": {
+        "$ref": "#/groups/0"
+      },
+      "children": [],
+      "label": "list_item",
+      "prov": [],
+      "orig": "Weiss HA, Hawkes S. Leprosy Rev 72:92\u201398 (2001). PMID: 11355525",
+      "text": "Weiss HA, Hawkes S. Leprosy Rev 72:92\u201398 (2001). PMID: 11355525",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/65",
+      "parent": {
+        "$ref": "#/groups/0"
+      },
+      "children": [],
+      "label": "list_item",
+      "prov": [],
+      "orig": "Taha TE, Dallabetta GA, Hoover DR, Chiphangwi JD, Mtimavalye LAR. AIDS 12:197\u2013203 (1998). PMID: 9468369",
+      "text": "Taha TE, Dallabetta GA, Hoover DR, Chiphangwi JD, Mtimavalye LAR. AIDS 12:197\u2013203 (1998). PMID: 9468369",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/66",
+      "parent": {
+        "$ref": "#/groups/0"
+      },
+      "children": [],
+      "label": "list_item",
+      "prov": [],
+      "orig": "AIDS Epidemic Update. Geneva: World Health Organization1\u201317 (1998).",
+      "text": "AIDS Epidemic Update. Geneva: World Health Organization1\u201317 (1998).",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/67",
+      "parent": {
+        "$ref": "#/groups/0"
+      },
+      "children": [],
+      "label": "list_item",
+      "prov": [],
+      "orig": "D'Souza MP, Harden VA. Nat Med 2:1293\u20131300 (1996). PMID: 8946819",
+      "text": "D'Souza MP, Harden VA. Nat Med 2:1293\u20131300 (1996). PMID: 8946819",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/68",
+      "parent": {
+        "$ref": "#/groups/0"
+      },
+      "children": [],
+      "label": "list_item",
+      "prov": [],
+      "orig": "Martinson JJ, Chapman NH, Rees DC, Liu YT, Clegg JB. Nat Genet 16:100\u2013103 (1997). PMID: 9140404",
+      "text": "Martinson JJ, Chapman NH, Rees DC, Liu YT, Clegg JB. Nat Genet 16:100\u2013103 (1997). PMID: 9140404",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/69",
+      "parent": {
+        "$ref": "#/groups/0"
+      },
+      "children": [],
+      "label": "list_item",
+      "prov": [],
+      "orig": "Roos MTL, Lange JMA, deGoede REY, Miedema PT, Tersmette F, Coutinho M, Schellekens RA. J Infect Dis 165:427\u2013432 (1992). PMID: 1347054",
+      "text": "Roos MTL, Lange JMA, deGoede REY, Miedema PT, Tersmette F, Coutinho M, Schellekens RA. J Infect Dis 165:427\u2013432 (1992). PMID: 1347054",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/70",
+      "parent": {
+        "$ref": "#/groups/0"
+      },
+      "children": [],
+      "label": "list_item",
+      "prov": [],
+      "orig": "Garred P, Eugen-Olsen J, Iversen AKN, Benfield TL, Svejgaard A, Hofmann B. Lancet 349:1884 (1997). PMID: 9217763",
+      "text": "Garred P, Eugen-Olsen J, Iversen AKN, Benfield TL, Svejgaard A, Hofmann B. Lancet 349:1884 (1997). PMID: 9217763",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/71",
+      "parent": {
+        "$ref": "#/groups/0"
+      },
+      "children": [],
+      "label": "list_item",
+      "prov": [],
+      "orig": "Katzenstein TL, Eugen-Olsen J, Hofman B, Benfield T, Pedersen C, Iversen AK, Sorensen AM, Garred P, Koppelhus U, Svejgaard A, Gerstoft J. J Acquired Immune Defic Syndr Hum Retrovirol 16:10\u201314 (1997). PMID: 9377119",
+      "text": "Katzenstein TL, Eugen-Olsen J, Hofman B, Benfield T, Pedersen C, Iversen AK, Sorensen AM, Garred P, Koppelhus U, Svejgaard A, Gerstoft J. J Acquired Immune Defic Syndr Hum Retrovirol 16:10\u201314 (1997). PMID: 9377119",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/72",
+      "parent": {
+        "$ref": "#/groups/0"
+      },
+      "children": [],
+      "label": "list_item",
+      "prov": [],
+      "orig": "deRoda H, Meyer K, Katzenstain W, Dean M. Science 273:1856\u20131862 (1996). PMID: 8791590",
+      "text": "deRoda H, Meyer K, Katzenstain W, Dean M. Science 273:1856\u20131862 (1996). PMID: 8791590",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/73",
+      "parent": {
+        "$ref": "#/groups/0"
+      },
+      "children": [],
+      "label": "list_item",
+      "prov": [],
+      "orig": "Meyer L, Magierowska M, Hubert JB, Rouzioux C, Deveau C, Sanson F, Debre P, Delfraissy JF, Theodorou I. AIDS 11:F73\u2013F78 (1997). PMID: 9302436",
+      "text": "Meyer L, Magierowska M, Hubert JB, Rouzioux C, Deveau C, Sanson F, Debre P, Delfraissy JF, Theodorou I. AIDS 11:F73\u2013F78 (1997). PMID: 9302436",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/74",
+      "parent": {
+        "$ref": "#/groups/0"
+      },
+      "children": [],
+      "label": "list_item",
+      "prov": [],
+      "orig": "Smith MW, Dean M, Carrington M, Winkler C, Huttley DA, Lomb GA, Goedert JJ, O'Brien TR, Jacobson LP, Kaslow R, et al. Science 277:959\u2013965 (1997). PMID: 9252328",
+      "text": "Smith MW, Dean M, Carrington M, Winkler C, Huttley DA, Lomb GA, Goedert JJ, O'Brien TR, Jacobson LP, Kaslow R, et al. Science 277:959\u2013965 (1997). PMID: 9252328",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/75",
+      "parent": {
+        "$ref": "#/groups/0"
+      },
+      "children": [],
+      "label": "list_item",
+      "prov": [],
+      "orig": "Samson M, Libert F, Doranz BJ, Rucker J, Liesnard C, Farber CM, Saragosti S, Lapoumeroulie C, Cognaux J, Forceille C, et al. Nature (London) 382:722\u2013725 (1996). PMID: 8751444",
+      "text": "Samson M, Libert F, Doranz BJ, Rucker J, Liesnard C, Farber CM, Saragosti S, Lapoumeroulie C, Cognaux J, Forceille C, et al. Nature (London) 382:722\u2013725 (1996). PMID: 8751444",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/76",
+      "parent": {
+        "$ref": "#/groups/0"
+      },
+      "children": [],
+      "label": "list_item",
+      "prov": [],
+      "orig": "McNicholl JM, Smith DK, Qari SH, Hodge T. Emerging Infect Dis 3:261\u2013271 (1997). PMID: 9284370",
+      "text": "McNicholl JM, Smith DK, Qari SH, Hodge T. Emerging Infect Dis 3:261\u2013271 (1997). PMID: 9284370",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/77",
+      "parent": {
+        "$ref": "#/groups/0"
+      },
+      "children": [],
+      "label": "list_item",
+      "prov": [],
+      "orig": "Michael NL, Chang G, Louie LG, Mascola JR, Dondero D, Birx DL, Sheppard HW. Nat Med 3:338\u2013340 (1997). PMID: 9055864",
+      "text": "Michael NL, Chang G, Louie LG, Mascola JR, Dondero D, Birx DL, Sheppard HW. Nat Med 3:338\u2013340 (1997). PMID: 9055864",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/78",
+      "parent": {
+        "$ref": "#/groups/0"
+      },
+      "children": [],
+      "label": "list_item",
+      "prov": [],
+      "orig": "Mayaud P, Mosha F, Todd J, Balira R, Mgara J, West B, Rusizoka M, Mwijarubi E, Gabone R, Gavyole A, et al. AIDS 11:1873\u20131880 (1997). PMID: 9412707",
+      "text": "Mayaud P, Mosha F, Todd J, Balira R, Mgara J, West B, Rusizoka M, Mwijarubi E, Gabone R, Gavyole A, et al. AIDS 11:1873\u20131880 (1997). PMID: 9412707",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/79",
+      "parent": {
+        "$ref": "#/groups/0"
+      },
+      "children": [],
+      "label": "list_item",
+      "prov": [],
+      "orig": "Hoffman IF, Jere CS, Taylor TE, Munthali P, Dyer JR. AIDS 13:487\u2013494 (1998).",
+      "text": "Hoffman IF, Jere CS, Taylor TE, Munthali P, Dyer JR. AIDS 13:487\u2013494 (1998).",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/80",
+      "parent": {
+        "$ref": "#/groups/0"
+      },
+      "children": [],
+      "label": "list_item",
+      "prov": [],
+      "orig": "HIV/AIDS Surveillance Database. Washington, DC: Population Division, International Programs Center (1999).",
+      "text": "HIV/AIDS Surveillance Database. Washington, DC: Population Division, International Programs Center (1999).",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/81",
+      "parent": {
+        "$ref": "#/groups/0"
+      },
+      "children": [],
+      "label": "list_item",
+      "prov": [],
+      "orig": "Anderson RM, May RM, McLean AR. Nature (London) 332:228\u2013234 (1988). PMID: 3279320",
+      "text": "Anderson RM, May RM, McLean AR. Nature (London) 332:228\u2013234 (1988). PMID: 3279320",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/82",
+      "parent": {
+        "$ref": "#/groups/0"
+      },
+      "children": [],
+      "label": "list_item",
+      "prov": [],
+      "orig": "Berger EA, Doms RW, Fenyo EM, Korber BT, Littman DR, Moore JP, Sattentau QJ, Schuitemaker H, Sodroski J, Weiss RA. Nature (London) 391:240 (1998). PMID: 9440686",
+      "text": "Berger EA, Doms RW, Fenyo EM, Korber BT, Littman DR, Moore JP, Sattentau QJ, Schuitemaker H, Sodroski J, Weiss RA. Nature (London) 391:240 (1998). PMID: 9440686",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/83",
+      "parent": {
+        "$ref": "#/groups/0"
+      },
+      "children": [],
+      "label": "list_item",
+      "prov": [],
+      "orig": "Alkhatib G, Broder CC, Berger EA. J Virol 70:5487\u20135494 (1996). PMID: 8764060",
+      "text": "Alkhatib G, Broder CC, Berger EA. J Virol 70:5487\u20135494 (1996). PMID: 8764060",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/84",
+      "parent": {
+        "$ref": "#/groups/0"
+      },
+      "children": [],
+      "label": "list_item",
+      "prov": [],
+      "orig": "Choe H, Farzan M, Sun Y, Sullivan N, Rollins B, Ponath PD, Wu L, Mackay CR, LaRosa G, Newman W, et al. Cell 85:1135\u20131148 (1996). PMID: 8674119",
+      "text": "Choe H, Farzan M, Sun Y, Sullivan N, Rollins B, Ponath PD, Wu L, Mackay CR, LaRosa G, Newman W, et al. Cell 85:1135\u20131148 (1996). PMID: 8674119",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/85",
+      "parent": {
+        "$ref": "#/groups/0"
+      },
+      "children": [],
+      "label": "list_item",
+      "prov": [],
+      "orig": "Deng H, Liu R, Ellmeier W, Choe S, Unutmaz D, Burkhart M, Di Marzio P, Marmon S, Sutton RE, Hill CM, et al. Nature (London) 381:661\u2013666 (1996). PMID: 8649511",
+      "text": "Deng H, Liu R, Ellmeier W, Choe S, Unutmaz D, Burkhart M, Di Marzio P, Marmon S, Sutton RE, Hill CM, et al. Nature (London) 381:661\u2013666 (1996). PMID: 8649511",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/86",
+      "parent": {
+        "$ref": "#/groups/0"
+      },
+      "children": [],
+      "label": "list_item",
+      "prov": [],
+      "orig": "Doranz BJ, Rucker J, Yi Y, Smyth RJ, Samsom M, Peiper M, Parmentier SC, Collman RG, Doms RW. Cell 85:1149\u20131158 (1996). PMID: 8674120",
+      "text": "Doranz BJ, Rucker J, Yi Y, Smyth RJ, Samsom M, Peiper M, Parmentier SC, Collman RG, Doms RW. Cell 85:1149\u20131158 (1996). PMID: 8674120",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/87",
+      "parent": {
+        "$ref": "#/groups/0"
+      },
+      "children": [],
+      "label": "list_item",
+      "prov": [],
+      "orig": "Dragic T, Litwin V, Allaway GP, Martin SR, Huang Y, Nagashima KA, Cayanan C, Maddon PJ, Koup RA, Moore JP, Paxton WA. Nature (London) 381:667\u2013673 (1996). PMID: 8649512",
+      "text": "Dragic T, Litwin V, Allaway GP, Martin SR, Huang Y, Nagashima KA, Cayanan C, Maddon PJ, Koup RA, Moore JP, Paxton WA. Nature (London) 381:667\u2013673 (1996). PMID: 8649512",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/88",
+      "parent": {
+        "$ref": "#/groups/0"
+      },
+      "children": [],
+      "label": "list_item",
+      "prov": [],
+      "orig": "Zhu T, Mo H, Wang N, Nam DS, Cao Y, Koup RA, Ho DD. Science 261:1179\u20131181 (1993). PMID: 8356453",
+      "text": "Zhu T, Mo H, Wang N, Nam DS, Cao Y, Koup RA, Ho DD. Science 261:1179\u20131181 (1993). PMID: 8356453",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/89",
+      "parent": {
+        "$ref": "#/groups/0"
+      },
+      "children": [],
+      "label": "list_item",
+      "prov": [],
+      "orig": "Bjorndal A, Deng H, Jansson M, Fiore JR, Colognesi C, Karlsson A, Albert J, Scarlatti G, Littman DR, Fenyo EM. J Virol 71:7478\u20137487 (1997). PMID: 9311827",
+      "text": "Bjorndal A, Deng H, Jansson M, Fiore JR, Colognesi C, Karlsson A, Albert J, Scarlatti G, Littman DR, Fenyo EM. J Virol 71:7478\u20137487 (1997). PMID: 9311827",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/90",
+      "parent": {
+        "$ref": "#/groups/0"
+      },
+      "children": [],
+      "label": "list_item",
+      "prov": [],
+      "orig": "Conner RI, Sheridan KE, Ceradinin D, Choe S, Landau NR. J Exp Med 185:621\u2013628 (1997). PMID: 9034141",
+      "text": "Conner RI, Sheridan KE, Ceradinin D, Choe S, Landau NR. J Exp Med 185:621\u2013628 (1997). PMID: 9034141",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/91",
+      "parent": {
+        "$ref": "#/groups/0"
+      },
+      "children": [],
+      "label": "list_item",
+      "prov": [],
+      "orig": "Liu R, Paxton WA, Choe S, Ceradini D, Martin SR, Horuk R, MacDonald ME, Stuhlmann H, Koup RA, Landau NR. Cell 86:367\u2013377 (1996). PMID: 8756719",
+      "text": "Liu R, Paxton WA, Choe S, Ceradini D, Martin SR, Horuk R, MacDonald ME, Stuhlmann H, Koup RA, Landau NR. Cell 86:367\u2013377 (1996). PMID: 8756719",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/92",
+      "parent": {
+        "$ref": "#/groups/0"
+      },
+      "children": [],
+      "label": "list_item",
+      "prov": [],
+      "orig": "Mussico M, Lazzarin A, Nicolosi A, Gasparini M, Costigliola P, Arici C, Saracco A. Arch Intern Med (Moscow) 154:1971\u20131976 (1994). PMID: 8074601",
+      "text": "Mussico M, Lazzarin A, Nicolosi A, Gasparini M, Costigliola P, Arici C, Saracco A. Arch Intern Med (Moscow) 154:1971\u20131976 (1994). PMID: 8074601",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/93",
+      "parent": {
+        "$ref": "#/groups/0"
+      },
+      "children": [],
+      "label": "list_item",
+      "prov": [],
+      "orig": "Michael NL, Nelson JA, KewalRamani VN, Chang G, O'Brien SJ, Mascola JR, Volsky B, Louder M, White GC, Littman DR, et al. J Virol 72:6040\u20136047 (1998). PMID: 9621067",
+      "text": "Michael NL, Nelson JA, KewalRamani VN, Chang G, O'Brien SJ, Mascola JR, Volsky B, Louder M, White GC, Littman DR, et al. J Virol 72:6040\u20136047 (1998). PMID: 9621067",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/94",
+      "parent": {
+        "$ref": "#/groups/0"
+      },
+      "children": [],
+      "label": "list_item",
+      "prov": [],
+      "orig": "Hethcote HW, Yorke JA. Gonorrhea Transmission Dynamics and Control. Berlin: Springer (1984).",
+      "text": "Hethcote HW, Yorke JA. Gonorrhea Transmission Dynamics and Control. Berlin: Springer (1984).",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/95",
+      "parent": {
+        "$ref": "#/groups/0"
+      },
+      "children": [],
+      "label": "list_item",
+      "prov": [],
+      "orig": "Anderson RM, May RM. Nature (London) 333:514\u2013522 (1988). PMID: 3374601",
+      "text": "Anderson RM, May RM. Nature (London) 333:514\u2013522 (1988). PMID: 3374601",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/96",
+      "parent": {
+        "$ref": "#/groups/0"
+      },
+      "children": [],
+      "label": "list_item",
+      "prov": [],
+      "orig": "Asiimwe-Okiror G, Opio AA, Musinguzi J, Madraa E, Tembo G, Carael M. AIDS 11:1757\u20131763 (1997). PMID: 9386811",
+      "text": "Asiimwe-Okiror G, Opio AA, Musinguzi J, Madraa E, Tembo G, Carael M. AIDS 11:1757\u20131763 (1997). PMID: 9386811",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/97",
+      "parent": {
+        "$ref": "#/groups/0"
+      },
+      "children": [],
+      "label": "list_item",
+      "prov": [],
+      "orig": "Carael M, Cleland J, Deheneffe JC, Ferry B, Ingham R. AIDS 9:1171\u20131175 (1995). PMID: 8519454",
+      "text": "Carael M, Cleland J, Deheneffe JC, Ferry B, Ingham R. AIDS 9:1171\u20131175 (1995). PMID: 8519454",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/98",
+      "parent": {
+        "$ref": "#/groups/0"
+      },
+      "children": [],
+      "label": "list_item",
+      "prov": [],
+      "orig": "Blower SM, Boe C. J AIDS 6:1347\u20131352 (1993). PMID: 8254474",
+      "text": "Blower SM, Boe C. J AIDS 6:1347\u20131352 (1993). PMID: 8254474",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/99",
+      "parent": {
+        "$ref": "#/groups/0"
+      },
+      "children": [],
+      "label": "list_item",
+      "prov": [],
+      "orig": "Kirschner D. J Appl Math 56:143\u2013166 (1996).",
+      "text": "Kirschner D. J Appl Math 56:143\u2013166 (1996).",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/100",
+      "parent": {
+        "$ref": "#/groups/0"
+      },
+      "children": [],
+      "label": "list_item",
+      "prov": [],
+      "orig": "Le Pont F, Blower S. J AIDS 4:987\u2013999 (1991). PMID: 1890608",
+      "text": "Le Pont F, Blower S. J AIDS 4:987\u2013999 (1991). PMID: 1890608",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/101",
+      "parent": {
+        "$ref": "#/groups/0"
+      },
+      "children": [],
+      "label": "list_item",
+      "prov": [],
+      "orig": "Kim MY, Lagakos SW. Ann Epidemiol 1:117\u2013128 (1990). PMID: 1669741",
+      "text": "Kim MY, Lagakos SW. Ann Epidemiol 1:117\u2013128 (1990). PMID: 1669741",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/102",
+      "parent": {
+        "$ref": "#/groups/0"
+      },
+      "children": [],
+      "label": "list_item",
+      "prov": [],
+      "orig": "Anderson RM, May RM. Infectious Disease of Humans: Dynamics and Control. Oxford: Oxford Univ. Press (1992).",
+      "text": "Anderson RM, May RM. Infectious Disease of Humans: Dynamics and Control. Oxford: Oxford Univ. Press (1992).",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/103",
+      "parent": {
+        "$ref": "#/groups/0"
+      },
+      "children": [],
+      "label": "list_item",
+      "prov": [],
+      "orig": "Ragni MV, Faruki H, Kingsley LA. J Acquired Immune Defic Syndr 17:42\u201345 (1998).",
+      "text": "Ragni MV, Faruki H, Kingsley LA. J Acquired Immune Defic Syndr 17:42\u201345 (1998).",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/104",
+      "parent": {
+        "$ref": "#/groups/0"
+      },
+      "children": [],
+      "label": "list_item",
+      "prov": [],
+      "orig": "Kaplan JE, Khabbaz RF, Murphy EL, Hermansen S, Roberts C, Lal R, Heneine W, Wright D, Matijas L, Thomson R, et al. J Acquired Immune Defic Syndr Hum Retrovirol 12:193\u2013201 (1996). PMID: 8680892",
+      "text": "Kaplan JE, Khabbaz RF, Murphy EL, Hermansen S, Roberts C, Lal R, Heneine W, Wright D, Matijas L, Thomson R, et al. J Acquired Immune Defic Syndr Hum Retrovirol 12:193\u2013201 (1996). PMID: 8680892",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/105",
+      "parent": {
+        "$ref": "#/groups/0"
+      },
+      "children": [],
+      "label": "list_item",
+      "prov": [],
+      "orig": "Padian NS, Shiboski SC, Glass SO, Vittinghoff E. Am J Edu 146:350\u2013357 (1997).",
+      "text": "Padian NS, Shiboski SC, Glass SO, Vittinghoff E. Am J Edu 146:350\u2013357 (1997).",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/106",
+      "parent": {
+        "$ref": "#/groups/0"
+      },
+      "children": [],
+      "label": "list_item",
+      "prov": [],
+      "orig": "Leynaert B, Downs AM, de Vincenzi I. Am J Edu 148:88\u201396 (1998).",
+      "text": "Leynaert B, Downs AM, de Vincenzi I. Am J Edu 148:88\u201396 (1998).",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/107",
+      "parent": {
+        "$ref": "#/groups/0"
+      },
+      "children": [],
+      "label": "list_item",
+      "prov": [],
+      "orig": "Garnett GP, Anderson RM. J Acquired Immune Defic Syndr 9:500\u2013513 (1995).",
+      "text": "Garnett GP, Anderson RM. J Acquired Immune Defic Syndr 9:500\u2013513 (1995).",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/108",
+      "parent": {
+        "$ref": "#/groups/0"
+      },
+      "children": [],
+      "label": "list_item",
+      "prov": [],
+      "orig": "Stigum H, Magnus P, Harris JR, Samualson SO, Bakketeig LS. Am J Edu 145:636\u2013643 (1997).",
+      "text": "Stigum H, Magnus P, Harris JR, Samualson SO, Bakketeig LS. Am J Edu 145:636\u2013643 (1997).",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/109",
+      "parent": {
+        "$ref": "#/groups/0"
+      },
+      "children": [],
+      "label": "list_item",
+      "prov": [],
+      "orig": "Ho DD, Neumann AU, Perelson AS, Chen W, Leonard JM, Markowitz M. Nature (London) 373:123\u2013126 (1995). PMID: 7816094",
+      "text": "Ho DD, Neumann AU, Perelson AS, Chen W, Leonard JM, Markowitz M. Nature (London) 373:123\u2013126 (1995). PMID: 7816094",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/110",
+      "parent": {
+        "$ref": "#/groups/0"
+      },
+      "children": [],
+      "label": "list_item",
+      "prov": [],
+      "orig": "World Resources (1998\u20131999). Oxford: Oxford Univ. Press (1999).",
+      "text": "World Resources (1998\u20131999). Oxford: Oxford Univ. Press (1999).",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/111",
+      "parent": {
+        "$ref": "#/groups/0"
+      },
+      "children": [],
+      "label": "list_item",
+      "prov": [],
+      "orig": "Kostrikis LG, Neumann AU, Thomson B, Korber BT, McHardy P, Karanicolas R, Deutsch L, Huang Y, Lew JF, McIntosh K, et al. J Virol 73:10264\u201310271 (1999). PMID: 10559343",
+      "text": "Kostrikis LG, Neumann AU, Thomson B, Korber BT, McHardy P, Karanicolas R, Deutsch L, Huang Y, Lew JF, McIntosh K, et al. J Virol 73:10264\u201310271 (1999). PMID: 10559343",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/112",
+      "parent": {
+        "$ref": "#/groups/0"
+      },
+      "children": [],
+      "label": "list_item",
+      "prov": [],
+      "orig": "Low-Beer D, Stoneburner RL, Mukulu A. Nat Med 3:553\u2013557 (1997). PMID: 9142126",
+      "text": "Low-Beer D, Stoneburner RL, Mukulu A. Nat Med 3:553\u2013557 (1997). PMID: 9142126",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/113",
+      "parent": {
+        "$ref": "#/groups/0"
+      },
+      "children": [],
+      "label": "list_item",
+      "prov": [],
+      "orig": "Grosskurth H, Mosha F, Todd J, Senkoro K, Newell J, Klokke A, Changalucha J, West B, Mayaud P, Gavyole A. AIDS 9:927\u2013934 (1995). PMID: 7576329",
+      "text": "Grosskurth H, Mosha F, Todd J, Senkoro K, Newell J, Klokke A, Changalucha J, West B, Mayaud P, Gavyole A. AIDS 9:927\u2013934 (1995). PMID: 7576329",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/114",
+      "parent": {
+        "$ref": "#/groups/0"
+      },
+      "children": [],
+      "label": "list_item",
+      "prov": [],
+      "orig": "Melo J, Beby-Defaux A, Faria C, Guiraud G, Folgosa E, Barreto A, Agius G. J AIDS 23:203\u2013204 (2000). PMID: 10737436",
+      "text": "Melo J, Beby-Defaux A, Faria C, Guiraud G, Folgosa E, Barreto A, Agius G. J AIDS 23:203\u2013204 (2000). PMID: 10737436",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/115",
+      "parent": {
+        "$ref": "#/groups/0"
+      },
+      "children": [],
+      "label": "list_item",
+      "prov": [],
+      "orig": "Iman RL, Helton JC, Campbell JE. J Quality Technol 13:174\u2013183 (1981).",
+      "text": "Iman RL, Helton JC, Campbell JE. J Quality Technol 13:174\u2013183 (1981).",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/116",
+      "parent": {
+        "$ref": "#/groups/0"
+      },
+      "children": [],
+      "label": "list_item",
+      "prov": [],
+      "orig": "Iman RL, Helton JC, Campbell JE. J Quality Technol 13:232\u2013240 (1981).",
+      "text": "Iman RL, Helton JC, Campbell JE. J Quality Technol 13:232\u2013240 (1981).",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/117",
+      "parent": {
+        "$ref": "#/groups/0"
+      },
+      "children": [],
+      "label": "list_item",
+      "prov": [],
+      "orig": "Blower SM, Dowlatabadi H. Int Stat Rev 62:229\u2013243 (1994).",
+      "text": "Blower SM, Dowlatabadi H. Int Stat Rev 62:229\u2013243 (1994).",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/118",
+      "parent": {
+        "$ref": "#/groups/0"
+      },
+      "children": [],
+      "label": "list_item",
+      "prov": [],
+      "orig": "Porco TC, Blower SM. Theor Popul Biol 54:117\u2013132 (1998). PMID: 9733654",
+      "text": "Porco TC, Blower SM. Theor Popul Biol 54:117\u2013132 (1998). PMID: 9733654",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/119",
+      "parent": {
+        "$ref": "#/groups/0"
+      },
+      "children": [],
+      "label": "list_item",
+      "prov": [],
+      "orig": "Blower SM, Porco TC, Darby G. Nat Med 4:673\u2013678 (1998). PMID: 9623975",
+      "text": "Blower SM, Porco TC, Darby G. Nat Med 4:673\u2013678 (1998). PMID: 9623975",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/120",
+      "parent": {
+        "$ref": "#/groups/0"
+      },
+      "children": [],
+      "label": "list_item",
+      "prov": [],
+      "orig": "Libert F, Cochaux P, Beckman G, Samson M, Aksenova M, Cao A, Czeizel A, Claustres M, de la Rua C, Ferrari M, et al. Hum Mol Genet 7:399\u2013406 (1998). PMID: 9466996",
+      "text": "Libert F, Cochaux P, Beckman G, Samson M, Aksenova M, Cao A, Czeizel A, Claustres M, de la Rua C, Ferrari M, et al. Hum Mol Genet 7:399\u2013406 (1998). PMID: 9466996",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/121",
+      "parent": {
+        "$ref": "#/groups/0"
+      },
+      "children": [],
+      "label": "list_item",
+      "prov": [],
+      "orig": "Lalani AS, Masters J, Zeng W, Barrett J, Pannu R, Everett H, Arendt CW, McFadden G. Science 286:1968\u20131971 (1999). PMID: 10583963",
+      "text": "Lalani AS, Masters J, Zeng W, Barrett J, Pannu R, Everett H, Arendt CW, McFadden G. Science 286:1968\u20131971 (1999). PMID: 10583963",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/122",
+      "parent": {
+        "$ref": "#/groups/0"
+      },
+      "children": [],
+      "label": "list_item",
+      "prov": [],
+      "orig": "Kermack WO, McKendrick AG. Proc R Soc London 261:700\u2013721 (1927).",
+      "text": "Kermack WO, McKendrick AG. Proc R Soc London 261:700\u2013721 (1927).",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/123",
+      "parent": {
+        "$ref": "#/groups/0"
+      },
+      "children": [],
+      "label": "list_item",
+      "prov": [],
+      "orig": "Gupta S, Hill AVS. Proc R Soc London Ser B 260:271\u2013277 (1995).",
+      "text": "Gupta S, Hill AVS. Proc R Soc London Ser B 260:271\u2013277 (1995).",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/124",
+      "parent": {
+        "$ref": "#/groups/0"
+      },
+      "children": [],
+      "label": "list_item",
+      "prov": [],
+      "orig": "Ruwende C, Khoo SC, Snow RW, Yates SNR, Kwiatkowski D, Gupta S, Warn P, Allsopp CE, Gilbert SC, Peschu N. Nature (London) 376:246\u2013249 (1995). PMID: 7617034",
+      "text": "Ruwende C, Khoo SC, Snow RW, Yates SNR, Kwiatkowski D, Gupta S, Warn P, Allsopp CE, Gilbert SC, Peschu N. Nature (London) 376:246\u2013249 (1995). PMID: 7617034",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/125",
+      "parent": {
+        "$ref": "#/groups/0"
+      },
+      "children": [],
+      "label": "list_item",
+      "prov": [],
+      "orig": "McDermott DH, Zimmerman PA, Guignard F, Kleeberger CA, Leitman SF, Murphy PM. Lancet 352:866\u2013870 (1998). PMID: 9742978",
+      "text": "McDermott DH, Zimmerman PA, Guignard F, Kleeberger CA, Leitman SF, Murphy PM. Lancet 352:866\u2013870 (1998). PMID: 9742978",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/126",
+      "parent": {
+        "$ref": "#/groups/0"
+      },
+      "children": [],
+      "label": "list_item",
+      "prov": [],
+      "orig": "Kostrikis LG, Huang Y, Moore JP, Wolinsky SM, Zhang L, Guo Y, Deutsch L, Phair J, Neumann AU, Ho DD. Nat Med 4:350\u2013353 (1998). PMID: 9500612",
+      "text": "Kostrikis LG, Huang Y, Moore JP, Wolinsky SM, Zhang L, Guo Y, Deutsch L, Phair J, Neumann AU, Ho DD. Nat Med 4:350\u2013353 (1998). PMID: 9500612",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/127",
+      "parent": {
+        "$ref": "#/groups/0"
+      },
+      "children": [],
+      "label": "list_item",
+      "prov": [],
+      "orig": "Winkler C, Modi W, Smith MW, Nelson GW, Wu X, Carrington M, Dean M, Honjo T, Tashiro K, Yabe D, et al. Science 279:389\u2013393 (1998). PMID: 9430590",
+      "text": "Winkler C, Modi W, Smith MW, Nelson GW, Wu X, Carrington M, Dean M, Honjo T, Tashiro K, Yabe D, et al. Science 279:389\u2013393 (1998). PMID: 9430590",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/128",
+      "parent": {
+        "$ref": "#/groups/0"
+      },
+      "children": [],
+      "label": "list_item",
+      "prov": [],
+      "orig": "Martinson JJ, Hong L, Karanicolas R, Moore JP, Kostrikis LG. AIDS 14:483\u2013489 (2000). PMID: 10780710",
+      "text": "Martinson JJ, Hong L, Karanicolas R, Moore JP, Kostrikis LG. AIDS 14:483\u2013489 (2000). PMID: 10780710",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/129",
+      "parent": {
+        "$ref": "#/groups/0"
+      },
+      "children": [],
+      "label": "list_item",
+      "prov": [],
+      "orig": "Vernazza PL, Eron JJ, Fiscus SA, Cohen MS. AIDS 13:155\u2013166 (1999). PMID: 10202821",
+      "text": "Vernazza PL, Eron JJ, Fiscus SA, Cohen MS. AIDS 13:155\u2013166 (1999). PMID: 10202821",
+      "enumerated": false,
+      "marker": "-"
+    }
+  ],
+  "pictures": [
+    {
+      "self_ref": "#/pictures/0",
+      "parent": {
+        "$ref": "#/texts/9"
+      },
+      "children": [],
+      "label": "picture",
+      "prov": [],
+      "captions": [
+        {
+          "$ref": "#/texts/11"
+        }
+      ],
+      "references": [],
+      "footnotes": [],
+      "annotations": []
+    },
+    {
+      "self_ref": "#/pictures/1",
+      "parent": {
+        "$ref": "#/texts/38"
+      },
+      "children": [],
+      "label": "picture",
+      "prov": [],
+      "captions": [
+        {
+          "$ref": "#/texts/42"
+        }
+      ],
+      "references": [],
+      "footnotes": [],
+      "annotations": []
+    },
+    {
+      "self_ref": "#/pictures/2",
+      "parent": {
+        "$ref": "#/texts/43"
+      },
+      "children": [],
+      "label": "picture",
+      "prov": [],
+      "captions": [
+        {
+          "$ref": "#/texts/47"
+        }
+      ],
+      "references": [],
+      "footnotes": [],
+      "annotations": []
+    },
+    {
+      "self_ref": "#/pictures/3",
+      "parent": {
+        "$ref": "#/texts/51"
+      },
+      "children": [],
+      "label": "picture",
+      "prov": [],
+      "captions": [
+        {
+          "$ref": "#/texts/53"
+        }
+      ],
+      "references": [],
+      "footnotes": [],
+      "annotations": []
+    }
+  ],
+  "tables": [
+    {
+      "self_ref": "#/tables/0",
+      "parent": {
+        "$ref": "#/texts/9"
+      },
+      "children": [],
+      "label": "table",
+      "prov": [],
+      "captions": [
+        {
+          "$ref": "#/texts/12"
+        }
+      ],
+      "references": [],
+      "footnotes": [],
+      "data": {
+        "table_cells": [
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 0,
+            "end_row_offset_idx": 1,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 1,
+            "text": "Parents",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 4,
+            "start_row_offset_idx": 0,
+            "end_row_offset_idx": 1,
+            "start_col_offset_idx": 1,
+            "end_col_offset_idx": 5,
+            "text": "Mother",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 5,
+            "start_row_offset_idx": 1,
+            "end_row_offset_idx": 2,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 5,
+            "text": "\n\n",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 2,
+            "end_row_offset_idx": 3,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 1,
+            "text": "Father",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 2,
+            "end_row_offset_idx": 3,
+            "start_col_offset_idx": 1,
+            "end_col_offset_idx": 2,
+            "text": "",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 2,
+            "end_row_offset_idx": 3,
+            "start_col_offset_idx": 2,
+            "end_col_offset_idx": 3,
+            "text": "W/W",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 2,
+            "end_row_offset_idx": 3,
+            "start_col_offset_idx": 3,
+            "end_col_offset_idx": 4,
+            "text": "W/\u039432",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 2,
+            "end_row_offset_idx": 3,
+            "start_col_offset_idx": 4,
+            "end_col_offset_idx": 5,
+            "text": "\u039432/\u039432",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 3,
+            "end_row_offset_idx": 4,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 1,
+            "text": "",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 3,
+            "end_row_offset_idx": 4,
+            "start_col_offset_idx": 1,
+            "end_col_offset_idx": 2,
+            "text": "W/W",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 3,
+            "end_row_offset_idx": 4,
+            "start_col_offset_idx": 2,
+            "end_col_offset_idx": 3,
+            "text": "\u03c71,j\n1,j\n",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 3,
+            "end_row_offset_idx": 4,
+            "start_col_offset_idx": 3,
+            "end_col_offset_idx": 4,
+            "text": "\u03c71,j\n1,j, \u03c72,j\n2,j\n",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 3,
+            "end_row_offset_idx": 4,
+            "start_col_offset_idx": 4,
+            "end_col_offset_idx": 5,
+            "text": "\u03c72,j\n2,j\n",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 4,
+            "end_row_offset_idx": 5,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 1,
+            "text": "",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 4,
+            "end_row_offset_idx": 5,
+            "start_col_offset_idx": 1,
+            "end_col_offset_idx": 2,
+            "text": "W/\u039432",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 4,
+            "end_row_offset_idx": 5,
+            "start_col_offset_idx": 2,
+            "end_col_offset_idx": 3,
+            "text": "\u03c71,j\n1,j, \u03c72,j\n2,j\n",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 4,
+            "end_row_offset_idx": 5,
+            "start_col_offset_idx": 3,
+            "end_col_offset_idx": 4,
+            "text": "\u03c71,j\n1,j, \u03c72,j\n2,j, \u03c73,j\n3,j\n",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 4,
+            "end_row_offset_idx": 5,
+            "start_col_offset_idx": 4,
+            "end_col_offset_idx": 5,
+            "text": "\u03c72,j\n2,j, \u03c73,j\n3,j\n",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 5,
+            "end_row_offset_idx": 6,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 1,
+            "text": "",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 5,
+            "end_row_offset_idx": 6,
+            "start_col_offset_idx": 1,
+            "end_col_offset_idx": 2,
+            "text": "\u039432/\u039432",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 5,
+            "end_row_offset_idx": 6,
+            "start_col_offset_idx": 2,
+            "end_col_offset_idx": 3,
+            "text": "\u03c72,j\n2,j\n",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 5,
+            "end_row_offset_idx": 6,
+            "start_col_offset_idx": 3,
+            "end_col_offset_idx": 4,
+            "text": "\u03c72,j\n2,j, \u03c73,j\n3,j\n",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 5,
+            "end_row_offset_idx": 6,
+            "start_col_offset_idx": 4,
+            "end_col_offset_idx": 5,
+            "text": "\u03c73,j\n3,j\n",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          }
+        ],
+        "num_rows": 6,
+        "num_cols": 5,
+        "grid": [
+          [
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 0,
+              "end_row_offset_idx": 1,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "Parents",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 4,
+              "start_row_offset_idx": 0,
+              "end_row_offset_idx": 1,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 5,
+              "text": "Mother",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 4,
+              "start_row_offset_idx": 0,
+              "end_row_offset_idx": 1,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 5,
+              "text": "Mother",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 4,
+              "start_row_offset_idx": 0,
+              "end_row_offset_idx": 1,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 5,
+              "text": "Mother",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 4,
+              "start_row_offset_idx": 0,
+              "end_row_offset_idx": 1,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 5,
+              "text": "Mother",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ],
+          [
+            {
+              "row_span": 1,
+              "col_span": 5,
+              "start_row_offset_idx": 1,
+              "end_row_offset_idx": 2,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 5,
+              "text": "\n\n",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 5,
+              "start_row_offset_idx": 1,
+              "end_row_offset_idx": 2,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 5,
+              "text": "\n\n",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 5,
+              "start_row_offset_idx": 1,
+              "end_row_offset_idx": 2,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 5,
+              "text": "\n\n",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 5,
+              "start_row_offset_idx": 1,
+              "end_row_offset_idx": 2,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 5,
+              "text": "\n\n",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 5,
+              "start_row_offset_idx": 1,
+              "end_row_offset_idx": 2,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 5,
+              "text": "\n\n",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ],
+          [
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 2,
+              "end_row_offset_idx": 3,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "Father",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 2,
+              "end_row_offset_idx": 3,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 2,
+              "text": "",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 2,
+              "end_row_offset_idx": 3,
+              "start_col_offset_idx": 2,
+              "end_col_offset_idx": 3,
+              "text": "W/W",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 2,
+              "end_row_offset_idx": 3,
+              "start_col_offset_idx": 3,
+              "end_col_offset_idx": 4,
+              "text": "W/\u039432",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 2,
+              "end_row_offset_idx": 3,
+              "start_col_offset_idx": 4,
+              "end_col_offset_idx": 5,
+              "text": "\u039432/\u039432",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ],
+          [
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 3,
+              "end_row_offset_idx": 4,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 3,
+              "end_row_offset_idx": 4,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 2,
+              "text": "W/W",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 3,
+              "end_row_offset_idx": 4,
+              "start_col_offset_idx": 2,
+              "end_col_offset_idx": 3,
+              "text": "\u03c71,j\n1,j\n",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 3,
+              "end_row_offset_idx": 4,
+              "start_col_offset_idx": 3,
+              "end_col_offset_idx": 4,
+              "text": "\u03c71,j\n1,j, \u03c72,j\n2,j\n",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 3,
+              "end_row_offset_idx": 4,
+              "start_col_offset_idx": 4,
+              "end_col_offset_idx": 5,
+              "text": "\u03c72,j\n2,j\n",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ],
+          [
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 4,
+              "end_row_offset_idx": 5,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 4,
+              "end_row_offset_idx": 5,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 2,
+              "text": "W/\u039432",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 4,
+              "end_row_offset_idx": 5,
+              "start_col_offset_idx": 2,
+              "end_col_offset_idx": 3,
+              "text": "\u03c71,j\n1,j, \u03c72,j\n2,j\n",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 4,
+              "end_row_offset_idx": 5,
+              "start_col_offset_idx": 3,
+              "end_col_offset_idx": 4,
+              "text": "\u03c71,j\n1,j, \u03c72,j\n2,j, \u03c73,j\n3,j\n",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 4,
+              "end_row_offset_idx": 5,
+              "start_col_offset_idx": 4,
+              "end_col_offset_idx": 5,
+              "text": "\u03c72,j\n2,j, \u03c73,j\n3,j\n",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ],
+          [
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 5,
+              "end_row_offset_idx": 6,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 5,
+              "end_row_offset_idx": 6,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 2,
+              "text": "\u039432/\u039432",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 5,
+              "end_row_offset_idx": 6,
+              "start_col_offset_idx": 2,
+              "end_col_offset_idx": 3,
+              "text": "\u03c72,j\n2,j\n",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 5,
+              "end_row_offset_idx": 6,
+              "start_col_offset_idx": 3,
+              "end_col_offset_idx": 4,
+              "text": "\u03c72,j\n2,j, \u03c73,j\n3,j\n",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 5,
+              "end_row_offset_idx": 6,
+              "start_col_offset_idx": 4,
+              "end_col_offset_idx": 5,
+              "text": "\u03c73,j\n3,j\n",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ]
+        ]
+      }
+    },
+    {
+      "self_ref": "#/tables/1",
+      "parent": {
+        "$ref": "#/texts/13"
+      },
+      "children": [],
+      "label": "table",
+      "prov": [],
+      "captions": [
+        {
+          "$ref": "#/texts/20"
+        }
+      ],
+      "references": [],
+      "footnotes": [],
+      "data": {
+        "table_cells": [
+          {
+            "row_span": 3,
+            "col_span": 1,
+            "start_row_offset_idx": 0,
+            "end_row_offset_idx": 3,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 1,
+            "text": "HIV-infected partner (\u00ee\u0131\u0131^^, \ueb30\ue2d4\ue2d4^^, \uea50k\nk^^)",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 4,
+            "start_row_offset_idx": 0,
+            "end_row_offset_idx": 1,
+            "start_col_offset_idx": 1,
+            "end_col_offset_idx": 5,
+            "text": "Susceptible partner (i, j)",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 4,
+            "start_row_offset_idx": 1,
+            "end_row_offset_idx": 2,
+            "start_col_offset_idx": 1,
+            "end_col_offset_idx": 5,
+            "text": "\n\n",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 2,
+            "end_row_offset_idx": 3,
+            "start_col_offset_idx": 1,
+            "end_col_offset_idx": 2,
+            "text": "(\ueb30\ue2d4\ue2d4^^ to j)",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 2,
+            "end_row_offset_idx": 3,
+            "start_col_offset_idx": 2,
+            "end_col_offset_idx": 3,
+            "text": "W/W",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 2,
+            "end_row_offset_idx": 3,
+            "start_col_offset_idx": 3,
+            "end_col_offset_idx": 4,
+            "text": "W/\u039432",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 2,
+            "end_row_offset_idx": 3,
+            "start_col_offset_idx": 4,
+            "end_col_offset_idx": 5,
+            "text": "\u039432/\u039432 ",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 5,
+            "start_row_offset_idx": 3,
+            "end_row_offset_idx": 4,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 5,
+            "text": "\n\n",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 4,
+            "end_row_offset_idx": 5,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 1,
+            "text": "Acute/primary",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 5,
+            "end_row_offset_idx": 6,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 1,
+            "text": "\u2003W/W or \u039432/\u039432",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 5,
+            "end_row_offset_idx": 6,
+            "start_col_offset_idx": 1,
+            "end_col_offset_idx": 2,
+            "text": "M to F",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 5,
+            "end_row_offset_idx": 6,
+            "start_col_offset_idx": 2,
+            "end_col_offset_idx": 3,
+            "text": "0.040",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 5,
+            "end_row_offset_idx": 6,
+            "start_col_offset_idx": 3,
+            "end_col_offset_idx": 4,
+            "text": "0.040",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 5,
+            "end_row_offset_idx": 6,
+            "start_col_offset_idx": 4,
+            "end_col_offset_idx": 5,
+            "text": "0.00040 ",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 6,
+            "end_row_offset_idx": 7,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 1,
+            "text": "",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 6,
+            "end_row_offset_idx": 7,
+            "start_col_offset_idx": 1,
+            "end_col_offset_idx": 2,
+            "text": "F to M",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 6,
+            "end_row_offset_idx": 7,
+            "start_col_offset_idx": 2,
+            "end_col_offset_idx": 3,
+            "text": "0.020",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 6,
+            "end_row_offset_idx": 7,
+            "start_col_offset_idx": 3,
+            "end_col_offset_idx": 4,
+            "text": "0.020",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 6,
+            "end_row_offset_idx": 7,
+            "start_col_offset_idx": 4,
+            "end_col_offset_idx": 5,
+            "text": "0.00020 ",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 7,
+            "end_row_offset_idx": 8,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 1,
+            "text": "\u2003W/\u039432",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 7,
+            "end_row_offset_idx": 8,
+            "start_col_offset_idx": 1,
+            "end_col_offset_idx": 2,
+            "text": "M to F",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 7,
+            "end_row_offset_idx": 8,
+            "start_col_offset_idx": 2,
+            "end_col_offset_idx": 3,
+            "text": "0.030",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 7,
+            "end_row_offset_idx": 8,
+            "start_col_offset_idx": 3,
+            "end_col_offset_idx": 4,
+            "text": "0.030",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 7,
+            "end_row_offset_idx": 8,
+            "start_col_offset_idx": 4,
+            "end_col_offset_idx": 5,
+            "text": "0.00030 ",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 8,
+            "end_row_offset_idx": 9,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 1,
+            "text": "",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 8,
+            "end_row_offset_idx": 9,
+            "start_col_offset_idx": 1,
+            "end_col_offset_idx": 2,
+            "text": "F to M",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 8,
+            "end_row_offset_idx": 9,
+            "start_col_offset_idx": 2,
+            "end_col_offset_idx": 3,
+            "text": "0.015",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 8,
+            "end_row_offset_idx": 9,
+            "start_col_offset_idx": 3,
+            "end_col_offset_idx": 4,
+            "text": "0.015",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 8,
+            "end_row_offset_idx": 9,
+            "start_col_offset_idx": 4,
+            "end_col_offset_idx": 5,
+            "text": "0.00015 ",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 9,
+            "end_row_offset_idx": 10,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 1,
+            "text": "Asymptomatic ",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 10,
+            "end_row_offset_idx": 11,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 1,
+            "text": "\u2003W/W or \u039432/\u039432",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 10,
+            "end_row_offset_idx": 11,
+            "start_col_offset_idx": 1,
+            "end_col_offset_idx": 2,
+            "text": "M to F",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 10,
+            "end_row_offset_idx": 11,
+            "start_col_offset_idx": 2,
+            "end_col_offset_idx": 3,
+            "text": "0.0010",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 10,
+            "end_row_offset_idx": 11,
+            "start_col_offset_idx": 3,
+            "end_col_offset_idx": 4,
+            "text": "0.0010",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 10,
+            "end_row_offset_idx": 11,
+            "start_col_offset_idx": 4,
+            "end_col_offset_idx": 5,
+            "text": "10 \u00d7 10\u22126\n",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 11,
+            "end_row_offset_idx": 12,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 1,
+            "text": "",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 11,
+            "end_row_offset_idx": 12,
+            "start_col_offset_idx": 1,
+            "end_col_offset_idx": 2,
+            "text": "F to M",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 11,
+            "end_row_offset_idx": 12,
+            "start_col_offset_idx": 2,
+            "end_col_offset_idx": 3,
+            "text": "0.0005",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 11,
+            "end_row_offset_idx": 12,
+            "start_col_offset_idx": 3,
+            "end_col_offset_idx": 4,
+            "text": "0.0005",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 11,
+            "end_row_offset_idx": 12,
+            "start_col_offset_idx": 4,
+            "end_col_offset_idx": 5,
+            "text": "5 \u00d7 10\u22126\n",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 12,
+            "end_row_offset_idx": 13,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 1,
+            "text": "\u2003W/\u039432",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 12,
+            "end_row_offset_idx": 13,
+            "start_col_offset_idx": 1,
+            "end_col_offset_idx": 2,
+            "text": "M to F",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 12,
+            "end_row_offset_idx": 13,
+            "start_col_offset_idx": 2,
+            "end_col_offset_idx": 3,
+            "text": "0.0005",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 12,
+            "end_row_offset_idx": 13,
+            "start_col_offset_idx": 3,
+            "end_col_offset_idx": 4,
+            "text": "0.0005",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 12,
+            "end_row_offset_idx": 13,
+            "start_col_offset_idx": 4,
+            "end_col_offset_idx": 5,
+            "text": "5 \u00d7 10\u22126\n",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 13,
+            "end_row_offset_idx": 14,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 1,
+            "text": "",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 13,
+            "end_row_offset_idx": 14,
+            "start_col_offset_idx": 1,
+            "end_col_offset_idx": 2,
+            "text": "F to M",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 13,
+            "end_row_offset_idx": 14,
+            "start_col_offset_idx": 2,
+            "end_col_offset_idx": 3,
+            "text": "0.00025",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 13,
+            "end_row_offset_idx": 14,
+            "start_col_offset_idx": 3,
+            "end_col_offset_idx": 4,
+            "text": "0.00025",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 13,
+            "end_row_offset_idx": 14,
+            "start_col_offset_idx": 4,
+            "end_col_offset_idx": 5,
+            "text": "2.5 \u00d7 10\u22126\n",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          }
+        ],
+        "num_rows": 14,
+        "num_cols": 5,
+        "grid": [
+          [
+            {
+              "row_span": 3,
+              "col_span": 1,
+              "start_row_offset_idx": 0,
+              "end_row_offset_idx": 3,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "HIV-infected partner (\u00ee\u0131\u0131^^, \ueb30\ue2d4\ue2d4^^, \uea50k\nk^^)",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 4,
+              "start_row_offset_idx": 0,
+              "end_row_offset_idx": 1,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 5,
+              "text": "Susceptible partner (i, j)",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 4,
+              "start_row_offset_idx": 0,
+              "end_row_offset_idx": 1,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 5,
+              "text": "Susceptible partner (i, j)",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 4,
+              "start_row_offset_idx": 0,
+              "end_row_offset_idx": 1,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 5,
+              "text": "Susceptible partner (i, j)",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 4,
+              "start_row_offset_idx": 0,
+              "end_row_offset_idx": 1,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 5,
+              "text": "Susceptible partner (i, j)",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ],
+          [
+            {
+              "row_span": 3,
+              "col_span": 1,
+              "start_row_offset_idx": 0,
+              "end_row_offset_idx": 3,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "HIV-infected partner (\u00ee\u0131\u0131^^, \ueb30\ue2d4\ue2d4^^, \uea50k\nk^^)",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 4,
+              "start_row_offset_idx": 1,
+              "end_row_offset_idx": 2,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 5,
+              "text": "\n\n",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 4,
+              "start_row_offset_idx": 1,
+              "end_row_offset_idx": 2,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 5,
+              "text": "\n\n",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 4,
+              "start_row_offset_idx": 1,
+              "end_row_offset_idx": 2,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 5,
+              "text": "\n\n",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 4,
+              "start_row_offset_idx": 1,
+              "end_row_offset_idx": 2,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 5,
+              "text": "\n\n",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ],
+          [
+            {
+              "row_span": 3,
+              "col_span": 1,
+              "start_row_offset_idx": 0,
+              "end_row_offset_idx": 3,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "HIV-infected partner (\u00ee\u0131\u0131^^, \ueb30\ue2d4\ue2d4^^, \uea50k\nk^^)",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 2,
+              "end_row_offset_idx": 3,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 2,
+              "text": "(\ueb30\ue2d4\ue2d4^^ to j)",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 2,
+              "end_row_offset_idx": 3,
+              "start_col_offset_idx": 2,
+              "end_col_offset_idx": 3,
+              "text": "W/W",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 2,
+              "end_row_offset_idx": 3,
+              "start_col_offset_idx": 3,
+              "end_col_offset_idx": 4,
+              "text": "W/\u039432",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 2,
+              "end_row_offset_idx": 3,
+              "start_col_offset_idx": 4,
+              "end_col_offset_idx": 5,
+              "text": "\u039432/\u039432 ",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ],
+          [
+            {
+              "row_span": 1,
+              "col_span": 5,
+              "start_row_offset_idx": 3,
+              "end_row_offset_idx": 4,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 5,
+              "text": "\n\n",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 5,
+              "start_row_offset_idx": 3,
+              "end_row_offset_idx": 4,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 5,
+              "text": "\n\n",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 5,
+              "start_row_offset_idx": 3,
+              "end_row_offset_idx": 4,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 5,
+              "text": "\n\n",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 5,
+              "start_row_offset_idx": 3,
+              "end_row_offset_idx": 4,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 5,
+              "text": "\n\n",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 5,
+              "start_row_offset_idx": 3,
+              "end_row_offset_idx": 4,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 5,
+              "text": "\n\n",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ],
+          [
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 4,
+              "end_row_offset_idx": 5,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "Acute/primary",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 4,
+              "end_row_offset_idx": 5,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 2,
+              "text": "",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 4,
+              "end_row_offset_idx": 5,
+              "start_col_offset_idx": 2,
+              "end_col_offset_idx": 3,
+              "text": "",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 4,
+              "end_row_offset_idx": 5,
+              "start_col_offset_idx": 3,
+              "end_col_offset_idx": 4,
+              "text": "",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 4,
+              "end_row_offset_idx": 5,
+              "start_col_offset_idx": 4,
+              "end_col_offset_idx": 5,
+              "text": "",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ],
+          [
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 5,
+              "end_row_offset_idx": 6,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "\u2003W/W or \u039432/\u039432",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 5,
+              "end_row_offset_idx": 6,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 2,
+              "text": "M to F",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 5,
+              "end_row_offset_idx": 6,
+              "start_col_offset_idx": 2,
+              "end_col_offset_idx": 3,
+              "text": "0.040",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 5,
+              "end_row_offset_idx": 6,
+              "start_col_offset_idx": 3,
+              "end_col_offset_idx": 4,
+              "text": "0.040",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 5,
+              "end_row_offset_idx": 6,
+              "start_col_offset_idx": 4,
+              "end_col_offset_idx": 5,
+              "text": "0.00040 ",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ],
+          [
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 6,
+              "end_row_offset_idx": 7,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 6,
+              "end_row_offset_idx": 7,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 2,
+              "text": "F to M",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 6,
+              "end_row_offset_idx": 7,
+              "start_col_offset_idx": 2,
+              "end_col_offset_idx": 3,
+              "text": "0.020",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 6,
+              "end_row_offset_idx": 7,
+              "start_col_offset_idx": 3,
+              "end_col_offset_idx": 4,
+              "text": "0.020",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 6,
+              "end_row_offset_idx": 7,
+              "start_col_offset_idx": 4,
+              "end_col_offset_idx": 5,
+              "text": "0.00020 ",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ],
+          [
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 7,
+              "end_row_offset_idx": 8,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "\u2003W/\u039432",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 7,
+              "end_row_offset_idx": 8,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 2,
+              "text": "M to F",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 7,
+              "end_row_offset_idx": 8,
+              "start_col_offset_idx": 2,
+              "end_col_offset_idx": 3,
+              "text": "0.030",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 7,
+              "end_row_offset_idx": 8,
+              "start_col_offset_idx": 3,
+              "end_col_offset_idx": 4,
+              "text": "0.030",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 7,
+              "end_row_offset_idx": 8,
+              "start_col_offset_idx": 4,
+              "end_col_offset_idx": 5,
+              "text": "0.00030 ",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ],
+          [
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 8,
+              "end_row_offset_idx": 9,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 8,
+              "end_row_offset_idx": 9,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 2,
+              "text": "F to M",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 8,
+              "end_row_offset_idx": 9,
+              "start_col_offset_idx": 2,
+              "end_col_offset_idx": 3,
+              "text": "0.015",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 8,
+              "end_row_offset_idx": 9,
+              "start_col_offset_idx": 3,
+              "end_col_offset_idx": 4,
+              "text": "0.015",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 8,
+              "end_row_offset_idx": 9,
+              "start_col_offset_idx": 4,
+              "end_col_offset_idx": 5,
+              "text": "0.00015 ",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ],
+          [
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 9,
+              "end_row_offset_idx": 10,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "Asymptomatic ",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 9,
+              "end_row_offset_idx": 10,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 2,
+              "text": "",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 9,
+              "end_row_offset_idx": 10,
+              "start_col_offset_idx": 2,
+              "end_col_offset_idx": 3,
+              "text": "",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 9,
+              "end_row_offset_idx": 10,
+              "start_col_offset_idx": 3,
+              "end_col_offset_idx": 4,
+              "text": "",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 9,
+              "end_row_offset_idx": 10,
+              "start_col_offset_idx": 4,
+              "end_col_offset_idx": 5,
+              "text": "",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ],
+          [
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 10,
+              "end_row_offset_idx": 11,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "\u2003W/W or \u039432/\u039432",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 10,
+              "end_row_offset_idx": 11,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 2,
+              "text": "M to F",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 10,
+              "end_row_offset_idx": 11,
+              "start_col_offset_idx": 2,
+              "end_col_offset_idx": 3,
+              "text": "0.0010",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 10,
+              "end_row_offset_idx": 11,
+              "start_col_offset_idx": 3,
+              "end_col_offset_idx": 4,
+              "text": "0.0010",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 10,
+              "end_row_offset_idx": 11,
+              "start_col_offset_idx": 4,
+              "end_col_offset_idx": 5,
+              "text": "10 \u00d7 10\u22126\n",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ],
+          [
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 11,
+              "end_row_offset_idx": 12,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 11,
+              "end_row_offset_idx": 12,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 2,
+              "text": "F to M",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 11,
+              "end_row_offset_idx": 12,
+              "start_col_offset_idx": 2,
+              "end_col_offset_idx": 3,
+              "text": "0.0005",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 11,
+              "end_row_offset_idx": 12,
+              "start_col_offset_idx": 3,
+              "end_col_offset_idx": 4,
+              "text": "0.0005",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 11,
+              "end_row_offset_idx": 12,
+              "start_col_offset_idx": 4,
+              "end_col_offset_idx": 5,
+              "text": "5 \u00d7 10\u22126\n",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ],
+          [
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 12,
+              "end_row_offset_idx": 13,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "\u2003W/\u039432",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 12,
+              "end_row_offset_idx": 13,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 2,
+              "text": "M to F",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 12,
+              "end_row_offset_idx": 13,
+              "start_col_offset_idx": 2,
+              "end_col_offset_idx": 3,
+              "text": "0.0005",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 12,
+              "end_row_offset_idx": 13,
+              "start_col_offset_idx": 3,
+              "end_col_offset_idx": 4,
+              "text": "0.0005",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 12,
+              "end_row_offset_idx": 13,
+              "start_col_offset_idx": 4,
+              "end_col_offset_idx": 5,
+              "text": "5 \u00d7 10\u22126\n",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ],
+          [
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 13,
+              "end_row_offset_idx": 14,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 13,
+              "end_row_offset_idx": 14,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 2,
+              "text": "F to M",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 13,
+              "end_row_offset_idx": 14,
+              "start_col_offset_idx": 2,
+              "end_col_offset_idx": 3,
+              "text": "0.00025",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 13,
+              "end_row_offset_idx": 14,
+              "start_col_offset_idx": 3,
+              "end_col_offset_idx": 4,
+              "text": "0.00025",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 13,
+              "end_row_offset_idx": 14,
+              "start_col_offset_idx": 4,
+              "end_col_offset_idx": 5,
+              "text": "2.5 \u00d7 10\u22126\n",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ]
+        ]
+      }
+    },
+    {
+      "self_ref": "#/tables/2",
+      "parent": {
+        "$ref": "#/texts/13"
+      },
+      "children": [],
+      "label": "table",
+      "prov": [],
+      "captions": [
+        {
+          "$ref": "#/texts/21"
+        }
+      ],
+      "references": [],
+      "footnotes": [],
+      "data": {
+        "table_cells": [
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 0,
+            "end_row_offset_idx": 1,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 1,
+            "text": "Genotype",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 0,
+            "end_row_offset_idx": 1,
+            "start_col_offset_idx": 1,
+            "end_col_offset_idx": 2,
+            "text": "Disease stage",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 0,
+            "end_row_offset_idx": 1,
+            "start_col_offset_idx": 2,
+            "end_col_offset_idx": 3,
+            "text": "Males/females ",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 3,
+            "start_row_offset_idx": 1,
+            "end_row_offset_idx": 2,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 3,
+            "text": "\n\n",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 2,
+            "end_row_offset_idx": 3,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 1,
+            "text": "W/W",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 2,
+            "end_row_offset_idx": 3,
+            "start_col_offset_idx": 1,
+            "end_col_offset_idx": 2,
+            "text": "A",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 2,
+            "end_row_offset_idx": 3,
+            "start_col_offset_idx": 2,
+            "end_col_offset_idx": 3,
+            "text": "3.5",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 3,
+            "end_row_offset_idx": 4,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 1,
+            "text": "",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 3,
+            "end_row_offset_idx": 4,
+            "start_col_offset_idx": 1,
+            "end_col_offset_idx": 2,
+            "text": "B",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 3,
+            "end_row_offset_idx": 4,
+            "start_col_offset_idx": 2,
+            "end_col_offset_idx": 3,
+            "text": "0.16667 ",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 4,
+            "end_row_offset_idx": 5,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 1,
+            "text": "W/\u039432",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 4,
+            "end_row_offset_idx": 5,
+            "start_col_offset_idx": 1,
+            "end_col_offset_idx": 2,
+            "text": "A",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 4,
+            "end_row_offset_idx": 5,
+            "start_col_offset_idx": 2,
+            "end_col_offset_idx": 3,
+            "text": "3.5 ",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 5,
+            "end_row_offset_idx": 6,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 1,
+            "text": "",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 5,
+            "end_row_offset_idx": 6,
+            "start_col_offset_idx": 1,
+            "end_col_offset_idx": 2,
+            "text": "B",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 5,
+            "end_row_offset_idx": 6,
+            "start_col_offset_idx": 2,
+            "end_col_offset_idx": 3,
+            "text": "0.125",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 6,
+            "end_row_offset_idx": 7,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 1,
+            "text": "\u039432/\u039432",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 6,
+            "end_row_offset_idx": 7,
+            "start_col_offset_idx": 1,
+            "end_col_offset_idx": 2,
+            "text": "A",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 6,
+            "end_row_offset_idx": 7,
+            "start_col_offset_idx": 2,
+            "end_col_offset_idx": 3,
+            "text": "3.5 ",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 7,
+            "end_row_offset_idx": 8,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 1,
+            "text": "",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 7,
+            "end_row_offset_idx": 8,
+            "start_col_offset_idx": 1,
+            "end_col_offset_idx": 2,
+            "text": "B",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 7,
+            "end_row_offset_idx": 8,
+            "start_col_offset_idx": 2,
+            "end_col_offset_idx": 3,
+            "text": "0.16667",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          }
+        ],
+        "num_rows": 8,
+        "num_cols": 3,
+        "grid": [
+          [
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 0,
+              "end_row_offset_idx": 1,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "Genotype",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 0,
+              "end_row_offset_idx": 1,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 2,
+              "text": "Disease stage",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 0,
+              "end_row_offset_idx": 1,
+              "start_col_offset_idx": 2,
+              "end_col_offset_idx": 3,
+              "text": "Males/females ",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ],
+          [
+            {
+              "row_span": 1,
+              "col_span": 3,
+              "start_row_offset_idx": 1,
+              "end_row_offset_idx": 2,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 3,
+              "text": "\n\n",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 3,
+              "start_row_offset_idx": 1,
+              "end_row_offset_idx": 2,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 3,
+              "text": "\n\n",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 3,
+              "start_row_offset_idx": 1,
+              "end_row_offset_idx": 2,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 3,
+              "text": "\n\n",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ],
+          [
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 2,
+              "end_row_offset_idx": 3,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "W/W",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 2,
+              "end_row_offset_idx": 3,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 2,
+              "text": "A",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 2,
+              "end_row_offset_idx": 3,
+              "start_col_offset_idx": 2,
+              "end_col_offset_idx": 3,
+              "text": "3.5",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ],
+          [
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 3,
+              "end_row_offset_idx": 4,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 3,
+              "end_row_offset_idx": 4,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 2,
+              "text": "B",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 3,
+              "end_row_offset_idx": 4,
+              "start_col_offset_idx": 2,
+              "end_col_offset_idx": 3,
+              "text": "0.16667 ",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ],
+          [
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 4,
+              "end_row_offset_idx": 5,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "W/\u039432",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 4,
+              "end_row_offset_idx": 5,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 2,
+              "text": "A",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 4,
+              "end_row_offset_idx": 5,
+              "start_col_offset_idx": 2,
+              "end_col_offset_idx": 3,
+              "text": "3.5 ",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ],
+          [
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 5,
+              "end_row_offset_idx": 6,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 5,
+              "end_row_offset_idx": 6,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 2,
+              "text": "B",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 5,
+              "end_row_offset_idx": 6,
+              "start_col_offset_idx": 2,
+              "end_col_offset_idx": 3,
+              "text": "0.125",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ],
+          [
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 6,
+              "end_row_offset_idx": 7,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "\u039432/\u039432",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 6,
+              "end_row_offset_idx": 7,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 2,
+              "text": "A",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 6,
+              "end_row_offset_idx": 7,
+              "start_col_offset_idx": 2,
+              "end_col_offset_idx": 3,
+              "text": "3.5 ",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ],
+          [
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 7,
+              "end_row_offset_idx": 8,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 7,
+              "end_row_offset_idx": 8,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 2,
+              "text": "B",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 7,
+              "end_row_offset_idx": 8,
+              "start_col_offset_idx": 2,
+              "end_col_offset_idx": 3,
+              "text": "0.16667",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ]
+        ]
+      }
+    },
+    {
+      "self_ref": "#/tables/3",
+      "parent": {
+        "$ref": "#/texts/13"
+      },
+      "children": [],
+      "label": "table",
+      "prov": [],
+      "captions": [
+        {
+          "$ref": "#/texts/22"
+        }
+      ],
+      "references": [],
+      "footnotes": [],
+      "data": {
+        "table_cells": [
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 0,
+            "end_row_offset_idx": 1,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 1,
+            "text": "Parameter",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 0,
+            "end_row_offset_idx": 1,
+            "start_col_offset_idx": 1,
+            "end_col_offset_idx": 2,
+            "text": "Definition",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 0,
+            "end_row_offset_idx": 1,
+            "start_col_offset_idx": 2,
+            "end_col_offset_idx": 3,
+            "text": "Value",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 3,
+            "start_row_offset_idx": 1,
+            "end_row_offset_idx": 2,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 3,
+            "text": "\n\n",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 2,
+            "end_row_offset_idx": 3,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 1,
+            "text": "\u03bc\nF\n\nF, \u03bc\nM\n\nM\n",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 2,
+            "end_row_offset_idx": 3,
+            "start_col_offset_idx": 1,
+            "end_col_offset_idx": 2,
+            "text": "All-cause mortality for adult females (males)",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 2,
+            "end_row_offset_idx": 3,
+            "start_col_offset_idx": 2,
+            "end_col_offset_idx": 3,
+            "text": "0.015 (0.016) per year",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 3,
+            "end_row_offset_idx": 4,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 1,
+            "text": "\u03bc\u03c7\u03c7",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 3,
+            "end_row_offset_idx": 4,
+            "start_col_offset_idx": 1,
+            "end_col_offset_idx": 2,
+            "text": "All-cause childhood mortality (<15 years of age)",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 3,
+            "end_row_offset_idx": 4,
+            "start_col_offset_idx": 2,
+            "end_col_offset_idx": 3,
+            "text": "0.01 per year",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 4,
+            "end_row_offset_idx": 5,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 1,
+            "text": "\nB\n\nr\n\nr\n",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 4,
+            "end_row_offset_idx": 5,
+            "start_col_offset_idx": 1,
+            "end_col_offset_idx": 2,
+            "text": "Birthrate",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 4,
+            "end_row_offset_idx": 5,
+            "start_col_offset_idx": 2,
+            "end_col_offset_idx": 3,
+            "text": "0.25 per woman per year",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 5,
+            "end_row_offset_idx": 6,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 1,
+            "text": "\nSA\n\nF\n\nF\n",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 5,
+            "end_row_offset_idx": 6,
+            "start_col_offset_idx": 1,
+            "end_col_offset_idx": 2,
+            "text": "Percent females acquiring new partners (sexual activity)",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 5,
+            "end_row_offset_idx": 6,
+            "start_col_offset_idx": 2,
+            "end_col_offset_idx": 3,
+            "text": "10%",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 6,
+            "end_row_offset_idx": 7,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 1,
+            "text": "\nSA\n\nM\n\nM\n",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 6,
+            "end_row_offset_idx": 7,
+            "start_col_offset_idx": 1,
+            "end_col_offset_idx": 2,
+            "text": "Percent males acquiring new partners (sexual activity)",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 6,
+            "end_row_offset_idx": 7,
+            "start_col_offset_idx": 2,
+            "end_col_offset_idx": 3,
+            "text": "25%",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 7,
+            "end_row_offset_idx": 8,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 1,
+            "text": "\nm\n\nF\n\nF(\u03c2$$ {\\mathrm{_{{F}}^{{2}}}} $$)",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 7,
+            "end_row_offset_idx": 8,
+            "start_col_offset_idx": 1,
+            "end_col_offset_idx": 2,
+            "text": "Mean (variance) no. of new partners for females",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 7,
+            "end_row_offset_idx": 8,
+            "start_col_offset_idx": 2,
+            "end_col_offset_idx": 3,
+            "text": "1.8 (1.2) per year",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 8,
+            "end_row_offset_idx": 9,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 1,
+            "text": "\u03c2$$ {\\mathrm{_{{M}}^{{2}}}} $$\n",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 8,
+            "end_row_offset_idx": 9,
+            "start_col_offset_idx": 1,
+            "end_col_offset_idx": 2,
+            "text": "Variance in no. of new partners for males",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 8,
+            "end_row_offset_idx": 9,
+            "start_col_offset_idx": 2,
+            "end_col_offset_idx": 3,
+            "text": "5.5 per year ",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 9,
+            "end_row_offset_idx": 10,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 1,
+            "text": "1 \u2212 p\n\nv\n\nv\n",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 9,
+            "end_row_offset_idx": 10,
+            "start_col_offset_idx": 1,
+            "end_col_offset_idx": 2,
+            "text": "Probability of vertical transmission",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 9,
+            "end_row_offset_idx": 10,
+            "start_col_offset_idx": 2,
+            "end_col_offset_idx": 3,
+            "text": "0.30 per birth",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 10,
+            "end_row_offset_idx": 11,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 1,
+            "text": "\nI\n\ni,j,k\n\ni,j,k(0)",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 10,
+            "end_row_offset_idx": 11,
+            "start_col_offset_idx": 1,
+            "end_col_offset_idx": 2,
+            "text": "Initial total population HIV-positive",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 10,
+            "end_row_offset_idx": 11,
+            "start_col_offset_idx": 2,
+            "end_col_offset_idx": 3,
+            "text": "0.50% ",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 11,
+            "end_row_offset_idx": 12,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 1,
+            "text": "\u03c7\ni,j\n\ni,j(0)",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 11,
+            "end_row_offset_idx": 12,
+            "start_col_offset_idx": 1,
+            "end_col_offset_idx": 2,
+            "text": "Initial total children in population (<15 years of age)",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 11,
+            "end_row_offset_idx": 12,
+            "start_col_offset_idx": 2,
+            "end_col_offset_idx": 3,
+            "text": "45%",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 12,
+            "end_row_offset_idx": 13,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 1,
+            "text": "\nW/W (0)",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 12,
+            "end_row_offset_idx": 13,
+            "start_col_offset_idx": 1,
+            "end_col_offset_idx": 2,
+            "text": "Initial total wild types (W/W) in population",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 12,
+            "end_row_offset_idx": 13,
+            "start_col_offset_idx": 2,
+            "end_col_offset_idx": 3,
+            "text": "80% ",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 13,
+            "end_row_offset_idx": 14,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 1,
+            "text": "\nW/\u039432(0)",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 13,
+            "end_row_offset_idx": 14,
+            "start_col_offset_idx": 1,
+            "end_col_offset_idx": 2,
+            "text": "Initial total heterozygotes (W/\u039432) in population",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 13,
+            "end_row_offset_idx": 14,
+            "start_col_offset_idx": 2,
+            "end_col_offset_idx": 3,
+            "text": "19%",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 14,
+            "end_row_offset_idx": 15,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 1,
+            "text": "\u039432/\u039432(0)",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 14,
+            "end_row_offset_idx": 15,
+            "start_col_offset_idx": 1,
+            "end_col_offset_idx": 2,
+            "text": "Initial total homozygotes (\u039432/\u039432) in population",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 14,
+            "end_row_offset_idx": 15,
+            "start_col_offset_idx": 2,
+            "end_col_offset_idx": 3,
+            "text": "1%",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 15,
+            "end_row_offset_idx": 16,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 1,
+            "text": "\nr\n\nM\n\nM(r\n\nF\n\nF)",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 15,
+            "end_row_offset_idx": 16,
+            "start_col_offset_idx": 1,
+            "end_col_offset_idx": 2,
+            "text": "Initial percent males (females) in total population",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 15,
+            "end_row_offset_idx": 16,
+            "start_col_offset_idx": 2,
+            "end_col_offset_idx": 3,
+            "text": "49% (51%)",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 16,
+            "end_row_offset_idx": 17,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 1,
+            "text": "\u03d5\nF\n\nF, \u03d5\nM\n\nM\n",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 16,
+            "end_row_offset_idx": 17,
+            "start_col_offset_idx": 1,
+            "end_col_offset_idx": 2,
+            "text": "Number of sexual contacts a female (male) has",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 16,
+            "end_row_offset_idx": 17,
+            "start_col_offset_idx": 2,
+            "end_col_offset_idx": 3,
+            "text": "30 (24) per partner",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 17,
+            "end_row_offset_idx": 18,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 1,
+            "text": "\u025b\ni,j,k\n\ni,j,k\n",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 17,
+            "end_row_offset_idx": 18,
+            "start_col_offset_idx": 1,
+            "end_col_offset_idx": 2,
+            "text": "% effect of mutation on transmission rates (see Table 2)",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 17,
+            "end_row_offset_idx": 18,
+            "start_col_offset_idx": 2,
+            "end_col_offset_idx": 3,
+            "text": "0 < \u025b\ni,j,k\n\ni,j,k < 1",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 18,
+            "end_row_offset_idx": 19,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 1,
+            "text": "\u03b4",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 18,
+            "end_row_offset_idx": 19,
+            "start_col_offset_idx": 1,
+            "end_col_offset_idx": 2,
+            "text": "Death rate for AIDS population",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 18,
+            "end_row_offset_idx": 19,
+            "start_col_offset_idx": 2,
+            "end_col_offset_idx": 3,
+            "text": "1.0 per year ",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 19,
+            "end_row_offset_idx": 20,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 1,
+            "text": "\nq\n",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 19,
+            "end_row_offset_idx": 20,
+            "start_col_offset_idx": 1,
+            "end_col_offset_idx": 2,
+            "text": "Allelic frequency of \u039432 allele",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 19,
+            "end_row_offset_idx": 20,
+            "start_col_offset_idx": 2,
+            "end_col_offset_idx": 3,
+            "text": "0.105573",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          }
+        ],
+        "num_rows": 20,
+        "num_cols": 3,
+        "grid": [
+          [
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 0,
+              "end_row_offset_idx": 1,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "Parameter",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 0,
+              "end_row_offset_idx": 1,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 2,
+              "text": "Definition",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 0,
+              "end_row_offset_idx": 1,
+              "start_col_offset_idx": 2,
+              "end_col_offset_idx": 3,
+              "text": "Value",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ],
+          [
+            {
+              "row_span": 1,
+              "col_span": 3,
+              "start_row_offset_idx": 1,
+              "end_row_offset_idx": 2,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 3,
+              "text": "\n\n",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 3,
+              "start_row_offset_idx": 1,
+              "end_row_offset_idx": 2,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 3,
+              "text": "\n\n",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 3,
+              "start_row_offset_idx": 1,
+              "end_row_offset_idx": 2,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 3,
+              "text": "\n\n",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ],
+          [
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 2,
+              "end_row_offset_idx": 3,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "\u03bc\nF\n\nF, \u03bc\nM\n\nM\n",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 2,
+              "end_row_offset_idx": 3,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 2,
+              "text": "All-cause mortality for adult females (males)",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 2,
+              "end_row_offset_idx": 3,
+              "start_col_offset_idx": 2,
+              "end_col_offset_idx": 3,
+              "text": "0.015 (0.016) per year",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ],
+          [
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 3,
+              "end_row_offset_idx": 4,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "\u03bc\u03c7\u03c7",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 3,
+              "end_row_offset_idx": 4,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 2,
+              "text": "All-cause childhood mortality (<15 years of age)",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 3,
+              "end_row_offset_idx": 4,
+              "start_col_offset_idx": 2,
+              "end_col_offset_idx": 3,
+              "text": "0.01 per year",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ],
+          [
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 4,
+              "end_row_offset_idx": 5,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "\nB\n\nr\n\nr\n",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 4,
+              "end_row_offset_idx": 5,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 2,
+              "text": "Birthrate",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 4,
+              "end_row_offset_idx": 5,
+              "start_col_offset_idx": 2,
+              "end_col_offset_idx": 3,
+              "text": "0.25 per woman per year",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ],
+          [
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 5,
+              "end_row_offset_idx": 6,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "\nSA\n\nF\n\nF\n",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 5,
+              "end_row_offset_idx": 6,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 2,
+              "text": "Percent females acquiring new partners (sexual activity)",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 5,
+              "end_row_offset_idx": 6,
+              "start_col_offset_idx": 2,
+              "end_col_offset_idx": 3,
+              "text": "10%",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ],
+          [
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 6,
+              "end_row_offset_idx": 7,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "\nSA\n\nM\n\nM\n",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 6,
+              "end_row_offset_idx": 7,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 2,
+              "text": "Percent males acquiring new partners (sexual activity)",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 6,
+              "end_row_offset_idx": 7,
+              "start_col_offset_idx": 2,
+              "end_col_offset_idx": 3,
+              "text": "25%",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ],
+          [
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 7,
+              "end_row_offset_idx": 8,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "\nm\n\nF\n\nF(\u03c2$$ {\\mathrm{_{{F}}^{{2}}}} $$)",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 7,
+              "end_row_offset_idx": 8,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 2,
+              "text": "Mean (variance) no. of new partners for females",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 7,
+              "end_row_offset_idx": 8,
+              "start_col_offset_idx": 2,
+              "end_col_offset_idx": 3,
+              "text": "1.8 (1.2) per year",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ],
+          [
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 8,
+              "end_row_offset_idx": 9,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "\u03c2$$ {\\mathrm{_{{M}}^{{2}}}} $$\n",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 8,
+              "end_row_offset_idx": 9,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 2,
+              "text": "Variance in no. of new partners for males",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 8,
+              "end_row_offset_idx": 9,
+              "start_col_offset_idx": 2,
+              "end_col_offset_idx": 3,
+              "text": "5.5 per year ",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ],
+          [
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 9,
+              "end_row_offset_idx": 10,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "1 \u2212 p\n\nv\n\nv\n",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 9,
+              "end_row_offset_idx": 10,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 2,
+              "text": "Probability of vertical transmission",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 9,
+              "end_row_offset_idx": 10,
+              "start_col_offset_idx": 2,
+              "end_col_offset_idx": 3,
+              "text": "0.30 per birth",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ],
+          [
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 10,
+              "end_row_offset_idx": 11,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "\nI\n\ni,j,k\n\ni,j,k(0)",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 10,
+              "end_row_offset_idx": 11,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 2,
+              "text": "Initial total population HIV-positive",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 10,
+              "end_row_offset_idx": 11,
+              "start_col_offset_idx": 2,
+              "end_col_offset_idx": 3,
+              "text": "0.50% ",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ],
+          [
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 11,
+              "end_row_offset_idx": 12,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "\u03c7\ni,j\n\ni,j(0)",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 11,
+              "end_row_offset_idx": 12,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 2,
+              "text": "Initial total children in population (<15 years of age)",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 11,
+              "end_row_offset_idx": 12,
+              "start_col_offset_idx": 2,
+              "end_col_offset_idx": 3,
+              "text": "45%",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ],
+          [
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 12,
+              "end_row_offset_idx": 13,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "\nW/W (0)",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 12,
+              "end_row_offset_idx": 13,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 2,
+              "text": "Initial total wild types (W/W) in population",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 12,
+              "end_row_offset_idx": 13,
+              "start_col_offset_idx": 2,
+              "end_col_offset_idx": 3,
+              "text": "80% ",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ],
+          [
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 13,
+              "end_row_offset_idx": 14,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "\nW/\u039432(0)",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 13,
+              "end_row_offset_idx": 14,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 2,
+              "text": "Initial total heterozygotes (W/\u039432) in population",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 13,
+              "end_row_offset_idx": 14,
+              "start_col_offset_idx": 2,
+              "end_col_offset_idx": 3,
+              "text": "19%",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ],
+          [
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 14,
+              "end_row_offset_idx": 15,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "\u039432/\u039432(0)",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 14,
+              "end_row_offset_idx": 15,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 2,
+              "text": "Initial total homozygotes (\u039432/\u039432) in population",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 14,
+              "end_row_offset_idx": 15,
+              "start_col_offset_idx": 2,
+              "end_col_offset_idx": 3,
+              "text": "1%",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ],
+          [
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 15,
+              "end_row_offset_idx": 16,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "\nr\n\nM\n\nM(r\n\nF\n\nF)",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 15,
+              "end_row_offset_idx": 16,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 2,
+              "text": "Initial percent males (females) in total population",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 15,
+              "end_row_offset_idx": 16,
+              "start_col_offset_idx": 2,
+              "end_col_offset_idx": 3,
+              "text": "49% (51%)",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ],
+          [
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 16,
+              "end_row_offset_idx": 17,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "\u03d5\nF\n\nF, \u03d5\nM\n\nM\n",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 16,
+              "end_row_offset_idx": 17,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 2,
+              "text": "Number of sexual contacts a female (male) has",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 16,
+              "end_row_offset_idx": 17,
+              "start_col_offset_idx": 2,
+              "end_col_offset_idx": 3,
+              "text": "30 (24) per partner",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ],
+          [
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 17,
+              "end_row_offset_idx": 18,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "\u025b\ni,j,k\n\ni,j,k\n",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 17,
+              "end_row_offset_idx": 18,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 2,
+              "text": "% effect of mutation on transmission rates (see Table 2)",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 17,
+              "end_row_offset_idx": 18,
+              "start_col_offset_idx": 2,
+              "end_col_offset_idx": 3,
+              "text": "0 < \u025b\ni,j,k\n\ni,j,k < 1",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ],
+          [
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 18,
+              "end_row_offset_idx": 19,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "\u03b4",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 18,
+              "end_row_offset_idx": 19,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 2,
+              "text": "Death rate for AIDS population",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 18,
+              "end_row_offset_idx": 19,
+              "start_col_offset_idx": 2,
+              "end_col_offset_idx": 3,
+              "text": "1.0 per year ",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ],
+          [
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 19,
+              "end_row_offset_idx": 20,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "\nq\n",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 19,
+              "end_row_offset_idx": 20,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 2,
+              "text": "Allelic frequency of \u039432 allele",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 19,
+              "end_row_offset_idx": 20,
+              "start_col_offset_idx": 2,
+              "end_col_offset_idx": 3,
+              "text": "0.105573",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ]
+        ]
+      }
+    }
+  ],
+  "key_value_items": [],
+  "pages": {}
+}
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v2/pnas_sample.xml.md b/tests/data/groundtruth/docling_v2/pnas_sample.xml.md
new file mode 100644
index 00000000..41dfe80d
--- /dev/null
+++ b/tests/data/groundtruth/docling_v2/pnas_sample.xml.md
@@ -0,0 +1,258 @@
+# The coreceptor mutation CCR5Δ32 influences the dynamics of HIV epidemics and is selected for by HIV
+
+Amy D. Sullivan, Janis Wigginton, Denise Kirschner
+
+Department of Microbiology and Immunology, University  of Michigan Medical School, Ann Arbor, MI 48109-0620
+
+## Abstract
+
+We explore the impact of a host genetic factor on heterosexual HIV epidemics by using a deterministic mathematical model. A protective allele unequally distributed across populations is exemplified in our models by the 32-bp deletion in the host-cell chemokine receptor CCR5, CCR5Δ32. Individuals homozygous for CCR5Δ32 are protected against HIV infection whereas those heterozygous for CCR5Δ32 have lower pre-AIDS viral loads and delayed progression to AIDS. CCR5Δ32 may limit HIV spread by decreasing the probability of both risk of infection and infectiousness. In this work, we characterize epidemic HIV within three dynamic subpopulations: CCR5/CCR5 (homozygous, wild type), CCR5/CCR5Δ32 (heterozygous), and CCR5Δ32/CCR5Δ32 (homozygous, mutant). Our results indicate that prevalence of HIV/AIDS is greater in populations lacking the CCR5Δ32 alleles (homozygous wild types only) as compared with populations that include people heterozygous or homozygous for CCR5Δ32. Also, we show that HIV can provide selective pressure for CCR5Δ32, increasing the frequency of this allele.
+
+Nineteen million people have died of AIDS since the discovery of HIV in the 1980s. In 1999 alone, 5.4 million people were newly infected with HIV (ref. 1 and http://www.unaids.org/epidemicupdate/report/Epireport.html). (For brevity, HIV-1 is referred to as HIV in this paper.) Sub-Saharan Africa has been hardest hit, with more than 20% of the general population HIV-positive in some countries (2, 3). In comparison, heterosexual epidemics in developed, market-economy countries have not reached such severe levels. Factors contributing to the severity of the epidemic in economically developing countries abound, including economic, health, and social differences such as high levels of sexually transmitted diseases and a lack of prevention programs. However, the staggering rate at which the epidemic has spread in sub-Saharan Africa has not been adequately explained. The rate and severity of this epidemic also could indicate a greater underlying susceptibility to HIV attributable not only to sexually transmitted disease, economics, etc., but also to other more ubiquitous factors such as host genetics (4, 5).
+
+To exemplify the contribution of such a host genetic factor to HIV prevalence trends, we consider a well-characterized 32-bp deletion in the host-cell chemokine receptor CCR5, CCR5Δ32. When HIV binds to host cells, it uses the CD4 receptor on the surface of host immune cells together with a coreceptor, mainly the CCR5 and CXCR4 chemokine receptors (6). Homozygous mutations for this 32-bp deletion offer almost complete protection from HIV infection, and heterozygous mutations are associated with lower pre-AIDS viral loads and delayed progression to AIDS (7–14). CCR5Δ32 generally is found in populations of European descent, with allelic frequencies ranging from 0 to 0.29 (13). African and Asian populations studied outside the United States or Europe appear to lack the CCR5Δ32 allele, with an allelic frequency of almost zero (5, 13). Thus, to understand the effects of a protective allele, we use a mathematical model to track prevalence of HIV in populations with or without CCR5Δ32 heterozygous and homozygous people and also to follow the CCR5Δ32 allelic frequency.
+
+We hypothesize that CCR5Δ32 limits epidemic HIV by decreasing infection rates, and we evaluate the relative contributions to this by the probability of infection and duration of infectivity. To capture HIV infection as a chronic infectious disease together with vertical transmission occurring in untreated mothers, we model a dynamic population (i.e., populations that vary in growth rates because of fluctuations in birth or death rates) based on realistic demographic characteristics (18). This scenario also allows tracking of the allelic frequencies over time. This work considers how a specific host genetic factor affecting HIV infectivity and viremia at the individual level might influence the epidemic in a dynamic population and how HIV exerts selective pressure, altering the frequency of this mutant allele.
+
+CCR5 is a host-cell chemokine receptor, which is also used as a coreceptor by R5 strains of HIV that are generally acquired during sexual transmission (6, 19–25). As infection progresses to AIDS the virus expands its repertoire of potential coreceptors to include other CC-family and CXC-family receptors in roughly 50% of patients (19, 26, 27). CCR5Δ32 was identified in HIV-resistant people (28). Benefits to individuals from the mutation in this allele are as follows. Persons homozygous for the CCR5Δ32 mutation are almost nonexistent in HIV-infected populations (11, 12) (see ref. 13 for review). Persons heterozygous for the mutant allele (CCR5 W/Δ32) tend to have lower pre-AIDS viral loads. Aside from the beneficial effects that lower viral loads may have for individuals, there is also an altruistic effect, as transmission rates are reduced for individuals with low viral loads (as compared with, for example, AZT and other studies; ref. 29). Finally, individuals heterozygous for the mutant allele (CCR5 W/Δ32) also have a slower progression to AIDS than those homozygous for the wild-type allele (CCR5 W/W) (7–10), remaining in the population 2 years longer, on average. Interestingly, the dearth of information on HIV disease progression in people homozygous for the CCR5Δ32 allele (CCR5 Δ32/Δ32) stems from the rarity of HIV infection in this group (4, 12, 28). However, in case reports of HIV-infected CCR5 Δ32/Δ32 homozygotes, a rapid decline in CD4+ T cells and a high viremia are observed, likely because of initial infection with a more aggressive viral strain (such as X4 or R5X4) (30).
+
+## The Model
+
+Because we are most concerned with understanding the severity of the epidemic in developing countries where the majority of infection is heterosexual, we consider a purely heterosexual model. To model the effects of the allele in the population, we examine the rate of HIV spread by using an enhanced susceptible-infected-AIDS model of epidemic HIV (for review see ref. 31). Our model compares two population scenarios: a CCR5 wild-type population and one with CCR5Δ32 heterozygotes and homozygotes in addition to the wild type. To model the scenario where there are only wild-type individuals present in the population (i.e., CCR5 W/W), we track the sexually active susceptibles at time t [Si,j (t)], where i = 1 refers to genotype (CCR5 W/W only in this case) and j is either the male or female subpopulation. We also track those who are HIV-positive at time t not yet having AIDS in Ii,j,k (t) where k refers to stage of HIV infection [primary (A) or asymptomatic (B)]. The total number of individuals with AIDS at time t are tracked in A(t). The source population are children, χ i,j (t), who mature into the sexually active population at time t (Fig. 1, Table 1). We compare the model of a population lacking the CCR5Δ32 allele to a demographically similar population with a high frequency of the allele. When genetic heterogeneity is included, male and female subpopulations are each further divided into three distinct genotypic groups, yielding six susceptible subpopulations, [Si,j (t), where i ranges from 1 to 3, where 1 = CCR5W/W; 2 = CCR5 W/Δ32; 3 = CCR5 Δ32/Δ32]. The infected classes, Ii,j,k (t), also increase in number to account for these new genotype compartments. In both settings we assume there is no treatment available and no knowledge of HIV status by people in the early acute and middle asymptomatic stages (both conditions exist in much of sub-Saharan Africa). In addition, we assume that sexual mixing in the population occurs randomly with respect to genotype and HIV disease status, all HIV-infected people eventually progress to AIDS, and no barrier contraceptives are used. These last assumptions reflect both economic and social conditions.
+
+Figure 1 A schematic representation of the basic compartmental HIV epidemic model. The criss-cross lines indicate the sexual mixing between different compartments. Each of these interactions has a positive probability of taking place; they also incorporate individual rates of transmission indicated as λ, but in full notation is λ î,,→i,j, where i,j,k is the phenotype of the infected partner and î, is the phenotype of the susceptible partner. Also shown are the different rates of disease progression, γ i,j,k , that vary according to genotype, gender, and stage. Thus, the interactions between different genotypes, genders, and stages are associated with a unique probability of HIV infection. M, male; F, female.
+
+<!-- image -->
+
+Table 1 Children's genotype
+
+| Parents   | Mother   | Mother             | Mother                       | Mother             |
+|-----------|----------|--------------------|------------------------------|--------------------|
+|           |          |                    |                              |                    |
+| Father    |          | W/W                | W/Δ32                        | Δ32/Δ32            |
+|           | W/W      | χ1,j 1,j           | χ1,j 1,j, χ2,j 2,j           | χ2,j 2,j           |
+|           | W/Δ32    | χ1,j 1,j, χ2,j 2,j | χ1,j 1,j, χ2,j 2,j, χ3,j 3,j | χ2,j 2,j, χ3,j 3,j |
+|           | Δ32/Δ32  | χ2,j 2,j           | χ2,j 2,j, χ3,j 3,j           | χ3,j 3,j           |
+
+### Parameter Estimates for the Model.
+
+Estimates for rates that govern the interactions depicted in Fig. 1 were derived from the extensive literature on HIV. Our parameters and their estimates are summarized in Tables 2–4. The general form of the equations describing the rates of transition between population classes as depicted in Fig. 1 are summarized as follows:
+
+$$ \frac{dS_{i,j}(t)}{dt}={\chi}_{i,j}(t)-{\mu}_{j}S_{i,j}(t)-{\lambda}_{\hat {\imath},\hat {},\hat {k}{\rightarrow}i,j}S_{i,j}(t), $$
+
+$$ \hspace{1em}\hspace{1em}\hspace{.167em}\frac{dI_{i,j,A}(t)}{dt}={\lambda}_{\hat {\imath},\hat {},\hat {k}{\rightarrow}i,j}S_{i,j}(t)-{\mu}_{j}I_{i,j,A}(t)-{\gamma}_{i,j,A}I_{i,j,A}(t), $$
+
+$$ \frac{dI_{i,j,B}(t)}{dt}={\gamma}_{i,j,A}I_{i,j,A}(t)-{\mu}_{j}I_{i,j,B}(t)-{\gamma}_{i,j,B}I_{i,j,B}(t), $$
+
+$$ \frac{dA(t)}{dt}={\gamma}_{i,j,B} \left( { \,\substack{ ^{3} \\ {\sum} \\ _{i=1} }\, }I_{i,F,B}(t)+I_{i,M,B}(t) \right) -{\mu}_{A}A(t)-{\delta}A(t), $$
+
+where, in addition to previously defined populations and rates (with i equals genotype, j equals gender, and k equals stage of infection, either A or B), μ j , represents the non-AIDS (natural) death rate for males and females respectively, and μA is estimated by the average (μF + μM/2). This approximation allows us to simplify the model (only one AIDS compartment) without compromising the results, as most people with AIDS die of AIDS (δAIDS) and very few of other causes (μA). These estimates include values that affect infectivity (λ î,,→i,j ), transmission (β î,,→i,j ), and disease progression (γ i  ,  j  ,  k ) where the î,, notation represents the genotype, gender, and stage of infection of the infected partner, and j ≠ .
+
+Table 2 Transmission probabilities
+
+| HIV-infected partner (îıı^^, ^^, k k^^)   | Susceptible partner (i, j)   | Susceptible partner (i, j)   | Susceptible partner (i, j)   | Susceptible partner (i, j)   |
+|-----------------------------------------------|------------------------------|------------------------------|------------------------------|------------------------------|
+| HIV-infected partner (îıı^^, ^^, k k^^)   |                              |                              |                              |                              |
+| HIV-infected partner (îıı^^, ^^, k k^^)   | (^^ to j)                 | W/W                          | W/Δ32                        | Δ32/Δ32                      |
+|                                               |                              |                              |                              |                              |
+| Acute/primary                                 |                              |                              |                              |                              |
+| W/W or Δ32/Δ32                                | M to F                       | 0.040                        | 0.040                        | 0.00040                      |
+|                                               | F to M                       | 0.020                        | 0.020                        | 0.00020                      |
+| W/Δ32                                         | M to F                       | 0.030                        | 0.030                        | 0.00030                      |
+|                                               | F to M                       | 0.015                        | 0.015                        | 0.00015                      |
+| Asymptomatic                                  |                              |                              |                              |                              |
+| W/W or Δ32/Δ32                                | M to F                       | 0.0010                       | 0.0010                       | 10 × 10−6                    |
+|                                               | F to M                       | 0.0005                       | 0.0005                       | 5 × 10−6                     |
+| W/Δ32                                         | M to F                       | 0.0005                       | 0.0005                       | 5 × 10−6                     |
+|                                               | F to M                       | 0.00025                      | 0.00025                      | 2.5 × 10−6                   |
+
+Table 3 Progression rates
+
+| Genotype   | Disease stage   | Males/females    |
+|------------|-----------------|------------------|
+|            |                 |                  |
+| W/W        | A               | 3.5              |
+|            | B               | 0.16667          |
+| W/Δ32      | A               | 3.5              |
+|            | B               | 0.125            |
+| Δ32/Δ32    | A               | 3.5              |
+|            | B               | 0.16667          |
+
+Table 4 Parameter values
+
+| Parameter                               | Definition                                               | Value                   |
+|-----------------------------------------|----------------------------------------------------------|-------------------------|
+|                                         |                                                          |                         |
+| μ F  F, μ M  M                          | All-cause mortality for adult females (males)            | 0.015 (0.016) per year  |
+| μχχ                                     | All-cause childhood mortality (&lt;15 years of age)         | 0.01 per year           |
+| B  r  r                                 | Birthrate                                                | 0.25 per woman per year |
+| SA  F  F                                | Percent females acquiring new partners (sexual activity) | 10%                     |
+| SA  M  M                                | Percent males acquiring new partners (sexual activity)   | 25%                     |
+| m  F  F(ς$$ {\mathrm{_{{F}}^{{2}}}} $$) | Mean (variance) no. of new partners for females          | 1.8 (1.2) per year      |
+| ς$$ {\mathrm{_{{M}}^{{2}}}} $$          | Variance in no. of new partners for males                | 5.5 per year            |
+| 1 − p  v  v                             | Probability of vertical transmission                     | 0.30 per birth          |
+| I  i,j,k  i,j,k(0)                      | Initial total population HIV-positive                    | 0.50%                   |
+| χ i,j  i,j(0)                           | Initial total children in population (&lt;15 years of age)  | 45%                     |
+| W/W (0)                                 | Initial total wild types (W/W) in population             | 80%                     |
+| W/Δ32(0)                                | Initial total heterozygotes (W/Δ32) in population        | 19%                     |
+| Δ32/Δ32(0)                              | Initial total homozygotes (Δ32/Δ32) in population        | 1%                      |
+| r  M  M(r  F  F)                        | Initial percent males (females) in total population      | 49% (51%)               |
+| ϕ F  F, ϕ M  M                          | Number of sexual contacts a female (male) has            | 30 (24) per partner     |
+| ɛ i,j,k  i,j,k                          | % effect of mutation on transmission rates (see Table 2) | 0 &lt; ɛ i,j,k  i,j,k &lt; 1  |
+| δ                                       | Death rate for AIDS population                           | 1.0 per year            |
+| q                                       | Allelic frequency of Δ32 allele                          | 0.105573                |
+
+The effects of the CCR5 W/Δ32 and CCR5 Δ32/Δ32 genotypes are included in our model through both the per-capita probabilities of infection, λ î,,→i,j , and the progression rates, γ i  ,  j  ,  k . The infectivity coefficients, λ î,,→i,j , are calculated for each population subgroup based on the following: likelihood of HIV transmission in a sexual encounter between a susceptible and an infected (βîıı^^,j,k k^^→i,j ) person; formation of new partnerships (c  j  j); number of contacts in a given partnership (ϕ j ); and probability of encountering an infected individual (I  î,, /N   ). The formula representing this probability of infection is
+
+$$ {\lambda}_{\hat {i},\hat {j},\hat {k}{\rightarrow}i,j}=\frac{C_{j}{\cdot}{\phi}_{j}}{N_{\hat {j}}}\hspace{.167em} \left[ { \,\substack{ \\ {\sum} \\ _{\hat {i},\hat {k}} }\, }{\beta}_{\hat {i},\hat {j},\hat {k}{\rightarrow}i,j}{\cdot}I_{\hat {i},\hat {j},\hat {k}} \right] , $$
+
+where j ≠  is either male or female. N    represents the total population of gender  (this does not include those with AIDS in the simulations).
+
+The average rate of partner acquisition, cj , includes the mean plus the variance to mean ratio of the relevant distribution of partner-change rates to capture the small number of high-risk people: cj  = mj  + (ς/m j) where the mean (mj ) and variance (ς) are annual figures for new partnerships only (32). These means are estimated from Ugandan data for the number of heterosexual partners in the past year (33) and the number of nonregular heterosexual partners (i.e., spouses or long-term partners) in the past year (34). In these sexual activity surveys, men invariably have more new partnerships; thus, we assumed that they would have fewer average contacts per partnership than women (a higher rate of new partner acquisition means fewer sexual contacts with a given partner; ref. 35). To incorporate this assumption in our model, the male contacts/partnership, ϕ M , was reduced by 20%. In a given population, the numbers of heterosexual interactions must equate between males and females. The balancing equation applied here is SA F·m F·N F = SA M·m M·N M, where SAj  are the percent sexually active and Nj  are the total in the populations for gender j. To specify changes in partner acquisition, we apply a male flexibility mechanism, holding the female rate of acquisition constant and allowing the male rates to vary (36, 37).
+
+#### Transmission probabilities.
+
+The effect of a genetic factor in a model of HIV transmission can be included by reducing the transmission coefficient. The probabilities of transmission per contact with an infected partner, βîıı^^,^^,k k^^→i,j , have been estimated in the literature (see ref. 38 for estimates in minimally treated groups). We want to capture a decreased risk in transmission based on genotype (ref. 39, Table 2). No studies have directly evaluated differences in infectivity between HIV-infected CCR5 W/Δ32 heterozygotes and HIV-infected CCR5 wild types. Thus, we base estimates for reduced transmission on studies of groups with various HIV serum viral loads (40), HTLV-I/II viral loads (41), and a study of the effect of AZT treatment on transmission (29). We decrease transmission probabilities for infecting CCR5Δ32/Δ32 persons by 100-fold to reflect the rarity of infections in these persons. However, we assume that infected CCR5Δ32/Δ32 homozygotes can infect susceptibles at a rate similar to CCR5W/W homozygotes, as the former generally have high viremias (ref. 30, Table 2). We also assume that male-to-female transmission is twice as efficient as female-to-male transmission (up to a 9-fold difference has been reported; ref. 42) (ref. 43, Table 2).
+
+Given the assumption of no treatment, the high burden of disease in people with AIDS is assumed to greatly limit their sexual activity. Our initial model excludes people with AIDS from the sexually active groups. Subsequently, we allow persons with AIDS to be sexually active, fixing their transmission rates (βAIDS) to be the same across all CCR5 genotypes, and lower than transmission rates for primary-stage infection (as the viral burden on average is not as high as during the acute phase), and larger than transmission rates for asymptomatic-stage infection (as the viral burden characteristically increases during the end stage of disease).
+
+#### Disease progression.
+
+We assume three stages of HIV infection: primary (acute, stage A), asymptomatic HIV (stage B), and AIDS. The rates of transition through the first two stages are denoted by γ i,j,k  i,j,k, where i represents genotype, j is male/female, and k represents either stage A or stage B. Transition rates through each of these stages are assumed to be inversely proportional to the duration of that stage; however, other distributions are possible (31, 44, 45). Although viral loads generally peak in the first 2 months of infection, steady-state viral loads are established several months beyond this (46). For group A, the primary HIV-infecteds, duration is assumed to be 3.5 months. Based on results from European cohort studies (7–10), the beneficial effects of the CCR5 W/Δ32 genotype are observed mainly in the asymptomatic years of HIV infection; ≈7 years after seroconversion survival rates appear to be quite similar between heterozygous and homozygous individuals. We also assume that CCR5Δ32/Δ32-infected individuals and wild-type individuals progress similarly, and that men and women progress through each disease stage at the same rate. Given these observations, and that survival after infection may be shorter in untreated populations, we choose the duration time in stage B to be 6 years for wild-type individuals and 8 years for heterozygous individuals. Transition through AIDS, δAIDS, is inversely proportional to the duration of AIDS. We estimate this value to be 1 year for the time from onset of AIDS to death. The progression rates are summarized in Table 3.
+
+### Demographic Setting.
+
+Demographic parameters are based on data from Malawi, Zimbabwe, and Botswana (3, 47). Estimated birth and child mortality rates are used to calculate the annual numbers of children (χ i,j  i,j) maturing into the potentially sexually active, susceptible group at the age of 15 years (3). For example, in the case where the mother is CCR5 wild type and the father is CCR5 wild type or heterozygous, the number of CCR5 W/W children is calculated as follows [suppressing (t) notation]: χ1,j 1,j =
+
+$$ B_{r}\hspace{.167em}{ \,\substack{ \\ {\sum} \\ _{k} }\, } \left[ S_{1,F}\frac{(S_{1,M}+I_{1,M,k})}{N_{M}}+ \left[ (0.5)S_{1,F}\frac{(S_{2,M}+I_{2,M,k})}{N_{M}} \right] + \right $$
+
+$$ p_{v} \left \left( \frac{(I_{1,F,k}(S_{1,M}+I_{1,M,k}))}{N_{M}}+ \left[ (0.5)I_{1,F,k}\frac{(S_{2,M}+I_{2,M,k})}{N_{M}} \right] \right) \right] ,\hspace{.167em} $$
+
+where the probability of HIV vertical transmission, 1 − pv , and the birthrate, Br , are both included in the equations together with the Mendelian inheritance values as presented in Table 1. The generalized version of this equation (i.e., χ i,j  i,j) can account for six categories of children (including gender and genotype). We assume that all children of all genotypes are at risk, although we can relax this condition if data become available to support vertical protection (e.g., ref. 48). All infected children are assumed to die before age 15. Before entering the susceptible group at age 15, there is additional loss because of mortality from all non-AIDS causes occurring less than 15 years of age at a rate of μχχ × χ i,j  i,j (where μχ is the mortality under 15 years of age). Children then enter the population as susceptibles at an annual rate, ς j  j × χ i,j  i,j/15, where ς j  distributes the children 51% females and 49% males. All parameters and their values are summarized in Table 4.
+
+## Prevalence of HIV
+
+### Demographics and Model Validation.
+
+The model was validated by using parameters estimated from available demographic data. Simulations were run in the absence of HIV infection to compare the model with known population growth rates. Infection was subsequently introduced with an initial low HIV prevalence of 0.5% to capture early epidemic behavior.
+
+In deciding on our initial values for parameters during infection, we use Joint United Nations Programme on HIV/AIDS national prevalence data for Malawi, Zimbabwe, and Botswana. Nationwide seroprevalence of HIV in these countries varies from ≈11% to over 20% (3), although there may be considerable variation within given subpopulations (2, 49).
+
+In the absence of HIV infection, the annual percent population growth rate in the model is ≈2.5%, predicting the present-day values for an average of sub-Saharan African cities (data not shown). To validate the model with HIV infection, we compare our simulation of the HIV epidemic to existing prevalence data for Kenya and Mozambique (http://www.who.int/emc-hiv/fact-sheets/pdfs/kenya.pdf and ref. 51). Prevalence data collected from these countries follow similar trajectories to those predicted by our model (Fig. 2).
+
+Figure 2 Model simulation of HIV infection in a population lacking the protective CCR5Δ32 allele compared with national data from Kenya (healthy adults) and Mozambique (blood donors, ref. 17). The simulated population incorporates parameter estimates from sub-Saharan African demographics. Note the two outlier points from the Mozambique data were likely caused by underreporting in the early stages of the epidemic.
+
+<!-- image -->
+
+### Effects of the Allele on Prevalence.
+
+After validating the model in the wild type-only population, both CCR5Δ32 heterozygous and homozygous people are included. Parameter values for HIV transmission, duration of illness, and numbers of contacts per partner are assumed to be the same within both settings. We then calculate HIV/AIDS prevalence among adults for total HIV/AIDS cases.
+
+Although CCR5Δ32/Δ32 homozygosity is rarely seen in HIV-positive populations (prevalence ranges between 0 and 0.004%), 1–20% of people in HIV-negative populations of European descent are homozygous. Thus, to evaluate the potential impact of CCR5Δ32, we estimate there are 19% CCR5 W/Δ32 heterozygous and 1% CCR5 Δ32/Δ32 homozygous people in our population. These values are in Hardy-Weinberg equilibrium with an allelic frequency of the mutation as 0.105573.
+
+Fig. 3 shows the prevalence of HIV in two populations: one lacking the mutant CCR5 allele and another carrying that allele. In the population lacking the protective mutation, prevalence increases logarithmically for the first 35 years of the epidemic, reaching 18% before leveling off.
+
+Figure 3 Prevalence of HIV/AIDS in the adult population as predicted by the model. The top curve (○) indicates prevalence in a population lacking the protective allele. We compare that to a population with 19% heterozygous and 1% homozygous for the allele (implying an allelic frequency of 0.105573. Confidence interval bands (light gray) are shown around the median simulation () providing a range of uncertainty in evaluating parameters for the effect of the mutation on the infectivity and the duration of asymptomatic HIV for heterozygotes.
+
+<!-- image -->
+
+In contrast, when a proportion of the population carries the CCR5Δ32 allele, the epidemic increases more slowly, but still logarithmically, for the first 50 years, and HIV/AIDS prevalence reaches ≈12% (Fig. 3). Prevalence begins to decline slowly after 70 years.
+
+In the above simulations we assume that people with AIDS are not sexually active. However, when these individuals are included in the sexually active population the severity of the epidemic increases considerably (data not shown). Consistent with our initial simulations, prevalences are still relatively lower in the presence of the CCR5 mutation.
+
+Because some parameters (e.g., rate constants) are difficult to estimate based on available data, we implement an uncertainty analysis to assess the variability in the model outcomes caused by any inaccuracies in estimates of the parameter values with regard to the effect of the allelic mutation. For these analyses we use Latin hypercube sampling, as described in refs. 52–56, Our uncertainty and sensitivity analyses focus on infectivity vs. duration of infectiousness. To this end, we assess the effects on the dynamics of the epidemic for a range of values of the parameters governing transmission and progression rates: βîıı^^,^^,k k^^→i,j  and γ i,j,k  i,j,k. All other parameters are held constant. These results are presented as an interval band about the average simulation for the population carrying the CCR5Δ32 allele (Fig. 3). Although there is variability in the model outcomes, the analysis indicates that the overall model predictions are consistent for a wide range of transmission and progression rates. Further, most of the variation observed in the outcome is because of the transmission rates for both heterosexual males and females in the primary stage of infection (β2,M,A →  i  ,F, β2,F,A →  i  ,M). As mentioned above, we assume lower viral loads correlate with reduced infectivity; thus, the reduction in viral load in heterozygotes has a major influence on disease spread.
+
+## HIV Induces Selective Pressure on Genotype Frequency
+
+To observe changes in the frequency of the CCR5Δ32 allele in a setting with HIV infection as compared with the Hardy-Weinberg equilibrium in the absence of HIV, we follow changes in the total number of CCR5Δ32 heterozygotes and homozygotes over 1,000 years (Fig. 4). We initially perform simulations in the absence of HIV infection as a negative control to show there is not significant selection of the allele in the absence of infection. To determine how long it would take for the allelic frequency to reach present-day levels (e.g., q = 0.105573), we initiate this simulation for 1,000 years with a very small allelic frequency (q = 0.00105). In the absence of HIV, the allelic frequency is maintained in equilibrium as shown by the constant proportions of CCR5Δ32 heterozygotes and homozygotes (Fig. 4, solid lines). The selection for CCR5Δ32 in the presence of HIV is seen in comparison (Fig. 4, dashed lines). We expand the time frame of this simulation to 2,000 years to view the point at which the frequency reaches present levels (where q ∼0.105573 at year = 1200). Note that the allelic frequency increases for ≈1,600 years before leveling off.
+
+Figure 4 Effects of HIV-1 on selection of the CCR5Δ32 allele. The Hardy-Weinberg equilibrium level is represented in the no-infection simulation (solid lines) for each population. Divergence from the original Hardy-Weinberg equilibrium is shown to occur in the simulations that include HIV infection (dashed lines). Fraction of the total subpopulations are presented: (A) wild types (W/W), (B) heterozygotes (W/Δ32), and (C) homozygotes (Δ32/Δ32). Note that we initiate this simulation with a much lower allelic frequency (0.00105) than used in the rest of the study to better exemplify the actual selective effect over a 1,000-year time scale. (D) The allelic selection effect over a 2,000-year time scale.
+
+<!-- image -->
+
+## Discussion
+
+This study illustrates how populations can differ in susceptibility to epidemic HIV/AIDS depending on a ubiquitous attribute such as a prevailing genotype. We have examined heterosexual HIV epidemics by using mathematical models to assess HIV transmission in dynamic populations either with or without CCR5Δ32 heterozygous and homozygous persons. The most susceptible population lacks the protective mutation in CCR5. In less susceptible populations, the majority of persons carrying the CCR5Δ32 allele are heterozygotes. We explore the hypothesis that lower viral loads (CCR5Δ32 heterozygotes) or resistance to infection (CCR5Δ32 homozygotes) observed in persons with this coreceptor mutation ultimately can influence HIV epidemic trends. Two contrasting influences of the protective CCR5 allele are conceivable: it may limit the epidemic by decreasing the probability of infection because of lower viral loads in infected heterozygotes, or it may exacerbate the epidemic by extending the time that infectious individuals remain in the sexually active population. Our results strongly suggest the former. Thus, the absence of this allele in Africa could explain the severity of HIV disease as compared with populations where the allele is present.
+
+We also observed that HIV can provide selective pressure for the CCR5Δ32 allele within a population, increasing the allelic frequency. Other influences may have additionally selected for this allele. Infectious diseases such as plague and small pox have been postulated to select for CCR5Δ32 (57, 58). For plague, relatively high levels of CCR5Δ32 are believed to have arisen within ≈4,000 years, accounting for the prevalence of the mutation only in populations of European descent. Smallpox virus uses the CC-coreceptor, indicating that direct selection for mutations in CCR5 may have offered resistance to smallpox. Given the differences in the epidemic rates of plague (59), smallpox, and HIV, it is difficult to directly compare our results to these findings. However, our model suggests that the CCR5Δ32 mutation could have reached its present allelic frequency in Northern Europe within this time frame if selected for by a disease with virulence patterns similar to HIV. Our results further support the idea that HIV has been only recently introduced as a pathogen into African populations, as the frequency of the protective allele is almost zero, and our model predicts that selection of the mutant allele in this population by HIV alone takes at least 1,000 years. This prediction is distinct from the frequency of the CCR5Δ32 allele in European populations, where pathogens that may have influenced its frequency (e.g., Yersinia pestis) have been present for much longer.
+
+Two mathematical models have considered the role of parasite and host genetic heterogeneity with regard to susceptibility to another pathogen, namely malaria (60, 61). In each it was determined that heterogeneity of host resistance facilitates the maintenance of diversity in parasite virulence. Given our underlying interest in the coevolution of pathogen and host, we focus on changes in a host protective mutation, holding the virulence of the pathogen constant over time.
+
+Even within our focus on host protective mutations, numerous genetic factors, beneficial or detrimental, could potentially influence epidemics. Other genetically determined host factors affecting HIV susceptibility and disease progression include a CCR5 A/A to G/G promoter polymorphism (62), a CCR2 point mutation (11, 63), and a mutation in the CXCR4 ligand (64). The CCR2b mutation, CCR264I, is found in linkage with at least one CCR5 promoter polymorphism (65) and is prevalent in populations where CCR5Δ32 is nonexistent, such as sub-Saharan Africa (63). However, as none of these mutations have been consistently shown to be as protective as the CCR5Δ32 allele, we simplified our model to incorporate only the effect of CCR5Δ32. Subsequent models could be constructed from our model to account for the complexity of multiple protective alleles. It is interesting to note that our model predicts that even if CCR264I is present at high frequencies in Africa, its protective effects may not augment the lack of a protective allele such as CCR5Δ32.
+
+Although our models demonstrate that genetic factors can contribute to the high prevalence of HIV in sub-Saharan Africa, demographic factors are also clearly important in this region. Our models explicitly incorporated such factors, for example, lack of treatment availability. Additional factors were implicitly controlled for by varying only the presence of the CCR5Δ32 allele. More complex models eventually could include interactions with infectious diseases that serve as cofactors in HIV transmission. The role of high sexually transmitted disease prevalences in HIV infection has long been discussed, especially in relation to core populations (15, 50, 66). Malaria, too, might influence HIV transmission, as it is associated with transient increases in semen HIV viral loads and thus could increase the susceptibility of the population to epidemic HIV (16).
+
+In assessing the HIV/AIDS epidemic, considerable attention has been paid to the influence of core groups in driving sexually transmitted disease epidemics. Our results also highlight how characteristics more uniformly distributed in a population can affect susceptibility. We observed that the genotypic profile of a population affects its susceptibility to epidemic HIV/AIDS. Additional studies are needed to better characterize the influence of these genetic determinants on HIV transmission, as they may be crucial in estimating the severity of the epidemic in some populations. This information can influence the design of treatment strategies as well as point to the urgency for education and prevention programs.
+
+## Acknowledgments
+
+We thank Mark Krosky, Katia Koelle, and Kevin Chung for programming and technical assistance. We also thank Drs. V. J. DiRita, P. Kazanjian, and S. M. Blower for helpful comments and discussions. We thank the reviewers for extremely insightful comments.
+
+## References
+
+- Weiss HA, Hawkes S. Leprosy Rev 72:92–98 (2001). PMID: 11355525
+- Taha TE, Dallabetta GA, Hoover DR, Chiphangwi JD, Mtimavalye LAR. AIDS 12:197–203 (1998). PMID: 9468369
+- AIDS Epidemic Update. Geneva: World Health Organization1–17 (1998).
+- D'Souza MP, Harden VA. Nat Med 2:1293–1300 (1996). PMID: 8946819
+- Martinson JJ, Chapman NH, Rees DC, Liu YT, Clegg JB. Nat Genet 16:100–103 (1997). PMID: 9140404
+- Roos MTL, Lange JMA, deGoede REY, Miedema PT, Tersmette F, Coutinho M, Schellekens RA. J Infect Dis 165:427–432 (1992). PMID: 1347054
+- Garred P, Eugen-Olsen J, Iversen AKN, Benfield TL, Svejgaard A, Hofmann B. Lancet 349:1884 (1997). PMID: 9217763
+- Katzenstein TL, Eugen-Olsen J, Hofman B, Benfield T, Pedersen C, Iversen AK, Sorensen AM, Garred P, Koppelhus U, Svejgaard A, Gerstoft J. J Acquired Immune Defic Syndr Hum Retrovirol 16:10–14 (1997). PMID: 9377119
+- deRoda H, Meyer K, Katzenstain W, Dean M. Science 273:1856–1862 (1996). PMID: 8791590
+- Meyer L, Magierowska M, Hubert JB, Rouzioux C, Deveau C, Sanson F, Debre P, Delfraissy JF, Theodorou I. AIDS 11:F73–F78 (1997). PMID: 9302436
+- Smith MW, Dean M, Carrington M, Winkler C, Huttley DA, Lomb GA, Goedert JJ, O'Brien TR, Jacobson LP, Kaslow R, et al. Science 277:959–965 (1997). PMID: 9252328
+- Samson M, Libert F, Doranz BJ, Rucker J, Liesnard C, Farber CM, Saragosti S, Lapoumeroulie C, Cognaux J, Forceille C, et al. Nature (London) 382:722–725 (1996). PMID: 8751444
+- McNicholl JM, Smith DK, Qari SH, Hodge T. Emerging Infect Dis 3:261–271 (1997). PMID: 9284370
+- Michael NL, Chang G, Louie LG, Mascola JR, Dondero D, Birx DL, Sheppard HW. Nat Med 3:338–340 (1997). PMID: 9055864
+- Mayaud P, Mosha F, Todd J, Balira R, Mgara J, West B, Rusizoka M, Mwijarubi E, Gabone R, Gavyole A, et al. AIDS 11:1873–1880 (1997). PMID: 9412707
+- Hoffman IF, Jere CS, Taylor TE, Munthali P, Dyer JR. AIDS 13:487–494 (1998).
+- HIV/AIDS Surveillance Database. Washington, DC: Population Division, International Programs Center (1999).
+- Anderson RM, May RM, McLean AR. Nature (London) 332:228–234 (1988). PMID: 3279320
+- Berger EA, Doms RW, Fenyo EM, Korber BT, Littman DR, Moore JP, Sattentau QJ, Schuitemaker H, Sodroski J, Weiss RA. Nature (London) 391:240 (1998). PMID: 9440686
+- Alkhatib G, Broder CC, Berger EA. J Virol 70:5487–5494 (1996). PMID: 8764060
+- Choe H, Farzan M, Sun Y, Sullivan N, Rollins B, Ponath PD, Wu L, Mackay CR, LaRosa G, Newman W, et al. Cell 85:1135–1148 (1996). PMID: 8674119
+- Deng H, Liu R, Ellmeier W, Choe S, Unutmaz D, Burkhart M, Di Marzio P, Marmon S, Sutton RE, Hill CM, et al. Nature (London) 381:661–666 (1996). PMID: 8649511
+- Doranz BJ, Rucker J, Yi Y, Smyth RJ, Samsom M, Peiper M, Parmentier SC, Collman RG, Doms RW. Cell 85:1149–1158 (1996). PMID: 8674120
+- Dragic T, Litwin V, Allaway GP, Martin SR, Huang Y, Nagashima KA, Cayanan C, Maddon PJ, Koup RA, Moore JP, Paxton WA. Nature (London) 381:667–673 (1996). PMID: 8649512
+- Zhu T, Mo H, Wang N, Nam DS, Cao Y, Koup RA, Ho DD. Science 261:1179–1181 (1993). PMID: 8356453
+- Bjorndal A, Deng H, Jansson M, Fiore JR, Colognesi C, Karlsson A, Albert J, Scarlatti G, Littman DR, Fenyo EM. J Virol 71:7478–7487 (1997). PMID: 9311827
+- Conner RI, Sheridan KE, Ceradinin D, Choe S, Landau NR. J Exp Med 185:621–628 (1997). PMID: 9034141
+- Liu R, Paxton WA, Choe S, Ceradini D, Martin SR, Horuk R, MacDonald ME, Stuhlmann H, Koup RA, Landau NR. Cell 86:367–377 (1996). PMID: 8756719
+- Mussico M, Lazzarin A, Nicolosi A, Gasparini M, Costigliola P, Arici C, Saracco A. Arch Intern Med (Moscow) 154:1971–1976 (1994). PMID: 8074601
+- Michael NL, Nelson JA, KewalRamani VN, Chang G, O'Brien SJ, Mascola JR, Volsky B, Louder M, White GC, Littman DR, et al. J Virol 72:6040–6047 (1998). PMID: 9621067
+- Hethcote HW, Yorke JA. Gonorrhea Transmission Dynamics and Control. Berlin: Springer (1984).
+- Anderson RM, May RM. Nature (London) 333:514–522 (1988). PMID: 3374601
+- Asiimwe-Okiror G, Opio AA, Musinguzi J, Madraa E, Tembo G, Carael M. AIDS 11:1757–1763 (1997). PMID: 9386811
+- Carael M, Cleland J, Deheneffe JC, Ferry B, Ingham R. AIDS 9:1171–1175 (1995). PMID: 8519454
+- Blower SM, Boe C. J AIDS 6:1347–1352 (1993). PMID: 8254474
+- Kirschner D. J Appl Math 56:143–166 (1996).
+- Le Pont F, Blower S. J AIDS 4:987–999 (1991). PMID: 1890608
+- Kim MY, Lagakos SW. Ann Epidemiol 1:117–128 (1990). PMID: 1669741
+- Anderson RM, May RM. Infectious Disease of Humans: Dynamics and Control. Oxford: Oxford Univ. Press (1992).
+- Ragni MV, Faruki H, Kingsley LA. J Acquired Immune Defic Syndr 17:42–45 (1998).
+- Kaplan JE, Khabbaz RF, Murphy EL, Hermansen S, Roberts C, Lal R, Heneine W, Wright D, Matijas L, Thomson R, et al. J Acquired Immune Defic Syndr Hum Retrovirol 12:193–201 (1996). PMID: 8680892
+- Padian NS, Shiboski SC, Glass SO, Vittinghoff E. Am J Edu 146:350–357 (1997).
+- Leynaert B, Downs AM, de Vincenzi I. Am J Edu 148:88–96 (1998).
+- Garnett GP, Anderson RM. J Acquired Immune Defic Syndr 9:500–513 (1995).
+- Stigum H, Magnus P, Harris JR, Samualson SO, Bakketeig LS. Am J Edu 145:636–643 (1997).
+- Ho DD, Neumann AU, Perelson AS, Chen W, Leonard JM, Markowitz M. Nature (London) 373:123–126 (1995). PMID: 7816094
+- World Resources (1998–1999). Oxford: Oxford Univ. Press (1999).
+- Kostrikis LG, Neumann AU, Thomson B, Korber BT, McHardy P, Karanicolas R, Deutsch L, Huang Y, Lew JF, McIntosh K, et al. J Virol 73:10264–10271 (1999). PMID: 10559343
+- Low-Beer D, Stoneburner RL, Mukulu A. Nat Med 3:553–557 (1997). PMID: 9142126
+- Grosskurth H, Mosha F, Todd J, Senkoro K, Newell J, Klokke A, Changalucha J, West B, Mayaud P, Gavyole A. AIDS 9:927–934 (1995). PMID: 7576329
+- Melo J, Beby-Defaux A, Faria C, Guiraud G, Folgosa E, Barreto A, Agius G. J AIDS 23:203–204 (2000). PMID: 10737436
+- Iman RL, Helton JC, Campbell JE. J Quality Technol 13:174–183 (1981).
+- Iman RL, Helton JC, Campbell JE. J Quality Technol 13:232–240 (1981).
+- Blower SM, Dowlatabadi H. Int Stat Rev 62:229–243 (1994).
+- Porco TC, Blower SM. Theor Popul Biol 54:117–132 (1998). PMID: 9733654
+- Blower SM, Porco TC, Darby G. Nat Med 4:673–678 (1998). PMID: 9623975
+- Libert F, Cochaux P, Beckman G, Samson M, Aksenova M, Cao A, Czeizel A, Claustres M, de la Rua C, Ferrari M, et al. Hum Mol Genet 7:399–406 (1998). PMID: 9466996
+- Lalani AS, Masters J, Zeng W, Barrett J, Pannu R, Everett H, Arendt CW, McFadden G. Science 286:1968–1971 (1999). PMID: 10583963
+- Kermack WO, McKendrick AG. Proc R Soc London 261:700–721 (1927).
+- Gupta S, Hill AVS. Proc R Soc London Ser B 260:271–277 (1995).
+- Ruwende C, Khoo SC, Snow RW, Yates SNR, Kwiatkowski D, Gupta S, Warn P, Allsopp CE, Gilbert SC, Peschu N. Nature (London) 376:246–249 (1995). PMID: 7617034
+- McDermott DH, Zimmerman PA, Guignard F, Kleeberger CA, Leitman SF, Murphy PM. Lancet 352:866–870 (1998). PMID: 9742978
+- Kostrikis LG, Huang Y, Moore JP, Wolinsky SM, Zhang L, Guo Y, Deutsch L, Phair J, Neumann AU, Ho DD. Nat Med 4:350–353 (1998). PMID: 9500612
+- Winkler C, Modi W, Smith MW, Nelson GW, Wu X, Carrington M, Dean M, Honjo T, Tashiro K, Yabe D, et al. Science 279:389–393 (1998). PMID: 9430590
+- Martinson JJ, Hong L, Karanicolas R, Moore JP, Kostrikis LG. AIDS 14:483–489 (2000). PMID: 10780710
+- Vernazza PL, Eron JJ, Fiscus SA, Cohen MS. AIDS 13:155–166 (1999). PMID: 10202821
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v2/pntd.0008301.xml.itxt b/tests/data/groundtruth/docling_v2/pntd.0008301.xml.itxt
index 1723f497..3629cf1d 100644
--- a/tests/data/groundtruth/docling_v2/pntd.0008301.xml.itxt
+++ b/tests/data/groundtruth/docling_v2/pntd.0008301.xml.itxt
@@ -1,132 +1,135 @@
 item-0 at level 0: unspecified: group _root_
   item-1 at level 1: title: Risk factors associated with fai ... s: Results of a multi-country analysis
-    item-2 at level 2: paragraph: Burgert-Brucker Clara R.; 1: Glo ... shington, DC, United States of America
-    item-3 at level 2: section_header: Abstract
-      item-4 at level 3: text: Achieving elimination of lymphat ... ine prevalence and/or lower elevation.
-    item-5 at level 2: section_header: Introduction
-      item-6 at level 3: text: Lymphatic filariasis (LF), a dis ... 8 countries remain endemic for LF [3].
-      item-7 at level 3: text: The road to elimination as a pub ... t elimination be officially validated.
-      item-8 at level 3: text: Pre-TAS include at least one sen ... me of day that blood can be taken [5].
-      item-9 at level 3: text: When a country fails to meet the ... o ensure rounds of MDA are not missed.
-      item-10 at level 3: text: This study aims to understand wh ... e of limited LF elimination resources.
-    item-11 at level 2: section_header: Methods
-      item-12 at level 3: text: This is a secondary data analysi ... rch; no ethical approval was required.
-      item-13 at level 3: text: Building on previous work, we de ... available global geospatial data sets.
-      item-14 at level 3: section_header: Data sources
-        item-15 at level 4: text: Information on baseline prevalen ...  publicly available sources (Table 1).
-      item-16 at level 3: section_header: Outcome and covariate variables
-        item-17 at level 4: text: The outcome of interest for this ... r than or equal to 1% Mf or 2% Ag [4].
-        item-18 at level 4: text: Potential covariates were derive ... is and the final categorizations used.
-        item-19 at level 4: section_header: Baseline prevalence
-          item-20 at level 5: text: Baseline prevalence can be assum ... (2) using the cut-off of <10% or ≥10%.
-        item-21 at level 4: section_header: Agent
-          item-22 at level 5: text: In terms of differences in trans ... dazole (DEC-ALB)] from the MDA domain.
-        item-23 at level 4: section_header: Environment
-          item-24 at level 5: text: LF transmission intensity is inf ... dicates a higher level of “greenness.”
-          item-25 at level 5: text: We included the socio-economic v ...  proxy for socio-economic status [33].
-          item-26 at level 5: text: Finally, all or parts of distric ... s were co-endemic with onchocerciasis.
-        item-27 at level 4: section_header: MDA
-          item-28 at level 5: text: Treatment effectiveness depends  ... esent a threat to elimination [41,42].
-          item-29 at level 5: text: We considered three approaches w ... unds ever documented in that district.
-        item-30 at level 4: section_header: Pre-TAS implementation
-          item-31 at level 5: text: Pre-TAS results can be influence ... d throughout the time period of study.
-      item-32 at level 3: section_header: Data inclusion criteria
-        item-33 at level 4: text: The dataset, summarized at the d ... al analysis dataset had 554 districts.
-      item-34 at level 3: section_header: Statistical analysis and modeling
-        item-35 at level 4: text: Statistical analysis and modelin ... d the number of variables accordingly.
-        item-36 at level 4: text: Sensitivity analysis was perform ... ot have been truly LF-endemic [43,44].
-    item-37 at level 2: section_header: Results
-      item-38 at level 3: text: The overall pre-TAS pass rate fo ... ts had baseline prevalences below 20%.
-      item-39 at level 3: text: Fig 3 shows the unadjusted analy ... overage, and sufficient rounds of MDA.
-      item-40 at level 3: text: The final log-binomial model inc ... igh baseline and diagnostic test used.
-      item-41 at level 3: text: Fig 4 shows the risk ratio resul ... of failing pre-TAS (95% CI 1.95–4.83).
-      item-42 at level 3: text: Sensitivity analyses were conduc ... gnified by large confidence intervals.
-      item-43 at level 3: text: Overall 74 districts in the data ... or 51% of all the failures (38 of 74).
-    item-44 at level 2: section_header: Discussion
-      item-45 at level 3: text: This paper reports for the first ... ctors associated with TAS failure [7].
-      item-46 at level 3: text: Though diagnostic test used was  ...  FTS was more sensitive than ICT [45].
-      item-47 at level 3: text: Elevation was the only environme ... ich impact vector chances of survival.
-      item-48 at level 3: text: The small number of failures ove ... search has shown the opposite [15,16].
-      item-49 at level 3: text: All other variables included in  ... are not necessary to lower prevalence.
-      item-50 at level 3: text: Limitations to this study includ ...  reducing LF prevalence [41,48,51–53].
-      item-51 at level 3: text: Fourteen districts were excluded ... ta to extreme outliners in a district.
-      item-52 at level 3: text: As this analysis used data acros ... of individuals included in the survey.
-      item-53 at level 3: text: This paper provides evidence fro ... th high baseline and/or low elevation.
-    item-54 at level 2: section_header: Tables
-      item-55 at level 3: table with [18x8]
-        item-55 at level 4: caption: Table 1: Categorization of potential factors influencing pre-TAS results.
-      item-56 at level 3: table with [11x6]
-        item-56 at level 4: caption: Table 2: Adjusted risk ratios for pre-TAS failure from log-binomial model sensitivity analysis.
-    item-57 at level 2: section_header: Figures
-      item-58 at level 3: picture
-        item-58 at level 4: caption: Fig 1: Number of pre-TAS by country.
-      item-59 at level 3: picture
-        item-59 at level 4: caption: Fig 2: District-level baseline prevalence by country.
-      item-60 at level 3: picture
-        item-60 at level 4: caption: Fig 3: Percent pre-TAS failure by each characteristic (unadjusted).
-      item-61 at level 3: picture
-        item-61 at level 4: caption: Fig 4: Adjusted risk ratios for pre-TAS failure with 95% Confidence Interval from log-binomial model.
-      item-62 at level 3: picture
-        item-62 at level 4: caption: Fig 5: Analysis of failures by model combinations.
-    item-63 at level 2: section_header: References
-      item-64 at level 3: list: group list
-        item-65 at level 4: list_item: World Health Organization. Lymph ... rategic plan 2010–2020. Geneva; 2010. 
-        item-66 at level 4: list_item: World Health Organization. Valid ...  public health problem. Geneva; 2017. 
-        item-67 at level 4: list_item: Global programme to eliminate ly ... eport, 2018. Wkly Epidemiol Rec (2019)
-        item-68 at level 4: list_item: World Health Organization. Globa ... ss drug administration. Geneva; 2011. 
-        item-69 at level 4: list_item: World Health Organization. Stren ... isease-specific Indicators. 2016; 42. 
-        item-70 at level 4: list_item: Kyelem D; Biswas G; Bockarie MJ; ... search needs. Am J Trop Med Hyg (2008)
-        item-71 at level 4: list_item: Goldberg EM; King JD; Mupfasoni  ... c filariasis. Am J Trop Med Hyg (2019)
-        item-72 at level 4: list_item: Cano J; Rebollo MP; Golding N; P ...  present. Parasites and Vectors (2014)
-        item-73 at level 4: list_item: CGIAR-CSI. CGIAR-CSI SRTM 90m DEM Digital Elevation Database. In: . 
-        item-74 at level 4: list_item: USGS NASA. Vegetation indices 16 ... et]. [cited 1 May 2018]. Available: . 
-        item-75 at level 4: list_item: Funk C; Peterson P; Landsfeld M; ... r monitoring extremes. Sci Data (2015)
-        item-76 at level 4: list_item: Lloyd CT; Sorichetta A; Tatem AJ ... in population studies. Sci Data (2017)
-        item-77 at level 4: list_item: Elvidge CD; Baugh KE; Zhizhin M; ... hts. Proc Asia-Pacific Adv Netw (2013)
-        item-78 at level 4: list_item: Jambulingam P; Subramanian S; De ... dicators. Parasites and Vectors (2016)
-        item-79 at level 4: list_item: Michael E; Malecela-Lazaro MN; S ... c filariasis. Lancet Infect Dis (2004)
-        item-80 at level 4: list_item: Stolk WA; Swaminathan S; van Oor ...  simulation study. J Infect Dis (2003)
-        item-81 at level 4: list_item: Grady CA; De Rochars MB; Direny  ... asis programs. Emerg Infect Dis (2007)
-        item-82 at level 4: list_item: Evans D; McFarland D; Adamani W; ... Nigeria. Ann Trop Med Parasitol (2011)
-        item-83 at level 4: list_item: Richards FO; Eigege A; Miri ES;  ...  in Nigeria. PLoS Negl Trop Dis (2011)
-        item-84 at level 4: list_item: Biritwum NK; Yikpotey P; Marfo B ... Ghana. Trans R Soc Trop Med Hyg (2016)
-        item-85 at level 4: list_item: Moraga P; Cano J; Baggaley RF; G ... odelling. Parasites and Vectors (2015)
-        item-86 at level 4: list_item: Irvine MA; Njenga SM; Gunawarden ... ction. Trans R Soc Trop Med Hyg (2016)
-        item-87 at level 4: list_item: Ottesen EA. Efficacy of diethylc ... ariae in humans. Rev Infect Dis (1985)
-        item-88 at level 4: list_item: Gambhir M; Bockarie M; Tisch D;  ...  lymphatic filariasis. BMC Biol (2010)
-        item-89 at level 4: list_item: World Health Organization. Globa ... al entomology handbook. Geneva; 2013. 
-        item-90 at level 4: list_item: Slater H; Michael E. Predicting  ... gical niche modelling. PLoS One (2012)
-        item-91 at level 4: list_item: Slater H; Michael E. Mapping, Ba ...  prevalence in Africa. PLoS One (2013)
-        item-92 at level 4: list_item: Sabesan S; Raju KHK; Subramanian ... odel. Vector-Borne Zoonotic Dis (2013)
-        item-93 at level 4: list_item: Stanton MC; Molyneux DH; Kyelem  ... in Burkina Faso. Geospat Health (2013)
-        item-94 at level 4: list_item: Manhenje I; Teresa Galán-Puchade ... hern Mozambique. Geospat Health (2013)
-        item-95 at level 4: list_item: Ngwira BM; Tambala P; Perez a M; ...  infection in Malawi. Filaria J (2007)
-        item-96 at level 4: list_item: Simonsen PE; Mwakitalu ME. Urban ... hatic filariasis. Parasitol Res (2013)
-        item-97 at level 4: list_item: Proville J; Zavala-Araiza D; Wag ... socio-economic trends. PLoS One (2017)
-        item-98 at level 4: list_item: Endeshaw T; Taye A; Tadesse Z; K ... st Ethiopia. Pathog Glob Health (2015)
-        item-99 at level 4: list_item: Richards FO; Eigege A; Pam D; Ka ... eas of co-endemicity. Filaria J (2005)
-        item-100 at level 4: list_item: Kyelem D; Sanou S; Boatin B a; M ... cations. Ann Trop Med Parasitol (2003)
-        item-101 at level 4: list_item: Weil GJ; Lammie PJ; Richards FO; ... ne and ivermectin. J Infect Dis (1991)
-        item-102 at level 4: list_item: Kumar A; Sachan P. Measuring imp ... rug administration. Trop Biomed (2014)
-        item-103 at level 4: list_item: Njenga SM; Mwandawiro CS; Wamae  ...  control. Parasites and Vectors (2011)
-        item-104 at level 4: list_item: Boyd A; Won KY; McClintock SK; D ... gane, Haiti. PLoS Negl Trop Dis (2010)
-        item-105 at level 4: list_item: Irvine MA; Reimer LJ; Njenga SM; ... mination. Parasites and Vectors (2015)
-        item-106 at level 4: list_item: Irvine MA; Stolk WA; Smith ME; S ... elling study. Lancet Infect Dis (2017)
-        item-107 at level 4: list_item: Pion SD; Montavon C; Chesnais CB ... crofilaremia. Am J Trop Med Hyg (2016)
-        item-108 at level 4: list_item: Wanji S; Esum ME; Njouendou AJ;  ... in Cameroon. PLoS Negl Trop Dis (2018)
-        item-109 at level 4: list_item: Chesnais CB; Awaca-Uvon NP; Bola ... a in Africa. PLoS Negl Trop Dis (2017)
-        item-110 at level 4: list_item: Silumbwe A; Zulu JM; Halwindi H; ... haran Africa. BMC Public Health (2017)
-        item-111 at level 4: list_item: Adams AM; Vuckovic M; Birch E; B ... nistration. Trop Med Infect Dis (2018)
-        item-112 at level 4: list_item: Rao RU; Samarasekera SD; Nagodav ... n Sri Lanka. PLoS Negl Trop Dis (2017)
-        item-113 at level 4: list_item: Xu Z; Graves PM; Lau CL; Clement ... is in American Samoa. Epidemics (2018)
-        item-114 at level 4: list_item: Id CM; Tettevi EJ; Mechan F; Idu ... rural Ghana. PLoS Negl Trop Dis (2019)
-        item-115 at level 4: list_item: Eigege A; Kal A; Miri E; Sallau  ...  in Nigeria. PLoS Negl Trop Dis (2013)
-        item-116 at level 4: list_item: Van den Berg H; Kelly-Hope LA; L ... r management. Lancet Infect Dis (2013)
-        item-117 at level 4: list_item: Webber R.. Eradication of Wucher ... ntrol. Trans R Soc Trop Med Hyg (1979)
-  item-118 at level 1: caption: Table 1: Categorization of potential factors influencing pre-TAS results.
-  item-119 at level 1: caption: Table 2: Adjusted risk ratios fo ... g-binomial model sensitivity analysis.
-  item-120 at level 1: caption: Fig 1: Number of pre-TAS by country.
-  item-121 at level 1: caption: Fig 2: District-level baseline prevalence by country.
-  item-122 at level 1: caption: Fig 3: Percent pre-TAS failure by each characteristic (unadjusted).
-  item-123 at level 1: caption: Fig 4: Adjusted risk ratios for  ... ence Interval from log-binomial model.
-  item-124 at level 1: caption: Fig 5: Analysis of failures by model combinations.
\ No newline at end of file
+    item-2 at level 2: paragraph: Clara R. Burgert-Brucker, Kathry ... garet Baker, John Kraemer, Molly Brady
+    item-3 at level 2: paragraph: Global Health Division, RTI Inte ... shington, DC, United States of America
+    item-4 at level 2: section_header: Abstract
+      item-5 at level 3: text: Achieving elimination of lymphat ... as at highest risk of failing pre-TAS.
+    item-6 at level 2: section_header: Author summary
+      item-7 at level 3: text: Achieving elimination of lymphat ... ine prevalence and/or lower elevation.
+    item-8 at level 2: section_header: Introduction
+      item-9 at level 3: text: Lymphatic filariasis (LF), a dis ... 8 countries remain endemic for LF [3].
+      item-10 at level 3: text: The road to elimination as a pub ... t elimination be officially validated.
+      item-11 at level 3: text: Pre-TAS include at least one sen ... me of day that blood can be taken [5].
+      item-12 at level 3: text: When a country fails to meet the ... o ensure rounds of MDA are not missed.
+      item-13 at level 3: text: This study aims to understand wh ... e of limited LF elimination resources.
+    item-14 at level 2: section_header: Methods
+      item-15 at level 3: text: This is a secondary data analysi ... rch; no ethical approval was required.
+      item-16 at level 3: text: Building on previous work, we de ... available global geospatial data sets.
+      item-17 at level 3: table with [18x8]
+        item-17 at level 4: caption: Table 1 Categorization of potential factors influencing pre-TAS results.
+      item-18 at level 3: section_header: Data sources
+        item-19 at level 4: text: Information on baseline prevalen ...  publicly available sources (Table 1).
+      item-20 at level 3: section_header: Outcome and covariate variables
+        item-21 at level 4: text: The outcome of interest for this ... r than or equal to 1% Mf or 2% Ag [4].
+        item-22 at level 4: text: Potential covariates were derive ... is and the final categorizations used.
+        item-23 at level 4: section_header: Baseline prevalence
+          item-24 at level 5: text: Baseline prevalence can be assum ... (2) using the cut-off of <10% or ≥10%.
+        item-25 at level 4: section_header: Agent
+          item-26 at level 5: text: In terms of differences in trans ... dazole (DEC-ALB)] from the MDA domain.
+        item-27 at level 4: section_header: Environment
+          item-28 at level 5: text: LF transmission intensity is inf ... dicates a higher level of “greenness.”
+          item-29 at level 5: text: We included the socio-economic v ...  proxy for socio-economic status [33].
+          item-30 at level 5: text: Finally, all or parts of distric ... s were co-endemic with onchocerciasis.
+        item-31 at level 4: section_header: MDA
+          item-32 at level 5: text: Treatment effectiveness depends  ... esent a threat to elimination [41,42].
+          item-33 at level 5: text: We considered three approaches w ... unds ever documented in that district.
+        item-34 at level 4: section_header: Pre-TAS implementation
+          item-35 at level 5: text: Pre-TAS results can be influence ... d throughout the time period of study.
+      item-36 at level 3: section_header: Data inclusion criteria
+        item-37 at level 4: text: The dataset, summarized at the d ... al analysis dataset had 554 districts.
+      item-38 at level 3: section_header: Statistical analysis and modeling
+        item-39 at level 4: text: Statistical analysis and modelin ... d the number of variables accordingly.
+        item-40 at level 4: text: Sensitivity analysis was perform ... ot have been truly LF-endemic [43,44].
+    item-41 at level 2: section_header: Results
+      item-42 at level 3: text: The overall pre-TAS pass rate fo ... ts had baseline prevalences below 20%.
+      item-43 at level 3: picture
+        item-43 at level 4: caption: Fig 1 Number of pre-TAS by country.
+      item-44 at level 3: picture
+        item-44 at level 4: caption: Fig 2 District-level baseline prevalence by country.
+      item-45 at level 3: text: Fig 3 shows the unadjusted analy ... overage, and sufficient rounds of MDA.
+      item-46 at level 3: picture
+        item-46 at level 4: caption: Fig 3 Percent pre-TAS failure by each characteristic (unadjusted).
+      item-47 at level 3: text: The final log-binomial model inc ... igh baseline and diagnostic test used.
+      item-48 at level 3: text: Fig 4 shows the risk ratio resul ... of failing pre-TAS (95% CI 1.95–4.83).
+      item-49 at level 3: picture
+        item-49 at level 4: caption: Fig 4 Adjusted risk ratios for pre-TAS failure with 95% Confidence Interval from log-binomial model.
+      item-50 at level 3: text: Sensitivity analyses were conduc ... gnified by large confidence intervals.
+      item-51 at level 3: table with [11x6]
+        item-51 at level 4: caption: Table 2 Adjusted risk ratios for pre-TAS failure from log-binomial model sensitivity analysis.
+      item-52 at level 3: text: Overall 74 districts in the data ... or 51% of all the failures (38 of 74).
+      item-53 at level 3: picture
+        item-53 at level 4: caption: Fig 5 Analysis of failures by model combinations.
+    item-54 at level 2: section_header: Discussion
+      item-55 at level 3: text: This paper reports for the first ... ctors associated with TAS failure [7].
+      item-56 at level 3: text: Though diagnostic test used was  ...  FTS was more sensitive than ICT [45].
+      item-57 at level 3: text: Elevation was the only environme ... ich impact vector chances of survival.
+      item-58 at level 3: text: The small number of failures ove ... search has shown the opposite [15,16].
+      item-59 at level 3: text: All other variables included in  ... are not necessary to lower prevalence.
+      item-60 at level 3: text: Limitations to this study includ ...  reducing LF prevalence [41,48,51–53].
+      item-61 at level 3: text: Fourteen districts were excluded ... ta to extreme outliners in a district.
+      item-62 at level 3: text: As this analysis used data acros ... of individuals included in the survey.
+      item-63 at level 3: text: This paper provides evidence fro ... th high baseline and/or low elevation.
+    item-64 at level 2: section_header: Acknowledgments
+      item-65 at level 3: text: The authors would like to thank  ... e surveys financially and technically.
+    item-66 at level 2: section_header: References
+      item-67 at level 3: list: group list
+        item-68 at level 4: list_item: World Health Organization. Lymph ... trategic plan 2010–2020. Geneva; 2010.
+        item-69 at level 4: list_item: World Health Organization. Valid ... a public health problem. Geneva; 2017.
+        item-70 at level 4: list_item: World Health Organization. Globa ...  Wkly Epidemiol Rec. 2019;94: 457–472.
+        item-71 at level 4: list_item: World Health Organization. Globa ... ass drug administration. Geneva; 2011.
+        item-72 at level 4: list_item: World Health Organization. Stren ... Disease-specific Indicators. 2016; 42.
+        item-73 at level 4: list_item: KyelemD, BiswasG, BockarieMJ, Br ... Trop Med Hyg. 2008;79: 480–4. 18840733
+        item-74 at level 4: list_item: GoldbergEM, KingJD, MupfasoniD,  ... . 2019; 10.4269/ajtmh.18-0721 31115301
+        item-75 at level 4: list_item: CanoJ, RebolloMP, GoldingN, Pull ... : 1–19. 10.1186/1756-3305-7-1 24411014
+        item-76 at level 4: list_item: CGIAR-CSI. CGIAR-CSI SRTM 90m DE ...  Available: http://srtm.csi.cgiar.org/
+        item-77 at level 4: list_item: USGS NASA. Vegetation indices 16 ... /lpdaac.usgs.gov/products/myd13a1v006/
+        item-78 at level 4: list_item: FunkC, PetersonP, LandsfeldM, Pe ...  2015;2 10.1038/sdata.2015.66 26646728
+        item-79 at level 4: list_item: LloydCT, SorichettaA, TatemAJ. H ... : 170001 10.1038/sdata.2017.1 28140386
+        item-80 at level 4: list_item: ElvidgeCD, BaughKE, ZhizhinM, Hs ... Network; 2013;35: 62 10.7125/apan.35.7
+        item-81 at level 4: list_item: JambulingamP, SubramanianS, De V ... 18. 10.1186/s13071-015-1291-6 26728523
+        item-82 at level 4: list_item: MichaelE, Malecela-LazaroMN, Sim ... 10.1016/S1473-3099(04)00973-9 15050941
+        item-83 at level 4: list_item: StolkWA, SwaminathanS, van Oortm ... ;188: 1371–81. 10.1086/378354 14593597
+        item-84 at level 4: list_item: GradyCA, De RocharsMB, DirenyAN, ... 8–610. 10.3201/eid1304.061063 17553278
+        item-85 at level 4: list_item: EvansD, McFarlandD, AdamaniW, Ei ... 0.1179/2047773211Y.0000000010 22325813
+        item-86 at level 4: list_item: RichardsFO, EigegeA, MiriES, Kal ...  10.1371/journal.pntd.0001346 22022627
+        item-87 at level 4: list_item: BiritwumNK, YikpoteyP, MarfoBK,  ... 90–695. 10.1093/trstmh/trx007 28938053
+        item-88 at level 4: list_item: MoragaP, CanoJ, BaggaleyRF, Gyap ... 16. 10.1186/s13071-014-0608-1 25561160
+        item-89 at level 4: list_item: IrvineMA, NjengaSM, GunawardenaS ... 18–124. 10.1093/trstmh/trv096 26822604
+        item-90 at level 4: list_item: OttesenEA. Efficacy of diethylca ... iae in humans. Rev Infect Dis. 1985;7.
+        item-91 at level 4: list_item: GambhirM, BockarieM, TischD, Kaz ... 2010;8 10.1186/1741-7007-8-22 20236528
+        item-92 at level 4: list_item: World Health Organization. Globa ... cal entomology handbook. Geneva; 2013.
+        item-93 at level 4: list_item: SlaterH, MichaelE. Predicting th ...  10.1371/journal.pone.0032202 22359670
+        item-94 at level 4: list_item: SlaterH, MichaelE. Mapping, Baye ...  10.1371/journal.pone.0071574 23951194
+        item-95 at level 4: list_item: SabesanS, RajuKHK, SubramanianS, ... 57–665. 10.1089/vbz.2012.1238 23808973
+        item-96 at level 4: list_item: StantonMC, MolyneuxDH, KyelemD,  ... : 159–173. 10.4081/gh.2013.63 24258892
+        item-97 at level 4: list_item: ManhenjeI, Teresa Galán-Puchades ... : 391–398. 10.4081/gh.2013.96 23733300
+        item-98 at level 4: list_item: NgwiraBM, TambalaP, Perez aM, Bo ... ;6: 12 10.1186/1475-2883-6-12 18047646
+        item-99 at level 4: list_item: SimonsenPE, MwakitaluME. Urban l ... 44. 10.1007/s00436-012-3226-x 23239094
+        item-100 at level 4: list_item: ProvilleJ, Zavala-AraizaD, Wagne ...  10.1371/journal.pone.0174610 28346500
+        item-101 at level 4: list_item: EndeshawT, TayeA, TadesseZ, Kata ... 10.1080/20477724.2015.1103501 26878935
+        item-102 at level 4: list_item: RichardsFO, EigegeA, PamD, KalA, ... 4: 3–5. 10.1186/1475-2883-4-3 15916708
+        item-103 at level 4: list_item: KyelemD, SanouS, BoatinB a., Med ... 8. 10.1179/000349803225002462 14754495
+        item-104 at level 4: list_item: WeilGJ, LammiePJ, RichardsFO, Eb ... –816. 10.1093/infdis/164.4.814 1894943
+        item-105 at level 4: list_item: KumarA, SachanP. Measuring impac ... rop Biomed. 2014;31: 225–229. 25134891
+        item-106 at level 4: list_item: NjengaSM, MwandawiroCS, WamaeCN, ... 4: 1–9. 10.1186/1756-3305-4-1 21205315
+        item-107 at level 4: list_item: BoydA, WonKY, McClintockSK, Dono ...  10.1371/journal.pntd.0000640 20351776
+        item-108 at level 4: list_item: IrvineMA, ReimerLJ, NjengaSM, Gu ... 19. 10.1186/s13071-014-0608-1 25561160
+        item-109 at level 4: list_item: IrvineMA, StolkWA, SmithME, Subr ... 10.1016/S1473-3099(16)30467-4 28012943
+        item-110 at level 4: list_item: PionSD, MontavonC, ChesnaisCB, K ... 7–1423. 10.4269/ajtmh.16-0547 27729568
+        item-111 at level 4: list_item: WanjiS, EsumME, NjouendouAJ, Mbe ...  10.1371/journal.pntd.0007192 30849120
+        item-112 at level 4: list_item: ChesnaisCB, Awaca-UvonNP, BolayF ...  10.1371/journal.pntd.0005703 28892473
+        item-113 at level 4: list_item: SilumbweA, ZuluJM, HalwindiH, Ja ... 15. 10.1186/s12889-017-4414-5 28532397
+        item-114 at level 4: list_item: AdamsAM, VuckovicM, BirchE, Bran ... ;3 10.3390/tropicalmed3040122 30469342
+        item-115 at level 4: list_item: RaoRU, SamarasekeraSD, Nagodavit ...  10.1371/journal.pntd.0006066 29084213
+        item-116 at level 4: list_item: XuZ, GravesPM, LauCL, ClementsA, ...  10.1016/j.epidem.2018.12.003 30611745
+        item-117 at level 4: list_item: IdCM, TetteviEJ, MechanF, IdunB, ... Ghana. PLoS Negl Trop Dis. 2019; 1–17.
+        item-118 at level 4: list_item: EigegeA, KalA, MiriE, SallauA, U ...  10.1371/journal.pntd.0002508 24205421
+        item-119 at level 4: list_item: Van den BergH, Kelly-HopeLA, Lin ... 10.1016/S1473-3099(12)70148-2 23084831
+        item-120 at level 4: list_item: WebberR. Eradication of Wucherer ... ol. Trans R Soc Trop Med Hyg. 1979;73.
+  item-121 at level 1: caption: Table 1 Categorization of potential factors influencing pre-TAS results.
+  item-122 at level 1: caption: Fig 1 Number of pre-TAS by country.
+  item-123 at level 1: caption: Fig 2 District-level baseline prevalence by country.
+  item-124 at level 1: caption: Fig 3 Percent pre-TAS failure by each characteristic (unadjusted).
+  item-125 at level 1: caption: Fig 4 Adjusted risk ratios for p ... ence Interval from log-binomial model.
+  item-126 at level 1: caption: Table 2 Adjusted risk ratios for ... g-binomial model sensitivity analysis.
+  item-127 at level 1: caption: Fig 5 Analysis of failures by model combinations.
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v2/pntd.0008301.xml.json b/tests/data/groundtruth/docling_v2/pntd.0008301.xml.json
deleted file mode 100644
index 3582dd69..00000000
--- a/tests/data/groundtruth/docling_v2/pntd.0008301.xml.json
+++ /dev/null
@@ -1,7063 +0,0 @@
-{
-  "schema_name": "DoclingDocument",
-  "version": "1.0.0",
-  "name": "pntd.0008301",
-  "origin": {
-    "mimetype": "application/xml",
-    "binary_hash": 10315162465449768094,
-    "filename": "pntd.0008301.xml"
-  },
-  "furniture": {
-    "self_ref": "#/furniture",
-    "children": [],
-    "name": "_root_",
-    "label": "unspecified"
-  },
-  "body": {
-    "self_ref": "#/body",
-    "children": [
-      {
-        "$ref": "#/texts/0"
-      },
-      {
-        "$ref": "#/texts/54"
-      },
-      {
-        "$ref": "#/texts/55"
-      },
-      {
-        "$ref": "#/texts/57"
-      },
-      {
-        "$ref": "#/texts/58"
-      },
-      {
-        "$ref": "#/texts/59"
-      },
-      {
-        "$ref": "#/texts/60"
-      },
-      {
-        "$ref": "#/texts/61"
-      }
-    ],
-    "name": "_root_",
-    "label": "unspecified"
-  },
-  "groups": [
-    {
-      "self_ref": "#/groups/0",
-      "parent": {
-        "$ref": "#/texts/62"
-      },
-      "children": [
-        {
-          "$ref": "#/texts/63"
-        },
-        {
-          "$ref": "#/texts/64"
-        },
-        {
-          "$ref": "#/texts/65"
-        },
-        {
-          "$ref": "#/texts/66"
-        },
-        {
-          "$ref": "#/texts/67"
-        },
-        {
-          "$ref": "#/texts/68"
-        },
-        {
-          "$ref": "#/texts/69"
-        },
-        {
-          "$ref": "#/texts/70"
-        },
-        {
-          "$ref": "#/texts/71"
-        },
-        {
-          "$ref": "#/texts/72"
-        },
-        {
-          "$ref": "#/texts/73"
-        },
-        {
-          "$ref": "#/texts/74"
-        },
-        {
-          "$ref": "#/texts/75"
-        },
-        {
-          "$ref": "#/texts/76"
-        },
-        {
-          "$ref": "#/texts/77"
-        },
-        {
-          "$ref": "#/texts/78"
-        },
-        {
-          "$ref": "#/texts/79"
-        },
-        {
-          "$ref": "#/texts/80"
-        },
-        {
-          "$ref": "#/texts/81"
-        },
-        {
-          "$ref": "#/texts/82"
-        },
-        {
-          "$ref": "#/texts/83"
-        },
-        {
-          "$ref": "#/texts/84"
-        },
-        {
-          "$ref": "#/texts/85"
-        },
-        {
-          "$ref": "#/texts/86"
-        },
-        {
-          "$ref": "#/texts/87"
-        },
-        {
-          "$ref": "#/texts/88"
-        },
-        {
-          "$ref": "#/texts/89"
-        },
-        {
-          "$ref": "#/texts/90"
-        },
-        {
-          "$ref": "#/texts/91"
-        },
-        {
-          "$ref": "#/texts/92"
-        },
-        {
-          "$ref": "#/texts/93"
-        },
-        {
-          "$ref": "#/texts/94"
-        },
-        {
-          "$ref": "#/texts/95"
-        },
-        {
-          "$ref": "#/texts/96"
-        },
-        {
-          "$ref": "#/texts/97"
-        },
-        {
-          "$ref": "#/texts/98"
-        },
-        {
-          "$ref": "#/texts/99"
-        },
-        {
-          "$ref": "#/texts/100"
-        },
-        {
-          "$ref": "#/texts/101"
-        },
-        {
-          "$ref": "#/texts/102"
-        },
-        {
-          "$ref": "#/texts/103"
-        },
-        {
-          "$ref": "#/texts/104"
-        },
-        {
-          "$ref": "#/texts/105"
-        },
-        {
-          "$ref": "#/texts/106"
-        },
-        {
-          "$ref": "#/texts/107"
-        },
-        {
-          "$ref": "#/texts/108"
-        },
-        {
-          "$ref": "#/texts/109"
-        },
-        {
-          "$ref": "#/texts/110"
-        },
-        {
-          "$ref": "#/texts/111"
-        },
-        {
-          "$ref": "#/texts/112"
-        },
-        {
-          "$ref": "#/texts/113"
-        },
-        {
-          "$ref": "#/texts/114"
-        },
-        {
-          "$ref": "#/texts/115"
-        }
-      ],
-      "name": "list",
-      "label": "list"
-    }
-  ],
-  "texts": [
-    {
-      "self_ref": "#/texts/0",
-      "parent": {
-        "$ref": "#/body"
-      },
-      "children": [
-        {
-          "$ref": "#/texts/1"
-        },
-        {
-          "$ref": "#/texts/2"
-        },
-        {
-          "$ref": "#/texts/4"
-        },
-        {
-          "$ref": "#/texts/10"
-        },
-        {
-          "$ref": "#/texts/36"
-        },
-        {
-          "$ref": "#/texts/43"
-        },
-        {
-          "$ref": "#/texts/53"
-        },
-        {
-          "$ref": "#/texts/56"
-        },
-        {
-          "$ref": "#/texts/62"
-        }
-      ],
-      "label": "title",
-      "prov": [],
-      "orig": "Risk factors associated with failing pre-transmission assessment surveys (pre-TAS) in lymphatic filariasis elimination programs: Results of a multi-country analysis",
-      "text": "Risk factors associated with failing pre-transmission assessment surveys (pre-TAS) in lymphatic filariasis elimination programs: Results of a multi-country analysis"
-    },
-    {
-      "self_ref": "#/texts/1",
-      "parent": {
-        "$ref": "#/texts/0"
-      },
-      "children": [],
-      "label": "paragraph",
-      "prov": [],
-      "orig": "Burgert-Brucker Clara R.; 1: Global Health Division, RTI International, Washington, DC, United States of America; Zoerhoff Kathryn L.; 1: Global Health Division, RTI International, Washington, DC, United States of America; Headland Maureen; 1: Global Health Division, RTI International, Washington, DC, United States of America, 2: Global Health, Population, and Nutrition, FHI 360, Washington, DC, United States of America; Shoemaker Erica A.; 1: Global Health Division, RTI International, Washington, DC, United States of America; Stelmach Rachel; 1: Global Health Division, RTI International, Washington, DC, United States of America; Karim Mohammad Jahirul; 3: Department of Disease Control, Ministry of Health and Family Welfare, Dhaka, Bangladesh; Batcho Wilfrid; 4: National Control Program of Communicable Diseases, Ministry of Health, Cotonou, Benin; Bougouma Clarisse; 5: Lymphatic Filariasis Elimination Program, Minist\u00e8re de la Sant\u00e9, Ouagadougou, Burkina Faso; Bougma Roland; 5: Lymphatic Filariasis Elimination Program, Minist\u00e8re de la Sant\u00e9, Ouagadougou, Burkina Faso; Benjamin Didier Biholong; 6: National Onchocerciasis and Lymphatic Filariasis Control Program, Ministry of Health, Yaounde, Cameroon; Georges Nko'Ayissi; 6: National Onchocerciasis and Lymphatic Filariasis Control Program, Ministry of Health, Yaounde, Cameroon; Marfo Benjamin; 7: Neglected Tropical Diseases Programme, Ghana Health Service, Accra, Ghana; Lemoine Jean Frantz; 8: Ministry of Health, Port-au-Prince, Haiti; Pangaribuan Helena Ullyartha; 9: National Institute Health Research & Development, Ministry of Health, Jakarta, Indonesia; Wijayanti Eksi; 9: National Institute Health Research & Development, Ministry of Health, Jakarta, Indonesia; Coulibaly Yaya Ibrahim; 10: Filariasis Unit, International Center of Excellence in Research, Faculty of Medicine and Odontostomatology, Bamako, Mali; Doumbia Salif Seriba; 10: Filariasis Unit, International Center of Excellence in Research, Faculty of Medicine and Odontostomatology, Bamako, Mali; Rimal Pradip; 11: Epidemiology and Disease Control Division, Department of Health Service, Kathmandu, Nepal; Salissou Adamou Bacthiri; 12: Programme Onchocercose et Filariose Lymphatique, Minist\u00e8re de la Sant\u00e9, Niamey, Niger; Bah Yukaba; 13: National Neglected Tropical Disease Program, Ministry of Health and Sanitation, Freetown, Sierra Leone; Mwingira Upendo; 14: Neglected Tropical Disease Control Programme, National Institute for Medical Research, Dar es Salaam, Tanzania; Nshala Andreas; 15: IMA World Health/Tanzania NTD Control Programme, Uppsala University, & TIBA Fellow, Dar es Salaam, Tanzania; Muheki Edridah; 16: Programme to Eliminate Lymphatic Filariasis, Ministry of Health, Kampala, Uganda; Shott Joseph; 17: Division of Neglected Tropical Diseases, Office of Infectious Diseases, Bureau for Global Health, USAID, Washington, DC, United States of America; Yevstigneyeva Violetta; 17: Division of Neglected Tropical Diseases, Office of Infectious Diseases, Bureau for Global Health, USAID, Washington, DC, United States of America; Ndayishimye Egide; 2: Global Health, Population, and Nutrition, FHI 360, Washington, DC, United States of America; Baker Margaret; 1: Global Health Division, RTI International, Washington, DC, United States of America; Kraemer John; 1: Global Health Division, RTI International, Washington, DC, United States of America, 18: Georgetown University, Washington, DC, United States of America; Brady Molly; 1: Global Health Division, RTI International, Washington, DC, United States of America",
-      "text": "Burgert-Brucker Clara R.; 1: Global Health Division, RTI International, Washington, DC, United States of America; Zoerhoff Kathryn L.; 1: Global Health Division, RTI International, Washington, DC, United States of America; Headland Maureen; 1: Global Health Division, RTI International, Washington, DC, United States of America, 2: Global Health, Population, and Nutrition, FHI 360, Washington, DC, United States of America; Shoemaker Erica A.; 1: Global Health Division, RTI International, Washington, DC, United States of America; Stelmach Rachel; 1: Global Health Division, RTI International, Washington, DC, United States of America; Karim Mohammad Jahirul; 3: Department of Disease Control, Ministry of Health and Family Welfare, Dhaka, Bangladesh; Batcho Wilfrid; 4: National Control Program of Communicable Diseases, Ministry of Health, Cotonou, Benin; Bougouma Clarisse; 5: Lymphatic Filariasis Elimination Program, Minist\u00e8re de la Sant\u00e9, Ouagadougou, Burkina Faso; Bougma Roland; 5: Lymphatic Filariasis Elimination Program, Minist\u00e8re de la Sant\u00e9, Ouagadougou, Burkina Faso; Benjamin Didier Biholong; 6: National Onchocerciasis and Lymphatic Filariasis Control Program, Ministry of Health, Yaounde, Cameroon; Georges Nko'Ayissi; 6: National Onchocerciasis and Lymphatic Filariasis Control Program, Ministry of Health, Yaounde, Cameroon; Marfo Benjamin; 7: Neglected Tropical Diseases Programme, Ghana Health Service, Accra, Ghana; Lemoine Jean Frantz; 8: Ministry of Health, Port-au-Prince, Haiti; Pangaribuan Helena Ullyartha; 9: National Institute Health Research & Development, Ministry of Health, Jakarta, Indonesia; Wijayanti Eksi; 9: National Institute Health Research & Development, Ministry of Health, Jakarta, Indonesia; Coulibaly Yaya Ibrahim; 10: Filariasis Unit, International Center of Excellence in Research, Faculty of Medicine and Odontostomatology, Bamako, Mali; Doumbia Salif Seriba; 10: Filariasis Unit, International Center of Excellence in Research, Faculty of Medicine and Odontostomatology, Bamako, Mali; Rimal Pradip; 11: Epidemiology and Disease Control Division, Department of Health Service, Kathmandu, Nepal; Salissou Adamou Bacthiri; 12: Programme Onchocercose et Filariose Lymphatique, Minist\u00e8re de la Sant\u00e9, Niamey, Niger; Bah Yukaba; 13: National Neglected Tropical Disease Program, Ministry of Health and Sanitation, Freetown, Sierra Leone; Mwingira Upendo; 14: Neglected Tropical Disease Control Programme, National Institute for Medical Research, Dar es Salaam, Tanzania; Nshala Andreas; 15: IMA World Health/Tanzania NTD Control Programme, Uppsala University, & TIBA Fellow, Dar es Salaam, Tanzania; Muheki Edridah; 16: Programme to Eliminate Lymphatic Filariasis, Ministry of Health, Kampala, Uganda; Shott Joseph; 17: Division of Neglected Tropical Diseases, Office of Infectious Diseases, Bureau for Global Health, USAID, Washington, DC, United States of America; Yevstigneyeva Violetta; 17: Division of Neglected Tropical Diseases, Office of Infectious Diseases, Bureau for Global Health, USAID, Washington, DC, United States of America; Ndayishimye Egide; 2: Global Health, Population, and Nutrition, FHI 360, Washington, DC, United States of America; Baker Margaret; 1: Global Health Division, RTI International, Washington, DC, United States of America; Kraemer John; 1: Global Health Division, RTI International, Washington, DC, United States of America, 18: Georgetown University, Washington, DC, United States of America; Brady Molly; 1: Global Health Division, RTI International, Washington, DC, United States of America"
-    },
-    {
-      "self_ref": "#/texts/2",
-      "parent": {
-        "$ref": "#/texts/0"
-      },
-      "children": [
-        {
-          "$ref": "#/texts/3"
-        }
-      ],
-      "label": "section_header",
-      "prov": [],
-      "orig": "Abstract",
-      "text": "Abstract",
-      "level": 1
-    },
-    {
-      "self_ref": "#/texts/3",
-      "parent": {
-        "$ref": "#/texts/2"
-      },
-      "children": [],
-      "label": "text",
-      "prov": [],
-      "orig": "Achieving elimination of lymphatic filariasis (LF) as a public health problem requires a minimum of five effective rounds of mass drug administration (MDA) and demonstrating low prevalence in subsequent assessments. The first assessments recommended by the World Health Organization (WHO) are sentinel and spot-check sites\u2014referred to as pre-transmission assessment surveys (pre-TAS)\u2014in each implementation unit after MDA. If pre-TAS shows that prevalence in each site has been lowered to less than 1% microfilaremia or less than 2% antigenemia, the implementation unit conducts a TAS to determine whether MDA can be stopped. Failure to pass pre-TAS means that further rounds of MDA are required. This study aims to understand factors influencing pre-TAS results using existing programmatic data from 554 implementation units, of which 74 (13%) failed, in 13 countries. Secondary data analysis was completed using existing data from Bangladesh, Benin, Burkina Faso, Cameroon, Ghana, Haiti, Indonesia, Mali, Nepal, Niger, Sierra Leone, Tanzania, and Uganda. Additional covariate data were obtained from spatial raster data sets. Bivariate analysis and multilinear regression were performed to establish potential relationships between variables and the pre-TAS result. Higher baseline prevalence and lower elevation were significant in the regression model. Variables statistically significantly associated with failure (p-value \u22640.05) in the bivariate analyses included baseline prevalence at or above 5% or 10%, use of Filariasis Test Strips (FTS), primary vector of Culex, treatment with diethylcarbamazine-albendazole, higher elevation, higher population density, higher enhanced vegetation index (EVI), higher annual rainfall, and 6 or more rounds of MDA. This paper reports for the first time factors associated with pre-TAS results from a multi-country analysis. This information can help countries more effectively forecast program activities, such as the potential need for more rounds of MDA, and prioritize resources to ensure adequate coverage of all persons in areas at highest risk of failing pre-TAS.Author summaryAchieving elimination of lymphatic filariasis (LF) as a public health problem requires a minimum of five rounds of mass drug administration (MDA) and being able to demonstrate low prevalence in several subsequent assessments. LF elimination programs implement sentinel and spot-check site assessments, called pre-TAS, to determine whether districts are eligible to implement more rigorous population-based surveys to determine whether MDA can be stopped or if further rounds are required. Reasons for failing pre-TAS are not well understood and have not previously been examined with data compiled from multiple countries. For this analysis, we analyzed data from routine USAID and WHO reports from Bangladesh, Benin, Burkina Faso, Cameroon, Ghana, Haiti, Indonesia, Mali, Nepal, Niger, Sierra Leone, Tanzania, and Uganda. In a model that included multiple variables, high baseline prevalence and lower elevation were significant. In models comparing only one variable to the outcome, the following were statistically significantly associated with failure: higher baseline prevalence at or above 5% or 10%, use of the FTS, primary vector of Culex, treatment with diethylcarbamazine-albendazole, lower elevation, higher population density, higher Enhanced Vegetation Index, higher annual rainfall, and six or more rounds of mass drug administration. These results can help national programs plan MDA more effectively, e.g., by focusing resources on areas with higher baseline prevalence and/or lower elevation.",
-      "text": "Achieving elimination of lymphatic filariasis (LF) as a public health problem requires a minimum of five effective rounds of mass drug administration (MDA) and demonstrating low prevalence in subsequent assessments. The first assessments recommended by the World Health Organization (WHO) are sentinel and spot-check sites\u2014referred to as pre-transmission assessment surveys (pre-TAS)\u2014in each implementation unit after MDA. If pre-TAS shows that prevalence in each site has been lowered to less than 1% microfilaremia or less than 2% antigenemia, the implementation unit conducts a TAS to determine whether MDA can be stopped. Failure to pass pre-TAS means that further rounds of MDA are required. This study aims to understand factors influencing pre-TAS results using existing programmatic data from 554 implementation units, of which 74 (13%) failed, in 13 countries. Secondary data analysis was completed using existing data from Bangladesh, Benin, Burkina Faso, Cameroon, Ghana, Haiti, Indonesia, Mali, Nepal, Niger, Sierra Leone, Tanzania, and Uganda. Additional covariate data were obtained from spatial raster data sets. Bivariate analysis and multilinear regression were performed to establish potential relationships between variables and the pre-TAS result. Higher baseline prevalence and lower elevation were significant in the regression model. Variables statistically significantly associated with failure (p-value \u22640.05) in the bivariate analyses included baseline prevalence at or above 5% or 10%, use of Filariasis Test Strips (FTS), primary vector of Culex, treatment with diethylcarbamazine-albendazole, higher elevation, higher population density, higher enhanced vegetation index (EVI), higher annual rainfall, and 6 or more rounds of MDA. This paper reports for the first time factors associated with pre-TAS results from a multi-country analysis. This information can help countries more effectively forecast program activities, such as the potential need for more rounds of MDA, and prioritize resources to ensure adequate coverage of all persons in areas at highest risk of failing pre-TAS.Author summaryAchieving elimination of lymphatic filariasis (LF) as a public health problem requires a minimum of five rounds of mass drug administration (MDA) and being able to demonstrate low prevalence in several subsequent assessments. LF elimination programs implement sentinel and spot-check site assessments, called pre-TAS, to determine whether districts are eligible to implement more rigorous population-based surveys to determine whether MDA can be stopped or if further rounds are required. Reasons for failing pre-TAS are not well understood and have not previously been examined with data compiled from multiple countries. For this analysis, we analyzed data from routine USAID and WHO reports from Bangladesh, Benin, Burkina Faso, Cameroon, Ghana, Haiti, Indonesia, Mali, Nepal, Niger, Sierra Leone, Tanzania, and Uganda. In a model that included multiple variables, high baseline prevalence and lower elevation were significant. In models comparing only one variable to the outcome, the following were statistically significantly associated with failure: higher baseline prevalence at or above 5% or 10%, use of the FTS, primary vector of Culex, treatment with diethylcarbamazine-albendazole, lower elevation, higher population density, higher Enhanced Vegetation Index, higher annual rainfall, and six or more rounds of mass drug administration. These results can help national programs plan MDA more effectively, e.g., by focusing resources on areas with higher baseline prevalence and/or lower elevation."
-    },
-    {
-      "self_ref": "#/texts/4",
-      "parent": {
-        "$ref": "#/texts/0"
-      },
-      "children": [
-        {
-          "$ref": "#/texts/5"
-        },
-        {
-          "$ref": "#/texts/6"
-        },
-        {
-          "$ref": "#/texts/7"
-        },
-        {
-          "$ref": "#/texts/8"
-        },
-        {
-          "$ref": "#/texts/9"
-        }
-      ],
-      "label": "section_header",
-      "prov": [],
-      "orig": "Introduction",
-      "text": "Introduction",
-      "level": 1
-    },
-    {
-      "self_ref": "#/texts/5",
-      "parent": {
-        "$ref": "#/texts/4"
-      },
-      "children": [],
-      "label": "text",
-      "prov": [],
-      "orig": "Lymphatic filariasis (LF), a disease caused by parasitic worms transmitted to humans by mosquito bite, manifests in disabling and stigmatizing chronic conditions including lymphedema and hydrocele. To eliminate LF as a public health problem, the World Health Organization (WHO) recommends two strategies: reducing transmission through annual mass drug administration (MDA) and reducing suffering through ensuring the availability of morbidity management and disability prevention services to all patients [1]. For the first strategy, eliminating LF as a public health problem is defined as a \u2018reduction in measurable prevalence in infection in endemic areas below a target threshold at which further transmission is considered unlikely even in the absence of MDA\u2019 [2]. As of 2018, 14 countries have eliminated LF as a public health problem while 58 countries remain endemic for LF [3].",
-      "text": "Lymphatic filariasis (LF), a disease caused by parasitic worms transmitted to humans by mosquito bite, manifests in disabling and stigmatizing chronic conditions including lymphedema and hydrocele. To eliminate LF as a public health problem, the World Health Organization (WHO) recommends two strategies: reducing transmission through annual mass drug administration (MDA) and reducing suffering through ensuring the availability of morbidity management and disability prevention services to all patients [1]. For the first strategy, eliminating LF as a public health problem is defined as a \u2018reduction in measurable prevalence in infection in endemic areas below a target threshold at which further transmission is considered unlikely even in the absence of MDA\u2019 [2]. As of 2018, 14 countries have eliminated LF as a public health problem while 58 countries remain endemic for LF [3]."
-    },
-    {
-      "self_ref": "#/texts/6",
-      "parent": {
-        "$ref": "#/texts/4"
-      },
-      "children": [],
-      "label": "text",
-      "prov": [],
-      "orig": "The road to elimination as a public health problem has several milestones. First, where LF prevalence at baseline has exceeded 1% as measured either through microfilaremia (Mf) or antigenemia (Ag), MDA is implemented and treatment coverage is measured in all implementation units, which usually correspond to districts. Implementation units must complete at least five rounds of \u2018effective\u2019 treatment, i.e. treatment with a minimum coverage of 65% of the total population. Then, WHO recommends sentinel and spot-check site assessments\u2014referred to as pre-transmission assessment surveys (pre-TAS)\u2014in each implementation unit to determine whether prevalence in each site is less than 1% Mf or less than 2% Ag [4]. Next, if these thresholds are met, national programs can progress to the first transmission assessment survey (TAS). The TAS is a population-based cluster or systematic survey of six- and seven-year-old children to assess whether transmission has fallen below the threshold at which infection is believed to persist. TAS is conducted at least three times, with two years between each survey. TAS 1 results determine if it is appropriate to stop MDA or whether further rounds are required. Finally, when TAS 2 and 3 also fall below the set threshold in every endemic implementation unit nationwide and morbidity criteria have been fulfilled, the national program submits a dossier to WHO requesting that elimination be officially validated.",
-      "text": "The road to elimination as a public health problem has several milestones. First, where LF prevalence at baseline has exceeded 1% as measured either through microfilaremia (Mf) or antigenemia (Ag), MDA is implemented and treatment coverage is measured in all implementation units, which usually correspond to districts. Implementation units must complete at least five rounds of \u2018effective\u2019 treatment, i.e. treatment with a minimum coverage of 65% of the total population. Then, WHO recommends sentinel and spot-check site assessments\u2014referred to as pre-transmission assessment surveys (pre-TAS)\u2014in each implementation unit to determine whether prevalence in each site is less than 1% Mf or less than 2% Ag [4]. Next, if these thresholds are met, national programs can progress to the first transmission assessment survey (TAS). The TAS is a population-based cluster or systematic survey of six- and seven-year-old children to assess whether transmission has fallen below the threshold at which infection is believed to persist. TAS is conducted at least three times, with two years between each survey. TAS 1 results determine if it is appropriate to stop MDA or whether further rounds are required. Finally, when TAS 2 and 3 also fall below the set threshold in every endemic implementation unit nationwide and morbidity criteria have been fulfilled, the national program submits a dossier to WHO requesting that elimination be officially validated."
-    },
-    {
-      "self_ref": "#/texts/7",
-      "parent": {
-        "$ref": "#/texts/4"
-      },
-      "children": [],
-      "label": "text",
-      "prov": [],
-      "orig": "Pre-TAS include at least one sentinel and one spot-check site per one million population. Sentinel sites are established at the start of the program in villages where LF prevalence was believed to be relatively high. Spot-check sites are villages not previously tested but purposively selected as potentially high-risk areas due to original high prevalence, low coverage during MDA, high vector density, or other factors [4]. At least six months after MDA implementation, data are collected from a convenience sample of at least 300 people over five years old in each site. Originally, Mf was recommended as the indicator of choice for pre-TAS, assessed by blood smears taken at the time of peak parasite periodicity [4]. WHO later recommended the use of circulating filarial antigen rapid diagnostic tests, BinaxNow immunochromatographic card tests (ICTs), and after 2016, Alere Filariasis Test Strips (FTS), because they are more sensitive, easier to implement, and more flexible about time of day that blood can be taken [5].",
-      "text": "Pre-TAS include at least one sentinel and one spot-check site per one million population. Sentinel sites are established at the start of the program in villages where LF prevalence was believed to be relatively high. Spot-check sites are villages not previously tested but purposively selected as potentially high-risk areas due to original high prevalence, low coverage during MDA, high vector density, or other factors [4]. At least six months after MDA implementation, data are collected from a convenience sample of at least 300 people over five years old in each site. Originally, Mf was recommended as the indicator of choice for pre-TAS, assessed by blood smears taken at the time of peak parasite periodicity [4]. WHO later recommended the use of circulating filarial antigen rapid diagnostic tests, BinaxNow immunochromatographic card tests (ICTs), and after 2016, Alere Filariasis Test Strips (FTS), because they are more sensitive, easier to implement, and more flexible about time of day that blood can be taken [5]."
-    },
-    {
-      "self_ref": "#/texts/8",
-      "parent": {
-        "$ref": "#/texts/4"
-      },
-      "children": [],
-      "label": "text",
-      "prov": [],
-      "orig": "When a country fails to meet the established thresholds in a pre-TAS, they must implement at least two more rounds of MDA. National programs need to forecast areas that might fail pre-TAS and need repeated MDA, so that they can inform the community and district decision-makers of the implications of pre-TAS failure, including the need for continued MDA to lower prevalence effectively. In addition, financial and human resources must be made available for ordering drugs, distributing drugs, supervision and monitoring to implement the further MDA rounds. Ordering drugs and providing MDA budgets often need to be completed before the pre-TAS are implemented, so contingency planning and funding are important to ensure rounds of MDA are not missed.",
-      "text": "When a country fails to meet the established thresholds in a pre-TAS, they must implement at least two more rounds of MDA. National programs need to forecast areas that might fail pre-TAS and need repeated MDA, so that they can inform the community and district decision-makers of the implications of pre-TAS failure, including the need for continued MDA to lower prevalence effectively. In addition, financial and human resources must be made available for ordering drugs, distributing drugs, supervision and monitoring to implement the further MDA rounds. Ordering drugs and providing MDA budgets often need to be completed before the pre-TAS are implemented, so contingency planning and funding are important to ensure rounds of MDA are not missed."
-    },
-    {
-      "self_ref": "#/texts/9",
-      "parent": {
-        "$ref": "#/texts/4"
-      },
-      "children": [],
-      "label": "text",
-      "prov": [],
-      "orig": "This study aims to understand which factors are associated with the need for additional rounds of MDA as identified by pre-TAS results using programmatic data from 13 countries. The factors associated with failing pre-TAS are not well understood and have not previously been examined at a multi-country scale in the literature. We examine the association between pre-TAS failure and baseline prevalence, parasites, environmental factors, MDA implementation, and pre-TAS implementation. Understanding determinants of pre-TAS failure will help countries identify where elimination may be most difficult and prioritize the use of limited LF elimination resources.",
-      "text": "This study aims to understand which factors are associated with the need for additional rounds of MDA as identified by pre-TAS results using programmatic data from 13 countries. The factors associated with failing pre-TAS are not well understood and have not previously been examined at a multi-country scale in the literature. We examine the association between pre-TAS failure and baseline prevalence, parasites, environmental factors, MDA implementation, and pre-TAS implementation. Understanding determinants of pre-TAS failure will help countries identify where elimination may be most difficult and prioritize the use of limited LF elimination resources."
-    },
-    {
-      "self_ref": "#/texts/10",
-      "parent": {
-        "$ref": "#/texts/0"
-      },
-      "children": [
-        {
-          "$ref": "#/texts/11"
-        },
-        {
-          "$ref": "#/texts/12"
-        },
-        {
-          "$ref": "#/texts/13"
-        },
-        {
-          "$ref": "#/texts/15"
-        },
-        {
-          "$ref": "#/texts/31"
-        },
-        {
-          "$ref": "#/texts/33"
-        }
-      ],
-      "label": "section_header",
-      "prov": [],
-      "orig": "Methods",
-      "text": "Methods",
-      "level": 1
-    },
-    {
-      "self_ref": "#/texts/11",
-      "parent": {
-        "$ref": "#/texts/10"
-      },
-      "children": [],
-      "label": "text",
-      "prov": [],
-      "orig": "This is a secondary data analysis using existing data, collected for programmatic purposes. Data for this analysis come from 568 districts in 13 countries whose LF elimination programs were supported by the United States Agency for International Development (USAID) through the ENVISION project, led by RTI International, and the END in Africa and END in Asia projects, led by FHI 360. These countries are Bangladesh, Benin, Burkina Faso, Cameroon, Ghana, Haiti, Indonesia, Mali, Nepal, Niger, Sierra Leone, Tanzania, and Uganda. The data represent all pre-TAS funded by USAID from 2012 to 2017 and, in some cases, surveys funded by host government or other non-United States government funders. Because pre-TAS data were collected as part of routine program activities in most countries, in general, ethical clearance was not sought for these surveys. Our secondary analysis only included the aggregated survey results and therefore did not constitute human subjects research; no ethical approval was required.",
-      "text": "This is a secondary data analysis using existing data, collected for programmatic purposes. Data for this analysis come from 568 districts in 13 countries whose LF elimination programs were supported by the United States Agency for International Development (USAID) through the ENVISION project, led by RTI International, and the END in Africa and END in Asia projects, led by FHI 360. These countries are Bangladesh, Benin, Burkina Faso, Cameroon, Ghana, Haiti, Indonesia, Mali, Nepal, Niger, Sierra Leone, Tanzania, and Uganda. The data represent all pre-TAS funded by USAID from 2012 to 2017 and, in some cases, surveys funded by host government or other non-United States government funders. Because pre-TAS data were collected as part of routine program activities in most countries, in general, ethical clearance was not sought for these surveys. Our secondary analysis only included the aggregated survey results and therefore did not constitute human subjects research; no ethical approval was required."
-    },
-    {
-      "self_ref": "#/texts/12",
-      "parent": {
-        "$ref": "#/texts/10"
-      },
-      "children": [],
-      "label": "text",
-      "prov": [],
-      "orig": "Building on previous work, we delineated five domains of variables that could influence pre-TAS outcomes: prevalence, agent, environment, MDA, and pre-TAS implementation (Table 1) [6\u20138]. We prioritized key concepts that could be measured through our data or captured through publicly available global geospatial data sets.",
-      "text": "Building on previous work, we delineated five domains of variables that could influence pre-TAS outcomes: prevalence, agent, environment, MDA, and pre-TAS implementation (Table 1) [6\u20138]. We prioritized key concepts that could be measured through our data or captured through publicly available global geospatial data sets."
-    },
-    {
-      "self_ref": "#/texts/13",
-      "parent": {
-        "$ref": "#/texts/10"
-      },
-      "children": [
-        {
-          "$ref": "#/texts/14"
-        }
-      ],
-      "label": "section_header",
-      "prov": [],
-      "orig": "Data sources",
-      "text": "Data sources",
-      "level": 1
-    },
-    {
-      "self_ref": "#/texts/14",
-      "parent": {
-        "$ref": "#/texts/13"
-      },
-      "children": [],
-      "label": "text",
-      "prov": [],
-      "orig": "Information on baseline prevalence, MDA coverage, the number of MDA rounds, and pre-TAS information (month and year of survey, district, site name, and outcome) was gathered through regular reporting for the USAID-funded NTD programs (ENVISION, END in Africa, and END in Asia). These data were augmented by other reporting data such as the country\u2019s dossier data annexes, the WHO Preventive Chemotherapy and Transmission Control Databank, and WHO reporting forms. Data were then reviewed by country experts, including the Ministry of Health program staff and implementing program staff, and updated as necessary. Data on vectors were also obtained from country experts. The district geographic boundaries were matched to geospatial shapefiles from the ENVISION project geospatial data repository, while other geospatial data were obtained through publicly available sources (Table 1).",
-      "text": "Information on baseline prevalence, MDA coverage, the number of MDA rounds, and pre-TAS information (month and year of survey, district, site name, and outcome) was gathered through regular reporting for the USAID-funded NTD programs (ENVISION, END in Africa, and END in Asia). These data were augmented by other reporting data such as the country\u2019s dossier data annexes, the WHO Preventive Chemotherapy and Transmission Control Databank, and WHO reporting forms. Data were then reviewed by country experts, including the Ministry of Health program staff and implementing program staff, and updated as necessary. Data on vectors were also obtained from country experts. The district geographic boundaries were matched to geospatial shapefiles from the ENVISION project geospatial data repository, while other geospatial data were obtained through publicly available sources (Table 1)."
-    },
-    {
-      "self_ref": "#/texts/15",
-      "parent": {
-        "$ref": "#/texts/10"
-      },
-      "children": [
-        {
-          "$ref": "#/texts/16"
-        },
-        {
-          "$ref": "#/texts/17"
-        },
-        {
-          "$ref": "#/texts/18"
-        },
-        {
-          "$ref": "#/texts/20"
-        },
-        {
-          "$ref": "#/texts/22"
-        },
-        {
-          "$ref": "#/texts/26"
-        },
-        {
-          "$ref": "#/texts/29"
-        }
-      ],
-      "label": "section_header",
-      "prov": [],
-      "orig": "Outcome and covariate variables",
-      "text": "Outcome and covariate variables",
-      "level": 1
-    },
-    {
-      "self_ref": "#/texts/16",
-      "parent": {
-        "$ref": "#/texts/15"
-      },
-      "children": [],
-      "label": "text",
-      "prov": [],
-      "orig": "The outcome of interest for this analysis was whether a district passed or failed the pre-TAS. Failure was defined as any district that had at least one sentinel or spot-check site with a prevalence higher than or equal to 1% Mf or 2% Ag [4].",
-      "text": "The outcome of interest for this analysis was whether a district passed or failed the pre-TAS. Failure was defined as any district that had at least one sentinel or spot-check site with a prevalence higher than or equal to 1% Mf or 2% Ag [4]."
-    },
-    {
-      "self_ref": "#/texts/17",
-      "parent": {
-        "$ref": "#/texts/15"
-      },
-      "children": [],
-      "label": "text",
-      "prov": [],
-      "orig": "Potential covariates were derived from the available data for each factor in the domain groups listed in Table 1. New dichotomous variables were created for all variables that had multiple categories or were continuous for ease of interpretation in models and use in program decision-making. Cut-points for continuous variables were derived from either a priori knowledge or through exploratory analysis considering the mean or median value of the dataset, looking to create two groups of similar size with logical cut-points (e.g. rounding numbers to whole numbers). All the variables derived from publicly available global spatial raster datasets were summarized to the district level in ArcGIS Pro using the \u201czonal statistics\u201d tool. The final output used the continuous value measuring the mean pixel value for the district for all variables except geographic area. Categories for each variable were determined by selecting the mean or median dataset value or cut-off used in other relevant literature [7]. The following section describes the variables that were included in the final analysis and the final categorizations used.",
-      "text": "Potential covariates were derived from the available data for each factor in the domain groups listed in Table 1. New dichotomous variables were created for all variables that had multiple categories or were continuous for ease of interpretation in models and use in program decision-making. Cut-points for continuous variables were derived from either a priori knowledge or through exploratory analysis considering the mean or median value of the dataset, looking to create two groups of similar size with logical cut-points (e.g. rounding numbers to whole numbers). All the variables derived from publicly available global spatial raster datasets were summarized to the district level in ArcGIS Pro using the \u201czonal statistics\u201d tool. The final output used the continuous value measuring the mean pixel value for the district for all variables except geographic area. Categories for each variable were determined by selecting the mean or median dataset value or cut-off used in other relevant literature [7]. The following section describes the variables that were included in the final analysis and the final categorizations used."
-    },
-    {
-      "self_ref": "#/texts/18",
-      "parent": {
-        "$ref": "#/texts/15"
-      },
-      "children": [
-        {
-          "$ref": "#/texts/19"
-        }
-      ],
-      "label": "section_header",
-      "prov": [],
-      "orig": "Baseline prevalence",
-      "text": "Baseline prevalence",
-      "level": 1
-    },
-    {
-      "self_ref": "#/texts/19",
-      "parent": {
-        "$ref": "#/texts/18"
-      },
-      "children": [],
-      "label": "text",
-      "prov": [],
-      "orig": "Baseline prevalence can be assumed as a proxy for local transmission conditions [14] and correlates with prevalence after MDA [14\u201320]. Baseline prevalence for each district was measured by either blood smears to measure Mf or rapid diagnostic tests to measure Ag. Other studies have modeled Mf and Ag prevalence separately, due to lack of a standardized correlation between the two, especially at pre-MDA levels [21,22]. However, because WHO mapping guidance states that MDA is required if either Mf or Ag is \u22651% and there were not enough data to model each separately, we combined baseline prevalence values regardless of diagnostic test used. We created two variables for use in the analysis (1) using the cut-off of <5% or \u22655% (dataset median value of 5%) and (2) using the cut-off of <10% or \u226510%.",
-      "text": "Baseline prevalence can be assumed as a proxy for local transmission conditions [14] and correlates with prevalence after MDA [14\u201320]. Baseline prevalence for each district was measured by either blood smears to measure Mf or rapid diagnostic tests to measure Ag. Other studies have modeled Mf and Ag prevalence separately, due to lack of a standardized correlation between the two, especially at pre-MDA levels [21,22]. However, because WHO mapping guidance states that MDA is required if either Mf or Ag is \u22651% and there were not enough data to model each separately, we combined baseline prevalence values regardless of diagnostic test used. We created two variables for use in the analysis (1) using the cut-off of <5% or \u22655% (dataset median value of 5%) and (2) using the cut-off of <10% or \u226510%."
-    },
-    {
-      "self_ref": "#/texts/20",
-      "parent": {
-        "$ref": "#/texts/15"
-      },
-      "children": [
-        {
-          "$ref": "#/texts/21"
-        }
-      ],
-      "label": "section_header",
-      "prov": [],
-      "orig": "Agent",
-      "text": "Agent",
-      "level": 1
-    },
-    {
-      "self_ref": "#/texts/21",
-      "parent": {
-        "$ref": "#/texts/20"
-      },
-      "children": [],
-      "label": "text",
-      "prov": [],
-      "orig": "In terms of differences in transmission dynamics by agent, research has shown that Brugia spp. are more susceptible to the anti-filarial drug regimens than Wuchereria bancrofti parasites [23]. Thus, we combined districts reporting B. malayi and B. timori and compared them to areas with W. bancrofti or mixed parasites. Two variables from other domains were identified in exploratory analyses to be highly colinear with the parasite, and thus we considered them in the same group of variables for the final regression models. These were variables delineating vectors (Anopheles or Mansonia compared to Culex) from the environmental domain and drug package [ivermectin-albendazole (IVM-ALB) compared to diethylcarbamazine-albendazole (DEC-ALB)] from the MDA domain.",
-      "text": "In terms of differences in transmission dynamics by agent, research has shown that Brugia spp. are more susceptible to the anti-filarial drug regimens than Wuchereria bancrofti parasites [23]. Thus, we combined districts reporting B. malayi and B. timori and compared them to areas with W. bancrofti or mixed parasites. Two variables from other domains were identified in exploratory analyses to be highly colinear with the parasite, and thus we considered them in the same group of variables for the final regression models. These were variables delineating vectors (Anopheles or Mansonia compared to Culex) from the environmental domain and drug package [ivermectin-albendazole (IVM-ALB) compared to diethylcarbamazine-albendazole (DEC-ALB)] from the MDA domain."
-    },
-    {
-      "self_ref": "#/texts/22",
-      "parent": {
-        "$ref": "#/texts/15"
-      },
-      "children": [
-        {
-          "$ref": "#/texts/23"
-        },
-        {
-          "$ref": "#/texts/24"
-        },
-        {
-          "$ref": "#/texts/25"
-        }
-      ],
-      "label": "section_header",
-      "prov": [],
-      "orig": "Environment",
-      "text": "Environment",
-      "level": 1
-    },
-    {
-      "self_ref": "#/texts/23",
-      "parent": {
-        "$ref": "#/texts/22"
-      },
-      "children": [],
-      "label": "text",
-      "prov": [],
-      "orig": "LF transmission intensity is influenced by differing vector transmission dynamics, including vector biting rates and competence, and the number of individuals with microfilaria [21,24,25]. Since vector data are not always available, previous studies have explored whether environmental variables associated with vector density, such as elevation, rainfall, and temperature, can be used to predict LF prevalence [8,21,26\u201331]. We included the district area and elevation in meters as geographic variables potentially associated with transmission intensity. In addition, within the climate factor, we included Enhanced Vegetation Index (EVI) and rainfall variables. EVI measures vegetation levels, or \u201cgreenness,\u201d where a higher index value indicates a higher level of \u201cgreenness.\u201d",
-      "text": "LF transmission intensity is influenced by differing vector transmission dynamics, including vector biting rates and competence, and the number of individuals with microfilaria [21,24,25]. Since vector data are not always available, previous studies have explored whether environmental variables associated with vector density, such as elevation, rainfall, and temperature, can be used to predict LF prevalence [8,21,26\u201331]. We included the district area and elevation in meters as geographic variables potentially associated with transmission intensity. In addition, within the climate factor, we included Enhanced Vegetation Index (EVI) and rainfall variables. EVI measures vegetation levels, or \u201cgreenness,\u201d where a higher index value indicates a higher level of \u201cgreenness.\u201d"
-    },
-    {
-      "self_ref": "#/texts/24",
-      "parent": {
-        "$ref": "#/texts/22"
-      },
-      "children": [],
-      "label": "text",
-      "prov": [],
-      "orig": "We included the socio-economic variable of population density, as it has been positively associated with LF prevalence in some studies [8,27,29], but no significant association has been found in others [30]. Population density could be correlated with vector, as in eastern African countries LF is mostly transmitted by Culex in urban areas and by Anopheles in rural areas [32]. Additionally, inclusion of the satellite imagery of nighttime lights data is another a proxy for socio-economic status [33].",
-      "text": "We included the socio-economic variable of population density, as it has been positively associated with LF prevalence in some studies [8,27,29], but no significant association has been found in others [30]. Population density could be correlated with vector, as in eastern African countries LF is mostly transmitted by Culex in urban areas and by Anopheles in rural areas [32]. Additionally, inclusion of the satellite imagery of nighttime lights data is another a proxy for socio-economic status [33]."
-    },
-    {
-      "self_ref": "#/texts/25",
-      "parent": {
-        "$ref": "#/texts/22"
-      },
-      "children": [],
-      "label": "text",
-      "prov": [],
-      "orig": "Finally, all or parts of districts that are co-endemic with onchocerciasis may have received multiple rounds of MDA with ivermectin before LF MDA started, which may have lowered LF prevalence in an area [34\u201336]. Thus, we included a categorical variable to distinguish if districts were co-endemic with onchocerciasis.",
-      "text": "Finally, all or parts of districts that are co-endemic with onchocerciasis may have received multiple rounds of MDA with ivermectin before LF MDA started, which may have lowered LF prevalence in an area [34\u201336]. Thus, we included a categorical variable to distinguish if districts were co-endemic with onchocerciasis."
-    },
-    {
-      "self_ref": "#/texts/26",
-      "parent": {
-        "$ref": "#/texts/15"
-      },
-      "children": [
-        {
-          "$ref": "#/texts/27"
-        },
-        {
-          "$ref": "#/texts/28"
-        }
-      ],
-      "label": "section_header",
-      "prov": [],
-      "orig": "MDA",
-      "text": "MDA",
-      "level": 1
-    },
-    {
-      "self_ref": "#/texts/27",
-      "parent": {
-        "$ref": "#/texts/26"
-      },
-      "children": [],
-      "label": "text",
-      "prov": [],
-      "orig": "Treatment effectiveness depends upon both drug efficacy (ability to kill adult worms, ability to kill Mf, drug resistance, drug quality) and implementation of MDA (coverage, compliance, number of rounds) [14,16]. Ivermectin is less effective against adult worms than DEC, and therefore it is likely that Ag reduction is slower in areas using ivermectin instead of DEC in MDA [37]. Models also have shown that MDA coverage affects prevalence, although coverage has been defined in various ways, such as median coverage, number of rounds, or individual compliance [14\u201316,20,38\u201340]. Furthermore, systematic non-compliance, or population sub-groups which consistently refuse to take medicines, has been shown to represent a threat to elimination [41,42].",
-      "text": "Treatment effectiveness depends upon both drug efficacy (ability to kill adult worms, ability to kill Mf, drug resistance, drug quality) and implementation of MDA (coverage, compliance, number of rounds) [14,16]. Ivermectin is less effective against adult worms than DEC, and therefore it is likely that Ag reduction is slower in areas using ivermectin instead of DEC in MDA [37]. Models also have shown that MDA coverage affects prevalence, although coverage has been defined in various ways, such as median coverage, number of rounds, or individual compliance [14\u201316,20,38\u201340]. Furthermore, systematic non-compliance, or population sub-groups which consistently refuse to take medicines, has been shown to represent a threat to elimination [41,42]."
-    },
-    {
-      "self_ref": "#/texts/28",
-      "parent": {
-        "$ref": "#/texts/26"
-      },
-      "children": [],
-      "label": "text",
-      "prov": [],
-      "orig": "We considered three approaches when analyzing the MDA data: median MDA coverage in the most recent 5 rounds, number of rounds with sufficient coverage in the most recent 5 rounds, and count of the total number of rounds. MDA coverage is considered sufficient at or above 65% of the total population who were reported to have ingested the drugs; this was used as the cut point for MDA median coverage for the most recent 5 rounds. The \u2018rounds of sufficient coverage\u2019 variable was categorized as having 2 or fewer rounds compared to 3 or more sufficient rounds. The \u2018total number of MDA rounds\u2019 variable was categorized at 5 or fewer rounds compared to 6 or more rounds ever documented in that district.",
-      "text": "We considered three approaches when analyzing the MDA data: median MDA coverage in the most recent 5 rounds, number of rounds with sufficient coverage in the most recent 5 rounds, and count of the total number of rounds. MDA coverage is considered sufficient at or above 65% of the total population who were reported to have ingested the drugs; this was used as the cut point for MDA median coverage for the most recent 5 rounds. The \u2018rounds of sufficient coverage\u2019 variable was categorized as having 2 or fewer rounds compared to 3 or more sufficient rounds. The \u2018total number of MDA rounds\u2019 variable was categorized at 5 or fewer rounds compared to 6 or more rounds ever documented in that district."
-    },
-    {
-      "self_ref": "#/texts/29",
-      "parent": {
-        "$ref": "#/texts/15"
-      },
-      "children": [
-        {
-          "$ref": "#/texts/30"
-        }
-      ],
-      "label": "section_header",
-      "prov": [],
-      "orig": "Pre-TAS implementation",
-      "text": "Pre-TAS implementation",
-      "level": 1
-    },
-    {
-      "self_ref": "#/texts/30",
-      "parent": {
-        "$ref": "#/texts/29"
-      },
-      "children": [],
-      "label": "text",
-      "prov": [],
-      "orig": "Pre-TAS results can be influenced by the implementation of the survey itself, including the use of a particular diagnostic test, the selection of sites, the timing of survey, and the appropriate application of methods for population recruitment and diagnostic test adminstration. We included two variables in the pre-TAS implementation domain: `type of diagnostic method used\u2019 and `diagnostic test used.\u2019 The \u2018type of diagnostic method used\u2019 variable categorized districts by either using Mf or Ag. The \u2018diagnostic test used\u2019 variable examined Mf (reference category) compared to ICT and compared to FTS (categorical variable with 3 values). This approach was used to compare each test to each other. Countries switched from ICT to FTS during 2016, while Mf testing continued to be used throughout the time period of study.",
-      "text": "Pre-TAS results can be influenced by the implementation of the survey itself, including the use of a particular diagnostic test, the selection of sites, the timing of survey, and the appropriate application of methods for population recruitment and diagnostic test adminstration. We included two variables in the pre-TAS implementation domain: `type of diagnostic method used\u2019 and `diagnostic test used.\u2019 The \u2018type of diagnostic method used\u2019 variable categorized districts by either using Mf or Ag. The \u2018diagnostic test used\u2019 variable examined Mf (reference category) compared to ICT and compared to FTS (categorical variable with 3 values). This approach was used to compare each test to each other. Countries switched from ICT to FTS during 2016, while Mf testing continued to be used throughout the time period of study."
-    },
-    {
-      "self_ref": "#/texts/31",
-      "parent": {
-        "$ref": "#/texts/10"
-      },
-      "children": [
-        {
-          "$ref": "#/texts/32"
-        }
-      ],
-      "label": "section_header",
-      "prov": [],
-      "orig": "Data inclusion criteria",
-      "text": "Data inclusion criteria",
-      "level": 1
-    },
-    {
-      "self_ref": "#/texts/32",
-      "parent": {
-        "$ref": "#/texts/31"
-      },
-      "children": [],
-      "label": "text",
-      "prov": [],
-      "orig": "The dataset, summarized at the district level, included information from 568 districts where a pre-TAS was being implemented for the first time. A total of 14 districts were removed from the final analysis due to missing data related to the following points: geospatial boundaries (4), baseline prevalence (4), and MDA coverage (6). The final analysis dataset had 554 districts.",
-      "text": "The dataset, summarized at the district level, included information from 568 districts where a pre-TAS was being implemented for the first time. A total of 14 districts were removed from the final analysis due to missing data related to the following points: geospatial boundaries (4), baseline prevalence (4), and MDA coverage (6). The final analysis dataset had 554 districts."
-    },
-    {
-      "self_ref": "#/texts/33",
-      "parent": {
-        "$ref": "#/texts/10"
-      },
-      "children": [
-        {
-          "$ref": "#/texts/34"
-        },
-        {
-          "$ref": "#/texts/35"
-        }
-      ],
-      "label": "section_header",
-      "prov": [],
-      "orig": "Statistical analysis and modeling",
-      "text": "Statistical analysis and modeling",
-      "level": 1
-    },
-    {
-      "self_ref": "#/texts/34",
-      "parent": {
-        "$ref": "#/texts/33"
-      },
-      "children": [],
-      "label": "text",
-      "prov": [],
-      "orig": "Statistical analysis and modeling were done with Stata MP 15.1 (College Station, TX). Descriptive statistics comparing various variables to the principle outcome were performed. Significant differences were identified using a chi-square test. A generalized linear model (GLM) with a log link and binomial error distribution\u2014which estimates relative risks\u2014was developed using forward stepwise modeling methods (called log-binomial model). Models with higher pseudo-r-squared and lower Akaike information criterion (AIC) were retained at each step. Pseudo-r-squared is a value between 0 and 1 with the higher the value, the better the model is at predicting the outcome of interest. AIC values are used to compare the relative quality of models compared to each other; in general, a lower value indicates a better model. Variables were tested by factor group. Once a variable was selected from the group, no other variable in that same group was eligible to be included in the final model due to issues of collinearity and small sample sizes. Interaction between terms in the model was tested after model selection, and interaction terms that modified the original terms\u2019 significance were included in the final model. Overall, the number of potential variables able to be included in the model remained low due to the relatively small number of failure results (13%) in the dataset. Furthermore, the models with more than 3 variables and one interaction term either were unstable (indicated by very large confidence interval widths) or did not improve the model by being significant predictors or by modifying other parameters already in the model. These models were at heightened risk of non-convergence; we limited the number of variables accordingly.",
-      "text": "Statistical analysis and modeling were done with Stata MP 15.1 (College Station, TX). Descriptive statistics comparing various variables to the principle outcome were performed. Significant differences were identified using a chi-square test. A generalized linear model (GLM) with a log link and binomial error distribution\u2014which estimates relative risks\u2014was developed using forward stepwise modeling methods (called log-binomial model). Models with higher pseudo-r-squared and lower Akaike information criterion (AIC) were retained at each step. Pseudo-r-squared is a value between 0 and 1 with the higher the value, the better the model is at predicting the outcome of interest. AIC values are used to compare the relative quality of models compared to each other; in general, a lower value indicates a better model. Variables were tested by factor group. Once a variable was selected from the group, no other variable in that same group was eligible to be included in the final model due to issues of collinearity and small sample sizes. Interaction between terms in the model was tested after model selection, and interaction terms that modified the original terms\u2019 significance were included in the final model. Overall, the number of potential variables able to be included in the model remained low due to the relatively small number of failure results (13%) in the dataset. Furthermore, the models with more than 3 variables and one interaction term either were unstable (indicated by very large confidence interval widths) or did not improve the model by being significant predictors or by modifying other parameters already in the model. These models were at heightened risk of non-convergence; we limited the number of variables accordingly."
-    },
-    {
-      "self_ref": "#/texts/35",
-      "parent": {
-        "$ref": "#/texts/33"
-      },
-      "children": [],
-      "label": "text",
-      "prov": [],
-      "orig": "Sensitivity analysis was performed for the final log-binomial model to test for the validity of results under different parameters by excluding some sub-sets of districts from the dataset and rerunning the model. This analysis was done to understand the robustness of the model when (1) excluding all districts in Cameroon, (2) including only districts in Africa, (3) including only districts with W. bancrofti parasite, and (4) including only districts with Anopheles as the primary vector. The sensitivity analysis excluding Cameroon was done for two reasons. First, Cameroon had the most pre-TAS results included, but no failures. Second, 70% of the Cameroon districts included in the analysis are co-endemic for loiasis. Given that diagnostic tests used in LF mapping have since been shown to cross-react with loiasis, there is some concern that these districts might not have been truly LF-endemic [43,44].",
-      "text": "Sensitivity analysis was performed for the final log-binomial model to test for the validity of results under different parameters by excluding some sub-sets of districts from the dataset and rerunning the model. This analysis was done to understand the robustness of the model when (1) excluding all districts in Cameroon, (2) including only districts in Africa, (3) including only districts with W. bancrofti parasite, and (4) including only districts with Anopheles as the primary vector. The sensitivity analysis excluding Cameroon was done for two reasons. First, Cameroon had the most pre-TAS results included, but no failures. Second, 70% of the Cameroon districts included in the analysis are co-endemic for loiasis. Given that diagnostic tests used in LF mapping have since been shown to cross-react with loiasis, there is some concern that these districts might not have been truly LF-endemic [43,44]."
-    },
-    {
-      "self_ref": "#/texts/36",
-      "parent": {
-        "$ref": "#/texts/0"
-      },
-      "children": [
-        {
-          "$ref": "#/texts/37"
-        },
-        {
-          "$ref": "#/texts/38"
-        },
-        {
-          "$ref": "#/texts/39"
-        },
-        {
-          "$ref": "#/texts/40"
-        },
-        {
-          "$ref": "#/texts/41"
-        },
-        {
-          "$ref": "#/texts/42"
-        }
-      ],
-      "label": "section_header",
-      "prov": [],
-      "orig": "Results",
-      "text": "Results",
-      "level": 1
-    },
-    {
-      "self_ref": "#/texts/37",
-      "parent": {
-        "$ref": "#/texts/36"
-      },
-      "children": [],
-      "label": "text",
-      "prov": [],
-      "orig": "The overall pre-TAS pass rate for the districts included in this analysis was 87% (74 failures in 554 districts). Nearly 40% of the 554 districts were from Cameroon (134) and Tanzania (87) (Fig 1). No districts in Bangladesh, Cameroon, Mali, or Uganda failed a pre-TAS in this data set; over 25% of districts in Burkina Faso, Ghana, Haiti, Nepal, and Sierra Leone failed pre-TAS in this data set. Baseline prevalence varied widely within and between the 13 countries. Fig 2 shows the highest, lowest, and median baseline prevalence in the study districts by country. Burkina Faso had the highest median baseline prevalence at 52% and Burkina Faso, Tanzania, and Ghana all had at least one district with a very high baseline of over 70%. In Mali, Indonesia, Benin, and Bangladesh, all districts had baseline prevalences below 20%.",
-      "text": "The overall pre-TAS pass rate for the districts included in this analysis was 87% (74 failures in 554 districts). Nearly 40% of the 554 districts were from Cameroon (134) and Tanzania (87) (Fig 1). No districts in Bangladesh, Cameroon, Mali, or Uganda failed a pre-TAS in this data set; over 25% of districts in Burkina Faso, Ghana, Haiti, Nepal, and Sierra Leone failed pre-TAS in this data set. Baseline prevalence varied widely within and between the 13 countries. Fig 2 shows the highest, lowest, and median baseline prevalence in the study districts by country. Burkina Faso had the highest median baseline prevalence at 52% and Burkina Faso, Tanzania, and Ghana all had at least one district with a very high baseline of over 70%. In Mali, Indonesia, Benin, and Bangladesh, all districts had baseline prevalences below 20%."
-    },
-    {
-      "self_ref": "#/texts/38",
-      "parent": {
-        "$ref": "#/texts/36"
-      },
-      "children": [],
-      "label": "text",
-      "prov": [],
-      "orig": "Fig 3 shows the unadjusted analysis for key variables by pre-TAS result. Variables statistically significantly associated with failure (p-value \u22640.05) included higher baseline prevalence at or above 5% or 10%, FTS diagnostic test, primary vector of Culex, treatment with DEC-ALB, higher elevation, higher population density, higher EVI, higher annual rainfall, and six or more rounds of MDA. Variables that were not significantly associated with pre-TAS failure included diagnostic method used (Ag or Mf), parasite, co-endemicity for onchocerciasis, median MDA coverage, and sufficient rounds of MDA.",
-      "text": "Fig 3 shows the unadjusted analysis for key variables by pre-TAS result. Variables statistically significantly associated with failure (p-value \u22640.05) included higher baseline prevalence at or above 5% or 10%, FTS diagnostic test, primary vector of Culex, treatment with DEC-ALB, higher elevation, higher population density, higher EVI, higher annual rainfall, and six or more rounds of MDA. Variables that were not significantly associated with pre-TAS failure included diagnostic method used (Ag or Mf), parasite, co-endemicity for onchocerciasis, median MDA coverage, and sufficient rounds of MDA."
-    },
-    {
-      "self_ref": "#/texts/39",
-      "parent": {
-        "$ref": "#/texts/36"
-      },
-      "children": [],
-      "label": "text",
-      "prov": [],
-      "orig": "The final log-binomial model included the variables of baseline prevalence \u226510%, the diagnostic test used (FTS and ICT), and elevation. The final model also included a significant interaction term between high baseline and diagnostic test used.",
-      "text": "The final log-binomial model included the variables of baseline prevalence \u226510%, the diagnostic test used (FTS and ICT), and elevation. The final model also included a significant interaction term between high baseline and diagnostic test used."
-    },
-    {
-      "self_ref": "#/texts/40",
-      "parent": {
-        "$ref": "#/texts/36"
-      },
-      "children": [],
-      "label": "text",
-      "prov": [],
-      "orig": "Fig 4 shows the risk ratio results with their corresponding confidence intervals. In a model with interaction between baseline and diagnostic test the baseline parameter was significant while diagnostic test and the interaction term were not. Districts with high baseline had a statistically significant (p-value \u22640.05) 2.52 times higher risk of failure (95% CI 1.37\u20134.64) compared to those with low baseline prevalence. The FTS diagnostic test or ICT diagnostic test alone were not significant nor was the interaction term. Additionally, districts with an elevation below 350 meters had a statistically significant (p-value \u22640.05) 3.07 times higher risk of failing pre-TAS (95% CI 1.95\u20134.83).",
-      "text": "Fig 4 shows the risk ratio results with their corresponding confidence intervals. In a model with interaction between baseline and diagnostic test the baseline parameter was significant while diagnostic test and the interaction term were not. Districts with high baseline had a statistically significant (p-value \u22640.05) 2.52 times higher risk of failure (95% CI 1.37\u20134.64) compared to those with low baseline prevalence. The FTS diagnostic test or ICT diagnostic test alone were not significant nor was the interaction term. Additionally, districts with an elevation below 350 meters had a statistically significant (p-value \u22640.05) 3.07 times higher risk of failing pre-TAS (95% CI 1.95\u20134.83)."
-    },
-    {
-      "self_ref": "#/texts/41",
-      "parent": {
-        "$ref": "#/texts/36"
-      },
-      "children": [],
-      "label": "text",
-      "prov": [],
-      "orig": "Sensitivity analyses were conducted using the same model with different subsets of the dataset including (1) all districts except for districts in Cameroon (134 total with no failures), (2) only districts in Africa, (3) only districts with W. bancrofti, and (4) only districts with Anopheles as primary vector. The results of the sensitivity models (Table 2) indicate an overall robust model. High baseline and lower elevation remained significant across all the models. The ICT diagnostic test used remains insignificant across all models. The FTS diagnostic test was positively significant in model 1 and negatively significant in model 4. The interaction term of baseline prevalence and FTS diagnostic test was significant in three models though the estimate was unstable in the W. bancrofti-only and Anopheles-only models (models 3 and 4 respectively), as signified by large confidence intervals.",
-      "text": "Sensitivity analyses were conducted using the same model with different subsets of the dataset including (1) all districts except for districts in Cameroon (134 total with no failures), (2) only districts in Africa, (3) only districts with W. bancrofti, and (4) only districts with Anopheles as primary vector. The results of the sensitivity models (Table 2) indicate an overall robust model. High baseline and lower elevation remained significant across all the models. The ICT diagnostic test used remains insignificant across all models. The FTS diagnostic test was positively significant in model 1 and negatively significant in model 4. The interaction term of baseline prevalence and FTS diagnostic test was significant in three models though the estimate was unstable in the W. bancrofti-only and Anopheles-only models (models 3 and 4 respectively), as signified by large confidence intervals."
-    },
-    {
-      "self_ref": "#/texts/42",
-      "parent": {
-        "$ref": "#/texts/36"
-      },
-      "children": [],
-      "label": "text",
-      "prov": [],
-      "orig": "Overall 74 districts in the dataset failed pre-TAS. Fig 5 summarizes the likelihood of failure by variable combinations identified in the log-binomial model. For those districts with a baseline prevalence \u226510% that used a FTS diagnostic test and have an average elevation below 350 meters (Combination C01), 87% of the 23 districts failed. Of districts with high baseline that used an ICT diagnostic test and have a low average elevation (C02) 45% failed. Overall, combinations with high baseline and low elevation C01, C02, and C04 accounted for 51% of all the failures (38 of 74).",
-      "text": "Overall 74 districts in the dataset failed pre-TAS. Fig 5 summarizes the likelihood of failure by variable combinations identified in the log-binomial model. For those districts with a baseline prevalence \u226510% that used a FTS diagnostic test and have an average elevation below 350 meters (Combination C01), 87% of the 23 districts failed. Of districts with high baseline that used an ICT diagnostic test and have a low average elevation (C02) 45% failed. Overall, combinations with high baseline and low elevation C01, C02, and C04 accounted for 51% of all the failures (38 of 74)."
-    },
-    {
-      "self_ref": "#/texts/43",
-      "parent": {
-        "$ref": "#/texts/0"
-      },
-      "children": [
-        {
-          "$ref": "#/texts/44"
-        },
-        {
-          "$ref": "#/texts/45"
-        },
-        {
-          "$ref": "#/texts/46"
-        },
-        {
-          "$ref": "#/texts/47"
-        },
-        {
-          "$ref": "#/texts/48"
-        },
-        {
-          "$ref": "#/texts/49"
-        },
-        {
-          "$ref": "#/texts/50"
-        },
-        {
-          "$ref": "#/texts/51"
-        },
-        {
-          "$ref": "#/texts/52"
-        }
-      ],
-      "label": "section_header",
-      "prov": [],
-      "orig": "Discussion",
-      "text": "Discussion",
-      "level": 1
-    },
-    {
-      "self_ref": "#/texts/44",
-      "parent": {
-        "$ref": "#/texts/43"
-      },
-      "children": [],
-      "label": "text",
-      "prov": [],
-      "orig": "This paper reports for the first time factors associated with pre-TAS results from a multi-country analysis. Variables significantly associated with failure were higher baseline prevalence and lower elevation. Districts with a baseline prevalence of 10% or more were at 2.52 times higher risk to fail pre-TAS in the final log-binomial model. In the bivariate analysis, baseline prevalence above 5% was also significantly more likely to fail compared to lower baselines, which indicates that the threshold for higher baseline prevalence may be as little as 5%, similar to what was found in Goldberg et al., which explored ecological and socioeconomic factors associated with TAS failure [7].",
-      "text": "This paper reports for the first time factors associated with pre-TAS results from a multi-country analysis. Variables significantly associated with failure were higher baseline prevalence and lower elevation. Districts with a baseline prevalence of 10% or more were at 2.52 times higher risk to fail pre-TAS in the final log-binomial model. In the bivariate analysis, baseline prevalence above 5% was also significantly more likely to fail compared to lower baselines, which indicates that the threshold for higher baseline prevalence may be as little as 5%, similar to what was found in Goldberg et al., which explored ecological and socioeconomic factors associated with TAS failure [7]."
-    },
-    {
-      "self_ref": "#/texts/45",
-      "parent": {
-        "$ref": "#/texts/43"
-      },
-      "children": [],
-      "label": "text",
-      "prov": [],
-      "orig": "Though diagnostic test used was selected for the final log-binomial model, neither category (FTS or ICT) were significant after interaction with high baseline. FTS alone is significant in the bivariate analysis compared to ICT or Mf. This result is not surprising given previous research which found that FTS was more sensitive than ICT [45].",
-      "text": "Though diagnostic test used was selected for the final log-binomial model, neither category (FTS or ICT) were significant after interaction with high baseline. FTS alone is significant in the bivariate analysis compared to ICT or Mf. This result is not surprising given previous research which found that FTS was more sensitive than ICT [45]."
-    },
-    {
-      "self_ref": "#/texts/46",
-      "parent": {
-        "$ref": "#/texts/43"
-      },
-      "children": [],
-      "label": "text",
-      "prov": [],
-      "orig": "Elevation was the only environmental domain variable selected for the final log-binomial model during the model selection process, with areas of lower elevation (<350m) found to be at 3.07 times higher risk to fail pre-TAS compared to districts with a higher elevation. Similar results related to elevation were found in previous studies [8,31], including Goldberg et al. [7], who used a cutoff of 200 meters. Elevation likely also encompasses some related environmental concepts, such as vector habitat, greenness (EVI), or rainfall, which impact vector chances of survival.",
-      "text": "Elevation was the only environmental domain variable selected for the final log-binomial model during the model selection process, with areas of lower elevation (<350m) found to be at 3.07 times higher risk to fail pre-TAS compared to districts with a higher elevation. Similar results related to elevation were found in previous studies [8,31], including Goldberg et al. [7], who used a cutoff of 200 meters. Elevation likely also encompasses some related environmental concepts, such as vector habitat, greenness (EVI), or rainfall, which impact vector chances of survival."
-    },
-    {
-      "self_ref": "#/texts/47",
-      "parent": {
-        "$ref": "#/texts/43"
-      },
-      "children": [],
-      "label": "text",
-      "prov": [],
-      "orig": "The small number of failures overall prevented the inclusion of a large number of variables in the final log-binomial model. However, other variables that are associated with failure as identified in the bivariate analyses, such as Culex vector, higher population density, higher EVI, higher rainfall and more rounds of MDA, should not be discounted when making programmatic decisions. Other models have shown that Culex as the predominant vector in a district, compared to Anopheles, results in more intense interventions needed to reach elimination [24,41]. Higher population density, which was also found to predict TAS failure [7], could be related to different vector species\u2019 transmission dynamics in urban areas, as well as the fact that MDAs are harder to conduct and to accurately measure in urban areas [46,47]. Both higher enhanced vegetation index (>0.3) and higher rainfall (>700 mm per year) contribute to expansion of vector habitats and population. Additionally, having more than five rounds of MDA before pre-TAS was also statistically significantly associated with higher failure in the bivariate analysis. It is unclear why higher number of rounds is associated with first pre-TAS failure given that other research has shown the opposite [15,16].",
-      "text": "The small number of failures overall prevented the inclusion of a large number of variables in the final log-binomial model. However, other variables that are associated with failure as identified in the bivariate analyses, such as Culex vector, higher population density, higher EVI, higher rainfall and more rounds of MDA, should not be discounted when making programmatic decisions. Other models have shown that Culex as the predominant vector in a district, compared to Anopheles, results in more intense interventions needed to reach elimination [24,41]. Higher population density, which was also found to predict TAS failure [7], could be related to different vector species\u2019 transmission dynamics in urban areas, as well as the fact that MDAs are harder to conduct and to accurately measure in urban areas [46,47]. Both higher enhanced vegetation index (>0.3) and higher rainfall (>700 mm per year) contribute to expansion of vector habitats and population. Additionally, having more than five rounds of MDA before pre-TAS was also statistically significantly associated with higher failure in the bivariate analysis. It is unclear why higher number of rounds is associated with first pre-TAS failure given that other research has shown the opposite [15,16]."
-    },
-    {
-      "self_ref": "#/texts/48",
-      "parent": {
-        "$ref": "#/texts/43"
-      },
-      "children": [],
-      "label": "text",
-      "prov": [],
-      "orig": "All other variables included in this analysis were not significantly associated with pre-TAS failure in our analysis. Goldberg et al. found Brugia spp. to be significantly associated with failure, but our results did not. This is likely due in part to the small number of districts with Brugia spp. in our dataset (6%) compared to 46% in the Goldberg et al. article [7]. MDA coverage levels were not significantly associated with pre-TAS failure, likely due to the lack of variance in the coverage data since WHO guidance dictates a minimum of five rounds of MDA with \u226565% epidemiological coverage to be eligible to implement pre-TAS. It should not be interpreted as evidence that high MDA coverage levels are not necessary to lower prevalence.",
-      "text": "All other variables included in this analysis were not significantly associated with pre-TAS failure in our analysis. Goldberg et al. found Brugia spp. to be significantly associated with failure, but our results did not. This is likely due in part to the small number of districts with Brugia spp. in our dataset (6%) compared to 46% in the Goldberg et al. article [7]. MDA coverage levels were not significantly associated with pre-TAS failure, likely due to the lack of variance in the coverage data since WHO guidance dictates a minimum of five rounds of MDA with \u226565% epidemiological coverage to be eligible to implement pre-TAS. It should not be interpreted as evidence that high MDA coverage levels are not necessary to lower prevalence."
-    },
-    {
-      "self_ref": "#/texts/49",
-      "parent": {
-        "$ref": "#/texts/43"
-      },
-      "children": [],
-      "label": "text",
-      "prov": [],
-      "orig": "Limitations to this study include data sources, excluded data, unreported data, misassigned data, and aggregation of results at the district level. The main data sources for this analysis were programmatic data, which may be less accurate than data collected specifically for research purposes. This is particularly true of the MDA coverage data, where some countries report data quality challenges in areas of instability or frequent population migration. Even though risk factors such as age, sex, compliance with MDA, and use of bednets have been shown to influence infection in individuals [40,48\u201350], we could not include factors from the human host domain in our analysis, as data sets were aggregated at site level and did not include individual information. In addition, vector control data were not universally available across the 13 countries and thus were not included in the analysis, despite studies showing that vector control has an impact on reducing LF prevalence [41,48,51\u201353].",
-      "text": "Limitations to this study include data sources, excluded data, unreported data, misassigned data, and aggregation of results at the district level. The main data sources for this analysis were programmatic data, which may be less accurate than data collected specifically for research purposes. This is particularly true of the MDA coverage data, where some countries report data quality challenges in areas of instability or frequent population migration. Even though risk factors such as age, sex, compliance with MDA, and use of bednets have been shown to influence infection in individuals [40,48\u201350], we could not include factors from the human host domain in our analysis, as data sets were aggregated at site level and did not include individual information. In addition, vector control data were not universally available across the 13 countries and thus were not included in the analysis, despite studies showing that vector control has an impact on reducing LF prevalence [41,48,51\u201353]."
-    },
-    {
-      "self_ref": "#/texts/50",
-      "parent": {
-        "$ref": "#/texts/43"
-      },
-      "children": [],
-      "label": "text",
-      "prov": [],
-      "orig": "Fourteen districts were excluded from the analysis because we were not able to obtain complete data for baseline prevalence, MDA coverage, or geographic boundaries. One of these districts had failed pre-TAS. It is likely these exclusions had minimal impact on the conclusions, as they represented a small number of districts and were similar to other included districts in terms of key variables. Unreported data could have occurred if a country conducted a pre-TAS that failed and then chose not to report it or reported it as a mid-term survey instead. Anecdotally, we know this has occurred occasionally, but we do not believe the practice to be widespread. Another limitation in the analysis is a potential misassignment of key variable values to a district due to changes in the district over time. Redistricting, changes in district size or composition, was pervasive in many countries during the study period; however, we expect the impact on the study outcome to be minimal, as the historical prevalence and MDA data from the \u201cmother\u201d districts are usually flowed down to these new \u201cdaughter\u201d districts. However, it is possible that the split created an area of higher prevalence or lower MDA coverage than would have been found on average in the overall larger original \u201cmother\u201d district. Finally, the aggregation or averaging of results to the district level may mask heterogeneity within districts. Though this impact could be substantial in districts with considerable heterogeneity, the use of median values and binomial variables mitigated the likelihood of skewing the data to extreme outliners in a district.",
-      "text": "Fourteen districts were excluded from the analysis because we were not able to obtain complete data for baseline prevalence, MDA coverage, or geographic boundaries. One of these districts had failed pre-TAS. It is likely these exclusions had minimal impact on the conclusions, as they represented a small number of districts and were similar to other included districts in terms of key variables. Unreported data could have occurred if a country conducted a pre-TAS that failed and then chose not to report it or reported it as a mid-term survey instead. Anecdotally, we know this has occurred occasionally, but we do not believe the practice to be widespread. Another limitation in the analysis is a potential misassignment of key variable values to a district due to changes in the district over time. Redistricting, changes in district size or composition, was pervasive in many countries during the study period; however, we expect the impact on the study outcome to be minimal, as the historical prevalence and MDA data from the \u201cmother\u201d districts are usually flowed down to these new \u201cdaughter\u201d districts. However, it is possible that the split created an area of higher prevalence or lower MDA coverage than would have been found on average in the overall larger original \u201cmother\u201d district. Finally, the aggregation or averaging of results to the district level may mask heterogeneity within districts. Though this impact could be substantial in districts with considerable heterogeneity, the use of median values and binomial variables mitigated the likelihood of skewing the data to extreme outliners in a district."
-    },
-    {
-      "self_ref": "#/texts/51",
-      "parent": {
-        "$ref": "#/texts/43"
-      },
-      "children": [],
-      "label": "text",
-      "prov": [],
-      "orig": "As this analysis used data across a variety of countries and epidemiological situations, the results are likely relevant for other districts in the countries examined and in countries with similar epidemiological backgrounds. In general, as more data become available at site level through the increased use of electronic data collection tools, further analysis of geospatial variables and associations will be possible. For example, with the availability of GPS coordinates, it may become possible to analyze outcomes by site and to link the geospatial environmental domain variables at a smaller scale. Future analyses also might seek to include information from coverage surveys or qualitative research studies on vector control interventions such as bed net usage, MDA compliance, population movement, and sub-populations that might be missed during MDA. Future pre-TAS using electronic data collection could include sex and age of individuals included in the survey.",
-      "text": "As this analysis used data across a variety of countries and epidemiological situations, the results are likely relevant for other districts in the countries examined and in countries with similar epidemiological backgrounds. In general, as more data become available at site level through the increased use of electronic data collection tools, further analysis of geospatial variables and associations will be possible. For example, with the availability of GPS coordinates, it may become possible to analyze outcomes by site and to link the geospatial environmental domain variables at a smaller scale. Future analyses also might seek to include information from coverage surveys or qualitative research studies on vector control interventions such as bed net usage, MDA compliance, population movement, and sub-populations that might be missed during MDA. Future pre-TAS using electronic data collection could include sex and age of individuals included in the survey."
-    },
-    {
-      "self_ref": "#/texts/52",
-      "parent": {
-        "$ref": "#/texts/43"
-      },
-      "children": [],
-      "label": "text",
-      "prov": [],
-      "orig": "This paper provides evidence from analysis of 554 districts and 13 countries on the factors associated with pre-TAS results. Baseline prevalence, elevation, vector, population density, EVI, rainfall, and number of MDA rounds were all significant in either bivariate or multivariate analyses. This information along with knowledge of local context can help countries more effectively plan pre-TAS and forecast program activities, such as the potential need for more than five rounds of MDA in areas with high baseline and/or low elevation.",
-      "text": "This paper provides evidence from analysis of 554 districts and 13 countries on the factors associated with pre-TAS results. Baseline prevalence, elevation, vector, population density, EVI, rainfall, and number of MDA rounds were all significant in either bivariate or multivariate analyses. This information along with knowledge of local context can help countries more effectively plan pre-TAS and forecast program activities, such as the potential need for more than five rounds of MDA in areas with high baseline and/or low elevation."
-    },
-    {
-      "self_ref": "#/texts/53",
-      "parent": {
-        "$ref": "#/texts/0"
-      },
-      "children": [
-        {
-          "$ref": "#/tables/0"
-        },
-        {
-          "$ref": "#/tables/1"
-        }
-      ],
-      "label": "section_header",
-      "prov": [],
-      "orig": "Tables",
-      "text": "Tables",
-      "level": 1
-    },
-    {
-      "self_ref": "#/texts/54",
-      "parent": {
-        "$ref": "#/body"
-      },
-      "children": [],
-      "label": "caption",
-      "prov": [],
-      "orig": "Table 1: Categorization of potential factors influencing pre-TAS results.",
-      "text": "Table 1: Categorization of potential factors influencing pre-TAS results."
-    },
-    {
-      "self_ref": "#/texts/55",
-      "parent": {
-        "$ref": "#/body"
-      },
-      "children": [],
-      "label": "caption",
-      "prov": [],
-      "orig": "Table 2: Adjusted risk ratios for pre-TAS failure from log-binomial model sensitivity analysis.",
-      "text": "Table 2: Adjusted risk ratios for pre-TAS failure from log-binomial model sensitivity analysis."
-    },
-    {
-      "self_ref": "#/texts/56",
-      "parent": {
-        "$ref": "#/texts/0"
-      },
-      "children": [
-        {
-          "$ref": "#/pictures/0"
-        },
-        {
-          "$ref": "#/pictures/1"
-        },
-        {
-          "$ref": "#/pictures/2"
-        },
-        {
-          "$ref": "#/pictures/3"
-        },
-        {
-          "$ref": "#/pictures/4"
-        }
-      ],
-      "label": "section_header",
-      "prov": [],
-      "orig": "Figures",
-      "text": "Figures",
-      "level": 1
-    },
-    {
-      "self_ref": "#/texts/57",
-      "parent": {
-        "$ref": "#/body"
-      },
-      "children": [],
-      "label": "caption",
-      "prov": [],
-      "orig": "Fig 1: Number of pre-TAS by country.",
-      "text": "Fig 1: Number of pre-TAS by country."
-    },
-    {
-      "self_ref": "#/texts/58",
-      "parent": {
-        "$ref": "#/body"
-      },
-      "children": [],
-      "label": "caption",
-      "prov": [],
-      "orig": "Fig 2: District-level baseline prevalence by country.",
-      "text": "Fig 2: District-level baseline prevalence by country."
-    },
-    {
-      "self_ref": "#/texts/59",
-      "parent": {
-        "$ref": "#/body"
-      },
-      "children": [],
-      "label": "caption",
-      "prov": [],
-      "orig": "Fig 3: Percent pre-TAS failure by each characteristic (unadjusted).",
-      "text": "Fig 3: Percent pre-TAS failure by each characteristic (unadjusted)."
-    },
-    {
-      "self_ref": "#/texts/60",
-      "parent": {
-        "$ref": "#/body"
-      },
-      "children": [],
-      "label": "caption",
-      "prov": [],
-      "orig": "Fig 4: Adjusted risk ratios for pre-TAS failure with 95% Confidence Interval from log-binomial model.",
-      "text": "Fig 4: Adjusted risk ratios for pre-TAS failure with 95% Confidence Interval from log-binomial model."
-    },
-    {
-      "self_ref": "#/texts/61",
-      "parent": {
-        "$ref": "#/body"
-      },
-      "children": [],
-      "label": "caption",
-      "prov": [],
-      "orig": "Fig 5: Analysis of failures by model combinations.",
-      "text": "Fig 5: Analysis of failures by model combinations."
-    },
-    {
-      "self_ref": "#/texts/62",
-      "parent": {
-        "$ref": "#/texts/0"
-      },
-      "children": [
-        {
-          "$ref": "#/groups/0"
-        }
-      ],
-      "label": "section_header",
-      "prov": [],
-      "orig": "References",
-      "text": "References",
-      "level": 1
-    },
-    {
-      "self_ref": "#/texts/63",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "World Health Organization. Lymphatic filariasis: progress report 2000\u20132009 and strategic plan 2010\u20132020. Geneva; 2010. ",
-      "text": "World Health Organization. Lymphatic filariasis: progress report 2000\u20132009 and strategic plan 2010\u20132020. Geneva; 2010. ",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/64",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "World Health Organization. Validation of elimination of lymphatic filariasis as a public health problem. Geneva; 2017. ",
-      "text": "World Health Organization. Validation of elimination of lymphatic filariasis as a public health problem. Geneva; 2017. ",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/65",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Global programme to eliminate lymphatic filariasis: progress report, 2018. Wkly Epidemiol Rec (2019)",
-      "text": "Global programme to eliminate lymphatic filariasis: progress report, 2018. Wkly Epidemiol Rec (2019)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/66",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "World Health Organization. Global programme to eliminate lymphatic filariasis: monitoring and epidemiological assessment of mass drug administration. Geneva; 2011. ",
-      "text": "World Health Organization. Global programme to eliminate lymphatic filariasis: monitoring and epidemiological assessment of mass drug administration. Geneva; 2011. ",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/67",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "World Health Organization. Strengthening the assessment of lymphatic filariasis transmission and documenting the achievement of elimination\u2014Meeting of the Neglected Tropical Diseases Strategic and Technical Advisory Group\u2019s Monitoring and Evaluation Subgroup on Disease-specific Indicators. 2016; 42. ",
-      "text": "World Health Organization. Strengthening the assessment of lymphatic filariasis transmission and documenting the achievement of elimination\u2014Meeting of the Neglected Tropical Diseases Strategic and Technical Advisory Group\u2019s Monitoring and Evaluation Subgroup on Disease-specific Indicators. 2016; 42. ",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/68",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Kyelem D; Biswas G; Bockarie MJ; Bradley MH; El-Setouhy M; Fischer PU. Determinants of success in national programs to eliminate lymphatic filariasis: a perspective identifying essential elements and research needs. Am J Trop Med Hyg (2008)",
-      "text": "Kyelem D; Biswas G; Bockarie MJ; Bradley MH; El-Setouhy M; Fischer PU. Determinants of success in national programs to eliminate lymphatic filariasis: a perspective identifying essential elements and research needs. Am J Trop Med Hyg (2008)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/69",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Goldberg EM; King JD; Mupfasoni D; Kwong K; Hay SI; Pigott DM. Ecological and socioeconomic predictors of transmission assessment survey failure for lymphatic filariasis. Am J Trop Med Hyg (2019)",
-      "text": "Goldberg EM; King JD; Mupfasoni D; Kwong K; Hay SI; Pigott DM. Ecological and socioeconomic predictors of transmission assessment survey failure for lymphatic filariasis. Am J Trop Med Hyg (2019)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/70",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Cano J; Rebollo MP; Golding N; Pullan RL; Crellen T; Soler A. The global distribution and transmission limits of lymphatic filariasis: past and present. Parasites and Vectors (2014)",
-      "text": "Cano J; Rebollo MP; Golding N; Pullan RL; Crellen T; Soler A. The global distribution and transmission limits of lymphatic filariasis: past and present. Parasites and Vectors (2014)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/71",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "CGIAR-CSI. CGIAR-CSI SRTM 90m DEM Digital Elevation Database. In: . ",
-      "text": "CGIAR-CSI. CGIAR-CSI SRTM 90m DEM Digital Elevation Database. In: . ",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/72",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "USGS NASA. Vegetation indices 16-DAy L3 global 500 MOD13A1 dataset [Internet]. [cited 1 May 2018]. Available: . ",
-      "text": "USGS NASA. Vegetation indices 16-DAy L3 global 500 MOD13A1 dataset [Internet]. [cited 1 May 2018]. Available: . ",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/73",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Funk C; Peterson P; Landsfeld M; Pedreros D; Verdin J; Shukla S. The climate hazards infrared precipitation with stations\u2014A new environmental record for monitoring extremes. Sci Data (2015)",
-      "text": "Funk C; Peterson P; Landsfeld M; Pedreros D; Verdin J; Shukla S. The climate hazards infrared precipitation with stations\u2014A new environmental record for monitoring extremes. Sci Data (2015)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/74",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Lloyd CT; Sorichetta A; Tatem AJ. High resolution global gridded data for use in population studies. Sci Data (2017)",
-      "text": "Lloyd CT; Sorichetta A; Tatem AJ. High resolution global gridded data for use in population studies. Sci Data (2017)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/75",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Elvidge CD; Baugh KE; Zhizhin M; Hsu F-C. Why VIIRS data are superior to DMSP for mapping nighttime lights. Proc Asia-Pacific Adv Netw (2013)",
-      "text": "Elvidge CD; Baugh KE; Zhizhin M; Hsu F-C. Why VIIRS data are superior to DMSP for mapping nighttime lights. Proc Asia-Pacific Adv Netw (2013)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/76",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Jambulingam P; Subramanian S; De Vlas SJ; Vinubala C; Stolk WA. Mathematical modelling of lymphatic filariasis elimination programmes in India: required duration of mass drug administration and post-treatment level of infection indicators. Parasites and Vectors (2016)",
-      "text": "Jambulingam P; Subramanian S; De Vlas SJ; Vinubala C; Stolk WA. Mathematical modelling of lymphatic filariasis elimination programmes in India: required duration of mass drug administration and post-treatment level of infection indicators. Parasites and Vectors (2016)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/77",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Michael E; Malecela-Lazaro MN; Simonsen PE; Pedersen EM; Barker G; Kumar A. Mathematical modelling and the control of lymphatic filariasis. Lancet Infect Dis (2004)",
-      "text": "Michael E; Malecela-Lazaro MN; Simonsen PE; Pedersen EM; Barker G; Kumar A. Mathematical modelling and the control of lymphatic filariasis. Lancet Infect Dis (2004)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/78",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Stolk WA; Swaminathan S; van Oortmarssen GJ; Das PK; Habbema JDF. Prospects for elimination of bancroftian filariasis by mass drug treatment in Pondicherry, India: a simulation study. J Infect Dis (2003)",
-      "text": "Stolk WA; Swaminathan S; van Oortmarssen GJ; Das PK; Habbema JDF. Prospects for elimination of bancroftian filariasis by mass drug treatment in Pondicherry, India: a simulation study. J Infect Dis (2003)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/79",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Grady CA; De Rochars MB; Direny AN; Orelus JN; Wendt J; Radday J. Endpoints for lymphatic filariasis programs. Emerg Infect Dis (2007)",
-      "text": "Grady CA; De Rochars MB; Direny AN; Orelus JN; Wendt J; Radday J. Endpoints for lymphatic filariasis programs. Emerg Infect Dis (2007)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/80",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Evans D; McFarland D; Adamani W; Eigege A; Miri E; Schulz J. Cost-effectiveness of triple drug administration (TDA) with praziquantel, ivermectin and albendazole for the prevention of neglected tropical diseases in Nigeria. Ann Trop Med Parasitol (2011)",
-      "text": "Evans D; McFarland D; Adamani W; Eigege A; Miri E; Schulz J. Cost-effectiveness of triple drug administration (TDA) with praziquantel, ivermectin and albendazole for the prevention of neglected tropical diseases in Nigeria. Ann Trop Med Parasitol (2011)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/81",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Richards FO; Eigege A; Miri ES; Kal A; Umaru J; Pam D. Epidemiological and entomological evaluations after six years or more of mass drug administration for lymphatic filariasis elimination in Nigeria. PLoS Negl Trop Dis (2011)",
-      "text": "Richards FO; Eigege A; Miri ES; Kal A; Umaru J; Pam D. Epidemiological and entomological evaluations after six years or more of mass drug administration for lymphatic filariasis elimination in Nigeria. PLoS Negl Trop Dis (2011)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/82",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Biritwum NK; Yikpotey P; Marfo BK; Odoom S; Mensah EO; Asiedu O. Persistent \u201chotspots\u201d of lymphatic filariasis microfilaraemia despite 14 years of mass drug administration in Ghana. Trans R Soc Trop Med Hyg (2016)",
-      "text": "Biritwum NK; Yikpotey P; Marfo BK; Odoom S; Mensah EO; Asiedu O. Persistent \u201chotspots\u201d of lymphatic filariasis microfilaraemia despite 14 years of mass drug administration in Ghana. Trans R Soc Trop Med Hyg (2016)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/83",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Moraga P; Cano J; Baggaley RF; Gyapong JO; Njenga SM; Nikolay B. Modelling the distribution and transmission intensity of lymphatic filariasis in sub-Saharan Africa prior to scaling up interventions: integrated use of geostatistical and mathematical modelling. Parasites and Vectors (2015)",
-      "text": "Moraga P; Cano J; Baggaley RF; Gyapong JO; Njenga SM; Nikolay B. Modelling the distribution and transmission intensity of lymphatic filariasis in sub-Saharan Africa prior to scaling up interventions: integrated use of geostatistical and mathematical modelling. Parasites and Vectors (2015)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/84",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Irvine MA; Njenga SM; Gunawardena S; Wamae CN; Cano J; Brooker SJ. Understanding the relationship between prevalence of microfilariae and antigenaemia using a model of lymphatic filariasis infection. Trans R Soc Trop Med Hyg (2016)",
-      "text": "Irvine MA; Njenga SM; Gunawardena S; Wamae CN; Cano J; Brooker SJ. Understanding the relationship between prevalence of microfilariae and antigenaemia using a model of lymphatic filariasis infection. Trans R Soc Trop Med Hyg (2016)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/85",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Ottesen EA. Efficacy of diethylcarbamazine in eradicating infection with lymphatic-dwelling filariae in humans. Rev Infect Dis (1985)",
-      "text": "Ottesen EA. Efficacy of diethylcarbamazine in eradicating infection with lymphatic-dwelling filariae in humans. Rev Infect Dis (1985)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/86",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Gambhir M; Bockarie M; Tisch D; Kazura J; Remais J; Spear R. Geographic and ecologic heterogeneity in elimination thresholds for the major vector-borne helminthic disease, lymphatic filariasis. BMC Biol (2010)",
-      "text": "Gambhir M; Bockarie M; Tisch D; Kazura J; Remais J; Spear R. Geographic and ecologic heterogeneity in elimination thresholds for the major vector-borne helminthic disease, lymphatic filariasis. BMC Biol (2010)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/87",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "World Health Organization. Global programme to eliminate lymphatic filariasis: practical entomology handbook. Geneva; 2013. ",
-      "text": "World Health Organization. Global programme to eliminate lymphatic filariasis: practical entomology handbook. Geneva; 2013. ",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/88",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Slater H; Michael E. Predicting the current and future potential distributions of lymphatic filariasis in Africa using maximum entropy ecological niche modelling. PLoS One (2012)",
-      "text": "Slater H; Michael E. Predicting the current and future potential distributions of lymphatic filariasis in Africa using maximum entropy ecological niche modelling. PLoS One (2012)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/89",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Slater H; Michael E. Mapping, Bayesian geostatistical analysis and spatial prediction of lymphatic filariasis prevalence in Africa. PLoS One (2013)",
-      "text": "Slater H; Michael E. Mapping, Bayesian geostatistical analysis and spatial prediction of lymphatic filariasis prevalence in Africa. PLoS One (2013)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/90",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Sabesan S; Raju KHK; Subramanian S; Srivastava PK; Jambulingam P. Lymphatic filariasis transmission risk map of India, based on a geo-environmental risk model. Vector-Borne Zoonotic Dis (2013)",
-      "text": "Sabesan S; Raju KHK; Subramanian S; Srivastava PK; Jambulingam P. Lymphatic filariasis transmission risk map of India, based on a geo-environmental risk model. Vector-Borne Zoonotic Dis (2013)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/91",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Stanton MC; Molyneux DH; Kyelem D; Bougma RW; Koudou BG; Kelly-Hope LA. Baseline drivers of lymphatic filariasis in Burkina Faso. Geospat Health (2013)",
-      "text": "Stanton MC; Molyneux DH; Kyelem D; Bougma RW; Koudou BG; Kelly-Hope LA. Baseline drivers of lymphatic filariasis in Burkina Faso. Geospat Health (2013)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/92",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Manhenje I; Teresa Gal\u00e1n-Puchades M; Fuentes M V. Socio-environmental variables and transmission risk of lymphatic filariasis in central and northern Mozambique. Geospat Health (2013)",
-      "text": "Manhenje I; Teresa Gal\u00e1n-Puchades M; Fuentes M V. Socio-environmental variables and transmission risk of lymphatic filariasis in central and northern Mozambique. Geospat Health (2013)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/93",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Ngwira BM; Tambala P; Perez a M; Bowie C; Molyneux DH. The geographical distribution of lymphatic filariasis infection in Malawi. Filaria J (2007)",
-      "text": "Ngwira BM; Tambala P; Perez a M; Bowie C; Molyneux DH. The geographical distribution of lymphatic filariasis infection in Malawi. Filaria J (2007)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/94",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Simonsen PE; Mwakitalu ME. Urban lymphatic filariasis. Parasitol Res (2013)",
-      "text": "Simonsen PE; Mwakitalu ME. Urban lymphatic filariasis. Parasitol Res (2013)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/95",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Proville J; Zavala-Araiza D; Wagner G. Night-time lights: a global, long term look at links to socio-economic trends. PLoS One (2017)",
-      "text": "Proville J; Zavala-Araiza D; Wagner G. Night-time lights: a global, long term look at links to socio-economic trends. PLoS One (2017)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/96",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Endeshaw T; Taye A; Tadesse Z; Katabarwa MN; Shafi O; Seid T. Presence of Wuchereria bancrofti microfilaremia despite seven years of annual ivermectin monotherapy mass drug administration for onchocerciasis control: a study in north-west Ethiopia. Pathog Glob Health (2015)",
-      "text": "Endeshaw T; Taye A; Tadesse Z; Katabarwa MN; Shafi O; Seid T. Presence of Wuchereria bancrofti microfilaremia despite seven years of annual ivermectin monotherapy mass drug administration for onchocerciasis control: a study in north-west Ethiopia. Pathog Glob Health (2015)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/97",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Richards FO; Eigege A; Pam D; Kal A; Lenhart A; Oneyka JOA. Mass ivermectin treatment for onchocerciasis: lack of evidence for collateral impact on transmission of Wuchereria bancrofti in areas of co-endemicity. Filaria J (2005)",
-      "text": "Richards FO; Eigege A; Pam D; Kal A; Lenhart A; Oneyka JOA. Mass ivermectin treatment for onchocerciasis: lack of evidence for collateral impact on transmission of Wuchereria bancrofti in areas of co-endemicity. Filaria J (2005)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/98",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Kyelem D; Sanou S; Boatin B a; Medlock J; Couibaly S; Molyneux DH. Impact of long-term ivermectin (Mectizan) on Wuchereria bancrofti and Mansonella perstans infections in Burkina Faso: strategic and policy implications. Ann Trop Med Parasitol (2003)",
-      "text": "Kyelem D; Sanou S; Boatin B a; Medlock J; Couibaly S; Molyneux DH. Impact of long-term ivermectin (Mectizan) on Wuchereria bancrofti and Mansonella perstans infections in Burkina Faso: strategic and policy implications. Ann Trop Med Parasitol (2003)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/99",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Weil GJ; Lammie PJ; Richards FO; Eberhard ML. Changes in circulating parasite antigen levels after treatment of bancroftian filariasis with diethylcarbamazine and ivermectin. J Infect Dis (1991)",
-      "text": "Weil GJ; Lammie PJ; Richards FO; Eberhard ML. Changes in circulating parasite antigen levels after treatment of bancroftian filariasis with diethylcarbamazine and ivermectin. J Infect Dis (1991)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/100",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Kumar A; Sachan P. Measuring impact on filarial infection status in a community study: role of coverage of mass drug administration. Trop Biomed (2014)",
-      "text": "Kumar A; Sachan P. Measuring impact on filarial infection status in a community study: role of coverage of mass drug administration. Trop Biomed (2014)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/101",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Njenga SM; Mwandawiro CS; Wamae CN; Mukoko DA; Omar AA; Shimada M. Sustained reduction in prevalence of lymphatic filariasis infection in spite of missed rounds of mass drug administration in an area under mosquito nets for malaria control. Parasites and Vectors (2011)",
-      "text": "Njenga SM; Mwandawiro CS; Wamae CN; Mukoko DA; Omar AA; Shimada M. Sustained reduction in prevalence of lymphatic filariasis infection in spite of missed rounds of mass drug administration in an area under mosquito nets for malaria control. Parasites and Vectors (2011)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/102",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Boyd A; Won KY; McClintock SK; Donovan C V; Laney SJ; Williams SA. A community-based study of factors associated with continuing transmission of lymphatic filariasis in Leogane, Haiti. PLoS Negl Trop Dis (2010)",
-      "text": "Boyd A; Won KY; McClintock SK; Donovan C V; Laney SJ; Williams SA. A community-based study of factors associated with continuing transmission of lymphatic filariasis in Leogane, Haiti. PLoS Negl Trop Dis (2010)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/103",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Irvine MA; Reimer LJ; Njenga SM; Gunawardena S; Kelly-Hope L; Bockarie M. Modelling strategies to break transmission of lymphatic filariasis\u2014aggregation, adherence and vector competence greatly alter elimination. Parasites and Vectors (2015)",
-      "text": "Irvine MA; Reimer LJ; Njenga SM; Gunawardena S; Kelly-Hope L; Bockarie M. Modelling strategies to break transmission of lymphatic filariasis\u2014aggregation, adherence and vector competence greatly alter elimination. Parasites and Vectors (2015)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/104",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Irvine MA; Stolk WA; Smith ME; Subramanian S; Singh BK; Weil GJ. Effectiveness of a triple-drug regimen for global elimination of lymphatic filariasis: a modelling study. Lancet Infect Dis (2017)",
-      "text": "Irvine MA; Stolk WA; Smith ME; Subramanian S; Singh BK; Weil GJ. Effectiveness of a triple-drug regimen for global elimination of lymphatic filariasis: a modelling study. Lancet Infect Dis (2017)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/105",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Pion SD; Montavon C; Chesnais CB; Kamgno J; Wanji S; Klion AD. Positivity of antigen tests used for diagnosis of lymphatic filariasis in individuals without Wuchereria bancrofti infection but with high loa loa microfilaremia. Am J Trop Med Hyg (2016)",
-      "text": "Pion SD; Montavon C; Chesnais CB; Kamgno J; Wanji S; Klion AD. Positivity of antigen tests used for diagnosis of lymphatic filariasis in individuals without Wuchereria bancrofti infection but with high loa loa microfilaremia. Am J Trop Med Hyg (2016)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/106",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Wanji S; Esum ME; Njouendou AJ; Mbeng AA; Chounna Ndongmo PW; Abong RA. Mapping of lymphatic filariasis in loiasis areas: a new strategy shows no evidence for Wuchereria bancrofti endemicity in Cameroon. PLoS Negl Trop Dis (2018)",
-      "text": "Wanji S; Esum ME; Njouendou AJ; Mbeng AA; Chounna Ndongmo PW; Abong RA. Mapping of lymphatic filariasis in loiasis areas: a new strategy shows no evidence for Wuchereria bancrofti endemicity in Cameroon. PLoS Negl Trop Dis (2018)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/107",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Chesnais CB; Awaca-Uvon NP; Bolay FK; Boussinesq M; Fischer PU; Gankpala L. A multi-center field study of two point-of-care tests for circulating Wuchereria bancrofti antigenemia in Africa. PLoS Negl Trop Dis (2017)",
-      "text": "Chesnais CB; Awaca-Uvon NP; Bolay FK; Boussinesq M; Fischer PU; Gankpala L. A multi-center field study of two point-of-care tests for circulating Wuchereria bancrofti antigenemia in Africa. PLoS Negl Trop Dis (2017)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/108",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Silumbwe A; Zulu JM; Halwindi H; Jacobs C; Zgambo J; Dambe R. A systematic review of factors that shape implementation of mass drug administration for lymphatic filariasis in sub-Saharan Africa. BMC Public Health (2017)",
-      "text": "Silumbwe A; Zulu JM; Halwindi H; Jacobs C; Zgambo J; Dambe R. A systematic review of factors that shape implementation of mass drug administration for lymphatic filariasis in sub-Saharan Africa. BMC Public Health (2017)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/109",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Adams AM; Vuckovic M; Birch E; Brant TA; Bialek S; Yoon D. Eliminating neglected tropical diseases in urban areas: a review of challenges, strategies and research directions for successful mass drug administration. Trop Med Infect Dis (2018)",
-      "text": "Adams AM; Vuckovic M; Birch E; Brant TA; Bialek S; Yoon D. Eliminating neglected tropical diseases in urban areas: a review of challenges, strategies and research directions for successful mass drug administration. Trop Med Infect Dis (2018)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/110",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Rao RU; Samarasekera SD; Nagodavithana KC; Dassanayaka TDM; Punchihewa MW; Ranasinghe USB. Reassessment of areas with persistent lymphatic filariasis nine years after cessation of mass drug administration in Sri Lanka. PLoS Negl Trop Dis (2017)",
-      "text": "Rao RU; Samarasekera SD; Nagodavithana KC; Dassanayaka TDM; Punchihewa MW; Ranasinghe USB. Reassessment of areas with persistent lymphatic filariasis nine years after cessation of mass drug administration in Sri Lanka. PLoS Negl Trop Dis (2017)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/111",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Xu Z; Graves PM; Lau CL; Clements A; Geard N; Glass K. GEOFIL: a spatially-explicit agent-based modelling framework for predicting the long-term transmission dynamics of lymphatic filariasis in American Samoa. Epidemics (2018)",
-      "text": "Xu Z; Graves PM; Lau CL; Clements A; Geard N; Glass K. GEOFIL: a spatially-explicit agent-based modelling framework for predicting the long-term transmission dynamics of lymphatic filariasis in American Samoa. Epidemics (2018)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/112",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Id CM; Tettevi EJ; Mechan F; Idun B; Biritwum N; Osei-atweneboana MY. Elimination within reach: a cross-sectional study highlighting the factors that contribute to persistent lymphatic filariasis in eight communities in rural Ghana. PLoS Negl Trop Dis (2019)",
-      "text": "Id CM; Tettevi EJ; Mechan F; Idun B; Biritwum N; Osei-atweneboana MY. Elimination within reach: a cross-sectional study highlighting the factors that contribute to persistent lymphatic filariasis in eight communities in rural Ghana. PLoS Negl Trop Dis (2019)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/113",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Eigege A; Kal A; Miri E; Sallau A; Umaru J; Mafuyai H. Long-lasting insecticidal nets are synergistic with mass drug administration for interruption of lymphatic filariasis transmission in Nigeria. PLoS Negl Trop Dis (2013)",
-      "text": "Eigege A; Kal A; Miri E; Sallau A; Umaru J; Mafuyai H. Long-lasting insecticidal nets are synergistic with mass drug administration for interruption of lymphatic filariasis transmission in Nigeria. PLoS Negl Trop Dis (2013)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/114",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Van den Berg H; Kelly-Hope LA; Lindsay SW. Malaria and lymphatic filariasis: The case for integrated vector management. Lancet Infect Dis (2013)",
-      "text": "Van den Berg H; Kelly-Hope LA; Lindsay SW. Malaria and lymphatic filariasis: The case for integrated vector management. Lancet Infect Dis (2013)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/115",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Webber R.. Eradication of Wuchereria bancrofti infection through vector control. Trans R Soc Trop Med Hyg (1979)",
-      "text": "Webber R.. Eradication of Wuchereria bancrofti infection through vector control. Trans R Soc Trop Med Hyg (1979)",
-      "enumerated": false,
-      "marker": "-"
-    }
-  ],
-  "pictures": [
-    {
-      "self_ref": "#/pictures/0",
-      "parent": {
-        "$ref": "#/texts/56"
-      },
-      "children": [],
-      "label": "picture",
-      "prov": [],
-      "captions": [
-        {
-          "$ref": "#/texts/57"
-        }
-      ],
-      "references": [],
-      "footnotes": [],
-      "annotations": []
-    },
-    {
-      "self_ref": "#/pictures/1",
-      "parent": {
-        "$ref": "#/texts/56"
-      },
-      "children": [],
-      "label": "picture",
-      "prov": [],
-      "captions": [
-        {
-          "$ref": "#/texts/58"
-        }
-      ],
-      "references": [],
-      "footnotes": [],
-      "annotations": []
-    },
-    {
-      "self_ref": "#/pictures/2",
-      "parent": {
-        "$ref": "#/texts/56"
-      },
-      "children": [],
-      "label": "picture",
-      "prov": [],
-      "captions": [
-        {
-          "$ref": "#/texts/59"
-        }
-      ],
-      "references": [],
-      "footnotes": [],
-      "annotations": []
-    },
-    {
-      "self_ref": "#/pictures/3",
-      "parent": {
-        "$ref": "#/texts/56"
-      },
-      "children": [],
-      "label": "picture",
-      "prov": [],
-      "captions": [
-        {
-          "$ref": "#/texts/60"
-        }
-      ],
-      "references": [],
-      "footnotes": [],
-      "annotations": []
-    },
-    {
-      "self_ref": "#/pictures/4",
-      "parent": {
-        "$ref": "#/texts/56"
-      },
-      "children": [],
-      "label": "picture",
-      "prov": [],
-      "captions": [
-        {
-          "$ref": "#/texts/61"
-        }
-      ],
-      "references": [],
-      "footnotes": [],
-      "annotations": []
-    }
-  ],
-  "tables": [
-    {
-      "self_ref": "#/tables/0",
-      "parent": {
-        "$ref": "#/texts/53"
-      },
-      "children": [],
-      "label": "table",
-      "prov": [],
-      "captions": [
-        {
-          "$ref": "#/texts/54"
-        }
-      ],
-      "references": [],
-      "footnotes": [],
-      "data": {
-        "table_cells": [
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 0,
-            "end_row_offset_idx": 1,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "Domain",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 0,
-            "end_row_offset_idx": 1,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "Factor",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 0,
-            "end_row_offset_idx": 1,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "Covariate",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 0,
-            "end_row_offset_idx": 1,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "Description",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 0,
-            "end_row_offset_idx": 1,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "Reference Group",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 0,
-            "end_row_offset_idx": 1,
-            "start_col_offset_idx": 5,
-            "end_col_offset_idx": 6,
-            "text": "Summary statistic",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 0,
-            "end_row_offset_idx": 1,
-            "start_col_offset_idx": 6,
-            "end_col_offset_idx": 7,
-            "text": "Temporal Resolution",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 0,
-            "end_row_offset_idx": 1,
-            "start_col_offset_idx": 7,
-            "end_col_offset_idx": 8,
-            "text": "Source",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 1,
-            "end_row_offset_idx": 2,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "Prevalence",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 1,
-            "end_row_offset_idx": 2,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "Baseline prevalence",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 1,
-            "end_row_offset_idx": 2,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "5% cut off",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 1,
-            "end_row_offset_idx": 2,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "Maximum reported mapping or baseline sentinel site prevalence",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 1,
-            "end_row_offset_idx": 2,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "<5%",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 1,
-            "end_row_offset_idx": 2,
-            "start_col_offset_idx": 5,
-            "end_col_offset_idx": 6,
-            "text": "Maximum",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 1,
-            "end_row_offset_idx": 2,
-            "start_col_offset_idx": 6,
-            "end_col_offset_idx": 7,
-            "text": "Varies",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 1,
-            "end_row_offset_idx": 2,
-            "start_col_offset_idx": 7,
-            "end_col_offset_idx": 8,
-            "text": "Programmatic data",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 2,
-            "end_row_offset_idx": 3,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "Prevalence",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 2,
-            "end_row_offset_idx": 3,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "Baseline prevalence",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 2,
-            "end_row_offset_idx": 3,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "10% cut off",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 2,
-            "end_row_offset_idx": 3,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "Maximum reported mapping or baseline sentinel site prevalence",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 2,
-            "end_row_offset_idx": 3,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "<10%",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 2,
-            "end_row_offset_idx": 3,
-            "start_col_offset_idx": 5,
-            "end_col_offset_idx": 6,
-            "text": "Maximum",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 2,
-            "end_row_offset_idx": 3,
-            "start_col_offset_idx": 6,
-            "end_col_offset_idx": 7,
-            "text": "Varies",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 2,
-            "end_row_offset_idx": 3,
-            "start_col_offset_idx": 7,
-            "end_col_offset_idx": 8,
-            "text": "Programmatic data",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 3,
-            "end_row_offset_idx": 4,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "Agent",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 3,
-            "end_row_offset_idx": 4,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "Parasite",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 3,
-            "end_row_offset_idx": 4,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "Parasite",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 3,
-            "end_row_offset_idx": 4,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "Predominate parasite in district",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 3,
-            "end_row_offset_idx": 4,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "W. bancrofti & mixed",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 3,
-            "end_row_offset_idx": 4,
-            "start_col_offset_idx": 5,
-            "end_col_offset_idx": 6,
-            "text": "Binary value",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 3,
-            "end_row_offset_idx": 4,
-            "start_col_offset_idx": 6,
-            "end_col_offset_idx": 7,
-            "text": "2018",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 3,
-            "end_row_offset_idx": 4,
-            "start_col_offset_idx": 7,
-            "end_col_offset_idx": 8,
-            "text": "Programmatic data",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 4,
-            "end_row_offset_idx": 5,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "Environment",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 4,
-            "end_row_offset_idx": 5,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "Vector",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 4,
-            "end_row_offset_idx": 5,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "Vector",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 4,
-            "end_row_offset_idx": 5,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "Predominate vector in district",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 4,
-            "end_row_offset_idx": 5,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "Anopheles & Mansonia",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 4,
-            "end_row_offset_idx": 5,
-            "start_col_offset_idx": 5,
-            "end_col_offset_idx": 6,
-            "text": "Binary value",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 4,
-            "end_row_offset_idx": 5,
-            "start_col_offset_idx": 6,
-            "end_col_offset_idx": 7,
-            "text": "2018",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 4,
-            "end_row_offset_idx": 5,
-            "start_col_offset_idx": 7,
-            "end_col_offset_idx": 8,
-            "text": "Country expert",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 5,
-            "end_row_offset_idx": 6,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "Environment",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 5,
-            "end_row_offset_idx": 6,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "Geography",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 5,
-            "end_row_offset_idx": 6,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "Elevation",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 5,
-            "end_row_offset_idx": 6,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "Elevation measured in meters",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 5,
-            "end_row_offset_idx": 6,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": ">350",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 5,
-            "end_row_offset_idx": 6,
-            "start_col_offset_idx": 5,
-            "end_col_offset_idx": 6,
-            "text": "Mean",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 5,
-            "end_row_offset_idx": 6,
-            "start_col_offset_idx": 6,
-            "end_col_offset_idx": 7,
-            "text": "2000",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 5,
-            "end_row_offset_idx": 6,
-            "start_col_offset_idx": 7,
-            "end_col_offset_idx": 8,
-            "text": "CGIAR-CSI SRTM [9]",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 6,
-            "end_row_offset_idx": 7,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "Environment",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 6,
-            "end_row_offset_idx": 7,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "Geography",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 6,
-            "end_row_offset_idx": 7,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "District area",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 6,
-            "end_row_offset_idx": 7,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "Area measured in km2",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 6,
-            "end_row_offset_idx": 7,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": ">2,500",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 6,
-            "end_row_offset_idx": 7,
-            "start_col_offset_idx": 5,
-            "end_col_offset_idx": 6,
-            "text": "Maximum sum",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 6,
-            "end_row_offset_idx": 7,
-            "start_col_offset_idx": 6,
-            "end_col_offset_idx": 7,
-            "text": "Static",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 6,
-            "end_row_offset_idx": 7,
-            "start_col_offset_idx": 7,
-            "end_col_offset_idx": 8,
-            "text": "Programmatic data",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 7,
-            "end_row_offset_idx": 8,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "Environment",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 7,
-            "end_row_offset_idx": 8,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "Climate",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 7,
-            "end_row_offset_idx": 8,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "EVI",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 7,
-            "end_row_offset_idx": 8,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "Enhanced vegetation index",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 7,
-            "end_row_offset_idx": 8,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "> 0.3",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 7,
-            "end_row_offset_idx": 8,
-            "start_col_offset_idx": 5,
-            "end_col_offset_idx": 6,
-            "text": "Mean",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 7,
-            "end_row_offset_idx": 8,
-            "start_col_offset_idx": 6,
-            "end_col_offset_idx": 7,
-            "text": "2015",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 7,
-            "end_row_offset_idx": 8,
-            "start_col_offset_idx": 7,
-            "end_col_offset_idx": 8,
-            "text": "MODIS [10]",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 8,
-            "end_row_offset_idx": 9,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "Environment",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 8,
-            "end_row_offset_idx": 9,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "Climate",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 8,
-            "end_row_offset_idx": 9,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "Rainfall",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 8,
-            "end_row_offset_idx": 9,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "Annual rainfall measured in mm",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 8,
-            "end_row_offset_idx": 9,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "\u2264 700",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 8,
-            "end_row_offset_idx": 9,
-            "start_col_offset_idx": 5,
-            "end_col_offset_idx": 6,
-            "text": "Mean",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 8,
-            "end_row_offset_idx": 9,
-            "start_col_offset_idx": 6,
-            "end_col_offset_idx": 7,
-            "text": "2015",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 8,
-            "end_row_offset_idx": 9,
-            "start_col_offset_idx": 7,
-            "end_col_offset_idx": 8,
-            "text": "CHIRPS [11]",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 9,
-            "end_row_offset_idx": 10,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "Environment",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 9,
-            "end_row_offset_idx": 10,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "Socio-economic",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 9,
-            "end_row_offset_idx": 10,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "Population density",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 9,
-            "end_row_offset_idx": 10,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "Number of people per km2",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 9,
-            "end_row_offset_idx": 10,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "\u2264 100",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 9,
-            "end_row_offset_idx": 10,
-            "start_col_offset_idx": 5,
-            "end_col_offset_idx": 6,
-            "text": "Mean",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 9,
-            "end_row_offset_idx": 10,
-            "start_col_offset_idx": 6,
-            "end_col_offset_idx": 7,
-            "text": "2015",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 9,
-            "end_row_offset_idx": 10,
-            "start_col_offset_idx": 7,
-            "end_col_offset_idx": 8,
-            "text": "WorldPop [12]",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 10,
-            "end_row_offset_idx": 11,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "Environment",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 10,
-            "end_row_offset_idx": 11,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "Socio-economic",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 10,
-            "end_row_offset_idx": 11,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "Nighttime lights",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 10,
-            "end_row_offset_idx": 11,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "Nighttime light index from 0 to 63",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 10,
-            "end_row_offset_idx": 11,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": ">1.5",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 10,
-            "end_row_offset_idx": 11,
-            "start_col_offset_idx": 5,
-            "end_col_offset_idx": 6,
-            "text": "Mean",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 10,
-            "end_row_offset_idx": 11,
-            "start_col_offset_idx": 6,
-            "end_col_offset_idx": 7,
-            "text": "2015",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 10,
-            "end_row_offset_idx": 11,
-            "start_col_offset_idx": 7,
-            "end_col_offset_idx": 8,
-            "text": "VIIRS [13]",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 11,
-            "end_row_offset_idx": 12,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "Environment",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 11,
-            "end_row_offset_idx": 12,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "Co-endemicity",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 11,
-            "end_row_offset_idx": 12,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "Co-endemic for onchocerciasis",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 11,
-            "end_row_offset_idx": 12,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "Part or all of district is also endemic for onchocerciases",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 11,
-            "end_row_offset_idx": 12,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "Non-endemic",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 11,
-            "end_row_offset_idx": 12,
-            "start_col_offset_idx": 5,
-            "end_col_offset_idx": 6,
-            "text": "Binary value",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 11,
-            "end_row_offset_idx": 12,
-            "start_col_offset_idx": 6,
-            "end_col_offset_idx": 7,
-            "text": "2018",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 11,
-            "end_row_offset_idx": 12,
-            "start_col_offset_idx": 7,
-            "end_col_offset_idx": 8,
-            "text": "Programmatic data",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 12,
-            "end_row_offset_idx": 13,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "MDA",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 12,
-            "end_row_offset_idx": 13,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "Drug efficacy",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 12,
-            "end_row_offset_idx": 13,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "Drug package",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 12,
-            "end_row_offset_idx": 13,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "DEC-ALB or IVM-ALB",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 12,
-            "end_row_offset_idx": 13,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "DEC-ALB",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 12,
-            "end_row_offset_idx": 13,
-            "start_col_offset_idx": 5,
-            "end_col_offset_idx": 6,
-            "text": "Binary value",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 12,
-            "end_row_offset_idx": 13,
-            "start_col_offset_idx": 6,
-            "end_col_offset_idx": 7,
-            "text": "2018",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 12,
-            "end_row_offset_idx": 13,
-            "start_col_offset_idx": 7,
-            "end_col_offset_idx": 8,
-            "text": "Programmatic data",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 13,
-            "end_row_offset_idx": 14,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "MDA",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 13,
-            "end_row_offset_idx": 14,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "Implementation of MDA",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 13,
-            "end_row_offset_idx": 14,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "Coverage",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 13,
-            "end_row_offset_idx": 14,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "Median MDA coverage for last 5 rounds",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 13,
-            "end_row_offset_idx": 14,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "\u2265 65%",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 13,
-            "end_row_offset_idx": 14,
-            "start_col_offset_idx": 5,
-            "end_col_offset_idx": 6,
-            "text": "Median",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 13,
-            "end_row_offset_idx": 14,
-            "start_col_offset_idx": 6,
-            "end_col_offset_idx": 7,
-            "text": "Varies",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 13,
-            "end_row_offset_idx": 14,
-            "start_col_offset_idx": 7,
-            "end_col_offset_idx": 8,
-            "text": "Programmatic data",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 14,
-            "end_row_offset_idx": 15,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "MDA",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 14,
-            "end_row_offset_idx": 15,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "Implementation of MDA",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 14,
-            "end_row_offset_idx": 15,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "Sufficient rounds",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 14,
-            "end_row_offset_idx": 15,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "Number of rounds of sufficient (\u2265 65% coverage) in last 5 years",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 14,
-            "end_row_offset_idx": 15,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "\u2265 3",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 14,
-            "end_row_offset_idx": 15,
-            "start_col_offset_idx": 5,
-            "end_col_offset_idx": 6,
-            "text": "Count",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 14,
-            "end_row_offset_idx": 15,
-            "start_col_offset_idx": 6,
-            "end_col_offset_idx": 7,
-            "text": "Varies",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 14,
-            "end_row_offset_idx": 15,
-            "start_col_offset_idx": 7,
-            "end_col_offset_idx": 8,
-            "text": "Programmatic data",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 15,
-            "end_row_offset_idx": 16,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "MDA",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 15,
-            "end_row_offset_idx": 16,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "Implementation of MDA",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 15,
-            "end_row_offset_idx": 16,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "Number of rounds",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 15,
-            "end_row_offset_idx": 16,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "Maximum number of recorded rounds of MDA",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 15,
-            "end_row_offset_idx": 16,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "\u2265 6",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 15,
-            "end_row_offset_idx": 16,
-            "start_col_offset_idx": 5,
-            "end_col_offset_idx": 6,
-            "text": "Maximum",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 15,
-            "end_row_offset_idx": 16,
-            "start_col_offset_idx": 6,
-            "end_col_offset_idx": 7,
-            "text": "Varies",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 15,
-            "end_row_offset_idx": 16,
-            "start_col_offset_idx": 7,
-            "end_col_offset_idx": 8,
-            "text": "Programmatic data",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 16,
-            "end_row_offset_idx": 17,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "Pre-TAS implementation",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 16,
-            "end_row_offset_idx": 17,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "Quality of survey",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 16,
-            "end_row_offset_idx": 17,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "Diagnostic method",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 16,
-            "end_row_offset_idx": 17,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "Using Mf or Ag",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 16,
-            "end_row_offset_idx": 17,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "Mf",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 16,
-            "end_row_offset_idx": 17,
-            "start_col_offset_idx": 5,
-            "end_col_offset_idx": 6,
-            "text": "Binary value",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 16,
-            "end_row_offset_idx": 17,
-            "start_col_offset_idx": 6,
-            "end_col_offset_idx": 7,
-            "text": "Varies",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 16,
-            "end_row_offset_idx": 17,
-            "start_col_offset_idx": 7,
-            "end_col_offset_idx": 8,
-            "text": "Programmatic data",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 17,
-            "end_row_offset_idx": 18,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "Pre-TAS implementation",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 17,
-            "end_row_offset_idx": 18,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "Quality of survey",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 17,
-            "end_row_offset_idx": 18,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "Diagnostic test",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 17,
-            "end_row_offset_idx": 18,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "Using Mf, ICT, or FTS",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 17,
-            "end_row_offset_idx": 18,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "Mf",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 17,
-            "end_row_offset_idx": 18,
-            "start_col_offset_idx": 5,
-            "end_col_offset_idx": 6,
-            "text": "Categorical",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 17,
-            "end_row_offset_idx": 18,
-            "start_col_offset_idx": 6,
-            "end_col_offset_idx": 7,
-            "text": "Varies",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 17,
-            "end_row_offset_idx": 18,
-            "start_col_offset_idx": 7,
-            "end_col_offset_idx": 8,
-            "text": "Programmatic data",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          }
-        ],
-        "num_rows": 18,
-        "num_cols": 8,
-        "grid": [
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 0,
-              "end_row_offset_idx": 1,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "Domain",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 0,
-              "end_row_offset_idx": 1,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "Factor",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 0,
-              "end_row_offset_idx": 1,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "Covariate",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 0,
-              "end_row_offset_idx": 1,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "Description",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 0,
-              "end_row_offset_idx": 1,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "Reference Group",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 0,
-              "end_row_offset_idx": 1,
-              "start_col_offset_idx": 5,
-              "end_col_offset_idx": 6,
-              "text": "Summary statistic",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 0,
-              "end_row_offset_idx": 1,
-              "start_col_offset_idx": 6,
-              "end_col_offset_idx": 7,
-              "text": "Temporal Resolution",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 0,
-              "end_row_offset_idx": 1,
-              "start_col_offset_idx": 7,
-              "end_col_offset_idx": 8,
-              "text": "Source",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 1,
-              "end_row_offset_idx": 2,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "Prevalence",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 1,
-              "end_row_offset_idx": 2,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "Baseline prevalence",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 1,
-              "end_row_offset_idx": 2,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "5% cut off",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 1,
-              "end_row_offset_idx": 2,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "Maximum reported mapping or baseline sentinel site prevalence",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 1,
-              "end_row_offset_idx": 2,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "<5%",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 1,
-              "end_row_offset_idx": 2,
-              "start_col_offset_idx": 5,
-              "end_col_offset_idx": 6,
-              "text": "Maximum",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 1,
-              "end_row_offset_idx": 2,
-              "start_col_offset_idx": 6,
-              "end_col_offset_idx": 7,
-              "text": "Varies",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 1,
-              "end_row_offset_idx": 2,
-              "start_col_offset_idx": 7,
-              "end_col_offset_idx": 8,
-              "text": "Programmatic data",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 2,
-              "end_row_offset_idx": 3,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "Prevalence",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 2,
-              "end_row_offset_idx": 3,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "Baseline prevalence",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 2,
-              "end_row_offset_idx": 3,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "10% cut off",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 2,
-              "end_row_offset_idx": 3,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "Maximum reported mapping or baseline sentinel site prevalence",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 2,
-              "end_row_offset_idx": 3,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "<10%",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 2,
-              "end_row_offset_idx": 3,
-              "start_col_offset_idx": 5,
-              "end_col_offset_idx": 6,
-              "text": "Maximum",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 2,
-              "end_row_offset_idx": 3,
-              "start_col_offset_idx": 6,
-              "end_col_offset_idx": 7,
-              "text": "Varies",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 2,
-              "end_row_offset_idx": 3,
-              "start_col_offset_idx": 7,
-              "end_col_offset_idx": 8,
-              "text": "Programmatic data",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 3,
-              "end_row_offset_idx": 4,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "Agent",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 3,
-              "end_row_offset_idx": 4,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "Parasite",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 3,
-              "end_row_offset_idx": 4,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "Parasite",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 3,
-              "end_row_offset_idx": 4,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "Predominate parasite in district",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 3,
-              "end_row_offset_idx": 4,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "W. bancrofti & mixed",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 3,
-              "end_row_offset_idx": 4,
-              "start_col_offset_idx": 5,
-              "end_col_offset_idx": 6,
-              "text": "Binary value",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 3,
-              "end_row_offset_idx": 4,
-              "start_col_offset_idx": 6,
-              "end_col_offset_idx": 7,
-              "text": "2018",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 3,
-              "end_row_offset_idx": 4,
-              "start_col_offset_idx": 7,
-              "end_col_offset_idx": 8,
-              "text": "Programmatic data",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 4,
-              "end_row_offset_idx": 5,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "Environment",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 4,
-              "end_row_offset_idx": 5,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "Vector",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 4,
-              "end_row_offset_idx": 5,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "Vector",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 4,
-              "end_row_offset_idx": 5,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "Predominate vector in district",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 4,
-              "end_row_offset_idx": 5,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "Anopheles & Mansonia",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 4,
-              "end_row_offset_idx": 5,
-              "start_col_offset_idx": 5,
-              "end_col_offset_idx": 6,
-              "text": "Binary value",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 4,
-              "end_row_offset_idx": 5,
-              "start_col_offset_idx": 6,
-              "end_col_offset_idx": 7,
-              "text": "2018",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 4,
-              "end_row_offset_idx": 5,
-              "start_col_offset_idx": 7,
-              "end_col_offset_idx": 8,
-              "text": "Country expert",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 5,
-              "end_row_offset_idx": 6,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "Environment",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 5,
-              "end_row_offset_idx": 6,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "Geography",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 5,
-              "end_row_offset_idx": 6,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "Elevation",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 5,
-              "end_row_offset_idx": 6,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "Elevation measured in meters",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 5,
-              "end_row_offset_idx": 6,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": ">350",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 5,
-              "end_row_offset_idx": 6,
-              "start_col_offset_idx": 5,
-              "end_col_offset_idx": 6,
-              "text": "Mean",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 5,
-              "end_row_offset_idx": 6,
-              "start_col_offset_idx": 6,
-              "end_col_offset_idx": 7,
-              "text": "2000",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 5,
-              "end_row_offset_idx": 6,
-              "start_col_offset_idx": 7,
-              "end_col_offset_idx": 8,
-              "text": "CGIAR-CSI SRTM [9]",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 6,
-              "end_row_offset_idx": 7,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "Environment",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 6,
-              "end_row_offset_idx": 7,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "Geography",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 6,
-              "end_row_offset_idx": 7,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "District area",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 6,
-              "end_row_offset_idx": 7,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "Area measured in km2",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 6,
-              "end_row_offset_idx": 7,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": ">2,500",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 6,
-              "end_row_offset_idx": 7,
-              "start_col_offset_idx": 5,
-              "end_col_offset_idx": 6,
-              "text": "Maximum sum",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 6,
-              "end_row_offset_idx": 7,
-              "start_col_offset_idx": 6,
-              "end_col_offset_idx": 7,
-              "text": "Static",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 6,
-              "end_row_offset_idx": 7,
-              "start_col_offset_idx": 7,
-              "end_col_offset_idx": 8,
-              "text": "Programmatic data",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 7,
-              "end_row_offset_idx": 8,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "Environment",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 7,
-              "end_row_offset_idx": 8,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "Climate",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 7,
-              "end_row_offset_idx": 8,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "EVI",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 7,
-              "end_row_offset_idx": 8,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "Enhanced vegetation index",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 7,
-              "end_row_offset_idx": 8,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "> 0.3",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 7,
-              "end_row_offset_idx": 8,
-              "start_col_offset_idx": 5,
-              "end_col_offset_idx": 6,
-              "text": "Mean",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 7,
-              "end_row_offset_idx": 8,
-              "start_col_offset_idx": 6,
-              "end_col_offset_idx": 7,
-              "text": "2015",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 7,
-              "end_row_offset_idx": 8,
-              "start_col_offset_idx": 7,
-              "end_col_offset_idx": 8,
-              "text": "MODIS [10]",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 8,
-              "end_row_offset_idx": 9,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "Environment",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 8,
-              "end_row_offset_idx": 9,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "Climate",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 8,
-              "end_row_offset_idx": 9,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "Rainfall",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 8,
-              "end_row_offset_idx": 9,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "Annual rainfall measured in mm",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 8,
-              "end_row_offset_idx": 9,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "\u2264 700",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 8,
-              "end_row_offset_idx": 9,
-              "start_col_offset_idx": 5,
-              "end_col_offset_idx": 6,
-              "text": "Mean",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 8,
-              "end_row_offset_idx": 9,
-              "start_col_offset_idx": 6,
-              "end_col_offset_idx": 7,
-              "text": "2015",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 8,
-              "end_row_offset_idx": 9,
-              "start_col_offset_idx": 7,
-              "end_col_offset_idx": 8,
-              "text": "CHIRPS [11]",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 9,
-              "end_row_offset_idx": 10,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "Environment",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 9,
-              "end_row_offset_idx": 10,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "Socio-economic",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 9,
-              "end_row_offset_idx": 10,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "Population density",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 9,
-              "end_row_offset_idx": 10,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "Number of people per km2",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 9,
-              "end_row_offset_idx": 10,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "\u2264 100",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 9,
-              "end_row_offset_idx": 10,
-              "start_col_offset_idx": 5,
-              "end_col_offset_idx": 6,
-              "text": "Mean",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 9,
-              "end_row_offset_idx": 10,
-              "start_col_offset_idx": 6,
-              "end_col_offset_idx": 7,
-              "text": "2015",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 9,
-              "end_row_offset_idx": 10,
-              "start_col_offset_idx": 7,
-              "end_col_offset_idx": 8,
-              "text": "WorldPop [12]",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 10,
-              "end_row_offset_idx": 11,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "Environment",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 10,
-              "end_row_offset_idx": 11,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "Socio-economic",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 10,
-              "end_row_offset_idx": 11,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "Nighttime lights",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 10,
-              "end_row_offset_idx": 11,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "Nighttime light index from 0 to 63",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 10,
-              "end_row_offset_idx": 11,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": ">1.5",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 10,
-              "end_row_offset_idx": 11,
-              "start_col_offset_idx": 5,
-              "end_col_offset_idx": 6,
-              "text": "Mean",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 10,
-              "end_row_offset_idx": 11,
-              "start_col_offset_idx": 6,
-              "end_col_offset_idx": 7,
-              "text": "2015",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 10,
-              "end_row_offset_idx": 11,
-              "start_col_offset_idx": 7,
-              "end_col_offset_idx": 8,
-              "text": "VIIRS [13]",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 11,
-              "end_row_offset_idx": 12,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "Environment",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 11,
-              "end_row_offset_idx": 12,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "Co-endemicity",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 11,
-              "end_row_offset_idx": 12,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "Co-endemic for onchocerciasis",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 11,
-              "end_row_offset_idx": 12,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "Part or all of district is also endemic for onchocerciases",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 11,
-              "end_row_offset_idx": 12,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "Non-endemic",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 11,
-              "end_row_offset_idx": 12,
-              "start_col_offset_idx": 5,
-              "end_col_offset_idx": 6,
-              "text": "Binary value",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 11,
-              "end_row_offset_idx": 12,
-              "start_col_offset_idx": 6,
-              "end_col_offset_idx": 7,
-              "text": "2018",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 11,
-              "end_row_offset_idx": 12,
-              "start_col_offset_idx": 7,
-              "end_col_offset_idx": 8,
-              "text": "Programmatic data",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 12,
-              "end_row_offset_idx": 13,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "MDA",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 12,
-              "end_row_offset_idx": 13,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "Drug efficacy",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 12,
-              "end_row_offset_idx": 13,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "Drug package",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 12,
-              "end_row_offset_idx": 13,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "DEC-ALB or IVM-ALB",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 12,
-              "end_row_offset_idx": 13,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "DEC-ALB",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 12,
-              "end_row_offset_idx": 13,
-              "start_col_offset_idx": 5,
-              "end_col_offset_idx": 6,
-              "text": "Binary value",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 12,
-              "end_row_offset_idx": 13,
-              "start_col_offset_idx": 6,
-              "end_col_offset_idx": 7,
-              "text": "2018",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 12,
-              "end_row_offset_idx": 13,
-              "start_col_offset_idx": 7,
-              "end_col_offset_idx": 8,
-              "text": "Programmatic data",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 13,
-              "end_row_offset_idx": 14,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "MDA",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 13,
-              "end_row_offset_idx": 14,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "Implementation of MDA",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 13,
-              "end_row_offset_idx": 14,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "Coverage",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 13,
-              "end_row_offset_idx": 14,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "Median MDA coverage for last 5 rounds",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 13,
-              "end_row_offset_idx": 14,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "\u2265 65%",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 13,
-              "end_row_offset_idx": 14,
-              "start_col_offset_idx": 5,
-              "end_col_offset_idx": 6,
-              "text": "Median",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 13,
-              "end_row_offset_idx": 14,
-              "start_col_offset_idx": 6,
-              "end_col_offset_idx": 7,
-              "text": "Varies",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 13,
-              "end_row_offset_idx": 14,
-              "start_col_offset_idx": 7,
-              "end_col_offset_idx": 8,
-              "text": "Programmatic data",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 14,
-              "end_row_offset_idx": 15,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "MDA",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 14,
-              "end_row_offset_idx": 15,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "Implementation of MDA",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 14,
-              "end_row_offset_idx": 15,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "Sufficient rounds",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 14,
-              "end_row_offset_idx": 15,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "Number of rounds of sufficient (\u2265 65% coverage) in last 5 years",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 14,
-              "end_row_offset_idx": 15,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "\u2265 3",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 14,
-              "end_row_offset_idx": 15,
-              "start_col_offset_idx": 5,
-              "end_col_offset_idx": 6,
-              "text": "Count",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 14,
-              "end_row_offset_idx": 15,
-              "start_col_offset_idx": 6,
-              "end_col_offset_idx": 7,
-              "text": "Varies",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 14,
-              "end_row_offset_idx": 15,
-              "start_col_offset_idx": 7,
-              "end_col_offset_idx": 8,
-              "text": "Programmatic data",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 15,
-              "end_row_offset_idx": 16,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "MDA",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 15,
-              "end_row_offset_idx": 16,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "Implementation of MDA",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 15,
-              "end_row_offset_idx": 16,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "Number of rounds",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 15,
-              "end_row_offset_idx": 16,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "Maximum number of recorded rounds of MDA",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 15,
-              "end_row_offset_idx": 16,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "\u2265 6",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 15,
-              "end_row_offset_idx": 16,
-              "start_col_offset_idx": 5,
-              "end_col_offset_idx": 6,
-              "text": "Maximum",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 15,
-              "end_row_offset_idx": 16,
-              "start_col_offset_idx": 6,
-              "end_col_offset_idx": 7,
-              "text": "Varies",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 15,
-              "end_row_offset_idx": 16,
-              "start_col_offset_idx": 7,
-              "end_col_offset_idx": 8,
-              "text": "Programmatic data",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 16,
-              "end_row_offset_idx": 17,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "Pre-TAS implementation",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 16,
-              "end_row_offset_idx": 17,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "Quality of survey",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 16,
-              "end_row_offset_idx": 17,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "Diagnostic method",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 16,
-              "end_row_offset_idx": 17,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "Using Mf or Ag",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 16,
-              "end_row_offset_idx": 17,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "Mf",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 16,
-              "end_row_offset_idx": 17,
-              "start_col_offset_idx": 5,
-              "end_col_offset_idx": 6,
-              "text": "Binary value",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 16,
-              "end_row_offset_idx": 17,
-              "start_col_offset_idx": 6,
-              "end_col_offset_idx": 7,
-              "text": "Varies",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 16,
-              "end_row_offset_idx": 17,
-              "start_col_offset_idx": 7,
-              "end_col_offset_idx": 8,
-              "text": "Programmatic data",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 17,
-              "end_row_offset_idx": 18,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "Pre-TAS implementation",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 17,
-              "end_row_offset_idx": 18,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "Quality of survey",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 17,
-              "end_row_offset_idx": 18,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "Diagnostic test",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 17,
-              "end_row_offset_idx": 18,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "Using Mf, ICT, or FTS",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 17,
-              "end_row_offset_idx": 18,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "Mf",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 17,
-              "end_row_offset_idx": 18,
-              "start_col_offset_idx": 5,
-              "end_col_offset_idx": 6,
-              "text": "Categorical",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 17,
-              "end_row_offset_idx": 18,
-              "start_col_offset_idx": 6,
-              "end_col_offset_idx": 7,
-              "text": "Varies",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 17,
-              "end_row_offset_idx": 18,
-              "start_col_offset_idx": 7,
-              "end_col_offset_idx": 8,
-              "text": "Programmatic data",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ]
-        ]
-      }
-    },
-    {
-      "self_ref": "#/tables/1",
-      "parent": {
-        "$ref": "#/texts/53"
-      },
-      "children": [],
-      "label": "table",
-      "prov": [],
-      "captions": [
-        {
-          "$ref": "#/texts/55"
-        }
-      ],
-      "references": [],
-      "footnotes": [],
-      "data": {
-        "table_cells": [
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 0,
-            "end_row_offset_idx": 1,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 0,
-            "end_row_offset_idx": 1,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 0,
-            "end_row_offset_idx": 1,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "(1)",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 0,
-            "end_row_offset_idx": 1,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "(2)",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 0,
-            "end_row_offset_idx": 1,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "(3)",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 0,
-            "end_row_offset_idx": 1,
-            "start_col_offset_idx": 5,
-            "end_col_offset_idx": 6,
-            "text": "(4)",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 1,
-            "end_row_offset_idx": 2,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 1,
-            "end_row_offset_idx": 2,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "Full Model",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 1,
-            "end_row_offset_idx": 2,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "Without Cameroon districts",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 1,
-            "end_row_offset_idx": 2,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "Only districts in Africa",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 1,
-            "end_row_offset_idx": 2,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "Only W. bancrofti parasite districts",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 1,
-            "end_row_offset_idx": 2,
-            "start_col_offset_idx": 5,
-            "end_col_offset_idx": 6,
-            "text": "Only Anopheles vector districts",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 2,
-            "end_row_offset_idx": 3,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "Number of Failures",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 2,
-            "end_row_offset_idx": 3,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "74",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 2,
-            "end_row_offset_idx": 3,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "74",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 2,
-            "end_row_offset_idx": 3,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "44",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 2,
-            "end_row_offset_idx": 3,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "72",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 2,
-            "end_row_offset_idx": 3,
-            "start_col_offset_idx": 5,
-            "end_col_offset_idx": 6,
-            "text": "46",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 3,
-            "end_row_offset_idx": 4,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "\u00a0Number of total districts",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 3,
-            "end_row_offset_idx": 4,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "(N = 554)",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 3,
-            "end_row_offset_idx": 4,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "(N = 420)",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 3,
-            "end_row_offset_idx": 4,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "(N = 407)",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 3,
-            "end_row_offset_idx": 4,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "(N = 518)",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 3,
-            "end_row_offset_idx": 4,
-            "start_col_offset_idx": 5,
-            "end_col_offset_idx": 6,
-            "text": "(N = 414)",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 4,
-            "end_row_offset_idx": 5,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "Covariate",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 4,
-            "end_row_offset_idx": 5,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "RR (95% CI)",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 4,
-            "end_row_offset_idx": 5,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "RR (95% CI)",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 4,
-            "end_row_offset_idx": 5,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "RR (95% CI)",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 4,
-            "end_row_offset_idx": 5,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "RR (95% CI)",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 4,
-            "end_row_offset_idx": 5,
-            "start_col_offset_idx": 5,
-            "end_col_offset_idx": 6,
-            "text": "RR (95% CI)",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 5,
-            "end_row_offset_idx": 6,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "Baseline prevalence > = 10% & used FTS test",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 5,
-            "end_row_offset_idx": 6,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "2.38 (0.96\u20135.90)",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 5,
-            "end_row_offset_idx": 6,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "1.23 (0.52\u20132.92)",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 5,
-            "end_row_offset_idx": 6,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "14.52 (1.79\u2013117.82)",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 5,
-            "end_row_offset_idx": 6,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "2.61 (1.03\u20136.61)",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 5,
-            "end_row_offset_idx": 6,
-            "start_col_offset_idx": 5,
-            "end_col_offset_idx": 6,
-            "text": "15.80 (1.95\u2013127.67)",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 6,
-            "end_row_offset_idx": 7,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "Baseline prevalence > = 10% & used ICT test",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 6,
-            "end_row_offset_idx": 7,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "0.80 (0.20\u20133.24)",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 6,
-            "end_row_offset_idx": 7,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "0.42 (0.11\u20131.68)",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 6,
-            "end_row_offset_idx": 7,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "1.00 (0.00\u20130.00)",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 6,
-            "end_row_offset_idx": 7,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "0.88 (0.21\u20133.60)",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 6,
-            "end_row_offset_idx": 7,
-            "start_col_offset_idx": 5,
-            "end_col_offset_idx": 6,
-            "text": "1.00 (0.00\u20130.00)",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 7,
-            "end_row_offset_idx": 8,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "+Used FTS test",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 7,
-            "end_row_offset_idx": 8,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "1.16 (0.52\u20132.59)",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 7,
-            "end_row_offset_idx": 8,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "2.40 (1.12\u20135.11)",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 7,
-            "end_row_offset_idx": 8,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "0.15 (0.02\u20131.11)",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 7,
-            "end_row_offset_idx": 8,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "1.03 (0.45\u20132.36)",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 7,
-            "end_row_offset_idx": 8,
-            "start_col_offset_idx": 5,
-            "end_col_offset_idx": 6,
-            "text": "0.13 (0.02\u20130.96)",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 8,
-            "end_row_offset_idx": 9,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "+Used ICT test",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 8,
-            "end_row_offset_idx": 9,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "0.92 (0.32\u20132.67)",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 8,
-            "end_row_offset_idx": 9,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "1.47 (0.51\u20134.21)",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 8,
-            "end_row_offset_idx": 9,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "0.33 (0.04\u20132.54)",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 8,
-            "end_row_offset_idx": 9,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "0.82 (0.28\u20132.43)",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 8,
-            "end_row_offset_idx": 9,
-            "start_col_offset_idx": 5,
-            "end_col_offset_idx": 6,
-            "text": "0.27 (0.03\u20132.04)",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 9,
-            "end_row_offset_idx": 10,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "+Baseline prevalence > = 10%",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 9,
-            "end_row_offset_idx": 10,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "2.52 (1.37\u20134.64)",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 9,
-            "end_row_offset_idx": 10,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "2.42 (1.31\u20134.47)",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 9,
-            "end_row_offset_idx": 10,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "2.03 (1.06\u20133.90)",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 9,
-            "end_row_offset_idx": 10,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "2.30 (1.21\u20134.36)",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 9,
-            "end_row_offset_idx": 10,
-            "start_col_offset_idx": 5,
-            "end_col_offset_idx": 6,
-            "text": "2.01 (1.07\u20133.77)",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 10,
-            "end_row_offset_idx": 11,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "Elevation < 350m",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 10,
-            "end_row_offset_idx": 11,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "3.07 (1.95\u20134.83)",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 10,
-            "end_row_offset_idx": 11,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "2.21 (1.42\u20133.43)",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 10,
-            "end_row_offset_idx": 11,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "4.68 (2.22\u20139.87)",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 10,
-            "end_row_offset_idx": 11,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "3.04 (1.93\u20134.79)",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 10,
-            "end_row_offset_idx": 11,
-            "start_col_offset_idx": 5,
-            "end_col_offset_idx": 6,
-            "text": "3.76 (1.92\u20137.37)",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          }
-        ],
-        "num_rows": 11,
-        "num_cols": 6,
-        "grid": [
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 0,
-              "end_row_offset_idx": 1,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 0,
-              "end_row_offset_idx": 1,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 0,
-              "end_row_offset_idx": 1,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "(1)",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 0,
-              "end_row_offset_idx": 1,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "(2)",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 0,
-              "end_row_offset_idx": 1,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "(3)",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 0,
-              "end_row_offset_idx": 1,
-              "start_col_offset_idx": 5,
-              "end_col_offset_idx": 6,
-              "text": "(4)",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 1,
-              "end_row_offset_idx": 2,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 1,
-              "end_row_offset_idx": 2,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "Full Model",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 1,
-              "end_row_offset_idx": 2,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "Without Cameroon districts",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 1,
-              "end_row_offset_idx": 2,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "Only districts in Africa",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 1,
-              "end_row_offset_idx": 2,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "Only W. bancrofti parasite districts",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 1,
-              "end_row_offset_idx": 2,
-              "start_col_offset_idx": 5,
-              "end_col_offset_idx": 6,
-              "text": "Only Anopheles vector districts",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 2,
-              "end_row_offset_idx": 3,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "Number of Failures",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 2,
-              "end_row_offset_idx": 3,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "74",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 2,
-              "end_row_offset_idx": 3,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "74",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 2,
-              "end_row_offset_idx": 3,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "44",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 2,
-              "end_row_offset_idx": 3,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "72",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 2,
-              "end_row_offset_idx": 3,
-              "start_col_offset_idx": 5,
-              "end_col_offset_idx": 6,
-              "text": "46",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 3,
-              "end_row_offset_idx": 4,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "\u00a0Number of total districts",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 3,
-              "end_row_offset_idx": 4,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "(N = 554)",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 3,
-              "end_row_offset_idx": 4,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "(N = 420)",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 3,
-              "end_row_offset_idx": 4,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "(N = 407)",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 3,
-              "end_row_offset_idx": 4,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "(N = 518)",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 3,
-              "end_row_offset_idx": 4,
-              "start_col_offset_idx": 5,
-              "end_col_offset_idx": 6,
-              "text": "(N = 414)",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 4,
-              "end_row_offset_idx": 5,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "Covariate",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 4,
-              "end_row_offset_idx": 5,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "RR (95% CI)",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 4,
-              "end_row_offset_idx": 5,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "RR (95% CI)",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 4,
-              "end_row_offset_idx": 5,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "RR (95% CI)",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 4,
-              "end_row_offset_idx": 5,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "RR (95% CI)",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 4,
-              "end_row_offset_idx": 5,
-              "start_col_offset_idx": 5,
-              "end_col_offset_idx": 6,
-              "text": "RR (95% CI)",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 5,
-              "end_row_offset_idx": 6,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "Baseline prevalence > = 10% & used FTS test",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 5,
-              "end_row_offset_idx": 6,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "2.38 (0.96\u20135.90)",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 5,
-              "end_row_offset_idx": 6,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "1.23 (0.52\u20132.92)",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 5,
-              "end_row_offset_idx": 6,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "14.52 (1.79\u2013117.82)",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 5,
-              "end_row_offset_idx": 6,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "2.61 (1.03\u20136.61)",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 5,
-              "end_row_offset_idx": 6,
-              "start_col_offset_idx": 5,
-              "end_col_offset_idx": 6,
-              "text": "15.80 (1.95\u2013127.67)",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 6,
-              "end_row_offset_idx": 7,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "Baseline prevalence > = 10% & used ICT test",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 6,
-              "end_row_offset_idx": 7,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "0.80 (0.20\u20133.24)",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 6,
-              "end_row_offset_idx": 7,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "0.42 (0.11\u20131.68)",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 6,
-              "end_row_offset_idx": 7,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "1.00 (0.00\u20130.00)",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 6,
-              "end_row_offset_idx": 7,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "0.88 (0.21\u20133.60)",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 6,
-              "end_row_offset_idx": 7,
-              "start_col_offset_idx": 5,
-              "end_col_offset_idx": 6,
-              "text": "1.00 (0.00\u20130.00)",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 7,
-              "end_row_offset_idx": 8,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "+Used FTS test",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 7,
-              "end_row_offset_idx": 8,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "1.16 (0.52\u20132.59)",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 7,
-              "end_row_offset_idx": 8,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "2.40 (1.12\u20135.11)",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 7,
-              "end_row_offset_idx": 8,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "0.15 (0.02\u20131.11)",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 7,
-              "end_row_offset_idx": 8,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "1.03 (0.45\u20132.36)",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 7,
-              "end_row_offset_idx": 8,
-              "start_col_offset_idx": 5,
-              "end_col_offset_idx": 6,
-              "text": "0.13 (0.02\u20130.96)",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 8,
-              "end_row_offset_idx": 9,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "+Used ICT test",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 8,
-              "end_row_offset_idx": 9,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "0.92 (0.32\u20132.67)",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 8,
-              "end_row_offset_idx": 9,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "1.47 (0.51\u20134.21)",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 8,
-              "end_row_offset_idx": 9,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "0.33 (0.04\u20132.54)",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 8,
-              "end_row_offset_idx": 9,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "0.82 (0.28\u20132.43)",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 8,
-              "end_row_offset_idx": 9,
-              "start_col_offset_idx": 5,
-              "end_col_offset_idx": 6,
-              "text": "0.27 (0.03\u20132.04)",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 9,
-              "end_row_offset_idx": 10,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "+Baseline prevalence > = 10%",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 9,
-              "end_row_offset_idx": 10,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "2.52 (1.37\u20134.64)",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 9,
-              "end_row_offset_idx": 10,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "2.42 (1.31\u20134.47)",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 9,
-              "end_row_offset_idx": 10,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "2.03 (1.06\u20133.90)",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 9,
-              "end_row_offset_idx": 10,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "2.30 (1.21\u20134.36)",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 9,
-              "end_row_offset_idx": 10,
-              "start_col_offset_idx": 5,
-              "end_col_offset_idx": 6,
-              "text": "2.01 (1.07\u20133.77)",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 10,
-              "end_row_offset_idx": 11,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "Elevation < 350m",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 10,
-              "end_row_offset_idx": 11,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "3.07 (1.95\u20134.83)",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 10,
-              "end_row_offset_idx": 11,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "2.21 (1.42\u20133.43)",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 10,
-              "end_row_offset_idx": 11,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "4.68 (2.22\u20139.87)",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 10,
-              "end_row_offset_idx": 11,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "3.04 (1.93\u20134.79)",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 10,
-              "end_row_offset_idx": 11,
-              "start_col_offset_idx": 5,
-              "end_col_offset_idx": 6,
-              "text": "3.76 (1.92\u20137.37)",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ]
-        ]
-      }
-    }
-  ],
-  "key_value_items": [],
-  "pages": {}
-}
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v2/pntd.0008301.xml.md b/tests/data/groundtruth/docling_v2/pntd.0008301.xml.md
index 2a0896cb..384edc3f 100644
--- a/tests/data/groundtruth/docling_v2/pntd.0008301.xml.md
+++ b/tests/data/groundtruth/docling_v2/pntd.0008301.xml.md
@@ -1,10 +1,16 @@
 # Risk factors associated with failing pre-transmission assessment surveys (pre-TAS) in lymphatic filariasis elimination programs: Results of a multi-country analysis
 
-Burgert-Brucker Clara R.; 1: Global Health Division, RTI International, Washington, DC, United States of America; Zoerhoff Kathryn L.; 1: Global Health Division, RTI International, Washington, DC, United States of America; Headland Maureen; 1: Global Health Division, RTI International, Washington, DC, United States of America, 2: Global Health, Population, and Nutrition, FHI 360, Washington, DC, United States of America; Shoemaker Erica A.; 1: Global Health Division, RTI International, Washington, DC, United States of America; Stelmach Rachel; 1: Global Health Division, RTI International, Washington, DC, United States of America; Karim Mohammad Jahirul; 3: Department of Disease Control, Ministry of Health and Family Welfare, Dhaka, Bangladesh; Batcho Wilfrid; 4: National Control Program of Communicable Diseases, Ministry of Health, Cotonou, Benin; Bougouma Clarisse; 5: Lymphatic Filariasis Elimination Program, Ministère de la Santé, Ouagadougou, Burkina Faso; Bougma Roland; 5: Lymphatic Filariasis Elimination Program, Ministère de la Santé, Ouagadougou, Burkina Faso; Benjamin Didier Biholong; 6: National Onchocerciasis and Lymphatic Filariasis Control Program, Ministry of Health, Yaounde, Cameroon; Georges Nko'Ayissi; 6: National Onchocerciasis and Lymphatic Filariasis Control Program, Ministry of Health, Yaounde, Cameroon; Marfo Benjamin; 7: Neglected Tropical Diseases Programme, Ghana Health Service, Accra, Ghana; Lemoine Jean Frantz; 8: Ministry of Health, Port-au-Prince, Haiti; Pangaribuan Helena Ullyartha; 9: National Institute Health Research & Development, Ministry of Health, Jakarta, Indonesia; Wijayanti Eksi; 9: National Institute Health Research & Development, Ministry of Health, Jakarta, Indonesia; Coulibaly Yaya Ibrahim; 10: Filariasis Unit, International Center of Excellence in Research, Faculty of Medicine and Odontostomatology, Bamako, Mali; Doumbia Salif Seriba; 10: Filariasis Unit, International Center of Excellence in Research, Faculty of Medicine and Odontostomatology, Bamako, Mali; Rimal Pradip; 11: Epidemiology and Disease Control Division, Department of Health Service, Kathmandu, Nepal; Salissou Adamou Bacthiri; 12: Programme Onchocercose et Filariose Lymphatique, Ministère de la Santé, Niamey, Niger; Bah Yukaba; 13: National Neglected Tropical Disease Program, Ministry of Health and Sanitation, Freetown, Sierra Leone; Mwingira Upendo; 14: Neglected Tropical Disease Control Programme, National Institute for Medical Research, Dar es Salaam, Tanzania; Nshala Andreas; 15: IMA World Health/Tanzania NTD Control Programme, Uppsala University, & TIBA Fellow, Dar es Salaam, Tanzania; Muheki Edridah; 16: Programme to Eliminate Lymphatic Filariasis, Ministry of Health, Kampala, Uganda; Shott Joseph; 17: Division of Neglected Tropical Diseases, Office of Infectious Diseases, Bureau for Global Health, USAID, Washington, DC, United States of America; Yevstigneyeva Violetta; 17: Division of Neglected Tropical Diseases, Office of Infectious Diseases, Bureau for Global Health, USAID, Washington, DC, United States of America; Ndayishimye Egide; 2: Global Health, Population, and Nutrition, FHI 360, Washington, DC, United States of America; Baker Margaret; 1: Global Health Division, RTI International, Washington, DC, United States of America; Kraemer John; 1: Global Health Division, RTI International, Washington, DC, United States of America, 18: Georgetown University, Washington, DC, United States of America; Brady Molly; 1: Global Health Division, RTI International, Washington, DC, United States of America
+Clara R. Burgert-Brucker, Kathryn L. Zoerhoff, Maureen Headland, Erica A. Shoemaker, Rachel Stelmach, Mohammad Jahirul Karim, Wilfrid Batcho, Clarisse Bougouma, Roland Bougma, Biholong Benjamin Didier, Nko'Ayissi Georges, Benjamin Marfo, Jean Frantz Lemoine, Helena Ullyartha Pangaribuan, Eksi Wijayanti, Yaya Ibrahim Coulibaly, Salif Seriba Doumbia, Pradip Rimal, Adamou Bacthiri Salissou, Yukaba Bah, Upendo Mwingira, Andreas Nshala, Edridah Muheki, Joseph Shott, Violetta Yevstigneyeva, Egide Ndayishimye, Margaret Baker, John Kraemer, Molly Brady
+
+Global Health Division, RTI International, Washington, DC, United States of America; Global Health, Population, and Nutrition, FHI 360, Washington, DC, United States of America; Department of Disease Control, Ministry of Health and Family Welfare, Dhaka, Bangladesh; National Control Program of Communicable Diseases, Ministry of Health, Cotonou, Benin; Lymphatic Filariasis Elimination Program, Ministère de la Santé, Ouagadougou, Burkina Faso; National Onchocerciasis and Lymphatic Filariasis Control Program, Ministry of Health, Yaounde, Cameroon; Neglected Tropical Diseases Programme, Ghana Health Service, Accra, Ghana; Ministry of Health, Port-au-Prince, Haiti; National Institute Health Research &amp; Development, Ministry of Health, Jakarta, Indonesia; Filariasis Unit, International Center of Excellence in Research, Faculty of Medicine and Odontostomatology, Bamako, Mali; Epidemiology and Disease Control Division, Department of Health Service, Kathmandu, Nepal; Programme Onchocercose et Filariose Lymphatique, Ministère de la Santé, Niamey, Niger; National Neglected Tropical Disease Program, Ministry of Health and Sanitation, Freetown, Sierra Leone; Neglected Tropical Disease Control Programme, National Institute for Medical Research, Dar es Salaam, Tanzania; IMA World Health/Tanzania NTD Control Programme, Uppsala University, &amp; TIBA Fellow, Dar es Salaam, Tanzania; Programme to Eliminate Lymphatic Filariasis, Ministry of Health, Kampala, Uganda; Division of Neglected Tropical Diseases, Office of Infectious Diseases, Bureau for Global Health, USAID, Washington, DC, United States of America; Georgetown University, Washington, DC, United States of America
 
 ## Abstract
 
-Achieving elimination of lymphatic filariasis (LF) as a public health problem requires a minimum of five effective rounds of mass drug administration (MDA) and demonstrating low prevalence in subsequent assessments. The first assessments recommended by the World Health Organization (WHO) are sentinel and spot-check sites—referred to as pre-transmission assessment surveys (pre-TAS)—in each implementation unit after MDA. If pre-TAS shows that prevalence in each site has been lowered to less than 1% microfilaremia or less than 2% antigenemia, the implementation unit conducts a TAS to determine whether MDA can be stopped. Failure to pass pre-TAS means that further rounds of MDA are required. This study aims to understand factors influencing pre-TAS results using existing programmatic data from 554 implementation units, of which 74 (13%) failed, in 13 countries. Secondary data analysis was completed using existing data from Bangladesh, Benin, Burkina Faso, Cameroon, Ghana, Haiti, Indonesia, Mali, Nepal, Niger, Sierra Leone, Tanzania, and Uganda. Additional covariate data were obtained from spatial raster data sets. Bivariate analysis and multilinear regression were performed to establish potential relationships between variables and the pre-TAS result. Higher baseline prevalence and lower elevation were significant in the regression model. Variables statistically significantly associated with failure (p-value ≤0.05) in the bivariate analyses included baseline prevalence at or above 5% or 10%, use of Filariasis Test Strips (FTS), primary vector of Culex, treatment with diethylcarbamazine-albendazole, higher elevation, higher population density, higher enhanced vegetation index (EVI), higher annual rainfall, and 6 or more rounds of MDA. This paper reports for the first time factors associated with pre-TAS results from a multi-country analysis. This information can help countries more effectively forecast program activities, such as the potential need for more rounds of MDA, and prioritize resources to ensure adequate coverage of all persons in areas at highest risk of failing pre-TAS.Author summaryAchieving elimination of lymphatic filariasis (LF) as a public health problem requires a minimum of five rounds of mass drug administration (MDA) and being able to demonstrate low prevalence in several subsequent assessments. LF elimination programs implement sentinel and spot-check site assessments, called pre-TAS, to determine whether districts are eligible to implement more rigorous population-based surveys to determine whether MDA can be stopped or if further rounds are required. Reasons for failing pre-TAS are not well understood and have not previously been examined with data compiled from multiple countries. For this analysis, we analyzed data from routine USAID and WHO reports from Bangladesh, Benin, Burkina Faso, Cameroon, Ghana, Haiti, Indonesia, Mali, Nepal, Niger, Sierra Leone, Tanzania, and Uganda. In a model that included multiple variables, high baseline prevalence and lower elevation were significant. In models comparing only one variable to the outcome, the following were statistically significantly associated with failure: higher baseline prevalence at or above 5% or 10%, use of the FTS, primary vector of Culex, treatment with diethylcarbamazine-albendazole, lower elevation, higher population density, higher Enhanced Vegetation Index, higher annual rainfall, and six or more rounds of mass drug administration. These results can help national programs plan MDA more effectively, e.g., by focusing resources on areas with higher baseline prevalence and/or lower elevation.
+Achieving elimination of lymphatic filariasis (LF) as a public health problem requires a minimum of five effective rounds of mass drug administration (MDA) and demonstrating low prevalence in subsequent assessments. The first assessments recommended by the World Health Organization (WHO) are sentinel and spot-check sites—referred to as pre-transmission assessment surveys (pre-TAS)—in each implementation unit after MDA. If pre-TAS shows that prevalence in each site has been lowered to less than 1% microfilaremia or less than 2% antigenemia, the implementation unit conducts a TAS to determine whether MDA can be stopped. Failure to pass pre-TAS means that further rounds of MDA are required. This study aims to understand factors influencing pre-TAS results using existing programmatic data from 554 implementation units, of which 74 (13%) failed, in 13 countries. Secondary data analysis was completed using existing data from Bangladesh, Benin, Burkina Faso, Cameroon, Ghana, Haiti, Indonesia, Mali, Nepal, Niger, Sierra Leone, Tanzania, and Uganda. Additional covariate data were obtained from spatial raster data sets. Bivariate analysis and multilinear regression were performed to establish potential relationships between variables and the pre-TAS result. Higher baseline prevalence and lower elevation were significant in the regression model. Variables statistically significantly associated with failure (p-value ≤0.05) in the bivariate analyses included baseline prevalence at or above 5% or 10%, use of Filariasis Test Strips (FTS), primary vector of Culex, treatment with diethylcarbamazine-albendazole, higher elevation, higher population density, higher enhanced vegetation index (EVI), higher annual rainfall, and 6 or more rounds of MDA. This paper reports for the first time factors associated with pre-TAS results from a multi-country analysis. This information can help countries more effectively forecast program activities, such as the potential need for more rounds of MDA, and prioritize resources to ensure adequate coverage of all persons in areas at highest risk of failing pre-TAS.
+
+## Author summary
+
+Achieving elimination of lymphatic filariasis (LF) as a public health problem requires a minimum of five rounds of mass drug administration (MDA) and being able to demonstrate low prevalence in several subsequent assessments. LF elimination programs implement sentinel and spot-check site assessments, called pre-TAS, to determine whether districts are eligible to implement more rigorous population-based surveys to determine whether MDA can be stopped or if further rounds are required. Reasons for failing pre-TAS are not well understood and have not previously been examined with data compiled from multiple countries. For this analysis, we analyzed data from routine USAID and WHO reports from Bangladesh, Benin, Burkina Faso, Cameroon, Ghana, Haiti, Indonesia, Mali, Nepal, Niger, Sierra Leone, Tanzania, and Uganda. In a model that included multiple variables, high baseline prevalence and lower elevation were significant. In models comparing only one variable to the outcome, the following were statistically significantly associated with failure: higher baseline prevalence at or above 5% or 10%, use of the FTS, primary vector of Culex, treatment with diethylcarbamazine-albendazole, lower elevation, higher population density, higher Enhanced Vegetation Index, higher annual rainfall, and six or more rounds of mass drug administration. These results can help national programs plan MDA more effectively, e.g., by focusing resources on areas with higher baseline prevalence and/or lower elevation.
 
 ## Introduction
 
@@ -24,6 +30,28 @@ This is a secondary data analysis using existing data, collected for programmati
 
 Building on previous work, we delineated five domains of variables that could influence pre-TAS outcomes: prevalence, agent, environment, MDA, and pre-TAS implementation (Table 1) [6–8]. We prioritized key concepts that could be measured through our data or captured through publicly available global geospatial data sets.
 
+Table 1 Categorization of potential factors influencing pre-TAS results.
+
+| Domain                 | Factor                | Covariate                     | Description                                                     | Reference Group      | Summary statistic   | Temporal Resolution   | Source             |
+|------------------------|-----------------------|-------------------------------|-----------------------------------------------------------------|----------------------|---------------------|-----------------------|--------------------|
+| Prevalence             | Baseline prevalence   | 5% cut off                    | Maximum reported mapping or baseline sentinel site prevalence   | &lt;5%                  | Maximum             | Varies                | Programmatic data  |
+| Prevalence             | Baseline prevalence   | 10% cut off                   | Maximum reported mapping or baseline sentinel site prevalence   | &lt;10%                 | Maximum             | Varies                | Programmatic data  |
+| Agent                  | Parasite              | Parasite                      | Predominate parasite in district                                | W. bancrofti &amp; mixed | Binary value        | 2018                  | Programmatic data  |
+| Environment            | Vector                | Vector                        | Predominate vector in district                                  | Anopheles &amp; Mansonia | Binary value        | 2018                  | Country expert     |
+| Environment            | Geography             | Elevation                     | Elevation measured in meters                                    | &gt;350                 | Mean                | 2000                  | CGIAR-CSI SRTM [9] |
+| Environment            | Geography             | District area                 | Area measured in km2                                            | &gt;2,500               | Maximum sum         | Static                | Programmatic data  |
+| Environment            | Climate               | EVI                           | Enhanced vegetation index                                       | &gt; 0.3                | Mean                | 2015                  | MODIS [10]         |
+| Environment            | Climate               | Rainfall                      | Annual rainfall measured in mm                                  | ≤ 700                | Mean                | 2015                  | CHIRPS [11]        |
+| Environment            | Socio-economic        | Population density            | Number of people per km2                                        | ≤ 100                | Mean                | 2015                  | WorldPop [12]      |
+| Environment            | Socio-economic        | Nighttime lights              | Nighttime light index from 0 to 63                              | &gt;1.5                 | Mean                | 2015                  | VIIRS [13]         |
+| Environment            | Co-endemicity         | Co-endemic for onchocerciasis | Part or all of district is also endemic for onchocerciases      | Non-endemic          | Binary value        | 2018                  | Programmatic data  |
+| MDA                    | Drug efficacy         | Drug package                  | DEC-ALB or IVM-ALB                                              | DEC-ALB              | Binary value        | 2018                  | Programmatic data  |
+| MDA                    | Implementation of MDA | Coverage                      | Median MDA coverage for last 5 rounds                           | ≥ 65%                | Median              | Varies                | Programmatic data  |
+| MDA                    | Implementation of MDA | Sufficient rounds             | Number of rounds of sufficient (≥ 65% coverage) in last 5 years | ≥ 3                  | Count               | Varies                | Programmatic data  |
+| MDA                    | Implementation of MDA | Number of rounds              | Maximum number of recorded rounds of MDA                        | ≥ 6                  | Maximum             | Varies                | Programmatic data  |
+| Pre-TAS implementation | Quality of survey     | Diagnostic method             | Using Mf or Ag                                                  | Mf                   | Binary value        | Varies                | Programmatic data  |
+| Pre-TAS implementation | Quality of survey     | Diagnostic test               | Using Mf, ICT, or FTS                                           | Mf                   | Categorical         | Varies                | Programmatic data  |
+
 ### Data sources
 
 Information on baseline prevalence, MDA coverage, the number of MDA rounds, and pre-TAS information (month and year of survey, district, site name, and outcome) was gathered through regular reporting for the USAID-funded NTD programs (ENVISION, END in Africa, and END in Asia). These data were augmented by other reporting data such as the country’s dossier data annexes, the WHO Preventive Chemotherapy and Transmission Control Databank, and WHO reporting forms. Data were then reviewed by country experts, including the Ministry of Health program staff and implementing program staff, and updated as necessary. Data on vectors were also obtained from country experts. The district geographic boundaries were matched to geospatial shapefiles from the ENVISION project geospatial data repository, while other geospatial data were obtained through publicly available sources (Table 1).
@@ -36,7 +64,7 @@ Potential covariates were derived from the available data for each factor in the
 
 #### Baseline prevalence
 
-Baseline prevalence can be assumed as a proxy for local transmission conditions [14] and correlates with prevalence after MDA [14–20]. Baseline prevalence for each district was measured by either blood smears to measure Mf or rapid diagnostic tests to measure Ag. Other studies have modeled Mf and Ag prevalence separately, due to lack of a standardized correlation between the two, especially at pre-MDA levels [21,22]. However, because WHO mapping guidance states that MDA is required if either Mf or Ag is ≥1% and there were not enough data to model each separately, we combined baseline prevalence values regardless of diagnostic test used. We created two variables for use in the analysis (1) using the cut-off of <5% or ≥5% (dataset median value of 5%) and (2) using the cut-off of <10% or ≥10%.
+Baseline prevalence can be assumed as a proxy for local transmission conditions [14] and correlates with prevalence after MDA [14–20]. Baseline prevalence for each district was measured by either blood smears to measure Mf or rapid diagnostic tests to measure Ag. Other studies have modeled Mf and Ag prevalence separately, due to lack of a standardized correlation between the two, especially at pre-MDA levels [21,22]. However, because WHO mapping guidance states that MDA is required if either Mf or Ag is ≥1% and there were not enough data to model each separately, we combined baseline prevalence values regardless of diagnostic test used. We created two variables for use in the analysis (1) using the cut-off of &lt;5% or ≥5% (dataset median value of 5%) and (2) using the cut-off of &lt;10% or ≥10%.
 
 #### Agent
 
@@ -74,25 +102,60 @@ Sensitivity analysis was performed for the final log-binomial model to test for
 
 The overall pre-TAS pass rate for the districts included in this analysis was 87% (74 failures in 554 districts). Nearly 40% of the 554 districts were from Cameroon (134) and Tanzania (87) (Fig 1). No districts in Bangladesh, Cameroon, Mali, or Uganda failed a pre-TAS in this data set; over 25% of districts in Burkina Faso, Ghana, Haiti, Nepal, and Sierra Leone failed pre-TAS in this data set. Baseline prevalence varied widely within and between the 13 countries. Fig 2 shows the highest, lowest, and median baseline prevalence in the study districts by country. Burkina Faso had the highest median baseline prevalence at 52% and Burkina Faso, Tanzania, and Ghana all had at least one district with a very high baseline of over 70%. In Mali, Indonesia, Benin, and Bangladesh, all districts had baseline prevalences below 20%.
 
+Fig 1 Number of pre-TAS by country.
+
+<!-- image -->
+
+Fig 2 District-level baseline prevalence by country.
+
+<!-- image -->
+
 Fig 3 shows the unadjusted analysis for key variables by pre-TAS result. Variables statistically significantly associated with failure (p-value ≤0.05) included higher baseline prevalence at or above 5% or 10%, FTS diagnostic test, primary vector of Culex, treatment with DEC-ALB, higher elevation, higher population density, higher EVI, higher annual rainfall, and six or more rounds of MDA. Variables that were not significantly associated with pre-TAS failure included diagnostic method used (Ag or Mf), parasite, co-endemicity for onchocerciasis, median MDA coverage, and sufficient rounds of MDA.
 
+Fig 3 Percent pre-TAS failure by each characteristic (unadjusted).
+
+<!-- image -->
+
 The final log-binomial model included the variables of baseline prevalence ≥10%, the diagnostic test used (FTS and ICT), and elevation. The final model also included a significant interaction term between high baseline and diagnostic test used.
 
 Fig 4 shows the risk ratio results with their corresponding confidence intervals. In a model with interaction between baseline and diagnostic test the baseline parameter was significant while diagnostic test and the interaction term were not. Districts with high baseline had a statistically significant (p-value ≤0.05) 2.52 times higher risk of failure (95% CI 1.37–4.64) compared to those with low baseline prevalence. The FTS diagnostic test or ICT diagnostic test alone were not significant nor was the interaction term. Additionally, districts with an elevation below 350 meters had a statistically significant (p-value ≤0.05) 3.07 times higher risk of failing pre-TAS (95% CI 1.95–4.83).
 
+Fig 4 Adjusted risk ratios for pre-TAS failure with 95% Confidence Interval from log-binomial model.
+
+<!-- image -->
+
 Sensitivity analyses were conducted using the same model with different subsets of the dataset including (1) all districts except for districts in Cameroon (134 total with no failures), (2) only districts in Africa, (3) only districts with W. bancrofti, and (4) only districts with Anopheles as primary vector. The results of the sensitivity models (Table 2) indicate an overall robust model. High baseline and lower elevation remained significant across all the models. The ICT diagnostic test used remains insignificant across all models. The FTS diagnostic test was positively significant in model 1 and negatively significant in model 4. The interaction term of baseline prevalence and FTS diagnostic test was significant in three models though the estimate was unstable in the W. bancrofti-only and Anopheles-only models (models 3 and 4 respectively), as signified by large confidence intervals.
 
+Table 2 Adjusted risk ratios for pre-TAS failure from log-binomial model sensitivity analysis.
+
+|                                             |                  | (1)                        | (2)                      | (3)                                  | (4)                             |
+|---------------------------------------------|------------------|----------------------------|--------------------------|--------------------------------------|---------------------------------|
+|                                             | Full Model       | Without Cameroon districts | Only districts in Africa | Only W. bancrofti parasite districts | Only Anopheles vector districts |
+| Number of Failures                          | 74               | 74                         | 44                       | 72                                   | 46                              |
+| Number of total districts                   | (N = 554)        | (N = 420)                  | (N = 407)                | (N = 518)                            | (N = 414)                       |
+| Covariate                                   | RR (95% CI)      | RR (95% CI)                | RR (95% CI)              | RR (95% CI)                          | RR (95% CI)                     |
+| Baseline prevalence &gt; = 10% &amp; used FTS test | 2.38 (0.96–5.90) | 1.23 (0.52–2.92)           | 14.52 (1.79–117.82)      | 2.61 (1.03–6.61)                     | 15.80 (1.95–127.67)             |
+| Baseline prevalence &gt; = 10% &amp; used ICT test | 0.80 (0.20–3.24) | 0.42 (0.11–1.68)           | 1.00 (0.00–0.00)         | 0.88 (0.21–3.60)                     | 1.00 (0.00–0.00)                |
+| +Used FTS test                              | 1.16 (0.52–2.59) | 2.40 (1.12–5.11)           | 0.15 (0.02–1.11)         | 1.03 (0.45–2.36)                     | 0.13 (0.02–0.96)                |
+| +Used ICT test                              | 0.92 (0.32–2.67) | 1.47 (0.51–4.21)           | 0.33 (0.04–2.54)         | 0.82 (0.28–2.43)                     | 0.27 (0.03–2.04)                |
+| +Baseline prevalence &gt; = 10%                | 2.52 (1.37–4.64) | 2.42 (1.31–4.47)           | 2.03 (1.06–3.90)         | 2.30 (1.21–4.36)                     | 2.01 (1.07–3.77)                |
+| Elevation &lt; 350m                            | 3.07 (1.95–4.83) | 2.21 (1.42–3.43)           | 4.68 (2.22–9.87)         | 3.04 (1.93–4.79)                     | 3.76 (1.92–7.37)                |
+
 Overall 74 districts in the dataset failed pre-TAS. Fig 5 summarizes the likelihood of failure by variable combinations identified in the log-binomial model. For those districts with a baseline prevalence ≥10% that used a FTS diagnostic test and have an average elevation below 350 meters (Combination C01), 87% of the 23 districts failed. Of districts with high baseline that used an ICT diagnostic test and have a low average elevation (C02) 45% failed. Overall, combinations with high baseline and low elevation C01, C02, and C04 accounted for 51% of all the failures (38 of 74).
 
+Fig 5 Analysis of failures by model combinations.
+
+<!-- image -->
+
 ## Discussion
 
 This paper reports for the first time factors associated with pre-TAS results from a multi-country analysis. Variables significantly associated with failure were higher baseline prevalence and lower elevation. Districts with a baseline prevalence of 10% or more were at 2.52 times higher risk to fail pre-TAS in the final log-binomial model. In the bivariate analysis, baseline prevalence above 5% was also significantly more likely to fail compared to lower baselines, which indicates that the threshold for higher baseline prevalence may be as little as 5%, similar to what was found in Goldberg et al., which explored ecological and socioeconomic factors associated with TAS failure [7].
 
 Though diagnostic test used was selected for the final log-binomial model, neither category (FTS or ICT) were significant after interaction with high baseline. FTS alone is significant in the bivariate analysis compared to ICT or Mf. This result is not surprising given previous research which found that FTS was more sensitive than ICT [45].
 
-Elevation was the only environmental domain variable selected for the final log-binomial model during the model selection process, with areas of lower elevation (<350m) found to be at 3.07 times higher risk to fail pre-TAS compared to districts with a higher elevation. Similar results related to elevation were found in previous studies [8,31], including Goldberg et al. [7], who used a cutoff of 200 meters. Elevation likely also encompasses some related environmental concepts, such as vector habitat, greenness (EVI), or rainfall, which impact vector chances of survival.
+Elevation was the only environmental domain variable selected for the final log-binomial model during the model selection process, with areas of lower elevation (&lt;350m) found to be at 3.07 times higher risk to fail pre-TAS compared to districts with a higher elevation. Similar results related to elevation were found in previous studies [8,31], including Goldberg et al. [7], who used a cutoff of 200 meters. Elevation likely also encompasses some related environmental concepts, such as vector habitat, greenness (EVI), or rainfall, which impact vector chances of survival.
 
-The small number of failures overall prevented the inclusion of a large number of variables in the final log-binomial model. However, other variables that are associated with failure as identified in the bivariate analyses, such as Culex vector, higher population density, higher EVI, higher rainfall and more rounds of MDA, should not be discounted when making programmatic decisions. Other models have shown that Culex as the predominant vector in a district, compared to Anopheles, results in more intense interventions needed to reach elimination [24,41]. Higher population density, which was also found to predict TAS failure [7], could be related to different vector species’ transmission dynamics in urban areas, as well as the fact that MDAs are harder to conduct and to accurately measure in urban areas [46,47]. Both higher enhanced vegetation index (>0.3) and higher rainfall (>700 mm per year) contribute to expansion of vector habitats and population. Additionally, having more than five rounds of MDA before pre-TAS was also statistically significantly associated with higher failure in the bivariate analysis. It is unclear why higher number of rounds is associated with first pre-TAS failure given that other research has shown the opposite [15,16].
+The small number of failures overall prevented the inclusion of a large number of variables in the final log-binomial model. However, other variables that are associated with failure as identified in the bivariate analyses, such as Culex vector, higher population density, higher EVI, higher rainfall and more rounds of MDA, should not be discounted when making programmatic decisions. Other models have shown that Culex as the predominant vector in a district, compared to Anopheles, results in more intense interventions needed to reach elimination [24,41]. Higher population density, which was also found to predict TAS failure [7], could be related to different vector species’ transmission dynamics in urban areas, as well as the fact that MDAs are harder to conduct and to accurately measure in urban areas [46,47]. Both higher enhanced vegetation index (&gt;0.3) and higher rainfall (&gt;700 mm per year) contribute to expansion of vector habitats and population. Additionally, having more than five rounds of MDA before pre-TAS was also statistically significantly associated with higher failure in the bivariate analysis. It is unclear why higher number of rounds is associated with first pre-TAS failure given that other research has shown the opposite [15,16].
 
 All other variables included in this analysis were not significantly associated with pre-TAS failure in our analysis. Goldberg et al. found Brugia spp. to be significantly associated with failure, but our results did not. This is likely due in part to the small number of districts with Brugia spp. in our dataset (6%) compared to 46% in the Goldberg et al. article [7]. MDA coverage levels were not significantly associated with pre-TAS failure, likely due to the lack of variance in the coverage data since WHO guidance dictates a minimum of five rounds of MDA with ≥65% epidemiological coverage to be eligible to implement pre-TAS. It should not be interpreted as evidence that high MDA coverage levels are not necessary to lower prevalence.
 
@@ -104,119 +167,62 @@ As this analysis used data across a variety of countries and epidemiological sit
 
 This paper provides evidence from analysis of 554 districts and 13 countries on the factors associated with pre-TAS results. Baseline prevalence, elevation, vector, population density, EVI, rainfall, and number of MDA rounds were all significant in either bivariate or multivariate analyses. This information along with knowledge of local context can help countries more effectively plan pre-TAS and forecast program activities, such as the potential need for more than five rounds of MDA in areas with high baseline and/or low elevation.
 
-## Tables
+## Acknowledgments
 
-Table 1: Categorization of potential factors influencing pre-TAS results.
-
-| Domain                 | Factor                | Covariate                     | Description                                                     | Reference Group      | Summary statistic   | Temporal Resolution   | Source             |
-|------------------------|-----------------------|-------------------------------|-----------------------------------------------------------------|----------------------|---------------------|-----------------------|--------------------|
-| Prevalence             | Baseline prevalence   | 5% cut off                    | Maximum reported mapping or baseline sentinel site prevalence   | <5%                  | Maximum             | Varies                | Programmatic data  |
-| Prevalence             | Baseline prevalence   | 10% cut off                   | Maximum reported mapping or baseline sentinel site prevalence   | <10%                 | Maximum             | Varies                | Programmatic data  |
-| Agent                  | Parasite              | Parasite                      | Predominate parasite in district                                | W. bancrofti & mixed | Binary value        | 2018                  | Programmatic data  |
-| Environment            | Vector                | Vector                        | Predominate vector in district                                  | Anopheles & Mansonia | Binary value        | 2018                  | Country expert     |
-| Environment            | Geography             | Elevation                     | Elevation measured in meters                                    | >350                 | Mean                | 2000                  | CGIAR-CSI SRTM [9] |
-| Environment            | Geography             | District area                 | Area measured in km2                                            | >2,500               | Maximum sum         | Static                | Programmatic data  |
-| Environment            | Climate               | EVI                           | Enhanced vegetation index                                       | > 0.3                | Mean                | 2015                  | MODIS [10]         |
-| Environment            | Climate               | Rainfall                      | Annual rainfall measured in mm                                  | ≤ 700                | Mean                | 2015                  | CHIRPS [11]        |
-| Environment            | Socio-economic        | Population density            | Number of people per km2                                        | ≤ 100                | Mean                | 2015                  | WorldPop [12]      |
-| Environment            | Socio-economic        | Nighttime lights              | Nighttime light index from 0 to 63                              | >1.5                 | Mean                | 2015                  | VIIRS [13]         |
-| Environment            | Co-endemicity         | Co-endemic for onchocerciasis | Part or all of district is also endemic for onchocerciases      | Non-endemic          | Binary value        | 2018                  | Programmatic data  |
-| MDA                    | Drug efficacy         | Drug package                  | DEC-ALB or IVM-ALB                                              | DEC-ALB              | Binary value        | 2018                  | Programmatic data  |
-| MDA                    | Implementation of MDA | Coverage                      | Median MDA coverage for last 5 rounds                           | ≥ 65%                | Median              | Varies                | Programmatic data  |
-| MDA                    | Implementation of MDA | Sufficient rounds             | Number of rounds of sufficient (≥ 65% coverage) in last 5 years | ≥ 3                  | Count               | Varies                | Programmatic data  |
-| MDA                    | Implementation of MDA | Number of rounds              | Maximum number of recorded rounds of MDA                        | ≥ 6                  | Maximum             | Varies                | Programmatic data  |
-| Pre-TAS implementation | Quality of survey     | Diagnostic method             | Using Mf or Ag                                                  | Mf                   | Binary value        | Varies                | Programmatic data  |
-| Pre-TAS implementation | Quality of survey     | Diagnostic test               | Using Mf, ICT, or FTS                                           | Mf                   | Categorical         | Varies                | Programmatic data  |
-
-Table 2: Adjusted risk ratios for pre-TAS failure from log-binomial model sensitivity analysis.
-
-|                                             |                  | (1)                        | (2)                      | (3)                                  | (4)                             |
-|---------------------------------------------|------------------|----------------------------|--------------------------|--------------------------------------|---------------------------------|
-|                                             | Full Model       | Without Cameroon districts | Only districts in Africa | Only W. bancrofti parasite districts | Only Anopheles vector districts |
-| Number of Failures                          | 74               | 74                         | 44                       | 72                                   | 46                              |
-| Number of total districts                   | (N = 554)        | (N = 420)                  | (N = 407)                | (N = 518)                            | (N = 414)                       |
-| Covariate                                   | RR (95% CI)      | RR (95% CI)                | RR (95% CI)              | RR (95% CI)                          | RR (95% CI)                     |
-| Baseline prevalence > = 10% & used FTS test | 2.38 (0.96–5.90) | 1.23 (0.52–2.92)           | 14.52 (1.79–117.82)      | 2.61 (1.03–6.61)                     | 15.80 (1.95–127.67)             |
-| Baseline prevalence > = 10% & used ICT test | 0.80 (0.20–3.24) | 0.42 (0.11–1.68)           | 1.00 (0.00–0.00)         | 0.88 (0.21–3.60)                     | 1.00 (0.00–0.00)                |
-| +Used FTS test                              | 1.16 (0.52–2.59) | 2.40 (1.12–5.11)           | 0.15 (0.02–1.11)         | 1.03 (0.45–2.36)                     | 0.13 (0.02–0.96)                |
-| +Used ICT test                              | 0.92 (0.32–2.67) | 1.47 (0.51–4.21)           | 0.33 (0.04–2.54)         | 0.82 (0.28–2.43)                     | 0.27 (0.03–2.04)                |
-| +Baseline prevalence > = 10%                | 2.52 (1.37–4.64) | 2.42 (1.31–4.47)           | 2.03 (1.06–3.90)         | 2.30 (1.21–4.36)                     | 2.01 (1.07–3.77)                |
-| Elevation < 350m                            | 3.07 (1.95–4.83) | 2.21 (1.42–3.43)           | 4.68 (2.22–9.87)         | 3.04 (1.93–4.79)                     | 3.76 (1.92–7.37)                |
-
-## Figures
-
-Fig 1: Number of pre-TAS by country.
-
-<!-- image -->
-
-Fig 2: District-level baseline prevalence by country.
-
-<!-- image -->
-
-Fig 3: Percent pre-TAS failure by each characteristic (unadjusted).
-
-<!-- image -->
-
-Fig 4: Adjusted risk ratios for pre-TAS failure with 95% Confidence Interval from log-binomial model.
-
-<!-- image -->
-
-Fig 5: Analysis of failures by model combinations.
-
-<!-- image -->
+The authors would like to thank all those involved from the Ministries of Health, volunteers and community members in the sentinel and spot-check site surveys for their tireless commitment to ridding the world of LF. In addition, gratitude is given to Joseph Koroma and all the partners, including USAID, RTI International, FHI 360, IMA World Health, and Helen Keller International, who supported the surveys financially and technically.
 
 ## References
 
-- World Health Organization. Lymphatic filariasis: progress report 2000–2009 and strategic plan 2010–2020. Geneva; 2010. 
-- World Health Organization. Validation of elimination of lymphatic filariasis as a public health problem. Geneva; 2017. 
-- Global programme to eliminate lymphatic filariasis: progress report, 2018. Wkly Epidemiol Rec (2019)
-- World Health Organization. Global programme to eliminate lymphatic filariasis: monitoring and epidemiological assessment of mass drug administration. Geneva; 2011. 
-- World Health Organization. Strengthening the assessment of lymphatic filariasis transmission and documenting the achievement of elimination—Meeting of the Neglected Tropical Diseases Strategic and Technical Advisory Group’s Monitoring and Evaluation Subgroup on Disease-specific Indicators. 2016; 42. 
-- Kyelem D; Biswas G; Bockarie MJ; Bradley MH; El-Setouhy M; Fischer PU. Determinants of success in national programs to eliminate lymphatic filariasis: a perspective identifying essential elements and research needs. Am J Trop Med Hyg (2008)
-- Goldberg EM; King JD; Mupfasoni D; Kwong K; Hay SI; Pigott DM. Ecological and socioeconomic predictors of transmission assessment survey failure for lymphatic filariasis. Am J Trop Med Hyg (2019)
-- Cano J; Rebollo MP; Golding N; Pullan RL; Crellen T; Soler A. The global distribution and transmission limits of lymphatic filariasis: past and present. Parasites and Vectors (2014)
-- CGIAR-CSI. CGIAR-CSI SRTM 90m DEM Digital Elevation Database. In: . 
-- USGS NASA. Vegetation indices 16-DAy L3 global 500 MOD13A1 dataset [Internet]. [cited 1 May 2018]. Available: . 
-- Funk C; Peterson P; Landsfeld M; Pedreros D; Verdin J; Shukla S. The climate hazards infrared precipitation with stations—A new environmental record for monitoring extremes. Sci Data (2015)
-- Lloyd CT; Sorichetta A; Tatem AJ. High resolution global gridded data for use in population studies. Sci Data (2017)
-- Elvidge CD; Baugh KE; Zhizhin M; Hsu F-C. Why VIIRS data are superior to DMSP for mapping nighttime lights. Proc Asia-Pacific Adv Netw (2013)
-- Jambulingam P; Subramanian S; De Vlas SJ; Vinubala C; Stolk WA. Mathematical modelling of lymphatic filariasis elimination programmes in India: required duration of mass drug administration and post-treatment level of infection indicators. Parasites and Vectors (2016)
-- Michael E; Malecela-Lazaro MN; Simonsen PE; Pedersen EM; Barker G; Kumar A. Mathematical modelling and the control of lymphatic filariasis. Lancet Infect Dis (2004)
-- Stolk WA; Swaminathan S; van Oortmarssen GJ; Das PK; Habbema JDF. Prospects for elimination of bancroftian filariasis by mass drug treatment in Pondicherry, India: a simulation study. J Infect Dis (2003)
-- Grady CA; De Rochars MB; Direny AN; Orelus JN; Wendt J; Radday J. Endpoints for lymphatic filariasis programs. Emerg Infect Dis (2007)
-- Evans D; McFarland D; Adamani W; Eigege A; Miri E; Schulz J. Cost-effectiveness of triple drug administration (TDA) with praziquantel, ivermectin and albendazole for the prevention of neglected tropical diseases in Nigeria. Ann Trop Med Parasitol (2011)
-- Richards FO; Eigege A; Miri ES; Kal A; Umaru J; Pam D. Epidemiological and entomological evaluations after six years or more of mass drug administration for lymphatic filariasis elimination in Nigeria. PLoS Negl Trop Dis (2011)
-- Biritwum NK; Yikpotey P; Marfo BK; Odoom S; Mensah EO; Asiedu O. Persistent “hotspots” of lymphatic filariasis microfilaraemia despite 14 years of mass drug administration in Ghana. Trans R Soc Trop Med Hyg (2016)
-- Moraga P; Cano J; Baggaley RF; Gyapong JO; Njenga SM; Nikolay B. Modelling the distribution and transmission intensity of lymphatic filariasis in sub-Saharan Africa prior to scaling up interventions: integrated use of geostatistical and mathematical modelling. Parasites and Vectors (2015)
-- Irvine MA; Njenga SM; Gunawardena S; Wamae CN; Cano J; Brooker SJ. Understanding the relationship between prevalence of microfilariae and antigenaemia using a model of lymphatic filariasis infection. Trans R Soc Trop Med Hyg (2016)
-- Ottesen EA. Efficacy of diethylcarbamazine in eradicating infection with lymphatic-dwelling filariae in humans. Rev Infect Dis (1985)
-- Gambhir M; Bockarie M; Tisch D; Kazura J; Remais J; Spear R. Geographic and ecologic heterogeneity in elimination thresholds for the major vector-borne helminthic disease, lymphatic filariasis. BMC Biol (2010)
-- World Health Organization. Global programme to eliminate lymphatic filariasis: practical entomology handbook. Geneva; 2013. 
-- Slater H; Michael E. Predicting the current and future potential distributions of lymphatic filariasis in Africa using maximum entropy ecological niche modelling. PLoS One (2012)
-- Slater H; Michael E. Mapping, Bayesian geostatistical analysis and spatial prediction of lymphatic filariasis prevalence in Africa. PLoS One (2013)
-- Sabesan S; Raju KHK; Subramanian S; Srivastava PK; Jambulingam P. Lymphatic filariasis transmission risk map of India, based on a geo-environmental risk model. Vector-Borne Zoonotic Dis (2013)
-- Stanton MC; Molyneux DH; Kyelem D; Bougma RW; Koudou BG; Kelly-Hope LA. Baseline drivers of lymphatic filariasis in Burkina Faso. Geospat Health (2013)
-- Manhenje I; Teresa Galán-Puchades M; Fuentes M V. Socio-environmental variables and transmission risk of lymphatic filariasis in central and northern Mozambique. Geospat Health (2013)
-- Ngwira BM; Tambala P; Perez a M; Bowie C; Molyneux DH. The geographical distribution of lymphatic filariasis infection in Malawi. Filaria J (2007)
-- Simonsen PE; Mwakitalu ME. Urban lymphatic filariasis. Parasitol Res (2013)
-- Proville J; Zavala-Araiza D; Wagner G. Night-time lights: a global, long term look at links to socio-economic trends. PLoS One (2017)
-- Endeshaw T; Taye A; Tadesse Z; Katabarwa MN; Shafi O; Seid T. Presence of Wuchereria bancrofti microfilaremia despite seven years of annual ivermectin monotherapy mass drug administration for onchocerciasis control: a study in north-west Ethiopia. Pathog Glob Health (2015)
-- Richards FO; Eigege A; Pam D; Kal A; Lenhart A; Oneyka JOA. Mass ivermectin treatment for onchocerciasis: lack of evidence for collateral impact on transmission of Wuchereria bancrofti in areas of co-endemicity. Filaria J (2005)
-- Kyelem D; Sanou S; Boatin B a; Medlock J; Couibaly S; Molyneux DH. Impact of long-term ivermectin (Mectizan) on Wuchereria bancrofti and Mansonella perstans infections in Burkina Faso: strategic and policy implications. Ann Trop Med Parasitol (2003)
-- Weil GJ; Lammie PJ; Richards FO; Eberhard ML. Changes in circulating parasite antigen levels after treatment of bancroftian filariasis with diethylcarbamazine and ivermectin. J Infect Dis (1991)
-- Kumar A; Sachan P. Measuring impact on filarial infection status in a community study: role of coverage of mass drug administration. Trop Biomed (2014)
-- Njenga SM; Mwandawiro CS; Wamae CN; Mukoko DA; Omar AA; Shimada M. Sustained reduction in prevalence of lymphatic filariasis infection in spite of missed rounds of mass drug administration in an area under mosquito nets for malaria control. Parasites and Vectors (2011)
-- Boyd A; Won KY; McClintock SK; Donovan C V; Laney SJ; Williams SA. A community-based study of factors associated with continuing transmission of lymphatic filariasis in Leogane, Haiti. PLoS Negl Trop Dis (2010)
-- Irvine MA; Reimer LJ; Njenga SM; Gunawardena S; Kelly-Hope L; Bockarie M. Modelling strategies to break transmission of lymphatic filariasis—aggregation, adherence and vector competence greatly alter elimination. Parasites and Vectors (2015)
-- Irvine MA; Stolk WA; Smith ME; Subramanian S; Singh BK; Weil GJ. Effectiveness of a triple-drug regimen for global elimination of lymphatic filariasis: a modelling study. Lancet Infect Dis (2017)
-- Pion SD; Montavon C; Chesnais CB; Kamgno J; Wanji S; Klion AD. Positivity of antigen tests used for diagnosis of lymphatic filariasis in individuals without Wuchereria bancrofti infection but with high loa loa microfilaremia. Am J Trop Med Hyg (2016)
-- Wanji S; Esum ME; Njouendou AJ; Mbeng AA; Chounna Ndongmo PW; Abong RA. Mapping of lymphatic filariasis in loiasis areas: a new strategy shows no evidence for Wuchereria bancrofti endemicity in Cameroon. PLoS Negl Trop Dis (2018)
-- Chesnais CB; Awaca-Uvon NP; Bolay FK; Boussinesq M; Fischer PU; Gankpala L. A multi-center field study of two point-of-care tests for circulating Wuchereria bancrofti antigenemia in Africa. PLoS Negl Trop Dis (2017)
-- Silumbwe A; Zulu JM; Halwindi H; Jacobs C; Zgambo J; Dambe R. A systematic review of factors that shape implementation of mass drug administration for lymphatic filariasis in sub-Saharan Africa. BMC Public Health (2017)
-- Adams AM; Vuckovic M; Birch E; Brant TA; Bialek S; Yoon D. Eliminating neglected tropical diseases in urban areas: a review of challenges, strategies and research directions for successful mass drug administration. Trop Med Infect Dis (2018)
-- Rao RU; Samarasekera SD; Nagodavithana KC; Dassanayaka TDM; Punchihewa MW; Ranasinghe USB. Reassessment of areas with persistent lymphatic filariasis nine years after cessation of mass drug administration in Sri Lanka. PLoS Negl Trop Dis (2017)
-- Xu Z; Graves PM; Lau CL; Clements A; Geard N; Glass K. GEOFIL: a spatially-explicit agent-based modelling framework for predicting the long-term transmission dynamics of lymphatic filariasis in American Samoa. Epidemics (2018)
-- Id CM; Tettevi EJ; Mechan F; Idun B; Biritwum N; Osei-atweneboana MY. Elimination within reach: a cross-sectional study highlighting the factors that contribute to persistent lymphatic filariasis in eight communities in rural Ghana. PLoS Negl Trop Dis (2019)
-- Eigege A; Kal A; Miri E; Sallau A; Umaru J; Mafuyai H. Long-lasting insecticidal nets are synergistic with mass drug administration for interruption of lymphatic filariasis transmission in Nigeria. PLoS Negl Trop Dis (2013)
-- Van den Berg H; Kelly-Hope LA; Lindsay SW. Malaria and lymphatic filariasis: The case for integrated vector management. Lancet Infect Dis (2013)
-- Webber R.. Eradication of Wuchereria bancrofti infection through vector control. Trans R Soc Trop Med Hyg (1979)
\ No newline at end of file
+- World Health Organization. Lymphatic filariasis: progress report 2000–2009 and strategic plan 2010–2020. Geneva; 2010.
+- World Health Organization. Validation of elimination of lymphatic filariasis as a public health problem. Geneva; 2017.
+- World Health Organization. Global programme to eliminate lymphatic filariasis: progress report, 2018. Wkly Epidemiol Rec. 2019;94: 457–472.
+- World Health Organization. Global programme to eliminate lymphatic filariasis: monitoring and epidemiological assessment of mass drug administration. Geneva; 2011.
+- World Health Organization. Strengthening the assessment of lymphatic filariasis transmission and documenting the achievement of elimination—Meeting of the Neglected Tropical Diseases Strategic and Technical Advisory Group’s Monitoring and Evaluation Subgroup on Disease-specific Indicators. 2016; 42.
+- KyelemD, BiswasG, BockarieMJ, BradleyMH, El-SetouhyM, FischerPU, et al Determinants of success in national programs to eliminate lymphatic filariasis: a perspective identifying essential elements and research needs. Am J Trop Med Hyg. 2008;79: 480–4. 18840733
+- GoldbergEM, KingJD, MupfasoniD, KwongK, HaySI, PigottDM, et al Ecological and socioeconomic predictors of transmission assessment survey failure for lymphatic filariasis. Am J Trop Med Hyg. 2019; 10.4269/ajtmh.18-0721 31115301
+- CanoJ, RebolloMP, GoldingN, PullanRL, CrellenT, SolerA, et al The global distribution and transmission limits of lymphatic filariasis: past and present. Parasites and Vectors. 2014;7: 1–19. 10.1186/1756-3305-7-1 24411014
+- CGIAR-CSI. CGIAR-CSI SRTM 90m DEM Digital Elevation Database. In: http://Srtm.Csi.Cgiar.Org/ [Internet]. 2008 [cited 1 May 2018]. Available: http://srtm.csi.cgiar.org/
+- USGS NASA. Vegetation indices 16-DAy L3 global 500 MOD13A1 dataset [Internet]. [cited 1 May 2018]. Available: https://lpdaac.usgs.gov/products/myd13a1v006/
+- FunkC, PetersonP, LandsfeldM, PedrerosD, VerdinJ, ShuklaS, et al The climate hazards infrared precipitation with stations—A new environmental record for monitoring extremes. Sci Data. Nature Publishing Groups; 2015;2 10.1038/sdata.2015.66 26646728
+- LloydCT, SorichettaA, TatemAJ. High resolution global gridded data for use in population studies. Sci Data. 2017;4: 170001 10.1038/sdata.2017.1 28140386
+- ElvidgeCD, BaughKE, ZhizhinM, HsuF-C. Why VIIRS data are superior to DMSP for mapping nighttime lights. Proc Asia-Pacific Adv Netw. Proceedings of the Asia-Pacific Advanced Network; 2013;35: 62 10.7125/apan.35.7
+- JambulingamP, SubramanianS, De VlasSJ, VinubalaC, StolkWA. Mathematical modelling of lymphatic filariasis elimination programmes in India: required duration of mass drug administration and post-treatment level of infection indicators. Parasites and Vectors. 2016;9: 1–18. 10.1186/s13071-015-1291-6 26728523
+- MichaelE, Malecela-LazaroMN, SimonsenPE, PedersenEM, BarkerG, KumarA, et al Mathematical modelling and the control of lymphatic filariasis. Lancet Infect Dis. 2004;4: 223–234. 10.1016/S1473-3099(04)00973-9 15050941
+- StolkWA, SwaminathanS, van OortmarssenGJ, DasPK, HabbemaJDF. Prospects for elimination of bancroftian filariasis by mass drug treatment in Pondicherry, India: a simulation study. J Infect Dis. 2003;188: 1371–81. 10.1086/378354 14593597
+- GradyCA, De RocharsMB, DirenyAN, OrelusJN, WendtJ, RaddayJ, et al Endpoints for lymphatic filariasis programs. Emerg Infect Dis. 2007;13: 608–610. 10.3201/eid1304.061063 17553278
+- EvansD, McFarlandD, AdamaniW, EigegeA, MiriE, SchulzJ, et al Cost-effectiveness of triple drug administration (TDA) with praziquantel, ivermectin and albendazole for the prevention of neglected tropical diseases in Nigeria. Ann Trop Med Parasitol. 2011;105: 537–47. 10.1179/2047773211Y.0000000010 22325813
+- RichardsFO, EigegeA, MiriES, KalA, UmaruJ, PamD, et al Epidemiological and entomological evaluations after six years or more of mass drug administration for lymphatic filariasis elimination in Nigeria. PLoS Negl Trop Dis. 2011;5: e1346 10.1371/journal.pntd.0001346 22022627
+- BiritwumNK, YikpoteyP, MarfoBK, OdoomS, MensahEO, AsieduO, et al Persistent “hotspots” of lymphatic filariasis microfilaraemia despite 14 years of mass drug administration in Ghana. Trans R Soc Trop Med Hyg. 2016;110: 690–695. 10.1093/trstmh/trx007 28938053
+- MoragaP, CanoJ, BaggaleyRF, GyapongJO, NjengaSM, NikolayB, et al Modelling the distribution and transmission intensity of lymphatic filariasis in sub-Saharan Africa prior to scaling up interventions: integrated use of geostatistical and mathematical modelling. Parasites and Vectors. 2015;8: 1–16. 10.1186/s13071-014-0608-1 25561160
+- IrvineMA, NjengaSM, GunawardenaS, WamaeCN, CanoJ, BrookerSJ, et al Understanding the relationship between prevalence of microfilariae and antigenaemia using a model of lymphatic filariasis infection. Trans R Soc Trop Med Hyg. 2016;110: 118–124. 10.1093/trstmh/trv096 26822604
+- OttesenEA. Efficacy of diethylcarbamazine in eradicating infection with lymphatic-dwelling filariae in humans. Rev Infect Dis. 1985;7.
+- GambhirM, BockarieM, TischD, KazuraJ, RemaisJ, SpearR, et al Geographic and ecologic heterogeneity in elimination thresholds for the major vector-borne helminthic disease, lymphatic filariasis. BMC Biol. 2010;8 10.1186/1741-7007-8-22 20236528
+- World Health Organization. Global programme to eliminate lymphatic filariasis: practical entomology handbook. Geneva; 2013.
+- SlaterH, MichaelE. Predicting the current and future potential distributions of lymphatic filariasis in Africa using maximum entropy ecological niche modelling. PLoS One. 2012;7: e32202 10.1371/journal.pone.0032202 22359670
+- SlaterH, MichaelE. Mapping, Bayesian geostatistical analysis and spatial prediction of lymphatic filariasis prevalence in Africa. PLoS One. 2013;8: 28–32. 10.1371/journal.pone.0071574 23951194
+- SabesanS, RajuKHK, SubramanianS, SrivastavaPK, JambulingamP. Lymphatic filariasis transmission risk map of India, based on a geo-environmental risk model. Vector-Borne Zoonotic Dis. 2013;13: 657–665. 10.1089/vbz.2012.1238 23808973
+- StantonMC, MolyneuxDH, KyelemD, BougmaRW, KoudouBG, Kelly-HopeLA. Baseline drivers of lymphatic filariasis in Burkina Faso. Geospat Health. 2013;8: 159–173. 10.4081/gh.2013.63 24258892
+- ManhenjeI, Teresa Galán-PuchadesM, FuentesM V. Socio-environmental variables and transmission risk of lymphatic filariasis in central and northern Mozambique. Geospat Health. 2013;7: 391–398. 10.4081/gh.2013.96 23733300
+- NgwiraBM, TambalaP, Perez aM, BowieC, MolyneuxDH. The geographical distribution of lymphatic filariasis infection in Malawi. Filaria J. 2007;6: 12 10.1186/1475-2883-6-12 18047646
+- SimonsenPE, MwakitaluME. Urban lymphatic filariasis. Parasitol Res. 2013;112: 35–44. 10.1007/s00436-012-3226-x 23239094
+- ProvilleJ, Zavala-AraizaD, WagnerG. Night-time lights: a global, long term look at links to socio-economic trends. PLoS One. Public Library of Science; 2017;12 10.1371/journal.pone.0174610 28346500
+- EndeshawT, TayeA, TadesseZ, KatabarwaMN, ShafiO, SeidT, et al Presence of Wuchereria bancrofti microfilaremia despite seven years of annual ivermectin monotherapy mass drug administration for onchocerciasis control: a study in north-west Ethiopia. Pathog Glob Health. 2015;109: 344–351. 10.1080/20477724.2015.1103501 26878935
+- RichardsFO, EigegeA, PamD, KalA, LenhartA, OneykaJOA, et al Mass ivermectin treatment for onchocerciasis: lack of evidence for collateral impact on transmission of Wuchereria bancrofti in areas of co-endemicity. Filaria J. 2005;4: 3–5. 10.1186/1475-2883-4-3 15916708
+- KyelemD, SanouS, BoatinB a., MedlockJ, CouibalyS, MolyneuxDH. Impact of long-term ivermectin (Mectizan) on Wuchereria bancrofti and Mansonella perstans infections in Burkina Faso: strategic and policy implications. Ann Trop Med Parasitol. 2003;97: 827–38. 10.1179/000349803225002462 14754495
+- WeilGJ, LammiePJ, RichardsFO, EberhardML. Changes in circulating parasite antigen levels after treatment of bancroftian filariasis with diethylcarbamazine and ivermectin. J Infect Dis. 1991;164: 814–816. 10.1093/infdis/164.4.814 1894943
+- KumarA, SachanP. Measuring impact on filarial infection status in a community study: role of coverage of mass drug administration. Trop Biomed. 2014;31: 225–229. 25134891
+- NjengaSM, MwandawiroCS, WamaeCN, MukokoDA, OmarAA, ShimadaM, et al Sustained reduction in prevalence of lymphatic filariasis infection in spite of missed rounds of mass drug administration in an area under mosquito nets for malaria control. Parasites and Vectors. 2011;4: 1–9. 10.1186/1756-3305-4-1 21205315
+- BoydA, WonKY, McClintockSK, DonovanC V., LaneySJ, WilliamsSA, et al A community-based study of factors associated with continuing transmission of lymphatic filariasis in Leogane, Haiti. PLoS Negl Trop Dis. 2010;4: 1–10. 10.1371/journal.pntd.0000640 20351776
+- IrvineMA, ReimerLJ, NjengaSM, GunawardenaS, Kelly-HopeL, BockarieM, et al Modelling strategies to break transmission of lymphatic filariasis—aggregation, adherence and vector competence greatly alter elimination. Parasites and Vectors. 2015;8: 1–19. 10.1186/s13071-014-0608-1 25561160
+- IrvineMA, StolkWA, SmithME, SubramanianS, SinghBK, WeilGJ, et al Effectiveness of a triple-drug regimen for global elimination of lymphatic filariasis: a modelling study. Lancet Infect Dis. 2017;17: 451–458. 10.1016/S1473-3099(16)30467-4 28012943
+- PionSD, MontavonC, ChesnaisCB, KamgnoJ, WanjiS, KlionAD, et al Positivity of antigen tests used for diagnosis of lymphatic filariasis in individuals without Wuchereria bancrofti infection but with high loa loa microfilaremia. Am J Trop Med Hyg. 2016;95: 1417–1423. 10.4269/ajtmh.16-0547 27729568
+- WanjiS, EsumME, NjouendouAJ, MbengAA, Chounna NdongmoPW, AbongRA, et al Mapping of lymphatic filariasis in loiasis areas: a new strategy shows no evidence for Wuchereria bancrofti endemicity in Cameroon. PLoS Negl Trop Dis. 2018;13: 1–15. 10.1371/journal.pntd.0007192 30849120
+- ChesnaisCB, Awaca-UvonNP, BolayFK, BoussinesqM, FischerPU, GankpalaL, et al A multi-center field study of two point-of-care tests for circulating Wuchereria bancrofti antigenemia in Africa. PLoS Negl Trop Dis. 2017;11: 1–15. 10.1371/journal.pntd.0005703 28892473
+- SilumbweA, ZuluJM, HalwindiH, JacobsC, ZgamboJ, DambeR, et al A systematic review of factors that shape implementation of mass drug administration for lymphatic filariasis in sub-Saharan Africa. BMC Public Health; 2017; 1–15. 10.1186/s12889-017-4414-5 28532397
+- AdamsAM, VuckovicM, BirchE, BrantTA, BialekS, YoonD, et al Eliminating neglected tropical diseases in urban areas: a review of challenges, strategies and research directions for successful mass drug administration. Trop Med Infect Dis. 2018;3 10.3390/tropicalmed3040122 30469342
+- RaoRU, SamarasekeraSD, NagodavithanaKC, DassanayakaTDM, PunchihewaMW, RanasingheUSB, et al Reassessment of areas with persistent lymphatic filariasis nine years after cessation of mass drug administration in Sri Lanka. PLoS Negl Trop Dis. 2017;11: 1–17. 10.1371/journal.pntd.0006066 29084213
+- XuZ, GravesPM, LauCL, ClementsA, GeardN, GlassK. GEOFIL: a spatially-explicit agent-based modelling framework for predicting the long-term transmission dynamics of lymphatic filariasis in American Samoa. Epidemics. 2018; 10.1016/j.epidem.2018.12.003 30611745
+- IdCM, TetteviEJ, MechanF, IdunB, BiritwumN, Osei-atweneboanaMY, et al Elimination within reach: a cross-sectional study highlighting the factors that contribute to persistent lymphatic filariasis in eight communities in rural Ghana. PLoS Negl Trop Dis. 2019; 1–17.
+- EigegeA, KalA, MiriE, SallauA, UmaruJ, MafuyaiH, et al Long-lasting insecticidal nets are synergistic with mass drug administration for interruption of lymphatic filariasis transmission in Nigeria. PLoS Negl Trop Dis. 2013;7: 7–10. 10.1371/journal.pntd.0002508 24205421
+- Van den BergH, Kelly-HopeLA, LindsaySW. Malaria and lymphatic filariasis: The case for integrated vector management. Lancet Infect Dis. 2013;13: 89–94. 10.1016/S1473-3099(12)70148-2 23084831
+- WebberR. Eradication of Wuchereria bancrofti infection through vector control. Trans R Soc Trop Med Hyg. 1979;73.
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v2/pone.0234687.xml.itxt b/tests/data/groundtruth/docling_v2/pone.0234687.xml.itxt
index 47cf0fde..0d855d73 100644
--- a/tests/data/groundtruth/docling_v2/pone.0234687.xml.itxt
+++ b/tests/data/groundtruth/docling_v2/pone.0234687.xml.itxt
@@ -1,177 +1,176 @@
 item-0 at level 0: unspecified: group _root_
   item-1 at level 1: title: Potential to reduce greenhouse g ...  cattle systems in subtropical regions
-    item-2 at level 2: paragraph: Ribeiro-Filho Henrique M. N.; 1: ... , California, United States of America
-    item-3 at level 2: section_header: Abstract
-      item-4 at level 3: text: Carbon (C) footprint of dairy pr ... uce the C footprint to a small extent.
-    item-5 at level 2: section_header: Introduction
-      item-6 at level 3: text: Greenhouse gas (GHG) emissions f ... suitable for food crop production [4].
-      item-7 at level 3: text: Considering the key role of live ... anagement to mitigate the C footprint.
-      item-8 at level 3: text: In subtropical climate zones, co ... t in tropical pastures (e.g. [17–19]).
-      item-9 at level 3: text: It has been shown that dairy cow ... sions from crop and reduced DM intake.
-      item-10 at level 3: text: The aim of this work was to quan ... uring lactation periods was evaluated.
-    item-11 at level 2: section_header: Materials and methods
-      item-12 at level 3: text: An LCA was developed according t ... 90816 - https://www.udesc.br/cav/ceua.
-      item-13 at level 3: section_header: System boundary
-        item-14 at level 4: text: The goal of the study was to ass ... n were outside of the system boundary.
-      item-15 at level 3: section_header: Functional unit
-        item-16 at level 4: text: The functional unit was one kilo ... tein according to NRC [20] as follows:
-        item-17 at level 4: text: ECM = Milk production × (0.0929  ...  characteristics described in Table 1.
-      item-18 at level 3: section_header: Data sources and livestock system description
-        item-19 at level 4: text: The individual feed requirements ... ed to the ad libitum TMR intake group.
-        item-20 at level 4: text: Using experimental data, three s ... med during an entire lactation period.
-      item-21 at level 3: section_header: Impact assessment
-        item-22 at level 4: text: The CO2e emissions were calculat ... 65 for CO2, CH4 and N2O, respectively.
-      item-23 at level 3: section_header: Feed production
-        item-24 at level 4: section_header: Diets composition
-          item-25 at level 5: text: The DM intake of each ingredient ...  collected throughout the experiments.
-        item-26 at level 4: section_header: GHG emissions from crop and pasture production
-          item-27 at level 5: text: GHG emission factors used for of ... onsume 70% of pastures during grazing.
-          item-28 at level 5: text: Emissions from on-farm feed prod ... factors described by Rotz et al. [42].
-      item-29 at level 3: section_header: Animal husbandry
-        item-30 at level 4: text: The CH4 emissions from enteric f ... 1) = 13.8 + 0.185 × NDF (% DM intake).
-      item-31 at level 3: section_header: Manure from confined cows and urine and dung from grazing animals
-        item-32 at level 4: text: The CH4 emission from manure (kg ... for dietary GE per kg of DM (MJ kg-1).
-        item-33 at level 4: text: The OM digestibility was estimat ... h were 31%, 26% and 46%, respectively.
-        item-34 at level 4: text: The N2O-N emissions from urine a ...  using the IPCC [38] emission factors.
-      item-35 at level 3: section_header: Farm management
-        item-36 at level 4: text: Emissions due to farm management ...  crop and pasture production’ section.
-        item-37 at level 4: text: The amount of fuel use for manur ... me that animals stayed on confinement.
-        item-38 at level 4: text: The emissions from fuel were est ...  × kg CO2e (kg machinery mass)-1 [42].
-        item-39 at level 4: text: Emissions from electricity for m ... ws in naturally ventilated barns [47].
-        item-40 at level 4: text: The lower impact of emissions fr ...  greater than 5% of total C footprint.
-        item-41 at level 4: text: Emissions from farm management d ...  gas and hard coal, respectively [46].
-      item-42 at level 3: section_header: Co-product allocation
-        item-43 at level 4: text: The C footprint for milk produce ...  directly assigned to milk production.
-      item-44 at level 3: section_header: Sensitivity analysis
-        item-45 at level 4: text: A sensitivity index was calculat ... ses a similar change in the footprint.
-    item-46 at level 2: section_header: Results and discussion
-      item-47 at level 3: text: The study has assessed the impac ... , feed production and electricity use.
-      item-48 at level 3: section_header: Greenhouse gas emissions
-        item-49 at level 4: text: Depending on emission factors us ... more than 5% of overall GHG emissions.
-        item-50 at level 4: text: Considering IPCC emission factor ...  the C footprint of the dairy systems.
-        item-51 at level 4: text: The similarity of C footprint be ... of TMR was replaced by pasture access.
-        item-52 at level 4: text: The lower C footprint in scenari ... r, averaging 0.004 kg N2O-N kg-1 [37].
-      item-53 at level 3: section_header: Methane emissions
-        item-54 at level 4: text: The enteric CH4 intensity was si ... ], which did not happen in this study.
-        item-55 at level 4: text: The lack of difference in enteri ...  same scenarios as in this study [26].
-      item-56 at level 3: section_header: Emissions from excreta and feed production
-        item-57 at level 4: text: Using IPCC emission factors for  ...  may not be captured by microbes [65].
-        item-58 at level 4: text: Using local emission factors for ... be revised for the subtropical region.
-        item-59 at level 4: text: Emissions for feed production de ... act, particularly in confinements [9].
-      item-60 at level 3: section_header: Assumptions and limitations
-        item-61 at level 4: text: The milk production and composit ... ions as a function of soil management.
-      item-62 at level 3: section_header: Further considerations
-        item-63 at level 4: text: The potential for using pasture  ... g ECM)-1 in case of foot lesions [72].
-        item-64 at level 4: text: Grazing lands may also improve b ... hange of CO2 would be negligible [76].
-    item-65 at level 2: section_header: Conclusions
-      item-66 at level 3: text: This study assessed the C footpr ... on with or without access to pastures.
-    item-67 at level 2: section_header: Tables
-      item-68 at level 3: table with [13x3]
-        item-68 at level 4: caption: Table 1: Descriptive characteristics of the herd.
-      item-69 at level 3: table with [21x11]
-        item-69 at level 4: caption: Table 2: Dairy cows’ diets in different scenariosa.
-      item-70 at level 3: table with [9x5]
-        item-70 at level 4: caption: Table 3: GHG emission factors for Off- and On-farm feed production.
-      item-71 at level 3: table with [28x5]
-        item-71 at level 4: caption: Table 4: GHG emissions from On-farm feed production.
-      item-72 at level 3: table with [12x4]
-        item-72 at level 4: caption: Table 5: Factors for major resource inputs in farm management.
-    item-73 at level 2: section_header: Figures
-      item-74 at level 3: picture
-        item-74 at level 4: caption: Fig 1: Overview of the milk production system boundary considered in the study.
-      item-75 at level 3: picture
-        item-75 at level 4: caption: Fig 2: Overall greenhouse gas emissions in dairy cattle systems under various scenarios.
-TMR = ad libitum TMR intake, 75TMR = 75% of ad libitum TMR intake with access to pasture, 50TMR = 50% of ad libitum TMR intake with access to pasture. (a) N2O emission factors for urine and dung from IPCC [38], feed production emission factors from Table 3 without accounting for sequestered CO2-C from perennial pasture, production of electricity = 0.73 kg CO2e kWh-1 [41]. (b) N2O emission factors for urine and dung from IPCC [38], feed production emission factors from Table 3 without accounting for sequestered CO2-C from perennial pasture, production of electricity = 0.205 kg CO2e kWh-1 [46]; (c) N2O emission factors for urine and dung from local data [37], feed production EF from Table 4 without accounting for sequestered CO2-C from perennial pasture, production of electricity = 0.205 kg CO2e kWh-1 [46]. (d) N2O emission factors for urine and dung from local data [37], feed production emission factors from Table 4 accounting for sequestered CO2-C from perennial pasture, production of electricity = 0.205 kg CO2e kWh-1 [46].
-      item-76 at level 3: picture
-        item-76 at level 4: caption: Fig 3: Sensitivity of the C footprint.
-Sensitivity index = percentage change in C footprint for a 10% change in the given emission source divided by 10% of. (a) N2O emission factors for urine and dung from IPCC [38], feed production emission factors from Table 3, production of electricity = 0.73 kg CO2e kWh-1 [41]. (b) N2O emission factors for urine and dung from IPCC [38], feed production emission factors from Table 3, production of electricity = 0.205 kg CO2e kWh-1 [46]; (c) N2O emission factors for urine and dung from local data [37], feed production EF from Table 4 without accounting sequestered CO2-C from perennial pasture, production of electricity = 0.205 kg CO2e kWh-1 [46]. (d) N2O emission factors for urine and dung from local data [37], feed production emission factors from Table 4 accounting sequestered CO2-C from perennial pasture, production of electricity = 0.205 kg CO2e kWh-1 [46].
-      item-77 at level 3: picture
-        item-77 at level 4: caption: Fig 4: Greenhouse gas emissions (GHG) from manure and feed production in dairy cattle systems.
-TMR = ad libitum TMR intake, 75TMR = 75% of ad libitum TMR intake with access to pasture, 50TMR = 50% of ad libitum TMR intake with access to pasture. (a) N2O emission factors for urine and dung from IPCC [38]. (b) Feed production emission factors from Table 3. (c) N2O emission factors for urine and dung from local data [37]. (d) Feed production emission factors from Table 4 accounting sequestered CO2-C from perennial pasture.
-    item-78 at level 2: section_header: References
-      item-79 at level 3: list: group list
-        item-80 at level 4: list_item: Climate Change and Land. Chapter 5: Food Security (2019)
-        item-81 at level 4: list_item: Herrero M; Henderson B; Havlík P ... ivestock sector. Nat Clim Chang (2016)
-        item-82 at level 4: list_item: Rivera-Ferre MG; López-i-Gelats  ... iley Interdiscip Rev Clim Chang (2016)
-        item-83 at level 4: list_item: van Zanten HHE; Mollenhorst H; K ... ystems. Int J Life Cycle Assess (2016)
-        item-84 at level 4: list_item: Hristov AN; Oh J; Firkins L; Dij ...  mitigation options. J Anim Sci (2013)
-        item-85 at level 4: list_item: Hristov AN; Ott T; Tricarico J;  ...  mitigation options. J Anim Sci (2013)
-        item-86 at level 4: list_item: Montes F; Meinen R; Dell C; Rotz ...  mitigation options. J Anim Sci (2013)
-        item-87 at level 4: list_item: Ledgard SF; Wei S; Wang X; Falco ...  mitigations. Agric Water Manag (2019)
-        item-88 at level 4: list_item: O’Brien D; Shalloo L; Patton J;  ... inement dairy farms. Agric Syst (2012)
-        item-89 at level 4: list_item: Salou T; Le Mouël C; van der Wer ... nal unit matters!. J Clean Prod (2017)
-        item-90 at level 4: list_item: Lizarralde C; Picasso V; Rotz CA ... Case Studies. Sustain Agric Res (2014)
-        item-91 at level 4: list_item: Clark CEF; Kaur R; Millapan LO;  ... ction and behavior. J Dairy Sci (2018)
-        item-92 at level 4: list_item: FAOSTAT.  (2017)
-        item-93 at level 4: list_item: Vogeler I; Mackay A; Vibart R; R ... ms modelling. Sci Total Environ (2016)
-        item-94 at level 4: list_item: Wilkinson JM; Lee MRF; Rivero MJ ... ate pastures. Grass Forage Sci. (2020)
-        item-95 at level 4: list_item: Wales WJ; Marett LC; Greenwood J ... ons of Australia. Anim Prod Sci (2013)
-        item-96 at level 4: list_item: Bargo F; Muller LD; Delahoy JE;  ... otal mixed rations. J Dairy Sci (2002)
-        item-97 at level 4: list_item: Vibart RE; Fellner V; Burns JC;  ... ration and pasture. J Dairy Res (2008)
-        item-98 at level 4: list_item: Mendoza A; Cajarville C; Repetto ... total mixed ration. J Dairy Sci (2016)
-        item-99 at level 4: list_item: Nutrient Requirements of Dairy Cattle (2001)
-        item-100 at level 4: list_item: Noizère P; Sauvant D; Delaby L.  (2018)
-        item-101 at level 4: list_item: Lorenz H; Reinsch T; Hess S; Tau ... roduction systems. J Clean Prod (2019)
-        item-102 at level 4: list_item: INTERNATIONAL STANDARD—Environme ... ent—Requirements and guidelines (2006)
-        item-103 at level 4: list_item: Environmental management—Life cy ... ciples and framework. Iso 14040 (2006)
-        item-104 at level 4: list_item: FAO. Environmental Performance o ... ains: Guidelines for assessment (2016)
-        item-105 at level 4: list_item: Civiero M; Ribeiro-Filho HMN; Sc ... ture Conference,. Foz do Iguaçu (2019)
-        item-106 at level 4: list_item: IPCC—Intergovernmental Panel on  ... d Version). 2014. Available: ttps://. 
-        item-107 at level 4: list_item: INRA. Alimentation des bovins, o ... nra 2007. 4th ed. INRA, editor. 2007. 
-        item-108 at level 4: list_item: Delagarde R; Faverdin P; Baratte ... ng management. Grass Forage Sci (2011)
-        item-109 at level 4: list_item: Ma BL; Liang BC; Biswas DK; Morr ... tions. Nutr Cycl Agroecosystems (2012)
-        item-110 at level 4: list_item: Rauccci GS; Moreira CS; Alves PS ... Mato Grosso State. J Clean Prod (2015)
-        item-111 at level 4: list_item: Camargo GGT; Ryan MR; Richard TL ... nergy Analysis Tool. Bioscience (2013)
-        item-112 at level 4: list_item: da Silva MSJ; Jobim CC; Poppi EC ... outhern Brazil. Rev Bras Zootec (2015)
-        item-113 at level 4: list_item: Duchini PGPG Guzatti GCGC; Ribei ...  monocultures. Crop Pasture Sci (2016)
-        item-114 at level 4: list_item: Scaravelli LFB; Pereira LET; Oli ... om vacas leiteiras. Cienc Rural (2007)
-        item-115 at level 4: list_item: Sbrissia AF; Duchini PG; Zanini  ... ge of grazing heights. Crop Sci (2018)
-        item-116 at level 4: list_item: Almeida JGR; Dall-Orsoletta AC;  ... grazing temperate grass. Animal (2020)
-        item-117 at level 4: list_item: Eggleston H.S.; Buendia L.; Miwa ... nal greenhouse gas inventories. (2006)
-        item-118 at level 4: list_item: Ramalho B; Dieckow J; Barth G; S ... mbric Ferralsol. Eur J Soil Sci (2020)
-        item-119 at level 4: list_item: Fernandes HC; da Silveira JCM; R ... nizadas. Cienc e Agrotecnologia (2008)
-        item-120 at level 4: list_item: Wang M Q. GREET 1.8a Spreadsheet Model. 2007. Available: . 
-        item-121 at level 4: list_item: Rotz CAA; Montes F; Chianese DS; ... e cycle assessment. J Dairy Sci (2010)
-        item-122 at level 4: list_item: Niu M; Kebreab E; Hristov AN; Oh ... ental database. Glob Chang Biol (2018)
-        item-123 at level 4: list_item: Eugène M; Sauvant D; Nozière P;  ... for ruminants. J Environ Manage (2019)
-        item-124 at level 4: list_item: Reed KF; Moraes LE; Casper DP; K ... retion from cattle. J Dairy Sci (2015)
-        item-125 at level 4: list_item: Barros MV; Piekarski CM; De Fran ...  the 2016–2026 period. Energies (2018)
-        item-126 at level 4: list_item: Ludington D; Johnson E. Dairy Fa ...  York State Energy Res Dev Auth (2003)
-        item-127 at level 4: list_item: Thoma G; Jolliet O; Wang Y. A bi ... ply chain analysis. Int Dairy J (2013)
-        item-128 at level 4: list_item: Naranjo A; Johnson A; Rossow H.  ...  dairy industry over 50 years.  (2020)
-        item-129 at level 4: list_item: Jayasundara S; Worden D; Weersin ... roduction systems. J Clean Prod (2019)
-        item-130 at level 4: list_item: Williams SRO; Fisher PD; Berrisf ... ssions. Int J Life Cycle Assess (2014)
-        item-131 at level 4: list_item: Gollnow S; Lundie S; Moore AD; M ...  cows in Australia. Int Dairy J (2014)
-        item-132 at level 4: list_item: O’Brien D; Capper JL; Garnsworth ... -based dairy farms. J Dairy Sci (2014)
-        item-133 at level 4: list_item: Chobtang J; McLaren SJ; Ledgard  ... Region, New Zealand. J Ind Ecol (2017)
-        item-134 at level 4: list_item: Garg MR; Phondba BT; Sherasia PL ... cycle assessment. Anim Prod Sci (2016)
-        item-135 at level 4: list_item: de Léis CM; Cherubini E; Ruviaro ...  study. Int J Life Cycle Assess (2015)
-        item-136 at level 4: list_item: O’Brien D; Geoghegan A; McNamara ... otprint of milk?. Anim Prod Sci (2016)
-        item-137 at level 4: list_item: O’Brien D; Brennan P; Humphreys  ... dology. Int J Life Cycle Assess (2014)
-        item-138 at level 4: list_item: Baek CY; Lee KM; Park KH. Quanti ...  dairy cow system. J Clean Prod (2014)
-        item-139 at level 4: list_item: Dall-Orsoletta AC; Almeida JGR;  ...  to late lactation. J Dairy Sci (2016)
-        item-140 at level 4: list_item: Dall-Orsoletta AC; Oziemblowski  ... entation. Anim Feed Sci Technol (2019)
-        item-141 at level 4: list_item: Niu M; Appuhamy JADRN; Leytem AB ... s simultaneously. Anim Prod Sci (2016)
-        item-142 at level 4: list_item: Waghorn GC; Law N; Bryant M; Pac ... with fodder beet. Anim Prod Sci (2019)
-        item-143 at level 4: list_item: Dickhoefer U; Glowacki S; Gómez  ...  protein and starch. Livest Sci (2018)
-        item-144 at level 4: list_item: Schwab CG; Broderick GA. A 100-Y ... tion in dairy cows. J Dairy Sci (2017)
-        item-145 at level 4: list_item: Sordi A; Dieckow J; Bayer C; Alb ... tureland. Agric Ecosyst Environ (2014)
-        item-146 at level 4: list_item: Simon PL; Dieckow J; de Klein CA ... pastures. Agric Ecosyst Environ (2018)
-        item-147 at level 4: list_item: Wang X; Ledgard S; Luo J; Guo Y; ... e assessment. Sci Total Environ (2018)
-        item-148 at level 4: list_item: Pirlo G; Lolli S. Environmental  ...  Lombardy (Italy). J Clean Prod (2019)
-        item-149 at level 4: list_item: Herzog A; Winckler C; Zollitsch  ... tigation. Agric Ecosyst Environ (2018)
-        item-150 at level 4: list_item: Mostert PF; van Middelaar CE; Bo ... f milk production. J Clean Prod (2018)
-        item-151 at level 4: list_item: Mostert PF; van Middelaar CE; de ...  of milk production. Agric Syst (2018)
-        item-152 at level 4: list_item: Foley JA; Ramankutty N; Brauman  ... for a cultivated planet. Nature (2011)
-        item-153 at level 4: list_item: Lal R.. Soil Carbon Sequestratio ... nd Food Security. Science (80-) (2004)
-        item-154 at level 4: list_item: Boddey RM; Jantalia CP; Conceiça ... al agriculture. Glob Chang Biol (2010)
-        item-155 at level 4: list_item: McConkey B; Angers D; Bentham M; ... he LULUCF sector for NIR 2014.  (2014)
-  item-156 at level 1: caption: Table 1: Descriptive characteristics of the herd.
-  item-157 at level 1: caption: Table 2: Dairy cows’ diets in different scenariosa.
-  item-158 at level 1: caption: Table 3: GHG emission factors for Off- and On-farm feed production.
-  item-159 at level 1: caption: Table 4: GHG emissions from On-farm feed production.
-  item-160 at level 1: caption: Table 5: Factors for major resource inputs in farm management.
-  item-161 at level 1: caption: Fig 1: Overview of the milk prod ... stem boundary considered in the study.
-  item-162 at level 1: caption: Fig 2: Overall greenhouse gas em ... lectricity = 0.205 kg CO2e kWh-1 [46].
-  item-163 at level 1: caption: Fig 3: Sensitivity of the C foot ... lectricity = 0.205 kg CO2e kWh-1 [46].
-  item-164 at level 1: caption: Fig 4: Greenhouse gas emissions  ... uestered CO2-C from perennial pasture.
\ No newline at end of file
+    item-2 at level 2: paragraph: Henrique M. N. Ribeiro-Filho, Maurício Civiero, Ermias Kebreab
+    item-3 at level 2: paragraph: Department of Animal Science, Un ... atarina, Lages, Santa Catarina, Brazil
+    item-4 at level 2: section_header: Abstract
+      item-5 at level 3: text: Carbon (C) footprint of dairy pr ... uce the C footprint to a small extent.
+    item-6 at level 2: section_header: Introduction
+      item-7 at level 3: text: Greenhouse gas (GHG) emissions f ... suitable for food crop production [4].
+      item-8 at level 3: text: Considering the key role of live ... anagement to mitigate the C footprint.
+      item-9 at level 3: text: In subtropical climate zones, co ... t in tropical pastures (e.g. [17–19]).
+      item-10 at level 3: text: It has been shown that dairy cow ... sions from crop and reduced DM intake.
+      item-11 at level 3: text: The aim of this work was to quan ... uring lactation periods was evaluated.
+    item-12 at level 2: section_header: Materials and methods
+      item-13 at level 3: text: An LCA was developed according t ... 90816 - https://www.udesc.br/cav/ceua.
+      item-14 at level 3: section_header: System boundary
+        item-15 at level 4: text: The goal of the study was to ass ... n were outside of the system boundary.
+        item-16 at level 4: picture
+          item-16 at level 5: caption: Fig 1 Overview of the milk production system boundary considered in the study.
+      item-17 at level 3: section_header: Functional unit
+        item-18 at level 4: text: The functional unit was one kilo ... tein according to NRC [20] as follows:
+        item-19 at level 4: text: ECM = Milk production × (0.0929  ...  characteristics described in Table 1.
+        item-20 at level 4: table with [13x3]
+          item-20 at level 5: caption: Table 1 Descriptive characteristics of the herd.
+      item-21 at level 3: section_header: Data sources and livestock system description
+        item-22 at level 4: text: The individual feed requirements ... ed to the ad libitum TMR intake group.
+        item-23 at level 4: text: Using experimental data, three s ... med during an entire lactation period.
+      item-24 at level 3: section_header: Impact assessment
+        item-25 at level 4: text: The CO2e emissions were calculat ... 65 for CO2, CH4 and N2O, respectively.
+      item-26 at level 3: section_header: Feed production
+        item-27 at level 4: section_header: Diets composition
+          item-28 at level 5: text: The DM intake of each ingredient ...  collected throughout the experiments.
+          item-29 at level 5: table with [21x11]
+            item-29 at level 6: caption: Table 2 Dairy cows’ diets in different scenariosa.
+        item-30 at level 4: section_header: GHG emissions from crop and pasture production
+          item-31 at level 5: text: GHG emission factors used for of ... onsume 70% of pastures during grazing.
+          item-32 at level 5: table with [9x5]
+            item-32 at level 6: caption: Table 3 GHG emission factors for Off- and On-farm feed production.
+          item-33 at level 5: text: Emissions from on-farm feed prod ... factors described by Rotz et al. [42].
+          item-34 at level 5: table with [28x5]
+            item-34 at level 6: caption: Table 4 GHG emissions from On-farm feed production.
+      item-35 at level 3: section_header: Animal husbandry
+        item-36 at level 4: text: The CH4 emissions from enteric f ... 1) = 13.8 + 0.185 × NDF (% DM intake).
+      item-37 at level 3: section_header: Manure from confined cows and urine and dung from grazing animals
+        item-38 at level 4: text: The CH4 emission from manure (kg ... for dietary GE per kg of DM (MJ kg-1).
+        item-39 at level 4: text: The OM digestibility was estimat ... h were 31%, 26% and 46%, respectively.
+        item-40 at level 4: text: The N2O-N emissions from urine a ...  using the IPCC [38] emission factors.
+      item-41 at level 3: section_header: Farm management
+        item-42 at level 4: text: Emissions due to farm management ...  crop and pasture production’ section.
+        item-43 at level 4: table with [12x4]
+          item-43 at level 5: caption: Table 5 Factors for major resource inputs in farm management.
+        item-44 at level 4: text: The amount of fuel use for manur ... me that animals stayed on confinement.
+        item-45 at level 4: text: The emissions from fuel were est ...  × kg CO2e (kg machinery mass)-1 [42].
+        item-46 at level 4: text: Emissions from electricity for m ... ws in naturally ventilated barns [47].
+      item-47 at level 3: section_header: Co-product allocation
+        item-48 at level 4: text: The C footprint for milk produce ...  directly assigned to milk production.
+      item-49 at level 3: section_header: Sensitivity analysis
+        item-50 at level 4: text: A sensitivity index was calculat ... ses a similar change in the footprint.
+    item-51 at level 2: section_header: Results and discussion
+      item-52 at level 3: text: The study has assessed the impac ... , feed production and electricity use.
+      item-53 at level 3: section_header: Greenhouse gas emissions
+        item-54 at level 4: text: Depending on emission factors us ... more than 5% of overall GHG emissions.
+        item-55 at level 4: picture
+          item-55 at level 5: caption: Fig 2 Overall greenhouse gas emissions in dairy cattle systems under various scenarios. TMR = ad libitum TMR intake, 75TMR = 75% of ad libitum TMR intake with access to pasture, 50TMR = 50% of ad libitum TMR intake with access to pasture. (a) N2O emission factors for urine and dung from IPCC [38], feed production emission factors from Table 3 without accounting for sequestered CO2-C from perennial pasture, production of electricity = 0.73 kg CO2e kWh-1 [41]. (b) N2O emission factors for urine and dung from IPCC [38], feed production emission factors from Table 3 without accounting for sequestered CO2-C from perennial pasture, production of electricity = 0.205 kg CO2e kWh-1 [46]; (c) N2O emission factors for urine and dung from local data [37], feed production EF from Table 4 without accounting for sequestered CO2-C from perennial pasture, production of electricity = 0.205 kg CO2e kWh-1 [46]. (d) N2O emission factors for urine and dung from local data [37], feed production emission factors from Table 4 accounting for sequestered CO2-C from perennial pasture, production of electricity = 0.205 kg CO2e kWh-1 [46].
+        item-56 at level 4: text: Considering IPCC emission factor ...  the C footprint of the dairy systems.
+        item-57 at level 4: text: The similarity of C footprint be ... of TMR was replaced by pasture access.
+        item-58 at level 4: text: The lower C footprint in scenari ... r, averaging 0.004 kg N2O-N kg-1 [37].
+      item-59 at level 3: section_header: Methane emissions
+        item-60 at level 4: text: The enteric CH4 intensity was si ... ], which did not happen in this study.
+        item-61 at level 4: picture
+          item-61 at level 5: caption: Fig 3 Sensitivity of the C footprint. Sensitivity index = percentage change in C footprint for a 10% change in the given emission source divided by 10% of. (a) N2O emission factors for urine and dung from IPCC [38], feed production emission factors from Table 3, production of electricity = 0.73 kg CO2e kWh-1 [41]. (b) N2O emission factors for urine and dung from IPCC [38], feed production emission factors from Table 3, production of electricity = 0.205 kg CO2e kWh-1 [46]; (c) N2O emission factors for urine and dung from local data [37], feed production EF from Table 4 without accounting sequestered CO2-C from perennial pasture, production of electricity = 0.205 kg CO2e kWh-1 [46]. (d) N2O emission factors for urine and dung from local data [37], feed production emission factors from Table 4 accounting sequestered CO2-C from perennial pasture, production of electricity = 0.205 kg CO2e kWh-1 [46].
+        item-62 at level 4: text: The lack of difference in enteri ...  same scenarios as in this study [26].
+      item-63 at level 3: section_header: Emissions from excreta and feed production
+        item-64 at level 4: text: Using IPCC emission factors for  ...  may not be captured by microbes [65].
+        item-65 at level 4: picture
+          item-65 at level 5: caption: Fig 4 Greenhouse gas emissions (GHG) from manure and feed production in dairy cattle systems. TMR = ad libitum TMR intake, 75TMR = 75% of ad libitum TMR intake with access to pasture, 50TMR = 50% of ad libitum TMR intake with access to pasture. (a) N2O emission factors for urine and dung from IPCC [38]. (b) Feed production emission factors from Table 3. (c) N2O emission factors for urine and dung from local data [37]. (d) Feed production emission factors from Table 4 accounting sequestered CO2-C from perennial pasture.
+        item-66 at level 4: text: Using local emission factors for ... be revised for the subtropical region.
+        item-67 at level 4: text: Emissions for feed production de ... act, particularly in confinements [9].
+      item-68 at level 3: section_header: Farm management
+        item-69 at level 4: text: The lower impact of emissions fr ...  greater than 5% of total C footprint.
+        item-70 at level 4: text: Emissions from farm management d ...  gas and hard coal, respectively [46].
+      item-71 at level 3: section_header: Assumptions and limitations
+        item-72 at level 4: text: The milk production and composit ... ions as a function of soil management.
+      item-73 at level 3: section_header: Further considerations
+        item-74 at level 4: text: The potential for using pasture  ... g ECM)-1 in case of foot lesions [72].
+        item-75 at level 4: text: Grazing lands may also improve b ... hange of CO2 would be negligible [76].
+    item-76 at level 2: section_header: Conclusions
+      item-77 at level 3: text: This study assessed the C footpr ... on with or without access to pastures.
+    item-78 at level 2: section_header: Acknowledgments
+      item-79 at level 3: text: Thanks to Anna Naranjo for helpf ...  of the herd considered in this study.
+    item-80 at level 2: section_header: References
+      item-81 at level 3: list: group list
+        item-82 at level 4: list_item: IPCC. Climate Change and Land. Chapter 5: Food Security. 2019.
+        item-83 at level 4: list_item: HerreroM, HendersonB, HavlíkP, T ...  2016;6: 452–461. 10.1038/nclimate2925
+        item-84 at level 4: list_item: Rivera-FerreMG, López-i-GelatsF, ... hang. 2016;7: 869–892. 10.1002/wcc.421
+        item-85 at level 4: list_item: van ZantenHHE, MollenhorstH, Klo ... 21: 747–758. 10.1007/s11367-015-0944-1
+        item-86 at level 4: list_item: HristovAN, OhJ, FirkinsL, Dijkst ... 5–5069. 10.2527/jas.2013-6583 24045497
+        item-87 at level 4: list_item: HristovAN, OttT, TricaricoJ, Rot ... 5–5113. 10.2527/jas.2013-6585 24045470
+        item-88 at level 4: list_item: MontesF, MeinenR, DellC, RotzA,  ... 0–5094. 10.2527/jas.2013-6584 24045493
+        item-89 at level 4: list_item: LedgardSF, WeiS, WangX, Falconer ... : 155–163. 10.1016/j.agwat.2018.10.009
+        item-90 at level 4: list_item: O’BrienD, ShallooL, PattonJ, Buc ... 107: 33–46. 10.1016/j.agsy.2011.11.004
+        item-91 at level 4: list_item: SalouT, Le MouëlC, van der WerfH ... od. 2017 10.1016/j.jclepro.2016.05.019
+        item-92 at level 4: list_item: LizarraldeC, PicassoV, RotzCA, C ... gric Res. 2014;3: 1 10.5539/sar.v3n2p1
+        item-93 at level 4: list_item: ClarkCEF, KaurR, MillapanLO, Gol ... –5465. 10.3168/jds.2017-13388 29550132
+        item-94 at level 4: list_item: Food and Agriculture Organization. FAOSTAT. 2017.
+        item-95 at level 4: list_item: VogelerI, MackayA, VibartR, Rend ... .1016/j.scitotenv.2016.05.006 27203517
+        item-96 at level 4: list_item: WilkinsonJM, LeeMRF, RiveroMJ, C ... 0;75: 1–17. 10.1111/gfs.12458 32109974
+        item-97 at level 4: list_item: WalesWJ, MarettLC, GreenwoodJS,  ... i. 2013;53: 1167–1178. 10.1071/AN13207
+        item-98 at level 4: list_item: BargoF, MullerLD, DelahoyJE, Cas ... 168/jds.S0022-0302(02)74381-6 12487461
+        item-99 at level 4: list_item: VibartRE, FellnerV, BurnsJC, Hun ... 80. 10.1017/S0022029908003361 18701000
+        item-100 at level 4: list_item: MendozaA, CajarvilleC, RepettoJL ... –1944. 10.3168/jds.2015-10257 26778319
+        item-101 at level 4: list_item: NRC. Nutrient Requirements of Da ... gton DC: National Academy Press; 2001.
+        item-102 at level 4: list_item: INRA. INRA Feeding System for Ru ... shiers; 2018 10.3920/978-90-8686-872-8
+        item-103 at level 4: list_item: LorenzH, ReinschT, HessS, TaubeF ... 161–170. 10.1016/j.jclepro.2018.11.113
+        item-104 at level 4: list_item: ISO 14044. INTERNATIONAL STANDAR ... rements and guidelines. 2006;2006: 46.
+        item-105 at level 4: list_item: ISO 14040. The International Sta ... ;2006: 1–28. 10.1136/bmj.332.7550.1107
+        item-106 at level 4: list_item: FAO. Environmental Performance o ... nerships/leap/resources/guidelines/en/
+        item-107 at level 4: list_item: CivieroM, Ribeiro-FilhoHMN, Scha ... nce,. Foz do Iguaçu; 2019 pp. 141–141.
+        item-108 at level 4: list_item: IPCC—Intergovernmental Panel on  ... /2018/05/SYR_AR5_FINAL_full_wcover.pdf
+        item-109 at level 4: list_item: INRA. Alimentation des bovins, o ... Inra 2007. 4th ed. INRA, editor. 2007.
+        item-110 at level 4: list_item: DelagardeR, FaverdinP, BaratteC, ... 5–60. 10.1111/j.1365-2494.2010.00770.x
+        item-111 at level 4: list_item: MaBL, LiangBC, BiswasDK, Morriso ... 2;94: 15–31. 10.1007/s10705-012-9522-0
+        item-112 at level 4: list_item: RauccciGS, MoreiraCS, AlvesPS, M ... State. J Clean Prod. 2015;96: 418–425.
+        item-113 at level 4: list_item: CamargoGGT, RyanMR, RichardTL. E ... 3;63: 263–273. 10.1525/bio.2013.63.4.6
+        item-114 at level 4: list_item: da SilvaMSJ, JobimCC, PoppiEC, T ... 3–313. 10.1590/S1806-92902015000900001
+        item-115 at level 4: list_item: Duchini PGPGGuzatti GCGC, Ribeir ... Sci. 2016;67: 574–581. 10.1071/CP15170
+        item-116 at level 4: list_item: ScaravelliLFB, PereiraLET, Olivo ... teiras. Cienc Rural. 2007;37: 841–846.
+        item-117 at level 4: list_item: SbrissiaAF, DuchiniPG, ZaniniGD, ... : 945–954. 10.2135/cropsci2017.07.0447
+        item-118 at level 4: list_item: AlmeidaJGR, Dall-OrsolettaAC, Oz ... 12. 10.1017/S1751731119003057 31907089
+        item-119 at level 4: list_item: Intergovernamental Panel on Clim ... Global Environmental Strategies; 2006.
+        item-120 at level 4: list_item: RamalhoB, DieckowJ, BarthG, Simo ... il Sci. 2020; 1–14. 10.1111/ejss.12933
+        item-121 at level 4: list_item: FernandesHC, da SilveiraJCM, Rin ... –1587. 10.1590/s1413-70542008000500034
+        item-122 at level 4: list_item: Wang M Q. GREET 1.8a Spreadsheet ... transportation.anl.gov/software/GREET/
+        item-123 at level 4: list_item: RotzCAA, MontesF, ChianeseDS, Ch ... 6–1282. 10.3168/jds.2009-2162 20172247
+        item-124 at level 4: list_item: NiuM, KebreabE, HristovAN, OhJ,  ...  3368–3389. 10.1111/gcb.14094 29450980
+        item-125 at level 4: list_item: EugèneM, SauvantD, NozièreP, Via ... 10.1016/j.jenvman.2018.10.086 30602259
+        item-126 at level 4: list_item: ReedKF, MoraesLE, CasperDP, Kebr ... 5–3035. 10.3168/jds.2014-8397 25747829
+        item-127 at level 4: list_item: BarrosMV, PiekarskiCM, De Franci ... . Energies. 2018;11 10.3390/en11061412
+        item-128 at level 4: list_item: LudingtonD, JohnsonE. Dairy Farm ...  York State Energy Res Dev Auth. 2003.
+        item-129 at level 4: list_item: ThomaG, JollietO, WangY. A bioph ...  2013;31 10.1016/j.idairyj.2012.08.012
+        item-130 at level 4: list_item: NaranjoA, JohnsonA, RossowH. Gre ... . 2020 10.3168/jds.2019-16576 32037166
+        item-131 at level 4: list_item: JayasundaraS, WordenD, WeersinkA ... 18–1028. 10.1016/j.jclepro.2019.04.013
+        item-132 at level 4: list_item: WilliamsSRO, FisherPD, Berrisfor ... 4;19: 69–78. 10.1007/s11367-013-0619-8
+        item-133 at level 4: list_item: GollnowS, LundieS, MooreAD, McLa ... : 31–38. 10.1016/j.idairyj.2014.02.005
+        item-134 at level 4: list_item: O’BrienD, CapperJL, GarnsworthyP ... i. 2014 10.3168/jds.2013-7174 24440256
+        item-135 at level 4: list_item: ChobtangJ, McLarenSJ, LedgardSF, ... 2017;21: 1139–1152. 10.1111/jiec.12484
+        item-136 at level 4: list_item: GargMR, PhondbaBT, SherasiaPL, M ... Sci. 2016;56: 423–436. 10.1071/AN15464
+        item-137 at level 4: list_item: de LéisCM, CherubiniE, RuviaroCF ... 5;20: 46–60. 10.1007/s11367-014-0813-3
+        item-138 at level 4: list_item: O’BrienD, GeogheganA, McNamaraK, ... Sci. 2016;56: 495–500. 10.1071/AN15490
+        item-139 at level 4: list_item: O’BrienD, BrennanP, HumphreysJ,  ... : 1469–1481. 10.1007/s11367-014-0755-9
+        item-140 at level 4: list_item: BaekCY, LeeKM, ParkKH. Quantific ... : 50–60. 10.1016/j.jclepro.2014.02.010
+        item-141 at level 4: list_item: Dall-OrsolettaAC, AlmeidaJGR, Ca ... –4383. 10.3168/jds.2015-10396 27016830
+        item-142 at level 4: list_item: Dall-OrsolettaAC, OziemblowskiMM ... 5–73. 10.1016/j.anifeedsci.2019.05.009
+        item-143 at level 4: list_item: NiuM, AppuhamyJADRN, LeytemAB, D ... Sci. 2016;56: 312–321. 10.1071/AN15498
+        item-144 at level 4: list_item: WaghornGC, LawN, BryantM, Pachec ... i. 2019;59: 1261–1270. 10.1071/AN18018
+        item-145 at level 4: list_item: DickhoeferU, GlowackiS, GómezCA, ...  109–118. 10.1016/j.livsci.2018.08.004
+        item-146 at level 4: list_item: SchwabCG, BroderickGA. A 100-Yea ... 10112. 10.3168/jds.2017-13320 29153157
+        item-147 at level 4: list_item: SordiA, DieckowJ, BayerC, Alburq ... 90: 94–103. 10.1016/j.agee.2013.09.004
+        item-148 at level 4: list_item: SimonPL, DieckowJ, de KleinCAM,  ... 267: 74–82. 10.1016/j.agee.2018.08.013
+        item-149 at level 4: list_item: WangX, LedgardS, LuoJ, GuoY, Zha ... .1016/j.scitotenv.2017.12.259 29291563
+        item-150 at level 4: list_item: PirloG, LolliS. Environmental im ... 962–971. 10.1016/j.jclepro.2018.11.070
+        item-151 at level 4: list_item: HerzogA, WincklerC, ZollitschW.  ... 7: 174–187. 10.1016/j.agee.2018.07.029
+        item-152 at level 4: list_item: MostertPF, van MiddelaarCE, Bokk ... od. 2018 10.1016/j.jclepro.2017.10.019
+        item-153 at level 4: list_item: MostertPF, van MiddelaarCE, de B ... 7: 206–212. 10.1016/j.agsy.2018.09.006
+        item-154 at level 4: list_item: FoleyJA, RamankuttyN, BraumanKA, ...  337–342. 10.1038/nature10452 21993620
+        item-155 at level 4: list_item: LalR. Soil Carbon Sequestration  ... 1627. 10.1126/science.1097396 15192216
+        item-156 at level 4: list_item: BoddeyRM, JantaliaCP, ConceiçaoP ... –795. 10.1111/j.1365-2486.2009.02020.x
+        item-157 at level 4: list_item: McConkeyB, AngersD, BenthamM, Bo ...  the LULUCF sector for NIR 2014. 2014.
+  item-158 at level 1: caption: Fig 1 Overview of the milk produ ... stem boundary considered in the study.
+  item-159 at level 1: caption: Table 1 Descriptive characteristics of the herd.
+  item-160 at level 1: caption: Table 2 Dairy cows’ diets in different scenariosa.
+  item-161 at level 1: caption: Table 3 GHG emission factors for Off- and On-farm feed production.
+  item-162 at level 1: caption: Table 4 GHG emissions from On-farm feed production.
+  item-163 at level 1: caption: Table 5 Factors for major resource inputs in farm management.
+  item-164 at level 1: caption: Fig 2 Overall greenhouse gas emi ... lectricity = 0.205 kg CO2e kWh-1 [46].
+  item-165 at level 1: caption: Fig 3 Sensitivity of the C footp ... lectricity = 0.205 kg CO2e kWh-1 [46].
+  item-166 at level 1: caption: Fig 4 Greenhouse gas emissions ( ... uestered CO2-C from perennial pasture.
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v2/pone.0234687.xml.json b/tests/data/groundtruth/docling_v2/pone.0234687.xml.json
deleted file mode 100644
index 08543140..00000000
--- a/tests/data/groundtruth/docling_v2/pone.0234687.xml.json
+++ /dev/null
@@ -1,14426 +0,0 @@
-{
-  "schema_name": "DoclingDocument",
-  "version": "1.0.0",
-  "name": "pone.0234687",
-  "origin": {
-    "mimetype": "application/xml",
-    "binary_hash": 5380322456719865404,
-    "filename": "pone.0234687.xml"
-  },
-  "furniture": {
-    "self_ref": "#/furniture",
-    "children": [],
-    "name": "_root_",
-    "label": "unspecified"
-  },
-  "body": {
-    "self_ref": "#/body",
-    "children": [
-      {
-        "$ref": "#/texts/0"
-      },
-      {
-        "$ref": "#/texts/67"
-      },
-      {
-        "$ref": "#/texts/68"
-      },
-      {
-        "$ref": "#/texts/69"
-      },
-      {
-        "$ref": "#/texts/70"
-      },
-      {
-        "$ref": "#/texts/71"
-      },
-      {
-        "$ref": "#/texts/73"
-      },
-      {
-        "$ref": "#/texts/74"
-      },
-      {
-        "$ref": "#/texts/75"
-      },
-      {
-        "$ref": "#/texts/76"
-      }
-    ],
-    "name": "_root_",
-    "label": "unspecified"
-  },
-  "groups": [
-    {
-      "self_ref": "#/groups/0",
-      "parent": {
-        "$ref": "#/texts/77"
-      },
-      "children": [
-        {
-          "$ref": "#/texts/78"
-        },
-        {
-          "$ref": "#/texts/79"
-        },
-        {
-          "$ref": "#/texts/80"
-        },
-        {
-          "$ref": "#/texts/81"
-        },
-        {
-          "$ref": "#/texts/82"
-        },
-        {
-          "$ref": "#/texts/83"
-        },
-        {
-          "$ref": "#/texts/84"
-        },
-        {
-          "$ref": "#/texts/85"
-        },
-        {
-          "$ref": "#/texts/86"
-        },
-        {
-          "$ref": "#/texts/87"
-        },
-        {
-          "$ref": "#/texts/88"
-        },
-        {
-          "$ref": "#/texts/89"
-        },
-        {
-          "$ref": "#/texts/90"
-        },
-        {
-          "$ref": "#/texts/91"
-        },
-        {
-          "$ref": "#/texts/92"
-        },
-        {
-          "$ref": "#/texts/93"
-        },
-        {
-          "$ref": "#/texts/94"
-        },
-        {
-          "$ref": "#/texts/95"
-        },
-        {
-          "$ref": "#/texts/96"
-        },
-        {
-          "$ref": "#/texts/97"
-        },
-        {
-          "$ref": "#/texts/98"
-        },
-        {
-          "$ref": "#/texts/99"
-        },
-        {
-          "$ref": "#/texts/100"
-        },
-        {
-          "$ref": "#/texts/101"
-        },
-        {
-          "$ref": "#/texts/102"
-        },
-        {
-          "$ref": "#/texts/103"
-        },
-        {
-          "$ref": "#/texts/104"
-        },
-        {
-          "$ref": "#/texts/105"
-        },
-        {
-          "$ref": "#/texts/106"
-        },
-        {
-          "$ref": "#/texts/107"
-        },
-        {
-          "$ref": "#/texts/108"
-        },
-        {
-          "$ref": "#/texts/109"
-        },
-        {
-          "$ref": "#/texts/110"
-        },
-        {
-          "$ref": "#/texts/111"
-        },
-        {
-          "$ref": "#/texts/112"
-        },
-        {
-          "$ref": "#/texts/113"
-        },
-        {
-          "$ref": "#/texts/114"
-        },
-        {
-          "$ref": "#/texts/115"
-        },
-        {
-          "$ref": "#/texts/116"
-        },
-        {
-          "$ref": "#/texts/117"
-        },
-        {
-          "$ref": "#/texts/118"
-        },
-        {
-          "$ref": "#/texts/119"
-        },
-        {
-          "$ref": "#/texts/120"
-        },
-        {
-          "$ref": "#/texts/121"
-        },
-        {
-          "$ref": "#/texts/122"
-        },
-        {
-          "$ref": "#/texts/123"
-        },
-        {
-          "$ref": "#/texts/124"
-        },
-        {
-          "$ref": "#/texts/125"
-        },
-        {
-          "$ref": "#/texts/126"
-        },
-        {
-          "$ref": "#/texts/127"
-        },
-        {
-          "$ref": "#/texts/128"
-        },
-        {
-          "$ref": "#/texts/129"
-        },
-        {
-          "$ref": "#/texts/130"
-        },
-        {
-          "$ref": "#/texts/131"
-        },
-        {
-          "$ref": "#/texts/132"
-        },
-        {
-          "$ref": "#/texts/133"
-        },
-        {
-          "$ref": "#/texts/134"
-        },
-        {
-          "$ref": "#/texts/135"
-        },
-        {
-          "$ref": "#/texts/136"
-        },
-        {
-          "$ref": "#/texts/137"
-        },
-        {
-          "$ref": "#/texts/138"
-        },
-        {
-          "$ref": "#/texts/139"
-        },
-        {
-          "$ref": "#/texts/140"
-        },
-        {
-          "$ref": "#/texts/141"
-        },
-        {
-          "$ref": "#/texts/142"
-        },
-        {
-          "$ref": "#/texts/143"
-        },
-        {
-          "$ref": "#/texts/144"
-        },
-        {
-          "$ref": "#/texts/145"
-        },
-        {
-          "$ref": "#/texts/146"
-        },
-        {
-          "$ref": "#/texts/147"
-        },
-        {
-          "$ref": "#/texts/148"
-        },
-        {
-          "$ref": "#/texts/149"
-        },
-        {
-          "$ref": "#/texts/150"
-        },
-        {
-          "$ref": "#/texts/151"
-        },
-        {
-          "$ref": "#/texts/152"
-        },
-        {
-          "$ref": "#/texts/153"
-        }
-      ],
-      "name": "list",
-      "label": "list"
-    }
-  ],
-  "texts": [
-    {
-      "self_ref": "#/texts/0",
-      "parent": {
-        "$ref": "#/body"
-      },
-      "children": [
-        {
-          "$ref": "#/texts/1"
-        },
-        {
-          "$ref": "#/texts/2"
-        },
-        {
-          "$ref": "#/texts/4"
-        },
-        {
-          "$ref": "#/texts/10"
-        },
-        {
-          "$ref": "#/texts/43"
-        },
-        {
-          "$ref": "#/texts/64"
-        },
-        {
-          "$ref": "#/texts/66"
-        },
-        {
-          "$ref": "#/texts/72"
-        },
-        {
-          "$ref": "#/texts/77"
-        }
-      ],
-      "label": "title",
-      "prov": [],
-      "orig": "Potential to reduce greenhouse gas emissions through different dairy cattle systems in subtropical regions",
-      "text": "Potential to reduce greenhouse gas emissions through different dairy cattle systems in subtropical regions"
-    },
-    {
-      "self_ref": "#/texts/1",
-      "parent": {
-        "$ref": "#/texts/0"
-      },
-      "children": [],
-      "label": "paragraph",
-      "prov": [],
-      "orig": "Ribeiro-Filho Henrique M. N.; 1: Department of Animal Science, University of California, Davis, California, United States of America, 2: Programa de P\u00f3s-gradua\u00e7\u00e3o em Ci\u00eancia Animal, Universidade do Estado de Santa Catarina, Lages, Santa Catarina, Brazil; Civiero Maur\u00edcio; 2: Programa de P\u00f3s-gradua\u00e7\u00e3o em Ci\u00eancia Animal, Universidade do Estado de Santa Catarina, Lages, Santa Catarina, Brazil; Kebreab Ermias; 1: Department of Animal Science, University of California, Davis, California, United States of America",
-      "text": "Ribeiro-Filho Henrique M. N.; 1: Department of Animal Science, University of California, Davis, California, United States of America, 2: Programa de P\u00f3s-gradua\u00e7\u00e3o em Ci\u00eancia Animal, Universidade do Estado de Santa Catarina, Lages, Santa Catarina, Brazil; Civiero Maur\u00edcio; 2: Programa de P\u00f3s-gradua\u00e7\u00e3o em Ci\u00eancia Animal, Universidade do Estado de Santa Catarina, Lages, Santa Catarina, Brazil; Kebreab Ermias; 1: Department of Animal Science, University of California, Davis, California, United States of America"
-    },
-    {
-      "self_ref": "#/texts/2",
-      "parent": {
-        "$ref": "#/texts/0"
-      },
-      "children": [
-        {
-          "$ref": "#/texts/3"
-        }
-      ],
-      "label": "section_header",
-      "prov": [],
-      "orig": "Abstract",
-      "text": "Abstract",
-      "level": 1
-    },
-    {
-      "self_ref": "#/texts/3",
-      "parent": {
-        "$ref": "#/texts/2"
-      },
-      "children": [],
-      "label": "text",
-      "prov": [],
-      "orig": "Carbon (C) footprint of dairy production, expressed in kg C dioxide (CO2) equivalents (CO2e) (kg energy-corrected milk (ECM))-1, encompasses emissions from feed production, diet management and total product output. The proportion of pasture on diets may affect all these factors, mainly in subtropical climate zones, where cows may access tropical and temperate pastures during warm and cold seasons, respectively. The aim of the study was to assess the C footprint of a dairy system with annual tropical and temperate pastures in a subtropical region. The system boundary included all processes up to the animal farm gate. Feed requirement during the entire life of each cow was based on data recorded from Holstein \u00d7 Jersey cow herds producing an average of 7,000 kg ECM lactation-1. The milk production response as consequence of feed strategies (scenarios) was based on results from two experiments (warm and cold seasons) using lactating cows from the same herd. Three scenarios were evaluated: total mixed ration (TMR) ad libitum intake, 75, and 50% of ad libitum TMR intake with access to grazing either a tropical or temperate pasture during lactation periods. Considering IPCC and international literature values to estimate emissions from urine/dung, feed production and electricity, the C footprint was similar between scenarios, averaging 1.06 kg CO2e (kg ECM)-1. Considering factors from studies conducted in subtropical conditions and actual inputs for on-farm feed production, the C footprint decreased 0.04 kg CO2e (kg ECM)-1 in scenarios including pastures compared to ad libitum TMR. Regardless of factors considered, emissions from feed production decreased as the proportion of pasture went up. In conclusion, decreasing TMR intake and including pastures in dairy cow diets in subtropical conditions have the potential to maintain or reduce the C footprint to a small extent.",
-      "text": "Carbon (C) footprint of dairy production, expressed in kg C dioxide (CO2) equivalents (CO2e) (kg energy-corrected milk (ECM))-1, encompasses emissions from feed production, diet management and total product output. The proportion of pasture on diets may affect all these factors, mainly in subtropical climate zones, where cows may access tropical and temperate pastures during warm and cold seasons, respectively. The aim of the study was to assess the C footprint of a dairy system with annual tropical and temperate pastures in a subtropical region. The system boundary included all processes up to the animal farm gate. Feed requirement during the entire life of each cow was based on data recorded from Holstein \u00d7 Jersey cow herds producing an average of 7,000 kg ECM lactation-1. The milk production response as consequence of feed strategies (scenarios) was based on results from two experiments (warm and cold seasons) using lactating cows from the same herd. Three scenarios were evaluated: total mixed ration (TMR) ad libitum intake, 75, and 50% of ad libitum TMR intake with access to grazing either a tropical or temperate pasture during lactation periods. Considering IPCC and international literature values to estimate emissions from urine/dung, feed production and electricity, the C footprint was similar between scenarios, averaging 1.06 kg CO2e (kg ECM)-1. Considering factors from studies conducted in subtropical conditions and actual inputs for on-farm feed production, the C footprint decreased 0.04 kg CO2e (kg ECM)-1 in scenarios including pastures compared to ad libitum TMR. Regardless of factors considered, emissions from feed production decreased as the proportion of pasture went up. In conclusion, decreasing TMR intake and including pastures in dairy cow diets in subtropical conditions have the potential to maintain or reduce the C footprint to a small extent."
-    },
-    {
-      "self_ref": "#/texts/4",
-      "parent": {
-        "$ref": "#/texts/0"
-      },
-      "children": [
-        {
-          "$ref": "#/texts/5"
-        },
-        {
-          "$ref": "#/texts/6"
-        },
-        {
-          "$ref": "#/texts/7"
-        },
-        {
-          "$ref": "#/texts/8"
-        },
-        {
-          "$ref": "#/texts/9"
-        }
-      ],
-      "label": "section_header",
-      "prov": [],
-      "orig": "Introduction",
-      "text": "Introduction",
-      "level": 1
-    },
-    {
-      "self_ref": "#/texts/5",
-      "parent": {
-        "$ref": "#/texts/4"
-      },
-      "children": [],
-      "label": "text",
-      "prov": [],
-      "orig": "Greenhouse gas (GHG) emissions from livestock activities represent 10\u201312% of global emissions [1], ranging from 5.5\u20137.5 Gt CO2 equivalents (CO2e) yr-1, with almost 30% coming from dairy cattle production systems [2]. However, the livestock sector supply between 13 and 17% of calories and between 28 and 33% of human edible protein consumption globally [3]. Additionally, livestock produce more human-edible protein per unit area than crops when land is unsuitable for food crop production [4].",
-      "text": "Greenhouse gas (GHG) emissions from livestock activities represent 10\u201312% of global emissions [1], ranging from 5.5\u20137.5 Gt CO2 equivalents (CO2e) yr-1, with almost 30% coming from dairy cattle production systems [2]. However, the livestock sector supply between 13 and 17% of calories and between 28 and 33% of human edible protein consumption globally [3]. Additionally, livestock produce more human-edible protein per unit area than crops when land is unsuitable for food crop production [4]."
-    },
-    {
-      "self_ref": "#/texts/6",
-      "parent": {
-        "$ref": "#/texts/4"
-      },
-      "children": [],
-      "label": "text",
-      "prov": [],
-      "orig": "Considering the key role of livestock systems in global food security, several technical and management interventions have been investigated to mitigate methane (CH4) emissions from enteric fermentation [5], animal management [6] and manure management [7]. CH4 emissions from enteric fermentation represents around 34% of total emissions from livestock sector, which is the largest source [2]. Increasing proportions of concentrate and digestibility of forages in the diet have been proposed as mitigation strategies [1,5]. In contrast, some life cycle assessment (LCA) studies of dairy systems in temperate regions [8\u201311] have identified that increasing concentrate proportion may increase carbon (C) footprint due to greater resource use and pollutants from the production of feed compared to forage. Thus, increasing pasture proportion on dairy cattle systems may be an alternative management to mitigate the C footprint.",
-      "text": "Considering the key role of livestock systems in global food security, several technical and management interventions have been investigated to mitigate methane (CH4) emissions from enteric fermentation [5], animal management [6] and manure management [7]. CH4 emissions from enteric fermentation represents around 34% of total emissions from livestock sector, which is the largest source [2]. Increasing proportions of concentrate and digestibility of forages in the diet have been proposed as mitigation strategies [1,5]. In contrast, some life cycle assessment (LCA) studies of dairy systems in temperate regions [8\u201311] have identified that increasing concentrate proportion may increase carbon (C) footprint due to greater resource use and pollutants from the production of feed compared to forage. Thus, increasing pasture proportion on dairy cattle systems may be an alternative management to mitigate the C footprint."
-    },
-    {
-      "self_ref": "#/texts/7",
-      "parent": {
-        "$ref": "#/texts/4"
-      },
-      "children": [],
-      "label": "text",
-      "prov": [],
-      "orig": "In subtropical climate zones, cows may graze tropical pastures rather than temperate pastures during the warm season [12]. Some important dairy production areas, such as southern Brazil, central to northern Argentina, Uruguay, South Africa, New Zealand and Australia, are located in these climate zones, having more than 900 million ha in native, permanent or temporary pastures, producing almost 20% of global milk production [13]. However, due to a considerable inter-annual variation in pasture growth rates [14,15], the interest in mixed systems, using total mixed ration (TMR) + pasture has been increasing [16]. Nevertheless, to our best knowledge, studies conducted to evaluate milk production response in dairy cow diets receiving TMR and pastures have only been conducted in temperate pastures and not in tropical pastures (e.g. [17\u201319]).",
-      "text": "In subtropical climate zones, cows may graze tropical pastures rather than temperate pastures during the warm season [12]. Some important dairy production areas, such as southern Brazil, central to northern Argentina, Uruguay, South Africa, New Zealand and Australia, are located in these climate zones, having more than 900 million ha in native, permanent or temporary pastures, producing almost 20% of global milk production [13]. However, due to a considerable inter-annual variation in pasture growth rates [14,15], the interest in mixed systems, using total mixed ration (TMR) + pasture has been increasing [16]. Nevertheless, to our best knowledge, studies conducted to evaluate milk production response in dairy cow diets receiving TMR and pastures have only been conducted in temperate pastures and not in tropical pastures (e.g. [17\u201319])."
-    },
-    {
-      "self_ref": "#/texts/8",
-      "parent": {
-        "$ref": "#/texts/4"
-      },
-      "children": [],
-      "label": "text",
-      "prov": [],
-      "orig": "It has been shown that dairy cows receiving TMR-based diets may not decrease milk production when supplemented with temperate pastures in a vegetative growth stage [18]. On the other hand, tropical pastures have lower organic matter digestibility and cows experience reduced dry matter (DM) intake and milk yield compared to temperate pastures [20,21]. A lower milk yield increases the C footprint intensity [22], offsetting an expected advantage through lower GHG emissions from crop and reduced DM intake.",
-      "text": "It has been shown that dairy cows receiving TMR-based diets may not decrease milk production when supplemented with temperate pastures in a vegetative growth stage [18]. On the other hand, tropical pastures have lower organic matter digestibility and cows experience reduced dry matter (DM) intake and milk yield compared to temperate pastures [20,21]. A lower milk yield increases the C footprint intensity [22], offsetting an expected advantage through lower GHG emissions from crop and reduced DM intake."
-    },
-    {
-      "self_ref": "#/texts/9",
-      "parent": {
-        "$ref": "#/texts/4"
-      },
-      "children": [],
-      "label": "text",
-      "prov": [],
-      "orig": "The aim of this work was to quantify the C footprint and land use of dairy systems using cows with a medium milk production potential in a subtropical region. The effect of replacing total mixed ration (TMR) with pastures during lactation periods was evaluated.",
-      "text": "The aim of this work was to quantify the C footprint and land use of dairy systems using cows with a medium milk production potential in a subtropical region. The effect of replacing total mixed ration (TMR) with pastures during lactation periods was evaluated."
-    },
-    {
-      "self_ref": "#/texts/10",
-      "parent": {
-        "$ref": "#/texts/0"
-      },
-      "children": [
-        {
-          "$ref": "#/texts/11"
-        },
-        {
-          "$ref": "#/texts/12"
-        },
-        {
-          "$ref": "#/texts/14"
-        },
-        {
-          "$ref": "#/texts/17"
-        },
-        {
-          "$ref": "#/texts/20"
-        },
-        {
-          "$ref": "#/texts/22"
-        },
-        {
-          "$ref": "#/texts/28"
-        },
-        {
-          "$ref": "#/texts/30"
-        },
-        {
-          "$ref": "#/texts/34"
-        },
-        {
-          "$ref": "#/texts/39"
-        },
-        {
-          "$ref": "#/texts/41"
-        }
-      ],
-      "label": "section_header",
-      "prov": [],
-      "orig": "Materials and methods",
-      "text": "Materials and methods",
-      "level": 1
-    },
-    {
-      "self_ref": "#/texts/11",
-      "parent": {
-        "$ref": "#/texts/10"
-      },
-      "children": [],
-      "label": "text",
-      "prov": [],
-      "orig": "An LCA was developed according to the ISO standards [23,24] and Food and Agriculture Organization of the United Nations (FAO) Livestock Environmental Assessment Protocol guidelines [25]. All procedures were approved by the \u2018Comiss\u00e3o de \u00c9tica no Uso de Animais\u2019 (CEUA/UDESC) on September 15, 2016\u2014Approval number 4373090816 - https://www.udesc.br/cav/ceua.",
-      "text": "An LCA was developed according to the ISO standards [23,24] and Food and Agriculture Organization of the United Nations (FAO) Livestock Environmental Assessment Protocol guidelines [25]. All procedures were approved by the \u2018Comiss\u00e3o de \u00c9tica no Uso de Animais\u2019 (CEUA/UDESC) on September 15, 2016\u2014Approval number 4373090816 - https://www.udesc.br/cav/ceua."
-    },
-    {
-      "self_ref": "#/texts/12",
-      "parent": {
-        "$ref": "#/texts/10"
-      },
-      "children": [
-        {
-          "$ref": "#/texts/13"
-        }
-      ],
-      "label": "section_header",
-      "prov": [],
-      "orig": "System boundary",
-      "text": "System boundary",
-      "level": 1
-    },
-    {
-      "self_ref": "#/texts/13",
-      "parent": {
-        "$ref": "#/texts/12"
-      },
-      "children": [],
-      "label": "text",
-      "prov": [],
-      "orig": "The goal of the study was to assess the C footprint of annual tropical and temperate pastures in lactating dairy cow diets. The production system was divided into four main processes: (i) animal husbandry, (ii) manure management and urine and dung deposited by grazing animals, (iii) production of feed ingredients and (iv) farm management (Fig 1). The study boundary included all processes up to the animal farm gate (cradle to gate), including secondary sources such as GHG emissions during the production of fuel, electricity, machinery, manufacturing of fertilizer, pesticides, seeds and plastic used in silage production. Fuel combustion and machinery (manufacture and repairs) for manure handling and electricity for milking and confinement were accounted as emissions from farm management. Emissions post milk production were assumed to be similar for all scenarios, therefore, activities including milk processing, distribution, retail or consumption were outside of the system boundary.",
-      "text": "The goal of the study was to assess the C footprint of annual tropical and temperate pastures in lactating dairy cow diets. The production system was divided into four main processes: (i) animal husbandry, (ii) manure management and urine and dung deposited by grazing animals, (iii) production of feed ingredients and (iv) farm management (Fig 1). The study boundary included all processes up to the animal farm gate (cradle to gate), including secondary sources such as GHG emissions during the production of fuel, electricity, machinery, manufacturing of fertilizer, pesticides, seeds and plastic used in silage production. Fuel combustion and machinery (manufacture and repairs) for manure handling and electricity for milking and confinement were accounted as emissions from farm management. Emissions post milk production were assumed to be similar for all scenarios, therefore, activities including milk processing, distribution, retail or consumption were outside of the system boundary."
-    },
-    {
-      "self_ref": "#/texts/14",
-      "parent": {
-        "$ref": "#/texts/10"
-      },
-      "children": [
-        {
-          "$ref": "#/texts/15"
-        },
-        {
-          "$ref": "#/texts/16"
-        }
-      ],
-      "label": "section_header",
-      "prov": [],
-      "orig": "Functional unit",
-      "text": "Functional unit",
-      "level": 1
-    },
-    {
-      "self_ref": "#/texts/15",
-      "parent": {
-        "$ref": "#/texts/14"
-      },
-      "children": [],
-      "label": "text",
-      "prov": [],
-      "orig": "The functional unit was one kilogram of energy-corrected milk (ECM) at the farm gate. All processes in the system were calculated based on one kilogram ECM. The ECM was calculated by multiplying milk production by the ratio of the energy content of the milk to the energy content of standard milk with 4% fat and 3.3% true protein according to NRC [20] as follows:",
-      "text": "The functional unit was one kilogram of energy-corrected milk (ECM) at the farm gate. All processes in the system were calculated based on one kilogram ECM. The ECM was calculated by multiplying milk production by the ratio of the energy content of the milk to the energy content of standard milk with 4% fat and 3.3% true protein according to NRC [20] as follows:"
-    },
-    {
-      "self_ref": "#/texts/16",
-      "parent": {
-        "$ref": "#/texts/14"
-      },
-      "children": [],
-      "label": "text",
-      "prov": [],
-      "orig": "ECM = Milk production \u00d7 (0.0929 \u00d7 fat% + 0.0588\u00d7 true protein% + 0.192) / (0.0929 \u00d7 (4%) + 0.0588 \u00d7 (3.3%) + 0.192), where fat% and protein% are fat and protein percentages in milk, respectively. The average milk production and composition were recorded from the University of Santa Catarina State (Brazil) herd, considering 165 lactations between 2009 and 2018. The herd is predominantly Holstein \u00d7 Jersey cows, with key characteristics described in Table 1.",
-      "text": "ECM = Milk production \u00d7 (0.0929 \u00d7 fat% + 0.0588\u00d7 true protein% + 0.192) / (0.0929 \u00d7 (4%) + 0.0588 \u00d7 (3.3%) + 0.192), where fat% and protein% are fat and protein percentages in milk, respectively. The average milk production and composition were recorded from the University of Santa Catarina State (Brazil) herd, considering 165 lactations between 2009 and 2018. The herd is predominantly Holstein \u00d7 Jersey cows, with key characteristics described in Table 1."
-    },
-    {
-      "self_ref": "#/texts/17",
-      "parent": {
-        "$ref": "#/texts/10"
-      },
-      "children": [
-        {
-          "$ref": "#/texts/18"
-        },
-        {
-          "$ref": "#/texts/19"
-        }
-      ],
-      "label": "section_header",
-      "prov": [],
-      "orig": "Data sources and livestock system description",
-      "text": "Data sources and livestock system description",
-      "level": 1
-    },
-    {
-      "self_ref": "#/texts/18",
-      "parent": {
-        "$ref": "#/texts/17"
-      },
-      "children": [],
-      "label": "text",
-      "prov": [],
-      "orig": "The individual feed requirements, as well as the milk production responses based on feed strategies were based on data recorded from the herd described above and two experiments performed using lactating cows from the same herd. Due to the variation on herbage production throughout the year, feed requirements were estimated taking into consideration that livestock systems have a calving period in April, which represents the beginning of fall season in the southern Hemisphere. The experiments have shown a 10% reduction in ECM production in dairy cows that received both 75 and 50% of ad libitum TMR intake with access to grazing a tropical pasture (pearl-millet, Pennisetum glaucum \u2018Campeiro\u2019) compared to cows receiving ad libitum TMR intake. Cows grazing on a temperate pasture (ryegrass, Lolium multiflorum \u2018Maximus\u2019) did not need changes to ECM production compared to the ad libitum TMR intake group.",
-      "text": "The individual feed requirements, as well as the milk production responses based on feed strategies were based on data recorded from the herd described above and two experiments performed using lactating cows from the same herd. Due to the variation on herbage production throughout the year, feed requirements were estimated taking into consideration that livestock systems have a calving period in April, which represents the beginning of fall season in the southern Hemisphere. The experiments have shown a 10% reduction in ECM production in dairy cows that received both 75 and 50% of ad libitum TMR intake with access to grazing a tropical pasture (pearl-millet, Pennisetum glaucum \u2018Campeiro\u2019) compared to cows receiving ad libitum TMR intake. Cows grazing on a temperate pasture (ryegrass, Lolium multiflorum \u2018Maximus\u2019) did not need changes to ECM production compared to the ad libitum TMR intake group."
-    },
-    {
-      "self_ref": "#/texts/19",
-      "parent": {
-        "$ref": "#/texts/17"
-      },
-      "children": [],
-      "label": "text",
-      "prov": [],
-      "orig": "Using experimental data, three scenarios were evaluated during the lactation period: ad libitum TMR intake, and 75, and 50% of ad libitum TMR intake with access to grazing either an annual tropical or temperate pasture as a function of month ([26], Civiero et al., in press). From April to October (210 days) cows accessed an annual temperate pasture (ryegrass), and from November to beginning of February (95 days) cows grazed an annual tropical pasture (pearl-millet). The average annual reduction in ECM production in dairy cows with access to pastures is 3%. This value was assumed during an entire lactation period.",
-      "text": "Using experimental data, three scenarios were evaluated during the lactation period: ad libitum TMR intake, and 75, and 50% of ad libitum TMR intake with access to grazing either an annual tropical or temperate pasture as a function of month ([26], Civiero et al., in press). From April to October (210 days) cows accessed an annual temperate pasture (ryegrass), and from November to beginning of February (95 days) cows grazed an annual tropical pasture (pearl-millet). The average annual reduction in ECM production in dairy cows with access to pastures is 3%. This value was assumed during an entire lactation period."
-    },
-    {
-      "self_ref": "#/texts/20",
-      "parent": {
-        "$ref": "#/texts/10"
-      },
-      "children": [
-        {
-          "$ref": "#/texts/21"
-        }
-      ],
-      "label": "section_header",
-      "prov": [],
-      "orig": "Impact assessment",
-      "text": "Impact assessment",
-      "level": 1
-    },
-    {
-      "self_ref": "#/texts/21",
-      "parent": {
-        "$ref": "#/texts/20"
-      },
-      "children": [],
-      "label": "text",
-      "prov": [],
-      "orig": "The CO2e emissions were calculated by multiplying the emissions of CO2, CH4 and N2O by their 100-year global warming potential (GWP100), based on IPCC assessment report 5 (AR5; [27]). The values of GWP100 are 1, 28 and 265 for CO2, CH4 and N2O, respectively.",
-      "text": "The CO2e emissions were calculated by multiplying the emissions of CO2, CH4 and N2O by their 100-year global warming potential (GWP100), based on IPCC assessment report 5 (AR5; [27]). The values of GWP100 are 1, 28 and 265 for CO2, CH4 and N2O, respectively."
-    },
-    {
-      "self_ref": "#/texts/22",
-      "parent": {
-        "$ref": "#/texts/10"
-      },
-      "children": [
-        {
-          "$ref": "#/texts/23"
-        },
-        {
-          "$ref": "#/texts/25"
-        }
-      ],
-      "label": "section_header",
-      "prov": [],
-      "orig": "Feed production",
-      "text": "Feed production",
-      "level": 1
-    },
-    {
-      "self_ref": "#/texts/23",
-      "parent": {
-        "$ref": "#/texts/22"
-      },
-      "children": [
-        {
-          "$ref": "#/texts/24"
-        }
-      ],
-      "label": "section_header",
-      "prov": [],
-      "orig": "Diets composition",
-      "text": "Diets composition",
-      "level": 1
-    },
-    {
-      "self_ref": "#/texts/24",
-      "parent": {
-        "$ref": "#/texts/23"
-      },
-      "children": [],
-      "label": "text",
-      "prov": [],
-      "orig": "The DM intake of each ingredient throughout the entire life of animals during lactation periods was calculated for each scenario: cows receiving only TMR, cows receiving 75% of TMR with annual pastures and cows receiving 50% of TMR with annual pastures (Table 2). In each of other phases of life (calf, heifer, dry cow), animals received the same diet, including a perennial tropical pasture (kikuyu grass, Pennisetum clandestinum). The DM intake of calves, heifers and dry cows was calculated assuming 2.8, 2.5 and 1.9% body weight, respectively [20]. In each case, the actual DM intake of concentrate and corn silage was recorded, and pasture DM intake was estimated by the difference between daily expected DM intake and actual DM intake of concentrate and corn silage. For lactating heifers and cows, TMR was formulated to meet the net energy for lactation (NEL) and metabolizable protein (MP) requirements of experimental animals, according to [28]. The INRA system was used because it is possible to estimate pasture DM intake taking into account the TMR intake, pasture management and the time of access to pasture using the GrazeIn model [29], which was integrated in the software INRAtion 4.07 (https://www.inration.educagri.fr/fr/forum.php). The nutrient intake was calculated as a product of TMR and pasture intake and the nutrient contents of TMR and pasture, respectively, which were determined in feed samples collected throughout the experiments.",
-      "text": "The DM intake of each ingredient throughout the entire life of animals during lactation periods was calculated for each scenario: cows receiving only TMR, cows receiving 75% of TMR with annual pastures and cows receiving 50% of TMR with annual pastures (Table 2). In each of other phases of life (calf, heifer, dry cow), animals received the same diet, including a perennial tropical pasture (kikuyu grass, Pennisetum clandestinum). The DM intake of calves, heifers and dry cows was calculated assuming 2.8, 2.5 and 1.9% body weight, respectively [20]. In each case, the actual DM intake of concentrate and corn silage was recorded, and pasture DM intake was estimated by the difference between daily expected DM intake and actual DM intake of concentrate and corn silage. For lactating heifers and cows, TMR was formulated to meet the net energy for lactation (NEL) and metabolizable protein (MP) requirements of experimental animals, according to [28]. The INRA system was used because it is possible to estimate pasture DM intake taking into account the TMR intake, pasture management and the time of access to pasture using the GrazeIn model [29], which was integrated in the software INRAtion 4.07 (https://www.inration.educagri.fr/fr/forum.php). The nutrient intake was calculated as a product of TMR and pasture intake and the nutrient contents of TMR and pasture, respectively, which were determined in feed samples collected throughout the experiments."
-    },
-    {
-      "self_ref": "#/texts/25",
-      "parent": {
-        "$ref": "#/texts/22"
-      },
-      "children": [
-        {
-          "$ref": "#/texts/26"
-        },
-        {
-          "$ref": "#/texts/27"
-        }
-      ],
-      "label": "section_header",
-      "prov": [],
-      "orig": "GHG emissions from crop and pasture production",
-      "text": "GHG emissions from crop and pasture production",
-      "level": 1
-    },
-    {
-      "self_ref": "#/texts/26",
-      "parent": {
-        "$ref": "#/texts/25"
-      },
-      "children": [],
-      "label": "text",
-      "prov": [],
-      "orig": "GHG emission factors used for off- and on-farm feed production were based on literature values, and are presented in Table 3. The emission factor used for corn grain is the average of emission factors observed in different levels of synthetic N fertilization [30]. The emission factor used for soybean is based on Brazilian soybean production [31]. The emissions used for corn silage, including feed processing (cutting, crushing and mixing), and annual or perennial grass productions were 3300 and 1500 kg CO2e ha-1, respectively [32]. The DM production (kg ha-1) of corn silage and pastures were based on regional and locally recorded data [33\u201336], assuming that animals are able to consume 70% of pastures during grazing.",
-      "text": "GHG emission factors used for off- and on-farm feed production were based on literature values, and are presented in Table 3. The emission factor used for corn grain is the average of emission factors observed in different levels of synthetic N fertilization [30]. The emission factor used for soybean is based on Brazilian soybean production [31]. The emissions used for corn silage, including feed processing (cutting, crushing and mixing), and annual or perennial grass productions were 3300 and 1500 kg CO2e ha-1, respectively [32]. The DM production (kg ha-1) of corn silage and pastures were based on regional and locally recorded data [33\u201336], assuming that animals are able to consume 70% of pastures during grazing."
-    },
-    {
-      "self_ref": "#/texts/27",
-      "parent": {
-        "$ref": "#/texts/25"
-      },
-      "children": [],
-      "label": "text",
-      "prov": [],
-      "orig": "Emissions from on-farm feed production (corn silage and pasture) were estimated using primary and secondary sources based on the actual amount of each input (Table 4). Primary sources were direct and indirect N2O-N emissions from organic and synthetic fertilizers and crop/pasture residues, CO2-C emissions from lime and urea applications, as well as fuel combustion. The direct N2O-N emission factor (kg (kg N input)-1) is based on a local study performed previously [37]. For indirect N2O-N emissions (kg N2O-N (kg NH3-N + NOx)-1), as well as CO2-C emissions from lime + urea, default values proposed by IPCC [38] were used. For perennial pastures, a C sequestration of 0.57 t ha-1 was used based on a 9-year study conducted in southern Brazil [39]. Due to the use of conventional tillage, no C sequestration was considered for annual pastures. The amount of fuel required was 8.9 (no-tillage) and 14.3 L ha-1 (disking) for annual tropical and temperate pastures, respectively [40]. The CO2 from fuel combustion was 2.7 kg CO2 L-1 [41]. Secondary sources of emissions during the production of fuel, machinery, fertilizer, pesticides, seeds and plastic for ensilage were estimated using emission factors described by Rotz et al. [42].",
-      "text": "Emissions from on-farm feed production (corn silage and pasture) were estimated using primary and secondary sources based on the actual amount of each input (Table 4). Primary sources were direct and indirect N2O-N emissions from organic and synthetic fertilizers and crop/pasture residues, CO2-C emissions from lime and urea applications, as well as fuel combustion. The direct N2O-N emission factor (kg (kg N input)-1) is based on a local study performed previously [37]. For indirect N2O-N emissions (kg N2O-N (kg NH3-N + NOx)-1), as well as CO2-C emissions from lime + urea, default values proposed by IPCC [38] were used. For perennial pastures, a C sequestration of 0.57 t ha-1 was used based on a 9-year study conducted in southern Brazil [39]. Due to the use of conventional tillage, no C sequestration was considered for annual pastures. The amount of fuel required was 8.9 (no-tillage) and 14.3 L ha-1 (disking) for annual tropical and temperate pastures, respectively [40]. The CO2 from fuel combustion was 2.7 kg CO2 L-1 [41]. Secondary sources of emissions during the production of fuel, machinery, fertilizer, pesticides, seeds and plastic for ensilage were estimated using emission factors described by Rotz et al. [42]."
-    },
-    {
-      "self_ref": "#/texts/28",
-      "parent": {
-        "$ref": "#/texts/10"
-      },
-      "children": [
-        {
-          "$ref": "#/texts/29"
-        }
-      ],
-      "label": "section_header",
-      "prov": [],
-      "orig": "Animal husbandry",
-      "text": "Animal husbandry",
-      "level": 1
-    },
-    {
-      "self_ref": "#/texts/29",
-      "parent": {
-        "$ref": "#/texts/28"
-      },
-      "children": [],
-      "label": "text",
-      "prov": [],
-      "orig": "The CH4 emissions from enteric fermentation intensity (g (kg ECM)-1) was a function of estimated CH4 yield (g (kg DM intake)-1), actual DM intake and ECM. The enteric CH4 yield was estimated as a function of neutral detergent fiber (NDF) concentration on total DM intake, as proposed by Niu et al. [43], where: CH4 yield (g (kg DM intake)-1) = 13.8 + 0.185 \u00d7 NDF (% DM intake).",
-      "text": "The CH4 emissions from enteric fermentation intensity (g (kg ECM)-1) was a function of estimated CH4 yield (g (kg DM intake)-1), actual DM intake and ECM. The enteric CH4 yield was estimated as a function of neutral detergent fiber (NDF) concentration on total DM intake, as proposed by Niu et al. [43], where: CH4 yield (g (kg DM intake)-1) = 13.8 + 0.185 \u00d7 NDF (% DM intake)."
-    },
-    {
-      "self_ref": "#/texts/30",
-      "parent": {
-        "$ref": "#/texts/10"
-      },
-      "children": [
-        {
-          "$ref": "#/texts/31"
-        },
-        {
-          "$ref": "#/texts/32"
-        },
-        {
-          "$ref": "#/texts/33"
-        }
-      ],
-      "label": "section_header",
-      "prov": [],
-      "orig": "Manure from confined cows and urine and dung from grazing animals",
-      "text": "Manure from confined cows and urine and dung from grazing animals",
-      "level": 1
-    },
-    {
-      "self_ref": "#/texts/31",
-      "parent": {
-        "$ref": "#/texts/30"
-      },
-      "children": [],
-      "label": "text",
-      "prov": [],
-      "orig": "The CH4 emission from manure (kg (kg ECM)-1) was a function of daily CH4 emission from manure (kg cow-1) and daily ECM (kg cow-1). The daily CH4 emission from manure was estimated according to IPCC [38], which considered daily volatile solid (VS) excreted (kg DM cow-1) in manure. The daily VS was estimated as proposed by Eug\u00e8ne et al. [44] as: VS = NDOMI + (UE \u00d7 GE) \u00d7 (OM/18.45), where: VS = volatile solid excretion on an organic matter (OM) basis (kg day-1), NDOMI = non-digestible OM intake (kg day-1): (1- OM digestibility) \u00d7 OM intake, UE = urinary energy excretion as a fraction of GE (0.04), GE = gross energy intake (MJ day-1), OM = organic matter (g), 18.45 = conversion factor for dietary GE per kg of DM (MJ kg-1).",
-      "text": "The CH4 emission from manure (kg (kg ECM)-1) was a function of daily CH4 emission from manure (kg cow-1) and daily ECM (kg cow-1). The daily CH4 emission from manure was estimated according to IPCC [38], which considered daily volatile solid (VS) excreted (kg DM cow-1) in manure. The daily VS was estimated as proposed by Eug\u00e8ne et al. [44] as: VS = NDOMI + (UE \u00d7 GE) \u00d7 (OM/18.45), where: VS = volatile solid excretion on an organic matter (OM) basis (kg day-1), NDOMI = non-digestible OM intake (kg day-1): (1- OM digestibility) \u00d7 OM intake, UE = urinary energy excretion as a fraction of GE (0.04), GE = gross energy intake (MJ day-1), OM = organic matter (g), 18.45 = conversion factor for dietary GE per kg of DM (MJ kg-1)."
-    },
-    {
-      "self_ref": "#/texts/32",
-      "parent": {
-        "$ref": "#/texts/30"
-      },
-      "children": [],
-      "label": "text",
-      "prov": [],
-      "orig": "The OM digestibility was estimated as a function of chemical composition, using equations published by INRA [21], which takes into account the effects of digestive interactions due to feeding level, the proportion of concentrate and rumen protein balance on OM digestibility. For scenarios where cows had access to grazing, the amount of calculated VS were corrected as a function of the time at pasture. The biodegradability of manure factor (0.13 for dairy cows in Latin America) and methane conversion factor (MCF) values were taken from IPCC [38]. The MCF values for pit storage below animal confinements (> 1 month) were used for the calculation, taking into account the annual average temperature (16.6\u00baC) or the average temperatures during the growth period of temperate (14.4\u00baC) or tropical (21\u00baC) annual pastures, which were 31%, 26% and 46%, respectively.",
-      "text": "The OM digestibility was estimated as a function of chemical composition, using equations published by INRA [21], which takes into account the effects of digestive interactions due to feeding level, the proportion of concentrate and rumen protein balance on OM digestibility. For scenarios where cows had access to grazing, the amount of calculated VS were corrected as a function of the time at pasture. The biodegradability of manure factor (0.13 for dairy cows in Latin America) and methane conversion factor (MCF) values were taken from IPCC [38]. The MCF values for pit storage below animal confinements (> 1 month) were used for the calculation, taking into account the annual average temperature (16.6\u00baC) or the average temperatures during the growth period of temperate (14.4\u00baC) or tropical (21\u00baC) annual pastures, which were 31%, 26% and 46%, respectively."
-    },
-    {
-      "self_ref": "#/texts/33",
-      "parent": {
-        "$ref": "#/texts/30"
-      },
-      "children": [],
-      "label": "text",
-      "prov": [],
-      "orig": "The N2O-N emissions from urine and feces were estimated considering the proportion of N excreted as manure and storage or as urine and dung deposited by grazing animals. These proportions were calculated based on the proportion of daily time that animals stayed on pasture (7 h/24 h = 0.29) or confinement (1\u22120.29 = 0.71). For lactating heifers and cows, the total amount of N excreted was calculated by the difference between N intake and milk N excretion. For heifers and non-lactating cows, urinary and fecal N excretion were estimated as proposed by Reed et al. [45] (Table 3: equations 10 and 12, respectively). The N2O emissions from stored manure as well as urine and dung during grazing were calculated based on the conversion of N2O-N emissions to N2O emissions, where N2O emissions = N2O-N emissions \u00d7 44/28. The emission factors were 0.002 kg N2O-N (kg N)-1 stored in a pit below animal confinements, and 0.02 kg N2O-N (kg of urine and dung)-1 deposited on pasture [38]. The indirect N2O emissions from storage manure and urine and dung deposits on pasture were also estimated using the IPCC [38] emission factors.",
-      "text": "The N2O-N emissions from urine and feces were estimated considering the proportion of N excreted as manure and storage or as urine and dung deposited by grazing animals. These proportions were calculated based on the proportion of daily time that animals stayed on pasture (7 h/24 h = 0.29) or confinement (1\u22120.29 = 0.71). For lactating heifers and cows, the total amount of N excreted was calculated by the difference between N intake and milk N excretion. For heifers and non-lactating cows, urinary and fecal N excretion were estimated as proposed by Reed et al. [45] (Table 3: equations 10 and 12, respectively). The N2O emissions from stored manure as well as urine and dung during grazing were calculated based on the conversion of N2O-N emissions to N2O emissions, where N2O emissions = N2O-N emissions \u00d7 44/28. The emission factors were 0.002 kg N2O-N (kg N)-1 stored in a pit below animal confinements, and 0.02 kg N2O-N (kg of urine and dung)-1 deposited on pasture [38]. The indirect N2O emissions from storage manure and urine and dung deposits on pasture were also estimated using the IPCC [38] emission factors."
-    },
-    {
-      "self_ref": "#/texts/34",
-      "parent": {
-        "$ref": "#/texts/10"
-      },
-      "children": [
-        {
-          "$ref": "#/texts/35"
-        },
-        {
-          "$ref": "#/texts/36"
-        },
-        {
-          "$ref": "#/texts/37"
-        },
-        {
-          "$ref": "#/texts/38"
-        },
-        {
-          "$ref": "#/texts/57"
-        },
-        {
-          "$ref": "#/texts/58"
-        }
-      ],
-      "label": "section_header",
-      "prov": [],
-      "orig": "Farm management",
-      "text": "Farm management",
-      "level": 1
-    },
-    {
-      "self_ref": "#/texts/35",
-      "parent": {
-        "$ref": "#/texts/34"
-      },
-      "children": [],
-      "label": "text",
-      "prov": [],
-      "orig": "Emissions due to farm management included those from fuel and machinery for manure handling and electricity for milking and confinement (Table 5). Emissions due to feed processing such as cutting, crushing, mixing and distributing, as well as secondary sources of emissions during the production of fuel, machinery, fertilizer, pesticides, seeds and plastic for ensilage were included in \u2018Emissions from crop and pasture production\u2019 section.",
-      "text": "Emissions due to farm management included those from fuel and machinery for manure handling and electricity for milking and confinement (Table 5). Emissions due to feed processing such as cutting, crushing, mixing and distributing, as well as secondary sources of emissions during the production of fuel, machinery, fertilizer, pesticides, seeds and plastic for ensilage were included in \u2018Emissions from crop and pasture production\u2019 section."
-    },
-    {
-      "self_ref": "#/texts/36",
-      "parent": {
-        "$ref": "#/texts/34"
-      },
-      "children": [],
-      "label": "text",
-      "prov": [],
-      "orig": "The amount of fuel use for manure handling were estimated taking into consideration the amount of manure produced per cow and the amounts of fuel required for manure handling (L diesel t-1) [42]. The amount of manure was estimated from OM excretions (kg cow-1), assuming that the manure has 8% ash on DM basis and 60% DM content. The OM excretions were calculated by NDOMI \u00d7 days in confinement \u00d7 proportion of daily time that animals stayed on confinement.",
-      "text": "The amount of fuel use for manure handling were estimated taking into consideration the amount of manure produced per cow and the amounts of fuel required for manure handling (L diesel t-1) [42]. The amount of manure was estimated from OM excretions (kg cow-1), assuming that the manure has 8% ash on DM basis and 60% DM content. The OM excretions were calculated by NDOMI \u00d7 days in confinement \u00d7 proportion of daily time that animals stayed on confinement."
-    },
-    {
-      "self_ref": "#/texts/37",
-      "parent": {
-        "$ref": "#/texts/34"
-      },
-      "children": [],
-      "label": "text",
-      "prov": [],
-      "orig": "The emissions from fuel were estimated considering the primary (emissions from fuel burned) and secondary (emissions for producing and transporting fuel) emissions. The primary emissions were calculated by the amount of fuel required for manure handling (L) \u00d7 (kg CO2e L-1) [41]. The secondary emissions from fuel were calculated by the amount of fuel required for manure handling \u00d7 emissions for production and transport of fuel (kg CO2e L-1) [41]. Emissions from manufacture and repair of machinery for manure handling were estimated by manure produced per cow (t) \u00d7 (kg machinery mass (kg manure)-1 \u00d7 10\u22123) [42] \u00d7 kg CO2e (kg machinery mass)-1 [42].",
-      "text": "The emissions from fuel were estimated considering the primary (emissions from fuel burned) and secondary (emissions for producing and transporting fuel) emissions. The primary emissions were calculated by the amount of fuel required for manure handling (L) \u00d7 (kg CO2e L-1) [41]. The secondary emissions from fuel were calculated by the amount of fuel required for manure handling \u00d7 emissions for production and transport of fuel (kg CO2e L-1) [41]. Emissions from manufacture and repair of machinery for manure handling were estimated by manure produced per cow (t) \u00d7 (kg machinery mass (kg manure)-1 \u00d7 10\u22123) [42] \u00d7 kg CO2e (kg machinery mass)-1 [42]."
-    },
-    {
-      "self_ref": "#/texts/38",
-      "parent": {
-        "$ref": "#/texts/34"
-      },
-      "children": [],
-      "label": "text",
-      "prov": [],
-      "orig": "Emissions from electricity for milking and confinement were estimated using two emission factors (kg CO2 kWh-1). The first one is based on United States electricity matrix [41], and was used as a reference of an electricity matrix with less hydroelectric power than the region under study. The second is based on the Brazilian electricity matrix [46]. The electricity required for milking activities is 0.06 kWh (kg milk produced)-1 [47]. The annual electricity use for lighting was 75 kWh cow-1, which is the value considered for lactating cows in naturally ventilated barns [47].",
-      "text": "Emissions from electricity for milking and confinement were estimated using two emission factors (kg CO2 kWh-1). The first one is based on United States electricity matrix [41], and was used as a reference of an electricity matrix with less hydroelectric power than the region under study. The second is based on the Brazilian electricity matrix [46]. The electricity required for milking activities is 0.06 kWh (kg milk produced)-1 [47]. The annual electricity use for lighting was 75 kWh cow-1, which is the value considered for lactating cows in naturally ventilated barns [47]."
-    },
-    {
-      "self_ref": "#/texts/39",
-      "parent": {
-        "$ref": "#/texts/10"
-      },
-      "children": [
-        {
-          "$ref": "#/texts/40"
-        }
-      ],
-      "label": "section_header",
-      "prov": [],
-      "orig": "Co-product allocation",
-      "text": "Co-product allocation",
-      "level": 1
-    },
-    {
-      "self_ref": "#/texts/40",
-      "parent": {
-        "$ref": "#/texts/39"
-      },
-      "children": [],
-      "label": "text",
-      "prov": [],
-      "orig": "The C footprint for milk produced in the system was calculated using a biophysical allocation approach, as recommended by the International Dairy Federation [49], and described by Thoma et al. [48]. Briefly, ARmilk = 1\u20136.04 \u00d7 BMR, where: ARmilk is the allocation ratio for milk and BMR is cow BW at the time of slaughter (kg) + calf BW sold (kg) divided by the total ECM produced during cow`s entire life (kg). The ARmilk were 0.854 and 0.849 for TMR and TMR with both pasture scenarios, respectively. The ARmilk was applied to the whole emissions, except for the electricity consumed for milking (milking parlor) and refrigerant loss, which was directly assigned to milk production.",
-      "text": "The C footprint for milk produced in the system was calculated using a biophysical allocation approach, as recommended by the International Dairy Federation [49], and described by Thoma et al. [48]. Briefly, ARmilk = 1\u20136.04 \u00d7 BMR, where: ARmilk is the allocation ratio for milk and BMR is cow BW at the time of slaughter (kg) + calf BW sold (kg) divided by the total ECM produced during cow`s entire life (kg). The ARmilk were 0.854 and 0.849 for TMR and TMR with both pasture scenarios, respectively. The ARmilk was applied to the whole emissions, except for the electricity consumed for milking (milking parlor) and refrigerant loss, which was directly assigned to milk production."
-    },
-    {
-      "self_ref": "#/texts/41",
-      "parent": {
-        "$ref": "#/texts/10"
-      },
-      "children": [
-        {
-          "$ref": "#/texts/42"
-        }
-      ],
-      "label": "section_header",
-      "prov": [],
-      "orig": "Sensitivity analysis",
-      "text": "Sensitivity analysis",
-      "level": 1
-    },
-    {
-      "self_ref": "#/texts/42",
-      "parent": {
-        "$ref": "#/texts/41"
-      },
-      "children": [],
-      "label": "text",
-      "prov": [],
-      "orig": "A sensitivity index was calculated as described by Rotz et al. [42]. The sensitivity index was defined for each emission source as the percentage change in the C footprint for a 10% change in the given emission source divided by 10%. Thus, a value near 0 indicates a low sensitivity, whereas an index near or greater than 1 indicates a high sensitivity because a change in this value causes a similar change in the footprint.",
-      "text": "A sensitivity index was calculated as described by Rotz et al. [42]. The sensitivity index was defined for each emission source as the percentage change in the C footprint for a 10% change in the given emission source divided by 10%. Thus, a value near 0 indicates a low sensitivity, whereas an index near or greater than 1 indicates a high sensitivity because a change in this value causes a similar change in the footprint."
-    },
-    {
-      "self_ref": "#/texts/43",
-      "parent": {
-        "$ref": "#/texts/0"
-      },
-      "children": [
-        {
-          "$ref": "#/texts/44"
-        },
-        {
-          "$ref": "#/texts/45"
-        },
-        {
-          "$ref": "#/texts/50"
-        },
-        {
-          "$ref": "#/texts/53"
-        },
-        {
-          "$ref": "#/texts/59"
-        },
-        {
-          "$ref": "#/texts/61"
-        }
-      ],
-      "label": "section_header",
-      "prov": [],
-      "orig": "Results and discussion",
-      "text": "Results and discussion",
-      "level": 1
-    },
-    {
-      "self_ref": "#/texts/44",
-      "parent": {
-        "$ref": "#/texts/43"
-      },
-      "children": [],
-      "label": "text",
-      "prov": [],
-      "orig": "The study has assessed the impact of tropical and temperate pastures in dairy cows fed TMR on the C footprint of dairy production in subtropics. Different factors were taken in to consideration to estimate emissions from manure (or urine and dung) of grazing animals, feed production and electricity use.",
-      "text": "The study has assessed the impact of tropical and temperate pastures in dairy cows fed TMR on the C footprint of dairy production in subtropics. Different factors were taken in to consideration to estimate emissions from manure (or urine and dung) of grazing animals, feed production and electricity use."
-    },
-    {
-      "self_ref": "#/texts/45",
-      "parent": {
-        "$ref": "#/texts/43"
-      },
-      "children": [
-        {
-          "$ref": "#/texts/46"
-        },
-        {
-          "$ref": "#/texts/47"
-        },
-        {
-          "$ref": "#/texts/48"
-        },
-        {
-          "$ref": "#/texts/49"
-        }
-      ],
-      "label": "section_header",
-      "prov": [],
-      "orig": "Greenhouse gas emissions",
-      "text": "Greenhouse gas emissions",
-      "level": 1
-    },
-    {
-      "self_ref": "#/texts/46",
-      "parent": {
-        "$ref": "#/texts/45"
-      },
-      "children": [],
-      "label": "text",
-      "prov": [],
-      "orig": "Depending on emission factors used for calculating emissions from urine and dung (IPCC or local data) and feed production (Tables 3 or 4), the C footprint was similar (Fig 2A and 2B) or decreased by 0.04 kg CO2e (kg ECM)-1 (Fig 2C and 2D) in scenarios that included pastures compared to ad libitum TMR intake. Due to differences in emission factors, the overall GHG emission values ranged from 0.92 to 1.04 kg CO2e (kg ECM)-1 for dairy cows receiving TMR exclusively, and from 0.88 to 1.04 kg CO2e (kg ECM)-1 for cows with access to pasture. Using IPCC emission factors [38], manure emissions increased as TMR intake went down (Fig 2A and 2B). However, using local emission factors for estimating N2O-N emissions [37], manure emissions decreased as TMR intake went down (Fig 2C and 2D). Regardless of emission factors used (Tables 3 or 4), emissions from feed production decreased to a small extent as the proportion of TMR intake decreased. Emissions from farm management did not contribute more than 5% of overall GHG emissions.",
-      "text": "Depending on emission factors used for calculating emissions from urine and dung (IPCC or local data) and feed production (Tables 3 or 4), the C footprint was similar (Fig 2A and 2B) or decreased by 0.04 kg CO2e (kg ECM)-1 (Fig 2C and 2D) in scenarios that included pastures compared to ad libitum TMR intake. Due to differences in emission factors, the overall GHG emission values ranged from 0.92 to 1.04 kg CO2e (kg ECM)-1 for dairy cows receiving TMR exclusively, and from 0.88 to 1.04 kg CO2e (kg ECM)-1 for cows with access to pasture. Using IPCC emission factors [38], manure emissions increased as TMR intake went down (Fig 2A and 2B). However, using local emission factors for estimating N2O-N emissions [37], manure emissions decreased as TMR intake went down (Fig 2C and 2D). Regardless of emission factors used (Tables 3 or 4), emissions from feed production decreased to a small extent as the proportion of TMR intake decreased. Emissions from farm management did not contribute more than 5% of overall GHG emissions."
-    },
-    {
-      "self_ref": "#/texts/47",
-      "parent": {
-        "$ref": "#/texts/45"
-      },
-      "children": [],
-      "label": "text",
-      "prov": [],
-      "orig": "Considering IPCC emission factors for N2O emissions from urine and dung [38] and those from Table 3, the C footprint ranged from 0.99 to 1.04 kg CO2e (kg ECM)-1, and was close to those reported under confined based systems in California [49], Canada [50], China [8], Ireland [9], different scenarios in Australia [51,52] and Uruguay [11], which ranged from 0.98 to 1.16 kg CO2e (kg ECM)-1. When local emission factors for N2O emissions from urine and dung [37] and those from Table 4 were taking into account, the C footprint for scenarios including pasture, without accounting for sequestered CO2-C from perennial pasture\u20140.91 kg CO2e (kg ECM)-1\u2014was lower than the range of values described above. However, these values were still greater than high-performance confinement systems in UK and USA [53] or grass based dairy systems in Ireland [9,53] and New Zealand [8,54], which ranged from 0.52 to 0.89 kg CO2e (kg ECM)-1. Regardless of which emission factor was used, we found a lower C footprint in all conditions compared to scenarios with lower milk production per cow or in poor conditions of manure management, which ranged from 1.4 to 2.3 kg CO2e (kg ECM)-1 [8,55]. Thus, even though differences between studies may be partially explained by various assumptions (e.g., emission factors, co-product allocation, methane emissions estimation, sequestered CO2-C, etc.), herd productivity and manure management were systematically associated with the C footprint of the dairy systems.",
-      "text": "Considering IPCC emission factors for N2O emissions from urine and dung [38] and those from Table 3, the C footprint ranged from 0.99 to 1.04 kg CO2e (kg ECM)-1, and was close to those reported under confined based systems in California [49], Canada [50], China [8], Ireland [9], different scenarios in Australia [51,52] and Uruguay [11], which ranged from 0.98 to 1.16 kg CO2e (kg ECM)-1. When local emission factors for N2O emissions from urine and dung [37] and those from Table 4 were taking into account, the C footprint for scenarios including pasture, without accounting for sequestered CO2-C from perennial pasture\u20140.91 kg CO2e (kg ECM)-1\u2014was lower than the range of values described above. However, these values were still greater than high-performance confinement systems in UK and USA [53] or grass based dairy systems in Ireland [9,53] and New Zealand [8,54], which ranged from 0.52 to 0.89 kg CO2e (kg ECM)-1. Regardless of which emission factor was used, we found a lower C footprint in all conditions compared to scenarios with lower milk production per cow or in poor conditions of manure management, which ranged from 1.4 to 2.3 kg CO2e (kg ECM)-1 [8,55]. Thus, even though differences between studies may be partially explained by various assumptions (e.g., emission factors, co-product allocation, methane emissions estimation, sequestered CO2-C, etc.), herd productivity and manure management were systematically associated with the C footprint of the dairy systems."
-    },
-    {
-      "self_ref": "#/texts/48",
-      "parent": {
-        "$ref": "#/texts/45"
-      },
-      "children": [],
-      "label": "text",
-      "prov": [],
-      "orig": "The similarity of C footprint between different scenarios using IPCC [38] for estimating emissions from manure and for emissions from feed production (Table 3) was a consequence of the trade-off between greater manure emissions and lower emissions to produce feed, as the proportion of pasture in diets increased. Additionally, the small negative effect of pasture on ECM production also contributed to the trade-off. The impact of milk production on the C footprint was reported in a meta-analysis comprising 30 studies from 15 different countries [22]. As observed in this study (Fig 2A and 2B) the authors reported no significant difference between the C footprint of pasture-based vs. confinement systems. However, they observed that an increase of 1000 kg cow-1 (5000 to 6000 kg ECM) reduced the C footprint by 0.12 kg CO2e (kg ECM)-1, which may explain an apparent discrepancy between our study and an LCA performed in south Brazilian conditions [56]. Their study compared a confinement and a grazing-based dairy system with annual average milk production of 7667 and 5535 kg cow, respectively. In this study, the same herd was used in all systems, with an annual average milk production of around 7000 kg cow-1. Experimental data showed a reduction not greater than 3% of ECM when 50% of TMR was replaced by pasture access.",
-      "text": "The similarity of C footprint between different scenarios using IPCC [38] for estimating emissions from manure and for emissions from feed production (Table 3) was a consequence of the trade-off between greater manure emissions and lower emissions to produce feed, as the proportion of pasture in diets increased. Additionally, the small negative effect of pasture on ECM production also contributed to the trade-off. The impact of milk production on the C footprint was reported in a meta-analysis comprising 30 studies from 15 different countries [22]. As observed in this study (Fig 2A and 2B) the authors reported no significant difference between the C footprint of pasture-based vs. confinement systems. However, they observed that an increase of 1000 kg cow-1 (5000 to 6000 kg ECM) reduced the C footprint by 0.12 kg CO2e (kg ECM)-1, which may explain an apparent discrepancy between our study and an LCA performed in south Brazilian conditions [56]. Their study compared a confinement and a grazing-based dairy system with annual average milk production of 7667 and 5535 kg cow, respectively. In this study, the same herd was used in all systems, with an annual average milk production of around 7000 kg cow-1. Experimental data showed a reduction not greater than 3% of ECM when 50% of TMR was replaced by pasture access."
-    },
-    {
-      "self_ref": "#/texts/49",
-      "parent": {
-        "$ref": "#/texts/45"
-      },
-      "children": [],
-      "label": "text",
-      "prov": [],
-      "orig": "The lower C footprint in scenarios with access to pasture, when local emission factors [37] were used for N2O emissions from urine and dung and for feed production (Table 4), may also be partially attributed to the small negative effect of pasture on ECM production. Nevertheless, local emission factors for urine and dung had a great impact on scenarios including pastures compared to ad libitum TMR intake. Whereas the IPCC [38] considers an emission of 0.02 kg N2O-N (kg N)-1 for urine and dung from grazing animals, experimental evidence shows that it may be up to five times lower, averaging 0.004 kg N2O-N kg-1 [37].",
-      "text": "The lower C footprint in scenarios with access to pasture, when local emission factors [37] were used for N2O emissions from urine and dung and for feed production (Table 4), may also be partially attributed to the small negative effect of pasture on ECM production. Nevertheless, local emission factors for urine and dung had a great impact on scenarios including pastures compared to ad libitum TMR intake. Whereas the IPCC [38] considers an emission of 0.02 kg N2O-N (kg N)-1 for urine and dung from grazing animals, experimental evidence shows that it may be up to five times lower, averaging 0.004 kg N2O-N kg-1 [37]."
-    },
-    {
-      "self_ref": "#/texts/50",
-      "parent": {
-        "$ref": "#/texts/43"
-      },
-      "children": [
-        {
-          "$ref": "#/texts/51"
-        },
-        {
-          "$ref": "#/texts/52"
-        }
-      ],
-      "label": "section_header",
-      "prov": [],
-      "orig": "Methane emissions",
-      "text": "Methane emissions",
-      "level": 1
-    },
-    {
-      "self_ref": "#/texts/51",
-      "parent": {
-        "$ref": "#/texts/50"
-      },
-      "children": [],
-      "label": "text",
-      "prov": [],
-      "orig": "The enteric CH4 intensity was similar between different scenarios (Fig 2), showing the greatest sensitivity index, with values ranging from 0.53 to 0.62, which indicate that for a 10% change in this source, the C footprint may change between 5.3 and 6.2% (Fig 3). The large effect of enteric CH4 emissions on the whole C footprint was expected, because the impact of enteric CH4 on GHG emissions of milk production in different dairy systems has been estimated to range from 44 to 60% of the total CO2e [50,52,57,58]. However, emissions in feed production may be the most important source of GHG when emission factors for producing concentrate feeds are greater than 0.7 kg CO2e kg-1 [59], which did not happen in this study.",
-      "text": "The enteric CH4 intensity was similar between different scenarios (Fig 2), showing the greatest sensitivity index, with values ranging from 0.53 to 0.62, which indicate that for a 10% change in this source, the C footprint may change between 5.3 and 6.2% (Fig 3). The large effect of enteric CH4 emissions on the whole C footprint was expected, because the impact of enteric CH4 on GHG emissions of milk production in different dairy systems has been estimated to range from 44 to 60% of the total CO2e [50,52,57,58]. However, emissions in feed production may be the most important source of GHG when emission factors for producing concentrate feeds are greater than 0.7 kg CO2e kg-1 [59], which did not happen in this study."
-    },
-    {
-      "self_ref": "#/texts/52",
-      "parent": {
-        "$ref": "#/texts/50"
-      },
-      "children": [],
-      "label": "text",
-      "prov": [],
-      "orig": "The lack of difference in enteric CH4 emissions in different systems can be explained by the narrow range of NDF content in diets (<4% difference). This non-difference is due to the lower NDF content of annual temperate pastures (495 g (kg DM)-1) compared to corn silage (550 g (kg DM)-1). Hence, an expected, increase NDF content with decreased concentrate was partially offset by an increase in the pasture proportion relatively low in NDF. This is in agreement with studies conducted in southern Brazil, which have shown that the actual enteric CH4 emissions may decrease with inclusion of temperate pastures in cows receiving corn silage and soybean meal [60] or increase enteric CH4 emissions when dairy cows grazing a temperate pasture was supplemented with corn silage [61]. Additionally, enteric CH4 emissions did not differ between dairy cows receiving TMR exclusively or grazing a tropical pasture in the same scenarios as in this study [26].",
-      "text": "The lack of difference in enteric CH4 emissions in different systems can be explained by the narrow range of NDF content in diets (<4% difference). This non-difference is due to the lower NDF content of annual temperate pastures (495 g (kg DM)-1) compared to corn silage (550 g (kg DM)-1). Hence, an expected, increase NDF content with decreased concentrate was partially offset by an increase in the pasture proportion relatively low in NDF. This is in agreement with studies conducted in southern Brazil, which have shown that the actual enteric CH4 emissions may decrease with inclusion of temperate pastures in cows receiving corn silage and soybean meal [60] or increase enteric CH4 emissions when dairy cows grazing a temperate pasture was supplemented with corn silage [61]. Additionally, enteric CH4 emissions did not differ between dairy cows receiving TMR exclusively or grazing a tropical pasture in the same scenarios as in this study [26]."
-    },
-    {
-      "self_ref": "#/texts/53",
-      "parent": {
-        "$ref": "#/texts/43"
-      },
-      "children": [
-        {
-          "$ref": "#/texts/54"
-        },
-        {
-          "$ref": "#/texts/55"
-        },
-        {
-          "$ref": "#/texts/56"
-        }
-      ],
-      "label": "section_header",
-      "prov": [],
-      "orig": "Emissions from excreta and feed production",
-      "text": "Emissions from excreta and feed production",
-      "level": 1
-    },
-    {
-      "self_ref": "#/texts/54",
-      "parent": {
-        "$ref": "#/texts/53"
-      },
-      "children": [],
-      "label": "text",
-      "prov": [],
-      "orig": "Using IPCC emission factors for N2O emissions from urine and dung [38] and those from Table 3, CH4 emissions from manure decreased 0.07 kg CO2e (kg ECM)-1, but N2O emissions from manure increased 0.09 kg CO2e (kg ECM)-1, as TMR intake was restricted to 50% ad libitum (Fig 4A). Emissions for pastures increased by 0.06 kg CO2e (kg ECM)-1, whereas emissions for producing concentrate feeds and corn silage decreased by 0.09 kg CO2e (kg ECM)-1, as TMR intake decreased (Fig 4B). In this situation, the lack of difference in calculated C footprints of different systems was also due to the greater emissions from manure, and offset by lower emissions from feed production with inclusion of pasture in lactating dairy cow diets. The greater N2O-N emissions from manure with pasture was a consequence of higher N2O-N emissions due to greater CP content and N urine excretion, as pasture intake increased. The effect of CP content on urine N excretion has been shown by several authors in lactating dairy cows [62\u201364]. For instance, by decreasing CP content from 185 to 152 g (kg DM)-1, N intake decreased by 20% and urine N excretion by 60% [62]. In this study, the CP content for lactating dairy cows ranged from 150 g (kg DM)-1 on TMR system to 198 g (kg DM)-1 on 50% TMR with pasture. Additionally, greater urine N excretion is expected with greater use of pasture. This occurs because protein utilization in pastures is inefficient, as the protein in fresh forages is highly degradable in the rumen and may not be captured by microbes [65].",
-      "text": "Using IPCC emission factors for N2O emissions from urine and dung [38] and those from Table 3, CH4 emissions from manure decreased 0.07 kg CO2e (kg ECM)-1, but N2O emissions from manure increased 0.09 kg CO2e (kg ECM)-1, as TMR intake was restricted to 50% ad libitum (Fig 4A). Emissions for pastures increased by 0.06 kg CO2e (kg ECM)-1, whereas emissions for producing concentrate feeds and corn silage decreased by 0.09 kg CO2e (kg ECM)-1, as TMR intake decreased (Fig 4B). In this situation, the lack of difference in calculated C footprints of different systems was also due to the greater emissions from manure, and offset by lower emissions from feed production with inclusion of pasture in lactating dairy cow diets. The greater N2O-N emissions from manure with pasture was a consequence of higher N2O-N emissions due to greater CP content and N urine excretion, as pasture intake increased. The effect of CP content on urine N excretion has been shown by several authors in lactating dairy cows [62\u201364]. For instance, by decreasing CP content from 185 to 152 g (kg DM)-1, N intake decreased by 20% and urine N excretion by 60% [62]. In this study, the CP content for lactating dairy cows ranged from 150 g (kg DM)-1 on TMR system to 198 g (kg DM)-1 on 50% TMR with pasture. Additionally, greater urine N excretion is expected with greater use of pasture. This occurs because protein utilization in pastures is inefficient, as the protein in fresh forages is highly degradable in the rumen and may not be captured by microbes [65]."
-    },
-    {
-      "self_ref": "#/texts/55",
-      "parent": {
-        "$ref": "#/texts/53"
-      },
-      "children": [],
-      "label": "text",
-      "prov": [],
-      "orig": "Using local emission factors for N2O emissions from urine and dung [37] and those from Table 4, reductions in CH4 emissions from stocked manure, when pastures were included on diets, did not offset by increases in N2O emissions from excreta (Fig 4C). In this case, total emissions from manure (Fig 4C) and feed production (Fig 4D) decreased with the inclusion of pasture. The impact of greater CP content and N urine excretion with increased pasture intake was offset by the much lower emission factors used for N2O emissions from urine and dung. As suggested by other authors [66,67], these results show that IPCC default value may need to be revised for the subtropical region.",
-      "text": "Using local emission factors for N2O emissions from urine and dung [37] and those from Table 4, reductions in CH4 emissions from stocked manure, when pastures were included on diets, did not offset by increases in N2O emissions from excreta (Fig 4C). In this case, total emissions from manure (Fig 4C) and feed production (Fig 4D) decreased with the inclusion of pasture. The impact of greater CP content and N urine excretion with increased pasture intake was offset by the much lower emission factors used for N2O emissions from urine and dung. As suggested by other authors [66,67], these results show that IPCC default value may need to be revised for the subtropical region."
-    },
-    {
-      "self_ref": "#/texts/56",
-      "parent": {
-        "$ref": "#/texts/53"
-      },
-      "children": [],
-      "label": "text",
-      "prov": [],
-      "orig": "Emissions for feed production decreased when pasture was included due to the greater emission factor for corn grain production compared to pastures. Emissions from concentrate and silage had at least twice the sensitivity index compared to emissions from pastures. The amount of grain required per cow in a lifetime decreased from 7,300 kg to 4,000 kg when 50% of TMR was replaced by pasture access. These results are in agreement with other studies which found lower C footprint, as concentrate use is reduced and/or pasture is included [9,68,69]. Moreover, it has been demonstrated that in intensive dairy systems, after enteric fermentation, feed production is the second main contributor to C footprint [50]. There is potential to decrease the environmental impact of dairy systems by reducing the use of concentrate ingredients with high environmental impact, particularly in confinements [9].",
-      "text": "Emissions for feed production decreased when pasture was included due to the greater emission factor for corn grain production compared to pastures. Emissions from concentrate and silage had at least twice the sensitivity index compared to emissions from pastures. The amount of grain required per cow in a lifetime decreased from 7,300 kg to 4,000 kg when 50% of TMR was replaced by pasture access. These results are in agreement with other studies which found lower C footprint, as concentrate use is reduced and/or pasture is included [9,68,69]. Moreover, it has been demonstrated that in intensive dairy systems, after enteric fermentation, feed production is the second main contributor to C footprint [50]. There is potential to decrease the environmental impact of dairy systems by reducing the use of concentrate ingredients with high environmental impact, particularly in confinements [9]."
-    },
-    {
-      "self_ref": "#/texts/57",
-      "parent": {
-        "$ref": "#/texts/34"
-      },
-      "children": [],
-      "label": "text",
-      "prov": [],
-      "orig": "The lower impact of emissions from farm management is in agreement with other studies conducted in Europe [9, 62] and USA [42, 55], where the authors found that most emissions in dairy production systems are from enteric fermentation, feed production and emissions from excreta. As emissions from fuel for on-farm feed production were accounted into the \u2018emissions from crop and pasture production\u2019, total emissions from farm management were not greater than 5% of total C footprint.",
-      "text": "The lower impact of emissions from farm management is in agreement with other studies conducted in Europe [9, 62] and USA [42, 55], where the authors found that most emissions in dairy production systems are from enteric fermentation, feed production and emissions from excreta. As emissions from fuel for on-farm feed production were accounted into the \u2018emissions from crop and pasture production\u2019, total emissions from farm management were not greater than 5% of total C footprint."
-    },
-    {
-      "self_ref": "#/texts/58",
-      "parent": {
-        "$ref": "#/texts/34"
-      },
-      "children": [],
-      "label": "text",
-      "prov": [],
-      "orig": "Emissions from farm management dropped when the emission factor for electricity generation was based on the Brazilian matrix. In this case, the emission factor for electricity generation (0.205 kg CO2e kWh-1 [46]) is much lower than that in a LCA study conducted in US (0.73 kg CO2e kWh-1 [42]). This apparent discrepancy is explained because in 2016, almost 66% of the electricity generated in Brazil was from hydropower, which has an emission factor of 0.074 kg CO2e kWh-1 against 0.382 and 0.926 kg CO2e kWh-1 produced by natural gas and hard coal, respectively [46].",
-      "text": "Emissions from farm management dropped when the emission factor for electricity generation was based on the Brazilian matrix. In this case, the emission factor for electricity generation (0.205 kg CO2e kWh-1 [46]) is much lower than that in a LCA study conducted in US (0.73 kg CO2e kWh-1 [42]). This apparent discrepancy is explained because in 2016, almost 66% of the electricity generated in Brazil was from hydropower, which has an emission factor of 0.074 kg CO2e kWh-1 against 0.382 and 0.926 kg CO2e kWh-1 produced by natural gas and hard coal, respectively [46]."
-    },
-    {
-      "self_ref": "#/texts/59",
-      "parent": {
-        "$ref": "#/texts/43"
-      },
-      "children": [
-        {
-          "$ref": "#/texts/60"
-        }
-      ],
-      "label": "section_header",
-      "prov": [],
-      "orig": "Assumptions and limitations",
-      "text": "Assumptions and limitations",
-      "level": 1
-    },
-    {
-      "self_ref": "#/texts/60",
-      "parent": {
-        "$ref": "#/texts/59"
-      },
-      "children": [],
-      "label": "text",
-      "prov": [],
-      "orig": "The milk production and composition data are the average for a typical herd, which might have great animal-to-animal variability. Likewise, DM yield of crops and pastures were collected from experimental observations, and may change as a function of inter-annual variation, climatic conditions, soil type, fertilization level etc. The emission factors for direct and indirect N2O emissions from urine and dung were alternatively estimated using local data, but more experiments are necessary to reduce the uncertainty. The CO2 emitted from lime and urea application was estimated from IPCC default values, which may not represent emissions in subtropical conditions. This LCA may be improved by reducing the uncertainty of factors for estimating emissions from excreta and feed production, including the C sequestration or emissions as a function of soil management.",
-      "text": "The milk production and composition data are the average for a typical herd, which might have great animal-to-animal variability. Likewise, DM yield of crops and pastures were collected from experimental observations, and may change as a function of inter-annual variation, climatic conditions, soil type, fertilization level etc. The emission factors for direct and indirect N2O emissions from urine and dung were alternatively estimated using local data, but more experiments are necessary to reduce the uncertainty. The CO2 emitted from lime and urea application was estimated from IPCC default values, which may not represent emissions in subtropical conditions. This LCA may be improved by reducing the uncertainty of factors for estimating emissions from excreta and feed production, including the C sequestration or emissions as a function of soil management."
-    },
-    {
-      "self_ref": "#/texts/61",
-      "parent": {
-        "$ref": "#/texts/43"
-      },
-      "children": [
-        {
-          "$ref": "#/texts/62"
-        },
-        {
-          "$ref": "#/texts/63"
-        }
-      ],
-      "label": "section_header",
-      "prov": [],
-      "orig": "Further considerations",
-      "text": "Further considerations",
-      "level": 1
-    },
-    {
-      "self_ref": "#/texts/62",
-      "parent": {
-        "$ref": "#/texts/61"
-      },
-      "children": [],
-      "label": "text",
-      "prov": [],
-      "orig": "The potential for using pasture can reduce the C footprint because milk production kept pace with animal confinement. However, if milk production is to decrease with lower TMR intake and inclusion of pasture [19], the C footprint would be expected to increase. Lorenz et al. [22] showed that an increase in milk yield from 5,000 to 6,000 kg ECM reduced the C footprint by 0.12 kg CO2e (kg ECM)-1, whereas an increase from 10,000 to 11,000 kg ECM reduced the C footprint by only 0.06 kg CO2e (kg ECM)-1. Hence, the impact of increasing milk production on decreasing C footprint is not linear, and mitigation measures, such as breeding for increased genetic yield potential and increasing concentrate ratio in the diet, are potentially harmful for animal\u2019s health and welfare [70]. For instance, increasing concentrate ratio potentially increases the occurrence of subclinical ketosis and foot lesions, and C footprint may increase by 0.03 kg CO2e (kg ECM)-1 in subclinical ketosis [71] and by 0.02 kg CO2e (kg ECM)-1 in case of foot lesions [72].",
-      "text": "The potential for using pasture can reduce the C footprint because milk production kept pace with animal confinement. However, if milk production is to decrease with lower TMR intake and inclusion of pasture [19], the C footprint would be expected to increase. Lorenz et al. [22] showed that an increase in milk yield from 5,000 to 6,000 kg ECM reduced the C footprint by 0.12 kg CO2e (kg ECM)-1, whereas an increase from 10,000 to 11,000 kg ECM reduced the C footprint by only 0.06 kg CO2e (kg ECM)-1. Hence, the impact of increasing milk production on decreasing C footprint is not linear, and mitigation measures, such as breeding for increased genetic yield potential and increasing concentrate ratio in the diet, are potentially harmful for animal\u2019s health and welfare [70]. For instance, increasing concentrate ratio potentially increases the occurrence of subclinical ketosis and foot lesions, and C footprint may increase by 0.03 kg CO2e (kg ECM)-1 in subclinical ketosis [71] and by 0.02 kg CO2e (kg ECM)-1 in case of foot lesions [72]."
-    },
-    {
-      "self_ref": "#/texts/63",
-      "parent": {
-        "$ref": "#/texts/61"
-      },
-      "children": [],
-      "label": "text",
-      "prov": [],
-      "orig": "Grazing lands may also improve biodiversity [73]. Strategies such as zero tillage may increase stocks of soil C [74]. This study did not consider C sequestration during the growth of annual pastures, because it was assumed these grasses were planted with tillage, having a balance between C sequestration and C emissions [38]. Considering the C sequestration from no-tillage perennial pasture, the amount of C sequestration will more than compensates for C emitted. These results are in agreement with other authors who have shown that a reduction or elimination of soil tillage increases annual soil C sequestration in subtropical areas by 0.5 to 1.5 t ha-1 [75]. If 50% of tilled areas were under perennial grasslands, 1.0 t C ha-1 would be sequestered, further reducing the C footprint by 0.015 and 0.025 kg CO2e (kg ECM)-1 for the scenarios using 75 and 50% TMR, respectively. Eliminating tillage, the reduction on total GHG emissions would be 0.03 and 0.05 kg CO2e (kg ECM)-1 for 75 and 50% TMR, respectively. However, this approach may be controversial because lands which have been consistently managed for decades have approached steady state C storage, so that net exchange of CO2 would be negligible [76].",
-      "text": "Grazing lands may also improve biodiversity [73]. Strategies such as zero tillage may increase stocks of soil C [74]. This study did not consider C sequestration during the growth of annual pastures, because it was assumed these grasses were planted with tillage, having a balance between C sequestration and C emissions [38]. Considering the C sequestration from no-tillage perennial pasture, the amount of C sequestration will more than compensates for C emitted. These results are in agreement with other authors who have shown that a reduction or elimination of soil tillage increases annual soil C sequestration in subtropical areas by 0.5 to 1.5 t ha-1 [75]. If 50% of tilled areas were under perennial grasslands, 1.0 t C ha-1 would be sequestered, further reducing the C footprint by 0.015 and 0.025 kg CO2e (kg ECM)-1 for the scenarios using 75 and 50% TMR, respectively. Eliminating tillage, the reduction on total GHG emissions would be 0.03 and 0.05 kg CO2e (kg ECM)-1 for 75 and 50% TMR, respectively. However, this approach may be controversial because lands which have been consistently managed for decades have approached steady state C storage, so that net exchange of CO2 would be negligible [76]."
-    },
-    {
-      "self_ref": "#/texts/64",
-      "parent": {
-        "$ref": "#/texts/0"
-      },
-      "children": [
-        {
-          "$ref": "#/texts/65"
-        }
-      ],
-      "label": "section_header",
-      "prov": [],
-      "orig": "Conclusions",
-      "text": "Conclusions",
-      "level": 1
-    },
-    {
-      "self_ref": "#/texts/65",
-      "parent": {
-        "$ref": "#/texts/64"
-      },
-      "children": [],
-      "label": "text",
-      "prov": [],
-      "orig": "This study assessed the C footprint of dairy cattle systems with or without access to pastures. Including pastures showed potential to maintain or decrease to a small extent the C footprint, which may be attributable to the evidence of low N2O emissions from urine and dung in dairy systems in subtropical areas. Even though the enteric CH4 intensity was the largest source of CO2e emissions, it did not change between different scenarios due to the narrow range of NDF content in diets and maintaining the same milk production with or without access to pastures.",
-      "text": "This study assessed the C footprint of dairy cattle systems with or without access to pastures. Including pastures showed potential to maintain or decrease to a small extent the C footprint, which may be attributable to the evidence of low N2O emissions from urine and dung in dairy systems in subtropical areas. Even though the enteric CH4 intensity was the largest source of CO2e emissions, it did not change between different scenarios due to the narrow range of NDF content in diets and maintaining the same milk production with or without access to pastures."
-    },
-    {
-      "self_ref": "#/texts/66",
-      "parent": {
-        "$ref": "#/texts/0"
-      },
-      "children": [
-        {
-          "$ref": "#/tables/0"
-        },
-        {
-          "$ref": "#/tables/1"
-        },
-        {
-          "$ref": "#/tables/2"
-        },
-        {
-          "$ref": "#/tables/3"
-        },
-        {
-          "$ref": "#/tables/4"
-        }
-      ],
-      "label": "section_header",
-      "prov": [],
-      "orig": "Tables",
-      "text": "Tables",
-      "level": 1
-    },
-    {
-      "self_ref": "#/texts/67",
-      "parent": {
-        "$ref": "#/body"
-      },
-      "children": [],
-      "label": "caption",
-      "prov": [],
-      "orig": "Table 1: Descriptive characteristics of the herd.",
-      "text": "Table 1: Descriptive characteristics of the herd."
-    },
-    {
-      "self_ref": "#/texts/68",
-      "parent": {
-        "$ref": "#/body"
-      },
-      "children": [],
-      "label": "caption",
-      "prov": [],
-      "orig": "Table 2: Dairy cows\u2019 diets in different scenariosa.",
-      "text": "Table 2: Dairy cows\u2019 diets in different scenariosa."
-    },
-    {
-      "self_ref": "#/texts/69",
-      "parent": {
-        "$ref": "#/body"
-      },
-      "children": [],
-      "label": "caption",
-      "prov": [],
-      "orig": "Table 3: GHG emission factors for Off- and On-farm feed production.",
-      "text": "Table 3: GHG emission factors for Off- and On-farm feed production."
-    },
-    {
-      "self_ref": "#/texts/70",
-      "parent": {
-        "$ref": "#/body"
-      },
-      "children": [],
-      "label": "caption",
-      "prov": [],
-      "orig": "Table 4: GHG emissions from On-farm feed production.",
-      "text": "Table 4: GHG emissions from On-farm feed production."
-    },
-    {
-      "self_ref": "#/texts/71",
-      "parent": {
-        "$ref": "#/body"
-      },
-      "children": [],
-      "label": "caption",
-      "prov": [],
-      "orig": "Table 5: Factors for major resource inputs in farm management.",
-      "text": "Table 5: Factors for major resource inputs in farm management."
-    },
-    {
-      "self_ref": "#/texts/72",
-      "parent": {
-        "$ref": "#/texts/0"
-      },
-      "children": [
-        {
-          "$ref": "#/pictures/0"
-        },
-        {
-          "$ref": "#/pictures/1"
-        },
-        {
-          "$ref": "#/pictures/2"
-        },
-        {
-          "$ref": "#/pictures/3"
-        }
-      ],
-      "label": "section_header",
-      "prov": [],
-      "orig": "Figures",
-      "text": "Figures",
-      "level": 1
-    },
-    {
-      "self_ref": "#/texts/73",
-      "parent": {
-        "$ref": "#/body"
-      },
-      "children": [],
-      "label": "caption",
-      "prov": [],
-      "orig": "Fig 1: Overview of the milk production system boundary considered in the study.",
-      "text": "Fig 1: Overview of the milk production system boundary considered in the study."
-    },
-    {
-      "self_ref": "#/texts/74",
-      "parent": {
-        "$ref": "#/body"
-      },
-      "children": [],
-      "label": "caption",
-      "prov": [],
-      "orig": "Fig 2: Overall greenhouse gas emissions in dairy cattle systems under various scenarios.\nTMR = ad libitum TMR intake, 75TMR = 75% of ad libitum TMR intake with access to pasture, 50TMR = 50% of ad libitum TMR intake with access to pasture. (a) N2O emission factors for urine and dung from IPCC [38], feed production emission factors from Table 3 without accounting for sequestered CO2-C from perennial pasture, production of electricity = 0.73 kg CO2e kWh-1 [41]. (b) N2O emission factors for urine and dung from IPCC [38], feed production emission factors from Table 3 without accounting for sequestered CO2-C from perennial pasture, production of electricity = 0.205 kg CO2e kWh-1 [46]; (c) N2O emission factors for urine and dung from local data [37], feed production EF from Table 4 without accounting for sequestered CO2-C from perennial pasture, production of electricity = 0.205 kg CO2e kWh-1 [46]. (d) N2O emission factors for urine and dung from local data [37], feed production emission factors from Table 4 accounting for sequestered CO2-C from perennial pasture, production of electricity = 0.205 kg CO2e kWh-1 [46].",
-      "text": "Fig 2: Overall greenhouse gas emissions in dairy cattle systems under various scenarios.\nTMR = ad libitum TMR intake, 75TMR = 75% of ad libitum TMR intake with access to pasture, 50TMR = 50% of ad libitum TMR intake with access to pasture. (a) N2O emission factors for urine and dung from IPCC [38], feed production emission factors from Table 3 without accounting for sequestered CO2-C from perennial pasture, production of electricity = 0.73 kg CO2e kWh-1 [41]. (b) N2O emission factors for urine and dung from IPCC [38], feed production emission factors from Table 3 without accounting for sequestered CO2-C from perennial pasture, production of electricity = 0.205 kg CO2e kWh-1 [46]; (c) N2O emission factors for urine and dung from local data [37], feed production EF from Table 4 without accounting for sequestered CO2-C from perennial pasture, production of electricity = 0.205 kg CO2e kWh-1 [46]. (d) N2O emission factors for urine and dung from local data [37], feed production emission factors from Table 4 accounting for sequestered CO2-C from perennial pasture, production of electricity = 0.205 kg CO2e kWh-1 [46]."
-    },
-    {
-      "self_ref": "#/texts/75",
-      "parent": {
-        "$ref": "#/body"
-      },
-      "children": [],
-      "label": "caption",
-      "prov": [],
-      "orig": "Fig 3: Sensitivity of the C footprint.\nSensitivity index = percentage change in C footprint for a 10% change in the given emission source divided by 10% of. (a) N2O emission factors for urine and dung from IPCC [38], feed production emission factors from Table 3, production of electricity = 0.73 kg CO2e kWh-1 [41]. (b) N2O emission factors for urine and dung from IPCC [38], feed production emission factors from Table 3, production of electricity = 0.205 kg CO2e kWh-1 [46]; (c) N2O emission factors for urine and dung from local data [37], feed production EF from Table 4 without accounting sequestered CO2-C from perennial pasture, production of electricity = 0.205 kg CO2e kWh-1 [46]. (d) N2O emission factors for urine and dung from local data [37], feed production emission factors from Table 4 accounting sequestered CO2-C from perennial pasture, production of electricity = 0.205 kg CO2e kWh-1 [46].",
-      "text": "Fig 3: Sensitivity of the C footprint.\nSensitivity index = percentage change in C footprint for a 10% change in the given emission source divided by 10% of. (a) N2O emission factors for urine and dung from IPCC [38], feed production emission factors from Table 3, production of electricity = 0.73 kg CO2e kWh-1 [41]. (b) N2O emission factors for urine and dung from IPCC [38], feed production emission factors from Table 3, production of electricity = 0.205 kg CO2e kWh-1 [46]; (c) N2O emission factors for urine and dung from local data [37], feed production EF from Table 4 without accounting sequestered CO2-C from perennial pasture, production of electricity = 0.205 kg CO2e kWh-1 [46]. (d) N2O emission factors for urine and dung from local data [37], feed production emission factors from Table 4 accounting sequestered CO2-C from perennial pasture, production of electricity = 0.205 kg CO2e kWh-1 [46]."
-    },
-    {
-      "self_ref": "#/texts/76",
-      "parent": {
-        "$ref": "#/body"
-      },
-      "children": [],
-      "label": "caption",
-      "prov": [],
-      "orig": "Fig 4: Greenhouse gas emissions (GHG) from manure and feed production in dairy cattle systems.\nTMR = ad libitum TMR intake, 75TMR = 75% of ad libitum TMR intake with access to pasture, 50TMR = 50% of ad libitum TMR intake with access to pasture. (a) N2O emission factors for urine and dung from IPCC [38]. (b) Feed production emission factors from Table 3. (c) N2O emission factors for urine and dung from local data [37]. (d) Feed production emission factors from Table 4 accounting sequestered CO2-C from perennial pasture.",
-      "text": "Fig 4: Greenhouse gas emissions (GHG) from manure and feed production in dairy cattle systems.\nTMR = ad libitum TMR intake, 75TMR = 75% of ad libitum TMR intake with access to pasture, 50TMR = 50% of ad libitum TMR intake with access to pasture. (a) N2O emission factors for urine and dung from IPCC [38]. (b) Feed production emission factors from Table 3. (c) N2O emission factors for urine and dung from local data [37]. (d) Feed production emission factors from Table 4 accounting sequestered CO2-C from perennial pasture."
-    },
-    {
-      "self_ref": "#/texts/77",
-      "parent": {
-        "$ref": "#/texts/0"
-      },
-      "children": [
-        {
-          "$ref": "#/groups/0"
-        }
-      ],
-      "label": "section_header",
-      "prov": [],
-      "orig": "References",
-      "text": "References",
-      "level": 1
-    },
-    {
-      "self_ref": "#/texts/78",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Climate Change and Land. Chapter 5: Food Security (2019)",
-      "text": "Climate Change and Land. Chapter 5: Food Security (2019)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/79",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Herrero M; Henderson B; Havl\u00edk P; Thornton PK; Conant RT; Smith P. Greenhouse gas mitigation potentials in the livestock sector. Nat Clim Chang (2016)",
-      "text": "Herrero M; Henderson B; Havl\u00edk P; Thornton PK; Conant RT; Smith P. Greenhouse gas mitigation potentials in the livestock sector. Nat Clim Chang (2016)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/80",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Rivera-Ferre MG; L\u00f3pez-i-Gelats F; Howden M; Smith P; Morton JF; Herrero M. Re-framing the climate change debate in the livestock sector: mitigation and adaptation options. Wiley Interdiscip Rev Clim Chang (2016)",
-      "text": "Rivera-Ferre MG; L\u00f3pez-i-Gelats F; Howden M; Smith P; Morton JF; Herrero M. Re-framing the climate change debate in the livestock sector: mitigation and adaptation options. Wiley Interdiscip Rev Clim Chang (2016)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/81",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "van Zanten HHE; Mollenhorst H; Klootwijk CW; van Middelaar CE; de Boer IJM. Global food supply: land use efficiency of livestock systems. Int J Life Cycle Assess (2016)",
-      "text": "van Zanten HHE; Mollenhorst H; Klootwijk CW; van Middelaar CE; de Boer IJM. Global food supply: land use efficiency of livestock systems. Int J Life Cycle Assess (2016)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/82",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Hristov AN; Oh J; Firkins L; Dijkstra J; Kebreab E; Waghorn G. SPECIAL TOPICS\u2014Mitigation of methane and nitrous oxide emissions from animal operations: I. A review of enteric methane mitigation options. J Anim Sci (2013)",
-      "text": "Hristov AN; Oh J; Firkins L; Dijkstra J; Kebreab E; Waghorn G. SPECIAL TOPICS\u2014Mitigation of methane and nitrous oxide emissions from animal operations: I. A review of enteric methane mitigation options. J Anim Sci (2013)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/83",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Hristov AN; Ott T; Tricarico J; Rotz A; Waghorn G; Adesogan A. SPECIAL TOPICS\u2014Mitigation of methane and nitrous oxide emissions from animal operations: III. A review of animal management mitigation options. J Anim Sci (2013)",
-      "text": "Hristov AN; Ott T; Tricarico J; Rotz A; Waghorn G; Adesogan A. SPECIAL TOPICS\u2014Mitigation of methane and nitrous oxide emissions from animal operations: III. A review of animal management mitigation options. J Anim Sci (2013)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/84",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Montes F; Meinen R; Dell C; Rotz A; Hristov AN; Oh J. SPECIAL TOPICS\u2014Mitigation of methane and nitrous oxide emissions from animal operations: II. A review of manure management mitigation options. J Anim Sci (2013)",
-      "text": "Montes F; Meinen R; Dell C; Rotz A; Hristov AN; Oh J. SPECIAL TOPICS\u2014Mitigation of methane and nitrous oxide emissions from animal operations: II. A review of manure management mitigation options. J Anim Sci (2013)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/85",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Ledgard SF; Wei S; Wang X; Falconer S; Zhang N; Zhang X. Nitrogen and carbon footprints of dairy farm systems in China and New Zealand, as influenced by productivity, feed sources and mitigations. Agric Water Manag (2019)",
-      "text": "Ledgard SF; Wei S; Wang X; Falconer S; Zhang N; Zhang X. Nitrogen and carbon footprints of dairy farm systems in China and New Zealand, as influenced by productivity, feed sources and mitigations. Agric Water Manag (2019)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/86",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "O\u2019Brien D; Shalloo L; Patton J; Buckley F; Grainger C; Wallace M. A life cycle assessment of seasonal grass-based and confinement dairy farms. Agric Syst (2012)",
-      "text": "O\u2019Brien D; Shalloo L; Patton J; Buckley F; Grainger C; Wallace M. A life cycle assessment of seasonal grass-based and confinement dairy farms. Agric Syst (2012)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/87",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Salou T; Le Mou\u00ebl C; van der Werf HMG. Environmental impacts of dairy system intensification: the functional unit matters!. J Clean Prod (2017)",
-      "text": "Salou T; Le Mou\u00ebl C; van der Werf HMG. Environmental impacts of dairy system intensification: the functional unit matters!. J Clean Prod (2017)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/88",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Lizarralde C; Picasso V; Rotz CA; Cadenazzi M; Astigarraga L. Practices to Reduce Milk Carbon Footprint on Grazing Dairy Farms in Southern Uruguay. Case Studies. Sustain Agric Res (2014)",
-      "text": "Lizarralde C; Picasso V; Rotz CA; Cadenazzi M; Astigarraga L. Practices to Reduce Milk Carbon Footprint on Grazing Dairy Farms in Southern Uruguay. Case Studies. Sustain Agric Res (2014)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/89",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Clark CEF; Kaur R; Millapan LO; Golder HM; Thomson PC; Horadagoda A. The effect of temperate or tropical pasture grazing state and grain-based concentrate allocation on dairy cattle production and behavior. J Dairy Sci (2018)",
-      "text": "Clark CEF; Kaur R; Millapan LO; Golder HM; Thomson PC; Horadagoda A. The effect of temperate or tropical pasture grazing state and grain-based concentrate allocation on dairy cattle production and behavior. J Dairy Sci (2018)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/90",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "FAOSTAT.  (2017)",
-      "text": "FAOSTAT.  (2017)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/91",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Vogeler I; Mackay A; Vibart R; Rendel J; Beautrais J; Dennis S. Effect of inter-annual variability in pasture growth and irrigation response on farm productivity and profitability based on biophysical and farm systems modelling. Sci Total Environ (2016)",
-      "text": "Vogeler I; Mackay A; Vibart R; Rendel J; Beautrais J; Dennis S. Effect of inter-annual variability in pasture growth and irrigation response on farm productivity and profitability based on biophysical and farm systems modelling. Sci Total Environ (2016)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/92",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Wilkinson JM; Lee MRF; Rivero MJ; Chamberlain AT. Some challenges and opportunities for grazing dairy cows on temperate pastures. Grass Forage Sci. (2020)",
-      "text": "Wilkinson JM; Lee MRF; Rivero MJ; Chamberlain AT. Some challenges and opportunities for grazing dairy cows on temperate pastures. Grass Forage Sci. (2020)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/93",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Wales WJ; Marett LC; Greenwood JS; Wright MM; Thornhill JB; Jacobs JL. Use of partial mixed rations in pasture-based dairying in temperate regions of Australia. Anim Prod Sci (2013)",
-      "text": "Wales WJ; Marett LC; Greenwood JS; Wright MM; Thornhill JB; Jacobs JL. Use of partial mixed rations in pasture-based dairying in temperate regions of Australia. Anim Prod Sci (2013)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/94",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Bargo F; Muller LD; Delahoy JE; Cassidy TW. Performance of high producing dairy cows with three different feeding systems combining pasture and total mixed rations. J Dairy Sci (2002)",
-      "text": "Bargo F; Muller LD; Delahoy JE; Cassidy TW. Performance of high producing dairy cows with three different feeding systems combining pasture and total mixed rations. J Dairy Sci (2002)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/95",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Vibart RE; Fellner V; Burns JC; Huntington GB; Green JT. Performance of lactating dairy cows fed varying levels of total mixed ration and pasture. J Dairy Res (2008)",
-      "text": "Vibart RE; Fellner V; Burns JC; Huntington GB; Green JT. Performance of lactating dairy cows fed varying levels of total mixed ration and pasture. J Dairy Res (2008)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/96",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Mendoza A; Cajarville C; Repetto JL. Short communication: Intake, milk production, and milk fatty acid profile of dairy cows fed diets combining fresh forage with a total mixed ration. J Dairy Sci (2016)",
-      "text": "Mendoza A; Cajarville C; Repetto JL. Short communication: Intake, milk production, and milk fatty acid profile of dairy cows fed diets combining fresh forage with a total mixed ration. J Dairy Sci (2016)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/97",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Nutrient Requirements of Dairy Cattle (2001)",
-      "text": "Nutrient Requirements of Dairy Cattle (2001)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/98",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Noiz\u00e8re P; Sauvant D; Delaby L.  (2018)",
-      "text": "Noiz\u00e8re P; Sauvant D; Delaby L.  (2018)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/99",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Lorenz H; Reinsch T; Hess S; Taube F. Is low-input dairy farming more climate friendly? A meta-analysis of the carbon footprints of different production systems. J Clean Prod (2019)",
-      "text": "Lorenz H; Reinsch T; Hess S; Taube F. Is low-input dairy farming more climate friendly? A meta-analysis of the carbon footprints of different production systems. J Clean Prod (2019)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/100",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "INTERNATIONAL STANDARD\u2014Environmental management\u2014Life cycle assessment\u2014Requirements and guidelines (2006)",
-      "text": "INTERNATIONAL STANDARD\u2014Environmental management\u2014Life cycle assessment\u2014Requirements and guidelines (2006)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/101",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Environmental management\u2014Life cycle assessment\u2014Principles and framework. Iso 14040 (2006)",
-      "text": "Environmental management\u2014Life cycle assessment\u2014Principles and framework. Iso 14040 (2006)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/102",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "FAO. Environmental Performance of Large Ruminant Supply Chains: Guidelines for assessment (2016)",
-      "text": "FAO. Environmental Performance of Large Ruminant Supply Chains: Guidelines for assessment (2016)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/103",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Civiero M; Ribeiro-Filho HMN; Schaitz LH. Pearl-millet grazing decreases daily methane emissions in dairy cows receiving total mixed ration. 7th Greenhouse Gas and Animal Agriculture Conference,. Foz do Igua\u00e7u (2019)",
-      "text": "Civiero M; Ribeiro-Filho HMN; Schaitz LH. Pearl-millet grazing decreases daily methane emissions in dairy cows receiving total mixed ration. 7th Greenhouse Gas and Animal Agriculture Conference,. Foz do Igua\u00e7u (2019)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/104",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "IPCC\u2014Intergovernmental Panel on Climate Change. Climate Change 2014 Synthesis Report (Unedited Version). 2014. Available: ttps://. ",
-      "text": "IPCC\u2014Intergovernmental Panel on Climate Change. Climate Change 2014 Synthesis Report (Unedited Version). 2014. Available: ttps://. ",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/105",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "INRA. Alimentation des bovins, ovins et caprins. Besoins des animaux\u2014valeurs des aliments. Tables Inra 2007. 4th ed. INRA, editor. 2007. ",
-      "text": "INRA. Alimentation des bovins, ovins et caprins. Besoins des animaux\u2014valeurs des aliments. Tables Inra 2007. 4th ed. INRA, editor. 2007. ",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/106",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Delagarde R; Faverdin P; Baratte C; Peyraud JL. GrazeIn: a model of herbage intake and milk production for grazing dairy cows. 2. Prediction of intake under rotational and continuously stocked grazing management. Grass Forage Sci (2011)",
-      "text": "Delagarde R; Faverdin P; Baratte C; Peyraud JL. GrazeIn: a model of herbage intake and milk production for grazing dairy cows. 2. Prediction of intake under rotational and continuously stocked grazing management. Grass Forage Sci (2011)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/107",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Ma BL; Liang BC; Biswas DK; Morrison MJ; McLaughlin NB. The carbon footprint of maize production as affected by nitrogen fertilizer and maize-legume rotations. Nutr Cycl Agroecosystems (2012)",
-      "text": "Ma BL; Liang BC; Biswas DK; Morrison MJ; McLaughlin NB. The carbon footprint of maize production as affected by nitrogen fertilizer and maize-legume rotations. Nutr Cycl Agroecosystems (2012)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/108",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Rauccci GS; Moreira CS; Alves PS; Mello FFC; Fraz\u00e3o LA; Cerri CEP. Greenhouse gas assessment of Brazilian soybean production: a case study of Mato Grosso State. J Clean Prod (2015)",
-      "text": "Rauccci GS; Moreira CS; Alves PS; Mello FFC; Fraz\u00e3o LA; Cerri CEP. Greenhouse gas assessment of Brazilian soybean production: a case study of Mato Grosso State. J Clean Prod (2015)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/109",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Camargo GGT; Ryan MR; Richard TL. Energy Use and Greenhouse Gas Emissions from Crop Production Using the Farm Energy Analysis Tool. Bioscience (2013)",
-      "text": "Camargo GGT; Ryan MR; Richard TL. Energy Use and Greenhouse Gas Emissions from Crop Production Using the Farm Energy Analysis Tool. Bioscience (2013)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/110",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "da Silva MSJ; Jobim CC; Poppi EC; Tres TT; Osmari MP. Production technology and quality of corn silage for feeding dairy cattle in Southern Brazil. Rev Bras Zootec (2015)",
-      "text": "da Silva MSJ; Jobim CC; Poppi EC; Tres TT; Osmari MP. Production technology and quality of corn silage for feeding dairy cattle in Southern Brazil. Rev Bras Zootec (2015)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/111",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Duchini PGPG Guzatti GCGC; Ribeiro-Filho HMNHMNN Sbrissia AFAFAF. Intercropping black oat (Avena strigosa) and annual ryegrass (Lolium multiflorum) can increase pasture leaf production compared with their monocultures. Crop Pasture Sci (2016)",
-      "text": "Duchini PGPG Guzatti GCGC; Ribeiro-Filho HMNHMNN Sbrissia AFAFAF. Intercropping black oat (Avena strigosa) and annual ryegrass (Lolium multiflorum) can increase pasture leaf production compared with their monocultures. Crop Pasture Sci (2016)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/112",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Scaravelli LFB; Pereira LET; Olivo CJ; Agnolin CA. Produ\u00e7\u00e3o e qualidade de pastagens de Coastcross-1 e milheto utilizadas com vacas leiteiras. Cienc Rural (2007)",
-      "text": "Scaravelli LFB; Pereira LET; Olivo CJ; Agnolin CA. Produ\u00e7\u00e3o e qualidade de pastagens de Coastcross-1 e milheto utilizadas com vacas leiteiras. Cienc Rural (2007)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/113",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Sbrissia AF; Duchini PG; Zanini GD; Santos GT; Padilha DA; Schmitt D. Defoliation strategies in pastures submitted to intermittent stocking method: Underlying mechanisms buffering forage accumulation over a range of grazing heights. Crop Sci (2018)",
-      "text": "Sbrissia AF; Duchini PG; Zanini GD; Santos GT; Padilha DA; Schmitt D. Defoliation strategies in pastures submitted to intermittent stocking method: Underlying mechanisms buffering forage accumulation over a range of grazing heights. Crop Sci (2018)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/114",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Almeida JGR; Dall-Orsoletta AC; Oziemblowski MM; Michelon GM; Bayer C; Edouard N. Carbohydrate-rich supplements can improve nitrogen use efficiency and mitigate nitrogenous gas emissions from the excreta of dairy cows grazing temperate grass. Animal (2020)",
-      "text": "Almeida JGR; Dall-Orsoletta AC; Oziemblowski MM; Michelon GM; Bayer C; Edouard N. Carbohydrate-rich supplements can improve nitrogen use efficiency and mitigate nitrogenous gas emissions from the excreta of dairy cows grazing temperate grass. Animal (2020)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/115",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Eggleston H.S.; Buendia L.; Miwa K. IPCC guidlines for national greenhouse gas inventories. (2006)",
-      "text": "Eggleston H.S.; Buendia L.; Miwa K. IPCC guidlines for national greenhouse gas inventories. (2006)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/116",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Ramalho B; Dieckow J; Barth G; Simon PL; Mangrich AS; Brevilieri RC. No-tillage and ryegrass grazing effects on stocks, stratification and lability of carbon and nitrogen in a subtropical Umbric Ferralsol. Eur J Soil Sci (2020)",
-      "text": "Ramalho B; Dieckow J; Barth G; Simon PL; Mangrich AS; Brevilieri RC. No-tillage and ryegrass grazing effects on stocks, stratification and lability of carbon and nitrogen in a subtropical Umbric Ferralsol. Eur J Soil Sci (2020)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/117",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Fernandes HC; da Silveira JCM; Rinaldi PCN. Avalia\u00e7\u00e3o do custo energ\u00e9tico de diferentes opera\u00e7\u00f5es agr\u00edcolas mecanizadas. Cienc e Agrotecnologia (2008)",
-      "text": "Fernandes HC; da Silveira JCM; Rinaldi PCN. Avalia\u00e7\u00e3o do custo energ\u00e9tico de diferentes opera\u00e7\u00f5es agr\u00edcolas mecanizadas. Cienc e Agrotecnologia (2008)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/118",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Wang M Q. GREET 1.8a Spreadsheet Model. 2007. Available: . ",
-      "text": "Wang M Q. GREET 1.8a Spreadsheet Model. 2007. Available: . ",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/119",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Rotz CAA; Montes F; Chianese DS; Chiane DS. The carbon footprint of dairy production systems through partial life cycle assessment. J Dairy Sci (2010)",
-      "text": "Rotz CAA; Montes F; Chianese DS; Chiane DS. The carbon footprint of dairy production systems through partial life cycle assessment. J Dairy Sci (2010)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/120",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Niu M; Kebreab E; Hristov AN; Oh J; Arndt C; Bannink A. Prediction of enteric methane production, yield, and intensity in dairy cattle using an intercontinental database. Glob Chang Biol (2018)",
-      "text": "Niu M; Kebreab E; Hristov AN; Oh J; Arndt C; Bannink A. Prediction of enteric methane production, yield, and intensity in dairy cattle using an intercontinental database. Glob Chang Biol (2018)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/121",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Eug\u00e8ne M; Sauvant D; Nozi\u00e8re P; Viallard D; Oueslati K; Lherm M. A new Tier 3 method to calculate methane emission inventory for ruminants. J Environ Manage (2019)",
-      "text": "Eug\u00e8ne M; Sauvant D; Nozi\u00e8re P; Viallard D; Oueslati K; Lherm M. A new Tier 3 method to calculate methane emission inventory for ruminants. J Environ Manage (2019)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/122",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Reed KF; Moraes LE; Casper DP; Kebreab E. Predicting nitrogen excretion from cattle. J Dairy Sci (2015)",
-      "text": "Reed KF; Moraes LE; Casper DP; Kebreab E. Predicting nitrogen excretion from cattle. J Dairy Sci (2015)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/123",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Barros MV; Piekarski CM; De Francisco AC. Carbon footprint of electricity generation in Brazil: An analysis of the 2016\u20132026 period. Energies (2018)",
-      "text": "Barros MV; Piekarski CM; De Francisco AC. Carbon footprint of electricity generation in Brazil: An analysis of the 2016\u20132026 period. Energies (2018)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/124",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Ludington D; Johnson E. Dairy Farm Energy Audit Summary. New York State Energy Res Dev Auth (2003)",
-      "text": "Ludington D; Johnson E. Dairy Farm Energy Audit Summary. New York State Energy Res Dev Auth (2003)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/125",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Thoma G; Jolliet O; Wang Y. A biophysical approach to allocation of life cycle environmental burdens for fluid milk supply chain analysis. Int Dairy J (2013)",
-      "text": "Thoma G; Jolliet O; Wang Y. A biophysical approach to allocation of life cycle environmental burdens for fluid milk supply chain analysis. Int Dairy J (2013)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/126",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Naranjo A; Johnson A; Rossow H. Greenhouse gas, water, and land footprint per unit of production of the California dairy industry over 50 years.  (2020)",
-      "text": "Naranjo A; Johnson A; Rossow H. Greenhouse gas, water, and land footprint per unit of production of the California dairy industry over 50 years.  (2020)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/127",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Jayasundara S; Worden D; Weersink A; Wright T; VanderZaag A; Gordon R. Improving farm profitability also reduces the carbon footprint of milk production in intensive dairy production systems. J Clean Prod (2019)",
-      "text": "Jayasundara S; Worden D; Weersink A; Wright T; VanderZaag A; Gordon R. Improving farm profitability also reduces the carbon footprint of milk production in intensive dairy production systems. J Clean Prod (2019)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/128",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Williams SRO; Fisher PD; Berrisford T; Moate PJ; Reynard K. Reducing methane on-farm by feeding diets high in fat may not always reduce life cycle greenhouse gas emissions. Int J Life Cycle Assess (2014)",
-      "text": "Williams SRO; Fisher PD; Berrisford T; Moate PJ; Reynard K. Reducing methane on-farm by feeding diets high in fat may not always reduce life cycle greenhouse gas emissions. Int J Life Cycle Assess (2014)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/129",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Gollnow S; Lundie S; Moore AD; McLaren J; van Buuren N; Stahle P. Carbon footprint of milk production from dairy cows in Australia. Int Dairy J (2014)",
-      "text": "Gollnow S; Lundie S; Moore AD; McLaren J; van Buuren N; Stahle P. Carbon footprint of milk production from dairy cows in Australia. Int Dairy J (2014)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/130",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "O\u2019Brien D; Capper JL; Garnsworthy PC; Grainger C; Shalloo L. A case study of the carbon footprint of milk from high-performing confinement and grass-based dairy farms. J Dairy Sci (2014)",
-      "text": "O\u2019Brien D; Capper JL; Garnsworthy PC; Grainger C; Shalloo L. A case study of the carbon footprint of milk from high-performing confinement and grass-based dairy farms. J Dairy Sci (2014)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/131",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Chobtang J; McLaren SJ; Ledgard SF; Donaghy DJ. Consequential Life Cycle Assessment of Pasture-based Milk Production: A Case Study in the Waikato Region, New Zealand. J Ind Ecol (2017)",
-      "text": "Chobtang J; McLaren SJ; Ledgard SF; Donaghy DJ. Consequential Life Cycle Assessment of Pasture-based Milk Production: A Case Study in the Waikato Region, New Zealand. J Ind Ecol (2017)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/132",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Garg MR; Phondba BT; Sherasia PL; Makkar HPS. Carbon footprint of milk production under smallholder dairying in Anand district of Western India: A cradle-to-farm gate life cycle assessment. Anim Prod Sci (2016)",
-      "text": "Garg MR; Phondba BT; Sherasia PL; Makkar HPS. Carbon footprint of milk production under smallholder dairying in Anand district of Western India: A cradle-to-farm gate life cycle assessment. Anim Prod Sci (2016)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/133",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "de L\u00e9is CM; Cherubini E; Ruviaro CF; Prud\u00eancio da Silva V; do Nascimento Lampert V; Spies A. Carbon footprint of milk production in Brazil: a comparative case study. Int J Life Cycle Assess (2015)",
-      "text": "de L\u00e9is CM; Cherubini E; Ruviaro CF; Prud\u00eancio da Silva V; do Nascimento Lampert V; Spies A. Carbon footprint of milk production in Brazil: a comparative case study. Int J Life Cycle Assess (2015)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/134",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "O\u2019Brien D; Geoghegan A; McNamara K; Shalloo L. How can grass-based dairy farmers reduce the carbon footprint of milk?. Anim Prod Sci (2016)",
-      "text": "O\u2019Brien D; Geoghegan A; McNamara K; Shalloo L. How can grass-based dairy farmers reduce the carbon footprint of milk?. Anim Prod Sci (2016)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/135",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "O\u2019Brien D; Brennan P; Humphreys J; Ruane E; Shalloo L. An appraisal of carbon footprint of milk from commercial grass-based dairy farms in Ireland according to a certified life cycle assessment methodology. Int J Life Cycle Assess (2014)",
-      "text": "O\u2019Brien D; Brennan P; Humphreys J; Ruane E; Shalloo L. An appraisal of carbon footprint of milk from commercial grass-based dairy farms in Ireland according to a certified life cycle assessment methodology. Int J Life Cycle Assess (2014)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/136",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Baek CY; Lee KM; Park KH. Quantification and control of the greenhouse gas emissions from a dairy cow system. J Clean Prod (2014)",
-      "text": "Baek CY; Lee KM; Park KH. Quantification and control of the greenhouse gas emissions from a dairy cow system. J Clean Prod (2014)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/137",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Dall-Orsoletta AC; Almeida JGR; Carvalho PCF; Savian J V. Ribeiro-Filho HMN. Ryegrass pasture combined with partial total mixed ration reduces enteric methane emissions and maintains the performance of dairy cows during mid to late lactation. J Dairy Sci (2016)",
-      "text": "Dall-Orsoletta AC; Almeida JGR; Carvalho PCF; Savian J V. Ribeiro-Filho HMN. Ryegrass pasture combined with partial total mixed ration reduces enteric methane emissions and maintains the performance of dairy cows during mid to late lactation. J Dairy Sci (2016)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/138",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Dall-Orsoletta AC; Oziemblowski MM; Berndt A; Ribeiro-Filho HMN. Enteric methane emission from grazing dairy cows receiving corn silage or ground corn supplementation. Anim Feed Sci Technol (2019)",
-      "text": "Dall-Orsoletta AC; Oziemblowski MM; Berndt A; Ribeiro-Filho HMN. Enteric methane emission from grazing dairy cows receiving corn silage or ground corn supplementation. Anim Feed Sci Technol (2019)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/139",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Niu M; Appuhamy JADRN; Leytem AB; Dungan RS; Kebreab E. Effect of dietary crude protein and forage contents on enteric methane emissions and nitrogen excretion from dairy cows simultaneously. Anim Prod Sci (2016)",
-      "text": "Niu M; Appuhamy JADRN; Leytem AB; Dungan RS; Kebreab E. Effect of dietary crude protein and forage contents on enteric methane emissions and nitrogen excretion from dairy cows simultaneously. Anim Prod Sci (2016)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/140",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Waghorn GC; Law N; Bryant M; Pacheco D; Dalley D. Digestion and nitrogen excretion by Holstein-Friesian cows in late lactation offered ryegrass-based pasture supplemented with fodder beet. Anim Prod Sci (2019)",
-      "text": "Waghorn GC; Law N; Bryant M; Pacheco D; Dalley D. Digestion and nitrogen excretion by Holstein-Friesian cows in late lactation offered ryegrass-based pasture supplemented with fodder beet. Anim Prod Sci (2019)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/141",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Dickhoefer U; Glowacki S; G\u00f3mez CA; Castro-Montoya JM. Forage and protein use efficiency in dairy cows grazing a mixed grass-legume pasture and supplemented with different levels of protein and starch. Livest Sci (2018)",
-      "text": "Dickhoefer U; Glowacki S; G\u00f3mez CA; Castro-Montoya JM. Forage and protein use efficiency in dairy cows grazing a mixed grass-legume pasture and supplemented with different levels of protein and starch. Livest Sci (2018)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/142",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Schwab CG; Broderick GA. A 100-Year Review: Protein and amino acid nutrition in dairy cows. J Dairy Sci (2017)",
-      "text": "Schwab CG; Broderick GA. A 100-Year Review: Protein and amino acid nutrition in dairy cows. J Dairy Sci (2017)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/143",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Sordi A; Dieckow J; Bayer C; Alburquerque MA; Piva JT; Zanatta JA. Nitrous oxide emission factors for urine and dung patches in a subtropical Brazilian pastureland. Agric Ecosyst Environ (2014)",
-      "text": "Sordi A; Dieckow J; Bayer C; Alburquerque MA; Piva JT; Zanatta JA. Nitrous oxide emission factors for urine and dung patches in a subtropical Brazilian pastureland. Agric Ecosyst Environ (2014)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/144",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Simon PL; Dieckow J; de Klein CAM; Zanatta JA; van der Weerden TJ; Ramalho B. Nitrous oxide emission factors from cattle urine and dung, and dicyandiamide (DCD) as a mitigation strategy in subtropical pastures. Agric Ecosyst Environ (2018)",
-      "text": "Simon PL; Dieckow J; de Klein CAM; Zanatta JA; van der Weerden TJ; Ramalho B. Nitrous oxide emission factors from cattle urine and dung, and dicyandiamide (DCD) as a mitigation strategy in subtropical pastures. Agric Ecosyst Environ (2018)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/145",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Wang X; Ledgard S; Luo J; Guo Y; Zhao Z; Guo L. Environmental impacts and resource use of milk production on the North China Plain, based on life cycle assessment. Sci Total Environ (2018)",
-      "text": "Wang X; Ledgard S; Luo J; Guo Y; Zhao Z; Guo L. Environmental impacts and resource use of milk production on the North China Plain, based on life cycle assessment. Sci Total Environ (2018)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/146",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Pirlo G; Lolli S. Environmental impact of milk production from samples of organic and conventional farms in Lombardy (Italy). J Clean Prod (2019)",
-      "text": "Pirlo G; Lolli S. Environmental impact of milk production from samples of organic and conventional farms in Lombardy (Italy). J Clean Prod (2019)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/147",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Herzog A; Winckler C; Zollitsch W. In pursuit of sustainability in dairy farming: A review of interdependent effects of animal welfare improvement and environmental impact mitigation. Agric Ecosyst Environ (2018)",
-      "text": "Herzog A; Winckler C; Zollitsch W. In pursuit of sustainability in dairy farming: A review of interdependent effects of animal welfare improvement and environmental impact mitigation. Agric Ecosyst Environ (2018)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/148",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Mostert PF; van Middelaar CE; Bokkers EAM; de Boer IJM. The impact of subclinical ketosis in dairy cows on greenhouse gas emissions of milk production. J Clean Prod (2018)",
-      "text": "Mostert PF; van Middelaar CE; Bokkers EAM; de Boer IJM. The impact of subclinical ketosis in dairy cows on greenhouse gas emissions of milk production. J Clean Prod (2018)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/149",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Mostert PF; van Middelaar CE; de Boer IJM; Bokkers EAM. The impact of foot lesions in dairy cows on greenhouse gas emissions of milk production. Agric Syst (2018)",
-      "text": "Mostert PF; van Middelaar CE; de Boer IJM; Bokkers EAM. The impact of foot lesions in dairy cows on greenhouse gas emissions of milk production. Agric Syst (2018)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/150",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Foley JA; Ramankutty N; Brauman KA; Cassidy ES; Gerber JS; Johnston M. Solutions for a cultivated planet. Nature (2011)",
-      "text": "Foley JA; Ramankutty N; Brauman KA; Cassidy ES; Gerber JS; Johnston M. Solutions for a cultivated planet. Nature (2011)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/151",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Lal R.. Soil Carbon Sequestration Impacts on Global Climate Change and Food Security. Science (80-) (2004)",
-      "text": "Lal R.. Soil Carbon Sequestration Impacts on Global Climate Change and Food Security. Science (80-) (2004)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/152",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Boddey RM; Jantalia CP; Concei\u00e7ao PC; Zanatta JA; Bayer C; Mielniczuk J. Carbon accumulation at depth in Ferralsols under zero-till subtropical agriculture. Glob Chang Biol (2010)",
-      "text": "Boddey RM; Jantalia CP; Concei\u00e7ao PC; Zanatta JA; Bayer C; Mielniczuk J. Carbon accumulation at depth in Ferralsols under zero-till subtropical agriculture. Glob Chang Biol (2010)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/153",
-      "parent": {
-        "$ref": "#/groups/0"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "McConkey B; Angers D; Bentham M; Boehm M; Brierley T; Cerkowniak D. Canadian agricultural greenhouse gas monitoring accounting and reporting system: methodology and greenhouse gas estimates for agricultural land in the LULUCF sector for NIR 2014.  (2014)",
-      "text": "McConkey B; Angers D; Bentham M; Boehm M; Brierley T; Cerkowniak D. Canadian agricultural greenhouse gas monitoring accounting and reporting system: methodology and greenhouse gas estimates for agricultural land in the LULUCF sector for NIR 2014.  (2014)",
-      "enumerated": false,
-      "marker": "-"
-    }
-  ],
-  "pictures": [
-    {
-      "self_ref": "#/pictures/0",
-      "parent": {
-        "$ref": "#/texts/72"
-      },
-      "children": [],
-      "label": "picture",
-      "prov": [],
-      "captions": [
-        {
-          "$ref": "#/texts/73"
-        }
-      ],
-      "references": [],
-      "footnotes": [],
-      "annotations": []
-    },
-    {
-      "self_ref": "#/pictures/1",
-      "parent": {
-        "$ref": "#/texts/72"
-      },
-      "children": [],
-      "label": "picture",
-      "prov": [],
-      "captions": [
-        {
-          "$ref": "#/texts/74"
-        }
-      ],
-      "references": [],
-      "footnotes": [],
-      "annotations": []
-    },
-    {
-      "self_ref": "#/pictures/2",
-      "parent": {
-        "$ref": "#/texts/72"
-      },
-      "children": [],
-      "label": "picture",
-      "prov": [],
-      "captions": [
-        {
-          "$ref": "#/texts/75"
-        }
-      ],
-      "references": [],
-      "footnotes": [],
-      "annotations": []
-    },
-    {
-      "self_ref": "#/pictures/3",
-      "parent": {
-        "$ref": "#/texts/72"
-      },
-      "children": [],
-      "label": "picture",
-      "prov": [],
-      "captions": [
-        {
-          "$ref": "#/texts/76"
-        }
-      ],
-      "references": [],
-      "footnotes": [],
-      "annotations": []
-    }
-  ],
-  "tables": [
-    {
-      "self_ref": "#/tables/0",
-      "parent": {
-        "$ref": "#/texts/66"
-      },
-      "children": [],
-      "label": "table",
-      "prov": [],
-      "captions": [
-        {
-          "$ref": "#/texts/67"
-        }
-      ],
-      "references": [],
-      "footnotes": [],
-      "data": {
-        "table_cells": [
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 0,
-            "end_row_offset_idx": 1,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "Item",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 0,
-            "end_row_offset_idx": 1,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "Unit",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 0,
-            "end_row_offset_idx": 1,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "Average",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 1,
-            "end_row_offset_idx": 2,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "Milking cows",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 1,
-            "end_row_offset_idx": 2,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "#",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 1,
-            "end_row_offset_idx": 2,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "165",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 2,
-            "end_row_offset_idx": 3,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "Milk production",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 2,
-            "end_row_offset_idx": 3,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "kg year-1",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 2,
-            "end_row_offset_idx": 3,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "7,015",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 3,
-            "end_row_offset_idx": 4,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "Milk fat",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 3,
-            "end_row_offset_idx": 4,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "%",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 3,
-            "end_row_offset_idx": 4,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "4.0",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 4,
-            "end_row_offset_idx": 5,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "Milk protein",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 4,
-            "end_row_offset_idx": 5,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "%",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 4,
-            "end_row_offset_idx": 5,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "3.3",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 5,
-            "end_row_offset_idx": 6,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "Length of lactation",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 5,
-            "end_row_offset_idx": 6,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "days",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 5,
-            "end_row_offset_idx": 6,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "305",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 6,
-            "end_row_offset_idx": 7,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "Body weight",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 6,
-            "end_row_offset_idx": 7,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "kg",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 6,
-            "end_row_offset_idx": 7,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "553",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 7,
-            "end_row_offset_idx": 8,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "Lactations per cow",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 7,
-            "end_row_offset_idx": 8,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "#",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 7,
-            "end_row_offset_idx": 8,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "4",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 8,
-            "end_row_offset_idx": 9,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "Replacement rate",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 8,
-            "end_row_offset_idx": 9,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "%",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 8,
-            "end_row_offset_idx": 9,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "25",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 9,
-            "end_row_offset_idx": 10,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "Cull rate",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 9,
-            "end_row_offset_idx": 10,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "%",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 9,
-            "end_row_offset_idx": 10,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "25",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 10,
-            "end_row_offset_idx": 11,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "First artificial insemination",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 10,
-            "end_row_offset_idx": 11,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "months",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 10,
-            "end_row_offset_idx": 11,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "16",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 11,
-            "end_row_offset_idx": 12,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "Weaned",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 11,
-            "end_row_offset_idx": 12,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "days",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 11,
-            "end_row_offset_idx": 12,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "60",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 12,
-            "end_row_offset_idx": 13,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "Mortality",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 12,
-            "end_row_offset_idx": 13,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "%",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 12,
-            "end_row_offset_idx": 13,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "3.0",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          }
-        ],
-        "num_rows": 13,
-        "num_cols": 3,
-        "grid": [
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 0,
-              "end_row_offset_idx": 1,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "Item",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 0,
-              "end_row_offset_idx": 1,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "Unit",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 0,
-              "end_row_offset_idx": 1,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "Average",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 1,
-              "end_row_offset_idx": 2,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "Milking cows",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 1,
-              "end_row_offset_idx": 2,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "#",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 1,
-              "end_row_offset_idx": 2,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "165",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 2,
-              "end_row_offset_idx": 3,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "Milk production",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 2,
-              "end_row_offset_idx": 3,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "kg year-1",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 2,
-              "end_row_offset_idx": 3,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "7,015",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 3,
-              "end_row_offset_idx": 4,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "Milk fat",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 3,
-              "end_row_offset_idx": 4,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "%",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 3,
-              "end_row_offset_idx": 4,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "4.0",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 4,
-              "end_row_offset_idx": 5,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "Milk protein",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 4,
-              "end_row_offset_idx": 5,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "%",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 4,
-              "end_row_offset_idx": 5,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "3.3",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 5,
-              "end_row_offset_idx": 6,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "Length of lactation",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 5,
-              "end_row_offset_idx": 6,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "days",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 5,
-              "end_row_offset_idx": 6,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "305",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 6,
-              "end_row_offset_idx": 7,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "Body weight",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 6,
-              "end_row_offset_idx": 7,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "kg",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 6,
-              "end_row_offset_idx": 7,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "553",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 7,
-              "end_row_offset_idx": 8,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "Lactations per cow",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 7,
-              "end_row_offset_idx": 8,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "#",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 7,
-              "end_row_offset_idx": 8,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "4",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 8,
-              "end_row_offset_idx": 9,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "Replacement rate",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 8,
-              "end_row_offset_idx": 9,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "%",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 8,
-              "end_row_offset_idx": 9,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "25",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 9,
-              "end_row_offset_idx": 10,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "Cull rate",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 9,
-              "end_row_offset_idx": 10,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "%",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 9,
-              "end_row_offset_idx": 10,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "25",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 10,
-              "end_row_offset_idx": 11,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "First artificial insemination",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 10,
-              "end_row_offset_idx": 11,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "months",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 10,
-              "end_row_offset_idx": 11,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "16",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 11,
-              "end_row_offset_idx": 12,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "Weaned",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 11,
-              "end_row_offset_idx": 12,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "days",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 11,
-              "end_row_offset_idx": 12,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "60",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 12,
-              "end_row_offset_idx": 13,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "Mortality",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 12,
-              "end_row_offset_idx": 13,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "%",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 12,
-              "end_row_offset_idx": 13,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "3.0",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ]
-        ]
-      }
-    },
-    {
-      "self_ref": "#/tables/1",
-      "parent": {
-        "$ref": "#/texts/66"
-      },
-      "children": [],
-      "label": "table",
-      "prov": [],
-      "captions": [
-        {
-          "$ref": "#/texts/68"
-        }
-      ],
-      "references": [],
-      "footnotes": [],
-      "data": {
-        "table_cells": [
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 0,
-            "end_row_offset_idx": 1,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 2,
-            "start_row_offset_idx": 0,
-            "end_row_offset_idx": 1,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 3,
-            "text": "Calf",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 2,
-            "start_row_offset_idx": 0,
-            "end_row_offset_idx": 1,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 5,
-            "text": "Pregnant/dry",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 3,
-            "start_row_offset_idx": 0,
-            "end_row_offset_idx": 1,
-            "start_col_offset_idx": 5,
-            "end_col_offset_idx": 8,
-            "text": "Lactation",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 3,
-            "start_row_offset_idx": 0,
-            "end_row_offset_idx": 1,
-            "start_col_offset_idx": 8,
-            "end_col_offset_idx": 11,
-            "text": "Weighted average",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 1,
-            "end_row_offset_idx": 2,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 1,
-            "end_row_offset_idx": 2,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "0\u201312 mo",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 1,
-            "end_row_offset_idx": 2,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "12-AI mo",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 1,
-            "end_row_offset_idx": 2,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "Heifer",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 1,
-            "end_row_offset_idx": 2,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "Cow",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 1,
-            "end_row_offset_idx": 2,
-            "start_col_offset_idx": 5,
-            "end_col_offset_idx": 6,
-            "text": "TMR",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 1,
-            "end_row_offset_idx": 2,
-            "start_col_offset_idx": 6,
-            "end_col_offset_idx": 7,
-            "text": "TMR75",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 1,
-            "end_row_offset_idx": 2,
-            "start_col_offset_idx": 7,
-            "end_col_offset_idx": 8,
-            "text": "TMR50",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 1,
-            "end_row_offset_idx": 2,
-            "start_col_offset_idx": 8,
-            "end_col_offset_idx": 9,
-            "text": "TMR",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 1,
-            "end_row_offset_idx": 2,
-            "start_col_offset_idx": 9,
-            "end_col_offset_idx": 10,
-            "text": "TMR75",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 1,
-            "end_row_offset_idx": 2,
-            "start_col_offset_idx": 10,
-            "end_col_offset_idx": 11,
-            "text": "TMR50",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 2,
-            "end_row_offset_idx": 3,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "Days",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 2,
-            "end_row_offset_idx": 3,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "360",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 2,
-            "end_row_offset_idx": 3,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "120",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 2,
-            "end_row_offset_idx": 3,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "270",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 2,
-            "end_row_offset_idx": 3,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "180",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 2,
-            "end_row_offset_idx": 3,
-            "start_col_offset_idx": 5,
-            "end_col_offset_idx": 6,
-            "text": "1220",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 2,
-            "end_row_offset_idx": 3,
-            "start_col_offset_idx": 6,
-            "end_col_offset_idx": 7,
-            "text": "1220",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 2,
-            "end_row_offset_idx": 3,
-            "start_col_offset_idx": 7,
-            "end_col_offset_idx": 8,
-            "text": "1220",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 2,
-            "end_row_offset_idx": 3,
-            "start_col_offset_idx": 8,
-            "end_col_offset_idx": 9,
-            "text": "",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 2,
-            "end_row_offset_idx": 3,
-            "start_col_offset_idx": 9,
-            "end_col_offset_idx": 10,
-            "text": "",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 2,
-            "end_row_offset_idx": 3,
-            "start_col_offset_idx": 10,
-            "end_col_offset_idx": 11,
-            "text": "",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 3,
-            "end_row_offset_idx": 4,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "DM intake, kg d-1",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 3,
-            "end_row_offset_idx": 4,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "3.35",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 3,
-            "end_row_offset_idx": 4,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "6.90",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 3,
-            "end_row_offset_idx": 4,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "10.4",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 3,
-            "end_row_offset_idx": 4,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "11.0",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 3,
-            "end_row_offset_idx": 4,
-            "start_col_offset_idx": 5,
-            "end_col_offset_idx": 6,
-            "text": "18.7",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 3,
-            "end_row_offset_idx": 4,
-            "start_col_offset_idx": 6,
-            "end_col_offset_idx": 7,
-            "text": "17.2",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 3,
-            "end_row_offset_idx": 4,
-            "start_col_offset_idx": 7,
-            "end_col_offset_idx": 8,
-            "text": "17.0",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 3,
-            "end_row_offset_idx": 4,
-            "start_col_offset_idx": 8,
-            "end_col_offset_idx": 9,
-            "text": "13.8",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 3,
-            "end_row_offset_idx": 4,
-            "start_col_offset_idx": 9,
-            "end_col_offset_idx": 10,
-            "text": "12.9",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 3,
-            "end_row_offset_idx": 4,
-            "start_col_offset_idx": 10,
-            "end_col_offset_idx": 11,
-            "text": "12.8",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 11,
-            "start_row_offset_idx": 4,
-            "end_row_offset_idx": 5,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 11,
-            "text": "Ingredients, g (kg DM)-1",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 5,
-            "end_row_offset_idx": 6,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "\u00a0\u00a0\u00a0\u00a0Ground corn",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 5,
-            "end_row_offset_idx": 6,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "309",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 5,
-            "end_row_offset_idx": 6,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "145",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 5,
-            "end_row_offset_idx": 6,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "96.3",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 5,
-            "end_row_offset_idx": 6,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "-",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 5,
-            "end_row_offset_idx": 6,
-            "start_col_offset_idx": 5,
-            "end_col_offset_idx": 6,
-            "text": "257",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 5,
-            "end_row_offset_idx": 6,
-            "start_col_offset_idx": 6,
-            "end_col_offset_idx": 7,
-            "text": "195",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 5,
-            "end_row_offset_idx": 6,
-            "start_col_offset_idx": 7,
-            "end_col_offset_idx": 8,
-            "text": "142",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 5,
-            "end_row_offset_idx": 6,
-            "start_col_offset_idx": 8,
-            "end_col_offset_idx": 9,
-            "text": "218",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 5,
-            "end_row_offset_idx": 6,
-            "start_col_offset_idx": 9,
-            "end_col_offset_idx": 10,
-            "text": "183",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 5,
-            "end_row_offset_idx": 6,
-            "start_col_offset_idx": 10,
-            "end_col_offset_idx": 11,
-            "text": "153",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 6,
-            "end_row_offset_idx": 7,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "\u00a0\u00a0\u00a0\u00a0Soybean meal",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 6,
-            "end_row_offset_idx": 7,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "138",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 6,
-            "end_row_offset_idx": 7,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "22",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 6,
-            "end_row_offset_idx": 7,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "26.7",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 6,
-            "end_row_offset_idx": 7,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "-",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 6,
-            "end_row_offset_idx": 7,
-            "start_col_offset_idx": 5,
-            "end_col_offset_idx": 6,
-            "text": "143",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 6,
-            "end_row_offset_idx": 7,
-            "start_col_offset_idx": 6,
-            "end_col_offset_idx": 7,
-            "text": "105",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 6,
-            "end_row_offset_idx": 7,
-            "start_col_offset_idx": 7,
-            "end_col_offset_idx": 8,
-            "text": "76.1",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 6,
-            "end_row_offset_idx": 7,
-            "start_col_offset_idx": 8,
-            "end_col_offset_idx": 9,
-            "text": "109",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 6,
-            "end_row_offset_idx": 7,
-            "start_col_offset_idx": 9,
-            "end_col_offset_idx": 10,
-            "text": "88.0",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 6,
-            "end_row_offset_idx": 7,
-            "start_col_offset_idx": 10,
-            "end_col_offset_idx": 11,
-            "text": "71.0",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 7,
-            "end_row_offset_idx": 8,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "\u00a0\u00a0\u00a0\u00a0Corn silage",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 7,
-            "end_row_offset_idx": 8,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "149",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 7,
-            "end_row_offset_idx": 8,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "290",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 7,
-            "end_row_offset_idx": 8,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "85.6",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 7,
-            "end_row_offset_idx": 8,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "-",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 7,
-            "end_row_offset_idx": 8,
-            "start_col_offset_idx": 5,
-            "end_col_offset_idx": 6,
-            "text": "601",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 7,
-            "end_row_offset_idx": 8,
-            "start_col_offset_idx": 6,
-            "end_col_offset_idx": 7,
-            "text": "451",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 7,
-            "end_row_offset_idx": 8,
-            "start_col_offset_idx": 7,
-            "end_col_offset_idx": 8,
-            "text": "326",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 7,
-            "end_row_offset_idx": 8,
-            "start_col_offset_idx": 8,
-            "end_col_offset_idx": 9,
-            "text": "393",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 7,
-            "end_row_offset_idx": 8,
-            "start_col_offset_idx": 9,
-            "end_col_offset_idx": 10,
-            "text": "308",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 7,
-            "end_row_offset_idx": 8,
-            "start_col_offset_idx": 10,
-            "end_col_offset_idx": 11,
-            "text": "237",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 8,
-            "end_row_offset_idx": 9,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "\u00a0\u00a0\u00a0\u00a0Ann temperate pasture",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 8,
-            "end_row_offset_idx": 9,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "184",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 8,
-            "end_row_offset_idx": 9,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "326",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 8,
-            "end_row_offset_idx": 9,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "257",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 8,
-            "end_row_offset_idx": 9,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "-",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 8,
-            "end_row_offset_idx": 9,
-            "start_col_offset_idx": 5,
-            "end_col_offset_idx": 6,
-            "text": "-",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 8,
-            "end_row_offset_idx": 9,
-            "start_col_offset_idx": 6,
-            "end_col_offset_idx": 7,
-            "text": "185",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 8,
-            "end_row_offset_idx": 9,
-            "start_col_offset_idx": 7,
-            "end_col_offset_idx": 8,
-            "text": "337",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 8,
-            "end_row_offset_idx": 9,
-            "start_col_offset_idx": 8,
-            "end_col_offset_idx": 9,
-            "text": "81.3",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 8,
-            "end_row_offset_idx": 9,
-            "start_col_offset_idx": 9,
-            "end_col_offset_idx": 10,
-            "text": "186",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 8,
-            "end_row_offset_idx": 9,
-            "start_col_offset_idx": 10,
-            "end_col_offset_idx": 11,
-            "text": "273",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 9,
-            "end_row_offset_idx": 10,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "\u00a0\u00a0\u00a0\u00a0Ann tropical pasture",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 9,
-            "end_row_offset_idx": 10,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "-",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 9,
-            "end_row_offset_idx": 10,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "-",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 9,
-            "end_row_offset_idx": 10,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "107",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 9,
-            "end_row_offset_idx": 10,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "-",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 9,
-            "end_row_offset_idx": 10,
-            "start_col_offset_idx": 5,
-            "end_col_offset_idx": 6,
-            "text": "-",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 9,
-            "end_row_offset_idx": 10,
-            "start_col_offset_idx": 6,
-            "end_col_offset_idx": 7,
-            "text": "63",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 9,
-            "end_row_offset_idx": 10,
-            "start_col_offset_idx": 7,
-            "end_col_offset_idx": 8,
-            "text": "119",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 9,
-            "end_row_offset_idx": 10,
-            "start_col_offset_idx": 8,
-            "end_col_offset_idx": 9,
-            "text": "13.4",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 9,
-            "end_row_offset_idx": 10,
-            "start_col_offset_idx": 9,
-            "end_col_offset_idx": 10,
-            "text": "49.1",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 9,
-            "end_row_offset_idx": 10,
-            "start_col_offset_idx": 10,
-            "end_col_offset_idx": 11,
-            "text": "81.0",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 10,
-            "end_row_offset_idx": 11,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "\u00a0\u00a0\u00a0\u00a0Perenn tropical pasture",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 10,
-            "end_row_offset_idx": 11,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "219",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 10,
-            "end_row_offset_idx": 11,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "217",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 10,
-            "end_row_offset_idx": 11,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "428",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 10,
-            "end_row_offset_idx": 11,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "1000",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 10,
-            "end_row_offset_idx": 11,
-            "start_col_offset_idx": 5,
-            "end_col_offset_idx": 6,
-            "text": "-",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 10,
-            "end_row_offset_idx": 11,
-            "start_col_offset_idx": 6,
-            "end_col_offset_idx": 7,
-            "text": "-",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 10,
-            "end_row_offset_idx": 11,
-            "start_col_offset_idx": 7,
-            "end_col_offset_idx": 8,
-            "text": "-",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 10,
-            "end_row_offset_idx": 11,
-            "start_col_offset_idx": 8,
-            "end_col_offset_idx": 9,
-            "text": "186",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 10,
-            "end_row_offset_idx": 11,
-            "start_col_offset_idx": 9,
-            "end_col_offset_idx": 10,
-            "text": "186",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 10,
-            "end_row_offset_idx": 11,
-            "start_col_offset_idx": 10,
-            "end_col_offset_idx": 11,
-            "text": "186",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 11,
-            "start_row_offset_idx": 11,
-            "end_row_offset_idx": 12,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 11,
-            "text": "Chemical composition, g (kg DM)-1",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 12,
-            "end_row_offset_idx": 13,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "\u00a0\u00a0\u00a0\u00a0Organic matter",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 12,
-            "end_row_offset_idx": 13,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "935",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 12,
-            "end_row_offset_idx": 13,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "924",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 12,
-            "end_row_offset_idx": 13,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "913",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 12,
-            "end_row_offset_idx": 13,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "916",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 12,
-            "end_row_offset_idx": 13,
-            "start_col_offset_idx": 5,
-            "end_col_offset_idx": 6,
-            "text": "958",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 12,
-            "end_row_offset_idx": 13,
-            "start_col_offset_idx": 6,
-            "end_col_offset_idx": 7,
-            "text": "939",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 12,
-            "end_row_offset_idx": 13,
-            "start_col_offset_idx": 7,
-            "end_col_offset_idx": 8,
-            "text": "924",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 12,
-            "end_row_offset_idx": 13,
-            "start_col_offset_idx": 8,
-            "end_col_offset_idx": 9,
-            "text": "943",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 12,
-            "end_row_offset_idx": 13,
-            "start_col_offset_idx": 9,
-            "end_col_offset_idx": 10,
-            "text": "932",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 12,
-            "end_row_offset_idx": 13,
-            "start_col_offset_idx": 10,
-            "end_col_offset_idx": 11,
-            "text": "924",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 13,
-            "end_row_offset_idx": 14,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "\u00a0\u00a0\u00a0\u00a0Crude protein",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 13,
-            "end_row_offset_idx": 14,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "216",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 13,
-            "end_row_offset_idx": 14,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "183",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 13,
-            "end_row_offset_idx": 14,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "213",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 13,
-            "end_row_offset_idx": 14,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "200",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 13,
-            "end_row_offset_idx": 14,
-            "start_col_offset_idx": 5,
-            "end_col_offset_idx": 6,
-            "text": "150",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 13,
-            "end_row_offset_idx": 14,
-            "start_col_offset_idx": 6,
-            "end_col_offset_idx": 7,
-            "text": "170",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 13,
-            "end_row_offset_idx": 14,
-            "start_col_offset_idx": 7,
-            "end_col_offset_idx": 8,
-            "text": "198",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 13,
-            "end_row_offset_idx": 14,
-            "start_col_offset_idx": 8,
-            "end_col_offset_idx": 9,
-            "text": "175",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 13,
-            "end_row_offset_idx": 14,
-            "start_col_offset_idx": 9,
-            "end_col_offset_idx": 10,
-            "text": "186",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 13,
-            "end_row_offset_idx": 14,
-            "start_col_offset_idx": 10,
-            "end_col_offset_idx": 11,
-            "text": "202",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 14,
-            "end_row_offset_idx": 15,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "\u00a0\u00a0\u00a0\u00a0Neutral detergent fibre",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 14,
-            "end_row_offset_idx": 15,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "299",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 14,
-            "end_row_offset_idx": 15,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "479",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 14,
-            "end_row_offset_idx": 15,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "518",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 14,
-            "end_row_offset_idx": 15,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "625",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 14,
-            "end_row_offset_idx": 15,
-            "start_col_offset_idx": 5,
-            "end_col_offset_idx": 6,
-            "text": "382",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 14,
-            "end_row_offset_idx": 15,
-            "start_col_offset_idx": 6,
-            "end_col_offset_idx": 7,
-            "text": "418",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 14,
-            "end_row_offset_idx": 15,
-            "start_col_offset_idx": 7,
-            "end_col_offset_idx": 8,
-            "text": "449",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 14,
-            "end_row_offset_idx": 15,
-            "start_col_offset_idx": 8,
-            "end_col_offset_idx": 9,
-            "text": "411",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 14,
-            "end_row_offset_idx": 15,
-            "start_col_offset_idx": 9,
-            "end_col_offset_idx": 10,
-            "text": "431",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 14,
-            "end_row_offset_idx": 15,
-            "start_col_offset_idx": 10,
-            "end_col_offset_idx": 11,
-            "text": "449",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 15,
-            "end_row_offset_idx": 16,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "\u00a0\u00a0\u00a0\u00a0Acid detergent fibre",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 15,
-            "end_row_offset_idx": 16,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "127",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 15,
-            "end_row_offset_idx": 16,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "203",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 15,
-            "end_row_offset_idx": 16,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "234",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 15,
-            "end_row_offset_idx": 16,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "306",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 15,
-            "end_row_offset_idx": 16,
-            "start_col_offset_idx": 5,
-            "end_col_offset_idx": 6,
-            "text": "152",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 15,
-            "end_row_offset_idx": 16,
-            "start_col_offset_idx": 6,
-            "end_col_offset_idx": 7,
-            "text": "171",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 15,
-            "end_row_offset_idx": 16,
-            "start_col_offset_idx": 7,
-            "end_col_offset_idx": 8,
-            "text": "187",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 15,
-            "end_row_offset_idx": 16,
-            "start_col_offset_idx": 8,
-            "end_col_offset_idx": 9,
-            "text": "174",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 15,
-            "end_row_offset_idx": 16,
-            "start_col_offset_idx": 9,
-            "end_col_offset_idx": 10,
-            "text": "185",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 15,
-            "end_row_offset_idx": 16,
-            "start_col_offset_idx": 10,
-            "end_col_offset_idx": 11,
-            "text": "194",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 16,
-            "end_row_offset_idx": 17,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "\u00a0\u00a0\u00a0\u00a0Ether extract",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 16,
-            "end_row_offset_idx": 17,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "46.5",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 16,
-            "end_row_offset_idx": 17,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "30.4",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 16,
-            "end_row_offset_idx": 17,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "28.6",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 16,
-            "end_row_offset_idx": 17,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "25.0",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 16,
-            "end_row_offset_idx": 17,
-            "start_col_offset_idx": 5,
-            "end_col_offset_idx": 6,
-            "text": "31.8",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 16,
-            "end_row_offset_idx": 17,
-            "start_col_offset_idx": 6,
-            "end_col_offset_idx": 7,
-            "text": "31.1",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 16,
-            "end_row_offset_idx": 17,
-            "start_col_offset_idx": 7,
-            "end_col_offset_idx": 8,
-            "text": "30.4",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 16,
-            "end_row_offset_idx": 17,
-            "start_col_offset_idx": 8,
-            "end_col_offset_idx": 9,
-            "text": "33.2",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 16,
-            "end_row_offset_idx": 17,
-            "start_col_offset_idx": 9,
-            "end_col_offset_idx": 10,
-            "text": "32.8",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 16,
-            "end_row_offset_idx": 17,
-            "start_col_offset_idx": 10,
-            "end_col_offset_idx": 11,
-            "text": "32.4",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 11,
-            "start_row_offset_idx": 17,
-            "end_row_offset_idx": 18,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 11,
-            "text": "Nutritive value",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 18,
-            "end_row_offset_idx": 19,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "\u00a0\u00a0\u00a0\u00a0OM digestibility, %",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 18,
-            "end_row_offset_idx": 19,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "82.1",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 18,
-            "end_row_offset_idx": 19,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "77.9",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 18,
-            "end_row_offset_idx": 19,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "77.1",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 18,
-            "end_row_offset_idx": 19,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "71.9",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 18,
-            "end_row_offset_idx": 19,
-            "start_col_offset_idx": 5,
-            "end_col_offset_idx": 6,
-            "text": "72.4",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 18,
-            "end_row_offset_idx": 19,
-            "start_col_offset_idx": 6,
-            "end_col_offset_idx": 7,
-            "text": "75.0",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 18,
-            "end_row_offset_idx": 19,
-            "start_col_offset_idx": 7,
-            "end_col_offset_idx": 8,
-            "text": "77.2",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 18,
-            "end_row_offset_idx": 19,
-            "start_col_offset_idx": 8,
-            "end_col_offset_idx": 9,
-            "text": "74.8",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 18,
-            "end_row_offset_idx": 19,
-            "start_col_offset_idx": 9,
-            "end_col_offset_idx": 10,
-            "text": "76.3",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 18,
-            "end_row_offset_idx": 19,
-            "start_col_offset_idx": 10,
-            "end_col_offset_idx": 11,
-            "text": "77.6",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 19,
-            "end_row_offset_idx": 20,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "\u00a0\u00a0\u00a0\u00a0NEL, Mcal (kg DM)-1",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 19,
-            "end_row_offset_idx": 20,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "1.96",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 19,
-            "end_row_offset_idx": 20,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "1.69",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 19,
-            "end_row_offset_idx": 20,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "1.63",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 19,
-            "end_row_offset_idx": 20,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "1.44",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 19,
-            "end_row_offset_idx": 20,
-            "start_col_offset_idx": 5,
-            "end_col_offset_idx": 6,
-            "text": "1.81",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 19,
-            "end_row_offset_idx": 20,
-            "start_col_offset_idx": 6,
-            "end_col_offset_idx": 7,
-            "text": "1.78",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 19,
-            "end_row_offset_idx": 20,
-            "start_col_offset_idx": 7,
-            "end_col_offset_idx": 8,
-            "text": "1.74",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 19,
-            "end_row_offset_idx": 20,
-            "start_col_offset_idx": 8,
-            "end_col_offset_idx": 9,
-            "text": "1.8",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 19,
-            "end_row_offset_idx": 20,
-            "start_col_offset_idx": 9,
-            "end_col_offset_idx": 10,
-            "text": "1.8",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 19,
-            "end_row_offset_idx": 20,
-            "start_col_offset_idx": 10,
-            "end_col_offset_idx": 11,
-            "text": "1.7",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 20,
-            "end_row_offset_idx": 21,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "\u00a0\u00a0\u00a0\u00a0MP, g (kg DM)-1",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 20,
-            "end_row_offset_idx": 21,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "111",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 20,
-            "end_row_offset_idx": 21,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "93.6",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 20,
-            "end_row_offset_idx": 21,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "97.6",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 20,
-            "end_row_offset_idx": 21,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "90.0",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 20,
-            "end_row_offset_idx": 21,
-            "start_col_offset_idx": 5,
-            "end_col_offset_idx": 6,
-            "text": "95.0",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 20,
-            "end_row_offset_idx": 21,
-            "start_col_offset_idx": 6,
-            "end_col_offset_idx": 7,
-            "text": "102",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 20,
-            "end_row_offset_idx": 21,
-            "start_col_offset_idx": 7,
-            "end_col_offset_idx": 8,
-            "text": "102",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 20,
-            "end_row_offset_idx": 21,
-            "start_col_offset_idx": 8,
-            "end_col_offset_idx": 9,
-            "text": "97.5",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 20,
-            "end_row_offset_idx": 21,
-            "start_col_offset_idx": 9,
-            "end_col_offset_idx": 10,
-            "text": "102",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 20,
-            "end_row_offset_idx": 21,
-            "start_col_offset_idx": 10,
-            "end_col_offset_idx": 11,
-            "text": "101",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          }
-        ],
-        "num_rows": 21,
-        "num_cols": 11,
-        "grid": [
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 0,
-              "end_row_offset_idx": 1,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 2,
-              "start_row_offset_idx": 0,
-              "end_row_offset_idx": 1,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 3,
-              "text": "Calf",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 2,
-              "start_row_offset_idx": 0,
-              "end_row_offset_idx": 1,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 3,
-              "text": "Calf",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 2,
-              "start_row_offset_idx": 0,
-              "end_row_offset_idx": 1,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 5,
-              "text": "Pregnant/dry",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 2,
-              "start_row_offset_idx": 0,
-              "end_row_offset_idx": 1,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 5,
-              "text": "Pregnant/dry",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 3,
-              "start_row_offset_idx": 0,
-              "end_row_offset_idx": 1,
-              "start_col_offset_idx": 5,
-              "end_col_offset_idx": 8,
-              "text": "Lactation",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 3,
-              "start_row_offset_idx": 0,
-              "end_row_offset_idx": 1,
-              "start_col_offset_idx": 5,
-              "end_col_offset_idx": 8,
-              "text": "Lactation",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 3,
-              "start_row_offset_idx": 0,
-              "end_row_offset_idx": 1,
-              "start_col_offset_idx": 5,
-              "end_col_offset_idx": 8,
-              "text": "Lactation",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 3,
-              "start_row_offset_idx": 0,
-              "end_row_offset_idx": 1,
-              "start_col_offset_idx": 8,
-              "end_col_offset_idx": 11,
-              "text": "Weighted average",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 3,
-              "start_row_offset_idx": 0,
-              "end_row_offset_idx": 1,
-              "start_col_offset_idx": 8,
-              "end_col_offset_idx": 11,
-              "text": "Weighted average",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 3,
-              "start_row_offset_idx": 0,
-              "end_row_offset_idx": 1,
-              "start_col_offset_idx": 8,
-              "end_col_offset_idx": 11,
-              "text": "Weighted average",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 1,
-              "end_row_offset_idx": 2,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 1,
-              "end_row_offset_idx": 2,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "0\u201312 mo",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 1,
-              "end_row_offset_idx": 2,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "12-AI mo",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 1,
-              "end_row_offset_idx": 2,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "Heifer",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 1,
-              "end_row_offset_idx": 2,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "Cow",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 1,
-              "end_row_offset_idx": 2,
-              "start_col_offset_idx": 5,
-              "end_col_offset_idx": 6,
-              "text": "TMR",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 1,
-              "end_row_offset_idx": 2,
-              "start_col_offset_idx": 6,
-              "end_col_offset_idx": 7,
-              "text": "TMR75",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 1,
-              "end_row_offset_idx": 2,
-              "start_col_offset_idx": 7,
-              "end_col_offset_idx": 8,
-              "text": "TMR50",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 1,
-              "end_row_offset_idx": 2,
-              "start_col_offset_idx": 8,
-              "end_col_offset_idx": 9,
-              "text": "TMR",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 1,
-              "end_row_offset_idx": 2,
-              "start_col_offset_idx": 9,
-              "end_col_offset_idx": 10,
-              "text": "TMR75",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 1,
-              "end_row_offset_idx": 2,
-              "start_col_offset_idx": 10,
-              "end_col_offset_idx": 11,
-              "text": "TMR50",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 2,
-              "end_row_offset_idx": 3,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "Days",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 2,
-              "end_row_offset_idx": 3,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "360",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 2,
-              "end_row_offset_idx": 3,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "120",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 2,
-              "end_row_offset_idx": 3,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "270",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 2,
-              "end_row_offset_idx": 3,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "180",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 2,
-              "end_row_offset_idx": 3,
-              "start_col_offset_idx": 5,
-              "end_col_offset_idx": 6,
-              "text": "1220",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 2,
-              "end_row_offset_idx": 3,
-              "start_col_offset_idx": 6,
-              "end_col_offset_idx": 7,
-              "text": "1220",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 2,
-              "end_row_offset_idx": 3,
-              "start_col_offset_idx": 7,
-              "end_col_offset_idx": 8,
-              "text": "1220",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 2,
-              "end_row_offset_idx": 3,
-              "start_col_offset_idx": 8,
-              "end_col_offset_idx": 9,
-              "text": "",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 2,
-              "end_row_offset_idx": 3,
-              "start_col_offset_idx": 9,
-              "end_col_offset_idx": 10,
-              "text": "",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 2,
-              "end_row_offset_idx": 3,
-              "start_col_offset_idx": 10,
-              "end_col_offset_idx": 11,
-              "text": "",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 3,
-              "end_row_offset_idx": 4,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "DM intake, kg d-1",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 3,
-              "end_row_offset_idx": 4,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "3.35",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 3,
-              "end_row_offset_idx": 4,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "6.90",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 3,
-              "end_row_offset_idx": 4,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "10.4",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 3,
-              "end_row_offset_idx": 4,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "11.0",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 3,
-              "end_row_offset_idx": 4,
-              "start_col_offset_idx": 5,
-              "end_col_offset_idx": 6,
-              "text": "18.7",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 3,
-              "end_row_offset_idx": 4,
-              "start_col_offset_idx": 6,
-              "end_col_offset_idx": 7,
-              "text": "17.2",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 3,
-              "end_row_offset_idx": 4,
-              "start_col_offset_idx": 7,
-              "end_col_offset_idx": 8,
-              "text": "17.0",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 3,
-              "end_row_offset_idx": 4,
-              "start_col_offset_idx": 8,
-              "end_col_offset_idx": 9,
-              "text": "13.8",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 3,
-              "end_row_offset_idx": 4,
-              "start_col_offset_idx": 9,
-              "end_col_offset_idx": 10,
-              "text": "12.9",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 3,
-              "end_row_offset_idx": 4,
-              "start_col_offset_idx": 10,
-              "end_col_offset_idx": 11,
-              "text": "12.8",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 11,
-              "start_row_offset_idx": 4,
-              "end_row_offset_idx": 5,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 11,
-              "text": "Ingredients, g (kg DM)-1",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 11,
-              "start_row_offset_idx": 4,
-              "end_row_offset_idx": 5,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 11,
-              "text": "Ingredients, g (kg DM)-1",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 11,
-              "start_row_offset_idx": 4,
-              "end_row_offset_idx": 5,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 11,
-              "text": "Ingredients, g (kg DM)-1",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 11,
-              "start_row_offset_idx": 4,
-              "end_row_offset_idx": 5,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 11,
-              "text": "Ingredients, g (kg DM)-1",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 11,
-              "start_row_offset_idx": 4,
-              "end_row_offset_idx": 5,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 11,
-              "text": "Ingredients, g (kg DM)-1",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 11,
-              "start_row_offset_idx": 4,
-              "end_row_offset_idx": 5,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 11,
-              "text": "Ingredients, g (kg DM)-1",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 11,
-              "start_row_offset_idx": 4,
-              "end_row_offset_idx": 5,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 11,
-              "text": "Ingredients, g (kg DM)-1",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 11,
-              "start_row_offset_idx": 4,
-              "end_row_offset_idx": 5,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 11,
-              "text": "Ingredients, g (kg DM)-1",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 11,
-              "start_row_offset_idx": 4,
-              "end_row_offset_idx": 5,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 11,
-              "text": "Ingredients, g (kg DM)-1",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 11,
-              "start_row_offset_idx": 4,
-              "end_row_offset_idx": 5,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 11,
-              "text": "Ingredients, g (kg DM)-1",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 11,
-              "start_row_offset_idx": 4,
-              "end_row_offset_idx": 5,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 11,
-              "text": "Ingredients, g (kg DM)-1",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 5,
-              "end_row_offset_idx": 6,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "\u00a0\u00a0\u00a0\u00a0Ground corn",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 5,
-              "end_row_offset_idx": 6,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "309",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 5,
-              "end_row_offset_idx": 6,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "145",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 5,
-              "end_row_offset_idx": 6,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "96.3",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 5,
-              "end_row_offset_idx": 6,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "-",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 5,
-              "end_row_offset_idx": 6,
-              "start_col_offset_idx": 5,
-              "end_col_offset_idx": 6,
-              "text": "257",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 5,
-              "end_row_offset_idx": 6,
-              "start_col_offset_idx": 6,
-              "end_col_offset_idx": 7,
-              "text": "195",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 5,
-              "end_row_offset_idx": 6,
-              "start_col_offset_idx": 7,
-              "end_col_offset_idx": 8,
-              "text": "142",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 5,
-              "end_row_offset_idx": 6,
-              "start_col_offset_idx": 8,
-              "end_col_offset_idx": 9,
-              "text": "218",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 5,
-              "end_row_offset_idx": 6,
-              "start_col_offset_idx": 9,
-              "end_col_offset_idx": 10,
-              "text": "183",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 5,
-              "end_row_offset_idx": 6,
-              "start_col_offset_idx": 10,
-              "end_col_offset_idx": 11,
-              "text": "153",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 6,
-              "end_row_offset_idx": 7,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "\u00a0\u00a0\u00a0\u00a0Soybean meal",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 6,
-              "end_row_offset_idx": 7,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "138",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 6,
-              "end_row_offset_idx": 7,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "22",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 6,
-              "end_row_offset_idx": 7,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "26.7",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 6,
-              "end_row_offset_idx": 7,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "-",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 6,
-              "end_row_offset_idx": 7,
-              "start_col_offset_idx": 5,
-              "end_col_offset_idx": 6,
-              "text": "143",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 6,
-              "end_row_offset_idx": 7,
-              "start_col_offset_idx": 6,
-              "end_col_offset_idx": 7,
-              "text": "105",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 6,
-              "end_row_offset_idx": 7,
-              "start_col_offset_idx": 7,
-              "end_col_offset_idx": 8,
-              "text": "76.1",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 6,
-              "end_row_offset_idx": 7,
-              "start_col_offset_idx": 8,
-              "end_col_offset_idx": 9,
-              "text": "109",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 6,
-              "end_row_offset_idx": 7,
-              "start_col_offset_idx": 9,
-              "end_col_offset_idx": 10,
-              "text": "88.0",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 6,
-              "end_row_offset_idx": 7,
-              "start_col_offset_idx": 10,
-              "end_col_offset_idx": 11,
-              "text": "71.0",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 7,
-              "end_row_offset_idx": 8,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "\u00a0\u00a0\u00a0\u00a0Corn silage",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 7,
-              "end_row_offset_idx": 8,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "149",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 7,
-              "end_row_offset_idx": 8,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "290",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 7,
-              "end_row_offset_idx": 8,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "85.6",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 7,
-              "end_row_offset_idx": 8,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "-",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 7,
-              "end_row_offset_idx": 8,
-              "start_col_offset_idx": 5,
-              "end_col_offset_idx": 6,
-              "text": "601",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 7,
-              "end_row_offset_idx": 8,
-              "start_col_offset_idx": 6,
-              "end_col_offset_idx": 7,
-              "text": "451",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 7,
-              "end_row_offset_idx": 8,
-              "start_col_offset_idx": 7,
-              "end_col_offset_idx": 8,
-              "text": "326",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 7,
-              "end_row_offset_idx": 8,
-              "start_col_offset_idx": 8,
-              "end_col_offset_idx": 9,
-              "text": "393",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 7,
-              "end_row_offset_idx": 8,
-              "start_col_offset_idx": 9,
-              "end_col_offset_idx": 10,
-              "text": "308",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 7,
-              "end_row_offset_idx": 8,
-              "start_col_offset_idx": 10,
-              "end_col_offset_idx": 11,
-              "text": "237",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 8,
-              "end_row_offset_idx": 9,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "\u00a0\u00a0\u00a0\u00a0Ann temperate pasture",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 8,
-              "end_row_offset_idx": 9,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "184",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 8,
-              "end_row_offset_idx": 9,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "326",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 8,
-              "end_row_offset_idx": 9,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "257",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 8,
-              "end_row_offset_idx": 9,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "-",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 8,
-              "end_row_offset_idx": 9,
-              "start_col_offset_idx": 5,
-              "end_col_offset_idx": 6,
-              "text": "-",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 8,
-              "end_row_offset_idx": 9,
-              "start_col_offset_idx": 6,
-              "end_col_offset_idx": 7,
-              "text": "185",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 8,
-              "end_row_offset_idx": 9,
-              "start_col_offset_idx": 7,
-              "end_col_offset_idx": 8,
-              "text": "337",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 8,
-              "end_row_offset_idx": 9,
-              "start_col_offset_idx": 8,
-              "end_col_offset_idx": 9,
-              "text": "81.3",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 8,
-              "end_row_offset_idx": 9,
-              "start_col_offset_idx": 9,
-              "end_col_offset_idx": 10,
-              "text": "186",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 8,
-              "end_row_offset_idx": 9,
-              "start_col_offset_idx": 10,
-              "end_col_offset_idx": 11,
-              "text": "273",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 9,
-              "end_row_offset_idx": 10,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "\u00a0\u00a0\u00a0\u00a0Ann tropical pasture",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 9,
-              "end_row_offset_idx": 10,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "-",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 9,
-              "end_row_offset_idx": 10,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "-",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 9,
-              "end_row_offset_idx": 10,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "107",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 9,
-              "end_row_offset_idx": 10,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "-",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 9,
-              "end_row_offset_idx": 10,
-              "start_col_offset_idx": 5,
-              "end_col_offset_idx": 6,
-              "text": "-",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 9,
-              "end_row_offset_idx": 10,
-              "start_col_offset_idx": 6,
-              "end_col_offset_idx": 7,
-              "text": "63",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 9,
-              "end_row_offset_idx": 10,
-              "start_col_offset_idx": 7,
-              "end_col_offset_idx": 8,
-              "text": "119",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 9,
-              "end_row_offset_idx": 10,
-              "start_col_offset_idx": 8,
-              "end_col_offset_idx": 9,
-              "text": "13.4",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 9,
-              "end_row_offset_idx": 10,
-              "start_col_offset_idx": 9,
-              "end_col_offset_idx": 10,
-              "text": "49.1",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 9,
-              "end_row_offset_idx": 10,
-              "start_col_offset_idx": 10,
-              "end_col_offset_idx": 11,
-              "text": "81.0",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 10,
-              "end_row_offset_idx": 11,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "\u00a0\u00a0\u00a0\u00a0Perenn tropical pasture",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 10,
-              "end_row_offset_idx": 11,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "219",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 10,
-              "end_row_offset_idx": 11,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "217",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 10,
-              "end_row_offset_idx": 11,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "428",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 10,
-              "end_row_offset_idx": 11,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "1000",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 10,
-              "end_row_offset_idx": 11,
-              "start_col_offset_idx": 5,
-              "end_col_offset_idx": 6,
-              "text": "-",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 10,
-              "end_row_offset_idx": 11,
-              "start_col_offset_idx": 6,
-              "end_col_offset_idx": 7,
-              "text": "-",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 10,
-              "end_row_offset_idx": 11,
-              "start_col_offset_idx": 7,
-              "end_col_offset_idx": 8,
-              "text": "-",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 10,
-              "end_row_offset_idx": 11,
-              "start_col_offset_idx": 8,
-              "end_col_offset_idx": 9,
-              "text": "186",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 10,
-              "end_row_offset_idx": 11,
-              "start_col_offset_idx": 9,
-              "end_col_offset_idx": 10,
-              "text": "186",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 10,
-              "end_row_offset_idx": 11,
-              "start_col_offset_idx": 10,
-              "end_col_offset_idx": 11,
-              "text": "186",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 11,
-              "start_row_offset_idx": 11,
-              "end_row_offset_idx": 12,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 11,
-              "text": "Chemical composition, g (kg DM)-1",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 11,
-              "start_row_offset_idx": 11,
-              "end_row_offset_idx": 12,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 11,
-              "text": "Chemical composition, g (kg DM)-1",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 11,
-              "start_row_offset_idx": 11,
-              "end_row_offset_idx": 12,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 11,
-              "text": "Chemical composition, g (kg DM)-1",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 11,
-              "start_row_offset_idx": 11,
-              "end_row_offset_idx": 12,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 11,
-              "text": "Chemical composition, g (kg DM)-1",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 11,
-              "start_row_offset_idx": 11,
-              "end_row_offset_idx": 12,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 11,
-              "text": "Chemical composition, g (kg DM)-1",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 11,
-              "start_row_offset_idx": 11,
-              "end_row_offset_idx": 12,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 11,
-              "text": "Chemical composition, g (kg DM)-1",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 11,
-              "start_row_offset_idx": 11,
-              "end_row_offset_idx": 12,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 11,
-              "text": "Chemical composition, g (kg DM)-1",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 11,
-              "start_row_offset_idx": 11,
-              "end_row_offset_idx": 12,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 11,
-              "text": "Chemical composition, g (kg DM)-1",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 11,
-              "start_row_offset_idx": 11,
-              "end_row_offset_idx": 12,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 11,
-              "text": "Chemical composition, g (kg DM)-1",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 11,
-              "start_row_offset_idx": 11,
-              "end_row_offset_idx": 12,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 11,
-              "text": "Chemical composition, g (kg DM)-1",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 11,
-              "start_row_offset_idx": 11,
-              "end_row_offset_idx": 12,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 11,
-              "text": "Chemical composition, g (kg DM)-1",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 12,
-              "end_row_offset_idx": 13,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "\u00a0\u00a0\u00a0\u00a0Organic matter",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 12,
-              "end_row_offset_idx": 13,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "935",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 12,
-              "end_row_offset_idx": 13,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "924",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 12,
-              "end_row_offset_idx": 13,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "913",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 12,
-              "end_row_offset_idx": 13,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "916",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 12,
-              "end_row_offset_idx": 13,
-              "start_col_offset_idx": 5,
-              "end_col_offset_idx": 6,
-              "text": "958",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 12,
-              "end_row_offset_idx": 13,
-              "start_col_offset_idx": 6,
-              "end_col_offset_idx": 7,
-              "text": "939",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 12,
-              "end_row_offset_idx": 13,
-              "start_col_offset_idx": 7,
-              "end_col_offset_idx": 8,
-              "text": "924",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 12,
-              "end_row_offset_idx": 13,
-              "start_col_offset_idx": 8,
-              "end_col_offset_idx": 9,
-              "text": "943",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 12,
-              "end_row_offset_idx": 13,
-              "start_col_offset_idx": 9,
-              "end_col_offset_idx": 10,
-              "text": "932",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 12,
-              "end_row_offset_idx": 13,
-              "start_col_offset_idx": 10,
-              "end_col_offset_idx": 11,
-              "text": "924",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 13,
-              "end_row_offset_idx": 14,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "\u00a0\u00a0\u00a0\u00a0Crude protein",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 13,
-              "end_row_offset_idx": 14,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "216",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 13,
-              "end_row_offset_idx": 14,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "183",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 13,
-              "end_row_offset_idx": 14,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "213",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 13,
-              "end_row_offset_idx": 14,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "200",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 13,
-              "end_row_offset_idx": 14,
-              "start_col_offset_idx": 5,
-              "end_col_offset_idx": 6,
-              "text": "150",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 13,
-              "end_row_offset_idx": 14,
-              "start_col_offset_idx": 6,
-              "end_col_offset_idx": 7,
-              "text": "170",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 13,
-              "end_row_offset_idx": 14,
-              "start_col_offset_idx": 7,
-              "end_col_offset_idx": 8,
-              "text": "198",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 13,
-              "end_row_offset_idx": 14,
-              "start_col_offset_idx": 8,
-              "end_col_offset_idx": 9,
-              "text": "175",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 13,
-              "end_row_offset_idx": 14,
-              "start_col_offset_idx": 9,
-              "end_col_offset_idx": 10,
-              "text": "186",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 13,
-              "end_row_offset_idx": 14,
-              "start_col_offset_idx": 10,
-              "end_col_offset_idx": 11,
-              "text": "202",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 14,
-              "end_row_offset_idx": 15,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "\u00a0\u00a0\u00a0\u00a0Neutral detergent fibre",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 14,
-              "end_row_offset_idx": 15,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "299",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 14,
-              "end_row_offset_idx": 15,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "479",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 14,
-              "end_row_offset_idx": 15,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "518",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 14,
-              "end_row_offset_idx": 15,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "625",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 14,
-              "end_row_offset_idx": 15,
-              "start_col_offset_idx": 5,
-              "end_col_offset_idx": 6,
-              "text": "382",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 14,
-              "end_row_offset_idx": 15,
-              "start_col_offset_idx": 6,
-              "end_col_offset_idx": 7,
-              "text": "418",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 14,
-              "end_row_offset_idx": 15,
-              "start_col_offset_idx": 7,
-              "end_col_offset_idx": 8,
-              "text": "449",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 14,
-              "end_row_offset_idx": 15,
-              "start_col_offset_idx": 8,
-              "end_col_offset_idx": 9,
-              "text": "411",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 14,
-              "end_row_offset_idx": 15,
-              "start_col_offset_idx": 9,
-              "end_col_offset_idx": 10,
-              "text": "431",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 14,
-              "end_row_offset_idx": 15,
-              "start_col_offset_idx": 10,
-              "end_col_offset_idx": 11,
-              "text": "449",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 15,
-              "end_row_offset_idx": 16,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "\u00a0\u00a0\u00a0\u00a0Acid detergent fibre",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 15,
-              "end_row_offset_idx": 16,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "127",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 15,
-              "end_row_offset_idx": 16,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "203",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 15,
-              "end_row_offset_idx": 16,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "234",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 15,
-              "end_row_offset_idx": 16,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "306",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 15,
-              "end_row_offset_idx": 16,
-              "start_col_offset_idx": 5,
-              "end_col_offset_idx": 6,
-              "text": "152",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 15,
-              "end_row_offset_idx": 16,
-              "start_col_offset_idx": 6,
-              "end_col_offset_idx": 7,
-              "text": "171",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 15,
-              "end_row_offset_idx": 16,
-              "start_col_offset_idx": 7,
-              "end_col_offset_idx": 8,
-              "text": "187",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 15,
-              "end_row_offset_idx": 16,
-              "start_col_offset_idx": 8,
-              "end_col_offset_idx": 9,
-              "text": "174",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 15,
-              "end_row_offset_idx": 16,
-              "start_col_offset_idx": 9,
-              "end_col_offset_idx": 10,
-              "text": "185",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 15,
-              "end_row_offset_idx": 16,
-              "start_col_offset_idx": 10,
-              "end_col_offset_idx": 11,
-              "text": "194",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 16,
-              "end_row_offset_idx": 17,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "\u00a0\u00a0\u00a0\u00a0Ether extract",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 16,
-              "end_row_offset_idx": 17,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "46.5",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 16,
-              "end_row_offset_idx": 17,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "30.4",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 16,
-              "end_row_offset_idx": 17,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "28.6",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 16,
-              "end_row_offset_idx": 17,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "25.0",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 16,
-              "end_row_offset_idx": 17,
-              "start_col_offset_idx": 5,
-              "end_col_offset_idx": 6,
-              "text": "31.8",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 16,
-              "end_row_offset_idx": 17,
-              "start_col_offset_idx": 6,
-              "end_col_offset_idx": 7,
-              "text": "31.1",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 16,
-              "end_row_offset_idx": 17,
-              "start_col_offset_idx": 7,
-              "end_col_offset_idx": 8,
-              "text": "30.4",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 16,
-              "end_row_offset_idx": 17,
-              "start_col_offset_idx": 8,
-              "end_col_offset_idx": 9,
-              "text": "33.2",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 16,
-              "end_row_offset_idx": 17,
-              "start_col_offset_idx": 9,
-              "end_col_offset_idx": 10,
-              "text": "32.8",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 16,
-              "end_row_offset_idx": 17,
-              "start_col_offset_idx": 10,
-              "end_col_offset_idx": 11,
-              "text": "32.4",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 11,
-              "start_row_offset_idx": 17,
-              "end_row_offset_idx": 18,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 11,
-              "text": "Nutritive value",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 11,
-              "start_row_offset_idx": 17,
-              "end_row_offset_idx": 18,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 11,
-              "text": "Nutritive value",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 11,
-              "start_row_offset_idx": 17,
-              "end_row_offset_idx": 18,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 11,
-              "text": "Nutritive value",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 11,
-              "start_row_offset_idx": 17,
-              "end_row_offset_idx": 18,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 11,
-              "text": "Nutritive value",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 11,
-              "start_row_offset_idx": 17,
-              "end_row_offset_idx": 18,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 11,
-              "text": "Nutritive value",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 11,
-              "start_row_offset_idx": 17,
-              "end_row_offset_idx": 18,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 11,
-              "text": "Nutritive value",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 11,
-              "start_row_offset_idx": 17,
-              "end_row_offset_idx": 18,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 11,
-              "text": "Nutritive value",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 11,
-              "start_row_offset_idx": 17,
-              "end_row_offset_idx": 18,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 11,
-              "text": "Nutritive value",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 11,
-              "start_row_offset_idx": 17,
-              "end_row_offset_idx": 18,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 11,
-              "text": "Nutritive value",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 11,
-              "start_row_offset_idx": 17,
-              "end_row_offset_idx": 18,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 11,
-              "text": "Nutritive value",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 11,
-              "start_row_offset_idx": 17,
-              "end_row_offset_idx": 18,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 11,
-              "text": "Nutritive value",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 18,
-              "end_row_offset_idx": 19,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "\u00a0\u00a0\u00a0\u00a0OM digestibility, %",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 18,
-              "end_row_offset_idx": 19,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "82.1",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 18,
-              "end_row_offset_idx": 19,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "77.9",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 18,
-              "end_row_offset_idx": 19,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "77.1",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 18,
-              "end_row_offset_idx": 19,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "71.9",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 18,
-              "end_row_offset_idx": 19,
-              "start_col_offset_idx": 5,
-              "end_col_offset_idx": 6,
-              "text": "72.4",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 18,
-              "end_row_offset_idx": 19,
-              "start_col_offset_idx": 6,
-              "end_col_offset_idx": 7,
-              "text": "75.0",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 18,
-              "end_row_offset_idx": 19,
-              "start_col_offset_idx": 7,
-              "end_col_offset_idx": 8,
-              "text": "77.2",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 18,
-              "end_row_offset_idx": 19,
-              "start_col_offset_idx": 8,
-              "end_col_offset_idx": 9,
-              "text": "74.8",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 18,
-              "end_row_offset_idx": 19,
-              "start_col_offset_idx": 9,
-              "end_col_offset_idx": 10,
-              "text": "76.3",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 18,
-              "end_row_offset_idx": 19,
-              "start_col_offset_idx": 10,
-              "end_col_offset_idx": 11,
-              "text": "77.6",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 19,
-              "end_row_offset_idx": 20,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "\u00a0\u00a0\u00a0\u00a0NEL, Mcal (kg DM)-1",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 19,
-              "end_row_offset_idx": 20,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "1.96",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 19,
-              "end_row_offset_idx": 20,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "1.69",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 19,
-              "end_row_offset_idx": 20,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "1.63",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 19,
-              "end_row_offset_idx": 20,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "1.44",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 19,
-              "end_row_offset_idx": 20,
-              "start_col_offset_idx": 5,
-              "end_col_offset_idx": 6,
-              "text": "1.81",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 19,
-              "end_row_offset_idx": 20,
-              "start_col_offset_idx": 6,
-              "end_col_offset_idx": 7,
-              "text": "1.78",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 19,
-              "end_row_offset_idx": 20,
-              "start_col_offset_idx": 7,
-              "end_col_offset_idx": 8,
-              "text": "1.74",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 19,
-              "end_row_offset_idx": 20,
-              "start_col_offset_idx": 8,
-              "end_col_offset_idx": 9,
-              "text": "1.8",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 19,
-              "end_row_offset_idx": 20,
-              "start_col_offset_idx": 9,
-              "end_col_offset_idx": 10,
-              "text": "1.8",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 19,
-              "end_row_offset_idx": 20,
-              "start_col_offset_idx": 10,
-              "end_col_offset_idx": 11,
-              "text": "1.7",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 20,
-              "end_row_offset_idx": 21,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "\u00a0\u00a0\u00a0\u00a0MP, g (kg DM)-1",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 20,
-              "end_row_offset_idx": 21,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "111",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 20,
-              "end_row_offset_idx": 21,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "93.6",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 20,
-              "end_row_offset_idx": 21,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "97.6",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 20,
-              "end_row_offset_idx": 21,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "90.0",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 20,
-              "end_row_offset_idx": 21,
-              "start_col_offset_idx": 5,
-              "end_col_offset_idx": 6,
-              "text": "95.0",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 20,
-              "end_row_offset_idx": 21,
-              "start_col_offset_idx": 6,
-              "end_col_offset_idx": 7,
-              "text": "102",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 20,
-              "end_row_offset_idx": 21,
-              "start_col_offset_idx": 7,
-              "end_col_offset_idx": 8,
-              "text": "102",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 20,
-              "end_row_offset_idx": 21,
-              "start_col_offset_idx": 8,
-              "end_col_offset_idx": 9,
-              "text": "97.5",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 20,
-              "end_row_offset_idx": 21,
-              "start_col_offset_idx": 9,
-              "end_col_offset_idx": 10,
-              "text": "102",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 20,
-              "end_row_offset_idx": 21,
-              "start_col_offset_idx": 10,
-              "end_col_offset_idx": 11,
-              "text": "101",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ]
-        ]
-      }
-    },
-    {
-      "self_ref": "#/tables/2",
-      "parent": {
-        "$ref": "#/texts/66"
-      },
-      "children": [],
-      "label": "table",
-      "prov": [],
-      "captions": [
-        {
-          "$ref": "#/texts/69"
-        }
-      ],
-      "references": [],
-      "footnotes": [],
-      "data": {
-        "table_cells": [
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 0,
-            "end_row_offset_idx": 1,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "Feed",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 0,
-            "end_row_offset_idx": 1,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "DM yield (kg ha-1)",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 0,
-            "end_row_offset_idx": 1,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "Emission factor",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 0,
-            "end_row_offset_idx": 1,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "Unita",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 0,
-            "end_row_offset_idx": 1,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "References",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 1,
-            "end_row_offset_idx": 2,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "Off-farm",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 1,
-            "end_row_offset_idx": 2,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 1,
-            "end_row_offset_idx": 2,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 1,
-            "end_row_offset_idx": 2,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 1,
-            "end_row_offset_idx": 2,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 2,
-            "end_row_offset_idx": 3,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "\u00a0\u00a0\u00a0\u00a0Corn grain",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 2,
-            "end_row_offset_idx": 3,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "7,500",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 2,
-            "end_row_offset_idx": 3,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "0.316",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 2,
-            "end_row_offset_idx": 3,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "kg CO2e (kg grain)-1",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 2,
-            "end_row_offset_idx": 3,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "[30]",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 3,
-            "end_row_offset_idx": 4,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "\u00a0\u00a0\u00a0\u00a0Soybean",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 3,
-            "end_row_offset_idx": 4,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "2,200",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 3,
-            "end_row_offset_idx": 4,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "0.186",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 3,
-            "end_row_offset_idx": 4,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "kg CO2e (kg grain)-1",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 3,
-            "end_row_offset_idx": 4,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "[31]",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 4,
-            "end_row_offset_idx": 5,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "On-farm",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 4,
-            "end_row_offset_idx": 5,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 4,
-            "end_row_offset_idx": 5,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 4,
-            "end_row_offset_idx": 5,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 4,
-            "end_row_offset_idx": 5,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 5,
-            "end_row_offset_idx": 6,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "\u00a0\u00a0\u00a0\u00a0Corn silageb",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 5,
-            "end_row_offset_idx": 6,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "16,000",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 5,
-            "end_row_offset_idx": 6,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "0.206",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 5,
-            "end_row_offset_idx": 6,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "kg CO2e (kg DM)-1",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 5,
-            "end_row_offset_idx": 6,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "[32,33]",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 6,
-            "end_row_offset_idx": 7,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "\u00a0\u00a0\u00a0\u00a0Annual ryegrassc",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 6,
-            "end_row_offset_idx": 7,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "9,500",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 6,
-            "end_row_offset_idx": 7,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "0.226",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 6,
-            "end_row_offset_idx": 7,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "kg CO2e (kg DM)-1",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 6,
-            "end_row_offset_idx": 7,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "[32,34]",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 7,
-            "end_row_offset_idx": 8,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "\u00a0\u00a0\u00a0\u00a0Pearl milletd",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 7,
-            "end_row_offset_idx": 8,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "11,000",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 7,
-            "end_row_offset_idx": 8,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "0.195",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 7,
-            "end_row_offset_idx": 8,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "kg CO2e (kg DM)-1",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 7,
-            "end_row_offset_idx": 8,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "[32,35]",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 8,
-            "end_row_offset_idx": 9,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "\u00a0\u00a0\u00a0\u00a0Kikuyu grasse",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 8,
-            "end_row_offset_idx": 9,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "9,500",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 8,
-            "end_row_offset_idx": 9,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "0.226",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 8,
-            "end_row_offset_idx": 9,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "kg CO2e (kg DM)-1",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 8,
-            "end_row_offset_idx": 9,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "[32,36]",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          }
-        ],
-        "num_rows": 9,
-        "num_cols": 5,
-        "grid": [
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 0,
-              "end_row_offset_idx": 1,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "Feed",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 0,
-              "end_row_offset_idx": 1,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "DM yield (kg ha-1)",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 0,
-              "end_row_offset_idx": 1,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "Emission factor",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 0,
-              "end_row_offset_idx": 1,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "Unita",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 0,
-              "end_row_offset_idx": 1,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "References",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 1,
-              "end_row_offset_idx": 2,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "Off-farm",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 1,
-              "end_row_offset_idx": 2,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 1,
-              "end_row_offset_idx": 2,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 1,
-              "end_row_offset_idx": 2,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 1,
-              "end_row_offset_idx": 2,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 2,
-              "end_row_offset_idx": 3,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "\u00a0\u00a0\u00a0\u00a0Corn grain",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 2,
-              "end_row_offset_idx": 3,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "7,500",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 2,
-              "end_row_offset_idx": 3,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "0.316",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 2,
-              "end_row_offset_idx": 3,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "kg CO2e (kg grain)-1",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 2,
-              "end_row_offset_idx": 3,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "[30]",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 3,
-              "end_row_offset_idx": 4,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "\u00a0\u00a0\u00a0\u00a0Soybean",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 3,
-              "end_row_offset_idx": 4,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "2,200",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 3,
-              "end_row_offset_idx": 4,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "0.186",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 3,
-              "end_row_offset_idx": 4,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "kg CO2e (kg grain)-1",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 3,
-              "end_row_offset_idx": 4,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "[31]",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 4,
-              "end_row_offset_idx": 5,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "On-farm",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 4,
-              "end_row_offset_idx": 5,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 4,
-              "end_row_offset_idx": 5,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 4,
-              "end_row_offset_idx": 5,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 4,
-              "end_row_offset_idx": 5,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 5,
-              "end_row_offset_idx": 6,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "\u00a0\u00a0\u00a0\u00a0Corn silageb",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 5,
-              "end_row_offset_idx": 6,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "16,000",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 5,
-              "end_row_offset_idx": 6,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "0.206",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 5,
-              "end_row_offset_idx": 6,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "kg CO2e (kg DM)-1",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 5,
-              "end_row_offset_idx": 6,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "[32,33]",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 6,
-              "end_row_offset_idx": 7,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "\u00a0\u00a0\u00a0\u00a0Annual ryegrassc",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 6,
-              "end_row_offset_idx": 7,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "9,500",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 6,
-              "end_row_offset_idx": 7,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "0.226",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 6,
-              "end_row_offset_idx": 7,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "kg CO2e (kg DM)-1",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 6,
-              "end_row_offset_idx": 7,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "[32,34]",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 7,
-              "end_row_offset_idx": 8,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "\u00a0\u00a0\u00a0\u00a0Pearl milletd",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 7,
-              "end_row_offset_idx": 8,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "11,000",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 7,
-              "end_row_offset_idx": 8,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "0.195",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 7,
-              "end_row_offset_idx": 8,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "kg CO2e (kg DM)-1",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 7,
-              "end_row_offset_idx": 8,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "[32,35]",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 8,
-              "end_row_offset_idx": 9,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "\u00a0\u00a0\u00a0\u00a0Kikuyu grasse",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 8,
-              "end_row_offset_idx": 9,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "9,500",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 8,
-              "end_row_offset_idx": 9,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "0.226",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 8,
-              "end_row_offset_idx": 9,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "kg CO2e (kg DM)-1",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 8,
-              "end_row_offset_idx": 9,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "[32,36]",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ]
-        ]
-      }
-    },
-    {
-      "self_ref": "#/tables/3",
-      "parent": {
-        "$ref": "#/texts/66"
-      },
-      "children": [],
-      "label": "table",
-      "prov": [],
-      "captions": [
-        {
-          "$ref": "#/texts/70"
-        }
-      ],
-      "references": [],
-      "footnotes": [],
-      "data": {
-        "table_cells": [
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 0,
-            "end_row_offset_idx": 1,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "Item",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 0,
-            "end_row_offset_idx": 1,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "Corn silage",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 0,
-            "end_row_offset_idx": 1,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "Annual temperate pasture",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 0,
-            "end_row_offset_idx": 1,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "Annual tropical pasture",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 0,
-            "end_row_offset_idx": 1,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "Perennial tropical pasture",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 1,
-            "end_row_offset_idx": 2,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "DM yield, kg ha-1",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 1,
-            "end_row_offset_idx": 2,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "16000",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 1,
-            "end_row_offset_idx": 2,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "9500",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 1,
-            "end_row_offset_idx": 2,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "11000",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 1,
-            "end_row_offset_idx": 2,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "9500",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 2,
-            "end_row_offset_idx": 3,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "Direct N2O emissions to air",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 2,
-            "end_row_offset_idx": 3,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 2,
-            "end_row_offset_idx": 3,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 2,
-            "end_row_offset_idx": 3,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 2,
-            "end_row_offset_idx": 3,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 3,
-            "end_row_offset_idx": 4,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "\u00a0\u00a0\u00a0\u00a0N organic fertilizer, kg ha-1a",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 3,
-            "end_row_offset_idx": 4,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "150",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 3,
-            "end_row_offset_idx": 4,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "180",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 3,
-            "end_row_offset_idx": 4,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "225",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 3,
-            "end_row_offset_idx": 4,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "225",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 4,
-            "end_row_offset_idx": 5,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "\u00a0\u00a0\u00a0\u00a0N synthetic fertilizer",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 4,
-            "end_row_offset_idx": 5,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "-",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 4,
-            "end_row_offset_idx": 5,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "20",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 4,
-            "end_row_offset_idx": 5,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "25",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 4,
-            "end_row_offset_idx": 5,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "25",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 5,
-            "end_row_offset_idx": 6,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "\u00a0\u00a0\u00a0\u00a0N from residual DM, kg ha-1b",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 5,
-            "end_row_offset_idx": 6,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "70",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 5,
-            "end_row_offset_idx": 6,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "112",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 5,
-            "end_row_offset_idx": 6,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "129",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 5,
-            "end_row_offset_idx": 6,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "112",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 6,
-            "end_row_offset_idx": 7,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "\u00a0\u00a0\u00a0\u00a0Emission fator, kg N2O-N (kg N)-1c",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 6,
-            "end_row_offset_idx": 7,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "0.002",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 6,
-            "end_row_offset_idx": 7,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "0.002",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 6,
-            "end_row_offset_idx": 7,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "0.002",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 6,
-            "end_row_offset_idx": 7,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "0.002",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 7,
-            "end_row_offset_idx": 8,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "\u00a0\u00a0\u00a0\u00a0kg N2O ha-1 from direct emissions",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 7,
-            "end_row_offset_idx": 8,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "0.69",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 7,
-            "end_row_offset_idx": 8,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "0.98",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 7,
-            "end_row_offset_idx": 8,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "1.19",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 7,
-            "end_row_offset_idx": 8,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "1.14",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 8,
-            "end_row_offset_idx": 9,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "Indirect N2O emissions to air",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 8,
-            "end_row_offset_idx": 9,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 8,
-            "end_row_offset_idx": 9,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 8,
-            "end_row_offset_idx": 9,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 8,
-            "end_row_offset_idx": 9,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 9,
-            "end_row_offset_idx": 10,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "\u00a0\u00a0\u00a0\u00a0kg NH3-N+NOx-N (kg organic N)-1b",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 9,
-            "end_row_offset_idx": 10,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "0.2",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 9,
-            "end_row_offset_idx": 10,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "0.2",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 9,
-            "end_row_offset_idx": 10,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "0.2",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 9,
-            "end_row_offset_idx": 10,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "0.2",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 10,
-            "end_row_offset_idx": 11,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "\u00a0\u00a0\u00a0\u00a0kg NH3-N+NOx-N (kg synthetic N)-1b",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 10,
-            "end_row_offset_idx": 11,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "0.1",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 10,
-            "end_row_offset_idx": 11,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "0.1",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 10,
-            "end_row_offset_idx": 11,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "0.1",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 10,
-            "end_row_offset_idx": 11,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "0.1",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 11,
-            "end_row_offset_idx": 12,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "\u00a0\u00a0\u00a0\u00a0kg N2O-N (kg NH3-N+NOx-N)-1b",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 11,
-            "end_row_offset_idx": 12,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "0.01",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 11,
-            "end_row_offset_idx": 12,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "0.01",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 11,
-            "end_row_offset_idx": 12,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "0.01",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 11,
-            "end_row_offset_idx": 12,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "0.01",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 12,
-            "end_row_offset_idx": 13,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "\u00a0\u00a0\u00a0\u00a0kg N2O ha-1 from NH3+NOx volatilized",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 12,
-            "end_row_offset_idx": 13,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "0.47",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 12,
-            "end_row_offset_idx": 13,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "0.60",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 12,
-            "end_row_offset_idx": 13,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "0.75",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 12,
-            "end_row_offset_idx": 13,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "0.75",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 13,
-            "end_row_offset_idx": 14,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "Indirect N2O emissions to soil",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 13,
-            "end_row_offset_idx": 14,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 13,
-            "end_row_offset_idx": 14,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 13,
-            "end_row_offset_idx": 14,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 13,
-            "end_row_offset_idx": 14,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 14,
-            "end_row_offset_idx": 15,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "\u00a0\u00a0\u00a0\u00a0kg N losses by leaching (kg N)-1b",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 14,
-            "end_row_offset_idx": 15,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "0.3",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 14,
-            "end_row_offset_idx": 15,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "0.3",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 14,
-            "end_row_offset_idx": 15,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "0.3",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 14,
-            "end_row_offset_idx": 15,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "0.3",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 15,
-            "end_row_offset_idx": 16,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "\u00a0\u00a0\u00a0\u00a0kg N2O-N (kg N leaching)-1",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 15,
-            "end_row_offset_idx": 16,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "0.0075",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 15,
-            "end_row_offset_idx": 16,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "0.0075",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 15,
-            "end_row_offset_idx": 16,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "0.0075",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 15,
-            "end_row_offset_idx": 16,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "0.0075",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 16,
-            "end_row_offset_idx": 17,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "\u00a0\u00a0\u00a0\u00a0kg N2O ha-1 from N losses by leaching",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 16,
-            "end_row_offset_idx": 17,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "0.78",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 16,
-            "end_row_offset_idx": 17,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "1.10",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 16,
-            "end_row_offset_idx": 17,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "1.34",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 16,
-            "end_row_offset_idx": 17,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "1.28",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 17,
-            "end_row_offset_idx": 18,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "kg N2O ha-1 (direct + indirect emissions)",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 17,
-            "end_row_offset_idx": 18,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "1.94",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 17,
-            "end_row_offset_idx": 18,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "2.68",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 17,
-            "end_row_offset_idx": 18,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "3.28",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 17,
-            "end_row_offset_idx": 18,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "3.16",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 18,
-            "end_row_offset_idx": 19,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "kg CO2e ha-1 from N20 emissionsd",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 18,
-            "end_row_offset_idx": 19,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "514",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 18,
-            "end_row_offset_idx": 19,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "710",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 18,
-            "end_row_offset_idx": 19,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "869",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 18,
-            "end_row_offset_idx": 19,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "838",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 19,
-            "end_row_offset_idx": 20,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "kg CO2 ha-1 from lime+ureab",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 19,
-            "end_row_offset_idx": 20,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "515",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 19,
-            "end_row_offset_idx": 20,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "721",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 19,
-            "end_row_offset_idx": 20,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "882",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 19,
-            "end_row_offset_idx": 20,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "852",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 20,
-            "end_row_offset_idx": 21,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "kg CO2 ha-1 from diesel combustione",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 20,
-            "end_row_offset_idx": 21,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "802",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 20,
-            "end_row_offset_idx": 21,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "38",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 20,
-            "end_row_offset_idx": 21,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "23",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 20,
-            "end_row_offset_idx": 21,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "12",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 21,
-            "end_row_offset_idx": 22,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "kg CO2e from secondary sourcesf",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 21,
-            "end_row_offset_idx": 22,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "516",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 21,
-            "end_row_offset_idx": 22,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "205",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 21,
-            "end_row_offset_idx": 22,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "225",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 21,
-            "end_row_offset_idx": 22,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "284",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 22,
-            "end_row_offset_idx": 23,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "Total CO2e emitted, kg ha-1",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 22,
-            "end_row_offset_idx": 23,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "1833",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 22,
-            "end_row_offset_idx": 23,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "964",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 22,
-            "end_row_offset_idx": 23,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "1130",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 22,
-            "end_row_offset_idx": 23,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "1148",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 23,
-            "end_row_offset_idx": 24,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "Emission factor, kg CO2e (kg DM)-1g",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 23,
-            "end_row_offset_idx": 24,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "0.115",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 23,
-            "end_row_offset_idx": 24,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "0.145",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 23,
-            "end_row_offset_idx": 24,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "0.147",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 23,
-            "end_row_offset_idx": 24,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "0.173",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 24,
-            "end_row_offset_idx": 25,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "Carbon sequestered, kg ha-1h",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 24,
-            "end_row_offset_idx": 25,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "-",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 24,
-            "end_row_offset_idx": 25,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "-",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 24,
-            "end_row_offset_idx": 25,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "-",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 24,
-            "end_row_offset_idx": 25,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "570",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 25,
-            "end_row_offset_idx": 26,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "Sequestered CO2-C, kg ha-1",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 25,
-            "end_row_offset_idx": 26,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "-",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 25,
-            "end_row_offset_idx": 26,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "-",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 25,
-            "end_row_offset_idx": 26,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "-",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 25,
-            "end_row_offset_idx": 26,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "1393",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 26,
-            "end_row_offset_idx": 27,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "kg CO2e ha-1 (emitted\u2014sequestered)",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 26,
-            "end_row_offset_idx": 27,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "1833",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 26,
-            "end_row_offset_idx": 27,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "964",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 26,
-            "end_row_offset_idx": 27,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "1130",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 26,
-            "end_row_offset_idx": 27,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "-245",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 27,
-            "end_row_offset_idx": 28,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "Emission factor, kg CO2e (kg DM)-1i",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 27,
-            "end_row_offset_idx": 28,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "0.115",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 27,
-            "end_row_offset_idx": 28,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "0.145",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 27,
-            "end_row_offset_idx": 28,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "0.147",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 27,
-            "end_row_offset_idx": 28,
-            "start_col_offset_idx": 4,
-            "end_col_offset_idx": 5,
-            "text": "-0.037",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          }
-        ],
-        "num_rows": 28,
-        "num_cols": 5,
-        "grid": [
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 0,
-              "end_row_offset_idx": 1,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "Item",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 0,
-              "end_row_offset_idx": 1,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "Corn silage",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 0,
-              "end_row_offset_idx": 1,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "Annual temperate pasture",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 0,
-              "end_row_offset_idx": 1,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "Annual tropical pasture",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 0,
-              "end_row_offset_idx": 1,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "Perennial tropical pasture",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 1,
-              "end_row_offset_idx": 2,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "DM yield, kg ha-1",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 1,
-              "end_row_offset_idx": 2,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "16000",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 1,
-              "end_row_offset_idx": 2,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "9500",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 1,
-              "end_row_offset_idx": 2,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "11000",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 1,
-              "end_row_offset_idx": 2,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "9500",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 2,
-              "end_row_offset_idx": 3,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "Direct N2O emissions to air",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 2,
-              "end_row_offset_idx": 3,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 2,
-              "end_row_offset_idx": 3,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 2,
-              "end_row_offset_idx": 3,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 2,
-              "end_row_offset_idx": 3,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 3,
-              "end_row_offset_idx": 4,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "\u00a0\u00a0\u00a0\u00a0N organic fertilizer, kg ha-1a",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 3,
-              "end_row_offset_idx": 4,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "150",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 3,
-              "end_row_offset_idx": 4,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "180",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 3,
-              "end_row_offset_idx": 4,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "225",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 3,
-              "end_row_offset_idx": 4,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "225",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 4,
-              "end_row_offset_idx": 5,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "\u00a0\u00a0\u00a0\u00a0N synthetic fertilizer",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 4,
-              "end_row_offset_idx": 5,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "-",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 4,
-              "end_row_offset_idx": 5,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "20",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 4,
-              "end_row_offset_idx": 5,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "25",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 4,
-              "end_row_offset_idx": 5,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "25",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 5,
-              "end_row_offset_idx": 6,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "\u00a0\u00a0\u00a0\u00a0N from residual DM, kg ha-1b",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 5,
-              "end_row_offset_idx": 6,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "70",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 5,
-              "end_row_offset_idx": 6,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "112",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 5,
-              "end_row_offset_idx": 6,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "129",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 5,
-              "end_row_offset_idx": 6,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "112",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 6,
-              "end_row_offset_idx": 7,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "\u00a0\u00a0\u00a0\u00a0Emission fator, kg N2O-N (kg N)-1c",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 6,
-              "end_row_offset_idx": 7,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "0.002",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 6,
-              "end_row_offset_idx": 7,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "0.002",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 6,
-              "end_row_offset_idx": 7,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "0.002",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 6,
-              "end_row_offset_idx": 7,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "0.002",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 7,
-              "end_row_offset_idx": 8,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "\u00a0\u00a0\u00a0\u00a0kg N2O ha-1 from direct emissions",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 7,
-              "end_row_offset_idx": 8,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "0.69",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 7,
-              "end_row_offset_idx": 8,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "0.98",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 7,
-              "end_row_offset_idx": 8,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "1.19",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 7,
-              "end_row_offset_idx": 8,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "1.14",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 8,
-              "end_row_offset_idx": 9,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "Indirect N2O emissions to air",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 8,
-              "end_row_offset_idx": 9,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 8,
-              "end_row_offset_idx": 9,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 8,
-              "end_row_offset_idx": 9,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 8,
-              "end_row_offset_idx": 9,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 9,
-              "end_row_offset_idx": 10,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "\u00a0\u00a0\u00a0\u00a0kg NH3-N+NOx-N (kg organic N)-1b",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 9,
-              "end_row_offset_idx": 10,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "0.2",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 9,
-              "end_row_offset_idx": 10,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "0.2",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 9,
-              "end_row_offset_idx": 10,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "0.2",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 9,
-              "end_row_offset_idx": 10,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "0.2",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 10,
-              "end_row_offset_idx": 11,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "\u00a0\u00a0\u00a0\u00a0kg NH3-N+NOx-N (kg synthetic N)-1b",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 10,
-              "end_row_offset_idx": 11,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "0.1",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 10,
-              "end_row_offset_idx": 11,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "0.1",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 10,
-              "end_row_offset_idx": 11,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "0.1",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 10,
-              "end_row_offset_idx": 11,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "0.1",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 11,
-              "end_row_offset_idx": 12,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "\u00a0\u00a0\u00a0\u00a0kg N2O-N (kg NH3-N+NOx-N)-1b",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 11,
-              "end_row_offset_idx": 12,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "0.01",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 11,
-              "end_row_offset_idx": 12,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "0.01",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 11,
-              "end_row_offset_idx": 12,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "0.01",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 11,
-              "end_row_offset_idx": 12,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "0.01",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 12,
-              "end_row_offset_idx": 13,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "\u00a0\u00a0\u00a0\u00a0kg N2O ha-1 from NH3+NOx volatilized",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 12,
-              "end_row_offset_idx": 13,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "0.47",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 12,
-              "end_row_offset_idx": 13,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "0.60",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 12,
-              "end_row_offset_idx": 13,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "0.75",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 12,
-              "end_row_offset_idx": 13,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "0.75",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 13,
-              "end_row_offset_idx": 14,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "Indirect N2O emissions to soil",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 13,
-              "end_row_offset_idx": 14,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 13,
-              "end_row_offset_idx": 14,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 13,
-              "end_row_offset_idx": 14,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 13,
-              "end_row_offset_idx": 14,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 14,
-              "end_row_offset_idx": 15,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "\u00a0\u00a0\u00a0\u00a0kg N losses by leaching (kg N)-1b",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 14,
-              "end_row_offset_idx": 15,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "0.3",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 14,
-              "end_row_offset_idx": 15,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "0.3",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 14,
-              "end_row_offset_idx": 15,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "0.3",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 14,
-              "end_row_offset_idx": 15,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "0.3",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 15,
-              "end_row_offset_idx": 16,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "\u00a0\u00a0\u00a0\u00a0kg N2O-N (kg N leaching)-1",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 15,
-              "end_row_offset_idx": 16,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "0.0075",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 15,
-              "end_row_offset_idx": 16,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "0.0075",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 15,
-              "end_row_offset_idx": 16,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "0.0075",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 15,
-              "end_row_offset_idx": 16,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "0.0075",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 16,
-              "end_row_offset_idx": 17,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "\u00a0\u00a0\u00a0\u00a0kg N2O ha-1 from N losses by leaching",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 16,
-              "end_row_offset_idx": 17,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "0.78",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 16,
-              "end_row_offset_idx": 17,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "1.10",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 16,
-              "end_row_offset_idx": 17,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "1.34",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 16,
-              "end_row_offset_idx": 17,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "1.28",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 17,
-              "end_row_offset_idx": 18,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "kg N2O ha-1 (direct + indirect emissions)",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 17,
-              "end_row_offset_idx": 18,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "1.94",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 17,
-              "end_row_offset_idx": 18,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "2.68",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 17,
-              "end_row_offset_idx": 18,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "3.28",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 17,
-              "end_row_offset_idx": 18,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "3.16",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 18,
-              "end_row_offset_idx": 19,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "kg CO2e ha-1 from N20 emissionsd",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 18,
-              "end_row_offset_idx": 19,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "514",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 18,
-              "end_row_offset_idx": 19,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "710",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 18,
-              "end_row_offset_idx": 19,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "869",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 18,
-              "end_row_offset_idx": 19,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "838",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 19,
-              "end_row_offset_idx": 20,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "kg CO2 ha-1 from lime+ureab",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 19,
-              "end_row_offset_idx": 20,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "515",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 19,
-              "end_row_offset_idx": 20,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "721",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 19,
-              "end_row_offset_idx": 20,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "882",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 19,
-              "end_row_offset_idx": 20,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "852",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 20,
-              "end_row_offset_idx": 21,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "kg CO2 ha-1 from diesel combustione",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 20,
-              "end_row_offset_idx": 21,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "802",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 20,
-              "end_row_offset_idx": 21,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "38",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 20,
-              "end_row_offset_idx": 21,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "23",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 20,
-              "end_row_offset_idx": 21,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "12",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 21,
-              "end_row_offset_idx": 22,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "kg CO2e from secondary sourcesf",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 21,
-              "end_row_offset_idx": 22,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "516",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 21,
-              "end_row_offset_idx": 22,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "205",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 21,
-              "end_row_offset_idx": 22,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "225",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 21,
-              "end_row_offset_idx": 22,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "284",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 22,
-              "end_row_offset_idx": 23,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "Total CO2e emitted, kg ha-1",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 22,
-              "end_row_offset_idx": 23,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "1833",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 22,
-              "end_row_offset_idx": 23,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "964",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 22,
-              "end_row_offset_idx": 23,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "1130",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 22,
-              "end_row_offset_idx": 23,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "1148",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 23,
-              "end_row_offset_idx": 24,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "Emission factor, kg CO2e (kg DM)-1g",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 23,
-              "end_row_offset_idx": 24,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "0.115",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 23,
-              "end_row_offset_idx": 24,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "0.145",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 23,
-              "end_row_offset_idx": 24,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "0.147",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 23,
-              "end_row_offset_idx": 24,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "0.173",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 24,
-              "end_row_offset_idx": 25,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "Carbon sequestered, kg ha-1h",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 24,
-              "end_row_offset_idx": 25,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "-",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 24,
-              "end_row_offset_idx": 25,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "-",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 24,
-              "end_row_offset_idx": 25,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "-",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 24,
-              "end_row_offset_idx": 25,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "570",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 25,
-              "end_row_offset_idx": 26,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "Sequestered CO2-C, kg ha-1",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 25,
-              "end_row_offset_idx": 26,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "-",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 25,
-              "end_row_offset_idx": 26,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "-",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 25,
-              "end_row_offset_idx": 26,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "-",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 25,
-              "end_row_offset_idx": 26,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "1393",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 26,
-              "end_row_offset_idx": 27,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "kg CO2e ha-1 (emitted\u2014sequestered)",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 26,
-              "end_row_offset_idx": 27,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "1833",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 26,
-              "end_row_offset_idx": 27,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "964",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 26,
-              "end_row_offset_idx": 27,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "1130",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 26,
-              "end_row_offset_idx": 27,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "-245",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 27,
-              "end_row_offset_idx": 28,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "Emission factor, kg CO2e (kg DM)-1i",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 27,
-              "end_row_offset_idx": 28,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "0.115",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 27,
-              "end_row_offset_idx": 28,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "0.145",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 27,
-              "end_row_offset_idx": 28,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "0.147",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 27,
-              "end_row_offset_idx": 28,
-              "start_col_offset_idx": 4,
-              "end_col_offset_idx": 5,
-              "text": "-0.037",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ]
-        ]
-      }
-    },
-    {
-      "self_ref": "#/tables/4",
-      "parent": {
-        "$ref": "#/texts/66"
-      },
-      "children": [],
-      "label": "table",
-      "prov": [],
-      "captions": [
-        {
-          "$ref": "#/texts/71"
-        }
-      ],
-      "references": [],
-      "footnotes": [],
-      "data": {
-        "table_cells": [
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 0,
-            "end_row_offset_idx": 1,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "Item",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 0,
-            "end_row_offset_idx": 1,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "Factor",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 0,
-            "end_row_offset_idx": 1,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "Unita",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 0,
-            "end_row_offset_idx": 1,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "References",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 1,
-            "end_row_offset_idx": 2,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "Production and transport of diesel",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 1,
-            "end_row_offset_idx": 2,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "0.374",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 1,
-            "end_row_offset_idx": 2,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "kg CO2e L-1",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 1,
-            "end_row_offset_idx": 2,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "[41]",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 2,
-            "end_row_offset_idx": 3,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "Emissions from diesel fuel combustion",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 2,
-            "end_row_offset_idx": 3,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "2.637",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 2,
-            "end_row_offset_idx": 3,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "kg CO2e L-1",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 2,
-            "end_row_offset_idx": 3,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "[41]",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 3,
-            "end_row_offset_idx": 4,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "Production of electricityb",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 3,
-            "end_row_offset_idx": 4,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "0.73",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 3,
-            "end_row_offset_idx": 4,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "kg CO2e kWh-1",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 3,
-            "end_row_offset_idx": 4,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "[41]",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 4,
-            "end_row_offset_idx": 5,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "Production of electricity (alternative)c",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 4,
-            "end_row_offset_idx": 5,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "0.205",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 4,
-            "end_row_offset_idx": 5,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "kg CO2e kWh-1",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 4,
-            "end_row_offset_idx": 5,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "[46]",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 5,
-            "end_row_offset_idx": 6,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "Production of machinery",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 5,
-            "end_row_offset_idx": 6,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "3.54",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 5,
-            "end_row_offset_idx": 6,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "kg CO2e (kg mm)-1",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 5,
-            "end_row_offset_idx": 6,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "[42]",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 6,
-            "end_row_offset_idx": 7,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "Manure handling",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 6,
-            "end_row_offset_idx": 7,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 6,
-            "end_row_offset_idx": 7,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 6,
-            "end_row_offset_idx": 7,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 7,
-            "end_row_offset_idx": 8,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "\u00a0\u00a0\u00a0\u00a0Fuel for manure handling",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 7,
-            "end_row_offset_idx": 8,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "0.600",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 7,
-            "end_row_offset_idx": 8,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "L diesel tonne-1",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 7,
-            "end_row_offset_idx": 8,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "[42]",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 8,
-            "end_row_offset_idx": 9,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "\u00a0\u00a0\u00a0\u00a0Machinery for manure handling",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 8,
-            "end_row_offset_idx": 9,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "0.17",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 8,
-            "end_row_offset_idx": 9,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "kg mm kg-1",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 8,
-            "end_row_offset_idx": 9,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "[42]",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 9,
-            "end_row_offset_idx": 10,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "Milking and confinement",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 9,
-            "end_row_offset_idx": 10,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 9,
-            "end_row_offset_idx": 10,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 9,
-            "end_row_offset_idx": 10,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 10,
-            "end_row_offset_idx": 11,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "\u00a0\u00a0\u00a0\u00a0Electricity for milking",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 10,
-            "end_row_offset_idx": 11,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "0.06",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 10,
-            "end_row_offset_idx": 11,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "kWh (kg milk)-1",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 10,
-            "end_row_offset_idx": 11,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "[47]",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 11,
-            "end_row_offset_idx": 12,
-            "start_col_offset_idx": 0,
-            "end_col_offset_idx": 1,
-            "text": "\u00a0\u00a0\u00a0\u00a0Electricity for lightingd",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 11,
-            "end_row_offset_idx": 12,
-            "start_col_offset_idx": 1,
-            "end_col_offset_idx": 2,
-            "text": "75",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 11,
-            "end_row_offset_idx": 12,
-            "start_col_offset_idx": 2,
-            "end_col_offset_idx": 3,
-            "text": "kWh cow-1",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          },
-          {
-            "row_span": 1,
-            "col_span": 1,
-            "start_row_offset_idx": 11,
-            "end_row_offset_idx": 12,
-            "start_col_offset_idx": 3,
-            "end_col_offset_idx": 4,
-            "text": "[47]",
-            "column_header": false,
-            "row_header": false,
-            "row_section": false
-          }
-        ],
-        "num_rows": 12,
-        "num_cols": 4,
-        "grid": [
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 0,
-              "end_row_offset_idx": 1,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "Item",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 0,
-              "end_row_offset_idx": 1,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "Factor",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 0,
-              "end_row_offset_idx": 1,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "Unita",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 0,
-              "end_row_offset_idx": 1,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "References",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 1,
-              "end_row_offset_idx": 2,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "Production and transport of diesel",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 1,
-              "end_row_offset_idx": 2,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "0.374",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 1,
-              "end_row_offset_idx": 2,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "kg CO2e L-1",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 1,
-              "end_row_offset_idx": 2,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "[41]",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 2,
-              "end_row_offset_idx": 3,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "Emissions from diesel fuel combustion",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 2,
-              "end_row_offset_idx": 3,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "2.637",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 2,
-              "end_row_offset_idx": 3,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "kg CO2e L-1",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 2,
-              "end_row_offset_idx": 3,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "[41]",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 3,
-              "end_row_offset_idx": 4,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "Production of electricityb",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 3,
-              "end_row_offset_idx": 4,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "0.73",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 3,
-              "end_row_offset_idx": 4,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "kg CO2e kWh-1",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 3,
-              "end_row_offset_idx": 4,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "[41]",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 4,
-              "end_row_offset_idx": 5,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "Production of electricity (alternative)c",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 4,
-              "end_row_offset_idx": 5,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "0.205",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 4,
-              "end_row_offset_idx": 5,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "kg CO2e kWh-1",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 4,
-              "end_row_offset_idx": 5,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "[46]",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 5,
-              "end_row_offset_idx": 6,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "Production of machinery",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 5,
-              "end_row_offset_idx": 6,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "3.54",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 5,
-              "end_row_offset_idx": 6,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "kg CO2e (kg mm)-1",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 5,
-              "end_row_offset_idx": 6,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "[42]",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 6,
-              "end_row_offset_idx": 7,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "Manure handling",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 6,
-              "end_row_offset_idx": 7,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 6,
-              "end_row_offset_idx": 7,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 6,
-              "end_row_offset_idx": 7,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 7,
-              "end_row_offset_idx": 8,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "\u00a0\u00a0\u00a0\u00a0Fuel for manure handling",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 7,
-              "end_row_offset_idx": 8,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "0.600",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 7,
-              "end_row_offset_idx": 8,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "L diesel tonne-1",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 7,
-              "end_row_offset_idx": 8,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "[42]",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 8,
-              "end_row_offset_idx": 9,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "\u00a0\u00a0\u00a0\u00a0Machinery for manure handling",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 8,
-              "end_row_offset_idx": 9,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "0.17",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 8,
-              "end_row_offset_idx": 9,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "kg mm kg-1",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 8,
-              "end_row_offset_idx": 9,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "[42]",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 9,
-              "end_row_offset_idx": 10,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "Milking and confinement",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 9,
-              "end_row_offset_idx": 10,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 9,
-              "end_row_offset_idx": 10,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 9,
-              "end_row_offset_idx": 10,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 10,
-              "end_row_offset_idx": 11,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "\u00a0\u00a0\u00a0\u00a0Electricity for milking",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 10,
-              "end_row_offset_idx": 11,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "0.06",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 10,
-              "end_row_offset_idx": 11,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "kWh (kg milk)-1",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 10,
-              "end_row_offset_idx": 11,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "[47]",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ],
-          [
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 11,
-              "end_row_offset_idx": 12,
-              "start_col_offset_idx": 0,
-              "end_col_offset_idx": 1,
-              "text": "\u00a0\u00a0\u00a0\u00a0Electricity for lightingd",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 11,
-              "end_row_offset_idx": 12,
-              "start_col_offset_idx": 1,
-              "end_col_offset_idx": 2,
-              "text": "75",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 11,
-              "end_row_offset_idx": 12,
-              "start_col_offset_idx": 2,
-              "end_col_offset_idx": 3,
-              "text": "kWh cow-1",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            },
-            {
-              "row_span": 1,
-              "col_span": 1,
-              "start_row_offset_idx": 11,
-              "end_row_offset_idx": 12,
-              "start_col_offset_idx": 3,
-              "end_col_offset_idx": 4,
-              "text": "[47]",
-              "column_header": false,
-              "row_header": false,
-              "row_section": false
-            }
-          ]
-        ]
-      }
-    }
-  ],
-  "key_value_items": [],
-  "pages": {}
-}
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v2/pone.0234687.xml.md b/tests/data/groundtruth/docling_v2/pone.0234687.xml.md
index 0e9c0f02..f3a9a8d4 100644
--- a/tests/data/groundtruth/docling_v2/pone.0234687.xml.md
+++ b/tests/data/groundtruth/docling_v2/pone.0234687.xml.md
@@ -1,6 +1,8 @@
 # Potential to reduce greenhouse gas emissions through different dairy cattle systems in subtropical regions
 
-Ribeiro-Filho Henrique M. N.; 1: Department of Animal Science, University of California, Davis, California, United States of America, 2: Programa de Pós-graduação em Ciência Animal, Universidade do Estado de Santa Catarina, Lages, Santa Catarina, Brazil; Civiero Maurício; 2: Programa de Pós-graduação em Ciência Animal, Universidade do Estado de Santa Catarina, Lages, Santa Catarina, Brazil; Kebreab Ermias; 1: Department of Animal Science, University of California, Davis, California, United States of America
+Henrique M. N. Ribeiro-Filho, Maurício Civiero, Ermias Kebreab
+
+Department of Animal Science, University of California, Davis, California, United States of America; Programa de Pós-graduação em Ciência Animal, Universidade do Estado de Santa Catarina, Lages, Santa Catarina, Brazil
 
 ## Abstract
 
@@ -26,12 +28,33 @@ An LCA was developed according to the ISO standards [23,24] and Food and Agricul
 
 The goal of the study was to assess the C footprint of annual tropical and temperate pastures in lactating dairy cow diets. The production system was divided into four main processes: (i) animal husbandry, (ii) manure management and urine and dung deposited by grazing animals, (iii) production of feed ingredients and (iv) farm management (Fig 1). The study boundary included all processes up to the animal farm gate (cradle to gate), including secondary sources such as GHG emissions during the production of fuel, electricity, machinery, manufacturing of fertilizer, pesticides, seeds and plastic used in silage production. Fuel combustion and machinery (manufacture and repairs) for manure handling and electricity for milking and confinement were accounted as emissions from farm management. Emissions post milk production were assumed to be similar for all scenarios, therefore, activities including milk processing, distribution, retail or consumption were outside of the system boundary.
 
+Fig 1 Overview of the milk production system boundary considered in the study.
+
+<!-- image -->
+
 ### Functional unit
 
 The functional unit was one kilogram of energy-corrected milk (ECM) at the farm gate. All processes in the system were calculated based on one kilogram ECM. The ECM was calculated by multiplying milk production by the ratio of the energy content of the milk to the energy content of standard milk with 4% fat and 3.3% true protein according to NRC [20] as follows:
 
 ECM = Milk production × (0.0929 × fat% + 0.0588× true protein% + 0.192) / (0.0929 × (4%) + 0.0588 × (3.3%) + 0.192), where fat% and protein% are fat and protein percentages in milk, respectively. The average milk production and composition were recorded from the University of Santa Catarina State (Brazil) herd, considering 165 lactations between 2009 and 2018. The herd is predominantly Holstein × Jersey cows, with key characteristics described in Table 1.
 
+Table 1 Descriptive characteristics of the herd.
+
+| Item                          | Unit      | Average   |
+|-------------------------------|-----------|-----------|
+| Milking cows                  | #         | 165       |
+| Milk production               | kg year-1 | 7,015     |
+| Milk fat                      | %         | 4.0       |
+| Milk protein                  | %         | 3.3       |
+| Length of lactation           | days      | 305       |
+| Body weight                   | kg        | 553       |
+| Lactations per cow            | #         | 4         |
+| Replacement rate              | %         | 25        |
+| Cull rate                     | %         | 25        |
+| First artificial insemination | months    | 16        |
+| Weaned                        | days      | 60        |
+| Mortality                     | %         | 3.0       |
+
 ### Data sources and livestock system description
 
 The individual feed requirements, as well as the milk production responses based on feed strategies were based on data recorded from the herd described above and two experiments performed using lactating cows from the same herd. Due to the variation on herbage production throughout the year, feed requirements were estimated taking into consideration that livestock systems have a calving period in April, which represents the beginning of fall season in the southern Hemisphere. The experiments have shown a 10% reduction in ECM production in dairy cows that received both 75 and 50% of ad libitum TMR intake with access to grazing a tropical pasture (pearl-millet, Pennisetum glaucum ‘Campeiro’) compared to cows receiving ad libitum TMR intake. Cows grazing on a temperate pasture (ryegrass, Lolium multiflorum ‘Maximus’) did not need changes to ECM production compared to the ad libitum TMR intake group.
@@ -48,108 +71,7 @@ The CO2e emissions were calculated by multiplying the emissions of CO2, CH4 and
 
 The DM intake of each ingredient throughout the entire life of animals during lactation periods was calculated for each scenario: cows receiving only TMR, cows receiving 75% of TMR with annual pastures and cows receiving 50% of TMR with annual pastures (Table 2). In each of other phases of life (calf, heifer, dry cow), animals received the same diet, including a perennial tropical pasture (kikuyu grass, Pennisetum clandestinum). The DM intake of calves, heifers and dry cows was calculated assuming 2.8, 2.5 and 1.9% body weight, respectively [20]. In each case, the actual DM intake of concentrate and corn silage was recorded, and pasture DM intake was estimated by the difference between daily expected DM intake and actual DM intake of concentrate and corn silage. For lactating heifers and cows, TMR was formulated to meet the net energy for lactation (NEL) and metabolizable protein (MP) requirements of experimental animals, according to [28]. The INRA system was used because it is possible to estimate pasture DM intake taking into account the TMR intake, pasture management and the time of access to pasture using the GrazeIn model [29], which was integrated in the software INRAtion 4.07 (https://www.inration.educagri.fr/fr/forum.php). The nutrient intake was calculated as a product of TMR and pasture intake and the nutrient contents of TMR and pasture, respectively, which were determined in feed samples collected throughout the experiments.
 
-#### GHG emissions from crop and pasture production
-
-GHG emission factors used for off- and on-farm feed production were based on literature values, and are presented in Table 3. The emission factor used for corn grain is the average of emission factors observed in different levels of synthetic N fertilization [30]. The emission factor used for soybean is based on Brazilian soybean production [31]. The emissions used for corn silage, including feed processing (cutting, crushing and mixing), and annual or perennial grass productions were 3300 and 1500 kg CO2e ha-1, respectively [32]. The DM production (kg ha-1) of corn silage and pastures were based on regional and locally recorded data [33–36], assuming that animals are able to consume 70% of pastures during grazing.
-
-Emissions from on-farm feed production (corn silage and pasture) were estimated using primary and secondary sources based on the actual amount of each input (Table 4). Primary sources were direct and indirect N2O-N emissions from organic and synthetic fertilizers and crop/pasture residues, CO2-C emissions from lime and urea applications, as well as fuel combustion. The direct N2O-N emission factor (kg (kg N input)-1) is based on a local study performed previously [37]. For indirect N2O-N emissions (kg N2O-N (kg NH3-N + NOx)-1), as well as CO2-C emissions from lime + urea, default values proposed by IPCC [38] were used. For perennial pastures, a C sequestration of 0.57 t ha-1 was used based on a 9-year study conducted in southern Brazil [39]. Due to the use of conventional tillage, no C sequestration was considered for annual pastures. The amount of fuel required was 8.9 (no-tillage) and 14.3 L ha-1 (disking) for annual tropical and temperate pastures, respectively [40]. The CO2 from fuel combustion was 2.7 kg CO2 L-1 [41]. Secondary sources of emissions during the production of fuel, machinery, fertilizer, pesticides, seeds and plastic for ensilage were estimated using emission factors described by Rotz et al. [42].
-
-### Animal husbandry
-
-The CH4 emissions from enteric fermentation intensity (g (kg ECM)-1) was a function of estimated CH4 yield (g (kg DM intake)-1), actual DM intake and ECM. The enteric CH4 yield was estimated as a function of neutral detergent fiber (NDF) concentration on total DM intake, as proposed by Niu et al. [43], where: CH4 yield (g (kg DM intake)-1) = 13.8 + 0.185 × NDF (% DM intake).
-
-### Manure from confined cows and urine and dung from grazing animals
-
-The CH4 emission from manure (kg (kg ECM)-1) was a function of daily CH4 emission from manure (kg cow-1) and daily ECM (kg cow-1). The daily CH4 emission from manure was estimated according to IPCC [38], which considered daily volatile solid (VS) excreted (kg DM cow-1) in manure. The daily VS was estimated as proposed by Eugène et al. [44] as: VS = NDOMI + (UE × GE) × (OM/18.45), where: VS = volatile solid excretion on an organic matter (OM) basis (kg day-1), NDOMI = non-digestible OM intake (kg day-1): (1- OM digestibility) × OM intake, UE = urinary energy excretion as a fraction of GE (0.04), GE = gross energy intake (MJ day-1), OM = organic matter (g), 18.45 = conversion factor for dietary GE per kg of DM (MJ kg-1).
-
-The OM digestibility was estimated as a function of chemical composition, using equations published by INRA [21], which takes into account the effects of digestive interactions due to feeding level, the proportion of concentrate and rumen protein balance on OM digestibility. For scenarios where cows had access to grazing, the amount of calculated VS were corrected as a function of the time at pasture. The biodegradability of manure factor (0.13 for dairy cows in Latin America) and methane conversion factor (MCF) values were taken from IPCC [38]. The MCF values for pit storage below animal confinements (> 1 month) were used for the calculation, taking into account the annual average temperature (16.6ºC) or the average temperatures during the growth period of temperate (14.4ºC) or tropical (21ºC) annual pastures, which were 31%, 26% and 46%, respectively.
-
-The N2O-N emissions from urine and feces were estimated considering the proportion of N excreted as manure and storage or as urine and dung deposited by grazing animals. These proportions were calculated based on the proportion of daily time that animals stayed on pasture (7 h/24 h = 0.29) or confinement (1−0.29 = 0.71). For lactating heifers and cows, the total amount of N excreted was calculated by the difference between N intake and milk N excretion. For heifers and non-lactating cows, urinary and fecal N excretion were estimated as proposed by Reed et al. [45] (Table 3: equations 10 and 12, respectively). The N2O emissions from stored manure as well as urine and dung during grazing were calculated based on the conversion of N2O-N emissions to N2O emissions, where N2O emissions = N2O-N emissions × 44/28. The emission factors were 0.002 kg N2O-N (kg N)-1 stored in a pit below animal confinements, and 0.02 kg N2O-N (kg of urine and dung)-1 deposited on pasture [38]. The indirect N2O emissions from storage manure and urine and dung deposits on pasture were also estimated using the IPCC [38] emission factors.
-
-### Farm management
-
-Emissions due to farm management included those from fuel and machinery for manure handling and electricity for milking and confinement (Table 5). Emissions due to feed processing such as cutting, crushing, mixing and distributing, as well as secondary sources of emissions during the production of fuel, machinery, fertilizer, pesticides, seeds and plastic for ensilage were included in ‘Emissions from crop and pasture production’ section.
-
-The amount of fuel use for manure handling were estimated taking into consideration the amount of manure produced per cow and the amounts of fuel required for manure handling (L diesel t-1) [42]. The amount of manure was estimated from OM excretions (kg cow-1), assuming that the manure has 8% ash on DM basis and 60% DM content. The OM excretions were calculated by NDOMI × days in confinement × proportion of daily time that animals stayed on confinement.
-
-The emissions from fuel were estimated considering the primary (emissions from fuel burned) and secondary (emissions for producing and transporting fuel) emissions. The primary emissions were calculated by the amount of fuel required for manure handling (L) × (kg CO2e L-1) [41]. The secondary emissions from fuel were calculated by the amount of fuel required for manure handling × emissions for production and transport of fuel (kg CO2e L-1) [41]. Emissions from manufacture and repair of machinery for manure handling were estimated by manure produced per cow (t) × (kg machinery mass (kg manure)-1 × 10−3) [42] × kg CO2e (kg machinery mass)-1 [42].
-
-Emissions from electricity for milking and confinement were estimated using two emission factors (kg CO2 kWh-1). The first one is based on United States electricity matrix [41], and was used as a reference of an electricity matrix with less hydroelectric power than the region under study. The second is based on the Brazilian electricity matrix [46]. The electricity required for milking activities is 0.06 kWh (kg milk produced)-1 [47]. The annual electricity use for lighting was 75 kWh cow-1, which is the value considered for lactating cows in naturally ventilated barns [47].
-
-The lower impact of emissions from farm management is in agreement with other studies conducted in Europe [9, 62] and USA [42, 55], where the authors found that most emissions in dairy production systems are from enteric fermentation, feed production and emissions from excreta. As emissions from fuel for on-farm feed production were accounted into the ‘emissions from crop and pasture production’, total emissions from farm management were not greater than 5% of total C footprint.
-
-Emissions from farm management dropped when the emission factor for electricity generation was based on the Brazilian matrix. In this case, the emission factor for electricity generation (0.205 kg CO2e kWh-1 [46]) is much lower than that in a LCA study conducted in US (0.73 kg CO2e kWh-1 [42]). This apparent discrepancy is explained because in 2016, almost 66% of the electricity generated in Brazil was from hydropower, which has an emission factor of 0.074 kg CO2e kWh-1 against 0.382 and 0.926 kg CO2e kWh-1 produced by natural gas and hard coal, respectively [46].
-
-### Co-product allocation
-
-The C footprint for milk produced in the system was calculated using a biophysical allocation approach, as recommended by the International Dairy Federation [49], and described by Thoma et al. [48]. Briefly, ARmilk = 1–6.04 × BMR, where: ARmilk is the allocation ratio for milk and BMR is cow BW at the time of slaughter (kg) + calf BW sold (kg) divided by the total ECM produced during cow`s entire life (kg). The ARmilk were 0.854 and 0.849 for TMR and TMR with both pasture scenarios, respectively. The ARmilk was applied to the whole emissions, except for the electricity consumed for milking (milking parlor) and refrigerant loss, which was directly assigned to milk production.
-
-### Sensitivity analysis
-
-A sensitivity index was calculated as described by Rotz et al. [42]. The sensitivity index was defined for each emission source as the percentage change in the C footprint for a 10% change in the given emission source divided by 10%. Thus, a value near 0 indicates a low sensitivity, whereas an index near or greater than 1 indicates a high sensitivity because a change in this value causes a similar change in the footprint.
-
-## Results and discussion
-
-The study has assessed the impact of tropical and temperate pastures in dairy cows fed TMR on the C footprint of dairy production in subtropics. Different factors were taken in to consideration to estimate emissions from manure (or urine and dung) of grazing animals, feed production and electricity use.
-
-### Greenhouse gas emissions
-
-Depending on emission factors used for calculating emissions from urine and dung (IPCC or local data) and feed production (Tables 3 or 4), the C footprint was similar (Fig 2A and 2B) or decreased by 0.04 kg CO2e (kg ECM)-1 (Fig 2C and 2D) in scenarios that included pastures compared to ad libitum TMR intake. Due to differences in emission factors, the overall GHG emission values ranged from 0.92 to 1.04 kg CO2e (kg ECM)-1 for dairy cows receiving TMR exclusively, and from 0.88 to 1.04 kg CO2e (kg ECM)-1 for cows with access to pasture. Using IPCC emission factors [38], manure emissions increased as TMR intake went down (Fig 2A and 2B). However, using local emission factors for estimating N2O-N emissions [37], manure emissions decreased as TMR intake went down (Fig 2C and 2D). Regardless of emission factors used (Tables 3 or 4), emissions from feed production decreased to a small extent as the proportion of TMR intake decreased. Emissions from farm management did not contribute more than 5% of overall GHG emissions.
-
-Considering IPCC emission factors for N2O emissions from urine and dung [38] and those from Table 3, the C footprint ranged from 0.99 to 1.04 kg CO2e (kg ECM)-1, and was close to those reported under confined based systems in California [49], Canada [50], China [8], Ireland [9], different scenarios in Australia [51,52] and Uruguay [11], which ranged from 0.98 to 1.16 kg CO2e (kg ECM)-1. When local emission factors for N2O emissions from urine and dung [37] and those from Table 4 were taking into account, the C footprint for scenarios including pasture, without accounting for sequestered CO2-C from perennial pasture—0.91 kg CO2e (kg ECM)-1—was lower than the range of values described above. However, these values were still greater than high-performance confinement systems in UK and USA [53] or grass based dairy systems in Ireland [9,53] and New Zealand [8,54], which ranged from 0.52 to 0.89 kg CO2e (kg ECM)-1. Regardless of which emission factor was used, we found a lower C footprint in all conditions compared to scenarios with lower milk production per cow or in poor conditions of manure management, which ranged from 1.4 to 2.3 kg CO2e (kg ECM)-1 [8,55]. Thus, even though differences between studies may be partially explained by various assumptions (e.g., emission factors, co-product allocation, methane emissions estimation, sequestered CO2-C, etc.), herd productivity and manure management were systematically associated with the C footprint of the dairy systems.
-
-The similarity of C footprint between different scenarios using IPCC [38] for estimating emissions from manure and for emissions from feed production (Table 3) was a consequence of the trade-off between greater manure emissions and lower emissions to produce feed, as the proportion of pasture in diets increased. Additionally, the small negative effect of pasture on ECM production also contributed to the trade-off. The impact of milk production on the C footprint was reported in a meta-analysis comprising 30 studies from 15 different countries [22]. As observed in this study (Fig 2A and 2B) the authors reported no significant difference between the C footprint of pasture-based vs. confinement systems. However, they observed that an increase of 1000 kg cow-1 (5000 to 6000 kg ECM) reduced the C footprint by 0.12 kg CO2e (kg ECM)-1, which may explain an apparent discrepancy between our study and an LCA performed in south Brazilian conditions [56]. Their study compared a confinement and a grazing-based dairy system with annual average milk production of 7667 and 5535 kg cow, respectively. In this study, the same herd was used in all systems, with an annual average milk production of around 7000 kg cow-1. Experimental data showed a reduction not greater than 3% of ECM when 50% of TMR was replaced by pasture access.
-
-The lower C footprint in scenarios with access to pasture, when local emission factors [37] were used for N2O emissions from urine and dung and for feed production (Table 4), may also be partially attributed to the small negative effect of pasture on ECM production. Nevertheless, local emission factors for urine and dung had a great impact on scenarios including pastures compared to ad libitum TMR intake. Whereas the IPCC [38] considers an emission of 0.02 kg N2O-N (kg N)-1 for urine and dung from grazing animals, experimental evidence shows that it may be up to five times lower, averaging 0.004 kg N2O-N kg-1 [37].
-
-### Methane emissions
-
-The enteric CH4 intensity was similar between different scenarios (Fig 2), showing the greatest sensitivity index, with values ranging from 0.53 to 0.62, which indicate that for a 10% change in this source, the C footprint may change between 5.3 and 6.2% (Fig 3). The large effect of enteric CH4 emissions on the whole C footprint was expected, because the impact of enteric CH4 on GHG emissions of milk production in different dairy systems has been estimated to range from 44 to 60% of the total CO2e [50,52,57,58]. However, emissions in feed production may be the most important source of GHG when emission factors for producing concentrate feeds are greater than 0.7 kg CO2e kg-1 [59], which did not happen in this study.
-
-The lack of difference in enteric CH4 emissions in different systems can be explained by the narrow range of NDF content in diets (<4% difference). This non-difference is due to the lower NDF content of annual temperate pastures (495 g (kg DM)-1) compared to corn silage (550 g (kg DM)-1). Hence, an expected, increase NDF content with decreased concentrate was partially offset by an increase in the pasture proportion relatively low in NDF. This is in agreement with studies conducted in southern Brazil, which have shown that the actual enteric CH4 emissions may decrease with inclusion of temperate pastures in cows receiving corn silage and soybean meal [60] or increase enteric CH4 emissions when dairy cows grazing a temperate pasture was supplemented with corn silage [61]. Additionally, enteric CH4 emissions did not differ between dairy cows receiving TMR exclusively or grazing a tropical pasture in the same scenarios as in this study [26].
-
-### Emissions from excreta and feed production
-
-Using IPCC emission factors for N2O emissions from urine and dung [38] and those from Table 3, CH4 emissions from manure decreased 0.07 kg CO2e (kg ECM)-1, but N2O emissions from manure increased 0.09 kg CO2e (kg ECM)-1, as TMR intake was restricted to 50% ad libitum (Fig 4A). Emissions for pastures increased by 0.06 kg CO2e (kg ECM)-1, whereas emissions for producing concentrate feeds and corn silage decreased by 0.09 kg CO2e (kg ECM)-1, as TMR intake decreased (Fig 4B). In this situation, the lack of difference in calculated C footprints of different systems was also due to the greater emissions from manure, and offset by lower emissions from feed production with inclusion of pasture in lactating dairy cow diets. The greater N2O-N emissions from manure with pasture was a consequence of higher N2O-N emissions due to greater CP content and N urine excretion, as pasture intake increased. The effect of CP content on urine N excretion has been shown by several authors in lactating dairy cows [62–64]. For instance, by decreasing CP content from 185 to 152 g (kg DM)-1, N intake decreased by 20% and urine N excretion by 60% [62]. In this study, the CP content for lactating dairy cows ranged from 150 g (kg DM)-1 on TMR system to 198 g (kg DM)-1 on 50% TMR with pasture. Additionally, greater urine N excretion is expected with greater use of pasture. This occurs because protein utilization in pastures is inefficient, as the protein in fresh forages is highly degradable in the rumen and may not be captured by microbes [65].
-
-Using local emission factors for N2O emissions from urine and dung [37] and those from Table 4, reductions in CH4 emissions from stocked manure, when pastures were included on diets, did not offset by increases in N2O emissions from excreta (Fig 4C). In this case, total emissions from manure (Fig 4C) and feed production (Fig 4D) decreased with the inclusion of pasture. The impact of greater CP content and N urine excretion with increased pasture intake was offset by the much lower emission factors used for N2O emissions from urine and dung. As suggested by other authors [66,67], these results show that IPCC default value may need to be revised for the subtropical region.
-
-Emissions for feed production decreased when pasture was included due to the greater emission factor for corn grain production compared to pastures. Emissions from concentrate and silage had at least twice the sensitivity index compared to emissions from pastures. The amount of grain required per cow in a lifetime decreased from 7,300 kg to 4,000 kg when 50% of TMR was replaced by pasture access. These results are in agreement with other studies which found lower C footprint, as concentrate use is reduced and/or pasture is included [9,68,69]. Moreover, it has been demonstrated that in intensive dairy systems, after enteric fermentation, feed production is the second main contributor to C footprint [50]. There is potential to decrease the environmental impact of dairy systems by reducing the use of concentrate ingredients with high environmental impact, particularly in confinements [9].
-
-### Assumptions and limitations
-
-The milk production and composition data are the average for a typical herd, which might have great animal-to-animal variability. Likewise, DM yield of crops and pastures were collected from experimental observations, and may change as a function of inter-annual variation, climatic conditions, soil type, fertilization level etc. The emission factors for direct and indirect N2O emissions from urine and dung were alternatively estimated using local data, but more experiments are necessary to reduce the uncertainty. The CO2 emitted from lime and urea application was estimated from IPCC default values, which may not represent emissions in subtropical conditions. This LCA may be improved by reducing the uncertainty of factors for estimating emissions from excreta and feed production, including the C sequestration or emissions as a function of soil management.
-
-### Further considerations
-
-The potential for using pasture can reduce the C footprint because milk production kept pace with animal confinement. However, if milk production is to decrease with lower TMR intake and inclusion of pasture [19], the C footprint would be expected to increase. Lorenz et al. [22] showed that an increase in milk yield from 5,000 to 6,000 kg ECM reduced the C footprint by 0.12 kg CO2e (kg ECM)-1, whereas an increase from 10,000 to 11,000 kg ECM reduced the C footprint by only 0.06 kg CO2e (kg ECM)-1. Hence, the impact of increasing milk production on decreasing C footprint is not linear, and mitigation measures, such as breeding for increased genetic yield potential and increasing concentrate ratio in the diet, are potentially harmful for animal’s health and welfare [70]. For instance, increasing concentrate ratio potentially increases the occurrence of subclinical ketosis and foot lesions, and C footprint may increase by 0.03 kg CO2e (kg ECM)-1 in subclinical ketosis [71] and by 0.02 kg CO2e (kg ECM)-1 in case of foot lesions [72].
-
-Grazing lands may also improve biodiversity [73]. Strategies such as zero tillage may increase stocks of soil C [74]. This study did not consider C sequestration during the growth of annual pastures, because it was assumed these grasses were planted with tillage, having a balance between C sequestration and C emissions [38]. Considering the C sequestration from no-tillage perennial pasture, the amount of C sequestration will more than compensates for C emitted. These results are in agreement with other authors who have shown that a reduction or elimination of soil tillage increases annual soil C sequestration in subtropical areas by 0.5 to 1.5 t ha-1 [75]. If 50% of tilled areas were under perennial grasslands, 1.0 t C ha-1 would be sequestered, further reducing the C footprint by 0.015 and 0.025 kg CO2e (kg ECM)-1 for the scenarios using 75 and 50% TMR, respectively. Eliminating tillage, the reduction on total GHG emissions would be 0.03 and 0.05 kg CO2e (kg ECM)-1 for 75 and 50% TMR, respectively. However, this approach may be controversial because lands which have been consistently managed for decades have approached steady state C storage, so that net exchange of CO2 would be negligible [76].
-
-## Conclusions
-
-This study assessed the C footprint of dairy cattle systems with or without access to pastures. Including pastures showed potential to maintain or decrease to a small extent the C footprint, which may be attributable to the evidence of low N2O emissions from urine and dung in dairy systems in subtropical areas. Even though the enteric CH4 intensity was the largest source of CO2e emissions, it did not change between different scenarios due to the narrow range of NDF content in diets and maintaining the same milk production with or without access to pastures.
-
-## Tables
-
-Table 1: Descriptive characteristics of the herd.
-
-| Item                          | Unit      | Average   |
-|-------------------------------|-----------|-----------|
-| Milking cows                  | #         | 165       |
-| Milk production               | kg year-1 | 7,015     |
-| Milk fat                      | %         | 4.0       |
-| Milk protein                  | %         | 3.3       |
-| Length of lactation           | days      | 305       |
-| Body weight                   | kg        | 553       |
-| Lactations per cow            | #         | 4         |
-| Replacement rate              | %         | 25        |
-| Cull rate                     | %         | 25        |
-| First artificial insemination | months    | 16        |
-| Weaned                        | days      | 60        |
-| Mortality                     | %         | 3.0       |
-
-Table 2: Dairy cows’ diets in different scenariosa.
+Table 2 Dairy cows’ diets in different scenariosa.
 
 |                                   | Calf                              | Calf                              | Pregnant/dry                      | Pregnant/dry                      | Lactation                         | Lactation                         | Lactation                         | Weighted average                  | Weighted average                  | Weighted average                  |
 |-----------------------------------|-----------------------------------|-----------------------------------|-----------------------------------|-----------------------------------|-----------------------------------|-----------------------------------|-----------------------------------|-----------------------------------|-----------------------------------|-----------------------------------|
@@ -174,7 +96,11 @@ Table 2: Dairy cows’ diets in different scenariosa.
 | NEL, Mcal (kg DM)-1               | 1.96                              | 1.69                              | 1.63                              | 1.44                              | 1.81                              | 1.78                              | 1.74                              | 1.8                               | 1.8                               | 1.7                               |
 | MP, g (kg DM)-1                   | 111                               | 93.6                              | 97.6                              | 90.0                              | 95.0                              | 102                               | 102                               | 97.5                              | 102                               | 101                               |
 
-Table 3: GHG emission factors for Off- and On-farm feed production.
+#### GHG emissions from crop and pasture production
+
+GHG emission factors used for off- and on-farm feed production were based on literature values, and are presented in Table 3. The emission factor used for corn grain is the average of emission factors observed in different levels of synthetic N fertilization [30]. The emission factor used for soybean is based on Brazilian soybean production [31]. The emissions used for corn silage, including feed processing (cutting, crushing and mixing), and annual or perennial grass productions were 3300 and 1500 kg CO2e ha-1, respectively [32]. The DM production (kg ha-1) of corn silage and pastures were based on regional and locally recorded data [33–36], assuming that animals are able to consume 70% of pastures during grazing.
+
+Table 3 GHG emission factors for Off- and On-farm feed production.
 
 | Feed             | DM yield (kg ha-1)   | Emission factor   | Unita                | References   |
 |------------------|----------------------|-------------------|----------------------|--------------|
@@ -187,7 +113,9 @@ Table 3: GHG emission factors for Off- and On-farm feed production.
 | Pearl milletd    | 11,000               | 0.195             | kg CO2e (kg DM)-1    | [32,35]      |
 | Kikuyu grasse    | 9,500                | 0.226             | kg CO2e (kg DM)-1    | [32,36]      |
 
-Table 4: GHG emissions from On-farm feed production.
+Emissions from on-farm feed production (corn silage and pasture) were estimated using primary and secondary sources based on the actual amount of each input (Table 4). Primary sources were direct and indirect N2O-N emissions from organic and synthetic fertilizers and crop/pasture residues, CO2-C emissions from lime and urea applications, as well as fuel combustion. The direct N2O-N emission factor (kg (kg N input)-1) is based on a local study performed previously [37]. For indirect N2O-N emissions (kg N2O-N (kg NH3-N + NOx)-1), as well as CO2-C emissions from lime + urea, default values proposed by IPCC [38] were used. For perennial pastures, a C sequestration of 0.57 t ha-1 was used based on a 9-year study conducted in southern Brazil [39]. Due to the use of conventional tillage, no C sequestration was considered for annual pastures. The amount of fuel required was 8.9 (no-tillage) and 14.3 L ha-1 (disking) for annual tropical and temperate pastures, respectively [40]. The CO2 from fuel combustion was 2.7 kg CO2 L-1 [41]. Secondary sources of emissions during the production of fuel, machinery, fertilizer, pesticides, seeds and plastic for ensilage were estimated using emission factors described by Rotz et al. [42].
+
+Table 4 GHG emissions from On-farm feed production.
 
 | Item                                      | Corn silage   | Annual temperate pasture   | Annual tropical pasture   | Perennial tropical pasture   |
 |-------------------------------------------|---------------|----------------------------|---------------------------|------------------------------|
@@ -219,7 +147,23 @@ Table 4: GHG emissions from On-farm feed production.
 | kg CO2e ha-1 (emitted—sequestered)        | 1833          | 964                        | 1130                      | -245                         |
 | Emission factor, kg CO2e (kg DM)-1i       | 0.115         | 0.145                      | 0.147                     | -0.037                       |
 
-Table 5: Factors for major resource inputs in farm management.
+### Animal husbandry
+
+The CH4 emissions from enteric fermentation intensity (g (kg ECM)-1) was a function of estimated CH4 yield (g (kg DM intake)-1), actual DM intake and ECM. The enteric CH4 yield was estimated as a function of neutral detergent fiber (NDF) concentration on total DM intake, as proposed by Niu et al. [43], where: CH4 yield (g (kg DM intake)-1) = 13.8 + 0.185 × NDF (% DM intake).
+
+### Manure from confined cows and urine and dung from grazing animals
+
+The CH4 emission from manure (kg (kg ECM)-1) was a function of daily CH4 emission from manure (kg cow-1) and daily ECM (kg cow-1). The daily CH4 emission from manure was estimated according to IPCC [38], which considered daily volatile solid (VS) excreted (kg DM cow-1) in manure. The daily VS was estimated as proposed by Eugène et al. [44] as: VS = NDOMI + (UE × GE) × (OM/18.45), where: VS = volatile solid excretion on an organic matter (OM) basis (kg day-1), NDOMI = non-digestible OM intake (kg day-1): (1- OM digestibility) × OM intake, UE = urinary energy excretion as a fraction of GE (0.04), GE = gross energy intake (MJ day-1), OM = organic matter (g), 18.45 = conversion factor for dietary GE per kg of DM (MJ kg-1).
+
+The OM digestibility was estimated as a function of chemical composition, using equations published by INRA [21], which takes into account the effects of digestive interactions due to feeding level, the proportion of concentrate and rumen protein balance on OM digestibility. For scenarios where cows had access to grazing, the amount of calculated VS were corrected as a function of the time at pasture. The biodegradability of manure factor (0.13 for dairy cows in Latin America) and methane conversion factor (MCF) values were taken from IPCC [38]. The MCF values for pit storage below animal confinements (&gt; 1 month) were used for the calculation, taking into account the annual average temperature (16.6ºC) or the average temperatures during the growth period of temperate (14.4ºC) or tropical (21ºC) annual pastures, which were 31%, 26% and 46%, respectively.
+
+The N2O-N emissions from urine and feces were estimated considering the proportion of N excreted as manure and storage or as urine and dung deposited by grazing animals. These proportions were calculated based on the proportion of daily time that animals stayed on pasture (7 h/24 h = 0.29) or confinement (1−0.29 = 0.71). For lactating heifers and cows, the total amount of N excreted was calculated by the difference between N intake and milk N excretion. For heifers and non-lactating cows, urinary and fecal N excretion were estimated as proposed by Reed et al. [45] (Table 3: equations 10 and 12, respectively). The N2O emissions from stored manure as well as urine and dung during grazing were calculated based on the conversion of N2O-N emissions to N2O emissions, where N2O emissions = N2O-N emissions × 44/28. The emission factors were 0.002 kg N2O-N (kg N)-1 stored in a pit below animal confinements, and 0.02 kg N2O-N (kg of urine and dung)-1 deposited on pasture [38]. The indirect N2O emissions from storage manure and urine and dung deposits on pasture were also estimated using the IPCC [38] emission factors.
+
+### Farm management
+
+Emissions due to farm management included those from fuel and machinery for manure handling and electricity for milking and confinement (Table 5). Emissions due to feed processing such as cutting, crushing, mixing and distributing, as well as secondary sources of emissions during the production of fuel, machinery, fertilizer, pesticides, seeds and plastic for ensilage were included in ‘Emissions from crop and pasture production’ section.
+
+Table 5 Factors for major resource inputs in farm management.
 
 | Item                                     | Factor   | Unita             | References   |
 |------------------------------------------|----------|-------------------|--------------|
@@ -235,102 +179,159 @@ Table 5: Factors for major resource inputs in farm management.
 | Electricity for milking                  | 0.06     | kWh (kg milk)-1   | [47]         |
 | Electricity for lightingd                | 75       | kWh cow-1         | [47]         |
 
-## Figures
+The amount of fuel use for manure handling were estimated taking into consideration the amount of manure produced per cow and the amounts of fuel required for manure handling (L diesel t-1) [42]. The amount of manure was estimated from OM excretions (kg cow-1), assuming that the manure has 8% ash on DM basis and 60% DM content. The OM excretions were calculated by NDOMI × days in confinement × proportion of daily time that animals stayed on confinement.
 
-Fig 1: Overview of the milk production system boundary considered in the study.
+The emissions from fuel were estimated considering the primary (emissions from fuel burned) and secondary (emissions for producing and transporting fuel) emissions. The primary emissions were calculated by the amount of fuel required for manure handling (L) × (kg CO2e L-1) [41]. The secondary emissions from fuel were calculated by the amount of fuel required for manure handling × emissions for production and transport of fuel (kg CO2e L-1) [41]. Emissions from manufacture and repair of machinery for manure handling were estimated by manure produced per cow (t) × (kg machinery mass (kg manure)-1 × 10−3) [42] × kg CO2e (kg machinery mass)-1 [42].
+
+Emissions from electricity for milking and confinement were estimated using two emission factors (kg CO2 kWh-1). The first one is based on United States electricity matrix [41], and was used as a reference of an electricity matrix with less hydroelectric power than the region under study. The second is based on the Brazilian electricity matrix [46]. The electricity required for milking activities is 0.06 kWh (kg milk produced)-1 [47]. The annual electricity use for lighting was 75 kWh cow-1, which is the value considered for lactating cows in naturally ventilated barns [47].
+
+### Co-product allocation
+
+The C footprint for milk produced in the system was calculated using a biophysical allocation approach, as recommended by the International Dairy Federation [49], and described by Thoma et al. [48]. Briefly, ARmilk = 1–6.04 × BMR, where: ARmilk is the allocation ratio for milk and BMR is cow BW at the time of slaughter (kg) + calf BW sold (kg) divided by the total ECM produced during cow`s entire life (kg). The ARmilk were 0.854 and 0.849 for TMR and TMR with both pasture scenarios, respectively. The ARmilk was applied to the whole emissions, except for the electricity consumed for milking (milking parlor) and refrigerant loss, which was directly assigned to milk production.
+
+### Sensitivity analysis
+
+A sensitivity index was calculated as described by Rotz et al. [42]. The sensitivity index was defined for each emission source as the percentage change in the C footprint for a 10% change in the given emission source divided by 10%. Thus, a value near 0 indicates a low sensitivity, whereas an index near or greater than 1 indicates a high sensitivity because a change in this value causes a similar change in the footprint.
+
+## Results and discussion
+
+The study has assessed the impact of tropical and temperate pastures in dairy cows fed TMR on the C footprint of dairy production in subtropics. Different factors were taken in to consideration to estimate emissions from manure (or urine and dung) of grazing animals, feed production and electricity use.
+
+### Greenhouse gas emissions
+
+Depending on emission factors used for calculating emissions from urine and dung (IPCC or local data) and feed production (Tables 3 or 4), the C footprint was similar (Fig 2A and 2B) or decreased by 0.04 kg CO2e (kg ECM)-1 (Fig 2C and 2D) in scenarios that included pastures compared to ad libitum TMR intake. Due to differences in emission factors, the overall GHG emission values ranged from 0.92 to 1.04 kg CO2e (kg ECM)-1 for dairy cows receiving TMR exclusively, and from 0.88 to 1.04 kg CO2e (kg ECM)-1 for cows with access to pasture. Using IPCC emission factors [38], manure emissions increased as TMR intake went down (Fig 2A and 2B). However, using local emission factors for estimating N2O-N emissions [37], manure emissions decreased as TMR intake went down (Fig 2C and 2D). Regardless of emission factors used (Tables 3 or 4), emissions from feed production decreased to a small extent as the proportion of TMR intake decreased. Emissions from farm management did not contribute more than 5% of overall GHG emissions.
+
+Fig 2 Overall greenhouse gas emissions in dairy cattle systems under various scenarios. TMR = ad libitum TMR intake, 75TMR = 75% of ad libitum TMR intake with access to pasture, 50TMR = 50% of ad libitum TMR intake with access to pasture. (a) N2O emission factors for urine and dung from IPCC [38], feed production emission factors from Table 3 without accounting for sequestered CO2-C from perennial pasture, production of electricity = 0.73 kg CO2e kWh-1 [41]. (b) N2O emission factors for urine and dung from IPCC [38], feed production emission factors from Table 3 without accounting for sequestered CO2-C from perennial pasture, production of electricity = 0.205 kg CO2e kWh-1 [46]; (c) N2O emission factors for urine and dung from local data [37], feed production EF from Table 4 without accounting for sequestered CO2-C from perennial pasture, production of electricity = 0.205 kg CO2e kWh-1 [46]. (d) N2O emission factors for urine and dung from local data [37], feed production emission factors from Table 4 accounting for sequestered CO2-C from perennial pasture, production of electricity = 0.205 kg CO2e kWh-1 [46].
 
 <!-- image -->
 
-Fig 2: Overall greenhouse gas emissions in dairy cattle systems under various scenarios.
-TMR = ad libitum TMR intake, 75TMR = 75% of ad libitum TMR intake with access to pasture, 50TMR = 50% of ad libitum TMR intake with access to pasture. (a) N2O emission factors for urine and dung from IPCC [38], feed production emission factors from Table 3 without accounting for sequestered CO2-C from perennial pasture, production of electricity = 0.73 kg CO2e kWh-1 [41]. (b) N2O emission factors for urine and dung from IPCC [38], feed production emission factors from Table 3 without accounting for sequestered CO2-C from perennial pasture, production of electricity = 0.205 kg CO2e kWh-1 [46]; (c) N2O emission factors for urine and dung from local data [37], feed production EF from Table 4 without accounting for sequestered CO2-C from perennial pasture, production of electricity = 0.205 kg CO2e kWh-1 [46]. (d) N2O emission factors for urine and dung from local data [37], feed production emission factors from Table 4 accounting for sequestered CO2-C from perennial pasture, production of electricity = 0.205 kg CO2e kWh-1 [46].
+Considering IPCC emission factors for N2O emissions from urine and dung [38] and those from Table 3, the C footprint ranged from 0.99 to 1.04 kg CO2e (kg ECM)-1, and was close to those reported under confined based systems in California [49], Canada [50], China [8], Ireland [9], different scenarios in Australia [51,52] and Uruguay [11], which ranged from 0.98 to 1.16 kg CO2e (kg ECM)-1. When local emission factors for N2O emissions from urine and dung [37] and those from Table 4 were taking into account, the C footprint for scenarios including pasture, without accounting for sequestered CO2-C from perennial pasture—0.91 kg CO2e (kg ECM)-1—was lower than the range of values described above. However, these values were still greater than high-performance confinement systems in UK and USA [53] or grass based dairy systems in Ireland [9,53] and New Zealand [8,54], which ranged from 0.52 to 0.89 kg CO2e (kg ECM)-1. Regardless of which emission factor was used, we found a lower C footprint in all conditions compared to scenarios with lower milk production per cow or in poor conditions of manure management, which ranged from 1.4 to 2.3 kg CO2e (kg ECM)-1 [8,55]. Thus, even though differences between studies may be partially explained by various assumptions (e.g., emission factors, co-product allocation, methane emissions estimation, sequestered CO2-C, etc.), herd productivity and manure management were systematically associated with the C footprint of the dairy systems.
+
+The similarity of C footprint between different scenarios using IPCC [38] for estimating emissions from manure and for emissions from feed production (Table 3) was a consequence of the trade-off between greater manure emissions and lower emissions to produce feed, as the proportion of pasture in diets increased. Additionally, the small negative effect of pasture on ECM production also contributed to the trade-off. The impact of milk production on the C footprint was reported in a meta-analysis comprising 30 studies from 15 different countries [22]. As observed in this study (Fig 2A and 2B) the authors reported no significant difference between the C footprint of pasture-based vs. confinement systems. However, they observed that an increase of 1000 kg cow-1 (5000 to 6000 kg ECM) reduced the C footprint by 0.12 kg CO2e (kg ECM)-1, which may explain an apparent discrepancy between our study and an LCA performed in south Brazilian conditions [56]. Their study compared a confinement and a grazing-based dairy system with annual average milk production of 7667 and 5535 kg cow, respectively. In this study, the same herd was used in all systems, with an annual average milk production of around 7000 kg cow-1. Experimental data showed a reduction not greater than 3% of ECM when 50% of TMR was replaced by pasture access.
+
+The lower C footprint in scenarios with access to pasture, when local emission factors [37] were used for N2O emissions from urine and dung and for feed production (Table 4), may also be partially attributed to the small negative effect of pasture on ECM production. Nevertheless, local emission factors for urine and dung had a great impact on scenarios including pastures compared to ad libitum TMR intake. Whereas the IPCC [38] considers an emission of 0.02 kg N2O-N (kg N)-1 for urine and dung from grazing animals, experimental evidence shows that it may be up to five times lower, averaging 0.004 kg N2O-N kg-1 [37].
+
+### Methane emissions
+
+The enteric CH4 intensity was similar between different scenarios (Fig 2), showing the greatest sensitivity index, with values ranging from 0.53 to 0.62, which indicate that for a 10% change in this source, the C footprint may change between 5.3 and 6.2% (Fig 3). The large effect of enteric CH4 emissions on the whole C footprint was expected, because the impact of enteric CH4 on GHG emissions of milk production in different dairy systems has been estimated to range from 44 to 60% of the total CO2e [50,52,57,58]. However, emissions in feed production may be the most important source of GHG when emission factors for producing concentrate feeds are greater than 0.7 kg CO2e kg-1 [59], which did not happen in this study.
+
+Fig 3 Sensitivity of the C footprint. Sensitivity index = percentage change in C footprint for a 10% change in the given emission source divided by 10% of. (a) N2O emission factors for urine and dung from IPCC [38], feed production emission factors from Table 3, production of electricity = 0.73 kg CO2e kWh-1 [41]. (b) N2O emission factors for urine and dung from IPCC [38], feed production emission factors from Table 3, production of electricity = 0.205 kg CO2e kWh-1 [46]; (c) N2O emission factors for urine and dung from local data [37], feed production EF from Table 4 without accounting sequestered CO2-C from perennial pasture, production of electricity = 0.205 kg CO2e kWh-1 [46]. (d) N2O emission factors for urine and dung from local data [37], feed production emission factors from Table 4 accounting sequestered CO2-C from perennial pasture, production of electricity = 0.205 kg CO2e kWh-1 [46].
 
 <!-- image -->
 
-Fig 3: Sensitivity of the C footprint.
-Sensitivity index = percentage change in C footprint for a 10% change in the given emission source divided by 10% of. (a) N2O emission factors for urine and dung from IPCC [38], feed production emission factors from Table 3, production of electricity = 0.73 kg CO2e kWh-1 [41]. (b) N2O emission factors for urine and dung from IPCC [38], feed production emission factors from Table 3, production of electricity = 0.205 kg CO2e kWh-1 [46]; (c) N2O emission factors for urine and dung from local data [37], feed production EF from Table 4 without accounting sequestered CO2-C from perennial pasture, production of electricity = 0.205 kg CO2e kWh-1 [46]. (d) N2O emission factors for urine and dung from local data [37], feed production emission factors from Table 4 accounting sequestered CO2-C from perennial pasture, production of electricity = 0.205 kg CO2e kWh-1 [46].
+The lack of difference in enteric CH4 emissions in different systems can be explained by the narrow range of NDF content in diets (&lt;4% difference). This non-difference is due to the lower NDF content of annual temperate pastures (495 g (kg DM)-1) compared to corn silage (550 g (kg DM)-1). Hence, an expected, increase NDF content with decreased concentrate was partially offset by an increase in the pasture proportion relatively low in NDF. This is in agreement with studies conducted in southern Brazil, which have shown that the actual enteric CH4 emissions may decrease with inclusion of temperate pastures in cows receiving corn silage and soybean meal [60] or increase enteric CH4 emissions when dairy cows grazing a temperate pasture was supplemented with corn silage [61]. Additionally, enteric CH4 emissions did not differ between dairy cows receiving TMR exclusively or grazing a tropical pasture in the same scenarios as in this study [26].
+
+### Emissions from excreta and feed production
+
+Using IPCC emission factors for N2O emissions from urine and dung [38] and those from Table 3, CH4 emissions from manure decreased 0.07 kg CO2e (kg ECM)-1, but N2O emissions from manure increased 0.09 kg CO2e (kg ECM)-1, as TMR intake was restricted to 50% ad libitum (Fig 4A). Emissions for pastures increased by 0.06 kg CO2e (kg ECM)-1, whereas emissions for producing concentrate feeds and corn silage decreased by 0.09 kg CO2e (kg ECM)-1, as TMR intake decreased (Fig 4B). In this situation, the lack of difference in calculated C footprints of different systems was also due to the greater emissions from manure, and offset by lower emissions from feed production with inclusion of pasture in lactating dairy cow diets. The greater N2O-N emissions from manure with pasture was a consequence of higher N2O-N emissions due to greater CP content and N urine excretion, as pasture intake increased. The effect of CP content on urine N excretion has been shown by several authors in lactating dairy cows [62–64]. For instance, by decreasing CP content from 185 to 152 g (kg DM)-1, N intake decreased by 20% and urine N excretion by 60% [62]. In this study, the CP content for lactating dairy cows ranged from 150 g (kg DM)-1 on TMR system to 198 g (kg DM)-1 on 50% TMR with pasture. Additionally, greater urine N excretion is expected with greater use of pasture. This occurs because protein utilization in pastures is inefficient, as the protein in fresh forages is highly degradable in the rumen and may not be captured by microbes [65].
+
+Fig 4 Greenhouse gas emissions (GHG) from manure and feed production in dairy cattle systems. TMR = ad libitum TMR intake, 75TMR = 75% of ad libitum TMR intake with access to pasture, 50TMR = 50% of ad libitum TMR intake with access to pasture. (a) N2O emission factors for urine and dung from IPCC [38]. (b) Feed production emission factors from Table 3. (c) N2O emission factors for urine and dung from local data [37]. (d) Feed production emission factors from Table 4 accounting sequestered CO2-C from perennial pasture.
 
 <!-- image -->
 
-Fig 4: Greenhouse gas emissions (GHG) from manure and feed production in dairy cattle systems.
-TMR = ad libitum TMR intake, 75TMR = 75% of ad libitum TMR intake with access to pasture, 50TMR = 50% of ad libitum TMR intake with access to pasture. (a) N2O emission factors for urine and dung from IPCC [38]. (b) Feed production emission factors from Table 3. (c) N2O emission factors for urine and dung from local data [37]. (d) Feed production emission factors from Table 4 accounting sequestered CO2-C from perennial pasture.
+Using local emission factors for N2O emissions from urine and dung [37] and those from Table 4, reductions in CH4 emissions from stocked manure, when pastures were included on diets, did not offset by increases in N2O emissions from excreta (Fig 4C). In this case, total emissions from manure (Fig 4C) and feed production (Fig 4D) decreased with the inclusion of pasture. The impact of greater CP content and N urine excretion with increased pasture intake was offset by the much lower emission factors used for N2O emissions from urine and dung. As suggested by other authors [66,67], these results show that IPCC default value may need to be revised for the subtropical region.
 
-<!-- image -->
+Emissions for feed production decreased when pasture was included due to the greater emission factor for corn grain production compared to pastures. Emissions from concentrate and silage had at least twice the sensitivity index compared to emissions from pastures. The amount of grain required per cow in a lifetime decreased from 7,300 kg to 4,000 kg when 50% of TMR was replaced by pasture access. These results are in agreement with other studies which found lower C footprint, as concentrate use is reduced and/or pasture is included [9,68,69]. Moreover, it has been demonstrated that in intensive dairy systems, after enteric fermentation, feed production is the second main contributor to C footprint [50]. There is potential to decrease the environmental impact of dairy systems by reducing the use of concentrate ingredients with high environmental impact, particularly in confinements [9].
+
+### Farm management
+
+The lower impact of emissions from farm management is in agreement with other studies conducted in Europe [9, 62] and USA [42, 55], where the authors found that most emissions in dairy production systems are from enteric fermentation, feed production and emissions from excreta. As emissions from fuel for on-farm feed production were accounted into the ‘emissions from crop and pasture production’, total emissions from farm management were not greater than 5% of total C footprint.
+
+Emissions from farm management dropped when the emission factor for electricity generation was based on the Brazilian matrix. In this case, the emission factor for electricity generation (0.205 kg CO2e kWh-1 [46]) is much lower than that in a LCA study conducted in US (0.73 kg CO2e kWh-1 [42]). This apparent discrepancy is explained because in 2016, almost 66% of the electricity generated in Brazil was from hydropower, which has an emission factor of 0.074 kg CO2e kWh-1 against 0.382 and 0.926 kg CO2e kWh-1 produced by natural gas and hard coal, respectively [46].
+
+### Assumptions and limitations
+
+The milk production and composition data are the average for a typical herd, which might have great animal-to-animal variability. Likewise, DM yield of crops and pastures were collected from experimental observations, and may change as a function of inter-annual variation, climatic conditions, soil type, fertilization level etc. The emission factors for direct and indirect N2O emissions from urine and dung were alternatively estimated using local data, but more experiments are necessary to reduce the uncertainty. The CO2 emitted from lime and urea application was estimated from IPCC default values, which may not represent emissions in subtropical conditions. This LCA may be improved by reducing the uncertainty of factors for estimating emissions from excreta and feed production, including the C sequestration or emissions as a function of soil management.
+
+### Further considerations
+
+The potential for using pasture can reduce the C footprint because milk production kept pace with animal confinement. However, if milk production is to decrease with lower TMR intake and inclusion of pasture [19], the C footprint would be expected to increase. Lorenz et al. [22] showed that an increase in milk yield from 5,000 to 6,000 kg ECM reduced the C footprint by 0.12 kg CO2e (kg ECM)-1, whereas an increase from 10,000 to 11,000 kg ECM reduced the C footprint by only 0.06 kg CO2e (kg ECM)-1. Hence, the impact of increasing milk production on decreasing C footprint is not linear, and mitigation measures, such as breeding for increased genetic yield potential and increasing concentrate ratio in the diet, are potentially harmful for animal’s health and welfare [70]. For instance, increasing concentrate ratio potentially increases the occurrence of subclinical ketosis and foot lesions, and C footprint may increase by 0.03 kg CO2e (kg ECM)-1 in subclinical ketosis [71] and by 0.02 kg CO2e (kg ECM)-1 in case of foot lesions [72].
+
+Grazing lands may also improve biodiversity [73]. Strategies such as zero tillage may increase stocks of soil C [74]. This study did not consider C sequestration during the growth of annual pastures, because it was assumed these grasses were planted with tillage, having a balance between C sequestration and C emissions [38]. Considering the C sequestration from no-tillage perennial pasture, the amount of C sequestration will more than compensates for C emitted. These results are in agreement with other authors who have shown that a reduction or elimination of soil tillage increases annual soil C sequestration in subtropical areas by 0.5 to 1.5 t ha-1 [75]. If 50% of tilled areas were under perennial grasslands, 1.0 t C ha-1 would be sequestered, further reducing the C footprint by 0.015 and 0.025 kg CO2e (kg ECM)-1 for the scenarios using 75 and 50% TMR, respectively. Eliminating tillage, the reduction on total GHG emissions would be 0.03 and 0.05 kg CO2e (kg ECM)-1 for 75 and 50% TMR, respectively. However, this approach may be controversial because lands which have been consistently managed for decades have approached steady state C storage, so that net exchange of CO2 would be negligible [76].
+
+## Conclusions
+
+This study assessed the C footprint of dairy cattle systems with or without access to pastures. Including pastures showed potential to maintain or decrease to a small extent the C footprint, which may be attributable to the evidence of low N2O emissions from urine and dung in dairy systems in subtropical areas. Even though the enteric CH4 intensity was the largest source of CO2e emissions, it did not change between different scenarios due to the narrow range of NDF content in diets and maintaining the same milk production with or without access to pastures.
+
+## Acknowledgments
+
+Thanks to Anna Naranjo for helpful comments throughout the elaboration of this manuscript, and to André Thaler Neto and Roberto Kappes for providing the key characteristics of the herd considered in this study.
 
 ## References
 
-- Climate Change and Land. Chapter 5: Food Security (2019)
-- Herrero M; Henderson B; Havlík P; Thornton PK; Conant RT; Smith P. Greenhouse gas mitigation potentials in the livestock sector. Nat Clim Chang (2016)
-- Rivera-Ferre MG; López-i-Gelats F; Howden M; Smith P; Morton JF; Herrero M. Re-framing the climate change debate in the livestock sector: mitigation and adaptation options. Wiley Interdiscip Rev Clim Chang (2016)
-- van Zanten HHE; Mollenhorst H; Klootwijk CW; van Middelaar CE; de Boer IJM. Global food supply: land use efficiency of livestock systems. Int J Life Cycle Assess (2016)
-- Hristov AN; Oh J; Firkins L; Dijkstra J; Kebreab E; Waghorn G. SPECIAL TOPICS—Mitigation of methane and nitrous oxide emissions from animal operations: I. A review of enteric methane mitigation options. J Anim Sci (2013)
-- Hristov AN; Ott T; Tricarico J; Rotz A; Waghorn G; Adesogan A. SPECIAL TOPICS—Mitigation of methane and nitrous oxide emissions from animal operations: III. A review of animal management mitigation options. J Anim Sci (2013)
-- Montes F; Meinen R; Dell C; Rotz A; Hristov AN; Oh J. SPECIAL TOPICS—Mitigation of methane and nitrous oxide emissions from animal operations: II. A review of manure management mitigation options. J Anim Sci (2013)
-- Ledgard SF; Wei S; Wang X; Falconer S; Zhang N; Zhang X. Nitrogen and carbon footprints of dairy farm systems in China and New Zealand, as influenced by productivity, feed sources and mitigations. Agric Water Manag (2019)
-- O’Brien D; Shalloo L; Patton J; Buckley F; Grainger C; Wallace M. A life cycle assessment of seasonal grass-based and confinement dairy farms. Agric Syst (2012)
-- Salou T; Le Mouël C; van der Werf HMG. Environmental impacts of dairy system intensification: the functional unit matters!. J Clean Prod (2017)
-- Lizarralde C; Picasso V; Rotz CA; Cadenazzi M; Astigarraga L. Practices to Reduce Milk Carbon Footprint on Grazing Dairy Farms in Southern Uruguay. Case Studies. Sustain Agric Res (2014)
-- Clark CEF; Kaur R; Millapan LO; Golder HM; Thomson PC; Horadagoda A. The effect of temperate or tropical pasture grazing state and grain-based concentrate allocation on dairy cattle production and behavior. J Dairy Sci (2018)
-- FAOSTAT.  (2017)
-- Vogeler I; Mackay A; Vibart R; Rendel J; Beautrais J; Dennis S. Effect of inter-annual variability in pasture growth and irrigation response on farm productivity and profitability based on biophysical and farm systems modelling. Sci Total Environ (2016)
-- Wilkinson JM; Lee MRF; Rivero MJ; Chamberlain AT. Some challenges and opportunities for grazing dairy cows on temperate pastures. Grass Forage Sci. (2020)
-- Wales WJ; Marett LC; Greenwood JS; Wright MM; Thornhill JB; Jacobs JL. Use of partial mixed rations in pasture-based dairying in temperate regions of Australia. Anim Prod Sci (2013)
-- Bargo F; Muller LD; Delahoy JE; Cassidy TW. Performance of high producing dairy cows with three different feeding systems combining pasture and total mixed rations. J Dairy Sci (2002)
-- Vibart RE; Fellner V; Burns JC; Huntington GB; Green JT. Performance of lactating dairy cows fed varying levels of total mixed ration and pasture. J Dairy Res (2008)
-- Mendoza A; Cajarville C; Repetto JL. Short communication: Intake, milk production, and milk fatty acid profile of dairy cows fed diets combining fresh forage with a total mixed ration. J Dairy Sci (2016)
-- Nutrient Requirements of Dairy Cattle (2001)
-- Noizère P; Sauvant D; Delaby L.  (2018)
-- Lorenz H; Reinsch T; Hess S; Taube F. Is low-input dairy farming more climate friendly? A meta-analysis of the carbon footprints of different production systems. J Clean Prod (2019)
-- INTERNATIONAL STANDARD—Environmental management—Life cycle assessment—Requirements and guidelines (2006)
-- Environmental management—Life cycle assessment—Principles and framework. Iso 14040 (2006)
-- FAO. Environmental Performance of Large Ruminant Supply Chains: Guidelines for assessment (2016)
-- Civiero M; Ribeiro-Filho HMN; Schaitz LH. Pearl-millet grazing decreases daily methane emissions in dairy cows receiving total mixed ration. 7th Greenhouse Gas and Animal Agriculture Conference,. Foz do Iguaçu (2019)
-- IPCC—Intergovernmental Panel on Climate Change. Climate Change 2014 Synthesis Report (Unedited Version). 2014. Available: ttps://. 
-- INRA. Alimentation des bovins, ovins et caprins. Besoins des animaux—valeurs des aliments. Tables Inra 2007. 4th ed. INRA, editor. 2007. 
-- Delagarde R; Faverdin P; Baratte C; Peyraud JL. GrazeIn: a model of herbage intake and milk production for grazing dairy cows. 2. Prediction of intake under rotational and continuously stocked grazing management. Grass Forage Sci (2011)
-- Ma BL; Liang BC; Biswas DK; Morrison MJ; McLaughlin NB. The carbon footprint of maize production as affected by nitrogen fertilizer and maize-legume rotations. Nutr Cycl Agroecosystems (2012)
-- Rauccci GS; Moreira CS; Alves PS; Mello FFC; Frazão LA; Cerri CEP. Greenhouse gas assessment of Brazilian soybean production: a case study of Mato Grosso State. J Clean Prod (2015)
-- Camargo GGT; Ryan MR; Richard TL. Energy Use and Greenhouse Gas Emissions from Crop Production Using the Farm Energy Analysis Tool. Bioscience (2013)
-- da Silva MSJ; Jobim CC; Poppi EC; Tres TT; Osmari MP. Production technology and quality of corn silage for feeding dairy cattle in Southern Brazil. Rev Bras Zootec (2015)
-- Duchini PGPG Guzatti GCGC; Ribeiro-Filho HMNHMNN Sbrissia AFAFAF. Intercropping black oat (Avena strigosa) and annual ryegrass (Lolium multiflorum) can increase pasture leaf production compared with their monocultures. Crop Pasture Sci (2016)
-- Scaravelli LFB; Pereira LET; Olivo CJ; Agnolin CA. Produção e qualidade de pastagens de Coastcross-1 e milheto utilizadas com vacas leiteiras. Cienc Rural (2007)
-- Sbrissia AF; Duchini PG; Zanini GD; Santos GT; Padilha DA; Schmitt D. Defoliation strategies in pastures submitted to intermittent stocking method: Underlying mechanisms buffering forage accumulation over a range of grazing heights. Crop Sci (2018)
-- Almeida JGR; Dall-Orsoletta AC; Oziemblowski MM; Michelon GM; Bayer C; Edouard N. Carbohydrate-rich supplements can improve nitrogen use efficiency and mitigate nitrogenous gas emissions from the excreta of dairy cows grazing temperate grass. Animal (2020)
-- Eggleston H.S.; Buendia L.; Miwa K. IPCC guidlines for national greenhouse gas inventories. (2006)
-- Ramalho B; Dieckow J; Barth G; Simon PL; Mangrich AS; Brevilieri RC. No-tillage and ryegrass grazing effects on stocks, stratification and lability of carbon and nitrogen in a subtropical Umbric Ferralsol. Eur J Soil Sci (2020)
-- Fernandes HC; da Silveira JCM; Rinaldi PCN. Avaliação do custo energético de diferentes operações agrícolas mecanizadas. Cienc e Agrotecnologia (2008)
-- Wang M Q. GREET 1.8a Spreadsheet Model. 2007. Available: . 
-- Rotz CAA; Montes F; Chianese DS; Chiane DS. The carbon footprint of dairy production systems through partial life cycle assessment. J Dairy Sci (2010)
-- Niu M; Kebreab E; Hristov AN; Oh J; Arndt C; Bannink A. Prediction of enteric methane production, yield, and intensity in dairy cattle using an intercontinental database. Glob Chang Biol (2018)
-- Eugène M; Sauvant D; Nozière P; Viallard D; Oueslati K; Lherm M. A new Tier 3 method to calculate methane emission inventory for ruminants. J Environ Manage (2019)
-- Reed KF; Moraes LE; Casper DP; Kebreab E. Predicting nitrogen excretion from cattle. J Dairy Sci (2015)
-- Barros MV; Piekarski CM; De Francisco AC. Carbon footprint of electricity generation in Brazil: An analysis of the 2016–2026 period. Energies (2018)
-- Ludington D; Johnson E. Dairy Farm Energy Audit Summary. New York State Energy Res Dev Auth (2003)
-- Thoma G; Jolliet O; Wang Y. A biophysical approach to allocation of life cycle environmental burdens for fluid milk supply chain analysis. Int Dairy J (2013)
-- Naranjo A; Johnson A; Rossow H. Greenhouse gas, water, and land footprint per unit of production of the California dairy industry over 50 years.  (2020)
-- Jayasundara S; Worden D; Weersink A; Wright T; VanderZaag A; Gordon R. Improving farm profitability also reduces the carbon footprint of milk production in intensive dairy production systems. J Clean Prod (2019)
-- Williams SRO; Fisher PD; Berrisford T; Moate PJ; Reynard K. Reducing methane on-farm by feeding diets high in fat may not always reduce life cycle greenhouse gas emissions. Int J Life Cycle Assess (2014)
-- Gollnow S; Lundie S; Moore AD; McLaren J; van Buuren N; Stahle P. Carbon footprint of milk production from dairy cows in Australia. Int Dairy J (2014)
-- O’Brien D; Capper JL; Garnsworthy PC; Grainger C; Shalloo L. A case study of the carbon footprint of milk from high-performing confinement and grass-based dairy farms. J Dairy Sci (2014)
-- Chobtang J; McLaren SJ; Ledgard SF; Donaghy DJ. Consequential Life Cycle Assessment of Pasture-based Milk Production: A Case Study in the Waikato Region, New Zealand. J Ind Ecol (2017)
-- Garg MR; Phondba BT; Sherasia PL; Makkar HPS. Carbon footprint of milk production under smallholder dairying in Anand district of Western India: A cradle-to-farm gate life cycle assessment. Anim Prod Sci (2016)
-- de Léis CM; Cherubini E; Ruviaro CF; Prudêncio da Silva V; do Nascimento Lampert V; Spies A. Carbon footprint of milk production in Brazil: a comparative case study. Int J Life Cycle Assess (2015)
-- O’Brien D; Geoghegan A; McNamara K; Shalloo L. How can grass-based dairy farmers reduce the carbon footprint of milk?. Anim Prod Sci (2016)
-- O’Brien D; Brennan P; Humphreys J; Ruane E; Shalloo L. An appraisal of carbon footprint of milk from commercial grass-based dairy farms in Ireland according to a certified life cycle assessment methodology. Int J Life Cycle Assess (2014)
-- Baek CY; Lee KM; Park KH. Quantification and control of the greenhouse gas emissions from a dairy cow system. J Clean Prod (2014)
-- Dall-Orsoletta AC; Almeida JGR; Carvalho PCF; Savian J V. Ribeiro-Filho HMN. Ryegrass pasture combined with partial total mixed ration reduces enteric methane emissions and maintains the performance of dairy cows during mid to late lactation. J Dairy Sci (2016)
-- Dall-Orsoletta AC; Oziemblowski MM; Berndt A; Ribeiro-Filho HMN. Enteric methane emission from grazing dairy cows receiving corn silage or ground corn supplementation. Anim Feed Sci Technol (2019)
-- Niu M; Appuhamy JADRN; Leytem AB; Dungan RS; Kebreab E. Effect of dietary crude protein and forage contents on enteric methane emissions and nitrogen excretion from dairy cows simultaneously. Anim Prod Sci (2016)
-- Waghorn GC; Law N; Bryant M; Pacheco D; Dalley D. Digestion and nitrogen excretion by Holstein-Friesian cows in late lactation offered ryegrass-based pasture supplemented with fodder beet. Anim Prod Sci (2019)
-- Dickhoefer U; Glowacki S; Gómez CA; Castro-Montoya JM. Forage and protein use efficiency in dairy cows grazing a mixed grass-legume pasture and supplemented with different levels of protein and starch. Livest Sci (2018)
-- Schwab CG; Broderick GA. A 100-Year Review: Protein and amino acid nutrition in dairy cows. J Dairy Sci (2017)
-- Sordi A; Dieckow J; Bayer C; Alburquerque MA; Piva JT; Zanatta JA. Nitrous oxide emission factors for urine and dung patches in a subtropical Brazilian pastureland. Agric Ecosyst Environ (2014)
-- Simon PL; Dieckow J; de Klein CAM; Zanatta JA; van der Weerden TJ; Ramalho B. Nitrous oxide emission factors from cattle urine and dung, and dicyandiamide (DCD) as a mitigation strategy in subtropical pastures. Agric Ecosyst Environ (2018)
-- Wang X; Ledgard S; Luo J; Guo Y; Zhao Z; Guo L. Environmental impacts and resource use of milk production on the North China Plain, based on life cycle assessment. Sci Total Environ (2018)
-- Pirlo G; Lolli S. Environmental impact of milk production from samples of organic and conventional farms in Lombardy (Italy). J Clean Prod (2019)
-- Herzog A; Winckler C; Zollitsch W. In pursuit of sustainability in dairy farming: A review of interdependent effects of animal welfare improvement and environmental impact mitigation. Agric Ecosyst Environ (2018)
-- Mostert PF; van Middelaar CE; Bokkers EAM; de Boer IJM. The impact of subclinical ketosis in dairy cows on greenhouse gas emissions of milk production. J Clean Prod (2018)
-- Mostert PF; van Middelaar CE; de Boer IJM; Bokkers EAM. The impact of foot lesions in dairy cows on greenhouse gas emissions of milk production. Agric Syst (2018)
-- Foley JA; Ramankutty N; Brauman KA; Cassidy ES; Gerber JS; Johnston M. Solutions for a cultivated planet. Nature (2011)
-- Lal R.. Soil Carbon Sequestration Impacts on Global Climate Change and Food Security. Science (80-) (2004)
-- Boddey RM; Jantalia CP; Conceiçao PC; Zanatta JA; Bayer C; Mielniczuk J. Carbon accumulation at depth in Ferralsols under zero-till subtropical agriculture. Glob Chang Biol (2010)
-- McConkey B; Angers D; Bentham M; Boehm M; Brierley T; Cerkowniak D. Canadian agricultural greenhouse gas monitoring accounting and reporting system: methodology and greenhouse gas estimates for agricultural land in the LULUCF sector for NIR 2014.  (2014)
\ No newline at end of file
+- IPCC. Climate Change and Land. Chapter 5: Food Security. 2019.
+- HerreroM, HendersonB, HavlíkP, ThorntonPK, ConantRT, SmithP, et al Greenhouse gas mitigation potentials in the livestock sector. Nat Clim Chang. 2016;6: 452–461. 10.1038/nclimate2925
+- Rivera-FerreMG, López-i-GelatsF, HowdenM, SmithP, MortonJF, HerreroM. Re-framing the climate change debate in the livestock sector: mitigation and adaptation options. Wiley Interdiscip Rev Clim Chang. 2016;7: 869–892. 10.1002/wcc.421
+- van ZantenHHE, MollenhorstH, KlootwijkCW, van MiddelaarCE, de BoerIJM. Global food supply: land use efficiency of livestock systems. Int J Life Cycle Assess. 2016;21: 747–758. 10.1007/s11367-015-0944-1
+- HristovAN, OhJ, FirkinsL, DijkstraJ, KebreabE, WaghornG, et al SPECIAL TOPICS—Mitigation of methane and nitrous oxide emissions from animal operations: I. A review of enteric methane mitigation options. J Anim Sci. 2013;91: 5045–5069. 10.2527/jas.2013-6583 24045497
+- HristovAN, OttT, TricaricoJ, RotzA, WaghornG, AdesoganA, et al SPECIAL TOPICS—Mitigation of methane and nitrous oxide emissions from animal operations: III. A review of animal management mitigation options. J Anim Sci. 2013;91: 5095–5113. 10.2527/jas.2013-6585 24045470
+- MontesF, MeinenR, DellC, RotzA, HristovAN, OhJ, et al SPECIAL TOPICS—Mitigation of methane and nitrous oxide emissions from animal operations: II. A review of manure management mitigation options. J Anim Sci. 2013;91: 5070–5094. 10.2527/jas.2013-6584 24045493
+- LedgardSF, WeiS, WangX, FalconerS, ZhangN, ZhangX, et al Nitrogen and carbon footprints of dairy farm systems in China and New Zealand, as influenced by productivity, feed sources and mitigations. Agric Water Manag. 2019;213: 155–163. 10.1016/j.agwat.2018.10.009
+- O’BrienD, ShallooL, PattonJ, BuckleyF, GraingerC, WallaceM. A life cycle assessment of seasonal grass-based and confinement dairy farms. Agric Syst. 2012;107: 33–46. 10.1016/j.agsy.2011.11.004
+- SalouT, Le MouëlC, van der WerfHMG. Environmental impacts of dairy system intensification: the functional unit matters! J Clean Prod. 2017 10.1016/j.jclepro.2016.05.019
+- LizarraldeC, PicassoV, RotzCA, CadenazziM, AstigarragaL. Practices to Reduce Milk Carbon Footprint on Grazing Dairy Farms in Southern Uruguay: Case Studies. Sustain Agric Res. 2014;3: 1 10.5539/sar.v3n2p1
+- ClarkCEF, KaurR, MillapanLO, GolderHM, ThomsonPC, HoradagodaA, et al The effect of temperate or tropical pasture grazing state and grain-based concentrate allocation on dairy cattle production and behavior. J Dairy Sci. 2018;101: 5454–5465. 10.3168/jds.2017-13388 29550132
+- Food and Agriculture Organization. FAOSTAT. 2017.
+- VogelerI, MackayA, VibartR, RendelJ, BeautraisJ, DennisS. Effect of inter-annual variability in pasture growth and irrigation response on farm productivity and profitability based on biophysical and farm systems modelling. Sci Total Environ. 2016;565: 564–575. 10.1016/j.scitotenv.2016.05.006 27203517
+- WilkinsonJM, LeeMRF, RiveroMJ, ChamberlainAT. Some challenges and opportunities for grazing dairy cows on temperate pastures. Grass Forage Sci. 2020;75: 1–17. 10.1111/gfs.12458 32109974
+- WalesWJ, MarettLC, GreenwoodJS, WrightMM, ThornhillJB, JacobsJL, et al Use of partial mixed rations in pasture-based dairying in temperate regions of Australia. Anim Prod Sci. 2013;53: 1167–1178. 10.1071/AN13207
+- BargoF, MullerLD, DelahoyJE, CassidyTW. Performance of high producing dairy cows with three different feeding systems combining pasture and total mixed rations. J Dairy Sci. 2002;85: 2948–2963. 10.3168/jds.S0022-0302(02)74381-6 12487461
+- VibartRE, FellnerV, BurnsJC, HuntingtonGB, GreenJT. Performance of lactating dairy cows fed varying levels of total mixed ration and pasture. J Dairy Res. 2008;75: 471–480. 10.1017/S0022029908003361 18701000
+- MendozaA, CajarvilleC, RepettoJL. Short communication: Intake, milk production, and milk fatty acid profile of dairy cows fed diets combining fresh forage with a total mixed ration. J Dairy Sci. 2016;99: 1938–1944. 10.3168/jds.2015-10257 26778319
+- NRC. Nutrient Requirements of Dairy Cattle. 7th ed. Washington DC: National Academy Press; 2001.
+- INRA. INRA Feeding System for Ruminants. NoizèreP, SauvantD, DelabyL, editors. Wageningen: Wageningen Academic Publishiers; 2018 10.3920/978-90-8686-872-8
+- LorenzH, ReinschT, HessS, TaubeF. Is low-input dairy farming more climate friendly? A meta-analysis of the carbon footprints of different production systems. J Clean Prod. 2019;211: 161–170. 10.1016/j.jclepro.2018.11.113
+- ISO 14044. INTERNATIONAL STANDARD—Environmental management—Life cycle assessment—Requirements and guidelines. 2006;2006: 46.
+- ISO 14040. The International Standards Organisation. Environmental management—Life cycle assessment—Principles and framework. Iso 14040. 2006;2006: 1–28. 10.1136/bmj.332.7550.1107
+- FAO. Environmental Performance of Large Ruminant Supply Chains: Guidelines for assessment. Livestock Environmental Assessment and Performance Partnership, editor. Rome, Italy: FAO; 2016 Available: http://www.fao.org/partnerships/leap/resources/guidelines/en/
+- CivieroM, Ribeiro-FilhoHMN, SchaitzLH. Pearl-millet grazing decreases daily methane emissions in dairy cows receiving total mixed ration. 7th Greenhouse Gas and Animal Agriculture Conference,. Foz do Iguaçu; 2019 pp. 141–141.
+- IPCC—Intergovernmental Panel on Climate Change. Climate Change 2014 Synthesis Report (Unedited Version). 2014. Available: ttps://www.ipcc.ch/site/assets/uploads/2018/05/SYR\_AR5\_FINAL\_full\_wcover.pdf
+- INRA. Alimentation des bovins, ovins et caprins. Besoins des animaux—valeurs des aliments. Tables Inra 2007. 4th ed. INRA, editor. 2007.
+- DelagardeR, FaverdinP, BaratteC, PeyraudJL. GrazeIn: a model of herbage intake and milk production for grazing dairy cows. 2. Prediction of intake under rotational and continuously stocked grazing management. Grass Forage Sci. 2011;66: 45–60. 10.1111/j.1365-2494.2010.00770.x
+- MaBL, LiangBC, BiswasDK, MorrisonMJ, McLaughlinNB. The carbon footprint of maize production as affected by nitrogen fertilizer and maize-legume rotations. Nutr Cycl Agroecosystems. 2012;94: 15–31. 10.1007/s10705-012-9522-0
+- RauccciGS, MoreiraCS, AlvesPS, MelloFFC, FrazãoLA, CerriCEP, et al Greenhouse gas assessment of Brazilian soybean production: a case study of Mato Grosso State. J Clean Prod. 2015;96: 418–425.
+- CamargoGGT, RyanMR, RichardTL. Energy Use and Greenhouse Gas Emissions from Crop Production Using the Farm Energy Analysis Tool. Bioscience. 2013;63: 263–273. 10.1525/bio.2013.63.4.6
+- da SilvaMSJ, JobimCC, PoppiEC, TresTT, OsmariMP. Production technology and quality of corn silage for feeding dairy cattle in Southern Brazil. Rev Bras Zootec. 2015;44: 303–313. 10.1590/S1806-92902015000900001
+- Duchini PGPGGuzatti GCGC, Ribeiro-Filho HMNHMNNSbrissia AFAFAF. Intercropping black oat (Avena strigosa) and annual ryegrass (Lolium multiflorum) can increase pasture leaf production compared with their monocultures. Crop Pasture Sci. 2016;67: 574–581. 10.1071/CP15170
+- ScaravelliLFB, PereiraLET, OlivoCJ, AgnolinCA. Produção e qualidade de pastagens de Coastcross-1 e milheto utilizadas com vacas leiteiras. Cienc Rural. 2007;37: 841–846.
+- SbrissiaAF, DuchiniPG, ZaniniGD, SantosGT, PadilhaDA, SchmittD. Defoliation strategies in pastures submitted to intermittent stocking method: Underlying mechanisms buffering forage accumulation over a range of grazing heights. Crop Sci. 2018;58: 945–954. 10.2135/cropsci2017.07.0447
+- AlmeidaJGR, Dall-OrsolettaAC, OziemblowskiMM, MichelonGM, BayerC, EdouardN, et al Carbohydrate-rich supplements can improve nitrogen use efficiency and mitigate nitrogenous gas emissions from the excreta of dairy cows grazing temperate grass. Animal. 2020; 1–12. 10.1017/S1751731119003057 31907089
+- Intergovernamental Panel on Climate Change (IPCC). IPCC guidlines for national greenhouse gas inventories. EgglestonH.S., BuendiaL., MiwaK. NT and TK, editor. Hayama, Kanagawa, Japan: Institute for Global Environmental Strategies; 2006.
+- RamalhoB, DieckowJ, BarthG, SimonPL, MangrichAS, BrevilieriRC. No-tillage and ryegrass grazing effects on stocks, stratification and lability of carbon and nitrogen in a subtropical Umbric Ferralsol. Eur J Soil Sci. 2020; 1–14. 10.1111/ejss.12933
+- FernandesHC, da SilveiraJCM, RinaldiPCN. Avaliação do custo energético de diferentes operações agrícolas mecanizadas. Cienc e Agrotecnologia. 2008;32: 1582–1587. 10.1590/s1413-70542008000500034
+- Wang M Q. GREET 1.8a Spreadsheet Model. 2007. Available: http://www.transportation.anl.gov/software/GREET/
+- RotzCAA, MontesF, ChianeseDS, ChianeDS. The carbon footprint of dairy production systems through partial life cycle assessment. J Dairy Sci. 2010;93: 1266–1282. 10.3168/jds.2009-2162 20172247
+- NiuM, KebreabE, HristovAN, OhJ, ArndtC, BanninkA, et al Prediction of enteric methane production, yield, and intensity in dairy cattle using an intercontinental database. Glob Chang Biol. 2018;24: 3368–3389. 10.1111/gcb.14094 29450980
+- EugèneM, SauvantD, NozièreP, ViallardD, OueslatiK, LhermM, et al A new Tier 3 method to calculate methane emission inventory for ruminants. J Environ Manage. 2019;231: 982–988. 10.1016/j.jenvman.2018.10.086 30602259
+- ReedKF, MoraesLE, CasperDP, KebreabE. Predicting nitrogen excretion from cattle. J Dairy Sci. 2015;98: 3025–3035. 10.3168/jds.2014-8397 25747829
+- BarrosMV, PiekarskiCM, De FranciscoAC. Carbon footprint of electricity generation in Brazil: An analysis of the 2016–2026 period. Energies. 2018;11 10.3390/en11061412
+- LudingtonD, JohnsonE. Dairy Farm Energy Audit Summary. New York State Energy Res Dev Auth. 2003.
+- ThomaG, JollietO, WangY. A biophysical approach to allocation of life cycle environmental burdens for fluid milk supply chain analysis. Int Dairy J. 2013;31 10.1016/j.idairyj.2012.08.012
+- NaranjoA, JohnsonA, RossowH. Greenhouse gas, water, and land footprint per unit of production of the California dairy industry over 50 years. 2020 10.3168/jds.2019-16576 32037166
+- JayasundaraS, WordenD, WeersinkA, WrightT, VanderZaagA, GordonR, et al Improving farm profitability also reduces the carbon footprint of milk production in intensive dairy production systems. J Clean Prod. 2019;229: 1018–1028. 10.1016/j.jclepro.2019.04.013
+- WilliamsSRO, FisherPD, BerrisfordT, MoatePJ, ReynardK. Reducing methane on-farm by feeding diets high in fat may not always reduce life cycle greenhouse gas emissions. Int J Life Cycle Assess. 2014;19: 69–78. 10.1007/s11367-013-0619-8
+- GollnowS, LundieS, MooreAD, McLarenJ, van BuurenN, StahleP, et al Carbon footprint of milk production from dairy cows in Australia. Int Dairy J. 2014;37: 31–38. 10.1016/j.idairyj.2014.02.005
+- O’BrienD, CapperJL, GarnsworthyPC, GraingerC, ShallooL. A case study of the carbon footprint of milk from high-performing confinement and grass-based dairy farms. J Dairy Sci. 2014 10.3168/jds.2013-7174 24440256
+- ChobtangJ, McLarenSJ, LedgardSF, DonaghyDJ. Consequential Life Cycle Assessment of Pasture-based Milk Production: A Case Study in the Waikato Region, New Zealand. J Ind Ecol. 2017;21: 1139–1152. 10.1111/jiec.12484
+- GargMR, PhondbaBT, SherasiaPL, MakkarHPS. Carbon footprint of milk production under smallholder dairying in Anand district of Western India: A cradle-to-farm gate life cycle assessment. Anim Prod Sci. 2016;56: 423–436. 10.1071/AN15464
+- de LéisCM, CherubiniE, RuviaroCF, Prudêncio da SilvaV, do Nascimento LampertV, SpiesA, et al Carbon footprint of milk production in Brazil: a comparative case study. Int J Life Cycle Assess. 2015;20: 46–60. 10.1007/s11367-014-0813-3
+- O’BrienD, GeogheganA, McNamaraK, ShallooL. How can grass-based dairy farmers reduce the carbon footprint of milk? Anim Prod Sci. 2016;56: 495–500. 10.1071/AN15490
+- O’BrienD, BrennanP, HumphreysJ, RuaneE, ShallooL. An appraisal of carbon footprint of milk from commercial grass-based dairy farms in Ireland according to a certified life cycle assessment methodology. Int J Life Cycle Assess. 2014;19: 1469–1481. 10.1007/s11367-014-0755-9
+- BaekCY, LeeKM, ParkKH. Quantification and control of the greenhouse gas emissions from a dairy cow system. J Clean Prod. 2014;70: 50–60. 10.1016/j.jclepro.2014.02.010
+- Dall-OrsolettaAC, AlmeidaJGR, CarvalhoPCF, Savian JV., Ribeiro-Filho HMN. Ryegrass pasture combined with partial total mixed ration reduces enteric methane emissions and maintains the performance of dairy cows during mid to late lactation. J Dairy Sci. 2016;99: 4374–4383. 10.3168/jds.2015-10396 27016830
+- Dall-OrsolettaAC, OziemblowskiMM, BerndtA, Ribeiro-FilhoHMN. Enteric methane emission from grazing dairy cows receiving corn silage or ground corn supplementation. Anim Feed Sci Technol. 2019;253: 65–73. 10.1016/j.anifeedsci.2019.05.009
+- NiuM, AppuhamyJADRN, LeytemAB, DunganRS, KebreabE. Effect of dietary crude protein and forage contents on enteric methane emissions and nitrogen excretion from dairy cows simultaneously. Anim Prod Sci. 2016;56: 312–321. 10.1071/AN15498
+- WaghornGC, LawN, BryantM, PachecoD, DalleyD. Digestion and nitrogen excretion by Holstein-Friesian cows in late lactation offered ryegrass-based pasture supplemented with fodder beet. Anim Prod Sci. 2019;59: 1261–1270. 10.1071/AN18018
+- DickhoeferU, GlowackiS, GómezCA, Castro-MontoyaJM. Forage and protein use efficiency in dairy cows grazing a mixed grass-legume pasture and supplemented with different levels of protein and starch. Livest Sci. 2018;216: 109–118. 10.1016/j.livsci.2018.08.004
+- SchwabCG, BroderickGA. A 100-Year Review: Protein and amino acid nutrition in dairy cows. J Dairy Sci. 2017;100: 10094–10112. 10.3168/jds.2017-13320 29153157
+- SordiA, DieckowJ, BayerC, AlburquerqueMA, PivaJT, ZanattaJA, et al Nitrous oxide emission factors for urine and dung patches in a subtropical Brazilian pastureland. Agric Ecosyst Environ. 2014;190: 94–103. 10.1016/j.agee.2013.09.004
+- SimonPL, DieckowJ, de KleinCAM, ZanattaJA, van der WeerdenTJ, RamalhoB, et al Nitrous oxide emission factors from cattle urine and dung, and dicyandiamide (DCD) as a mitigation strategy in subtropical pastures. Agric Ecosyst Environ. 2018;267: 74–82. 10.1016/j.agee.2018.08.013
+- WangX, LedgardS, LuoJ, GuoY, ZhaoZ, GuoL, et al Environmental impacts and resource use of milk production on the North China Plain, based on life cycle assessment. Sci Total Environ. 2018;625: 486–495. 10.1016/j.scitotenv.2017.12.259 29291563
+- PirloG, LolliS. Environmental impact of milk production from samples of organic and conventional farms in Lombardy (Italy). J Clean Prod. 2019;211: 962–971. 10.1016/j.jclepro.2018.11.070
+- HerzogA, WincklerC, ZollitschW. In pursuit of sustainability in dairy farming: A review of interdependent effects of animal welfare improvement and environmental impact mitigation. Agric Ecosyst Environ. 2018;267: 174–187. 10.1016/j.agee.2018.07.029
+- MostertPF, van MiddelaarCE, BokkersEAM, de BoerIJM. The impact of subclinical ketosis in dairy cows on greenhouse gas emissions of milk production. J Clean Prod. 2018 10.1016/j.jclepro.2017.10.019
+- MostertPF, van MiddelaarCE, de BoerIJM, BokkersEAM. The impact of foot lesions in dairy cows on greenhouse gas emissions of milk production. Agric Syst. 2018;167: 206–212. 10.1016/j.agsy.2018.09.006
+- FoleyJA, RamankuttyN, BraumanKA, CassidyES, GerberJS, JohnstonM, et al Solutions for a cultivated planet. Nature. 2011;478: 337–342. 10.1038/nature10452 21993620
+- LalR. Soil Carbon Sequestration Impacts on Global Climate Change and Food Security. Science (80-). 2004;304: 1623–1627. 10.1126/science.1097396 15192216
+- BoddeyRM, JantaliaCP, ConceiçaoPC, ZanattaJA, BayerC, MielniczukJ, et al Carbon accumulation at depth in Ferralsols under zero-till subtropical agriculture. Glob Chang Biol. 2010;16: 784–795. 10.1111/j.1365-2486.2009.02020.x
+- McConkeyB, AngersD, BenthamM, BoehmM, BrierleyT, CerkowniakD, et al Canadian agricultural greenhouse gas monitoring accounting and reporting system: methodology and greenhouse gas estimates for agricultural land in the LULUCF sector for NIR 2014. 2014.
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v2/powerpoint_sample.pptx.json b/tests/data/groundtruth/docling_v2/powerpoint_sample.pptx.json
index 44288d7d..3d5b32ea 100644
--- a/tests/data/groundtruth/docling_v2/powerpoint_sample.pptx.json
+++ b/tests/data/groundtruth/docling_v2/powerpoint_sample.pptx.json
@@ -1,6 +1,6 @@
 {
   "schema_name": "DoclingDocument",
-  "version": "1.0.0",
+  "version": "1.1.0",
   "name": "powerpoint_sample",
   "origin": {
     "mimetype": "application/vnd.ms-powerpoint",
@@ -10,6 +10,7 @@
   "furniture": {
     "self_ref": "#/furniture",
     "children": [],
+    "content_layer": "furniture",
     "name": "_root_",
     "label": "unspecified"
   },
@@ -26,6 +27,7 @@
         "$ref": "#/groups/2"
       }
     ],
+    "content_layer": "body",
     "name": "_root_",
     "label": "unspecified"
   },
@@ -46,6 +48,7 @@
           "$ref": "#/tables/0"
         }
       ],
+      "content_layer": "body",
       "name": "slide-0",
       "label": "chapter"
     },
@@ -74,6 +77,7 @@
           "$ref": "#/texts/7"
         }
       ],
+      "content_layer": "body",
       "name": "slide-1",
       "label": "chapter"
     },
@@ -105,6 +109,7 @@
           "$ref": "#/groups/7"
         }
       ],
+      "content_layer": "body",
       "name": "slide-2",
       "label": "chapter"
     },
@@ -124,6 +129,7 @@
           "$ref": "#/texts/10"
         }
       ],
+      "content_layer": "body",
       "name": "list",
       "label": "ordered_list"
     },
@@ -146,6 +152,7 @@
           "$ref": "#/texts/14"
         }
       ],
+      "content_layer": "body",
       "name": "list",
       "label": "list"
     },
@@ -162,6 +169,7 @@
           "$ref": "#/texts/17"
         }
       ],
+      "content_layer": "body",
       "name": "list",
       "label": "list"
     },
@@ -181,6 +189,7 @@
           "$ref": "#/texts/21"
         }
       ],
+      "content_layer": "body",
       "name": "list",
       "label": "ordered_list"
     },
@@ -200,6 +209,7 @@
           "$ref": "#/texts/24"
         }
       ],
+      "content_layer": "body",
       "name": "list",
       "label": "list"
     }
@@ -211,6 +221,7 @@
         "$ref": "#/groups/0"
       },
       "children": [],
+      "content_layer": "body",
       "label": "title",
       "prov": [
         {
@@ -237,6 +248,7 @@
         "$ref": "#/groups/0"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [
         {
@@ -263,6 +275,7 @@
         "$ref": "#/groups/1"
       },
       "children": [],
+      "content_layer": "body",
       "label": "title",
       "prov": [
         {
@@ -289,6 +302,7 @@
         "$ref": "#/groups/1"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [
         {
@@ -315,6 +329,7 @@
         "$ref": "#/groups/1"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [
         {
@@ -341,6 +356,7 @@
         "$ref": "#/groups/1"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [
         {
@@ -367,6 +383,7 @@
         "$ref": "#/groups/1"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [
         {
@@ -393,6 +410,7 @@
         "$ref": "#/groups/1"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [
         {
@@ -419,6 +437,7 @@
         "$ref": "#/groups/3"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [
         {
@@ -447,6 +466,7 @@
         "$ref": "#/groups/3"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [
         {
@@ -475,6 +495,7 @@
         "$ref": "#/groups/3"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [
         {
@@ -503,6 +524,7 @@
         "$ref": "#/groups/4"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [
         {
@@ -531,6 +553,7 @@
         "$ref": "#/groups/4"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [
         {
@@ -559,6 +582,7 @@
         "$ref": "#/groups/4"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [
         {
@@ -587,6 +611,7 @@
         "$ref": "#/groups/4"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [
         {
@@ -615,6 +640,7 @@
         "$ref": "#/groups/2"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [
         {
@@ -641,6 +667,7 @@
         "$ref": "#/groups/5"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [
         {
@@ -669,6 +696,7 @@
         "$ref": "#/groups/5"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [
         {
@@ -697,6 +725,7 @@
         "$ref": "#/groups/2"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [
         {
@@ -723,6 +752,7 @@
         "$ref": "#/groups/6"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [
         {
@@ -751,6 +781,7 @@
         "$ref": "#/groups/6"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [
         {
@@ -779,6 +810,7 @@
         "$ref": "#/groups/6"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [
         {
@@ -807,6 +839,7 @@
         "$ref": "#/groups/7"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [
         {
@@ -835,6 +868,7 @@
         "$ref": "#/groups/7"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [
         {
@@ -863,6 +897,7 @@
         "$ref": "#/groups/7"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [
         {
@@ -894,6 +929,7 @@
         "$ref": "#/groups/0"
       },
       "children": [],
+      "content_layer": "body",
       "label": "table",
       "prov": [
         {
diff --git a/tests/data/groundtruth/docling_v2/powerpoint_with_image.pptx.json b/tests/data/groundtruth/docling_v2/powerpoint_with_image.pptx.json
index eaa343f0..b6c7422b 100644
--- a/tests/data/groundtruth/docling_v2/powerpoint_with_image.pptx.json
+++ b/tests/data/groundtruth/docling_v2/powerpoint_with_image.pptx.json
@@ -1,6 +1,6 @@
 {
   "schema_name": "DoclingDocument",
-  "version": "1.0.0",
+  "version": "1.1.0",
   "name": "powerpoint_with_image",
   "origin": {
     "mimetype": "application/vnd.ms-powerpoint",
@@ -10,6 +10,7 @@
   "furniture": {
     "self_ref": "#/furniture",
     "children": [],
+    "content_layer": "furniture",
     "name": "_root_",
     "label": "unspecified"
   },
@@ -20,6 +21,7 @@
         "$ref": "#/groups/0"
       }
     ],
+    "content_layer": "body",
     "name": "_root_",
     "label": "unspecified"
   },
@@ -40,6 +42,7 @@
           "$ref": "#/pictures/0"
         }
       ],
+      "content_layer": "body",
       "name": "slide-0",
       "label": "chapter"
     }
@@ -51,6 +54,7 @@
         "$ref": "#/groups/0"
       },
       "children": [],
+      "content_layer": "body",
       "label": "title",
       "prov": [
         {
@@ -77,6 +81,7 @@
         "$ref": "#/groups/0"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [
         {
@@ -105,6 +110,7 @@
         "$ref": "#/groups/0"
       },
       "children": [],
+      "content_layer": "body",
       "label": "picture",
       "prov": [
         {
diff --git a/tests/data/groundtruth/docling_v2/redp5110_sampled.doctags.txt b/tests/data/groundtruth/docling_v2/redp5110_sampled.doctags.txt
index fcbedd50..0622aa68 100644
--- a/tests/data/groundtruth/docling_v2/redp5110_sampled.doctags.txt
+++ b/tests/data/groundtruth/docling_v2/redp5110_sampled.doctags.txt
@@ -1,332 +1,234 @@
-<document>
-<text><location><page_1><loc_47><loc_94><loc_68><loc_96></location>Front cover</text>
-<figure>
-<location><page_1><loc_84><loc_93><loc_96><loc_97></location>
-</figure>
-<section_header_level_1><location><page_1><loc_6><loc_79><loc_96><loc_89></location>Row and Column Access Control Support in IBM DB2 for i</section_header_level_1>
-<figure>
-<location><page_1><loc_5><loc_11><loc_96><loc_63></location>
-</figure>
-<figure>
-<location><page_1><loc_52><loc_2><loc_95><loc_10></location>
-</figure>
-<section_header_level_1><location><page_2><loc_11><loc_88><loc_28><loc_91></location>Contents</section_header_level_1>
-<table>
-<location><page_2><loc_22><loc_10><loc_89><loc_83></location>
-<row_0><col_0><body>Notices</col_0><col_1><body>. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vii</col_1></row_0>
-<row_1><col_0><body>Trademarks</col_0><col_1><body>. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . viii</col_1></row_1>
-<row_2><col_0><body>DB2 for i Center of Excellence</col_0><col_1><body>. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ix</col_1></row_2>
-<row_3><col_0><body>Preface</col_0><col_1><body>. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi</col_1></row_3>
-<row_4><col_0><body>Authors . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi</col_0><col_1><body></col_1></row_4>
-<row_5><col_0><body>Now you can become a published author, too!</col_0><col_1><body>. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xiii</col_1></row_5>
-<row_6><col_0><body>Comments welcome. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .</col_0><col_1><body>xiii</col_1></row_6>
-<row_7><col_0><body>Stay connected to IBM Redbooks</col_0><col_1><body>. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xiv</col_1></row_7>
-<row_8><col_0><body>Chapter 1. Securing and protecting IBM DB2 data  . . . . . . . . . . . . . . . . . . . . . . . . . . . . .</col_0><col_1><body>1</col_1></row_8>
-<row_9><col_0><body>1.1 Security fundamentals. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2</col_0><col_1><body></col_1></row_9>
-<row_10><col_0><body>1.2 Current state of IBM i security . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .</col_0><col_1><body>2</col_1></row_10>
-<row_11><col_0><body>1.3 DB2 for i security controls . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3</col_0><col_1><body></col_1></row_11>
-<row_12><col_0><body>1.3.1 Existing row and column control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .</col_0><col_1><body>4</col_1></row_12>
-<row_13><col_0><body>1.3.2 New controls: Row and Column Access Control. . . . . . . . . . . . . . . . . . . . . . . . . . .</col_0><col_1><body>5</col_1></row_13>
-<row_14><col_0><body>Chapter 2. Roles and separation of duties . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .</col_0><col_1><body>7</col_1></row_14>
-<row_15><col_0><body>2.1 Roles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .</col_0><col_1><body>8</col_1></row_15>
-<row_16><col_0><body>2.1.1 DDM and DRDA application server access: QIBM_DB_DDMDRDA . . . . . . . . . . .</col_0><col_1><body>8</col_1></row_16>
-<row_17><col_0><body>2.1.2 Toolbox application server access: QIBM_DB_ZDA. . . . . . . . . . . . . . . . . . . . . . . .</col_0><col_1><body>8</col_1></row_17>
-<row_18><col_0><body>2.1.3 Database Administrator function: QIBM_DB_SQLADM . . . . . . . . . . . . . . . . . . . . .</col_0><col_1><body>9</col_1></row_18>
-<row_19><col_0><body>2.1.4 Database Information function: QIBM_DB_SYSMON</col_0><col_1><body>. . . . . . . . . . . . . . . . . . . . . . 9</col_1></row_19>
-<row_20><col_0><body>2.1.5 Security Administrator function: QIBM_DB_SECADM . . . . . . . . . . . . . . . . . . . . . .</col_0><col_1><body>9</col_1></row_20>
-<row_21><col_0><body>2.1.6 Change Function Usage CL command . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .</col_0><col_1><body>10</col_1></row_21>
-<row_22><col_0><body>2.1.7 Verifying function usage IDs for RCAC with the FUNCTION_USAGE view . . . . .</col_0><col_1><body>10</col_1></row_22>
-<row_23><col_0><body>2.2 Separation of duties . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10</col_0><col_1><body></col_1></row_23>
-<row_24><col_0><body>Chapter 3. Row and Column Access Control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .</col_0><col_1><body>13</col_1></row_24>
-<row_25><col_0><body>3.1 Explanation of RCAC and the concept of access control . . . . . . . . . . . . . . . . . . . . . . .</col_0><col_1><body>14</col_1></row_25>
-<row_26><col_0><body>3.1.1 Row permission and column mask definitions</col_0><col_1><body>. . . . . . . . . . . . . . . . . . . . . . . . . . . 14</col_1></row_26>
-<row_27><col_0><body>3.1.2 Enabling and activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .</col_0><col_1><body>16</col_1></row_27>
-<row_28><col_0><body>3.2 Special registers and built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .</col_0><col_1><body>18</col_1></row_28>
-<row_29><col_0><body>3.2.1 Special registers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .</col_0><col_1><body>18</col_1></row_29>
-<row_30><col_0><body>3.2.2 Built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .</col_0><col_1><body>19</col_1></row_30>
-<row_31><col_0><body>3.3 VERIFY_GROUP_FOR_USER function . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .</col_0><col_1><body>20</col_1></row_31>
-<row_32><col_0><body>3.4 Establishing and controlling accessibility by using the RCAC rule text . . . . . . . . . . . . .</col_0><col_1><body>21</col_1></row_32>
-<row_33><col_0><body>. . . . . . . . . . . . . . . . . . . . . . . .</col_0><col_1><body>22</col_1></row_33>
-<row_34><col_0><body>3.5 SELECT, INSERT, and UPDATE behavior with RCAC 3.6 Human resources example . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .</col_0><col_1><body>22</col_1></row_34>
-<row_35><col_0><body>3.6.1 Assigning the QIBM_DB_SECADM function ID to the consultants. . . . . . . . . . . .</col_0><col_1><body>23</col_1></row_35>
-<row_36><col_0><body>3.6.2 Creating group profiles for the users and their roles . . . . . . . . . . . . . . . . . . . . . . .</col_0><col_1><body>23</col_1></row_36>
-<row_37><col_0><body>3.6.3 Demonstrating data access without RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .</col_0><col_1><body>24</col_1></row_37>
-<row_38><col_0><body>3.6.4 Defining and creating row permissions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .</col_0><col_1><body>25</col_1></row_38>
-<row_39><col_0><body>3.6.5 Defining and creating column masks</col_0><col_1><body>. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26</col_1></row_39>
-<row_40><col_0><body>3.6.6 Activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .</col_0><col_1><body>28</col_1></row_40>
-<row_41><col_0><body>3.6.7 Demonstrating data access with RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .</col_0><col_1><body>29</col_1></row_41>
-<row_42><col_0><body>3.6.8 Demonstrating data access with a view and RCAC . . . . . . . . . . . . . . . . . . . . . . .</col_0><col_1><body>32</col_1></row_42>
-</table>
-<text><location><page_3><loc_11><loc_89><loc_39><loc_91></location>DB2 for i Center of Excellence</text>
-<text><location><page_3><loc_15><loc_80><loc_38><loc_83></location>Solution Brief IBM Systems Lab Services and Training</text>
-<figure>
-<location><page_3><loc_23><loc_64><loc_29><loc_66></location>
-</figure>
-<section_header_level_1><location><page_3><loc_24><loc_57><loc_31><loc_59></location>Highlights</section_header_level_1>
-<unordered_list>
-<list_item><location><page_3><loc_24><loc_55><loc_40><loc_56></location>GLYPH<g115>GLYPH<g3> GLYPH<g40>GLYPH<g81>GLYPH<g75>GLYPH<g68>GLYPH<g81>GLYPH<g70>GLYPH<g72>GLYPH<g3> GLYPH<g87>GLYPH<g75>GLYPH<g72>GLYPH<g3> GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g73>GLYPH<g82>GLYPH<g85>GLYPH<g80>GLYPH<g68>GLYPH<g81>GLYPH<g70>GLYPH<g72>GLYPH<g3> GLYPH<g82>GLYPH<g73>GLYPH<g3> GLYPH<g92>GLYPH<g82>GLYPH<g88>GLYPH<g85> GLYPH<g3> GLYPH<g71>GLYPH<g68>GLYPH<g87>GLYPH<g68>GLYPH<g69>GLYPH<g68>GLYPH<g86>GLYPH<g72>GLYPH<g3> GLYPH<g82>GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g68>GLYPH<g87>GLYPH<g76>GLYPH<g82>GLYPH<g81>GLYPH<g86></list_item>
-<list_item><location><page_3><loc_24><loc_51><loc_42><loc_54></location>GLYPH<g115>GLYPH<g3> GLYPH<g40>GLYPH<g68>GLYPH<g85> GLYPH<g81>GLYPH<g3> GLYPH<g74>GLYPH<g85>GLYPH<g72>GLYPH<g68>GLYPH<g87>GLYPH<g72>GLYPH<g85>GLYPH<g3> GLYPH<g85>GLYPH<g72>GLYPH<g87>GLYPH<g88>GLYPH<g85> GLYPH<g81>GLYPH<g3> GLYPH<g82>GLYPH<g81>GLYPH<g3> GLYPH<g44>GLYPH<g55>GLYPH<g3> GLYPH<g83>GLYPH<g85>GLYPH<g82>GLYPH<g77>GLYPH<g72>GLYPH<g70>GLYPH<g87>GLYPH<g86> GLYPH<g3> GLYPH<g87>GLYPH<g75>GLYPH<g85>GLYPH<g82>GLYPH<g88>GLYPH<g74>GLYPH<g75>GLYPH<g3> GLYPH<g80>GLYPH<g82>GLYPH<g71>GLYPH<g72>GLYPH<g85> GLYPH<g81>GLYPH<g76>GLYPH<g93>GLYPH<g68>GLYPH<g87>GLYPH<g76>GLYPH<g82>GLYPH<g81>GLYPH<g3> GLYPH<g82>GLYPH<g73>GLYPH<g3> GLYPH<g71>GLYPH<g68>GLYPH<g87>GLYPH<g68>GLYPH<g69>GLYPH<g68>GLYPH<g86>GLYPH<g72>GLYPH<g3> GLYPH<g68>GLYPH<g81>GLYPH<g71> GLYPH<g3> GLYPH<g68>GLYPH<g83>GLYPH<g83>GLYPH<g79>GLYPH<g76>GLYPH<g70>GLYPH<g68>GLYPH<g87>GLYPH<g76>GLYPH<g82>GLYPH<g81>GLYPH<g86></list_item>
-<list_item><location><page_3><loc_24><loc_48><loc_41><loc_50></location>GLYPH<g115>GLYPH<g3> GLYPH<g53>GLYPH<g72>GLYPH<g79>GLYPH<g92>GLYPH<g3> GLYPH<g82>GLYPH<g81>GLYPH<g3> GLYPH<g44>GLYPH<g37>GLYPH<g48>GLYPH<g3> GLYPH<g72>GLYPH<g91>GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g87>GLYPH<g3> GLYPH<g70>GLYPH<g82>GLYPH<g81>GLYPH<g86>GLYPH<g88>GLYPH<g79>GLYPH<g87>GLYPH<g76>GLYPH<g81>GLYPH<g74>GLYPH<g15>GLYPH<g3> GLYPH<g86>GLYPH<g78>GLYPH<g76>GLYPH<g79>GLYPH<g79>GLYPH<g86> GLYPH<g3> GLYPH<g86>GLYPH<g75>GLYPH<g68>GLYPH<g85>GLYPH<g76>GLYPH<g81>GLYPH<g74>GLYPH<g3> GLYPH<g68>GLYPH<g81>GLYPH<g71>GLYPH<g3> GLYPH<g85>GLYPH<g72>GLYPH<g81>GLYPH<g82>GLYPH<g90>GLYPH<g81>GLYPH<g3> GLYPH<g86>GLYPH<g72>GLYPH<g85>GLYPH<g89>GLYPH<g76>GLYPH<g70>GLYPH<g72>GLYPH<g86></list_item>
-<list_item><location><page_3><loc_24><loc_45><loc_38><loc_47></location>GLYPH<g115>GLYPH<g3> GLYPH<g55> GLYPH<g68>GLYPH<g78>GLYPH<g72>GLYPH<g3> GLYPH<g68>GLYPH<g71>GLYPH<g89>GLYPH<g68>GLYPH<g81>GLYPH<g87>GLYPH<g68>GLYPH<g74>GLYPH<g72>GLYPH<g3> GLYPH<g82>GLYPH<g73>GLYPH<g3> GLYPH<g68>GLYPH<g70>GLYPH<g70>GLYPH<g72>GLYPH<g86>GLYPH<g86>GLYPH<g3> GLYPH<g87>GLYPH<g82>GLYPH<g3> GLYPH<g68> GLYPH<g3> GLYPH<g90>GLYPH<g82>GLYPH<g85>GLYPH<g79>GLYPH<g71>GLYPH<g90>GLYPH<g76>GLYPH<g71>GLYPH<g72>GLYPH<g3> GLYPH<g86>GLYPH<g82>GLYPH<g88>GLYPH<g85>GLYPH<g70>GLYPH<g72>GLYPH<g3> GLYPH<g82>GLYPH<g73>GLYPH<g3> GLYPH<g72>GLYPH<g91>GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g87>GLYPH<g76>GLYPH<g86>GLYPH<g72></list_item>
+<doctag><text><loc_235><loc_18><loc_342><loc_32>Front cover</text>
+<picture><loc_419><loc_16><loc_479><loc_35></picture>
+<section_header_level_1><loc_29><loc_53><loc_478><loc_105>Row and Column Access Control Support in IBM DB2 for i</section_header_level_1>
+<picture><loc_27><loc_185><loc_478><loc_443></picture>
+<text><loc_235><loc_18><loc_342><loc_32>Front cover</text>
+<page_footer><loc_30><loc_474><loc_134><loc_483>ibm.com /redbooks</page_footer>
+<page_break>
+<section_header_level_1><loc_53><loc_47><loc_138><loc_61>Contents</section_header_level_1>
+<otsl><loc_111><loc_83><loc_447><loc_452><fcel>Notices<fcel>. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vii<nl><fcel>Trademarks<fcel>. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . viii<nl><fcel>DB2 for i Center of Excellence<fcel>. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ix<nl><fcel>Preface<fcel>. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi<nl><fcel>Authors . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi<ecel><nl><fcel>Now you can become a published author, too!<fcel>. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xiii<nl><fcel>Comments welcome. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .<fcel>xiii<nl><fcel>Stay connected to IBM Redbooks<fcel>. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xiv<nl><fcel>Chapter 1. Securing and protecting IBM DB2 data  . . . . . . . . . . . . . . . . . . . . . . . . . . . . .<fcel>1<nl><fcel>1.1 Security fundamentals. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2<ecel><nl><fcel>1.2 Current state of IBM i security . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .<fcel>2<nl><fcel>1.3 DB2 for i security controls . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3<ecel><nl><fcel>1.3.1 Existing row and column control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .<fcel>4<nl><fcel>1.3.2 New controls: Row and Column Access Control. . . . . . . . . . . . . . . . . . . . . . . . . . .<fcel>5<nl><fcel>Chapter 2. Roles and separation of duties . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .<fcel>7<nl><fcel>2.1 Roles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .<fcel>8<nl><fcel>2.1.1 DDM and DRDA application server access: QIBM_DB_DDMDRDA . . . . . . . . . . .<fcel>8<nl><fcel>2.1.2 Toolbox application server access: QIBM_DB_ZDA. . . . . . . . . . . . . . . . . . . . . . . .<fcel>8<nl><fcel>2.1.3 Database Administrator function: QIBM_DB_SQLADM . . . . . . . . . . . . . . . . . . . . .<fcel>9<nl><fcel>2.1.4 Database Information function: QIBM_DB_SYSMON<fcel>. . . . . . . . . . . . . . . . . . . . . . 9<nl><fcel>2.1.5 Security Administrator function: QIBM_DB_SECADM . . . . . . . . . . . . . . . . . . . . . .<fcel>9<nl><fcel>2.1.6 Change Function Usage CL command . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .<fcel>10<nl><fcel>2.1.7 Verifying function usage IDs for RCAC with the FUNCTION_USAGE view . . . . .<fcel>10<nl><fcel>2.2 Separation of duties . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10<ecel><nl><fcel>Chapter 3. Row and Column Access Control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .<fcel>13<nl><fcel>3.1 Explanation of RCAC and the concept of access control . . . . . . . . . . . . . . . . . . . . . . .<fcel>14<nl><fcel>3.1.1 Row permission and column mask definitions<fcel>. . . . . . . . . . . . . . . . . . . . . . . . . . . 14<nl><fcel>3.1.2 Enabling and activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .<fcel>16<nl><fcel>3.2 Special registers and built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .<fcel>18<nl><fcel>3.2.1 Special registers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .<fcel>18<nl><fcel>3.2.2 Built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .<fcel>19<nl><fcel>3.3 VERIFY_GROUP_FOR_USER function . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .<fcel>20<nl><fcel>3.4 Establishing and controlling accessibility by using the RCAC rule text . . . . . . . . . . . . .<fcel>21<nl><fcel>. . . . . . . . . . . . . . . . . . . . . . . .<fcel>22<nl><fcel>3.5 SELECT, INSERT, and UPDATE behavior with RCAC 3.6 Human resources example . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .<fcel>22<nl><fcel>3.6.1 Assigning the QIBM_DB_SECADM function ID to the consultants. . . . . . . . . . . .<fcel>23<nl><fcel>3.6.2 Creating group profiles for the users and their roles . . . . . . . . . . . . . . . . . . . . . . .<fcel>23<nl><fcel>3.6.3 Demonstrating data access without RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .<fcel>24<nl><fcel>3.6.4 Defining and creating row permissions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .<fcel>25<nl><fcel>3.6.5 Defining and creating column masks<fcel>. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26<nl><fcel>3.6.6 Activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .<fcel>28<nl><fcel>3.6.7 Demonstrating data access with RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .<fcel>29<nl><fcel>3.6.8 Demonstrating data access with a view and RCAC . . . . . . . . . . . . . . . . . . . . . . .<fcel>32<nl></otsl>
+<page_footer><loc_53><loc_477><loc_210><loc_482>' Copyright IBM Corp. 2014. All rights reserved.</page_footer>
+<page_footer><loc_440><loc_477><loc_447><loc_482>iii</page_footer>
+<page_break>
+<text><loc_53><loc_47><loc_193><loc_54>DB2 for i Center of Excellence</text>
+<text><loc_77><loc_87><loc_191><loc_98>Solution Brief IBM Systems Lab Services and Training</text>
+<picture><loc_117><loc_171><loc_147><loc_180></picture>
+<section_header_level_1><loc_118><loc_207><loc_154><loc_213>Highlights</section_header_level_1>
+<unordered_list><list_item><loc_118><loc_218><loc_198><loc_226>GLYPH<g115>GLYPH<g3> GLYPH<g40>GLYPH<g81>GLYPH<g75>GLYPH<g68>GLYPH<g81>GLYPH<g70>GLYPH<g72>GLYPH<g3> GLYPH<g87>GLYPH<g75>GLYPH<g72>GLYPH<g3> GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g73>GLYPH<g82>GLYPH<g85>GLYPH<g80>GLYPH<g68>GLYPH<g81>GLYPH<g70>GLYPH<g72>GLYPH<g3> GLYPH<g82>GLYPH<g73>GLYPH<g3> GLYPH<g92>GLYPH<g82>GLYPH<g88>GLYPH<g85> GLYPH<g3> GLYPH<g71>GLYPH<g68>GLYPH<g87>GLYPH<g68>GLYPH<g69>GLYPH<g68>GLYPH<g86>GLYPH<g72>GLYPH<g3> GLYPH<g82>GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g68>GLYPH<g87>GLYPH<g76>GLYPH<g82>GLYPH<g81>GLYPH<g86></list_item>
+<list_item><loc_118><loc_232><loc_212><loc_246>GLYPH<g115>GLYPH<g3> GLYPH<g40>GLYPH<g68>GLYPH<g85> GLYPH<g81>GLYPH<g3> GLYPH<g74>GLYPH<g85>GLYPH<g72>GLYPH<g68>GLYPH<g87>GLYPH<g72>GLYPH<g85>GLYPH<g3> GLYPH<g85>GLYPH<g72>GLYPH<g87>GLYPH<g88>GLYPH<g85> GLYPH<g81>GLYPH<g3> GLYPH<g82>GLYPH<g81>GLYPH<g3> GLYPH<g44>GLYPH<g55>GLYPH<g3> GLYPH<g83>GLYPH<g85>GLYPH<g82>GLYPH<g77>GLYPH<g72>GLYPH<g70>GLYPH<g87>GLYPH<g86> GLYPH<g3> GLYPH<g87>GLYPH<g75>GLYPH<g85>GLYPH<g82>GLYPH<g88>GLYPH<g74>GLYPH<g75>GLYPH<g3> GLYPH<g80>GLYPH<g82>GLYPH<g71>GLYPH<g72>GLYPH<g85> GLYPH<g81>GLYPH<g76>GLYPH<g93>GLYPH<g68>GLYPH<g87>GLYPH<g76>GLYPH<g82>GLYPH<g81>GLYPH<g3> GLYPH<g82>GLYPH<g73>GLYPH<g3> GLYPH<g71>GLYPH<g68>GLYPH<g87>GLYPH<g68>GLYPH<g69>GLYPH<g68>GLYPH<g86>GLYPH<g72>GLYPH<g3> GLYPH<g68>GLYPH<g81>GLYPH<g71> GLYPH<g3> GLYPH<g68>GLYPH<g83>GLYPH<g83>GLYPH<g79>GLYPH<g76>GLYPH<g70>GLYPH<g68>GLYPH<g87>GLYPH<g76>GLYPH<g82>GLYPH<g81>GLYPH<g86></list_item>
+<list_item><loc_118><loc_252><loc_204><loc_260>GLYPH<g115>GLYPH<g3> GLYPH<g53>GLYPH<g72>GLYPH<g79>GLYPH<g92>GLYPH<g3> GLYPH<g82>GLYPH<g81>GLYPH<g3> GLYPH<g44>GLYPH<g37>GLYPH<g48>GLYPH<g3> GLYPH<g72>GLYPH<g91>GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g87>GLYPH<g3> GLYPH<g70>GLYPH<g82>GLYPH<g81>GLYPH<g86>GLYPH<g88>GLYPH<g79>GLYPH<g87>GLYPH<g76>GLYPH<g81>GLYPH<g74>GLYPH<g15>GLYPH<g3> GLYPH<g86>GLYPH<g78>GLYPH<g76>GLYPH<g79>GLYPH<g79>GLYPH<g86> GLYPH<g3> GLYPH<g86>GLYPH<g75>GLYPH<g68>GLYPH<g85>GLYPH<g76>GLYPH<g81>GLYPH<g74>GLYPH<g3> GLYPH<g68>GLYPH<g81>GLYPH<g71>GLYPH<g3> GLYPH<g85>GLYPH<g72>GLYPH<g81>GLYPH<g82>GLYPH<g90>GLYPH<g81>GLYPH<g3> GLYPH<g86>GLYPH<g72>GLYPH<g85>GLYPH<g89>GLYPH<g76>GLYPH<g70>GLYPH<g72>GLYPH<g86></list_item>
+<list_item><loc_118><loc_266><loc_191><loc_274>GLYPH<g115>GLYPH<g3> GLYPH<g55> GLYPH<g68>GLYPH<g78>GLYPH<g72>GLYPH<g3> GLYPH<g68>GLYPH<g71>GLYPH<g89>GLYPH<g68>GLYPH<g81>GLYPH<g87>GLYPH<g68>GLYPH<g74>GLYPH<g72>GLYPH<g3> GLYPH<g82>GLYPH<g73>GLYPH<g3> GLYPH<g68>GLYPH<g70>GLYPH<g70>GLYPH<g72>GLYPH<g86>GLYPH<g86>GLYPH<g3> GLYPH<g87>GLYPH<g82>GLYPH<g3> GLYPH<g68> GLYPH<g3> GLYPH<g90>GLYPH<g82>GLYPH<g85>GLYPH<g79>GLYPH<g71>GLYPH<g90>GLYPH<g76>GLYPH<g71>GLYPH<g72>GLYPH<g3> GLYPH<g86>GLYPH<g82>GLYPH<g88>GLYPH<g85>GLYPH<g70>GLYPH<g72>GLYPH<g3> GLYPH<g82>GLYPH<g73>GLYPH<g3> GLYPH<g72>GLYPH<g91>GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g87>GLYPH<g76>GLYPH<g86>GLYPH<g72></list_item>
 </unordered_list>
-<figure>
-<location><page_3><loc_10><loc_13><loc_42><loc_24></location>
-</figure>
-<text><location><page_3><loc_75><loc_82><loc_83><loc_83></location>Power Services</text>
-<section_header_level_1><location><page_3><loc_46><loc_65><loc_76><loc_70></location>DB2 for i Center of Excellence</section_header_level_1>
-<text><location><page_3><loc_46><loc_64><loc_79><loc_65></location>Expert help to achieve your business requirements</text>
-<section_header_level_1><location><page_3><loc_46><loc_59><loc_72><loc_60></location>We build confident, satisfied clients</section_header_level_1>
-<text><location><page_3><loc_46><loc_56><loc_80><loc_59></location>No one else has the vast consulting experiences, skills sharing and renown service offerings to do what we can do for you.</text>
-<text><location><page_3><loc_46><loc_54><loc_60><loc_55></location>Because no one else is IBM.</text>
-<text><location><page_3><loc_46><loc_46><loc_82><loc_52></location>With combined experiences and direct access to development groups, we're the experts in IBM DB2® for i. The DB2 for i Center of Excellence (CoE) can help you achieve-perhaps reexamine and exceed-your business requirements and gain more confidence and satisfaction in IBM product data management products and solutions.</text>
-<section_header_level_1><location><page_3><loc_46><loc_44><loc_71><loc_45></location>Who we are, some of what we do</section_header_level_1>
-<text><location><page_3><loc_46><loc_42><loc_71><loc_43></location>Global CoE engagements cover topics including:</text>
-<unordered_list>
-<list_item><location><page_3><loc_46><loc_40><loc_66><loc_41></location>r Database performance and scalability</list_item>
-<list_item><location><page_3><loc_46><loc_39><loc_69><loc_39></location>r Advanced SQL knowledge and skills transfer</list_item>
-<list_item><location><page_3><loc_46><loc_37><loc_64><loc_38></location>r Business intelligence and analytics</list_item>
-<list_item><location><page_3><loc_46><loc_36><loc_56><loc_37></location>r DB2 Web Query</list_item>
-<list_item><location><page_3><loc_46><loc_35><loc_82><loc_36></location>r Query/400 modernization for better reporting and analysis capabilities</list_item>
-<list_item><location><page_3><loc_46><loc_33><loc_69><loc_34></location>r Database modernization and re-engineering</list_item>
-<list_item><location><page_3><loc_46><loc_32><loc_65><loc_33></location>r Data-centric architecture and design</list_item>
-<list_item><location><page_3><loc_46><loc_31><loc_76><loc_32></location>r Extremely large database and overcoming limits to growth</list_item>
-<list_item><location><page_3><loc_46><loc_30><loc_62><loc_30></location>r ISV education and enablement</list_item>
+<picture><loc_52><loc_381><loc_211><loc_434></picture>
+<text><loc_377><loc_87><loc_414><loc_92>Power Services</text>
+<section_header_level_1><loc_229><loc_151><loc_379><loc_175>DB2 for i Center of Excellence</section_header_level_1>
+<text><loc_229><loc_175><loc_395><loc_181>Expert help to achieve your business requirements</text>
+<section_header_level_1><loc_229><loc_199><loc_362><loc_205>We build confident, satisfied clients</section_header_level_1>
+<text><loc_229><loc_207><loc_399><loc_218>No one else has the vast consulting experiences, skills sharing and renown service offerings to do what we can do for you.</text>
+<text><loc_229><loc_226><loc_301><loc_230>Because no one else is IBM.</text>
+<text><loc_229><loc_238><loc_409><loc_268>With combined experiences and direct access to development groups, we're the experts in IBM DB2® for i. The DB2 for i Center of Excellence (CoE) can help you achieve-perhaps reexamine and exceed-your business requirements and gain more confidence and satisfaction in IBM product data management products and solutions.</text>
+<section_header_level_1><loc_229><loc_276><loc_355><loc_282>Who we are, some of what we do</section_header_level_1>
+<text><loc_229><loc_284><loc_355><loc_288>Global CoE engagements cover topics including:</text>
+<unordered_list><list_item><loc_229><loc_296><loc_328><loc_301>r Database performance and scalability</list_item>
+<list_item><loc_229><loc_303><loc_347><loc_307>r Advanced SQL knowledge and skills transfer</list_item>
+<list_item><loc_229><loc_309><loc_320><loc_314>r Business intelligence and analytics</list_item>
+<list_item><loc_229><loc_315><loc_278><loc_320>r DB2 Web Query</list_item>
+<list_item><loc_229><loc_322><loc_412><loc_327>r Query/400 modernization for better reporting and analysis capabilities</list_item>
+<list_item><loc_229><loc_328><loc_346><loc_333>r Database modernization and re-engineering</list_item>
+<list_item><loc_229><loc_335><loc_327><loc_339>r Data-centric architecture and design</list_item>
+<list_item><loc_229><loc_341><loc_381><loc_346>r Extremely large database and overcoming limits to growth</list_item>
+<list_item><loc_229><loc_348><loc_312><loc_352>r ISV education and enablement</list_item>
 </unordered_list>
-<section_header_level_1><location><page_4><loc_11><loc_88><loc_25><loc_91></location>Preface</section_header_level_1>
-<text><location><page_4><loc_22><loc_75><loc_89><loc_83></location>This IBMfi Redpaper™ publication provides information about the IBM i 7.2 feature of IBM DB2fi for i Row and Column Access Control (RCAC). It offers a broad description of the function and advantages of controlling access to data in a comprehensive and transparent way. This publication helps you understand the capabilities of RCAC and provides examples of defining, creating, and implementing the row permissions and column masks in a relational database environment.</text>
-<text><location><page_4><loc_22><loc_67><loc_89><loc_73></location>This paper is intended for database engineers, data-centric application developers, and security officers who want to design and implement RCAC as a part of their data control and governance policy. A solid background in IBM i object level security, DB2 for i relational database concepts, and SQL is assumed.</text>
-<text><location><page_4><loc_22><loc_57><loc_89><loc_60></location>This paper was produced by the IBM DB2 for i Center of Excellence team in partnership with the International Technical Support Organization (ITSO), Rochester, Minnesota US.</text>
-<figure>
-<location><page_4><loc_23><loc_36><loc_41><loc_53></location>
-</figure>
-<figure>
-<location><page_4><loc_24><loc_20><loc_41><loc_33></location>
-</figure>
-<text><location><page_4><loc_43><loc_35><loc_88><loc_53></location>Jim Bainbridge is a senior DB2 consultant on the DB2 for i Center of Excellence team in the IBM Lab Services and Training organization. His primary role is training and implementation services for IBM DB2 Web Query for i and business analytics. Jim began his career with IBM 30 years ago in the IBM Rochester Development Lab, where he developed cooperative processing products that paired IBM PCs with IBM S/36 and AS/.400 systems. In the years since, Jim has held numerous technical roles, including independent software vendors technical support on a broad range of IBM technologies and products, and supporting customers in the IBM Executive Briefing Center and IBM Project Office.</text>
-<text><location><page_4><loc_43><loc_14><loc_88><loc_33></location>Hernando Bedoya is a Senior IT Specialist at STG Lab Services and Training in Rochester, Minnesota. He writes extensively and teaches IBM classes worldwide in all areas of DB2 for i. Before joining STG Lab Services, he worked in the ITSO for nine years writing multiple IBM Redbooksfi publications. He also worked for IBM Colombia as an IBM AS/400fi IT Specialist doing presales support for the Andean countries. He has 28 years of experience in the computing field and has taught database classes in Colombian universities. He holds a Master's degree in Computer Science from EAFIT, Colombia. His areas of expertise are database technology, performance, and data warehousing. Hernando can be contacted at hbedoya@us.ibm.com .</text>
-<section_header_level_1><location><page_4><loc_11><loc_62><loc_20><loc_64></location>Authors</section_header_level_1>
-<figure>
-<location><page_5><loc_5><loc_70><loc_39><loc_91></location>
-</figure>
-<text><location><page_5><loc_13><loc_65><loc_19><loc_66></location>Chapter 1.</text>
-<text><location><page_5><loc_82><loc_84><loc_85><loc_88></location>1</text>
-<section_header_level_1><location><page_5><loc_22><loc_61><loc_89><loc_68></location>Securing and protecting IBM DB2 data</section_header_level_1>
-<text><location><page_5><loc_22><loc_46><loc_89><loc_56></location>Recent news headlines are filled with reports of data breaches and cyber-attacks impacting global businesses of all sizes. The Identity Theft Resource Center$^{1}$ reports that almost 5000 data breaches have occurred since 2005, exposing over 600 million records of data. The financial cost of these data breaches is skyrocketing. Studies from the Ponemon Institute$^{2}$ revealed that the average cost of a data breach increased in 2013 by 15% globally and resulted in a brand equity loss of $9.4 million per attack. The average cost that is incurred for each lost record containing sensitive information increased more than 9% to $145 per record.</text>
-<text><location><page_5><loc_22><loc_38><loc_86><loc_44></location>Businesses must make a serious effort to secure their data and recognize that securing information assets is a cost of doing business. In many parts of the world and in many industries, securing the data is required by law and subject to audits. Data security is no longer an option; it is a requirement.</text>
-<text><location><page_5><loc_22><loc_34><loc_89><loc_37></location>This chapter describes how you can secure and protect data in DB2 for i. The following topics are covered in this chapter:</text>
-<unordered_list>
-<list_item><location><page_5><loc_22><loc_32><loc_41><loc_33></location>GLYPH<SM590000> Security fundamentals</list_item>
-<list_item><location><page_5><loc_22><loc_30><loc_46><loc_32></location>GLYPH<SM590000> Current state of IBM i security</list_item>
-<list_item><location><page_5><loc_22><loc_29><loc_43><loc_30></location>GLYPH<SM590000> DB2 for i security controls</list_item>
+<page_break>
+<section_header_level_1><loc_53><loc_47><loc_124><loc_61>Preface</section_header_level_1>
+<text><loc_112><loc_84><loc_447><loc_127>This IBMfi Redpaper™ publication provides information about the IBM i 7.2 feature of IBM DB2fi for i Row and Column Access Control (RCAC). It offers a broad description of the function and advantages of controlling access to data in a comprehensive and transparent way. This publication helps you understand the capabilities of RCAC and provides examples of defining, creating, and implementing the row permissions and column masks in a relational database environment.</text>
+<text><loc_112><loc_135><loc_446><loc_164>This paper is intended for database engineers, data-centric application developers, and security officers who want to design and implement RCAC as a part of their data control and governance policy. A solid background in IBM i object level security, DB2 for i relational database concepts, and SQL is assumed.</text>
+<text><loc_112><loc_202><loc_447><loc_216>This paper was produced by the IBM DB2 for i Center of Excellence team in partnership with the International Technical Support Organization (ITSO), Rochester, Minnesota US.</text>
+<picture><loc_116><loc_237><loc_205><loc_318></picture>
+<text><loc_215><loc_237><loc_442><loc_326>Jim Bainbridge is a senior DB2 consultant on the DB2 for i Center of Excellence team in the IBM Lab Services and Training organization. His primary role is training and implementation services for IBM DB2 Web Query for i and business analytics. Jim began his career with IBM 30 years ago in the IBM Rochester Development Lab, where he developed cooperative processing products that paired IBM PCs with IBM S/36 and AS/.400 systems. In the years since, Jim has held numerous technical roles, including independent software vendors technical support on a broad range of IBM technologies and products, and supporting customers in the IBM Executive Briefing Center and IBM Project Office.</text>
+<picture><loc_119><loc_333><loc_206><loc_401></picture>
+<text><loc_215><loc_333><loc_442><loc_430>Hernando Bedoya is a Senior IT Specialist at STG Lab Services and Training in Rochester, Minnesota. He writes extensively and teaches IBM classes worldwide in all areas of DB2 for i. Before joining STG Lab Services, he worked in the ITSO for nine years writing multiple IBM Redbooksfi publications. He also worked for IBM Colombia as an IBM AS/400fi IT Specialist doing presales support for the Andean countries. He has 28 years of experience in the computing field and has taught database classes in Colombian universities. He holds a Master's degree in Computer Science from EAFIT, Colombia. His areas of expertise are database technology, performance, and data warehousing. Hernando can be contacted at hbedoya@us.ibm.com .</text>
+<section_header_level_1><loc_53><loc_182><loc_102><loc_191>Authors</section_header_level_1>
+<page_footer><loc_53><loc_477><loc_210><loc_482>' Copyright IBM Corp. 2014. All rights reserved.</page_footer>
+<page_footer><loc_440><loc_477><loc_447><loc_482>xi</page_footer>
+<page_break>
+<picture><loc_26><loc_45><loc_196><loc_150></picture>
+<text><loc_409><loc_59><loc_427><loc_82>1</text>
+<text><loc_66><loc_170><loc_94><loc_174>Chapter 1.</text>
+<section_header_level_1><loc_112><loc_161><loc_447><loc_196>Securing and protecting IBM DB2 data</section_header_level_1>
+<text><loc_112><loc_220><loc_447><loc_271>Recent news headlines are filled with reports of data breaches and cyber-attacks impacting global businesses of all sizes. The Identity Theft Resource Center$^{1}$ reports that almost 5000 data breaches have occurred since 2005, exposing over 600 million records of data. The financial cost of these data breaches is skyrocketing. Studies from the Ponemon Institute$^{2}$ revealed that the average cost of a data breach increased in 2013 by 15% globally and resulted in a brand equity loss of $9.4 million per attack. The average cost that is incurred for each lost record containing sensitive information increased more than 9% to $145 per record.</text>
+<text><loc_112><loc_279><loc_431><loc_308>Businesses must make a serious effort to secure their data and recognize that securing information assets is a cost of doing business. In many parts of the world and in many industries, securing the data is required by law and subject to audits. Data security is no longer an option; it is a requirement.</text>
+<text><loc_112><loc_316><loc_447><loc_329>This chapter describes how you can secure and protect data in DB2 for i. The following topics are covered in this chapter:</text>
+<unordered_list><list_item><loc_112><loc_334><loc_204><loc_340>GLYPH<SM590000> Security fundamentals</list_item>
+<list_item><loc_112><loc_342><loc_231><loc_348>GLYPH<SM590000> Current state of IBM i security</list_item>
+<list_item><loc_112><loc_350><loc_216><loc_355>GLYPH<SM590000> DB2 for i security controls</list_item>
 </unordered_list>
-<section_header_level_1><location><page_6><loc_11><loc_89><loc_44><loc_91></location>1.1 Security fundamentals</section_header_level_1>
-<text><location><page_6><loc_22><loc_84><loc_89><loc_87></location>Before reviewing database security techniques, there are two fundamental steps in securing information assets that must be described:</text>
-<unordered_list>
-<list_item><location><page_6><loc_22><loc_77><loc_89><loc_83></location>GLYPH<SM590000> First, and most important, is the definition of a company's security policy . Without a security policy, there is no definition of what are acceptable practices for using, accessing, and storing information by who, what, when, where, and how. A security policy should minimally address three things: confidentiality, integrity, and availability.</list_item>
-<list_item><location><page_6><loc_25><loc_66><loc_89><loc_76></location>The monitoring and assessment of adherence to the security policy determines whether your security strategy is working. Often, IBM security consultants are asked to perform security assessments for companies without regard to the security policy. Although these assessments can be useful for observing how the system is defined and how data is being accessed, they cannot determine the level of security without a security policy. Without a security policy, it really is not an assessment as much as it is a baseline for monitoring the changes in the security settings that are captured.</list_item>
+<footnote><loc_112><loc_453><loc_211><loc_458>$^{1 }$http://www.idtheftcenter.org</footnote>
+<footnote><loc_112><loc_459><loc_191><loc_464>$^{2 }$http://www.ponemon.org /</footnote>
+<page_footer><loc_53><loc_477><loc_210><loc_482>' Copyright IBM Corp. 2014. All rights reserved.</page_footer>
+<page_footer><loc_443><loc_477><loc_447><loc_482>1</page_footer>
+<page_break>
+<section_header_level_1><loc_53><loc_47><loc_218><loc_56>1.1 Security fundamentals</section_header_level_1>
+<text><loc_112><loc_67><loc_445><loc_81>Before reviewing database security techniques, there are two fundamental steps in securing information assets that must be described:</text>
+<unordered_list><list_item><loc_112><loc_85><loc_447><loc_114>GLYPH<SM590000> First, and most important, is the definition of a company's security policy . Without a security policy, there is no definition of what are acceptable practices for using, accessing, and storing information by who, what, when, where, and how. A security policy should minimally address three things: confidentiality, integrity, and availability.</list_item>
+<list_item><loc_124><loc_119><loc_447><loc_170>The monitoring and assessment of adherence to the security policy determines whether your security strategy is working. Often, IBM security consultants are asked to perform security assessments for companies without regard to the security policy. Although these assessments can be useful for observing how the system is defined and how data is being accessed, they cannot determine the level of security without a security policy. Without a security policy, it really is not an assessment as much as it is a baseline for monitoring the changes in the security settings that are captured.</list_item>
 </unordered_list>
-<text><location><page_6><loc_25><loc_64><loc_89><loc_65></location>A security policy is what defines whether the system and its settings are secure (or not).</text>
-<unordered_list>
-<list_item><location><page_6><loc_22><loc_53><loc_89><loc_63></location>GLYPH<SM590000> The second fundamental in securing data assets is the use of resource security . If implemented properly, resource security prevents data breaches from both internal and external intrusions. Resource security controls are closely tied to the part of the security policy that defines who should have access to what information resources. A hacker might be good enough to get through your company firewalls and sift his way through to your system, but if they do not have explicit access to your database, the hacker cannot compromise your information assets.</list_item>
+<text><loc_124><loc_175><loc_443><loc_181>A security policy is what defines whether the system and its settings are secure (or not).</text>
+<unordered_list><list_item><loc_112><loc_186><loc_447><loc_237>GLYPH<SM590000> The second fundamental in securing data assets is the use of resource security . If implemented properly, resource security prevents data breaches from both internal and external intrusions. Resource security controls are closely tied to the part of the security policy that defines who should have access to what information resources. A hacker might be good enough to get through your company firewalls and sift his way through to your system, but if they do not have explicit access to your database, the hacker cannot compromise your information assets.</list_item>
 </unordered_list>
-<text><location><page_6><loc_22><loc_48><loc_87><loc_51></location>With your eyes now open to the importance of securing information assets, the rest of this chapter reviews the methods that are available for securing database resources on IBM i.</text>
-<section_header_level_1><location><page_6><loc_11><loc_43><loc_53><loc_45></location>1.2 Current state of IBM i security</section_header_level_1>
-<text><location><page_6><loc_22><loc_35><loc_89><loc_41></location>Because of the inherently secure nature of IBM i, many clients rely on the default system settings to protect their business data that is stored in DB2 for i. In most cases, this means no data protection because the default setting for the Create default public authority (QCRTAUT) system value is *CHANGE.</text>
-<text><location><page_6><loc_22><loc_26><loc_89><loc_33></location>Even more disturbing is that many IBM i clients remain in this state, despite the news headlines and the significant costs that are involved with databases being compromised. This default security configuration makes it quite challenging to implement basic security policies. A tighter implementation is required if you really want to protect one of your company's most valuable assets, which is the data.</text>
-<text><location><page_6><loc_22><loc_14><loc_89><loc_24></location>Traditionally, IBM i applications have employed menu-based security to counteract this default configuration that gives all users access to the data. The theory is that data is protected by the menu options controlling what database operations that the user can perform. This approach is ineffective, even if the user profile is restricted from running interactive commands. The reason is that in today's connected world there are a multitude of interfaces into the system, from web browsers to PC clients, that bypass application menus. If there are no object-level controls, users of these newer interfaces have an open door to your data.</text>
-<text><location><page_7><loc_22><loc_81><loc_89><loc_91></location>Many businesses are trying to limit data access to a need-to-know basis. This security goal means that users should be given access only to the minimum set of data that is required to perform their job. Often, users with object-level access are given access to row and column values that are beyond what their business task requires because that object-level security provides an all-or-nothing solution. For example, object-level controls allow a manager to access data about all employees. Most security policies limit a manager to accessing data only for the employees that they manage.</text>
-<section_header_level_1><location><page_7><loc_11><loc_77><loc_49><loc_78></location>1.3.1 Existing row and column control</section_header_level_1>
-<text><location><page_7><loc_22><loc_68><loc_88><loc_75></location>Some IBM i clients have tried augmenting the all-or-nothing object-level security with SQL views (or logical files) and application logic, as shown in Figure 1-2. However, application-based logic is easy to bypass with all of the different data access interfaces that are provided by the IBM i operating system, such as Open Database Connectivity (ODBC) and System i Navigator.</text>
-<text><location><page_7><loc_22><loc_60><loc_89><loc_66></location>Using SQL views to limit access to a subset of the data in a table also has its own set of challenges. First, there is the complexity of managing all of the SQL view objects that are used for securing data access. Second, scaling a view-based security solution can be difficult as the amount of data grows and the number of users increases.</text>
-<text><location><page_7><loc_22><loc_54><loc_89><loc_59></location>Even if you are willing to live with these performance and management issues, a user with *ALLOBJ access still can directly access all of the data in the underlying DB2 table and easily bypass the security controls that are built into an SQL view.</text>
-<figure>
-<location><page_7><loc_22><loc_13><loc_89><loc_53></location>
-<caption>Figure 1-2 Existing row and column controls</caption>
-</figure>
-<section_header_level_1><location><page_8><loc_11><loc_89><loc_55><loc_91></location>2.1.6 Change Function Usage CL command</section_header_level_1>
-<text><location><page_8><loc_22><loc_87><loc_89><loc_88></location>The following CL commands can be used to work with, display, or change function usage IDs:</text>
-<unordered_list>
-<list_item><location><page_8><loc_22><loc_84><loc_49><loc_86></location>GLYPH<SM590000> Work Function Usage ( WRKFCNUSG )</list_item>
-<list_item><location><page_8><loc_22><loc_83><loc_51><loc_84></location>GLYPH<SM590000> Change Function Usage ( CHGFCNUSG )</list_item>
-<list_item><location><page_8><loc_22><loc_81><loc_51><loc_83></location>GLYPH<SM590000> Display Function Usage ( DSPFCNUSG )</list_item>
+<text><loc_112><loc_245><loc_437><loc_259>With your eyes now open to the importance of securing information assets, the rest of this chapter reviews the methods that are available for securing database resources on IBM i.</text>
+<section_header_level_1><loc_53><loc_277><loc_264><loc_286>1.2 Current state of IBM i security</section_header_level_1>
+<text><loc_112><loc_297><loc_447><loc_326>Because of the inherently secure nature of IBM i, many clients rely on the default system settings to protect their business data that is stored in DB2 for i. In most cases, this means no data protection because the default setting for the Create default public authority (QCRTAUT) system value is *CHANGE.</text>
+<text><loc_112><loc_334><loc_447><loc_370>Even more disturbing is that many IBM i clients remain in this state, despite the news headlines and the significant costs that are involved with databases being compromised. This default security configuration makes it quite challenging to implement basic security policies. A tighter implementation is required if you really want to protect one of your company's most valuable assets, which is the data.</text>
+<text><loc_112><loc_378><loc_447><loc_429>Traditionally, IBM i applications have employed menu-based security to counteract this default configuration that gives all users access to the data. The theory is that data is protected by the menu options controlling what database operations that the user can perform. This approach is ineffective, even if the user profile is restricted from running interactive commands. The reason is that in today's connected world there are a multitude of interfaces into the system, from web browsers to PC clients, that bypass application menus. If there are no object-level controls, users of these newer interfaces have an open door to your data.</text>
+<page_footer><loc_53><loc_477><loc_59><loc_482>2</page_footer>
+<page_footer><loc_72><loc_477><loc_269><loc_482>Row and Column Access Control Support in IBM DB2 for i</page_footer>
+<page_break>
+<text><loc_112><loc_45><loc_445><loc_96>Many businesses are trying to limit data access to a need-to-know basis. This security goal means that users should be given access only to the minimum set of data that is required to perform their job. Often, users with object-level access are given access to row and column values that are beyond what their business task requires because that object-level security provides an all-or-nothing solution. For example, object-level controls allow a manager to access data about all employees. Most security policies limit a manager to accessing data only for the employees that they manage.</text>
+<section_header_level_1><loc_53><loc_109><loc_246><loc_117>1.3.1 Existing row and column control</section_header_level_1>
+<text><loc_112><loc_126><loc_442><loc_162>Some IBM i clients have tried augmenting the all-or-nothing object-level security with SQL views (or logical files) and application logic, as shown in Figure 1-2. However, application-based logic is easy to bypass with all of the different data access interfaces that are provided by the IBM i operating system, such as Open Database Connectivity (ODBC) and System i Navigator.</text>
+<text><loc_112><loc_170><loc_447><loc_199>Using SQL views to limit access to a subset of the data in a table also has its own set of challenges. First, there is the complexity of managing all of the SQL view objects that are used for securing data access. Second, scaling a view-based security solution can be difficult as the amount of data grows and the number of users increases.</text>
+<text><loc_112><loc_207><loc_447><loc_228>Even if you are willing to live with these performance and management issues, a user with *ALLOBJ access still can directly access all of the data in the underlying DB2 table and easily bypass the security controls that are built into an SQL view.</text>
+<picture><loc_111><loc_237><loc_446><loc_435><caption><loc_112><loc_437><loc_259><loc_442>Figure 1-2 Existing row and column controls</caption></picture>
+<page_footer><loc_53><loc_477><loc_59><loc_482>4</page_footer>
+<page_footer><loc_72><loc_477><loc_269><loc_482>Row and Column Access Control Support in IBM DB2 for i</page_footer>
+<page_break>
+<section_header_level_1><loc_53><loc_45><loc_274><loc_53>2.1.6 Change Function Usage CL command</section_header_level_1>
+<text><loc_112><loc_62><loc_447><loc_67>The following CL commands can be used to work with, display, or change function usage IDs:</text>
+<unordered_list><list_item><loc_112><loc_72><loc_246><loc_78>GLYPH<SM590000> Work Function Usage ( WRKFCNUSG )</list_item>
+<list_item><loc_112><loc_80><loc_256><loc_86>GLYPH<SM590000> Change Function Usage ( CHGFCNUSG )</list_item>
+<list_item><loc_112><loc_87><loc_254><loc_93>GLYPH<SM590000> Display Function Usage ( DSPFCNUSG )</list_item>
 </unordered_list>
-<text><location><page_8><loc_22><loc_77><loc_84><loc_80></location>For example, the following CHGFCNUSG command shows granting authorization to user HBEDOYA to administer and manage RCAC rules:</text>
-<text><location><page_8><loc_22><loc_75><loc_72><loc_76></location>CHGFCNUSG FCNID(QIBM_DB_SECADM) USER(HBEDOYA) USAGE(*ALLOWED)</text>
-<section_header_level_1><location><page_8><loc_11><loc_71><loc_89><loc_72></location>2.1.7 Verifying function usage IDs for RCAC with the FUNCTION_USAGE view</section_header_level_1>
-<text><location><page_8><loc_22><loc_66><loc_85><loc_69></location>The FUNCTION_USAGE view contains function usage configuration details. Table 2-1 describes the columns in the FUNCTION_USAGE view.</text>
-<table>
-<location><page_8><loc_22><loc_44><loc_89><loc_63></location>
-<caption>Table 2-1 FUNCTION_USAGE view</caption>
-<row_0><col_0><col_header>Column name</col_0><col_1><col_header>Data type</col_1><col_2><col_header>Description</col_2></row_0>
-<row_1><col_0><body>FUNCTION_ID</col_0><col_1><body>VARCHAR(30)</col_1><col_2><body>ID of the function.</col_2></row_1>
-<row_2><col_0><body>USER_NAME</col_0><col_1><body>VARCHAR(10)</col_1><col_2><body>Name of the user profile that has a usage setting for this  function.</col_2></row_2>
-<row_3><col_0><body>USAGE</col_0><col_1><body>VARCHAR(7)</col_1><col_2><body>Usage setting: GLYPH<SM590000> ALLOWED: The user profile is allowed to use the function. GLYPH<SM590000> DENIED: The user profile is not allowed to use the function.</col_2></row_3>
-<row_4><col_0><body>USER_TYPE</col_0><col_1><body>VARCHAR(5)</col_1><col_2><body>Type of user profile: GLYPH<SM590000> USER: The user profile is a user. GLYPH<SM590000> GROUP: The user profile is a group.</col_2></row_4>
-</table>
-<text><location><page_8><loc_22><loc_40><loc_89><loc_43></location>To discover who has authorization to define and manage RCAC, you can use the query that is shown in Example 2-1.</text>
-<paragraph><location><page_8><loc_22><loc_38><loc_76><loc_39></location>Example 2-1 Query to determine who has authority to define and manage RCAC</paragraph>
-<text><location><page_8><loc_22><loc_35><loc_28><loc_36></location>SELECT</text>
-<text><location><page_8><loc_30><loc_35><loc_41><loc_36></location>function_id,</text>
-<text><location><page_8><loc_27><loc_34><loc_39><loc_35></location>user_name,</text>
-<text><location><page_8><loc_28><loc_32><loc_36><loc_33></location>usage,</text>
-<text><location><page_8><loc_27><loc_31><loc_39><loc_32></location>user_type</text>
-<text><location><page_8><loc_22><loc_29><loc_26><loc_30></location>FROM</text>
-<text><location><page_8><loc_29><loc_29><loc_43><loc_30></location>function_usage</text>
-<text><location><page_8><loc_22><loc_28><loc_27><loc_29></location>WHERE</text>
-<text><location><page_8><loc_29><loc_28><loc_54><loc_29></location>function_id=’QIBM_DB_SECADM’</text>
-<text><location><page_8><loc_22><loc_26><loc_29><loc_27></location>ORDER BY</text>
-<text><location><page_8><loc_31><loc_26><loc_39><loc_27></location>user_name;</text>
-<section_header_level_1><location><page_8><loc_11><loc_20><loc_41><loc_22></location>2.2 Separation of duties</section_header_level_1>
-<text><location><page_8><loc_22><loc_10><loc_89><loc_18></location>Separation of duties helps businesses comply with industry regulations or organizational requirements and simplifies the management of authorities. Separation of duties is commonly used to prevent fraudulent activities or errors by a single person. It provides the ability for administrative functions to be divided across individuals without overlapping responsibilities, so that one user does not possess unlimited authority, such as with the *ALLOBJ authority.</text>
-<text><location><page_9><loc_22><loc_82><loc_89><loc_91></location>For example, assume that a business has assigned the duty to manage security on IBM i to Theresa. Before release IBM i 7.2, to grant privileges, Theresa had to have the same privileges Theresa was granting to others. Therefore, to grant *USE privileges to the PAYROLL table, Theresa had to have *OBJMGT and *USE authority (or a higher level of authority, such as *ALLOBJ). This requirement allowed Theresa to access the data in the PAYROLL table even though Theresa's job description was only to manage its security.</text>
-<text><location><page_9><loc_22><loc_75><loc_89><loc_81></location>In IBM i 7.2, the QIBM_DB_SECADM function usage grants authorities, revokes authorities, changes ownership, or changes the primary group without giving access to the object or, in the case of a database table, to the data that is in the table or allowing other operations on the table.</text>
-<text><location><page_9><loc_22><loc_71><loc_88><loc_73></location>QIBM_DB_SECADM function usage can be granted only by a user with *SECADM special authority and can be given to a user or a group.</text>
-<text><location><page_9><loc_22><loc_65><loc_89><loc_69></location>QIBM_DB_SECADM also is responsible for administering RCAC, which restricts which rows a user is allowed to access in a table and whether a user is allowed to see information in certain columns of a table.</text>
-<text><location><page_9><loc_22><loc_57><loc_88><loc_63></location>A preferred practice is that the RCAC administrator has the QIBM_DB_SECADM function usage ID, but absolutely no other data privileges. The result is that the RCAC administrator can deploy and maintain the RCAC constructs, but cannot grant themselves unauthorized access to data itself.</text>
-<text><location><page_9><loc_22><loc_53><loc_89><loc_56></location>Table 2-2 shows a comparison of the different function usage IDs and *JOBCTL authority to the different CL commands and DB2 for i tools.</text>
-<table>
-<location><page_9><loc_11><loc_9><loc_89><loc_50></location>
-<caption>Table 2-2 Comparison of the different function usage IDs and *JOBCTL authority</caption>
-<row_0><col_0><row_header>User action</col_0><col_1><body>*JOBCTL</col_1><col_2><body>QIBM_DB_SECADM</col_2><col_3><body>QIBM_DB_SQLADM</col_3><col_4><body>QIBM_DB_SYSMON</col_4><col_5><body>No Authority</col_5></row_0>
-<row_1><col_0><row_header>SET CURRENT DEGREE  (SQL statement)</col_0><col_1><body>X</col_1><col_2><body></col_2><col_3><body>X</col_3><col_4><body></col_4><col_5><body></col_5></row_1>
-<row_2><col_0><row_header>CHGQRYA  command targeting a different user's job</col_0><col_1><body>X</col_1><col_2><body></col_2><col_3><body>X</col_3><col_4><body></col_4><col_5><body></col_5></row_2>
-<row_3><col_0><row_header>STRDBMON  or  ENDDBMON  commands targeting a different user's job</col_0><col_1><body>X</col_1><col_2><body></col_2><col_3><body>X</col_3><col_4><body></col_4><col_5><body></col_5></row_3>
-<row_4><col_0><row_header>STRDBMON  or  ENDDBMON  commands targeting a job that matches the current user</col_0><col_1><body>X</col_1><col_2><body></col_2><col_3><body>X</col_3><col_4><body>X</col_4><col_5><body>X</col_5></row_4>
-<row_5><col_0><row_header>QUSRJOBI() API format 900 or System i Navigator's SQL Details for Job</col_0><col_1><body>X</col_1><col_2><body></col_2><col_3><body>X</col_3><col_4><body>X</col_4><col_5><body></col_5></row_5>
-<row_6><col_0><row_header>Visual Explain within Run SQL scripts</col_0><col_1><body>X</col_1><col_2><body></col_2><col_3><body>X</col_3><col_4><body>X</col_4><col_5><body>X</col_5></row_6>
-<row_7><col_0><row_header>Visual Explain outside of Run SQL scripts</col_0><col_1><body>X</col_1><col_2><body></col_2><col_3><body>X</col_3><col_4><body></col_4><col_5><body></col_5></row_7>
-<row_8><col_0><row_header>ANALYZE PLAN CACHE procedure</col_0><col_1><body>X</col_1><col_2><body></col_2><col_3><body>X</col_3><col_4><body></col_4><col_5><body></col_5></row_8>
-<row_9><col_0><row_header>DUMP PLAN CACHE procedure</col_0><col_1><body>X</col_1><col_2><body></col_2><col_3><body>X</col_3><col_4><body></col_4><col_5><body></col_5></row_9>
-<row_10><col_0><row_header>MODIFY PLAN CACHE procedure</col_0><col_1><body>X</col_1><col_2><body></col_2><col_3><body>X</col_3><col_4><body></col_4><col_5><body></col_5></row_10>
-<row_11><col_0><row_header>MODIFY PLAN CACHE PROPERTIES procedure (currently does not check authority)</col_0><col_1><body>X</col_1><col_2><body></col_2><col_3><body>X</col_3><col_4><body></col_4><col_5><body></col_5></row_11>
-<row_12><col_0><row_header>CHANGE PLAN CACHE SIZE procedure (currently does not check authority)</col_0><col_1><body>X</col_1><col_2><body></col_2><col_3><body>X</col_3><col_4><body></col_4><col_5><body></col_5></row_12>
-</table>
-<figure>
-<location><page_10><loc_22><loc_48><loc_89><loc_86></location>
-<caption>The SQL CREATE PERMISSION statement that is shown in Figure 3-1 is used to define and initially enable or disable the row access rules.Figure 3-1 CREATE PERMISSION SQL statement</caption>
-</figure>
-<section_header_level_1><location><page_10><loc_22><loc_43><loc_35><loc_44></location>Column mask</section_header_level_1>
-<text><location><page_10><loc_22><loc_37><loc_89><loc_43></location>A column mask is a database object that manifests a column value access control rule for a specific column in a specific table. It uses a CASE expression that describes what you see when you access the column. For example, a teller can see only the last four digits of a tax identification number.</text>
-<paragraph><location><page_11><loc_22><loc_90><loc_67><loc_91></location>Table 3-1 summarizes these special registers and their values.</paragraph>
-<table>
-<location><page_11><loc_22><loc_74><loc_89><loc_87></location>
-<caption>Table 3-1 Special registers and their corresponding values</caption>
-<row_0><col_0><col_header>Special register</col_0><col_1><col_header>Corresponding value</col_1></row_0>
-<row_1><col_0><body>USER or SESSION_USER</col_0><col_1><body>The effective user of the thread excluding adopted authority.</col_1></row_1>
-<row_2><col_0><body>CURRENT_USER</col_0><col_1><body>The effective user of the thread including adopted authority. When no adopted  authority is present, this has the same value as USER.</col_1></row_2>
-<row_3><col_0><body>SYSTEM_USER</col_0><col_1><body>The authorization ID that initiated the connection.</col_1></row_3>
-</table>
-<text><location><page_11><loc_22><loc_70><loc_88><loc_73></location>Figure 3-5 shows the difference in the special register values when an adopted authority is used:</text>
-<unordered_list>
-<list_item><location><page_11><loc_22><loc_68><loc_67><loc_69></location>GLYPH<SM590000> A user connects to the server using the user profile ALICE.</list_item>
-<list_item><location><page_11><loc_22><loc_66><loc_74><loc_67></location>GLYPH<SM590000> USER and CURRENT USER initially have the same value of ALICE.</list_item>
-<list_item><location><page_11><loc_22><loc_62><loc_88><loc_65></location>GLYPH<SM590000> ALICE calls an SQL procedure that is named proc1, which is owned by user profile JOE and was created to adopt JOE's authority when it is called.</list_item>
-<list_item><location><page_11><loc_22><loc_57><loc_89><loc_61></location>GLYPH<SM590000> While the procedure is running, the special register USER still contains the value of ALICE because it excludes any adopted authority. The special register CURRENT USER contains the value of JOE because it includes any adopted authority.</list_item>
-<list_item><location><page_11><loc_22><loc_53><loc_89><loc_56></location>GLYPH<SM590000> When proc1 ends, the session reverts to its original state with both USER and CURRENT USER having the value of ALICE.</list_item>
+<text><loc_112><loc_101><loc_419><loc_115>For example, the following CHGFCNUSG command shows granting authorization to user HBEDOYA to administer and manage RCAC rules:</text>
+<text><loc_112><loc_120><loc_361><loc_125>CHGFCNUSG FCNID(QIBM_DB_SECADM) USER(HBEDOYA) USAGE(*ALLOWED)</text>
+<section_header_level_1><loc_53><loc_138><loc_445><loc_146>2.1.7 Verifying function usage IDs for RCAC with the FUNCTION_USAGE view</section_header_level_1>
+<text><loc_112><loc_155><loc_424><loc_168>The FUNCTION_USAGE view contains function usage configuration details. Table 2-1 describes the columns in the FUNCTION_USAGE view.</text>
+<otsl><loc_111><loc_183><loc_446><loc_279><ched>Column name<ched>Data type<ched>Description<nl><fcel>FUNCTION_ID<fcel>VARCHAR(30)<fcel>ID of the function.<nl><fcel>USER_NAME<fcel>VARCHAR(10)<fcel>Name of the user profile that has a usage setting for this  function.<nl><fcel>USAGE<fcel>VARCHAR(7)<fcel>Usage setting: GLYPH<SM590000> ALLOWED: The user profile is allowed to use the function. GLYPH<SM590000> DENIED: The user profile is not allowed to use the function.<nl><fcel>USER_TYPE<fcel>VARCHAR(5)<fcel>Type of user profile: GLYPH<SM590000> USER: The user profile is a user. GLYPH<SM590000> GROUP: The user profile is a group.<nl><caption><loc_112><loc_176><loc_232><loc_182>Table 2-1 FUNCTION_USAGE view</caption></otsl>
+<text><loc_112><loc_286><loc_447><loc_299>To discover who has authorization to define and manage RCAC, you can use the query that is shown in Example 2-1.</text>
+<caption><loc_112><loc_307><loc_378><loc_312>Example 2-1 Query to determine who has authority to define and manage RCAC</caption>
+<text><loc_112><loc_318><loc_140><loc_324>SELECT</text>
+<text><loc_149><loc_318><loc_206><loc_324>function_id,</text>
+<text><loc_136><loc_326><loc_197><loc_331>user_name,</text>
+<text><loc_140><loc_333><loc_181><loc_339>usage,</text>
+<text><loc_137><loc_341><loc_193><loc_346>user_type</text>
+<text><loc_112><loc_348><loc_131><loc_354>FROM</text>
+<text><loc_146><loc_348><loc_214><loc_354>function_usage</text>
+<text><loc_112><loc_356><loc_133><loc_361>WHERE</text>
+<text><loc_145><loc_356><loc_271><loc_361>function_id=’QIBM_DB_SECADM’</text>
+<text><loc_112><loc_363><loc_146><loc_369>ORDER BY</text>
+<text><loc_155><loc_363><loc_197><loc_369>user_name;</text>
+<section_header_level_1><loc_53><loc_392><loc_204><loc_401>2.2 Separation of duties</section_header_level_1>
+<text><loc_112><loc_412><loc_447><loc_448>Separation of duties helps businesses comply with industry regulations or organizational requirements and simplifies the management of authorities. Separation of duties is commonly used to prevent fraudulent activities or errors by a single person. It provides the ability for administrative functions to be divided across individuals without overlapping responsibilities, so that one user does not possess unlimited authority, such as with the *ALLOBJ authority.</text>
+<page_footer><loc_53><loc_477><loc_64><loc_482>10</page_footer>
+<page_footer><loc_76><loc_477><loc_273><loc_482>Row and Column Access Control Support in IBM DB2 for i</page_footer>
+<page_break>
+<text><loc_112><loc_45><loc_443><loc_89>For example, assume that a business has assigned the duty to manage security on IBM i to Theresa. Before release IBM i 7.2, to grant privileges, Theresa had to have the same privileges Theresa was granting to others. Therefore, to grant *USE privileges to the PAYROLL table, Theresa had to have *OBJMGT and *USE authority (or a higher level of authority, such as *ALLOBJ). This requirement allowed Theresa to access the data in the PAYROLL table even though Theresa's job description was only to manage its security.</text>
+<text><loc_112><loc_97><loc_447><loc_125>In IBM i 7.2, the QIBM_DB_SECADM function usage grants authorities, revokes authorities, changes ownership, or changes the primary group without giving access to the object or, in the case of a database table, to the data that is in the table or allowing other operations on the table.</text>
+<text><loc_112><loc_134><loc_440><loc_147>QIBM_DB_SECADM function usage can be granted only by a user with *SECADM special authority and can be given to a user or a group.</text>
+<text><loc_112><loc_155><loc_446><loc_176>QIBM_DB_SECADM also is responsible for administering RCAC, which restricts which rows a user is allowed to access in a table and whether a user is allowed to see information in certain columns of a table.</text>
+<text><loc_112><loc_184><loc_441><loc_213>A preferred practice is that the RCAC administrator has the QIBM_DB_SECADM function usage ID, but absolutely no other data privileges. The result is that the RCAC administrator can deploy and maintain the RCAC constructs, but cannot grant themselves unauthorized access to data itself.</text>
+<text><loc_112><loc_221><loc_444><loc_234>Table 2-2 shows a comparison of the different function usage IDs and *JOBCTL authority to the different CL commands and DB2 for i tools.</text>
+<otsl><loc_53><loc_248><loc_447><loc_456><rhed>User action<fcel>*JOBCTL<fcel>QIBM_DB_SECADM<fcel>QIBM_DB_SQLADM<fcel>QIBM_DB_SYSMON<fcel>No Authority<nl><rhed>SET CURRENT DEGREE  (SQL statement)<fcel>X<ecel><fcel>X<ecel><ecel><nl><rhed>CHGQRYA  command targeting a different user’s job<fcel>X<ecel><fcel>X<ecel><ecel><nl><rhed>STRDBMON  or  ENDDBMON  commands targeting a different user’s job<fcel>X<ecel><fcel>X<ecel><ecel><nl><rhed>STRDBMON  or  ENDDBMON  commands targeting a job that matches the current user<fcel>X<ecel><fcel>X<fcel>X<fcel>X<nl><rhed>QUSRJOBI() API format 900 or System i Navigator’s SQL Details for Job<fcel>X<ecel><fcel>X<fcel>X<ecel><nl><rhed>Visual Explain within Run SQL scripts<fcel>X<ecel><fcel>X<fcel>X<fcel>X<nl><rhed>Visual Explain outside of Run SQL scripts<fcel>X<ecel><fcel>X<ecel><ecel><nl><rhed>ANALYZE PLAN CACHE procedure<fcel>X<ecel><fcel>X<ecel><ecel><nl><rhed>DUMP PLAN CACHE procedure<fcel>X<ecel><fcel>X<ecel><ecel><nl><rhed>MODIFY PLAN CACHE procedure<fcel>X<ecel><fcel>X<ecel><ecel><nl><rhed>MODIFY PLAN CACHE PROPERTIES procedure (currently does not check authority)<fcel>X<ecel><fcel>X<ecel><ecel><nl><rhed>CHANGE PLAN CACHE SIZE procedure (currently does not check authority)<fcel>X<ecel><fcel>X<ecel><ecel><nl><caption><loc_53><loc_242><loc_320><loc_247>Table 2-2 Comparison of the different function usage IDs and *JOBCTL authority</caption></otsl>
+<page_footer><loc_290><loc_477><loc_428><loc_482>Chapter 2. Roles and separation of duties</page_footer>
+<page_footer><loc_438><loc_477><loc_447><loc_482>11</page_footer>
+<page_break>
+<caption><loc_112><loc_45><loc_432><loc_59>The SQL CREATE PERMISSION statement that is shown in Figure 3-1 is used to define and initially enable or disable the row access rules.</caption>
+<picture><loc_111><loc_68><loc_446><loc_259><caption><loc_112><loc_261><loc_279><loc_267>Figure 3-1 CREATE PERMISSION SQL statement</caption></picture>
+<section_header_level_1><loc_112><loc_278><loc_176><loc_285>Column mask</section_header_level_1>
+<text><loc_112><loc_287><loc_443><loc_316>A column mask is a database object that manifests a column value access control rule for a specific column in a specific table. It uses a CASE expression that describes what you see when you access the column. For example, a teller can see only the last four digits of a tax identification number.</text>
+<page_footer><loc_282><loc_477><loc_428><loc_482>Chapter 3. Row and Column Access Control</page_footer>
+<page_footer><loc_438><loc_477><loc_447><loc_482>15</page_footer>
+<page_break>
+<caption><loc_112><loc_45><loc_337><loc_51>Table 3-1 summarizes these special registers and their values.</caption>
+<otsl><loc_110><loc_65><loc_443><loc_129><ched>Special register<ched>Corresponding value<nl><fcel>USER or SESSION_USER<fcel>The effective user of the thread excluding adopted authority.<nl><fcel>CURRENT_USER<fcel>The effective user of the thread including adopted authority. When no adopted  authority is present, this has the same value as USER.<nl><fcel>SYSTEM_USER<fcel>The authorization ID that initiated the connection.<nl><caption><loc_112><loc_59><loc_304><loc_64>Table 3-1 Special registers and their corresponding values</caption></otsl>
+<text><loc_112><loc_135><loc_440><loc_149>Figure 3-5 shows the difference in the special register values when an adopted authority is used:</text>
+<unordered_list><list_item><loc_112><loc_154><loc_336><loc_160>GLYPH<SM590000> A user connects to the server using the user profile ALICE.</list_item>
+<list_item><loc_112><loc_164><loc_370><loc_170>GLYPH<SM590000> USER and CURRENT USER initially have the same value of ALICE.</list_item>
+<list_item><loc_112><loc_175><loc_442><loc_189>GLYPH<SM590000> ALICE calls an SQL procedure that is named proc1, which is owned by user profile JOE and was created to adopt JOE's authority when it is called.</list_item>
+<list_item><loc_112><loc_194><loc_447><loc_214>GLYPH<SM590000> While the procedure is running, the special register USER still contains the value of ALICE because it excludes any adopted authority. The special register CURRENT USER contains the value of JOE because it includes any adopted authority.</list_item>
+<list_item><loc_112><loc_219><loc_447><loc_233>GLYPH<SM590000> When proc1 ends, the session reverts to its original state with both USER and CURRENT USER having the value of ALICE.</list_item>
 </unordered_list>
-<figure>
-<location><page_11><loc_22><loc_25><loc_49><loc_51></location>
-<caption>Figure 3-5 Special registers and adopted authority</caption>
-</figure>
-<section_header_level_1><location><page_11><loc_11><loc_20><loc_40><loc_21></location>3.2.2 Built-in global variables</section_header_level_1>
-<text><location><page_11><loc_22><loc_15><loc_85><loc_18></location>Built-in global variables are provided with the database manager and are used in SQL statements to retrieve scalar values that are associated with the variables.</text>
-<text><location><page_11><loc_22><loc_9><loc_87><loc_13></location>IBM DB2 for i supports nine different built-in global variables that are read only and maintained by the system. These global variables can be used to identify attributes of the database connection and used as part of the RCAC logic.</text>
-<text><location><page_12><loc_22><loc_90><loc_56><loc_91></location>Table 3-2 lists the nine built-in global variables.</text>
-<table>
-<location><page_12><loc_10><loc_63><loc_90><loc_87></location>
-<caption>Table 3-2 Built-in global variables</caption>
-<row_0><col_0><col_header>Global variable</col_0><col_1><col_header>Type</col_1><col_2><col_header>Description</col_2></row_0>
-<row_1><col_0><body>CLIENT_HOST</col_0><col_1><body>VARCHAR(255)</col_1><col_2><body>Host name of the current client as returned by the system</col_2></row_1>
-<row_2><col_0><body>CLIENT_IPADDR</col_0><col_1><body>VARCHAR(128)</col_1><col_2><body>IP address of the current client as returned by the system</col_2></row_2>
-<row_3><col_0><body>CLIENT_PORT</col_0><col_1><body>INTEGER</col_1><col_2><body>Port used by the current client to communicate with the server</col_2></row_3>
-<row_4><col_0><body>PACKAGE_NAME</col_0><col_1><body>VARCHAR(128)</col_1><col_2><body>Name of the currently running package</col_2></row_4>
-<row_5><col_0><body>PACKAGE_SCHEMA</col_0><col_1><body>VARCHAR(128)</col_1><col_2><body>Schema name of the currently running package</col_2></row_5>
-<row_6><col_0><body>PACKAGE_VERSION</col_0><col_1><body>VARCHAR(64)</col_1><col_2><body>Version identifier of the currently running package</col_2></row_6>
-<row_7><col_0><body>ROUTINE_SCHEMA</col_0><col_1><body>VARCHAR(128)</col_1><col_2><body>Schema name of the currently running routine</col_2></row_7>
-<row_8><col_0><body>ROUTINE_SPECIFIC_NAME</col_0><col_1><body>VARCHAR(128)</col_1><col_2><body>Name of the currently running routine</col_2></row_8>
-<row_9><col_0><body>ROUTINE_TYPE</col_0><col_1><body>CHAR(1)</col_1><col_2><body>Type of the currently running routine</col_2></row_9>
-</table>
-<section_header_level_1><location><page_12><loc_11><loc_57><loc_63><loc_59></location>3.3 VERIFY_GROUP_FOR_USER function</section_header_level_1>
-<text><location><page_12><loc_22><loc_45><loc_89><loc_55></location>The VERIFY_GROUP_FOR_USER function was added in IBM i 7.2. Although it is primarily intended for use with RCAC permissions and masks, it can be used in other SQL statements. The first parameter must be one of these three special registers: SESSION_USER, USER, or CURRENT_USER. The second and subsequent parameters are a list of user or group profiles. Each of these values must be 1 - 10 characters in length. These values are not validated for their existence, which means that you can specify the names of user profiles that do not exist without receiving any kind of error.</text>
-<text><location><page_12><loc_22><loc_39><loc_89><loc_43></location>If a special register value is in the list of user profiles or it is a member of a group profile included in the list, the function returns a long integer value of 1. Otherwise, it returns a value of 0. It never returns the null value.</text>
-<text><location><page_12><loc_22><loc_36><loc_75><loc_38></location>Here is an example of using the VERIFY_GROUP_FOR_USER function:</text>
-<unordered_list>
-<list_item><location><page_12><loc_22><loc_34><loc_66><loc_35></location>1. There are user profiles for MGR, JANE, JUDY, and TONY.</list_item>
-<list_item><location><page_12><loc_22><loc_32><loc_65><loc_33></location>2. The user profile JANE specifies a group profile of MGR.</list_item>
-<list_item><location><page_12><loc_22><loc_28><loc_88><loc_31></location>3. If a user is connected to the server using user profile JANE, all of the following function invocations return a value of 1:</list_item>
+<picture><loc_111><loc_243><loc_246><loc_375><caption><loc_112><loc_377><loc_279><loc_382>Figure 3-5 Special registers and adopted authority</caption></picture>
+<section_header_level_1><loc_53><loc_395><loc_202><loc_402>3.2.2 Built-in global variables</section_header_level_1>
+<text><loc_112><loc_411><loc_423><loc_425>Built-in global variables are provided with the database manager and are used in SQL statements to retrieve scalar values that are associated with the variables.</text>
+<text><loc_112><loc_433><loc_435><loc_454>IBM DB2 for i supports nine different built-in global variables that are read only and maintained by the system. These global variables can be used to identify attributes of the database connection and used as part of the RCAC logic.</text>
+<page_footer><loc_282><loc_477><loc_428><loc_482>Chapter 3. Row and Column Access Control</page_footer>
+<page_footer><loc_438><loc_477><loc_447><loc_482>19</page_footer>
+<page_break>
+<text><loc_112><loc_45><loc_280><loc_51>Table 3-2 lists the nine built-in global variables.</text>
+<otsl><loc_52><loc_66><loc_448><loc_187><ched>Global variable<ched>Type<ched>Description<nl><fcel>CLIENT_HOST<fcel>VARCHAR(255)<fcel>Host name of the current client as returned by the system<nl><fcel>CLIENT_IPADDR<fcel>VARCHAR(128)<fcel>IP address of the current client as returned by the system<nl><fcel>CLIENT_PORT<fcel>INTEGER<fcel>Port used by the current client to communicate with the server<nl><fcel>PACKAGE_NAME<fcel>VARCHAR(128)<fcel>Name of the currently running package<nl><fcel>PACKAGE_SCHEMA<fcel>VARCHAR(128)<fcel>Schema name of the currently running package<nl><fcel>PACKAGE_VERSION<fcel>VARCHAR(64)<fcel>Version identifier of the currently running package<nl><fcel>ROUTINE_SCHEMA<fcel>VARCHAR(128)<fcel>Schema name of the currently running routine<nl><fcel>ROUTINE_SPECIFIC_NAME<fcel>VARCHAR(128)<fcel>Name of the currently running routine<nl><fcel>ROUTINE_TYPE<fcel>CHAR(1)<fcel>Type of the currently running routine<nl><caption><loc_53><loc_59><loc_164><loc_64>Table 3-2 Built-in global variables</caption></otsl>
+<section_header_level_1><loc_53><loc_203><loc_314><loc_213>3.3 VERIFY_GROUP_FOR_USER function</section_header_level_1>
+<text><loc_112><loc_224><loc_447><loc_275>The VERIFY_GROUP_FOR_USER function was added in IBM i 7.2. Although it is primarily intended for use with RCAC permissions and masks, it can be used in other SQL statements. The first parameter must be one of these three special registers: SESSION_USER, USER, or CURRENT_USER. The second and subsequent parameters are a list of user or group profiles. Each of these values must be 1 - 10 characters in length. These values are not validated for their existence, which means that you can specify the names of user profiles that do not exist without receiving any kind of error.</text>
+<text><loc_112><loc_283><loc_447><loc_304>If a special register value is in the list of user profiles or it is a member of a group profile included in the list, the function returns a long integer value of 1. Otherwise, it returns a value of 0. It never returns the null value.</text>
+<text><loc_112><loc_312><loc_375><loc_318>Here is an example of using the VERIFY_GROUP_FOR_USER function:</text>
+<unordered_list><list_item><loc_112><loc_323><loc_332><loc_329>1. There are user profiles for MGR, JANE, JUDY, and TONY.</list_item>
+<list_item><loc_112><loc_334><loc_324><loc_339>2. The user profile JANE specifies a group profile of MGR.</list_item>
+<list_item><loc_112><loc_344><loc_438><loc_358>3. If a user is connected to the server using user profile JANE, all of the following function invocations return a value of 1:</list_item>
 </unordered_list>
-<code><location><page_12><loc_25><loc_19><loc_74><loc_27></location>VERIFY_GROUP_FOR_USER (CURRENT_USER, 'MGR') VERIFY_GROUP_FOR_USER (CURRENT_USER, 'JANE', 'MGR') VERIFY_GROUP_FOR_USER (CURRENT_USER, 'JANE', 'MGR', 'STEVE') The following function invocation returns a value of 0: VERIFY_GROUP_FOR_USER (CURRENT_USER, 'JUDY', 'TONY')</code>
-<text><location><page_13><loc_22><loc_90><loc_27><loc_91></location>RETURN</text>
-<text><location><page_13><loc_22><loc_88><loc_26><loc_89></location>CASE</text>
-<code><location><page_13><loc_22><loc_67><loc_85><loc_88></location>WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'HR', 'EMP' ) = 1 THEN EMPLOYEES . DATE_OF_BIRTH WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1 AND SESSION_USER = EMPLOYEES . USER_ID THEN EMPLOYEES . DATE_OF_BIRTH WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1 AND SESSION_USER <> EMPLOYEES . USER_ID THEN ( 9999 || '-' || MONTH ( EMPLOYEES . DATE_OF_BIRTH ) || '-' || DAY (EMPLOYEES.DATE_OF_BIRTH )) ELSE NULL END ENABLE ;</code>
-<unordered_list>
-<list_item><location><page_13><loc_22><loc_63><loc_89><loc_65></location>2. The other column to mask in this example is the TAX_ID information. In this example, the rules to enforce include the following ones:</list_item>
-<list_item><location><page_13><loc_25><loc_60><loc_77><loc_62></location>-Human Resources can see the unmasked TAX_ID of the employees.</list_item>
-<list_item><location><page_13><loc_25><loc_58><loc_66><loc_59></location>-Employees can see only their own unmasked TAX_ID.</list_item>
-<list_item><location><page_13><loc_25><loc_55><loc_89><loc_57></location>-Managers see a masked version of TAX_ID with the first five characters replaced with the X character (for example, XXX-XX-1234).</list_item>
-<list_item><location><page_13><loc_25><loc_52><loc_87><loc_54></location>-Any other person sees the entire TAX_ID as masked, for example, XXX-XX-XXXX.</list_item>
-<list_item><location><page_13><loc_25><loc_50><loc_87><loc_51></location>To implement this column mask, run the SQL statement that is shown in Example 3-9.</list_item>
+<code<loc_124><loc_363><loc_368><loc_405><_unknown_>VERIFY_GROUP_FOR_USER (CURRENT_USER, 'MGR') VERIFY_GROUP_FOR_USER (CURRENT_USER, 'JANE', 'MGR') VERIFY_GROUP_FOR_USER (CURRENT_USER, 'JANE', 'MGR', 'STEVE') The following function invocation returns a value of 0: VERIFY_GROUP_FOR_USER (CURRENT_USER, 'JUDY', 'TONY')</code
+<page_footer><loc_53><loc_477><loc_64><loc_482>20</page_footer>
+<page_footer><loc_76><loc_477><loc_273><loc_482>Row and Column Access Control Support in IBM DB2 for i</page_footer>
+<page_break>
+<text><loc_112><loc_45><loc_136><loc_51>RETURN</text>
+<text><loc_112><loc_53><loc_128><loc_58>CASE</text>
+<code<loc_112><loc_60><loc_426><loc_164><_unknown_>WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'HR', 'EMP' ) = 1 THEN EMPLOYEES . DATE_OF_BIRTH WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1 AND SESSION_USER = EMPLOYEES . USER_ID THEN EMPLOYEES . DATE_OF_BIRTH WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1 AND SESSION_USER <> EMPLOYEES . USER_ID THEN ( 9999 || '-' || MONTH ( EMPLOYEES . DATE_OF_BIRTH ) || '-' || DAY (EMPLOYEES.DATE_OF_BIRTH )) ELSE NULL END ENABLE ;</code
+<unordered_list><list_item><loc_112><loc_174><loc_447><loc_187>2. The other column to mask in this example is the TAX_ID information. In this example, the rules to enforce include the following ones:</list_item>
+<list_item><loc_124><loc_192><loc_383><loc_198>-Human Resources can see the unmasked TAX_ID of the employees.</list_item>
+<list_item><loc_124><loc_203><loc_330><loc_209>-Employees can see only their own unmasked TAX_ID.</list_item>
+<list_item><loc_124><loc_214><loc_445><loc_227>-Managers see a masked version of TAX_ID with the first five characters replaced with the X character (for example, XXX-XX-1234).</list_item>
+<list_item><loc_124><loc_232><loc_433><loc_238>-Any other person sees the entire TAX_ID as masked, for example, XXX-XX-XXXX.</list_item>
+<list_item><loc_124><loc_243><loc_433><loc_249>To implement this column mask, run the SQL statement that is shown in Example 3-9.</list_item>
 </unordered_list>
-<paragraph><location><page_13><loc_22><loc_48><loc_58><loc_49></location>Example 3-9 Creating a mask on the TAX_ID column</paragraph>
-<code><location><page_13><loc_22><loc_14><loc_86><loc_47></location>CREATE MASK HR_SCHEMA.MASK_TAX_ID_ON_EMPLOYEES ON HR_SCHEMA.EMPLOYEES AS EMPLOYEES FOR COLUMN TAX_ID RETURN CASE WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'HR' ) = 1 THEN EMPLOYEES . TAX_ID WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1 AND SESSION_USER = EMPLOYEES . USER_ID THEN EMPLOYEES . TAX_ID WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1 AND SESSION_USER <> EMPLOYEES . USER_ID THEN ( 'XXX-XX-' CONCAT QSYS2 . SUBSTR ( EMPLOYEES . TAX_ID , 8 , 4 ) ) WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'EMP' ) = 1 THEN EMPLOYEES . TAX_ID ELSE 'XXX-XX-XXXX' END ENABLE ;</code>
-<unordered_list>
-<list_item><location><page_14><loc_22><loc_90><loc_74><loc_91></location>3. Figure 3-10 shows the masks that are created in the HR_SCHEMA.</list_item>
+<code<loc_112><loc_267><loc_430><loc_432><_unknown_>CREATE MASK HR_SCHEMA.MASK_TAX_ID_ON_EMPLOYEES ON HR_SCHEMA.EMPLOYEES AS EMPLOYEES FOR COLUMN TAX_ID RETURN CASE WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'HR' ) = 1 THEN EMPLOYEES . TAX_ID WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1 AND SESSION_USER = EMPLOYEES . USER_ID THEN EMPLOYEES . TAX_ID WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1 AND SESSION_USER <> EMPLOYEES . USER_ID THEN ( 'XXX-XX-' CONCAT QSYS2 . SUBSTR ( EMPLOYEES . TAX_ID , 8 , 4 ) ) WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'EMP' ) = 1 THEN EMPLOYEES . TAX_ID ELSE 'XXX-XX-XXXX' END ENABLE ;</code
+<caption><loc_112><loc_257><loc_288><loc_262>Example 3-9 Creating a mask on the TAX_ID column</caption>
+<page_footer><loc_282><loc_477><loc_428><loc_482>Chapter 3. Row and Column Access Control</page_footer>
+<page_footer><loc_438><loc_477><loc_447><loc_482>27</page_footer>
+<unordered_list><page_break>
+<list_item><loc_112><loc_45><loc_368><loc_51>3. Figure 3-10 shows the masks that are created in the HR_SCHEMA.</list_item>
 </unordered_list>
-<figure>
-<location><page_14><loc_10><loc_79><loc_89><loc_88></location>
-<caption>Figure 3-10 Column masks shown in System i Navigator</caption>
-</figure>
-<section_header_level_1><location><page_14><loc_11><loc_73><loc_33><loc_74></location>3.6.6 Activating RCAC</section_header_level_1>
-<text><location><page_14><loc_22><loc_67><loc_89><loc_71></location>Now that you have created the row permission and the two column masks, RCAC must be activated. The row permission and the two column masks are enabled (last clause in the scripts), but now you must activate RCAC on the table. To do so, complete the following steps:</text>
-<unordered_list>
-<list_item><location><page_14><loc_22><loc_65><loc_67><loc_66></location>1. Run the SQL statements that are shown in Example 3-10.</list_item>
+<picture><loc_52><loc_60><loc_447><loc_107><caption><loc_53><loc_110><loc_239><loc_115>Figure 3-10 Column masks shown in System i Navigator</caption></picture>
+<section_header_level_1><loc_53><loc_128><loc_167><loc_135>3.6.6 Activating RCAC</section_header_level_1>
+<text><loc_112><loc_144><loc_447><loc_165>Now that you have created the row permission and the two column masks, RCAC must be activated. The row permission and the two column masks are enabled (last clause in the scripts), but now you must activate RCAC on the table. To do so, complete the following steps:</text>
+<unordered_list><list_item><loc_112><loc_170><loc_335><loc_176>1. Run the SQL statements that are shown in Example 3-10.</list_item>
 </unordered_list>
-<section_header_level_1><location><page_14><loc_22><loc_62><loc_61><loc_63></location>Example 3-10 Activating RCAC on the EMPLOYEES table</section_header_level_1>
-<unordered_list>
-<list_item><location><page_14><loc_22><loc_60><loc_62><loc_61></location>/* Active Row Access Control (permissions) */</list_item>
-<list_item><location><page_14><loc_22><loc_58><loc_58><loc_60></location>/* Active Column Access Control (masks)</list_item>
+<section_header_level_1><loc_112><loc_184><loc_307><loc_189>Example 3-10 Activating RCAC on the EMPLOYEES table</section_header_level_1>
+<unordered_list><list_item><loc_112><loc_195><loc_308><loc_200>/* Active Row Access Control (permissions) */</list_item>
+<list_item><loc_112><loc_202><loc_290><loc_208>/* Active Column Access Control (masks)</list_item>
 </unordered_list>
-<text><location><page_14><loc_60><loc_58><loc_62><loc_60></location>*/</text>
-<text><location><page_14><loc_22><loc_57><loc_48><loc_58></location>ALTER TABLE HR_SCHEMA.EMPLOYEES</text>
-<text><location><page_14><loc_22><loc_55><loc_44><loc_56></location>ACTIVATE ROW ACCESS CONTROL</text>
-<text><location><page_14><loc_22><loc_54><loc_48><loc_55></location>ACTIVATE COLUMN ACCESS CONTROL;</text>
-<unordered_list>
-<list_item><location><page_14><loc_22><loc_48><loc_88><loc_52></location>2. Look at the definition of the EMPLOYEE table, as shown in Figure 3-11. To do this, from the main navigation pane of System i Navigator, click Schemas  HR_SCHEMA  Tables , right-click the EMPLOYEES table, and click Definition .</list_item>
+<text><loc_299><loc_202><loc_308><loc_208>*/</text>
+<text><loc_112><loc_210><loc_238><loc_216>ALTER TABLE HR_SCHEMA.EMPLOYEES</text>
+<text><loc_112><loc_218><loc_222><loc_223>ACTIVATE ROW ACCESS CONTROL</text>
+<text><loc_112><loc_225><loc_238><loc_231>ACTIVATE COLUMN ACCESS CONTROL;</text>
+<unordered_list><list_item><loc_112><loc_240><loc_442><loc_261>2. Look at the definition of the EMPLOYEE table, as shown in Figure 3-11. To do this, from the main navigation pane of System i Navigator, click Schemas  HR_SCHEMA  Tables , right-click the EMPLOYEES table, and click Definition .</list_item>
 </unordered_list>
-<figure>
-<location><page_14><loc_10><loc_18><loc_87><loc_46></location>
-<caption>Figure 3-11 Selecting the EMPLOYEES table from System i Navigator</caption>
-</figure>
-<unordered_list>
-<list_item><location><page_15><loc_22><loc_87><loc_84><loc_91></location>2. Figure 4-68 shows the Visual Explain of the same SQL statement, but with RCAC enabled. It is clear that the implementation of the SQL statement is more complex because the row permission rule becomes part of the WHERE clause.</list_item>
+<picture><loc_52><loc_270><loc_433><loc_408><caption><loc_53><loc_410><loc_284><loc_415>Figure 3-11 Selecting the EMPLOYEES table from System i Navigator</caption></picture>
+<page_footer><loc_53><loc_477><loc_64><loc_482>28</page_footer>
+<page_footer><loc_76><loc_477><loc_273><loc_482>Row and Column Access Control Support in IBM DB2 for i</page_footer>
+<unordered_list><page_break>
+<list_item><loc_112><loc_45><loc_420><loc_66>2. Figure 4-68 shows the Visual Explain of the same SQL statement, but with RCAC enabled. It is clear that the implementation of the SQL statement is more complex because the row permission rule becomes part of the WHERE clause.</list_item>
+<list_item><loc_112><loc_320><loc_447><loc_341>3. Compare the advised indexes that are provided by the Optimizer without RCAC and with RCAC enabled. Figure 4-69 shows the index advice for the SQL statement without RCAC enabled. The index being advised is for the ORDER BY clause.</list_item>
 </unordered_list>
-<figure>
-<location><page_15><loc_22><loc_40><loc_89><loc_85></location>
-<caption>Figure 4-68 Visual Explain with RCAC enabled</caption>
-</figure>
-<unordered_list>
-<list_item><location><page_15><loc_22><loc_32><loc_89><loc_36></location>3. Compare the advised indexes that are provided by the Optimizer without RCAC and with RCAC enabled. Figure 4-69 shows the index advice for the SQL statement without RCAC enabled. The index being advised is for the ORDER BY clause.</list_item>
-</unordered_list>
-<figure>
-<location><page_15><loc_11><loc_16><loc_83><loc_30></location>
-<caption>Figure 4-69 Index advice with no RCAC</caption>
-</figure>
-<code><location><page_16><loc_11><loc_11><loc_82><loc_91></location>THEN C . CUSTOMER_TAX_ID WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'TELLER' ) = 1 THEN ( 'XXX-XX-' CONCAT QSYS2 . SUBSTR ( C . CUSTOMER_TAX_ID , 8 , 4 ) ) WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 THEN C . CUSTOMER_TAX_ID ELSE 'XXX-XX-XXXX' END ENABLE ; CREATE MASK BANK_SCHEMA.MASK_DRIVERS_LICENSE_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C FOR COLUMN CUSTOMER_DRIVERS_LICENSE_NUMBER RETURN CASE WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 THEN C . CUSTOMER_DRIVERS_LICENSE_NUMBER WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'TELLER' ) = 1 THEN C . CUSTOMER_DRIVERS_LICENSE_NUMBER WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 THEN C . CUSTOMER_DRIVERS_LICENSE_NUMBER ELSE '*************' END ENABLE ; CREATE MASK BANK_SCHEMA.MASK_LOGIN_ID_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C FOR COLUMN CUSTOMER_LOGIN_ID RETURN CASE WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 THEN C . CUSTOMER_LOGIN_ID WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 THEN C . CUSTOMER_LOGIN_ID ELSE '*****' END ENABLE ; CREATE MASK BANK_SCHEMA.MASK_SECURITY_QUESTION_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C FOR COLUMN CUSTOMER_SECURITY_QUESTION RETURN CASE WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 THEN C . CUSTOMER_SECURITY_QUESTION WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 THEN C . CUSTOMER_SECURITY_QUESTION ELSE '*****' END ENABLE ; CREATE MASK BANK_SCHEMA.MASK_SECURITY_QUESTION_ANSWER_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C FOR COLUMN CUSTOMER_SECURITY_QUESTION_ANSWER RETURN CASE WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 THEN C . CUSTOMER_SECURITY_QUESTION_ANSWER WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 THEN C . CUSTOMER_SECURITY_QUESTION_ANSWER ELSE '*****' END ENABLE ; ALTER TABLE BANK_SCHEMA.CUSTOMERS ACTIVATE ROW ACCESS CONTROL ACTIVATE COLUMN ACCESS CONTROL ;</code>
-<text><location><page_18><loc_47><loc_94><loc_68><loc_96></location>Back cover</text>
-<section_header_level_1><location><page_18><loc_4><loc_82><loc_73><loc_91></location>Row and Column Access Control Support in IBM DB2 for i</section_header_level_1>
-<text><location><page_18><loc_4><loc_66><loc_21><loc_69></location>Implement roles and separation of duties</text>
-<text><location><page_18><loc_4><loc_59><loc_20><loc_64></location>Leverage row permissions on the database</text>
-<text><location><page_18><loc_4><loc_52><loc_20><loc_57></location>Protect columns by defining column masks</text>
-<text><location><page_18><loc_25><loc_59><loc_68><loc_69></location>This IBM Redpaper publication provides information about the IBM i 7.2 feature of IBM DB2 for i Row and Column Access Control (RCAC). It offers a broad description of the function and advantages of controlling access to data in a comprehensive and transparent way. This publication helps you understand the capabilities of RCAC and provides examples of defining, creating, and implementing the row permissions and column masks in a relational database environment.</text>
-<text><location><page_18><loc_25><loc_51><loc_68><loc_58></location>This paper is intended for database engineers, data-centric application developers, and security officers who want to design and implement RCAC as a part of their data control and governance policy. A solid background in IBM i object level security, DB2 for i relational database concepts, and SQL is assumed.</text>
-<figure>
-<location><page_18><loc_79><loc_93><loc_93><loc_97></location>
-</figure>
-<figure>
-<location><page_18><loc_78><loc_76><loc_97><loc_90></location>
-</figure>
-<text><location><page_18><loc_76><loc_62><loc_91><loc_69></location>INTERNATIONAL TECHNICAL SUPPORT ORGANIZATION</text>
-<text><location><page_18><loc_76><loc_51><loc_96><loc_56></location>BUILDING TECHNICAL INFORMATION BASED ON PRACTICAL EXPERIENCE</text>
-<text><location><page_18><loc_76><loc_32><loc_96><loc_50></location>IBM Redbooks are developed by the IBM International Technical Support Organization. Experts from IBM, Customers and Partners from around the world create timely technical information based on realistic scenarios. Specific recommendations are provided to help you implement IT solutions more effectively in your environment.</text>
-<text><location><page_18><loc_76><loc_24><loc_93><loc_27></location>For more information: ibm.com /redbooks</text>
-</document>
\ No newline at end of file
+<picture><loc_112><loc_75><loc_446><loc_301><caption><loc_112><loc_303><loc_267><loc_309>Figure 4-68 Visual Explain with RCAC enabled</caption></picture>
+<picture><loc_53><loc_349><loc_414><loc_419><caption><loc_53><loc_421><loc_186><loc_427>Figure 4-69 Index advice with no RCAC</caption></picture>
+<page_footer><loc_175><loc_477><loc_428><loc_482>Chapter 4. Implementing Row and Column Access Control: Banking example</page_footer>
+<page_footer><loc_438><loc_477><loc_447><loc_482>77</page_footer>
+<page_break>
+<code<loc_53><loc_45><loc_409><loc_446><_unknown_>THEN C . CUSTOMER_TAX_ID WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'TELLER' ) = 1 THEN ( 'XXX-XX-' CONCAT QSYS2 . SUBSTR ( C . CUSTOMER_TAX_ID , 8 , 4 ) ) WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 THEN C . CUSTOMER_TAX_ID ELSE 'XXX-XX-XXXX' END ENABLE ; CREATE MASK BANK_SCHEMA.MASK_DRIVERS_LICENSE_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C FOR COLUMN CUSTOMER_DRIVERS_LICENSE_NUMBER RETURN CASE WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 THEN C . CUSTOMER_DRIVERS_LICENSE_NUMBER WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'TELLER' ) = 1 THEN C . CUSTOMER_DRIVERS_LICENSE_NUMBER WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 THEN C . CUSTOMER_DRIVERS_LICENSE_NUMBER ELSE '*************' END ENABLE ; CREATE MASK BANK_SCHEMA.MASK_LOGIN_ID_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C FOR COLUMN CUSTOMER_LOGIN_ID RETURN CASE WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 THEN C . CUSTOMER_LOGIN_ID WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 THEN C . CUSTOMER_LOGIN_ID ELSE '*****' END ENABLE ; CREATE MASK BANK_SCHEMA.MASK_SECURITY_QUESTION_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C FOR COLUMN CUSTOMER_SECURITY_QUESTION RETURN CASE WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 THEN C . CUSTOMER_SECURITY_QUESTION WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 THEN C . CUSTOMER_SECURITY_QUESTION ELSE '*****' END ENABLE ; CREATE MASK BANK_SCHEMA.MASK_SECURITY_QUESTION_ANSWER_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C FOR COLUMN CUSTOMER_SECURITY_QUESTION_ANSWER RETURN CASE WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 THEN C . CUSTOMER_SECURITY_QUESTION_ANSWER WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 THEN C . CUSTOMER_SECURITY_QUESTION_ANSWER ELSE '*****' END ENABLE ; ALTER TABLE BANK_SCHEMA.CUSTOMERS ACTIVATE ROW ACCESS CONTROL ACTIVATE COLUMN ACCESS CONTROL ;</code
+<page_footer><loc_53><loc_477><loc_69><loc_482>124</page_footer>
+<page_footer><loc_81><loc_477><loc_278><loc_482>Row and Column Access Control Support in IBM DB2 for i</page_footer>
+<page_break>
+<text><loc_235><loc_18><loc_338><loc_32>Back cover</text>
+<section_header_level_1><loc_22><loc_46><loc_365><loc_89>Row and Column Access Control Support in IBM DB2 for i</section_header_level_1>
+<text><loc_22><loc_153><loc_104><loc_168>Implement roles and separation of duties</text>
+<text><loc_22><loc_179><loc_98><loc_204>Leverage row permissions on the database</text>
+<text><loc_125><loc_153><loc_338><loc_204>This IBM Redpaper publication provides information about the IBM i 7.2 feature of IBM DB2 for i Row and Column Access Control (RCAC). It offers a broad description of the function and advantages of controlling access to data in a comprehensive and transparent way. This publication helps you understand the capabilities of RCAC and provides examples of defining, creating, and implementing the row permissions and column masks in a relational database environment.</text>
+<text><loc_22><loc_215><loc_99><loc_239>Protect columns by defining column masks</text>
+<text><loc_125><loc_209><loc_338><loc_245>This paper is intended for database engineers, data-centric application developers, and security officers who want to design and implement RCAC as a part of their data control and governance policy. A solid background in IBM i object level security, DB2 for i relational database concepts, and SQL is assumed.</text>
+<picture><loc_396><loc_16><loc_463><loc_34></picture>
+<picture><loc_388><loc_51><loc_484><loc_120></picture>
+<text><loc_382><loc_156><loc_457><loc_191>INTERNATIONAL TECHNICAL SUPPORT ORGANIZATION</text>
+<text><loc_382><loc_222><loc_480><loc_244>BUILDING TECHNICAL INFORMATION BASED ON PRACTICAL EXPERIENCE</text>
+<text><loc_382><loc_252><loc_480><loc_342>IBM Redbooks are developed by the IBM International Technical Support Organization. Experts from IBM, Customers and Partners from around the world create timely technical information based on realistic scenarios. Specific recommendations are provided to help you implement IT solutions more effectively in your environment.</text>
+<text><loc_382><loc_365><loc_466><loc_380>For more information: ibm.com /redbooks</text>
+<page_footer><loc_140><loc_399><loc_189><loc_404>REDP-5110-00</page_footer>
+</doctag>
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v2/redp5110_sampled.json b/tests/data/groundtruth/docling_v2/redp5110_sampled.json
index 5d884b0a..16f6376e 100644
--- a/tests/data/groundtruth/docling_v2/redp5110_sampled.json
+++ b/tests/data/groundtruth/docling_v2/redp5110_sampled.json
@@ -1 +1 @@
-{"schema_name": "DoclingDocument", "version": "1.0.0", "name": "redp5110_sampled", "origin": {"mimetype": "application/pdf", "binary_hash": 12110913468886801317, "filename": "redp5110_sampled.pdf", "uri": null}, "furniture": {"self_ref": "#/furniture", "parent": null, "children": [], "name": "_root_", "label": "unspecified"}, "body": {"self_ref": "#/body", "parent": null, "children": [{"cref": "#/texts/0"}, {"cref": "#/pictures/0"}, {"cref": "#/texts/1"}, {"cref": "#/pictures/1"}, {"cref": "#/texts/6"}, {"cref": "#/pictures/2"}, {"cref": "#/texts/8"}, {"cref": "#/tables/0"}, {"cref": "#/texts/9"}, {"cref": "#/texts/10"}, {"cref": "#/texts/11"}, {"cref": "#/texts/12"}, {"cref": "#/pictures/3"}, {"cref": "#/texts/13"}, {"cref": "#/groups/0"}, {"cref": "#/pictures/4"}, {"cref": "#/texts/18"}, {"cref": "#/texts/19"}, {"cref": "#/texts/20"}, {"cref": "#/texts/21"}, {"cref": "#/texts/22"}, {"cref": "#/texts/23"}, {"cref": "#/texts/24"}, {"cref": "#/texts/25"}, {"cref": "#/texts/26"}, {"cref": "#/groups/1"}, {"cref": "#/texts/36"}, {"cref": "#/texts/37"}, {"cref": "#/texts/38"}, {"cref": "#/texts/39"}, {"cref": "#/pictures/5"}, {"cref": "#/pictures/6"}, {"cref": "#/texts/40"}, {"cref": "#/texts/41"}, {"cref": "#/texts/42"}, {"cref": "#/texts/43"}, {"cref": "#/texts/44"}, {"cref": "#/pictures/7"}, {"cref": "#/texts/45"}, {"cref": "#/texts/46"}, {"cref": "#/texts/47"}, {"cref": "#/texts/48"}, {"cref": "#/texts/49"}, {"cref": "#/texts/50"}, {"cref": "#/groups/2"}, {"cref": "#/texts/54"}, {"cref": "#/texts/55"}, {"cref": "#/texts/56"}, {"cref": "#/texts/57"}, {"cref": "#/texts/58"}, {"cref": "#/texts/59"}, {"cref": "#/groups/3"}, {"cref": "#/texts/62"}, {"cref": "#/groups/4"}, {"cref": "#/texts/64"}, {"cref": "#/texts/65"}, {"cref": "#/texts/66"}, {"cref": "#/texts/67"}, {"cref": "#/texts/68"}, {"cref": "#/texts/69"}, {"cref": "#/texts/70"}, {"cref": "#/texts/71"}, {"cref": "#/texts/72"}, {"cref": "#/texts/73"}, {"cref": "#/texts/74"}, {"cref": "#/texts/75"}, {"cref": "#/texts/76"}, {"cref": "#/texts/77"}, {"cref": "#/texts/78"}, {"cref": "#/pictures/8"}, {"cref": "#/texts/81"}, {"cref": "#/texts/82"}, {"cref": "#/groups/5"}, {"cref": "#/texts/86"}, {"cref": "#/texts/87"}, {"cref": "#/texts/88"}, {"cref": "#/texts/89"}, {"cref": "#/texts/90"}, {"cref": "#/tables/1"}, {"cref": "#/texts/91"}, {"cref": "#/texts/92"}, {"cref": "#/groups/6"}, {"cref": "#/texts/104"}, {"cref": "#/texts/105"}, {"cref": "#/texts/106"}, {"cref": "#/texts/107"}, {"cref": "#/texts/108"}, {"cref": "#/texts/109"}, {"cref": "#/texts/110"}, {"cref": "#/texts/111"}, {"cref": "#/texts/112"}, {"cref": "#/texts/113"}, {"cref": "#/texts/114"}, {"cref": "#/tables/2"}, {"cref": "#/texts/115"}, {"cref": "#/texts/116"}, {"cref": "#/texts/117"}, {"cref": "#/texts/118"}, {"cref": "#/pictures/9"}, {"cref": "#/texts/167"}, {"cref": "#/texts/168"}, {"cref": "#/texts/169"}, {"cref": "#/texts/170"}, {"cref": "#/texts/171"}, {"cref": "#/texts/172"}, {"cref": "#/tables/3"}, {"cref": "#/texts/173"}, {"cref": "#/groups/7"}, {"cref": "#/texts/179"}, {"cref": "#/pictures/10"}, {"cref": "#/texts/190"}, {"cref": "#/texts/191"}, {"cref": "#/texts/192"}, {"cref": "#/texts/193"}, {"cref": "#/texts/194"}, {"cref": "#/texts/195"}, {"cref": "#/texts/196"}, {"cref": "#/texts/197"}, {"cref": "#/texts/198"}, {"cref": "#/tables/4"}, {"cref": "#/texts/199"}, {"cref": "#/texts/200"}, {"cref": "#/texts/201"}, {"cref": "#/texts/202"}, {"cref": "#/groups/8"}, {"cref": "#/texts/206"}, {"cref": "#/texts/207"}, {"cref": "#/texts/208"}, {"cref": "#/texts/209"}, {"cref": "#/groups/9"}, {"cref": "#/texts/216"}, {"cref": "#/texts/217"}, {"cref": "#/texts/218"}, {"cref": "#/texts/219"}, {"cref": "#/groups/10"}, {"cref": "#/texts/221"}, {"cref": "#/pictures/11"}, {"cref": "#/texts/222"}, {"cref": "#/texts/223"}, {"cref": "#/groups/11"}, {"cref": "#/texts/225"}, {"cref": "#/groups/12"}, {"cref": "#/texts/228"}, {"cref": "#/texts/229"}, {"cref": "#/texts/230"}, {"cref": "#/texts/231"}, {"cref": "#/groups/13"}, {"cref": "#/texts/233"}, {"cref": "#/pictures/12"}, {"cref": "#/texts/234"}, {"cref": "#/texts/235"}, {"cref": "#/groups/14"}, {"cref": "#/texts/237"}, {"cref": "#/pictures/13"}, {"cref": "#/groups/15"}, {"cref": "#/texts/239"}, {"cref": "#/pictures/14"}, {"cref": "#/texts/240"}, {"cref": "#/texts/241"}, {"cref": "#/texts/242"}, {"cref": "#/texts/243"}, {"cref": "#/texts/244"}, {"cref": "#/groups/16"}, {"cref": "#/texts/245"}, {"cref": "#/texts/246"}, {"cref": "#/texts/247"}, {"cref": "#/texts/248"}, {"cref": "#/texts/249"}, {"cref": "#/texts/250"}, {"cref": "#/texts/251"}, {"cref": "#/texts/252"}, {"cref": "#/pictures/15"}, {"cref": "#/pictures/16"}, {"cref": "#/texts/256"}, {"cref": "#/texts/257"}, {"cref": "#/texts/258"}, {"cref": "#/texts/259"}], "name": "_root_", "label": "unspecified"}, "groups": [{"self_ref": "#/groups/0", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/14"}, {"cref": "#/texts/15"}, {"cref": "#/texts/16"}, {"cref": "#/texts/17"}], "name": "list", "label": "list"}, {"self_ref": "#/groups/1", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/27"}, {"cref": "#/texts/28"}, {"cref": "#/texts/29"}, {"cref": "#/texts/30"}, {"cref": "#/texts/31"}, {"cref": "#/texts/32"}, {"cref": "#/texts/33"}, {"cref": "#/texts/34"}, {"cref": "#/texts/35"}], "name": "list", "label": "list"}, {"self_ref": "#/groups/2", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/51"}, {"cref": "#/texts/52"}, {"cref": "#/texts/53"}], "name": "list", "label": "list"}, {"self_ref": "#/groups/3", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/60"}, {"cref": "#/texts/61"}], "name": "list", "label": "list"}, {"self_ref": "#/groups/4", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/63"}], "name": "list", "label": "list"}, {"self_ref": "#/groups/5", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/83"}, {"cref": "#/texts/84"}, {"cref": "#/texts/85"}], "name": "list", "label": "list"}, {"self_ref": "#/groups/6", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/93"}, {"cref": "#/texts/94"}, {"cref": "#/texts/95"}, {"cref": "#/texts/96"}, {"cref": "#/texts/97"}, {"cref": "#/texts/98"}, {"cref": "#/texts/99"}, {"cref": "#/texts/100"}, {"cref": "#/texts/101"}, {"cref": "#/texts/102"}, {"cref": "#/texts/103"}], "name": "group", "label": "key_value_area"}, {"self_ref": "#/groups/7", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/174"}, {"cref": "#/texts/175"}, {"cref": "#/texts/176"}, {"cref": "#/texts/177"}, {"cref": "#/texts/178"}], "name": "list", "label": "list"}, {"self_ref": "#/groups/8", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/203"}, {"cref": "#/texts/204"}, {"cref": "#/texts/205"}], "name": "list", "label": "list"}, {"self_ref": "#/groups/9", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/210"}, {"cref": "#/texts/211"}, {"cref": "#/texts/212"}, {"cref": "#/texts/213"}, {"cref": "#/texts/214"}, {"cref": "#/texts/215"}], "name": "list", "label": "list"}, {"self_ref": "#/groups/10", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/220"}], "name": "list", "label": "list"}, {"self_ref": "#/groups/11", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/224"}], "name": "list", "label": "list"}, {"self_ref": "#/groups/12", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/226"}, {"cref": "#/texts/227"}], "name": "list", "label": "list"}, {"self_ref": "#/groups/13", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/232"}], "name": "list", "label": "list"}, {"self_ref": "#/groups/14", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/236"}], "name": "list", "label": "list"}, {"self_ref": "#/groups/15", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/238"}], "name": "list", "label": "list"}, {"self_ref": "#/groups/16", "parent": {"cref": "#/body"}, "children": [], "name": "group", "label": "form_area"}], "texts": [{"self_ref": "#/texts/0", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 287.82000732421875, "t": 763.4519653320312, "r": 418.83355712890625, "b": 741.251953125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 11]}], "orig": "Front cover", "text": "Front cover"}, {"self_ref": "#/texts/1", "parent": {"cref": "#/body"}, "children": [], "label": "section_header", "prov": [{"page_no": 1, "bbox": {"l": 35.70000076293945, "t": 707.4134521484375, "r": 584.6428833007812, "b": 626.1588745117188, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 54]}], "orig": "Row and Column Access Control Support in IBM DB2 for i", "text": "Row and Column Access Control Support in IBM DB2 for i", "level": 1}, {"self_ref": "#/texts/2", "parent": {"cref": "#/pictures/1"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 497.70001, "t": 216.28799000000004, "r": 581.38678, "b": 93.58802800000001, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 115]}], "orig": "Jim Bainbridge Hernando Bedoya Rob Bestgen Mike Cain Dan Cruikshank Jim Denton Doug Mack Tom McKinley Kent Milligan", "text": "Jim Bainbridge Hernando Bedoya Rob Bestgen Mike Cain Dan Cruikshank Jim Denton Doug Mack Tom McKinley Kent Milligan"}, {"self_ref": "#/texts/3", "parent": {"cref": "#/pictures/1"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 36.119999, "t": 495.86172, "r": 216.00064, "b": 466.43942, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 40]}], "orig": "Implement roles and separation of duties", "text": "Implement roles and separation of duties"}, {"self_ref": "#/texts/4", "parent": {"cref": "#/pictures/1"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 35.759315, "t": 441.86118000000005, "r": 202.45404, "b": 412.43887000000007, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 40]}], "orig": "Leverage row permissions on the database", "text": "Leverage row permissions on the database"}, {"self_ref": "#/texts/5", "parent": {"cref": "#/pictures/1"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 36.059887, "t": 387.86063, "r": 195.2753, "b": 358.43832000000003, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 40]}], "orig": "Protect columns by defining column masks", "text": "Protect columns by defining column masks"}, {"self_ref": "#/texts/6", "parent": {"cref": "#/body"}, "children": [], "label": "page_footer", "prov": [{"page_no": 1, "bbox": {"l": 36.900001525878906, "t": 40.77000045776367, "r": 164.45849609375, "b": 26.895000457763672, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 17]}], "orig": "ibm.com /redbooks", "text": "ibm.com /redbooks"}, {"self_ref": "#/texts/7", "parent": {"cref": "#/pictures/2"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 314.70001, "t": 80.49144000000001, "r": 580.52002, "b": 18.227040999999986, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 8]}], "orig": "Redpaper", "text": "Redpaper"}, {"self_ref": "#/texts/8", "parent": {"cref": "#/body"}, "children": [], "label": "section_header", "prov": [{"page_no": 2, "bbox": {"l": 64.80000305175781, "t": 718.1519775390625, "r": 168.73440551757812, "b": 695.9519653320312, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 8]}], "orig": "Contents", "text": "Contents", "level": 1}, {"self_ref": "#/texts/9", "parent": {"cref": "#/body"}, "children": [], "label": "page_footer", "prov": [{"page_no": 2, "bbox": {"l": 64.80000305175781, "t": 36.461997985839844, "r": 257.24334716796875, "b": 28.136999130249023, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 48]}], "orig": "' Copyright IBM Corp. 2014. All rights reserved.", "text": "' Copyright IBM Corp. 2014. All rights reserved."}, {"self_ref": "#/texts/10", "parent": {"cref": "#/body"}, "children": [], "label": "page_footer", "prov": [{"page_no": 2, "bbox": {"l": 538.8599853515625, "t": 37.15127944946289, "r": 547.25927734375, "b": 27.93828010559082, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 3]}], "orig": "iii", "text": "iii"}, {"self_ref": "#/texts/11", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 64.80000305175781, "t": 717.5160522460938, "r": 235.86239624023438, "b": 706.416015625, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 30]}], "orig": "DB2 for i Center of Excellence", "text": "DB2 for i Center of Excellence"}, {"self_ref": "#/texts/12", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 94.13269805908203, "t": 653.5498657226562, "r": 233.99972534179688, "b": 636.66357421875, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 52]}], "orig": "Solution Brief IBM Systems Lab Services and Training", "text": "Solution Brief IBM Systems Lab Services and Training"}, {"self_ref": "#/texts/13", "parent": {"cref": "#/body"}, "children": [], "label": "section_header", "prov": [{"page_no": 3, "bbox": {"l": 144.8892059326172, "t": 464.5383605957031, "r": 188.74681091308594, "b": 455.1859436035156, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 10]}], "orig": "Highlights", "text": "Highlights", "level": 1}, {"self_ref": "#/texts/14", "parent": {"cref": "#/groups/0"}, "children": [], "label": "list_item", "prov": [{"page_no": 3, "bbox": {"l": 144.8892059326172, "t": 446.7829284667969, "r": 242.87388610839844, "b": 433.3105773925781, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 532]}], "orig": "GLYPH<g115>GLYPH<g3> GLYPH<g40>GLYPH<g81>GLYPH<g75>GLYPH<g68>GLYPH<g81>GLYPH<g70>GLYPH<g72>GLYPH<g3> GLYPH<g87>GLYPH<g75>GLYPH<g72>GLYPH<g3> GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g73>GLYPH<g82>GLYPH<g85>GLYPH<g80>GLYPH<g68>GLYPH<g81>GLYPH<g70>GLYPH<g72>GLYPH<g3> GLYPH<g82>GLYPH<g73>GLYPH<g3> GLYPH<g92>GLYPH<g82>GLYPH<g88>GLYPH<g85> GLYPH<g3> GLYPH<g71>GLYPH<g68>GLYPH<g87>GLYPH<g68>GLYPH<g69>GLYPH<g68>GLYPH<g86>GLYPH<g72>GLYPH<g3> GLYPH<g82>GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g68>GLYPH<g87>GLYPH<g76>GLYPH<g82>GLYPH<g81>GLYPH<g86>", "text": "GLYPH<g115>GLYPH<g3> GLYPH<g40>GLYPH<g81>GLYPH<g75>GLYPH<g68>GLYPH<g81>GLYPH<g70>GLYPH<g72>GLYPH<g3> GLYPH<g87>GLYPH<g75>GLYPH<g72>GLYPH<g3> GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g73>GLYPH<g82>GLYPH<g85>GLYPH<g80>GLYPH<g68>GLYPH<g81>GLYPH<g70>GLYPH<g72>GLYPH<g3> GLYPH<g82>GLYPH<g73>GLYPH<g3> GLYPH<g92>GLYPH<g82>GLYPH<g88>GLYPH<g85> GLYPH<g3> GLYPH<g71>GLYPH<g68>GLYPH<g87>GLYPH<g68>GLYPH<g69>GLYPH<g68>GLYPH<g86>GLYPH<g72>GLYPH<g3> GLYPH<g82>GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g68>GLYPH<g87>GLYPH<g76>GLYPH<g82>GLYPH<g81>GLYPH<g86>", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/15", "parent": {"cref": "#/groups/0"}, "children": [], "label": "list_item", "prov": [{"page_no": 3, "bbox": {"l": 144.8892059326172, "t": 424.06781005859375, "r": 259.22869873046875, "b": 402.7626953125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 876]}], "orig": "GLYPH<g115>GLYPH<g3> GLYPH<g40>GLYPH<g68>GLYPH<g85> GLYPH<g81>GLYPH<g3> GLYPH<g74>GLYPH<g85>GLYPH<g72>GLYPH<g68>GLYPH<g87>GLYPH<g72>GLYPH<g85>GLYPH<g3> GLYPH<g85>GLYPH<g72>GLYPH<g87>GLYPH<g88>GLYPH<g85> GLYPH<g81>GLYPH<g3> GLYPH<g82>GLYPH<g81>GLYPH<g3> GLYPH<g44>GLYPH<g55>GLYPH<g3> GLYPH<g83>GLYPH<g85>GLYPH<g82>GLYPH<g77>GLYPH<g72>GLYPH<g70>GLYPH<g87>GLYPH<g86> GLYPH<g3> GLYPH<g87>GLYPH<g75>GLYPH<g85>GLYPH<g82>GLYPH<g88>GLYPH<g74>GLYPH<g75>GLYPH<g3> GLYPH<g80>GLYPH<g82>GLYPH<g71>GLYPH<g72>GLYPH<g85> GLYPH<g81>GLYPH<g76>GLYPH<g93>GLYPH<g68>GLYPH<g87>GLYPH<g76>GLYPH<g82>GLYPH<g81>GLYPH<g3> GLYPH<g82>GLYPH<g73>GLYPH<g3> GLYPH<g71>GLYPH<g68>GLYPH<g87>GLYPH<g68>GLYPH<g69>GLYPH<g68>GLYPH<g86>GLYPH<g72>GLYPH<g3> GLYPH<g68>GLYPH<g81>GLYPH<g71> GLYPH<g3> GLYPH<g68>GLYPH<g83>GLYPH<g83>GLYPH<g79>GLYPH<g76>GLYPH<g70>GLYPH<g68>GLYPH<g87>GLYPH<g76>GLYPH<g82>GLYPH<g81>GLYPH<g86>", "text": "GLYPH<g115>GLYPH<g3> GLYPH<g40>GLYPH<g68>GLYPH<g85> GLYPH<g81>GLYPH<g3> GLYPH<g74>GLYPH<g85>GLYPH<g72>GLYPH<g68>GLYPH<g87>GLYPH<g72>GLYPH<g85>GLYPH<g3> GLYPH<g85>GLYPH<g72>GLYPH<g87>GLYPH<g88>GLYPH<g85> GLYPH<g81>GLYPH<g3> GLYPH<g82>GLYPH<g81>GLYPH<g3> GLYPH<g44>GLYPH<g55>GLYPH<g3> GLYPH<g83>GLYPH<g85>GLYPH<g82>GLYPH<g77>GLYPH<g72>GLYPH<g70>GLYPH<g87>GLYPH<g86> GLYPH<g3> GLYPH<g87>GLYPH<g75>GLYPH<g85>GLYPH<g82>GLYPH<g88>GLYPH<g74>GLYPH<g75>GLYPH<g3> GLYPH<g80>GLYPH<g82>GLYPH<g71>GLYPH<g72>GLYPH<g85> GLYPH<g81>GLYPH<g76>GLYPH<g93>GLYPH<g68>GLYPH<g87>GLYPH<g76>GLYPH<g82>GLYPH<g81>GLYPH<g3> GLYPH<g82>GLYPH<g73>GLYPH<g3> GLYPH<g71>GLYPH<g68>GLYPH<g87>GLYPH<g68>GLYPH<g69>GLYPH<g68>GLYPH<g86>GLYPH<g72>GLYPH<g3> GLYPH<g68>GLYPH<g81>GLYPH<g71> GLYPH<g3> GLYPH<g68>GLYPH<g83>GLYPH<g83>GLYPH<g79>GLYPH<g76>GLYPH<g70>GLYPH<g68>GLYPH<g87>GLYPH<g76>GLYPH<g82>GLYPH<g81>GLYPH<g86>", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/16", "parent": {"cref": "#/groups/0"}, "children": [], "label": "list_item", "prov": [{"page_no": 3, "bbox": {"l": 144.8892059326172, "t": 393.5198059082031, "r": 249.8356170654297, "b": 380.0474548339844, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 672]}], "orig": "GLYPH<g115>GLYPH<g3> GLYPH<g53>GLYPH<g72>GLYPH<g79>GLYPH<g92>GLYPH<g3> GLYPH<g82>GLYPH<g81>GLYPH<g3> GLYPH<g44>GLYPH<g37>GLYPH<g48>GLYPH<g3> GLYPH<g72>GLYPH<g91>GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g87>GLYPH<g3> GLYPH<g70>GLYPH<g82>GLYPH<g81>GLYPH<g86>GLYPH<g88>GLYPH<g79>GLYPH<g87>GLYPH<g76>GLYPH<g81>GLYPH<g74>GLYPH<g15>GLYPH<g3> GLYPH<g86>GLYPH<g78>GLYPH<g76>GLYPH<g79>GLYPH<g79>GLYPH<g86> GLYPH<g3> GLYPH<g86>GLYPH<g75>GLYPH<g68>GLYPH<g85>GLYPH<g76>GLYPH<g81>GLYPH<g74>GLYPH<g3> GLYPH<g68>GLYPH<g81>GLYPH<g71>GLYPH<g3> GLYPH<g85>GLYPH<g72>GLYPH<g81>GLYPH<g82>GLYPH<g90>GLYPH<g81>GLYPH<g3> GLYPH<g86>GLYPH<g72>GLYPH<g85>GLYPH<g89>GLYPH<g76>GLYPH<g70>GLYPH<g72>GLYPH<g86>", "text": "GLYPH<g115>GLYPH<g3> GLYPH<g53>GLYPH<g72>GLYPH<g79>GLYPH<g92>GLYPH<g3> GLYPH<g82>GLYPH<g81>GLYPH<g3> GLYPH<g44>GLYPH<g37>GLYPH<g48>GLYPH<g3> GLYPH<g72>GLYPH<g91>GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g87>GLYPH<g3> GLYPH<g70>GLYPH<g82>GLYPH<g81>GLYPH<g86>GLYPH<g88>GLYPH<g79>GLYPH<g87>GLYPH<g76>GLYPH<g81>GLYPH<g74>GLYPH<g15>GLYPH<g3> GLYPH<g86>GLYPH<g78>GLYPH<g76>GLYPH<g79>GLYPH<g79>GLYPH<g86> GLYPH<g3> GLYPH<g86>GLYPH<g75>GLYPH<g68>GLYPH<g85>GLYPH<g76>GLYPH<g81>GLYPH<g74>GLYPH<g3> GLYPH<g68>GLYPH<g81>GLYPH<g71>GLYPH<g3> GLYPH<g85>GLYPH<g72>GLYPH<g81>GLYPH<g82>GLYPH<g90>GLYPH<g81>GLYPH<g3> GLYPH<g86>GLYPH<g72>GLYPH<g85>GLYPH<g89>GLYPH<g76>GLYPH<g70>GLYPH<g72>GLYPH<g86>", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/17", "parent": {"cref": "#/groups/0"}, "children": [], "label": "list_item", "prov": [{"page_no": 3, "bbox": {"l": 144.8892059326172, "t": 370.8047180175781, "r": 234.2516326904297, "b": 357.3323669433594, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 613]}], "orig": "GLYPH<g115>GLYPH<g3> GLYPH<g55> GLYPH<g68>GLYPH<g78>GLYPH<g72>GLYPH<g3> GLYPH<g68>GLYPH<g71>GLYPH<g89>GLYPH<g68>GLYPH<g81>GLYPH<g87>GLYPH<g68>GLYPH<g74>GLYPH<g72>GLYPH<g3> GLYPH<g82>GLYPH<g73>GLYPH<g3> GLYPH<g68>GLYPH<g70>GLYPH<g70>GLYPH<g72>GLYPH<g86>GLYPH<g86>GLYPH<g3> GLYPH<g87>GLYPH<g82>GLYPH<g3> GLYPH<g68> GLYPH<g3> GLYPH<g90>GLYPH<g82>GLYPH<g85>GLYPH<g79>GLYPH<g71>GLYPH<g90>GLYPH<g76>GLYPH<g71>GLYPH<g72>GLYPH<g3> GLYPH<g86>GLYPH<g82>GLYPH<g88>GLYPH<g85>GLYPH<g70>GLYPH<g72>GLYPH<g3> GLYPH<g82>GLYPH<g73>GLYPH<g3> GLYPH<g72>GLYPH<g91>GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g87>GLYPH<g76>GLYPH<g86>GLYPH<g72>", "text": "GLYPH<g115>GLYPH<g3> GLYPH<g55> GLYPH<g68>GLYPH<g78>GLYPH<g72>GLYPH<g3> GLYPH<g68>GLYPH<g71>GLYPH<g89>GLYPH<g68>GLYPH<g81>GLYPH<g87>GLYPH<g68>GLYPH<g74>GLYPH<g72>GLYPH<g3> GLYPH<g82>GLYPH<g73>GLYPH<g3> GLYPH<g68>GLYPH<g70>GLYPH<g70>GLYPH<g72>GLYPH<g86>GLYPH<g86>GLYPH<g3> GLYPH<g87>GLYPH<g82>GLYPH<g3> GLYPH<g68> GLYPH<g3> GLYPH<g90>GLYPH<g82>GLYPH<g85>GLYPH<g79>GLYPH<g71>GLYPH<g90>GLYPH<g76>GLYPH<g71>GLYPH<g72>GLYPH<g3> GLYPH<g86>GLYPH<g82>GLYPH<g88>GLYPH<g85>GLYPH<g70>GLYPH<g72>GLYPH<g3> GLYPH<g82>GLYPH<g73>GLYPH<g3> GLYPH<g72>GLYPH<g91>GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g87>GLYPH<g76>GLYPH<g86>GLYPH<g72>", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/18", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 461.0885925292969, "t": 653.5924682617188, "r": 506.26177978515625, "b": 646.5781860351562, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 14]}], "orig": "Power Services", "text": "Power Services"}, {"self_ref": "#/texts/19", "parent": {"cref": "#/body"}, "children": [], "label": "section_header", "prov": [{"page_no": 3, "bbox": {"l": 280.2401123046875, "t": 552.6573486328125, "r": 463.8094177246094, "b": 515.3794555664062, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 30]}], "orig": "DB2 for i Center of Excellence", "text": "DB2 for i Center of Excellence", "level": 1}, {"self_ref": "#/texts/20", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 280.2401123046875, "t": 514.4097290039062, "r": 483.29571533203125, "b": 504.5404052734375, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 49]}], "orig": "Expert help to achieve your business requirements", "text": "Expert help to achieve your business requirements"}, {"self_ref": "#/texts/21", "parent": {"cref": "#/body"}, "children": [], "label": "section_header", "prov": [{"page_no": 3, "bbox": {"l": 280.2401123046875, "t": 476.1183776855469, "r": 443.2821044921875, "b": 467.1043395996094, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 37]}], "orig": "We build confident, satisfied clients", "text": "We build confident, satisfied clients", "level": 1}, {"self_ref": "#/texts/22", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 280.2401123046875, "t": 464.6240539550781, "r": 488.1546630859375, "b": 447.0404968261719, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 122]}], "orig": "No one else has the vast consulting experiences, skills sharing and renown service offerings to do what we can do for you.", "text": "No one else has the vast consulting experiences, skills sharing and renown service offerings to do what we can do for you."}, {"self_ref": "#/texts/23", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 280.2401123046875, "t": 434.6739807128906, "r": 367.8602294921875, "b": 427.2699890136719, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 27]}], "orig": "Because no one else is IBM.", "text": "Because no one else is IBM."}, {"self_ref": "#/texts/24", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 280.2401123046875, "t": 414.9019775390625, "r": 500.321044921875, "b": 366.77972412109375, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 318]}], "orig": "With combined experiences and direct access to development groups, we're the experts in IBM DB2\u00ae for i. The DB2 for i Center of Excellence (CoE) can help you achieve-perhaps reexamine and exceed-your business requirements and gain more confidence and satisfaction in IBM product data management products and solutions.", "text": "With combined experiences and direct access to development groups, we're the experts in IBM DB2\u00ae for i. The DB2 for i Center of Excellence (CoE) can help you achieve-perhaps reexamine and exceed-your business requirements and gain more confidence and satisfaction in IBM product data management products and solutions."}, {"self_ref": "#/texts/25", "parent": {"cref": "#/body"}, "children": [], "label": "section_header", "prov": [{"page_no": 3, "bbox": {"l": 280.2401123046875, "t": 354.1459655761719, "r": 434.8320617675781, "b": 345.1319274902344, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 30]}], "orig": "Who we are, some of what we do", "text": "Who we are, some of what we do", "level": 1}, {"self_ref": "#/texts/26", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 280.2401123046875, "t": 342.6517639160156, "r": 434.56317138671875, "b": 335.2477722167969, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 46]}], "orig": "Global CoE engagements cover topics including:", "text": "Global CoE engagements cover topics including:"}, {"self_ref": "#/texts/27", "parent": {"cref": "#/groups/1"}, "children": [], "label": "list_item", "prov": [{"page_no": 3, "bbox": {"l": 280.2401123046875, "t": 322.8817443847656, "r": 401.5641174316406, "b": 315.4777526855469, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 38]}], "orig": "r Database performance and scalability", "text": "r Database performance and scalability", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/28", "parent": {"cref": "#/groups/1"}, "children": [], "label": "list_item", "prov": [{"page_no": 3, "bbox": {"l": 280.2401123046875, "t": 312.69903564453125, "r": 424.9964599609375, "b": 305.2950439453125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 44]}], "orig": "r Advanced SQL knowledge and skills transfer", "text": "r Advanced SQL knowledge and skills transfer", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/29", "parent": {"cref": "#/groups/1"}, "children": [], "label": "list_item", "prov": [{"page_no": 3, "bbox": {"l": 280.2401123046875, "t": 302.5164489746094, "r": 392.158447265625, "b": 295.1124572753906, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 37]}], "orig": "r Business intelligence and analytics", "text": "r Business intelligence and analytics", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/30", "parent": {"cref": "#/groups/1"}, "children": [], "label": "list_item", "prov": [{"page_no": 3, "bbox": {"l": 280.2401123046875, "t": 292.333740234375, "r": 339.94354248046875, "b": 284.92974853515625, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 15]}], "orig": "r DB2 Web Query", "text": "r DB2 Web Query", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/31", "parent": {"cref": "#/groups/1"}, "children": [], "label": "list_item", "prov": [{"page_no": 3, "bbox": {"l": 280.2401123046875, "t": 282.1511535644531, "r": 504.1931457519531, "b": 274.7471618652344, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 72]}], "orig": "r Query/400 modernization for better reporting and analysis capabilities", "text": "r Query/400 modernization for better reporting and analysis capabilities", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/32", "parent": {"cref": "#/groups/1"}, "children": [], "label": "list_item", "prov": [{"page_no": 3, "bbox": {"l": 280.2401123046875, "t": 271.96844482421875, "r": 423.002197265625, "b": 264.564453125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 43]}], "orig": "r Database modernization and re-engineering", "text": "r Database modernization and re-engineering", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/33", "parent": {"cref": "#/groups/1"}, "children": [], "label": "list_item", "prov": [{"page_no": 3, "bbox": {"l": 280.2401123046875, "t": 261.7858581542969, "r": 399.6517333984375, "b": 254.38186645507812, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 38]}], "orig": "r Data-centric architecture and design", "text": "r Data-centric architecture and design", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/34", "parent": {"cref": "#/groups/1"}, "children": [], "label": "list_item", "prov": [{"page_no": 3, "bbox": {"l": 280.2401123046875, "t": 251.60325622558594, "r": 466.77880859375, "b": 244.1992645263672, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 58]}], "orig": "r Extremely large database and overcoming limits to growth", "text": "r Extremely large database and overcoming limits to growth", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/35", "parent": {"cref": "#/groups/1"}, "children": [], "label": "list_item", "prov": [{"page_no": 3, "bbox": {"l": 280.2401123046875, "t": 241.42054748535156, "r": 382.2095642089844, "b": 234.0165557861328, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 30]}], "orig": "r ISV education and enablement", "text": "r ISV education and enablement", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/36", "parent": {"cref": "#/body"}, "children": [], "label": "section_header", "prov": [{"page_no": 4, "bbox": {"l": 64.80000305175781, "t": 718.1519775390625, "r": 151.46160888671875, "b": 695.9519653320312, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 7]}], "orig": "Preface", "text": "Preface", "level": 1}, {"self_ref": "#/texts/37", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 4, "bbox": {"l": 136.79983520507812, "t": 659.3513793945312, "r": 547.3082275390625, "b": 590.1392822265625, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 469]}], "orig": "This IBMfi Redpaper\u2122 publication provides information about the IBM i 7.2 feature of IBM DB2fi for i Row and Column Access Control (RCAC). It offers a broad description of the function and advantages of controlling access to data in a comprehensive and transparent way. This publication helps you understand the capabilities of RCAC and provides examples of defining, creating, and implementing the row permissions and column masks in a relational database environment.", "text": "This IBMfi Redpaper\u2122 publication provides information about the IBM i 7.2 feature of IBM DB2fi for i Row and Column Access Control (RCAC). It offers a broad description of the function and advantages of controlling access to data in a comprehensive and transparent way. This publication helps you understand the capabilities of RCAC and provides examples of defining, creating, and implementing the row permissions and column masks in a relational database environment."}, {"self_ref": "#/texts/38", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 4, "bbox": {"l": 136.79986572265625, "t": 577.3925170898438, "r": 546.4656982421875, "b": 532.1800537109375, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 309]}], "orig": "This paper is intended for database engineers, data-centric application developers, and security officers who want to design and implement RCAC as a part of their data control and governance policy. A solid background in IBM i object level security, DB2 for i relational database concepts, and SQL is assumed.", "text": "This paper is intended for database engineers, data-centric application developers, and security officers who want to design and implement RCAC as a part of their data control and governance policy. A solid background in IBM i object level security, DB2 for i relational database concepts, and SQL is assumed."}, {"self_ref": "#/texts/39", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 4, "bbox": {"l": 136.8000030517578, "t": 471.37127685546875, "r": 547.2366943359375, "b": 450.1584777832031, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 172]}], "orig": "This paper was produced by the IBM DB2 for i Center of Excellence team in partnership with the International Technical Support Organization (ITSO), Rochester, Minnesota US.", "text": "This paper was produced by the IBM DB2 for i Center of Excellence team in partnership with the International Technical Support Organization (ITSO), Rochester, Minnesota US."}, {"self_ref": "#/texts/40", "parent": {"cref": "#/body"}, "children": [], "label": "page_footer", "prov": [{"page_no": 4, "bbox": {"l": 64.80000305175781, "t": 36.461997985839844, "r": 257.24334716796875, "b": 28.136999130249023, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 48]}], "orig": "' Copyright IBM Corp. 2014. All rights reserved.", "text": "' Copyright IBM Corp. 2014. All rights reserved."}, {"self_ref": "#/texts/41", "parent": {"cref": "#/body"}, "children": [], "label": "page_footer", "prov": [{"page_no": 4, "bbox": {"l": 538.8599853515625, "t": 37.15127944946289, "r": 547.2503051757812, "b": 27.93828010559082, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "xi", "text": "xi"}, {"self_ref": "#/texts/42", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 4, "bbox": {"l": 263.3995666503906, "t": 416.3512268066406, "r": 541.2507934570312, "b": 275.1402587890625, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 684]}], "orig": "Jim Bainbridge is a senior DB2 consultant on the DB2 for i Center of Excellence team in the IBM Lab Services and Training organization. His primary role is training and implementation services for IBM DB2 Web Query for i and business analytics. Jim began his career with IBM 30 years ago in the IBM Rochester Development Lab, where he developed cooperative processing products that paired IBM PCs with IBM S/36 and AS/.400 systems. In the years since, Jim has held numerous technical roles, including independent software vendors technical support on a broad range of IBM technologies and products, and supporting customers in the IBM Executive Briefing Center and IBM Project Office.", "text": "Jim Bainbridge is a senior DB2 consultant on the DB2 for i Center of Excellence team in the IBM Lab Services and Training organization. His primary role is training and implementation services for IBM DB2 Web Query for i and business analytics. Jim began his career with IBM 30 years ago in the IBM Rochester Development Lab, where he developed cooperative processing products that paired IBM PCs with IBM S/36 and AS/.400 systems. In the years since, Jim has held numerous technical roles, including independent software vendors technical support on a broad range of IBM technologies and products, and supporting customers in the IBM Executive Briefing Center and IBM Project Office."}, {"self_ref": "#/texts/43", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 4, "bbox": {"l": 263.39959716796875, "t": 264.37347412109375, "r": 541.2737426757812, "b": 111.162841796875, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 726]}], "orig": "Hernando Bedoya is a Senior IT Specialist at STG Lab Services and Training in Rochester, Minnesota. He writes extensively and teaches IBM classes worldwide in all areas of DB2 for i. Before joining STG Lab Services, he worked in the ITSO for nine years writing multiple IBM Redbooksfi publications. He also worked for IBM Colombia as an IBM AS/400fi IT Specialist doing presales support for the Andean countries. He has 28 years of experience in the computing field and has taught database classes in Colombian universities. He holds a Master's degree in Computer Science from EAFIT, Colombia. His areas of expertise are database technology, performance, and data warehousing. Hernando can be contacted at hbedoya@us.ibm.com .", "text": "Hernando Bedoya is a Senior IT Specialist at STG Lab Services and Training in Rochester, Minnesota. He writes extensively and teaches IBM classes worldwide in all areas of DB2 for i. Before joining STG Lab Services, he worked in the ITSO for nine years writing multiple IBM Redbooksfi publications. He also worked for IBM Colombia as an IBM AS/400fi IT Specialist doing presales support for the Andean countries. He has 28 years of experience in the computing field and has taught database classes in Colombian universities. He holds a Master's degree in Computer Science from EAFIT, Colombia. His areas of expertise are database technology, performance, and data warehousing. Hernando can be contacted at hbedoya@us.ibm.com ."}, {"self_ref": "#/texts/44", "parent": {"cref": "#/body"}, "children": [], "label": "section_header", "prov": [{"page_no": 4, "bbox": {"l": 64.80000305175781, "t": 503.69940185546875, "r": 125.36660766601562, "b": 488.9364013671875, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 7]}], "orig": "Authors", "text": "Authors", "level": 1}, {"self_ref": "#/texts/45", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 81.0, "t": 523.457275390625, "r": 115.13253021240234, "b": 517.019287109375, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 10]}], "orig": "Chapter 1.", "text": "Chapter 1."}, {"self_ref": "#/texts/46", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 500.3999938964844, "t": 698.831298828125, "r": 522.6177368164062, "b": 661.8682861328125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "1", "text": "1"}, {"self_ref": "#/texts/47", "parent": {"cref": "#/body"}, "children": [], "label": "section_header", "prov": [{"page_no": 5, "bbox": {"l": 136.8000030517578, "t": 537.1136474609375, "r": 547.3047485351562, "b": 482.1217956542969, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 36]}], "orig": "Securing and protecting IBM DB2 data", "text": "Securing and protecting IBM DB2 data", "level": 1}, {"self_ref": "#/texts/48", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 136.79965209960938, "t": 443.2912902832031, "r": 547.2540283203125, "b": 362.078857421875, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 648]}], "orig": "Recent news headlines are filled with reports of data breaches and cyber-attacks impacting global businesses of all sizes. The Identity Theft Resource Center$^{1}$ reports that almost 5000 data breaches have occurred since 2005, exposing over 600 million records of data. The financial cost of these data breaches is skyrocketing. Studies from the Ponemon Institute$^{2}$ revealed that the average cost of a data breach increased in 2013 by 15% globally and resulted in a brand equity loss of $9.4 million per attack. The average cost that is incurred for each lost record containing sensitive information increased more than 9% to $145 per record.", "text": "Recent news headlines are filled with reports of data breaches and cyber-attacks impacting global businesses of all sizes. The Identity Theft Resource Center$^{1}$ reports that almost 5000 data breaches have occurred since 2005, exposing over 600 million records of data. The financial cost of these data breaches is skyrocketing. Studies from the Ponemon Institute$^{2}$ revealed that the average cost of a data breach increased in 2013 by 15% globally and resulted in a brand equity loss of $9.4 million per attack. The average cost that is incurred for each lost record containing sensitive information increased more than 9% to $145 per record."}, {"self_ref": "#/texts/49", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 136.80023193359375, "t": 349.27227783203125, "r": 527.206298828125, "b": 304.0598449707031, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 304]}], "orig": "Businesses must make a serious effort to secure their data and recognize that securing information assets is a cost of doing business. In many parts of the world and in many industries, securing the data is required by law and subject to audits. Data security is no longer an option; it is a requirement.", "text": "Businesses must make a serious effort to secure their data and recognize that securing information assets is a cost of doing business. In many parts of the world and in many industries, securing the data is required by law and subject to audits. Data security is no longer an option; it is a requirement."}, {"self_ref": "#/texts/50", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 136.8002471923828, "t": 291.3130187988281, "r": 547.1551513671875, "b": 270.1002197265625, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 122]}], "orig": "This chapter describes how you can secure and protect data in DB2 for i. The following topics are covered in this chapter:", "text": "This chapter describes how you can secure and protect data in DB2 for i. The following topics are covered in this chapter:"}, {"self_ref": "#/texts/51", "parent": {"cref": "#/groups/2"}, "children": [], "label": "list_item", "prov": [{"page_no": 5, "bbox": {"l": 136.8002471923828, "t": 262.2736511230469, "r": 250.23167419433594, "b": 253.06063842773438, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 37]}], "orig": "GLYPH<SM590000> Security fundamentals", "text": "GLYPH<SM590000> Security fundamentals", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/52", "parent": {"cref": "#/groups/2"}, "children": [], "label": "list_item", "prov": [{"page_no": 5, "bbox": {"l": 136.8002471923828, "t": 250.27383422851562, "r": 282.98114013671875, "b": 241.0608367919922, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 47]}], "orig": "GLYPH<SM590000> Current state of IBM i security", "text": "GLYPH<SM590000> Current state of IBM i security", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/53", "parent": {"cref": "#/groups/2"}, "children": [], "label": "list_item", "prov": [{"page_no": 5, "bbox": {"l": 136.8002471923828, "t": 238.27403259277344, "r": 264.8818664550781, "b": 229.06103515625, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 43]}], "orig": "GLYPH<SM590000> DB2 for i security controls", "text": "GLYPH<SM590000> DB2 for i security controls", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/54", "parent": {"cref": "#/body"}, "children": [], "label": "footnote", "prov": [{"page_no": 5, "bbox": {"l": 136.8000030517578, "t": 74.24993896484375, "r": 258.362548828125, "b": 67.21955871582031, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 35]}], "orig": "$^{1 }$http://www.idtheftcenter.org", "text": "$^{1 }$http://www.idtheftcenter.org"}, {"self_ref": "#/texts/55", "parent": {"cref": "#/body"}, "children": [], "label": "footnote", "prov": [{"page_no": 5, "bbox": {"l": 136.8000030517578, "t": 64.40973663330078, "r": 234.05880737304688, "b": 57.02824020385742, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 31]}], "orig": "$^{2 }$http://www.ponemon.org /", "text": "$^{2 }$http://www.ponemon.org /"}, {"self_ref": "#/texts/56", "parent": {"cref": "#/body"}, "children": [], "label": "page_footer", "prov": [{"page_no": 5, "bbox": {"l": 64.80000305175781, "t": 36.461997985839844, "r": 257.24334716796875, "b": 28.136999130249023, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 48]}], "orig": "' Copyright IBM Corp. 2014. All rights reserved.", "text": "' Copyright IBM Corp. 2014. All rights reserved."}, {"self_ref": "#/texts/57", "parent": {"cref": "#/body"}, "children": [], "label": "page_footer", "prov": [{"page_no": 5, "bbox": {"l": 541.6798706054688, "t": 37.15127944946289, "r": 547.2176513671875, "b": 27.93828010559082, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "1", "text": "1"}, {"self_ref": "#/texts/58", "parent": {"cref": "#/body"}, "children": [], "label": "section_header", "prov": [{"page_no": 6, "bbox": {"l": 64.80000305175781, "t": 717.6593017578125, "r": 267.40582275390625, "b": 702.8963012695312, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 25]}], "orig": "1.1 Security fundamentals", "text": "1.1 Security fundamentals", "level": 1}, {"self_ref": "#/texts/59", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 6, "bbox": {"l": 136.8000030517578, "t": 685.3912963867188, "r": 545.0048217773438, "b": 664.178466796875, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 133]}], "orig": "Before reviewing database security techniques, there are two fundamental steps in securing information assets that must be described:", "text": "Before reviewing database security techniques, there are two fundamental steps in securing information assets that must be described:"}, {"self_ref": "#/texts/60", "parent": {"cref": "#/groups/3"}, "children": [], "label": "list_item", "prov": [{"page_no": 6, "bbox": {"l": 136.8000030517578, "t": 656.8751220703125, "r": 547.1642456054688, "b": 611.138916015625, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 361]}], "orig": "GLYPH<SM590000> First, and most important, is the definition of a company's security policy . Without a security policy, there is no definition of what are acceptable practices for using, accessing, and storing information by who, what, when, where, and how. A security policy should minimally address three things: confidentiality, integrity, and availability.", "text": "GLYPH<SM590000> First, and most important, is the definition of a company's security policy . Without a security policy, there is no definition of what are acceptable practices for using, accessing, and storing information by who, what, when, where, and how. A security policy should minimally address three things: confidentiality, integrity, and availability.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/61", "parent": {"cref": "#/groups/3"}, "children": [], "label": "list_item", "prov": [{"page_no": 6, "bbox": {"l": 151.199462890625, "t": 603.3721313476562, "r": 547.2608642578125, "b": 522.1602172851562, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 587]}], "orig": "The monitoring and assessment of adherence to the security policy determines whether your security strategy is working. Often, IBM security consultants are asked to perform security assessments for companies without regard to the security policy. Although these assessments can be useful for observing how the system is defined and how data is being accessed, they cannot determine the level of security without a security policy. Without a security policy, it really is not an assessment as much as it is a baseline for monitoring the changes in the security settings that are captured.", "text": "The monitoring and assessment of adherence to the security policy determines whether your security strategy is working. Often, IBM security consultants are asked to perform security assessments for companies without regard to the security policy. Although these assessments can be useful for observing how the system is defined and how data is being accessed, they cannot determine the level of security without a security policy. Without a security policy, it really is not an assessment as much as it is a baseline for monitoring the changes in the security settings that are captured.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/62", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 6, "bbox": {"l": 151.199462890625, "t": 514.3934326171875, "r": 541.9920043945312, "b": 505.180419921875, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 90]}], "orig": "A security policy is what defines whether the system and its settings are secure (or not).", "text": "A security policy is what defines whether the system and its settings are secure (or not)."}, {"self_ref": "#/texts/63", "parent": {"cref": "#/groups/4"}, "children": [], "label": "list_item", "prov": [{"page_no": 6, "bbox": {"l": 136.79930114746094, "t": 497.8750305175781, "r": 547.1582641601562, "b": 416.139404296875, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 573]}], "orig": "GLYPH<SM590000> The second fundamental in securing data assets is the use of resource security . If implemented properly, resource security prevents data breaches from both internal and external intrusions. Resource security controls are closely tied to the part of the security policy that defines who should have access to what information resources. A hacker might be good enough to get through your company firewalls and sift his way through to your system, but if they do not have explicit access to your database, the hacker cannot compromise your information assets.", "text": "GLYPH<SM590000> The second fundamental in securing data assets is the use of resource security . If implemented properly, resource security prevents data breaches from both internal and external intrusions. Resource security controls are closely tied to the part of the security policy that defines who should have access to what information resources. A hacker might be good enough to get through your company firewalls and sift his way through to your system, but if they do not have explicit access to your database, the hacker cannot compromise your information assets.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/64", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 6, "bbox": {"l": 136.8002166748047, "t": 403.392578125, "r": 535.3616943359375, "b": 382.1797790527344, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 179]}], "orig": "With your eyes now open to the importance of securing information assets, the rest of this chapter reviews the methods that are available for securing database resources on IBM i.", "text": "With your eyes now open to the importance of securing information assets, the rest of this chapter reviews the methods that are available for securing database resources on IBM i."}, {"self_ref": "#/texts/65", "parent": {"cref": "#/body"}, "children": [], "label": "section_header", "prov": [{"page_no": 6, "bbox": {"l": 64.80000305175781, "t": 353.69927978515625, "r": 323.3839111328125, "b": 338.936279296875, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 35]}], "orig": "1.2 Current state of IBM i security", "text": "1.2 Current state of IBM i security", "level": 1}, {"self_ref": "#/texts/66", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 6, "bbox": {"l": 136.8000030517578, "t": 321.37127685546875, "r": 547.3182373046875, "b": 276.1588439941406, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 306]}], "orig": "Because of the inherently secure nature of IBM i, many clients rely on the default system settings to protect their business data that is stored in DB2 for i. In most cases, this means no data protection because the default setting for the Create default public authority (QCRTAUT) system value is *CHANGE.", "text": "Because of the inherently secure nature of IBM i, many clients rely on the default system settings to protect their business data that is stored in DB2 for i. In most cases, this means no data protection because the default setting for the Create default public authority (QCRTAUT) system value is *CHANGE."}, {"self_ref": "#/texts/67", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 6, "bbox": {"l": 136.8000030517578, "t": 263.3522644042969, "r": 547.284423828125, "b": 206.1400604248047, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 405]}], "orig": "Even more disturbing is that many IBM i clients remain in this state, despite the news headlines and the significant costs that are involved with databases being compromised. This default security configuration makes it quite challenging to implement basic security policies. A tighter implementation is required if you really want to protect one of your company's most valuable assets, which is the data.", "text": "Even more disturbing is that many IBM i clients remain in this state, despite the news headlines and the significant costs that are involved with databases being compromised. This default security configuration makes it quite challenging to implement basic security policies. A tighter implementation is required if you really want to protect one of your company's most valuable assets, which is the data."}, {"self_ref": "#/texts/68", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 6, "bbox": {"l": 136.8000030517578, "t": 193.33349609375, "r": 547.2832641601562, "b": 112.12167358398438, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 640]}], "orig": "Traditionally, IBM i applications have employed menu-based security to counteract this default configuration that gives all users access to the data. The theory is that data is protected by the menu options controlling what database operations that the user can perform. This approach is ineffective, even if the user profile is restricted from running interactive commands. The reason is that in today's connected world there are a multitude of interfaces into the system, from web browsers to PC clients, that bypass application menus. If there are no object-level controls, users of these newer interfaces have an open door to your data.", "text": "Traditionally, IBM i applications have employed menu-based security to counteract this default configuration that gives all users access to the data. The theory is that data is protected by the menu options controlling what database operations that the user can perform. This approach is ineffective, even if the user profile is restricted from running interactive commands. The reason is that in today's connected world there are a multitude of interfaces into the system, from web browsers to PC clients, that bypass application menus. If there are no object-level controls, users of these newer interfaces have an open door to your data."}, {"self_ref": "#/texts/69", "parent": {"cref": "#/body"}, "children": [], "label": "page_footer", "prov": [{"page_no": 6, "bbox": {"l": 64.80000305175781, "t": 37.15127944946289, "r": 72.8219985961914, "b": 27.93828010559082, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "2", "text": "2"}, {"self_ref": "#/texts/70", "parent": {"cref": "#/body"}, "children": [], "label": "page_footer", "prov": [{"page_no": 6, "bbox": {"l": 87.84030151367188, "t": 36.461997985839844, "r": 328.7253723144531, "b": 28.136999130249023, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 54]}], "orig": "Row and Column Access Control Support in IBM DB2 for i", "text": "Row and Column Access Control Support in IBM DB2 for i"}, {"self_ref": "#/texts/71", "parent": {"cref": "#/body"}, "children": [], "label": "page_footer", "prov": [{"page_no": 7, "bbox": {"l": 64.80000305175781, "t": 37.15127944946289, "r": 72.8219985961914, "b": 27.93828010559082, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "4", "text": "4"}, {"self_ref": "#/texts/72", "parent": {"cref": "#/body"}, "children": [], "label": "page_footer", "prov": [{"page_no": 7, "bbox": {"l": 87.84030151367188, "t": 36.461997985839844, "r": 328.7253723144531, "b": 28.136999130249023, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 54]}], "orig": "Row and Column Access Control Support in IBM DB2 for i", "text": "Row and Column Access Control Support in IBM DB2 for i"}, {"self_ref": "#/texts/73", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 136.8000030517578, "t": 720.4913330078125, "r": 544.3033447265625, "b": 639.2794189453125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 589]}], "orig": "Many businesses are trying to limit data access to a need-to-know basis. This security goal means that users should be given access only to the minimum set of data that is required to perform their job. Often, users with object-level access are given access to row and column values that are beyond what their business task requires because that object-level security provides an all-or-nothing solution. For example, object-level controls allow a manager to access data about all employees. Most security policies limit a manager to accessing data only for the employees that they manage.", "text": "Many businesses are trying to limit data access to a need-to-know basis. This security goal means that users should be given access only to the minimum set of data that is required to perform their job. Often, users with object-level access are given access to row and column values that are beyond what their business task requires because that object-level security provides an all-or-nothing solution. For example, object-level controls allow a manager to access data about all employees. Most security policies limit a manager to accessing data only for the employees that they manage."}, {"self_ref": "#/texts/74", "parent": {"cref": "#/body"}, "children": [], "label": "section_header", "prov": [{"page_no": 7, "bbox": {"l": 64.80000305175781, "t": 618.665283203125, "r": 301.4690246582031, "b": 606.67724609375, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 37]}], "orig": "1.3.1 Existing row and column control", "text": "1.3.1 Existing row and column control", "level": 1}, {"self_ref": "#/texts/75", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 136.79998779296875, "t": 592.5112915039062, "r": 541.5673828125, "b": 535.2990112304688, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 377]}], "orig": "Some IBM i clients have tried augmenting the all-or-nothing object-level security with SQL views (or logical files) and application logic, as shown in Figure 1-2. However, application-based logic is easy to bypass with all of the different data access interfaces that are provided by the IBM i operating system, such as Open Database Connectivity (ODBC) and System i Navigator.", "text": "Some IBM i clients have tried augmenting the all-or-nothing object-level security with SQL views (or logical files) and application logic, as shown in Figure 1-2. However, application-based logic is easy to bypass with all of the different data access interfaces that are provided by the IBM i operating system, such as Open Database Connectivity (ODBC) and System i Navigator."}, {"self_ref": "#/texts/76", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 136.79998779296875, "t": 522.492431640625, "r": 547.4407958984375, "b": 477.27996826171875, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 340]}], "orig": "Using SQL views to limit access to a subset of the data in a table also has its own set of challenges. First, there is the complexity of managing all of the SQL view objects that are used for securing data access. Second, scaling a view-based security solution can be difficult as the amount of data grows and the number of users increases.", "text": "Using SQL views to limit access to a subset of the data in a table also has its own set of challenges. First, there is the complexity of managing all of the SQL view objects that are used for securing data access. Second, scaling a view-based security solution can be difficult as the amount of data grows and the number of users increases."}, {"self_ref": "#/texts/77", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 136.79998779296875, "t": 464.473388671875, "r": 547.232666015625, "b": 431.2607727050781, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 247]}], "orig": "Even if you are willing to live with these performance and management issues, a user with *ALLOBJ access still can directly access all of the data in the underlying DB2 table and easily bypass the security controls that are built into an SQL view.", "text": "Even if you are willing to live with these performance and management issues, a user with *ALLOBJ access still can directly access all of the data in the underlying DB2 table and easily bypass the security controls that are built into an SQL view."}, {"self_ref": "#/texts/78", "parent": {"cref": "#/body"}, "children": [], "label": "caption", "prov": [{"page_no": 7, "bbox": {"l": 136.8000030517578, "t": 100.18199920654297, "r": 316.447265625, "b": 91.85700225830078, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 43]}], "orig": "Figure 1-2 Existing row and column controls", "text": "Figure 1-2 Existing row and column controls"}, {"self_ref": "#/texts/79", "parent": {"cref": "#/pictures/8"}, "children": [], "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 180.95911, "t": 408.54388, "r": 209.08017, "b": 402.9216, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 9]}], "orig": "User with", "text": "User with"}, {"self_ref": "#/texts/80", "parent": {"cref": "#/pictures/8"}, "children": [], "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 170.00624, "t": 401.04749, "r": 220.10355, "b": 395.42519999999996, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 14]}], "orig": "*ALLOBJ access", "text": "*ALLOBJ access"}, {"self_ref": "#/texts/81", "parent": {"cref": "#/body"}, "children": [], "label": "section_header", "prov": [{"page_no": 8, "bbox": {"l": 64.80000305175781, "t": 720.665283203125, "r": 335.4955139160156, "b": 708.67724609375, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 38]}], "orig": "2.1.6 Change Function Usage CL command", "text": "2.1.6 Change Function Usage CL command", "level": 1}, {"self_ref": "#/texts/82", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 136.8000030517578, "t": 694.5112915039062, "r": 547.284423828125, "b": 685.2982788085938, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 90]}], "orig": "The following CL commands can be used to work with, display, or change function usage IDs:", "text": "The following CL commands can be used to work with, display, or change function usage IDs:"}, {"self_ref": "#/texts/83", "parent": {"cref": "#/groups/5"}, "children": [], "label": "list_item", "prov": [{"page_no": 8, "bbox": {"l": 136.8000030517578, "t": 677.4717407226562, "r": 301.5174865722656, "b": 668.2587280273438, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 49]}], "orig": "GLYPH<SM590000> Work Function Usage ( WRKFCNUSG )", "text": "GLYPH<SM590000> Work Function Usage ( WRKFCNUSG )", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/84", "parent": {"cref": "#/groups/5"}, "children": [], "label": "list_item", "prov": [{"page_no": 8, "bbox": {"l": 136.80099487304688, "t": 665.471923828125, "r": 313.39776611328125, "b": 656.2589111328125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 51]}], "orig": "GLYPH<SM590000> Change Function Usage ( CHGFCNUSG )", "text": "GLYPH<SM590000> Change Function Usage ( CHGFCNUSG )", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/85", "parent": {"cref": "#/groups/5"}, "children": [], "label": "list_item", "prov": [{"page_no": 8, "bbox": {"l": 136.8009796142578, "t": 653.4721069335938, "r": 310.8171081542969, "b": 644.2590942382812, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 52]}], "orig": "GLYPH<SM590000> Display Function Usage ( DSPFCNUSG )", "text": "GLYPH<SM590000> Display Function Usage ( DSPFCNUSG )", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/86", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 136.7999725341797, "t": 631.5123291015625, "r": 512.5380249023438, "b": 610.2994995117188, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 126]}], "orig": "For example, the following CHGFCNUSG command shows granting authorization to user HBEDOYA to administer and manage RCAC rules:", "text": "For example, the following CHGFCNUSG command shows granting authorization to user HBEDOYA to administer and manage RCAC rules:"}, {"self_ref": "#/texts/87", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 136.80096435546875, "t": 602.3235473632812, "r": 441.59686279296875, "b": 593.5487670898438, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 61]}], "orig": "CHGFCNUSG FCNID(QIBM_DB_SECADM) USER(HBEDOYA) USAGE(*ALLOWED)", "text": "CHGFCNUSG FCNID(QIBM_DB_SECADM) USER(HBEDOYA) USAGE(*ALLOWED)"}, {"self_ref": "#/texts/88", "parent": {"cref": "#/body"}, "children": [], "label": "section_header", "prov": [{"page_no": 8, "bbox": {"l": 64.80000305175781, "t": 572.6453247070312, "r": 544.4754638671875, "b": 560.6572875976562, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 72]}], "orig": "2.1.7 Verifying function usage IDs for RCAC with the FUNCTION_USAGE view", "text": "2.1.7 Verifying function usage IDs for RCAC with the FUNCTION_USAGE view", "level": 1}, {"self_ref": "#/texts/89", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 136.8000030517578, "t": 546.4913330078125, "r": 519.5179443359375, "b": 525.2785034179688, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 130]}], "orig": "The FUNCTION_USAGE view contains function usage configuration details. Table 2-1 describes the columns in the FUNCTION_USAGE view.", "text": "The FUNCTION_USAGE view contains function usage configuration details. Table 2-1 describes the columns in the FUNCTION_USAGE view."}, {"self_ref": "#/texts/90", "parent": {"cref": "#/body"}, "children": [], "label": "caption", "prov": [{"page_no": 8, "bbox": {"l": 136.8000030517578, "t": 512.4420166015625, "r": 283.9680480957031, "b": 504.11700439453125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 29]}], "orig": "Table 2-1 FUNCTION_USAGE view", "text": "Table 2-1 FUNCTION_USAGE view"}, {"self_ref": "#/texts/91", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 136.8000030517578, "t": 339.49127197265625, "r": 547.2803955078125, "b": 318.2784729003906, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 112]}], "orig": "To discover who has authorization to define and manage RCAC, you can use the query that is shown in Example 2-1.", "text": "To discover who has authorization to define and manage RCAC, you can use the query that is shown in Example 2-1."}, {"self_ref": "#/texts/92", "parent": {"cref": "#/body"}, "children": [], "label": "paragraph", "prov": [{"page_no": 8, "bbox": {"l": 136.8000030517578, "t": 305.4420166015625, "r": 462.35418701171875, "b": 297.11700439453125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 74]}], "orig": "Example 2-1 Query to determine who has authority to define and manage RCAC", "text": "Example 2-1 Query to determine who has authority to define and manage RCAC"}, {"self_ref": "#/texts/93", "parent": {"cref": "#/groups/6"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 136.8, "t": 288.34198, "r": 171.26956, "b": 279.56719999999996, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 6]}], "orig": "SELECT", "text": "SELECT"}, {"self_ref": "#/texts/94", "parent": {"cref": "#/groups/6"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 182.75941, "t": 288.34198, "r": 251.69853, "b": 279.56719999999996, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 12]}], "orig": "function_id,", "text": "function_id,"}, {"self_ref": "#/texts/95", "parent": {"cref": "#/groups/6"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 166.78244, "t": 276.3421599999999, "r": 241.73852999999997, "b": 267.56737999999996, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 10]}], "orig": "user_name,", "text": "user_name,"}, {"self_ref": "#/texts/96", "parent": {"cref": "#/groups/6"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 170.75961, "t": 264.34235, "r": 221.69901999999996, "b": 255.56758000000002, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 6]}], "orig": "usage,", "text": "usage,"}, {"self_ref": "#/texts/97", "parent": {"cref": "#/groups/6"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 167.53809, "t": 252.34253, "r": 236.69878, "b": 243.56777999999997, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 9]}], "orig": "user_type", "text": "user_type"}, {"self_ref": "#/texts/98", "parent": {"cref": "#/groups/6"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 136.8, "t": 240.34272999999996, "r": 160.59396, "b": 231.56798000000003, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "FROM", "text": "FROM"}, {"self_ref": "#/texts/99", "parent": {"cref": "#/groups/6"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 178.43944, "t": 240.34272999999996, "r": 261.71829, "b": 231.56798000000003, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 14]}], "orig": "function_usage", "text": "function_usage"}, {"self_ref": "#/texts/100", "parent": {"cref": "#/groups/6"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 136.8, "t": 228.34293000000002, "r": 162.44176, "b": 219.56817999999998, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 5]}], "orig": "WHERE", "text": "WHERE"}, {"self_ref": "#/texts/101", "parent": {"cref": "#/groups/6"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 177.8268, "t": 228.34293000000002, "r": 331.67731, "b": 219.56817999999998, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 28]}], "orig": "function_id=\u2019QIBM_DB_SECADM\u2019", "text": "function_id=\u2019QIBM_DB_SECADM\u2019"}, {"self_ref": "#/texts/102", "parent": {"cref": "#/groups/6"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 136.8, "t": 216.34312, "r": 178.77542, "b": 207.56836999999996, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 8]}], "orig": "ORDER BY", "text": "ORDER BY"}, {"self_ref": "#/texts/103", "parent": {"cref": "#/groups/6"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 189.26929, "t": 216.34312, "r": 241.73856, "b": 207.56836999999996, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 10]}], "orig": "user_name;", "text": "user_name;"}, {"self_ref": "#/texts/104", "parent": {"cref": "#/body"}, "children": [], "label": "section_header", "prov": [{"page_no": 8, "bbox": {"l": 64.80000305175781, "t": 171.7793731689453, "r": 249.59605407714844, "b": 157.01637268066406, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 24]}], "orig": "2.2 Separation of duties", "text": "2.2 Separation of duties", "level": 1}, {"self_ref": "#/texts/105", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 136.8000030517578, "t": 139.45127868652344, "r": 547.2234497070312, "b": 82.23904418945312, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 463]}], "orig": "Separation of duties helps businesses comply with industry regulations or organizational requirements and simplifies the management of authorities. Separation of duties is commonly used to prevent fraudulent activities or errors by a single person. It provides the ability for administrative functions to be divided across individuals without overlapping responsibilities, so that one user does not possess unlimited authority, such as with the *ALLOBJ authority.", "text": "Separation of duties helps businesses comply with industry regulations or organizational requirements and simplifies the management of authorities. Separation of duties is commonly used to prevent fraudulent activities or errors by a single person. It provides the ability for administrative functions to be divided across individuals without overlapping responsibilities, so that one user does not possess unlimited authority, such as with the *ALLOBJ authority."}, {"self_ref": "#/texts/106", "parent": {"cref": "#/body"}, "children": [], "label": "page_footer", "prov": [{"page_no": 8, "bbox": {"l": 64.80000305175781, "t": 37.15127944946289, "r": 78.4020004272461, "b": 27.93828010559082, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "10", "text": "10"}, {"self_ref": "#/texts/107", "parent": {"cref": "#/body"}, "children": [], "label": "page_footer", "prov": [{"page_no": 8, "bbox": {"l": 93.42030334472656, "t": 36.461997985839844, "r": 334.4214172363281, "b": 28.136999130249023, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 54]}], "orig": "Row and Column Access Control Support in IBM DB2 for i", "text": "Row and Column Access Control Support in IBM DB2 for i"}, {"self_ref": "#/texts/108", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 9, "bbox": {"l": 136.79959106445312, "t": 720.490966796875, "r": 542.6943359375, "b": 651.2788696289062, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 516]}], "orig": "For example, assume that a business has assigned the duty to manage security on IBM i to Theresa. Before release IBM i 7.2, to grant privileges, Theresa had to have the same privileges Theresa was granting to others. Therefore, to grant *USE privileges to the PAYROLL table, Theresa had to have *OBJMGT and *USE authority (or a higher level of authority, such as *ALLOBJ). This requirement allowed Theresa to access the data in the PAYROLL table even though Theresa's job description was only to manage its security.", "text": "For example, assume that a business has assigned the duty to manage security on IBM i to Theresa. Before release IBM i 7.2, to grant privileges, Theresa had to have the same privileges Theresa was granting to others. Therefore, to grant *USE privileges to the PAYROLL table, Theresa had to have *OBJMGT and *USE authority (or a higher level of authority, such as *ALLOBJ). This requirement allowed Theresa to access the data in the PAYROLL table even though Theresa's job description was only to manage its security."}, {"self_ref": "#/texts/109", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 9, "bbox": {"l": 136.79959106445312, "t": 638.4722900390625, "r": 547.303955078125, "b": 593.2598266601562, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 285]}], "orig": "In IBM i 7.2, the QIBM_DB_SECADM function usage grants authorities, revokes authorities, changes ownership, or changes the primary group without giving access to the object or, in the case of a database table, to the data that is in the table or allowing other operations on the table.", "text": "In IBM i 7.2, the QIBM_DB_SECADM function usage grants authorities, revokes authorities, changes ownership, or changes the primary group without giving access to the object or, in the case of a database table, to the data that is in the table or allowing other operations on the table."}, {"self_ref": "#/texts/110", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 9, "bbox": {"l": 136.79959106445312, "t": 580.5130615234375, "r": 538.6507568359375, "b": 559.3002319335938, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 129]}], "orig": "QIBM_DB_SECADM function usage can be granted only by a user with *SECADM special authority and can be given to a user or a group.", "text": "QIBM_DB_SECADM function usage can be granted only by a user with *SECADM special authority and can be given to a user or a group."}, {"self_ref": "#/texts/111", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 9, "bbox": {"l": 136.79959106445312, "t": 546.49365234375, "r": 545.7960205078125, "b": 513.281005859375, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 204]}], "orig": "QIBM_DB_SECADM also is responsible for administering RCAC, which restricts which rows a user is allowed to access in a table and whether a user is allowed to see information in certain columns of a table.", "text": "QIBM_DB_SECADM also is responsible for administering RCAC, which restricts which rows a user is allowed to access in a table and whether a user is allowed to see information in certain columns of a table."}, {"self_ref": "#/texts/112", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 9, "bbox": {"l": 136.79959106445312, "t": 500.47442626953125, "r": 539.80712890625, "b": 455.2619934082031, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 285]}], "orig": "A preferred practice is that the RCAC administrator has the QIBM_DB_SECADM function usage ID, but absolutely no other data privileges. The result is that the RCAC administrator can deploy and maintain the RCAC constructs, but cannot grant themselves unauthorized access to data itself.", "text": "A preferred practice is that the RCAC administrator has the QIBM_DB_SECADM function usage ID, but absolutely no other data privileges. The result is that the RCAC administrator can deploy and maintain the RCAC constructs, but cannot grant themselves unauthorized access to data itself."}, {"self_ref": "#/texts/113", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 9, "bbox": {"l": 136.79959106445312, "t": 442.5151672363281, "r": 543.067138671875, "b": 421.3023681640625, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 136]}], "orig": "Table 2-2 shows a comparison of the different function usage IDs and *JOBCTL authority to the different CL commands and DB2 for i tools.", "text": "Table 2-2 shows a comparison of the different function usage IDs and *JOBCTL authority to the different CL commands and DB2 for i tools."}, {"self_ref": "#/texts/114", "parent": {"cref": "#/body"}, "children": [], "label": "caption", "prov": [{"page_no": 9, "bbox": {"l": 64.80000305175781, "t": 408.4620056152344, "r": 391.754638671875, "b": 400.1369934082031, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 78]}], "orig": "Table 2-2 Comparison of the different function usage IDs and *JOBCTL authority", "text": "Table 2-2 Comparison of the different function usage IDs and *JOBCTL authority"}, {"self_ref": "#/texts/115", "parent": {"cref": "#/body"}, "children": [], "label": "page_footer", "prov": [{"page_no": 9, "bbox": {"l": 355.32000732421875, "t": 36.461997985839844, "r": 523.5407104492188, "b": 28.136999130249023, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 41]}], "orig": "Chapter 2. Roles and separation of duties", "text": "Chapter 2. Roles and separation of duties"}, {"self_ref": "#/texts/116", "parent": {"cref": "#/body"}, "children": [], "label": "page_footer", "prov": [{"page_no": 9, "bbox": {"l": 536.0999755859375, "t": 37.15127944946289, "r": 547.2591552734375, "b": 27.93828010559082, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "11", "text": "11"}, {"self_ref": "#/texts/117", "parent": {"cref": "#/body"}, "children": [], "label": "caption", "prov": [{"page_no": 10, "bbox": {"l": 136.799560546875, "t": 720.490966796875, "r": 528.7305908203125, "b": 699.2781372070312, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 135]}], "orig": "The SQL CREATE PERMISSION statement that is shown in Figure 3-1 is used to define and initially enable or disable the row access rules.", "text": "The SQL CREATE PERMISSION statement that is shown in Figure 3-1 is used to define and initially enable or disable the row access rules."}, {"self_ref": "#/texts/118", "parent": {"cref": "#/body"}, "children": [], "label": "caption", "prov": [{"page_no": 10, "bbox": {"l": 136.8000030517578, "t": 377.86199951171875, "r": 341.9765930175781, "b": 369.5369873046875, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 42]}], "orig": "Figure 3-1 CREATE PERMISSION SQL statement", "text": "Figure 3-1 CREATE PERMISSION SQL statement"}, {"self_ref": "#/texts/119", "parent": {"cref": "#/pictures/9"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 148.1337, "t": 652.32031, "r": 246.7961, "b": 642.49017, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 17]}], "orig": "CREATE PERMISSION", "text": "CREATE PERMISSION"}, {"self_ref": "#/texts/120", "parent": {"cref": "#/pictures/9"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 251.86685, "t": 652.32031, "r": 257.58578, "b": 642.50165, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "<", "text": "<"}, {"self_ref": "#/texts/121", "parent": {"cref": "#/pictures/9"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 257.59152, "t": 652.32031, "r": 336.99741, "b": 642.49017, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 15]}], "orig": "permission name", "text": "permission name"}, {"self_ref": "#/texts/122", "parent": {"cref": "#/pictures/9"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 337.01233, "t": 652.32031, "r": 342.73126, "b": 642.50165, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": ">", "text": ">"}, {"self_ref": "#/texts/123", "parent": {"cref": "#/pictures/9"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 346.56491, "t": 670.53748, "r": 530.74371, "b": 662.66492, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 47]}], "orig": "Names the row permission for row access control", "text": "Names the row permission for row access control"}, {"self_ref": "#/texts/124", "parent": {"cref": "#/pictures/9"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 148.1337, "t": 610.93744, "r": 163.45079, "b": 601.1073, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "ON", "text": "ON"}, {"self_ref": "#/texts/125", "parent": {"cref": "#/pictures/9"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 168.58405, "t": 610.93744, "r": 174.30298, "b": 601.11877, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "<", "text": "<"}, {"self_ref": "#/texts/126", "parent": {"cref": "#/pictures/9"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 174.30872, "t": 610.93744, "r": 226.86777, "b": 601.1073, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 10]}], "orig": "table name", "text": "table name"}, {"self_ref": "#/texts/127", "parent": {"cref": "#/pictures/9"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 226.86548000000002, "t": 610.93744, "r": 232.58441, "b": 601.11877, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": ">", "text": ">"}, {"self_ref": "#/texts/128", "parent": {"cref": "#/pictures/9"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 311.3204, "t": 625.70587, "r": 450.77191000000005, "b": 617.83331, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 37]}], "orig": "Identifies the table on which the row", "text": "Identifies the table on which the row"}, {"self_ref": "#/texts/129", "parent": {"cref": "#/pictures/9"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 450.86123999999995, "t": 625.70587, "r": 529.93134, "b": 617.83331, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 21]}], "orig": "permission is created", "text": "permission is created"}, {"self_ref": "#/texts/130", "parent": {"cref": "#/pictures/9"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 148.1337, "t": 569.5545, "r": 163.10973, "b": 559.72437, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "AS", "text": "AS"}, {"self_ref": "#/texts/131", "parent": {"cref": "#/pictures/9"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 165.68669, "t": 569.5545, "r": 171.40562, "b": 559.73584, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "<", "text": "<"}, {"self_ref": "#/texts/132", "parent": {"cref": "#/pictures/9"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 171.41136, "t": 569.5545, "r": 251.20424000000003, "b": 559.72437, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 16]}], "orig": "correlation name", "text": "correlation name"}, {"self_ref": "#/texts/133", "parent": {"cref": "#/pictures/9"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 251.21115, "t": 569.5545, "r": 256.93008, "b": 559.73584, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": ">", "text": ">"}, {"self_ref": "#/texts/134", "parent": {"cref": "#/pictures/9"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 235.79649, "t": 587.77161, "r": 406.62051, "b": 579.89905, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 46]}], "orig": "Specifies an optional correlation name that ca", "text": "Specifies an optional correlation name that ca"}, {"self_ref": "#/texts/135", "parent": {"cref": "#/pictures/9"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 480.53094, "t": 587.77161, "r": 532.89496, "b": 579.89905, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 31]}], "orig": "be used within search-condition", "text": "be used within search-condition"}, {"self_ref": "#/texts/136", "parent": {"cref": "#/pictures/9"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 148.1337, "t": 528.17163, "r": 199.72467, "b": 518.34149, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 8]}], "orig": "FOR ROWS", "text": "FOR ROWS"}, {"self_ref": "#/texts/137", "parent": {"cref": "#/pictures/9"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 321.56271, "t": 545.90588, "r": 455.3432, "b": 538.03333, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 37]}], "orig": "Indicates that a row permission is cr", "text": "Indicates that a row permission is cr"}, {"self_ref": "#/texts/138", "parent": {"cref": "#/pictures/9"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 455.20786000000004, "t": 545.90588, "r": 476.48404, "b": 538.03333, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 5]}], "orig": "eated", "text": "eated"}, {"self_ref": "#/texts/139", "parent": {"cref": "#/pictures/9"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 321.5972, "t": 525.69733, "r": 444.0292400000001, "b": 517.82477, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 33]}], "orig": "Specifies a condition that can be", "text": "Specifies a condition that can be"}, {"self_ref": "#/texts/140", "parent": {"cref": "#/pictures/9"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 444.07986, "t": 525.69733, "r": 459.08678999999995, "b": 517.82477, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 5]}], "orig": "true,", "text": "true,"}, {"self_ref": "#/texts/141", "parent": {"cref": "#/pictures/9"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 464.2088, "t": 525.69733, "r": 530.94897, "b": 517.82477, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 17]}], "orig": "false, or unknown", "text": "false, or unknown"}, {"self_ref": "#/texts/142", "parent": {"cref": "#/pictures/9"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 148.1337, "t": 500.58292, "r": 183.42342, "b": 490.75278, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 5]}], "orig": "WHERE", "text": "WHERE"}, {"self_ref": "#/texts/143", "parent": {"cref": "#/pictures/9"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 188.61984, "t": 500.58292, "r": 194.33878, "b": 490.76428, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "<", "text": "<"}, {"self_ref": "#/texts/144", "parent": {"cref": "#/pictures/9"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 194.34451, "t": 500.58292, "r": 437.04659999999996, "b": 490.75278, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 52]}], "orig": "logic to test: user and/or group and/or column value", "text": "logic to test: user and/or group and/or column value"}, {"self_ref": "#/texts/145", "parent": {"cref": "#/pictures/9"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 437.09020999999996, "t": 500.58292, "r": 442.80914000000007, "b": 490.76428, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": ">", "text": ">"}, {"self_ref": "#/texts/146", "parent": {"cref": "#/pictures/9"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 148.1337, "t": 459.20001, "r": 278.77805, "b": 449.36987, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 23]}], "orig": "ENFORCED FOR ALL ACCESS", "text": "ENFORCED FOR ALL ACCESS"}, {"self_ref": "#/texts/147", "parent": {"cref": "#/pictures/9"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 271.55829, "t": 477.41724, "r": 457.4451, "b": 469.54465, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 52]}], "orig": "Specifies that the row permission applies to all ref", "text": "Specifies that the row permission applies to all ref"}, {"self_ref": "#/texts/148", "parent": {"cref": "#/pictures/9"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 457.19281, "t": 477.41724, "r": 531.74939, "b": 469.54465, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 20]}], "orig": "erences of the table", "text": "erences of the table"}, {"self_ref": "#/texts/149", "parent": {"cref": "#/pictures/9"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 148.1337, "t": 417.81711, "r": 185.17584, "b": 407.98697000000004, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 6]}], "orig": "ENABLE", "text": "ENABLE"}, {"self_ref": "#/texts/150", "parent": {"cref": "#/pictures/9"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 312.28601, "t": 436.03423999999995, "r": 454.33505, "b": 428.16165, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 39]}], "orig": "Specifies that the row permission is to", "text": "Specifies that the row permission is to"}, {"self_ref": "#/texts/151", "parent": {"cref": "#/pictures/9"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 454.3461, "t": 436.03423999999995, "r": 527.05286, "b": 428.16165, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 20]}], "orig": "be initially enabled", "text": "be initially enabled"}, {"self_ref": "#/texts/152", "parent": {"cref": "#/pictures/9"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 311.73431, "t": 415.34283, "r": 315.94684, "b": 407.47025, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "S", "text": "S"}, {"self_ref": "#/texts/153", "parent": {"cref": "#/pictures/9"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 329.28326, "t": 415.34283, "r": 371.71786, "b": 407.47025, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 10]}], "orig": "ifith t th", "text": "ifith t th"}, {"self_ref": "#/texts/154", "parent": {"cref": "#/pictures/9"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 415.0014, "t": 415.34283, "r": 417.09616, "b": 407.47025, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "i", "text": "i"}, {"self_ref": "#/texts/155", "parent": {"cref": "#/pictures/9"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 424.27356, "t": 415.34283, "r": 426.36832, "b": 407.47025, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "i", "text": "i"}, {"self_ref": "#/texts/156", "parent": {"cref": "#/pictures/9"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 438.13208, "t": 415.34283, "r": 440.2268399999999, "b": 407.47025, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "i", "text": "i"}, {"self_ref": "#/texts/157", "parent": {"cref": "#/pictures/9"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 445.88681, "t": 415.34283, "r": 448.95757999999995, "b": 407.47025, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "t", "text": "t"}, {"self_ref": "#/texts/158", "parent": {"cref": "#/pictures/9"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 455.8532400000001, "t": 415.34283, "r": 460.67346000000003, "b": 407.47025, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "b", "text": "b"}, {"self_ref": "#/texts/159", "parent": {"cref": "#/pictures/9"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 467.36746, "t": 415.34283, "r": 470.06998000000004, "b": 407.47025, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "i", "text": "i"}, {"self_ref": "#/texts/160", "parent": {"cref": "#/pictures/9"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 472.73705999999993, "t": 415.34283, "r": 490.1676, "b": 407.47025, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 6]}], "orig": "iti ll", "text": "iti ll"}, {"self_ref": "#/texts/161", "parent": {"cref": "#/pictures/9"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 496.33661, "t": 415.34283, "r": 503.2608, "b": 407.47025, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "di", "text": "di"}, {"self_ref": "#/texts/162", "parent": {"cref": "#/pictures/9"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 511.26138, "t": 415.34283, "r": 527.59674, "b": 407.47025, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "bl d", "text": "bl d"}, {"self_ref": "#/texts/163", "parent": {"cref": "#/pictures/9"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 148.1337, "t": 404.0228, "r": 187.6265, "b": 394.19265999999993, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 7]}], "orig": "DISABLE", "text": "DISABLE"}, {"self_ref": "#/texts/164", "parent": {"cref": "#/pictures/9"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 187.58514, "t": 404.0228, "r": 190.6628, "b": 394.20416000000006, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": ";", "text": ";"}, {"self_ref": "#/texts/165", "parent": {"cref": "#/pictures/9"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 311.73431, "t": 415.34283, "r": 455.83047000000005, "b": 407.47025, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 39]}], "orig": "Specifies that the row permission is to", "text": "Specifies that the row permission is to"}, {"self_ref": "#/texts/166", "parent": {"cref": "#/pictures/9"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 455.8848, "t": 415.34283, "r": 527.62122, "b": 407.47025, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 21]}], "orig": "be initially disabled", "text": "be initially disabled"}, {"self_ref": "#/texts/167", "parent": {"cref": "#/body"}, "children": [], "label": "section_header", "prov": [{"page_no": 10, "bbox": {"l": 136.8000030517578, "t": 352.0559997558594, "r": 215.37600708007812, "b": 340.95599365234375, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 11]}], "orig": "Column mask", "text": "Column mask", "level": 1}, {"self_ref": "#/texts/168", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 136.8000030517578, "t": 336.9112854003906, "r": 542.7664794921875, "b": 291.6988525390625, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 297]}], "orig": "A column mask is a database object that manifests a column value access control rule for a specific column in a specific table. It uses a CASE expression that describes what you see when you access the column. For example, a teller can see only the last four digits of a tax identification number.", "text": "A column mask is a database object that manifests a column value access control rule for a specific column in a specific table. It uses a CASE expression that describes what you see when you access the column. For example, a teller can see only the last four digits of a tax identification number."}, {"self_ref": "#/texts/169", "parent": {"cref": "#/body"}, "children": [], "label": "page_footer", "prov": [{"page_no": 10, "bbox": {"l": 344.94000244140625, "t": 36.461997985839844, "r": 523.6016235351562, "b": 28.136999130249023, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 40]}], "orig": "Chapter 3. Row and Column Access Control", "text": "Chapter 3. Row and Column Access Control"}, {"self_ref": "#/texts/170", "parent": {"cref": "#/body"}, "children": [], "label": "page_footer", "prov": [{"page_no": 10, "bbox": {"l": 536.0999755859375, "t": 37.15127944946289, "r": 547.2591552734375, "b": 27.93828010559082, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "15", "text": "15"}, {"self_ref": "#/texts/171", "parent": {"cref": "#/body"}, "children": [], "label": "paragraph", "prov": [{"page_no": 11, "bbox": {"l": 136.79959106445312, "t": 720.490966796875, "r": 412.20758056640625, "b": 711.2779541015625, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 62]}], "orig": "Table 3-1 summarizes these special registers and their values.", "text": "Table 3-1 summarizes these special registers and their values."}, {"self_ref": "#/texts/172", "parent": {"cref": "#/body"}, "children": [], "label": "caption", "prov": [{"page_no": 11, "bbox": {"l": 136.8000030517578, "t": 698.501953125, "r": 372.6036376953125, "b": 690.177001953125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 58]}], "orig": "Table 3-1 Special registers and their corresponding values", "text": "Table 3-1 Special registers and their corresponding values"}, {"self_ref": "#/texts/173", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 11, "bbox": {"l": 136.8000030517578, "t": 577.5112915039062, "r": 538.493896484375, "b": 556.2984619140625, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 97]}], "orig": "Figure 3-5 shows the difference in the special register values when an adopted authority is used:", "text": "Figure 3-5 shows the difference in the special register values when an adopted authority is used:"}, {"self_ref": "#/texts/174", "parent": {"cref": "#/groups/7"}, "children": [], "label": "list_item", "prov": [{"page_no": 11, "bbox": {"l": 136.8000030517578, "t": 548.471923828125, "r": 411.36138916015625, "b": 539.2589111328125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 75]}], "orig": "GLYPH<SM590000> A user connects to the server using the user profile ALICE.", "text": "GLYPH<SM590000> A user connects to the server using the user profile ALICE.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/175", "parent": {"cref": "#/groups/7"}, "children": [], "label": "list_item", "prov": [{"page_no": 11, "bbox": {"l": 136.8000030517578, "t": 531.4921264648438, "r": 453.2580871582031, "b": 522.2791137695312, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 77]}], "orig": "GLYPH<SM590000> USER and CURRENT USER initially have the same value of ALICE.", "text": "GLYPH<SM590000> USER and CURRENT USER initially have the same value of ALICE.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/176", "parent": {"cref": "#/groups/7"}, "children": [], "label": "list_item", "prov": [{"page_no": 11, "bbox": {"l": 136.8000030517578, "t": 514.5123291015625, "r": 541.4498291015625, "b": 493.29949951171875, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 160]}], "orig": "GLYPH<SM590000> ALICE calls an SQL procedure that is named proc1, which is owned by user profile JOE and was created to adopt JOE's authority when it is called.", "text": "GLYPH<SM590000> ALICE calls an SQL procedure that is named proc1, which is owned by user profile JOE and was created to adopt JOE's authority when it is called.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/177", "parent": {"cref": "#/groups/7"}, "children": [], "label": "list_item", "prov": [{"page_no": 11, "bbox": {"l": 136.8000030517578, "t": 485.472900390625, "r": 547.2167358398438, "b": 452.2602844238281, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 253]}], "orig": "GLYPH<SM590000> While the procedure is running, the special register USER still contains the value of ALICE because it excludes any adopted authority. The special register CURRENT USER contains the value of JOE because it includes any adopted authority.", "text": "GLYPH<SM590000> While the procedure is running, the special register USER still contains the value of ALICE because it excludes any adopted authority. The special register CURRENT USER contains the value of JOE because it includes any adopted authority.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/178", "parent": {"cref": "#/groups/7"}, "children": [], "label": "list_item", "prov": [{"page_no": 11, "bbox": {"l": 136.80101013183594, "t": 444.49346923828125, "r": 547.3540649414062, "b": 423.2806701660156, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 133]}], "orig": "GLYPH<SM590000> When proc1 ends, the session reverts to its original state with both USER and CURRENT USER having the value of ALICE.", "text": "GLYPH<SM590000> When proc1 ends, the session reverts to its original state with both USER and CURRENT USER having the value of ALICE.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/179", "parent": {"cref": "#/body"}, "children": [], "label": "caption", "prov": [{"page_no": 11, "bbox": {"l": 136.8000030517578, "t": 195.2821044921875, "r": 341.2566223144531, "b": 186.95709228515625, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 50]}], "orig": "Figure 3-5 Special registers and adopted authority", "text": "Figure 3-5 Special registers and adopted authority"}, {"self_ref": "#/texts/180", "parent": {"cref": "#/pictures/10"}, "children": [], "label": "text", "prov": [{"page_no": 11, "bbox": {"l": 140.7323, "t": 405.01547, "r": 218.71170000000004, "b": 396.50473, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 34]}], "orig": "SignedonasALICE Signed on as ALICE", "text": "SignedonasALICE Signed on as ALICE"}, {"self_ref": "#/texts/181", "parent": {"cref": "#/pictures/10"}, "children": [], "label": "text", "prov": [{"page_no": 11, "bbox": {"l": 138.476, "t": 381.12558000000007, "r": 191.70256, "b": 372.61484, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 12]}], "orig": "USER = ALICE", "text": "USER = ALICE"}, {"self_ref": "#/texts/182", "parent": {"cref": "#/pictures/10"}, "children": [], "label": "text", "prov": [{"page_no": 11, "bbox": {"l": 138.476, "t": 369.18066, "r": 232.56117, "b": 360.66992, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 20]}], "orig": "CURRENT USER = ALICE", "text": "CURRENT USER = ALICE"}, {"self_ref": "#/texts/183", "parent": {"cref": "#/pictures/10"}, "children": [], "label": "text", "prov": [{"page_no": 11, "bbox": {"l": 138.476, "t": 345.29076999999995, "r": 183.26944, "b": 336.78003, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 10]}], "orig": "CALL proc1", "text": "CALL proc1"}, {"self_ref": "#/texts/184", "parent": {"cref": "#/pictures/10"}, "children": [], "label": "text", "prov": [{"page_no": 11, "bbox": {"l": 148.4301, "t": 318.41476, "r": 184.17328, "b": 309.90402, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 9]}], "orig": "P1 Proc1:", "text": "P1 Proc1:"}, {"self_ref": "#/texts/185", "parent": {"cref": "#/pictures/10"}, "children": [], "label": "text", "prov": [{"page_no": 11, "bbox": {"l": 157.52185, "t": 306.46985, "r": 209.103, "b": 297.95911, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 11]}], "orig": "Owner = JOE", "text": "Owner = JOE"}, {"self_ref": "#/texts/186", "parent": {"cref": "#/pictures/10"}, "children": [], "label": "text", "prov": [{"page_no": 11, "bbox": {"l": 157.52185, "t": 294.52493, "r": 281.68927, "b": 286.01419, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 24]}], "orig": "SET OPTION USRPRF=*OWNER", "text": "SET OPTION USRPRF=*OWNER"}, {"self_ref": "#/texts/187", "parent": {"cref": "#/pictures/10"}, "children": [], "label": "text", "prov": [{"page_no": 11, "bbox": {"l": 148.4301, "t": 270.63507000000004, "r": 201.65666, "b": 262.12433, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 12]}], "orig": "USER = ALICE", "text": "USER = ALICE"}, {"self_ref": "#/texts/188", "parent": {"cref": "#/pictures/10"}, "children": [], "label": "text", "prov": [{"page_no": 11, "bbox": {"l": 148.4301, "t": 258.69016, "r": 234.57686999999999, "b": 250.17940999999996, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 18]}], "orig": "CURRENT USER = JOE", "text": "CURRENT USER = JOE"}, {"self_ref": "#/texts/189", "parent": {"cref": "#/pictures/10"}, "children": [], "label": "text", "prov": [{"page_no": 11, "bbox": {"l": 138.476, "t": 225.84158000000002, "r": 232.56117, "b": 205.38590999999997, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 33]}], "orig": "USER = ALICE CURRENT USER = ALICE", "text": "USER = ALICE CURRENT USER = ALICE"}, {"self_ref": "#/texts/190", "parent": {"cref": "#/body"}, "children": [], "label": "section_header", "prov": [{"page_no": 11, "bbox": {"l": 64.80000305175781, "t": 166.44528198242188, "r": 247.02536010742188, "b": 154.457275390625, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 31]}], "orig": "3.2.2 Built-in global variables", "text": "3.2.2 Built-in global variables", "level": 1}, {"self_ref": "#/texts/191", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 11, "bbox": {"l": 136.8000030517578, "t": 140.29127502441406, "r": 518.0011596679688, "b": 119.0784683227539, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 161]}], "orig": "Built-in global variables are provided with the database manager and are used in SQL statements to retrieve scalar values that are associated with the variables.", "text": "Built-in global variables are provided with the database manager and are used in SQL statements to retrieve scalar values that are associated with the variables."}, {"self_ref": "#/texts/192", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 11, "bbox": {"l": 136.8000030517578, "t": 106.27189636230469, "r": 532.3385009765625, "b": 73.05928039550781, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 233]}], "orig": "IBM DB2 for i supports nine different built-in global variables that are read only and maintained by the system. These global variables can be used to identify attributes of the database connection and used as part of the RCAC logic.", "text": "IBM DB2 for i supports nine different built-in global variables that are read only and maintained by the system. These global variables can be used to identify attributes of the database connection and used as part of the RCAC logic."}, {"self_ref": "#/texts/193", "parent": {"cref": "#/body"}, "children": [], "label": "page_footer", "prov": [{"page_no": 11, "bbox": {"l": 344.94000244140625, "t": 36.461997985839844, "r": 523.6016235351562, "b": 28.136999130249023, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 40]}], "orig": "Chapter 3. Row and Column Access Control", "text": "Chapter 3. Row and Column Access Control"}, {"self_ref": "#/texts/194", "parent": {"cref": "#/body"}, "children": [], "label": "page_footer", "prov": [{"page_no": 11, "bbox": {"l": 536.0999755859375, "t": 37.15127944946289, "r": 547.2591552734375, "b": 27.93828010559082, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "19", "text": "19"}, {"self_ref": "#/texts/195", "parent": {"cref": "#/body"}, "children": [], "label": "page_footer", "prov": [{"page_no": 12, "bbox": {"l": 64.80000305175781, "t": 37.15127944946289, "r": 78.4020004272461, "b": 27.93828010559082, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "20", "text": "20"}, {"self_ref": "#/texts/196", "parent": {"cref": "#/body"}, "children": [], "label": "page_footer", "prov": [{"page_no": 12, "bbox": {"l": 93.42030334472656, "t": 36.461997985839844, "r": 334.4214172363281, "b": 28.136999130249023, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 54]}], "orig": "Row and Column Access Control Support in IBM DB2 for i", "text": "Row and Column Access Control Support in IBM DB2 for i"}, {"self_ref": "#/texts/197", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 136.8000030517578, "t": 720.4913330078125, "r": 342.5477294921875, "b": 711.2783203125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 51]}], "orig": "Table 3-2 lists the nine built-in global variables.", "text": "Table 3-2 lists the nine built-in global variables."}, {"self_ref": "#/texts/198", "parent": {"cref": "#/body"}, "children": [], "label": "caption", "prov": [{"page_no": 12, "bbox": {"l": 64.80000305175781, "t": 698.501953125, "r": 201.1814727783203, "b": 690.177001953125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 35]}], "orig": "Table 3-2 Built-in global variables", "text": "Table 3-2 Built-in global variables"}, {"self_ref": "#/texts/199", "parent": {"cref": "#/body"}, "children": [], "label": "section_header", "prov": [{"page_no": 12, "bbox": {"l": 64.80000305175781, "t": 469.7992858886719, "r": 384.3638916015625, "b": 455.0362854003906, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 34]}], "orig": "3.3 VERIFY_GROUP_FOR_USER function", "text": "3.3 VERIFY_GROUP_FOR_USER function", "level": 1}, {"self_ref": "#/texts/200", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 136.8000030517578, "t": 437.4712829589844, "r": 547.2347412109375, "b": 356.2593994140625, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 576]}], "orig": "The VERIFY_GROUP_FOR_USER function was added in IBM i 7.2. Although it is primarily intended for use with RCAC permissions and masks, it can be used in other SQL statements. The first parameter must be one of these three special registers: SESSION_USER, USER, or CURRENT_USER. The second and subsequent parameters are a list of user or group profiles. Each of these values must be 1 - 10 characters in length. These values are not validated for their existence, which means that you can specify the names of user profiles that do not exist without receiving any kind of error.", "text": "The VERIFY_GROUP_FOR_USER function was added in IBM i 7.2. Although it is primarily intended for use with RCAC permissions and masks, it can be used in other SQL statements. The first parameter must be one of these three special registers: SESSION_USER, USER, or CURRENT_USER. The second and subsequent parameters are a list of user or group profiles. Each of these values must be 1 - 10 characters in length. These values are not validated for their existence, which means that you can specify the names of user profiles that do not exist without receiving any kind of error."}, {"self_ref": "#/texts/201", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 136.80001831054688, "t": 343.5125732421875, "r": 547.2573852539062, "b": 310.2999572753906, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 235]}], "orig": "If a special register value is in the list of user profiles or it is a member of a group profile included in the list, the function returns a long integer value of 1. Otherwise, it returns a value of 0. It never returns the null value.", "text": "If a special register value is in the list of user profiles or it is a member of a group profile included in the list, the function returns a long integer value of 1. Otherwise, it returns a value of 0. It never returns the null value."}, {"self_ref": "#/texts/202", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 136.80001831054688, "t": 297.4933776855469, "r": 458.44525146484375, "b": 288.2803955078125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 63]}], "orig": "Here is an example of using the VERIFY_GROUP_FOR_USER function:", "text": "Here is an example of using the VERIFY_GROUP_FOR_USER function:"}, {"self_ref": "#/texts/203", "parent": {"cref": "#/groups/8"}, "children": [], "label": "list_item", "prov": [{"page_no": 12, "bbox": {"l": 136.80001831054688, "t": 280.45379638671875, "r": 406.0775146484375, "b": 271.2408142089844, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 57]}], "orig": "1. There are user profiles for MGR, JANE, JUDY, and TONY.", "text": "1. There are user profiles for MGR, JANE, JUDY, and TONY.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/204", "parent": {"cref": "#/groups/8"}, "children": [], "label": "list_item", "prov": [{"page_no": 12, "bbox": {"l": 136.80001831054688, "t": 263.4739990234375, "r": 396.9881591796875, "b": 254.26100158691406, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 58]}], "orig": "2. The user profile JANE specifies a group profile of MGR.", "text": "2. The user profile JANE specifies a group profile of MGR.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/205", "parent": {"cref": "#/groups/8"}, "children": [], "label": "list_item", "prov": [{"page_no": 12, "bbox": {"l": 136.80001831054688, "t": 246.4941864013672, "r": 536.568603515625, "b": 225.28138732910156, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 127]}], "orig": "3. If a user is connected to the server using user profile JANE, all of the following function invocations return a value of 1:", "text": "3. If a user is connected to the server using user profile JANE, all of the following function invocations return a value of 1:", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/206", "parent": {"cref": "#/body"}, "children": [], "label": "code", "prov": [{"page_no": 12, "bbox": {"l": 151.20018005371094, "t": 217.305419921875, "r": 451.01605224609375, "b": 150.57144165039062, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 265]}], "orig": "VERIFY_GROUP_FOR_USER (CURRENT_USER, 'MGR') VERIFY_GROUP_FOR_USER (CURRENT_USER, 'JANE', 'MGR') VERIFY_GROUP_FOR_USER (CURRENT_USER, 'JANE', 'MGR', 'STEVE') The following function invocation returns a value of 0: VERIFY_GROUP_FOR_USER (CURRENT_USER, 'JUDY', 'TONY')", "text": "VERIFY_GROUP_FOR_USER (CURRENT_USER, 'MGR') VERIFY_GROUP_FOR_USER (CURRENT_USER, 'JANE', 'MGR') VERIFY_GROUP_FOR_USER (CURRENT_USER, 'JANE', 'MGR', 'STEVE') The following function invocation returns a value of 0: VERIFY_GROUP_FOR_USER (CURRENT_USER, 'JUDY', 'TONY')", "code_language": "unknown"}, {"self_ref": "#/texts/207", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 13, "bbox": {"l": 136.79959106445312, "t": 720.341552734375, "r": 166.73934936523438, "b": 711.5667724609375, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 6]}], "orig": "RETURN", "text": "RETURN"}, {"self_ref": "#/texts/208", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 13, "bbox": {"l": 136.79959106445312, "t": 708.3417358398438, "r": 156.7793426513672, "b": 699.5669555664062, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "CASE", "text": "CASE"}, {"self_ref": "#/texts/209", "parent": {"cref": "#/body"}, "children": [], "label": "code", "prov": [{"page_no": 13, "bbox": {"l": 136.79959106445312, "t": 696.3419189453125, "r": 521.5742797851562, "b": 531.5695190429688, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 437]}], "orig": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'HR', 'EMP' ) = 1 THEN EMPLOYEES . DATE_OF_BIRTH WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1 AND SESSION_USER = EMPLOYEES . USER_ID THEN EMPLOYEES . DATE_OF_BIRTH WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1 AND SESSION_USER <> EMPLOYEES . USER_ID THEN ( 9999 || '-' || MONTH ( EMPLOYEES . DATE_OF_BIRTH ) || '-' || DAY (EMPLOYEES.DATE_OF_BIRTH )) ELSE NULL END ENABLE ;", "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'HR', 'EMP' ) = 1 THEN EMPLOYEES . DATE_OF_BIRTH WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1 AND SESSION_USER = EMPLOYEES . USER_ID THEN EMPLOYEES . DATE_OF_BIRTH WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1 AND SESSION_USER <> EMPLOYEES . USER_ID THEN ( 9999 || '-' || MONTH ( EMPLOYEES . DATE_OF_BIRTH ) || '-' || DAY (EMPLOYEES.DATE_OF_BIRTH )) ELSE NULL END ENABLE ;", "code_language": "unknown"}, {"self_ref": "#/texts/210", "parent": {"cref": "#/groups/9"}, "children": [], "label": "list_item", "prov": [{"page_no": 13, "bbox": {"l": 136.79959106445312, "t": 516.4940795898438, "r": 547.2122192382812, "b": 495.2812805175781, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 136]}], "orig": "2. The other column to mask in this example is the TAX_ID information. In this example, the rules to enforce include the following ones:", "text": "2. The other column to mask in this example is the TAX_ID information. In this example, the rules to enforce include the following ones:", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/211", "parent": {"cref": "#/groups/9"}, "children": [], "label": "list_item", "prov": [{"page_no": 13, "bbox": {"l": 152.03939819335938, "t": 487.51446533203125, "r": 469.1528015136719, "b": 478.3014831542969, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 62]}], "orig": "-Human Resources can see the unmasked TAX_ID of the employees.", "text": "-Human Resources can see the unmasked TAX_ID of the employees.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/212", "parent": {"cref": "#/groups/9"}, "children": [], "label": "list_item", "prov": [{"page_no": 13, "bbox": {"l": 152.03939819335938, "t": 470.4748840332031, "r": 403.95953369140625, "b": 461.26190185546875, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 50]}], "orig": "-Employees can see only their own unmasked TAX_ID.", "text": "-Employees can see only their own unmasked TAX_ID.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/213", "parent": {"cref": "#/groups/9"}, "children": [], "label": "list_item", "prov": [{"page_no": 13, "bbox": {"l": 152.03939819335938, "t": 453.4950866699219, "r": 545.16845703125, "b": 432.28228759765625, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 129]}], "orig": "-Managers see a masked version of TAX_ID with the first five characters replaced with the X character (for example, XXX-XX-1234).", "text": "-Managers see a masked version of TAX_ID with the first five characters replaced with the X character (for example, XXX-XX-1234).", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/214", "parent": {"cref": "#/groups/9"}, "children": [], "label": "list_item", "prov": [{"page_no": 13, "bbox": {"l": 152.03939819335938, "t": 424.5154724121094, "r": 529.463623046875, "b": 415.302490234375, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 77]}], "orig": "-Any other person sees the entire TAX_ID as masked, for example, XXX-XX-XXXX.", "text": "-Any other person sees the entire TAX_ID as masked, for example, XXX-XX-XXXX.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/215", "parent": {"cref": "#/groups/9"}, "children": [], "label": "list_item", "prov": [{"page_no": 13, "bbox": {"l": 151.1997833251953, "t": 407.47589111328125, "r": 530.060302734375, "b": 398.2629089355469, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 82]}], "orig": "To implement this column mask, run the SQL statement that is shown in Example 3-9.", "text": "To implement this column mask, run the SQL statement that is shown in Example 3-9.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/216", "parent": {"cref": "#/body"}, "children": [], "label": "paragraph", "prov": [{"page_no": 13, "bbox": {"l": 136.8000030517578, "t": 385.48199462890625, "r": 351.9873046875, "b": 377.156982421875, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 48]}], "orig": "Example 3-9 Creating a mask on the TAX_ID column", "text": "Example 3-9 Creating a mask on the TAX_ID column"}, {"self_ref": "#/texts/217", "parent": {"cref": "#/body"}, "children": [], "label": "code", "prov": [{"page_no": 13, "bbox": {"l": 136.8000030517578, "t": 368.3218994140625, "r": 526.5546875, "b": 107.55116271972656, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 590]}], "orig": "CREATE MASK HR_SCHEMA.MASK_TAX_ID_ON_EMPLOYEES ON HR_SCHEMA.EMPLOYEES AS EMPLOYEES FOR COLUMN TAX_ID RETURN CASE WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'HR' ) = 1 THEN EMPLOYEES . TAX_ID WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1 AND SESSION_USER = EMPLOYEES . USER_ID THEN EMPLOYEES . TAX_ID WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1 AND SESSION_USER <> EMPLOYEES . USER_ID THEN ( 'XXX-XX-' CONCAT QSYS2 . SUBSTR ( EMPLOYEES . TAX_ID , 8 , 4 ) ) WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'EMP' ) = 1 THEN EMPLOYEES . TAX_ID ELSE 'XXX-XX-XXXX' END ENABLE ;", "text": "CREATE MASK HR_SCHEMA.MASK_TAX_ID_ON_EMPLOYEES ON HR_SCHEMA.EMPLOYEES AS EMPLOYEES FOR COLUMN TAX_ID RETURN CASE WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'HR' ) = 1 THEN EMPLOYEES . TAX_ID WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1 AND SESSION_USER = EMPLOYEES . USER_ID THEN EMPLOYEES . TAX_ID WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1 AND SESSION_USER <> EMPLOYEES . USER_ID THEN ( 'XXX-XX-' CONCAT QSYS2 . SUBSTR ( EMPLOYEES . TAX_ID , 8 , 4 ) ) WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'EMP' ) = 1 THEN EMPLOYEES . TAX_ID ELSE 'XXX-XX-XXXX' END ENABLE ;", "code_language": "unknown"}, {"self_ref": "#/texts/218", "parent": {"cref": "#/body"}, "children": [], "label": "page_footer", "prov": [{"page_no": 13, "bbox": {"l": 344.94000244140625, "t": 36.461997985839844, "r": 523.6016235351562, "b": 28.136999130249023, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 40]}], "orig": "Chapter 3. Row and Column Access Control", "text": "Chapter 3. Row and Column Access Control"}, {"self_ref": "#/texts/219", "parent": {"cref": "#/body"}, "children": [], "label": "page_footer", "prov": [{"page_no": 13, "bbox": {"l": 536.0999755859375, "t": 37.15127944946289, "r": 547.2591552734375, "b": 27.93828010559082, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "27", "text": "27"}, {"self_ref": "#/texts/220", "parent": {"cref": "#/groups/10"}, "children": [], "label": "list_item", "prov": [{"page_no": 14, "bbox": {"l": 136.8000030517578, "t": 720.4913330078125, "r": 449.952392578125, "b": 711.2783203125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 65]}], "orig": "3. Figure 3-10 shows the masks that are created in the HR_SCHEMA.", "text": "3. Figure 3-10 shows the masks that are created in the HR_SCHEMA.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/221", "parent": {"cref": "#/body"}, "children": [], "label": "caption", "prov": [{"page_no": 14, "bbox": {"l": 64.80000305175781, "t": 618.4619750976562, "r": 293.1380920410156, "b": 610.1370239257812, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 52]}], "orig": "Figure 3-10 Column masks shown in System i Navigator", "text": "Figure 3-10 Column masks shown in System i Navigator"}, {"self_ref": "#/texts/222", "parent": {"cref": "#/body"}, "children": [], "label": "section_header", "prov": [{"page_no": 14, "bbox": {"l": 64.80000305175781, "t": 589.6253051757812, "r": 203.98521423339844, "b": 577.6372680664062, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 21]}], "orig": "3.6.6 Activating RCAC", "text": "3.6.6 Activating RCAC", "level": 1}, {"self_ref": "#/texts/223", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 14, "bbox": {"l": 136.8000030517578, "t": 563.4713134765625, "r": 547.2256469726562, "b": 530.2586669921875, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 265]}], "orig": "Now that you have created the row permission and the two column masks, RCAC must be activated. The row permission and the two column masks are enabled (last clause in the scripts), but now you must activate RCAC on the table. To do so, complete the following steps:", "text": "Now that you have created the row permission and the two column masks, RCAC must be activated. The row permission and the two column masks are enabled (last clause in the scripts), but now you must activate RCAC on the table. To do so, complete the following steps:"}, {"self_ref": "#/texts/224", "parent": {"cref": "#/groups/11"}, "children": [], "label": "list_item", "prov": [{"page_no": 14, "bbox": {"l": 136.8000030517578, "t": 522.4918823242188, "r": 409.4788818359375, "b": 513.2788696289062, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 57]}], "orig": "1. Run the SQL statements that are shown in Example 3-10.", "text": "1. Run the SQL statements that are shown in Example 3-10.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/225", "parent": {"cref": "#/body"}, "children": [], "label": "section_header", "prov": [{"page_no": 14, "bbox": {"l": 136.8000030517578, "t": 500.4420166015625, "r": 375.2909851074219, "b": 492.11700439453125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 51]}], "orig": "Example 3-10 Activating RCAC on the EMPLOYEES table", "text": "Example 3-10 Activating RCAC on the EMPLOYEES table", "level": 1}, {"self_ref": "#/texts/226", "parent": {"cref": "#/groups/12"}, "children": [], "label": "list_item", "prov": [{"page_no": 14, "bbox": {"l": 136.8000030517578, "t": 483.3418884277344, "r": 376.6766052246094, "b": 474.5671081542969, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 45]}], "orig": "/* Active Row Access Control (permissions) */", "text": "/* Active Row Access Control (permissions) */", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/227", "parent": {"cref": "#/groups/12"}, "children": [], "label": "list_item", "prov": [{"page_no": 14, "bbox": {"l": 136.8000030517578, "t": 471.3420715332031, "r": 354.86962890625, "b": 462.5672912597656, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 39]}], "orig": "/* Active Column Access Control (masks)", "text": "/* Active Column Access Control (masks)", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/228", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 14, "bbox": {"l": 365.77313232421875, "t": 471.3420715332031, "r": 376.6766052246094, "b": 462.5672912597656, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "*/", "text": "*/"}, {"self_ref": "#/texts/229", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 14, "bbox": {"l": 136.8000030517578, "t": 459.3422546386719, "r": 291.7178039550781, "b": 450.5674743652344, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 31]}], "orig": "ALTER TABLE HR_SCHEMA.EMPLOYEES", "text": "ALTER TABLE HR_SCHEMA.EMPLOYEES"}, {"self_ref": "#/texts/230", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 14, "bbox": {"l": 136.8000030517578, "t": 447.3424377441406, "r": 271.6783142089844, "b": 438.5676574707031, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 27]}], "orig": "ACTIVATE ROW ACCESS CONTROL", "text": "ACTIVATE ROW ACCESS CONTROL"}, {"self_ref": "#/texts/231", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 14, "bbox": {"l": 136.8000030517578, "t": 435.3426208496094, "r": 291.7178039550781, "b": 426.5678405761719, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 31]}], "orig": "ACTIVATE COLUMN ACCESS CONTROL;", "text": "ACTIVATE COLUMN ACCESS CONTROL;"}, {"self_ref": "#/texts/232", "parent": {"cref": "#/groups/13"}, "children": [], "label": "list_item", "prov": [{"page_no": 14, "bbox": {"l": 136.8000030517578, "t": 411.4924011230469, "r": 540.8014526367188, "b": 378.27978515625, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 231]}], "orig": "2. Look at the definition of the EMPLOYEE table, as shown in Figure 3-11. To do this, from the main navigation pane of System i Navigator, click Schemas \uf0ae HR_SCHEMA \uf0ae Tables , right-click the EMPLOYEES table, and click Definition .", "text": "2. Look at the definition of the EMPLOYEE table, as shown in Figure 3-11. To do this, from the main navigation pane of System i Navigator, click Schemas \uf0ae HR_SCHEMA \uf0ae Tables , right-click the EMPLOYEES table, and click Definition .", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/233", "parent": {"cref": "#/body"}, "children": [], "label": "caption", "prov": [{"page_no": 14, "bbox": {"l": 64.80000305175781, "t": 142.9621124267578, "r": 347.4305419921875, "b": 134.63710021972656, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 65]}], "orig": "Figure 3-11 Selecting the EMPLOYEES table from System i Navigator", "text": "Figure 3-11 Selecting the EMPLOYEES table from System i Navigator"}, {"self_ref": "#/texts/234", "parent": {"cref": "#/body"}, "children": [], "label": "page_footer", "prov": [{"page_no": 14, "bbox": {"l": 64.80000305175781, "t": 37.15127944946289, "r": 78.4020004272461, "b": 27.93828010559082, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "28", "text": "28"}, {"self_ref": "#/texts/235", "parent": {"cref": "#/body"}, "children": [], "label": "page_footer", "prov": [{"page_no": 14, "bbox": {"l": 93.42030334472656, "t": 36.461997985839844, "r": 334.4214172363281, "b": 28.136999130249023, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 54]}], "orig": "Row and Column Access Control Support in IBM DB2 for i", "text": "Row and Column Access Control Support in IBM DB2 for i"}, {"self_ref": "#/texts/236", "parent": {"cref": "#/groups/14"}, "children": [], "label": "list_item", "prov": [{"page_no": 15, "bbox": {"l": 136.79959106445312, "t": 720.490966796875, "r": 514.048583984375, "b": 687.2783203125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 228]}], "orig": "2. Figure 4-68 shows the Visual Explain of the same SQL statement, but with RCAC enabled. It is clear that the implementation of the SQL statement is more complex because the row permission rule becomes part of the WHERE clause.", "text": "2. Figure 4-68 shows the Visual Explain of the same SQL statement, but with RCAC enabled. It is clear that the implementation of the SQL statement is more complex because the row permission rule becomes part of the WHERE clause.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/237", "parent": {"cref": "#/body"}, "children": [], "label": "caption", "prov": [{"page_no": 15, "bbox": {"l": 136.8000030517578, "t": 311.4420166015625, "r": 327.0932922363281, "b": 303.11700439453125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 44]}], "orig": "Figure 4-68 Visual Explain with RCAC enabled", "text": "Figure 4-68 Visual Explain with RCAC enabled"}, {"self_ref": "#/texts/238", "parent": {"cref": "#/groups/15"}, "children": [], "label": "list_item", "prov": [{"page_no": 15, "bbox": {"l": 136.8000030517578, "t": 285.4313659667969, "r": 547.2394409179688, "b": 252.21875, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 232]}], "orig": "3. Compare the advised indexes that are provided by the Optimizer without RCAC and with RCAC enabled. Figure 4-69 shows the index advice for the SQL statement without RCAC enabled. The index being advised is for the ORDER BY clause.", "text": "3. Compare the advised indexes that are provided by the Optimizer without RCAC and with RCAC enabled. Figure 4-69 shows the index advice for the SQL statement without RCAC enabled. The index being advised is for the ORDER BY clause.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/239", "parent": {"cref": "#/body"}, "children": [], "label": "caption", "prov": [{"page_no": 15, "bbox": {"l": 64.80000305175781, "t": 124.48210144042969, "r": 227.1014862060547, "b": 116.15709686279297, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 37]}], "orig": "Figure 4-69 Index advice with no RCAC", "text": "Figure 4-69 Index advice with no RCAC"}, {"self_ref": "#/texts/240", "parent": {"cref": "#/body"}, "children": [], "label": "page_footer", "prov": [{"page_no": 15, "bbox": {"l": 214.8000030517578, "t": 36.461997985839844, "r": 523.5935668945312, "b": 28.136999130249023, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 70]}], "orig": "Chapter 4. Implementing Row and Column Access Control: Banking example", "text": "Chapter 4. Implementing Row and Column Access Control: Banking example"}, {"self_ref": "#/texts/241", "parent": {"cref": "#/body"}, "children": [], "label": "page_footer", "prov": [{"page_no": 15, "bbox": {"l": 536.0999755859375, "t": 37.15127944946289, "r": 547.2591552734375, "b": 27.93828010559082, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "77", "text": "77"}, {"self_ref": "#/texts/242", "parent": {"cref": "#/body"}, "children": [], "label": "code", "prov": [{"page_no": 16, "bbox": {"l": 64.80030822753906, "t": 720.3270263671875, "r": 500.697265625, "b": 85.39237976074219, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1998]}], "orig": "THEN C . CUSTOMER_TAX_ID WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'TELLER' ) = 1 THEN ( 'XXX-XX-' CONCAT QSYS2 . SUBSTR ( C . CUSTOMER_TAX_ID , 8 , 4 ) ) WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 THEN C . CUSTOMER_TAX_ID ELSE 'XXX-XX-XXXX' END ENABLE ; CREATE MASK BANK_SCHEMA.MASK_DRIVERS_LICENSE_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C FOR COLUMN CUSTOMER_DRIVERS_LICENSE_NUMBER RETURN CASE WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 THEN C . CUSTOMER_DRIVERS_LICENSE_NUMBER WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'TELLER' ) = 1 THEN C . CUSTOMER_DRIVERS_LICENSE_NUMBER WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 THEN C . CUSTOMER_DRIVERS_LICENSE_NUMBER ELSE '*************' END ENABLE ; CREATE MASK BANK_SCHEMA.MASK_LOGIN_ID_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C FOR COLUMN CUSTOMER_LOGIN_ID RETURN CASE WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 THEN C . CUSTOMER_LOGIN_ID WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 THEN C . CUSTOMER_LOGIN_ID ELSE '*****' END ENABLE ; CREATE MASK BANK_SCHEMA.MASK_SECURITY_QUESTION_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C FOR COLUMN CUSTOMER_SECURITY_QUESTION RETURN CASE WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 THEN C . CUSTOMER_SECURITY_QUESTION WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 THEN C . CUSTOMER_SECURITY_QUESTION ELSE '*****' END ENABLE ; CREATE MASK BANK_SCHEMA.MASK_SECURITY_QUESTION_ANSWER_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C FOR COLUMN CUSTOMER_SECURITY_QUESTION_ANSWER RETURN CASE WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 THEN C . CUSTOMER_SECURITY_QUESTION_ANSWER WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 THEN C . CUSTOMER_SECURITY_QUESTION_ANSWER ELSE '*****' END ENABLE ; ALTER TABLE BANK_SCHEMA.CUSTOMERS ACTIVATE ROW ACCESS CONTROL ACTIVATE COLUMN ACCESS CONTROL ;", "text": "THEN C . CUSTOMER_TAX_ID WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'TELLER' ) = 1 THEN ( 'XXX-XX-' CONCAT QSYS2 . SUBSTR ( C . CUSTOMER_TAX_ID , 8 , 4 ) ) WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 THEN C . CUSTOMER_TAX_ID ELSE 'XXX-XX-XXXX' END ENABLE ; CREATE MASK BANK_SCHEMA.MASK_DRIVERS_LICENSE_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C FOR COLUMN CUSTOMER_DRIVERS_LICENSE_NUMBER RETURN CASE WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 THEN C . CUSTOMER_DRIVERS_LICENSE_NUMBER WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'TELLER' ) = 1 THEN C . CUSTOMER_DRIVERS_LICENSE_NUMBER WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 THEN C . CUSTOMER_DRIVERS_LICENSE_NUMBER ELSE '*************' END ENABLE ; CREATE MASK BANK_SCHEMA.MASK_LOGIN_ID_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C FOR COLUMN CUSTOMER_LOGIN_ID RETURN CASE WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 THEN C . CUSTOMER_LOGIN_ID WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 THEN C . CUSTOMER_LOGIN_ID ELSE '*****' END ENABLE ; CREATE MASK BANK_SCHEMA.MASK_SECURITY_QUESTION_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C FOR COLUMN CUSTOMER_SECURITY_QUESTION RETURN CASE WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 THEN C . CUSTOMER_SECURITY_QUESTION WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 THEN C . CUSTOMER_SECURITY_QUESTION ELSE '*****' END ENABLE ; CREATE MASK BANK_SCHEMA.MASK_SECURITY_QUESTION_ANSWER_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C FOR COLUMN CUSTOMER_SECURITY_QUESTION_ANSWER RETURN CASE WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 THEN C . CUSTOMER_SECURITY_QUESTION_ANSWER WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 THEN C . CUSTOMER_SECURITY_QUESTION_ANSWER ELSE '*****' END ENABLE ; ALTER TABLE BANK_SCHEMA.CUSTOMERS ACTIVATE ROW ACCESS CONTROL ACTIVATE COLUMN ACCESS CONTROL ;", "code_language": "unknown"}, {"self_ref": "#/texts/243", "parent": {"cref": "#/body"}, "children": [], "label": "page_footer", "prov": [{"page_no": 16, "bbox": {"l": 64.80000305175781, "t": 37.15127944946289, "r": 83.98200225830078, "b": 27.93828010559082, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 3]}], "orig": "124", "text": "124"}, {"self_ref": "#/texts/244", "parent": {"cref": "#/body"}, "children": [], "label": "page_footer", "prov": [{"page_no": 16, "bbox": {"l": 98.94000244140625, "t": 36.461997985839844, "r": 339.819580078125, "b": 28.136999130249023, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 54]}], "orig": "Row and Column Access Control Support in IBM DB2 for i", "text": "Row and Column Access Control Support in IBM DB2 for i"}, {"self_ref": "#/texts/245", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 18, "bbox": {"l": 287.2200012207031, "t": 763.4519653320312, "r": 414.24481201171875, "b": 741.251953125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 10]}], "orig": "Back cover", "text": "Back cover"}, {"self_ref": "#/texts/246", "parent": {"cref": "#/body"}, "children": [], "label": "section_header", "prov": [{"page_no": 18, "bbox": {"l": 27.0, "t": 718.3619995117188, "r": 447.3600158691406, "b": 651.5399780273438, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 54]}], "orig": "Row and Column Access Control Support in IBM DB2 for i", "text": "Row and Column Access Control Support in IBM DB2 for i", "level": 1}, {"self_ref": "#/texts/247", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 18, "bbox": {"l": 26.700000762939453, "t": 549.8280029296875, "r": 127.443603515625, "b": 525.1680297851562, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 40]}], "orig": "Implement roles and separation of duties", "text": "Implement roles and separation of duties"}, {"self_ref": "#/texts/248", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 18, "bbox": {"l": 26.700000762939453, "t": 507.8280334472656, "r": 120.283203125, "b": 469.1280212402344, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 40]}], "orig": "Leverage row permissions on the database", "text": "Leverage row permissions on the database"}, {"self_ref": "#/texts/249", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 18, "bbox": {"l": 26.700000762939453, "t": 451.8480224609375, "r": 121.44960021972656, "b": 413.14801025390625, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 40]}], "orig": "Protect columns by defining column masks", "text": "Protect columns by defining column masks"}, {"self_ref": "#/texts/250", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 18, "bbox": {"l": 152.94000244140625, "t": 549.2714233398438, "r": 414.084228515625, "b": 468.4081115722656, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 464]}], "orig": "This IBM Redpaper publication provides information about the IBM i 7.2 feature of IBM DB2 for i Row and Column Access Control (RCAC). It offers a broad description of the function and advantages of controlling access to data in a comprehensive and transparent way. This publication helps you understand the capabilities of RCAC and provides examples of defining, creating, and implementing the row permissions and column masks in a relational database environment.", "text": "This IBM Redpaper publication provides information about the IBM i 7.2 feature of IBM DB2 for i Row and Column Access Control (RCAC). It offers a broad description of the function and advantages of controlling access to data in a comprehensive and transparent way. This publication helps you understand the capabilities of RCAC and provides examples of defining, creating, and implementing the row permissions and column masks in a relational database environment."}, {"self_ref": "#/texts/251", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 18, "bbox": {"l": 152.9400177001953, "t": 460.292724609375, "r": 414.173828125, "b": 403.4290466308594, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 309]}], "orig": "This paper is intended for database engineers, data-centric application developers, and security officers who want to design and implement RCAC as a part of their data control and governance policy. A solid background in IBM i object level security, DB2 for i relational database concepts, and SQL is assumed.", "text": "This paper is intended for database engineers, data-centric application developers, and security officers who want to design and implement RCAC as a part of their data control and governance policy. A solid background in IBM i object level security, DB2 for i relational database concepts, and SQL is assumed."}, {"self_ref": "#/texts/252", "parent": {"cref": "#/body"}, "children": [], "label": "page_footer", "prov": [{"page_no": 18, "bbox": {"l": 171.0, "t": 160.66200256347656, "r": 231.8876953125, "b": 152.3369903564453, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 12]}], "orig": "REDP-5110-00", "text": "REDP-5110-00"}, {"self_ref": "#/texts/253", "parent": {"cref": "#/pictures/15"}, "children": [], "label": "text", "prov": [{"page_no": 18, "bbox": {"l": 558.11987, "t": 746.5313100000001, "r": 565.46039, "b": 737.3183, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "fi", "text": "fi"}, {"self_ref": "#/texts/254", "parent": {"cref": "#/pictures/16"}, "children": [], "label": "text", "prov": [{"page_no": 18, "bbox": {"l": 474.60001, "t": 627.94342, "r": 580.88989, "b": 603.05902, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 8]}], "orig": "Redpaper", "text": "Redpaper"}, {"self_ref": "#/texts/255", "parent": {"cref": "#/pictures/16"}, "children": [], "label": "text", "prov": [{"page_no": 18, "bbox": {"l": 582.53992, "t": 619.67285, "r": 592.13989, "b": 610.79285, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "\u2122", "text": "\u2122"}, {"self_ref": "#/texts/256", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 18, "bbox": {"l": 467.3399963378906, "t": 544.2816772460938, "r": 559.809326171875, "b": 489.8393859863281, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 44]}], "orig": "INTERNATIONAL TECHNICAL SUPPORT ORGANIZATION", "text": "INTERNATIONAL TECHNICAL SUPPORT ORGANIZATION"}, {"self_ref": "#/texts/257", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 18, "bbox": {"l": 467.3399963378906, "t": 440.2080078125, "r": 587.38916015625, "b": 405.52801513671875, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 60]}], "orig": "BUILDING TECHNICAL INFORMATION BASED ON PRACTICAL EXPERIENCE", "text": "BUILDING TECHNICAL INFORMATION BASED ON PRACTICAL EXPERIENCE"}, {"self_ref": "#/texts/258", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 18, "bbox": {"l": 467.3399963378906, "t": 392.13970947265625, "r": 587.5205078125, "b": 250.36593627929688, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 323]}], "orig": "IBM Redbooks are developed by the IBM International Technical Support Organization. Experts from IBM, Customers and Partners from around the world create timely technical information based on realistic scenarios. Specific recommendations are provided to help you implement IT solutions more effectively in your environment.", "text": "IBM Redbooks are developed by the IBM International Technical Support Organization. Experts from IBM, Customers and Partners from around the world create timely technical information based on realistic scenarios. Specific recommendations are provided to help you implement IT solutions more effectively in your environment."}, {"self_ref": "#/texts/259", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 18, "bbox": {"l": 467.3399963378906, "t": 213.1680908203125, "r": 570.947998046875, "b": 190.48809814453125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 39]}], "orig": "For more information: ibm.com /redbooks", "text": "For more information: ibm.com /redbooks"}], "pictures": [{"self_ref": "#/pictures/0", "parent": {"cref": "#/body"}, "children": [], "label": "picture", "prov": [{"page_no": 1, "bbox": {"l": 513.4560546875, "t": 765.9149169921875, "r": 586.1583251953125, "b": 737.1808471679688, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "annotations": []}, {"self_ref": "#/pictures/1", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/2"}, {"cref": "#/texts/3"}, {"cref": "#/texts/4"}, {"cref": "#/texts/5"}], "label": "picture", "prov": [{"page_no": 1, "bbox": {"l": 33.09040069580078, "t": 498.9671630859375, "r": 585.1502075195312, "b": 89.5469970703125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "annotations": []}, {"self_ref": "#/pictures/2", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/7"}], "label": "picture", "prov": [{"page_no": 1, "bbox": {"l": 316.9404296875, "t": 81.87213134765625, "r": 581.354736328125, "b": 17.5740966796875, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "annotations": []}, {"self_ref": "#/pictures/3", "parent": {"cref": "#/body"}, "children": [], "label": "picture", "prov": [{"page_no": 3, "bbox": {"l": 143.39866638183594, "t": 521.7388916015625, "r": 179.56256103515625, "b": 506.378662109375, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "annotations": []}, {"self_ref": "#/pictures/4", "parent": {"cref": "#/body"}, "children": [], "label": "picture", "prov": [{"page_no": 3, "bbox": {"l": 64.1669921875, "t": 188.49365234375, "r": 258.7742919921875, "b": 103.87176513671875, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "annotations": []}, {"self_ref": "#/pictures/5", "parent": {"cref": "#/body"}, "children": [], "label": "picture", "prov": [{"page_no": 4, "bbox": {"l": 142.52883911132812, "t": 416.9550476074219, "r": 251.47850036621094, "b": 288.79351806640625, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "annotations": []}, {"self_ref": "#/pictures/6", "parent": {"cref": "#/body"}, "children": [], "label": "picture", "prov": [{"page_no": 4, "bbox": {"l": 145.4144744873047, "t": 264.7552490234375, "r": 252.08840942382812, "b": 156.616943359375, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "annotations": []}, {"self_ref": "#/pictures/7", "parent": {"cref": "#/body"}, "children": [], "label": "picture", "prov": [{"page_no": 5, "bbox": {"l": 32.075252532958984, "t": 721.422607421875, "r": 239.620361328125, "b": 554.0420532226562, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "annotations": []}, {"self_ref": "#/pictures/8", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/79"}, {"cref": "#/texts/80"}], "label": "picture", "prov": [{"page_no": 7, "bbox": {"l": 135.92466735839844, "t": 416.0727844238281, "r": 546.4456176757812, "b": 103.39019775390625, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 43]}], "captions": [{"cref": "#/texts/78"}], "references": [], "footnotes": [], "image": null, "annotations": []}, {"self_ref": "#/pictures/9", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/119"}, {"cref": "#/texts/120"}, {"cref": "#/texts/121"}, {"cref": "#/texts/122"}, {"cref": "#/texts/123"}, {"cref": "#/texts/124"}, {"cref": "#/texts/125"}, {"cref": "#/texts/126"}, {"cref": "#/texts/127"}, {"cref": "#/texts/128"}, {"cref": "#/texts/129"}, {"cref": "#/texts/130"}, {"cref": "#/texts/131"}, {"cref": "#/texts/132"}, {"cref": "#/texts/133"}, {"cref": "#/texts/134"}, {"cref": "#/texts/135"}, {"cref": "#/texts/136"}, {"cref": "#/texts/137"}, {"cref": "#/texts/138"}, {"cref": "#/texts/139"}, {"cref": "#/texts/140"}, {"cref": "#/texts/141"}, {"cref": "#/texts/142"}, {"cref": "#/texts/143"}, {"cref": "#/texts/144"}, {"cref": "#/texts/145"}, {"cref": "#/texts/146"}, {"cref": "#/texts/147"}, {"cref": "#/texts/148"}, {"cref": "#/texts/149"}, {"cref": "#/texts/150"}, {"cref": "#/texts/151"}, {"cref": "#/texts/152"}, {"cref": "#/texts/153"}, {"cref": "#/texts/154"}, {"cref": "#/texts/155"}, {"cref": "#/texts/156"}, {"cref": "#/texts/157"}, {"cref": "#/texts/158"}, {"cref": "#/texts/159"}, {"cref": "#/texts/160"}, {"cref": "#/texts/161"}, {"cref": "#/texts/162"}, {"cref": "#/texts/163"}, {"cref": "#/texts/164"}, {"cref": "#/texts/165"}, {"cref": "#/texts/166"}], "label": "picture", "prov": [{"page_no": 10, "bbox": {"l": 135.97177124023438, "t": 684.5892333984375, "r": 545.4180908203125, "b": 381.39068603515625, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 177]}], "captions": [{"cref": "#/texts/117"}, {"cref": "#/texts/118"}], "references": [], "footnotes": [], "image": null, "annotations": []}, {"self_ref": "#/pictures/10", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/180"}, {"cref": "#/texts/181"}, {"cref": "#/texts/182"}, {"cref": "#/texts/183"}, {"cref": "#/texts/184"}, {"cref": "#/texts/185"}, {"cref": "#/texts/186"}, {"cref": "#/texts/187"}, {"cref": "#/texts/188"}, {"cref": "#/texts/189"}], "label": "picture", "prov": [{"page_no": 11, "bbox": {"l": 135.64837646484375, "t": 407.8262939453125, "r": 301.2367248535156, "b": 197.24334716796875, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 50]}], "captions": [{"cref": "#/texts/179"}], "references": [], "footnotes": [], "image": null, "annotations": []}, {"self_ref": "#/pictures/11", "parent": {"cref": "#/body"}, "children": [], "label": "picture", "prov": [{"page_no": 14, "bbox": {"l": 63.801902770996094, "t": 696.6175537109375, "r": 547.11474609375, "b": 621.9678344726562, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 52]}], "captions": [{"cref": "#/texts/221"}], "references": [], "footnotes": [], "image": null, "annotations": []}, {"self_ref": "#/pictures/12", "parent": {"cref": "#/body"}, "children": [], "label": "picture", "prov": [{"page_no": 14, "bbox": {"l": 63.985130310058594, "t": 364.09503173828125, "r": 530.0478515625, "b": 145.8603515625, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 65]}], "captions": [{"cref": "#/texts/233"}], "references": [], "footnotes": [], "image": null, "annotations": []}, {"self_ref": "#/pictures/13", "parent": {"cref": "#/body"}, "children": [], "label": "picture", "prov": [{"page_no": 15, "bbox": {"l": 136.5016632080078, "t": 672.7508544921875, "r": 545.4508666992188, "b": 314.4587707519531, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 44]}], "captions": [{"cref": "#/texts/237"}], "references": [], "footnotes": [], "image": null, "annotations": []}, {"self_ref": "#/pictures/14", "parent": {"cref": "#/body"}, "children": [], "label": "picture", "prov": [{"page_no": 15, "bbox": {"l": 64.27847290039062, "t": 238.41851806640625, "r": 506.39263916015625, "b": 127.91290283203125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 37]}], "captions": [{"cref": "#/texts/239"}], "references": [], "footnotes": [], "image": null, "annotations": []}, {"self_ref": "#/pictures/15", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/253"}], "label": "picture", "prov": [{"page_no": 18, "bbox": {"l": 485.1698303222656, "t": 766.7407836914062, "r": 566.2962036132812, "b": 737.8084106445312, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "annotations": []}, {"self_ref": "#/pictures/16", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/254"}, {"cref": "#/texts/255"}], "label": "picture", "prov": [{"page_no": 18, "bbox": {"l": 474.35540771484375, "t": 711.9486694335938, "r": 592.2726440429688, "b": 602.1873779296875, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "annotations": []}], "tables": [{"self_ref": "#/tables/0", "parent": {"cref": "#/body"}, "children": [], "label": "document_index", "prov": [{"page_no": 2, "bbox": {"l": 136.1496124267578, "t": 659.9669799804688, "r": 547.5267944335938, "b": 76.34844970703125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "data": {"table_cells": [{"bbox": {"l": 136.8000030517578, "t": 659.3513793945312, "r": 172.89404296875, "b": 650.1383666992188, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Notices", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 175.01951599121094, "t": 659.3513793945312, "r": 547.1898193359375, "b": 650.1383666992188, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vii", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79901123046875, "t": 646.8715209960938, "r": 189.86537170410156, "b": 637.6585083007812, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Trademarks", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 195.3968505859375, "t": 646.8715209960938, "r": 547.182861328125, "b": 637.6585083007812, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . viii", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79901123046875, "t": 624.3718872070312, "r": 279.3973083496094, "b": 615.1588745117188, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "DB2 for i Center of Excellence", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.6194152832031, "t": 624.3718872070312, "r": 547.1907958984375, "b": 615.1588745117188, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ix", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79901123046875, "t": 601.8722534179688, "r": 172.84423828125, "b": 592.6592407226562, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Preface", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 175.01852416992188, "t": 601.8722534179688, "r": 547.182861328125, "b": 592.6592407226562, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79803466796875, "t": 589.3923950195312, "r": 547.1808471679688, "b": 580.1793823242188, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Authors . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79803466796875, "t": 576.852783203125, "r": 339.18292236328125, "b": 567.6397705078125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Now you can become a published author, too!", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 344.714111328125, "t": 576.852783203125, "r": 547.1387939453125, "b": 567.6397705078125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xiii", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79803466796875, "t": 564.3729248046875, "r": 529.9950561523438, "b": 555.159912109375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Comments welcome. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 535.5494995117188, "t": 564.3729248046875, "r": 547.1978759765625, "b": 555.159912109375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "xiii", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79806518554688, "t": 551.89306640625, "r": 284.0286560058594, "b": 542.6800537109375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Stay connected to IBM Redbooks", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.54449462890625, "t": 551.89306640625, "r": 547.1211547851562, "b": 542.6800537109375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xiv", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79806518554688, "t": 529.3934326171875, "r": 536.0958862304688, "b": 520.180419921875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Chapter 1. Securing and protecting IBM DB2 data  . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.6468505859375, "t": 529.3934326171875, "r": 547.1978149414062, "b": 520.180419921875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79808044433594, "t": 517.3936157226562, "r": 549.8472290039062, "b": 508.18060302734375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "1.1 Security fundamentals. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79806518554688, "t": 504.85394287109375, "r": 536.1293334960938, "b": 495.6409606933594, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "1.2 Current state of IBM i security . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.6611328125, "t": 504.85394287109375, "r": 547.19287109375, "b": 495.6409606933594, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79806518554688, "t": 492.3740539550781, "r": 549.8472290039062, "b": 483.16107177734375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "1.3 DB2 for i security controls . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19720458984375, "t": 479.8941650390625, "r": 536.0551147460938, "b": 470.6811828613281, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "1.3.1 Existing row and column control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.6015014648438, "t": 479.8941650390625, "r": 547.14794921875, "b": 470.6811828613281, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19720458984375, "t": 467.3545227050781, "r": 536.080078125, "b": 458.14154052734375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "1.3.2 New controls: Row and Column Access Control. . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.635498046875, "t": 467.3545227050781, "r": 547.19091796875, "b": 458.14154052734375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.7970428466797, "t": 444.8548889160156, "r": 536.0908813476562, "b": 435.64190673828125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 14, "end_row_offset_idx": 15, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Chapter 2. Roles and separation of duties . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.642822265625, "t": 444.8548889160156, "r": 547.1947631835938, "b": 435.64190673828125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 14, "end_row_offset_idx": 15, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.7970428466797, "t": 432.8550720214844, "r": 536.1271362304688, "b": 423.64208984375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 15, "end_row_offset_idx": 16, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1 Roles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.6658935546875, "t": 432.8550720214844, "r": 547.2047119140625, "b": 423.64208984375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 15, "end_row_offset_idx": 16, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19720458984375, "t": 420.37518310546875, "r": 535.9526977539062, "b": 411.1622009277344, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 16, "end_row_offset_idx": 17, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.1 DDM and DRDA application server access: QIBM_DB_DDMDRDA . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.5558471679688, "t": 420.37518310546875, "r": 547.1590576171875, "b": 411.1622009277344, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 16, "end_row_offset_idx": 17, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19720458984375, "t": 407.8952941894531, "r": 536.0410766601562, "b": 398.68231201171875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 17, "end_row_offset_idx": 18, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.2 Toolbox application server access: QIBM_DB_ZDA. . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.595947265625, "t": 407.8952941894531, "r": 547.1508178710938, "b": 398.68231201171875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 17, "end_row_offset_idx": 18, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19720458984375, "t": 395.35565185546875, "r": 536.0748901367188, "b": 386.1426696777344, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 18, "end_row_offset_idx": 19, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.3 Database Administrator function: QIBM_DB_SQLADM . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.6302490234375, "t": 395.35565185546875, "r": 547.1856079101562, "b": 386.1426696777344, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 18, "end_row_offset_idx": 19, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19720458984375, "t": 382.8757629394531, "r": 411.2704772949219, "b": 373.66278076171875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 19, "end_row_offset_idx": 20, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.4 Database Information function: QIBM_DB_SYSMON", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 416.8177490234375, "t": 382.8757629394531, "r": 547.1786499023438, "b": 373.66278076171875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 19, "end_row_offset_idx": 20, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . 9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19720458984375, "t": 370.3958740234375, "r": 536.035888671875, "b": 361.1828918457031, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 20, "end_row_offset_idx": 21, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.5 Security Administrator function: QIBM_DB_SECADM . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.5989379882812, "t": 370.3958740234375, "r": 547.1619262695312, "b": 361.1828918457031, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 20, "end_row_offset_idx": 21, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19720458984375, "t": 357.8562316894531, "r": 530.5731811523438, "b": 348.64324951171875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 21, "end_row_offset_idx": 22, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.6 Change Function Usage CL command . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.1044311523438, "t": 357.8562316894531, "r": 547.1668701171875, "b": 348.64324951171875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 21, "end_row_offset_idx": 22, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "10", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19720458984375, "t": 345.3763427734375, "r": 530.5352172851562, "b": 336.1633605957031, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 22, "end_row_offset_idx": 23, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.7 Verifying function usage IDs for RCAC with the FUNCTION_USAGE view . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.0755004882812, "t": 345.3763427734375, "r": 547.156005859375, "b": 336.1633605957031, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 22, "end_row_offset_idx": 23, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "10", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.7970428466797, "t": 332.8964538574219, "r": 547.256591796875, "b": 323.6834716796875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 23, "end_row_offset_idx": 24, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.2 Separation of duties . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 23, "end_row_offset_idx": 24, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79702758789062, "t": 310.3968200683594, "r": 530.5396118164062, "b": 301.183837890625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 24, "end_row_offset_idx": 25, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Chapter 3. Row and Column Access Control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.0916748046875, "t": 310.3968200683594, "r": 547.19580078125, "b": 301.183837890625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 24, "end_row_offset_idx": 25, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "13", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79702758789062, "t": 298.3970031738281, "r": 530.4808959960938, "b": 289.18402099609375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 25, "end_row_offset_idx": 26, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.1 Explanation of RCAC and the concept of access control . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.04248046875, "t": 298.3970031738281, "r": 547.1657104492188, "b": 289.18402099609375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 25, "end_row_offset_idx": 26, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "14", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1971893310547, "t": 285.85736083984375, "r": 378.2078552246094, "b": 276.6443786621094, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 26, "end_row_offset_idx": 27, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.1.1 Row permission and column mask definitions", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 383.74713134765625, "t": 285.85736083984375, "r": 547.15576171875, "b": 276.6443786621094, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 26, "end_row_offset_idx": 27, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . 14", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1971893310547, "t": 273.3774719238281, "r": 530.4347534179688, "b": 264.16448974609375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 27, "end_row_offset_idx": 28, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.1.2 Enabling and activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 535.9962158203125, "t": 273.3774719238281, "r": 547.1190795898438, "b": 264.16448974609375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 27, "end_row_offset_idx": 28, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "16", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79702758789062, "t": 260.83782958984375, "r": 530.528076171875, "b": 251.6248321533203, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 28, "end_row_offset_idx": 29, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.2 Special registers and built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.0670166015625, "t": 260.83782958984375, "r": 547.1448364257812, "b": 251.6248321533203, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 28, "end_row_offset_idx": 29, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "18", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1971893310547, "t": 248.3579559326172, "r": 530.4978637695312, "b": 239.14495849609375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 29, "end_row_offset_idx": 30, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.2.1 Special registers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.0518798828125, "t": 248.3579559326172, "r": 547.159912109375, "b": 239.14495849609375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 29, "end_row_offset_idx": 30, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "18", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1971893310547, "t": 235.87808227539062, "r": 530.5602416992188, "b": 226.6650848388672, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 30, "end_row_offset_idx": 31, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.2.2 Built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.09912109375, "t": 235.87808227539062, "r": 547.1768798828125, "b": 226.6650848388672, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 30, "end_row_offset_idx": 31, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "19", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79702758789062, "t": 223.33843994140625, "r": 530.5302734375, "b": 214.1254425048828, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 31, "end_row_offset_idx": 32, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.3 VERIFY_GROUP_FOR_USER function . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.0615234375, "t": 223.33843994140625, "r": 547.1240234375, "b": 214.1254425048828, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 31, "end_row_offset_idx": 32, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "20", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79702758789062, "t": 210.8585662841797, "r": 530.6299438476562, "b": 201.64556884765625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 32, "end_row_offset_idx": 33, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.4 Establishing and controlling accessibility by using the RCAC rule text . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.1631469726562, "t": 210.8585662841797, "r": 547.2295532226562, "b": 201.64556884765625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 32, "end_row_offset_idx": 33, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "21", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 400.3206481933594, "t": 198.37869262695312, "r": 530.4835815429688, "b": 189.1656951904297, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 33, "end_row_offset_idx": 34, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": ". . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.0223999023438, "t": 198.37869262695312, "r": 547.10009765625, "b": 189.1656951904297, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 33, "end_row_offset_idx": 34, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "22", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79701232910156, "t": 198.37869262695312, "r": 530.5651245117188, "b": 176.6260528564453, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 34, "end_row_offset_idx": 35, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.5 SELECT, INSERT, and UPDATE behavior with RCAC 3.6 Human resources example . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.1119995117188, "t": 185.83905029296875, "r": 547.2057495117188, "b": 176.6260528564453, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 34, "end_row_offset_idx": 35, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "22", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717407226562, "t": 173.3591766357422, "r": 530.4913940429688, "b": 164.14617919921875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 35, "end_row_offset_idx": 36, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.1 Assigning the QIBM_DB_SECADM function ID to the consultants. . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.0463256835938, "t": 173.3591766357422, "r": 547.1561889648438, "b": 164.14617919921875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 35, "end_row_offset_idx": 36, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "23", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717407226562, "t": 160.87930297851562, "r": 530.5645751953125, "b": 151.6663055419922, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 36, "end_row_offset_idx": 37, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.2 Creating group profiles for the users and their roles . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.0960083007812, "t": 160.87930297851562, "r": 547.1587524414062, "b": 151.6663055419922, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 36, "end_row_offset_idx": 37, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "23", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717407226562, "t": 148.33966064453125, "r": 530.5569458007812, "b": 139.1266632080078, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 37, "end_row_offset_idx": 38, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.3 Demonstrating data access without RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.0881958007812, "t": 148.33966064453125, "r": 547.1507568359375, "b": 139.1266632080078, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 37, "end_row_offset_idx": 38, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "24", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717407226562, "t": 135.8597869873047, "r": 530.5341186523438, "b": 126.64678955078125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 38, "end_row_offset_idx": 39, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.4 Defining and creating row permissions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.072998046875, "t": 135.8597869873047, "r": 547.15087890625, "b": 126.64678955078125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 38, "end_row_offset_idx": 39, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "25", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717407226562, "t": 123.37991333007812, "r": 339.4510498046875, "b": 114.16690826416016, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 39, "end_row_offset_idx": 40, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.5 Defining and creating column masks", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 344.9899597167969, "t": 123.37991333007812, "r": 547.160888671875, "b": 114.16690826416016, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 39, "end_row_offset_idx": 40, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717407226562, "t": 110.84027099609375, "r": 530.541015625, "b": 101.62727355957031, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 40, "end_row_offset_idx": 41, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.6 Activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.087646484375, "t": 110.84027099609375, "r": 547.1808471679688, "b": 101.62727355957031, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 40, "end_row_offset_idx": 41, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "28", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717407226562, "t": 98.36038970947266, "r": 530.5750732421875, "b": 89.14738464355469, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 41, "end_row_offset_idx": 42, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.7 Demonstrating data access with RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.1066284179688, "t": 98.36038970947266, "r": 547.169677734375, "b": 89.14738464355469, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 41, "end_row_offset_idx": 42, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "29", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717407226562, "t": 85.88050842285156, "r": 530.436279296875, "b": 76.6675033569336, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 42, "end_row_offset_idx": 43, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.8 Demonstrating data access with a view and RCAC . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 535.9984741210938, "t": 85.88050842285156, "r": 547.1228637695312, "b": 76.6675033569336, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 42, "end_row_offset_idx": 43, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "32", "column_header": false, "row_header": false, "row_section": false}], "num_rows": 43, "num_cols": 2, "grid": [[{"bbox": {"l": 136.8000030517578, "t": 659.3513793945312, "r": 172.89404296875, "b": 650.1383666992188, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Notices", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 175.01951599121094, "t": 659.3513793945312, "r": 547.1898193359375, "b": 650.1383666992188, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vii", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 136.79901123046875, "t": 646.8715209960938, "r": 189.86537170410156, "b": 637.6585083007812, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Trademarks", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 195.3968505859375, "t": 646.8715209960938, "r": 547.182861328125, "b": 637.6585083007812, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . viii", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 136.79901123046875, "t": 624.3718872070312, "r": 279.3973083496094, "b": 615.1588745117188, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "DB2 for i Center of Excellence", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.6194152832031, "t": 624.3718872070312, "r": 547.1907958984375, "b": 615.1588745117188, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ix", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 136.79901123046875, "t": 601.8722534179688, "r": 172.84423828125, "b": 592.6592407226562, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Preface", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 175.01852416992188, "t": 601.8722534179688, "r": 547.182861328125, "b": 592.6592407226562, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 136.79803466796875, "t": 589.3923950195312, "r": 547.1808471679688, "b": 580.1793823242188, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Authors . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 136.79803466796875, "t": 576.852783203125, "r": 339.18292236328125, "b": 567.6397705078125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Now you can become a published author, too!", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 344.714111328125, "t": 576.852783203125, "r": 547.1387939453125, "b": 567.6397705078125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xiii", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 136.79803466796875, "t": 564.3729248046875, "r": 529.9950561523438, "b": 555.159912109375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Comments welcome. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 535.5494995117188, "t": 564.3729248046875, "r": 547.1978759765625, "b": 555.159912109375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "xiii", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 136.79806518554688, "t": 551.89306640625, "r": 284.0286560058594, "b": 542.6800537109375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Stay connected to IBM Redbooks", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.54449462890625, "t": 551.89306640625, "r": 547.1211547851562, "b": 542.6800537109375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xiv", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 136.79806518554688, "t": 529.3934326171875, "r": 536.0958862304688, "b": 520.180419921875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Chapter 1. Securing and protecting IBM DB2 data  . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.6468505859375, "t": 529.3934326171875, "r": 547.1978149414062, "b": 520.180419921875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "1", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 136.79808044433594, "t": 517.3936157226562, "r": 549.8472290039062, "b": 508.18060302734375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "1.1 Security fundamentals. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 136.79806518554688, "t": 504.85394287109375, "r": 536.1293334960938, "b": 495.6409606933594, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "1.2 Current state of IBM i security . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.6611328125, "t": 504.85394287109375, "r": 547.19287109375, "b": 495.6409606933594, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "2", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 136.79806518554688, "t": 492.3740539550781, "r": 549.8472290039062, "b": 483.16107177734375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "1.3 DB2 for i security controls . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 151.19720458984375, "t": 479.8941650390625, "r": 536.0551147460938, "b": 470.6811828613281, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "1.3.1 Existing row and column control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.6015014648438, "t": 479.8941650390625, "r": 547.14794921875, "b": 470.6811828613281, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "4", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 151.19720458984375, "t": 467.3545227050781, "r": 536.080078125, "b": 458.14154052734375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "1.3.2 New controls: Row and Column Access Control. . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.635498046875, "t": 467.3545227050781, "r": 547.19091796875, "b": 458.14154052734375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "5", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 136.7970428466797, "t": 444.8548889160156, "r": 536.0908813476562, "b": 435.64190673828125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 14, "end_row_offset_idx": 15, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Chapter 2. Roles and separation of duties . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.642822265625, "t": 444.8548889160156, "r": 547.1947631835938, "b": 435.64190673828125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 14, "end_row_offset_idx": 15, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "7", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 136.7970428466797, "t": 432.8550720214844, "r": 536.1271362304688, "b": 423.64208984375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 15, "end_row_offset_idx": 16, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1 Roles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.6658935546875, "t": 432.8550720214844, "r": 547.2047119140625, "b": 423.64208984375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 15, "end_row_offset_idx": 16, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "8", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 151.19720458984375, "t": 420.37518310546875, "r": 535.9526977539062, "b": 411.1622009277344, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 16, "end_row_offset_idx": 17, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.1 DDM and DRDA application server access: QIBM_DB_DDMDRDA . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.5558471679688, "t": 420.37518310546875, "r": 547.1590576171875, "b": 411.1622009277344, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 16, "end_row_offset_idx": 17, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "8", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 151.19720458984375, "t": 407.8952941894531, "r": 536.0410766601562, "b": 398.68231201171875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 17, "end_row_offset_idx": 18, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.2 Toolbox application server access: QIBM_DB_ZDA. . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.595947265625, "t": 407.8952941894531, "r": 547.1508178710938, "b": 398.68231201171875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 17, "end_row_offset_idx": 18, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "8", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 151.19720458984375, "t": 395.35565185546875, "r": 536.0748901367188, "b": 386.1426696777344, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 18, "end_row_offset_idx": 19, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.3 Database Administrator function: QIBM_DB_SQLADM . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.6302490234375, "t": 395.35565185546875, "r": 547.1856079101562, "b": 386.1426696777344, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 18, "end_row_offset_idx": 19, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "9", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 151.19720458984375, "t": 382.8757629394531, "r": 411.2704772949219, "b": 373.66278076171875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 19, "end_row_offset_idx": 20, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.4 Database Information function: QIBM_DB_SYSMON", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 416.8177490234375, "t": 382.8757629394531, "r": 547.1786499023438, "b": 373.66278076171875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 19, "end_row_offset_idx": 20, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . 9", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 151.19720458984375, "t": 370.3958740234375, "r": 536.035888671875, "b": 361.1828918457031, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 20, "end_row_offset_idx": 21, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.5 Security Administrator function: QIBM_DB_SECADM . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.5989379882812, "t": 370.3958740234375, "r": 547.1619262695312, "b": 361.1828918457031, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 20, "end_row_offset_idx": 21, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "9", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 151.19720458984375, "t": 357.8562316894531, "r": 530.5731811523438, "b": 348.64324951171875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 21, "end_row_offset_idx": 22, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.6 Change Function Usage CL command . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.1044311523438, "t": 357.8562316894531, "r": 547.1668701171875, "b": 348.64324951171875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 21, "end_row_offset_idx": 22, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "10", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 151.19720458984375, "t": 345.3763427734375, "r": 530.5352172851562, "b": 336.1633605957031, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 22, "end_row_offset_idx": 23, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.7 Verifying function usage IDs for RCAC with the FUNCTION_USAGE view . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.0755004882812, "t": 345.3763427734375, "r": 547.156005859375, "b": 336.1633605957031, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 22, "end_row_offset_idx": 23, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "10", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 136.7970428466797, "t": 332.8964538574219, "r": 547.256591796875, "b": 323.6834716796875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 23, "end_row_offset_idx": 24, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.2 Separation of duties . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 23, "end_row_offset_idx": 24, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 136.79702758789062, "t": 310.3968200683594, "r": 530.5396118164062, "b": 301.183837890625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 24, "end_row_offset_idx": 25, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Chapter 3. Row and Column Access Control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.0916748046875, "t": 310.3968200683594, "r": 547.19580078125, "b": 301.183837890625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 24, "end_row_offset_idx": 25, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "13", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 136.79702758789062, "t": 298.3970031738281, "r": 530.4808959960938, "b": 289.18402099609375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 25, "end_row_offset_idx": 26, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.1 Explanation of RCAC and the concept of access control . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.04248046875, "t": 298.3970031738281, "r": 547.1657104492188, "b": 289.18402099609375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 25, "end_row_offset_idx": 26, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "14", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 151.1971893310547, "t": 285.85736083984375, "r": 378.2078552246094, "b": 276.6443786621094, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 26, "end_row_offset_idx": 27, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.1.1 Row permission and column mask definitions", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 383.74713134765625, "t": 285.85736083984375, "r": 547.15576171875, "b": 276.6443786621094, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 26, "end_row_offset_idx": 27, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . 14", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 151.1971893310547, "t": 273.3774719238281, "r": 530.4347534179688, "b": 264.16448974609375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 27, "end_row_offset_idx": 28, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.1.2 Enabling and activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 535.9962158203125, "t": 273.3774719238281, "r": 547.1190795898438, "b": 264.16448974609375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 27, "end_row_offset_idx": 28, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "16", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 136.79702758789062, "t": 260.83782958984375, "r": 530.528076171875, "b": 251.6248321533203, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 28, "end_row_offset_idx": 29, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.2 Special registers and built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.0670166015625, "t": 260.83782958984375, "r": 547.1448364257812, "b": 251.6248321533203, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 28, "end_row_offset_idx": 29, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "18", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 151.1971893310547, "t": 248.3579559326172, "r": 530.4978637695312, "b": 239.14495849609375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 29, "end_row_offset_idx": 30, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.2.1 Special registers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.0518798828125, "t": 248.3579559326172, "r": 547.159912109375, "b": 239.14495849609375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 29, "end_row_offset_idx": 30, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "18", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 151.1971893310547, "t": 235.87808227539062, "r": 530.5602416992188, "b": 226.6650848388672, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 30, "end_row_offset_idx": 31, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.2.2 Built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.09912109375, "t": 235.87808227539062, "r": 547.1768798828125, "b": 226.6650848388672, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 30, "end_row_offset_idx": 31, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "19", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 136.79702758789062, "t": 223.33843994140625, "r": 530.5302734375, "b": 214.1254425048828, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 31, "end_row_offset_idx": 32, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.3 VERIFY_GROUP_FOR_USER function . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.0615234375, "t": 223.33843994140625, "r": 547.1240234375, "b": 214.1254425048828, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 31, "end_row_offset_idx": 32, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "20", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 136.79702758789062, "t": 210.8585662841797, "r": 530.6299438476562, "b": 201.64556884765625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 32, "end_row_offset_idx": 33, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.4 Establishing and controlling accessibility by using the RCAC rule text . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.1631469726562, "t": 210.8585662841797, "r": 547.2295532226562, "b": 201.64556884765625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 32, "end_row_offset_idx": 33, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "21", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 400.3206481933594, "t": 198.37869262695312, "r": 530.4835815429688, "b": 189.1656951904297, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 33, "end_row_offset_idx": 34, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": ". . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.0223999023438, "t": 198.37869262695312, "r": 547.10009765625, "b": 189.1656951904297, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 33, "end_row_offset_idx": 34, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "22", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 136.79701232910156, "t": 198.37869262695312, "r": 530.5651245117188, "b": 176.6260528564453, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 34, "end_row_offset_idx": 35, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.5 SELECT, INSERT, and UPDATE behavior with RCAC 3.6 Human resources example . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.1119995117188, "t": 185.83905029296875, "r": 547.2057495117188, "b": 176.6260528564453, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 34, "end_row_offset_idx": 35, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "22", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 151.19717407226562, "t": 173.3591766357422, "r": 530.4913940429688, "b": 164.14617919921875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 35, "end_row_offset_idx": 36, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.1 Assigning the QIBM_DB_SECADM function ID to the consultants. . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.0463256835938, "t": 173.3591766357422, "r": 547.1561889648438, "b": 164.14617919921875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 35, "end_row_offset_idx": 36, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "23", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 151.19717407226562, "t": 160.87930297851562, "r": 530.5645751953125, "b": 151.6663055419922, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 36, "end_row_offset_idx": 37, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.2 Creating group profiles for the users and their roles . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.0960083007812, "t": 160.87930297851562, "r": 547.1587524414062, "b": 151.6663055419922, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 36, "end_row_offset_idx": 37, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "23", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 151.19717407226562, "t": 148.33966064453125, "r": 530.5569458007812, "b": 139.1266632080078, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 37, "end_row_offset_idx": 38, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.3 Demonstrating data access without RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.0881958007812, "t": 148.33966064453125, "r": 547.1507568359375, "b": 139.1266632080078, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 37, "end_row_offset_idx": 38, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "24", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 151.19717407226562, "t": 135.8597869873047, "r": 530.5341186523438, "b": 126.64678955078125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 38, "end_row_offset_idx": 39, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.4 Defining and creating row permissions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.072998046875, "t": 135.8597869873047, "r": 547.15087890625, "b": 126.64678955078125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 38, "end_row_offset_idx": 39, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "25", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 151.19717407226562, "t": 123.37991333007812, "r": 339.4510498046875, "b": 114.16690826416016, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 39, "end_row_offset_idx": 40, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.5 Defining and creating column masks", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 344.9899597167969, "t": 123.37991333007812, "r": 547.160888671875, "b": 114.16690826416016, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 39, "end_row_offset_idx": 40, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 151.19717407226562, "t": 110.84027099609375, "r": 530.541015625, "b": 101.62727355957031, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 40, "end_row_offset_idx": 41, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.6 Activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.087646484375, "t": 110.84027099609375, "r": 547.1808471679688, "b": 101.62727355957031, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 40, "end_row_offset_idx": 41, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "28", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 151.19717407226562, "t": 98.36038970947266, "r": 530.5750732421875, "b": 89.14738464355469, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 41, "end_row_offset_idx": 42, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.7 Demonstrating data access with RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.1066284179688, "t": 98.36038970947266, "r": 547.169677734375, "b": 89.14738464355469, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 41, "end_row_offset_idx": 42, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "29", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 151.19717407226562, "t": 85.88050842285156, "r": 530.436279296875, "b": 76.6675033569336, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 42, "end_row_offset_idx": 43, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.8 Demonstrating data access with a view and RCAC . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 535.9984741210938, "t": 85.88050842285156, "r": 547.1228637695312, "b": 76.6675033569336, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 42, "end_row_offset_idx": 43, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "32", "column_header": false, "row_header": false, "row_section": false}]]}}, {"self_ref": "#/tables/1", "parent": {"cref": "#/body"}, "children": [], "label": "table", "prov": [{"page_no": 8, "bbox": {"l": 135.52462768554688, "t": 502.2747802734375, "r": 545.8714599609375, "b": 349.949462890625, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [{"cref": "#/texts/90"}], "references": [], "footnotes": [], "image": null, "data": {"table_cells": [{"bbox": {"l": 142.8000030517578, "t": 495.4620056152344, "r": 202.2449951171875, "b": 487.1369934082031, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Column name", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 216.8087921142578, "t": 495.4620056152344, "r": 257.210693359375, "b": 487.1369934082031, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Data type", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 289.47479248046875, "t": 495.4620056152344, "r": 338.8946838378906, "b": 487.1369934082031, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Description", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 142.8000030517578, "t": 476.4422912597656, "r": 203.2322998046875, "b": 468.1172790527344, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "FUNCTION_ID", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 216.785400390625, "t": 476.4422912597656, "r": 276.00360107421875, "b": 468.1172790527344, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(30)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.45770263671875, "t": 476.4422912597656, "r": 359.85394287109375, "b": 468.1172790527344, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "ID of the function.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 142.8000030517578, "t": 457.48199462890625, "r": 198.66929626464844, "b": 449.156982421875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "USER_NAME", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 216.74130249023438, "t": 457.48199462890625, "r": 275.9234924316406, "b": 449.156982421875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(10)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.382080078125, "t": 457.48199462890625, "r": 515.0535888671875, "b": 438.1166687011719, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Name of the user profile that has a usage setting for this  function.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 142.79998779296875, "t": 427.48138427734375, "r": 173.98318481445312, "b": 419.1563720703125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "USAGE", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 216.773681640625, "t": 427.48138427734375, "r": 270.9797668457031, "b": 419.1563720703125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(7)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.416259765625, "t": 427.48138427734375, "r": 539.1071166992188, "b": 397.13604736328125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Usage setting: GLYPH<SM590000> ALLOWED: The user profile is allowed to use the function. GLYPH<SM590000> DENIED: The user profile is not allowed to use the function.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 142.8000030517578, "t": 386.44134521484375, "r": 196.2248992919922, "b": 378.1163330078125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "USER_TYPE", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 216.75210571289062, "t": 386.44134521484375, "r": 270.99871826171875, "b": 378.1163330078125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(5)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.4316101074219, "t": 386.44134521484375, "r": 448.11962890625, "b": 356.15631103515625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Type of user profile: GLYPH<SM590000> USER: The user profile is a user. GLYPH<SM590000> GROUP: The user profile is a group.", "column_header": false, "row_header": false, "row_section": false}], "num_rows": 5, "num_cols": 3, "grid": [[{"bbox": {"l": 142.8000030517578, "t": 495.4620056152344, "r": 202.2449951171875, "b": 487.1369934082031, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Column name", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 216.8087921142578, "t": 495.4620056152344, "r": 257.210693359375, "b": 487.1369934082031, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Data type", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 289.47479248046875, "t": 495.4620056152344, "r": 338.8946838378906, "b": 487.1369934082031, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Description", "column_header": true, "row_header": false, "row_section": false}], [{"bbox": {"l": 142.8000030517578, "t": 476.4422912597656, "r": 203.2322998046875, "b": 468.1172790527344, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "FUNCTION_ID", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 216.785400390625, "t": 476.4422912597656, "r": 276.00360107421875, "b": 468.1172790527344, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(30)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.45770263671875, "t": 476.4422912597656, "r": 359.85394287109375, "b": 468.1172790527344, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "ID of the function.", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 142.8000030517578, "t": 457.48199462890625, "r": 198.66929626464844, "b": 449.156982421875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "USER_NAME", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 216.74130249023438, "t": 457.48199462890625, "r": 275.9234924316406, "b": 449.156982421875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(10)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.382080078125, "t": 457.48199462890625, "r": 515.0535888671875, "b": 438.1166687011719, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Name of the user profile that has a usage setting for this  function.", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 142.79998779296875, "t": 427.48138427734375, "r": 173.98318481445312, "b": 419.1563720703125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "USAGE", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 216.773681640625, "t": 427.48138427734375, "r": 270.9797668457031, "b": 419.1563720703125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(7)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.416259765625, "t": 427.48138427734375, "r": 539.1071166992188, "b": 397.13604736328125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Usage setting: GLYPH<SM590000> ALLOWED: The user profile is allowed to use the function. GLYPH<SM590000> DENIED: The user profile is not allowed to use the function.", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 142.8000030517578, "t": 386.44134521484375, "r": 196.2248992919922, "b": 378.1163330078125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "USER_TYPE", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 216.75210571289062, "t": 386.44134521484375, "r": 270.99871826171875, "b": 378.1163330078125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(5)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.4316101074219, "t": 386.44134521484375, "r": 448.11962890625, "b": 356.15631103515625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Type of user profile: GLYPH<SM590000> USER: The user profile is a user. GLYPH<SM590000> GROUP: The user profile is a group.", "column_header": false, "row_header": false, "row_section": false}]]}}, {"self_ref": "#/tables/2", "parent": {"cref": "#/body"}, "children": [], "label": "table", "prov": [{"page_no": 9, "bbox": {"l": 64.41139221191406, "t": 398.3863830566406, "r": 547.3950805664062, "b": 70.39208984375, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [{"cref": "#/texts/114"}], "references": [], "footnotes": [], "image": null, "data": {"table_cells": [{"bbox": {"l": 70.80030059814453, "t": 391.4817199707031, "r": 119.78550720214844, "b": 383.1567077636719, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "User action", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 424.93804931640625, "t": 344.4774475097656, "r": 433.2629699707031, "b": 304.9800109863281, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "*JOBCTL", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 450.1380615234375, "t": 390.3999328613281, "r": 458.4629821777344, "b": 304.9800109863281, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "QIBM_DB_SECADM", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 475.9383544921875, "t": 390.465576171875, "r": 484.2632751464844, "b": 304.9800109863281, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "QIBM_DB_SQLADM", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 501.13836669921875, "t": 390.385498046875, "r": 509.4632873535156, "b": 304.9800109863281, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "QIBM_DB_SYSMON", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 526.3986206054688, "t": 359.2005615234375, "r": 534.7235717773438, "b": 304.9799499511719, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "No Authority", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.80000305175781, "t": 293.4420166015625, "r": 220.1568145751953, "b": 285.11700439453125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "SET CURRENT DEGREE  (SQL statement)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0, "t": 293.4420166015625, "r": 435.00299072265625, "b": 285.11700439453125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00030517578125, "t": 293.4420166015625, "r": 486.0032958984375, "b": 285.11700439453125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.80001831054688, "t": 274.4817199707031, "r": 264.5538024902344, "b": 266.1567077636719, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "CHGQRYA  command targeting a different user's job", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000305175781, "t": 274.4817199707031, "r": 435.0030212402344, "b": 266.1567077636719, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.0003356933594, "t": 274.4817199707031, "r": 486.0033264160156, "b": 266.1567077636719, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800048828125, "t": 255.46202087402344, "r": 322.5057373046875, "b": 247.1370086669922, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "STRDBMON  or  ENDDBMON  commands targeting a different user's job", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000305175781, "t": 255.46202087402344, "r": 435.0030212402344, "b": 247.1370086669922, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.0003356933594, "t": 255.46202087402344, "r": 486.0033264160156, "b": 247.1370086669922, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800048828125, "t": 236.44232177734375, "r": 381.0218505859375, "b": 228.1173095703125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "STRDBMON  or  ENDDBMON  commands targeting a job that matches the current user", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000305175781, "t": 236.44232177734375, "r": 435.0030212402344, "b": 228.1173095703125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.0003356933594, "t": 236.44232177734375, "r": 486.0033264160156, "b": 228.1173095703125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 505.2606201171875, "t": 236.44232177734375, "r": 511.26361083984375, "b": 228.1173095703125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 530.7603149414062, "t": 236.44232177734375, "r": 536.7633056640625, "b": 228.1173095703125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800048828125, "t": 217.48202514648438, "r": 359.5173645019531, "b": 209.15701293945312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "QUSRJOBI() API format 900 or System i Navigator's SQL Details for Job", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.00006103515625, "t": 217.48202514648438, "r": 435.0030517578125, "b": 209.15701293945312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.0003662109375, "t": 217.48202514648438, "r": 486.00335693359375, "b": 209.15701293945312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 505.26068115234375, "t": 217.48202514648438, "r": 511.263671875, "b": 209.15701293945312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.80007934570312, "t": 198.4623260498047, "r": 220.7517852783203, "b": 190.13731384277344, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Visual Explain within Run SQL scripts", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.00006103515625, "t": 198.4623260498047, "r": 435.0030517578125, "b": 190.13731384277344, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.0003662109375, "t": 198.4623260498047, "r": 486.00335693359375, "b": 190.13731384277344, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 505.26068115234375, "t": 198.4623260498047, "r": 511.263671875, "b": 190.13731384277344, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 530.7603759765625, "t": 198.4623260498047, "r": 536.7633666992188, "b": 190.13731384277344, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.80007934570312, "t": 179.442626953125, "r": 236.65480041503906, "b": 171.11761474609375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Visual Explain outside of Run SQL scripts", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.00006103515625, "t": 179.442626953125, "r": 435.0030517578125, "b": 171.11761474609375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.0003662109375, "t": 179.442626953125, "r": 486.00335693359375, "b": 171.11761474609375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.80007934570312, "t": 160.48233032226562, "r": 213.1296844482422, "b": 152.15731811523438, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "ANALYZE PLAN CACHE procedure", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.00006103515625, "t": 160.48233032226562, "r": 435.0030517578125, "b": 152.15731811523438, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.0003662109375, "t": 160.48233032226562, "r": 486.00335693359375, "b": 152.15731811523438, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.80007934570312, "t": 141.46263122558594, "r": 199.87808227539062, "b": 133.1376190185547, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "DUMP PLAN CACHE procedure", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.00006103515625, "t": 141.46263122558594, "r": 435.0030517578125, "b": 133.1376190185547, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.0003662109375, "t": 141.46263122558594, "r": 486.00335693359375, "b": 133.1376190185547, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.80007934570312, "t": 122.44291687011719, "r": 208.36776733398438, "b": 114.11792755126953, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "MODIFY PLAN CACHE procedure", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.00006103515625, "t": 122.44291687011719, "r": 435.0030517578125, "b": 114.11792755126953, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.0003662109375, "t": 122.44291687011719, "r": 486.00335693359375, "b": 114.11792755126953, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.80007934570312, "t": 103.42323303222656, "r": 411.20263671875, "b": 95.09822845458984, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "MODIFY PLAN CACHE PROPERTIES procedure (currently does not check authority)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.00006103515625, "t": 103.42323303222656, "r": 435.0030517578125, "b": 95.09822845458984, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.0003662109375, "t": 103.42323303222656, "r": 486.00335693359375, "b": 95.09822845458984, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.80007934570312, "t": 84.46292877197266, "r": 377.1258544921875, "b": 76.13793182373047, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "CHANGE PLAN CACHE SIZE procedure (currently does not check authority)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.00006103515625, "t": 84.46292877197266, "r": 435.0030517578125, "b": 76.13793182373047, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.0003662109375, "t": 84.46292877197266, "r": 486.00335693359375, "b": 76.13793182373047, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "", "column_header": false, "row_header": false, "row_section": false}], "num_rows": 13, "num_cols": 6, "grid": [[{"bbox": {"l": 70.80030059814453, "t": 391.4817199707031, "r": 119.78550720214844, "b": 383.1567077636719, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "User action", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 424.93804931640625, "t": 344.4774475097656, "r": 433.2629699707031, "b": 304.9800109863281, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "*JOBCTL", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 450.1380615234375, "t": 390.3999328613281, "r": 458.4629821777344, "b": 304.9800109863281, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "QIBM_DB_SECADM", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 475.9383544921875, "t": 390.465576171875, "r": 484.2632751464844, "b": 304.9800109863281, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "QIBM_DB_SQLADM", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 501.13836669921875, "t": 390.385498046875, "r": 509.4632873535156, "b": 304.9800109863281, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "QIBM_DB_SYSMON", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 526.3986206054688, "t": 359.2005615234375, "r": 534.7235717773438, "b": 304.9799499511719, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "No Authority", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 70.80000305175781, "t": 293.4420166015625, "r": 220.1568145751953, "b": 285.11700439453125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "SET CURRENT DEGREE  (SQL statement)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0, "t": 293.4420166015625, "r": 435.00299072265625, "b": 285.11700439453125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00030517578125, "t": 293.4420166015625, "r": 486.0032958984375, "b": 285.11700439453125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 70.80001831054688, "t": 274.4817199707031, "r": 264.5538024902344, "b": 266.1567077636719, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "CHGQRYA  command targeting a different user's job", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000305175781, "t": 274.4817199707031, "r": 435.0030212402344, "b": 266.1567077636719, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.0003356933594, "t": 274.4817199707031, "r": 486.0033264160156, "b": 266.1567077636719, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 70.800048828125, "t": 255.46202087402344, "r": 322.5057373046875, "b": 247.1370086669922, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "STRDBMON  or  ENDDBMON  commands targeting a different user's job", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000305175781, "t": 255.46202087402344, "r": 435.0030212402344, "b": 247.1370086669922, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.0003356933594, "t": 255.46202087402344, "r": 486.0033264160156, "b": 247.1370086669922, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 70.800048828125, "t": 236.44232177734375, "r": 381.0218505859375, "b": 228.1173095703125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "STRDBMON  or  ENDDBMON  commands targeting a job that matches the current user", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000305175781, "t": 236.44232177734375, "r": 435.0030212402344, "b": 228.1173095703125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.0003356933594, "t": 236.44232177734375, "r": 486.0033264160156, "b": 228.1173095703125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 505.2606201171875, "t": 236.44232177734375, "r": 511.26361083984375, "b": 228.1173095703125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 530.7603149414062, "t": 236.44232177734375, "r": 536.7633056640625, "b": 228.1173095703125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "X", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 70.800048828125, "t": 217.48202514648438, "r": 359.5173645019531, "b": 209.15701293945312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "QUSRJOBI() API format 900 or System i Navigator's SQL Details for Job", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.00006103515625, "t": 217.48202514648438, "r": 435.0030517578125, "b": 209.15701293945312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.0003662109375, "t": 217.48202514648438, "r": 486.00335693359375, "b": 209.15701293945312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 505.26068115234375, "t": 217.48202514648438, "r": 511.263671875, "b": 209.15701293945312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 70.80007934570312, "t": 198.4623260498047, "r": 220.7517852783203, "b": 190.13731384277344, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Visual Explain within Run SQL scripts", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.00006103515625, "t": 198.4623260498047, "r": 435.0030517578125, "b": 190.13731384277344, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.0003662109375, "t": 198.4623260498047, "r": 486.00335693359375, "b": 190.13731384277344, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 505.26068115234375, "t": 198.4623260498047, "r": 511.263671875, "b": 190.13731384277344, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 530.7603759765625, "t": 198.4623260498047, "r": 536.7633666992188, "b": 190.13731384277344, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "X", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 70.80007934570312, "t": 179.442626953125, "r": 236.65480041503906, "b": 171.11761474609375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Visual Explain outside of Run SQL scripts", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.00006103515625, "t": 179.442626953125, "r": 435.0030517578125, "b": 171.11761474609375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.0003662109375, "t": 179.442626953125, "r": 486.00335693359375, "b": 171.11761474609375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 70.80007934570312, "t": 160.48233032226562, "r": 213.1296844482422, "b": 152.15731811523438, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "ANALYZE PLAN CACHE procedure", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.00006103515625, "t": 160.48233032226562, "r": 435.0030517578125, "b": 152.15731811523438, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.0003662109375, "t": 160.48233032226562, "r": 486.00335693359375, "b": 152.15731811523438, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 70.80007934570312, "t": 141.46263122558594, "r": 199.87808227539062, "b": 133.1376190185547, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "DUMP PLAN CACHE procedure", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.00006103515625, "t": 141.46263122558594, "r": 435.0030517578125, "b": 133.1376190185547, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.0003662109375, "t": 141.46263122558594, "r": 486.00335693359375, "b": 133.1376190185547, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 70.80007934570312, "t": 122.44291687011719, "r": 208.36776733398438, "b": 114.11792755126953, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "MODIFY PLAN CACHE procedure", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.00006103515625, "t": 122.44291687011719, "r": 435.0030517578125, "b": 114.11792755126953, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.0003662109375, "t": 122.44291687011719, "r": 486.00335693359375, "b": 114.11792755126953, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 70.80007934570312, "t": 103.42323303222656, "r": 411.20263671875, "b": 95.09822845458984, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "MODIFY PLAN CACHE PROPERTIES procedure (currently does not check authority)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.00006103515625, "t": 103.42323303222656, "r": 435.0030517578125, "b": 95.09822845458984, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.0003662109375, "t": 103.42323303222656, "r": 486.00335693359375, "b": 95.09822845458984, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 70.80007934570312, "t": 84.46292877197266, "r": 377.1258544921875, "b": 76.13793182373047, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "CHANGE PLAN CACHE SIZE procedure (currently does not check authority)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.00006103515625, "t": 84.46292877197266, "r": 435.0030517578125, "b": 76.13793182373047, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.0003662109375, "t": 84.46292877197266, "r": 486.00335693359375, "b": 76.13793182373047, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "", "column_header": false, "row_header": false, "row_section": false}]]}}, {"self_ref": "#/tables/3", "parent": {"cref": "#/body"}, "children": [], "label": "table", "prov": [{"page_no": 11, "bbox": {"l": 134.5462646484375, "t": 688.5811157226562, "r": 542.0460815429688, "b": 587.7283935546875, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [{"cref": "#/texts/172"}], "references": [], "footnotes": [], "image": null, "data": {"table_cells": [{"bbox": {"l": 142.8000030517578, "t": 681.4619750976562, "r": 209.67091369628906, "b": 673.1370239257812, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Special register", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 230.18911743164062, "t": 681.4619750976562, "r": 319.9352722167969, "b": 673.1370239257812, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Corresponding value", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 142.80001831054688, "t": 662.5016479492188, "r": 212.7012176513672, "b": 643.1364135742188, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "USER or SESSION_USER", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 230.2197265625, "t": 662.5016479492188, "r": 467.9906921386719, "b": 654.1766967773438, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "The effective user of the thread excluding adopted authority.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 142.80003356933594, "t": 632.441650390625, "r": 216.63963317871094, "b": 624.11669921875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "CURRENT_USER", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 230.19813537597656, "t": 632.441650390625, "r": 535.6508178710938, "b": 613.13671875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "The effective user of the thread including adopted authority. When no adopted  authority is present, this has the same value as USER.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 142.8009033203125, "t": 602.4419555664062, "r": 209.73570251464844, "b": 594.1170043945312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "SYSTEM_USER", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 230.24490356445312, "t": 602.4419555664062, "r": 425.64569091796875, "b": 594.1170043945312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "The authorization ID that initiated the connection.", "column_header": false, "row_header": false, "row_section": false}], "num_rows": 4, "num_cols": 2, "grid": [[{"bbox": {"l": 142.8000030517578, "t": 681.4619750976562, "r": 209.67091369628906, "b": 673.1370239257812, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Special register", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 230.18911743164062, "t": 681.4619750976562, "r": 319.9352722167969, "b": 673.1370239257812, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Corresponding value", "column_header": true, "row_header": false, "row_section": false}], [{"bbox": {"l": 142.80001831054688, "t": 662.5016479492188, "r": 212.7012176513672, "b": 643.1364135742188, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "USER or SESSION_USER", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 230.2197265625, "t": 662.5016479492188, "r": 467.9906921386719, "b": 654.1766967773438, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "The effective user of the thread excluding adopted authority.", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 142.80003356933594, "t": 632.441650390625, "r": 216.63963317871094, "b": 624.11669921875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "CURRENT_USER", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 230.19813537597656, "t": 632.441650390625, "r": 535.6508178710938, "b": 613.13671875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "The effective user of the thread including adopted authority. When no adopted  authority is present, this has the same value as USER.", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 142.8009033203125, "t": 602.4419555664062, "r": 209.73570251464844, "b": 594.1170043945312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "SYSTEM_USER", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 230.24490356445312, "t": 602.4419555664062, "r": 425.64569091796875, "b": 594.1170043945312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "The authorization ID that initiated the connection.", "column_header": false, "row_header": false, "row_section": false}]]}}, {"self_ref": "#/tables/4", "parent": {"cref": "#/body"}, "children": [], "label": "table", "prov": [{"page_no": 12, "bbox": {"l": 63.55636978149414, "t": 687.76611328125, "r": 548.5687255859375, "b": 495.77532958984375, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [{"cref": "#/texts/198"}], "references": [], "footnotes": [], "image": null, "data": {"table_cells": [{"bbox": {"l": 70.80000305175781, "t": 681.4619750976562, "r": 134.99070739746094, "b": 673.1370239257812, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Global variable", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 202.889404296875, "t": 681.4619750976562, "r": 223.34640502929688, "b": 673.1370239257812, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Type", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 281.8247985839844, "t": 681.4619750976562, "r": 331.3428039550781, "b": 673.1370239257812, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Description", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 70.80000305175781, "t": 662.5016479492188, "r": 132.7209014892578, "b": 654.1766967773438, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "CLIENT_HOST", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.89028930664062, "t": 662.5016479492188, "r": 267.0765075683594, "b": 654.1766967773438, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(255)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.8473205566406, "t": 662.5016479492188, "r": 510.17547607421875, "b": 654.1766967773438, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Host name of the current client as returned by the system", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.80001831054688, "t": 643.48193359375, "r": 140.66522216796875, "b": 635.156982421875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "CLIENT_IPADDR", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.872314453125, "t": 643.48193359375, "r": 267.077392578125, "b": 635.156982421875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(128)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.8454895019531, "t": 643.48193359375, "r": 509.6058349609375, "b": 635.156982421875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "IP address of the current client as returned by the system", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.80001831054688, "t": 624.4622192382812, "r": 134.98263549804688, "b": 616.1372680664062, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "CLIENT_PORT", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.90293884277344, "t": 624.4622192382812, "r": 242.80084228515625, "b": 616.1372680664062, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "INTEGER", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.7978515625, "t": 624.4622192382812, "r": 527.5922241210938, "b": 616.1372680664062, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Port used by the current client to communicate with the server", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.80001831054688, "t": 605.4425048828125, "r": 143.50924682617188, "b": 597.1175537109375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PACKAGE_NAME", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.80575561523438, "t": 605.4425048828125, "r": 267.0693664550781, "b": 597.1175537109375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(128)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.85186767578125, "t": 605.4425048828125, "r": 436.5726013183594, "b": 597.1175537109375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Name of the currently running package", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.80001831054688, "t": 586.482177734375, "r": 156.01654052734375, "b": 578.1572265625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PACKAGE_SCHEMA", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.83544921875, "t": 586.482177734375, "r": 267.0864562988281, "b": 578.1572265625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(128)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.8707580566406, "t": 586.482177734375, "r": 470.44677734375, "b": 578.1572265625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Schema name of the currently running package", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.80001831054688, "t": 567.4624633789062, "r": 157.89932250976562, "b": 559.1375122070312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PACKAGE_VERSION", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.72471618652344, "t": 567.4624633789062, "r": 261.9825439453125, "b": 559.1375122070312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(64)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.7492370605469, "t": 567.4624633789062, "r": 478.84381103515625, "b": 559.1375122070312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Version identifier of the currently running package", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.80001831054688, "t": 548.4427490234375, "r": 154.419921875, "b": 540.1177978515625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "ROUTINE_SCHEMA", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.79312133789062, "t": 548.4427490234375, "r": 267.0927429199219, "b": 540.1177978515625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(128)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.87164306640625, "t": 548.4427490234375, "r": 464.2602233886719, "b": 540.1177978515625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Schema name of the currently running routine", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.80001831054688, "t": 529.482421875, "r": 188.43991088867188, "b": 521.157470703125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "ROUTINE_SPECIFIC_NAME", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.8444061279297, "t": 529.482421875, "r": 267.03692626953125, "b": 521.157470703125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(128)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.80682373046875, "t": 529.482421875, "r": 430.40045166015625, "b": 521.157470703125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Name of the currently running routine", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.80003356933594, "t": 510.4627380371094, "r": 139.4313507080078, "b": 502.1377258300781, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "ROUTINE_TYPE", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.74635314941406, "t": 510.4627380371094, "r": 239.2899627685547, "b": 502.1377258300781, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "CHAR(1)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.7906494140625, "t": 510.4627380371094, "r": 425.09130859375, "b": 502.1377258300781, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Type of the currently running routine", "column_header": false, "row_header": false, "row_section": false}], "num_rows": 10, "num_cols": 3, "grid": [[{"bbox": {"l": 70.80000305175781, "t": 681.4619750976562, "r": 134.99070739746094, "b": 673.1370239257812, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Global variable", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 202.889404296875, "t": 681.4619750976562, "r": 223.34640502929688, "b": 673.1370239257812, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Type", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 281.8247985839844, "t": 681.4619750976562, "r": 331.3428039550781, "b": 673.1370239257812, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Description", "column_header": true, "row_header": false, "row_section": false}], [{"bbox": {"l": 70.80000305175781, "t": 662.5016479492188, "r": 132.7209014892578, "b": 654.1766967773438, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "CLIENT_HOST", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.89028930664062, "t": 662.5016479492188, "r": 267.0765075683594, "b": 654.1766967773438, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(255)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.8473205566406, "t": 662.5016479492188, "r": 510.17547607421875, "b": 654.1766967773438, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Host name of the current client as returned by the system", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 70.80001831054688, "t": 643.48193359375, "r": 140.66522216796875, "b": 635.156982421875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "CLIENT_IPADDR", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.872314453125, "t": 643.48193359375, "r": 267.077392578125, "b": 635.156982421875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(128)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.8454895019531, "t": 643.48193359375, "r": 509.6058349609375, "b": 635.156982421875, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "IP address of the current client as returned by the system", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 70.80001831054688, "t": 624.4622192382812, "r": 134.98263549804688, "b": 616.1372680664062, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "CLIENT_PORT", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.90293884277344, "t": 624.4622192382812, "r": 242.80084228515625, "b": 616.1372680664062, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "INTEGER", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.7978515625, "t": 624.4622192382812, "r": 527.5922241210938, "b": 616.1372680664062, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Port used by the current client to communicate with the server", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 70.80001831054688, "t": 605.4425048828125, "r": 143.50924682617188, "b": 597.1175537109375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PACKAGE_NAME", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.80575561523438, "t": 605.4425048828125, "r": 267.0693664550781, "b": 597.1175537109375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(128)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.85186767578125, "t": 605.4425048828125, "r": 436.5726013183594, "b": 597.1175537109375, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Name of the currently running package", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 70.80001831054688, "t": 586.482177734375, "r": 156.01654052734375, "b": 578.1572265625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PACKAGE_SCHEMA", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.83544921875, "t": 586.482177734375, "r": 267.0864562988281, "b": 578.1572265625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(128)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.8707580566406, "t": 586.482177734375, "r": 470.44677734375, "b": 578.1572265625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Schema name of the currently running package", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 70.80001831054688, "t": 567.4624633789062, "r": 157.89932250976562, "b": 559.1375122070312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PACKAGE_VERSION", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.72471618652344, "t": 567.4624633789062, "r": 261.9825439453125, "b": 559.1375122070312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(64)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.7492370605469, "t": 567.4624633789062, "r": 478.84381103515625, "b": 559.1375122070312, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Version identifier of the currently running package", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 70.80001831054688, "t": 548.4427490234375, "r": 154.419921875, "b": 540.1177978515625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "ROUTINE_SCHEMA", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.79312133789062, "t": 548.4427490234375, "r": 267.0927429199219, "b": 540.1177978515625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(128)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.87164306640625, "t": 548.4427490234375, "r": 464.2602233886719, "b": 540.1177978515625, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Schema name of the currently running routine", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 70.80001831054688, "t": 529.482421875, "r": 188.43991088867188, "b": 521.157470703125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "ROUTINE_SPECIFIC_NAME", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.8444061279297, "t": 529.482421875, "r": 267.03692626953125, "b": 521.157470703125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(128)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.80682373046875, "t": 529.482421875, "r": 430.40045166015625, "b": 521.157470703125, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Name of the currently running routine", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 70.80003356933594, "t": 510.4627380371094, "r": 139.4313507080078, "b": 502.1377258300781, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "ROUTINE_TYPE", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.74635314941406, "t": 510.4627380371094, "r": 239.2899627685547, "b": 502.1377258300781, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "CHAR(1)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.7906494140625, "t": 510.4627380371094, "r": 425.09130859375, "b": 502.1377258300781, "coord_origin": "BOTTOMLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Type of the currently running routine", "column_header": false, "row_header": false, "row_section": false}]]}}], "key_value_items": [], "pages": {"1": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 1}, "2": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 2}, "3": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 3}, "4": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 4}, "5": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 5}, "6": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 6}, "7": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 7}, "8": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 8}, "9": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 9}, "10": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 10}, "11": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 11}, "12": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 12}, "13": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 13}, "14": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 14}, "15": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 15}, "16": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 16}, "17": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 17}, "18": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 18}}}
\ No newline at end of file
+{"schema_name": "DoclingDocument", "version": "1.1.0", "name": "redp5110_sampled", "origin": {"mimetype": "application/pdf", "binary_hash": 12110913468886801317, "filename": "redp5110_sampled.pdf", "uri": null}, "furniture": {"self_ref": "#/furniture", "parent": null, "children": [], "content_layer": "furniture", "name": "_root_", "label": "unspecified"}, "body": {"self_ref": "#/body", "parent": null, "children": [{"cref": "#/texts/0"}, {"cref": "#/pictures/0"}, {"cref": "#/texts/1"}, {"cref": "#/pictures/1"}, {"cref": "#/texts/6"}, {"cref": "#/texts/7"}, {"cref": "#/texts/8"}, {"cref": "#/tables/0"}, {"cref": "#/texts/9"}, {"cref": "#/texts/10"}, {"cref": "#/texts/11"}, {"cref": "#/texts/12"}, {"cref": "#/pictures/2"}, {"cref": "#/texts/13"}, {"cref": "#/groups/0"}, {"cref": "#/pictures/3"}, {"cref": "#/texts/18"}, {"cref": "#/texts/19"}, {"cref": "#/texts/20"}, {"cref": "#/texts/21"}, {"cref": "#/texts/22"}, {"cref": "#/texts/23"}, {"cref": "#/texts/24"}, {"cref": "#/texts/25"}, {"cref": "#/texts/26"}, {"cref": "#/groups/1"}, {"cref": "#/texts/36"}, {"cref": "#/texts/37"}, {"cref": "#/texts/38"}, {"cref": "#/texts/39"}, {"cref": "#/pictures/4"}, {"cref": "#/texts/40"}, {"cref": "#/pictures/5"}, {"cref": "#/texts/41"}, {"cref": "#/texts/42"}, {"cref": "#/texts/43"}, {"cref": "#/texts/44"}, {"cref": "#/pictures/6"}, {"cref": "#/texts/45"}, {"cref": "#/texts/46"}, {"cref": "#/texts/47"}, {"cref": "#/texts/48"}, {"cref": "#/texts/49"}, {"cref": "#/texts/50"}, {"cref": "#/groups/2"}, {"cref": "#/texts/54"}, {"cref": "#/texts/55"}, {"cref": "#/texts/56"}, {"cref": "#/texts/57"}, {"cref": "#/texts/58"}, {"cref": "#/texts/59"}, {"cref": "#/groups/3"}, {"cref": "#/texts/62"}, {"cref": "#/groups/4"}, {"cref": "#/texts/64"}, {"cref": "#/texts/65"}, {"cref": "#/texts/66"}, {"cref": "#/texts/67"}, {"cref": "#/texts/68"}, {"cref": "#/texts/69"}, {"cref": "#/texts/70"}, {"cref": "#/texts/71"}, {"cref": "#/texts/72"}, {"cref": "#/texts/73"}, {"cref": "#/texts/74"}, {"cref": "#/texts/75"}, {"cref": "#/pictures/7"}, {"cref": "#/texts/79"}, {"cref": "#/texts/80"}, {"cref": "#/texts/81"}, {"cref": "#/texts/82"}, {"cref": "#/groups/5"}, {"cref": "#/texts/86"}, {"cref": "#/texts/87"}, {"cref": "#/texts/88"}, {"cref": "#/texts/89"}, {"cref": "#/tables/1"}, {"cref": "#/texts/91"}, {"cref": "#/texts/92"}, {"cref": "#/groups/6"}, {"cref": "#/texts/104"}, {"cref": "#/texts/105"}, {"cref": "#/texts/106"}, {"cref": "#/texts/107"}, {"cref": "#/texts/108"}, {"cref": "#/texts/109"}, {"cref": "#/texts/110"}, {"cref": "#/texts/111"}, {"cref": "#/texts/112"}, {"cref": "#/texts/113"}, {"cref": "#/tables/2"}, {"cref": "#/texts/115"}, {"cref": "#/texts/116"}, {"cref": "#/texts/117"}, {"cref": "#/pictures/8"}, {"cref": "#/texts/167"}, {"cref": "#/texts/168"}, {"cref": "#/texts/169"}, {"cref": "#/texts/170"}, {"cref": "#/texts/171"}, {"cref": "#/tables/3"}, {"cref": "#/texts/173"}, {"cref": "#/groups/7"}, {"cref": "#/pictures/9"}, {"cref": "#/texts/190"}, {"cref": "#/texts/191"}, {"cref": "#/texts/192"}, {"cref": "#/texts/193"}, {"cref": "#/texts/194"}, {"cref": "#/texts/195"}, {"cref": "#/tables/4"}, {"cref": "#/texts/197"}, {"cref": "#/texts/198"}, {"cref": "#/texts/199"}, {"cref": "#/texts/200"}, {"cref": "#/groups/8"}, {"cref": "#/texts/204"}, {"cref": "#/texts/205"}, {"cref": "#/texts/206"}, {"cref": "#/texts/207"}, {"cref": "#/texts/208"}, {"cref": "#/texts/209"}, {"cref": "#/groups/9"}, {"cref": "#/texts/216"}, {"cref": "#/texts/218"}, {"cref": "#/texts/219"}, {"cref": "#/groups/10"}, {"cref": "#/pictures/10"}, {"cref": "#/texts/222"}, {"cref": "#/texts/223"}, {"cref": "#/groups/11"}, {"cref": "#/texts/225"}, {"cref": "#/groups/12"}, {"cref": "#/texts/228"}, {"cref": "#/texts/229"}, {"cref": "#/texts/230"}, {"cref": "#/texts/231"}, {"cref": "#/groups/13"}, {"cref": "#/pictures/11"}, {"cref": "#/texts/234"}, {"cref": "#/texts/235"}, {"cref": "#/groups/14"}, {"cref": "#/pictures/12"}, {"cref": "#/pictures/13"}, {"cref": "#/texts/240"}, {"cref": "#/texts/241"}, {"cref": "#/texts/242"}, {"cref": "#/texts/243"}, {"cref": "#/texts/244"}, {"cref": "#/groups/15"}, {"cref": "#/texts/245"}, {"cref": "#/texts/246"}, {"cref": "#/texts/247"}, {"cref": "#/texts/248"}, {"cref": "#/texts/249"}, {"cref": "#/texts/250"}, {"cref": "#/texts/251"}, {"cref": "#/pictures/14"}, {"cref": "#/pictures/15"}, {"cref": "#/texts/255"}, {"cref": "#/texts/256"}, {"cref": "#/texts/257"}, {"cref": "#/texts/258"}, {"cref": "#/texts/259"}], "content_layer": "body", "name": "_root_", "label": "unspecified"}, "groups": [{"self_ref": "#/groups/0", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/14"}, {"cref": "#/texts/15"}, {"cref": "#/texts/16"}, {"cref": "#/texts/17"}], "content_layer": "body", "name": "list", "label": "list"}, {"self_ref": "#/groups/1", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/27"}, {"cref": "#/texts/28"}, {"cref": "#/texts/29"}, {"cref": "#/texts/30"}, {"cref": "#/texts/31"}, {"cref": "#/texts/32"}, {"cref": "#/texts/33"}, {"cref": "#/texts/34"}, {"cref": "#/texts/35"}], "content_layer": "body", "name": "list", "label": "list"}, {"self_ref": "#/groups/2", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/51"}, {"cref": "#/texts/52"}, {"cref": "#/texts/53"}], "content_layer": "body", "name": "list", "label": "list"}, {"self_ref": "#/groups/3", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/60"}, {"cref": "#/texts/61"}], "content_layer": "body", "name": "list", "label": "list"}, {"self_ref": "#/groups/4", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/63"}], "content_layer": "body", "name": "list", "label": "list"}, {"self_ref": "#/groups/5", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/83"}, {"cref": "#/texts/84"}, {"cref": "#/texts/85"}], "content_layer": "body", "name": "list", "label": "list"}, {"self_ref": "#/groups/6", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/93"}, {"cref": "#/texts/94"}, {"cref": "#/texts/95"}, {"cref": "#/texts/96"}, {"cref": "#/texts/97"}, {"cref": "#/texts/98"}, {"cref": "#/texts/99"}, {"cref": "#/texts/100"}, {"cref": "#/texts/101"}, {"cref": "#/texts/102"}, {"cref": "#/texts/103"}], "content_layer": "body", "name": "group", "label": "key_value_area"}, {"self_ref": "#/groups/7", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/174"}, {"cref": "#/texts/175"}, {"cref": "#/texts/176"}, {"cref": "#/texts/177"}, {"cref": "#/texts/178"}], "content_layer": "body", "name": "list", "label": "list"}, {"self_ref": "#/groups/8", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/201"}, {"cref": "#/texts/202"}, {"cref": "#/texts/203"}], "content_layer": "body", "name": "list", "label": "list"}, {"self_ref": "#/groups/9", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/210"}, {"cref": "#/texts/211"}, {"cref": "#/texts/212"}, {"cref": "#/texts/213"}, {"cref": "#/texts/214"}, {"cref": "#/texts/215"}], "content_layer": "body", "name": "list", "label": "list"}, {"self_ref": "#/groups/10", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/220"}], "content_layer": "body", "name": "list", "label": "list"}, {"self_ref": "#/groups/11", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/224"}], "content_layer": "body", "name": "list", "label": "list"}, {"self_ref": "#/groups/12", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/226"}, {"cref": "#/texts/227"}], "content_layer": "body", "name": "list", "label": "list"}, {"self_ref": "#/groups/13", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/232"}], "content_layer": "body", "name": "list", "label": "list"}, {"self_ref": "#/groups/14", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/236"}, {"cref": "#/texts/238"}], "content_layer": "body", "name": "list", "label": "list"}, {"self_ref": "#/groups/15", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "name": "group", "label": "form_area"}], "texts": [{"self_ref": "#/texts/0", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 287.82001, "t": 763.45197, "r": 418.83356, "b": 741.25195, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 11]}], "orig": "Front cover", "text": "Front cover"}, {"self_ref": "#/texts/1", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "section_header", "prov": [{"page_no": 1, "bbox": {"l": 35.700001, "t": 707.4134500000001, "r": 584.64288, "b": 626.15887, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 54]}], "orig": "Row and Column Access Control Support in IBM DB2 for i", "text": "Row and Column Access Control Support in IBM DB2 for i", "level": 1}, {"self_ref": "#/texts/2", "parent": {"cref": "#/pictures/1"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 497.70001, "t": 216.28799000000004, "r": 581.38678, "b": 93.58802800000001, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 115]}], "orig": "Jim Bainbridge Hernando Bedoya Rob Bestgen Mike Cain Dan Cruikshank Jim Denton Doug Mack Tom McKinley Kent Milligan", "text": "Jim Bainbridge Hernando Bedoya Rob Bestgen Mike Cain Dan Cruikshank Jim Denton Doug Mack Tom McKinley Kent Milligan"}, {"self_ref": "#/texts/3", "parent": {"cref": "#/pictures/1"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 36.119999, "t": 495.86172, "r": 216.00064, "b": 466.43942, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 40]}], "orig": "Implement roles and separation of duties", "text": "Implement roles and separation of duties"}, {"self_ref": "#/texts/4", "parent": {"cref": "#/pictures/1"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 35.759315, "t": 441.86118000000005, "r": 202.45404, "b": 412.43887000000007, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 40]}], "orig": "Leverage row permissions on the database", "text": "Leverage row permissions on the database"}, {"self_ref": "#/texts/5", "parent": {"cref": "#/pictures/1"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 36.059887, "t": 387.86063, "r": 195.2753, "b": 358.43832000000003, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 40]}], "orig": "Protect columns by defining column masks", "text": "Protect columns by defining column masks"}, {"self_ref": "#/texts/6", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 287.82001, "t": 763.45197, "r": 418.83356, "b": 741.25195, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 11]}], "orig": "Front cover", "text": "Front cover"}, {"self_ref": "#/texts/7", "parent": {"cref": "#/body"}, "children": [], "content_layer": "furniture", "label": "page_footer", "prov": [{"page_no": 1, "bbox": {"l": 36.900002, "t": 40.76999999999998, "r": 164.4585, "b": 26.894999999999982, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 17]}], "orig": "ibm.com /redbooks", "text": "ibm.com /redbooks"}, {"self_ref": "#/texts/8", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "section_header", "prov": [{"page_no": 2, "bbox": {"l": 64.800003, "t": 718.15198, "r": 168.73441, "b": 695.95197, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 8]}], "orig": "Contents", "text": "Contents", "level": 1}, {"self_ref": "#/texts/9", "parent": {"cref": "#/body"}, "children": [], "content_layer": "furniture", "label": "page_footer", "prov": [{"page_no": 2, "bbox": {"l": 64.800003, "t": 36.461997999999994, "r": 257.24335, "b": 28.136998999999946, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 48]}], "orig": "' Copyright IBM Corp. 2014. All rights reserved.", "text": "' Copyright IBM Corp. 2014. All rights reserved."}, {"self_ref": "#/texts/10", "parent": {"cref": "#/body"}, "children": [], "content_layer": "furniture", "label": "page_footer", "prov": [{"page_no": 2, "bbox": {"l": 538.85999, "t": 37.151279000000045, "r": 547.25928, "b": 27.938279999999963, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 3]}], "orig": "iii", "text": "iii"}, {"self_ref": "#/texts/11", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 64.800003, "t": 717.51605, "r": 235.8624, "b": 706.41602, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 30]}], "orig": "DB2 for i Center of Excellence", "text": "DB2 for i Center of Excellence"}, {"self_ref": "#/texts/12", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 94.132698, "t": 653.54987, "r": 233.99973, "b": 636.66357, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 52]}], "orig": "Solution Brief IBM Systems Lab Services and Training", "text": "Solution Brief IBM Systems Lab Services and Training"}, {"self_ref": "#/texts/13", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "section_header", "prov": [{"page_no": 3, "bbox": {"l": 144.88921, "t": 464.53836000000007, "r": 188.74681, "b": 455.18594, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 10]}], "orig": "Highlights", "text": "Highlights", "level": 1}, {"self_ref": "#/texts/14", "parent": {"cref": "#/groups/0"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 3, "bbox": {"l": 144.88921, "t": 446.78293, "r": 242.87389000000002, "b": 433.31058, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 532]}], "orig": "GLYPH<g115>GLYPH<g3> GLYPH<g40>GLYPH<g81>GLYPH<g75>GLYPH<g68>GLYPH<g81>GLYPH<g70>GLYPH<g72>GLYPH<g3> GLYPH<g87>GLYPH<g75>GLYPH<g72>GLYPH<g3> GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g73>GLYPH<g82>GLYPH<g85>GLYPH<g80>GLYPH<g68>GLYPH<g81>GLYPH<g70>GLYPH<g72>GLYPH<g3> GLYPH<g82>GLYPH<g73>GLYPH<g3> GLYPH<g92>GLYPH<g82>GLYPH<g88>GLYPH<g85> GLYPH<g3> GLYPH<g71>GLYPH<g68>GLYPH<g87>GLYPH<g68>GLYPH<g69>GLYPH<g68>GLYPH<g86>GLYPH<g72>GLYPH<g3> GLYPH<g82>GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g68>GLYPH<g87>GLYPH<g76>GLYPH<g82>GLYPH<g81>GLYPH<g86>", "text": "GLYPH<g115>GLYPH<g3> GLYPH<g40>GLYPH<g81>GLYPH<g75>GLYPH<g68>GLYPH<g81>GLYPH<g70>GLYPH<g72>GLYPH<g3> GLYPH<g87>GLYPH<g75>GLYPH<g72>GLYPH<g3> GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g73>GLYPH<g82>GLYPH<g85>GLYPH<g80>GLYPH<g68>GLYPH<g81>GLYPH<g70>GLYPH<g72>GLYPH<g3> GLYPH<g82>GLYPH<g73>GLYPH<g3> GLYPH<g92>GLYPH<g82>GLYPH<g88>GLYPH<g85> GLYPH<g3> GLYPH<g71>GLYPH<g68>GLYPH<g87>GLYPH<g68>GLYPH<g69>GLYPH<g68>GLYPH<g86>GLYPH<g72>GLYPH<g3> GLYPH<g82>GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g68>GLYPH<g87>GLYPH<g76>GLYPH<g82>GLYPH<g81>GLYPH<g86>", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/15", "parent": {"cref": "#/groups/0"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 3, "bbox": {"l": 144.88921, "t": 424.06781, "r": 259.2287, "b": 402.7627, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 876]}], "orig": "GLYPH<g115>GLYPH<g3> GLYPH<g40>GLYPH<g68>GLYPH<g85> GLYPH<g81>GLYPH<g3> GLYPH<g74>GLYPH<g85>GLYPH<g72>GLYPH<g68>GLYPH<g87>GLYPH<g72>GLYPH<g85>GLYPH<g3> GLYPH<g85>GLYPH<g72>GLYPH<g87>GLYPH<g88>GLYPH<g85> GLYPH<g81>GLYPH<g3> GLYPH<g82>GLYPH<g81>GLYPH<g3> GLYPH<g44>GLYPH<g55>GLYPH<g3> GLYPH<g83>GLYPH<g85>GLYPH<g82>GLYPH<g77>GLYPH<g72>GLYPH<g70>GLYPH<g87>GLYPH<g86> GLYPH<g3> GLYPH<g87>GLYPH<g75>GLYPH<g85>GLYPH<g82>GLYPH<g88>GLYPH<g74>GLYPH<g75>GLYPH<g3> GLYPH<g80>GLYPH<g82>GLYPH<g71>GLYPH<g72>GLYPH<g85> GLYPH<g81>GLYPH<g76>GLYPH<g93>GLYPH<g68>GLYPH<g87>GLYPH<g76>GLYPH<g82>GLYPH<g81>GLYPH<g3> GLYPH<g82>GLYPH<g73>GLYPH<g3> GLYPH<g71>GLYPH<g68>GLYPH<g87>GLYPH<g68>GLYPH<g69>GLYPH<g68>GLYPH<g86>GLYPH<g72>GLYPH<g3> GLYPH<g68>GLYPH<g81>GLYPH<g71> GLYPH<g3> GLYPH<g68>GLYPH<g83>GLYPH<g83>GLYPH<g79>GLYPH<g76>GLYPH<g70>GLYPH<g68>GLYPH<g87>GLYPH<g76>GLYPH<g82>GLYPH<g81>GLYPH<g86>", "text": "GLYPH<g115>GLYPH<g3> GLYPH<g40>GLYPH<g68>GLYPH<g85> GLYPH<g81>GLYPH<g3> GLYPH<g74>GLYPH<g85>GLYPH<g72>GLYPH<g68>GLYPH<g87>GLYPH<g72>GLYPH<g85>GLYPH<g3> GLYPH<g85>GLYPH<g72>GLYPH<g87>GLYPH<g88>GLYPH<g85> GLYPH<g81>GLYPH<g3> GLYPH<g82>GLYPH<g81>GLYPH<g3> GLYPH<g44>GLYPH<g55>GLYPH<g3> GLYPH<g83>GLYPH<g85>GLYPH<g82>GLYPH<g77>GLYPH<g72>GLYPH<g70>GLYPH<g87>GLYPH<g86> GLYPH<g3> GLYPH<g87>GLYPH<g75>GLYPH<g85>GLYPH<g82>GLYPH<g88>GLYPH<g74>GLYPH<g75>GLYPH<g3> GLYPH<g80>GLYPH<g82>GLYPH<g71>GLYPH<g72>GLYPH<g85> GLYPH<g81>GLYPH<g76>GLYPH<g93>GLYPH<g68>GLYPH<g87>GLYPH<g76>GLYPH<g82>GLYPH<g81>GLYPH<g3> GLYPH<g82>GLYPH<g73>GLYPH<g3> GLYPH<g71>GLYPH<g68>GLYPH<g87>GLYPH<g68>GLYPH<g69>GLYPH<g68>GLYPH<g86>GLYPH<g72>GLYPH<g3> GLYPH<g68>GLYPH<g81>GLYPH<g71> GLYPH<g3> GLYPH<g68>GLYPH<g83>GLYPH<g83>GLYPH<g79>GLYPH<g76>GLYPH<g70>GLYPH<g68>GLYPH<g87>GLYPH<g76>GLYPH<g82>GLYPH<g81>GLYPH<g86>", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/16", "parent": {"cref": "#/groups/0"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 3, "bbox": {"l": 144.88921, "t": 393.51981, "r": 249.83562, "b": 380.04745, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 672]}], "orig": "GLYPH<g115>GLYPH<g3> GLYPH<g53>GLYPH<g72>GLYPH<g79>GLYPH<g92>GLYPH<g3> GLYPH<g82>GLYPH<g81>GLYPH<g3> GLYPH<g44>GLYPH<g37>GLYPH<g48>GLYPH<g3> GLYPH<g72>GLYPH<g91>GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g87>GLYPH<g3> GLYPH<g70>GLYPH<g82>GLYPH<g81>GLYPH<g86>GLYPH<g88>GLYPH<g79>GLYPH<g87>GLYPH<g76>GLYPH<g81>GLYPH<g74>GLYPH<g15>GLYPH<g3> GLYPH<g86>GLYPH<g78>GLYPH<g76>GLYPH<g79>GLYPH<g79>GLYPH<g86> GLYPH<g3> GLYPH<g86>GLYPH<g75>GLYPH<g68>GLYPH<g85>GLYPH<g76>GLYPH<g81>GLYPH<g74>GLYPH<g3> GLYPH<g68>GLYPH<g81>GLYPH<g71>GLYPH<g3> GLYPH<g85>GLYPH<g72>GLYPH<g81>GLYPH<g82>GLYPH<g90>GLYPH<g81>GLYPH<g3> GLYPH<g86>GLYPH<g72>GLYPH<g85>GLYPH<g89>GLYPH<g76>GLYPH<g70>GLYPH<g72>GLYPH<g86>", "text": "GLYPH<g115>GLYPH<g3> GLYPH<g53>GLYPH<g72>GLYPH<g79>GLYPH<g92>GLYPH<g3> GLYPH<g82>GLYPH<g81>GLYPH<g3> GLYPH<g44>GLYPH<g37>GLYPH<g48>GLYPH<g3> GLYPH<g72>GLYPH<g91>GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g87>GLYPH<g3> GLYPH<g70>GLYPH<g82>GLYPH<g81>GLYPH<g86>GLYPH<g88>GLYPH<g79>GLYPH<g87>GLYPH<g76>GLYPH<g81>GLYPH<g74>GLYPH<g15>GLYPH<g3> GLYPH<g86>GLYPH<g78>GLYPH<g76>GLYPH<g79>GLYPH<g79>GLYPH<g86> GLYPH<g3> GLYPH<g86>GLYPH<g75>GLYPH<g68>GLYPH<g85>GLYPH<g76>GLYPH<g81>GLYPH<g74>GLYPH<g3> GLYPH<g68>GLYPH<g81>GLYPH<g71>GLYPH<g3> GLYPH<g85>GLYPH<g72>GLYPH<g81>GLYPH<g82>GLYPH<g90>GLYPH<g81>GLYPH<g3> GLYPH<g86>GLYPH<g72>GLYPH<g85>GLYPH<g89>GLYPH<g76>GLYPH<g70>GLYPH<g72>GLYPH<g86>", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/17", "parent": {"cref": "#/groups/0"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 3, "bbox": {"l": 144.88921, "t": 370.8047199999999, "r": 234.25163000000003, "b": 357.33237, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 613]}], "orig": "GLYPH<g115>GLYPH<g3> GLYPH<g55> GLYPH<g68>GLYPH<g78>GLYPH<g72>GLYPH<g3> GLYPH<g68>GLYPH<g71>GLYPH<g89>GLYPH<g68>GLYPH<g81>GLYPH<g87>GLYPH<g68>GLYPH<g74>GLYPH<g72>GLYPH<g3> GLYPH<g82>GLYPH<g73>GLYPH<g3> GLYPH<g68>GLYPH<g70>GLYPH<g70>GLYPH<g72>GLYPH<g86>GLYPH<g86>GLYPH<g3> GLYPH<g87>GLYPH<g82>GLYPH<g3> GLYPH<g68> GLYPH<g3> GLYPH<g90>GLYPH<g82>GLYPH<g85>GLYPH<g79>GLYPH<g71>GLYPH<g90>GLYPH<g76>GLYPH<g71>GLYPH<g72>GLYPH<g3> GLYPH<g86>GLYPH<g82>GLYPH<g88>GLYPH<g85>GLYPH<g70>GLYPH<g72>GLYPH<g3> GLYPH<g82>GLYPH<g73>GLYPH<g3> GLYPH<g72>GLYPH<g91>GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g87>GLYPH<g76>GLYPH<g86>GLYPH<g72>", "text": "GLYPH<g115>GLYPH<g3> GLYPH<g55> GLYPH<g68>GLYPH<g78>GLYPH<g72>GLYPH<g3> GLYPH<g68>GLYPH<g71>GLYPH<g89>GLYPH<g68>GLYPH<g81>GLYPH<g87>GLYPH<g68>GLYPH<g74>GLYPH<g72>GLYPH<g3> GLYPH<g82>GLYPH<g73>GLYPH<g3> GLYPH<g68>GLYPH<g70>GLYPH<g70>GLYPH<g72>GLYPH<g86>GLYPH<g86>GLYPH<g3> GLYPH<g87>GLYPH<g82>GLYPH<g3> GLYPH<g68> GLYPH<g3> GLYPH<g90>GLYPH<g82>GLYPH<g85>GLYPH<g79>GLYPH<g71>GLYPH<g90>GLYPH<g76>GLYPH<g71>GLYPH<g72>GLYPH<g3> GLYPH<g86>GLYPH<g82>GLYPH<g88>GLYPH<g85>GLYPH<g70>GLYPH<g72>GLYPH<g3> GLYPH<g82>GLYPH<g73>GLYPH<g3> GLYPH<g72>GLYPH<g91>GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g87>GLYPH<g76>GLYPH<g86>GLYPH<g72>", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/18", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 461.08859000000007, "t": 653.59247, "r": 506.26178, "b": 646.57819, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 14]}], "orig": "Power Services", "text": "Power Services"}, {"self_ref": "#/texts/19", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "section_header", "prov": [{"page_no": 3, "bbox": {"l": 280.24011, "t": 552.65735, "r": 463.80942, "b": 515.37946, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 30]}], "orig": "DB2 for i Center of Excellence", "text": "DB2 for i Center of Excellence", "level": 1}, {"self_ref": "#/texts/20", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 280.24011, "t": 514.40973, "r": 483.29572, "b": 504.54041, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 49]}], "orig": "Expert help to achieve your business requirements", "text": "Expert help to achieve your business requirements"}, {"self_ref": "#/texts/21", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "section_header", "prov": [{"page_no": 3, "bbox": {"l": 280.24011, "t": 476.11838000000006, "r": 443.28210000000007, "b": 467.10434, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 37]}], "orig": "We build confident, satisfied clients", "text": "We build confident, satisfied clients", "level": 1}, {"self_ref": "#/texts/22", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 280.24011, "t": 464.62405, "r": 488.15466, "b": 447.0405, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 122]}], "orig": "No one else has the vast consulting experiences, skills sharing and renown service offerings to do what we can do for you.", "text": "No one else has the vast consulting experiences, skills sharing and renown service offerings to do what we can do for you."}, {"self_ref": "#/texts/23", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 280.24011, "t": 434.6739799999999, "r": 367.86023, "b": 427.26999, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 27]}], "orig": "Because no one else is IBM.", "text": "Because no one else is IBM."}, {"self_ref": "#/texts/24", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 280.24011, "t": 414.90198000000004, "r": 500.32104000000004, "b": 366.77972000000005, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 318]}], "orig": "With combined experiences and direct access to development groups, we're the experts in IBM DB2\u00ae for i. The DB2 for i Center of Excellence (CoE) can help you achieve-perhaps reexamine and exceed-your business requirements and gain more confidence and satisfaction in IBM product data management products and solutions.", "text": "With combined experiences and direct access to development groups, we're the experts in IBM DB2\u00ae for i. The DB2 for i Center of Excellence (CoE) can help you achieve-perhaps reexamine and exceed-your business requirements and gain more confidence and satisfaction in IBM product data management products and solutions."}, {"self_ref": "#/texts/25", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "section_header", "prov": [{"page_no": 3, "bbox": {"l": 280.24011, "t": 354.14597, "r": 434.83205999999996, "b": 345.13193, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 30]}], "orig": "Who we are, some of what we do", "text": "Who we are, some of what we do", "level": 1}, {"self_ref": "#/texts/26", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 3, "bbox": {"l": 280.24011, "t": 342.65175999999997, "r": 434.56316999999996, "b": 335.24777, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 46]}], "orig": "Global CoE engagements cover topics including:", "text": "Global CoE engagements cover topics including:"}, {"self_ref": "#/texts/27", "parent": {"cref": "#/groups/1"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 3, "bbox": {"l": 280.24011, "t": 322.88174, "r": 401.56412, "b": 315.47775, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 38]}], "orig": "r Database performance and scalability", "text": "r Database performance and scalability", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/28", "parent": {"cref": "#/groups/1"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 3, "bbox": {"l": 280.24011, "t": 312.69904, "r": 424.99646, "b": 305.29504, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 44]}], "orig": "r Advanced SQL knowledge and skills transfer", "text": "r Advanced SQL knowledge and skills transfer", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/29", "parent": {"cref": "#/groups/1"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 3, "bbox": {"l": 280.24011, "t": 302.51645, "r": 392.15845, "b": 295.11246, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 37]}], "orig": "r Business intelligence and analytics", "text": "r Business intelligence and analytics", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/30", "parent": {"cref": "#/groups/1"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 3, "bbox": {"l": 280.24011, "t": 292.33374, "r": 339.94354, "b": 284.92975, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 15]}], "orig": "r DB2 Web Query", "text": "r DB2 Web Query", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/31", "parent": {"cref": "#/groups/1"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 3, "bbox": {"l": 280.24011, "t": 282.15115, "r": 504.19314999999995, "b": 274.74716, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 72]}], "orig": "r Query/400 modernization for better reporting and analysis capabilities", "text": "r Query/400 modernization for better reporting and analysis capabilities", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/32", "parent": {"cref": "#/groups/1"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 3, "bbox": {"l": 280.24011, "t": 271.96844, "r": 423.0022, "b": 264.5644500000001, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 43]}], "orig": "r Database modernization and re-engineering", "text": "r Database modernization and re-engineering", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/33", "parent": {"cref": "#/groups/1"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 3, "bbox": {"l": 280.24011, "t": 261.78585999999996, "r": 399.65173, "b": 254.38187000000005, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 38]}], "orig": "r Data-centric architecture and design", "text": "r Data-centric architecture and design", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/34", "parent": {"cref": "#/groups/1"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 3, "bbox": {"l": 280.24011, "t": 251.60325999999998, "r": 466.77881, "b": 244.19925999999998, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 58]}], "orig": "r Extremely large database and overcoming limits to growth", "text": "r Extremely large database and overcoming limits to growth", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/35", "parent": {"cref": "#/groups/1"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 3, "bbox": {"l": 280.24011, "t": 241.42054999999993, "r": 382.20956, "b": 234.01656000000003, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 30]}], "orig": "r ISV education and enablement", "text": "r ISV education and enablement", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/36", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "section_header", "prov": [{"page_no": 4, "bbox": {"l": 64.800003, "t": 718.15198, "r": 151.46161, "b": 695.95197, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 7]}], "orig": "Preface", "text": "Preface", "level": 1}, {"self_ref": "#/texts/37", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 4, "bbox": {"l": 136.79984, "t": 659.35138, "r": 547.30823, "b": 590.13928, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 469]}], "orig": "This IBMfi Redpaper\u2122 publication provides information about the IBM i 7.2 feature of IBM DB2fi for i Row and Column Access Control (RCAC). It offers a broad description of the function and advantages of controlling access to data in a comprehensive and transparent way. This publication helps you understand the capabilities of RCAC and provides examples of defining, creating, and implementing the row permissions and column masks in a relational database environment.", "text": "This IBMfi Redpaper\u2122 publication provides information about the IBM i 7.2 feature of IBM DB2fi for i Row and Column Access Control (RCAC). It offers a broad description of the function and advantages of controlling access to data in a comprehensive and transparent way. This publication helps you understand the capabilities of RCAC and provides examples of defining, creating, and implementing the row permissions and column masks in a relational database environment."}, {"self_ref": "#/texts/38", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 4, "bbox": {"l": 136.79987, "t": 577.39252, "r": 546.4657, "b": 532.18005, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 309]}], "orig": "This paper is intended for database engineers, data-centric application developers, and security officers who want to design and implement RCAC as a part of their data control and governance policy. A solid background in IBM i object level security, DB2 for i relational database concepts, and SQL is assumed.", "text": "This paper is intended for database engineers, data-centric application developers, and security officers who want to design and implement RCAC as a part of their data control and governance policy. A solid background in IBM i object level security, DB2 for i relational database concepts, and SQL is assumed."}, {"self_ref": "#/texts/39", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 4, "bbox": {"l": 136.8, "t": 471.37128000000007, "r": 547.23669, "b": 450.15848, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 172]}], "orig": "This paper was produced by the IBM DB2 for i Center of Excellence team in partnership with the International Technical Support Organization (ITSO), Rochester, Minnesota US.", "text": "This paper was produced by the IBM DB2 for i Center of Excellence team in partnership with the International Technical Support Organization (ITSO), Rochester, Minnesota US."}, {"self_ref": "#/texts/40", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 4, "bbox": {"l": 263.39957, "t": 416.35123, "r": 541.25079, "b": 275.14026, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 684]}], "orig": "Jim Bainbridge is a senior DB2 consultant on the DB2 for i Center of Excellence team in the IBM Lab Services and Training organization. His primary role is training and implementation services for IBM DB2 Web Query for i and business analytics. Jim began his career with IBM 30 years ago in the IBM Rochester Development Lab, where he developed cooperative processing products that paired IBM PCs with IBM S/36 and AS/.400 systems. In the years since, Jim has held numerous technical roles, including independent software vendors technical support on a broad range of IBM technologies and products, and supporting customers in the IBM Executive Briefing Center and IBM Project Office.", "text": "Jim Bainbridge is a senior DB2 consultant on the DB2 for i Center of Excellence team in the IBM Lab Services and Training organization. His primary role is training and implementation services for IBM DB2 Web Query for i and business analytics. Jim began his career with IBM 30 years ago in the IBM Rochester Development Lab, where he developed cooperative processing products that paired IBM PCs with IBM S/36 and AS/.400 systems. In the years since, Jim has held numerous technical roles, including independent software vendors technical support on a broad range of IBM technologies and products, and supporting customers in the IBM Executive Briefing Center and IBM Project Office."}, {"self_ref": "#/texts/41", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 4, "bbox": {"l": 263.3996, "t": 264.37347, "r": 541.27374, "b": 111.16283999999996, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 726]}], "orig": "Hernando Bedoya is a Senior IT Specialist at STG Lab Services and Training in Rochester, Minnesota. He writes extensively and teaches IBM classes worldwide in all areas of DB2 for i. Before joining STG Lab Services, he worked in the ITSO for nine years writing multiple IBM Redbooksfi publications. He also worked for IBM Colombia as an IBM AS/400fi IT Specialist doing presales support for the Andean countries. He has 28 years of experience in the computing field and has taught database classes in Colombian universities. He holds a Master's degree in Computer Science from EAFIT, Colombia. His areas of expertise are database technology, performance, and data warehousing. Hernando can be contacted at hbedoya@us.ibm.com .", "text": "Hernando Bedoya is a Senior IT Specialist at STG Lab Services and Training in Rochester, Minnesota. He writes extensively and teaches IBM classes worldwide in all areas of DB2 for i. Before joining STG Lab Services, he worked in the ITSO for nine years writing multiple IBM Redbooksfi publications. He also worked for IBM Colombia as an IBM AS/400fi IT Specialist doing presales support for the Andean countries. He has 28 years of experience in the computing field and has taught database classes in Colombian universities. He holds a Master's degree in Computer Science from EAFIT, Colombia. His areas of expertise are database technology, performance, and data warehousing. Hernando can be contacted at hbedoya@us.ibm.com ."}, {"self_ref": "#/texts/42", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "section_header", "prov": [{"page_no": 4, "bbox": {"l": 64.800003, "t": 503.6994, "r": 125.36661, "b": 488.9364, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 7]}], "orig": "Authors", "text": "Authors", "level": 1}, {"self_ref": "#/texts/43", "parent": {"cref": "#/body"}, "children": [], "content_layer": "furniture", "label": "page_footer", "prov": [{"page_no": 4, "bbox": {"l": 64.800003, "t": 36.461997999999994, "r": 257.24335, "b": 28.136998999999946, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 48]}], "orig": "' Copyright IBM Corp. 2014. All rights reserved.", "text": "' Copyright IBM Corp. 2014. All rights reserved."}, {"self_ref": "#/texts/44", "parent": {"cref": "#/body"}, "children": [], "content_layer": "furniture", "label": "page_footer", "prov": [{"page_no": 4, "bbox": {"l": 538.85999, "t": 37.151279000000045, "r": 547.25031, "b": 27.938279999999963, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "xi", "text": "xi"}, {"self_ref": "#/texts/45", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 500.39999, "t": 698.8312999999999, "r": 522.61774, "b": 661.86829, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "1", "text": "1"}, {"self_ref": "#/texts/46", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 81.0, "t": 523.45728, "r": 115.13253, "b": 517.01929, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 10]}], "orig": "Chapter 1.", "text": "Chapter 1."}, {"self_ref": "#/texts/47", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "section_header", "prov": [{"page_no": 5, "bbox": {"l": 136.8, "t": 537.11365, "r": 547.30475, "b": 482.1218, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 36]}], "orig": "Securing and protecting IBM DB2 data", "text": "Securing and protecting IBM DB2 data", "level": 1}, {"self_ref": "#/texts/48", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 136.79965, "t": 443.29129, "r": 547.25403, "b": 362.07886, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 648]}], "orig": "Recent news headlines are filled with reports of data breaches and cyber-attacks impacting global businesses of all sizes. The Identity Theft Resource Center$^{1}$ reports that almost 5000 data breaches have occurred since 2005, exposing over 600 million records of data. The financial cost of these data breaches is skyrocketing. Studies from the Ponemon Institute$^{2}$ revealed that the average cost of a data breach increased in 2013 by 15% globally and resulted in a brand equity loss of $9.4 million per attack. The average cost that is incurred for each lost record containing sensitive information increased more than 9% to $145 per record.", "text": "Recent news headlines are filled with reports of data breaches and cyber-attacks impacting global businesses of all sizes. The Identity Theft Resource Center$^{1}$ reports that almost 5000 data breaches have occurred since 2005, exposing over 600 million records of data. The financial cost of these data breaches is skyrocketing. Studies from the Ponemon Institute$^{2}$ revealed that the average cost of a data breach increased in 2013 by 15% globally and resulted in a brand equity loss of $9.4 million per attack. The average cost that is incurred for each lost record containing sensitive information increased more than 9% to $145 per record."}, {"self_ref": "#/texts/49", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 136.80023, "t": 349.2722800000001, "r": 527.2063, "b": 304.05984, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 304]}], "orig": "Businesses must make a serious effort to secure their data and recognize that securing information assets is a cost of doing business. In many parts of the world and in many industries, securing the data is required by law and subject to audits. Data security is no longer an option; it is a requirement.", "text": "Businesses must make a serious effort to secure their data and recognize that securing information assets is a cost of doing business. In many parts of the world and in many industries, securing the data is required by law and subject to audits. Data security is no longer an option; it is a requirement."}, {"self_ref": "#/texts/50", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 5, "bbox": {"l": 136.80025, "t": 291.31302, "r": 547.15515, "b": 270.10022000000004, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 122]}], "orig": "This chapter describes how you can secure and protect data in DB2 for i. The following topics are covered in this chapter:", "text": "This chapter describes how you can secure and protect data in DB2 for i. The following topics are covered in this chapter:"}, {"self_ref": "#/texts/51", "parent": {"cref": "#/groups/2"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 5, "bbox": {"l": 136.80025, "t": 262.27365, "r": 250.23166999999998, "b": 253.06064000000003, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 37]}], "orig": "GLYPH<SM590000> Security fundamentals", "text": "GLYPH<SM590000> Security fundamentals", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/52", "parent": {"cref": "#/groups/2"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 5, "bbox": {"l": 136.80025, "t": 250.27382999999998, "r": 282.98114, "b": 241.06083999999998, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 47]}], "orig": "GLYPH<SM590000> Current state of IBM i security", "text": "GLYPH<SM590000> Current state of IBM i security", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/53", "parent": {"cref": "#/groups/2"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 5, "bbox": {"l": 136.80025, "t": 238.27403000000004, "r": 264.88187, "b": 229.06104000000005, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 43]}], "orig": "GLYPH<SM590000> DB2 for i security controls", "text": "GLYPH<SM590000> DB2 for i security controls", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/54", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "footnote", "prov": [{"page_no": 5, "bbox": {"l": 136.8, "t": 74.24993900000004, "r": 258.36255, "b": 67.219559, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 35]}], "orig": "$^{1 }$http://www.idtheftcenter.org", "text": "$^{1 }$http://www.idtheftcenter.org"}, {"self_ref": "#/texts/55", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "footnote", "prov": [{"page_no": 5, "bbox": {"l": 136.8, "t": 64.40973699999995, "r": 234.05881, "b": 57.02823999999998, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 31]}], "orig": "$^{2 }$http://www.ponemon.org /", "text": "$^{2 }$http://www.ponemon.org /"}, {"self_ref": "#/texts/56", "parent": {"cref": "#/body"}, "children": [], "content_layer": "furniture", "label": "page_footer", "prov": [{"page_no": 5, "bbox": {"l": 64.800003, "t": 36.461997999999994, "r": 257.24335, "b": 28.136998999999946, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 48]}], "orig": "' Copyright IBM Corp. 2014. All rights reserved.", "text": "' Copyright IBM Corp. 2014. All rights reserved."}, {"self_ref": "#/texts/57", "parent": {"cref": "#/body"}, "children": [], "content_layer": "furniture", "label": "page_footer", "prov": [{"page_no": 5, "bbox": {"l": 541.67987, "t": 37.151279000000045, "r": 547.21765, "b": 27.938279999999963, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "1", "text": "1"}, {"self_ref": "#/texts/58", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "section_header", "prov": [{"page_no": 6, "bbox": {"l": 64.800003, "t": 717.6593, "r": 267.40582, "b": 702.8963, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 25]}], "orig": "1.1 Security fundamentals", "text": "1.1 Security fundamentals", "level": 1}, {"self_ref": "#/texts/59", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 6, "bbox": {"l": 136.8, "t": 685.3913, "r": 545.00482, "b": 664.17847, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 133]}], "orig": "Before reviewing database security techniques, there are two fundamental steps in securing information assets that must be described:", "text": "Before reviewing database security techniques, there are two fundamental steps in securing information assets that must be described:"}, {"self_ref": "#/texts/60", "parent": {"cref": "#/groups/3"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 6, "bbox": {"l": 136.8, "t": 656.87512, "r": 547.16425, "b": 611.13892, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 361]}], "orig": "GLYPH<SM590000> First, and most important, is the definition of a company's security policy . Without a security policy, there is no definition of what are acceptable practices for using, accessing, and storing information by who, what, when, where, and how. A security policy should minimally address three things: confidentiality, integrity, and availability.", "text": "GLYPH<SM590000> First, and most important, is the definition of a company's security policy . Without a security policy, there is no definition of what are acceptable practices for using, accessing, and storing information by who, what, when, where, and how. A security policy should minimally address three things: confidentiality, integrity, and availability.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/61", "parent": {"cref": "#/groups/3"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 6, "bbox": {"l": 151.19946, "t": 603.37213, "r": 547.26086, "b": 522.16022, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 587]}], "orig": "The monitoring and assessment of adherence to the security policy determines whether your security strategy is working. Often, IBM security consultants are asked to perform security assessments for companies without regard to the security policy. Although these assessments can be useful for observing how the system is defined and how data is being accessed, they cannot determine the level of security without a security policy. Without a security policy, it really is not an assessment as much as it is a baseline for monitoring the changes in the security settings that are captured.", "text": "The monitoring and assessment of adherence to the security policy determines whether your security strategy is working. Often, IBM security consultants are asked to perform security assessments for companies without regard to the security policy. Although these assessments can be useful for observing how the system is defined and how data is being accessed, they cannot determine the level of security without a security policy. Without a security policy, it really is not an assessment as much as it is a baseline for monitoring the changes in the security settings that are captured.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/62", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 6, "bbox": {"l": 151.19946, "t": 514.39343, "r": 541.992, "b": 505.18042, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 90]}], "orig": "A security policy is what defines whether the system and its settings are secure (or not).", "text": "A security policy is what defines whether the system and its settings are secure (or not)."}, {"self_ref": "#/texts/63", "parent": {"cref": "#/groups/4"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 6, "bbox": {"l": 136.7993, "t": 497.87503000000004, "r": 547.15826, "b": 416.1394, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 573]}], "orig": "GLYPH<SM590000> The second fundamental in securing data assets is the use of resource security . If implemented properly, resource security prevents data breaches from both internal and external intrusions. Resource security controls are closely tied to the part of the security policy that defines who should have access to what information resources. A hacker might be good enough to get through your company firewalls and sift his way through to your system, but if they do not have explicit access to your database, the hacker cannot compromise your information assets.", "text": "GLYPH<SM590000> The second fundamental in securing data assets is the use of resource security . If implemented properly, resource security prevents data breaches from both internal and external intrusions. Resource security controls are closely tied to the part of the security policy that defines who should have access to what information resources. A hacker might be good enough to get through your company firewalls and sift his way through to your system, but if they do not have explicit access to your database, the hacker cannot compromise your information assets.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/64", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 6, "bbox": {"l": 136.80022, "t": 403.39258, "r": 535.36169, "b": 382.17978, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 179]}], "orig": "With your eyes now open to the importance of securing information assets, the rest of this chapter reviews the methods that are available for securing database resources on IBM i.", "text": "With your eyes now open to the importance of securing information assets, the rest of this chapter reviews the methods that are available for securing database resources on IBM i."}, {"self_ref": "#/texts/65", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "section_header", "prov": [{"page_no": 6, "bbox": {"l": 64.800003, "t": 353.69928, "r": 323.38391, "b": 338.93628, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 35]}], "orig": "1.2 Current state of IBM i security", "text": "1.2 Current state of IBM i security", "level": 1}, {"self_ref": "#/texts/66", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 6, "bbox": {"l": 136.8, "t": 321.37128, "r": 547.31824, "b": 276.15884000000005, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 306]}], "orig": "Because of the inherently secure nature of IBM i, many clients rely on the default system settings to protect their business data that is stored in DB2 for i. In most cases, this means no data protection because the default setting for the Create default public authority (QCRTAUT) system value is *CHANGE.", "text": "Because of the inherently secure nature of IBM i, many clients rely on the default system settings to protect their business data that is stored in DB2 for i. In most cases, this means no data protection because the default setting for the Create default public authority (QCRTAUT) system value is *CHANGE."}, {"self_ref": "#/texts/67", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 6, "bbox": {"l": 136.8, "t": 263.35226, "r": 547.28442, "b": 206.14005999999995, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 405]}], "orig": "Even more disturbing is that many IBM i clients remain in this state, despite the news headlines and the significant costs that are involved with databases being compromised. This default security configuration makes it quite challenging to implement basic security policies. A tighter implementation is required if you really want to protect one of your company's most valuable assets, which is the data.", "text": "Even more disturbing is that many IBM i clients remain in this state, despite the news headlines and the significant costs that are involved with databases being compromised. This default security configuration makes it quite challenging to implement basic security policies. A tighter implementation is required if you really want to protect one of your company's most valuable assets, which is the data."}, {"self_ref": "#/texts/68", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 6, "bbox": {"l": 136.8, "t": 193.33349999999996, "r": 547.28326, "b": 112.12167, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 640]}], "orig": "Traditionally, IBM i applications have employed menu-based security to counteract this default configuration that gives all users access to the data. The theory is that data is protected by the menu options controlling what database operations that the user can perform. This approach is ineffective, even if the user profile is restricted from running interactive commands. The reason is that in today's connected world there are a multitude of interfaces into the system, from web browsers to PC clients, that bypass application menus. If there are no object-level controls, users of these newer interfaces have an open door to your data.", "text": "Traditionally, IBM i applications have employed menu-based security to counteract this default configuration that gives all users access to the data. The theory is that data is protected by the menu options controlling what database operations that the user can perform. This approach is ineffective, even if the user profile is restricted from running interactive commands. The reason is that in today's connected world there are a multitude of interfaces into the system, from web browsers to PC clients, that bypass application menus. If there are no object-level controls, users of these newer interfaces have an open door to your data."}, {"self_ref": "#/texts/69", "parent": {"cref": "#/body"}, "children": [], "content_layer": "furniture", "label": "page_footer", "prov": [{"page_no": 6, "bbox": {"l": 64.800003, "t": 37.151279000000045, "r": 72.821999, "b": 27.938279999999963, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "2", "text": "2"}, {"self_ref": "#/texts/70", "parent": {"cref": "#/body"}, "children": [], "content_layer": "furniture", "label": "page_footer", "prov": [{"page_no": 6, "bbox": {"l": 87.840302, "t": 36.461997999999994, "r": 328.72537, "b": 28.136998999999946, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 54]}], "orig": "Row and Column Access Control Support in IBM DB2 for i", "text": "Row and Column Access Control Support in IBM DB2 for i"}, {"self_ref": "#/texts/71", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 136.8, "t": 720.49133, "r": 544.30334, "b": 639.27942, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 589]}], "orig": "Many businesses are trying to limit data access to a need-to-know basis. This security goal means that users should be given access only to the minimum set of data that is required to perform their job. Often, users with object-level access are given access to row and column values that are beyond what their business task requires because that object-level security provides an all-or-nothing solution. For example, object-level controls allow a manager to access data about all employees. Most security policies limit a manager to accessing data only for the employees that they manage.", "text": "Many businesses are trying to limit data access to a need-to-know basis. This security goal means that users should be given access only to the minimum set of data that is required to perform their job. Often, users with object-level access are given access to row and column values that are beyond what their business task requires because that object-level security provides an all-or-nothing solution. For example, object-level controls allow a manager to access data about all employees. Most security policies limit a manager to accessing data only for the employees that they manage."}, {"self_ref": "#/texts/72", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "section_header", "prov": [{"page_no": 7, "bbox": {"l": 64.800003, "t": 618.66528, "r": 301.46902, "b": 606.67725, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 37]}], "orig": "1.3.1 Existing row and column control", "text": "1.3.1 Existing row and column control", "level": 1}, {"self_ref": "#/texts/73", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 136.79999, "t": 592.51129, "r": 541.56738, "b": 535.29901, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 377]}], "orig": "Some IBM i clients have tried augmenting the all-or-nothing object-level security with SQL views (or logical files) and application logic, as shown in Figure 1-2. However, application-based logic is easy to bypass with all of the different data access interfaces that are provided by the IBM i operating system, such as Open Database Connectivity (ODBC) and System i Navigator.", "text": "Some IBM i clients have tried augmenting the all-or-nothing object-level security with SQL views (or logical files) and application logic, as shown in Figure 1-2. However, application-based logic is easy to bypass with all of the different data access interfaces that are provided by the IBM i operating system, such as Open Database Connectivity (ODBC) and System i Navigator."}, {"self_ref": "#/texts/74", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 136.79999, "t": 522.49243, "r": 547.4408, "b": 477.27997, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 340]}], "orig": "Using SQL views to limit access to a subset of the data in a table also has its own set of challenges. First, there is the complexity of managing all of the SQL view objects that are used for securing data access. Second, scaling a view-based security solution can be difficult as the amount of data grows and the number of users increases.", "text": "Using SQL views to limit access to a subset of the data in a table also has its own set of challenges. First, there is the complexity of managing all of the SQL view objects that are used for securing data access. Second, scaling a view-based security solution can be difficult as the amount of data grows and the number of users increases."}, {"self_ref": "#/texts/75", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 136.79999, "t": 464.47339, "r": 547.23267, "b": 431.26077, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 247]}], "orig": "Even if you are willing to live with these performance and management issues, a user with *ALLOBJ access still can directly access all of the data in the underlying DB2 table and easily bypass the security controls that are built into an SQL view.", "text": "Even if you are willing to live with these performance and management issues, a user with *ALLOBJ access still can directly access all of the data in the underlying DB2 table and easily bypass the security controls that are built into an SQL view."}, {"self_ref": "#/texts/76", "parent": {"cref": "#/pictures/7"}, "children": [], "content_layer": "body", "label": "caption", "prov": [{"page_no": 7, "bbox": {"l": 136.8, "t": 100.18200000000002, "r": 316.44727, "b": 91.85700199999997, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 43]}], "orig": "Figure 1-2 Existing row and column controls", "text": "Figure 1-2 Existing row and column controls"}, {"self_ref": "#/texts/77", "parent": {"cref": "#/pictures/7"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 180.95911, "t": 408.54388, "r": 209.08017, "b": 402.9216, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 9]}], "orig": "User with", "text": "User with"}, {"self_ref": "#/texts/78", "parent": {"cref": "#/pictures/7"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 7, "bbox": {"l": 170.00624, "t": 401.04749, "r": 220.10355, "b": 395.42519999999996, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 14]}], "orig": "*ALLOBJ access", "text": "*ALLOBJ access"}, {"self_ref": "#/texts/79", "parent": {"cref": "#/body"}, "children": [], "content_layer": "furniture", "label": "page_footer", "prov": [{"page_no": 7, "bbox": {"l": 64.800003, "t": 37.151279000000045, "r": 72.821999, "b": 27.938279999999963, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "4", "text": "4"}, {"self_ref": "#/texts/80", "parent": {"cref": "#/body"}, "children": [], "content_layer": "furniture", "label": "page_footer", "prov": [{"page_no": 7, "bbox": {"l": 87.840302, "t": 36.461997999999994, "r": 328.72537, "b": 28.136998999999946, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 54]}], "orig": "Row and Column Access Control Support in IBM DB2 for i", "text": "Row and Column Access Control Support in IBM DB2 for i"}, {"self_ref": "#/texts/81", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "section_header", "prov": [{"page_no": 8, "bbox": {"l": 64.800003, "t": 720.66528, "r": 335.49551, "b": 708.67725, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 38]}], "orig": "2.1.6 Change Function Usage CL command", "text": "2.1.6 Change Function Usage CL command", "level": 1}, {"self_ref": "#/texts/82", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 136.8, "t": 694.51129, "r": 547.28442, "b": 685.2982799999999, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 90]}], "orig": "The following CL commands can be used to work with, display, or change function usage IDs:", "text": "The following CL commands can be used to work with, display, or change function usage IDs:"}, {"self_ref": "#/texts/83", "parent": {"cref": "#/groups/5"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 8, "bbox": {"l": 136.8, "t": 677.47174, "r": 301.51749, "b": 668.25873, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 49]}], "orig": "GLYPH<SM590000> Work Function Usage ( WRKFCNUSG )", "text": "GLYPH<SM590000> Work Function Usage ( WRKFCNUSG )", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/84", "parent": {"cref": "#/groups/5"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 8, "bbox": {"l": 136.80099, "t": 665.47192, "r": 313.39777, "b": 656.25891, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 51]}], "orig": "GLYPH<SM590000> Change Function Usage ( CHGFCNUSG )", "text": "GLYPH<SM590000> Change Function Usage ( CHGFCNUSG )", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/85", "parent": {"cref": "#/groups/5"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 8, "bbox": {"l": 136.80098, "t": 653.47211, "r": 310.81711, "b": 644.25909, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 52]}], "orig": "GLYPH<SM590000> Display Function Usage ( DSPFCNUSG )", "text": "GLYPH<SM590000> Display Function Usage ( DSPFCNUSG )", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/86", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 136.79997, "t": 631.51233, "r": 512.53802, "b": 610.2995, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 126]}], "orig": "For example, the following CHGFCNUSG command shows granting authorization to user HBEDOYA to administer and manage RCAC rules:", "text": "For example, the following CHGFCNUSG command shows granting authorization to user HBEDOYA to administer and manage RCAC rules:"}, {"self_ref": "#/texts/87", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 136.80096, "t": 602.32355, "r": 441.59686, "b": 593.54877, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 61]}], "orig": "CHGFCNUSG FCNID(QIBM_DB_SECADM) USER(HBEDOYA) USAGE(*ALLOWED)", "text": "CHGFCNUSG FCNID(QIBM_DB_SECADM) USER(HBEDOYA) USAGE(*ALLOWED)"}, {"self_ref": "#/texts/88", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "section_header", "prov": [{"page_no": 8, "bbox": {"l": 64.800003, "t": 572.64532, "r": 544.47546, "b": 560.65729, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 72]}], "orig": "2.1.7 Verifying function usage IDs for RCAC with the FUNCTION_USAGE view", "text": "2.1.7 Verifying function usage IDs for RCAC with the FUNCTION_USAGE view", "level": 1}, {"self_ref": "#/texts/89", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 136.8, "t": 546.49133, "r": 519.51794, "b": 525.2785, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 130]}], "orig": "The FUNCTION_USAGE view contains function usage configuration details. Table 2-1 describes the columns in the FUNCTION_USAGE view.", "text": "The FUNCTION_USAGE view contains function usage configuration details. Table 2-1 describes the columns in the FUNCTION_USAGE view."}, {"self_ref": "#/texts/90", "parent": {"cref": "#/tables/1"}, "children": [], "content_layer": "body", "label": "caption", "prov": [{"page_no": 8, "bbox": {"l": 136.8, "t": 512.44202, "r": 283.96805, "b": 504.11699999999996, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 29]}], "orig": "Table 2-1 FUNCTION_USAGE view", "text": "Table 2-1 FUNCTION_USAGE view"}, {"self_ref": "#/texts/91", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 136.8, "t": 339.49127000000004, "r": 547.2804, "b": 318.27847, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 112]}], "orig": "To discover who has authorization to define and manage RCAC, you can use the query that is shown in Example 2-1.", "text": "To discover who has authorization to define and manage RCAC, you can use the query that is shown in Example 2-1."}, {"self_ref": "#/texts/92", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "caption", "prov": [{"page_no": 8, "bbox": {"l": 136.8, "t": 305.44202, "r": 462.35419, "b": 297.117, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 74]}], "orig": "Example 2-1 Query to determine who has authority to define and manage RCAC", "text": "Example 2-1 Query to determine who has authority to define and manage RCAC"}, {"self_ref": "#/texts/93", "parent": {"cref": "#/groups/6"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 136.8, "t": 288.34198, "r": 171.26956, "b": 279.56719999999996, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 6]}], "orig": "SELECT", "text": "SELECT"}, {"self_ref": "#/texts/94", "parent": {"cref": "#/groups/6"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 182.75941, "t": 288.34198, "r": 251.69853, "b": 279.56719999999996, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 12]}], "orig": "function_id,", "text": "function_id,"}, {"self_ref": "#/texts/95", "parent": {"cref": "#/groups/6"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 166.78244, "t": 276.3421599999999, "r": 241.73852999999997, "b": 267.56737999999996, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 10]}], "orig": "user_name,", "text": "user_name,"}, {"self_ref": "#/texts/96", "parent": {"cref": "#/groups/6"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 170.75961, "t": 264.34235, "r": 221.69901999999996, "b": 255.56758000000002, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 6]}], "orig": "usage,", "text": "usage,"}, {"self_ref": "#/texts/97", "parent": {"cref": "#/groups/6"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 167.53809, "t": 252.34253, "r": 236.69878, "b": 243.56777999999997, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 9]}], "orig": "user_type", "text": "user_type"}, {"self_ref": "#/texts/98", "parent": {"cref": "#/groups/6"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 136.8, "t": 240.34272999999996, "r": 160.59396, "b": 231.56798000000003, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "FROM", "text": "FROM"}, {"self_ref": "#/texts/99", "parent": {"cref": "#/groups/6"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 178.43944, "t": 240.34272999999996, "r": 261.71829, "b": 231.56798000000003, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 14]}], "orig": "function_usage", "text": "function_usage"}, {"self_ref": "#/texts/100", "parent": {"cref": "#/groups/6"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 136.8, "t": 228.34293000000002, "r": 162.44176, "b": 219.56817999999998, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 5]}], "orig": "WHERE", "text": "WHERE"}, {"self_ref": "#/texts/101", "parent": {"cref": "#/groups/6"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 177.8268, "t": 228.34293000000002, "r": 331.67731, "b": 219.56817999999998, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 28]}], "orig": "function_id=\u2019QIBM_DB_SECADM\u2019", "text": "function_id=\u2019QIBM_DB_SECADM\u2019"}, {"self_ref": "#/texts/102", "parent": {"cref": "#/groups/6"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 136.8, "t": 216.34312, "r": 178.77542, "b": 207.56836999999996, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 8]}], "orig": "ORDER BY", "text": "ORDER BY"}, {"self_ref": "#/texts/103", "parent": {"cref": "#/groups/6"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 189.26929, "t": 216.34312, "r": 241.73856, "b": 207.56836999999996, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 10]}], "orig": "user_name;", "text": "user_name;"}, {"self_ref": "#/texts/104", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "section_header", "prov": [{"page_no": 8, "bbox": {"l": 64.800003, "t": 171.77936999999997, "r": 249.59605000000002, "b": 157.01637000000005, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 24]}], "orig": "2.2 Separation of duties", "text": "2.2 Separation of duties", "level": 1}, {"self_ref": "#/texts/105", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 8, "bbox": {"l": 136.8, "t": 139.45128, "r": 547.22345, "b": 82.23904400000004, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 463]}], "orig": "Separation of duties helps businesses comply with industry regulations or organizational requirements and simplifies the management of authorities. Separation of duties is commonly used to prevent fraudulent activities or errors by a single person. It provides the ability for administrative functions to be divided across individuals without overlapping responsibilities, so that one user does not possess unlimited authority, such as with the *ALLOBJ authority.", "text": "Separation of duties helps businesses comply with industry regulations or organizational requirements and simplifies the management of authorities. Separation of duties is commonly used to prevent fraudulent activities or errors by a single person. It provides the ability for administrative functions to be divided across individuals without overlapping responsibilities, so that one user does not possess unlimited authority, such as with the *ALLOBJ authority."}, {"self_ref": "#/texts/106", "parent": {"cref": "#/body"}, "children": [], "content_layer": "furniture", "label": "page_footer", "prov": [{"page_no": 8, "bbox": {"l": 64.800003, "t": 37.151279000000045, "r": 78.402, "b": 27.938279999999963, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "10", "text": "10"}, {"self_ref": "#/texts/107", "parent": {"cref": "#/body"}, "children": [], "content_layer": "furniture", "label": "page_footer", "prov": [{"page_no": 8, "bbox": {"l": 93.420303, "t": 36.461997999999994, "r": 334.42142, "b": 28.136998999999946, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 54]}], "orig": "Row and Column Access Control Support in IBM DB2 for i", "text": "Row and Column Access Control Support in IBM DB2 for i"}, {"self_ref": "#/texts/108", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 9, "bbox": {"l": 136.79959, "t": 720.49097, "r": 542.69434, "b": 651.27887, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 516]}], "orig": "For example, assume that a business has assigned the duty to manage security on IBM i to Theresa. Before release IBM i 7.2, to grant privileges, Theresa had to have the same privileges Theresa was granting to others. Therefore, to grant *USE privileges to the PAYROLL table, Theresa had to have *OBJMGT and *USE authority (or a higher level of authority, such as *ALLOBJ). This requirement allowed Theresa to access the data in the PAYROLL table even though Theresa's job description was only to manage its security.", "text": "For example, assume that a business has assigned the duty to manage security on IBM i to Theresa. Before release IBM i 7.2, to grant privileges, Theresa had to have the same privileges Theresa was granting to others. Therefore, to grant *USE privileges to the PAYROLL table, Theresa had to have *OBJMGT and *USE authority (or a higher level of authority, such as *ALLOBJ). This requirement allowed Theresa to access the data in the PAYROLL table even though Theresa's job description was only to manage its security."}, {"self_ref": "#/texts/109", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 9, "bbox": {"l": 136.79959, "t": 638.47229, "r": 547.30396, "b": 593.25983, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 285]}], "orig": "In IBM i 7.2, the QIBM_DB_SECADM function usage grants authorities, revokes authorities, changes ownership, or changes the primary group without giving access to the object or, in the case of a database table, to the data that is in the table or allowing other operations on the table.", "text": "In IBM i 7.2, the QIBM_DB_SECADM function usage grants authorities, revokes authorities, changes ownership, or changes the primary group without giving access to the object or, in the case of a database table, to the data that is in the table or allowing other operations on the table."}, {"self_ref": "#/texts/110", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 9, "bbox": {"l": 136.79959, "t": 580.51306, "r": 538.65076, "b": 559.30023, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 129]}], "orig": "QIBM_DB_SECADM function usage can be granted only by a user with *SECADM special authority and can be given to a user or a group.", "text": "QIBM_DB_SECADM function usage can be granted only by a user with *SECADM special authority and can be given to a user or a group."}, {"self_ref": "#/texts/111", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 9, "bbox": {"l": 136.79959, "t": 546.49365, "r": 545.79602, "b": 513.28101, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 204]}], "orig": "QIBM_DB_SECADM also is responsible for administering RCAC, which restricts which rows a user is allowed to access in a table and whether a user is allowed to see information in certain columns of a table.", "text": "QIBM_DB_SECADM also is responsible for administering RCAC, which restricts which rows a user is allowed to access in a table and whether a user is allowed to see information in certain columns of a table."}, {"self_ref": "#/texts/112", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 9, "bbox": {"l": 136.79959, "t": 500.47443, "r": 539.80713, "b": 455.26199, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 285]}], "orig": "A preferred practice is that the RCAC administrator has the QIBM_DB_SECADM function usage ID, but absolutely no other data privileges. The result is that the RCAC administrator can deploy and maintain the RCAC constructs, but cannot grant themselves unauthorized access to data itself.", "text": "A preferred practice is that the RCAC administrator has the QIBM_DB_SECADM function usage ID, but absolutely no other data privileges. The result is that the RCAC administrator can deploy and maintain the RCAC constructs, but cannot grant themselves unauthorized access to data itself."}, {"self_ref": "#/texts/113", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 9, "bbox": {"l": 136.79959, "t": 442.51517, "r": 543.06714, "b": 421.30236999999994, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 136]}], "orig": "Table 2-2 shows a comparison of the different function usage IDs and *JOBCTL authority to the different CL commands and DB2 for i tools.", "text": "Table 2-2 shows a comparison of the different function usage IDs and *JOBCTL authority to the different CL commands and DB2 for i tools."}, {"self_ref": "#/texts/114", "parent": {"cref": "#/tables/2"}, "children": [], "content_layer": "body", "label": "caption", "prov": [{"page_no": 9, "bbox": {"l": 64.800003, "t": 408.4620100000001, "r": 391.75464, "b": 400.13699, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 78]}], "orig": "Table 2-2 Comparison of the different function usage IDs and *JOBCTL authority", "text": "Table 2-2 Comparison of the different function usage IDs and *JOBCTL authority"}, {"self_ref": "#/texts/115", "parent": {"cref": "#/body"}, "children": [], "content_layer": "furniture", "label": "page_footer", "prov": [{"page_no": 9, "bbox": {"l": 355.32001, "t": 36.461997999999994, "r": 523.54071, "b": 28.136998999999946, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 41]}], "orig": "Chapter 2. Roles and separation of duties", "text": "Chapter 2. Roles and separation of duties"}, {"self_ref": "#/texts/116", "parent": {"cref": "#/body"}, "children": [], "content_layer": "furniture", "label": "page_footer", "prov": [{"page_no": 9, "bbox": {"l": 536.09998, "t": 37.151279000000045, "r": 547.25916, "b": 27.938279999999963, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "11", "text": "11"}, {"self_ref": "#/texts/117", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "caption", "prov": [{"page_no": 10, "bbox": {"l": 136.79956, "t": 720.49097, "r": 528.73059, "b": 699.27814, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 135]}], "orig": "The SQL CREATE PERMISSION statement that is shown in Figure 3-1 is used to define and initially enable or disable the row access rules.", "text": "The SQL CREATE PERMISSION statement that is shown in Figure 3-1 is used to define and initially enable or disable the row access rules."}, {"self_ref": "#/texts/118", "parent": {"cref": "#/pictures/8"}, "children": [], "content_layer": "body", "label": "caption", "prov": [{"page_no": 10, "bbox": {"l": 136.8, "t": 377.862, "r": 341.97659, "b": 369.53699, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 42]}], "orig": "Figure 3-1 CREATE PERMISSION SQL statement", "text": "Figure 3-1 CREATE PERMISSION SQL statement"}, {"self_ref": "#/texts/119", "parent": {"cref": "#/pictures/8"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 148.1337, "t": 652.32031, "r": 246.7961, "b": 642.49017, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 17]}], "orig": "CREATE PERMISSION", "text": "CREATE PERMISSION"}, {"self_ref": "#/texts/120", "parent": {"cref": "#/pictures/8"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 251.86685, "t": 652.32031, "r": 257.58578, "b": 642.50165, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "<", "text": "<"}, {"self_ref": "#/texts/121", "parent": {"cref": "#/pictures/8"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 257.59152, "t": 652.32031, "r": 336.99741, "b": 642.49017, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 15]}], "orig": "permission name", "text": "permission name"}, {"self_ref": "#/texts/122", "parent": {"cref": "#/pictures/8"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 337.01233, "t": 652.32031, "r": 342.73126, "b": 642.50165, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": ">", "text": ">"}, {"self_ref": "#/texts/123", "parent": {"cref": "#/pictures/8"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 346.56491, "t": 670.53748, "r": 530.74371, "b": 662.66492, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 47]}], "orig": "Names the row permission for row access control", "text": "Names the row permission for row access control"}, {"self_ref": "#/texts/124", "parent": {"cref": "#/pictures/8"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 148.1337, "t": 610.93744, "r": 163.45079, "b": 601.1073, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "ON", "text": "ON"}, {"self_ref": "#/texts/125", "parent": {"cref": "#/pictures/8"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 168.58405, "t": 610.93744, "r": 174.30298, "b": 601.11877, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "<", "text": "<"}, {"self_ref": "#/texts/126", "parent": {"cref": "#/pictures/8"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 174.30872, "t": 610.93744, "r": 226.86777, "b": 601.1073, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 10]}], "orig": "table name", "text": "table name"}, {"self_ref": "#/texts/127", "parent": {"cref": "#/pictures/8"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 226.86548000000002, "t": 610.93744, "r": 232.58441, "b": 601.11877, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": ">", "text": ">"}, {"self_ref": "#/texts/128", "parent": {"cref": "#/pictures/8"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 311.3204, "t": 625.70587, "r": 450.77191000000005, "b": 617.83331, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 37]}], "orig": "Identifies the table on which the row", "text": "Identifies the table on which the row"}, {"self_ref": "#/texts/129", "parent": {"cref": "#/pictures/8"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 450.86123999999995, "t": 625.70587, "r": 529.93134, "b": 617.83331, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 21]}], "orig": "permission is created", "text": "permission is created"}, {"self_ref": "#/texts/130", "parent": {"cref": "#/pictures/8"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 148.1337, "t": 569.5545, "r": 163.10973, "b": 559.72437, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "AS", "text": "AS"}, {"self_ref": "#/texts/131", "parent": {"cref": "#/pictures/8"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 165.68669, "t": 569.5545, "r": 171.40562, "b": 559.73584, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "<", "text": "<"}, {"self_ref": "#/texts/132", "parent": {"cref": "#/pictures/8"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 171.41136, "t": 569.5545, "r": 251.20424000000003, "b": 559.72437, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 16]}], "orig": "correlation name", "text": "correlation name"}, {"self_ref": "#/texts/133", "parent": {"cref": "#/pictures/8"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 251.21115, "t": 569.5545, "r": 256.93008, "b": 559.73584, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": ">", "text": ">"}, {"self_ref": "#/texts/134", "parent": {"cref": "#/pictures/8"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 235.79649, "t": 587.77161, "r": 406.62051, "b": 579.89905, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 46]}], "orig": "Specifies an optional correlation name that ca", "text": "Specifies an optional correlation name that ca"}, {"self_ref": "#/texts/135", "parent": {"cref": "#/pictures/8"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 480.53094, "t": 587.77161, "r": 532.89496, "b": 579.89905, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 31]}], "orig": "be used within search-condition", "text": "be used within search-condition"}, {"self_ref": "#/texts/136", "parent": {"cref": "#/pictures/8"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 148.1337, "t": 528.17163, "r": 199.72467, "b": 518.34149, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 8]}], "orig": "FOR ROWS", "text": "FOR ROWS"}, {"self_ref": "#/texts/137", "parent": {"cref": "#/pictures/8"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 321.56271, "t": 545.90588, "r": 455.3432, "b": 538.03333, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 37]}], "orig": "Indicates that a row permission is cr", "text": "Indicates that a row permission is cr"}, {"self_ref": "#/texts/138", "parent": {"cref": "#/pictures/8"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 455.20786000000004, "t": 545.90588, "r": 476.48404, "b": 538.03333, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 5]}], "orig": "eated", "text": "eated"}, {"self_ref": "#/texts/139", "parent": {"cref": "#/pictures/8"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 321.5972, "t": 525.69733, "r": 444.0292400000001, "b": 517.82477, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 33]}], "orig": "Specifies a condition that can be", "text": "Specifies a condition that can be"}, {"self_ref": "#/texts/140", "parent": {"cref": "#/pictures/8"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 444.07986, "t": 525.69733, "r": 459.08678999999995, "b": 517.82477, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 5]}], "orig": "true,", "text": "true,"}, {"self_ref": "#/texts/141", "parent": {"cref": "#/pictures/8"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 464.2088, "t": 525.69733, "r": 530.94897, "b": 517.82477, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 17]}], "orig": "false, or unknown", "text": "false, or unknown"}, {"self_ref": "#/texts/142", "parent": {"cref": "#/pictures/8"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 148.1337, "t": 500.58292, "r": 183.42342, "b": 490.75278, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 5]}], "orig": "WHERE", "text": "WHERE"}, {"self_ref": "#/texts/143", "parent": {"cref": "#/pictures/8"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 188.61984, "t": 500.58292, "r": 194.33878, "b": 490.76428, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "<", "text": "<"}, {"self_ref": "#/texts/144", "parent": {"cref": "#/pictures/8"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 194.34451, "t": 500.58292, "r": 437.04659999999996, "b": 490.75278, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 52]}], "orig": "logic to test: user and/or group and/or column value", "text": "logic to test: user and/or group and/or column value"}, {"self_ref": "#/texts/145", "parent": {"cref": "#/pictures/8"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 437.09020999999996, "t": 500.58292, "r": 442.80914000000007, "b": 490.76428, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": ">", "text": ">"}, {"self_ref": "#/texts/146", "parent": {"cref": "#/pictures/8"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 148.1337, "t": 459.20001, "r": 278.77805, "b": 449.36987, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 23]}], "orig": "ENFORCED FOR ALL ACCESS", "text": "ENFORCED FOR ALL ACCESS"}, {"self_ref": "#/texts/147", "parent": {"cref": "#/pictures/8"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 271.55829, "t": 477.41724, "r": 457.4451, "b": 469.54465, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 52]}], "orig": "Specifies that the row permission applies to all ref", "text": "Specifies that the row permission applies to all ref"}, {"self_ref": "#/texts/148", "parent": {"cref": "#/pictures/8"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 457.19281, "t": 477.41724, "r": 531.74939, "b": 469.54465, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 20]}], "orig": "erences of the table", "text": "erences of the table"}, {"self_ref": "#/texts/149", "parent": {"cref": "#/pictures/8"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 148.1337, "t": 417.81711, "r": 185.17584, "b": 407.98697000000004, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 6]}], "orig": "ENABLE", "text": "ENABLE"}, {"self_ref": "#/texts/150", "parent": {"cref": "#/pictures/8"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 312.28601, "t": 436.03423999999995, "r": 454.33505, "b": 428.16165, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 39]}], "orig": "Specifies that the row permission is to", "text": "Specifies that the row permission is to"}, {"self_ref": "#/texts/151", "parent": {"cref": "#/pictures/8"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 454.3461, "t": 436.03423999999995, "r": 527.05286, "b": 428.16165, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 20]}], "orig": "be initially enabled", "text": "be initially enabled"}, {"self_ref": "#/texts/152", "parent": {"cref": "#/pictures/8"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 311.73431, "t": 415.34283, "r": 315.94684, "b": 407.47025, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "S", "text": "S"}, {"self_ref": "#/texts/153", "parent": {"cref": "#/pictures/8"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 329.28326, "t": 415.34283, "r": 371.71786, "b": 407.47025, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 10]}], "orig": "ifith t th", "text": "ifith t th"}, {"self_ref": "#/texts/154", "parent": {"cref": "#/pictures/8"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 415.0014, "t": 415.34283, "r": 417.09616, "b": 407.47025, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "i", "text": "i"}, {"self_ref": "#/texts/155", "parent": {"cref": "#/pictures/8"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 424.27356, "t": 415.34283, "r": 426.36832, "b": 407.47025, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "i", "text": "i"}, {"self_ref": "#/texts/156", "parent": {"cref": "#/pictures/8"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 438.13208, "t": 415.34283, "r": 440.2268399999999, "b": 407.47025, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "i", "text": "i"}, {"self_ref": "#/texts/157", "parent": {"cref": "#/pictures/8"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 445.88681, "t": 415.34283, "r": 448.95757999999995, "b": 407.47025, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "t", "text": "t"}, {"self_ref": "#/texts/158", "parent": {"cref": "#/pictures/8"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 455.8532400000001, "t": 415.34283, "r": 460.67346000000003, "b": 407.47025, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "b", "text": "b"}, {"self_ref": "#/texts/159", "parent": {"cref": "#/pictures/8"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 467.36746, "t": 415.34283, "r": 470.06998000000004, "b": 407.47025, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "i", "text": "i"}, {"self_ref": "#/texts/160", "parent": {"cref": "#/pictures/8"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 472.73705999999993, "t": 415.34283, "r": 490.1676, "b": 407.47025, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 6]}], "orig": "iti ll", "text": "iti ll"}, {"self_ref": "#/texts/161", "parent": {"cref": "#/pictures/8"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 496.33661, "t": 415.34283, "r": 503.2608, "b": 407.47025, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "di", "text": "di"}, {"self_ref": "#/texts/162", "parent": {"cref": "#/pictures/8"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 511.26138, "t": 415.34283, "r": 527.59674, "b": 407.47025, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "bl d", "text": "bl d"}, {"self_ref": "#/texts/163", "parent": {"cref": "#/pictures/8"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 148.1337, "t": 404.0228, "r": 187.6265, "b": 394.19265999999993, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 7]}], "orig": "DISABLE", "text": "DISABLE"}, {"self_ref": "#/texts/164", "parent": {"cref": "#/pictures/8"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 187.58514, "t": 404.0228, "r": 190.6628, "b": 394.20416000000006, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": ";", "text": ";"}, {"self_ref": "#/texts/165", "parent": {"cref": "#/pictures/8"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 311.73431, "t": 415.34283, "r": 455.83047000000005, "b": 407.47025, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 39]}], "orig": "Specifies that the row permission is to", "text": "Specifies that the row permission is to"}, {"self_ref": "#/texts/166", "parent": {"cref": "#/pictures/8"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 455.8848, "t": 415.34283, "r": 527.62122, "b": 407.47025, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 21]}], "orig": "be initially disabled", "text": "be initially disabled"}, {"self_ref": "#/texts/167", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "section_header", "prov": [{"page_no": 10, "bbox": {"l": 136.8, "t": 352.05600000000004, "r": 215.37601, "b": 340.95599, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 11]}], "orig": "Column mask", "text": "Column mask", "level": 1}, {"self_ref": "#/texts/168", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 10, "bbox": {"l": 136.8, "t": 336.91128999999995, "r": 542.76648, "b": 291.69885, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 297]}], "orig": "A column mask is a database object that manifests a column value access control rule for a specific column in a specific table. It uses a CASE expression that describes what you see when you access the column. For example, a teller can see only the last four digits of a tax identification number.", "text": "A column mask is a database object that manifests a column value access control rule for a specific column in a specific table. It uses a CASE expression that describes what you see when you access the column. For example, a teller can see only the last four digits of a tax identification number."}, {"self_ref": "#/texts/169", "parent": {"cref": "#/body"}, "children": [], "content_layer": "furniture", "label": "page_footer", "prov": [{"page_no": 10, "bbox": {"l": 344.94, "t": 36.461997999999994, "r": 523.60162, "b": 28.136998999999946, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 40]}], "orig": "Chapter 3. Row and Column Access Control", "text": "Chapter 3. Row and Column Access Control"}, {"self_ref": "#/texts/170", "parent": {"cref": "#/body"}, "children": [], "content_layer": "furniture", "label": "page_footer", "prov": [{"page_no": 10, "bbox": {"l": 536.09998, "t": 37.151279000000045, "r": 547.25916, "b": 27.938279999999963, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "15", "text": "15"}, {"self_ref": "#/texts/171", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "caption", "prov": [{"page_no": 11, "bbox": {"l": 136.79959, "t": 720.49097, "r": 412.20758, "b": 711.2779500000001, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 62]}], "orig": "Table 3-1 summarizes these special registers and their values.", "text": "Table 3-1 summarizes these special registers and their values."}, {"self_ref": "#/texts/172", "parent": {"cref": "#/tables/3"}, "children": [], "content_layer": "body", "label": "caption", "prov": [{"page_no": 11, "bbox": {"l": 136.8, "t": 698.50195, "r": 372.60364, "b": 690.177, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 58]}], "orig": "Table 3-1 Special registers and their corresponding values", "text": "Table 3-1 Special registers and their corresponding values"}, {"self_ref": "#/texts/173", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 11, "bbox": {"l": 136.8, "t": 577.51129, "r": 538.4939, "b": 556.29846, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 97]}], "orig": "Figure 3-5 shows the difference in the special register values when an adopted authority is used:", "text": "Figure 3-5 shows the difference in the special register values when an adopted authority is used:"}, {"self_ref": "#/texts/174", "parent": {"cref": "#/groups/7"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 11, "bbox": {"l": 136.8, "t": 548.47192, "r": 411.36139, "b": 539.25891, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 75]}], "orig": "GLYPH<SM590000> A user connects to the server using the user profile ALICE.", "text": "GLYPH<SM590000> A user connects to the server using the user profile ALICE.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/175", "parent": {"cref": "#/groups/7"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 11, "bbox": {"l": 136.8, "t": 531.49213, "r": 453.2580899999999, "b": 522.27911, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 77]}], "orig": "GLYPH<SM590000> USER and CURRENT USER initially have the same value of ALICE.", "text": "GLYPH<SM590000> USER and CURRENT USER initially have the same value of ALICE.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/176", "parent": {"cref": "#/groups/7"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 11, "bbox": {"l": 136.8, "t": 514.51233, "r": 541.44983, "b": 493.2995, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 160]}], "orig": "GLYPH<SM590000> ALICE calls an SQL procedure that is named proc1, which is owned by user profile JOE and was created to adopt JOE's authority when it is called.", "text": "GLYPH<SM590000> ALICE calls an SQL procedure that is named proc1, which is owned by user profile JOE and was created to adopt JOE's authority when it is called.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/177", "parent": {"cref": "#/groups/7"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 11, "bbox": {"l": 136.8, "t": 485.4729, "r": 547.21674, "b": 452.26028, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 253]}], "orig": "GLYPH<SM590000> While the procedure is running, the special register USER still contains the value of ALICE because it excludes any adopted authority. The special register CURRENT USER contains the value of JOE because it includes any adopted authority.", "text": "GLYPH<SM590000> While the procedure is running, the special register USER still contains the value of ALICE because it excludes any adopted authority. The special register CURRENT USER contains the value of JOE because it includes any adopted authority.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/178", "parent": {"cref": "#/groups/7"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 11, "bbox": {"l": 136.80101, "t": 444.49347, "r": 547.35406, "b": 423.28066999999993, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 133]}], "orig": "GLYPH<SM590000> When proc1 ends, the session reverts to its original state with both USER and CURRENT USER having the value of ALICE.", "text": "GLYPH<SM590000> When proc1 ends, the session reverts to its original state with both USER and CURRENT USER having the value of ALICE.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/179", "parent": {"cref": "#/pictures/9"}, "children": [], "content_layer": "body", "label": "caption", "prov": [{"page_no": 11, "bbox": {"l": 136.8, "t": 195.2821, "r": 341.25662, "b": 186.95709, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 50]}], "orig": "Figure 3-5 Special registers and adopted authority", "text": "Figure 3-5 Special registers and adopted authority"}, {"self_ref": "#/texts/180", "parent": {"cref": "#/pictures/9"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 11, "bbox": {"l": 140.7323, "t": 405.01547, "r": 218.71170000000004, "b": 396.50473, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 34]}], "orig": "SignedonasALICE Signed on as ALICE", "text": "SignedonasALICE Signed on as ALICE"}, {"self_ref": "#/texts/181", "parent": {"cref": "#/pictures/9"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 11, "bbox": {"l": 138.476, "t": 381.12558000000007, "r": 191.70256, "b": 372.61484, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 12]}], "orig": "USER = ALICE", "text": "USER = ALICE"}, {"self_ref": "#/texts/182", "parent": {"cref": "#/pictures/9"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 11, "bbox": {"l": 138.476, "t": 369.18066, "r": 232.56117, "b": 360.66992, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 20]}], "orig": "CURRENT USER = ALICE", "text": "CURRENT USER = ALICE"}, {"self_ref": "#/texts/183", "parent": {"cref": "#/pictures/9"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 11, "bbox": {"l": 138.476, "t": 345.29076999999995, "r": 183.26944, "b": 336.78003, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 10]}], "orig": "CALL proc1", "text": "CALL proc1"}, {"self_ref": "#/texts/184", "parent": {"cref": "#/pictures/9"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 11, "bbox": {"l": 148.4301, "t": 318.41476, "r": 184.17328, "b": 309.90402, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 9]}], "orig": "P1 Proc1:", "text": "P1 Proc1:"}, {"self_ref": "#/texts/185", "parent": {"cref": "#/pictures/9"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 11, "bbox": {"l": 157.52185, "t": 306.46985, "r": 209.103, "b": 297.95911, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 11]}], "orig": "Owner = JOE", "text": "Owner = JOE"}, {"self_ref": "#/texts/186", "parent": {"cref": "#/pictures/9"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 11, "bbox": {"l": 157.52185, "t": 294.52493, "r": 281.68927, "b": 286.01419, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 24]}], "orig": "SET OPTION USRPRF=*OWNER", "text": "SET OPTION USRPRF=*OWNER"}, {"self_ref": "#/texts/187", "parent": {"cref": "#/pictures/9"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 11, "bbox": {"l": 148.4301, "t": 270.63507000000004, "r": 201.65666, "b": 262.12433, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 12]}], "orig": "USER = ALICE", "text": "USER = ALICE"}, {"self_ref": "#/texts/188", "parent": {"cref": "#/pictures/9"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 11, "bbox": {"l": 148.4301, "t": 258.69016, "r": 234.57686999999999, "b": 250.17940999999996, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 18]}], "orig": "CURRENT USER = JOE", "text": "CURRENT USER = JOE"}, {"self_ref": "#/texts/189", "parent": {"cref": "#/pictures/9"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 11, "bbox": {"l": 138.476, "t": 225.84158000000002, "r": 232.56117, "b": 205.38590999999997, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 33]}], "orig": "USER = ALICE CURRENT USER = ALICE", "text": "USER = ALICE CURRENT USER = ALICE"}, {"self_ref": "#/texts/190", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "section_header", "prov": [{"page_no": 11, "bbox": {"l": 64.800003, "t": 166.44528000000003, "r": 247.02536, "b": 154.45727999999997, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 31]}], "orig": "3.2.2 Built-in global variables", "text": "3.2.2 Built-in global variables", "level": 1}, {"self_ref": "#/texts/191", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 11, "bbox": {"l": 136.8, "t": 140.29128000000003, "r": 518.00116, "b": 119.07847000000004, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 161]}], "orig": "Built-in global variables are provided with the database manager and are used in SQL statements to retrieve scalar values that are associated with the variables.", "text": "Built-in global variables are provided with the database manager and are used in SQL statements to retrieve scalar values that are associated with the variables."}, {"self_ref": "#/texts/192", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 11, "bbox": {"l": 136.8, "t": 106.27189999999996, "r": 532.3385, "b": 73.05927999999994, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 233]}], "orig": "IBM DB2 for i supports nine different built-in global variables that are read only and maintained by the system. These global variables can be used to identify attributes of the database connection and used as part of the RCAC logic.", "text": "IBM DB2 for i supports nine different built-in global variables that are read only and maintained by the system. These global variables can be used to identify attributes of the database connection and used as part of the RCAC logic."}, {"self_ref": "#/texts/193", "parent": {"cref": "#/body"}, "children": [], "content_layer": "furniture", "label": "page_footer", "prov": [{"page_no": 11, "bbox": {"l": 344.94, "t": 36.461997999999994, "r": 523.60162, "b": 28.136998999999946, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 40]}], "orig": "Chapter 3. Row and Column Access Control", "text": "Chapter 3. Row and Column Access Control"}, {"self_ref": "#/texts/194", "parent": {"cref": "#/body"}, "children": [], "content_layer": "furniture", "label": "page_footer", "prov": [{"page_no": 11, "bbox": {"l": 536.09998, "t": 37.151279000000045, "r": 547.25916, "b": 27.938279999999963, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "19", "text": "19"}, {"self_ref": "#/texts/195", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 136.8, "t": 720.49133, "r": 342.54773, "b": 711.27832, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 51]}], "orig": "Table 3-2 lists the nine built-in global variables.", "text": "Table 3-2 lists the nine built-in global variables."}, {"self_ref": "#/texts/196", "parent": {"cref": "#/tables/4"}, "children": [], "content_layer": "body", "label": "caption", "prov": [{"page_no": 12, "bbox": {"l": 64.800003, "t": 698.50195, "r": 201.18147, "b": 690.177, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 35]}], "orig": "Table 3-2 Built-in global variables", "text": "Table 3-2 Built-in global variables"}, {"self_ref": "#/texts/197", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "section_header", "prov": [{"page_no": 12, "bbox": {"l": 64.800003, "t": 469.79929, "r": 384.36389, "b": 455.03628999999995, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 34]}], "orig": "3.3 VERIFY_GROUP_FOR_USER function", "text": "3.3 VERIFY_GROUP_FOR_USER function", "level": 1}, {"self_ref": "#/texts/198", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 136.8, "t": 437.47128, "r": 547.23474, "b": 356.25939999999997, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 576]}], "orig": "The VERIFY_GROUP_FOR_USER function was added in IBM i 7.2. Although it is primarily intended for use with RCAC permissions and masks, it can be used in other SQL statements. The first parameter must be one of these three special registers: SESSION_USER, USER, or CURRENT_USER. The second and subsequent parameters are a list of user or group profiles. Each of these values must be 1 - 10 characters in length. These values are not validated for their existence, which means that you can specify the names of user profiles that do not exist without receiving any kind of error.", "text": "The VERIFY_GROUP_FOR_USER function was added in IBM i 7.2. Although it is primarily intended for use with RCAC permissions and masks, it can be used in other SQL statements. The first parameter must be one of these three special registers: SESSION_USER, USER, or CURRENT_USER. The second and subsequent parameters are a list of user or group profiles. Each of these values must be 1 - 10 characters in length. These values are not validated for their existence, which means that you can specify the names of user profiles that do not exist without receiving any kind of error."}, {"self_ref": "#/texts/199", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 136.80002, "t": 343.51257, "r": 547.25739, "b": 310.29996, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 235]}], "orig": "If a special register value is in the list of user profiles or it is a member of a group profile included in the list, the function returns a long integer value of 1. Otherwise, it returns a value of 0. It never returns the null value.", "text": "If a special register value is in the list of user profiles or it is a member of a group profile included in the list, the function returns a long integer value of 1. Otherwise, it returns a value of 0. It never returns the null value."}, {"self_ref": "#/texts/200", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 12, "bbox": {"l": 136.80002, "t": 297.49338, "r": 458.44525000000004, "b": 288.2804, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 63]}], "orig": "Here is an example of using the VERIFY_GROUP_FOR_USER function:", "text": "Here is an example of using the VERIFY_GROUP_FOR_USER function:"}, {"self_ref": "#/texts/201", "parent": {"cref": "#/groups/8"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 12, "bbox": {"l": 136.80002, "t": 280.4538, "r": 406.07751, "b": 271.24081, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 57]}], "orig": "1. There are user profiles for MGR, JANE, JUDY, and TONY.", "text": "1. There are user profiles for MGR, JANE, JUDY, and TONY.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/202", "parent": {"cref": "#/groups/8"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 12, "bbox": {"l": 136.80002, "t": 263.47399999999993, "r": 396.98816, "b": 254.26099999999997, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 58]}], "orig": "2. The user profile JANE specifies a group profile of MGR.", "text": "2. The user profile JANE specifies a group profile of MGR.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/203", "parent": {"cref": "#/groups/8"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 12, "bbox": {"l": 136.80002, "t": 246.49419, "r": 536.5686, "b": 225.28139, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 127]}], "orig": "3. If a user is connected to the server using user profile JANE, all of the following function invocations return a value of 1:", "text": "3. If a user is connected to the server using user profile JANE, all of the following function invocations return a value of 1:", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/204", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "code", "prov": [{"page_no": 12, "bbox": {"l": 151.20018, "t": 217.30542000000003, "r": 451.01605, "b": 150.57143999999994, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 265]}], "orig": "VERIFY_GROUP_FOR_USER (CURRENT_USER, 'MGR') VERIFY_GROUP_FOR_USER (CURRENT_USER, 'JANE', 'MGR') VERIFY_GROUP_FOR_USER (CURRENT_USER, 'JANE', 'MGR', 'STEVE') The following function invocation returns a value of 0: VERIFY_GROUP_FOR_USER (CURRENT_USER, 'JUDY', 'TONY')", "text": "VERIFY_GROUP_FOR_USER (CURRENT_USER, 'MGR') VERIFY_GROUP_FOR_USER (CURRENT_USER, 'JANE', 'MGR') VERIFY_GROUP_FOR_USER (CURRENT_USER, 'JANE', 'MGR', 'STEVE') The following function invocation returns a value of 0: VERIFY_GROUP_FOR_USER (CURRENT_USER, 'JUDY', 'TONY')", "captions": [], "references": [], "footnotes": [], "image": null, "code_language": "unknown"}, {"self_ref": "#/texts/205", "parent": {"cref": "#/body"}, "children": [], "content_layer": "furniture", "label": "page_footer", "prov": [{"page_no": 12, "bbox": {"l": 64.800003, "t": 37.151279000000045, "r": 78.402, "b": 27.938279999999963, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "20", "text": "20"}, {"self_ref": "#/texts/206", "parent": {"cref": "#/body"}, "children": [], "content_layer": "furniture", "label": "page_footer", "prov": [{"page_no": 12, "bbox": {"l": 93.420303, "t": 36.461997999999994, "r": 334.42142, "b": 28.136998999999946, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 54]}], "orig": "Row and Column Access Control Support in IBM DB2 for i", "text": "Row and Column Access Control Support in IBM DB2 for i"}, {"self_ref": "#/texts/207", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 13, "bbox": {"l": 136.79959, "t": 720.34155, "r": 166.73935, "b": 711.56677, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 6]}], "orig": "RETURN", "text": "RETURN"}, {"self_ref": "#/texts/208", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 13, "bbox": {"l": 136.79959, "t": 708.34174, "r": 156.77934, "b": 699.56696, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 4]}], "orig": "CASE", "text": "CASE"}, {"self_ref": "#/texts/209", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "code", "prov": [{"page_no": 13, "bbox": {"l": 136.79959, "t": 696.3419199999998, "r": 521.57428, "b": 531.56952, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 437]}], "orig": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'HR', 'EMP' ) = 1 THEN EMPLOYEES . DATE_OF_BIRTH WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1 AND SESSION_USER = EMPLOYEES . USER_ID THEN EMPLOYEES . DATE_OF_BIRTH WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1 AND SESSION_USER <> EMPLOYEES . USER_ID THEN ( 9999 || '-' || MONTH ( EMPLOYEES . DATE_OF_BIRTH ) || '-' || DAY (EMPLOYEES.DATE_OF_BIRTH )) ELSE NULL END ENABLE ;", "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'HR', 'EMP' ) = 1 THEN EMPLOYEES . DATE_OF_BIRTH WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1 AND SESSION_USER = EMPLOYEES . USER_ID THEN EMPLOYEES . DATE_OF_BIRTH WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1 AND SESSION_USER <> EMPLOYEES . USER_ID THEN ( 9999 || '-' || MONTH ( EMPLOYEES . DATE_OF_BIRTH ) || '-' || DAY (EMPLOYEES.DATE_OF_BIRTH )) ELSE NULL END ENABLE ;", "captions": [], "references": [], "footnotes": [], "image": null, "code_language": "unknown"}, {"self_ref": "#/texts/210", "parent": {"cref": "#/groups/9"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 13, "bbox": {"l": 136.79959, "t": 516.49408, "r": 547.21222, "b": 495.28128000000004, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 136]}], "orig": "2. The other column to mask in this example is the TAX_ID information. In this example, the rules to enforce include the following ones:", "text": "2. The other column to mask in this example is the TAX_ID information. In this example, the rules to enforce include the following ones:", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/211", "parent": {"cref": "#/groups/9"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 13, "bbox": {"l": 152.0394, "t": 487.51446999999996, "r": 469.1528, "b": 478.30147999999997, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 62]}], "orig": "-Human Resources can see the unmasked TAX_ID of the employees.", "text": "-Human Resources can see the unmasked TAX_ID of the employees.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/212", "parent": {"cref": "#/groups/9"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 13, "bbox": {"l": 152.0394, "t": 470.47488, "r": 403.95953, "b": 461.2619, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 50]}], "orig": "-Employees can see only their own unmasked TAX_ID.", "text": "-Employees can see only their own unmasked TAX_ID.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/213", "parent": {"cref": "#/groups/9"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 13, "bbox": {"l": 152.0394, "t": 453.49509, "r": 545.16846, "b": 432.28229, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 129]}], "orig": "-Managers see a masked version of TAX_ID with the first five characters replaced with the X character (for example, XXX-XX-1234).", "text": "-Managers see a masked version of TAX_ID with the first five characters replaced with the X character (for example, XXX-XX-1234).", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/214", "parent": {"cref": "#/groups/9"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 13, "bbox": {"l": 152.0394, "t": 424.51547, "r": 529.46362, "b": 415.3024899999999, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 77]}], "orig": "-Any other person sees the entire TAX_ID as masked, for example, XXX-XX-XXXX.", "text": "-Any other person sees the entire TAX_ID as masked, for example, XXX-XX-XXXX.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/215", "parent": {"cref": "#/groups/9"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 13, "bbox": {"l": 151.19978, "t": 407.47589, "r": 530.0603, "b": 398.26291, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 82]}], "orig": "To implement this column mask, run the SQL statement that is shown in Example 3-9.", "text": "To implement this column mask, run the SQL statement that is shown in Example 3-9.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/216", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/217"}], "content_layer": "body", "label": "code", "prov": [{"page_no": 13, "bbox": {"l": 136.8, "t": 368.32189999999997, "r": 526.55469, "b": 107.55115999999998, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 590]}], "orig": "CREATE MASK HR_SCHEMA.MASK_TAX_ID_ON_EMPLOYEES ON HR_SCHEMA.EMPLOYEES AS EMPLOYEES FOR COLUMN TAX_ID RETURN CASE WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'HR' ) = 1 THEN EMPLOYEES . TAX_ID WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1 AND SESSION_USER = EMPLOYEES . USER_ID THEN EMPLOYEES . TAX_ID WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1 AND SESSION_USER <> EMPLOYEES . USER_ID THEN ( 'XXX-XX-' CONCAT QSYS2 . SUBSTR ( EMPLOYEES . TAX_ID , 8 , 4 ) ) WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'EMP' ) = 1 THEN EMPLOYEES . TAX_ID ELSE 'XXX-XX-XXXX' END ENABLE ;", "text": "CREATE MASK HR_SCHEMA.MASK_TAX_ID_ON_EMPLOYEES ON HR_SCHEMA.EMPLOYEES AS EMPLOYEES FOR COLUMN TAX_ID RETURN CASE WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'HR' ) = 1 THEN EMPLOYEES . TAX_ID WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1 AND SESSION_USER = EMPLOYEES . USER_ID THEN EMPLOYEES . TAX_ID WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1 AND SESSION_USER <> EMPLOYEES . USER_ID THEN ( 'XXX-XX-' CONCAT QSYS2 . SUBSTR ( EMPLOYEES . TAX_ID , 8 , 4 ) ) WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'EMP' ) = 1 THEN EMPLOYEES . TAX_ID ELSE 'XXX-XX-XXXX' END ENABLE ;", "captions": [{"cref": "#/texts/217"}], "references": [], "footnotes": [], "image": null, "code_language": "unknown"}, {"self_ref": "#/texts/217", "parent": {"cref": "#/texts/216"}, "children": [], "content_layer": "body", "label": "caption", "prov": [{"page_no": 13, "bbox": {"l": 136.8, "t": 385.48199, "r": 351.9873, "b": 377.15698, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 48]}], "orig": "Example 3-9 Creating a mask on the TAX_ID column", "text": "Example 3-9 Creating a mask on the TAX_ID column"}, {"self_ref": "#/texts/218", "parent": {"cref": "#/body"}, "children": [], "content_layer": "furniture", "label": "page_footer", "prov": [{"page_no": 13, "bbox": {"l": 344.94, "t": 36.461997999999994, "r": 523.60162, "b": 28.136998999999946, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 40]}], "orig": "Chapter 3. Row and Column Access Control", "text": "Chapter 3. Row and Column Access Control"}, {"self_ref": "#/texts/219", "parent": {"cref": "#/body"}, "children": [], "content_layer": "furniture", "label": "page_footer", "prov": [{"page_no": 13, "bbox": {"l": 536.09998, "t": 37.151279000000045, "r": 547.25916, "b": 27.938279999999963, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "27", "text": "27"}, {"self_ref": "#/texts/220", "parent": {"cref": "#/groups/10"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 14, "bbox": {"l": 136.8, "t": 720.49133, "r": 449.9523899999999, "b": 711.27832, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 65]}], "orig": "3. Figure 3-10 shows the masks that are created in the HR_SCHEMA.", "text": "3. Figure 3-10 shows the masks that are created in the HR_SCHEMA.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/221", "parent": {"cref": "#/pictures/10"}, "children": [], "content_layer": "body", "label": "caption", "prov": [{"page_no": 14, "bbox": {"l": 64.800003, "t": 618.46198, "r": 293.13809, "b": 610.13702, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 52]}], "orig": "Figure 3-10 Column masks shown in System i Navigator", "text": "Figure 3-10 Column masks shown in System i Navigator"}, {"self_ref": "#/texts/222", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "section_header", "prov": [{"page_no": 14, "bbox": {"l": 64.800003, "t": 589.62531, "r": 203.98521, "b": 577.63727, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 21]}], "orig": "3.6.6 Activating RCAC", "text": "3.6.6 Activating RCAC", "level": 1}, {"self_ref": "#/texts/223", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 14, "bbox": {"l": 136.8, "t": 563.47131, "r": 547.22565, "b": 530.25867, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 265]}], "orig": "Now that you have created the row permission and the two column masks, RCAC must be activated. The row permission and the two column masks are enabled (last clause in the scripts), but now you must activate RCAC on the table. To do so, complete the following steps:", "text": "Now that you have created the row permission and the two column masks, RCAC must be activated. The row permission and the two column masks are enabled (last clause in the scripts), but now you must activate RCAC on the table. To do so, complete the following steps:"}, {"self_ref": "#/texts/224", "parent": {"cref": "#/groups/11"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 14, "bbox": {"l": 136.8, "t": 522.49188, "r": 409.47888, "b": 513.27887, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 57]}], "orig": "1. Run the SQL statements that are shown in Example 3-10.", "text": "1. Run the SQL statements that are shown in Example 3-10.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/225", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "section_header", "prov": [{"page_no": 14, "bbox": {"l": 136.8, "t": 500.44202, "r": 375.29099, "b": 492.11699999999996, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 51]}], "orig": "Example 3-10 Activating RCAC on the EMPLOYEES table", "text": "Example 3-10 Activating RCAC on the EMPLOYEES table", "level": 1}, {"self_ref": "#/texts/226", "parent": {"cref": "#/groups/12"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 14, "bbox": {"l": 136.8, "t": 483.34189, "r": 376.67661, "b": 474.56711, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 45]}], "orig": "/* Active Row Access Control (permissions) */", "text": "/* Active Row Access Control (permissions) */", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/227", "parent": {"cref": "#/groups/12"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 14, "bbox": {"l": 136.8, "t": 471.34207, "r": 354.86963, "b": 462.56729, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 39]}], "orig": "/* Active Column Access Control (masks)", "text": "/* Active Column Access Control (masks)", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/228", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 14, "bbox": {"l": 365.77313, "t": 471.34207, "r": 376.67661, "b": 462.56729, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "*/", "text": "*/"}, {"self_ref": "#/texts/229", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 14, "bbox": {"l": 136.8, "t": 459.34225, "r": 291.7178, "b": 450.56747, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 31]}], "orig": "ALTER TABLE HR_SCHEMA.EMPLOYEES", "text": "ALTER TABLE HR_SCHEMA.EMPLOYEES"}, {"self_ref": "#/texts/230", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 14, "bbox": {"l": 136.8, "t": 447.34244, "r": 271.67831, "b": 438.56765999999993, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 27]}], "orig": "ACTIVATE ROW ACCESS CONTROL", "text": "ACTIVATE ROW ACCESS CONTROL"}, {"self_ref": "#/texts/231", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 14, "bbox": {"l": 136.8, "t": 435.34262, "r": 291.7178, "b": 426.56784, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 31]}], "orig": "ACTIVATE COLUMN ACCESS CONTROL;", "text": "ACTIVATE COLUMN ACCESS CONTROL;"}, {"self_ref": "#/texts/232", "parent": {"cref": "#/groups/13"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 14, "bbox": {"l": 136.8, "t": 411.4924, "r": 540.80145, "b": 378.27979, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 231]}], "orig": "2. Look at the definition of the EMPLOYEE table, as shown in Figure 3-11. To do this, from the main navigation pane of System i Navigator, click Schemas \uf0ae HR_SCHEMA \uf0ae Tables , right-click the EMPLOYEES table, and click Definition .", "text": "2. Look at the definition of the EMPLOYEE table, as shown in Figure 3-11. To do this, from the main navigation pane of System i Navigator, click Schemas \uf0ae HR_SCHEMA \uf0ae Tables , right-click the EMPLOYEES table, and click Definition .", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/233", "parent": {"cref": "#/pictures/11"}, "children": [], "content_layer": "body", "label": "caption", "prov": [{"page_no": 14, "bbox": {"l": 64.800003, "t": 142.96210999999994, "r": 347.43054, "b": 134.63710000000003, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 65]}], "orig": "Figure 3-11 Selecting the EMPLOYEES table from System i Navigator", "text": "Figure 3-11 Selecting the EMPLOYEES table from System i Navigator"}, {"self_ref": "#/texts/234", "parent": {"cref": "#/body"}, "children": [], "content_layer": "furniture", "label": "page_footer", "prov": [{"page_no": 14, "bbox": {"l": 64.800003, "t": 37.151279000000045, "r": 78.402, "b": 27.938279999999963, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "28", "text": "28"}, {"self_ref": "#/texts/235", "parent": {"cref": "#/body"}, "children": [], "content_layer": "furniture", "label": "page_footer", "prov": [{"page_no": 14, "bbox": {"l": 93.420303, "t": 36.461997999999994, "r": 334.42142, "b": 28.136998999999946, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 54]}], "orig": "Row and Column Access Control Support in IBM DB2 for i", "text": "Row and Column Access Control Support in IBM DB2 for i"}, {"self_ref": "#/texts/236", "parent": {"cref": "#/groups/14"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 15, "bbox": {"l": 136.79959, "t": 720.49097, "r": 514.04858, "b": 687.27832, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 228]}], "orig": "2. Figure 4-68 shows the Visual Explain of the same SQL statement, but with RCAC enabled. It is clear that the implementation of the SQL statement is more complex because the row permission rule becomes part of the WHERE clause.", "text": "2. Figure 4-68 shows the Visual Explain of the same SQL statement, but with RCAC enabled. It is clear that the implementation of the SQL statement is more complex because the row permission rule becomes part of the WHERE clause.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/237", "parent": {"cref": "#/pictures/12"}, "children": [], "content_layer": "body", "label": "caption", "prov": [{"page_no": 15, "bbox": {"l": 136.8, "t": 311.44202, "r": 327.09329, "b": 303.117, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 44]}], "orig": "Figure 4-68 Visual Explain with RCAC enabled", "text": "Figure 4-68 Visual Explain with RCAC enabled"}, {"self_ref": "#/texts/238", "parent": {"cref": "#/groups/14"}, "children": [], "content_layer": "body", "label": "list_item", "prov": [{"page_no": 15, "bbox": {"l": 136.8, "t": 285.43137, "r": 547.23944, "b": 252.21875, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 232]}], "orig": "3. Compare the advised indexes that are provided by the Optimizer without RCAC and with RCAC enabled. Figure 4-69 shows the index advice for the SQL statement without RCAC enabled. The index being advised is for the ORDER BY clause.", "text": "3. Compare the advised indexes that are provided by the Optimizer without RCAC and with RCAC enabled. Figure 4-69 shows the index advice for the SQL statement without RCAC enabled. The index being advised is for the ORDER BY clause.", "enumerated": false, "marker": "-"}, {"self_ref": "#/texts/239", "parent": {"cref": "#/pictures/13"}, "children": [], "content_layer": "body", "label": "caption", "prov": [{"page_no": 15, "bbox": {"l": 64.800003, "t": 124.48209999999995, "r": 227.10149, "b": 116.15710000000001, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 37]}], "orig": "Figure 4-69 Index advice with no RCAC", "text": "Figure 4-69 Index advice with no RCAC"}, {"self_ref": "#/texts/240", "parent": {"cref": "#/body"}, "children": [], "content_layer": "furniture", "label": "page_footer", "prov": [{"page_no": 15, "bbox": {"l": 214.8, "t": 36.461997999999994, "r": 523.59357, "b": 28.136998999999946, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 70]}], "orig": "Chapter 4. Implementing Row and Column Access Control: Banking example", "text": "Chapter 4. Implementing Row and Column Access Control: Banking example"}, {"self_ref": "#/texts/241", "parent": {"cref": "#/body"}, "children": [], "content_layer": "furniture", "label": "page_footer", "prov": [{"page_no": 15, "bbox": {"l": 536.09998, "t": 37.151279000000045, "r": 547.25916, "b": 27.938279999999963, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "77", "text": "77"}, {"self_ref": "#/texts/242", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "code", "prov": [{"page_no": 16, "bbox": {"l": 64.800308, "t": 720.32703, "r": 500.69727, "b": 85.39238, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1998]}], "orig": "THEN C . CUSTOMER_TAX_ID WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'TELLER' ) = 1 THEN ( 'XXX-XX-' CONCAT QSYS2 . SUBSTR ( C . CUSTOMER_TAX_ID , 8 , 4 ) ) WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 THEN C . CUSTOMER_TAX_ID ELSE 'XXX-XX-XXXX' END ENABLE ; CREATE MASK BANK_SCHEMA.MASK_DRIVERS_LICENSE_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C FOR COLUMN CUSTOMER_DRIVERS_LICENSE_NUMBER RETURN CASE WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 THEN C . CUSTOMER_DRIVERS_LICENSE_NUMBER WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'TELLER' ) = 1 THEN C . CUSTOMER_DRIVERS_LICENSE_NUMBER WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 THEN C . CUSTOMER_DRIVERS_LICENSE_NUMBER ELSE '*************' END ENABLE ; CREATE MASK BANK_SCHEMA.MASK_LOGIN_ID_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C FOR COLUMN CUSTOMER_LOGIN_ID RETURN CASE WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 THEN C . CUSTOMER_LOGIN_ID WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 THEN C . CUSTOMER_LOGIN_ID ELSE '*****' END ENABLE ; CREATE MASK BANK_SCHEMA.MASK_SECURITY_QUESTION_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C FOR COLUMN CUSTOMER_SECURITY_QUESTION RETURN CASE WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 THEN C . CUSTOMER_SECURITY_QUESTION WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 THEN C . CUSTOMER_SECURITY_QUESTION ELSE '*****' END ENABLE ; CREATE MASK BANK_SCHEMA.MASK_SECURITY_QUESTION_ANSWER_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C FOR COLUMN CUSTOMER_SECURITY_QUESTION_ANSWER RETURN CASE WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 THEN C . CUSTOMER_SECURITY_QUESTION_ANSWER WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 THEN C . CUSTOMER_SECURITY_QUESTION_ANSWER ELSE '*****' END ENABLE ; ALTER TABLE BANK_SCHEMA.CUSTOMERS ACTIVATE ROW ACCESS CONTROL ACTIVATE COLUMN ACCESS CONTROL ;", "text": "THEN C . CUSTOMER_TAX_ID WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'TELLER' ) = 1 THEN ( 'XXX-XX-' CONCAT QSYS2 . SUBSTR ( C . CUSTOMER_TAX_ID , 8 , 4 ) ) WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 THEN C . CUSTOMER_TAX_ID ELSE 'XXX-XX-XXXX' END ENABLE ; CREATE MASK BANK_SCHEMA.MASK_DRIVERS_LICENSE_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C FOR COLUMN CUSTOMER_DRIVERS_LICENSE_NUMBER RETURN CASE WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 THEN C . CUSTOMER_DRIVERS_LICENSE_NUMBER WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'TELLER' ) = 1 THEN C . CUSTOMER_DRIVERS_LICENSE_NUMBER WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 THEN C . CUSTOMER_DRIVERS_LICENSE_NUMBER ELSE '*************' END ENABLE ; CREATE MASK BANK_SCHEMA.MASK_LOGIN_ID_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C FOR COLUMN CUSTOMER_LOGIN_ID RETURN CASE WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 THEN C . CUSTOMER_LOGIN_ID WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 THEN C . CUSTOMER_LOGIN_ID ELSE '*****' END ENABLE ; CREATE MASK BANK_SCHEMA.MASK_SECURITY_QUESTION_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C FOR COLUMN CUSTOMER_SECURITY_QUESTION RETURN CASE WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 THEN C . CUSTOMER_SECURITY_QUESTION WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 THEN C . CUSTOMER_SECURITY_QUESTION ELSE '*****' END ENABLE ; CREATE MASK BANK_SCHEMA.MASK_SECURITY_QUESTION_ANSWER_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C FOR COLUMN CUSTOMER_SECURITY_QUESTION_ANSWER RETURN CASE WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 THEN C . CUSTOMER_SECURITY_QUESTION_ANSWER WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 THEN C . CUSTOMER_SECURITY_QUESTION_ANSWER ELSE '*****' END ENABLE ; ALTER TABLE BANK_SCHEMA.CUSTOMERS ACTIVATE ROW ACCESS CONTROL ACTIVATE COLUMN ACCESS CONTROL ;", "captions": [], "references": [], "footnotes": [], "image": null, "code_language": "unknown"}, {"self_ref": "#/texts/243", "parent": {"cref": "#/body"}, "children": [], "content_layer": "furniture", "label": "page_footer", "prov": [{"page_no": 16, "bbox": {"l": 64.800003, "t": 37.151279000000045, "r": 83.982002, "b": 27.938279999999963, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 3]}], "orig": "124", "text": "124"}, {"self_ref": "#/texts/244", "parent": {"cref": "#/body"}, "children": [], "content_layer": "furniture", "label": "page_footer", "prov": [{"page_no": 16, "bbox": {"l": 98.940002, "t": 36.461997999999994, "r": 339.81958, "b": 28.136998999999946, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 54]}], "orig": "Row and Column Access Control Support in IBM DB2 for i", "text": "Row and Column Access Control Support in IBM DB2 for i"}, {"self_ref": "#/texts/245", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 18, "bbox": {"l": 287.22, "t": 763.45197, "r": 414.24481, "b": 741.25195, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 10]}], "orig": "Back cover", "text": "Back cover"}, {"self_ref": "#/texts/246", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "section_header", "prov": [{"page_no": 18, "bbox": {"l": 27.0, "t": 718.3620000000001, "r": 447.36002, "b": 651.53998, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 54]}], "orig": "Row and Column Access Control Support in IBM DB2 for i", "text": "Row and Column Access Control Support in IBM DB2 for i", "level": 1}, {"self_ref": "#/texts/247", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 18, "bbox": {"l": 26.700001, "t": 549.828, "r": 127.4436, "b": 525.16803, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 40]}], "orig": "Implement roles and separation of duties", "text": "Implement roles and separation of duties"}, {"self_ref": "#/texts/248", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 18, "bbox": {"l": 26.700001, "t": 507.82803, "r": 120.28319999999998, "b": 469.12802, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 40]}], "orig": "Leverage row permissions on the database", "text": "Leverage row permissions on the database"}, {"self_ref": "#/texts/249", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 18, "bbox": {"l": 152.94, "t": 549.27142, "r": 414.08423, "b": 468.40811, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 464]}], "orig": "This IBM Redpaper publication provides information about the IBM i 7.2 feature of IBM DB2 for i Row and Column Access Control (RCAC). It offers a broad description of the function and advantages of controlling access to data in a comprehensive and transparent way. This publication helps you understand the capabilities of RCAC and provides examples of defining, creating, and implementing the row permissions and column masks in a relational database environment.", "text": "This IBM Redpaper publication provides information about the IBM i 7.2 feature of IBM DB2 for i Row and Column Access Control (RCAC). It offers a broad description of the function and advantages of controlling access to data in a comprehensive and transparent way. This publication helps you understand the capabilities of RCAC and provides examples of defining, creating, and implementing the row permissions and column masks in a relational database environment."}, {"self_ref": "#/texts/250", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 18, "bbox": {"l": 26.700001, "t": 451.84801999999996, "r": 121.44960000000002, "b": 413.14801, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 40]}], "orig": "Protect columns by defining column masks", "text": "Protect columns by defining column masks"}, {"self_ref": "#/texts/251", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 18, "bbox": {"l": 152.94002, "t": 460.29272, "r": 414.17383, "b": 403.42905, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 309]}], "orig": "This paper is intended for database engineers, data-centric application developers, and security officers who want to design and implement RCAC as a part of their data control and governance policy. A solid background in IBM i object level security, DB2 for i relational database concepts, and SQL is assumed.", "text": "This paper is intended for database engineers, data-centric application developers, and security officers who want to design and implement RCAC as a part of their data control and governance policy. A solid background in IBM i object level security, DB2 for i relational database concepts, and SQL is assumed."}, {"self_ref": "#/texts/252", "parent": {"cref": "#/pictures/14"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 18, "bbox": {"l": 558.11987, "t": 746.5313100000001, "r": 565.46039, "b": 737.3183, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "fi", "text": "fi"}, {"self_ref": "#/texts/253", "parent": {"cref": "#/pictures/15"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 18, "bbox": {"l": 474.60001, "t": 627.94342, "r": 580.88989, "b": 603.05902, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 8]}], "orig": "Redpaper", "text": "Redpaper"}, {"self_ref": "#/texts/254", "parent": {"cref": "#/pictures/15"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 18, "bbox": {"l": 582.53992, "t": 619.67285, "r": 592.13989, "b": 610.79285, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "\u2122", "text": "\u2122"}, {"self_ref": "#/texts/255", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 18, "bbox": {"l": 467.3399999999999, "t": 544.28168, "r": 559.80933, "b": 489.83939, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 44]}], "orig": "INTERNATIONAL TECHNICAL SUPPORT ORGANIZATION", "text": "INTERNATIONAL TECHNICAL SUPPORT ORGANIZATION"}, {"self_ref": "#/texts/256", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 18, "bbox": {"l": 467.3399999999999, "t": 440.20801, "r": 587.38916, "b": 405.52802, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 60]}], "orig": "BUILDING TECHNICAL INFORMATION BASED ON PRACTICAL EXPERIENCE", "text": "BUILDING TECHNICAL INFORMATION BASED ON PRACTICAL EXPERIENCE"}, {"self_ref": "#/texts/257", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 18, "bbox": {"l": 467.3399999999999, "t": 392.1397099999999, "r": 587.52051, "b": 250.36594000000002, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 323]}], "orig": "IBM Redbooks are developed by the IBM International Technical Support Organization. Experts from IBM, Customers and Partners from around the world create timely technical information based on realistic scenarios. Specific recommendations are provided to help you implement IT solutions more effectively in your environment.", "text": "IBM Redbooks are developed by the IBM International Technical Support Organization. Experts from IBM, Customers and Partners from around the world create timely technical information based on realistic scenarios. Specific recommendations are provided to help you implement IT solutions more effectively in your environment."}, {"self_ref": "#/texts/258", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 18, "bbox": {"l": 467.3399999999999, "t": 213.16809, "r": 570.948, "b": 190.48810000000003, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 39]}], "orig": "For more information: ibm.com /redbooks", "text": "For more information: ibm.com /redbooks"}, {"self_ref": "#/texts/259", "parent": {"cref": "#/body"}, "children": [], "content_layer": "furniture", "label": "page_footer", "prov": [{"page_no": 18, "bbox": {"l": 171.0, "t": 160.66200000000003, "r": 231.88769999999997, "b": 152.33699000000001, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 12]}], "orig": "REDP-5110-00", "text": "REDP-5110-00"}], "pictures": [{"self_ref": "#/pictures/0", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "picture", "prov": [{"page_no": 1, "bbox": {"l": 513.4560546875, "t": 765.9149017333984, "r": 586.1583251953125, "b": 737.1808471679688, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "annotations": []}, {"self_ref": "#/pictures/1", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/2"}, {"cref": "#/texts/3"}, {"cref": "#/texts/4"}, {"cref": "#/texts/5"}], "content_layer": "body", "label": "picture", "prov": [{"page_no": 1, "bbox": {"l": 33.09040069580078, "t": 498.9671630859375, "r": 585.1502075195312, "b": 89.5469970703125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "annotations": []}, {"self_ref": "#/pictures/2", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "picture", "prov": [{"page_no": 3, "bbox": {"l": 143.39866638183594, "t": 521.7389221191406, "r": 179.56256103515625, "b": 506.378662109375, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "annotations": []}, {"self_ref": "#/pictures/3", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "picture", "prov": [{"page_no": 3, "bbox": {"l": 64.1669921875, "t": 188.49365234375, "r": 258.7742919921875, "b": 103.87176513671875, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "annotations": []}, {"self_ref": "#/pictures/4", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "picture", "prov": [{"page_no": 4, "bbox": {"l": 142.52883911132812, "t": 416.9550476074219, "r": 251.47850036621094, "b": 288.79351806640625, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "annotations": []}, {"self_ref": "#/pictures/5", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "picture", "prov": [{"page_no": 4, "bbox": {"l": 145.4144744873047, "t": 264.7552490234375, "r": 252.08840942382812, "b": 156.616943359375, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "annotations": []}, {"self_ref": "#/pictures/6", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "picture", "prov": [{"page_no": 5, "bbox": {"l": 32.075252532958984, "t": 721.4226226806641, "r": 239.620361328125, "b": 554.0420684814453, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "annotations": []}, {"self_ref": "#/pictures/7", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/76"}, {"cref": "#/texts/77"}, {"cref": "#/texts/78"}], "content_layer": "body", "label": "picture", "prov": [{"page_no": 7, "bbox": {"l": 135.92466735839844, "t": 416.0727844238281, "r": 546.4456176757812, "b": 103.39019775390625, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [{"cref": "#/texts/76"}], "references": [], "footnotes": [], "image": null, "annotations": []}, {"self_ref": "#/pictures/8", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/118"}, {"cref": "#/texts/119"}, {"cref": "#/texts/120"}, {"cref": "#/texts/121"}, {"cref": "#/texts/122"}, {"cref": "#/texts/123"}, {"cref": "#/texts/124"}, {"cref": "#/texts/125"}, {"cref": "#/texts/126"}, {"cref": "#/texts/127"}, {"cref": "#/texts/128"}, {"cref": "#/texts/129"}, {"cref": "#/texts/130"}, {"cref": "#/texts/131"}, {"cref": "#/texts/132"}, {"cref": "#/texts/133"}, {"cref": "#/texts/134"}, {"cref": "#/texts/135"}, {"cref": "#/texts/136"}, {"cref": "#/texts/137"}, {"cref": "#/texts/138"}, {"cref": "#/texts/139"}, {"cref": "#/texts/140"}, {"cref": "#/texts/141"}, {"cref": "#/texts/142"}, {"cref": "#/texts/143"}, {"cref": "#/texts/144"}, {"cref": "#/texts/145"}, {"cref": "#/texts/146"}, {"cref": "#/texts/147"}, {"cref": "#/texts/148"}, {"cref": "#/texts/149"}, {"cref": "#/texts/150"}, {"cref": "#/texts/151"}, {"cref": "#/texts/152"}, {"cref": "#/texts/153"}, {"cref": "#/texts/154"}, {"cref": "#/texts/155"}, {"cref": "#/texts/156"}, {"cref": "#/texts/157"}, {"cref": "#/texts/158"}, {"cref": "#/texts/159"}, {"cref": "#/texts/160"}, {"cref": "#/texts/161"}, {"cref": "#/texts/162"}, {"cref": "#/texts/163"}, {"cref": "#/texts/164"}, {"cref": "#/texts/165"}, {"cref": "#/texts/166"}], "content_layer": "body", "label": "picture", "prov": [{"page_no": 10, "bbox": {"l": 135.97177124023438, "t": 684.5892486572266, "r": 545.4180908203125, "b": 381.39068603515625, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [{"cref": "#/texts/118"}], "references": [], "footnotes": [], "image": null, "annotations": []}, {"self_ref": "#/pictures/9", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/179"}, {"cref": "#/texts/180"}, {"cref": "#/texts/181"}, {"cref": "#/texts/182"}, {"cref": "#/texts/183"}, {"cref": "#/texts/184"}, {"cref": "#/texts/185"}, {"cref": "#/texts/186"}, {"cref": "#/texts/187"}, {"cref": "#/texts/188"}, {"cref": "#/texts/189"}], "content_layer": "body", "label": "picture", "prov": [{"page_no": 11, "bbox": {"l": 135.64837646484375, "t": 407.8262939453125, "r": 301.2367248535156, "b": 197.24334716796875, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [{"cref": "#/texts/179"}], "references": [], "footnotes": [], "image": null, "annotations": []}, {"self_ref": "#/pictures/10", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/221"}], "content_layer": "body", "label": "picture", "prov": [{"page_no": 14, "bbox": {"l": 63.801902770996094, "t": 696.6175842285156, "r": 547.11474609375, "b": 621.9678497314453, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [{"cref": "#/texts/221"}], "references": [], "footnotes": [], "image": null, "annotations": []}, {"self_ref": "#/pictures/11", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/233"}], "content_layer": "body", "label": "picture", "prov": [{"page_no": 14, "bbox": {"l": 63.985130310058594, "t": 364.09503173828125, "r": 530.0478515625, "b": 145.8603515625, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [{"cref": "#/texts/233"}], "references": [], "footnotes": [], "image": null, "annotations": []}, {"self_ref": "#/pictures/12", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/237"}], "content_layer": "body", "label": "picture", "prov": [{"page_no": 15, "bbox": {"l": 136.5016632080078, "t": 672.7508773803711, "r": 545.4508666992188, "b": 314.4587707519531, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [{"cref": "#/texts/237"}], "references": [], "footnotes": [], "image": null, "annotations": []}, {"self_ref": "#/pictures/13", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/239"}], "content_layer": "body", "label": "picture", "prov": [{"page_no": 15, "bbox": {"l": 64.27847290039062, "t": 238.41851806640625, "r": 506.39263916015625, "b": 127.91290283203125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [{"cref": "#/texts/239"}], "references": [], "footnotes": [], "image": null, "annotations": []}, {"self_ref": "#/pictures/14", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/252"}], "content_layer": "body", "label": "picture", "prov": [{"page_no": 18, "bbox": {"l": 485.1698303222656, "t": 766.7408027648926, "r": 566.2962036132812, "b": 737.8084144592285, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "annotations": []}, {"self_ref": "#/pictures/15", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/253"}, {"cref": "#/texts/254"}], "content_layer": "body", "label": "picture", "prov": [{"page_no": 18, "bbox": {"l": 474.35540771484375, "t": 711.9486846923828, "r": 592.2726440429688, "b": 602.1873931884766, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "annotations": []}], "tables": [{"self_ref": "#/tables/0", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "document_index", "prov": [{"page_no": 2, "bbox": {"l": 136.1496124267578, "t": 659.9669647216797, "r": 547.5267944335938, "b": 76.34844970703125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "data": {"table_cells": [{"bbox": {"l": 136.8, "t": 132.64862000000005, "r": 172.89404, "b": 141.86163, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Notices", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 175.01952, "t": 132.64862000000005, "r": 547.18982, "b": 141.86163, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vii", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79901, "t": 145.12847999999997, "r": 189.86537, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Trademarks", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 195.39685, "t": 145.12847999999997, "r": 547.18286, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . viii", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79901, "t": 167.62811, "r": 279.39731, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "DB2 for i Center of Excellence", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.61942, "t": 167.62811, "r": 547.1908, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ix", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79901, "t": 190.12775, "r": 172.84424, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Preface", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 175.01852, "t": 190.12775, "r": 547.18286, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79803, "t": 202.60760000000005, "r": 547.18085, "b": 211.82061999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Authors . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79803, "t": 215.14721999999995, "r": 339.18292, "b": 224.36023, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Now you can become a published author, too!", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 344.71411, "t": 215.14721999999995, "r": 547.13879, "b": 224.36023, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xiii", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79803, "t": 227.62707999999998, "r": 529.99506, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Comments welcome. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 535.5495, "t": 227.62707999999998, "r": 547.19788, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "xiii", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79807, "t": 240.10693000000003, "r": 284.02866, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Stay connected to IBM Redbooks", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.54449, "t": 240.10693000000003, "r": 547.12115, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xiv", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79807, "t": 262.60657000000003, "r": 536.09589, "b": 271.81958, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Chapter 1. Securing and protecting IBM DB2 data  . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.64685, "t": 262.60657000000003, "r": 547.19781, "b": 271.81958, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79808, "t": 274.60637999999994, "r": 549.84723, "b": 283.8194, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "1.1 Security fundamentals. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79807, "t": 287.14606000000003, "r": 536.12933, "b": 296.35904, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "1.2 Current state of IBM i security . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.66113, "t": 287.14606000000003, "r": 547.19287, "b": 296.35904, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79807, "t": 299.62595, "r": 549.84723, "b": 308.83893, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "1.3 DB2 for i security controls . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 312.1058300000001, "r": 536.05511, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "1.3.1 Existing row and column control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.6015, "t": 312.1058300000001, "r": 547.14795, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 324.64548, "r": 536.08008, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "1.3.2 New controls: Row and Column Access Control. . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.6355, "t": 324.64548, "r": 547.19092, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79704, "t": 347.14511, "r": 536.09088, "b": 356.35809, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 14, "end_row_offset_idx": 15, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Chapter 2. Roles and separation of duties . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.64282, "t": 347.14511, "r": 547.19476, "b": 356.35809, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 14, "end_row_offset_idx": 15, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79704, "t": 359.14493, "r": 536.12714, "b": 368.35791, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 15, "end_row_offset_idx": 16, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1 Roles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.66589, "t": 359.14493, "r": 547.20471, "b": 368.35791, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 15, "end_row_offset_idx": 16, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 371.62482, "r": 535.9527, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 16, "end_row_offset_idx": 17, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.1 DDM and DRDA application server access: QIBM_DB_DDMDRDA . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.55585, "t": 371.62482, "r": 547.15906, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 16, "end_row_offset_idx": 17, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 384.10470999999995, "r": 536.04108, "b": 393.31769, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 17, "end_row_offset_idx": 18, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.2 Toolbox application server access: QIBM_DB_ZDA. . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.59595, "t": 384.10470999999995, "r": 547.15082, "b": 393.31769, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 17, "end_row_offset_idx": 18, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 396.64435, "r": 536.07489, "b": 405.85733, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 18, "end_row_offset_idx": 19, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.3 Database Administrator function: QIBM_DB_SQLADM . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.63025, "t": 396.64435, "r": 547.18561, "b": 405.85733, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 18, "end_row_offset_idx": 19, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 409.12424000000004, "r": 411.27048, "b": 418.33722, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 19, "end_row_offset_idx": 20, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.4 Database Information function: QIBM_DB_SYSMON", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 416.81775, "t": 409.12424000000004, "r": 547.17865, "b": 418.33722, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 19, "end_row_offset_idx": 20, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . 9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 421.60413, "r": 536.03589, "b": 430.81711, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 20, "end_row_offset_idx": 21, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.5 Security Administrator function: QIBM_DB_SECADM . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.59894, "t": 421.60413, "r": 547.16193, "b": 430.81711, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 20, "end_row_offset_idx": 21, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 434.1437700000001, "r": 530.57318, "b": 443.35675, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 21, "end_row_offset_idx": 22, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.6 Change Function Usage CL command . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.10443, "t": 434.1437700000001, "r": 547.16687, "b": 443.35675, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 21, "end_row_offset_idx": 22, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "10", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 446.62366, "r": 530.53522, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 22, "end_row_offset_idx": 23, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.7 Verifying function usage IDs for RCAC with the FUNCTION_USAGE view . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.0755, "t": 446.62366, "r": 547.15601, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 22, "end_row_offset_idx": 23, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "10", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79704, "t": 459.10355, "r": 547.25659, "b": 468.31653, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 23, "end_row_offset_idx": 24, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.2 Separation of duties . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79703, "t": 481.60318, "r": 530.53961, "b": 490.81616, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 24, "end_row_offset_idx": 25, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Chapter 3. Row and Column Access Control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.09167, "t": 481.60318, "r": 547.1958, "b": 490.81616, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 24, "end_row_offset_idx": 25, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "13", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79703, "t": 493.603, "r": 530.4809, "b": 502.81598, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 25, "end_row_offset_idx": 26, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.1 Explanation of RCAC and the concept of access control . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.04248, "t": 493.603, "r": 547.16571, "b": 502.81598, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 25, "end_row_offset_idx": 26, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "14", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19719, "t": 506.14264, "r": 378.20786, "b": 515.35562, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 26, "end_row_offset_idx": 27, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.1.1 Row permission and column mask definitions", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 383.74713, "t": 506.14264, "r": 547.15576, "b": 515.35562, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 26, "end_row_offset_idx": 27, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . 14", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19719, "t": 518.62253, "r": 530.43475, "b": 527.83551, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 27, "end_row_offset_idx": 28, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.1.2 Enabling and activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 535.99622, "t": 518.62253, "r": 547.11908, "b": 527.83551, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 27, "end_row_offset_idx": 28, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "16", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79703, "t": 531.1621700000001, "r": 530.52808, "b": 540.37517, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 28, "end_row_offset_idx": 29, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.2 Special registers and built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.06702, "t": 531.1621700000001, "r": 547.14484, "b": 540.37517, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 28, "end_row_offset_idx": 29, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "18", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19719, "t": 543.64204, "r": 530.49786, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 29, "end_row_offset_idx": 30, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.2.1 Special registers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.05188, "t": 543.64204, "r": 547.15991, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 29, "end_row_offset_idx": 30, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "18", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19719, "t": 556.12192, "r": 530.56024, "b": 565.33492, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 30, "end_row_offset_idx": 31, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.2.2 Built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.09912, "t": 556.12192, "r": 547.17688, "b": 565.33492, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 30, "end_row_offset_idx": 31, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "19", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79703, "t": 568.66156, "r": 530.53027, "b": 577.87456, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 31, "end_row_offset_idx": 32, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.3 VERIFY_GROUP_FOR_USER function . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.06152, "t": 568.66156, "r": 547.12402, "b": 577.87456, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 31, "end_row_offset_idx": 32, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "20", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79703, "t": 581.14143, "r": 530.62994, "b": 590.35443, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 32, "end_row_offset_idx": 33, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.4 Establishing and controlling accessibility by using the RCAC rule text . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.16315, "t": 581.14143, "r": 547.22955, "b": 590.35443, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 32, "end_row_offset_idx": 33, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "21", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79701, "t": 593.62131, "r": 530.56512, "b": 615.37395, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 34, "end_row_offset_idx": 35, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.5 SELECT, INSERT, and UPDATE behavior with RCAC 3.6 Human resources example . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 400.32065, "t": 593.62131, "r": 530.48358, "b": 602.8343, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 33, "end_row_offset_idx": 34, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": ". . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.0224, "t": 593.62131, "r": 547.1001, "b": 602.8343, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 33, "end_row_offset_idx": 34, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "22", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.112, "t": 606.16095, "r": 547.20575, "b": 615.37395, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 34, "end_row_offset_idx": 35, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "22", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717, "t": 618.64082, "r": 530.49139, "b": 627.85382, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 35, "end_row_offset_idx": 36, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.1 Assigning the QIBM_DB_SECADM function ID to the consultants. . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.04633, "t": 618.64082, "r": 547.15619, "b": 627.85382, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 35, "end_row_offset_idx": 36, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "23", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717, "t": 631.1206999999999, "r": 530.56458, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 36, "end_row_offset_idx": 37, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.2 Creating group profiles for the users and their roles . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.09601, "t": 631.1206999999999, "r": 547.15875, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 36, "end_row_offset_idx": 37, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "23", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717, "t": 643.66034, "r": 530.55695, "b": 652.87334, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 37, "end_row_offset_idx": 38, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.3 Demonstrating data access without RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.0882, "t": 643.66034, "r": 547.15076, "b": 652.87334, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 37, "end_row_offset_idx": 38, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "24", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717, "t": 656.14021, "r": 530.53412, "b": 665.35321, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 38, "end_row_offset_idx": 39, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.4 Defining and creating row permissions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.073, "t": 656.14021, "r": 547.15088, "b": 665.35321, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 38, "end_row_offset_idx": 39, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "25", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717, "t": 668.62009, "r": 339.45105, "b": 677.83309, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 39, "end_row_offset_idx": 40, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.5 Defining and creating column masks", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 344.98996, "t": 668.62009, "r": 547.16089, "b": 677.83309, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 39, "end_row_offset_idx": 40, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717, "t": 681.15973, "r": 530.54102, "b": 690.37273, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 40, "end_row_offset_idx": 41, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.6 Activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.08765, "t": 681.15973, "r": 547.18085, "b": 690.37273, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 40, "end_row_offset_idx": 41, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "28", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717, "t": 693.63961, "r": 530.57507, "b": 702.852615, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 41, "end_row_offset_idx": 42, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.7 Demonstrating data access with RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.10663, "t": 693.63961, "r": 547.16968, "b": 702.852615, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 41, "end_row_offset_idx": 42, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "29", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717, "t": 706.119492, "r": 530.43628, "b": 715.332497, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 42, "end_row_offset_idx": 43, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.8 Demonstrating data access with a view and RCAC . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 535.99847, "t": 706.119492, "r": 547.12286, "b": 715.332497, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 42, "end_row_offset_idx": 43, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "32", "column_header": false, "row_header": false, "row_section": false}], "num_rows": 43, "num_cols": 2, "grid": [[{"bbox": {"l": 136.8, "t": 132.64862000000005, "r": 172.89404, "b": 141.86163, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Notices", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 175.01952, "t": 132.64862000000005, "r": 547.18982, "b": 141.86163, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vii", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 136.79901, "t": 145.12847999999997, "r": 189.86537, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Trademarks", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 195.39685, "t": 145.12847999999997, "r": 547.18286, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . viii", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 136.79901, "t": 167.62811, "r": 279.39731, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "DB2 for i Center of Excellence", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.61942, "t": 167.62811, "r": 547.1908, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ix", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 136.79901, "t": 190.12775, "r": 172.84424, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Preface", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 175.01852, "t": 190.12775, "r": 547.18286, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 136.79803, "t": 202.60760000000005, "r": 547.18085, "b": 211.82061999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Authors . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 136.79803, "t": 215.14721999999995, "r": 339.18292, "b": 224.36023, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Now you can become a published author, too!", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 344.71411, "t": 215.14721999999995, "r": 547.13879, "b": 224.36023, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xiii", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 136.79803, "t": 227.62707999999998, "r": 529.99506, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Comments welcome. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 535.5495, "t": 227.62707999999998, "r": 547.19788, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "xiii", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 136.79807, "t": 240.10693000000003, "r": 284.02866, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Stay connected to IBM Redbooks", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.54449, "t": 240.10693000000003, "r": 547.12115, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xiv", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 136.79807, "t": 262.60657000000003, "r": 536.09589, "b": 271.81958, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Chapter 1. Securing and protecting IBM DB2 data  . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.64685, "t": 262.60657000000003, "r": 547.19781, "b": 271.81958, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "1", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 136.79808, "t": 274.60637999999994, "r": 549.84723, "b": 283.8194, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "1.1 Security fundamentals. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 136.79807, "t": 287.14606000000003, "r": 536.12933, "b": 296.35904, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "1.2 Current state of IBM i security . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.66113, "t": 287.14606000000003, "r": 547.19287, "b": 296.35904, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "2", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 136.79807, "t": 299.62595, "r": 549.84723, "b": 308.83893, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "1.3 DB2 for i security controls . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 151.1972, "t": 312.1058300000001, "r": 536.05511, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "1.3.1 Existing row and column control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.6015, "t": 312.1058300000001, "r": 547.14795, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "4", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 151.1972, "t": 324.64548, "r": 536.08008, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "1.3.2 New controls: Row and Column Access Control. . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.6355, "t": 324.64548, "r": 547.19092, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "5", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 136.79704, "t": 347.14511, "r": 536.09088, "b": 356.35809, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 14, "end_row_offset_idx": 15, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Chapter 2. Roles and separation of duties . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.64282, "t": 347.14511, "r": 547.19476, "b": 356.35809, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 14, "end_row_offset_idx": 15, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "7", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 136.79704, "t": 359.14493, "r": 536.12714, "b": 368.35791, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 15, "end_row_offset_idx": 16, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1 Roles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.66589, "t": 359.14493, "r": 547.20471, "b": 368.35791, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 15, "end_row_offset_idx": 16, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "8", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 151.1972, "t": 371.62482, "r": 535.9527, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 16, "end_row_offset_idx": 17, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.1 DDM and DRDA application server access: QIBM_DB_DDMDRDA . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.55585, "t": 371.62482, "r": 547.15906, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 16, "end_row_offset_idx": 17, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "8", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 151.1972, "t": 384.10470999999995, "r": 536.04108, "b": 393.31769, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 17, "end_row_offset_idx": 18, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.2 Toolbox application server access: QIBM_DB_ZDA. . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.59595, "t": 384.10470999999995, "r": 547.15082, "b": 393.31769, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 17, "end_row_offset_idx": 18, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "8", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 151.1972, "t": 396.64435, "r": 536.07489, "b": 405.85733, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 18, "end_row_offset_idx": 19, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.3 Database Administrator function: QIBM_DB_SQLADM . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.63025, "t": 396.64435, "r": 547.18561, "b": 405.85733, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 18, "end_row_offset_idx": 19, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "9", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 151.1972, "t": 409.12424000000004, "r": 411.27048, "b": 418.33722, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 19, "end_row_offset_idx": 20, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.4 Database Information function: QIBM_DB_SYSMON", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 416.81775, "t": 409.12424000000004, "r": 547.17865, "b": 418.33722, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 19, "end_row_offset_idx": 20, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . 9", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 151.1972, "t": 421.60413, "r": 536.03589, "b": 430.81711, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 20, "end_row_offset_idx": 21, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.5 Security Administrator function: QIBM_DB_SECADM . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.59894, "t": 421.60413, "r": 547.16193, "b": 430.81711, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 20, "end_row_offset_idx": 21, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "9", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 151.1972, "t": 434.1437700000001, "r": 530.57318, "b": 443.35675, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 21, "end_row_offset_idx": 22, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.6 Change Function Usage CL command . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.10443, "t": 434.1437700000001, "r": 547.16687, "b": 443.35675, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 21, "end_row_offset_idx": 22, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "10", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 151.1972, "t": 446.62366, "r": 530.53522, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 22, "end_row_offset_idx": 23, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.7 Verifying function usage IDs for RCAC with the FUNCTION_USAGE view . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.0755, "t": 446.62366, "r": 547.15601, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 22, "end_row_offset_idx": 23, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "10", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 136.79704, "t": 459.10355, "r": 547.25659, "b": 468.31653, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 23, "end_row_offset_idx": 24, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.2 Separation of duties . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 23, "end_row_offset_idx": 24, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 136.79703, "t": 481.60318, "r": 530.53961, "b": 490.81616, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 24, "end_row_offset_idx": 25, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Chapter 3. Row and Column Access Control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.09167, "t": 481.60318, "r": 547.1958, "b": 490.81616, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 24, "end_row_offset_idx": 25, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "13", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 136.79703, "t": 493.603, "r": 530.4809, "b": 502.81598, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 25, "end_row_offset_idx": 26, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.1 Explanation of RCAC and the concept of access control . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.04248, "t": 493.603, "r": 547.16571, "b": 502.81598, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 25, "end_row_offset_idx": 26, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "14", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 151.19719, "t": 506.14264, "r": 378.20786, "b": 515.35562, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 26, "end_row_offset_idx": 27, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.1.1 Row permission and column mask definitions", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 383.74713, "t": 506.14264, "r": 547.15576, "b": 515.35562, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 26, "end_row_offset_idx": 27, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . 14", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 151.19719, "t": 518.62253, "r": 530.43475, "b": 527.83551, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 27, "end_row_offset_idx": 28, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.1.2 Enabling and activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 535.99622, "t": 518.62253, "r": 547.11908, "b": 527.83551, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 27, "end_row_offset_idx": 28, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "16", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 136.79703, "t": 531.1621700000001, "r": 530.52808, "b": 540.37517, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 28, "end_row_offset_idx": 29, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.2 Special registers and built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.06702, "t": 531.1621700000001, "r": 547.14484, "b": 540.37517, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 28, "end_row_offset_idx": 29, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "18", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 151.19719, "t": 543.64204, "r": 530.49786, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 29, "end_row_offset_idx": 30, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.2.1 Special registers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.05188, "t": 543.64204, "r": 547.15991, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 29, "end_row_offset_idx": 30, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "18", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 151.19719, "t": 556.12192, "r": 530.56024, "b": 565.33492, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 30, "end_row_offset_idx": 31, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.2.2 Built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.09912, "t": 556.12192, "r": 547.17688, "b": 565.33492, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 30, "end_row_offset_idx": 31, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "19", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 136.79703, "t": 568.66156, "r": 530.53027, "b": 577.87456, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 31, "end_row_offset_idx": 32, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.3 VERIFY_GROUP_FOR_USER function . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.06152, "t": 568.66156, "r": 547.12402, "b": 577.87456, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 31, "end_row_offset_idx": 32, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "20", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 136.79703, "t": 581.14143, "r": 530.62994, "b": 590.35443, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 32, "end_row_offset_idx": 33, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.4 Establishing and controlling accessibility by using the RCAC rule text . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.16315, "t": 581.14143, "r": 547.22955, "b": 590.35443, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 32, "end_row_offset_idx": 33, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "21", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 400.32065, "t": 593.62131, "r": 530.48358, "b": 602.8343, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 33, "end_row_offset_idx": 34, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": ". . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.0224, "t": 593.62131, "r": 547.1001, "b": 602.8343, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 33, "end_row_offset_idx": 34, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "22", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 136.79701, "t": 593.62131, "r": 530.56512, "b": 615.37395, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 34, "end_row_offset_idx": 35, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.5 SELECT, INSERT, and UPDATE behavior with RCAC 3.6 Human resources example . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.112, "t": 606.16095, "r": 547.20575, "b": 615.37395, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 34, "end_row_offset_idx": 35, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "22", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 151.19717, "t": 618.64082, "r": 530.49139, "b": 627.85382, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 35, "end_row_offset_idx": 36, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.1 Assigning the QIBM_DB_SECADM function ID to the consultants. . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.04633, "t": 618.64082, "r": 547.15619, "b": 627.85382, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 35, "end_row_offset_idx": 36, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "23", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 151.19717, "t": 631.1206999999999, "r": 530.56458, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 36, "end_row_offset_idx": 37, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.2 Creating group profiles for the users and their roles . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.09601, "t": 631.1206999999999, "r": 547.15875, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 36, "end_row_offset_idx": 37, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "23", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 151.19717, "t": 643.66034, "r": 530.55695, "b": 652.87334, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 37, "end_row_offset_idx": 38, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.3 Demonstrating data access without RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.0882, "t": 643.66034, "r": 547.15076, "b": 652.87334, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 37, "end_row_offset_idx": 38, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "24", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 151.19717, "t": 656.14021, "r": 530.53412, "b": 665.35321, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 38, "end_row_offset_idx": 39, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.4 Defining and creating row permissions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.073, "t": 656.14021, "r": 547.15088, "b": 665.35321, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 38, "end_row_offset_idx": 39, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "25", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 151.19717, "t": 668.62009, "r": 339.45105, "b": 677.83309, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 39, "end_row_offset_idx": 40, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.5 Defining and creating column masks", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 344.98996, "t": 668.62009, "r": 547.16089, "b": 677.83309, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 39, "end_row_offset_idx": 40, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 151.19717, "t": 681.15973, "r": 530.54102, "b": 690.37273, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 40, "end_row_offset_idx": 41, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.6 Activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.08765, "t": 681.15973, "r": 547.18085, "b": 690.37273, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 40, "end_row_offset_idx": 41, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "28", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 151.19717, "t": 693.63961, "r": 530.57507, "b": 702.852615, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 41, "end_row_offset_idx": 42, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.7 Demonstrating data access with RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.10663, "t": 693.63961, "r": 547.16968, "b": 702.852615, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 41, "end_row_offset_idx": 42, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "29", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 151.19717, "t": 706.119492, "r": 530.43628, "b": 715.332497, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 42, "end_row_offset_idx": 43, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.8 Demonstrating data access with a view and RCAC . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 535.99847, "t": 706.119492, "r": 547.12286, "b": 715.332497, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 42, "end_row_offset_idx": 43, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "32", "column_header": false, "row_header": false, "row_section": false}]]}}, {"self_ref": "#/tables/1", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/90"}], "content_layer": "body", "label": "table", "prov": [{"page_no": 8, "bbox": {"l": 135.52462768554688, "t": 502.2747802734375, "r": 545.8714599609375, "b": 349.949462890625, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [{"cref": "#/texts/90"}], "references": [], "footnotes": [], "image": null, "data": {"table_cells": [{"bbox": {"l": 142.8, "t": 296.5379899999999, "r": 202.245, "b": 304.86301, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Column name", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 216.80878999999996, "t": 296.5379899999999, "r": 257.21069, "b": 304.86301, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Data type", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 289.47479, "t": 296.5379899999999, "r": 338.89468, "b": 304.86301, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Description", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 142.8, "t": 315.55771, "r": 203.2323, "b": 323.88272, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "FUNCTION_ID", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 216.7854, "t": 315.55771, "r": 276.0036, "b": 323.88272, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(30)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.4577, "t": 315.55771, "r": 359.85394, "b": 323.88272, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "ID of the function.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 142.8, "t": 334.51801, "r": 198.6693, "b": 342.84302, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "USER_NAME", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 216.74129999999997, "t": 334.51801, "r": 275.92349, "b": 342.84302, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(10)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.38208, "t": 334.51801, "r": 515.05359, "b": 353.88333, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Name of the user profile that has a usage setting for this  function.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 142.79999, "t": 364.51862, "r": 173.98318, "b": 372.84363, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "USAGE", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 216.77367999999998, "t": 364.51862, "r": 270.97977, "b": 372.84363, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(7)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.41626, "t": 364.51862, "r": 539.10712, "b": 394.86395, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Usage setting: GLYPH<SM590000> ALLOWED: The user profile is allowed to use the function. GLYPH<SM590000> DENIED: The user profile is not allowed to use the function.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 142.8, "t": 405.55865, "r": 196.2249, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "USER_TYPE", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 216.75211, "t": 405.55865, "r": 270.99872, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(5)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.43161, "t": 405.55865, "r": 448.11963000000003, "b": 435.84369, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Type of user profile: GLYPH<SM590000> USER: The user profile is a user. GLYPH<SM590000> GROUP: The user profile is a group.", "column_header": false, "row_header": false, "row_section": false}], "num_rows": 5, "num_cols": 3, "grid": [[{"bbox": {"l": 142.8, "t": 296.5379899999999, "r": 202.245, "b": 304.86301, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Column name", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 216.80878999999996, "t": 296.5379899999999, "r": 257.21069, "b": 304.86301, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Data type", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 289.47479, "t": 296.5379899999999, "r": 338.89468, "b": 304.86301, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Description", "column_header": true, "row_header": false, "row_section": false}], [{"bbox": {"l": 142.8, "t": 315.55771, "r": 203.2323, "b": 323.88272, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "FUNCTION_ID", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 216.7854, "t": 315.55771, "r": 276.0036, "b": 323.88272, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(30)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.4577, "t": 315.55771, "r": 359.85394, "b": 323.88272, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "ID of the function.", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 142.8, "t": 334.51801, "r": 198.6693, "b": 342.84302, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "USER_NAME", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 216.74129999999997, "t": 334.51801, "r": 275.92349, "b": 342.84302, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(10)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.38208, "t": 334.51801, "r": 515.05359, "b": 353.88333, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Name of the user profile that has a usage setting for this  function.", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 142.79999, "t": 364.51862, "r": 173.98318, "b": 372.84363, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "USAGE", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 216.77367999999998, "t": 364.51862, "r": 270.97977, "b": 372.84363, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(7)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.41626, "t": 364.51862, "r": 539.10712, "b": 394.86395, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Usage setting: GLYPH<SM590000> ALLOWED: The user profile is allowed to use the function. GLYPH<SM590000> DENIED: The user profile is not allowed to use the function.", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 142.8, "t": 405.55865, "r": 196.2249, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "USER_TYPE", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 216.75211, "t": 405.55865, "r": 270.99872, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(5)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.43161, "t": 405.55865, "r": 448.11963000000003, "b": 435.84369, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Type of user profile: GLYPH<SM590000> USER: The user profile is a user. GLYPH<SM590000> GROUP: The user profile is a group.", "column_header": false, "row_header": false, "row_section": false}]]}}, {"self_ref": "#/tables/2", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/114"}], "content_layer": "body", "label": "table", "prov": [{"page_no": 9, "bbox": {"l": 64.41139221191406, "t": 398.3863830566406, "r": 547.3950805664062, "b": 70.39208984375, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [{"cref": "#/texts/114"}], "references": [], "footnotes": [], "image": null, "data": {"table_cells": [{"bbox": {"l": 70.800301, "t": 400.51827999999995, "r": 119.78551, "b": 408.84329, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "User action", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 424.93805, "t": 447.52255, "r": 433.26297000000005, "b": 487.01999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "*JOBCTL", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 450.13806, "t": 401.6000700000001, "r": 458.46298, "b": 487.01999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "QIBM_DB_SECADM", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 475.93835000000007, "t": 401.53442, "r": 484.26327999999995, "b": 487.01999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "QIBM_DB_SQLADM", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 501.13837, "t": 401.6145, "r": 509.46329, "b": 487.01999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "QIBM_DB_SYSMON", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 526.39862, "t": 432.79944, "r": 534.72357, "b": 487.02005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "No Authority", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800003, "t": 498.55798, "r": 220.15681000000004, "b": 506.883, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "SET CURRENT DEGREE  (SQL statement)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0, "t": 498.55798, "r": 435.00299000000007, "b": 506.883, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00031, "t": 498.55798, "r": 486.0033, "b": 506.883, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800018, "t": 517.51828, "r": 264.5538, "b": 525.84329, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "CHGQRYA  command targeting a different user\u2019s job", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.00003, "t": 517.51828, "r": 435.00302000000005, "b": 525.84329, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00034, "t": 517.51828, "r": 486.00333, "b": 525.84329, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800049, "t": 536.5379800000001, "r": 322.50574, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "STRDBMON  or  ENDDBMON  commands targeting a different user\u2019s job", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.00003, "t": 536.5379800000001, "r": 435.00302000000005, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00034, "t": 536.5379800000001, "r": 486.00333, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800049, "t": 555.55768, "r": 381.02185, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "STRDBMON  or  ENDDBMON  commands targeting a job that matches the current user", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.00003, "t": 555.55768, "r": 435.00302000000005, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00034, "t": 555.55768, "r": 486.00333, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 505.26061999999996, "t": 555.55768, "r": 511.26361, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 530.76031, "t": 555.55768, "r": 536.76331, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800049, "t": 574.51797, "r": 359.51736, "b": 582.84299, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "QUSRJOBI() API format 900 or System i Navigator\u2019s SQL Details for Job", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 574.51797, "r": 435.00305000000003, "b": 582.84299, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 574.51797, "r": 486.00335999999993, "b": 582.84299, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 505.2606799999999, "t": 574.51797, "r": 511.26367, "b": 582.84299, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800079, "t": 593.5376699999999, "r": 220.75178999999997, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Visual Explain within Run SQL scripts", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 593.5376699999999, "r": 435.00305000000003, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 593.5376699999999, "r": 486.00335999999993, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 505.2606799999999, "t": 593.5376699999999, "r": 511.26367, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 530.76038, "t": 593.5376699999999, "r": 536.76337, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800079, "t": 612.55737, "r": 236.6548, "b": 620.88239, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Visual Explain outside of Run SQL scripts", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 612.55737, "r": 435.00305000000003, "b": 620.88239, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 612.55737, "r": 486.00335999999993, "b": 620.88239, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800079, "t": 631.51767, "r": 213.12968, "b": 639.84268, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "ANALYZE PLAN CACHE procedure", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 631.51767, "r": 435.00305000000003, "b": 639.84268, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 631.51767, "r": 486.00335999999993, "b": 639.84268, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800079, "t": 650.53737, "r": 199.87808, "b": 658.86238, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "DUMP PLAN CACHE procedure", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 650.53737, "r": 435.00305000000003, "b": 658.86238, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 650.53737, "r": 486.00335999999993, "b": 658.86238, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800079, "t": 669.55708, "r": 208.36777, "b": 677.88207, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "MODIFY PLAN CACHE procedure", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 669.55708, "r": 435.00305000000003, "b": 677.88207, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 669.55708, "r": 486.00335999999993, "b": 677.88207, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800079, "t": 688.57677, "r": 411.20264, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "MODIFY PLAN CACHE PROPERTIES procedure (currently does not check authority)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 688.57677, "r": 435.00305000000003, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 688.57677, "r": 486.00335999999993, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800079, "t": 707.537071, "r": 377.12585, "b": 715.862068, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "CHANGE PLAN CACHE SIZE procedure (currently does not check authority)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 707.537071, "r": 435.00305000000003, "b": 715.862068, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 707.537071, "r": 486.00335999999993, "b": 715.862068, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}], "num_rows": 13, "num_cols": 6, "grid": [[{"bbox": {"l": 70.800301, "t": 400.51827999999995, "r": 119.78551, "b": 408.84329, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "User action", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 424.93805, "t": 447.52255, "r": 433.26297000000005, "b": 487.01999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "*JOBCTL", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 450.13806, "t": 401.6000700000001, "r": 458.46298, "b": 487.01999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "QIBM_DB_SECADM", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 475.93835000000007, "t": 401.53442, "r": 484.26327999999995, "b": 487.01999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "QIBM_DB_SQLADM", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 501.13837, "t": 401.6145, "r": 509.46329, "b": 487.01999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "QIBM_DB_SYSMON", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 526.39862, "t": 432.79944, "r": 534.72357, "b": 487.02005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "No Authority", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 70.800003, "t": 498.55798, "r": 220.15681000000004, "b": 506.883, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "SET CURRENT DEGREE  (SQL statement)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0, "t": 498.55798, "r": 435.00299000000007, "b": 506.883, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00031, "t": 498.55798, "r": 486.0033, "b": 506.883, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 70.800018, "t": 517.51828, "r": 264.5538, "b": 525.84329, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "CHGQRYA  command targeting a different user\u2019s job", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.00003, "t": 517.51828, "r": 435.00302000000005, "b": 525.84329, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00034, "t": 517.51828, "r": 486.00333, "b": 525.84329, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 70.800049, "t": 536.5379800000001, "r": 322.50574, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "STRDBMON  or  ENDDBMON  commands targeting a different user\u2019s job", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.00003, "t": 536.5379800000001, "r": 435.00302000000005, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00034, "t": 536.5379800000001, "r": 486.00333, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 70.800049, "t": 555.55768, "r": 381.02185, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "STRDBMON  or  ENDDBMON  commands targeting a job that matches the current user", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.00003, "t": 555.55768, "r": 435.00302000000005, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00034, "t": 555.55768, "r": 486.00333, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 505.26061999999996, "t": 555.55768, "r": 511.26361, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 530.76031, "t": 555.55768, "r": 536.76331, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "X", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 70.800049, "t": 574.51797, "r": 359.51736, "b": 582.84299, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "QUSRJOBI() API format 900 or System i Navigator\u2019s SQL Details for Job", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 574.51797, "r": 435.00305000000003, "b": 582.84299, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 574.51797, "r": 486.00335999999993, "b": 582.84299, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 505.2606799999999, "t": 574.51797, "r": 511.26367, "b": 582.84299, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 70.800079, "t": 593.5376699999999, "r": 220.75178999999997, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Visual Explain within Run SQL scripts", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 593.5376699999999, "r": 435.00305000000003, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 593.5376699999999, "r": 486.00335999999993, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 505.2606799999999, "t": 593.5376699999999, "r": 511.26367, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 530.76038, "t": 593.5376699999999, "r": 536.76337, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "X", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 70.800079, "t": 612.55737, "r": 236.6548, "b": 620.88239, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Visual Explain outside of Run SQL scripts", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 612.55737, "r": 435.00305000000003, "b": 620.88239, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 612.55737, "r": 486.00335999999993, "b": 620.88239, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 70.800079, "t": 631.51767, "r": 213.12968, "b": 639.84268, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "ANALYZE PLAN CACHE procedure", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 631.51767, "r": 435.00305000000003, "b": 639.84268, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 631.51767, "r": 486.00335999999993, "b": 639.84268, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 70.800079, "t": 650.53737, "r": 199.87808, "b": 658.86238, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "DUMP PLAN CACHE procedure", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 650.53737, "r": 435.00305000000003, "b": 658.86238, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 650.53737, "r": 486.00335999999993, "b": 658.86238, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 70.800079, "t": 669.55708, "r": 208.36777, "b": 677.88207, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "MODIFY PLAN CACHE procedure", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 669.55708, "r": 435.00305000000003, "b": 677.88207, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 669.55708, "r": 486.00335999999993, "b": 677.88207, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 70.800079, "t": 688.57677, "r": 411.20264, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "MODIFY PLAN CACHE PROPERTIES procedure (currently does not check authority)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 688.57677, "r": 435.00305000000003, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 688.57677, "r": 486.00335999999993, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 70.800079, "t": 707.537071, "r": 377.12585, "b": 715.862068, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "CHANGE PLAN CACHE SIZE procedure (currently does not check authority)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 707.537071, "r": 435.00305000000003, "b": 715.862068, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 707.537071, "r": 486.00335999999993, "b": 715.862068, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "", "column_header": false, "row_header": false, "row_section": false}, {"bbox": null, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "", "column_header": false, "row_header": false, "row_section": false}]]}}, {"self_ref": "#/tables/3", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/172"}], "content_layer": "body", "label": "table", "prov": [{"page_no": 11, "bbox": {"l": 134.5462646484375, "t": 688.5811080932617, "r": 542.0460815429688, "b": 587.7283935546875, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [{"cref": "#/texts/172"}], "references": [], "footnotes": [], "image": null, "data": {"table_cells": [{"bbox": {"l": 142.8, "t": 110.53801999999985, "r": 209.67091, "b": 118.86298, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Special register", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 230.18912000000003, "t": 110.53801999999985, "r": 319.93527, "b": 118.86298, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Corresponding value", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 142.80002, "t": 129.49834999999996, "r": 212.70122, "b": 148.86359000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "USER or SESSION_USER", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 230.21973000000003, "t": 129.49834999999996, "r": 467.99069000000003, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "The effective user of the thread excluding adopted authority.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 142.80003, "t": 159.55835000000002, "r": 216.63962999999998, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "CURRENT_USER", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 230.19814, "t": 159.55835000000002, "r": 535.65082, "b": 178.86328000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "The effective user of the thread including adopted authority. When no adopted  authority is present, this has the same value as USER.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 142.8009, "t": 189.55804, "r": 209.7357, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "SYSTEM_USER", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 230.2449, "t": 189.55804, "r": 425.64569, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "The authorization ID that initiated the connection.", "column_header": false, "row_header": false, "row_section": false}], "num_rows": 4, "num_cols": 2, "grid": [[{"bbox": {"l": 142.8, "t": 110.53801999999985, "r": 209.67091, "b": 118.86298, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Special register", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 230.18912000000003, "t": 110.53801999999985, "r": 319.93527, "b": 118.86298, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Corresponding value", "column_header": true, "row_header": false, "row_section": false}], [{"bbox": {"l": 142.80002, "t": 129.49834999999996, "r": 212.70122, "b": 148.86359000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "USER or SESSION_USER", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 230.21973000000003, "t": 129.49834999999996, "r": 467.99069000000003, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "The effective user of the thread excluding adopted authority.", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 142.80003, "t": 159.55835000000002, "r": 216.63962999999998, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "CURRENT_USER", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 230.19814, "t": 159.55835000000002, "r": 535.65082, "b": 178.86328000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "The effective user of the thread including adopted authority. When no adopted  authority is present, this has the same value as USER.", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 142.8009, "t": 189.55804, "r": 209.7357, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "SYSTEM_USER", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 230.2449, "t": 189.55804, "r": 425.64569, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "The authorization ID that initiated the connection.", "column_header": false, "row_header": false, "row_section": false}]]}}, {"self_ref": "#/tables/4", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/196"}], "content_layer": "body", "label": "table", "prov": [{"page_no": 12, "bbox": {"l": 63.55636978149414, "t": 687.7661285400391, "r": 548.5687255859375, "b": 495.77532958984375, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [{"cref": "#/texts/196"}], "references": [], "footnotes": [], "image": null, "data": {"table_cells": [{"bbox": {"l": 70.800003, "t": 110.53801999999985, "r": 134.99071, "b": 118.86298, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Global variable", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 202.8894, "t": 110.53801999999985, "r": 223.34641, "b": 118.86298, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Type", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 281.8248, "t": 110.53801999999985, "r": 331.3428, "b": 118.86298, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Description", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800003, "t": 129.49834999999996, "r": 132.7209, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "CLIENT_HOST", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.89029, "t": 129.49834999999996, "r": 267.07651, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(255)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.84732, "t": 129.49834999999996, "r": 510.17548, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Host name of the current client as returned by the system", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800018, "t": 148.51806999999997, "r": 140.66522, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "CLIENT_IPADDR", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.87231, "t": 148.51806999999997, "r": 267.07739, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(128)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.84549, "t": 148.51806999999997, "r": 509.60583, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "IP address of the current client as returned by the system", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800018, "t": 167.53778, "r": 134.98264, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "CLIENT_PORT", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.90294, "t": 167.53778, "r": 242.80084, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "INTEGER", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.79785, "t": 167.53778, "r": 527.59222, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Port used by the current client to communicate with the server", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800018, "t": 186.5575, "r": 143.50925, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PACKAGE_NAME", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.80576, "t": 186.5575, "r": 267.06937, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(128)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.85187, "t": 186.5575, "r": 436.57259999999997, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Name of the currently running package", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800018, "t": 205.51782000000003, "r": 156.01654, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PACKAGE_SCHEMA", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.83545, "t": 205.51782000000003, "r": 267.08646, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(128)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.87076, "t": 205.51782000000003, "r": 470.44678, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Schema name of the currently running package", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800018, "t": 224.53754000000004, "r": 157.89932, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PACKAGE_VERSION", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.72472, "t": 224.53754000000004, "r": 261.98254, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(64)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.74924, "t": 224.53754000000004, "r": 478.8438100000001, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Version identifier of the currently running package", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800018, "t": 243.55724999999995, "r": 154.41992, "b": 251.8822, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "ROUTINE_SCHEMA", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.79312, "t": 243.55724999999995, "r": 267.09274, "b": 251.8822, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(128)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.87164, "t": 243.55724999999995, "r": 464.26022, "b": 251.8822, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Schema name of the currently running routine", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800018, "t": 262.51757999999995, "r": 188.43991, "b": 270.84253, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "ROUTINE_SPECIFIC_NAME", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.84441, "t": 262.51757999999995, "r": 267.03693, "b": 270.84253, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(128)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.80682, "t": 262.51757999999995, "r": 430.40045, "b": 270.84253, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Name of the currently running routine", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800034, "t": 281.53726, "r": 139.43135, "b": 289.86227, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "ROUTINE_TYPE", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.74635, "t": 281.53726, "r": 239.28996000000004, "b": 289.86227, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "CHAR(1)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.79065, "t": 281.53726, "r": 425.09131, "b": 289.86227, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Type of the currently running routine", "column_header": false, "row_header": false, "row_section": false}], "num_rows": 10, "num_cols": 3, "grid": [[{"bbox": {"l": 70.800003, "t": 110.53801999999985, "r": 134.99071, "b": 118.86298, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Global variable", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 202.8894, "t": 110.53801999999985, "r": 223.34641, "b": 118.86298, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Type", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 281.8248, "t": 110.53801999999985, "r": 331.3428, "b": 118.86298, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Description", "column_header": true, "row_header": false, "row_section": false}], [{"bbox": {"l": 70.800003, "t": 129.49834999999996, "r": 132.7209, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "CLIENT_HOST", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.89029, "t": 129.49834999999996, "r": 267.07651, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(255)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.84732, "t": 129.49834999999996, "r": 510.17548, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Host name of the current client as returned by the system", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 70.800018, "t": 148.51806999999997, "r": 140.66522, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "CLIENT_IPADDR", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.87231, "t": 148.51806999999997, "r": 267.07739, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(128)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.84549, "t": 148.51806999999997, "r": 509.60583, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "IP address of the current client as returned by the system", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 70.800018, "t": 167.53778, "r": 134.98264, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "CLIENT_PORT", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.90294, "t": 167.53778, "r": 242.80084, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "INTEGER", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.79785, "t": 167.53778, "r": 527.59222, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Port used by the current client to communicate with the server", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 70.800018, "t": 186.5575, "r": 143.50925, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PACKAGE_NAME", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.80576, "t": 186.5575, "r": 267.06937, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(128)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.85187, "t": 186.5575, "r": 436.57259999999997, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Name of the currently running package", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 70.800018, "t": 205.51782000000003, "r": 156.01654, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PACKAGE_SCHEMA", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.83545, "t": 205.51782000000003, "r": 267.08646, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(128)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.87076, "t": 205.51782000000003, "r": 470.44678, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Schema name of the currently running package", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 70.800018, "t": 224.53754000000004, "r": 157.89932, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PACKAGE_VERSION", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.72472, "t": 224.53754000000004, "r": 261.98254, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(64)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.74924, "t": 224.53754000000004, "r": 478.8438100000001, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Version identifier of the currently running package", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 70.800018, "t": 243.55724999999995, "r": 154.41992, "b": 251.8822, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "ROUTINE_SCHEMA", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.79312, "t": 243.55724999999995, "r": 267.09274, "b": 251.8822, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(128)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.87164, "t": 243.55724999999995, "r": 464.26022, "b": 251.8822, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Schema name of the currently running routine", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 70.800018, "t": 262.51757999999995, "r": 188.43991, "b": 270.84253, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "ROUTINE_SPECIFIC_NAME", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.84441, "t": 262.51757999999995, "r": 267.03693, "b": 270.84253, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(128)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.80682, "t": 262.51757999999995, "r": 430.40045, "b": 270.84253, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Name of the currently running routine", "column_header": false, "row_header": false, "row_section": false}], [{"bbox": {"l": 70.800034, "t": 281.53726, "r": 139.43135, "b": 289.86227, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "ROUTINE_TYPE", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.74635, "t": 281.53726, "r": 239.28996000000004, "b": 289.86227, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "CHAR(1)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.79065, "t": 281.53726, "r": 425.09131, "b": 289.86227, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Type of the currently running routine", "column_header": false, "row_header": false, "row_section": false}]]}}], "key_value_items": [], "form_items": [], "pages": {"1": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 1}, "2": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 2}, "3": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 3}, "4": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 4}, "5": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 5}, "6": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 6}, "7": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 7}, "8": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 8}, "9": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 9}, "10": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 10}, "11": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 11}, "12": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 12}, "13": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 13}, "14": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 14}, "15": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 15}, "16": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 16}, "17": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 17}, "18": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 18}}}
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v2/redp5110_sampled.md b/tests/data/groundtruth/docling_v2/redp5110_sampled.md
index a0e71aad..f8ebee98 100644
--- a/tests/data/groundtruth/docling_v2/redp5110_sampled.md
+++ b/tests/data/groundtruth/docling_v2/redp5110_sampled.md
@@ -6,7 +6,7 @@ Front cover
 
 <!-- image -->
 
-<!-- image -->
+Front cover
 
 ## Contents
 
@@ -63,10 +63,10 @@ Solution Brief IBM Systems Lab Services and Training
 
 ## Highlights
 
-- GLYPH<g115>GLYPH<g3> GLYPH<g40>GLYPH<g81>GLYPH<g75>GLYPH<g68>GLYPH<g81>GLYPH<g70>GLYPH<g72>GLYPH<g3> GLYPH<g87>GLYPH<g75>GLYPH<g72>GLYPH<g3> GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g73>GLYPH<g82>GLYPH<g85>GLYPH<g80>GLYPH<g68>GLYPH<g81>GLYPH<g70>GLYPH<g72>GLYPH<g3> GLYPH<g82>GLYPH<g73>GLYPH<g3> GLYPH<g92>GLYPH<g82>GLYPH<g88>GLYPH<g85> GLYPH<g3> GLYPH<g71>GLYPH<g68>GLYPH<g87>GLYPH<g68>GLYPH<g69>GLYPH<g68>GLYPH<g86>GLYPH<g72>GLYPH<g3> GLYPH<g82>GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g68>GLYPH<g87>GLYPH<g76>GLYPH<g82>GLYPH<g81>GLYPH<g86>
-- GLYPH<g115>GLYPH<g3> GLYPH<g40>GLYPH<g68>GLYPH<g85> GLYPH<g81>GLYPH<g3> GLYPH<g74>GLYPH<g85>GLYPH<g72>GLYPH<g68>GLYPH<g87>GLYPH<g72>GLYPH<g85>GLYPH<g3> GLYPH<g85>GLYPH<g72>GLYPH<g87>GLYPH<g88>GLYPH<g85> GLYPH<g81>GLYPH<g3> GLYPH<g82>GLYPH<g81>GLYPH<g3> GLYPH<g44>GLYPH<g55>GLYPH<g3> GLYPH<g83>GLYPH<g85>GLYPH<g82>GLYPH<g77>GLYPH<g72>GLYPH<g70>GLYPH<g87>GLYPH<g86> GLYPH<g3> GLYPH<g87>GLYPH<g75>GLYPH<g85>GLYPH<g82>GLYPH<g88>GLYPH<g74>GLYPH<g75>GLYPH<g3> GLYPH<g80>GLYPH<g82>GLYPH<g71>GLYPH<g72>GLYPH<g85> GLYPH<g81>GLYPH<g76>GLYPH<g93>GLYPH<g68>GLYPH<g87>GLYPH<g76>GLYPH<g82>GLYPH<g81>GLYPH<g3> GLYPH<g82>GLYPH<g73>GLYPH<g3> GLYPH<g71>GLYPH<g68>GLYPH<g87>GLYPH<g68>GLYPH<g69>GLYPH<g68>GLYPH<g86>GLYPH<g72>GLYPH<g3> GLYPH<g68>GLYPH<g81>GLYPH<g71> GLYPH<g3> GLYPH<g68>GLYPH<g83>GLYPH<g83>GLYPH<g79>GLYPH<g76>GLYPH<g70>GLYPH<g68>GLYPH<g87>GLYPH<g76>GLYPH<g82>GLYPH<g81>GLYPH<g86>
-- GLYPH<g115>GLYPH<g3> GLYPH<g53>GLYPH<g72>GLYPH<g79>GLYPH<g92>GLYPH<g3> GLYPH<g82>GLYPH<g81>GLYPH<g3> GLYPH<g44>GLYPH<g37>GLYPH<g48>GLYPH<g3> GLYPH<g72>GLYPH<g91>GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g87>GLYPH<g3> GLYPH<g70>GLYPH<g82>GLYPH<g81>GLYPH<g86>GLYPH<g88>GLYPH<g79>GLYPH<g87>GLYPH<g76>GLYPH<g81>GLYPH<g74>GLYPH<g15>GLYPH<g3> GLYPH<g86>GLYPH<g78>GLYPH<g76>GLYPH<g79>GLYPH<g79>GLYPH<g86> GLYPH<g3> GLYPH<g86>GLYPH<g75>GLYPH<g68>GLYPH<g85>GLYPH<g76>GLYPH<g81>GLYPH<g74>GLYPH<g3> GLYPH<g68>GLYPH<g81>GLYPH<g71>GLYPH<g3> GLYPH<g85>GLYPH<g72>GLYPH<g81>GLYPH<g82>GLYPH<g90>GLYPH<g81>GLYPH<g3> GLYPH<g86>GLYPH<g72>GLYPH<g85>GLYPH<g89>GLYPH<g76>GLYPH<g70>GLYPH<g72>GLYPH<g86>
-- GLYPH<g115>GLYPH<g3> GLYPH<g55> GLYPH<g68>GLYPH<g78>GLYPH<g72>GLYPH<g3> GLYPH<g68>GLYPH<g71>GLYPH<g89>GLYPH<g68>GLYPH<g81>GLYPH<g87>GLYPH<g68>GLYPH<g74>GLYPH<g72>GLYPH<g3> GLYPH<g82>GLYPH<g73>GLYPH<g3> GLYPH<g68>GLYPH<g70>GLYPH<g70>GLYPH<g72>GLYPH<g86>GLYPH<g86>GLYPH<g3> GLYPH<g87>GLYPH<g82>GLYPH<g3> GLYPH<g68> GLYPH<g3> GLYPH<g90>GLYPH<g82>GLYPH<g85>GLYPH<g79>GLYPH<g71>GLYPH<g90>GLYPH<g76>GLYPH<g71>GLYPH<g72>GLYPH<g3> GLYPH<g86>GLYPH<g82>GLYPH<g88>GLYPH<g85>GLYPH<g70>GLYPH<g72>GLYPH<g3> GLYPH<g82>GLYPH<g73>GLYPH<g3> GLYPH<g72>GLYPH<g91>GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g87>GLYPH<g76>GLYPH<g86>GLYPH<g72>
+- GLYPH&lt;g115&gt;GLYPH&lt;g3&gt; GLYPH&lt;g40&gt;GLYPH&lt;g81&gt;GLYPH&lt;g75&gt;GLYPH&lt;g68&gt;GLYPH&lt;g81&gt;GLYPH&lt;g70&gt;GLYPH&lt;g72&gt;GLYPH&lt;g3&gt; GLYPH&lt;g87&gt;GLYPH&lt;g75&gt;GLYPH&lt;g72&gt;GLYPH&lt;g3&gt; GLYPH&lt;g83&gt;GLYPH&lt;g72&gt;GLYPH&lt;g85&gt;GLYPH&lt;g73&gt;GLYPH&lt;g82&gt;GLYPH&lt;g85&gt;GLYPH&lt;g80&gt;GLYPH&lt;g68&gt;GLYPH&lt;g81&gt;GLYPH&lt;g70&gt;GLYPH&lt;g72&gt;GLYPH&lt;g3&gt; GLYPH&lt;g82&gt;GLYPH&lt;g73&gt;GLYPH&lt;g3&gt; GLYPH&lt;g92&gt;GLYPH&lt;g82&gt;GLYPH&lt;g88&gt;GLYPH&lt;g85&gt; GLYPH&lt;g3&gt; GLYPH&lt;g71&gt;GLYPH&lt;g68&gt;GLYPH&lt;g87&gt;GLYPH&lt;g68&gt;GLYPH&lt;g69&gt;GLYPH&lt;g68&gt;GLYPH&lt;g86&gt;GLYPH&lt;g72&gt;GLYPH&lt;g3&gt; GLYPH&lt;g82&gt;GLYPH&lt;g83&gt;GLYPH&lt;g72&gt;GLYPH&lt;g85&gt;GLYPH&lt;g68&gt;GLYPH&lt;g87&gt;GLYPH&lt;g76&gt;GLYPH&lt;g82&gt;GLYPH&lt;g81&gt;GLYPH&lt;g86&gt;
+- GLYPH&lt;g115&gt;GLYPH&lt;g3&gt; GLYPH&lt;g40&gt;GLYPH&lt;g68&gt;GLYPH&lt;g85&gt; GLYPH&lt;g81&gt;GLYPH&lt;g3&gt; GLYPH&lt;g74&gt;GLYPH&lt;g85&gt;GLYPH&lt;g72&gt;GLYPH&lt;g68&gt;GLYPH&lt;g87&gt;GLYPH&lt;g72&gt;GLYPH&lt;g85&gt;GLYPH&lt;g3&gt; GLYPH&lt;g85&gt;GLYPH&lt;g72&gt;GLYPH&lt;g87&gt;GLYPH&lt;g88&gt;GLYPH&lt;g85&gt; GLYPH&lt;g81&gt;GLYPH&lt;g3&gt; GLYPH&lt;g82&gt;GLYPH&lt;g81&gt;GLYPH&lt;g3&gt; GLYPH&lt;g44&gt;GLYPH&lt;g55&gt;GLYPH&lt;g3&gt; GLYPH&lt;g83&gt;GLYPH&lt;g85&gt;GLYPH&lt;g82&gt;GLYPH&lt;g77&gt;GLYPH&lt;g72&gt;GLYPH&lt;g70&gt;GLYPH&lt;g87&gt;GLYPH&lt;g86&gt; GLYPH&lt;g3&gt; GLYPH&lt;g87&gt;GLYPH&lt;g75&gt;GLYPH&lt;g85&gt;GLYPH&lt;g82&gt;GLYPH&lt;g88&gt;GLYPH&lt;g74&gt;GLYPH&lt;g75&gt;GLYPH&lt;g3&gt; GLYPH&lt;g80&gt;GLYPH&lt;g82&gt;GLYPH&lt;g71&gt;GLYPH&lt;g72&gt;GLYPH&lt;g85&gt; GLYPH&lt;g81&gt;GLYPH&lt;g76&gt;GLYPH&lt;g93&gt;GLYPH&lt;g68&gt;GLYPH&lt;g87&gt;GLYPH&lt;g76&gt;GLYPH&lt;g82&gt;GLYPH&lt;g81&gt;GLYPH&lt;g3&gt; GLYPH&lt;g82&gt;GLYPH&lt;g73&gt;GLYPH&lt;g3&gt; GLYPH&lt;g71&gt;GLYPH&lt;g68&gt;GLYPH&lt;g87&gt;GLYPH&lt;g68&gt;GLYPH&lt;g69&gt;GLYPH&lt;g68&gt;GLYPH&lt;g86&gt;GLYPH&lt;g72&gt;GLYPH&lt;g3&gt; GLYPH&lt;g68&gt;GLYPH&lt;g81&gt;GLYPH&lt;g71&gt; GLYPH&lt;g3&gt; GLYPH&lt;g68&gt;GLYPH&lt;g83&gt;GLYPH&lt;g83&gt;GLYPH&lt;g79&gt;GLYPH&lt;g76&gt;GLYPH&lt;g70&gt;GLYPH&lt;g68&gt;GLYPH&lt;g87&gt;GLYPH&lt;g76&gt;GLYPH&lt;g82&gt;GLYPH&lt;g81&gt;GLYPH&lt;g86&gt;
+- GLYPH&lt;g115&gt;GLYPH&lt;g3&gt; GLYPH&lt;g53&gt;GLYPH&lt;g72&gt;GLYPH&lt;g79&gt;GLYPH&lt;g92&gt;GLYPH&lt;g3&gt; GLYPH&lt;g82&gt;GLYPH&lt;g81&gt;GLYPH&lt;g3&gt; GLYPH&lt;g44&gt;GLYPH&lt;g37&gt;GLYPH&lt;g48&gt;GLYPH&lt;g3&gt; GLYPH&lt;g72&gt;GLYPH&lt;g91&gt;GLYPH&lt;g83&gt;GLYPH&lt;g72&gt;GLYPH&lt;g85&gt;GLYPH&lt;g87&gt;GLYPH&lt;g3&gt; GLYPH&lt;g70&gt;GLYPH&lt;g82&gt;GLYPH&lt;g81&gt;GLYPH&lt;g86&gt;GLYPH&lt;g88&gt;GLYPH&lt;g79&gt;GLYPH&lt;g87&gt;GLYPH&lt;g76&gt;GLYPH&lt;g81&gt;GLYPH&lt;g74&gt;GLYPH&lt;g15&gt;GLYPH&lt;g3&gt; GLYPH&lt;g86&gt;GLYPH&lt;g78&gt;GLYPH&lt;g76&gt;GLYPH&lt;g79&gt;GLYPH&lt;g79&gt;GLYPH&lt;g86&gt; GLYPH&lt;g3&gt; GLYPH&lt;g86&gt;GLYPH&lt;g75&gt;GLYPH&lt;g68&gt;GLYPH&lt;g85&gt;GLYPH&lt;g76&gt;GLYPH&lt;g81&gt;GLYPH&lt;g74&gt;GLYPH&lt;g3&gt; GLYPH&lt;g68&gt;GLYPH&lt;g81&gt;GLYPH&lt;g71&gt;GLYPH&lt;g3&gt; GLYPH&lt;g85&gt;GLYPH&lt;g72&gt;GLYPH&lt;g81&gt;GLYPH&lt;g82&gt;GLYPH&lt;g90&gt;GLYPH&lt;g81&gt;GLYPH&lt;g3&gt; GLYPH&lt;g86&gt;GLYPH&lt;g72&gt;GLYPH&lt;g85&gt;GLYPH&lt;g89&gt;GLYPH&lt;g76&gt;GLYPH&lt;g70&gt;GLYPH&lt;g72&gt;GLYPH&lt;g86&gt;
+- GLYPH&lt;g115&gt;GLYPH&lt;g3&gt; GLYPH&lt;g55&gt; GLYPH&lt;g68&gt;GLYPH&lt;g78&gt;GLYPH&lt;g72&gt;GLYPH&lt;g3&gt; GLYPH&lt;g68&gt;GLYPH&lt;g71&gt;GLYPH&lt;g89&gt;GLYPH&lt;g68&gt;GLYPH&lt;g81&gt;GLYPH&lt;g87&gt;GLYPH&lt;g68&gt;GLYPH&lt;g74&gt;GLYPH&lt;g72&gt;GLYPH&lt;g3&gt; GLYPH&lt;g82&gt;GLYPH&lt;g73&gt;GLYPH&lt;g3&gt; GLYPH&lt;g68&gt;GLYPH&lt;g70&gt;GLYPH&lt;g70&gt;GLYPH&lt;g72&gt;GLYPH&lt;g86&gt;GLYPH&lt;g86&gt;GLYPH&lt;g3&gt; GLYPH&lt;g87&gt;GLYPH&lt;g82&gt;GLYPH&lt;g3&gt; GLYPH&lt;g68&gt; GLYPH&lt;g3&gt; GLYPH&lt;g90&gt;GLYPH&lt;g82&gt;GLYPH&lt;g85&gt;GLYPH&lt;g79&gt;GLYPH&lt;g71&gt;GLYPH&lt;g90&gt;GLYPH&lt;g76&gt;GLYPH&lt;g71&gt;GLYPH&lt;g72&gt;GLYPH&lt;g3&gt; GLYPH&lt;g86&gt;GLYPH&lt;g82&gt;GLYPH&lt;g88&gt;GLYPH&lt;g85&gt;GLYPH&lt;g70&gt;GLYPH&lt;g72&gt;GLYPH&lt;g3&gt; GLYPH&lt;g82&gt;GLYPH&lt;g73&gt;GLYPH&lt;g3&gt; GLYPH&lt;g72&gt;GLYPH&lt;g91&gt;GLYPH&lt;g83&gt;GLYPH&lt;g72&gt;GLYPH&lt;g85&gt;GLYPH&lt;g87&gt;GLYPH&lt;g76&gt;GLYPH&lt;g86&gt;GLYPH&lt;g72&gt;
 
 <!-- image -->
 
@@ -108,20 +108,20 @@ This paper was produced by the IBM DB2 for i Center of Excellence team in partne
 
 <!-- image -->
 
-<!-- image -->
-
 Jim Bainbridge is a senior DB2 consultant on the DB2 for i Center of Excellence team in the IBM Lab Services and Training organization. His primary role is training and implementation services for IBM DB2 Web Query for i and business analytics. Jim began his career with IBM 30 years ago in the IBM Rochester Development Lab, where he developed cooperative processing products that paired IBM PCs with IBM S/36 and AS/.400 systems. In the years since, Jim has held numerous technical roles, including independent software vendors technical support on a broad range of IBM technologies and products, and supporting customers in the IBM Executive Briefing Center and IBM Project Office.
 
+<!-- image -->
+
 Hernando Bedoya is a Senior IT Specialist at STG Lab Services and Training in Rochester, Minnesota. He writes extensively and teaches IBM classes worldwide in all areas of DB2 for i. Before joining STG Lab Services, he worked in the ITSO for nine years writing multiple IBM Redbooksfi publications. He also worked for IBM Colombia as an IBM AS/400fi IT Specialist doing presales support for the Andean countries. He has 28 years of experience in the computing field and has taught database classes in Colombian universities. He holds a Master's degree in Computer Science from EAFIT, Colombia. His areas of expertise are database technology, performance, and data warehousing. Hernando can be contacted at hbedoya@us.ibm.com .
 
 ## Authors
 
 <!-- image -->
 
-Chapter 1.
-
 1
 
+Chapter 1.
+
 ## Securing and protecting IBM DB2 data
 
 Recent news headlines are filled with reports of data breaches and cyber-attacks impacting global businesses of all sizes. The Identity Theft Resource Center$^{1}$ reports that almost 5000 data breaches have occurred since 2005, exposing over 600 million records of data. The financial cost of these data breaches is skyrocketing. Studies from the Ponemon Institute$^{2}$ revealed that the average cost of a data breach increased in 2013 by 15% globally and resulted in a brand equity loss of $9.4 million per attack. The average cost that is incurred for each lost record containing sensitive information increased more than 9% to $145 per record.
@@ -130,20 +130,20 @@ Businesses must make a serious effort to secure their data and recognize that se
 
 This chapter describes how you can secure and protect data in DB2 for i. The following topics are covered in this chapter:
 
-- GLYPH<SM590000> Security fundamentals
-- GLYPH<SM590000> Current state of IBM i security
-- GLYPH<SM590000> DB2 for i security controls
+- GLYPH&lt;SM590000&gt; Security fundamentals
+- GLYPH&lt;SM590000&gt; Current state of IBM i security
+- GLYPH&lt;SM590000&gt; DB2 for i security controls
 
 ## 1.1 Security fundamentals
 
 Before reviewing database security techniques, there are two fundamental steps in securing information assets that must be described:
 
-- GLYPH<SM590000> First, and most important, is the definition of a company's security policy . Without a security policy, there is no definition of what are acceptable practices for using, accessing, and storing information by who, what, when, where, and how. A security policy should minimally address three things: confidentiality, integrity, and availability.
+- GLYPH&lt;SM590000&gt; First, and most important, is the definition of a company's security policy . Without a security policy, there is no definition of what are acceptable practices for using, accessing, and storing information by who, what, when, where, and how. A security policy should minimally address three things: confidentiality, integrity, and availability.
 - The monitoring and assessment of adherence to the security policy determines whether your security strategy is working. Often, IBM security consultants are asked to perform security assessments for companies without regard to the security policy. Although these assessments can be useful for observing how the system is defined and how data is being accessed, they cannot determine the level of security without a security policy. Without a security policy, it really is not an assessment as much as it is a baseline for monitoring the changes in the security settings that are captured.
 
 A security policy is what defines whether the system and its settings are secure (or not).
 
-- GLYPH<SM590000> The second fundamental in securing data assets is the use of resource security . If implemented properly, resource security prevents data breaches from both internal and external intrusions. Resource security controls are closely tied to the part of the security policy that defines who should have access to what information resources. A hacker might be good enough to get through your company firewalls and sift his way through to your system, but if they do not have explicit access to your database, the hacker cannot compromise your information assets.
+- GLYPH&lt;SM590000&gt; The second fundamental in securing data assets is the use of resource security . If implemented properly, resource security prevents data breaches from both internal and external intrusions. Resource security controls are closely tied to the part of the security policy that defines who should have access to what information resources. A hacker might be good enough to get through your company firewalls and sift his way through to your system, but if they do not have explicit access to your database, the hacker cannot compromise your information assets.
 
 With your eyes now open to the importance of securing information assets, the rest of this chapter reviews the methods that are available for securing database resources on IBM i.
 
@@ -173,9 +173,9 @@ Figure 1-2 Existing row and column controls
 
 The following CL commands can be used to work with, display, or change function usage IDs:
 
-- GLYPH<SM590000> Work Function Usage ( WRKFCNUSG )
-- GLYPH<SM590000> Change Function Usage ( CHGFCNUSG )
-- GLYPH<SM590000> Display Function Usage ( DSPFCNUSG )
+- GLYPH&lt;SM590000&gt; Work Function Usage ( WRKFCNUSG )
+- GLYPH&lt;SM590000&gt; Change Function Usage ( CHGFCNUSG )
+- GLYPH&lt;SM590000&gt; Display Function Usage ( DSPFCNUSG )
 
 For example, the following CHGFCNUSG command shows granting authorization to user HBEDOYA to administer and manage RCAC rules:
 
@@ -191,13 +191,11 @@ Table 2-1 FUNCTION\_USAGE view
 |---------------|-------------|-----------------------------------------------------------------------------------------------------------------------------------------------------------------------|
 | FUNCTION\_ID   | VARCHAR(30) | ID of the function.                                                                                                                                                   |
 | USER\_NAME     | VARCHAR(10) | Name of the user profile that has a usage setting for this  function.                                                                                                 |
-| USAGE         | VARCHAR(7)  | Usage setting: GLYPH<SM590000> ALLOWED: The user profile is allowed to use the function. GLYPH<SM590000> DENIED: The user profile is not allowed to use the function. |
-| USER\_TYPE     | VARCHAR(5)  | Type of user profile: GLYPH<SM590000> USER: The user profile is a user. GLYPH<SM590000> GROUP: The user profile is a group.                                           |
+| USAGE         | VARCHAR(7)  | Usage setting: GLYPH&lt;SM590000&gt; ALLOWED: The user profile is allowed to use the function. GLYPH&lt;SM590000&gt; DENIED: The user profile is not allowed to use the function. |
+| USER\_TYPE     | VARCHAR(5)  | Type of user profile: GLYPH&lt;SM590000&gt; USER: The user profile is a user. GLYPH&lt;SM590000&gt; GROUP: The user profile is a group.                                           |
 
 To discover who has authorization to define and manage RCAC, you can use the query that is shown in Example 2-1.
 
-Example 2-1 Query to determine who has authority to define and manage RCAC
-
 SELECT
 
 function\_id,
@@ -241,10 +239,10 @@ Table 2-2 Comparison of the different function usage IDs and *JOBCTL authority
 | User action                                                                    | *JOBCTL   | QIBM\_DB\_SECADM   | QIBM\_DB\_SQLADM   | QIBM\_DB\_SYSMON   | No Authority   |
 |--------------------------------------------------------------------------------|-----------|------------------|------------------|------------------|----------------|
 | SET CURRENT DEGREE  (SQL statement)                                            | X         |                  | X                |                  |                |
-| CHGQRYA  command targeting a different user's job                              | X         |                  | X                |                  |                |
-| STRDBMON  or  ENDDBMON  commands targeting a different user's job              | X         |                  | X                |                  |                |
+| CHGQRYA  command targeting a different user’s job                              | X         |                  | X                |                  |                |
+| STRDBMON  or  ENDDBMON  commands targeting a different user’s job              | X         |                  | X                |                  |                |
 | STRDBMON  or  ENDDBMON  commands targeting a job that matches the current user | X         |                  | X                | X                | X              |
-| QUSRJOBI() API format 900 or System i Navigator's SQL Details for Job          | X         |                  | X                | X                |                |
+| QUSRJOBI() API format 900 or System i Navigator’s SQL Details for Job          | X         |                  | X                | X                |                |
 | Visual Explain within Run SQL scripts                                          | X         |                  | X                | X                | X              |
 | Visual Explain outside of Run SQL scripts                                      | X         |                  | X                |                  |                |
 | ANALYZE PLAN CACHE procedure                                                   | X         |                  | X                |                  |                |
@@ -253,7 +251,7 @@ Table 2-2 Comparison of the different function usage IDs and *JOBCTL authority
 | MODIFY PLAN CACHE PROPERTIES procedure (currently does not check authority)    | X         |                  | X                |                  |                |
 | CHANGE PLAN CACHE SIZE procedure (currently does not check authority)          | X         |                  | X                |                  |                |
 
-The SQL CREATE PERMISSION statement that is shown in Figure 3-1 is used to define and initially enable or disable the row access rules.Figure 3-1 CREATE PERMISSION SQL statement
+Figure 3-1 CREATE PERMISSION SQL statement
 
 <!-- image -->
 
@@ -261,8 +259,6 @@ The SQL CREATE PERMISSION statement that is shown in Figure 3-1 is used to defin
 
 A column mask is a database object that manifests a column value access control rule for a specific column in a specific table. It uses a CASE expression that describes what you see when you access the column. For example, a teller can see only the last four digits of a tax identification number.
 
-Table 3-1 summarizes these special registers and their values.
-
 Table 3-1 Special registers and their corresponding values
 
 | Special register     | Corresponding value                                                                                                                   |
@@ -273,11 +269,11 @@ Table 3-1 Special registers and their corresponding values
 
 Figure 3-5 shows the difference in the special register values when an adopted authority is used:
 
-- GLYPH<SM590000> A user connects to the server using the user profile ALICE.
-- GLYPH<SM590000> USER and CURRENT USER initially have the same value of ALICE.
-- GLYPH<SM590000> ALICE calls an SQL procedure that is named proc1, which is owned by user profile JOE and was created to adopt JOE's authority when it is called.
-- GLYPH<SM590000> While the procedure is running, the special register USER still contains the value of ALICE because it excludes any adopted authority. The special register CURRENT USER contains the value of JOE because it includes any adopted authority.
-- GLYPH<SM590000> When proc1 ends, the session reverts to its original state with both USER and CURRENT USER having the value of ALICE.
+- GLYPH&lt;SM590000&gt; A user connects to the server using the user profile ALICE.
+- GLYPH&lt;SM590000&gt; USER and CURRENT USER initially have the same value of ALICE.
+- GLYPH&lt;SM590000&gt; ALICE calls an SQL procedure that is named proc1, which is owned by user profile JOE and was created to adopt JOE's authority when it is called.
+- GLYPH&lt;SM590000&gt; While the procedure is running, the special register USER still contains the value of ALICE because it excludes any adopted authority. The special register CURRENT USER contains the value of JOE because it includes any adopted authority.
+- GLYPH&lt;SM590000&gt; When proc1 ends, the session reverts to its original state with both USER and CURRENT USER having the value of ALICE.
 
 Figure 3-5 Special registers and adopted authority
 
@@ -318,7 +314,7 @@ Here is an example of using the VERIFY\_GROUP\_FOR\_USER function:
 - 3. If a user is connected to the server using user profile JANE, all of the following function invocations return a value of 1:
 
 ```
-VERIFY\_GROUP\_FOR\_USER (CURRENT\_USER, 'MGR') VERIFY\_GROUP\_FOR\_USER (CURRENT\_USER, 'JANE', 'MGR') VERIFY\_GROUP\_FOR\_USER (CURRENT\_USER, 'JANE', 'MGR', 'STEVE') The following function invocation returns a value of 0: VERIFY\_GROUP\_FOR\_USER (CURRENT\_USER, 'JUDY', 'TONY')
+VERIFY_GROUP_FOR_USER (CURRENT_USER, 'MGR') VERIFY_GROUP_FOR_USER (CURRENT_USER, 'JANE', 'MGR') VERIFY_GROUP_FOR_USER (CURRENT_USER, 'JANE', 'MGR', 'STEVE') The following function invocation returns a value of 0: VERIFY_GROUP_FOR_USER (CURRENT_USER, 'JUDY', 'TONY')
 ```
 
 RETURN
@@ -326,7 +322,7 @@ RETURN
 CASE
 
 ```
-WHEN VERIFY\_GROUP\_FOR\_USER ( SESSION\_USER , 'HR', 'EMP' ) = 1 THEN EMPLOYEES . DATE\_OF\_BIRTH WHEN VERIFY\_GROUP\_FOR\_USER ( SESSION\_USER , 'MGR' ) = 1 AND SESSION\_USER = EMPLOYEES . USER\_ID THEN EMPLOYEES . DATE\_OF\_BIRTH WHEN VERIFY\_GROUP\_FOR\_USER ( SESSION\_USER , 'MGR' ) = 1 AND SESSION\_USER <> EMPLOYEES . USER\_ID THEN ( 9999 || '-' || MONTH ( EMPLOYEES . DATE\_OF\_BIRTH ) || '-' || DAY (EMPLOYEES.DATE\_OF\_BIRTH )) ELSE NULL END ENABLE ;
+WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'HR', 'EMP' ) = 1 THEN EMPLOYEES . DATE_OF_BIRTH WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1 AND SESSION_USER = EMPLOYEES . USER_ID THEN EMPLOYEES . DATE_OF_BIRTH WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1 AND SESSION_USER <> EMPLOYEES . USER_ID THEN ( 9999 || '-' || MONTH ( EMPLOYEES . DATE_OF_BIRTH ) || '-' || DAY (EMPLOYEES.DATE_OF_BIRTH )) ELSE NULL END ENABLE ;
 ```
 
 - 2. The other column to mask in this example is the TAX\_ID information. In this example, the rules to enforce include the following ones:
@@ -336,10 +332,8 @@ WHEN VERIFY\_GROUP\_FOR\_USER ( SESSION\_USER , 'HR', 'EMP' ) = 1 THEN EMPLOYEES
 - -Any other person sees the entire TAX\_ID as masked, for example, XXX-XX-XXXX.
 - To implement this column mask, run the SQL statement that is shown in Example 3-9.
 
-Example 3-9 Creating a mask on the TAX\_ID column
-
 ```
-CREATE MASK HR\_SCHEMA.MASK\_TAX\_ID\_ON\_EMPLOYEES ON HR\_SCHEMA.EMPLOYEES AS EMPLOYEES FOR COLUMN TAX\_ID RETURN CASE WHEN VERIFY\_GROUP\_FOR\_USER ( SESSION\_USER , 'HR' ) = 1 THEN EMPLOYEES . TAX\_ID WHEN VERIFY\_GROUP\_FOR\_USER ( SESSION\_USER , 'MGR' ) = 1 AND SESSION\_USER = EMPLOYEES . USER\_ID THEN EMPLOYEES . TAX\_ID WHEN VERIFY\_GROUP\_FOR\_USER ( SESSION\_USER , 'MGR' ) = 1 AND SESSION\_USER <> EMPLOYEES . USER\_ID THEN ( 'XXX-XX-' CONCAT QSYS2 . SUBSTR ( EMPLOYEES . TAX\_ID , 8 , 4 ) ) WHEN VERIFY\_GROUP\_FOR\_USER ( SESSION\_USER , 'EMP' ) = 1 THEN EMPLOYEES . TAX\_ID ELSE 'XXX-XX-XXXX' END ENABLE ;
+CREATE MASK HR_SCHEMA.MASK_TAX_ID_ON_EMPLOYEES ON HR_SCHEMA.EMPLOYEES AS EMPLOYEES FOR COLUMN TAX_ID RETURN CASE WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'HR' ) = 1 THEN EMPLOYEES . TAX_ID WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1 AND SESSION_USER = EMPLOYEES . USER_ID THEN EMPLOYEES . TAX_ID WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1 AND SESSION_USER <> EMPLOYEES . USER_ID THEN ( 'XXX-XX-' CONCAT QSYS2 . SUBSTR ( EMPLOYEES . TAX_ID , 8 , 4 ) ) WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'EMP' ) = 1 THEN EMPLOYEES . TAX_ID ELSE 'XXX-XX-XXXX' END ENABLE ;
 ```
 
 - 3. Figure 3-10 shows the masks that are created in the HR\_SCHEMA.
@@ -374,19 +368,18 @@ Figure 3-11 Selecting the EMPLOYEES table from System i Navigator
 <!-- image -->
 
 - 2. Figure 4-68 shows the Visual Explain of the same SQL statement, but with RCAC enabled. It is clear that the implementation of the SQL statement is more complex because the row permission rule becomes part of the WHERE clause.
+- 3. Compare the advised indexes that are provided by the Optimizer without RCAC and with RCAC enabled. Figure 4-69 shows the index advice for the SQL statement without RCAC enabled. The index being advised is for the ORDER BY clause.
 
 Figure 4-68 Visual Explain with RCAC enabled
 
 <!-- image -->
 
-- 3. Compare the advised indexes that are provided by the Optimizer without RCAC and with RCAC enabled. Figure 4-69 shows the index advice for the SQL statement without RCAC enabled. The index being advised is for the ORDER BY clause.
-
 Figure 4-69 Index advice with no RCAC
 
 <!-- image -->
 
 ```
-THEN C . CUSTOMER\_TAX\_ID WHEN QSYS2 . VERIFY\_GROUP\_FOR\_USER ( SESSION\_USER , 'TELLER' ) = 1 THEN ( 'XXX-XX-' CONCAT QSYS2 . SUBSTR ( C . CUSTOMER\_TAX\_ID , 8 , 4 ) ) WHEN QSYS2 . VERIFY\_GROUP\_FOR\_USER ( SESSION\_USER , 'CUSTOMER' ) = 1 THEN C . CUSTOMER\_TAX\_ID ELSE 'XXX-XX-XXXX' END ENABLE ; CREATE MASK BANK\_SCHEMA.MASK\_DRIVERS\_LICENSE\_ON\_CUSTOMERS ON BANK\_SCHEMA.CUSTOMERS AS C FOR COLUMN CUSTOMER\_DRIVERS\_LICENSE\_NUMBER RETURN CASE WHEN QSYS2 . VERIFY\_GROUP\_FOR\_USER ( SESSION\_USER , 'ADMIN' ) = 1 THEN C . CUSTOMER\_DRIVERS\_LICENSE\_NUMBER WHEN QSYS2 . VERIFY\_GROUP\_FOR\_USER ( SESSION\_USER , 'TELLER' ) = 1 THEN C . CUSTOMER\_DRIVERS\_LICENSE\_NUMBER WHEN QSYS2 . VERIFY\_GROUP\_FOR\_USER ( SESSION\_USER , 'CUSTOMER' ) = 1 THEN C . CUSTOMER\_DRIVERS\_LICENSE\_NUMBER ELSE '*************' END ENABLE ; CREATE MASK BANK\_SCHEMA.MASK\_LOGIN\_ID\_ON\_CUSTOMERS ON BANK\_SCHEMA.CUSTOMERS AS C FOR COLUMN CUSTOMER\_LOGIN\_ID RETURN CASE WHEN QSYS2 . VERIFY\_GROUP\_FOR\_USER ( SESSION\_USER , 'ADMIN' ) = 1 THEN C . CUSTOMER\_LOGIN\_ID WHEN QSYS2 . VERIFY\_GROUP\_FOR\_USER ( SESSION\_USER , 'CUSTOMER' ) = 1 THEN C . CUSTOMER\_LOGIN\_ID ELSE '*****' END ENABLE ; CREATE MASK BANK\_SCHEMA.MASK\_SECURITY\_QUESTION\_ON\_CUSTOMERS ON BANK\_SCHEMA.CUSTOMERS AS C FOR COLUMN CUSTOMER\_SECURITY\_QUESTION RETURN CASE WHEN QSYS2 . VERIFY\_GROUP\_FOR\_USER ( SESSION\_USER , 'ADMIN' ) = 1 THEN C . CUSTOMER\_SECURITY\_QUESTION WHEN QSYS2 . VERIFY\_GROUP\_FOR\_USER ( SESSION\_USER , 'CUSTOMER' ) = 1 THEN C . CUSTOMER\_SECURITY\_QUESTION ELSE '*****' END ENABLE ; CREATE MASK BANK\_SCHEMA.MASK\_SECURITY\_QUESTION\_ANSWER\_ON\_CUSTOMERS ON BANK\_SCHEMA.CUSTOMERS AS C FOR COLUMN CUSTOMER\_SECURITY\_QUESTION\_ANSWER RETURN CASE WHEN QSYS2 . VERIFY\_GROUP\_FOR\_USER ( SESSION\_USER , 'ADMIN' ) = 1 THEN C . CUSTOMER\_SECURITY\_QUESTION\_ANSWER WHEN QSYS2 . VERIFY\_GROUP\_FOR\_USER ( SESSION\_USER , 'CUSTOMER' ) = 1 THEN C . CUSTOMER\_SECURITY\_QUESTION\_ANSWER ELSE '*****' END ENABLE ; ALTER TABLE BANK\_SCHEMA.CUSTOMERS ACTIVATE ROW ACCESS CONTROL ACTIVATE COLUMN ACCESS CONTROL ;
+THEN C . CUSTOMER_TAX_ID WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'TELLER' ) = 1 THEN ( 'XXX-XX-' CONCAT QSYS2 . SUBSTR ( C . CUSTOMER_TAX_ID , 8 , 4 ) ) WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 THEN C . CUSTOMER_TAX_ID ELSE 'XXX-XX-XXXX' END ENABLE ; CREATE MASK BANK_SCHEMA.MASK_DRIVERS_LICENSE_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C FOR COLUMN CUSTOMER_DRIVERS_LICENSE_NUMBER RETURN CASE WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 THEN C . CUSTOMER_DRIVERS_LICENSE_NUMBER WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'TELLER' ) = 1 THEN C . CUSTOMER_DRIVERS_LICENSE_NUMBER WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 THEN C . CUSTOMER_DRIVERS_LICENSE_NUMBER ELSE '*************' END ENABLE ; CREATE MASK BANK_SCHEMA.MASK_LOGIN_ID_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C FOR COLUMN CUSTOMER_LOGIN_ID RETURN CASE WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 THEN C . CUSTOMER_LOGIN_ID WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 THEN C . CUSTOMER_LOGIN_ID ELSE '*****' END ENABLE ; CREATE MASK BANK_SCHEMA.MASK_SECURITY_QUESTION_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C FOR COLUMN CUSTOMER_SECURITY_QUESTION RETURN CASE WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 THEN C . CUSTOMER_SECURITY_QUESTION WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 THEN C . CUSTOMER_SECURITY_QUESTION ELSE '*****' END ENABLE ; CREATE MASK BANK_SCHEMA.MASK_SECURITY_QUESTION_ANSWER_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C FOR COLUMN CUSTOMER_SECURITY_QUESTION_ANSWER RETURN CASE WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 THEN C . CUSTOMER_SECURITY_QUESTION_ANSWER WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 THEN C . CUSTOMER_SECURITY_QUESTION_ANSWER ELSE '*****' END ENABLE ; ALTER TABLE BANK_SCHEMA.CUSTOMERS ACTIVATE ROW ACCESS CONTROL ACTIVATE COLUMN ACCESS CONTROL ;
 ```
 
 Back cover
@@ -397,10 +390,10 @@ Implement roles and separation of duties
 
 Leverage row permissions on the database
 
-Protect columns by defining column masks
-
 This IBM Redpaper publication provides information about the IBM i 7.2 feature of IBM DB2 for i Row and Column Access Control (RCAC). It offers a broad description of the function and advantages of controlling access to data in a comprehensive and transparent way. This publication helps you understand the capabilities of RCAC and provides examples of defining, creating, and implementing the row permissions and column masks in a relational database environment.
 
+Protect columns by defining column masks
+
 This paper is intended for database engineers, data-centric application developers, and security officers who want to design and implement RCAC as a part of their data control and governance policy. A solid background in IBM i object level security, DB2 for i relational database concepts, and SQL is assumed.
 
 <!-- image -->
diff --git a/tests/data/groundtruth/docling_v2/redp5110_sampled.pages.json b/tests/data/groundtruth/docling_v2/redp5110_sampled.pages.json
index b6552e8c..dc72db6d 100644
--- a/tests/data/groundtruth/docling_v2/redp5110_sampled.pages.json
+++ b/tests/data/groundtruth/docling_v2/redp5110_sampled.pages.json
@@ -1 +1 @@
-[{"page_no": 0, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "ibm.com", "bbox": {"l": 36.900002, "t": 751.23, "r": 98.600998, "b": 765.105, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "/redbooks", "bbox": {"l": 98.580002, "t": 751.23, "r": 164.4585, "b": 765.105, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Redpaper", "bbox": {"l": 314.70001, "t": 711.50856, "r": 580.52002, "b": 773.772959, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Front cover", "bbox": {"l": 287.82001, "t": 28.54803000000004, "r": 418.83356, "b": 50.748050000000035, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Row and Column Access Control ", "bbox": {"l": 35.700001, "t": 84.58654999999987, "r": 584.64288, "b": 122.82097999999996, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Support in IBM DB2 for i", "bbox": {"l": 35.700001, "t": 127.60668999999996, "r": 447.66919000000007, "b": 165.84113000000002, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Jim Bainbridge", "bbox": {"l": 509.22, "t": 575.71201, "r": 581.34119, "b": 586.392, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Hernando Bedoya", "bbox": {"l": 497.70001, "t": 589.752, "r": 581.3736, "b": 600.43199, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Rob Bestgen", "bbox": {"l": 521.40002, "t": 603.73199, "r": 581.34003, "b": 614.4119900000001, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Mike Cain", "bbox": {"l": 534.12, "t": 617.71199, "r": 581.31598, "b": 628.39198, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Dan Cruikshank", "bbox": {"l": 505.43999999999994, "t": 631.75198, "r": 581.29077, "b": 642.4319800000001, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Jim Denton", "bbox": {"l": 527.22003, "t": 645.73198, "r": 581.29926, "b": 656.41197, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Doug Mack", "bbox": {"l": 527.64001, "t": 659.71198, "r": 581.30884, "b": 670.39197, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Tom McKinley", "bbox": {"l": 514.38, "t": 673.75197, "r": 581.38678, "b": 684.43197, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Kent Milligan", "bbox": {"l": 518.82001, "t": 687.73197, "r": 581.33759, "b": 698.411972, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Implement roles and separation ", "bbox": {"l": 36.119999, "t": 296.13828, "r": 216.00064, "b": 308.58047, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "of duties", "bbox": {"l": 36.119999, "t": 313.11838000000006, "r": 84.527145, "b": 325.56058, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "Leverage", "bbox": {"l": 35.759315, "t": 350.13881999999995, "r": 80.409691, "b": 362.58102, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "row permissions on ", "bbox": {"l": 151.8503, "t": 350.13881999999995, "r": 202.45404, "b": 362.58102, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "the", "bbox": {"l": 35.759315, "t": 367.11893, "r": 50.758106, "b": 379.56112999999993, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "database", "bbox": {"l": 86.755211, "t": 367.11893, "r": 107.75352000000001, "b": 379.56112999999993, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Protect", "bbox": {"l": 36.059887, "t": 404.13937, "r": 73.020607, "b": 416.58157, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "columns by defining ", "bbox": {"l": 152.62831, "t": 404.13937, "r": 195.2753, "b": 416.58157, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "column", "bbox": {"l": 36.059887, "t": 421.11948, "r": 73.311806, "b": 433.56167999999997, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "masks", "bbox": {"l": 73.311806, "t": 421.11948, "r": 117.33681, "b": 433.56167999999997, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 6, "label": "page_footer", "bbox": {"l": 36.900002, "t": 751.23, "r": 164.4585, "b": 765.105, "coord_origin": "TOPLEFT"}, "confidence": 0.7180292010307312, "cells": [{"id": 0, "text": "ibm.com", "bbox": {"l": 36.900002, "t": 751.23, "r": 98.600998, "b": 765.105, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "/redbooks", "bbox": {"l": 98.580002, "t": 751.23, "r": 164.4585, "b": 765.105, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "picture", "bbox": {"l": 316.9404296875, "t": 710.1278686523438, "r": 581.354736328125, "b": 774.4259033203125, "coord_origin": "TOPLEFT"}, "confidence": 0.577752947807312, "cells": [{"id": 2, "text": "Redpaper", "bbox": {"l": 314.70001, "t": 711.50856, "r": 580.52002, "b": 773.772959, "coord_origin": "TOPLEFT"}}], "children": [{"id": 11, "label": "text", "bbox": {"l": 314.70001, "t": 711.50856, "r": 580.52002, "b": 773.772959, "coord_origin": "TOPLEFT"}, "confidence": 0.5870781540870667, "cells": [{"id": 2, "text": "Redpaper", "bbox": {"l": 314.70001, "t": 711.50856, "r": 580.52002, "b": 773.772959, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 12, "label": "text", "bbox": {"l": 287.82001, "t": 28.54803000000004, "r": 418.83356, "b": 50.748050000000035, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 3, "text": "Front cover", "bbox": {"l": 287.82001, "t": 28.54803000000004, "r": 418.83356, "b": 50.748050000000035, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "section_header", "bbox": {"l": 35.700001, "t": 84.58654999999987, "r": 584.64288, "b": 165.84113000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.8281130790710449, "cells": [{"id": 4, "text": "Row and Column Access Control ", "bbox": {"l": 35.700001, "t": 84.58654999999987, "r": 584.64288, "b": 122.82097999999996, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Support in IBM DB2 for i", "bbox": {"l": 35.700001, "t": 127.60668999999996, "r": 447.66919000000007, "b": 165.84113000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "picture", "bbox": {"l": 33.09040069580078, "t": 293.0328369140625, "r": 585.1502075195312, "b": 702.4530029296875, "coord_origin": "TOPLEFT"}, "confidence": 0.5889471173286438, "cells": [{"id": 6, "text": "Jim Bainbridge", "bbox": {"l": 509.22, "t": 575.71201, "r": 581.34119, "b": 586.392, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Hernando Bedoya", "bbox": {"l": 497.70001, "t": 589.752, "r": 581.3736, "b": 600.43199, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Rob Bestgen", "bbox": {"l": 521.40002, "t": 603.73199, "r": 581.34003, "b": 614.4119900000001, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Mike Cain", "bbox": {"l": 534.12, "t": 617.71199, "r": 581.31598, "b": 628.39198, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Dan Cruikshank", "bbox": {"l": 505.43999999999994, "t": 631.75198, "r": 581.29077, "b": 642.4319800000001, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Jim Denton", "bbox": {"l": 527.22003, "t": 645.73198, "r": 581.29926, "b": 656.41197, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Doug Mack", "bbox": {"l": 527.64001, "t": 659.71198, "r": 581.30884, "b": 670.39197, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Tom McKinley", "bbox": {"l": 514.38, "t": 673.75197, "r": 581.38678, "b": 684.43197, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Kent Milligan", "bbox": {"l": 518.82001, "t": 687.73197, "r": 581.33759, "b": 698.411972, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Implement roles and separation ", "bbox": {"l": 36.119999, "t": 296.13828, "r": 216.00064, "b": 308.58047, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "of duties", "bbox": {"l": 36.119999, "t": 313.11838000000006, "r": 84.527145, "b": 325.56058, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "Leverage", "bbox": {"l": 35.759315, "t": 350.13881999999995, "r": 80.409691, "b": 362.58102, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "row permissions on ", "bbox": {"l": 151.8503, "t": 350.13881999999995, "r": 202.45404, "b": 362.58102, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "the", "bbox": {"l": 35.759315, "t": 367.11893, "r": 50.758106, "b": 379.56112999999993, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "database", "bbox": {"l": 86.755211, "t": 367.11893, "r": 107.75352000000001, "b": 379.56112999999993, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Protect", "bbox": {"l": 36.059887, "t": 404.13937, "r": 73.020607, "b": 416.58157, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "columns by defining ", "bbox": {"l": 152.62831, "t": 404.13937, "r": 195.2753, "b": 416.58157, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "column", "bbox": {"l": 36.059887, "t": 421.11948, "r": 73.311806, "b": 433.56167999999997, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "masks", "bbox": {"l": 73.311806, "t": 421.11948, "r": 117.33681, "b": 433.56167999999997, "coord_origin": "TOPLEFT"}}], "children": [{"id": 5, "label": "text", "bbox": {"l": 497.70001, "t": 575.71201, "r": 581.38678, "b": 698.411972, "coord_origin": "TOPLEFT"}, "confidence": 0.762180745601654, "cells": [{"id": 6, "text": "Jim Bainbridge", "bbox": {"l": 509.22, "t": 575.71201, "r": 581.34119, "b": 586.392, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Hernando Bedoya", "bbox": {"l": 497.70001, "t": 589.752, "r": 581.3736, "b": 600.43199, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Rob Bestgen", "bbox": {"l": 521.40002, "t": 603.73199, "r": 581.34003, "b": 614.4119900000001, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Mike Cain", "bbox": {"l": 534.12, "t": 617.71199, "r": 581.31598, "b": 628.39198, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Dan Cruikshank", "bbox": {"l": 505.43999999999994, "t": 631.75198, "r": 581.29077, "b": 642.4319800000001, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Jim Denton", "bbox": {"l": 527.22003, "t": 645.73198, "r": 581.29926, "b": 656.41197, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Doug Mack", "bbox": {"l": 527.64001, "t": 659.71198, "r": 581.30884, "b": 670.39197, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Tom McKinley", "bbox": {"l": 514.38, "t": 673.75197, "r": 581.38678, "b": 684.43197, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Kent Milligan", "bbox": {"l": 518.82001, "t": 687.73197, "r": 581.33759, "b": 698.411972, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 36.119999, "t": 296.13828, "r": 216.00064, "b": 325.56058, "coord_origin": "TOPLEFT"}, "confidence": 0.8502885103225708, "cells": [{"id": 15, "text": "Implement roles and separation ", "bbox": {"l": 36.119999, "t": 296.13828, "r": 216.00064, "b": 308.58047, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "of duties", "bbox": {"l": 36.119999, "t": 313.11838000000006, "r": 84.527145, "b": 325.56058, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 35.759315, "t": 350.13881999999995, "r": 202.45404, "b": 379.56112999999993, "coord_origin": "TOPLEFT"}, "confidence": 0.8639556169509888, "cells": [{"id": 17, "text": "Leverage", "bbox": {"l": 35.759315, "t": 350.13881999999995, "r": 80.409691, "b": 362.58102, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "row permissions on ", "bbox": {"l": 151.8503, "t": 350.13881999999995, "r": 202.45404, "b": 362.58102, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "the", "bbox": {"l": 35.759315, "t": 367.11893, "r": 50.758106, "b": 379.56112999999993, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "database", "bbox": {"l": 86.755211, "t": 367.11893, "r": 107.75352000000001, "b": 379.56112999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 36.059887, "t": 404.13937, "r": 195.2753, "b": 433.56167999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.842113196849823, "cells": [{"id": 21, "text": "Protect", "bbox": {"l": 36.059887, "t": 404.13937, "r": 73.020607, "b": 416.58157, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "columns by defining ", "bbox": {"l": 152.62831, "t": 404.13937, "r": 195.2753, "b": 416.58157, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "column", "bbox": {"l": 36.059887, "t": 421.11948, "r": 73.311806, "b": 433.56167999999997, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "masks", "bbox": {"l": 73.311806, "t": 421.11948, "r": 117.33681, "b": 433.56167999999997, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 0, "label": "picture", "bbox": {"l": 513.4560546875, "t": 26.085098266601562, "r": 586.1583251953125, "b": 54.81915283203125, "coord_origin": "TOPLEFT"}, "confidence": 0.9272358417510986, "cells": [], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_footer", "id": 6, "page_no": 0, "cluster": {"id": 6, "label": "page_footer", "bbox": {"l": 36.900002, "t": 751.23, "r": 164.4585, "b": 765.105, "coord_origin": "TOPLEFT"}, "confidence": 0.7180292010307312, "cells": [{"id": 0, "text": "ibm.com", "bbox": {"l": 36.900002, "t": 751.23, "r": 98.600998, "b": 765.105, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "/redbooks", "bbox": {"l": 98.580002, "t": 751.23, "r": 164.4585, "b": 765.105, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "ibm.com /redbooks"}, {"label": "picture", "id": 12, "page_no": 0, "cluster": {"id": 12, "label": "picture", "bbox": {"l": 316.9404296875, "t": 710.1278686523438, "r": 581.354736328125, "b": 774.4259033203125, "coord_origin": "TOPLEFT"}, "confidence": 0.577752947807312, "cells": [{"id": 2, "text": "Redpaper", "bbox": {"l": 314.70001, "t": 711.50856, "r": 580.52002, "b": 773.772959, "coord_origin": "TOPLEFT"}}], "children": [{"id": 11, "label": "text", "bbox": {"l": 314.70001, "t": 711.50856, "r": 580.52002, "b": 773.772959, "coord_origin": "TOPLEFT"}, "confidence": 0.5870781540870667, "cells": [{"id": 2, "text": "Redpaper", "bbox": {"l": 314.70001, "t": 711.50856, "r": 580.52002, "b": 773.772959, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "text", "id": 12, "page_no": 0, "cluster": {"id": 12, "label": "text", "bbox": {"l": 287.82001, "t": 28.54803000000004, "r": 418.83356, "b": 50.748050000000035, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 3, "text": "Front cover", "bbox": {"l": 287.82001, "t": 28.54803000000004, "r": 418.83356, "b": 50.748050000000035, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Front cover"}, {"label": "section_header", "id": 4, "page_no": 0, "cluster": {"id": 4, "label": "section_header", "bbox": {"l": 35.700001, "t": 84.58654999999987, "r": 584.64288, "b": 165.84113000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.8281130790710449, "cells": [{"id": 4, "text": "Row and Column Access Control ", "bbox": {"l": 35.700001, "t": 84.58654999999987, "r": 584.64288, "b": 122.82097999999996, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Support in IBM DB2 for i", "bbox": {"l": 35.700001, "t": 127.60668999999996, "r": 447.66919000000007, "b": 165.84113000000002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Row and Column Access Control Support in IBM DB2 for i"}, {"label": "picture", "id": 10, "page_no": 0, "cluster": {"id": 10, "label": "picture", "bbox": {"l": 33.09040069580078, "t": 293.0328369140625, "r": 585.1502075195312, "b": 702.4530029296875, "coord_origin": "TOPLEFT"}, "confidence": 0.5889471173286438, "cells": [{"id": 6, "text": "Jim Bainbridge", "bbox": {"l": 509.22, "t": 575.71201, "r": 581.34119, "b": 586.392, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Hernando Bedoya", "bbox": {"l": 497.70001, "t": 589.752, "r": 581.3736, "b": 600.43199, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Rob Bestgen", "bbox": {"l": 521.40002, "t": 603.73199, "r": 581.34003, "b": 614.4119900000001, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Mike Cain", "bbox": {"l": 534.12, "t": 617.71199, "r": 581.31598, "b": 628.39198, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Dan Cruikshank", "bbox": {"l": 505.43999999999994, "t": 631.75198, "r": 581.29077, "b": 642.4319800000001, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Jim Denton", "bbox": {"l": 527.22003, "t": 645.73198, "r": 581.29926, "b": 656.41197, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Doug Mack", "bbox": {"l": 527.64001, "t": 659.71198, "r": 581.30884, "b": 670.39197, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Tom McKinley", "bbox": {"l": 514.38, "t": 673.75197, "r": 581.38678, "b": 684.43197, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Kent Milligan", "bbox": {"l": 518.82001, "t": 687.73197, "r": 581.33759, "b": 698.411972, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Implement roles and separation ", "bbox": {"l": 36.119999, "t": 296.13828, "r": 216.00064, "b": 308.58047, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "of duties", "bbox": {"l": 36.119999, "t": 313.11838000000006, "r": 84.527145, "b": 325.56058, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "Leverage", "bbox": {"l": 35.759315, "t": 350.13881999999995, "r": 80.409691, "b": 362.58102, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "row permissions on ", "bbox": {"l": 151.8503, "t": 350.13881999999995, "r": 202.45404, "b": 362.58102, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "the", "bbox": {"l": 35.759315, "t": 367.11893, "r": 50.758106, "b": 379.56112999999993, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "database", "bbox": {"l": 86.755211, "t": 367.11893, "r": 107.75352000000001, "b": 379.56112999999993, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Protect", "bbox": {"l": 36.059887, "t": 404.13937, "r": 73.020607, "b": 416.58157, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "columns by defining ", "bbox": {"l": 152.62831, "t": 404.13937, "r": 195.2753, "b": 416.58157, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "column", "bbox": {"l": 36.059887, "t": 421.11948, "r": 73.311806, "b": 433.56167999999997, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "masks", "bbox": {"l": 73.311806, "t": 421.11948, "r": 117.33681, "b": 433.56167999999997, "coord_origin": "TOPLEFT"}}], "children": [{"id": 5, "label": "text", "bbox": {"l": 497.70001, "t": 575.71201, "r": 581.38678, "b": 698.411972, "coord_origin": "TOPLEFT"}, "confidence": 0.762180745601654, "cells": [{"id": 6, "text": "Jim Bainbridge", "bbox": {"l": 509.22, "t": 575.71201, "r": 581.34119, "b": 586.392, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Hernando Bedoya", "bbox": {"l": 497.70001, "t": 589.752, "r": 581.3736, "b": 600.43199, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Rob Bestgen", "bbox": {"l": 521.40002, "t": 603.73199, "r": 581.34003, "b": 614.4119900000001, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Mike Cain", "bbox": {"l": 534.12, "t": 617.71199, "r": 581.31598, "b": 628.39198, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Dan Cruikshank", "bbox": {"l": 505.43999999999994, "t": 631.75198, "r": 581.29077, "b": 642.4319800000001, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Jim Denton", "bbox": {"l": 527.22003, "t": 645.73198, "r": 581.29926, "b": 656.41197, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Doug Mack", "bbox": {"l": 527.64001, "t": 659.71198, "r": 581.30884, "b": 670.39197, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Tom McKinley", "bbox": {"l": 514.38, "t": 673.75197, "r": 581.38678, "b": 684.43197, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Kent Milligan", "bbox": {"l": 518.82001, "t": 687.73197, "r": 581.33759, "b": 698.411972, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 36.119999, "t": 296.13828, "r": 216.00064, "b": 325.56058, "coord_origin": "TOPLEFT"}, "confidence": 0.8502885103225708, "cells": [{"id": 15, "text": "Implement roles and separation ", "bbox": {"l": 36.119999, "t": 296.13828, "r": 216.00064, "b": 308.58047, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "of duties", "bbox": {"l": 36.119999, "t": 313.11838000000006, "r": 84.527145, "b": 325.56058, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 35.759315, "t": 350.13881999999995, "r": 202.45404, "b": 379.56112999999993, "coord_origin": "TOPLEFT"}, "confidence": 0.8639556169509888, "cells": [{"id": 17, "text": "Leverage", "bbox": {"l": 35.759315, "t": 350.13881999999995, "r": 80.409691, "b": 362.58102, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "row permissions on ", "bbox": {"l": 151.8503, "t": 350.13881999999995, "r": 202.45404, "b": 362.58102, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "the", "bbox": {"l": 35.759315, "t": 367.11893, "r": 50.758106, "b": 379.56112999999993, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "database", "bbox": {"l": 86.755211, "t": 367.11893, "r": 107.75352000000001, "b": 379.56112999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 36.059887, "t": 404.13937, "r": 195.2753, "b": 433.56167999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.842113196849823, "cells": [{"id": 21, "text": "Protect", "bbox": {"l": 36.059887, "t": 404.13937, "r": 73.020607, "b": 416.58157, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "columns by defining ", "bbox": {"l": 152.62831, "t": 404.13937, "r": 195.2753, "b": 416.58157, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "column", "bbox": {"l": 36.059887, "t": 421.11948, "r": 73.311806, "b": 433.56167999999997, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "masks", "bbox": {"l": 73.311806, "t": 421.11948, "r": 117.33681, "b": 433.56167999999997, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "picture", "id": 0, "page_no": 0, "cluster": {"id": 0, "label": "picture", "bbox": {"l": 513.4560546875, "t": 26.085098266601562, "r": 586.1583251953125, "b": 54.81915283203125, "coord_origin": "TOPLEFT"}, "confidence": 0.9272358417510986, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "body": [{"label": "picture", "id": 12, "page_no": 0, "cluster": {"id": 12, "label": "picture", "bbox": {"l": 316.9404296875, "t": 710.1278686523438, "r": 581.354736328125, "b": 774.4259033203125, "coord_origin": "TOPLEFT"}, "confidence": 0.577752947807312, "cells": [{"id": 2, "text": "Redpaper", "bbox": {"l": 314.70001, "t": 711.50856, "r": 580.52002, "b": 773.772959, "coord_origin": "TOPLEFT"}}], "children": [{"id": 11, "label": "text", "bbox": {"l": 314.70001, "t": 711.50856, "r": 580.52002, "b": 773.772959, "coord_origin": "TOPLEFT"}, "confidence": 0.5870781540870667, "cells": [{"id": 2, "text": "Redpaper", "bbox": {"l": 314.70001, "t": 711.50856, "r": 580.52002, "b": 773.772959, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "text", "id": 12, "page_no": 0, "cluster": {"id": 12, "label": "text", "bbox": {"l": 287.82001, "t": 28.54803000000004, "r": 418.83356, "b": 50.748050000000035, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 3, "text": "Front cover", "bbox": {"l": 287.82001, "t": 28.54803000000004, "r": 418.83356, "b": 50.748050000000035, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Front cover"}, {"label": "section_header", "id": 4, "page_no": 0, "cluster": {"id": 4, "label": "section_header", "bbox": {"l": 35.700001, "t": 84.58654999999987, "r": 584.64288, "b": 165.84113000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.8281130790710449, "cells": [{"id": 4, "text": "Row and Column Access Control ", "bbox": {"l": 35.700001, "t": 84.58654999999987, "r": 584.64288, "b": 122.82097999999996, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Support in IBM DB2 for i", "bbox": {"l": 35.700001, "t": 127.60668999999996, "r": 447.66919000000007, "b": 165.84113000000002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Row and Column Access Control Support in IBM DB2 for i"}, {"label": "picture", "id": 10, "page_no": 0, "cluster": {"id": 10, "label": "picture", "bbox": {"l": 33.09040069580078, "t": 293.0328369140625, "r": 585.1502075195312, "b": 702.4530029296875, "coord_origin": "TOPLEFT"}, "confidence": 0.5889471173286438, "cells": [{"id": 6, "text": "Jim Bainbridge", "bbox": {"l": 509.22, "t": 575.71201, "r": 581.34119, "b": 586.392, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Hernando Bedoya", "bbox": {"l": 497.70001, "t": 589.752, "r": 581.3736, "b": 600.43199, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Rob Bestgen", "bbox": {"l": 521.40002, "t": 603.73199, "r": 581.34003, "b": 614.4119900000001, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Mike Cain", "bbox": {"l": 534.12, "t": 617.71199, "r": 581.31598, "b": 628.39198, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Dan Cruikshank", "bbox": {"l": 505.43999999999994, "t": 631.75198, "r": 581.29077, "b": 642.4319800000001, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Jim Denton", "bbox": {"l": 527.22003, "t": 645.73198, "r": 581.29926, "b": 656.41197, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Doug Mack", "bbox": {"l": 527.64001, "t": 659.71198, "r": 581.30884, "b": 670.39197, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Tom McKinley", "bbox": {"l": 514.38, "t": 673.75197, "r": 581.38678, "b": 684.43197, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Kent Milligan", "bbox": {"l": 518.82001, "t": 687.73197, "r": 581.33759, "b": 698.411972, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Implement roles and separation ", "bbox": {"l": 36.119999, "t": 296.13828, "r": 216.00064, "b": 308.58047, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "of duties", "bbox": {"l": 36.119999, "t": 313.11838000000006, "r": 84.527145, "b": 325.56058, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "Leverage", "bbox": {"l": 35.759315, "t": 350.13881999999995, "r": 80.409691, "b": 362.58102, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "row permissions on ", "bbox": {"l": 151.8503, "t": 350.13881999999995, "r": 202.45404, "b": 362.58102, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "the", "bbox": {"l": 35.759315, "t": 367.11893, "r": 50.758106, "b": 379.56112999999993, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "database", "bbox": {"l": 86.755211, "t": 367.11893, "r": 107.75352000000001, "b": 379.56112999999993, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Protect", "bbox": {"l": 36.059887, "t": 404.13937, "r": 73.020607, "b": 416.58157, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "columns by defining ", "bbox": {"l": 152.62831, "t": 404.13937, "r": 195.2753, "b": 416.58157, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "column", "bbox": {"l": 36.059887, "t": 421.11948, "r": 73.311806, "b": 433.56167999999997, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "masks", "bbox": {"l": 73.311806, "t": 421.11948, "r": 117.33681, "b": 433.56167999999997, "coord_origin": "TOPLEFT"}}], "children": [{"id": 5, "label": "text", "bbox": {"l": 497.70001, "t": 575.71201, "r": 581.38678, "b": 698.411972, "coord_origin": "TOPLEFT"}, "confidence": 0.762180745601654, "cells": [{"id": 6, "text": "Jim Bainbridge", "bbox": {"l": 509.22, "t": 575.71201, "r": 581.34119, "b": 586.392, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Hernando Bedoya", "bbox": {"l": 497.70001, "t": 589.752, "r": 581.3736, "b": 600.43199, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Rob Bestgen", "bbox": {"l": 521.40002, "t": 603.73199, "r": 581.34003, "b": 614.4119900000001, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Mike Cain", "bbox": {"l": 534.12, "t": 617.71199, "r": 581.31598, "b": 628.39198, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Dan Cruikshank", "bbox": {"l": 505.43999999999994, "t": 631.75198, "r": 581.29077, "b": 642.4319800000001, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Jim Denton", "bbox": {"l": 527.22003, "t": 645.73198, "r": 581.29926, "b": 656.41197, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Doug Mack", "bbox": {"l": 527.64001, "t": 659.71198, "r": 581.30884, "b": 670.39197, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Tom McKinley", "bbox": {"l": 514.38, "t": 673.75197, "r": 581.38678, "b": 684.43197, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Kent Milligan", "bbox": {"l": 518.82001, "t": 687.73197, "r": 581.33759, "b": 698.411972, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 36.119999, "t": 296.13828, "r": 216.00064, "b": 325.56058, "coord_origin": "TOPLEFT"}, "confidence": 0.8502885103225708, "cells": [{"id": 15, "text": "Implement roles and separation ", "bbox": {"l": 36.119999, "t": 296.13828, "r": 216.00064, "b": 308.58047, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "of duties", "bbox": {"l": 36.119999, "t": 313.11838000000006, "r": 84.527145, "b": 325.56058, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 35.759315, "t": 350.13881999999995, "r": 202.45404, "b": 379.56112999999993, "coord_origin": "TOPLEFT"}, "confidence": 0.8639556169509888, "cells": [{"id": 17, "text": "Leverage", "bbox": {"l": 35.759315, "t": 350.13881999999995, "r": 80.409691, "b": 362.58102, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "row permissions on ", "bbox": {"l": 151.8503, "t": 350.13881999999995, "r": 202.45404, "b": 362.58102, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "the", "bbox": {"l": 35.759315, "t": 367.11893, "r": 50.758106, "b": 379.56112999999993, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "database", "bbox": {"l": 86.755211, "t": 367.11893, "r": 107.75352000000001, "b": 379.56112999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 36.059887, "t": 404.13937, "r": 195.2753, "b": 433.56167999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.842113196849823, "cells": [{"id": 21, "text": "Protect", "bbox": {"l": 36.059887, "t": 404.13937, "r": 73.020607, "b": 416.58157, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "columns by defining ", "bbox": {"l": 152.62831, "t": 404.13937, "r": 195.2753, "b": 416.58157, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "column", "bbox": {"l": 36.059887, "t": 421.11948, "r": 73.311806, "b": 433.56167999999997, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "masks", "bbox": {"l": 73.311806, "t": 421.11948, "r": 117.33681, "b": 433.56167999999997, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "picture", "id": 0, "page_no": 0, "cluster": {"id": 0, "label": "picture", "bbox": {"l": 513.4560546875, "t": 26.085098266601562, "r": 586.1583251953125, "b": 54.81915283203125, "coord_origin": "TOPLEFT"}, "confidence": 0.9272358417510986, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "headers": [{"label": "page_footer", "id": 6, "page_no": 0, "cluster": {"id": 6, "label": "page_footer", "bbox": {"l": 36.900002, "t": 751.23, "r": 164.4585, "b": 765.105, "coord_origin": "TOPLEFT"}, "confidence": 0.7180292010307312, "cells": [{"id": 0, "text": "ibm.com", "bbox": {"l": 36.900002, "t": 751.23, "r": 98.600998, "b": 765.105, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "/redbooks", "bbox": {"l": 98.580002, "t": 751.23, "r": 164.4585, "b": 765.105, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "ibm.com /redbooks"}]}}, {"page_no": 1, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "' Copyright IBM Corp. 2014. All rights reserved.", "bbox": {"l": 64.800003, "t": 755.538002, "r": 257.24335, "b": 763.863001, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "iii", "bbox": {"l": 538.85999, "t": 754.848721, "r": 547.25928, "b": 764.06172, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Contents", "bbox": {"l": 64.800003, "t": 73.84802000000002, "r": 168.73441, "b": 96.04803000000004, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Notices", "bbox": {"l": 136.8, "t": 132.64862000000005, "r": 172.89404, "b": 141.86163, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vii", "bbox": {"l": 175.01952, "t": 132.64862000000005, "r": 547.18982, "b": 141.86163, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Trademarks", "bbox": {"l": 136.79901, "t": 145.12847999999997, "r": 189.86537, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 195.39685, "t": 145.12847999999997, "r": 530.05121, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "viii", "bbox": {"l": 535.5827, "t": 145.12847999999997, "r": 547.18286, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "DB2 for i Center of Excellence", "bbox": {"l": 136.79901, "t": 167.62811, "r": 279.39731, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ix", "bbox": {"l": 280.61942, "t": 167.62811, "r": 547.1908, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Preface", "bbox": {"l": 136.79901, "t": 190.12775, "r": 172.84424, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi", "bbox": {"l": 175.01852, "t": 190.12775, "r": 547.18286, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Authors . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi", "bbox": {"l": 136.79803, "t": 202.60760000000005, "r": 547.18085, "b": 211.82061999999996, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Now you can become a published author, too!", "bbox": {"l": 136.79803, "t": 215.14721999999995, "r": 339.18292, "b": 224.36023, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 344.71411, "t": 215.14721999999995, "r": 530.00812, "b": 224.36023, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "xiii", "bbox": {"l": 535.53925, "t": 215.14721999999995, "r": 547.13879, "b": 224.36023, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Comments welcome. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 136.79803, "t": 227.62707999999998, "r": 529.99506, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "xiii", "bbox": {"l": 535.5495, "t": 227.62707999999998, "r": 547.19788, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Stay connected to IBM Redbooks", "bbox": {"l": 136.79807, "t": 240.10693000000003, "r": 284.02866, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 289.54449, "t": 240.10693000000003, "r": 529.48242, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "xiv", "bbox": {"l": 534.99829, "t": 240.10693000000003, "r": 547.12115, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Chapter 1. Securing and protecting IBM DB2 data", "bbox": {"l": 136.79807, "t": 262.60657000000003, "r": 373.17566, "b": 271.81958, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 375.11798, "t": 262.60657000000003, "r": 536.09589, "b": 271.81958, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "1", "bbox": {"l": 541.64685, "t": 262.60657000000003, "r": 547.19781, "b": 271.81958, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "1.1", "bbox": {"l": 136.79808, "t": 274.60637999999994, "r": 150.88702, "b": 283.8194, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "Security fundamentals. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2", "bbox": {"l": 156.5226, "t": 274.60637999999994, "r": 549.84723, "b": 283.8194, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "1.2", "bbox": {"l": 136.79807, "t": 287.14606000000003, "r": 150.62746, "b": 296.35904, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Current state of IBM i security . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.15923, "t": 287.14606000000003, "r": 536.12933, "b": 296.35904, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "2", "bbox": {"l": 541.66113, "t": 287.14606000000003, "r": 547.19287, "b": 296.35904, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "1.3", "bbox": {"l": 136.79807, "t": 299.62595, "r": 150.84943, "b": 308.83893, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "DB2 for i security controls . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3", "bbox": {"l": 156.46996, "t": 299.62595, "r": 549.84723, "b": 308.83893, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "1.3.1", "bbox": {"l": 151.1972, "t": 312.1058300000001, "r": 173.38289, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Existing row and column control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.92932, "t": 312.1058300000001, "r": 536.05511, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "4", "bbox": {"l": 541.6015, "t": 312.1058300000001, "r": 547.14795, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "1.3.2", "bbox": {"l": 151.1972, "t": 324.64548, "r": 173.4189, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "New controls: Row and Column Access Control. . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.97432, "t": 324.64548, "r": 536.08008, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "5", "bbox": {"l": 541.6355, "t": 324.64548, "r": 547.19092, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "Chapter 2. Roles and separation of duties", "bbox": {"l": 136.79704, "t": 347.14511, "r": 336.82071, "b": 356.35809, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 338.99701, "t": 347.14511, "r": 536.09088, "b": 356.35809, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "7", "bbox": {"l": 541.64282, "t": 347.14511, "r": 547.19476, "b": 356.35809, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "2.1", "bbox": {"l": 136.79704, "t": 359.14493, "r": 150.644, "b": 368.35791, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Roles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.18277, "t": 359.14493, "r": 536.12714, "b": 368.35791, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "8", "bbox": {"l": 541.66589, "t": 359.14493, "r": 547.20471, "b": 368.35791, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "2.1.1", "bbox": {"l": 151.1972, "t": 371.62482, "r": 173.60995, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "DDM and DRDA application server access: QIBM_DB_DDMDRDA . . . . . . . . . . .", "bbox": {"l": 176.41154, "t": 371.62482, "r": 535.9527, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "8", "bbox": {"l": 541.55585, "t": 371.62482, "r": 547.15906, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "2.1.2", "bbox": {"l": 151.1972, "t": 384.10470999999995, "r": 173.41664, "b": 393.31769, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "Toolbox application server access: QIBM_DB_ZDA. . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.97151, "t": 384.10470999999995, "r": 536.04108, "b": 393.31769, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "8", "bbox": {"l": 541.59595, "t": 384.10470999999995, "r": 547.15082, "b": 393.31769, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "2.1.3", "bbox": {"l": 151.1972, "t": 396.64435, "r": 173.41859, "b": 405.85733, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Database Administrator function: QIBM_DB_SQLADM . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.97394, "t": 396.64435, "r": 536.07489, "b": 405.85733, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "9", "bbox": {"l": 541.63025, "t": 396.64435, "r": 547.18561, "b": 405.85733, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "2.1.4", "bbox": {"l": 151.1972, "t": 409.12424000000004, "r": 173.38629, "b": 418.33722, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Database Information function: QIBM_DB_SYSMON", "bbox": {"l": 178.93356, "t": 409.12424000000004, "r": 411.27048, "b": 418.33722, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": ". . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 416.81775, "t": 409.12424000000004, "r": 536.08411, "b": 418.33722, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "9", "bbox": {"l": 541.63135, "t": 409.12424000000004, "r": 547.17865, "b": 418.33722, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "2.1.5", "bbox": {"l": 151.1972, "t": 421.60413, "r": 173.44926, "b": 430.81711, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Security Administrator function: QIBM_DB_SECADM . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 179.01228, "t": 421.60413, "r": 536.03589, "b": 430.81711, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "9", "bbox": {"l": 541.59894, "t": 421.60413, "r": 547.16193, "b": 430.81711, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "2.1.6", "bbox": {"l": 151.1972, "t": 434.1437700000001, "r": 173.32208, "b": 443.35675, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Change Function Usage CL command . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.8533, "t": 434.1437700000001, "r": 530.57318, "b": 443.35675, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "10", "bbox": {"l": 536.10443, "t": 434.1437700000001, "r": 547.16687, "b": 443.35675, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "2.1.7", "bbox": {"l": 151.1972, "t": 446.62366, "r": 173.35822, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "Verifying function usage IDs for RCAC with the FUNCTION_USAGE view . . . . .", "bbox": {"l": 178.89848, "t": 446.62366, "r": 530.53522, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "10", "bbox": {"l": 536.0755, "t": 446.62366, "r": 547.15601, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "2.2", "bbox": {"l": 136.79704, "t": 459.10355, "r": 150.85457, "b": 468.31653, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "Separation of duties . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10", "bbox": {"l": 156.47758, "t": 459.10355, "r": 547.25659, "b": 468.31653, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "Chapter 3. Row and Column Access Control", "bbox": {"l": 136.79703, "t": 481.60318, "r": 348.68503, "b": 490.81616, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 350.09741, "t": 481.60318, "r": 530.53961, "b": 490.81616, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "13", "bbox": {"l": 536.09167, "t": 481.60318, "r": 547.1958, "b": 490.81616, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "3.1", "bbox": {"l": 136.79703, "t": 493.603, "r": 150.70105, "b": 502.81598, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Explanation of RCAC and the concept of access control . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.26266, "t": 493.603, "r": 530.4809, "b": 502.81598, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "14", "bbox": {"l": 536.04248, "t": 493.603, "r": 547.16571, "b": 502.81598, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "3.1.1", "bbox": {"l": 151.19719, "t": 506.14264, "r": 173.35429, "b": 515.35562, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "Row permission and column mask definitions", "bbox": {"l": 178.89357, "t": 506.14264, "r": 378.20786, "b": 515.35562, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 383.74713, "t": 506.14264, "r": 530.5379, "b": 515.35562, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "14", "bbox": {"l": 536.07721, "t": 506.14264, "r": 547.15576, "b": 515.35562, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "3.1.2", "bbox": {"l": 151.19719, "t": 518.62253, "r": 173.44292, "b": 527.83551, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "Enabling and activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 179.00435, "t": 518.62253, "r": 530.43475, "b": 527.83551, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "16", "bbox": {"l": 535.99622, "t": 518.62253, "r": 547.11908, "b": 527.83551, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "3.2", "bbox": {"l": 136.79703, "t": 531.1621700000001, "r": 150.64432, "b": 540.37517, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Special registers and built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.18323, "t": 531.1621700000001, "r": 530.52808, "b": 540.37517, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "18", "bbox": {"l": 536.06702, "t": 531.1621700000001, "r": 547.14484, "b": 540.37517, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "3.2.1", "bbox": {"l": 151.19719, "t": 543.64204, "r": 173.41321, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "Special registers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.96722, "t": 543.64204, "r": 530.49786, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "18", "bbox": {"l": 536.05188, "t": 543.64204, "r": 547.15991, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "3.2.2", "bbox": {"l": 151.19719, "t": 556.12192, "r": 173.35269, "b": 565.33492, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.89156, "t": 556.12192, "r": 530.56024, "b": 565.33492, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "19", "bbox": {"l": 536.09912, "t": 556.12192, "r": 547.17688, "b": 565.33492, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "3.3", "bbox": {"l": 136.79703, "t": 568.66156, "r": 150.62514, "b": 577.87456, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "VERIFY_GROUP_FOR_USER function . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.15639, "t": 568.66156, "r": 530.53027, "b": 577.87456, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "20", "bbox": {"l": 536.06152, "t": 568.66156, "r": 547.12402, "b": 577.87456, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "3.4", "bbox": {"l": 136.79703, "t": 581.14143, "r": 150.63004, "b": 590.35443, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "Establishing and controlling accessibility by using the RCAC rule text . . . . . . . . . . . . .", "bbox": {"l": 156.16325, "t": 581.14143, "r": 530.62994, "b": 590.35443, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "21", "bbox": {"l": 536.16315, "t": 581.14143, "r": 547.22955, "b": 590.35443, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "3.5", "bbox": {"l": 136.79701, "t": 593.62131, "r": 150.64413, "b": 602.8343, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "SELECT, INSERT, and UPDATE behavior with RCAC", "bbox": {"l": 156.18298, "t": 593.62131, "r": 394.7818, "b": 602.8343, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": ". . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 400.32065, "t": 593.62131, "r": 530.48358, "b": 602.8343, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "22", "bbox": {"l": 536.0224, "t": 593.62131, "r": 547.1001, "b": 602.8343, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "3.6", "bbox": {"l": 136.79701, "t": 606.16095, "r": 150.6642, "b": 615.37395, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "Human resources example . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.21107, "t": 606.16095, "r": 530.56512, "b": 615.37395, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "22", "bbox": {"l": 536.112, "t": 606.16095, "r": 547.20575, "b": 615.37395, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "3.6.1", "bbox": {"l": 151.19717, "t": 618.64082, "r": 173.41692, "b": 627.85382, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "Assigning the QIBM_DB_SECADM function ID to the consultants. . . . . . . . . . . .", "bbox": {"l": 178.97185, "t": 618.64082, "r": 530.49139, "b": 627.85382, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "23", "bbox": {"l": 536.04633, "t": 618.64082, "r": 547.15619, "b": 627.85382, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "3.6.2", "bbox": {"l": 151.19717, "t": 631.1206999999999, "r": 173.32271, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "Creating group profiles for the users and their roles . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.8541, "t": 631.1206999999999, "r": 530.56458, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "23", "bbox": {"l": 536.09601, "t": 631.1206999999999, "r": 547.15875, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "3.6.3", "bbox": {"l": 151.19717, "t": 643.66034, "r": 173.32227, "b": 652.87334, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "Demonstrating data access without RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.85353, "t": 643.66034, "r": 530.55695, "b": 652.87334, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "24", "bbox": {"l": 536.0882, "t": 643.66034, "r": 547.15076, "b": 652.87334, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "3.6.4", "bbox": {"l": 151.19717, "t": 656.14021, "r": 173.35289, "b": 665.35321, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "Defining and creating row permissions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.89182, "t": 656.14021, "r": 530.53412, "b": 665.35321, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "25", "bbox": {"l": 536.073, "t": 656.14021, "r": 547.15088, "b": 665.35321, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "3.6.5", "bbox": {"l": 151.19717, "t": 668.62009, "r": 173.35289, "b": 677.83309, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "Defining and creating column masks", "bbox": {"l": 178.89182, "t": 668.62009, "r": 339.45105, "b": 677.83309, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 344.98996, "t": 668.62009, "r": 530.54413, "b": 677.83309, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "26", "bbox": {"l": 536.08301, "t": 668.62009, "r": 547.16089, "b": 677.83309, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "3.6.6", "bbox": {"l": 151.19717, "t": 681.15973, "r": 173.38359, "b": 690.37273, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "Activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.93019, "t": 681.15973, "r": 530.54102, "b": 690.37273, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "28", "bbox": {"l": 536.08765, "t": 681.15973, "r": 547.18085, "b": 690.37273, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "3.6.7", "bbox": {"l": 151.19717, "t": 693.63961, "r": 173.32332, "b": 702.852615, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Demonstrating data access with RCAC", "bbox": {"l": 178.85486, "t": 693.63961, "r": 350.80011, "b": 702.852615, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 356.33163, "t": 693.63961, "r": 530.57507, "b": 702.852615, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "29", "bbox": {"l": 536.10663, "t": 693.63961, "r": 547.16968, "b": 702.852615, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "3.6.8", "bbox": {"l": 151.19717, "t": 706.119492, "r": 173.44592, "b": 715.332497, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "Demonstrating data access with a view and RCAC . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 179.00812, "t": 706.119492, "r": 530.43628, "b": 715.332497, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "32", "bbox": {"l": 535.99847, "t": 706.119492, "r": 547.12286, "b": 715.332497, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 2, "label": "page_footer", "bbox": {"l": 64.800003, "t": 755.538002, "r": 257.24335, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9473597407341003, "cells": [{"id": 0, "text": "' Copyright IBM Corp. 2014. All rights reserved.", "bbox": {"l": 64.800003, "t": 755.538002, "r": 257.24335, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "page_footer", "bbox": {"l": 538.85999, "t": 754.848721, "r": 547.25928, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.8926277160644531, "cells": [{"id": 1, "text": "iii", "bbox": {"l": 538.85999, "t": 754.848721, "r": 547.25928, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "section_header", "bbox": {"l": 64.800003, "t": 73.84802000000002, "r": 168.73441, "b": 96.04803000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9509142637252808, "cells": [{"id": 2, "text": "Contents", "bbox": {"l": 64.800003, "t": 73.84802000000002, "r": 168.73441, "b": 96.04803000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "document_index", "bbox": {"l": 136.1496124267578, "t": 132.0330352783203, "r": 547.5267944335938, "b": 715.6515502929688, "coord_origin": "TOPLEFT"}, "confidence": 0.9803681373596191, "cells": [{"id": 3, "text": "Notices", "bbox": {"l": 136.8, "t": 132.64862000000005, "r": 172.89404, "b": 141.86163, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vii", "bbox": {"l": 175.01952, "t": 132.64862000000005, "r": 547.18982, "b": 141.86163, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Trademarks", "bbox": {"l": 136.79901, "t": 145.12847999999997, "r": 189.86537, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 195.39685, "t": 145.12847999999997, "r": 530.05121, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "viii", "bbox": {"l": 535.5827, "t": 145.12847999999997, "r": 547.18286, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "DB2 for i Center of Excellence", "bbox": {"l": 136.79901, "t": 167.62811, "r": 279.39731, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ix", "bbox": {"l": 280.61942, "t": 167.62811, "r": 547.1908, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Preface", "bbox": {"l": 136.79901, "t": 190.12775, "r": 172.84424, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi", "bbox": {"l": 175.01852, "t": 190.12775, "r": 547.18286, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Authors . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi", "bbox": {"l": 136.79803, "t": 202.60760000000005, "r": 547.18085, "b": 211.82061999999996, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Now you can become a published author, too!", "bbox": {"l": 136.79803, "t": 215.14721999999995, "r": 339.18292, "b": 224.36023, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 344.71411, "t": 215.14721999999995, "r": 530.00812, "b": 224.36023, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "xiii", "bbox": {"l": 535.53925, "t": 215.14721999999995, "r": 547.13879, "b": 224.36023, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Comments welcome. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 136.79803, "t": 227.62707999999998, "r": 529.99506, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "xiii", "bbox": {"l": 535.5495, "t": 227.62707999999998, "r": 547.19788, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Stay connected to IBM Redbooks", "bbox": {"l": 136.79807, "t": 240.10693000000003, "r": 284.02866, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 289.54449, "t": 240.10693000000003, "r": 529.48242, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "xiv", "bbox": {"l": 534.99829, "t": 240.10693000000003, "r": 547.12115, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Chapter 1. Securing and protecting IBM DB2 data", "bbox": {"l": 136.79807, "t": 262.60657000000003, "r": 373.17566, "b": 271.81958, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 375.11798, "t": 262.60657000000003, "r": 536.09589, "b": 271.81958, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "1", "bbox": {"l": 541.64685, "t": 262.60657000000003, "r": 547.19781, "b": 271.81958, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "1.1", "bbox": {"l": 136.79808, "t": 274.60637999999994, "r": 150.88702, "b": 283.8194, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "Security fundamentals. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2", "bbox": {"l": 156.5226, "t": 274.60637999999994, "r": 549.84723, "b": 283.8194, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "1.2", "bbox": {"l": 136.79807, "t": 287.14606000000003, "r": 150.62746, "b": 296.35904, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Current state of IBM i security . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.15923, "t": 287.14606000000003, "r": 536.12933, "b": 296.35904, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "2", "bbox": {"l": 541.66113, "t": 287.14606000000003, "r": 547.19287, "b": 296.35904, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "1.3", "bbox": {"l": 136.79807, "t": 299.62595, "r": 150.84943, "b": 308.83893, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "DB2 for i security controls . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3", "bbox": {"l": 156.46996, "t": 299.62595, "r": 549.84723, "b": 308.83893, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "1.3.1", "bbox": {"l": 151.1972, "t": 312.1058300000001, "r": 173.38289, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Existing row and column control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.92932, "t": 312.1058300000001, "r": 536.05511, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "4", "bbox": {"l": 541.6015, "t": 312.1058300000001, "r": 547.14795, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "1.3.2", "bbox": {"l": 151.1972, "t": 324.64548, "r": 173.4189, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "New controls: Row and Column Access Control. . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.97432, "t": 324.64548, "r": 536.08008, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "5", "bbox": {"l": 541.6355, "t": 324.64548, "r": 547.19092, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "Chapter 2. Roles and separation of duties", "bbox": {"l": 136.79704, "t": 347.14511, "r": 336.82071, "b": 356.35809, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 338.99701, "t": 347.14511, "r": 536.09088, "b": 356.35809, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "7", "bbox": {"l": 541.64282, "t": 347.14511, "r": 547.19476, "b": 356.35809, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "2.1", "bbox": {"l": 136.79704, "t": 359.14493, "r": 150.644, "b": 368.35791, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Roles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.18277, "t": 359.14493, "r": 536.12714, "b": 368.35791, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "8", "bbox": {"l": 541.66589, "t": 359.14493, "r": 547.20471, "b": 368.35791, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "2.1.1", "bbox": {"l": 151.1972, "t": 371.62482, "r": 173.60995, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "DDM and DRDA application server access: QIBM_DB_DDMDRDA . . . . . . . . . . .", "bbox": {"l": 176.41154, "t": 371.62482, "r": 535.9527, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "8", "bbox": {"l": 541.55585, "t": 371.62482, "r": 547.15906, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "2.1.2", "bbox": {"l": 151.1972, "t": 384.10470999999995, "r": 173.41664, "b": 393.31769, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "Toolbox application server access: QIBM_DB_ZDA. . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.97151, "t": 384.10470999999995, "r": 536.04108, "b": 393.31769, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "8", "bbox": {"l": 541.59595, "t": 384.10470999999995, "r": 547.15082, "b": 393.31769, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "2.1.3", "bbox": {"l": 151.1972, "t": 396.64435, "r": 173.41859, "b": 405.85733, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Database Administrator function: QIBM_DB_SQLADM . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.97394, "t": 396.64435, "r": 536.07489, "b": 405.85733, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "9", "bbox": {"l": 541.63025, "t": 396.64435, "r": 547.18561, "b": 405.85733, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "2.1.4", "bbox": {"l": 151.1972, "t": 409.12424000000004, "r": 173.38629, "b": 418.33722, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Database Information function: QIBM_DB_SYSMON", "bbox": {"l": 178.93356, "t": 409.12424000000004, "r": 411.27048, "b": 418.33722, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": ". . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 416.81775, "t": 409.12424000000004, "r": 536.08411, "b": 418.33722, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "9", "bbox": {"l": 541.63135, "t": 409.12424000000004, "r": 547.17865, "b": 418.33722, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "2.1.5", "bbox": {"l": 151.1972, "t": 421.60413, "r": 173.44926, "b": 430.81711, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Security Administrator function: QIBM_DB_SECADM . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 179.01228, "t": 421.60413, "r": 536.03589, "b": 430.81711, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "9", "bbox": {"l": 541.59894, "t": 421.60413, "r": 547.16193, "b": 430.81711, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "2.1.6", "bbox": {"l": 151.1972, "t": 434.1437700000001, "r": 173.32208, "b": 443.35675, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Change Function Usage CL command . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.8533, "t": 434.1437700000001, "r": 530.57318, "b": 443.35675, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "10", "bbox": {"l": 536.10443, "t": 434.1437700000001, "r": 547.16687, "b": 443.35675, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "2.1.7", "bbox": {"l": 151.1972, "t": 446.62366, "r": 173.35822, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "Verifying function usage IDs for RCAC with the FUNCTION_USAGE view . . . . .", "bbox": {"l": 178.89848, "t": 446.62366, "r": 530.53522, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "10", "bbox": {"l": 536.0755, "t": 446.62366, "r": 547.15601, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "2.2", "bbox": {"l": 136.79704, "t": 459.10355, "r": 150.85457, "b": 468.31653, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "Separation of duties . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10", "bbox": {"l": 156.47758, "t": 459.10355, "r": 547.25659, "b": 468.31653, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "Chapter 3. Row and Column Access Control", "bbox": {"l": 136.79703, "t": 481.60318, "r": 348.68503, "b": 490.81616, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 350.09741, "t": 481.60318, "r": 530.53961, "b": 490.81616, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "13", "bbox": {"l": 536.09167, "t": 481.60318, "r": 547.1958, "b": 490.81616, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "3.1", "bbox": {"l": 136.79703, "t": 493.603, "r": 150.70105, "b": 502.81598, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Explanation of RCAC and the concept of access control . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.26266, "t": 493.603, "r": 530.4809, "b": 502.81598, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "14", "bbox": {"l": 536.04248, "t": 493.603, "r": 547.16571, "b": 502.81598, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "3.1.1", "bbox": {"l": 151.19719, "t": 506.14264, "r": 173.35429, "b": 515.35562, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "Row permission and column mask definitions", "bbox": {"l": 178.89357, "t": 506.14264, "r": 378.20786, "b": 515.35562, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 383.74713, "t": 506.14264, "r": 530.5379, "b": 515.35562, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "14", "bbox": {"l": 536.07721, "t": 506.14264, "r": 547.15576, "b": 515.35562, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "3.1.2", "bbox": {"l": 151.19719, "t": 518.62253, "r": 173.44292, "b": 527.83551, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "Enabling and activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 179.00435, "t": 518.62253, "r": 530.43475, "b": 527.83551, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "16", "bbox": {"l": 535.99622, "t": 518.62253, "r": 547.11908, "b": 527.83551, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "3.2", "bbox": {"l": 136.79703, "t": 531.1621700000001, "r": 150.64432, "b": 540.37517, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Special registers and built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.18323, "t": 531.1621700000001, "r": 530.52808, "b": 540.37517, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "18", "bbox": {"l": 536.06702, "t": 531.1621700000001, "r": 547.14484, "b": 540.37517, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "3.2.1", "bbox": {"l": 151.19719, "t": 543.64204, "r": 173.41321, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "Special registers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.96722, "t": 543.64204, "r": 530.49786, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "18", "bbox": {"l": 536.05188, "t": 543.64204, "r": 547.15991, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "3.2.2", "bbox": {"l": 151.19719, "t": 556.12192, "r": 173.35269, "b": 565.33492, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.89156, "t": 556.12192, "r": 530.56024, "b": 565.33492, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "19", "bbox": {"l": 536.09912, "t": 556.12192, "r": 547.17688, "b": 565.33492, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "3.3", "bbox": {"l": 136.79703, "t": 568.66156, "r": 150.62514, "b": 577.87456, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "VERIFY_GROUP_FOR_USER function . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.15639, "t": 568.66156, "r": 530.53027, "b": 577.87456, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "20", "bbox": {"l": 536.06152, "t": 568.66156, "r": 547.12402, "b": 577.87456, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "3.4", "bbox": {"l": 136.79703, "t": 581.14143, "r": 150.63004, "b": 590.35443, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "Establishing and controlling accessibility by using the RCAC rule text . . . . . . . . . . . . .", "bbox": {"l": 156.16325, "t": 581.14143, "r": 530.62994, "b": 590.35443, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "21", "bbox": {"l": 536.16315, "t": 581.14143, "r": 547.22955, "b": 590.35443, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "3.5", "bbox": {"l": 136.79701, "t": 593.62131, "r": 150.64413, "b": 602.8343, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "SELECT, INSERT, and UPDATE behavior with RCAC", "bbox": {"l": 156.18298, "t": 593.62131, "r": 394.7818, "b": 602.8343, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": ". . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 400.32065, "t": 593.62131, "r": 530.48358, "b": 602.8343, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "22", "bbox": {"l": 536.0224, "t": 593.62131, "r": 547.1001, "b": 602.8343, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "3.6", "bbox": {"l": 136.79701, "t": 606.16095, "r": 150.6642, "b": 615.37395, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "Human resources example . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.21107, "t": 606.16095, "r": 530.56512, "b": 615.37395, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "22", "bbox": {"l": 536.112, "t": 606.16095, "r": 547.20575, "b": 615.37395, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "3.6.1", "bbox": {"l": 151.19717, "t": 618.64082, "r": 173.41692, "b": 627.85382, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "Assigning the QIBM_DB_SECADM function ID to the consultants. . . . . . . . . . . .", "bbox": {"l": 178.97185, "t": 618.64082, "r": 530.49139, "b": 627.85382, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "23", "bbox": {"l": 536.04633, "t": 618.64082, "r": 547.15619, "b": 627.85382, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "3.6.2", "bbox": {"l": 151.19717, "t": 631.1206999999999, "r": 173.32271, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "Creating group profiles for the users and their roles . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.8541, "t": 631.1206999999999, "r": 530.56458, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "23", "bbox": {"l": 536.09601, "t": 631.1206999999999, "r": 547.15875, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "3.6.3", "bbox": {"l": 151.19717, "t": 643.66034, "r": 173.32227, "b": 652.87334, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "Demonstrating data access without RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.85353, "t": 643.66034, "r": 530.55695, "b": 652.87334, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "24", "bbox": {"l": 536.0882, "t": 643.66034, "r": 547.15076, "b": 652.87334, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "3.6.4", "bbox": {"l": 151.19717, "t": 656.14021, "r": 173.35289, "b": 665.35321, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "Defining and creating row permissions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.89182, "t": 656.14021, "r": 530.53412, "b": 665.35321, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "25", "bbox": {"l": 536.073, "t": 656.14021, "r": 547.15088, "b": 665.35321, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "3.6.5", "bbox": {"l": 151.19717, "t": 668.62009, "r": 173.35289, "b": 677.83309, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "Defining and creating column masks", "bbox": {"l": 178.89182, "t": 668.62009, "r": 339.45105, "b": 677.83309, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 344.98996, "t": 668.62009, "r": 530.54413, "b": 677.83309, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "26", "bbox": {"l": 536.08301, "t": 668.62009, "r": 547.16089, "b": 677.83309, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "3.6.6", "bbox": {"l": 151.19717, "t": 681.15973, "r": 173.38359, "b": 690.37273, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "Activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.93019, "t": 681.15973, "r": 530.54102, "b": 690.37273, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "28", "bbox": {"l": 536.08765, "t": 681.15973, "r": 547.18085, "b": 690.37273, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "3.6.7", "bbox": {"l": 151.19717, "t": 693.63961, "r": 173.32332, "b": 702.852615, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Demonstrating data access with RCAC", "bbox": {"l": 178.85486, "t": 693.63961, "r": 350.80011, "b": 702.852615, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 356.33163, "t": 693.63961, "r": 530.57507, "b": 702.852615, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "29", "bbox": {"l": 536.10663, "t": 693.63961, "r": 547.16968, "b": 702.852615, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "3.6.8", "bbox": {"l": 151.19717, "t": 706.119492, "r": 173.44592, "b": 715.332497, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "Demonstrating data access with a view and RCAC . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 179.00812, "t": 706.119492, "r": 530.43628, "b": 715.332497, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "32", "bbox": {"l": 535.99847, "t": 706.119492, "r": 547.12286, "b": 715.332497, "coord_origin": "TOPLEFT"}}], "children": [{"id": 4, "label": "text", "bbox": {"l": 136.8, "t": 132.64862000000005, "r": 172.89404, "b": 141.86163, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 3, "text": "Notices", "bbox": {"l": 136.8, "t": 132.64862000000005, "r": 172.89404, "b": 141.86163, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "text", "bbox": {"l": 175.01952, "t": 132.64862000000005, "r": 547.18982, "b": 141.86163, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 4, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vii", "bbox": {"l": 175.01952, "t": 132.64862000000005, "r": 547.18982, "b": 141.86163, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "text", "bbox": {"l": 136.79901, "t": 145.12847999999997, "r": 189.86537, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 5, "text": "Trademarks", "bbox": {"l": 136.79901, "t": 145.12847999999997, "r": 189.86537, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "text", "bbox": {"l": 195.39685, "t": 145.12847999999997, "r": 530.05121, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 195.39685, "t": 145.12847999999997, "r": 530.05121, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "text", "bbox": {"l": 535.5827, "t": 145.12847999999997, "r": 547.18286, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "viii", "bbox": {"l": 535.5827, "t": 145.12847999999997, "r": 547.18286, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 136.79901, "t": 167.62811, "r": 279.39731, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "DB2 for i Center of Excellence", "bbox": {"l": 136.79901, "t": 167.62811, "r": 279.39731, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "text", "bbox": {"l": 280.61942, "t": 167.62811, "r": 547.1908, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ix", "bbox": {"l": 280.61942, "t": 167.62811, "r": 547.1908, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 136.79901, "t": 190.12775, "r": 172.84424, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "Preface", "bbox": {"l": 136.79901, "t": 190.12775, "r": 172.84424, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 175.01852, "t": 190.12775, "r": 547.18286, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi", "bbox": {"l": 175.01852, "t": 190.12775, "r": 547.18286, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 136.79803, "t": 202.60760000000005, "r": 547.18085, "b": 211.82061999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "Authors . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi", "bbox": {"l": 136.79803, "t": 202.60760000000005, "r": 547.18085, "b": 211.82061999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 136.79803, "t": 215.14721999999995, "r": 339.18292, "b": 224.36023, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "Now you can become a published author, too!", "bbox": {"l": 136.79803, "t": 215.14721999999995, "r": 339.18292, "b": 224.36023, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 344.71411, "t": 215.14721999999995, "r": 530.00812, "b": 224.36023, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 344.71411, "t": 215.14721999999995, "r": 530.00812, "b": 224.36023, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 535.53925, "t": 215.14721999999995, "r": 547.13879, "b": 224.36023, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "xiii", "bbox": {"l": 535.53925, "t": 215.14721999999995, "r": 547.13879, "b": 224.36023, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 136.79803, "t": 227.62707999999998, "r": 529.99506, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "Comments welcome. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 136.79803, "t": 227.62707999999998, "r": 529.99506, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 535.5495, "t": 227.62707999999998, "r": 547.19788, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "xiii", "bbox": {"l": 535.5495, "t": 227.62707999999998, "r": 547.19788, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 136.79807, "t": 240.10693000000003, "r": 284.02866, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "Stay connected to IBM Redbooks", "bbox": {"l": 136.79807, "t": 240.10693000000003, "r": 284.02866, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 289.54449, "t": 240.10693000000003, "r": 529.48242, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 289.54449, "t": 240.10693000000003, "r": 529.48242, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 534.99829, "t": 240.10693000000003, "r": 547.12115, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "xiv", "bbox": {"l": 534.99829, "t": 240.10693000000003, "r": 547.12115, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 136.79807, "t": 262.60657000000003, "r": 373.17566, "b": 271.81958, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "Chapter 1. Securing and protecting IBM DB2 data", "bbox": {"l": 136.79807, "t": 262.60657000000003, "r": 373.17566, "b": 271.81958, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 375.11798, "t": 262.60657000000003, "r": 536.09589, "b": 271.81958, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 375.11798, "t": 262.60657000000003, "r": 536.09589, "b": 271.81958, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 541.64685, "t": 262.60657000000003, "r": 547.19781, "b": 271.81958, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "1", "bbox": {"l": 541.64685, "t": 262.60657000000003, "r": 547.19781, "b": 271.81958, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 136.79808, "t": 274.60637999999994, "r": 150.88702, "b": 283.8194, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "1.1", "bbox": {"l": 136.79808, "t": 274.60637999999994, "r": 150.88702, "b": 283.8194, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 156.5226, "t": 274.60637999999994, "r": 549.84723, "b": 283.8194, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "Security fundamentals. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2", "bbox": {"l": 156.5226, "t": 274.60637999999994, "r": 549.84723, "b": 283.8194, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 136.79807, "t": 287.14606000000003, "r": 150.62746, "b": 296.35904, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "1.2", "bbox": {"l": 136.79807, "t": 287.14606000000003, "r": 150.62746, "b": 296.35904, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 156.15923, "t": 287.14606000000003, "r": 536.12933, "b": 296.35904, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "Current state of IBM i security . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.15923, "t": 287.14606000000003, "r": 536.12933, "b": 296.35904, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 541.66113, "t": 287.14606000000003, "r": 547.19287, "b": 296.35904, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "2", "bbox": {"l": 541.66113, "t": 287.14606000000003, "r": 547.19287, "b": 296.35904, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 136.79807, "t": 299.62595, "r": 150.84943, "b": 308.83893, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "1.3", "bbox": {"l": 136.79807, "t": 299.62595, "r": 150.84943, "b": 308.83893, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 156.46996, "t": 299.62595, "r": 549.84723, "b": 308.83893, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "DB2 for i security controls . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3", "bbox": {"l": 156.46996, "t": 299.62595, "r": 549.84723, "b": 308.83893, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 151.1972, "t": 312.1058300000001, "r": 173.38289, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "1.3.1", "bbox": {"l": 151.1972, "t": 312.1058300000001, "r": 173.38289, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 178.92932, "t": 312.1058300000001, "r": 536.05511, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "Existing row and column control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.92932, "t": 312.1058300000001, "r": 536.05511, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 541.6015, "t": 312.1058300000001, "r": 547.14795, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "4", "bbox": {"l": 541.6015, "t": 312.1058300000001, "r": 547.14795, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 151.1972, "t": 324.64548, "r": 173.4189, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "1.3.2", "bbox": {"l": 151.1972, "t": 324.64548, "r": 173.4189, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 178.97432, "t": 324.64548, "r": 536.08008, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "New controls: Row and Column Access Control. . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.97432, "t": 324.64548, "r": 536.08008, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 541.6355, "t": 324.64548, "r": 547.19092, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "5", "bbox": {"l": 541.6355, "t": 324.64548, "r": 547.19092, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 136.79704, "t": 347.14511, "r": 336.82071, "b": 356.35809, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "Chapter 2. Roles and separation of duties", "bbox": {"l": 136.79704, "t": 347.14511, "r": 336.82071, "b": 356.35809, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 338.99701, "t": 347.14511, "r": 536.09088, "b": 356.35809, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 338.99701, "t": 347.14511, "r": 536.09088, "b": 356.35809, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 541.64282, "t": 347.14511, "r": 547.19476, "b": 356.35809, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "7", "bbox": {"l": 541.64282, "t": 347.14511, "r": 547.19476, "b": 356.35809, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 136.79704, "t": 359.14493, "r": 150.644, "b": 368.35791, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "2.1", "bbox": {"l": 136.79704, "t": 359.14493, "r": 150.644, "b": 368.35791, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 156.18277, "t": 359.14493, "r": 536.12714, "b": 368.35791, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "Roles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.18277, "t": 359.14493, "r": 536.12714, "b": 368.35791, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 541.66589, "t": 359.14493, "r": 547.20471, "b": 368.35791, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "8", "bbox": {"l": 541.66589, "t": 359.14493, "r": 547.20471, "b": 368.35791, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 151.1972, "t": 371.62482, "r": 173.60995, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "2.1.1", "bbox": {"l": 151.1972, "t": 371.62482, "r": 173.60995, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 176.41154, "t": 371.62482, "r": 535.9527, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "DDM and DRDA application server access: QIBM_DB_DDMDRDA . . . . . . . . . . .", "bbox": {"l": 176.41154, "t": 371.62482, "r": 535.9527, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 541.55585, "t": 371.62482, "r": 547.15906, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "8", "bbox": {"l": 541.55585, "t": 371.62482, "r": 547.15906, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 151.1972, "t": 384.10470999999995, "r": 173.41664, "b": 393.31769, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "2.1.2", "bbox": {"l": 151.1972, "t": 384.10470999999995, "r": 173.41664, "b": 393.31769, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 178.97151, "t": 384.10470999999995, "r": 536.04108, "b": 393.31769, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "Toolbox application server access: QIBM_DB_ZDA. . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.97151, "t": 384.10470999999995, "r": 536.04108, "b": 393.31769, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 541.59595, "t": 384.10470999999995, "r": 547.15082, "b": 393.31769, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "8", "bbox": {"l": 541.59595, "t": 384.10470999999995, "r": 547.15082, "b": 393.31769, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 151.1972, "t": 396.64435, "r": 173.41859, "b": 405.85733, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "2.1.3", "bbox": {"l": 151.1972, "t": 396.64435, "r": 173.41859, "b": 405.85733, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 178.97394, "t": 396.64435, "r": 536.07489, "b": 405.85733, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "Database Administrator function: QIBM_DB_SQLADM . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.97394, "t": 396.64435, "r": 536.07489, "b": 405.85733, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 541.63025, "t": 396.64435, "r": 547.18561, "b": 405.85733, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "9", "bbox": {"l": 541.63025, "t": 396.64435, "r": 547.18561, "b": 405.85733, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 151.1972, "t": 409.12424000000004, "r": 173.38629, "b": 418.33722, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "2.1.4", "bbox": {"l": 151.1972, "t": 409.12424000000004, "r": 173.38629, "b": 418.33722, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 178.93356, "t": 409.12424000000004, "r": 411.27048, "b": 418.33722, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "Database Information function: QIBM_DB_SYSMON", "bbox": {"l": 178.93356, "t": 409.12424000000004, "r": 411.27048, "b": 418.33722, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 416.81775, "t": 409.12424000000004, "r": 536.08411, "b": 418.33722, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": ". . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 416.81775, "t": 409.12424000000004, "r": 536.08411, "b": 418.33722, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 541.63135, "t": 409.12424000000004, "r": 547.17865, "b": 418.33722, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "9", "bbox": {"l": 541.63135, "t": 409.12424000000004, "r": 547.17865, "b": 418.33722, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 151.1972, "t": 421.60413, "r": 173.44926, "b": 430.81711, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "2.1.5", "bbox": {"l": 151.1972, "t": 421.60413, "r": 173.44926, "b": 430.81711, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 179.01228, "t": 421.60413, "r": 536.03589, "b": 430.81711, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "Security Administrator function: QIBM_DB_SECADM . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 179.01228, "t": 421.60413, "r": 536.03589, "b": 430.81711, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 541.59894, "t": 421.60413, "r": 547.16193, "b": 430.81711, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "9", "bbox": {"l": 541.59894, "t": 421.60413, "r": 547.16193, "b": 430.81711, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 151.1972, "t": 434.1437700000001, "r": 173.32208, "b": 443.35675, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "2.1.6", "bbox": {"l": 151.1972, "t": 434.1437700000001, "r": 173.32208, "b": 443.35675, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 178.8533, "t": 434.1437700000001, "r": 530.57318, "b": 443.35675, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "Change Function Usage CL command . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.8533, "t": 434.1437700000001, "r": 530.57318, "b": 443.35675, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 536.10443, "t": 434.1437700000001, "r": 547.16687, "b": 443.35675, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "10", "bbox": {"l": 536.10443, "t": 434.1437700000001, "r": 547.16687, "b": 443.35675, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 151.1972, "t": 446.62366, "r": 173.35822, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "2.1.7", "bbox": {"l": 151.1972, "t": 446.62366, "r": 173.35822, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 178.89848, "t": 446.62366, "r": 530.53522, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "Verifying function usage IDs for RCAC with the FUNCTION_USAGE view . . . . .", "bbox": {"l": 178.89848, "t": 446.62366, "r": 530.53522, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 536.0755, "t": 446.62366, "r": 547.15601, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "10", "bbox": {"l": 536.0755, "t": 446.62366, "r": 547.15601, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 136.79704, "t": 459.10355, "r": 150.85457, "b": 468.31653, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "2.2", "bbox": {"l": 136.79704, "t": 459.10355, "r": 150.85457, "b": 468.31653, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 156.47758, "t": 459.10355, "r": 547.25659, "b": 468.31653, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "Separation of duties . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10", "bbox": {"l": 156.47758, "t": 459.10355, "r": 547.25659, "b": 468.31653, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 136.79703, "t": 481.60318, "r": 348.68503, "b": 490.81616, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "Chapter 3. Row and Column Access Control", "bbox": {"l": 136.79703, "t": 481.60318, "r": 348.68503, "b": 490.81616, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 350.09741, "t": 481.60318, "r": 530.53961, "b": 490.81616, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 350.09741, "t": 481.60318, "r": 530.53961, "b": 490.81616, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 536.09167, "t": 481.60318, "r": 547.1958, "b": 490.81616, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "13", "bbox": {"l": 536.09167, "t": 481.60318, "r": 547.1958, "b": 490.81616, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 136.79703, "t": 493.603, "r": 150.70105, "b": 502.81598, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "3.1", "bbox": {"l": 136.79703, "t": 493.603, "r": 150.70105, "b": 502.81598, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 156.26266, "t": 493.603, "r": 530.4809, "b": 502.81598, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "Explanation of RCAC and the concept of access control . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.26266, "t": 493.603, "r": 530.4809, "b": 502.81598, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 536.04248, "t": 493.603, "r": 547.16571, "b": 502.81598, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "14", "bbox": {"l": 536.04248, "t": 493.603, "r": 547.16571, "b": 502.81598, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 151.19719, "t": 506.14264, "r": 173.35429, "b": 515.35562, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "3.1.1", "bbox": {"l": 151.19719, "t": 506.14264, "r": 173.35429, "b": 515.35562, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 178.89357, "t": 506.14264, "r": 378.20786, "b": 515.35562, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "Row permission and column mask definitions", "bbox": {"l": 178.89357, "t": 506.14264, "r": 378.20786, "b": 515.35562, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 383.74713, "t": 506.14264, "r": 530.5379, "b": 515.35562, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 383.74713, "t": 506.14264, "r": 530.5379, "b": 515.35562, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 536.07721, "t": 506.14264, "r": 547.15576, "b": 515.35562, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "14", "bbox": {"l": 536.07721, "t": 506.14264, "r": 547.15576, "b": 515.35562, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 151.19719, "t": 518.62253, "r": 173.44292, "b": 527.83551, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "3.1.2", "bbox": {"l": 151.19719, "t": 518.62253, "r": 173.44292, "b": 527.83551, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 179.00435, "t": 518.62253, "r": 530.43475, "b": 527.83551, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "Enabling and activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 179.00435, "t": 518.62253, "r": 530.43475, "b": 527.83551, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 535.99622, "t": 518.62253, "r": 547.11908, "b": 527.83551, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "16", "bbox": {"l": 535.99622, "t": 518.62253, "r": 547.11908, "b": 527.83551, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 136.79703, "t": 531.1621700000001, "r": 150.64432, "b": 540.37517, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "3.2", "bbox": {"l": 136.79703, "t": 531.1621700000001, "r": 150.64432, "b": 540.37517, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 156.18323, "t": 531.1621700000001, "r": 530.52808, "b": 540.37517, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "Special registers and built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.18323, "t": 531.1621700000001, "r": 530.52808, "b": 540.37517, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 536.06702, "t": 531.1621700000001, "r": 547.14484, "b": 540.37517, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "18", "bbox": {"l": 536.06702, "t": 531.1621700000001, "r": 547.14484, "b": 540.37517, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 151.19719, "t": 543.64204, "r": 173.41321, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "3.2.1", "bbox": {"l": 151.19719, "t": 543.64204, "r": 173.41321, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 178.96722, "t": 543.64204, "r": 530.49786, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "Special registers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.96722, "t": 543.64204, "r": 530.49786, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 536.05188, "t": 543.64204, "r": 547.15991, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "18", "bbox": {"l": 536.05188, "t": 543.64204, "r": 547.15991, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 151.19719, "t": 556.12192, "r": 173.35269, "b": 565.33492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "3.2.2", "bbox": {"l": 151.19719, "t": 556.12192, "r": 173.35269, "b": 565.33492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 178.89156, "t": 556.12192, "r": 530.56024, "b": 565.33492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "Built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.89156, "t": 556.12192, "r": 530.56024, "b": 565.33492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 536.09912, "t": 556.12192, "r": 547.17688, "b": 565.33492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "19", "bbox": {"l": 536.09912, "t": 556.12192, "r": 547.17688, "b": 565.33492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 136.79703, "t": 568.66156, "r": 150.62514, "b": 577.87456, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "3.3", "bbox": {"l": 136.79703, "t": 568.66156, "r": 150.62514, "b": 577.87456, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 156.15639, "t": 568.66156, "r": 530.53027, "b": 577.87456, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "VERIFY_GROUP_FOR_USER function . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.15639, "t": 568.66156, "r": 530.53027, "b": 577.87456, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 536.06152, "t": 568.66156, "r": 547.12402, "b": 577.87456, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "20", "bbox": {"l": 536.06152, "t": 568.66156, "r": 547.12402, "b": 577.87456, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 136.79703, "t": 581.14143, "r": 150.63004, "b": 590.35443, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "3.4", "bbox": {"l": 136.79703, "t": 581.14143, "r": 150.63004, "b": 590.35443, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 156.16325, "t": 581.14143, "r": 530.62994, "b": 590.35443, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "Establishing and controlling accessibility by using the RCAC rule text . . . . . . . . . . . . .", "bbox": {"l": 156.16325, "t": 581.14143, "r": 530.62994, "b": 590.35443, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 536.16315, "t": 581.14143, "r": 547.22955, "b": 590.35443, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "21", "bbox": {"l": 536.16315, "t": 581.14143, "r": 547.22955, "b": 590.35443, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 136.79701, "t": 593.62131, "r": 150.64413, "b": 602.8343, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "3.5", "bbox": {"l": 136.79701, "t": 593.62131, "r": 150.64413, "b": 602.8343, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 156.18298, "t": 593.62131, "r": 394.7818, "b": 602.8343, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "SELECT, INSERT, and UPDATE behavior with RCAC", "bbox": {"l": 156.18298, "t": 593.62131, "r": 394.7818, "b": 602.8343, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 400.32065, "t": 593.62131, "r": 530.48358, "b": 602.8343, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": ". . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 400.32065, "t": 593.62131, "r": 530.48358, "b": 602.8343, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 536.0224, "t": 593.62131, "r": 547.1001, "b": 602.8343, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "22", "bbox": {"l": 536.0224, "t": 593.62131, "r": 547.1001, "b": 602.8343, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 136.79701, "t": 606.16095, "r": 150.6642, "b": 615.37395, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "3.6", "bbox": {"l": 136.79701, "t": 606.16095, "r": 150.6642, "b": 615.37395, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 156.21107, "t": 606.16095, "r": 530.56512, "b": 615.37395, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "Human resources example . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.21107, "t": 606.16095, "r": 530.56512, "b": 615.37395, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 536.112, "t": 606.16095, "r": 547.20575, "b": 615.37395, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "22", "bbox": {"l": 536.112, "t": 606.16095, "r": 547.20575, "b": 615.37395, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 151.19717, "t": 618.64082, "r": 173.41692, "b": 627.85382, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "3.6.1", "bbox": {"l": 151.19717, "t": 618.64082, "r": 173.41692, "b": 627.85382, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 178.97185, "t": 618.64082, "r": 530.49139, "b": 627.85382, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": "Assigning the QIBM_DB_SECADM function ID to the consultants. . . . . . . . . . . .", "bbox": {"l": 178.97185, "t": 618.64082, "r": 530.49139, "b": 627.85382, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 536.04633, "t": 618.64082, "r": 547.15619, "b": 627.85382, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "23", "bbox": {"l": 536.04633, "t": 618.64082, "r": 547.15619, "b": 627.85382, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 151.19717, "t": 631.1206999999999, "r": 173.32271, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "3.6.2", "bbox": {"l": 151.19717, "t": 631.1206999999999, "r": 173.32271, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 178.8541, "t": 631.1206999999999, "r": 530.56458, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": "Creating group profiles for the users and their roles . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.8541, "t": 631.1206999999999, "r": 530.56458, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 536.09601, "t": 631.1206999999999, "r": 547.15875, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 107, "text": "23", "bbox": {"l": 536.09601, "t": 631.1206999999999, "r": 547.15875, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 151.19717, "t": 643.66034, "r": 173.32227, "b": 652.87334, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 108, "text": "3.6.3", "bbox": {"l": 151.19717, "t": 643.66034, "r": 173.32227, "b": 652.87334, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 178.85353, "t": 643.66034, "r": 530.55695, "b": 652.87334, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 109, "text": "Demonstrating data access without RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.85353, "t": 643.66034, "r": 530.55695, "b": 652.87334, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 536.0882, "t": 643.66034, "r": 547.15076, "b": 652.87334, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 110, "text": "24", "bbox": {"l": 536.0882, "t": 643.66034, "r": 547.15076, "b": 652.87334, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 151.19717, "t": 656.14021, "r": 173.35289, "b": 665.35321, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 111, "text": "3.6.4", "bbox": {"l": 151.19717, "t": 656.14021, "r": 173.35289, "b": 665.35321, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 178.89182, "t": 656.14021, "r": 530.53412, "b": 665.35321, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 112, "text": "Defining and creating row permissions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.89182, "t": 656.14021, "r": 530.53412, "b": 665.35321, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 114, "label": "text", "bbox": {"l": 536.073, "t": 656.14021, "r": 547.15088, "b": 665.35321, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 113, "text": "25", "bbox": {"l": 536.073, "t": 656.14021, "r": 547.15088, "b": 665.35321, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 115, "label": "text", "bbox": {"l": 151.19717, "t": 668.62009, "r": 173.35289, "b": 677.83309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 114, "text": "3.6.5", "bbox": {"l": 151.19717, "t": 668.62009, "r": 173.35289, "b": 677.83309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 116, "label": "text", "bbox": {"l": 178.89182, "t": 668.62009, "r": 339.45105, "b": 677.83309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 115, "text": "Defining and creating column masks", "bbox": {"l": 178.89182, "t": 668.62009, "r": 339.45105, "b": 677.83309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 117, "label": "text", "bbox": {"l": 344.98996, "t": 668.62009, "r": 530.54413, "b": 677.83309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 116, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 344.98996, "t": 668.62009, "r": 530.54413, "b": 677.83309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 118, "label": "text", "bbox": {"l": 536.08301, "t": 668.62009, "r": 547.16089, "b": 677.83309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 117, "text": "26", "bbox": {"l": 536.08301, "t": 668.62009, "r": 547.16089, "b": 677.83309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 119, "label": "text", "bbox": {"l": 151.19717, "t": 681.15973, "r": 173.38359, "b": 690.37273, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 118, "text": "3.6.6", "bbox": {"l": 151.19717, "t": 681.15973, "r": 173.38359, "b": 690.37273, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 120, "label": "text", "bbox": {"l": 178.93019, "t": 681.15973, "r": 530.54102, "b": 690.37273, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 119, "text": "Activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.93019, "t": 681.15973, "r": 530.54102, "b": 690.37273, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 121, "label": "text", "bbox": {"l": 536.08765, "t": 681.15973, "r": 547.18085, "b": 690.37273, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 120, "text": "28", "bbox": {"l": 536.08765, "t": 681.15973, "r": 547.18085, "b": 690.37273, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 122, "label": "text", "bbox": {"l": 151.19717, "t": 693.63961, "r": 173.32332, "b": 702.852615, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 121, "text": "3.6.7", "bbox": {"l": 151.19717, "t": 693.63961, "r": 173.32332, "b": 702.852615, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 123, "label": "text", "bbox": {"l": 178.85486, "t": 693.63961, "r": 350.80011, "b": 702.852615, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 122, "text": "Demonstrating data access with RCAC", "bbox": {"l": 178.85486, "t": 693.63961, "r": 350.80011, "b": 702.852615, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 124, "label": "text", "bbox": {"l": 356.33163, "t": 693.63961, "r": 530.57507, "b": 702.852615, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 123, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 356.33163, "t": 693.63961, "r": 530.57507, "b": 702.852615, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 125, "label": "text", "bbox": {"l": 536.10663, "t": 693.63961, "r": 547.16968, "b": 702.852615, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 124, "text": "29", "bbox": {"l": 536.10663, "t": 693.63961, "r": 547.16968, "b": 702.852615, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 126, "label": "text", "bbox": {"l": 151.19717, "t": 706.119492, "r": 173.44592, "b": 715.332497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 125, "text": "3.6.8", "bbox": {"l": 151.19717, "t": 706.119492, "r": 173.44592, "b": 715.332497, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 127, "label": "text", "bbox": {"l": 179.00812, "t": 706.119492, "r": 530.43628, "b": 715.332497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 126, "text": "Demonstrating data access with a view and RCAC . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 179.00812, "t": 706.119492, "r": 530.43628, "b": 715.332497, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 128, "label": "text", "bbox": {"l": 535.99847, "t": 706.119492, "r": 547.12286, "b": 715.332497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 127, "text": "32", "bbox": {"l": 535.99847, "t": 706.119492, "r": 547.12286, "b": 715.332497, "coord_origin": "TOPLEFT"}}], "children": []}]}]}, "tablestructure": {"table_map": {"0": {"label": "document_index", "id": 0, "page_no": 1, "cluster": {"id": 0, "label": "document_index", "bbox": {"l": 136.1496124267578, "t": 132.0330352783203, "r": 547.5267944335938, "b": 715.6515502929688, "coord_origin": "TOPLEFT"}, "confidence": 0.9803681373596191, "cells": [{"id": 3, "text": "Notices", "bbox": {"l": 136.8, "t": 132.64862000000005, "r": 172.89404, "b": 141.86163, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vii", "bbox": {"l": 175.01952, "t": 132.64862000000005, "r": 547.18982, "b": 141.86163, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Trademarks", "bbox": {"l": 136.79901, "t": 145.12847999999997, "r": 189.86537, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 195.39685, "t": 145.12847999999997, "r": 530.05121, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "viii", "bbox": {"l": 535.5827, "t": 145.12847999999997, "r": 547.18286, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "DB2 for i Center of Excellence", "bbox": {"l": 136.79901, "t": 167.62811, "r": 279.39731, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ix", "bbox": {"l": 280.61942, "t": 167.62811, "r": 547.1908, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Preface", "bbox": {"l": 136.79901, "t": 190.12775, "r": 172.84424, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi", "bbox": {"l": 175.01852, "t": 190.12775, "r": 547.18286, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Authors . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi", "bbox": {"l": 136.79803, "t": 202.60760000000005, "r": 547.18085, "b": 211.82061999999996, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Now you can become a published author, too!", "bbox": {"l": 136.79803, "t": 215.14721999999995, "r": 339.18292, "b": 224.36023, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 344.71411, "t": 215.14721999999995, "r": 530.00812, "b": 224.36023, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "xiii", "bbox": {"l": 535.53925, "t": 215.14721999999995, "r": 547.13879, "b": 224.36023, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Comments welcome. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 136.79803, "t": 227.62707999999998, "r": 529.99506, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "xiii", "bbox": {"l": 535.5495, "t": 227.62707999999998, "r": 547.19788, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Stay connected to IBM Redbooks", "bbox": {"l": 136.79807, "t": 240.10693000000003, "r": 284.02866, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 289.54449, "t": 240.10693000000003, "r": 529.48242, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "xiv", "bbox": {"l": 534.99829, "t": 240.10693000000003, "r": 547.12115, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Chapter 1. Securing and protecting IBM DB2 data", "bbox": {"l": 136.79807, "t": 262.60657000000003, "r": 373.17566, "b": 271.81958, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 375.11798, "t": 262.60657000000003, "r": 536.09589, "b": 271.81958, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "1", "bbox": {"l": 541.64685, "t": 262.60657000000003, "r": 547.19781, "b": 271.81958, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "1.1", "bbox": {"l": 136.79808, "t": 274.60637999999994, "r": 150.88702, "b": 283.8194, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "Security fundamentals. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2", "bbox": {"l": 156.5226, "t": 274.60637999999994, "r": 549.84723, "b": 283.8194, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "1.2", "bbox": {"l": 136.79807, "t": 287.14606000000003, "r": 150.62746, "b": 296.35904, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Current state of IBM i security . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.15923, "t": 287.14606000000003, "r": 536.12933, "b": 296.35904, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "2", "bbox": {"l": 541.66113, "t": 287.14606000000003, "r": 547.19287, "b": 296.35904, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "1.3", "bbox": {"l": 136.79807, "t": 299.62595, "r": 150.84943, "b": 308.83893, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "DB2 for i security controls . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3", "bbox": {"l": 156.46996, "t": 299.62595, "r": 549.84723, "b": 308.83893, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "1.3.1", "bbox": {"l": 151.1972, "t": 312.1058300000001, "r": 173.38289, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Existing row and column control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.92932, "t": 312.1058300000001, "r": 536.05511, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "4", "bbox": {"l": 541.6015, "t": 312.1058300000001, "r": 547.14795, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "1.3.2", "bbox": {"l": 151.1972, "t": 324.64548, "r": 173.4189, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "New controls: Row and Column Access Control. . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.97432, "t": 324.64548, "r": 536.08008, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "5", "bbox": {"l": 541.6355, "t": 324.64548, "r": 547.19092, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "Chapter 2. Roles and separation of duties", "bbox": {"l": 136.79704, "t": 347.14511, "r": 336.82071, "b": 356.35809, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 338.99701, "t": 347.14511, "r": 536.09088, "b": 356.35809, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "7", "bbox": {"l": 541.64282, "t": 347.14511, "r": 547.19476, "b": 356.35809, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "2.1", "bbox": {"l": 136.79704, "t": 359.14493, "r": 150.644, "b": 368.35791, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Roles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.18277, "t": 359.14493, "r": 536.12714, "b": 368.35791, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "8", "bbox": {"l": 541.66589, "t": 359.14493, "r": 547.20471, "b": 368.35791, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "2.1.1", "bbox": {"l": 151.1972, "t": 371.62482, "r": 173.60995, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "DDM and DRDA application server access: QIBM_DB_DDMDRDA . . . . . . . . . . .", "bbox": {"l": 176.41154, "t": 371.62482, "r": 535.9527, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "8", "bbox": {"l": 541.55585, "t": 371.62482, "r": 547.15906, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "2.1.2", "bbox": {"l": 151.1972, "t": 384.10470999999995, "r": 173.41664, "b": 393.31769, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "Toolbox application server access: QIBM_DB_ZDA. . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.97151, "t": 384.10470999999995, "r": 536.04108, "b": 393.31769, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "8", "bbox": {"l": 541.59595, "t": 384.10470999999995, "r": 547.15082, "b": 393.31769, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "2.1.3", "bbox": {"l": 151.1972, "t": 396.64435, "r": 173.41859, "b": 405.85733, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Database Administrator function: QIBM_DB_SQLADM . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.97394, "t": 396.64435, "r": 536.07489, "b": 405.85733, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "9", "bbox": {"l": 541.63025, "t": 396.64435, "r": 547.18561, "b": 405.85733, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "2.1.4", "bbox": {"l": 151.1972, "t": 409.12424000000004, "r": 173.38629, "b": 418.33722, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Database Information function: QIBM_DB_SYSMON", "bbox": {"l": 178.93356, "t": 409.12424000000004, "r": 411.27048, "b": 418.33722, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": ". . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 416.81775, "t": 409.12424000000004, "r": 536.08411, "b": 418.33722, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "9", "bbox": {"l": 541.63135, "t": 409.12424000000004, "r": 547.17865, "b": 418.33722, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "2.1.5", "bbox": {"l": 151.1972, "t": 421.60413, "r": 173.44926, "b": 430.81711, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Security Administrator function: QIBM_DB_SECADM . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 179.01228, "t": 421.60413, "r": 536.03589, "b": 430.81711, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "9", "bbox": {"l": 541.59894, "t": 421.60413, "r": 547.16193, "b": 430.81711, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "2.1.6", "bbox": {"l": 151.1972, "t": 434.1437700000001, "r": 173.32208, "b": 443.35675, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Change Function Usage CL command . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.8533, "t": 434.1437700000001, "r": 530.57318, "b": 443.35675, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "10", "bbox": {"l": 536.10443, "t": 434.1437700000001, "r": 547.16687, "b": 443.35675, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "2.1.7", "bbox": {"l": 151.1972, "t": 446.62366, "r": 173.35822, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "Verifying function usage IDs for RCAC with the FUNCTION_USAGE view . . . . .", "bbox": {"l": 178.89848, "t": 446.62366, "r": 530.53522, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "10", "bbox": {"l": 536.0755, "t": 446.62366, "r": 547.15601, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "2.2", "bbox": {"l": 136.79704, "t": 459.10355, "r": 150.85457, "b": 468.31653, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "Separation of duties . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10", "bbox": {"l": 156.47758, "t": 459.10355, "r": 547.25659, "b": 468.31653, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "Chapter 3. Row and Column Access Control", "bbox": {"l": 136.79703, "t": 481.60318, "r": 348.68503, "b": 490.81616, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 350.09741, "t": 481.60318, "r": 530.53961, "b": 490.81616, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "13", "bbox": {"l": 536.09167, "t": 481.60318, "r": 547.1958, "b": 490.81616, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "3.1", "bbox": {"l": 136.79703, "t": 493.603, "r": 150.70105, "b": 502.81598, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Explanation of RCAC and the concept of access control . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.26266, "t": 493.603, "r": 530.4809, "b": 502.81598, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "14", "bbox": {"l": 536.04248, "t": 493.603, "r": 547.16571, "b": 502.81598, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "3.1.1", "bbox": {"l": 151.19719, "t": 506.14264, "r": 173.35429, "b": 515.35562, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "Row permission and column mask definitions", "bbox": {"l": 178.89357, "t": 506.14264, "r": 378.20786, "b": 515.35562, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 383.74713, "t": 506.14264, "r": 530.5379, "b": 515.35562, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "14", "bbox": {"l": 536.07721, "t": 506.14264, "r": 547.15576, "b": 515.35562, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "3.1.2", "bbox": {"l": 151.19719, "t": 518.62253, "r": 173.44292, "b": 527.83551, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "Enabling and activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 179.00435, "t": 518.62253, "r": 530.43475, "b": 527.83551, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "16", "bbox": {"l": 535.99622, "t": 518.62253, "r": 547.11908, "b": 527.83551, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "3.2", "bbox": {"l": 136.79703, "t": 531.1621700000001, "r": 150.64432, "b": 540.37517, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Special registers and built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.18323, "t": 531.1621700000001, "r": 530.52808, "b": 540.37517, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "18", "bbox": {"l": 536.06702, "t": 531.1621700000001, "r": 547.14484, "b": 540.37517, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "3.2.1", "bbox": {"l": 151.19719, "t": 543.64204, "r": 173.41321, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "Special registers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.96722, "t": 543.64204, "r": 530.49786, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "18", "bbox": {"l": 536.05188, "t": 543.64204, "r": 547.15991, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "3.2.2", "bbox": {"l": 151.19719, "t": 556.12192, "r": 173.35269, "b": 565.33492, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.89156, "t": 556.12192, "r": 530.56024, "b": 565.33492, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "19", "bbox": {"l": 536.09912, "t": 556.12192, "r": 547.17688, "b": 565.33492, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "3.3", "bbox": {"l": 136.79703, "t": 568.66156, "r": 150.62514, "b": 577.87456, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "VERIFY_GROUP_FOR_USER function . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.15639, "t": 568.66156, "r": 530.53027, "b": 577.87456, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "20", "bbox": {"l": 536.06152, "t": 568.66156, "r": 547.12402, "b": 577.87456, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "3.4", "bbox": {"l": 136.79703, "t": 581.14143, "r": 150.63004, "b": 590.35443, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "Establishing and controlling accessibility by using the RCAC rule text . . . . . . . . . . . . .", "bbox": {"l": 156.16325, "t": 581.14143, "r": 530.62994, "b": 590.35443, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "21", "bbox": {"l": 536.16315, "t": 581.14143, "r": 547.22955, "b": 590.35443, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "3.5", "bbox": {"l": 136.79701, "t": 593.62131, "r": 150.64413, "b": 602.8343, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "SELECT, INSERT, and UPDATE behavior with RCAC", "bbox": {"l": 156.18298, "t": 593.62131, "r": 394.7818, "b": 602.8343, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": ". . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 400.32065, "t": 593.62131, "r": 530.48358, "b": 602.8343, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "22", "bbox": {"l": 536.0224, "t": 593.62131, "r": 547.1001, "b": 602.8343, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "3.6", "bbox": {"l": 136.79701, "t": 606.16095, "r": 150.6642, "b": 615.37395, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "Human resources example . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.21107, "t": 606.16095, "r": 530.56512, "b": 615.37395, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "22", "bbox": {"l": 536.112, "t": 606.16095, "r": 547.20575, "b": 615.37395, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "3.6.1", "bbox": {"l": 151.19717, "t": 618.64082, "r": 173.41692, "b": 627.85382, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "Assigning the QIBM_DB_SECADM function ID to the consultants. . . . . . . . . . . .", "bbox": {"l": 178.97185, "t": 618.64082, "r": 530.49139, "b": 627.85382, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "23", "bbox": {"l": 536.04633, "t": 618.64082, "r": 547.15619, "b": 627.85382, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "3.6.2", "bbox": {"l": 151.19717, "t": 631.1206999999999, "r": 173.32271, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "Creating group profiles for the users and their roles . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.8541, "t": 631.1206999999999, "r": 530.56458, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "23", "bbox": {"l": 536.09601, "t": 631.1206999999999, "r": 547.15875, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "3.6.3", "bbox": {"l": 151.19717, "t": 643.66034, "r": 173.32227, "b": 652.87334, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "Demonstrating data access without RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.85353, "t": 643.66034, "r": 530.55695, "b": 652.87334, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "24", "bbox": {"l": 536.0882, "t": 643.66034, "r": 547.15076, "b": 652.87334, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "3.6.4", "bbox": {"l": 151.19717, "t": 656.14021, "r": 173.35289, "b": 665.35321, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "Defining and creating row permissions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.89182, "t": 656.14021, "r": 530.53412, "b": 665.35321, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "25", "bbox": {"l": 536.073, "t": 656.14021, "r": 547.15088, "b": 665.35321, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "3.6.5", "bbox": {"l": 151.19717, "t": 668.62009, "r": 173.35289, "b": 677.83309, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "Defining and creating column masks", "bbox": {"l": 178.89182, "t": 668.62009, "r": 339.45105, "b": 677.83309, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 344.98996, "t": 668.62009, "r": 530.54413, "b": 677.83309, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "26", "bbox": {"l": 536.08301, "t": 668.62009, "r": 547.16089, "b": 677.83309, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "3.6.6", "bbox": {"l": 151.19717, "t": 681.15973, "r": 173.38359, "b": 690.37273, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "Activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.93019, "t": 681.15973, "r": 530.54102, "b": 690.37273, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "28", "bbox": {"l": 536.08765, "t": 681.15973, "r": 547.18085, "b": 690.37273, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "3.6.7", "bbox": {"l": 151.19717, "t": 693.63961, "r": 173.32332, "b": 702.852615, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Demonstrating data access with RCAC", "bbox": {"l": 178.85486, "t": 693.63961, "r": 350.80011, "b": 702.852615, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 356.33163, "t": 693.63961, "r": 530.57507, "b": 702.852615, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "29", "bbox": {"l": 536.10663, "t": 693.63961, "r": 547.16968, "b": 702.852615, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "3.6.8", "bbox": {"l": 151.19717, "t": 706.119492, "r": 173.44592, "b": 715.332497, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "Demonstrating data access with a view and RCAC . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 179.00812, "t": 706.119492, "r": 530.43628, "b": 715.332497, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "32", "bbox": {"l": 535.99847, "t": 706.119492, "r": 547.12286, "b": 715.332497, "coord_origin": "TOPLEFT"}}], "children": [{"id": 4, "label": "text", "bbox": {"l": 136.8, "t": 132.64862000000005, "r": 172.89404, "b": 141.86163, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 3, "text": "Notices", "bbox": {"l": 136.8, "t": 132.64862000000005, "r": 172.89404, "b": 141.86163, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "text", "bbox": {"l": 175.01952, "t": 132.64862000000005, "r": 547.18982, "b": 141.86163, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 4, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vii", "bbox": {"l": 175.01952, "t": 132.64862000000005, "r": 547.18982, "b": 141.86163, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "text", "bbox": {"l": 136.79901, "t": 145.12847999999997, "r": 189.86537, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 5, "text": "Trademarks", "bbox": {"l": 136.79901, "t": 145.12847999999997, "r": 189.86537, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "text", "bbox": {"l": 195.39685, "t": 145.12847999999997, "r": 530.05121, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 195.39685, "t": 145.12847999999997, "r": 530.05121, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "text", "bbox": {"l": 535.5827, "t": 145.12847999999997, "r": 547.18286, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "viii", "bbox": {"l": 535.5827, "t": 145.12847999999997, "r": 547.18286, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 136.79901, "t": 167.62811, "r": 279.39731, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "DB2 for i Center of Excellence", "bbox": {"l": 136.79901, "t": 167.62811, "r": 279.39731, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "text", "bbox": {"l": 280.61942, "t": 167.62811, "r": 547.1908, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ix", "bbox": {"l": 280.61942, "t": 167.62811, "r": 547.1908, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 136.79901, "t": 190.12775, "r": 172.84424, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "Preface", "bbox": {"l": 136.79901, "t": 190.12775, "r": 172.84424, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 175.01852, "t": 190.12775, "r": 547.18286, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi", "bbox": {"l": 175.01852, "t": 190.12775, "r": 547.18286, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 136.79803, "t": 202.60760000000005, "r": 547.18085, "b": 211.82061999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "Authors . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi", "bbox": {"l": 136.79803, "t": 202.60760000000005, "r": 547.18085, "b": 211.82061999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 136.79803, "t": 215.14721999999995, "r": 339.18292, "b": 224.36023, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "Now you can become a published author, too!", "bbox": {"l": 136.79803, "t": 215.14721999999995, "r": 339.18292, "b": 224.36023, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 344.71411, "t": 215.14721999999995, "r": 530.00812, "b": 224.36023, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 344.71411, "t": 215.14721999999995, "r": 530.00812, "b": 224.36023, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 535.53925, "t": 215.14721999999995, "r": 547.13879, "b": 224.36023, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "xiii", "bbox": {"l": 535.53925, "t": 215.14721999999995, "r": 547.13879, "b": 224.36023, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 136.79803, "t": 227.62707999999998, "r": 529.99506, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "Comments welcome. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 136.79803, "t": 227.62707999999998, "r": 529.99506, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 535.5495, "t": 227.62707999999998, "r": 547.19788, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "xiii", "bbox": {"l": 535.5495, "t": 227.62707999999998, "r": 547.19788, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 136.79807, "t": 240.10693000000003, "r": 284.02866, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "Stay connected to IBM Redbooks", "bbox": {"l": 136.79807, "t": 240.10693000000003, "r": 284.02866, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 289.54449, "t": 240.10693000000003, "r": 529.48242, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 289.54449, "t": 240.10693000000003, "r": 529.48242, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 534.99829, "t": 240.10693000000003, "r": 547.12115, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "xiv", "bbox": {"l": 534.99829, "t": 240.10693000000003, "r": 547.12115, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 136.79807, "t": 262.60657000000003, "r": 373.17566, "b": 271.81958, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "Chapter 1. Securing and protecting IBM DB2 data", "bbox": {"l": 136.79807, "t": 262.60657000000003, "r": 373.17566, "b": 271.81958, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 375.11798, "t": 262.60657000000003, "r": 536.09589, "b": 271.81958, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 375.11798, "t": 262.60657000000003, "r": 536.09589, "b": 271.81958, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 541.64685, "t": 262.60657000000003, "r": 547.19781, "b": 271.81958, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "1", "bbox": {"l": 541.64685, "t": 262.60657000000003, "r": 547.19781, "b": 271.81958, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 136.79808, "t": 274.60637999999994, "r": 150.88702, "b": 283.8194, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "1.1", "bbox": {"l": 136.79808, "t": 274.60637999999994, "r": 150.88702, "b": 283.8194, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 156.5226, "t": 274.60637999999994, "r": 549.84723, "b": 283.8194, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "Security fundamentals. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2", "bbox": {"l": 156.5226, "t": 274.60637999999994, "r": 549.84723, "b": 283.8194, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 136.79807, "t": 287.14606000000003, "r": 150.62746, "b": 296.35904, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "1.2", "bbox": {"l": 136.79807, "t": 287.14606000000003, "r": 150.62746, "b": 296.35904, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 156.15923, "t": 287.14606000000003, "r": 536.12933, "b": 296.35904, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "Current state of IBM i security . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.15923, "t": 287.14606000000003, "r": 536.12933, "b": 296.35904, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 541.66113, "t": 287.14606000000003, "r": 547.19287, "b": 296.35904, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "2", "bbox": {"l": 541.66113, "t": 287.14606000000003, "r": 547.19287, "b": 296.35904, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 136.79807, "t": 299.62595, "r": 150.84943, "b": 308.83893, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "1.3", "bbox": {"l": 136.79807, "t": 299.62595, "r": 150.84943, "b": 308.83893, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 156.46996, "t": 299.62595, "r": 549.84723, "b": 308.83893, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "DB2 for i security controls . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3", "bbox": {"l": 156.46996, "t": 299.62595, "r": 549.84723, "b": 308.83893, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 151.1972, "t": 312.1058300000001, "r": 173.38289, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "1.3.1", "bbox": {"l": 151.1972, "t": 312.1058300000001, "r": 173.38289, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 178.92932, "t": 312.1058300000001, "r": 536.05511, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "Existing row and column control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.92932, "t": 312.1058300000001, "r": 536.05511, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 541.6015, "t": 312.1058300000001, "r": 547.14795, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "4", "bbox": {"l": 541.6015, "t": 312.1058300000001, "r": 547.14795, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 151.1972, "t": 324.64548, "r": 173.4189, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "1.3.2", "bbox": {"l": 151.1972, "t": 324.64548, "r": 173.4189, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 178.97432, "t": 324.64548, "r": 536.08008, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "New controls: Row and Column Access Control. . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.97432, "t": 324.64548, "r": 536.08008, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 541.6355, "t": 324.64548, "r": 547.19092, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "5", "bbox": {"l": 541.6355, "t": 324.64548, "r": 547.19092, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 136.79704, "t": 347.14511, "r": 336.82071, "b": 356.35809, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "Chapter 2. Roles and separation of duties", "bbox": {"l": 136.79704, "t": 347.14511, "r": 336.82071, "b": 356.35809, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 338.99701, "t": 347.14511, "r": 536.09088, "b": 356.35809, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 338.99701, "t": 347.14511, "r": 536.09088, "b": 356.35809, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 541.64282, "t": 347.14511, "r": 547.19476, "b": 356.35809, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "7", "bbox": {"l": 541.64282, "t": 347.14511, "r": 547.19476, "b": 356.35809, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 136.79704, "t": 359.14493, "r": 150.644, "b": 368.35791, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "2.1", "bbox": {"l": 136.79704, "t": 359.14493, "r": 150.644, "b": 368.35791, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 156.18277, "t": 359.14493, "r": 536.12714, "b": 368.35791, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "Roles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.18277, "t": 359.14493, "r": 536.12714, "b": 368.35791, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 541.66589, "t": 359.14493, "r": 547.20471, "b": 368.35791, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "8", "bbox": {"l": 541.66589, "t": 359.14493, "r": 547.20471, "b": 368.35791, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 151.1972, "t": 371.62482, "r": 173.60995, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "2.1.1", "bbox": {"l": 151.1972, "t": 371.62482, "r": 173.60995, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 176.41154, "t": 371.62482, "r": 535.9527, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "DDM and DRDA application server access: QIBM_DB_DDMDRDA . . . . . . . . . . .", "bbox": {"l": 176.41154, "t": 371.62482, "r": 535.9527, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 541.55585, "t": 371.62482, "r": 547.15906, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "8", "bbox": {"l": 541.55585, "t": 371.62482, "r": 547.15906, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 151.1972, "t": 384.10470999999995, "r": 173.41664, "b": 393.31769, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "2.1.2", "bbox": {"l": 151.1972, "t": 384.10470999999995, "r": 173.41664, "b": 393.31769, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 178.97151, "t": 384.10470999999995, "r": 536.04108, "b": 393.31769, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "Toolbox application server access: QIBM_DB_ZDA. . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.97151, "t": 384.10470999999995, "r": 536.04108, "b": 393.31769, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 541.59595, "t": 384.10470999999995, "r": 547.15082, "b": 393.31769, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "8", "bbox": {"l": 541.59595, "t": 384.10470999999995, "r": 547.15082, "b": 393.31769, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 151.1972, "t": 396.64435, "r": 173.41859, "b": 405.85733, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "2.1.3", "bbox": {"l": 151.1972, "t": 396.64435, "r": 173.41859, "b": 405.85733, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 178.97394, "t": 396.64435, "r": 536.07489, "b": 405.85733, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "Database Administrator function: QIBM_DB_SQLADM . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.97394, "t": 396.64435, "r": 536.07489, "b": 405.85733, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 541.63025, "t": 396.64435, "r": 547.18561, "b": 405.85733, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "9", "bbox": {"l": 541.63025, "t": 396.64435, "r": 547.18561, "b": 405.85733, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 151.1972, "t": 409.12424000000004, "r": 173.38629, "b": 418.33722, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "2.1.4", "bbox": {"l": 151.1972, "t": 409.12424000000004, "r": 173.38629, "b": 418.33722, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 178.93356, "t": 409.12424000000004, "r": 411.27048, "b": 418.33722, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "Database Information function: QIBM_DB_SYSMON", "bbox": {"l": 178.93356, "t": 409.12424000000004, "r": 411.27048, "b": 418.33722, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 416.81775, "t": 409.12424000000004, "r": 536.08411, "b": 418.33722, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": ". . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 416.81775, "t": 409.12424000000004, "r": 536.08411, "b": 418.33722, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 541.63135, "t": 409.12424000000004, "r": 547.17865, "b": 418.33722, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "9", "bbox": {"l": 541.63135, "t": 409.12424000000004, "r": 547.17865, "b": 418.33722, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 151.1972, "t": 421.60413, "r": 173.44926, "b": 430.81711, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "2.1.5", "bbox": {"l": 151.1972, "t": 421.60413, "r": 173.44926, "b": 430.81711, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 179.01228, "t": 421.60413, "r": 536.03589, "b": 430.81711, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "Security Administrator function: QIBM_DB_SECADM . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 179.01228, "t": 421.60413, "r": 536.03589, "b": 430.81711, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 541.59894, "t": 421.60413, "r": 547.16193, "b": 430.81711, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "9", "bbox": {"l": 541.59894, "t": 421.60413, "r": 547.16193, "b": 430.81711, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 151.1972, "t": 434.1437700000001, "r": 173.32208, "b": 443.35675, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "2.1.6", "bbox": {"l": 151.1972, "t": 434.1437700000001, "r": 173.32208, "b": 443.35675, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 178.8533, "t": 434.1437700000001, "r": 530.57318, "b": 443.35675, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "Change Function Usage CL command . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.8533, "t": 434.1437700000001, "r": 530.57318, "b": 443.35675, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 536.10443, "t": 434.1437700000001, "r": 547.16687, "b": 443.35675, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "10", "bbox": {"l": 536.10443, "t": 434.1437700000001, "r": 547.16687, "b": 443.35675, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 151.1972, "t": 446.62366, "r": 173.35822, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "2.1.7", "bbox": {"l": 151.1972, "t": 446.62366, "r": 173.35822, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 178.89848, "t": 446.62366, "r": 530.53522, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "Verifying function usage IDs for RCAC with the FUNCTION_USAGE view . . . . .", "bbox": {"l": 178.89848, "t": 446.62366, "r": 530.53522, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 536.0755, "t": 446.62366, "r": 547.15601, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "10", "bbox": {"l": 536.0755, "t": 446.62366, "r": 547.15601, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 136.79704, "t": 459.10355, "r": 150.85457, "b": 468.31653, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "2.2", "bbox": {"l": 136.79704, "t": 459.10355, "r": 150.85457, "b": 468.31653, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 156.47758, "t": 459.10355, "r": 547.25659, "b": 468.31653, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "Separation of duties . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10", "bbox": {"l": 156.47758, "t": 459.10355, "r": 547.25659, "b": 468.31653, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 136.79703, "t": 481.60318, "r": 348.68503, "b": 490.81616, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "Chapter 3. Row and Column Access Control", "bbox": {"l": 136.79703, "t": 481.60318, "r": 348.68503, "b": 490.81616, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 350.09741, "t": 481.60318, "r": 530.53961, "b": 490.81616, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 350.09741, "t": 481.60318, "r": 530.53961, "b": 490.81616, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 536.09167, "t": 481.60318, "r": 547.1958, "b": 490.81616, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "13", "bbox": {"l": 536.09167, "t": 481.60318, "r": 547.1958, "b": 490.81616, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 136.79703, "t": 493.603, "r": 150.70105, "b": 502.81598, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "3.1", "bbox": {"l": 136.79703, "t": 493.603, "r": 150.70105, "b": 502.81598, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 156.26266, "t": 493.603, "r": 530.4809, "b": 502.81598, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "Explanation of RCAC and the concept of access control . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.26266, "t": 493.603, "r": 530.4809, "b": 502.81598, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 536.04248, "t": 493.603, "r": 547.16571, "b": 502.81598, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "14", "bbox": {"l": 536.04248, "t": 493.603, "r": 547.16571, "b": 502.81598, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 151.19719, "t": 506.14264, "r": 173.35429, "b": 515.35562, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "3.1.1", "bbox": {"l": 151.19719, "t": 506.14264, "r": 173.35429, "b": 515.35562, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 178.89357, "t": 506.14264, "r": 378.20786, "b": 515.35562, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "Row permission and column mask definitions", "bbox": {"l": 178.89357, "t": 506.14264, "r": 378.20786, "b": 515.35562, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 383.74713, "t": 506.14264, "r": 530.5379, "b": 515.35562, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 383.74713, "t": 506.14264, "r": 530.5379, "b": 515.35562, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 536.07721, "t": 506.14264, "r": 547.15576, "b": 515.35562, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "14", "bbox": {"l": 536.07721, "t": 506.14264, "r": 547.15576, "b": 515.35562, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 151.19719, "t": 518.62253, "r": 173.44292, "b": 527.83551, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "3.1.2", "bbox": {"l": 151.19719, "t": 518.62253, "r": 173.44292, "b": 527.83551, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 179.00435, "t": 518.62253, "r": 530.43475, "b": 527.83551, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "Enabling and activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 179.00435, "t": 518.62253, "r": 530.43475, "b": 527.83551, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 535.99622, "t": 518.62253, "r": 547.11908, "b": 527.83551, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "16", "bbox": {"l": 535.99622, "t": 518.62253, "r": 547.11908, "b": 527.83551, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 136.79703, "t": 531.1621700000001, "r": 150.64432, "b": 540.37517, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "3.2", "bbox": {"l": 136.79703, "t": 531.1621700000001, "r": 150.64432, "b": 540.37517, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 156.18323, "t": 531.1621700000001, "r": 530.52808, "b": 540.37517, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "Special registers and built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.18323, "t": 531.1621700000001, "r": 530.52808, "b": 540.37517, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 536.06702, "t": 531.1621700000001, "r": 547.14484, "b": 540.37517, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "18", "bbox": {"l": 536.06702, "t": 531.1621700000001, "r": 547.14484, "b": 540.37517, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 151.19719, "t": 543.64204, "r": 173.41321, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "3.2.1", "bbox": {"l": 151.19719, "t": 543.64204, "r": 173.41321, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 178.96722, "t": 543.64204, "r": 530.49786, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "Special registers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.96722, "t": 543.64204, "r": 530.49786, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 536.05188, "t": 543.64204, "r": 547.15991, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "18", "bbox": {"l": 536.05188, "t": 543.64204, "r": 547.15991, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 151.19719, "t": 556.12192, "r": 173.35269, "b": 565.33492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "3.2.2", "bbox": {"l": 151.19719, "t": 556.12192, "r": 173.35269, "b": 565.33492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 178.89156, "t": 556.12192, "r": 530.56024, "b": 565.33492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "Built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.89156, "t": 556.12192, "r": 530.56024, "b": 565.33492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 536.09912, "t": 556.12192, "r": 547.17688, "b": 565.33492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "19", "bbox": {"l": 536.09912, "t": 556.12192, "r": 547.17688, "b": 565.33492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 136.79703, "t": 568.66156, "r": 150.62514, "b": 577.87456, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "3.3", "bbox": {"l": 136.79703, "t": 568.66156, "r": 150.62514, "b": 577.87456, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 156.15639, "t": 568.66156, "r": 530.53027, "b": 577.87456, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "VERIFY_GROUP_FOR_USER function . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.15639, "t": 568.66156, "r": 530.53027, "b": 577.87456, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 536.06152, "t": 568.66156, "r": 547.12402, "b": 577.87456, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "20", "bbox": {"l": 536.06152, "t": 568.66156, "r": 547.12402, "b": 577.87456, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 136.79703, "t": 581.14143, "r": 150.63004, "b": 590.35443, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "3.4", "bbox": {"l": 136.79703, "t": 581.14143, "r": 150.63004, "b": 590.35443, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 156.16325, "t": 581.14143, "r": 530.62994, "b": 590.35443, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "Establishing and controlling accessibility by using the RCAC rule text . . . . . . . . . . . . .", "bbox": {"l": 156.16325, "t": 581.14143, "r": 530.62994, "b": 590.35443, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 536.16315, "t": 581.14143, "r": 547.22955, "b": 590.35443, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "21", "bbox": {"l": 536.16315, "t": 581.14143, "r": 547.22955, "b": 590.35443, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 136.79701, "t": 593.62131, "r": 150.64413, "b": 602.8343, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "3.5", "bbox": {"l": 136.79701, "t": 593.62131, "r": 150.64413, "b": 602.8343, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 156.18298, "t": 593.62131, "r": 394.7818, "b": 602.8343, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "SELECT, INSERT, and UPDATE behavior with RCAC", "bbox": {"l": 156.18298, "t": 593.62131, "r": 394.7818, "b": 602.8343, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 400.32065, "t": 593.62131, "r": 530.48358, "b": 602.8343, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": ". . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 400.32065, "t": 593.62131, "r": 530.48358, "b": 602.8343, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 536.0224, "t": 593.62131, "r": 547.1001, "b": 602.8343, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "22", "bbox": {"l": 536.0224, "t": 593.62131, "r": 547.1001, "b": 602.8343, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 136.79701, "t": 606.16095, "r": 150.6642, "b": 615.37395, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "3.6", "bbox": {"l": 136.79701, "t": 606.16095, "r": 150.6642, "b": 615.37395, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 156.21107, "t": 606.16095, "r": 530.56512, "b": 615.37395, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "Human resources example . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.21107, "t": 606.16095, "r": 530.56512, "b": 615.37395, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 536.112, "t": 606.16095, "r": 547.20575, "b": 615.37395, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "22", "bbox": {"l": 536.112, "t": 606.16095, "r": 547.20575, "b": 615.37395, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 151.19717, "t": 618.64082, "r": 173.41692, "b": 627.85382, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "3.6.1", "bbox": {"l": 151.19717, "t": 618.64082, "r": 173.41692, "b": 627.85382, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 178.97185, "t": 618.64082, "r": 530.49139, "b": 627.85382, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": "Assigning the QIBM_DB_SECADM function ID to the consultants. . . . . . . . . . . .", "bbox": {"l": 178.97185, "t": 618.64082, "r": 530.49139, "b": 627.85382, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 536.04633, "t": 618.64082, "r": 547.15619, "b": 627.85382, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "23", "bbox": {"l": 536.04633, "t": 618.64082, "r": 547.15619, "b": 627.85382, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 151.19717, "t": 631.1206999999999, "r": 173.32271, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "3.6.2", "bbox": {"l": 151.19717, "t": 631.1206999999999, "r": 173.32271, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 178.8541, "t": 631.1206999999999, "r": 530.56458, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": "Creating group profiles for the users and their roles . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.8541, "t": 631.1206999999999, "r": 530.56458, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 536.09601, "t": 631.1206999999999, "r": 547.15875, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 107, "text": "23", "bbox": {"l": 536.09601, "t": 631.1206999999999, "r": 547.15875, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 151.19717, "t": 643.66034, "r": 173.32227, "b": 652.87334, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 108, "text": "3.6.3", "bbox": {"l": 151.19717, "t": 643.66034, "r": 173.32227, "b": 652.87334, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 178.85353, "t": 643.66034, "r": 530.55695, "b": 652.87334, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 109, "text": "Demonstrating data access without RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.85353, "t": 643.66034, "r": 530.55695, "b": 652.87334, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 536.0882, "t": 643.66034, "r": 547.15076, "b": 652.87334, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 110, "text": "24", "bbox": {"l": 536.0882, "t": 643.66034, "r": 547.15076, "b": 652.87334, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 151.19717, "t": 656.14021, "r": 173.35289, "b": 665.35321, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 111, "text": "3.6.4", "bbox": {"l": 151.19717, "t": 656.14021, "r": 173.35289, "b": 665.35321, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 178.89182, "t": 656.14021, "r": 530.53412, "b": 665.35321, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 112, "text": "Defining and creating row permissions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.89182, "t": 656.14021, "r": 530.53412, "b": 665.35321, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 114, "label": "text", "bbox": {"l": 536.073, "t": 656.14021, "r": 547.15088, "b": 665.35321, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 113, "text": "25", "bbox": {"l": 536.073, "t": 656.14021, "r": 547.15088, "b": 665.35321, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 115, "label": "text", "bbox": {"l": 151.19717, "t": 668.62009, "r": 173.35289, "b": 677.83309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 114, "text": "3.6.5", "bbox": {"l": 151.19717, "t": 668.62009, "r": 173.35289, "b": 677.83309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 116, "label": "text", "bbox": {"l": 178.89182, "t": 668.62009, "r": 339.45105, "b": 677.83309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 115, "text": "Defining and creating column masks", "bbox": {"l": 178.89182, "t": 668.62009, "r": 339.45105, "b": 677.83309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 117, "label": "text", "bbox": {"l": 344.98996, "t": 668.62009, "r": 530.54413, "b": 677.83309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 116, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 344.98996, "t": 668.62009, "r": 530.54413, "b": 677.83309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 118, "label": "text", "bbox": {"l": 536.08301, "t": 668.62009, "r": 547.16089, "b": 677.83309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 117, "text": "26", "bbox": {"l": 536.08301, "t": 668.62009, "r": 547.16089, "b": 677.83309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 119, "label": "text", "bbox": {"l": 151.19717, "t": 681.15973, "r": 173.38359, "b": 690.37273, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 118, "text": "3.6.6", "bbox": {"l": 151.19717, "t": 681.15973, "r": 173.38359, "b": 690.37273, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 120, "label": "text", "bbox": {"l": 178.93019, "t": 681.15973, "r": 530.54102, "b": 690.37273, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 119, "text": "Activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.93019, "t": 681.15973, "r": 530.54102, "b": 690.37273, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 121, "label": "text", "bbox": {"l": 536.08765, "t": 681.15973, "r": 547.18085, "b": 690.37273, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 120, "text": "28", "bbox": {"l": 536.08765, "t": 681.15973, "r": 547.18085, "b": 690.37273, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 122, "label": "text", "bbox": {"l": 151.19717, "t": 693.63961, "r": 173.32332, "b": 702.852615, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 121, "text": "3.6.7", "bbox": {"l": 151.19717, "t": 693.63961, "r": 173.32332, "b": 702.852615, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 123, "label": "text", "bbox": {"l": 178.85486, "t": 693.63961, "r": 350.80011, "b": 702.852615, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 122, "text": "Demonstrating data access with RCAC", "bbox": {"l": 178.85486, "t": 693.63961, "r": 350.80011, "b": 702.852615, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 124, "label": "text", "bbox": {"l": 356.33163, "t": 693.63961, "r": 530.57507, "b": 702.852615, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 123, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 356.33163, "t": 693.63961, "r": 530.57507, "b": 702.852615, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 125, "label": "text", "bbox": {"l": 536.10663, "t": 693.63961, "r": 547.16968, "b": 702.852615, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 124, "text": "29", "bbox": {"l": 536.10663, "t": 693.63961, "r": 547.16968, "b": 702.852615, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 126, "label": "text", "bbox": {"l": 151.19717, "t": 706.119492, "r": 173.44592, "b": 715.332497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 125, "text": "3.6.8", "bbox": {"l": 151.19717, "t": 706.119492, "r": 173.44592, "b": 715.332497, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 127, "label": "text", "bbox": {"l": 179.00812, "t": 706.119492, "r": 530.43628, "b": 715.332497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 126, "text": "Demonstrating data access with a view and RCAC . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 179.00812, "t": 706.119492, "r": 530.43628, "b": 715.332497, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 128, "label": "text", "bbox": {"l": 535.99847, "t": 706.119492, "r": 547.12286, "b": 715.332497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 127, "text": "32", "bbox": {"l": 535.99847, "t": 706.119492, "r": 547.12286, "b": 715.332497, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 43, "num_cols": 2, "table_cells": [{"bbox": {"l": 136.8, "t": 132.64862000000005, "r": 172.89404, "b": 141.86163, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Notices", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 175.01952, "t": 132.64862000000005, "r": 547.18982, "b": 141.86163, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vii", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79901, "t": 145.12847999999997, "r": 189.86537, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Trademarks", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 195.39685, "t": 145.12847999999997, "r": 547.18286, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . viii", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79901, "t": 167.62811, "r": 279.39731, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "DB2 for i Center of Excellence", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.61942, "t": 167.62811, "r": 547.1908, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ix", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79901, "t": 190.12775, "r": 172.84424, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Preface", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 175.01852, "t": 190.12775, "r": 547.18286, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79803, "t": 202.60760000000005, "r": 547.18085, "b": 211.82061999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Authors . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79803, "t": 215.14721999999995, "r": 339.18292, "b": 224.36023, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Now you can become a published author, too!", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 344.71411, "t": 215.14721999999995, "r": 547.13879, "b": 224.36023, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xiii", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79803, "t": 227.62707999999998, "r": 529.99506, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Comments welcome. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 535.5495, "t": 227.62707999999998, "r": 547.19788, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "xiii", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79807, "t": 240.10693000000003, "r": 284.02866, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Stay connected to IBM Redbooks", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.54449, "t": 240.10693000000003, "r": 547.12115, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xiv", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79807, "t": 262.60657000000003, "r": 536.09589, "b": 271.81958, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Chapter 1. Securing and protecting IBM DB2 data  . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.64685, "t": 262.60657000000003, "r": 547.19781, "b": 271.81958, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79808, "t": 274.60637999999994, "r": 549.84723, "b": 283.8194, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "1.1 Security fundamentals. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79807, "t": 287.14606000000003, "r": 536.12933, "b": 296.35904, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "1.2 Current state of IBM i security . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.66113, "t": 287.14606000000003, "r": 547.19287, "b": 296.35904, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79807, "t": 299.62595, "r": 549.84723, "b": 308.83893, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "1.3 DB2 for i security controls . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 312.1058300000001, "r": 536.05511, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "1.3.1 Existing row and column control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.6015, "t": 312.1058300000001, "r": 547.14795, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 324.64548, "r": 536.08008, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "1.3.2 New controls: Row and Column Access Control. . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.6355, "t": 324.64548, "r": 547.19092, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79704, "t": 347.14511, "r": 536.09088, "b": 356.35809, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 14, "end_row_offset_idx": 15, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Chapter 2. Roles and separation of duties . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.64282, "t": 347.14511, "r": 547.19476, "b": 356.35809, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 14, "end_row_offset_idx": 15, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79704, "t": 359.14493, "r": 536.12714, "b": 368.35791, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 15, "end_row_offset_idx": 16, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1 Roles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.66589, "t": 359.14493, "r": 547.20471, "b": 368.35791, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 15, "end_row_offset_idx": 16, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 371.62482, "r": 535.9527, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 16, "end_row_offset_idx": 17, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.1 DDM and DRDA application server access: QIBM_DB_DDMDRDA . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.55585, "t": 371.62482, "r": 547.15906, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 16, "end_row_offset_idx": 17, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 384.10470999999995, "r": 536.04108, "b": 393.31769, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 17, "end_row_offset_idx": 18, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.2 Toolbox application server access: QIBM_DB_ZDA. . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.59595, "t": 384.10470999999995, "r": 547.15082, "b": 393.31769, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 17, "end_row_offset_idx": 18, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 396.64435, "r": 536.07489, "b": 405.85733, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 18, "end_row_offset_idx": 19, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.3 Database Administrator function: QIBM_DB_SQLADM . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.63025, "t": 396.64435, "r": 547.18561, "b": 405.85733, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 18, "end_row_offset_idx": 19, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 409.12424000000004, "r": 411.27048, "b": 418.33722, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 19, "end_row_offset_idx": 20, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.4 Database Information function: QIBM_DB_SYSMON", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 416.81775, "t": 409.12424000000004, "r": 547.17865, "b": 418.33722, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 19, "end_row_offset_idx": 20, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . 9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 421.60413, "r": 536.03589, "b": 430.81711, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 20, "end_row_offset_idx": 21, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.5 Security Administrator function: QIBM_DB_SECADM . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.59894, "t": 421.60413, "r": 547.16193, "b": 430.81711, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 20, "end_row_offset_idx": 21, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 434.1437700000001, "r": 530.57318, "b": 443.35675, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 21, "end_row_offset_idx": 22, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.6 Change Function Usage CL command . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.10443, "t": 434.1437700000001, "r": 547.16687, "b": 443.35675, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 21, "end_row_offset_idx": 22, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "10", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 446.62366, "r": 530.53522, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 22, "end_row_offset_idx": 23, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.7 Verifying function usage IDs for RCAC with the FUNCTION_USAGE view . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.0755, "t": 446.62366, "r": 547.15601, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 22, "end_row_offset_idx": 23, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "10", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79704, "t": 459.10355, "r": 547.25659, "b": 468.31653, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 23, "end_row_offset_idx": 24, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.2 Separation of duties . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79703, "t": 481.60318, "r": 530.53961, "b": 490.81616, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 24, "end_row_offset_idx": 25, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Chapter 3. Row and Column Access Control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.09167, "t": 481.60318, "r": 547.1958, "b": 490.81616, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 24, "end_row_offset_idx": 25, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "13", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79703, "t": 493.603, "r": 530.4809, "b": 502.81598, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 25, "end_row_offset_idx": 26, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.1 Explanation of RCAC and the concept of access control . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.04248, "t": 493.603, "r": 547.16571, "b": 502.81598, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 25, "end_row_offset_idx": 26, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "14", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19719, "t": 506.14264, "r": 378.20786, "b": 515.35562, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 26, "end_row_offset_idx": 27, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.1.1 Row permission and column mask definitions", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 383.74713, "t": 506.14264, "r": 547.15576, "b": 515.35562, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 26, "end_row_offset_idx": 27, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . 14", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19719, "t": 518.62253, "r": 530.43475, "b": 527.83551, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 27, "end_row_offset_idx": 28, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.1.2 Enabling and activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 535.99622, "t": 518.62253, "r": 547.11908, "b": 527.83551, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 27, "end_row_offset_idx": 28, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "16", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79703, "t": 531.1621700000001, "r": 530.52808, "b": 540.37517, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 28, "end_row_offset_idx": 29, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.2 Special registers and built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.06702, "t": 531.1621700000001, "r": 547.14484, "b": 540.37517, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 28, "end_row_offset_idx": 29, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "18", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19719, "t": 543.64204, "r": 530.49786, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 29, "end_row_offset_idx": 30, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.2.1 Special registers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.05188, "t": 543.64204, "r": 547.15991, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 29, "end_row_offset_idx": 30, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "18", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19719, "t": 556.12192, "r": 530.56024, "b": 565.33492, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 30, "end_row_offset_idx": 31, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.2.2 Built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.09912, "t": 556.12192, "r": 547.17688, "b": 565.33492, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 30, "end_row_offset_idx": 31, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "19", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79703, "t": 568.66156, "r": 530.53027, "b": 577.87456, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 31, "end_row_offset_idx": 32, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.3 VERIFY_GROUP_FOR_USER function . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.06152, "t": 568.66156, "r": 547.12402, "b": 577.87456, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 31, "end_row_offset_idx": 32, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "20", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79703, "t": 581.14143, "r": 530.62994, "b": 590.35443, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 32, "end_row_offset_idx": 33, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.4 Establishing and controlling accessibility by using the RCAC rule text . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.16315, "t": 581.14143, "r": 547.22955, "b": 590.35443, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 32, "end_row_offset_idx": 33, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "21", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79701, "t": 593.62131, "r": 530.56512, "b": 615.37395, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 34, "end_row_offset_idx": 35, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.5 SELECT, INSERT, and UPDATE behavior with RCAC 3.6 Human resources example . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 400.32065, "t": 593.62131, "r": 530.48358, "b": 602.8343, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 33, "end_row_offset_idx": 34, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": ". . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.0224, "t": 593.62131, "r": 547.1001, "b": 602.8343, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 33, "end_row_offset_idx": 34, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "22", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.112, "t": 606.16095, "r": 547.20575, "b": 615.37395, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 34, "end_row_offset_idx": 35, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "22", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717, "t": 618.64082, "r": 530.49139, "b": 627.85382, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 35, "end_row_offset_idx": 36, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.1 Assigning the QIBM_DB_SECADM function ID to the consultants. . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.04633, "t": 618.64082, "r": 547.15619, "b": 627.85382, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 35, "end_row_offset_idx": 36, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "23", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717, "t": 631.1206999999999, "r": 530.56458, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 36, "end_row_offset_idx": 37, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.2 Creating group profiles for the users and their roles . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.09601, "t": 631.1206999999999, "r": 547.15875, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 36, "end_row_offset_idx": 37, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "23", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717, "t": 643.66034, "r": 530.55695, "b": 652.87334, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 37, "end_row_offset_idx": 38, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.3 Demonstrating data access without RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.0882, "t": 643.66034, "r": 547.15076, "b": 652.87334, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 37, "end_row_offset_idx": 38, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "24", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717, "t": 656.14021, "r": 530.53412, "b": 665.35321, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 38, "end_row_offset_idx": 39, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.4 Defining and creating row permissions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.073, "t": 656.14021, "r": 547.15088, "b": 665.35321, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 38, "end_row_offset_idx": 39, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "25", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717, "t": 668.62009, "r": 339.45105, "b": 677.83309, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 39, "end_row_offset_idx": 40, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.5 Defining and creating column masks", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 344.98996, "t": 668.62009, "r": 547.16089, "b": 677.83309, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 39, "end_row_offset_idx": 40, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717, "t": 681.15973, "r": 530.54102, "b": 690.37273, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 40, "end_row_offset_idx": 41, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.6 Activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.08765, "t": 681.15973, "r": 547.18085, "b": 690.37273, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 40, "end_row_offset_idx": 41, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "28", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717, "t": 693.63961, "r": 530.57507, "b": 702.852615, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 41, "end_row_offset_idx": 42, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.7 Demonstrating data access with RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.10663, "t": 693.63961, "r": 547.16968, "b": 702.852615, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 41, "end_row_offset_idx": 42, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "29", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717, "t": 706.119492, "r": 530.43628, "b": 715.332497, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 42, "end_row_offset_idx": 43, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.8 Demonstrating data access with a view and RCAC . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 535.99847, "t": 706.119492, "r": 547.12286, "b": 715.332497, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 42, "end_row_offset_idx": 43, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "32", "column_header": false, "row_header": false, "row_section": false}]}}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_footer", "id": 2, "page_no": 1, "cluster": {"id": 2, "label": "page_footer", "bbox": {"l": 64.800003, "t": 755.538002, "r": 257.24335, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9473597407341003, "cells": [{"id": 0, "text": "' Copyright IBM Corp. 2014. All rights reserved.", "bbox": {"l": 64.800003, "t": 755.538002, "r": 257.24335, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "' Copyright IBM Corp. 2014. All rights reserved."}, {"label": "page_footer", "id": 3, "page_no": 1, "cluster": {"id": 3, "label": "page_footer", "bbox": {"l": 538.85999, "t": 754.848721, "r": 547.25928, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.8926277160644531, "cells": [{"id": 1, "text": "iii", "bbox": {"l": 538.85999, "t": 754.848721, "r": 547.25928, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "iii"}, {"label": "section_header", "id": 1, "page_no": 1, "cluster": {"id": 1, "label": "section_header", "bbox": {"l": 64.800003, "t": 73.84802000000002, "r": 168.73441, "b": 96.04803000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9509142637252808, "cells": [{"id": 2, "text": "Contents", "bbox": {"l": 64.800003, "t": 73.84802000000002, "r": 168.73441, "b": 96.04803000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Contents"}, {"label": "document_index", "id": 0, "page_no": 1, "cluster": {"id": 0, "label": "document_index", "bbox": {"l": 136.1496124267578, "t": 132.0330352783203, "r": 547.5267944335938, "b": 715.6515502929688, "coord_origin": "TOPLEFT"}, "confidence": 0.9803681373596191, "cells": [{"id": 3, "text": "Notices", "bbox": {"l": 136.8, "t": 132.64862000000005, "r": 172.89404, "b": 141.86163, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vii", "bbox": {"l": 175.01952, "t": 132.64862000000005, "r": 547.18982, "b": 141.86163, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Trademarks", "bbox": {"l": 136.79901, "t": 145.12847999999997, "r": 189.86537, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 195.39685, "t": 145.12847999999997, "r": 530.05121, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "viii", "bbox": {"l": 535.5827, "t": 145.12847999999997, "r": 547.18286, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "DB2 for i Center of Excellence", "bbox": {"l": 136.79901, "t": 167.62811, "r": 279.39731, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ix", "bbox": {"l": 280.61942, "t": 167.62811, "r": 547.1908, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Preface", "bbox": {"l": 136.79901, "t": 190.12775, "r": 172.84424, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi", "bbox": {"l": 175.01852, "t": 190.12775, "r": 547.18286, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Authors . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi", "bbox": {"l": 136.79803, "t": 202.60760000000005, "r": 547.18085, "b": 211.82061999999996, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Now you can become a published author, too!", "bbox": {"l": 136.79803, "t": 215.14721999999995, "r": 339.18292, "b": 224.36023, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 344.71411, "t": 215.14721999999995, "r": 530.00812, "b": 224.36023, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "xiii", "bbox": {"l": 535.53925, "t": 215.14721999999995, "r": 547.13879, "b": 224.36023, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Comments welcome. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 136.79803, "t": 227.62707999999998, "r": 529.99506, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "xiii", "bbox": {"l": 535.5495, "t": 227.62707999999998, "r": 547.19788, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Stay connected to IBM Redbooks", "bbox": {"l": 136.79807, "t": 240.10693000000003, "r": 284.02866, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 289.54449, "t": 240.10693000000003, "r": 529.48242, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "xiv", "bbox": {"l": 534.99829, "t": 240.10693000000003, "r": 547.12115, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Chapter 1. Securing and protecting IBM DB2 data", "bbox": {"l": 136.79807, "t": 262.60657000000003, "r": 373.17566, "b": 271.81958, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 375.11798, "t": 262.60657000000003, "r": 536.09589, "b": 271.81958, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "1", "bbox": {"l": 541.64685, "t": 262.60657000000003, "r": 547.19781, "b": 271.81958, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "1.1", "bbox": {"l": 136.79808, "t": 274.60637999999994, "r": 150.88702, "b": 283.8194, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "Security fundamentals. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2", "bbox": {"l": 156.5226, "t": 274.60637999999994, "r": 549.84723, "b": 283.8194, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "1.2", "bbox": {"l": 136.79807, "t": 287.14606000000003, "r": 150.62746, "b": 296.35904, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Current state of IBM i security . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.15923, "t": 287.14606000000003, "r": 536.12933, "b": 296.35904, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "2", "bbox": {"l": 541.66113, "t": 287.14606000000003, "r": 547.19287, "b": 296.35904, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "1.3", "bbox": {"l": 136.79807, "t": 299.62595, "r": 150.84943, "b": 308.83893, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "DB2 for i security controls . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3", "bbox": {"l": 156.46996, "t": 299.62595, "r": 549.84723, "b": 308.83893, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "1.3.1", "bbox": {"l": 151.1972, "t": 312.1058300000001, "r": 173.38289, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Existing row and column control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.92932, "t": 312.1058300000001, "r": 536.05511, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "4", "bbox": {"l": 541.6015, "t": 312.1058300000001, "r": 547.14795, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "1.3.2", "bbox": {"l": 151.1972, "t": 324.64548, "r": 173.4189, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "New controls: Row and Column Access Control. . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.97432, "t": 324.64548, "r": 536.08008, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "5", "bbox": {"l": 541.6355, "t": 324.64548, "r": 547.19092, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "Chapter 2. Roles and separation of duties", "bbox": {"l": 136.79704, "t": 347.14511, "r": 336.82071, "b": 356.35809, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 338.99701, "t": 347.14511, "r": 536.09088, "b": 356.35809, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "7", "bbox": {"l": 541.64282, "t": 347.14511, "r": 547.19476, "b": 356.35809, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "2.1", "bbox": {"l": 136.79704, "t": 359.14493, "r": 150.644, "b": 368.35791, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Roles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.18277, "t": 359.14493, "r": 536.12714, "b": 368.35791, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "8", "bbox": {"l": 541.66589, "t": 359.14493, "r": 547.20471, "b": 368.35791, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "2.1.1", "bbox": {"l": 151.1972, "t": 371.62482, "r": 173.60995, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "DDM and DRDA application server access: QIBM_DB_DDMDRDA . . . . . . . . . . .", "bbox": {"l": 176.41154, "t": 371.62482, "r": 535.9527, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "8", "bbox": {"l": 541.55585, "t": 371.62482, "r": 547.15906, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "2.1.2", "bbox": {"l": 151.1972, "t": 384.10470999999995, "r": 173.41664, "b": 393.31769, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "Toolbox application server access: QIBM_DB_ZDA. . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.97151, "t": 384.10470999999995, "r": 536.04108, "b": 393.31769, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "8", "bbox": {"l": 541.59595, "t": 384.10470999999995, "r": 547.15082, "b": 393.31769, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "2.1.3", "bbox": {"l": 151.1972, "t": 396.64435, "r": 173.41859, "b": 405.85733, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Database Administrator function: QIBM_DB_SQLADM . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.97394, "t": 396.64435, "r": 536.07489, "b": 405.85733, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "9", "bbox": {"l": 541.63025, "t": 396.64435, "r": 547.18561, "b": 405.85733, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "2.1.4", "bbox": {"l": 151.1972, "t": 409.12424000000004, "r": 173.38629, "b": 418.33722, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Database Information function: QIBM_DB_SYSMON", "bbox": {"l": 178.93356, "t": 409.12424000000004, "r": 411.27048, "b": 418.33722, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": ". . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 416.81775, "t": 409.12424000000004, "r": 536.08411, "b": 418.33722, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "9", "bbox": {"l": 541.63135, "t": 409.12424000000004, "r": 547.17865, "b": 418.33722, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "2.1.5", "bbox": {"l": 151.1972, "t": 421.60413, "r": 173.44926, "b": 430.81711, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Security Administrator function: QIBM_DB_SECADM . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 179.01228, "t": 421.60413, "r": 536.03589, "b": 430.81711, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "9", "bbox": {"l": 541.59894, "t": 421.60413, "r": 547.16193, "b": 430.81711, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "2.1.6", "bbox": {"l": 151.1972, "t": 434.1437700000001, "r": 173.32208, "b": 443.35675, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Change Function Usage CL command . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.8533, "t": 434.1437700000001, "r": 530.57318, "b": 443.35675, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "10", "bbox": {"l": 536.10443, "t": 434.1437700000001, "r": 547.16687, "b": 443.35675, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "2.1.7", "bbox": {"l": 151.1972, "t": 446.62366, "r": 173.35822, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "Verifying function usage IDs for RCAC with the FUNCTION_USAGE view . . . . .", "bbox": {"l": 178.89848, "t": 446.62366, "r": 530.53522, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "10", "bbox": {"l": 536.0755, "t": 446.62366, "r": 547.15601, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "2.2", "bbox": {"l": 136.79704, "t": 459.10355, "r": 150.85457, "b": 468.31653, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "Separation of duties . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10", "bbox": {"l": 156.47758, "t": 459.10355, "r": 547.25659, "b": 468.31653, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "Chapter 3. Row and Column Access Control", "bbox": {"l": 136.79703, "t": 481.60318, "r": 348.68503, "b": 490.81616, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 350.09741, "t": 481.60318, "r": 530.53961, "b": 490.81616, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "13", "bbox": {"l": 536.09167, "t": 481.60318, "r": 547.1958, "b": 490.81616, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "3.1", "bbox": {"l": 136.79703, "t": 493.603, "r": 150.70105, "b": 502.81598, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Explanation of RCAC and the concept of access control . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.26266, "t": 493.603, "r": 530.4809, "b": 502.81598, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "14", "bbox": {"l": 536.04248, "t": 493.603, "r": 547.16571, "b": 502.81598, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "3.1.1", "bbox": {"l": 151.19719, "t": 506.14264, "r": 173.35429, "b": 515.35562, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "Row permission and column mask definitions", "bbox": {"l": 178.89357, "t": 506.14264, "r": 378.20786, "b": 515.35562, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 383.74713, "t": 506.14264, "r": 530.5379, "b": 515.35562, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "14", "bbox": {"l": 536.07721, "t": 506.14264, "r": 547.15576, "b": 515.35562, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "3.1.2", "bbox": {"l": 151.19719, "t": 518.62253, "r": 173.44292, "b": 527.83551, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "Enabling and activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 179.00435, "t": 518.62253, "r": 530.43475, "b": 527.83551, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "16", "bbox": {"l": 535.99622, "t": 518.62253, "r": 547.11908, "b": 527.83551, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "3.2", "bbox": {"l": 136.79703, "t": 531.1621700000001, "r": 150.64432, "b": 540.37517, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Special registers and built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.18323, "t": 531.1621700000001, "r": 530.52808, "b": 540.37517, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "18", "bbox": {"l": 536.06702, "t": 531.1621700000001, "r": 547.14484, "b": 540.37517, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "3.2.1", "bbox": {"l": 151.19719, "t": 543.64204, "r": 173.41321, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "Special registers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.96722, "t": 543.64204, "r": 530.49786, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "18", "bbox": {"l": 536.05188, "t": 543.64204, "r": 547.15991, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "3.2.2", "bbox": {"l": 151.19719, "t": 556.12192, "r": 173.35269, "b": 565.33492, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.89156, "t": 556.12192, "r": 530.56024, "b": 565.33492, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "19", "bbox": {"l": 536.09912, "t": 556.12192, "r": 547.17688, "b": 565.33492, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "3.3", "bbox": {"l": 136.79703, "t": 568.66156, "r": 150.62514, "b": 577.87456, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "VERIFY_GROUP_FOR_USER function . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.15639, "t": 568.66156, "r": 530.53027, "b": 577.87456, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "20", "bbox": {"l": 536.06152, "t": 568.66156, "r": 547.12402, "b": 577.87456, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "3.4", "bbox": {"l": 136.79703, "t": 581.14143, "r": 150.63004, "b": 590.35443, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "Establishing and controlling accessibility by using the RCAC rule text . . . . . . . . . . . . .", "bbox": {"l": 156.16325, "t": 581.14143, "r": 530.62994, "b": 590.35443, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "21", "bbox": {"l": 536.16315, "t": 581.14143, "r": 547.22955, "b": 590.35443, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "3.5", "bbox": {"l": 136.79701, "t": 593.62131, "r": 150.64413, "b": 602.8343, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "SELECT, INSERT, and UPDATE behavior with RCAC", "bbox": {"l": 156.18298, "t": 593.62131, "r": 394.7818, "b": 602.8343, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": ". . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 400.32065, "t": 593.62131, "r": 530.48358, "b": 602.8343, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "22", "bbox": {"l": 536.0224, "t": 593.62131, "r": 547.1001, "b": 602.8343, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "3.6", "bbox": {"l": 136.79701, "t": 606.16095, "r": 150.6642, "b": 615.37395, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "Human resources example . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.21107, "t": 606.16095, "r": 530.56512, "b": 615.37395, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "22", "bbox": {"l": 536.112, "t": 606.16095, "r": 547.20575, "b": 615.37395, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "3.6.1", "bbox": {"l": 151.19717, "t": 618.64082, "r": 173.41692, "b": 627.85382, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "Assigning the QIBM_DB_SECADM function ID to the consultants. . . . . . . . . . . .", "bbox": {"l": 178.97185, "t": 618.64082, "r": 530.49139, "b": 627.85382, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "23", "bbox": {"l": 536.04633, "t": 618.64082, "r": 547.15619, "b": 627.85382, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "3.6.2", "bbox": {"l": 151.19717, "t": 631.1206999999999, "r": 173.32271, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "Creating group profiles for the users and their roles . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.8541, "t": 631.1206999999999, "r": 530.56458, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "23", "bbox": {"l": 536.09601, "t": 631.1206999999999, "r": 547.15875, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "3.6.3", "bbox": {"l": 151.19717, "t": 643.66034, "r": 173.32227, "b": 652.87334, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "Demonstrating data access without RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.85353, "t": 643.66034, "r": 530.55695, "b": 652.87334, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "24", "bbox": {"l": 536.0882, "t": 643.66034, "r": 547.15076, "b": 652.87334, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "3.6.4", "bbox": {"l": 151.19717, "t": 656.14021, "r": 173.35289, "b": 665.35321, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "Defining and creating row permissions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.89182, "t": 656.14021, "r": 530.53412, "b": 665.35321, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "25", "bbox": {"l": 536.073, "t": 656.14021, "r": 547.15088, "b": 665.35321, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "3.6.5", "bbox": {"l": 151.19717, "t": 668.62009, "r": 173.35289, "b": 677.83309, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "Defining and creating column masks", "bbox": {"l": 178.89182, "t": 668.62009, "r": 339.45105, "b": 677.83309, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 344.98996, "t": 668.62009, "r": 530.54413, "b": 677.83309, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "26", "bbox": {"l": 536.08301, "t": 668.62009, "r": 547.16089, "b": 677.83309, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "3.6.6", "bbox": {"l": 151.19717, "t": 681.15973, "r": 173.38359, "b": 690.37273, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "Activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.93019, "t": 681.15973, "r": 530.54102, "b": 690.37273, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "28", "bbox": {"l": 536.08765, "t": 681.15973, "r": 547.18085, "b": 690.37273, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "3.6.7", "bbox": {"l": 151.19717, "t": 693.63961, "r": 173.32332, "b": 702.852615, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Demonstrating data access with RCAC", "bbox": {"l": 178.85486, "t": 693.63961, "r": 350.80011, "b": 702.852615, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 356.33163, "t": 693.63961, "r": 530.57507, "b": 702.852615, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "29", "bbox": {"l": 536.10663, "t": 693.63961, "r": 547.16968, "b": 702.852615, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "3.6.8", "bbox": {"l": 151.19717, "t": 706.119492, "r": 173.44592, "b": 715.332497, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "Demonstrating data access with a view and RCAC . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 179.00812, "t": 706.119492, "r": 530.43628, "b": 715.332497, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "32", "bbox": {"l": 535.99847, "t": 706.119492, "r": 547.12286, "b": 715.332497, "coord_origin": "TOPLEFT"}}], "children": [{"id": 4, "label": "text", "bbox": {"l": 136.8, "t": 132.64862000000005, "r": 172.89404, "b": 141.86163, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 3, "text": "Notices", "bbox": {"l": 136.8, "t": 132.64862000000005, "r": 172.89404, "b": 141.86163, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "text", "bbox": {"l": 175.01952, "t": 132.64862000000005, "r": 547.18982, "b": 141.86163, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 4, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vii", "bbox": {"l": 175.01952, "t": 132.64862000000005, "r": 547.18982, "b": 141.86163, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "text", "bbox": {"l": 136.79901, "t": 145.12847999999997, "r": 189.86537, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 5, "text": "Trademarks", "bbox": {"l": 136.79901, "t": 145.12847999999997, "r": 189.86537, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "text", "bbox": {"l": 195.39685, "t": 145.12847999999997, "r": 530.05121, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 195.39685, "t": 145.12847999999997, "r": 530.05121, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "text", "bbox": {"l": 535.5827, "t": 145.12847999999997, "r": 547.18286, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "viii", "bbox": {"l": 535.5827, "t": 145.12847999999997, "r": 547.18286, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 136.79901, "t": 167.62811, "r": 279.39731, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "DB2 for i Center of Excellence", "bbox": {"l": 136.79901, "t": 167.62811, "r": 279.39731, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "text", "bbox": {"l": 280.61942, "t": 167.62811, "r": 547.1908, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ix", "bbox": {"l": 280.61942, "t": 167.62811, "r": 547.1908, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 136.79901, "t": 190.12775, "r": 172.84424, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "Preface", "bbox": {"l": 136.79901, "t": 190.12775, "r": 172.84424, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 175.01852, "t": 190.12775, "r": 547.18286, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi", "bbox": {"l": 175.01852, "t": 190.12775, "r": 547.18286, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 136.79803, "t": 202.60760000000005, "r": 547.18085, "b": 211.82061999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "Authors . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi", "bbox": {"l": 136.79803, "t": 202.60760000000005, "r": 547.18085, "b": 211.82061999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 136.79803, "t": 215.14721999999995, "r": 339.18292, "b": 224.36023, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "Now you can become a published author, too!", "bbox": {"l": 136.79803, "t": 215.14721999999995, "r": 339.18292, "b": 224.36023, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 344.71411, "t": 215.14721999999995, "r": 530.00812, "b": 224.36023, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 344.71411, "t": 215.14721999999995, "r": 530.00812, "b": 224.36023, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 535.53925, "t": 215.14721999999995, "r": 547.13879, "b": 224.36023, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "xiii", "bbox": {"l": 535.53925, "t": 215.14721999999995, "r": 547.13879, "b": 224.36023, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 136.79803, "t": 227.62707999999998, "r": 529.99506, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "Comments welcome. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 136.79803, "t": 227.62707999999998, "r": 529.99506, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 535.5495, "t": 227.62707999999998, "r": 547.19788, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "xiii", "bbox": {"l": 535.5495, "t": 227.62707999999998, "r": 547.19788, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 136.79807, "t": 240.10693000000003, "r": 284.02866, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "Stay connected to IBM Redbooks", "bbox": {"l": 136.79807, "t": 240.10693000000003, "r": 284.02866, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 289.54449, "t": 240.10693000000003, "r": 529.48242, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 289.54449, "t": 240.10693000000003, "r": 529.48242, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 534.99829, "t": 240.10693000000003, "r": 547.12115, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "xiv", "bbox": {"l": 534.99829, "t": 240.10693000000003, "r": 547.12115, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 136.79807, "t": 262.60657000000003, "r": 373.17566, "b": 271.81958, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "Chapter 1. Securing and protecting IBM DB2 data", "bbox": {"l": 136.79807, "t": 262.60657000000003, "r": 373.17566, "b": 271.81958, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 375.11798, "t": 262.60657000000003, "r": 536.09589, "b": 271.81958, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 375.11798, "t": 262.60657000000003, "r": 536.09589, "b": 271.81958, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 541.64685, "t": 262.60657000000003, "r": 547.19781, "b": 271.81958, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "1", "bbox": {"l": 541.64685, "t": 262.60657000000003, "r": 547.19781, "b": 271.81958, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 136.79808, "t": 274.60637999999994, "r": 150.88702, "b": 283.8194, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "1.1", "bbox": {"l": 136.79808, "t": 274.60637999999994, "r": 150.88702, "b": 283.8194, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 156.5226, "t": 274.60637999999994, "r": 549.84723, "b": 283.8194, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "Security fundamentals. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2", "bbox": {"l": 156.5226, "t": 274.60637999999994, "r": 549.84723, "b": 283.8194, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 136.79807, "t": 287.14606000000003, "r": 150.62746, "b": 296.35904, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "1.2", "bbox": {"l": 136.79807, "t": 287.14606000000003, "r": 150.62746, "b": 296.35904, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 156.15923, "t": 287.14606000000003, "r": 536.12933, "b": 296.35904, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "Current state of IBM i security . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.15923, "t": 287.14606000000003, "r": 536.12933, "b": 296.35904, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 541.66113, "t": 287.14606000000003, "r": 547.19287, "b": 296.35904, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "2", "bbox": {"l": 541.66113, "t": 287.14606000000003, "r": 547.19287, "b": 296.35904, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 136.79807, "t": 299.62595, "r": 150.84943, "b": 308.83893, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "1.3", "bbox": {"l": 136.79807, "t": 299.62595, "r": 150.84943, "b": 308.83893, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 156.46996, "t": 299.62595, "r": 549.84723, "b": 308.83893, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "DB2 for i security controls . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3", "bbox": {"l": 156.46996, "t": 299.62595, "r": 549.84723, "b": 308.83893, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 151.1972, "t": 312.1058300000001, "r": 173.38289, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "1.3.1", "bbox": {"l": 151.1972, "t": 312.1058300000001, "r": 173.38289, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 178.92932, "t": 312.1058300000001, "r": 536.05511, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "Existing row and column control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.92932, "t": 312.1058300000001, "r": 536.05511, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 541.6015, "t": 312.1058300000001, "r": 547.14795, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "4", "bbox": {"l": 541.6015, "t": 312.1058300000001, "r": 547.14795, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 151.1972, "t": 324.64548, "r": 173.4189, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "1.3.2", "bbox": {"l": 151.1972, "t": 324.64548, "r": 173.4189, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 178.97432, "t": 324.64548, "r": 536.08008, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "New controls: Row and Column Access Control. . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.97432, "t": 324.64548, "r": 536.08008, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 541.6355, "t": 324.64548, "r": 547.19092, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "5", "bbox": {"l": 541.6355, "t": 324.64548, "r": 547.19092, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 136.79704, "t": 347.14511, "r": 336.82071, "b": 356.35809, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "Chapter 2. Roles and separation of duties", "bbox": {"l": 136.79704, "t": 347.14511, "r": 336.82071, "b": 356.35809, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 338.99701, "t": 347.14511, "r": 536.09088, "b": 356.35809, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 338.99701, "t": 347.14511, "r": 536.09088, "b": 356.35809, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 541.64282, "t": 347.14511, "r": 547.19476, "b": 356.35809, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "7", "bbox": {"l": 541.64282, "t": 347.14511, "r": 547.19476, "b": 356.35809, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 136.79704, "t": 359.14493, "r": 150.644, "b": 368.35791, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "2.1", "bbox": {"l": 136.79704, "t": 359.14493, "r": 150.644, "b": 368.35791, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 156.18277, "t": 359.14493, "r": 536.12714, "b": 368.35791, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "Roles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.18277, "t": 359.14493, "r": 536.12714, "b": 368.35791, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 541.66589, "t": 359.14493, "r": 547.20471, "b": 368.35791, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "8", "bbox": {"l": 541.66589, "t": 359.14493, "r": 547.20471, "b": 368.35791, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 151.1972, "t": 371.62482, "r": 173.60995, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "2.1.1", "bbox": {"l": 151.1972, "t": 371.62482, "r": 173.60995, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 176.41154, "t": 371.62482, "r": 535.9527, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "DDM and DRDA application server access: QIBM_DB_DDMDRDA . . . . . . . . . . .", "bbox": {"l": 176.41154, "t": 371.62482, "r": 535.9527, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 541.55585, "t": 371.62482, "r": 547.15906, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "8", "bbox": {"l": 541.55585, "t": 371.62482, "r": 547.15906, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 151.1972, "t": 384.10470999999995, "r": 173.41664, "b": 393.31769, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "2.1.2", "bbox": {"l": 151.1972, "t": 384.10470999999995, "r": 173.41664, "b": 393.31769, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 178.97151, "t": 384.10470999999995, "r": 536.04108, "b": 393.31769, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "Toolbox application server access: QIBM_DB_ZDA. . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.97151, "t": 384.10470999999995, "r": 536.04108, "b": 393.31769, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 541.59595, "t": 384.10470999999995, "r": 547.15082, "b": 393.31769, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "8", "bbox": {"l": 541.59595, "t": 384.10470999999995, "r": 547.15082, "b": 393.31769, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 151.1972, "t": 396.64435, "r": 173.41859, "b": 405.85733, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "2.1.3", "bbox": {"l": 151.1972, "t": 396.64435, "r": 173.41859, "b": 405.85733, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 178.97394, "t": 396.64435, "r": 536.07489, "b": 405.85733, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "Database Administrator function: QIBM_DB_SQLADM . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.97394, "t": 396.64435, "r": 536.07489, "b": 405.85733, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 541.63025, "t": 396.64435, "r": 547.18561, "b": 405.85733, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "9", "bbox": {"l": 541.63025, "t": 396.64435, "r": 547.18561, "b": 405.85733, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 151.1972, "t": 409.12424000000004, "r": 173.38629, "b": 418.33722, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "2.1.4", "bbox": {"l": 151.1972, "t": 409.12424000000004, "r": 173.38629, "b": 418.33722, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 178.93356, "t": 409.12424000000004, "r": 411.27048, "b": 418.33722, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "Database Information function: QIBM_DB_SYSMON", "bbox": {"l": 178.93356, "t": 409.12424000000004, "r": 411.27048, "b": 418.33722, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 416.81775, "t": 409.12424000000004, "r": 536.08411, "b": 418.33722, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": ". . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 416.81775, "t": 409.12424000000004, "r": 536.08411, "b": 418.33722, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 541.63135, "t": 409.12424000000004, "r": 547.17865, "b": 418.33722, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "9", "bbox": {"l": 541.63135, "t": 409.12424000000004, "r": 547.17865, "b": 418.33722, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 151.1972, "t": 421.60413, "r": 173.44926, "b": 430.81711, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "2.1.5", "bbox": {"l": 151.1972, "t": 421.60413, "r": 173.44926, "b": 430.81711, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 179.01228, "t": 421.60413, "r": 536.03589, "b": 430.81711, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "Security Administrator function: QIBM_DB_SECADM . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 179.01228, "t": 421.60413, "r": 536.03589, "b": 430.81711, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 541.59894, "t": 421.60413, "r": 547.16193, "b": 430.81711, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "9", "bbox": {"l": 541.59894, "t": 421.60413, "r": 547.16193, "b": 430.81711, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 151.1972, "t": 434.1437700000001, "r": 173.32208, "b": 443.35675, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "2.1.6", "bbox": {"l": 151.1972, "t": 434.1437700000001, "r": 173.32208, "b": 443.35675, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 178.8533, "t": 434.1437700000001, "r": 530.57318, "b": 443.35675, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "Change Function Usage CL command . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.8533, "t": 434.1437700000001, "r": 530.57318, "b": 443.35675, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 536.10443, "t": 434.1437700000001, "r": 547.16687, "b": 443.35675, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "10", "bbox": {"l": 536.10443, "t": 434.1437700000001, "r": 547.16687, "b": 443.35675, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 151.1972, "t": 446.62366, "r": 173.35822, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "2.1.7", "bbox": {"l": 151.1972, "t": 446.62366, "r": 173.35822, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 178.89848, "t": 446.62366, "r": 530.53522, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "Verifying function usage IDs for RCAC with the FUNCTION_USAGE view . . . . .", "bbox": {"l": 178.89848, "t": 446.62366, "r": 530.53522, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 536.0755, "t": 446.62366, "r": 547.15601, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "10", "bbox": {"l": 536.0755, "t": 446.62366, "r": 547.15601, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 136.79704, "t": 459.10355, "r": 150.85457, "b": 468.31653, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "2.2", "bbox": {"l": 136.79704, "t": 459.10355, "r": 150.85457, "b": 468.31653, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 156.47758, "t": 459.10355, "r": 547.25659, "b": 468.31653, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "Separation of duties . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10", "bbox": {"l": 156.47758, "t": 459.10355, "r": 547.25659, "b": 468.31653, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 136.79703, "t": 481.60318, "r": 348.68503, "b": 490.81616, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "Chapter 3. Row and Column Access Control", "bbox": {"l": 136.79703, "t": 481.60318, "r": 348.68503, "b": 490.81616, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 350.09741, "t": 481.60318, "r": 530.53961, "b": 490.81616, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 350.09741, "t": 481.60318, "r": 530.53961, "b": 490.81616, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 536.09167, "t": 481.60318, "r": 547.1958, "b": 490.81616, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "13", "bbox": {"l": 536.09167, "t": 481.60318, "r": 547.1958, "b": 490.81616, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 136.79703, "t": 493.603, "r": 150.70105, "b": 502.81598, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "3.1", "bbox": {"l": 136.79703, "t": 493.603, "r": 150.70105, "b": 502.81598, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 156.26266, "t": 493.603, "r": 530.4809, "b": 502.81598, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "Explanation of RCAC and the concept of access control . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.26266, "t": 493.603, "r": 530.4809, "b": 502.81598, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 536.04248, "t": 493.603, "r": 547.16571, "b": 502.81598, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "14", "bbox": {"l": 536.04248, "t": 493.603, "r": 547.16571, "b": 502.81598, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 151.19719, "t": 506.14264, "r": 173.35429, "b": 515.35562, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "3.1.1", "bbox": {"l": 151.19719, "t": 506.14264, "r": 173.35429, "b": 515.35562, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 178.89357, "t": 506.14264, "r": 378.20786, "b": 515.35562, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "Row permission and column mask definitions", "bbox": {"l": 178.89357, "t": 506.14264, "r": 378.20786, "b": 515.35562, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 383.74713, "t": 506.14264, "r": 530.5379, "b": 515.35562, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 383.74713, "t": 506.14264, "r": 530.5379, "b": 515.35562, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 536.07721, "t": 506.14264, "r": 547.15576, "b": 515.35562, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "14", "bbox": {"l": 536.07721, "t": 506.14264, "r": 547.15576, "b": 515.35562, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 151.19719, "t": 518.62253, "r": 173.44292, "b": 527.83551, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "3.1.2", "bbox": {"l": 151.19719, "t": 518.62253, "r": 173.44292, "b": 527.83551, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 179.00435, "t": 518.62253, "r": 530.43475, "b": 527.83551, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "Enabling and activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 179.00435, "t": 518.62253, "r": 530.43475, "b": 527.83551, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 535.99622, "t": 518.62253, "r": 547.11908, "b": 527.83551, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "16", "bbox": {"l": 535.99622, "t": 518.62253, "r": 547.11908, "b": 527.83551, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 136.79703, "t": 531.1621700000001, "r": 150.64432, "b": 540.37517, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "3.2", "bbox": {"l": 136.79703, "t": 531.1621700000001, "r": 150.64432, "b": 540.37517, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 156.18323, "t": 531.1621700000001, "r": 530.52808, "b": 540.37517, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "Special registers and built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.18323, "t": 531.1621700000001, "r": 530.52808, "b": 540.37517, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 536.06702, "t": 531.1621700000001, "r": 547.14484, "b": 540.37517, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "18", "bbox": {"l": 536.06702, "t": 531.1621700000001, "r": 547.14484, "b": 540.37517, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 151.19719, "t": 543.64204, "r": 173.41321, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "3.2.1", "bbox": {"l": 151.19719, "t": 543.64204, "r": 173.41321, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 178.96722, "t": 543.64204, "r": 530.49786, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "Special registers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.96722, "t": 543.64204, "r": 530.49786, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 536.05188, "t": 543.64204, "r": 547.15991, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "18", "bbox": {"l": 536.05188, "t": 543.64204, "r": 547.15991, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 151.19719, "t": 556.12192, "r": 173.35269, "b": 565.33492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "3.2.2", "bbox": {"l": 151.19719, "t": 556.12192, "r": 173.35269, "b": 565.33492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 178.89156, "t": 556.12192, "r": 530.56024, "b": 565.33492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "Built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.89156, "t": 556.12192, "r": 530.56024, "b": 565.33492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 536.09912, "t": 556.12192, "r": 547.17688, "b": 565.33492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "19", "bbox": {"l": 536.09912, "t": 556.12192, "r": 547.17688, "b": 565.33492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 136.79703, "t": 568.66156, "r": 150.62514, "b": 577.87456, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "3.3", "bbox": {"l": 136.79703, "t": 568.66156, "r": 150.62514, "b": 577.87456, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 156.15639, "t": 568.66156, "r": 530.53027, "b": 577.87456, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "VERIFY_GROUP_FOR_USER function . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.15639, "t": 568.66156, "r": 530.53027, "b": 577.87456, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 536.06152, "t": 568.66156, "r": 547.12402, "b": 577.87456, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "20", "bbox": {"l": 536.06152, "t": 568.66156, "r": 547.12402, "b": 577.87456, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 136.79703, "t": 581.14143, "r": 150.63004, "b": 590.35443, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "3.4", "bbox": {"l": 136.79703, "t": 581.14143, "r": 150.63004, "b": 590.35443, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 156.16325, "t": 581.14143, "r": 530.62994, "b": 590.35443, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "Establishing and controlling accessibility by using the RCAC rule text . . . . . . . . . . . . .", "bbox": {"l": 156.16325, "t": 581.14143, "r": 530.62994, "b": 590.35443, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 536.16315, "t": 581.14143, "r": 547.22955, "b": 590.35443, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "21", "bbox": {"l": 536.16315, "t": 581.14143, "r": 547.22955, "b": 590.35443, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 136.79701, "t": 593.62131, "r": 150.64413, "b": 602.8343, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "3.5", "bbox": {"l": 136.79701, "t": 593.62131, "r": 150.64413, "b": 602.8343, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 156.18298, "t": 593.62131, "r": 394.7818, "b": 602.8343, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "SELECT, INSERT, and UPDATE behavior with RCAC", "bbox": {"l": 156.18298, "t": 593.62131, "r": 394.7818, "b": 602.8343, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 400.32065, "t": 593.62131, "r": 530.48358, "b": 602.8343, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": ". . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 400.32065, "t": 593.62131, "r": 530.48358, "b": 602.8343, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 536.0224, "t": 593.62131, "r": 547.1001, "b": 602.8343, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "22", "bbox": {"l": 536.0224, "t": 593.62131, "r": 547.1001, "b": 602.8343, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 136.79701, "t": 606.16095, "r": 150.6642, "b": 615.37395, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "3.6", "bbox": {"l": 136.79701, "t": 606.16095, "r": 150.6642, "b": 615.37395, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 156.21107, "t": 606.16095, "r": 530.56512, "b": 615.37395, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "Human resources example . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.21107, "t": 606.16095, "r": 530.56512, "b": 615.37395, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 536.112, "t": 606.16095, "r": 547.20575, "b": 615.37395, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "22", "bbox": {"l": 536.112, "t": 606.16095, "r": 547.20575, "b": 615.37395, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 151.19717, "t": 618.64082, "r": 173.41692, "b": 627.85382, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "3.6.1", "bbox": {"l": 151.19717, "t": 618.64082, "r": 173.41692, "b": 627.85382, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 178.97185, "t": 618.64082, "r": 530.49139, "b": 627.85382, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": "Assigning the QIBM_DB_SECADM function ID to the consultants. . . . . . . . . . . .", "bbox": {"l": 178.97185, "t": 618.64082, "r": 530.49139, "b": 627.85382, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 536.04633, "t": 618.64082, "r": 547.15619, "b": 627.85382, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "23", "bbox": {"l": 536.04633, "t": 618.64082, "r": 547.15619, "b": 627.85382, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 151.19717, "t": 631.1206999999999, "r": 173.32271, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "3.6.2", "bbox": {"l": 151.19717, "t": 631.1206999999999, "r": 173.32271, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 178.8541, "t": 631.1206999999999, "r": 530.56458, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": "Creating group profiles for the users and their roles . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.8541, "t": 631.1206999999999, "r": 530.56458, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 536.09601, "t": 631.1206999999999, "r": 547.15875, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 107, "text": "23", "bbox": {"l": 536.09601, "t": 631.1206999999999, "r": 547.15875, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 151.19717, "t": 643.66034, "r": 173.32227, "b": 652.87334, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 108, "text": "3.6.3", "bbox": {"l": 151.19717, "t": 643.66034, "r": 173.32227, "b": 652.87334, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 178.85353, "t": 643.66034, "r": 530.55695, "b": 652.87334, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 109, "text": "Demonstrating data access without RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.85353, "t": 643.66034, "r": 530.55695, "b": 652.87334, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 536.0882, "t": 643.66034, "r": 547.15076, "b": 652.87334, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 110, "text": "24", "bbox": {"l": 536.0882, "t": 643.66034, "r": 547.15076, "b": 652.87334, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 151.19717, "t": 656.14021, "r": 173.35289, "b": 665.35321, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 111, "text": "3.6.4", "bbox": {"l": 151.19717, "t": 656.14021, "r": 173.35289, "b": 665.35321, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 178.89182, "t": 656.14021, "r": 530.53412, "b": 665.35321, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 112, "text": "Defining and creating row permissions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.89182, "t": 656.14021, "r": 530.53412, "b": 665.35321, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 114, "label": "text", "bbox": {"l": 536.073, "t": 656.14021, "r": 547.15088, "b": 665.35321, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 113, "text": "25", "bbox": {"l": 536.073, "t": 656.14021, "r": 547.15088, "b": 665.35321, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 115, "label": "text", "bbox": {"l": 151.19717, "t": 668.62009, "r": 173.35289, "b": 677.83309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 114, "text": "3.6.5", "bbox": {"l": 151.19717, "t": 668.62009, "r": 173.35289, "b": 677.83309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 116, "label": "text", "bbox": {"l": 178.89182, "t": 668.62009, "r": 339.45105, "b": 677.83309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 115, "text": "Defining and creating column masks", "bbox": {"l": 178.89182, "t": 668.62009, "r": 339.45105, "b": 677.83309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 117, "label": "text", "bbox": {"l": 344.98996, "t": 668.62009, "r": 530.54413, "b": 677.83309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 116, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 344.98996, "t": 668.62009, "r": 530.54413, "b": 677.83309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 118, "label": "text", "bbox": {"l": 536.08301, "t": 668.62009, "r": 547.16089, "b": 677.83309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 117, "text": "26", "bbox": {"l": 536.08301, "t": 668.62009, "r": 547.16089, "b": 677.83309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 119, "label": "text", "bbox": {"l": 151.19717, "t": 681.15973, "r": 173.38359, "b": 690.37273, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 118, "text": "3.6.6", "bbox": {"l": 151.19717, "t": 681.15973, "r": 173.38359, "b": 690.37273, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 120, "label": "text", "bbox": {"l": 178.93019, "t": 681.15973, "r": 530.54102, "b": 690.37273, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 119, "text": "Activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.93019, "t": 681.15973, "r": 530.54102, "b": 690.37273, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 121, "label": "text", "bbox": {"l": 536.08765, "t": 681.15973, "r": 547.18085, "b": 690.37273, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 120, "text": "28", "bbox": {"l": 536.08765, "t": 681.15973, "r": 547.18085, "b": 690.37273, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 122, "label": "text", "bbox": {"l": 151.19717, "t": 693.63961, "r": 173.32332, "b": 702.852615, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 121, "text": "3.6.7", "bbox": {"l": 151.19717, "t": 693.63961, "r": 173.32332, "b": 702.852615, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 123, "label": "text", "bbox": {"l": 178.85486, "t": 693.63961, "r": 350.80011, "b": 702.852615, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 122, "text": "Demonstrating data access with RCAC", "bbox": {"l": 178.85486, "t": 693.63961, "r": 350.80011, "b": 702.852615, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 124, "label": "text", "bbox": {"l": 356.33163, "t": 693.63961, "r": 530.57507, "b": 702.852615, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 123, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 356.33163, "t": 693.63961, "r": 530.57507, "b": 702.852615, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 125, "label": "text", "bbox": {"l": 536.10663, "t": 693.63961, "r": 547.16968, "b": 702.852615, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 124, "text": "29", "bbox": {"l": 536.10663, "t": 693.63961, "r": 547.16968, "b": 702.852615, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 126, "label": "text", "bbox": {"l": 151.19717, "t": 706.119492, "r": 173.44592, "b": 715.332497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 125, "text": "3.6.8", "bbox": {"l": 151.19717, "t": 706.119492, "r": 173.44592, "b": 715.332497, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 127, "label": "text", "bbox": {"l": 179.00812, "t": 706.119492, "r": 530.43628, "b": 715.332497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 126, "text": "Demonstrating data access with a view and RCAC . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 179.00812, "t": 706.119492, "r": 530.43628, "b": 715.332497, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 128, "label": "text", "bbox": {"l": 535.99847, "t": 706.119492, "r": 547.12286, "b": 715.332497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 127, "text": "32", "bbox": {"l": 535.99847, "t": 706.119492, "r": 547.12286, "b": 715.332497, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 43, "num_cols": 2, "table_cells": [{"bbox": {"l": 136.8, "t": 132.64862000000005, "r": 172.89404, "b": 141.86163, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Notices", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 175.01952, "t": 132.64862000000005, "r": 547.18982, "b": 141.86163, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vii", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79901, "t": 145.12847999999997, "r": 189.86537, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Trademarks", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 195.39685, "t": 145.12847999999997, "r": 547.18286, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . viii", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79901, "t": 167.62811, "r": 279.39731, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "DB2 for i Center of Excellence", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.61942, "t": 167.62811, "r": 547.1908, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ix", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79901, "t": 190.12775, "r": 172.84424, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Preface", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 175.01852, "t": 190.12775, "r": 547.18286, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79803, "t": 202.60760000000005, "r": 547.18085, "b": 211.82061999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Authors . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79803, "t": 215.14721999999995, "r": 339.18292, "b": 224.36023, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Now you can become a published author, too!", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 344.71411, "t": 215.14721999999995, "r": 547.13879, "b": 224.36023, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xiii", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79803, "t": 227.62707999999998, "r": 529.99506, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Comments welcome. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 535.5495, "t": 227.62707999999998, "r": 547.19788, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "xiii", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79807, "t": 240.10693000000003, "r": 284.02866, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Stay connected to IBM Redbooks", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.54449, "t": 240.10693000000003, "r": 547.12115, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xiv", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79807, "t": 262.60657000000003, "r": 536.09589, "b": 271.81958, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Chapter 1. Securing and protecting IBM DB2 data  . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.64685, "t": 262.60657000000003, "r": 547.19781, "b": 271.81958, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79808, "t": 274.60637999999994, "r": 549.84723, "b": 283.8194, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "1.1 Security fundamentals. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79807, "t": 287.14606000000003, "r": 536.12933, "b": 296.35904, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "1.2 Current state of IBM i security . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.66113, "t": 287.14606000000003, "r": 547.19287, "b": 296.35904, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79807, "t": 299.62595, "r": 549.84723, "b": 308.83893, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "1.3 DB2 for i security controls . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 312.1058300000001, "r": 536.05511, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "1.3.1 Existing row and column control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.6015, "t": 312.1058300000001, "r": 547.14795, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 324.64548, "r": 536.08008, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "1.3.2 New controls: Row and Column Access Control. . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.6355, "t": 324.64548, "r": 547.19092, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79704, "t": 347.14511, "r": 536.09088, "b": 356.35809, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 14, "end_row_offset_idx": 15, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Chapter 2. Roles and separation of duties . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.64282, "t": 347.14511, "r": 547.19476, "b": 356.35809, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 14, "end_row_offset_idx": 15, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79704, "t": 359.14493, "r": 536.12714, "b": 368.35791, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 15, "end_row_offset_idx": 16, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1 Roles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.66589, "t": 359.14493, "r": 547.20471, "b": 368.35791, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 15, "end_row_offset_idx": 16, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 371.62482, "r": 535.9527, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 16, "end_row_offset_idx": 17, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.1 DDM and DRDA application server access: QIBM_DB_DDMDRDA . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.55585, "t": 371.62482, "r": 547.15906, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 16, "end_row_offset_idx": 17, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 384.10470999999995, "r": 536.04108, "b": 393.31769, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 17, "end_row_offset_idx": 18, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.2 Toolbox application server access: QIBM_DB_ZDA. . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.59595, "t": 384.10470999999995, "r": 547.15082, "b": 393.31769, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 17, "end_row_offset_idx": 18, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 396.64435, "r": 536.07489, "b": 405.85733, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 18, "end_row_offset_idx": 19, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.3 Database Administrator function: QIBM_DB_SQLADM . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.63025, "t": 396.64435, "r": 547.18561, "b": 405.85733, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 18, "end_row_offset_idx": 19, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 409.12424000000004, "r": 411.27048, "b": 418.33722, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 19, "end_row_offset_idx": 20, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.4 Database Information function: QIBM_DB_SYSMON", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 416.81775, "t": 409.12424000000004, "r": 547.17865, "b": 418.33722, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 19, "end_row_offset_idx": 20, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . 9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 421.60413, "r": 536.03589, "b": 430.81711, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 20, "end_row_offset_idx": 21, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.5 Security Administrator function: QIBM_DB_SECADM . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.59894, "t": 421.60413, "r": 547.16193, "b": 430.81711, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 20, "end_row_offset_idx": 21, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 434.1437700000001, "r": 530.57318, "b": 443.35675, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 21, "end_row_offset_idx": 22, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.6 Change Function Usage CL command . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.10443, "t": 434.1437700000001, "r": 547.16687, "b": 443.35675, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 21, "end_row_offset_idx": 22, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "10", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 446.62366, "r": 530.53522, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 22, "end_row_offset_idx": 23, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.7 Verifying function usage IDs for RCAC with the FUNCTION_USAGE view . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.0755, "t": 446.62366, "r": 547.15601, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 22, "end_row_offset_idx": 23, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "10", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79704, "t": 459.10355, "r": 547.25659, "b": 468.31653, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 23, "end_row_offset_idx": 24, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.2 Separation of duties . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79703, "t": 481.60318, "r": 530.53961, "b": 490.81616, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 24, "end_row_offset_idx": 25, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Chapter 3. Row and Column Access Control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.09167, "t": 481.60318, "r": 547.1958, "b": 490.81616, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 24, "end_row_offset_idx": 25, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "13", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79703, "t": 493.603, "r": 530.4809, "b": 502.81598, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 25, "end_row_offset_idx": 26, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.1 Explanation of RCAC and the concept of access control . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.04248, "t": 493.603, "r": 547.16571, "b": 502.81598, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 25, "end_row_offset_idx": 26, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "14", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19719, "t": 506.14264, "r": 378.20786, "b": 515.35562, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 26, "end_row_offset_idx": 27, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.1.1 Row permission and column mask definitions", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 383.74713, "t": 506.14264, "r": 547.15576, "b": 515.35562, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 26, "end_row_offset_idx": 27, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . 14", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19719, "t": 518.62253, "r": 530.43475, "b": 527.83551, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 27, "end_row_offset_idx": 28, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.1.2 Enabling and activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 535.99622, "t": 518.62253, "r": 547.11908, "b": 527.83551, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 27, "end_row_offset_idx": 28, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "16", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79703, "t": 531.1621700000001, "r": 530.52808, "b": 540.37517, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 28, "end_row_offset_idx": 29, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.2 Special registers and built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.06702, "t": 531.1621700000001, "r": 547.14484, "b": 540.37517, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 28, "end_row_offset_idx": 29, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "18", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19719, "t": 543.64204, "r": 530.49786, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 29, "end_row_offset_idx": 30, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.2.1 Special registers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.05188, "t": 543.64204, "r": 547.15991, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 29, "end_row_offset_idx": 30, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "18", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19719, "t": 556.12192, "r": 530.56024, "b": 565.33492, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 30, "end_row_offset_idx": 31, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.2.2 Built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.09912, "t": 556.12192, "r": 547.17688, "b": 565.33492, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 30, "end_row_offset_idx": 31, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "19", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79703, "t": 568.66156, "r": 530.53027, "b": 577.87456, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 31, "end_row_offset_idx": 32, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.3 VERIFY_GROUP_FOR_USER function . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.06152, "t": 568.66156, "r": 547.12402, "b": 577.87456, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 31, "end_row_offset_idx": 32, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "20", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79703, "t": 581.14143, "r": 530.62994, "b": 590.35443, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 32, "end_row_offset_idx": 33, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.4 Establishing and controlling accessibility by using the RCAC rule text . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.16315, "t": 581.14143, "r": 547.22955, "b": 590.35443, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 32, "end_row_offset_idx": 33, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "21", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79701, "t": 593.62131, "r": 530.56512, "b": 615.37395, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 34, "end_row_offset_idx": 35, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.5 SELECT, INSERT, and UPDATE behavior with RCAC 3.6 Human resources example . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 400.32065, "t": 593.62131, "r": 530.48358, "b": 602.8343, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 33, "end_row_offset_idx": 34, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": ". . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.0224, "t": 593.62131, "r": 547.1001, "b": 602.8343, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 33, "end_row_offset_idx": 34, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "22", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.112, "t": 606.16095, "r": 547.20575, "b": 615.37395, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 34, "end_row_offset_idx": 35, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "22", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717, "t": 618.64082, "r": 530.49139, "b": 627.85382, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 35, "end_row_offset_idx": 36, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.1 Assigning the QIBM_DB_SECADM function ID to the consultants. . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.04633, "t": 618.64082, "r": 547.15619, "b": 627.85382, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 35, "end_row_offset_idx": 36, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "23", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717, "t": 631.1206999999999, "r": 530.56458, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 36, "end_row_offset_idx": 37, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.2 Creating group profiles for the users and their roles . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.09601, "t": 631.1206999999999, "r": 547.15875, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 36, "end_row_offset_idx": 37, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "23", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717, "t": 643.66034, "r": 530.55695, "b": 652.87334, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 37, "end_row_offset_idx": 38, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.3 Demonstrating data access without RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.0882, "t": 643.66034, "r": 547.15076, "b": 652.87334, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 37, "end_row_offset_idx": 38, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "24", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717, "t": 656.14021, "r": 530.53412, "b": 665.35321, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 38, "end_row_offset_idx": 39, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.4 Defining and creating row permissions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.073, "t": 656.14021, "r": 547.15088, "b": 665.35321, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 38, "end_row_offset_idx": 39, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "25", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717, "t": 668.62009, "r": 339.45105, "b": 677.83309, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 39, "end_row_offset_idx": 40, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.5 Defining and creating column masks", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 344.98996, "t": 668.62009, "r": 547.16089, "b": 677.83309, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 39, "end_row_offset_idx": 40, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717, "t": 681.15973, "r": 530.54102, "b": 690.37273, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 40, "end_row_offset_idx": 41, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.6 Activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.08765, "t": 681.15973, "r": 547.18085, "b": 690.37273, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 40, "end_row_offset_idx": 41, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "28", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717, "t": 693.63961, "r": 530.57507, "b": 702.852615, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 41, "end_row_offset_idx": 42, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.7 Demonstrating data access with RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.10663, "t": 693.63961, "r": 547.16968, "b": 702.852615, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 41, "end_row_offset_idx": 42, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "29", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717, "t": 706.119492, "r": 530.43628, "b": 715.332497, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 42, "end_row_offset_idx": 43, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.8 Demonstrating data access with a view and RCAC . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 535.99847, "t": 706.119492, "r": 547.12286, "b": 715.332497, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 42, "end_row_offset_idx": 43, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "32", "column_header": false, "row_header": false, "row_section": false}]}], "body": [{"label": "section_header", "id": 1, "page_no": 1, "cluster": {"id": 1, "label": "section_header", "bbox": {"l": 64.800003, "t": 73.84802000000002, "r": 168.73441, "b": 96.04803000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9509142637252808, "cells": [{"id": 2, "text": "Contents", "bbox": {"l": 64.800003, "t": 73.84802000000002, "r": 168.73441, "b": 96.04803000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Contents"}, {"label": "document_index", "id": 0, "page_no": 1, "cluster": {"id": 0, "label": "document_index", "bbox": {"l": 136.1496124267578, "t": 132.0330352783203, "r": 547.5267944335938, "b": 715.6515502929688, "coord_origin": "TOPLEFT"}, "confidence": 0.9803681373596191, "cells": [{"id": 3, "text": "Notices", "bbox": {"l": 136.8, "t": 132.64862000000005, "r": 172.89404, "b": 141.86163, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vii", "bbox": {"l": 175.01952, "t": 132.64862000000005, "r": 547.18982, "b": 141.86163, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Trademarks", "bbox": {"l": 136.79901, "t": 145.12847999999997, "r": 189.86537, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 195.39685, "t": 145.12847999999997, "r": 530.05121, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "viii", "bbox": {"l": 535.5827, "t": 145.12847999999997, "r": 547.18286, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "DB2 for i Center of Excellence", "bbox": {"l": 136.79901, "t": 167.62811, "r": 279.39731, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ix", "bbox": {"l": 280.61942, "t": 167.62811, "r": 547.1908, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Preface", "bbox": {"l": 136.79901, "t": 190.12775, "r": 172.84424, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi", "bbox": {"l": 175.01852, "t": 190.12775, "r": 547.18286, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Authors . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi", "bbox": {"l": 136.79803, "t": 202.60760000000005, "r": 547.18085, "b": 211.82061999999996, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Now you can become a published author, too!", "bbox": {"l": 136.79803, "t": 215.14721999999995, "r": 339.18292, "b": 224.36023, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 344.71411, "t": 215.14721999999995, "r": 530.00812, "b": 224.36023, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "xiii", "bbox": {"l": 535.53925, "t": 215.14721999999995, "r": 547.13879, "b": 224.36023, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Comments welcome. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 136.79803, "t": 227.62707999999998, "r": 529.99506, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "xiii", "bbox": {"l": 535.5495, "t": 227.62707999999998, "r": 547.19788, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Stay connected to IBM Redbooks", "bbox": {"l": 136.79807, "t": 240.10693000000003, "r": 284.02866, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 289.54449, "t": 240.10693000000003, "r": 529.48242, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "xiv", "bbox": {"l": 534.99829, "t": 240.10693000000003, "r": 547.12115, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Chapter 1. Securing and protecting IBM DB2 data", "bbox": {"l": 136.79807, "t": 262.60657000000003, "r": 373.17566, "b": 271.81958, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 375.11798, "t": 262.60657000000003, "r": 536.09589, "b": 271.81958, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "1", "bbox": {"l": 541.64685, "t": 262.60657000000003, "r": 547.19781, "b": 271.81958, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "1.1", "bbox": {"l": 136.79808, "t": 274.60637999999994, "r": 150.88702, "b": 283.8194, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "Security fundamentals. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2", "bbox": {"l": 156.5226, "t": 274.60637999999994, "r": 549.84723, "b": 283.8194, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "1.2", "bbox": {"l": 136.79807, "t": 287.14606000000003, "r": 150.62746, "b": 296.35904, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Current state of IBM i security . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.15923, "t": 287.14606000000003, "r": 536.12933, "b": 296.35904, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "2", "bbox": {"l": 541.66113, "t": 287.14606000000003, "r": 547.19287, "b": 296.35904, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "1.3", "bbox": {"l": 136.79807, "t": 299.62595, "r": 150.84943, "b": 308.83893, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "DB2 for i security controls . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3", "bbox": {"l": 156.46996, "t": 299.62595, "r": 549.84723, "b": 308.83893, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "1.3.1", "bbox": {"l": 151.1972, "t": 312.1058300000001, "r": 173.38289, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Existing row and column control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.92932, "t": 312.1058300000001, "r": 536.05511, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "4", "bbox": {"l": 541.6015, "t": 312.1058300000001, "r": 547.14795, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "1.3.2", "bbox": {"l": 151.1972, "t": 324.64548, "r": 173.4189, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "New controls: Row and Column Access Control. . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.97432, "t": 324.64548, "r": 536.08008, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "5", "bbox": {"l": 541.6355, "t": 324.64548, "r": 547.19092, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "Chapter 2. Roles and separation of duties", "bbox": {"l": 136.79704, "t": 347.14511, "r": 336.82071, "b": 356.35809, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 338.99701, "t": 347.14511, "r": 536.09088, "b": 356.35809, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "7", "bbox": {"l": 541.64282, "t": 347.14511, "r": 547.19476, "b": 356.35809, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "2.1", "bbox": {"l": 136.79704, "t": 359.14493, "r": 150.644, "b": 368.35791, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Roles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.18277, "t": 359.14493, "r": 536.12714, "b": 368.35791, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "8", "bbox": {"l": 541.66589, "t": 359.14493, "r": 547.20471, "b": 368.35791, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "2.1.1", "bbox": {"l": 151.1972, "t": 371.62482, "r": 173.60995, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "DDM and DRDA application server access: QIBM_DB_DDMDRDA . . . . . . . . . . .", "bbox": {"l": 176.41154, "t": 371.62482, "r": 535.9527, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "8", "bbox": {"l": 541.55585, "t": 371.62482, "r": 547.15906, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "2.1.2", "bbox": {"l": 151.1972, "t": 384.10470999999995, "r": 173.41664, "b": 393.31769, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "Toolbox application server access: QIBM_DB_ZDA. . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.97151, "t": 384.10470999999995, "r": 536.04108, "b": 393.31769, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "8", "bbox": {"l": 541.59595, "t": 384.10470999999995, "r": 547.15082, "b": 393.31769, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "2.1.3", "bbox": {"l": 151.1972, "t": 396.64435, "r": 173.41859, "b": 405.85733, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Database Administrator function: QIBM_DB_SQLADM . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.97394, "t": 396.64435, "r": 536.07489, "b": 405.85733, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "9", "bbox": {"l": 541.63025, "t": 396.64435, "r": 547.18561, "b": 405.85733, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "2.1.4", "bbox": {"l": 151.1972, "t": 409.12424000000004, "r": 173.38629, "b": 418.33722, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Database Information function: QIBM_DB_SYSMON", "bbox": {"l": 178.93356, "t": 409.12424000000004, "r": 411.27048, "b": 418.33722, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": ". . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 416.81775, "t": 409.12424000000004, "r": 536.08411, "b": 418.33722, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "9", "bbox": {"l": 541.63135, "t": 409.12424000000004, "r": 547.17865, "b": 418.33722, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "2.1.5", "bbox": {"l": 151.1972, "t": 421.60413, "r": 173.44926, "b": 430.81711, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Security Administrator function: QIBM_DB_SECADM . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 179.01228, "t": 421.60413, "r": 536.03589, "b": 430.81711, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "9", "bbox": {"l": 541.59894, "t": 421.60413, "r": 547.16193, "b": 430.81711, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "2.1.6", "bbox": {"l": 151.1972, "t": 434.1437700000001, "r": 173.32208, "b": 443.35675, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Change Function Usage CL command . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.8533, "t": 434.1437700000001, "r": 530.57318, "b": 443.35675, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "10", "bbox": {"l": 536.10443, "t": 434.1437700000001, "r": 547.16687, "b": 443.35675, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "2.1.7", "bbox": {"l": 151.1972, "t": 446.62366, "r": 173.35822, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "Verifying function usage IDs for RCAC with the FUNCTION_USAGE view . . . . .", "bbox": {"l": 178.89848, "t": 446.62366, "r": 530.53522, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "10", "bbox": {"l": 536.0755, "t": 446.62366, "r": 547.15601, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "2.2", "bbox": {"l": 136.79704, "t": 459.10355, "r": 150.85457, "b": 468.31653, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "Separation of duties . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10", "bbox": {"l": 156.47758, "t": 459.10355, "r": 547.25659, "b": 468.31653, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "Chapter 3. Row and Column Access Control", "bbox": {"l": 136.79703, "t": 481.60318, "r": 348.68503, "b": 490.81616, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 350.09741, "t": 481.60318, "r": 530.53961, "b": 490.81616, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "13", "bbox": {"l": 536.09167, "t": 481.60318, "r": 547.1958, "b": 490.81616, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "3.1", "bbox": {"l": 136.79703, "t": 493.603, "r": 150.70105, "b": 502.81598, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Explanation of RCAC and the concept of access control . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.26266, "t": 493.603, "r": 530.4809, "b": 502.81598, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "14", "bbox": {"l": 536.04248, "t": 493.603, "r": 547.16571, "b": 502.81598, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "3.1.1", "bbox": {"l": 151.19719, "t": 506.14264, "r": 173.35429, "b": 515.35562, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "Row permission and column mask definitions", "bbox": {"l": 178.89357, "t": 506.14264, "r": 378.20786, "b": 515.35562, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 383.74713, "t": 506.14264, "r": 530.5379, "b": 515.35562, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "14", "bbox": {"l": 536.07721, "t": 506.14264, "r": 547.15576, "b": 515.35562, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "3.1.2", "bbox": {"l": 151.19719, "t": 518.62253, "r": 173.44292, "b": 527.83551, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "Enabling and activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 179.00435, "t": 518.62253, "r": 530.43475, "b": 527.83551, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "16", "bbox": {"l": 535.99622, "t": 518.62253, "r": 547.11908, "b": 527.83551, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "3.2", "bbox": {"l": 136.79703, "t": 531.1621700000001, "r": 150.64432, "b": 540.37517, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Special registers and built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.18323, "t": 531.1621700000001, "r": 530.52808, "b": 540.37517, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "18", "bbox": {"l": 536.06702, "t": 531.1621700000001, "r": 547.14484, "b": 540.37517, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "3.2.1", "bbox": {"l": 151.19719, "t": 543.64204, "r": 173.41321, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "Special registers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.96722, "t": 543.64204, "r": 530.49786, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "18", "bbox": {"l": 536.05188, "t": 543.64204, "r": 547.15991, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "3.2.2", "bbox": {"l": 151.19719, "t": 556.12192, "r": 173.35269, "b": 565.33492, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.89156, "t": 556.12192, "r": 530.56024, "b": 565.33492, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "19", "bbox": {"l": 536.09912, "t": 556.12192, "r": 547.17688, "b": 565.33492, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "3.3", "bbox": {"l": 136.79703, "t": 568.66156, "r": 150.62514, "b": 577.87456, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "VERIFY_GROUP_FOR_USER function . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.15639, "t": 568.66156, "r": 530.53027, "b": 577.87456, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "20", "bbox": {"l": 536.06152, "t": 568.66156, "r": 547.12402, "b": 577.87456, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "3.4", "bbox": {"l": 136.79703, "t": 581.14143, "r": 150.63004, "b": 590.35443, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "Establishing and controlling accessibility by using the RCAC rule text . . . . . . . . . . . . .", "bbox": {"l": 156.16325, "t": 581.14143, "r": 530.62994, "b": 590.35443, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "21", "bbox": {"l": 536.16315, "t": 581.14143, "r": 547.22955, "b": 590.35443, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "3.5", "bbox": {"l": 136.79701, "t": 593.62131, "r": 150.64413, "b": 602.8343, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "SELECT, INSERT, and UPDATE behavior with RCAC", "bbox": {"l": 156.18298, "t": 593.62131, "r": 394.7818, "b": 602.8343, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": ". . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 400.32065, "t": 593.62131, "r": 530.48358, "b": 602.8343, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "22", "bbox": {"l": 536.0224, "t": 593.62131, "r": 547.1001, "b": 602.8343, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "3.6", "bbox": {"l": 136.79701, "t": 606.16095, "r": 150.6642, "b": 615.37395, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "Human resources example . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.21107, "t": 606.16095, "r": 530.56512, "b": 615.37395, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "22", "bbox": {"l": 536.112, "t": 606.16095, "r": 547.20575, "b": 615.37395, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "3.6.1", "bbox": {"l": 151.19717, "t": 618.64082, "r": 173.41692, "b": 627.85382, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "Assigning the QIBM_DB_SECADM function ID to the consultants. . . . . . . . . . . .", "bbox": {"l": 178.97185, "t": 618.64082, "r": 530.49139, "b": 627.85382, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "23", "bbox": {"l": 536.04633, "t": 618.64082, "r": 547.15619, "b": 627.85382, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "3.6.2", "bbox": {"l": 151.19717, "t": 631.1206999999999, "r": 173.32271, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "Creating group profiles for the users and their roles . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.8541, "t": 631.1206999999999, "r": 530.56458, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "23", "bbox": {"l": 536.09601, "t": 631.1206999999999, "r": 547.15875, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "3.6.3", "bbox": {"l": 151.19717, "t": 643.66034, "r": 173.32227, "b": 652.87334, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "Demonstrating data access without RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.85353, "t": 643.66034, "r": 530.55695, "b": 652.87334, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "24", "bbox": {"l": 536.0882, "t": 643.66034, "r": 547.15076, "b": 652.87334, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "3.6.4", "bbox": {"l": 151.19717, "t": 656.14021, "r": 173.35289, "b": 665.35321, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "Defining and creating row permissions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.89182, "t": 656.14021, "r": 530.53412, "b": 665.35321, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "25", "bbox": {"l": 536.073, "t": 656.14021, "r": 547.15088, "b": 665.35321, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "3.6.5", "bbox": {"l": 151.19717, "t": 668.62009, "r": 173.35289, "b": 677.83309, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "Defining and creating column masks", "bbox": {"l": 178.89182, "t": 668.62009, "r": 339.45105, "b": 677.83309, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 344.98996, "t": 668.62009, "r": 530.54413, "b": 677.83309, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "26", "bbox": {"l": 536.08301, "t": 668.62009, "r": 547.16089, "b": 677.83309, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "3.6.6", "bbox": {"l": 151.19717, "t": 681.15973, "r": 173.38359, "b": 690.37273, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "Activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.93019, "t": 681.15973, "r": 530.54102, "b": 690.37273, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "28", "bbox": {"l": 536.08765, "t": 681.15973, "r": 547.18085, "b": 690.37273, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "3.6.7", "bbox": {"l": 151.19717, "t": 693.63961, "r": 173.32332, "b": 702.852615, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Demonstrating data access with RCAC", "bbox": {"l": 178.85486, "t": 693.63961, "r": 350.80011, "b": 702.852615, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 356.33163, "t": 693.63961, "r": 530.57507, "b": 702.852615, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "29", "bbox": {"l": 536.10663, "t": 693.63961, "r": 547.16968, "b": 702.852615, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "3.6.8", "bbox": {"l": 151.19717, "t": 706.119492, "r": 173.44592, "b": 715.332497, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "Demonstrating data access with a view and RCAC . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 179.00812, "t": 706.119492, "r": 530.43628, "b": 715.332497, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "32", "bbox": {"l": 535.99847, "t": 706.119492, "r": 547.12286, "b": 715.332497, "coord_origin": "TOPLEFT"}}], "children": [{"id": 4, "label": "text", "bbox": {"l": 136.8, "t": 132.64862000000005, "r": 172.89404, "b": 141.86163, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 3, "text": "Notices", "bbox": {"l": 136.8, "t": 132.64862000000005, "r": 172.89404, "b": 141.86163, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "text", "bbox": {"l": 175.01952, "t": 132.64862000000005, "r": 547.18982, "b": 141.86163, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 4, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vii", "bbox": {"l": 175.01952, "t": 132.64862000000005, "r": 547.18982, "b": 141.86163, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "text", "bbox": {"l": 136.79901, "t": 145.12847999999997, "r": 189.86537, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 5, "text": "Trademarks", "bbox": {"l": 136.79901, "t": 145.12847999999997, "r": 189.86537, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "text", "bbox": {"l": 195.39685, "t": 145.12847999999997, "r": 530.05121, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 195.39685, "t": 145.12847999999997, "r": 530.05121, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "text", "bbox": {"l": 535.5827, "t": 145.12847999999997, "r": 547.18286, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "viii", "bbox": {"l": 535.5827, "t": 145.12847999999997, "r": 547.18286, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 136.79901, "t": 167.62811, "r": 279.39731, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "DB2 for i Center of Excellence", "bbox": {"l": 136.79901, "t": 167.62811, "r": 279.39731, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "text", "bbox": {"l": 280.61942, "t": 167.62811, "r": 547.1908, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ix", "bbox": {"l": 280.61942, "t": 167.62811, "r": 547.1908, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 136.79901, "t": 190.12775, "r": 172.84424, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "Preface", "bbox": {"l": 136.79901, "t": 190.12775, "r": 172.84424, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 175.01852, "t": 190.12775, "r": 547.18286, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi", "bbox": {"l": 175.01852, "t": 190.12775, "r": 547.18286, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 136.79803, "t": 202.60760000000005, "r": 547.18085, "b": 211.82061999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "Authors . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi", "bbox": {"l": 136.79803, "t": 202.60760000000005, "r": 547.18085, "b": 211.82061999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 136.79803, "t": 215.14721999999995, "r": 339.18292, "b": 224.36023, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "Now you can become a published author, too!", "bbox": {"l": 136.79803, "t": 215.14721999999995, "r": 339.18292, "b": 224.36023, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 344.71411, "t": 215.14721999999995, "r": 530.00812, "b": 224.36023, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 344.71411, "t": 215.14721999999995, "r": 530.00812, "b": 224.36023, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 535.53925, "t": 215.14721999999995, "r": 547.13879, "b": 224.36023, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "xiii", "bbox": {"l": 535.53925, "t": 215.14721999999995, "r": 547.13879, "b": 224.36023, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 136.79803, "t": 227.62707999999998, "r": 529.99506, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "Comments welcome. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 136.79803, "t": 227.62707999999998, "r": 529.99506, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 535.5495, "t": 227.62707999999998, "r": 547.19788, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "xiii", "bbox": {"l": 535.5495, "t": 227.62707999999998, "r": 547.19788, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 136.79807, "t": 240.10693000000003, "r": 284.02866, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "Stay connected to IBM Redbooks", "bbox": {"l": 136.79807, "t": 240.10693000000003, "r": 284.02866, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 289.54449, "t": 240.10693000000003, "r": 529.48242, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 289.54449, "t": 240.10693000000003, "r": 529.48242, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 534.99829, "t": 240.10693000000003, "r": 547.12115, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "xiv", "bbox": {"l": 534.99829, "t": 240.10693000000003, "r": 547.12115, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 136.79807, "t": 262.60657000000003, "r": 373.17566, "b": 271.81958, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "Chapter 1. Securing and protecting IBM DB2 data", "bbox": {"l": 136.79807, "t": 262.60657000000003, "r": 373.17566, "b": 271.81958, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 375.11798, "t": 262.60657000000003, "r": 536.09589, "b": 271.81958, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 375.11798, "t": 262.60657000000003, "r": 536.09589, "b": 271.81958, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 541.64685, "t": 262.60657000000003, "r": 547.19781, "b": 271.81958, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "1", "bbox": {"l": 541.64685, "t": 262.60657000000003, "r": 547.19781, "b": 271.81958, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 136.79808, "t": 274.60637999999994, "r": 150.88702, "b": 283.8194, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "1.1", "bbox": {"l": 136.79808, "t": 274.60637999999994, "r": 150.88702, "b": 283.8194, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 156.5226, "t": 274.60637999999994, "r": 549.84723, "b": 283.8194, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "Security fundamentals. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2", "bbox": {"l": 156.5226, "t": 274.60637999999994, "r": 549.84723, "b": 283.8194, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 136.79807, "t": 287.14606000000003, "r": 150.62746, "b": 296.35904, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "1.2", "bbox": {"l": 136.79807, "t": 287.14606000000003, "r": 150.62746, "b": 296.35904, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 156.15923, "t": 287.14606000000003, "r": 536.12933, "b": 296.35904, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "Current state of IBM i security . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.15923, "t": 287.14606000000003, "r": 536.12933, "b": 296.35904, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 541.66113, "t": 287.14606000000003, "r": 547.19287, "b": 296.35904, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "2", "bbox": {"l": 541.66113, "t": 287.14606000000003, "r": 547.19287, "b": 296.35904, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 136.79807, "t": 299.62595, "r": 150.84943, "b": 308.83893, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "1.3", "bbox": {"l": 136.79807, "t": 299.62595, "r": 150.84943, "b": 308.83893, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 156.46996, "t": 299.62595, "r": 549.84723, "b": 308.83893, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "DB2 for i security controls . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3", "bbox": {"l": 156.46996, "t": 299.62595, "r": 549.84723, "b": 308.83893, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 151.1972, "t": 312.1058300000001, "r": 173.38289, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "1.3.1", "bbox": {"l": 151.1972, "t": 312.1058300000001, "r": 173.38289, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 178.92932, "t": 312.1058300000001, "r": 536.05511, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "Existing row and column control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.92932, "t": 312.1058300000001, "r": 536.05511, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 541.6015, "t": 312.1058300000001, "r": 547.14795, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "4", "bbox": {"l": 541.6015, "t": 312.1058300000001, "r": 547.14795, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 151.1972, "t": 324.64548, "r": 173.4189, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "1.3.2", "bbox": {"l": 151.1972, "t": 324.64548, "r": 173.4189, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 178.97432, "t": 324.64548, "r": 536.08008, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "New controls: Row and Column Access Control. . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.97432, "t": 324.64548, "r": 536.08008, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 541.6355, "t": 324.64548, "r": 547.19092, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "5", "bbox": {"l": 541.6355, "t": 324.64548, "r": 547.19092, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 136.79704, "t": 347.14511, "r": 336.82071, "b": 356.35809, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "Chapter 2. Roles and separation of duties", "bbox": {"l": 136.79704, "t": 347.14511, "r": 336.82071, "b": 356.35809, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 338.99701, "t": 347.14511, "r": 536.09088, "b": 356.35809, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 338.99701, "t": 347.14511, "r": 536.09088, "b": 356.35809, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 541.64282, "t": 347.14511, "r": 547.19476, "b": 356.35809, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "7", "bbox": {"l": 541.64282, "t": 347.14511, "r": 547.19476, "b": 356.35809, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 136.79704, "t": 359.14493, "r": 150.644, "b": 368.35791, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "2.1", "bbox": {"l": 136.79704, "t": 359.14493, "r": 150.644, "b": 368.35791, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 156.18277, "t": 359.14493, "r": 536.12714, "b": 368.35791, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "Roles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.18277, "t": 359.14493, "r": 536.12714, "b": 368.35791, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 541.66589, "t": 359.14493, "r": 547.20471, "b": 368.35791, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "8", "bbox": {"l": 541.66589, "t": 359.14493, "r": 547.20471, "b": 368.35791, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 151.1972, "t": 371.62482, "r": 173.60995, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "2.1.1", "bbox": {"l": 151.1972, "t": 371.62482, "r": 173.60995, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 176.41154, "t": 371.62482, "r": 535.9527, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "DDM and DRDA application server access: QIBM_DB_DDMDRDA . . . . . . . . . . .", "bbox": {"l": 176.41154, "t": 371.62482, "r": 535.9527, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 541.55585, "t": 371.62482, "r": 547.15906, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "8", "bbox": {"l": 541.55585, "t": 371.62482, "r": 547.15906, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 151.1972, "t": 384.10470999999995, "r": 173.41664, "b": 393.31769, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "2.1.2", "bbox": {"l": 151.1972, "t": 384.10470999999995, "r": 173.41664, "b": 393.31769, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 178.97151, "t": 384.10470999999995, "r": 536.04108, "b": 393.31769, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "Toolbox application server access: QIBM_DB_ZDA. . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.97151, "t": 384.10470999999995, "r": 536.04108, "b": 393.31769, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 541.59595, "t": 384.10470999999995, "r": 547.15082, "b": 393.31769, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "8", "bbox": {"l": 541.59595, "t": 384.10470999999995, "r": 547.15082, "b": 393.31769, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 151.1972, "t": 396.64435, "r": 173.41859, "b": 405.85733, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "2.1.3", "bbox": {"l": 151.1972, "t": 396.64435, "r": 173.41859, "b": 405.85733, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 178.97394, "t": 396.64435, "r": 536.07489, "b": 405.85733, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "Database Administrator function: QIBM_DB_SQLADM . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.97394, "t": 396.64435, "r": 536.07489, "b": 405.85733, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 541.63025, "t": 396.64435, "r": 547.18561, "b": 405.85733, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "9", "bbox": {"l": 541.63025, "t": 396.64435, "r": 547.18561, "b": 405.85733, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 151.1972, "t": 409.12424000000004, "r": 173.38629, "b": 418.33722, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "2.1.4", "bbox": {"l": 151.1972, "t": 409.12424000000004, "r": 173.38629, "b": 418.33722, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 178.93356, "t": 409.12424000000004, "r": 411.27048, "b": 418.33722, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "Database Information function: QIBM_DB_SYSMON", "bbox": {"l": 178.93356, "t": 409.12424000000004, "r": 411.27048, "b": 418.33722, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 416.81775, "t": 409.12424000000004, "r": 536.08411, "b": 418.33722, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": ". . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 416.81775, "t": 409.12424000000004, "r": 536.08411, "b": 418.33722, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 541.63135, "t": 409.12424000000004, "r": 547.17865, "b": 418.33722, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "9", "bbox": {"l": 541.63135, "t": 409.12424000000004, "r": 547.17865, "b": 418.33722, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 151.1972, "t": 421.60413, "r": 173.44926, "b": 430.81711, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "2.1.5", "bbox": {"l": 151.1972, "t": 421.60413, "r": 173.44926, "b": 430.81711, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 179.01228, "t": 421.60413, "r": 536.03589, "b": 430.81711, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "Security Administrator function: QIBM_DB_SECADM . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 179.01228, "t": 421.60413, "r": 536.03589, "b": 430.81711, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 541.59894, "t": 421.60413, "r": 547.16193, "b": 430.81711, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "9", "bbox": {"l": 541.59894, "t": 421.60413, "r": 547.16193, "b": 430.81711, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 151.1972, "t": 434.1437700000001, "r": 173.32208, "b": 443.35675, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "2.1.6", "bbox": {"l": 151.1972, "t": 434.1437700000001, "r": 173.32208, "b": 443.35675, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 178.8533, "t": 434.1437700000001, "r": 530.57318, "b": 443.35675, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "Change Function Usage CL command . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.8533, "t": 434.1437700000001, "r": 530.57318, "b": 443.35675, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 536.10443, "t": 434.1437700000001, "r": 547.16687, "b": 443.35675, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "10", "bbox": {"l": 536.10443, "t": 434.1437700000001, "r": 547.16687, "b": 443.35675, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 151.1972, "t": 446.62366, "r": 173.35822, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "2.1.7", "bbox": {"l": 151.1972, "t": 446.62366, "r": 173.35822, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 178.89848, "t": 446.62366, "r": 530.53522, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "Verifying function usage IDs for RCAC with the FUNCTION_USAGE view . . . . .", "bbox": {"l": 178.89848, "t": 446.62366, "r": 530.53522, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 536.0755, "t": 446.62366, "r": 547.15601, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "10", "bbox": {"l": 536.0755, "t": 446.62366, "r": 547.15601, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 136.79704, "t": 459.10355, "r": 150.85457, "b": 468.31653, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "2.2", "bbox": {"l": 136.79704, "t": 459.10355, "r": 150.85457, "b": 468.31653, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 156.47758, "t": 459.10355, "r": 547.25659, "b": 468.31653, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "Separation of duties . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10", "bbox": {"l": 156.47758, "t": 459.10355, "r": 547.25659, "b": 468.31653, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 136.79703, "t": 481.60318, "r": 348.68503, "b": 490.81616, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "Chapter 3. Row and Column Access Control", "bbox": {"l": 136.79703, "t": 481.60318, "r": 348.68503, "b": 490.81616, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 350.09741, "t": 481.60318, "r": 530.53961, "b": 490.81616, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 350.09741, "t": 481.60318, "r": 530.53961, "b": 490.81616, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 536.09167, "t": 481.60318, "r": 547.1958, "b": 490.81616, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "13", "bbox": {"l": 536.09167, "t": 481.60318, "r": 547.1958, "b": 490.81616, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 136.79703, "t": 493.603, "r": 150.70105, "b": 502.81598, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "3.1", "bbox": {"l": 136.79703, "t": 493.603, "r": 150.70105, "b": 502.81598, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 156.26266, "t": 493.603, "r": 530.4809, "b": 502.81598, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "Explanation of RCAC and the concept of access control . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.26266, "t": 493.603, "r": 530.4809, "b": 502.81598, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 536.04248, "t": 493.603, "r": 547.16571, "b": 502.81598, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "14", "bbox": {"l": 536.04248, "t": 493.603, "r": 547.16571, "b": 502.81598, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 151.19719, "t": 506.14264, "r": 173.35429, "b": 515.35562, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "3.1.1", "bbox": {"l": 151.19719, "t": 506.14264, "r": 173.35429, "b": 515.35562, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 178.89357, "t": 506.14264, "r": 378.20786, "b": 515.35562, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "Row permission and column mask definitions", "bbox": {"l": 178.89357, "t": 506.14264, "r": 378.20786, "b": 515.35562, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 383.74713, "t": 506.14264, "r": 530.5379, "b": 515.35562, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 383.74713, "t": 506.14264, "r": 530.5379, "b": 515.35562, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 536.07721, "t": 506.14264, "r": 547.15576, "b": 515.35562, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "14", "bbox": {"l": 536.07721, "t": 506.14264, "r": 547.15576, "b": 515.35562, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 151.19719, "t": 518.62253, "r": 173.44292, "b": 527.83551, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "3.1.2", "bbox": {"l": 151.19719, "t": 518.62253, "r": 173.44292, "b": 527.83551, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 179.00435, "t": 518.62253, "r": 530.43475, "b": 527.83551, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "Enabling and activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 179.00435, "t": 518.62253, "r": 530.43475, "b": 527.83551, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 535.99622, "t": 518.62253, "r": 547.11908, "b": 527.83551, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "16", "bbox": {"l": 535.99622, "t": 518.62253, "r": 547.11908, "b": 527.83551, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 136.79703, "t": 531.1621700000001, "r": 150.64432, "b": 540.37517, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "3.2", "bbox": {"l": 136.79703, "t": 531.1621700000001, "r": 150.64432, "b": 540.37517, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 156.18323, "t": 531.1621700000001, "r": 530.52808, "b": 540.37517, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "Special registers and built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.18323, "t": 531.1621700000001, "r": 530.52808, "b": 540.37517, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 536.06702, "t": 531.1621700000001, "r": 547.14484, "b": 540.37517, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "18", "bbox": {"l": 536.06702, "t": 531.1621700000001, "r": 547.14484, "b": 540.37517, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 151.19719, "t": 543.64204, "r": 173.41321, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "3.2.1", "bbox": {"l": 151.19719, "t": 543.64204, "r": 173.41321, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 178.96722, "t": 543.64204, "r": 530.49786, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "Special registers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.96722, "t": 543.64204, "r": 530.49786, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 536.05188, "t": 543.64204, "r": 547.15991, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "18", "bbox": {"l": 536.05188, "t": 543.64204, "r": 547.15991, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 151.19719, "t": 556.12192, "r": 173.35269, "b": 565.33492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "3.2.2", "bbox": {"l": 151.19719, "t": 556.12192, "r": 173.35269, "b": 565.33492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 178.89156, "t": 556.12192, "r": 530.56024, "b": 565.33492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "Built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.89156, "t": 556.12192, "r": 530.56024, "b": 565.33492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 536.09912, "t": 556.12192, "r": 547.17688, "b": 565.33492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "19", "bbox": {"l": 536.09912, "t": 556.12192, "r": 547.17688, "b": 565.33492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 136.79703, "t": 568.66156, "r": 150.62514, "b": 577.87456, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "3.3", "bbox": {"l": 136.79703, "t": 568.66156, "r": 150.62514, "b": 577.87456, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 156.15639, "t": 568.66156, "r": 530.53027, "b": 577.87456, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "VERIFY_GROUP_FOR_USER function . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.15639, "t": 568.66156, "r": 530.53027, "b": 577.87456, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 536.06152, "t": 568.66156, "r": 547.12402, "b": 577.87456, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "20", "bbox": {"l": 536.06152, "t": 568.66156, "r": 547.12402, "b": 577.87456, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 136.79703, "t": 581.14143, "r": 150.63004, "b": 590.35443, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "3.4", "bbox": {"l": 136.79703, "t": 581.14143, "r": 150.63004, "b": 590.35443, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 156.16325, "t": 581.14143, "r": 530.62994, "b": 590.35443, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "Establishing and controlling accessibility by using the RCAC rule text . . . . . . . . . . . . .", "bbox": {"l": 156.16325, "t": 581.14143, "r": 530.62994, "b": 590.35443, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 536.16315, "t": 581.14143, "r": 547.22955, "b": 590.35443, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "21", "bbox": {"l": 536.16315, "t": 581.14143, "r": 547.22955, "b": 590.35443, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 136.79701, "t": 593.62131, "r": 150.64413, "b": 602.8343, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "3.5", "bbox": {"l": 136.79701, "t": 593.62131, "r": 150.64413, "b": 602.8343, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 156.18298, "t": 593.62131, "r": 394.7818, "b": 602.8343, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "SELECT, INSERT, and UPDATE behavior with RCAC", "bbox": {"l": 156.18298, "t": 593.62131, "r": 394.7818, "b": 602.8343, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 400.32065, "t": 593.62131, "r": 530.48358, "b": 602.8343, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": ". . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 400.32065, "t": 593.62131, "r": 530.48358, "b": 602.8343, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 536.0224, "t": 593.62131, "r": 547.1001, "b": 602.8343, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "22", "bbox": {"l": 536.0224, "t": 593.62131, "r": 547.1001, "b": 602.8343, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 136.79701, "t": 606.16095, "r": 150.6642, "b": 615.37395, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "3.6", "bbox": {"l": 136.79701, "t": 606.16095, "r": 150.6642, "b": 615.37395, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 156.21107, "t": 606.16095, "r": 530.56512, "b": 615.37395, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "Human resources example . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.21107, "t": 606.16095, "r": 530.56512, "b": 615.37395, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 536.112, "t": 606.16095, "r": 547.20575, "b": 615.37395, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "22", "bbox": {"l": 536.112, "t": 606.16095, "r": 547.20575, "b": 615.37395, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 151.19717, "t": 618.64082, "r": 173.41692, "b": 627.85382, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "3.6.1", "bbox": {"l": 151.19717, "t": 618.64082, "r": 173.41692, "b": 627.85382, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 178.97185, "t": 618.64082, "r": 530.49139, "b": 627.85382, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": "Assigning the QIBM_DB_SECADM function ID to the consultants. . . . . . . . . . . .", "bbox": {"l": 178.97185, "t": 618.64082, "r": 530.49139, "b": 627.85382, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 536.04633, "t": 618.64082, "r": 547.15619, "b": 627.85382, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "23", "bbox": {"l": 536.04633, "t": 618.64082, "r": 547.15619, "b": 627.85382, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 151.19717, "t": 631.1206999999999, "r": 173.32271, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "3.6.2", "bbox": {"l": 151.19717, "t": 631.1206999999999, "r": 173.32271, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 178.8541, "t": 631.1206999999999, "r": 530.56458, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": "Creating group profiles for the users and their roles . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.8541, "t": 631.1206999999999, "r": 530.56458, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 536.09601, "t": 631.1206999999999, "r": 547.15875, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 107, "text": "23", "bbox": {"l": 536.09601, "t": 631.1206999999999, "r": 547.15875, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 151.19717, "t": 643.66034, "r": 173.32227, "b": 652.87334, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 108, "text": "3.6.3", "bbox": {"l": 151.19717, "t": 643.66034, "r": 173.32227, "b": 652.87334, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 178.85353, "t": 643.66034, "r": 530.55695, "b": 652.87334, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 109, "text": "Demonstrating data access without RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.85353, "t": 643.66034, "r": 530.55695, "b": 652.87334, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 536.0882, "t": 643.66034, "r": 547.15076, "b": 652.87334, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 110, "text": "24", "bbox": {"l": 536.0882, "t": 643.66034, "r": 547.15076, "b": 652.87334, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 151.19717, "t": 656.14021, "r": 173.35289, "b": 665.35321, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 111, "text": "3.6.4", "bbox": {"l": 151.19717, "t": 656.14021, "r": 173.35289, "b": 665.35321, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 178.89182, "t": 656.14021, "r": 530.53412, "b": 665.35321, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 112, "text": "Defining and creating row permissions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.89182, "t": 656.14021, "r": 530.53412, "b": 665.35321, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 114, "label": "text", "bbox": {"l": 536.073, "t": 656.14021, "r": 547.15088, "b": 665.35321, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 113, "text": "25", "bbox": {"l": 536.073, "t": 656.14021, "r": 547.15088, "b": 665.35321, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 115, "label": "text", "bbox": {"l": 151.19717, "t": 668.62009, "r": 173.35289, "b": 677.83309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 114, "text": "3.6.5", "bbox": {"l": 151.19717, "t": 668.62009, "r": 173.35289, "b": 677.83309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 116, "label": "text", "bbox": {"l": 178.89182, "t": 668.62009, "r": 339.45105, "b": 677.83309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 115, "text": "Defining and creating column masks", "bbox": {"l": 178.89182, "t": 668.62009, "r": 339.45105, "b": 677.83309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 117, "label": "text", "bbox": {"l": 344.98996, "t": 668.62009, "r": 530.54413, "b": 677.83309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 116, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 344.98996, "t": 668.62009, "r": 530.54413, "b": 677.83309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 118, "label": "text", "bbox": {"l": 536.08301, "t": 668.62009, "r": 547.16089, "b": 677.83309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 117, "text": "26", "bbox": {"l": 536.08301, "t": 668.62009, "r": 547.16089, "b": 677.83309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 119, "label": "text", "bbox": {"l": 151.19717, "t": 681.15973, "r": 173.38359, "b": 690.37273, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 118, "text": "3.6.6", "bbox": {"l": 151.19717, "t": 681.15973, "r": 173.38359, "b": 690.37273, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 120, "label": "text", "bbox": {"l": 178.93019, "t": 681.15973, "r": 530.54102, "b": 690.37273, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 119, "text": "Activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.93019, "t": 681.15973, "r": 530.54102, "b": 690.37273, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 121, "label": "text", "bbox": {"l": 536.08765, "t": 681.15973, "r": 547.18085, "b": 690.37273, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 120, "text": "28", "bbox": {"l": 536.08765, "t": 681.15973, "r": 547.18085, "b": 690.37273, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 122, "label": "text", "bbox": {"l": 151.19717, "t": 693.63961, "r": 173.32332, "b": 702.852615, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 121, "text": "3.6.7", "bbox": {"l": 151.19717, "t": 693.63961, "r": 173.32332, "b": 702.852615, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 123, "label": "text", "bbox": {"l": 178.85486, "t": 693.63961, "r": 350.80011, "b": 702.852615, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 122, "text": "Demonstrating data access with RCAC", "bbox": {"l": 178.85486, "t": 693.63961, "r": 350.80011, "b": 702.852615, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 124, "label": "text", "bbox": {"l": 356.33163, "t": 693.63961, "r": 530.57507, "b": 702.852615, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 123, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 356.33163, "t": 693.63961, "r": 530.57507, "b": 702.852615, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 125, "label": "text", "bbox": {"l": 536.10663, "t": 693.63961, "r": 547.16968, "b": 702.852615, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 124, "text": "29", "bbox": {"l": 536.10663, "t": 693.63961, "r": 547.16968, "b": 702.852615, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 126, "label": "text", "bbox": {"l": 151.19717, "t": 706.119492, "r": 173.44592, "b": 715.332497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 125, "text": "3.6.8", "bbox": {"l": 151.19717, "t": 706.119492, "r": 173.44592, "b": 715.332497, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 127, "label": "text", "bbox": {"l": 179.00812, "t": 706.119492, "r": 530.43628, "b": 715.332497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 126, "text": "Demonstrating data access with a view and RCAC . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 179.00812, "t": 706.119492, "r": 530.43628, "b": 715.332497, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 128, "label": "text", "bbox": {"l": 535.99847, "t": 706.119492, "r": 547.12286, "b": 715.332497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 127, "text": "32", "bbox": {"l": 535.99847, "t": 706.119492, "r": 547.12286, "b": 715.332497, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 43, "num_cols": 2, "table_cells": [{"bbox": {"l": 136.8, "t": 132.64862000000005, "r": 172.89404, "b": 141.86163, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Notices", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 175.01952, "t": 132.64862000000005, "r": 547.18982, "b": 141.86163, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vii", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79901, "t": 145.12847999999997, "r": 189.86537, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Trademarks", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 195.39685, "t": 145.12847999999997, "r": 547.18286, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . viii", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79901, "t": 167.62811, "r": 279.39731, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "DB2 for i Center of Excellence", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.61942, "t": 167.62811, "r": 547.1908, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ix", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79901, "t": 190.12775, "r": 172.84424, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Preface", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 175.01852, "t": 190.12775, "r": 547.18286, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79803, "t": 202.60760000000005, "r": 547.18085, "b": 211.82061999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Authors . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79803, "t": 215.14721999999995, "r": 339.18292, "b": 224.36023, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Now you can become a published author, too!", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 344.71411, "t": 215.14721999999995, "r": 547.13879, "b": 224.36023, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xiii", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79803, "t": 227.62707999999998, "r": 529.99506, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Comments welcome. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 535.5495, "t": 227.62707999999998, "r": 547.19788, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "xiii", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79807, "t": 240.10693000000003, "r": 284.02866, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Stay connected to IBM Redbooks", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.54449, "t": 240.10693000000003, "r": 547.12115, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xiv", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79807, "t": 262.60657000000003, "r": 536.09589, "b": 271.81958, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Chapter 1. Securing and protecting IBM DB2 data  . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.64685, "t": 262.60657000000003, "r": 547.19781, "b": 271.81958, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79808, "t": 274.60637999999994, "r": 549.84723, "b": 283.8194, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "1.1 Security fundamentals. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79807, "t": 287.14606000000003, "r": 536.12933, "b": 296.35904, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "1.2 Current state of IBM i security . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.66113, "t": 287.14606000000003, "r": 547.19287, "b": 296.35904, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79807, "t": 299.62595, "r": 549.84723, "b": 308.83893, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "1.3 DB2 for i security controls . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 312.1058300000001, "r": 536.05511, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "1.3.1 Existing row and column control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.6015, "t": 312.1058300000001, "r": 547.14795, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 324.64548, "r": 536.08008, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "1.3.2 New controls: Row and Column Access Control. . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.6355, "t": 324.64548, "r": 547.19092, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79704, "t": 347.14511, "r": 536.09088, "b": 356.35809, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 14, "end_row_offset_idx": 15, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Chapter 2. Roles and separation of duties . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.64282, "t": 347.14511, "r": 547.19476, "b": 356.35809, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 14, "end_row_offset_idx": 15, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79704, "t": 359.14493, "r": 536.12714, "b": 368.35791, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 15, "end_row_offset_idx": 16, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1 Roles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.66589, "t": 359.14493, "r": 547.20471, "b": 368.35791, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 15, "end_row_offset_idx": 16, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 371.62482, "r": 535.9527, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 16, "end_row_offset_idx": 17, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.1 DDM and DRDA application server access: QIBM_DB_DDMDRDA . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.55585, "t": 371.62482, "r": 547.15906, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 16, "end_row_offset_idx": 17, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 384.10470999999995, "r": 536.04108, "b": 393.31769, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 17, "end_row_offset_idx": 18, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.2 Toolbox application server access: QIBM_DB_ZDA. . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.59595, "t": 384.10470999999995, "r": 547.15082, "b": 393.31769, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 17, "end_row_offset_idx": 18, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 396.64435, "r": 536.07489, "b": 405.85733, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 18, "end_row_offset_idx": 19, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.3 Database Administrator function: QIBM_DB_SQLADM . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.63025, "t": 396.64435, "r": 547.18561, "b": 405.85733, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 18, "end_row_offset_idx": 19, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 409.12424000000004, "r": 411.27048, "b": 418.33722, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 19, "end_row_offset_idx": 20, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.4 Database Information function: QIBM_DB_SYSMON", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 416.81775, "t": 409.12424000000004, "r": 547.17865, "b": 418.33722, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 19, "end_row_offset_idx": 20, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . 9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 421.60413, "r": 536.03589, "b": 430.81711, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 20, "end_row_offset_idx": 21, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.5 Security Administrator function: QIBM_DB_SECADM . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.59894, "t": 421.60413, "r": 547.16193, "b": 430.81711, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 20, "end_row_offset_idx": 21, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 434.1437700000001, "r": 530.57318, "b": 443.35675, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 21, "end_row_offset_idx": 22, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.6 Change Function Usage CL command . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.10443, "t": 434.1437700000001, "r": 547.16687, "b": 443.35675, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 21, "end_row_offset_idx": 22, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "10", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 446.62366, "r": 530.53522, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 22, "end_row_offset_idx": 23, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.7 Verifying function usage IDs for RCAC with the FUNCTION_USAGE view . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.0755, "t": 446.62366, "r": 547.15601, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 22, "end_row_offset_idx": 23, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "10", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79704, "t": 459.10355, "r": 547.25659, "b": 468.31653, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 23, "end_row_offset_idx": 24, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.2 Separation of duties . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79703, "t": 481.60318, "r": 530.53961, "b": 490.81616, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 24, "end_row_offset_idx": 25, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Chapter 3. Row and Column Access Control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.09167, "t": 481.60318, "r": 547.1958, "b": 490.81616, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 24, "end_row_offset_idx": 25, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "13", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79703, "t": 493.603, "r": 530.4809, "b": 502.81598, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 25, "end_row_offset_idx": 26, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.1 Explanation of RCAC and the concept of access control . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.04248, "t": 493.603, "r": 547.16571, "b": 502.81598, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 25, "end_row_offset_idx": 26, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "14", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19719, "t": 506.14264, "r": 378.20786, "b": 515.35562, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 26, "end_row_offset_idx": 27, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.1.1 Row permission and column mask definitions", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 383.74713, "t": 506.14264, "r": 547.15576, "b": 515.35562, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 26, "end_row_offset_idx": 27, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . 14", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19719, "t": 518.62253, "r": 530.43475, "b": 527.83551, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 27, "end_row_offset_idx": 28, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.1.2 Enabling and activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 535.99622, "t": 518.62253, "r": 547.11908, "b": 527.83551, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 27, "end_row_offset_idx": 28, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "16", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79703, "t": 531.1621700000001, "r": 530.52808, "b": 540.37517, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 28, "end_row_offset_idx": 29, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.2 Special registers and built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.06702, "t": 531.1621700000001, "r": 547.14484, "b": 540.37517, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 28, "end_row_offset_idx": 29, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "18", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19719, "t": 543.64204, "r": 530.49786, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 29, "end_row_offset_idx": 30, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.2.1 Special registers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.05188, "t": 543.64204, "r": 547.15991, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 29, "end_row_offset_idx": 30, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "18", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19719, "t": 556.12192, "r": 530.56024, "b": 565.33492, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 30, "end_row_offset_idx": 31, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.2.2 Built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.09912, "t": 556.12192, "r": 547.17688, "b": 565.33492, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 30, "end_row_offset_idx": 31, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "19", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79703, "t": 568.66156, "r": 530.53027, "b": 577.87456, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 31, "end_row_offset_idx": 32, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.3 VERIFY_GROUP_FOR_USER function . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.06152, "t": 568.66156, "r": 547.12402, "b": 577.87456, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 31, "end_row_offset_idx": 32, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "20", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79703, "t": 581.14143, "r": 530.62994, "b": 590.35443, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 32, "end_row_offset_idx": 33, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.4 Establishing and controlling accessibility by using the RCAC rule text . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.16315, "t": 581.14143, "r": 547.22955, "b": 590.35443, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 32, "end_row_offset_idx": 33, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "21", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79701, "t": 593.62131, "r": 530.56512, "b": 615.37395, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 34, "end_row_offset_idx": 35, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.5 SELECT, INSERT, and UPDATE behavior with RCAC 3.6 Human resources example . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 400.32065, "t": 593.62131, "r": 530.48358, "b": 602.8343, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 33, "end_row_offset_idx": 34, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": ". . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.0224, "t": 593.62131, "r": 547.1001, "b": 602.8343, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 33, "end_row_offset_idx": 34, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "22", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.112, "t": 606.16095, "r": 547.20575, "b": 615.37395, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 34, "end_row_offset_idx": 35, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "22", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717, "t": 618.64082, "r": 530.49139, "b": 627.85382, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 35, "end_row_offset_idx": 36, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.1 Assigning the QIBM_DB_SECADM function ID to the consultants. . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.04633, "t": 618.64082, "r": 547.15619, "b": 627.85382, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 35, "end_row_offset_idx": 36, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "23", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717, "t": 631.1206999999999, "r": 530.56458, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 36, "end_row_offset_idx": 37, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.2 Creating group profiles for the users and their roles . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.09601, "t": 631.1206999999999, "r": 547.15875, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 36, "end_row_offset_idx": 37, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "23", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717, "t": 643.66034, "r": 530.55695, "b": 652.87334, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 37, "end_row_offset_idx": 38, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.3 Demonstrating data access without RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.0882, "t": 643.66034, "r": 547.15076, "b": 652.87334, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 37, "end_row_offset_idx": 38, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "24", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717, "t": 656.14021, "r": 530.53412, "b": 665.35321, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 38, "end_row_offset_idx": 39, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.4 Defining and creating row permissions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.073, "t": 656.14021, "r": 547.15088, "b": 665.35321, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 38, "end_row_offset_idx": 39, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "25", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717, "t": 668.62009, "r": 339.45105, "b": 677.83309, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 39, "end_row_offset_idx": 40, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.5 Defining and creating column masks", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 344.98996, "t": 668.62009, "r": 547.16089, "b": 677.83309, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 39, "end_row_offset_idx": 40, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717, "t": 681.15973, "r": 530.54102, "b": 690.37273, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 40, "end_row_offset_idx": 41, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.6 Activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.08765, "t": 681.15973, "r": 547.18085, "b": 690.37273, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 40, "end_row_offset_idx": 41, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "28", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717, "t": 693.63961, "r": 530.57507, "b": 702.852615, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 41, "end_row_offset_idx": 42, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.7 Demonstrating data access with RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.10663, "t": 693.63961, "r": 547.16968, "b": 702.852615, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 41, "end_row_offset_idx": 42, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "29", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717, "t": 706.119492, "r": 530.43628, "b": 715.332497, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 42, "end_row_offset_idx": 43, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.8 Demonstrating data access with a view and RCAC . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 535.99847, "t": 706.119492, "r": 547.12286, "b": 715.332497, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 42, "end_row_offset_idx": 43, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "32", "column_header": false, "row_header": false, "row_section": false}]}], "headers": [{"label": "page_footer", "id": 2, "page_no": 1, "cluster": {"id": 2, "label": "page_footer", "bbox": {"l": 64.800003, "t": 755.538002, "r": 257.24335, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9473597407341003, "cells": [{"id": 0, "text": "' Copyright IBM Corp. 2014. All rights reserved.", "bbox": {"l": 64.800003, "t": 755.538002, "r": 257.24335, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "' Copyright IBM Corp. 2014. All rights reserved."}, {"label": "page_footer", "id": 3, "page_no": 1, "cluster": {"id": 3, "label": "page_footer", "bbox": {"l": 538.85999, "t": 754.848721, "r": 547.25928, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.8926277160644531, "cells": [{"id": 1, "text": "iii", "bbox": {"l": 538.85999, "t": 754.848721, "r": 547.25928, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "iii"}]}}, {"page_no": 2, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "DB2 for i Center of Excellence", "bbox": {"l": 64.800003, "t": 74.48395000000005, "r": 235.8624, "b": 85.58398, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Solution Brief", "bbox": {"l": 94.132698, "t": 148.63933999999995, "r": 139.54634, "b": 155.33642999999995, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "IBM Systems Lab Services and Training", "bbox": {"l": 94.134933, "t": 138.45012999999994, "r": 233.99973, "b": 145.22162000000003, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Power Services", "bbox": {"l": 461.08859000000007, "t": 138.40752999999995, "r": 506.26178, "b": 145.42181000000005, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "DB2 for i", "bbox": {"l": 280.24011, "t": 239.34265000000005, "r": 354.57022, "b": 256.26153999999997, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Center of Excellence ", "bbox": {"l": 280.24011, "t": 259.70165999999995, "r": 463.80942, "b": 276.62054, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Expert help to achieve your business requirements", "bbox": {"l": 280.24011, "t": 277.59027000000003, "r": 483.29572, "b": 287.45959, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "We build confident, satisfied clients", "bbox": {"l": 280.24011, "t": 315.88161999999994, "r": 443.28210000000007, "b": 324.89566, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "No one else has the vast consulting experiences, skills sharing and ", "bbox": {"l": 280.24011, "t": 327.37595, "r": 488.15466, "b": 334.77994, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "renown service offerings to do what we can do for you.", "bbox": {"l": 280.24011, "t": 337.55551, "r": 452.34018, "b": 344.9595, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Because no one else is IBM.", "bbox": {"l": 280.24011, "t": 357.3260200000001, "r": 367.86023, "b": 364.73001, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "With combined experiences and direct access to development groups, ", "bbox": {"l": 280.24011, "t": 377.09801999999996, "r": 500.32104000000004, "b": 384.50201, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "we\u2019re the experts in IBM DB2\u00ae for i. The DB2 for i Center of ", "bbox": {"l": 280.24011, "t": 387.27759, "r": 479.25497, "b": 394.68158, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Excellence (CoE) can help you achieve-perhaps reexamine and ", "bbox": {"l": 280.24011, "t": 397.45715, "r": 483.4667400000001, "b": 404.86115, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "exceed-your business requirements and gain more confidence and ", "bbox": {"l": 280.24011, "t": 407.63672, "r": 492.97656, "b": 415.04071000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "satisfaction in IBM product data management products and solutions.", "bbox": {"l": 280.24011, "t": 417.81628, "r": 498.87, "b": 425.22027999999995, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Who we are, some of what we do", "bbox": {"l": 280.24011, "t": 437.85403, "r": 434.83205999999996, "b": 446.86807, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "Global CoE engagements cover topics including:", "bbox": {"l": 280.24011, "t": 449.34824000000003, "r": 434.56316999999996, "b": 456.75223, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "r ", "bbox": {"l": 280.24011, "t": 470.95236, "r": 284.0993, "b": 476.16074, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Database performance and scalability", "bbox": {"l": 287.28961, "t": 469.11826, "r": 401.56412, "b": 476.52225, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "r ", "bbox": {"l": 280.24011, "t": 481.13507, "r": 284.0993, "b": 486.34344, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Advanced SQL knowledge and skills transfer", "bbox": {"l": 287.28961, "t": 479.30096, "r": 424.99646, "b": 486.70496, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "r ", "bbox": {"l": 280.24011, "t": 491.31766, "r": 284.0993, "b": 496.52603, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Business intelligence and analytics", "bbox": {"l": 287.28961, "t": 489.48355, "r": 392.15845, "b": 496.88754, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "r ", "bbox": {"l": 280.24011, "t": 501.50037, "r": 284.0993, "b": 506.70874, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "DB2 Web Query", "bbox": {"l": 287.28961, "t": 499.66626, "r": 339.94354, "b": 507.07025, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "r ", "bbox": {"l": 280.24011, "t": 511.68295, "r": 284.0993, "b": 516.8913299999999, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Query/400 modernization for better reporting and analysis capabilities", "bbox": {"l": 287.28961, "t": 509.84885, "r": 504.19314999999995, "b": 517.25284, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "r ", "bbox": {"l": 280.24011, "t": 521.8656599999999, "r": 284.0993, "b": 527.07404, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Database modernization and re-engineering", "bbox": {"l": 287.28961, "t": 520.03156, "r": 423.0022, "b": 527.4355499999999, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "r ", "bbox": {"l": 280.24011, "t": 532.04825, "r": 284.0993, "b": 537.2566400000001, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Data-centric architecture and design", "bbox": {"l": 287.28961, "t": 530.21414, "r": 399.65173, "b": 537.61813, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "r ", "bbox": {"l": 280.24011, "t": 542.23083, "r": 284.0993, "b": 547.43924, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "Extremely large database and overcoming limits to growth", "bbox": {"l": 287.28961, "t": 540.39674, "r": 466.77881, "b": 547.80074, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "r ", "bbox": {"l": 280.24011, "t": 552.41354, "r": 284.0993, "b": 557.62195, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "ISV education and enablement", "bbox": {"l": 287.28961, "t": 550.5794500000001, "r": 382.20956, "b": 557.98344, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Highlights ", "bbox": {"l": 144.88921, "t": 327.46163999999993, "r": 188.74681, "b": 336.81406, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "GLYPH<g115>GLYPH<g3>", "bbox": {"l": 144.88921, "t": 346.01953, "r": 148.68732, "b": 350.60168, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "GLYPH<g40>GLYPH<g81>GLYPH<g75>GLYPH<g68>GLYPH<g81>GLYPH<g70>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 151.9388, "t": 345.21707, "r": 177.25424, "b": 350.85666, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "GLYPH<g87>GLYPH<g75>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 176.9472, "t": 345.21707, "r": 187.11098, "b": 350.85666, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g73>GLYPH<g82>GLYPH<g85>GLYPH<g80>GLYPH<g68>GLYPH<g81>GLYPH<g70>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 186.7914, "t": 345.21707, "r": 222.95989999999998, "b": 350.85666, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "GLYPH<g82>GLYPH<g73>GLYPH<g3>", "bbox": {"l": 222.65912, "t": 345.21707, "r": 229.55193999999997, "b": 350.85666, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "GLYPH<g92>GLYPH<g82>GLYPH<g88>GLYPH<g85> GLYPH<g3>", "bbox": {"l": 229.2261, "t": 345.21707, "r": 242.87389000000002, "b": 350.85666, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "GLYPH<g71>GLYPH<g68>GLYPH<g87>GLYPH<g68>GLYPH<g69>GLYPH<g68>GLYPH<g86>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 151.93253, "t": 353.04984, "r": 178.77066, "b": 358.68942, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "GLYPH<g82>GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g68>GLYPH<g87>GLYPH<g76>GLYPH<g82>GLYPH<g81>GLYPH<g86>", "bbox": {"l": 178.46362, "t": 353.04984, "r": 207.16908, "b": 358.68942, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "GLYPH<g115>GLYPH<g3>", "bbox": {"l": 144.88921, "t": 368.73465, "r": 148.68732, "b": 373.3168, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "GLYPH<g40>GLYPH<g68>GLYPH<g85> GLYPH<g81>GLYPH<g3>", "bbox": {"l": 151.9388, "t": 367.93219, "r": 166.05655, "b": 373.57178, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "GLYPH<g74>GLYPH<g85>GLYPH<g72>GLYPH<g68>GLYPH<g87>GLYPH<g72>GLYPH<g85>GLYPH<g3>", "bbox": {"l": 165.73697, "t": 367.93219, "r": 186.40289, "b": 373.57178, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "GLYPH<g85>GLYPH<g72>GLYPH<g87>GLYPH<g88>GLYPH<g85> GLYPH<g81>GLYPH<g3>", "bbox": {"l": 186.09586, "t": 367.93219, "r": 203.61617, "b": 373.57178, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "GLYPH<g82>GLYPH<g81>GLYPH<g3>", "bbox": {"l": 203.30286, "t": 367.93219, "r": 211.82489, "b": 373.57178, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "GLYPH<g44>GLYPH<g55>GLYPH<g3>", "bbox": {"l": 211.49905, "t": 367.93219, "r": 218.16002, "b": 373.57178, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "GLYPH<g83>GLYPH<g85>GLYPH<g82>GLYPH<g77>GLYPH<g72>GLYPH<g70>GLYPH<g87>GLYPH<g86> GLYPH<g3>", "bbox": {"l": 217.83418, "t": 367.93219, "r": 241.30737, "b": 373.57178, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "GLYPH<g87>GLYPH<g75>GLYPH<g85>GLYPH<g82>GLYPH<g88>GLYPH<g74>GLYPH<g75>GLYPH<g3>", "bbox": {"l": 151.93253, "t": 375.76495, "r": 174.46577, "b": 381.40454, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "GLYPH<g80>GLYPH<g82>GLYPH<g71>GLYPH<g72>GLYPH<g85> GLYPH<g81>GLYPH<g76>GLYPH<g93>GLYPH<g68>GLYPH<g87>GLYPH<g76>GLYPH<g82>GLYPH<g81>GLYPH<g3>", "bbox": {"l": 174.15874, "t": 375.76495, "r": 214.4128, "b": 381.40454, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "GLYPH<g82>GLYPH<g73>GLYPH<g3>", "bbox": {"l": 214.11829, "t": 375.76495, "r": 221.01110999999997, "b": 381.40454, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "GLYPH<g71>GLYPH<g68>GLYPH<g87>GLYPH<g68>GLYPH<g69>GLYPH<g68>GLYPH<g86>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 220.68527, "t": 375.76495, "r": 247.52341000000004, "b": 381.40454, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "GLYPH<g68>GLYPH<g81>GLYPH<g71> GLYPH<g3>", "bbox": {"l": 247.21637, "t": 375.76495, "r": 259.2287, "b": 381.40454, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "GLYPH<g68>GLYPH<g83>GLYPH<g83>GLYPH<g79>GLYPH<g76>GLYPH<g70>GLYPH<g68>GLYPH<g87>GLYPH<g76>GLYPH<g82>GLYPH<g81>GLYPH<g86>", "bbox": {"l": 151.93253, "t": 383.59772, "r": 184.61703, "b": 389.2373, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "GLYPH<g115>GLYPH<g3>", "bbox": {"l": 144.88921, "t": 399.28265, "r": 148.68732, "b": 403.86481000000003, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "GLYPH<g53>GLYPH<g72>GLYPH<g79>GLYPH<g92>GLYPH<g3>", "bbox": {"l": 151.9388, "t": 398.48019, "r": 165.36099, "b": 404.11978, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "GLYPH<g82>GLYPH<g81>GLYPH<g3>", "bbox": {"l": 165.04141, "t": 398.48019, "r": 173.56345, "b": 404.11978, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "GLYPH<g44>GLYPH<g37>GLYPH<g48>GLYPH<g3>", "bbox": {"l": 173.23761, "t": 398.48019, "r": 185.95174, "b": 404.11978, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "GLYPH<g72>GLYPH<g91>GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g87>GLYPH<g3>", "bbox": {"l": 185.63216, "t": 398.48019, "r": 204.42448, "b": 404.11978, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "GLYPH<g70>GLYPH<g82>GLYPH<g81>GLYPH<g86>GLYPH<g88>GLYPH<g79>GLYPH<g87>GLYPH<g76>GLYPH<g81>GLYPH<g74>GLYPH<g15>GLYPH<g3>", "bbox": {"l": 204.11118, "t": 398.48019, "r": 235.29178, "b": 404.11978, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "GLYPH<g86>GLYPH<g78>GLYPH<g76>GLYPH<g79>GLYPH<g79>GLYPH<g86> GLYPH<g3>", "bbox": {"l": 234.99099999999999, "t": 398.48019, "r": 249.83562, "b": 404.11978, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "GLYPH<g86>GLYPH<g75>GLYPH<g68>GLYPH<g85>GLYPH<g76>GLYPH<g81>GLYPH<g74>GLYPH<g3>", "bbox": {"l": 151.93253, "t": 406.31296, "r": 173.41306, "b": 411.95255, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "GLYPH<g68>GLYPH<g81>GLYPH<g71>GLYPH<g3>", "bbox": {"l": 173.10602, "t": 406.31296, "r": 185.0118, "b": 411.95255, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "GLYPH<g85>GLYPH<g72>GLYPH<g81>GLYPH<g82>GLYPH<g90>GLYPH<g81>GLYPH<g3>", "bbox": {"l": 184.69221, "t": 406.31296, "r": 206.3858, "b": 411.95255, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "GLYPH<g86>GLYPH<g72>GLYPH<g85>GLYPH<g89>GLYPH<g76>GLYPH<g70>GLYPH<g72>GLYPH<g86>", "bbox": {"l": 206.07249, "t": 406.31296, "r": 228.24231000000003, "b": 411.95255, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "GLYPH<g115>GLYPH<g3>", "bbox": {"l": 144.88921, "t": 421.99773999999996, "r": 148.68732, "b": 426.5799, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "GLYPH<g55>", "bbox": {"l": 151.9388, "t": 421.1952800000001, "r": 155.43533, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "GLYPH<g68>GLYPH<g78>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 154.73979, "t": 421.1952800000001, "r": 166.06282, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "GLYPH<g68>GLYPH<g71>GLYPH<g89>GLYPH<g68>GLYPH<g81>GLYPH<g87>GLYPH<g68>GLYPH<g74>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 165.74324, "t": 421.1952800000001, "r": 195.84607, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "GLYPH<g82>GLYPH<g73>GLYPH<g3>", "bbox": {"l": 195.53903, "t": 421.1952800000001, "r": 202.43185, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "GLYPH<g68>GLYPH<g70>GLYPH<g70>GLYPH<g72>GLYPH<g86>GLYPH<g86>GLYPH<g3>", "bbox": {"l": 202.10602, "t": 421.1952800000001, "r": 222.87220999999997, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "GLYPH<g87>GLYPH<g82>GLYPH<g3>", "bbox": {"l": 222.55890000000002, "t": 421.1952800000001, "r": 229.57077, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "GLYPH<g68> GLYPH<g3>", "bbox": {"l": 229.24492999999998, "t": 421.1952800000001, "r": 234.25163000000003, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "GLYPH<g90>GLYPH<g82>GLYPH<g85>GLYPH<g79>GLYPH<g71>GLYPH<g90>GLYPH<g76>GLYPH<g71>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 151.92627, "t": 429.02805, "r": 181.42754, "b": 434.66763, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "GLYPH<g86>GLYPH<g82>GLYPH<g88>GLYPH<g85>GLYPH<g70>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 181.1205, "t": 429.02805, "r": 201.07835, "b": 434.66763, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "GLYPH<g82>GLYPH<g73>GLYPH<g3>", "bbox": {"l": 200.76505, "t": 429.02805, "r": 207.65787, "b": 434.66763, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "GLYPH<g72>GLYPH<g91>GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g87>GLYPH<g76>GLYPH<g86>GLYPH<g72>", "bbox": {"l": 207.33203, "t": 429.02805, "r": 232.07098000000002, "b": 434.66763, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 26, "label": "text", "bbox": {"l": 64.800003, "t": 74.48395000000005, "r": 235.8624, "b": 85.58398, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 0, "text": "DB2 for i Center of Excellence", "bbox": {"l": 64.800003, "t": 74.48395000000005, "r": 235.8624, "b": 85.58398, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 94.132698, "t": 138.45012999999994, "r": 233.99973, "b": 155.33642999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.7431555986404419, "cells": [{"id": 1, "text": "Solution Brief", "bbox": {"l": 94.132698, "t": 148.63933999999995, "r": 139.54634, "b": 155.33642999999995, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "IBM Systems Lab Services and Training", "bbox": {"l": 94.134933, "t": 138.45012999999994, "r": 233.99973, "b": 145.22162000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 461.08859000000007, "t": 138.40752999999995, "r": 506.26178, "b": 145.42181000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.7798982858657837, "cells": [{"id": 3, "text": "Power Services", "bbox": {"l": 461.08859000000007, "t": 138.40752999999995, "r": 506.26178, "b": 145.42181000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "section_header", "bbox": {"l": 280.24011, "t": 239.34265000000005, "r": 463.80942, "b": 276.62054, "coord_origin": "TOPLEFT"}, "confidence": 0.7587865591049194, "cells": [{"id": 4, "text": "DB2 for i", "bbox": {"l": 280.24011, "t": 239.34265000000005, "r": 354.57022, "b": 256.26153999999997, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Center of Excellence ", "bbox": {"l": 280.24011, "t": 259.70165999999995, "r": 463.80942, "b": 276.62054, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 280.24011, "t": 277.59027000000003, "r": 483.29572, "b": 287.45959, "coord_origin": "TOPLEFT"}, "confidence": 0.7965622544288635, "cells": [{"id": 6, "text": "Expert help to achieve your business requirements", "bbox": {"l": 280.24011, "t": 277.59027000000003, "r": 483.29572, "b": 287.45959, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "section_header", "bbox": {"l": 280.24011, "t": 315.88161999999994, "r": 443.28210000000007, "b": 324.89566, "coord_origin": "TOPLEFT"}, "confidence": 0.8913541436195374, "cells": [{"id": 7, "text": "We build confident, satisfied clients", "bbox": {"l": 280.24011, "t": 315.88161999999994, "r": 443.28210000000007, "b": 324.89566, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 280.24011, "t": 327.37595, "r": 488.15466, "b": 344.9595, "coord_origin": "TOPLEFT"}, "confidence": 0.9560741782188416, "cells": [{"id": 8, "text": "No one else has the vast consulting experiences, skills sharing and ", "bbox": {"l": 280.24011, "t": 327.37595, "r": 488.15466, "b": 334.77994, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "renown service offerings to do what we can do for you.", "bbox": {"l": 280.24011, "t": 337.55551, "r": 452.34018, "b": 344.9595, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 280.24011, "t": 357.3260200000001, "r": 367.86023, "b": 364.73001, "coord_origin": "TOPLEFT"}, "confidence": 0.8260757923126221, "cells": [{"id": 10, "text": "Because no one else is IBM.", "bbox": {"l": 280.24011, "t": 357.3260200000001, "r": 367.86023, "b": 364.73001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 280.24011, "t": 377.09801999999996, "r": 500.32104000000004, "b": 425.22027999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9764723181724548, "cells": [{"id": 11, "text": "With combined experiences and direct access to development groups, ", "bbox": {"l": 280.24011, "t": 377.09801999999996, "r": 500.32104000000004, "b": 384.50201, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "we\u2019re the experts in IBM DB2\u00ae for i. The DB2 for i Center of ", "bbox": {"l": 280.24011, "t": 387.27759, "r": 479.25497, "b": 394.68158, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Excellence (CoE) can help you achieve-perhaps reexamine and ", "bbox": {"l": 280.24011, "t": 397.45715, "r": 483.4667400000001, "b": 404.86115, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "exceed-your business requirements and gain more confidence and ", "bbox": {"l": 280.24011, "t": 407.63672, "r": 492.97656, "b": 415.04071000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "satisfaction in IBM product data management products and solutions.", "bbox": {"l": 280.24011, "t": 417.81628, "r": 498.87, "b": 425.22027999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "section_header", "bbox": {"l": 280.24011, "t": 437.85403, "r": 434.83205999999996, "b": 446.86807, "coord_origin": "TOPLEFT"}, "confidence": 0.8492127060890198, "cells": [{"id": 16, "text": "Who we are, some of what we do", "bbox": {"l": 280.24011, "t": 437.85403, "r": 434.83205999999996, "b": 446.86807, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 280.24011, "t": 449.34824000000003, "r": 434.56316999999996, "b": 456.75223, "coord_origin": "TOPLEFT"}, "confidence": 0.8440335392951965, "cells": [{"id": 17, "text": "Global CoE engagements cover topics including:", "bbox": {"l": 280.24011, "t": 449.34824000000003, "r": 434.56316999999996, "b": 456.75223, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "list_item", "bbox": {"l": 280.24011, "t": 469.11826, "r": 401.56412, "b": 476.52225, "coord_origin": "TOPLEFT"}, "confidence": 0.9239600896835327, "cells": [{"id": 18, "text": "r ", "bbox": {"l": 280.24011, "t": 470.95236, "r": 284.0993, "b": 476.16074, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Database performance and scalability", "bbox": {"l": 287.28961, "t": 469.11826, "r": 401.56412, "b": 476.52225, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "list_item", "bbox": {"l": 280.24011, "t": 479.30096, "r": 424.99646, "b": 486.70496, "coord_origin": "TOPLEFT"}, "confidence": 0.9239721298217773, "cells": [{"id": 20, "text": "r ", "bbox": {"l": 280.24011, "t": 481.13507, "r": 284.0993, "b": 486.34344, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Advanced SQL knowledge and skills transfer", "bbox": {"l": 287.28961, "t": 479.30096, "r": 424.99646, "b": 486.70496, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "list_item", "bbox": {"l": 280.24011, "t": 489.48355, "r": 392.15845, "b": 496.88754, "coord_origin": "TOPLEFT"}, "confidence": 0.9157900214195251, "cells": [{"id": 22, "text": "r ", "bbox": {"l": 280.24011, "t": 491.31766, "r": 284.0993, "b": 496.52603, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Business intelligence and analytics", "bbox": {"l": 287.28961, "t": 489.48355, "r": 392.15845, "b": 496.88754, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "list_item", "bbox": {"l": 280.24011, "t": 499.66626, "r": 339.94354, "b": 507.07025, "coord_origin": "TOPLEFT"}, "confidence": 0.8733457326889038, "cells": [{"id": 24, "text": "r ", "bbox": {"l": 280.24011, "t": 501.50037, "r": 284.0993, "b": 506.70874, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "DB2 Web Query", "bbox": {"l": 287.28961, "t": 499.66626, "r": 339.94354, "b": 507.07025, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "list_item", "bbox": {"l": 280.24011, "t": 509.84885, "r": 504.19314999999995, "b": 517.25284, "coord_origin": "TOPLEFT"}, "confidence": 0.9249242544174194, "cells": [{"id": 26, "text": "r ", "bbox": {"l": 280.24011, "t": 511.68295, "r": 284.0993, "b": 516.8913299999999, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Query/400 modernization for better reporting and analysis capabilities", "bbox": {"l": 287.28961, "t": 509.84885, "r": 504.19314999999995, "b": 517.25284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "list_item", "bbox": {"l": 280.24011, "t": 520.03156, "r": 423.0022, "b": 527.4355499999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9109312891960144, "cells": [{"id": 28, "text": "r ", "bbox": {"l": 280.24011, "t": 521.8656599999999, "r": 284.0993, "b": 527.07404, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Database modernization and re-engineering", "bbox": {"l": 287.28961, "t": 520.03156, "r": 423.0022, "b": 527.4355499999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "list_item", "bbox": {"l": 280.24011, "t": 530.21414, "r": 399.65173, "b": 537.61813, "coord_origin": "TOPLEFT"}, "confidence": 0.8977466225624084, "cells": [{"id": 30, "text": "r ", "bbox": {"l": 280.24011, "t": 532.04825, "r": 284.0993, "b": 537.2566400000001, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Data-centric architecture and design", "bbox": {"l": 287.28961, "t": 530.21414, "r": 399.65173, "b": 537.61813, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "list_item", "bbox": {"l": 280.24011, "t": 540.39674, "r": 466.77881, "b": 547.80074, "coord_origin": "TOPLEFT"}, "confidence": 0.9218331575393677, "cells": [{"id": 32, "text": "r ", "bbox": {"l": 280.24011, "t": 542.23083, "r": 284.0993, "b": 547.43924, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "Extremely large database and overcoming limits to growth", "bbox": {"l": 287.28961, "t": 540.39674, "r": 466.77881, "b": 547.80074, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "list_item", "bbox": {"l": 280.24011, "t": 550.5794500000001, "r": 382.20956, "b": 557.98344, "coord_origin": "TOPLEFT"}, "confidence": 0.9075438976287842, "cells": [{"id": 34, "text": "r ", "bbox": {"l": 280.24011, "t": 552.41354, "r": 284.0993, "b": 557.62195, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "ISV education and enablement", "bbox": {"l": 287.28961, "t": 550.5794500000001, "r": 382.20956, "b": 557.98344, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "section_header", "bbox": {"l": 144.88921, "t": 327.46163999999993, "r": 188.74681, "b": 336.81406, "coord_origin": "TOPLEFT"}, "confidence": 0.9098502993583679, "cells": [{"id": 36, "text": "Highlights ", "bbox": {"l": 144.88921, "t": 327.46163999999993, "r": 188.74681, "b": 336.81406, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "list_item", "bbox": {"l": 144.88921, "t": 345.21707, "r": 242.87389000000002, "b": 358.68942, "coord_origin": "TOPLEFT"}, "confidence": 0.957169771194458, "cells": [{"id": 37, "text": "GLYPH<g115>GLYPH<g3>", "bbox": {"l": 144.88921, "t": 346.01953, "r": 148.68732, "b": 350.60168, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "GLYPH<g40>GLYPH<g81>GLYPH<g75>GLYPH<g68>GLYPH<g81>GLYPH<g70>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 151.9388, "t": 345.21707, "r": 177.25424, "b": 350.85666, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "GLYPH<g87>GLYPH<g75>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 176.9472, "t": 345.21707, "r": 187.11098, "b": 350.85666, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g73>GLYPH<g82>GLYPH<g85>GLYPH<g80>GLYPH<g68>GLYPH<g81>GLYPH<g70>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 186.7914, "t": 345.21707, "r": 222.95989999999998, "b": 350.85666, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "GLYPH<g82>GLYPH<g73>GLYPH<g3>", "bbox": {"l": 222.65912, "t": 345.21707, "r": 229.55193999999997, "b": 350.85666, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "GLYPH<g92>GLYPH<g82>GLYPH<g88>GLYPH<g85> GLYPH<g3>", "bbox": {"l": 229.2261, "t": 345.21707, "r": 242.87389000000002, "b": 350.85666, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "GLYPH<g71>GLYPH<g68>GLYPH<g87>GLYPH<g68>GLYPH<g69>GLYPH<g68>GLYPH<g86>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 151.93253, "t": 353.04984, "r": 178.77066, "b": 358.68942, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "GLYPH<g82>GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g68>GLYPH<g87>GLYPH<g76>GLYPH<g82>GLYPH<g81>GLYPH<g86>", "bbox": {"l": 178.46362, "t": 353.04984, "r": 207.16908, "b": 358.68942, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "list_item", "bbox": {"l": 144.88921, "t": 367.93219, "r": 259.2287, "b": 389.2373, "coord_origin": "TOPLEFT"}, "confidence": 0.9634580612182617, "cells": [{"id": 45, "text": "GLYPH<g115>GLYPH<g3>", "bbox": {"l": 144.88921, "t": 368.73465, "r": 148.68732, "b": 373.3168, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "GLYPH<g40>GLYPH<g68>GLYPH<g85> GLYPH<g81>GLYPH<g3>", "bbox": {"l": 151.9388, "t": 367.93219, "r": 166.05655, "b": 373.57178, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "GLYPH<g74>GLYPH<g85>GLYPH<g72>GLYPH<g68>GLYPH<g87>GLYPH<g72>GLYPH<g85>GLYPH<g3>", "bbox": {"l": 165.73697, "t": 367.93219, "r": 186.40289, "b": 373.57178, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "GLYPH<g85>GLYPH<g72>GLYPH<g87>GLYPH<g88>GLYPH<g85> GLYPH<g81>GLYPH<g3>", "bbox": {"l": 186.09586, "t": 367.93219, "r": 203.61617, "b": 373.57178, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "GLYPH<g82>GLYPH<g81>GLYPH<g3>", "bbox": {"l": 203.30286, "t": 367.93219, "r": 211.82489, "b": 373.57178, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "GLYPH<g44>GLYPH<g55>GLYPH<g3>", "bbox": {"l": 211.49905, "t": 367.93219, "r": 218.16002, "b": 373.57178, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "GLYPH<g83>GLYPH<g85>GLYPH<g82>GLYPH<g77>GLYPH<g72>GLYPH<g70>GLYPH<g87>GLYPH<g86> GLYPH<g3>", "bbox": {"l": 217.83418, "t": 367.93219, "r": 241.30737, "b": 373.57178, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "GLYPH<g87>GLYPH<g75>GLYPH<g85>GLYPH<g82>GLYPH<g88>GLYPH<g74>GLYPH<g75>GLYPH<g3>", "bbox": {"l": 151.93253, "t": 375.76495, "r": 174.46577, "b": 381.40454, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "GLYPH<g80>GLYPH<g82>GLYPH<g71>GLYPH<g72>GLYPH<g85> GLYPH<g81>GLYPH<g76>GLYPH<g93>GLYPH<g68>GLYPH<g87>GLYPH<g76>GLYPH<g82>GLYPH<g81>GLYPH<g3>", "bbox": {"l": 174.15874, "t": 375.76495, "r": 214.4128, "b": 381.40454, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "GLYPH<g82>GLYPH<g73>GLYPH<g3>", "bbox": {"l": 214.11829, "t": 375.76495, "r": 221.01110999999997, "b": 381.40454, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "GLYPH<g71>GLYPH<g68>GLYPH<g87>GLYPH<g68>GLYPH<g69>GLYPH<g68>GLYPH<g86>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 220.68527, "t": 375.76495, "r": 247.52341000000004, "b": 381.40454, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "GLYPH<g68>GLYPH<g81>GLYPH<g71> GLYPH<g3>", "bbox": {"l": 247.21637, "t": 375.76495, "r": 259.2287, "b": 381.40454, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "GLYPH<g68>GLYPH<g83>GLYPH<g83>GLYPH<g79>GLYPH<g76>GLYPH<g70>GLYPH<g68>GLYPH<g87>GLYPH<g76>GLYPH<g82>GLYPH<g81>GLYPH<g86>", "bbox": {"l": 151.93253, "t": 383.59772, "r": 184.61703, "b": 389.2373, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "list_item", "bbox": {"l": 144.88921, "t": 398.48019, "r": 249.83562, "b": 411.95255, "coord_origin": "TOPLEFT"}, "confidence": 0.9541196823120117, "cells": [{"id": 58, "text": "GLYPH<g115>GLYPH<g3>", "bbox": {"l": 144.88921, "t": 399.28265, "r": 148.68732, "b": 403.86481000000003, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "GLYPH<g53>GLYPH<g72>GLYPH<g79>GLYPH<g92>GLYPH<g3>", "bbox": {"l": 151.9388, "t": 398.48019, "r": 165.36099, "b": 404.11978, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "GLYPH<g82>GLYPH<g81>GLYPH<g3>", "bbox": {"l": 165.04141, "t": 398.48019, "r": 173.56345, "b": 404.11978, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "GLYPH<g44>GLYPH<g37>GLYPH<g48>GLYPH<g3>", "bbox": {"l": 173.23761, "t": 398.48019, "r": 185.95174, "b": 404.11978, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "GLYPH<g72>GLYPH<g91>GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g87>GLYPH<g3>", "bbox": {"l": 185.63216, "t": 398.48019, "r": 204.42448, "b": 404.11978, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "GLYPH<g70>GLYPH<g82>GLYPH<g81>GLYPH<g86>GLYPH<g88>GLYPH<g79>GLYPH<g87>GLYPH<g76>GLYPH<g81>GLYPH<g74>GLYPH<g15>GLYPH<g3>", "bbox": {"l": 204.11118, "t": 398.48019, "r": 235.29178, "b": 404.11978, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "GLYPH<g86>GLYPH<g78>GLYPH<g76>GLYPH<g79>GLYPH<g79>GLYPH<g86> GLYPH<g3>", "bbox": {"l": 234.99099999999999, "t": 398.48019, "r": 249.83562, "b": 404.11978, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "GLYPH<g86>GLYPH<g75>GLYPH<g68>GLYPH<g85>GLYPH<g76>GLYPH<g81>GLYPH<g74>GLYPH<g3>", "bbox": {"l": 151.93253, "t": 406.31296, "r": 173.41306, "b": 411.95255, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "GLYPH<g68>GLYPH<g81>GLYPH<g71>GLYPH<g3>", "bbox": {"l": 173.10602, "t": 406.31296, "r": 185.0118, "b": 411.95255, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "GLYPH<g85>GLYPH<g72>GLYPH<g81>GLYPH<g82>GLYPH<g90>GLYPH<g81>GLYPH<g3>", "bbox": {"l": 184.69221, "t": 406.31296, "r": 206.3858, "b": 411.95255, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "GLYPH<g86>GLYPH<g72>GLYPH<g85>GLYPH<g89>GLYPH<g76>GLYPH<g70>GLYPH<g72>GLYPH<g86>", "bbox": {"l": 206.07249, "t": 406.31296, "r": 228.24231000000003, "b": 411.95255, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "list_item", "bbox": {"l": 144.88921, "t": 421.1952800000001, "r": 234.25163000000003, "b": 434.66763, "coord_origin": "TOPLEFT"}, "confidence": 0.9440370798110962, "cells": [{"id": 69, "text": "GLYPH<g115>GLYPH<g3>", "bbox": {"l": 144.88921, "t": 421.99773999999996, "r": 148.68732, "b": 426.5799, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "GLYPH<g55>", "bbox": {"l": 151.9388, "t": 421.1952800000001, "r": 155.43533, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "GLYPH<g68>GLYPH<g78>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 154.73979, "t": 421.1952800000001, "r": 166.06282, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "GLYPH<g68>GLYPH<g71>GLYPH<g89>GLYPH<g68>GLYPH<g81>GLYPH<g87>GLYPH<g68>GLYPH<g74>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 165.74324, "t": 421.1952800000001, "r": 195.84607, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "GLYPH<g82>GLYPH<g73>GLYPH<g3>", "bbox": {"l": 195.53903, "t": 421.1952800000001, "r": 202.43185, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "GLYPH<g68>GLYPH<g70>GLYPH<g70>GLYPH<g72>GLYPH<g86>GLYPH<g86>GLYPH<g3>", "bbox": {"l": 202.10602, "t": 421.1952800000001, "r": 222.87220999999997, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "GLYPH<g87>GLYPH<g82>GLYPH<g3>", "bbox": {"l": 222.55890000000002, "t": 421.1952800000001, "r": 229.57077, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "GLYPH<g68> GLYPH<g3>", "bbox": {"l": 229.24492999999998, "t": 421.1952800000001, "r": 234.25163000000003, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "GLYPH<g90>GLYPH<g82>GLYPH<g85>GLYPH<g79>GLYPH<g71>GLYPH<g90>GLYPH<g76>GLYPH<g71>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 151.92627, "t": 429.02805, "r": 181.42754, "b": 434.66763, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "GLYPH<g86>GLYPH<g82>GLYPH<g88>GLYPH<g85>GLYPH<g70>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 181.1205, "t": 429.02805, "r": 201.07835, "b": 434.66763, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "GLYPH<g82>GLYPH<g73>GLYPH<g3>", "bbox": {"l": 200.76505, "t": 429.02805, "r": 207.65787, "b": 434.66763, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "GLYPH<g72>GLYPH<g91>GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g87>GLYPH<g76>GLYPH<g86>GLYPH<g72>", "bbox": {"l": 207.33203, "t": 429.02805, "r": 232.07098000000002, "b": 434.66763, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "picture", "bbox": {"l": 143.39866638183594, "t": 270.2610778808594, "r": 179.56256103515625, "b": 285.621337890625, "coord_origin": "TOPLEFT"}, "confidence": 0.7491768598556519, "cells": [], "children": []}, {"id": 15, "label": "picture", "bbox": {"l": 64.1669921875, "t": 603.50634765625, "r": 258.7742919921875, "b": 688.1282348632812, "coord_origin": "TOPLEFT"}, "confidence": 0.8925829529762268, "cells": [], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "text", "id": 26, "page_no": 2, "cluster": {"id": 26, "label": "text", "bbox": {"l": 64.800003, "t": 74.48395000000005, "r": 235.8624, "b": 85.58398, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 0, "text": "DB2 for i Center of Excellence", "bbox": {"l": 64.800003, "t": 74.48395000000005, "r": 235.8624, "b": 85.58398, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "DB2 for i Center of Excellence"}, {"label": "text", "id": 25, "page_no": 2, "cluster": {"id": 25, "label": "text", "bbox": {"l": 94.132698, "t": 138.45012999999994, "r": 233.99973, "b": 155.33642999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.7431555986404419, "cells": [{"id": 1, "text": "Solution Brief", "bbox": {"l": 94.132698, "t": 148.63933999999995, "r": 139.54634, "b": 155.33642999999995, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "IBM Systems Lab Services and Training", "bbox": {"l": 94.134933, "t": 138.45012999999994, "r": 233.99973, "b": 145.22162000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Solution Brief IBM Systems Lab Services and Training"}, {"label": "text", "id": 22, "page_no": 2, "cluster": {"id": 22, "label": "text", "bbox": {"l": 461.08859000000007, "t": 138.40752999999995, "r": 506.26178, "b": 145.42181000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.7798982858657837, "cells": [{"id": 3, "text": "Power Services", "bbox": {"l": 461.08859000000007, "t": 138.40752999999995, "r": 506.26178, "b": 145.42181000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Power Services"}, {"label": "section_header", "id": 23, "page_no": 2, "cluster": {"id": 23, "label": "section_header", "bbox": {"l": 280.24011, "t": 239.34265000000005, "r": 463.80942, "b": 276.62054, "coord_origin": "TOPLEFT"}, "confidence": 0.7587865591049194, "cells": [{"id": 4, "text": "DB2 for i", "bbox": {"l": 280.24011, "t": 239.34265000000005, "r": 354.57022, "b": 256.26153999999997, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Center of Excellence ", "bbox": {"l": 280.24011, "t": 259.70165999999995, "r": 463.80942, "b": 276.62054, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "DB2 for i Center of Excellence"}, {"label": "text", "id": 21, "page_no": 2, "cluster": {"id": 21, "label": "text", "bbox": {"l": 280.24011, "t": 277.59027000000003, "r": 483.29572, "b": 287.45959, "coord_origin": "TOPLEFT"}, "confidence": 0.7965622544288635, "cells": [{"id": 6, "text": "Expert help to achieve your business requirements", "bbox": {"l": 280.24011, "t": 277.59027000000003, "r": 483.29572, "b": 287.45959, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Expert help to achieve your business requirements"}, {"label": "section_header", "id": 16, "page_no": 2, "cluster": {"id": 16, "label": "section_header", "bbox": {"l": 280.24011, "t": 315.88161999999994, "r": 443.28210000000007, "b": 324.89566, "coord_origin": "TOPLEFT"}, "confidence": 0.8913541436195374, "cells": [{"id": 7, "text": "We build confident, satisfied clients", "bbox": {"l": 280.24011, "t": 315.88161999999994, "r": 443.28210000000007, "b": 324.89566, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "We build confident, satisfied clients"}, {"label": "text", "id": 3, "page_no": 2, "cluster": {"id": 3, "label": "text", "bbox": {"l": 280.24011, "t": 327.37595, "r": 488.15466, "b": 344.9595, "coord_origin": "TOPLEFT"}, "confidence": 0.9560741782188416, "cells": [{"id": 8, "text": "No one else has the vast consulting experiences, skills sharing and ", "bbox": {"l": 280.24011, "t": 327.37595, "r": 488.15466, "b": 334.77994, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "renown service offerings to do what we can do for you.", "bbox": {"l": 280.24011, "t": 337.55551, "r": 452.34018, "b": 344.9595, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "No one else has the vast consulting experiences, skills sharing and renown service offerings to do what we can do for you."}, {"label": "text", "id": 20, "page_no": 2, "cluster": {"id": 20, "label": "text", "bbox": {"l": 280.24011, "t": 357.3260200000001, "r": 367.86023, "b": 364.73001, "coord_origin": "TOPLEFT"}, "confidence": 0.8260757923126221, "cells": [{"id": 10, "text": "Because no one else is IBM.", "bbox": {"l": 280.24011, "t": 357.3260200000001, "r": 367.86023, "b": 364.73001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Because no one else is IBM."}, {"label": "text", "id": 0, "page_no": 2, "cluster": {"id": 0, "label": "text", "bbox": {"l": 280.24011, "t": 377.09801999999996, "r": 500.32104000000004, "b": 425.22027999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9764723181724548, "cells": [{"id": 11, "text": "With combined experiences and direct access to development groups, ", "bbox": {"l": 280.24011, "t": 377.09801999999996, "r": 500.32104000000004, "b": 384.50201, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "we\u2019re the experts in IBM DB2\u00ae for i. The DB2 for i Center of ", "bbox": {"l": 280.24011, "t": 387.27759, "r": 479.25497, "b": 394.68158, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Excellence (CoE) can help you achieve-perhaps reexamine and ", "bbox": {"l": 280.24011, "t": 397.45715, "r": 483.4667400000001, "b": 404.86115, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "exceed-your business requirements and gain more confidence and ", "bbox": {"l": 280.24011, "t": 407.63672, "r": 492.97656, "b": 415.04071000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "satisfaction in IBM product data management products and solutions.", "bbox": {"l": 280.24011, "t": 417.81628, "r": 498.87, "b": 425.22027999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "With combined experiences and direct access to development groups, we\u2019re the experts in IBM DB2\u00ae for i. The DB2 for i Center of Excellence (CoE) can help you achieve-perhaps reexamine and exceed-your business requirements and gain more confidence and satisfaction in IBM product data management products and solutions."}, {"label": "section_header", "id": 18, "page_no": 2, "cluster": {"id": 18, "label": "section_header", "bbox": {"l": 280.24011, "t": 437.85403, "r": 434.83205999999996, "b": 446.86807, "coord_origin": "TOPLEFT"}, "confidence": 0.8492127060890198, "cells": [{"id": 16, "text": "Who we are, some of what we do", "bbox": {"l": 280.24011, "t": 437.85403, "r": 434.83205999999996, "b": 446.86807, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Who we are, some of what we do"}, {"label": "text", "id": 19, "page_no": 2, "cluster": {"id": 19, "label": "text", "bbox": {"l": 280.24011, "t": 449.34824000000003, "r": 434.56316999999996, "b": 456.75223, "coord_origin": "TOPLEFT"}, "confidence": 0.8440335392951965, "cells": [{"id": 17, "text": "Global CoE engagements cover topics including:", "bbox": {"l": 280.24011, "t": 449.34824000000003, "r": 434.56316999999996, "b": 456.75223, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Global CoE engagements cover topics including:"}, {"label": "list_item", "id": 8, "page_no": 2, "cluster": {"id": 8, "label": "list_item", "bbox": {"l": 280.24011, "t": 469.11826, "r": 401.56412, "b": 476.52225, "coord_origin": "TOPLEFT"}, "confidence": 0.9239600896835327, "cells": [{"id": 18, "text": "r ", "bbox": {"l": 280.24011, "t": 470.95236, "r": 284.0993, "b": 476.16074, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Database performance and scalability", "bbox": {"l": 287.28961, "t": 469.11826, "r": 401.56412, "b": 476.52225, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "r Database performance and scalability"}, {"label": "list_item", "id": 7, "page_no": 2, "cluster": {"id": 7, "label": "list_item", "bbox": {"l": 280.24011, "t": 479.30096, "r": 424.99646, "b": 486.70496, "coord_origin": "TOPLEFT"}, "confidence": 0.9239721298217773, "cells": [{"id": 20, "text": "r ", "bbox": {"l": 280.24011, "t": 481.13507, "r": 284.0993, "b": 486.34344, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Advanced SQL knowledge and skills transfer", "bbox": {"l": 287.28961, "t": 479.30096, "r": 424.99646, "b": 486.70496, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "r Advanced SQL knowledge and skills transfer"}, {"label": "list_item", "id": 10, "page_no": 2, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 280.24011, "t": 489.48355, "r": 392.15845, "b": 496.88754, "coord_origin": "TOPLEFT"}, "confidence": 0.9157900214195251, "cells": [{"id": 22, "text": "r ", "bbox": {"l": 280.24011, "t": 491.31766, "r": 284.0993, "b": 496.52603, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Business intelligence and analytics", "bbox": {"l": 287.28961, "t": 489.48355, "r": 392.15845, "b": 496.88754, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "r Business intelligence and analytics"}, {"label": "list_item", "id": 17, "page_no": 2, "cluster": {"id": 17, "label": "list_item", "bbox": {"l": 280.24011, "t": 499.66626, "r": 339.94354, "b": 507.07025, "coord_origin": "TOPLEFT"}, "confidence": 0.8733457326889038, "cells": [{"id": 24, "text": "r ", "bbox": {"l": 280.24011, "t": 501.50037, "r": 284.0993, "b": 506.70874, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "DB2 Web Query", "bbox": {"l": 287.28961, "t": 499.66626, "r": 339.94354, "b": 507.07025, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "r DB2 Web Query"}, {"label": "list_item", "id": 6, "page_no": 2, "cluster": {"id": 6, "label": "list_item", "bbox": {"l": 280.24011, "t": 509.84885, "r": 504.19314999999995, "b": 517.25284, "coord_origin": "TOPLEFT"}, "confidence": 0.9249242544174194, "cells": [{"id": 26, "text": "r ", "bbox": {"l": 280.24011, "t": 511.68295, "r": 284.0993, "b": 516.8913299999999, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Query/400 modernization for better reporting and analysis capabilities", "bbox": {"l": 287.28961, "t": 509.84885, "r": 504.19314999999995, "b": 517.25284, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "r Query/400 modernization for better reporting and analysis capabilities"}, {"label": "list_item", "id": 11, "page_no": 2, "cluster": {"id": 11, "label": "list_item", "bbox": {"l": 280.24011, "t": 520.03156, "r": 423.0022, "b": 527.4355499999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9109312891960144, "cells": [{"id": 28, "text": "r ", "bbox": {"l": 280.24011, "t": 521.8656599999999, "r": 284.0993, "b": 527.07404, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Database modernization and re-engineering", "bbox": {"l": 287.28961, "t": 520.03156, "r": 423.0022, "b": 527.4355499999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "r Database modernization and re-engineering"}, {"label": "list_item", "id": 14, "page_no": 2, "cluster": {"id": 14, "label": "list_item", "bbox": {"l": 280.24011, "t": 530.21414, "r": 399.65173, "b": 537.61813, "coord_origin": "TOPLEFT"}, "confidence": 0.8977466225624084, "cells": [{"id": 30, "text": "r ", "bbox": {"l": 280.24011, "t": 532.04825, "r": 284.0993, "b": 537.2566400000001, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Data-centric architecture and design", "bbox": {"l": 287.28961, "t": 530.21414, "r": 399.65173, "b": 537.61813, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "r Data-centric architecture and design"}, {"label": "list_item", "id": 9, "page_no": 2, "cluster": {"id": 9, "label": "list_item", "bbox": {"l": 280.24011, "t": 540.39674, "r": 466.77881, "b": 547.80074, "coord_origin": "TOPLEFT"}, "confidence": 0.9218331575393677, "cells": [{"id": 32, "text": "r ", "bbox": {"l": 280.24011, "t": 542.23083, "r": 284.0993, "b": 547.43924, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "Extremely large database and overcoming limits to growth", "bbox": {"l": 287.28961, "t": 540.39674, "r": 466.77881, "b": 547.80074, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "r Extremely large database and overcoming limits to growth"}, {"label": "list_item", "id": 13, "page_no": 2, "cluster": {"id": 13, "label": "list_item", "bbox": {"l": 280.24011, "t": 550.5794500000001, "r": 382.20956, "b": 557.98344, "coord_origin": "TOPLEFT"}, "confidence": 0.9075438976287842, "cells": [{"id": 34, "text": "r ", "bbox": {"l": 280.24011, "t": 552.41354, "r": 284.0993, "b": 557.62195, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "ISV education and enablement", "bbox": {"l": 287.28961, "t": 550.5794500000001, "r": 382.20956, "b": 557.98344, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "r ISV education and enablement"}, {"label": "section_header", "id": 12, "page_no": 2, "cluster": {"id": 12, "label": "section_header", "bbox": {"l": 144.88921, "t": 327.46163999999993, "r": 188.74681, "b": 336.81406, "coord_origin": "TOPLEFT"}, "confidence": 0.9098502993583679, "cells": [{"id": 36, "text": "Highlights ", "bbox": {"l": 144.88921, "t": 327.46163999999993, "r": 188.74681, "b": 336.81406, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Highlights"}, {"label": "list_item", "id": 2, "page_no": 2, "cluster": {"id": 2, "label": "list_item", "bbox": {"l": 144.88921, "t": 345.21707, "r": 242.87389000000002, "b": 358.68942, "coord_origin": "TOPLEFT"}, "confidence": 0.957169771194458, "cells": [{"id": 37, "text": "GLYPH<g115>GLYPH<g3>", "bbox": {"l": 144.88921, "t": 346.01953, "r": 148.68732, "b": 350.60168, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "GLYPH<g40>GLYPH<g81>GLYPH<g75>GLYPH<g68>GLYPH<g81>GLYPH<g70>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 151.9388, "t": 345.21707, "r": 177.25424, "b": 350.85666, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "GLYPH<g87>GLYPH<g75>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 176.9472, "t": 345.21707, "r": 187.11098, "b": 350.85666, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g73>GLYPH<g82>GLYPH<g85>GLYPH<g80>GLYPH<g68>GLYPH<g81>GLYPH<g70>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 186.7914, "t": 345.21707, "r": 222.95989999999998, "b": 350.85666, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "GLYPH<g82>GLYPH<g73>GLYPH<g3>", "bbox": {"l": 222.65912, "t": 345.21707, "r": 229.55193999999997, "b": 350.85666, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "GLYPH<g92>GLYPH<g82>GLYPH<g88>GLYPH<g85> GLYPH<g3>", "bbox": {"l": 229.2261, "t": 345.21707, "r": 242.87389000000002, "b": 350.85666, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "GLYPH<g71>GLYPH<g68>GLYPH<g87>GLYPH<g68>GLYPH<g69>GLYPH<g68>GLYPH<g86>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 151.93253, "t": 353.04984, "r": 178.77066, "b": 358.68942, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "GLYPH<g82>GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g68>GLYPH<g87>GLYPH<g76>GLYPH<g82>GLYPH<g81>GLYPH<g86>", "bbox": {"l": 178.46362, "t": 353.04984, "r": 207.16908, "b": 358.68942, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<g115>GLYPH<g3> GLYPH<g40>GLYPH<g81>GLYPH<g75>GLYPH<g68>GLYPH<g81>GLYPH<g70>GLYPH<g72>GLYPH<g3> GLYPH<g87>GLYPH<g75>GLYPH<g72>GLYPH<g3> GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g73>GLYPH<g82>GLYPH<g85>GLYPH<g80>GLYPH<g68>GLYPH<g81>GLYPH<g70>GLYPH<g72>GLYPH<g3> GLYPH<g82>GLYPH<g73>GLYPH<g3> GLYPH<g92>GLYPH<g82>GLYPH<g88>GLYPH<g85> GLYPH<g3> GLYPH<g71>GLYPH<g68>GLYPH<g87>GLYPH<g68>GLYPH<g69>GLYPH<g68>GLYPH<g86>GLYPH<g72>GLYPH<g3> GLYPH<g82>GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g68>GLYPH<g87>GLYPH<g76>GLYPH<g82>GLYPH<g81>GLYPH<g86>"}, {"label": "list_item", "id": 1, "page_no": 2, "cluster": {"id": 1, "label": "list_item", "bbox": {"l": 144.88921, "t": 367.93219, "r": 259.2287, "b": 389.2373, "coord_origin": "TOPLEFT"}, "confidence": 0.9634580612182617, "cells": [{"id": 45, "text": "GLYPH<g115>GLYPH<g3>", "bbox": {"l": 144.88921, "t": 368.73465, "r": 148.68732, "b": 373.3168, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "GLYPH<g40>GLYPH<g68>GLYPH<g85> GLYPH<g81>GLYPH<g3>", "bbox": {"l": 151.9388, "t": 367.93219, "r": 166.05655, "b": 373.57178, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "GLYPH<g74>GLYPH<g85>GLYPH<g72>GLYPH<g68>GLYPH<g87>GLYPH<g72>GLYPH<g85>GLYPH<g3>", "bbox": {"l": 165.73697, "t": 367.93219, "r": 186.40289, "b": 373.57178, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "GLYPH<g85>GLYPH<g72>GLYPH<g87>GLYPH<g88>GLYPH<g85> GLYPH<g81>GLYPH<g3>", "bbox": {"l": 186.09586, "t": 367.93219, "r": 203.61617, "b": 373.57178, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "GLYPH<g82>GLYPH<g81>GLYPH<g3>", "bbox": {"l": 203.30286, "t": 367.93219, "r": 211.82489, "b": 373.57178, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "GLYPH<g44>GLYPH<g55>GLYPH<g3>", "bbox": {"l": 211.49905, "t": 367.93219, "r": 218.16002, "b": 373.57178, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "GLYPH<g83>GLYPH<g85>GLYPH<g82>GLYPH<g77>GLYPH<g72>GLYPH<g70>GLYPH<g87>GLYPH<g86> GLYPH<g3>", "bbox": {"l": 217.83418, "t": 367.93219, "r": 241.30737, "b": 373.57178, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "GLYPH<g87>GLYPH<g75>GLYPH<g85>GLYPH<g82>GLYPH<g88>GLYPH<g74>GLYPH<g75>GLYPH<g3>", "bbox": {"l": 151.93253, "t": 375.76495, "r": 174.46577, "b": 381.40454, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "GLYPH<g80>GLYPH<g82>GLYPH<g71>GLYPH<g72>GLYPH<g85> GLYPH<g81>GLYPH<g76>GLYPH<g93>GLYPH<g68>GLYPH<g87>GLYPH<g76>GLYPH<g82>GLYPH<g81>GLYPH<g3>", "bbox": {"l": 174.15874, "t": 375.76495, "r": 214.4128, "b": 381.40454, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "GLYPH<g82>GLYPH<g73>GLYPH<g3>", "bbox": {"l": 214.11829, "t": 375.76495, "r": 221.01110999999997, "b": 381.40454, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "GLYPH<g71>GLYPH<g68>GLYPH<g87>GLYPH<g68>GLYPH<g69>GLYPH<g68>GLYPH<g86>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 220.68527, "t": 375.76495, "r": 247.52341000000004, "b": 381.40454, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "GLYPH<g68>GLYPH<g81>GLYPH<g71> GLYPH<g3>", "bbox": {"l": 247.21637, "t": 375.76495, "r": 259.2287, "b": 381.40454, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "GLYPH<g68>GLYPH<g83>GLYPH<g83>GLYPH<g79>GLYPH<g76>GLYPH<g70>GLYPH<g68>GLYPH<g87>GLYPH<g76>GLYPH<g82>GLYPH<g81>GLYPH<g86>", "bbox": {"l": 151.93253, "t": 383.59772, "r": 184.61703, "b": 389.2373, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<g115>GLYPH<g3> GLYPH<g40>GLYPH<g68>GLYPH<g85> GLYPH<g81>GLYPH<g3> GLYPH<g74>GLYPH<g85>GLYPH<g72>GLYPH<g68>GLYPH<g87>GLYPH<g72>GLYPH<g85>GLYPH<g3> GLYPH<g85>GLYPH<g72>GLYPH<g87>GLYPH<g88>GLYPH<g85> GLYPH<g81>GLYPH<g3> GLYPH<g82>GLYPH<g81>GLYPH<g3> GLYPH<g44>GLYPH<g55>GLYPH<g3> GLYPH<g83>GLYPH<g85>GLYPH<g82>GLYPH<g77>GLYPH<g72>GLYPH<g70>GLYPH<g87>GLYPH<g86> GLYPH<g3> GLYPH<g87>GLYPH<g75>GLYPH<g85>GLYPH<g82>GLYPH<g88>GLYPH<g74>GLYPH<g75>GLYPH<g3> GLYPH<g80>GLYPH<g82>GLYPH<g71>GLYPH<g72>GLYPH<g85> GLYPH<g81>GLYPH<g76>GLYPH<g93>GLYPH<g68>GLYPH<g87>GLYPH<g76>GLYPH<g82>GLYPH<g81>GLYPH<g3> GLYPH<g82>GLYPH<g73>GLYPH<g3> GLYPH<g71>GLYPH<g68>GLYPH<g87>GLYPH<g68>GLYPH<g69>GLYPH<g68>GLYPH<g86>GLYPH<g72>GLYPH<g3> GLYPH<g68>GLYPH<g81>GLYPH<g71> GLYPH<g3> GLYPH<g68>GLYPH<g83>GLYPH<g83>GLYPH<g79>GLYPH<g76>GLYPH<g70>GLYPH<g68>GLYPH<g87>GLYPH<g76>GLYPH<g82>GLYPH<g81>GLYPH<g86>"}, {"label": "list_item", "id": 4, "page_no": 2, "cluster": {"id": 4, "label": "list_item", "bbox": {"l": 144.88921, "t": 398.48019, "r": 249.83562, "b": 411.95255, "coord_origin": "TOPLEFT"}, "confidence": 0.9541196823120117, "cells": [{"id": 58, "text": "GLYPH<g115>GLYPH<g3>", "bbox": {"l": 144.88921, "t": 399.28265, "r": 148.68732, "b": 403.86481000000003, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "GLYPH<g53>GLYPH<g72>GLYPH<g79>GLYPH<g92>GLYPH<g3>", "bbox": {"l": 151.9388, "t": 398.48019, "r": 165.36099, "b": 404.11978, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "GLYPH<g82>GLYPH<g81>GLYPH<g3>", "bbox": {"l": 165.04141, "t": 398.48019, "r": 173.56345, "b": 404.11978, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "GLYPH<g44>GLYPH<g37>GLYPH<g48>GLYPH<g3>", "bbox": {"l": 173.23761, "t": 398.48019, "r": 185.95174, "b": 404.11978, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "GLYPH<g72>GLYPH<g91>GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g87>GLYPH<g3>", "bbox": {"l": 185.63216, "t": 398.48019, "r": 204.42448, "b": 404.11978, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "GLYPH<g70>GLYPH<g82>GLYPH<g81>GLYPH<g86>GLYPH<g88>GLYPH<g79>GLYPH<g87>GLYPH<g76>GLYPH<g81>GLYPH<g74>GLYPH<g15>GLYPH<g3>", "bbox": {"l": 204.11118, "t": 398.48019, "r": 235.29178, "b": 404.11978, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "GLYPH<g86>GLYPH<g78>GLYPH<g76>GLYPH<g79>GLYPH<g79>GLYPH<g86> GLYPH<g3>", "bbox": {"l": 234.99099999999999, "t": 398.48019, "r": 249.83562, "b": 404.11978, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "GLYPH<g86>GLYPH<g75>GLYPH<g68>GLYPH<g85>GLYPH<g76>GLYPH<g81>GLYPH<g74>GLYPH<g3>", "bbox": {"l": 151.93253, "t": 406.31296, "r": 173.41306, "b": 411.95255, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "GLYPH<g68>GLYPH<g81>GLYPH<g71>GLYPH<g3>", "bbox": {"l": 173.10602, "t": 406.31296, "r": 185.0118, "b": 411.95255, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "GLYPH<g85>GLYPH<g72>GLYPH<g81>GLYPH<g82>GLYPH<g90>GLYPH<g81>GLYPH<g3>", "bbox": {"l": 184.69221, "t": 406.31296, "r": 206.3858, "b": 411.95255, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "GLYPH<g86>GLYPH<g72>GLYPH<g85>GLYPH<g89>GLYPH<g76>GLYPH<g70>GLYPH<g72>GLYPH<g86>", "bbox": {"l": 206.07249, "t": 406.31296, "r": 228.24231000000003, "b": 411.95255, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<g115>GLYPH<g3> GLYPH<g53>GLYPH<g72>GLYPH<g79>GLYPH<g92>GLYPH<g3> GLYPH<g82>GLYPH<g81>GLYPH<g3> GLYPH<g44>GLYPH<g37>GLYPH<g48>GLYPH<g3> GLYPH<g72>GLYPH<g91>GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g87>GLYPH<g3> GLYPH<g70>GLYPH<g82>GLYPH<g81>GLYPH<g86>GLYPH<g88>GLYPH<g79>GLYPH<g87>GLYPH<g76>GLYPH<g81>GLYPH<g74>GLYPH<g15>GLYPH<g3> GLYPH<g86>GLYPH<g78>GLYPH<g76>GLYPH<g79>GLYPH<g79>GLYPH<g86> GLYPH<g3> GLYPH<g86>GLYPH<g75>GLYPH<g68>GLYPH<g85>GLYPH<g76>GLYPH<g81>GLYPH<g74>GLYPH<g3> GLYPH<g68>GLYPH<g81>GLYPH<g71>GLYPH<g3> GLYPH<g85>GLYPH<g72>GLYPH<g81>GLYPH<g82>GLYPH<g90>GLYPH<g81>GLYPH<g3> GLYPH<g86>GLYPH<g72>GLYPH<g85>GLYPH<g89>GLYPH<g76>GLYPH<g70>GLYPH<g72>GLYPH<g86>"}, {"label": "list_item", "id": 5, "page_no": 2, "cluster": {"id": 5, "label": "list_item", "bbox": {"l": 144.88921, "t": 421.1952800000001, "r": 234.25163000000003, "b": 434.66763, "coord_origin": "TOPLEFT"}, "confidence": 0.9440370798110962, "cells": [{"id": 69, "text": "GLYPH<g115>GLYPH<g3>", "bbox": {"l": 144.88921, "t": 421.99773999999996, "r": 148.68732, "b": 426.5799, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "GLYPH<g55>", "bbox": {"l": 151.9388, "t": 421.1952800000001, "r": 155.43533, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "GLYPH<g68>GLYPH<g78>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 154.73979, "t": 421.1952800000001, "r": 166.06282, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "GLYPH<g68>GLYPH<g71>GLYPH<g89>GLYPH<g68>GLYPH<g81>GLYPH<g87>GLYPH<g68>GLYPH<g74>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 165.74324, "t": 421.1952800000001, "r": 195.84607, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "GLYPH<g82>GLYPH<g73>GLYPH<g3>", "bbox": {"l": 195.53903, "t": 421.1952800000001, "r": 202.43185, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "GLYPH<g68>GLYPH<g70>GLYPH<g70>GLYPH<g72>GLYPH<g86>GLYPH<g86>GLYPH<g3>", "bbox": {"l": 202.10602, "t": 421.1952800000001, "r": 222.87220999999997, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "GLYPH<g87>GLYPH<g82>GLYPH<g3>", "bbox": {"l": 222.55890000000002, "t": 421.1952800000001, "r": 229.57077, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "GLYPH<g68> GLYPH<g3>", "bbox": {"l": 229.24492999999998, "t": 421.1952800000001, "r": 234.25163000000003, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "GLYPH<g90>GLYPH<g82>GLYPH<g85>GLYPH<g79>GLYPH<g71>GLYPH<g90>GLYPH<g76>GLYPH<g71>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 151.92627, "t": 429.02805, "r": 181.42754, "b": 434.66763, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "GLYPH<g86>GLYPH<g82>GLYPH<g88>GLYPH<g85>GLYPH<g70>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 181.1205, "t": 429.02805, "r": 201.07835, "b": 434.66763, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "GLYPH<g82>GLYPH<g73>GLYPH<g3>", "bbox": {"l": 200.76505, "t": 429.02805, "r": 207.65787, "b": 434.66763, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "GLYPH<g72>GLYPH<g91>GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g87>GLYPH<g76>GLYPH<g86>GLYPH<g72>", "bbox": {"l": 207.33203, "t": 429.02805, "r": 232.07098000000002, "b": 434.66763, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<g115>GLYPH<g3> GLYPH<g55> GLYPH<g68>GLYPH<g78>GLYPH<g72>GLYPH<g3> GLYPH<g68>GLYPH<g71>GLYPH<g89>GLYPH<g68>GLYPH<g81>GLYPH<g87>GLYPH<g68>GLYPH<g74>GLYPH<g72>GLYPH<g3> GLYPH<g82>GLYPH<g73>GLYPH<g3> GLYPH<g68>GLYPH<g70>GLYPH<g70>GLYPH<g72>GLYPH<g86>GLYPH<g86>GLYPH<g3> GLYPH<g87>GLYPH<g82>GLYPH<g3> GLYPH<g68> GLYPH<g3> GLYPH<g90>GLYPH<g82>GLYPH<g85>GLYPH<g79>GLYPH<g71>GLYPH<g90>GLYPH<g76>GLYPH<g71>GLYPH<g72>GLYPH<g3> GLYPH<g86>GLYPH<g82>GLYPH<g88>GLYPH<g85>GLYPH<g70>GLYPH<g72>GLYPH<g3> GLYPH<g82>GLYPH<g73>GLYPH<g3> GLYPH<g72>GLYPH<g91>GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g87>GLYPH<g76>GLYPH<g86>GLYPH<g72>"}, {"label": "picture", "id": 24, "page_no": 2, "cluster": {"id": 24, "label": "picture", "bbox": {"l": 143.39866638183594, "t": 270.2610778808594, "r": 179.56256103515625, "b": 285.621337890625, "coord_origin": "TOPLEFT"}, "confidence": 0.7491768598556519, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "picture", "id": 15, "page_no": 2, "cluster": {"id": 15, "label": "picture", "bbox": {"l": 64.1669921875, "t": 603.50634765625, "r": 258.7742919921875, "b": 688.1282348632812, "coord_origin": "TOPLEFT"}, "confidence": 0.8925829529762268, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "body": [{"label": "text", "id": 26, "page_no": 2, "cluster": {"id": 26, "label": "text", "bbox": {"l": 64.800003, "t": 74.48395000000005, "r": 235.8624, "b": 85.58398, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 0, "text": "DB2 for i Center of Excellence", "bbox": {"l": 64.800003, "t": 74.48395000000005, "r": 235.8624, "b": 85.58398, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "DB2 for i Center of Excellence"}, {"label": "text", "id": 25, "page_no": 2, "cluster": {"id": 25, "label": "text", "bbox": {"l": 94.132698, "t": 138.45012999999994, "r": 233.99973, "b": 155.33642999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.7431555986404419, "cells": [{"id": 1, "text": "Solution Brief", "bbox": {"l": 94.132698, "t": 148.63933999999995, "r": 139.54634, "b": 155.33642999999995, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "IBM Systems Lab Services and Training", "bbox": {"l": 94.134933, "t": 138.45012999999994, "r": 233.99973, "b": 145.22162000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Solution Brief IBM Systems Lab Services and Training"}, {"label": "text", "id": 22, "page_no": 2, "cluster": {"id": 22, "label": "text", "bbox": {"l": 461.08859000000007, "t": 138.40752999999995, "r": 506.26178, "b": 145.42181000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.7798982858657837, "cells": [{"id": 3, "text": "Power Services", "bbox": {"l": 461.08859000000007, "t": 138.40752999999995, "r": 506.26178, "b": 145.42181000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Power Services"}, {"label": "section_header", "id": 23, "page_no": 2, "cluster": {"id": 23, "label": "section_header", "bbox": {"l": 280.24011, "t": 239.34265000000005, "r": 463.80942, "b": 276.62054, "coord_origin": "TOPLEFT"}, "confidence": 0.7587865591049194, "cells": [{"id": 4, "text": "DB2 for i", "bbox": {"l": 280.24011, "t": 239.34265000000005, "r": 354.57022, "b": 256.26153999999997, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Center of Excellence ", "bbox": {"l": 280.24011, "t": 259.70165999999995, "r": 463.80942, "b": 276.62054, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "DB2 for i Center of Excellence"}, {"label": "text", "id": 21, "page_no": 2, "cluster": {"id": 21, "label": "text", "bbox": {"l": 280.24011, "t": 277.59027000000003, "r": 483.29572, "b": 287.45959, "coord_origin": "TOPLEFT"}, "confidence": 0.7965622544288635, "cells": [{"id": 6, "text": "Expert help to achieve your business requirements", "bbox": {"l": 280.24011, "t": 277.59027000000003, "r": 483.29572, "b": 287.45959, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Expert help to achieve your business requirements"}, {"label": "section_header", "id": 16, "page_no": 2, "cluster": {"id": 16, "label": "section_header", "bbox": {"l": 280.24011, "t": 315.88161999999994, "r": 443.28210000000007, "b": 324.89566, "coord_origin": "TOPLEFT"}, "confidence": 0.8913541436195374, "cells": [{"id": 7, "text": "We build confident, satisfied clients", "bbox": {"l": 280.24011, "t": 315.88161999999994, "r": 443.28210000000007, "b": 324.89566, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "We build confident, satisfied clients"}, {"label": "text", "id": 3, "page_no": 2, "cluster": {"id": 3, "label": "text", "bbox": {"l": 280.24011, "t": 327.37595, "r": 488.15466, "b": 344.9595, "coord_origin": "TOPLEFT"}, "confidence": 0.9560741782188416, "cells": [{"id": 8, "text": "No one else has the vast consulting experiences, skills sharing and ", "bbox": {"l": 280.24011, "t": 327.37595, "r": 488.15466, "b": 334.77994, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "renown service offerings to do what we can do for you.", "bbox": {"l": 280.24011, "t": 337.55551, "r": 452.34018, "b": 344.9595, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "No one else has the vast consulting experiences, skills sharing and renown service offerings to do what we can do for you."}, {"label": "text", "id": 20, "page_no": 2, "cluster": {"id": 20, "label": "text", "bbox": {"l": 280.24011, "t": 357.3260200000001, "r": 367.86023, "b": 364.73001, "coord_origin": "TOPLEFT"}, "confidence": 0.8260757923126221, "cells": [{"id": 10, "text": "Because no one else is IBM.", "bbox": {"l": 280.24011, "t": 357.3260200000001, "r": 367.86023, "b": 364.73001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Because no one else is IBM."}, {"label": "text", "id": 0, "page_no": 2, "cluster": {"id": 0, "label": "text", "bbox": {"l": 280.24011, "t": 377.09801999999996, "r": 500.32104000000004, "b": 425.22027999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9764723181724548, "cells": [{"id": 11, "text": "With combined experiences and direct access to development groups, ", "bbox": {"l": 280.24011, "t": 377.09801999999996, "r": 500.32104000000004, "b": 384.50201, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "we\u2019re the experts in IBM DB2\u00ae for i. The DB2 for i Center of ", "bbox": {"l": 280.24011, "t": 387.27759, "r": 479.25497, "b": 394.68158, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Excellence (CoE) can help you achieve-perhaps reexamine and ", "bbox": {"l": 280.24011, "t": 397.45715, "r": 483.4667400000001, "b": 404.86115, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "exceed-your business requirements and gain more confidence and ", "bbox": {"l": 280.24011, "t": 407.63672, "r": 492.97656, "b": 415.04071000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "satisfaction in IBM product data management products and solutions.", "bbox": {"l": 280.24011, "t": 417.81628, "r": 498.87, "b": 425.22027999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "With combined experiences and direct access to development groups, we\u2019re the experts in IBM DB2\u00ae for i. The DB2 for i Center of Excellence (CoE) can help you achieve-perhaps reexamine and exceed-your business requirements and gain more confidence and satisfaction in IBM product data management products and solutions."}, {"label": "section_header", "id": 18, "page_no": 2, "cluster": {"id": 18, "label": "section_header", "bbox": {"l": 280.24011, "t": 437.85403, "r": 434.83205999999996, "b": 446.86807, "coord_origin": "TOPLEFT"}, "confidence": 0.8492127060890198, "cells": [{"id": 16, "text": "Who we are, some of what we do", "bbox": {"l": 280.24011, "t": 437.85403, "r": 434.83205999999996, "b": 446.86807, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Who we are, some of what we do"}, {"label": "text", "id": 19, "page_no": 2, "cluster": {"id": 19, "label": "text", "bbox": {"l": 280.24011, "t": 449.34824000000003, "r": 434.56316999999996, "b": 456.75223, "coord_origin": "TOPLEFT"}, "confidence": 0.8440335392951965, "cells": [{"id": 17, "text": "Global CoE engagements cover topics including:", "bbox": {"l": 280.24011, "t": 449.34824000000003, "r": 434.56316999999996, "b": 456.75223, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Global CoE engagements cover topics including:"}, {"label": "list_item", "id": 8, "page_no": 2, "cluster": {"id": 8, "label": "list_item", "bbox": {"l": 280.24011, "t": 469.11826, "r": 401.56412, "b": 476.52225, "coord_origin": "TOPLEFT"}, "confidence": 0.9239600896835327, "cells": [{"id": 18, "text": "r ", "bbox": {"l": 280.24011, "t": 470.95236, "r": 284.0993, "b": 476.16074, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Database performance and scalability", "bbox": {"l": 287.28961, "t": 469.11826, "r": 401.56412, "b": 476.52225, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "r Database performance and scalability"}, {"label": "list_item", "id": 7, "page_no": 2, "cluster": {"id": 7, "label": "list_item", "bbox": {"l": 280.24011, "t": 479.30096, "r": 424.99646, "b": 486.70496, "coord_origin": "TOPLEFT"}, "confidence": 0.9239721298217773, "cells": [{"id": 20, "text": "r ", "bbox": {"l": 280.24011, "t": 481.13507, "r": 284.0993, "b": 486.34344, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Advanced SQL knowledge and skills transfer", "bbox": {"l": 287.28961, "t": 479.30096, "r": 424.99646, "b": 486.70496, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "r Advanced SQL knowledge and skills transfer"}, {"label": "list_item", "id": 10, "page_no": 2, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 280.24011, "t": 489.48355, "r": 392.15845, "b": 496.88754, "coord_origin": "TOPLEFT"}, "confidence": 0.9157900214195251, "cells": [{"id": 22, "text": "r ", "bbox": {"l": 280.24011, "t": 491.31766, "r": 284.0993, "b": 496.52603, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Business intelligence and analytics", "bbox": {"l": 287.28961, "t": 489.48355, "r": 392.15845, "b": 496.88754, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "r Business intelligence and analytics"}, {"label": "list_item", "id": 17, "page_no": 2, "cluster": {"id": 17, "label": "list_item", "bbox": {"l": 280.24011, "t": 499.66626, "r": 339.94354, "b": 507.07025, "coord_origin": "TOPLEFT"}, "confidence": 0.8733457326889038, "cells": [{"id": 24, "text": "r ", "bbox": {"l": 280.24011, "t": 501.50037, "r": 284.0993, "b": 506.70874, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "DB2 Web Query", "bbox": {"l": 287.28961, "t": 499.66626, "r": 339.94354, "b": 507.07025, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "r DB2 Web Query"}, {"label": "list_item", "id": 6, "page_no": 2, "cluster": {"id": 6, "label": "list_item", "bbox": {"l": 280.24011, "t": 509.84885, "r": 504.19314999999995, "b": 517.25284, "coord_origin": "TOPLEFT"}, "confidence": 0.9249242544174194, "cells": [{"id": 26, "text": "r ", "bbox": {"l": 280.24011, "t": 511.68295, "r": 284.0993, "b": 516.8913299999999, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Query/400 modernization for better reporting and analysis capabilities", "bbox": {"l": 287.28961, "t": 509.84885, "r": 504.19314999999995, "b": 517.25284, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "r Query/400 modernization for better reporting and analysis capabilities"}, {"label": "list_item", "id": 11, "page_no": 2, "cluster": {"id": 11, "label": "list_item", "bbox": {"l": 280.24011, "t": 520.03156, "r": 423.0022, "b": 527.4355499999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9109312891960144, "cells": [{"id": 28, "text": "r ", "bbox": {"l": 280.24011, "t": 521.8656599999999, "r": 284.0993, "b": 527.07404, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Database modernization and re-engineering", "bbox": {"l": 287.28961, "t": 520.03156, "r": 423.0022, "b": 527.4355499999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "r Database modernization and re-engineering"}, {"label": "list_item", "id": 14, "page_no": 2, "cluster": {"id": 14, "label": "list_item", "bbox": {"l": 280.24011, "t": 530.21414, "r": 399.65173, "b": 537.61813, "coord_origin": "TOPLEFT"}, "confidence": 0.8977466225624084, "cells": [{"id": 30, "text": "r ", "bbox": {"l": 280.24011, "t": 532.04825, "r": 284.0993, "b": 537.2566400000001, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Data-centric architecture and design", "bbox": {"l": 287.28961, "t": 530.21414, "r": 399.65173, "b": 537.61813, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "r Data-centric architecture and design"}, {"label": "list_item", "id": 9, "page_no": 2, "cluster": {"id": 9, "label": "list_item", "bbox": {"l": 280.24011, "t": 540.39674, "r": 466.77881, "b": 547.80074, "coord_origin": "TOPLEFT"}, "confidence": 0.9218331575393677, "cells": [{"id": 32, "text": "r ", "bbox": {"l": 280.24011, "t": 542.23083, "r": 284.0993, "b": 547.43924, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "Extremely large database and overcoming limits to growth", "bbox": {"l": 287.28961, "t": 540.39674, "r": 466.77881, "b": 547.80074, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "r Extremely large database and overcoming limits to growth"}, {"label": "list_item", "id": 13, "page_no": 2, "cluster": {"id": 13, "label": "list_item", "bbox": {"l": 280.24011, "t": 550.5794500000001, "r": 382.20956, "b": 557.98344, "coord_origin": "TOPLEFT"}, "confidence": 0.9075438976287842, "cells": [{"id": 34, "text": "r ", "bbox": {"l": 280.24011, "t": 552.41354, "r": 284.0993, "b": 557.62195, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "ISV education and enablement", "bbox": {"l": 287.28961, "t": 550.5794500000001, "r": 382.20956, "b": 557.98344, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "r ISV education and enablement"}, {"label": "section_header", "id": 12, "page_no": 2, "cluster": {"id": 12, "label": "section_header", "bbox": {"l": 144.88921, "t": 327.46163999999993, "r": 188.74681, "b": 336.81406, "coord_origin": "TOPLEFT"}, "confidence": 0.9098502993583679, "cells": [{"id": 36, "text": "Highlights ", "bbox": {"l": 144.88921, "t": 327.46163999999993, "r": 188.74681, "b": 336.81406, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Highlights"}, {"label": "list_item", "id": 2, "page_no": 2, "cluster": {"id": 2, "label": "list_item", "bbox": {"l": 144.88921, "t": 345.21707, "r": 242.87389000000002, "b": 358.68942, "coord_origin": "TOPLEFT"}, "confidence": 0.957169771194458, "cells": [{"id": 37, "text": "GLYPH<g115>GLYPH<g3>", "bbox": {"l": 144.88921, "t": 346.01953, "r": 148.68732, "b": 350.60168, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "GLYPH<g40>GLYPH<g81>GLYPH<g75>GLYPH<g68>GLYPH<g81>GLYPH<g70>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 151.9388, "t": 345.21707, "r": 177.25424, "b": 350.85666, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "GLYPH<g87>GLYPH<g75>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 176.9472, "t": 345.21707, "r": 187.11098, "b": 350.85666, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g73>GLYPH<g82>GLYPH<g85>GLYPH<g80>GLYPH<g68>GLYPH<g81>GLYPH<g70>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 186.7914, "t": 345.21707, "r": 222.95989999999998, "b": 350.85666, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "GLYPH<g82>GLYPH<g73>GLYPH<g3>", "bbox": {"l": 222.65912, "t": 345.21707, "r": 229.55193999999997, "b": 350.85666, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "GLYPH<g92>GLYPH<g82>GLYPH<g88>GLYPH<g85> GLYPH<g3>", "bbox": {"l": 229.2261, "t": 345.21707, "r": 242.87389000000002, "b": 350.85666, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "GLYPH<g71>GLYPH<g68>GLYPH<g87>GLYPH<g68>GLYPH<g69>GLYPH<g68>GLYPH<g86>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 151.93253, "t": 353.04984, "r": 178.77066, "b": 358.68942, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "GLYPH<g82>GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g68>GLYPH<g87>GLYPH<g76>GLYPH<g82>GLYPH<g81>GLYPH<g86>", "bbox": {"l": 178.46362, "t": 353.04984, "r": 207.16908, "b": 358.68942, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<g115>GLYPH<g3> GLYPH<g40>GLYPH<g81>GLYPH<g75>GLYPH<g68>GLYPH<g81>GLYPH<g70>GLYPH<g72>GLYPH<g3> GLYPH<g87>GLYPH<g75>GLYPH<g72>GLYPH<g3> GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g73>GLYPH<g82>GLYPH<g85>GLYPH<g80>GLYPH<g68>GLYPH<g81>GLYPH<g70>GLYPH<g72>GLYPH<g3> GLYPH<g82>GLYPH<g73>GLYPH<g3> GLYPH<g92>GLYPH<g82>GLYPH<g88>GLYPH<g85> GLYPH<g3> GLYPH<g71>GLYPH<g68>GLYPH<g87>GLYPH<g68>GLYPH<g69>GLYPH<g68>GLYPH<g86>GLYPH<g72>GLYPH<g3> GLYPH<g82>GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g68>GLYPH<g87>GLYPH<g76>GLYPH<g82>GLYPH<g81>GLYPH<g86>"}, {"label": "list_item", "id": 1, "page_no": 2, "cluster": {"id": 1, "label": "list_item", "bbox": {"l": 144.88921, "t": 367.93219, "r": 259.2287, "b": 389.2373, "coord_origin": "TOPLEFT"}, "confidence": 0.9634580612182617, "cells": [{"id": 45, "text": "GLYPH<g115>GLYPH<g3>", "bbox": {"l": 144.88921, "t": 368.73465, "r": 148.68732, "b": 373.3168, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "GLYPH<g40>GLYPH<g68>GLYPH<g85> GLYPH<g81>GLYPH<g3>", "bbox": {"l": 151.9388, "t": 367.93219, "r": 166.05655, "b": 373.57178, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "GLYPH<g74>GLYPH<g85>GLYPH<g72>GLYPH<g68>GLYPH<g87>GLYPH<g72>GLYPH<g85>GLYPH<g3>", "bbox": {"l": 165.73697, "t": 367.93219, "r": 186.40289, "b": 373.57178, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "GLYPH<g85>GLYPH<g72>GLYPH<g87>GLYPH<g88>GLYPH<g85> GLYPH<g81>GLYPH<g3>", "bbox": {"l": 186.09586, "t": 367.93219, "r": 203.61617, "b": 373.57178, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "GLYPH<g82>GLYPH<g81>GLYPH<g3>", "bbox": {"l": 203.30286, "t": 367.93219, "r": 211.82489, "b": 373.57178, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "GLYPH<g44>GLYPH<g55>GLYPH<g3>", "bbox": {"l": 211.49905, "t": 367.93219, "r": 218.16002, "b": 373.57178, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "GLYPH<g83>GLYPH<g85>GLYPH<g82>GLYPH<g77>GLYPH<g72>GLYPH<g70>GLYPH<g87>GLYPH<g86> GLYPH<g3>", "bbox": {"l": 217.83418, "t": 367.93219, "r": 241.30737, "b": 373.57178, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "GLYPH<g87>GLYPH<g75>GLYPH<g85>GLYPH<g82>GLYPH<g88>GLYPH<g74>GLYPH<g75>GLYPH<g3>", "bbox": {"l": 151.93253, "t": 375.76495, "r": 174.46577, "b": 381.40454, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "GLYPH<g80>GLYPH<g82>GLYPH<g71>GLYPH<g72>GLYPH<g85> GLYPH<g81>GLYPH<g76>GLYPH<g93>GLYPH<g68>GLYPH<g87>GLYPH<g76>GLYPH<g82>GLYPH<g81>GLYPH<g3>", "bbox": {"l": 174.15874, "t": 375.76495, "r": 214.4128, "b": 381.40454, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "GLYPH<g82>GLYPH<g73>GLYPH<g3>", "bbox": {"l": 214.11829, "t": 375.76495, "r": 221.01110999999997, "b": 381.40454, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "GLYPH<g71>GLYPH<g68>GLYPH<g87>GLYPH<g68>GLYPH<g69>GLYPH<g68>GLYPH<g86>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 220.68527, "t": 375.76495, "r": 247.52341000000004, "b": 381.40454, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "GLYPH<g68>GLYPH<g81>GLYPH<g71> GLYPH<g3>", "bbox": {"l": 247.21637, "t": 375.76495, "r": 259.2287, "b": 381.40454, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "GLYPH<g68>GLYPH<g83>GLYPH<g83>GLYPH<g79>GLYPH<g76>GLYPH<g70>GLYPH<g68>GLYPH<g87>GLYPH<g76>GLYPH<g82>GLYPH<g81>GLYPH<g86>", "bbox": {"l": 151.93253, "t": 383.59772, "r": 184.61703, "b": 389.2373, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<g115>GLYPH<g3> GLYPH<g40>GLYPH<g68>GLYPH<g85> GLYPH<g81>GLYPH<g3> GLYPH<g74>GLYPH<g85>GLYPH<g72>GLYPH<g68>GLYPH<g87>GLYPH<g72>GLYPH<g85>GLYPH<g3> GLYPH<g85>GLYPH<g72>GLYPH<g87>GLYPH<g88>GLYPH<g85> GLYPH<g81>GLYPH<g3> GLYPH<g82>GLYPH<g81>GLYPH<g3> GLYPH<g44>GLYPH<g55>GLYPH<g3> GLYPH<g83>GLYPH<g85>GLYPH<g82>GLYPH<g77>GLYPH<g72>GLYPH<g70>GLYPH<g87>GLYPH<g86> GLYPH<g3> GLYPH<g87>GLYPH<g75>GLYPH<g85>GLYPH<g82>GLYPH<g88>GLYPH<g74>GLYPH<g75>GLYPH<g3> GLYPH<g80>GLYPH<g82>GLYPH<g71>GLYPH<g72>GLYPH<g85> GLYPH<g81>GLYPH<g76>GLYPH<g93>GLYPH<g68>GLYPH<g87>GLYPH<g76>GLYPH<g82>GLYPH<g81>GLYPH<g3> GLYPH<g82>GLYPH<g73>GLYPH<g3> GLYPH<g71>GLYPH<g68>GLYPH<g87>GLYPH<g68>GLYPH<g69>GLYPH<g68>GLYPH<g86>GLYPH<g72>GLYPH<g3> GLYPH<g68>GLYPH<g81>GLYPH<g71> GLYPH<g3> GLYPH<g68>GLYPH<g83>GLYPH<g83>GLYPH<g79>GLYPH<g76>GLYPH<g70>GLYPH<g68>GLYPH<g87>GLYPH<g76>GLYPH<g82>GLYPH<g81>GLYPH<g86>"}, {"label": "list_item", "id": 4, "page_no": 2, "cluster": {"id": 4, "label": "list_item", "bbox": {"l": 144.88921, "t": 398.48019, "r": 249.83562, "b": 411.95255, "coord_origin": "TOPLEFT"}, "confidence": 0.9541196823120117, "cells": [{"id": 58, "text": "GLYPH<g115>GLYPH<g3>", "bbox": {"l": 144.88921, "t": 399.28265, "r": 148.68732, "b": 403.86481000000003, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "GLYPH<g53>GLYPH<g72>GLYPH<g79>GLYPH<g92>GLYPH<g3>", "bbox": {"l": 151.9388, "t": 398.48019, "r": 165.36099, "b": 404.11978, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "GLYPH<g82>GLYPH<g81>GLYPH<g3>", "bbox": {"l": 165.04141, "t": 398.48019, "r": 173.56345, "b": 404.11978, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "GLYPH<g44>GLYPH<g37>GLYPH<g48>GLYPH<g3>", "bbox": {"l": 173.23761, "t": 398.48019, "r": 185.95174, "b": 404.11978, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "GLYPH<g72>GLYPH<g91>GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g87>GLYPH<g3>", "bbox": {"l": 185.63216, "t": 398.48019, "r": 204.42448, "b": 404.11978, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "GLYPH<g70>GLYPH<g82>GLYPH<g81>GLYPH<g86>GLYPH<g88>GLYPH<g79>GLYPH<g87>GLYPH<g76>GLYPH<g81>GLYPH<g74>GLYPH<g15>GLYPH<g3>", "bbox": {"l": 204.11118, "t": 398.48019, "r": 235.29178, "b": 404.11978, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "GLYPH<g86>GLYPH<g78>GLYPH<g76>GLYPH<g79>GLYPH<g79>GLYPH<g86> GLYPH<g3>", "bbox": {"l": 234.99099999999999, "t": 398.48019, "r": 249.83562, "b": 404.11978, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "GLYPH<g86>GLYPH<g75>GLYPH<g68>GLYPH<g85>GLYPH<g76>GLYPH<g81>GLYPH<g74>GLYPH<g3>", "bbox": {"l": 151.93253, "t": 406.31296, "r": 173.41306, "b": 411.95255, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "GLYPH<g68>GLYPH<g81>GLYPH<g71>GLYPH<g3>", "bbox": {"l": 173.10602, "t": 406.31296, "r": 185.0118, "b": 411.95255, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "GLYPH<g85>GLYPH<g72>GLYPH<g81>GLYPH<g82>GLYPH<g90>GLYPH<g81>GLYPH<g3>", "bbox": {"l": 184.69221, "t": 406.31296, "r": 206.3858, "b": 411.95255, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "GLYPH<g86>GLYPH<g72>GLYPH<g85>GLYPH<g89>GLYPH<g76>GLYPH<g70>GLYPH<g72>GLYPH<g86>", "bbox": {"l": 206.07249, "t": 406.31296, "r": 228.24231000000003, "b": 411.95255, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<g115>GLYPH<g3> GLYPH<g53>GLYPH<g72>GLYPH<g79>GLYPH<g92>GLYPH<g3> GLYPH<g82>GLYPH<g81>GLYPH<g3> GLYPH<g44>GLYPH<g37>GLYPH<g48>GLYPH<g3> GLYPH<g72>GLYPH<g91>GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g87>GLYPH<g3> GLYPH<g70>GLYPH<g82>GLYPH<g81>GLYPH<g86>GLYPH<g88>GLYPH<g79>GLYPH<g87>GLYPH<g76>GLYPH<g81>GLYPH<g74>GLYPH<g15>GLYPH<g3> GLYPH<g86>GLYPH<g78>GLYPH<g76>GLYPH<g79>GLYPH<g79>GLYPH<g86> GLYPH<g3> GLYPH<g86>GLYPH<g75>GLYPH<g68>GLYPH<g85>GLYPH<g76>GLYPH<g81>GLYPH<g74>GLYPH<g3> GLYPH<g68>GLYPH<g81>GLYPH<g71>GLYPH<g3> GLYPH<g85>GLYPH<g72>GLYPH<g81>GLYPH<g82>GLYPH<g90>GLYPH<g81>GLYPH<g3> GLYPH<g86>GLYPH<g72>GLYPH<g85>GLYPH<g89>GLYPH<g76>GLYPH<g70>GLYPH<g72>GLYPH<g86>"}, {"label": "list_item", "id": 5, "page_no": 2, "cluster": {"id": 5, "label": "list_item", "bbox": {"l": 144.88921, "t": 421.1952800000001, "r": 234.25163000000003, "b": 434.66763, "coord_origin": "TOPLEFT"}, "confidence": 0.9440370798110962, "cells": [{"id": 69, "text": "GLYPH<g115>GLYPH<g3>", "bbox": {"l": 144.88921, "t": 421.99773999999996, "r": 148.68732, "b": 426.5799, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "GLYPH<g55>", "bbox": {"l": 151.9388, "t": 421.1952800000001, "r": 155.43533, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "GLYPH<g68>GLYPH<g78>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 154.73979, "t": 421.1952800000001, "r": 166.06282, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "GLYPH<g68>GLYPH<g71>GLYPH<g89>GLYPH<g68>GLYPH<g81>GLYPH<g87>GLYPH<g68>GLYPH<g74>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 165.74324, "t": 421.1952800000001, "r": 195.84607, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "GLYPH<g82>GLYPH<g73>GLYPH<g3>", "bbox": {"l": 195.53903, "t": 421.1952800000001, "r": 202.43185, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "GLYPH<g68>GLYPH<g70>GLYPH<g70>GLYPH<g72>GLYPH<g86>GLYPH<g86>GLYPH<g3>", "bbox": {"l": 202.10602, "t": 421.1952800000001, "r": 222.87220999999997, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "GLYPH<g87>GLYPH<g82>GLYPH<g3>", "bbox": {"l": 222.55890000000002, "t": 421.1952800000001, "r": 229.57077, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "GLYPH<g68> GLYPH<g3>", "bbox": {"l": 229.24492999999998, "t": 421.1952800000001, "r": 234.25163000000003, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "GLYPH<g90>GLYPH<g82>GLYPH<g85>GLYPH<g79>GLYPH<g71>GLYPH<g90>GLYPH<g76>GLYPH<g71>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 151.92627, "t": 429.02805, "r": 181.42754, "b": 434.66763, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "GLYPH<g86>GLYPH<g82>GLYPH<g88>GLYPH<g85>GLYPH<g70>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 181.1205, "t": 429.02805, "r": 201.07835, "b": 434.66763, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "GLYPH<g82>GLYPH<g73>GLYPH<g3>", "bbox": {"l": 200.76505, "t": 429.02805, "r": 207.65787, "b": 434.66763, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "GLYPH<g72>GLYPH<g91>GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g87>GLYPH<g76>GLYPH<g86>GLYPH<g72>", "bbox": {"l": 207.33203, "t": 429.02805, "r": 232.07098000000002, "b": 434.66763, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<g115>GLYPH<g3> GLYPH<g55> GLYPH<g68>GLYPH<g78>GLYPH<g72>GLYPH<g3> GLYPH<g68>GLYPH<g71>GLYPH<g89>GLYPH<g68>GLYPH<g81>GLYPH<g87>GLYPH<g68>GLYPH<g74>GLYPH<g72>GLYPH<g3> GLYPH<g82>GLYPH<g73>GLYPH<g3> GLYPH<g68>GLYPH<g70>GLYPH<g70>GLYPH<g72>GLYPH<g86>GLYPH<g86>GLYPH<g3> GLYPH<g87>GLYPH<g82>GLYPH<g3> GLYPH<g68> GLYPH<g3> GLYPH<g90>GLYPH<g82>GLYPH<g85>GLYPH<g79>GLYPH<g71>GLYPH<g90>GLYPH<g76>GLYPH<g71>GLYPH<g72>GLYPH<g3> GLYPH<g86>GLYPH<g82>GLYPH<g88>GLYPH<g85>GLYPH<g70>GLYPH<g72>GLYPH<g3> GLYPH<g82>GLYPH<g73>GLYPH<g3> GLYPH<g72>GLYPH<g91>GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g87>GLYPH<g76>GLYPH<g86>GLYPH<g72>"}, {"label": "picture", "id": 24, "page_no": 2, "cluster": {"id": 24, "label": "picture", "bbox": {"l": 143.39866638183594, "t": 270.2610778808594, "r": 179.56256103515625, "b": 285.621337890625, "coord_origin": "TOPLEFT"}, "confidence": 0.7491768598556519, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "picture", "id": 15, "page_no": 2, "cluster": {"id": 15, "label": "picture", "bbox": {"l": 64.1669921875, "t": 603.50634765625, "r": 258.7742919921875, "b": 688.1282348632812, "coord_origin": "TOPLEFT"}, "confidence": 0.8925829529762268, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "headers": []}}, {"page_no": 3, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "' Copyright IBM Corp. 2014. All rights reserved.", "bbox": {"l": 64.800003, "t": 755.538002, "r": 257.24335, "b": 763.863001, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "xi", "bbox": {"l": 538.85999, "t": 754.848721, "r": 547.25031, "b": 764.06172, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Preface", "bbox": {"l": 64.800003, "t": 73.84802000000002, "r": 151.46161, "b": 96.04803000000004, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "This IBMfi Redpaper\u2122 publication provides information about the IBM i 7.2 feature of IBM ", "bbox": {"l": 136.8, "t": 132.64862000000005, "r": 542.91888, "b": 141.86163, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "DB2fi for i Row and Column Access Control (RCAC). It offers a broad description of the ", "bbox": {"l": 136.79984, "t": 144.64844000000005, "r": 526.65509, "b": 153.86145, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "function and advantages of controlling access to data in a comprehensive and transparent ", "bbox": {"l": 136.79984, "t": 156.64824999999996, "r": 536.82135, "b": 165.86127, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "way. This publication helps you understand the capabilities of RCAC and provides examples ", "bbox": {"l": 136.79987, "t": 168.64806999999996, "r": 544.67975, "b": 177.86108000000002, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "of defining, creating, and implementing the row permissions and column masks in a relational ", "bbox": {"l": 136.79987, "t": 180.64788999999996, "r": 547.30823, "b": 189.86090000000002, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "database environment.", "bbox": {"l": 136.79987, "t": 192.64770999999996, "r": 238.32117, "b": 201.86072000000001, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "This paper is intended for database engineers, data-centric application developers, and ", "bbox": {"l": 136.79987, "t": 214.60748, "r": 524.18518, "b": 223.82050000000004, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "security officers who want to design and implement RCAC as a part of their data control and ", "bbox": {"l": 136.79987, "t": 226.6073, "r": 546.4657, "b": 235.82030999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "governance policy. A solid background in IBM i object level security, DB2 for i relational ", "bbox": {"l": 136.79987, "t": 238.60712, "r": 521.25488, "b": 247.82012999999995, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "database concepts, and SQL is assumed.", "bbox": {"l": 136.79987, "t": 250.60693000000003, "r": 321.69434, "b": 259.81994999999995, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Authors", "bbox": {"l": 64.800003, "t": 288.3006, "r": 125.36661, "b": 303.0636, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "This paper was produced by the IBM DB2 for i Center of Excellence team in partnership with ", "bbox": {"l": 136.8, "t": 320.62871999999993, "r": 547.23669, "b": 329.8417099999999, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "the International Technical Support Organization (ITSO), Rochester, Minnesota US.", "bbox": {"l": 136.8, "t": 332.62854, "r": 505.05518, "b": 341.84152, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Jim Bainbridge", "bbox": {"l": 263.39957, "t": 375.64877, "r": 335.7251, "b": 384.86176, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": " is a senior DB2 consultant on the DB2 for i ", "bbox": {"l": 335.69922, "t": 375.64877, "r": 529.34259, "b": 384.86176, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Center of Excellence team in the IBM Lab Services and ", "bbox": {"l": 263.3996, "t": 387.64859, "r": 511.50717, "b": 396.86157, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Training organization. His primary role is training and ", "bbox": {"l": 263.3996, "t": 399.64841, "r": 499.077, "b": 408.86139, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "implementation services for IBM DB2 Web Query for i and ", "bbox": {"l": 263.3996, "t": 411.64822, "r": 522.51996, "b": 420.86121, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "business analytics. Jim began his career with IBM 30 years ago ", "bbox": {"l": 263.3996, "t": 423.64804, "r": 541.25079, "b": 432.86102, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "in the IBM Rochester Development Lab, where he developed ", "bbox": {"l": 263.3996, "t": 435.64786, "r": 534.71411, "b": 444.86084, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "cooperative processing products that paired IBM PCs with IBM ", "bbox": {"l": 263.3996, "t": 447.64767, "r": 541.22375, "b": 456.86066, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "S/36 and AS/.400 systems. In the years since, Jim has held ", "bbox": {"l": 263.3996, "t": 459.64749, "r": 528.91016, "b": 468.86047, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "numerous technical roles, including independent software ", "bbox": {"l": 263.3996, "t": 471.64731, "r": 520.24207, "b": 480.86029, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "vendors technical support on a broad range of IBM ", "bbox": {"l": 263.3996, "t": 483.64713, "r": 490.6967200000001, "b": 492.86011, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "technologies and products, and supporting customers in the ", "bbox": {"l": 263.3996, "t": 495.64694, "r": 530.95514, "b": 504.85992, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "IBM Executive Briefing Center and IBM Project Office.", "bbox": {"l": 263.3996, "t": 507.64676, "r": 501.62973, "b": 516.85974, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Hernando Bedoya", "bbox": {"l": 263.3996, "t": 527.62653, "r": 348.38229, "b": 536.83952, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": " is a Senior IT Specialist at STG Lab ", "bbox": {"l": 348.41916, "t": 527.62653, "r": 512.3429, "b": 536.83952, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Services and Training in Rochester, Minnesota. He writes ", "bbox": {"l": 263.3996, "t": 539.62633, "r": 519.26306, "b": 548.83932, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "extensively and teaches IBM classes worldwide in all areas of ", "bbox": {"l": 263.3996, "t": 551.62613, "r": 538.40308, "b": 560.8391300000001, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "DB2 for i. Before joining STG Lab Services, he worked in the ", "bbox": {"l": 263.3996, "t": 563.62593, "r": 533.95715, "b": 572.83893, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "ITSO for nine years writing multiple IBM Redbooksfi ", "bbox": {"l": 263.3996, "t": 575.62573, "r": 496.94464, "b": 584.8387299999999, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "publications. He also worked for IBM Colombia as an IBM ", "bbox": {"l": 263.3996, "t": 587.62553, "r": 520.38562, "b": 596.83853, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "AS/400fi IT Specialist doing presales support for the Andean ", "bbox": {"l": 263.3996, "t": 599.62534, "r": 535.99078, "b": 608.83833, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "countries. He has 28 years of experience in the computing field ", "bbox": {"l": 263.3996, "t": 611.62514, "r": 541.27374, "b": 620.83813, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "and has taught database classes in Colombian universities. He ", "bbox": {"l": 263.3996, "t": 623.62494, "r": 541.26465, "b": 632.83794, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "holds a Master\u2019s degree in Computer Science from EAFIT, ", "bbox": {"l": 263.3996, "t": 635.62474, "r": 523.22211, "b": 644.8377399999999, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "Colombia. His areas of expertise are database technology, ", "bbox": {"l": 263.3996, "t": 647.62454, "r": 524.77386, "b": 656.83754, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "performance, and data warehousing. Hernando can be ", "bbox": {"l": 263.3996, "t": 659.62434, "r": 508.27124, "b": 668.83735, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "contacted at ", "bbox": {"l": 263.3996, "t": 671.62415, "r": 320.63568, "b": 680.83716, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "hbedoya@us.ibm.com", "bbox": {"l": 320.63971, "t": 671.77356, "r": 410.57852, "b": 680.54832, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": ".", "bbox": {"l": 410.5795, "t": 671.62415, "r": 413.34839, "b": 680.83716, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 7, "label": "page_footer", "bbox": {"l": 64.800003, "t": 755.538002, "r": 257.24335, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9469243884086609, "cells": [{"id": 0, "text": "' Copyright IBM Corp. 2014. All rights reserved.", "bbox": {"l": 64.800003, "t": 755.538002, "r": 257.24335, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "page_footer", "bbox": {"l": 538.85999, "t": 754.848721, "r": 547.25031, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.904093861579895, "cells": [{"id": 1, "text": "xi", "bbox": {"l": 538.85999, "t": 754.848721, "r": 547.25031, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "section_header", "bbox": {"l": 64.800003, "t": 73.84802000000002, "r": 151.46161, "b": 96.04803000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9174711108207703, "cells": [{"id": 2, "text": "Preface", "bbox": {"l": 64.800003, "t": 73.84802000000002, "r": 151.46161, "b": 96.04803000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 136.79984, "t": 132.64862000000005, "r": 547.30823, "b": 201.86072000000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9869155883789062, "cells": [{"id": 3, "text": "This IBMfi Redpaper\u2122 publication provides information about the IBM i 7.2 feature of IBM ", "bbox": {"l": 136.8, "t": 132.64862000000005, "r": 542.91888, "b": 141.86163, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "DB2fi for i Row and Column Access Control (RCAC). It offers a broad description of the ", "bbox": {"l": 136.79984, "t": 144.64844000000005, "r": 526.65509, "b": 153.86145, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "function and advantages of controlling access to data in a comprehensive and transparent ", "bbox": {"l": 136.79984, "t": 156.64824999999996, "r": 536.82135, "b": 165.86127, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "way. This publication helps you understand the capabilities of RCAC and provides examples ", "bbox": {"l": 136.79987, "t": 168.64806999999996, "r": 544.67975, "b": 177.86108000000002, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "of defining, creating, and implementing the row permissions and column masks in a relational ", "bbox": {"l": 136.79987, "t": 180.64788999999996, "r": 547.30823, "b": 189.86090000000002, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "database environment.", "bbox": {"l": 136.79987, "t": 192.64770999999996, "r": 238.32117, "b": 201.86072000000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 136.79987, "t": 214.60748, "r": 546.4657, "b": 259.81994999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9872201681137085, "cells": [{"id": 9, "text": "This paper is intended for database engineers, data-centric application developers, and ", "bbox": {"l": 136.79987, "t": 214.60748, "r": 524.18518, "b": 223.82050000000004, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "security officers who want to design and implement RCAC as a part of their data control and ", "bbox": {"l": 136.79987, "t": 226.6073, "r": 546.4657, "b": 235.82030999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "governance policy. A solid background in IBM i object level security, DB2 for i relational ", "bbox": {"l": 136.79987, "t": 238.60712, "r": 521.25488, "b": 247.82012999999995, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "database concepts, and SQL is assumed.", "bbox": {"l": 136.79987, "t": 250.60693000000003, "r": 321.69434, "b": 259.81994999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "section_header", "bbox": {"l": 64.800003, "t": 288.3006, "r": 125.36661, "b": 303.0636, "coord_origin": "TOPLEFT"}, "confidence": 0.9255507588386536, "cells": [{"id": 13, "text": "Authors", "bbox": {"l": 64.800003, "t": 288.3006, "r": 125.36661, "b": 303.0636, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "text", "bbox": {"l": 136.8, "t": 320.62871999999993, "r": 547.23669, "b": 341.84152, "coord_origin": "TOPLEFT"}, "confidence": 0.9713318347930908, "cells": [{"id": 14, "text": "This paper was produced by the IBM DB2 for i Center of Excellence team in partnership with ", "bbox": {"l": 136.8, "t": 320.62871999999993, "r": 547.23669, "b": 329.8417099999999, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "the International Technical Support Organization (ITSO), Rochester, Minnesota US.", "bbox": {"l": 136.8, "t": 332.62854, "r": 505.05518, "b": 341.84152, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "text", "bbox": {"l": 263.39957, "t": 375.64877, "r": 541.25079, "b": 516.85974, "coord_origin": "TOPLEFT"}, "confidence": 0.9842760562896729, "cells": [{"id": 16, "text": "Jim Bainbridge", "bbox": {"l": 263.39957, "t": 375.64877, "r": 335.7251, "b": 384.86176, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": " is a senior DB2 consultant on the DB2 for i ", "bbox": {"l": 335.69922, "t": 375.64877, "r": 529.34259, "b": 384.86176, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Center of Excellence team in the IBM Lab Services and ", "bbox": {"l": 263.3996, "t": 387.64859, "r": 511.50717, "b": 396.86157, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Training organization. His primary role is training and ", "bbox": {"l": 263.3996, "t": 399.64841, "r": 499.077, "b": 408.86139, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "implementation services for IBM DB2 Web Query for i and ", "bbox": {"l": 263.3996, "t": 411.64822, "r": 522.51996, "b": 420.86121, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "business analytics. Jim began his career with IBM 30 years ago ", "bbox": {"l": 263.3996, "t": 423.64804, "r": 541.25079, "b": 432.86102, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "in the IBM Rochester Development Lab, where he developed ", "bbox": {"l": 263.3996, "t": 435.64786, "r": 534.71411, "b": 444.86084, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "cooperative processing products that paired IBM PCs with IBM ", "bbox": {"l": 263.3996, "t": 447.64767, "r": 541.22375, "b": 456.86066, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "S/36 and AS/.400 systems. In the years since, Jim has held ", "bbox": {"l": 263.3996, "t": 459.64749, "r": 528.91016, "b": 468.86047, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "numerous technical roles, including independent software ", "bbox": {"l": 263.3996, "t": 471.64731, "r": 520.24207, "b": 480.86029, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "vendors technical support on a broad range of IBM ", "bbox": {"l": 263.3996, "t": 483.64713, "r": 490.6967200000001, "b": 492.86011, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "technologies and products, and supporting customers in the ", "bbox": {"l": 263.3996, "t": 495.64694, "r": 530.95514, "b": 504.85992, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "IBM Executive Briefing Center and IBM Project Office.", "bbox": {"l": 263.3996, "t": 507.64676, "r": 501.62973, "b": 516.85974, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "text", "bbox": {"l": 263.3996, "t": 527.62653, "r": 541.27374, "b": 680.83716, "coord_origin": "TOPLEFT"}, "confidence": 0.9823779463768005, "cells": [{"id": 29, "text": "Hernando Bedoya", "bbox": {"l": 263.3996, "t": 527.62653, "r": 348.38229, "b": 536.83952, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": " is a Senior IT Specialist at STG Lab ", "bbox": {"l": 348.41916, "t": 527.62653, "r": 512.3429, "b": 536.83952, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Services and Training in Rochester, Minnesota. He writes ", "bbox": {"l": 263.3996, "t": 539.62633, "r": 519.26306, "b": 548.83932, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "extensively and teaches IBM classes worldwide in all areas of ", "bbox": {"l": 263.3996, "t": 551.62613, "r": 538.40308, "b": 560.8391300000001, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "DB2 for i. Before joining STG Lab Services, he worked in the ", "bbox": {"l": 263.3996, "t": 563.62593, "r": 533.95715, "b": 572.83893, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "ITSO for nine years writing multiple IBM Redbooksfi ", "bbox": {"l": 263.3996, "t": 575.62573, "r": 496.94464, "b": 584.8387299999999, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "publications. He also worked for IBM Colombia as an IBM ", "bbox": {"l": 263.3996, "t": 587.62553, "r": 520.38562, "b": 596.83853, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "AS/400fi IT Specialist doing presales support for the Andean ", "bbox": {"l": 263.3996, "t": 599.62534, "r": 535.99078, "b": 608.83833, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "countries. He has 28 years of experience in the computing field ", "bbox": {"l": 263.3996, "t": 611.62514, "r": 541.27374, "b": 620.83813, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "and has taught database classes in Colombian universities. He ", "bbox": {"l": 263.3996, "t": 623.62494, "r": 541.26465, "b": 632.83794, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "holds a Master\u2019s degree in Computer Science from EAFIT, ", "bbox": {"l": 263.3996, "t": 635.62474, "r": 523.22211, "b": 644.8377399999999, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "Colombia. His areas of expertise are database technology, ", "bbox": {"l": 263.3996, "t": 647.62454, "r": 524.77386, "b": 656.83754, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "performance, and data warehousing. Hernando can be ", "bbox": {"l": 263.3996, "t": 659.62434, "r": 508.27124, "b": 668.83735, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "contacted at ", "bbox": {"l": 263.3996, "t": 671.62415, "r": 320.63568, "b": 680.83716, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "hbedoya@us.ibm.com", "bbox": {"l": 320.63971, "t": 671.77356, "r": 410.57852, "b": 680.54832, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": ".", "bbox": {"l": 410.5795, "t": 671.62415, "r": 413.34839, "b": 680.83716, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "picture", "bbox": {"l": 142.52883911132812, "t": 375.0449523925781, "r": 251.47850036621094, "b": 503.20648193359375, "coord_origin": "TOPLEFT"}, "confidence": 0.9862572550773621, "cells": [], "children": []}, {"id": 1, "label": "picture", "bbox": {"l": 145.4144744873047, "t": 527.2447509765625, "r": 252.08840942382812, "b": 635.383056640625, "coord_origin": "TOPLEFT"}, "confidence": 0.9871657490730286, "cells": [], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_footer", "id": 7, "page_no": 3, "cluster": {"id": 7, "label": "page_footer", "bbox": {"l": 64.800003, "t": 755.538002, "r": 257.24335, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9469243884086609, "cells": [{"id": 0, "text": "' Copyright IBM Corp. 2014. All rights reserved.", "bbox": {"l": 64.800003, "t": 755.538002, "r": 257.24335, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "' Copyright IBM Corp. 2014. All rights reserved."}, {"label": "page_footer", "id": 10, "page_no": 3, "cluster": {"id": 10, "label": "page_footer", "bbox": {"l": 538.85999, "t": 754.848721, "r": 547.25031, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.904093861579895, "cells": [{"id": 1, "text": "xi", "bbox": {"l": 538.85999, "t": 754.848721, "r": 547.25031, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "xi"}, {"label": "section_header", "id": 9, "page_no": 3, "cluster": {"id": 9, "label": "section_header", "bbox": {"l": 64.800003, "t": 73.84802000000002, "r": 151.46161, "b": 96.04803000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9174711108207703, "cells": [{"id": 2, "text": "Preface", "bbox": {"l": 64.800003, "t": 73.84802000000002, "r": 151.46161, "b": 96.04803000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Preface"}, {"label": "text", "id": 2, "page_no": 3, "cluster": {"id": 2, "label": "text", "bbox": {"l": 136.79984, "t": 132.64862000000005, "r": 547.30823, "b": 201.86072000000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9869155883789062, "cells": [{"id": 3, "text": "This IBMfi Redpaper\u2122 publication provides information about the IBM i 7.2 feature of IBM ", "bbox": {"l": 136.8, "t": 132.64862000000005, "r": 542.91888, "b": 141.86163, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "DB2fi for i Row and Column Access Control (RCAC). It offers a broad description of the ", "bbox": {"l": 136.79984, "t": 144.64844000000005, "r": 526.65509, "b": 153.86145, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "function and advantages of controlling access to data in a comprehensive and transparent ", "bbox": {"l": 136.79984, "t": 156.64824999999996, "r": 536.82135, "b": 165.86127, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "way. This publication helps you understand the capabilities of RCAC and provides examples ", "bbox": {"l": 136.79987, "t": 168.64806999999996, "r": 544.67975, "b": 177.86108000000002, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "of defining, creating, and implementing the row permissions and column masks in a relational ", "bbox": {"l": 136.79987, "t": 180.64788999999996, "r": 547.30823, "b": 189.86090000000002, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "database environment.", "bbox": {"l": 136.79987, "t": 192.64770999999996, "r": 238.32117, "b": 201.86072000000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "This IBMfi Redpaper\u2122 publication provides information about the IBM i 7.2 feature of IBM DB2fi for i Row and Column Access Control (RCAC). It offers a broad description of the function and advantages of controlling access to data in a comprehensive and transparent way. This publication helps you understand the capabilities of RCAC and provides examples of defining, creating, and implementing the row permissions and column masks in a relational database environment."}, {"label": "text", "id": 0, "page_no": 3, "cluster": {"id": 0, "label": "text", "bbox": {"l": 136.79987, "t": 214.60748, "r": 546.4657, "b": 259.81994999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9872201681137085, "cells": [{"id": 9, "text": "This paper is intended for database engineers, data-centric application developers, and ", "bbox": {"l": 136.79987, "t": 214.60748, "r": 524.18518, "b": 223.82050000000004, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "security officers who want to design and implement RCAC as a part of their data control and ", "bbox": {"l": 136.79987, "t": 226.6073, "r": 546.4657, "b": 235.82030999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "governance policy. A solid background in IBM i object level security, DB2 for i relational ", "bbox": {"l": 136.79987, "t": 238.60712, "r": 521.25488, "b": 247.82012999999995, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "database concepts, and SQL is assumed.", "bbox": {"l": 136.79987, "t": 250.60693000000003, "r": 321.69434, "b": 259.81994999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "This paper is intended for database engineers, data-centric application developers, and security officers who want to design and implement RCAC as a part of their data control and governance policy. A solid background in IBM i object level security, DB2 for i relational database concepts, and SQL is assumed."}, {"label": "section_header", "id": 8, "page_no": 3, "cluster": {"id": 8, "label": "section_header", "bbox": {"l": 64.800003, "t": 288.3006, "r": 125.36661, "b": 303.0636, "coord_origin": "TOPLEFT"}, "confidence": 0.9255507588386536, "cells": [{"id": 13, "text": "Authors", "bbox": {"l": 64.800003, "t": 288.3006, "r": 125.36661, "b": 303.0636, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Authors"}, {"label": "text", "id": 6, "page_no": 3, "cluster": {"id": 6, "label": "text", "bbox": {"l": 136.8, "t": 320.62871999999993, "r": 547.23669, "b": 341.84152, "coord_origin": "TOPLEFT"}, "confidence": 0.9713318347930908, "cells": [{"id": 14, "text": "This paper was produced by the IBM DB2 for i Center of Excellence team in partnership with ", "bbox": {"l": 136.8, "t": 320.62871999999993, "r": 547.23669, "b": 329.8417099999999, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "the International Technical Support Organization (ITSO), Rochester, Minnesota US.", "bbox": {"l": 136.8, "t": 332.62854, "r": 505.05518, "b": 341.84152, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "This paper was produced by the IBM DB2 for i Center of Excellence team in partnership with the International Technical Support Organization (ITSO), Rochester, Minnesota US."}, {"label": "text", "id": 4, "page_no": 3, "cluster": {"id": 4, "label": "text", "bbox": {"l": 263.39957, "t": 375.64877, "r": 541.25079, "b": 516.85974, "coord_origin": "TOPLEFT"}, "confidence": 0.9842760562896729, "cells": [{"id": 16, "text": "Jim Bainbridge", "bbox": {"l": 263.39957, "t": 375.64877, "r": 335.7251, "b": 384.86176, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": " is a senior DB2 consultant on the DB2 for i ", "bbox": {"l": 335.69922, "t": 375.64877, "r": 529.34259, "b": 384.86176, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Center of Excellence team in the IBM Lab Services and ", "bbox": {"l": 263.3996, "t": 387.64859, "r": 511.50717, "b": 396.86157, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Training organization. His primary role is training and ", "bbox": {"l": 263.3996, "t": 399.64841, "r": 499.077, "b": 408.86139, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "implementation services for IBM DB2 Web Query for i and ", "bbox": {"l": 263.3996, "t": 411.64822, "r": 522.51996, "b": 420.86121, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "business analytics. Jim began his career with IBM 30 years ago ", "bbox": {"l": 263.3996, "t": 423.64804, "r": 541.25079, "b": 432.86102, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "in the IBM Rochester Development Lab, where he developed ", "bbox": {"l": 263.3996, "t": 435.64786, "r": 534.71411, "b": 444.86084, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "cooperative processing products that paired IBM PCs with IBM ", "bbox": {"l": 263.3996, "t": 447.64767, "r": 541.22375, "b": 456.86066, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "S/36 and AS/.400 systems. In the years since, Jim has held ", "bbox": {"l": 263.3996, "t": 459.64749, "r": 528.91016, "b": 468.86047, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "numerous technical roles, including independent software ", "bbox": {"l": 263.3996, "t": 471.64731, "r": 520.24207, "b": 480.86029, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "vendors technical support on a broad range of IBM ", "bbox": {"l": 263.3996, "t": 483.64713, "r": 490.6967200000001, "b": 492.86011, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "technologies and products, and supporting customers in the ", "bbox": {"l": 263.3996, "t": 495.64694, "r": 530.95514, "b": 504.85992, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "IBM Executive Briefing Center and IBM Project Office.", "bbox": {"l": 263.3996, "t": 507.64676, "r": 501.62973, "b": 516.85974, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Jim Bainbridge is a senior DB2 consultant on the DB2 for i Center of Excellence team in the IBM Lab Services and Training organization. His primary role is training and implementation services for IBM DB2 Web Query for i and business analytics. Jim began his career with IBM 30 years ago in the IBM Rochester Development Lab, where he developed cooperative processing products that paired IBM PCs with IBM S/36 and AS/.400 systems. In the years since, Jim has held numerous technical roles, including independent software vendors technical support on a broad range of IBM technologies and products, and supporting customers in the IBM Executive Briefing Center and IBM Project Office."}, {"label": "text", "id": 5, "page_no": 3, "cluster": {"id": 5, "label": "text", "bbox": {"l": 263.3996, "t": 527.62653, "r": 541.27374, "b": 680.83716, "coord_origin": "TOPLEFT"}, "confidence": 0.9823779463768005, "cells": [{"id": 29, "text": "Hernando Bedoya", "bbox": {"l": 263.3996, "t": 527.62653, "r": 348.38229, "b": 536.83952, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": " is a Senior IT Specialist at STG Lab ", "bbox": {"l": 348.41916, "t": 527.62653, "r": 512.3429, "b": 536.83952, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Services and Training in Rochester, Minnesota. He writes ", "bbox": {"l": 263.3996, "t": 539.62633, "r": 519.26306, "b": 548.83932, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "extensively and teaches IBM classes worldwide in all areas of ", "bbox": {"l": 263.3996, "t": 551.62613, "r": 538.40308, "b": 560.8391300000001, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "DB2 for i. Before joining STG Lab Services, he worked in the ", "bbox": {"l": 263.3996, "t": 563.62593, "r": 533.95715, "b": 572.83893, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "ITSO for nine years writing multiple IBM Redbooksfi ", "bbox": {"l": 263.3996, "t": 575.62573, "r": 496.94464, "b": 584.8387299999999, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "publications. He also worked for IBM Colombia as an IBM ", "bbox": {"l": 263.3996, "t": 587.62553, "r": 520.38562, "b": 596.83853, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "AS/400fi IT Specialist doing presales support for the Andean ", "bbox": {"l": 263.3996, "t": 599.62534, "r": 535.99078, "b": 608.83833, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "countries. He has 28 years of experience in the computing field ", "bbox": {"l": 263.3996, "t": 611.62514, "r": 541.27374, "b": 620.83813, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "and has taught database classes in Colombian universities. He ", "bbox": {"l": 263.3996, "t": 623.62494, "r": 541.26465, "b": 632.83794, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "holds a Master\u2019s degree in Computer Science from EAFIT, ", "bbox": {"l": 263.3996, "t": 635.62474, "r": 523.22211, "b": 644.8377399999999, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "Colombia. His areas of expertise are database technology, ", "bbox": {"l": 263.3996, "t": 647.62454, "r": 524.77386, "b": 656.83754, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "performance, and data warehousing. Hernando can be ", "bbox": {"l": 263.3996, "t": 659.62434, "r": 508.27124, "b": 668.83735, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "contacted at ", "bbox": {"l": 263.3996, "t": 671.62415, "r": 320.63568, "b": 680.83716, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "hbedoya@us.ibm.com", "bbox": {"l": 320.63971, "t": 671.77356, "r": 410.57852, "b": 680.54832, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": ".", "bbox": {"l": 410.5795, "t": 671.62415, "r": 413.34839, "b": 680.83716, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Hernando Bedoya is a Senior IT Specialist at STG Lab Services and Training in Rochester, Minnesota. He writes extensively and teaches IBM classes worldwide in all areas of DB2 for i. Before joining STG Lab Services, he worked in the ITSO for nine years writing multiple IBM Redbooksfi publications. He also worked for IBM Colombia as an IBM AS/400fi IT Specialist doing presales support for the Andean countries. He has 28 years of experience in the computing field and has taught database classes in Colombian universities. He holds a Master\u2019s degree in Computer Science from EAFIT, Colombia. His areas of expertise are database technology, performance, and data warehousing. Hernando can be contacted at hbedoya@us.ibm.com ."}, {"label": "picture", "id": 3, "page_no": 3, "cluster": {"id": 3, "label": "picture", "bbox": {"l": 142.52883911132812, "t": 375.0449523925781, "r": 251.47850036621094, "b": 503.20648193359375, "coord_origin": "TOPLEFT"}, "confidence": 0.9862572550773621, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "picture", "id": 1, "page_no": 3, "cluster": {"id": 1, "label": "picture", "bbox": {"l": 145.4144744873047, "t": 527.2447509765625, "r": 252.08840942382812, "b": 635.383056640625, "coord_origin": "TOPLEFT"}, "confidence": 0.9871657490730286, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "body": [{"label": "section_header", "id": 9, "page_no": 3, "cluster": {"id": 9, "label": "section_header", "bbox": {"l": 64.800003, "t": 73.84802000000002, "r": 151.46161, "b": 96.04803000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9174711108207703, "cells": [{"id": 2, "text": "Preface", "bbox": {"l": 64.800003, "t": 73.84802000000002, "r": 151.46161, "b": 96.04803000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Preface"}, {"label": "text", "id": 2, "page_no": 3, "cluster": {"id": 2, "label": "text", "bbox": {"l": 136.79984, "t": 132.64862000000005, "r": 547.30823, "b": 201.86072000000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9869155883789062, "cells": [{"id": 3, "text": "This IBMfi Redpaper\u2122 publication provides information about the IBM i 7.2 feature of IBM ", "bbox": {"l": 136.8, "t": 132.64862000000005, "r": 542.91888, "b": 141.86163, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "DB2fi for i Row and Column Access Control (RCAC). It offers a broad description of the ", "bbox": {"l": 136.79984, "t": 144.64844000000005, "r": 526.65509, "b": 153.86145, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "function and advantages of controlling access to data in a comprehensive and transparent ", "bbox": {"l": 136.79984, "t": 156.64824999999996, "r": 536.82135, "b": 165.86127, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "way. This publication helps you understand the capabilities of RCAC and provides examples ", "bbox": {"l": 136.79987, "t": 168.64806999999996, "r": 544.67975, "b": 177.86108000000002, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "of defining, creating, and implementing the row permissions and column masks in a relational ", "bbox": {"l": 136.79987, "t": 180.64788999999996, "r": 547.30823, "b": 189.86090000000002, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "database environment.", "bbox": {"l": 136.79987, "t": 192.64770999999996, "r": 238.32117, "b": 201.86072000000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "This IBMfi Redpaper\u2122 publication provides information about the IBM i 7.2 feature of IBM DB2fi for i Row and Column Access Control (RCAC). It offers a broad description of the function and advantages of controlling access to data in a comprehensive and transparent way. This publication helps you understand the capabilities of RCAC and provides examples of defining, creating, and implementing the row permissions and column masks in a relational database environment."}, {"label": "text", "id": 0, "page_no": 3, "cluster": {"id": 0, "label": "text", "bbox": {"l": 136.79987, "t": 214.60748, "r": 546.4657, "b": 259.81994999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9872201681137085, "cells": [{"id": 9, "text": "This paper is intended for database engineers, data-centric application developers, and ", "bbox": {"l": 136.79987, "t": 214.60748, "r": 524.18518, "b": 223.82050000000004, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "security officers who want to design and implement RCAC as a part of their data control and ", "bbox": {"l": 136.79987, "t": 226.6073, "r": 546.4657, "b": 235.82030999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "governance policy. A solid background in IBM i object level security, DB2 for i relational ", "bbox": {"l": 136.79987, "t": 238.60712, "r": 521.25488, "b": 247.82012999999995, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "database concepts, and SQL is assumed.", "bbox": {"l": 136.79987, "t": 250.60693000000003, "r": 321.69434, "b": 259.81994999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "This paper is intended for database engineers, data-centric application developers, and security officers who want to design and implement RCAC as a part of their data control and governance policy. A solid background in IBM i object level security, DB2 for i relational database concepts, and SQL is assumed."}, {"label": "section_header", "id": 8, "page_no": 3, "cluster": {"id": 8, "label": "section_header", "bbox": {"l": 64.800003, "t": 288.3006, "r": 125.36661, "b": 303.0636, "coord_origin": "TOPLEFT"}, "confidence": 0.9255507588386536, "cells": [{"id": 13, "text": "Authors", "bbox": {"l": 64.800003, "t": 288.3006, "r": 125.36661, "b": 303.0636, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Authors"}, {"label": "text", "id": 6, "page_no": 3, "cluster": {"id": 6, "label": "text", "bbox": {"l": 136.8, "t": 320.62871999999993, "r": 547.23669, "b": 341.84152, "coord_origin": "TOPLEFT"}, "confidence": 0.9713318347930908, "cells": [{"id": 14, "text": "This paper was produced by the IBM DB2 for i Center of Excellence team in partnership with ", "bbox": {"l": 136.8, "t": 320.62871999999993, "r": 547.23669, "b": 329.8417099999999, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "the International Technical Support Organization (ITSO), Rochester, Minnesota US.", "bbox": {"l": 136.8, "t": 332.62854, "r": 505.05518, "b": 341.84152, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "This paper was produced by the IBM DB2 for i Center of Excellence team in partnership with the International Technical Support Organization (ITSO), Rochester, Minnesota US."}, {"label": "text", "id": 4, "page_no": 3, "cluster": {"id": 4, "label": "text", "bbox": {"l": 263.39957, "t": 375.64877, "r": 541.25079, "b": 516.85974, "coord_origin": "TOPLEFT"}, "confidence": 0.9842760562896729, "cells": [{"id": 16, "text": "Jim Bainbridge", "bbox": {"l": 263.39957, "t": 375.64877, "r": 335.7251, "b": 384.86176, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": " is a senior DB2 consultant on the DB2 for i ", "bbox": {"l": 335.69922, "t": 375.64877, "r": 529.34259, "b": 384.86176, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Center of Excellence team in the IBM Lab Services and ", "bbox": {"l": 263.3996, "t": 387.64859, "r": 511.50717, "b": 396.86157, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Training organization. His primary role is training and ", "bbox": {"l": 263.3996, "t": 399.64841, "r": 499.077, "b": 408.86139, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "implementation services for IBM DB2 Web Query for i and ", "bbox": {"l": 263.3996, "t": 411.64822, "r": 522.51996, "b": 420.86121, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "business analytics. Jim began his career with IBM 30 years ago ", "bbox": {"l": 263.3996, "t": 423.64804, "r": 541.25079, "b": 432.86102, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "in the IBM Rochester Development Lab, where he developed ", "bbox": {"l": 263.3996, "t": 435.64786, "r": 534.71411, "b": 444.86084, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "cooperative processing products that paired IBM PCs with IBM ", "bbox": {"l": 263.3996, "t": 447.64767, "r": 541.22375, "b": 456.86066, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "S/36 and AS/.400 systems. In the years since, Jim has held ", "bbox": {"l": 263.3996, "t": 459.64749, "r": 528.91016, "b": 468.86047, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "numerous technical roles, including independent software ", "bbox": {"l": 263.3996, "t": 471.64731, "r": 520.24207, "b": 480.86029, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "vendors technical support on a broad range of IBM ", "bbox": {"l": 263.3996, "t": 483.64713, "r": 490.6967200000001, "b": 492.86011, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "technologies and products, and supporting customers in the ", "bbox": {"l": 263.3996, "t": 495.64694, "r": 530.95514, "b": 504.85992, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "IBM Executive Briefing Center and IBM Project Office.", "bbox": {"l": 263.3996, "t": 507.64676, "r": 501.62973, "b": 516.85974, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Jim Bainbridge is a senior DB2 consultant on the DB2 for i Center of Excellence team in the IBM Lab Services and Training organization. His primary role is training and implementation services for IBM DB2 Web Query for i and business analytics. Jim began his career with IBM 30 years ago in the IBM Rochester Development Lab, where he developed cooperative processing products that paired IBM PCs with IBM S/36 and AS/.400 systems. In the years since, Jim has held numerous technical roles, including independent software vendors technical support on a broad range of IBM technologies and products, and supporting customers in the IBM Executive Briefing Center and IBM Project Office."}, {"label": "text", "id": 5, "page_no": 3, "cluster": {"id": 5, "label": "text", "bbox": {"l": 263.3996, "t": 527.62653, "r": 541.27374, "b": 680.83716, "coord_origin": "TOPLEFT"}, "confidence": 0.9823779463768005, "cells": [{"id": 29, "text": "Hernando Bedoya", "bbox": {"l": 263.3996, "t": 527.62653, "r": 348.38229, "b": 536.83952, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": " is a Senior IT Specialist at STG Lab ", "bbox": {"l": 348.41916, "t": 527.62653, "r": 512.3429, "b": 536.83952, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Services and Training in Rochester, Minnesota. He writes ", "bbox": {"l": 263.3996, "t": 539.62633, "r": 519.26306, "b": 548.83932, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "extensively and teaches IBM classes worldwide in all areas of ", "bbox": {"l": 263.3996, "t": 551.62613, "r": 538.40308, "b": 560.8391300000001, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "DB2 for i. Before joining STG Lab Services, he worked in the ", "bbox": {"l": 263.3996, "t": 563.62593, "r": 533.95715, "b": 572.83893, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "ITSO for nine years writing multiple IBM Redbooksfi ", "bbox": {"l": 263.3996, "t": 575.62573, "r": 496.94464, "b": 584.8387299999999, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "publications. He also worked for IBM Colombia as an IBM ", "bbox": {"l": 263.3996, "t": 587.62553, "r": 520.38562, "b": 596.83853, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "AS/400fi IT Specialist doing presales support for the Andean ", "bbox": {"l": 263.3996, "t": 599.62534, "r": 535.99078, "b": 608.83833, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "countries. He has 28 years of experience in the computing field ", "bbox": {"l": 263.3996, "t": 611.62514, "r": 541.27374, "b": 620.83813, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "and has taught database classes in Colombian universities. He ", "bbox": {"l": 263.3996, "t": 623.62494, "r": 541.26465, "b": 632.83794, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "holds a Master\u2019s degree in Computer Science from EAFIT, ", "bbox": {"l": 263.3996, "t": 635.62474, "r": 523.22211, "b": 644.8377399999999, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "Colombia. His areas of expertise are database technology, ", "bbox": {"l": 263.3996, "t": 647.62454, "r": 524.77386, "b": 656.83754, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "performance, and data warehousing. Hernando can be ", "bbox": {"l": 263.3996, "t": 659.62434, "r": 508.27124, "b": 668.83735, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "contacted at ", "bbox": {"l": 263.3996, "t": 671.62415, "r": 320.63568, "b": 680.83716, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "hbedoya@us.ibm.com", "bbox": {"l": 320.63971, "t": 671.77356, "r": 410.57852, "b": 680.54832, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": ".", "bbox": {"l": 410.5795, "t": 671.62415, "r": 413.34839, "b": 680.83716, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Hernando Bedoya is a Senior IT Specialist at STG Lab Services and Training in Rochester, Minnesota. He writes extensively and teaches IBM classes worldwide in all areas of DB2 for i. Before joining STG Lab Services, he worked in the ITSO for nine years writing multiple IBM Redbooksfi publications. He also worked for IBM Colombia as an IBM AS/400fi IT Specialist doing presales support for the Andean countries. He has 28 years of experience in the computing field and has taught database classes in Colombian universities. He holds a Master\u2019s degree in Computer Science from EAFIT, Colombia. His areas of expertise are database technology, performance, and data warehousing. Hernando can be contacted at hbedoya@us.ibm.com ."}, {"label": "picture", "id": 3, "page_no": 3, "cluster": {"id": 3, "label": "picture", "bbox": {"l": 142.52883911132812, "t": 375.0449523925781, "r": 251.47850036621094, "b": 503.20648193359375, "coord_origin": "TOPLEFT"}, "confidence": 0.9862572550773621, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "picture", "id": 1, "page_no": 3, "cluster": {"id": 1, "label": "picture", "bbox": {"l": 145.4144744873047, "t": 527.2447509765625, "r": 252.08840942382812, "b": 635.383056640625, "coord_origin": "TOPLEFT"}, "confidence": 0.9871657490730286, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "headers": [{"label": "page_footer", "id": 7, "page_no": 3, "cluster": {"id": 7, "label": "page_footer", "bbox": {"l": 64.800003, "t": 755.538002, "r": 257.24335, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9469243884086609, "cells": [{"id": 0, "text": "' Copyright IBM Corp. 2014. All rights reserved.", "bbox": {"l": 64.800003, "t": 755.538002, "r": 257.24335, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "' Copyright IBM Corp. 2014. All rights reserved."}, {"label": "page_footer", "id": 10, "page_no": 3, "cluster": {"id": 10, "label": "page_footer", "bbox": {"l": 538.85999, "t": 754.848721, "r": 547.25031, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.904093861579895, "cells": [{"id": 1, "text": "xi", "bbox": {"l": 538.85999, "t": 754.848721, "r": 547.25031, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "xi"}]}}, {"page_no": 4, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "' Copyright IBM Corp. 2014. All rights reserved.", "bbox": {"l": 64.800003, "t": 755.538002, "r": 257.24335, "b": 763.863001, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "1", "bbox": {"l": 541.67987, "t": 754.848721, "r": 547.21765, "b": 764.06172, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Chapter 1.", "bbox": {"l": 81.0, "t": 268.54272000000003, "r": 115.13253, "b": 274.98071000000004, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Securing and protecting IBM DB2 ", "bbox": {"l": 136.8, "t": 254.88635, "r": 547.30475, "b": 278.91785000000004, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "data", "bbox": {"l": 136.8, "t": 285.84671, "r": 190.29802, "b": 309.8782, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Recent news headlines are filled with reports of data breaches and cyber-attacks impacting ", "bbox": {"l": 136.8, "t": 348.70871, "r": 542.25665, "b": 357.92169, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "global businesses of all sizes. The Identity Theft Resource Center$^{1}$ reports that almost 5000 ", "bbox": {"l": 136.80096, "t": 360.70853, "r": 544.96643, "b": 369.92150999999996, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "data breaches have occurred since 2005, exposing over 600 million records of data. The ", "bbox": {"l": 136.79965, "t": 372.70853, "r": 529.53839, "b": 381.92150999999996, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "financial cost of these data breaches is skyrocketing. Studies from the Ponemon Institute$^{2}$ ", "bbox": {"l": 136.79965, "t": 384.7083400000001, "r": 535.32874, "b": 393.92133000000007, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "revealed that the average cost of a data breach increased in 2013 by 15% globally and ", "bbox": {"l": 136.80026, "t": 396.70853, "r": 521.64374, "b": 405.92150999999996, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "resulted in a brand equity loss of $9.4 million per attack. The average cost that is incurred for ", "bbox": {"l": 136.80026, "t": 408.7083400000001, "r": 547.13135, "b": 417.92133000000007, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "each lost record containing sensitive information increased more than 9% to $145 per record. ", "bbox": {"l": 136.80023, "t": 420.70816, "r": 547.25403, "b": 429.92114, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Businesses must make a serious effort to secure their data and recognize that securing ", "bbox": {"l": 136.80023, "t": 442.7277199999999, "r": 525.06482, "b": 451.9407, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "information assets is a cost of doing business. In many parts of the world and in many ", "bbox": {"l": 136.80025, "t": 454.72754000000003, "r": 518.26825, "b": 463.94052, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "industries, securing the data is required by law and subject to audits. Data security is no ", "bbox": {"l": 136.80025, "t": 466.72736, "r": 527.2063, "b": 475.94034, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "longer an option; it is a requirement.", "bbox": {"l": 136.80025, "t": 478.72717, "r": 296.31067, "b": 487.94016, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "This chapter describes how you can secure and protect data in DB2 for i. The following topics ", "bbox": {"l": 136.80025, "t": 500.68698, "r": 547.15515, "b": 509.89996, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "are covered in this chapter:", "bbox": {"l": 136.80025, "t": 512.6868, "r": 257.28036, "b": 521.89978, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "GLYPH<SM590000>", "bbox": {"l": 136.80025, "t": 529.87576, "r": 141.78024, "b": 538.6505099999999, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Security fundamentals", "bbox": {"l": 151.20041, "t": 529.72635, "r": 250.23166999999998, "b": 538.93936, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "GLYPH<SM590000>", "bbox": {"l": 136.80025, "t": 541.87556, "r": 141.78024, "b": 550.65031, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Current state of IBM i security", "bbox": {"l": 151.20041, "t": 541.72617, "r": 282.98114, "b": 550.93916, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "GLYPH<SM590000>", "bbox": {"l": 136.80025, "t": 553.87537, "r": 141.78024, "b": 562.65012, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "DB2 for i security controls", "bbox": {"l": 151.20041, "t": 553.72597, "r": 264.88187, "b": 562.93896, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "1", "bbox": {"l": 500.39999, "t": 93.16870000000006, "r": 522.61774, "b": 130.13171, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "$^{1 }$http://www.idtheftcenter.org", "bbox": {"l": 136.8, "t": 717.750061, "r": 258.36255, "b": 724.780441, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "$^{2 }$http://www.ponemon.org", "bbox": {"l": 136.8, "t": 727.709961, "r": 231.90257, "b": 734.740341, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "/", "bbox": {"l": 231.84036, "t": 727.590263, "r": 234.05881, "b": 734.97176, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 6, "label": "page_footer", "bbox": {"l": 64.800003, "t": 755.538002, "r": 257.24335, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9364771246910095, "cells": [{"id": 0, "text": "' Copyright IBM Corp. 2014. All rights reserved.", "bbox": {"l": 64.800003, "t": 755.538002, "r": 257.24335, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "page_footer", "bbox": {"l": 541.67987, "t": 754.848721, "r": 547.21765, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.8511815071105957, "cells": [{"id": 1, "text": "1", "bbox": {"l": 541.67987, "t": 754.848721, "r": 547.21765, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 81.0, "t": 268.54272000000003, "r": 115.13253, "b": 274.98071000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 2, "text": "Chapter 1.", "bbox": {"l": 81.0, "t": 268.54272000000003, "r": 115.13253, "b": 274.98071000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "section_header", "bbox": {"l": 136.8, "t": 254.88635, "r": 547.30475, "b": 309.8782, "coord_origin": "TOPLEFT"}, "confidence": 0.9371159076690674, "cells": [{"id": 3, "text": "Securing and protecting IBM DB2 ", "bbox": {"l": 136.8, "t": 254.88635, "r": 547.30475, "b": 278.91785000000004, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "data", "bbox": {"l": 136.8, "t": 285.84671, "r": 190.29802, "b": 309.8782, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 136.79965, "t": 348.70871, "r": 547.25403, "b": 429.92114, "coord_origin": "TOPLEFT"}, "confidence": 0.9868631362915039, "cells": [{"id": 5, "text": "Recent news headlines are filled with reports of data breaches and cyber-attacks impacting ", "bbox": {"l": 136.8, "t": 348.70871, "r": 542.25665, "b": 357.92169, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "global businesses of all sizes. The Identity Theft Resource Center$^{1}$ reports that almost 5000 ", "bbox": {"l": 136.80096, "t": 360.70853, "r": 544.96643, "b": 369.92150999999996, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "data breaches have occurred since 2005, exposing over 600 million records of data. The ", "bbox": {"l": 136.79965, "t": 372.70853, "r": 529.53839, "b": 381.92150999999996, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "financial cost of these data breaches is skyrocketing. Studies from the Ponemon Institute$^{2}$ ", "bbox": {"l": 136.79965, "t": 384.7083400000001, "r": 535.32874, "b": 393.92133000000007, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "revealed that the average cost of a data breach increased in 2013 by 15% globally and ", "bbox": {"l": 136.80026, "t": 396.70853, "r": 521.64374, "b": 405.92150999999996, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "resulted in a brand equity loss of $9.4 million per attack. The average cost that is incurred for ", "bbox": {"l": 136.80026, "t": 408.7083400000001, "r": 547.13135, "b": 417.92133000000007, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "each lost record containing sensitive information increased more than 9% to $145 per record. ", "bbox": {"l": 136.80023, "t": 420.70816, "r": 547.25403, "b": 429.92114, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 136.80023, "t": 442.7277199999999, "r": 527.2063, "b": 487.94016, "coord_origin": "TOPLEFT"}, "confidence": 0.9865838885307312, "cells": [{"id": 12, "text": "Businesses must make a serious effort to secure their data and recognize that securing ", "bbox": {"l": 136.80023, "t": 442.7277199999999, "r": 525.06482, "b": 451.9407, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "information assets is a cost of doing business. In many parts of the world and in many ", "bbox": {"l": 136.80025, "t": 454.72754000000003, "r": 518.26825, "b": 463.94052, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "industries, securing the data is required by law and subject to audits. Data security is no ", "bbox": {"l": 136.80025, "t": 466.72736, "r": 527.2063, "b": 475.94034, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "longer an option; it is a requirement.", "bbox": {"l": 136.80025, "t": 478.72717, "r": 296.31067, "b": 487.94016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 136.80025, "t": 500.68698, "r": 547.15515, "b": 521.89978, "coord_origin": "TOPLEFT"}, "confidence": 0.9734062552452087, "cells": [{"id": 16, "text": "This chapter describes how you can secure and protect data in DB2 for i. The following topics ", "bbox": {"l": 136.80025, "t": 500.68698, "r": 547.15515, "b": 509.89996, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "are covered in this chapter:", "bbox": {"l": 136.80025, "t": 512.6868, "r": 257.28036, "b": 521.89978, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "list_item", "bbox": {"l": 136.80025, "t": 529.72635, "r": 250.23166999999998, "b": 538.93936, "coord_origin": "TOPLEFT"}, "confidence": 0.9373421669006348, "cells": [{"id": 18, "text": "GLYPH<SM590000>", "bbox": {"l": 136.80025, "t": 529.87576, "r": 141.78024, "b": 538.6505099999999, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Security fundamentals", "bbox": {"l": 151.20041, "t": 529.72635, "r": 250.23166999999998, "b": 538.93936, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "list_item", "bbox": {"l": 136.80025, "t": 541.72617, "r": 282.98114, "b": 550.93916, "coord_origin": "TOPLEFT"}, "confidence": 0.9334256649017334, "cells": [{"id": 20, "text": "GLYPH<SM590000>", "bbox": {"l": 136.80025, "t": 541.87556, "r": 141.78024, "b": 550.65031, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Current state of IBM i security", "bbox": {"l": 151.20041, "t": 541.72617, "r": 282.98114, "b": 550.93916, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "list_item", "bbox": {"l": 136.80025, "t": 553.72597, "r": 264.88187, "b": 562.93896, "coord_origin": "TOPLEFT"}, "confidence": 0.9462205767631531, "cells": [{"id": 22, "text": "GLYPH<SM590000>", "bbox": {"l": 136.80025, "t": 553.87537, "r": 141.78024, "b": 562.65012, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "DB2 for i security controls", "bbox": {"l": 151.20041, "t": 553.72597, "r": 264.88187, "b": 562.93896, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 500.39999, "t": 93.16870000000006, "r": 522.61774, "b": 130.13171, "coord_origin": "TOPLEFT"}, "confidence": 0.7085074782371521, "cells": [{"id": 24, "text": "1", "bbox": {"l": 500.39999, "t": 93.16870000000006, "r": 522.61774, "b": 130.13171, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "footnote", "bbox": {"l": 136.8, "t": 717.750061, "r": 258.36255, "b": 724.780441, "coord_origin": "TOPLEFT"}, "confidence": 0.5138102173805237, "cells": [{"id": 25, "text": "$^{1 }$http://www.idtheftcenter.org", "bbox": {"l": 136.8, "t": 717.750061, "r": 258.36255, "b": 724.780441, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "footnote", "bbox": {"l": 136.8, "t": 727.590263, "r": 234.05881, "b": 734.97176, "coord_origin": "TOPLEFT"}, "confidence": 0.7965563535690308, "cells": [{"id": 26, "text": "$^{2 }$http://www.ponemon.org", "bbox": {"l": 136.8, "t": 727.709961, "r": 231.90257, "b": 734.740341, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "/", "bbox": {"l": 231.84036, "t": 727.590263, "r": 234.05881, "b": 734.97176, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "picture", "bbox": {"l": 32.075252532958984, "t": 70.57737731933594, "r": 239.620361328125, "b": 237.9579315185547, "coord_origin": "TOPLEFT"}, "confidence": 0.7509335279464722, "cells": [], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_footer", "id": 6, "page_no": 4, "cluster": {"id": 6, "label": "page_footer", "bbox": {"l": 64.800003, "t": 755.538002, "r": 257.24335, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9364771246910095, "cells": [{"id": 0, "text": "' Copyright IBM Corp. 2014. All rights reserved.", "bbox": {"l": 64.800003, "t": 755.538002, "r": 257.24335, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "' Copyright IBM Corp. 2014. All rights reserved."}, {"label": "page_footer", "id": 8, "page_no": 4, "cluster": {"id": 8, "label": "page_footer", "bbox": {"l": 541.67987, "t": 754.848721, "r": 547.21765, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.8511815071105957, "cells": [{"id": 1, "text": "1", "bbox": {"l": 541.67987, "t": 754.848721, "r": 547.21765, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1"}, {"label": "text", "id": 14, "page_no": 4, "cluster": {"id": 14, "label": "text", "bbox": {"l": 81.0, "t": 268.54272000000003, "r": 115.13253, "b": 274.98071000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 2, "text": "Chapter 1.", "bbox": {"l": 81.0, "t": 268.54272000000003, "r": 115.13253, "b": 274.98071000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Chapter 1."}, {"label": "section_header", "id": 5, "page_no": 4, "cluster": {"id": 5, "label": "section_header", "bbox": {"l": 136.8, "t": 254.88635, "r": 547.30475, "b": 309.8782, "coord_origin": "TOPLEFT"}, "confidence": 0.9371159076690674, "cells": [{"id": 3, "text": "Securing and protecting IBM DB2 ", "bbox": {"l": 136.8, "t": 254.88635, "r": 547.30475, "b": 278.91785000000004, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "data", "bbox": {"l": 136.8, "t": 285.84671, "r": 190.29802, "b": 309.8782, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Securing and protecting IBM DB2 data"}, {"label": "text", "id": 0, "page_no": 4, "cluster": {"id": 0, "label": "text", "bbox": {"l": 136.79965, "t": 348.70871, "r": 547.25403, "b": 429.92114, "coord_origin": "TOPLEFT"}, "confidence": 0.9868631362915039, "cells": [{"id": 5, "text": "Recent news headlines are filled with reports of data breaches and cyber-attacks impacting ", "bbox": {"l": 136.8, "t": 348.70871, "r": 542.25665, "b": 357.92169, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "global businesses of all sizes. The Identity Theft Resource Center$^{1}$ reports that almost 5000 ", "bbox": {"l": 136.80096, "t": 360.70853, "r": 544.96643, "b": 369.92150999999996, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "data breaches have occurred since 2005, exposing over 600 million records of data. The ", "bbox": {"l": 136.79965, "t": 372.70853, "r": 529.53839, "b": 381.92150999999996, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "financial cost of these data breaches is skyrocketing. Studies from the Ponemon Institute$^{2}$ ", "bbox": {"l": 136.79965, "t": 384.7083400000001, "r": 535.32874, "b": 393.92133000000007, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "revealed that the average cost of a data breach increased in 2013 by 15% globally and ", "bbox": {"l": 136.80026, "t": 396.70853, "r": 521.64374, "b": 405.92150999999996, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "resulted in a brand equity loss of $9.4 million per attack. The average cost that is incurred for ", "bbox": {"l": 136.80026, "t": 408.7083400000001, "r": 547.13135, "b": 417.92133000000007, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "each lost record containing sensitive information increased more than 9% to $145 per record. ", "bbox": {"l": 136.80023, "t": 420.70816, "r": 547.25403, "b": 429.92114, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Recent news headlines are filled with reports of data breaches and cyber-attacks impacting global businesses of all sizes. The Identity Theft Resource Center$^{1}$ reports that almost 5000 data breaches have occurred since 2005, exposing over 600 million records of data. The financial cost of these data breaches is skyrocketing. Studies from the Ponemon Institute$^{2}$ revealed that the average cost of a data breach increased in 2013 by 15% globally and resulted in a brand equity loss of $9.4 million per attack. The average cost that is incurred for each lost record containing sensitive information increased more than 9% to $145 per record."}, {"label": "text", "id": 1, "page_no": 4, "cluster": {"id": 1, "label": "text", "bbox": {"l": 136.80023, "t": 442.7277199999999, "r": 527.2063, "b": 487.94016, "coord_origin": "TOPLEFT"}, "confidence": 0.9865838885307312, "cells": [{"id": 12, "text": "Businesses must make a serious effort to secure their data and recognize that securing ", "bbox": {"l": 136.80023, "t": 442.7277199999999, "r": 525.06482, "b": 451.9407, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "information assets is a cost of doing business. In many parts of the world and in many ", "bbox": {"l": 136.80025, "t": 454.72754000000003, "r": 518.26825, "b": 463.94052, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "industries, securing the data is required by law and subject to audits. Data security is no ", "bbox": {"l": 136.80025, "t": 466.72736, "r": 527.2063, "b": 475.94034, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "longer an option; it is a requirement.", "bbox": {"l": 136.80025, "t": 478.72717, "r": 296.31067, "b": 487.94016, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Businesses must make a serious effort to secure their data and recognize that securing information assets is a cost of doing business. In many parts of the world and in many industries, securing the data is required by law and subject to audits. Data security is no longer an option; it is a requirement."}, {"label": "text", "id": 2, "page_no": 4, "cluster": {"id": 2, "label": "text", "bbox": {"l": 136.80025, "t": 500.68698, "r": 547.15515, "b": 521.89978, "coord_origin": "TOPLEFT"}, "confidence": 0.9734062552452087, "cells": [{"id": 16, "text": "This chapter describes how you can secure and protect data in DB2 for i. The following topics ", "bbox": {"l": 136.80025, "t": 500.68698, "r": 547.15515, "b": 509.89996, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "are covered in this chapter:", "bbox": {"l": 136.80025, "t": 512.6868, "r": 257.28036, "b": 521.89978, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "This chapter describes how you can secure and protect data in DB2 for i. The following topics are covered in this chapter:"}, {"label": "list_item", "id": 4, "page_no": 4, "cluster": {"id": 4, "label": "list_item", "bbox": {"l": 136.80025, "t": 529.72635, "r": 250.23166999999998, "b": 538.93936, "coord_origin": "TOPLEFT"}, "confidence": 0.9373421669006348, "cells": [{"id": 18, "text": "GLYPH<SM590000>", "bbox": {"l": 136.80025, "t": 529.87576, "r": 141.78024, "b": 538.6505099999999, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Security fundamentals", "bbox": {"l": 151.20041, "t": 529.72635, "r": 250.23166999999998, "b": 538.93936, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<SM590000> Security fundamentals"}, {"label": "list_item", "id": 7, "page_no": 4, "cluster": {"id": 7, "label": "list_item", "bbox": {"l": 136.80025, "t": 541.72617, "r": 282.98114, "b": 550.93916, "coord_origin": "TOPLEFT"}, "confidence": 0.9334256649017334, "cells": [{"id": 20, "text": "GLYPH<SM590000>", "bbox": {"l": 136.80025, "t": 541.87556, "r": 141.78024, "b": 550.65031, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Current state of IBM i security", "bbox": {"l": 151.20041, "t": 541.72617, "r": 282.98114, "b": 550.93916, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<SM590000> Current state of IBM i security"}, {"label": "list_item", "id": 3, "page_no": 4, "cluster": {"id": 3, "label": "list_item", "bbox": {"l": 136.80025, "t": 553.72597, "r": 264.88187, "b": 562.93896, "coord_origin": "TOPLEFT"}, "confidence": 0.9462205767631531, "cells": [{"id": 22, "text": "GLYPH<SM590000>", "bbox": {"l": 136.80025, "t": 553.87537, "r": 141.78024, "b": 562.65012, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "DB2 for i security controls", "bbox": {"l": 151.20041, "t": 553.72597, "r": 264.88187, "b": 562.93896, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<SM590000> DB2 for i security controls"}, {"label": "text", "id": 12, "page_no": 4, "cluster": {"id": 12, "label": "text", "bbox": {"l": 500.39999, "t": 93.16870000000006, "r": 522.61774, "b": 130.13171, "coord_origin": "TOPLEFT"}, "confidence": 0.7085074782371521, "cells": [{"id": 24, "text": "1", "bbox": {"l": 500.39999, "t": 93.16870000000006, "r": 522.61774, "b": 130.13171, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1"}, {"label": "footnote", "id": 13, "page_no": 4, "cluster": {"id": 13, "label": "footnote", "bbox": {"l": 136.8, "t": 717.750061, "r": 258.36255, "b": 724.780441, "coord_origin": "TOPLEFT"}, "confidence": 0.5138102173805237, "cells": [{"id": 25, "text": "$^{1 }$http://www.idtheftcenter.org", "bbox": {"l": 136.8, "t": 717.750061, "r": 258.36255, "b": 724.780441, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "$^{1 }$http://www.idtheftcenter.org"}, {"label": "footnote", "id": 9, "page_no": 4, "cluster": {"id": 9, "label": "footnote", "bbox": {"l": 136.8, "t": 727.590263, "r": 234.05881, "b": 734.97176, "coord_origin": "TOPLEFT"}, "confidence": 0.7965563535690308, "cells": [{"id": 26, "text": "$^{2 }$http://www.ponemon.org", "bbox": {"l": 136.8, "t": 727.709961, "r": 231.90257, "b": 734.740341, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "/", "bbox": {"l": 231.84036, "t": 727.590263, "r": 234.05881, "b": 734.97176, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "$^{2 }$http://www.ponemon.org /"}, {"label": "picture", "id": 11, "page_no": 4, "cluster": {"id": 11, "label": "picture", "bbox": {"l": 32.075252532958984, "t": 70.57737731933594, "r": 239.620361328125, "b": 237.9579315185547, "coord_origin": "TOPLEFT"}, "confidence": 0.7509335279464722, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "body": [{"label": "text", "id": 14, "page_no": 4, "cluster": {"id": 14, "label": "text", "bbox": {"l": 81.0, "t": 268.54272000000003, "r": 115.13253, "b": 274.98071000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 2, "text": "Chapter 1.", "bbox": {"l": 81.0, "t": 268.54272000000003, "r": 115.13253, "b": 274.98071000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Chapter 1."}, {"label": "section_header", "id": 5, "page_no": 4, "cluster": {"id": 5, "label": "section_header", "bbox": {"l": 136.8, "t": 254.88635, "r": 547.30475, "b": 309.8782, "coord_origin": "TOPLEFT"}, "confidence": 0.9371159076690674, "cells": [{"id": 3, "text": "Securing and protecting IBM DB2 ", "bbox": {"l": 136.8, "t": 254.88635, "r": 547.30475, "b": 278.91785000000004, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "data", "bbox": {"l": 136.8, "t": 285.84671, "r": 190.29802, "b": 309.8782, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Securing and protecting IBM DB2 data"}, {"label": "text", "id": 0, "page_no": 4, "cluster": {"id": 0, "label": "text", "bbox": {"l": 136.79965, "t": 348.70871, "r": 547.25403, "b": 429.92114, "coord_origin": "TOPLEFT"}, "confidence": 0.9868631362915039, "cells": [{"id": 5, "text": "Recent news headlines are filled with reports of data breaches and cyber-attacks impacting ", "bbox": {"l": 136.8, "t": 348.70871, "r": 542.25665, "b": 357.92169, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "global businesses of all sizes. The Identity Theft Resource Center$^{1}$ reports that almost 5000 ", "bbox": {"l": 136.80096, "t": 360.70853, "r": 544.96643, "b": 369.92150999999996, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "data breaches have occurred since 2005, exposing over 600 million records of data. The ", "bbox": {"l": 136.79965, "t": 372.70853, "r": 529.53839, "b": 381.92150999999996, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "financial cost of these data breaches is skyrocketing. Studies from the Ponemon Institute$^{2}$ ", "bbox": {"l": 136.79965, "t": 384.7083400000001, "r": 535.32874, "b": 393.92133000000007, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "revealed that the average cost of a data breach increased in 2013 by 15% globally and ", "bbox": {"l": 136.80026, "t": 396.70853, "r": 521.64374, "b": 405.92150999999996, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "resulted in a brand equity loss of $9.4 million per attack. The average cost that is incurred for ", "bbox": {"l": 136.80026, "t": 408.7083400000001, "r": 547.13135, "b": 417.92133000000007, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "each lost record containing sensitive information increased more than 9% to $145 per record. ", "bbox": {"l": 136.80023, "t": 420.70816, "r": 547.25403, "b": 429.92114, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Recent news headlines are filled with reports of data breaches and cyber-attacks impacting global businesses of all sizes. The Identity Theft Resource Center$^{1}$ reports that almost 5000 data breaches have occurred since 2005, exposing over 600 million records of data. The financial cost of these data breaches is skyrocketing. Studies from the Ponemon Institute$^{2}$ revealed that the average cost of a data breach increased in 2013 by 15% globally and resulted in a brand equity loss of $9.4 million per attack. The average cost that is incurred for each lost record containing sensitive information increased more than 9% to $145 per record."}, {"label": "text", "id": 1, "page_no": 4, "cluster": {"id": 1, "label": "text", "bbox": {"l": 136.80023, "t": 442.7277199999999, "r": 527.2063, "b": 487.94016, "coord_origin": "TOPLEFT"}, "confidence": 0.9865838885307312, "cells": [{"id": 12, "text": "Businesses must make a serious effort to secure their data and recognize that securing ", "bbox": {"l": 136.80023, "t": 442.7277199999999, "r": 525.06482, "b": 451.9407, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "information assets is a cost of doing business. In many parts of the world and in many ", "bbox": {"l": 136.80025, "t": 454.72754000000003, "r": 518.26825, "b": 463.94052, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "industries, securing the data is required by law and subject to audits. Data security is no ", "bbox": {"l": 136.80025, "t": 466.72736, "r": 527.2063, "b": 475.94034, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "longer an option; it is a requirement.", "bbox": {"l": 136.80025, "t": 478.72717, "r": 296.31067, "b": 487.94016, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Businesses must make a serious effort to secure their data and recognize that securing information assets is a cost of doing business. In many parts of the world and in many industries, securing the data is required by law and subject to audits. Data security is no longer an option; it is a requirement."}, {"label": "text", "id": 2, "page_no": 4, "cluster": {"id": 2, "label": "text", "bbox": {"l": 136.80025, "t": 500.68698, "r": 547.15515, "b": 521.89978, "coord_origin": "TOPLEFT"}, "confidence": 0.9734062552452087, "cells": [{"id": 16, "text": "This chapter describes how you can secure and protect data in DB2 for i. The following topics ", "bbox": {"l": 136.80025, "t": 500.68698, "r": 547.15515, "b": 509.89996, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "are covered in this chapter:", "bbox": {"l": 136.80025, "t": 512.6868, "r": 257.28036, "b": 521.89978, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "This chapter describes how you can secure and protect data in DB2 for i. The following topics are covered in this chapter:"}, {"label": "list_item", "id": 4, "page_no": 4, "cluster": {"id": 4, "label": "list_item", "bbox": {"l": 136.80025, "t": 529.72635, "r": 250.23166999999998, "b": 538.93936, "coord_origin": "TOPLEFT"}, "confidence": 0.9373421669006348, "cells": [{"id": 18, "text": "GLYPH<SM590000>", "bbox": {"l": 136.80025, "t": 529.87576, "r": 141.78024, "b": 538.6505099999999, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Security fundamentals", "bbox": {"l": 151.20041, "t": 529.72635, "r": 250.23166999999998, "b": 538.93936, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<SM590000> Security fundamentals"}, {"label": "list_item", "id": 7, "page_no": 4, "cluster": {"id": 7, "label": "list_item", "bbox": {"l": 136.80025, "t": 541.72617, "r": 282.98114, "b": 550.93916, "coord_origin": "TOPLEFT"}, "confidence": 0.9334256649017334, "cells": [{"id": 20, "text": "GLYPH<SM590000>", "bbox": {"l": 136.80025, "t": 541.87556, "r": 141.78024, "b": 550.65031, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Current state of IBM i security", "bbox": {"l": 151.20041, "t": 541.72617, "r": 282.98114, "b": 550.93916, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<SM590000> Current state of IBM i security"}, {"label": "list_item", "id": 3, "page_no": 4, "cluster": {"id": 3, "label": "list_item", "bbox": {"l": 136.80025, "t": 553.72597, "r": 264.88187, "b": 562.93896, "coord_origin": "TOPLEFT"}, "confidence": 0.9462205767631531, "cells": [{"id": 22, "text": "GLYPH<SM590000>", "bbox": {"l": 136.80025, "t": 553.87537, "r": 141.78024, "b": 562.65012, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "DB2 for i security controls", "bbox": {"l": 151.20041, "t": 553.72597, "r": 264.88187, "b": 562.93896, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<SM590000> DB2 for i security controls"}, {"label": "text", "id": 12, "page_no": 4, "cluster": {"id": 12, "label": "text", "bbox": {"l": 500.39999, "t": 93.16870000000006, "r": 522.61774, "b": 130.13171, "coord_origin": "TOPLEFT"}, "confidence": 0.7085074782371521, "cells": [{"id": 24, "text": "1", "bbox": {"l": 500.39999, "t": 93.16870000000006, "r": 522.61774, "b": 130.13171, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1"}, {"label": "footnote", "id": 13, "page_no": 4, "cluster": {"id": 13, "label": "footnote", "bbox": {"l": 136.8, "t": 717.750061, "r": 258.36255, "b": 724.780441, "coord_origin": "TOPLEFT"}, "confidence": 0.5138102173805237, "cells": [{"id": 25, "text": "$^{1 }$http://www.idtheftcenter.org", "bbox": {"l": 136.8, "t": 717.750061, "r": 258.36255, "b": 724.780441, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "$^{1 }$http://www.idtheftcenter.org"}, {"label": "footnote", "id": 9, "page_no": 4, "cluster": {"id": 9, "label": "footnote", "bbox": {"l": 136.8, "t": 727.590263, "r": 234.05881, "b": 734.97176, "coord_origin": "TOPLEFT"}, "confidence": 0.7965563535690308, "cells": [{"id": 26, "text": "$^{2 }$http://www.ponemon.org", "bbox": {"l": 136.8, "t": 727.709961, "r": 231.90257, "b": 734.740341, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "/", "bbox": {"l": 231.84036, "t": 727.590263, "r": 234.05881, "b": 734.97176, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "$^{2 }$http://www.ponemon.org /"}, {"label": "picture", "id": 11, "page_no": 4, "cluster": {"id": 11, "label": "picture", "bbox": {"l": 32.075252532958984, "t": 70.57737731933594, "r": 239.620361328125, "b": 237.9579315185547, "coord_origin": "TOPLEFT"}, "confidence": 0.7509335279464722, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "headers": [{"label": "page_footer", "id": 6, "page_no": 4, "cluster": {"id": 6, "label": "page_footer", "bbox": {"l": 64.800003, "t": 755.538002, "r": 257.24335, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9364771246910095, "cells": [{"id": 0, "text": "' Copyright IBM Corp. 2014. All rights reserved.", "bbox": {"l": 64.800003, "t": 755.538002, "r": 257.24335, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "' Copyright IBM Corp. 2014. All rights reserved."}, {"label": "page_footer", "id": 8, "page_no": 4, "cluster": {"id": 8, "label": "page_footer", "bbox": {"l": 541.67987, "t": 754.848721, "r": 547.21765, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.8511815071105957, "cells": [{"id": 1, "text": "1", "bbox": {"l": 541.67987, "t": 754.848721, "r": 547.21765, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1"}]}}, {"page_no": 5, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "2 ", "bbox": {"l": 64.800003, "t": 754.848721, "r": 72.821999, "b": 764.06172, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Row and Column Access Control Support in IBM DB2 for i", "bbox": {"l": 87.840302, "t": 755.538002, "r": 328.72537, "b": 763.863001, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "1.1", "bbox": {"l": 64.800003, "t": 74.34069999999997, "r": 87.524292, "b": 89.1037, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Security fundamentals", "bbox": {"l": 92.069145, "t": 74.34069999999997, "r": 267.40582, "b": 89.1037, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Before reviewing database security techniques, there are two fundamental steps in securing ", "bbox": {"l": 136.8, "t": 106.6087, "r": 545.00482, "b": 115.82172000000003, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "information assets that must be described:", "bbox": {"l": 136.8, "t": 118.60852, "r": 324.47229, "b": 127.82153000000005, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "GLYPH<SM590000>", "bbox": {"l": 136.8, "t": 135.79749000000004, "r": 141.78, "b": 144.57227, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "First, and most important, is the definition of a company\u2019s ", "bbox": {"l": 151.20016, "t": 135.64806999999996, "r": 406.67715, "b": 144.86108000000002, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "security policy", "bbox": {"l": 406.67999, "t": 135.12487999999996, "r": 471.03815, "b": 145.18262000000004, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": ". Without a ", "bbox": {"l": 470.04001000000005, "t": 135.64862000000005, "r": 520.59796, "b": 144.86163, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "security policy, there is no definition of what are acceptable practices for using, accessing, ", "bbox": {"l": 151.19949, "t": 147.64844000000005, "r": 547.16425, "b": 156.86145, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "and storing information by who, what, when, where, and how. A security policy should ", "bbox": {"l": 151.19948, "t": 159.64824999999996, "r": 531.02008, "b": 168.86127, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "minimally address three things: confidentiality, integrity, and availability.", "bbox": {"l": 151.19948, "t": 171.64806999999996, "r": 463.3578499999999, "b": 180.86108000000002, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "The monitoring and assessment of adherence to the security policy determines whether ", "bbox": {"l": 151.19948, "t": 188.62787000000003, "r": 541.70514, "b": 197.84087999999997, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "your security strategy is working. Often, IBM security consultants are asked to perform ", "bbox": {"l": 151.19948, "t": 200.62769000000003, "r": 534.83002, "b": 209.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "security assessments for companies without regard to the security policy. Although these ", "bbox": {"l": 151.19948, "t": 212.62750000000005, "r": 545.79773, "b": 221.84051999999997, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "assessments can be useful for observing how the system is defined and how data is being ", "bbox": {"l": 151.19948, "t": 224.62732000000005, "r": 547.26086, "b": 233.84033, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "accessed, they cannot determine the level of security without a security policy. Without a ", "bbox": {"l": 151.19948, "t": 236.62714000000005, "r": 543.91528, "b": 245.84015, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "security policy, it really is not an assessment as much as it is a baseline for monitoring the ", "bbox": {"l": 151.19948, "t": 248.62694999999997, "r": 547.25989, "b": 257.83997, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "changes in the security settings that are captured.", "bbox": {"l": 151.19946, "t": 260.62676999999996, "r": 371.8692, "b": 269.83978, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "A security policy is what defines whether the system and its settings are secure (or not). ", "bbox": {"l": 151.19946, "t": 277.60657000000003, "r": 541.992, "b": 286.81958, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "GLYPH<SM590000>", "bbox": {"l": 136.7993, "t": 294.7955600000001, "r": 141.7793, "b": 303.57034, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "The second fundamental in securing data assets is the use of ", "bbox": {"l": 151.19946, "t": 294.64618, "r": 425.86029, "b": 303.85916, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "resource security", "bbox": {"l": 425.82001, "t": 294.12496999999996, "r": 501.60065, "b": 304.18265, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": ". If ", "bbox": {"l": 500.64001, "t": 294.64871, "r": 514.49933, "b": 303.86169, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "implemented properly, resource security prevents data breaches from both internal and ", "bbox": {"l": 151.20038, "t": 306.64853, "r": 537.87421, "b": 315.86151, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "external intrusions. Resource security controls are closely tied to the part of the security ", "bbox": {"l": 151.20038, "t": 318.64834999999994, "r": 541.33636, "b": 327.86133, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "policy that defines who should have access to what information resources. A hacker might ", "bbox": {"l": 151.20038, "t": 330.64816, "r": 547.15826, "b": 339.86115, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "be good enough to get through your company firewalls and sift his way through to your ", "bbox": {"l": 151.20038, "t": 342.64798, "r": 534.86066, "b": 351.86096, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "system, but if they do not have explicit access to your database, the hacker cannot ", "bbox": {"l": 151.20038, "t": 354.6478, "r": 517.00739, "b": 363.86078, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "compromise your information assets.", "bbox": {"l": 151.20038, "t": 366.64761, "r": 314.03534, "b": 375.8606, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "With your eyes now open to the importance of securing information assets, the rest of this ", "bbox": {"l": 136.80022, "t": 388.60742, "r": 535.36169, "b": 397.82040000000006, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "chapter reviews the methods that are available for securing database resources on IBM i. ", "bbox": {"l": 136.80022, "t": 400.60724, "r": 532.755, "b": 409.82022, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "1.2", "bbox": {"l": 64.800003, "t": 438.30072, "r": 87.415726, "b": 453.06372, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Current state of IBM i security", "bbox": {"l": 91.93885, "t": 438.30072, "r": 323.38391, "b": 453.06372, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "Because of the inherently secure nature of IBM i, many clients rely on the default system ", "bbox": {"l": 136.8, "t": 470.62872, "r": 530.30463, "b": 479.84171, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "settings to protect their business data that is stored in DB2 for i. In most cases, this means no ", "bbox": {"l": 136.8, "t": 482.62854, "r": 547.31824, "b": 491.84152, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "data protection because the default setting for the Create default public authority (QCRTAUT) ", "bbox": {"l": 136.8, "t": 494.62836, "r": 547.19586, "b": 503.84134, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "system value is *CHANGE.", "bbox": {"l": 136.8, "t": 506.62817, "r": 257.04709, "b": 515.84116, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "Even more disturbing is that many IBM i clients remain in this state, despite the news ", "bbox": {"l": 136.8, "t": 528.64774, "r": 513.90448, "b": 537.86073, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "headlines and the significant costs that are involved with databases being compromised. This ", "bbox": {"l": 136.8, "t": 540.6475399999999, "r": 547.28442, "b": 549.86053, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "default security configuration makes it quite challenging to implement basic security policies. ", "bbox": {"l": 136.8, "t": 552.64734, "r": 546.27533, "b": 561.86034, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "A tighter implementation is required if you really want to protect one of your company\u2019s most ", "bbox": {"l": 136.8, "t": 564.64714, "r": 545.08014, "b": 573.86014, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "valuable assets, which is the data.", "bbox": {"l": 136.8, "t": 576.64694, "r": 287.80057, "b": 585.85994, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "Traditionally, IBM i applications have employed menu-based security to counteract this default ", "bbox": {"l": 136.8, "t": 598.6665, "r": 547.28326, "b": 607.8795, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "configuration that gives all users access to the data. The theory is that data is protected by ", "bbox": {"l": 136.8, "t": 610.6663100000001, "r": 538.6767, "b": 619.8793000000001, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "the menu options controlling what database operations that the user can perform. This ", "bbox": {"l": 136.8, "t": 622.66611, "r": 520.35364, "b": 631.8791, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "approach is ineffective, even if the user profile is restricted from running interactive ", "bbox": {"l": 136.80002, "t": 634.6659099999999, "r": 502.77115000000003, "b": 643.87891, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "commands. The reason is that in today\u2019s connected world there are a multitude of interfaces ", "bbox": {"l": 136.80002, "t": 646.66571, "r": 545.16492, "b": 655.87871, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "into the system, from web browsers to PC clients, that bypass application menus. If there are ", "bbox": {"l": 136.80002, "t": 658.66551, "r": 547.23376, "b": 667.87852, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "no object-level controls, users of these newer interfaces have an open door to your data.", "bbox": {"l": 136.80002, "t": 670.66532, "r": 526.04187, "b": 679.87833, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 10, "label": "page_footer", "bbox": {"l": 64.800003, "t": 754.848721, "r": 72.821999, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.8889444470405579, "cells": [{"id": 0, "text": "2 ", "bbox": {"l": 64.800003, "t": 754.848721, "r": 72.821999, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "page_footer", "bbox": {"l": 87.840302, "t": 755.538002, "r": 328.72537, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9476422667503357, "cells": [{"id": 1, "text": "Row and Column Access Control Support in IBM DB2 for i", "bbox": {"l": 87.840302, "t": 755.538002, "r": 328.72537, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "section_header", "bbox": {"l": 64.800003, "t": 74.34069999999997, "r": 267.40582, "b": 89.1037, "coord_origin": "TOPLEFT"}, "confidence": 0.9651358723640442, "cells": [{"id": 2, "text": "1.1", "bbox": {"l": 64.800003, "t": 74.34069999999997, "r": 87.524292, "b": 89.1037, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Security fundamentals", "bbox": {"l": 92.069145, "t": 74.34069999999997, "r": 267.40582, "b": 89.1037, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "text", "bbox": {"l": 136.8, "t": 106.6087, "r": 545.00482, "b": 127.82153000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9663435220718384, "cells": [{"id": 4, "text": "Before reviewing database security techniques, there are two fundamental steps in securing ", "bbox": {"l": 136.8, "t": 106.6087, "r": 545.00482, "b": 115.82172000000003, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "information assets that must be described:", "bbox": {"l": 136.8, "t": 118.60852, "r": 324.47229, "b": 127.82153000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "list_item", "bbox": {"l": 136.8, "t": 135.12487999999996, "r": 547.16425, "b": 180.86108000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9835494756698608, "cells": [{"id": 6, "text": "GLYPH<SM590000>", "bbox": {"l": 136.8, "t": 135.79749000000004, "r": 141.78, "b": 144.57227, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "First, and most important, is the definition of a company\u2019s ", "bbox": {"l": 151.20016, "t": 135.64806999999996, "r": 406.67715, "b": 144.86108000000002, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "security policy", "bbox": {"l": 406.67999, "t": 135.12487999999996, "r": 471.03815, "b": 145.18262000000004, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": ". Without a ", "bbox": {"l": 470.04001000000005, "t": 135.64862000000005, "r": 520.59796, "b": 144.86163, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "security policy, there is no definition of what are acceptable practices for using, accessing, ", "bbox": {"l": 151.19949, "t": 147.64844000000005, "r": 547.16425, "b": 156.86145, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "and storing information by who, what, when, where, and how. A security policy should ", "bbox": {"l": 151.19948, "t": 159.64824999999996, "r": 531.02008, "b": 168.86127, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "minimally address three things: confidentiality, integrity, and availability.", "bbox": {"l": 151.19948, "t": 171.64806999999996, "r": 463.3578499999999, "b": 180.86108000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "list_item", "bbox": {"l": 151.19946, "t": 188.62787000000003, "r": 547.26086, "b": 269.83978, "coord_origin": "TOPLEFT"}, "confidence": 0.8077318072319031, "cells": [{"id": 13, "text": "The monitoring and assessment of adherence to the security policy determines whether ", "bbox": {"l": 151.19948, "t": 188.62787000000003, "r": 541.70514, "b": 197.84087999999997, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "your security strategy is working. Often, IBM security consultants are asked to perform ", "bbox": {"l": 151.19948, "t": 200.62769000000003, "r": 534.83002, "b": 209.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "security assessments for companies without regard to the security policy. Although these ", "bbox": {"l": 151.19948, "t": 212.62750000000005, "r": 545.79773, "b": 221.84051999999997, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "assessments can be useful for observing how the system is defined and how data is being ", "bbox": {"l": 151.19948, "t": 224.62732000000005, "r": 547.26086, "b": 233.84033, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "accessed, they cannot determine the level of security without a security policy. Without a ", "bbox": {"l": 151.19948, "t": 236.62714000000005, "r": 543.91528, "b": 245.84015, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "security policy, it really is not an assessment as much as it is a baseline for monitoring the ", "bbox": {"l": 151.19948, "t": 248.62694999999997, "r": 547.25989, "b": 257.83997, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "changes in the security settings that are captured.", "bbox": {"l": 151.19946, "t": 260.62676999999996, "r": 371.8692, "b": 269.83978, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 151.19946, "t": 277.60657000000003, "r": 541.992, "b": 286.81958, "coord_origin": "TOPLEFT"}, "confidence": 0.7967224717140198, "cells": [{"id": 20, "text": "A security policy is what defines whether the system and its settings are secure (or not). ", "bbox": {"l": 151.19946, "t": 277.60657000000003, "r": 541.992, "b": 286.81958, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "list_item", "bbox": {"l": 136.7993, "t": 294.12496999999996, "r": 547.15826, "b": 375.8606, "coord_origin": "TOPLEFT"}, "confidence": 0.9837487936019897, "cells": [{"id": 21, "text": "GLYPH<SM590000>", "bbox": {"l": 136.7993, "t": 294.7955600000001, "r": 141.7793, "b": 303.57034, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "The second fundamental in securing data assets is the use of ", "bbox": {"l": 151.19946, "t": 294.64618, "r": 425.86029, "b": 303.85916, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "resource security", "bbox": {"l": 425.82001, "t": 294.12496999999996, "r": 501.60065, "b": 304.18265, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": ". If ", "bbox": {"l": 500.64001, "t": 294.64871, "r": 514.49933, "b": 303.86169, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "implemented properly, resource security prevents data breaches from both internal and ", "bbox": {"l": 151.20038, "t": 306.64853, "r": 537.87421, "b": 315.86151, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "external intrusions. Resource security controls are closely tied to the part of the security ", "bbox": {"l": 151.20038, "t": 318.64834999999994, "r": 541.33636, "b": 327.86133, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "policy that defines who should have access to what information resources. A hacker might ", "bbox": {"l": 151.20038, "t": 330.64816, "r": 547.15826, "b": 339.86115, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "be good enough to get through your company firewalls and sift his way through to your ", "bbox": {"l": 151.20038, "t": 342.64798, "r": 534.86066, "b": 351.86096, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "system, but if they do not have explicit access to your database, the hacker cannot ", "bbox": {"l": 151.20038, "t": 354.6478, "r": 517.00739, "b": 363.86078, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "compromise your information assets.", "bbox": {"l": 151.20038, "t": 366.64761, "r": 314.03534, "b": 375.8606, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "text", "bbox": {"l": 136.80022, "t": 388.60742, "r": 535.36169, "b": 409.82022, "coord_origin": "TOPLEFT"}, "confidence": 0.9621998071670532, "cells": [{"id": 31, "text": "With your eyes now open to the importance of securing information assets, the rest of this ", "bbox": {"l": 136.80022, "t": 388.60742, "r": 535.36169, "b": 397.82040000000006, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "chapter reviews the methods that are available for securing database resources on IBM i. ", "bbox": {"l": 136.80022, "t": 400.60724, "r": 532.755, "b": 409.82022, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "section_header", "bbox": {"l": 64.800003, "t": 438.30072, "r": 323.38391, "b": 453.06372, "coord_origin": "TOPLEFT"}, "confidence": 0.9650285243988037, "cells": [{"id": 33, "text": "1.2", "bbox": {"l": 64.800003, "t": 438.30072, "r": 87.415726, "b": 453.06372, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Current state of IBM i security", "bbox": {"l": 91.93885, "t": 438.30072, "r": 323.38391, "b": 453.06372, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 136.8, "t": 470.62872, "r": 547.31824, "b": 515.84116, "coord_origin": "TOPLEFT"}, "confidence": 0.9848750233650208, "cells": [{"id": 35, "text": "Because of the inherently secure nature of IBM i, many clients rely on the default system ", "bbox": {"l": 136.8, "t": 470.62872, "r": 530.30463, "b": 479.84171, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "settings to protect their business data that is stored in DB2 for i. In most cases, this means no ", "bbox": {"l": 136.8, "t": 482.62854, "r": 547.31824, "b": 491.84152, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "data protection because the default setting for the Create default public authority (QCRTAUT) ", "bbox": {"l": 136.8, "t": 494.62836, "r": 547.19586, "b": 503.84134, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "system value is *CHANGE.", "bbox": {"l": 136.8, "t": 506.62817, "r": 257.04709, "b": 515.84116, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 136.8, "t": 528.64774, "r": 547.28442, "b": 585.85994, "coord_origin": "TOPLEFT"}, "confidence": 0.9848474860191345, "cells": [{"id": 39, "text": "Even more disturbing is that many IBM i clients remain in this state, despite the news ", "bbox": {"l": 136.8, "t": 528.64774, "r": 513.90448, "b": 537.86073, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "headlines and the significant costs that are involved with databases being compromised. This ", "bbox": {"l": 136.8, "t": 540.6475399999999, "r": 547.28442, "b": 549.86053, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "default security configuration makes it quite challenging to implement basic security policies. ", "bbox": {"l": 136.8, "t": 552.64734, "r": 546.27533, "b": 561.86034, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "A tighter implementation is required if you really want to protect one of your company\u2019s most ", "bbox": {"l": 136.8, "t": 564.64714, "r": 545.08014, "b": 573.86014, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "valuable assets, which is the data.", "bbox": {"l": 136.8, "t": 576.64694, "r": 287.80057, "b": 585.85994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 136.8, "t": 598.6665, "r": 547.28326, "b": 679.87833, "coord_origin": "TOPLEFT"}, "confidence": 0.9870820045471191, "cells": [{"id": 44, "text": "Traditionally, IBM i applications have employed menu-based security to counteract this default ", "bbox": {"l": 136.8, "t": 598.6665, "r": 547.28326, "b": 607.8795, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "configuration that gives all users access to the data. The theory is that data is protected by ", "bbox": {"l": 136.8, "t": 610.6663100000001, "r": 538.6767, "b": 619.8793000000001, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "the menu options controlling what database operations that the user can perform. This ", "bbox": {"l": 136.8, "t": 622.66611, "r": 520.35364, "b": 631.8791, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "approach is ineffective, even if the user profile is restricted from running interactive ", "bbox": {"l": 136.80002, "t": 634.6659099999999, "r": 502.77115000000003, "b": 643.87891, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "commands. The reason is that in today\u2019s connected world there are a multitude of interfaces ", "bbox": {"l": 136.80002, "t": 646.66571, "r": 545.16492, "b": 655.87871, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "into the system, from web browsers to PC clients, that bypass application menus. If there are ", "bbox": {"l": 136.80002, "t": 658.66551, "r": 547.23376, "b": 667.87852, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "no object-level controls, users of these newer interfaces have an open door to your data.", "bbox": {"l": 136.80002, "t": 670.66532, "r": 526.04187, "b": 679.87833, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_footer", "id": 10, "page_no": 5, "cluster": {"id": 10, "label": "page_footer", "bbox": {"l": 64.800003, "t": 754.848721, "r": 72.821999, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.8889444470405579, "cells": [{"id": 0, "text": "2 ", "bbox": {"l": 64.800003, "t": 754.848721, "r": 72.821999, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2"}, {"label": "page_footer", "id": 9, "page_no": 5, "cluster": {"id": 9, "label": "page_footer", "bbox": {"l": 87.840302, "t": 755.538002, "r": 328.72537, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9476422667503357, "cells": [{"id": 1, "text": "Row and Column Access Control Support in IBM DB2 for i", "bbox": {"l": 87.840302, "t": 755.538002, "r": 328.72537, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Row and Column Access Control Support in IBM DB2 for i"}, {"label": "section_header", "id": 6, "page_no": 5, "cluster": {"id": 6, "label": "section_header", "bbox": {"l": 64.800003, "t": 74.34069999999997, "r": 267.40582, "b": 89.1037, "coord_origin": "TOPLEFT"}, "confidence": 0.9651358723640442, "cells": [{"id": 2, "text": "1.1", "bbox": {"l": 64.800003, "t": 74.34069999999997, "r": 87.524292, "b": 89.1037, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Security fundamentals", "bbox": {"l": 92.069145, "t": 74.34069999999997, "r": 267.40582, "b": 89.1037, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1.1 Security fundamentals"}, {"label": "text", "id": 5, "page_no": 5, "cluster": {"id": 5, "label": "text", "bbox": {"l": 136.8, "t": 106.6087, "r": 545.00482, "b": 127.82153000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9663435220718384, "cells": [{"id": 4, "text": "Before reviewing database security techniques, there are two fundamental steps in securing ", "bbox": {"l": 136.8, "t": 106.6087, "r": 545.00482, "b": 115.82172000000003, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "information assets that must be described:", "bbox": {"l": 136.8, "t": 118.60852, "r": 324.47229, "b": 127.82153000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Before reviewing database security techniques, there are two fundamental steps in securing information assets that must be described:"}, {"label": "list_item", "id": 4, "page_no": 5, "cluster": {"id": 4, "label": "list_item", "bbox": {"l": 136.8, "t": 135.12487999999996, "r": 547.16425, "b": 180.86108000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9835494756698608, "cells": [{"id": 6, "text": "GLYPH<SM590000>", "bbox": {"l": 136.8, "t": 135.79749000000004, "r": 141.78, "b": 144.57227, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "First, and most important, is the definition of a company\u2019s ", "bbox": {"l": 151.20016, "t": 135.64806999999996, "r": 406.67715, "b": 144.86108000000002, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "security policy", "bbox": {"l": 406.67999, "t": 135.12487999999996, "r": 471.03815, "b": 145.18262000000004, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": ". Without a ", "bbox": {"l": 470.04001000000005, "t": 135.64862000000005, "r": 520.59796, "b": 144.86163, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "security policy, there is no definition of what are acceptable practices for using, accessing, ", "bbox": {"l": 151.19949, "t": 147.64844000000005, "r": 547.16425, "b": 156.86145, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "and storing information by who, what, when, where, and how. A security policy should ", "bbox": {"l": 151.19948, "t": 159.64824999999996, "r": 531.02008, "b": 168.86127, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "minimally address three things: confidentiality, integrity, and availability.", "bbox": {"l": 151.19948, "t": 171.64806999999996, "r": 463.3578499999999, "b": 180.86108000000002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<SM590000> First, and most important, is the definition of a company\u2019s security policy . Without a security policy, there is no definition of what are acceptable practices for using, accessing, and storing information by who, what, when, where, and how. A security policy should minimally address three things: confidentiality, integrity, and availability."}, {"label": "list_item", "id": 11, "page_no": 5, "cluster": {"id": 11, "label": "list_item", "bbox": {"l": 151.19946, "t": 188.62787000000003, "r": 547.26086, "b": 269.83978, "coord_origin": "TOPLEFT"}, "confidence": 0.8077318072319031, "cells": [{"id": 13, "text": "The monitoring and assessment of adherence to the security policy determines whether ", "bbox": {"l": 151.19948, "t": 188.62787000000003, "r": 541.70514, "b": 197.84087999999997, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "your security strategy is working. Often, IBM security consultants are asked to perform ", "bbox": {"l": 151.19948, "t": 200.62769000000003, "r": 534.83002, "b": 209.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "security assessments for companies without regard to the security policy. Although these ", "bbox": {"l": 151.19948, "t": 212.62750000000005, "r": 545.79773, "b": 221.84051999999997, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "assessments can be useful for observing how the system is defined and how data is being ", "bbox": {"l": 151.19948, "t": 224.62732000000005, "r": 547.26086, "b": 233.84033, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "accessed, they cannot determine the level of security without a security policy. Without a ", "bbox": {"l": 151.19948, "t": 236.62714000000005, "r": 543.91528, "b": 245.84015, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "security policy, it really is not an assessment as much as it is a baseline for monitoring the ", "bbox": {"l": 151.19948, "t": 248.62694999999997, "r": 547.25989, "b": 257.83997, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "changes in the security settings that are captured.", "bbox": {"l": 151.19946, "t": 260.62676999999996, "r": 371.8692, "b": 269.83978, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The monitoring and assessment of adherence to the security policy determines whether your security strategy is working. Often, IBM security consultants are asked to perform security assessments for companies without regard to the security policy. Although these assessments can be useful for observing how the system is defined and how data is being accessed, they cannot determine the level of security without a security policy. Without a security policy, it really is not an assessment as much as it is a baseline for monitoring the changes in the security settings that are captured."}, {"label": "text", "id": 12, "page_no": 5, "cluster": {"id": 12, "label": "text", "bbox": {"l": 151.19946, "t": 277.60657000000003, "r": 541.992, "b": 286.81958, "coord_origin": "TOPLEFT"}, "confidence": 0.7967224717140198, "cells": [{"id": 20, "text": "A security policy is what defines whether the system and its settings are secure (or not). ", "bbox": {"l": 151.19946, "t": 277.60657000000003, "r": 541.992, "b": 286.81958, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "A security policy is what defines whether the system and its settings are secure (or not)."}, {"label": "list_item", "id": 3, "page_no": 5, "cluster": {"id": 3, "label": "list_item", "bbox": {"l": 136.7993, "t": 294.12496999999996, "r": 547.15826, "b": 375.8606, "coord_origin": "TOPLEFT"}, "confidence": 0.9837487936019897, "cells": [{"id": 21, "text": "GLYPH<SM590000>", "bbox": {"l": 136.7993, "t": 294.7955600000001, "r": 141.7793, "b": 303.57034, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "The second fundamental in securing data assets is the use of ", "bbox": {"l": 151.19946, "t": 294.64618, "r": 425.86029, "b": 303.85916, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "resource security", "bbox": {"l": 425.82001, "t": 294.12496999999996, "r": 501.60065, "b": 304.18265, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": ". If ", "bbox": {"l": 500.64001, "t": 294.64871, "r": 514.49933, "b": 303.86169, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "implemented properly, resource security prevents data breaches from both internal and ", "bbox": {"l": 151.20038, "t": 306.64853, "r": 537.87421, "b": 315.86151, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "external intrusions. Resource security controls are closely tied to the part of the security ", "bbox": {"l": 151.20038, "t": 318.64834999999994, "r": 541.33636, "b": 327.86133, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "policy that defines who should have access to what information resources. A hacker might ", "bbox": {"l": 151.20038, "t": 330.64816, "r": 547.15826, "b": 339.86115, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "be good enough to get through your company firewalls and sift his way through to your ", "bbox": {"l": 151.20038, "t": 342.64798, "r": 534.86066, "b": 351.86096, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "system, but if they do not have explicit access to your database, the hacker cannot ", "bbox": {"l": 151.20038, "t": 354.6478, "r": 517.00739, "b": 363.86078, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "compromise your information assets.", "bbox": {"l": 151.20038, "t": 366.64761, "r": 314.03534, "b": 375.8606, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<SM590000> The second fundamental in securing data assets is the use of resource security . If implemented properly, resource security prevents data breaches from both internal and external intrusions. Resource security controls are closely tied to the part of the security policy that defines who should have access to what information resources. A hacker might be good enough to get through your company firewalls and sift his way through to your system, but if they do not have explicit access to your database, the hacker cannot compromise your information assets."}, {"label": "text", "id": 8, "page_no": 5, "cluster": {"id": 8, "label": "text", "bbox": {"l": 136.80022, "t": 388.60742, "r": 535.36169, "b": 409.82022, "coord_origin": "TOPLEFT"}, "confidence": 0.9621998071670532, "cells": [{"id": 31, "text": "With your eyes now open to the importance of securing information assets, the rest of this ", "bbox": {"l": 136.80022, "t": 388.60742, "r": 535.36169, "b": 397.82040000000006, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "chapter reviews the methods that are available for securing database resources on IBM i. ", "bbox": {"l": 136.80022, "t": 400.60724, "r": 532.755, "b": 409.82022, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "With your eyes now open to the importance of securing information assets, the rest of this chapter reviews the methods that are available for securing database resources on IBM i."}, {"label": "section_header", "id": 7, "page_no": 5, "cluster": {"id": 7, "label": "section_header", "bbox": {"l": 64.800003, "t": 438.30072, "r": 323.38391, "b": 453.06372, "coord_origin": "TOPLEFT"}, "confidence": 0.9650285243988037, "cells": [{"id": 33, "text": "1.2", "bbox": {"l": 64.800003, "t": 438.30072, "r": 87.415726, "b": 453.06372, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Current state of IBM i security", "bbox": {"l": 91.93885, "t": 438.30072, "r": 323.38391, "b": 453.06372, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1.2 Current state of IBM i security"}, {"label": "text", "id": 1, "page_no": 5, "cluster": {"id": 1, "label": "text", "bbox": {"l": 136.8, "t": 470.62872, "r": 547.31824, "b": 515.84116, "coord_origin": "TOPLEFT"}, "confidence": 0.9848750233650208, "cells": [{"id": 35, "text": "Because of the inherently secure nature of IBM i, many clients rely on the default system ", "bbox": {"l": 136.8, "t": 470.62872, "r": 530.30463, "b": 479.84171, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "settings to protect their business data that is stored in DB2 for i. In most cases, this means no ", "bbox": {"l": 136.8, "t": 482.62854, "r": 547.31824, "b": 491.84152, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "data protection because the default setting for the Create default public authority (QCRTAUT) ", "bbox": {"l": 136.8, "t": 494.62836, "r": 547.19586, "b": 503.84134, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "system value is *CHANGE.", "bbox": {"l": 136.8, "t": 506.62817, "r": 257.04709, "b": 515.84116, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Because of the inherently secure nature of IBM i, many clients rely on the default system settings to protect their business data that is stored in DB2 for i. In most cases, this means no data protection because the default setting for the Create default public authority (QCRTAUT) system value is *CHANGE."}, {"label": "text", "id": 2, "page_no": 5, "cluster": {"id": 2, "label": "text", "bbox": {"l": 136.8, "t": 528.64774, "r": 547.28442, "b": 585.85994, "coord_origin": "TOPLEFT"}, "confidence": 0.9848474860191345, "cells": [{"id": 39, "text": "Even more disturbing is that many IBM i clients remain in this state, despite the news ", "bbox": {"l": 136.8, "t": 528.64774, "r": 513.90448, "b": 537.86073, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "headlines and the significant costs that are involved with databases being compromised. This ", "bbox": {"l": 136.8, "t": 540.6475399999999, "r": 547.28442, "b": 549.86053, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "default security configuration makes it quite challenging to implement basic security policies. ", "bbox": {"l": 136.8, "t": 552.64734, "r": 546.27533, "b": 561.86034, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "A tighter implementation is required if you really want to protect one of your company\u2019s most ", "bbox": {"l": 136.8, "t": 564.64714, "r": 545.08014, "b": 573.86014, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "valuable assets, which is the data.", "bbox": {"l": 136.8, "t": 576.64694, "r": 287.80057, "b": 585.85994, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Even more disturbing is that many IBM i clients remain in this state, despite the news headlines and the significant costs that are involved with databases being compromised. This default security configuration makes it quite challenging to implement basic security policies. A tighter implementation is required if you really want to protect one of your company\u2019s most valuable assets, which is the data."}, {"label": "text", "id": 0, "page_no": 5, "cluster": {"id": 0, "label": "text", "bbox": {"l": 136.8, "t": 598.6665, "r": 547.28326, "b": 679.87833, "coord_origin": "TOPLEFT"}, "confidence": 0.9870820045471191, "cells": [{"id": 44, "text": "Traditionally, IBM i applications have employed menu-based security to counteract this default ", "bbox": {"l": 136.8, "t": 598.6665, "r": 547.28326, "b": 607.8795, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "configuration that gives all users access to the data. The theory is that data is protected by ", "bbox": {"l": 136.8, "t": 610.6663100000001, "r": 538.6767, "b": 619.8793000000001, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "the menu options controlling what database operations that the user can perform. This ", "bbox": {"l": 136.8, "t": 622.66611, "r": 520.35364, "b": 631.8791, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "approach is ineffective, even if the user profile is restricted from running interactive ", "bbox": {"l": 136.80002, "t": 634.6659099999999, "r": 502.77115000000003, "b": 643.87891, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "commands. The reason is that in today\u2019s connected world there are a multitude of interfaces ", "bbox": {"l": 136.80002, "t": 646.66571, "r": 545.16492, "b": 655.87871, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "into the system, from web browsers to PC clients, that bypass application menus. If there are ", "bbox": {"l": 136.80002, "t": 658.66551, "r": 547.23376, "b": 667.87852, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "no object-level controls, users of these newer interfaces have an open door to your data.", "bbox": {"l": 136.80002, "t": 670.66532, "r": 526.04187, "b": 679.87833, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Traditionally, IBM i applications have employed menu-based security to counteract this default configuration that gives all users access to the data. The theory is that data is protected by the menu options controlling what database operations that the user can perform. This approach is ineffective, even if the user profile is restricted from running interactive commands. The reason is that in today\u2019s connected world there are a multitude of interfaces into the system, from web browsers to PC clients, that bypass application menus. If there are no object-level controls, users of these newer interfaces have an open door to your data."}], "body": [{"label": "section_header", "id": 6, "page_no": 5, "cluster": {"id": 6, "label": "section_header", "bbox": {"l": 64.800003, "t": 74.34069999999997, "r": 267.40582, "b": 89.1037, "coord_origin": "TOPLEFT"}, "confidence": 0.9651358723640442, "cells": [{"id": 2, "text": "1.1", "bbox": {"l": 64.800003, "t": 74.34069999999997, "r": 87.524292, "b": 89.1037, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Security fundamentals", "bbox": {"l": 92.069145, "t": 74.34069999999997, "r": 267.40582, "b": 89.1037, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1.1 Security fundamentals"}, {"label": "text", "id": 5, "page_no": 5, "cluster": {"id": 5, "label": "text", "bbox": {"l": 136.8, "t": 106.6087, "r": 545.00482, "b": 127.82153000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9663435220718384, "cells": [{"id": 4, "text": "Before reviewing database security techniques, there are two fundamental steps in securing ", "bbox": {"l": 136.8, "t": 106.6087, "r": 545.00482, "b": 115.82172000000003, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "information assets that must be described:", "bbox": {"l": 136.8, "t": 118.60852, "r": 324.47229, "b": 127.82153000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Before reviewing database security techniques, there are two fundamental steps in securing information assets that must be described:"}, {"label": "list_item", "id": 4, "page_no": 5, "cluster": {"id": 4, "label": "list_item", "bbox": {"l": 136.8, "t": 135.12487999999996, "r": 547.16425, "b": 180.86108000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9835494756698608, "cells": [{"id": 6, "text": "GLYPH<SM590000>", "bbox": {"l": 136.8, "t": 135.79749000000004, "r": 141.78, "b": 144.57227, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "First, and most important, is the definition of a company\u2019s ", "bbox": {"l": 151.20016, "t": 135.64806999999996, "r": 406.67715, "b": 144.86108000000002, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "security policy", "bbox": {"l": 406.67999, "t": 135.12487999999996, "r": 471.03815, "b": 145.18262000000004, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": ". Without a ", "bbox": {"l": 470.04001000000005, "t": 135.64862000000005, "r": 520.59796, "b": 144.86163, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "security policy, there is no definition of what are acceptable practices for using, accessing, ", "bbox": {"l": 151.19949, "t": 147.64844000000005, "r": 547.16425, "b": 156.86145, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "and storing information by who, what, when, where, and how. A security policy should ", "bbox": {"l": 151.19948, "t": 159.64824999999996, "r": 531.02008, "b": 168.86127, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "minimally address three things: confidentiality, integrity, and availability.", "bbox": {"l": 151.19948, "t": 171.64806999999996, "r": 463.3578499999999, "b": 180.86108000000002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<SM590000> First, and most important, is the definition of a company\u2019s security policy . Without a security policy, there is no definition of what are acceptable practices for using, accessing, and storing information by who, what, when, where, and how. A security policy should minimally address three things: confidentiality, integrity, and availability."}, {"label": "list_item", "id": 11, "page_no": 5, "cluster": {"id": 11, "label": "list_item", "bbox": {"l": 151.19946, "t": 188.62787000000003, "r": 547.26086, "b": 269.83978, "coord_origin": "TOPLEFT"}, "confidence": 0.8077318072319031, "cells": [{"id": 13, "text": "The monitoring and assessment of adherence to the security policy determines whether ", "bbox": {"l": 151.19948, "t": 188.62787000000003, "r": 541.70514, "b": 197.84087999999997, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "your security strategy is working. Often, IBM security consultants are asked to perform ", "bbox": {"l": 151.19948, "t": 200.62769000000003, "r": 534.83002, "b": 209.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "security assessments for companies without regard to the security policy. Although these ", "bbox": {"l": 151.19948, "t": 212.62750000000005, "r": 545.79773, "b": 221.84051999999997, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "assessments can be useful for observing how the system is defined and how data is being ", "bbox": {"l": 151.19948, "t": 224.62732000000005, "r": 547.26086, "b": 233.84033, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "accessed, they cannot determine the level of security without a security policy. Without a ", "bbox": {"l": 151.19948, "t": 236.62714000000005, "r": 543.91528, "b": 245.84015, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "security policy, it really is not an assessment as much as it is a baseline for monitoring the ", "bbox": {"l": 151.19948, "t": 248.62694999999997, "r": 547.25989, "b": 257.83997, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "changes in the security settings that are captured.", "bbox": {"l": 151.19946, "t": 260.62676999999996, "r": 371.8692, "b": 269.83978, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The monitoring and assessment of adherence to the security policy determines whether your security strategy is working. Often, IBM security consultants are asked to perform security assessments for companies without regard to the security policy. Although these assessments can be useful for observing how the system is defined and how data is being accessed, they cannot determine the level of security without a security policy. Without a security policy, it really is not an assessment as much as it is a baseline for monitoring the changes in the security settings that are captured."}, {"label": "text", "id": 12, "page_no": 5, "cluster": {"id": 12, "label": "text", "bbox": {"l": 151.19946, "t": 277.60657000000003, "r": 541.992, "b": 286.81958, "coord_origin": "TOPLEFT"}, "confidence": 0.7967224717140198, "cells": [{"id": 20, "text": "A security policy is what defines whether the system and its settings are secure (or not). ", "bbox": {"l": 151.19946, "t": 277.60657000000003, "r": 541.992, "b": 286.81958, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "A security policy is what defines whether the system and its settings are secure (or not)."}, {"label": "list_item", "id": 3, "page_no": 5, "cluster": {"id": 3, "label": "list_item", "bbox": {"l": 136.7993, "t": 294.12496999999996, "r": 547.15826, "b": 375.8606, "coord_origin": "TOPLEFT"}, "confidence": 0.9837487936019897, "cells": [{"id": 21, "text": "GLYPH<SM590000>", "bbox": {"l": 136.7993, "t": 294.7955600000001, "r": 141.7793, "b": 303.57034, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "The second fundamental in securing data assets is the use of ", "bbox": {"l": 151.19946, "t": 294.64618, "r": 425.86029, "b": 303.85916, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "resource security", "bbox": {"l": 425.82001, "t": 294.12496999999996, "r": 501.60065, "b": 304.18265, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": ". If ", "bbox": {"l": 500.64001, "t": 294.64871, "r": 514.49933, "b": 303.86169, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "implemented properly, resource security prevents data breaches from both internal and ", "bbox": {"l": 151.20038, "t": 306.64853, "r": 537.87421, "b": 315.86151, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "external intrusions. Resource security controls are closely tied to the part of the security ", "bbox": {"l": 151.20038, "t": 318.64834999999994, "r": 541.33636, "b": 327.86133, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "policy that defines who should have access to what information resources. A hacker might ", "bbox": {"l": 151.20038, "t": 330.64816, "r": 547.15826, "b": 339.86115, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "be good enough to get through your company firewalls and sift his way through to your ", "bbox": {"l": 151.20038, "t": 342.64798, "r": 534.86066, "b": 351.86096, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "system, but if they do not have explicit access to your database, the hacker cannot ", "bbox": {"l": 151.20038, "t": 354.6478, "r": 517.00739, "b": 363.86078, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "compromise your information assets.", "bbox": {"l": 151.20038, "t": 366.64761, "r": 314.03534, "b": 375.8606, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<SM590000> The second fundamental in securing data assets is the use of resource security . If implemented properly, resource security prevents data breaches from both internal and external intrusions. Resource security controls are closely tied to the part of the security policy that defines who should have access to what information resources. A hacker might be good enough to get through your company firewalls and sift his way through to your system, but if they do not have explicit access to your database, the hacker cannot compromise your information assets."}, {"label": "text", "id": 8, "page_no": 5, "cluster": {"id": 8, "label": "text", "bbox": {"l": 136.80022, "t": 388.60742, "r": 535.36169, "b": 409.82022, "coord_origin": "TOPLEFT"}, "confidence": 0.9621998071670532, "cells": [{"id": 31, "text": "With your eyes now open to the importance of securing information assets, the rest of this ", "bbox": {"l": 136.80022, "t": 388.60742, "r": 535.36169, "b": 397.82040000000006, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "chapter reviews the methods that are available for securing database resources on IBM i. ", "bbox": {"l": 136.80022, "t": 400.60724, "r": 532.755, "b": 409.82022, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "With your eyes now open to the importance of securing information assets, the rest of this chapter reviews the methods that are available for securing database resources on IBM i."}, {"label": "section_header", "id": 7, "page_no": 5, "cluster": {"id": 7, "label": "section_header", "bbox": {"l": 64.800003, "t": 438.30072, "r": 323.38391, "b": 453.06372, "coord_origin": "TOPLEFT"}, "confidence": 0.9650285243988037, "cells": [{"id": 33, "text": "1.2", "bbox": {"l": 64.800003, "t": 438.30072, "r": 87.415726, "b": 453.06372, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Current state of IBM i security", "bbox": {"l": 91.93885, "t": 438.30072, "r": 323.38391, "b": 453.06372, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1.2 Current state of IBM i security"}, {"label": "text", "id": 1, "page_no": 5, "cluster": {"id": 1, "label": "text", "bbox": {"l": 136.8, "t": 470.62872, "r": 547.31824, "b": 515.84116, "coord_origin": "TOPLEFT"}, "confidence": 0.9848750233650208, "cells": [{"id": 35, "text": "Because of the inherently secure nature of IBM i, many clients rely on the default system ", "bbox": {"l": 136.8, "t": 470.62872, "r": 530.30463, "b": 479.84171, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "settings to protect their business data that is stored in DB2 for i. In most cases, this means no ", "bbox": {"l": 136.8, "t": 482.62854, "r": 547.31824, "b": 491.84152, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "data protection because the default setting for the Create default public authority (QCRTAUT) ", "bbox": {"l": 136.8, "t": 494.62836, "r": 547.19586, "b": 503.84134, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "system value is *CHANGE.", "bbox": {"l": 136.8, "t": 506.62817, "r": 257.04709, "b": 515.84116, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Because of the inherently secure nature of IBM i, many clients rely on the default system settings to protect their business data that is stored in DB2 for i. In most cases, this means no data protection because the default setting for the Create default public authority (QCRTAUT) system value is *CHANGE."}, {"label": "text", "id": 2, "page_no": 5, "cluster": {"id": 2, "label": "text", "bbox": {"l": 136.8, "t": 528.64774, "r": 547.28442, "b": 585.85994, "coord_origin": "TOPLEFT"}, "confidence": 0.9848474860191345, "cells": [{"id": 39, "text": "Even more disturbing is that many IBM i clients remain in this state, despite the news ", "bbox": {"l": 136.8, "t": 528.64774, "r": 513.90448, "b": 537.86073, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "headlines and the significant costs that are involved with databases being compromised. This ", "bbox": {"l": 136.8, "t": 540.6475399999999, "r": 547.28442, "b": 549.86053, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "default security configuration makes it quite challenging to implement basic security policies. ", "bbox": {"l": 136.8, "t": 552.64734, "r": 546.27533, "b": 561.86034, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "A tighter implementation is required if you really want to protect one of your company\u2019s most ", "bbox": {"l": 136.8, "t": 564.64714, "r": 545.08014, "b": 573.86014, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "valuable assets, which is the data.", "bbox": {"l": 136.8, "t": 576.64694, "r": 287.80057, "b": 585.85994, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Even more disturbing is that many IBM i clients remain in this state, despite the news headlines and the significant costs that are involved with databases being compromised. This default security configuration makes it quite challenging to implement basic security policies. A tighter implementation is required if you really want to protect one of your company\u2019s most valuable assets, which is the data."}, {"label": "text", "id": 0, "page_no": 5, "cluster": {"id": 0, "label": "text", "bbox": {"l": 136.8, "t": 598.6665, "r": 547.28326, "b": 679.87833, "coord_origin": "TOPLEFT"}, "confidence": 0.9870820045471191, "cells": [{"id": 44, "text": "Traditionally, IBM i applications have employed menu-based security to counteract this default ", "bbox": {"l": 136.8, "t": 598.6665, "r": 547.28326, "b": 607.8795, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "configuration that gives all users access to the data. The theory is that data is protected by ", "bbox": {"l": 136.8, "t": 610.6663100000001, "r": 538.6767, "b": 619.8793000000001, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "the menu options controlling what database operations that the user can perform. This ", "bbox": {"l": 136.8, "t": 622.66611, "r": 520.35364, "b": 631.8791, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "approach is ineffective, even if the user profile is restricted from running interactive ", "bbox": {"l": 136.80002, "t": 634.6659099999999, "r": 502.77115000000003, "b": 643.87891, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "commands. The reason is that in today\u2019s connected world there are a multitude of interfaces ", "bbox": {"l": 136.80002, "t": 646.66571, "r": 545.16492, "b": 655.87871, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "into the system, from web browsers to PC clients, that bypass application menus. If there are ", "bbox": {"l": 136.80002, "t": 658.66551, "r": 547.23376, "b": 667.87852, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "no object-level controls, users of these newer interfaces have an open door to your data.", "bbox": {"l": 136.80002, "t": 670.66532, "r": 526.04187, "b": 679.87833, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Traditionally, IBM i applications have employed menu-based security to counteract this default configuration that gives all users access to the data. The theory is that data is protected by the menu options controlling what database operations that the user can perform. This approach is ineffective, even if the user profile is restricted from running interactive commands. The reason is that in today\u2019s connected world there are a multitude of interfaces into the system, from web browsers to PC clients, that bypass application menus. If there are no object-level controls, users of these newer interfaces have an open door to your data."}], "headers": [{"label": "page_footer", "id": 10, "page_no": 5, "cluster": {"id": 10, "label": "page_footer", "bbox": {"l": 64.800003, "t": 754.848721, "r": 72.821999, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.8889444470405579, "cells": [{"id": 0, "text": "2 ", "bbox": {"l": 64.800003, "t": 754.848721, "r": 72.821999, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2"}, {"label": "page_footer", "id": 9, "page_no": 5, "cluster": {"id": 9, "label": "page_footer", "bbox": {"l": 87.840302, "t": 755.538002, "r": 328.72537, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9476422667503357, "cells": [{"id": 1, "text": "Row and Column Access Control Support in IBM DB2 for i", "bbox": {"l": 87.840302, "t": 755.538002, "r": 328.72537, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Row and Column Access Control Support in IBM DB2 for i"}]}}, {"page_no": 6, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "4 ", "bbox": {"l": 64.800003, "t": 754.848721, "r": 72.821999, "b": 764.06172, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Row and Column Access Control Support in IBM DB2 for i", "bbox": {"l": 87.840302, "t": 755.538002, "r": 328.72537, "b": 763.863001, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Many businesses are trying to limit data access to a need-to-know basis. This security goal ", "bbox": {"l": 136.8, "t": 71.50867000000005, "r": 541.19006, "b": 80.72167999999999, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "means that users should be given access only to the minimum set of data that is required to ", "bbox": {"l": 136.8, "t": 83.50847999999996, "r": 544.30334, "b": 92.72149999999999, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "perform their job. Often, users with object-level access are given access to row and column ", "bbox": {"l": 136.8, "t": 95.50829999999996, "r": 540.94299, "b": 104.72131000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "values that are beyond what their business task requires because that object-level security ", "bbox": {"l": 136.80002, "t": 107.50811999999996, "r": 538.27454, "b": 116.72113000000002, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "provides an all-or-nothing solution. For example, object-level controls allow a manager to ", "bbox": {"l": 136.80002, "t": 119.50792999999999, "r": 530.23004, "b": 128.72095000000002, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "access data about all employees. Most security policies limit a manager to accessing data ", "bbox": {"l": 136.80002, "t": 131.50775, "r": 536.26263, "b": 140.72076000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "only for the employees that they manage.", "bbox": {"l": 136.80002, "t": 143.50757, "r": 319.04318, "b": 152.72058000000004, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "1.3.1", "bbox": {"l": 64.800003, "t": 173.33471999999995, "r": 94.033653, "b": 185.32275000000004, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Existing row and column control", "bbox": {"l": 97.687859, "t": 173.33471999999995, "r": 301.46902, "b": 185.32275000000004, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Some IBM i clients have tried augmenting the all-or-nothing object-level security with SQL ", "bbox": {"l": 136.8, "t": 199.48870999999997, "r": 534.90112, "b": 208.70172000000002, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "views (or logical files) and application logic, as shown in Figure 1-2. However, ", "bbox": {"l": 136.8, "t": 211.48852999999997, "r": 480.47281000000004, "b": 220.70154000000002, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "application-based logic is easy to bypass with all of the different data access interfaces that ", "bbox": {"l": 136.8, "t": 223.48834, "r": 541.56738, "b": 232.70135000000005, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "are provided by the IBM i operating system, such as Open Database Connectivity (ODBC) ", "bbox": {"l": 136.8, "t": 235.48816, "r": 537.39423, "b": 244.70117000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "and System i Navigator.", "bbox": {"l": 136.79999, "t": 247.48798, "r": 242.24352000000002, "b": 256.70099000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Using SQL views to limit access to a subset of the data in a table also has its own set of ", "bbox": {"l": 136.79999, "t": 269.50757, "r": 526.88428, "b": 278.72058000000004, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "challenges. First, there is the complexity of managing all of the SQL view objects that are ", "bbox": {"l": 136.79999, "t": 281.50742, "r": 531.77087, "b": 290.7203999999999, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "used for securing data access. Second, scaling a view-based security solution can be difficult ", "bbox": {"l": 136.79999, "t": 293.50723000000005, "r": 547.4408, "b": 302.72021, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "as the amount of data grows and the number of users increases.", "bbox": {"l": 136.79999, "t": 305.50705, "r": 421.86725, "b": 314.72003, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Even if you are willing to live with these performance and management issues, a user with ", "bbox": {"l": 136.79999, "t": 327.52661, "r": 536.46692, "b": 336.7395900000001, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "*ALLOBJ access still can directly access all of the data in the underlying DB2 table and easily ", "bbox": {"l": 136.79999, "t": 339.52643, "r": 547.23267, "b": 348.73941, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "bypass the security controls that are built into an SQL view.", "bbox": {"l": 136.79999, "t": 351.52624999999995, "r": 397.88553, "b": 360.73923, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Figure 1-2 Existing row and column controls", "bbox": {"l": 136.8, "t": 691.818, "r": 316.44727, "b": 700.142998, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "User with", "bbox": {"l": 180.95911, "t": 383.45612, "r": 209.08017, "b": 389.0784, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "*ALLOBJ access", "bbox": {"l": 170.00624, "t": 390.95251, "r": 220.10355, "b": 396.57480000000004, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 8, "label": "page_footer", "bbox": {"l": 64.800003, "t": 754.848721, "r": 72.821999, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.8578535318374634, "cells": [{"id": 0, "text": "4 ", "bbox": {"l": 64.800003, "t": 754.848721, "r": 72.821999, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "page_footer", "bbox": {"l": 87.840302, "t": 755.538002, "r": 328.72537, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9491620659828186, "cells": [{"id": 1, "text": "Row and Column Access Control Support in IBM DB2 for i", "bbox": {"l": 87.840302, "t": 755.538002, "r": 328.72537, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 136.8, "t": 71.50867000000005, "r": 544.30334, "b": 152.72058000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9872740507125854, "cells": [{"id": 2, "text": "Many businesses are trying to limit data access to a need-to-know basis. This security goal ", "bbox": {"l": 136.8, "t": 71.50867000000005, "r": 541.19006, "b": 80.72167999999999, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "means that users should be given access only to the minimum set of data that is required to ", "bbox": {"l": 136.8, "t": 83.50847999999996, "r": 544.30334, "b": 92.72149999999999, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "perform their job. Often, users with object-level access are given access to row and column ", "bbox": {"l": 136.8, "t": 95.50829999999996, "r": 540.94299, "b": 104.72131000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "values that are beyond what their business task requires because that object-level security ", "bbox": {"l": 136.80002, "t": 107.50811999999996, "r": 538.27454, "b": 116.72113000000002, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "provides an all-or-nothing solution. For example, object-level controls allow a manager to ", "bbox": {"l": 136.80002, "t": 119.50792999999999, "r": 530.23004, "b": 128.72095000000002, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "access data about all employees. Most security policies limit a manager to accessing data ", "bbox": {"l": 136.80002, "t": 131.50775, "r": 536.26263, "b": 140.72076000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "only for the employees that they manage.", "bbox": {"l": 136.80002, "t": 143.50757, "r": 319.04318, "b": 152.72058000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "section_header", "bbox": {"l": 64.800003, "t": 173.33471999999995, "r": 301.46902, "b": 185.32275000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9626136422157288, "cells": [{"id": 9, "text": "1.3.1", "bbox": {"l": 64.800003, "t": 173.33471999999995, "r": 94.033653, "b": 185.32275000000004, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Existing row and column control", "bbox": {"l": 97.687859, "t": 173.33471999999995, "r": 301.46902, "b": 185.32275000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 136.79999, "t": 199.48870999999997, "r": 541.56738, "b": 256.70099000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9858147501945496, "cells": [{"id": 11, "text": "Some IBM i clients have tried augmenting the all-or-nothing object-level security with SQL ", "bbox": {"l": 136.8, "t": 199.48870999999997, "r": 534.90112, "b": 208.70172000000002, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "views (or logical files) and application logic, as shown in Figure 1-2. However, ", "bbox": {"l": 136.8, "t": 211.48852999999997, "r": 480.47281000000004, "b": 220.70154000000002, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "application-based logic is easy to bypass with all of the different data access interfaces that ", "bbox": {"l": 136.8, "t": 223.48834, "r": 541.56738, "b": 232.70135000000005, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "are provided by the IBM i operating system, such as Open Database Connectivity (ODBC) ", "bbox": {"l": 136.8, "t": 235.48816, "r": 537.39423, "b": 244.70117000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "and System i Navigator.", "bbox": {"l": 136.79999, "t": 247.48798, "r": 242.24352000000002, "b": 256.70099000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 136.79999, "t": 269.50757, "r": 547.4408, "b": 314.72003, "coord_origin": "TOPLEFT"}, "confidence": 0.9875384569168091, "cells": [{"id": 16, "text": "Using SQL views to limit access to a subset of the data in a table also has its own set of ", "bbox": {"l": 136.79999, "t": 269.50757, "r": 526.88428, "b": 278.72058000000004, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "challenges. First, there is the complexity of managing all of the SQL view objects that are ", "bbox": {"l": 136.79999, "t": 281.50742, "r": 531.77087, "b": 290.7203999999999, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "used for securing data access. Second, scaling a view-based security solution can be difficult ", "bbox": {"l": 136.79999, "t": 293.50723000000005, "r": 547.4408, "b": 302.72021, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "as the amount of data grows and the number of users increases.", "bbox": {"l": 136.79999, "t": 305.50705, "r": 421.86725, "b": 314.72003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "text", "bbox": {"l": 136.79999, "t": 327.52661, "r": 547.23267, "b": 360.73923, "coord_origin": "TOPLEFT"}, "confidence": 0.975760281085968, "cells": [{"id": 20, "text": "Even if you are willing to live with these performance and management issues, a user with ", "bbox": {"l": 136.79999, "t": 327.52661, "r": 536.46692, "b": 336.7395900000001, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "*ALLOBJ access still can directly access all of the data in the underlying DB2 table and easily ", "bbox": {"l": 136.79999, "t": 339.52643, "r": 547.23267, "b": 348.73941, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "bypass the security controls that are built into an SQL view.", "bbox": {"l": 136.79999, "t": 351.52624999999995, "r": 397.88553, "b": 360.73923, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "caption", "bbox": {"l": 136.8, "t": 691.818, "r": 316.44727, "b": 700.142998, "coord_origin": "TOPLEFT"}, "confidence": 0.9457826614379883, "cells": [{"id": 23, "text": "Figure 1-2 Existing row and column controls", "bbox": {"l": 136.8, "t": 691.818, "r": 316.44727, "b": 700.142998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "picture", "bbox": {"l": 135.92466735839844, "t": 375.9272155761719, "r": 546.4456176757812, "b": 688.6098022460938, "coord_origin": "TOPLEFT"}, "confidence": 0.9838992357254028, "cells": [{"id": 24, "text": "User with", "bbox": {"l": 180.95911, "t": 383.45612, "r": 209.08017, "b": 389.0784, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "*ALLOBJ access", "bbox": {"l": 170.00624, "t": 390.95251, "r": 220.10355, "b": 396.57480000000004, "coord_origin": "TOPLEFT"}}], "children": [{"id": 9, "label": "text", "bbox": {"l": 180.95911, "t": 383.45612, "r": 209.08017, "b": 389.0784, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "User with", "bbox": {"l": 180.95911, "t": 383.45612, "r": 209.08017, "b": 389.0784, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "text", "bbox": {"l": 170.00624, "t": 390.95251, "r": 220.10355, "b": 396.57480000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "*ALLOBJ access", "bbox": {"l": 170.00624, "t": 390.95251, "r": 220.10355, "b": 396.57480000000004, "coord_origin": "TOPLEFT"}}], "children": []}]}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_footer", "id": 8, "page_no": 6, "cluster": {"id": 8, "label": "page_footer", "bbox": {"l": 64.800003, "t": 754.848721, "r": 72.821999, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.8578535318374634, "cells": [{"id": 0, "text": "4 ", "bbox": {"l": 64.800003, "t": 754.848721, "r": 72.821999, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4"}, {"label": "page_footer", "id": 6, "page_no": 6, "cluster": {"id": 6, "label": "page_footer", "bbox": {"l": 87.840302, "t": 755.538002, "r": 328.72537, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9491620659828186, "cells": [{"id": 1, "text": "Row and Column Access Control Support in IBM DB2 for i", "bbox": {"l": 87.840302, "t": 755.538002, "r": 328.72537, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Row and Column Access Control Support in IBM DB2 for i"}, {"label": "text", "id": 1, "page_no": 6, "cluster": {"id": 1, "label": "text", "bbox": {"l": 136.8, "t": 71.50867000000005, "r": 544.30334, "b": 152.72058000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9872740507125854, "cells": [{"id": 2, "text": "Many businesses are trying to limit data access to a need-to-know basis. This security goal ", "bbox": {"l": 136.8, "t": 71.50867000000005, "r": 541.19006, "b": 80.72167999999999, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "means that users should be given access only to the minimum set of data that is required to ", "bbox": {"l": 136.8, "t": 83.50847999999996, "r": 544.30334, "b": 92.72149999999999, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "perform their job. Often, users with object-level access are given access to row and column ", "bbox": {"l": 136.8, "t": 95.50829999999996, "r": 540.94299, "b": 104.72131000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "values that are beyond what their business task requires because that object-level security ", "bbox": {"l": 136.80002, "t": 107.50811999999996, "r": 538.27454, "b": 116.72113000000002, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "provides an all-or-nothing solution. For example, object-level controls allow a manager to ", "bbox": {"l": 136.80002, "t": 119.50792999999999, "r": 530.23004, "b": 128.72095000000002, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "access data about all employees. Most security policies limit a manager to accessing data ", "bbox": {"l": 136.80002, "t": 131.50775, "r": 536.26263, "b": 140.72076000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "only for the employees that they manage.", "bbox": {"l": 136.80002, "t": 143.50757, "r": 319.04318, "b": 152.72058000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Many businesses are trying to limit data access to a need-to-know basis. This security goal means that users should be given access only to the minimum set of data that is required to perform their job. Often, users with object-level access are given access to row and column values that are beyond what their business task requires because that object-level security provides an all-or-nothing solution. For example, object-level controls allow a manager to access data about all employees. Most security policies limit a manager to accessing data only for the employees that they manage."}, {"label": "section_header", "id": 5, "page_no": 6, "cluster": {"id": 5, "label": "section_header", "bbox": {"l": 64.800003, "t": 173.33471999999995, "r": 301.46902, "b": 185.32275000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9626136422157288, "cells": [{"id": 9, "text": "1.3.1", "bbox": {"l": 64.800003, "t": 173.33471999999995, "r": 94.033653, "b": 185.32275000000004, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Existing row and column control", "bbox": {"l": 97.687859, "t": 173.33471999999995, "r": 301.46902, "b": 185.32275000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1.3.1 Existing row and column control"}, {"label": "text", "id": 2, "page_no": 6, "cluster": {"id": 2, "label": "text", "bbox": {"l": 136.79999, "t": 199.48870999999997, "r": 541.56738, "b": 256.70099000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9858147501945496, "cells": [{"id": 11, "text": "Some IBM i clients have tried augmenting the all-or-nothing object-level security with SQL ", "bbox": {"l": 136.8, "t": 199.48870999999997, "r": 534.90112, "b": 208.70172000000002, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "views (or logical files) and application logic, as shown in Figure 1-2. However, ", "bbox": {"l": 136.8, "t": 211.48852999999997, "r": 480.47281000000004, "b": 220.70154000000002, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "application-based logic is easy to bypass with all of the different data access interfaces that ", "bbox": {"l": 136.8, "t": 223.48834, "r": 541.56738, "b": 232.70135000000005, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "are provided by the IBM i operating system, such as Open Database Connectivity (ODBC) ", "bbox": {"l": 136.8, "t": 235.48816, "r": 537.39423, "b": 244.70117000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "and System i Navigator.", "bbox": {"l": 136.79999, "t": 247.48798, "r": 242.24352000000002, "b": 256.70099000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Some IBM i clients have tried augmenting the all-or-nothing object-level security with SQL views (or logical files) and application logic, as shown in Figure 1-2. However, application-based logic is easy to bypass with all of the different data access interfaces that are provided by the IBM i operating system, such as Open Database Connectivity (ODBC) and System i Navigator."}, {"label": "text", "id": 0, "page_no": 6, "cluster": {"id": 0, "label": "text", "bbox": {"l": 136.79999, "t": 269.50757, "r": 547.4408, "b": 314.72003, "coord_origin": "TOPLEFT"}, "confidence": 0.9875384569168091, "cells": [{"id": 16, "text": "Using SQL views to limit access to a subset of the data in a table also has its own set of ", "bbox": {"l": 136.79999, "t": 269.50757, "r": 526.88428, "b": 278.72058000000004, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "challenges. First, there is the complexity of managing all of the SQL view objects that are ", "bbox": {"l": 136.79999, "t": 281.50742, "r": 531.77087, "b": 290.7203999999999, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "used for securing data access. Second, scaling a view-based security solution can be difficult ", "bbox": {"l": 136.79999, "t": 293.50723000000005, "r": 547.4408, "b": 302.72021, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "as the amount of data grows and the number of users increases.", "bbox": {"l": 136.79999, "t": 305.50705, "r": 421.86725, "b": 314.72003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Using SQL views to limit access to a subset of the data in a table also has its own set of challenges. First, there is the complexity of managing all of the SQL view objects that are used for securing data access. Second, scaling a view-based security solution can be difficult as the amount of data grows and the number of users increases."}, {"label": "text", "id": 4, "page_no": 6, "cluster": {"id": 4, "label": "text", "bbox": {"l": 136.79999, "t": 327.52661, "r": 547.23267, "b": 360.73923, "coord_origin": "TOPLEFT"}, "confidence": 0.975760281085968, "cells": [{"id": 20, "text": "Even if you are willing to live with these performance and management issues, a user with ", "bbox": {"l": 136.79999, "t": 327.52661, "r": 536.46692, "b": 336.7395900000001, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "*ALLOBJ access still can directly access all of the data in the underlying DB2 table and easily ", "bbox": {"l": 136.79999, "t": 339.52643, "r": 547.23267, "b": 348.73941, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "bypass the security controls that are built into an SQL view.", "bbox": {"l": 136.79999, "t": 351.52624999999995, "r": 397.88553, "b": 360.73923, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Even if you are willing to live with these performance and management issues, a user with *ALLOBJ access still can directly access all of the data in the underlying DB2 table and easily bypass the security controls that are built into an SQL view."}, {"label": "caption", "id": 7, "page_no": 6, "cluster": {"id": 7, "label": "caption", "bbox": {"l": 136.8, "t": 691.818, "r": 316.44727, "b": 700.142998, "coord_origin": "TOPLEFT"}, "confidence": 0.9457826614379883, "cells": [{"id": 23, "text": "Figure 1-2 Existing row and column controls", "bbox": {"l": 136.8, "t": 691.818, "r": 316.44727, "b": 700.142998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 1-2 Existing row and column controls"}, {"label": "picture", "id": 3, "page_no": 6, "cluster": {"id": 3, "label": "picture", "bbox": {"l": 135.92466735839844, "t": 375.9272155761719, "r": 546.4456176757812, "b": 688.6098022460938, "coord_origin": "TOPLEFT"}, "confidence": 0.9838992357254028, "cells": [{"id": 24, "text": "User with", "bbox": {"l": 180.95911, "t": 383.45612, "r": 209.08017, "b": 389.0784, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "*ALLOBJ access", "bbox": {"l": 170.00624, "t": 390.95251, "r": 220.10355, "b": 396.57480000000004, "coord_origin": "TOPLEFT"}}], "children": [{"id": 9, "label": "text", "bbox": {"l": 180.95911, "t": 383.45612, "r": 209.08017, "b": 389.0784, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "User with", "bbox": {"l": 180.95911, "t": 383.45612, "r": 209.08017, "b": 389.0784, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "text", "bbox": {"l": 170.00624, "t": 390.95251, "r": 220.10355, "b": 396.57480000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "*ALLOBJ access", "bbox": {"l": 170.00624, "t": 390.95251, "r": 220.10355, "b": 396.57480000000004, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "body": [{"label": "text", "id": 1, "page_no": 6, "cluster": {"id": 1, "label": "text", "bbox": {"l": 136.8, "t": 71.50867000000005, "r": 544.30334, "b": 152.72058000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9872740507125854, "cells": [{"id": 2, "text": "Many businesses are trying to limit data access to a need-to-know basis. This security goal ", "bbox": {"l": 136.8, "t": 71.50867000000005, "r": 541.19006, "b": 80.72167999999999, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "means that users should be given access only to the minimum set of data that is required to ", "bbox": {"l": 136.8, "t": 83.50847999999996, "r": 544.30334, "b": 92.72149999999999, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "perform their job. Often, users with object-level access are given access to row and column ", "bbox": {"l": 136.8, "t": 95.50829999999996, "r": 540.94299, "b": 104.72131000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "values that are beyond what their business task requires because that object-level security ", "bbox": {"l": 136.80002, "t": 107.50811999999996, "r": 538.27454, "b": 116.72113000000002, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "provides an all-or-nothing solution. For example, object-level controls allow a manager to ", "bbox": {"l": 136.80002, "t": 119.50792999999999, "r": 530.23004, "b": 128.72095000000002, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "access data about all employees. Most security policies limit a manager to accessing data ", "bbox": {"l": 136.80002, "t": 131.50775, "r": 536.26263, "b": 140.72076000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "only for the employees that they manage.", "bbox": {"l": 136.80002, "t": 143.50757, "r": 319.04318, "b": 152.72058000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Many businesses are trying to limit data access to a need-to-know basis. This security goal means that users should be given access only to the minimum set of data that is required to perform their job. Often, users with object-level access are given access to row and column values that are beyond what their business task requires because that object-level security provides an all-or-nothing solution. For example, object-level controls allow a manager to access data about all employees. Most security policies limit a manager to accessing data only for the employees that they manage."}, {"label": "section_header", "id": 5, "page_no": 6, "cluster": {"id": 5, "label": "section_header", "bbox": {"l": 64.800003, "t": 173.33471999999995, "r": 301.46902, "b": 185.32275000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9626136422157288, "cells": [{"id": 9, "text": "1.3.1", "bbox": {"l": 64.800003, "t": 173.33471999999995, "r": 94.033653, "b": 185.32275000000004, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Existing row and column control", "bbox": {"l": 97.687859, "t": 173.33471999999995, "r": 301.46902, "b": 185.32275000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1.3.1 Existing row and column control"}, {"label": "text", "id": 2, "page_no": 6, "cluster": {"id": 2, "label": "text", "bbox": {"l": 136.79999, "t": 199.48870999999997, "r": 541.56738, "b": 256.70099000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9858147501945496, "cells": [{"id": 11, "text": "Some IBM i clients have tried augmenting the all-or-nothing object-level security with SQL ", "bbox": {"l": 136.8, "t": 199.48870999999997, "r": 534.90112, "b": 208.70172000000002, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "views (or logical files) and application logic, as shown in Figure 1-2. However, ", "bbox": {"l": 136.8, "t": 211.48852999999997, "r": 480.47281000000004, "b": 220.70154000000002, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "application-based logic is easy to bypass with all of the different data access interfaces that ", "bbox": {"l": 136.8, "t": 223.48834, "r": 541.56738, "b": 232.70135000000005, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "are provided by the IBM i operating system, such as Open Database Connectivity (ODBC) ", "bbox": {"l": 136.8, "t": 235.48816, "r": 537.39423, "b": 244.70117000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "and System i Navigator.", "bbox": {"l": 136.79999, "t": 247.48798, "r": 242.24352000000002, "b": 256.70099000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Some IBM i clients have tried augmenting the all-or-nothing object-level security with SQL views (or logical files) and application logic, as shown in Figure 1-2. However, application-based logic is easy to bypass with all of the different data access interfaces that are provided by the IBM i operating system, such as Open Database Connectivity (ODBC) and System i Navigator."}, {"label": "text", "id": 0, "page_no": 6, "cluster": {"id": 0, "label": "text", "bbox": {"l": 136.79999, "t": 269.50757, "r": 547.4408, "b": 314.72003, "coord_origin": "TOPLEFT"}, "confidence": 0.9875384569168091, "cells": [{"id": 16, "text": "Using SQL views to limit access to a subset of the data in a table also has its own set of ", "bbox": {"l": 136.79999, "t": 269.50757, "r": 526.88428, "b": 278.72058000000004, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "challenges. First, there is the complexity of managing all of the SQL view objects that are ", "bbox": {"l": 136.79999, "t": 281.50742, "r": 531.77087, "b": 290.7203999999999, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "used for securing data access. Second, scaling a view-based security solution can be difficult ", "bbox": {"l": 136.79999, "t": 293.50723000000005, "r": 547.4408, "b": 302.72021, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "as the amount of data grows and the number of users increases.", "bbox": {"l": 136.79999, "t": 305.50705, "r": 421.86725, "b": 314.72003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Using SQL views to limit access to a subset of the data in a table also has its own set of challenges. First, there is the complexity of managing all of the SQL view objects that are used for securing data access. Second, scaling a view-based security solution can be difficult as the amount of data grows and the number of users increases."}, {"label": "text", "id": 4, "page_no": 6, "cluster": {"id": 4, "label": "text", "bbox": {"l": 136.79999, "t": 327.52661, "r": 547.23267, "b": 360.73923, "coord_origin": "TOPLEFT"}, "confidence": 0.975760281085968, "cells": [{"id": 20, "text": "Even if you are willing to live with these performance and management issues, a user with ", "bbox": {"l": 136.79999, "t": 327.52661, "r": 536.46692, "b": 336.7395900000001, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "*ALLOBJ access still can directly access all of the data in the underlying DB2 table and easily ", "bbox": {"l": 136.79999, "t": 339.52643, "r": 547.23267, "b": 348.73941, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "bypass the security controls that are built into an SQL view.", "bbox": {"l": 136.79999, "t": 351.52624999999995, "r": 397.88553, "b": 360.73923, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Even if you are willing to live with these performance and management issues, a user with *ALLOBJ access still can directly access all of the data in the underlying DB2 table and easily bypass the security controls that are built into an SQL view."}, {"label": "caption", "id": 7, "page_no": 6, "cluster": {"id": 7, "label": "caption", "bbox": {"l": 136.8, "t": 691.818, "r": 316.44727, "b": 700.142998, "coord_origin": "TOPLEFT"}, "confidence": 0.9457826614379883, "cells": [{"id": 23, "text": "Figure 1-2 Existing row and column controls", "bbox": {"l": 136.8, "t": 691.818, "r": 316.44727, "b": 700.142998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 1-2 Existing row and column controls"}, {"label": "picture", "id": 3, "page_no": 6, "cluster": {"id": 3, "label": "picture", "bbox": {"l": 135.92466735839844, "t": 375.9272155761719, "r": 546.4456176757812, "b": 688.6098022460938, "coord_origin": "TOPLEFT"}, "confidence": 0.9838992357254028, "cells": [{"id": 24, "text": "User with", "bbox": {"l": 180.95911, "t": 383.45612, "r": 209.08017, "b": 389.0784, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "*ALLOBJ access", "bbox": {"l": 170.00624, "t": 390.95251, "r": 220.10355, "b": 396.57480000000004, "coord_origin": "TOPLEFT"}}], "children": [{"id": 9, "label": "text", "bbox": {"l": 180.95911, "t": 383.45612, "r": 209.08017, "b": 389.0784, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "User with", "bbox": {"l": 180.95911, "t": 383.45612, "r": 209.08017, "b": 389.0784, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "text", "bbox": {"l": 170.00624, "t": 390.95251, "r": 220.10355, "b": 396.57480000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "*ALLOBJ access", "bbox": {"l": 170.00624, "t": 390.95251, "r": 220.10355, "b": 396.57480000000004, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "headers": [{"label": "page_footer", "id": 8, "page_no": 6, "cluster": {"id": 8, "label": "page_footer", "bbox": {"l": 64.800003, "t": 754.848721, "r": 72.821999, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.8578535318374634, "cells": [{"id": 0, "text": "4 ", "bbox": {"l": 64.800003, "t": 754.848721, "r": 72.821999, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4"}, {"label": "page_footer", "id": 6, "page_no": 6, "cluster": {"id": 6, "label": "page_footer", "bbox": {"l": 87.840302, "t": 755.538002, "r": 328.72537, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9491620659828186, "cells": [{"id": 1, "text": "Row and Column Access Control Support in IBM DB2 for i", "bbox": {"l": 87.840302, "t": 755.538002, "r": 328.72537, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Row and Column Access Control Support in IBM DB2 for i"}]}}, {"page_no": 7, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "10 ", "bbox": {"l": 64.800003, "t": 754.848721, "r": 78.402, "b": 764.06172, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Row and Column Access Control Support in IBM DB2 for i", "bbox": {"l": 93.420303, "t": 755.538002, "r": 334.42142, "b": 763.863001, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "2.1.6", "bbox": {"l": 64.800003, "t": 71.33471999999995, "r": 94.081459, "b": 83.32275000000004, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Change Function Usage CL command", "bbox": {"l": 97.741661, "t": 71.33471999999995, "r": 335.49551, "b": 83.32275000000004, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "The following CL commands can be used to work with, display, or change function usage IDs:", "bbox": {"l": 136.8, "t": 97.48870999999997, "r": 547.28442, "b": 106.70172000000014, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "GLYPH<SM590000>", "bbox": {"l": 136.8, "t": 114.67767000000003, "r": 141.78, "b": 123.45245, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Work Function Usage (", "bbox": {"l": 151.20016, "t": 114.52826000000005, "r": 253.26227000000003, "b": 123.74126999999999, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "WRKFCNUSG", "bbox": {"l": 253.26028, "t": 114.67767000000003, "r": 298.1998, "b": 123.50225999999998, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": ")", "bbox": {"l": 298.20081, "t": 114.52826000000005, "r": 301.51749, "b": 123.74126999999999, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "GLYPH<SM590000>", "bbox": {"l": 136.80099, "t": 126.67749000000003, "r": 141.78099, "b": 135.45227, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Change Function Usage (", "bbox": {"l": 151.20116, "t": 126.52808000000005, "r": 265.13354, "b": 135.74108999999999, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "CHGFCNUSG", "bbox": {"l": 265.08081, "t": 126.67749000000003, "r": 310.02032, "b": 135.50207999999998, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": ")", "bbox": {"l": 310.08109, "t": 126.52808000000005, "r": 313.39777, "b": 135.74108999999999, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "GLYPH<SM590000>", "bbox": {"l": 136.80098, "t": 138.67731000000003, "r": 141.78098, "b": 147.45209, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Display Function Usage (", "bbox": {"l": 151.20114, "t": 138.52788999999996, "r": 262.5639, "b": 147.74090999999999, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "DSPFCNUSG", "bbox": {"l": 262.56091, "t": 138.67731000000003, "r": 307.50043, "b": 147.50189, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": ")", "bbox": {"l": 307.50043, "t": 138.52788999999996, "r": 310.81711, "b": 147.74090999999999, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "For example, the following ", "bbox": {"l": 136.79997, "t": 160.48766999999998, "r": 255.09984000000003, "b": 169.70068000000003, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "CHGFCNUSG", "bbox": {"l": 255.00027, "t": 160.63707999999997, "r": 299.99957, "b": 169.46167000000003, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": " command shows granting authorization to user ", "bbox": {"l": 300.00055, "t": 160.48766999999998, "r": 512.53802, "b": 169.70068000000003, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "HBEDOYA to administer and manage RCAC rules:", "bbox": {"l": 136.80096, "t": 172.48748999999998, "r": 360.41989, "b": 181.70050000000003, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "CHGFCNUSG FCNID(QIBM_DB_SECADM) USER(HBEDOYA) USAGE(*ALLOWED)", "bbox": {"l": 136.80096, "t": 189.67645000000005, "r": 441.59686, "b": 198.45123, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "2.1.7", "bbox": {"l": 64.800003, "t": 219.35468000000003, "r": 93.757614, "b": 231.34271, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Verifying function usage IDs for RCAC with the FUNCTION_USAGE view", "bbox": {"l": 97.377296, "t": 219.35468000000003, "r": 544.47546, "b": 231.34271, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "The FUNCTION_USAGE view contains function usage configuration details. Table 2-1 ", "bbox": {"l": 136.8, "t": 245.50867000000005, "r": 519.51794, "b": 254.72168, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "describes the columns in the FUNCTION_USAGE view.", "bbox": {"l": 136.8, "t": 257.50847999999996, "r": 382.94443, "b": 266.7215, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "Table 2-1 FUNCTION_USAGE view", "bbox": {"l": 136.8, "t": 279.55798000000004, "r": 283.96805, "b": 287.88300000000004, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "To discover who has authorization to define and manage RCAC, you can use the query that is ", "bbox": {"l": 136.8, "t": 452.50872999999996, "r": 547.2804, "b": 461.72171, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "shown in Example 2-1.", "bbox": {"l": 136.8, "t": 464.50854, "r": 237.76951999999997, "b": 473.72153, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Example 2-1 Query to determine who has authority to define and manage RCAC", "bbox": {"l": 136.8, "t": 486.55798, "r": 462.35419, "b": 494.883, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "SELECT", "bbox": {"l": 136.8, "t": 503.65802, "r": 171.26956, "b": 512.4328, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "function_id,", "bbox": {"l": 182.75941, "t": 503.65802, "r": 251.69853, "b": 512.4328, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "user_name,", "bbox": {"l": 166.78244, "t": 515.6578400000001, "r": 241.73852999999997, "b": 524.43262, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "usage,", "bbox": {"l": 170.75961, "t": 527.65765, "r": 221.69901999999996, "b": 536.43242, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "user_type", "bbox": {"l": 167.53809, "t": 539.65747, "r": 236.69878, "b": 548.43222, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "FROM", "bbox": {"l": 136.8, "t": 551.65727, "r": 160.59396, "b": 560.43202, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "function_usage", "bbox": {"l": 178.43944, "t": 551.65727, "r": 261.71829, "b": 560.43202, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "WHERE", "bbox": {"l": 136.8, "t": 563.65707, "r": 162.44176, "b": 572.43182, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "function_id=\u2019QIBM_DB_SECADM\u2019", "bbox": {"l": 177.8268, "t": 563.65707, "r": 331.67731, "b": 572.43182, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "ORDER BY", "bbox": {"l": 136.8, "t": 575.65688, "r": 178.77542, "b": 584.43163, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "user_name;", "bbox": {"l": 189.26929, "t": 575.65688, "r": 241.73856, "b": 584.43163, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "2.2", "bbox": {"l": 64.800003, "t": 620.22063, "r": 87.569839, "b": 634.98363, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "Separation of duties", "bbox": {"l": 92.123802, "t": 620.22063, "r": 249.59605000000002, "b": 634.98363, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Separation of duties helps businesses comply with industry regulations or organizational ", "bbox": {"l": 136.8, "t": 652.54872, "r": 529.09357, "b": 661.76172, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "requirements and simplifies the management of authorities. Separation of duties is commonly ", "bbox": {"l": 136.8, "t": 664.54852, "r": 547.22345, "b": 673.76153, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "used to prevent fraudulent activities or errors by a single person. It provides the ability for ", "bbox": {"l": 136.8, "t": 676.54833, "r": 530.89716, "b": 685.76134, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "administrative functions to be divided across individuals without overlapping responsibilities, ", "bbox": {"l": 136.80002, "t": 688.54814, "r": 544.33832, "b": 697.7611469999999, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "so that one user does not possess unlimited authority, such as with the *ALLOBJ authority.", "bbox": {"l": 136.80002, "t": 700.547951, "r": 536.28363, "b": 709.760956, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Column name", "bbox": {"l": 142.8, "t": 296.5379899999999, "r": 202.245, "b": 304.86301, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "Data type", "bbox": {"l": 216.80878999999996, "t": 296.5379899999999, "r": 257.21069, "b": 304.86301, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Description", "bbox": {"l": 289.47479, "t": 296.5379899999999, "r": 338.89468, "b": 304.86301, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "FUNCTION_ID", "bbox": {"l": 142.8, "t": 315.55771, "r": 203.2323, "b": 323.88272, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "VARCHAR(30)", "bbox": {"l": 216.7854, "t": 315.55771, "r": 276.0036, "b": 323.88272, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "ID of the function.", "bbox": {"l": 289.4577, "t": 315.55771, "r": 359.85394, "b": 323.88272, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "USER_NAME", "bbox": {"l": 142.8, "t": 334.51801, "r": 198.6693, "b": 342.84302, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "VARCHAR(10)", "bbox": {"l": 216.74129999999997, "t": 334.51801, "r": 275.92349, "b": 342.84302, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Name of the user profile that has a usage setting for this ", "bbox": {"l": 289.38208, "t": 334.51801, "r": 515.05359, "b": 342.84302, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "function.", "bbox": {"l": 289.4397, "t": 345.55832, "r": 323.43362, "b": 353.88333, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "USAGE", "bbox": {"l": 142.79999, "t": 364.51862, "r": 173.98318, "b": 372.84363, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "VARCHAR(7)", "bbox": {"l": 216.77367999999998, "t": 364.51862, "r": 270.97977, "b": 372.84363, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Usage setting:", "bbox": {"l": 289.41626, "t": 364.51862, "r": 346.88757, "b": 372.84363, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 375.69394000000005, "r": 293.9397, "b": 383.62292, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "ALLOWED: The user profile is allowed to use the function.", "bbox": {"l": 303.83969, "t": 375.55893, "r": 535.16766, "b": 383.88394, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 386.67395, "r": 293.9397, "b": 394.60294, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "DENIED: The user profile is not allowed to use the function.", "bbox": {"l": 303.83969, "t": 386.53894, "r": 539.10712, "b": 394.86395, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "USER_TYPE", "bbox": {"l": 142.8, "t": 405.55865, "r": 196.2249, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "VARCHAR(5)", "bbox": {"l": 216.75211, "t": 405.55865, "r": 270.99872, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "Type of user profile:", "bbox": {"l": 289.43161, "t": 405.55865, "r": 367.8009, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 416.67368000000005, "r": 293.9397, "b": 424.60266, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "USER: The user profile is a user.", "bbox": {"l": 303.83969, "t": 416.53867, "r": 434.78159, "b": 424.86368, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 427.65369, "r": 293.9397, "b": 435.58267000000006, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "GROUP: The user profile is a group.", "bbox": {"l": 303.83969, "t": 427.51868, "r": 448.11963000000003, "b": 435.84369, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 14, "label": "page_footer", "bbox": {"l": 64.800003, "t": 754.848721, "r": 78.402, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.9166396856307983, "cells": [{"id": 0, "text": "10 ", "bbox": {"l": 64.800003, "t": 754.848721, "r": 78.402, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "page_footer", "bbox": {"l": 93.420303, "t": 755.538002, "r": 334.42142, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9530044198036194, "cells": [{"id": 1, "text": "Row and Column Access Control Support in IBM DB2 for i", "bbox": {"l": 93.420303, "t": 755.538002, "r": 334.42142, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "section_header", "bbox": {"l": 64.800003, "t": 71.33471999999995, "r": 335.49551, "b": 83.32275000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9697521328926086, "cells": [{"id": 2, "text": "2.1.6", "bbox": {"l": 64.800003, "t": 71.33471999999995, "r": 94.081459, "b": 83.32275000000004, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Change Function Usage CL command", "bbox": {"l": 97.741661, "t": 71.33471999999995, "r": 335.49551, "b": 83.32275000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 136.8, "t": 97.48870999999997, "r": 547.28442, "b": 106.70172000000014, "coord_origin": "TOPLEFT"}, "confidence": 0.9551582932472229, "cells": [{"id": 4, "text": "The following CL commands can be used to work with, display, or change function usage IDs:", "bbox": {"l": 136.8, "t": 97.48870999999997, "r": 547.28442, "b": 106.70172000000014, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "list_item", "bbox": {"l": 136.8, "t": 114.52826000000005, "r": 301.51749, "b": 123.74126999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9410832524299622, "cells": [{"id": 5, "text": "GLYPH<SM590000>", "bbox": {"l": 136.8, "t": 114.67767000000003, "r": 141.78, "b": 123.45245, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Work Function Usage (", "bbox": {"l": 151.20016, "t": 114.52826000000005, "r": 253.26227000000003, "b": 123.74126999999999, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "WRKFCNUSG", "bbox": {"l": 253.26028, "t": 114.67767000000003, "r": 298.1998, "b": 123.50225999999998, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": ")", "bbox": {"l": 298.20081, "t": 114.52826000000005, "r": 301.51749, "b": 123.74126999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "list_item", "bbox": {"l": 136.80099, "t": 126.52808000000005, "r": 313.39777, "b": 135.74108999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9418092370033264, "cells": [{"id": 9, "text": "GLYPH<SM590000>", "bbox": {"l": 136.80099, "t": 126.67749000000003, "r": 141.78099, "b": 135.45227, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Change Function Usage (", "bbox": {"l": 151.20116, "t": 126.52808000000005, "r": 265.13354, "b": 135.74108999999999, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "CHGFCNUSG", "bbox": {"l": 265.08081, "t": 126.67749000000003, "r": 310.02032, "b": 135.50207999999998, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": ")", "bbox": {"l": 310.08109, "t": 126.52808000000005, "r": 313.39777, "b": 135.74108999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "list_item", "bbox": {"l": 136.80098, "t": 138.52788999999996, "r": 310.81711, "b": 147.74090999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9562349915504456, "cells": [{"id": 13, "text": "GLYPH<SM590000>", "bbox": {"l": 136.80098, "t": 138.67731000000003, "r": 141.78098, "b": 147.45209, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Display Function Usage (", "bbox": {"l": 151.20114, "t": 138.52788999999996, "r": 262.5639, "b": 147.74090999999999, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "DSPFCNUSG", "bbox": {"l": 262.56091, "t": 138.67731000000003, "r": 307.50043, "b": 147.50189, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": ")", "bbox": {"l": 307.50043, "t": 138.52788999999996, "r": 310.81711, "b": 147.74090999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "text", "bbox": {"l": 136.79997, "t": 160.48766999999998, "r": 512.53802, "b": 181.70050000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9682500958442688, "cells": [{"id": 17, "text": "For example, the following ", "bbox": {"l": 136.79997, "t": 160.48766999999998, "r": 255.09984000000003, "b": 169.70068000000003, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "CHGFCNUSG", "bbox": {"l": 255.00027, "t": 160.63707999999997, "r": 299.99957, "b": 169.46167000000003, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": " command shows granting authorization to user ", "bbox": {"l": 300.00055, "t": 160.48766999999998, "r": 512.53802, "b": 169.70068000000003, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "HBEDOYA to administer and manage RCAC rules:", "bbox": {"l": 136.80096, "t": 172.48748999999998, "r": 360.41989, "b": 181.70050000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 136.80096, "t": 189.67645000000005, "r": 441.59686, "b": 198.45123, "coord_origin": "TOPLEFT"}, "confidence": 0.905712902545929, "cells": [{"id": 21, "text": "CHGFCNUSG FCNID(QIBM_DB_SECADM) USER(HBEDOYA) USAGE(*ALLOWED)", "bbox": {"l": 136.80096, "t": 189.67645000000005, "r": 441.59686, "b": 198.45123, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "section_header", "bbox": {"l": 64.800003, "t": 219.35468000000003, "r": 544.47546, "b": 231.34271, "coord_origin": "TOPLEFT"}, "confidence": 0.9636710286140442, "cells": [{"id": 22, "text": "2.1.7", "bbox": {"l": 64.800003, "t": 219.35468000000003, "r": 93.757614, "b": 231.34271, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Verifying function usage IDs for RCAC with the FUNCTION_USAGE view", "bbox": {"l": 97.377296, "t": 219.35468000000003, "r": 544.47546, "b": 231.34271, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 136.8, "t": 245.50867000000005, "r": 519.51794, "b": 266.7215, "coord_origin": "TOPLEFT"}, "confidence": 0.9737311601638794, "cells": [{"id": 24, "text": "The FUNCTION_USAGE view contains function usage configuration details. Table 2-1 ", "bbox": {"l": 136.8, "t": 245.50867000000005, "r": 519.51794, "b": 254.72168, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "describes the columns in the FUNCTION_USAGE view.", "bbox": {"l": 136.8, "t": 257.50847999999996, "r": 382.94443, "b": 266.7215, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "caption", "bbox": {"l": 136.8, "t": 279.55798000000004, "r": 283.96805, "b": 287.88300000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9196999669075012, "cells": [{"id": 26, "text": "Table 2-1 FUNCTION_USAGE view", "bbox": {"l": 136.8, "t": 279.55798000000004, "r": 283.96805, "b": 287.88300000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "text", "bbox": {"l": 136.8, "t": 452.50872999999996, "r": 547.2804, "b": 473.72153, "coord_origin": "TOPLEFT"}, "confidence": 0.964775562286377, "cells": [{"id": 27, "text": "To discover who has authorization to define and manage RCAC, you can use the query that is ", "bbox": {"l": 136.8, "t": 452.50872999999996, "r": 547.2804, "b": 461.72171, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "shown in Example 2-1.", "bbox": {"l": 136.8, "t": 464.50854, "r": 237.76951999999997, "b": 473.72153, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "caption", "bbox": {"l": 136.8, "t": 486.55798, "r": 462.35419, "b": 494.883, "coord_origin": "TOPLEFT"}, "confidence": 0.8159958720207214, "cells": [{"id": 29, "text": "Example 2-1 Query to determine who has authority to define and manage RCAC", "bbox": {"l": 136.8, "t": 486.55798, "r": 462.35419, "b": 494.883, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "key_value_region", "bbox": {"l": 136.8, "t": 503.65802, "r": 331.67731, "b": 584.43163, "coord_origin": "TOPLEFT"}, "confidence": 0.5808265805244446, "cells": [{"id": 30, "text": "SELECT", "bbox": {"l": 136.8, "t": 503.65802, "r": 171.26956, "b": 512.4328, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "function_id,", "bbox": {"l": 182.75941, "t": 503.65802, "r": 251.69853, "b": 512.4328, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "user_name,", "bbox": {"l": 166.78244, "t": 515.6578400000001, "r": 241.73852999999997, "b": 524.43262, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "usage,", "bbox": {"l": 170.75961, "t": 527.65765, "r": 221.69901999999996, "b": 536.43242, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "user_type", "bbox": {"l": 167.53809, "t": 539.65747, "r": 236.69878, "b": 548.43222, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "FROM", "bbox": {"l": 136.8, "t": 551.65727, "r": 160.59396, "b": 560.43202, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "function_usage", "bbox": {"l": 178.43944, "t": 551.65727, "r": 261.71829, "b": 560.43202, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "WHERE", "bbox": {"l": 136.8, "t": 563.65707, "r": 162.44176, "b": 572.43182, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "function_id=\u2019QIBM_DB_SECADM\u2019", "bbox": {"l": 177.8268, "t": 563.65707, "r": 331.67731, "b": 572.43182, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "ORDER BY", "bbox": {"l": 136.8, "t": 575.65688, "r": 178.77542, "b": 584.43163, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "user_name;", "bbox": {"l": 189.26929, "t": 575.65688, "r": 241.73856, "b": 584.43163, "coord_origin": "TOPLEFT"}}], "children": [{"id": 19, "label": "text", "bbox": {"l": 136.8, "t": 503.65802, "r": 171.26956, "b": 512.4328, "coord_origin": "TOPLEFT"}, "confidence": 0.5631121397018433, "cells": [{"id": 30, "text": "SELECT", "bbox": {"l": 136.8, "t": 503.65802, "r": 171.26956, "b": 512.4328, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 182.75941, "t": 503.65802, "r": 251.69853, "b": 512.4328, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "function_id,", "bbox": {"l": 182.75941, "t": 503.65802, "r": 251.69853, "b": 512.4328, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 166.78244, "t": 515.6578400000001, "r": 241.73852999999997, "b": 524.43262, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "user_name,", "bbox": {"l": 166.78244, "t": 515.6578400000001, "r": 241.73852999999997, "b": 524.43262, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 170.75961, "t": 527.65765, "r": 221.69901999999996, "b": 536.43242, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "usage,", "bbox": {"l": 170.75961, "t": 527.65765, "r": 221.69901999999996, "b": 536.43242, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 167.53809, "t": 539.65747, "r": 236.69878, "b": 548.43222, "coord_origin": "TOPLEFT"}, "confidence": 0.5346826314926147, "cells": [{"id": 34, "text": "user_type", "bbox": {"l": 167.53809, "t": 539.65747, "r": 236.69878, "b": 548.43222, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 136.8, "t": 551.65727, "r": 160.59396, "b": 560.43202, "coord_origin": "TOPLEFT"}, "confidence": 0.581838846206665, "cells": [{"id": 35, "text": "FROM", "bbox": {"l": 136.8, "t": 551.65727, "r": 160.59396, "b": 560.43202, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 178.43944, "t": 551.65727, "r": 261.71829, "b": 560.43202, "coord_origin": "TOPLEFT"}, "confidence": 0.5035740733146667, "cells": [{"id": 36, "text": "function_usage", "bbox": {"l": 178.43944, "t": 551.65727, "r": 261.71829, "b": 560.43202, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 136.8, "t": 563.65707, "r": 162.44176, "b": 572.43182, "coord_origin": "TOPLEFT"}, "confidence": 0.534027099609375, "cells": [{"id": 37, "text": "WHERE", "bbox": {"l": 136.8, "t": 563.65707, "r": 162.44176, "b": 572.43182, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 177.8268, "t": 563.65707, "r": 331.67731, "b": 572.43182, "coord_origin": "TOPLEFT"}, "confidence": 0.5171723365783691, "cells": [{"id": 38, "text": "function_id=\u2019QIBM_DB_SECADM\u2019", "bbox": {"l": 177.8268, "t": 563.65707, "r": 331.67731, "b": 572.43182, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 136.8, "t": 575.65688, "r": 178.77542, "b": 584.43163, "coord_origin": "TOPLEFT"}, "confidence": 0.5373470187187195, "cells": [{"id": 39, "text": "ORDER BY", "bbox": {"l": 136.8, "t": 575.65688, "r": 178.77542, "b": 584.43163, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 189.26929, "t": 575.65688, "r": 241.73856, "b": 584.43163, "coord_origin": "TOPLEFT"}, "confidence": 0.5167025327682495, "cells": [{"id": 40, "text": "user_name;", "bbox": {"l": 189.26929, "t": 575.65688, "r": 241.73856, "b": 584.43163, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 5, "label": "section_header", "bbox": {"l": 64.800003, "t": 620.22063, "r": 249.59605000000002, "b": 634.98363, "coord_origin": "TOPLEFT"}, "confidence": 0.9656105041503906, "cells": [{"id": 41, "text": "2.2", "bbox": {"l": 64.800003, "t": 620.22063, "r": 87.569839, "b": 634.98363, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "Separation of duties", "bbox": {"l": 92.123802, "t": 620.22063, "r": 249.59605000000002, "b": 634.98363, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 136.8, "t": 652.54872, "r": 547.22345, "b": 709.760956, "coord_origin": "TOPLEFT"}, "confidence": 0.9853070974349976, "cells": [{"id": 43, "text": "Separation of duties helps businesses comply with industry regulations or organizational ", "bbox": {"l": 136.8, "t": 652.54872, "r": 529.09357, "b": 661.76172, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "requirements and simplifies the management of authorities. Separation of duties is commonly ", "bbox": {"l": 136.8, "t": 664.54852, "r": 547.22345, "b": 673.76153, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "used to prevent fraudulent activities or errors by a single person. It provides the ability for ", "bbox": {"l": 136.8, "t": 676.54833, "r": 530.89716, "b": 685.76134, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "administrative functions to be divided across individuals without overlapping responsibilities, ", "bbox": {"l": 136.80002, "t": 688.54814, "r": 544.33832, "b": 697.7611469999999, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "so that one user does not possess unlimited authority, such as with the *ALLOBJ authority.", "bbox": {"l": 136.80002, "t": 700.547951, "r": 536.28363, "b": 709.760956, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "table", "bbox": {"l": 135.52462768554688, "t": 289.7252197265625, "r": 545.8714599609375, "b": 442.050537109375, "coord_origin": "TOPLEFT"}, "confidence": 0.9851690530776978, "cells": [{"id": 48, "text": "Column name", "bbox": {"l": 142.8, "t": 296.5379899999999, "r": 202.245, "b": 304.86301, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "Data type", "bbox": {"l": 216.80878999999996, "t": 296.5379899999999, "r": 257.21069, "b": 304.86301, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Description", "bbox": {"l": 289.47479, "t": 296.5379899999999, "r": 338.89468, "b": 304.86301, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "FUNCTION_ID", "bbox": {"l": 142.8, "t": 315.55771, "r": 203.2323, "b": 323.88272, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "VARCHAR(30)", "bbox": {"l": 216.7854, "t": 315.55771, "r": 276.0036, "b": 323.88272, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "ID of the function.", "bbox": {"l": 289.4577, "t": 315.55771, "r": 359.85394, "b": 323.88272, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "USER_NAME", "bbox": {"l": 142.8, "t": 334.51801, "r": 198.6693, "b": 342.84302, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "VARCHAR(10)", "bbox": {"l": 216.74129999999997, "t": 334.51801, "r": 275.92349, "b": 342.84302, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Name of the user profile that has a usage setting for this ", "bbox": {"l": 289.38208, "t": 334.51801, "r": 515.05359, "b": 342.84302, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "function.", "bbox": {"l": 289.4397, "t": 345.55832, "r": 323.43362, "b": 353.88333, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "USAGE", "bbox": {"l": 142.79999, "t": 364.51862, "r": 173.98318, "b": 372.84363, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "VARCHAR(7)", "bbox": {"l": 216.77367999999998, "t": 364.51862, "r": 270.97977, "b": 372.84363, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Usage setting:", "bbox": {"l": 289.41626, "t": 364.51862, "r": 346.88757, "b": 372.84363, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 375.69394000000005, "r": 293.9397, "b": 383.62292, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "ALLOWED: The user profile is allowed to use the function.", "bbox": {"l": 303.83969, "t": 375.55893, "r": 535.16766, "b": 383.88394, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 386.67395, "r": 293.9397, "b": 394.60294, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "DENIED: The user profile is not allowed to use the function.", "bbox": {"l": 303.83969, "t": 386.53894, "r": 539.10712, "b": 394.86395, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "USER_TYPE", "bbox": {"l": 142.8, "t": 405.55865, "r": 196.2249, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "VARCHAR(5)", "bbox": {"l": 216.75211, "t": 405.55865, "r": 270.99872, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "Type of user profile:", "bbox": {"l": 289.43161, "t": 405.55865, "r": 367.8009, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 416.67368000000005, "r": 293.9397, "b": 424.60266, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "USER: The user profile is a user.", "bbox": {"l": 303.83969, "t": 416.53867, "r": 434.78159, "b": 424.86368, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 427.65369, "r": 293.9397, "b": 435.58267000000006, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "GROUP: The user profile is a group.", "bbox": {"l": 303.83969, "t": 427.51868, "r": 448.11963000000003, "b": 435.84369, "coord_origin": "TOPLEFT"}}], "children": [{"id": 31, "label": "text", "bbox": {"l": 142.8, "t": 296.5379899999999, "r": 202.245, "b": 304.86301, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "Column name", "bbox": {"l": 142.8, "t": 296.5379899999999, "r": 202.245, "b": 304.86301, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 216.80878999999996, "t": 296.5379899999999, "r": 257.21069, "b": 304.86301, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "Data type", "bbox": {"l": 216.80878999999996, "t": 296.5379899999999, "r": 257.21069, "b": 304.86301, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 289.47479, "t": 296.5379899999999, "r": 338.89468, "b": 304.86301, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "Description", "bbox": {"l": 289.47479, "t": 296.5379899999999, "r": 338.89468, "b": 304.86301, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 142.8, "t": 315.55771, "r": 203.2323, "b": 323.88272, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "FUNCTION_ID", "bbox": {"l": 142.8, "t": 315.55771, "r": 203.2323, "b": 323.88272, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 216.7854, "t": 315.55771, "r": 276.0036, "b": 323.88272, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "VARCHAR(30)", "bbox": {"l": 216.7854, "t": 315.55771, "r": 276.0036, "b": 323.88272, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 289.4577, "t": 315.55771, "r": 359.85394, "b": 323.88272, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "ID of the function.", "bbox": {"l": 289.4577, "t": 315.55771, "r": 359.85394, "b": 323.88272, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 142.8, "t": 334.51801, "r": 198.6693, "b": 342.84302, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "USER_NAME", "bbox": {"l": 142.8, "t": 334.51801, "r": 198.6693, "b": 342.84302, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 216.74129999999997, "t": 334.51801, "r": 275.92349, "b": 342.84302, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "VARCHAR(10)", "bbox": {"l": 216.74129999999997, "t": 334.51801, "r": 275.92349, "b": 342.84302, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 289.38208, "t": 334.51801, "r": 515.05359, "b": 342.84302, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "Name of the user profile that has a usage setting for this ", "bbox": {"l": 289.38208, "t": 334.51801, "r": 515.05359, "b": 342.84302, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 289.4397, "t": 345.55832, "r": 323.43362, "b": 353.88333, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "function.", "bbox": {"l": 289.4397, "t": 345.55832, "r": 323.43362, "b": 353.88333, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 142.79999, "t": 364.51862, "r": 173.98318, "b": 372.84363, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "USAGE", "bbox": {"l": 142.79999, "t": 364.51862, "r": 173.98318, "b": 372.84363, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 216.77367999999998, "t": 364.51862, "r": 270.97977, "b": 372.84363, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "VARCHAR(7)", "bbox": {"l": 216.77367999999998, "t": 364.51862, "r": 270.97977, "b": 372.84363, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 289.41626, "t": 364.51862, "r": 346.88757, "b": 372.84363, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "Usage setting:", "bbox": {"l": 289.41626, "t": 364.51862, "r": 346.88757, "b": 372.84363, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 289.4397, "t": 375.69394000000005, "r": 293.9397, "b": 383.62292, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 375.69394000000005, "r": 293.9397, "b": 383.62292, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 303.83969, "t": 375.55893, "r": 535.16766, "b": 383.88394, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "ALLOWED: The user profile is allowed to use the function.", "bbox": {"l": 303.83969, "t": 375.55893, "r": 535.16766, "b": 383.88394, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 289.4397, "t": 386.67395, "r": 293.9397, "b": 394.60294, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 386.67395, "r": 293.9397, "b": 394.60294, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 303.83969, "t": 386.53894, "r": 539.10712, "b": 394.86395, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "DENIED: The user profile is not allowed to use the function.", "bbox": {"l": 303.83969, "t": 386.53894, "r": 539.10712, "b": 394.86395, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 142.8, "t": 405.55865, "r": 196.2249, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "USER_TYPE", "bbox": {"l": 142.8, "t": 405.55865, "r": 196.2249, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 216.75211, "t": 405.55865, "r": 270.99872, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "VARCHAR(5)", "bbox": {"l": 216.75211, "t": 405.55865, "r": 270.99872, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 289.43161, "t": 405.55865, "r": 367.8009, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "Type of user profile:", "bbox": {"l": 289.43161, "t": 405.55865, "r": 367.8009, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 289.4397, "t": 416.67368000000005, "r": 293.9397, "b": 424.60266, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 416.67368000000005, "r": 293.9397, "b": 424.60266, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 303.83969, "t": 416.53867, "r": 434.78159, "b": 424.86368, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "USER: The user profile is a user.", "bbox": {"l": 303.83969, "t": 416.53867, "r": 434.78159, "b": 424.86368, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 289.4397, "t": 427.65369, "r": 293.9397, "b": 435.58267000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 427.65369, "r": 293.9397, "b": 435.58267000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 303.83969, "t": 427.51868, "r": 448.11963000000003, "b": 435.84369, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "GROUP: The user profile is a group.", "bbox": {"l": 303.83969, "t": 427.51868, "r": 448.11963000000003, "b": 435.84369, "coord_origin": "TOPLEFT"}}], "children": []}]}]}, "tablestructure": {"table_map": {"1": {"label": "table", "id": 1, "page_no": 7, "cluster": {"id": 1, "label": "table", "bbox": {"l": 135.52462768554688, "t": 289.7252197265625, "r": 545.8714599609375, "b": 442.050537109375, "coord_origin": "TOPLEFT"}, "confidence": 0.9851690530776978, "cells": [{"id": 48, "text": "Column name", "bbox": {"l": 142.8, "t": 296.5379899999999, "r": 202.245, "b": 304.86301, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "Data type", "bbox": {"l": 216.80878999999996, "t": 296.5379899999999, "r": 257.21069, "b": 304.86301, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Description", "bbox": {"l": 289.47479, "t": 296.5379899999999, "r": 338.89468, "b": 304.86301, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "FUNCTION_ID", "bbox": {"l": 142.8, "t": 315.55771, "r": 203.2323, "b": 323.88272, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "VARCHAR(30)", "bbox": {"l": 216.7854, "t": 315.55771, "r": 276.0036, "b": 323.88272, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "ID of the function.", "bbox": {"l": 289.4577, "t": 315.55771, "r": 359.85394, "b": 323.88272, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "USER_NAME", "bbox": {"l": 142.8, "t": 334.51801, "r": 198.6693, "b": 342.84302, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "VARCHAR(10)", "bbox": {"l": 216.74129999999997, "t": 334.51801, "r": 275.92349, "b": 342.84302, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Name of the user profile that has a usage setting for this ", "bbox": {"l": 289.38208, "t": 334.51801, "r": 515.05359, "b": 342.84302, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "function.", "bbox": {"l": 289.4397, "t": 345.55832, "r": 323.43362, "b": 353.88333, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "USAGE", "bbox": {"l": 142.79999, "t": 364.51862, "r": 173.98318, "b": 372.84363, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "VARCHAR(7)", "bbox": {"l": 216.77367999999998, "t": 364.51862, "r": 270.97977, "b": 372.84363, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Usage setting:", "bbox": {"l": 289.41626, "t": 364.51862, "r": 346.88757, "b": 372.84363, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 375.69394000000005, "r": 293.9397, "b": 383.62292, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "ALLOWED: The user profile is allowed to use the function.", "bbox": {"l": 303.83969, "t": 375.55893, "r": 535.16766, "b": 383.88394, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 386.67395, "r": 293.9397, "b": 394.60294, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "DENIED: The user profile is not allowed to use the function.", "bbox": {"l": 303.83969, "t": 386.53894, "r": 539.10712, "b": 394.86395, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "USER_TYPE", "bbox": {"l": 142.8, "t": 405.55865, "r": 196.2249, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "VARCHAR(5)", "bbox": {"l": 216.75211, "t": 405.55865, "r": 270.99872, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "Type of user profile:", "bbox": {"l": 289.43161, "t": 405.55865, "r": 367.8009, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 416.67368000000005, "r": 293.9397, "b": 424.60266, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "USER: The user profile is a user.", "bbox": {"l": 303.83969, "t": 416.53867, "r": 434.78159, "b": 424.86368, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 427.65369, "r": 293.9397, "b": 435.58267000000006, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "GROUP: The user profile is a group.", "bbox": {"l": 303.83969, "t": 427.51868, "r": 448.11963000000003, "b": 435.84369, "coord_origin": "TOPLEFT"}}], "children": [{"id": 31, "label": "text", "bbox": {"l": 142.8, "t": 296.5379899999999, "r": 202.245, "b": 304.86301, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "Column name", "bbox": {"l": 142.8, "t": 296.5379899999999, "r": 202.245, "b": 304.86301, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 216.80878999999996, "t": 296.5379899999999, "r": 257.21069, "b": 304.86301, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "Data type", "bbox": {"l": 216.80878999999996, "t": 296.5379899999999, "r": 257.21069, "b": 304.86301, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 289.47479, "t": 296.5379899999999, "r": 338.89468, "b": 304.86301, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "Description", "bbox": {"l": 289.47479, "t": 296.5379899999999, "r": 338.89468, "b": 304.86301, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 142.8, "t": 315.55771, "r": 203.2323, "b": 323.88272, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "FUNCTION_ID", "bbox": {"l": 142.8, "t": 315.55771, "r": 203.2323, "b": 323.88272, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 216.7854, "t": 315.55771, "r": 276.0036, "b": 323.88272, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "VARCHAR(30)", "bbox": {"l": 216.7854, "t": 315.55771, "r": 276.0036, "b": 323.88272, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 289.4577, "t": 315.55771, "r": 359.85394, "b": 323.88272, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "ID of the function.", "bbox": {"l": 289.4577, "t": 315.55771, "r": 359.85394, "b": 323.88272, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 142.8, "t": 334.51801, "r": 198.6693, "b": 342.84302, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "USER_NAME", "bbox": {"l": 142.8, "t": 334.51801, "r": 198.6693, "b": 342.84302, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 216.74129999999997, "t": 334.51801, "r": 275.92349, "b": 342.84302, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "VARCHAR(10)", "bbox": {"l": 216.74129999999997, "t": 334.51801, "r": 275.92349, "b": 342.84302, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 289.38208, "t": 334.51801, "r": 515.05359, "b": 342.84302, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "Name of the user profile that has a usage setting for this ", "bbox": {"l": 289.38208, "t": 334.51801, "r": 515.05359, "b": 342.84302, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 289.4397, "t": 345.55832, "r": 323.43362, "b": 353.88333, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "function.", "bbox": {"l": 289.4397, "t": 345.55832, "r": 323.43362, "b": 353.88333, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 142.79999, "t": 364.51862, "r": 173.98318, "b": 372.84363, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "USAGE", "bbox": {"l": 142.79999, "t": 364.51862, "r": 173.98318, "b": 372.84363, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 216.77367999999998, "t": 364.51862, "r": 270.97977, "b": 372.84363, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "VARCHAR(7)", "bbox": {"l": 216.77367999999998, "t": 364.51862, "r": 270.97977, "b": 372.84363, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 289.41626, "t": 364.51862, "r": 346.88757, "b": 372.84363, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "Usage setting:", "bbox": {"l": 289.41626, "t": 364.51862, "r": 346.88757, "b": 372.84363, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 289.4397, "t": 375.69394000000005, "r": 293.9397, "b": 383.62292, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 375.69394000000005, "r": 293.9397, "b": 383.62292, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 303.83969, "t": 375.55893, "r": 535.16766, "b": 383.88394, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "ALLOWED: The user profile is allowed to use the function.", "bbox": {"l": 303.83969, "t": 375.55893, "r": 535.16766, "b": 383.88394, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 289.4397, "t": 386.67395, "r": 293.9397, "b": 394.60294, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 386.67395, "r": 293.9397, "b": 394.60294, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 303.83969, "t": 386.53894, "r": 539.10712, "b": 394.86395, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "DENIED: The user profile is not allowed to use the function.", "bbox": {"l": 303.83969, "t": 386.53894, "r": 539.10712, "b": 394.86395, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 142.8, "t": 405.55865, "r": 196.2249, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "USER_TYPE", "bbox": {"l": 142.8, "t": 405.55865, "r": 196.2249, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 216.75211, "t": 405.55865, "r": 270.99872, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "VARCHAR(5)", "bbox": {"l": 216.75211, "t": 405.55865, "r": 270.99872, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 289.43161, "t": 405.55865, "r": 367.8009, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "Type of user profile:", "bbox": {"l": 289.43161, "t": 405.55865, "r": 367.8009, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 289.4397, "t": 416.67368000000005, "r": 293.9397, "b": 424.60266, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 416.67368000000005, "r": 293.9397, "b": 424.60266, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 303.83969, "t": 416.53867, "r": 434.78159, "b": 424.86368, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "USER: The user profile is a user.", "bbox": {"l": 303.83969, "t": 416.53867, "r": 434.78159, "b": 424.86368, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 289.4397, "t": 427.65369, "r": 293.9397, "b": 435.58267000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 427.65369, "r": 293.9397, "b": 435.58267000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 303.83969, "t": 427.51868, "r": 448.11963000000003, "b": 435.84369, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "GROUP: The user profile is a group.", "bbox": {"l": 303.83969, "t": 427.51868, "r": 448.11963000000003, "b": 435.84369, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl"], "num_rows": 5, "num_cols": 3, "table_cells": [{"bbox": {"l": 142.8, "t": 296.5379899999999, "r": 202.245, "b": 304.86301, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Column name", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 216.80878999999996, "t": 296.5379899999999, "r": 257.21069, "b": 304.86301, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Data type", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 289.47479, "t": 296.5379899999999, "r": 338.89468, "b": 304.86301, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Description", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 142.8, "t": 315.55771, "r": 203.2323, "b": 323.88272, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "FUNCTION_ID", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 216.7854, "t": 315.55771, "r": 276.0036, "b": 323.88272, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(30)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.4577, "t": 315.55771, "r": 359.85394, "b": 323.88272, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "ID of the function.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 142.8, "t": 334.51801, "r": 198.6693, "b": 342.84302, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "USER_NAME", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 216.74129999999997, "t": 334.51801, "r": 275.92349, "b": 342.84302, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(10)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.38208, "t": 334.51801, "r": 515.05359, "b": 353.88333, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Name of the user profile that has a usage setting for this  function.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 142.79999, "t": 364.51862, "r": 173.98318, "b": 372.84363, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "USAGE", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 216.77367999999998, "t": 364.51862, "r": 270.97977, "b": 372.84363, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(7)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.41626, "t": 364.51862, "r": 539.10712, "b": 394.86395, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Usage setting: GLYPH<SM590000> ALLOWED: The user profile is allowed to use the function. GLYPH<SM590000> DENIED: The user profile is not allowed to use the function.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 142.8, "t": 405.55865, "r": 196.2249, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "USER_TYPE", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 216.75211, "t": 405.55865, "r": 270.99872, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(5)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.43161, "t": 405.55865, "r": 448.11963000000003, "b": 435.84369, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Type of user profile: GLYPH<SM590000> USER: The user profile is a user. GLYPH<SM590000> GROUP: The user profile is a group.", "column_header": false, "row_header": false, "row_section": false}]}}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_footer", "id": 14, "page_no": 7, "cluster": {"id": 14, "label": "page_footer", "bbox": {"l": 64.800003, "t": 754.848721, "r": 78.402, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.9166396856307983, "cells": [{"id": 0, "text": "10 ", "bbox": {"l": 64.800003, "t": 754.848721, "r": 78.402, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "10"}, {"label": "page_footer", "id": 10, "page_no": 7, "cluster": {"id": 10, "label": "page_footer", "bbox": {"l": 93.420303, "t": 755.538002, "r": 334.42142, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9530044198036194, "cells": [{"id": 1, "text": "Row and Column Access Control Support in IBM DB2 for i", "bbox": {"l": 93.420303, "t": 755.538002, "r": 334.42142, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Row and Column Access Control Support in IBM DB2 for i"}, {"label": "section_header", "id": 3, "page_no": 7, "cluster": {"id": 3, "label": "section_header", "bbox": {"l": 64.800003, "t": 71.33471999999995, "r": 335.49551, "b": 83.32275000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9697521328926086, "cells": [{"id": 2, "text": "2.1.6", "bbox": {"l": 64.800003, "t": 71.33471999999995, "r": 94.081459, "b": 83.32275000000004, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Change Function Usage CL command", "bbox": {"l": 97.741661, "t": 71.33471999999995, "r": 335.49551, "b": 83.32275000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2.1.6 Change Function Usage CL command"}, {"label": "text", "id": 9, "page_no": 7, "cluster": {"id": 9, "label": "text", "bbox": {"l": 136.8, "t": 97.48870999999997, "r": 547.28442, "b": 106.70172000000014, "coord_origin": "TOPLEFT"}, "confidence": 0.9551582932472229, "cells": [{"id": 4, "text": "The following CL commands can be used to work with, display, or change function usage IDs:", "bbox": {"l": 136.8, "t": 97.48870999999997, "r": 547.28442, "b": 106.70172000000014, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The following CL commands can be used to work with, display, or change function usage IDs:"}, {"label": "list_item", "id": 12, "page_no": 7, "cluster": {"id": 12, "label": "list_item", "bbox": {"l": 136.8, "t": 114.52826000000005, "r": 301.51749, "b": 123.74126999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9410832524299622, "cells": [{"id": 5, "text": "GLYPH<SM590000>", "bbox": {"l": 136.8, "t": 114.67767000000003, "r": 141.78, "b": 123.45245, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Work Function Usage (", "bbox": {"l": 151.20016, "t": 114.52826000000005, "r": 253.26227000000003, "b": 123.74126999999999, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "WRKFCNUSG", "bbox": {"l": 253.26028, "t": 114.67767000000003, "r": 298.1998, "b": 123.50225999999998, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": ")", "bbox": {"l": 298.20081, "t": 114.52826000000005, "r": 301.51749, "b": 123.74126999999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<SM590000> Work Function Usage ( WRKFCNUSG )"}, {"label": "list_item", "id": 11, "page_no": 7, "cluster": {"id": 11, "label": "list_item", "bbox": {"l": 136.80099, "t": 126.52808000000005, "r": 313.39777, "b": 135.74108999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9418092370033264, "cells": [{"id": 9, "text": "GLYPH<SM590000>", "bbox": {"l": 136.80099, "t": 126.67749000000003, "r": 141.78099, "b": 135.45227, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Change Function Usage (", "bbox": {"l": 151.20116, "t": 126.52808000000005, "r": 265.13354, "b": 135.74108999999999, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "CHGFCNUSG", "bbox": {"l": 265.08081, "t": 126.67749000000003, "r": 310.02032, "b": 135.50207999999998, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": ")", "bbox": {"l": 310.08109, "t": 126.52808000000005, "r": 313.39777, "b": 135.74108999999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<SM590000> Change Function Usage ( CHGFCNUSG )"}, {"label": "list_item", "id": 8, "page_no": 7, "cluster": {"id": 8, "label": "list_item", "bbox": {"l": 136.80098, "t": 138.52788999999996, "r": 310.81711, "b": 147.74090999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9562349915504456, "cells": [{"id": 13, "text": "GLYPH<SM590000>", "bbox": {"l": 136.80098, "t": 138.67731000000003, "r": 141.78098, "b": 147.45209, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Display Function Usage (", "bbox": {"l": 151.20114, "t": 138.52788999999996, "r": 262.5639, "b": 147.74090999999999, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "DSPFCNUSG", "bbox": {"l": 262.56091, "t": 138.67731000000003, "r": 307.50043, "b": 147.50189, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": ")", "bbox": {"l": 307.50043, "t": 138.52788999999996, "r": 310.81711, "b": 147.74090999999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<SM590000> Display Function Usage ( DSPFCNUSG )"}, {"label": "text", "id": 4, "page_no": 7, "cluster": {"id": 4, "label": "text", "bbox": {"l": 136.79997, "t": 160.48766999999998, "r": 512.53802, "b": 181.70050000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9682500958442688, "cells": [{"id": 17, "text": "For example, the following ", "bbox": {"l": 136.79997, "t": 160.48766999999998, "r": 255.09984000000003, "b": 169.70068000000003, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "CHGFCNUSG", "bbox": {"l": 255.00027, "t": 160.63707999999997, "r": 299.99957, "b": 169.46167000000003, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": " command shows granting authorization to user ", "bbox": {"l": 300.00055, "t": 160.48766999999998, "r": 512.53802, "b": 169.70068000000003, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "HBEDOYA to administer and manage RCAC rules:", "bbox": {"l": 136.80096, "t": 172.48748999999998, "r": 360.41989, "b": 181.70050000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "For example, the following CHGFCNUSG command shows granting authorization to user HBEDOYA to administer and manage RCAC rules:"}, {"label": "text", "id": 15, "page_no": 7, "cluster": {"id": 15, "label": "text", "bbox": {"l": 136.80096, "t": 189.67645000000005, "r": 441.59686, "b": 198.45123, "coord_origin": "TOPLEFT"}, "confidence": 0.905712902545929, "cells": [{"id": 21, "text": "CHGFCNUSG FCNID(QIBM_DB_SECADM) USER(HBEDOYA) USAGE(*ALLOWED)", "bbox": {"l": 136.80096, "t": 189.67645000000005, "r": 441.59686, "b": 198.45123, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "CHGFCNUSG FCNID(QIBM_DB_SECADM) USER(HBEDOYA) USAGE(*ALLOWED)"}, {"label": "section_header", "id": 7, "page_no": 7, "cluster": {"id": 7, "label": "section_header", "bbox": {"l": 64.800003, "t": 219.35468000000003, "r": 544.47546, "b": 231.34271, "coord_origin": "TOPLEFT"}, "confidence": 0.9636710286140442, "cells": [{"id": 22, "text": "2.1.7", "bbox": {"l": 64.800003, "t": 219.35468000000003, "r": 93.757614, "b": 231.34271, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Verifying function usage IDs for RCAC with the FUNCTION_USAGE view", "bbox": {"l": 97.377296, "t": 219.35468000000003, "r": 544.47546, "b": 231.34271, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2.1.7 Verifying function usage IDs for RCAC with the FUNCTION_USAGE view"}, {"label": "text", "id": 2, "page_no": 7, "cluster": {"id": 2, "label": "text", "bbox": {"l": 136.8, "t": 245.50867000000005, "r": 519.51794, "b": 266.7215, "coord_origin": "TOPLEFT"}, "confidence": 0.9737311601638794, "cells": [{"id": 24, "text": "The FUNCTION_USAGE view contains function usage configuration details. Table 2-1 ", "bbox": {"l": 136.8, "t": 245.50867000000005, "r": 519.51794, "b": 254.72168, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "describes the columns in the FUNCTION_USAGE view.", "bbox": {"l": 136.8, "t": 257.50847999999996, "r": 382.94443, "b": 266.7215, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The FUNCTION_USAGE view contains function usage configuration details. Table 2-1 describes the columns in the FUNCTION_USAGE view."}, {"label": "caption", "id": 13, "page_no": 7, "cluster": {"id": 13, "label": "caption", "bbox": {"l": 136.8, "t": 279.55798000000004, "r": 283.96805, "b": 287.88300000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9196999669075012, "cells": [{"id": 26, "text": "Table 2-1 FUNCTION_USAGE view", "bbox": {"l": 136.8, "t": 279.55798000000004, "r": 283.96805, "b": 287.88300000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 2-1 FUNCTION_USAGE view"}, {"label": "text", "id": 6, "page_no": 7, "cluster": {"id": 6, "label": "text", "bbox": {"l": 136.8, "t": 452.50872999999996, "r": 547.2804, "b": 473.72153, "coord_origin": "TOPLEFT"}, "confidence": 0.964775562286377, "cells": [{"id": 27, "text": "To discover who has authorization to define and manage RCAC, you can use the query that is ", "bbox": {"l": 136.8, "t": 452.50872999999996, "r": 547.2804, "b": 461.72171, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "shown in Example 2-1.", "bbox": {"l": 136.8, "t": 464.50854, "r": 237.76951999999997, "b": 473.72153, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "To discover who has authorization to define and manage RCAC, you can use the query that is shown in Example 2-1."}, {"label": "caption", "id": 16, "page_no": 7, "cluster": {"id": 16, "label": "caption", "bbox": {"l": 136.8, "t": 486.55798, "r": 462.35419, "b": 494.883, "coord_origin": "TOPLEFT"}, "confidence": 0.8159958720207214, "cells": [{"id": 29, "text": "Example 2-1 Query to determine who has authority to define and manage RCAC", "bbox": {"l": 136.8, "t": 486.55798, "r": 462.35419, "b": 494.883, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Example 2-1 Query to determine who has authority to define and manage RCAC"}, {"label": "key_value_region", "id": 18, "page_no": 7, "cluster": {"id": 18, "label": "key_value_region", "bbox": {"l": 136.8, "t": 503.65802, "r": 331.67731, "b": 584.43163, "coord_origin": "TOPLEFT"}, "confidence": 0.5808265805244446, "cells": [{"id": 30, "text": "SELECT", "bbox": {"l": 136.8, "t": 503.65802, "r": 171.26956, "b": 512.4328, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "function_id,", "bbox": {"l": 182.75941, "t": 503.65802, "r": 251.69853, "b": 512.4328, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "user_name,", "bbox": {"l": 166.78244, "t": 515.6578400000001, "r": 241.73852999999997, "b": 524.43262, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "usage,", "bbox": {"l": 170.75961, "t": 527.65765, "r": 221.69901999999996, "b": 536.43242, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "user_type", "bbox": {"l": 167.53809, "t": 539.65747, "r": 236.69878, "b": 548.43222, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "FROM", "bbox": {"l": 136.8, "t": 551.65727, "r": 160.59396, "b": 560.43202, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "function_usage", "bbox": {"l": 178.43944, "t": 551.65727, "r": 261.71829, "b": 560.43202, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "WHERE", "bbox": {"l": 136.8, "t": 563.65707, "r": 162.44176, "b": 572.43182, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "function_id=\u2019QIBM_DB_SECADM\u2019", "bbox": {"l": 177.8268, "t": 563.65707, "r": 331.67731, "b": 572.43182, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "ORDER BY", "bbox": {"l": 136.8, "t": 575.65688, "r": 178.77542, "b": 584.43163, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "user_name;", "bbox": {"l": 189.26929, "t": 575.65688, "r": 241.73856, "b": 584.43163, "coord_origin": "TOPLEFT"}}], "children": [{"id": 19, "label": "text", "bbox": {"l": 136.8, "t": 503.65802, "r": 171.26956, "b": 512.4328, "coord_origin": "TOPLEFT"}, "confidence": 0.5631121397018433, "cells": [{"id": 30, "text": "SELECT", "bbox": {"l": 136.8, "t": 503.65802, "r": 171.26956, "b": 512.4328, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 182.75941, "t": 503.65802, "r": 251.69853, "b": 512.4328, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "function_id,", "bbox": {"l": 182.75941, "t": 503.65802, "r": 251.69853, "b": 512.4328, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 166.78244, "t": 515.6578400000001, "r": 241.73852999999997, "b": 524.43262, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "user_name,", "bbox": {"l": 166.78244, "t": 515.6578400000001, "r": 241.73852999999997, "b": 524.43262, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 170.75961, "t": 527.65765, "r": 221.69901999999996, "b": 536.43242, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "usage,", "bbox": {"l": 170.75961, "t": 527.65765, "r": 221.69901999999996, "b": 536.43242, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 167.53809, "t": 539.65747, "r": 236.69878, "b": 548.43222, "coord_origin": "TOPLEFT"}, "confidence": 0.5346826314926147, "cells": [{"id": 34, "text": "user_type", "bbox": {"l": 167.53809, "t": 539.65747, "r": 236.69878, "b": 548.43222, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 136.8, "t": 551.65727, "r": 160.59396, "b": 560.43202, "coord_origin": "TOPLEFT"}, "confidence": 0.581838846206665, "cells": [{"id": 35, "text": "FROM", "bbox": {"l": 136.8, "t": 551.65727, "r": 160.59396, "b": 560.43202, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 178.43944, "t": 551.65727, "r": 261.71829, "b": 560.43202, "coord_origin": "TOPLEFT"}, "confidence": 0.5035740733146667, "cells": [{"id": 36, "text": "function_usage", "bbox": {"l": 178.43944, "t": 551.65727, "r": 261.71829, "b": 560.43202, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 136.8, "t": 563.65707, "r": 162.44176, "b": 572.43182, "coord_origin": "TOPLEFT"}, "confidence": 0.534027099609375, "cells": [{"id": 37, "text": "WHERE", "bbox": {"l": 136.8, "t": 563.65707, "r": 162.44176, "b": 572.43182, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 177.8268, "t": 563.65707, "r": 331.67731, "b": 572.43182, "coord_origin": "TOPLEFT"}, "confidence": 0.5171723365783691, "cells": [{"id": 38, "text": "function_id=\u2019QIBM_DB_SECADM\u2019", "bbox": {"l": 177.8268, "t": 563.65707, "r": 331.67731, "b": 572.43182, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 136.8, "t": 575.65688, "r": 178.77542, "b": 584.43163, "coord_origin": "TOPLEFT"}, "confidence": 0.5373470187187195, "cells": [{"id": 39, "text": "ORDER BY", "bbox": {"l": 136.8, "t": 575.65688, "r": 178.77542, "b": 584.43163, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 189.26929, "t": 575.65688, "r": 241.73856, "b": 584.43163, "coord_origin": "TOPLEFT"}, "confidence": 0.5167025327682495, "cells": [{"id": 40, "text": "user_name;", "bbox": {"l": 189.26929, "t": 575.65688, "r": 241.73856, "b": 584.43163, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null}, {"label": "section_header", "id": 5, "page_no": 7, "cluster": {"id": 5, "label": "section_header", "bbox": {"l": 64.800003, "t": 620.22063, "r": 249.59605000000002, "b": 634.98363, "coord_origin": "TOPLEFT"}, "confidence": 0.9656105041503906, "cells": [{"id": 41, "text": "2.2", "bbox": {"l": 64.800003, "t": 620.22063, "r": 87.569839, "b": 634.98363, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "Separation of duties", "bbox": {"l": 92.123802, "t": 620.22063, "r": 249.59605000000002, "b": 634.98363, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2.2 Separation of duties"}, {"label": "text", "id": 0, "page_no": 7, "cluster": {"id": 0, "label": "text", "bbox": {"l": 136.8, "t": 652.54872, "r": 547.22345, "b": 709.760956, "coord_origin": "TOPLEFT"}, "confidence": 0.9853070974349976, "cells": [{"id": 43, "text": "Separation of duties helps businesses comply with industry regulations or organizational ", "bbox": {"l": 136.8, "t": 652.54872, "r": 529.09357, "b": 661.76172, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "requirements and simplifies the management of authorities. Separation of duties is commonly ", "bbox": {"l": 136.8, "t": 664.54852, "r": 547.22345, "b": 673.76153, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "used to prevent fraudulent activities or errors by a single person. It provides the ability for ", "bbox": {"l": 136.8, "t": 676.54833, "r": 530.89716, "b": 685.76134, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "administrative functions to be divided across individuals without overlapping responsibilities, ", "bbox": {"l": 136.80002, "t": 688.54814, "r": 544.33832, "b": 697.7611469999999, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "so that one user does not possess unlimited authority, such as with the *ALLOBJ authority.", "bbox": {"l": 136.80002, "t": 700.547951, "r": 536.28363, "b": 709.760956, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Separation of duties helps businesses comply with industry regulations or organizational requirements and simplifies the management of authorities. Separation of duties is commonly used to prevent fraudulent activities or errors by a single person. It provides the ability for administrative functions to be divided across individuals without overlapping responsibilities, so that one user does not possess unlimited authority, such as with the *ALLOBJ authority."}, {"label": "table", "id": 1, "page_no": 7, "cluster": {"id": 1, "label": "table", "bbox": {"l": 135.52462768554688, "t": 289.7252197265625, "r": 545.8714599609375, "b": 442.050537109375, "coord_origin": "TOPLEFT"}, "confidence": 0.9851690530776978, "cells": [{"id": 48, "text": "Column name", "bbox": {"l": 142.8, "t": 296.5379899999999, "r": 202.245, "b": 304.86301, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "Data type", "bbox": {"l": 216.80878999999996, "t": 296.5379899999999, "r": 257.21069, "b": 304.86301, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Description", "bbox": {"l": 289.47479, "t": 296.5379899999999, "r": 338.89468, "b": 304.86301, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "FUNCTION_ID", "bbox": {"l": 142.8, "t": 315.55771, "r": 203.2323, "b": 323.88272, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "VARCHAR(30)", "bbox": {"l": 216.7854, "t": 315.55771, "r": 276.0036, "b": 323.88272, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "ID of the function.", "bbox": {"l": 289.4577, "t": 315.55771, "r": 359.85394, "b": 323.88272, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "USER_NAME", "bbox": {"l": 142.8, "t": 334.51801, "r": 198.6693, "b": 342.84302, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "VARCHAR(10)", "bbox": {"l": 216.74129999999997, "t": 334.51801, "r": 275.92349, "b": 342.84302, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Name of the user profile that has a usage setting for this ", "bbox": {"l": 289.38208, "t": 334.51801, "r": 515.05359, "b": 342.84302, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "function.", "bbox": {"l": 289.4397, "t": 345.55832, "r": 323.43362, "b": 353.88333, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "USAGE", "bbox": {"l": 142.79999, "t": 364.51862, "r": 173.98318, "b": 372.84363, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "VARCHAR(7)", "bbox": {"l": 216.77367999999998, "t": 364.51862, "r": 270.97977, "b": 372.84363, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Usage setting:", "bbox": {"l": 289.41626, "t": 364.51862, "r": 346.88757, "b": 372.84363, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 375.69394000000005, "r": 293.9397, "b": 383.62292, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "ALLOWED: The user profile is allowed to use the function.", "bbox": {"l": 303.83969, "t": 375.55893, "r": 535.16766, "b": 383.88394, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 386.67395, "r": 293.9397, "b": 394.60294, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "DENIED: The user profile is not allowed to use the function.", "bbox": {"l": 303.83969, "t": 386.53894, "r": 539.10712, "b": 394.86395, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "USER_TYPE", "bbox": {"l": 142.8, "t": 405.55865, "r": 196.2249, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "VARCHAR(5)", "bbox": {"l": 216.75211, "t": 405.55865, "r": 270.99872, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "Type of user profile:", "bbox": {"l": 289.43161, "t": 405.55865, "r": 367.8009, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 416.67368000000005, "r": 293.9397, "b": 424.60266, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "USER: The user profile is a user.", "bbox": {"l": 303.83969, "t": 416.53867, "r": 434.78159, "b": 424.86368, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 427.65369, "r": 293.9397, "b": 435.58267000000006, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "GROUP: The user profile is a group.", "bbox": {"l": 303.83969, "t": 427.51868, "r": 448.11963000000003, "b": 435.84369, "coord_origin": "TOPLEFT"}}], "children": [{"id": 31, "label": "text", "bbox": {"l": 142.8, "t": 296.5379899999999, "r": 202.245, "b": 304.86301, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "Column name", "bbox": {"l": 142.8, "t": 296.5379899999999, "r": 202.245, "b": 304.86301, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 216.80878999999996, "t": 296.5379899999999, "r": 257.21069, "b": 304.86301, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "Data type", "bbox": {"l": 216.80878999999996, "t": 296.5379899999999, "r": 257.21069, "b": 304.86301, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 289.47479, "t": 296.5379899999999, "r": 338.89468, "b": 304.86301, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "Description", "bbox": {"l": 289.47479, "t": 296.5379899999999, "r": 338.89468, "b": 304.86301, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 142.8, "t": 315.55771, "r": 203.2323, "b": 323.88272, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "FUNCTION_ID", "bbox": {"l": 142.8, "t": 315.55771, "r": 203.2323, "b": 323.88272, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 216.7854, "t": 315.55771, "r": 276.0036, "b": 323.88272, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "VARCHAR(30)", "bbox": {"l": 216.7854, "t": 315.55771, "r": 276.0036, "b": 323.88272, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 289.4577, "t": 315.55771, "r": 359.85394, "b": 323.88272, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "ID of the function.", "bbox": {"l": 289.4577, "t": 315.55771, "r": 359.85394, "b": 323.88272, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 142.8, "t": 334.51801, "r": 198.6693, "b": 342.84302, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "USER_NAME", "bbox": {"l": 142.8, "t": 334.51801, "r": 198.6693, "b": 342.84302, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 216.74129999999997, "t": 334.51801, "r": 275.92349, "b": 342.84302, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "VARCHAR(10)", "bbox": {"l": 216.74129999999997, "t": 334.51801, "r": 275.92349, "b": 342.84302, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 289.38208, "t": 334.51801, "r": 515.05359, "b": 342.84302, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "Name of the user profile that has a usage setting for this ", "bbox": {"l": 289.38208, "t": 334.51801, "r": 515.05359, "b": 342.84302, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 289.4397, "t": 345.55832, "r": 323.43362, "b": 353.88333, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "function.", "bbox": {"l": 289.4397, "t": 345.55832, "r": 323.43362, "b": 353.88333, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 142.79999, "t": 364.51862, "r": 173.98318, "b": 372.84363, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "USAGE", "bbox": {"l": 142.79999, "t": 364.51862, "r": 173.98318, "b": 372.84363, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 216.77367999999998, "t": 364.51862, "r": 270.97977, "b": 372.84363, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "VARCHAR(7)", "bbox": {"l": 216.77367999999998, "t": 364.51862, "r": 270.97977, "b": 372.84363, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 289.41626, "t": 364.51862, "r": 346.88757, "b": 372.84363, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "Usage setting:", "bbox": {"l": 289.41626, "t": 364.51862, "r": 346.88757, "b": 372.84363, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 289.4397, "t": 375.69394000000005, "r": 293.9397, "b": 383.62292, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 375.69394000000005, "r": 293.9397, "b": 383.62292, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 303.83969, "t": 375.55893, "r": 535.16766, "b": 383.88394, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "ALLOWED: The user profile is allowed to use the function.", "bbox": {"l": 303.83969, "t": 375.55893, "r": 535.16766, "b": 383.88394, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 289.4397, "t": 386.67395, "r": 293.9397, "b": 394.60294, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 386.67395, "r": 293.9397, "b": 394.60294, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 303.83969, "t": 386.53894, "r": 539.10712, "b": 394.86395, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "DENIED: The user profile is not allowed to use the function.", "bbox": {"l": 303.83969, "t": 386.53894, "r": 539.10712, "b": 394.86395, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 142.8, "t": 405.55865, "r": 196.2249, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "USER_TYPE", "bbox": {"l": 142.8, "t": 405.55865, "r": 196.2249, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 216.75211, "t": 405.55865, "r": 270.99872, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "VARCHAR(5)", "bbox": {"l": 216.75211, "t": 405.55865, "r": 270.99872, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 289.43161, "t": 405.55865, "r": 367.8009, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "Type of user profile:", "bbox": {"l": 289.43161, "t": 405.55865, "r": 367.8009, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 289.4397, "t": 416.67368000000005, "r": 293.9397, "b": 424.60266, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 416.67368000000005, "r": 293.9397, "b": 424.60266, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 303.83969, "t": 416.53867, "r": 434.78159, "b": 424.86368, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "USER: The user profile is a user.", "bbox": {"l": 303.83969, "t": 416.53867, "r": 434.78159, "b": 424.86368, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 289.4397, "t": 427.65369, "r": 293.9397, "b": 435.58267000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 427.65369, "r": 293.9397, "b": 435.58267000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 303.83969, "t": 427.51868, "r": 448.11963000000003, "b": 435.84369, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "GROUP: The user profile is a group.", "bbox": {"l": 303.83969, "t": 427.51868, "r": 448.11963000000003, "b": 435.84369, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl"], "num_rows": 5, "num_cols": 3, "table_cells": [{"bbox": {"l": 142.8, "t": 296.5379899999999, "r": 202.245, "b": 304.86301, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Column name", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 216.80878999999996, "t": 296.5379899999999, "r": 257.21069, "b": 304.86301, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Data type", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 289.47479, "t": 296.5379899999999, "r": 338.89468, "b": 304.86301, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Description", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 142.8, "t": 315.55771, "r": 203.2323, "b": 323.88272, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "FUNCTION_ID", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 216.7854, "t": 315.55771, "r": 276.0036, "b": 323.88272, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(30)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.4577, "t": 315.55771, "r": 359.85394, "b": 323.88272, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "ID of the function.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 142.8, "t": 334.51801, "r": 198.6693, "b": 342.84302, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "USER_NAME", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 216.74129999999997, "t": 334.51801, "r": 275.92349, "b": 342.84302, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(10)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.38208, "t": 334.51801, "r": 515.05359, "b": 353.88333, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Name of the user profile that has a usage setting for this  function.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 142.79999, "t": 364.51862, "r": 173.98318, "b": 372.84363, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "USAGE", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 216.77367999999998, "t": 364.51862, "r": 270.97977, "b": 372.84363, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(7)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.41626, "t": 364.51862, "r": 539.10712, "b": 394.86395, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Usage setting: GLYPH<SM590000> ALLOWED: The user profile is allowed to use the function. GLYPH<SM590000> DENIED: The user profile is not allowed to use the function.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 142.8, "t": 405.55865, "r": 196.2249, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "USER_TYPE", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 216.75211, "t": 405.55865, "r": 270.99872, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(5)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.43161, "t": 405.55865, "r": 448.11963000000003, "b": 435.84369, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Type of user profile: GLYPH<SM590000> USER: The user profile is a user. GLYPH<SM590000> GROUP: The user profile is a group.", "column_header": false, "row_header": false, "row_section": false}]}], "body": [{"label": "section_header", "id": 3, "page_no": 7, "cluster": {"id": 3, "label": "section_header", "bbox": {"l": 64.800003, "t": 71.33471999999995, "r": 335.49551, "b": 83.32275000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9697521328926086, "cells": [{"id": 2, "text": "2.1.6", "bbox": {"l": 64.800003, "t": 71.33471999999995, "r": 94.081459, "b": 83.32275000000004, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Change Function Usage CL command", "bbox": {"l": 97.741661, "t": 71.33471999999995, "r": 335.49551, "b": 83.32275000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2.1.6 Change Function Usage CL command"}, {"label": "text", "id": 9, "page_no": 7, "cluster": {"id": 9, "label": "text", "bbox": {"l": 136.8, "t": 97.48870999999997, "r": 547.28442, "b": 106.70172000000014, "coord_origin": "TOPLEFT"}, "confidence": 0.9551582932472229, "cells": [{"id": 4, "text": "The following CL commands can be used to work with, display, or change function usage IDs:", "bbox": {"l": 136.8, "t": 97.48870999999997, "r": 547.28442, "b": 106.70172000000014, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The following CL commands can be used to work with, display, or change function usage IDs:"}, {"label": "list_item", "id": 12, "page_no": 7, "cluster": {"id": 12, "label": "list_item", "bbox": {"l": 136.8, "t": 114.52826000000005, "r": 301.51749, "b": 123.74126999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9410832524299622, "cells": [{"id": 5, "text": "GLYPH<SM590000>", "bbox": {"l": 136.8, "t": 114.67767000000003, "r": 141.78, "b": 123.45245, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Work Function Usage (", "bbox": {"l": 151.20016, "t": 114.52826000000005, "r": 253.26227000000003, "b": 123.74126999999999, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "WRKFCNUSG", "bbox": {"l": 253.26028, "t": 114.67767000000003, "r": 298.1998, "b": 123.50225999999998, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": ")", "bbox": {"l": 298.20081, "t": 114.52826000000005, "r": 301.51749, "b": 123.74126999999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<SM590000> Work Function Usage ( WRKFCNUSG )"}, {"label": "list_item", "id": 11, "page_no": 7, "cluster": {"id": 11, "label": "list_item", "bbox": {"l": 136.80099, "t": 126.52808000000005, "r": 313.39777, "b": 135.74108999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9418092370033264, "cells": [{"id": 9, "text": "GLYPH<SM590000>", "bbox": {"l": 136.80099, "t": 126.67749000000003, "r": 141.78099, "b": 135.45227, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Change Function Usage (", "bbox": {"l": 151.20116, "t": 126.52808000000005, "r": 265.13354, "b": 135.74108999999999, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "CHGFCNUSG", "bbox": {"l": 265.08081, "t": 126.67749000000003, "r": 310.02032, "b": 135.50207999999998, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": ")", "bbox": {"l": 310.08109, "t": 126.52808000000005, "r": 313.39777, "b": 135.74108999999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<SM590000> Change Function Usage ( CHGFCNUSG )"}, {"label": "list_item", "id": 8, "page_no": 7, "cluster": {"id": 8, "label": "list_item", "bbox": {"l": 136.80098, "t": 138.52788999999996, "r": 310.81711, "b": 147.74090999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9562349915504456, "cells": [{"id": 13, "text": "GLYPH<SM590000>", "bbox": {"l": 136.80098, "t": 138.67731000000003, "r": 141.78098, "b": 147.45209, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Display Function Usage (", "bbox": {"l": 151.20114, "t": 138.52788999999996, "r": 262.5639, "b": 147.74090999999999, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "DSPFCNUSG", "bbox": {"l": 262.56091, "t": 138.67731000000003, "r": 307.50043, "b": 147.50189, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": ")", "bbox": {"l": 307.50043, "t": 138.52788999999996, "r": 310.81711, "b": 147.74090999999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<SM590000> Display Function Usage ( DSPFCNUSG )"}, {"label": "text", "id": 4, "page_no": 7, "cluster": {"id": 4, "label": "text", "bbox": {"l": 136.79997, "t": 160.48766999999998, "r": 512.53802, "b": 181.70050000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9682500958442688, "cells": [{"id": 17, "text": "For example, the following ", "bbox": {"l": 136.79997, "t": 160.48766999999998, "r": 255.09984000000003, "b": 169.70068000000003, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "CHGFCNUSG", "bbox": {"l": 255.00027, "t": 160.63707999999997, "r": 299.99957, "b": 169.46167000000003, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": " command shows granting authorization to user ", "bbox": {"l": 300.00055, "t": 160.48766999999998, "r": 512.53802, "b": 169.70068000000003, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "HBEDOYA to administer and manage RCAC rules:", "bbox": {"l": 136.80096, "t": 172.48748999999998, "r": 360.41989, "b": 181.70050000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "For example, the following CHGFCNUSG command shows granting authorization to user HBEDOYA to administer and manage RCAC rules:"}, {"label": "text", "id": 15, "page_no": 7, "cluster": {"id": 15, "label": "text", "bbox": {"l": 136.80096, "t": 189.67645000000005, "r": 441.59686, "b": 198.45123, "coord_origin": "TOPLEFT"}, "confidence": 0.905712902545929, "cells": [{"id": 21, "text": "CHGFCNUSG FCNID(QIBM_DB_SECADM) USER(HBEDOYA) USAGE(*ALLOWED)", "bbox": {"l": 136.80096, "t": 189.67645000000005, "r": 441.59686, "b": 198.45123, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "CHGFCNUSG FCNID(QIBM_DB_SECADM) USER(HBEDOYA) USAGE(*ALLOWED)"}, {"label": "section_header", "id": 7, "page_no": 7, "cluster": {"id": 7, "label": "section_header", "bbox": {"l": 64.800003, "t": 219.35468000000003, "r": 544.47546, "b": 231.34271, "coord_origin": "TOPLEFT"}, "confidence": 0.9636710286140442, "cells": [{"id": 22, "text": "2.1.7", "bbox": {"l": 64.800003, "t": 219.35468000000003, "r": 93.757614, "b": 231.34271, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Verifying function usage IDs for RCAC with the FUNCTION_USAGE view", "bbox": {"l": 97.377296, "t": 219.35468000000003, "r": 544.47546, "b": 231.34271, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2.1.7 Verifying function usage IDs for RCAC with the FUNCTION_USAGE view"}, {"label": "text", "id": 2, "page_no": 7, "cluster": {"id": 2, "label": "text", "bbox": {"l": 136.8, "t": 245.50867000000005, "r": 519.51794, "b": 266.7215, "coord_origin": "TOPLEFT"}, "confidence": 0.9737311601638794, "cells": [{"id": 24, "text": "The FUNCTION_USAGE view contains function usage configuration details. Table 2-1 ", "bbox": {"l": 136.8, "t": 245.50867000000005, "r": 519.51794, "b": 254.72168, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "describes the columns in the FUNCTION_USAGE view.", "bbox": {"l": 136.8, "t": 257.50847999999996, "r": 382.94443, "b": 266.7215, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The FUNCTION_USAGE view contains function usage configuration details. Table 2-1 describes the columns in the FUNCTION_USAGE view."}, {"label": "caption", "id": 13, "page_no": 7, "cluster": {"id": 13, "label": "caption", "bbox": {"l": 136.8, "t": 279.55798000000004, "r": 283.96805, "b": 287.88300000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9196999669075012, "cells": [{"id": 26, "text": "Table 2-1 FUNCTION_USAGE view", "bbox": {"l": 136.8, "t": 279.55798000000004, "r": 283.96805, "b": 287.88300000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 2-1 FUNCTION_USAGE view"}, {"label": "text", "id": 6, "page_no": 7, "cluster": {"id": 6, "label": "text", "bbox": {"l": 136.8, "t": 452.50872999999996, "r": 547.2804, "b": 473.72153, "coord_origin": "TOPLEFT"}, "confidence": 0.964775562286377, "cells": [{"id": 27, "text": "To discover who has authorization to define and manage RCAC, you can use the query that is ", "bbox": {"l": 136.8, "t": 452.50872999999996, "r": 547.2804, "b": 461.72171, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "shown in Example 2-1.", "bbox": {"l": 136.8, "t": 464.50854, "r": 237.76951999999997, "b": 473.72153, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "To discover who has authorization to define and manage RCAC, you can use the query that is shown in Example 2-1."}, {"label": "caption", "id": 16, "page_no": 7, "cluster": {"id": 16, "label": "caption", "bbox": {"l": 136.8, "t": 486.55798, "r": 462.35419, "b": 494.883, "coord_origin": "TOPLEFT"}, "confidence": 0.8159958720207214, "cells": [{"id": 29, "text": "Example 2-1 Query to determine who has authority to define and manage RCAC", "bbox": {"l": 136.8, "t": 486.55798, "r": 462.35419, "b": 494.883, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Example 2-1 Query to determine who has authority to define and manage RCAC"}, {"label": "key_value_region", "id": 18, "page_no": 7, "cluster": {"id": 18, "label": "key_value_region", "bbox": {"l": 136.8, "t": 503.65802, "r": 331.67731, "b": 584.43163, "coord_origin": "TOPLEFT"}, "confidence": 0.5808265805244446, "cells": [{"id": 30, "text": "SELECT", "bbox": {"l": 136.8, "t": 503.65802, "r": 171.26956, "b": 512.4328, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "function_id,", "bbox": {"l": 182.75941, "t": 503.65802, "r": 251.69853, "b": 512.4328, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "user_name,", "bbox": {"l": 166.78244, "t": 515.6578400000001, "r": 241.73852999999997, "b": 524.43262, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "usage,", "bbox": {"l": 170.75961, "t": 527.65765, "r": 221.69901999999996, "b": 536.43242, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "user_type", "bbox": {"l": 167.53809, "t": 539.65747, "r": 236.69878, "b": 548.43222, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "FROM", "bbox": {"l": 136.8, "t": 551.65727, "r": 160.59396, "b": 560.43202, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "function_usage", "bbox": {"l": 178.43944, "t": 551.65727, "r": 261.71829, "b": 560.43202, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "WHERE", "bbox": {"l": 136.8, "t": 563.65707, "r": 162.44176, "b": 572.43182, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "function_id=\u2019QIBM_DB_SECADM\u2019", "bbox": {"l": 177.8268, "t": 563.65707, "r": 331.67731, "b": 572.43182, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "ORDER BY", "bbox": {"l": 136.8, "t": 575.65688, "r": 178.77542, "b": 584.43163, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "user_name;", "bbox": {"l": 189.26929, "t": 575.65688, "r": 241.73856, "b": 584.43163, "coord_origin": "TOPLEFT"}}], "children": [{"id": 19, "label": "text", "bbox": {"l": 136.8, "t": 503.65802, "r": 171.26956, "b": 512.4328, "coord_origin": "TOPLEFT"}, "confidence": 0.5631121397018433, "cells": [{"id": 30, "text": "SELECT", "bbox": {"l": 136.8, "t": 503.65802, "r": 171.26956, "b": 512.4328, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 182.75941, "t": 503.65802, "r": 251.69853, "b": 512.4328, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "function_id,", "bbox": {"l": 182.75941, "t": 503.65802, "r": 251.69853, "b": 512.4328, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 166.78244, "t": 515.6578400000001, "r": 241.73852999999997, "b": 524.43262, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "user_name,", "bbox": {"l": 166.78244, "t": 515.6578400000001, "r": 241.73852999999997, "b": 524.43262, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 170.75961, "t": 527.65765, "r": 221.69901999999996, "b": 536.43242, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "usage,", "bbox": {"l": 170.75961, "t": 527.65765, "r": 221.69901999999996, "b": 536.43242, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 167.53809, "t": 539.65747, "r": 236.69878, "b": 548.43222, "coord_origin": "TOPLEFT"}, "confidence": 0.5346826314926147, "cells": [{"id": 34, "text": "user_type", "bbox": {"l": 167.53809, "t": 539.65747, "r": 236.69878, "b": 548.43222, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 136.8, "t": 551.65727, "r": 160.59396, "b": 560.43202, "coord_origin": "TOPLEFT"}, "confidence": 0.581838846206665, "cells": [{"id": 35, "text": "FROM", "bbox": {"l": 136.8, "t": 551.65727, "r": 160.59396, "b": 560.43202, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 178.43944, "t": 551.65727, "r": 261.71829, "b": 560.43202, "coord_origin": "TOPLEFT"}, "confidence": 0.5035740733146667, "cells": [{"id": 36, "text": "function_usage", "bbox": {"l": 178.43944, "t": 551.65727, "r": 261.71829, "b": 560.43202, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 136.8, "t": 563.65707, "r": 162.44176, "b": 572.43182, "coord_origin": "TOPLEFT"}, "confidence": 0.534027099609375, "cells": [{"id": 37, "text": "WHERE", "bbox": {"l": 136.8, "t": 563.65707, "r": 162.44176, "b": 572.43182, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 177.8268, "t": 563.65707, "r": 331.67731, "b": 572.43182, "coord_origin": "TOPLEFT"}, "confidence": 0.5171723365783691, "cells": [{"id": 38, "text": "function_id=\u2019QIBM_DB_SECADM\u2019", "bbox": {"l": 177.8268, "t": 563.65707, "r": 331.67731, "b": 572.43182, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 136.8, "t": 575.65688, "r": 178.77542, "b": 584.43163, "coord_origin": "TOPLEFT"}, "confidence": 0.5373470187187195, "cells": [{"id": 39, "text": "ORDER BY", "bbox": {"l": 136.8, "t": 575.65688, "r": 178.77542, "b": 584.43163, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 189.26929, "t": 575.65688, "r": 241.73856, "b": 584.43163, "coord_origin": "TOPLEFT"}, "confidence": 0.5167025327682495, "cells": [{"id": 40, "text": "user_name;", "bbox": {"l": 189.26929, "t": 575.65688, "r": 241.73856, "b": 584.43163, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null}, {"label": "section_header", "id": 5, "page_no": 7, "cluster": {"id": 5, "label": "section_header", "bbox": {"l": 64.800003, "t": 620.22063, "r": 249.59605000000002, "b": 634.98363, "coord_origin": "TOPLEFT"}, "confidence": 0.9656105041503906, "cells": [{"id": 41, "text": "2.2", "bbox": {"l": 64.800003, "t": 620.22063, "r": 87.569839, "b": 634.98363, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "Separation of duties", "bbox": {"l": 92.123802, "t": 620.22063, "r": 249.59605000000002, "b": 634.98363, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2.2 Separation of duties"}, {"label": "text", "id": 0, "page_no": 7, "cluster": {"id": 0, "label": "text", "bbox": {"l": 136.8, "t": 652.54872, "r": 547.22345, "b": 709.760956, "coord_origin": "TOPLEFT"}, "confidence": 0.9853070974349976, "cells": [{"id": 43, "text": "Separation of duties helps businesses comply with industry regulations or organizational ", "bbox": {"l": 136.8, "t": 652.54872, "r": 529.09357, "b": 661.76172, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "requirements and simplifies the management of authorities. Separation of duties is commonly ", "bbox": {"l": 136.8, "t": 664.54852, "r": 547.22345, "b": 673.76153, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "used to prevent fraudulent activities or errors by a single person. It provides the ability for ", "bbox": {"l": 136.8, "t": 676.54833, "r": 530.89716, "b": 685.76134, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "administrative functions to be divided across individuals without overlapping responsibilities, ", "bbox": {"l": 136.80002, "t": 688.54814, "r": 544.33832, "b": 697.7611469999999, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "so that one user does not possess unlimited authority, such as with the *ALLOBJ authority.", "bbox": {"l": 136.80002, "t": 700.547951, "r": 536.28363, "b": 709.760956, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Separation of duties helps businesses comply with industry regulations or organizational requirements and simplifies the management of authorities. Separation of duties is commonly used to prevent fraudulent activities or errors by a single person. It provides the ability for administrative functions to be divided across individuals without overlapping responsibilities, so that one user does not possess unlimited authority, such as with the *ALLOBJ authority."}, {"label": "table", "id": 1, "page_no": 7, "cluster": {"id": 1, "label": "table", "bbox": {"l": 135.52462768554688, "t": 289.7252197265625, "r": 545.8714599609375, "b": 442.050537109375, "coord_origin": "TOPLEFT"}, "confidence": 0.9851690530776978, "cells": [{"id": 48, "text": "Column name", "bbox": {"l": 142.8, "t": 296.5379899999999, "r": 202.245, "b": 304.86301, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "Data type", "bbox": {"l": 216.80878999999996, "t": 296.5379899999999, "r": 257.21069, "b": 304.86301, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Description", "bbox": {"l": 289.47479, "t": 296.5379899999999, "r": 338.89468, "b": 304.86301, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "FUNCTION_ID", "bbox": {"l": 142.8, "t": 315.55771, "r": 203.2323, "b": 323.88272, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "VARCHAR(30)", "bbox": {"l": 216.7854, "t": 315.55771, "r": 276.0036, "b": 323.88272, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "ID of the function.", "bbox": {"l": 289.4577, "t": 315.55771, "r": 359.85394, "b": 323.88272, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "USER_NAME", "bbox": {"l": 142.8, "t": 334.51801, "r": 198.6693, "b": 342.84302, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "VARCHAR(10)", "bbox": {"l": 216.74129999999997, "t": 334.51801, "r": 275.92349, "b": 342.84302, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Name of the user profile that has a usage setting for this ", "bbox": {"l": 289.38208, "t": 334.51801, "r": 515.05359, "b": 342.84302, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "function.", "bbox": {"l": 289.4397, "t": 345.55832, "r": 323.43362, "b": 353.88333, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "USAGE", "bbox": {"l": 142.79999, "t": 364.51862, "r": 173.98318, "b": 372.84363, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "VARCHAR(7)", "bbox": {"l": 216.77367999999998, "t": 364.51862, "r": 270.97977, "b": 372.84363, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Usage setting:", "bbox": {"l": 289.41626, "t": 364.51862, "r": 346.88757, "b": 372.84363, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 375.69394000000005, "r": 293.9397, "b": 383.62292, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "ALLOWED: The user profile is allowed to use the function.", "bbox": {"l": 303.83969, "t": 375.55893, "r": 535.16766, "b": 383.88394, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 386.67395, "r": 293.9397, "b": 394.60294, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "DENIED: The user profile is not allowed to use the function.", "bbox": {"l": 303.83969, "t": 386.53894, "r": 539.10712, "b": 394.86395, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "USER_TYPE", "bbox": {"l": 142.8, "t": 405.55865, "r": 196.2249, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "VARCHAR(5)", "bbox": {"l": 216.75211, "t": 405.55865, "r": 270.99872, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "Type of user profile:", "bbox": {"l": 289.43161, "t": 405.55865, "r": 367.8009, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 416.67368000000005, "r": 293.9397, "b": 424.60266, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "USER: The user profile is a user.", "bbox": {"l": 303.83969, "t": 416.53867, "r": 434.78159, "b": 424.86368, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 427.65369, "r": 293.9397, "b": 435.58267000000006, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "GROUP: The user profile is a group.", "bbox": {"l": 303.83969, "t": 427.51868, "r": 448.11963000000003, "b": 435.84369, "coord_origin": "TOPLEFT"}}], "children": [{"id": 31, "label": "text", "bbox": {"l": 142.8, "t": 296.5379899999999, "r": 202.245, "b": 304.86301, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "Column name", "bbox": {"l": 142.8, "t": 296.5379899999999, "r": 202.245, "b": 304.86301, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 216.80878999999996, "t": 296.5379899999999, "r": 257.21069, "b": 304.86301, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "Data type", "bbox": {"l": 216.80878999999996, "t": 296.5379899999999, "r": 257.21069, "b": 304.86301, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 289.47479, "t": 296.5379899999999, "r": 338.89468, "b": 304.86301, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "Description", "bbox": {"l": 289.47479, "t": 296.5379899999999, "r": 338.89468, "b": 304.86301, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 142.8, "t": 315.55771, "r": 203.2323, "b": 323.88272, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "FUNCTION_ID", "bbox": {"l": 142.8, "t": 315.55771, "r": 203.2323, "b": 323.88272, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 216.7854, "t": 315.55771, "r": 276.0036, "b": 323.88272, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "VARCHAR(30)", "bbox": {"l": 216.7854, "t": 315.55771, "r": 276.0036, "b": 323.88272, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 289.4577, "t": 315.55771, "r": 359.85394, "b": 323.88272, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "ID of the function.", "bbox": {"l": 289.4577, "t": 315.55771, "r": 359.85394, "b": 323.88272, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 142.8, "t": 334.51801, "r": 198.6693, "b": 342.84302, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "USER_NAME", "bbox": {"l": 142.8, "t": 334.51801, "r": 198.6693, "b": 342.84302, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 216.74129999999997, "t": 334.51801, "r": 275.92349, "b": 342.84302, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "VARCHAR(10)", "bbox": {"l": 216.74129999999997, "t": 334.51801, "r": 275.92349, "b": 342.84302, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 289.38208, "t": 334.51801, "r": 515.05359, "b": 342.84302, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "Name of the user profile that has a usage setting for this ", "bbox": {"l": 289.38208, "t": 334.51801, "r": 515.05359, "b": 342.84302, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 289.4397, "t": 345.55832, "r": 323.43362, "b": 353.88333, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "function.", "bbox": {"l": 289.4397, "t": 345.55832, "r": 323.43362, "b": 353.88333, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 142.79999, "t": 364.51862, "r": 173.98318, "b": 372.84363, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "USAGE", "bbox": {"l": 142.79999, "t": 364.51862, "r": 173.98318, "b": 372.84363, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 216.77367999999998, "t": 364.51862, "r": 270.97977, "b": 372.84363, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "VARCHAR(7)", "bbox": {"l": 216.77367999999998, "t": 364.51862, "r": 270.97977, "b": 372.84363, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 289.41626, "t": 364.51862, "r": 346.88757, "b": 372.84363, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "Usage setting:", "bbox": {"l": 289.41626, "t": 364.51862, "r": 346.88757, "b": 372.84363, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 289.4397, "t": 375.69394000000005, "r": 293.9397, "b": 383.62292, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 375.69394000000005, "r": 293.9397, "b": 383.62292, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 303.83969, "t": 375.55893, "r": 535.16766, "b": 383.88394, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "ALLOWED: The user profile is allowed to use the function.", "bbox": {"l": 303.83969, "t": 375.55893, "r": 535.16766, "b": 383.88394, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 289.4397, "t": 386.67395, "r": 293.9397, "b": 394.60294, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 386.67395, "r": 293.9397, "b": 394.60294, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 303.83969, "t": 386.53894, "r": 539.10712, "b": 394.86395, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "DENIED: The user profile is not allowed to use the function.", "bbox": {"l": 303.83969, "t": 386.53894, "r": 539.10712, "b": 394.86395, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 142.8, "t": 405.55865, "r": 196.2249, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "USER_TYPE", "bbox": {"l": 142.8, "t": 405.55865, "r": 196.2249, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 216.75211, "t": 405.55865, "r": 270.99872, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "VARCHAR(5)", "bbox": {"l": 216.75211, "t": 405.55865, "r": 270.99872, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 289.43161, "t": 405.55865, "r": 367.8009, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "Type of user profile:", "bbox": {"l": 289.43161, "t": 405.55865, "r": 367.8009, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 289.4397, "t": 416.67368000000005, "r": 293.9397, "b": 424.60266, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 416.67368000000005, "r": 293.9397, "b": 424.60266, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 303.83969, "t": 416.53867, "r": 434.78159, "b": 424.86368, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "USER: The user profile is a user.", "bbox": {"l": 303.83969, "t": 416.53867, "r": 434.78159, "b": 424.86368, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 289.4397, "t": 427.65369, "r": 293.9397, "b": 435.58267000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 427.65369, "r": 293.9397, "b": 435.58267000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 303.83969, "t": 427.51868, "r": 448.11963000000003, "b": 435.84369, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "GROUP: The user profile is a group.", "bbox": {"l": 303.83969, "t": 427.51868, "r": 448.11963000000003, "b": 435.84369, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl"], "num_rows": 5, "num_cols": 3, "table_cells": [{"bbox": {"l": 142.8, "t": 296.5379899999999, "r": 202.245, "b": 304.86301, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Column name", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 216.80878999999996, "t": 296.5379899999999, "r": 257.21069, "b": 304.86301, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Data type", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 289.47479, "t": 296.5379899999999, "r": 338.89468, "b": 304.86301, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Description", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 142.8, "t": 315.55771, "r": 203.2323, "b": 323.88272, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "FUNCTION_ID", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 216.7854, "t": 315.55771, "r": 276.0036, "b": 323.88272, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(30)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.4577, "t": 315.55771, "r": 359.85394, "b": 323.88272, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "ID of the function.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 142.8, "t": 334.51801, "r": 198.6693, "b": 342.84302, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "USER_NAME", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 216.74129999999997, "t": 334.51801, "r": 275.92349, "b": 342.84302, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(10)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.38208, "t": 334.51801, "r": 515.05359, "b": 353.88333, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Name of the user profile that has a usage setting for this  function.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 142.79999, "t": 364.51862, "r": 173.98318, "b": 372.84363, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "USAGE", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 216.77367999999998, "t": 364.51862, "r": 270.97977, "b": 372.84363, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(7)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.41626, "t": 364.51862, "r": 539.10712, "b": 394.86395, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Usage setting: GLYPH<SM590000> ALLOWED: The user profile is allowed to use the function. GLYPH<SM590000> DENIED: The user profile is not allowed to use the function.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 142.8, "t": 405.55865, "r": 196.2249, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "USER_TYPE", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 216.75211, "t": 405.55865, "r": 270.99872, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(5)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.43161, "t": 405.55865, "r": 448.11963000000003, "b": 435.84369, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Type of user profile: GLYPH<SM590000> USER: The user profile is a user. GLYPH<SM590000> GROUP: The user profile is a group.", "column_header": false, "row_header": false, "row_section": false}]}], "headers": [{"label": "page_footer", "id": 14, "page_no": 7, "cluster": {"id": 14, "label": "page_footer", "bbox": {"l": 64.800003, "t": 754.848721, "r": 78.402, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.9166396856307983, "cells": [{"id": 0, "text": "10 ", "bbox": {"l": 64.800003, "t": 754.848721, "r": 78.402, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "10"}, {"label": "page_footer", "id": 10, "page_no": 7, "cluster": {"id": 10, "label": "page_footer", "bbox": {"l": 93.420303, "t": 755.538002, "r": 334.42142, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9530044198036194, "cells": [{"id": 1, "text": "Row and Column Access Control Support in IBM DB2 for i", "bbox": {"l": 93.420303, "t": 755.538002, "r": 334.42142, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Row and Column Access Control Support in IBM DB2 for i"}]}}, {"page_no": 8, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "Chapter 2. Roles and separation of duties ", "bbox": {"l": 355.32001, "t": 755.538002, "r": 523.54071, "b": 763.863001, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "11", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "For example, assume that a business has assigned the duty to manage security on IBM i to ", "bbox": {"l": 136.79959, "t": 71.50903000000005, "r": 542.69434, "b": 80.72204999999985, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Theresa. Before release IBM i 7.2, to grant privileges, Theresa had to have the same ", "bbox": {"l": 136.79959, "t": 83.50885000000017, "r": 513.67804, "b": 92.72185999999999, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "privileges Theresa was granting to others. Therefore, to grant *USE privileges to the ", "bbox": {"l": 136.79959, "t": 95.50867000000005, "r": 509.71902, "b": 104.72167999999999, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "PAYROLL table, Theresa had to have *OBJMGT and *USE authority (or a higher level of ", "bbox": {"l": 136.79959, "t": 107.50847999999996, "r": 528.20184, "b": 116.72149999999999, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "authority, such as *ALLOBJ). This requirement allowed Theresa to access the data in the ", "bbox": {"l": 136.79959, "t": 119.50829999999996, "r": 531.84015, "b": 128.72131000000002, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "PAYROLL table even though Theresa\u2019s job description was only to manage its security.", "bbox": {"l": 136.79959, "t": 131.50811999999996, "r": 519.24982, "b": 140.72113000000002, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "In IBM i 7.2, the QIBM_DB_SECADM function usage grants authorities, revokes authorities, ", "bbox": {"l": 136.79959, "t": 153.52770999999996, "r": 544.16064, "b": 162.74072, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "changes ownership, or changes the primary group without giving access to the object or, in ", "bbox": {"l": 136.79959, "t": 165.52752999999996, "r": 540.66156, "b": 174.74054, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "the case of a database table, to the data that is in the table or allowing other operations on the ", "bbox": {"l": 136.79959, "t": 177.52733999999998, "r": 547.30396, "b": 186.74036, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "table. ", "bbox": {"l": 136.79959, "t": 189.52715999999998, "r": 163.6189, "b": 198.74017000000003, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "QIBM_DB_SECADM function usage can be granted only by a user with *SECADM special ", "bbox": {"l": 136.79959, "t": 211.48694, "r": 538.65076, "b": 220.69994999999994, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "authority and can be given to a user or a group.", "bbox": {"l": 136.79959, "t": 223.48676, "r": 346.34808, "b": 232.69976999999994, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "QIBM_DB_SECADM also is responsible for administering RCAC, which restricts which rows ", "bbox": {"l": 136.79959, "t": 245.50635, "r": 545.79602, "b": 254.71936000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "a user is allowed to access in a table and whether a user is allowed to see information in ", "bbox": {"l": 136.79959, "t": 257.50616, "r": 529.46149, "b": 266.71918000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "certain columns of a table.", "bbox": {"l": 136.79959, "t": 269.50598, "r": 253.47696999999997, "b": 278.71898999999996, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "A preferred practice is that the RCAC administrator has the QIBM_DB_SECADM function ", "bbox": {"l": 136.79959, "t": 291.52557, "r": 533.78137, "b": 300.73856, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "usage ID, but absolutely no other data privileges. The result is that the RCAC administrator ", "bbox": {"l": 136.79959, "t": 303.52539, "r": 539.80713, "b": 312.73837000000003, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "can deploy and maintain the RCAC constructs, but cannot grant themselves unauthorized ", "bbox": {"l": 136.79959, "t": 315.52521, "r": 534.5741, "b": 324.73819, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "access to data itself.", "bbox": {"l": 136.79959, "t": 327.52502, "r": 227.02324, "b": 336.73801, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Table 2-2 shows a comparison of the different function usage IDs and *JOBCTL authority to ", "bbox": {"l": 136.79959, "t": 349.48483, "r": 543.06714, "b": 358.69780999999995, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "the different CL commands and DB2 for i tools.", "bbox": {"l": 136.79959, "t": 361.48465, "r": 343.79236, "b": 370.69763000000006, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Table 2-2 Comparison of the different function usage IDs and *JOBCTL authority", "bbox": {"l": 64.800003, "t": 383.5379899999999, "r": 391.75464, "b": 391.86301, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "User action", "bbox": {"l": 70.800301, "t": 400.51827999999995, "r": 119.78551, "b": 408.84329, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "*JOBCTL", "bbox": {"l": 424.93805, "t": 447.52255, "r": 433.26297000000005, "b": 487.01999, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "QIBM_DB_SECADM", "bbox": {"l": 450.13806, "t": 401.6000700000001, "r": 458.46298, "b": 487.01999, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "QIBM_DB_SQLADM", "bbox": {"l": 475.93835000000007, "t": 401.53442, "r": 484.26327999999995, "b": 487.01999, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "QIBM_DB_SYSMON", "bbox": {"l": 501.13837, "t": 401.6145, "r": 509.46329, "b": 487.01999, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "No Authority", "bbox": {"l": 526.39862, "t": 432.79944, "r": 534.72357, "b": 487.02005, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "SET CURRENT DEGREE", "bbox": {"l": 70.800003, "t": 498.69299, "r": 151.6794, "b": 506.66699, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": " (SQL statement)", "bbox": {"l": 151.6803, "t": 498.55798, "r": 220.15681000000004, "b": 506.883, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "X", "bbox": {"l": 429.0, "t": 498.55798, "r": 435.00299000000007, "b": 506.883, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "X", "bbox": {"l": 480.00031, "t": 498.55798, "r": 486.0033, "b": 506.883, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "CHGQRYA", "bbox": {"l": 70.800018, "t": 517.65329, "r": 102.23972, "b": 525.62729, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": " command targeting a different user\u2019s job", "bbox": {"l": 102.23972, "t": 517.51828, "r": 264.5538, "b": 525.84329, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "X", "bbox": {"l": 429.00003, "t": 517.51828, "r": 435.00302000000005, "b": 525.84329, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "X", "bbox": {"l": 480.00034, "t": 517.51828, "r": 486.00333, "b": 525.84329, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "STRDBMON", "bbox": {"l": 70.800049, "t": 536.67299, "r": 106.73975, "b": 544.64699, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": " or ", "bbox": {"l": 106.73975, "t": 536.5379800000001, "r": 119.77895, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "ENDDBMON", "bbox": {"l": 119.69975000000001, "t": 536.67299, "r": 155.69974, "b": 544.64699, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": " commands targeting a different user\u2019s job", "bbox": {"l": 155.69974, "t": 536.5379800000001, "r": 322.50574, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "X", "bbox": {"l": 429.00003, "t": 536.5379800000001, "r": 435.00302000000005, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "X", "bbox": {"l": 480.00034, "t": 536.5379800000001, "r": 486.00333, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "STRDBMON", "bbox": {"l": 70.800049, "t": 555.69269, "r": 106.73975, "b": 563.66669, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": " or ", "bbox": {"l": 106.73975, "t": 555.55768, "r": 119.77895, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "ENDDBMON", "bbox": {"l": 119.69975000000001, "t": 555.69269, "r": 155.69974, "b": 563.66669, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": " commands targeting a job that matches the current user", "bbox": {"l": 155.69974, "t": 555.55768, "r": 381.02185, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "X", "bbox": {"l": 429.00003, "t": 555.55768, "r": 435.00302000000005, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "X", "bbox": {"l": 480.00034, "t": 555.55768, "r": 486.00333, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "X", "bbox": {"l": 505.26061999999996, "t": 555.55768, "r": 511.26361, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "X", "bbox": {"l": 530.76031, "t": 555.55768, "r": 536.76331, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "QUSRJOBI() API format 900 or System i Navigator\u2019s SQL Details for Job", "bbox": {"l": 70.800049, "t": 574.51797, "r": 359.51736, "b": 582.84299, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "X", "bbox": {"l": 429.0000600000001, "t": 574.51797, "r": 435.00305000000003, "b": 582.84299, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "X", "bbox": {"l": 480.00037, "t": 574.51797, "r": 486.00335999999993, "b": 582.84299, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "X", "bbox": {"l": 505.2606799999999, "t": 574.51797, "r": 511.26367, "b": 582.84299, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Visual Explain within Run SQL scripts", "bbox": {"l": 70.800079, "t": 593.5376699999999, "r": 220.75178999999997, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "X", "bbox": {"l": 429.0000600000001, "t": 593.5376699999999, "r": 435.00305000000003, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "X", "bbox": {"l": 480.00037, "t": 593.5376699999999, "r": 486.00335999999993, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "X", "bbox": {"l": 505.2606799999999, "t": 593.5376699999999, "r": 511.26367, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "X", "bbox": {"l": 530.76038, "t": 593.5376699999999, "r": 536.76337, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "Visual Explain outside of Run SQL scripts", "bbox": {"l": 70.800079, "t": 612.55737, "r": 236.6548, "b": 620.88239, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "X", "bbox": {"l": 429.0000600000001, "t": 612.55737, "r": 435.00305000000003, "b": 620.88239, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "X", "bbox": {"l": 480.00037, "t": 612.55737, "r": 486.00335999999993, "b": 620.88239, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "ANALYZE PLAN CACHE procedure", "bbox": {"l": 70.800079, "t": 631.51767, "r": 213.12968, "b": 639.84268, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "X", "bbox": {"l": 429.0000600000001, "t": 631.51767, "r": 435.00305000000003, "b": 639.84268, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "X", "bbox": {"l": 480.00037, "t": 631.51767, "r": 486.00335999999993, "b": 639.84268, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "DUMP PLAN CACHE procedure", "bbox": {"l": 70.800079, "t": 650.53737, "r": 199.87808, "b": 658.86238, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "X", "bbox": {"l": 429.0000600000001, "t": 650.53737, "r": 435.00305000000003, "b": 658.86238, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "X", "bbox": {"l": 480.00037, "t": 650.53737, "r": 486.00335999999993, "b": 658.86238, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "MODIFY PLAN CACHE procedure", "bbox": {"l": 70.800079, "t": 669.55708, "r": 208.36777, "b": 677.88207, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "X", "bbox": {"l": 429.0000600000001, "t": 669.55708, "r": 435.00305000000003, "b": 677.88207, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "X", "bbox": {"l": 480.00037, "t": 669.55708, "r": 486.00335999999993, "b": 677.88207, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "MODIFY PLAN CACHE PROPERTIES procedure (currently does not check authority)", "bbox": {"l": 70.800079, "t": 688.57677, "r": 411.20264, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "X", "bbox": {"l": 429.0000600000001, "t": 688.57677, "r": 435.00305000000003, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "X", "bbox": {"l": 480.00037, "t": 688.57677, "r": 486.00335999999993, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "CHANGE PLAN CACHE SIZE procedure (currently does not check authority)", "bbox": {"l": 70.800079, "t": 707.537071, "r": 377.12585, "b": 715.862068, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "X", "bbox": {"l": 429.0000600000001, "t": 707.537071, "r": 435.00305000000003, "b": 715.862068, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "X", "bbox": {"l": 480.00037, "t": 707.537071, "r": 486.00335999999993, "b": 715.862068, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 7, "label": "page_footer", "bbox": {"l": 355.32001, "t": 755.538002, "r": 523.54071, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9508126378059387, "cells": [{"id": 0, "text": "Chapter 2. Roles and separation of duties ", "bbox": {"l": 355.32001, "t": 755.538002, "r": 523.54071, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "page_footer", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.8987301588058472, "cells": [{"id": 1, "text": "11", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 136.79959, "t": 71.50903000000005, "r": 542.69434, "b": 140.72113000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9789126515388489, "cells": [{"id": 2, "text": "For example, assume that a business has assigned the duty to manage security on IBM i to ", "bbox": {"l": 136.79959, "t": 71.50903000000005, "r": 542.69434, "b": 80.72204999999985, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Theresa. Before release IBM i 7.2, to grant privileges, Theresa had to have the same ", "bbox": {"l": 136.79959, "t": 83.50885000000017, "r": 513.67804, "b": 92.72185999999999, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "privileges Theresa was granting to others. Therefore, to grant *USE privileges to the ", "bbox": {"l": 136.79959, "t": 95.50867000000005, "r": 509.71902, "b": 104.72167999999999, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "PAYROLL table, Theresa had to have *OBJMGT and *USE authority (or a higher level of ", "bbox": {"l": 136.79959, "t": 107.50847999999996, "r": 528.20184, "b": 116.72149999999999, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "authority, such as *ALLOBJ). This requirement allowed Theresa to access the data in the ", "bbox": {"l": 136.79959, "t": 119.50829999999996, "r": 531.84015, "b": 128.72131000000002, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "PAYROLL table even though Theresa\u2019s job description was only to manage its security.", "bbox": {"l": 136.79959, "t": 131.50811999999996, "r": 519.24982, "b": 140.72113000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "text", "bbox": {"l": 136.79959, "t": 153.52770999999996, "r": 547.30396, "b": 198.74017000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9665538668632507, "cells": [{"id": 8, "text": "In IBM i 7.2, the QIBM_DB_SECADM function usage grants authorities, revokes authorities, ", "bbox": {"l": 136.79959, "t": 153.52770999999996, "r": 544.16064, "b": 162.74072, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "changes ownership, or changes the primary group without giving access to the object or, in ", "bbox": {"l": 136.79959, "t": 165.52752999999996, "r": 540.66156, "b": 174.74054, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "the case of a database table, to the data that is in the table or allowing other operations on the ", "bbox": {"l": 136.79959, "t": 177.52733999999998, "r": 547.30396, "b": 186.74036, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "table. ", "bbox": {"l": 136.79959, "t": 189.52715999999998, "r": 163.6189, "b": 198.74017000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "text", "bbox": {"l": 136.79959, "t": 211.48694, "r": 538.65076, "b": 232.69976999999994, "coord_origin": "TOPLEFT"}, "confidence": 0.9691813588142395, "cells": [{"id": 12, "text": "QIBM_DB_SECADM function usage can be granted only by a user with *SECADM special ", "bbox": {"l": 136.79959, "t": 211.48694, "r": 538.65076, "b": 220.69994999999994, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "authority and can be given to a user or a group.", "bbox": {"l": 136.79959, "t": 223.48676, "r": 346.34808, "b": 232.69976999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 136.79959, "t": 245.50635, "r": 545.79602, "b": 278.71898999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9729602336883545, "cells": [{"id": 14, "text": "QIBM_DB_SECADM also is responsible for administering RCAC, which restricts which rows ", "bbox": {"l": 136.79959, "t": 245.50635, "r": 545.79602, "b": 254.71936000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "a user is allowed to access in a table and whether a user is allowed to see information in ", "bbox": {"l": 136.79959, "t": 257.50616, "r": 529.46149, "b": 266.71918000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "certain columns of a table.", "bbox": {"l": 136.79959, "t": 269.50598, "r": 253.47696999999997, "b": 278.71898999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 136.79959, "t": 291.52557, "r": 539.80713, "b": 336.73801, "coord_origin": "TOPLEFT"}, "confidence": 0.9815152883529663, "cells": [{"id": 17, "text": "A preferred practice is that the RCAC administrator has the QIBM_DB_SECADM function ", "bbox": {"l": 136.79959, "t": 291.52557, "r": 533.78137, "b": 300.73856, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "usage ID, but absolutely no other data privileges. The result is that the RCAC administrator ", "bbox": {"l": 136.79959, "t": 303.52539, "r": 539.80713, "b": 312.73837000000003, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "can deploy and maintain the RCAC constructs, but cannot grant themselves unauthorized ", "bbox": {"l": 136.79959, "t": 315.52521, "r": 534.5741, "b": 324.73819, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "access to data itself.", "bbox": {"l": 136.79959, "t": 327.52502, "r": 227.02324, "b": 336.73801, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "text", "bbox": {"l": 136.79959, "t": 349.48483, "r": 543.06714, "b": 370.69763000000006, "coord_origin": "TOPLEFT"}, "confidence": 0.9672255516052246, "cells": [{"id": 21, "text": "Table 2-2 shows a comparison of the different function usage IDs and *JOBCTL authority to ", "bbox": {"l": 136.79959, "t": 349.48483, "r": 543.06714, "b": 358.69780999999995, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "the different CL commands and DB2 for i tools.", "bbox": {"l": 136.79959, "t": 361.48465, "r": 343.79236, "b": 370.69763000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "caption", "bbox": {"l": 64.800003, "t": 383.5379899999999, "r": 391.75464, "b": 391.86301, "coord_origin": "TOPLEFT"}, "confidence": 0.9337189793586731, "cells": [{"id": 23, "text": "Table 2-2 Comparison of the different function usage IDs and *JOBCTL authority", "bbox": {"l": 64.800003, "t": 383.5379899999999, "r": 391.75464, "b": 391.86301, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "table", "bbox": {"l": 64.41139221191406, "t": 393.6136169433594, "r": 547.3950805664062, "b": 721.60791015625, "coord_origin": "TOPLEFT"}, "confidence": 0.9899571537971497, "cells": [{"id": 24, "text": "User action", "bbox": {"l": 70.800301, "t": 400.51827999999995, "r": 119.78551, "b": 408.84329, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "*JOBCTL", "bbox": {"l": 424.93805, "t": 447.52255, "r": 433.26297000000005, "b": 487.01999, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "QIBM_DB_SECADM", "bbox": {"l": 450.13806, "t": 401.6000700000001, "r": 458.46298, "b": 487.01999, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "QIBM_DB_SQLADM", "bbox": {"l": 475.93835000000007, "t": 401.53442, "r": 484.26327999999995, "b": 487.01999, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "QIBM_DB_SYSMON", "bbox": {"l": 501.13837, "t": 401.6145, "r": 509.46329, "b": 487.01999, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "No Authority", "bbox": {"l": 526.39862, "t": 432.79944, "r": 534.72357, "b": 487.02005, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "SET CURRENT DEGREE", "bbox": {"l": 70.800003, "t": 498.69299, "r": 151.6794, "b": 506.66699, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": " (SQL statement)", "bbox": {"l": 151.6803, "t": 498.55798, "r": 220.15681000000004, "b": 506.883, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "X", "bbox": {"l": 429.0, "t": 498.55798, "r": 435.00299000000007, "b": 506.883, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "X", "bbox": {"l": 480.00031, "t": 498.55798, "r": 486.0033, "b": 506.883, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "CHGQRYA", "bbox": {"l": 70.800018, "t": 517.65329, "r": 102.23972, "b": 525.62729, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": " command targeting a different user\u2019s job", "bbox": {"l": 102.23972, "t": 517.51828, "r": 264.5538, "b": 525.84329, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "X", "bbox": {"l": 429.00003, "t": 517.51828, "r": 435.00302000000005, "b": 525.84329, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "X", "bbox": {"l": 480.00034, "t": 517.51828, "r": 486.00333, "b": 525.84329, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "STRDBMON", "bbox": {"l": 70.800049, "t": 536.67299, "r": 106.73975, "b": 544.64699, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": " or ", "bbox": {"l": 106.73975, "t": 536.5379800000001, "r": 119.77895, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "ENDDBMON", "bbox": {"l": 119.69975000000001, "t": 536.67299, "r": 155.69974, "b": 544.64699, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": " commands targeting a different user\u2019s job", "bbox": {"l": 155.69974, "t": 536.5379800000001, "r": 322.50574, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "X", "bbox": {"l": 429.00003, "t": 536.5379800000001, "r": 435.00302000000005, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "X", "bbox": {"l": 480.00034, "t": 536.5379800000001, "r": 486.00333, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "STRDBMON", "bbox": {"l": 70.800049, "t": 555.69269, "r": 106.73975, "b": 563.66669, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": " or ", "bbox": {"l": 106.73975, "t": 555.55768, "r": 119.77895, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "ENDDBMON", "bbox": {"l": 119.69975000000001, "t": 555.69269, "r": 155.69974, "b": 563.66669, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": " commands targeting a job that matches the current user", "bbox": {"l": 155.69974, "t": 555.55768, "r": 381.02185, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "X", "bbox": {"l": 429.00003, "t": 555.55768, "r": 435.00302000000005, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "X", "bbox": {"l": 480.00034, "t": 555.55768, "r": 486.00333, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "X", "bbox": {"l": 505.26061999999996, "t": 555.55768, "r": 511.26361, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "X", "bbox": {"l": 530.76031, "t": 555.55768, "r": 536.76331, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "QUSRJOBI() API format 900 or System i Navigator\u2019s SQL Details for Job", "bbox": {"l": 70.800049, "t": 574.51797, "r": 359.51736, "b": 582.84299, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "X", "bbox": {"l": 429.0000600000001, "t": 574.51797, "r": 435.00305000000003, "b": 582.84299, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "X", "bbox": {"l": 480.00037, "t": 574.51797, "r": 486.00335999999993, "b": 582.84299, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "X", "bbox": {"l": 505.2606799999999, "t": 574.51797, "r": 511.26367, "b": 582.84299, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Visual Explain within Run SQL scripts", "bbox": {"l": 70.800079, "t": 593.5376699999999, "r": 220.75178999999997, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "X", "bbox": {"l": 429.0000600000001, "t": 593.5376699999999, "r": 435.00305000000003, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "X", "bbox": {"l": 480.00037, "t": 593.5376699999999, "r": 486.00335999999993, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "X", "bbox": {"l": 505.2606799999999, "t": 593.5376699999999, "r": 511.26367, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "X", "bbox": {"l": 530.76038, "t": 593.5376699999999, "r": 536.76337, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "Visual Explain outside of Run SQL scripts", "bbox": {"l": 70.800079, "t": 612.55737, "r": 236.6548, "b": 620.88239, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "X", "bbox": {"l": 429.0000600000001, "t": 612.55737, "r": 435.00305000000003, "b": 620.88239, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "X", "bbox": {"l": 480.00037, "t": 612.55737, "r": 486.00335999999993, "b": 620.88239, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "ANALYZE PLAN CACHE procedure", "bbox": {"l": 70.800079, "t": 631.51767, "r": 213.12968, "b": 639.84268, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "X", "bbox": {"l": 429.0000600000001, "t": 631.51767, "r": 435.00305000000003, "b": 639.84268, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "X", "bbox": {"l": 480.00037, "t": 631.51767, "r": 486.00335999999993, "b": 639.84268, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "DUMP PLAN CACHE procedure", "bbox": {"l": 70.800079, "t": 650.53737, "r": 199.87808, "b": 658.86238, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "X", "bbox": {"l": 429.0000600000001, "t": 650.53737, "r": 435.00305000000003, "b": 658.86238, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "X", "bbox": {"l": 480.00037, "t": 650.53737, "r": 486.00335999999993, "b": 658.86238, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "MODIFY PLAN CACHE procedure", "bbox": {"l": 70.800079, "t": 669.55708, "r": 208.36777, "b": 677.88207, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "X", "bbox": {"l": 429.0000600000001, "t": 669.55708, "r": 435.00305000000003, "b": 677.88207, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "X", "bbox": {"l": 480.00037, "t": 669.55708, "r": 486.00335999999993, "b": 677.88207, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "MODIFY PLAN CACHE PROPERTIES procedure (currently does not check authority)", "bbox": {"l": 70.800079, "t": 688.57677, "r": 411.20264, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "X", "bbox": {"l": 429.0000600000001, "t": 688.57677, "r": 435.00305000000003, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "X", "bbox": {"l": 480.00037, "t": 688.57677, "r": 486.00335999999993, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "CHANGE PLAN CACHE SIZE procedure (currently does not check authority)", "bbox": {"l": 70.800079, "t": 707.537071, "r": 377.12585, "b": 715.862068, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "X", "bbox": {"l": 429.0000600000001, "t": 707.537071, "r": 435.00305000000003, "b": 715.862068, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "X", "bbox": {"l": 480.00037, "t": 707.537071, "r": 486.00335999999993, "b": 715.862068, "coord_origin": "TOPLEFT"}}], "children": [{"id": 10, "label": "text", "bbox": {"l": 70.800301, "t": 400.51827999999995, "r": 119.78551, "b": 408.84329, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "User action", "bbox": {"l": 70.800301, "t": 400.51827999999995, "r": 119.78551, "b": 408.84329, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 424.93805, "t": 447.52255, "r": 433.26297000000005, "b": 487.01999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "*JOBCTL", "bbox": {"l": 424.93805, "t": 447.52255, "r": 433.26297000000005, "b": 487.01999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 450.13806, "t": 401.6000700000001, "r": 458.46298, "b": 487.01999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "QIBM_DB_SECADM", "bbox": {"l": 450.13806, "t": 401.6000700000001, "r": 458.46298, "b": 487.01999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 475.93835000000007, "t": 401.53442, "r": 484.26327999999995, "b": 487.01999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "QIBM_DB_SQLADM", "bbox": {"l": 475.93835000000007, "t": 401.53442, "r": 484.26327999999995, "b": 487.01999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 501.13837, "t": 401.6145, "r": 509.46329, "b": 487.01999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "QIBM_DB_SYSMON", "bbox": {"l": 501.13837, "t": 401.6145, "r": 509.46329, "b": 487.01999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 526.39862, "t": 432.79944, "r": 534.72357, "b": 487.02005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "No Authority", "bbox": {"l": 526.39862, "t": 432.79944, "r": 534.72357, "b": 487.02005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 70.800003, "t": 498.69299, "r": 151.6794, "b": 506.66699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "SET CURRENT DEGREE", "bbox": {"l": 70.800003, "t": 498.69299, "r": 151.6794, "b": 506.66699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 151.6803, "t": 498.55798, "r": 220.15681000000004, "b": 506.883, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": " (SQL statement)", "bbox": {"l": 151.6803, "t": 498.55798, "r": 220.15681000000004, "b": 506.883, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 429.0, "t": 498.55798, "r": 435.00299000000007, "b": 506.883, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "X", "bbox": {"l": 429.0, "t": 498.55798, "r": 435.00299000000007, "b": 506.883, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 480.00031, "t": 498.55798, "r": 486.0033, "b": 506.883, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "X", "bbox": {"l": 480.00031, "t": 498.55798, "r": 486.0033, "b": 506.883, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 70.800018, "t": 517.65329, "r": 102.23972, "b": 525.62729, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "CHGQRYA", "bbox": {"l": 70.800018, "t": 517.65329, "r": 102.23972, "b": 525.62729, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 102.23972, "t": 517.51828, "r": 264.5538, "b": 525.84329, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": " command targeting a different user\u2019s job", "bbox": {"l": 102.23972, "t": 517.51828, "r": 264.5538, "b": 525.84329, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 429.00003, "t": 517.51828, "r": 435.00302000000005, "b": 525.84329, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "X", "bbox": {"l": 429.00003, "t": 517.51828, "r": 435.00302000000005, "b": 525.84329, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 480.00034, "t": 517.51828, "r": 486.00333, "b": 525.84329, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "X", "bbox": {"l": 480.00034, "t": 517.51828, "r": 486.00333, "b": 525.84329, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 70.800049, "t": 536.67299, "r": 106.73975, "b": 544.64699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "STRDBMON", "bbox": {"l": 70.800049, "t": 536.67299, "r": 106.73975, "b": 544.64699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 106.73975, "t": 536.5379800000001, "r": 119.77895, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": " or ", "bbox": {"l": 106.73975, "t": 536.5379800000001, "r": 119.77895, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 119.69975000000001, "t": 536.67299, "r": 155.69974, "b": 544.64699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "ENDDBMON", "bbox": {"l": 119.69975000000001, "t": 536.67299, "r": 155.69974, "b": 544.64699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 155.69974, "t": 536.5379800000001, "r": 322.50574, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": " commands targeting a different user\u2019s job", "bbox": {"l": 155.69974, "t": 536.5379800000001, "r": 322.50574, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 429.00003, "t": 536.5379800000001, "r": 435.00302000000005, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "X", "bbox": {"l": 429.00003, "t": 536.5379800000001, "r": 435.00302000000005, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 480.00034, "t": 536.5379800000001, "r": 486.00333, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "X", "bbox": {"l": 480.00034, "t": 536.5379800000001, "r": 486.00333, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 70.800049, "t": 555.69269, "r": 106.73975, "b": 563.66669, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "STRDBMON", "bbox": {"l": 70.800049, "t": 555.69269, "r": 106.73975, "b": 563.66669, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 106.73975, "t": 555.55768, "r": 119.77895, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": " or ", "bbox": {"l": 106.73975, "t": 555.55768, "r": 119.77895, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 119.69975000000001, "t": 555.69269, "r": 155.69974, "b": 563.66669, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "ENDDBMON", "bbox": {"l": 119.69975000000001, "t": 555.69269, "r": 155.69974, "b": 563.66669, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 155.69974, "t": 555.55768, "r": 381.02185, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": " commands targeting a job that matches the current user", "bbox": {"l": 155.69974, "t": 555.55768, "r": 381.02185, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 429.00003, "t": 555.55768, "r": 435.00302000000005, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "X", "bbox": {"l": 429.00003, "t": 555.55768, "r": 435.00302000000005, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 480.00034, "t": 555.55768, "r": 486.00333, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "X", "bbox": {"l": 480.00034, "t": 555.55768, "r": 486.00333, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 505.26061999999996, "t": 555.55768, "r": 511.26361, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "X", "bbox": {"l": 505.26061999999996, "t": 555.55768, "r": 511.26361, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 530.76031, "t": 555.55768, "r": 536.76331, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "X", "bbox": {"l": 530.76031, "t": 555.55768, "r": 536.76331, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 70.800049, "t": 574.51797, "r": 359.51736, "b": 582.84299, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "QUSRJOBI() API format 900 or System i Navigator\u2019s SQL Details for Job", "bbox": {"l": 70.800049, "t": 574.51797, "r": 359.51736, "b": 582.84299, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 429.0000600000001, "t": 574.51797, "r": 435.00305000000003, "b": 582.84299, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "X", "bbox": {"l": 429.0000600000001, "t": 574.51797, "r": 435.00305000000003, "b": 582.84299, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 480.00037, "t": 574.51797, "r": 486.00335999999993, "b": 582.84299, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "X", "bbox": {"l": 480.00037, "t": 574.51797, "r": 486.00335999999993, "b": 582.84299, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 505.2606799999999, "t": 574.51797, "r": 511.26367, "b": 582.84299, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "X", "bbox": {"l": 505.2606799999999, "t": 574.51797, "r": 511.26367, "b": 582.84299, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 70.800079, "t": 593.5376699999999, "r": 220.75178999999997, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "Visual Explain within Run SQL scripts", "bbox": {"l": 70.800079, "t": 593.5376699999999, "r": 220.75178999999997, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 429.0000600000001, "t": 593.5376699999999, "r": 435.00305000000003, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "X", "bbox": {"l": 429.0000600000001, "t": 593.5376699999999, "r": 435.00305000000003, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 480.00037, "t": 593.5376699999999, "r": 486.00335999999993, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "X", "bbox": {"l": 480.00037, "t": 593.5376699999999, "r": 486.00335999999993, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 505.2606799999999, "t": 593.5376699999999, "r": 511.26367, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "X", "bbox": {"l": 505.2606799999999, "t": 593.5376699999999, "r": 511.26367, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 530.76038, "t": 593.5376699999999, "r": 536.76337, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "X", "bbox": {"l": 530.76038, "t": 593.5376699999999, "r": 536.76337, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 70.800079, "t": 612.55737, "r": 236.6548, "b": 620.88239, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "Visual Explain outside of Run SQL scripts", "bbox": {"l": 70.800079, "t": 612.55737, "r": 236.6548, "b": 620.88239, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 429.0000600000001, "t": 612.55737, "r": 435.00305000000003, "b": 620.88239, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "X", "bbox": {"l": 429.0000600000001, "t": 612.55737, "r": 435.00305000000003, "b": 620.88239, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 480.00037, "t": 612.55737, "r": 486.00335999999993, "b": 620.88239, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "X", "bbox": {"l": 480.00037, "t": 612.55737, "r": 486.00335999999993, "b": 620.88239, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 70.800079, "t": 631.51767, "r": 213.12968, "b": 639.84268, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "ANALYZE PLAN CACHE procedure", "bbox": {"l": 70.800079, "t": 631.51767, "r": 213.12968, "b": 639.84268, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 429.0000600000001, "t": 631.51767, "r": 435.00305000000003, "b": 639.84268, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "X", "bbox": {"l": 429.0000600000001, "t": 631.51767, "r": 435.00305000000003, "b": 639.84268, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 480.00037, "t": 631.51767, "r": 486.00335999999993, "b": 639.84268, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "X", "bbox": {"l": 480.00037, "t": 631.51767, "r": 486.00335999999993, "b": 639.84268, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 70.800079, "t": 650.53737, "r": 199.87808, "b": 658.86238, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "DUMP PLAN CACHE procedure", "bbox": {"l": 70.800079, "t": 650.53737, "r": 199.87808, "b": 658.86238, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 429.0000600000001, "t": 650.53737, "r": 435.00305000000003, "b": 658.86238, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "X", "bbox": {"l": 429.0000600000001, "t": 650.53737, "r": 435.00305000000003, "b": 658.86238, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 480.00037, "t": 650.53737, "r": 486.00335999999993, "b": 658.86238, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "X", "bbox": {"l": 480.00037, "t": 650.53737, "r": 486.00335999999993, "b": 658.86238, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 70.800079, "t": 669.55708, "r": 208.36777, "b": 677.88207, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "MODIFY PLAN CACHE procedure", "bbox": {"l": 70.800079, "t": 669.55708, "r": 208.36777, "b": 677.88207, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 429.0000600000001, "t": 669.55708, "r": 435.00305000000003, "b": 677.88207, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "X", "bbox": {"l": 429.0000600000001, "t": 669.55708, "r": 435.00305000000003, "b": 677.88207, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 480.00037, "t": 669.55708, "r": 486.00335999999993, "b": 677.88207, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "X", "bbox": {"l": 480.00037, "t": 669.55708, "r": 486.00335999999993, "b": 677.88207, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 70.800079, "t": 688.57677, "r": 411.20264, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "MODIFY PLAN CACHE PROPERTIES procedure (currently does not check authority)", "bbox": {"l": 70.800079, "t": 688.57677, "r": 411.20264, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 429.0000600000001, "t": 688.57677, "r": 435.00305000000003, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "X", "bbox": {"l": 429.0000600000001, "t": 688.57677, "r": 435.00305000000003, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 480.00037, "t": 688.57677, "r": 486.00335999999993, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "X", "bbox": {"l": 480.00037, "t": 688.57677, "r": 486.00335999999993, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 70.800079, "t": 707.537071, "r": 377.12585, "b": 715.862068, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "CHANGE PLAN CACHE SIZE procedure (currently does not check authority)", "bbox": {"l": 70.800079, "t": 707.537071, "r": 377.12585, "b": 715.862068, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 429.0000600000001, "t": 707.537071, "r": 435.00305000000003, "b": 715.862068, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "X", "bbox": {"l": 429.0000600000001, "t": 707.537071, "r": 435.00305000000003, "b": 715.862068, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 480.00037, "t": 707.537071, "r": 486.00335999999993, "b": 715.862068, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "X", "bbox": {"l": 480.00037, "t": 707.537071, "r": 486.00335999999993, "b": 715.862068, "coord_origin": "TOPLEFT"}}], "children": []}]}]}, "tablestructure": {"table_map": {"0": {"label": "table", "id": 0, "page_no": 8, "cluster": {"id": 0, "label": "table", "bbox": {"l": 64.41139221191406, "t": 393.6136169433594, "r": 547.3950805664062, "b": 721.60791015625, "coord_origin": "TOPLEFT"}, "confidence": 0.9899571537971497, "cells": [{"id": 24, "text": "User action", "bbox": {"l": 70.800301, "t": 400.51827999999995, "r": 119.78551, "b": 408.84329, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "*JOBCTL", "bbox": {"l": 424.93805, "t": 447.52255, "r": 433.26297000000005, "b": 487.01999, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "QIBM_DB_SECADM", "bbox": {"l": 450.13806, "t": 401.6000700000001, "r": 458.46298, "b": 487.01999, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "QIBM_DB_SQLADM", "bbox": {"l": 475.93835000000007, "t": 401.53442, "r": 484.26327999999995, "b": 487.01999, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "QIBM_DB_SYSMON", "bbox": {"l": 501.13837, "t": 401.6145, "r": 509.46329, "b": 487.01999, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "No Authority", "bbox": {"l": 526.39862, "t": 432.79944, "r": 534.72357, "b": 487.02005, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "SET CURRENT DEGREE", "bbox": {"l": 70.800003, "t": 498.69299, "r": 151.6794, "b": 506.66699, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": " (SQL statement)", "bbox": {"l": 151.6803, "t": 498.55798, "r": 220.15681000000004, "b": 506.883, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "X", "bbox": {"l": 429.0, "t": 498.55798, "r": 435.00299000000007, "b": 506.883, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "X", "bbox": {"l": 480.00031, "t": 498.55798, "r": 486.0033, "b": 506.883, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "CHGQRYA", "bbox": {"l": 70.800018, "t": 517.65329, "r": 102.23972, "b": 525.62729, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": " command targeting a different user\u2019s job", "bbox": {"l": 102.23972, "t": 517.51828, "r": 264.5538, "b": 525.84329, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "X", "bbox": {"l": 429.00003, "t": 517.51828, "r": 435.00302000000005, "b": 525.84329, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "X", "bbox": {"l": 480.00034, "t": 517.51828, "r": 486.00333, "b": 525.84329, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "STRDBMON", "bbox": {"l": 70.800049, "t": 536.67299, "r": 106.73975, "b": 544.64699, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": " or ", "bbox": {"l": 106.73975, "t": 536.5379800000001, "r": 119.77895, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "ENDDBMON", "bbox": {"l": 119.69975000000001, "t": 536.67299, "r": 155.69974, "b": 544.64699, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": " commands targeting a different user\u2019s job", "bbox": {"l": 155.69974, "t": 536.5379800000001, "r": 322.50574, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "X", "bbox": {"l": 429.00003, "t": 536.5379800000001, "r": 435.00302000000005, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "X", "bbox": {"l": 480.00034, "t": 536.5379800000001, "r": 486.00333, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "STRDBMON", "bbox": {"l": 70.800049, "t": 555.69269, "r": 106.73975, "b": 563.66669, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": " or ", "bbox": {"l": 106.73975, "t": 555.55768, "r": 119.77895, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "ENDDBMON", "bbox": {"l": 119.69975000000001, "t": 555.69269, "r": 155.69974, "b": 563.66669, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": " commands targeting a job that matches the current user", "bbox": {"l": 155.69974, "t": 555.55768, "r": 381.02185, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "X", "bbox": {"l": 429.00003, "t": 555.55768, "r": 435.00302000000005, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "X", "bbox": {"l": 480.00034, "t": 555.55768, "r": 486.00333, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "X", "bbox": {"l": 505.26061999999996, "t": 555.55768, "r": 511.26361, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "X", "bbox": {"l": 530.76031, "t": 555.55768, "r": 536.76331, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "QUSRJOBI() API format 900 or System i Navigator\u2019s SQL Details for Job", "bbox": {"l": 70.800049, "t": 574.51797, "r": 359.51736, "b": 582.84299, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "X", "bbox": {"l": 429.0000600000001, "t": 574.51797, "r": 435.00305000000003, "b": 582.84299, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "X", "bbox": {"l": 480.00037, "t": 574.51797, "r": 486.00335999999993, "b": 582.84299, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "X", "bbox": {"l": 505.2606799999999, "t": 574.51797, "r": 511.26367, "b": 582.84299, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Visual Explain within Run SQL scripts", "bbox": {"l": 70.800079, "t": 593.5376699999999, "r": 220.75178999999997, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "X", "bbox": {"l": 429.0000600000001, "t": 593.5376699999999, "r": 435.00305000000003, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "X", "bbox": {"l": 480.00037, "t": 593.5376699999999, "r": 486.00335999999993, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "X", "bbox": {"l": 505.2606799999999, "t": 593.5376699999999, "r": 511.26367, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "X", "bbox": {"l": 530.76038, "t": 593.5376699999999, "r": 536.76337, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "Visual Explain outside of Run SQL scripts", "bbox": {"l": 70.800079, "t": 612.55737, "r": 236.6548, "b": 620.88239, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "X", "bbox": {"l": 429.0000600000001, "t": 612.55737, "r": 435.00305000000003, "b": 620.88239, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "X", "bbox": {"l": 480.00037, "t": 612.55737, "r": 486.00335999999993, "b": 620.88239, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "ANALYZE PLAN CACHE procedure", "bbox": {"l": 70.800079, "t": 631.51767, "r": 213.12968, "b": 639.84268, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "X", "bbox": {"l": 429.0000600000001, "t": 631.51767, "r": 435.00305000000003, "b": 639.84268, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "X", "bbox": {"l": 480.00037, "t": 631.51767, "r": 486.00335999999993, "b": 639.84268, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "DUMP PLAN CACHE procedure", "bbox": {"l": 70.800079, "t": 650.53737, "r": 199.87808, "b": 658.86238, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "X", "bbox": {"l": 429.0000600000001, "t": 650.53737, "r": 435.00305000000003, "b": 658.86238, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "X", "bbox": {"l": 480.00037, "t": 650.53737, "r": 486.00335999999993, "b": 658.86238, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "MODIFY PLAN CACHE procedure", "bbox": {"l": 70.800079, "t": 669.55708, "r": 208.36777, "b": 677.88207, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "X", "bbox": {"l": 429.0000600000001, "t": 669.55708, "r": 435.00305000000003, "b": 677.88207, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "X", "bbox": {"l": 480.00037, "t": 669.55708, "r": 486.00335999999993, "b": 677.88207, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "MODIFY PLAN CACHE PROPERTIES procedure (currently does not check authority)", "bbox": {"l": 70.800079, "t": 688.57677, "r": 411.20264, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "X", "bbox": {"l": 429.0000600000001, "t": 688.57677, "r": 435.00305000000003, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "X", "bbox": {"l": 480.00037, "t": 688.57677, "r": 486.00335999999993, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "CHANGE PLAN CACHE SIZE procedure (currently does not check authority)", "bbox": {"l": 70.800079, "t": 707.537071, "r": 377.12585, "b": 715.862068, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "X", "bbox": {"l": 429.0000600000001, "t": 707.537071, "r": 435.00305000000003, "b": 715.862068, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "X", "bbox": {"l": 480.00037, "t": 707.537071, "r": 486.00335999999993, "b": 715.862068, "coord_origin": "TOPLEFT"}}], "children": [{"id": 10, "label": "text", "bbox": {"l": 70.800301, "t": 400.51827999999995, "r": 119.78551, "b": 408.84329, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "User action", "bbox": {"l": 70.800301, "t": 400.51827999999995, "r": 119.78551, "b": 408.84329, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 424.93805, "t": 447.52255, "r": 433.26297000000005, "b": 487.01999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "*JOBCTL", "bbox": {"l": 424.93805, "t": 447.52255, "r": 433.26297000000005, "b": 487.01999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 450.13806, "t": 401.6000700000001, "r": 458.46298, "b": 487.01999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "QIBM_DB_SECADM", "bbox": {"l": 450.13806, "t": 401.6000700000001, "r": 458.46298, "b": 487.01999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 475.93835000000007, "t": 401.53442, "r": 484.26327999999995, "b": 487.01999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "QIBM_DB_SQLADM", "bbox": {"l": 475.93835000000007, "t": 401.53442, "r": 484.26327999999995, "b": 487.01999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 501.13837, "t": 401.6145, "r": 509.46329, "b": 487.01999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "QIBM_DB_SYSMON", "bbox": {"l": 501.13837, "t": 401.6145, "r": 509.46329, "b": 487.01999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 526.39862, "t": 432.79944, "r": 534.72357, "b": 487.02005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "No Authority", "bbox": {"l": 526.39862, "t": 432.79944, "r": 534.72357, "b": 487.02005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 70.800003, "t": 498.69299, "r": 151.6794, "b": 506.66699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "SET CURRENT DEGREE", "bbox": {"l": 70.800003, "t": 498.69299, "r": 151.6794, "b": 506.66699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 151.6803, "t": 498.55798, "r": 220.15681000000004, "b": 506.883, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": " (SQL statement)", "bbox": {"l": 151.6803, "t": 498.55798, "r": 220.15681000000004, "b": 506.883, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 429.0, "t": 498.55798, "r": 435.00299000000007, "b": 506.883, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "X", "bbox": {"l": 429.0, "t": 498.55798, "r": 435.00299000000007, "b": 506.883, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 480.00031, "t": 498.55798, "r": 486.0033, "b": 506.883, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "X", "bbox": {"l": 480.00031, "t": 498.55798, "r": 486.0033, "b": 506.883, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 70.800018, "t": 517.65329, "r": 102.23972, "b": 525.62729, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "CHGQRYA", "bbox": {"l": 70.800018, "t": 517.65329, "r": 102.23972, "b": 525.62729, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 102.23972, "t": 517.51828, "r": 264.5538, "b": 525.84329, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": " command targeting a different user\u2019s job", "bbox": {"l": 102.23972, "t": 517.51828, "r": 264.5538, "b": 525.84329, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 429.00003, "t": 517.51828, "r": 435.00302000000005, "b": 525.84329, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "X", "bbox": {"l": 429.00003, "t": 517.51828, "r": 435.00302000000005, "b": 525.84329, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 480.00034, "t": 517.51828, "r": 486.00333, "b": 525.84329, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "X", "bbox": {"l": 480.00034, "t": 517.51828, "r": 486.00333, "b": 525.84329, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 70.800049, "t": 536.67299, "r": 106.73975, "b": 544.64699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "STRDBMON", "bbox": {"l": 70.800049, "t": 536.67299, "r": 106.73975, "b": 544.64699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 106.73975, "t": 536.5379800000001, "r": 119.77895, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": " or ", "bbox": {"l": 106.73975, "t": 536.5379800000001, "r": 119.77895, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 119.69975000000001, "t": 536.67299, "r": 155.69974, "b": 544.64699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "ENDDBMON", "bbox": {"l": 119.69975000000001, "t": 536.67299, "r": 155.69974, "b": 544.64699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 155.69974, "t": 536.5379800000001, "r": 322.50574, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": " commands targeting a different user\u2019s job", "bbox": {"l": 155.69974, "t": 536.5379800000001, "r": 322.50574, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 429.00003, "t": 536.5379800000001, "r": 435.00302000000005, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "X", "bbox": {"l": 429.00003, "t": 536.5379800000001, "r": 435.00302000000005, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 480.00034, "t": 536.5379800000001, "r": 486.00333, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "X", "bbox": {"l": 480.00034, "t": 536.5379800000001, "r": 486.00333, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 70.800049, "t": 555.69269, "r": 106.73975, "b": 563.66669, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "STRDBMON", "bbox": {"l": 70.800049, "t": 555.69269, "r": 106.73975, "b": 563.66669, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 106.73975, "t": 555.55768, "r": 119.77895, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": " or ", "bbox": {"l": 106.73975, "t": 555.55768, "r": 119.77895, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 119.69975000000001, "t": 555.69269, "r": 155.69974, "b": 563.66669, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "ENDDBMON", "bbox": {"l": 119.69975000000001, "t": 555.69269, "r": 155.69974, "b": 563.66669, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 155.69974, "t": 555.55768, "r": 381.02185, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": " commands targeting a job that matches the current user", "bbox": {"l": 155.69974, "t": 555.55768, "r": 381.02185, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 429.00003, "t": 555.55768, "r": 435.00302000000005, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "X", "bbox": {"l": 429.00003, "t": 555.55768, "r": 435.00302000000005, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 480.00034, "t": 555.55768, "r": 486.00333, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "X", "bbox": {"l": 480.00034, "t": 555.55768, "r": 486.00333, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 505.26061999999996, "t": 555.55768, "r": 511.26361, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "X", "bbox": {"l": 505.26061999999996, "t": 555.55768, "r": 511.26361, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 530.76031, "t": 555.55768, "r": 536.76331, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "X", "bbox": {"l": 530.76031, "t": 555.55768, "r": 536.76331, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 70.800049, "t": 574.51797, "r": 359.51736, "b": 582.84299, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "QUSRJOBI() API format 900 or System i Navigator\u2019s SQL Details for Job", "bbox": {"l": 70.800049, "t": 574.51797, "r": 359.51736, "b": 582.84299, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 429.0000600000001, "t": 574.51797, "r": 435.00305000000003, "b": 582.84299, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "X", "bbox": {"l": 429.0000600000001, "t": 574.51797, "r": 435.00305000000003, "b": 582.84299, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 480.00037, "t": 574.51797, "r": 486.00335999999993, "b": 582.84299, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "X", "bbox": {"l": 480.00037, "t": 574.51797, "r": 486.00335999999993, "b": 582.84299, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 505.2606799999999, "t": 574.51797, "r": 511.26367, "b": 582.84299, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "X", "bbox": {"l": 505.2606799999999, "t": 574.51797, "r": 511.26367, "b": 582.84299, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 70.800079, "t": 593.5376699999999, "r": 220.75178999999997, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "Visual Explain within Run SQL scripts", "bbox": {"l": 70.800079, "t": 593.5376699999999, "r": 220.75178999999997, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 429.0000600000001, "t": 593.5376699999999, "r": 435.00305000000003, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "X", "bbox": {"l": 429.0000600000001, "t": 593.5376699999999, "r": 435.00305000000003, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 480.00037, "t": 593.5376699999999, "r": 486.00335999999993, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "X", "bbox": {"l": 480.00037, "t": 593.5376699999999, "r": 486.00335999999993, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 505.2606799999999, "t": 593.5376699999999, "r": 511.26367, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "X", "bbox": {"l": 505.2606799999999, "t": 593.5376699999999, "r": 511.26367, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 530.76038, "t": 593.5376699999999, "r": 536.76337, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "X", "bbox": {"l": 530.76038, "t": 593.5376699999999, "r": 536.76337, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 70.800079, "t": 612.55737, "r": 236.6548, "b": 620.88239, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "Visual Explain outside of Run SQL scripts", "bbox": {"l": 70.800079, "t": 612.55737, "r": 236.6548, "b": 620.88239, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 429.0000600000001, "t": 612.55737, "r": 435.00305000000003, "b": 620.88239, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "X", "bbox": {"l": 429.0000600000001, "t": 612.55737, "r": 435.00305000000003, "b": 620.88239, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 480.00037, "t": 612.55737, "r": 486.00335999999993, "b": 620.88239, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "X", "bbox": {"l": 480.00037, "t": 612.55737, "r": 486.00335999999993, "b": 620.88239, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 70.800079, "t": 631.51767, "r": 213.12968, "b": 639.84268, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "ANALYZE PLAN CACHE procedure", "bbox": {"l": 70.800079, "t": 631.51767, "r": 213.12968, "b": 639.84268, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 429.0000600000001, "t": 631.51767, "r": 435.00305000000003, "b": 639.84268, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "X", "bbox": {"l": 429.0000600000001, "t": 631.51767, "r": 435.00305000000003, "b": 639.84268, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 480.00037, "t": 631.51767, "r": 486.00335999999993, "b": 639.84268, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "X", "bbox": {"l": 480.00037, "t": 631.51767, "r": 486.00335999999993, "b": 639.84268, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 70.800079, "t": 650.53737, "r": 199.87808, "b": 658.86238, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "DUMP PLAN CACHE procedure", "bbox": {"l": 70.800079, "t": 650.53737, "r": 199.87808, "b": 658.86238, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 429.0000600000001, "t": 650.53737, "r": 435.00305000000003, "b": 658.86238, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "X", "bbox": {"l": 429.0000600000001, "t": 650.53737, "r": 435.00305000000003, "b": 658.86238, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 480.00037, "t": 650.53737, "r": 486.00335999999993, "b": 658.86238, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "X", "bbox": {"l": 480.00037, "t": 650.53737, "r": 486.00335999999993, "b": 658.86238, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 70.800079, "t": 669.55708, "r": 208.36777, "b": 677.88207, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "MODIFY PLAN CACHE procedure", "bbox": {"l": 70.800079, "t": 669.55708, "r": 208.36777, "b": 677.88207, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 429.0000600000001, "t": 669.55708, "r": 435.00305000000003, "b": 677.88207, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "X", "bbox": {"l": 429.0000600000001, "t": 669.55708, "r": 435.00305000000003, "b": 677.88207, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 480.00037, "t": 669.55708, "r": 486.00335999999993, "b": 677.88207, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "X", "bbox": {"l": 480.00037, "t": 669.55708, "r": 486.00335999999993, "b": 677.88207, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 70.800079, "t": 688.57677, "r": 411.20264, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "MODIFY PLAN CACHE PROPERTIES procedure (currently does not check authority)", "bbox": {"l": 70.800079, "t": 688.57677, "r": 411.20264, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 429.0000600000001, "t": 688.57677, "r": 435.00305000000003, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "X", "bbox": {"l": 429.0000600000001, "t": 688.57677, "r": 435.00305000000003, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 480.00037, "t": 688.57677, "r": 486.00335999999993, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "X", "bbox": {"l": 480.00037, "t": 688.57677, "r": 486.00335999999993, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 70.800079, "t": 707.537071, "r": 377.12585, "b": 715.862068, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "CHANGE PLAN CACHE SIZE procedure (currently does not check authority)", "bbox": {"l": 70.800079, "t": 707.537071, "r": 377.12585, "b": 715.862068, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 429.0000600000001, "t": 707.537071, "r": 435.00305000000003, "b": 715.862068, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "X", "bbox": {"l": 429.0000600000001, "t": 707.537071, "r": 435.00305000000003, "b": 715.862068, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 480.00037, "t": 707.537071, "r": 486.00335999999993, "b": 715.862068, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "X", "bbox": {"l": 480.00037, "t": 707.537071, "r": 486.00335999999993, "b": 715.862068, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "ecel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "ecel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "ecel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "ecel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "ecel", "fcel", "fcel", "ecel", "nl", "rhed", "fcel", "ecel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "ecel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "ecel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "ecel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "ecel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "ecel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "ecel", "fcel", "ecel", "ecel", "nl"], "num_rows": 13, "num_cols": 6, "table_cells": [{"bbox": {"l": 70.800301, "t": 400.51827999999995, "r": 119.78551, "b": 408.84329, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "User action", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 424.93805, "t": 447.52255, "r": 433.26297000000005, "b": 487.01999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "*JOBCTL", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 450.13806, "t": 401.6000700000001, "r": 458.46298, "b": 487.01999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "QIBM_DB_SECADM", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 475.93835000000007, "t": 401.53442, "r": 484.26327999999995, "b": 487.01999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "QIBM_DB_SQLADM", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 501.13837, "t": 401.6145, "r": 509.46329, "b": 487.01999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "QIBM_DB_SYSMON", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 526.39862, "t": 432.79944, "r": 534.72357, "b": 487.02005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "No Authority", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800003, "t": 498.55798, "r": 220.15681000000004, "b": 506.883, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "SET CURRENT DEGREE  (SQL statement)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0, "t": 498.55798, "r": 435.00299000000007, "b": 506.883, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00031, "t": 498.55798, "r": 486.0033, "b": 506.883, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800018, "t": 517.51828, "r": 264.5538, "b": 525.84329, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "CHGQRYA  command targeting a different user\u2019s job", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.00003, "t": 517.51828, "r": 435.00302000000005, "b": 525.84329, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00034, "t": 517.51828, "r": 486.00333, "b": 525.84329, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800049, "t": 536.5379800000001, "r": 322.50574, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "STRDBMON  or  ENDDBMON  commands targeting a different user\u2019s job", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.00003, "t": 536.5379800000001, "r": 435.00302000000005, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00034, "t": 536.5379800000001, "r": 486.00333, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800049, "t": 555.55768, "r": 381.02185, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "STRDBMON  or  ENDDBMON  commands targeting a job that matches the current user", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.00003, "t": 555.55768, "r": 435.00302000000005, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00034, "t": 555.55768, "r": 486.00333, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 505.26061999999996, "t": 555.55768, "r": 511.26361, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 530.76031, "t": 555.55768, "r": 536.76331, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800049, "t": 574.51797, "r": 359.51736, "b": 582.84299, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "QUSRJOBI() API format 900 or System i Navigator\u2019s SQL Details for Job", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 574.51797, "r": 435.00305000000003, "b": 582.84299, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 574.51797, "r": 486.00335999999993, "b": 582.84299, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 505.2606799999999, "t": 574.51797, "r": 511.26367, "b": 582.84299, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800079, "t": 593.5376699999999, "r": 220.75178999999997, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Visual Explain within Run SQL scripts", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 593.5376699999999, "r": 435.00305000000003, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 593.5376699999999, "r": 486.00335999999993, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 505.2606799999999, "t": 593.5376699999999, "r": 511.26367, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 530.76038, "t": 593.5376699999999, "r": 536.76337, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800079, "t": 612.55737, "r": 236.6548, "b": 620.88239, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Visual Explain outside of Run SQL scripts", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 612.55737, "r": 435.00305000000003, "b": 620.88239, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 612.55737, "r": 486.00335999999993, "b": 620.88239, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800079, "t": 631.51767, "r": 213.12968, "b": 639.84268, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "ANALYZE PLAN CACHE procedure", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 631.51767, "r": 435.00305000000003, "b": 639.84268, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 631.51767, "r": 486.00335999999993, "b": 639.84268, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800079, "t": 650.53737, "r": 199.87808, "b": 658.86238, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "DUMP PLAN CACHE procedure", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 650.53737, "r": 435.00305000000003, "b": 658.86238, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 650.53737, "r": 486.00335999999993, "b": 658.86238, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800079, "t": 669.55708, "r": 208.36777, "b": 677.88207, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "MODIFY PLAN CACHE procedure", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 669.55708, "r": 435.00305000000003, "b": 677.88207, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 669.55708, "r": 486.00335999999993, "b": 677.88207, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800079, "t": 688.57677, "r": 411.20264, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "MODIFY PLAN CACHE PROPERTIES procedure (currently does not check authority)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 688.57677, "r": 435.00305000000003, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 688.57677, "r": 486.00335999999993, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800079, "t": 707.537071, "r": 377.12585, "b": 715.862068, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "CHANGE PLAN CACHE SIZE procedure (currently does not check authority)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 707.537071, "r": 435.00305000000003, "b": 715.862068, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 707.537071, "r": 486.00335999999993, "b": 715.862068, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}]}}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_footer", "id": 7, "page_no": 8, "cluster": {"id": 7, "label": "page_footer", "bbox": {"l": 355.32001, "t": 755.538002, "r": 523.54071, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9508126378059387, "cells": [{"id": 0, "text": "Chapter 2. Roles and separation of duties ", "bbox": {"l": 355.32001, "t": 755.538002, "r": 523.54071, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Chapter 2. Roles and separation of duties"}, {"label": "page_footer", "id": 9, "page_no": 8, "cluster": {"id": 9, "label": "page_footer", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.8987301588058472, "cells": [{"id": 1, "text": "11", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "11"}, {"label": "text", "id": 2, "page_no": 8, "cluster": {"id": 2, "label": "text", "bbox": {"l": 136.79959, "t": 71.50903000000005, "r": 542.69434, "b": 140.72113000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9789126515388489, "cells": [{"id": 2, "text": "For example, assume that a business has assigned the duty to manage security on IBM i to ", "bbox": {"l": 136.79959, "t": 71.50903000000005, "r": 542.69434, "b": 80.72204999999985, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Theresa. Before release IBM i 7.2, to grant privileges, Theresa had to have the same ", "bbox": {"l": 136.79959, "t": 83.50885000000017, "r": 513.67804, "b": 92.72185999999999, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "privileges Theresa was granting to others. Therefore, to grant *USE privileges to the ", "bbox": {"l": 136.79959, "t": 95.50867000000005, "r": 509.71902, "b": 104.72167999999999, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "PAYROLL table, Theresa had to have *OBJMGT and *USE authority (or a higher level of ", "bbox": {"l": 136.79959, "t": 107.50847999999996, "r": 528.20184, "b": 116.72149999999999, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "authority, such as *ALLOBJ). This requirement allowed Theresa to access the data in the ", "bbox": {"l": 136.79959, "t": 119.50829999999996, "r": 531.84015, "b": 128.72131000000002, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "PAYROLL table even though Theresa\u2019s job description was only to manage its security.", "bbox": {"l": 136.79959, "t": 131.50811999999996, "r": 519.24982, "b": 140.72113000000002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "For example, assume that a business has assigned the duty to manage security on IBM i to Theresa. Before release IBM i 7.2, to grant privileges, Theresa had to have the same privileges Theresa was granting to others. Therefore, to grant *USE privileges to the PAYROLL table, Theresa had to have *OBJMGT and *USE authority (or a higher level of authority, such as *ALLOBJ). This requirement allowed Theresa to access the data in the PAYROLL table even though Theresa\u2019s job description was only to manage its security."}, {"label": "text", "id": 6, "page_no": 8, "cluster": {"id": 6, "label": "text", "bbox": {"l": 136.79959, "t": 153.52770999999996, "r": 547.30396, "b": 198.74017000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9665538668632507, "cells": [{"id": 8, "text": "In IBM i 7.2, the QIBM_DB_SECADM function usage grants authorities, revokes authorities, ", "bbox": {"l": 136.79959, "t": 153.52770999999996, "r": 544.16064, "b": 162.74072, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "changes ownership, or changes the primary group without giving access to the object or, in ", "bbox": {"l": 136.79959, "t": 165.52752999999996, "r": 540.66156, "b": 174.74054, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "the case of a database table, to the data that is in the table or allowing other operations on the ", "bbox": {"l": 136.79959, "t": 177.52733999999998, "r": 547.30396, "b": 186.74036, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "table. ", "bbox": {"l": 136.79959, "t": 189.52715999999998, "r": 163.6189, "b": 198.74017000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In IBM i 7.2, the QIBM_DB_SECADM function usage grants authorities, revokes authorities, changes ownership, or changes the primary group without giving access to the object or, in the case of a database table, to the data that is in the table or allowing other operations on the table."}, {"label": "text", "id": 4, "page_no": 8, "cluster": {"id": 4, "label": "text", "bbox": {"l": 136.79959, "t": 211.48694, "r": 538.65076, "b": 232.69976999999994, "coord_origin": "TOPLEFT"}, "confidence": 0.9691813588142395, "cells": [{"id": 12, "text": "QIBM_DB_SECADM function usage can be granted only by a user with *SECADM special ", "bbox": {"l": 136.79959, "t": 211.48694, "r": 538.65076, "b": 220.69994999999994, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "authority and can be given to a user or a group.", "bbox": {"l": 136.79959, "t": 223.48676, "r": 346.34808, "b": 232.69976999999994, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "QIBM_DB_SECADM function usage can be granted only by a user with *SECADM special authority and can be given to a user or a group."}, {"label": "text", "id": 3, "page_no": 8, "cluster": {"id": 3, "label": "text", "bbox": {"l": 136.79959, "t": 245.50635, "r": 545.79602, "b": 278.71898999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9729602336883545, "cells": [{"id": 14, "text": "QIBM_DB_SECADM also is responsible for administering RCAC, which restricts which rows ", "bbox": {"l": 136.79959, "t": 245.50635, "r": 545.79602, "b": 254.71936000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "a user is allowed to access in a table and whether a user is allowed to see information in ", "bbox": {"l": 136.79959, "t": 257.50616, "r": 529.46149, "b": 266.71918000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "certain columns of a table.", "bbox": {"l": 136.79959, "t": 269.50598, "r": 253.47696999999997, "b": 278.71898999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "QIBM_DB_SECADM also is responsible for administering RCAC, which restricts which rows a user is allowed to access in a table and whether a user is allowed to see information in certain columns of a table."}, {"label": "text", "id": 1, "page_no": 8, "cluster": {"id": 1, "label": "text", "bbox": {"l": 136.79959, "t": 291.52557, "r": 539.80713, "b": 336.73801, "coord_origin": "TOPLEFT"}, "confidence": 0.9815152883529663, "cells": [{"id": 17, "text": "A preferred practice is that the RCAC administrator has the QIBM_DB_SECADM function ", "bbox": {"l": 136.79959, "t": 291.52557, "r": 533.78137, "b": 300.73856, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "usage ID, but absolutely no other data privileges. The result is that the RCAC administrator ", "bbox": {"l": 136.79959, "t": 303.52539, "r": 539.80713, "b": 312.73837000000003, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "can deploy and maintain the RCAC constructs, but cannot grant themselves unauthorized ", "bbox": {"l": 136.79959, "t": 315.52521, "r": 534.5741, "b": 324.73819, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "access to data itself.", "bbox": {"l": 136.79959, "t": 327.52502, "r": 227.02324, "b": 336.73801, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "A preferred practice is that the RCAC administrator has the QIBM_DB_SECADM function usage ID, but absolutely no other data privileges. The result is that the RCAC administrator can deploy and maintain the RCAC constructs, but cannot grant themselves unauthorized access to data itself."}, {"label": "text", "id": 5, "page_no": 8, "cluster": {"id": 5, "label": "text", "bbox": {"l": 136.79959, "t": 349.48483, "r": 543.06714, "b": 370.69763000000006, "coord_origin": "TOPLEFT"}, "confidence": 0.9672255516052246, "cells": [{"id": 21, "text": "Table 2-2 shows a comparison of the different function usage IDs and *JOBCTL authority to ", "bbox": {"l": 136.79959, "t": 349.48483, "r": 543.06714, "b": 358.69780999999995, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "the different CL commands and DB2 for i tools.", "bbox": {"l": 136.79959, "t": 361.48465, "r": 343.79236, "b": 370.69763000000006, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 2-2 shows a comparison of the different function usage IDs and *JOBCTL authority to the different CL commands and DB2 for i tools."}, {"label": "caption", "id": 8, "page_no": 8, "cluster": {"id": 8, "label": "caption", "bbox": {"l": 64.800003, "t": 383.5379899999999, "r": 391.75464, "b": 391.86301, "coord_origin": "TOPLEFT"}, "confidence": 0.9337189793586731, "cells": [{"id": 23, "text": "Table 2-2 Comparison of the different function usage IDs and *JOBCTL authority", "bbox": {"l": 64.800003, "t": 383.5379899999999, "r": 391.75464, "b": 391.86301, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 2-2 Comparison of the different function usage IDs and *JOBCTL authority"}, {"label": "table", "id": 0, "page_no": 8, "cluster": {"id": 0, "label": "table", "bbox": {"l": 64.41139221191406, "t": 393.6136169433594, "r": 547.3950805664062, "b": 721.60791015625, "coord_origin": "TOPLEFT"}, "confidence": 0.9899571537971497, "cells": [{"id": 24, "text": "User action", "bbox": {"l": 70.800301, "t": 400.51827999999995, "r": 119.78551, "b": 408.84329, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "*JOBCTL", "bbox": {"l": 424.93805, "t": 447.52255, "r": 433.26297000000005, "b": 487.01999, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "QIBM_DB_SECADM", "bbox": {"l": 450.13806, "t": 401.6000700000001, "r": 458.46298, "b": 487.01999, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "QIBM_DB_SQLADM", "bbox": {"l": 475.93835000000007, "t": 401.53442, "r": 484.26327999999995, "b": 487.01999, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "QIBM_DB_SYSMON", "bbox": {"l": 501.13837, "t": 401.6145, "r": 509.46329, "b": 487.01999, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "No Authority", "bbox": {"l": 526.39862, "t": 432.79944, "r": 534.72357, "b": 487.02005, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "SET CURRENT DEGREE", "bbox": {"l": 70.800003, "t": 498.69299, "r": 151.6794, "b": 506.66699, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": " (SQL statement)", "bbox": {"l": 151.6803, "t": 498.55798, "r": 220.15681000000004, "b": 506.883, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "X", "bbox": {"l": 429.0, "t": 498.55798, "r": 435.00299000000007, "b": 506.883, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "X", "bbox": {"l": 480.00031, "t": 498.55798, "r": 486.0033, "b": 506.883, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "CHGQRYA", "bbox": {"l": 70.800018, "t": 517.65329, "r": 102.23972, "b": 525.62729, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": " command targeting a different user\u2019s job", "bbox": {"l": 102.23972, "t": 517.51828, "r": 264.5538, "b": 525.84329, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "X", "bbox": {"l": 429.00003, "t": 517.51828, "r": 435.00302000000005, "b": 525.84329, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "X", "bbox": {"l": 480.00034, "t": 517.51828, "r": 486.00333, "b": 525.84329, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "STRDBMON", "bbox": {"l": 70.800049, "t": 536.67299, "r": 106.73975, "b": 544.64699, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": " or ", "bbox": {"l": 106.73975, "t": 536.5379800000001, "r": 119.77895, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "ENDDBMON", "bbox": {"l": 119.69975000000001, "t": 536.67299, "r": 155.69974, "b": 544.64699, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": " commands targeting a different user\u2019s job", "bbox": {"l": 155.69974, "t": 536.5379800000001, "r": 322.50574, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "X", "bbox": {"l": 429.00003, "t": 536.5379800000001, "r": 435.00302000000005, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "X", "bbox": {"l": 480.00034, "t": 536.5379800000001, "r": 486.00333, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "STRDBMON", "bbox": {"l": 70.800049, "t": 555.69269, "r": 106.73975, "b": 563.66669, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": " or ", "bbox": {"l": 106.73975, "t": 555.55768, "r": 119.77895, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "ENDDBMON", "bbox": {"l": 119.69975000000001, "t": 555.69269, "r": 155.69974, "b": 563.66669, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": " commands targeting a job that matches the current user", "bbox": {"l": 155.69974, "t": 555.55768, "r": 381.02185, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "X", "bbox": {"l": 429.00003, "t": 555.55768, "r": 435.00302000000005, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "X", "bbox": {"l": 480.00034, "t": 555.55768, "r": 486.00333, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "X", "bbox": {"l": 505.26061999999996, "t": 555.55768, "r": 511.26361, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "X", "bbox": {"l": 530.76031, "t": 555.55768, "r": 536.76331, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "QUSRJOBI() API format 900 or System i Navigator\u2019s SQL Details for Job", "bbox": {"l": 70.800049, "t": 574.51797, "r": 359.51736, "b": 582.84299, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "X", "bbox": {"l": 429.0000600000001, "t": 574.51797, "r": 435.00305000000003, "b": 582.84299, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "X", "bbox": {"l": 480.00037, "t": 574.51797, "r": 486.00335999999993, "b": 582.84299, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "X", "bbox": {"l": 505.2606799999999, "t": 574.51797, "r": 511.26367, "b": 582.84299, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Visual Explain within Run SQL scripts", "bbox": {"l": 70.800079, "t": 593.5376699999999, "r": 220.75178999999997, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "X", "bbox": {"l": 429.0000600000001, "t": 593.5376699999999, "r": 435.00305000000003, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "X", "bbox": {"l": 480.00037, "t": 593.5376699999999, "r": 486.00335999999993, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "X", "bbox": {"l": 505.2606799999999, "t": 593.5376699999999, "r": 511.26367, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "X", "bbox": {"l": 530.76038, "t": 593.5376699999999, "r": 536.76337, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "Visual Explain outside of Run SQL scripts", "bbox": {"l": 70.800079, "t": 612.55737, "r": 236.6548, "b": 620.88239, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "X", "bbox": {"l": 429.0000600000001, "t": 612.55737, "r": 435.00305000000003, "b": 620.88239, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "X", "bbox": {"l": 480.00037, "t": 612.55737, "r": 486.00335999999993, "b": 620.88239, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "ANALYZE PLAN CACHE procedure", "bbox": {"l": 70.800079, "t": 631.51767, "r": 213.12968, "b": 639.84268, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "X", "bbox": {"l": 429.0000600000001, "t": 631.51767, "r": 435.00305000000003, "b": 639.84268, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "X", "bbox": {"l": 480.00037, "t": 631.51767, "r": 486.00335999999993, "b": 639.84268, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "DUMP PLAN CACHE procedure", "bbox": {"l": 70.800079, "t": 650.53737, "r": 199.87808, "b": 658.86238, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "X", "bbox": {"l": 429.0000600000001, "t": 650.53737, "r": 435.00305000000003, "b": 658.86238, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "X", "bbox": {"l": 480.00037, "t": 650.53737, "r": 486.00335999999993, "b": 658.86238, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "MODIFY PLAN CACHE procedure", "bbox": {"l": 70.800079, "t": 669.55708, "r": 208.36777, "b": 677.88207, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "X", "bbox": {"l": 429.0000600000001, "t": 669.55708, "r": 435.00305000000003, "b": 677.88207, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "X", "bbox": {"l": 480.00037, "t": 669.55708, "r": 486.00335999999993, "b": 677.88207, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "MODIFY PLAN CACHE PROPERTIES procedure (currently does not check authority)", "bbox": {"l": 70.800079, "t": 688.57677, "r": 411.20264, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "X", "bbox": {"l": 429.0000600000001, "t": 688.57677, "r": 435.00305000000003, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "X", "bbox": {"l": 480.00037, "t": 688.57677, "r": 486.00335999999993, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "CHANGE PLAN CACHE SIZE procedure (currently does not check authority)", "bbox": {"l": 70.800079, "t": 707.537071, "r": 377.12585, "b": 715.862068, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "X", "bbox": {"l": 429.0000600000001, "t": 707.537071, "r": 435.00305000000003, "b": 715.862068, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "X", "bbox": {"l": 480.00037, "t": 707.537071, "r": 486.00335999999993, "b": 715.862068, "coord_origin": "TOPLEFT"}}], "children": [{"id": 10, "label": "text", "bbox": {"l": 70.800301, "t": 400.51827999999995, "r": 119.78551, "b": 408.84329, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "User action", "bbox": {"l": 70.800301, "t": 400.51827999999995, "r": 119.78551, "b": 408.84329, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 424.93805, "t": 447.52255, "r": 433.26297000000005, "b": 487.01999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "*JOBCTL", "bbox": {"l": 424.93805, "t": 447.52255, "r": 433.26297000000005, "b": 487.01999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 450.13806, "t": 401.6000700000001, "r": 458.46298, "b": 487.01999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "QIBM_DB_SECADM", "bbox": {"l": 450.13806, "t": 401.6000700000001, "r": 458.46298, "b": 487.01999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 475.93835000000007, "t": 401.53442, "r": 484.26327999999995, "b": 487.01999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "QIBM_DB_SQLADM", "bbox": {"l": 475.93835000000007, "t": 401.53442, "r": 484.26327999999995, "b": 487.01999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 501.13837, "t": 401.6145, "r": 509.46329, "b": 487.01999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "QIBM_DB_SYSMON", "bbox": {"l": 501.13837, "t": 401.6145, "r": 509.46329, "b": 487.01999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 526.39862, "t": 432.79944, "r": 534.72357, "b": 487.02005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "No Authority", "bbox": {"l": 526.39862, "t": 432.79944, "r": 534.72357, "b": 487.02005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 70.800003, "t": 498.69299, "r": 151.6794, "b": 506.66699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "SET CURRENT DEGREE", "bbox": {"l": 70.800003, "t": 498.69299, "r": 151.6794, "b": 506.66699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 151.6803, "t": 498.55798, "r": 220.15681000000004, "b": 506.883, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": " (SQL statement)", "bbox": {"l": 151.6803, "t": 498.55798, "r": 220.15681000000004, "b": 506.883, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 429.0, "t": 498.55798, "r": 435.00299000000007, "b": 506.883, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "X", "bbox": {"l": 429.0, "t": 498.55798, "r": 435.00299000000007, "b": 506.883, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 480.00031, "t": 498.55798, "r": 486.0033, "b": 506.883, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "X", "bbox": {"l": 480.00031, "t": 498.55798, "r": 486.0033, "b": 506.883, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 70.800018, "t": 517.65329, "r": 102.23972, "b": 525.62729, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "CHGQRYA", "bbox": {"l": 70.800018, "t": 517.65329, "r": 102.23972, "b": 525.62729, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 102.23972, "t": 517.51828, "r": 264.5538, "b": 525.84329, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": " command targeting a different user\u2019s job", "bbox": {"l": 102.23972, "t": 517.51828, "r": 264.5538, "b": 525.84329, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 429.00003, "t": 517.51828, "r": 435.00302000000005, "b": 525.84329, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "X", "bbox": {"l": 429.00003, "t": 517.51828, "r": 435.00302000000005, "b": 525.84329, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 480.00034, "t": 517.51828, "r": 486.00333, "b": 525.84329, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "X", "bbox": {"l": 480.00034, "t": 517.51828, "r": 486.00333, "b": 525.84329, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 70.800049, "t": 536.67299, "r": 106.73975, "b": 544.64699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "STRDBMON", "bbox": {"l": 70.800049, "t": 536.67299, "r": 106.73975, "b": 544.64699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 106.73975, "t": 536.5379800000001, "r": 119.77895, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": " or ", "bbox": {"l": 106.73975, "t": 536.5379800000001, "r": 119.77895, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 119.69975000000001, "t": 536.67299, "r": 155.69974, "b": 544.64699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "ENDDBMON", "bbox": {"l": 119.69975000000001, "t": 536.67299, "r": 155.69974, "b": 544.64699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 155.69974, "t": 536.5379800000001, "r": 322.50574, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": " commands targeting a different user\u2019s job", "bbox": {"l": 155.69974, "t": 536.5379800000001, "r": 322.50574, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 429.00003, "t": 536.5379800000001, "r": 435.00302000000005, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "X", "bbox": {"l": 429.00003, "t": 536.5379800000001, "r": 435.00302000000005, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 480.00034, "t": 536.5379800000001, "r": 486.00333, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "X", "bbox": {"l": 480.00034, "t": 536.5379800000001, "r": 486.00333, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 70.800049, "t": 555.69269, "r": 106.73975, "b": 563.66669, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "STRDBMON", "bbox": {"l": 70.800049, "t": 555.69269, "r": 106.73975, "b": 563.66669, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 106.73975, "t": 555.55768, "r": 119.77895, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": " or ", "bbox": {"l": 106.73975, "t": 555.55768, "r": 119.77895, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 119.69975000000001, "t": 555.69269, "r": 155.69974, "b": 563.66669, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "ENDDBMON", "bbox": {"l": 119.69975000000001, "t": 555.69269, "r": 155.69974, "b": 563.66669, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 155.69974, "t": 555.55768, "r": 381.02185, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": " commands targeting a job that matches the current user", "bbox": {"l": 155.69974, "t": 555.55768, "r": 381.02185, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 429.00003, "t": 555.55768, "r": 435.00302000000005, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "X", "bbox": {"l": 429.00003, "t": 555.55768, "r": 435.00302000000005, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 480.00034, "t": 555.55768, "r": 486.00333, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "X", "bbox": {"l": 480.00034, "t": 555.55768, "r": 486.00333, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 505.26061999999996, "t": 555.55768, "r": 511.26361, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "X", "bbox": {"l": 505.26061999999996, "t": 555.55768, "r": 511.26361, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 530.76031, "t": 555.55768, "r": 536.76331, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "X", "bbox": {"l": 530.76031, "t": 555.55768, "r": 536.76331, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 70.800049, "t": 574.51797, "r": 359.51736, "b": 582.84299, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "QUSRJOBI() API format 900 or System i Navigator\u2019s SQL Details for Job", "bbox": {"l": 70.800049, "t": 574.51797, "r": 359.51736, "b": 582.84299, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 429.0000600000001, "t": 574.51797, "r": 435.00305000000003, "b": 582.84299, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "X", "bbox": {"l": 429.0000600000001, "t": 574.51797, "r": 435.00305000000003, "b": 582.84299, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 480.00037, "t": 574.51797, "r": 486.00335999999993, "b": 582.84299, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "X", "bbox": {"l": 480.00037, "t": 574.51797, "r": 486.00335999999993, "b": 582.84299, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 505.2606799999999, "t": 574.51797, "r": 511.26367, "b": 582.84299, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "X", "bbox": {"l": 505.2606799999999, "t": 574.51797, "r": 511.26367, "b": 582.84299, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 70.800079, "t": 593.5376699999999, "r": 220.75178999999997, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "Visual Explain within Run SQL scripts", "bbox": {"l": 70.800079, "t": 593.5376699999999, "r": 220.75178999999997, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 429.0000600000001, "t": 593.5376699999999, "r": 435.00305000000003, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "X", "bbox": {"l": 429.0000600000001, "t": 593.5376699999999, "r": 435.00305000000003, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 480.00037, "t": 593.5376699999999, "r": 486.00335999999993, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "X", "bbox": {"l": 480.00037, "t": 593.5376699999999, "r": 486.00335999999993, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 505.2606799999999, "t": 593.5376699999999, "r": 511.26367, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "X", "bbox": {"l": 505.2606799999999, "t": 593.5376699999999, "r": 511.26367, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 530.76038, "t": 593.5376699999999, "r": 536.76337, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "X", "bbox": {"l": 530.76038, "t": 593.5376699999999, "r": 536.76337, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 70.800079, "t": 612.55737, "r": 236.6548, "b": 620.88239, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "Visual Explain outside of Run SQL scripts", "bbox": {"l": 70.800079, "t": 612.55737, "r": 236.6548, "b": 620.88239, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 429.0000600000001, "t": 612.55737, "r": 435.00305000000003, "b": 620.88239, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "X", "bbox": {"l": 429.0000600000001, "t": 612.55737, "r": 435.00305000000003, "b": 620.88239, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 480.00037, "t": 612.55737, "r": 486.00335999999993, "b": 620.88239, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "X", "bbox": {"l": 480.00037, "t": 612.55737, "r": 486.00335999999993, "b": 620.88239, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 70.800079, "t": 631.51767, "r": 213.12968, "b": 639.84268, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "ANALYZE PLAN CACHE procedure", "bbox": {"l": 70.800079, "t": 631.51767, "r": 213.12968, "b": 639.84268, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 429.0000600000001, "t": 631.51767, "r": 435.00305000000003, "b": 639.84268, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "X", "bbox": {"l": 429.0000600000001, "t": 631.51767, "r": 435.00305000000003, "b": 639.84268, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 480.00037, "t": 631.51767, "r": 486.00335999999993, "b": 639.84268, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "X", "bbox": {"l": 480.00037, "t": 631.51767, "r": 486.00335999999993, "b": 639.84268, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 70.800079, "t": 650.53737, "r": 199.87808, "b": 658.86238, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "DUMP PLAN CACHE procedure", "bbox": {"l": 70.800079, "t": 650.53737, "r": 199.87808, "b": 658.86238, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 429.0000600000001, "t": 650.53737, "r": 435.00305000000003, "b": 658.86238, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "X", "bbox": {"l": 429.0000600000001, "t": 650.53737, "r": 435.00305000000003, "b": 658.86238, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 480.00037, "t": 650.53737, "r": 486.00335999999993, "b": 658.86238, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "X", "bbox": {"l": 480.00037, "t": 650.53737, "r": 486.00335999999993, "b": 658.86238, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 70.800079, "t": 669.55708, "r": 208.36777, "b": 677.88207, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "MODIFY PLAN CACHE procedure", "bbox": {"l": 70.800079, "t": 669.55708, "r": 208.36777, "b": 677.88207, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 429.0000600000001, "t": 669.55708, "r": 435.00305000000003, "b": 677.88207, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "X", "bbox": {"l": 429.0000600000001, "t": 669.55708, "r": 435.00305000000003, "b": 677.88207, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 480.00037, "t": 669.55708, "r": 486.00335999999993, "b": 677.88207, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "X", "bbox": {"l": 480.00037, "t": 669.55708, "r": 486.00335999999993, "b": 677.88207, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 70.800079, "t": 688.57677, "r": 411.20264, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "MODIFY PLAN CACHE PROPERTIES procedure (currently does not check authority)", "bbox": {"l": 70.800079, "t": 688.57677, "r": 411.20264, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 429.0000600000001, "t": 688.57677, "r": 435.00305000000003, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "X", "bbox": {"l": 429.0000600000001, "t": 688.57677, "r": 435.00305000000003, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 480.00037, "t": 688.57677, "r": 486.00335999999993, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "X", "bbox": {"l": 480.00037, "t": 688.57677, "r": 486.00335999999993, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 70.800079, "t": 707.537071, "r": 377.12585, "b": 715.862068, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "CHANGE PLAN CACHE SIZE procedure (currently does not check authority)", "bbox": {"l": 70.800079, "t": 707.537071, "r": 377.12585, "b": 715.862068, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 429.0000600000001, "t": 707.537071, "r": 435.00305000000003, "b": 715.862068, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "X", "bbox": {"l": 429.0000600000001, "t": 707.537071, "r": 435.00305000000003, "b": 715.862068, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 480.00037, "t": 707.537071, "r": 486.00335999999993, "b": 715.862068, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "X", "bbox": {"l": 480.00037, "t": 707.537071, "r": 486.00335999999993, "b": 715.862068, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "ecel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "ecel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "ecel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "ecel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "ecel", "fcel", "fcel", "ecel", "nl", "rhed", "fcel", "ecel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "ecel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "ecel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "ecel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "ecel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "ecel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "ecel", "fcel", "ecel", "ecel", "nl"], "num_rows": 13, "num_cols": 6, "table_cells": [{"bbox": {"l": 70.800301, "t": 400.51827999999995, "r": 119.78551, "b": 408.84329, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "User action", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 424.93805, "t": 447.52255, "r": 433.26297000000005, "b": 487.01999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "*JOBCTL", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 450.13806, "t": 401.6000700000001, "r": 458.46298, "b": 487.01999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "QIBM_DB_SECADM", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 475.93835000000007, "t": 401.53442, "r": 484.26327999999995, "b": 487.01999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "QIBM_DB_SQLADM", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 501.13837, "t": 401.6145, "r": 509.46329, "b": 487.01999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "QIBM_DB_SYSMON", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 526.39862, "t": 432.79944, "r": 534.72357, "b": 487.02005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "No Authority", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800003, "t": 498.55798, "r": 220.15681000000004, "b": 506.883, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "SET CURRENT DEGREE  (SQL statement)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0, "t": 498.55798, "r": 435.00299000000007, "b": 506.883, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00031, "t": 498.55798, "r": 486.0033, "b": 506.883, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800018, "t": 517.51828, "r": 264.5538, "b": 525.84329, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "CHGQRYA  command targeting a different user\u2019s job", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.00003, "t": 517.51828, "r": 435.00302000000005, "b": 525.84329, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00034, "t": 517.51828, "r": 486.00333, "b": 525.84329, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800049, "t": 536.5379800000001, "r": 322.50574, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "STRDBMON  or  ENDDBMON  commands targeting a different user\u2019s job", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.00003, "t": 536.5379800000001, "r": 435.00302000000005, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00034, "t": 536.5379800000001, "r": 486.00333, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800049, "t": 555.55768, "r": 381.02185, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "STRDBMON  or  ENDDBMON  commands targeting a job that matches the current user", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.00003, "t": 555.55768, "r": 435.00302000000005, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00034, "t": 555.55768, "r": 486.00333, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 505.26061999999996, "t": 555.55768, "r": 511.26361, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 530.76031, "t": 555.55768, "r": 536.76331, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800049, "t": 574.51797, "r": 359.51736, "b": 582.84299, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "QUSRJOBI() API format 900 or System i Navigator\u2019s SQL Details for Job", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 574.51797, "r": 435.00305000000003, "b": 582.84299, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 574.51797, "r": 486.00335999999993, "b": 582.84299, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 505.2606799999999, "t": 574.51797, "r": 511.26367, "b": 582.84299, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800079, "t": 593.5376699999999, "r": 220.75178999999997, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Visual Explain within Run SQL scripts", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 593.5376699999999, "r": 435.00305000000003, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 593.5376699999999, "r": 486.00335999999993, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 505.2606799999999, "t": 593.5376699999999, "r": 511.26367, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 530.76038, "t": 593.5376699999999, "r": 536.76337, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800079, "t": 612.55737, "r": 236.6548, "b": 620.88239, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Visual Explain outside of Run SQL scripts", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 612.55737, "r": 435.00305000000003, "b": 620.88239, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 612.55737, "r": 486.00335999999993, "b": 620.88239, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800079, "t": 631.51767, "r": 213.12968, "b": 639.84268, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "ANALYZE PLAN CACHE procedure", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 631.51767, "r": 435.00305000000003, "b": 639.84268, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 631.51767, "r": 486.00335999999993, "b": 639.84268, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800079, "t": 650.53737, "r": 199.87808, "b": 658.86238, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "DUMP PLAN CACHE procedure", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 650.53737, "r": 435.00305000000003, "b": 658.86238, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 650.53737, "r": 486.00335999999993, "b": 658.86238, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800079, "t": 669.55708, "r": 208.36777, "b": 677.88207, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "MODIFY PLAN CACHE procedure", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 669.55708, "r": 435.00305000000003, "b": 677.88207, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 669.55708, "r": 486.00335999999993, "b": 677.88207, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800079, "t": 688.57677, "r": 411.20264, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "MODIFY PLAN CACHE PROPERTIES procedure (currently does not check authority)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 688.57677, "r": 435.00305000000003, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 688.57677, "r": 486.00335999999993, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800079, "t": 707.537071, "r": 377.12585, "b": 715.862068, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "CHANGE PLAN CACHE SIZE procedure (currently does not check authority)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 707.537071, "r": 435.00305000000003, "b": 715.862068, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 707.537071, "r": 486.00335999999993, "b": 715.862068, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}]}], "body": [{"label": "text", "id": 2, "page_no": 8, "cluster": {"id": 2, "label": "text", "bbox": {"l": 136.79959, "t": 71.50903000000005, "r": 542.69434, "b": 140.72113000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9789126515388489, "cells": [{"id": 2, "text": "For example, assume that a business has assigned the duty to manage security on IBM i to ", "bbox": {"l": 136.79959, "t": 71.50903000000005, "r": 542.69434, "b": 80.72204999999985, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Theresa. Before release IBM i 7.2, to grant privileges, Theresa had to have the same ", "bbox": {"l": 136.79959, "t": 83.50885000000017, "r": 513.67804, "b": 92.72185999999999, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "privileges Theresa was granting to others. Therefore, to grant *USE privileges to the ", "bbox": {"l": 136.79959, "t": 95.50867000000005, "r": 509.71902, "b": 104.72167999999999, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "PAYROLL table, Theresa had to have *OBJMGT and *USE authority (or a higher level of ", "bbox": {"l": 136.79959, "t": 107.50847999999996, "r": 528.20184, "b": 116.72149999999999, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "authority, such as *ALLOBJ). This requirement allowed Theresa to access the data in the ", "bbox": {"l": 136.79959, "t": 119.50829999999996, "r": 531.84015, "b": 128.72131000000002, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "PAYROLL table even though Theresa\u2019s job description was only to manage its security.", "bbox": {"l": 136.79959, "t": 131.50811999999996, "r": 519.24982, "b": 140.72113000000002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "For example, assume that a business has assigned the duty to manage security on IBM i to Theresa. Before release IBM i 7.2, to grant privileges, Theresa had to have the same privileges Theresa was granting to others. Therefore, to grant *USE privileges to the PAYROLL table, Theresa had to have *OBJMGT and *USE authority (or a higher level of authority, such as *ALLOBJ). This requirement allowed Theresa to access the data in the PAYROLL table even though Theresa\u2019s job description was only to manage its security."}, {"label": "text", "id": 6, "page_no": 8, "cluster": {"id": 6, "label": "text", "bbox": {"l": 136.79959, "t": 153.52770999999996, "r": 547.30396, "b": 198.74017000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9665538668632507, "cells": [{"id": 8, "text": "In IBM i 7.2, the QIBM_DB_SECADM function usage grants authorities, revokes authorities, ", "bbox": {"l": 136.79959, "t": 153.52770999999996, "r": 544.16064, "b": 162.74072, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "changes ownership, or changes the primary group without giving access to the object or, in ", "bbox": {"l": 136.79959, "t": 165.52752999999996, "r": 540.66156, "b": 174.74054, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "the case of a database table, to the data that is in the table or allowing other operations on the ", "bbox": {"l": 136.79959, "t": 177.52733999999998, "r": 547.30396, "b": 186.74036, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "table. ", "bbox": {"l": 136.79959, "t": 189.52715999999998, "r": 163.6189, "b": 198.74017000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In IBM i 7.2, the QIBM_DB_SECADM function usage grants authorities, revokes authorities, changes ownership, or changes the primary group without giving access to the object or, in the case of a database table, to the data that is in the table or allowing other operations on the table."}, {"label": "text", "id": 4, "page_no": 8, "cluster": {"id": 4, "label": "text", "bbox": {"l": 136.79959, "t": 211.48694, "r": 538.65076, "b": 232.69976999999994, "coord_origin": "TOPLEFT"}, "confidence": 0.9691813588142395, "cells": [{"id": 12, "text": "QIBM_DB_SECADM function usage can be granted only by a user with *SECADM special ", "bbox": {"l": 136.79959, "t": 211.48694, "r": 538.65076, "b": 220.69994999999994, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "authority and can be given to a user or a group.", "bbox": {"l": 136.79959, "t": 223.48676, "r": 346.34808, "b": 232.69976999999994, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "QIBM_DB_SECADM function usage can be granted only by a user with *SECADM special authority and can be given to a user or a group."}, {"label": "text", "id": 3, "page_no": 8, "cluster": {"id": 3, "label": "text", "bbox": {"l": 136.79959, "t": 245.50635, "r": 545.79602, "b": 278.71898999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9729602336883545, "cells": [{"id": 14, "text": "QIBM_DB_SECADM also is responsible for administering RCAC, which restricts which rows ", "bbox": {"l": 136.79959, "t": 245.50635, "r": 545.79602, "b": 254.71936000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "a user is allowed to access in a table and whether a user is allowed to see information in ", "bbox": {"l": 136.79959, "t": 257.50616, "r": 529.46149, "b": 266.71918000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "certain columns of a table.", "bbox": {"l": 136.79959, "t": 269.50598, "r": 253.47696999999997, "b": 278.71898999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "QIBM_DB_SECADM also is responsible for administering RCAC, which restricts which rows a user is allowed to access in a table and whether a user is allowed to see information in certain columns of a table."}, {"label": "text", "id": 1, "page_no": 8, "cluster": {"id": 1, "label": "text", "bbox": {"l": 136.79959, "t": 291.52557, "r": 539.80713, "b": 336.73801, "coord_origin": "TOPLEFT"}, "confidence": 0.9815152883529663, "cells": [{"id": 17, "text": "A preferred practice is that the RCAC administrator has the QIBM_DB_SECADM function ", "bbox": {"l": 136.79959, "t": 291.52557, "r": 533.78137, "b": 300.73856, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "usage ID, but absolutely no other data privileges. The result is that the RCAC administrator ", "bbox": {"l": 136.79959, "t": 303.52539, "r": 539.80713, "b": 312.73837000000003, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "can deploy and maintain the RCAC constructs, but cannot grant themselves unauthorized ", "bbox": {"l": 136.79959, "t": 315.52521, "r": 534.5741, "b": 324.73819, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "access to data itself.", "bbox": {"l": 136.79959, "t": 327.52502, "r": 227.02324, "b": 336.73801, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "A preferred practice is that the RCAC administrator has the QIBM_DB_SECADM function usage ID, but absolutely no other data privileges. The result is that the RCAC administrator can deploy and maintain the RCAC constructs, but cannot grant themselves unauthorized access to data itself."}, {"label": "text", "id": 5, "page_no": 8, "cluster": {"id": 5, "label": "text", "bbox": {"l": 136.79959, "t": 349.48483, "r": 543.06714, "b": 370.69763000000006, "coord_origin": "TOPLEFT"}, "confidence": 0.9672255516052246, "cells": [{"id": 21, "text": "Table 2-2 shows a comparison of the different function usage IDs and *JOBCTL authority to ", "bbox": {"l": 136.79959, "t": 349.48483, "r": 543.06714, "b": 358.69780999999995, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "the different CL commands and DB2 for i tools.", "bbox": {"l": 136.79959, "t": 361.48465, "r": 343.79236, "b": 370.69763000000006, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 2-2 shows a comparison of the different function usage IDs and *JOBCTL authority to the different CL commands and DB2 for i tools."}, {"label": "caption", "id": 8, "page_no": 8, "cluster": {"id": 8, "label": "caption", "bbox": {"l": 64.800003, "t": 383.5379899999999, "r": 391.75464, "b": 391.86301, "coord_origin": "TOPLEFT"}, "confidence": 0.9337189793586731, "cells": [{"id": 23, "text": "Table 2-2 Comparison of the different function usage IDs and *JOBCTL authority", "bbox": {"l": 64.800003, "t": 383.5379899999999, "r": 391.75464, "b": 391.86301, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 2-2 Comparison of the different function usage IDs and *JOBCTL authority"}, {"label": "table", "id": 0, "page_no": 8, "cluster": {"id": 0, "label": "table", "bbox": {"l": 64.41139221191406, "t": 393.6136169433594, "r": 547.3950805664062, "b": 721.60791015625, "coord_origin": "TOPLEFT"}, "confidence": 0.9899571537971497, "cells": [{"id": 24, "text": "User action", "bbox": {"l": 70.800301, "t": 400.51827999999995, "r": 119.78551, "b": 408.84329, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "*JOBCTL", "bbox": {"l": 424.93805, "t": 447.52255, "r": 433.26297000000005, "b": 487.01999, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "QIBM_DB_SECADM", "bbox": {"l": 450.13806, "t": 401.6000700000001, "r": 458.46298, "b": 487.01999, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "QIBM_DB_SQLADM", "bbox": {"l": 475.93835000000007, "t": 401.53442, "r": 484.26327999999995, "b": 487.01999, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "QIBM_DB_SYSMON", "bbox": {"l": 501.13837, "t": 401.6145, "r": 509.46329, "b": 487.01999, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "No Authority", "bbox": {"l": 526.39862, "t": 432.79944, "r": 534.72357, "b": 487.02005, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "SET CURRENT DEGREE", "bbox": {"l": 70.800003, "t": 498.69299, "r": 151.6794, "b": 506.66699, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": " (SQL statement)", "bbox": {"l": 151.6803, "t": 498.55798, "r": 220.15681000000004, "b": 506.883, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "X", "bbox": {"l": 429.0, "t": 498.55798, "r": 435.00299000000007, "b": 506.883, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "X", "bbox": {"l": 480.00031, "t": 498.55798, "r": 486.0033, "b": 506.883, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "CHGQRYA", "bbox": {"l": 70.800018, "t": 517.65329, "r": 102.23972, "b": 525.62729, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": " command targeting a different user\u2019s job", "bbox": {"l": 102.23972, "t": 517.51828, "r": 264.5538, "b": 525.84329, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "X", "bbox": {"l": 429.00003, "t": 517.51828, "r": 435.00302000000005, "b": 525.84329, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "X", "bbox": {"l": 480.00034, "t": 517.51828, "r": 486.00333, "b": 525.84329, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "STRDBMON", "bbox": {"l": 70.800049, "t": 536.67299, "r": 106.73975, "b": 544.64699, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": " or ", "bbox": {"l": 106.73975, "t": 536.5379800000001, "r": 119.77895, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "ENDDBMON", "bbox": {"l": 119.69975000000001, "t": 536.67299, "r": 155.69974, "b": 544.64699, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": " commands targeting a different user\u2019s job", "bbox": {"l": 155.69974, "t": 536.5379800000001, "r": 322.50574, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "X", "bbox": {"l": 429.00003, "t": 536.5379800000001, "r": 435.00302000000005, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "X", "bbox": {"l": 480.00034, "t": 536.5379800000001, "r": 486.00333, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "STRDBMON", "bbox": {"l": 70.800049, "t": 555.69269, "r": 106.73975, "b": 563.66669, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": " or ", "bbox": {"l": 106.73975, "t": 555.55768, "r": 119.77895, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "ENDDBMON", "bbox": {"l": 119.69975000000001, "t": 555.69269, "r": 155.69974, "b": 563.66669, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": " commands targeting a job that matches the current user", "bbox": {"l": 155.69974, "t": 555.55768, "r": 381.02185, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "X", "bbox": {"l": 429.00003, "t": 555.55768, "r": 435.00302000000005, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "X", "bbox": {"l": 480.00034, "t": 555.55768, "r": 486.00333, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "X", "bbox": {"l": 505.26061999999996, "t": 555.55768, "r": 511.26361, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "X", "bbox": {"l": 530.76031, "t": 555.55768, "r": 536.76331, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "QUSRJOBI() API format 900 or System i Navigator\u2019s SQL Details for Job", "bbox": {"l": 70.800049, "t": 574.51797, "r": 359.51736, "b": 582.84299, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "X", "bbox": {"l": 429.0000600000001, "t": 574.51797, "r": 435.00305000000003, "b": 582.84299, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "X", "bbox": {"l": 480.00037, "t": 574.51797, "r": 486.00335999999993, "b": 582.84299, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "X", "bbox": {"l": 505.2606799999999, "t": 574.51797, "r": 511.26367, "b": 582.84299, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Visual Explain within Run SQL scripts", "bbox": {"l": 70.800079, "t": 593.5376699999999, "r": 220.75178999999997, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "X", "bbox": {"l": 429.0000600000001, "t": 593.5376699999999, "r": 435.00305000000003, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "X", "bbox": {"l": 480.00037, "t": 593.5376699999999, "r": 486.00335999999993, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "X", "bbox": {"l": 505.2606799999999, "t": 593.5376699999999, "r": 511.26367, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "X", "bbox": {"l": 530.76038, "t": 593.5376699999999, "r": 536.76337, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "Visual Explain outside of Run SQL scripts", "bbox": {"l": 70.800079, "t": 612.55737, "r": 236.6548, "b": 620.88239, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "X", "bbox": {"l": 429.0000600000001, "t": 612.55737, "r": 435.00305000000003, "b": 620.88239, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "X", "bbox": {"l": 480.00037, "t": 612.55737, "r": 486.00335999999993, "b": 620.88239, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "ANALYZE PLAN CACHE procedure", "bbox": {"l": 70.800079, "t": 631.51767, "r": 213.12968, "b": 639.84268, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "X", "bbox": {"l": 429.0000600000001, "t": 631.51767, "r": 435.00305000000003, "b": 639.84268, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "X", "bbox": {"l": 480.00037, "t": 631.51767, "r": 486.00335999999993, "b": 639.84268, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "DUMP PLAN CACHE procedure", "bbox": {"l": 70.800079, "t": 650.53737, "r": 199.87808, "b": 658.86238, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "X", "bbox": {"l": 429.0000600000001, "t": 650.53737, "r": 435.00305000000003, "b": 658.86238, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "X", "bbox": {"l": 480.00037, "t": 650.53737, "r": 486.00335999999993, "b": 658.86238, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "MODIFY PLAN CACHE procedure", "bbox": {"l": 70.800079, "t": 669.55708, "r": 208.36777, "b": 677.88207, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "X", "bbox": {"l": 429.0000600000001, "t": 669.55708, "r": 435.00305000000003, "b": 677.88207, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "X", "bbox": {"l": 480.00037, "t": 669.55708, "r": 486.00335999999993, "b": 677.88207, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "MODIFY PLAN CACHE PROPERTIES procedure (currently does not check authority)", "bbox": {"l": 70.800079, "t": 688.57677, "r": 411.20264, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "X", "bbox": {"l": 429.0000600000001, "t": 688.57677, "r": 435.00305000000003, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "X", "bbox": {"l": 480.00037, "t": 688.57677, "r": 486.00335999999993, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "CHANGE PLAN CACHE SIZE procedure (currently does not check authority)", "bbox": {"l": 70.800079, "t": 707.537071, "r": 377.12585, "b": 715.862068, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "X", "bbox": {"l": 429.0000600000001, "t": 707.537071, "r": 435.00305000000003, "b": 715.862068, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "X", "bbox": {"l": 480.00037, "t": 707.537071, "r": 486.00335999999993, "b": 715.862068, "coord_origin": "TOPLEFT"}}], "children": [{"id": 10, "label": "text", "bbox": {"l": 70.800301, "t": 400.51827999999995, "r": 119.78551, "b": 408.84329, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "User action", "bbox": {"l": 70.800301, "t": 400.51827999999995, "r": 119.78551, "b": 408.84329, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 424.93805, "t": 447.52255, "r": 433.26297000000005, "b": 487.01999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "*JOBCTL", "bbox": {"l": 424.93805, "t": 447.52255, "r": 433.26297000000005, "b": 487.01999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 450.13806, "t": 401.6000700000001, "r": 458.46298, "b": 487.01999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "QIBM_DB_SECADM", "bbox": {"l": 450.13806, "t": 401.6000700000001, "r": 458.46298, "b": 487.01999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 475.93835000000007, "t": 401.53442, "r": 484.26327999999995, "b": 487.01999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "QIBM_DB_SQLADM", "bbox": {"l": 475.93835000000007, "t": 401.53442, "r": 484.26327999999995, "b": 487.01999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 501.13837, "t": 401.6145, "r": 509.46329, "b": 487.01999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "QIBM_DB_SYSMON", "bbox": {"l": 501.13837, "t": 401.6145, "r": 509.46329, "b": 487.01999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 526.39862, "t": 432.79944, "r": 534.72357, "b": 487.02005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "No Authority", "bbox": {"l": 526.39862, "t": 432.79944, "r": 534.72357, "b": 487.02005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 70.800003, "t": 498.69299, "r": 151.6794, "b": 506.66699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "SET CURRENT DEGREE", "bbox": {"l": 70.800003, "t": 498.69299, "r": 151.6794, "b": 506.66699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 151.6803, "t": 498.55798, "r": 220.15681000000004, "b": 506.883, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": " (SQL statement)", "bbox": {"l": 151.6803, "t": 498.55798, "r": 220.15681000000004, "b": 506.883, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 429.0, "t": 498.55798, "r": 435.00299000000007, "b": 506.883, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "X", "bbox": {"l": 429.0, "t": 498.55798, "r": 435.00299000000007, "b": 506.883, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 480.00031, "t": 498.55798, "r": 486.0033, "b": 506.883, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "X", "bbox": {"l": 480.00031, "t": 498.55798, "r": 486.0033, "b": 506.883, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 70.800018, "t": 517.65329, "r": 102.23972, "b": 525.62729, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "CHGQRYA", "bbox": {"l": 70.800018, "t": 517.65329, "r": 102.23972, "b": 525.62729, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 102.23972, "t": 517.51828, "r": 264.5538, "b": 525.84329, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": " command targeting a different user\u2019s job", "bbox": {"l": 102.23972, "t": 517.51828, "r": 264.5538, "b": 525.84329, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 429.00003, "t": 517.51828, "r": 435.00302000000005, "b": 525.84329, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "X", "bbox": {"l": 429.00003, "t": 517.51828, "r": 435.00302000000005, "b": 525.84329, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 480.00034, "t": 517.51828, "r": 486.00333, "b": 525.84329, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "X", "bbox": {"l": 480.00034, "t": 517.51828, "r": 486.00333, "b": 525.84329, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 70.800049, "t": 536.67299, "r": 106.73975, "b": 544.64699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "STRDBMON", "bbox": {"l": 70.800049, "t": 536.67299, "r": 106.73975, "b": 544.64699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 106.73975, "t": 536.5379800000001, "r": 119.77895, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": " or ", "bbox": {"l": 106.73975, "t": 536.5379800000001, "r": 119.77895, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 119.69975000000001, "t": 536.67299, "r": 155.69974, "b": 544.64699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "ENDDBMON", "bbox": {"l": 119.69975000000001, "t": 536.67299, "r": 155.69974, "b": 544.64699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 155.69974, "t": 536.5379800000001, "r": 322.50574, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": " commands targeting a different user\u2019s job", "bbox": {"l": 155.69974, "t": 536.5379800000001, "r": 322.50574, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 429.00003, "t": 536.5379800000001, "r": 435.00302000000005, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "X", "bbox": {"l": 429.00003, "t": 536.5379800000001, "r": 435.00302000000005, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 480.00034, "t": 536.5379800000001, "r": 486.00333, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "X", "bbox": {"l": 480.00034, "t": 536.5379800000001, "r": 486.00333, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 70.800049, "t": 555.69269, "r": 106.73975, "b": 563.66669, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "STRDBMON", "bbox": {"l": 70.800049, "t": 555.69269, "r": 106.73975, "b": 563.66669, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 106.73975, "t": 555.55768, "r": 119.77895, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": " or ", "bbox": {"l": 106.73975, "t": 555.55768, "r": 119.77895, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 119.69975000000001, "t": 555.69269, "r": 155.69974, "b": 563.66669, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "ENDDBMON", "bbox": {"l": 119.69975000000001, "t": 555.69269, "r": 155.69974, "b": 563.66669, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 155.69974, "t": 555.55768, "r": 381.02185, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": " commands targeting a job that matches the current user", "bbox": {"l": 155.69974, "t": 555.55768, "r": 381.02185, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 429.00003, "t": 555.55768, "r": 435.00302000000005, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "X", "bbox": {"l": 429.00003, "t": 555.55768, "r": 435.00302000000005, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 480.00034, "t": 555.55768, "r": 486.00333, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "X", "bbox": {"l": 480.00034, "t": 555.55768, "r": 486.00333, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 505.26061999999996, "t": 555.55768, "r": 511.26361, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "X", "bbox": {"l": 505.26061999999996, "t": 555.55768, "r": 511.26361, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 530.76031, "t": 555.55768, "r": 536.76331, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "X", "bbox": {"l": 530.76031, "t": 555.55768, "r": 536.76331, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 70.800049, "t": 574.51797, "r": 359.51736, "b": 582.84299, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "QUSRJOBI() API format 900 or System i Navigator\u2019s SQL Details for Job", "bbox": {"l": 70.800049, "t": 574.51797, "r": 359.51736, "b": 582.84299, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 429.0000600000001, "t": 574.51797, "r": 435.00305000000003, "b": 582.84299, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "X", "bbox": {"l": 429.0000600000001, "t": 574.51797, "r": 435.00305000000003, "b": 582.84299, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 480.00037, "t": 574.51797, "r": 486.00335999999993, "b": 582.84299, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "X", "bbox": {"l": 480.00037, "t": 574.51797, "r": 486.00335999999993, "b": 582.84299, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 505.2606799999999, "t": 574.51797, "r": 511.26367, "b": 582.84299, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "X", "bbox": {"l": 505.2606799999999, "t": 574.51797, "r": 511.26367, "b": 582.84299, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 70.800079, "t": 593.5376699999999, "r": 220.75178999999997, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "Visual Explain within Run SQL scripts", "bbox": {"l": 70.800079, "t": 593.5376699999999, "r": 220.75178999999997, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 429.0000600000001, "t": 593.5376699999999, "r": 435.00305000000003, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "X", "bbox": {"l": 429.0000600000001, "t": 593.5376699999999, "r": 435.00305000000003, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 480.00037, "t": 593.5376699999999, "r": 486.00335999999993, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "X", "bbox": {"l": 480.00037, "t": 593.5376699999999, "r": 486.00335999999993, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 505.2606799999999, "t": 593.5376699999999, "r": 511.26367, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "X", "bbox": {"l": 505.2606799999999, "t": 593.5376699999999, "r": 511.26367, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 530.76038, "t": 593.5376699999999, "r": 536.76337, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "X", "bbox": {"l": 530.76038, "t": 593.5376699999999, "r": 536.76337, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 70.800079, "t": 612.55737, "r": 236.6548, "b": 620.88239, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "Visual Explain outside of Run SQL scripts", "bbox": {"l": 70.800079, "t": 612.55737, "r": 236.6548, "b": 620.88239, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 429.0000600000001, "t": 612.55737, "r": 435.00305000000003, "b": 620.88239, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "X", "bbox": {"l": 429.0000600000001, "t": 612.55737, "r": 435.00305000000003, "b": 620.88239, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 480.00037, "t": 612.55737, "r": 486.00335999999993, "b": 620.88239, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "X", "bbox": {"l": 480.00037, "t": 612.55737, "r": 486.00335999999993, "b": 620.88239, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 70.800079, "t": 631.51767, "r": 213.12968, "b": 639.84268, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "ANALYZE PLAN CACHE procedure", "bbox": {"l": 70.800079, "t": 631.51767, "r": 213.12968, "b": 639.84268, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 429.0000600000001, "t": 631.51767, "r": 435.00305000000003, "b": 639.84268, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "X", "bbox": {"l": 429.0000600000001, "t": 631.51767, "r": 435.00305000000003, "b": 639.84268, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 480.00037, "t": 631.51767, "r": 486.00335999999993, "b": 639.84268, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "X", "bbox": {"l": 480.00037, "t": 631.51767, "r": 486.00335999999993, "b": 639.84268, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 70.800079, "t": 650.53737, "r": 199.87808, "b": 658.86238, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "DUMP PLAN CACHE procedure", "bbox": {"l": 70.800079, "t": 650.53737, "r": 199.87808, "b": 658.86238, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 429.0000600000001, "t": 650.53737, "r": 435.00305000000003, "b": 658.86238, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "X", "bbox": {"l": 429.0000600000001, "t": 650.53737, "r": 435.00305000000003, "b": 658.86238, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 480.00037, "t": 650.53737, "r": 486.00335999999993, "b": 658.86238, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "X", "bbox": {"l": 480.00037, "t": 650.53737, "r": 486.00335999999993, "b": 658.86238, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 70.800079, "t": 669.55708, "r": 208.36777, "b": 677.88207, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "MODIFY PLAN CACHE procedure", "bbox": {"l": 70.800079, "t": 669.55708, "r": 208.36777, "b": 677.88207, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 429.0000600000001, "t": 669.55708, "r": 435.00305000000003, "b": 677.88207, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "X", "bbox": {"l": 429.0000600000001, "t": 669.55708, "r": 435.00305000000003, "b": 677.88207, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 480.00037, "t": 669.55708, "r": 486.00335999999993, "b": 677.88207, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "X", "bbox": {"l": 480.00037, "t": 669.55708, "r": 486.00335999999993, "b": 677.88207, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 70.800079, "t": 688.57677, "r": 411.20264, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "MODIFY PLAN CACHE PROPERTIES procedure (currently does not check authority)", "bbox": {"l": 70.800079, "t": 688.57677, "r": 411.20264, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 429.0000600000001, "t": 688.57677, "r": 435.00305000000003, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "X", "bbox": {"l": 429.0000600000001, "t": 688.57677, "r": 435.00305000000003, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 480.00037, "t": 688.57677, "r": 486.00335999999993, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "X", "bbox": {"l": 480.00037, "t": 688.57677, "r": 486.00335999999993, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 70.800079, "t": 707.537071, "r": 377.12585, "b": 715.862068, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "CHANGE PLAN CACHE SIZE procedure (currently does not check authority)", "bbox": {"l": 70.800079, "t": 707.537071, "r": 377.12585, "b": 715.862068, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 429.0000600000001, "t": 707.537071, "r": 435.00305000000003, "b": 715.862068, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "X", "bbox": {"l": 429.0000600000001, "t": 707.537071, "r": 435.00305000000003, "b": 715.862068, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 480.00037, "t": 707.537071, "r": 486.00335999999993, "b": 715.862068, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "X", "bbox": {"l": 480.00037, "t": 707.537071, "r": 486.00335999999993, "b": 715.862068, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "ecel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "ecel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "ecel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "ecel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "ecel", "fcel", "fcel", "ecel", "nl", "rhed", "fcel", "ecel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "ecel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "ecel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "ecel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "ecel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "ecel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "ecel", "fcel", "ecel", "ecel", "nl"], "num_rows": 13, "num_cols": 6, "table_cells": [{"bbox": {"l": 70.800301, "t": 400.51827999999995, "r": 119.78551, "b": 408.84329, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "User action", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 424.93805, "t": 447.52255, "r": 433.26297000000005, "b": 487.01999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "*JOBCTL", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 450.13806, "t": 401.6000700000001, "r": 458.46298, "b": 487.01999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "QIBM_DB_SECADM", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 475.93835000000007, "t": 401.53442, "r": 484.26327999999995, "b": 487.01999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "QIBM_DB_SQLADM", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 501.13837, "t": 401.6145, "r": 509.46329, "b": 487.01999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "QIBM_DB_SYSMON", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 526.39862, "t": 432.79944, "r": 534.72357, "b": 487.02005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "No Authority", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800003, "t": 498.55798, "r": 220.15681000000004, "b": 506.883, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "SET CURRENT DEGREE  (SQL statement)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0, "t": 498.55798, "r": 435.00299000000007, "b": 506.883, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00031, "t": 498.55798, "r": 486.0033, "b": 506.883, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800018, "t": 517.51828, "r": 264.5538, "b": 525.84329, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "CHGQRYA  command targeting a different user\u2019s job", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.00003, "t": 517.51828, "r": 435.00302000000005, "b": 525.84329, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00034, "t": 517.51828, "r": 486.00333, "b": 525.84329, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800049, "t": 536.5379800000001, "r": 322.50574, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "STRDBMON  or  ENDDBMON  commands targeting a different user\u2019s job", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.00003, "t": 536.5379800000001, "r": 435.00302000000005, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00034, "t": 536.5379800000001, "r": 486.00333, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800049, "t": 555.55768, "r": 381.02185, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "STRDBMON  or  ENDDBMON  commands targeting a job that matches the current user", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.00003, "t": 555.55768, "r": 435.00302000000005, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00034, "t": 555.55768, "r": 486.00333, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 505.26061999999996, "t": 555.55768, "r": 511.26361, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 530.76031, "t": 555.55768, "r": 536.76331, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800049, "t": 574.51797, "r": 359.51736, "b": 582.84299, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "QUSRJOBI() API format 900 or System i Navigator\u2019s SQL Details for Job", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 574.51797, "r": 435.00305000000003, "b": 582.84299, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 574.51797, "r": 486.00335999999993, "b": 582.84299, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 505.2606799999999, "t": 574.51797, "r": 511.26367, "b": 582.84299, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800079, "t": 593.5376699999999, "r": 220.75178999999997, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Visual Explain within Run SQL scripts", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 593.5376699999999, "r": 435.00305000000003, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 593.5376699999999, "r": 486.00335999999993, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 505.2606799999999, "t": 593.5376699999999, "r": 511.26367, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 530.76038, "t": 593.5376699999999, "r": 536.76337, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800079, "t": 612.55737, "r": 236.6548, "b": 620.88239, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Visual Explain outside of Run SQL scripts", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 612.55737, "r": 435.00305000000003, "b": 620.88239, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 612.55737, "r": 486.00335999999993, "b": 620.88239, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800079, "t": 631.51767, "r": 213.12968, "b": 639.84268, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "ANALYZE PLAN CACHE procedure", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 631.51767, "r": 435.00305000000003, "b": 639.84268, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 631.51767, "r": 486.00335999999993, "b": 639.84268, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800079, "t": 650.53737, "r": 199.87808, "b": 658.86238, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "DUMP PLAN CACHE procedure", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 650.53737, "r": 435.00305000000003, "b": 658.86238, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 650.53737, "r": 486.00335999999993, "b": 658.86238, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800079, "t": 669.55708, "r": 208.36777, "b": 677.88207, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "MODIFY PLAN CACHE procedure", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 669.55708, "r": 435.00305000000003, "b": 677.88207, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 669.55708, "r": 486.00335999999993, "b": 677.88207, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800079, "t": 688.57677, "r": 411.20264, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "MODIFY PLAN CACHE PROPERTIES procedure (currently does not check authority)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 688.57677, "r": 435.00305000000003, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 688.57677, "r": 486.00335999999993, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800079, "t": 707.537071, "r": 377.12585, "b": 715.862068, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "CHANGE PLAN CACHE SIZE procedure (currently does not check authority)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 707.537071, "r": 435.00305000000003, "b": 715.862068, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 707.537071, "r": 486.00335999999993, "b": 715.862068, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}]}], "headers": [{"label": "page_footer", "id": 7, "page_no": 8, "cluster": {"id": 7, "label": "page_footer", "bbox": {"l": 355.32001, "t": 755.538002, "r": 523.54071, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9508126378059387, "cells": [{"id": 0, "text": "Chapter 2. Roles and separation of duties ", "bbox": {"l": 355.32001, "t": 755.538002, "r": 523.54071, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Chapter 2. Roles and separation of duties"}, {"label": "page_footer", "id": 9, "page_no": 8, "cluster": {"id": 9, "label": "page_footer", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.8987301588058472, "cells": [{"id": 1, "text": "11", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "11"}]}}, {"page_no": 9, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "Chapter 3. Row and Column Access Control ", "bbox": {"l": 344.94, "t": 755.538002, "r": 523.60162, "b": 763.863001, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "15", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "The SQL ", "bbox": {"l": 136.79959, "t": 71.50903000000005, "r": 179.58179, "b": 80.72204999999985, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "CREATE PERMISSION", "bbox": {"l": 179.57977, "t": 71.65845000000002, "r": 264.47879, "b": 80.48302999999999, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": " statement that is shown in Figure 3-1 is used to define and ", "bbox": {"l": 264.53955, "t": 71.50903000000005, "r": 528.73059, "b": 80.72204999999985, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "initially enable or disable the row access rules.", "bbox": {"l": 136.79956, "t": 83.50885000000017, "r": 341.71762, "b": 92.72185999999999, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Figure 3-1 CREATE PERMISSION SQL statement", "bbox": {"l": 136.8, "t": 414.138, "r": 341.97659, "b": 422.46301, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Column mask", "bbox": {"l": 136.8, "t": 439.94399999999996, "r": 215.37601, "b": 451.04401, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "A column mask is a database object that manifests a column value access control rule for a ", "bbox": {"l": 136.8, "t": 455.08871000000005, "r": 542.76648, "b": 464.3017, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "specific column in a specific table. It uses a CASE expression that describes what you see ", "bbox": {"l": 136.8, "t": 467.08853, "r": 537.84125, "b": 476.30151, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "when you access the column. For example, a teller can see only the last four digits of a tax ", "bbox": {"l": 136.8, "t": 479.08835, "r": 538.80927, "b": 488.30133, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "identification number.", "bbox": {"l": 136.8, "t": 491.08817, "r": 231.20888, "b": 500.30115, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "CREATE PERMISSION", "bbox": {"l": 148.1337, "t": 139.67969000000005, "r": 246.7961, "b": 149.50982999999997, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "<", "bbox": {"l": 251.86685, "t": 139.67969000000005, "r": 257.58578, "b": 149.49834999999996, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "permission name", "bbox": {"l": 257.59152, "t": 139.67969000000005, "r": 336.99741, "b": 149.50982999999997, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": ">", "bbox": {"l": 337.01233, "t": 139.67969000000005, "r": 342.73126, "b": 149.49834999999996, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Names the row permission for row access control", "bbox": {"l": 346.56491, "t": 121.46252000000004, "r": 530.74371, "b": 129.33507999999995, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "ON", "bbox": {"l": 148.1337, "t": 181.06255999999996, "r": 163.45079, "b": 190.8927, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "<", "bbox": {"l": 168.58405, "t": 181.06255999999996, "r": 174.30298, "b": 190.88122999999996, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "table name", "bbox": {"l": 174.30872, "t": 181.06255999999996, "r": 226.86777, "b": 190.8927, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": ">", "bbox": {"l": 226.86548000000002, "t": 181.06255999999996, "r": 232.58441, "b": 190.88122999999996, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Identifies the table on which the row ", "bbox": {"l": 311.3204, "t": 166.29413, "r": 450.77191000000005, "b": 174.16669000000002, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "permission is created", "bbox": {"l": 450.86123999999995, "t": 166.29413, "r": 529.93134, "b": 174.16669000000002, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "AS ", "bbox": {"l": 148.1337, "t": 222.44550000000004, "r": 163.10973, "b": 232.27562999999998, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "<", "bbox": {"l": 165.68669, "t": 222.44550000000004, "r": 171.40562, "b": 232.26415999999995, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "correlation name", "bbox": {"l": 171.41136, "t": 222.44550000000004, "r": 251.20424000000003, "b": 232.27562999999998, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": ">", "bbox": {"l": 251.21115, "t": 222.44550000000004, "r": 256.93008, "b": 232.26415999999995, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Specifies an optional correlation name that ca", "bbox": {"l": 235.79649, "t": 204.22839, "r": 406.62051, "b": 212.10095, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "be used within search-condition", "bbox": {"l": 480.53094, "t": 204.22839, "r": 532.89496, "b": 212.10095, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "FOR ROWS", "bbox": {"l": 148.1337, "t": 263.82836999999995, "r": 199.72467, "b": 273.65851, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Indicates that a row permission is cr", "bbox": {"l": 321.56271, "t": 246.09411999999998, "r": 455.3432, "b": 253.96667000000002, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "eated", "bbox": {"l": 455.20786000000004, "t": 246.09411999999998, "r": 476.48404, "b": 253.96667000000002, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Specifies a condition that can be ", "bbox": {"l": 321.5972, "t": 266.30267000000003, "r": 444.0292400000001, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "true,", "bbox": {"l": 444.07986, "t": 266.30267000000003, "r": 459.08678999999995, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "false, or unknown", "bbox": {"l": 464.2088, "t": 266.30267000000003, "r": 530.94897, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "WHERE", "bbox": {"l": 148.1337, "t": 291.41708, "r": 183.42342, "b": 301.24722, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "<", "bbox": {"l": 188.61984, "t": 291.41708, "r": 194.33878, "b": 301.23572, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "logic to test: user and/or group and/or column value", "bbox": {"l": 194.34451, "t": 291.41708, "r": 437.04659999999996, "b": 301.24722, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": ">", "bbox": {"l": 437.09020999999996, "t": 291.41708, "r": 442.80914000000007, "b": 301.23572, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "ENFORCED FOR ALL ACCESS", "bbox": {"l": 148.1337, "t": 332.79999, "r": 278.77805, "b": 342.63013, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "Specifies that the row permission applies to all ref", "bbox": {"l": 271.55829, "t": 314.58276, "r": 457.4451, "b": 322.45535, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "erences of the table", "bbox": {"l": 457.19281, "t": 314.58276, "r": 531.74939, "b": 322.45535, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "ENABLE", "bbox": {"l": 148.1337, "t": 374.18289, "r": 185.17584, "b": 384.01302999999996, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Specifies that the row permission is to", "bbox": {"l": 312.28601, "t": 355.96576000000005, "r": 454.33505, "b": 363.83835, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": " be initially enabled", "bbox": {"l": 454.3461, "t": 355.96576000000005, "r": 527.05286, "b": 363.83835, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "S", "bbox": {"l": 311.73431, "t": 376.65717, "r": 315.94684, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "ifith t th", "bbox": {"l": 329.28326, "t": 376.65717, "r": 371.71786, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "i", "bbox": {"l": 415.0014, "t": 376.65717, "r": 417.09616, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "i", "bbox": {"l": 424.27356, "t": 376.65717, "r": 426.36832, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "i", "bbox": {"l": 438.13208, "t": 376.65717, "r": 440.2268399999999, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "t", "bbox": {"l": 445.88681, "t": 376.65717, "r": 448.95757999999995, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "b", "bbox": {"l": 455.8532400000001, "t": 376.65717, "r": 460.67346000000003, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "i", "bbox": {"l": 467.36746, "t": 376.65717, "r": 470.06998000000004, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "iti ll", "bbox": {"l": 472.73705999999993, "t": 376.65717, "r": 490.1676, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "di", "bbox": {"l": 496.33661, "t": 376.65717, "r": 503.2608, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "bl d", "bbox": {"l": 511.26138, "t": 376.65717, "r": 527.59674, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "DISABLE", "bbox": {"l": 148.1337, "t": 387.9772, "r": 187.6265, "b": 397.80734000000007, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": ";", "bbox": {"l": 187.58514, "t": 387.9772, "r": 190.6628, "b": 397.79583999999994, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Specifies that the row permission is to ", "bbox": {"l": 311.73431, "t": 376.65717, "r": 455.83047000000005, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "be initially disabled", "bbox": {"l": 455.8848, "t": 376.65717, "r": 527.62122, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 2, "label": "page_footer", "bbox": {"l": 344.94, "t": 755.538002, "r": 523.60162, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9526246786117554, "cells": [{"id": 0, "text": "Chapter 3. Row and Column Access Control ", "bbox": {"l": 344.94, "t": 755.538002, "r": 523.60162, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "page_footer", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.9071078896522522, "cells": [{"id": 1, "text": "15", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "caption", "bbox": {"l": 136.79956, "t": 71.50903000000005, "r": 528.73059, "b": 92.72185999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.872844398021698, "cells": [{"id": 2, "text": "The SQL ", "bbox": {"l": 136.79959, "t": 71.50903000000005, "r": 179.58179, "b": 80.72204999999985, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "CREATE PERMISSION", "bbox": {"l": 179.57977, "t": 71.65845000000002, "r": 264.47879, "b": 80.48302999999999, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": " statement that is shown in Figure 3-1 is used to define and ", "bbox": {"l": 264.53955, "t": 71.50903000000005, "r": 528.73059, "b": 80.72204999999985, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "initially enable or disable the row access rules.", "bbox": {"l": 136.79956, "t": 83.50885000000017, "r": 341.71762, "b": 92.72185999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "caption", "bbox": {"l": 136.8, "t": 414.138, "r": 341.97659, "b": 422.46301, "coord_origin": "TOPLEFT"}, "confidence": 0.938783586025238, "cells": [{"id": 6, "text": "Figure 3-1 CREATE PERMISSION SQL statement", "bbox": {"l": 136.8, "t": 414.138, "r": 341.97659, "b": 422.46301, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "section_header", "bbox": {"l": 136.8, "t": 439.94399999999996, "r": 215.37601, "b": 451.04401, "coord_origin": "TOPLEFT"}, "confidence": 0.9477567076683044, "cells": [{"id": 7, "text": "Column mask", "bbox": {"l": 136.8, "t": 439.94399999999996, "r": 215.37601, "b": 451.04401, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 136.8, "t": 455.08871000000005, "r": 542.76648, "b": 500.30115, "coord_origin": "TOPLEFT"}, "confidence": 0.9843975901603699, "cells": [{"id": 8, "text": "A column mask is a database object that manifests a column value access control rule for a ", "bbox": {"l": 136.8, "t": 455.08871000000005, "r": 542.76648, "b": 464.3017, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "specific column in a specific table. It uses a CASE expression that describes what you see ", "bbox": {"l": 136.8, "t": 467.08853, "r": 537.84125, "b": 476.30151, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "when you access the column. For example, a teller can see only the last four digits of a tax ", "bbox": {"l": 136.8, "t": 479.08835, "r": 538.80927, "b": 488.30133, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "identification number.", "bbox": {"l": 136.8, "t": 491.08817, "r": 231.20888, "b": 500.30115, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "picture", "bbox": {"l": 135.97177124023438, "t": 107.41075134277344, "r": 545.4180908203125, "b": 410.60931396484375, "coord_origin": "TOPLEFT"}, "confidence": 0.9788318872451782, "cells": [{"id": 12, "text": "CREATE PERMISSION", "bbox": {"l": 148.1337, "t": 139.67969000000005, "r": 246.7961, "b": 149.50982999999997, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "<", "bbox": {"l": 251.86685, "t": 139.67969000000005, "r": 257.58578, "b": 149.49834999999996, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "permission name", "bbox": {"l": 257.59152, "t": 139.67969000000005, "r": 336.99741, "b": 149.50982999999997, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": ">", "bbox": {"l": 337.01233, "t": 139.67969000000005, "r": 342.73126, "b": 149.49834999999996, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Names the row permission for row access control", "bbox": {"l": 346.56491, "t": 121.46252000000004, "r": 530.74371, "b": 129.33507999999995, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "ON", "bbox": {"l": 148.1337, "t": 181.06255999999996, "r": 163.45079, "b": 190.8927, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "<", "bbox": {"l": 168.58405, "t": 181.06255999999996, "r": 174.30298, "b": 190.88122999999996, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "table name", "bbox": {"l": 174.30872, "t": 181.06255999999996, "r": 226.86777, "b": 190.8927, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": ">", "bbox": {"l": 226.86548000000002, "t": 181.06255999999996, "r": 232.58441, "b": 190.88122999999996, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Identifies the table on which the row ", "bbox": {"l": 311.3204, "t": 166.29413, "r": 450.77191000000005, "b": 174.16669000000002, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "permission is created", "bbox": {"l": 450.86123999999995, "t": 166.29413, "r": 529.93134, "b": 174.16669000000002, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "AS ", "bbox": {"l": 148.1337, "t": 222.44550000000004, "r": 163.10973, "b": 232.27562999999998, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "<", "bbox": {"l": 165.68669, "t": 222.44550000000004, "r": 171.40562, "b": 232.26415999999995, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "correlation name", "bbox": {"l": 171.41136, "t": 222.44550000000004, "r": 251.20424000000003, "b": 232.27562999999998, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": ">", "bbox": {"l": 251.21115, "t": 222.44550000000004, "r": 256.93008, "b": 232.26415999999995, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Specifies an optional correlation name that ca", "bbox": {"l": 235.79649, "t": 204.22839, "r": 406.62051, "b": 212.10095, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "be used within search-condition", "bbox": {"l": 480.53094, "t": 204.22839, "r": 532.89496, "b": 212.10095, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "FOR ROWS", "bbox": {"l": 148.1337, "t": 263.82836999999995, "r": 199.72467, "b": 273.65851, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Indicates that a row permission is cr", "bbox": {"l": 321.56271, "t": 246.09411999999998, "r": 455.3432, "b": 253.96667000000002, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "eated", "bbox": {"l": 455.20786000000004, "t": 246.09411999999998, "r": 476.48404, "b": 253.96667000000002, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Specifies a condition that can be ", "bbox": {"l": 321.5972, "t": 266.30267000000003, "r": 444.0292400000001, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "true,", "bbox": {"l": 444.07986, "t": 266.30267000000003, "r": 459.08678999999995, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "false, or unknown", "bbox": {"l": 464.2088, "t": 266.30267000000003, "r": 530.94897, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "WHERE", "bbox": {"l": 148.1337, "t": 291.41708, "r": 183.42342, "b": 301.24722, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "<", "bbox": {"l": 188.61984, "t": 291.41708, "r": 194.33878, "b": 301.23572, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "logic to test: user and/or group and/or column value", "bbox": {"l": 194.34451, "t": 291.41708, "r": 437.04659999999996, "b": 301.24722, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": ">", "bbox": {"l": 437.09020999999996, "t": 291.41708, "r": 442.80914000000007, "b": 301.23572, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "ENFORCED FOR ALL ACCESS", "bbox": {"l": 148.1337, "t": 332.79999, "r": 278.77805, "b": 342.63013, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "Specifies that the row permission applies to all ref", "bbox": {"l": 271.55829, "t": 314.58276, "r": 457.4451, "b": 322.45535, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "erences of the table", "bbox": {"l": 457.19281, "t": 314.58276, "r": 531.74939, "b": 322.45535, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "ENABLE", "bbox": {"l": 148.1337, "t": 374.18289, "r": 185.17584, "b": 384.01302999999996, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Specifies that the row permission is to", "bbox": {"l": 312.28601, "t": 355.96576000000005, "r": 454.33505, "b": 363.83835, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": " be initially enabled", "bbox": {"l": 454.3461, "t": 355.96576000000005, "r": 527.05286, "b": 363.83835, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "S", "bbox": {"l": 311.73431, "t": 376.65717, "r": 315.94684, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "ifith t th", "bbox": {"l": 329.28326, "t": 376.65717, "r": 371.71786, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "i", "bbox": {"l": 415.0014, "t": 376.65717, "r": 417.09616, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "i", "bbox": {"l": 424.27356, "t": 376.65717, "r": 426.36832, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "i", "bbox": {"l": 438.13208, "t": 376.65717, "r": 440.2268399999999, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "t", "bbox": {"l": 445.88681, "t": 376.65717, "r": 448.95757999999995, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "b", "bbox": {"l": 455.8532400000001, "t": 376.65717, "r": 460.67346000000003, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "i", "bbox": {"l": 467.36746, "t": 376.65717, "r": 470.06998000000004, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "iti ll", "bbox": {"l": 472.73705999999993, "t": 376.65717, "r": 490.1676, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "di", "bbox": {"l": 496.33661, "t": 376.65717, "r": 503.2608, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "bl d", "bbox": {"l": 511.26138, "t": 376.65717, "r": 527.59674, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "DISABLE", "bbox": {"l": 148.1337, "t": 387.9772, "r": 187.6265, "b": 397.80734000000007, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": ";", "bbox": {"l": 187.58514, "t": 387.9772, "r": 190.6628, "b": 397.79583999999994, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Specifies that the row permission is to ", "bbox": {"l": 311.73431, "t": 376.65717, "r": 455.83047000000005, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "be initially disabled", "bbox": {"l": 455.8848, "t": 376.65717, "r": 527.62122, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": [{"id": 7, "label": "text", "bbox": {"l": 148.1337, "t": 139.67969000000005, "r": 246.7961, "b": 149.50982999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "CREATE PERMISSION", "bbox": {"l": 148.1337, "t": 139.67969000000005, "r": 246.7961, "b": 149.50982999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "text", "bbox": {"l": 251.86685, "t": 139.67969000000005, "r": 257.58578, "b": 149.49834999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "<", "bbox": {"l": 251.86685, "t": 139.67969000000005, "r": 257.58578, "b": 149.49834999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 257.59152, "t": 139.67969000000005, "r": 336.99741, "b": 149.50982999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "permission name", "bbox": {"l": 257.59152, "t": 139.67969000000005, "r": 336.99741, "b": 149.50982999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "text", "bbox": {"l": 337.01233, "t": 139.67969000000005, "r": 342.73126, "b": 149.49834999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": ">", "bbox": {"l": 337.01233, "t": 139.67969000000005, "r": 342.73126, "b": 149.49834999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 346.56491, "t": 121.46252000000004, "r": 530.74371, "b": 129.33507999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "Names the row permission for row access control", "bbox": {"l": 346.56491, "t": 121.46252000000004, "r": 530.74371, "b": 129.33507999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 148.1337, "t": 181.06255999999996, "r": 163.45079, "b": 190.8927, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "ON", "bbox": {"l": 148.1337, "t": 181.06255999999996, "r": 163.45079, "b": 190.8927, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 168.58405, "t": 181.06255999999996, "r": 174.30298, "b": 190.88122999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "<", "bbox": {"l": 168.58405, "t": 181.06255999999996, "r": 174.30298, "b": 190.88122999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 174.30872, "t": 181.06255999999996, "r": 226.86777, "b": 190.8927, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "table name", "bbox": {"l": 174.30872, "t": 181.06255999999996, "r": 226.86777, "b": 190.8927, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 226.86548000000002, "t": 181.06255999999996, "r": 232.58441, "b": 190.88122999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": ">", "bbox": {"l": 226.86548000000002, "t": 181.06255999999996, "r": 232.58441, "b": 190.88122999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 311.3204, "t": 166.29413, "r": 450.77191000000005, "b": 174.16669000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "Identifies the table on which the row ", "bbox": {"l": 311.3204, "t": 166.29413, "r": 450.77191000000005, "b": 174.16669000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 450.86123999999995, "t": 166.29413, "r": 529.93134, "b": 174.16669000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "permission is created", "bbox": {"l": 450.86123999999995, "t": 166.29413, "r": 529.93134, "b": 174.16669000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 148.1337, "t": 222.44550000000004, "r": 163.10973, "b": 232.27562999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "AS ", "bbox": {"l": 148.1337, "t": 222.44550000000004, "r": 163.10973, "b": 232.27562999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 165.68669, "t": 222.44550000000004, "r": 171.40562, "b": 232.26415999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "<", "bbox": {"l": 165.68669, "t": 222.44550000000004, "r": 171.40562, "b": 232.26415999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 171.41136, "t": 222.44550000000004, "r": 251.20424000000003, "b": 232.27562999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "correlation name", "bbox": {"l": 171.41136, "t": 222.44550000000004, "r": 251.20424000000003, "b": 232.27562999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 251.21115, "t": 222.44550000000004, "r": 256.93008, "b": 232.26415999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": ">", "bbox": {"l": 251.21115, "t": 222.44550000000004, "r": 256.93008, "b": 232.26415999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 235.79649, "t": 204.22839, "r": 406.62051, "b": 212.10095, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "Specifies an optional correlation name that ca", "bbox": {"l": 235.79649, "t": 204.22839, "r": 406.62051, "b": 212.10095, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 480.53094, "t": 204.22839, "r": 532.89496, "b": 212.10095, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "be used within search-condition", "bbox": {"l": 480.53094, "t": 204.22839, "r": 532.89496, "b": 212.10095, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 148.1337, "t": 263.82836999999995, "r": 199.72467, "b": 273.65851, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "FOR ROWS", "bbox": {"l": 148.1337, "t": 263.82836999999995, "r": 199.72467, "b": 273.65851, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 321.56271, "t": 246.09411999999998, "r": 455.3432, "b": 253.96667000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "Indicates that a row permission is cr", "bbox": {"l": 321.56271, "t": 246.09411999999998, "r": 455.3432, "b": 253.96667000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 455.20786000000004, "t": 246.09411999999998, "r": 476.48404, "b": 253.96667000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "eated", "bbox": {"l": 455.20786000000004, "t": 246.09411999999998, "r": 476.48404, "b": 253.96667000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 321.5972, "t": 266.30267000000003, "r": 444.0292400000001, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "Specifies a condition that can be ", "bbox": {"l": 321.5972, "t": 266.30267000000003, "r": 444.0292400000001, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 444.07986, "t": 266.30267000000003, "r": 459.08678999999995, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "true,", "bbox": {"l": 444.07986, "t": 266.30267000000003, "r": 459.08678999999995, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 464.2088, "t": 266.30267000000003, "r": 530.94897, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "false, or unknown", "bbox": {"l": 464.2088, "t": 266.30267000000003, "r": 530.94897, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 148.1337, "t": 291.41708, "r": 183.42342, "b": 301.24722, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "WHERE", "bbox": {"l": 148.1337, "t": 291.41708, "r": 183.42342, "b": 301.24722, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 188.61984, "t": 291.41708, "r": 194.33878, "b": 301.23572, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "<", "bbox": {"l": 188.61984, "t": 291.41708, "r": 194.33878, "b": 301.23572, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 194.34451, "t": 291.41708, "r": 437.04659999999996, "b": 301.24722, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "logic to test: user and/or group and/or column value", "bbox": {"l": 194.34451, "t": 291.41708, "r": 437.04659999999996, "b": 301.24722, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 437.09020999999996, "t": 291.41708, "r": 442.80914000000007, "b": 301.23572, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": ">", "bbox": {"l": 437.09020999999996, "t": 291.41708, "r": 442.80914000000007, "b": 301.23572, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 148.1337, "t": 332.79999, "r": 278.77805, "b": 342.63013, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "ENFORCED FOR ALL ACCESS", "bbox": {"l": 148.1337, "t": 332.79999, "r": 278.77805, "b": 342.63013, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 271.55829, "t": 314.58276, "r": 457.4451, "b": 322.45535, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "Specifies that the row permission applies to all ref", "bbox": {"l": 271.55829, "t": 314.58276, "r": 457.4451, "b": 322.45535, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 457.19281, "t": 314.58276, "r": 531.74939, "b": 322.45535, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "erences of the table", "bbox": {"l": 457.19281, "t": 314.58276, "r": 531.74939, "b": 322.45535, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 148.1337, "t": 374.18289, "r": 185.17584, "b": 384.01302999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "ENABLE", "bbox": {"l": 148.1337, "t": 374.18289, "r": 185.17584, "b": 384.01302999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 312.28601, "t": 355.96576000000005, "r": 454.33505, "b": 363.83835, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "Specifies that the row permission is to", "bbox": {"l": 312.28601, "t": 355.96576000000005, "r": 454.33505, "b": 363.83835, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 454.3461, "t": 355.96576000000005, "r": 527.05286, "b": 363.83835, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": " be initially enabled", "bbox": {"l": 454.3461, "t": 355.96576000000005, "r": 527.05286, "b": 363.83835, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 311.73431, "t": 376.65717, "r": 315.94684, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "S", "bbox": {"l": 311.73431, "t": 376.65717, "r": 315.94684, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 329.28326, "t": 376.65717, "r": 371.71786, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "ifith t th", "bbox": {"l": 329.28326, "t": 376.65717, "r": 371.71786, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 415.0014, "t": 376.65717, "r": 417.09616, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "i", "bbox": {"l": 415.0014, "t": 376.65717, "r": 417.09616, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 424.27356, "t": 376.65717, "r": 426.36832, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "i", "bbox": {"l": 424.27356, "t": 376.65717, "r": 426.36832, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 438.13208, "t": 376.65717, "r": 440.2268399999999, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "i", "bbox": {"l": 438.13208, "t": 376.65717, "r": 440.2268399999999, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 445.88681, "t": 376.65717, "r": 448.95757999999995, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "t", "bbox": {"l": 445.88681, "t": 376.65717, "r": 448.95757999999995, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 455.8532400000001, "t": 376.65717, "r": 460.67346000000003, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "b", "bbox": {"l": 455.8532400000001, "t": 376.65717, "r": 460.67346000000003, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 467.36746, "t": 376.65717, "r": 470.06998000000004, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "i", "bbox": {"l": 467.36746, "t": 376.65717, "r": 470.06998000000004, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 472.73705999999993, "t": 376.65717, "r": 490.1676, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "iti ll", "bbox": {"l": 472.73705999999993, "t": 376.65717, "r": 490.1676, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 496.33661, "t": 376.65717, "r": 503.2608, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "di", "bbox": {"l": 496.33661, "t": 376.65717, "r": 503.2608, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 511.26138, "t": 376.65717, "r": 527.59674, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "bl d", "bbox": {"l": 511.26138, "t": 376.65717, "r": 527.59674, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 148.1337, "t": 387.9772, "r": 187.6265, "b": 397.80734000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "DISABLE", "bbox": {"l": 148.1337, "t": 387.9772, "r": 187.6265, "b": 397.80734000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 187.58514, "t": 387.9772, "r": 190.6628, "b": 397.79583999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": ";", "bbox": {"l": 187.58514, "t": 387.9772, "r": 190.6628, "b": 397.79583999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 311.73431, "t": 376.65717, "r": 455.83047000000005, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "Specifies that the row permission is to ", "bbox": {"l": 311.73431, "t": 376.65717, "r": 455.83047000000005, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 455.8848, "t": 376.65717, "r": 527.62122, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "be initially disabled", "bbox": {"l": 455.8848, "t": 376.65717, "r": 527.62122, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}]}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_footer", "id": 2, "page_no": 9, "cluster": {"id": 2, "label": "page_footer", "bbox": {"l": 344.94, "t": 755.538002, "r": 523.60162, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9526246786117554, "cells": [{"id": 0, "text": "Chapter 3. Row and Column Access Control ", "bbox": {"l": 344.94, "t": 755.538002, "r": 523.60162, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Chapter 3. Row and Column Access Control"}, {"label": "page_footer", "id": 5, "page_no": 9, "cluster": {"id": 5, "label": "page_footer", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.9071078896522522, "cells": [{"id": 1, "text": "15", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "15"}, {"label": "caption", "id": 6, "page_no": 9, "cluster": {"id": 6, "label": "caption", "bbox": {"l": 136.79956, "t": 71.50903000000005, "r": 528.73059, "b": 92.72185999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.872844398021698, "cells": [{"id": 2, "text": "The SQL ", "bbox": {"l": 136.79959, "t": 71.50903000000005, "r": 179.58179, "b": 80.72204999999985, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "CREATE PERMISSION", "bbox": {"l": 179.57977, "t": 71.65845000000002, "r": 264.47879, "b": 80.48302999999999, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": " statement that is shown in Figure 3-1 is used to define and ", "bbox": {"l": 264.53955, "t": 71.50903000000005, "r": 528.73059, "b": 80.72204999999985, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "initially enable or disable the row access rules.", "bbox": {"l": 136.79956, "t": 83.50885000000017, "r": 341.71762, "b": 92.72185999999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The SQL CREATE PERMISSION statement that is shown in Figure 3-1 is used to define and initially enable or disable the row access rules."}, {"label": "caption", "id": 4, "page_no": 9, "cluster": {"id": 4, "label": "caption", "bbox": {"l": 136.8, "t": 414.138, "r": 341.97659, "b": 422.46301, "coord_origin": "TOPLEFT"}, "confidence": 0.938783586025238, "cells": [{"id": 6, "text": "Figure 3-1 CREATE PERMISSION SQL statement", "bbox": {"l": 136.8, "t": 414.138, "r": 341.97659, "b": 422.46301, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 3-1 CREATE PERMISSION SQL statement"}, {"label": "section_header", "id": 3, "page_no": 9, "cluster": {"id": 3, "label": "section_header", "bbox": {"l": 136.8, "t": 439.94399999999996, "r": 215.37601, "b": 451.04401, "coord_origin": "TOPLEFT"}, "confidence": 0.9477567076683044, "cells": [{"id": 7, "text": "Column mask", "bbox": {"l": 136.8, "t": 439.94399999999996, "r": 215.37601, "b": 451.04401, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Column mask"}, {"label": "text", "id": 0, "page_no": 9, "cluster": {"id": 0, "label": "text", "bbox": {"l": 136.8, "t": 455.08871000000005, "r": 542.76648, "b": 500.30115, "coord_origin": "TOPLEFT"}, "confidence": 0.9843975901603699, "cells": [{"id": 8, "text": "A column mask is a database object that manifests a column value access control rule for a ", "bbox": {"l": 136.8, "t": 455.08871000000005, "r": 542.76648, "b": 464.3017, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "specific column in a specific table. It uses a CASE expression that describes what you see ", "bbox": {"l": 136.8, "t": 467.08853, "r": 537.84125, "b": 476.30151, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "when you access the column. For example, a teller can see only the last four digits of a tax ", "bbox": {"l": 136.8, "t": 479.08835, "r": 538.80927, "b": 488.30133, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "identification number.", "bbox": {"l": 136.8, "t": 491.08817, "r": 231.20888, "b": 500.30115, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "A column mask is a database object that manifests a column value access control rule for a specific column in a specific table. It uses a CASE expression that describes what you see when you access the column. For example, a teller can see only the last four digits of a tax identification number."}, {"label": "picture", "id": 1, "page_no": 9, "cluster": {"id": 1, "label": "picture", "bbox": {"l": 135.97177124023438, "t": 107.41075134277344, "r": 545.4180908203125, "b": 410.60931396484375, "coord_origin": "TOPLEFT"}, "confidence": 0.9788318872451782, "cells": [{"id": 12, "text": "CREATE PERMISSION", "bbox": {"l": 148.1337, "t": 139.67969000000005, "r": 246.7961, "b": 149.50982999999997, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "<", "bbox": {"l": 251.86685, "t": 139.67969000000005, "r": 257.58578, "b": 149.49834999999996, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "permission name", "bbox": {"l": 257.59152, "t": 139.67969000000005, "r": 336.99741, "b": 149.50982999999997, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": ">", "bbox": {"l": 337.01233, "t": 139.67969000000005, "r": 342.73126, "b": 149.49834999999996, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Names the row permission for row access control", "bbox": {"l": 346.56491, "t": 121.46252000000004, "r": 530.74371, "b": 129.33507999999995, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "ON", "bbox": {"l": 148.1337, "t": 181.06255999999996, "r": 163.45079, "b": 190.8927, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "<", "bbox": {"l": 168.58405, "t": 181.06255999999996, "r": 174.30298, "b": 190.88122999999996, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "table name", "bbox": {"l": 174.30872, "t": 181.06255999999996, "r": 226.86777, "b": 190.8927, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": ">", "bbox": {"l": 226.86548000000002, "t": 181.06255999999996, "r": 232.58441, "b": 190.88122999999996, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Identifies the table on which the row ", "bbox": {"l": 311.3204, "t": 166.29413, "r": 450.77191000000005, "b": 174.16669000000002, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "permission is created", "bbox": {"l": 450.86123999999995, "t": 166.29413, "r": 529.93134, "b": 174.16669000000002, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "AS ", "bbox": {"l": 148.1337, "t": 222.44550000000004, "r": 163.10973, "b": 232.27562999999998, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "<", "bbox": {"l": 165.68669, "t": 222.44550000000004, "r": 171.40562, "b": 232.26415999999995, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "correlation name", "bbox": {"l": 171.41136, "t": 222.44550000000004, "r": 251.20424000000003, "b": 232.27562999999998, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": ">", "bbox": {"l": 251.21115, "t": 222.44550000000004, "r": 256.93008, "b": 232.26415999999995, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Specifies an optional correlation name that ca", "bbox": {"l": 235.79649, "t": 204.22839, "r": 406.62051, "b": 212.10095, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "be used within search-condition", "bbox": {"l": 480.53094, "t": 204.22839, "r": 532.89496, "b": 212.10095, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "FOR ROWS", "bbox": {"l": 148.1337, "t": 263.82836999999995, "r": 199.72467, "b": 273.65851, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Indicates that a row permission is cr", "bbox": {"l": 321.56271, "t": 246.09411999999998, "r": 455.3432, "b": 253.96667000000002, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "eated", "bbox": {"l": 455.20786000000004, "t": 246.09411999999998, "r": 476.48404, "b": 253.96667000000002, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Specifies a condition that can be ", "bbox": {"l": 321.5972, "t": 266.30267000000003, "r": 444.0292400000001, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "true,", "bbox": {"l": 444.07986, "t": 266.30267000000003, "r": 459.08678999999995, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "false, or unknown", "bbox": {"l": 464.2088, "t": 266.30267000000003, "r": 530.94897, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "WHERE", "bbox": {"l": 148.1337, "t": 291.41708, "r": 183.42342, "b": 301.24722, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "<", "bbox": {"l": 188.61984, "t": 291.41708, "r": 194.33878, "b": 301.23572, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "logic to test: user and/or group and/or column value", "bbox": {"l": 194.34451, "t": 291.41708, "r": 437.04659999999996, "b": 301.24722, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": ">", "bbox": {"l": 437.09020999999996, "t": 291.41708, "r": 442.80914000000007, "b": 301.23572, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "ENFORCED FOR ALL ACCESS", "bbox": {"l": 148.1337, "t": 332.79999, "r": 278.77805, "b": 342.63013, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "Specifies that the row permission applies to all ref", "bbox": {"l": 271.55829, "t": 314.58276, "r": 457.4451, "b": 322.45535, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "erences of the table", "bbox": {"l": 457.19281, "t": 314.58276, "r": 531.74939, "b": 322.45535, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "ENABLE", "bbox": {"l": 148.1337, "t": 374.18289, "r": 185.17584, "b": 384.01302999999996, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Specifies that the row permission is to", "bbox": {"l": 312.28601, "t": 355.96576000000005, "r": 454.33505, "b": 363.83835, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": " be initially enabled", "bbox": {"l": 454.3461, "t": 355.96576000000005, "r": 527.05286, "b": 363.83835, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "S", "bbox": {"l": 311.73431, "t": 376.65717, "r": 315.94684, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "ifith t th", "bbox": {"l": 329.28326, "t": 376.65717, "r": 371.71786, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "i", "bbox": {"l": 415.0014, "t": 376.65717, "r": 417.09616, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "i", "bbox": {"l": 424.27356, "t": 376.65717, "r": 426.36832, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "i", "bbox": {"l": 438.13208, "t": 376.65717, "r": 440.2268399999999, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "t", "bbox": {"l": 445.88681, "t": 376.65717, "r": 448.95757999999995, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "b", "bbox": {"l": 455.8532400000001, "t": 376.65717, "r": 460.67346000000003, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "i", "bbox": {"l": 467.36746, "t": 376.65717, "r": 470.06998000000004, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "iti ll", "bbox": {"l": 472.73705999999993, "t": 376.65717, "r": 490.1676, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "di", "bbox": {"l": 496.33661, "t": 376.65717, "r": 503.2608, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "bl d", "bbox": {"l": 511.26138, "t": 376.65717, "r": 527.59674, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "DISABLE", "bbox": {"l": 148.1337, "t": 387.9772, "r": 187.6265, "b": 397.80734000000007, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": ";", "bbox": {"l": 187.58514, "t": 387.9772, "r": 190.6628, "b": 397.79583999999994, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Specifies that the row permission is to ", "bbox": {"l": 311.73431, "t": 376.65717, "r": 455.83047000000005, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "be initially disabled", "bbox": {"l": 455.8848, "t": 376.65717, "r": 527.62122, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": [{"id": 7, "label": "text", "bbox": {"l": 148.1337, "t": 139.67969000000005, "r": 246.7961, "b": 149.50982999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "CREATE PERMISSION", "bbox": {"l": 148.1337, "t": 139.67969000000005, "r": 246.7961, "b": 149.50982999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "text", "bbox": {"l": 251.86685, "t": 139.67969000000005, "r": 257.58578, "b": 149.49834999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "<", "bbox": {"l": 251.86685, "t": 139.67969000000005, "r": 257.58578, "b": 149.49834999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 257.59152, "t": 139.67969000000005, "r": 336.99741, "b": 149.50982999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "permission name", "bbox": {"l": 257.59152, "t": 139.67969000000005, "r": 336.99741, "b": 149.50982999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "text", "bbox": {"l": 337.01233, "t": 139.67969000000005, "r": 342.73126, "b": 149.49834999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": ">", "bbox": {"l": 337.01233, "t": 139.67969000000005, "r": 342.73126, "b": 149.49834999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 346.56491, "t": 121.46252000000004, "r": 530.74371, "b": 129.33507999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "Names the row permission for row access control", "bbox": {"l": 346.56491, "t": 121.46252000000004, "r": 530.74371, "b": 129.33507999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 148.1337, "t": 181.06255999999996, "r": 163.45079, "b": 190.8927, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "ON", "bbox": {"l": 148.1337, "t": 181.06255999999996, "r": 163.45079, "b": 190.8927, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 168.58405, "t": 181.06255999999996, "r": 174.30298, "b": 190.88122999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "<", "bbox": {"l": 168.58405, "t": 181.06255999999996, "r": 174.30298, "b": 190.88122999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 174.30872, "t": 181.06255999999996, "r": 226.86777, "b": 190.8927, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "table name", "bbox": {"l": 174.30872, "t": 181.06255999999996, "r": 226.86777, "b": 190.8927, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 226.86548000000002, "t": 181.06255999999996, "r": 232.58441, "b": 190.88122999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": ">", "bbox": {"l": 226.86548000000002, "t": 181.06255999999996, "r": 232.58441, "b": 190.88122999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 311.3204, "t": 166.29413, "r": 450.77191000000005, "b": 174.16669000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "Identifies the table on which the row ", "bbox": {"l": 311.3204, "t": 166.29413, "r": 450.77191000000005, "b": 174.16669000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 450.86123999999995, "t": 166.29413, "r": 529.93134, "b": 174.16669000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "permission is created", "bbox": {"l": 450.86123999999995, "t": 166.29413, "r": 529.93134, "b": 174.16669000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 148.1337, "t": 222.44550000000004, "r": 163.10973, "b": 232.27562999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "AS ", "bbox": {"l": 148.1337, "t": 222.44550000000004, "r": 163.10973, "b": 232.27562999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 165.68669, "t": 222.44550000000004, "r": 171.40562, "b": 232.26415999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "<", "bbox": {"l": 165.68669, "t": 222.44550000000004, "r": 171.40562, "b": 232.26415999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 171.41136, "t": 222.44550000000004, "r": 251.20424000000003, "b": 232.27562999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "correlation name", "bbox": {"l": 171.41136, "t": 222.44550000000004, "r": 251.20424000000003, "b": 232.27562999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 251.21115, "t": 222.44550000000004, "r": 256.93008, "b": 232.26415999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": ">", "bbox": {"l": 251.21115, "t": 222.44550000000004, "r": 256.93008, "b": 232.26415999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 235.79649, "t": 204.22839, "r": 406.62051, "b": 212.10095, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "Specifies an optional correlation name that ca", "bbox": {"l": 235.79649, "t": 204.22839, "r": 406.62051, "b": 212.10095, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 480.53094, "t": 204.22839, "r": 532.89496, "b": 212.10095, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "be used within search-condition", "bbox": {"l": 480.53094, "t": 204.22839, "r": 532.89496, "b": 212.10095, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 148.1337, "t": 263.82836999999995, "r": 199.72467, "b": 273.65851, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "FOR ROWS", "bbox": {"l": 148.1337, "t": 263.82836999999995, "r": 199.72467, "b": 273.65851, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 321.56271, "t": 246.09411999999998, "r": 455.3432, "b": 253.96667000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "Indicates that a row permission is cr", "bbox": {"l": 321.56271, "t": 246.09411999999998, "r": 455.3432, "b": 253.96667000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 455.20786000000004, "t": 246.09411999999998, "r": 476.48404, "b": 253.96667000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "eated", "bbox": {"l": 455.20786000000004, "t": 246.09411999999998, "r": 476.48404, "b": 253.96667000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 321.5972, "t": 266.30267000000003, "r": 444.0292400000001, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "Specifies a condition that can be ", "bbox": {"l": 321.5972, "t": 266.30267000000003, "r": 444.0292400000001, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 444.07986, "t": 266.30267000000003, "r": 459.08678999999995, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "true,", "bbox": {"l": 444.07986, "t": 266.30267000000003, "r": 459.08678999999995, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 464.2088, "t": 266.30267000000003, "r": 530.94897, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "false, or unknown", "bbox": {"l": 464.2088, "t": 266.30267000000003, "r": 530.94897, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 148.1337, "t": 291.41708, "r": 183.42342, "b": 301.24722, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "WHERE", "bbox": {"l": 148.1337, "t": 291.41708, "r": 183.42342, "b": 301.24722, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 188.61984, "t": 291.41708, "r": 194.33878, "b": 301.23572, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "<", "bbox": {"l": 188.61984, "t": 291.41708, "r": 194.33878, "b": 301.23572, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 194.34451, "t": 291.41708, "r": 437.04659999999996, "b": 301.24722, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "logic to test: user and/or group and/or column value", "bbox": {"l": 194.34451, "t": 291.41708, "r": 437.04659999999996, "b": 301.24722, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 437.09020999999996, "t": 291.41708, "r": 442.80914000000007, "b": 301.23572, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": ">", "bbox": {"l": 437.09020999999996, "t": 291.41708, "r": 442.80914000000007, "b": 301.23572, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 148.1337, "t": 332.79999, "r": 278.77805, "b": 342.63013, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "ENFORCED FOR ALL ACCESS", "bbox": {"l": 148.1337, "t": 332.79999, "r": 278.77805, "b": 342.63013, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 271.55829, "t": 314.58276, "r": 457.4451, "b": 322.45535, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "Specifies that the row permission applies to all ref", "bbox": {"l": 271.55829, "t": 314.58276, "r": 457.4451, "b": 322.45535, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 457.19281, "t": 314.58276, "r": 531.74939, "b": 322.45535, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "erences of the table", "bbox": {"l": 457.19281, "t": 314.58276, "r": 531.74939, "b": 322.45535, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 148.1337, "t": 374.18289, "r": 185.17584, "b": 384.01302999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "ENABLE", "bbox": {"l": 148.1337, "t": 374.18289, "r": 185.17584, "b": 384.01302999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 312.28601, "t": 355.96576000000005, "r": 454.33505, "b": 363.83835, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "Specifies that the row permission is to", "bbox": {"l": 312.28601, "t": 355.96576000000005, "r": 454.33505, "b": 363.83835, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 454.3461, "t": 355.96576000000005, "r": 527.05286, "b": 363.83835, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": " be initially enabled", "bbox": {"l": 454.3461, "t": 355.96576000000005, "r": 527.05286, "b": 363.83835, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 311.73431, "t": 376.65717, "r": 315.94684, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "S", "bbox": {"l": 311.73431, "t": 376.65717, "r": 315.94684, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 329.28326, "t": 376.65717, "r": 371.71786, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "ifith t th", "bbox": {"l": 329.28326, "t": 376.65717, "r": 371.71786, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 415.0014, "t": 376.65717, "r": 417.09616, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "i", "bbox": {"l": 415.0014, "t": 376.65717, "r": 417.09616, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 424.27356, "t": 376.65717, "r": 426.36832, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "i", "bbox": {"l": 424.27356, "t": 376.65717, "r": 426.36832, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 438.13208, "t": 376.65717, "r": 440.2268399999999, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "i", "bbox": {"l": 438.13208, "t": 376.65717, "r": 440.2268399999999, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 445.88681, "t": 376.65717, "r": 448.95757999999995, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "t", "bbox": {"l": 445.88681, "t": 376.65717, "r": 448.95757999999995, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 455.8532400000001, "t": 376.65717, "r": 460.67346000000003, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "b", "bbox": {"l": 455.8532400000001, "t": 376.65717, "r": 460.67346000000003, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 467.36746, "t": 376.65717, "r": 470.06998000000004, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "i", "bbox": {"l": 467.36746, "t": 376.65717, "r": 470.06998000000004, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 472.73705999999993, "t": 376.65717, "r": 490.1676, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "iti ll", "bbox": {"l": 472.73705999999993, "t": 376.65717, "r": 490.1676, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 496.33661, "t": 376.65717, "r": 503.2608, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "di", "bbox": {"l": 496.33661, "t": 376.65717, "r": 503.2608, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 511.26138, "t": 376.65717, "r": 527.59674, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "bl d", "bbox": {"l": 511.26138, "t": 376.65717, "r": 527.59674, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 148.1337, "t": 387.9772, "r": 187.6265, "b": 397.80734000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "DISABLE", "bbox": {"l": 148.1337, "t": 387.9772, "r": 187.6265, "b": 397.80734000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 187.58514, "t": 387.9772, "r": 190.6628, "b": 397.79583999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": ";", "bbox": {"l": 187.58514, "t": 387.9772, "r": 190.6628, "b": 397.79583999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 311.73431, "t": 376.65717, "r": 455.83047000000005, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "Specifies that the row permission is to ", "bbox": {"l": 311.73431, "t": 376.65717, "r": 455.83047000000005, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 455.8848, "t": 376.65717, "r": 527.62122, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "be initially disabled", "bbox": {"l": 455.8848, "t": 376.65717, "r": 527.62122, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "body": [{"label": "caption", "id": 6, "page_no": 9, "cluster": {"id": 6, "label": "caption", "bbox": {"l": 136.79956, "t": 71.50903000000005, "r": 528.73059, "b": 92.72185999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.872844398021698, "cells": [{"id": 2, "text": "The SQL ", "bbox": {"l": 136.79959, "t": 71.50903000000005, "r": 179.58179, "b": 80.72204999999985, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "CREATE PERMISSION", "bbox": {"l": 179.57977, "t": 71.65845000000002, "r": 264.47879, "b": 80.48302999999999, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": " statement that is shown in Figure 3-1 is used to define and ", "bbox": {"l": 264.53955, "t": 71.50903000000005, "r": 528.73059, "b": 80.72204999999985, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "initially enable or disable the row access rules.", "bbox": {"l": 136.79956, "t": 83.50885000000017, "r": 341.71762, "b": 92.72185999999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The SQL CREATE PERMISSION statement that is shown in Figure 3-1 is used to define and initially enable or disable the row access rules."}, {"label": "caption", "id": 4, "page_no": 9, "cluster": {"id": 4, "label": "caption", "bbox": {"l": 136.8, "t": 414.138, "r": 341.97659, "b": 422.46301, "coord_origin": "TOPLEFT"}, "confidence": 0.938783586025238, "cells": [{"id": 6, "text": "Figure 3-1 CREATE PERMISSION SQL statement", "bbox": {"l": 136.8, "t": 414.138, "r": 341.97659, "b": 422.46301, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 3-1 CREATE PERMISSION SQL statement"}, {"label": "section_header", "id": 3, "page_no": 9, "cluster": {"id": 3, "label": "section_header", "bbox": {"l": 136.8, "t": 439.94399999999996, "r": 215.37601, "b": 451.04401, "coord_origin": "TOPLEFT"}, "confidence": 0.9477567076683044, "cells": [{"id": 7, "text": "Column mask", "bbox": {"l": 136.8, "t": 439.94399999999996, "r": 215.37601, "b": 451.04401, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Column mask"}, {"label": "text", "id": 0, "page_no": 9, "cluster": {"id": 0, "label": "text", "bbox": {"l": 136.8, "t": 455.08871000000005, "r": 542.76648, "b": 500.30115, "coord_origin": "TOPLEFT"}, "confidence": 0.9843975901603699, "cells": [{"id": 8, "text": "A column mask is a database object that manifests a column value access control rule for a ", "bbox": {"l": 136.8, "t": 455.08871000000005, "r": 542.76648, "b": 464.3017, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "specific column in a specific table. It uses a CASE expression that describes what you see ", "bbox": {"l": 136.8, "t": 467.08853, "r": 537.84125, "b": 476.30151, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "when you access the column. For example, a teller can see only the last four digits of a tax ", "bbox": {"l": 136.8, "t": 479.08835, "r": 538.80927, "b": 488.30133, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "identification number.", "bbox": {"l": 136.8, "t": 491.08817, "r": 231.20888, "b": 500.30115, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "A column mask is a database object that manifests a column value access control rule for a specific column in a specific table. It uses a CASE expression that describes what you see when you access the column. For example, a teller can see only the last four digits of a tax identification number."}, {"label": "picture", "id": 1, "page_no": 9, "cluster": {"id": 1, "label": "picture", "bbox": {"l": 135.97177124023438, "t": 107.41075134277344, "r": 545.4180908203125, "b": 410.60931396484375, "coord_origin": "TOPLEFT"}, "confidence": 0.9788318872451782, "cells": [{"id": 12, "text": "CREATE PERMISSION", "bbox": {"l": 148.1337, "t": 139.67969000000005, "r": 246.7961, "b": 149.50982999999997, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "<", "bbox": {"l": 251.86685, "t": 139.67969000000005, "r": 257.58578, "b": 149.49834999999996, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "permission name", "bbox": {"l": 257.59152, "t": 139.67969000000005, "r": 336.99741, "b": 149.50982999999997, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": ">", "bbox": {"l": 337.01233, "t": 139.67969000000005, "r": 342.73126, "b": 149.49834999999996, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Names the row permission for row access control", "bbox": {"l": 346.56491, "t": 121.46252000000004, "r": 530.74371, "b": 129.33507999999995, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "ON", "bbox": {"l": 148.1337, "t": 181.06255999999996, "r": 163.45079, "b": 190.8927, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "<", "bbox": {"l": 168.58405, "t": 181.06255999999996, "r": 174.30298, "b": 190.88122999999996, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "table name", "bbox": {"l": 174.30872, "t": 181.06255999999996, "r": 226.86777, "b": 190.8927, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": ">", "bbox": {"l": 226.86548000000002, "t": 181.06255999999996, "r": 232.58441, "b": 190.88122999999996, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Identifies the table on which the row ", "bbox": {"l": 311.3204, "t": 166.29413, "r": 450.77191000000005, "b": 174.16669000000002, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "permission is created", "bbox": {"l": 450.86123999999995, "t": 166.29413, "r": 529.93134, "b": 174.16669000000002, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "AS ", "bbox": {"l": 148.1337, "t": 222.44550000000004, "r": 163.10973, "b": 232.27562999999998, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "<", "bbox": {"l": 165.68669, "t": 222.44550000000004, "r": 171.40562, "b": 232.26415999999995, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "correlation name", "bbox": {"l": 171.41136, "t": 222.44550000000004, "r": 251.20424000000003, "b": 232.27562999999998, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": ">", "bbox": {"l": 251.21115, "t": 222.44550000000004, "r": 256.93008, "b": 232.26415999999995, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Specifies an optional correlation name that ca", "bbox": {"l": 235.79649, "t": 204.22839, "r": 406.62051, "b": 212.10095, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "be used within search-condition", "bbox": {"l": 480.53094, "t": 204.22839, "r": 532.89496, "b": 212.10095, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "FOR ROWS", "bbox": {"l": 148.1337, "t": 263.82836999999995, "r": 199.72467, "b": 273.65851, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Indicates that a row permission is cr", "bbox": {"l": 321.56271, "t": 246.09411999999998, "r": 455.3432, "b": 253.96667000000002, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "eated", "bbox": {"l": 455.20786000000004, "t": 246.09411999999998, "r": 476.48404, "b": 253.96667000000002, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Specifies a condition that can be ", "bbox": {"l": 321.5972, "t": 266.30267000000003, "r": 444.0292400000001, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "true,", "bbox": {"l": 444.07986, "t": 266.30267000000003, "r": 459.08678999999995, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "false, or unknown", "bbox": {"l": 464.2088, "t": 266.30267000000003, "r": 530.94897, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "WHERE", "bbox": {"l": 148.1337, "t": 291.41708, "r": 183.42342, "b": 301.24722, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "<", "bbox": {"l": 188.61984, "t": 291.41708, "r": 194.33878, "b": 301.23572, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "logic to test: user and/or group and/or column value", "bbox": {"l": 194.34451, "t": 291.41708, "r": 437.04659999999996, "b": 301.24722, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": ">", "bbox": {"l": 437.09020999999996, "t": 291.41708, "r": 442.80914000000007, "b": 301.23572, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "ENFORCED FOR ALL ACCESS", "bbox": {"l": 148.1337, "t": 332.79999, "r": 278.77805, "b": 342.63013, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "Specifies that the row permission applies to all ref", "bbox": {"l": 271.55829, "t": 314.58276, "r": 457.4451, "b": 322.45535, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "erences of the table", "bbox": {"l": 457.19281, "t": 314.58276, "r": 531.74939, "b": 322.45535, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "ENABLE", "bbox": {"l": 148.1337, "t": 374.18289, "r": 185.17584, "b": 384.01302999999996, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Specifies that the row permission is to", "bbox": {"l": 312.28601, "t": 355.96576000000005, "r": 454.33505, "b": 363.83835, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": " be initially enabled", "bbox": {"l": 454.3461, "t": 355.96576000000005, "r": 527.05286, "b": 363.83835, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "S", "bbox": {"l": 311.73431, "t": 376.65717, "r": 315.94684, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "ifith t th", "bbox": {"l": 329.28326, "t": 376.65717, "r": 371.71786, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "i", "bbox": {"l": 415.0014, "t": 376.65717, "r": 417.09616, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "i", "bbox": {"l": 424.27356, "t": 376.65717, "r": 426.36832, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "i", "bbox": {"l": 438.13208, "t": 376.65717, "r": 440.2268399999999, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "t", "bbox": {"l": 445.88681, "t": 376.65717, "r": 448.95757999999995, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "b", "bbox": {"l": 455.8532400000001, "t": 376.65717, "r": 460.67346000000003, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "i", "bbox": {"l": 467.36746, "t": 376.65717, "r": 470.06998000000004, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "iti ll", "bbox": {"l": 472.73705999999993, "t": 376.65717, "r": 490.1676, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "di", "bbox": {"l": 496.33661, "t": 376.65717, "r": 503.2608, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "bl d", "bbox": {"l": 511.26138, "t": 376.65717, "r": 527.59674, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "DISABLE", "bbox": {"l": 148.1337, "t": 387.9772, "r": 187.6265, "b": 397.80734000000007, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": ";", "bbox": {"l": 187.58514, "t": 387.9772, "r": 190.6628, "b": 397.79583999999994, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Specifies that the row permission is to ", "bbox": {"l": 311.73431, "t": 376.65717, "r": 455.83047000000005, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "be initially disabled", "bbox": {"l": 455.8848, "t": 376.65717, "r": 527.62122, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": [{"id": 7, "label": "text", "bbox": {"l": 148.1337, "t": 139.67969000000005, "r": 246.7961, "b": 149.50982999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "CREATE PERMISSION", "bbox": {"l": 148.1337, "t": 139.67969000000005, "r": 246.7961, "b": 149.50982999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "text", "bbox": {"l": 251.86685, "t": 139.67969000000005, "r": 257.58578, "b": 149.49834999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "<", "bbox": {"l": 251.86685, "t": 139.67969000000005, "r": 257.58578, "b": 149.49834999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 257.59152, "t": 139.67969000000005, "r": 336.99741, "b": 149.50982999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "permission name", "bbox": {"l": 257.59152, "t": 139.67969000000005, "r": 336.99741, "b": 149.50982999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "text", "bbox": {"l": 337.01233, "t": 139.67969000000005, "r": 342.73126, "b": 149.49834999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": ">", "bbox": {"l": 337.01233, "t": 139.67969000000005, "r": 342.73126, "b": 149.49834999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 346.56491, "t": 121.46252000000004, "r": 530.74371, "b": 129.33507999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "Names the row permission for row access control", "bbox": {"l": 346.56491, "t": 121.46252000000004, "r": 530.74371, "b": 129.33507999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 148.1337, "t": 181.06255999999996, "r": 163.45079, "b": 190.8927, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "ON", "bbox": {"l": 148.1337, "t": 181.06255999999996, "r": 163.45079, "b": 190.8927, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 168.58405, "t": 181.06255999999996, "r": 174.30298, "b": 190.88122999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "<", "bbox": {"l": 168.58405, "t": 181.06255999999996, "r": 174.30298, "b": 190.88122999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 174.30872, "t": 181.06255999999996, "r": 226.86777, "b": 190.8927, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "table name", "bbox": {"l": 174.30872, "t": 181.06255999999996, "r": 226.86777, "b": 190.8927, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 226.86548000000002, "t": 181.06255999999996, "r": 232.58441, "b": 190.88122999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": ">", "bbox": {"l": 226.86548000000002, "t": 181.06255999999996, "r": 232.58441, "b": 190.88122999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 311.3204, "t": 166.29413, "r": 450.77191000000005, "b": 174.16669000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "Identifies the table on which the row ", "bbox": {"l": 311.3204, "t": 166.29413, "r": 450.77191000000005, "b": 174.16669000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 450.86123999999995, "t": 166.29413, "r": 529.93134, "b": 174.16669000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "permission is created", "bbox": {"l": 450.86123999999995, "t": 166.29413, "r": 529.93134, "b": 174.16669000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 148.1337, "t": 222.44550000000004, "r": 163.10973, "b": 232.27562999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "AS ", "bbox": {"l": 148.1337, "t": 222.44550000000004, "r": 163.10973, "b": 232.27562999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 165.68669, "t": 222.44550000000004, "r": 171.40562, "b": 232.26415999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "<", "bbox": {"l": 165.68669, "t": 222.44550000000004, "r": 171.40562, "b": 232.26415999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 171.41136, "t": 222.44550000000004, "r": 251.20424000000003, "b": 232.27562999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "correlation name", "bbox": {"l": 171.41136, "t": 222.44550000000004, "r": 251.20424000000003, "b": 232.27562999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 251.21115, "t": 222.44550000000004, "r": 256.93008, "b": 232.26415999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": ">", "bbox": {"l": 251.21115, "t": 222.44550000000004, "r": 256.93008, "b": 232.26415999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 235.79649, "t": 204.22839, "r": 406.62051, "b": 212.10095, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "Specifies an optional correlation name that ca", "bbox": {"l": 235.79649, "t": 204.22839, "r": 406.62051, "b": 212.10095, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 480.53094, "t": 204.22839, "r": 532.89496, "b": 212.10095, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "be used within search-condition", "bbox": {"l": 480.53094, "t": 204.22839, "r": 532.89496, "b": 212.10095, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 148.1337, "t": 263.82836999999995, "r": 199.72467, "b": 273.65851, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "FOR ROWS", "bbox": {"l": 148.1337, "t": 263.82836999999995, "r": 199.72467, "b": 273.65851, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 321.56271, "t": 246.09411999999998, "r": 455.3432, "b": 253.96667000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "Indicates that a row permission is cr", "bbox": {"l": 321.56271, "t": 246.09411999999998, "r": 455.3432, "b": 253.96667000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 455.20786000000004, "t": 246.09411999999998, "r": 476.48404, "b": 253.96667000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "eated", "bbox": {"l": 455.20786000000004, "t": 246.09411999999998, "r": 476.48404, "b": 253.96667000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 321.5972, "t": 266.30267000000003, "r": 444.0292400000001, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "Specifies a condition that can be ", "bbox": {"l": 321.5972, "t": 266.30267000000003, "r": 444.0292400000001, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 444.07986, "t": 266.30267000000003, "r": 459.08678999999995, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "true,", "bbox": {"l": 444.07986, "t": 266.30267000000003, "r": 459.08678999999995, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 464.2088, "t": 266.30267000000003, "r": 530.94897, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "false, or unknown", "bbox": {"l": 464.2088, "t": 266.30267000000003, "r": 530.94897, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 148.1337, "t": 291.41708, "r": 183.42342, "b": 301.24722, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "WHERE", "bbox": {"l": 148.1337, "t": 291.41708, "r": 183.42342, "b": 301.24722, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 188.61984, "t": 291.41708, "r": 194.33878, "b": 301.23572, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "<", "bbox": {"l": 188.61984, "t": 291.41708, "r": 194.33878, "b": 301.23572, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 194.34451, "t": 291.41708, "r": 437.04659999999996, "b": 301.24722, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "logic to test: user and/or group and/or column value", "bbox": {"l": 194.34451, "t": 291.41708, "r": 437.04659999999996, "b": 301.24722, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 437.09020999999996, "t": 291.41708, "r": 442.80914000000007, "b": 301.23572, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": ">", "bbox": {"l": 437.09020999999996, "t": 291.41708, "r": 442.80914000000007, "b": 301.23572, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 148.1337, "t": 332.79999, "r": 278.77805, "b": 342.63013, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "ENFORCED FOR ALL ACCESS", "bbox": {"l": 148.1337, "t": 332.79999, "r": 278.77805, "b": 342.63013, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 271.55829, "t": 314.58276, "r": 457.4451, "b": 322.45535, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "Specifies that the row permission applies to all ref", "bbox": {"l": 271.55829, "t": 314.58276, "r": 457.4451, "b": 322.45535, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 457.19281, "t": 314.58276, "r": 531.74939, "b": 322.45535, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "erences of the table", "bbox": {"l": 457.19281, "t": 314.58276, "r": 531.74939, "b": 322.45535, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 148.1337, "t": 374.18289, "r": 185.17584, "b": 384.01302999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "ENABLE", "bbox": {"l": 148.1337, "t": 374.18289, "r": 185.17584, "b": 384.01302999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 312.28601, "t": 355.96576000000005, "r": 454.33505, "b": 363.83835, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "Specifies that the row permission is to", "bbox": {"l": 312.28601, "t": 355.96576000000005, "r": 454.33505, "b": 363.83835, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 454.3461, "t": 355.96576000000005, "r": 527.05286, "b": 363.83835, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": " be initially enabled", "bbox": {"l": 454.3461, "t": 355.96576000000005, "r": 527.05286, "b": 363.83835, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 311.73431, "t": 376.65717, "r": 315.94684, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "S", "bbox": {"l": 311.73431, "t": 376.65717, "r": 315.94684, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 329.28326, "t": 376.65717, "r": 371.71786, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "ifith t th", "bbox": {"l": 329.28326, "t": 376.65717, "r": 371.71786, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 415.0014, "t": 376.65717, "r": 417.09616, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "i", "bbox": {"l": 415.0014, "t": 376.65717, "r": 417.09616, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 424.27356, "t": 376.65717, "r": 426.36832, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "i", "bbox": {"l": 424.27356, "t": 376.65717, "r": 426.36832, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 438.13208, "t": 376.65717, "r": 440.2268399999999, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "i", "bbox": {"l": 438.13208, "t": 376.65717, "r": 440.2268399999999, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 445.88681, "t": 376.65717, "r": 448.95757999999995, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "t", "bbox": {"l": 445.88681, "t": 376.65717, "r": 448.95757999999995, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 455.8532400000001, "t": 376.65717, "r": 460.67346000000003, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "b", "bbox": {"l": 455.8532400000001, "t": 376.65717, "r": 460.67346000000003, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 467.36746, "t": 376.65717, "r": 470.06998000000004, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "i", "bbox": {"l": 467.36746, "t": 376.65717, "r": 470.06998000000004, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 472.73705999999993, "t": 376.65717, "r": 490.1676, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "iti ll", "bbox": {"l": 472.73705999999993, "t": 376.65717, "r": 490.1676, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 496.33661, "t": 376.65717, "r": 503.2608, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "di", "bbox": {"l": 496.33661, "t": 376.65717, "r": 503.2608, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 511.26138, "t": 376.65717, "r": 527.59674, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "bl d", "bbox": {"l": 511.26138, "t": 376.65717, "r": 527.59674, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 148.1337, "t": 387.9772, "r": 187.6265, "b": 397.80734000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "DISABLE", "bbox": {"l": 148.1337, "t": 387.9772, "r": 187.6265, "b": 397.80734000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 187.58514, "t": 387.9772, "r": 190.6628, "b": 397.79583999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": ";", "bbox": {"l": 187.58514, "t": 387.9772, "r": 190.6628, "b": 397.79583999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 311.73431, "t": 376.65717, "r": 455.83047000000005, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "Specifies that the row permission is to ", "bbox": {"l": 311.73431, "t": 376.65717, "r": 455.83047000000005, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 455.8848, "t": 376.65717, "r": 527.62122, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "be initially disabled", "bbox": {"l": 455.8848, "t": 376.65717, "r": 527.62122, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "headers": [{"label": "page_footer", "id": 2, "page_no": 9, "cluster": {"id": 2, "label": "page_footer", "bbox": {"l": 344.94, "t": 755.538002, "r": 523.60162, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9526246786117554, "cells": [{"id": 0, "text": "Chapter 3. Row and Column Access Control ", "bbox": {"l": 344.94, "t": 755.538002, "r": 523.60162, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Chapter 3. Row and Column Access Control"}, {"label": "page_footer", "id": 5, "page_no": 9, "cluster": {"id": 5, "label": "page_footer", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.9071078896522522, "cells": [{"id": 1, "text": "15", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "15"}]}}, {"page_no": 10, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "Chapter 3. Row and Column Access Control ", "bbox": {"l": 344.94, "t": 755.538002, "r": 523.60162, "b": 763.863001, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "19", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Table 3-1 summarizes these special registers and their values.", "bbox": {"l": 136.79959, "t": 71.50903000000005, "r": 412.20758, "b": 80.72204999999985, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Table 3-1 Special registers and their corresponding values", "bbox": {"l": 136.8, "t": 93.49805000000003, "r": 372.60364, "b": 101.82299999999998, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Figure 3-5 shows the difference in the special register values when an adopted authority is ", "bbox": {"l": 136.8, "t": 214.48870999999997, "r": 538.4939, "b": 223.70172000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "used:", "bbox": {"l": 136.8, "t": 226.48852999999997, "r": 161.20995, "b": 235.70154000000002, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "GLYPH<SM590000>", "bbox": {"l": 136.8, "t": 243.67749000000003, "r": 141.78, "b": 252.45227, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "A user connects to the server using the user profile ALICE.", "bbox": {"l": 151.20016, "t": 243.52808000000005, "r": 411.36139, "b": 252.74108999999999, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "GLYPH<SM590000>", "bbox": {"l": 136.8, "t": 260.65729, "r": 141.78, "b": 269.43206999999995, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "USER and CURRENT USER initially have the same value of ALICE.", "bbox": {"l": 151.20016, "t": 260.50787, "r": 453.2580899999999, "b": 269.72089000000005, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "GLYPH<SM590000>", "bbox": {"l": 136.8, "t": 277.63707999999997, "r": 141.78, "b": 286.41187, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "ALICE calls an SQL procedure that is named proc1, which is owned by user profile JOE ", "bbox": {"l": 151.20016, "t": 277.48767, "r": 541.44983, "b": 286.70068, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "and was created to adopt JOE\u2019s authority when it is called.", "bbox": {"l": 151.20016, "t": 289.4875200000001, "r": 409.82953, "b": 298.7005, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "GLYPH<SM590000>", "bbox": {"l": 136.8, "t": 306.67647999999997, "r": 141.78, "b": 315.45126000000005, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "While the procedure is running, the special register USER still contains the value of ALICE ", "bbox": {"l": 151.20016, "t": 306.5271, "r": 547.21674, "b": 315.74008, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "because it excludes any adopted authority. The special register CURRENT USER ", "bbox": {"l": 151.20117, "t": 318.52691999999996, "r": 514.32971, "b": 327.7399, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "contains the value of JOE because it includes any adopted authority.", "bbox": {"l": 151.20117, "t": 330.52673, "r": 453.3249200000001, "b": 339.73972, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "GLYPH<SM590000>", "bbox": {"l": 136.80101, "t": 347.65591, "r": 141.78101, "b": 356.43069, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "When proc1 ends, the session reverts to its original state with both USER and CURRENT ", "bbox": {"l": 151.20117, "t": 347.50653, "r": 547.35406, "b": 356.71950999999996, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "USER having the value of ALICE.", "bbox": {"l": 151.20117, "t": 359.50635, "r": 299.57532, "b": 368.71933000000007, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Figure 3-5 Special registers and adopted authority", "bbox": {"l": 136.8, "t": 596.7179, "r": 341.25662, "b": 605.04291, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "3.2.2", "bbox": {"l": 64.800003, "t": 625.55472, "r": 94.20356, "b": 637.54272, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "Built-in global variables", "bbox": {"l": 97.879005, "t": 625.55472, "r": 247.02536, "b": 637.54272, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Built-in global variables are provided with the database manager and are used in SQL ", "bbox": {"l": 136.8, "t": 651.70872, "r": 518.00116, "b": 660.92172, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "statements to retrieve scalar values that are associated with the variables.", "bbox": {"l": 136.8, "t": 663.70853, "r": 462.81759999999997, "b": 672.92153, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "IBM DB2 for i supports nine different built-in global variables that are read only and ", "bbox": {"l": 136.8, "t": 685.7281, "r": 504.44669, "b": 694.941101, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "maintained by the system. These global variables can be used to identify attributes of the ", "bbox": {"l": 136.8, "t": 697.727905, "r": 532.3385, "b": 706.94091, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "database connection and used as part of the RCAC logic.", "bbox": {"l": 136.8, "t": 709.727715, "r": 391.38257, "b": 718.94072, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Special register", "bbox": {"l": 142.8, "t": 110.53801999999985, "r": 209.67091, "b": 118.86298, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Corresponding value", "bbox": {"l": 230.18912000000003, "t": 110.53801999999985, "r": 319.93527, "b": 118.86298, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "USER or", "bbox": {"l": 142.80002, "t": 129.49834999999996, "r": 178.26361, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "SESSION_USER", "bbox": {"l": 142.80002, "t": 140.53864, "r": 212.70122, "b": 148.86359000000004, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "The effective user of the thread excluding adopted authority.", "bbox": {"l": 230.21973000000003, "t": 129.49834999999996, "r": 467.99069000000003, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "CURRENT_USER", "bbox": {"l": 142.80003, "t": 159.55835000000002, "r": 216.63962999999998, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "The effective user of the thread including adopted authority. When no adopted ", "bbox": {"l": 230.19814, "t": 159.55835000000002, "r": 535.65082, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "authority is present, this has the same value as USER.", "bbox": {"l": 230.22061, "t": 170.53832999999997, "r": 447.36533, "b": 178.86328000000003, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "SYSTEM_USER", "bbox": {"l": 142.8009, "t": 189.55804, "r": 209.7357, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "The authorization ID that initiated the connection.", "bbox": {"l": 230.2449, "t": 189.55804, "r": 425.64569, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "SignedonasALICE", "bbox": {"l": 140.7323, "t": 386.98453, "r": 218.71170000000004, "b": 395.49527, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "Signed on as ALICE", "bbox": {"l": 140.7323, "t": 386.98453, "r": 216.40009, "b": 395.49527, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "USER = ALICE", "bbox": {"l": 138.476, "t": 410.87441999999993, "r": 191.70256, "b": 419.38516, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "CURRENT USER = ALICE", "bbox": {"l": 138.476, "t": 422.81934, "r": 232.56117, "b": 431.33008, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "CALL proc1", "bbox": {"l": 138.476, "t": 446.70923000000005, "r": 183.26944, "b": 455.21997, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "P1", "bbox": {"l": 148.4301, "t": 473.58524, "r": 184.17328, "b": 482.09598, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "Proc1:", "bbox": {"l": 148.4301, "t": 473.58524, "r": 174.05859, "b": 482.09598, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Owner = JOE", "bbox": {"l": 157.52185, "t": 485.53015, "r": 209.103, "b": 494.04089, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "SET OPTION USRPRF=*OWNER", "bbox": {"l": 157.52185, "t": 497.47507, "r": 281.68927, "b": 505.98581, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "USER = ALICE", "bbox": {"l": 148.4301, "t": 521.36493, "r": 201.65666, "b": 529.87567, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "CURRENT USER = JOE", "bbox": {"l": 148.4301, "t": 533.30984, "r": 234.57686999999999, "b": 541.82059, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "USER = ALICE", "bbox": {"l": 138.476, "t": 566.15842, "r": 191.70256, "b": 574.66917, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "CURRENT USER = ALICE", "bbox": {"l": 138.476, "t": 578.10333, "r": 232.56117, "b": 586.61409, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 7, "label": "page_footer", "bbox": {"l": 344.94, "t": 755.538002, "r": 523.60162, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9557498693466187, "cells": [{"id": 0, "text": "Chapter 3. Row and Column Access Control ", "bbox": {"l": 344.94, "t": 755.538002, "r": 523.60162, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "page_footer", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.9130511283874512, "cells": [{"id": 1, "text": "19", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "caption", "bbox": {"l": 136.79959, "t": 71.50903000000005, "r": 412.20758, "b": 80.72204999999985, "coord_origin": "TOPLEFT"}, "confidence": 0.7875156402587891, "cells": [{"id": 2, "text": "Table 3-1 summarizes these special registers and their values.", "bbox": {"l": 136.79959, "t": 71.50903000000005, "r": 412.20758, "b": 80.72204999999985, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "caption", "bbox": {"l": 136.8, "t": 93.49805000000003, "r": 372.60364, "b": 101.82299999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.9253708720207214, "cells": [{"id": 3, "text": "Table 3-1 Special registers and their corresponding values", "bbox": {"l": 136.8, "t": 93.49805000000003, "r": 372.60364, "b": 101.82299999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 136.8, "t": 214.48870999999997, "r": 538.4939, "b": 235.70154000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9466660022735596, "cells": [{"id": 4, "text": "Figure 3-5 shows the difference in the special register values when an adopted authority is ", "bbox": {"l": 136.8, "t": 214.48870999999997, "r": 538.4939, "b": 223.70172000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "used:", "bbox": {"l": 136.8, "t": 226.48852999999997, "r": 161.20995, "b": 235.70154000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "list_item", "bbox": {"l": 136.8, "t": 243.52808000000005, "r": 411.36139, "b": 252.74108999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9504424333572388, "cells": [{"id": 6, "text": "GLYPH<SM590000>", "bbox": {"l": 136.8, "t": 243.67749000000003, "r": 141.78, "b": 252.45227, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "A user connects to the server using the user profile ALICE.", "bbox": {"l": 151.20016, "t": 243.52808000000005, "r": 411.36139, "b": 252.74108999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "list_item", "bbox": {"l": 136.8, "t": 260.50787, "r": 453.2580899999999, "b": 269.72089000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9445974230766296, "cells": [{"id": 8, "text": "GLYPH<SM590000>", "bbox": {"l": 136.8, "t": 260.65729, "r": 141.78, "b": 269.43206999999995, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "USER and CURRENT USER initially have the same value of ALICE.", "bbox": {"l": 151.20016, "t": 260.50787, "r": 453.2580899999999, "b": 269.72089000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "list_item", "bbox": {"l": 136.8, "t": 277.48767, "r": 541.44983, "b": 298.7005, "coord_origin": "TOPLEFT"}, "confidence": 0.9742953777313232, "cells": [{"id": 10, "text": "GLYPH<SM590000>", "bbox": {"l": 136.8, "t": 277.63707999999997, "r": 141.78, "b": 286.41187, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "ALICE calls an SQL procedure that is named proc1, which is owned by user profile JOE ", "bbox": {"l": 151.20016, "t": 277.48767, "r": 541.44983, "b": 286.70068, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "and was created to adopt JOE\u2019s authority when it is called.", "bbox": {"l": 151.20016, "t": 289.4875200000001, "r": 409.82953, "b": 298.7005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "list_item", "bbox": {"l": 136.8, "t": 306.5271, "r": 547.21674, "b": 339.73972, "coord_origin": "TOPLEFT"}, "confidence": 0.981132447719574, "cells": [{"id": 13, "text": "GLYPH<SM590000>", "bbox": {"l": 136.8, "t": 306.67647999999997, "r": 141.78, "b": 315.45126000000005, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "While the procedure is running, the special register USER still contains the value of ALICE ", "bbox": {"l": 151.20016, "t": 306.5271, "r": 547.21674, "b": 315.74008, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "because it excludes any adopted authority. The special register CURRENT USER ", "bbox": {"l": 151.20117, "t": 318.52691999999996, "r": 514.32971, "b": 327.7399, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "contains the value of JOE because it includes any adopted authority.", "bbox": {"l": 151.20117, "t": 330.52673, "r": 453.3249200000001, "b": 339.73972, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "list_item", "bbox": {"l": 136.80101, "t": 347.50653, "r": 547.35406, "b": 368.71933000000007, "coord_origin": "TOPLEFT"}, "confidence": 0.9748278260231018, "cells": [{"id": 17, "text": "GLYPH<SM590000>", "bbox": {"l": 136.80101, "t": 347.65591, "r": 141.78101, "b": 356.43069, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "When proc1 ends, the session reverts to its original state with both USER and CURRENT ", "bbox": {"l": 151.20117, "t": 347.50653, "r": 547.35406, "b": 356.71950999999996, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "USER having the value of ALICE.", "bbox": {"l": 151.20117, "t": 359.50635, "r": 299.57532, "b": 368.71933000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "caption", "bbox": {"l": 136.8, "t": 596.7179, "r": 341.25662, "b": 605.04291, "coord_origin": "TOPLEFT"}, "confidence": 0.9274530410766602, "cells": [{"id": 20, "text": "Figure 3-5 Special registers and adopted authority", "bbox": {"l": 136.8, "t": 596.7179, "r": 341.25662, "b": 605.04291, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "section_header", "bbox": {"l": 64.800003, "t": 625.55472, "r": 247.02536, "b": 637.54272, "coord_origin": "TOPLEFT"}, "confidence": 0.9659212827682495, "cells": [{"id": 21, "text": "3.2.2", "bbox": {"l": 64.800003, "t": 625.55472, "r": 94.20356, "b": 637.54272, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "Built-in global variables", "bbox": {"l": 97.879005, "t": 625.55472, "r": 247.02536, "b": 637.54272, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "text", "bbox": {"l": 136.8, "t": 651.70872, "r": 518.00116, "b": 672.92153, "coord_origin": "TOPLEFT"}, "confidence": 0.9696778059005737, "cells": [{"id": 23, "text": "Built-in global variables are provided with the database manager and are used in SQL ", "bbox": {"l": 136.8, "t": 651.70872, "r": 518.00116, "b": 660.92172, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "statements to retrieve scalar values that are associated with the variables.", "bbox": {"l": 136.8, "t": 663.70853, "r": 462.81759999999997, "b": 672.92153, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 136.8, "t": 685.7281, "r": 532.3385, "b": 718.94072, "coord_origin": "TOPLEFT"}, "confidence": 0.978398323059082, "cells": [{"id": 25, "text": "IBM DB2 for i supports nine different built-in global variables that are read only and ", "bbox": {"l": 136.8, "t": 685.7281, "r": 504.44669, "b": 694.941101, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "maintained by the system. These global variables can be used to identify attributes of the ", "bbox": {"l": 136.8, "t": 697.727905, "r": 532.3385, "b": 706.94091, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "database connection and used as part of the RCAC logic.", "bbox": {"l": 136.8, "t": 709.727715, "r": 391.38257, "b": 718.94072, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "table", "bbox": {"l": 134.5462646484375, "t": 103.41889190673828, "r": 542.0460815429688, "b": 204.2716064453125, "coord_origin": "TOPLEFT"}, "confidence": 0.9731299877166748, "cells": [{"id": 28, "text": "Special register", "bbox": {"l": 142.8, "t": 110.53801999999985, "r": 209.67091, "b": 118.86298, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Corresponding value", "bbox": {"l": 230.18912000000003, "t": 110.53801999999985, "r": 319.93527, "b": 118.86298, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "USER or", "bbox": {"l": 142.80002, "t": 129.49834999999996, "r": 178.26361, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "SESSION_USER", "bbox": {"l": 142.80002, "t": 140.53864, "r": 212.70122, "b": 148.86359000000004, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "The effective user of the thread excluding adopted authority.", "bbox": {"l": 230.21973000000003, "t": 129.49834999999996, "r": 467.99069000000003, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "CURRENT_USER", "bbox": {"l": 142.80003, "t": 159.55835000000002, "r": 216.63962999999998, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "The effective user of the thread including adopted authority. When no adopted ", "bbox": {"l": 230.19814, "t": 159.55835000000002, "r": 535.65082, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "authority is present, this has the same value as USER.", "bbox": {"l": 230.22061, "t": 170.53832999999997, "r": 447.36533, "b": 178.86328000000003, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "SYSTEM_USER", "bbox": {"l": 142.8009, "t": 189.55804, "r": 209.7357, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "The authorization ID that initiated the connection.", "bbox": {"l": 230.2449, "t": 189.55804, "r": 425.64569, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}}], "children": [{"id": 26, "label": "text", "bbox": {"l": 142.8, "t": 110.53801999999985, "r": 209.67091, "b": 118.86298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "Special register", "bbox": {"l": 142.8, "t": 110.53801999999985, "r": 209.67091, "b": 118.86298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 230.18912000000003, "t": 110.53801999999985, "r": 319.93527, "b": 118.86298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "Corresponding value", "bbox": {"l": 230.18912000000003, "t": 110.53801999999985, "r": 319.93527, "b": 118.86298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 142.80002, "t": 129.49834999999996, "r": 178.26361, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "USER or", "bbox": {"l": 142.80002, "t": 129.49834999999996, "r": 178.26361, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 142.80002, "t": 140.53864, "r": 212.70122, "b": 148.86359000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "SESSION_USER", "bbox": {"l": 142.80002, "t": 140.53864, "r": 212.70122, "b": 148.86359000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 230.21973000000003, "t": 129.49834999999996, "r": 467.99069000000003, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "The effective user of the thread excluding adopted authority.", "bbox": {"l": 230.21973000000003, "t": 129.49834999999996, "r": 467.99069000000003, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 142.80003, "t": 159.55835000000002, "r": 216.63962999999998, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "CURRENT_USER", "bbox": {"l": 142.80003, "t": 159.55835000000002, "r": 216.63962999999998, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 230.19814, "t": 159.55835000000002, "r": 535.65082, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "The effective user of the thread including adopted authority. When no adopted ", "bbox": {"l": 230.19814, "t": 159.55835000000002, "r": 535.65082, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 230.22061, "t": 170.53832999999997, "r": 447.36533, "b": 178.86328000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "authority is present, this has the same value as USER.", "bbox": {"l": 230.22061, "t": 170.53832999999997, "r": 447.36533, "b": 178.86328000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 142.8009, "t": 189.55804, "r": 209.7357, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "SYSTEM_USER", "bbox": {"l": 142.8009, "t": 189.55804, "r": 209.7357, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 230.2449, "t": 189.55804, "r": 425.64569, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "The authorization ID that initiated the connection.", "bbox": {"l": 230.2449, "t": 189.55804, "r": 425.64569, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 16, "label": "picture", "bbox": {"l": 135.64837646484375, "t": 384.1737060546875, "r": 301.2367248535156, "b": 594.7566528320312, "coord_origin": "TOPLEFT"}, "confidence": 0.7221468687057495, "cells": [{"id": 38, "text": "SignedonasALICE", "bbox": {"l": 140.7323, "t": 386.98453, "r": 218.71170000000004, "b": 395.49527, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "Signed on as ALICE", "bbox": {"l": 140.7323, "t": 386.98453, "r": 216.40009, "b": 395.49527, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "USER = ALICE", "bbox": {"l": 138.476, "t": 410.87441999999993, "r": 191.70256, "b": 419.38516, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "CURRENT USER = ALICE", "bbox": {"l": 138.476, "t": 422.81934, "r": 232.56117, "b": 431.33008, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "CALL proc1", "bbox": {"l": 138.476, "t": 446.70923000000005, "r": 183.26944, "b": 455.21997, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "P1", "bbox": {"l": 148.4301, "t": 473.58524, "r": 184.17328, "b": 482.09598, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "Proc1:", "bbox": {"l": 148.4301, "t": 473.58524, "r": 174.05859, "b": 482.09598, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Owner = JOE", "bbox": {"l": 157.52185, "t": 485.53015, "r": 209.103, "b": 494.04089, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "SET OPTION USRPRF=*OWNER", "bbox": {"l": 157.52185, "t": 497.47507, "r": 281.68927, "b": 505.98581, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "USER = ALICE", "bbox": {"l": 148.4301, "t": 521.36493, "r": 201.65666, "b": 529.87567, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "CURRENT USER = JOE", "bbox": {"l": 148.4301, "t": 533.30984, "r": 234.57686999999999, "b": 541.82059, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "USER = ALICE", "bbox": {"l": 138.476, "t": 566.15842, "r": 191.70256, "b": 574.66917, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "CURRENT USER = ALICE", "bbox": {"l": 138.476, "t": 578.10333, "r": 232.56117, "b": 586.61409, "coord_origin": "TOPLEFT"}}], "children": [{"id": 15, "label": "text", "bbox": {"l": 140.7323, "t": 386.98453, "r": 218.71170000000004, "b": 395.49527, "coord_origin": "TOPLEFT"}, "confidence": 0.7616674304008484, "cells": [{"id": 38, "text": "SignedonasALICE", "bbox": {"l": 140.7323, "t": 386.98453, "r": 218.71170000000004, "b": 395.49527, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "Signed on as ALICE", "bbox": {"l": 140.7323, "t": 386.98453, "r": 216.40009, "b": 395.49527, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 138.476, "t": 410.87441999999993, "r": 191.70256, "b": 419.38516, "coord_origin": "TOPLEFT"}, "confidence": 0.5373895764350891, "cells": [{"id": 40, "text": "USER = ALICE", "bbox": {"l": 138.476, "t": 410.87441999999993, "r": 191.70256, "b": 419.38516, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 138.476, "t": 422.81934, "r": 232.56117, "b": 431.33008, "coord_origin": "TOPLEFT"}, "confidence": 0.5213791728019714, "cells": [{"id": 41, "text": "CURRENT USER = ALICE", "bbox": {"l": 138.476, "t": 422.81934, "r": 232.56117, "b": 431.33008, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 138.476, "t": 446.70923000000005, "r": 183.26944, "b": 455.21997, "coord_origin": "TOPLEFT"}, "confidence": 0.6404178142547607, "cells": [{"id": 42, "text": "CALL proc1", "bbox": {"l": 138.476, "t": 446.70923000000005, "r": 183.26944, "b": 455.21997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 148.4301, "t": 473.58524, "r": 184.17328, "b": 482.09598, "coord_origin": "TOPLEFT"}, "confidence": 0.5759297609329224, "cells": [{"id": 43, "text": "P1", "bbox": {"l": 148.4301, "t": 473.58524, "r": 184.17328, "b": 482.09598, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "Proc1:", "bbox": {"l": 148.4301, "t": 473.58524, "r": 174.05859, "b": 482.09598, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 157.52185, "t": 485.53015, "r": 209.103, "b": 494.04089, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "Owner = JOE", "bbox": {"l": 157.52185, "t": 485.53015, "r": 209.103, "b": 494.04089, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 157.52185, "t": 497.47507, "r": 281.68927, "b": 505.98581, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "SET OPTION USRPRF=*OWNER", "bbox": {"l": 157.52185, "t": 497.47507, "r": 281.68927, "b": 505.98581, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 148.4301, "t": 521.36493, "r": 201.65666, "b": 529.87567, "coord_origin": "TOPLEFT"}, "confidence": 0.5350866913795471, "cells": [{"id": 47, "text": "USER = ALICE", "bbox": {"l": 148.4301, "t": 521.36493, "r": 201.65666, "b": 529.87567, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 148.4301, "t": 533.30984, "r": 234.57686999999999, "b": 541.82059, "coord_origin": "TOPLEFT"}, "confidence": 0.5008324384689331, "cells": [{"id": 48, "text": "CURRENT USER = JOE", "bbox": {"l": 148.4301, "t": 533.30984, "r": 234.57686999999999, "b": 541.82059, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 138.476, "t": 566.15842, "r": 232.56117, "b": 586.61409, "coord_origin": "TOPLEFT"}, "confidence": 0.5024971961975098, "cells": [{"id": 49, "text": "USER = ALICE", "bbox": {"l": 138.476, "t": 566.15842, "r": 191.70256, "b": 574.66917, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "CURRENT USER = ALICE", "bbox": {"l": 138.476, "t": 578.10333, "r": 232.56117, "b": 586.61409, "coord_origin": "TOPLEFT"}}], "children": []}]}]}, "tablestructure": {"table_map": {"4": {"label": "table", "id": 4, "page_no": 10, "cluster": {"id": 4, "label": "table", "bbox": {"l": 134.5462646484375, "t": 103.41889190673828, "r": 542.0460815429688, "b": 204.2716064453125, "coord_origin": "TOPLEFT"}, "confidence": 0.9731299877166748, "cells": [{"id": 28, "text": "Special register", "bbox": {"l": 142.8, "t": 110.53801999999985, "r": 209.67091, "b": 118.86298, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Corresponding value", "bbox": {"l": 230.18912000000003, "t": 110.53801999999985, "r": 319.93527, "b": 118.86298, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "USER or", "bbox": {"l": 142.80002, "t": 129.49834999999996, "r": 178.26361, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "SESSION_USER", "bbox": {"l": 142.80002, "t": 140.53864, "r": 212.70122, "b": 148.86359000000004, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "The effective user of the thread excluding adopted authority.", "bbox": {"l": 230.21973000000003, "t": 129.49834999999996, "r": 467.99069000000003, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "CURRENT_USER", "bbox": {"l": 142.80003, "t": 159.55835000000002, "r": 216.63962999999998, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "The effective user of the thread including adopted authority. When no adopted ", "bbox": {"l": 230.19814, "t": 159.55835000000002, "r": 535.65082, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "authority is present, this has the same value as USER.", "bbox": {"l": 230.22061, "t": 170.53832999999997, "r": 447.36533, "b": 178.86328000000003, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "SYSTEM_USER", "bbox": {"l": 142.8009, "t": 189.55804, "r": 209.7357, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "The authorization ID that initiated the connection.", "bbox": {"l": 230.2449, "t": 189.55804, "r": 425.64569, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}}], "children": [{"id": 26, "label": "text", "bbox": {"l": 142.8, "t": 110.53801999999985, "r": 209.67091, "b": 118.86298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "Special register", "bbox": {"l": 142.8, "t": 110.53801999999985, "r": 209.67091, "b": 118.86298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 230.18912000000003, "t": 110.53801999999985, "r": 319.93527, "b": 118.86298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "Corresponding value", "bbox": {"l": 230.18912000000003, "t": 110.53801999999985, "r": 319.93527, "b": 118.86298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 142.80002, "t": 129.49834999999996, "r": 178.26361, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "USER or", "bbox": {"l": 142.80002, "t": 129.49834999999996, "r": 178.26361, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 142.80002, "t": 140.53864, "r": 212.70122, "b": 148.86359000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "SESSION_USER", "bbox": {"l": 142.80002, "t": 140.53864, "r": 212.70122, "b": 148.86359000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 230.21973000000003, "t": 129.49834999999996, "r": 467.99069000000003, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "The effective user of the thread excluding adopted authority.", "bbox": {"l": 230.21973000000003, "t": 129.49834999999996, "r": 467.99069000000003, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 142.80003, "t": 159.55835000000002, "r": 216.63962999999998, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "CURRENT_USER", "bbox": {"l": 142.80003, "t": 159.55835000000002, "r": 216.63962999999998, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 230.19814, "t": 159.55835000000002, "r": 535.65082, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "The effective user of the thread including adopted authority. When no adopted ", "bbox": {"l": 230.19814, "t": 159.55835000000002, "r": 535.65082, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 230.22061, "t": 170.53832999999997, "r": 447.36533, "b": 178.86328000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "authority is present, this has the same value as USER.", "bbox": {"l": 230.22061, "t": 170.53832999999997, "r": 447.36533, "b": 178.86328000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 142.8009, "t": 189.55804, "r": 209.7357, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "SYSTEM_USER", "bbox": {"l": 142.8009, "t": 189.55804, "r": 209.7357, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 230.2449, "t": 189.55804, "r": 425.64569, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "The authorization ID that initiated the connection.", "bbox": {"l": 230.2449, "t": 189.55804, "r": 425.64569, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 4, "num_cols": 2, "table_cells": [{"bbox": {"l": 142.8, "t": 110.53801999999985, "r": 209.67091, "b": 118.86298, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Special register", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 230.18912000000003, "t": 110.53801999999985, "r": 319.93527, "b": 118.86298, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Corresponding value", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 142.80002, "t": 129.49834999999996, "r": 212.70122, "b": 148.86359000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "USER or SESSION_USER", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 230.21973000000003, "t": 129.49834999999996, "r": 467.99069000000003, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "The effective user of the thread excluding adopted authority.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 142.80003, "t": 159.55835000000002, "r": 216.63962999999998, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "CURRENT_USER", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 230.19814, "t": 159.55835000000002, "r": 535.65082, "b": 178.86328000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "The effective user of the thread including adopted authority. When no adopted  authority is present, this has the same value as USER.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 142.8009, "t": 189.55804, "r": 209.7357, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "SYSTEM_USER", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 230.2449, "t": 189.55804, "r": 425.64569, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "The authorization ID that initiated the connection.", "column_header": false, "row_header": false, "row_section": false}]}}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_footer", "id": 7, "page_no": 10, "cluster": {"id": 7, "label": "page_footer", "bbox": {"l": 344.94, "t": 755.538002, "r": 523.60162, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9557498693466187, "cells": [{"id": 0, "text": "Chapter 3. Row and Column Access Control ", "bbox": {"l": 344.94, "t": 755.538002, "r": 523.60162, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Chapter 3. Row and Column Access Control"}, {"label": "page_footer", "id": 13, "page_no": 10, "cluster": {"id": 13, "label": "page_footer", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.9130511283874512, "cells": [{"id": 1, "text": "19", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "19"}, {"label": "caption", "id": 14, "page_no": 10, "cluster": {"id": 14, "label": "caption", "bbox": {"l": 136.79959, "t": 71.50903000000005, "r": 412.20758, "b": 80.72204999999985, "coord_origin": "TOPLEFT"}, "confidence": 0.7875156402587891, "cells": [{"id": 2, "text": "Table 3-1 summarizes these special registers and their values.", "bbox": {"l": 136.79959, "t": 71.50903000000005, "r": 412.20758, "b": 80.72204999999985, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 3-1 summarizes these special registers and their values."}, {"label": "caption", "id": 12, "page_no": 10, "cluster": {"id": 12, "label": "caption", "bbox": {"l": 136.8, "t": 93.49805000000003, "r": 372.60364, "b": 101.82299999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.9253708720207214, "cells": [{"id": 3, "text": "Table 3-1 Special registers and their corresponding values", "bbox": {"l": 136.8, "t": 93.49805000000003, "r": 372.60364, "b": 101.82299999999998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 3-1 Special registers and their corresponding values"}, {"label": "text", "id": 9, "page_no": 10, "cluster": {"id": 9, "label": "text", "bbox": {"l": 136.8, "t": 214.48870999999997, "r": 538.4939, "b": 235.70154000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9466660022735596, "cells": [{"id": 4, "text": "Figure 3-5 shows the difference in the special register values when an adopted authority is ", "bbox": {"l": 136.8, "t": 214.48870999999997, "r": 538.4939, "b": 223.70172000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "used:", "bbox": {"l": 136.8, "t": 226.48852999999997, "r": 161.20995, "b": 235.70154000000002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 3-5 shows the difference in the special register values when an adopted authority is used:"}, {"label": "list_item", "id": 8, "page_no": 10, "cluster": {"id": 8, "label": "list_item", "bbox": {"l": 136.8, "t": 243.52808000000005, "r": 411.36139, "b": 252.74108999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9504424333572388, "cells": [{"id": 6, "text": "GLYPH<SM590000>", "bbox": {"l": 136.8, "t": 243.67749000000003, "r": 141.78, "b": 252.45227, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "A user connects to the server using the user profile ALICE.", "bbox": {"l": 151.20016, "t": 243.52808000000005, "r": 411.36139, "b": 252.74108999999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<SM590000> A user connects to the server using the user profile ALICE."}, {"label": "list_item", "id": 10, "page_no": 10, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 136.8, "t": 260.50787, "r": 453.2580899999999, "b": 269.72089000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9445974230766296, "cells": [{"id": 8, "text": "GLYPH<SM590000>", "bbox": {"l": 136.8, "t": 260.65729, "r": 141.78, "b": 269.43206999999995, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "USER and CURRENT USER initially have the same value of ALICE.", "bbox": {"l": 151.20016, "t": 260.50787, "r": 453.2580899999999, "b": 269.72089000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<SM590000> USER and CURRENT USER initially have the same value of ALICE."}, {"label": "list_item", "id": 3, "page_no": 10, "cluster": {"id": 3, "label": "list_item", "bbox": {"l": 136.8, "t": 277.48767, "r": 541.44983, "b": 298.7005, "coord_origin": "TOPLEFT"}, "confidence": 0.9742953777313232, "cells": [{"id": 10, "text": "GLYPH<SM590000>", "bbox": {"l": 136.8, "t": 277.63707999999997, "r": 141.78, "b": 286.41187, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "ALICE calls an SQL procedure that is named proc1, which is owned by user profile JOE ", "bbox": {"l": 151.20016, "t": 277.48767, "r": 541.44983, "b": 286.70068, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "and was created to adopt JOE\u2019s authority when it is called.", "bbox": {"l": 151.20016, "t": 289.4875200000001, "r": 409.82953, "b": 298.7005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<SM590000> ALICE calls an SQL procedure that is named proc1, which is owned by user profile JOE and was created to adopt JOE\u2019s authority when it is called."}, {"label": "list_item", "id": 0, "page_no": 10, "cluster": {"id": 0, "label": "list_item", "bbox": {"l": 136.8, "t": 306.5271, "r": 547.21674, "b": 339.73972, "coord_origin": "TOPLEFT"}, "confidence": 0.981132447719574, "cells": [{"id": 13, "text": "GLYPH<SM590000>", "bbox": {"l": 136.8, "t": 306.67647999999997, "r": 141.78, "b": 315.45126000000005, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "While the procedure is running, the special register USER still contains the value of ALICE ", "bbox": {"l": 151.20016, "t": 306.5271, "r": 547.21674, "b": 315.74008, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "because it excludes any adopted authority. The special register CURRENT USER ", "bbox": {"l": 151.20117, "t": 318.52691999999996, "r": 514.32971, "b": 327.7399, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "contains the value of JOE because it includes any adopted authority.", "bbox": {"l": 151.20117, "t": 330.52673, "r": 453.3249200000001, "b": 339.73972, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<SM590000> While the procedure is running, the special register USER still contains the value of ALICE because it excludes any adopted authority. The special register CURRENT USER contains the value of JOE because it includes any adopted authority."}, {"label": "list_item", "id": 2, "page_no": 10, "cluster": {"id": 2, "label": "list_item", "bbox": {"l": 136.80101, "t": 347.50653, "r": 547.35406, "b": 368.71933000000007, "coord_origin": "TOPLEFT"}, "confidence": 0.9748278260231018, "cells": [{"id": 17, "text": "GLYPH<SM590000>", "bbox": {"l": 136.80101, "t": 347.65591, "r": 141.78101, "b": 356.43069, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "When proc1 ends, the session reverts to its original state with both USER and CURRENT ", "bbox": {"l": 151.20117, "t": 347.50653, "r": 547.35406, "b": 356.71950999999996, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "USER having the value of ALICE.", "bbox": {"l": 151.20117, "t": 359.50635, "r": 299.57532, "b": 368.71933000000007, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<SM590000> When proc1 ends, the session reverts to its original state with both USER and CURRENT USER having the value of ALICE."}, {"label": "caption", "id": 11, "page_no": 10, "cluster": {"id": 11, "label": "caption", "bbox": {"l": 136.8, "t": 596.7179, "r": 341.25662, "b": 605.04291, "coord_origin": "TOPLEFT"}, "confidence": 0.9274530410766602, "cells": [{"id": 20, "text": "Figure 3-5 Special registers and adopted authority", "bbox": {"l": 136.8, "t": 596.7179, "r": 341.25662, "b": 605.04291, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 3-5 Special registers and adopted authority"}, {"label": "section_header", "id": 6, "page_no": 10, "cluster": {"id": 6, "label": "section_header", "bbox": {"l": 64.800003, "t": 625.55472, "r": 247.02536, "b": 637.54272, "coord_origin": "TOPLEFT"}, "confidence": 0.9659212827682495, "cells": [{"id": 21, "text": "3.2.2", "bbox": {"l": 64.800003, "t": 625.55472, "r": 94.20356, "b": 637.54272, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "Built-in global variables", "bbox": {"l": 97.879005, "t": 625.55472, "r": 247.02536, "b": 637.54272, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3.2.2 Built-in global variables"}, {"label": "text", "id": 5, "page_no": 10, "cluster": {"id": 5, "label": "text", "bbox": {"l": 136.8, "t": 651.70872, "r": 518.00116, "b": 672.92153, "coord_origin": "TOPLEFT"}, "confidence": 0.9696778059005737, "cells": [{"id": 23, "text": "Built-in global variables are provided with the database manager and are used in SQL ", "bbox": {"l": 136.8, "t": 651.70872, "r": 518.00116, "b": 660.92172, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "statements to retrieve scalar values that are associated with the variables.", "bbox": {"l": 136.8, "t": 663.70853, "r": 462.81759999999997, "b": 672.92153, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Built-in global variables are provided with the database manager and are used in SQL statements to retrieve scalar values that are associated with the variables."}, {"label": "text", "id": 1, "page_no": 10, "cluster": {"id": 1, "label": "text", "bbox": {"l": 136.8, "t": 685.7281, "r": 532.3385, "b": 718.94072, "coord_origin": "TOPLEFT"}, "confidence": 0.978398323059082, "cells": [{"id": 25, "text": "IBM DB2 for i supports nine different built-in global variables that are read only and ", "bbox": {"l": 136.8, "t": 685.7281, "r": 504.44669, "b": 694.941101, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "maintained by the system. These global variables can be used to identify attributes of the ", "bbox": {"l": 136.8, "t": 697.727905, "r": 532.3385, "b": 706.94091, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "database connection and used as part of the RCAC logic.", "bbox": {"l": 136.8, "t": 709.727715, "r": 391.38257, "b": 718.94072, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "IBM DB2 for i supports nine different built-in global variables that are read only and maintained by the system. These global variables can be used to identify attributes of the database connection and used as part of the RCAC logic."}, {"label": "table", "id": 4, "page_no": 10, "cluster": {"id": 4, "label": "table", "bbox": {"l": 134.5462646484375, "t": 103.41889190673828, "r": 542.0460815429688, "b": 204.2716064453125, "coord_origin": "TOPLEFT"}, "confidence": 0.9731299877166748, "cells": [{"id": 28, "text": "Special register", "bbox": {"l": 142.8, "t": 110.53801999999985, "r": 209.67091, "b": 118.86298, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Corresponding value", "bbox": {"l": 230.18912000000003, "t": 110.53801999999985, "r": 319.93527, "b": 118.86298, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "USER or", "bbox": {"l": 142.80002, "t": 129.49834999999996, "r": 178.26361, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "SESSION_USER", "bbox": {"l": 142.80002, "t": 140.53864, "r": 212.70122, "b": 148.86359000000004, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "The effective user of the thread excluding adopted authority.", "bbox": {"l": 230.21973000000003, "t": 129.49834999999996, "r": 467.99069000000003, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "CURRENT_USER", "bbox": {"l": 142.80003, "t": 159.55835000000002, "r": 216.63962999999998, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "The effective user of the thread including adopted authority. When no adopted ", "bbox": {"l": 230.19814, "t": 159.55835000000002, "r": 535.65082, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "authority is present, this has the same value as USER.", "bbox": {"l": 230.22061, "t": 170.53832999999997, "r": 447.36533, "b": 178.86328000000003, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "SYSTEM_USER", "bbox": {"l": 142.8009, "t": 189.55804, "r": 209.7357, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "The authorization ID that initiated the connection.", "bbox": {"l": 230.2449, "t": 189.55804, "r": 425.64569, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}}], "children": [{"id": 26, "label": "text", "bbox": {"l": 142.8, "t": 110.53801999999985, "r": 209.67091, "b": 118.86298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "Special register", "bbox": {"l": 142.8, "t": 110.53801999999985, "r": 209.67091, "b": 118.86298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 230.18912000000003, "t": 110.53801999999985, "r": 319.93527, "b": 118.86298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "Corresponding value", "bbox": {"l": 230.18912000000003, "t": 110.53801999999985, "r": 319.93527, "b": 118.86298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 142.80002, "t": 129.49834999999996, "r": 178.26361, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "USER or", "bbox": {"l": 142.80002, "t": 129.49834999999996, "r": 178.26361, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 142.80002, "t": 140.53864, "r": 212.70122, "b": 148.86359000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "SESSION_USER", "bbox": {"l": 142.80002, "t": 140.53864, "r": 212.70122, "b": 148.86359000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 230.21973000000003, "t": 129.49834999999996, "r": 467.99069000000003, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "The effective user of the thread excluding adopted authority.", "bbox": {"l": 230.21973000000003, "t": 129.49834999999996, "r": 467.99069000000003, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 142.80003, "t": 159.55835000000002, "r": 216.63962999999998, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "CURRENT_USER", "bbox": {"l": 142.80003, "t": 159.55835000000002, "r": 216.63962999999998, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 230.19814, "t": 159.55835000000002, "r": 535.65082, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "The effective user of the thread including adopted authority. When no adopted ", "bbox": {"l": 230.19814, "t": 159.55835000000002, "r": 535.65082, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 230.22061, "t": 170.53832999999997, "r": 447.36533, "b": 178.86328000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "authority is present, this has the same value as USER.", "bbox": {"l": 230.22061, "t": 170.53832999999997, "r": 447.36533, "b": 178.86328000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 142.8009, "t": 189.55804, "r": 209.7357, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "SYSTEM_USER", "bbox": {"l": 142.8009, "t": 189.55804, "r": 209.7357, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 230.2449, "t": 189.55804, "r": 425.64569, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "The authorization ID that initiated the connection.", "bbox": {"l": 230.2449, "t": 189.55804, "r": 425.64569, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 4, "num_cols": 2, "table_cells": [{"bbox": {"l": 142.8, "t": 110.53801999999985, "r": 209.67091, "b": 118.86298, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Special register", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 230.18912000000003, "t": 110.53801999999985, "r": 319.93527, "b": 118.86298, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Corresponding value", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 142.80002, "t": 129.49834999999996, "r": 212.70122, "b": 148.86359000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "USER or SESSION_USER", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 230.21973000000003, "t": 129.49834999999996, "r": 467.99069000000003, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "The effective user of the thread excluding adopted authority.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 142.80003, "t": 159.55835000000002, "r": 216.63962999999998, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "CURRENT_USER", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 230.19814, "t": 159.55835000000002, "r": 535.65082, "b": 178.86328000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "The effective user of the thread including adopted authority. When no adopted  authority is present, this has the same value as USER.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 142.8009, "t": 189.55804, "r": 209.7357, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "SYSTEM_USER", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 230.2449, "t": 189.55804, "r": 425.64569, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "The authorization ID that initiated the connection.", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "picture", "id": 16, "page_no": 10, "cluster": {"id": 16, "label": "picture", "bbox": {"l": 135.64837646484375, "t": 384.1737060546875, "r": 301.2367248535156, "b": 594.7566528320312, "coord_origin": "TOPLEFT"}, "confidence": 0.7221468687057495, "cells": [{"id": 38, "text": "SignedonasALICE", "bbox": {"l": 140.7323, "t": 386.98453, "r": 218.71170000000004, "b": 395.49527, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "Signed on as ALICE", "bbox": {"l": 140.7323, "t": 386.98453, "r": 216.40009, "b": 395.49527, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "USER = ALICE", "bbox": {"l": 138.476, "t": 410.87441999999993, "r": 191.70256, "b": 419.38516, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "CURRENT USER = ALICE", "bbox": {"l": 138.476, "t": 422.81934, "r": 232.56117, "b": 431.33008, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "CALL proc1", "bbox": {"l": 138.476, "t": 446.70923000000005, "r": 183.26944, "b": 455.21997, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "P1", "bbox": {"l": 148.4301, "t": 473.58524, "r": 184.17328, "b": 482.09598, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "Proc1:", "bbox": {"l": 148.4301, "t": 473.58524, "r": 174.05859, "b": 482.09598, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Owner = JOE", "bbox": {"l": 157.52185, "t": 485.53015, "r": 209.103, "b": 494.04089, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "SET OPTION USRPRF=*OWNER", "bbox": {"l": 157.52185, "t": 497.47507, "r": 281.68927, "b": 505.98581, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "USER = ALICE", "bbox": {"l": 148.4301, "t": 521.36493, "r": 201.65666, "b": 529.87567, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "CURRENT USER = JOE", "bbox": {"l": 148.4301, "t": 533.30984, "r": 234.57686999999999, "b": 541.82059, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "USER = ALICE", "bbox": {"l": 138.476, "t": 566.15842, "r": 191.70256, "b": 574.66917, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "CURRENT USER = ALICE", "bbox": {"l": 138.476, "t": 578.10333, "r": 232.56117, "b": 586.61409, "coord_origin": "TOPLEFT"}}], "children": [{"id": 15, "label": "text", "bbox": {"l": 140.7323, "t": 386.98453, "r": 218.71170000000004, "b": 395.49527, "coord_origin": "TOPLEFT"}, "confidence": 0.7616674304008484, "cells": [{"id": 38, "text": "SignedonasALICE", "bbox": {"l": 140.7323, "t": 386.98453, "r": 218.71170000000004, "b": 395.49527, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "Signed on as ALICE", "bbox": {"l": 140.7323, "t": 386.98453, "r": 216.40009, "b": 395.49527, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 138.476, "t": 410.87441999999993, "r": 191.70256, "b": 419.38516, "coord_origin": "TOPLEFT"}, "confidence": 0.5373895764350891, "cells": [{"id": 40, "text": "USER = ALICE", "bbox": {"l": 138.476, "t": 410.87441999999993, "r": 191.70256, "b": 419.38516, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 138.476, "t": 422.81934, "r": 232.56117, "b": 431.33008, "coord_origin": "TOPLEFT"}, "confidence": 0.5213791728019714, "cells": [{"id": 41, "text": "CURRENT USER = ALICE", "bbox": {"l": 138.476, "t": 422.81934, "r": 232.56117, "b": 431.33008, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 138.476, "t": 446.70923000000005, "r": 183.26944, "b": 455.21997, "coord_origin": "TOPLEFT"}, "confidence": 0.6404178142547607, "cells": [{"id": 42, "text": "CALL proc1", "bbox": {"l": 138.476, "t": 446.70923000000005, "r": 183.26944, "b": 455.21997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 148.4301, "t": 473.58524, "r": 184.17328, "b": 482.09598, "coord_origin": "TOPLEFT"}, "confidence": 0.5759297609329224, "cells": [{"id": 43, "text": "P1", "bbox": {"l": 148.4301, "t": 473.58524, "r": 184.17328, "b": 482.09598, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "Proc1:", "bbox": {"l": 148.4301, "t": 473.58524, "r": 174.05859, "b": 482.09598, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 157.52185, "t": 485.53015, "r": 209.103, "b": 494.04089, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "Owner = JOE", "bbox": {"l": 157.52185, "t": 485.53015, "r": 209.103, "b": 494.04089, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 157.52185, "t": 497.47507, "r": 281.68927, "b": 505.98581, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "SET OPTION USRPRF=*OWNER", "bbox": {"l": 157.52185, "t": 497.47507, "r": 281.68927, "b": 505.98581, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 148.4301, "t": 521.36493, "r": 201.65666, "b": 529.87567, "coord_origin": "TOPLEFT"}, "confidence": 0.5350866913795471, "cells": [{"id": 47, "text": "USER = ALICE", "bbox": {"l": 148.4301, "t": 521.36493, "r": 201.65666, "b": 529.87567, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 148.4301, "t": 533.30984, "r": 234.57686999999999, "b": 541.82059, "coord_origin": "TOPLEFT"}, "confidence": 0.5008324384689331, "cells": [{"id": 48, "text": "CURRENT USER = JOE", "bbox": {"l": 148.4301, "t": 533.30984, "r": 234.57686999999999, "b": 541.82059, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 138.476, "t": 566.15842, "r": 232.56117, "b": 586.61409, "coord_origin": "TOPLEFT"}, "confidence": 0.5024971961975098, "cells": [{"id": 49, "text": "USER = ALICE", "bbox": {"l": 138.476, "t": 566.15842, "r": 191.70256, "b": 574.66917, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "CURRENT USER = ALICE", "bbox": {"l": 138.476, "t": 578.10333, "r": 232.56117, "b": 586.61409, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "body": [{"label": "caption", "id": 14, "page_no": 10, "cluster": {"id": 14, "label": "caption", "bbox": {"l": 136.79959, "t": 71.50903000000005, "r": 412.20758, "b": 80.72204999999985, "coord_origin": "TOPLEFT"}, "confidence": 0.7875156402587891, "cells": [{"id": 2, "text": "Table 3-1 summarizes these special registers and their values.", "bbox": {"l": 136.79959, "t": 71.50903000000005, "r": 412.20758, "b": 80.72204999999985, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 3-1 summarizes these special registers and their values."}, {"label": "caption", "id": 12, "page_no": 10, "cluster": {"id": 12, "label": "caption", "bbox": {"l": 136.8, "t": 93.49805000000003, "r": 372.60364, "b": 101.82299999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.9253708720207214, "cells": [{"id": 3, "text": "Table 3-1 Special registers and their corresponding values", "bbox": {"l": 136.8, "t": 93.49805000000003, "r": 372.60364, "b": 101.82299999999998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 3-1 Special registers and their corresponding values"}, {"label": "text", "id": 9, "page_no": 10, "cluster": {"id": 9, "label": "text", "bbox": {"l": 136.8, "t": 214.48870999999997, "r": 538.4939, "b": 235.70154000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9466660022735596, "cells": [{"id": 4, "text": "Figure 3-5 shows the difference in the special register values when an adopted authority is ", "bbox": {"l": 136.8, "t": 214.48870999999997, "r": 538.4939, "b": 223.70172000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "used:", "bbox": {"l": 136.8, "t": 226.48852999999997, "r": 161.20995, "b": 235.70154000000002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 3-5 shows the difference in the special register values when an adopted authority is used:"}, {"label": "list_item", "id": 8, "page_no": 10, "cluster": {"id": 8, "label": "list_item", "bbox": {"l": 136.8, "t": 243.52808000000005, "r": 411.36139, "b": 252.74108999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9504424333572388, "cells": [{"id": 6, "text": "GLYPH<SM590000>", "bbox": {"l": 136.8, "t": 243.67749000000003, "r": 141.78, "b": 252.45227, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "A user connects to the server using the user profile ALICE.", "bbox": {"l": 151.20016, "t": 243.52808000000005, "r": 411.36139, "b": 252.74108999999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<SM590000> A user connects to the server using the user profile ALICE."}, {"label": "list_item", "id": 10, "page_no": 10, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 136.8, "t": 260.50787, "r": 453.2580899999999, "b": 269.72089000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9445974230766296, "cells": [{"id": 8, "text": "GLYPH<SM590000>", "bbox": {"l": 136.8, "t": 260.65729, "r": 141.78, "b": 269.43206999999995, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "USER and CURRENT USER initially have the same value of ALICE.", "bbox": {"l": 151.20016, "t": 260.50787, "r": 453.2580899999999, "b": 269.72089000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<SM590000> USER and CURRENT USER initially have the same value of ALICE."}, {"label": "list_item", "id": 3, "page_no": 10, "cluster": {"id": 3, "label": "list_item", "bbox": {"l": 136.8, "t": 277.48767, "r": 541.44983, "b": 298.7005, "coord_origin": "TOPLEFT"}, "confidence": 0.9742953777313232, "cells": [{"id": 10, "text": "GLYPH<SM590000>", "bbox": {"l": 136.8, "t": 277.63707999999997, "r": 141.78, "b": 286.41187, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "ALICE calls an SQL procedure that is named proc1, which is owned by user profile JOE ", "bbox": {"l": 151.20016, "t": 277.48767, "r": 541.44983, "b": 286.70068, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "and was created to adopt JOE\u2019s authority when it is called.", "bbox": {"l": 151.20016, "t": 289.4875200000001, "r": 409.82953, "b": 298.7005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<SM590000> ALICE calls an SQL procedure that is named proc1, which is owned by user profile JOE and was created to adopt JOE\u2019s authority when it is called."}, {"label": "list_item", "id": 0, "page_no": 10, "cluster": {"id": 0, "label": "list_item", "bbox": {"l": 136.8, "t": 306.5271, "r": 547.21674, "b": 339.73972, "coord_origin": "TOPLEFT"}, "confidence": 0.981132447719574, "cells": [{"id": 13, "text": "GLYPH<SM590000>", "bbox": {"l": 136.8, "t": 306.67647999999997, "r": 141.78, "b": 315.45126000000005, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "While the procedure is running, the special register USER still contains the value of ALICE ", "bbox": {"l": 151.20016, "t": 306.5271, "r": 547.21674, "b": 315.74008, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "because it excludes any adopted authority. The special register CURRENT USER ", "bbox": {"l": 151.20117, "t": 318.52691999999996, "r": 514.32971, "b": 327.7399, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "contains the value of JOE because it includes any adopted authority.", "bbox": {"l": 151.20117, "t": 330.52673, "r": 453.3249200000001, "b": 339.73972, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<SM590000> While the procedure is running, the special register USER still contains the value of ALICE because it excludes any adopted authority. The special register CURRENT USER contains the value of JOE because it includes any adopted authority."}, {"label": "list_item", "id": 2, "page_no": 10, "cluster": {"id": 2, "label": "list_item", "bbox": {"l": 136.80101, "t": 347.50653, "r": 547.35406, "b": 368.71933000000007, "coord_origin": "TOPLEFT"}, "confidence": 0.9748278260231018, "cells": [{"id": 17, "text": "GLYPH<SM590000>", "bbox": {"l": 136.80101, "t": 347.65591, "r": 141.78101, "b": 356.43069, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "When proc1 ends, the session reverts to its original state with both USER and CURRENT ", "bbox": {"l": 151.20117, "t": 347.50653, "r": 547.35406, "b": 356.71950999999996, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "USER having the value of ALICE.", "bbox": {"l": 151.20117, "t": 359.50635, "r": 299.57532, "b": 368.71933000000007, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<SM590000> When proc1 ends, the session reverts to its original state with both USER and CURRENT USER having the value of ALICE."}, {"label": "caption", "id": 11, "page_no": 10, "cluster": {"id": 11, "label": "caption", "bbox": {"l": 136.8, "t": 596.7179, "r": 341.25662, "b": 605.04291, "coord_origin": "TOPLEFT"}, "confidence": 0.9274530410766602, "cells": [{"id": 20, "text": "Figure 3-5 Special registers and adopted authority", "bbox": {"l": 136.8, "t": 596.7179, "r": 341.25662, "b": 605.04291, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 3-5 Special registers and adopted authority"}, {"label": "section_header", "id": 6, "page_no": 10, "cluster": {"id": 6, "label": "section_header", "bbox": {"l": 64.800003, "t": 625.55472, "r": 247.02536, "b": 637.54272, "coord_origin": "TOPLEFT"}, "confidence": 0.9659212827682495, "cells": [{"id": 21, "text": "3.2.2", "bbox": {"l": 64.800003, "t": 625.55472, "r": 94.20356, "b": 637.54272, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "Built-in global variables", "bbox": {"l": 97.879005, "t": 625.55472, "r": 247.02536, "b": 637.54272, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3.2.2 Built-in global variables"}, {"label": "text", "id": 5, "page_no": 10, "cluster": {"id": 5, "label": "text", "bbox": {"l": 136.8, "t": 651.70872, "r": 518.00116, "b": 672.92153, "coord_origin": "TOPLEFT"}, "confidence": 0.9696778059005737, "cells": [{"id": 23, "text": "Built-in global variables are provided with the database manager and are used in SQL ", "bbox": {"l": 136.8, "t": 651.70872, "r": 518.00116, "b": 660.92172, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "statements to retrieve scalar values that are associated with the variables.", "bbox": {"l": 136.8, "t": 663.70853, "r": 462.81759999999997, "b": 672.92153, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Built-in global variables are provided with the database manager and are used in SQL statements to retrieve scalar values that are associated with the variables."}, {"label": "text", "id": 1, "page_no": 10, "cluster": {"id": 1, "label": "text", "bbox": {"l": 136.8, "t": 685.7281, "r": 532.3385, "b": 718.94072, "coord_origin": "TOPLEFT"}, "confidence": 0.978398323059082, "cells": [{"id": 25, "text": "IBM DB2 for i supports nine different built-in global variables that are read only and ", "bbox": {"l": 136.8, "t": 685.7281, "r": 504.44669, "b": 694.941101, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "maintained by the system. These global variables can be used to identify attributes of the ", "bbox": {"l": 136.8, "t": 697.727905, "r": 532.3385, "b": 706.94091, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "database connection and used as part of the RCAC logic.", "bbox": {"l": 136.8, "t": 709.727715, "r": 391.38257, "b": 718.94072, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "IBM DB2 for i supports nine different built-in global variables that are read only and maintained by the system. These global variables can be used to identify attributes of the database connection and used as part of the RCAC logic."}, {"label": "table", "id": 4, "page_no": 10, "cluster": {"id": 4, "label": "table", "bbox": {"l": 134.5462646484375, "t": 103.41889190673828, "r": 542.0460815429688, "b": 204.2716064453125, "coord_origin": "TOPLEFT"}, "confidence": 0.9731299877166748, "cells": [{"id": 28, "text": "Special register", "bbox": {"l": 142.8, "t": 110.53801999999985, "r": 209.67091, "b": 118.86298, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Corresponding value", "bbox": {"l": 230.18912000000003, "t": 110.53801999999985, "r": 319.93527, "b": 118.86298, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "USER or", "bbox": {"l": 142.80002, "t": 129.49834999999996, "r": 178.26361, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "SESSION_USER", "bbox": {"l": 142.80002, "t": 140.53864, "r": 212.70122, "b": 148.86359000000004, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "The effective user of the thread excluding adopted authority.", "bbox": {"l": 230.21973000000003, "t": 129.49834999999996, "r": 467.99069000000003, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "CURRENT_USER", "bbox": {"l": 142.80003, "t": 159.55835000000002, "r": 216.63962999999998, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "The effective user of the thread including adopted authority. When no adopted ", "bbox": {"l": 230.19814, "t": 159.55835000000002, "r": 535.65082, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "authority is present, this has the same value as USER.", "bbox": {"l": 230.22061, "t": 170.53832999999997, "r": 447.36533, "b": 178.86328000000003, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "SYSTEM_USER", "bbox": {"l": 142.8009, "t": 189.55804, "r": 209.7357, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "The authorization ID that initiated the connection.", "bbox": {"l": 230.2449, "t": 189.55804, "r": 425.64569, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}}], "children": [{"id": 26, "label": "text", "bbox": {"l": 142.8, "t": 110.53801999999985, "r": 209.67091, "b": 118.86298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "Special register", "bbox": {"l": 142.8, "t": 110.53801999999985, "r": 209.67091, "b": 118.86298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 230.18912000000003, "t": 110.53801999999985, "r": 319.93527, "b": 118.86298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "Corresponding value", "bbox": {"l": 230.18912000000003, "t": 110.53801999999985, "r": 319.93527, "b": 118.86298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 142.80002, "t": 129.49834999999996, "r": 178.26361, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "USER or", "bbox": {"l": 142.80002, "t": 129.49834999999996, "r": 178.26361, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 142.80002, "t": 140.53864, "r": 212.70122, "b": 148.86359000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "SESSION_USER", "bbox": {"l": 142.80002, "t": 140.53864, "r": 212.70122, "b": 148.86359000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 230.21973000000003, "t": 129.49834999999996, "r": 467.99069000000003, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "The effective user of the thread excluding adopted authority.", "bbox": {"l": 230.21973000000003, "t": 129.49834999999996, "r": 467.99069000000003, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 142.80003, "t": 159.55835000000002, "r": 216.63962999999998, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "CURRENT_USER", "bbox": {"l": 142.80003, "t": 159.55835000000002, "r": 216.63962999999998, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 230.19814, "t": 159.55835000000002, "r": 535.65082, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "The effective user of the thread including adopted authority. When no adopted ", "bbox": {"l": 230.19814, "t": 159.55835000000002, "r": 535.65082, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 230.22061, "t": 170.53832999999997, "r": 447.36533, "b": 178.86328000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "authority is present, this has the same value as USER.", "bbox": {"l": 230.22061, "t": 170.53832999999997, "r": 447.36533, "b": 178.86328000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 142.8009, "t": 189.55804, "r": 209.7357, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "SYSTEM_USER", "bbox": {"l": 142.8009, "t": 189.55804, "r": 209.7357, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 230.2449, "t": 189.55804, "r": 425.64569, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "The authorization ID that initiated the connection.", "bbox": {"l": 230.2449, "t": 189.55804, "r": 425.64569, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 4, "num_cols": 2, "table_cells": [{"bbox": {"l": 142.8, "t": 110.53801999999985, "r": 209.67091, "b": 118.86298, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Special register", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 230.18912000000003, "t": 110.53801999999985, "r": 319.93527, "b": 118.86298, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Corresponding value", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 142.80002, "t": 129.49834999999996, "r": 212.70122, "b": 148.86359000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "USER or SESSION_USER", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 230.21973000000003, "t": 129.49834999999996, "r": 467.99069000000003, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "The effective user of the thread excluding adopted authority.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 142.80003, "t": 159.55835000000002, "r": 216.63962999999998, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "CURRENT_USER", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 230.19814, "t": 159.55835000000002, "r": 535.65082, "b": 178.86328000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "The effective user of the thread including adopted authority. When no adopted  authority is present, this has the same value as USER.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 142.8009, "t": 189.55804, "r": 209.7357, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "SYSTEM_USER", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 230.2449, "t": 189.55804, "r": 425.64569, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "The authorization ID that initiated the connection.", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "picture", "id": 16, "page_no": 10, "cluster": {"id": 16, "label": "picture", "bbox": {"l": 135.64837646484375, "t": 384.1737060546875, "r": 301.2367248535156, "b": 594.7566528320312, "coord_origin": "TOPLEFT"}, "confidence": 0.7221468687057495, "cells": [{"id": 38, "text": "SignedonasALICE", "bbox": {"l": 140.7323, "t": 386.98453, "r": 218.71170000000004, "b": 395.49527, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "Signed on as ALICE", "bbox": {"l": 140.7323, "t": 386.98453, "r": 216.40009, "b": 395.49527, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "USER = ALICE", "bbox": {"l": 138.476, "t": 410.87441999999993, "r": 191.70256, "b": 419.38516, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "CURRENT USER = ALICE", "bbox": {"l": 138.476, "t": 422.81934, "r": 232.56117, "b": 431.33008, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "CALL proc1", "bbox": {"l": 138.476, "t": 446.70923000000005, "r": 183.26944, "b": 455.21997, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "P1", "bbox": {"l": 148.4301, "t": 473.58524, "r": 184.17328, "b": 482.09598, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "Proc1:", "bbox": {"l": 148.4301, "t": 473.58524, "r": 174.05859, "b": 482.09598, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Owner = JOE", "bbox": {"l": 157.52185, "t": 485.53015, "r": 209.103, "b": 494.04089, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "SET OPTION USRPRF=*OWNER", "bbox": {"l": 157.52185, "t": 497.47507, "r": 281.68927, "b": 505.98581, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "USER = ALICE", "bbox": {"l": 148.4301, "t": 521.36493, "r": 201.65666, "b": 529.87567, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "CURRENT USER = JOE", "bbox": {"l": 148.4301, "t": 533.30984, "r": 234.57686999999999, "b": 541.82059, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "USER = ALICE", "bbox": {"l": 138.476, "t": 566.15842, "r": 191.70256, "b": 574.66917, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "CURRENT USER = ALICE", "bbox": {"l": 138.476, "t": 578.10333, "r": 232.56117, "b": 586.61409, "coord_origin": "TOPLEFT"}}], "children": [{"id": 15, "label": "text", "bbox": {"l": 140.7323, "t": 386.98453, "r": 218.71170000000004, "b": 395.49527, "coord_origin": "TOPLEFT"}, "confidence": 0.7616674304008484, "cells": [{"id": 38, "text": "SignedonasALICE", "bbox": {"l": 140.7323, "t": 386.98453, "r": 218.71170000000004, "b": 395.49527, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "Signed on as ALICE", "bbox": {"l": 140.7323, "t": 386.98453, "r": 216.40009, "b": 395.49527, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 138.476, "t": 410.87441999999993, "r": 191.70256, "b": 419.38516, "coord_origin": "TOPLEFT"}, "confidence": 0.5373895764350891, "cells": [{"id": 40, "text": "USER = ALICE", "bbox": {"l": 138.476, "t": 410.87441999999993, "r": 191.70256, "b": 419.38516, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 138.476, "t": 422.81934, "r": 232.56117, "b": 431.33008, "coord_origin": "TOPLEFT"}, "confidence": 0.5213791728019714, "cells": [{"id": 41, "text": "CURRENT USER = ALICE", "bbox": {"l": 138.476, "t": 422.81934, "r": 232.56117, "b": 431.33008, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 138.476, "t": 446.70923000000005, "r": 183.26944, "b": 455.21997, "coord_origin": "TOPLEFT"}, "confidence": 0.6404178142547607, "cells": [{"id": 42, "text": "CALL proc1", "bbox": {"l": 138.476, "t": 446.70923000000005, "r": 183.26944, "b": 455.21997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 148.4301, "t": 473.58524, "r": 184.17328, "b": 482.09598, "coord_origin": "TOPLEFT"}, "confidence": 0.5759297609329224, "cells": [{"id": 43, "text": "P1", "bbox": {"l": 148.4301, "t": 473.58524, "r": 184.17328, "b": 482.09598, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "Proc1:", "bbox": {"l": 148.4301, "t": 473.58524, "r": 174.05859, "b": 482.09598, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 157.52185, "t": 485.53015, "r": 209.103, "b": 494.04089, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "Owner = JOE", "bbox": {"l": 157.52185, "t": 485.53015, "r": 209.103, "b": 494.04089, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 157.52185, "t": 497.47507, "r": 281.68927, "b": 505.98581, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "SET OPTION USRPRF=*OWNER", "bbox": {"l": 157.52185, "t": 497.47507, "r": 281.68927, "b": 505.98581, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 148.4301, "t": 521.36493, "r": 201.65666, "b": 529.87567, "coord_origin": "TOPLEFT"}, "confidence": 0.5350866913795471, "cells": [{"id": 47, "text": "USER = ALICE", "bbox": {"l": 148.4301, "t": 521.36493, "r": 201.65666, "b": 529.87567, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 148.4301, "t": 533.30984, "r": 234.57686999999999, "b": 541.82059, "coord_origin": "TOPLEFT"}, "confidence": 0.5008324384689331, "cells": [{"id": 48, "text": "CURRENT USER = JOE", "bbox": {"l": 148.4301, "t": 533.30984, "r": 234.57686999999999, "b": 541.82059, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 138.476, "t": 566.15842, "r": 232.56117, "b": 586.61409, "coord_origin": "TOPLEFT"}, "confidence": 0.5024971961975098, "cells": [{"id": 49, "text": "USER = ALICE", "bbox": {"l": 138.476, "t": 566.15842, "r": 191.70256, "b": 574.66917, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "CURRENT USER = ALICE", "bbox": {"l": 138.476, "t": 578.10333, "r": 232.56117, "b": 586.61409, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "headers": [{"label": "page_footer", "id": 7, "page_no": 10, "cluster": {"id": 7, "label": "page_footer", "bbox": {"l": 344.94, "t": 755.538002, "r": 523.60162, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9557498693466187, "cells": [{"id": 0, "text": "Chapter 3. Row and Column Access Control ", "bbox": {"l": 344.94, "t": 755.538002, "r": 523.60162, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Chapter 3. Row and Column Access Control"}, {"label": "page_footer", "id": 13, "page_no": 10, "cluster": {"id": 13, "label": "page_footer", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.9130511283874512, "cells": [{"id": 1, "text": "19", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "19"}]}}, {"page_no": 11, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "20 ", "bbox": {"l": 64.800003, "t": 754.848721, "r": 78.402, "b": 764.06172, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Row and Column Access Control Support in IBM DB2 for i", "bbox": {"l": 93.420303, "t": 755.538002, "r": 334.42142, "b": 763.863001, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Table 3-2 lists the nine built-in global variables.", "bbox": {"l": 136.8, "t": 71.50867000000005, "r": 342.54773, "b": 80.72167999999999, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Table 3-2 Built-in global variables", "bbox": {"l": 64.800003, "t": 93.49805000000003, "r": 201.18147, "b": 101.82299999999998, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "3.3", "bbox": {"l": 64.800003, "t": 322.20071, "r": 87.318192, "b": 336.96371000000005, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "VERIFY_GROUP_FOR_USER function", "bbox": {"l": 91.821815, "t": 322.20071, "r": 384.36389, "b": 336.96371000000005, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "The VERIFY_GROUP_FOR_USER function was added in IBM i 7.2. Although it is primarily ", "bbox": {"l": 136.8, "t": 354.52872, "r": 542.83539, "b": 363.7417, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "intended for use with RCAC permissions and masks, it can be used in other SQL statements. ", "bbox": {"l": 136.8, "t": 366.52853, "r": 547.14783, "b": 375.74152, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "The first parameter must be one of these three special registers: SESSION_USER, USER, or ", "bbox": {"l": 136.8, "t": 378.52835, "r": 547.15106, "b": 387.74132999999995, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "CURRENT_USER. The second and subsequent parameters are a list of user or group ", "bbox": {"l": 136.80002, "t": 390.52817, "r": 520.62958, "b": 399.74115000000006, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "profiles. Each of these values must be 1 - 10 characters in length. These values are not ", "bbox": {"l": 136.80002, "t": 402.52798, "r": 524.88824, "b": 411.74097, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "validated for their existence, which means that you can specify the names of user profiles that ", "bbox": {"l": 136.80002, "t": 414.5278, "r": 547.23474, "b": 423.7407799999999, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "do not exist without receiving any kind of error.", "bbox": {"l": 136.80002, "t": 426.52762, "r": 342.04672, "b": 435.74060000000003, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "If a special register value is in the list of user profiles or it is a member of a group profile ", "bbox": {"l": 136.80002, "t": 448.48743, "r": 525.1474, "b": 457.70041, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "included in the list, the function returns a long integer value of 1. Otherwise, it returns a value ", "bbox": {"l": 136.80002, "t": 460.48724, "r": 547.25739, "b": 469.70023, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "of 0. It never returns the null value.", "bbox": {"l": 136.80002, "t": 472.48706, "r": 289.84335, "b": 481.70004, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Here is an example of using the VERIFY_GROUP_FOR_USER function:", "bbox": {"l": 136.80002, "t": 494.50662, "r": 458.44525000000004, "b": 503.7196, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "1.", "bbox": {"l": 136.80002, "t": 511.5462, "r": 145.09804, "b": 520.75919, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "There are user profiles for MGR, JANE, JUDY, and TONY.", "bbox": {"l": 147.86403, "t": 511.5462, "r": 406.07751, "b": 520.75919, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "2.", "bbox": {"l": 136.80002, "t": 528.5260000000001, "r": 145.23297, "b": 537.739, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "The user profile JANE specifies a group profile of MGR.", "bbox": {"l": 148.04396, "t": 528.5260000000001, "r": 396.98816, "b": 537.739, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "3.", "bbox": {"l": 136.80002, "t": 545.50581, "r": 145.18951, "b": 554.71881, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "If a user is connected to the server using user profile JANE, all of the following function ", "bbox": {"l": 147.98601, "t": 545.50581, "r": 536.5686, "b": 554.71881, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "invocations return a value of 1:", "bbox": {"l": 151.20018, "t": 557.50562, "r": 286.84641, "b": 566.71861, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "VERIFY_GROUP_FOR_USER (CURRENT_USER, 'MGR')", "bbox": {"l": 151.20018, "t": 574.69458, "r": 366.05725, "b": 583.46933, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "VERIFY_GROUP_FOR_USER (CURRENT_USER, 'JANE', 'MGR')", "bbox": {"l": 151.20018, "t": 586.69438, "r": 406.01678, "b": 595.46913, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "VERIFY_GROUP_FOR_USER (CURRENT_USER, 'JANE', 'MGR', 'STEVE')", "bbox": {"l": 151.20018, "t": 598.69418, "r": 451.01605, "b": 607.46893, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "The following function invocation returns a value of 0:", "bbox": {"l": 151.20018, "t": 615.5246, "r": 385.87271, "b": 624.73759, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "VERIFY_GROUP_FOR_USER (CURRENT_USER, 'JUDY', 'TONY')", "bbox": {"l": 151.20018, "t": 632.65381, "r": 411.05655, "b": 641.4285600000001, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Global variable", "bbox": {"l": 70.800003, "t": 110.53801999999985, "r": 134.99071, "b": 118.86298, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Type", "bbox": {"l": 202.8894, "t": 110.53801999999985, "r": 223.34641, "b": 118.86298, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Description", "bbox": {"l": 281.8248, "t": 110.53801999999985, "r": 331.3428, "b": 118.86298, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "CLIENT_HOST", "bbox": {"l": 70.800003, "t": 129.49834999999996, "r": 132.7209, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "VARCHAR(255)", "bbox": {"l": 202.89029, "t": 129.49834999999996, "r": 267.07651, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Host name of the current client as returned by the system", "bbox": {"l": 281.84732, "t": 129.49834999999996, "r": 510.17548, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "CLIENT_IPADDR", "bbox": {"l": 70.800018, "t": 148.51806999999997, "r": 140.66522, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "VARCHAR(128)", "bbox": {"l": 202.87231, "t": 148.51806999999997, "r": 267.07739, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "IP address of the current client as returned by the system", "bbox": {"l": 281.84549, "t": 148.51806999999997, "r": 509.60583, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "CLIENT_PORT ", "bbox": {"l": 70.800018, "t": 167.53778, "r": 134.98264, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "INTEGER", "bbox": {"l": 202.90294, "t": 167.53778, "r": 242.80084, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "Port used by the current client to communicate with the server", "bbox": {"l": 281.79785, "t": 167.53778, "r": 527.59222, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "PACKAGE_NAME", "bbox": {"l": 70.800018, "t": 186.5575, "r": 143.50925, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "VARCHAR(128)", "bbox": {"l": 202.80576, "t": 186.5575, "r": 267.06937, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Name of the currently running package", "bbox": {"l": 281.85187, "t": 186.5575, "r": 436.57259999999997, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "PACKAGE_SCHEMA", "bbox": {"l": 70.800018, "t": 205.51782000000003, "r": 156.01654, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "VARCHAR(128)", "bbox": {"l": 202.83545, "t": 205.51782000000003, "r": 267.08646, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "Schema name of the currently running package", "bbox": {"l": 281.87076, "t": 205.51782000000003, "r": 470.44678, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "PACKAGE_VERSION", "bbox": {"l": 70.800018, "t": 224.53754000000004, "r": 157.89932, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "VARCHAR(64)", "bbox": {"l": 202.72472, "t": 224.53754000000004, "r": 261.98254, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "Version identifier of the currently running package", "bbox": {"l": 281.74924, "t": 224.53754000000004, "r": 478.8438100000001, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "ROUTINE_SCHEMA", "bbox": {"l": 70.800018, "t": 243.55724999999995, "r": 154.41992, "b": 251.8822, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "VARCHAR(128)", "bbox": {"l": 202.79312, "t": 243.55724999999995, "r": 267.09274, "b": 251.8822, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Schema name of the currently running routine", "bbox": {"l": 281.87164, "t": 243.55724999999995, "r": 464.26022, "b": 251.8822, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "ROUTINE_SPECIFIC_NAME", "bbox": {"l": 70.800018, "t": 262.51757999999995, "r": 188.43991, "b": 270.84253, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "VARCHAR(128)", "bbox": {"l": 202.84441, "t": 262.51757999999995, "r": 267.03693, "b": 270.84253, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "Name of the currently running routine", "bbox": {"l": 281.80682, "t": 262.51757999999995, "r": 430.40045, "b": 270.84253, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "ROUTINE_TYPE", "bbox": {"l": 70.800034, "t": 281.53726, "r": 139.43135, "b": 289.86227, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "CHAR(1)", "bbox": {"l": 202.74635, "t": 281.53726, "r": 239.28996000000004, "b": 289.86227, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Type of the currently running routine", "bbox": {"l": 281.79065, "t": 281.53726, "r": 425.09131, "b": 289.86227, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 9, "label": "page_footer", "bbox": {"l": 64.800003, "t": 754.848721, "r": 78.402, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.9187920093536377, "cells": [{"id": 0, "text": "20 ", "bbox": {"l": 64.800003, "t": 754.848721, "r": 78.402, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "page_footer", "bbox": {"l": 93.420303, "t": 755.538002, "r": 334.42142, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9505079388618469, "cells": [{"id": 1, "text": "Row and Column Access Control Support in IBM DB2 for i", "bbox": {"l": 93.420303, "t": 755.538002, "r": 334.42142, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 136.8, "t": 71.50867000000005, "r": 342.54773, "b": 80.72167999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.8370978832244873, "cells": [{"id": 2, "text": "Table 3-2 lists the nine built-in global variables.", "bbox": {"l": 136.8, "t": 71.50867000000005, "r": 342.54773, "b": 80.72167999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "caption", "bbox": {"l": 64.800003, "t": 93.49805000000003, "r": 201.18147, "b": 101.82299999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.913235604763031, "cells": [{"id": 3, "text": "Table 3-2 Built-in global variables", "bbox": {"l": 64.800003, "t": 93.49805000000003, "r": 201.18147, "b": 101.82299999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "section_header", "bbox": {"l": 64.800003, "t": 322.20071, "r": 384.36389, "b": 336.96371000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9645338654518127, "cells": [{"id": 4, "text": "3.3", "bbox": {"l": 64.800003, "t": 322.20071, "r": 87.318192, "b": 336.96371000000005, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "VERIFY_GROUP_FOR_USER function", "bbox": {"l": 91.821815, "t": 322.20071, "r": 384.36389, "b": 336.96371000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 136.8, "t": 354.52872, "r": 547.23474, "b": 435.74060000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9864333868026733, "cells": [{"id": 6, "text": "The VERIFY_GROUP_FOR_USER function was added in IBM i 7.2. Although it is primarily ", "bbox": {"l": 136.8, "t": 354.52872, "r": 542.83539, "b": 363.7417, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "intended for use with RCAC permissions and masks, it can be used in other SQL statements. ", "bbox": {"l": 136.8, "t": 366.52853, "r": 547.14783, "b": 375.74152, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "The first parameter must be one of these three special registers: SESSION_USER, USER, or ", "bbox": {"l": 136.8, "t": 378.52835, "r": 547.15106, "b": 387.74132999999995, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "CURRENT_USER. The second and subsequent parameters are a list of user or group ", "bbox": {"l": 136.80002, "t": 390.52817, "r": 520.62958, "b": 399.74115000000006, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "profiles. Each of these values must be 1 - 10 characters in length. These values are not ", "bbox": {"l": 136.80002, "t": 402.52798, "r": 524.88824, "b": 411.74097, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "validated for their existence, which means that you can specify the names of user profiles that ", "bbox": {"l": 136.80002, "t": 414.5278, "r": 547.23474, "b": 423.7407799999999, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "do not exist without receiving any kind of error.", "bbox": {"l": 136.80002, "t": 426.52762, "r": 342.04672, "b": 435.74060000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 136.80002, "t": 448.48743, "r": 547.25739, "b": 481.70004, "coord_origin": "TOPLEFT"}, "confidence": 0.9807308912277222, "cells": [{"id": 13, "text": "If a special register value is in the list of user profiles or it is a member of a group profile ", "bbox": {"l": 136.80002, "t": 448.48743, "r": 525.1474, "b": 457.70041, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "included in the list, the function returns a long integer value of 1. Otherwise, it returns a value ", "bbox": {"l": 136.80002, "t": 460.48724, "r": 547.25739, "b": 469.70023, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "of 0. It never returns the null value.", "bbox": {"l": 136.80002, "t": 472.48706, "r": 289.84335, "b": 481.70004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "text", "bbox": {"l": 136.80002, "t": 494.50662, "r": 458.44525000000004, "b": 503.7196, "coord_origin": "TOPLEFT"}, "confidence": 0.9237529635429382, "cells": [{"id": 16, "text": "Here is an example of using the VERIFY_GROUP_FOR_USER function:", "bbox": {"l": 136.80002, "t": 494.50662, "r": 458.44525000000004, "b": 503.7196, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "list_item", "bbox": {"l": 136.80002, "t": 511.5462, "r": 406.07751, "b": 520.75919, "coord_origin": "TOPLEFT"}, "confidence": 0.9338629841804504, "cells": [{"id": 17, "text": "1.", "bbox": {"l": 136.80002, "t": 511.5462, "r": 145.09804, "b": 520.75919, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "There are user profiles for MGR, JANE, JUDY, and TONY.", "bbox": {"l": 147.86403, "t": 511.5462, "r": 406.07751, "b": 520.75919, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "list_item", "bbox": {"l": 136.80002, "t": 528.5260000000001, "r": 396.98816, "b": 537.739, "coord_origin": "TOPLEFT"}, "confidence": 0.9514460563659668, "cells": [{"id": 19, "text": "2.", "bbox": {"l": 136.80002, "t": 528.5260000000001, "r": 145.23297, "b": 537.739, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "The user profile JANE specifies a group profile of MGR.", "bbox": {"l": 148.04396, "t": 528.5260000000001, "r": 396.98816, "b": 537.739, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "list_item", "bbox": {"l": 136.80002, "t": 545.50581, "r": 536.5686, "b": 566.71861, "coord_origin": "TOPLEFT"}, "confidence": 0.951230525970459, "cells": [{"id": 21, "text": "3.", "bbox": {"l": 136.80002, "t": 545.50581, "r": 145.18951, "b": 554.71881, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "If a user is connected to the server using user profile JANE, all of the following function ", "bbox": {"l": 147.98601, "t": 545.50581, "r": 536.5686, "b": 554.71881, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "invocations return a value of 1:", "bbox": {"l": 151.20018, "t": 557.50562, "r": 286.84641, "b": 566.71861, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "code", "bbox": {"l": 151.20018, "t": 574.69458, "r": 451.01605, "b": 641.4285600000001, "coord_origin": "TOPLEFT"}, "confidence": 0.7066455483436584, "cells": [{"id": 24, "text": "VERIFY_GROUP_FOR_USER (CURRENT_USER, 'MGR')", "bbox": {"l": 151.20018, "t": 574.69458, "r": 366.05725, "b": 583.46933, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "VERIFY_GROUP_FOR_USER (CURRENT_USER, 'JANE', 'MGR')", "bbox": {"l": 151.20018, "t": 586.69438, "r": 406.01678, "b": 595.46913, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "VERIFY_GROUP_FOR_USER (CURRENT_USER, 'JANE', 'MGR', 'STEVE')", "bbox": {"l": 151.20018, "t": 598.69418, "r": 451.01605, "b": 607.46893, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "The following function invocation returns a value of 0:", "bbox": {"l": 151.20018, "t": 615.5246, "r": 385.87271, "b": 624.73759, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "VERIFY_GROUP_FOR_USER (CURRENT_USER, 'JUDY', 'TONY')", "bbox": {"l": 151.20018, "t": 632.65381, "r": 411.05655, "b": 641.4285600000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "table", "bbox": {"l": 63.55636978149414, "t": 104.23387145996094, "r": 548.5687255859375, "b": 296.22467041015625, "coord_origin": "TOPLEFT"}, "confidence": 0.9868634939193726, "cells": [{"id": 29, "text": "Global variable", "bbox": {"l": 70.800003, "t": 110.53801999999985, "r": 134.99071, "b": 118.86298, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Type", "bbox": {"l": 202.8894, "t": 110.53801999999985, "r": 223.34641, "b": 118.86298, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Description", "bbox": {"l": 281.8248, "t": 110.53801999999985, "r": 331.3428, "b": 118.86298, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "CLIENT_HOST", "bbox": {"l": 70.800003, "t": 129.49834999999996, "r": 132.7209, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "VARCHAR(255)", "bbox": {"l": 202.89029, "t": 129.49834999999996, "r": 267.07651, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Host name of the current client as returned by the system", "bbox": {"l": 281.84732, "t": 129.49834999999996, "r": 510.17548, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "CLIENT_IPADDR", "bbox": {"l": 70.800018, "t": 148.51806999999997, "r": 140.66522, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "VARCHAR(128)", "bbox": {"l": 202.87231, "t": 148.51806999999997, "r": 267.07739, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "IP address of the current client as returned by the system", "bbox": {"l": 281.84549, "t": 148.51806999999997, "r": 509.60583, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "CLIENT_PORT ", "bbox": {"l": 70.800018, "t": 167.53778, "r": 134.98264, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "INTEGER", "bbox": {"l": 202.90294, "t": 167.53778, "r": 242.80084, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "Port used by the current client to communicate with the server", "bbox": {"l": 281.79785, "t": 167.53778, "r": 527.59222, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "PACKAGE_NAME", "bbox": {"l": 70.800018, "t": 186.5575, "r": 143.50925, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "VARCHAR(128)", "bbox": {"l": 202.80576, "t": 186.5575, "r": 267.06937, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Name of the currently running package", "bbox": {"l": 281.85187, "t": 186.5575, "r": 436.57259999999997, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "PACKAGE_SCHEMA", "bbox": {"l": 70.800018, "t": 205.51782000000003, "r": 156.01654, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "VARCHAR(128)", "bbox": {"l": 202.83545, "t": 205.51782000000003, "r": 267.08646, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "Schema name of the currently running package", "bbox": {"l": 281.87076, "t": 205.51782000000003, "r": 470.44678, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "PACKAGE_VERSION", "bbox": {"l": 70.800018, "t": 224.53754000000004, "r": 157.89932, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "VARCHAR(64)", "bbox": {"l": 202.72472, "t": 224.53754000000004, "r": 261.98254, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "Version identifier of the currently running package", "bbox": {"l": 281.74924, "t": 224.53754000000004, "r": 478.8438100000001, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "ROUTINE_SCHEMA", "bbox": {"l": 70.800018, "t": 243.55724999999995, "r": 154.41992, "b": 251.8822, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "VARCHAR(128)", "bbox": {"l": 202.79312, "t": 243.55724999999995, "r": 267.09274, "b": 251.8822, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Schema name of the currently running routine", "bbox": {"l": 281.87164, "t": 243.55724999999995, "r": 464.26022, "b": 251.8822, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "ROUTINE_SPECIFIC_NAME", "bbox": {"l": 70.800018, "t": 262.51757999999995, "r": 188.43991, "b": 270.84253, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "VARCHAR(128)", "bbox": {"l": 202.84441, "t": 262.51757999999995, "r": 267.03693, "b": 270.84253, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "Name of the currently running routine", "bbox": {"l": 281.80682, "t": 262.51757999999995, "r": 430.40045, "b": 270.84253, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "ROUTINE_TYPE", "bbox": {"l": 70.800034, "t": 281.53726, "r": 139.43135, "b": 289.86227, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "CHAR(1)", "bbox": {"l": 202.74635, "t": 281.53726, "r": 239.28996000000004, "b": 289.86227, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Type of the currently running routine", "bbox": {"l": 281.79065, "t": 281.53726, "r": 425.09131, "b": 289.86227, "coord_origin": "TOPLEFT"}}], "children": [{"id": 14, "label": "text", "bbox": {"l": 70.800003, "t": 110.53801999999985, "r": 134.99071, "b": 118.86298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "Global variable", "bbox": {"l": 70.800003, "t": 110.53801999999985, "r": 134.99071, "b": 118.86298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 202.8894, "t": 110.53801999999985, "r": 223.34641, "b": 118.86298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "Type", "bbox": {"l": 202.8894, "t": 110.53801999999985, "r": 223.34641, "b": 118.86298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 281.8248, "t": 110.53801999999985, "r": 331.3428, "b": 118.86298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "Description", "bbox": {"l": 281.8248, "t": 110.53801999999985, "r": 331.3428, "b": 118.86298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 70.800003, "t": 129.49834999999996, "r": 132.7209, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "CLIENT_HOST", "bbox": {"l": 70.800003, "t": 129.49834999999996, "r": 132.7209, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 202.89029, "t": 129.49834999999996, "r": 267.07651, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "VARCHAR(255)", "bbox": {"l": 202.89029, "t": 129.49834999999996, "r": 267.07651, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 281.84732, "t": 129.49834999999996, "r": 510.17548, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "Host name of the current client as returned by the system", "bbox": {"l": 281.84732, "t": 129.49834999999996, "r": 510.17548, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 70.800018, "t": 148.51806999999997, "r": 140.66522, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "CLIENT_IPADDR", "bbox": {"l": 70.800018, "t": 148.51806999999997, "r": 140.66522, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 202.87231, "t": 148.51806999999997, "r": 267.07739, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "VARCHAR(128)", "bbox": {"l": 202.87231, "t": 148.51806999999997, "r": 267.07739, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 281.84549, "t": 148.51806999999997, "r": 509.60583, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "IP address of the current client as returned by the system", "bbox": {"l": 281.84549, "t": 148.51806999999997, "r": 509.60583, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 70.800018, "t": 167.53778, "r": 134.98264, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "CLIENT_PORT ", "bbox": {"l": 70.800018, "t": 167.53778, "r": 134.98264, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 202.90294, "t": 167.53778, "r": 242.80084, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "INTEGER", "bbox": {"l": 202.90294, "t": 167.53778, "r": 242.80084, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 281.79785, "t": 167.53778, "r": 527.59222, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "Port used by the current client to communicate with the server", "bbox": {"l": 281.79785, "t": 167.53778, "r": 527.59222, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 70.800018, "t": 186.5575, "r": 143.50925, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "PACKAGE_NAME", "bbox": {"l": 70.800018, "t": 186.5575, "r": 143.50925, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 202.80576, "t": 186.5575, "r": 267.06937, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "VARCHAR(128)", "bbox": {"l": 202.80576, "t": 186.5575, "r": 267.06937, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 281.85187, "t": 186.5575, "r": 436.57259999999997, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "Name of the currently running package", "bbox": {"l": 281.85187, "t": 186.5575, "r": 436.57259999999997, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 70.800018, "t": 205.51782000000003, "r": 156.01654, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "PACKAGE_SCHEMA", "bbox": {"l": 70.800018, "t": 205.51782000000003, "r": 156.01654, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 202.83545, "t": 205.51782000000003, "r": 267.08646, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "VARCHAR(128)", "bbox": {"l": 202.83545, "t": 205.51782000000003, "r": 267.08646, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 281.87076, "t": 205.51782000000003, "r": 470.44678, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "Schema name of the currently running package", "bbox": {"l": 281.87076, "t": 205.51782000000003, "r": 470.44678, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 70.800018, "t": 224.53754000000004, "r": 157.89932, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "PACKAGE_VERSION", "bbox": {"l": 70.800018, "t": 224.53754000000004, "r": 157.89932, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 202.72472, "t": 224.53754000000004, "r": 261.98254, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "VARCHAR(64)", "bbox": {"l": 202.72472, "t": 224.53754000000004, "r": 261.98254, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 281.74924, "t": 224.53754000000004, "r": 478.8438100000001, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "Version identifier of the currently running package", "bbox": {"l": 281.74924, "t": 224.53754000000004, "r": 478.8438100000001, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 70.800018, "t": 243.55724999999995, "r": 154.41992, "b": 251.8822, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "ROUTINE_SCHEMA", "bbox": {"l": 70.800018, "t": 243.55724999999995, "r": 154.41992, "b": 251.8822, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 202.79312, "t": 243.55724999999995, "r": 267.09274, "b": 251.8822, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "VARCHAR(128)", "bbox": {"l": 202.79312, "t": 243.55724999999995, "r": 267.09274, "b": 251.8822, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 281.87164, "t": 243.55724999999995, "r": 464.26022, "b": 251.8822, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "Schema name of the currently running routine", "bbox": {"l": 281.87164, "t": 243.55724999999995, "r": 464.26022, "b": 251.8822, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 70.800018, "t": 262.51757999999995, "r": 188.43991, "b": 270.84253, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "ROUTINE_SPECIFIC_NAME", "bbox": {"l": 70.800018, "t": 262.51757999999995, "r": 188.43991, "b": 270.84253, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 202.84441, "t": 262.51757999999995, "r": 267.03693, "b": 270.84253, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "VARCHAR(128)", "bbox": {"l": 202.84441, "t": 262.51757999999995, "r": 267.03693, "b": 270.84253, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 281.80682, "t": 262.51757999999995, "r": 430.40045, "b": 270.84253, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "Name of the currently running routine", "bbox": {"l": 281.80682, "t": 262.51757999999995, "r": 430.40045, "b": 270.84253, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 70.800034, "t": 281.53726, "r": 139.43135, "b": 289.86227, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "ROUTINE_TYPE", "bbox": {"l": 70.800034, "t": 281.53726, "r": 139.43135, "b": 289.86227, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 202.74635, "t": 281.53726, "r": 239.28996000000004, "b": 289.86227, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "CHAR(1)", "bbox": {"l": 202.74635, "t": 281.53726, "r": 239.28996000000004, "b": 289.86227, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 281.79065, "t": 281.53726, "r": 425.09131, "b": 289.86227, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "Type of the currently running routine", "bbox": {"l": 281.79065, "t": 281.53726, "r": 425.09131, "b": 289.86227, "coord_origin": "TOPLEFT"}}], "children": []}]}]}, "tablestructure": {"table_map": {"0": {"label": "table", "id": 0, "page_no": 11, "cluster": {"id": 0, "label": "table", "bbox": {"l": 63.55636978149414, "t": 104.23387145996094, "r": 548.5687255859375, "b": 296.22467041015625, "coord_origin": "TOPLEFT"}, "confidence": 0.9868634939193726, "cells": [{"id": 29, "text": "Global variable", "bbox": {"l": 70.800003, "t": 110.53801999999985, "r": 134.99071, "b": 118.86298, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Type", "bbox": {"l": 202.8894, "t": 110.53801999999985, "r": 223.34641, "b": 118.86298, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Description", "bbox": {"l": 281.8248, "t": 110.53801999999985, "r": 331.3428, "b": 118.86298, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "CLIENT_HOST", "bbox": {"l": 70.800003, "t": 129.49834999999996, "r": 132.7209, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "VARCHAR(255)", "bbox": {"l": 202.89029, "t": 129.49834999999996, "r": 267.07651, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Host name of the current client as returned by the system", "bbox": {"l": 281.84732, "t": 129.49834999999996, "r": 510.17548, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "CLIENT_IPADDR", "bbox": {"l": 70.800018, "t": 148.51806999999997, "r": 140.66522, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "VARCHAR(128)", "bbox": {"l": 202.87231, "t": 148.51806999999997, "r": 267.07739, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "IP address of the current client as returned by the system", "bbox": {"l": 281.84549, "t": 148.51806999999997, "r": 509.60583, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "CLIENT_PORT ", "bbox": {"l": 70.800018, "t": 167.53778, "r": 134.98264, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "INTEGER", "bbox": {"l": 202.90294, "t": 167.53778, "r": 242.80084, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "Port used by the current client to communicate with the server", "bbox": {"l": 281.79785, "t": 167.53778, "r": 527.59222, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "PACKAGE_NAME", "bbox": {"l": 70.800018, "t": 186.5575, "r": 143.50925, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "VARCHAR(128)", "bbox": {"l": 202.80576, "t": 186.5575, "r": 267.06937, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Name of the currently running package", "bbox": {"l": 281.85187, "t": 186.5575, "r": 436.57259999999997, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "PACKAGE_SCHEMA", "bbox": {"l": 70.800018, "t": 205.51782000000003, "r": 156.01654, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "VARCHAR(128)", "bbox": {"l": 202.83545, "t": 205.51782000000003, "r": 267.08646, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "Schema name of the currently running package", "bbox": {"l": 281.87076, "t": 205.51782000000003, "r": 470.44678, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "PACKAGE_VERSION", "bbox": {"l": 70.800018, "t": 224.53754000000004, "r": 157.89932, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "VARCHAR(64)", "bbox": {"l": 202.72472, "t": 224.53754000000004, "r": 261.98254, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "Version identifier of the currently running package", "bbox": {"l": 281.74924, "t": 224.53754000000004, "r": 478.8438100000001, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "ROUTINE_SCHEMA", "bbox": {"l": 70.800018, "t": 243.55724999999995, "r": 154.41992, "b": 251.8822, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "VARCHAR(128)", "bbox": {"l": 202.79312, "t": 243.55724999999995, "r": 267.09274, "b": 251.8822, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Schema name of the currently running routine", "bbox": {"l": 281.87164, "t": 243.55724999999995, "r": 464.26022, "b": 251.8822, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "ROUTINE_SPECIFIC_NAME", "bbox": {"l": 70.800018, "t": 262.51757999999995, "r": 188.43991, "b": 270.84253, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "VARCHAR(128)", "bbox": {"l": 202.84441, "t": 262.51757999999995, "r": 267.03693, "b": 270.84253, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "Name of the currently running routine", "bbox": {"l": 281.80682, "t": 262.51757999999995, "r": 430.40045, "b": 270.84253, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "ROUTINE_TYPE", "bbox": {"l": 70.800034, "t": 281.53726, "r": 139.43135, "b": 289.86227, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "CHAR(1)", "bbox": {"l": 202.74635, "t": 281.53726, "r": 239.28996000000004, "b": 289.86227, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Type of the currently running routine", "bbox": {"l": 281.79065, "t": 281.53726, "r": 425.09131, "b": 289.86227, "coord_origin": "TOPLEFT"}}], "children": [{"id": 14, "label": "text", "bbox": {"l": 70.800003, "t": 110.53801999999985, "r": 134.99071, "b": 118.86298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "Global variable", "bbox": {"l": 70.800003, "t": 110.53801999999985, "r": 134.99071, "b": 118.86298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 202.8894, "t": 110.53801999999985, "r": 223.34641, "b": 118.86298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "Type", "bbox": {"l": 202.8894, "t": 110.53801999999985, "r": 223.34641, "b": 118.86298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 281.8248, "t": 110.53801999999985, "r": 331.3428, "b": 118.86298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "Description", "bbox": {"l": 281.8248, "t": 110.53801999999985, "r": 331.3428, "b": 118.86298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 70.800003, "t": 129.49834999999996, "r": 132.7209, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "CLIENT_HOST", "bbox": {"l": 70.800003, "t": 129.49834999999996, "r": 132.7209, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 202.89029, "t": 129.49834999999996, "r": 267.07651, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "VARCHAR(255)", "bbox": {"l": 202.89029, "t": 129.49834999999996, "r": 267.07651, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 281.84732, "t": 129.49834999999996, "r": 510.17548, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "Host name of the current client as returned by the system", "bbox": {"l": 281.84732, "t": 129.49834999999996, "r": 510.17548, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 70.800018, "t": 148.51806999999997, "r": 140.66522, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "CLIENT_IPADDR", "bbox": {"l": 70.800018, "t": 148.51806999999997, "r": 140.66522, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 202.87231, "t": 148.51806999999997, "r": 267.07739, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "VARCHAR(128)", "bbox": {"l": 202.87231, "t": 148.51806999999997, "r": 267.07739, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 281.84549, "t": 148.51806999999997, "r": 509.60583, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "IP address of the current client as returned by the system", "bbox": {"l": 281.84549, "t": 148.51806999999997, "r": 509.60583, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 70.800018, "t": 167.53778, "r": 134.98264, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "CLIENT_PORT ", "bbox": {"l": 70.800018, "t": 167.53778, "r": 134.98264, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 202.90294, "t": 167.53778, "r": 242.80084, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "INTEGER", "bbox": {"l": 202.90294, "t": 167.53778, "r": 242.80084, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 281.79785, "t": 167.53778, "r": 527.59222, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "Port used by the current client to communicate with the server", "bbox": {"l": 281.79785, "t": 167.53778, "r": 527.59222, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 70.800018, "t": 186.5575, "r": 143.50925, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "PACKAGE_NAME", "bbox": {"l": 70.800018, "t": 186.5575, "r": 143.50925, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 202.80576, "t": 186.5575, "r": 267.06937, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "VARCHAR(128)", "bbox": {"l": 202.80576, "t": 186.5575, "r": 267.06937, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 281.85187, "t": 186.5575, "r": 436.57259999999997, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "Name of the currently running package", "bbox": {"l": 281.85187, "t": 186.5575, "r": 436.57259999999997, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 70.800018, "t": 205.51782000000003, "r": 156.01654, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "PACKAGE_SCHEMA", "bbox": {"l": 70.800018, "t": 205.51782000000003, "r": 156.01654, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 202.83545, "t": 205.51782000000003, "r": 267.08646, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "VARCHAR(128)", "bbox": {"l": 202.83545, "t": 205.51782000000003, "r": 267.08646, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 281.87076, "t": 205.51782000000003, "r": 470.44678, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "Schema name of the currently running package", "bbox": {"l": 281.87076, "t": 205.51782000000003, "r": 470.44678, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 70.800018, "t": 224.53754000000004, "r": 157.89932, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "PACKAGE_VERSION", "bbox": {"l": 70.800018, "t": 224.53754000000004, "r": 157.89932, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 202.72472, "t": 224.53754000000004, "r": 261.98254, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "VARCHAR(64)", "bbox": {"l": 202.72472, "t": 224.53754000000004, "r": 261.98254, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 281.74924, "t": 224.53754000000004, "r": 478.8438100000001, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "Version identifier of the currently running package", "bbox": {"l": 281.74924, "t": 224.53754000000004, "r": 478.8438100000001, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 70.800018, "t": 243.55724999999995, "r": 154.41992, "b": 251.8822, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "ROUTINE_SCHEMA", "bbox": {"l": 70.800018, "t": 243.55724999999995, "r": 154.41992, "b": 251.8822, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 202.79312, "t": 243.55724999999995, "r": 267.09274, "b": 251.8822, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "VARCHAR(128)", "bbox": {"l": 202.79312, "t": 243.55724999999995, "r": 267.09274, "b": 251.8822, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 281.87164, "t": 243.55724999999995, "r": 464.26022, "b": 251.8822, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "Schema name of the currently running routine", "bbox": {"l": 281.87164, "t": 243.55724999999995, "r": 464.26022, "b": 251.8822, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 70.800018, "t": 262.51757999999995, "r": 188.43991, "b": 270.84253, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "ROUTINE_SPECIFIC_NAME", "bbox": {"l": 70.800018, "t": 262.51757999999995, "r": 188.43991, "b": 270.84253, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 202.84441, "t": 262.51757999999995, "r": 267.03693, "b": 270.84253, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "VARCHAR(128)", "bbox": {"l": 202.84441, "t": 262.51757999999995, "r": 267.03693, "b": 270.84253, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 281.80682, "t": 262.51757999999995, "r": 430.40045, "b": 270.84253, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "Name of the currently running routine", "bbox": {"l": 281.80682, "t": 262.51757999999995, "r": 430.40045, "b": 270.84253, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 70.800034, "t": 281.53726, "r": 139.43135, "b": 289.86227, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "ROUTINE_TYPE", "bbox": {"l": 70.800034, "t": 281.53726, "r": 139.43135, "b": 289.86227, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 202.74635, "t": 281.53726, "r": 239.28996000000004, "b": 289.86227, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "CHAR(1)", "bbox": {"l": 202.74635, "t": 281.53726, "r": 239.28996000000004, "b": 289.86227, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 281.79065, "t": 281.53726, "r": 425.09131, "b": 289.86227, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "Type of the currently running routine", "bbox": {"l": 281.79065, "t": 281.53726, "r": 425.09131, "b": 289.86227, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl"], "num_rows": 10, "num_cols": 3, "table_cells": [{"bbox": {"l": 70.800003, "t": 110.53801999999985, "r": 134.99071, "b": 118.86298, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Global variable", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 202.8894, "t": 110.53801999999985, "r": 223.34641, "b": 118.86298, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Type", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 281.8248, "t": 110.53801999999985, "r": 331.3428, "b": 118.86298, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Description", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800003, "t": 129.49834999999996, "r": 132.7209, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "CLIENT_HOST", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.89029, "t": 129.49834999999996, "r": 267.07651, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(255)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.84732, "t": 129.49834999999996, "r": 510.17548, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Host name of the current client as returned by the system", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800018, "t": 148.51806999999997, "r": 140.66522, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "CLIENT_IPADDR", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.87231, "t": 148.51806999999997, "r": 267.07739, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(128)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.84549, "t": 148.51806999999997, "r": 509.60583, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "IP address of the current client as returned by the system", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800018, "t": 167.53778, "r": 134.98264, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "CLIENT_PORT", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.90294, "t": 167.53778, "r": 242.80084, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "INTEGER", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.79785, "t": 167.53778, "r": 527.59222, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Port used by the current client to communicate with the server", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800018, "t": 186.5575, "r": 143.50925, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PACKAGE_NAME", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.80576, "t": 186.5575, "r": 267.06937, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(128)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.85187, "t": 186.5575, "r": 436.57259999999997, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Name of the currently running package", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800018, "t": 205.51782000000003, "r": 156.01654, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PACKAGE_SCHEMA", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.83545, "t": 205.51782000000003, "r": 267.08646, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(128)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.87076, "t": 205.51782000000003, "r": 470.44678, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Schema name of the currently running package", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800018, "t": 224.53754000000004, "r": 157.89932, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PACKAGE_VERSION", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.72472, "t": 224.53754000000004, "r": 261.98254, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(64)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.74924, "t": 224.53754000000004, "r": 478.8438100000001, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Version identifier of the currently running package", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800018, "t": 243.55724999999995, "r": 154.41992, "b": 251.8822, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "ROUTINE_SCHEMA", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.79312, "t": 243.55724999999995, "r": 267.09274, "b": 251.8822, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(128)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.87164, "t": 243.55724999999995, "r": 464.26022, "b": 251.8822, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Schema name of the currently running routine", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800018, "t": 262.51757999999995, "r": 188.43991, "b": 270.84253, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "ROUTINE_SPECIFIC_NAME", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.84441, "t": 262.51757999999995, "r": 267.03693, "b": 270.84253, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(128)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.80682, "t": 262.51757999999995, "r": 430.40045, "b": 270.84253, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Name of the currently running routine", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800034, "t": 281.53726, "r": 139.43135, "b": 289.86227, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "ROUTINE_TYPE", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.74635, "t": 281.53726, "r": 239.28996000000004, "b": 289.86227, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "CHAR(1)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.79065, "t": 281.53726, "r": 425.09131, "b": 289.86227, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Type of the currently running routine", "column_header": false, "row_header": false, "row_section": false}]}}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_footer", "id": 9, "page_no": 11, "cluster": {"id": 9, "label": "page_footer", "bbox": {"l": 64.800003, "t": 754.848721, "r": 78.402, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.9187920093536377, "cells": [{"id": 0, "text": "20 ", "bbox": {"l": 64.800003, "t": 754.848721, "r": 78.402, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "20"}, {"label": "page_footer", "id": 6, "page_no": 11, "cluster": {"id": 6, "label": "page_footer", "bbox": {"l": 93.420303, "t": 755.538002, "r": 334.42142, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9505079388618469, "cells": [{"id": 1, "text": "Row and Column Access Control Support in IBM DB2 for i", "bbox": {"l": 93.420303, "t": 755.538002, "r": 334.42142, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Row and Column Access Control Support in IBM DB2 for i"}, {"label": "text", "id": 11, "page_no": 11, "cluster": {"id": 11, "label": "text", "bbox": {"l": 136.8, "t": 71.50867000000005, "r": 342.54773, "b": 80.72167999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.8370978832244873, "cells": [{"id": 2, "text": "Table 3-2 lists the nine built-in global variables.", "bbox": {"l": 136.8, "t": 71.50867000000005, "r": 342.54773, "b": 80.72167999999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 3-2 lists the nine built-in global variables."}, {"label": "caption", "id": 10, "page_no": 11, "cluster": {"id": 10, "label": "caption", "bbox": {"l": 64.800003, "t": 93.49805000000003, "r": 201.18147, "b": 101.82299999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.913235604763031, "cells": [{"id": 3, "text": "Table 3-2 Built-in global variables", "bbox": {"l": 64.800003, "t": 93.49805000000003, "r": 201.18147, "b": 101.82299999999998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 3-2 Built-in global variables"}, {"label": "section_header", "id": 3, "page_no": 11, "cluster": {"id": 3, "label": "section_header", "bbox": {"l": 64.800003, "t": 322.20071, "r": 384.36389, "b": 336.96371000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9645338654518127, "cells": [{"id": 4, "text": "3.3", "bbox": {"l": 64.800003, "t": 322.20071, "r": 87.318192, "b": 336.96371000000005, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "VERIFY_GROUP_FOR_USER function", "bbox": {"l": 91.821815, "t": 322.20071, "r": 384.36389, "b": 336.96371000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3.3 VERIFY_GROUP_FOR_USER function"}, {"label": "text", "id": 1, "page_no": 11, "cluster": {"id": 1, "label": "text", "bbox": {"l": 136.8, "t": 354.52872, "r": 547.23474, "b": 435.74060000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9864333868026733, "cells": [{"id": 6, "text": "The VERIFY_GROUP_FOR_USER function was added in IBM i 7.2. Although it is primarily ", "bbox": {"l": 136.8, "t": 354.52872, "r": 542.83539, "b": 363.7417, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "intended for use with RCAC permissions and masks, it can be used in other SQL statements. ", "bbox": {"l": 136.8, "t": 366.52853, "r": 547.14783, "b": 375.74152, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "The first parameter must be one of these three special registers: SESSION_USER, USER, or ", "bbox": {"l": 136.8, "t": 378.52835, "r": 547.15106, "b": 387.74132999999995, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "CURRENT_USER. The second and subsequent parameters are a list of user or group ", "bbox": {"l": 136.80002, "t": 390.52817, "r": 520.62958, "b": 399.74115000000006, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "profiles. Each of these values must be 1 - 10 characters in length. These values are not ", "bbox": {"l": 136.80002, "t": 402.52798, "r": 524.88824, "b": 411.74097, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "validated for their existence, which means that you can specify the names of user profiles that ", "bbox": {"l": 136.80002, "t": 414.5278, "r": 547.23474, "b": 423.7407799999999, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "do not exist without receiving any kind of error.", "bbox": {"l": 136.80002, "t": 426.52762, "r": 342.04672, "b": 435.74060000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The VERIFY_GROUP_FOR_USER function was added in IBM i 7.2. Although it is primarily intended for use with RCAC permissions and masks, it can be used in other SQL statements. The first parameter must be one of these three special registers: SESSION_USER, USER, or CURRENT_USER. The second and subsequent parameters are a list of user or group profiles. Each of these values must be 1 - 10 characters in length. These values are not validated for their existence, which means that you can specify the names of user profiles that do not exist without receiving any kind of error."}, {"label": "text", "id": 2, "page_no": 11, "cluster": {"id": 2, "label": "text", "bbox": {"l": 136.80002, "t": 448.48743, "r": 547.25739, "b": 481.70004, "coord_origin": "TOPLEFT"}, "confidence": 0.9807308912277222, "cells": [{"id": 13, "text": "If a special register value is in the list of user profiles or it is a member of a group profile ", "bbox": {"l": 136.80002, "t": 448.48743, "r": 525.1474, "b": 457.70041, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "included in the list, the function returns a long integer value of 1. Otherwise, it returns a value ", "bbox": {"l": 136.80002, "t": 460.48724, "r": 547.25739, "b": 469.70023, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "of 0. It never returns the null value.", "bbox": {"l": 136.80002, "t": 472.48706, "r": 289.84335, "b": 481.70004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "If a special register value is in the list of user profiles or it is a member of a group profile included in the list, the function returns a long integer value of 1. Otherwise, it returns a value of 0. It never returns the null value."}, {"label": "text", "id": 8, "page_no": 11, "cluster": {"id": 8, "label": "text", "bbox": {"l": 136.80002, "t": 494.50662, "r": 458.44525000000004, "b": 503.7196, "coord_origin": "TOPLEFT"}, "confidence": 0.9237529635429382, "cells": [{"id": 16, "text": "Here is an example of using the VERIFY_GROUP_FOR_USER function:", "bbox": {"l": 136.80002, "t": 494.50662, "r": 458.44525000000004, "b": 503.7196, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Here is an example of using the VERIFY_GROUP_FOR_USER function:"}, {"label": "list_item", "id": 7, "page_no": 11, "cluster": {"id": 7, "label": "list_item", "bbox": {"l": 136.80002, "t": 511.5462, "r": 406.07751, "b": 520.75919, "coord_origin": "TOPLEFT"}, "confidence": 0.9338629841804504, "cells": [{"id": 17, "text": "1.", "bbox": {"l": 136.80002, "t": 511.5462, "r": 145.09804, "b": 520.75919, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "There are user profiles for MGR, JANE, JUDY, and TONY.", "bbox": {"l": 147.86403, "t": 511.5462, "r": 406.07751, "b": 520.75919, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1. There are user profiles for MGR, JANE, JUDY, and TONY."}, {"label": "list_item", "id": 4, "page_no": 11, "cluster": {"id": 4, "label": "list_item", "bbox": {"l": 136.80002, "t": 528.5260000000001, "r": 396.98816, "b": 537.739, "coord_origin": "TOPLEFT"}, "confidence": 0.9514460563659668, "cells": [{"id": 19, "text": "2.", "bbox": {"l": 136.80002, "t": 528.5260000000001, "r": 145.23297, "b": 537.739, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "The user profile JANE specifies a group profile of MGR.", "bbox": {"l": 148.04396, "t": 528.5260000000001, "r": 396.98816, "b": 537.739, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2. The user profile JANE specifies a group profile of MGR."}, {"label": "list_item", "id": 5, "page_no": 11, "cluster": {"id": 5, "label": "list_item", "bbox": {"l": 136.80002, "t": 545.50581, "r": 536.5686, "b": 566.71861, "coord_origin": "TOPLEFT"}, "confidence": 0.951230525970459, "cells": [{"id": 21, "text": "3.", "bbox": {"l": 136.80002, "t": 545.50581, "r": 145.18951, "b": 554.71881, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "If a user is connected to the server using user profile JANE, all of the following function ", "bbox": {"l": 147.98601, "t": 545.50581, "r": 536.5686, "b": 554.71881, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "invocations return a value of 1:", "bbox": {"l": 151.20018, "t": 557.50562, "r": 286.84641, "b": 566.71861, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3. If a user is connected to the server using user profile JANE, all of the following function invocations return a value of 1:"}, {"label": "code", "id": 12, "page_no": 11, "cluster": {"id": 12, "label": "code", "bbox": {"l": 151.20018, "t": 574.69458, "r": 451.01605, "b": 641.4285600000001, "coord_origin": "TOPLEFT"}, "confidence": 0.7066455483436584, "cells": [{"id": 24, "text": "VERIFY_GROUP_FOR_USER (CURRENT_USER, 'MGR')", "bbox": {"l": 151.20018, "t": 574.69458, "r": 366.05725, "b": 583.46933, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "VERIFY_GROUP_FOR_USER (CURRENT_USER, 'JANE', 'MGR')", "bbox": {"l": 151.20018, "t": 586.69438, "r": 406.01678, "b": 595.46913, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "VERIFY_GROUP_FOR_USER (CURRENT_USER, 'JANE', 'MGR', 'STEVE')", "bbox": {"l": 151.20018, "t": 598.69418, "r": 451.01605, "b": 607.46893, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "The following function invocation returns a value of 0:", "bbox": {"l": 151.20018, "t": 615.5246, "r": 385.87271, "b": 624.73759, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "VERIFY_GROUP_FOR_USER (CURRENT_USER, 'JUDY', 'TONY')", "bbox": {"l": 151.20018, "t": 632.65381, "r": 411.05655, "b": 641.4285600000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "VERIFY_GROUP_FOR_USER (CURRENT_USER, 'MGR') VERIFY_GROUP_FOR_USER (CURRENT_USER, 'JANE', 'MGR') VERIFY_GROUP_FOR_USER (CURRENT_USER, 'JANE', 'MGR', 'STEVE') The following function invocation returns a value of 0: VERIFY_GROUP_FOR_USER (CURRENT_USER, 'JUDY', 'TONY')"}, {"label": "table", "id": 0, "page_no": 11, "cluster": {"id": 0, "label": "table", "bbox": {"l": 63.55636978149414, "t": 104.23387145996094, "r": 548.5687255859375, "b": 296.22467041015625, "coord_origin": "TOPLEFT"}, "confidence": 0.9868634939193726, "cells": [{"id": 29, "text": "Global variable", "bbox": {"l": 70.800003, "t": 110.53801999999985, "r": 134.99071, "b": 118.86298, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Type", "bbox": {"l": 202.8894, "t": 110.53801999999985, "r": 223.34641, "b": 118.86298, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Description", "bbox": {"l": 281.8248, "t": 110.53801999999985, "r": 331.3428, "b": 118.86298, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "CLIENT_HOST", "bbox": {"l": 70.800003, "t": 129.49834999999996, "r": 132.7209, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "VARCHAR(255)", "bbox": {"l": 202.89029, "t": 129.49834999999996, "r": 267.07651, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Host name of the current client as returned by the system", "bbox": {"l": 281.84732, "t": 129.49834999999996, "r": 510.17548, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "CLIENT_IPADDR", "bbox": {"l": 70.800018, "t": 148.51806999999997, "r": 140.66522, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "VARCHAR(128)", "bbox": {"l": 202.87231, "t": 148.51806999999997, "r": 267.07739, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "IP address of the current client as returned by the system", "bbox": {"l": 281.84549, "t": 148.51806999999997, "r": 509.60583, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "CLIENT_PORT ", "bbox": {"l": 70.800018, "t": 167.53778, "r": 134.98264, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "INTEGER", "bbox": {"l": 202.90294, "t": 167.53778, "r": 242.80084, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "Port used by the current client to communicate with the server", "bbox": {"l": 281.79785, "t": 167.53778, "r": 527.59222, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "PACKAGE_NAME", "bbox": {"l": 70.800018, "t": 186.5575, "r": 143.50925, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "VARCHAR(128)", "bbox": {"l": 202.80576, "t": 186.5575, "r": 267.06937, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Name of the currently running package", "bbox": {"l": 281.85187, "t": 186.5575, "r": 436.57259999999997, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "PACKAGE_SCHEMA", "bbox": {"l": 70.800018, "t": 205.51782000000003, "r": 156.01654, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "VARCHAR(128)", "bbox": {"l": 202.83545, "t": 205.51782000000003, "r": 267.08646, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "Schema name of the currently running package", "bbox": {"l": 281.87076, "t": 205.51782000000003, "r": 470.44678, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "PACKAGE_VERSION", "bbox": {"l": 70.800018, "t": 224.53754000000004, "r": 157.89932, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "VARCHAR(64)", "bbox": {"l": 202.72472, "t": 224.53754000000004, "r": 261.98254, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "Version identifier of the currently running package", "bbox": {"l": 281.74924, "t": 224.53754000000004, "r": 478.8438100000001, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "ROUTINE_SCHEMA", "bbox": {"l": 70.800018, "t": 243.55724999999995, "r": 154.41992, "b": 251.8822, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "VARCHAR(128)", "bbox": {"l": 202.79312, "t": 243.55724999999995, "r": 267.09274, "b": 251.8822, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Schema name of the currently running routine", "bbox": {"l": 281.87164, "t": 243.55724999999995, "r": 464.26022, "b": 251.8822, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "ROUTINE_SPECIFIC_NAME", "bbox": {"l": 70.800018, "t": 262.51757999999995, "r": 188.43991, "b": 270.84253, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "VARCHAR(128)", "bbox": {"l": 202.84441, "t": 262.51757999999995, "r": 267.03693, "b": 270.84253, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "Name of the currently running routine", "bbox": {"l": 281.80682, "t": 262.51757999999995, "r": 430.40045, "b": 270.84253, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "ROUTINE_TYPE", "bbox": {"l": 70.800034, "t": 281.53726, "r": 139.43135, "b": 289.86227, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "CHAR(1)", "bbox": {"l": 202.74635, "t": 281.53726, "r": 239.28996000000004, "b": 289.86227, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Type of the currently running routine", "bbox": {"l": 281.79065, "t": 281.53726, "r": 425.09131, "b": 289.86227, "coord_origin": "TOPLEFT"}}], "children": [{"id": 14, "label": "text", "bbox": {"l": 70.800003, "t": 110.53801999999985, "r": 134.99071, "b": 118.86298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "Global variable", "bbox": {"l": 70.800003, "t": 110.53801999999985, "r": 134.99071, "b": 118.86298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 202.8894, "t": 110.53801999999985, "r": 223.34641, "b": 118.86298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "Type", "bbox": {"l": 202.8894, "t": 110.53801999999985, "r": 223.34641, "b": 118.86298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 281.8248, "t": 110.53801999999985, "r": 331.3428, "b": 118.86298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "Description", "bbox": {"l": 281.8248, "t": 110.53801999999985, "r": 331.3428, "b": 118.86298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 70.800003, "t": 129.49834999999996, "r": 132.7209, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "CLIENT_HOST", "bbox": {"l": 70.800003, "t": 129.49834999999996, "r": 132.7209, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 202.89029, "t": 129.49834999999996, "r": 267.07651, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "VARCHAR(255)", "bbox": {"l": 202.89029, "t": 129.49834999999996, "r": 267.07651, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 281.84732, "t": 129.49834999999996, "r": 510.17548, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "Host name of the current client as returned by the system", "bbox": {"l": 281.84732, "t": 129.49834999999996, "r": 510.17548, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 70.800018, "t": 148.51806999999997, "r": 140.66522, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "CLIENT_IPADDR", "bbox": {"l": 70.800018, "t": 148.51806999999997, "r": 140.66522, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 202.87231, "t": 148.51806999999997, "r": 267.07739, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "VARCHAR(128)", "bbox": {"l": 202.87231, "t": 148.51806999999997, "r": 267.07739, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 281.84549, "t": 148.51806999999997, "r": 509.60583, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "IP address of the current client as returned by the system", "bbox": {"l": 281.84549, "t": 148.51806999999997, "r": 509.60583, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 70.800018, "t": 167.53778, "r": 134.98264, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "CLIENT_PORT ", "bbox": {"l": 70.800018, "t": 167.53778, "r": 134.98264, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 202.90294, "t": 167.53778, "r": 242.80084, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "INTEGER", "bbox": {"l": 202.90294, "t": 167.53778, "r": 242.80084, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 281.79785, "t": 167.53778, "r": 527.59222, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "Port used by the current client to communicate with the server", "bbox": {"l": 281.79785, "t": 167.53778, "r": 527.59222, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 70.800018, "t": 186.5575, "r": 143.50925, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "PACKAGE_NAME", "bbox": {"l": 70.800018, "t": 186.5575, "r": 143.50925, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 202.80576, "t": 186.5575, "r": 267.06937, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "VARCHAR(128)", "bbox": {"l": 202.80576, "t": 186.5575, "r": 267.06937, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 281.85187, "t": 186.5575, "r": 436.57259999999997, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "Name of the currently running package", "bbox": {"l": 281.85187, "t": 186.5575, "r": 436.57259999999997, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 70.800018, "t": 205.51782000000003, "r": 156.01654, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "PACKAGE_SCHEMA", "bbox": {"l": 70.800018, "t": 205.51782000000003, "r": 156.01654, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 202.83545, "t": 205.51782000000003, "r": 267.08646, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "VARCHAR(128)", "bbox": {"l": 202.83545, "t": 205.51782000000003, "r": 267.08646, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 281.87076, "t": 205.51782000000003, "r": 470.44678, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "Schema name of the currently running package", "bbox": {"l": 281.87076, "t": 205.51782000000003, "r": 470.44678, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 70.800018, "t": 224.53754000000004, "r": 157.89932, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "PACKAGE_VERSION", "bbox": {"l": 70.800018, "t": 224.53754000000004, "r": 157.89932, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 202.72472, "t": 224.53754000000004, "r": 261.98254, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "VARCHAR(64)", "bbox": {"l": 202.72472, "t": 224.53754000000004, "r": 261.98254, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 281.74924, "t": 224.53754000000004, "r": 478.8438100000001, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "Version identifier of the currently running package", "bbox": {"l": 281.74924, "t": 224.53754000000004, "r": 478.8438100000001, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 70.800018, "t": 243.55724999999995, "r": 154.41992, "b": 251.8822, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "ROUTINE_SCHEMA", "bbox": {"l": 70.800018, "t": 243.55724999999995, "r": 154.41992, "b": 251.8822, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 202.79312, "t": 243.55724999999995, "r": 267.09274, "b": 251.8822, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "VARCHAR(128)", "bbox": {"l": 202.79312, "t": 243.55724999999995, "r": 267.09274, "b": 251.8822, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 281.87164, "t": 243.55724999999995, "r": 464.26022, "b": 251.8822, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "Schema name of the currently running routine", "bbox": {"l": 281.87164, "t": 243.55724999999995, "r": 464.26022, "b": 251.8822, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 70.800018, "t": 262.51757999999995, "r": 188.43991, "b": 270.84253, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "ROUTINE_SPECIFIC_NAME", "bbox": {"l": 70.800018, "t": 262.51757999999995, "r": 188.43991, "b": 270.84253, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 202.84441, "t": 262.51757999999995, "r": 267.03693, "b": 270.84253, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "VARCHAR(128)", "bbox": {"l": 202.84441, "t": 262.51757999999995, "r": 267.03693, "b": 270.84253, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 281.80682, "t": 262.51757999999995, "r": 430.40045, "b": 270.84253, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "Name of the currently running routine", "bbox": {"l": 281.80682, "t": 262.51757999999995, "r": 430.40045, "b": 270.84253, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 70.800034, "t": 281.53726, "r": 139.43135, "b": 289.86227, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "ROUTINE_TYPE", "bbox": {"l": 70.800034, "t": 281.53726, "r": 139.43135, "b": 289.86227, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 202.74635, "t": 281.53726, "r": 239.28996000000004, "b": 289.86227, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "CHAR(1)", "bbox": {"l": 202.74635, "t": 281.53726, "r": 239.28996000000004, "b": 289.86227, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 281.79065, "t": 281.53726, "r": 425.09131, "b": 289.86227, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "Type of the currently running routine", "bbox": {"l": 281.79065, "t": 281.53726, "r": 425.09131, "b": 289.86227, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl"], "num_rows": 10, "num_cols": 3, "table_cells": [{"bbox": {"l": 70.800003, "t": 110.53801999999985, "r": 134.99071, "b": 118.86298, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Global variable", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 202.8894, "t": 110.53801999999985, "r": 223.34641, "b": 118.86298, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Type", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 281.8248, "t": 110.53801999999985, "r": 331.3428, "b": 118.86298, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Description", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800003, "t": 129.49834999999996, "r": 132.7209, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "CLIENT_HOST", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.89029, "t": 129.49834999999996, "r": 267.07651, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(255)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.84732, "t": 129.49834999999996, "r": 510.17548, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Host name of the current client as returned by the system", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800018, "t": 148.51806999999997, "r": 140.66522, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "CLIENT_IPADDR", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.87231, "t": 148.51806999999997, "r": 267.07739, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(128)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.84549, "t": 148.51806999999997, "r": 509.60583, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "IP address of the current client as returned by the system", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800018, "t": 167.53778, "r": 134.98264, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "CLIENT_PORT", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.90294, "t": 167.53778, "r": 242.80084, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "INTEGER", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.79785, "t": 167.53778, "r": 527.59222, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Port used by the current client to communicate with the server", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800018, "t": 186.5575, "r": 143.50925, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PACKAGE_NAME", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.80576, "t": 186.5575, "r": 267.06937, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(128)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.85187, "t": 186.5575, "r": 436.57259999999997, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Name of the currently running package", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800018, "t": 205.51782000000003, "r": 156.01654, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PACKAGE_SCHEMA", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.83545, "t": 205.51782000000003, "r": 267.08646, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(128)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.87076, "t": 205.51782000000003, "r": 470.44678, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Schema name of the currently running package", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800018, "t": 224.53754000000004, "r": 157.89932, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PACKAGE_VERSION", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.72472, "t": 224.53754000000004, "r": 261.98254, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(64)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.74924, "t": 224.53754000000004, "r": 478.8438100000001, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Version identifier of the currently running package", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800018, "t": 243.55724999999995, "r": 154.41992, "b": 251.8822, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "ROUTINE_SCHEMA", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.79312, "t": 243.55724999999995, "r": 267.09274, "b": 251.8822, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(128)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.87164, "t": 243.55724999999995, "r": 464.26022, "b": 251.8822, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Schema name of the currently running routine", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800018, "t": 262.51757999999995, "r": 188.43991, "b": 270.84253, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "ROUTINE_SPECIFIC_NAME", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.84441, "t": 262.51757999999995, "r": 267.03693, "b": 270.84253, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(128)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.80682, "t": 262.51757999999995, "r": 430.40045, "b": 270.84253, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Name of the currently running routine", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800034, "t": 281.53726, "r": 139.43135, "b": 289.86227, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "ROUTINE_TYPE", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.74635, "t": 281.53726, "r": 239.28996000000004, "b": 289.86227, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "CHAR(1)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.79065, "t": 281.53726, "r": 425.09131, "b": 289.86227, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Type of the currently running routine", "column_header": false, "row_header": false, "row_section": false}]}], "body": [{"label": "text", "id": 11, "page_no": 11, "cluster": {"id": 11, "label": "text", "bbox": {"l": 136.8, "t": 71.50867000000005, "r": 342.54773, "b": 80.72167999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.8370978832244873, "cells": [{"id": 2, "text": "Table 3-2 lists the nine built-in global variables.", "bbox": {"l": 136.8, "t": 71.50867000000005, "r": 342.54773, "b": 80.72167999999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 3-2 lists the nine built-in global variables."}, {"label": "caption", "id": 10, "page_no": 11, "cluster": {"id": 10, "label": "caption", "bbox": {"l": 64.800003, "t": 93.49805000000003, "r": 201.18147, "b": 101.82299999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.913235604763031, "cells": [{"id": 3, "text": "Table 3-2 Built-in global variables", "bbox": {"l": 64.800003, "t": 93.49805000000003, "r": 201.18147, "b": 101.82299999999998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 3-2 Built-in global variables"}, {"label": "section_header", "id": 3, "page_no": 11, "cluster": {"id": 3, "label": "section_header", "bbox": {"l": 64.800003, "t": 322.20071, "r": 384.36389, "b": 336.96371000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9645338654518127, "cells": [{"id": 4, "text": "3.3", "bbox": {"l": 64.800003, "t": 322.20071, "r": 87.318192, "b": 336.96371000000005, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "VERIFY_GROUP_FOR_USER function", "bbox": {"l": 91.821815, "t": 322.20071, "r": 384.36389, "b": 336.96371000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3.3 VERIFY_GROUP_FOR_USER function"}, {"label": "text", "id": 1, "page_no": 11, "cluster": {"id": 1, "label": "text", "bbox": {"l": 136.8, "t": 354.52872, "r": 547.23474, "b": 435.74060000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9864333868026733, "cells": [{"id": 6, "text": "The VERIFY_GROUP_FOR_USER function was added in IBM i 7.2. Although it is primarily ", "bbox": {"l": 136.8, "t": 354.52872, "r": 542.83539, "b": 363.7417, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "intended for use with RCAC permissions and masks, it can be used in other SQL statements. ", "bbox": {"l": 136.8, "t": 366.52853, "r": 547.14783, "b": 375.74152, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "The first parameter must be one of these three special registers: SESSION_USER, USER, or ", "bbox": {"l": 136.8, "t": 378.52835, "r": 547.15106, "b": 387.74132999999995, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "CURRENT_USER. The second and subsequent parameters are a list of user or group ", "bbox": {"l": 136.80002, "t": 390.52817, "r": 520.62958, "b": 399.74115000000006, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "profiles. Each of these values must be 1 - 10 characters in length. These values are not ", "bbox": {"l": 136.80002, "t": 402.52798, "r": 524.88824, "b": 411.74097, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "validated for their existence, which means that you can specify the names of user profiles that ", "bbox": {"l": 136.80002, "t": 414.5278, "r": 547.23474, "b": 423.7407799999999, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "do not exist without receiving any kind of error.", "bbox": {"l": 136.80002, "t": 426.52762, "r": 342.04672, "b": 435.74060000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The VERIFY_GROUP_FOR_USER function was added in IBM i 7.2. Although it is primarily intended for use with RCAC permissions and masks, it can be used in other SQL statements. The first parameter must be one of these three special registers: SESSION_USER, USER, or CURRENT_USER. The second and subsequent parameters are a list of user or group profiles. Each of these values must be 1 - 10 characters in length. These values are not validated for their existence, which means that you can specify the names of user profiles that do not exist without receiving any kind of error."}, {"label": "text", "id": 2, "page_no": 11, "cluster": {"id": 2, "label": "text", "bbox": {"l": 136.80002, "t": 448.48743, "r": 547.25739, "b": 481.70004, "coord_origin": "TOPLEFT"}, "confidence": 0.9807308912277222, "cells": [{"id": 13, "text": "If a special register value is in the list of user profiles or it is a member of a group profile ", "bbox": {"l": 136.80002, "t": 448.48743, "r": 525.1474, "b": 457.70041, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "included in the list, the function returns a long integer value of 1. Otherwise, it returns a value ", "bbox": {"l": 136.80002, "t": 460.48724, "r": 547.25739, "b": 469.70023, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "of 0. It never returns the null value.", "bbox": {"l": 136.80002, "t": 472.48706, "r": 289.84335, "b": 481.70004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "If a special register value is in the list of user profiles or it is a member of a group profile included in the list, the function returns a long integer value of 1. Otherwise, it returns a value of 0. It never returns the null value."}, {"label": "text", "id": 8, "page_no": 11, "cluster": {"id": 8, "label": "text", "bbox": {"l": 136.80002, "t": 494.50662, "r": 458.44525000000004, "b": 503.7196, "coord_origin": "TOPLEFT"}, "confidence": 0.9237529635429382, "cells": [{"id": 16, "text": "Here is an example of using the VERIFY_GROUP_FOR_USER function:", "bbox": {"l": 136.80002, "t": 494.50662, "r": 458.44525000000004, "b": 503.7196, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Here is an example of using the VERIFY_GROUP_FOR_USER function:"}, {"label": "list_item", "id": 7, "page_no": 11, "cluster": {"id": 7, "label": "list_item", "bbox": {"l": 136.80002, "t": 511.5462, "r": 406.07751, "b": 520.75919, "coord_origin": "TOPLEFT"}, "confidence": 0.9338629841804504, "cells": [{"id": 17, "text": "1.", "bbox": {"l": 136.80002, "t": 511.5462, "r": 145.09804, "b": 520.75919, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "There are user profiles for MGR, JANE, JUDY, and TONY.", "bbox": {"l": 147.86403, "t": 511.5462, "r": 406.07751, "b": 520.75919, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1. There are user profiles for MGR, JANE, JUDY, and TONY."}, {"label": "list_item", "id": 4, "page_no": 11, "cluster": {"id": 4, "label": "list_item", "bbox": {"l": 136.80002, "t": 528.5260000000001, "r": 396.98816, "b": 537.739, "coord_origin": "TOPLEFT"}, "confidence": 0.9514460563659668, "cells": [{"id": 19, "text": "2.", "bbox": {"l": 136.80002, "t": 528.5260000000001, "r": 145.23297, "b": 537.739, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "The user profile JANE specifies a group profile of MGR.", "bbox": {"l": 148.04396, "t": 528.5260000000001, "r": 396.98816, "b": 537.739, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2. The user profile JANE specifies a group profile of MGR."}, {"label": "list_item", "id": 5, "page_no": 11, "cluster": {"id": 5, "label": "list_item", "bbox": {"l": 136.80002, "t": 545.50581, "r": 536.5686, "b": 566.71861, "coord_origin": "TOPLEFT"}, "confidence": 0.951230525970459, "cells": [{"id": 21, "text": "3.", "bbox": {"l": 136.80002, "t": 545.50581, "r": 145.18951, "b": 554.71881, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "If a user is connected to the server using user profile JANE, all of the following function ", "bbox": {"l": 147.98601, "t": 545.50581, "r": 536.5686, "b": 554.71881, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "invocations return a value of 1:", "bbox": {"l": 151.20018, "t": 557.50562, "r": 286.84641, "b": 566.71861, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3. If a user is connected to the server using user profile JANE, all of the following function invocations return a value of 1:"}, {"label": "code", "id": 12, "page_no": 11, "cluster": {"id": 12, "label": "code", "bbox": {"l": 151.20018, "t": 574.69458, "r": 451.01605, "b": 641.4285600000001, "coord_origin": "TOPLEFT"}, "confidence": 0.7066455483436584, "cells": [{"id": 24, "text": "VERIFY_GROUP_FOR_USER (CURRENT_USER, 'MGR')", "bbox": {"l": 151.20018, "t": 574.69458, "r": 366.05725, "b": 583.46933, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "VERIFY_GROUP_FOR_USER (CURRENT_USER, 'JANE', 'MGR')", "bbox": {"l": 151.20018, "t": 586.69438, "r": 406.01678, "b": 595.46913, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "VERIFY_GROUP_FOR_USER (CURRENT_USER, 'JANE', 'MGR', 'STEVE')", "bbox": {"l": 151.20018, "t": 598.69418, "r": 451.01605, "b": 607.46893, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "The following function invocation returns a value of 0:", "bbox": {"l": 151.20018, "t": 615.5246, "r": 385.87271, "b": 624.73759, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "VERIFY_GROUP_FOR_USER (CURRENT_USER, 'JUDY', 'TONY')", "bbox": {"l": 151.20018, "t": 632.65381, "r": 411.05655, "b": 641.4285600000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "VERIFY_GROUP_FOR_USER (CURRENT_USER, 'MGR') VERIFY_GROUP_FOR_USER (CURRENT_USER, 'JANE', 'MGR') VERIFY_GROUP_FOR_USER (CURRENT_USER, 'JANE', 'MGR', 'STEVE') The following function invocation returns a value of 0: VERIFY_GROUP_FOR_USER (CURRENT_USER, 'JUDY', 'TONY')"}, {"label": "table", "id": 0, "page_no": 11, "cluster": {"id": 0, "label": "table", "bbox": {"l": 63.55636978149414, "t": 104.23387145996094, "r": 548.5687255859375, "b": 296.22467041015625, "coord_origin": "TOPLEFT"}, "confidence": 0.9868634939193726, "cells": [{"id": 29, "text": "Global variable", "bbox": {"l": 70.800003, "t": 110.53801999999985, "r": 134.99071, "b": 118.86298, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Type", "bbox": {"l": 202.8894, "t": 110.53801999999985, "r": 223.34641, "b": 118.86298, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Description", "bbox": {"l": 281.8248, "t": 110.53801999999985, "r": 331.3428, "b": 118.86298, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "CLIENT_HOST", "bbox": {"l": 70.800003, "t": 129.49834999999996, "r": 132.7209, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "VARCHAR(255)", "bbox": {"l": 202.89029, "t": 129.49834999999996, "r": 267.07651, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Host name of the current client as returned by the system", "bbox": {"l": 281.84732, "t": 129.49834999999996, "r": 510.17548, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "CLIENT_IPADDR", "bbox": {"l": 70.800018, "t": 148.51806999999997, "r": 140.66522, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "VARCHAR(128)", "bbox": {"l": 202.87231, "t": 148.51806999999997, "r": 267.07739, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "IP address of the current client as returned by the system", "bbox": {"l": 281.84549, "t": 148.51806999999997, "r": 509.60583, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "CLIENT_PORT ", "bbox": {"l": 70.800018, "t": 167.53778, "r": 134.98264, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "INTEGER", "bbox": {"l": 202.90294, "t": 167.53778, "r": 242.80084, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "Port used by the current client to communicate with the server", "bbox": {"l": 281.79785, "t": 167.53778, "r": 527.59222, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "PACKAGE_NAME", "bbox": {"l": 70.800018, "t": 186.5575, "r": 143.50925, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "VARCHAR(128)", "bbox": {"l": 202.80576, "t": 186.5575, "r": 267.06937, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Name of the currently running package", "bbox": {"l": 281.85187, "t": 186.5575, "r": 436.57259999999997, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "PACKAGE_SCHEMA", "bbox": {"l": 70.800018, "t": 205.51782000000003, "r": 156.01654, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "VARCHAR(128)", "bbox": {"l": 202.83545, "t": 205.51782000000003, "r": 267.08646, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "Schema name of the currently running package", "bbox": {"l": 281.87076, "t": 205.51782000000003, "r": 470.44678, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "PACKAGE_VERSION", "bbox": {"l": 70.800018, "t": 224.53754000000004, "r": 157.89932, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "VARCHAR(64)", "bbox": {"l": 202.72472, "t": 224.53754000000004, "r": 261.98254, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "Version identifier of the currently running package", "bbox": {"l": 281.74924, "t": 224.53754000000004, "r": 478.8438100000001, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "ROUTINE_SCHEMA", "bbox": {"l": 70.800018, "t": 243.55724999999995, "r": 154.41992, "b": 251.8822, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "VARCHAR(128)", "bbox": {"l": 202.79312, "t": 243.55724999999995, "r": 267.09274, "b": 251.8822, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Schema name of the currently running routine", "bbox": {"l": 281.87164, "t": 243.55724999999995, "r": 464.26022, "b": 251.8822, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "ROUTINE_SPECIFIC_NAME", "bbox": {"l": 70.800018, "t": 262.51757999999995, "r": 188.43991, "b": 270.84253, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "VARCHAR(128)", "bbox": {"l": 202.84441, "t": 262.51757999999995, "r": 267.03693, "b": 270.84253, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "Name of the currently running routine", "bbox": {"l": 281.80682, "t": 262.51757999999995, "r": 430.40045, "b": 270.84253, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "ROUTINE_TYPE", "bbox": {"l": 70.800034, "t": 281.53726, "r": 139.43135, "b": 289.86227, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "CHAR(1)", "bbox": {"l": 202.74635, "t": 281.53726, "r": 239.28996000000004, "b": 289.86227, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Type of the currently running routine", "bbox": {"l": 281.79065, "t": 281.53726, "r": 425.09131, "b": 289.86227, "coord_origin": "TOPLEFT"}}], "children": [{"id": 14, "label": "text", "bbox": {"l": 70.800003, "t": 110.53801999999985, "r": 134.99071, "b": 118.86298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "Global variable", "bbox": {"l": 70.800003, "t": 110.53801999999985, "r": 134.99071, "b": 118.86298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 202.8894, "t": 110.53801999999985, "r": 223.34641, "b": 118.86298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "Type", "bbox": {"l": 202.8894, "t": 110.53801999999985, "r": 223.34641, "b": 118.86298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 281.8248, "t": 110.53801999999985, "r": 331.3428, "b": 118.86298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "Description", "bbox": {"l": 281.8248, "t": 110.53801999999985, "r": 331.3428, "b": 118.86298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 70.800003, "t": 129.49834999999996, "r": 132.7209, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "CLIENT_HOST", "bbox": {"l": 70.800003, "t": 129.49834999999996, "r": 132.7209, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 202.89029, "t": 129.49834999999996, "r": 267.07651, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "VARCHAR(255)", "bbox": {"l": 202.89029, "t": 129.49834999999996, "r": 267.07651, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 281.84732, "t": 129.49834999999996, "r": 510.17548, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "Host name of the current client as returned by the system", "bbox": {"l": 281.84732, "t": 129.49834999999996, "r": 510.17548, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 70.800018, "t": 148.51806999999997, "r": 140.66522, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "CLIENT_IPADDR", "bbox": {"l": 70.800018, "t": 148.51806999999997, "r": 140.66522, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 202.87231, "t": 148.51806999999997, "r": 267.07739, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "VARCHAR(128)", "bbox": {"l": 202.87231, "t": 148.51806999999997, "r": 267.07739, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 281.84549, "t": 148.51806999999997, "r": 509.60583, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "IP address of the current client as returned by the system", "bbox": {"l": 281.84549, "t": 148.51806999999997, "r": 509.60583, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 70.800018, "t": 167.53778, "r": 134.98264, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "CLIENT_PORT ", "bbox": {"l": 70.800018, "t": 167.53778, "r": 134.98264, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 202.90294, "t": 167.53778, "r": 242.80084, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "INTEGER", "bbox": {"l": 202.90294, "t": 167.53778, "r": 242.80084, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 281.79785, "t": 167.53778, "r": 527.59222, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "Port used by the current client to communicate with the server", "bbox": {"l": 281.79785, "t": 167.53778, "r": 527.59222, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 70.800018, "t": 186.5575, "r": 143.50925, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "PACKAGE_NAME", "bbox": {"l": 70.800018, "t": 186.5575, "r": 143.50925, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 202.80576, "t": 186.5575, "r": 267.06937, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "VARCHAR(128)", "bbox": {"l": 202.80576, "t": 186.5575, "r": 267.06937, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 281.85187, "t": 186.5575, "r": 436.57259999999997, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "Name of the currently running package", "bbox": {"l": 281.85187, "t": 186.5575, "r": 436.57259999999997, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 70.800018, "t": 205.51782000000003, "r": 156.01654, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "PACKAGE_SCHEMA", "bbox": {"l": 70.800018, "t": 205.51782000000003, "r": 156.01654, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 202.83545, "t": 205.51782000000003, "r": 267.08646, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "VARCHAR(128)", "bbox": {"l": 202.83545, "t": 205.51782000000003, "r": 267.08646, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 281.87076, "t": 205.51782000000003, "r": 470.44678, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "Schema name of the currently running package", "bbox": {"l": 281.87076, "t": 205.51782000000003, "r": 470.44678, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 70.800018, "t": 224.53754000000004, "r": 157.89932, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "PACKAGE_VERSION", "bbox": {"l": 70.800018, "t": 224.53754000000004, "r": 157.89932, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 202.72472, "t": 224.53754000000004, "r": 261.98254, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "VARCHAR(64)", "bbox": {"l": 202.72472, "t": 224.53754000000004, "r": 261.98254, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 281.74924, "t": 224.53754000000004, "r": 478.8438100000001, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "Version identifier of the currently running package", "bbox": {"l": 281.74924, "t": 224.53754000000004, "r": 478.8438100000001, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 70.800018, "t": 243.55724999999995, "r": 154.41992, "b": 251.8822, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "ROUTINE_SCHEMA", "bbox": {"l": 70.800018, "t": 243.55724999999995, "r": 154.41992, "b": 251.8822, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 202.79312, "t": 243.55724999999995, "r": 267.09274, "b": 251.8822, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "VARCHAR(128)", "bbox": {"l": 202.79312, "t": 243.55724999999995, "r": 267.09274, "b": 251.8822, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 281.87164, "t": 243.55724999999995, "r": 464.26022, "b": 251.8822, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "Schema name of the currently running routine", "bbox": {"l": 281.87164, "t": 243.55724999999995, "r": 464.26022, "b": 251.8822, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 70.800018, "t": 262.51757999999995, "r": 188.43991, "b": 270.84253, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "ROUTINE_SPECIFIC_NAME", "bbox": {"l": 70.800018, "t": 262.51757999999995, "r": 188.43991, "b": 270.84253, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 202.84441, "t": 262.51757999999995, "r": 267.03693, "b": 270.84253, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "VARCHAR(128)", "bbox": {"l": 202.84441, "t": 262.51757999999995, "r": 267.03693, "b": 270.84253, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 281.80682, "t": 262.51757999999995, "r": 430.40045, "b": 270.84253, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "Name of the currently running routine", "bbox": {"l": 281.80682, "t": 262.51757999999995, "r": 430.40045, "b": 270.84253, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 70.800034, "t": 281.53726, "r": 139.43135, "b": 289.86227, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "ROUTINE_TYPE", "bbox": {"l": 70.800034, "t": 281.53726, "r": 139.43135, "b": 289.86227, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 202.74635, "t": 281.53726, "r": 239.28996000000004, "b": 289.86227, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "CHAR(1)", "bbox": {"l": 202.74635, "t": 281.53726, "r": 239.28996000000004, "b": 289.86227, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 281.79065, "t": 281.53726, "r": 425.09131, "b": 289.86227, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "Type of the currently running routine", "bbox": {"l": 281.79065, "t": 281.53726, "r": 425.09131, "b": 289.86227, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl"], "num_rows": 10, "num_cols": 3, "table_cells": [{"bbox": {"l": 70.800003, "t": 110.53801999999985, "r": 134.99071, "b": 118.86298, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Global variable", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 202.8894, "t": 110.53801999999985, "r": 223.34641, "b": 118.86298, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Type", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 281.8248, "t": 110.53801999999985, "r": 331.3428, "b": 118.86298, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Description", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800003, "t": 129.49834999999996, "r": 132.7209, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "CLIENT_HOST", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.89029, "t": 129.49834999999996, "r": 267.07651, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(255)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.84732, "t": 129.49834999999996, "r": 510.17548, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Host name of the current client as returned by the system", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800018, "t": 148.51806999999997, "r": 140.66522, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "CLIENT_IPADDR", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.87231, "t": 148.51806999999997, "r": 267.07739, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(128)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.84549, "t": 148.51806999999997, "r": 509.60583, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "IP address of the current client as returned by the system", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800018, "t": 167.53778, "r": 134.98264, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "CLIENT_PORT", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.90294, "t": 167.53778, "r": 242.80084, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "INTEGER", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.79785, "t": 167.53778, "r": 527.59222, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Port used by the current client to communicate with the server", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800018, "t": 186.5575, "r": 143.50925, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PACKAGE_NAME", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.80576, "t": 186.5575, "r": 267.06937, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(128)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.85187, "t": 186.5575, "r": 436.57259999999997, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Name of the currently running package", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800018, "t": 205.51782000000003, "r": 156.01654, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PACKAGE_SCHEMA", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.83545, "t": 205.51782000000003, "r": 267.08646, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(128)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.87076, "t": 205.51782000000003, "r": 470.44678, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Schema name of the currently running package", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800018, "t": 224.53754000000004, "r": 157.89932, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PACKAGE_VERSION", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.72472, "t": 224.53754000000004, "r": 261.98254, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(64)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.74924, "t": 224.53754000000004, "r": 478.8438100000001, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Version identifier of the currently running package", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800018, "t": 243.55724999999995, "r": 154.41992, "b": 251.8822, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "ROUTINE_SCHEMA", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.79312, "t": 243.55724999999995, "r": 267.09274, "b": 251.8822, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(128)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.87164, "t": 243.55724999999995, "r": 464.26022, "b": 251.8822, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Schema name of the currently running routine", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800018, "t": 262.51757999999995, "r": 188.43991, "b": 270.84253, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "ROUTINE_SPECIFIC_NAME", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.84441, "t": 262.51757999999995, "r": 267.03693, "b": 270.84253, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(128)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.80682, "t": 262.51757999999995, "r": 430.40045, "b": 270.84253, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Name of the currently running routine", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800034, "t": 281.53726, "r": 139.43135, "b": 289.86227, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "ROUTINE_TYPE", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.74635, "t": 281.53726, "r": 239.28996000000004, "b": 289.86227, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "CHAR(1)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.79065, "t": 281.53726, "r": 425.09131, "b": 289.86227, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Type of the currently running routine", "column_header": false, "row_header": false, "row_section": false}]}], "headers": [{"label": "page_footer", "id": 9, "page_no": 11, "cluster": {"id": 9, "label": "page_footer", "bbox": {"l": 64.800003, "t": 754.848721, "r": 78.402, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.9187920093536377, "cells": [{"id": 0, "text": "20 ", "bbox": {"l": 64.800003, "t": 754.848721, "r": 78.402, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "20"}, {"label": "page_footer", "id": 6, "page_no": 11, "cluster": {"id": 6, "label": "page_footer", "bbox": {"l": 93.420303, "t": 755.538002, "r": 334.42142, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9505079388618469, "cells": [{"id": 1, "text": "Row and Column Access Control Support in IBM DB2 for i", "bbox": {"l": 93.420303, "t": 755.538002, "r": 334.42142, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Row and Column Access Control Support in IBM DB2 for i"}]}}, {"page_no": 12, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "Chapter 3. Row and Column Access Control ", "bbox": {"l": 344.94, "t": 755.538002, "r": 523.60162, "b": 763.863001, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "27", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "RETURN", "bbox": {"l": 136.79959, "t": 71.65845000000002, "r": 166.73935, "b": 80.43322999999998, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "CASE", "bbox": {"l": 136.79959, "t": 83.65826000000004, "r": 156.77934, "b": 92.43304, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'HR', 'EMP' ) = 1", "bbox": {"l": 147.26993, "t": 95.65808000000015, "r": 466.61502, "b": 104.43286000000012, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "THEN EMPLOYEES . DATE_OF_BIRTH", "bbox": {"l": 147.73068, "t": 107.65790000000004, "r": 311.69717, "b": 116.43268, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1", "bbox": {"l": 147.31944, "t": 131.65752999999995, "r": 436.61547999999993, "b": 140.43231000000003, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "AND SESSION_USER = EMPLOYEES . USER_ID", "bbox": {"l": 147.54245, "t": 143.65734999999995, "r": 351.65668, "b": 152.43213000000003, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "THEN EMPLOYEES . DATE_OF_BIRTH", "bbox": {"l": 147.73068, "t": 155.65716999999995, "r": 311.69717, "b": 164.43195000000003, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1", "bbox": {"l": 147.31944, "t": 179.65679999999998, "r": 436.61547999999993, "b": 188.43158000000005, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "AND SESSION_USER <> EMPLOYEES . USER_ID", "bbox": {"l": 147.52335, "t": 191.65661999999998, "r": 356.63669, "b": 200.43140000000005, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "THEN ( 9999 || '-' ||", "bbox": {"l": 147.63832, "t": 203.65643, "r": 261.44492, "b": 212.43120999999996, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "MONTH ( EMPLOYEES . DATE_OF_BIRTH ) || '-'", "bbox": {"l": 272.28363, "t": 203.65643, "r": 499.89682, "b": 212.43120999999996, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "||", "bbox": {"l": 510.73557, "t": 203.65643, "r": 521.57428, "b": 212.43120999999996, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "DAY (EMPLOYEES.DATE_OF_BIRTH ))", "bbox": {"l": 160.78555, "t": 215.65625, "r": 346.6767, "b": 224.43102999999996, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "ELSE NULL", "bbox": {"l": 149.51941, "t": 227.65607, "r": 206.75861, "b": 236.43084999999996, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": " END", "bbox": {"l": 136.79959, "t": 239.65588000000002, "r": 156.77934, "b": 248.43066, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": " ENABLE ;", "bbox": {"l": 136.79959, "t": 251.65570000000002, "r": 186.7191, "b": 260.43048, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "2.", "bbox": {"l": 136.79959, "t": 275.50591999999995, "r": 145.18994, "b": 284.7189, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "The other column to mask in this example is the TAX_ID information. In this example, the ", "bbox": {"l": 147.98672, "t": 275.50591999999995, "r": 547.21222, "b": 284.7189, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "rules to enforce include the following ones:", "bbox": {"l": 151.19977, "t": 287.50574, "r": 339.37903, "b": 296.71871999999996, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "-", "bbox": {"l": 152.0394, "t": 304.48553000000004, "r": 157.61201, "b": 313.69852000000003, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "Human Resources can see the unmasked TAX_ID of the employees.", "bbox": {"l": 165.59894, "t": 304.48553000000004, "r": 469.1528, "b": 313.69852000000003, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "-", "bbox": {"l": 152.0394, "t": 321.52512, "r": 157.60504, "b": 330.7381, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "Employees can see only their own unmasked TAX_ID.", "bbox": {"l": 165.59894, "t": 321.52512, "r": 403.95953, "b": 330.7381, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "-", "bbox": {"l": 152.0394, "t": 338.50491, "r": 157.57019, "b": 347.7179, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "Managers see a masked version of TAX_ID with the first five characters replaced with ", "bbox": {"l": 165.59894, "t": 338.50491, "r": 545.16846, "b": 347.7179, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "the X character (for example, XXX-XX-1234).", "bbox": {"l": 165.59894, "t": 350.50473, "r": 364.67947, "b": 359.71771, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "-", "bbox": {"l": 152.0394, "t": 367.48453, "r": 157.59309, "b": 376.6975100000001, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Any other person sees the entire TAX_ID as masked, for example, XXX-XX-XXXX.", "bbox": {"l": 165.59995, "t": 367.48453, "r": 529.46362, "b": 376.6975100000001, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "To implement this column mask, run the SQL statement that is shown in Example 3-9.", "bbox": {"l": 151.19978, "t": 384.52411, "r": 530.0603, "b": 393.73709, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Example 3-9 Creating a mask on the TAX_ID column", "bbox": {"l": 136.8, "t": 406.51801, "r": 351.9873, "b": 414.84302, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "CREATE MASK", "bbox": {"l": 136.8, "t": 423.67810000000003, "r": 192.91296, "b": 432.45287999999994, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "HR_SCHEMA.MASK_TAX_ID_ON_EMPLOYEES ", "bbox": {"l": 203.11533, "t": 423.67810000000003, "r": 381.65659, "b": 432.45287999999994, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "ON", "bbox": {"l": 136.8, "t": 435.67792, "r": 148.54184, "b": 444.45270000000005, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "HR_SCHEMA.EMPLOYEES AS EMPLOYEES ", "bbox": {"l": 177.89645, "t": 435.67792, "r": 371.63684, "b": 444.45270000000005, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "FOR COLUMN", "bbox": {"l": 136.8, "t": 447.67773, "r": 199.25916, "b": 456.45251, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "TAX_ID", "bbox": {"l": 211.75098, "t": 447.67773, "r": 249.22647, "b": 456.45251, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "RETURN ", "bbox": {"l": 136.8, "t": 459.67755, "r": 176.75952, "b": 468.45233, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "CASE ", "bbox": {"l": 136.8, "t": 471.67737, "r": 161.75977, "b": 480.45215, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'HR' ) = 1", "bbox": {"l": 152.84189, "t": 483.67719, "r": 441.59589, "b": 492.45197, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "THEN EMPLOYEES . TAX_ID ", "bbox": {"l": 154.01309, "t": 495.677, "r": 291.7178, "b": 504.45178, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1 ", "bbox": {"l": 152.80757, "t": 519.67661, "r": 451.6156, "b": 528.45139, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "AND SESSION_USER = EMPLOYEES . USER_ID ", "bbox": {"l": 153.21835, "t": 531.67642, "r": 366.65683, "b": 540.45117, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "THEN EMPLOYEES . TAX_ID", "bbox": {"l": 154.09363, "t": 543.6762200000001, "r": 286.67804, "b": 552.45097, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1", "bbox": {"l": 152.82599, "t": 567.67583, "r": 446.63561999999996, "b": 576.45058, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "AND SESSION_USER <> EMPLOYEES . USER_ID ", "bbox": {"l": 153.18398, "t": 579.67563, "r": 371.63684, "b": 588.45038, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "THEN ( 'XXX-XX-' CONCAT QSYS2 . SUBSTR ( EMPLOYEES . TAX_ID , 8 , 4 ) )", "bbox": {"l": 152.60088, "t": 591.67543, "r": 526.55469, "b": 600.45018, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'EMP' ) = 1 ", "bbox": {"l": 152.80757, "t": 615.67505, "r": 451.6156, "b": 624.4498, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "THEN EMPLOYEES . TAX_ID ", "bbox": {"l": 154.01309, "t": 627.67485, "r": 291.7178, "b": 636.4496, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "ELSE 'XXX-XX-XXXX' ", "bbox": {"l": 154.5134, "t": 651.67447, "r": 266.69827, "b": 660.44922, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "END", "bbox": {"l": 136.8, "t": 663.67427, "r": 157.7877, "b": 672.44904, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "ENABLE ;", "bbox": {"l": 136.8, "t": 675.67409, "r": 181.73952, "b": 684.44884, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 1, "label": "page_footer", "bbox": {"l": 344.94, "t": 755.538002, "r": 523.60162, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9556925892829895, "cells": [{"id": 0, "text": "Chapter 3. Row and Column Access Control ", "bbox": {"l": 344.94, "t": 755.538002, "r": 523.60162, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "page_footer", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.9105783104896545, "cells": [{"id": 1, "text": "27", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 136.79959, "t": 71.65845000000002, "r": 166.73935, "b": 80.43322999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.5606335997581482, "cells": [{"id": 2, "text": "RETURN", "bbox": {"l": 136.79959, "t": 71.65845000000002, "r": 166.73935, "b": 80.43322999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 136.79959, "t": 83.65826000000004, "r": 156.77934, "b": 92.43304, "coord_origin": "TOPLEFT"}, "confidence": 0.589726984500885, "cells": [{"id": 3, "text": "CASE", "bbox": {"l": 136.79959, "t": 83.65826000000004, "r": 156.77934, "b": 92.43304, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "code", "bbox": {"l": 136.79959, "t": 95.65808000000015, "r": 521.57428, "b": 260.43048, "coord_origin": "TOPLEFT"}, "confidence": 0.778521716594696, "cells": [{"id": 4, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'HR', 'EMP' ) = 1", "bbox": {"l": 147.26993, "t": 95.65808000000015, "r": 466.61502, "b": 104.43286000000012, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "THEN EMPLOYEES . DATE_OF_BIRTH", "bbox": {"l": 147.73068, "t": 107.65790000000004, "r": 311.69717, "b": 116.43268, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1", "bbox": {"l": 147.31944, "t": 131.65752999999995, "r": 436.61547999999993, "b": 140.43231000000003, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "AND SESSION_USER = EMPLOYEES . USER_ID", "bbox": {"l": 147.54245, "t": 143.65734999999995, "r": 351.65668, "b": 152.43213000000003, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "THEN EMPLOYEES . DATE_OF_BIRTH", "bbox": {"l": 147.73068, "t": 155.65716999999995, "r": 311.69717, "b": 164.43195000000003, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1", "bbox": {"l": 147.31944, "t": 179.65679999999998, "r": 436.61547999999993, "b": 188.43158000000005, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "AND SESSION_USER <> EMPLOYEES . USER_ID", "bbox": {"l": 147.52335, "t": 191.65661999999998, "r": 356.63669, "b": 200.43140000000005, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "THEN ( 9999 || '-' ||", "bbox": {"l": 147.63832, "t": 203.65643, "r": 261.44492, "b": 212.43120999999996, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "MONTH ( EMPLOYEES . DATE_OF_BIRTH ) || '-'", "bbox": {"l": 272.28363, "t": 203.65643, "r": 499.89682, "b": 212.43120999999996, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "||", "bbox": {"l": 510.73557, "t": 203.65643, "r": 521.57428, "b": 212.43120999999996, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "DAY (EMPLOYEES.DATE_OF_BIRTH ))", "bbox": {"l": 160.78555, "t": 215.65625, "r": 346.6767, "b": 224.43102999999996, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "ELSE NULL", "bbox": {"l": 149.51941, "t": 227.65607, "r": 206.75861, "b": 236.43084999999996, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": " END", "bbox": {"l": 136.79959, "t": 239.65588000000002, "r": 156.77934, "b": 248.43066, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": " ENABLE ;", "bbox": {"l": 136.79959, "t": 251.65570000000002, "r": 186.7191, "b": 260.43048, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "list_item", "bbox": {"l": 136.79959, "t": 275.50591999999995, "r": 547.21222, "b": 296.71871999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.8678942918777466, "cells": [{"id": 18, "text": "2.", "bbox": {"l": 136.79959, "t": 275.50591999999995, "r": 145.18994, "b": 284.7189, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "The other column to mask in this example is the TAX_ID information. In this example, the ", "bbox": {"l": 147.98672, "t": 275.50591999999995, "r": 547.21222, "b": 284.7189, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "rules to enforce include the following ones:", "bbox": {"l": 151.19977, "t": 287.50574, "r": 339.37903, "b": 296.71871999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "list_item", "bbox": {"l": 152.0394, "t": 304.48553000000004, "r": 469.1528, "b": 313.69852000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9461130499839783, "cells": [{"id": 21, "text": "-", "bbox": {"l": 152.0394, "t": 304.48553000000004, "r": 157.61201, "b": 313.69852000000003, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "Human Resources can see the unmasked TAX_ID of the employees.", "bbox": {"l": 165.59894, "t": 304.48553000000004, "r": 469.1528, "b": 313.69852000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "list_item", "bbox": {"l": 152.0394, "t": 321.52512, "r": 403.95953, "b": 330.7381, "coord_origin": "TOPLEFT"}, "confidence": 0.9467733502388, "cells": [{"id": 23, "text": "-", "bbox": {"l": 152.0394, "t": 321.52512, "r": 157.60504, "b": 330.7381, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "Employees can see only their own unmasked TAX_ID.", "bbox": {"l": 165.59894, "t": 321.52512, "r": 403.95953, "b": 330.7381, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "list_item", "bbox": {"l": 152.0394, "t": 338.50491, "r": 545.16846, "b": 359.71771, "coord_origin": "TOPLEFT"}, "confidence": 0.9705166220664978, "cells": [{"id": 25, "text": "-", "bbox": {"l": 152.0394, "t": 338.50491, "r": 157.57019, "b": 347.7179, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "Managers see a masked version of TAX_ID with the first five characters replaced with ", "bbox": {"l": 165.59894, "t": 338.50491, "r": 545.16846, "b": 347.7179, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "the X character (for example, XXX-XX-1234).", "bbox": {"l": 165.59894, "t": 350.50473, "r": 364.67947, "b": 359.71771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "list_item", "bbox": {"l": 152.0394, "t": 367.48453, "r": 529.46362, "b": 376.6975100000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9469642639160156, "cells": [{"id": 28, "text": "-", "bbox": {"l": 152.0394, "t": 367.48453, "r": 157.59309, "b": 376.6975100000001, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Any other person sees the entire TAX_ID as masked, for example, XXX-XX-XXXX.", "bbox": {"l": 165.59995, "t": 367.48453, "r": 529.46362, "b": 376.6975100000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "list_item", "bbox": {"l": 151.19978, "t": 384.52411, "r": 530.0603, "b": 393.73709, "coord_origin": "TOPLEFT"}, "confidence": 0.7003502249717712, "cells": [{"id": 30, "text": "To implement this column mask, run the SQL statement that is shown in Example 3-9.", "bbox": {"l": 151.19978, "t": 384.52411, "r": 530.0603, "b": 393.73709, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "caption", "bbox": {"l": 136.8, "t": 406.51801, "r": 351.9873, "b": 414.84302, "coord_origin": "TOPLEFT"}, "confidence": 0.8488203287124634, "cells": [{"id": 31, "text": "Example 3-9 Creating a mask on the TAX_ID column", "bbox": {"l": 136.8, "t": 406.51801, "r": 351.9873, "b": 414.84302, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "code", "bbox": {"l": 136.8, "t": 423.67810000000003, "r": 526.55469, "b": 684.44884, "coord_origin": "TOPLEFT"}, "confidence": 0.8411229252815247, "cells": [{"id": 32, "text": "CREATE MASK", "bbox": {"l": 136.8, "t": 423.67810000000003, "r": 192.91296, "b": 432.45287999999994, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "HR_SCHEMA.MASK_TAX_ID_ON_EMPLOYEES ", "bbox": {"l": 203.11533, "t": 423.67810000000003, "r": 381.65659, "b": 432.45287999999994, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "ON", "bbox": {"l": 136.8, "t": 435.67792, "r": 148.54184, "b": 444.45270000000005, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "HR_SCHEMA.EMPLOYEES AS EMPLOYEES ", "bbox": {"l": 177.89645, "t": 435.67792, "r": 371.63684, "b": 444.45270000000005, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "FOR COLUMN", "bbox": {"l": 136.8, "t": 447.67773, "r": 199.25916, "b": 456.45251, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "TAX_ID", "bbox": {"l": 211.75098, "t": 447.67773, "r": 249.22647, "b": 456.45251, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "RETURN ", "bbox": {"l": 136.8, "t": 459.67755, "r": 176.75952, "b": 468.45233, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "CASE ", "bbox": {"l": 136.8, "t": 471.67737, "r": 161.75977, "b": 480.45215, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'HR' ) = 1", "bbox": {"l": 152.84189, "t": 483.67719, "r": 441.59589, "b": 492.45197, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "THEN EMPLOYEES . TAX_ID ", "bbox": {"l": 154.01309, "t": 495.677, "r": 291.7178, "b": 504.45178, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1 ", "bbox": {"l": 152.80757, "t": 519.67661, "r": 451.6156, "b": 528.45139, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "AND SESSION_USER = EMPLOYEES . USER_ID ", "bbox": {"l": 153.21835, "t": 531.67642, "r": 366.65683, "b": 540.45117, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "THEN EMPLOYEES . TAX_ID", "bbox": {"l": 154.09363, "t": 543.6762200000001, "r": 286.67804, "b": 552.45097, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1", "bbox": {"l": 152.82599, "t": 567.67583, "r": 446.63561999999996, "b": 576.45058, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "AND SESSION_USER <> EMPLOYEES . USER_ID ", "bbox": {"l": 153.18398, "t": 579.67563, "r": 371.63684, "b": 588.45038, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "THEN ( 'XXX-XX-' CONCAT QSYS2 . SUBSTR ( EMPLOYEES . TAX_ID , 8 , 4 ) )", "bbox": {"l": 152.60088, "t": 591.67543, "r": 526.55469, "b": 600.45018, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'EMP' ) = 1 ", "bbox": {"l": 152.80757, "t": 615.67505, "r": 451.6156, "b": 624.4498, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "THEN EMPLOYEES . TAX_ID ", "bbox": {"l": 154.01309, "t": 627.67485, "r": 291.7178, "b": 636.4496, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "ELSE 'XXX-XX-XXXX' ", "bbox": {"l": 154.5134, "t": 651.67447, "r": 266.69827, "b": 660.44922, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "END", "bbox": {"l": 136.8, "t": 663.67427, "r": 157.7877, "b": 672.44904, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "ENABLE ;", "bbox": {"l": 136.8, "t": 675.67409, "r": 181.73952, "b": 684.44884, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_footer", "id": 1, "page_no": 12, "cluster": {"id": 1, "label": "page_footer", "bbox": {"l": 344.94, "t": 755.538002, "r": 523.60162, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9556925892829895, "cells": [{"id": 0, "text": "Chapter 3. Row and Column Access Control ", "bbox": {"l": 344.94, "t": 755.538002, "r": 523.60162, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Chapter 3. Row and Column Access Control"}, {"label": "page_footer", "id": 5, "page_no": 12, "cluster": {"id": 5, "label": "page_footer", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.9105783104896545, "cells": [{"id": 1, "text": "27", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "27"}, {"label": "text", "id": 13, "page_no": 12, "cluster": {"id": 13, "label": "text", "bbox": {"l": 136.79959, "t": 71.65845000000002, "r": 166.73935, "b": 80.43322999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.5606335997581482, "cells": [{"id": 2, "text": "RETURN", "bbox": {"l": 136.79959, "t": 71.65845000000002, "r": 166.73935, "b": 80.43322999999998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "RETURN"}, {"label": "text", "id": 12, "page_no": 12, "cluster": {"id": 12, "label": "text", "bbox": {"l": 136.79959, "t": 83.65826000000004, "r": 156.77934, "b": 92.43304, "coord_origin": "TOPLEFT"}, "confidence": 0.589726984500885, "cells": [{"id": 3, "text": "CASE", "bbox": {"l": 136.79959, "t": 83.65826000000004, "r": 156.77934, "b": 92.43304, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "CASE"}, {"label": "code", "id": 9, "page_no": 12, "cluster": {"id": 9, "label": "code", "bbox": {"l": 136.79959, "t": 95.65808000000015, "r": 521.57428, "b": 260.43048, "coord_origin": "TOPLEFT"}, "confidence": 0.778521716594696, "cells": [{"id": 4, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'HR', 'EMP' ) = 1", "bbox": {"l": 147.26993, "t": 95.65808000000015, "r": 466.61502, "b": 104.43286000000012, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "THEN EMPLOYEES . DATE_OF_BIRTH", "bbox": {"l": 147.73068, "t": 107.65790000000004, "r": 311.69717, "b": 116.43268, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1", "bbox": {"l": 147.31944, "t": 131.65752999999995, "r": 436.61547999999993, "b": 140.43231000000003, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "AND SESSION_USER = EMPLOYEES . USER_ID", "bbox": {"l": 147.54245, "t": 143.65734999999995, "r": 351.65668, "b": 152.43213000000003, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "THEN EMPLOYEES . DATE_OF_BIRTH", "bbox": {"l": 147.73068, "t": 155.65716999999995, "r": 311.69717, "b": 164.43195000000003, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1", "bbox": {"l": 147.31944, "t": 179.65679999999998, "r": 436.61547999999993, "b": 188.43158000000005, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "AND SESSION_USER <> EMPLOYEES . USER_ID", "bbox": {"l": 147.52335, "t": 191.65661999999998, "r": 356.63669, "b": 200.43140000000005, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "THEN ( 9999 || '-' ||", "bbox": {"l": 147.63832, "t": 203.65643, "r": 261.44492, "b": 212.43120999999996, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "MONTH ( EMPLOYEES . DATE_OF_BIRTH ) || '-'", "bbox": {"l": 272.28363, "t": 203.65643, "r": 499.89682, "b": 212.43120999999996, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "||", "bbox": {"l": 510.73557, "t": 203.65643, "r": 521.57428, "b": 212.43120999999996, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "DAY (EMPLOYEES.DATE_OF_BIRTH ))", "bbox": {"l": 160.78555, "t": 215.65625, "r": 346.6767, "b": 224.43102999999996, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "ELSE NULL", "bbox": {"l": 149.51941, "t": 227.65607, "r": 206.75861, "b": 236.43084999999996, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": " END", "bbox": {"l": 136.79959, "t": 239.65588000000002, "r": 156.77934, "b": 248.43066, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": " ENABLE ;", "bbox": {"l": 136.79959, "t": 251.65570000000002, "r": 186.7191, "b": 260.43048, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'HR', 'EMP' ) = 1 THEN EMPLOYEES . DATE_OF_BIRTH WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1 AND SESSION_USER = EMPLOYEES . USER_ID THEN EMPLOYEES . DATE_OF_BIRTH WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1 AND SESSION_USER <> EMPLOYEES . USER_ID THEN ( 9999 || '-' || MONTH ( EMPLOYEES . DATE_OF_BIRTH ) || '-' || DAY (EMPLOYEES.DATE_OF_BIRTH )) ELSE NULL END ENABLE ;"}, {"label": "list_item", "id": 6, "page_no": 12, "cluster": {"id": 6, "label": "list_item", "bbox": {"l": 136.79959, "t": 275.50591999999995, "r": 547.21222, "b": 296.71871999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.8678942918777466, "cells": [{"id": 18, "text": "2.", "bbox": {"l": 136.79959, "t": 275.50591999999995, "r": 145.18994, "b": 284.7189, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "The other column to mask in this example is the TAX_ID information. In this example, the ", "bbox": {"l": 147.98672, "t": 275.50591999999995, "r": 547.21222, "b": 284.7189, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "rules to enforce include the following ones:", "bbox": {"l": 151.19977, "t": 287.50574, "r": 339.37903, "b": 296.71871999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2. The other column to mask in this example is the TAX_ID information. In this example, the rules to enforce include the following ones:"}, {"label": "list_item", "id": 4, "page_no": 12, "cluster": {"id": 4, "label": "list_item", "bbox": {"l": 152.0394, "t": 304.48553000000004, "r": 469.1528, "b": 313.69852000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9461130499839783, "cells": [{"id": 21, "text": "-", "bbox": {"l": 152.0394, "t": 304.48553000000004, "r": 157.61201, "b": 313.69852000000003, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "Human Resources can see the unmasked TAX_ID of the employees.", "bbox": {"l": 165.59894, "t": 304.48553000000004, "r": 469.1528, "b": 313.69852000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "-Human Resources can see the unmasked TAX_ID of the employees."}, {"label": "list_item", "id": 3, "page_no": 12, "cluster": {"id": 3, "label": "list_item", "bbox": {"l": 152.0394, "t": 321.52512, "r": 403.95953, "b": 330.7381, "coord_origin": "TOPLEFT"}, "confidence": 0.9467733502388, "cells": [{"id": 23, "text": "-", "bbox": {"l": 152.0394, "t": 321.52512, "r": 157.60504, "b": 330.7381, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "Employees can see only their own unmasked TAX_ID.", "bbox": {"l": 165.59894, "t": 321.52512, "r": 403.95953, "b": 330.7381, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "-Employees can see only their own unmasked TAX_ID."}, {"label": "list_item", "id": 0, "page_no": 12, "cluster": {"id": 0, "label": "list_item", "bbox": {"l": 152.0394, "t": 338.50491, "r": 545.16846, "b": 359.71771, "coord_origin": "TOPLEFT"}, "confidence": 0.9705166220664978, "cells": [{"id": 25, "text": "-", "bbox": {"l": 152.0394, "t": 338.50491, "r": 157.57019, "b": 347.7179, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "Managers see a masked version of TAX_ID with the first five characters replaced with ", "bbox": {"l": 165.59894, "t": 338.50491, "r": 545.16846, "b": 347.7179, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "the X character (for example, XXX-XX-1234).", "bbox": {"l": 165.59894, "t": 350.50473, "r": 364.67947, "b": 359.71771, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "-Managers see a masked version of TAX_ID with the first five characters replaced with the X character (for example, XXX-XX-1234)."}, {"label": "list_item", "id": 2, "page_no": 12, "cluster": {"id": 2, "label": "list_item", "bbox": {"l": 152.0394, "t": 367.48453, "r": 529.46362, "b": 376.6975100000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9469642639160156, "cells": [{"id": 28, "text": "-", "bbox": {"l": 152.0394, "t": 367.48453, "r": 157.59309, "b": 376.6975100000001, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Any other person sees the entire TAX_ID as masked, for example, XXX-XX-XXXX.", "bbox": {"l": 165.59995, "t": 367.48453, "r": 529.46362, "b": 376.6975100000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "-Any other person sees the entire TAX_ID as masked, for example, XXX-XX-XXXX."}, {"label": "list_item", "id": 10, "page_no": 12, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 151.19978, "t": 384.52411, "r": 530.0603, "b": 393.73709, "coord_origin": "TOPLEFT"}, "confidence": 0.7003502249717712, "cells": [{"id": 30, "text": "To implement this column mask, run the SQL statement that is shown in Example 3-9.", "bbox": {"l": 151.19978, "t": 384.52411, "r": 530.0603, "b": 393.73709, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "To implement this column mask, run the SQL statement that is shown in Example 3-9."}, {"label": "caption", "id": 7, "page_no": 12, "cluster": {"id": 7, "label": "caption", "bbox": {"l": 136.8, "t": 406.51801, "r": 351.9873, "b": 414.84302, "coord_origin": "TOPLEFT"}, "confidence": 0.8488203287124634, "cells": [{"id": 31, "text": "Example 3-9 Creating a mask on the TAX_ID column", "bbox": {"l": 136.8, "t": 406.51801, "r": 351.9873, "b": 414.84302, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Example 3-9 Creating a mask on the TAX_ID column"}, {"label": "code", "id": 8, "page_no": 12, "cluster": {"id": 8, "label": "code", "bbox": {"l": 136.8, "t": 423.67810000000003, "r": 526.55469, "b": 684.44884, "coord_origin": "TOPLEFT"}, "confidence": 0.8411229252815247, "cells": [{"id": 32, "text": "CREATE MASK", "bbox": {"l": 136.8, "t": 423.67810000000003, "r": 192.91296, "b": 432.45287999999994, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "HR_SCHEMA.MASK_TAX_ID_ON_EMPLOYEES ", "bbox": {"l": 203.11533, "t": 423.67810000000003, "r": 381.65659, "b": 432.45287999999994, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "ON", "bbox": {"l": 136.8, "t": 435.67792, "r": 148.54184, "b": 444.45270000000005, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "HR_SCHEMA.EMPLOYEES AS EMPLOYEES ", "bbox": {"l": 177.89645, "t": 435.67792, "r": 371.63684, "b": 444.45270000000005, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "FOR COLUMN", "bbox": {"l": 136.8, "t": 447.67773, "r": 199.25916, "b": 456.45251, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "TAX_ID", "bbox": {"l": 211.75098, "t": 447.67773, "r": 249.22647, "b": 456.45251, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "RETURN ", "bbox": {"l": 136.8, "t": 459.67755, "r": 176.75952, "b": 468.45233, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "CASE ", "bbox": {"l": 136.8, "t": 471.67737, "r": 161.75977, "b": 480.45215, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'HR' ) = 1", "bbox": {"l": 152.84189, "t": 483.67719, "r": 441.59589, "b": 492.45197, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "THEN EMPLOYEES . TAX_ID ", "bbox": {"l": 154.01309, "t": 495.677, "r": 291.7178, "b": 504.45178, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1 ", "bbox": {"l": 152.80757, "t": 519.67661, "r": 451.6156, "b": 528.45139, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "AND SESSION_USER = EMPLOYEES . USER_ID ", "bbox": {"l": 153.21835, "t": 531.67642, "r": 366.65683, "b": 540.45117, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "THEN EMPLOYEES . TAX_ID", "bbox": {"l": 154.09363, "t": 543.6762200000001, "r": 286.67804, "b": 552.45097, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1", "bbox": {"l": 152.82599, "t": 567.67583, "r": 446.63561999999996, "b": 576.45058, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "AND SESSION_USER <> EMPLOYEES . USER_ID ", "bbox": {"l": 153.18398, "t": 579.67563, "r": 371.63684, "b": 588.45038, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "THEN ( 'XXX-XX-' CONCAT QSYS2 . SUBSTR ( EMPLOYEES . TAX_ID , 8 , 4 ) )", "bbox": {"l": 152.60088, "t": 591.67543, "r": 526.55469, "b": 600.45018, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'EMP' ) = 1 ", "bbox": {"l": 152.80757, "t": 615.67505, "r": 451.6156, "b": 624.4498, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "THEN EMPLOYEES . TAX_ID ", "bbox": {"l": 154.01309, "t": 627.67485, "r": 291.7178, "b": 636.4496, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "ELSE 'XXX-XX-XXXX' ", "bbox": {"l": 154.5134, "t": 651.67447, "r": 266.69827, "b": 660.44922, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "END", "bbox": {"l": 136.8, "t": 663.67427, "r": 157.7877, "b": 672.44904, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "ENABLE ;", "bbox": {"l": 136.8, "t": 675.67409, "r": 181.73952, "b": 684.44884, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "CREATE MASK HR_SCHEMA.MASK_TAX_ID_ON_EMPLOYEES ON HR_SCHEMA.EMPLOYEES AS EMPLOYEES FOR COLUMN TAX_ID RETURN CASE WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'HR' ) = 1 THEN EMPLOYEES . TAX_ID WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1 AND SESSION_USER = EMPLOYEES . USER_ID THEN EMPLOYEES . TAX_ID WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1 AND SESSION_USER <> EMPLOYEES . USER_ID THEN ( 'XXX-XX-' CONCAT QSYS2 . SUBSTR ( EMPLOYEES . TAX_ID , 8 , 4 ) ) WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'EMP' ) = 1 THEN EMPLOYEES . TAX_ID ELSE 'XXX-XX-XXXX' END ENABLE ;"}], "body": [{"label": "text", "id": 13, "page_no": 12, "cluster": {"id": 13, "label": "text", "bbox": {"l": 136.79959, "t": 71.65845000000002, "r": 166.73935, "b": 80.43322999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.5606335997581482, "cells": [{"id": 2, "text": "RETURN", "bbox": {"l": 136.79959, "t": 71.65845000000002, "r": 166.73935, "b": 80.43322999999998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "RETURN"}, {"label": "text", "id": 12, "page_no": 12, "cluster": {"id": 12, "label": "text", "bbox": {"l": 136.79959, "t": 83.65826000000004, "r": 156.77934, "b": 92.43304, "coord_origin": "TOPLEFT"}, "confidence": 0.589726984500885, "cells": [{"id": 3, "text": "CASE", "bbox": {"l": 136.79959, "t": 83.65826000000004, "r": 156.77934, "b": 92.43304, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "CASE"}, {"label": "code", "id": 9, "page_no": 12, "cluster": {"id": 9, "label": "code", "bbox": {"l": 136.79959, "t": 95.65808000000015, "r": 521.57428, "b": 260.43048, "coord_origin": "TOPLEFT"}, "confidence": 0.778521716594696, "cells": [{"id": 4, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'HR', 'EMP' ) = 1", "bbox": {"l": 147.26993, "t": 95.65808000000015, "r": 466.61502, "b": 104.43286000000012, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "THEN EMPLOYEES . DATE_OF_BIRTH", "bbox": {"l": 147.73068, "t": 107.65790000000004, "r": 311.69717, "b": 116.43268, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1", "bbox": {"l": 147.31944, "t": 131.65752999999995, "r": 436.61547999999993, "b": 140.43231000000003, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "AND SESSION_USER = EMPLOYEES . USER_ID", "bbox": {"l": 147.54245, "t": 143.65734999999995, "r": 351.65668, "b": 152.43213000000003, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "THEN EMPLOYEES . DATE_OF_BIRTH", "bbox": {"l": 147.73068, "t": 155.65716999999995, "r": 311.69717, "b": 164.43195000000003, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1", "bbox": {"l": 147.31944, "t": 179.65679999999998, "r": 436.61547999999993, "b": 188.43158000000005, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "AND SESSION_USER <> EMPLOYEES . USER_ID", "bbox": {"l": 147.52335, "t": 191.65661999999998, "r": 356.63669, "b": 200.43140000000005, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "THEN ( 9999 || '-' ||", "bbox": {"l": 147.63832, "t": 203.65643, "r": 261.44492, "b": 212.43120999999996, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "MONTH ( EMPLOYEES . DATE_OF_BIRTH ) || '-'", "bbox": {"l": 272.28363, "t": 203.65643, "r": 499.89682, "b": 212.43120999999996, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "||", "bbox": {"l": 510.73557, "t": 203.65643, "r": 521.57428, "b": 212.43120999999996, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "DAY (EMPLOYEES.DATE_OF_BIRTH ))", "bbox": {"l": 160.78555, "t": 215.65625, "r": 346.6767, "b": 224.43102999999996, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "ELSE NULL", "bbox": {"l": 149.51941, "t": 227.65607, "r": 206.75861, "b": 236.43084999999996, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": " END", "bbox": {"l": 136.79959, "t": 239.65588000000002, "r": 156.77934, "b": 248.43066, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": " ENABLE ;", "bbox": {"l": 136.79959, "t": 251.65570000000002, "r": 186.7191, "b": 260.43048, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'HR', 'EMP' ) = 1 THEN EMPLOYEES . DATE_OF_BIRTH WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1 AND SESSION_USER = EMPLOYEES . USER_ID THEN EMPLOYEES . DATE_OF_BIRTH WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1 AND SESSION_USER <> EMPLOYEES . USER_ID THEN ( 9999 || '-' || MONTH ( EMPLOYEES . DATE_OF_BIRTH ) || '-' || DAY (EMPLOYEES.DATE_OF_BIRTH )) ELSE NULL END ENABLE ;"}, {"label": "list_item", "id": 6, "page_no": 12, "cluster": {"id": 6, "label": "list_item", "bbox": {"l": 136.79959, "t": 275.50591999999995, "r": 547.21222, "b": 296.71871999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.8678942918777466, "cells": [{"id": 18, "text": "2.", "bbox": {"l": 136.79959, "t": 275.50591999999995, "r": 145.18994, "b": 284.7189, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "The other column to mask in this example is the TAX_ID information. In this example, the ", "bbox": {"l": 147.98672, "t": 275.50591999999995, "r": 547.21222, "b": 284.7189, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "rules to enforce include the following ones:", "bbox": {"l": 151.19977, "t": 287.50574, "r": 339.37903, "b": 296.71871999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2. The other column to mask in this example is the TAX_ID information. In this example, the rules to enforce include the following ones:"}, {"label": "list_item", "id": 4, "page_no": 12, "cluster": {"id": 4, "label": "list_item", "bbox": {"l": 152.0394, "t": 304.48553000000004, "r": 469.1528, "b": 313.69852000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9461130499839783, "cells": [{"id": 21, "text": "-", "bbox": {"l": 152.0394, "t": 304.48553000000004, "r": 157.61201, "b": 313.69852000000003, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "Human Resources can see the unmasked TAX_ID of the employees.", "bbox": {"l": 165.59894, "t": 304.48553000000004, "r": 469.1528, "b": 313.69852000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "-Human Resources can see the unmasked TAX_ID of the employees."}, {"label": "list_item", "id": 3, "page_no": 12, "cluster": {"id": 3, "label": "list_item", "bbox": {"l": 152.0394, "t": 321.52512, "r": 403.95953, "b": 330.7381, "coord_origin": "TOPLEFT"}, "confidence": 0.9467733502388, "cells": [{"id": 23, "text": "-", "bbox": {"l": 152.0394, "t": 321.52512, "r": 157.60504, "b": 330.7381, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "Employees can see only their own unmasked TAX_ID.", "bbox": {"l": 165.59894, "t": 321.52512, "r": 403.95953, "b": 330.7381, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "-Employees can see only their own unmasked TAX_ID."}, {"label": "list_item", "id": 0, "page_no": 12, "cluster": {"id": 0, "label": "list_item", "bbox": {"l": 152.0394, "t": 338.50491, "r": 545.16846, "b": 359.71771, "coord_origin": "TOPLEFT"}, "confidence": 0.9705166220664978, "cells": [{"id": 25, "text": "-", "bbox": {"l": 152.0394, "t": 338.50491, "r": 157.57019, "b": 347.7179, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "Managers see a masked version of TAX_ID with the first five characters replaced with ", "bbox": {"l": 165.59894, "t": 338.50491, "r": 545.16846, "b": 347.7179, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "the X character (for example, XXX-XX-1234).", "bbox": {"l": 165.59894, "t": 350.50473, "r": 364.67947, "b": 359.71771, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "-Managers see a masked version of TAX_ID with the first five characters replaced with the X character (for example, XXX-XX-1234)."}, {"label": "list_item", "id": 2, "page_no": 12, "cluster": {"id": 2, "label": "list_item", "bbox": {"l": 152.0394, "t": 367.48453, "r": 529.46362, "b": 376.6975100000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9469642639160156, "cells": [{"id": 28, "text": "-", "bbox": {"l": 152.0394, "t": 367.48453, "r": 157.59309, "b": 376.6975100000001, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Any other person sees the entire TAX_ID as masked, for example, XXX-XX-XXXX.", "bbox": {"l": 165.59995, "t": 367.48453, "r": 529.46362, "b": 376.6975100000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "-Any other person sees the entire TAX_ID as masked, for example, XXX-XX-XXXX."}, {"label": "list_item", "id": 10, "page_no": 12, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 151.19978, "t": 384.52411, "r": 530.0603, "b": 393.73709, "coord_origin": "TOPLEFT"}, "confidence": 0.7003502249717712, "cells": [{"id": 30, "text": "To implement this column mask, run the SQL statement that is shown in Example 3-9.", "bbox": {"l": 151.19978, "t": 384.52411, "r": 530.0603, "b": 393.73709, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "To implement this column mask, run the SQL statement that is shown in Example 3-9."}, {"label": "caption", "id": 7, "page_no": 12, "cluster": {"id": 7, "label": "caption", "bbox": {"l": 136.8, "t": 406.51801, "r": 351.9873, "b": 414.84302, "coord_origin": "TOPLEFT"}, "confidence": 0.8488203287124634, "cells": [{"id": 31, "text": "Example 3-9 Creating a mask on the TAX_ID column", "bbox": {"l": 136.8, "t": 406.51801, "r": 351.9873, "b": 414.84302, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Example 3-9 Creating a mask on the TAX_ID column"}, {"label": "code", "id": 8, "page_no": 12, "cluster": {"id": 8, "label": "code", "bbox": {"l": 136.8, "t": 423.67810000000003, "r": 526.55469, "b": 684.44884, "coord_origin": "TOPLEFT"}, "confidence": 0.8411229252815247, "cells": [{"id": 32, "text": "CREATE MASK", "bbox": {"l": 136.8, "t": 423.67810000000003, "r": 192.91296, "b": 432.45287999999994, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "HR_SCHEMA.MASK_TAX_ID_ON_EMPLOYEES ", "bbox": {"l": 203.11533, "t": 423.67810000000003, "r": 381.65659, "b": 432.45287999999994, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "ON", "bbox": {"l": 136.8, "t": 435.67792, "r": 148.54184, "b": 444.45270000000005, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "HR_SCHEMA.EMPLOYEES AS EMPLOYEES ", "bbox": {"l": 177.89645, "t": 435.67792, "r": 371.63684, "b": 444.45270000000005, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "FOR COLUMN", "bbox": {"l": 136.8, "t": 447.67773, "r": 199.25916, "b": 456.45251, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "TAX_ID", "bbox": {"l": 211.75098, "t": 447.67773, "r": 249.22647, "b": 456.45251, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "RETURN ", "bbox": {"l": 136.8, "t": 459.67755, "r": 176.75952, "b": 468.45233, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "CASE ", "bbox": {"l": 136.8, "t": 471.67737, "r": 161.75977, "b": 480.45215, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'HR' ) = 1", "bbox": {"l": 152.84189, "t": 483.67719, "r": 441.59589, "b": 492.45197, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "THEN EMPLOYEES . TAX_ID ", "bbox": {"l": 154.01309, "t": 495.677, "r": 291.7178, "b": 504.45178, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1 ", "bbox": {"l": 152.80757, "t": 519.67661, "r": 451.6156, "b": 528.45139, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "AND SESSION_USER = EMPLOYEES . USER_ID ", "bbox": {"l": 153.21835, "t": 531.67642, "r": 366.65683, "b": 540.45117, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "THEN EMPLOYEES . TAX_ID", "bbox": {"l": 154.09363, "t": 543.6762200000001, "r": 286.67804, "b": 552.45097, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1", "bbox": {"l": 152.82599, "t": 567.67583, "r": 446.63561999999996, "b": 576.45058, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "AND SESSION_USER <> EMPLOYEES . USER_ID ", "bbox": {"l": 153.18398, "t": 579.67563, "r": 371.63684, "b": 588.45038, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "THEN ( 'XXX-XX-' CONCAT QSYS2 . SUBSTR ( EMPLOYEES . TAX_ID , 8 , 4 ) )", "bbox": {"l": 152.60088, "t": 591.67543, "r": 526.55469, "b": 600.45018, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'EMP' ) = 1 ", "bbox": {"l": 152.80757, "t": 615.67505, "r": 451.6156, "b": 624.4498, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "THEN EMPLOYEES . TAX_ID ", "bbox": {"l": 154.01309, "t": 627.67485, "r": 291.7178, "b": 636.4496, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "ELSE 'XXX-XX-XXXX' ", "bbox": {"l": 154.5134, "t": 651.67447, "r": 266.69827, "b": 660.44922, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "END", "bbox": {"l": 136.8, "t": 663.67427, "r": 157.7877, "b": 672.44904, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "ENABLE ;", "bbox": {"l": 136.8, "t": 675.67409, "r": 181.73952, "b": 684.44884, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "CREATE MASK HR_SCHEMA.MASK_TAX_ID_ON_EMPLOYEES ON HR_SCHEMA.EMPLOYEES AS EMPLOYEES FOR COLUMN TAX_ID RETURN CASE WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'HR' ) = 1 THEN EMPLOYEES . TAX_ID WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1 AND SESSION_USER = EMPLOYEES . USER_ID THEN EMPLOYEES . TAX_ID WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1 AND SESSION_USER <> EMPLOYEES . USER_ID THEN ( 'XXX-XX-' CONCAT QSYS2 . SUBSTR ( EMPLOYEES . TAX_ID , 8 , 4 ) ) WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'EMP' ) = 1 THEN EMPLOYEES . TAX_ID ELSE 'XXX-XX-XXXX' END ENABLE ;"}], "headers": [{"label": "page_footer", "id": 1, "page_no": 12, "cluster": {"id": 1, "label": "page_footer", "bbox": {"l": 344.94, "t": 755.538002, "r": 523.60162, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9556925892829895, "cells": [{"id": 0, "text": "Chapter 3. Row and Column Access Control ", "bbox": {"l": 344.94, "t": 755.538002, "r": 523.60162, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Chapter 3. Row and Column Access Control"}, {"label": "page_footer", "id": 5, "page_no": 12, "cluster": {"id": 5, "label": "page_footer", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.9105783104896545, "cells": [{"id": 1, "text": "27", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "27"}]}}, {"page_no": 13, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "28 ", "bbox": {"l": 64.800003, "t": 754.848721, "r": 78.402, "b": 764.06172, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Row and Column Access Control Support in IBM DB2 for i", "bbox": {"l": 93.420303, "t": 755.538002, "r": 334.42142, "b": 763.863001, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "3.", "bbox": {"l": 136.8, "t": 71.50867000000005, "r": 145.22156, "b": 80.72167999999999, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Figure 3-10 shows the masks that are created in the HR_SCHEMA.", "bbox": {"l": 148.02872, "t": 71.50867000000005, "r": 449.9523899999999, "b": 80.72167999999999, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Figure 3-10 Column masks shown in System i Navigator", "bbox": {"l": 64.800003, "t": 173.53801999999996, "r": 293.13809, "b": 181.86298, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "3.6.6", "bbox": {"l": 64.800003, "t": 202.37469, "r": 94.275139, "b": 214.36273000000006, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Activating RCAC", "bbox": {"l": 97.959534, "t": 202.37469, "r": 203.98521, "b": 214.36273000000006, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Now that you have created the row permission and the two column masks, RCAC must be ", "bbox": {"l": 136.8, "t": 228.52868999999998, "r": 537.09131, "b": 237.74170000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "activated. The row permission and the two column masks are enabled (last clause in the ", "bbox": {"l": 136.8, "t": 240.5285, "r": 529.20422, "b": 249.74152000000004, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "scripts), but now you must activate RCAC on the table. To do so, complete the following steps:", "bbox": {"l": 136.8, "t": 252.52832, "r": 547.22565, "b": 261.74132999999995, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "1.", "bbox": {"l": 136.8, "t": 269.50811999999996, "r": 145.32378, "b": 278.72113, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Run the SQL statements that are shown in Example 3-10.", "bbox": {"l": 148.16501, "t": 269.50811999999996, "r": 409.47888, "b": 278.72113, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Example 3-10 Activating RCAC on the EMPLOYEES table ", "bbox": {"l": 136.8, "t": 291.55798, "r": 375.29099, "b": 299.88300000000004, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "/*", "bbox": {"l": 136.8, "t": 308.65811, "r": 147.22942, "b": 317.43289, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Active Row Access Control (permissions) */", "bbox": {"l": 157.65884, "t": 308.65811, "r": 376.67661, "b": 317.43289, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "/*", "bbox": {"l": 136.8, "t": 320.65793, "r": 147.70349, "b": 329.43271, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Active Column Access Control (masks)", "bbox": {"l": 158.60696, "t": 320.65793, "r": 354.86963, "b": 329.43271, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "*/", "bbox": {"l": 365.77313, "t": 320.65793, "r": 376.67661, "b": 329.43271, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "ALTER TABLE HR_SCHEMA.EMPLOYEES", "bbox": {"l": 136.8, "t": 332.65775, "r": 291.7178, "b": 341.43253, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "ACTIVATE ROW ACCESS CONTROL", "bbox": {"l": 136.8, "t": 344.65756, "r": 271.67831, "b": 353.43234000000007, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "ACTIVATE COLUMN ACCESS CONTROL;", "bbox": {"l": 136.8, "t": 356.65738, "r": 291.7178, "b": 365.43216, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "2.", "bbox": {"l": 136.8, "t": 380.5076, "r": 145.14954, "b": 389.72058, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "Look at the definition of the EMPLOYEE table, as shown in Figure 3-11. To do this, from ", "bbox": {"l": 147.93271, "t": 380.5076, "r": 540.80145, "b": 389.72058, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "the main navigation pane of System i Navigator, click ", "bbox": {"l": 151.20013, "t": 392.50742, "r": 387.36169, "b": 401.7203999999999, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "Schemas", "bbox": {"l": 387.29993, "t": 392.50742, "r": 431.07614, "b": 401.7203999999999, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "\uf0ae", "bbox": {"l": 433.85992000000005, "t": 389.64889999999997, "r": 443.69043, "b": 401.83994, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "HR_SCHEMA", "bbox": {"l": 446.51906999999994, "t": 392.50742, "r": 509.73618000000005, "b": 401.7203999999999, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "\uf0ae", "bbox": {"l": 512.5788, "t": 389.64889999999997, "r": 522.4093, "b": 401.83994, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Tables", "bbox": {"l": 151.19812, "t": 404.50723000000005, "r": 181.12892, "b": 413.72021, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": ", right-click the ", "bbox": {"l": 181.79823, "t": 404.50723000000005, "r": 248.99638, "b": 413.72021, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "EMPLOYEES", "bbox": {"l": 248.93860000000004, "t": 404.50723000000005, "r": 310.44357, "b": 413.72021, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": " table, and click ", "bbox": {"l": 310.49835, "t": 404.50723000000005, "r": 381.53305, "b": 413.72021, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Definition", "bbox": {"l": 381.59882, "t": 404.50723000000005, "r": 427.68176, "b": 413.72021, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": ".", "bbox": {"l": 427.67877, "t": 404.50723000000005, "r": 430.4476599999999, "b": 413.72021, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Figure 3-11 Selecting the EMPLOYEES table from System i Navigator", "bbox": {"l": 64.800003, "t": 649.0378900000001, "r": 347.43054, "b": 657.3629, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 8, "label": "page_footer", "bbox": {"l": 64.800003, "t": 754.848721, "r": 78.402, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.9161998629570007, "cells": [{"id": 0, "text": "28 ", "bbox": {"l": 64.800003, "t": 754.848721, "r": 78.402, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "page_footer", "bbox": {"l": 93.420303, "t": 755.538002, "r": 334.42142, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9540064334869385, "cells": [{"id": 1, "text": "Row and Column Access Control Support in IBM DB2 for i", "bbox": {"l": 93.420303, "t": 755.538002, "r": 334.42142, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "list_item", "bbox": {"l": 136.8, "t": 71.50867000000005, "r": 449.9523899999999, "b": 80.72167999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.8751048445701599, "cells": [{"id": 2, "text": "3.", "bbox": {"l": 136.8, "t": 71.50867000000005, "r": 145.22156, "b": 80.72167999999999, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Figure 3-10 shows the masks that are created in the HR_SCHEMA.", "bbox": {"l": 148.02872, "t": 71.50867000000005, "r": 449.9523899999999, "b": 80.72167999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "caption", "bbox": {"l": 64.800003, "t": 173.53801999999996, "r": 293.13809, "b": 181.86298, "coord_origin": "TOPLEFT"}, "confidence": 0.944426953792572, "cells": [{"id": 4, "text": "Figure 3-10 Column masks shown in System i Navigator", "bbox": {"l": 64.800003, "t": 173.53801999999996, "r": 293.13809, "b": 181.86298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "section_header", "bbox": {"l": 64.800003, "t": 202.37469, "r": 203.98521, "b": 214.36273000000006, "coord_origin": "TOPLEFT"}, "confidence": 0.9645015001296997, "cells": [{"id": 5, "text": "3.6.6", "bbox": {"l": 64.800003, "t": 202.37469, "r": 94.275139, "b": 214.36273000000006, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Activating RCAC", "bbox": {"l": 97.959534, "t": 202.37469, "r": 203.98521, "b": 214.36273000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 136.8, "t": 228.52868999999998, "r": 547.22565, "b": 261.74132999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9768574237823486, "cells": [{"id": 7, "text": "Now that you have created the row permission and the two column masks, RCAC must be ", "bbox": {"l": 136.8, "t": 228.52868999999998, "r": 537.09131, "b": 237.74170000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "activated. The row permission and the two column masks are enabled (last clause in the ", "bbox": {"l": 136.8, "t": 240.5285, "r": 529.20422, "b": 249.74152000000004, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "scripts), but now you must activate RCAC on the table. To do so, complete the following steps:", "bbox": {"l": 136.8, "t": 252.52832, "r": 547.22565, "b": 261.74132999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "list_item", "bbox": {"l": 136.8, "t": 269.50811999999996, "r": 409.47888, "b": 278.72113, "coord_origin": "TOPLEFT"}, "confidence": 0.9059441685676575, "cells": [{"id": 10, "text": "1.", "bbox": {"l": 136.8, "t": 269.50811999999996, "r": 145.32378, "b": 278.72113, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Run the SQL statements that are shown in Example 3-10.", "bbox": {"l": 148.16501, "t": 269.50811999999996, "r": 409.47888, "b": 278.72113, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "section_header", "bbox": {"l": 136.8, "t": 291.55798, "r": 375.29099, "b": 299.88300000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.657009482383728, "cells": [{"id": 12, "text": "Example 3-10 Activating RCAC on the EMPLOYEES table ", "bbox": {"l": 136.8, "t": 291.55798, "r": 375.29099, "b": 299.88300000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "list_item", "bbox": {"l": 136.8, "t": 308.65811, "r": 376.67661, "b": 317.43289, "coord_origin": "TOPLEFT"}, "confidence": 0.6002400517463684, "cells": [{"id": 13, "text": "/*", "bbox": {"l": 136.8, "t": 308.65811, "r": 147.22942, "b": 317.43289, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Active Row Access Control (permissions) */", "bbox": {"l": 157.65884, "t": 308.65811, "r": 376.67661, "b": 317.43289, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "list_item", "bbox": {"l": 136.8, "t": 320.65793, "r": 354.86963, "b": 329.43271, "coord_origin": "TOPLEFT"}, "confidence": 0.598584771156311, "cells": [{"id": 15, "text": "/*", "bbox": {"l": 136.8, "t": 320.65793, "r": 147.70349, "b": 329.43271, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Active Column Access Control (masks)", "bbox": {"l": 158.60696, "t": 320.65793, "r": 354.86963, "b": 329.43271, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 365.77313, "t": 320.65793, "r": 376.67661, "b": 329.43271, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "*/", "bbox": {"l": 365.77313, "t": 320.65793, "r": 376.67661, "b": 329.43271, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 136.8, "t": 332.65775, "r": 291.7178, "b": 341.43253, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "ALTER TABLE HR_SCHEMA.EMPLOYEES", "bbox": {"l": 136.8, "t": 332.65775, "r": 291.7178, "b": 341.43253, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 136.8, "t": 344.65756, "r": 271.67831, "b": 353.43234000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "ACTIVATE ROW ACCESS CONTROL", "bbox": {"l": 136.8, "t": 344.65756, "r": 271.67831, "b": 353.43234000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 136.8, "t": 356.65738, "r": 291.7178, "b": 365.43216, "coord_origin": "TOPLEFT"}, "confidence": 0.5431806445121765, "cells": [{"id": 20, "text": "ACTIVATE COLUMN ACCESS CONTROL;", "bbox": {"l": 136.8, "t": 356.65738, "r": 291.7178, "b": 365.43216, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "list_item", "bbox": {"l": 136.8, "t": 380.5076, "r": 540.80145, "b": 413.72021, "coord_origin": "TOPLEFT"}, "confidence": 0.9449257850646973, "cells": [{"id": 21, "text": "2.", "bbox": {"l": 136.8, "t": 380.5076, "r": 145.14954, "b": 389.72058, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "Look at the definition of the EMPLOYEE table, as shown in Figure 3-11. To do this, from ", "bbox": {"l": 147.93271, "t": 380.5076, "r": 540.80145, "b": 389.72058, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "the main navigation pane of System i Navigator, click ", "bbox": {"l": 151.20013, "t": 392.50742, "r": 387.36169, "b": 401.7203999999999, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "Schemas", "bbox": {"l": 387.29993, "t": 392.50742, "r": 431.07614, "b": 401.7203999999999, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "\uf0ae", "bbox": {"l": 433.85992000000005, "t": 389.64889999999997, "r": 443.69043, "b": 401.83994, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "HR_SCHEMA", "bbox": {"l": 446.51906999999994, "t": 392.50742, "r": 509.73618000000005, "b": 401.7203999999999, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "\uf0ae", "bbox": {"l": 512.5788, "t": 389.64889999999997, "r": 522.4093, "b": 401.83994, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Tables", "bbox": {"l": 151.19812, "t": 404.50723000000005, "r": 181.12892, "b": 413.72021, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": ", right-click the ", "bbox": {"l": 181.79823, "t": 404.50723000000005, "r": 248.99638, "b": 413.72021, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "EMPLOYEES", "bbox": {"l": 248.93860000000004, "t": 404.50723000000005, "r": 310.44357, "b": 413.72021, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": " table, and click ", "bbox": {"l": 310.49835, "t": 404.50723000000005, "r": 381.53305, "b": 413.72021, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Definition", "bbox": {"l": 381.59882, "t": 404.50723000000005, "r": 427.68176, "b": 413.72021, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": ".", "bbox": {"l": 427.67877, "t": 404.50723000000005, "r": 430.4476599999999, "b": 413.72021, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "caption", "bbox": {"l": 64.800003, "t": 649.0378900000001, "r": 347.43054, "b": 657.3629, "coord_origin": "TOPLEFT"}, "confidence": 0.9499983787536621, "cells": [{"id": 34, "text": "Figure 3-11 Selecting the EMPLOYEES table from System i Navigator", "bbox": {"l": 64.800003, "t": 649.0378900000001, "r": 347.43054, "b": 657.3629, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "picture", "bbox": {"l": 63.801902770996094, "t": 95.38241577148438, "r": 547.11474609375, "b": 170.0321502685547, "coord_origin": "TOPLEFT"}, "confidence": 0.9635388851165771, "cells": [], "children": []}, {"id": 0, "label": "picture", "bbox": {"l": 63.985130310058594, "t": 427.90496826171875, "r": 530.0478515625, "b": 646.1396484375, "coord_origin": "TOPLEFT"}, "confidence": 0.9801459908485413, "cells": [], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_footer", "id": 8, "page_no": 13, "cluster": {"id": 8, "label": "page_footer", "bbox": {"l": 64.800003, "t": 754.848721, "r": 78.402, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.9161998629570007, "cells": [{"id": 0, "text": "28 ", "bbox": {"l": 64.800003, "t": 754.848721, "r": 78.402, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "28"}, {"label": "page_footer", "id": 4, "page_no": 13, "cluster": {"id": 4, "label": "page_footer", "bbox": {"l": 93.420303, "t": 755.538002, "r": 334.42142, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9540064334869385, "cells": [{"id": 1, "text": "Row and Column Access Control Support in IBM DB2 for i", "bbox": {"l": 93.420303, "t": 755.538002, "r": 334.42142, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Row and Column Access Control Support in IBM DB2 for i"}, {"label": "list_item", "id": 10, "page_no": 13, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 136.8, "t": 71.50867000000005, "r": 449.9523899999999, "b": 80.72167999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.8751048445701599, "cells": [{"id": 2, "text": "3.", "bbox": {"l": 136.8, "t": 71.50867000000005, "r": 145.22156, "b": 80.72167999999999, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Figure 3-10 shows the masks that are created in the HR_SCHEMA.", "bbox": {"l": 148.02872, "t": 71.50867000000005, "r": 449.9523899999999, "b": 80.72167999999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3. Figure 3-10 shows the masks that are created in the HR_SCHEMA."}, {"label": "caption", "id": 7, "page_no": 13, "cluster": {"id": 7, "label": "caption", "bbox": {"l": 64.800003, "t": 173.53801999999996, "r": 293.13809, "b": 181.86298, "coord_origin": "TOPLEFT"}, "confidence": 0.944426953792572, "cells": [{"id": 4, "text": "Figure 3-10 Column masks shown in System i Navigator", "bbox": {"l": 64.800003, "t": 173.53801999999996, "r": 293.13809, "b": 181.86298, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 3-10 Column masks shown in System i Navigator"}, {"label": "section_header", "id": 2, "page_no": 13, "cluster": {"id": 2, "label": "section_header", "bbox": {"l": 64.800003, "t": 202.37469, "r": 203.98521, "b": 214.36273000000006, "coord_origin": "TOPLEFT"}, "confidence": 0.9645015001296997, "cells": [{"id": 5, "text": "3.6.6", "bbox": {"l": 64.800003, "t": 202.37469, "r": 94.275139, "b": 214.36273000000006, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Activating RCAC", "bbox": {"l": 97.959534, "t": 202.37469, "r": 203.98521, "b": 214.36273000000006, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3.6.6 Activating RCAC"}, {"label": "text", "id": 1, "page_no": 13, "cluster": {"id": 1, "label": "text", "bbox": {"l": 136.8, "t": 228.52868999999998, "r": 547.22565, "b": 261.74132999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9768574237823486, "cells": [{"id": 7, "text": "Now that you have created the row permission and the two column masks, RCAC must be ", "bbox": {"l": 136.8, "t": 228.52868999999998, "r": 537.09131, "b": 237.74170000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "activated. The row permission and the two column masks are enabled (last clause in the ", "bbox": {"l": 136.8, "t": 240.5285, "r": 529.20422, "b": 249.74152000000004, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "scripts), but now you must activate RCAC on the table. To do so, complete the following steps:", "bbox": {"l": 136.8, "t": 252.52832, "r": 547.22565, "b": 261.74132999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Now that you have created the row permission and the two column masks, RCAC must be activated. The row permission and the two column masks are enabled (last clause in the scripts), but now you must activate RCAC on the table. To do so, complete the following steps:"}, {"label": "list_item", "id": 9, "page_no": 13, "cluster": {"id": 9, "label": "list_item", "bbox": {"l": 136.8, "t": 269.50811999999996, "r": 409.47888, "b": 278.72113, "coord_origin": "TOPLEFT"}, "confidence": 0.9059441685676575, "cells": [{"id": 10, "text": "1.", "bbox": {"l": 136.8, "t": 269.50811999999996, "r": 145.32378, "b": 278.72113, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Run the SQL statements that are shown in Example 3-10.", "bbox": {"l": 148.16501, "t": 269.50811999999996, "r": 409.47888, "b": 278.72113, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1. Run the SQL statements that are shown in Example 3-10."}, {"label": "section_header", "id": 11, "page_no": 13, "cluster": {"id": 11, "label": "section_header", "bbox": {"l": 136.8, "t": 291.55798, "r": 375.29099, "b": 299.88300000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.657009482383728, "cells": [{"id": 12, "text": "Example 3-10 Activating RCAC on the EMPLOYEES table ", "bbox": {"l": 136.8, "t": 291.55798, "r": 375.29099, "b": 299.88300000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Example 3-10 Activating RCAC on the EMPLOYEES table"}, {"label": "list_item", "id": 13, "page_no": 13, "cluster": {"id": 13, "label": "list_item", "bbox": {"l": 136.8, "t": 308.65811, "r": 376.67661, "b": 317.43289, "coord_origin": "TOPLEFT"}, "confidence": 0.6002400517463684, "cells": [{"id": 13, "text": "/*", "bbox": {"l": 136.8, "t": 308.65811, "r": 147.22942, "b": 317.43289, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Active Row Access Control (permissions) */", "bbox": {"l": 157.65884, "t": 308.65811, "r": 376.67661, "b": 317.43289, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "/* Active Row Access Control (permissions) */"}, {"label": "list_item", "id": 14, "page_no": 13, "cluster": {"id": 14, "label": "list_item", "bbox": {"l": 136.8, "t": 320.65793, "r": 354.86963, "b": 329.43271, "coord_origin": "TOPLEFT"}, "confidence": 0.598584771156311, "cells": [{"id": 15, "text": "/*", "bbox": {"l": 136.8, "t": 320.65793, "r": 147.70349, "b": 329.43271, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Active Column Access Control (masks)", "bbox": {"l": 158.60696, "t": 320.65793, "r": 354.86963, "b": 329.43271, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "/* Active Column Access Control (masks)"}, {"label": "text", "id": 16, "page_no": 13, "cluster": {"id": 16, "label": "text", "bbox": {"l": 365.77313, "t": 320.65793, "r": 376.67661, "b": 329.43271, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "*/", "bbox": {"l": 365.77313, "t": 320.65793, "r": 376.67661, "b": 329.43271, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "*/"}, {"label": "text", "id": 17, "page_no": 13, "cluster": {"id": 17, "label": "text", "bbox": {"l": 136.8, "t": 332.65775, "r": 291.7178, "b": 341.43253, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "ALTER TABLE HR_SCHEMA.EMPLOYEES", "bbox": {"l": 136.8, "t": 332.65775, "r": 291.7178, "b": 341.43253, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "ALTER TABLE HR_SCHEMA.EMPLOYEES"}, {"label": "text", "id": 18, "page_no": 13, "cluster": {"id": 18, "label": "text", "bbox": {"l": 136.8, "t": 344.65756, "r": 271.67831, "b": 353.43234000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "ACTIVATE ROW ACCESS CONTROL", "bbox": {"l": 136.8, "t": 344.65756, "r": 271.67831, "b": 353.43234000000007, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "ACTIVATE ROW ACCESS CONTROL"}, {"label": "text", "id": 15, "page_no": 13, "cluster": {"id": 15, "label": "text", "bbox": {"l": 136.8, "t": 356.65738, "r": 291.7178, "b": 365.43216, "coord_origin": "TOPLEFT"}, "confidence": 0.5431806445121765, "cells": [{"id": 20, "text": "ACTIVATE COLUMN ACCESS CONTROL;", "bbox": {"l": 136.8, "t": 356.65738, "r": 291.7178, "b": 365.43216, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "ACTIVATE COLUMN ACCESS CONTROL;"}, {"label": "list_item", "id": 6, "page_no": 13, "cluster": {"id": 6, "label": "list_item", "bbox": {"l": 136.8, "t": 380.5076, "r": 540.80145, "b": 413.72021, "coord_origin": "TOPLEFT"}, "confidence": 0.9449257850646973, "cells": [{"id": 21, "text": "2.", "bbox": {"l": 136.8, "t": 380.5076, "r": 145.14954, "b": 389.72058, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "Look at the definition of the EMPLOYEE table, as shown in Figure 3-11. To do this, from ", "bbox": {"l": 147.93271, "t": 380.5076, "r": 540.80145, "b": 389.72058, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "the main navigation pane of System i Navigator, click ", "bbox": {"l": 151.20013, "t": 392.50742, "r": 387.36169, "b": 401.7203999999999, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "Schemas", "bbox": {"l": 387.29993, "t": 392.50742, "r": 431.07614, "b": 401.7203999999999, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "\uf0ae", "bbox": {"l": 433.85992000000005, "t": 389.64889999999997, "r": 443.69043, "b": 401.83994, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "HR_SCHEMA", "bbox": {"l": 446.51906999999994, "t": 392.50742, "r": 509.73618000000005, "b": 401.7203999999999, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "\uf0ae", "bbox": {"l": 512.5788, "t": 389.64889999999997, "r": 522.4093, "b": 401.83994, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Tables", "bbox": {"l": 151.19812, "t": 404.50723000000005, "r": 181.12892, "b": 413.72021, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": ", right-click the ", "bbox": {"l": 181.79823, "t": 404.50723000000005, "r": 248.99638, "b": 413.72021, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "EMPLOYEES", "bbox": {"l": 248.93860000000004, "t": 404.50723000000005, "r": 310.44357, "b": 413.72021, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": " table, and click ", "bbox": {"l": 310.49835, "t": 404.50723000000005, "r": 381.53305, "b": 413.72021, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Definition", "bbox": {"l": 381.59882, "t": 404.50723000000005, "r": 427.68176, "b": 413.72021, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": ".", "bbox": {"l": 427.67877, "t": 404.50723000000005, "r": 430.4476599999999, "b": 413.72021, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2. Look at the definition of the EMPLOYEE table, as shown in Figure 3-11. To do this, from the main navigation pane of System i Navigator, click Schemas \uf0ae HR_SCHEMA \uf0ae Tables , right-click the EMPLOYEES table, and click Definition ."}, {"label": "caption", "id": 5, "page_no": 13, "cluster": {"id": 5, "label": "caption", "bbox": {"l": 64.800003, "t": 649.0378900000001, "r": 347.43054, "b": 657.3629, "coord_origin": "TOPLEFT"}, "confidence": 0.9499983787536621, "cells": [{"id": 34, "text": "Figure 3-11 Selecting the EMPLOYEES table from System i Navigator", "bbox": {"l": 64.800003, "t": 649.0378900000001, "r": 347.43054, "b": 657.3629, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 3-11 Selecting the EMPLOYEES table from System i Navigator"}, {"label": "picture", "id": 3, "page_no": 13, "cluster": {"id": 3, "label": "picture", "bbox": {"l": 63.801902770996094, "t": 95.38241577148438, "r": 547.11474609375, "b": 170.0321502685547, "coord_origin": "TOPLEFT"}, "confidence": 0.9635388851165771, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "picture", "id": 0, "page_no": 13, "cluster": {"id": 0, "label": "picture", "bbox": {"l": 63.985130310058594, "t": 427.90496826171875, "r": 530.0478515625, "b": 646.1396484375, "coord_origin": "TOPLEFT"}, "confidence": 0.9801459908485413, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "body": [{"label": "list_item", "id": 10, "page_no": 13, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 136.8, "t": 71.50867000000005, "r": 449.9523899999999, "b": 80.72167999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.8751048445701599, "cells": [{"id": 2, "text": "3.", "bbox": {"l": 136.8, "t": 71.50867000000005, "r": 145.22156, "b": 80.72167999999999, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Figure 3-10 shows the masks that are created in the HR_SCHEMA.", "bbox": {"l": 148.02872, "t": 71.50867000000005, "r": 449.9523899999999, "b": 80.72167999999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3. Figure 3-10 shows the masks that are created in the HR_SCHEMA."}, {"label": "caption", "id": 7, "page_no": 13, "cluster": {"id": 7, "label": "caption", "bbox": {"l": 64.800003, "t": 173.53801999999996, "r": 293.13809, "b": 181.86298, "coord_origin": "TOPLEFT"}, "confidence": 0.944426953792572, "cells": [{"id": 4, "text": "Figure 3-10 Column masks shown in System i Navigator", "bbox": {"l": 64.800003, "t": 173.53801999999996, "r": 293.13809, "b": 181.86298, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 3-10 Column masks shown in System i Navigator"}, {"label": "section_header", "id": 2, "page_no": 13, "cluster": {"id": 2, "label": "section_header", "bbox": {"l": 64.800003, "t": 202.37469, "r": 203.98521, "b": 214.36273000000006, "coord_origin": "TOPLEFT"}, "confidence": 0.9645015001296997, "cells": [{"id": 5, "text": "3.6.6", "bbox": {"l": 64.800003, "t": 202.37469, "r": 94.275139, "b": 214.36273000000006, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Activating RCAC", "bbox": {"l": 97.959534, "t": 202.37469, "r": 203.98521, "b": 214.36273000000006, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3.6.6 Activating RCAC"}, {"label": "text", "id": 1, "page_no": 13, "cluster": {"id": 1, "label": "text", "bbox": {"l": 136.8, "t": 228.52868999999998, "r": 547.22565, "b": 261.74132999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9768574237823486, "cells": [{"id": 7, "text": "Now that you have created the row permission and the two column masks, RCAC must be ", "bbox": {"l": 136.8, "t": 228.52868999999998, "r": 537.09131, "b": 237.74170000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "activated. The row permission and the two column masks are enabled (last clause in the ", "bbox": {"l": 136.8, "t": 240.5285, "r": 529.20422, "b": 249.74152000000004, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "scripts), but now you must activate RCAC on the table. To do so, complete the following steps:", "bbox": {"l": 136.8, "t": 252.52832, "r": 547.22565, "b": 261.74132999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Now that you have created the row permission and the two column masks, RCAC must be activated. The row permission and the two column masks are enabled (last clause in the scripts), but now you must activate RCAC on the table. To do so, complete the following steps:"}, {"label": "list_item", "id": 9, "page_no": 13, "cluster": {"id": 9, "label": "list_item", "bbox": {"l": 136.8, "t": 269.50811999999996, "r": 409.47888, "b": 278.72113, "coord_origin": "TOPLEFT"}, "confidence": 0.9059441685676575, "cells": [{"id": 10, "text": "1.", "bbox": {"l": 136.8, "t": 269.50811999999996, "r": 145.32378, "b": 278.72113, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Run the SQL statements that are shown in Example 3-10.", "bbox": {"l": 148.16501, "t": 269.50811999999996, "r": 409.47888, "b": 278.72113, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1. Run the SQL statements that are shown in Example 3-10."}, {"label": "section_header", "id": 11, "page_no": 13, "cluster": {"id": 11, "label": "section_header", "bbox": {"l": 136.8, "t": 291.55798, "r": 375.29099, "b": 299.88300000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.657009482383728, "cells": [{"id": 12, "text": "Example 3-10 Activating RCAC on the EMPLOYEES table ", "bbox": {"l": 136.8, "t": 291.55798, "r": 375.29099, "b": 299.88300000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Example 3-10 Activating RCAC on the EMPLOYEES table"}, {"label": "list_item", "id": 13, "page_no": 13, "cluster": {"id": 13, "label": "list_item", "bbox": {"l": 136.8, "t": 308.65811, "r": 376.67661, "b": 317.43289, "coord_origin": "TOPLEFT"}, "confidence": 0.6002400517463684, "cells": [{"id": 13, "text": "/*", "bbox": {"l": 136.8, "t": 308.65811, "r": 147.22942, "b": 317.43289, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Active Row Access Control (permissions) */", "bbox": {"l": 157.65884, "t": 308.65811, "r": 376.67661, "b": 317.43289, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "/* Active Row Access Control (permissions) */"}, {"label": "list_item", "id": 14, "page_no": 13, "cluster": {"id": 14, "label": "list_item", "bbox": {"l": 136.8, "t": 320.65793, "r": 354.86963, "b": 329.43271, "coord_origin": "TOPLEFT"}, "confidence": 0.598584771156311, "cells": [{"id": 15, "text": "/*", "bbox": {"l": 136.8, "t": 320.65793, "r": 147.70349, "b": 329.43271, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Active Column Access Control (masks)", "bbox": {"l": 158.60696, "t": 320.65793, "r": 354.86963, "b": 329.43271, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "/* Active Column Access Control (masks)"}, {"label": "text", "id": 16, "page_no": 13, "cluster": {"id": 16, "label": "text", "bbox": {"l": 365.77313, "t": 320.65793, "r": 376.67661, "b": 329.43271, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "*/", "bbox": {"l": 365.77313, "t": 320.65793, "r": 376.67661, "b": 329.43271, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "*/"}, {"label": "text", "id": 17, "page_no": 13, "cluster": {"id": 17, "label": "text", "bbox": {"l": 136.8, "t": 332.65775, "r": 291.7178, "b": 341.43253, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "ALTER TABLE HR_SCHEMA.EMPLOYEES", "bbox": {"l": 136.8, "t": 332.65775, "r": 291.7178, "b": 341.43253, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "ALTER TABLE HR_SCHEMA.EMPLOYEES"}, {"label": "text", "id": 18, "page_no": 13, "cluster": {"id": 18, "label": "text", "bbox": {"l": 136.8, "t": 344.65756, "r": 271.67831, "b": 353.43234000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "ACTIVATE ROW ACCESS CONTROL", "bbox": {"l": 136.8, "t": 344.65756, "r": 271.67831, "b": 353.43234000000007, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "ACTIVATE ROW ACCESS CONTROL"}, {"label": "text", "id": 15, "page_no": 13, "cluster": {"id": 15, "label": "text", "bbox": {"l": 136.8, "t": 356.65738, "r": 291.7178, "b": 365.43216, "coord_origin": "TOPLEFT"}, "confidence": 0.5431806445121765, "cells": [{"id": 20, "text": "ACTIVATE COLUMN ACCESS CONTROL;", "bbox": {"l": 136.8, "t": 356.65738, "r": 291.7178, "b": 365.43216, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "ACTIVATE COLUMN ACCESS CONTROL;"}, {"label": "list_item", "id": 6, "page_no": 13, "cluster": {"id": 6, "label": "list_item", "bbox": {"l": 136.8, "t": 380.5076, "r": 540.80145, "b": 413.72021, "coord_origin": "TOPLEFT"}, "confidence": 0.9449257850646973, "cells": [{"id": 21, "text": "2.", "bbox": {"l": 136.8, "t": 380.5076, "r": 145.14954, "b": 389.72058, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "Look at the definition of the EMPLOYEE table, as shown in Figure 3-11. To do this, from ", "bbox": {"l": 147.93271, "t": 380.5076, "r": 540.80145, "b": 389.72058, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "the main navigation pane of System i Navigator, click ", "bbox": {"l": 151.20013, "t": 392.50742, "r": 387.36169, "b": 401.7203999999999, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "Schemas", "bbox": {"l": 387.29993, "t": 392.50742, "r": 431.07614, "b": 401.7203999999999, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "\uf0ae", "bbox": {"l": 433.85992000000005, "t": 389.64889999999997, "r": 443.69043, "b": 401.83994, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "HR_SCHEMA", "bbox": {"l": 446.51906999999994, "t": 392.50742, "r": 509.73618000000005, "b": 401.7203999999999, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "\uf0ae", "bbox": {"l": 512.5788, "t": 389.64889999999997, "r": 522.4093, "b": 401.83994, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Tables", "bbox": {"l": 151.19812, "t": 404.50723000000005, "r": 181.12892, "b": 413.72021, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": ", right-click the ", "bbox": {"l": 181.79823, "t": 404.50723000000005, "r": 248.99638, "b": 413.72021, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "EMPLOYEES", "bbox": {"l": 248.93860000000004, "t": 404.50723000000005, "r": 310.44357, "b": 413.72021, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": " table, and click ", "bbox": {"l": 310.49835, "t": 404.50723000000005, "r": 381.53305, "b": 413.72021, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Definition", "bbox": {"l": 381.59882, "t": 404.50723000000005, "r": 427.68176, "b": 413.72021, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": ".", "bbox": {"l": 427.67877, "t": 404.50723000000005, "r": 430.4476599999999, "b": 413.72021, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2. Look at the definition of the EMPLOYEE table, as shown in Figure 3-11. To do this, from the main navigation pane of System i Navigator, click Schemas \uf0ae HR_SCHEMA \uf0ae Tables , right-click the EMPLOYEES table, and click Definition ."}, {"label": "caption", "id": 5, "page_no": 13, "cluster": {"id": 5, "label": "caption", "bbox": {"l": 64.800003, "t": 649.0378900000001, "r": 347.43054, "b": 657.3629, "coord_origin": "TOPLEFT"}, "confidence": 0.9499983787536621, "cells": [{"id": 34, "text": "Figure 3-11 Selecting the EMPLOYEES table from System i Navigator", "bbox": {"l": 64.800003, "t": 649.0378900000001, "r": 347.43054, "b": 657.3629, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 3-11 Selecting the EMPLOYEES table from System i Navigator"}, {"label": "picture", "id": 3, "page_no": 13, "cluster": {"id": 3, "label": "picture", "bbox": {"l": 63.801902770996094, "t": 95.38241577148438, "r": 547.11474609375, "b": 170.0321502685547, "coord_origin": "TOPLEFT"}, "confidence": 0.9635388851165771, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "picture", "id": 0, "page_no": 13, "cluster": {"id": 0, "label": "picture", "bbox": {"l": 63.985130310058594, "t": 427.90496826171875, "r": 530.0478515625, "b": 646.1396484375, "coord_origin": "TOPLEFT"}, "confidence": 0.9801459908485413, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "headers": [{"label": "page_footer", "id": 8, "page_no": 13, "cluster": {"id": 8, "label": "page_footer", "bbox": {"l": 64.800003, "t": 754.848721, "r": 78.402, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.9161998629570007, "cells": [{"id": 0, "text": "28 ", "bbox": {"l": 64.800003, "t": 754.848721, "r": 78.402, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "28"}, {"label": "page_footer", "id": 4, "page_no": 13, "cluster": {"id": 4, "label": "page_footer", "bbox": {"l": 93.420303, "t": 755.538002, "r": 334.42142, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9540064334869385, "cells": [{"id": 1, "text": "Row and Column Access Control Support in IBM DB2 for i", "bbox": {"l": 93.420303, "t": 755.538002, "r": 334.42142, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Row and Column Access Control Support in IBM DB2 for i"}]}}, {"page_no": 14, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "Chapter 4. Implementing Row and Column Access Control: Banking example ", "bbox": {"l": 214.8, "t": 755.538002, "r": 523.59357, "b": 763.863001, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "77", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "2.", "bbox": {"l": 136.79959, "t": 71.50903000000005, "r": 145.19554, "b": 80.72204999999985, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Figure 4-68 shows the Visual Explain of the same SQL statement, but with RCAC ", "bbox": {"l": 147.9942, "t": 71.50903000000005, "r": 513.35919, "b": 80.72204999999985, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "enabled. It is clear that the implementation of the SQL statement is more complex ", "bbox": {"l": 151.19975, "t": 83.50885000000017, "r": 514.04858, "b": 92.72185999999999, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "because the row permission rule becomes part of the ", "bbox": {"l": 151.19975, "t": 95.50867000000005, "r": 389.64822, "b": 104.72167999999999, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "WHERE", "bbox": {"l": 389.57941, "t": 95.65808000000015, "r": 414.53918, "b": 104.48266999999998, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": " clause.", "bbox": {"l": 414.59991, "t": 95.50867000000005, "r": 448.8892200000001, "b": 104.72167999999999, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Figure 4-68 Visual Explain with RCAC enabled", "bbox": {"l": 136.8, "t": 480.55798, "r": 327.09329, "b": 488.883, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "3.", "bbox": {"l": 136.8, "t": 506.56863, "r": 145.17432, "b": 515.78162, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Compare the advised indexes that are provided by the Optimizer without RCAC and with ", "bbox": {"l": 147.96574, "t": 506.56863, "r": 543.63715, "b": 515.78162, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "RCAC enabled. Figure 4-69 shows the index advice for the SQL statement without RCAC ", "bbox": {"l": 151.20016, "t": 518.56845, "r": 547.23944, "b": 527.78143, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "enabled. The index being advised is for the ORDER BY clause.", "bbox": {"l": 151.20016, "t": 530.5682400000001, "r": 430.28333, "b": 539.78125, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Figure 4-69 Index advice with no RCAC", "bbox": {"l": 64.800003, "t": 667.5179, "r": 227.10149, "b": 675.8429, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 4, "label": "page_footer", "bbox": {"l": 214.8, "t": 755.538002, "r": 523.59357, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.95576012134552, "cells": [{"id": 0, "text": "Chapter 4. Implementing Row and Column Access Control: Banking example ", "bbox": {"l": 214.8, "t": 755.538002, "r": 523.59357, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "page_footer", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.9056528806686401, "cells": [{"id": 1, "text": "77", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "list_item", "bbox": {"l": 136.79959, "t": 71.50903000000005, "r": 514.04858, "b": 104.72167999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9761855006217957, "cells": [{"id": 2, "text": "2.", "bbox": {"l": 136.79959, "t": 71.50903000000005, "r": 145.19554, "b": 80.72204999999985, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Figure 4-68 shows the Visual Explain of the same SQL statement, but with RCAC ", "bbox": {"l": 147.9942, "t": 71.50903000000005, "r": 513.35919, "b": 80.72204999999985, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "enabled. It is clear that the implementation of the SQL statement is more complex ", "bbox": {"l": 151.19975, "t": 83.50885000000017, "r": 514.04858, "b": 92.72185999999999, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "because the row permission rule becomes part of the ", "bbox": {"l": 151.19975, "t": 95.50867000000005, "r": 389.64822, "b": 104.72167999999999, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "WHERE", "bbox": {"l": 389.57941, "t": 95.65808000000015, "r": 414.53918, "b": 104.48266999999998, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": " clause.", "bbox": {"l": 414.59991, "t": 95.50867000000005, "r": 448.8892200000001, "b": 104.72167999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "caption", "bbox": {"l": 136.8, "t": 480.55798, "r": 327.09329, "b": 488.883, "coord_origin": "TOPLEFT"}, "confidence": 0.9529654383659363, "cells": [{"id": 8, "text": "Figure 4-68 Visual Explain with RCAC enabled", "bbox": {"l": 136.8, "t": 480.55798, "r": 327.09329, "b": 488.883, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "list_item", "bbox": {"l": 136.8, "t": 506.56863, "r": 547.23944, "b": 539.78125, "coord_origin": "TOPLEFT"}, "confidence": 0.9766736626625061, "cells": [{"id": 9, "text": "3.", "bbox": {"l": 136.8, "t": 506.56863, "r": 145.17432, "b": 515.78162, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Compare the advised indexes that are provided by the Optimizer without RCAC and with ", "bbox": {"l": 147.96574, "t": 506.56863, "r": 543.63715, "b": 515.78162, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "RCAC enabled. Figure 4-69 shows the index advice for the SQL statement without RCAC ", "bbox": {"l": 151.20016, "t": 518.56845, "r": 547.23944, "b": 527.78143, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "enabled. The index being advised is for the ORDER BY clause.", "bbox": {"l": 151.20016, "t": 530.5682400000001, "r": 430.28333, "b": 539.78125, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "caption", "bbox": {"l": 64.800003, "t": 667.5179, "r": 227.10149, "b": 675.8429, "coord_origin": "TOPLEFT"}, "confidence": 0.9514285922050476, "cells": [{"id": 13, "text": "Figure 4-69 Index advice with no RCAC", "bbox": {"l": 64.800003, "t": 667.5179, "r": 227.10149, "b": 675.8429, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "picture", "bbox": {"l": 136.5016632080078, "t": 119.2491226196289, "r": 545.4508666992188, "b": 477.5412292480469, "coord_origin": "TOPLEFT"}, "confidence": 0.9864527583122253, "cells": [], "children": []}, {"id": 1, "label": "picture", "bbox": {"l": 64.27847290039062, "t": 553.5814819335938, "r": 506.39263916015625, "b": 664.0870971679688, "coord_origin": "TOPLEFT"}, "confidence": 0.9797719120979309, "cells": [], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_footer", "id": 4, "page_no": 14, "cluster": {"id": 4, "label": "page_footer", "bbox": {"l": 214.8, "t": 755.538002, "r": 523.59357, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.95576012134552, "cells": [{"id": 0, "text": "Chapter 4. Implementing Row and Column Access Control: Banking example ", "bbox": {"l": 214.8, "t": 755.538002, "r": 523.59357, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Chapter 4. Implementing Row and Column Access Control: Banking example"}, {"label": "page_footer", "id": 7, "page_no": 14, "cluster": {"id": 7, "label": "page_footer", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.9056528806686401, "cells": [{"id": 1, "text": "77", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "77"}, {"label": "list_item", "id": 3, "page_no": 14, "cluster": {"id": 3, "label": "list_item", "bbox": {"l": 136.79959, "t": 71.50903000000005, "r": 514.04858, "b": 104.72167999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9761855006217957, "cells": [{"id": 2, "text": "2.", "bbox": {"l": 136.79959, "t": 71.50903000000005, "r": 145.19554, "b": 80.72204999999985, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Figure 4-68 shows the Visual Explain of the same SQL statement, but with RCAC ", "bbox": {"l": 147.9942, "t": 71.50903000000005, "r": 513.35919, "b": 80.72204999999985, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "enabled. It is clear that the implementation of the SQL statement is more complex ", "bbox": {"l": 151.19975, "t": 83.50885000000017, "r": 514.04858, "b": 92.72185999999999, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "because the row permission rule becomes part of the ", "bbox": {"l": 151.19975, "t": 95.50867000000005, "r": 389.64822, "b": 104.72167999999999, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "WHERE", "bbox": {"l": 389.57941, "t": 95.65808000000015, "r": 414.53918, "b": 104.48266999999998, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": " clause.", "bbox": {"l": 414.59991, "t": 95.50867000000005, "r": 448.8892200000001, "b": 104.72167999999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2. Figure 4-68 shows the Visual Explain of the same SQL statement, but with RCAC enabled. It is clear that the implementation of the SQL statement is more complex because the row permission rule becomes part of the WHERE clause."}, {"label": "caption", "id": 5, "page_no": 14, "cluster": {"id": 5, "label": "caption", "bbox": {"l": 136.8, "t": 480.55798, "r": 327.09329, "b": 488.883, "coord_origin": "TOPLEFT"}, "confidence": 0.9529654383659363, "cells": [{"id": 8, "text": "Figure 4-68 Visual Explain with RCAC enabled", "bbox": {"l": 136.8, "t": 480.55798, "r": 327.09329, "b": 488.883, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 4-68 Visual Explain with RCAC enabled"}, {"label": "list_item", "id": 2, "page_no": 14, "cluster": {"id": 2, "label": "list_item", "bbox": {"l": 136.8, "t": 506.56863, "r": 547.23944, "b": 539.78125, "coord_origin": "TOPLEFT"}, "confidence": 0.9766736626625061, "cells": [{"id": 9, "text": "3.", "bbox": {"l": 136.8, "t": 506.56863, "r": 145.17432, "b": 515.78162, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Compare the advised indexes that are provided by the Optimizer without RCAC and with ", "bbox": {"l": 147.96574, "t": 506.56863, "r": 543.63715, "b": 515.78162, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "RCAC enabled. Figure 4-69 shows the index advice for the SQL statement without RCAC ", "bbox": {"l": 151.20016, "t": 518.56845, "r": 547.23944, "b": 527.78143, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "enabled. The index being advised is for the ORDER BY clause.", "bbox": {"l": 151.20016, "t": 530.5682400000001, "r": 430.28333, "b": 539.78125, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3. Compare the advised indexes that are provided by the Optimizer without RCAC and with RCAC enabled. Figure 4-69 shows the index advice for the SQL statement without RCAC enabled. The index being advised is for the ORDER BY clause."}, {"label": "caption", "id": 6, "page_no": 14, "cluster": {"id": 6, "label": "caption", "bbox": {"l": 64.800003, "t": 667.5179, "r": 227.10149, "b": 675.8429, "coord_origin": "TOPLEFT"}, "confidence": 0.9514285922050476, "cells": [{"id": 13, "text": "Figure 4-69 Index advice with no RCAC", "bbox": {"l": 64.800003, "t": 667.5179, "r": 227.10149, "b": 675.8429, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 4-69 Index advice with no RCAC"}, {"label": "picture", "id": 0, "page_no": 14, "cluster": {"id": 0, "label": "picture", "bbox": {"l": 136.5016632080078, "t": 119.2491226196289, "r": 545.4508666992188, "b": 477.5412292480469, "coord_origin": "TOPLEFT"}, "confidence": 0.9864527583122253, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "picture", "id": 1, "page_no": 14, "cluster": {"id": 1, "label": "picture", "bbox": {"l": 64.27847290039062, "t": 553.5814819335938, "r": 506.39263916015625, "b": 664.0870971679688, "coord_origin": "TOPLEFT"}, "confidence": 0.9797719120979309, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "body": [{"label": "list_item", "id": 3, "page_no": 14, "cluster": {"id": 3, "label": "list_item", "bbox": {"l": 136.79959, "t": 71.50903000000005, "r": 514.04858, "b": 104.72167999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9761855006217957, "cells": [{"id": 2, "text": "2.", "bbox": {"l": 136.79959, "t": 71.50903000000005, "r": 145.19554, "b": 80.72204999999985, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Figure 4-68 shows the Visual Explain of the same SQL statement, but with RCAC ", "bbox": {"l": 147.9942, "t": 71.50903000000005, "r": 513.35919, "b": 80.72204999999985, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "enabled. It is clear that the implementation of the SQL statement is more complex ", "bbox": {"l": 151.19975, "t": 83.50885000000017, "r": 514.04858, "b": 92.72185999999999, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "because the row permission rule becomes part of the ", "bbox": {"l": 151.19975, "t": 95.50867000000005, "r": 389.64822, "b": 104.72167999999999, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "WHERE", "bbox": {"l": 389.57941, "t": 95.65808000000015, "r": 414.53918, "b": 104.48266999999998, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": " clause.", "bbox": {"l": 414.59991, "t": 95.50867000000005, "r": 448.8892200000001, "b": 104.72167999999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2. Figure 4-68 shows the Visual Explain of the same SQL statement, but with RCAC enabled. It is clear that the implementation of the SQL statement is more complex because the row permission rule becomes part of the WHERE clause."}, {"label": "caption", "id": 5, "page_no": 14, "cluster": {"id": 5, "label": "caption", "bbox": {"l": 136.8, "t": 480.55798, "r": 327.09329, "b": 488.883, "coord_origin": "TOPLEFT"}, "confidence": 0.9529654383659363, "cells": [{"id": 8, "text": "Figure 4-68 Visual Explain with RCAC enabled", "bbox": {"l": 136.8, "t": 480.55798, "r": 327.09329, "b": 488.883, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 4-68 Visual Explain with RCAC enabled"}, {"label": "list_item", "id": 2, "page_no": 14, "cluster": {"id": 2, "label": "list_item", "bbox": {"l": 136.8, "t": 506.56863, "r": 547.23944, "b": 539.78125, "coord_origin": "TOPLEFT"}, "confidence": 0.9766736626625061, "cells": [{"id": 9, "text": "3.", "bbox": {"l": 136.8, "t": 506.56863, "r": 145.17432, "b": 515.78162, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Compare the advised indexes that are provided by the Optimizer without RCAC and with ", "bbox": {"l": 147.96574, "t": 506.56863, "r": 543.63715, "b": 515.78162, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "RCAC enabled. Figure 4-69 shows the index advice for the SQL statement without RCAC ", "bbox": {"l": 151.20016, "t": 518.56845, "r": 547.23944, "b": 527.78143, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "enabled. The index being advised is for the ORDER BY clause.", "bbox": {"l": 151.20016, "t": 530.5682400000001, "r": 430.28333, "b": 539.78125, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3. Compare the advised indexes that are provided by the Optimizer without RCAC and with RCAC enabled. Figure 4-69 shows the index advice for the SQL statement without RCAC enabled. The index being advised is for the ORDER BY clause."}, {"label": "caption", "id": 6, "page_no": 14, "cluster": {"id": 6, "label": "caption", "bbox": {"l": 64.800003, "t": 667.5179, "r": 227.10149, "b": 675.8429, "coord_origin": "TOPLEFT"}, "confidence": 0.9514285922050476, "cells": [{"id": 13, "text": "Figure 4-69 Index advice with no RCAC", "bbox": {"l": 64.800003, "t": 667.5179, "r": 227.10149, "b": 675.8429, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 4-69 Index advice with no RCAC"}, {"label": "picture", "id": 0, "page_no": 14, "cluster": {"id": 0, "label": "picture", "bbox": {"l": 136.5016632080078, "t": 119.2491226196289, "r": 545.4508666992188, "b": 477.5412292480469, "coord_origin": "TOPLEFT"}, "confidence": 0.9864527583122253, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "picture", "id": 1, "page_no": 14, "cluster": {"id": 1, "label": "picture", "bbox": {"l": 64.27847290039062, "t": 553.5814819335938, "r": 506.39263916015625, "b": 664.0870971679688, "coord_origin": "TOPLEFT"}, "confidence": 0.9797719120979309, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "headers": [{"label": "page_footer", "id": 4, "page_no": 14, "cluster": {"id": 4, "label": "page_footer", "bbox": {"l": 214.8, "t": 755.538002, "r": 523.59357, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.95576012134552, "cells": [{"id": 0, "text": "Chapter 4. Implementing Row and Column Access Control: Banking example ", "bbox": {"l": 214.8, "t": 755.538002, "r": 523.59357, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Chapter 4. Implementing Row and Column Access Control: Banking example"}, {"label": "page_footer", "id": 7, "page_no": 14, "cluster": {"id": 7, "label": "page_footer", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.9056528806686401, "cells": [{"id": 1, "text": "77", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "77"}]}}, {"page_no": 15, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "124 ", "bbox": {"l": 64.800003, "t": 754.848721, "r": 83.982002, "b": 764.06172, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Row and Column Access Control Support in IBM DB2 for i", "bbox": {"l": 98.940002, "t": 755.538002, "r": 339.81958, "b": 763.863001, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "THEN C . CUSTOMER_TAX_ID ", "bbox": {"l": 64.800308, "t": 71.67296999999996, "r": 177.1194, "b": 79.60199, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'TELLER' ) = 1 ", "bbox": {"l": 64.800308, "t": 82.65295000000015, "r": 365.87817, "b": 90.58196999999996, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "THEN ( 'XXX-XX-' CONCAT QSYS2 . SUBSTR ( C . CUSTOMER_TAX_ID , 8 , 4 ) ) ", "bbox": {"l": 64.800308, "t": 93.63292999999999, "r": 392.81787, "b": 101.56195000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 ", "bbox": {"l": 64.800308, "t": 104.67322000000001, "r": 374.87817, "b": 112.60222999999996, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "THEN C . CUSTOMER_TAX_ID ", "bbox": {"l": 64.800308, "t": 115.65319999999997, "r": 177.1194, "b": 123.58220999999992, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "ELSE 'XXX-XX-XXXX' ", "bbox": {"l": 64.800308, "t": 126.63318000000015, "r": 150.1797, "b": 134.56219, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "END ", "bbox": {"l": 64.800308, "t": 137.67345999999998, "r": 96.240005, "b": 145.60248, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "ENABLE ; ", "bbox": {"l": 79.20031, "t": 148.65344000000005, "r": 124.14001, "b": 156.58245999999997, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "CREATE MASK BANK_SCHEMA.MASK_DRIVERS_LICENSE_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C ", "bbox": {"l": 64.800308, "t": 170.67377, "r": 460.25757, "b": 178.60278000000005, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "FOR COLUMN CUSTOMER_DRIVERS_LICENSE_NUMBER ", "bbox": {"l": 79.20031, "t": 181.65374999999995, "r": 272.45911, "b": 189.58276, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "RETURN CASE ", "bbox": {"l": 79.20031, "t": 192.69403, "r": 137.64001, "b": 200.62305000000003, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 ", "bbox": {"l": 64.800308, "t": 203.67400999999995, "r": 361.37817, "b": 211.60303, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "THEN C . CUSTOMER_DRIVERS_LICENSE_NUMBER ", "bbox": {"l": 64.800308, "t": 214.65399000000002, "r": 249.0591, "b": 222.58300999999994, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'TELLER' ) = 1 ", "bbox": {"l": 64.800308, "t": 225.69426999999996, "r": 365.87817, "b": 233.62329, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "THEN C . CUSTOMER_DRIVERS_LICENSE_NUMBER ", "bbox": {"l": 64.800308, "t": 236.67426, "r": 249.0591, "b": 244.60326999999995, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 ", "bbox": {"l": 64.800308, "t": 247.65423999999996, "r": 374.87817, "b": 255.58325000000002, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "THEN C . CUSTOMER_DRIVERS_LICENSE_NUMBER ", "bbox": {"l": 64.800308, "t": 258.69452, "r": 249.0591, "b": 266.62354000000005, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "ELSE '*************' ", "bbox": {"l": 64.800308, "t": 269.67449999999997, "r": 159.1797, "b": 277.60352, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "END ", "bbox": {"l": 64.800308, "t": 280.65454, "r": 96.240005, "b": 288.58353, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "ENABLE ; ", "bbox": {"l": 79.20031, "t": 291.69485000000003, "r": 124.14001, "b": 299.62384, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "CREATE MASK BANK_SCHEMA.MASK_LOGIN_ID_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C ", "bbox": {"l": 64.800308, "t": 313.65485, "r": 428.81786999999997, "b": 321.58383, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "FOR COLUMN CUSTOMER_LOGIN_ID ", "bbox": {"l": 79.20031, "t": 324.69516, "r": 209.51941, "b": 332.62415, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "RETURN CASE ", "bbox": {"l": 79.20031, "t": 335.67517, "r": 137.64001, "b": 343.6041599999999, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 ", "bbox": {"l": 64.800308, "t": 346.65518, "r": 361.37817, "b": 354.58417, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "THEN C . CUSTOMER_LOGIN_ID ", "bbox": {"l": 64.800308, "t": 357.69550000000004, "r": 186.1194, "b": 365.62448, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 ", "bbox": {"l": 64.800308, "t": 368.67551, "r": 374.87817, "b": 376.60449, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "THEN C . CUSTOMER_LOGIN_ID ", "bbox": {"l": 64.800308, "t": 379.65552, "r": 186.1194, "b": 387.5845, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "ELSE '*****' ", "bbox": {"l": 64.800308, "t": 390.69583, "r": 123.24001, "b": 398.62482, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "END ", "bbox": {"l": 64.800308, "t": 401.67584, "r": 96.240005, "b": 409.60482999999994, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "ENABLE ; ", "bbox": {"l": 79.20031, "t": 412.65585, "r": 124.14001, "b": 420.58484, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "CREATE MASK BANK_SCHEMA.MASK_SECURITY_QUESTION_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C ", "bbox": {"l": 64.800308, "t": 434.67615, "r": 469.25757, "b": 442.60513, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "FOR COLUMN CUSTOMER_SECURITY_QUESTION ", "bbox": {"l": 79.20031, "t": 445.65616000000006, "r": 249.95911, "b": 453.58514, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "RETURN CASE ", "bbox": {"l": 79.20031, "t": 456.6964699999999, "r": 137.64001, "b": 464.62546, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 ", "bbox": {"l": 64.800308, "t": 467.67648, "r": 361.37817, "b": 475.60547, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "THEN C . CUSTOMER_SECURITY_QUESTION ", "bbox": {"l": 64.800308, "t": 478.65649, "r": 226.5591, "b": 486.58548, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 ", "bbox": {"l": 64.800308, "t": 489.69681, "r": 374.87817, "b": 497.62579, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "THEN C . CUSTOMER_SECURITY_QUESTION ", "bbox": {"l": 64.800308, "t": 500.67682, "r": 226.5591, "b": 508.6058, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "ELSE '*****' ", "bbox": {"l": 64.800308, "t": 511.65683, "r": 123.24001, "b": 519.58582, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "END ", "bbox": {"l": 64.800308, "t": 522.69714, "r": 96.240005, "b": 530.62613, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "ENABLE ; ", "bbox": {"l": 79.20031, "t": 533.6771200000001, "r": 124.14001, "b": 541.60614, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "CREATE MASK BANK_SCHEMA.MASK_SECURITY_QUESTION_ANSWER_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C ", "bbox": {"l": 64.800308, "t": 555.69745, "r": 500.69727, "b": 563.62645, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "FOR COLUMN CUSTOMER_SECURITY_QUESTION_ANSWER ", "bbox": {"l": 79.20031, "t": 566.6774399999999, "r": 281.3988, "b": 574.60645, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "RETURN CASE ", "bbox": {"l": 79.20031, "t": 577.65744, "r": 137.64001, "b": 585.58644, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 ", "bbox": {"l": 64.800308, "t": 588.6977400000001, "r": 361.37817, "b": 596.62674, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "THEN C . CUSTOMER_SECURITY_QUESTION_ANSWER ", "bbox": {"l": 64.800308, "t": 599.67773, "r": 258.05908, "b": 607.60674, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 ", "bbox": {"l": 64.800308, "t": 610.65773, "r": 374.87817, "b": 618.58673, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "THEN C . CUSTOMER_SECURITY_QUESTION_ANSWER ", "bbox": {"l": 64.800308, "t": 621.69803, "r": 258.05908, "b": 629.62703, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "ELSE '*****' ", "bbox": {"l": 64.800308, "t": 632.6780200000001, "r": 123.24001, "b": 640.60703, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "END ", "bbox": {"l": 64.800308, "t": 643.71832, "r": 96.240005, "b": 651.64732, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "ENABLE ; ", "bbox": {"l": 79.20031, "t": 654.69832, "r": 124.14001, "b": 662.62732, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "ALTER TABLE BANK_SCHEMA.CUSTOMERS ", "bbox": {"l": 64.800308, "t": 676.71861, "r": 226.5591, "b": 684.64761, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "ACTIVATE ROW ACCESS CONTROL ", "bbox": {"l": 79.20031, "t": 687.69862, "r": 214.01941, "b": 695.627617, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "ACTIVATE COLUMN ACCESS CONTROL ;", "bbox": {"l": 79.20031, "t": 698.678619, "r": 223.01941, "b": 706.60762, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 1, "label": "page_footer", "bbox": {"l": 64.800003, "t": 754.848721, "r": 83.982002, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.8994001150131226, "cells": [{"id": 0, "text": "124 ", "bbox": {"l": 64.800003, "t": 754.848721, "r": 83.982002, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "page_footer", "bbox": {"l": 98.940002, "t": 755.538002, "r": 339.81958, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.943077027797699, "cells": [{"id": 1, "text": "Row and Column Access Control Support in IBM DB2 for i", "bbox": {"l": 98.940002, "t": 755.538002, "r": 339.81958, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "code", "bbox": {"l": 64.800308, "t": 71.67296999999996, "r": 500.69727, "b": 706.60762, "coord_origin": "TOPLEFT"}, "confidence": 0.7632161378860474, "cells": [{"id": 2, "text": "THEN C . CUSTOMER_TAX_ID ", "bbox": {"l": 64.800308, "t": 71.67296999999996, "r": 177.1194, "b": 79.60199, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'TELLER' ) = 1 ", "bbox": {"l": 64.800308, "t": 82.65295000000015, "r": 365.87817, "b": 90.58196999999996, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "THEN ( 'XXX-XX-' CONCAT QSYS2 . SUBSTR ( C . CUSTOMER_TAX_ID , 8 , 4 ) ) ", "bbox": {"l": 64.800308, "t": 93.63292999999999, "r": 392.81787, "b": 101.56195000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 ", "bbox": {"l": 64.800308, "t": 104.67322000000001, "r": 374.87817, "b": 112.60222999999996, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "THEN C . CUSTOMER_TAX_ID ", "bbox": {"l": 64.800308, "t": 115.65319999999997, "r": 177.1194, "b": 123.58220999999992, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "ELSE 'XXX-XX-XXXX' ", "bbox": {"l": 64.800308, "t": 126.63318000000015, "r": 150.1797, "b": 134.56219, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "END ", "bbox": {"l": 64.800308, "t": 137.67345999999998, "r": 96.240005, "b": 145.60248, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "ENABLE ; ", "bbox": {"l": 79.20031, "t": 148.65344000000005, "r": 124.14001, "b": 156.58245999999997, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "CREATE MASK BANK_SCHEMA.MASK_DRIVERS_LICENSE_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C ", "bbox": {"l": 64.800308, "t": 170.67377, "r": 460.25757, "b": 178.60278000000005, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "FOR COLUMN CUSTOMER_DRIVERS_LICENSE_NUMBER ", "bbox": {"l": 79.20031, "t": 181.65374999999995, "r": 272.45911, "b": 189.58276, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "RETURN CASE ", "bbox": {"l": 79.20031, "t": 192.69403, "r": 137.64001, "b": 200.62305000000003, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 ", "bbox": {"l": 64.800308, "t": 203.67400999999995, "r": 361.37817, "b": 211.60303, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "THEN C . CUSTOMER_DRIVERS_LICENSE_NUMBER ", "bbox": {"l": 64.800308, "t": 214.65399000000002, "r": 249.0591, "b": 222.58300999999994, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'TELLER' ) = 1 ", "bbox": {"l": 64.800308, "t": 225.69426999999996, "r": 365.87817, "b": 233.62329, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "THEN C . CUSTOMER_DRIVERS_LICENSE_NUMBER ", "bbox": {"l": 64.800308, "t": 236.67426, "r": 249.0591, "b": 244.60326999999995, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 ", "bbox": {"l": 64.800308, "t": 247.65423999999996, "r": 374.87817, "b": 255.58325000000002, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "THEN C . CUSTOMER_DRIVERS_LICENSE_NUMBER ", "bbox": {"l": 64.800308, "t": 258.69452, "r": 249.0591, "b": 266.62354000000005, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "ELSE '*************' ", "bbox": {"l": 64.800308, "t": 269.67449999999997, "r": 159.1797, "b": 277.60352, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "END ", "bbox": {"l": 64.800308, "t": 280.65454, "r": 96.240005, "b": 288.58353, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "ENABLE ; ", "bbox": {"l": 79.20031, "t": 291.69485000000003, "r": 124.14001, "b": 299.62384, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "CREATE MASK BANK_SCHEMA.MASK_LOGIN_ID_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C ", "bbox": {"l": 64.800308, "t": 313.65485, "r": 428.81786999999997, "b": 321.58383, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "FOR COLUMN CUSTOMER_LOGIN_ID ", "bbox": {"l": 79.20031, "t": 324.69516, "r": 209.51941, "b": 332.62415, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "RETURN CASE ", "bbox": {"l": 79.20031, "t": 335.67517, "r": 137.64001, "b": 343.6041599999999, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 ", "bbox": {"l": 64.800308, "t": 346.65518, "r": 361.37817, "b": 354.58417, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "THEN C . CUSTOMER_LOGIN_ID ", "bbox": {"l": 64.800308, "t": 357.69550000000004, "r": 186.1194, "b": 365.62448, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 ", "bbox": {"l": 64.800308, "t": 368.67551, "r": 374.87817, "b": 376.60449, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "THEN C . CUSTOMER_LOGIN_ID ", "bbox": {"l": 64.800308, "t": 379.65552, "r": 186.1194, "b": 387.5845, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "ELSE '*****' ", "bbox": {"l": 64.800308, "t": 390.69583, "r": 123.24001, "b": 398.62482, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "END ", "bbox": {"l": 64.800308, "t": 401.67584, "r": 96.240005, "b": 409.60482999999994, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "ENABLE ; ", "bbox": {"l": 79.20031, "t": 412.65585, "r": 124.14001, "b": 420.58484, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "CREATE MASK BANK_SCHEMA.MASK_SECURITY_QUESTION_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C ", "bbox": {"l": 64.800308, "t": 434.67615, "r": 469.25757, "b": 442.60513, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "FOR COLUMN CUSTOMER_SECURITY_QUESTION ", "bbox": {"l": 79.20031, "t": 445.65616000000006, "r": 249.95911, "b": 453.58514, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "RETURN CASE ", "bbox": {"l": 79.20031, "t": 456.6964699999999, "r": 137.64001, "b": 464.62546, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 ", "bbox": {"l": 64.800308, "t": 467.67648, "r": 361.37817, "b": 475.60547, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "THEN C . CUSTOMER_SECURITY_QUESTION ", "bbox": {"l": 64.800308, "t": 478.65649, "r": 226.5591, "b": 486.58548, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 ", "bbox": {"l": 64.800308, "t": 489.69681, "r": 374.87817, "b": 497.62579, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "THEN C . CUSTOMER_SECURITY_QUESTION ", "bbox": {"l": 64.800308, "t": 500.67682, "r": 226.5591, "b": 508.6058, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "ELSE '*****' ", "bbox": {"l": 64.800308, "t": 511.65683, "r": 123.24001, "b": 519.58582, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "END ", "bbox": {"l": 64.800308, "t": 522.69714, "r": 96.240005, "b": 530.62613, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "ENABLE ; ", "bbox": {"l": 79.20031, "t": 533.6771200000001, "r": 124.14001, "b": 541.60614, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "CREATE MASK BANK_SCHEMA.MASK_SECURITY_QUESTION_ANSWER_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C ", "bbox": {"l": 64.800308, "t": 555.69745, "r": 500.69727, "b": 563.62645, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "FOR COLUMN CUSTOMER_SECURITY_QUESTION_ANSWER ", "bbox": {"l": 79.20031, "t": 566.6774399999999, "r": 281.3988, "b": 574.60645, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "RETURN CASE ", "bbox": {"l": 79.20031, "t": 577.65744, "r": 137.64001, "b": 585.58644, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 ", "bbox": {"l": 64.800308, "t": 588.6977400000001, "r": 361.37817, "b": 596.62674, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "THEN C . CUSTOMER_SECURITY_QUESTION_ANSWER ", "bbox": {"l": 64.800308, "t": 599.67773, "r": 258.05908, "b": 607.60674, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 ", "bbox": {"l": 64.800308, "t": 610.65773, "r": 374.87817, "b": 618.58673, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "THEN C . CUSTOMER_SECURITY_QUESTION_ANSWER ", "bbox": {"l": 64.800308, "t": 621.69803, "r": 258.05908, "b": 629.62703, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "ELSE '*****' ", "bbox": {"l": 64.800308, "t": 632.6780200000001, "r": 123.24001, "b": 640.60703, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "END ", "bbox": {"l": 64.800308, "t": 643.71832, "r": 96.240005, "b": 651.64732, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "ENABLE ; ", "bbox": {"l": 79.20031, "t": 654.69832, "r": 124.14001, "b": 662.62732, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "ALTER TABLE BANK_SCHEMA.CUSTOMERS ", "bbox": {"l": 64.800308, "t": 676.71861, "r": 226.5591, "b": 684.64761, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "ACTIVATE ROW ACCESS CONTROL ", "bbox": {"l": 79.20031, "t": 687.69862, "r": 214.01941, "b": 695.627617, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "ACTIVATE COLUMN ACCESS CONTROL ;", "bbox": {"l": 79.20031, "t": 698.678619, "r": 223.01941, "b": 706.60762, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_footer", "id": 1, "page_no": 15, "cluster": {"id": 1, "label": "page_footer", "bbox": {"l": 64.800003, "t": 754.848721, "r": 83.982002, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.8994001150131226, "cells": [{"id": 0, "text": "124 ", "bbox": {"l": 64.800003, "t": 754.848721, "r": 83.982002, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "124"}, {"label": "page_footer", "id": 0, "page_no": 15, "cluster": {"id": 0, "label": "page_footer", "bbox": {"l": 98.940002, "t": 755.538002, "r": 339.81958, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.943077027797699, "cells": [{"id": 1, "text": "Row and Column Access Control Support in IBM DB2 for i", "bbox": {"l": 98.940002, "t": 755.538002, "r": 339.81958, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Row and Column Access Control Support in IBM DB2 for i"}, {"label": "code", "id": 2, "page_no": 15, "cluster": {"id": 2, "label": "code", "bbox": {"l": 64.800308, "t": 71.67296999999996, "r": 500.69727, "b": 706.60762, "coord_origin": "TOPLEFT"}, "confidence": 0.7632161378860474, "cells": [{"id": 2, "text": "THEN C . CUSTOMER_TAX_ID ", "bbox": {"l": 64.800308, "t": 71.67296999999996, "r": 177.1194, "b": 79.60199, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'TELLER' ) = 1 ", "bbox": {"l": 64.800308, "t": 82.65295000000015, "r": 365.87817, "b": 90.58196999999996, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "THEN ( 'XXX-XX-' CONCAT QSYS2 . SUBSTR ( C . CUSTOMER_TAX_ID , 8 , 4 ) ) ", "bbox": {"l": 64.800308, "t": 93.63292999999999, "r": 392.81787, "b": 101.56195000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 ", "bbox": {"l": 64.800308, "t": 104.67322000000001, "r": 374.87817, "b": 112.60222999999996, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "THEN C . CUSTOMER_TAX_ID ", "bbox": {"l": 64.800308, "t": 115.65319999999997, "r": 177.1194, "b": 123.58220999999992, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "ELSE 'XXX-XX-XXXX' ", "bbox": {"l": 64.800308, "t": 126.63318000000015, "r": 150.1797, "b": 134.56219, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "END ", "bbox": {"l": 64.800308, "t": 137.67345999999998, "r": 96.240005, "b": 145.60248, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "ENABLE ; ", "bbox": {"l": 79.20031, "t": 148.65344000000005, "r": 124.14001, "b": 156.58245999999997, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "CREATE MASK BANK_SCHEMA.MASK_DRIVERS_LICENSE_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C ", "bbox": {"l": 64.800308, "t": 170.67377, "r": 460.25757, "b": 178.60278000000005, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "FOR COLUMN CUSTOMER_DRIVERS_LICENSE_NUMBER ", "bbox": {"l": 79.20031, "t": 181.65374999999995, "r": 272.45911, "b": 189.58276, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "RETURN CASE ", "bbox": {"l": 79.20031, "t": 192.69403, "r": 137.64001, "b": 200.62305000000003, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 ", "bbox": {"l": 64.800308, "t": 203.67400999999995, "r": 361.37817, "b": 211.60303, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "THEN C . CUSTOMER_DRIVERS_LICENSE_NUMBER ", "bbox": {"l": 64.800308, "t": 214.65399000000002, "r": 249.0591, "b": 222.58300999999994, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'TELLER' ) = 1 ", "bbox": {"l": 64.800308, "t": 225.69426999999996, "r": 365.87817, "b": 233.62329, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "THEN C . CUSTOMER_DRIVERS_LICENSE_NUMBER ", "bbox": {"l": 64.800308, "t": 236.67426, "r": 249.0591, "b": 244.60326999999995, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 ", "bbox": {"l": 64.800308, "t": 247.65423999999996, "r": 374.87817, "b": 255.58325000000002, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "THEN C . CUSTOMER_DRIVERS_LICENSE_NUMBER ", "bbox": {"l": 64.800308, "t": 258.69452, "r": 249.0591, "b": 266.62354000000005, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "ELSE '*************' ", "bbox": {"l": 64.800308, "t": 269.67449999999997, "r": 159.1797, "b": 277.60352, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "END ", "bbox": {"l": 64.800308, "t": 280.65454, "r": 96.240005, "b": 288.58353, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "ENABLE ; ", "bbox": {"l": 79.20031, "t": 291.69485000000003, "r": 124.14001, "b": 299.62384, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "CREATE MASK BANK_SCHEMA.MASK_LOGIN_ID_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C ", "bbox": {"l": 64.800308, "t": 313.65485, "r": 428.81786999999997, "b": 321.58383, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "FOR COLUMN CUSTOMER_LOGIN_ID ", "bbox": {"l": 79.20031, "t": 324.69516, "r": 209.51941, "b": 332.62415, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "RETURN CASE ", "bbox": {"l": 79.20031, "t": 335.67517, "r": 137.64001, "b": 343.6041599999999, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 ", "bbox": {"l": 64.800308, "t": 346.65518, "r": 361.37817, "b": 354.58417, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "THEN C . CUSTOMER_LOGIN_ID ", "bbox": {"l": 64.800308, "t": 357.69550000000004, "r": 186.1194, "b": 365.62448, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 ", "bbox": {"l": 64.800308, "t": 368.67551, "r": 374.87817, "b": 376.60449, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "THEN C . CUSTOMER_LOGIN_ID ", "bbox": {"l": 64.800308, "t": 379.65552, "r": 186.1194, "b": 387.5845, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "ELSE '*****' ", "bbox": {"l": 64.800308, "t": 390.69583, "r": 123.24001, "b": 398.62482, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "END ", "bbox": {"l": 64.800308, "t": 401.67584, "r": 96.240005, "b": 409.60482999999994, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "ENABLE ; ", "bbox": {"l": 79.20031, "t": 412.65585, "r": 124.14001, "b": 420.58484, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "CREATE MASK BANK_SCHEMA.MASK_SECURITY_QUESTION_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C ", "bbox": {"l": 64.800308, "t": 434.67615, "r": 469.25757, "b": 442.60513, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "FOR COLUMN CUSTOMER_SECURITY_QUESTION ", "bbox": {"l": 79.20031, "t": 445.65616000000006, "r": 249.95911, "b": 453.58514, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "RETURN CASE ", "bbox": {"l": 79.20031, "t": 456.6964699999999, "r": 137.64001, "b": 464.62546, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 ", "bbox": {"l": 64.800308, "t": 467.67648, "r": 361.37817, "b": 475.60547, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "THEN C . CUSTOMER_SECURITY_QUESTION ", "bbox": {"l": 64.800308, "t": 478.65649, "r": 226.5591, "b": 486.58548, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 ", "bbox": {"l": 64.800308, "t": 489.69681, "r": 374.87817, "b": 497.62579, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "THEN C . CUSTOMER_SECURITY_QUESTION ", "bbox": {"l": 64.800308, "t": 500.67682, "r": 226.5591, "b": 508.6058, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "ELSE '*****' ", "bbox": {"l": 64.800308, "t": 511.65683, "r": 123.24001, "b": 519.58582, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "END ", "bbox": {"l": 64.800308, "t": 522.69714, "r": 96.240005, "b": 530.62613, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "ENABLE ; ", "bbox": {"l": 79.20031, "t": 533.6771200000001, "r": 124.14001, "b": 541.60614, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "CREATE MASK BANK_SCHEMA.MASK_SECURITY_QUESTION_ANSWER_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C ", "bbox": {"l": 64.800308, "t": 555.69745, "r": 500.69727, "b": 563.62645, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "FOR COLUMN CUSTOMER_SECURITY_QUESTION_ANSWER ", "bbox": {"l": 79.20031, "t": 566.6774399999999, "r": 281.3988, "b": 574.60645, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "RETURN CASE ", "bbox": {"l": 79.20031, "t": 577.65744, "r": 137.64001, "b": 585.58644, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 ", "bbox": {"l": 64.800308, "t": 588.6977400000001, "r": 361.37817, "b": 596.62674, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "THEN C . CUSTOMER_SECURITY_QUESTION_ANSWER ", "bbox": {"l": 64.800308, "t": 599.67773, "r": 258.05908, "b": 607.60674, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 ", "bbox": {"l": 64.800308, "t": 610.65773, "r": 374.87817, "b": 618.58673, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "THEN C . CUSTOMER_SECURITY_QUESTION_ANSWER ", "bbox": {"l": 64.800308, "t": 621.69803, "r": 258.05908, "b": 629.62703, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "ELSE '*****' ", "bbox": {"l": 64.800308, "t": 632.6780200000001, "r": 123.24001, "b": 640.60703, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "END ", "bbox": {"l": 64.800308, "t": 643.71832, "r": 96.240005, "b": 651.64732, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "ENABLE ; ", "bbox": {"l": 79.20031, "t": 654.69832, "r": 124.14001, "b": 662.62732, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "ALTER TABLE BANK_SCHEMA.CUSTOMERS ", "bbox": {"l": 64.800308, "t": 676.71861, "r": 226.5591, "b": 684.64761, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "ACTIVATE ROW ACCESS CONTROL ", "bbox": {"l": 79.20031, "t": 687.69862, "r": 214.01941, "b": 695.627617, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "ACTIVATE COLUMN ACCESS CONTROL ;", "bbox": {"l": 79.20031, "t": 698.678619, "r": 223.01941, "b": 706.60762, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "THEN C . CUSTOMER_TAX_ID WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'TELLER' ) = 1 THEN ( 'XXX-XX-' CONCAT QSYS2 . SUBSTR ( C . CUSTOMER_TAX_ID , 8 , 4 ) ) WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 THEN C . CUSTOMER_TAX_ID ELSE 'XXX-XX-XXXX' END ENABLE ; CREATE MASK BANK_SCHEMA.MASK_DRIVERS_LICENSE_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C FOR COLUMN CUSTOMER_DRIVERS_LICENSE_NUMBER RETURN CASE WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 THEN C . CUSTOMER_DRIVERS_LICENSE_NUMBER WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'TELLER' ) = 1 THEN C . CUSTOMER_DRIVERS_LICENSE_NUMBER WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 THEN C . CUSTOMER_DRIVERS_LICENSE_NUMBER ELSE '*************' END ENABLE ; CREATE MASK BANK_SCHEMA.MASK_LOGIN_ID_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C FOR COLUMN CUSTOMER_LOGIN_ID RETURN CASE WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 THEN C . CUSTOMER_LOGIN_ID WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 THEN C . CUSTOMER_LOGIN_ID ELSE '*****' END ENABLE ; CREATE MASK BANK_SCHEMA.MASK_SECURITY_QUESTION_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C FOR COLUMN CUSTOMER_SECURITY_QUESTION RETURN CASE WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 THEN C . CUSTOMER_SECURITY_QUESTION WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 THEN C . CUSTOMER_SECURITY_QUESTION ELSE '*****' END ENABLE ; CREATE MASK BANK_SCHEMA.MASK_SECURITY_QUESTION_ANSWER_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C FOR COLUMN CUSTOMER_SECURITY_QUESTION_ANSWER RETURN CASE WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 THEN C . CUSTOMER_SECURITY_QUESTION_ANSWER WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 THEN C . CUSTOMER_SECURITY_QUESTION_ANSWER ELSE '*****' END ENABLE ; ALTER TABLE BANK_SCHEMA.CUSTOMERS ACTIVATE ROW ACCESS CONTROL ACTIVATE COLUMN ACCESS CONTROL ;"}], "body": [{"label": "code", "id": 2, "page_no": 15, "cluster": {"id": 2, "label": "code", "bbox": {"l": 64.800308, "t": 71.67296999999996, "r": 500.69727, "b": 706.60762, "coord_origin": "TOPLEFT"}, "confidence": 0.7632161378860474, "cells": [{"id": 2, "text": "THEN C . CUSTOMER_TAX_ID ", "bbox": {"l": 64.800308, "t": 71.67296999999996, "r": 177.1194, "b": 79.60199, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'TELLER' ) = 1 ", "bbox": {"l": 64.800308, "t": 82.65295000000015, "r": 365.87817, "b": 90.58196999999996, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "THEN ( 'XXX-XX-' CONCAT QSYS2 . SUBSTR ( C . CUSTOMER_TAX_ID , 8 , 4 ) ) ", "bbox": {"l": 64.800308, "t": 93.63292999999999, "r": 392.81787, "b": 101.56195000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 ", "bbox": {"l": 64.800308, "t": 104.67322000000001, "r": 374.87817, "b": 112.60222999999996, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "THEN C . CUSTOMER_TAX_ID ", "bbox": {"l": 64.800308, "t": 115.65319999999997, "r": 177.1194, "b": 123.58220999999992, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "ELSE 'XXX-XX-XXXX' ", "bbox": {"l": 64.800308, "t": 126.63318000000015, "r": 150.1797, "b": 134.56219, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "END ", "bbox": {"l": 64.800308, "t": 137.67345999999998, "r": 96.240005, "b": 145.60248, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "ENABLE ; ", "bbox": {"l": 79.20031, "t": 148.65344000000005, "r": 124.14001, "b": 156.58245999999997, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "CREATE MASK BANK_SCHEMA.MASK_DRIVERS_LICENSE_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C ", "bbox": {"l": 64.800308, "t": 170.67377, "r": 460.25757, "b": 178.60278000000005, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "FOR COLUMN CUSTOMER_DRIVERS_LICENSE_NUMBER ", "bbox": {"l": 79.20031, "t": 181.65374999999995, "r": 272.45911, "b": 189.58276, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "RETURN CASE ", "bbox": {"l": 79.20031, "t": 192.69403, "r": 137.64001, "b": 200.62305000000003, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 ", "bbox": {"l": 64.800308, "t": 203.67400999999995, "r": 361.37817, "b": 211.60303, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "THEN C . CUSTOMER_DRIVERS_LICENSE_NUMBER ", "bbox": {"l": 64.800308, "t": 214.65399000000002, "r": 249.0591, "b": 222.58300999999994, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'TELLER' ) = 1 ", "bbox": {"l": 64.800308, "t": 225.69426999999996, "r": 365.87817, "b": 233.62329, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "THEN C . CUSTOMER_DRIVERS_LICENSE_NUMBER ", "bbox": {"l": 64.800308, "t": 236.67426, "r": 249.0591, "b": 244.60326999999995, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 ", "bbox": {"l": 64.800308, "t": 247.65423999999996, "r": 374.87817, "b": 255.58325000000002, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "THEN C . CUSTOMER_DRIVERS_LICENSE_NUMBER ", "bbox": {"l": 64.800308, "t": 258.69452, "r": 249.0591, "b": 266.62354000000005, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "ELSE '*************' ", "bbox": {"l": 64.800308, "t": 269.67449999999997, "r": 159.1797, "b": 277.60352, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "END ", "bbox": {"l": 64.800308, "t": 280.65454, "r": 96.240005, "b": 288.58353, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "ENABLE ; ", "bbox": {"l": 79.20031, "t": 291.69485000000003, "r": 124.14001, "b": 299.62384, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "CREATE MASK BANK_SCHEMA.MASK_LOGIN_ID_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C ", "bbox": {"l": 64.800308, "t": 313.65485, "r": 428.81786999999997, "b": 321.58383, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "FOR COLUMN CUSTOMER_LOGIN_ID ", "bbox": {"l": 79.20031, "t": 324.69516, "r": 209.51941, "b": 332.62415, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "RETURN CASE ", "bbox": {"l": 79.20031, "t": 335.67517, "r": 137.64001, "b": 343.6041599999999, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 ", "bbox": {"l": 64.800308, "t": 346.65518, "r": 361.37817, "b": 354.58417, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "THEN C . CUSTOMER_LOGIN_ID ", "bbox": {"l": 64.800308, "t": 357.69550000000004, "r": 186.1194, "b": 365.62448, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 ", "bbox": {"l": 64.800308, "t": 368.67551, "r": 374.87817, "b": 376.60449, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "THEN C . CUSTOMER_LOGIN_ID ", "bbox": {"l": 64.800308, "t": 379.65552, "r": 186.1194, "b": 387.5845, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "ELSE '*****' ", "bbox": {"l": 64.800308, "t": 390.69583, "r": 123.24001, "b": 398.62482, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "END ", "bbox": {"l": 64.800308, "t": 401.67584, "r": 96.240005, "b": 409.60482999999994, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "ENABLE ; ", "bbox": {"l": 79.20031, "t": 412.65585, "r": 124.14001, "b": 420.58484, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "CREATE MASK BANK_SCHEMA.MASK_SECURITY_QUESTION_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C ", "bbox": {"l": 64.800308, "t": 434.67615, "r": 469.25757, "b": 442.60513, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "FOR COLUMN CUSTOMER_SECURITY_QUESTION ", "bbox": {"l": 79.20031, "t": 445.65616000000006, "r": 249.95911, "b": 453.58514, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "RETURN CASE ", "bbox": {"l": 79.20031, "t": 456.6964699999999, "r": 137.64001, "b": 464.62546, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 ", "bbox": {"l": 64.800308, "t": 467.67648, "r": 361.37817, "b": 475.60547, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "THEN C . CUSTOMER_SECURITY_QUESTION ", "bbox": {"l": 64.800308, "t": 478.65649, "r": 226.5591, "b": 486.58548, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 ", "bbox": {"l": 64.800308, "t": 489.69681, "r": 374.87817, "b": 497.62579, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "THEN C . CUSTOMER_SECURITY_QUESTION ", "bbox": {"l": 64.800308, "t": 500.67682, "r": 226.5591, "b": 508.6058, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "ELSE '*****' ", "bbox": {"l": 64.800308, "t": 511.65683, "r": 123.24001, "b": 519.58582, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "END ", "bbox": {"l": 64.800308, "t": 522.69714, "r": 96.240005, "b": 530.62613, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "ENABLE ; ", "bbox": {"l": 79.20031, "t": 533.6771200000001, "r": 124.14001, "b": 541.60614, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "CREATE MASK BANK_SCHEMA.MASK_SECURITY_QUESTION_ANSWER_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C ", "bbox": {"l": 64.800308, "t": 555.69745, "r": 500.69727, "b": 563.62645, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "FOR COLUMN CUSTOMER_SECURITY_QUESTION_ANSWER ", "bbox": {"l": 79.20031, "t": 566.6774399999999, "r": 281.3988, "b": 574.60645, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "RETURN CASE ", "bbox": {"l": 79.20031, "t": 577.65744, "r": 137.64001, "b": 585.58644, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 ", "bbox": {"l": 64.800308, "t": 588.6977400000001, "r": 361.37817, "b": 596.62674, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "THEN C . CUSTOMER_SECURITY_QUESTION_ANSWER ", "bbox": {"l": 64.800308, "t": 599.67773, "r": 258.05908, "b": 607.60674, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 ", "bbox": {"l": 64.800308, "t": 610.65773, "r": 374.87817, "b": 618.58673, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "THEN C . CUSTOMER_SECURITY_QUESTION_ANSWER ", "bbox": {"l": 64.800308, "t": 621.69803, "r": 258.05908, "b": 629.62703, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "ELSE '*****' ", "bbox": {"l": 64.800308, "t": 632.6780200000001, "r": 123.24001, "b": 640.60703, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "END ", "bbox": {"l": 64.800308, "t": 643.71832, "r": 96.240005, "b": 651.64732, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "ENABLE ; ", "bbox": {"l": 79.20031, "t": 654.69832, "r": 124.14001, "b": 662.62732, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "ALTER TABLE BANK_SCHEMA.CUSTOMERS ", "bbox": {"l": 64.800308, "t": 676.71861, "r": 226.5591, "b": 684.64761, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "ACTIVATE ROW ACCESS CONTROL ", "bbox": {"l": 79.20031, "t": 687.69862, "r": 214.01941, "b": 695.627617, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "ACTIVATE COLUMN ACCESS CONTROL ;", "bbox": {"l": 79.20031, "t": 698.678619, "r": 223.01941, "b": 706.60762, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "THEN C . CUSTOMER_TAX_ID WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'TELLER' ) = 1 THEN ( 'XXX-XX-' CONCAT QSYS2 . SUBSTR ( C . CUSTOMER_TAX_ID , 8 , 4 ) ) WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 THEN C . CUSTOMER_TAX_ID ELSE 'XXX-XX-XXXX' END ENABLE ; CREATE MASK BANK_SCHEMA.MASK_DRIVERS_LICENSE_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C FOR COLUMN CUSTOMER_DRIVERS_LICENSE_NUMBER RETURN CASE WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 THEN C . CUSTOMER_DRIVERS_LICENSE_NUMBER WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'TELLER' ) = 1 THEN C . CUSTOMER_DRIVERS_LICENSE_NUMBER WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 THEN C . CUSTOMER_DRIVERS_LICENSE_NUMBER ELSE '*************' END ENABLE ; CREATE MASK BANK_SCHEMA.MASK_LOGIN_ID_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C FOR COLUMN CUSTOMER_LOGIN_ID RETURN CASE WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 THEN C . CUSTOMER_LOGIN_ID WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 THEN C . CUSTOMER_LOGIN_ID ELSE '*****' END ENABLE ; CREATE MASK BANK_SCHEMA.MASK_SECURITY_QUESTION_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C FOR COLUMN CUSTOMER_SECURITY_QUESTION RETURN CASE WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 THEN C . CUSTOMER_SECURITY_QUESTION WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 THEN C . CUSTOMER_SECURITY_QUESTION ELSE '*****' END ENABLE ; CREATE MASK BANK_SCHEMA.MASK_SECURITY_QUESTION_ANSWER_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C FOR COLUMN CUSTOMER_SECURITY_QUESTION_ANSWER RETURN CASE WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 THEN C . CUSTOMER_SECURITY_QUESTION_ANSWER WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 THEN C . CUSTOMER_SECURITY_QUESTION_ANSWER ELSE '*****' END ENABLE ; ALTER TABLE BANK_SCHEMA.CUSTOMERS ACTIVATE ROW ACCESS CONTROL ACTIVATE COLUMN ACCESS CONTROL ;"}], "headers": [{"label": "page_footer", "id": 1, "page_no": 15, "cluster": {"id": 1, "label": "page_footer", "bbox": {"l": 64.800003, "t": 754.848721, "r": 83.982002, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.8994001150131226, "cells": [{"id": 0, "text": "124 ", "bbox": {"l": 64.800003, "t": 754.848721, "r": 83.982002, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "124"}, {"label": "page_footer", "id": 0, "page_no": 15, "cluster": {"id": 0, "label": "page_footer", "bbox": {"l": 98.940002, "t": 755.538002, "r": 339.81958, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.943077027797699, "cells": [{"id": 1, "text": "Row and Column Access Control Support in IBM DB2 for i", "bbox": {"l": 98.940002, "t": 755.538002, "r": 339.81958, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Row and Column Access Control Support in IBM DB2 for i"}]}}, {"page_no": 16, "size": {"width": 612.0, "height": 792.0}, "cells": [], "predictions": {"layout": {"clusters": [{"id": 0, "label": "form", "bbox": {"l": 0.4932013750076294, "t": 0.0, "r": 610.2305297851562, "b": 791.654541015625, "coord_origin": "TOPLEFT"}, "confidence": 0.6497200131416321, "cells": [], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "form", "id": 0, "page_no": 16, "cluster": {"id": 0, "label": "form", "bbox": {"l": 0.4932013750076294, "t": 0.0, "r": 610.2305297851562, "b": 791.654541015625, "coord_origin": "TOPLEFT"}, "confidence": 0.6497200131416321, "cells": [], "children": []}, "text": null}], "body": [{"label": "form", "id": 0, "page_no": 16, "cluster": {"id": 0, "label": "form", "bbox": {"l": 0.4932013750076294, "t": 0.0, "r": 610.2305297851562, "b": 791.654541015625, "coord_origin": "TOPLEFT"}, "confidence": 0.6497200131416321, "cells": [], "children": []}, "text": null}], "headers": []}}, {"page_no": 17, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "fi", "bbox": {"l": 558.11987, "t": 45.468689999999924, "r": 565.46039, "b": 54.68169999999998, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "REDP-5110-00", "bbox": {"l": 171.0, "t": 631.338, "r": 231.88769999999997, "b": 639.66301, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "INTERNATIONAL ", "bbox": {"l": 467.3399999999999, "t": 247.71831999999995, "r": 559.80933, "b": 260.16052, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "TECHNICAL", "bbox": {"l": 467.3399999999999, "t": 261.75842, "r": 529.50208, "b": 274.20061999999996, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "SUPPORT", "bbox": {"l": 467.3399999999999, "t": 275.73839999999996, "r": 518.93317, "b": 288.1806, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "ORGANIZATION", "bbox": {"l": 467.3399999999999, "t": 289.71841, "r": 550.7475, "b": 302.16061, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "BUILDING TECHNICAL ", "bbox": {"l": 467.3399999999999, "t": 351.79199, "r": 571.70758, "b": 362.47198, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "INFORMATION BASED ON ", "bbox": {"l": 467.3399999999999, "t": 363.79199, "r": 587.38916, "b": 374.47198, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "PRACTICAL EXPERIENCE", "bbox": {"l": 467.3399999999999, "t": 375.79199, "r": 582.5556, "b": 386.47198, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "IBM Redbooks are developed ", "bbox": {"l": 467.3399999999999, "t": 399.8602900000001, "r": 587.46674, "b": 409.63251, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "by the IBM International ", "bbox": {"l": 467.3399999999999, "t": 410.90067, "r": 566.34229, "b": 420.67285, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Technical Support ", "bbox": {"l": 467.3399999999999, "t": 421.88068, "r": 543.20404, "b": 431.65289, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Organization. Experts from ", "bbox": {"l": 467.3399999999999, "t": 432.8606899999999, "r": 577.76697, "b": 442.63287, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "IBM, Customers and Partners ", "bbox": {"l": 467.3399999999999, "t": 443.90106, "r": 587.40948, "b": 453.67328, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "from around the world create ", "bbox": {"l": 467.3399999999999, "t": 454.88107, "r": 587.52051, "b": 464.65326, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "timely technical information ", "bbox": {"l": 467.3399999999999, "t": 465.86108, "r": 582.67505, "b": 475.6333, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "based on realistic scenarios. ", "bbox": {"l": 467.3399999999999, "t": 476.90146, "r": 585.46722, "b": 486.67365, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "Specific recommendations ", "bbox": {"l": 467.3399999999999, "t": 487.88147, "r": 577.70874, "b": 497.65369, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "are provided to help you ", "bbox": {"l": 467.3399999999999, "t": 498.86148, "r": 568.03546, "b": 508.63367, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "implement IT solutions more ", "bbox": {"l": 467.3399999999999, "t": 509.90186, "r": 585.44525, "b": 519.67407, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "effectively in your ", "bbox": {"l": 467.3399999999999, "t": 520.8818699999999, "r": 541.4967, "b": 530.65405, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "environment.", "bbox": {"l": 467.3399999999999, "t": 531.8618799999999, "r": 520.64893, "b": 541.63406, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "For more information:", "bbox": {"l": 467.3399999999999, "t": 578.83191, "r": 570.948, "b": 589.5119, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "ibm.com", "bbox": {"l": 467.3399999999999, "t": 590.83191, "r": 508.59961, "b": 601.5119, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "/redbooks", "bbox": {"l": 508.56000000000006, "t": 590.83191, "r": 552.74518, "b": 601.5119, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "Redpaper", "bbox": {"l": 474.60001, "t": 164.05658000000005, "r": 580.88989, "b": 188.94097999999997, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "\u2122", "bbox": {"l": 582.53992, "t": 172.32714999999996, "r": 592.13989, "b": 181.20714999999996, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Row and Column Access Control ", "bbox": {"l": 27.0, "t": 73.63799999999992, "r": 447.36002, "b": 103.00800000000004, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Support in IBM DB2 for i", "bbox": {"l": 27.0, "t": 113.76000999999997, "r": 314.43002, "b": 140.46002, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Implement roles and ", "bbox": {"l": 26.700001, "t": 242.17200000000003, "r": 127.4436, "b": 252.85199, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "separation of duties", "bbox": {"l": 26.700001, "t": 256.15198, "r": 121.6608, "b": 266.83196999999996, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Leverage row ", "bbox": {"l": 26.700001, "t": 284.17197, "r": 93.970795, "b": 294.85196, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "permissions on the ", "bbox": {"l": 26.700001, "t": 298.15198000000004, "r": 120.28319999999998, "b": 308.83197, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "database", "bbox": {"l": 26.700001, "t": 312.19199000000003, "r": 70.413605, "b": 322.87198, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Protect columns by ", "bbox": {"l": 26.700001, "t": 340.15198000000004, "r": 121.44960000000002, "b": 350.83197, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "defining column ", "bbox": {"l": 26.700001, "t": 354.19199000000003, "r": 106.5696, "b": 364.87198, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "masks", "bbox": {"l": 26.700001, "t": 368.1720000000001, "r": 58.194, "b": 378.85199, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "This IBM Redpaper publication provides information about the IBM i 7.2 ", "bbox": {"l": 152.94, "t": 242.72857999999997, "r": 413.99057, "b": 251.59295999999995, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "feature of IBM DB2 for i Row and Column Access Control (RCAC). It ", "bbox": {"l": 152.94002, "t": 254.72839, "r": 401.85635, "b": 263.59277, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "offers a broad description of the function and advantages of controlling ", "bbox": {"l": 152.94002, "t": 266.72821, "r": 414.08423, "b": 275.59259, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "access to data in a comprehensive and transparent way. This ", "bbox": {"l": 152.94002, "t": 278.72803, "r": 381.24014, "b": 287.59244, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "publication helps you understand the capabilities of RCAC and provides ", "bbox": {"l": 152.94002, "t": 290.72784, "r": 414.07031, "b": 299.59225, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "examples of defining, creating, and implementing the row permissions ", "bbox": {"l": 152.94002, "t": 302.72766, "r": 414.05447, "b": 311.59207, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "and column masks in a relational database environment.", "bbox": {"l": 152.94002, "t": 314.72747999999996, "r": 362.3291, "b": 323.59189, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "This paper is intended for database engineers, data-centric application ", "bbox": {"l": 152.94002, "t": 331.70728, "r": 414.17383, "b": 340.57169, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "developers, and security officers who want to design and implement ", "bbox": {"l": 152.94002, "t": 343.70709, "r": 407.61029, "b": 352.5715, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "RCAC as a part of their data control and governance policy. A solid ", "bbox": {"l": 152.94002, "t": 355.70691, "r": 399.29565, "b": 364.57132, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "background in IBM i object level security, DB2 for i relational database ", "bbox": {"l": 152.94002, "t": 367.70673, "r": 414.0603, "b": 376.57114, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "concepts, and SQL is assumed.", "bbox": {"l": 152.94002, "t": 379.70654, "r": 268.86945, "b": 388.57095, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "Back cover", "bbox": {"l": 287.22, "t": 28.54803000000004, "r": 414.24481, "b": 50.748050000000035, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 4, "label": "picture", "bbox": {"l": 485.1698303222656, "t": 25.259197235107422, "r": 566.2962036132812, "b": 54.191585540771484, "coord_origin": "TOPLEFT"}, "confidence": 0.9404253363609314, "cells": [{"id": 0, "text": "fi", "bbox": {"l": 558.11987, "t": 45.468689999999924, "r": 565.46039, "b": 54.68169999999998, "coord_origin": "TOPLEFT"}}], "children": [{"id": 13, "label": "text", "bbox": {"l": 558.11987, "t": 45.468689999999924, "r": 565.46039, "b": 54.68169999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 0, "text": "fi", "bbox": {"l": 558.11987, "t": 45.468689999999924, "r": 565.46039, "b": 54.68169999999998, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 10, "label": "page_footer", "bbox": {"l": 171.0, "t": 631.338, "r": 231.88769999999997, "b": 639.66301, "coord_origin": "TOPLEFT"}, "confidence": 0.7700252532958984, "cells": [{"id": 1, "text": "REDP-5110-00", "bbox": {"l": 171.0, "t": 631.338, "r": 231.88769999999997, "b": 639.66301, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "text", "bbox": {"l": 467.3399999999999, "t": 247.71831999999995, "r": 559.80933, "b": 302.16061, "coord_origin": "TOPLEFT"}, "confidence": 0.8532665967941284, "cells": [{"id": 2, "text": "INTERNATIONAL ", "bbox": {"l": 467.3399999999999, "t": 247.71831999999995, "r": 559.80933, "b": 260.16052, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "TECHNICAL", "bbox": {"l": 467.3399999999999, "t": 261.75842, "r": 529.50208, "b": 274.20061999999996, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "SUPPORT", "bbox": {"l": 467.3399999999999, "t": 275.73839999999996, "r": 518.93317, "b": 288.1806, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "ORGANIZATION", "bbox": {"l": 467.3399999999999, "t": 289.71841, "r": 550.7475, "b": 302.16061, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 467.3399999999999, "t": 351.79199, "r": 587.38916, "b": 386.47198, "coord_origin": "TOPLEFT"}, "confidence": 0.7157140374183655, "cells": [{"id": 6, "text": "BUILDING TECHNICAL ", "bbox": {"l": 467.3399999999999, "t": 351.79199, "r": 571.70758, "b": 362.47198, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "INFORMATION BASED ON ", "bbox": {"l": 467.3399999999999, "t": 363.79199, "r": 587.38916, "b": 374.47198, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "PRACTICAL EXPERIENCE", "bbox": {"l": 467.3399999999999, "t": 375.79199, "r": 582.5556, "b": 386.47198, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 467.3399999999999, "t": 399.8602900000001, "r": 587.52051, "b": 541.63406, "coord_origin": "TOPLEFT"}, "confidence": 0.9518947005271912, "cells": [{"id": 9, "text": "IBM Redbooks are developed ", "bbox": {"l": 467.3399999999999, "t": 399.8602900000001, "r": 587.46674, "b": 409.63251, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "by the IBM International ", "bbox": {"l": 467.3399999999999, "t": 410.90067, "r": 566.34229, "b": 420.67285, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Technical Support ", "bbox": {"l": 467.3399999999999, "t": 421.88068, "r": 543.20404, "b": 431.65289, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Organization. Experts from ", "bbox": {"l": 467.3399999999999, "t": 432.8606899999999, "r": 577.76697, "b": 442.63287, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "IBM, Customers and Partners ", "bbox": {"l": 467.3399999999999, "t": 443.90106, "r": 587.40948, "b": 453.67328, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "from around the world create ", "bbox": {"l": 467.3399999999999, "t": 454.88107, "r": 587.52051, "b": 464.65326, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "timely technical information ", "bbox": {"l": 467.3399999999999, "t": 465.86108, "r": 582.67505, "b": 475.6333, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "based on realistic scenarios. ", "bbox": {"l": 467.3399999999999, "t": 476.90146, "r": 585.46722, "b": 486.67365, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "Specific recommendations ", "bbox": {"l": 467.3399999999999, "t": 487.88147, "r": 577.70874, "b": 497.65369, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "are provided to help you ", "bbox": {"l": 467.3399999999999, "t": 498.86148, "r": 568.03546, "b": 508.63367, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "implement IT solutions more ", "bbox": {"l": 467.3399999999999, "t": 509.90186, "r": 585.44525, "b": 519.67407, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "effectively in your ", "bbox": {"l": 467.3399999999999, "t": 520.8818699999999, "r": 541.4967, "b": 530.65405, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "environment.", "bbox": {"l": 467.3399999999999, "t": 531.8618799999999, "r": 520.64893, "b": 541.63406, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 467.3399999999999, "t": 578.83191, "r": 570.948, "b": 601.5119, "coord_origin": "TOPLEFT"}, "confidence": 0.8230002522468567, "cells": [{"id": 22, "text": "For more information:", "bbox": {"l": 467.3399999999999, "t": 578.83191, "r": 570.948, "b": 589.5119, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "ibm.com", "bbox": {"l": 467.3399999999999, "t": 590.83191, "r": 508.59961, "b": 601.5119, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "/redbooks", "bbox": {"l": 508.56000000000006, "t": 590.83191, "r": 552.74518, "b": 601.5119, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "picture", "bbox": {"l": 474.35540771484375, "t": 80.05131530761719, "r": 592.2726440429688, "b": 189.81260681152344, "coord_origin": "TOPLEFT"}, "confidence": 0.9696109890937805, "cells": [{"id": 25, "text": "Redpaper", "bbox": {"l": 474.60001, "t": 164.05658000000005, "r": 580.88989, "b": 188.94097999999997, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "\u2122", "bbox": {"l": 582.53992, "t": 172.32714999999996, "r": 592.13989, "b": 181.20714999999996, "coord_origin": "TOPLEFT"}}], "children": [{"id": 14, "label": "text", "bbox": {"l": 474.60001, "t": 164.05658000000005, "r": 580.88989, "b": 188.94097999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "Redpaper", "bbox": {"l": 474.60001, "t": 164.05658000000005, "r": 580.88989, "b": 188.94097999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 582.53992, "t": 172.32714999999996, "r": 592.13989, "b": 181.20714999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "\u2122", "bbox": {"l": 582.53992, "t": 172.32714999999996, "r": 592.13989, "b": 181.20714999999996, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 12, "label": "section_header", "bbox": {"l": 27.0, "t": 73.63799999999992, "r": 447.36002, "b": 140.46002, "coord_origin": "TOPLEFT"}, "confidence": 0.7128154635429382, "cells": [{"id": 27, "text": "Row and Column Access Control ", "bbox": {"l": 27.0, "t": 73.63799999999992, "r": 447.36002, "b": 103.00800000000004, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Support in IBM DB2 for i", "bbox": {"l": 27.0, "t": 113.76000999999997, "r": 314.43002, "b": 140.46002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "text", "bbox": {"l": 26.700001, "t": 242.17200000000003, "r": 127.4436, "b": 266.83196999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.8400377631187439, "cells": [{"id": 29, "text": "Implement roles and ", "bbox": {"l": 26.700001, "t": 242.17200000000003, "r": 127.4436, "b": 252.85199, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "separation of duties", "bbox": {"l": 26.700001, "t": 256.15198, "r": 121.6608, "b": 266.83196999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "text", "bbox": {"l": 26.700001, "t": 284.17197, "r": 120.28319999999998, "b": 322.87198, "coord_origin": "TOPLEFT"}, "confidence": 0.8828511834144592, "cells": [{"id": 31, "text": "Leverage row ", "bbox": {"l": 26.700001, "t": 284.17197, "r": 93.970795, "b": 294.85196, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "permissions on the ", "bbox": {"l": 26.700001, "t": 298.15198000000004, "r": 120.28319999999998, "b": 308.83197, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "database", "bbox": {"l": 26.700001, "t": 312.19199000000003, "r": 70.413605, "b": 322.87198, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "text", "bbox": {"l": 26.700001, "t": 340.15198000000004, "r": 121.44960000000002, "b": 378.85199, "coord_origin": "TOPLEFT"}, "confidence": 0.9064874053001404, "cells": [{"id": 34, "text": "Protect columns by ", "bbox": {"l": 26.700001, "t": 340.15198000000004, "r": 121.44960000000002, "b": 350.83197, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "defining column ", "bbox": {"l": 26.700001, "t": 354.19199000000003, "r": 106.5696, "b": 364.87198, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "masks", "bbox": {"l": 26.700001, "t": 368.1720000000001, "r": 58.194, "b": 378.85199, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 152.94, "t": 242.72857999999997, "r": 414.08423, "b": 323.59189, "coord_origin": "TOPLEFT"}, "confidence": 0.9789719581604004, "cells": [{"id": 37, "text": "This IBM Redpaper publication provides information about the IBM i 7.2 ", "bbox": {"l": 152.94, "t": 242.72857999999997, "r": 413.99057, "b": 251.59295999999995, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "feature of IBM DB2 for i Row and Column Access Control (RCAC). It ", "bbox": {"l": 152.94002, "t": 254.72839, "r": 401.85635, "b": 263.59277, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "offers a broad description of the function and advantages of controlling ", "bbox": {"l": 152.94002, "t": 266.72821, "r": 414.08423, "b": 275.59259, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "access to data in a comprehensive and transparent way. This ", "bbox": {"l": 152.94002, "t": 278.72803, "r": 381.24014, "b": 287.59244, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "publication helps you understand the capabilities of RCAC and provides ", "bbox": {"l": 152.94002, "t": 290.72784, "r": 414.07031, "b": 299.59225, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "examples of defining, creating, and implementing the row permissions ", "bbox": {"l": 152.94002, "t": 302.72766, "r": 414.05447, "b": 311.59207, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "and column masks in a relational database environment.", "bbox": {"l": 152.94002, "t": 314.72747999999996, "r": 362.3291, "b": 323.59189, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 152.94002, "t": 331.70728, "r": 414.17383, "b": 388.57095, "coord_origin": "TOPLEFT"}, "confidence": 0.9799742698669434, "cells": [{"id": 44, "text": "This paper is intended for database engineers, data-centric application ", "bbox": {"l": 152.94002, "t": 331.70728, "r": 414.17383, "b": 340.57169, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "developers, and security officers who want to design and implement ", "bbox": {"l": 152.94002, "t": 343.70709, "r": 407.61029, "b": 352.5715, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "RCAC as a part of their data control and governance policy. A solid ", "bbox": {"l": 152.94002, "t": 355.70691, "r": 399.29565, "b": 364.57132, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "background in IBM i object level security, DB2 for i relational database ", "bbox": {"l": 152.94002, "t": 367.70673, "r": 414.0603, "b": 376.57114, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "concepts, and SQL is assumed.", "bbox": {"l": 152.94002, "t": 379.70654, "r": 268.86945, "b": 388.57095, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 287.22, "t": 28.54803000000004, "r": 414.24481, "b": 50.748050000000035, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "Back cover", "bbox": {"l": 287.22, "t": 28.54803000000004, "r": 414.24481, "b": 50.748050000000035, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "picture", "id": 4, "page_no": 17, "cluster": {"id": 4, "label": "picture", "bbox": {"l": 485.1698303222656, "t": 25.259197235107422, "r": 566.2962036132812, "b": 54.191585540771484, "coord_origin": "TOPLEFT"}, "confidence": 0.9404253363609314, "cells": [{"id": 0, "text": "fi", "bbox": {"l": 558.11987, "t": 45.468689999999924, "r": 565.46039, "b": 54.68169999999998, "coord_origin": "TOPLEFT"}}], "children": [{"id": 13, "label": "text", "bbox": {"l": 558.11987, "t": 45.468689999999924, "r": 565.46039, "b": 54.68169999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 0, "text": "fi", "bbox": {"l": 558.11987, "t": 45.468689999999924, "r": 565.46039, "b": 54.68169999999998, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "page_footer", "id": 10, "page_no": 17, "cluster": {"id": 10, "label": "page_footer", "bbox": {"l": 171.0, "t": 631.338, "r": 231.88769999999997, "b": 639.66301, "coord_origin": "TOPLEFT"}, "confidence": 0.7700252532958984, "cells": [{"id": 1, "text": "REDP-5110-00", "bbox": {"l": 171.0, "t": 631.338, "r": 231.88769999999997, "b": 639.66301, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "REDP-5110-00"}, {"label": "text", "id": 7, "page_no": 17, "cluster": {"id": 7, "label": "text", "bbox": {"l": 467.3399999999999, "t": 247.71831999999995, "r": 559.80933, "b": 302.16061, "coord_origin": "TOPLEFT"}, "confidence": 0.8532665967941284, "cells": [{"id": 2, "text": "INTERNATIONAL ", "bbox": {"l": 467.3399999999999, "t": 247.71831999999995, "r": 559.80933, "b": 260.16052, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "TECHNICAL", "bbox": {"l": 467.3399999999999, "t": 261.75842, "r": 529.50208, "b": 274.20061999999996, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "SUPPORT", "bbox": {"l": 467.3399999999999, "t": 275.73839999999996, "r": 518.93317, "b": 288.1806, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "ORGANIZATION", "bbox": {"l": 467.3399999999999, "t": 289.71841, "r": 550.7475, "b": 302.16061, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "INTERNATIONAL TECHNICAL SUPPORT ORGANIZATION"}, {"label": "text", "id": 11, "page_no": 17, "cluster": {"id": 11, "label": "text", "bbox": {"l": 467.3399999999999, "t": 351.79199, "r": 587.38916, "b": 386.47198, "coord_origin": "TOPLEFT"}, "confidence": 0.7157140374183655, "cells": [{"id": 6, "text": "BUILDING TECHNICAL ", "bbox": {"l": 467.3399999999999, "t": 351.79199, "r": 571.70758, "b": 362.47198, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "INFORMATION BASED ON ", "bbox": {"l": 467.3399999999999, "t": 363.79199, "r": 587.38916, "b": 374.47198, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "PRACTICAL EXPERIENCE", "bbox": {"l": 467.3399999999999, "t": 375.79199, "r": 582.5556, "b": 386.47198, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "BUILDING TECHNICAL INFORMATION BASED ON PRACTICAL EXPERIENCE"}, {"label": "text", "id": 3, "page_no": 17, "cluster": {"id": 3, "label": "text", "bbox": {"l": 467.3399999999999, "t": 399.8602900000001, "r": 587.52051, "b": 541.63406, "coord_origin": "TOPLEFT"}, "confidence": 0.9518947005271912, "cells": [{"id": 9, "text": "IBM Redbooks are developed ", "bbox": {"l": 467.3399999999999, "t": 399.8602900000001, "r": 587.46674, "b": 409.63251, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "by the IBM International ", "bbox": {"l": 467.3399999999999, "t": 410.90067, "r": 566.34229, "b": 420.67285, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Technical Support ", "bbox": {"l": 467.3399999999999, "t": 421.88068, "r": 543.20404, "b": 431.65289, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Organization. Experts from ", "bbox": {"l": 467.3399999999999, "t": 432.8606899999999, "r": 577.76697, "b": 442.63287, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "IBM, Customers and Partners ", "bbox": {"l": 467.3399999999999, "t": 443.90106, "r": 587.40948, "b": 453.67328, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "from around the world create ", "bbox": {"l": 467.3399999999999, "t": 454.88107, "r": 587.52051, "b": 464.65326, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "timely technical information ", "bbox": {"l": 467.3399999999999, "t": 465.86108, "r": 582.67505, "b": 475.6333, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "based on realistic scenarios. ", "bbox": {"l": 467.3399999999999, "t": 476.90146, "r": 585.46722, "b": 486.67365, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "Specific recommendations ", "bbox": {"l": 467.3399999999999, "t": 487.88147, "r": 577.70874, "b": 497.65369, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "are provided to help you ", "bbox": {"l": 467.3399999999999, "t": 498.86148, "r": 568.03546, "b": 508.63367, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "implement IT solutions more ", "bbox": {"l": 467.3399999999999, "t": 509.90186, "r": 585.44525, "b": 519.67407, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "effectively in your ", "bbox": {"l": 467.3399999999999, "t": 520.8818699999999, "r": 541.4967, "b": 530.65405, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "environment.", "bbox": {"l": 467.3399999999999, "t": 531.8618799999999, "r": 520.64893, "b": 541.63406, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "IBM Redbooks are developed by the IBM International Technical Support Organization. Experts from IBM, Customers and Partners from around the world create timely technical information based on realistic scenarios. Specific recommendations are provided to help you implement IT solutions more effectively in your environment."}, {"label": "text", "id": 9, "page_no": 17, "cluster": {"id": 9, "label": "text", "bbox": {"l": 467.3399999999999, "t": 578.83191, "r": 570.948, "b": 601.5119, "coord_origin": "TOPLEFT"}, "confidence": 0.8230002522468567, "cells": [{"id": 22, "text": "For more information:", "bbox": {"l": 467.3399999999999, "t": 578.83191, "r": 570.948, "b": 589.5119, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "ibm.com", "bbox": {"l": 467.3399999999999, "t": 590.83191, "r": 508.59961, "b": 601.5119, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "/redbooks", "bbox": {"l": 508.56000000000006, "t": 590.83191, "r": 552.74518, "b": 601.5119, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "For more information: ibm.com /redbooks"}, {"label": "picture", "id": 2, "page_no": 17, "cluster": {"id": 2, "label": "picture", "bbox": {"l": 474.35540771484375, "t": 80.05131530761719, "r": 592.2726440429688, "b": 189.81260681152344, "coord_origin": "TOPLEFT"}, "confidence": 0.9696109890937805, "cells": [{"id": 25, "text": "Redpaper", "bbox": {"l": 474.60001, "t": 164.05658000000005, "r": 580.88989, "b": 188.94097999999997, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "\u2122", "bbox": {"l": 582.53992, "t": 172.32714999999996, "r": 592.13989, "b": 181.20714999999996, "coord_origin": "TOPLEFT"}}], "children": [{"id": 14, "label": "text", "bbox": {"l": 474.60001, "t": 164.05658000000005, "r": 580.88989, "b": 188.94097999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "Redpaper", "bbox": {"l": 474.60001, "t": 164.05658000000005, "r": 580.88989, "b": 188.94097999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 582.53992, "t": 172.32714999999996, "r": 592.13989, "b": 181.20714999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "\u2122", "bbox": {"l": 582.53992, "t": 172.32714999999996, "r": 592.13989, "b": 181.20714999999996, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "section_header", "id": 12, "page_no": 17, "cluster": {"id": 12, "label": "section_header", "bbox": {"l": 27.0, "t": 73.63799999999992, "r": 447.36002, "b": 140.46002, "coord_origin": "TOPLEFT"}, "confidence": 0.7128154635429382, "cells": [{"id": 27, "text": "Row and Column Access Control ", "bbox": {"l": 27.0, "t": 73.63799999999992, "r": 447.36002, "b": 103.00800000000004, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Support in IBM DB2 for i", "bbox": {"l": 27.0, "t": 113.76000999999997, "r": 314.43002, "b": 140.46002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Row and Column Access Control Support in IBM DB2 for i"}, {"label": "text", "id": 8, "page_no": 17, "cluster": {"id": 8, "label": "text", "bbox": {"l": 26.700001, "t": 242.17200000000003, "r": 127.4436, "b": 266.83196999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.8400377631187439, "cells": [{"id": 29, "text": "Implement roles and ", "bbox": {"l": 26.700001, "t": 242.17200000000003, "r": 127.4436, "b": 252.85199, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "separation of duties", "bbox": {"l": 26.700001, "t": 256.15198, "r": 121.6608, "b": 266.83196999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Implement roles and separation of duties"}, {"label": "text", "id": 6, "page_no": 17, "cluster": {"id": 6, "label": "text", "bbox": {"l": 26.700001, "t": 284.17197, "r": 120.28319999999998, "b": 322.87198, "coord_origin": "TOPLEFT"}, "confidence": 0.8828511834144592, "cells": [{"id": 31, "text": "Leverage row ", "bbox": {"l": 26.700001, "t": 284.17197, "r": 93.970795, "b": 294.85196, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "permissions on the ", "bbox": {"l": 26.700001, "t": 298.15198000000004, "r": 120.28319999999998, "b": 308.83197, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "database", "bbox": {"l": 26.700001, "t": 312.19199000000003, "r": 70.413605, "b": 322.87198, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Leverage row permissions on the database"}, {"label": "text", "id": 5, "page_no": 17, "cluster": {"id": 5, "label": "text", "bbox": {"l": 26.700001, "t": 340.15198000000004, "r": 121.44960000000002, "b": 378.85199, "coord_origin": "TOPLEFT"}, "confidence": 0.9064874053001404, "cells": [{"id": 34, "text": "Protect columns by ", "bbox": {"l": 26.700001, "t": 340.15198000000004, "r": 121.44960000000002, "b": 350.83197, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "defining column ", "bbox": {"l": 26.700001, "t": 354.19199000000003, "r": 106.5696, "b": 364.87198, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "masks", "bbox": {"l": 26.700001, "t": 368.1720000000001, "r": 58.194, "b": 378.85199, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Protect columns by defining column masks"}, {"label": "text", "id": 1, "page_no": 17, "cluster": {"id": 1, "label": "text", "bbox": {"l": 152.94, "t": 242.72857999999997, "r": 414.08423, "b": 323.59189, "coord_origin": "TOPLEFT"}, "confidence": 0.9789719581604004, "cells": [{"id": 37, "text": "This IBM Redpaper publication provides information about the IBM i 7.2 ", "bbox": {"l": 152.94, "t": 242.72857999999997, "r": 413.99057, "b": 251.59295999999995, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "feature of IBM DB2 for i Row and Column Access Control (RCAC). It ", "bbox": {"l": 152.94002, "t": 254.72839, "r": 401.85635, "b": 263.59277, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "offers a broad description of the function and advantages of controlling ", "bbox": {"l": 152.94002, "t": 266.72821, "r": 414.08423, "b": 275.59259, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "access to data in a comprehensive and transparent way. This ", "bbox": {"l": 152.94002, "t": 278.72803, "r": 381.24014, "b": 287.59244, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "publication helps you understand the capabilities of RCAC and provides ", "bbox": {"l": 152.94002, "t": 290.72784, "r": 414.07031, "b": 299.59225, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "examples of defining, creating, and implementing the row permissions ", "bbox": {"l": 152.94002, "t": 302.72766, "r": 414.05447, "b": 311.59207, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "and column masks in a relational database environment.", "bbox": {"l": 152.94002, "t": 314.72747999999996, "r": 362.3291, "b": 323.59189, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "This IBM Redpaper publication provides information about the IBM i 7.2 feature of IBM DB2 for i Row and Column Access Control (RCAC). It offers a broad description of the function and advantages of controlling access to data in a comprehensive and transparent way. This publication helps you understand the capabilities of RCAC and provides examples of defining, creating, and implementing the row permissions and column masks in a relational database environment."}, {"label": "text", "id": 0, "page_no": 17, "cluster": {"id": 0, "label": "text", "bbox": {"l": 152.94002, "t": 331.70728, "r": 414.17383, "b": 388.57095, "coord_origin": "TOPLEFT"}, "confidence": 0.9799742698669434, "cells": [{"id": 44, "text": "This paper is intended for database engineers, data-centric application ", "bbox": {"l": 152.94002, "t": 331.70728, "r": 414.17383, "b": 340.57169, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "developers, and security officers who want to design and implement ", "bbox": {"l": 152.94002, "t": 343.70709, "r": 407.61029, "b": 352.5715, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "RCAC as a part of their data control and governance policy. A solid ", "bbox": {"l": 152.94002, "t": 355.70691, "r": 399.29565, "b": 364.57132, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "background in IBM i object level security, DB2 for i relational database ", "bbox": {"l": 152.94002, "t": 367.70673, "r": 414.0603, "b": 376.57114, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "concepts, and SQL is assumed.", "bbox": {"l": 152.94002, "t": 379.70654, "r": 268.86945, "b": 388.57095, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "This paper is intended for database engineers, data-centric application developers, and security officers who want to design and implement RCAC as a part of their data control and governance policy. A solid background in IBM i object level security, DB2 for i relational database concepts, and SQL is assumed."}, {"label": "text", "id": 16, "page_no": 17, "cluster": {"id": 16, "label": "text", "bbox": {"l": 287.22, "t": 28.54803000000004, "r": 414.24481, "b": 50.748050000000035, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "Back cover", "bbox": {"l": 287.22, "t": 28.54803000000004, "r": 414.24481, "b": 50.748050000000035, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Back cover"}], "body": [{"label": "picture", "id": 4, "page_no": 17, "cluster": {"id": 4, "label": "picture", "bbox": {"l": 485.1698303222656, "t": 25.259197235107422, "r": 566.2962036132812, "b": 54.191585540771484, "coord_origin": "TOPLEFT"}, "confidence": 0.9404253363609314, "cells": [{"id": 0, "text": "fi", "bbox": {"l": 558.11987, "t": 45.468689999999924, "r": 565.46039, "b": 54.68169999999998, "coord_origin": "TOPLEFT"}}], "children": [{"id": 13, "label": "text", "bbox": {"l": 558.11987, "t": 45.468689999999924, "r": 565.46039, "b": 54.68169999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 0, "text": "fi", "bbox": {"l": 558.11987, "t": 45.468689999999924, "r": 565.46039, "b": 54.68169999999998, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "text", "id": 7, "page_no": 17, "cluster": {"id": 7, "label": "text", "bbox": {"l": 467.3399999999999, "t": 247.71831999999995, "r": 559.80933, "b": 302.16061, "coord_origin": "TOPLEFT"}, "confidence": 0.8532665967941284, "cells": [{"id": 2, "text": "INTERNATIONAL ", "bbox": {"l": 467.3399999999999, "t": 247.71831999999995, "r": 559.80933, "b": 260.16052, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "TECHNICAL", "bbox": {"l": 467.3399999999999, "t": 261.75842, "r": 529.50208, "b": 274.20061999999996, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "SUPPORT", "bbox": {"l": 467.3399999999999, "t": 275.73839999999996, "r": 518.93317, "b": 288.1806, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "ORGANIZATION", "bbox": {"l": 467.3399999999999, "t": 289.71841, "r": 550.7475, "b": 302.16061, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "INTERNATIONAL TECHNICAL SUPPORT ORGANIZATION"}, {"label": "text", "id": 11, "page_no": 17, "cluster": {"id": 11, "label": "text", "bbox": {"l": 467.3399999999999, "t": 351.79199, "r": 587.38916, "b": 386.47198, "coord_origin": "TOPLEFT"}, "confidence": 0.7157140374183655, "cells": [{"id": 6, "text": "BUILDING TECHNICAL ", "bbox": {"l": 467.3399999999999, "t": 351.79199, "r": 571.70758, "b": 362.47198, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "INFORMATION BASED ON ", "bbox": {"l": 467.3399999999999, "t": 363.79199, "r": 587.38916, "b": 374.47198, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "PRACTICAL EXPERIENCE", "bbox": {"l": 467.3399999999999, "t": 375.79199, "r": 582.5556, "b": 386.47198, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "BUILDING TECHNICAL INFORMATION BASED ON PRACTICAL EXPERIENCE"}, {"label": "text", "id": 3, "page_no": 17, "cluster": {"id": 3, "label": "text", "bbox": {"l": 467.3399999999999, "t": 399.8602900000001, "r": 587.52051, "b": 541.63406, "coord_origin": "TOPLEFT"}, "confidence": 0.9518947005271912, "cells": [{"id": 9, "text": "IBM Redbooks are developed ", "bbox": {"l": 467.3399999999999, "t": 399.8602900000001, "r": 587.46674, "b": 409.63251, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "by the IBM International ", "bbox": {"l": 467.3399999999999, "t": 410.90067, "r": 566.34229, "b": 420.67285, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Technical Support ", "bbox": {"l": 467.3399999999999, "t": 421.88068, "r": 543.20404, "b": 431.65289, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Organization. Experts from ", "bbox": {"l": 467.3399999999999, "t": 432.8606899999999, "r": 577.76697, "b": 442.63287, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "IBM, Customers and Partners ", "bbox": {"l": 467.3399999999999, "t": 443.90106, "r": 587.40948, "b": 453.67328, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "from around the world create ", "bbox": {"l": 467.3399999999999, "t": 454.88107, "r": 587.52051, "b": 464.65326, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "timely technical information ", "bbox": {"l": 467.3399999999999, "t": 465.86108, "r": 582.67505, "b": 475.6333, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "based on realistic scenarios. ", "bbox": {"l": 467.3399999999999, "t": 476.90146, "r": 585.46722, "b": 486.67365, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "Specific recommendations ", "bbox": {"l": 467.3399999999999, "t": 487.88147, "r": 577.70874, "b": 497.65369, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "are provided to help you ", "bbox": {"l": 467.3399999999999, "t": 498.86148, "r": 568.03546, "b": 508.63367, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "implement IT solutions more ", "bbox": {"l": 467.3399999999999, "t": 509.90186, "r": 585.44525, "b": 519.67407, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "effectively in your ", "bbox": {"l": 467.3399999999999, "t": 520.8818699999999, "r": 541.4967, "b": 530.65405, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "environment.", "bbox": {"l": 467.3399999999999, "t": 531.8618799999999, "r": 520.64893, "b": 541.63406, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "IBM Redbooks are developed by the IBM International Technical Support Organization. Experts from IBM, Customers and Partners from around the world create timely technical information based on realistic scenarios. Specific recommendations are provided to help you implement IT solutions more effectively in your environment."}, {"label": "text", "id": 9, "page_no": 17, "cluster": {"id": 9, "label": "text", "bbox": {"l": 467.3399999999999, "t": 578.83191, "r": 570.948, "b": 601.5119, "coord_origin": "TOPLEFT"}, "confidence": 0.8230002522468567, "cells": [{"id": 22, "text": "For more information:", "bbox": {"l": 467.3399999999999, "t": 578.83191, "r": 570.948, "b": 589.5119, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "ibm.com", "bbox": {"l": 467.3399999999999, "t": 590.83191, "r": 508.59961, "b": 601.5119, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "/redbooks", "bbox": {"l": 508.56000000000006, "t": 590.83191, "r": 552.74518, "b": 601.5119, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "For more information: ibm.com /redbooks"}, {"label": "picture", "id": 2, "page_no": 17, "cluster": {"id": 2, "label": "picture", "bbox": {"l": 474.35540771484375, "t": 80.05131530761719, "r": 592.2726440429688, "b": 189.81260681152344, "coord_origin": "TOPLEFT"}, "confidence": 0.9696109890937805, "cells": [{"id": 25, "text": "Redpaper", "bbox": {"l": 474.60001, "t": 164.05658000000005, "r": 580.88989, "b": 188.94097999999997, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "\u2122", "bbox": {"l": 582.53992, "t": 172.32714999999996, "r": 592.13989, "b": 181.20714999999996, "coord_origin": "TOPLEFT"}}], "children": [{"id": 14, "label": "text", "bbox": {"l": 474.60001, "t": 164.05658000000005, "r": 580.88989, "b": 188.94097999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "Redpaper", "bbox": {"l": 474.60001, "t": 164.05658000000005, "r": 580.88989, "b": 188.94097999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 582.53992, "t": 172.32714999999996, "r": 592.13989, "b": 181.20714999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "\u2122", "bbox": {"l": 582.53992, "t": 172.32714999999996, "r": 592.13989, "b": 181.20714999999996, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "section_header", "id": 12, "page_no": 17, "cluster": {"id": 12, "label": "section_header", "bbox": {"l": 27.0, "t": 73.63799999999992, "r": 447.36002, "b": 140.46002, "coord_origin": "TOPLEFT"}, "confidence": 0.7128154635429382, "cells": [{"id": 27, "text": "Row and Column Access Control ", "bbox": {"l": 27.0, "t": 73.63799999999992, "r": 447.36002, "b": 103.00800000000004, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Support in IBM DB2 for i", "bbox": {"l": 27.0, "t": 113.76000999999997, "r": 314.43002, "b": 140.46002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Row and Column Access Control Support in IBM DB2 for i"}, {"label": "text", "id": 8, "page_no": 17, "cluster": {"id": 8, "label": "text", "bbox": {"l": 26.700001, "t": 242.17200000000003, "r": 127.4436, "b": 266.83196999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.8400377631187439, "cells": [{"id": 29, "text": "Implement roles and ", "bbox": {"l": 26.700001, "t": 242.17200000000003, "r": 127.4436, "b": 252.85199, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "separation of duties", "bbox": {"l": 26.700001, "t": 256.15198, "r": 121.6608, "b": 266.83196999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Implement roles and separation of duties"}, {"label": "text", "id": 6, "page_no": 17, "cluster": {"id": 6, "label": "text", "bbox": {"l": 26.700001, "t": 284.17197, "r": 120.28319999999998, "b": 322.87198, "coord_origin": "TOPLEFT"}, "confidence": 0.8828511834144592, "cells": [{"id": 31, "text": "Leverage row ", "bbox": {"l": 26.700001, "t": 284.17197, "r": 93.970795, "b": 294.85196, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "permissions on the ", "bbox": {"l": 26.700001, "t": 298.15198000000004, "r": 120.28319999999998, "b": 308.83197, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "database", "bbox": {"l": 26.700001, "t": 312.19199000000003, "r": 70.413605, "b": 322.87198, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Leverage row permissions on the database"}, {"label": "text", "id": 5, "page_no": 17, "cluster": {"id": 5, "label": "text", "bbox": {"l": 26.700001, "t": 340.15198000000004, "r": 121.44960000000002, "b": 378.85199, "coord_origin": "TOPLEFT"}, "confidence": 0.9064874053001404, "cells": [{"id": 34, "text": "Protect columns by ", "bbox": {"l": 26.700001, "t": 340.15198000000004, "r": 121.44960000000002, "b": 350.83197, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "defining column ", "bbox": {"l": 26.700001, "t": 354.19199000000003, "r": 106.5696, "b": 364.87198, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "masks", "bbox": {"l": 26.700001, "t": 368.1720000000001, "r": 58.194, "b": 378.85199, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Protect columns by defining column masks"}, {"label": "text", "id": 1, "page_no": 17, "cluster": {"id": 1, "label": "text", "bbox": {"l": 152.94, "t": 242.72857999999997, "r": 414.08423, "b": 323.59189, "coord_origin": "TOPLEFT"}, "confidence": 0.9789719581604004, "cells": [{"id": 37, "text": "This IBM Redpaper publication provides information about the IBM i 7.2 ", "bbox": {"l": 152.94, "t": 242.72857999999997, "r": 413.99057, "b": 251.59295999999995, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "feature of IBM DB2 for i Row and Column Access Control (RCAC). It ", "bbox": {"l": 152.94002, "t": 254.72839, "r": 401.85635, "b": 263.59277, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "offers a broad description of the function and advantages of controlling ", "bbox": {"l": 152.94002, "t": 266.72821, "r": 414.08423, "b": 275.59259, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "access to data in a comprehensive and transparent way. This ", "bbox": {"l": 152.94002, "t": 278.72803, "r": 381.24014, "b": 287.59244, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "publication helps you understand the capabilities of RCAC and provides ", "bbox": {"l": 152.94002, "t": 290.72784, "r": 414.07031, "b": 299.59225, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "examples of defining, creating, and implementing the row permissions ", "bbox": {"l": 152.94002, "t": 302.72766, "r": 414.05447, "b": 311.59207, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "and column masks in a relational database environment.", "bbox": {"l": 152.94002, "t": 314.72747999999996, "r": 362.3291, "b": 323.59189, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "This IBM Redpaper publication provides information about the IBM i 7.2 feature of IBM DB2 for i Row and Column Access Control (RCAC). It offers a broad description of the function and advantages of controlling access to data in a comprehensive and transparent way. This publication helps you understand the capabilities of RCAC and provides examples of defining, creating, and implementing the row permissions and column masks in a relational database environment."}, {"label": "text", "id": 0, "page_no": 17, "cluster": {"id": 0, "label": "text", "bbox": {"l": 152.94002, "t": 331.70728, "r": 414.17383, "b": 388.57095, "coord_origin": "TOPLEFT"}, "confidence": 0.9799742698669434, "cells": [{"id": 44, "text": "This paper is intended for database engineers, data-centric application ", "bbox": {"l": 152.94002, "t": 331.70728, "r": 414.17383, "b": 340.57169, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "developers, and security officers who want to design and implement ", "bbox": {"l": 152.94002, "t": 343.70709, "r": 407.61029, "b": 352.5715, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "RCAC as a part of their data control and governance policy. A solid ", "bbox": {"l": 152.94002, "t": 355.70691, "r": 399.29565, "b": 364.57132, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "background in IBM i object level security, DB2 for i relational database ", "bbox": {"l": 152.94002, "t": 367.70673, "r": 414.0603, "b": 376.57114, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "concepts, and SQL is assumed.", "bbox": {"l": 152.94002, "t": 379.70654, "r": 268.86945, "b": 388.57095, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "This paper is intended for database engineers, data-centric application developers, and security officers who want to design and implement RCAC as a part of their data control and governance policy. A solid background in IBM i object level security, DB2 for i relational database concepts, and SQL is assumed."}, {"label": "text", "id": 16, "page_no": 17, "cluster": {"id": 16, "label": "text", "bbox": {"l": 287.22, "t": 28.54803000000004, "r": 414.24481, "b": 50.748050000000035, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "Back cover", "bbox": {"l": 287.22, "t": 28.54803000000004, "r": 414.24481, "b": 50.748050000000035, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Back cover"}], "headers": [{"label": "page_footer", "id": 10, "page_no": 17, "cluster": {"id": 10, "label": "page_footer", "bbox": {"l": 171.0, "t": 631.338, "r": 231.88769999999997, "b": 639.66301, "coord_origin": "TOPLEFT"}, "confidence": 0.7700252532958984, "cells": [{"id": 1, "text": "REDP-5110-00", "bbox": {"l": 171.0, "t": 631.338, "r": 231.88769999999997, "b": 639.66301, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "REDP-5110-00"}]}}]
\ No newline at end of file
+[{"page_no": 0, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "ibm.com", "bbox": {"l": 36.900002, "t": 751.23, "r": 98.600998, "b": 765.105, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "/redbooks", "bbox": {"l": 98.580002, "t": 751.23, "r": 164.4585, "b": 765.105, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Redpaper", "bbox": {"l": 314.70001, "t": 711.50856, "r": 580.52002, "b": 773.772959, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Front cover", "bbox": {"l": 287.82001, "t": 28.54803000000004, "r": 418.83356, "b": 50.748050000000035, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Row and Column Access Control ", "bbox": {"l": 35.700001, "t": 84.58654999999987, "r": 584.64288, "b": 122.82097999999996, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Support in IBM DB2 for i", "bbox": {"l": 35.700001, "t": 127.60668999999996, "r": 447.66919000000007, "b": 165.84113000000002, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Jim Bainbridge", "bbox": {"l": 509.22, "t": 575.71201, "r": 581.34119, "b": 586.392, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Hernando Bedoya", "bbox": {"l": 497.70001, "t": 589.752, "r": 581.3736, "b": 600.43199, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Rob Bestgen", "bbox": {"l": 521.40002, "t": 603.73199, "r": 581.34003, "b": 614.4119900000001, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Mike Cain", "bbox": {"l": 534.12, "t": 617.71199, "r": 581.31598, "b": 628.39198, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Dan Cruikshank", "bbox": {"l": 505.43999999999994, "t": 631.75198, "r": 581.29077, "b": 642.4319800000001, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Jim Denton", "bbox": {"l": 527.22003, "t": 645.73198, "r": 581.29926, "b": 656.41197, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Doug Mack", "bbox": {"l": 527.64001, "t": 659.71198, "r": 581.30884, "b": 670.39197, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Tom McKinley", "bbox": {"l": 514.38, "t": 673.75197, "r": 581.38678, "b": 684.43197, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Kent Milligan", "bbox": {"l": 518.82001, "t": 687.73197, "r": 581.33759, "b": 698.411972, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Implement roles and separation ", "bbox": {"l": 36.119999, "t": 296.13828, "r": 216.00064, "b": 308.58047, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "of duties", "bbox": {"l": 36.119999, "t": 313.11838000000006, "r": 84.527145, "b": 325.56058, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "Leverage", "bbox": {"l": 35.759315, "t": 350.13881999999995, "r": 80.409691, "b": 362.58102, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "row permissions on ", "bbox": {"l": 151.8503, "t": 350.13881999999995, "r": 202.45404, "b": 362.58102, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "the", "bbox": {"l": 35.759315, "t": 367.11893, "r": 50.758106, "b": 379.56112999999993, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "database", "bbox": {"l": 86.755211, "t": 367.11893, "r": 107.75352000000001, "b": 379.56112999999993, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Protect", "bbox": {"l": 36.059887, "t": 404.13937, "r": 73.020607, "b": 416.58157, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "columns by defining ", "bbox": {"l": 152.62831, "t": 404.13937, "r": 195.2753, "b": 416.58157, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "column", "bbox": {"l": 36.059887, "t": 421.11948, "r": 73.311806, "b": 433.56167999999997, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "masks", "bbox": {"l": 73.311806, "t": 421.11948, "r": 117.33681, "b": 433.56167999999997, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 6, "label": "page_footer", "bbox": {"l": 36.900002, "t": 751.23, "r": 164.4585, "b": 765.105, "coord_origin": "TOPLEFT"}, "confidence": 0.7180292010307312, "cells": [{"id": 0, "text": "ibm.com", "bbox": {"l": 36.900002, "t": 751.23, "r": 98.600998, "b": 765.105, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "/redbooks", "bbox": {"l": 98.580002, "t": 751.23, "r": 164.4585, "b": 765.105, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "picture", "bbox": {"l": 316.9404296875, "t": 710.1278686523438, "r": 581.354736328125, "b": 774.4259033203125, "coord_origin": "TOPLEFT"}, "confidence": 0.577752947807312, "cells": [{"id": 2, "text": "Redpaper", "bbox": {"l": 314.70001, "t": 711.50856, "r": 580.52002, "b": 773.772959, "coord_origin": "TOPLEFT"}}], "children": [{"id": 11, "label": "text", "bbox": {"l": 314.70001, "t": 711.50856, "r": 580.52002, "b": 773.772959, "coord_origin": "TOPLEFT"}, "confidence": 0.5870781540870667, "cells": [{"id": 2, "text": "Redpaper", "bbox": {"l": 314.70001, "t": 711.50856, "r": 580.52002, "b": 773.772959, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 12, "label": "text", "bbox": {"l": 287.82001, "t": 28.54803000000004, "r": 418.83356, "b": 50.748050000000035, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 3, "text": "Front cover", "bbox": {"l": 287.82001, "t": 28.54803000000004, "r": 418.83356, "b": 50.748050000000035, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "section_header", "bbox": {"l": 35.700001, "t": 84.58654999999987, "r": 584.64288, "b": 165.84113000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.8281130790710449, "cells": [{"id": 4, "text": "Row and Column Access Control ", "bbox": {"l": 35.700001, "t": 84.58654999999987, "r": 584.64288, "b": 122.82097999999996, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Support in IBM DB2 for i", "bbox": {"l": 35.700001, "t": 127.60668999999996, "r": 447.66919000000007, "b": 165.84113000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "picture", "bbox": {"l": 33.09040069580078, "t": 293.0328369140625, "r": 585.1502075195312, "b": 702.4530029296875, "coord_origin": "TOPLEFT"}, "confidence": 0.5889471173286438, "cells": [{"id": 6, "text": "Jim Bainbridge", "bbox": {"l": 509.22, "t": 575.71201, "r": 581.34119, "b": 586.392, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Hernando Bedoya", "bbox": {"l": 497.70001, "t": 589.752, "r": 581.3736, "b": 600.43199, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Rob Bestgen", "bbox": {"l": 521.40002, "t": 603.73199, "r": 581.34003, "b": 614.4119900000001, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Mike Cain", "bbox": {"l": 534.12, "t": 617.71199, "r": 581.31598, "b": 628.39198, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Dan Cruikshank", "bbox": {"l": 505.43999999999994, "t": 631.75198, "r": 581.29077, "b": 642.4319800000001, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Jim Denton", "bbox": {"l": 527.22003, "t": 645.73198, "r": 581.29926, "b": 656.41197, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Doug Mack", "bbox": {"l": 527.64001, "t": 659.71198, "r": 581.30884, "b": 670.39197, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Tom McKinley", "bbox": {"l": 514.38, "t": 673.75197, "r": 581.38678, "b": 684.43197, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Kent Milligan", "bbox": {"l": 518.82001, "t": 687.73197, "r": 581.33759, "b": 698.411972, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Implement roles and separation ", "bbox": {"l": 36.119999, "t": 296.13828, "r": 216.00064, "b": 308.58047, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "of duties", "bbox": {"l": 36.119999, "t": 313.11838000000006, "r": 84.527145, "b": 325.56058, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "Leverage", "bbox": {"l": 35.759315, "t": 350.13881999999995, "r": 80.409691, "b": 362.58102, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "row permissions on ", "bbox": {"l": 151.8503, "t": 350.13881999999995, "r": 202.45404, "b": 362.58102, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "the", "bbox": {"l": 35.759315, "t": 367.11893, "r": 50.758106, "b": 379.56112999999993, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "database", "bbox": {"l": 86.755211, "t": 367.11893, "r": 107.75352000000001, "b": 379.56112999999993, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Protect", "bbox": {"l": 36.059887, "t": 404.13937, "r": 73.020607, "b": 416.58157, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "columns by defining ", "bbox": {"l": 152.62831, "t": 404.13937, "r": 195.2753, "b": 416.58157, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "column", "bbox": {"l": 36.059887, "t": 421.11948, "r": 73.311806, "b": 433.56167999999997, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "masks", "bbox": {"l": 73.311806, "t": 421.11948, "r": 117.33681, "b": 433.56167999999997, "coord_origin": "TOPLEFT"}}], "children": [{"id": 5, "label": "text", "bbox": {"l": 497.70001, "t": 575.71201, "r": 581.38678, "b": 698.411972, "coord_origin": "TOPLEFT"}, "confidence": 0.762180745601654, "cells": [{"id": 6, "text": "Jim Bainbridge", "bbox": {"l": 509.22, "t": 575.71201, "r": 581.34119, "b": 586.392, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Hernando Bedoya", "bbox": {"l": 497.70001, "t": 589.752, "r": 581.3736, "b": 600.43199, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Rob Bestgen", "bbox": {"l": 521.40002, "t": 603.73199, "r": 581.34003, "b": 614.4119900000001, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Mike Cain", "bbox": {"l": 534.12, "t": 617.71199, "r": 581.31598, "b": 628.39198, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Dan Cruikshank", "bbox": {"l": 505.43999999999994, "t": 631.75198, "r": 581.29077, "b": 642.4319800000001, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Jim Denton", "bbox": {"l": 527.22003, "t": 645.73198, "r": 581.29926, "b": 656.41197, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Doug Mack", "bbox": {"l": 527.64001, "t": 659.71198, "r": 581.30884, "b": 670.39197, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Tom McKinley", "bbox": {"l": 514.38, "t": 673.75197, "r": 581.38678, "b": 684.43197, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Kent Milligan", "bbox": {"l": 518.82001, "t": 687.73197, "r": 581.33759, "b": 698.411972, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 36.119999, "t": 296.13828, "r": 216.00064, "b": 325.56058, "coord_origin": "TOPLEFT"}, "confidence": 0.8502885103225708, "cells": [{"id": 15, "text": "Implement roles and separation ", "bbox": {"l": 36.119999, "t": 296.13828, "r": 216.00064, "b": 308.58047, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "of duties", "bbox": {"l": 36.119999, "t": 313.11838000000006, "r": 84.527145, "b": 325.56058, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 35.759315, "t": 350.13881999999995, "r": 202.45404, "b": 379.56112999999993, "coord_origin": "TOPLEFT"}, "confidence": 0.8639556169509888, "cells": [{"id": 17, "text": "Leverage", "bbox": {"l": 35.759315, "t": 350.13881999999995, "r": 80.409691, "b": 362.58102, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "row permissions on ", "bbox": {"l": 151.8503, "t": 350.13881999999995, "r": 202.45404, "b": 362.58102, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "the", "bbox": {"l": 35.759315, "t": 367.11893, "r": 50.758106, "b": 379.56112999999993, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "database", "bbox": {"l": 86.755211, "t": 367.11893, "r": 107.75352000000001, "b": 379.56112999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 36.059887, "t": 404.13937, "r": 195.2753, "b": 433.56167999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.842113196849823, "cells": [{"id": 21, "text": "Protect", "bbox": {"l": 36.059887, "t": 404.13937, "r": 73.020607, "b": 416.58157, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "columns by defining ", "bbox": {"l": 152.62831, "t": 404.13937, "r": 195.2753, "b": 416.58157, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "column", "bbox": {"l": 36.059887, "t": 421.11948, "r": 73.311806, "b": 433.56167999999997, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "masks", "bbox": {"l": 73.311806, "t": 421.11948, "r": 117.33681, "b": 433.56167999999997, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 0, "label": "picture", "bbox": {"l": 513.4560546875, "t": 26.085098266601562, "r": 586.1583251953125, "b": 54.81915283203125, "coord_origin": "TOPLEFT"}, "confidence": 0.9272358417510986, "cells": [], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_footer", "id": 6, "page_no": 0, "cluster": {"id": 6, "label": "page_footer", "bbox": {"l": 36.900002, "t": 751.23, "r": 164.4585, "b": 765.105, "coord_origin": "TOPLEFT"}, "confidence": 0.7180292010307312, "cells": [{"id": 0, "text": "ibm.com", "bbox": {"l": 36.900002, "t": 751.23, "r": 98.600998, "b": 765.105, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "/redbooks", "bbox": {"l": 98.580002, "t": 751.23, "r": 164.4585, "b": 765.105, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "ibm.com /redbooks"}, {"label": "picture", "id": 12, "page_no": 0, "cluster": {"id": 12, "label": "picture", "bbox": {"l": 316.9404296875, "t": 710.1278686523438, "r": 581.354736328125, "b": 774.4259033203125, "coord_origin": "TOPLEFT"}, "confidence": 0.577752947807312, "cells": [{"id": 2, "text": "Redpaper", "bbox": {"l": 314.70001, "t": 711.50856, "r": 580.52002, "b": 773.772959, "coord_origin": "TOPLEFT"}}], "children": [{"id": 11, "label": "text", "bbox": {"l": 314.70001, "t": 711.50856, "r": 580.52002, "b": 773.772959, "coord_origin": "TOPLEFT"}, "confidence": 0.5870781540870667, "cells": [{"id": 2, "text": "Redpaper", "bbox": {"l": 314.70001, "t": 711.50856, "r": 580.52002, "b": 773.772959, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "text", "id": 12, "page_no": 0, "cluster": {"id": 12, "label": "text", "bbox": {"l": 287.82001, "t": 28.54803000000004, "r": 418.83356, "b": 50.748050000000035, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 3, "text": "Front cover", "bbox": {"l": 287.82001, "t": 28.54803000000004, "r": 418.83356, "b": 50.748050000000035, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Front cover"}, {"label": "section_header", "id": 4, "page_no": 0, "cluster": {"id": 4, "label": "section_header", "bbox": {"l": 35.700001, "t": 84.58654999999987, "r": 584.64288, "b": 165.84113000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.8281130790710449, "cells": [{"id": 4, "text": "Row and Column Access Control ", "bbox": {"l": 35.700001, "t": 84.58654999999987, "r": 584.64288, "b": 122.82097999999996, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Support in IBM DB2 for i", "bbox": {"l": 35.700001, "t": 127.60668999999996, "r": 447.66919000000007, "b": 165.84113000000002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Row and Column Access Control Support in IBM DB2 for i"}, {"label": "picture", "id": 10, "page_no": 0, "cluster": {"id": 10, "label": "picture", "bbox": {"l": 33.09040069580078, "t": 293.0328369140625, "r": 585.1502075195312, "b": 702.4530029296875, "coord_origin": "TOPLEFT"}, "confidence": 0.5889471173286438, "cells": [{"id": 6, "text": "Jim Bainbridge", "bbox": {"l": 509.22, "t": 575.71201, "r": 581.34119, "b": 586.392, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Hernando Bedoya", "bbox": {"l": 497.70001, "t": 589.752, "r": 581.3736, "b": 600.43199, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Rob Bestgen", "bbox": {"l": 521.40002, "t": 603.73199, "r": 581.34003, "b": 614.4119900000001, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Mike Cain", "bbox": {"l": 534.12, "t": 617.71199, "r": 581.31598, "b": 628.39198, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Dan Cruikshank", "bbox": {"l": 505.43999999999994, "t": 631.75198, "r": 581.29077, "b": 642.4319800000001, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Jim Denton", "bbox": {"l": 527.22003, "t": 645.73198, "r": 581.29926, "b": 656.41197, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Doug Mack", "bbox": {"l": 527.64001, "t": 659.71198, "r": 581.30884, "b": 670.39197, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Tom McKinley", "bbox": {"l": 514.38, "t": 673.75197, "r": 581.38678, "b": 684.43197, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Kent Milligan", "bbox": {"l": 518.82001, "t": 687.73197, "r": 581.33759, "b": 698.411972, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Implement roles and separation ", "bbox": {"l": 36.119999, "t": 296.13828, "r": 216.00064, "b": 308.58047, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "of duties", "bbox": {"l": 36.119999, "t": 313.11838000000006, "r": 84.527145, "b": 325.56058, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "Leverage", "bbox": {"l": 35.759315, "t": 350.13881999999995, "r": 80.409691, "b": 362.58102, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "row permissions on ", "bbox": {"l": 151.8503, "t": 350.13881999999995, "r": 202.45404, "b": 362.58102, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "the", "bbox": {"l": 35.759315, "t": 367.11893, "r": 50.758106, "b": 379.56112999999993, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "database", "bbox": {"l": 86.755211, "t": 367.11893, "r": 107.75352000000001, "b": 379.56112999999993, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Protect", "bbox": {"l": 36.059887, "t": 404.13937, "r": 73.020607, "b": 416.58157, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "columns by defining ", "bbox": {"l": 152.62831, "t": 404.13937, "r": 195.2753, "b": 416.58157, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "column", "bbox": {"l": 36.059887, "t": 421.11948, "r": 73.311806, "b": 433.56167999999997, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "masks", "bbox": {"l": 73.311806, "t": 421.11948, "r": 117.33681, "b": 433.56167999999997, "coord_origin": "TOPLEFT"}}], "children": [{"id": 5, "label": "text", "bbox": {"l": 497.70001, "t": 575.71201, "r": 581.38678, "b": 698.411972, "coord_origin": "TOPLEFT"}, "confidence": 0.762180745601654, "cells": [{"id": 6, "text": "Jim Bainbridge", "bbox": {"l": 509.22, "t": 575.71201, "r": 581.34119, "b": 586.392, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Hernando Bedoya", "bbox": {"l": 497.70001, "t": 589.752, "r": 581.3736, "b": 600.43199, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Rob Bestgen", "bbox": {"l": 521.40002, "t": 603.73199, "r": 581.34003, "b": 614.4119900000001, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Mike Cain", "bbox": {"l": 534.12, "t": 617.71199, "r": 581.31598, "b": 628.39198, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Dan Cruikshank", "bbox": {"l": 505.43999999999994, "t": 631.75198, "r": 581.29077, "b": 642.4319800000001, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Jim Denton", "bbox": {"l": 527.22003, "t": 645.73198, "r": 581.29926, "b": 656.41197, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Doug Mack", "bbox": {"l": 527.64001, "t": 659.71198, "r": 581.30884, "b": 670.39197, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Tom McKinley", "bbox": {"l": 514.38, "t": 673.75197, "r": 581.38678, "b": 684.43197, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Kent Milligan", "bbox": {"l": 518.82001, "t": 687.73197, "r": 581.33759, "b": 698.411972, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 36.119999, "t": 296.13828, "r": 216.00064, "b": 325.56058, "coord_origin": "TOPLEFT"}, "confidence": 0.8502885103225708, "cells": [{"id": 15, "text": "Implement roles and separation ", "bbox": {"l": 36.119999, "t": 296.13828, "r": 216.00064, "b": 308.58047, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "of duties", "bbox": {"l": 36.119999, "t": 313.11838000000006, "r": 84.527145, "b": 325.56058, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 35.759315, "t": 350.13881999999995, "r": 202.45404, "b": 379.56112999999993, "coord_origin": "TOPLEFT"}, "confidence": 0.8639556169509888, "cells": [{"id": 17, "text": "Leverage", "bbox": {"l": 35.759315, "t": 350.13881999999995, "r": 80.409691, "b": 362.58102, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "row permissions on ", "bbox": {"l": 151.8503, "t": 350.13881999999995, "r": 202.45404, "b": 362.58102, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "the", "bbox": {"l": 35.759315, "t": 367.11893, "r": 50.758106, "b": 379.56112999999993, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "database", "bbox": {"l": 86.755211, "t": 367.11893, "r": 107.75352000000001, "b": 379.56112999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 36.059887, "t": 404.13937, "r": 195.2753, "b": 433.56167999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.842113196849823, "cells": [{"id": 21, "text": "Protect", "bbox": {"l": 36.059887, "t": 404.13937, "r": 73.020607, "b": 416.58157, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "columns by defining ", "bbox": {"l": 152.62831, "t": 404.13937, "r": 195.2753, "b": 416.58157, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "column", "bbox": {"l": 36.059887, "t": 421.11948, "r": 73.311806, "b": 433.56167999999997, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "masks", "bbox": {"l": 73.311806, "t": 421.11948, "r": 117.33681, "b": 433.56167999999997, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "picture", "id": 0, "page_no": 0, "cluster": {"id": 0, "label": "picture", "bbox": {"l": 513.4560546875, "t": 26.085098266601562, "r": 586.1583251953125, "b": 54.81915283203125, "coord_origin": "TOPLEFT"}, "confidence": 0.9272358417510986, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "body": [{"label": "picture", "id": 12, "page_no": 0, "cluster": {"id": 12, "label": "picture", "bbox": {"l": 316.9404296875, "t": 710.1278686523438, "r": 581.354736328125, "b": 774.4259033203125, "coord_origin": "TOPLEFT"}, "confidence": 0.577752947807312, "cells": [{"id": 2, "text": "Redpaper", "bbox": {"l": 314.70001, "t": 711.50856, "r": 580.52002, "b": 773.772959, "coord_origin": "TOPLEFT"}}], "children": [{"id": 11, "label": "text", "bbox": {"l": 314.70001, "t": 711.50856, "r": 580.52002, "b": 773.772959, "coord_origin": "TOPLEFT"}, "confidence": 0.5870781540870667, "cells": [{"id": 2, "text": "Redpaper", "bbox": {"l": 314.70001, "t": 711.50856, "r": 580.52002, "b": 773.772959, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "text", "id": 12, "page_no": 0, "cluster": {"id": 12, "label": "text", "bbox": {"l": 287.82001, "t": 28.54803000000004, "r": 418.83356, "b": 50.748050000000035, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 3, "text": "Front cover", "bbox": {"l": 287.82001, "t": 28.54803000000004, "r": 418.83356, "b": 50.748050000000035, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Front cover"}, {"label": "section_header", "id": 4, "page_no": 0, "cluster": {"id": 4, "label": "section_header", "bbox": {"l": 35.700001, "t": 84.58654999999987, "r": 584.64288, "b": 165.84113000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.8281130790710449, "cells": [{"id": 4, "text": "Row and Column Access Control ", "bbox": {"l": 35.700001, "t": 84.58654999999987, "r": 584.64288, "b": 122.82097999999996, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Support in IBM DB2 for i", "bbox": {"l": 35.700001, "t": 127.60668999999996, "r": 447.66919000000007, "b": 165.84113000000002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Row and Column Access Control Support in IBM DB2 for i"}, {"label": "picture", "id": 10, "page_no": 0, "cluster": {"id": 10, "label": "picture", "bbox": {"l": 33.09040069580078, "t": 293.0328369140625, "r": 585.1502075195312, "b": 702.4530029296875, "coord_origin": "TOPLEFT"}, "confidence": 0.5889471173286438, "cells": [{"id": 6, "text": "Jim Bainbridge", "bbox": {"l": 509.22, "t": 575.71201, "r": 581.34119, "b": 586.392, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Hernando Bedoya", "bbox": {"l": 497.70001, "t": 589.752, "r": 581.3736, "b": 600.43199, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Rob Bestgen", "bbox": {"l": 521.40002, "t": 603.73199, "r": 581.34003, "b": 614.4119900000001, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Mike Cain", "bbox": {"l": 534.12, "t": 617.71199, "r": 581.31598, "b": 628.39198, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Dan Cruikshank", "bbox": {"l": 505.43999999999994, "t": 631.75198, "r": 581.29077, "b": 642.4319800000001, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Jim Denton", "bbox": {"l": 527.22003, "t": 645.73198, "r": 581.29926, "b": 656.41197, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Doug Mack", "bbox": {"l": 527.64001, "t": 659.71198, "r": 581.30884, "b": 670.39197, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Tom McKinley", "bbox": {"l": 514.38, "t": 673.75197, "r": 581.38678, "b": 684.43197, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Kent Milligan", "bbox": {"l": 518.82001, "t": 687.73197, "r": 581.33759, "b": 698.411972, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "Implement roles and separation ", "bbox": {"l": 36.119999, "t": 296.13828, "r": 216.00064, "b": 308.58047, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "of duties", "bbox": {"l": 36.119999, "t": 313.11838000000006, "r": 84.527145, "b": 325.56058, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "Leverage", "bbox": {"l": 35.759315, "t": 350.13881999999995, "r": 80.409691, "b": 362.58102, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "row permissions on ", "bbox": {"l": 151.8503, "t": 350.13881999999995, "r": 202.45404, "b": 362.58102, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "the", "bbox": {"l": 35.759315, "t": 367.11893, "r": 50.758106, "b": 379.56112999999993, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "database", "bbox": {"l": 86.755211, "t": 367.11893, "r": 107.75352000000001, "b": 379.56112999999993, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Protect", "bbox": {"l": 36.059887, "t": 404.13937, "r": 73.020607, "b": 416.58157, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "columns by defining ", "bbox": {"l": 152.62831, "t": 404.13937, "r": 195.2753, "b": 416.58157, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "column", "bbox": {"l": 36.059887, "t": 421.11948, "r": 73.311806, "b": 433.56167999999997, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "masks", "bbox": {"l": 73.311806, "t": 421.11948, "r": 117.33681, "b": 433.56167999999997, "coord_origin": "TOPLEFT"}}], "children": [{"id": 5, "label": "text", "bbox": {"l": 497.70001, "t": 575.71201, "r": 581.38678, "b": 698.411972, "coord_origin": "TOPLEFT"}, "confidence": 0.762180745601654, "cells": [{"id": 6, "text": "Jim Bainbridge", "bbox": {"l": 509.22, "t": 575.71201, "r": 581.34119, "b": 586.392, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Hernando Bedoya", "bbox": {"l": 497.70001, "t": 589.752, "r": 581.3736, "b": 600.43199, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Rob Bestgen", "bbox": {"l": 521.40002, "t": 603.73199, "r": 581.34003, "b": 614.4119900000001, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "Mike Cain", "bbox": {"l": 534.12, "t": 617.71199, "r": 581.31598, "b": 628.39198, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Dan Cruikshank", "bbox": {"l": 505.43999999999994, "t": 631.75198, "r": 581.29077, "b": 642.4319800000001, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Jim Denton", "bbox": {"l": 527.22003, "t": 645.73198, "r": 581.29926, "b": 656.41197, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Doug Mack", "bbox": {"l": 527.64001, "t": 659.71198, "r": 581.30884, "b": 670.39197, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Tom McKinley", "bbox": {"l": 514.38, "t": 673.75197, "r": 581.38678, "b": 684.43197, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Kent Milligan", "bbox": {"l": 518.82001, "t": 687.73197, "r": 581.33759, "b": 698.411972, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 36.119999, "t": 296.13828, "r": 216.00064, "b": 325.56058, "coord_origin": "TOPLEFT"}, "confidence": 0.8502885103225708, "cells": [{"id": 15, "text": "Implement roles and separation ", "bbox": {"l": 36.119999, "t": 296.13828, "r": 216.00064, "b": 308.58047, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "of duties", "bbox": {"l": 36.119999, "t": 313.11838000000006, "r": 84.527145, "b": 325.56058, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 35.759315, "t": 350.13881999999995, "r": 202.45404, "b": 379.56112999999993, "coord_origin": "TOPLEFT"}, "confidence": 0.8639556169509888, "cells": [{"id": 17, "text": "Leverage", "bbox": {"l": 35.759315, "t": 350.13881999999995, "r": 80.409691, "b": 362.58102, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "row permissions on ", "bbox": {"l": 151.8503, "t": 350.13881999999995, "r": 202.45404, "b": 362.58102, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "the", "bbox": {"l": 35.759315, "t": 367.11893, "r": 50.758106, "b": 379.56112999999993, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "database", "bbox": {"l": 86.755211, "t": 367.11893, "r": 107.75352000000001, "b": 379.56112999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 36.059887, "t": 404.13937, "r": 195.2753, "b": 433.56167999999997, "coord_origin": "TOPLEFT"}, "confidence": 0.842113196849823, "cells": [{"id": 21, "text": "Protect", "bbox": {"l": 36.059887, "t": 404.13937, "r": 73.020607, "b": 416.58157, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "columns by defining ", "bbox": {"l": 152.62831, "t": 404.13937, "r": 195.2753, "b": 416.58157, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "column", "bbox": {"l": 36.059887, "t": 421.11948, "r": 73.311806, "b": 433.56167999999997, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "masks", "bbox": {"l": 73.311806, "t": 421.11948, "r": 117.33681, "b": 433.56167999999997, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "picture", "id": 0, "page_no": 0, "cluster": {"id": 0, "label": "picture", "bbox": {"l": 513.4560546875, "t": 26.085098266601562, "r": 586.1583251953125, "b": 54.81915283203125, "coord_origin": "TOPLEFT"}, "confidence": 0.9272358417510986, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "headers": [{"label": "page_footer", "id": 6, "page_no": 0, "cluster": {"id": 6, "label": "page_footer", "bbox": {"l": 36.900002, "t": 751.23, "r": 164.4585, "b": 765.105, "coord_origin": "TOPLEFT"}, "confidence": 0.7180292010307312, "cells": [{"id": 0, "text": "ibm.com", "bbox": {"l": 36.900002, "t": 751.23, "r": 98.600998, "b": 765.105, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "/redbooks", "bbox": {"l": 98.580002, "t": 751.23, "r": 164.4585, "b": 765.105, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "ibm.com /redbooks"}]}}, {"page_no": 1, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "' Copyright IBM Corp. 2014. All rights reserved.", "bbox": {"l": 64.800003, "t": 755.538002, "r": 257.24335, "b": 763.863001, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "iii", "bbox": {"l": 538.85999, "t": 754.848721, "r": 547.25928, "b": 764.06172, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Contents", "bbox": {"l": 64.800003, "t": 73.84802000000002, "r": 168.73441, "b": 96.04803000000004, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Notices", "bbox": {"l": 136.8, "t": 132.64862000000005, "r": 172.89404, "b": 141.86163, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vii", "bbox": {"l": 175.01952, "t": 132.64862000000005, "r": 547.18982, "b": 141.86163, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Trademarks", "bbox": {"l": 136.79901, "t": 145.12847999999997, "r": 189.86537, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 195.39685, "t": 145.12847999999997, "r": 530.05121, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "viii", "bbox": {"l": 535.5827, "t": 145.12847999999997, "r": 547.18286, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "DB2 for i Center of Excellence", "bbox": {"l": 136.79901, "t": 167.62811, "r": 279.39731, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ix", "bbox": {"l": 280.61942, "t": 167.62811, "r": 547.1908, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Preface", "bbox": {"l": 136.79901, "t": 190.12775, "r": 172.84424, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi", "bbox": {"l": 175.01852, "t": 190.12775, "r": 547.18286, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Authors . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi", "bbox": {"l": 136.79803, "t": 202.60760000000005, "r": 547.18085, "b": 211.82061999999996, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Now you can become a published author, too!", "bbox": {"l": 136.79803, "t": 215.14721999999995, "r": 339.18292, "b": 224.36023, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 344.71411, "t": 215.14721999999995, "r": 530.00812, "b": 224.36023, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "xiii", "bbox": {"l": 535.53925, "t": 215.14721999999995, "r": 547.13879, "b": 224.36023, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Comments welcome. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 136.79803, "t": 227.62707999999998, "r": 529.99506, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "xiii", "bbox": {"l": 535.5495, "t": 227.62707999999998, "r": 547.19788, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Stay connected to IBM Redbooks", "bbox": {"l": 136.79807, "t": 240.10693000000003, "r": 284.02866, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 289.54449, "t": 240.10693000000003, "r": 529.48242, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "xiv", "bbox": {"l": 534.99829, "t": 240.10693000000003, "r": 547.12115, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Chapter 1. Securing and protecting IBM DB2 data", "bbox": {"l": 136.79807, "t": 262.60657000000003, "r": 373.17566, "b": 271.81958, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 375.11798, "t": 262.60657000000003, "r": 536.09589, "b": 271.81958, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "1", "bbox": {"l": 541.64685, "t": 262.60657000000003, "r": 547.19781, "b": 271.81958, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "1.1", "bbox": {"l": 136.79808, "t": 274.60637999999994, "r": 150.88702, "b": 283.8194, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "Security fundamentals. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2", "bbox": {"l": 156.5226, "t": 274.60637999999994, "r": 549.84723, "b": 283.8194, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "1.2", "bbox": {"l": 136.79807, "t": 287.14606000000003, "r": 150.62746, "b": 296.35904, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Current state of IBM i security . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.15923, "t": 287.14606000000003, "r": 536.12933, "b": 296.35904, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "2", "bbox": {"l": 541.66113, "t": 287.14606000000003, "r": 547.19287, "b": 296.35904, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "1.3", "bbox": {"l": 136.79807, "t": 299.62595, "r": 150.84943, "b": 308.83893, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "DB2 for i security controls . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3", "bbox": {"l": 156.46996, "t": 299.62595, "r": 549.84723, "b": 308.83893, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "1.3.1", "bbox": {"l": 151.1972, "t": 312.1058300000001, "r": 173.38289, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Existing row and column control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.92932, "t": 312.1058300000001, "r": 536.05511, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "4", "bbox": {"l": 541.6015, "t": 312.1058300000001, "r": 547.14795, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "1.3.2", "bbox": {"l": 151.1972, "t": 324.64548, "r": 173.4189, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "New controls: Row and Column Access Control. . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.97432, "t": 324.64548, "r": 536.08008, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "5", "bbox": {"l": 541.6355, "t": 324.64548, "r": 547.19092, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "Chapter 2. Roles and separation of duties", "bbox": {"l": 136.79704, "t": 347.14511, "r": 336.82071, "b": 356.35809, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 338.99701, "t": 347.14511, "r": 536.09088, "b": 356.35809, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "7", "bbox": {"l": 541.64282, "t": 347.14511, "r": 547.19476, "b": 356.35809, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "2.1", "bbox": {"l": 136.79704, "t": 359.14493, "r": 150.644, "b": 368.35791, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Roles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.18277, "t": 359.14493, "r": 536.12714, "b": 368.35791, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "8", "bbox": {"l": 541.66589, "t": 359.14493, "r": 547.20471, "b": 368.35791, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "2.1.1", "bbox": {"l": 151.1972, "t": 371.62482, "r": 173.60995, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "DDM and DRDA application server access: QIBM_DB_DDMDRDA . . . . . . . . . . .", "bbox": {"l": 176.41154, "t": 371.62482, "r": 535.9527, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "8", "bbox": {"l": 541.55585, "t": 371.62482, "r": 547.15906, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "2.1.2", "bbox": {"l": 151.1972, "t": 384.10470999999995, "r": 173.41664, "b": 393.31769, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "Toolbox application server access: QIBM_DB_ZDA. . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.97151, "t": 384.10470999999995, "r": 536.04108, "b": 393.31769, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "8", "bbox": {"l": 541.59595, "t": 384.10470999999995, "r": 547.15082, "b": 393.31769, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "2.1.3", "bbox": {"l": 151.1972, "t": 396.64435, "r": 173.41859, "b": 405.85733, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Database Administrator function: QIBM_DB_SQLADM . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.97394, "t": 396.64435, "r": 536.07489, "b": 405.85733, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "9", "bbox": {"l": 541.63025, "t": 396.64435, "r": 547.18561, "b": 405.85733, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "2.1.4", "bbox": {"l": 151.1972, "t": 409.12424000000004, "r": 173.38629, "b": 418.33722, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Database Information function: QIBM_DB_SYSMON", "bbox": {"l": 178.93356, "t": 409.12424000000004, "r": 411.27048, "b": 418.33722, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": ". . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 416.81775, "t": 409.12424000000004, "r": 536.08411, "b": 418.33722, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "9", "bbox": {"l": 541.63135, "t": 409.12424000000004, "r": 547.17865, "b": 418.33722, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "2.1.5", "bbox": {"l": 151.1972, "t": 421.60413, "r": 173.44926, "b": 430.81711, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Security Administrator function: QIBM_DB_SECADM . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 179.01228, "t": 421.60413, "r": 536.03589, "b": 430.81711, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "9", "bbox": {"l": 541.59894, "t": 421.60413, "r": 547.16193, "b": 430.81711, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "2.1.6", "bbox": {"l": 151.1972, "t": 434.1437700000001, "r": 173.32208, "b": 443.35675, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Change Function Usage CL command . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.8533, "t": 434.1437700000001, "r": 530.57318, "b": 443.35675, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "10", "bbox": {"l": 536.10443, "t": 434.1437700000001, "r": 547.16687, "b": 443.35675, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "2.1.7", "bbox": {"l": 151.1972, "t": 446.62366, "r": 173.35822, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "Verifying function usage IDs for RCAC with the FUNCTION_USAGE view . . . . .", "bbox": {"l": 178.89848, "t": 446.62366, "r": 530.53522, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "10", "bbox": {"l": 536.0755, "t": 446.62366, "r": 547.15601, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "2.2", "bbox": {"l": 136.79704, "t": 459.10355, "r": 150.85457, "b": 468.31653, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "Separation of duties . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10", "bbox": {"l": 156.47758, "t": 459.10355, "r": 547.25659, "b": 468.31653, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "Chapter 3. Row and Column Access Control", "bbox": {"l": 136.79703, "t": 481.60318, "r": 348.68503, "b": 490.81616, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 350.09741, "t": 481.60318, "r": 530.53961, "b": 490.81616, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "13", "bbox": {"l": 536.09167, "t": 481.60318, "r": 547.1958, "b": 490.81616, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "3.1", "bbox": {"l": 136.79703, "t": 493.603, "r": 150.70105, "b": 502.81598, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Explanation of RCAC and the concept of access control . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.26266, "t": 493.603, "r": 530.4809, "b": 502.81598, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "14", "bbox": {"l": 536.04248, "t": 493.603, "r": 547.16571, "b": 502.81598, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "3.1.1", "bbox": {"l": 151.19719, "t": 506.14264, "r": 173.35429, "b": 515.35562, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "Row permission and column mask definitions", "bbox": {"l": 178.89357, "t": 506.14264, "r": 378.20786, "b": 515.35562, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 383.74713, "t": 506.14264, "r": 530.5379, "b": 515.35562, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "14", "bbox": {"l": 536.07721, "t": 506.14264, "r": 547.15576, "b": 515.35562, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "3.1.2", "bbox": {"l": 151.19719, "t": 518.62253, "r": 173.44292, "b": 527.83551, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "Enabling and activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 179.00435, "t": 518.62253, "r": 530.43475, "b": 527.83551, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "16", "bbox": {"l": 535.99622, "t": 518.62253, "r": 547.11908, "b": 527.83551, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "3.2", "bbox": {"l": 136.79703, "t": 531.1621700000001, "r": 150.64432, "b": 540.37517, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Special registers and built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.18323, "t": 531.1621700000001, "r": 530.52808, "b": 540.37517, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "18", "bbox": {"l": 536.06702, "t": 531.1621700000001, "r": 547.14484, "b": 540.37517, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "3.2.1", "bbox": {"l": 151.19719, "t": 543.64204, "r": 173.41321, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "Special registers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.96722, "t": 543.64204, "r": 530.49786, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "18", "bbox": {"l": 536.05188, "t": 543.64204, "r": 547.15991, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "3.2.2", "bbox": {"l": 151.19719, "t": 556.12192, "r": 173.35269, "b": 565.33492, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.89156, "t": 556.12192, "r": 530.56024, "b": 565.33492, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "19", "bbox": {"l": 536.09912, "t": 556.12192, "r": 547.17688, "b": 565.33492, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "3.3", "bbox": {"l": 136.79703, "t": 568.66156, "r": 150.62514, "b": 577.87456, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "VERIFY_GROUP_FOR_USER function . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.15639, "t": 568.66156, "r": 530.53027, "b": 577.87456, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "20", "bbox": {"l": 536.06152, "t": 568.66156, "r": 547.12402, "b": 577.87456, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "3.4", "bbox": {"l": 136.79703, "t": 581.14143, "r": 150.63004, "b": 590.35443, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "Establishing and controlling accessibility by using the RCAC rule text . . . . . . . . . . . . .", "bbox": {"l": 156.16325, "t": 581.14143, "r": 530.62994, "b": 590.35443, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "21", "bbox": {"l": 536.16315, "t": 581.14143, "r": 547.22955, "b": 590.35443, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "3.5", "bbox": {"l": 136.79701, "t": 593.62131, "r": 150.64413, "b": 602.8343, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "SELECT, INSERT, and UPDATE behavior with RCAC", "bbox": {"l": 156.18298, "t": 593.62131, "r": 394.7818, "b": 602.8343, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": ". . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 400.32065, "t": 593.62131, "r": 530.48358, "b": 602.8343, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "22", "bbox": {"l": 536.0224, "t": 593.62131, "r": 547.1001, "b": 602.8343, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "3.6", "bbox": {"l": 136.79701, "t": 606.16095, "r": 150.6642, "b": 615.37395, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "Human resources example . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.21107, "t": 606.16095, "r": 530.56512, "b": 615.37395, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "22", "bbox": {"l": 536.112, "t": 606.16095, "r": 547.20575, "b": 615.37395, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "3.6.1", "bbox": {"l": 151.19717, "t": 618.64082, "r": 173.41692, "b": 627.85382, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "Assigning the QIBM_DB_SECADM function ID to the consultants. . . . . . . . . . . .", "bbox": {"l": 178.97185, "t": 618.64082, "r": 530.49139, "b": 627.85382, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "23", "bbox": {"l": 536.04633, "t": 618.64082, "r": 547.15619, "b": 627.85382, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "3.6.2", "bbox": {"l": 151.19717, "t": 631.1206999999999, "r": 173.32271, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "Creating group profiles for the users and their roles . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.8541, "t": 631.1206999999999, "r": 530.56458, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "23", "bbox": {"l": 536.09601, "t": 631.1206999999999, "r": 547.15875, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "3.6.3", "bbox": {"l": 151.19717, "t": 643.66034, "r": 173.32227, "b": 652.87334, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "Demonstrating data access without RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.85353, "t": 643.66034, "r": 530.55695, "b": 652.87334, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "24", "bbox": {"l": 536.0882, "t": 643.66034, "r": 547.15076, "b": 652.87334, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "3.6.4", "bbox": {"l": 151.19717, "t": 656.14021, "r": 173.35289, "b": 665.35321, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "Defining and creating row permissions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.89182, "t": 656.14021, "r": 530.53412, "b": 665.35321, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "25", "bbox": {"l": 536.073, "t": 656.14021, "r": 547.15088, "b": 665.35321, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "3.6.5", "bbox": {"l": 151.19717, "t": 668.62009, "r": 173.35289, "b": 677.83309, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "Defining and creating column masks", "bbox": {"l": 178.89182, "t": 668.62009, "r": 339.45105, "b": 677.83309, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 344.98996, "t": 668.62009, "r": 530.54413, "b": 677.83309, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "26", "bbox": {"l": 536.08301, "t": 668.62009, "r": 547.16089, "b": 677.83309, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "3.6.6", "bbox": {"l": 151.19717, "t": 681.15973, "r": 173.38359, "b": 690.37273, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "Activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.93019, "t": 681.15973, "r": 530.54102, "b": 690.37273, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "28", "bbox": {"l": 536.08765, "t": 681.15973, "r": 547.18085, "b": 690.37273, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "3.6.7", "bbox": {"l": 151.19717, "t": 693.63961, "r": 173.32332, "b": 702.852615, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Demonstrating data access with RCAC", "bbox": {"l": 178.85486, "t": 693.63961, "r": 350.80011, "b": 702.852615, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 356.33163, "t": 693.63961, "r": 530.57507, "b": 702.852615, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "29", "bbox": {"l": 536.10663, "t": 693.63961, "r": 547.16968, "b": 702.852615, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "3.6.8", "bbox": {"l": 151.19717, "t": 706.119492, "r": 173.44592, "b": 715.332497, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "Demonstrating data access with a view and RCAC . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 179.00812, "t": 706.119492, "r": 530.43628, "b": 715.332497, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "32", "bbox": {"l": 535.99847, "t": 706.119492, "r": 547.12286, "b": 715.332497, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 2, "label": "page_footer", "bbox": {"l": 64.800003, "t": 755.538002, "r": 257.24335, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9473597407341003, "cells": [{"id": 0, "text": "' Copyright IBM Corp. 2014. All rights reserved.", "bbox": {"l": 64.800003, "t": 755.538002, "r": 257.24335, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "page_footer", "bbox": {"l": 538.85999, "t": 754.848721, "r": 547.25928, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.8926277160644531, "cells": [{"id": 1, "text": "iii", "bbox": {"l": 538.85999, "t": 754.848721, "r": 547.25928, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "section_header", "bbox": {"l": 64.800003, "t": 73.84802000000002, "r": 168.73441, "b": 96.04803000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9509142637252808, "cells": [{"id": 2, "text": "Contents", "bbox": {"l": 64.800003, "t": 73.84802000000002, "r": 168.73441, "b": 96.04803000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "document_index", "bbox": {"l": 136.1496124267578, "t": 132.0330352783203, "r": 547.5267944335938, "b": 715.6515502929688, "coord_origin": "TOPLEFT"}, "confidence": 0.9803681373596191, "cells": [{"id": 3, "text": "Notices", "bbox": {"l": 136.8, "t": 132.64862000000005, "r": 172.89404, "b": 141.86163, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vii", "bbox": {"l": 175.01952, "t": 132.64862000000005, "r": 547.18982, "b": 141.86163, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Trademarks", "bbox": {"l": 136.79901, "t": 145.12847999999997, "r": 189.86537, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 195.39685, "t": 145.12847999999997, "r": 530.05121, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "viii", "bbox": {"l": 535.5827, "t": 145.12847999999997, "r": 547.18286, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "DB2 for i Center of Excellence", "bbox": {"l": 136.79901, "t": 167.62811, "r": 279.39731, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ix", "bbox": {"l": 280.61942, "t": 167.62811, "r": 547.1908, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Preface", "bbox": {"l": 136.79901, "t": 190.12775, "r": 172.84424, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi", "bbox": {"l": 175.01852, "t": 190.12775, "r": 547.18286, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Authors . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi", "bbox": {"l": 136.79803, "t": 202.60760000000005, "r": 547.18085, "b": 211.82061999999996, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Now you can become a published author, too!", "bbox": {"l": 136.79803, "t": 215.14721999999995, "r": 339.18292, "b": 224.36023, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 344.71411, "t": 215.14721999999995, "r": 530.00812, "b": 224.36023, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "xiii", "bbox": {"l": 535.53925, "t": 215.14721999999995, "r": 547.13879, "b": 224.36023, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Comments welcome. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 136.79803, "t": 227.62707999999998, "r": 529.99506, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "xiii", "bbox": {"l": 535.5495, "t": 227.62707999999998, "r": 547.19788, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Stay connected to IBM Redbooks", "bbox": {"l": 136.79807, "t": 240.10693000000003, "r": 284.02866, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 289.54449, "t": 240.10693000000003, "r": 529.48242, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "xiv", "bbox": {"l": 534.99829, "t": 240.10693000000003, "r": 547.12115, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Chapter 1. Securing and protecting IBM DB2 data", "bbox": {"l": 136.79807, "t": 262.60657000000003, "r": 373.17566, "b": 271.81958, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 375.11798, "t": 262.60657000000003, "r": 536.09589, "b": 271.81958, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "1", "bbox": {"l": 541.64685, "t": 262.60657000000003, "r": 547.19781, "b": 271.81958, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "1.1", "bbox": {"l": 136.79808, "t": 274.60637999999994, "r": 150.88702, "b": 283.8194, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "Security fundamentals. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2", "bbox": {"l": 156.5226, "t": 274.60637999999994, "r": 549.84723, "b": 283.8194, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "1.2", "bbox": {"l": 136.79807, "t": 287.14606000000003, "r": 150.62746, "b": 296.35904, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Current state of IBM i security . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.15923, "t": 287.14606000000003, "r": 536.12933, "b": 296.35904, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "2", "bbox": {"l": 541.66113, "t": 287.14606000000003, "r": 547.19287, "b": 296.35904, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "1.3", "bbox": {"l": 136.79807, "t": 299.62595, "r": 150.84943, "b": 308.83893, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "DB2 for i security controls . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3", "bbox": {"l": 156.46996, "t": 299.62595, "r": 549.84723, "b": 308.83893, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "1.3.1", "bbox": {"l": 151.1972, "t": 312.1058300000001, "r": 173.38289, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Existing row and column control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.92932, "t": 312.1058300000001, "r": 536.05511, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "4", "bbox": {"l": 541.6015, "t": 312.1058300000001, "r": 547.14795, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "1.3.2", "bbox": {"l": 151.1972, "t": 324.64548, "r": 173.4189, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "New controls: Row and Column Access Control. . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.97432, "t": 324.64548, "r": 536.08008, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "5", "bbox": {"l": 541.6355, "t": 324.64548, "r": 547.19092, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "Chapter 2. Roles and separation of duties", "bbox": {"l": 136.79704, "t": 347.14511, "r": 336.82071, "b": 356.35809, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 338.99701, "t": 347.14511, "r": 536.09088, "b": 356.35809, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "7", "bbox": {"l": 541.64282, "t": 347.14511, "r": 547.19476, "b": 356.35809, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "2.1", "bbox": {"l": 136.79704, "t": 359.14493, "r": 150.644, "b": 368.35791, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Roles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.18277, "t": 359.14493, "r": 536.12714, "b": 368.35791, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "8", "bbox": {"l": 541.66589, "t": 359.14493, "r": 547.20471, "b": 368.35791, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "2.1.1", "bbox": {"l": 151.1972, "t": 371.62482, "r": 173.60995, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "DDM and DRDA application server access: QIBM_DB_DDMDRDA . . . . . . . . . . .", "bbox": {"l": 176.41154, "t": 371.62482, "r": 535.9527, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "8", "bbox": {"l": 541.55585, "t": 371.62482, "r": 547.15906, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "2.1.2", "bbox": {"l": 151.1972, "t": 384.10470999999995, "r": 173.41664, "b": 393.31769, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "Toolbox application server access: QIBM_DB_ZDA. . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.97151, "t": 384.10470999999995, "r": 536.04108, "b": 393.31769, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "8", "bbox": {"l": 541.59595, "t": 384.10470999999995, "r": 547.15082, "b": 393.31769, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "2.1.3", "bbox": {"l": 151.1972, "t": 396.64435, "r": 173.41859, "b": 405.85733, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Database Administrator function: QIBM_DB_SQLADM . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.97394, "t": 396.64435, "r": 536.07489, "b": 405.85733, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "9", "bbox": {"l": 541.63025, "t": 396.64435, "r": 547.18561, "b": 405.85733, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "2.1.4", "bbox": {"l": 151.1972, "t": 409.12424000000004, "r": 173.38629, "b": 418.33722, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Database Information function: QIBM_DB_SYSMON", "bbox": {"l": 178.93356, "t": 409.12424000000004, "r": 411.27048, "b": 418.33722, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": ". . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 416.81775, "t": 409.12424000000004, "r": 536.08411, "b": 418.33722, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "9", "bbox": {"l": 541.63135, "t": 409.12424000000004, "r": 547.17865, "b": 418.33722, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "2.1.5", "bbox": {"l": 151.1972, "t": 421.60413, "r": 173.44926, "b": 430.81711, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Security Administrator function: QIBM_DB_SECADM . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 179.01228, "t": 421.60413, "r": 536.03589, "b": 430.81711, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "9", "bbox": {"l": 541.59894, "t": 421.60413, "r": 547.16193, "b": 430.81711, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "2.1.6", "bbox": {"l": 151.1972, "t": 434.1437700000001, "r": 173.32208, "b": 443.35675, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Change Function Usage CL command . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.8533, "t": 434.1437700000001, "r": 530.57318, "b": 443.35675, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "10", "bbox": {"l": 536.10443, "t": 434.1437700000001, "r": 547.16687, "b": 443.35675, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "2.1.7", "bbox": {"l": 151.1972, "t": 446.62366, "r": 173.35822, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "Verifying function usage IDs for RCAC with the FUNCTION_USAGE view . . . . .", "bbox": {"l": 178.89848, "t": 446.62366, "r": 530.53522, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "10", "bbox": {"l": 536.0755, "t": 446.62366, "r": 547.15601, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "2.2", "bbox": {"l": 136.79704, "t": 459.10355, "r": 150.85457, "b": 468.31653, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "Separation of duties . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10", "bbox": {"l": 156.47758, "t": 459.10355, "r": 547.25659, "b": 468.31653, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "Chapter 3. Row and Column Access Control", "bbox": {"l": 136.79703, "t": 481.60318, "r": 348.68503, "b": 490.81616, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 350.09741, "t": 481.60318, "r": 530.53961, "b": 490.81616, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "13", "bbox": {"l": 536.09167, "t": 481.60318, "r": 547.1958, "b": 490.81616, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "3.1", "bbox": {"l": 136.79703, "t": 493.603, "r": 150.70105, "b": 502.81598, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Explanation of RCAC and the concept of access control . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.26266, "t": 493.603, "r": 530.4809, "b": 502.81598, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "14", "bbox": {"l": 536.04248, "t": 493.603, "r": 547.16571, "b": 502.81598, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "3.1.1", "bbox": {"l": 151.19719, "t": 506.14264, "r": 173.35429, "b": 515.35562, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "Row permission and column mask definitions", "bbox": {"l": 178.89357, "t": 506.14264, "r": 378.20786, "b": 515.35562, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 383.74713, "t": 506.14264, "r": 530.5379, "b": 515.35562, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "14", "bbox": {"l": 536.07721, "t": 506.14264, "r": 547.15576, "b": 515.35562, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "3.1.2", "bbox": {"l": 151.19719, "t": 518.62253, "r": 173.44292, "b": 527.83551, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "Enabling and activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 179.00435, "t": 518.62253, "r": 530.43475, "b": 527.83551, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "16", "bbox": {"l": 535.99622, "t": 518.62253, "r": 547.11908, "b": 527.83551, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "3.2", "bbox": {"l": 136.79703, "t": 531.1621700000001, "r": 150.64432, "b": 540.37517, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Special registers and built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.18323, "t": 531.1621700000001, "r": 530.52808, "b": 540.37517, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "18", "bbox": {"l": 536.06702, "t": 531.1621700000001, "r": 547.14484, "b": 540.37517, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "3.2.1", "bbox": {"l": 151.19719, "t": 543.64204, "r": 173.41321, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "Special registers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.96722, "t": 543.64204, "r": 530.49786, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "18", "bbox": {"l": 536.05188, "t": 543.64204, "r": 547.15991, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "3.2.2", "bbox": {"l": 151.19719, "t": 556.12192, "r": 173.35269, "b": 565.33492, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.89156, "t": 556.12192, "r": 530.56024, "b": 565.33492, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "19", "bbox": {"l": 536.09912, "t": 556.12192, "r": 547.17688, "b": 565.33492, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "3.3", "bbox": {"l": 136.79703, "t": 568.66156, "r": 150.62514, "b": 577.87456, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "VERIFY_GROUP_FOR_USER function . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.15639, "t": 568.66156, "r": 530.53027, "b": 577.87456, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "20", "bbox": {"l": 536.06152, "t": 568.66156, "r": 547.12402, "b": 577.87456, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "3.4", "bbox": {"l": 136.79703, "t": 581.14143, "r": 150.63004, "b": 590.35443, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "Establishing and controlling accessibility by using the RCAC rule text . . . . . . . . . . . . .", "bbox": {"l": 156.16325, "t": 581.14143, "r": 530.62994, "b": 590.35443, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "21", "bbox": {"l": 536.16315, "t": 581.14143, "r": 547.22955, "b": 590.35443, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "3.5", "bbox": {"l": 136.79701, "t": 593.62131, "r": 150.64413, "b": 602.8343, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "SELECT, INSERT, and UPDATE behavior with RCAC", "bbox": {"l": 156.18298, "t": 593.62131, "r": 394.7818, "b": 602.8343, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": ". . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 400.32065, "t": 593.62131, "r": 530.48358, "b": 602.8343, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "22", "bbox": {"l": 536.0224, "t": 593.62131, "r": 547.1001, "b": 602.8343, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "3.6", "bbox": {"l": 136.79701, "t": 606.16095, "r": 150.6642, "b": 615.37395, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "Human resources example . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.21107, "t": 606.16095, "r": 530.56512, "b": 615.37395, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "22", "bbox": {"l": 536.112, "t": 606.16095, "r": 547.20575, "b": 615.37395, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "3.6.1", "bbox": {"l": 151.19717, "t": 618.64082, "r": 173.41692, "b": 627.85382, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "Assigning the QIBM_DB_SECADM function ID to the consultants. . . . . . . . . . . .", "bbox": {"l": 178.97185, "t": 618.64082, "r": 530.49139, "b": 627.85382, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "23", "bbox": {"l": 536.04633, "t": 618.64082, "r": 547.15619, "b": 627.85382, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "3.6.2", "bbox": {"l": 151.19717, "t": 631.1206999999999, "r": 173.32271, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "Creating group profiles for the users and their roles . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.8541, "t": 631.1206999999999, "r": 530.56458, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "23", "bbox": {"l": 536.09601, "t": 631.1206999999999, "r": 547.15875, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "3.6.3", "bbox": {"l": 151.19717, "t": 643.66034, "r": 173.32227, "b": 652.87334, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "Demonstrating data access without RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.85353, "t": 643.66034, "r": 530.55695, "b": 652.87334, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "24", "bbox": {"l": 536.0882, "t": 643.66034, "r": 547.15076, "b": 652.87334, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "3.6.4", "bbox": {"l": 151.19717, "t": 656.14021, "r": 173.35289, "b": 665.35321, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "Defining and creating row permissions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.89182, "t": 656.14021, "r": 530.53412, "b": 665.35321, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "25", "bbox": {"l": 536.073, "t": 656.14021, "r": 547.15088, "b": 665.35321, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "3.6.5", "bbox": {"l": 151.19717, "t": 668.62009, "r": 173.35289, "b": 677.83309, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "Defining and creating column masks", "bbox": {"l": 178.89182, "t": 668.62009, "r": 339.45105, "b": 677.83309, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 344.98996, "t": 668.62009, "r": 530.54413, "b": 677.83309, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "26", "bbox": {"l": 536.08301, "t": 668.62009, "r": 547.16089, "b": 677.83309, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "3.6.6", "bbox": {"l": 151.19717, "t": 681.15973, "r": 173.38359, "b": 690.37273, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "Activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.93019, "t": 681.15973, "r": 530.54102, "b": 690.37273, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "28", "bbox": {"l": 536.08765, "t": 681.15973, "r": 547.18085, "b": 690.37273, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "3.6.7", "bbox": {"l": 151.19717, "t": 693.63961, "r": 173.32332, "b": 702.852615, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Demonstrating data access with RCAC", "bbox": {"l": 178.85486, "t": 693.63961, "r": 350.80011, "b": 702.852615, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 356.33163, "t": 693.63961, "r": 530.57507, "b": 702.852615, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "29", "bbox": {"l": 536.10663, "t": 693.63961, "r": 547.16968, "b": 702.852615, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "3.6.8", "bbox": {"l": 151.19717, "t": 706.119492, "r": 173.44592, "b": 715.332497, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "Demonstrating data access with a view and RCAC . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 179.00812, "t": 706.119492, "r": 530.43628, "b": 715.332497, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "32", "bbox": {"l": 535.99847, "t": 706.119492, "r": 547.12286, "b": 715.332497, "coord_origin": "TOPLEFT"}}], "children": [{"id": 4, "label": "text", "bbox": {"l": 136.8, "t": 132.64862000000005, "r": 172.89404, "b": 141.86163, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 3, "text": "Notices", "bbox": {"l": 136.8, "t": 132.64862000000005, "r": 172.89404, "b": 141.86163, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "text", "bbox": {"l": 175.01952, "t": 132.64862000000005, "r": 547.18982, "b": 141.86163, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 4, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vii", "bbox": {"l": 175.01952, "t": 132.64862000000005, "r": 547.18982, "b": 141.86163, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "text", "bbox": {"l": 136.79901, "t": 145.12847999999997, "r": 189.86537, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 5, "text": "Trademarks", "bbox": {"l": 136.79901, "t": 145.12847999999997, "r": 189.86537, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "text", "bbox": {"l": 195.39685, "t": 145.12847999999997, "r": 530.05121, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 195.39685, "t": 145.12847999999997, "r": 530.05121, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "text", "bbox": {"l": 535.5827, "t": 145.12847999999997, "r": 547.18286, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "viii", "bbox": {"l": 535.5827, "t": 145.12847999999997, "r": 547.18286, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 136.79901, "t": 167.62811, "r": 279.39731, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "DB2 for i Center of Excellence", "bbox": {"l": 136.79901, "t": 167.62811, "r": 279.39731, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "text", "bbox": {"l": 280.61942, "t": 167.62811, "r": 547.1908, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ix", "bbox": {"l": 280.61942, "t": 167.62811, "r": 547.1908, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 136.79901, "t": 190.12775, "r": 172.84424, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "Preface", "bbox": {"l": 136.79901, "t": 190.12775, "r": 172.84424, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 175.01852, "t": 190.12775, "r": 547.18286, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi", "bbox": {"l": 175.01852, "t": 190.12775, "r": 547.18286, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 136.79803, "t": 202.60760000000005, "r": 547.18085, "b": 211.82061999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "Authors . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi", "bbox": {"l": 136.79803, "t": 202.60760000000005, "r": 547.18085, "b": 211.82061999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 136.79803, "t": 215.14721999999995, "r": 339.18292, "b": 224.36023, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "Now you can become a published author, too!", "bbox": {"l": 136.79803, "t": 215.14721999999995, "r": 339.18292, "b": 224.36023, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 344.71411, "t": 215.14721999999995, "r": 530.00812, "b": 224.36023, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 344.71411, "t": 215.14721999999995, "r": 530.00812, "b": 224.36023, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 535.53925, "t": 215.14721999999995, "r": 547.13879, "b": 224.36023, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "xiii", "bbox": {"l": 535.53925, "t": 215.14721999999995, "r": 547.13879, "b": 224.36023, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 136.79803, "t": 227.62707999999998, "r": 529.99506, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "Comments welcome. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 136.79803, "t": 227.62707999999998, "r": 529.99506, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 535.5495, "t": 227.62707999999998, "r": 547.19788, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "xiii", "bbox": {"l": 535.5495, "t": 227.62707999999998, "r": 547.19788, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 136.79807, "t": 240.10693000000003, "r": 284.02866, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "Stay connected to IBM Redbooks", "bbox": {"l": 136.79807, "t": 240.10693000000003, "r": 284.02866, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 289.54449, "t": 240.10693000000003, "r": 529.48242, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 289.54449, "t": 240.10693000000003, "r": 529.48242, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 534.99829, "t": 240.10693000000003, "r": 547.12115, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "xiv", "bbox": {"l": 534.99829, "t": 240.10693000000003, "r": 547.12115, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 136.79807, "t": 262.60657000000003, "r": 373.17566, "b": 271.81958, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "Chapter 1. Securing and protecting IBM DB2 data", "bbox": {"l": 136.79807, "t": 262.60657000000003, "r": 373.17566, "b": 271.81958, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 375.11798, "t": 262.60657000000003, "r": 536.09589, "b": 271.81958, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 375.11798, "t": 262.60657000000003, "r": 536.09589, "b": 271.81958, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 541.64685, "t": 262.60657000000003, "r": 547.19781, "b": 271.81958, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "1", "bbox": {"l": 541.64685, "t": 262.60657000000003, "r": 547.19781, "b": 271.81958, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 136.79808, "t": 274.60637999999994, "r": 150.88702, "b": 283.8194, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "1.1", "bbox": {"l": 136.79808, "t": 274.60637999999994, "r": 150.88702, "b": 283.8194, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 156.5226, "t": 274.60637999999994, "r": 549.84723, "b": 283.8194, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "Security fundamentals. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2", "bbox": {"l": 156.5226, "t": 274.60637999999994, "r": 549.84723, "b": 283.8194, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 136.79807, "t": 287.14606000000003, "r": 150.62746, "b": 296.35904, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "1.2", "bbox": {"l": 136.79807, "t": 287.14606000000003, "r": 150.62746, "b": 296.35904, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 156.15923, "t": 287.14606000000003, "r": 536.12933, "b": 296.35904, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "Current state of IBM i security . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.15923, "t": 287.14606000000003, "r": 536.12933, "b": 296.35904, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 541.66113, "t": 287.14606000000003, "r": 547.19287, "b": 296.35904, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "2", "bbox": {"l": 541.66113, "t": 287.14606000000003, "r": 547.19287, "b": 296.35904, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 136.79807, "t": 299.62595, "r": 150.84943, "b": 308.83893, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "1.3", "bbox": {"l": 136.79807, "t": 299.62595, "r": 150.84943, "b": 308.83893, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 156.46996, "t": 299.62595, "r": 549.84723, "b": 308.83893, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "DB2 for i security controls . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3", "bbox": {"l": 156.46996, "t": 299.62595, "r": 549.84723, "b": 308.83893, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 151.1972, "t": 312.1058300000001, "r": 173.38289, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "1.3.1", "bbox": {"l": 151.1972, "t": 312.1058300000001, "r": 173.38289, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 178.92932, "t": 312.1058300000001, "r": 536.05511, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "Existing row and column control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.92932, "t": 312.1058300000001, "r": 536.05511, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 541.6015, "t": 312.1058300000001, "r": 547.14795, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "4", "bbox": {"l": 541.6015, "t": 312.1058300000001, "r": 547.14795, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 151.1972, "t": 324.64548, "r": 173.4189, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "1.3.2", "bbox": {"l": 151.1972, "t": 324.64548, "r": 173.4189, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 178.97432, "t": 324.64548, "r": 536.08008, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "New controls: Row and Column Access Control. . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.97432, "t": 324.64548, "r": 536.08008, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 541.6355, "t": 324.64548, "r": 547.19092, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "5", "bbox": {"l": 541.6355, "t": 324.64548, "r": 547.19092, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 136.79704, "t": 347.14511, "r": 336.82071, "b": 356.35809, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "Chapter 2. Roles and separation of duties", "bbox": {"l": 136.79704, "t": 347.14511, "r": 336.82071, "b": 356.35809, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 338.99701, "t": 347.14511, "r": 536.09088, "b": 356.35809, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 338.99701, "t": 347.14511, "r": 536.09088, "b": 356.35809, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 541.64282, "t": 347.14511, "r": 547.19476, "b": 356.35809, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "7", "bbox": {"l": 541.64282, "t": 347.14511, "r": 547.19476, "b": 356.35809, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 136.79704, "t": 359.14493, "r": 150.644, "b": 368.35791, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "2.1", "bbox": {"l": 136.79704, "t": 359.14493, "r": 150.644, "b": 368.35791, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 156.18277, "t": 359.14493, "r": 536.12714, "b": 368.35791, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "Roles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.18277, "t": 359.14493, "r": 536.12714, "b": 368.35791, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 541.66589, "t": 359.14493, "r": 547.20471, "b": 368.35791, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "8", "bbox": {"l": 541.66589, "t": 359.14493, "r": 547.20471, "b": 368.35791, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 151.1972, "t": 371.62482, "r": 173.60995, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "2.1.1", "bbox": {"l": 151.1972, "t": 371.62482, "r": 173.60995, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 176.41154, "t": 371.62482, "r": 535.9527, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "DDM and DRDA application server access: QIBM_DB_DDMDRDA . . . . . . . . . . .", "bbox": {"l": 176.41154, "t": 371.62482, "r": 535.9527, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 541.55585, "t": 371.62482, "r": 547.15906, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "8", "bbox": {"l": 541.55585, "t": 371.62482, "r": 547.15906, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 151.1972, "t": 384.10470999999995, "r": 173.41664, "b": 393.31769, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "2.1.2", "bbox": {"l": 151.1972, "t": 384.10470999999995, "r": 173.41664, "b": 393.31769, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 178.97151, "t": 384.10470999999995, "r": 536.04108, "b": 393.31769, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "Toolbox application server access: QIBM_DB_ZDA. . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.97151, "t": 384.10470999999995, "r": 536.04108, "b": 393.31769, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 541.59595, "t": 384.10470999999995, "r": 547.15082, "b": 393.31769, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "8", "bbox": {"l": 541.59595, "t": 384.10470999999995, "r": 547.15082, "b": 393.31769, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 151.1972, "t": 396.64435, "r": 173.41859, "b": 405.85733, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "2.1.3", "bbox": {"l": 151.1972, "t": 396.64435, "r": 173.41859, "b": 405.85733, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 178.97394, "t": 396.64435, "r": 536.07489, "b": 405.85733, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "Database Administrator function: QIBM_DB_SQLADM . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.97394, "t": 396.64435, "r": 536.07489, "b": 405.85733, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 541.63025, "t": 396.64435, "r": 547.18561, "b": 405.85733, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "9", "bbox": {"l": 541.63025, "t": 396.64435, "r": 547.18561, "b": 405.85733, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 151.1972, "t": 409.12424000000004, "r": 173.38629, "b": 418.33722, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "2.1.4", "bbox": {"l": 151.1972, "t": 409.12424000000004, "r": 173.38629, "b": 418.33722, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 178.93356, "t": 409.12424000000004, "r": 411.27048, "b": 418.33722, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "Database Information function: QIBM_DB_SYSMON", "bbox": {"l": 178.93356, "t": 409.12424000000004, "r": 411.27048, "b": 418.33722, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 416.81775, "t": 409.12424000000004, "r": 536.08411, "b": 418.33722, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": ". . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 416.81775, "t": 409.12424000000004, "r": 536.08411, "b": 418.33722, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 541.63135, "t": 409.12424000000004, "r": 547.17865, "b": 418.33722, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "9", "bbox": {"l": 541.63135, "t": 409.12424000000004, "r": 547.17865, "b": 418.33722, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 151.1972, "t": 421.60413, "r": 173.44926, "b": 430.81711, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "2.1.5", "bbox": {"l": 151.1972, "t": 421.60413, "r": 173.44926, "b": 430.81711, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 179.01228, "t": 421.60413, "r": 536.03589, "b": 430.81711, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "Security Administrator function: QIBM_DB_SECADM . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 179.01228, "t": 421.60413, "r": 536.03589, "b": 430.81711, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 541.59894, "t": 421.60413, "r": 547.16193, "b": 430.81711, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "9", "bbox": {"l": 541.59894, "t": 421.60413, "r": 547.16193, "b": 430.81711, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 151.1972, "t": 434.1437700000001, "r": 173.32208, "b": 443.35675, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "2.1.6", "bbox": {"l": 151.1972, "t": 434.1437700000001, "r": 173.32208, "b": 443.35675, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 178.8533, "t": 434.1437700000001, "r": 530.57318, "b": 443.35675, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "Change Function Usage CL command . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.8533, "t": 434.1437700000001, "r": 530.57318, "b": 443.35675, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 536.10443, "t": 434.1437700000001, "r": 547.16687, "b": 443.35675, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "10", "bbox": {"l": 536.10443, "t": 434.1437700000001, "r": 547.16687, "b": 443.35675, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 151.1972, "t": 446.62366, "r": 173.35822, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "2.1.7", "bbox": {"l": 151.1972, "t": 446.62366, "r": 173.35822, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 178.89848, "t": 446.62366, "r": 530.53522, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "Verifying function usage IDs for RCAC with the FUNCTION_USAGE view . . . . .", "bbox": {"l": 178.89848, "t": 446.62366, "r": 530.53522, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 536.0755, "t": 446.62366, "r": 547.15601, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "10", "bbox": {"l": 536.0755, "t": 446.62366, "r": 547.15601, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 136.79704, "t": 459.10355, "r": 150.85457, "b": 468.31653, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "2.2", "bbox": {"l": 136.79704, "t": 459.10355, "r": 150.85457, "b": 468.31653, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 156.47758, "t": 459.10355, "r": 547.25659, "b": 468.31653, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "Separation of duties . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10", "bbox": {"l": 156.47758, "t": 459.10355, "r": 547.25659, "b": 468.31653, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 136.79703, "t": 481.60318, "r": 348.68503, "b": 490.81616, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "Chapter 3. Row and Column Access Control", "bbox": {"l": 136.79703, "t": 481.60318, "r": 348.68503, "b": 490.81616, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 350.09741, "t": 481.60318, "r": 530.53961, "b": 490.81616, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 350.09741, "t": 481.60318, "r": 530.53961, "b": 490.81616, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 536.09167, "t": 481.60318, "r": 547.1958, "b": 490.81616, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "13", "bbox": {"l": 536.09167, "t": 481.60318, "r": 547.1958, "b": 490.81616, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 136.79703, "t": 493.603, "r": 150.70105, "b": 502.81598, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "3.1", "bbox": {"l": 136.79703, "t": 493.603, "r": 150.70105, "b": 502.81598, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 156.26266, "t": 493.603, "r": 530.4809, "b": 502.81598, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "Explanation of RCAC and the concept of access control . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.26266, "t": 493.603, "r": 530.4809, "b": 502.81598, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 536.04248, "t": 493.603, "r": 547.16571, "b": 502.81598, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "14", "bbox": {"l": 536.04248, "t": 493.603, "r": 547.16571, "b": 502.81598, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 151.19719, "t": 506.14264, "r": 173.35429, "b": 515.35562, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "3.1.1", "bbox": {"l": 151.19719, "t": 506.14264, "r": 173.35429, "b": 515.35562, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 178.89357, "t": 506.14264, "r": 378.20786, "b": 515.35562, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "Row permission and column mask definitions", "bbox": {"l": 178.89357, "t": 506.14264, "r": 378.20786, "b": 515.35562, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 383.74713, "t": 506.14264, "r": 530.5379, "b": 515.35562, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 383.74713, "t": 506.14264, "r": 530.5379, "b": 515.35562, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 536.07721, "t": 506.14264, "r": 547.15576, "b": 515.35562, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "14", "bbox": {"l": 536.07721, "t": 506.14264, "r": 547.15576, "b": 515.35562, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 151.19719, "t": 518.62253, "r": 173.44292, "b": 527.83551, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "3.1.2", "bbox": {"l": 151.19719, "t": 518.62253, "r": 173.44292, "b": 527.83551, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 179.00435, "t": 518.62253, "r": 530.43475, "b": 527.83551, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "Enabling and activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 179.00435, "t": 518.62253, "r": 530.43475, "b": 527.83551, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 535.99622, "t": 518.62253, "r": 547.11908, "b": 527.83551, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "16", "bbox": {"l": 535.99622, "t": 518.62253, "r": 547.11908, "b": 527.83551, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 136.79703, "t": 531.1621700000001, "r": 150.64432, "b": 540.37517, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "3.2", "bbox": {"l": 136.79703, "t": 531.1621700000001, "r": 150.64432, "b": 540.37517, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 156.18323, "t": 531.1621700000001, "r": 530.52808, "b": 540.37517, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "Special registers and built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.18323, "t": 531.1621700000001, "r": 530.52808, "b": 540.37517, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 536.06702, "t": 531.1621700000001, "r": 547.14484, "b": 540.37517, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "18", "bbox": {"l": 536.06702, "t": 531.1621700000001, "r": 547.14484, "b": 540.37517, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 151.19719, "t": 543.64204, "r": 173.41321, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "3.2.1", "bbox": {"l": 151.19719, "t": 543.64204, "r": 173.41321, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 178.96722, "t": 543.64204, "r": 530.49786, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "Special registers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.96722, "t": 543.64204, "r": 530.49786, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 536.05188, "t": 543.64204, "r": 547.15991, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "18", "bbox": {"l": 536.05188, "t": 543.64204, "r": 547.15991, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 151.19719, "t": 556.12192, "r": 173.35269, "b": 565.33492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "3.2.2", "bbox": {"l": 151.19719, "t": 556.12192, "r": 173.35269, "b": 565.33492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 178.89156, "t": 556.12192, "r": 530.56024, "b": 565.33492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "Built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.89156, "t": 556.12192, "r": 530.56024, "b": 565.33492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 536.09912, "t": 556.12192, "r": 547.17688, "b": 565.33492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "19", "bbox": {"l": 536.09912, "t": 556.12192, "r": 547.17688, "b": 565.33492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 136.79703, "t": 568.66156, "r": 150.62514, "b": 577.87456, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "3.3", "bbox": {"l": 136.79703, "t": 568.66156, "r": 150.62514, "b": 577.87456, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 156.15639, "t": 568.66156, "r": 530.53027, "b": 577.87456, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "VERIFY_GROUP_FOR_USER function . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.15639, "t": 568.66156, "r": 530.53027, "b": 577.87456, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 536.06152, "t": 568.66156, "r": 547.12402, "b": 577.87456, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "20", "bbox": {"l": 536.06152, "t": 568.66156, "r": 547.12402, "b": 577.87456, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 136.79703, "t": 581.14143, "r": 150.63004, "b": 590.35443, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "3.4", "bbox": {"l": 136.79703, "t": 581.14143, "r": 150.63004, "b": 590.35443, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 156.16325, "t": 581.14143, "r": 530.62994, "b": 590.35443, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "Establishing and controlling accessibility by using the RCAC rule text . . . . . . . . . . . . .", "bbox": {"l": 156.16325, "t": 581.14143, "r": 530.62994, "b": 590.35443, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 536.16315, "t": 581.14143, "r": 547.22955, "b": 590.35443, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "21", "bbox": {"l": 536.16315, "t": 581.14143, "r": 547.22955, "b": 590.35443, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 136.79701, "t": 593.62131, "r": 150.64413, "b": 602.8343, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "3.5", "bbox": {"l": 136.79701, "t": 593.62131, "r": 150.64413, "b": 602.8343, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 156.18298, "t": 593.62131, "r": 394.7818, "b": 602.8343, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "SELECT, INSERT, and UPDATE behavior with RCAC", "bbox": {"l": 156.18298, "t": 593.62131, "r": 394.7818, "b": 602.8343, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 400.32065, "t": 593.62131, "r": 530.48358, "b": 602.8343, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": ". . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 400.32065, "t": 593.62131, "r": 530.48358, "b": 602.8343, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 536.0224, "t": 593.62131, "r": 547.1001, "b": 602.8343, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "22", "bbox": {"l": 536.0224, "t": 593.62131, "r": 547.1001, "b": 602.8343, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 136.79701, "t": 606.16095, "r": 150.6642, "b": 615.37395, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "3.6", "bbox": {"l": 136.79701, "t": 606.16095, "r": 150.6642, "b": 615.37395, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 156.21107, "t": 606.16095, "r": 530.56512, "b": 615.37395, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "Human resources example . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.21107, "t": 606.16095, "r": 530.56512, "b": 615.37395, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 536.112, "t": 606.16095, "r": 547.20575, "b": 615.37395, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "22", "bbox": {"l": 536.112, "t": 606.16095, "r": 547.20575, "b": 615.37395, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 151.19717, "t": 618.64082, "r": 173.41692, "b": 627.85382, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "3.6.1", "bbox": {"l": 151.19717, "t": 618.64082, "r": 173.41692, "b": 627.85382, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 178.97185, "t": 618.64082, "r": 530.49139, "b": 627.85382, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": "Assigning the QIBM_DB_SECADM function ID to the consultants. . . . . . . . . . . .", "bbox": {"l": 178.97185, "t": 618.64082, "r": 530.49139, "b": 627.85382, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 536.04633, "t": 618.64082, "r": 547.15619, "b": 627.85382, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "23", "bbox": {"l": 536.04633, "t": 618.64082, "r": 547.15619, "b": 627.85382, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 151.19717, "t": 631.1206999999999, "r": 173.32271, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "3.6.2", "bbox": {"l": 151.19717, "t": 631.1206999999999, "r": 173.32271, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 178.8541, "t": 631.1206999999999, "r": 530.56458, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": "Creating group profiles for the users and their roles . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.8541, "t": 631.1206999999999, "r": 530.56458, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 536.09601, "t": 631.1206999999999, "r": 547.15875, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 107, "text": "23", "bbox": {"l": 536.09601, "t": 631.1206999999999, "r": 547.15875, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 151.19717, "t": 643.66034, "r": 173.32227, "b": 652.87334, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 108, "text": "3.6.3", "bbox": {"l": 151.19717, "t": 643.66034, "r": 173.32227, "b": 652.87334, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 178.85353, "t": 643.66034, "r": 530.55695, "b": 652.87334, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 109, "text": "Demonstrating data access without RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.85353, "t": 643.66034, "r": 530.55695, "b": 652.87334, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 536.0882, "t": 643.66034, "r": 547.15076, "b": 652.87334, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 110, "text": "24", "bbox": {"l": 536.0882, "t": 643.66034, "r": 547.15076, "b": 652.87334, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 151.19717, "t": 656.14021, "r": 173.35289, "b": 665.35321, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 111, "text": "3.6.4", "bbox": {"l": 151.19717, "t": 656.14021, "r": 173.35289, "b": 665.35321, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 178.89182, "t": 656.14021, "r": 530.53412, "b": 665.35321, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 112, "text": "Defining and creating row permissions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.89182, "t": 656.14021, "r": 530.53412, "b": 665.35321, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 114, "label": "text", "bbox": {"l": 536.073, "t": 656.14021, "r": 547.15088, "b": 665.35321, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 113, "text": "25", "bbox": {"l": 536.073, "t": 656.14021, "r": 547.15088, "b": 665.35321, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 115, "label": "text", "bbox": {"l": 151.19717, "t": 668.62009, "r": 173.35289, "b": 677.83309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 114, "text": "3.6.5", "bbox": {"l": 151.19717, "t": 668.62009, "r": 173.35289, "b": 677.83309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 116, "label": "text", "bbox": {"l": 178.89182, "t": 668.62009, "r": 339.45105, "b": 677.83309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 115, "text": "Defining and creating column masks", "bbox": {"l": 178.89182, "t": 668.62009, "r": 339.45105, "b": 677.83309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 117, "label": "text", "bbox": {"l": 344.98996, "t": 668.62009, "r": 530.54413, "b": 677.83309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 116, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 344.98996, "t": 668.62009, "r": 530.54413, "b": 677.83309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 118, "label": "text", "bbox": {"l": 536.08301, "t": 668.62009, "r": 547.16089, "b": 677.83309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 117, "text": "26", "bbox": {"l": 536.08301, "t": 668.62009, "r": 547.16089, "b": 677.83309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 119, "label": "text", "bbox": {"l": 151.19717, "t": 681.15973, "r": 173.38359, "b": 690.37273, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 118, "text": "3.6.6", "bbox": {"l": 151.19717, "t": 681.15973, "r": 173.38359, "b": 690.37273, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 120, "label": "text", "bbox": {"l": 178.93019, "t": 681.15973, "r": 530.54102, "b": 690.37273, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 119, "text": "Activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.93019, "t": 681.15973, "r": 530.54102, "b": 690.37273, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 121, "label": "text", "bbox": {"l": 536.08765, "t": 681.15973, "r": 547.18085, "b": 690.37273, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 120, "text": "28", "bbox": {"l": 536.08765, "t": 681.15973, "r": 547.18085, "b": 690.37273, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 122, "label": "text", "bbox": {"l": 151.19717, "t": 693.63961, "r": 173.32332, "b": 702.852615, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 121, "text": "3.6.7", "bbox": {"l": 151.19717, "t": 693.63961, "r": 173.32332, "b": 702.852615, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 123, "label": "text", "bbox": {"l": 178.85486, "t": 693.63961, "r": 350.80011, "b": 702.852615, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 122, "text": "Demonstrating data access with RCAC", "bbox": {"l": 178.85486, "t": 693.63961, "r": 350.80011, "b": 702.852615, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 124, "label": "text", "bbox": {"l": 356.33163, "t": 693.63961, "r": 530.57507, "b": 702.852615, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 123, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 356.33163, "t": 693.63961, "r": 530.57507, "b": 702.852615, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 125, "label": "text", "bbox": {"l": 536.10663, "t": 693.63961, "r": 547.16968, "b": 702.852615, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 124, "text": "29", "bbox": {"l": 536.10663, "t": 693.63961, "r": 547.16968, "b": 702.852615, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 126, "label": "text", "bbox": {"l": 151.19717, "t": 706.119492, "r": 173.44592, "b": 715.332497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 125, "text": "3.6.8", "bbox": {"l": 151.19717, "t": 706.119492, "r": 173.44592, "b": 715.332497, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 127, "label": "text", "bbox": {"l": 179.00812, "t": 706.119492, "r": 530.43628, "b": 715.332497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 126, "text": "Demonstrating data access with a view and RCAC . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 179.00812, "t": 706.119492, "r": 530.43628, "b": 715.332497, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 128, "label": "text", "bbox": {"l": 535.99847, "t": 706.119492, "r": 547.12286, "b": 715.332497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 127, "text": "32", "bbox": {"l": 535.99847, "t": 706.119492, "r": 547.12286, "b": 715.332497, "coord_origin": "TOPLEFT"}}], "children": []}]}]}, "tablestructure": {"table_map": {"0": {"label": "document_index", "id": 0, "page_no": 1, "cluster": {"id": 0, "label": "document_index", "bbox": {"l": 136.1496124267578, "t": 132.0330352783203, "r": 547.5267944335938, "b": 715.6515502929688, "coord_origin": "TOPLEFT"}, "confidence": 0.9803681373596191, "cells": [{"id": 3, "text": "Notices", "bbox": {"l": 136.8, "t": 132.64862000000005, "r": 172.89404, "b": 141.86163, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vii", "bbox": {"l": 175.01952, "t": 132.64862000000005, "r": 547.18982, "b": 141.86163, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Trademarks", "bbox": {"l": 136.79901, "t": 145.12847999999997, "r": 189.86537, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 195.39685, "t": 145.12847999999997, "r": 530.05121, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "viii", "bbox": {"l": 535.5827, "t": 145.12847999999997, "r": 547.18286, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "DB2 for i Center of Excellence", "bbox": {"l": 136.79901, "t": 167.62811, "r": 279.39731, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ix", "bbox": {"l": 280.61942, "t": 167.62811, "r": 547.1908, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Preface", "bbox": {"l": 136.79901, "t": 190.12775, "r": 172.84424, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi", "bbox": {"l": 175.01852, "t": 190.12775, "r": 547.18286, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Authors . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi", "bbox": {"l": 136.79803, "t": 202.60760000000005, "r": 547.18085, "b": 211.82061999999996, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Now you can become a published author, too!", "bbox": {"l": 136.79803, "t": 215.14721999999995, "r": 339.18292, "b": 224.36023, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 344.71411, "t": 215.14721999999995, "r": 530.00812, "b": 224.36023, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "xiii", "bbox": {"l": 535.53925, "t": 215.14721999999995, "r": 547.13879, "b": 224.36023, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Comments welcome. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 136.79803, "t": 227.62707999999998, "r": 529.99506, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "xiii", "bbox": {"l": 535.5495, "t": 227.62707999999998, "r": 547.19788, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Stay connected to IBM Redbooks", "bbox": {"l": 136.79807, "t": 240.10693000000003, "r": 284.02866, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 289.54449, "t": 240.10693000000003, "r": 529.48242, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "xiv", "bbox": {"l": 534.99829, "t": 240.10693000000003, "r": 547.12115, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Chapter 1. Securing and protecting IBM DB2 data", "bbox": {"l": 136.79807, "t": 262.60657000000003, "r": 373.17566, "b": 271.81958, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 375.11798, "t": 262.60657000000003, "r": 536.09589, "b": 271.81958, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "1", "bbox": {"l": 541.64685, "t": 262.60657000000003, "r": 547.19781, "b": 271.81958, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "1.1", "bbox": {"l": 136.79808, "t": 274.60637999999994, "r": 150.88702, "b": 283.8194, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "Security fundamentals. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2", "bbox": {"l": 156.5226, "t": 274.60637999999994, "r": 549.84723, "b": 283.8194, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "1.2", "bbox": {"l": 136.79807, "t": 287.14606000000003, "r": 150.62746, "b": 296.35904, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Current state of IBM i security . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.15923, "t": 287.14606000000003, "r": 536.12933, "b": 296.35904, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "2", "bbox": {"l": 541.66113, "t": 287.14606000000003, "r": 547.19287, "b": 296.35904, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "1.3", "bbox": {"l": 136.79807, "t": 299.62595, "r": 150.84943, "b": 308.83893, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "DB2 for i security controls . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3", "bbox": {"l": 156.46996, "t": 299.62595, "r": 549.84723, "b": 308.83893, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "1.3.1", "bbox": {"l": 151.1972, "t": 312.1058300000001, "r": 173.38289, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Existing row and column control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.92932, "t": 312.1058300000001, "r": 536.05511, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "4", "bbox": {"l": 541.6015, "t": 312.1058300000001, "r": 547.14795, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "1.3.2", "bbox": {"l": 151.1972, "t": 324.64548, "r": 173.4189, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "New controls: Row and Column Access Control. . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.97432, "t": 324.64548, "r": 536.08008, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "5", "bbox": {"l": 541.6355, "t": 324.64548, "r": 547.19092, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "Chapter 2. Roles and separation of duties", "bbox": {"l": 136.79704, "t": 347.14511, "r": 336.82071, "b": 356.35809, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 338.99701, "t": 347.14511, "r": 536.09088, "b": 356.35809, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "7", "bbox": {"l": 541.64282, "t": 347.14511, "r": 547.19476, "b": 356.35809, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "2.1", "bbox": {"l": 136.79704, "t": 359.14493, "r": 150.644, "b": 368.35791, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Roles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.18277, "t": 359.14493, "r": 536.12714, "b": 368.35791, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "8", "bbox": {"l": 541.66589, "t": 359.14493, "r": 547.20471, "b": 368.35791, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "2.1.1", "bbox": {"l": 151.1972, "t": 371.62482, "r": 173.60995, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "DDM and DRDA application server access: QIBM_DB_DDMDRDA . . . . . . . . . . .", "bbox": {"l": 176.41154, "t": 371.62482, "r": 535.9527, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "8", "bbox": {"l": 541.55585, "t": 371.62482, "r": 547.15906, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "2.1.2", "bbox": {"l": 151.1972, "t": 384.10470999999995, "r": 173.41664, "b": 393.31769, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "Toolbox application server access: QIBM_DB_ZDA. . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.97151, "t": 384.10470999999995, "r": 536.04108, "b": 393.31769, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "8", "bbox": {"l": 541.59595, "t": 384.10470999999995, "r": 547.15082, "b": 393.31769, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "2.1.3", "bbox": {"l": 151.1972, "t": 396.64435, "r": 173.41859, "b": 405.85733, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Database Administrator function: QIBM_DB_SQLADM . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.97394, "t": 396.64435, "r": 536.07489, "b": 405.85733, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "9", "bbox": {"l": 541.63025, "t": 396.64435, "r": 547.18561, "b": 405.85733, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "2.1.4", "bbox": {"l": 151.1972, "t": 409.12424000000004, "r": 173.38629, "b": 418.33722, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Database Information function: QIBM_DB_SYSMON", "bbox": {"l": 178.93356, "t": 409.12424000000004, "r": 411.27048, "b": 418.33722, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": ". . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 416.81775, "t": 409.12424000000004, "r": 536.08411, "b": 418.33722, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "9", "bbox": {"l": 541.63135, "t": 409.12424000000004, "r": 547.17865, "b": 418.33722, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "2.1.5", "bbox": {"l": 151.1972, "t": 421.60413, "r": 173.44926, "b": 430.81711, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Security Administrator function: QIBM_DB_SECADM . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 179.01228, "t": 421.60413, "r": 536.03589, "b": 430.81711, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "9", "bbox": {"l": 541.59894, "t": 421.60413, "r": 547.16193, "b": 430.81711, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "2.1.6", "bbox": {"l": 151.1972, "t": 434.1437700000001, "r": 173.32208, "b": 443.35675, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Change Function Usage CL command . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.8533, "t": 434.1437700000001, "r": 530.57318, "b": 443.35675, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "10", "bbox": {"l": 536.10443, "t": 434.1437700000001, "r": 547.16687, "b": 443.35675, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "2.1.7", "bbox": {"l": 151.1972, "t": 446.62366, "r": 173.35822, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "Verifying function usage IDs for RCAC with the FUNCTION_USAGE view . . . . .", "bbox": {"l": 178.89848, "t": 446.62366, "r": 530.53522, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "10", "bbox": {"l": 536.0755, "t": 446.62366, "r": 547.15601, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "2.2", "bbox": {"l": 136.79704, "t": 459.10355, "r": 150.85457, "b": 468.31653, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "Separation of duties . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10", "bbox": {"l": 156.47758, "t": 459.10355, "r": 547.25659, "b": 468.31653, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "Chapter 3. Row and Column Access Control", "bbox": {"l": 136.79703, "t": 481.60318, "r": 348.68503, "b": 490.81616, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 350.09741, "t": 481.60318, "r": 530.53961, "b": 490.81616, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "13", "bbox": {"l": 536.09167, "t": 481.60318, "r": 547.1958, "b": 490.81616, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "3.1", "bbox": {"l": 136.79703, "t": 493.603, "r": 150.70105, "b": 502.81598, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Explanation of RCAC and the concept of access control . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.26266, "t": 493.603, "r": 530.4809, "b": 502.81598, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "14", "bbox": {"l": 536.04248, "t": 493.603, "r": 547.16571, "b": 502.81598, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "3.1.1", "bbox": {"l": 151.19719, "t": 506.14264, "r": 173.35429, "b": 515.35562, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "Row permission and column mask definitions", "bbox": {"l": 178.89357, "t": 506.14264, "r": 378.20786, "b": 515.35562, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 383.74713, "t": 506.14264, "r": 530.5379, "b": 515.35562, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "14", "bbox": {"l": 536.07721, "t": 506.14264, "r": 547.15576, "b": 515.35562, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "3.1.2", "bbox": {"l": 151.19719, "t": 518.62253, "r": 173.44292, "b": 527.83551, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "Enabling and activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 179.00435, "t": 518.62253, "r": 530.43475, "b": 527.83551, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "16", "bbox": {"l": 535.99622, "t": 518.62253, "r": 547.11908, "b": 527.83551, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "3.2", "bbox": {"l": 136.79703, "t": 531.1621700000001, "r": 150.64432, "b": 540.37517, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Special registers and built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.18323, "t": 531.1621700000001, "r": 530.52808, "b": 540.37517, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "18", "bbox": {"l": 536.06702, "t": 531.1621700000001, "r": 547.14484, "b": 540.37517, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "3.2.1", "bbox": {"l": 151.19719, "t": 543.64204, "r": 173.41321, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "Special registers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.96722, "t": 543.64204, "r": 530.49786, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "18", "bbox": {"l": 536.05188, "t": 543.64204, "r": 547.15991, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "3.2.2", "bbox": {"l": 151.19719, "t": 556.12192, "r": 173.35269, "b": 565.33492, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.89156, "t": 556.12192, "r": 530.56024, "b": 565.33492, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "19", "bbox": {"l": 536.09912, "t": 556.12192, "r": 547.17688, "b": 565.33492, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "3.3", "bbox": {"l": 136.79703, "t": 568.66156, "r": 150.62514, "b": 577.87456, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "VERIFY_GROUP_FOR_USER function . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.15639, "t": 568.66156, "r": 530.53027, "b": 577.87456, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "20", "bbox": {"l": 536.06152, "t": 568.66156, "r": 547.12402, "b": 577.87456, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "3.4", "bbox": {"l": 136.79703, "t": 581.14143, "r": 150.63004, "b": 590.35443, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "Establishing and controlling accessibility by using the RCAC rule text . . . . . . . . . . . . .", "bbox": {"l": 156.16325, "t": 581.14143, "r": 530.62994, "b": 590.35443, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "21", "bbox": {"l": 536.16315, "t": 581.14143, "r": 547.22955, "b": 590.35443, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "3.5", "bbox": {"l": 136.79701, "t": 593.62131, "r": 150.64413, "b": 602.8343, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "SELECT, INSERT, and UPDATE behavior with RCAC", "bbox": {"l": 156.18298, "t": 593.62131, "r": 394.7818, "b": 602.8343, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": ". . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 400.32065, "t": 593.62131, "r": 530.48358, "b": 602.8343, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "22", "bbox": {"l": 536.0224, "t": 593.62131, "r": 547.1001, "b": 602.8343, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "3.6", "bbox": {"l": 136.79701, "t": 606.16095, "r": 150.6642, "b": 615.37395, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "Human resources example . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.21107, "t": 606.16095, "r": 530.56512, "b": 615.37395, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "22", "bbox": {"l": 536.112, "t": 606.16095, "r": 547.20575, "b": 615.37395, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "3.6.1", "bbox": {"l": 151.19717, "t": 618.64082, "r": 173.41692, "b": 627.85382, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "Assigning the QIBM_DB_SECADM function ID to the consultants. . . . . . . . . . . .", "bbox": {"l": 178.97185, "t": 618.64082, "r": 530.49139, "b": 627.85382, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "23", "bbox": {"l": 536.04633, "t": 618.64082, "r": 547.15619, "b": 627.85382, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "3.6.2", "bbox": {"l": 151.19717, "t": 631.1206999999999, "r": 173.32271, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "Creating group profiles for the users and their roles . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.8541, "t": 631.1206999999999, "r": 530.56458, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "23", "bbox": {"l": 536.09601, "t": 631.1206999999999, "r": 547.15875, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "3.6.3", "bbox": {"l": 151.19717, "t": 643.66034, "r": 173.32227, "b": 652.87334, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "Demonstrating data access without RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.85353, "t": 643.66034, "r": 530.55695, "b": 652.87334, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "24", "bbox": {"l": 536.0882, "t": 643.66034, "r": 547.15076, "b": 652.87334, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "3.6.4", "bbox": {"l": 151.19717, "t": 656.14021, "r": 173.35289, "b": 665.35321, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "Defining and creating row permissions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.89182, "t": 656.14021, "r": 530.53412, "b": 665.35321, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "25", "bbox": {"l": 536.073, "t": 656.14021, "r": 547.15088, "b": 665.35321, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "3.6.5", "bbox": {"l": 151.19717, "t": 668.62009, "r": 173.35289, "b": 677.83309, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "Defining and creating column masks", "bbox": {"l": 178.89182, "t": 668.62009, "r": 339.45105, "b": 677.83309, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 344.98996, "t": 668.62009, "r": 530.54413, "b": 677.83309, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "26", "bbox": {"l": 536.08301, "t": 668.62009, "r": 547.16089, "b": 677.83309, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "3.6.6", "bbox": {"l": 151.19717, "t": 681.15973, "r": 173.38359, "b": 690.37273, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "Activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.93019, "t": 681.15973, "r": 530.54102, "b": 690.37273, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "28", "bbox": {"l": 536.08765, "t": 681.15973, "r": 547.18085, "b": 690.37273, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "3.6.7", "bbox": {"l": 151.19717, "t": 693.63961, "r": 173.32332, "b": 702.852615, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Demonstrating data access with RCAC", "bbox": {"l": 178.85486, "t": 693.63961, "r": 350.80011, "b": 702.852615, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 356.33163, "t": 693.63961, "r": 530.57507, "b": 702.852615, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "29", "bbox": {"l": 536.10663, "t": 693.63961, "r": 547.16968, "b": 702.852615, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "3.6.8", "bbox": {"l": 151.19717, "t": 706.119492, "r": 173.44592, "b": 715.332497, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "Demonstrating data access with a view and RCAC . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 179.00812, "t": 706.119492, "r": 530.43628, "b": 715.332497, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "32", "bbox": {"l": 535.99847, "t": 706.119492, "r": 547.12286, "b": 715.332497, "coord_origin": "TOPLEFT"}}], "children": [{"id": 4, "label": "text", "bbox": {"l": 136.8, "t": 132.64862000000005, "r": 172.89404, "b": 141.86163, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 3, "text": "Notices", "bbox": {"l": 136.8, "t": 132.64862000000005, "r": 172.89404, "b": 141.86163, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "text", "bbox": {"l": 175.01952, "t": 132.64862000000005, "r": 547.18982, "b": 141.86163, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 4, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vii", "bbox": {"l": 175.01952, "t": 132.64862000000005, "r": 547.18982, "b": 141.86163, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "text", "bbox": {"l": 136.79901, "t": 145.12847999999997, "r": 189.86537, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 5, "text": "Trademarks", "bbox": {"l": 136.79901, "t": 145.12847999999997, "r": 189.86537, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "text", "bbox": {"l": 195.39685, "t": 145.12847999999997, "r": 530.05121, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 195.39685, "t": 145.12847999999997, "r": 530.05121, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "text", "bbox": {"l": 535.5827, "t": 145.12847999999997, "r": 547.18286, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "viii", "bbox": {"l": 535.5827, "t": 145.12847999999997, "r": 547.18286, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 136.79901, "t": 167.62811, "r": 279.39731, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "DB2 for i Center of Excellence", "bbox": {"l": 136.79901, "t": 167.62811, "r": 279.39731, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "text", "bbox": {"l": 280.61942, "t": 167.62811, "r": 547.1908, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ix", "bbox": {"l": 280.61942, "t": 167.62811, "r": 547.1908, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 136.79901, "t": 190.12775, "r": 172.84424, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "Preface", "bbox": {"l": 136.79901, "t": 190.12775, "r": 172.84424, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 175.01852, "t": 190.12775, "r": 547.18286, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi", "bbox": {"l": 175.01852, "t": 190.12775, "r": 547.18286, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 136.79803, "t": 202.60760000000005, "r": 547.18085, "b": 211.82061999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "Authors . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi", "bbox": {"l": 136.79803, "t": 202.60760000000005, "r": 547.18085, "b": 211.82061999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 136.79803, "t": 215.14721999999995, "r": 339.18292, "b": 224.36023, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "Now you can become a published author, too!", "bbox": {"l": 136.79803, "t": 215.14721999999995, "r": 339.18292, "b": 224.36023, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 344.71411, "t": 215.14721999999995, "r": 530.00812, "b": 224.36023, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 344.71411, "t": 215.14721999999995, "r": 530.00812, "b": 224.36023, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 535.53925, "t": 215.14721999999995, "r": 547.13879, "b": 224.36023, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "xiii", "bbox": {"l": 535.53925, "t": 215.14721999999995, "r": 547.13879, "b": 224.36023, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 136.79803, "t": 227.62707999999998, "r": 529.99506, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "Comments welcome. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 136.79803, "t": 227.62707999999998, "r": 529.99506, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 535.5495, "t": 227.62707999999998, "r": 547.19788, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "xiii", "bbox": {"l": 535.5495, "t": 227.62707999999998, "r": 547.19788, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 136.79807, "t": 240.10693000000003, "r": 284.02866, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "Stay connected to IBM Redbooks", "bbox": {"l": 136.79807, "t": 240.10693000000003, "r": 284.02866, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 289.54449, "t": 240.10693000000003, "r": 529.48242, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 289.54449, "t": 240.10693000000003, "r": 529.48242, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 534.99829, "t": 240.10693000000003, "r": 547.12115, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "xiv", "bbox": {"l": 534.99829, "t": 240.10693000000003, "r": 547.12115, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 136.79807, "t": 262.60657000000003, "r": 373.17566, "b": 271.81958, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "Chapter 1. Securing and protecting IBM DB2 data", "bbox": {"l": 136.79807, "t": 262.60657000000003, "r": 373.17566, "b": 271.81958, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 375.11798, "t": 262.60657000000003, "r": 536.09589, "b": 271.81958, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 375.11798, "t": 262.60657000000003, "r": 536.09589, "b": 271.81958, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 541.64685, "t": 262.60657000000003, "r": 547.19781, "b": 271.81958, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "1", "bbox": {"l": 541.64685, "t": 262.60657000000003, "r": 547.19781, "b": 271.81958, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 136.79808, "t": 274.60637999999994, "r": 150.88702, "b": 283.8194, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "1.1", "bbox": {"l": 136.79808, "t": 274.60637999999994, "r": 150.88702, "b": 283.8194, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 156.5226, "t": 274.60637999999994, "r": 549.84723, "b": 283.8194, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "Security fundamentals. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2", "bbox": {"l": 156.5226, "t": 274.60637999999994, "r": 549.84723, "b": 283.8194, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 136.79807, "t": 287.14606000000003, "r": 150.62746, "b": 296.35904, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "1.2", "bbox": {"l": 136.79807, "t": 287.14606000000003, "r": 150.62746, "b": 296.35904, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 156.15923, "t": 287.14606000000003, "r": 536.12933, "b": 296.35904, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "Current state of IBM i security . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.15923, "t": 287.14606000000003, "r": 536.12933, "b": 296.35904, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 541.66113, "t": 287.14606000000003, "r": 547.19287, "b": 296.35904, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "2", "bbox": {"l": 541.66113, "t": 287.14606000000003, "r": 547.19287, "b": 296.35904, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 136.79807, "t": 299.62595, "r": 150.84943, "b": 308.83893, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "1.3", "bbox": {"l": 136.79807, "t": 299.62595, "r": 150.84943, "b": 308.83893, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 156.46996, "t": 299.62595, "r": 549.84723, "b": 308.83893, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "DB2 for i security controls . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3", "bbox": {"l": 156.46996, "t": 299.62595, "r": 549.84723, "b": 308.83893, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 151.1972, "t": 312.1058300000001, "r": 173.38289, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "1.3.1", "bbox": {"l": 151.1972, "t": 312.1058300000001, "r": 173.38289, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 178.92932, "t": 312.1058300000001, "r": 536.05511, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "Existing row and column control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.92932, "t": 312.1058300000001, "r": 536.05511, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 541.6015, "t": 312.1058300000001, "r": 547.14795, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "4", "bbox": {"l": 541.6015, "t": 312.1058300000001, "r": 547.14795, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 151.1972, "t": 324.64548, "r": 173.4189, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "1.3.2", "bbox": {"l": 151.1972, "t": 324.64548, "r": 173.4189, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 178.97432, "t": 324.64548, "r": 536.08008, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "New controls: Row and Column Access Control. . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.97432, "t": 324.64548, "r": 536.08008, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 541.6355, "t": 324.64548, "r": 547.19092, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "5", "bbox": {"l": 541.6355, "t": 324.64548, "r": 547.19092, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 136.79704, "t": 347.14511, "r": 336.82071, "b": 356.35809, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "Chapter 2. Roles and separation of duties", "bbox": {"l": 136.79704, "t": 347.14511, "r": 336.82071, "b": 356.35809, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 338.99701, "t": 347.14511, "r": 536.09088, "b": 356.35809, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 338.99701, "t": 347.14511, "r": 536.09088, "b": 356.35809, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 541.64282, "t": 347.14511, "r": 547.19476, "b": 356.35809, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "7", "bbox": {"l": 541.64282, "t": 347.14511, "r": 547.19476, "b": 356.35809, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 136.79704, "t": 359.14493, "r": 150.644, "b": 368.35791, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "2.1", "bbox": {"l": 136.79704, "t": 359.14493, "r": 150.644, "b": 368.35791, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 156.18277, "t": 359.14493, "r": 536.12714, "b": 368.35791, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "Roles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.18277, "t": 359.14493, "r": 536.12714, "b": 368.35791, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 541.66589, "t": 359.14493, "r": 547.20471, "b": 368.35791, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "8", "bbox": {"l": 541.66589, "t": 359.14493, "r": 547.20471, "b": 368.35791, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 151.1972, "t": 371.62482, "r": 173.60995, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "2.1.1", "bbox": {"l": 151.1972, "t": 371.62482, "r": 173.60995, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 176.41154, "t": 371.62482, "r": 535.9527, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "DDM and DRDA application server access: QIBM_DB_DDMDRDA . . . . . . . . . . .", "bbox": {"l": 176.41154, "t": 371.62482, "r": 535.9527, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 541.55585, "t": 371.62482, "r": 547.15906, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "8", "bbox": {"l": 541.55585, "t": 371.62482, "r": 547.15906, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 151.1972, "t": 384.10470999999995, "r": 173.41664, "b": 393.31769, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "2.1.2", "bbox": {"l": 151.1972, "t": 384.10470999999995, "r": 173.41664, "b": 393.31769, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 178.97151, "t": 384.10470999999995, "r": 536.04108, "b": 393.31769, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "Toolbox application server access: QIBM_DB_ZDA. . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.97151, "t": 384.10470999999995, "r": 536.04108, "b": 393.31769, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 541.59595, "t": 384.10470999999995, "r": 547.15082, "b": 393.31769, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "8", "bbox": {"l": 541.59595, "t": 384.10470999999995, "r": 547.15082, "b": 393.31769, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 151.1972, "t": 396.64435, "r": 173.41859, "b": 405.85733, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "2.1.3", "bbox": {"l": 151.1972, "t": 396.64435, "r": 173.41859, "b": 405.85733, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 178.97394, "t": 396.64435, "r": 536.07489, "b": 405.85733, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "Database Administrator function: QIBM_DB_SQLADM . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.97394, "t": 396.64435, "r": 536.07489, "b": 405.85733, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 541.63025, "t": 396.64435, "r": 547.18561, "b": 405.85733, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "9", "bbox": {"l": 541.63025, "t": 396.64435, "r": 547.18561, "b": 405.85733, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 151.1972, "t": 409.12424000000004, "r": 173.38629, "b": 418.33722, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "2.1.4", "bbox": {"l": 151.1972, "t": 409.12424000000004, "r": 173.38629, "b": 418.33722, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 178.93356, "t": 409.12424000000004, "r": 411.27048, "b": 418.33722, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "Database Information function: QIBM_DB_SYSMON", "bbox": {"l": 178.93356, "t": 409.12424000000004, "r": 411.27048, "b": 418.33722, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 416.81775, "t": 409.12424000000004, "r": 536.08411, "b": 418.33722, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": ". . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 416.81775, "t": 409.12424000000004, "r": 536.08411, "b": 418.33722, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 541.63135, "t": 409.12424000000004, "r": 547.17865, "b": 418.33722, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "9", "bbox": {"l": 541.63135, "t": 409.12424000000004, "r": 547.17865, "b": 418.33722, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 151.1972, "t": 421.60413, "r": 173.44926, "b": 430.81711, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "2.1.5", "bbox": {"l": 151.1972, "t": 421.60413, "r": 173.44926, "b": 430.81711, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 179.01228, "t": 421.60413, "r": 536.03589, "b": 430.81711, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "Security Administrator function: QIBM_DB_SECADM . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 179.01228, "t": 421.60413, "r": 536.03589, "b": 430.81711, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 541.59894, "t": 421.60413, "r": 547.16193, "b": 430.81711, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "9", "bbox": {"l": 541.59894, "t": 421.60413, "r": 547.16193, "b": 430.81711, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 151.1972, "t": 434.1437700000001, "r": 173.32208, "b": 443.35675, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "2.1.6", "bbox": {"l": 151.1972, "t": 434.1437700000001, "r": 173.32208, "b": 443.35675, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 178.8533, "t": 434.1437700000001, "r": 530.57318, "b": 443.35675, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "Change Function Usage CL command . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.8533, "t": 434.1437700000001, "r": 530.57318, "b": 443.35675, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 536.10443, "t": 434.1437700000001, "r": 547.16687, "b": 443.35675, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "10", "bbox": {"l": 536.10443, "t": 434.1437700000001, "r": 547.16687, "b": 443.35675, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 151.1972, "t": 446.62366, "r": 173.35822, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "2.1.7", "bbox": {"l": 151.1972, "t": 446.62366, "r": 173.35822, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 178.89848, "t": 446.62366, "r": 530.53522, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "Verifying function usage IDs for RCAC with the FUNCTION_USAGE view . . . . .", "bbox": {"l": 178.89848, "t": 446.62366, "r": 530.53522, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 536.0755, "t": 446.62366, "r": 547.15601, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "10", "bbox": {"l": 536.0755, "t": 446.62366, "r": 547.15601, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 136.79704, "t": 459.10355, "r": 150.85457, "b": 468.31653, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "2.2", "bbox": {"l": 136.79704, "t": 459.10355, "r": 150.85457, "b": 468.31653, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 156.47758, "t": 459.10355, "r": 547.25659, "b": 468.31653, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "Separation of duties . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10", "bbox": {"l": 156.47758, "t": 459.10355, "r": 547.25659, "b": 468.31653, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 136.79703, "t": 481.60318, "r": 348.68503, "b": 490.81616, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "Chapter 3. Row and Column Access Control", "bbox": {"l": 136.79703, "t": 481.60318, "r": 348.68503, "b": 490.81616, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 350.09741, "t": 481.60318, "r": 530.53961, "b": 490.81616, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 350.09741, "t": 481.60318, "r": 530.53961, "b": 490.81616, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 536.09167, "t": 481.60318, "r": 547.1958, "b": 490.81616, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "13", "bbox": {"l": 536.09167, "t": 481.60318, "r": 547.1958, "b": 490.81616, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 136.79703, "t": 493.603, "r": 150.70105, "b": 502.81598, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "3.1", "bbox": {"l": 136.79703, "t": 493.603, "r": 150.70105, "b": 502.81598, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 156.26266, "t": 493.603, "r": 530.4809, "b": 502.81598, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "Explanation of RCAC and the concept of access control . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.26266, "t": 493.603, "r": 530.4809, "b": 502.81598, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 536.04248, "t": 493.603, "r": 547.16571, "b": 502.81598, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "14", "bbox": {"l": 536.04248, "t": 493.603, "r": 547.16571, "b": 502.81598, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 151.19719, "t": 506.14264, "r": 173.35429, "b": 515.35562, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "3.1.1", "bbox": {"l": 151.19719, "t": 506.14264, "r": 173.35429, "b": 515.35562, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 178.89357, "t": 506.14264, "r": 378.20786, "b": 515.35562, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "Row permission and column mask definitions", "bbox": {"l": 178.89357, "t": 506.14264, "r": 378.20786, "b": 515.35562, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 383.74713, "t": 506.14264, "r": 530.5379, "b": 515.35562, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 383.74713, "t": 506.14264, "r": 530.5379, "b": 515.35562, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 536.07721, "t": 506.14264, "r": 547.15576, "b": 515.35562, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "14", "bbox": {"l": 536.07721, "t": 506.14264, "r": 547.15576, "b": 515.35562, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 151.19719, "t": 518.62253, "r": 173.44292, "b": 527.83551, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "3.1.2", "bbox": {"l": 151.19719, "t": 518.62253, "r": 173.44292, "b": 527.83551, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 179.00435, "t": 518.62253, "r": 530.43475, "b": 527.83551, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "Enabling and activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 179.00435, "t": 518.62253, "r": 530.43475, "b": 527.83551, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 535.99622, "t": 518.62253, "r": 547.11908, "b": 527.83551, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "16", "bbox": {"l": 535.99622, "t": 518.62253, "r": 547.11908, "b": 527.83551, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 136.79703, "t": 531.1621700000001, "r": 150.64432, "b": 540.37517, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "3.2", "bbox": {"l": 136.79703, "t": 531.1621700000001, "r": 150.64432, "b": 540.37517, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 156.18323, "t": 531.1621700000001, "r": 530.52808, "b": 540.37517, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "Special registers and built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.18323, "t": 531.1621700000001, "r": 530.52808, "b": 540.37517, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 536.06702, "t": 531.1621700000001, "r": 547.14484, "b": 540.37517, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "18", "bbox": {"l": 536.06702, "t": 531.1621700000001, "r": 547.14484, "b": 540.37517, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 151.19719, "t": 543.64204, "r": 173.41321, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "3.2.1", "bbox": {"l": 151.19719, "t": 543.64204, "r": 173.41321, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 178.96722, "t": 543.64204, "r": 530.49786, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "Special registers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.96722, "t": 543.64204, "r": 530.49786, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 536.05188, "t": 543.64204, "r": 547.15991, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "18", "bbox": {"l": 536.05188, "t": 543.64204, "r": 547.15991, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 151.19719, "t": 556.12192, "r": 173.35269, "b": 565.33492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "3.2.2", "bbox": {"l": 151.19719, "t": 556.12192, "r": 173.35269, "b": 565.33492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 178.89156, "t": 556.12192, "r": 530.56024, "b": 565.33492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "Built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.89156, "t": 556.12192, "r": 530.56024, "b": 565.33492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 536.09912, "t": 556.12192, "r": 547.17688, "b": 565.33492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "19", "bbox": {"l": 536.09912, "t": 556.12192, "r": 547.17688, "b": 565.33492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 136.79703, "t": 568.66156, "r": 150.62514, "b": 577.87456, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "3.3", "bbox": {"l": 136.79703, "t": 568.66156, "r": 150.62514, "b": 577.87456, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 156.15639, "t": 568.66156, "r": 530.53027, "b": 577.87456, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "VERIFY_GROUP_FOR_USER function . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.15639, "t": 568.66156, "r": 530.53027, "b": 577.87456, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 536.06152, "t": 568.66156, "r": 547.12402, "b": 577.87456, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "20", "bbox": {"l": 536.06152, "t": 568.66156, "r": 547.12402, "b": 577.87456, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 136.79703, "t": 581.14143, "r": 150.63004, "b": 590.35443, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "3.4", "bbox": {"l": 136.79703, "t": 581.14143, "r": 150.63004, "b": 590.35443, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 156.16325, "t": 581.14143, "r": 530.62994, "b": 590.35443, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "Establishing and controlling accessibility by using the RCAC rule text . . . . . . . . . . . . .", "bbox": {"l": 156.16325, "t": 581.14143, "r": 530.62994, "b": 590.35443, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 536.16315, "t": 581.14143, "r": 547.22955, "b": 590.35443, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "21", "bbox": {"l": 536.16315, "t": 581.14143, "r": 547.22955, "b": 590.35443, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 136.79701, "t": 593.62131, "r": 150.64413, "b": 602.8343, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "3.5", "bbox": {"l": 136.79701, "t": 593.62131, "r": 150.64413, "b": 602.8343, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 156.18298, "t": 593.62131, "r": 394.7818, "b": 602.8343, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "SELECT, INSERT, and UPDATE behavior with RCAC", "bbox": {"l": 156.18298, "t": 593.62131, "r": 394.7818, "b": 602.8343, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 400.32065, "t": 593.62131, "r": 530.48358, "b": 602.8343, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": ". . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 400.32065, "t": 593.62131, "r": 530.48358, "b": 602.8343, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 536.0224, "t": 593.62131, "r": 547.1001, "b": 602.8343, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "22", "bbox": {"l": 536.0224, "t": 593.62131, "r": 547.1001, "b": 602.8343, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 136.79701, "t": 606.16095, "r": 150.6642, "b": 615.37395, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "3.6", "bbox": {"l": 136.79701, "t": 606.16095, "r": 150.6642, "b": 615.37395, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 156.21107, "t": 606.16095, "r": 530.56512, "b": 615.37395, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "Human resources example . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.21107, "t": 606.16095, "r": 530.56512, "b": 615.37395, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 536.112, "t": 606.16095, "r": 547.20575, "b": 615.37395, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "22", "bbox": {"l": 536.112, "t": 606.16095, "r": 547.20575, "b": 615.37395, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 151.19717, "t": 618.64082, "r": 173.41692, "b": 627.85382, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "3.6.1", "bbox": {"l": 151.19717, "t": 618.64082, "r": 173.41692, "b": 627.85382, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 178.97185, "t": 618.64082, "r": 530.49139, "b": 627.85382, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": "Assigning the QIBM_DB_SECADM function ID to the consultants. . . . . . . . . . . .", "bbox": {"l": 178.97185, "t": 618.64082, "r": 530.49139, "b": 627.85382, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 536.04633, "t": 618.64082, "r": 547.15619, "b": 627.85382, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "23", "bbox": {"l": 536.04633, "t": 618.64082, "r": 547.15619, "b": 627.85382, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 151.19717, "t": 631.1206999999999, "r": 173.32271, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "3.6.2", "bbox": {"l": 151.19717, "t": 631.1206999999999, "r": 173.32271, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 178.8541, "t": 631.1206999999999, "r": 530.56458, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": "Creating group profiles for the users and their roles . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.8541, "t": 631.1206999999999, "r": 530.56458, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 536.09601, "t": 631.1206999999999, "r": 547.15875, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 107, "text": "23", "bbox": {"l": 536.09601, "t": 631.1206999999999, "r": 547.15875, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 151.19717, "t": 643.66034, "r": 173.32227, "b": 652.87334, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 108, "text": "3.6.3", "bbox": {"l": 151.19717, "t": 643.66034, "r": 173.32227, "b": 652.87334, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 178.85353, "t": 643.66034, "r": 530.55695, "b": 652.87334, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 109, "text": "Demonstrating data access without RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.85353, "t": 643.66034, "r": 530.55695, "b": 652.87334, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 536.0882, "t": 643.66034, "r": 547.15076, "b": 652.87334, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 110, "text": "24", "bbox": {"l": 536.0882, "t": 643.66034, "r": 547.15076, "b": 652.87334, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 151.19717, "t": 656.14021, "r": 173.35289, "b": 665.35321, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 111, "text": "3.6.4", "bbox": {"l": 151.19717, "t": 656.14021, "r": 173.35289, "b": 665.35321, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 178.89182, "t": 656.14021, "r": 530.53412, "b": 665.35321, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 112, "text": "Defining and creating row permissions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.89182, "t": 656.14021, "r": 530.53412, "b": 665.35321, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 114, "label": "text", "bbox": {"l": 536.073, "t": 656.14021, "r": 547.15088, "b": 665.35321, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 113, "text": "25", "bbox": {"l": 536.073, "t": 656.14021, "r": 547.15088, "b": 665.35321, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 115, "label": "text", "bbox": {"l": 151.19717, "t": 668.62009, "r": 173.35289, "b": 677.83309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 114, "text": "3.6.5", "bbox": {"l": 151.19717, "t": 668.62009, "r": 173.35289, "b": 677.83309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 116, "label": "text", "bbox": {"l": 178.89182, "t": 668.62009, "r": 339.45105, "b": 677.83309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 115, "text": "Defining and creating column masks", "bbox": {"l": 178.89182, "t": 668.62009, "r": 339.45105, "b": 677.83309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 117, "label": "text", "bbox": {"l": 344.98996, "t": 668.62009, "r": 530.54413, "b": 677.83309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 116, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 344.98996, "t": 668.62009, "r": 530.54413, "b": 677.83309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 118, "label": "text", "bbox": {"l": 536.08301, "t": 668.62009, "r": 547.16089, "b": 677.83309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 117, "text": "26", "bbox": {"l": 536.08301, "t": 668.62009, "r": 547.16089, "b": 677.83309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 119, "label": "text", "bbox": {"l": 151.19717, "t": 681.15973, "r": 173.38359, "b": 690.37273, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 118, "text": "3.6.6", "bbox": {"l": 151.19717, "t": 681.15973, "r": 173.38359, "b": 690.37273, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 120, "label": "text", "bbox": {"l": 178.93019, "t": 681.15973, "r": 530.54102, "b": 690.37273, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 119, "text": "Activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.93019, "t": 681.15973, "r": 530.54102, "b": 690.37273, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 121, "label": "text", "bbox": {"l": 536.08765, "t": 681.15973, "r": 547.18085, "b": 690.37273, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 120, "text": "28", "bbox": {"l": 536.08765, "t": 681.15973, "r": 547.18085, "b": 690.37273, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 122, "label": "text", "bbox": {"l": 151.19717, "t": 693.63961, "r": 173.32332, "b": 702.852615, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 121, "text": "3.6.7", "bbox": {"l": 151.19717, "t": 693.63961, "r": 173.32332, "b": 702.852615, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 123, "label": "text", "bbox": {"l": 178.85486, "t": 693.63961, "r": 350.80011, "b": 702.852615, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 122, "text": "Demonstrating data access with RCAC", "bbox": {"l": 178.85486, "t": 693.63961, "r": 350.80011, "b": 702.852615, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 124, "label": "text", "bbox": {"l": 356.33163, "t": 693.63961, "r": 530.57507, "b": 702.852615, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 123, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 356.33163, "t": 693.63961, "r": 530.57507, "b": 702.852615, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 125, "label": "text", "bbox": {"l": 536.10663, "t": 693.63961, "r": 547.16968, "b": 702.852615, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 124, "text": "29", "bbox": {"l": 536.10663, "t": 693.63961, "r": 547.16968, "b": 702.852615, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 126, "label": "text", "bbox": {"l": 151.19717, "t": 706.119492, "r": 173.44592, "b": 715.332497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 125, "text": "3.6.8", "bbox": {"l": 151.19717, "t": 706.119492, "r": 173.44592, "b": 715.332497, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 127, "label": "text", "bbox": {"l": 179.00812, "t": 706.119492, "r": 530.43628, "b": 715.332497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 126, "text": "Demonstrating data access with a view and RCAC . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 179.00812, "t": 706.119492, "r": 530.43628, "b": 715.332497, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 128, "label": "text", "bbox": {"l": 535.99847, "t": 706.119492, "r": 547.12286, "b": 715.332497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 127, "text": "32", "bbox": {"l": 535.99847, "t": 706.119492, "r": 547.12286, "b": 715.332497, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 43, "num_cols": 2, "table_cells": [{"bbox": {"l": 136.8, "t": 132.64862000000005, "r": 172.89404, "b": 141.86163, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Notices", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 175.01952, "t": 132.64862000000005, "r": 547.18982, "b": 141.86163, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vii", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79901, "t": 145.12847999999997, "r": 189.86537, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Trademarks", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 195.39685, "t": 145.12847999999997, "r": 547.18286, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . viii", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79901, "t": 167.62811, "r": 279.39731, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "DB2 for i Center of Excellence", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.61942, "t": 167.62811, "r": 547.1908, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ix", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79901, "t": 190.12775, "r": 172.84424, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Preface", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 175.01852, "t": 190.12775, "r": 547.18286, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79803, "t": 202.60760000000005, "r": 547.18085, "b": 211.82061999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Authors . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79803, "t": 215.14721999999995, "r": 339.18292, "b": 224.36023, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Now you can become a published author, too!", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 344.71411, "t": 215.14721999999995, "r": 547.13879, "b": 224.36023, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xiii", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79803, "t": 227.62707999999998, "r": 529.99506, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Comments welcome. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 535.5495, "t": 227.62707999999998, "r": 547.19788, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "xiii", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79807, "t": 240.10693000000003, "r": 284.02866, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Stay connected to IBM Redbooks", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.54449, "t": 240.10693000000003, "r": 547.12115, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xiv", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79807, "t": 262.60657000000003, "r": 536.09589, "b": 271.81958, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Chapter 1. Securing and protecting IBM DB2 data  . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.64685, "t": 262.60657000000003, "r": 547.19781, "b": 271.81958, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79808, "t": 274.60637999999994, "r": 549.84723, "b": 283.8194, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "1.1 Security fundamentals. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79807, "t": 287.14606000000003, "r": 536.12933, "b": 296.35904, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "1.2 Current state of IBM i security . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.66113, "t": 287.14606000000003, "r": 547.19287, "b": 296.35904, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79807, "t": 299.62595, "r": 549.84723, "b": 308.83893, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "1.3 DB2 for i security controls . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 312.1058300000001, "r": 536.05511, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "1.3.1 Existing row and column control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.6015, "t": 312.1058300000001, "r": 547.14795, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 324.64548, "r": 536.08008, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "1.3.2 New controls: Row and Column Access Control. . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.6355, "t": 324.64548, "r": 547.19092, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79704, "t": 347.14511, "r": 536.09088, "b": 356.35809, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 14, "end_row_offset_idx": 15, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Chapter 2. Roles and separation of duties . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.64282, "t": 347.14511, "r": 547.19476, "b": 356.35809, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 14, "end_row_offset_idx": 15, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79704, "t": 359.14493, "r": 536.12714, "b": 368.35791, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 15, "end_row_offset_idx": 16, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1 Roles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.66589, "t": 359.14493, "r": 547.20471, "b": 368.35791, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 15, "end_row_offset_idx": 16, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 371.62482, "r": 535.9527, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 16, "end_row_offset_idx": 17, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.1 DDM and DRDA application server access: QIBM_DB_DDMDRDA . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.55585, "t": 371.62482, "r": 547.15906, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 16, "end_row_offset_idx": 17, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 384.10470999999995, "r": 536.04108, "b": 393.31769, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 17, "end_row_offset_idx": 18, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.2 Toolbox application server access: QIBM_DB_ZDA. . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.59595, "t": 384.10470999999995, "r": 547.15082, "b": 393.31769, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 17, "end_row_offset_idx": 18, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 396.64435, "r": 536.07489, "b": 405.85733, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 18, "end_row_offset_idx": 19, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.3 Database Administrator function: QIBM_DB_SQLADM . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.63025, "t": 396.64435, "r": 547.18561, "b": 405.85733, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 18, "end_row_offset_idx": 19, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 409.12424000000004, "r": 411.27048, "b": 418.33722, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 19, "end_row_offset_idx": 20, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.4 Database Information function: QIBM_DB_SYSMON", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 416.81775, "t": 409.12424000000004, "r": 547.17865, "b": 418.33722, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 19, "end_row_offset_idx": 20, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . 9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 421.60413, "r": 536.03589, "b": 430.81711, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 20, "end_row_offset_idx": 21, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.5 Security Administrator function: QIBM_DB_SECADM . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.59894, "t": 421.60413, "r": 547.16193, "b": 430.81711, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 20, "end_row_offset_idx": 21, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 434.1437700000001, "r": 530.57318, "b": 443.35675, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 21, "end_row_offset_idx": 22, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.6 Change Function Usage CL command . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.10443, "t": 434.1437700000001, "r": 547.16687, "b": 443.35675, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 21, "end_row_offset_idx": 22, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "10", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 446.62366, "r": 530.53522, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 22, "end_row_offset_idx": 23, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.7 Verifying function usage IDs for RCAC with the FUNCTION_USAGE view . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.0755, "t": 446.62366, "r": 547.15601, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 22, "end_row_offset_idx": 23, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "10", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79704, "t": 459.10355, "r": 547.25659, "b": 468.31653, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 23, "end_row_offset_idx": 24, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.2 Separation of duties . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79703, "t": 481.60318, "r": 530.53961, "b": 490.81616, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 24, "end_row_offset_idx": 25, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Chapter 3. Row and Column Access Control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.09167, "t": 481.60318, "r": 547.1958, "b": 490.81616, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 24, "end_row_offset_idx": 25, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "13", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79703, "t": 493.603, "r": 530.4809, "b": 502.81598, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 25, "end_row_offset_idx": 26, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.1 Explanation of RCAC and the concept of access control . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.04248, "t": 493.603, "r": 547.16571, "b": 502.81598, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 25, "end_row_offset_idx": 26, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "14", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19719, "t": 506.14264, "r": 378.20786, "b": 515.35562, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 26, "end_row_offset_idx": 27, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.1.1 Row permission and column mask definitions", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 383.74713, "t": 506.14264, "r": 547.15576, "b": 515.35562, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 26, "end_row_offset_idx": 27, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . 14", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19719, "t": 518.62253, "r": 530.43475, "b": 527.83551, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 27, "end_row_offset_idx": 28, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.1.2 Enabling and activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 535.99622, "t": 518.62253, "r": 547.11908, "b": 527.83551, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 27, "end_row_offset_idx": 28, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "16", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79703, "t": 531.1621700000001, "r": 530.52808, "b": 540.37517, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 28, "end_row_offset_idx": 29, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.2 Special registers and built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.06702, "t": 531.1621700000001, "r": 547.14484, "b": 540.37517, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 28, "end_row_offset_idx": 29, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "18", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19719, "t": 543.64204, "r": 530.49786, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 29, "end_row_offset_idx": 30, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.2.1 Special registers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.05188, "t": 543.64204, "r": 547.15991, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 29, "end_row_offset_idx": 30, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "18", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19719, "t": 556.12192, "r": 530.56024, "b": 565.33492, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 30, "end_row_offset_idx": 31, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.2.2 Built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.09912, "t": 556.12192, "r": 547.17688, "b": 565.33492, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 30, "end_row_offset_idx": 31, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "19", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79703, "t": 568.66156, "r": 530.53027, "b": 577.87456, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 31, "end_row_offset_idx": 32, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.3 VERIFY_GROUP_FOR_USER function . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.06152, "t": 568.66156, "r": 547.12402, "b": 577.87456, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 31, "end_row_offset_idx": 32, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "20", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79703, "t": 581.14143, "r": 530.62994, "b": 590.35443, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 32, "end_row_offset_idx": 33, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.4 Establishing and controlling accessibility by using the RCAC rule text . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.16315, "t": 581.14143, "r": 547.22955, "b": 590.35443, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 32, "end_row_offset_idx": 33, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "21", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79701, "t": 593.62131, "r": 530.56512, "b": 615.37395, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 34, "end_row_offset_idx": 35, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.5 SELECT, INSERT, and UPDATE behavior with RCAC 3.6 Human resources example . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 400.32065, "t": 593.62131, "r": 530.48358, "b": 602.8343, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 33, "end_row_offset_idx": 34, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": ". . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.0224, "t": 593.62131, "r": 547.1001, "b": 602.8343, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 33, "end_row_offset_idx": 34, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "22", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.112, "t": 606.16095, "r": 547.20575, "b": 615.37395, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 34, "end_row_offset_idx": 35, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "22", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717, "t": 618.64082, "r": 530.49139, "b": 627.85382, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 35, "end_row_offset_idx": 36, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.1 Assigning the QIBM_DB_SECADM function ID to the consultants. . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.04633, "t": 618.64082, "r": 547.15619, "b": 627.85382, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 35, "end_row_offset_idx": 36, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "23", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717, "t": 631.1206999999999, "r": 530.56458, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 36, "end_row_offset_idx": 37, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.2 Creating group profiles for the users and their roles . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.09601, "t": 631.1206999999999, "r": 547.15875, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 36, "end_row_offset_idx": 37, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "23", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717, "t": 643.66034, "r": 530.55695, "b": 652.87334, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 37, "end_row_offset_idx": 38, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.3 Demonstrating data access without RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.0882, "t": 643.66034, "r": 547.15076, "b": 652.87334, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 37, "end_row_offset_idx": 38, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "24", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717, "t": 656.14021, "r": 530.53412, "b": 665.35321, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 38, "end_row_offset_idx": 39, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.4 Defining and creating row permissions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.073, "t": 656.14021, "r": 547.15088, "b": 665.35321, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 38, "end_row_offset_idx": 39, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "25", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717, "t": 668.62009, "r": 339.45105, "b": 677.83309, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 39, "end_row_offset_idx": 40, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.5 Defining and creating column masks", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 344.98996, "t": 668.62009, "r": 547.16089, "b": 677.83309, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 39, "end_row_offset_idx": 40, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717, "t": 681.15973, "r": 530.54102, "b": 690.37273, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 40, "end_row_offset_idx": 41, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.6 Activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.08765, "t": 681.15973, "r": 547.18085, "b": 690.37273, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 40, "end_row_offset_idx": 41, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "28", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717, "t": 693.63961, "r": 530.57507, "b": 702.852615, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 41, "end_row_offset_idx": 42, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.7 Demonstrating data access with RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.10663, "t": 693.63961, "r": 547.16968, "b": 702.852615, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 41, "end_row_offset_idx": 42, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "29", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717, "t": 706.119492, "r": 530.43628, "b": 715.332497, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 42, "end_row_offset_idx": 43, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.8 Demonstrating data access with a view and RCAC . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 535.99847, "t": 706.119492, "r": 547.12286, "b": 715.332497, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 42, "end_row_offset_idx": 43, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "32", "column_header": false, "row_header": false, "row_section": false}]}}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_footer", "id": 2, "page_no": 1, "cluster": {"id": 2, "label": "page_footer", "bbox": {"l": 64.800003, "t": 755.538002, "r": 257.24335, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9473597407341003, "cells": [{"id": 0, "text": "' Copyright IBM Corp. 2014. All rights reserved.", "bbox": {"l": 64.800003, "t": 755.538002, "r": 257.24335, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "' Copyright IBM Corp. 2014. All rights reserved."}, {"label": "page_footer", "id": 3, "page_no": 1, "cluster": {"id": 3, "label": "page_footer", "bbox": {"l": 538.85999, "t": 754.848721, "r": 547.25928, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.8926277160644531, "cells": [{"id": 1, "text": "iii", "bbox": {"l": 538.85999, "t": 754.848721, "r": 547.25928, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "iii"}, {"label": "section_header", "id": 1, "page_no": 1, "cluster": {"id": 1, "label": "section_header", "bbox": {"l": 64.800003, "t": 73.84802000000002, "r": 168.73441, "b": 96.04803000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9509142637252808, "cells": [{"id": 2, "text": "Contents", "bbox": {"l": 64.800003, "t": 73.84802000000002, "r": 168.73441, "b": 96.04803000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Contents"}, {"label": "document_index", "id": 0, "page_no": 1, "cluster": {"id": 0, "label": "document_index", "bbox": {"l": 136.1496124267578, "t": 132.0330352783203, "r": 547.5267944335938, "b": 715.6515502929688, "coord_origin": "TOPLEFT"}, "confidence": 0.9803681373596191, "cells": [{"id": 3, "text": "Notices", "bbox": {"l": 136.8, "t": 132.64862000000005, "r": 172.89404, "b": 141.86163, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vii", "bbox": {"l": 175.01952, "t": 132.64862000000005, "r": 547.18982, "b": 141.86163, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Trademarks", "bbox": {"l": 136.79901, "t": 145.12847999999997, "r": 189.86537, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 195.39685, "t": 145.12847999999997, "r": 530.05121, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "viii", "bbox": {"l": 535.5827, "t": 145.12847999999997, "r": 547.18286, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "DB2 for i Center of Excellence", "bbox": {"l": 136.79901, "t": 167.62811, "r": 279.39731, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ix", "bbox": {"l": 280.61942, "t": 167.62811, "r": 547.1908, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Preface", "bbox": {"l": 136.79901, "t": 190.12775, "r": 172.84424, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi", "bbox": {"l": 175.01852, "t": 190.12775, "r": 547.18286, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Authors . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi", "bbox": {"l": 136.79803, "t": 202.60760000000005, "r": 547.18085, "b": 211.82061999999996, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Now you can become a published author, too!", "bbox": {"l": 136.79803, "t": 215.14721999999995, "r": 339.18292, "b": 224.36023, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 344.71411, "t": 215.14721999999995, "r": 530.00812, "b": 224.36023, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "xiii", "bbox": {"l": 535.53925, "t": 215.14721999999995, "r": 547.13879, "b": 224.36023, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Comments welcome. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 136.79803, "t": 227.62707999999998, "r": 529.99506, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "xiii", "bbox": {"l": 535.5495, "t": 227.62707999999998, "r": 547.19788, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Stay connected to IBM Redbooks", "bbox": {"l": 136.79807, "t": 240.10693000000003, "r": 284.02866, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 289.54449, "t": 240.10693000000003, "r": 529.48242, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "xiv", "bbox": {"l": 534.99829, "t": 240.10693000000003, "r": 547.12115, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Chapter 1. Securing and protecting IBM DB2 data", "bbox": {"l": 136.79807, "t": 262.60657000000003, "r": 373.17566, "b": 271.81958, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 375.11798, "t": 262.60657000000003, "r": 536.09589, "b": 271.81958, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "1", "bbox": {"l": 541.64685, "t": 262.60657000000003, "r": 547.19781, "b": 271.81958, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "1.1", "bbox": {"l": 136.79808, "t": 274.60637999999994, "r": 150.88702, "b": 283.8194, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "Security fundamentals. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2", "bbox": {"l": 156.5226, "t": 274.60637999999994, "r": 549.84723, "b": 283.8194, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "1.2", "bbox": {"l": 136.79807, "t": 287.14606000000003, "r": 150.62746, "b": 296.35904, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Current state of IBM i security . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.15923, "t": 287.14606000000003, "r": 536.12933, "b": 296.35904, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "2", "bbox": {"l": 541.66113, "t": 287.14606000000003, "r": 547.19287, "b": 296.35904, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "1.3", "bbox": {"l": 136.79807, "t": 299.62595, "r": 150.84943, "b": 308.83893, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "DB2 for i security controls . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3", "bbox": {"l": 156.46996, "t": 299.62595, "r": 549.84723, "b": 308.83893, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "1.3.1", "bbox": {"l": 151.1972, "t": 312.1058300000001, "r": 173.38289, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Existing row and column control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.92932, "t": 312.1058300000001, "r": 536.05511, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "4", "bbox": {"l": 541.6015, "t": 312.1058300000001, "r": 547.14795, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "1.3.2", "bbox": {"l": 151.1972, "t": 324.64548, "r": 173.4189, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "New controls: Row and Column Access Control. . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.97432, "t": 324.64548, "r": 536.08008, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "5", "bbox": {"l": 541.6355, "t": 324.64548, "r": 547.19092, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "Chapter 2. Roles and separation of duties", "bbox": {"l": 136.79704, "t": 347.14511, "r": 336.82071, "b": 356.35809, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 338.99701, "t": 347.14511, "r": 536.09088, "b": 356.35809, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "7", "bbox": {"l": 541.64282, "t": 347.14511, "r": 547.19476, "b": 356.35809, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "2.1", "bbox": {"l": 136.79704, "t": 359.14493, "r": 150.644, "b": 368.35791, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Roles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.18277, "t": 359.14493, "r": 536.12714, "b": 368.35791, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "8", "bbox": {"l": 541.66589, "t": 359.14493, "r": 547.20471, "b": 368.35791, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "2.1.1", "bbox": {"l": 151.1972, "t": 371.62482, "r": 173.60995, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "DDM and DRDA application server access: QIBM_DB_DDMDRDA . . . . . . . . . . .", "bbox": {"l": 176.41154, "t": 371.62482, "r": 535.9527, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "8", "bbox": {"l": 541.55585, "t": 371.62482, "r": 547.15906, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "2.1.2", "bbox": {"l": 151.1972, "t": 384.10470999999995, "r": 173.41664, "b": 393.31769, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "Toolbox application server access: QIBM_DB_ZDA. . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.97151, "t": 384.10470999999995, "r": 536.04108, "b": 393.31769, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "8", "bbox": {"l": 541.59595, "t": 384.10470999999995, "r": 547.15082, "b": 393.31769, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "2.1.3", "bbox": {"l": 151.1972, "t": 396.64435, "r": 173.41859, "b": 405.85733, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Database Administrator function: QIBM_DB_SQLADM . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.97394, "t": 396.64435, "r": 536.07489, "b": 405.85733, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "9", "bbox": {"l": 541.63025, "t": 396.64435, "r": 547.18561, "b": 405.85733, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "2.1.4", "bbox": {"l": 151.1972, "t": 409.12424000000004, "r": 173.38629, "b": 418.33722, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Database Information function: QIBM_DB_SYSMON", "bbox": {"l": 178.93356, "t": 409.12424000000004, "r": 411.27048, "b": 418.33722, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": ". . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 416.81775, "t": 409.12424000000004, "r": 536.08411, "b": 418.33722, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "9", "bbox": {"l": 541.63135, "t": 409.12424000000004, "r": 547.17865, "b": 418.33722, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "2.1.5", "bbox": {"l": 151.1972, "t": 421.60413, "r": 173.44926, "b": 430.81711, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Security Administrator function: QIBM_DB_SECADM . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 179.01228, "t": 421.60413, "r": 536.03589, "b": 430.81711, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "9", "bbox": {"l": 541.59894, "t": 421.60413, "r": 547.16193, "b": 430.81711, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "2.1.6", "bbox": {"l": 151.1972, "t": 434.1437700000001, "r": 173.32208, "b": 443.35675, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Change Function Usage CL command . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.8533, "t": 434.1437700000001, "r": 530.57318, "b": 443.35675, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "10", "bbox": {"l": 536.10443, "t": 434.1437700000001, "r": 547.16687, "b": 443.35675, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "2.1.7", "bbox": {"l": 151.1972, "t": 446.62366, "r": 173.35822, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "Verifying function usage IDs for RCAC with the FUNCTION_USAGE view . . . . .", "bbox": {"l": 178.89848, "t": 446.62366, "r": 530.53522, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "10", "bbox": {"l": 536.0755, "t": 446.62366, "r": 547.15601, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "2.2", "bbox": {"l": 136.79704, "t": 459.10355, "r": 150.85457, "b": 468.31653, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "Separation of duties . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10", "bbox": {"l": 156.47758, "t": 459.10355, "r": 547.25659, "b": 468.31653, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "Chapter 3. Row and Column Access Control", "bbox": {"l": 136.79703, "t": 481.60318, "r": 348.68503, "b": 490.81616, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 350.09741, "t": 481.60318, "r": 530.53961, "b": 490.81616, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "13", "bbox": {"l": 536.09167, "t": 481.60318, "r": 547.1958, "b": 490.81616, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "3.1", "bbox": {"l": 136.79703, "t": 493.603, "r": 150.70105, "b": 502.81598, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Explanation of RCAC and the concept of access control . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.26266, "t": 493.603, "r": 530.4809, "b": 502.81598, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "14", "bbox": {"l": 536.04248, "t": 493.603, "r": 547.16571, "b": 502.81598, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "3.1.1", "bbox": {"l": 151.19719, "t": 506.14264, "r": 173.35429, "b": 515.35562, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "Row permission and column mask definitions", "bbox": {"l": 178.89357, "t": 506.14264, "r": 378.20786, "b": 515.35562, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 383.74713, "t": 506.14264, "r": 530.5379, "b": 515.35562, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "14", "bbox": {"l": 536.07721, "t": 506.14264, "r": 547.15576, "b": 515.35562, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "3.1.2", "bbox": {"l": 151.19719, "t": 518.62253, "r": 173.44292, "b": 527.83551, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "Enabling and activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 179.00435, "t": 518.62253, "r": 530.43475, "b": 527.83551, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "16", "bbox": {"l": 535.99622, "t": 518.62253, "r": 547.11908, "b": 527.83551, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "3.2", "bbox": {"l": 136.79703, "t": 531.1621700000001, "r": 150.64432, "b": 540.37517, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Special registers and built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.18323, "t": 531.1621700000001, "r": 530.52808, "b": 540.37517, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "18", "bbox": {"l": 536.06702, "t": 531.1621700000001, "r": 547.14484, "b": 540.37517, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "3.2.1", "bbox": {"l": 151.19719, "t": 543.64204, "r": 173.41321, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "Special registers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.96722, "t": 543.64204, "r": 530.49786, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "18", "bbox": {"l": 536.05188, "t": 543.64204, "r": 547.15991, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "3.2.2", "bbox": {"l": 151.19719, "t": 556.12192, "r": 173.35269, "b": 565.33492, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.89156, "t": 556.12192, "r": 530.56024, "b": 565.33492, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "19", "bbox": {"l": 536.09912, "t": 556.12192, "r": 547.17688, "b": 565.33492, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "3.3", "bbox": {"l": 136.79703, "t": 568.66156, "r": 150.62514, "b": 577.87456, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "VERIFY_GROUP_FOR_USER function . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.15639, "t": 568.66156, "r": 530.53027, "b": 577.87456, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "20", "bbox": {"l": 536.06152, "t": 568.66156, "r": 547.12402, "b": 577.87456, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "3.4", "bbox": {"l": 136.79703, "t": 581.14143, "r": 150.63004, "b": 590.35443, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "Establishing and controlling accessibility by using the RCAC rule text . . . . . . . . . . . . .", "bbox": {"l": 156.16325, "t": 581.14143, "r": 530.62994, "b": 590.35443, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "21", "bbox": {"l": 536.16315, "t": 581.14143, "r": 547.22955, "b": 590.35443, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "3.5", "bbox": {"l": 136.79701, "t": 593.62131, "r": 150.64413, "b": 602.8343, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "SELECT, INSERT, and UPDATE behavior with RCAC", "bbox": {"l": 156.18298, "t": 593.62131, "r": 394.7818, "b": 602.8343, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": ". . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 400.32065, "t": 593.62131, "r": 530.48358, "b": 602.8343, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "22", "bbox": {"l": 536.0224, "t": 593.62131, "r": 547.1001, "b": 602.8343, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "3.6", "bbox": {"l": 136.79701, "t": 606.16095, "r": 150.6642, "b": 615.37395, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "Human resources example . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.21107, "t": 606.16095, "r": 530.56512, "b": 615.37395, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "22", "bbox": {"l": 536.112, "t": 606.16095, "r": 547.20575, "b": 615.37395, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "3.6.1", "bbox": {"l": 151.19717, "t": 618.64082, "r": 173.41692, "b": 627.85382, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "Assigning the QIBM_DB_SECADM function ID to the consultants. . . . . . . . . . . .", "bbox": {"l": 178.97185, "t": 618.64082, "r": 530.49139, "b": 627.85382, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "23", "bbox": {"l": 536.04633, "t": 618.64082, "r": 547.15619, "b": 627.85382, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "3.6.2", "bbox": {"l": 151.19717, "t": 631.1206999999999, "r": 173.32271, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "Creating group profiles for the users and their roles . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.8541, "t": 631.1206999999999, "r": 530.56458, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "23", "bbox": {"l": 536.09601, "t": 631.1206999999999, "r": 547.15875, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "3.6.3", "bbox": {"l": 151.19717, "t": 643.66034, "r": 173.32227, "b": 652.87334, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "Demonstrating data access without RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.85353, "t": 643.66034, "r": 530.55695, "b": 652.87334, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "24", "bbox": {"l": 536.0882, "t": 643.66034, "r": 547.15076, "b": 652.87334, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "3.6.4", "bbox": {"l": 151.19717, "t": 656.14021, "r": 173.35289, "b": 665.35321, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "Defining and creating row permissions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.89182, "t": 656.14021, "r": 530.53412, "b": 665.35321, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "25", "bbox": {"l": 536.073, "t": 656.14021, "r": 547.15088, "b": 665.35321, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "3.6.5", "bbox": {"l": 151.19717, "t": 668.62009, "r": 173.35289, "b": 677.83309, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "Defining and creating column masks", "bbox": {"l": 178.89182, "t": 668.62009, "r": 339.45105, "b": 677.83309, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 344.98996, "t": 668.62009, "r": 530.54413, "b": 677.83309, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "26", "bbox": {"l": 536.08301, "t": 668.62009, "r": 547.16089, "b": 677.83309, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "3.6.6", "bbox": {"l": 151.19717, "t": 681.15973, "r": 173.38359, "b": 690.37273, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "Activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.93019, "t": 681.15973, "r": 530.54102, "b": 690.37273, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "28", "bbox": {"l": 536.08765, "t": 681.15973, "r": 547.18085, "b": 690.37273, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "3.6.7", "bbox": {"l": 151.19717, "t": 693.63961, "r": 173.32332, "b": 702.852615, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Demonstrating data access with RCAC", "bbox": {"l": 178.85486, "t": 693.63961, "r": 350.80011, "b": 702.852615, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 356.33163, "t": 693.63961, "r": 530.57507, "b": 702.852615, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "29", "bbox": {"l": 536.10663, "t": 693.63961, "r": 547.16968, "b": 702.852615, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "3.6.8", "bbox": {"l": 151.19717, "t": 706.119492, "r": 173.44592, "b": 715.332497, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "Demonstrating data access with a view and RCAC . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 179.00812, "t": 706.119492, "r": 530.43628, "b": 715.332497, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "32", "bbox": {"l": 535.99847, "t": 706.119492, "r": 547.12286, "b": 715.332497, "coord_origin": "TOPLEFT"}}], "children": [{"id": 4, "label": "text", "bbox": {"l": 136.8, "t": 132.64862000000005, "r": 172.89404, "b": 141.86163, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 3, "text": "Notices", "bbox": {"l": 136.8, "t": 132.64862000000005, "r": 172.89404, "b": 141.86163, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "text", "bbox": {"l": 175.01952, "t": 132.64862000000005, "r": 547.18982, "b": 141.86163, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 4, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vii", "bbox": {"l": 175.01952, "t": 132.64862000000005, "r": 547.18982, "b": 141.86163, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "text", "bbox": {"l": 136.79901, "t": 145.12847999999997, "r": 189.86537, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 5, "text": "Trademarks", "bbox": {"l": 136.79901, "t": 145.12847999999997, "r": 189.86537, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "text", "bbox": {"l": 195.39685, "t": 145.12847999999997, "r": 530.05121, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 195.39685, "t": 145.12847999999997, "r": 530.05121, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "text", "bbox": {"l": 535.5827, "t": 145.12847999999997, "r": 547.18286, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "viii", "bbox": {"l": 535.5827, "t": 145.12847999999997, "r": 547.18286, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 136.79901, "t": 167.62811, "r": 279.39731, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "DB2 for i Center of Excellence", "bbox": {"l": 136.79901, "t": 167.62811, "r": 279.39731, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "text", "bbox": {"l": 280.61942, "t": 167.62811, "r": 547.1908, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ix", "bbox": {"l": 280.61942, "t": 167.62811, "r": 547.1908, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 136.79901, "t": 190.12775, "r": 172.84424, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "Preface", "bbox": {"l": 136.79901, "t": 190.12775, "r": 172.84424, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 175.01852, "t": 190.12775, "r": 547.18286, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi", "bbox": {"l": 175.01852, "t": 190.12775, "r": 547.18286, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 136.79803, "t": 202.60760000000005, "r": 547.18085, "b": 211.82061999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "Authors . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi", "bbox": {"l": 136.79803, "t": 202.60760000000005, "r": 547.18085, "b": 211.82061999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 136.79803, "t": 215.14721999999995, "r": 339.18292, "b": 224.36023, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "Now you can become a published author, too!", "bbox": {"l": 136.79803, "t": 215.14721999999995, "r": 339.18292, "b": 224.36023, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 344.71411, "t": 215.14721999999995, "r": 530.00812, "b": 224.36023, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 344.71411, "t": 215.14721999999995, "r": 530.00812, "b": 224.36023, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 535.53925, "t": 215.14721999999995, "r": 547.13879, "b": 224.36023, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "xiii", "bbox": {"l": 535.53925, "t": 215.14721999999995, "r": 547.13879, "b": 224.36023, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 136.79803, "t": 227.62707999999998, "r": 529.99506, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "Comments welcome. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 136.79803, "t": 227.62707999999998, "r": 529.99506, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 535.5495, "t": 227.62707999999998, "r": 547.19788, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "xiii", "bbox": {"l": 535.5495, "t": 227.62707999999998, "r": 547.19788, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 136.79807, "t": 240.10693000000003, "r": 284.02866, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "Stay connected to IBM Redbooks", "bbox": {"l": 136.79807, "t": 240.10693000000003, "r": 284.02866, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 289.54449, "t": 240.10693000000003, "r": 529.48242, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 289.54449, "t": 240.10693000000003, "r": 529.48242, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 534.99829, "t": 240.10693000000003, "r": 547.12115, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "xiv", "bbox": {"l": 534.99829, "t": 240.10693000000003, "r": 547.12115, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 136.79807, "t": 262.60657000000003, "r": 373.17566, "b": 271.81958, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "Chapter 1. Securing and protecting IBM DB2 data", "bbox": {"l": 136.79807, "t": 262.60657000000003, "r": 373.17566, "b": 271.81958, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 375.11798, "t": 262.60657000000003, "r": 536.09589, "b": 271.81958, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 375.11798, "t": 262.60657000000003, "r": 536.09589, "b": 271.81958, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 541.64685, "t": 262.60657000000003, "r": 547.19781, "b": 271.81958, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "1", "bbox": {"l": 541.64685, "t": 262.60657000000003, "r": 547.19781, "b": 271.81958, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 136.79808, "t": 274.60637999999994, "r": 150.88702, "b": 283.8194, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "1.1", "bbox": {"l": 136.79808, "t": 274.60637999999994, "r": 150.88702, "b": 283.8194, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 156.5226, "t": 274.60637999999994, "r": 549.84723, "b": 283.8194, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "Security fundamentals. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2", "bbox": {"l": 156.5226, "t": 274.60637999999994, "r": 549.84723, "b": 283.8194, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 136.79807, "t": 287.14606000000003, "r": 150.62746, "b": 296.35904, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "1.2", "bbox": {"l": 136.79807, "t": 287.14606000000003, "r": 150.62746, "b": 296.35904, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 156.15923, "t": 287.14606000000003, "r": 536.12933, "b": 296.35904, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "Current state of IBM i security . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.15923, "t": 287.14606000000003, "r": 536.12933, "b": 296.35904, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 541.66113, "t": 287.14606000000003, "r": 547.19287, "b": 296.35904, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "2", "bbox": {"l": 541.66113, "t": 287.14606000000003, "r": 547.19287, "b": 296.35904, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 136.79807, "t": 299.62595, "r": 150.84943, "b": 308.83893, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "1.3", "bbox": {"l": 136.79807, "t": 299.62595, "r": 150.84943, "b": 308.83893, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 156.46996, "t": 299.62595, "r": 549.84723, "b": 308.83893, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "DB2 for i security controls . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3", "bbox": {"l": 156.46996, "t": 299.62595, "r": 549.84723, "b": 308.83893, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 151.1972, "t": 312.1058300000001, "r": 173.38289, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "1.3.1", "bbox": {"l": 151.1972, "t": 312.1058300000001, "r": 173.38289, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 178.92932, "t": 312.1058300000001, "r": 536.05511, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "Existing row and column control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.92932, "t": 312.1058300000001, "r": 536.05511, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 541.6015, "t": 312.1058300000001, "r": 547.14795, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "4", "bbox": {"l": 541.6015, "t": 312.1058300000001, "r": 547.14795, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 151.1972, "t": 324.64548, "r": 173.4189, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "1.3.2", "bbox": {"l": 151.1972, "t": 324.64548, "r": 173.4189, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 178.97432, "t": 324.64548, "r": 536.08008, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "New controls: Row and Column Access Control. . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.97432, "t": 324.64548, "r": 536.08008, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 541.6355, "t": 324.64548, "r": 547.19092, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "5", "bbox": {"l": 541.6355, "t": 324.64548, "r": 547.19092, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 136.79704, "t": 347.14511, "r": 336.82071, "b": 356.35809, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "Chapter 2. Roles and separation of duties", "bbox": {"l": 136.79704, "t": 347.14511, "r": 336.82071, "b": 356.35809, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 338.99701, "t": 347.14511, "r": 536.09088, "b": 356.35809, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 338.99701, "t": 347.14511, "r": 536.09088, "b": 356.35809, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 541.64282, "t": 347.14511, "r": 547.19476, "b": 356.35809, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "7", "bbox": {"l": 541.64282, "t": 347.14511, "r": 547.19476, "b": 356.35809, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 136.79704, "t": 359.14493, "r": 150.644, "b": 368.35791, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "2.1", "bbox": {"l": 136.79704, "t": 359.14493, "r": 150.644, "b": 368.35791, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 156.18277, "t": 359.14493, "r": 536.12714, "b": 368.35791, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "Roles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.18277, "t": 359.14493, "r": 536.12714, "b": 368.35791, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 541.66589, "t": 359.14493, "r": 547.20471, "b": 368.35791, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "8", "bbox": {"l": 541.66589, "t": 359.14493, "r": 547.20471, "b": 368.35791, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 151.1972, "t": 371.62482, "r": 173.60995, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "2.1.1", "bbox": {"l": 151.1972, "t": 371.62482, "r": 173.60995, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 176.41154, "t": 371.62482, "r": 535.9527, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "DDM and DRDA application server access: QIBM_DB_DDMDRDA . . . . . . . . . . .", "bbox": {"l": 176.41154, "t": 371.62482, "r": 535.9527, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 541.55585, "t": 371.62482, "r": 547.15906, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "8", "bbox": {"l": 541.55585, "t": 371.62482, "r": 547.15906, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 151.1972, "t": 384.10470999999995, "r": 173.41664, "b": 393.31769, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "2.1.2", "bbox": {"l": 151.1972, "t": 384.10470999999995, "r": 173.41664, "b": 393.31769, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 178.97151, "t": 384.10470999999995, "r": 536.04108, "b": 393.31769, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "Toolbox application server access: QIBM_DB_ZDA. . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.97151, "t": 384.10470999999995, "r": 536.04108, "b": 393.31769, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 541.59595, "t": 384.10470999999995, "r": 547.15082, "b": 393.31769, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "8", "bbox": {"l": 541.59595, "t": 384.10470999999995, "r": 547.15082, "b": 393.31769, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 151.1972, "t": 396.64435, "r": 173.41859, "b": 405.85733, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "2.1.3", "bbox": {"l": 151.1972, "t": 396.64435, "r": 173.41859, "b": 405.85733, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 178.97394, "t": 396.64435, "r": 536.07489, "b": 405.85733, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "Database Administrator function: QIBM_DB_SQLADM . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.97394, "t": 396.64435, "r": 536.07489, "b": 405.85733, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 541.63025, "t": 396.64435, "r": 547.18561, "b": 405.85733, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "9", "bbox": {"l": 541.63025, "t": 396.64435, "r": 547.18561, "b": 405.85733, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 151.1972, "t": 409.12424000000004, "r": 173.38629, "b": 418.33722, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "2.1.4", "bbox": {"l": 151.1972, "t": 409.12424000000004, "r": 173.38629, "b": 418.33722, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 178.93356, "t": 409.12424000000004, "r": 411.27048, "b": 418.33722, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "Database Information function: QIBM_DB_SYSMON", "bbox": {"l": 178.93356, "t": 409.12424000000004, "r": 411.27048, "b": 418.33722, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 416.81775, "t": 409.12424000000004, "r": 536.08411, "b": 418.33722, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": ". . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 416.81775, "t": 409.12424000000004, "r": 536.08411, "b": 418.33722, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 541.63135, "t": 409.12424000000004, "r": 547.17865, "b": 418.33722, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "9", "bbox": {"l": 541.63135, "t": 409.12424000000004, "r": 547.17865, "b": 418.33722, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 151.1972, "t": 421.60413, "r": 173.44926, "b": 430.81711, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "2.1.5", "bbox": {"l": 151.1972, "t": 421.60413, "r": 173.44926, "b": 430.81711, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 179.01228, "t": 421.60413, "r": 536.03589, "b": 430.81711, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "Security Administrator function: QIBM_DB_SECADM . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 179.01228, "t": 421.60413, "r": 536.03589, "b": 430.81711, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 541.59894, "t": 421.60413, "r": 547.16193, "b": 430.81711, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "9", "bbox": {"l": 541.59894, "t": 421.60413, "r": 547.16193, "b": 430.81711, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 151.1972, "t": 434.1437700000001, "r": 173.32208, "b": 443.35675, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "2.1.6", "bbox": {"l": 151.1972, "t": 434.1437700000001, "r": 173.32208, "b": 443.35675, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 178.8533, "t": 434.1437700000001, "r": 530.57318, "b": 443.35675, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "Change Function Usage CL command . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.8533, "t": 434.1437700000001, "r": 530.57318, "b": 443.35675, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 536.10443, "t": 434.1437700000001, "r": 547.16687, "b": 443.35675, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "10", "bbox": {"l": 536.10443, "t": 434.1437700000001, "r": 547.16687, "b": 443.35675, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 151.1972, "t": 446.62366, "r": 173.35822, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "2.1.7", "bbox": {"l": 151.1972, "t": 446.62366, "r": 173.35822, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 178.89848, "t": 446.62366, "r": 530.53522, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "Verifying function usage IDs for RCAC with the FUNCTION_USAGE view . . . . .", "bbox": {"l": 178.89848, "t": 446.62366, "r": 530.53522, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 536.0755, "t": 446.62366, "r": 547.15601, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "10", "bbox": {"l": 536.0755, "t": 446.62366, "r": 547.15601, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 136.79704, "t": 459.10355, "r": 150.85457, "b": 468.31653, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "2.2", "bbox": {"l": 136.79704, "t": 459.10355, "r": 150.85457, "b": 468.31653, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 156.47758, "t": 459.10355, "r": 547.25659, "b": 468.31653, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "Separation of duties . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10", "bbox": {"l": 156.47758, "t": 459.10355, "r": 547.25659, "b": 468.31653, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 136.79703, "t": 481.60318, "r": 348.68503, "b": 490.81616, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "Chapter 3. Row and Column Access Control", "bbox": {"l": 136.79703, "t": 481.60318, "r": 348.68503, "b": 490.81616, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 350.09741, "t": 481.60318, "r": 530.53961, "b": 490.81616, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 350.09741, "t": 481.60318, "r": 530.53961, "b": 490.81616, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 536.09167, "t": 481.60318, "r": 547.1958, "b": 490.81616, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "13", "bbox": {"l": 536.09167, "t": 481.60318, "r": 547.1958, "b": 490.81616, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 136.79703, "t": 493.603, "r": 150.70105, "b": 502.81598, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "3.1", "bbox": {"l": 136.79703, "t": 493.603, "r": 150.70105, "b": 502.81598, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 156.26266, "t": 493.603, "r": 530.4809, "b": 502.81598, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "Explanation of RCAC and the concept of access control . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.26266, "t": 493.603, "r": 530.4809, "b": 502.81598, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 536.04248, "t": 493.603, "r": 547.16571, "b": 502.81598, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "14", "bbox": {"l": 536.04248, "t": 493.603, "r": 547.16571, "b": 502.81598, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 151.19719, "t": 506.14264, "r": 173.35429, "b": 515.35562, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "3.1.1", "bbox": {"l": 151.19719, "t": 506.14264, "r": 173.35429, "b": 515.35562, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 178.89357, "t": 506.14264, "r": 378.20786, "b": 515.35562, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "Row permission and column mask definitions", "bbox": {"l": 178.89357, "t": 506.14264, "r": 378.20786, "b": 515.35562, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 383.74713, "t": 506.14264, "r": 530.5379, "b": 515.35562, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 383.74713, "t": 506.14264, "r": 530.5379, "b": 515.35562, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 536.07721, "t": 506.14264, "r": 547.15576, "b": 515.35562, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "14", "bbox": {"l": 536.07721, "t": 506.14264, "r": 547.15576, "b": 515.35562, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 151.19719, "t": 518.62253, "r": 173.44292, "b": 527.83551, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "3.1.2", "bbox": {"l": 151.19719, "t": 518.62253, "r": 173.44292, "b": 527.83551, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 179.00435, "t": 518.62253, "r": 530.43475, "b": 527.83551, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "Enabling and activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 179.00435, "t": 518.62253, "r": 530.43475, "b": 527.83551, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 535.99622, "t": 518.62253, "r": 547.11908, "b": 527.83551, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "16", "bbox": {"l": 535.99622, "t": 518.62253, "r": 547.11908, "b": 527.83551, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 136.79703, "t": 531.1621700000001, "r": 150.64432, "b": 540.37517, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "3.2", "bbox": {"l": 136.79703, "t": 531.1621700000001, "r": 150.64432, "b": 540.37517, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 156.18323, "t": 531.1621700000001, "r": 530.52808, "b": 540.37517, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "Special registers and built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.18323, "t": 531.1621700000001, "r": 530.52808, "b": 540.37517, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 536.06702, "t": 531.1621700000001, "r": 547.14484, "b": 540.37517, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "18", "bbox": {"l": 536.06702, "t": 531.1621700000001, "r": 547.14484, "b": 540.37517, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 151.19719, "t": 543.64204, "r": 173.41321, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "3.2.1", "bbox": {"l": 151.19719, "t": 543.64204, "r": 173.41321, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 178.96722, "t": 543.64204, "r": 530.49786, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "Special registers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.96722, "t": 543.64204, "r": 530.49786, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 536.05188, "t": 543.64204, "r": 547.15991, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "18", "bbox": {"l": 536.05188, "t": 543.64204, "r": 547.15991, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 151.19719, "t": 556.12192, "r": 173.35269, "b": 565.33492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "3.2.2", "bbox": {"l": 151.19719, "t": 556.12192, "r": 173.35269, "b": 565.33492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 178.89156, "t": 556.12192, "r": 530.56024, "b": 565.33492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "Built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.89156, "t": 556.12192, "r": 530.56024, "b": 565.33492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 536.09912, "t": 556.12192, "r": 547.17688, "b": 565.33492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "19", "bbox": {"l": 536.09912, "t": 556.12192, "r": 547.17688, "b": 565.33492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 136.79703, "t": 568.66156, "r": 150.62514, "b": 577.87456, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "3.3", "bbox": {"l": 136.79703, "t": 568.66156, "r": 150.62514, "b": 577.87456, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 156.15639, "t": 568.66156, "r": 530.53027, "b": 577.87456, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "VERIFY_GROUP_FOR_USER function . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.15639, "t": 568.66156, "r": 530.53027, "b": 577.87456, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 536.06152, "t": 568.66156, "r": 547.12402, "b": 577.87456, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "20", "bbox": {"l": 536.06152, "t": 568.66156, "r": 547.12402, "b": 577.87456, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 136.79703, "t": 581.14143, "r": 150.63004, "b": 590.35443, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "3.4", "bbox": {"l": 136.79703, "t": 581.14143, "r": 150.63004, "b": 590.35443, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 156.16325, "t": 581.14143, "r": 530.62994, "b": 590.35443, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "Establishing and controlling accessibility by using the RCAC rule text . . . . . . . . . . . . .", "bbox": {"l": 156.16325, "t": 581.14143, "r": 530.62994, "b": 590.35443, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 536.16315, "t": 581.14143, "r": 547.22955, "b": 590.35443, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "21", "bbox": {"l": 536.16315, "t": 581.14143, "r": 547.22955, "b": 590.35443, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 136.79701, "t": 593.62131, "r": 150.64413, "b": 602.8343, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "3.5", "bbox": {"l": 136.79701, "t": 593.62131, "r": 150.64413, "b": 602.8343, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 156.18298, "t": 593.62131, "r": 394.7818, "b": 602.8343, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "SELECT, INSERT, and UPDATE behavior with RCAC", "bbox": {"l": 156.18298, "t": 593.62131, "r": 394.7818, "b": 602.8343, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 400.32065, "t": 593.62131, "r": 530.48358, "b": 602.8343, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": ". . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 400.32065, "t": 593.62131, "r": 530.48358, "b": 602.8343, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 536.0224, "t": 593.62131, "r": 547.1001, "b": 602.8343, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "22", "bbox": {"l": 536.0224, "t": 593.62131, "r": 547.1001, "b": 602.8343, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 136.79701, "t": 606.16095, "r": 150.6642, "b": 615.37395, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "3.6", "bbox": {"l": 136.79701, "t": 606.16095, "r": 150.6642, "b": 615.37395, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 156.21107, "t": 606.16095, "r": 530.56512, "b": 615.37395, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "Human resources example . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.21107, "t": 606.16095, "r": 530.56512, "b": 615.37395, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 536.112, "t": 606.16095, "r": 547.20575, "b": 615.37395, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "22", "bbox": {"l": 536.112, "t": 606.16095, "r": 547.20575, "b": 615.37395, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 151.19717, "t": 618.64082, "r": 173.41692, "b": 627.85382, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "3.6.1", "bbox": {"l": 151.19717, "t": 618.64082, "r": 173.41692, "b": 627.85382, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 178.97185, "t": 618.64082, "r": 530.49139, "b": 627.85382, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": "Assigning the QIBM_DB_SECADM function ID to the consultants. . . . . . . . . . . .", "bbox": {"l": 178.97185, "t": 618.64082, "r": 530.49139, "b": 627.85382, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 536.04633, "t": 618.64082, "r": 547.15619, "b": 627.85382, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "23", "bbox": {"l": 536.04633, "t": 618.64082, "r": 547.15619, "b": 627.85382, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 151.19717, "t": 631.1206999999999, "r": 173.32271, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "3.6.2", "bbox": {"l": 151.19717, "t": 631.1206999999999, "r": 173.32271, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 178.8541, "t": 631.1206999999999, "r": 530.56458, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": "Creating group profiles for the users and their roles . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.8541, "t": 631.1206999999999, "r": 530.56458, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 536.09601, "t": 631.1206999999999, "r": 547.15875, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 107, "text": "23", "bbox": {"l": 536.09601, "t": 631.1206999999999, "r": 547.15875, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 151.19717, "t": 643.66034, "r": 173.32227, "b": 652.87334, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 108, "text": "3.6.3", "bbox": {"l": 151.19717, "t": 643.66034, "r": 173.32227, "b": 652.87334, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 178.85353, "t": 643.66034, "r": 530.55695, "b": 652.87334, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 109, "text": "Demonstrating data access without RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.85353, "t": 643.66034, "r": 530.55695, "b": 652.87334, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 536.0882, "t": 643.66034, "r": 547.15076, "b": 652.87334, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 110, "text": "24", "bbox": {"l": 536.0882, "t": 643.66034, "r": 547.15076, "b": 652.87334, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 151.19717, "t": 656.14021, "r": 173.35289, "b": 665.35321, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 111, "text": "3.6.4", "bbox": {"l": 151.19717, "t": 656.14021, "r": 173.35289, "b": 665.35321, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 178.89182, "t": 656.14021, "r": 530.53412, "b": 665.35321, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 112, "text": "Defining and creating row permissions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.89182, "t": 656.14021, "r": 530.53412, "b": 665.35321, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 114, "label": "text", "bbox": {"l": 536.073, "t": 656.14021, "r": 547.15088, "b": 665.35321, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 113, "text": "25", "bbox": {"l": 536.073, "t": 656.14021, "r": 547.15088, "b": 665.35321, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 115, "label": "text", "bbox": {"l": 151.19717, "t": 668.62009, "r": 173.35289, "b": 677.83309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 114, "text": "3.6.5", "bbox": {"l": 151.19717, "t": 668.62009, "r": 173.35289, "b": 677.83309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 116, "label": "text", "bbox": {"l": 178.89182, "t": 668.62009, "r": 339.45105, "b": 677.83309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 115, "text": "Defining and creating column masks", "bbox": {"l": 178.89182, "t": 668.62009, "r": 339.45105, "b": 677.83309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 117, "label": "text", "bbox": {"l": 344.98996, "t": 668.62009, "r": 530.54413, "b": 677.83309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 116, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 344.98996, "t": 668.62009, "r": 530.54413, "b": 677.83309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 118, "label": "text", "bbox": {"l": 536.08301, "t": 668.62009, "r": 547.16089, "b": 677.83309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 117, "text": "26", "bbox": {"l": 536.08301, "t": 668.62009, "r": 547.16089, "b": 677.83309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 119, "label": "text", "bbox": {"l": 151.19717, "t": 681.15973, "r": 173.38359, "b": 690.37273, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 118, "text": "3.6.6", "bbox": {"l": 151.19717, "t": 681.15973, "r": 173.38359, "b": 690.37273, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 120, "label": "text", "bbox": {"l": 178.93019, "t": 681.15973, "r": 530.54102, "b": 690.37273, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 119, "text": "Activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.93019, "t": 681.15973, "r": 530.54102, "b": 690.37273, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 121, "label": "text", "bbox": {"l": 536.08765, "t": 681.15973, "r": 547.18085, "b": 690.37273, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 120, "text": "28", "bbox": {"l": 536.08765, "t": 681.15973, "r": 547.18085, "b": 690.37273, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 122, "label": "text", "bbox": {"l": 151.19717, "t": 693.63961, "r": 173.32332, "b": 702.852615, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 121, "text": "3.6.7", "bbox": {"l": 151.19717, "t": 693.63961, "r": 173.32332, "b": 702.852615, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 123, "label": "text", "bbox": {"l": 178.85486, "t": 693.63961, "r": 350.80011, "b": 702.852615, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 122, "text": "Demonstrating data access with RCAC", "bbox": {"l": 178.85486, "t": 693.63961, "r": 350.80011, "b": 702.852615, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 124, "label": "text", "bbox": {"l": 356.33163, "t": 693.63961, "r": 530.57507, "b": 702.852615, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 123, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 356.33163, "t": 693.63961, "r": 530.57507, "b": 702.852615, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 125, "label": "text", "bbox": {"l": 536.10663, "t": 693.63961, "r": 547.16968, "b": 702.852615, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 124, "text": "29", "bbox": {"l": 536.10663, "t": 693.63961, "r": 547.16968, "b": 702.852615, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 126, "label": "text", "bbox": {"l": 151.19717, "t": 706.119492, "r": 173.44592, "b": 715.332497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 125, "text": "3.6.8", "bbox": {"l": 151.19717, "t": 706.119492, "r": 173.44592, "b": 715.332497, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 127, "label": "text", "bbox": {"l": 179.00812, "t": 706.119492, "r": 530.43628, "b": 715.332497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 126, "text": "Demonstrating data access with a view and RCAC . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 179.00812, "t": 706.119492, "r": 530.43628, "b": 715.332497, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 128, "label": "text", "bbox": {"l": 535.99847, "t": 706.119492, "r": 547.12286, "b": 715.332497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 127, "text": "32", "bbox": {"l": 535.99847, "t": 706.119492, "r": 547.12286, "b": 715.332497, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 43, "num_cols": 2, "table_cells": [{"bbox": {"l": 136.8, "t": 132.64862000000005, "r": 172.89404, "b": 141.86163, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Notices", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 175.01952, "t": 132.64862000000005, "r": 547.18982, "b": 141.86163, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vii", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79901, "t": 145.12847999999997, "r": 189.86537, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Trademarks", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 195.39685, "t": 145.12847999999997, "r": 547.18286, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . viii", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79901, "t": 167.62811, "r": 279.39731, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "DB2 for i Center of Excellence", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.61942, "t": 167.62811, "r": 547.1908, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ix", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79901, "t": 190.12775, "r": 172.84424, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Preface", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 175.01852, "t": 190.12775, "r": 547.18286, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79803, "t": 202.60760000000005, "r": 547.18085, "b": 211.82061999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Authors . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79803, "t": 215.14721999999995, "r": 339.18292, "b": 224.36023, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Now you can become a published author, too!", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 344.71411, "t": 215.14721999999995, "r": 547.13879, "b": 224.36023, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xiii", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79803, "t": 227.62707999999998, "r": 529.99506, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Comments welcome. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 535.5495, "t": 227.62707999999998, "r": 547.19788, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "xiii", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79807, "t": 240.10693000000003, "r": 284.02866, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Stay connected to IBM Redbooks", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.54449, "t": 240.10693000000003, "r": 547.12115, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xiv", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79807, "t": 262.60657000000003, "r": 536.09589, "b": 271.81958, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Chapter 1. Securing and protecting IBM DB2 data  . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.64685, "t": 262.60657000000003, "r": 547.19781, "b": 271.81958, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79808, "t": 274.60637999999994, "r": 549.84723, "b": 283.8194, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "1.1 Security fundamentals. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79807, "t": 287.14606000000003, "r": 536.12933, "b": 296.35904, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "1.2 Current state of IBM i security . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.66113, "t": 287.14606000000003, "r": 547.19287, "b": 296.35904, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79807, "t": 299.62595, "r": 549.84723, "b": 308.83893, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "1.3 DB2 for i security controls . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 312.1058300000001, "r": 536.05511, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "1.3.1 Existing row and column control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.6015, "t": 312.1058300000001, "r": 547.14795, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 324.64548, "r": 536.08008, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "1.3.2 New controls: Row and Column Access Control. . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.6355, "t": 324.64548, "r": 547.19092, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79704, "t": 347.14511, "r": 536.09088, "b": 356.35809, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 14, "end_row_offset_idx": 15, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Chapter 2. Roles and separation of duties . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.64282, "t": 347.14511, "r": 547.19476, "b": 356.35809, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 14, "end_row_offset_idx": 15, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79704, "t": 359.14493, "r": 536.12714, "b": 368.35791, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 15, "end_row_offset_idx": 16, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1 Roles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.66589, "t": 359.14493, "r": 547.20471, "b": 368.35791, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 15, "end_row_offset_idx": 16, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 371.62482, "r": 535.9527, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 16, "end_row_offset_idx": 17, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.1 DDM and DRDA application server access: QIBM_DB_DDMDRDA . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.55585, "t": 371.62482, "r": 547.15906, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 16, "end_row_offset_idx": 17, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 384.10470999999995, "r": 536.04108, "b": 393.31769, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 17, "end_row_offset_idx": 18, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.2 Toolbox application server access: QIBM_DB_ZDA. . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.59595, "t": 384.10470999999995, "r": 547.15082, "b": 393.31769, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 17, "end_row_offset_idx": 18, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 396.64435, "r": 536.07489, "b": 405.85733, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 18, "end_row_offset_idx": 19, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.3 Database Administrator function: QIBM_DB_SQLADM . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.63025, "t": 396.64435, "r": 547.18561, "b": 405.85733, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 18, "end_row_offset_idx": 19, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 409.12424000000004, "r": 411.27048, "b": 418.33722, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 19, "end_row_offset_idx": 20, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.4 Database Information function: QIBM_DB_SYSMON", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 416.81775, "t": 409.12424000000004, "r": 547.17865, "b": 418.33722, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 19, "end_row_offset_idx": 20, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . 9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 421.60413, "r": 536.03589, "b": 430.81711, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 20, "end_row_offset_idx": 21, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.5 Security Administrator function: QIBM_DB_SECADM . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.59894, "t": 421.60413, "r": 547.16193, "b": 430.81711, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 20, "end_row_offset_idx": 21, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 434.1437700000001, "r": 530.57318, "b": 443.35675, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 21, "end_row_offset_idx": 22, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.6 Change Function Usage CL command . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.10443, "t": 434.1437700000001, "r": 547.16687, "b": 443.35675, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 21, "end_row_offset_idx": 22, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "10", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 446.62366, "r": 530.53522, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 22, "end_row_offset_idx": 23, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.7 Verifying function usage IDs for RCAC with the FUNCTION_USAGE view . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.0755, "t": 446.62366, "r": 547.15601, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 22, "end_row_offset_idx": 23, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "10", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79704, "t": 459.10355, "r": 547.25659, "b": 468.31653, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 23, "end_row_offset_idx": 24, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.2 Separation of duties . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79703, "t": 481.60318, "r": 530.53961, "b": 490.81616, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 24, "end_row_offset_idx": 25, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Chapter 3. Row and Column Access Control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.09167, "t": 481.60318, "r": 547.1958, "b": 490.81616, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 24, "end_row_offset_idx": 25, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "13", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79703, "t": 493.603, "r": 530.4809, "b": 502.81598, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 25, "end_row_offset_idx": 26, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.1 Explanation of RCAC and the concept of access control . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.04248, "t": 493.603, "r": 547.16571, "b": 502.81598, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 25, "end_row_offset_idx": 26, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "14", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19719, "t": 506.14264, "r": 378.20786, "b": 515.35562, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 26, "end_row_offset_idx": 27, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.1.1 Row permission and column mask definitions", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 383.74713, "t": 506.14264, "r": 547.15576, "b": 515.35562, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 26, "end_row_offset_idx": 27, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . 14", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19719, "t": 518.62253, "r": 530.43475, "b": 527.83551, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 27, "end_row_offset_idx": 28, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.1.2 Enabling and activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 535.99622, "t": 518.62253, "r": 547.11908, "b": 527.83551, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 27, "end_row_offset_idx": 28, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "16", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79703, "t": 531.1621700000001, "r": 530.52808, "b": 540.37517, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 28, "end_row_offset_idx": 29, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.2 Special registers and built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.06702, "t": 531.1621700000001, "r": 547.14484, "b": 540.37517, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 28, "end_row_offset_idx": 29, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "18", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19719, "t": 543.64204, "r": 530.49786, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 29, "end_row_offset_idx": 30, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.2.1 Special registers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.05188, "t": 543.64204, "r": 547.15991, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 29, "end_row_offset_idx": 30, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "18", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19719, "t": 556.12192, "r": 530.56024, "b": 565.33492, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 30, "end_row_offset_idx": 31, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.2.2 Built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.09912, "t": 556.12192, "r": 547.17688, "b": 565.33492, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 30, "end_row_offset_idx": 31, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "19", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79703, "t": 568.66156, "r": 530.53027, "b": 577.87456, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 31, "end_row_offset_idx": 32, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.3 VERIFY_GROUP_FOR_USER function . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.06152, "t": 568.66156, "r": 547.12402, "b": 577.87456, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 31, "end_row_offset_idx": 32, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "20", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79703, "t": 581.14143, "r": 530.62994, "b": 590.35443, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 32, "end_row_offset_idx": 33, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.4 Establishing and controlling accessibility by using the RCAC rule text . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.16315, "t": 581.14143, "r": 547.22955, "b": 590.35443, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 32, "end_row_offset_idx": 33, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "21", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79701, "t": 593.62131, "r": 530.56512, "b": 615.37395, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 34, "end_row_offset_idx": 35, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.5 SELECT, INSERT, and UPDATE behavior with RCAC 3.6 Human resources example . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 400.32065, "t": 593.62131, "r": 530.48358, "b": 602.8343, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 33, "end_row_offset_idx": 34, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": ". . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.0224, "t": 593.62131, "r": 547.1001, "b": 602.8343, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 33, "end_row_offset_idx": 34, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "22", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.112, "t": 606.16095, "r": 547.20575, "b": 615.37395, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 34, "end_row_offset_idx": 35, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "22", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717, "t": 618.64082, "r": 530.49139, "b": 627.85382, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 35, "end_row_offset_idx": 36, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.1 Assigning the QIBM_DB_SECADM function ID to the consultants. . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.04633, "t": 618.64082, "r": 547.15619, "b": 627.85382, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 35, "end_row_offset_idx": 36, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "23", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717, "t": 631.1206999999999, "r": 530.56458, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 36, "end_row_offset_idx": 37, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.2 Creating group profiles for the users and their roles . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.09601, "t": 631.1206999999999, "r": 547.15875, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 36, "end_row_offset_idx": 37, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "23", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717, "t": 643.66034, "r": 530.55695, "b": 652.87334, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 37, "end_row_offset_idx": 38, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.3 Demonstrating data access without RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.0882, "t": 643.66034, "r": 547.15076, "b": 652.87334, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 37, "end_row_offset_idx": 38, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "24", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717, "t": 656.14021, "r": 530.53412, "b": 665.35321, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 38, "end_row_offset_idx": 39, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.4 Defining and creating row permissions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.073, "t": 656.14021, "r": 547.15088, "b": 665.35321, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 38, "end_row_offset_idx": 39, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "25", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717, "t": 668.62009, "r": 339.45105, "b": 677.83309, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 39, "end_row_offset_idx": 40, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.5 Defining and creating column masks", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 344.98996, "t": 668.62009, "r": 547.16089, "b": 677.83309, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 39, "end_row_offset_idx": 40, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717, "t": 681.15973, "r": 530.54102, "b": 690.37273, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 40, "end_row_offset_idx": 41, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.6 Activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.08765, "t": 681.15973, "r": 547.18085, "b": 690.37273, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 40, "end_row_offset_idx": 41, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "28", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717, "t": 693.63961, "r": 530.57507, "b": 702.852615, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 41, "end_row_offset_idx": 42, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.7 Demonstrating data access with RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.10663, "t": 693.63961, "r": 547.16968, "b": 702.852615, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 41, "end_row_offset_idx": 42, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "29", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717, "t": 706.119492, "r": 530.43628, "b": 715.332497, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 42, "end_row_offset_idx": 43, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.8 Demonstrating data access with a view and RCAC . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 535.99847, "t": 706.119492, "r": 547.12286, "b": 715.332497, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 42, "end_row_offset_idx": 43, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "32", "column_header": false, "row_header": false, "row_section": false}]}], "body": [{"label": "section_header", "id": 1, "page_no": 1, "cluster": {"id": 1, "label": "section_header", "bbox": {"l": 64.800003, "t": 73.84802000000002, "r": 168.73441, "b": 96.04803000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9509142637252808, "cells": [{"id": 2, "text": "Contents", "bbox": {"l": 64.800003, "t": 73.84802000000002, "r": 168.73441, "b": 96.04803000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Contents"}, {"label": "document_index", "id": 0, "page_no": 1, "cluster": {"id": 0, "label": "document_index", "bbox": {"l": 136.1496124267578, "t": 132.0330352783203, "r": 547.5267944335938, "b": 715.6515502929688, "coord_origin": "TOPLEFT"}, "confidence": 0.9803681373596191, "cells": [{"id": 3, "text": "Notices", "bbox": {"l": 136.8, "t": 132.64862000000005, "r": 172.89404, "b": 141.86163, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vii", "bbox": {"l": 175.01952, "t": 132.64862000000005, "r": 547.18982, "b": 141.86163, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Trademarks", "bbox": {"l": 136.79901, "t": 145.12847999999997, "r": 189.86537, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 195.39685, "t": 145.12847999999997, "r": 530.05121, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "viii", "bbox": {"l": 535.5827, "t": 145.12847999999997, "r": 547.18286, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "DB2 for i Center of Excellence", "bbox": {"l": 136.79901, "t": 167.62811, "r": 279.39731, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ix", "bbox": {"l": 280.61942, "t": 167.62811, "r": 547.1908, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Preface", "bbox": {"l": 136.79901, "t": 190.12775, "r": 172.84424, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi", "bbox": {"l": 175.01852, "t": 190.12775, "r": 547.18286, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Authors . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi", "bbox": {"l": 136.79803, "t": 202.60760000000005, "r": 547.18085, "b": 211.82061999999996, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Now you can become a published author, too!", "bbox": {"l": 136.79803, "t": 215.14721999999995, "r": 339.18292, "b": 224.36023, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 344.71411, "t": 215.14721999999995, "r": 530.00812, "b": 224.36023, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "xiii", "bbox": {"l": 535.53925, "t": 215.14721999999995, "r": 547.13879, "b": 224.36023, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Comments welcome. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 136.79803, "t": 227.62707999999998, "r": 529.99506, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "xiii", "bbox": {"l": 535.5495, "t": 227.62707999999998, "r": 547.19788, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Stay connected to IBM Redbooks", "bbox": {"l": 136.79807, "t": 240.10693000000003, "r": 284.02866, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 289.54449, "t": 240.10693000000003, "r": 529.48242, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "xiv", "bbox": {"l": 534.99829, "t": 240.10693000000003, "r": 547.12115, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Chapter 1. Securing and protecting IBM DB2 data", "bbox": {"l": 136.79807, "t": 262.60657000000003, "r": 373.17566, "b": 271.81958, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 375.11798, "t": 262.60657000000003, "r": 536.09589, "b": 271.81958, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "1", "bbox": {"l": 541.64685, "t": 262.60657000000003, "r": 547.19781, "b": 271.81958, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "1.1", "bbox": {"l": 136.79808, "t": 274.60637999999994, "r": 150.88702, "b": 283.8194, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "Security fundamentals. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2", "bbox": {"l": 156.5226, "t": 274.60637999999994, "r": 549.84723, "b": 283.8194, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "1.2", "bbox": {"l": 136.79807, "t": 287.14606000000003, "r": 150.62746, "b": 296.35904, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Current state of IBM i security . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.15923, "t": 287.14606000000003, "r": 536.12933, "b": 296.35904, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "2", "bbox": {"l": 541.66113, "t": 287.14606000000003, "r": 547.19287, "b": 296.35904, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "1.3", "bbox": {"l": 136.79807, "t": 299.62595, "r": 150.84943, "b": 308.83893, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "DB2 for i security controls . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3", "bbox": {"l": 156.46996, "t": 299.62595, "r": 549.84723, "b": 308.83893, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "1.3.1", "bbox": {"l": 151.1972, "t": 312.1058300000001, "r": 173.38289, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Existing row and column control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.92932, "t": 312.1058300000001, "r": 536.05511, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "4", "bbox": {"l": 541.6015, "t": 312.1058300000001, "r": 547.14795, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "1.3.2", "bbox": {"l": 151.1972, "t": 324.64548, "r": 173.4189, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "New controls: Row and Column Access Control. . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.97432, "t": 324.64548, "r": 536.08008, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "5", "bbox": {"l": 541.6355, "t": 324.64548, "r": 547.19092, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "Chapter 2. Roles and separation of duties", "bbox": {"l": 136.79704, "t": 347.14511, "r": 336.82071, "b": 356.35809, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 338.99701, "t": 347.14511, "r": 536.09088, "b": 356.35809, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "7", "bbox": {"l": 541.64282, "t": 347.14511, "r": 547.19476, "b": 356.35809, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "2.1", "bbox": {"l": 136.79704, "t": 359.14493, "r": 150.644, "b": 368.35791, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "Roles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.18277, "t": 359.14493, "r": 536.12714, "b": 368.35791, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "8", "bbox": {"l": 541.66589, "t": 359.14493, "r": 547.20471, "b": 368.35791, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "2.1.1", "bbox": {"l": 151.1972, "t": 371.62482, "r": 173.60995, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "DDM and DRDA application server access: QIBM_DB_DDMDRDA . . . . . . . . . . .", "bbox": {"l": 176.41154, "t": 371.62482, "r": 535.9527, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "8", "bbox": {"l": 541.55585, "t": 371.62482, "r": 547.15906, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "2.1.2", "bbox": {"l": 151.1972, "t": 384.10470999999995, "r": 173.41664, "b": 393.31769, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "Toolbox application server access: QIBM_DB_ZDA. . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.97151, "t": 384.10470999999995, "r": 536.04108, "b": 393.31769, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "8", "bbox": {"l": 541.59595, "t": 384.10470999999995, "r": 547.15082, "b": 393.31769, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "2.1.3", "bbox": {"l": 151.1972, "t": 396.64435, "r": 173.41859, "b": 405.85733, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Database Administrator function: QIBM_DB_SQLADM . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.97394, "t": 396.64435, "r": 536.07489, "b": 405.85733, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "9", "bbox": {"l": 541.63025, "t": 396.64435, "r": 547.18561, "b": 405.85733, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "2.1.4", "bbox": {"l": 151.1972, "t": 409.12424000000004, "r": 173.38629, "b": 418.33722, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "Database Information function: QIBM_DB_SYSMON", "bbox": {"l": 178.93356, "t": 409.12424000000004, "r": 411.27048, "b": 418.33722, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": ". . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 416.81775, "t": 409.12424000000004, "r": 536.08411, "b": 418.33722, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "9", "bbox": {"l": 541.63135, "t": 409.12424000000004, "r": 547.17865, "b": 418.33722, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "2.1.5", "bbox": {"l": 151.1972, "t": 421.60413, "r": 173.44926, "b": 430.81711, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "Security Administrator function: QIBM_DB_SECADM . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 179.01228, "t": 421.60413, "r": 536.03589, "b": 430.81711, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "9", "bbox": {"l": 541.59894, "t": 421.60413, "r": 547.16193, "b": 430.81711, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "2.1.6", "bbox": {"l": 151.1972, "t": 434.1437700000001, "r": 173.32208, "b": 443.35675, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Change Function Usage CL command . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.8533, "t": 434.1437700000001, "r": 530.57318, "b": 443.35675, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "10", "bbox": {"l": 536.10443, "t": 434.1437700000001, "r": 547.16687, "b": 443.35675, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "2.1.7", "bbox": {"l": 151.1972, "t": 446.62366, "r": 173.35822, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "Verifying function usage IDs for RCAC with the FUNCTION_USAGE view . . . . .", "bbox": {"l": 178.89848, "t": 446.62366, "r": 530.53522, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "10", "bbox": {"l": 536.0755, "t": 446.62366, "r": 547.15601, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "2.2", "bbox": {"l": 136.79704, "t": 459.10355, "r": 150.85457, "b": 468.31653, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "Separation of duties . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10", "bbox": {"l": 156.47758, "t": 459.10355, "r": 547.25659, "b": 468.31653, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "Chapter 3. Row and Column Access Control", "bbox": {"l": 136.79703, "t": 481.60318, "r": 348.68503, "b": 490.81616, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 350.09741, "t": 481.60318, "r": 530.53961, "b": 490.81616, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "13", "bbox": {"l": 536.09167, "t": 481.60318, "r": 547.1958, "b": 490.81616, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "3.1", "bbox": {"l": 136.79703, "t": 493.603, "r": 150.70105, "b": 502.81598, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "Explanation of RCAC and the concept of access control . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.26266, "t": 493.603, "r": 530.4809, "b": 502.81598, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "14", "bbox": {"l": 536.04248, "t": 493.603, "r": 547.16571, "b": 502.81598, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "3.1.1", "bbox": {"l": 151.19719, "t": 506.14264, "r": 173.35429, "b": 515.35562, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "Row permission and column mask definitions", "bbox": {"l": 178.89357, "t": 506.14264, "r": 378.20786, "b": 515.35562, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 383.74713, "t": 506.14264, "r": 530.5379, "b": 515.35562, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "14", "bbox": {"l": 536.07721, "t": 506.14264, "r": 547.15576, "b": 515.35562, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "3.1.2", "bbox": {"l": 151.19719, "t": 518.62253, "r": 173.44292, "b": 527.83551, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "Enabling and activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 179.00435, "t": 518.62253, "r": 530.43475, "b": 527.83551, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "16", "bbox": {"l": 535.99622, "t": 518.62253, "r": 547.11908, "b": 527.83551, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "3.2", "bbox": {"l": 136.79703, "t": 531.1621700000001, "r": 150.64432, "b": 540.37517, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "Special registers and built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.18323, "t": 531.1621700000001, "r": 530.52808, "b": 540.37517, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "18", "bbox": {"l": 536.06702, "t": 531.1621700000001, "r": 547.14484, "b": 540.37517, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "3.2.1", "bbox": {"l": 151.19719, "t": 543.64204, "r": 173.41321, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "Special registers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.96722, "t": 543.64204, "r": 530.49786, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "18", "bbox": {"l": 536.05188, "t": 543.64204, "r": 547.15991, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": "3.2.2", "bbox": {"l": 151.19719, "t": 556.12192, "r": 173.35269, "b": 565.33492, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "Built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.89156, "t": 556.12192, "r": 530.56024, "b": 565.33492, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "19", "bbox": {"l": 536.09912, "t": 556.12192, "r": 547.17688, "b": 565.33492, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "3.3", "bbox": {"l": 136.79703, "t": 568.66156, "r": 150.62514, "b": 577.87456, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": "VERIFY_GROUP_FOR_USER function . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.15639, "t": 568.66156, "r": 530.53027, "b": 577.87456, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "20", "bbox": {"l": 536.06152, "t": 568.66156, "r": 547.12402, "b": 577.87456, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "3.4", "bbox": {"l": 136.79703, "t": 581.14143, "r": 150.63004, "b": 590.35443, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "Establishing and controlling accessibility by using the RCAC rule text . . . . . . . . . . . . .", "bbox": {"l": 156.16325, "t": 581.14143, "r": 530.62994, "b": 590.35443, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "21", "bbox": {"l": 536.16315, "t": 581.14143, "r": 547.22955, "b": 590.35443, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "3.5", "bbox": {"l": 136.79701, "t": 593.62131, "r": 150.64413, "b": 602.8343, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "SELECT, INSERT, and UPDATE behavior with RCAC", "bbox": {"l": 156.18298, "t": 593.62131, "r": 394.7818, "b": 602.8343, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": ". . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 400.32065, "t": 593.62131, "r": 530.48358, "b": 602.8343, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "22", "bbox": {"l": 536.0224, "t": 593.62131, "r": 547.1001, "b": 602.8343, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": "3.6", "bbox": {"l": 136.79701, "t": 606.16095, "r": 150.6642, "b": 615.37395, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "Human resources example . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.21107, "t": 606.16095, "r": 530.56512, "b": 615.37395, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "22", "bbox": {"l": 536.112, "t": 606.16095, "r": 547.20575, "b": 615.37395, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "3.6.1", "bbox": {"l": 151.19717, "t": 618.64082, "r": 173.41692, "b": 627.85382, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "Assigning the QIBM_DB_SECADM function ID to the consultants. . . . . . . . . . . .", "bbox": {"l": 178.97185, "t": 618.64082, "r": 530.49139, "b": 627.85382, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "23", "bbox": {"l": 536.04633, "t": 618.64082, "r": 547.15619, "b": 627.85382, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "3.6.2", "bbox": {"l": 151.19717, "t": 631.1206999999999, "r": 173.32271, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "Creating group profiles for the users and their roles . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.8541, "t": 631.1206999999999, "r": 530.56458, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "23", "bbox": {"l": 536.09601, "t": 631.1206999999999, "r": 547.15875, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "3.6.3", "bbox": {"l": 151.19717, "t": 643.66034, "r": 173.32227, "b": 652.87334, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "Demonstrating data access without RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.85353, "t": 643.66034, "r": 530.55695, "b": 652.87334, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "24", "bbox": {"l": 536.0882, "t": 643.66034, "r": 547.15076, "b": 652.87334, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "3.6.4", "bbox": {"l": 151.19717, "t": 656.14021, "r": 173.35289, "b": 665.35321, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "Defining and creating row permissions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.89182, "t": 656.14021, "r": 530.53412, "b": 665.35321, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "25", "bbox": {"l": 536.073, "t": 656.14021, "r": 547.15088, "b": 665.35321, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "3.6.5", "bbox": {"l": 151.19717, "t": 668.62009, "r": 173.35289, "b": 677.83309, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "Defining and creating column masks", "bbox": {"l": 178.89182, "t": 668.62009, "r": 339.45105, "b": 677.83309, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 344.98996, "t": 668.62009, "r": 530.54413, "b": 677.83309, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "26", "bbox": {"l": 536.08301, "t": 668.62009, "r": 547.16089, "b": 677.83309, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "3.6.6", "bbox": {"l": 151.19717, "t": 681.15973, "r": 173.38359, "b": 690.37273, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "Activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.93019, "t": 681.15973, "r": 530.54102, "b": 690.37273, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "28", "bbox": {"l": 536.08765, "t": 681.15973, "r": 547.18085, "b": 690.37273, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "3.6.7", "bbox": {"l": 151.19717, "t": 693.63961, "r": 173.32332, "b": 702.852615, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "Demonstrating data access with RCAC", "bbox": {"l": 178.85486, "t": 693.63961, "r": 350.80011, "b": 702.852615, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 356.33163, "t": 693.63961, "r": 530.57507, "b": 702.852615, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "29", "bbox": {"l": 536.10663, "t": 693.63961, "r": 547.16968, "b": 702.852615, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "3.6.8", "bbox": {"l": 151.19717, "t": 706.119492, "r": 173.44592, "b": 715.332497, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "Demonstrating data access with a view and RCAC . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 179.00812, "t": 706.119492, "r": 530.43628, "b": 715.332497, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "32", "bbox": {"l": 535.99847, "t": 706.119492, "r": 547.12286, "b": 715.332497, "coord_origin": "TOPLEFT"}}], "children": [{"id": 4, "label": "text", "bbox": {"l": 136.8, "t": 132.64862000000005, "r": 172.89404, "b": 141.86163, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 3, "text": "Notices", "bbox": {"l": 136.8, "t": 132.64862000000005, "r": 172.89404, "b": 141.86163, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "text", "bbox": {"l": 175.01952, "t": 132.64862000000005, "r": 547.18982, "b": 141.86163, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 4, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vii", "bbox": {"l": 175.01952, "t": 132.64862000000005, "r": 547.18982, "b": 141.86163, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "text", "bbox": {"l": 136.79901, "t": 145.12847999999997, "r": 189.86537, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 5, "text": "Trademarks", "bbox": {"l": 136.79901, "t": 145.12847999999997, "r": 189.86537, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "text", "bbox": {"l": 195.39685, "t": 145.12847999999997, "r": 530.05121, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 6, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 195.39685, "t": 145.12847999999997, "r": 530.05121, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "text", "bbox": {"l": 535.5827, "t": 145.12847999999997, "r": 547.18286, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 7, "text": "viii", "bbox": {"l": 535.5827, "t": 145.12847999999997, "r": 547.18286, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 136.79901, "t": 167.62811, "r": 279.39731, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 8, "text": "DB2 for i Center of Excellence", "bbox": {"l": 136.79901, "t": 167.62811, "r": 279.39731, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "text", "bbox": {"l": 280.61942, "t": 167.62811, "r": 547.1908, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 9, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ix", "bbox": {"l": 280.61942, "t": 167.62811, "r": 547.1908, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 136.79901, "t": 190.12775, "r": 172.84424, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 10, "text": "Preface", "bbox": {"l": 136.79901, "t": 190.12775, "r": 172.84424, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 175.01852, "t": 190.12775, "r": 547.18286, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi", "bbox": {"l": 175.01852, "t": 190.12775, "r": 547.18286, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 136.79803, "t": 202.60760000000005, "r": 547.18085, "b": 211.82061999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "Authors . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi", "bbox": {"l": 136.79803, "t": 202.60760000000005, "r": 547.18085, "b": 211.82061999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 136.79803, "t": 215.14721999999995, "r": 339.18292, "b": 224.36023, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "Now you can become a published author, too!", "bbox": {"l": 136.79803, "t": 215.14721999999995, "r": 339.18292, "b": 224.36023, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 344.71411, "t": 215.14721999999995, "r": 530.00812, "b": 224.36023, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 344.71411, "t": 215.14721999999995, "r": 530.00812, "b": 224.36023, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 535.53925, "t": 215.14721999999995, "r": 547.13879, "b": 224.36023, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": "xiii", "bbox": {"l": 535.53925, "t": 215.14721999999995, "r": 547.13879, "b": 224.36023, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 136.79803, "t": 227.62707999999998, "r": 529.99506, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "Comments welcome. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 136.79803, "t": 227.62707999999998, "r": 529.99506, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 535.5495, "t": 227.62707999999998, "r": 547.19788, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "xiii", "bbox": {"l": 535.5495, "t": 227.62707999999998, "r": 547.19788, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 136.79807, "t": 240.10693000000003, "r": 284.02866, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "Stay connected to IBM Redbooks", "bbox": {"l": 136.79807, "t": 240.10693000000003, "r": 284.02866, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 289.54449, "t": 240.10693000000003, "r": 529.48242, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 289.54449, "t": 240.10693000000003, "r": 529.48242, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 534.99829, "t": 240.10693000000003, "r": 547.12115, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": "xiv", "bbox": {"l": 534.99829, "t": 240.10693000000003, "r": 547.12115, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 136.79807, "t": 262.60657000000003, "r": 373.17566, "b": 271.81958, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "Chapter 1. Securing and protecting IBM DB2 data", "bbox": {"l": 136.79807, "t": 262.60657000000003, "r": 373.17566, "b": 271.81958, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 375.11798, "t": 262.60657000000003, "r": 536.09589, "b": 271.81958, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": " . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 375.11798, "t": 262.60657000000003, "r": 536.09589, "b": 271.81958, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 541.64685, "t": 262.60657000000003, "r": 547.19781, "b": 271.81958, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "1", "bbox": {"l": 541.64685, "t": 262.60657000000003, "r": 547.19781, "b": 271.81958, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 136.79808, "t": 274.60637999999994, "r": 150.88702, "b": 283.8194, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "1.1", "bbox": {"l": 136.79808, "t": 274.60637999999994, "r": 150.88702, "b": 283.8194, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 156.5226, "t": 274.60637999999994, "r": 549.84723, "b": 283.8194, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "Security fundamentals. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2", "bbox": {"l": 156.5226, "t": 274.60637999999994, "r": 549.84723, "b": 283.8194, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 136.79807, "t": 287.14606000000003, "r": 150.62746, "b": 296.35904, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "1.2", "bbox": {"l": 136.79807, "t": 287.14606000000003, "r": 150.62746, "b": 296.35904, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 156.15923, "t": 287.14606000000003, "r": 536.12933, "b": 296.35904, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "Current state of IBM i security . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.15923, "t": 287.14606000000003, "r": 536.12933, "b": 296.35904, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 541.66113, "t": 287.14606000000003, "r": 547.19287, "b": 296.35904, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "2", "bbox": {"l": 541.66113, "t": 287.14606000000003, "r": 547.19287, "b": 296.35904, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 136.79807, "t": 299.62595, "r": 150.84943, "b": 308.83893, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "1.3", "bbox": {"l": 136.79807, "t": 299.62595, "r": 150.84943, "b": 308.83893, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 156.46996, "t": 299.62595, "r": 549.84723, "b": 308.83893, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "DB2 for i security controls . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3", "bbox": {"l": 156.46996, "t": 299.62595, "r": 549.84723, "b": 308.83893, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 151.1972, "t": 312.1058300000001, "r": 173.38289, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "1.3.1", "bbox": {"l": 151.1972, "t": 312.1058300000001, "r": 173.38289, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 178.92932, "t": 312.1058300000001, "r": 536.05511, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "Existing row and column control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.92932, "t": 312.1058300000001, "r": 536.05511, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 541.6015, "t": 312.1058300000001, "r": 547.14795, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "4", "bbox": {"l": 541.6015, "t": 312.1058300000001, "r": 547.14795, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 151.1972, "t": 324.64548, "r": 173.4189, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "1.3.2", "bbox": {"l": 151.1972, "t": 324.64548, "r": 173.4189, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 178.97432, "t": 324.64548, "r": 536.08008, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "New controls: Row and Column Access Control. . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.97432, "t": 324.64548, "r": 536.08008, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 541.6355, "t": 324.64548, "r": 547.19092, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "5", "bbox": {"l": 541.6355, "t": 324.64548, "r": 547.19092, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 136.79704, "t": 347.14511, "r": 336.82071, "b": 356.35809, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "Chapter 2. Roles and separation of duties", "bbox": {"l": 136.79704, "t": 347.14511, "r": 336.82071, "b": 356.35809, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 338.99701, "t": 347.14511, "r": 536.09088, "b": 356.35809, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 338.99701, "t": 347.14511, "r": 536.09088, "b": 356.35809, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 541.64282, "t": 347.14511, "r": 547.19476, "b": 356.35809, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "7", "bbox": {"l": 541.64282, "t": 347.14511, "r": 547.19476, "b": 356.35809, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 136.79704, "t": 359.14493, "r": 150.644, "b": 368.35791, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "2.1", "bbox": {"l": 136.79704, "t": 359.14493, "r": 150.644, "b": 368.35791, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 156.18277, "t": 359.14493, "r": 536.12714, "b": 368.35791, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "Roles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.18277, "t": 359.14493, "r": 536.12714, "b": 368.35791, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 541.66589, "t": 359.14493, "r": 547.20471, "b": 368.35791, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "8", "bbox": {"l": 541.66589, "t": 359.14493, "r": 547.20471, "b": 368.35791, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 151.1972, "t": 371.62482, "r": 173.60995, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "2.1.1", "bbox": {"l": 151.1972, "t": 371.62482, "r": 173.60995, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 176.41154, "t": 371.62482, "r": 535.9527, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "DDM and DRDA application server access: QIBM_DB_DDMDRDA . . . . . . . . . . .", "bbox": {"l": 176.41154, "t": 371.62482, "r": 535.9527, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 541.55585, "t": 371.62482, "r": 547.15906, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "8", "bbox": {"l": 541.55585, "t": 371.62482, "r": 547.15906, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 151.1972, "t": 384.10470999999995, "r": 173.41664, "b": 393.31769, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "2.1.2", "bbox": {"l": 151.1972, "t": 384.10470999999995, "r": 173.41664, "b": 393.31769, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 178.97151, "t": 384.10470999999995, "r": 536.04108, "b": 393.31769, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "Toolbox application server access: QIBM_DB_ZDA. . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.97151, "t": 384.10470999999995, "r": 536.04108, "b": 393.31769, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 541.59595, "t": 384.10470999999995, "r": 547.15082, "b": 393.31769, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "8", "bbox": {"l": 541.59595, "t": 384.10470999999995, "r": 547.15082, "b": 393.31769, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 151.1972, "t": 396.64435, "r": 173.41859, "b": 405.85733, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "2.1.3", "bbox": {"l": 151.1972, "t": 396.64435, "r": 173.41859, "b": 405.85733, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 178.97394, "t": 396.64435, "r": 536.07489, "b": 405.85733, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "Database Administrator function: QIBM_DB_SQLADM . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.97394, "t": 396.64435, "r": 536.07489, "b": 405.85733, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 541.63025, "t": 396.64435, "r": 547.18561, "b": 405.85733, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "9", "bbox": {"l": 541.63025, "t": 396.64435, "r": 547.18561, "b": 405.85733, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 151.1972, "t": 409.12424000000004, "r": 173.38629, "b": 418.33722, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "2.1.4", "bbox": {"l": 151.1972, "t": 409.12424000000004, "r": 173.38629, "b": 418.33722, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 178.93356, "t": 409.12424000000004, "r": 411.27048, "b": 418.33722, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "Database Information function: QIBM_DB_SYSMON", "bbox": {"l": 178.93356, "t": 409.12424000000004, "r": 411.27048, "b": 418.33722, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 416.81775, "t": 409.12424000000004, "r": 536.08411, "b": 418.33722, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": ". . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 416.81775, "t": 409.12424000000004, "r": 536.08411, "b": 418.33722, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 541.63135, "t": 409.12424000000004, "r": 547.17865, "b": 418.33722, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "9", "bbox": {"l": 541.63135, "t": 409.12424000000004, "r": 547.17865, "b": 418.33722, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 151.1972, "t": 421.60413, "r": 173.44926, "b": 430.81711, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "2.1.5", "bbox": {"l": 151.1972, "t": 421.60413, "r": 173.44926, "b": 430.81711, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 179.01228, "t": 421.60413, "r": 536.03589, "b": 430.81711, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "Security Administrator function: QIBM_DB_SECADM . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 179.01228, "t": 421.60413, "r": 536.03589, "b": 430.81711, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 541.59894, "t": 421.60413, "r": 547.16193, "b": 430.81711, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "9", "bbox": {"l": 541.59894, "t": 421.60413, "r": 547.16193, "b": 430.81711, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 151.1972, "t": 434.1437700000001, "r": 173.32208, "b": 443.35675, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "2.1.6", "bbox": {"l": 151.1972, "t": 434.1437700000001, "r": 173.32208, "b": 443.35675, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 178.8533, "t": 434.1437700000001, "r": 530.57318, "b": 443.35675, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "Change Function Usage CL command . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.8533, "t": 434.1437700000001, "r": 530.57318, "b": 443.35675, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 536.10443, "t": 434.1437700000001, "r": 547.16687, "b": 443.35675, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "10", "bbox": {"l": 536.10443, "t": 434.1437700000001, "r": 547.16687, "b": 443.35675, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 151.1972, "t": 446.62366, "r": 173.35822, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "2.1.7", "bbox": {"l": 151.1972, "t": 446.62366, "r": 173.35822, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 178.89848, "t": 446.62366, "r": 530.53522, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "Verifying function usage IDs for RCAC with the FUNCTION_USAGE view . . . . .", "bbox": {"l": 178.89848, "t": 446.62366, "r": 530.53522, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 65, "label": "text", "bbox": {"l": 536.0755, "t": 446.62366, "r": 547.15601, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "10", "bbox": {"l": 536.0755, "t": 446.62366, "r": 547.15601, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 66, "label": "text", "bbox": {"l": 136.79704, "t": 459.10355, "r": 150.85457, "b": 468.31653, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "2.2", "bbox": {"l": 136.79704, "t": 459.10355, "r": 150.85457, "b": 468.31653, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 67, "label": "text", "bbox": {"l": 156.47758, "t": 459.10355, "r": 547.25659, "b": 468.31653, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "Separation of duties . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10", "bbox": {"l": 156.47758, "t": 459.10355, "r": 547.25659, "b": 468.31653, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 68, "label": "text", "bbox": {"l": 136.79703, "t": 481.60318, "r": 348.68503, "b": 490.81616, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "Chapter 3. Row and Column Access Control", "bbox": {"l": 136.79703, "t": 481.60318, "r": 348.68503, "b": 490.81616, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 69, "label": "text", "bbox": {"l": 350.09741, "t": 481.60318, "r": 530.53961, "b": 490.81616, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 350.09741, "t": 481.60318, "r": 530.53961, "b": 490.81616, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 70, "label": "text", "bbox": {"l": 536.09167, "t": 481.60318, "r": 547.1958, "b": 490.81616, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "13", "bbox": {"l": 536.09167, "t": 481.60318, "r": 547.1958, "b": 490.81616, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 71, "label": "text", "bbox": {"l": 136.79703, "t": 493.603, "r": 150.70105, "b": 502.81598, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "3.1", "bbox": {"l": 136.79703, "t": 493.603, "r": 150.70105, "b": 502.81598, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 72, "label": "text", "bbox": {"l": 156.26266, "t": 493.603, "r": 530.4809, "b": 502.81598, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "Explanation of RCAC and the concept of access control . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.26266, "t": 493.603, "r": 530.4809, "b": 502.81598, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 73, "label": "text", "bbox": {"l": 536.04248, "t": 493.603, "r": 547.16571, "b": 502.81598, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "14", "bbox": {"l": 536.04248, "t": 493.603, "r": 547.16571, "b": 502.81598, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 74, "label": "text", "bbox": {"l": 151.19719, "t": 506.14264, "r": 173.35429, "b": 515.35562, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "3.1.1", "bbox": {"l": 151.19719, "t": 506.14264, "r": 173.35429, "b": 515.35562, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 75, "label": "text", "bbox": {"l": 178.89357, "t": 506.14264, "r": 378.20786, "b": 515.35562, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "Row permission and column mask definitions", "bbox": {"l": 178.89357, "t": 506.14264, "r": 378.20786, "b": 515.35562, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 76, "label": "text", "bbox": {"l": 383.74713, "t": 506.14264, "r": 530.5379, "b": 515.35562, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 383.74713, "t": 506.14264, "r": 530.5379, "b": 515.35562, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 77, "label": "text", "bbox": {"l": 536.07721, "t": 506.14264, "r": 547.15576, "b": 515.35562, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "14", "bbox": {"l": 536.07721, "t": 506.14264, "r": 547.15576, "b": 515.35562, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 78, "label": "text", "bbox": {"l": 151.19719, "t": 518.62253, "r": 173.44292, "b": 527.83551, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "3.1.2", "bbox": {"l": 151.19719, "t": 518.62253, "r": 173.44292, "b": 527.83551, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 79, "label": "text", "bbox": {"l": 179.00435, "t": 518.62253, "r": 530.43475, "b": 527.83551, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "Enabling and activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 179.00435, "t": 518.62253, "r": 530.43475, "b": 527.83551, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 80, "label": "text", "bbox": {"l": 535.99622, "t": 518.62253, "r": 547.11908, "b": 527.83551, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 79, "text": "16", "bbox": {"l": 535.99622, "t": 518.62253, "r": 547.11908, "b": 527.83551, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 81, "label": "text", "bbox": {"l": 136.79703, "t": 531.1621700000001, "r": 150.64432, "b": 540.37517, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 80, "text": "3.2", "bbox": {"l": 136.79703, "t": 531.1621700000001, "r": 150.64432, "b": 540.37517, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 82, "label": "text", "bbox": {"l": 156.18323, "t": 531.1621700000001, "r": 530.52808, "b": 540.37517, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 81, "text": "Special registers and built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.18323, "t": 531.1621700000001, "r": 530.52808, "b": 540.37517, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 83, "label": "text", "bbox": {"l": 536.06702, "t": 531.1621700000001, "r": 547.14484, "b": 540.37517, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 82, "text": "18", "bbox": {"l": 536.06702, "t": 531.1621700000001, "r": 547.14484, "b": 540.37517, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 84, "label": "text", "bbox": {"l": 151.19719, "t": 543.64204, "r": 173.41321, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 83, "text": "3.2.1", "bbox": {"l": 151.19719, "t": 543.64204, "r": 173.41321, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 85, "label": "text", "bbox": {"l": 178.96722, "t": 543.64204, "r": 530.49786, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 84, "text": "Special registers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.96722, "t": 543.64204, "r": 530.49786, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 86, "label": "text", "bbox": {"l": 536.05188, "t": 543.64204, "r": 547.15991, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 85, "text": "18", "bbox": {"l": 536.05188, "t": 543.64204, "r": 547.15991, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 87, "label": "text", "bbox": {"l": 151.19719, "t": 556.12192, "r": 173.35269, "b": 565.33492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 86, "text": "3.2.2", "bbox": {"l": 151.19719, "t": 556.12192, "r": 173.35269, "b": 565.33492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 88, "label": "text", "bbox": {"l": 178.89156, "t": 556.12192, "r": 530.56024, "b": 565.33492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 87, "text": "Built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.89156, "t": 556.12192, "r": 530.56024, "b": 565.33492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 89, "label": "text", "bbox": {"l": 536.09912, "t": 556.12192, "r": 547.17688, "b": 565.33492, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 88, "text": "19", "bbox": {"l": 536.09912, "t": 556.12192, "r": 547.17688, "b": 565.33492, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 90, "label": "text", "bbox": {"l": 136.79703, "t": 568.66156, "r": 150.62514, "b": 577.87456, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 89, "text": "3.3", "bbox": {"l": 136.79703, "t": 568.66156, "r": 150.62514, "b": 577.87456, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 91, "label": "text", "bbox": {"l": 156.15639, "t": 568.66156, "r": 530.53027, "b": 577.87456, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 90, "text": "VERIFY_GROUP_FOR_USER function . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.15639, "t": 568.66156, "r": 530.53027, "b": 577.87456, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 92, "label": "text", "bbox": {"l": 536.06152, "t": 568.66156, "r": 547.12402, "b": 577.87456, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 91, "text": "20", "bbox": {"l": 536.06152, "t": 568.66156, "r": 547.12402, "b": 577.87456, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 93, "label": "text", "bbox": {"l": 136.79703, "t": 581.14143, "r": 150.63004, "b": 590.35443, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 92, "text": "3.4", "bbox": {"l": 136.79703, "t": 581.14143, "r": 150.63004, "b": 590.35443, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 94, "label": "text", "bbox": {"l": 156.16325, "t": 581.14143, "r": 530.62994, "b": 590.35443, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 93, "text": "Establishing and controlling accessibility by using the RCAC rule text . . . . . . . . . . . . .", "bbox": {"l": 156.16325, "t": 581.14143, "r": 530.62994, "b": 590.35443, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 95, "label": "text", "bbox": {"l": 536.16315, "t": 581.14143, "r": 547.22955, "b": 590.35443, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 94, "text": "21", "bbox": {"l": 536.16315, "t": 581.14143, "r": 547.22955, "b": 590.35443, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 96, "label": "text", "bbox": {"l": 136.79701, "t": 593.62131, "r": 150.64413, "b": 602.8343, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 95, "text": "3.5", "bbox": {"l": 136.79701, "t": 593.62131, "r": 150.64413, "b": 602.8343, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 97, "label": "text", "bbox": {"l": 156.18298, "t": 593.62131, "r": 394.7818, "b": 602.8343, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 96, "text": "SELECT, INSERT, and UPDATE behavior with RCAC", "bbox": {"l": 156.18298, "t": 593.62131, "r": 394.7818, "b": 602.8343, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 98, "label": "text", "bbox": {"l": 400.32065, "t": 593.62131, "r": 530.48358, "b": 602.8343, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 97, "text": ". . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 400.32065, "t": 593.62131, "r": 530.48358, "b": 602.8343, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 99, "label": "text", "bbox": {"l": 536.0224, "t": 593.62131, "r": 547.1001, "b": 602.8343, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 98, "text": "22", "bbox": {"l": 536.0224, "t": 593.62131, "r": 547.1001, "b": 602.8343, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 100, "label": "text", "bbox": {"l": 136.79701, "t": 606.16095, "r": 150.6642, "b": 615.37395, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 99, "text": "3.6", "bbox": {"l": 136.79701, "t": 606.16095, "r": 150.6642, "b": 615.37395, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 101, "label": "text", "bbox": {"l": 156.21107, "t": 606.16095, "r": 530.56512, "b": 615.37395, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 100, "text": "Human resources example . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 156.21107, "t": 606.16095, "r": 530.56512, "b": 615.37395, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 102, "label": "text", "bbox": {"l": 536.112, "t": 606.16095, "r": 547.20575, "b": 615.37395, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 101, "text": "22", "bbox": {"l": 536.112, "t": 606.16095, "r": 547.20575, "b": 615.37395, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 103, "label": "text", "bbox": {"l": 151.19717, "t": 618.64082, "r": 173.41692, "b": 627.85382, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 102, "text": "3.6.1", "bbox": {"l": 151.19717, "t": 618.64082, "r": 173.41692, "b": 627.85382, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 104, "label": "text", "bbox": {"l": 178.97185, "t": 618.64082, "r": 530.49139, "b": 627.85382, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 103, "text": "Assigning the QIBM_DB_SECADM function ID to the consultants. . . . . . . . . . . .", "bbox": {"l": 178.97185, "t": 618.64082, "r": 530.49139, "b": 627.85382, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 105, "label": "text", "bbox": {"l": 536.04633, "t": 618.64082, "r": 547.15619, "b": 627.85382, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 104, "text": "23", "bbox": {"l": 536.04633, "t": 618.64082, "r": 547.15619, "b": 627.85382, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 106, "label": "text", "bbox": {"l": 151.19717, "t": 631.1206999999999, "r": 173.32271, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 105, "text": "3.6.2", "bbox": {"l": 151.19717, "t": 631.1206999999999, "r": 173.32271, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 107, "label": "text", "bbox": {"l": 178.8541, "t": 631.1206999999999, "r": 530.56458, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 106, "text": "Creating group profiles for the users and their roles . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.8541, "t": 631.1206999999999, "r": 530.56458, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 108, "label": "text", "bbox": {"l": 536.09601, "t": 631.1206999999999, "r": 547.15875, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 107, "text": "23", "bbox": {"l": 536.09601, "t": 631.1206999999999, "r": 547.15875, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 109, "label": "text", "bbox": {"l": 151.19717, "t": 643.66034, "r": 173.32227, "b": 652.87334, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 108, "text": "3.6.3", "bbox": {"l": 151.19717, "t": 643.66034, "r": 173.32227, "b": 652.87334, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 110, "label": "text", "bbox": {"l": 178.85353, "t": 643.66034, "r": 530.55695, "b": 652.87334, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 109, "text": "Demonstrating data access without RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.85353, "t": 643.66034, "r": 530.55695, "b": 652.87334, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 111, "label": "text", "bbox": {"l": 536.0882, "t": 643.66034, "r": 547.15076, "b": 652.87334, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 110, "text": "24", "bbox": {"l": 536.0882, "t": 643.66034, "r": 547.15076, "b": 652.87334, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 112, "label": "text", "bbox": {"l": 151.19717, "t": 656.14021, "r": 173.35289, "b": 665.35321, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 111, "text": "3.6.4", "bbox": {"l": 151.19717, "t": 656.14021, "r": 173.35289, "b": 665.35321, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 113, "label": "text", "bbox": {"l": 178.89182, "t": 656.14021, "r": 530.53412, "b": 665.35321, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 112, "text": "Defining and creating row permissions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.89182, "t": 656.14021, "r": 530.53412, "b": 665.35321, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 114, "label": "text", "bbox": {"l": 536.073, "t": 656.14021, "r": 547.15088, "b": 665.35321, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 113, "text": "25", "bbox": {"l": 536.073, "t": 656.14021, "r": 547.15088, "b": 665.35321, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 115, "label": "text", "bbox": {"l": 151.19717, "t": 668.62009, "r": 173.35289, "b": 677.83309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 114, "text": "3.6.5", "bbox": {"l": 151.19717, "t": 668.62009, "r": 173.35289, "b": 677.83309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 116, "label": "text", "bbox": {"l": 178.89182, "t": 668.62009, "r": 339.45105, "b": 677.83309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 115, "text": "Defining and creating column masks", "bbox": {"l": 178.89182, "t": 668.62009, "r": 339.45105, "b": 677.83309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 117, "label": "text", "bbox": {"l": 344.98996, "t": 668.62009, "r": 530.54413, "b": 677.83309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 116, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 344.98996, "t": 668.62009, "r": 530.54413, "b": 677.83309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 118, "label": "text", "bbox": {"l": 536.08301, "t": 668.62009, "r": 547.16089, "b": 677.83309, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 117, "text": "26", "bbox": {"l": 536.08301, "t": 668.62009, "r": 547.16089, "b": 677.83309, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 119, "label": "text", "bbox": {"l": 151.19717, "t": 681.15973, "r": 173.38359, "b": 690.37273, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 118, "text": "3.6.6", "bbox": {"l": 151.19717, "t": 681.15973, "r": 173.38359, "b": 690.37273, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 120, "label": "text", "bbox": {"l": 178.93019, "t": 681.15973, "r": 530.54102, "b": 690.37273, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 119, "text": "Activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 178.93019, "t": 681.15973, "r": 530.54102, "b": 690.37273, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 121, "label": "text", "bbox": {"l": 536.08765, "t": 681.15973, "r": 547.18085, "b": 690.37273, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 120, "text": "28", "bbox": {"l": 536.08765, "t": 681.15973, "r": 547.18085, "b": 690.37273, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 122, "label": "text", "bbox": {"l": 151.19717, "t": 693.63961, "r": 173.32332, "b": 702.852615, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 121, "text": "3.6.7", "bbox": {"l": 151.19717, "t": 693.63961, "r": 173.32332, "b": 702.852615, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 123, "label": "text", "bbox": {"l": 178.85486, "t": 693.63961, "r": 350.80011, "b": 702.852615, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 122, "text": "Demonstrating data access with RCAC", "bbox": {"l": 178.85486, "t": 693.63961, "r": 350.80011, "b": 702.852615, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 124, "label": "text", "bbox": {"l": 356.33163, "t": 693.63961, "r": 530.57507, "b": 702.852615, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 123, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 356.33163, "t": 693.63961, "r": 530.57507, "b": 702.852615, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 125, "label": "text", "bbox": {"l": 536.10663, "t": 693.63961, "r": 547.16968, "b": 702.852615, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 124, "text": "29", "bbox": {"l": 536.10663, "t": 693.63961, "r": 547.16968, "b": 702.852615, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 126, "label": "text", "bbox": {"l": 151.19717, "t": 706.119492, "r": 173.44592, "b": 715.332497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 125, "text": "3.6.8", "bbox": {"l": 151.19717, "t": 706.119492, "r": 173.44592, "b": 715.332497, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 127, "label": "text", "bbox": {"l": 179.00812, "t": 706.119492, "r": 530.43628, "b": 715.332497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 126, "text": "Demonstrating data access with a view and RCAC . . . . . . . . . . . . . . . . . . . . . . .", "bbox": {"l": 179.00812, "t": 706.119492, "r": 530.43628, "b": 715.332497, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 128, "label": "text", "bbox": {"l": 535.99847, "t": 706.119492, "r": 547.12286, "b": 715.332497, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 127, "text": "32", "bbox": {"l": 535.99847, "t": 706.119492, "r": 547.12286, "b": 715.332497, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 43, "num_cols": 2, "table_cells": [{"bbox": {"l": 136.8, "t": 132.64862000000005, "r": 172.89404, "b": 141.86163, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Notices", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 175.01952, "t": 132.64862000000005, "r": 547.18982, "b": 141.86163, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vii", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79901, "t": 145.12847999999997, "r": 189.86537, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Trademarks", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 195.39685, "t": 145.12847999999997, "r": 547.18286, "b": 154.34149000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . viii", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79901, "t": 167.62811, "r": 279.39731, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "DB2 for i Center of Excellence", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 280.61942, "t": 167.62811, "r": 547.1908, "b": 176.84113000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ix", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79901, "t": 190.12775, "r": 172.84424, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Preface", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 175.01852, "t": 190.12775, "r": 547.18286, "b": 199.34076000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79803, "t": 202.60760000000005, "r": 547.18085, "b": 211.82061999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Authors . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79803, "t": 215.14721999999995, "r": 339.18292, "b": 224.36023, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Now you can become a published author, too!", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 344.71411, "t": 215.14721999999995, "r": 547.13879, "b": 224.36023, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xiii", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79803, "t": 227.62707999999998, "r": 529.99506, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Comments welcome. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 535.5495, "t": 227.62707999999998, "r": 547.19788, "b": 236.84009000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "xiii", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79807, "t": 240.10693000000003, "r": 284.02866, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Stay connected to IBM Redbooks", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.54449, "t": 240.10693000000003, "r": 547.12115, "b": 249.31994999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xiv", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79807, "t": 262.60657000000003, "r": 536.09589, "b": 271.81958, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Chapter 1. Securing and protecting IBM DB2 data  . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.64685, "t": 262.60657000000003, "r": 547.19781, "b": 271.81958, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "1", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79808, "t": 274.60637999999994, "r": 549.84723, "b": 283.8194, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "1.1 Security fundamentals. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79807, "t": 287.14606000000003, "r": 536.12933, "b": 296.35904, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "1.2 Current state of IBM i security . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.66113, "t": 287.14606000000003, "r": 547.19287, "b": 296.35904, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "2", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79807, "t": 299.62595, "r": 549.84723, "b": 308.83893, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "1.3 DB2 for i security controls . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 312.1058300000001, "r": 536.05511, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "1.3.1 Existing row and column control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.6015, "t": 312.1058300000001, "r": 547.14795, "b": 321.3188200000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "4", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 324.64548, "r": 536.08008, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "1.3.2 New controls: Row and Column Access Control. . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.6355, "t": 324.64548, "r": 547.19092, "b": 333.8584599999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 13, "end_row_offset_idx": 14, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "5", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79704, "t": 347.14511, "r": 536.09088, "b": 356.35809, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 14, "end_row_offset_idx": 15, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Chapter 2. Roles and separation of duties . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.64282, "t": 347.14511, "r": 547.19476, "b": 356.35809, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 14, "end_row_offset_idx": 15, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "7", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79704, "t": 359.14493, "r": 536.12714, "b": 368.35791, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 15, "end_row_offset_idx": 16, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1 Roles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.66589, "t": 359.14493, "r": 547.20471, "b": 368.35791, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 15, "end_row_offset_idx": 16, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 371.62482, "r": 535.9527, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 16, "end_row_offset_idx": 17, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.1 DDM and DRDA application server access: QIBM_DB_DDMDRDA . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.55585, "t": 371.62482, "r": 547.15906, "b": 380.8378000000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 16, "end_row_offset_idx": 17, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 384.10470999999995, "r": 536.04108, "b": 393.31769, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 17, "end_row_offset_idx": 18, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.2 Toolbox application server access: QIBM_DB_ZDA. . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.59595, "t": 384.10470999999995, "r": 547.15082, "b": 393.31769, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 17, "end_row_offset_idx": 18, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "8", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 396.64435, "r": 536.07489, "b": 405.85733, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 18, "end_row_offset_idx": 19, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.3 Database Administrator function: QIBM_DB_SQLADM . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.63025, "t": 396.64435, "r": 547.18561, "b": 405.85733, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 18, "end_row_offset_idx": 19, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 409.12424000000004, "r": 411.27048, "b": 418.33722, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 19, "end_row_offset_idx": 20, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.4 Database Information function: QIBM_DB_SYSMON", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 416.81775, "t": 409.12424000000004, "r": 547.17865, "b": 418.33722, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 19, "end_row_offset_idx": 20, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . 9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 421.60413, "r": 536.03589, "b": 430.81711, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 20, "end_row_offset_idx": 21, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.5 Security Administrator function: QIBM_DB_SECADM . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 541.59894, "t": 421.60413, "r": 547.16193, "b": 430.81711, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 20, "end_row_offset_idx": 21, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "9", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 434.1437700000001, "r": 530.57318, "b": 443.35675, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 21, "end_row_offset_idx": 22, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.6 Change Function Usage CL command . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.10443, "t": 434.1437700000001, "r": 547.16687, "b": 443.35675, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 21, "end_row_offset_idx": 22, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "10", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.1972, "t": 446.62366, "r": 530.53522, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 22, "end_row_offset_idx": 23, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.1.7 Verifying function usage IDs for RCAC with the FUNCTION_USAGE view . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.0755, "t": 446.62366, "r": 547.15601, "b": 455.83663999999993, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 22, "end_row_offset_idx": 23, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "10", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79704, "t": 459.10355, "r": 547.25659, "b": 468.31653, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 23, "end_row_offset_idx": 24, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "2.2 Separation of duties . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79703, "t": 481.60318, "r": 530.53961, "b": 490.81616, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 24, "end_row_offset_idx": 25, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Chapter 3. Row and Column Access Control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.09167, "t": 481.60318, "r": 547.1958, "b": 490.81616, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 24, "end_row_offset_idx": 25, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "13", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79703, "t": 493.603, "r": 530.4809, "b": 502.81598, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 25, "end_row_offset_idx": 26, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.1 Explanation of RCAC and the concept of access control . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.04248, "t": 493.603, "r": 547.16571, "b": 502.81598, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 25, "end_row_offset_idx": 26, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "14", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19719, "t": 506.14264, "r": 378.20786, "b": 515.35562, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 26, "end_row_offset_idx": 27, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.1.1 Row permission and column mask definitions", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 383.74713, "t": 506.14264, "r": 547.15576, "b": 515.35562, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 26, "end_row_offset_idx": 27, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . 14", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19719, "t": 518.62253, "r": 530.43475, "b": 527.83551, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 27, "end_row_offset_idx": 28, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.1.2 Enabling and activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 535.99622, "t": 518.62253, "r": 547.11908, "b": 527.83551, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 27, "end_row_offset_idx": 28, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "16", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79703, "t": 531.1621700000001, "r": 530.52808, "b": 540.37517, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 28, "end_row_offset_idx": 29, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.2 Special registers and built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.06702, "t": 531.1621700000001, "r": 547.14484, "b": 540.37517, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 28, "end_row_offset_idx": 29, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "18", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19719, "t": 543.64204, "r": 530.49786, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 29, "end_row_offset_idx": 30, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.2.1 Special registers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.05188, "t": 543.64204, "r": 547.15991, "b": 552.8550399999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 29, "end_row_offset_idx": 30, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "18", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19719, "t": 556.12192, "r": 530.56024, "b": 565.33492, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 30, "end_row_offset_idx": 31, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.2.2 Built-in global variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.09912, "t": 556.12192, "r": 547.17688, "b": 565.33492, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 30, "end_row_offset_idx": 31, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "19", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79703, "t": 568.66156, "r": 530.53027, "b": 577.87456, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 31, "end_row_offset_idx": 32, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.3 VERIFY_GROUP_FOR_USER function . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.06152, "t": 568.66156, "r": 547.12402, "b": 577.87456, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 31, "end_row_offset_idx": 32, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "20", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79703, "t": 581.14143, "r": 530.62994, "b": 590.35443, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 32, "end_row_offset_idx": 33, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.4 Establishing and controlling accessibility by using the RCAC rule text . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.16315, "t": 581.14143, "r": 547.22955, "b": 590.35443, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 32, "end_row_offset_idx": 33, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "21", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 136.79701, "t": 593.62131, "r": 530.56512, "b": 615.37395, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 34, "end_row_offset_idx": 35, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.5 SELECT, INSERT, and UPDATE behavior with RCAC 3.6 Human resources example . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 400.32065, "t": 593.62131, "r": 530.48358, "b": 602.8343, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 33, "end_row_offset_idx": 34, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": ". . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.0224, "t": 593.62131, "r": 547.1001, "b": 602.8343, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 33, "end_row_offset_idx": 34, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "22", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.112, "t": 606.16095, "r": 547.20575, "b": 615.37395, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 34, "end_row_offset_idx": 35, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "22", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717, "t": 618.64082, "r": 530.49139, "b": 627.85382, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 35, "end_row_offset_idx": 36, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.1 Assigning the QIBM_DB_SECADM function ID to the consultants. . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.04633, "t": 618.64082, "r": 547.15619, "b": 627.85382, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 35, "end_row_offset_idx": 36, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "23", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717, "t": 631.1206999999999, "r": 530.56458, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 36, "end_row_offset_idx": 37, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.2 Creating group profiles for the users and their roles . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.09601, "t": 631.1206999999999, "r": 547.15875, "b": 640.3336899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 36, "end_row_offset_idx": 37, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "23", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717, "t": 643.66034, "r": 530.55695, "b": 652.87334, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 37, "end_row_offset_idx": 38, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.3 Demonstrating data access without RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.0882, "t": 643.66034, "r": 547.15076, "b": 652.87334, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 37, "end_row_offset_idx": 38, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "24", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717, "t": 656.14021, "r": 530.53412, "b": 665.35321, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 38, "end_row_offset_idx": 39, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.4 Defining and creating row permissions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.073, "t": 656.14021, "r": 547.15088, "b": 665.35321, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 38, "end_row_offset_idx": 39, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "25", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717, "t": 668.62009, "r": 339.45105, "b": 677.83309, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 39, "end_row_offset_idx": 40, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.5 Defining and creating column masks", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 344.98996, "t": 668.62009, "r": 547.16089, "b": 677.83309, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 39, "end_row_offset_idx": 40, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": ". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717, "t": 681.15973, "r": 530.54102, "b": 690.37273, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 40, "end_row_offset_idx": 41, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.6 Activating RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.08765, "t": 681.15973, "r": 547.18085, "b": 690.37273, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 40, "end_row_offset_idx": 41, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "28", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717, "t": 693.63961, "r": 530.57507, "b": 702.852615, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 41, "end_row_offset_idx": 42, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.7 Demonstrating data access with RCAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 536.10663, "t": 693.63961, "r": 547.16968, "b": 702.852615, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 41, "end_row_offset_idx": 42, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "29", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 151.19717, "t": 706.119492, "r": 530.43628, "b": 715.332497, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 42, "end_row_offset_idx": 43, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "3.6.8 Demonstrating data access with a view and RCAC . . . . . . . . . . . . . . . . . . . . . . .", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 535.99847, "t": 706.119492, "r": 547.12286, "b": 715.332497, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 42, "end_row_offset_idx": 43, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "32", "column_header": false, "row_header": false, "row_section": false}]}], "headers": [{"label": "page_footer", "id": 2, "page_no": 1, "cluster": {"id": 2, "label": "page_footer", "bbox": {"l": 64.800003, "t": 755.538002, "r": 257.24335, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9473597407341003, "cells": [{"id": 0, "text": "' Copyright IBM Corp. 2014. All rights reserved.", "bbox": {"l": 64.800003, "t": 755.538002, "r": 257.24335, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "' Copyright IBM Corp. 2014. All rights reserved."}, {"label": "page_footer", "id": 3, "page_no": 1, "cluster": {"id": 3, "label": "page_footer", "bbox": {"l": 538.85999, "t": 754.848721, "r": 547.25928, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.8926277160644531, "cells": [{"id": 1, "text": "iii", "bbox": {"l": 538.85999, "t": 754.848721, "r": 547.25928, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "iii"}]}}, {"page_no": 2, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "DB2 for i Center of Excellence", "bbox": {"l": 64.800003, "t": 74.48395000000005, "r": 235.8624, "b": 85.58398, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Solution Brief", "bbox": {"l": 94.132698, "t": 148.63933999999995, "r": 139.54634, "b": 155.33642999999995, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "IBM Systems Lab Services and Training", "bbox": {"l": 94.134933, "t": 138.45012999999994, "r": 233.99973, "b": 145.22162000000003, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Power Services", "bbox": {"l": 461.08859000000007, "t": 138.40752999999995, "r": 506.26178, "b": 145.42181000000005, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "DB2 for i", "bbox": {"l": 280.24011, "t": 239.34265000000005, "r": 354.57022, "b": 256.26153999999997, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Center of Excellence ", "bbox": {"l": 280.24011, "t": 259.70165999999995, "r": 463.80942, "b": 276.62054, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Expert help to achieve your business requirements", "bbox": {"l": 280.24011, "t": 277.59027000000003, "r": 483.29572, "b": 287.45959, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "We build confident, satisfied clients", "bbox": {"l": 280.24011, "t": 315.88161999999994, "r": 443.28210000000007, "b": 324.89566, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "No one else has the vast consulting experiences, skills sharing and ", "bbox": {"l": 280.24011, "t": 327.37595, "r": 488.15466, "b": 334.77994, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "renown service offerings to do what we can do for you.", "bbox": {"l": 280.24011, "t": 337.55551, "r": 452.34018, "b": 344.9595, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Because no one else is IBM.", "bbox": {"l": 280.24011, "t": 357.3260200000001, "r": 367.86023, "b": 364.73001, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "With combined experiences and direct access to development groups, ", "bbox": {"l": 280.24011, "t": 377.09801999999996, "r": 500.32104000000004, "b": 384.50201, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "we\u2019re the experts in IBM DB2\u00ae for i. The DB2 for i Center of ", "bbox": {"l": 280.24011, "t": 387.27759, "r": 479.25497, "b": 394.68158, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Excellence (CoE) can help you achieve-perhaps reexamine and ", "bbox": {"l": 280.24011, "t": 397.45715, "r": 483.4667400000001, "b": 404.86115, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "exceed-your business requirements and gain more confidence and ", "bbox": {"l": 280.24011, "t": 407.63672, "r": 492.97656, "b": 415.04071000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "satisfaction in IBM product data management products and solutions.", "bbox": {"l": 280.24011, "t": 417.81628, "r": 498.87, "b": 425.22027999999995, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Who we are, some of what we do", "bbox": {"l": 280.24011, "t": 437.85403, "r": 434.83205999999996, "b": 446.86807, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "Global CoE engagements cover topics including:", "bbox": {"l": 280.24011, "t": 449.34824000000003, "r": 434.56316999999996, "b": 456.75223, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "r ", "bbox": {"l": 280.24011, "t": 470.95236, "r": 284.0993, "b": 476.16074, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Database performance and scalability", "bbox": {"l": 287.28961, "t": 469.11826, "r": 401.56412, "b": 476.52225, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "r ", "bbox": {"l": 280.24011, "t": 481.13507, "r": 284.0993, "b": 486.34344, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Advanced SQL knowledge and skills transfer", "bbox": {"l": 287.28961, "t": 479.30096, "r": 424.99646, "b": 486.70496, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "r ", "bbox": {"l": 280.24011, "t": 491.31766, "r": 284.0993, "b": 496.52603, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Business intelligence and analytics", "bbox": {"l": 287.28961, "t": 489.48355, "r": 392.15845, "b": 496.88754, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "r ", "bbox": {"l": 280.24011, "t": 501.50037, "r": 284.0993, "b": 506.70874, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "DB2 Web Query", "bbox": {"l": 287.28961, "t": 499.66626, "r": 339.94354, "b": 507.07025, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "r ", "bbox": {"l": 280.24011, "t": 511.68295, "r": 284.0993, "b": 516.8913299999999, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Query/400 modernization for better reporting and analysis capabilities", "bbox": {"l": 287.28961, "t": 509.84885, "r": 504.19314999999995, "b": 517.25284, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "r ", "bbox": {"l": 280.24011, "t": 521.8656599999999, "r": 284.0993, "b": 527.07404, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Database modernization and re-engineering", "bbox": {"l": 287.28961, "t": 520.03156, "r": 423.0022, "b": 527.4355499999999, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "r ", "bbox": {"l": 280.24011, "t": 532.04825, "r": 284.0993, "b": 537.2566400000001, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Data-centric architecture and design", "bbox": {"l": 287.28961, "t": 530.21414, "r": 399.65173, "b": 537.61813, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "r ", "bbox": {"l": 280.24011, "t": 542.23083, "r": 284.0993, "b": 547.43924, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "Extremely large database and overcoming limits to growth", "bbox": {"l": 287.28961, "t": 540.39674, "r": 466.77881, "b": 547.80074, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "r ", "bbox": {"l": 280.24011, "t": 552.41354, "r": 284.0993, "b": 557.62195, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "ISV education and enablement", "bbox": {"l": 287.28961, "t": 550.5794500000001, "r": 382.20956, "b": 557.98344, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "Highlights ", "bbox": {"l": 144.88921, "t": 327.46163999999993, "r": 188.74681, "b": 336.81406, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "GLYPH<g115>GLYPH<g3>", "bbox": {"l": 144.88921, "t": 346.01953, "r": 148.68732, "b": 350.60168, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "GLYPH<g40>GLYPH<g81>GLYPH<g75>GLYPH<g68>GLYPH<g81>GLYPH<g70>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 151.9388, "t": 345.21707, "r": 177.25424, "b": 350.85666, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "GLYPH<g87>GLYPH<g75>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 176.9472, "t": 345.21707, "r": 187.11098, "b": 350.85666, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g73>GLYPH<g82>GLYPH<g85>GLYPH<g80>GLYPH<g68>GLYPH<g81>GLYPH<g70>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 186.7914, "t": 345.21707, "r": 222.95989999999998, "b": 350.85666, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "GLYPH<g82>GLYPH<g73>GLYPH<g3>", "bbox": {"l": 222.65912, "t": 345.21707, "r": 229.55193999999997, "b": 350.85666, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "GLYPH<g92>GLYPH<g82>GLYPH<g88>GLYPH<g85> GLYPH<g3>", "bbox": {"l": 229.2261, "t": 345.21707, "r": 242.87389000000002, "b": 350.85666, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "GLYPH<g71>GLYPH<g68>GLYPH<g87>GLYPH<g68>GLYPH<g69>GLYPH<g68>GLYPH<g86>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 151.93253, "t": 353.04984, "r": 178.77066, "b": 358.68942, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "GLYPH<g82>GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g68>GLYPH<g87>GLYPH<g76>GLYPH<g82>GLYPH<g81>GLYPH<g86>", "bbox": {"l": 178.46362, "t": 353.04984, "r": 207.16908, "b": 358.68942, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "GLYPH<g115>GLYPH<g3>", "bbox": {"l": 144.88921, "t": 368.73465, "r": 148.68732, "b": 373.3168, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "GLYPH<g40>GLYPH<g68>GLYPH<g85> GLYPH<g81>GLYPH<g3>", "bbox": {"l": 151.9388, "t": 367.93219, "r": 166.05655, "b": 373.57178, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "GLYPH<g74>GLYPH<g85>GLYPH<g72>GLYPH<g68>GLYPH<g87>GLYPH<g72>GLYPH<g85>GLYPH<g3>", "bbox": {"l": 165.73697, "t": 367.93219, "r": 186.40289, "b": 373.57178, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "GLYPH<g85>GLYPH<g72>GLYPH<g87>GLYPH<g88>GLYPH<g85> GLYPH<g81>GLYPH<g3>", "bbox": {"l": 186.09586, "t": 367.93219, "r": 203.61617, "b": 373.57178, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "GLYPH<g82>GLYPH<g81>GLYPH<g3>", "bbox": {"l": 203.30286, "t": 367.93219, "r": 211.82489, "b": 373.57178, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "GLYPH<g44>GLYPH<g55>GLYPH<g3>", "bbox": {"l": 211.49905, "t": 367.93219, "r": 218.16002, "b": 373.57178, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "GLYPH<g83>GLYPH<g85>GLYPH<g82>GLYPH<g77>GLYPH<g72>GLYPH<g70>GLYPH<g87>GLYPH<g86> GLYPH<g3>", "bbox": {"l": 217.83418, "t": 367.93219, "r": 241.30737, "b": 373.57178, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "GLYPH<g87>GLYPH<g75>GLYPH<g85>GLYPH<g82>GLYPH<g88>GLYPH<g74>GLYPH<g75>GLYPH<g3>", "bbox": {"l": 151.93253, "t": 375.76495, "r": 174.46577, "b": 381.40454, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "GLYPH<g80>GLYPH<g82>GLYPH<g71>GLYPH<g72>GLYPH<g85> GLYPH<g81>GLYPH<g76>GLYPH<g93>GLYPH<g68>GLYPH<g87>GLYPH<g76>GLYPH<g82>GLYPH<g81>GLYPH<g3>", "bbox": {"l": 174.15874, "t": 375.76495, "r": 214.4128, "b": 381.40454, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "GLYPH<g82>GLYPH<g73>GLYPH<g3>", "bbox": {"l": 214.11829, "t": 375.76495, "r": 221.01110999999997, "b": 381.40454, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "GLYPH<g71>GLYPH<g68>GLYPH<g87>GLYPH<g68>GLYPH<g69>GLYPH<g68>GLYPH<g86>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 220.68527, "t": 375.76495, "r": 247.52341000000004, "b": 381.40454, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "GLYPH<g68>GLYPH<g81>GLYPH<g71> GLYPH<g3>", "bbox": {"l": 247.21637, "t": 375.76495, "r": 259.2287, "b": 381.40454, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "GLYPH<g68>GLYPH<g83>GLYPH<g83>GLYPH<g79>GLYPH<g76>GLYPH<g70>GLYPH<g68>GLYPH<g87>GLYPH<g76>GLYPH<g82>GLYPH<g81>GLYPH<g86>", "bbox": {"l": 151.93253, "t": 383.59772, "r": 184.61703, "b": 389.2373, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "GLYPH<g115>GLYPH<g3>", "bbox": {"l": 144.88921, "t": 399.28265, "r": 148.68732, "b": 403.86481000000003, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "GLYPH<g53>GLYPH<g72>GLYPH<g79>GLYPH<g92>GLYPH<g3>", "bbox": {"l": 151.9388, "t": 398.48019, "r": 165.36099, "b": 404.11978, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "GLYPH<g82>GLYPH<g81>GLYPH<g3>", "bbox": {"l": 165.04141, "t": 398.48019, "r": 173.56345, "b": 404.11978, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "GLYPH<g44>GLYPH<g37>GLYPH<g48>GLYPH<g3>", "bbox": {"l": 173.23761, "t": 398.48019, "r": 185.95174, "b": 404.11978, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "GLYPH<g72>GLYPH<g91>GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g87>GLYPH<g3>", "bbox": {"l": 185.63216, "t": 398.48019, "r": 204.42448, "b": 404.11978, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "GLYPH<g70>GLYPH<g82>GLYPH<g81>GLYPH<g86>GLYPH<g88>GLYPH<g79>GLYPH<g87>GLYPH<g76>GLYPH<g81>GLYPH<g74>GLYPH<g15>GLYPH<g3>", "bbox": {"l": 204.11118, "t": 398.48019, "r": 235.29178, "b": 404.11978, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "GLYPH<g86>GLYPH<g78>GLYPH<g76>GLYPH<g79>GLYPH<g79>GLYPH<g86> GLYPH<g3>", "bbox": {"l": 234.99099999999999, "t": 398.48019, "r": 249.83562, "b": 404.11978, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "GLYPH<g86>GLYPH<g75>GLYPH<g68>GLYPH<g85>GLYPH<g76>GLYPH<g81>GLYPH<g74>GLYPH<g3>", "bbox": {"l": 151.93253, "t": 406.31296, "r": 173.41306, "b": 411.95255, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "GLYPH<g68>GLYPH<g81>GLYPH<g71>GLYPH<g3>", "bbox": {"l": 173.10602, "t": 406.31296, "r": 185.0118, "b": 411.95255, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "GLYPH<g85>GLYPH<g72>GLYPH<g81>GLYPH<g82>GLYPH<g90>GLYPH<g81>GLYPH<g3>", "bbox": {"l": 184.69221, "t": 406.31296, "r": 206.3858, "b": 411.95255, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "GLYPH<g86>GLYPH<g72>GLYPH<g85>GLYPH<g89>GLYPH<g76>GLYPH<g70>GLYPH<g72>GLYPH<g86>", "bbox": {"l": 206.07249, "t": 406.31296, "r": 228.24231000000003, "b": 411.95255, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "GLYPH<g115>GLYPH<g3>", "bbox": {"l": 144.88921, "t": 421.99773999999996, "r": 148.68732, "b": 426.5799, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "GLYPH<g55>", "bbox": {"l": 151.9388, "t": 421.1952800000001, "r": 155.43533, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "GLYPH<g68>GLYPH<g78>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 154.73979, "t": 421.1952800000001, "r": 166.06282, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "GLYPH<g68>GLYPH<g71>GLYPH<g89>GLYPH<g68>GLYPH<g81>GLYPH<g87>GLYPH<g68>GLYPH<g74>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 165.74324, "t": 421.1952800000001, "r": 195.84607, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "GLYPH<g82>GLYPH<g73>GLYPH<g3>", "bbox": {"l": 195.53903, "t": 421.1952800000001, "r": 202.43185, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "GLYPH<g68>GLYPH<g70>GLYPH<g70>GLYPH<g72>GLYPH<g86>GLYPH<g86>GLYPH<g3>", "bbox": {"l": 202.10602, "t": 421.1952800000001, "r": 222.87220999999997, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "GLYPH<g87>GLYPH<g82>GLYPH<g3>", "bbox": {"l": 222.55890000000002, "t": 421.1952800000001, "r": 229.57077, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "GLYPH<g68> GLYPH<g3>", "bbox": {"l": 229.24492999999998, "t": 421.1952800000001, "r": 234.25163000000003, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "GLYPH<g90>GLYPH<g82>GLYPH<g85>GLYPH<g79>GLYPH<g71>GLYPH<g90>GLYPH<g76>GLYPH<g71>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 151.92627, "t": 429.02805, "r": 181.42754, "b": 434.66763, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "GLYPH<g86>GLYPH<g82>GLYPH<g88>GLYPH<g85>GLYPH<g70>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 181.1205, "t": 429.02805, "r": 201.07835, "b": 434.66763, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "GLYPH<g82>GLYPH<g73>GLYPH<g3>", "bbox": {"l": 200.76505, "t": 429.02805, "r": 207.65787, "b": 434.66763, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "GLYPH<g72>GLYPH<g91>GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g87>GLYPH<g76>GLYPH<g86>GLYPH<g72>", "bbox": {"l": 207.33203, "t": 429.02805, "r": 232.07098000000002, "b": 434.66763, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 26, "label": "text", "bbox": {"l": 64.800003, "t": 74.48395000000005, "r": 235.8624, "b": 85.58398, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 0, "text": "DB2 for i Center of Excellence", "bbox": {"l": 64.800003, "t": 74.48395000000005, "r": 235.8624, "b": 85.58398, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 94.132698, "t": 138.45012999999994, "r": 233.99973, "b": 155.33642999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.7431555986404419, "cells": [{"id": 1, "text": "Solution Brief", "bbox": {"l": 94.132698, "t": 148.63933999999995, "r": 139.54634, "b": 155.33642999999995, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "IBM Systems Lab Services and Training", "bbox": {"l": 94.134933, "t": 138.45012999999994, "r": 233.99973, "b": 145.22162000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 461.08859000000007, "t": 138.40752999999995, "r": 506.26178, "b": 145.42181000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.7798982858657837, "cells": [{"id": 3, "text": "Power Services", "bbox": {"l": 461.08859000000007, "t": 138.40752999999995, "r": 506.26178, "b": 145.42181000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "section_header", "bbox": {"l": 280.24011, "t": 239.34265000000005, "r": 463.80942, "b": 276.62054, "coord_origin": "TOPLEFT"}, "confidence": 0.7587865591049194, "cells": [{"id": 4, "text": "DB2 for i", "bbox": {"l": 280.24011, "t": 239.34265000000005, "r": 354.57022, "b": 256.26153999999997, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Center of Excellence ", "bbox": {"l": 280.24011, "t": 259.70165999999995, "r": 463.80942, "b": 276.62054, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 280.24011, "t": 277.59027000000003, "r": 483.29572, "b": 287.45959, "coord_origin": "TOPLEFT"}, "confidence": 0.7965622544288635, "cells": [{"id": 6, "text": "Expert help to achieve your business requirements", "bbox": {"l": 280.24011, "t": 277.59027000000003, "r": 483.29572, "b": 287.45959, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "section_header", "bbox": {"l": 280.24011, "t": 315.88161999999994, "r": 443.28210000000007, "b": 324.89566, "coord_origin": "TOPLEFT"}, "confidence": 0.8913541436195374, "cells": [{"id": 7, "text": "We build confident, satisfied clients", "bbox": {"l": 280.24011, "t": 315.88161999999994, "r": 443.28210000000007, "b": 324.89566, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 280.24011, "t": 327.37595, "r": 488.15466, "b": 344.9595, "coord_origin": "TOPLEFT"}, "confidence": 0.9560741782188416, "cells": [{"id": 8, "text": "No one else has the vast consulting experiences, skills sharing and ", "bbox": {"l": 280.24011, "t": 327.37595, "r": 488.15466, "b": 334.77994, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "renown service offerings to do what we can do for you.", "bbox": {"l": 280.24011, "t": 337.55551, "r": 452.34018, "b": 344.9595, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 280.24011, "t": 357.3260200000001, "r": 367.86023, "b": 364.73001, "coord_origin": "TOPLEFT"}, "confidence": 0.8260757923126221, "cells": [{"id": 10, "text": "Because no one else is IBM.", "bbox": {"l": 280.24011, "t": 357.3260200000001, "r": 367.86023, "b": 364.73001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 280.24011, "t": 377.09801999999996, "r": 500.32104000000004, "b": 425.22027999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9764723181724548, "cells": [{"id": 11, "text": "With combined experiences and direct access to development groups, ", "bbox": {"l": 280.24011, "t": 377.09801999999996, "r": 500.32104000000004, "b": 384.50201, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "we\u2019re the experts in IBM DB2\u00ae for i. The DB2 for i Center of ", "bbox": {"l": 280.24011, "t": 387.27759, "r": 479.25497, "b": 394.68158, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Excellence (CoE) can help you achieve-perhaps reexamine and ", "bbox": {"l": 280.24011, "t": 397.45715, "r": 483.4667400000001, "b": 404.86115, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "exceed-your business requirements and gain more confidence and ", "bbox": {"l": 280.24011, "t": 407.63672, "r": 492.97656, "b": 415.04071000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "satisfaction in IBM product data management products and solutions.", "bbox": {"l": 280.24011, "t": 417.81628, "r": 498.87, "b": 425.22027999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "section_header", "bbox": {"l": 280.24011, "t": 437.85403, "r": 434.83205999999996, "b": 446.86807, "coord_origin": "TOPLEFT"}, "confidence": 0.8492127060890198, "cells": [{"id": 16, "text": "Who we are, some of what we do", "bbox": {"l": 280.24011, "t": 437.85403, "r": 434.83205999999996, "b": 446.86807, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 280.24011, "t": 449.34824000000003, "r": 434.56316999999996, "b": 456.75223, "coord_origin": "TOPLEFT"}, "confidence": 0.8440335392951965, "cells": [{"id": 17, "text": "Global CoE engagements cover topics including:", "bbox": {"l": 280.24011, "t": 449.34824000000003, "r": 434.56316999999996, "b": 456.75223, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "list_item", "bbox": {"l": 280.24011, "t": 469.11826, "r": 401.56412, "b": 476.52225, "coord_origin": "TOPLEFT"}, "confidence": 0.9239600896835327, "cells": [{"id": 18, "text": "r ", "bbox": {"l": 280.24011, "t": 470.95236, "r": 284.0993, "b": 476.16074, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Database performance and scalability", "bbox": {"l": 287.28961, "t": 469.11826, "r": 401.56412, "b": 476.52225, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "list_item", "bbox": {"l": 280.24011, "t": 479.30096, "r": 424.99646, "b": 486.70496, "coord_origin": "TOPLEFT"}, "confidence": 0.9239721298217773, "cells": [{"id": 20, "text": "r ", "bbox": {"l": 280.24011, "t": 481.13507, "r": 284.0993, "b": 486.34344, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Advanced SQL knowledge and skills transfer", "bbox": {"l": 287.28961, "t": 479.30096, "r": 424.99646, "b": 486.70496, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "list_item", "bbox": {"l": 280.24011, "t": 489.48355, "r": 392.15845, "b": 496.88754, "coord_origin": "TOPLEFT"}, "confidence": 0.9157900214195251, "cells": [{"id": 22, "text": "r ", "bbox": {"l": 280.24011, "t": 491.31766, "r": 284.0993, "b": 496.52603, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Business intelligence and analytics", "bbox": {"l": 287.28961, "t": 489.48355, "r": 392.15845, "b": 496.88754, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "list_item", "bbox": {"l": 280.24011, "t": 499.66626, "r": 339.94354, "b": 507.07025, "coord_origin": "TOPLEFT"}, "confidence": 0.8733457326889038, "cells": [{"id": 24, "text": "r ", "bbox": {"l": 280.24011, "t": 501.50037, "r": 284.0993, "b": 506.70874, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "DB2 Web Query", "bbox": {"l": 287.28961, "t": 499.66626, "r": 339.94354, "b": 507.07025, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "list_item", "bbox": {"l": 280.24011, "t": 509.84885, "r": 504.19314999999995, "b": 517.25284, "coord_origin": "TOPLEFT"}, "confidence": 0.9249242544174194, "cells": [{"id": 26, "text": "r ", "bbox": {"l": 280.24011, "t": 511.68295, "r": 284.0993, "b": 516.8913299999999, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Query/400 modernization for better reporting and analysis capabilities", "bbox": {"l": 287.28961, "t": 509.84885, "r": 504.19314999999995, "b": 517.25284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "list_item", "bbox": {"l": 280.24011, "t": 520.03156, "r": 423.0022, "b": 527.4355499999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9109312891960144, "cells": [{"id": 28, "text": "r ", "bbox": {"l": 280.24011, "t": 521.8656599999999, "r": 284.0993, "b": 527.07404, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Database modernization and re-engineering", "bbox": {"l": 287.28961, "t": 520.03156, "r": 423.0022, "b": 527.4355499999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "list_item", "bbox": {"l": 280.24011, "t": 530.21414, "r": 399.65173, "b": 537.61813, "coord_origin": "TOPLEFT"}, "confidence": 0.8977466225624084, "cells": [{"id": 30, "text": "r ", "bbox": {"l": 280.24011, "t": 532.04825, "r": 284.0993, "b": 537.2566400000001, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Data-centric architecture and design", "bbox": {"l": 287.28961, "t": 530.21414, "r": 399.65173, "b": 537.61813, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "list_item", "bbox": {"l": 280.24011, "t": 540.39674, "r": 466.77881, "b": 547.80074, "coord_origin": "TOPLEFT"}, "confidence": 0.9218331575393677, "cells": [{"id": 32, "text": "r ", "bbox": {"l": 280.24011, "t": 542.23083, "r": 284.0993, "b": 547.43924, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "Extremely large database and overcoming limits to growth", "bbox": {"l": 287.28961, "t": 540.39674, "r": 466.77881, "b": 547.80074, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "list_item", "bbox": {"l": 280.24011, "t": 550.5794500000001, "r": 382.20956, "b": 557.98344, "coord_origin": "TOPLEFT"}, "confidence": 0.9075438976287842, "cells": [{"id": 34, "text": "r ", "bbox": {"l": 280.24011, "t": 552.41354, "r": 284.0993, "b": 557.62195, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "ISV education and enablement", "bbox": {"l": 287.28961, "t": 550.5794500000001, "r": 382.20956, "b": 557.98344, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "section_header", "bbox": {"l": 144.88921, "t": 327.46163999999993, "r": 188.74681, "b": 336.81406, "coord_origin": "TOPLEFT"}, "confidence": 0.9098502993583679, "cells": [{"id": 36, "text": "Highlights ", "bbox": {"l": 144.88921, "t": 327.46163999999993, "r": 188.74681, "b": 336.81406, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "list_item", "bbox": {"l": 144.88921, "t": 345.21707, "r": 242.87389000000002, "b": 358.68942, "coord_origin": "TOPLEFT"}, "confidence": 0.957169771194458, "cells": [{"id": 37, "text": "GLYPH<g115>GLYPH<g3>", "bbox": {"l": 144.88921, "t": 346.01953, "r": 148.68732, "b": 350.60168, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "GLYPH<g40>GLYPH<g81>GLYPH<g75>GLYPH<g68>GLYPH<g81>GLYPH<g70>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 151.9388, "t": 345.21707, "r": 177.25424, "b": 350.85666, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "GLYPH<g87>GLYPH<g75>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 176.9472, "t": 345.21707, "r": 187.11098, "b": 350.85666, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g73>GLYPH<g82>GLYPH<g85>GLYPH<g80>GLYPH<g68>GLYPH<g81>GLYPH<g70>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 186.7914, "t": 345.21707, "r": 222.95989999999998, "b": 350.85666, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "GLYPH<g82>GLYPH<g73>GLYPH<g3>", "bbox": {"l": 222.65912, "t": 345.21707, "r": 229.55193999999997, "b": 350.85666, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "GLYPH<g92>GLYPH<g82>GLYPH<g88>GLYPH<g85> GLYPH<g3>", "bbox": {"l": 229.2261, "t": 345.21707, "r": 242.87389000000002, "b": 350.85666, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "GLYPH<g71>GLYPH<g68>GLYPH<g87>GLYPH<g68>GLYPH<g69>GLYPH<g68>GLYPH<g86>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 151.93253, "t": 353.04984, "r": 178.77066, "b": 358.68942, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "GLYPH<g82>GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g68>GLYPH<g87>GLYPH<g76>GLYPH<g82>GLYPH<g81>GLYPH<g86>", "bbox": {"l": 178.46362, "t": 353.04984, "r": 207.16908, "b": 358.68942, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "list_item", "bbox": {"l": 144.88921, "t": 367.93219, "r": 259.2287, "b": 389.2373, "coord_origin": "TOPLEFT"}, "confidence": 0.9634580612182617, "cells": [{"id": 45, "text": "GLYPH<g115>GLYPH<g3>", "bbox": {"l": 144.88921, "t": 368.73465, "r": 148.68732, "b": 373.3168, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "GLYPH<g40>GLYPH<g68>GLYPH<g85> GLYPH<g81>GLYPH<g3>", "bbox": {"l": 151.9388, "t": 367.93219, "r": 166.05655, "b": 373.57178, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "GLYPH<g74>GLYPH<g85>GLYPH<g72>GLYPH<g68>GLYPH<g87>GLYPH<g72>GLYPH<g85>GLYPH<g3>", "bbox": {"l": 165.73697, "t": 367.93219, "r": 186.40289, "b": 373.57178, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "GLYPH<g85>GLYPH<g72>GLYPH<g87>GLYPH<g88>GLYPH<g85> GLYPH<g81>GLYPH<g3>", "bbox": {"l": 186.09586, "t": 367.93219, "r": 203.61617, "b": 373.57178, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "GLYPH<g82>GLYPH<g81>GLYPH<g3>", "bbox": {"l": 203.30286, "t": 367.93219, "r": 211.82489, "b": 373.57178, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "GLYPH<g44>GLYPH<g55>GLYPH<g3>", "bbox": {"l": 211.49905, "t": 367.93219, "r": 218.16002, "b": 373.57178, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "GLYPH<g83>GLYPH<g85>GLYPH<g82>GLYPH<g77>GLYPH<g72>GLYPH<g70>GLYPH<g87>GLYPH<g86> GLYPH<g3>", "bbox": {"l": 217.83418, "t": 367.93219, "r": 241.30737, "b": 373.57178, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "GLYPH<g87>GLYPH<g75>GLYPH<g85>GLYPH<g82>GLYPH<g88>GLYPH<g74>GLYPH<g75>GLYPH<g3>", "bbox": {"l": 151.93253, "t": 375.76495, "r": 174.46577, "b": 381.40454, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "GLYPH<g80>GLYPH<g82>GLYPH<g71>GLYPH<g72>GLYPH<g85> GLYPH<g81>GLYPH<g76>GLYPH<g93>GLYPH<g68>GLYPH<g87>GLYPH<g76>GLYPH<g82>GLYPH<g81>GLYPH<g3>", "bbox": {"l": 174.15874, "t": 375.76495, "r": 214.4128, "b": 381.40454, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "GLYPH<g82>GLYPH<g73>GLYPH<g3>", "bbox": {"l": 214.11829, "t": 375.76495, "r": 221.01110999999997, "b": 381.40454, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "GLYPH<g71>GLYPH<g68>GLYPH<g87>GLYPH<g68>GLYPH<g69>GLYPH<g68>GLYPH<g86>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 220.68527, "t": 375.76495, "r": 247.52341000000004, "b": 381.40454, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "GLYPH<g68>GLYPH<g81>GLYPH<g71> GLYPH<g3>", "bbox": {"l": 247.21637, "t": 375.76495, "r": 259.2287, "b": 381.40454, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "GLYPH<g68>GLYPH<g83>GLYPH<g83>GLYPH<g79>GLYPH<g76>GLYPH<g70>GLYPH<g68>GLYPH<g87>GLYPH<g76>GLYPH<g82>GLYPH<g81>GLYPH<g86>", "bbox": {"l": 151.93253, "t": 383.59772, "r": 184.61703, "b": 389.2373, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "list_item", "bbox": {"l": 144.88921, "t": 398.48019, "r": 249.83562, "b": 411.95255, "coord_origin": "TOPLEFT"}, "confidence": 0.9541196823120117, "cells": [{"id": 58, "text": "GLYPH<g115>GLYPH<g3>", "bbox": {"l": 144.88921, "t": 399.28265, "r": 148.68732, "b": 403.86481000000003, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "GLYPH<g53>GLYPH<g72>GLYPH<g79>GLYPH<g92>GLYPH<g3>", "bbox": {"l": 151.9388, "t": 398.48019, "r": 165.36099, "b": 404.11978, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "GLYPH<g82>GLYPH<g81>GLYPH<g3>", "bbox": {"l": 165.04141, "t": 398.48019, "r": 173.56345, "b": 404.11978, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "GLYPH<g44>GLYPH<g37>GLYPH<g48>GLYPH<g3>", "bbox": {"l": 173.23761, "t": 398.48019, "r": 185.95174, "b": 404.11978, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "GLYPH<g72>GLYPH<g91>GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g87>GLYPH<g3>", "bbox": {"l": 185.63216, "t": 398.48019, "r": 204.42448, "b": 404.11978, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "GLYPH<g70>GLYPH<g82>GLYPH<g81>GLYPH<g86>GLYPH<g88>GLYPH<g79>GLYPH<g87>GLYPH<g76>GLYPH<g81>GLYPH<g74>GLYPH<g15>GLYPH<g3>", "bbox": {"l": 204.11118, "t": 398.48019, "r": 235.29178, "b": 404.11978, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "GLYPH<g86>GLYPH<g78>GLYPH<g76>GLYPH<g79>GLYPH<g79>GLYPH<g86> GLYPH<g3>", "bbox": {"l": 234.99099999999999, "t": 398.48019, "r": 249.83562, "b": 404.11978, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "GLYPH<g86>GLYPH<g75>GLYPH<g68>GLYPH<g85>GLYPH<g76>GLYPH<g81>GLYPH<g74>GLYPH<g3>", "bbox": {"l": 151.93253, "t": 406.31296, "r": 173.41306, "b": 411.95255, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "GLYPH<g68>GLYPH<g81>GLYPH<g71>GLYPH<g3>", "bbox": {"l": 173.10602, "t": 406.31296, "r": 185.0118, "b": 411.95255, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "GLYPH<g85>GLYPH<g72>GLYPH<g81>GLYPH<g82>GLYPH<g90>GLYPH<g81>GLYPH<g3>", "bbox": {"l": 184.69221, "t": 406.31296, "r": 206.3858, "b": 411.95255, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "GLYPH<g86>GLYPH<g72>GLYPH<g85>GLYPH<g89>GLYPH<g76>GLYPH<g70>GLYPH<g72>GLYPH<g86>", "bbox": {"l": 206.07249, "t": 406.31296, "r": 228.24231000000003, "b": 411.95255, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "list_item", "bbox": {"l": 144.88921, "t": 421.1952800000001, "r": 234.25163000000003, "b": 434.66763, "coord_origin": "TOPLEFT"}, "confidence": 0.9440370798110962, "cells": [{"id": 69, "text": "GLYPH<g115>GLYPH<g3>", "bbox": {"l": 144.88921, "t": 421.99773999999996, "r": 148.68732, "b": 426.5799, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "GLYPH<g55>", "bbox": {"l": 151.9388, "t": 421.1952800000001, "r": 155.43533, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "GLYPH<g68>GLYPH<g78>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 154.73979, "t": 421.1952800000001, "r": 166.06282, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "GLYPH<g68>GLYPH<g71>GLYPH<g89>GLYPH<g68>GLYPH<g81>GLYPH<g87>GLYPH<g68>GLYPH<g74>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 165.74324, "t": 421.1952800000001, "r": 195.84607, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "GLYPH<g82>GLYPH<g73>GLYPH<g3>", "bbox": {"l": 195.53903, "t": 421.1952800000001, "r": 202.43185, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "GLYPH<g68>GLYPH<g70>GLYPH<g70>GLYPH<g72>GLYPH<g86>GLYPH<g86>GLYPH<g3>", "bbox": {"l": 202.10602, "t": 421.1952800000001, "r": 222.87220999999997, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "GLYPH<g87>GLYPH<g82>GLYPH<g3>", "bbox": {"l": 222.55890000000002, "t": 421.1952800000001, "r": 229.57077, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "GLYPH<g68> GLYPH<g3>", "bbox": {"l": 229.24492999999998, "t": 421.1952800000001, "r": 234.25163000000003, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "GLYPH<g90>GLYPH<g82>GLYPH<g85>GLYPH<g79>GLYPH<g71>GLYPH<g90>GLYPH<g76>GLYPH<g71>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 151.92627, "t": 429.02805, "r": 181.42754, "b": 434.66763, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "GLYPH<g86>GLYPH<g82>GLYPH<g88>GLYPH<g85>GLYPH<g70>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 181.1205, "t": 429.02805, "r": 201.07835, "b": 434.66763, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "GLYPH<g82>GLYPH<g73>GLYPH<g3>", "bbox": {"l": 200.76505, "t": 429.02805, "r": 207.65787, "b": 434.66763, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "GLYPH<g72>GLYPH<g91>GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g87>GLYPH<g76>GLYPH<g86>GLYPH<g72>", "bbox": {"l": 207.33203, "t": 429.02805, "r": 232.07098000000002, "b": 434.66763, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "picture", "bbox": {"l": 143.39866638183594, "t": 270.2610778808594, "r": 179.56256103515625, "b": 285.621337890625, "coord_origin": "TOPLEFT"}, "confidence": 0.7491768598556519, "cells": [], "children": []}, {"id": 15, "label": "picture", "bbox": {"l": 64.1669921875, "t": 603.50634765625, "r": 258.7742919921875, "b": 688.1282348632812, "coord_origin": "TOPLEFT"}, "confidence": 0.8925829529762268, "cells": [], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "text", "id": 26, "page_no": 2, "cluster": {"id": 26, "label": "text", "bbox": {"l": 64.800003, "t": 74.48395000000005, "r": 235.8624, "b": 85.58398, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 0, "text": "DB2 for i Center of Excellence", "bbox": {"l": 64.800003, "t": 74.48395000000005, "r": 235.8624, "b": 85.58398, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "DB2 for i Center of Excellence"}, {"label": "text", "id": 25, "page_no": 2, "cluster": {"id": 25, "label": "text", "bbox": {"l": 94.132698, "t": 138.45012999999994, "r": 233.99973, "b": 155.33642999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.7431555986404419, "cells": [{"id": 1, "text": "Solution Brief", "bbox": {"l": 94.132698, "t": 148.63933999999995, "r": 139.54634, "b": 155.33642999999995, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "IBM Systems Lab Services and Training", "bbox": {"l": 94.134933, "t": 138.45012999999994, "r": 233.99973, "b": 145.22162000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Solution Brief IBM Systems Lab Services and Training"}, {"label": "text", "id": 22, "page_no": 2, "cluster": {"id": 22, "label": "text", "bbox": {"l": 461.08859000000007, "t": 138.40752999999995, "r": 506.26178, "b": 145.42181000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.7798982858657837, "cells": [{"id": 3, "text": "Power Services", "bbox": {"l": 461.08859000000007, "t": 138.40752999999995, "r": 506.26178, "b": 145.42181000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Power Services"}, {"label": "section_header", "id": 23, "page_no": 2, "cluster": {"id": 23, "label": "section_header", "bbox": {"l": 280.24011, "t": 239.34265000000005, "r": 463.80942, "b": 276.62054, "coord_origin": "TOPLEFT"}, "confidence": 0.7587865591049194, "cells": [{"id": 4, "text": "DB2 for i", "bbox": {"l": 280.24011, "t": 239.34265000000005, "r": 354.57022, "b": 256.26153999999997, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Center of Excellence ", "bbox": {"l": 280.24011, "t": 259.70165999999995, "r": 463.80942, "b": 276.62054, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "DB2 for i Center of Excellence"}, {"label": "text", "id": 21, "page_no": 2, "cluster": {"id": 21, "label": "text", "bbox": {"l": 280.24011, "t": 277.59027000000003, "r": 483.29572, "b": 287.45959, "coord_origin": "TOPLEFT"}, "confidence": 0.7965622544288635, "cells": [{"id": 6, "text": "Expert help to achieve your business requirements", "bbox": {"l": 280.24011, "t": 277.59027000000003, "r": 483.29572, "b": 287.45959, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Expert help to achieve your business requirements"}, {"label": "section_header", "id": 16, "page_no": 2, "cluster": {"id": 16, "label": "section_header", "bbox": {"l": 280.24011, "t": 315.88161999999994, "r": 443.28210000000007, "b": 324.89566, "coord_origin": "TOPLEFT"}, "confidence": 0.8913541436195374, "cells": [{"id": 7, "text": "We build confident, satisfied clients", "bbox": {"l": 280.24011, "t": 315.88161999999994, "r": 443.28210000000007, "b": 324.89566, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "We build confident, satisfied clients"}, {"label": "text", "id": 3, "page_no": 2, "cluster": {"id": 3, "label": "text", "bbox": {"l": 280.24011, "t": 327.37595, "r": 488.15466, "b": 344.9595, "coord_origin": "TOPLEFT"}, "confidence": 0.9560741782188416, "cells": [{"id": 8, "text": "No one else has the vast consulting experiences, skills sharing and ", "bbox": {"l": 280.24011, "t": 327.37595, "r": 488.15466, "b": 334.77994, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "renown service offerings to do what we can do for you.", "bbox": {"l": 280.24011, "t": 337.55551, "r": 452.34018, "b": 344.9595, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "No one else has the vast consulting experiences, skills sharing and renown service offerings to do what we can do for you."}, {"label": "text", "id": 20, "page_no": 2, "cluster": {"id": 20, "label": "text", "bbox": {"l": 280.24011, "t": 357.3260200000001, "r": 367.86023, "b": 364.73001, "coord_origin": "TOPLEFT"}, "confidence": 0.8260757923126221, "cells": [{"id": 10, "text": "Because no one else is IBM.", "bbox": {"l": 280.24011, "t": 357.3260200000001, "r": 367.86023, "b": 364.73001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Because no one else is IBM."}, {"label": "text", "id": 0, "page_no": 2, "cluster": {"id": 0, "label": "text", "bbox": {"l": 280.24011, "t": 377.09801999999996, "r": 500.32104000000004, "b": 425.22027999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9764723181724548, "cells": [{"id": 11, "text": "With combined experiences and direct access to development groups, ", "bbox": {"l": 280.24011, "t": 377.09801999999996, "r": 500.32104000000004, "b": 384.50201, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "we\u2019re the experts in IBM DB2\u00ae for i. The DB2 for i Center of ", "bbox": {"l": 280.24011, "t": 387.27759, "r": 479.25497, "b": 394.68158, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Excellence (CoE) can help you achieve-perhaps reexamine and ", "bbox": {"l": 280.24011, "t": 397.45715, "r": 483.4667400000001, "b": 404.86115, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "exceed-your business requirements and gain more confidence and ", "bbox": {"l": 280.24011, "t": 407.63672, "r": 492.97656, "b": 415.04071000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "satisfaction in IBM product data management products and solutions.", "bbox": {"l": 280.24011, "t": 417.81628, "r": 498.87, "b": 425.22027999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "With combined experiences and direct access to development groups, we're the experts in IBM DB2\u00ae for i. The DB2 for i Center of Excellence (CoE) can help you achieve-perhaps reexamine and exceed-your business requirements and gain more confidence and satisfaction in IBM product data management products and solutions."}, {"label": "section_header", "id": 18, "page_no": 2, "cluster": {"id": 18, "label": "section_header", "bbox": {"l": 280.24011, "t": 437.85403, "r": 434.83205999999996, "b": 446.86807, "coord_origin": "TOPLEFT"}, "confidence": 0.8492127060890198, "cells": [{"id": 16, "text": "Who we are, some of what we do", "bbox": {"l": 280.24011, "t": 437.85403, "r": 434.83205999999996, "b": 446.86807, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Who we are, some of what we do"}, {"label": "text", "id": 19, "page_no": 2, "cluster": {"id": 19, "label": "text", "bbox": {"l": 280.24011, "t": 449.34824000000003, "r": 434.56316999999996, "b": 456.75223, "coord_origin": "TOPLEFT"}, "confidence": 0.8440335392951965, "cells": [{"id": 17, "text": "Global CoE engagements cover topics including:", "bbox": {"l": 280.24011, "t": 449.34824000000003, "r": 434.56316999999996, "b": 456.75223, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Global CoE engagements cover topics including:"}, {"label": "list_item", "id": 8, "page_no": 2, "cluster": {"id": 8, "label": "list_item", "bbox": {"l": 280.24011, "t": 469.11826, "r": 401.56412, "b": 476.52225, "coord_origin": "TOPLEFT"}, "confidence": 0.9239600896835327, "cells": [{"id": 18, "text": "r ", "bbox": {"l": 280.24011, "t": 470.95236, "r": 284.0993, "b": 476.16074, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Database performance and scalability", "bbox": {"l": 287.28961, "t": 469.11826, "r": 401.56412, "b": 476.52225, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "r Database performance and scalability"}, {"label": "list_item", "id": 7, "page_no": 2, "cluster": {"id": 7, "label": "list_item", "bbox": {"l": 280.24011, "t": 479.30096, "r": 424.99646, "b": 486.70496, "coord_origin": "TOPLEFT"}, "confidence": 0.9239721298217773, "cells": [{"id": 20, "text": "r ", "bbox": {"l": 280.24011, "t": 481.13507, "r": 284.0993, "b": 486.34344, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Advanced SQL knowledge and skills transfer", "bbox": {"l": 287.28961, "t": 479.30096, "r": 424.99646, "b": 486.70496, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "r Advanced SQL knowledge and skills transfer"}, {"label": "list_item", "id": 10, "page_no": 2, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 280.24011, "t": 489.48355, "r": 392.15845, "b": 496.88754, "coord_origin": "TOPLEFT"}, "confidence": 0.9157900214195251, "cells": [{"id": 22, "text": "r ", "bbox": {"l": 280.24011, "t": 491.31766, "r": 284.0993, "b": 496.52603, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Business intelligence and analytics", "bbox": {"l": 287.28961, "t": 489.48355, "r": 392.15845, "b": 496.88754, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "r Business intelligence and analytics"}, {"label": "list_item", "id": 17, "page_no": 2, "cluster": {"id": 17, "label": "list_item", "bbox": {"l": 280.24011, "t": 499.66626, "r": 339.94354, "b": 507.07025, "coord_origin": "TOPLEFT"}, "confidence": 0.8733457326889038, "cells": [{"id": 24, "text": "r ", "bbox": {"l": 280.24011, "t": 501.50037, "r": 284.0993, "b": 506.70874, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "DB2 Web Query", "bbox": {"l": 287.28961, "t": 499.66626, "r": 339.94354, "b": 507.07025, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "r DB2 Web Query"}, {"label": "list_item", "id": 6, "page_no": 2, "cluster": {"id": 6, "label": "list_item", "bbox": {"l": 280.24011, "t": 509.84885, "r": 504.19314999999995, "b": 517.25284, "coord_origin": "TOPLEFT"}, "confidence": 0.9249242544174194, "cells": [{"id": 26, "text": "r ", "bbox": {"l": 280.24011, "t": 511.68295, "r": 284.0993, "b": 516.8913299999999, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Query/400 modernization for better reporting and analysis capabilities", "bbox": {"l": 287.28961, "t": 509.84885, "r": 504.19314999999995, "b": 517.25284, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "r Query/400 modernization for better reporting and analysis capabilities"}, {"label": "list_item", "id": 11, "page_no": 2, "cluster": {"id": 11, "label": "list_item", "bbox": {"l": 280.24011, "t": 520.03156, "r": 423.0022, "b": 527.4355499999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9109312891960144, "cells": [{"id": 28, "text": "r ", "bbox": {"l": 280.24011, "t": 521.8656599999999, "r": 284.0993, "b": 527.07404, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Database modernization and re-engineering", "bbox": {"l": 287.28961, "t": 520.03156, "r": 423.0022, "b": 527.4355499999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "r Database modernization and re-engineering"}, {"label": "list_item", "id": 14, "page_no": 2, "cluster": {"id": 14, "label": "list_item", "bbox": {"l": 280.24011, "t": 530.21414, "r": 399.65173, "b": 537.61813, "coord_origin": "TOPLEFT"}, "confidence": 0.8977466225624084, "cells": [{"id": 30, "text": "r ", "bbox": {"l": 280.24011, "t": 532.04825, "r": 284.0993, "b": 537.2566400000001, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Data-centric architecture and design", "bbox": {"l": 287.28961, "t": 530.21414, "r": 399.65173, "b": 537.61813, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "r Data-centric architecture and design"}, {"label": "list_item", "id": 9, "page_no": 2, "cluster": {"id": 9, "label": "list_item", "bbox": {"l": 280.24011, "t": 540.39674, "r": 466.77881, "b": 547.80074, "coord_origin": "TOPLEFT"}, "confidence": 0.9218331575393677, "cells": [{"id": 32, "text": "r ", "bbox": {"l": 280.24011, "t": 542.23083, "r": 284.0993, "b": 547.43924, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "Extremely large database and overcoming limits to growth", "bbox": {"l": 287.28961, "t": 540.39674, "r": 466.77881, "b": 547.80074, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "r Extremely large database and overcoming limits to growth"}, {"label": "list_item", "id": 13, "page_no": 2, "cluster": {"id": 13, "label": "list_item", "bbox": {"l": 280.24011, "t": 550.5794500000001, "r": 382.20956, "b": 557.98344, "coord_origin": "TOPLEFT"}, "confidence": 0.9075438976287842, "cells": [{"id": 34, "text": "r ", "bbox": {"l": 280.24011, "t": 552.41354, "r": 284.0993, "b": 557.62195, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "ISV education and enablement", "bbox": {"l": 287.28961, "t": 550.5794500000001, "r": 382.20956, "b": 557.98344, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "r ISV education and enablement"}, {"label": "section_header", "id": 12, "page_no": 2, "cluster": {"id": 12, "label": "section_header", "bbox": {"l": 144.88921, "t": 327.46163999999993, "r": 188.74681, "b": 336.81406, "coord_origin": "TOPLEFT"}, "confidence": 0.9098502993583679, "cells": [{"id": 36, "text": "Highlights ", "bbox": {"l": 144.88921, "t": 327.46163999999993, "r": 188.74681, "b": 336.81406, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Highlights"}, {"label": "list_item", "id": 2, "page_no": 2, "cluster": {"id": 2, "label": "list_item", "bbox": {"l": 144.88921, "t": 345.21707, "r": 242.87389000000002, "b": 358.68942, "coord_origin": "TOPLEFT"}, "confidence": 0.957169771194458, "cells": [{"id": 37, "text": "GLYPH<g115>GLYPH<g3>", "bbox": {"l": 144.88921, "t": 346.01953, "r": 148.68732, "b": 350.60168, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "GLYPH<g40>GLYPH<g81>GLYPH<g75>GLYPH<g68>GLYPH<g81>GLYPH<g70>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 151.9388, "t": 345.21707, "r": 177.25424, "b": 350.85666, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "GLYPH<g87>GLYPH<g75>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 176.9472, "t": 345.21707, "r": 187.11098, "b": 350.85666, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g73>GLYPH<g82>GLYPH<g85>GLYPH<g80>GLYPH<g68>GLYPH<g81>GLYPH<g70>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 186.7914, "t": 345.21707, "r": 222.95989999999998, "b": 350.85666, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "GLYPH<g82>GLYPH<g73>GLYPH<g3>", "bbox": {"l": 222.65912, "t": 345.21707, "r": 229.55193999999997, "b": 350.85666, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "GLYPH<g92>GLYPH<g82>GLYPH<g88>GLYPH<g85> GLYPH<g3>", "bbox": {"l": 229.2261, "t": 345.21707, "r": 242.87389000000002, "b": 350.85666, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "GLYPH<g71>GLYPH<g68>GLYPH<g87>GLYPH<g68>GLYPH<g69>GLYPH<g68>GLYPH<g86>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 151.93253, "t": 353.04984, "r": 178.77066, "b": 358.68942, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "GLYPH<g82>GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g68>GLYPH<g87>GLYPH<g76>GLYPH<g82>GLYPH<g81>GLYPH<g86>", "bbox": {"l": 178.46362, "t": 353.04984, "r": 207.16908, "b": 358.68942, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<g115>GLYPH<g3> GLYPH<g40>GLYPH<g81>GLYPH<g75>GLYPH<g68>GLYPH<g81>GLYPH<g70>GLYPH<g72>GLYPH<g3> GLYPH<g87>GLYPH<g75>GLYPH<g72>GLYPH<g3> GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g73>GLYPH<g82>GLYPH<g85>GLYPH<g80>GLYPH<g68>GLYPH<g81>GLYPH<g70>GLYPH<g72>GLYPH<g3> GLYPH<g82>GLYPH<g73>GLYPH<g3> GLYPH<g92>GLYPH<g82>GLYPH<g88>GLYPH<g85> GLYPH<g3> GLYPH<g71>GLYPH<g68>GLYPH<g87>GLYPH<g68>GLYPH<g69>GLYPH<g68>GLYPH<g86>GLYPH<g72>GLYPH<g3> GLYPH<g82>GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g68>GLYPH<g87>GLYPH<g76>GLYPH<g82>GLYPH<g81>GLYPH<g86>"}, {"label": "list_item", "id": 1, "page_no": 2, "cluster": {"id": 1, "label": "list_item", "bbox": {"l": 144.88921, "t": 367.93219, "r": 259.2287, "b": 389.2373, "coord_origin": "TOPLEFT"}, "confidence": 0.9634580612182617, "cells": [{"id": 45, "text": "GLYPH<g115>GLYPH<g3>", "bbox": {"l": 144.88921, "t": 368.73465, "r": 148.68732, "b": 373.3168, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "GLYPH<g40>GLYPH<g68>GLYPH<g85> GLYPH<g81>GLYPH<g3>", "bbox": {"l": 151.9388, "t": 367.93219, "r": 166.05655, "b": 373.57178, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "GLYPH<g74>GLYPH<g85>GLYPH<g72>GLYPH<g68>GLYPH<g87>GLYPH<g72>GLYPH<g85>GLYPH<g3>", "bbox": {"l": 165.73697, "t": 367.93219, "r": 186.40289, "b": 373.57178, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "GLYPH<g85>GLYPH<g72>GLYPH<g87>GLYPH<g88>GLYPH<g85> GLYPH<g81>GLYPH<g3>", "bbox": {"l": 186.09586, "t": 367.93219, "r": 203.61617, "b": 373.57178, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "GLYPH<g82>GLYPH<g81>GLYPH<g3>", "bbox": {"l": 203.30286, "t": 367.93219, "r": 211.82489, "b": 373.57178, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "GLYPH<g44>GLYPH<g55>GLYPH<g3>", "bbox": {"l": 211.49905, "t": 367.93219, "r": 218.16002, "b": 373.57178, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "GLYPH<g83>GLYPH<g85>GLYPH<g82>GLYPH<g77>GLYPH<g72>GLYPH<g70>GLYPH<g87>GLYPH<g86> GLYPH<g3>", "bbox": {"l": 217.83418, "t": 367.93219, "r": 241.30737, "b": 373.57178, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "GLYPH<g87>GLYPH<g75>GLYPH<g85>GLYPH<g82>GLYPH<g88>GLYPH<g74>GLYPH<g75>GLYPH<g3>", "bbox": {"l": 151.93253, "t": 375.76495, "r": 174.46577, "b": 381.40454, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "GLYPH<g80>GLYPH<g82>GLYPH<g71>GLYPH<g72>GLYPH<g85> GLYPH<g81>GLYPH<g76>GLYPH<g93>GLYPH<g68>GLYPH<g87>GLYPH<g76>GLYPH<g82>GLYPH<g81>GLYPH<g3>", "bbox": {"l": 174.15874, "t": 375.76495, "r": 214.4128, "b": 381.40454, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "GLYPH<g82>GLYPH<g73>GLYPH<g3>", "bbox": {"l": 214.11829, "t": 375.76495, "r": 221.01110999999997, "b": 381.40454, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "GLYPH<g71>GLYPH<g68>GLYPH<g87>GLYPH<g68>GLYPH<g69>GLYPH<g68>GLYPH<g86>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 220.68527, "t": 375.76495, "r": 247.52341000000004, "b": 381.40454, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "GLYPH<g68>GLYPH<g81>GLYPH<g71> GLYPH<g3>", "bbox": {"l": 247.21637, "t": 375.76495, "r": 259.2287, "b": 381.40454, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "GLYPH<g68>GLYPH<g83>GLYPH<g83>GLYPH<g79>GLYPH<g76>GLYPH<g70>GLYPH<g68>GLYPH<g87>GLYPH<g76>GLYPH<g82>GLYPH<g81>GLYPH<g86>", "bbox": {"l": 151.93253, "t": 383.59772, "r": 184.61703, "b": 389.2373, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<g115>GLYPH<g3> GLYPH<g40>GLYPH<g68>GLYPH<g85> GLYPH<g81>GLYPH<g3> GLYPH<g74>GLYPH<g85>GLYPH<g72>GLYPH<g68>GLYPH<g87>GLYPH<g72>GLYPH<g85>GLYPH<g3> GLYPH<g85>GLYPH<g72>GLYPH<g87>GLYPH<g88>GLYPH<g85> GLYPH<g81>GLYPH<g3> GLYPH<g82>GLYPH<g81>GLYPH<g3> GLYPH<g44>GLYPH<g55>GLYPH<g3> GLYPH<g83>GLYPH<g85>GLYPH<g82>GLYPH<g77>GLYPH<g72>GLYPH<g70>GLYPH<g87>GLYPH<g86> GLYPH<g3> GLYPH<g87>GLYPH<g75>GLYPH<g85>GLYPH<g82>GLYPH<g88>GLYPH<g74>GLYPH<g75>GLYPH<g3> GLYPH<g80>GLYPH<g82>GLYPH<g71>GLYPH<g72>GLYPH<g85> GLYPH<g81>GLYPH<g76>GLYPH<g93>GLYPH<g68>GLYPH<g87>GLYPH<g76>GLYPH<g82>GLYPH<g81>GLYPH<g3> GLYPH<g82>GLYPH<g73>GLYPH<g3> GLYPH<g71>GLYPH<g68>GLYPH<g87>GLYPH<g68>GLYPH<g69>GLYPH<g68>GLYPH<g86>GLYPH<g72>GLYPH<g3> GLYPH<g68>GLYPH<g81>GLYPH<g71> GLYPH<g3> GLYPH<g68>GLYPH<g83>GLYPH<g83>GLYPH<g79>GLYPH<g76>GLYPH<g70>GLYPH<g68>GLYPH<g87>GLYPH<g76>GLYPH<g82>GLYPH<g81>GLYPH<g86>"}, {"label": "list_item", "id": 4, "page_no": 2, "cluster": {"id": 4, "label": "list_item", "bbox": {"l": 144.88921, "t": 398.48019, "r": 249.83562, "b": 411.95255, "coord_origin": "TOPLEFT"}, "confidence": 0.9541196823120117, "cells": [{"id": 58, "text": "GLYPH<g115>GLYPH<g3>", "bbox": {"l": 144.88921, "t": 399.28265, "r": 148.68732, "b": 403.86481000000003, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "GLYPH<g53>GLYPH<g72>GLYPH<g79>GLYPH<g92>GLYPH<g3>", "bbox": {"l": 151.9388, "t": 398.48019, "r": 165.36099, "b": 404.11978, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "GLYPH<g82>GLYPH<g81>GLYPH<g3>", "bbox": {"l": 165.04141, "t": 398.48019, "r": 173.56345, "b": 404.11978, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "GLYPH<g44>GLYPH<g37>GLYPH<g48>GLYPH<g3>", "bbox": {"l": 173.23761, "t": 398.48019, "r": 185.95174, "b": 404.11978, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "GLYPH<g72>GLYPH<g91>GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g87>GLYPH<g3>", "bbox": {"l": 185.63216, "t": 398.48019, "r": 204.42448, "b": 404.11978, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "GLYPH<g70>GLYPH<g82>GLYPH<g81>GLYPH<g86>GLYPH<g88>GLYPH<g79>GLYPH<g87>GLYPH<g76>GLYPH<g81>GLYPH<g74>GLYPH<g15>GLYPH<g3>", "bbox": {"l": 204.11118, "t": 398.48019, "r": 235.29178, "b": 404.11978, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "GLYPH<g86>GLYPH<g78>GLYPH<g76>GLYPH<g79>GLYPH<g79>GLYPH<g86> GLYPH<g3>", "bbox": {"l": 234.99099999999999, "t": 398.48019, "r": 249.83562, "b": 404.11978, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "GLYPH<g86>GLYPH<g75>GLYPH<g68>GLYPH<g85>GLYPH<g76>GLYPH<g81>GLYPH<g74>GLYPH<g3>", "bbox": {"l": 151.93253, "t": 406.31296, "r": 173.41306, "b": 411.95255, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "GLYPH<g68>GLYPH<g81>GLYPH<g71>GLYPH<g3>", "bbox": {"l": 173.10602, "t": 406.31296, "r": 185.0118, "b": 411.95255, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "GLYPH<g85>GLYPH<g72>GLYPH<g81>GLYPH<g82>GLYPH<g90>GLYPH<g81>GLYPH<g3>", "bbox": {"l": 184.69221, "t": 406.31296, "r": 206.3858, "b": 411.95255, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "GLYPH<g86>GLYPH<g72>GLYPH<g85>GLYPH<g89>GLYPH<g76>GLYPH<g70>GLYPH<g72>GLYPH<g86>", "bbox": {"l": 206.07249, "t": 406.31296, "r": 228.24231000000003, "b": 411.95255, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<g115>GLYPH<g3> GLYPH<g53>GLYPH<g72>GLYPH<g79>GLYPH<g92>GLYPH<g3> GLYPH<g82>GLYPH<g81>GLYPH<g3> GLYPH<g44>GLYPH<g37>GLYPH<g48>GLYPH<g3> GLYPH<g72>GLYPH<g91>GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g87>GLYPH<g3> GLYPH<g70>GLYPH<g82>GLYPH<g81>GLYPH<g86>GLYPH<g88>GLYPH<g79>GLYPH<g87>GLYPH<g76>GLYPH<g81>GLYPH<g74>GLYPH<g15>GLYPH<g3> GLYPH<g86>GLYPH<g78>GLYPH<g76>GLYPH<g79>GLYPH<g79>GLYPH<g86> GLYPH<g3> GLYPH<g86>GLYPH<g75>GLYPH<g68>GLYPH<g85>GLYPH<g76>GLYPH<g81>GLYPH<g74>GLYPH<g3> GLYPH<g68>GLYPH<g81>GLYPH<g71>GLYPH<g3> GLYPH<g85>GLYPH<g72>GLYPH<g81>GLYPH<g82>GLYPH<g90>GLYPH<g81>GLYPH<g3> GLYPH<g86>GLYPH<g72>GLYPH<g85>GLYPH<g89>GLYPH<g76>GLYPH<g70>GLYPH<g72>GLYPH<g86>"}, {"label": "list_item", "id": 5, "page_no": 2, "cluster": {"id": 5, "label": "list_item", "bbox": {"l": 144.88921, "t": 421.1952800000001, "r": 234.25163000000003, "b": 434.66763, "coord_origin": "TOPLEFT"}, "confidence": 0.9440370798110962, "cells": [{"id": 69, "text": "GLYPH<g115>GLYPH<g3>", "bbox": {"l": 144.88921, "t": 421.99773999999996, "r": 148.68732, "b": 426.5799, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "GLYPH<g55>", "bbox": {"l": 151.9388, "t": 421.1952800000001, "r": 155.43533, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "GLYPH<g68>GLYPH<g78>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 154.73979, "t": 421.1952800000001, "r": 166.06282, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "GLYPH<g68>GLYPH<g71>GLYPH<g89>GLYPH<g68>GLYPH<g81>GLYPH<g87>GLYPH<g68>GLYPH<g74>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 165.74324, "t": 421.1952800000001, "r": 195.84607, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "GLYPH<g82>GLYPH<g73>GLYPH<g3>", "bbox": {"l": 195.53903, "t": 421.1952800000001, "r": 202.43185, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "GLYPH<g68>GLYPH<g70>GLYPH<g70>GLYPH<g72>GLYPH<g86>GLYPH<g86>GLYPH<g3>", "bbox": {"l": 202.10602, "t": 421.1952800000001, "r": 222.87220999999997, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "GLYPH<g87>GLYPH<g82>GLYPH<g3>", "bbox": {"l": 222.55890000000002, "t": 421.1952800000001, "r": 229.57077, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "GLYPH<g68> GLYPH<g3>", "bbox": {"l": 229.24492999999998, "t": 421.1952800000001, "r": 234.25163000000003, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "GLYPH<g90>GLYPH<g82>GLYPH<g85>GLYPH<g79>GLYPH<g71>GLYPH<g90>GLYPH<g76>GLYPH<g71>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 151.92627, "t": 429.02805, "r": 181.42754, "b": 434.66763, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "GLYPH<g86>GLYPH<g82>GLYPH<g88>GLYPH<g85>GLYPH<g70>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 181.1205, "t": 429.02805, "r": 201.07835, "b": 434.66763, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "GLYPH<g82>GLYPH<g73>GLYPH<g3>", "bbox": {"l": 200.76505, "t": 429.02805, "r": 207.65787, "b": 434.66763, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "GLYPH<g72>GLYPH<g91>GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g87>GLYPH<g76>GLYPH<g86>GLYPH<g72>", "bbox": {"l": 207.33203, "t": 429.02805, "r": 232.07098000000002, "b": 434.66763, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<g115>GLYPH<g3> GLYPH<g55> GLYPH<g68>GLYPH<g78>GLYPH<g72>GLYPH<g3> GLYPH<g68>GLYPH<g71>GLYPH<g89>GLYPH<g68>GLYPH<g81>GLYPH<g87>GLYPH<g68>GLYPH<g74>GLYPH<g72>GLYPH<g3> GLYPH<g82>GLYPH<g73>GLYPH<g3> GLYPH<g68>GLYPH<g70>GLYPH<g70>GLYPH<g72>GLYPH<g86>GLYPH<g86>GLYPH<g3> GLYPH<g87>GLYPH<g82>GLYPH<g3> GLYPH<g68> GLYPH<g3> GLYPH<g90>GLYPH<g82>GLYPH<g85>GLYPH<g79>GLYPH<g71>GLYPH<g90>GLYPH<g76>GLYPH<g71>GLYPH<g72>GLYPH<g3> GLYPH<g86>GLYPH<g82>GLYPH<g88>GLYPH<g85>GLYPH<g70>GLYPH<g72>GLYPH<g3> GLYPH<g82>GLYPH<g73>GLYPH<g3> GLYPH<g72>GLYPH<g91>GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g87>GLYPH<g76>GLYPH<g86>GLYPH<g72>"}, {"label": "picture", "id": 24, "page_no": 2, "cluster": {"id": 24, "label": "picture", "bbox": {"l": 143.39866638183594, "t": 270.2610778808594, "r": 179.56256103515625, "b": 285.621337890625, "coord_origin": "TOPLEFT"}, "confidence": 0.7491768598556519, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "picture", "id": 15, "page_no": 2, "cluster": {"id": 15, "label": "picture", "bbox": {"l": 64.1669921875, "t": 603.50634765625, "r": 258.7742919921875, "b": 688.1282348632812, "coord_origin": "TOPLEFT"}, "confidence": 0.8925829529762268, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "body": [{"label": "text", "id": 26, "page_no": 2, "cluster": {"id": 26, "label": "text", "bbox": {"l": 64.800003, "t": 74.48395000000005, "r": 235.8624, "b": 85.58398, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 0, "text": "DB2 for i Center of Excellence", "bbox": {"l": 64.800003, "t": 74.48395000000005, "r": 235.8624, "b": 85.58398, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "DB2 for i Center of Excellence"}, {"label": "text", "id": 25, "page_no": 2, "cluster": {"id": 25, "label": "text", "bbox": {"l": 94.132698, "t": 138.45012999999994, "r": 233.99973, "b": 155.33642999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.7431555986404419, "cells": [{"id": 1, "text": "Solution Brief", "bbox": {"l": 94.132698, "t": 148.63933999999995, "r": 139.54634, "b": 155.33642999999995, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "IBM Systems Lab Services and Training", "bbox": {"l": 94.134933, "t": 138.45012999999994, "r": 233.99973, "b": 145.22162000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Solution Brief IBM Systems Lab Services and Training"}, {"label": "text", "id": 22, "page_no": 2, "cluster": {"id": 22, "label": "text", "bbox": {"l": 461.08859000000007, "t": 138.40752999999995, "r": 506.26178, "b": 145.42181000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.7798982858657837, "cells": [{"id": 3, "text": "Power Services", "bbox": {"l": 461.08859000000007, "t": 138.40752999999995, "r": 506.26178, "b": 145.42181000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Power Services"}, {"label": "section_header", "id": 23, "page_no": 2, "cluster": {"id": 23, "label": "section_header", "bbox": {"l": 280.24011, "t": 239.34265000000005, "r": 463.80942, "b": 276.62054, "coord_origin": "TOPLEFT"}, "confidence": 0.7587865591049194, "cells": [{"id": 4, "text": "DB2 for i", "bbox": {"l": 280.24011, "t": 239.34265000000005, "r": 354.57022, "b": 256.26153999999997, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Center of Excellence ", "bbox": {"l": 280.24011, "t": 259.70165999999995, "r": 463.80942, "b": 276.62054, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "DB2 for i Center of Excellence"}, {"label": "text", "id": 21, "page_no": 2, "cluster": {"id": 21, "label": "text", "bbox": {"l": 280.24011, "t": 277.59027000000003, "r": 483.29572, "b": 287.45959, "coord_origin": "TOPLEFT"}, "confidence": 0.7965622544288635, "cells": [{"id": 6, "text": "Expert help to achieve your business requirements", "bbox": {"l": 280.24011, "t": 277.59027000000003, "r": 483.29572, "b": 287.45959, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Expert help to achieve your business requirements"}, {"label": "section_header", "id": 16, "page_no": 2, "cluster": {"id": 16, "label": "section_header", "bbox": {"l": 280.24011, "t": 315.88161999999994, "r": 443.28210000000007, "b": 324.89566, "coord_origin": "TOPLEFT"}, "confidence": 0.8913541436195374, "cells": [{"id": 7, "text": "We build confident, satisfied clients", "bbox": {"l": 280.24011, "t": 315.88161999999994, "r": 443.28210000000007, "b": 324.89566, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "We build confident, satisfied clients"}, {"label": "text", "id": 3, "page_no": 2, "cluster": {"id": 3, "label": "text", "bbox": {"l": 280.24011, "t": 327.37595, "r": 488.15466, "b": 344.9595, "coord_origin": "TOPLEFT"}, "confidence": 0.9560741782188416, "cells": [{"id": 8, "text": "No one else has the vast consulting experiences, skills sharing and ", "bbox": {"l": 280.24011, "t": 327.37595, "r": 488.15466, "b": 334.77994, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "renown service offerings to do what we can do for you.", "bbox": {"l": 280.24011, "t": 337.55551, "r": 452.34018, "b": 344.9595, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "No one else has the vast consulting experiences, skills sharing and renown service offerings to do what we can do for you."}, {"label": "text", "id": 20, "page_no": 2, "cluster": {"id": 20, "label": "text", "bbox": {"l": 280.24011, "t": 357.3260200000001, "r": 367.86023, "b": 364.73001, "coord_origin": "TOPLEFT"}, "confidence": 0.8260757923126221, "cells": [{"id": 10, "text": "Because no one else is IBM.", "bbox": {"l": 280.24011, "t": 357.3260200000001, "r": 367.86023, "b": 364.73001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Because no one else is IBM."}, {"label": "text", "id": 0, "page_no": 2, "cluster": {"id": 0, "label": "text", "bbox": {"l": 280.24011, "t": 377.09801999999996, "r": 500.32104000000004, "b": 425.22027999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9764723181724548, "cells": [{"id": 11, "text": "With combined experiences and direct access to development groups, ", "bbox": {"l": 280.24011, "t": 377.09801999999996, "r": 500.32104000000004, "b": 384.50201, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "we\u2019re the experts in IBM DB2\u00ae for i. The DB2 for i Center of ", "bbox": {"l": 280.24011, "t": 387.27759, "r": 479.25497, "b": 394.68158, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Excellence (CoE) can help you achieve-perhaps reexamine and ", "bbox": {"l": 280.24011, "t": 397.45715, "r": 483.4667400000001, "b": 404.86115, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "exceed-your business requirements and gain more confidence and ", "bbox": {"l": 280.24011, "t": 407.63672, "r": 492.97656, "b": 415.04071000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "satisfaction in IBM product data management products and solutions.", "bbox": {"l": 280.24011, "t": 417.81628, "r": 498.87, "b": 425.22027999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "With combined experiences and direct access to development groups, we're the experts in IBM DB2\u00ae for i. The DB2 for i Center of Excellence (CoE) can help you achieve-perhaps reexamine and exceed-your business requirements and gain more confidence and satisfaction in IBM product data management products and solutions."}, {"label": "section_header", "id": 18, "page_no": 2, "cluster": {"id": 18, "label": "section_header", "bbox": {"l": 280.24011, "t": 437.85403, "r": 434.83205999999996, "b": 446.86807, "coord_origin": "TOPLEFT"}, "confidence": 0.8492127060890198, "cells": [{"id": 16, "text": "Who we are, some of what we do", "bbox": {"l": 280.24011, "t": 437.85403, "r": 434.83205999999996, "b": 446.86807, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Who we are, some of what we do"}, {"label": "text", "id": 19, "page_no": 2, "cluster": {"id": 19, "label": "text", "bbox": {"l": 280.24011, "t": 449.34824000000003, "r": 434.56316999999996, "b": 456.75223, "coord_origin": "TOPLEFT"}, "confidence": 0.8440335392951965, "cells": [{"id": 17, "text": "Global CoE engagements cover topics including:", "bbox": {"l": 280.24011, "t": 449.34824000000003, "r": 434.56316999999996, "b": 456.75223, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Global CoE engagements cover topics including:"}, {"label": "list_item", "id": 8, "page_no": 2, "cluster": {"id": 8, "label": "list_item", "bbox": {"l": 280.24011, "t": 469.11826, "r": 401.56412, "b": 476.52225, "coord_origin": "TOPLEFT"}, "confidence": 0.9239600896835327, "cells": [{"id": 18, "text": "r ", "bbox": {"l": 280.24011, "t": 470.95236, "r": 284.0993, "b": 476.16074, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Database performance and scalability", "bbox": {"l": 287.28961, "t": 469.11826, "r": 401.56412, "b": 476.52225, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "r Database performance and scalability"}, {"label": "list_item", "id": 7, "page_no": 2, "cluster": {"id": 7, "label": "list_item", "bbox": {"l": 280.24011, "t": 479.30096, "r": 424.99646, "b": 486.70496, "coord_origin": "TOPLEFT"}, "confidence": 0.9239721298217773, "cells": [{"id": 20, "text": "r ", "bbox": {"l": 280.24011, "t": 481.13507, "r": 284.0993, "b": 486.34344, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Advanced SQL knowledge and skills transfer", "bbox": {"l": 287.28961, "t": 479.30096, "r": 424.99646, "b": 486.70496, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "r Advanced SQL knowledge and skills transfer"}, {"label": "list_item", "id": 10, "page_no": 2, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 280.24011, "t": 489.48355, "r": 392.15845, "b": 496.88754, "coord_origin": "TOPLEFT"}, "confidence": 0.9157900214195251, "cells": [{"id": 22, "text": "r ", "bbox": {"l": 280.24011, "t": 491.31766, "r": 284.0993, "b": 496.52603, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Business intelligence and analytics", "bbox": {"l": 287.28961, "t": 489.48355, "r": 392.15845, "b": 496.88754, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "r Business intelligence and analytics"}, {"label": "list_item", "id": 17, "page_no": 2, "cluster": {"id": 17, "label": "list_item", "bbox": {"l": 280.24011, "t": 499.66626, "r": 339.94354, "b": 507.07025, "coord_origin": "TOPLEFT"}, "confidence": 0.8733457326889038, "cells": [{"id": 24, "text": "r ", "bbox": {"l": 280.24011, "t": 501.50037, "r": 284.0993, "b": 506.70874, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "DB2 Web Query", "bbox": {"l": 287.28961, "t": 499.66626, "r": 339.94354, "b": 507.07025, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "r DB2 Web Query"}, {"label": "list_item", "id": 6, "page_no": 2, "cluster": {"id": 6, "label": "list_item", "bbox": {"l": 280.24011, "t": 509.84885, "r": 504.19314999999995, "b": 517.25284, "coord_origin": "TOPLEFT"}, "confidence": 0.9249242544174194, "cells": [{"id": 26, "text": "r ", "bbox": {"l": 280.24011, "t": 511.68295, "r": 284.0993, "b": 516.8913299999999, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Query/400 modernization for better reporting and analysis capabilities", "bbox": {"l": 287.28961, "t": 509.84885, "r": 504.19314999999995, "b": 517.25284, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "r Query/400 modernization for better reporting and analysis capabilities"}, {"label": "list_item", "id": 11, "page_no": 2, "cluster": {"id": 11, "label": "list_item", "bbox": {"l": 280.24011, "t": 520.03156, "r": 423.0022, "b": 527.4355499999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9109312891960144, "cells": [{"id": 28, "text": "r ", "bbox": {"l": 280.24011, "t": 521.8656599999999, "r": 284.0993, "b": 527.07404, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Database modernization and re-engineering", "bbox": {"l": 287.28961, "t": 520.03156, "r": 423.0022, "b": 527.4355499999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "r Database modernization and re-engineering"}, {"label": "list_item", "id": 14, "page_no": 2, "cluster": {"id": 14, "label": "list_item", "bbox": {"l": 280.24011, "t": 530.21414, "r": 399.65173, "b": 537.61813, "coord_origin": "TOPLEFT"}, "confidence": 0.8977466225624084, "cells": [{"id": 30, "text": "r ", "bbox": {"l": 280.24011, "t": 532.04825, "r": 284.0993, "b": 537.2566400000001, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Data-centric architecture and design", "bbox": {"l": 287.28961, "t": 530.21414, "r": 399.65173, "b": 537.61813, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "r Data-centric architecture and design"}, {"label": "list_item", "id": 9, "page_no": 2, "cluster": {"id": 9, "label": "list_item", "bbox": {"l": 280.24011, "t": 540.39674, "r": 466.77881, "b": 547.80074, "coord_origin": "TOPLEFT"}, "confidence": 0.9218331575393677, "cells": [{"id": 32, "text": "r ", "bbox": {"l": 280.24011, "t": 542.23083, "r": 284.0993, "b": 547.43924, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "Extremely large database and overcoming limits to growth", "bbox": {"l": 287.28961, "t": 540.39674, "r": 466.77881, "b": 547.80074, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "r Extremely large database and overcoming limits to growth"}, {"label": "list_item", "id": 13, "page_no": 2, "cluster": {"id": 13, "label": "list_item", "bbox": {"l": 280.24011, "t": 550.5794500000001, "r": 382.20956, "b": 557.98344, "coord_origin": "TOPLEFT"}, "confidence": 0.9075438976287842, "cells": [{"id": 34, "text": "r ", "bbox": {"l": 280.24011, "t": 552.41354, "r": 284.0993, "b": 557.62195, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "ISV education and enablement", "bbox": {"l": 287.28961, "t": 550.5794500000001, "r": 382.20956, "b": 557.98344, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "r ISV education and enablement"}, {"label": "section_header", "id": 12, "page_no": 2, "cluster": {"id": 12, "label": "section_header", "bbox": {"l": 144.88921, "t": 327.46163999999993, "r": 188.74681, "b": 336.81406, "coord_origin": "TOPLEFT"}, "confidence": 0.9098502993583679, "cells": [{"id": 36, "text": "Highlights ", "bbox": {"l": 144.88921, "t": 327.46163999999993, "r": 188.74681, "b": 336.81406, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Highlights"}, {"label": "list_item", "id": 2, "page_no": 2, "cluster": {"id": 2, "label": "list_item", "bbox": {"l": 144.88921, "t": 345.21707, "r": 242.87389000000002, "b": 358.68942, "coord_origin": "TOPLEFT"}, "confidence": 0.957169771194458, "cells": [{"id": 37, "text": "GLYPH<g115>GLYPH<g3>", "bbox": {"l": 144.88921, "t": 346.01953, "r": 148.68732, "b": 350.60168, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "GLYPH<g40>GLYPH<g81>GLYPH<g75>GLYPH<g68>GLYPH<g81>GLYPH<g70>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 151.9388, "t": 345.21707, "r": 177.25424, "b": 350.85666, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "GLYPH<g87>GLYPH<g75>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 176.9472, "t": 345.21707, "r": 187.11098, "b": 350.85666, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g73>GLYPH<g82>GLYPH<g85>GLYPH<g80>GLYPH<g68>GLYPH<g81>GLYPH<g70>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 186.7914, "t": 345.21707, "r": 222.95989999999998, "b": 350.85666, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "GLYPH<g82>GLYPH<g73>GLYPH<g3>", "bbox": {"l": 222.65912, "t": 345.21707, "r": 229.55193999999997, "b": 350.85666, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "GLYPH<g92>GLYPH<g82>GLYPH<g88>GLYPH<g85> GLYPH<g3>", "bbox": {"l": 229.2261, "t": 345.21707, "r": 242.87389000000002, "b": 350.85666, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "GLYPH<g71>GLYPH<g68>GLYPH<g87>GLYPH<g68>GLYPH<g69>GLYPH<g68>GLYPH<g86>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 151.93253, "t": 353.04984, "r": 178.77066, "b": 358.68942, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "GLYPH<g82>GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g68>GLYPH<g87>GLYPH<g76>GLYPH<g82>GLYPH<g81>GLYPH<g86>", "bbox": {"l": 178.46362, "t": 353.04984, "r": 207.16908, "b": 358.68942, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<g115>GLYPH<g3> GLYPH<g40>GLYPH<g81>GLYPH<g75>GLYPH<g68>GLYPH<g81>GLYPH<g70>GLYPH<g72>GLYPH<g3> GLYPH<g87>GLYPH<g75>GLYPH<g72>GLYPH<g3> GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g73>GLYPH<g82>GLYPH<g85>GLYPH<g80>GLYPH<g68>GLYPH<g81>GLYPH<g70>GLYPH<g72>GLYPH<g3> GLYPH<g82>GLYPH<g73>GLYPH<g3> GLYPH<g92>GLYPH<g82>GLYPH<g88>GLYPH<g85> GLYPH<g3> GLYPH<g71>GLYPH<g68>GLYPH<g87>GLYPH<g68>GLYPH<g69>GLYPH<g68>GLYPH<g86>GLYPH<g72>GLYPH<g3> GLYPH<g82>GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g68>GLYPH<g87>GLYPH<g76>GLYPH<g82>GLYPH<g81>GLYPH<g86>"}, {"label": "list_item", "id": 1, "page_no": 2, "cluster": {"id": 1, "label": "list_item", "bbox": {"l": 144.88921, "t": 367.93219, "r": 259.2287, "b": 389.2373, "coord_origin": "TOPLEFT"}, "confidence": 0.9634580612182617, "cells": [{"id": 45, "text": "GLYPH<g115>GLYPH<g3>", "bbox": {"l": 144.88921, "t": 368.73465, "r": 148.68732, "b": 373.3168, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "GLYPH<g40>GLYPH<g68>GLYPH<g85> GLYPH<g81>GLYPH<g3>", "bbox": {"l": 151.9388, "t": 367.93219, "r": 166.05655, "b": 373.57178, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "GLYPH<g74>GLYPH<g85>GLYPH<g72>GLYPH<g68>GLYPH<g87>GLYPH<g72>GLYPH<g85>GLYPH<g3>", "bbox": {"l": 165.73697, "t": 367.93219, "r": 186.40289, "b": 373.57178, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "GLYPH<g85>GLYPH<g72>GLYPH<g87>GLYPH<g88>GLYPH<g85> GLYPH<g81>GLYPH<g3>", "bbox": {"l": 186.09586, "t": 367.93219, "r": 203.61617, "b": 373.57178, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "GLYPH<g82>GLYPH<g81>GLYPH<g3>", "bbox": {"l": 203.30286, "t": 367.93219, "r": 211.82489, "b": 373.57178, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "GLYPH<g44>GLYPH<g55>GLYPH<g3>", "bbox": {"l": 211.49905, "t": 367.93219, "r": 218.16002, "b": 373.57178, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "GLYPH<g83>GLYPH<g85>GLYPH<g82>GLYPH<g77>GLYPH<g72>GLYPH<g70>GLYPH<g87>GLYPH<g86> GLYPH<g3>", "bbox": {"l": 217.83418, "t": 367.93219, "r": 241.30737, "b": 373.57178, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "GLYPH<g87>GLYPH<g75>GLYPH<g85>GLYPH<g82>GLYPH<g88>GLYPH<g74>GLYPH<g75>GLYPH<g3>", "bbox": {"l": 151.93253, "t": 375.76495, "r": 174.46577, "b": 381.40454, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "GLYPH<g80>GLYPH<g82>GLYPH<g71>GLYPH<g72>GLYPH<g85> GLYPH<g81>GLYPH<g76>GLYPH<g93>GLYPH<g68>GLYPH<g87>GLYPH<g76>GLYPH<g82>GLYPH<g81>GLYPH<g3>", "bbox": {"l": 174.15874, "t": 375.76495, "r": 214.4128, "b": 381.40454, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "GLYPH<g82>GLYPH<g73>GLYPH<g3>", "bbox": {"l": 214.11829, "t": 375.76495, "r": 221.01110999999997, "b": 381.40454, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "GLYPH<g71>GLYPH<g68>GLYPH<g87>GLYPH<g68>GLYPH<g69>GLYPH<g68>GLYPH<g86>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 220.68527, "t": 375.76495, "r": 247.52341000000004, "b": 381.40454, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "GLYPH<g68>GLYPH<g81>GLYPH<g71> GLYPH<g3>", "bbox": {"l": 247.21637, "t": 375.76495, "r": 259.2287, "b": 381.40454, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "GLYPH<g68>GLYPH<g83>GLYPH<g83>GLYPH<g79>GLYPH<g76>GLYPH<g70>GLYPH<g68>GLYPH<g87>GLYPH<g76>GLYPH<g82>GLYPH<g81>GLYPH<g86>", "bbox": {"l": 151.93253, "t": 383.59772, "r": 184.61703, "b": 389.2373, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<g115>GLYPH<g3> GLYPH<g40>GLYPH<g68>GLYPH<g85> GLYPH<g81>GLYPH<g3> GLYPH<g74>GLYPH<g85>GLYPH<g72>GLYPH<g68>GLYPH<g87>GLYPH<g72>GLYPH<g85>GLYPH<g3> GLYPH<g85>GLYPH<g72>GLYPH<g87>GLYPH<g88>GLYPH<g85> GLYPH<g81>GLYPH<g3> GLYPH<g82>GLYPH<g81>GLYPH<g3> GLYPH<g44>GLYPH<g55>GLYPH<g3> GLYPH<g83>GLYPH<g85>GLYPH<g82>GLYPH<g77>GLYPH<g72>GLYPH<g70>GLYPH<g87>GLYPH<g86> GLYPH<g3> GLYPH<g87>GLYPH<g75>GLYPH<g85>GLYPH<g82>GLYPH<g88>GLYPH<g74>GLYPH<g75>GLYPH<g3> GLYPH<g80>GLYPH<g82>GLYPH<g71>GLYPH<g72>GLYPH<g85> GLYPH<g81>GLYPH<g76>GLYPH<g93>GLYPH<g68>GLYPH<g87>GLYPH<g76>GLYPH<g82>GLYPH<g81>GLYPH<g3> GLYPH<g82>GLYPH<g73>GLYPH<g3> GLYPH<g71>GLYPH<g68>GLYPH<g87>GLYPH<g68>GLYPH<g69>GLYPH<g68>GLYPH<g86>GLYPH<g72>GLYPH<g3> GLYPH<g68>GLYPH<g81>GLYPH<g71> GLYPH<g3> GLYPH<g68>GLYPH<g83>GLYPH<g83>GLYPH<g79>GLYPH<g76>GLYPH<g70>GLYPH<g68>GLYPH<g87>GLYPH<g76>GLYPH<g82>GLYPH<g81>GLYPH<g86>"}, {"label": "list_item", "id": 4, "page_no": 2, "cluster": {"id": 4, "label": "list_item", "bbox": {"l": 144.88921, "t": 398.48019, "r": 249.83562, "b": 411.95255, "coord_origin": "TOPLEFT"}, "confidence": 0.9541196823120117, "cells": [{"id": 58, "text": "GLYPH<g115>GLYPH<g3>", "bbox": {"l": 144.88921, "t": 399.28265, "r": 148.68732, "b": 403.86481000000003, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "GLYPH<g53>GLYPH<g72>GLYPH<g79>GLYPH<g92>GLYPH<g3>", "bbox": {"l": 151.9388, "t": 398.48019, "r": 165.36099, "b": 404.11978, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "GLYPH<g82>GLYPH<g81>GLYPH<g3>", "bbox": {"l": 165.04141, "t": 398.48019, "r": 173.56345, "b": 404.11978, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "GLYPH<g44>GLYPH<g37>GLYPH<g48>GLYPH<g3>", "bbox": {"l": 173.23761, "t": 398.48019, "r": 185.95174, "b": 404.11978, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "GLYPH<g72>GLYPH<g91>GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g87>GLYPH<g3>", "bbox": {"l": 185.63216, "t": 398.48019, "r": 204.42448, "b": 404.11978, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "GLYPH<g70>GLYPH<g82>GLYPH<g81>GLYPH<g86>GLYPH<g88>GLYPH<g79>GLYPH<g87>GLYPH<g76>GLYPH<g81>GLYPH<g74>GLYPH<g15>GLYPH<g3>", "bbox": {"l": 204.11118, "t": 398.48019, "r": 235.29178, "b": 404.11978, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "GLYPH<g86>GLYPH<g78>GLYPH<g76>GLYPH<g79>GLYPH<g79>GLYPH<g86> GLYPH<g3>", "bbox": {"l": 234.99099999999999, "t": 398.48019, "r": 249.83562, "b": 404.11978, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "GLYPH<g86>GLYPH<g75>GLYPH<g68>GLYPH<g85>GLYPH<g76>GLYPH<g81>GLYPH<g74>GLYPH<g3>", "bbox": {"l": 151.93253, "t": 406.31296, "r": 173.41306, "b": 411.95255, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "GLYPH<g68>GLYPH<g81>GLYPH<g71>GLYPH<g3>", "bbox": {"l": 173.10602, "t": 406.31296, "r": 185.0118, "b": 411.95255, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "GLYPH<g85>GLYPH<g72>GLYPH<g81>GLYPH<g82>GLYPH<g90>GLYPH<g81>GLYPH<g3>", "bbox": {"l": 184.69221, "t": 406.31296, "r": 206.3858, "b": 411.95255, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "GLYPH<g86>GLYPH<g72>GLYPH<g85>GLYPH<g89>GLYPH<g76>GLYPH<g70>GLYPH<g72>GLYPH<g86>", "bbox": {"l": 206.07249, "t": 406.31296, "r": 228.24231000000003, "b": 411.95255, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<g115>GLYPH<g3> GLYPH<g53>GLYPH<g72>GLYPH<g79>GLYPH<g92>GLYPH<g3> GLYPH<g82>GLYPH<g81>GLYPH<g3> GLYPH<g44>GLYPH<g37>GLYPH<g48>GLYPH<g3> GLYPH<g72>GLYPH<g91>GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g87>GLYPH<g3> GLYPH<g70>GLYPH<g82>GLYPH<g81>GLYPH<g86>GLYPH<g88>GLYPH<g79>GLYPH<g87>GLYPH<g76>GLYPH<g81>GLYPH<g74>GLYPH<g15>GLYPH<g3> GLYPH<g86>GLYPH<g78>GLYPH<g76>GLYPH<g79>GLYPH<g79>GLYPH<g86> GLYPH<g3> GLYPH<g86>GLYPH<g75>GLYPH<g68>GLYPH<g85>GLYPH<g76>GLYPH<g81>GLYPH<g74>GLYPH<g3> GLYPH<g68>GLYPH<g81>GLYPH<g71>GLYPH<g3> GLYPH<g85>GLYPH<g72>GLYPH<g81>GLYPH<g82>GLYPH<g90>GLYPH<g81>GLYPH<g3> GLYPH<g86>GLYPH<g72>GLYPH<g85>GLYPH<g89>GLYPH<g76>GLYPH<g70>GLYPH<g72>GLYPH<g86>"}, {"label": "list_item", "id": 5, "page_no": 2, "cluster": {"id": 5, "label": "list_item", "bbox": {"l": 144.88921, "t": 421.1952800000001, "r": 234.25163000000003, "b": 434.66763, "coord_origin": "TOPLEFT"}, "confidence": 0.9440370798110962, "cells": [{"id": 69, "text": "GLYPH<g115>GLYPH<g3>", "bbox": {"l": 144.88921, "t": 421.99773999999996, "r": 148.68732, "b": 426.5799, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "GLYPH<g55>", "bbox": {"l": 151.9388, "t": 421.1952800000001, "r": 155.43533, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "GLYPH<g68>GLYPH<g78>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 154.73979, "t": 421.1952800000001, "r": 166.06282, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "GLYPH<g68>GLYPH<g71>GLYPH<g89>GLYPH<g68>GLYPH<g81>GLYPH<g87>GLYPH<g68>GLYPH<g74>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 165.74324, "t": 421.1952800000001, "r": 195.84607, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "GLYPH<g82>GLYPH<g73>GLYPH<g3>", "bbox": {"l": 195.53903, "t": 421.1952800000001, "r": 202.43185, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "GLYPH<g68>GLYPH<g70>GLYPH<g70>GLYPH<g72>GLYPH<g86>GLYPH<g86>GLYPH<g3>", "bbox": {"l": 202.10602, "t": 421.1952800000001, "r": 222.87220999999997, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "GLYPH<g87>GLYPH<g82>GLYPH<g3>", "bbox": {"l": 222.55890000000002, "t": 421.1952800000001, "r": 229.57077, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "GLYPH<g68> GLYPH<g3>", "bbox": {"l": 229.24492999999998, "t": 421.1952800000001, "r": 234.25163000000003, "b": 426.83487, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "GLYPH<g90>GLYPH<g82>GLYPH<g85>GLYPH<g79>GLYPH<g71>GLYPH<g90>GLYPH<g76>GLYPH<g71>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 151.92627, "t": 429.02805, "r": 181.42754, "b": 434.66763, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "GLYPH<g86>GLYPH<g82>GLYPH<g88>GLYPH<g85>GLYPH<g70>GLYPH<g72>GLYPH<g3>", "bbox": {"l": 181.1205, "t": 429.02805, "r": 201.07835, "b": 434.66763, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "GLYPH<g82>GLYPH<g73>GLYPH<g3>", "bbox": {"l": 200.76505, "t": 429.02805, "r": 207.65787, "b": 434.66763, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "GLYPH<g72>GLYPH<g91>GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g87>GLYPH<g76>GLYPH<g86>GLYPH<g72>", "bbox": {"l": 207.33203, "t": 429.02805, "r": 232.07098000000002, "b": 434.66763, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<g115>GLYPH<g3> GLYPH<g55> GLYPH<g68>GLYPH<g78>GLYPH<g72>GLYPH<g3> GLYPH<g68>GLYPH<g71>GLYPH<g89>GLYPH<g68>GLYPH<g81>GLYPH<g87>GLYPH<g68>GLYPH<g74>GLYPH<g72>GLYPH<g3> GLYPH<g82>GLYPH<g73>GLYPH<g3> GLYPH<g68>GLYPH<g70>GLYPH<g70>GLYPH<g72>GLYPH<g86>GLYPH<g86>GLYPH<g3> GLYPH<g87>GLYPH<g82>GLYPH<g3> GLYPH<g68> GLYPH<g3> GLYPH<g90>GLYPH<g82>GLYPH<g85>GLYPH<g79>GLYPH<g71>GLYPH<g90>GLYPH<g76>GLYPH<g71>GLYPH<g72>GLYPH<g3> GLYPH<g86>GLYPH<g82>GLYPH<g88>GLYPH<g85>GLYPH<g70>GLYPH<g72>GLYPH<g3> GLYPH<g82>GLYPH<g73>GLYPH<g3> GLYPH<g72>GLYPH<g91>GLYPH<g83>GLYPH<g72>GLYPH<g85>GLYPH<g87>GLYPH<g76>GLYPH<g86>GLYPH<g72>"}, {"label": "picture", "id": 24, "page_no": 2, "cluster": {"id": 24, "label": "picture", "bbox": {"l": 143.39866638183594, "t": 270.2610778808594, "r": 179.56256103515625, "b": 285.621337890625, "coord_origin": "TOPLEFT"}, "confidence": 0.7491768598556519, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "picture", "id": 15, "page_no": 2, "cluster": {"id": 15, "label": "picture", "bbox": {"l": 64.1669921875, "t": 603.50634765625, "r": 258.7742919921875, "b": 688.1282348632812, "coord_origin": "TOPLEFT"}, "confidence": 0.8925829529762268, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "headers": []}}, {"page_no": 3, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "' Copyright IBM Corp. 2014. All rights reserved.", "bbox": {"l": 64.800003, "t": 755.538002, "r": 257.24335, "b": 763.863001, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "xi", "bbox": {"l": 538.85999, "t": 754.848721, "r": 547.25031, "b": 764.06172, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Preface", "bbox": {"l": 64.800003, "t": 73.84802000000002, "r": 151.46161, "b": 96.04803000000004, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "This IBMfi Redpaper\u2122 publication provides information about the IBM i 7.2 feature of IBM ", "bbox": {"l": 136.8, "t": 132.64862000000005, "r": 542.91888, "b": 141.86163, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "DB2fi for i Row and Column Access Control (RCAC). It offers a broad description of the ", "bbox": {"l": 136.79984, "t": 144.64844000000005, "r": 526.65509, "b": 153.86145, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "function and advantages of controlling access to data in a comprehensive and transparent ", "bbox": {"l": 136.79984, "t": 156.64824999999996, "r": 536.82135, "b": 165.86127, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "way. This publication helps you understand the capabilities of RCAC and provides examples ", "bbox": {"l": 136.79987, "t": 168.64806999999996, "r": 544.67975, "b": 177.86108000000002, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "of defining, creating, and implementing the row permissions and column masks in a relational ", "bbox": {"l": 136.79987, "t": 180.64788999999996, "r": 547.30823, "b": 189.86090000000002, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "database environment.", "bbox": {"l": 136.79987, "t": 192.64770999999996, "r": 238.32117, "b": 201.86072000000001, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "This paper is intended for database engineers, data-centric application developers, and ", "bbox": {"l": 136.79987, "t": 214.60748, "r": 524.18518, "b": 223.82050000000004, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "security officers who want to design and implement RCAC as a part of their data control and ", "bbox": {"l": 136.79987, "t": 226.6073, "r": 546.4657, "b": 235.82030999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "governance policy. A solid background in IBM i object level security, DB2 for i relational ", "bbox": {"l": 136.79987, "t": 238.60712, "r": 521.25488, "b": 247.82012999999995, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "database concepts, and SQL is assumed.", "bbox": {"l": 136.79987, "t": 250.60693000000003, "r": 321.69434, "b": 259.81994999999995, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Authors", "bbox": {"l": 64.800003, "t": 288.3006, "r": 125.36661, "b": 303.0636, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "This paper was produced by the IBM DB2 for i Center of Excellence team in partnership with ", "bbox": {"l": 136.8, "t": 320.62871999999993, "r": 547.23669, "b": 329.8417099999999, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "the International Technical Support Organization (ITSO), Rochester, Minnesota US.", "bbox": {"l": 136.8, "t": 332.62854, "r": 505.05518, "b": 341.84152, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Jim Bainbridge", "bbox": {"l": 263.39957, "t": 375.64877, "r": 335.7251, "b": 384.86176, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": " is a senior DB2 consultant on the DB2 for i ", "bbox": {"l": 335.69922, "t": 375.64877, "r": 529.34259, "b": 384.86176, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Center of Excellence team in the IBM Lab Services and ", "bbox": {"l": 263.3996, "t": 387.64859, "r": 511.50717, "b": 396.86157, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Training organization. His primary role is training and ", "bbox": {"l": 263.3996, "t": 399.64841, "r": 499.077, "b": 408.86139, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "implementation services for IBM DB2 Web Query for i and ", "bbox": {"l": 263.3996, "t": 411.64822, "r": 522.51996, "b": 420.86121, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "business analytics. Jim began his career with IBM 30 years ago ", "bbox": {"l": 263.3996, "t": 423.64804, "r": 541.25079, "b": 432.86102, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "in the IBM Rochester Development Lab, where he developed ", "bbox": {"l": 263.3996, "t": 435.64786, "r": 534.71411, "b": 444.86084, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "cooperative processing products that paired IBM PCs with IBM ", "bbox": {"l": 263.3996, "t": 447.64767, "r": 541.22375, "b": 456.86066, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "S/36 and AS/.400 systems. In the years since, Jim has held ", "bbox": {"l": 263.3996, "t": 459.64749, "r": 528.91016, "b": 468.86047, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "numerous technical roles, including independent software ", "bbox": {"l": 263.3996, "t": 471.64731, "r": 520.24207, "b": 480.86029, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "vendors technical support on a broad range of IBM ", "bbox": {"l": 263.3996, "t": 483.64713, "r": 490.6967200000001, "b": 492.86011, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "technologies and products, and supporting customers in the ", "bbox": {"l": 263.3996, "t": 495.64694, "r": 530.95514, "b": 504.85992, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "IBM Executive Briefing Center and IBM Project Office.", "bbox": {"l": 263.3996, "t": 507.64676, "r": 501.62973, "b": 516.85974, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Hernando Bedoya", "bbox": {"l": 263.3996, "t": 527.62653, "r": 348.38229, "b": 536.83952, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": " is a Senior IT Specialist at STG Lab ", "bbox": {"l": 348.41916, "t": 527.62653, "r": 512.3429, "b": 536.83952, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Services and Training in Rochester, Minnesota. He writes ", "bbox": {"l": 263.3996, "t": 539.62633, "r": 519.26306, "b": 548.83932, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "extensively and teaches IBM classes worldwide in all areas of ", "bbox": {"l": 263.3996, "t": 551.62613, "r": 538.40308, "b": 560.8391300000001, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "DB2 for i. Before joining STG Lab Services, he worked in the ", "bbox": {"l": 263.3996, "t": 563.62593, "r": 533.95715, "b": 572.83893, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "ITSO for nine years writing multiple IBM Redbooksfi ", "bbox": {"l": 263.3996, "t": 575.62573, "r": 496.94464, "b": 584.8387299999999, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "publications. He also worked for IBM Colombia as an IBM ", "bbox": {"l": 263.3996, "t": 587.62553, "r": 520.38562, "b": 596.83853, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "AS/400fi IT Specialist doing presales support for the Andean ", "bbox": {"l": 263.3996, "t": 599.62534, "r": 535.99078, "b": 608.83833, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "countries. He has 28 years of experience in the computing field ", "bbox": {"l": 263.3996, "t": 611.62514, "r": 541.27374, "b": 620.83813, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "and has taught database classes in Colombian universities. He ", "bbox": {"l": 263.3996, "t": 623.62494, "r": 541.26465, "b": 632.83794, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "holds a Master\u2019s degree in Computer Science from EAFIT, ", "bbox": {"l": 263.3996, "t": 635.62474, "r": 523.22211, "b": 644.8377399999999, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "Colombia. His areas of expertise are database technology, ", "bbox": {"l": 263.3996, "t": 647.62454, "r": 524.77386, "b": 656.83754, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "performance, and data warehousing. Hernando can be ", "bbox": {"l": 263.3996, "t": 659.62434, "r": 508.27124, "b": 668.83735, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "contacted at ", "bbox": {"l": 263.3996, "t": 671.62415, "r": 320.63568, "b": 680.83716, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "hbedoya@us.ibm.com", "bbox": {"l": 320.63971, "t": 671.77356, "r": 410.57852, "b": 680.54832, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": ".", "bbox": {"l": 410.5795, "t": 671.62415, "r": 413.34839, "b": 680.83716, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 7, "label": "page_footer", "bbox": {"l": 64.800003, "t": 755.538002, "r": 257.24335, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9469243884086609, "cells": [{"id": 0, "text": "' Copyright IBM Corp. 2014. All rights reserved.", "bbox": {"l": 64.800003, "t": 755.538002, "r": 257.24335, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "page_footer", "bbox": {"l": 538.85999, "t": 754.848721, "r": 547.25031, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.904093861579895, "cells": [{"id": 1, "text": "xi", "bbox": {"l": 538.85999, "t": 754.848721, "r": 547.25031, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "section_header", "bbox": {"l": 64.800003, "t": 73.84802000000002, "r": 151.46161, "b": 96.04803000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9174711108207703, "cells": [{"id": 2, "text": "Preface", "bbox": {"l": 64.800003, "t": 73.84802000000002, "r": 151.46161, "b": 96.04803000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 136.79984, "t": 132.64862000000005, "r": 547.30823, "b": 201.86072000000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9869155883789062, "cells": [{"id": 3, "text": "This IBMfi Redpaper\u2122 publication provides information about the IBM i 7.2 feature of IBM ", "bbox": {"l": 136.8, "t": 132.64862000000005, "r": 542.91888, "b": 141.86163, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "DB2fi for i Row and Column Access Control (RCAC). It offers a broad description of the ", "bbox": {"l": 136.79984, "t": 144.64844000000005, "r": 526.65509, "b": 153.86145, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "function and advantages of controlling access to data in a comprehensive and transparent ", "bbox": {"l": 136.79984, "t": 156.64824999999996, "r": 536.82135, "b": 165.86127, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "way. This publication helps you understand the capabilities of RCAC and provides examples ", "bbox": {"l": 136.79987, "t": 168.64806999999996, "r": 544.67975, "b": 177.86108000000002, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "of defining, creating, and implementing the row permissions and column masks in a relational ", "bbox": {"l": 136.79987, "t": 180.64788999999996, "r": 547.30823, "b": 189.86090000000002, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "database environment.", "bbox": {"l": 136.79987, "t": 192.64770999999996, "r": 238.32117, "b": 201.86072000000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 136.79987, "t": 214.60748, "r": 546.4657, "b": 259.81994999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9872201681137085, "cells": [{"id": 9, "text": "This paper is intended for database engineers, data-centric application developers, and ", "bbox": {"l": 136.79987, "t": 214.60748, "r": 524.18518, "b": 223.82050000000004, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "security officers who want to design and implement RCAC as a part of their data control and ", "bbox": {"l": 136.79987, "t": 226.6073, "r": 546.4657, "b": 235.82030999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "governance policy. A solid background in IBM i object level security, DB2 for i relational ", "bbox": {"l": 136.79987, "t": 238.60712, "r": 521.25488, "b": 247.82012999999995, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "database concepts, and SQL is assumed.", "bbox": {"l": 136.79987, "t": 250.60693000000003, "r": 321.69434, "b": 259.81994999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "section_header", "bbox": {"l": 64.800003, "t": 288.3006, "r": 125.36661, "b": 303.0636, "coord_origin": "TOPLEFT"}, "confidence": 0.9255507588386536, "cells": [{"id": 13, "text": "Authors", "bbox": {"l": 64.800003, "t": 288.3006, "r": 125.36661, "b": 303.0636, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "text", "bbox": {"l": 136.8, "t": 320.62871999999993, "r": 547.23669, "b": 341.84152, "coord_origin": "TOPLEFT"}, "confidence": 0.9713318347930908, "cells": [{"id": 14, "text": "This paper was produced by the IBM DB2 for i Center of Excellence team in partnership with ", "bbox": {"l": 136.8, "t": 320.62871999999993, "r": 547.23669, "b": 329.8417099999999, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "the International Technical Support Organization (ITSO), Rochester, Minnesota US.", "bbox": {"l": 136.8, "t": 332.62854, "r": 505.05518, "b": 341.84152, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "text", "bbox": {"l": 263.39957, "t": 375.64877, "r": 541.25079, "b": 516.85974, "coord_origin": "TOPLEFT"}, "confidence": 0.9842760562896729, "cells": [{"id": 16, "text": "Jim Bainbridge", "bbox": {"l": 263.39957, "t": 375.64877, "r": 335.7251, "b": 384.86176, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": " is a senior DB2 consultant on the DB2 for i ", "bbox": {"l": 335.69922, "t": 375.64877, "r": 529.34259, "b": 384.86176, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Center of Excellence team in the IBM Lab Services and ", "bbox": {"l": 263.3996, "t": 387.64859, "r": 511.50717, "b": 396.86157, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Training organization. His primary role is training and ", "bbox": {"l": 263.3996, "t": 399.64841, "r": 499.077, "b": 408.86139, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "implementation services for IBM DB2 Web Query for i and ", "bbox": {"l": 263.3996, "t": 411.64822, "r": 522.51996, "b": 420.86121, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "business analytics. Jim began his career with IBM 30 years ago ", "bbox": {"l": 263.3996, "t": 423.64804, "r": 541.25079, "b": 432.86102, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "in the IBM Rochester Development Lab, where he developed ", "bbox": {"l": 263.3996, "t": 435.64786, "r": 534.71411, "b": 444.86084, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "cooperative processing products that paired IBM PCs with IBM ", "bbox": {"l": 263.3996, "t": 447.64767, "r": 541.22375, "b": 456.86066, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "S/36 and AS/.400 systems. In the years since, Jim has held ", "bbox": {"l": 263.3996, "t": 459.64749, "r": 528.91016, "b": 468.86047, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "numerous technical roles, including independent software ", "bbox": {"l": 263.3996, "t": 471.64731, "r": 520.24207, "b": 480.86029, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "vendors technical support on a broad range of IBM ", "bbox": {"l": 263.3996, "t": 483.64713, "r": 490.6967200000001, "b": 492.86011, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "technologies and products, and supporting customers in the ", "bbox": {"l": 263.3996, "t": 495.64694, "r": 530.95514, "b": 504.85992, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "IBM Executive Briefing Center and IBM Project Office.", "bbox": {"l": 263.3996, "t": 507.64676, "r": 501.62973, "b": 516.85974, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "text", "bbox": {"l": 263.3996, "t": 527.62653, "r": 541.27374, "b": 680.83716, "coord_origin": "TOPLEFT"}, "confidence": 0.9823779463768005, "cells": [{"id": 29, "text": "Hernando Bedoya", "bbox": {"l": 263.3996, "t": 527.62653, "r": 348.38229, "b": 536.83952, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": " is a Senior IT Specialist at STG Lab ", "bbox": {"l": 348.41916, "t": 527.62653, "r": 512.3429, "b": 536.83952, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Services and Training in Rochester, Minnesota. He writes ", "bbox": {"l": 263.3996, "t": 539.62633, "r": 519.26306, "b": 548.83932, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "extensively and teaches IBM classes worldwide in all areas of ", "bbox": {"l": 263.3996, "t": 551.62613, "r": 538.40308, "b": 560.8391300000001, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "DB2 for i. Before joining STG Lab Services, he worked in the ", "bbox": {"l": 263.3996, "t": 563.62593, "r": 533.95715, "b": 572.83893, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "ITSO for nine years writing multiple IBM Redbooksfi ", "bbox": {"l": 263.3996, "t": 575.62573, "r": 496.94464, "b": 584.8387299999999, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "publications. He also worked for IBM Colombia as an IBM ", "bbox": {"l": 263.3996, "t": 587.62553, "r": 520.38562, "b": 596.83853, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "AS/400fi IT Specialist doing presales support for the Andean ", "bbox": {"l": 263.3996, "t": 599.62534, "r": 535.99078, "b": 608.83833, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "countries. He has 28 years of experience in the computing field ", "bbox": {"l": 263.3996, "t": 611.62514, "r": 541.27374, "b": 620.83813, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "and has taught database classes in Colombian universities. He ", "bbox": {"l": 263.3996, "t": 623.62494, "r": 541.26465, "b": 632.83794, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "holds a Master\u2019s degree in Computer Science from EAFIT, ", "bbox": {"l": 263.3996, "t": 635.62474, "r": 523.22211, "b": 644.8377399999999, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "Colombia. His areas of expertise are database technology, ", "bbox": {"l": 263.3996, "t": 647.62454, "r": 524.77386, "b": 656.83754, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "performance, and data warehousing. Hernando can be ", "bbox": {"l": 263.3996, "t": 659.62434, "r": 508.27124, "b": 668.83735, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "contacted at ", "bbox": {"l": 263.3996, "t": 671.62415, "r": 320.63568, "b": 680.83716, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "hbedoya@us.ibm.com", "bbox": {"l": 320.63971, "t": 671.77356, "r": 410.57852, "b": 680.54832, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": ".", "bbox": {"l": 410.5795, "t": 671.62415, "r": 413.34839, "b": 680.83716, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "picture", "bbox": {"l": 142.52883911132812, "t": 375.0449523925781, "r": 251.47850036621094, "b": 503.20648193359375, "coord_origin": "TOPLEFT"}, "confidence": 0.9862572550773621, "cells": [], "children": []}, {"id": 1, "label": "picture", "bbox": {"l": 145.4144744873047, "t": 527.2447509765625, "r": 252.08840942382812, "b": 635.383056640625, "coord_origin": "TOPLEFT"}, "confidence": 0.9871657490730286, "cells": [], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_footer", "id": 7, "page_no": 3, "cluster": {"id": 7, "label": "page_footer", "bbox": {"l": 64.800003, "t": 755.538002, "r": 257.24335, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9469243884086609, "cells": [{"id": 0, "text": "' Copyright IBM Corp. 2014. All rights reserved.", "bbox": {"l": 64.800003, "t": 755.538002, "r": 257.24335, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "' Copyright IBM Corp. 2014. All rights reserved."}, {"label": "page_footer", "id": 10, "page_no": 3, "cluster": {"id": 10, "label": "page_footer", "bbox": {"l": 538.85999, "t": 754.848721, "r": 547.25031, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.904093861579895, "cells": [{"id": 1, "text": "xi", "bbox": {"l": 538.85999, "t": 754.848721, "r": 547.25031, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "xi"}, {"label": "section_header", "id": 9, "page_no": 3, "cluster": {"id": 9, "label": "section_header", "bbox": {"l": 64.800003, "t": 73.84802000000002, "r": 151.46161, "b": 96.04803000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9174711108207703, "cells": [{"id": 2, "text": "Preface", "bbox": {"l": 64.800003, "t": 73.84802000000002, "r": 151.46161, "b": 96.04803000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Preface"}, {"label": "text", "id": 2, "page_no": 3, "cluster": {"id": 2, "label": "text", "bbox": {"l": 136.79984, "t": 132.64862000000005, "r": 547.30823, "b": 201.86072000000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9869155883789062, "cells": [{"id": 3, "text": "This IBMfi Redpaper\u2122 publication provides information about the IBM i 7.2 feature of IBM ", "bbox": {"l": 136.8, "t": 132.64862000000005, "r": 542.91888, "b": 141.86163, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "DB2fi for i Row and Column Access Control (RCAC). It offers a broad description of the ", "bbox": {"l": 136.79984, "t": 144.64844000000005, "r": 526.65509, "b": 153.86145, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "function and advantages of controlling access to data in a comprehensive and transparent ", "bbox": {"l": 136.79984, "t": 156.64824999999996, "r": 536.82135, "b": 165.86127, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "way. This publication helps you understand the capabilities of RCAC and provides examples ", "bbox": {"l": 136.79987, "t": 168.64806999999996, "r": 544.67975, "b": 177.86108000000002, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "of defining, creating, and implementing the row permissions and column masks in a relational ", "bbox": {"l": 136.79987, "t": 180.64788999999996, "r": 547.30823, "b": 189.86090000000002, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "database environment.", "bbox": {"l": 136.79987, "t": 192.64770999999996, "r": 238.32117, "b": 201.86072000000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "This IBMfi Redpaper\u2122 publication provides information about the IBM i 7.2 feature of IBM DB2fi for i Row and Column Access Control (RCAC). It offers a broad description of the function and advantages of controlling access to data in a comprehensive and transparent way. This publication helps you understand the capabilities of RCAC and provides examples of defining, creating, and implementing the row permissions and column masks in a relational database environment."}, {"label": "text", "id": 0, "page_no": 3, "cluster": {"id": 0, "label": "text", "bbox": {"l": 136.79987, "t": 214.60748, "r": 546.4657, "b": 259.81994999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9872201681137085, "cells": [{"id": 9, "text": "This paper is intended for database engineers, data-centric application developers, and ", "bbox": {"l": 136.79987, "t": 214.60748, "r": 524.18518, "b": 223.82050000000004, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "security officers who want to design and implement RCAC as a part of their data control and ", "bbox": {"l": 136.79987, "t": 226.6073, "r": 546.4657, "b": 235.82030999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "governance policy. A solid background in IBM i object level security, DB2 for i relational ", "bbox": {"l": 136.79987, "t": 238.60712, "r": 521.25488, "b": 247.82012999999995, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "database concepts, and SQL is assumed.", "bbox": {"l": 136.79987, "t": 250.60693000000003, "r": 321.69434, "b": 259.81994999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "This paper is intended for database engineers, data-centric application developers, and security officers who want to design and implement RCAC as a part of their data control and governance policy. A solid background in IBM i object level security, DB2 for i relational database concepts, and SQL is assumed."}, {"label": "section_header", "id": 8, "page_no": 3, "cluster": {"id": 8, "label": "section_header", "bbox": {"l": 64.800003, "t": 288.3006, "r": 125.36661, "b": 303.0636, "coord_origin": "TOPLEFT"}, "confidence": 0.9255507588386536, "cells": [{"id": 13, "text": "Authors", "bbox": {"l": 64.800003, "t": 288.3006, "r": 125.36661, "b": 303.0636, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Authors"}, {"label": "text", "id": 6, "page_no": 3, "cluster": {"id": 6, "label": "text", "bbox": {"l": 136.8, "t": 320.62871999999993, "r": 547.23669, "b": 341.84152, "coord_origin": "TOPLEFT"}, "confidence": 0.9713318347930908, "cells": [{"id": 14, "text": "This paper was produced by the IBM DB2 for i Center of Excellence team in partnership with ", "bbox": {"l": 136.8, "t": 320.62871999999993, "r": 547.23669, "b": 329.8417099999999, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "the International Technical Support Organization (ITSO), Rochester, Minnesota US.", "bbox": {"l": 136.8, "t": 332.62854, "r": 505.05518, "b": 341.84152, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "This paper was produced by the IBM DB2 for i Center of Excellence team in partnership with the International Technical Support Organization (ITSO), Rochester, Minnesota US."}, {"label": "text", "id": 4, "page_no": 3, "cluster": {"id": 4, "label": "text", "bbox": {"l": 263.39957, "t": 375.64877, "r": 541.25079, "b": 516.85974, "coord_origin": "TOPLEFT"}, "confidence": 0.9842760562896729, "cells": [{"id": 16, "text": "Jim Bainbridge", "bbox": {"l": 263.39957, "t": 375.64877, "r": 335.7251, "b": 384.86176, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": " is a senior DB2 consultant on the DB2 for i ", "bbox": {"l": 335.69922, "t": 375.64877, "r": 529.34259, "b": 384.86176, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Center of Excellence team in the IBM Lab Services and ", "bbox": {"l": 263.3996, "t": 387.64859, "r": 511.50717, "b": 396.86157, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Training organization. His primary role is training and ", "bbox": {"l": 263.3996, "t": 399.64841, "r": 499.077, "b": 408.86139, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "implementation services for IBM DB2 Web Query for i and ", "bbox": {"l": 263.3996, "t": 411.64822, "r": 522.51996, "b": 420.86121, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "business analytics. Jim began his career with IBM 30 years ago ", "bbox": {"l": 263.3996, "t": 423.64804, "r": 541.25079, "b": 432.86102, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "in the IBM Rochester Development Lab, where he developed ", "bbox": {"l": 263.3996, "t": 435.64786, "r": 534.71411, "b": 444.86084, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "cooperative processing products that paired IBM PCs with IBM ", "bbox": {"l": 263.3996, "t": 447.64767, "r": 541.22375, "b": 456.86066, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "S/36 and AS/.400 systems. In the years since, Jim has held ", "bbox": {"l": 263.3996, "t": 459.64749, "r": 528.91016, "b": 468.86047, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "numerous technical roles, including independent software ", "bbox": {"l": 263.3996, "t": 471.64731, "r": 520.24207, "b": 480.86029, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "vendors technical support on a broad range of IBM ", "bbox": {"l": 263.3996, "t": 483.64713, "r": 490.6967200000001, "b": 492.86011, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "technologies and products, and supporting customers in the ", "bbox": {"l": 263.3996, "t": 495.64694, "r": 530.95514, "b": 504.85992, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "IBM Executive Briefing Center and IBM Project Office.", "bbox": {"l": 263.3996, "t": 507.64676, "r": 501.62973, "b": 516.85974, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Jim Bainbridge is a senior DB2 consultant on the DB2 for i Center of Excellence team in the IBM Lab Services and Training organization. His primary role is training and implementation services for IBM DB2 Web Query for i and business analytics. Jim began his career with IBM 30 years ago in the IBM Rochester Development Lab, where he developed cooperative processing products that paired IBM PCs with IBM S/36 and AS/.400 systems. In the years since, Jim has held numerous technical roles, including independent software vendors technical support on a broad range of IBM technologies and products, and supporting customers in the IBM Executive Briefing Center and IBM Project Office."}, {"label": "text", "id": 5, "page_no": 3, "cluster": {"id": 5, "label": "text", "bbox": {"l": 263.3996, "t": 527.62653, "r": 541.27374, "b": 680.83716, "coord_origin": "TOPLEFT"}, "confidence": 0.9823779463768005, "cells": [{"id": 29, "text": "Hernando Bedoya", "bbox": {"l": 263.3996, "t": 527.62653, "r": 348.38229, "b": 536.83952, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": " is a Senior IT Specialist at STG Lab ", "bbox": {"l": 348.41916, "t": 527.62653, "r": 512.3429, "b": 536.83952, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Services and Training in Rochester, Minnesota. He writes ", "bbox": {"l": 263.3996, "t": 539.62633, "r": 519.26306, "b": 548.83932, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "extensively and teaches IBM classes worldwide in all areas of ", "bbox": {"l": 263.3996, "t": 551.62613, "r": 538.40308, "b": 560.8391300000001, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "DB2 for i. Before joining STG Lab Services, he worked in the ", "bbox": {"l": 263.3996, "t": 563.62593, "r": 533.95715, "b": 572.83893, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "ITSO for nine years writing multiple IBM Redbooksfi ", "bbox": {"l": 263.3996, "t": 575.62573, "r": 496.94464, "b": 584.8387299999999, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "publications. He also worked for IBM Colombia as an IBM ", "bbox": {"l": 263.3996, "t": 587.62553, "r": 520.38562, "b": 596.83853, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "AS/400fi IT Specialist doing presales support for the Andean ", "bbox": {"l": 263.3996, "t": 599.62534, "r": 535.99078, "b": 608.83833, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "countries. He has 28 years of experience in the computing field ", "bbox": {"l": 263.3996, "t": 611.62514, "r": 541.27374, "b": 620.83813, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "and has taught database classes in Colombian universities. He ", "bbox": {"l": 263.3996, "t": 623.62494, "r": 541.26465, "b": 632.83794, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "holds a Master\u2019s degree in Computer Science from EAFIT, ", "bbox": {"l": 263.3996, "t": 635.62474, "r": 523.22211, "b": 644.8377399999999, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "Colombia. His areas of expertise are database technology, ", "bbox": {"l": 263.3996, "t": 647.62454, "r": 524.77386, "b": 656.83754, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "performance, and data warehousing. Hernando can be ", "bbox": {"l": 263.3996, "t": 659.62434, "r": 508.27124, "b": 668.83735, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "contacted at ", "bbox": {"l": 263.3996, "t": 671.62415, "r": 320.63568, "b": 680.83716, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "hbedoya@us.ibm.com", "bbox": {"l": 320.63971, "t": 671.77356, "r": 410.57852, "b": 680.54832, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": ".", "bbox": {"l": 410.5795, "t": 671.62415, "r": 413.34839, "b": 680.83716, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Hernando Bedoya is a Senior IT Specialist at STG Lab Services and Training in Rochester, Minnesota. He writes extensively and teaches IBM classes worldwide in all areas of DB2 for i. Before joining STG Lab Services, he worked in the ITSO for nine years writing multiple IBM Redbooksfi publications. He also worked for IBM Colombia as an IBM AS/400fi IT Specialist doing presales support for the Andean countries. He has 28 years of experience in the computing field and has taught database classes in Colombian universities. He holds a Master's degree in Computer Science from EAFIT, Colombia. His areas of expertise are database technology, performance, and data warehousing. Hernando can be contacted at hbedoya@us.ibm.com ."}, {"label": "picture", "id": 3, "page_no": 3, "cluster": {"id": 3, "label": "picture", "bbox": {"l": 142.52883911132812, "t": 375.0449523925781, "r": 251.47850036621094, "b": 503.20648193359375, "coord_origin": "TOPLEFT"}, "confidence": 0.9862572550773621, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "picture", "id": 1, "page_no": 3, "cluster": {"id": 1, "label": "picture", "bbox": {"l": 145.4144744873047, "t": 527.2447509765625, "r": 252.08840942382812, "b": 635.383056640625, "coord_origin": "TOPLEFT"}, "confidence": 0.9871657490730286, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "body": [{"label": "section_header", "id": 9, "page_no": 3, "cluster": {"id": 9, "label": "section_header", "bbox": {"l": 64.800003, "t": 73.84802000000002, "r": 151.46161, "b": 96.04803000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9174711108207703, "cells": [{"id": 2, "text": "Preface", "bbox": {"l": 64.800003, "t": 73.84802000000002, "r": 151.46161, "b": 96.04803000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Preface"}, {"label": "text", "id": 2, "page_no": 3, "cluster": {"id": 2, "label": "text", "bbox": {"l": 136.79984, "t": 132.64862000000005, "r": 547.30823, "b": 201.86072000000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9869155883789062, "cells": [{"id": 3, "text": "This IBMfi Redpaper\u2122 publication provides information about the IBM i 7.2 feature of IBM ", "bbox": {"l": 136.8, "t": 132.64862000000005, "r": 542.91888, "b": 141.86163, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "DB2fi for i Row and Column Access Control (RCAC). It offers a broad description of the ", "bbox": {"l": 136.79984, "t": 144.64844000000005, "r": 526.65509, "b": 153.86145, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "function and advantages of controlling access to data in a comprehensive and transparent ", "bbox": {"l": 136.79984, "t": 156.64824999999996, "r": 536.82135, "b": 165.86127, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "way. This publication helps you understand the capabilities of RCAC and provides examples ", "bbox": {"l": 136.79987, "t": 168.64806999999996, "r": 544.67975, "b": 177.86108000000002, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "of defining, creating, and implementing the row permissions and column masks in a relational ", "bbox": {"l": 136.79987, "t": 180.64788999999996, "r": 547.30823, "b": 189.86090000000002, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "database environment.", "bbox": {"l": 136.79987, "t": 192.64770999999996, "r": 238.32117, "b": 201.86072000000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "This IBMfi Redpaper\u2122 publication provides information about the IBM i 7.2 feature of IBM DB2fi for i Row and Column Access Control (RCAC). It offers a broad description of the function and advantages of controlling access to data in a comprehensive and transparent way. This publication helps you understand the capabilities of RCAC and provides examples of defining, creating, and implementing the row permissions and column masks in a relational database environment."}, {"label": "text", "id": 0, "page_no": 3, "cluster": {"id": 0, "label": "text", "bbox": {"l": 136.79987, "t": 214.60748, "r": 546.4657, "b": 259.81994999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9872201681137085, "cells": [{"id": 9, "text": "This paper is intended for database engineers, data-centric application developers, and ", "bbox": {"l": 136.79987, "t": 214.60748, "r": 524.18518, "b": 223.82050000000004, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "security officers who want to design and implement RCAC as a part of their data control and ", "bbox": {"l": 136.79987, "t": 226.6073, "r": 546.4657, "b": 235.82030999999995, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "governance policy. A solid background in IBM i object level security, DB2 for i relational ", "bbox": {"l": 136.79987, "t": 238.60712, "r": 521.25488, "b": 247.82012999999995, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "database concepts, and SQL is assumed.", "bbox": {"l": 136.79987, "t": 250.60693000000003, "r": 321.69434, "b": 259.81994999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "This paper is intended for database engineers, data-centric application developers, and security officers who want to design and implement RCAC as a part of their data control and governance policy. A solid background in IBM i object level security, DB2 for i relational database concepts, and SQL is assumed."}, {"label": "section_header", "id": 8, "page_no": 3, "cluster": {"id": 8, "label": "section_header", "bbox": {"l": 64.800003, "t": 288.3006, "r": 125.36661, "b": 303.0636, "coord_origin": "TOPLEFT"}, "confidence": 0.9255507588386536, "cells": [{"id": 13, "text": "Authors", "bbox": {"l": 64.800003, "t": 288.3006, "r": 125.36661, "b": 303.0636, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Authors"}, {"label": "text", "id": 6, "page_no": 3, "cluster": {"id": 6, "label": "text", "bbox": {"l": 136.8, "t": 320.62871999999993, "r": 547.23669, "b": 341.84152, "coord_origin": "TOPLEFT"}, "confidence": 0.9713318347930908, "cells": [{"id": 14, "text": "This paper was produced by the IBM DB2 for i Center of Excellence team in partnership with ", "bbox": {"l": 136.8, "t": 320.62871999999993, "r": 547.23669, "b": 329.8417099999999, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "the International Technical Support Organization (ITSO), Rochester, Minnesota US.", "bbox": {"l": 136.8, "t": 332.62854, "r": 505.05518, "b": 341.84152, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "This paper was produced by the IBM DB2 for i Center of Excellence team in partnership with the International Technical Support Organization (ITSO), Rochester, Minnesota US."}, {"label": "text", "id": 4, "page_no": 3, "cluster": {"id": 4, "label": "text", "bbox": {"l": 263.39957, "t": 375.64877, "r": 541.25079, "b": 516.85974, "coord_origin": "TOPLEFT"}, "confidence": 0.9842760562896729, "cells": [{"id": 16, "text": "Jim Bainbridge", "bbox": {"l": 263.39957, "t": 375.64877, "r": 335.7251, "b": 384.86176, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": " is a senior DB2 consultant on the DB2 for i ", "bbox": {"l": 335.69922, "t": 375.64877, "r": 529.34259, "b": 384.86176, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "Center of Excellence team in the IBM Lab Services and ", "bbox": {"l": 263.3996, "t": 387.64859, "r": 511.50717, "b": 396.86157, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Training organization. His primary role is training and ", "bbox": {"l": 263.3996, "t": 399.64841, "r": 499.077, "b": 408.86139, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "implementation services for IBM DB2 Web Query for i and ", "bbox": {"l": 263.3996, "t": 411.64822, "r": 522.51996, "b": 420.86121, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "business analytics. Jim began his career with IBM 30 years ago ", "bbox": {"l": 263.3996, "t": 423.64804, "r": 541.25079, "b": 432.86102, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "in the IBM Rochester Development Lab, where he developed ", "bbox": {"l": 263.3996, "t": 435.64786, "r": 534.71411, "b": 444.86084, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "cooperative processing products that paired IBM PCs with IBM ", "bbox": {"l": 263.3996, "t": 447.64767, "r": 541.22375, "b": 456.86066, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "S/36 and AS/.400 systems. In the years since, Jim has held ", "bbox": {"l": 263.3996, "t": 459.64749, "r": 528.91016, "b": 468.86047, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "numerous technical roles, including independent software ", "bbox": {"l": 263.3996, "t": 471.64731, "r": 520.24207, "b": 480.86029, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "vendors technical support on a broad range of IBM ", "bbox": {"l": 263.3996, "t": 483.64713, "r": 490.6967200000001, "b": 492.86011, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "technologies and products, and supporting customers in the ", "bbox": {"l": 263.3996, "t": 495.64694, "r": 530.95514, "b": 504.85992, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "IBM Executive Briefing Center and IBM Project Office.", "bbox": {"l": 263.3996, "t": 507.64676, "r": 501.62973, "b": 516.85974, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Jim Bainbridge is a senior DB2 consultant on the DB2 for i Center of Excellence team in the IBM Lab Services and Training organization. His primary role is training and implementation services for IBM DB2 Web Query for i and business analytics. Jim began his career with IBM 30 years ago in the IBM Rochester Development Lab, where he developed cooperative processing products that paired IBM PCs with IBM S/36 and AS/.400 systems. In the years since, Jim has held numerous technical roles, including independent software vendors technical support on a broad range of IBM technologies and products, and supporting customers in the IBM Executive Briefing Center and IBM Project Office."}, {"label": "text", "id": 5, "page_no": 3, "cluster": {"id": 5, "label": "text", "bbox": {"l": 263.3996, "t": 527.62653, "r": 541.27374, "b": 680.83716, "coord_origin": "TOPLEFT"}, "confidence": 0.9823779463768005, "cells": [{"id": 29, "text": "Hernando Bedoya", "bbox": {"l": 263.3996, "t": 527.62653, "r": 348.38229, "b": 536.83952, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": " is a Senior IT Specialist at STG Lab ", "bbox": {"l": 348.41916, "t": 527.62653, "r": 512.3429, "b": 536.83952, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Services and Training in Rochester, Minnesota. He writes ", "bbox": {"l": 263.3996, "t": 539.62633, "r": 519.26306, "b": 548.83932, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "extensively and teaches IBM classes worldwide in all areas of ", "bbox": {"l": 263.3996, "t": 551.62613, "r": 538.40308, "b": 560.8391300000001, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "DB2 for i. Before joining STG Lab Services, he worked in the ", "bbox": {"l": 263.3996, "t": 563.62593, "r": 533.95715, "b": 572.83893, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "ITSO for nine years writing multiple IBM Redbooksfi ", "bbox": {"l": 263.3996, "t": 575.62573, "r": 496.94464, "b": 584.8387299999999, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "publications. He also worked for IBM Colombia as an IBM ", "bbox": {"l": 263.3996, "t": 587.62553, "r": 520.38562, "b": 596.83853, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "AS/400fi IT Specialist doing presales support for the Andean ", "bbox": {"l": 263.3996, "t": 599.62534, "r": 535.99078, "b": 608.83833, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "countries. He has 28 years of experience in the computing field ", "bbox": {"l": 263.3996, "t": 611.62514, "r": 541.27374, "b": 620.83813, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "and has taught database classes in Colombian universities. He ", "bbox": {"l": 263.3996, "t": 623.62494, "r": 541.26465, "b": 632.83794, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "holds a Master\u2019s degree in Computer Science from EAFIT, ", "bbox": {"l": 263.3996, "t": 635.62474, "r": 523.22211, "b": 644.8377399999999, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "Colombia. His areas of expertise are database technology, ", "bbox": {"l": 263.3996, "t": 647.62454, "r": 524.77386, "b": 656.83754, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "performance, and data warehousing. Hernando can be ", "bbox": {"l": 263.3996, "t": 659.62434, "r": 508.27124, "b": 668.83735, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "contacted at ", "bbox": {"l": 263.3996, "t": 671.62415, "r": 320.63568, "b": 680.83716, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "hbedoya@us.ibm.com", "bbox": {"l": 320.63971, "t": 671.77356, "r": 410.57852, "b": 680.54832, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": ".", "bbox": {"l": 410.5795, "t": 671.62415, "r": 413.34839, "b": 680.83716, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Hernando Bedoya is a Senior IT Specialist at STG Lab Services and Training in Rochester, Minnesota. He writes extensively and teaches IBM classes worldwide in all areas of DB2 for i. Before joining STG Lab Services, he worked in the ITSO for nine years writing multiple IBM Redbooksfi publications. He also worked for IBM Colombia as an IBM AS/400fi IT Specialist doing presales support for the Andean countries. He has 28 years of experience in the computing field and has taught database classes in Colombian universities. He holds a Master's degree in Computer Science from EAFIT, Colombia. His areas of expertise are database technology, performance, and data warehousing. Hernando can be contacted at hbedoya@us.ibm.com ."}, {"label": "picture", "id": 3, "page_no": 3, "cluster": {"id": 3, "label": "picture", "bbox": {"l": 142.52883911132812, "t": 375.0449523925781, "r": 251.47850036621094, "b": 503.20648193359375, "coord_origin": "TOPLEFT"}, "confidence": 0.9862572550773621, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "picture", "id": 1, "page_no": 3, "cluster": {"id": 1, "label": "picture", "bbox": {"l": 145.4144744873047, "t": 527.2447509765625, "r": 252.08840942382812, "b": 635.383056640625, "coord_origin": "TOPLEFT"}, "confidence": 0.9871657490730286, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "headers": [{"label": "page_footer", "id": 7, "page_no": 3, "cluster": {"id": 7, "label": "page_footer", "bbox": {"l": 64.800003, "t": 755.538002, "r": 257.24335, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9469243884086609, "cells": [{"id": 0, "text": "' Copyright IBM Corp. 2014. All rights reserved.", "bbox": {"l": 64.800003, "t": 755.538002, "r": 257.24335, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "' Copyright IBM Corp. 2014. All rights reserved."}, {"label": "page_footer", "id": 10, "page_no": 3, "cluster": {"id": 10, "label": "page_footer", "bbox": {"l": 538.85999, "t": 754.848721, "r": 547.25031, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.904093861579895, "cells": [{"id": 1, "text": "xi", "bbox": {"l": 538.85999, "t": 754.848721, "r": 547.25031, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "xi"}]}}, {"page_no": 4, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "' Copyright IBM Corp. 2014. All rights reserved.", "bbox": {"l": 64.800003, "t": 755.538002, "r": 257.24335, "b": 763.863001, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "1", "bbox": {"l": 541.67987, "t": 754.848721, "r": 547.21765, "b": 764.06172, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Chapter 1.", "bbox": {"l": 81.0, "t": 268.54272000000003, "r": 115.13253, "b": 274.98071000000004, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Securing and protecting IBM DB2 ", "bbox": {"l": 136.8, "t": 254.88635, "r": 547.30475, "b": 278.91785000000004, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "data", "bbox": {"l": 136.8, "t": 285.84671, "r": 190.29802, "b": 309.8782, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "Recent news headlines are filled with reports of data breaches and cyber-attacks impacting ", "bbox": {"l": 136.8, "t": 348.70871, "r": 542.25665, "b": 357.92169, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "global businesses of all sizes. The Identity Theft Resource Center$^{1}$ reports that almost 5000 ", "bbox": {"l": 136.80096, "t": 360.70853, "r": 544.96643, "b": 369.92150999999996, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "data breaches have occurred since 2005, exposing over 600 million records of data. The ", "bbox": {"l": 136.79965, "t": 372.70853, "r": 529.53839, "b": 381.92150999999996, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "financial cost of these data breaches is skyrocketing. Studies from the Ponemon Institute$^{2}$ ", "bbox": {"l": 136.79965, "t": 384.7083400000001, "r": 535.32874, "b": 393.92133000000007, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "revealed that the average cost of a data breach increased in 2013 by 15% globally and ", "bbox": {"l": 136.80026, "t": 396.70853, "r": 521.64374, "b": 405.92150999999996, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "resulted in a brand equity loss of $9.4 million per attack. The average cost that is incurred for ", "bbox": {"l": 136.80026, "t": 408.7083400000001, "r": 547.13135, "b": 417.92133000000007, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "each lost record containing sensitive information increased more than 9% to $145 per record. ", "bbox": {"l": 136.80023, "t": 420.70816, "r": 547.25403, "b": 429.92114, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Businesses must make a serious effort to secure their data and recognize that securing ", "bbox": {"l": 136.80023, "t": 442.7277199999999, "r": 525.06482, "b": 451.9407, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "information assets is a cost of doing business. In many parts of the world and in many ", "bbox": {"l": 136.80025, "t": 454.72754000000003, "r": 518.26825, "b": 463.94052, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "industries, securing the data is required by law and subject to audits. Data security is no ", "bbox": {"l": 136.80025, "t": 466.72736, "r": 527.2063, "b": 475.94034, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "longer an option; it is a requirement.", "bbox": {"l": 136.80025, "t": 478.72717, "r": 296.31067, "b": 487.94016, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "This chapter describes how you can secure and protect data in DB2 for i. The following topics ", "bbox": {"l": 136.80025, "t": 500.68698, "r": 547.15515, "b": 509.89996, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "are covered in this chapter:", "bbox": {"l": 136.80025, "t": 512.6868, "r": 257.28036, "b": 521.89978, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "GLYPH<SM590000>", "bbox": {"l": 136.80025, "t": 529.87576, "r": 141.78024, "b": 538.6505099999999, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Security fundamentals", "bbox": {"l": 151.20041, "t": 529.72635, "r": 250.23166999999998, "b": 538.93936, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "GLYPH<SM590000>", "bbox": {"l": 136.80025, "t": 541.87556, "r": 141.78024, "b": 550.65031, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Current state of IBM i security", "bbox": {"l": 151.20041, "t": 541.72617, "r": 282.98114, "b": 550.93916, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "GLYPH<SM590000>", "bbox": {"l": 136.80025, "t": 553.87537, "r": 141.78024, "b": 562.65012, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "DB2 for i security controls", "bbox": {"l": 151.20041, "t": 553.72597, "r": 264.88187, "b": 562.93896, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "1", "bbox": {"l": 500.39999, "t": 93.16870000000006, "r": 522.61774, "b": 130.13171, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "$^{1 }$http://www.idtheftcenter.org", "bbox": {"l": 136.8, "t": 717.750061, "r": 258.36255, "b": 724.780441, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "$^{2 }$http://www.ponemon.org", "bbox": {"l": 136.8, "t": 727.709961, "r": 231.90257, "b": 734.740341, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "/", "bbox": {"l": 231.84036, "t": 727.590263, "r": 234.05881, "b": 734.97176, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 6, "label": "page_footer", "bbox": {"l": 64.800003, "t": 755.538002, "r": 257.24335, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9364771246910095, "cells": [{"id": 0, "text": "' Copyright IBM Corp. 2014. All rights reserved.", "bbox": {"l": 64.800003, "t": 755.538002, "r": 257.24335, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "page_footer", "bbox": {"l": 541.67987, "t": 754.848721, "r": 547.21765, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.8511815071105957, "cells": [{"id": 1, "text": "1", "bbox": {"l": 541.67987, "t": 754.848721, "r": 547.21765, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 81.0, "t": 268.54272000000003, "r": 115.13253, "b": 274.98071000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 2, "text": "Chapter 1.", "bbox": {"l": 81.0, "t": 268.54272000000003, "r": 115.13253, "b": 274.98071000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "section_header", "bbox": {"l": 136.8, "t": 254.88635, "r": 547.30475, "b": 309.8782, "coord_origin": "TOPLEFT"}, "confidence": 0.9371159076690674, "cells": [{"id": 3, "text": "Securing and protecting IBM DB2 ", "bbox": {"l": 136.8, "t": 254.88635, "r": 547.30475, "b": 278.91785000000004, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "data", "bbox": {"l": 136.8, "t": 285.84671, "r": 190.29802, "b": 309.8782, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 136.79965, "t": 348.70871, "r": 547.25403, "b": 429.92114, "coord_origin": "TOPLEFT"}, "confidence": 0.9868631362915039, "cells": [{"id": 5, "text": "Recent news headlines are filled with reports of data breaches and cyber-attacks impacting ", "bbox": {"l": 136.8, "t": 348.70871, "r": 542.25665, "b": 357.92169, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "global businesses of all sizes. The Identity Theft Resource Center$^{1}$ reports that almost 5000 ", "bbox": {"l": 136.80096, "t": 360.70853, "r": 544.96643, "b": 369.92150999999996, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "data breaches have occurred since 2005, exposing over 600 million records of data. The ", "bbox": {"l": 136.79965, "t": 372.70853, "r": 529.53839, "b": 381.92150999999996, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "financial cost of these data breaches is skyrocketing. Studies from the Ponemon Institute$^{2}$ ", "bbox": {"l": 136.79965, "t": 384.7083400000001, "r": 535.32874, "b": 393.92133000000007, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "revealed that the average cost of a data breach increased in 2013 by 15% globally and ", "bbox": {"l": 136.80026, "t": 396.70853, "r": 521.64374, "b": 405.92150999999996, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "resulted in a brand equity loss of $9.4 million per attack. The average cost that is incurred for ", "bbox": {"l": 136.80026, "t": 408.7083400000001, "r": 547.13135, "b": 417.92133000000007, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "each lost record containing sensitive information increased more than 9% to $145 per record. ", "bbox": {"l": 136.80023, "t": 420.70816, "r": 547.25403, "b": 429.92114, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 136.80023, "t": 442.7277199999999, "r": 527.2063, "b": 487.94016, "coord_origin": "TOPLEFT"}, "confidence": 0.9865838885307312, "cells": [{"id": 12, "text": "Businesses must make a serious effort to secure their data and recognize that securing ", "bbox": {"l": 136.80023, "t": 442.7277199999999, "r": 525.06482, "b": 451.9407, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "information assets is a cost of doing business. In many parts of the world and in many ", "bbox": {"l": 136.80025, "t": 454.72754000000003, "r": 518.26825, "b": 463.94052, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "industries, securing the data is required by law and subject to audits. Data security is no ", "bbox": {"l": 136.80025, "t": 466.72736, "r": 527.2063, "b": 475.94034, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "longer an option; it is a requirement.", "bbox": {"l": 136.80025, "t": 478.72717, "r": 296.31067, "b": 487.94016, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 136.80025, "t": 500.68698, "r": 547.15515, "b": 521.89978, "coord_origin": "TOPLEFT"}, "confidence": 0.9734062552452087, "cells": [{"id": 16, "text": "This chapter describes how you can secure and protect data in DB2 for i. The following topics ", "bbox": {"l": 136.80025, "t": 500.68698, "r": 547.15515, "b": 509.89996, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "are covered in this chapter:", "bbox": {"l": 136.80025, "t": 512.6868, "r": 257.28036, "b": 521.89978, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "list_item", "bbox": {"l": 136.80025, "t": 529.72635, "r": 250.23166999999998, "b": 538.93936, "coord_origin": "TOPLEFT"}, "confidence": 0.9373421669006348, "cells": [{"id": 18, "text": "GLYPH<SM590000>", "bbox": {"l": 136.80025, "t": 529.87576, "r": 141.78024, "b": 538.6505099999999, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Security fundamentals", "bbox": {"l": 151.20041, "t": 529.72635, "r": 250.23166999999998, "b": 538.93936, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "list_item", "bbox": {"l": 136.80025, "t": 541.72617, "r": 282.98114, "b": 550.93916, "coord_origin": "TOPLEFT"}, "confidence": 0.9334256649017334, "cells": [{"id": 20, "text": "GLYPH<SM590000>", "bbox": {"l": 136.80025, "t": 541.87556, "r": 141.78024, "b": 550.65031, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Current state of IBM i security", "bbox": {"l": 151.20041, "t": 541.72617, "r": 282.98114, "b": 550.93916, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "list_item", "bbox": {"l": 136.80025, "t": 553.72597, "r": 264.88187, "b": 562.93896, "coord_origin": "TOPLEFT"}, "confidence": 0.9462205767631531, "cells": [{"id": 22, "text": "GLYPH<SM590000>", "bbox": {"l": 136.80025, "t": 553.87537, "r": 141.78024, "b": 562.65012, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "DB2 for i security controls", "bbox": {"l": 151.20041, "t": 553.72597, "r": 264.88187, "b": 562.93896, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 500.39999, "t": 93.16870000000006, "r": 522.61774, "b": 130.13171, "coord_origin": "TOPLEFT"}, "confidence": 0.7085074782371521, "cells": [{"id": 24, "text": "1", "bbox": {"l": 500.39999, "t": 93.16870000000006, "r": 522.61774, "b": 130.13171, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "footnote", "bbox": {"l": 136.8, "t": 717.750061, "r": 258.36255, "b": 724.780441, "coord_origin": "TOPLEFT"}, "confidence": 0.5138102173805237, "cells": [{"id": 25, "text": "$^{1 }$http://www.idtheftcenter.org", "bbox": {"l": 136.8, "t": 717.750061, "r": 258.36255, "b": 724.780441, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "footnote", "bbox": {"l": 136.8, "t": 727.590263, "r": 234.05881, "b": 734.97176, "coord_origin": "TOPLEFT"}, "confidence": 0.7965563535690308, "cells": [{"id": 26, "text": "$^{2 }$http://www.ponemon.org", "bbox": {"l": 136.8, "t": 727.709961, "r": 231.90257, "b": 734.740341, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "/", "bbox": {"l": 231.84036, "t": 727.590263, "r": 234.05881, "b": 734.97176, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "picture", "bbox": {"l": 32.075252532958984, "t": 70.57737731933594, "r": 239.620361328125, "b": 237.9579315185547, "coord_origin": "TOPLEFT"}, "confidence": 0.7509335279464722, "cells": [], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_footer", "id": 6, "page_no": 4, "cluster": {"id": 6, "label": "page_footer", "bbox": {"l": 64.800003, "t": 755.538002, "r": 257.24335, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9364771246910095, "cells": [{"id": 0, "text": "' Copyright IBM Corp. 2014. All rights reserved.", "bbox": {"l": 64.800003, "t": 755.538002, "r": 257.24335, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "' Copyright IBM Corp. 2014. All rights reserved."}, {"label": "page_footer", "id": 8, "page_no": 4, "cluster": {"id": 8, "label": "page_footer", "bbox": {"l": 541.67987, "t": 754.848721, "r": 547.21765, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.8511815071105957, "cells": [{"id": 1, "text": "1", "bbox": {"l": 541.67987, "t": 754.848721, "r": 547.21765, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1"}, {"label": "text", "id": 14, "page_no": 4, "cluster": {"id": 14, "label": "text", "bbox": {"l": 81.0, "t": 268.54272000000003, "r": 115.13253, "b": 274.98071000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 2, "text": "Chapter 1.", "bbox": {"l": 81.0, "t": 268.54272000000003, "r": 115.13253, "b": 274.98071000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Chapter 1."}, {"label": "section_header", "id": 5, "page_no": 4, "cluster": {"id": 5, "label": "section_header", "bbox": {"l": 136.8, "t": 254.88635, "r": 547.30475, "b": 309.8782, "coord_origin": "TOPLEFT"}, "confidence": 0.9371159076690674, "cells": [{"id": 3, "text": "Securing and protecting IBM DB2 ", "bbox": {"l": 136.8, "t": 254.88635, "r": 547.30475, "b": 278.91785000000004, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "data", "bbox": {"l": 136.8, "t": 285.84671, "r": 190.29802, "b": 309.8782, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Securing and protecting IBM DB2 data"}, {"label": "text", "id": 0, "page_no": 4, "cluster": {"id": 0, "label": "text", "bbox": {"l": 136.79965, "t": 348.70871, "r": 547.25403, "b": 429.92114, "coord_origin": "TOPLEFT"}, "confidence": 0.9868631362915039, "cells": [{"id": 5, "text": "Recent news headlines are filled with reports of data breaches and cyber-attacks impacting ", "bbox": {"l": 136.8, "t": 348.70871, "r": 542.25665, "b": 357.92169, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "global businesses of all sizes. The Identity Theft Resource Center$^{1}$ reports that almost 5000 ", "bbox": {"l": 136.80096, "t": 360.70853, "r": 544.96643, "b": 369.92150999999996, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "data breaches have occurred since 2005, exposing over 600 million records of data. The ", "bbox": {"l": 136.79965, "t": 372.70853, "r": 529.53839, "b": 381.92150999999996, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "financial cost of these data breaches is skyrocketing. Studies from the Ponemon Institute$^{2}$ ", "bbox": {"l": 136.79965, "t": 384.7083400000001, "r": 535.32874, "b": 393.92133000000007, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "revealed that the average cost of a data breach increased in 2013 by 15% globally and ", "bbox": {"l": 136.80026, "t": 396.70853, "r": 521.64374, "b": 405.92150999999996, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "resulted in a brand equity loss of $9.4 million per attack. The average cost that is incurred for ", "bbox": {"l": 136.80026, "t": 408.7083400000001, "r": 547.13135, "b": 417.92133000000007, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "each lost record containing sensitive information increased more than 9% to $145 per record. ", "bbox": {"l": 136.80023, "t": 420.70816, "r": 547.25403, "b": 429.92114, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Recent news headlines are filled with reports of data breaches and cyber-attacks impacting global businesses of all sizes. The Identity Theft Resource Center$^{1}$ reports that almost 5000 data breaches have occurred since 2005, exposing over 600 million records of data. The financial cost of these data breaches is skyrocketing. Studies from the Ponemon Institute$^{2}$ revealed that the average cost of a data breach increased in 2013 by 15% globally and resulted in a brand equity loss of $9.4 million per attack. The average cost that is incurred for each lost record containing sensitive information increased more than 9% to $145 per record."}, {"label": "text", "id": 1, "page_no": 4, "cluster": {"id": 1, "label": "text", "bbox": {"l": 136.80023, "t": 442.7277199999999, "r": 527.2063, "b": 487.94016, "coord_origin": "TOPLEFT"}, "confidence": 0.9865838885307312, "cells": [{"id": 12, "text": "Businesses must make a serious effort to secure their data and recognize that securing ", "bbox": {"l": 136.80023, "t": 442.7277199999999, "r": 525.06482, "b": 451.9407, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "information assets is a cost of doing business. In many parts of the world and in many ", "bbox": {"l": 136.80025, "t": 454.72754000000003, "r": 518.26825, "b": 463.94052, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "industries, securing the data is required by law and subject to audits. Data security is no ", "bbox": {"l": 136.80025, "t": 466.72736, "r": 527.2063, "b": 475.94034, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "longer an option; it is a requirement.", "bbox": {"l": 136.80025, "t": 478.72717, "r": 296.31067, "b": 487.94016, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Businesses must make a serious effort to secure their data and recognize that securing information assets is a cost of doing business. In many parts of the world and in many industries, securing the data is required by law and subject to audits. Data security is no longer an option; it is a requirement."}, {"label": "text", "id": 2, "page_no": 4, "cluster": {"id": 2, "label": "text", "bbox": {"l": 136.80025, "t": 500.68698, "r": 547.15515, "b": 521.89978, "coord_origin": "TOPLEFT"}, "confidence": 0.9734062552452087, "cells": [{"id": 16, "text": "This chapter describes how you can secure and protect data in DB2 for i. The following topics ", "bbox": {"l": 136.80025, "t": 500.68698, "r": 547.15515, "b": 509.89996, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "are covered in this chapter:", "bbox": {"l": 136.80025, "t": 512.6868, "r": 257.28036, "b": 521.89978, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "This chapter describes how you can secure and protect data in DB2 for i. The following topics are covered in this chapter:"}, {"label": "list_item", "id": 4, "page_no": 4, "cluster": {"id": 4, "label": "list_item", "bbox": {"l": 136.80025, "t": 529.72635, "r": 250.23166999999998, "b": 538.93936, "coord_origin": "TOPLEFT"}, "confidence": 0.9373421669006348, "cells": [{"id": 18, "text": "GLYPH<SM590000>", "bbox": {"l": 136.80025, "t": 529.87576, "r": 141.78024, "b": 538.6505099999999, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Security fundamentals", "bbox": {"l": 151.20041, "t": 529.72635, "r": 250.23166999999998, "b": 538.93936, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<SM590000> Security fundamentals"}, {"label": "list_item", "id": 7, "page_no": 4, "cluster": {"id": 7, "label": "list_item", "bbox": {"l": 136.80025, "t": 541.72617, "r": 282.98114, "b": 550.93916, "coord_origin": "TOPLEFT"}, "confidence": 0.9334256649017334, "cells": [{"id": 20, "text": "GLYPH<SM590000>", "bbox": {"l": 136.80025, "t": 541.87556, "r": 141.78024, "b": 550.65031, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Current state of IBM i security", "bbox": {"l": 151.20041, "t": 541.72617, "r": 282.98114, "b": 550.93916, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<SM590000> Current state of IBM i security"}, {"label": "list_item", "id": 3, "page_no": 4, "cluster": {"id": 3, "label": "list_item", "bbox": {"l": 136.80025, "t": 553.72597, "r": 264.88187, "b": 562.93896, "coord_origin": "TOPLEFT"}, "confidence": 0.9462205767631531, "cells": [{"id": 22, "text": "GLYPH<SM590000>", "bbox": {"l": 136.80025, "t": 553.87537, "r": 141.78024, "b": 562.65012, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "DB2 for i security controls", "bbox": {"l": 151.20041, "t": 553.72597, "r": 264.88187, "b": 562.93896, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<SM590000> DB2 for i security controls"}, {"label": "text", "id": 12, "page_no": 4, "cluster": {"id": 12, "label": "text", "bbox": {"l": 500.39999, "t": 93.16870000000006, "r": 522.61774, "b": 130.13171, "coord_origin": "TOPLEFT"}, "confidence": 0.7085074782371521, "cells": [{"id": 24, "text": "1", "bbox": {"l": 500.39999, "t": 93.16870000000006, "r": 522.61774, "b": 130.13171, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1"}, {"label": "footnote", "id": 13, "page_no": 4, "cluster": {"id": 13, "label": "footnote", "bbox": {"l": 136.8, "t": 717.750061, "r": 258.36255, "b": 724.780441, "coord_origin": "TOPLEFT"}, "confidence": 0.5138102173805237, "cells": [{"id": 25, "text": "$^{1 }$http://www.idtheftcenter.org", "bbox": {"l": 136.8, "t": 717.750061, "r": 258.36255, "b": 724.780441, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "$^{1 }$http://www.idtheftcenter.org"}, {"label": "footnote", "id": 9, "page_no": 4, "cluster": {"id": 9, "label": "footnote", "bbox": {"l": 136.8, "t": 727.590263, "r": 234.05881, "b": 734.97176, "coord_origin": "TOPLEFT"}, "confidence": 0.7965563535690308, "cells": [{"id": 26, "text": "$^{2 }$http://www.ponemon.org", "bbox": {"l": 136.8, "t": 727.709961, "r": 231.90257, "b": 734.740341, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "/", "bbox": {"l": 231.84036, "t": 727.590263, "r": 234.05881, "b": 734.97176, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "$^{2 }$http://www.ponemon.org /"}, {"label": "picture", "id": 11, "page_no": 4, "cluster": {"id": 11, "label": "picture", "bbox": {"l": 32.075252532958984, "t": 70.57737731933594, "r": 239.620361328125, "b": 237.9579315185547, "coord_origin": "TOPLEFT"}, "confidence": 0.7509335279464722, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "body": [{"label": "text", "id": 14, "page_no": 4, "cluster": {"id": 14, "label": "text", "bbox": {"l": 81.0, "t": 268.54272000000003, "r": 115.13253, "b": 274.98071000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 2, "text": "Chapter 1.", "bbox": {"l": 81.0, "t": 268.54272000000003, "r": 115.13253, "b": 274.98071000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Chapter 1."}, {"label": "section_header", "id": 5, "page_no": 4, "cluster": {"id": 5, "label": "section_header", "bbox": {"l": 136.8, "t": 254.88635, "r": 547.30475, "b": 309.8782, "coord_origin": "TOPLEFT"}, "confidence": 0.9371159076690674, "cells": [{"id": 3, "text": "Securing and protecting IBM DB2 ", "bbox": {"l": 136.8, "t": 254.88635, "r": 547.30475, "b": 278.91785000000004, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "data", "bbox": {"l": 136.8, "t": 285.84671, "r": 190.29802, "b": 309.8782, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Securing and protecting IBM DB2 data"}, {"label": "text", "id": 0, "page_no": 4, "cluster": {"id": 0, "label": "text", "bbox": {"l": 136.79965, "t": 348.70871, "r": 547.25403, "b": 429.92114, "coord_origin": "TOPLEFT"}, "confidence": 0.9868631362915039, "cells": [{"id": 5, "text": "Recent news headlines are filled with reports of data breaches and cyber-attacks impacting ", "bbox": {"l": 136.8, "t": 348.70871, "r": 542.25665, "b": 357.92169, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "global businesses of all sizes. The Identity Theft Resource Center$^{1}$ reports that almost 5000 ", "bbox": {"l": 136.80096, "t": 360.70853, "r": 544.96643, "b": 369.92150999999996, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "data breaches have occurred since 2005, exposing over 600 million records of data. The ", "bbox": {"l": 136.79965, "t": 372.70853, "r": 529.53839, "b": 381.92150999999996, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "financial cost of these data breaches is skyrocketing. Studies from the Ponemon Institute$^{2}$ ", "bbox": {"l": 136.79965, "t": 384.7083400000001, "r": 535.32874, "b": 393.92133000000007, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "revealed that the average cost of a data breach increased in 2013 by 15% globally and ", "bbox": {"l": 136.80026, "t": 396.70853, "r": 521.64374, "b": 405.92150999999996, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "resulted in a brand equity loss of $9.4 million per attack. The average cost that is incurred for ", "bbox": {"l": 136.80026, "t": 408.7083400000001, "r": 547.13135, "b": 417.92133000000007, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "each lost record containing sensitive information increased more than 9% to $145 per record. ", "bbox": {"l": 136.80023, "t": 420.70816, "r": 547.25403, "b": 429.92114, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Recent news headlines are filled with reports of data breaches and cyber-attacks impacting global businesses of all sizes. The Identity Theft Resource Center$^{1}$ reports that almost 5000 data breaches have occurred since 2005, exposing over 600 million records of data. The financial cost of these data breaches is skyrocketing. Studies from the Ponemon Institute$^{2}$ revealed that the average cost of a data breach increased in 2013 by 15% globally and resulted in a brand equity loss of $9.4 million per attack. The average cost that is incurred for each lost record containing sensitive information increased more than 9% to $145 per record."}, {"label": "text", "id": 1, "page_no": 4, "cluster": {"id": 1, "label": "text", "bbox": {"l": 136.80023, "t": 442.7277199999999, "r": 527.2063, "b": 487.94016, "coord_origin": "TOPLEFT"}, "confidence": 0.9865838885307312, "cells": [{"id": 12, "text": "Businesses must make a serious effort to secure their data and recognize that securing ", "bbox": {"l": 136.80023, "t": 442.7277199999999, "r": 525.06482, "b": 451.9407, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "information assets is a cost of doing business. In many parts of the world and in many ", "bbox": {"l": 136.80025, "t": 454.72754000000003, "r": 518.26825, "b": 463.94052, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "industries, securing the data is required by law and subject to audits. Data security is no ", "bbox": {"l": 136.80025, "t": 466.72736, "r": 527.2063, "b": 475.94034, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "longer an option; it is a requirement.", "bbox": {"l": 136.80025, "t": 478.72717, "r": 296.31067, "b": 487.94016, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Businesses must make a serious effort to secure their data and recognize that securing information assets is a cost of doing business. In many parts of the world and in many industries, securing the data is required by law and subject to audits. Data security is no longer an option; it is a requirement."}, {"label": "text", "id": 2, "page_no": 4, "cluster": {"id": 2, "label": "text", "bbox": {"l": 136.80025, "t": 500.68698, "r": 547.15515, "b": 521.89978, "coord_origin": "TOPLEFT"}, "confidence": 0.9734062552452087, "cells": [{"id": 16, "text": "This chapter describes how you can secure and protect data in DB2 for i. The following topics ", "bbox": {"l": 136.80025, "t": 500.68698, "r": 547.15515, "b": 509.89996, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "are covered in this chapter:", "bbox": {"l": 136.80025, "t": 512.6868, "r": 257.28036, "b": 521.89978, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "This chapter describes how you can secure and protect data in DB2 for i. The following topics are covered in this chapter:"}, {"label": "list_item", "id": 4, "page_no": 4, "cluster": {"id": 4, "label": "list_item", "bbox": {"l": 136.80025, "t": 529.72635, "r": 250.23166999999998, "b": 538.93936, "coord_origin": "TOPLEFT"}, "confidence": 0.9373421669006348, "cells": [{"id": 18, "text": "GLYPH<SM590000>", "bbox": {"l": 136.80025, "t": 529.87576, "r": 141.78024, "b": 538.6505099999999, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "Security fundamentals", "bbox": {"l": 151.20041, "t": 529.72635, "r": 250.23166999999998, "b": 538.93936, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<SM590000> Security fundamentals"}, {"label": "list_item", "id": 7, "page_no": 4, "cluster": {"id": 7, "label": "list_item", "bbox": {"l": 136.80025, "t": 541.72617, "r": 282.98114, "b": 550.93916, "coord_origin": "TOPLEFT"}, "confidence": 0.9334256649017334, "cells": [{"id": 20, "text": "GLYPH<SM590000>", "bbox": {"l": 136.80025, "t": 541.87556, "r": 141.78024, "b": 550.65031, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Current state of IBM i security", "bbox": {"l": 151.20041, "t": 541.72617, "r": 282.98114, "b": 550.93916, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<SM590000> Current state of IBM i security"}, {"label": "list_item", "id": 3, "page_no": 4, "cluster": {"id": 3, "label": "list_item", "bbox": {"l": 136.80025, "t": 553.72597, "r": 264.88187, "b": 562.93896, "coord_origin": "TOPLEFT"}, "confidence": 0.9462205767631531, "cells": [{"id": 22, "text": "GLYPH<SM590000>", "bbox": {"l": 136.80025, "t": 553.87537, "r": 141.78024, "b": 562.65012, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "DB2 for i security controls", "bbox": {"l": 151.20041, "t": 553.72597, "r": 264.88187, "b": 562.93896, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<SM590000> DB2 for i security controls"}, {"label": "text", "id": 12, "page_no": 4, "cluster": {"id": 12, "label": "text", "bbox": {"l": 500.39999, "t": 93.16870000000006, "r": 522.61774, "b": 130.13171, "coord_origin": "TOPLEFT"}, "confidence": 0.7085074782371521, "cells": [{"id": 24, "text": "1", "bbox": {"l": 500.39999, "t": 93.16870000000006, "r": 522.61774, "b": 130.13171, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1"}, {"label": "footnote", "id": 13, "page_no": 4, "cluster": {"id": 13, "label": "footnote", "bbox": {"l": 136.8, "t": 717.750061, "r": 258.36255, "b": 724.780441, "coord_origin": "TOPLEFT"}, "confidence": 0.5138102173805237, "cells": [{"id": 25, "text": "$^{1 }$http://www.idtheftcenter.org", "bbox": {"l": 136.8, "t": 717.750061, "r": 258.36255, "b": 724.780441, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "$^{1 }$http://www.idtheftcenter.org"}, {"label": "footnote", "id": 9, "page_no": 4, "cluster": {"id": 9, "label": "footnote", "bbox": {"l": 136.8, "t": 727.590263, "r": 234.05881, "b": 734.97176, "coord_origin": "TOPLEFT"}, "confidence": 0.7965563535690308, "cells": [{"id": 26, "text": "$^{2 }$http://www.ponemon.org", "bbox": {"l": 136.8, "t": 727.709961, "r": 231.90257, "b": 734.740341, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "/", "bbox": {"l": 231.84036, "t": 727.590263, "r": 234.05881, "b": 734.97176, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "$^{2 }$http://www.ponemon.org /"}, {"label": "picture", "id": 11, "page_no": 4, "cluster": {"id": 11, "label": "picture", "bbox": {"l": 32.075252532958984, "t": 70.57737731933594, "r": 239.620361328125, "b": 237.9579315185547, "coord_origin": "TOPLEFT"}, "confidence": 0.7509335279464722, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "headers": [{"label": "page_footer", "id": 6, "page_no": 4, "cluster": {"id": 6, "label": "page_footer", "bbox": {"l": 64.800003, "t": 755.538002, "r": 257.24335, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9364771246910095, "cells": [{"id": 0, "text": "' Copyright IBM Corp. 2014. All rights reserved.", "bbox": {"l": 64.800003, "t": 755.538002, "r": 257.24335, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "' Copyright IBM Corp. 2014. All rights reserved."}, {"label": "page_footer", "id": 8, "page_no": 4, "cluster": {"id": 8, "label": "page_footer", "bbox": {"l": 541.67987, "t": 754.848721, "r": 547.21765, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.8511815071105957, "cells": [{"id": 1, "text": "1", "bbox": {"l": 541.67987, "t": 754.848721, "r": 547.21765, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1"}]}}, {"page_no": 5, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "2 ", "bbox": {"l": 64.800003, "t": 754.848721, "r": 72.821999, "b": 764.06172, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Row and Column Access Control Support in IBM DB2 for i", "bbox": {"l": 87.840302, "t": 755.538002, "r": 328.72537, "b": 763.863001, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "1.1", "bbox": {"l": 64.800003, "t": 74.34069999999997, "r": 87.524292, "b": 89.1037, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Security fundamentals", "bbox": {"l": 92.069145, "t": 74.34069999999997, "r": 267.40582, "b": 89.1037, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Before reviewing database security techniques, there are two fundamental steps in securing ", "bbox": {"l": 136.8, "t": 106.6087, "r": 545.00482, "b": 115.82172000000003, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "information assets that must be described:", "bbox": {"l": 136.8, "t": 118.60852, "r": 324.47229, "b": 127.82153000000005, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "GLYPH<SM590000>", "bbox": {"l": 136.8, "t": 135.79749000000004, "r": 141.78, "b": 144.57227, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "First, and most important, is the definition of a company\u2019s ", "bbox": {"l": 151.20016, "t": 135.64806999999996, "r": 406.67715, "b": 144.86108000000002, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "security policy", "bbox": {"l": 406.67999, "t": 135.12487999999996, "r": 471.03815, "b": 145.18262000000004, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": ". Without a ", "bbox": {"l": 470.04001000000005, "t": 135.64862000000005, "r": 520.59796, "b": 144.86163, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "security policy, there is no definition of what are acceptable practices for using, accessing, ", "bbox": {"l": 151.19949, "t": 147.64844000000005, "r": 547.16425, "b": 156.86145, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "and storing information by who, what, when, where, and how. A security policy should ", "bbox": {"l": 151.19948, "t": 159.64824999999996, "r": 531.02008, "b": 168.86127, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "minimally address three things: confidentiality, integrity, and availability.", "bbox": {"l": 151.19948, "t": 171.64806999999996, "r": 463.3578499999999, "b": 180.86108000000002, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "The monitoring and assessment of adherence to the security policy determines whether ", "bbox": {"l": 151.19948, "t": 188.62787000000003, "r": 541.70514, "b": 197.84087999999997, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "your security strategy is working. Often, IBM security consultants are asked to perform ", "bbox": {"l": 151.19948, "t": 200.62769000000003, "r": 534.83002, "b": 209.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "security assessments for companies without regard to the security policy. Although these ", "bbox": {"l": 151.19948, "t": 212.62750000000005, "r": 545.79773, "b": 221.84051999999997, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "assessments can be useful for observing how the system is defined and how data is being ", "bbox": {"l": 151.19948, "t": 224.62732000000005, "r": 547.26086, "b": 233.84033, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "accessed, they cannot determine the level of security without a security policy. Without a ", "bbox": {"l": 151.19948, "t": 236.62714000000005, "r": 543.91528, "b": 245.84015, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "security policy, it really is not an assessment as much as it is a baseline for monitoring the ", "bbox": {"l": 151.19948, "t": 248.62694999999997, "r": 547.25989, "b": 257.83997, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "changes in the security settings that are captured.", "bbox": {"l": 151.19946, "t": 260.62676999999996, "r": 371.8692, "b": 269.83978, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "A security policy is what defines whether the system and its settings are secure (or not). ", "bbox": {"l": 151.19946, "t": 277.60657000000003, "r": 541.992, "b": 286.81958, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "GLYPH<SM590000>", "bbox": {"l": 136.7993, "t": 294.7955600000001, "r": 141.7793, "b": 303.57034, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "The second fundamental in securing data assets is the use of ", "bbox": {"l": 151.19946, "t": 294.64618, "r": 425.86029, "b": 303.85916, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "resource security", "bbox": {"l": 425.82001, "t": 294.12496999999996, "r": 501.60065, "b": 304.18265, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": ". If ", "bbox": {"l": 500.64001, "t": 294.64871, "r": 514.49933, "b": 303.86169, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "implemented properly, resource security prevents data breaches from both internal and ", "bbox": {"l": 151.20038, "t": 306.64853, "r": 537.87421, "b": 315.86151, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "external intrusions. Resource security controls are closely tied to the part of the security ", "bbox": {"l": 151.20038, "t": 318.64834999999994, "r": 541.33636, "b": 327.86133, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "policy that defines who should have access to what information resources. A hacker might ", "bbox": {"l": 151.20038, "t": 330.64816, "r": 547.15826, "b": 339.86115, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "be good enough to get through your company firewalls and sift his way through to your ", "bbox": {"l": 151.20038, "t": 342.64798, "r": 534.86066, "b": 351.86096, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "system, but if they do not have explicit access to your database, the hacker cannot ", "bbox": {"l": 151.20038, "t": 354.6478, "r": 517.00739, "b": 363.86078, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "compromise your information assets.", "bbox": {"l": 151.20038, "t": 366.64761, "r": 314.03534, "b": 375.8606, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "With your eyes now open to the importance of securing information assets, the rest of this ", "bbox": {"l": 136.80022, "t": 388.60742, "r": 535.36169, "b": 397.82040000000006, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "chapter reviews the methods that are available for securing database resources on IBM i. ", "bbox": {"l": 136.80022, "t": 400.60724, "r": 532.755, "b": 409.82022, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "1.2", "bbox": {"l": 64.800003, "t": 438.30072, "r": 87.415726, "b": 453.06372, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Current state of IBM i security", "bbox": {"l": 91.93885, "t": 438.30072, "r": 323.38391, "b": 453.06372, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "Because of the inherently secure nature of IBM i, many clients rely on the default system ", "bbox": {"l": 136.8, "t": 470.62872, "r": 530.30463, "b": 479.84171, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "settings to protect their business data that is stored in DB2 for i. In most cases, this means no ", "bbox": {"l": 136.8, "t": 482.62854, "r": 547.31824, "b": 491.84152, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "data protection because the default setting for the Create default public authority (QCRTAUT) ", "bbox": {"l": 136.8, "t": 494.62836, "r": 547.19586, "b": 503.84134, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "system value is *CHANGE.", "bbox": {"l": 136.8, "t": 506.62817, "r": 257.04709, "b": 515.84116, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "Even more disturbing is that many IBM i clients remain in this state, despite the news ", "bbox": {"l": 136.8, "t": 528.64774, "r": 513.90448, "b": 537.86073, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "headlines and the significant costs that are involved with databases being compromised. This ", "bbox": {"l": 136.8, "t": 540.6475399999999, "r": 547.28442, "b": 549.86053, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "default security configuration makes it quite challenging to implement basic security policies. ", "bbox": {"l": 136.8, "t": 552.64734, "r": 546.27533, "b": 561.86034, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "A tighter implementation is required if you really want to protect one of your company\u2019s most ", "bbox": {"l": 136.8, "t": 564.64714, "r": 545.08014, "b": 573.86014, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "valuable assets, which is the data.", "bbox": {"l": 136.8, "t": 576.64694, "r": 287.80057, "b": 585.85994, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "Traditionally, IBM i applications have employed menu-based security to counteract this default ", "bbox": {"l": 136.8, "t": 598.6665, "r": 547.28326, "b": 607.8795, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "configuration that gives all users access to the data. The theory is that data is protected by ", "bbox": {"l": 136.8, "t": 610.6663100000001, "r": 538.6767, "b": 619.8793000000001, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "the menu options controlling what database operations that the user can perform. This ", "bbox": {"l": 136.8, "t": 622.66611, "r": 520.35364, "b": 631.8791, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "approach is ineffective, even if the user profile is restricted from running interactive ", "bbox": {"l": 136.80002, "t": 634.6659099999999, "r": 502.77115000000003, "b": 643.87891, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "commands. The reason is that in today\u2019s connected world there are a multitude of interfaces ", "bbox": {"l": 136.80002, "t": 646.66571, "r": 545.16492, "b": 655.87871, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "into the system, from web browsers to PC clients, that bypass application menus. If there are ", "bbox": {"l": 136.80002, "t": 658.66551, "r": 547.23376, "b": 667.87852, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "no object-level controls, users of these newer interfaces have an open door to your data.", "bbox": {"l": 136.80002, "t": 670.66532, "r": 526.04187, "b": 679.87833, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 10, "label": "page_footer", "bbox": {"l": 64.800003, "t": 754.848721, "r": 72.821999, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.8889444470405579, "cells": [{"id": 0, "text": "2 ", "bbox": {"l": 64.800003, "t": 754.848721, "r": 72.821999, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "page_footer", "bbox": {"l": 87.840302, "t": 755.538002, "r": 328.72537, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9476422667503357, "cells": [{"id": 1, "text": "Row and Column Access Control Support in IBM DB2 for i", "bbox": {"l": 87.840302, "t": 755.538002, "r": 328.72537, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "section_header", "bbox": {"l": 64.800003, "t": 74.34069999999997, "r": 267.40582, "b": 89.1037, "coord_origin": "TOPLEFT"}, "confidence": 0.9651358723640442, "cells": [{"id": 2, "text": "1.1", "bbox": {"l": 64.800003, "t": 74.34069999999997, "r": 87.524292, "b": 89.1037, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Security fundamentals", "bbox": {"l": 92.069145, "t": 74.34069999999997, "r": 267.40582, "b": 89.1037, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "text", "bbox": {"l": 136.8, "t": 106.6087, "r": 545.00482, "b": 127.82153000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9663435220718384, "cells": [{"id": 4, "text": "Before reviewing database security techniques, there are two fundamental steps in securing ", "bbox": {"l": 136.8, "t": 106.6087, "r": 545.00482, "b": 115.82172000000003, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "information assets that must be described:", "bbox": {"l": 136.8, "t": 118.60852, "r": 324.47229, "b": 127.82153000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "list_item", "bbox": {"l": 136.8, "t": 135.12487999999996, "r": 547.16425, "b": 180.86108000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9835494756698608, "cells": [{"id": 6, "text": "GLYPH<SM590000>", "bbox": {"l": 136.8, "t": 135.79749000000004, "r": 141.78, "b": 144.57227, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "First, and most important, is the definition of a company\u2019s ", "bbox": {"l": 151.20016, "t": 135.64806999999996, "r": 406.67715, "b": 144.86108000000002, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "security policy", "bbox": {"l": 406.67999, "t": 135.12487999999996, "r": 471.03815, "b": 145.18262000000004, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": ". Without a ", "bbox": {"l": 470.04001000000005, "t": 135.64862000000005, "r": 520.59796, "b": 144.86163, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "security policy, there is no definition of what are acceptable practices for using, accessing, ", "bbox": {"l": 151.19949, "t": 147.64844000000005, "r": 547.16425, "b": 156.86145, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "and storing information by who, what, when, where, and how. A security policy should ", "bbox": {"l": 151.19948, "t": 159.64824999999996, "r": 531.02008, "b": 168.86127, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "minimally address three things: confidentiality, integrity, and availability.", "bbox": {"l": 151.19948, "t": 171.64806999999996, "r": 463.3578499999999, "b": 180.86108000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "list_item", "bbox": {"l": 151.19946, "t": 188.62787000000003, "r": 547.26086, "b": 269.83978, "coord_origin": "TOPLEFT"}, "confidence": 0.8077318072319031, "cells": [{"id": 13, "text": "The monitoring and assessment of adherence to the security policy determines whether ", "bbox": {"l": 151.19948, "t": 188.62787000000003, "r": 541.70514, "b": 197.84087999999997, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "your security strategy is working. Often, IBM security consultants are asked to perform ", "bbox": {"l": 151.19948, "t": 200.62769000000003, "r": 534.83002, "b": 209.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "security assessments for companies without regard to the security policy. Although these ", "bbox": {"l": 151.19948, "t": 212.62750000000005, "r": 545.79773, "b": 221.84051999999997, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "assessments can be useful for observing how the system is defined and how data is being ", "bbox": {"l": 151.19948, "t": 224.62732000000005, "r": 547.26086, "b": 233.84033, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "accessed, they cannot determine the level of security without a security policy. Without a ", "bbox": {"l": 151.19948, "t": 236.62714000000005, "r": 543.91528, "b": 245.84015, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "security policy, it really is not an assessment as much as it is a baseline for monitoring the ", "bbox": {"l": 151.19948, "t": 248.62694999999997, "r": 547.25989, "b": 257.83997, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "changes in the security settings that are captured.", "bbox": {"l": 151.19946, "t": 260.62676999999996, "r": 371.8692, "b": 269.83978, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 151.19946, "t": 277.60657000000003, "r": 541.992, "b": 286.81958, "coord_origin": "TOPLEFT"}, "confidence": 0.7967224717140198, "cells": [{"id": 20, "text": "A security policy is what defines whether the system and its settings are secure (or not). ", "bbox": {"l": 151.19946, "t": 277.60657000000003, "r": 541.992, "b": 286.81958, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "list_item", "bbox": {"l": 136.7993, "t": 294.12496999999996, "r": 547.15826, "b": 375.8606, "coord_origin": "TOPLEFT"}, "confidence": 0.9837487936019897, "cells": [{"id": 21, "text": "GLYPH<SM590000>", "bbox": {"l": 136.7993, "t": 294.7955600000001, "r": 141.7793, "b": 303.57034, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "The second fundamental in securing data assets is the use of ", "bbox": {"l": 151.19946, "t": 294.64618, "r": 425.86029, "b": 303.85916, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "resource security", "bbox": {"l": 425.82001, "t": 294.12496999999996, "r": 501.60065, "b": 304.18265, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": ". If ", "bbox": {"l": 500.64001, "t": 294.64871, "r": 514.49933, "b": 303.86169, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "implemented properly, resource security prevents data breaches from both internal and ", "bbox": {"l": 151.20038, "t": 306.64853, "r": 537.87421, "b": 315.86151, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "external intrusions. Resource security controls are closely tied to the part of the security ", "bbox": {"l": 151.20038, "t": 318.64834999999994, "r": 541.33636, "b": 327.86133, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "policy that defines who should have access to what information resources. A hacker might ", "bbox": {"l": 151.20038, "t": 330.64816, "r": 547.15826, "b": 339.86115, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "be good enough to get through your company firewalls and sift his way through to your ", "bbox": {"l": 151.20038, "t": 342.64798, "r": 534.86066, "b": 351.86096, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "system, but if they do not have explicit access to your database, the hacker cannot ", "bbox": {"l": 151.20038, "t": 354.6478, "r": 517.00739, "b": 363.86078, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "compromise your information assets.", "bbox": {"l": 151.20038, "t": 366.64761, "r": 314.03534, "b": 375.8606, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "text", "bbox": {"l": 136.80022, "t": 388.60742, "r": 535.36169, "b": 409.82022, "coord_origin": "TOPLEFT"}, "confidence": 0.9621998071670532, "cells": [{"id": 31, "text": "With your eyes now open to the importance of securing information assets, the rest of this ", "bbox": {"l": 136.80022, "t": 388.60742, "r": 535.36169, "b": 397.82040000000006, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "chapter reviews the methods that are available for securing database resources on IBM i. ", "bbox": {"l": 136.80022, "t": 400.60724, "r": 532.755, "b": 409.82022, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "section_header", "bbox": {"l": 64.800003, "t": 438.30072, "r": 323.38391, "b": 453.06372, "coord_origin": "TOPLEFT"}, "confidence": 0.9650285243988037, "cells": [{"id": 33, "text": "1.2", "bbox": {"l": 64.800003, "t": 438.30072, "r": 87.415726, "b": 453.06372, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Current state of IBM i security", "bbox": {"l": 91.93885, "t": 438.30072, "r": 323.38391, "b": 453.06372, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 136.8, "t": 470.62872, "r": 547.31824, "b": 515.84116, "coord_origin": "TOPLEFT"}, "confidence": 0.9848750233650208, "cells": [{"id": 35, "text": "Because of the inherently secure nature of IBM i, many clients rely on the default system ", "bbox": {"l": 136.8, "t": 470.62872, "r": 530.30463, "b": 479.84171, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "settings to protect their business data that is stored in DB2 for i. In most cases, this means no ", "bbox": {"l": 136.8, "t": 482.62854, "r": 547.31824, "b": 491.84152, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "data protection because the default setting for the Create default public authority (QCRTAUT) ", "bbox": {"l": 136.8, "t": 494.62836, "r": 547.19586, "b": 503.84134, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "system value is *CHANGE.", "bbox": {"l": 136.8, "t": 506.62817, "r": 257.04709, "b": 515.84116, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 136.8, "t": 528.64774, "r": 547.28442, "b": 585.85994, "coord_origin": "TOPLEFT"}, "confidence": 0.9848474860191345, "cells": [{"id": 39, "text": "Even more disturbing is that many IBM i clients remain in this state, despite the news ", "bbox": {"l": 136.8, "t": 528.64774, "r": 513.90448, "b": 537.86073, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "headlines and the significant costs that are involved with databases being compromised. This ", "bbox": {"l": 136.8, "t": 540.6475399999999, "r": 547.28442, "b": 549.86053, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "default security configuration makes it quite challenging to implement basic security policies. ", "bbox": {"l": 136.8, "t": 552.64734, "r": 546.27533, "b": 561.86034, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "A tighter implementation is required if you really want to protect one of your company\u2019s most ", "bbox": {"l": 136.8, "t": 564.64714, "r": 545.08014, "b": 573.86014, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "valuable assets, which is the data.", "bbox": {"l": 136.8, "t": 576.64694, "r": 287.80057, "b": 585.85994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 136.8, "t": 598.6665, "r": 547.28326, "b": 679.87833, "coord_origin": "TOPLEFT"}, "confidence": 0.9870820045471191, "cells": [{"id": 44, "text": "Traditionally, IBM i applications have employed menu-based security to counteract this default ", "bbox": {"l": 136.8, "t": 598.6665, "r": 547.28326, "b": 607.8795, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "configuration that gives all users access to the data. The theory is that data is protected by ", "bbox": {"l": 136.8, "t": 610.6663100000001, "r": 538.6767, "b": 619.8793000000001, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "the menu options controlling what database operations that the user can perform. This ", "bbox": {"l": 136.8, "t": 622.66611, "r": 520.35364, "b": 631.8791, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "approach is ineffective, even if the user profile is restricted from running interactive ", "bbox": {"l": 136.80002, "t": 634.6659099999999, "r": 502.77115000000003, "b": 643.87891, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "commands. The reason is that in today\u2019s connected world there are a multitude of interfaces ", "bbox": {"l": 136.80002, "t": 646.66571, "r": 545.16492, "b": 655.87871, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "into the system, from web browsers to PC clients, that bypass application menus. If there are ", "bbox": {"l": 136.80002, "t": 658.66551, "r": 547.23376, "b": 667.87852, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "no object-level controls, users of these newer interfaces have an open door to your data.", "bbox": {"l": 136.80002, "t": 670.66532, "r": 526.04187, "b": 679.87833, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_footer", "id": 10, "page_no": 5, "cluster": {"id": 10, "label": "page_footer", "bbox": {"l": 64.800003, "t": 754.848721, "r": 72.821999, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.8889444470405579, "cells": [{"id": 0, "text": "2 ", "bbox": {"l": 64.800003, "t": 754.848721, "r": 72.821999, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2"}, {"label": "page_footer", "id": 9, "page_no": 5, "cluster": {"id": 9, "label": "page_footer", "bbox": {"l": 87.840302, "t": 755.538002, "r": 328.72537, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9476422667503357, "cells": [{"id": 1, "text": "Row and Column Access Control Support in IBM DB2 for i", "bbox": {"l": 87.840302, "t": 755.538002, "r": 328.72537, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Row and Column Access Control Support in IBM DB2 for i"}, {"label": "section_header", "id": 6, "page_no": 5, "cluster": {"id": 6, "label": "section_header", "bbox": {"l": 64.800003, "t": 74.34069999999997, "r": 267.40582, "b": 89.1037, "coord_origin": "TOPLEFT"}, "confidence": 0.9651358723640442, "cells": [{"id": 2, "text": "1.1", "bbox": {"l": 64.800003, "t": 74.34069999999997, "r": 87.524292, "b": 89.1037, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Security fundamentals", "bbox": {"l": 92.069145, "t": 74.34069999999997, "r": 267.40582, "b": 89.1037, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1.1 Security fundamentals"}, {"label": "text", "id": 5, "page_no": 5, "cluster": {"id": 5, "label": "text", "bbox": {"l": 136.8, "t": 106.6087, "r": 545.00482, "b": 127.82153000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9663435220718384, "cells": [{"id": 4, "text": "Before reviewing database security techniques, there are two fundamental steps in securing ", "bbox": {"l": 136.8, "t": 106.6087, "r": 545.00482, "b": 115.82172000000003, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "information assets that must be described:", "bbox": {"l": 136.8, "t": 118.60852, "r": 324.47229, "b": 127.82153000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Before reviewing database security techniques, there are two fundamental steps in securing information assets that must be described:"}, {"label": "list_item", "id": 4, "page_no": 5, "cluster": {"id": 4, "label": "list_item", "bbox": {"l": 136.8, "t": 135.12487999999996, "r": 547.16425, "b": 180.86108000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9835494756698608, "cells": [{"id": 6, "text": "GLYPH<SM590000>", "bbox": {"l": 136.8, "t": 135.79749000000004, "r": 141.78, "b": 144.57227, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "First, and most important, is the definition of a company\u2019s ", "bbox": {"l": 151.20016, "t": 135.64806999999996, "r": 406.67715, "b": 144.86108000000002, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "security policy", "bbox": {"l": 406.67999, "t": 135.12487999999996, "r": 471.03815, "b": 145.18262000000004, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": ". Without a ", "bbox": {"l": 470.04001000000005, "t": 135.64862000000005, "r": 520.59796, "b": 144.86163, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "security policy, there is no definition of what are acceptable practices for using, accessing, ", "bbox": {"l": 151.19949, "t": 147.64844000000005, "r": 547.16425, "b": 156.86145, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "and storing information by who, what, when, where, and how. A security policy should ", "bbox": {"l": 151.19948, "t": 159.64824999999996, "r": 531.02008, "b": 168.86127, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "minimally address three things: confidentiality, integrity, and availability.", "bbox": {"l": 151.19948, "t": 171.64806999999996, "r": 463.3578499999999, "b": 180.86108000000002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<SM590000> First, and most important, is the definition of a company's security policy . Without a security policy, there is no definition of what are acceptable practices for using, accessing, and storing information by who, what, when, where, and how. A security policy should minimally address three things: confidentiality, integrity, and availability."}, {"label": "list_item", "id": 11, "page_no": 5, "cluster": {"id": 11, "label": "list_item", "bbox": {"l": 151.19946, "t": 188.62787000000003, "r": 547.26086, "b": 269.83978, "coord_origin": "TOPLEFT"}, "confidence": 0.8077318072319031, "cells": [{"id": 13, "text": "The monitoring and assessment of adherence to the security policy determines whether ", "bbox": {"l": 151.19948, "t": 188.62787000000003, "r": 541.70514, "b": 197.84087999999997, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "your security strategy is working. Often, IBM security consultants are asked to perform ", "bbox": {"l": 151.19948, "t": 200.62769000000003, "r": 534.83002, "b": 209.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "security assessments for companies without regard to the security policy. Although these ", "bbox": {"l": 151.19948, "t": 212.62750000000005, "r": 545.79773, "b": 221.84051999999997, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "assessments can be useful for observing how the system is defined and how data is being ", "bbox": {"l": 151.19948, "t": 224.62732000000005, "r": 547.26086, "b": 233.84033, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "accessed, they cannot determine the level of security without a security policy. Without a ", "bbox": {"l": 151.19948, "t": 236.62714000000005, "r": 543.91528, "b": 245.84015, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "security policy, it really is not an assessment as much as it is a baseline for monitoring the ", "bbox": {"l": 151.19948, "t": 248.62694999999997, "r": 547.25989, "b": 257.83997, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "changes in the security settings that are captured.", "bbox": {"l": 151.19946, "t": 260.62676999999996, "r": 371.8692, "b": 269.83978, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The monitoring and assessment of adherence to the security policy determines whether your security strategy is working. Often, IBM security consultants are asked to perform security assessments for companies without regard to the security policy. Although these assessments can be useful for observing how the system is defined and how data is being accessed, they cannot determine the level of security without a security policy. Without a security policy, it really is not an assessment as much as it is a baseline for monitoring the changes in the security settings that are captured."}, {"label": "text", "id": 12, "page_no": 5, "cluster": {"id": 12, "label": "text", "bbox": {"l": 151.19946, "t": 277.60657000000003, "r": 541.992, "b": 286.81958, "coord_origin": "TOPLEFT"}, "confidence": 0.7967224717140198, "cells": [{"id": 20, "text": "A security policy is what defines whether the system and its settings are secure (or not). ", "bbox": {"l": 151.19946, "t": 277.60657000000003, "r": 541.992, "b": 286.81958, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "A security policy is what defines whether the system and its settings are secure (or not)."}, {"label": "list_item", "id": 3, "page_no": 5, "cluster": {"id": 3, "label": "list_item", "bbox": {"l": 136.7993, "t": 294.12496999999996, "r": 547.15826, "b": 375.8606, "coord_origin": "TOPLEFT"}, "confidence": 0.9837487936019897, "cells": [{"id": 21, "text": "GLYPH<SM590000>", "bbox": {"l": 136.7993, "t": 294.7955600000001, "r": 141.7793, "b": 303.57034, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "The second fundamental in securing data assets is the use of ", "bbox": {"l": 151.19946, "t": 294.64618, "r": 425.86029, "b": 303.85916, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "resource security", "bbox": {"l": 425.82001, "t": 294.12496999999996, "r": 501.60065, "b": 304.18265, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": ". If ", "bbox": {"l": 500.64001, "t": 294.64871, "r": 514.49933, "b": 303.86169, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "implemented properly, resource security prevents data breaches from both internal and ", "bbox": {"l": 151.20038, "t": 306.64853, "r": 537.87421, "b": 315.86151, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "external intrusions. Resource security controls are closely tied to the part of the security ", "bbox": {"l": 151.20038, "t": 318.64834999999994, "r": 541.33636, "b": 327.86133, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "policy that defines who should have access to what information resources. A hacker might ", "bbox": {"l": 151.20038, "t": 330.64816, "r": 547.15826, "b": 339.86115, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "be good enough to get through your company firewalls and sift his way through to your ", "bbox": {"l": 151.20038, "t": 342.64798, "r": 534.86066, "b": 351.86096, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "system, but if they do not have explicit access to your database, the hacker cannot ", "bbox": {"l": 151.20038, "t": 354.6478, "r": 517.00739, "b": 363.86078, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "compromise your information assets.", "bbox": {"l": 151.20038, "t": 366.64761, "r": 314.03534, "b": 375.8606, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<SM590000> The second fundamental in securing data assets is the use of resource security . If implemented properly, resource security prevents data breaches from both internal and external intrusions. Resource security controls are closely tied to the part of the security policy that defines who should have access to what information resources. A hacker might be good enough to get through your company firewalls and sift his way through to your system, but if they do not have explicit access to your database, the hacker cannot compromise your information assets."}, {"label": "text", "id": 8, "page_no": 5, "cluster": {"id": 8, "label": "text", "bbox": {"l": 136.80022, "t": 388.60742, "r": 535.36169, "b": 409.82022, "coord_origin": "TOPLEFT"}, "confidence": 0.9621998071670532, "cells": [{"id": 31, "text": "With your eyes now open to the importance of securing information assets, the rest of this ", "bbox": {"l": 136.80022, "t": 388.60742, "r": 535.36169, "b": 397.82040000000006, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "chapter reviews the methods that are available for securing database resources on IBM i. ", "bbox": {"l": 136.80022, "t": 400.60724, "r": 532.755, "b": 409.82022, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "With your eyes now open to the importance of securing information assets, the rest of this chapter reviews the methods that are available for securing database resources on IBM i."}, {"label": "section_header", "id": 7, "page_no": 5, "cluster": {"id": 7, "label": "section_header", "bbox": {"l": 64.800003, "t": 438.30072, "r": 323.38391, "b": 453.06372, "coord_origin": "TOPLEFT"}, "confidence": 0.9650285243988037, "cells": [{"id": 33, "text": "1.2", "bbox": {"l": 64.800003, "t": 438.30072, "r": 87.415726, "b": 453.06372, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Current state of IBM i security", "bbox": {"l": 91.93885, "t": 438.30072, "r": 323.38391, "b": 453.06372, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1.2 Current state of IBM i security"}, {"label": "text", "id": 1, "page_no": 5, "cluster": {"id": 1, "label": "text", "bbox": {"l": 136.8, "t": 470.62872, "r": 547.31824, "b": 515.84116, "coord_origin": "TOPLEFT"}, "confidence": 0.9848750233650208, "cells": [{"id": 35, "text": "Because of the inherently secure nature of IBM i, many clients rely on the default system ", "bbox": {"l": 136.8, "t": 470.62872, "r": 530.30463, "b": 479.84171, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "settings to protect their business data that is stored in DB2 for i. In most cases, this means no ", "bbox": {"l": 136.8, "t": 482.62854, "r": 547.31824, "b": 491.84152, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "data protection because the default setting for the Create default public authority (QCRTAUT) ", "bbox": {"l": 136.8, "t": 494.62836, "r": 547.19586, "b": 503.84134, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "system value is *CHANGE.", "bbox": {"l": 136.8, "t": 506.62817, "r": 257.04709, "b": 515.84116, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Because of the inherently secure nature of IBM i, many clients rely on the default system settings to protect their business data that is stored in DB2 for i. In most cases, this means no data protection because the default setting for the Create default public authority (QCRTAUT) system value is *CHANGE."}, {"label": "text", "id": 2, "page_no": 5, "cluster": {"id": 2, "label": "text", "bbox": {"l": 136.8, "t": 528.64774, "r": 547.28442, "b": 585.85994, "coord_origin": "TOPLEFT"}, "confidence": 0.9848474860191345, "cells": [{"id": 39, "text": "Even more disturbing is that many IBM i clients remain in this state, despite the news ", "bbox": {"l": 136.8, "t": 528.64774, "r": 513.90448, "b": 537.86073, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "headlines and the significant costs that are involved with databases being compromised. This ", "bbox": {"l": 136.8, "t": 540.6475399999999, "r": 547.28442, "b": 549.86053, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "default security configuration makes it quite challenging to implement basic security policies. ", "bbox": {"l": 136.8, "t": 552.64734, "r": 546.27533, "b": 561.86034, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "A tighter implementation is required if you really want to protect one of your company\u2019s most ", "bbox": {"l": 136.8, "t": 564.64714, "r": 545.08014, "b": 573.86014, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "valuable assets, which is the data.", "bbox": {"l": 136.8, "t": 576.64694, "r": 287.80057, "b": 585.85994, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Even more disturbing is that many IBM i clients remain in this state, despite the news headlines and the significant costs that are involved with databases being compromised. This default security configuration makes it quite challenging to implement basic security policies. A tighter implementation is required if you really want to protect one of your company's most valuable assets, which is the data."}, {"label": "text", "id": 0, "page_no": 5, "cluster": {"id": 0, "label": "text", "bbox": {"l": 136.8, "t": 598.6665, "r": 547.28326, "b": 679.87833, "coord_origin": "TOPLEFT"}, "confidence": 0.9870820045471191, "cells": [{"id": 44, "text": "Traditionally, IBM i applications have employed menu-based security to counteract this default ", "bbox": {"l": 136.8, "t": 598.6665, "r": 547.28326, "b": 607.8795, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "configuration that gives all users access to the data. The theory is that data is protected by ", "bbox": {"l": 136.8, "t": 610.6663100000001, "r": 538.6767, "b": 619.8793000000001, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "the menu options controlling what database operations that the user can perform. This ", "bbox": {"l": 136.8, "t": 622.66611, "r": 520.35364, "b": 631.8791, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "approach is ineffective, even if the user profile is restricted from running interactive ", "bbox": {"l": 136.80002, "t": 634.6659099999999, "r": 502.77115000000003, "b": 643.87891, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "commands. The reason is that in today\u2019s connected world there are a multitude of interfaces ", "bbox": {"l": 136.80002, "t": 646.66571, "r": 545.16492, "b": 655.87871, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "into the system, from web browsers to PC clients, that bypass application menus. If there are ", "bbox": {"l": 136.80002, "t": 658.66551, "r": 547.23376, "b": 667.87852, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "no object-level controls, users of these newer interfaces have an open door to your data.", "bbox": {"l": 136.80002, "t": 670.66532, "r": 526.04187, "b": 679.87833, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Traditionally, IBM i applications have employed menu-based security to counteract this default configuration that gives all users access to the data. The theory is that data is protected by the menu options controlling what database operations that the user can perform. This approach is ineffective, even if the user profile is restricted from running interactive commands. The reason is that in today's connected world there are a multitude of interfaces into the system, from web browsers to PC clients, that bypass application menus. If there are no object-level controls, users of these newer interfaces have an open door to your data."}], "body": [{"label": "section_header", "id": 6, "page_no": 5, "cluster": {"id": 6, "label": "section_header", "bbox": {"l": 64.800003, "t": 74.34069999999997, "r": 267.40582, "b": 89.1037, "coord_origin": "TOPLEFT"}, "confidence": 0.9651358723640442, "cells": [{"id": 2, "text": "1.1", "bbox": {"l": 64.800003, "t": 74.34069999999997, "r": 87.524292, "b": 89.1037, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Security fundamentals", "bbox": {"l": 92.069145, "t": 74.34069999999997, "r": 267.40582, "b": 89.1037, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1.1 Security fundamentals"}, {"label": "text", "id": 5, "page_no": 5, "cluster": {"id": 5, "label": "text", "bbox": {"l": 136.8, "t": 106.6087, "r": 545.00482, "b": 127.82153000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9663435220718384, "cells": [{"id": 4, "text": "Before reviewing database security techniques, there are two fundamental steps in securing ", "bbox": {"l": 136.8, "t": 106.6087, "r": 545.00482, "b": 115.82172000000003, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "information assets that must be described:", "bbox": {"l": 136.8, "t": 118.60852, "r": 324.47229, "b": 127.82153000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Before reviewing database security techniques, there are two fundamental steps in securing information assets that must be described:"}, {"label": "list_item", "id": 4, "page_no": 5, "cluster": {"id": 4, "label": "list_item", "bbox": {"l": 136.8, "t": 135.12487999999996, "r": 547.16425, "b": 180.86108000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9835494756698608, "cells": [{"id": 6, "text": "GLYPH<SM590000>", "bbox": {"l": 136.8, "t": 135.79749000000004, "r": 141.78, "b": 144.57227, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "First, and most important, is the definition of a company\u2019s ", "bbox": {"l": 151.20016, "t": 135.64806999999996, "r": 406.67715, "b": 144.86108000000002, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "security policy", "bbox": {"l": 406.67999, "t": 135.12487999999996, "r": 471.03815, "b": 145.18262000000004, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": ". Without a ", "bbox": {"l": 470.04001000000005, "t": 135.64862000000005, "r": 520.59796, "b": 144.86163, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "security policy, there is no definition of what are acceptable practices for using, accessing, ", "bbox": {"l": 151.19949, "t": 147.64844000000005, "r": 547.16425, "b": 156.86145, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "and storing information by who, what, when, where, and how. A security policy should ", "bbox": {"l": 151.19948, "t": 159.64824999999996, "r": 531.02008, "b": 168.86127, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "minimally address three things: confidentiality, integrity, and availability.", "bbox": {"l": 151.19948, "t": 171.64806999999996, "r": 463.3578499999999, "b": 180.86108000000002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<SM590000> First, and most important, is the definition of a company's security policy . Without a security policy, there is no definition of what are acceptable practices for using, accessing, and storing information by who, what, when, where, and how. A security policy should minimally address three things: confidentiality, integrity, and availability."}, {"label": "list_item", "id": 11, "page_no": 5, "cluster": {"id": 11, "label": "list_item", "bbox": {"l": 151.19946, "t": 188.62787000000003, "r": 547.26086, "b": 269.83978, "coord_origin": "TOPLEFT"}, "confidence": 0.8077318072319031, "cells": [{"id": 13, "text": "The monitoring and assessment of adherence to the security policy determines whether ", "bbox": {"l": 151.19948, "t": 188.62787000000003, "r": 541.70514, "b": 197.84087999999997, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "your security strategy is working. Often, IBM security consultants are asked to perform ", "bbox": {"l": 151.19948, "t": 200.62769000000003, "r": 534.83002, "b": 209.84069999999997, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "security assessments for companies without regard to the security policy. Although these ", "bbox": {"l": 151.19948, "t": 212.62750000000005, "r": 545.79773, "b": 221.84051999999997, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "assessments can be useful for observing how the system is defined and how data is being ", "bbox": {"l": 151.19948, "t": 224.62732000000005, "r": 547.26086, "b": 233.84033, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "accessed, they cannot determine the level of security without a security policy. Without a ", "bbox": {"l": 151.19948, "t": 236.62714000000005, "r": 543.91528, "b": 245.84015, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "security policy, it really is not an assessment as much as it is a baseline for monitoring the ", "bbox": {"l": 151.19948, "t": 248.62694999999997, "r": 547.25989, "b": 257.83997, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "changes in the security settings that are captured.", "bbox": {"l": 151.19946, "t": 260.62676999999996, "r": 371.8692, "b": 269.83978, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The monitoring and assessment of adherence to the security policy determines whether your security strategy is working. Often, IBM security consultants are asked to perform security assessments for companies without regard to the security policy. Although these assessments can be useful for observing how the system is defined and how data is being accessed, they cannot determine the level of security without a security policy. Without a security policy, it really is not an assessment as much as it is a baseline for monitoring the changes in the security settings that are captured."}, {"label": "text", "id": 12, "page_no": 5, "cluster": {"id": 12, "label": "text", "bbox": {"l": 151.19946, "t": 277.60657000000003, "r": 541.992, "b": 286.81958, "coord_origin": "TOPLEFT"}, "confidence": 0.7967224717140198, "cells": [{"id": 20, "text": "A security policy is what defines whether the system and its settings are secure (or not). ", "bbox": {"l": 151.19946, "t": 277.60657000000003, "r": 541.992, "b": 286.81958, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "A security policy is what defines whether the system and its settings are secure (or not)."}, {"label": "list_item", "id": 3, "page_no": 5, "cluster": {"id": 3, "label": "list_item", "bbox": {"l": 136.7993, "t": 294.12496999999996, "r": 547.15826, "b": 375.8606, "coord_origin": "TOPLEFT"}, "confidence": 0.9837487936019897, "cells": [{"id": 21, "text": "GLYPH<SM590000>", "bbox": {"l": 136.7993, "t": 294.7955600000001, "r": 141.7793, "b": 303.57034, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "The second fundamental in securing data assets is the use of ", "bbox": {"l": 151.19946, "t": 294.64618, "r": 425.86029, "b": 303.85916, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "resource security", "bbox": {"l": 425.82001, "t": 294.12496999999996, "r": 501.60065, "b": 304.18265, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": ". If ", "bbox": {"l": 500.64001, "t": 294.64871, "r": 514.49933, "b": 303.86169, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "implemented properly, resource security prevents data breaches from both internal and ", "bbox": {"l": 151.20038, "t": 306.64853, "r": 537.87421, "b": 315.86151, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "external intrusions. Resource security controls are closely tied to the part of the security ", "bbox": {"l": 151.20038, "t": 318.64834999999994, "r": 541.33636, "b": 327.86133, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "policy that defines who should have access to what information resources. A hacker might ", "bbox": {"l": 151.20038, "t": 330.64816, "r": 547.15826, "b": 339.86115, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "be good enough to get through your company firewalls and sift his way through to your ", "bbox": {"l": 151.20038, "t": 342.64798, "r": 534.86066, "b": 351.86096, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "system, but if they do not have explicit access to your database, the hacker cannot ", "bbox": {"l": 151.20038, "t": 354.6478, "r": 517.00739, "b": 363.86078, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "compromise your information assets.", "bbox": {"l": 151.20038, "t": 366.64761, "r": 314.03534, "b": 375.8606, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<SM590000> The second fundamental in securing data assets is the use of resource security . If implemented properly, resource security prevents data breaches from both internal and external intrusions. Resource security controls are closely tied to the part of the security policy that defines who should have access to what information resources. A hacker might be good enough to get through your company firewalls and sift his way through to your system, but if they do not have explicit access to your database, the hacker cannot compromise your information assets."}, {"label": "text", "id": 8, "page_no": 5, "cluster": {"id": 8, "label": "text", "bbox": {"l": 136.80022, "t": 388.60742, "r": 535.36169, "b": 409.82022, "coord_origin": "TOPLEFT"}, "confidence": 0.9621998071670532, "cells": [{"id": 31, "text": "With your eyes now open to the importance of securing information assets, the rest of this ", "bbox": {"l": 136.80022, "t": 388.60742, "r": 535.36169, "b": 397.82040000000006, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "chapter reviews the methods that are available for securing database resources on IBM i. ", "bbox": {"l": 136.80022, "t": 400.60724, "r": 532.755, "b": 409.82022, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "With your eyes now open to the importance of securing information assets, the rest of this chapter reviews the methods that are available for securing database resources on IBM i."}, {"label": "section_header", "id": 7, "page_no": 5, "cluster": {"id": 7, "label": "section_header", "bbox": {"l": 64.800003, "t": 438.30072, "r": 323.38391, "b": 453.06372, "coord_origin": "TOPLEFT"}, "confidence": 0.9650285243988037, "cells": [{"id": 33, "text": "1.2", "bbox": {"l": 64.800003, "t": 438.30072, "r": 87.415726, "b": 453.06372, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Current state of IBM i security", "bbox": {"l": 91.93885, "t": 438.30072, "r": 323.38391, "b": 453.06372, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1.2 Current state of IBM i security"}, {"label": "text", "id": 1, "page_no": 5, "cluster": {"id": 1, "label": "text", "bbox": {"l": 136.8, "t": 470.62872, "r": 547.31824, "b": 515.84116, "coord_origin": "TOPLEFT"}, "confidence": 0.9848750233650208, "cells": [{"id": 35, "text": "Because of the inherently secure nature of IBM i, many clients rely on the default system ", "bbox": {"l": 136.8, "t": 470.62872, "r": 530.30463, "b": 479.84171, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "settings to protect their business data that is stored in DB2 for i. In most cases, this means no ", "bbox": {"l": 136.8, "t": 482.62854, "r": 547.31824, "b": 491.84152, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "data protection because the default setting for the Create default public authority (QCRTAUT) ", "bbox": {"l": 136.8, "t": 494.62836, "r": 547.19586, "b": 503.84134, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "system value is *CHANGE.", "bbox": {"l": 136.8, "t": 506.62817, "r": 257.04709, "b": 515.84116, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Because of the inherently secure nature of IBM i, many clients rely on the default system settings to protect their business data that is stored in DB2 for i. In most cases, this means no data protection because the default setting for the Create default public authority (QCRTAUT) system value is *CHANGE."}, {"label": "text", "id": 2, "page_no": 5, "cluster": {"id": 2, "label": "text", "bbox": {"l": 136.8, "t": 528.64774, "r": 547.28442, "b": 585.85994, "coord_origin": "TOPLEFT"}, "confidence": 0.9848474860191345, "cells": [{"id": 39, "text": "Even more disturbing is that many IBM i clients remain in this state, despite the news ", "bbox": {"l": 136.8, "t": 528.64774, "r": 513.90448, "b": 537.86073, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "headlines and the significant costs that are involved with databases being compromised. This ", "bbox": {"l": 136.8, "t": 540.6475399999999, "r": 547.28442, "b": 549.86053, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "default security configuration makes it quite challenging to implement basic security policies. ", "bbox": {"l": 136.8, "t": 552.64734, "r": 546.27533, "b": 561.86034, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "A tighter implementation is required if you really want to protect one of your company\u2019s most ", "bbox": {"l": 136.8, "t": 564.64714, "r": 545.08014, "b": 573.86014, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "valuable assets, which is the data.", "bbox": {"l": 136.8, "t": 576.64694, "r": 287.80057, "b": 585.85994, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Even more disturbing is that many IBM i clients remain in this state, despite the news headlines and the significant costs that are involved with databases being compromised. This default security configuration makes it quite challenging to implement basic security policies. A tighter implementation is required if you really want to protect one of your company's most valuable assets, which is the data."}, {"label": "text", "id": 0, "page_no": 5, "cluster": {"id": 0, "label": "text", "bbox": {"l": 136.8, "t": 598.6665, "r": 547.28326, "b": 679.87833, "coord_origin": "TOPLEFT"}, "confidence": 0.9870820045471191, "cells": [{"id": 44, "text": "Traditionally, IBM i applications have employed menu-based security to counteract this default ", "bbox": {"l": 136.8, "t": 598.6665, "r": 547.28326, "b": 607.8795, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "configuration that gives all users access to the data. The theory is that data is protected by ", "bbox": {"l": 136.8, "t": 610.6663100000001, "r": 538.6767, "b": 619.8793000000001, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "the menu options controlling what database operations that the user can perform. This ", "bbox": {"l": 136.8, "t": 622.66611, "r": 520.35364, "b": 631.8791, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "approach is ineffective, even if the user profile is restricted from running interactive ", "bbox": {"l": 136.80002, "t": 634.6659099999999, "r": 502.77115000000003, "b": 643.87891, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "commands. The reason is that in today\u2019s connected world there are a multitude of interfaces ", "bbox": {"l": 136.80002, "t": 646.66571, "r": 545.16492, "b": 655.87871, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "into the system, from web browsers to PC clients, that bypass application menus. If there are ", "bbox": {"l": 136.80002, "t": 658.66551, "r": 547.23376, "b": 667.87852, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "no object-level controls, users of these newer interfaces have an open door to your data.", "bbox": {"l": 136.80002, "t": 670.66532, "r": 526.04187, "b": 679.87833, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Traditionally, IBM i applications have employed menu-based security to counteract this default configuration that gives all users access to the data. The theory is that data is protected by the menu options controlling what database operations that the user can perform. This approach is ineffective, even if the user profile is restricted from running interactive commands. The reason is that in today's connected world there are a multitude of interfaces into the system, from web browsers to PC clients, that bypass application menus. If there are no object-level controls, users of these newer interfaces have an open door to your data."}], "headers": [{"label": "page_footer", "id": 10, "page_no": 5, "cluster": {"id": 10, "label": "page_footer", "bbox": {"l": 64.800003, "t": 754.848721, "r": 72.821999, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.8889444470405579, "cells": [{"id": 0, "text": "2 ", "bbox": {"l": 64.800003, "t": 754.848721, "r": 72.821999, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2"}, {"label": "page_footer", "id": 9, "page_no": 5, "cluster": {"id": 9, "label": "page_footer", "bbox": {"l": 87.840302, "t": 755.538002, "r": 328.72537, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9476422667503357, "cells": [{"id": 1, "text": "Row and Column Access Control Support in IBM DB2 for i", "bbox": {"l": 87.840302, "t": 755.538002, "r": 328.72537, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Row and Column Access Control Support in IBM DB2 for i"}]}}, {"page_no": 6, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "4 ", "bbox": {"l": 64.800003, "t": 754.848721, "r": 72.821999, "b": 764.06172, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Row and Column Access Control Support in IBM DB2 for i", "bbox": {"l": 87.840302, "t": 755.538002, "r": 328.72537, "b": 763.863001, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Many businesses are trying to limit data access to a need-to-know basis. This security goal ", "bbox": {"l": 136.8, "t": 71.50867000000005, "r": 541.19006, "b": 80.72167999999999, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "means that users should be given access only to the minimum set of data that is required to ", "bbox": {"l": 136.8, "t": 83.50847999999996, "r": 544.30334, "b": 92.72149999999999, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "perform their job. Often, users with object-level access are given access to row and column ", "bbox": {"l": 136.8, "t": 95.50829999999996, "r": 540.94299, "b": 104.72131000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "values that are beyond what their business task requires because that object-level security ", "bbox": {"l": 136.80002, "t": 107.50811999999996, "r": 538.27454, "b": 116.72113000000002, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "provides an all-or-nothing solution. For example, object-level controls allow a manager to ", "bbox": {"l": 136.80002, "t": 119.50792999999999, "r": 530.23004, "b": 128.72095000000002, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "access data about all employees. Most security policies limit a manager to accessing data ", "bbox": {"l": 136.80002, "t": 131.50775, "r": 536.26263, "b": 140.72076000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "only for the employees that they manage.", "bbox": {"l": 136.80002, "t": 143.50757, "r": 319.04318, "b": 152.72058000000004, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "1.3.1", "bbox": {"l": 64.800003, "t": 173.33471999999995, "r": 94.033653, "b": 185.32275000000004, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Existing row and column control", "bbox": {"l": 97.687859, "t": 173.33471999999995, "r": 301.46902, "b": 185.32275000000004, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Some IBM i clients have tried augmenting the all-or-nothing object-level security with SQL ", "bbox": {"l": 136.8, "t": 199.48870999999997, "r": 534.90112, "b": 208.70172000000002, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "views (or logical files) and application logic, as shown in Figure 1-2. However, ", "bbox": {"l": 136.8, "t": 211.48852999999997, "r": 480.47281000000004, "b": 220.70154000000002, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "application-based logic is easy to bypass with all of the different data access interfaces that ", "bbox": {"l": 136.8, "t": 223.48834, "r": 541.56738, "b": 232.70135000000005, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "are provided by the IBM i operating system, such as Open Database Connectivity (ODBC) ", "bbox": {"l": 136.8, "t": 235.48816, "r": 537.39423, "b": 244.70117000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "and System i Navigator.", "bbox": {"l": 136.79999, "t": 247.48798, "r": 242.24352000000002, "b": 256.70099000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Using SQL views to limit access to a subset of the data in a table also has its own set of ", "bbox": {"l": 136.79999, "t": 269.50757, "r": 526.88428, "b": 278.72058000000004, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "challenges. First, there is the complexity of managing all of the SQL view objects that are ", "bbox": {"l": 136.79999, "t": 281.50742, "r": 531.77087, "b": 290.7203999999999, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "used for securing data access. Second, scaling a view-based security solution can be difficult ", "bbox": {"l": 136.79999, "t": 293.50723000000005, "r": 547.4408, "b": 302.72021, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "as the amount of data grows and the number of users increases.", "bbox": {"l": 136.79999, "t": 305.50705, "r": 421.86725, "b": 314.72003, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Even if you are willing to live with these performance and management issues, a user with ", "bbox": {"l": 136.79999, "t": 327.52661, "r": 536.46692, "b": 336.7395900000001, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "*ALLOBJ access still can directly access all of the data in the underlying DB2 table and easily ", "bbox": {"l": 136.79999, "t": 339.52643, "r": 547.23267, "b": 348.73941, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "bypass the security controls that are built into an SQL view.", "bbox": {"l": 136.79999, "t": 351.52624999999995, "r": 397.88553, "b": 360.73923, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Figure 1-2 Existing row and column controls", "bbox": {"l": 136.8, "t": 691.818, "r": 316.44727, "b": 700.142998, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "User with", "bbox": {"l": 180.95911, "t": 383.45612, "r": 209.08017, "b": 389.0784, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "*ALLOBJ access", "bbox": {"l": 170.00624, "t": 390.95251, "r": 220.10355, "b": 396.57480000000004, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 8, "label": "page_footer", "bbox": {"l": 64.800003, "t": 754.848721, "r": 72.821999, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.8578535318374634, "cells": [{"id": 0, "text": "4 ", "bbox": {"l": 64.800003, "t": 754.848721, "r": 72.821999, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "page_footer", "bbox": {"l": 87.840302, "t": 755.538002, "r": 328.72537, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9491620659828186, "cells": [{"id": 1, "text": "Row and Column Access Control Support in IBM DB2 for i", "bbox": {"l": 87.840302, "t": 755.538002, "r": 328.72537, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 136.8, "t": 71.50867000000005, "r": 544.30334, "b": 152.72058000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9872740507125854, "cells": [{"id": 2, "text": "Many businesses are trying to limit data access to a need-to-know basis. This security goal ", "bbox": {"l": 136.8, "t": 71.50867000000005, "r": 541.19006, "b": 80.72167999999999, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "means that users should be given access only to the minimum set of data that is required to ", "bbox": {"l": 136.8, "t": 83.50847999999996, "r": 544.30334, "b": 92.72149999999999, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "perform their job. Often, users with object-level access are given access to row and column ", "bbox": {"l": 136.8, "t": 95.50829999999996, "r": 540.94299, "b": 104.72131000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "values that are beyond what their business task requires because that object-level security ", "bbox": {"l": 136.80002, "t": 107.50811999999996, "r": 538.27454, "b": 116.72113000000002, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "provides an all-or-nothing solution. For example, object-level controls allow a manager to ", "bbox": {"l": 136.80002, "t": 119.50792999999999, "r": 530.23004, "b": 128.72095000000002, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "access data about all employees. Most security policies limit a manager to accessing data ", "bbox": {"l": 136.80002, "t": 131.50775, "r": 536.26263, "b": 140.72076000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "only for the employees that they manage.", "bbox": {"l": 136.80002, "t": 143.50757, "r": 319.04318, "b": 152.72058000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "section_header", "bbox": {"l": 64.800003, "t": 173.33471999999995, "r": 301.46902, "b": 185.32275000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9626136422157288, "cells": [{"id": 9, "text": "1.3.1", "bbox": {"l": 64.800003, "t": 173.33471999999995, "r": 94.033653, "b": 185.32275000000004, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Existing row and column control", "bbox": {"l": 97.687859, "t": 173.33471999999995, "r": 301.46902, "b": 185.32275000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 136.79999, "t": 199.48870999999997, "r": 541.56738, "b": 256.70099000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9858147501945496, "cells": [{"id": 11, "text": "Some IBM i clients have tried augmenting the all-or-nothing object-level security with SQL ", "bbox": {"l": 136.8, "t": 199.48870999999997, "r": 534.90112, "b": 208.70172000000002, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "views (or logical files) and application logic, as shown in Figure 1-2. However, ", "bbox": {"l": 136.8, "t": 211.48852999999997, "r": 480.47281000000004, "b": 220.70154000000002, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "application-based logic is easy to bypass with all of the different data access interfaces that ", "bbox": {"l": 136.8, "t": 223.48834, "r": 541.56738, "b": 232.70135000000005, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "are provided by the IBM i operating system, such as Open Database Connectivity (ODBC) ", "bbox": {"l": 136.8, "t": 235.48816, "r": 537.39423, "b": 244.70117000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "and System i Navigator.", "bbox": {"l": 136.79999, "t": 247.48798, "r": 242.24352000000002, "b": 256.70099000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 136.79999, "t": 269.50757, "r": 547.4408, "b": 314.72003, "coord_origin": "TOPLEFT"}, "confidence": 0.9875384569168091, "cells": [{"id": 16, "text": "Using SQL views to limit access to a subset of the data in a table also has its own set of ", "bbox": {"l": 136.79999, "t": 269.50757, "r": 526.88428, "b": 278.72058000000004, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "challenges. First, there is the complexity of managing all of the SQL view objects that are ", "bbox": {"l": 136.79999, "t": 281.50742, "r": 531.77087, "b": 290.7203999999999, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "used for securing data access. Second, scaling a view-based security solution can be difficult ", "bbox": {"l": 136.79999, "t": 293.50723000000005, "r": 547.4408, "b": 302.72021, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "as the amount of data grows and the number of users increases.", "bbox": {"l": 136.79999, "t": 305.50705, "r": 421.86725, "b": 314.72003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "text", "bbox": {"l": 136.79999, "t": 327.52661, "r": 547.23267, "b": 360.73923, "coord_origin": "TOPLEFT"}, "confidence": 0.975760281085968, "cells": [{"id": 20, "text": "Even if you are willing to live with these performance and management issues, a user with ", "bbox": {"l": 136.79999, "t": 327.52661, "r": 536.46692, "b": 336.7395900000001, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "*ALLOBJ access still can directly access all of the data in the underlying DB2 table and easily ", "bbox": {"l": 136.79999, "t": 339.52643, "r": 547.23267, "b": 348.73941, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "bypass the security controls that are built into an SQL view.", "bbox": {"l": 136.79999, "t": 351.52624999999995, "r": 397.88553, "b": 360.73923, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "caption", "bbox": {"l": 136.8, "t": 691.818, "r": 316.44727, "b": 700.142998, "coord_origin": "TOPLEFT"}, "confidence": 0.9457826614379883, "cells": [{"id": 23, "text": "Figure 1-2 Existing row and column controls", "bbox": {"l": 136.8, "t": 691.818, "r": 316.44727, "b": 700.142998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "picture", "bbox": {"l": 135.92466735839844, "t": 375.9272155761719, "r": 546.4456176757812, "b": 688.6098022460938, "coord_origin": "TOPLEFT"}, "confidence": 0.9838992357254028, "cells": [{"id": 24, "text": "User with", "bbox": {"l": 180.95911, "t": 383.45612, "r": 209.08017, "b": 389.0784, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "*ALLOBJ access", "bbox": {"l": 170.00624, "t": 390.95251, "r": 220.10355, "b": 396.57480000000004, "coord_origin": "TOPLEFT"}}], "children": [{"id": 9, "label": "text", "bbox": {"l": 180.95911, "t": 383.45612, "r": 209.08017, "b": 389.0784, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "User with", "bbox": {"l": 180.95911, "t": 383.45612, "r": 209.08017, "b": 389.0784, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "text", "bbox": {"l": 170.00624, "t": 390.95251, "r": 220.10355, "b": 396.57480000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "*ALLOBJ access", "bbox": {"l": 170.00624, "t": 390.95251, "r": 220.10355, "b": 396.57480000000004, "coord_origin": "TOPLEFT"}}], "children": []}]}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_footer", "id": 8, "page_no": 6, "cluster": {"id": 8, "label": "page_footer", "bbox": {"l": 64.800003, "t": 754.848721, "r": 72.821999, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.8578535318374634, "cells": [{"id": 0, "text": "4 ", "bbox": {"l": 64.800003, "t": 754.848721, "r": 72.821999, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4"}, {"label": "page_footer", "id": 6, "page_no": 6, "cluster": {"id": 6, "label": "page_footer", "bbox": {"l": 87.840302, "t": 755.538002, "r": 328.72537, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9491620659828186, "cells": [{"id": 1, "text": "Row and Column Access Control Support in IBM DB2 for i", "bbox": {"l": 87.840302, "t": 755.538002, "r": 328.72537, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Row and Column Access Control Support in IBM DB2 for i"}, {"label": "text", "id": 1, "page_no": 6, "cluster": {"id": 1, "label": "text", "bbox": {"l": 136.8, "t": 71.50867000000005, "r": 544.30334, "b": 152.72058000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9872740507125854, "cells": [{"id": 2, "text": "Many businesses are trying to limit data access to a need-to-know basis. This security goal ", "bbox": {"l": 136.8, "t": 71.50867000000005, "r": 541.19006, "b": 80.72167999999999, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "means that users should be given access only to the minimum set of data that is required to ", "bbox": {"l": 136.8, "t": 83.50847999999996, "r": 544.30334, "b": 92.72149999999999, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "perform their job. Often, users with object-level access are given access to row and column ", "bbox": {"l": 136.8, "t": 95.50829999999996, "r": 540.94299, "b": 104.72131000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "values that are beyond what their business task requires because that object-level security ", "bbox": {"l": 136.80002, "t": 107.50811999999996, "r": 538.27454, "b": 116.72113000000002, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "provides an all-or-nothing solution. For example, object-level controls allow a manager to ", "bbox": {"l": 136.80002, "t": 119.50792999999999, "r": 530.23004, "b": 128.72095000000002, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "access data about all employees. Most security policies limit a manager to accessing data ", "bbox": {"l": 136.80002, "t": 131.50775, "r": 536.26263, "b": 140.72076000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "only for the employees that they manage.", "bbox": {"l": 136.80002, "t": 143.50757, "r": 319.04318, "b": 152.72058000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Many businesses are trying to limit data access to a need-to-know basis. This security goal means that users should be given access only to the minimum set of data that is required to perform their job. Often, users with object-level access are given access to row and column values that are beyond what their business task requires because that object-level security provides an all-or-nothing solution. For example, object-level controls allow a manager to access data about all employees. Most security policies limit a manager to accessing data only for the employees that they manage."}, {"label": "section_header", "id": 5, "page_no": 6, "cluster": {"id": 5, "label": "section_header", "bbox": {"l": 64.800003, "t": 173.33471999999995, "r": 301.46902, "b": 185.32275000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9626136422157288, "cells": [{"id": 9, "text": "1.3.1", "bbox": {"l": 64.800003, "t": 173.33471999999995, "r": 94.033653, "b": 185.32275000000004, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Existing row and column control", "bbox": {"l": 97.687859, "t": 173.33471999999995, "r": 301.46902, "b": 185.32275000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1.3.1 Existing row and column control"}, {"label": "text", "id": 2, "page_no": 6, "cluster": {"id": 2, "label": "text", "bbox": {"l": 136.79999, "t": 199.48870999999997, "r": 541.56738, "b": 256.70099000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9858147501945496, "cells": [{"id": 11, "text": "Some IBM i clients have tried augmenting the all-or-nothing object-level security with SQL ", "bbox": {"l": 136.8, "t": 199.48870999999997, "r": 534.90112, "b": 208.70172000000002, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "views (or logical files) and application logic, as shown in Figure 1-2. However, ", "bbox": {"l": 136.8, "t": 211.48852999999997, "r": 480.47281000000004, "b": 220.70154000000002, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "application-based logic is easy to bypass with all of the different data access interfaces that ", "bbox": {"l": 136.8, "t": 223.48834, "r": 541.56738, "b": 232.70135000000005, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "are provided by the IBM i operating system, such as Open Database Connectivity (ODBC) ", "bbox": {"l": 136.8, "t": 235.48816, "r": 537.39423, "b": 244.70117000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "and System i Navigator.", "bbox": {"l": 136.79999, "t": 247.48798, "r": 242.24352000000002, "b": 256.70099000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Some IBM i clients have tried augmenting the all-or-nothing object-level security with SQL views (or logical files) and application logic, as shown in Figure 1-2. However, application-based logic is easy to bypass with all of the different data access interfaces that are provided by the IBM i operating system, such as Open Database Connectivity (ODBC) and System i Navigator."}, {"label": "text", "id": 0, "page_no": 6, "cluster": {"id": 0, "label": "text", "bbox": {"l": 136.79999, "t": 269.50757, "r": 547.4408, "b": 314.72003, "coord_origin": "TOPLEFT"}, "confidence": 0.9875384569168091, "cells": [{"id": 16, "text": "Using SQL views to limit access to a subset of the data in a table also has its own set of ", "bbox": {"l": 136.79999, "t": 269.50757, "r": 526.88428, "b": 278.72058000000004, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "challenges. First, there is the complexity of managing all of the SQL view objects that are ", "bbox": {"l": 136.79999, "t": 281.50742, "r": 531.77087, "b": 290.7203999999999, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "used for securing data access. Second, scaling a view-based security solution can be difficult ", "bbox": {"l": 136.79999, "t": 293.50723000000005, "r": 547.4408, "b": 302.72021, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "as the amount of data grows and the number of users increases.", "bbox": {"l": 136.79999, "t": 305.50705, "r": 421.86725, "b": 314.72003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Using SQL views to limit access to a subset of the data in a table also has its own set of challenges. First, there is the complexity of managing all of the SQL view objects that are used for securing data access. Second, scaling a view-based security solution can be difficult as the amount of data grows and the number of users increases."}, {"label": "text", "id": 4, "page_no": 6, "cluster": {"id": 4, "label": "text", "bbox": {"l": 136.79999, "t": 327.52661, "r": 547.23267, "b": 360.73923, "coord_origin": "TOPLEFT"}, "confidence": 0.975760281085968, "cells": [{"id": 20, "text": "Even if you are willing to live with these performance and management issues, a user with ", "bbox": {"l": 136.79999, "t": 327.52661, "r": 536.46692, "b": 336.7395900000001, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "*ALLOBJ access still can directly access all of the data in the underlying DB2 table and easily ", "bbox": {"l": 136.79999, "t": 339.52643, "r": 547.23267, "b": 348.73941, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "bypass the security controls that are built into an SQL view.", "bbox": {"l": 136.79999, "t": 351.52624999999995, "r": 397.88553, "b": 360.73923, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Even if you are willing to live with these performance and management issues, a user with *ALLOBJ access still can directly access all of the data in the underlying DB2 table and easily bypass the security controls that are built into an SQL view."}, {"label": "caption", "id": 7, "page_no": 6, "cluster": {"id": 7, "label": "caption", "bbox": {"l": 136.8, "t": 691.818, "r": 316.44727, "b": 700.142998, "coord_origin": "TOPLEFT"}, "confidence": 0.9457826614379883, "cells": [{"id": 23, "text": "Figure 1-2 Existing row and column controls", "bbox": {"l": 136.8, "t": 691.818, "r": 316.44727, "b": 700.142998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 1-2 Existing row and column controls"}, {"label": "picture", "id": 3, "page_no": 6, "cluster": {"id": 3, "label": "picture", "bbox": {"l": 135.92466735839844, "t": 375.9272155761719, "r": 546.4456176757812, "b": 688.6098022460938, "coord_origin": "TOPLEFT"}, "confidence": 0.9838992357254028, "cells": [{"id": 24, "text": "User with", "bbox": {"l": 180.95911, "t": 383.45612, "r": 209.08017, "b": 389.0784, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "*ALLOBJ access", "bbox": {"l": 170.00624, "t": 390.95251, "r": 220.10355, "b": 396.57480000000004, "coord_origin": "TOPLEFT"}}], "children": [{"id": 9, "label": "text", "bbox": {"l": 180.95911, "t": 383.45612, "r": 209.08017, "b": 389.0784, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "User with", "bbox": {"l": 180.95911, "t": 383.45612, "r": 209.08017, "b": 389.0784, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "text", "bbox": {"l": 170.00624, "t": 390.95251, "r": 220.10355, "b": 396.57480000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "*ALLOBJ access", "bbox": {"l": 170.00624, "t": 390.95251, "r": 220.10355, "b": 396.57480000000004, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "body": [{"label": "text", "id": 1, "page_no": 6, "cluster": {"id": 1, "label": "text", "bbox": {"l": 136.8, "t": 71.50867000000005, "r": 544.30334, "b": 152.72058000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9872740507125854, "cells": [{"id": 2, "text": "Many businesses are trying to limit data access to a need-to-know basis. This security goal ", "bbox": {"l": 136.8, "t": 71.50867000000005, "r": 541.19006, "b": 80.72167999999999, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "means that users should be given access only to the minimum set of data that is required to ", "bbox": {"l": 136.8, "t": 83.50847999999996, "r": 544.30334, "b": 92.72149999999999, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "perform their job. Often, users with object-level access are given access to row and column ", "bbox": {"l": 136.8, "t": 95.50829999999996, "r": 540.94299, "b": 104.72131000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "values that are beyond what their business task requires because that object-level security ", "bbox": {"l": 136.80002, "t": 107.50811999999996, "r": 538.27454, "b": 116.72113000000002, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "provides an all-or-nothing solution. For example, object-level controls allow a manager to ", "bbox": {"l": 136.80002, "t": 119.50792999999999, "r": 530.23004, "b": 128.72095000000002, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "access data about all employees. Most security policies limit a manager to accessing data ", "bbox": {"l": 136.80002, "t": 131.50775, "r": 536.26263, "b": 140.72076000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "only for the employees that they manage.", "bbox": {"l": 136.80002, "t": 143.50757, "r": 319.04318, "b": 152.72058000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Many businesses are trying to limit data access to a need-to-know basis. This security goal means that users should be given access only to the minimum set of data that is required to perform their job. Often, users with object-level access are given access to row and column values that are beyond what their business task requires because that object-level security provides an all-or-nothing solution. For example, object-level controls allow a manager to access data about all employees. Most security policies limit a manager to accessing data only for the employees that they manage."}, {"label": "section_header", "id": 5, "page_no": 6, "cluster": {"id": 5, "label": "section_header", "bbox": {"l": 64.800003, "t": 173.33471999999995, "r": 301.46902, "b": 185.32275000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9626136422157288, "cells": [{"id": 9, "text": "1.3.1", "bbox": {"l": 64.800003, "t": 173.33471999999995, "r": 94.033653, "b": 185.32275000000004, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Existing row and column control", "bbox": {"l": 97.687859, "t": 173.33471999999995, "r": 301.46902, "b": 185.32275000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1.3.1 Existing row and column control"}, {"label": "text", "id": 2, "page_no": 6, "cluster": {"id": 2, "label": "text", "bbox": {"l": 136.79999, "t": 199.48870999999997, "r": 541.56738, "b": 256.70099000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9858147501945496, "cells": [{"id": 11, "text": "Some IBM i clients have tried augmenting the all-or-nothing object-level security with SQL ", "bbox": {"l": 136.8, "t": 199.48870999999997, "r": 534.90112, "b": 208.70172000000002, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "views (or logical files) and application logic, as shown in Figure 1-2. However, ", "bbox": {"l": 136.8, "t": 211.48852999999997, "r": 480.47281000000004, "b": 220.70154000000002, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "application-based logic is easy to bypass with all of the different data access interfaces that ", "bbox": {"l": 136.8, "t": 223.48834, "r": 541.56738, "b": 232.70135000000005, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "are provided by the IBM i operating system, such as Open Database Connectivity (ODBC) ", "bbox": {"l": 136.8, "t": 235.48816, "r": 537.39423, "b": 244.70117000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "and System i Navigator.", "bbox": {"l": 136.79999, "t": 247.48798, "r": 242.24352000000002, "b": 256.70099000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Some IBM i clients have tried augmenting the all-or-nothing object-level security with SQL views (or logical files) and application logic, as shown in Figure 1-2. However, application-based logic is easy to bypass with all of the different data access interfaces that are provided by the IBM i operating system, such as Open Database Connectivity (ODBC) and System i Navigator."}, {"label": "text", "id": 0, "page_no": 6, "cluster": {"id": 0, "label": "text", "bbox": {"l": 136.79999, "t": 269.50757, "r": 547.4408, "b": 314.72003, "coord_origin": "TOPLEFT"}, "confidence": 0.9875384569168091, "cells": [{"id": 16, "text": "Using SQL views to limit access to a subset of the data in a table also has its own set of ", "bbox": {"l": 136.79999, "t": 269.50757, "r": 526.88428, "b": 278.72058000000004, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "challenges. First, there is the complexity of managing all of the SQL view objects that are ", "bbox": {"l": 136.79999, "t": 281.50742, "r": 531.77087, "b": 290.7203999999999, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "used for securing data access. Second, scaling a view-based security solution can be difficult ", "bbox": {"l": 136.79999, "t": 293.50723000000005, "r": 547.4408, "b": 302.72021, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "as the amount of data grows and the number of users increases.", "bbox": {"l": 136.79999, "t": 305.50705, "r": 421.86725, "b": 314.72003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Using SQL views to limit access to a subset of the data in a table also has its own set of challenges. First, there is the complexity of managing all of the SQL view objects that are used for securing data access. Second, scaling a view-based security solution can be difficult as the amount of data grows and the number of users increases."}, {"label": "text", "id": 4, "page_no": 6, "cluster": {"id": 4, "label": "text", "bbox": {"l": 136.79999, "t": 327.52661, "r": 547.23267, "b": 360.73923, "coord_origin": "TOPLEFT"}, "confidence": 0.975760281085968, "cells": [{"id": 20, "text": "Even if you are willing to live with these performance and management issues, a user with ", "bbox": {"l": 136.79999, "t": 327.52661, "r": 536.46692, "b": 336.7395900000001, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "*ALLOBJ access still can directly access all of the data in the underlying DB2 table and easily ", "bbox": {"l": 136.79999, "t": 339.52643, "r": 547.23267, "b": 348.73941, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "bypass the security controls that are built into an SQL view.", "bbox": {"l": 136.79999, "t": 351.52624999999995, "r": 397.88553, "b": 360.73923, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Even if you are willing to live with these performance and management issues, a user with *ALLOBJ access still can directly access all of the data in the underlying DB2 table and easily bypass the security controls that are built into an SQL view."}, {"label": "caption", "id": 7, "page_no": 6, "cluster": {"id": 7, "label": "caption", "bbox": {"l": 136.8, "t": 691.818, "r": 316.44727, "b": 700.142998, "coord_origin": "TOPLEFT"}, "confidence": 0.9457826614379883, "cells": [{"id": 23, "text": "Figure 1-2 Existing row and column controls", "bbox": {"l": 136.8, "t": 691.818, "r": 316.44727, "b": 700.142998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 1-2 Existing row and column controls"}, {"label": "picture", "id": 3, "page_no": 6, "cluster": {"id": 3, "label": "picture", "bbox": {"l": 135.92466735839844, "t": 375.9272155761719, "r": 546.4456176757812, "b": 688.6098022460938, "coord_origin": "TOPLEFT"}, "confidence": 0.9838992357254028, "cells": [{"id": 24, "text": "User with", "bbox": {"l": 180.95911, "t": 383.45612, "r": 209.08017, "b": 389.0784, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "*ALLOBJ access", "bbox": {"l": 170.00624, "t": 390.95251, "r": 220.10355, "b": 396.57480000000004, "coord_origin": "TOPLEFT"}}], "children": [{"id": 9, "label": "text", "bbox": {"l": 180.95911, "t": 383.45612, "r": 209.08017, "b": 389.0784, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "User with", "bbox": {"l": 180.95911, "t": 383.45612, "r": 209.08017, "b": 389.0784, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "text", "bbox": {"l": 170.00624, "t": 390.95251, "r": 220.10355, "b": 396.57480000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "*ALLOBJ access", "bbox": {"l": 170.00624, "t": 390.95251, "r": 220.10355, "b": 396.57480000000004, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "headers": [{"label": "page_footer", "id": 8, "page_no": 6, "cluster": {"id": 8, "label": "page_footer", "bbox": {"l": 64.800003, "t": 754.848721, "r": 72.821999, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.8578535318374634, "cells": [{"id": 0, "text": "4 ", "bbox": {"l": 64.800003, "t": 754.848721, "r": 72.821999, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "4"}, {"label": "page_footer", "id": 6, "page_no": 6, "cluster": {"id": 6, "label": "page_footer", "bbox": {"l": 87.840302, "t": 755.538002, "r": 328.72537, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9491620659828186, "cells": [{"id": 1, "text": "Row and Column Access Control Support in IBM DB2 for i", "bbox": {"l": 87.840302, "t": 755.538002, "r": 328.72537, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Row and Column Access Control Support in IBM DB2 for i"}]}}, {"page_no": 7, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "10 ", "bbox": {"l": 64.800003, "t": 754.848721, "r": 78.402, "b": 764.06172, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Row and Column Access Control Support in IBM DB2 for i", "bbox": {"l": 93.420303, "t": 755.538002, "r": 334.42142, "b": 763.863001, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "2.1.6", "bbox": {"l": 64.800003, "t": 71.33471999999995, "r": 94.081459, "b": 83.32275000000004, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Change Function Usage CL command", "bbox": {"l": 97.741661, "t": 71.33471999999995, "r": 335.49551, "b": 83.32275000000004, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "The following CL commands can be used to work with, display, or change function usage IDs:", "bbox": {"l": 136.8, "t": 97.48870999999997, "r": 547.28442, "b": 106.70172000000014, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "GLYPH<SM590000>", "bbox": {"l": 136.8, "t": 114.67767000000003, "r": 141.78, "b": 123.45245, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Work Function Usage (", "bbox": {"l": 151.20016, "t": 114.52826000000005, "r": 253.26227000000003, "b": 123.74126999999999, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "WRKFCNUSG", "bbox": {"l": 253.26028, "t": 114.67767000000003, "r": 298.1998, "b": 123.50225999999998, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": ")", "bbox": {"l": 298.20081, "t": 114.52826000000005, "r": 301.51749, "b": 123.74126999999999, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "GLYPH<SM590000>", "bbox": {"l": 136.80099, "t": 126.67749000000003, "r": 141.78099, "b": 135.45227, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Change Function Usage (", "bbox": {"l": 151.20116, "t": 126.52808000000005, "r": 265.13354, "b": 135.74108999999999, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "CHGFCNUSG", "bbox": {"l": 265.08081, "t": 126.67749000000003, "r": 310.02032, "b": 135.50207999999998, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": ")", "bbox": {"l": 310.08109, "t": 126.52808000000005, "r": 313.39777, "b": 135.74108999999999, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "GLYPH<SM590000>", "bbox": {"l": 136.80098, "t": 138.67731000000003, "r": 141.78098, "b": 147.45209, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Display Function Usage (", "bbox": {"l": 151.20114, "t": 138.52788999999996, "r": 262.5639, "b": 147.74090999999999, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "DSPFCNUSG", "bbox": {"l": 262.56091, "t": 138.67731000000003, "r": 307.50043, "b": 147.50189, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": ")", "bbox": {"l": 307.50043, "t": 138.52788999999996, "r": 310.81711, "b": 147.74090999999999, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "For example, the following ", "bbox": {"l": 136.79997, "t": 160.48766999999998, "r": 255.09984000000003, "b": 169.70068000000003, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "CHGFCNUSG", "bbox": {"l": 255.00027, "t": 160.63707999999997, "r": 299.99957, "b": 169.46167000000003, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": " command shows granting authorization to user ", "bbox": {"l": 300.00055, "t": 160.48766999999998, "r": 512.53802, "b": 169.70068000000003, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "HBEDOYA to administer and manage RCAC rules:", "bbox": {"l": 136.80096, "t": 172.48748999999998, "r": 360.41989, "b": 181.70050000000003, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "CHGFCNUSG FCNID(QIBM_DB_SECADM) USER(HBEDOYA) USAGE(*ALLOWED)", "bbox": {"l": 136.80096, "t": 189.67645000000005, "r": 441.59686, "b": 198.45123, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "2.1.7", "bbox": {"l": 64.800003, "t": 219.35468000000003, "r": 93.757614, "b": 231.34271, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Verifying function usage IDs for RCAC with the FUNCTION_USAGE view", "bbox": {"l": 97.377296, "t": 219.35468000000003, "r": 544.47546, "b": 231.34271, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "The FUNCTION_USAGE view contains function usage configuration details. Table 2-1 ", "bbox": {"l": 136.8, "t": 245.50867000000005, "r": 519.51794, "b": 254.72168, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "describes the columns in the FUNCTION_USAGE view.", "bbox": {"l": 136.8, "t": 257.50847999999996, "r": 382.94443, "b": 266.7215, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "Table 2-1 FUNCTION_USAGE view", "bbox": {"l": 136.8, "t": 279.55798000000004, "r": 283.96805, "b": 287.88300000000004, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "To discover who has authorization to define and manage RCAC, you can use the query that is ", "bbox": {"l": 136.8, "t": 452.50872999999996, "r": 547.2804, "b": 461.72171, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "shown in Example 2-1.", "bbox": {"l": 136.8, "t": 464.50854, "r": 237.76951999999997, "b": 473.72153, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Example 2-1 Query to determine who has authority to define and manage RCAC", "bbox": {"l": 136.8, "t": 486.55798, "r": 462.35419, "b": 494.883, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "SELECT", "bbox": {"l": 136.8, "t": 503.65802, "r": 171.26956, "b": 512.4328, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "function_id,", "bbox": {"l": 182.75941, "t": 503.65802, "r": 251.69853, "b": 512.4328, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "user_name,", "bbox": {"l": 166.78244, "t": 515.6578400000001, "r": 241.73852999999997, "b": 524.43262, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "usage,", "bbox": {"l": 170.75961, "t": 527.65765, "r": 221.69901999999996, "b": 536.43242, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "user_type", "bbox": {"l": 167.53809, "t": 539.65747, "r": 236.69878, "b": 548.43222, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "FROM", "bbox": {"l": 136.8, "t": 551.65727, "r": 160.59396, "b": 560.43202, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "function_usage", "bbox": {"l": 178.43944, "t": 551.65727, "r": 261.71829, "b": 560.43202, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "WHERE", "bbox": {"l": 136.8, "t": 563.65707, "r": 162.44176, "b": 572.43182, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "function_id=\u2019QIBM_DB_SECADM\u2019", "bbox": {"l": 177.8268, "t": 563.65707, "r": 331.67731, "b": 572.43182, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "ORDER BY", "bbox": {"l": 136.8, "t": 575.65688, "r": 178.77542, "b": 584.43163, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "user_name;", "bbox": {"l": 189.26929, "t": 575.65688, "r": 241.73856, "b": 584.43163, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "2.2", "bbox": {"l": 64.800003, "t": 620.22063, "r": 87.569839, "b": 634.98363, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "Separation of duties", "bbox": {"l": 92.123802, "t": 620.22063, "r": 249.59605000000002, "b": 634.98363, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Separation of duties helps businesses comply with industry regulations or organizational ", "bbox": {"l": 136.8, "t": 652.54872, "r": 529.09357, "b": 661.76172, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "requirements and simplifies the management of authorities. Separation of duties is commonly ", "bbox": {"l": 136.8, "t": 664.54852, "r": 547.22345, "b": 673.76153, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "used to prevent fraudulent activities or errors by a single person. It provides the ability for ", "bbox": {"l": 136.8, "t": 676.54833, "r": 530.89716, "b": 685.76134, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "administrative functions to be divided across individuals without overlapping responsibilities, ", "bbox": {"l": 136.80002, "t": 688.54814, "r": 544.33832, "b": 697.7611469999999, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "so that one user does not possess unlimited authority, such as with the *ALLOBJ authority.", "bbox": {"l": 136.80002, "t": 700.547951, "r": 536.28363, "b": 709.760956, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "Column name", "bbox": {"l": 142.8, "t": 296.5379899999999, "r": 202.245, "b": 304.86301, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "Data type", "bbox": {"l": 216.80878999999996, "t": 296.5379899999999, "r": 257.21069, "b": 304.86301, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Description", "bbox": {"l": 289.47479, "t": 296.5379899999999, "r": 338.89468, "b": 304.86301, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "FUNCTION_ID", "bbox": {"l": 142.8, "t": 315.55771, "r": 203.2323, "b": 323.88272, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "VARCHAR(30)", "bbox": {"l": 216.7854, "t": 315.55771, "r": 276.0036, "b": 323.88272, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "ID of the function.", "bbox": {"l": 289.4577, "t": 315.55771, "r": 359.85394, "b": 323.88272, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "USER_NAME", "bbox": {"l": 142.8, "t": 334.51801, "r": 198.6693, "b": 342.84302, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "VARCHAR(10)", "bbox": {"l": 216.74129999999997, "t": 334.51801, "r": 275.92349, "b": 342.84302, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Name of the user profile that has a usage setting for this ", "bbox": {"l": 289.38208, "t": 334.51801, "r": 515.05359, "b": 342.84302, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "function.", "bbox": {"l": 289.4397, "t": 345.55832, "r": 323.43362, "b": 353.88333, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "USAGE", "bbox": {"l": 142.79999, "t": 364.51862, "r": 173.98318, "b": 372.84363, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "VARCHAR(7)", "bbox": {"l": 216.77367999999998, "t": 364.51862, "r": 270.97977, "b": 372.84363, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Usage setting:", "bbox": {"l": 289.41626, "t": 364.51862, "r": 346.88757, "b": 372.84363, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 375.69394000000005, "r": 293.9397, "b": 383.62292, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "ALLOWED: The user profile is allowed to use the function.", "bbox": {"l": 303.83969, "t": 375.55893, "r": 535.16766, "b": 383.88394, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 386.67395, "r": 293.9397, "b": 394.60294, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "DENIED: The user profile is not allowed to use the function.", "bbox": {"l": 303.83969, "t": 386.53894, "r": 539.10712, "b": 394.86395, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "USER_TYPE", "bbox": {"l": 142.8, "t": 405.55865, "r": 196.2249, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "VARCHAR(5)", "bbox": {"l": 216.75211, "t": 405.55865, "r": 270.99872, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "Type of user profile:", "bbox": {"l": 289.43161, "t": 405.55865, "r": 367.8009, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 416.67368000000005, "r": 293.9397, "b": 424.60266, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "USER: The user profile is a user.", "bbox": {"l": 303.83969, "t": 416.53867, "r": 434.78159, "b": 424.86368, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 427.65369, "r": 293.9397, "b": 435.58267000000006, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "GROUP: The user profile is a group.", "bbox": {"l": 303.83969, "t": 427.51868, "r": 448.11963000000003, "b": 435.84369, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 14, "label": "page_footer", "bbox": {"l": 64.800003, "t": 754.848721, "r": 78.402, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.9166396856307983, "cells": [{"id": 0, "text": "10 ", "bbox": {"l": 64.800003, "t": 754.848721, "r": 78.402, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "page_footer", "bbox": {"l": 93.420303, "t": 755.538002, "r": 334.42142, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9530044198036194, "cells": [{"id": 1, "text": "Row and Column Access Control Support in IBM DB2 for i", "bbox": {"l": 93.420303, "t": 755.538002, "r": 334.42142, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "section_header", "bbox": {"l": 64.800003, "t": 71.33471999999995, "r": 335.49551, "b": 83.32275000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9697521328926086, "cells": [{"id": 2, "text": "2.1.6", "bbox": {"l": 64.800003, "t": 71.33471999999995, "r": 94.081459, "b": 83.32275000000004, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Change Function Usage CL command", "bbox": {"l": 97.741661, "t": 71.33471999999995, "r": 335.49551, "b": 83.32275000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 136.8, "t": 97.48870999999997, "r": 547.28442, "b": 106.70172000000014, "coord_origin": "TOPLEFT"}, "confidence": 0.9551582932472229, "cells": [{"id": 4, "text": "The following CL commands can be used to work with, display, or change function usage IDs:", "bbox": {"l": 136.8, "t": 97.48870999999997, "r": 547.28442, "b": 106.70172000000014, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "list_item", "bbox": {"l": 136.8, "t": 114.52826000000005, "r": 301.51749, "b": 123.74126999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9410832524299622, "cells": [{"id": 5, "text": "GLYPH<SM590000>", "bbox": {"l": 136.8, "t": 114.67767000000003, "r": 141.78, "b": 123.45245, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Work Function Usage (", "bbox": {"l": 151.20016, "t": 114.52826000000005, "r": 253.26227000000003, "b": 123.74126999999999, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "WRKFCNUSG", "bbox": {"l": 253.26028, "t": 114.67767000000003, "r": 298.1998, "b": 123.50225999999998, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": ")", "bbox": {"l": 298.20081, "t": 114.52826000000005, "r": 301.51749, "b": 123.74126999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "list_item", "bbox": {"l": 136.80099, "t": 126.52808000000005, "r": 313.39777, "b": 135.74108999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9418092370033264, "cells": [{"id": 9, "text": "GLYPH<SM590000>", "bbox": {"l": 136.80099, "t": 126.67749000000003, "r": 141.78099, "b": 135.45227, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Change Function Usage (", "bbox": {"l": 151.20116, "t": 126.52808000000005, "r": 265.13354, "b": 135.74108999999999, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "CHGFCNUSG", "bbox": {"l": 265.08081, "t": 126.67749000000003, "r": 310.02032, "b": 135.50207999999998, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": ")", "bbox": {"l": 310.08109, "t": 126.52808000000005, "r": 313.39777, "b": 135.74108999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "list_item", "bbox": {"l": 136.80098, "t": 138.52788999999996, "r": 310.81711, "b": 147.74090999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9562349915504456, "cells": [{"id": 13, "text": "GLYPH<SM590000>", "bbox": {"l": 136.80098, "t": 138.67731000000003, "r": 141.78098, "b": 147.45209, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Display Function Usage (", "bbox": {"l": 151.20114, "t": 138.52788999999996, "r": 262.5639, "b": 147.74090999999999, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "DSPFCNUSG", "bbox": {"l": 262.56091, "t": 138.67731000000003, "r": 307.50043, "b": 147.50189, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": ")", "bbox": {"l": 307.50043, "t": 138.52788999999996, "r": 310.81711, "b": 147.74090999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "text", "bbox": {"l": 136.79997, "t": 160.48766999999998, "r": 512.53802, "b": 181.70050000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9682500958442688, "cells": [{"id": 17, "text": "For example, the following ", "bbox": {"l": 136.79997, "t": 160.48766999999998, "r": 255.09984000000003, "b": 169.70068000000003, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "CHGFCNUSG", "bbox": {"l": 255.00027, "t": 160.63707999999997, "r": 299.99957, "b": 169.46167000000003, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": " command shows granting authorization to user ", "bbox": {"l": 300.00055, "t": 160.48766999999998, "r": 512.53802, "b": 169.70068000000003, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "HBEDOYA to administer and manage RCAC rules:", "bbox": {"l": 136.80096, "t": 172.48748999999998, "r": 360.41989, "b": 181.70050000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 136.80096, "t": 189.67645000000005, "r": 441.59686, "b": 198.45123, "coord_origin": "TOPLEFT"}, "confidence": 0.905712902545929, "cells": [{"id": 21, "text": "CHGFCNUSG FCNID(QIBM_DB_SECADM) USER(HBEDOYA) USAGE(*ALLOWED)", "bbox": {"l": 136.80096, "t": 189.67645000000005, "r": 441.59686, "b": 198.45123, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "section_header", "bbox": {"l": 64.800003, "t": 219.35468000000003, "r": 544.47546, "b": 231.34271, "coord_origin": "TOPLEFT"}, "confidence": 0.9636710286140442, "cells": [{"id": 22, "text": "2.1.7", "bbox": {"l": 64.800003, "t": 219.35468000000003, "r": 93.757614, "b": 231.34271, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Verifying function usage IDs for RCAC with the FUNCTION_USAGE view", "bbox": {"l": 97.377296, "t": 219.35468000000003, "r": 544.47546, "b": 231.34271, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 136.8, "t": 245.50867000000005, "r": 519.51794, "b": 266.7215, "coord_origin": "TOPLEFT"}, "confidence": 0.9737311601638794, "cells": [{"id": 24, "text": "The FUNCTION_USAGE view contains function usage configuration details. Table 2-1 ", "bbox": {"l": 136.8, "t": 245.50867000000005, "r": 519.51794, "b": 254.72168, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "describes the columns in the FUNCTION_USAGE view.", "bbox": {"l": 136.8, "t": 257.50847999999996, "r": 382.94443, "b": 266.7215, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "caption", "bbox": {"l": 136.8, "t": 279.55798000000004, "r": 283.96805, "b": 287.88300000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9196999669075012, "cells": [{"id": 26, "text": "Table 2-1 FUNCTION_USAGE view", "bbox": {"l": 136.8, "t": 279.55798000000004, "r": 283.96805, "b": 287.88300000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "text", "bbox": {"l": 136.8, "t": 452.50872999999996, "r": 547.2804, "b": 473.72153, "coord_origin": "TOPLEFT"}, "confidence": 0.964775562286377, "cells": [{"id": 27, "text": "To discover who has authorization to define and manage RCAC, you can use the query that is ", "bbox": {"l": 136.8, "t": 452.50872999999996, "r": 547.2804, "b": 461.72171, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "shown in Example 2-1.", "bbox": {"l": 136.8, "t": 464.50854, "r": 237.76951999999997, "b": 473.72153, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "caption", "bbox": {"l": 136.8, "t": 486.55798, "r": 462.35419, "b": 494.883, "coord_origin": "TOPLEFT"}, "confidence": 0.8159958720207214, "cells": [{"id": 29, "text": "Example 2-1 Query to determine who has authority to define and manage RCAC", "bbox": {"l": 136.8, "t": 486.55798, "r": 462.35419, "b": 494.883, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "key_value_region", "bbox": {"l": 136.8, "t": 503.65802, "r": 331.67731, "b": 584.43163, "coord_origin": "TOPLEFT"}, "confidence": 0.5808265805244446, "cells": [{"id": 30, "text": "SELECT", "bbox": {"l": 136.8, "t": 503.65802, "r": 171.26956, "b": 512.4328, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "function_id,", "bbox": {"l": 182.75941, "t": 503.65802, "r": 251.69853, "b": 512.4328, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "user_name,", "bbox": {"l": 166.78244, "t": 515.6578400000001, "r": 241.73852999999997, "b": 524.43262, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "usage,", "bbox": {"l": 170.75961, "t": 527.65765, "r": 221.69901999999996, "b": 536.43242, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "user_type", "bbox": {"l": 167.53809, "t": 539.65747, "r": 236.69878, "b": 548.43222, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "FROM", "bbox": {"l": 136.8, "t": 551.65727, "r": 160.59396, "b": 560.43202, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "function_usage", "bbox": {"l": 178.43944, "t": 551.65727, "r": 261.71829, "b": 560.43202, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "WHERE", "bbox": {"l": 136.8, "t": 563.65707, "r": 162.44176, "b": 572.43182, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "function_id=\u2019QIBM_DB_SECADM\u2019", "bbox": {"l": 177.8268, "t": 563.65707, "r": 331.67731, "b": 572.43182, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "ORDER BY", "bbox": {"l": 136.8, "t": 575.65688, "r": 178.77542, "b": 584.43163, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "user_name;", "bbox": {"l": 189.26929, "t": 575.65688, "r": 241.73856, "b": 584.43163, "coord_origin": "TOPLEFT"}}], "children": [{"id": 19, "label": "text", "bbox": {"l": 136.8, "t": 503.65802, "r": 171.26956, "b": 512.4328, "coord_origin": "TOPLEFT"}, "confidence": 0.5631121397018433, "cells": [{"id": 30, "text": "SELECT", "bbox": {"l": 136.8, "t": 503.65802, "r": 171.26956, "b": 512.4328, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 182.75941, "t": 503.65802, "r": 251.69853, "b": 512.4328, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "function_id,", "bbox": {"l": 182.75941, "t": 503.65802, "r": 251.69853, "b": 512.4328, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 166.78244, "t": 515.6578400000001, "r": 241.73852999999997, "b": 524.43262, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "user_name,", "bbox": {"l": 166.78244, "t": 515.6578400000001, "r": 241.73852999999997, "b": 524.43262, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 170.75961, "t": 527.65765, "r": 221.69901999999996, "b": 536.43242, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "usage,", "bbox": {"l": 170.75961, "t": 527.65765, "r": 221.69901999999996, "b": 536.43242, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 167.53809, "t": 539.65747, "r": 236.69878, "b": 548.43222, "coord_origin": "TOPLEFT"}, "confidence": 0.5346826314926147, "cells": [{"id": 34, "text": "user_type", "bbox": {"l": 167.53809, "t": 539.65747, "r": 236.69878, "b": 548.43222, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 136.8, "t": 551.65727, "r": 160.59396, "b": 560.43202, "coord_origin": "TOPLEFT"}, "confidence": 0.581838846206665, "cells": [{"id": 35, "text": "FROM", "bbox": {"l": 136.8, "t": 551.65727, "r": 160.59396, "b": 560.43202, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 178.43944, "t": 551.65727, "r": 261.71829, "b": 560.43202, "coord_origin": "TOPLEFT"}, "confidence": 0.5035740733146667, "cells": [{"id": 36, "text": "function_usage", "bbox": {"l": 178.43944, "t": 551.65727, "r": 261.71829, "b": 560.43202, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 136.8, "t": 563.65707, "r": 162.44176, "b": 572.43182, "coord_origin": "TOPLEFT"}, "confidence": 0.534027099609375, "cells": [{"id": 37, "text": "WHERE", "bbox": {"l": 136.8, "t": 563.65707, "r": 162.44176, "b": 572.43182, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 177.8268, "t": 563.65707, "r": 331.67731, "b": 572.43182, "coord_origin": "TOPLEFT"}, "confidence": 0.5171723365783691, "cells": [{"id": 38, "text": "function_id=\u2019QIBM_DB_SECADM\u2019", "bbox": {"l": 177.8268, "t": 563.65707, "r": 331.67731, "b": 572.43182, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 136.8, "t": 575.65688, "r": 178.77542, "b": 584.43163, "coord_origin": "TOPLEFT"}, "confidence": 0.5373470187187195, "cells": [{"id": 39, "text": "ORDER BY", "bbox": {"l": 136.8, "t": 575.65688, "r": 178.77542, "b": 584.43163, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 189.26929, "t": 575.65688, "r": 241.73856, "b": 584.43163, "coord_origin": "TOPLEFT"}, "confidence": 0.5167025327682495, "cells": [{"id": 40, "text": "user_name;", "bbox": {"l": 189.26929, "t": 575.65688, "r": 241.73856, "b": 584.43163, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 5, "label": "section_header", "bbox": {"l": 64.800003, "t": 620.22063, "r": 249.59605000000002, "b": 634.98363, "coord_origin": "TOPLEFT"}, "confidence": 0.9656105041503906, "cells": [{"id": 41, "text": "2.2", "bbox": {"l": 64.800003, "t": 620.22063, "r": 87.569839, "b": 634.98363, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "Separation of duties", "bbox": {"l": 92.123802, "t": 620.22063, "r": 249.59605000000002, "b": 634.98363, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 136.8, "t": 652.54872, "r": 547.22345, "b": 709.760956, "coord_origin": "TOPLEFT"}, "confidence": 0.9853070974349976, "cells": [{"id": 43, "text": "Separation of duties helps businesses comply with industry regulations or organizational ", "bbox": {"l": 136.8, "t": 652.54872, "r": 529.09357, "b": 661.76172, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "requirements and simplifies the management of authorities. Separation of duties is commonly ", "bbox": {"l": 136.8, "t": 664.54852, "r": 547.22345, "b": 673.76153, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "used to prevent fraudulent activities or errors by a single person. It provides the ability for ", "bbox": {"l": 136.8, "t": 676.54833, "r": 530.89716, "b": 685.76134, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "administrative functions to be divided across individuals without overlapping responsibilities, ", "bbox": {"l": 136.80002, "t": 688.54814, "r": 544.33832, "b": 697.7611469999999, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "so that one user does not possess unlimited authority, such as with the *ALLOBJ authority.", "bbox": {"l": 136.80002, "t": 700.547951, "r": 536.28363, "b": 709.760956, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "table", "bbox": {"l": 135.52462768554688, "t": 289.7252197265625, "r": 545.8714599609375, "b": 442.050537109375, "coord_origin": "TOPLEFT"}, "confidence": 0.9851690530776978, "cells": [{"id": 48, "text": "Column name", "bbox": {"l": 142.8, "t": 296.5379899999999, "r": 202.245, "b": 304.86301, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "Data type", "bbox": {"l": 216.80878999999996, "t": 296.5379899999999, "r": 257.21069, "b": 304.86301, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Description", "bbox": {"l": 289.47479, "t": 296.5379899999999, "r": 338.89468, "b": 304.86301, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "FUNCTION_ID", "bbox": {"l": 142.8, "t": 315.55771, "r": 203.2323, "b": 323.88272, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "VARCHAR(30)", "bbox": {"l": 216.7854, "t": 315.55771, "r": 276.0036, "b": 323.88272, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "ID of the function.", "bbox": {"l": 289.4577, "t": 315.55771, "r": 359.85394, "b": 323.88272, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "USER_NAME", "bbox": {"l": 142.8, "t": 334.51801, "r": 198.6693, "b": 342.84302, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "VARCHAR(10)", "bbox": {"l": 216.74129999999997, "t": 334.51801, "r": 275.92349, "b": 342.84302, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Name of the user profile that has a usage setting for this ", "bbox": {"l": 289.38208, "t": 334.51801, "r": 515.05359, "b": 342.84302, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "function.", "bbox": {"l": 289.4397, "t": 345.55832, "r": 323.43362, "b": 353.88333, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "USAGE", "bbox": {"l": 142.79999, "t": 364.51862, "r": 173.98318, "b": 372.84363, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "VARCHAR(7)", "bbox": {"l": 216.77367999999998, "t": 364.51862, "r": 270.97977, "b": 372.84363, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Usage setting:", "bbox": {"l": 289.41626, "t": 364.51862, "r": 346.88757, "b": 372.84363, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 375.69394000000005, "r": 293.9397, "b": 383.62292, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "ALLOWED: The user profile is allowed to use the function.", "bbox": {"l": 303.83969, "t": 375.55893, "r": 535.16766, "b": 383.88394, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 386.67395, "r": 293.9397, "b": 394.60294, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "DENIED: The user profile is not allowed to use the function.", "bbox": {"l": 303.83969, "t": 386.53894, "r": 539.10712, "b": 394.86395, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "USER_TYPE", "bbox": {"l": 142.8, "t": 405.55865, "r": 196.2249, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "VARCHAR(5)", "bbox": {"l": 216.75211, "t": 405.55865, "r": 270.99872, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "Type of user profile:", "bbox": {"l": 289.43161, "t": 405.55865, "r": 367.8009, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 416.67368000000005, "r": 293.9397, "b": 424.60266, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "USER: The user profile is a user.", "bbox": {"l": 303.83969, "t": 416.53867, "r": 434.78159, "b": 424.86368, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 427.65369, "r": 293.9397, "b": 435.58267000000006, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "GROUP: The user profile is a group.", "bbox": {"l": 303.83969, "t": 427.51868, "r": 448.11963000000003, "b": 435.84369, "coord_origin": "TOPLEFT"}}], "children": [{"id": 31, "label": "text", "bbox": {"l": 142.8, "t": 296.5379899999999, "r": 202.245, "b": 304.86301, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "Column name", "bbox": {"l": 142.8, "t": 296.5379899999999, "r": 202.245, "b": 304.86301, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 216.80878999999996, "t": 296.5379899999999, "r": 257.21069, "b": 304.86301, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "Data type", "bbox": {"l": 216.80878999999996, "t": 296.5379899999999, "r": 257.21069, "b": 304.86301, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 289.47479, "t": 296.5379899999999, "r": 338.89468, "b": 304.86301, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "Description", "bbox": {"l": 289.47479, "t": 296.5379899999999, "r": 338.89468, "b": 304.86301, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 142.8, "t": 315.55771, "r": 203.2323, "b": 323.88272, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "FUNCTION_ID", "bbox": {"l": 142.8, "t": 315.55771, "r": 203.2323, "b": 323.88272, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 216.7854, "t": 315.55771, "r": 276.0036, "b": 323.88272, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "VARCHAR(30)", "bbox": {"l": 216.7854, "t": 315.55771, "r": 276.0036, "b": 323.88272, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 289.4577, "t": 315.55771, "r": 359.85394, "b": 323.88272, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "ID of the function.", "bbox": {"l": 289.4577, "t": 315.55771, "r": 359.85394, "b": 323.88272, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 142.8, "t": 334.51801, "r": 198.6693, "b": 342.84302, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "USER_NAME", "bbox": {"l": 142.8, "t": 334.51801, "r": 198.6693, "b": 342.84302, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 216.74129999999997, "t": 334.51801, "r": 275.92349, "b": 342.84302, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "VARCHAR(10)", "bbox": {"l": 216.74129999999997, "t": 334.51801, "r": 275.92349, "b": 342.84302, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 289.38208, "t": 334.51801, "r": 515.05359, "b": 342.84302, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "Name of the user profile that has a usage setting for this ", "bbox": {"l": 289.38208, "t": 334.51801, "r": 515.05359, "b": 342.84302, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 289.4397, "t": 345.55832, "r": 323.43362, "b": 353.88333, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "function.", "bbox": {"l": 289.4397, "t": 345.55832, "r": 323.43362, "b": 353.88333, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 142.79999, "t": 364.51862, "r": 173.98318, "b": 372.84363, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "USAGE", "bbox": {"l": 142.79999, "t": 364.51862, "r": 173.98318, "b": 372.84363, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 216.77367999999998, "t": 364.51862, "r": 270.97977, "b": 372.84363, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "VARCHAR(7)", "bbox": {"l": 216.77367999999998, "t": 364.51862, "r": 270.97977, "b": 372.84363, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 289.41626, "t": 364.51862, "r": 346.88757, "b": 372.84363, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "Usage setting:", "bbox": {"l": 289.41626, "t": 364.51862, "r": 346.88757, "b": 372.84363, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 289.4397, "t": 375.69394000000005, "r": 293.9397, "b": 383.62292, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 375.69394000000005, "r": 293.9397, "b": 383.62292, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 303.83969, "t": 375.55893, "r": 535.16766, "b": 383.88394, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "ALLOWED: The user profile is allowed to use the function.", "bbox": {"l": 303.83969, "t": 375.55893, "r": 535.16766, "b": 383.88394, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 289.4397, "t": 386.67395, "r": 293.9397, "b": 394.60294, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 386.67395, "r": 293.9397, "b": 394.60294, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 303.83969, "t": 386.53894, "r": 539.10712, "b": 394.86395, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "DENIED: The user profile is not allowed to use the function.", "bbox": {"l": 303.83969, "t": 386.53894, "r": 539.10712, "b": 394.86395, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 142.8, "t": 405.55865, "r": 196.2249, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "USER_TYPE", "bbox": {"l": 142.8, "t": 405.55865, "r": 196.2249, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 216.75211, "t": 405.55865, "r": 270.99872, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "VARCHAR(5)", "bbox": {"l": 216.75211, "t": 405.55865, "r": 270.99872, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 289.43161, "t": 405.55865, "r": 367.8009, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "Type of user profile:", "bbox": {"l": 289.43161, "t": 405.55865, "r": 367.8009, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 289.4397, "t": 416.67368000000005, "r": 293.9397, "b": 424.60266, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 416.67368000000005, "r": 293.9397, "b": 424.60266, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 303.83969, "t": 416.53867, "r": 434.78159, "b": 424.86368, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "USER: The user profile is a user.", "bbox": {"l": 303.83969, "t": 416.53867, "r": 434.78159, "b": 424.86368, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 289.4397, "t": 427.65369, "r": 293.9397, "b": 435.58267000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 427.65369, "r": 293.9397, "b": 435.58267000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 303.83969, "t": 427.51868, "r": 448.11963000000003, "b": 435.84369, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "GROUP: The user profile is a group.", "bbox": {"l": 303.83969, "t": 427.51868, "r": 448.11963000000003, "b": 435.84369, "coord_origin": "TOPLEFT"}}], "children": []}]}]}, "tablestructure": {"table_map": {"1": {"label": "table", "id": 1, "page_no": 7, "cluster": {"id": 1, "label": "table", "bbox": {"l": 135.52462768554688, "t": 289.7252197265625, "r": 545.8714599609375, "b": 442.050537109375, "coord_origin": "TOPLEFT"}, "confidence": 0.9851690530776978, "cells": [{"id": 48, "text": "Column name", "bbox": {"l": 142.8, "t": 296.5379899999999, "r": 202.245, "b": 304.86301, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "Data type", "bbox": {"l": 216.80878999999996, "t": 296.5379899999999, "r": 257.21069, "b": 304.86301, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Description", "bbox": {"l": 289.47479, "t": 296.5379899999999, "r": 338.89468, "b": 304.86301, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "FUNCTION_ID", "bbox": {"l": 142.8, "t": 315.55771, "r": 203.2323, "b": 323.88272, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "VARCHAR(30)", "bbox": {"l": 216.7854, "t": 315.55771, "r": 276.0036, "b": 323.88272, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "ID of the function.", "bbox": {"l": 289.4577, "t": 315.55771, "r": 359.85394, "b": 323.88272, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "USER_NAME", "bbox": {"l": 142.8, "t": 334.51801, "r": 198.6693, "b": 342.84302, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "VARCHAR(10)", "bbox": {"l": 216.74129999999997, "t": 334.51801, "r": 275.92349, "b": 342.84302, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Name of the user profile that has a usage setting for this ", "bbox": {"l": 289.38208, "t": 334.51801, "r": 515.05359, "b": 342.84302, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "function.", "bbox": {"l": 289.4397, "t": 345.55832, "r": 323.43362, "b": 353.88333, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "USAGE", "bbox": {"l": 142.79999, "t": 364.51862, "r": 173.98318, "b": 372.84363, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "VARCHAR(7)", "bbox": {"l": 216.77367999999998, "t": 364.51862, "r": 270.97977, "b": 372.84363, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Usage setting:", "bbox": {"l": 289.41626, "t": 364.51862, "r": 346.88757, "b": 372.84363, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 375.69394000000005, "r": 293.9397, "b": 383.62292, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "ALLOWED: The user profile is allowed to use the function.", "bbox": {"l": 303.83969, "t": 375.55893, "r": 535.16766, "b": 383.88394, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 386.67395, "r": 293.9397, "b": 394.60294, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "DENIED: The user profile is not allowed to use the function.", "bbox": {"l": 303.83969, "t": 386.53894, "r": 539.10712, "b": 394.86395, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "USER_TYPE", "bbox": {"l": 142.8, "t": 405.55865, "r": 196.2249, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "VARCHAR(5)", "bbox": {"l": 216.75211, "t": 405.55865, "r": 270.99872, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "Type of user profile:", "bbox": {"l": 289.43161, "t": 405.55865, "r": 367.8009, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 416.67368000000005, "r": 293.9397, "b": 424.60266, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "USER: The user profile is a user.", "bbox": {"l": 303.83969, "t": 416.53867, "r": 434.78159, "b": 424.86368, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 427.65369, "r": 293.9397, "b": 435.58267000000006, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "GROUP: The user profile is a group.", "bbox": {"l": 303.83969, "t": 427.51868, "r": 448.11963000000003, "b": 435.84369, "coord_origin": "TOPLEFT"}}], "children": [{"id": 31, "label": "text", "bbox": {"l": 142.8, "t": 296.5379899999999, "r": 202.245, "b": 304.86301, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "Column name", "bbox": {"l": 142.8, "t": 296.5379899999999, "r": 202.245, "b": 304.86301, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 216.80878999999996, "t": 296.5379899999999, "r": 257.21069, "b": 304.86301, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "Data type", "bbox": {"l": 216.80878999999996, "t": 296.5379899999999, "r": 257.21069, "b": 304.86301, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 289.47479, "t": 296.5379899999999, "r": 338.89468, "b": 304.86301, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "Description", "bbox": {"l": 289.47479, "t": 296.5379899999999, "r": 338.89468, "b": 304.86301, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 142.8, "t": 315.55771, "r": 203.2323, "b": 323.88272, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "FUNCTION_ID", "bbox": {"l": 142.8, "t": 315.55771, "r": 203.2323, "b": 323.88272, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 216.7854, "t": 315.55771, "r": 276.0036, "b": 323.88272, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "VARCHAR(30)", "bbox": {"l": 216.7854, "t": 315.55771, "r": 276.0036, "b": 323.88272, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 289.4577, "t": 315.55771, "r": 359.85394, "b": 323.88272, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "ID of the function.", "bbox": {"l": 289.4577, "t": 315.55771, "r": 359.85394, "b": 323.88272, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 142.8, "t": 334.51801, "r": 198.6693, "b": 342.84302, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "USER_NAME", "bbox": {"l": 142.8, "t": 334.51801, "r": 198.6693, "b": 342.84302, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 216.74129999999997, "t": 334.51801, "r": 275.92349, "b": 342.84302, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "VARCHAR(10)", "bbox": {"l": 216.74129999999997, "t": 334.51801, "r": 275.92349, "b": 342.84302, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 289.38208, "t": 334.51801, "r": 515.05359, "b": 342.84302, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "Name of the user profile that has a usage setting for this ", "bbox": {"l": 289.38208, "t": 334.51801, "r": 515.05359, "b": 342.84302, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 289.4397, "t": 345.55832, "r": 323.43362, "b": 353.88333, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "function.", "bbox": {"l": 289.4397, "t": 345.55832, "r": 323.43362, "b": 353.88333, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 142.79999, "t": 364.51862, "r": 173.98318, "b": 372.84363, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "USAGE", "bbox": {"l": 142.79999, "t": 364.51862, "r": 173.98318, "b": 372.84363, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 216.77367999999998, "t": 364.51862, "r": 270.97977, "b": 372.84363, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "VARCHAR(7)", "bbox": {"l": 216.77367999999998, "t": 364.51862, "r": 270.97977, "b": 372.84363, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 289.41626, "t": 364.51862, "r": 346.88757, "b": 372.84363, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "Usage setting:", "bbox": {"l": 289.41626, "t": 364.51862, "r": 346.88757, "b": 372.84363, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 289.4397, "t": 375.69394000000005, "r": 293.9397, "b": 383.62292, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 375.69394000000005, "r": 293.9397, "b": 383.62292, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 303.83969, "t": 375.55893, "r": 535.16766, "b": 383.88394, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "ALLOWED: The user profile is allowed to use the function.", "bbox": {"l": 303.83969, "t": 375.55893, "r": 535.16766, "b": 383.88394, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 289.4397, "t": 386.67395, "r": 293.9397, "b": 394.60294, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 386.67395, "r": 293.9397, "b": 394.60294, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 303.83969, "t": 386.53894, "r": 539.10712, "b": 394.86395, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "DENIED: The user profile is not allowed to use the function.", "bbox": {"l": 303.83969, "t": 386.53894, "r": 539.10712, "b": 394.86395, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 142.8, "t": 405.55865, "r": 196.2249, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "USER_TYPE", "bbox": {"l": 142.8, "t": 405.55865, "r": 196.2249, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 216.75211, "t": 405.55865, "r": 270.99872, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "VARCHAR(5)", "bbox": {"l": 216.75211, "t": 405.55865, "r": 270.99872, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 289.43161, "t": 405.55865, "r": 367.8009, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "Type of user profile:", "bbox": {"l": 289.43161, "t": 405.55865, "r": 367.8009, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 289.4397, "t": 416.67368000000005, "r": 293.9397, "b": 424.60266, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 416.67368000000005, "r": 293.9397, "b": 424.60266, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 303.83969, "t": 416.53867, "r": 434.78159, "b": 424.86368, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "USER: The user profile is a user.", "bbox": {"l": 303.83969, "t": 416.53867, "r": 434.78159, "b": 424.86368, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 289.4397, "t": 427.65369, "r": 293.9397, "b": 435.58267000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 427.65369, "r": 293.9397, "b": 435.58267000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 303.83969, "t": 427.51868, "r": 448.11963000000003, "b": 435.84369, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "GROUP: The user profile is a group.", "bbox": {"l": 303.83969, "t": 427.51868, "r": 448.11963000000003, "b": 435.84369, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl"], "num_rows": 5, "num_cols": 3, "table_cells": [{"bbox": {"l": 142.8, "t": 296.5379899999999, "r": 202.245, "b": 304.86301, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Column name", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 216.80878999999996, "t": 296.5379899999999, "r": 257.21069, "b": 304.86301, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Data type", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 289.47479, "t": 296.5379899999999, "r": 338.89468, "b": 304.86301, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Description", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 142.8, "t": 315.55771, "r": 203.2323, "b": 323.88272, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "FUNCTION_ID", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 216.7854, "t": 315.55771, "r": 276.0036, "b": 323.88272, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(30)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.4577, "t": 315.55771, "r": 359.85394, "b": 323.88272, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "ID of the function.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 142.8, "t": 334.51801, "r": 198.6693, "b": 342.84302, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "USER_NAME", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 216.74129999999997, "t": 334.51801, "r": 275.92349, "b": 342.84302, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(10)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.38208, "t": 334.51801, "r": 515.05359, "b": 353.88333, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Name of the user profile that has a usage setting for this  function.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 142.79999, "t": 364.51862, "r": 173.98318, "b": 372.84363, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "USAGE", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 216.77367999999998, "t": 364.51862, "r": 270.97977, "b": 372.84363, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(7)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.41626, "t": 364.51862, "r": 539.10712, "b": 394.86395, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Usage setting: GLYPH<SM590000> ALLOWED: The user profile is allowed to use the function. GLYPH<SM590000> DENIED: The user profile is not allowed to use the function.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 142.8, "t": 405.55865, "r": 196.2249, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "USER_TYPE", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 216.75211, "t": 405.55865, "r": 270.99872, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(5)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.43161, "t": 405.55865, "r": 448.11963000000003, "b": 435.84369, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Type of user profile: GLYPH<SM590000> USER: The user profile is a user. GLYPH<SM590000> GROUP: The user profile is a group.", "column_header": false, "row_header": false, "row_section": false}]}}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_footer", "id": 14, "page_no": 7, "cluster": {"id": 14, "label": "page_footer", "bbox": {"l": 64.800003, "t": 754.848721, "r": 78.402, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.9166396856307983, "cells": [{"id": 0, "text": "10 ", "bbox": {"l": 64.800003, "t": 754.848721, "r": 78.402, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "10"}, {"label": "page_footer", "id": 10, "page_no": 7, "cluster": {"id": 10, "label": "page_footer", "bbox": {"l": 93.420303, "t": 755.538002, "r": 334.42142, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9530044198036194, "cells": [{"id": 1, "text": "Row and Column Access Control Support in IBM DB2 for i", "bbox": {"l": 93.420303, "t": 755.538002, "r": 334.42142, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Row and Column Access Control Support in IBM DB2 for i"}, {"label": "section_header", "id": 3, "page_no": 7, "cluster": {"id": 3, "label": "section_header", "bbox": {"l": 64.800003, "t": 71.33471999999995, "r": 335.49551, "b": 83.32275000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9697521328926086, "cells": [{"id": 2, "text": "2.1.6", "bbox": {"l": 64.800003, "t": 71.33471999999995, "r": 94.081459, "b": 83.32275000000004, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Change Function Usage CL command", "bbox": {"l": 97.741661, "t": 71.33471999999995, "r": 335.49551, "b": 83.32275000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2.1.6 Change Function Usage CL command"}, {"label": "text", "id": 9, "page_no": 7, "cluster": {"id": 9, "label": "text", "bbox": {"l": 136.8, "t": 97.48870999999997, "r": 547.28442, "b": 106.70172000000014, "coord_origin": "TOPLEFT"}, "confidence": 0.9551582932472229, "cells": [{"id": 4, "text": "The following CL commands can be used to work with, display, or change function usage IDs:", "bbox": {"l": 136.8, "t": 97.48870999999997, "r": 547.28442, "b": 106.70172000000014, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The following CL commands can be used to work with, display, or change function usage IDs:"}, {"label": "list_item", "id": 12, "page_no": 7, "cluster": {"id": 12, "label": "list_item", "bbox": {"l": 136.8, "t": 114.52826000000005, "r": 301.51749, "b": 123.74126999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9410832524299622, "cells": [{"id": 5, "text": "GLYPH<SM590000>", "bbox": {"l": 136.8, "t": 114.67767000000003, "r": 141.78, "b": 123.45245, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Work Function Usage (", "bbox": {"l": 151.20016, "t": 114.52826000000005, "r": 253.26227000000003, "b": 123.74126999999999, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "WRKFCNUSG", "bbox": {"l": 253.26028, "t": 114.67767000000003, "r": 298.1998, "b": 123.50225999999998, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": ")", "bbox": {"l": 298.20081, "t": 114.52826000000005, "r": 301.51749, "b": 123.74126999999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<SM590000> Work Function Usage ( WRKFCNUSG )"}, {"label": "list_item", "id": 11, "page_no": 7, "cluster": {"id": 11, "label": "list_item", "bbox": {"l": 136.80099, "t": 126.52808000000005, "r": 313.39777, "b": 135.74108999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9418092370033264, "cells": [{"id": 9, "text": "GLYPH<SM590000>", "bbox": {"l": 136.80099, "t": 126.67749000000003, "r": 141.78099, "b": 135.45227, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Change Function Usage (", "bbox": {"l": 151.20116, "t": 126.52808000000005, "r": 265.13354, "b": 135.74108999999999, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "CHGFCNUSG", "bbox": {"l": 265.08081, "t": 126.67749000000003, "r": 310.02032, "b": 135.50207999999998, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": ")", "bbox": {"l": 310.08109, "t": 126.52808000000005, "r": 313.39777, "b": 135.74108999999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<SM590000> Change Function Usage ( CHGFCNUSG )"}, {"label": "list_item", "id": 8, "page_no": 7, "cluster": {"id": 8, "label": "list_item", "bbox": {"l": 136.80098, "t": 138.52788999999996, "r": 310.81711, "b": 147.74090999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9562349915504456, "cells": [{"id": 13, "text": "GLYPH<SM590000>", "bbox": {"l": 136.80098, "t": 138.67731000000003, "r": 141.78098, "b": 147.45209, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Display Function Usage (", "bbox": {"l": 151.20114, "t": 138.52788999999996, "r": 262.5639, "b": 147.74090999999999, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "DSPFCNUSG", "bbox": {"l": 262.56091, "t": 138.67731000000003, "r": 307.50043, "b": 147.50189, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": ")", "bbox": {"l": 307.50043, "t": 138.52788999999996, "r": 310.81711, "b": 147.74090999999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<SM590000> Display Function Usage ( DSPFCNUSG )"}, {"label": "text", "id": 4, "page_no": 7, "cluster": {"id": 4, "label": "text", "bbox": {"l": 136.79997, "t": 160.48766999999998, "r": 512.53802, "b": 181.70050000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9682500958442688, "cells": [{"id": 17, "text": "For example, the following ", "bbox": {"l": 136.79997, "t": 160.48766999999998, "r": 255.09984000000003, "b": 169.70068000000003, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "CHGFCNUSG", "bbox": {"l": 255.00027, "t": 160.63707999999997, "r": 299.99957, "b": 169.46167000000003, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": " command shows granting authorization to user ", "bbox": {"l": 300.00055, "t": 160.48766999999998, "r": 512.53802, "b": 169.70068000000003, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "HBEDOYA to administer and manage RCAC rules:", "bbox": {"l": 136.80096, "t": 172.48748999999998, "r": 360.41989, "b": 181.70050000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "For example, the following CHGFCNUSG command shows granting authorization to user HBEDOYA to administer and manage RCAC rules:"}, {"label": "text", "id": 15, "page_no": 7, "cluster": {"id": 15, "label": "text", "bbox": {"l": 136.80096, "t": 189.67645000000005, "r": 441.59686, "b": 198.45123, "coord_origin": "TOPLEFT"}, "confidence": 0.905712902545929, "cells": [{"id": 21, "text": "CHGFCNUSG FCNID(QIBM_DB_SECADM) USER(HBEDOYA) USAGE(*ALLOWED)", "bbox": {"l": 136.80096, "t": 189.67645000000005, "r": 441.59686, "b": 198.45123, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "CHGFCNUSG FCNID(QIBM_DB_SECADM) USER(HBEDOYA) USAGE(*ALLOWED)"}, {"label": "section_header", "id": 7, "page_no": 7, "cluster": {"id": 7, "label": "section_header", "bbox": {"l": 64.800003, "t": 219.35468000000003, "r": 544.47546, "b": 231.34271, "coord_origin": "TOPLEFT"}, "confidence": 0.9636710286140442, "cells": [{"id": 22, "text": "2.1.7", "bbox": {"l": 64.800003, "t": 219.35468000000003, "r": 93.757614, "b": 231.34271, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Verifying function usage IDs for RCAC with the FUNCTION_USAGE view", "bbox": {"l": 97.377296, "t": 219.35468000000003, "r": 544.47546, "b": 231.34271, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2.1.7 Verifying function usage IDs for RCAC with the FUNCTION_USAGE view"}, {"label": "text", "id": 2, "page_no": 7, "cluster": {"id": 2, "label": "text", "bbox": {"l": 136.8, "t": 245.50867000000005, "r": 519.51794, "b": 266.7215, "coord_origin": "TOPLEFT"}, "confidence": 0.9737311601638794, "cells": [{"id": 24, "text": "The FUNCTION_USAGE view contains function usage configuration details. Table 2-1 ", "bbox": {"l": 136.8, "t": 245.50867000000005, "r": 519.51794, "b": 254.72168, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "describes the columns in the FUNCTION_USAGE view.", "bbox": {"l": 136.8, "t": 257.50847999999996, "r": 382.94443, "b": 266.7215, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The FUNCTION_USAGE view contains function usage configuration details. Table 2-1 describes the columns in the FUNCTION_USAGE view."}, {"label": "caption", "id": 13, "page_no": 7, "cluster": {"id": 13, "label": "caption", "bbox": {"l": 136.8, "t": 279.55798000000004, "r": 283.96805, "b": 287.88300000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9196999669075012, "cells": [{"id": 26, "text": "Table 2-1 FUNCTION_USAGE view", "bbox": {"l": 136.8, "t": 279.55798000000004, "r": 283.96805, "b": 287.88300000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 2-1 FUNCTION_USAGE view"}, {"label": "text", "id": 6, "page_no": 7, "cluster": {"id": 6, "label": "text", "bbox": {"l": 136.8, "t": 452.50872999999996, "r": 547.2804, "b": 473.72153, "coord_origin": "TOPLEFT"}, "confidence": 0.964775562286377, "cells": [{"id": 27, "text": "To discover who has authorization to define and manage RCAC, you can use the query that is ", "bbox": {"l": 136.8, "t": 452.50872999999996, "r": 547.2804, "b": 461.72171, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "shown in Example 2-1.", "bbox": {"l": 136.8, "t": 464.50854, "r": 237.76951999999997, "b": 473.72153, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "To discover who has authorization to define and manage RCAC, you can use the query that is shown in Example 2-1."}, {"label": "caption", "id": 16, "page_no": 7, "cluster": {"id": 16, "label": "caption", "bbox": {"l": 136.8, "t": 486.55798, "r": 462.35419, "b": 494.883, "coord_origin": "TOPLEFT"}, "confidence": 0.8159958720207214, "cells": [{"id": 29, "text": "Example 2-1 Query to determine who has authority to define and manage RCAC", "bbox": {"l": 136.8, "t": 486.55798, "r": 462.35419, "b": 494.883, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Example 2-1 Query to determine who has authority to define and manage RCAC"}, {"label": "key_value_region", "id": 18, "page_no": 7, "cluster": {"id": 18, "label": "key_value_region", "bbox": {"l": 136.8, "t": 503.65802, "r": 331.67731, "b": 584.43163, "coord_origin": "TOPLEFT"}, "confidence": 0.5808265805244446, "cells": [{"id": 30, "text": "SELECT", "bbox": {"l": 136.8, "t": 503.65802, "r": 171.26956, "b": 512.4328, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "function_id,", "bbox": {"l": 182.75941, "t": 503.65802, "r": 251.69853, "b": 512.4328, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "user_name,", "bbox": {"l": 166.78244, "t": 515.6578400000001, "r": 241.73852999999997, "b": 524.43262, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "usage,", "bbox": {"l": 170.75961, "t": 527.65765, "r": 221.69901999999996, "b": 536.43242, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "user_type", "bbox": {"l": 167.53809, "t": 539.65747, "r": 236.69878, "b": 548.43222, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "FROM", "bbox": {"l": 136.8, "t": 551.65727, "r": 160.59396, "b": 560.43202, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "function_usage", "bbox": {"l": 178.43944, "t": 551.65727, "r": 261.71829, "b": 560.43202, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "WHERE", "bbox": {"l": 136.8, "t": 563.65707, "r": 162.44176, "b": 572.43182, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "function_id=\u2019QIBM_DB_SECADM\u2019", "bbox": {"l": 177.8268, "t": 563.65707, "r": 331.67731, "b": 572.43182, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "ORDER BY", "bbox": {"l": 136.8, "t": 575.65688, "r": 178.77542, "b": 584.43163, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "user_name;", "bbox": {"l": 189.26929, "t": 575.65688, "r": 241.73856, "b": 584.43163, "coord_origin": "TOPLEFT"}}], "children": [{"id": 19, "label": "text", "bbox": {"l": 136.8, "t": 503.65802, "r": 171.26956, "b": 512.4328, "coord_origin": "TOPLEFT"}, "confidence": 0.5631121397018433, "cells": [{"id": 30, "text": "SELECT", "bbox": {"l": 136.8, "t": 503.65802, "r": 171.26956, "b": 512.4328, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 182.75941, "t": 503.65802, "r": 251.69853, "b": 512.4328, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "function_id,", "bbox": {"l": 182.75941, "t": 503.65802, "r": 251.69853, "b": 512.4328, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 166.78244, "t": 515.6578400000001, "r": 241.73852999999997, "b": 524.43262, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "user_name,", "bbox": {"l": 166.78244, "t": 515.6578400000001, "r": 241.73852999999997, "b": 524.43262, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 170.75961, "t": 527.65765, "r": 221.69901999999996, "b": 536.43242, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "usage,", "bbox": {"l": 170.75961, "t": 527.65765, "r": 221.69901999999996, "b": 536.43242, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 167.53809, "t": 539.65747, "r": 236.69878, "b": 548.43222, "coord_origin": "TOPLEFT"}, "confidence": 0.5346826314926147, "cells": [{"id": 34, "text": "user_type", "bbox": {"l": 167.53809, "t": 539.65747, "r": 236.69878, "b": 548.43222, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 136.8, "t": 551.65727, "r": 160.59396, "b": 560.43202, "coord_origin": "TOPLEFT"}, "confidence": 0.581838846206665, "cells": [{"id": 35, "text": "FROM", "bbox": {"l": 136.8, "t": 551.65727, "r": 160.59396, "b": 560.43202, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 178.43944, "t": 551.65727, "r": 261.71829, "b": 560.43202, "coord_origin": "TOPLEFT"}, "confidence": 0.5035740733146667, "cells": [{"id": 36, "text": "function_usage", "bbox": {"l": 178.43944, "t": 551.65727, "r": 261.71829, "b": 560.43202, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 136.8, "t": 563.65707, "r": 162.44176, "b": 572.43182, "coord_origin": "TOPLEFT"}, "confidence": 0.534027099609375, "cells": [{"id": 37, "text": "WHERE", "bbox": {"l": 136.8, "t": 563.65707, "r": 162.44176, "b": 572.43182, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 177.8268, "t": 563.65707, "r": 331.67731, "b": 572.43182, "coord_origin": "TOPLEFT"}, "confidence": 0.5171723365783691, "cells": [{"id": 38, "text": "function_id=\u2019QIBM_DB_SECADM\u2019", "bbox": {"l": 177.8268, "t": 563.65707, "r": 331.67731, "b": 572.43182, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 136.8, "t": 575.65688, "r": 178.77542, "b": 584.43163, "coord_origin": "TOPLEFT"}, "confidence": 0.5373470187187195, "cells": [{"id": 39, "text": "ORDER BY", "bbox": {"l": 136.8, "t": 575.65688, "r": 178.77542, "b": 584.43163, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 189.26929, "t": 575.65688, "r": 241.73856, "b": 584.43163, "coord_origin": "TOPLEFT"}, "confidence": 0.5167025327682495, "cells": [{"id": 40, "text": "user_name;", "bbox": {"l": 189.26929, "t": 575.65688, "r": 241.73856, "b": 584.43163, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null}, {"label": "section_header", "id": 5, "page_no": 7, "cluster": {"id": 5, "label": "section_header", "bbox": {"l": 64.800003, "t": 620.22063, "r": 249.59605000000002, "b": 634.98363, "coord_origin": "TOPLEFT"}, "confidence": 0.9656105041503906, "cells": [{"id": 41, "text": "2.2", "bbox": {"l": 64.800003, "t": 620.22063, "r": 87.569839, "b": 634.98363, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "Separation of duties", "bbox": {"l": 92.123802, "t": 620.22063, "r": 249.59605000000002, "b": 634.98363, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2.2 Separation of duties"}, {"label": "text", "id": 0, "page_no": 7, "cluster": {"id": 0, "label": "text", "bbox": {"l": 136.8, "t": 652.54872, "r": 547.22345, "b": 709.760956, "coord_origin": "TOPLEFT"}, "confidence": 0.9853070974349976, "cells": [{"id": 43, "text": "Separation of duties helps businesses comply with industry regulations or organizational ", "bbox": {"l": 136.8, "t": 652.54872, "r": 529.09357, "b": 661.76172, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "requirements and simplifies the management of authorities. Separation of duties is commonly ", "bbox": {"l": 136.8, "t": 664.54852, "r": 547.22345, "b": 673.76153, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "used to prevent fraudulent activities or errors by a single person. It provides the ability for ", "bbox": {"l": 136.8, "t": 676.54833, "r": 530.89716, "b": 685.76134, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "administrative functions to be divided across individuals without overlapping responsibilities, ", "bbox": {"l": 136.80002, "t": 688.54814, "r": 544.33832, "b": 697.7611469999999, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "so that one user does not possess unlimited authority, such as with the *ALLOBJ authority.", "bbox": {"l": 136.80002, "t": 700.547951, "r": 536.28363, "b": 709.760956, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Separation of duties helps businesses comply with industry regulations or organizational requirements and simplifies the management of authorities. Separation of duties is commonly used to prevent fraudulent activities or errors by a single person. It provides the ability for administrative functions to be divided across individuals without overlapping responsibilities, so that one user does not possess unlimited authority, such as with the *ALLOBJ authority."}, {"label": "table", "id": 1, "page_no": 7, "cluster": {"id": 1, "label": "table", "bbox": {"l": 135.52462768554688, "t": 289.7252197265625, "r": 545.8714599609375, "b": 442.050537109375, "coord_origin": "TOPLEFT"}, "confidence": 0.9851690530776978, "cells": [{"id": 48, "text": "Column name", "bbox": {"l": 142.8, "t": 296.5379899999999, "r": 202.245, "b": 304.86301, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "Data type", "bbox": {"l": 216.80878999999996, "t": 296.5379899999999, "r": 257.21069, "b": 304.86301, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Description", "bbox": {"l": 289.47479, "t": 296.5379899999999, "r": 338.89468, "b": 304.86301, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "FUNCTION_ID", "bbox": {"l": 142.8, "t": 315.55771, "r": 203.2323, "b": 323.88272, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "VARCHAR(30)", "bbox": {"l": 216.7854, "t": 315.55771, "r": 276.0036, "b": 323.88272, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "ID of the function.", "bbox": {"l": 289.4577, "t": 315.55771, "r": 359.85394, "b": 323.88272, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "USER_NAME", "bbox": {"l": 142.8, "t": 334.51801, "r": 198.6693, "b": 342.84302, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "VARCHAR(10)", "bbox": {"l": 216.74129999999997, "t": 334.51801, "r": 275.92349, "b": 342.84302, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Name of the user profile that has a usage setting for this ", "bbox": {"l": 289.38208, "t": 334.51801, "r": 515.05359, "b": 342.84302, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "function.", "bbox": {"l": 289.4397, "t": 345.55832, "r": 323.43362, "b": 353.88333, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "USAGE", "bbox": {"l": 142.79999, "t": 364.51862, "r": 173.98318, "b": 372.84363, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "VARCHAR(7)", "bbox": {"l": 216.77367999999998, "t": 364.51862, "r": 270.97977, "b": 372.84363, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Usage setting:", "bbox": {"l": 289.41626, "t": 364.51862, "r": 346.88757, "b": 372.84363, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 375.69394000000005, "r": 293.9397, "b": 383.62292, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "ALLOWED: The user profile is allowed to use the function.", "bbox": {"l": 303.83969, "t": 375.55893, "r": 535.16766, "b": 383.88394, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 386.67395, "r": 293.9397, "b": 394.60294, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "DENIED: The user profile is not allowed to use the function.", "bbox": {"l": 303.83969, "t": 386.53894, "r": 539.10712, "b": 394.86395, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "USER_TYPE", "bbox": {"l": 142.8, "t": 405.55865, "r": 196.2249, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "VARCHAR(5)", "bbox": {"l": 216.75211, "t": 405.55865, "r": 270.99872, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "Type of user profile:", "bbox": {"l": 289.43161, "t": 405.55865, "r": 367.8009, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 416.67368000000005, "r": 293.9397, "b": 424.60266, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "USER: The user profile is a user.", "bbox": {"l": 303.83969, "t": 416.53867, "r": 434.78159, "b": 424.86368, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 427.65369, "r": 293.9397, "b": 435.58267000000006, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "GROUP: The user profile is a group.", "bbox": {"l": 303.83969, "t": 427.51868, "r": 448.11963000000003, "b": 435.84369, "coord_origin": "TOPLEFT"}}], "children": [{"id": 31, "label": "text", "bbox": {"l": 142.8, "t": 296.5379899999999, "r": 202.245, "b": 304.86301, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "Column name", "bbox": {"l": 142.8, "t": 296.5379899999999, "r": 202.245, "b": 304.86301, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 216.80878999999996, "t": 296.5379899999999, "r": 257.21069, "b": 304.86301, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "Data type", "bbox": {"l": 216.80878999999996, "t": 296.5379899999999, "r": 257.21069, "b": 304.86301, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 289.47479, "t": 296.5379899999999, "r": 338.89468, "b": 304.86301, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "Description", "bbox": {"l": 289.47479, "t": 296.5379899999999, "r": 338.89468, "b": 304.86301, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 142.8, "t": 315.55771, "r": 203.2323, "b": 323.88272, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "FUNCTION_ID", "bbox": {"l": 142.8, "t": 315.55771, "r": 203.2323, "b": 323.88272, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 216.7854, "t": 315.55771, "r": 276.0036, "b": 323.88272, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "VARCHAR(30)", "bbox": {"l": 216.7854, "t": 315.55771, "r": 276.0036, "b": 323.88272, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 289.4577, "t": 315.55771, "r": 359.85394, "b": 323.88272, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "ID of the function.", "bbox": {"l": 289.4577, "t": 315.55771, "r": 359.85394, "b": 323.88272, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 142.8, "t": 334.51801, "r": 198.6693, "b": 342.84302, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "USER_NAME", "bbox": {"l": 142.8, "t": 334.51801, "r": 198.6693, "b": 342.84302, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 216.74129999999997, "t": 334.51801, "r": 275.92349, "b": 342.84302, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "VARCHAR(10)", "bbox": {"l": 216.74129999999997, "t": 334.51801, "r": 275.92349, "b": 342.84302, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 289.38208, "t": 334.51801, "r": 515.05359, "b": 342.84302, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "Name of the user profile that has a usage setting for this ", "bbox": {"l": 289.38208, "t": 334.51801, "r": 515.05359, "b": 342.84302, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 289.4397, "t": 345.55832, "r": 323.43362, "b": 353.88333, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "function.", "bbox": {"l": 289.4397, "t": 345.55832, "r": 323.43362, "b": 353.88333, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 142.79999, "t": 364.51862, "r": 173.98318, "b": 372.84363, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "USAGE", "bbox": {"l": 142.79999, "t": 364.51862, "r": 173.98318, "b": 372.84363, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 216.77367999999998, "t": 364.51862, "r": 270.97977, "b": 372.84363, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "VARCHAR(7)", "bbox": {"l": 216.77367999999998, "t": 364.51862, "r": 270.97977, "b": 372.84363, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 289.41626, "t": 364.51862, "r": 346.88757, "b": 372.84363, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "Usage setting:", "bbox": {"l": 289.41626, "t": 364.51862, "r": 346.88757, "b": 372.84363, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 289.4397, "t": 375.69394000000005, "r": 293.9397, "b": 383.62292, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 375.69394000000005, "r": 293.9397, "b": 383.62292, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 303.83969, "t": 375.55893, "r": 535.16766, "b": 383.88394, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "ALLOWED: The user profile is allowed to use the function.", "bbox": {"l": 303.83969, "t": 375.55893, "r": 535.16766, "b": 383.88394, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 289.4397, "t": 386.67395, "r": 293.9397, "b": 394.60294, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 386.67395, "r": 293.9397, "b": 394.60294, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 303.83969, "t": 386.53894, "r": 539.10712, "b": 394.86395, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "DENIED: The user profile is not allowed to use the function.", "bbox": {"l": 303.83969, "t": 386.53894, "r": 539.10712, "b": 394.86395, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 142.8, "t": 405.55865, "r": 196.2249, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "USER_TYPE", "bbox": {"l": 142.8, "t": 405.55865, "r": 196.2249, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 216.75211, "t": 405.55865, "r": 270.99872, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "VARCHAR(5)", "bbox": {"l": 216.75211, "t": 405.55865, "r": 270.99872, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 289.43161, "t": 405.55865, "r": 367.8009, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "Type of user profile:", "bbox": {"l": 289.43161, "t": 405.55865, "r": 367.8009, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 289.4397, "t": 416.67368000000005, "r": 293.9397, "b": 424.60266, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 416.67368000000005, "r": 293.9397, "b": 424.60266, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 303.83969, "t": 416.53867, "r": 434.78159, "b": 424.86368, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "USER: The user profile is a user.", "bbox": {"l": 303.83969, "t": 416.53867, "r": 434.78159, "b": 424.86368, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 289.4397, "t": 427.65369, "r": 293.9397, "b": 435.58267000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 427.65369, "r": 293.9397, "b": 435.58267000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 303.83969, "t": 427.51868, "r": 448.11963000000003, "b": 435.84369, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "GROUP: The user profile is a group.", "bbox": {"l": 303.83969, "t": 427.51868, "r": 448.11963000000003, "b": 435.84369, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl"], "num_rows": 5, "num_cols": 3, "table_cells": [{"bbox": {"l": 142.8, "t": 296.5379899999999, "r": 202.245, "b": 304.86301, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Column name", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 216.80878999999996, "t": 296.5379899999999, "r": 257.21069, "b": 304.86301, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Data type", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 289.47479, "t": 296.5379899999999, "r": 338.89468, "b": 304.86301, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Description", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 142.8, "t": 315.55771, "r": 203.2323, "b": 323.88272, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "FUNCTION_ID", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 216.7854, "t": 315.55771, "r": 276.0036, "b": 323.88272, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(30)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.4577, "t": 315.55771, "r": 359.85394, "b": 323.88272, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "ID of the function.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 142.8, "t": 334.51801, "r": 198.6693, "b": 342.84302, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "USER_NAME", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 216.74129999999997, "t": 334.51801, "r": 275.92349, "b": 342.84302, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(10)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.38208, "t": 334.51801, "r": 515.05359, "b": 353.88333, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Name of the user profile that has a usage setting for this  function.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 142.79999, "t": 364.51862, "r": 173.98318, "b": 372.84363, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "USAGE", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 216.77367999999998, "t": 364.51862, "r": 270.97977, "b": 372.84363, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(7)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.41626, "t": 364.51862, "r": 539.10712, "b": 394.86395, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Usage setting: GLYPH<SM590000> ALLOWED: The user profile is allowed to use the function. GLYPH<SM590000> DENIED: The user profile is not allowed to use the function.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 142.8, "t": 405.55865, "r": 196.2249, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "USER_TYPE", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 216.75211, "t": 405.55865, "r": 270.99872, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(5)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.43161, "t": 405.55865, "r": 448.11963000000003, "b": 435.84369, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Type of user profile: GLYPH<SM590000> USER: The user profile is a user. GLYPH<SM590000> GROUP: The user profile is a group.", "column_header": false, "row_header": false, "row_section": false}]}], "body": [{"label": "section_header", "id": 3, "page_no": 7, "cluster": {"id": 3, "label": "section_header", "bbox": {"l": 64.800003, "t": 71.33471999999995, "r": 335.49551, "b": 83.32275000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9697521328926086, "cells": [{"id": 2, "text": "2.1.6", "bbox": {"l": 64.800003, "t": 71.33471999999995, "r": 94.081459, "b": 83.32275000000004, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Change Function Usage CL command", "bbox": {"l": 97.741661, "t": 71.33471999999995, "r": 335.49551, "b": 83.32275000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2.1.6 Change Function Usage CL command"}, {"label": "text", "id": 9, "page_no": 7, "cluster": {"id": 9, "label": "text", "bbox": {"l": 136.8, "t": 97.48870999999997, "r": 547.28442, "b": 106.70172000000014, "coord_origin": "TOPLEFT"}, "confidence": 0.9551582932472229, "cells": [{"id": 4, "text": "The following CL commands can be used to work with, display, or change function usage IDs:", "bbox": {"l": 136.8, "t": 97.48870999999997, "r": 547.28442, "b": 106.70172000000014, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The following CL commands can be used to work with, display, or change function usage IDs:"}, {"label": "list_item", "id": 12, "page_no": 7, "cluster": {"id": 12, "label": "list_item", "bbox": {"l": 136.8, "t": 114.52826000000005, "r": 301.51749, "b": 123.74126999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9410832524299622, "cells": [{"id": 5, "text": "GLYPH<SM590000>", "bbox": {"l": 136.8, "t": 114.67767000000003, "r": 141.78, "b": 123.45245, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Work Function Usage (", "bbox": {"l": 151.20016, "t": 114.52826000000005, "r": 253.26227000000003, "b": 123.74126999999999, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "WRKFCNUSG", "bbox": {"l": 253.26028, "t": 114.67767000000003, "r": 298.1998, "b": 123.50225999999998, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": ")", "bbox": {"l": 298.20081, "t": 114.52826000000005, "r": 301.51749, "b": 123.74126999999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<SM590000> Work Function Usage ( WRKFCNUSG )"}, {"label": "list_item", "id": 11, "page_no": 7, "cluster": {"id": 11, "label": "list_item", "bbox": {"l": 136.80099, "t": 126.52808000000005, "r": 313.39777, "b": 135.74108999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9418092370033264, "cells": [{"id": 9, "text": "GLYPH<SM590000>", "bbox": {"l": 136.80099, "t": 126.67749000000003, "r": 141.78099, "b": 135.45227, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Change Function Usage (", "bbox": {"l": 151.20116, "t": 126.52808000000005, "r": 265.13354, "b": 135.74108999999999, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "CHGFCNUSG", "bbox": {"l": 265.08081, "t": 126.67749000000003, "r": 310.02032, "b": 135.50207999999998, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": ")", "bbox": {"l": 310.08109, "t": 126.52808000000005, "r": 313.39777, "b": 135.74108999999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<SM590000> Change Function Usage ( CHGFCNUSG )"}, {"label": "list_item", "id": 8, "page_no": 7, "cluster": {"id": 8, "label": "list_item", "bbox": {"l": 136.80098, "t": 138.52788999999996, "r": 310.81711, "b": 147.74090999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9562349915504456, "cells": [{"id": 13, "text": "GLYPH<SM590000>", "bbox": {"l": 136.80098, "t": 138.67731000000003, "r": 141.78098, "b": 147.45209, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Display Function Usage (", "bbox": {"l": 151.20114, "t": 138.52788999999996, "r": 262.5639, "b": 147.74090999999999, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "DSPFCNUSG", "bbox": {"l": 262.56091, "t": 138.67731000000003, "r": 307.50043, "b": 147.50189, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": ")", "bbox": {"l": 307.50043, "t": 138.52788999999996, "r": 310.81711, "b": 147.74090999999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<SM590000> Display Function Usage ( DSPFCNUSG )"}, {"label": "text", "id": 4, "page_no": 7, "cluster": {"id": 4, "label": "text", "bbox": {"l": 136.79997, "t": 160.48766999999998, "r": 512.53802, "b": 181.70050000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9682500958442688, "cells": [{"id": 17, "text": "For example, the following ", "bbox": {"l": 136.79997, "t": 160.48766999999998, "r": 255.09984000000003, "b": 169.70068000000003, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "CHGFCNUSG", "bbox": {"l": 255.00027, "t": 160.63707999999997, "r": 299.99957, "b": 169.46167000000003, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": " command shows granting authorization to user ", "bbox": {"l": 300.00055, "t": 160.48766999999998, "r": 512.53802, "b": 169.70068000000003, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "HBEDOYA to administer and manage RCAC rules:", "bbox": {"l": 136.80096, "t": 172.48748999999998, "r": 360.41989, "b": 181.70050000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "For example, the following CHGFCNUSG command shows granting authorization to user HBEDOYA to administer and manage RCAC rules:"}, {"label": "text", "id": 15, "page_no": 7, "cluster": {"id": 15, "label": "text", "bbox": {"l": 136.80096, "t": 189.67645000000005, "r": 441.59686, "b": 198.45123, "coord_origin": "TOPLEFT"}, "confidence": 0.905712902545929, "cells": [{"id": 21, "text": "CHGFCNUSG FCNID(QIBM_DB_SECADM) USER(HBEDOYA) USAGE(*ALLOWED)", "bbox": {"l": 136.80096, "t": 189.67645000000005, "r": 441.59686, "b": 198.45123, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "CHGFCNUSG FCNID(QIBM_DB_SECADM) USER(HBEDOYA) USAGE(*ALLOWED)"}, {"label": "section_header", "id": 7, "page_no": 7, "cluster": {"id": 7, "label": "section_header", "bbox": {"l": 64.800003, "t": 219.35468000000003, "r": 544.47546, "b": 231.34271, "coord_origin": "TOPLEFT"}, "confidence": 0.9636710286140442, "cells": [{"id": 22, "text": "2.1.7", "bbox": {"l": 64.800003, "t": 219.35468000000003, "r": 93.757614, "b": 231.34271, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Verifying function usage IDs for RCAC with the FUNCTION_USAGE view", "bbox": {"l": 97.377296, "t": 219.35468000000003, "r": 544.47546, "b": 231.34271, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2.1.7 Verifying function usage IDs for RCAC with the FUNCTION_USAGE view"}, {"label": "text", "id": 2, "page_no": 7, "cluster": {"id": 2, "label": "text", "bbox": {"l": 136.8, "t": 245.50867000000005, "r": 519.51794, "b": 266.7215, "coord_origin": "TOPLEFT"}, "confidence": 0.9737311601638794, "cells": [{"id": 24, "text": "The FUNCTION_USAGE view contains function usage configuration details. Table 2-1 ", "bbox": {"l": 136.8, "t": 245.50867000000005, "r": 519.51794, "b": 254.72168, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "describes the columns in the FUNCTION_USAGE view.", "bbox": {"l": 136.8, "t": 257.50847999999996, "r": 382.94443, "b": 266.7215, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The FUNCTION_USAGE view contains function usage configuration details. Table 2-1 describes the columns in the FUNCTION_USAGE view."}, {"label": "caption", "id": 13, "page_no": 7, "cluster": {"id": 13, "label": "caption", "bbox": {"l": 136.8, "t": 279.55798000000004, "r": 283.96805, "b": 287.88300000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.9196999669075012, "cells": [{"id": 26, "text": "Table 2-1 FUNCTION_USAGE view", "bbox": {"l": 136.8, "t": 279.55798000000004, "r": 283.96805, "b": 287.88300000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 2-1 FUNCTION_USAGE view"}, {"label": "text", "id": 6, "page_no": 7, "cluster": {"id": 6, "label": "text", "bbox": {"l": 136.8, "t": 452.50872999999996, "r": 547.2804, "b": 473.72153, "coord_origin": "TOPLEFT"}, "confidence": 0.964775562286377, "cells": [{"id": 27, "text": "To discover who has authorization to define and manage RCAC, you can use the query that is ", "bbox": {"l": 136.8, "t": 452.50872999999996, "r": 547.2804, "b": 461.72171, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "shown in Example 2-1.", "bbox": {"l": 136.8, "t": 464.50854, "r": 237.76951999999997, "b": 473.72153, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "To discover who has authorization to define and manage RCAC, you can use the query that is shown in Example 2-1."}, {"label": "caption", "id": 16, "page_no": 7, "cluster": {"id": 16, "label": "caption", "bbox": {"l": 136.8, "t": 486.55798, "r": 462.35419, "b": 494.883, "coord_origin": "TOPLEFT"}, "confidence": 0.8159958720207214, "cells": [{"id": 29, "text": "Example 2-1 Query to determine who has authority to define and manage RCAC", "bbox": {"l": 136.8, "t": 486.55798, "r": 462.35419, "b": 494.883, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Example 2-1 Query to determine who has authority to define and manage RCAC"}, {"label": "key_value_region", "id": 18, "page_no": 7, "cluster": {"id": 18, "label": "key_value_region", "bbox": {"l": 136.8, "t": 503.65802, "r": 331.67731, "b": 584.43163, "coord_origin": "TOPLEFT"}, "confidence": 0.5808265805244446, "cells": [{"id": 30, "text": "SELECT", "bbox": {"l": 136.8, "t": 503.65802, "r": 171.26956, "b": 512.4328, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "function_id,", "bbox": {"l": 182.75941, "t": 503.65802, "r": 251.69853, "b": 512.4328, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "user_name,", "bbox": {"l": 166.78244, "t": 515.6578400000001, "r": 241.73852999999997, "b": 524.43262, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "usage,", "bbox": {"l": 170.75961, "t": 527.65765, "r": 221.69901999999996, "b": 536.43242, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "user_type", "bbox": {"l": 167.53809, "t": 539.65747, "r": 236.69878, "b": 548.43222, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "FROM", "bbox": {"l": 136.8, "t": 551.65727, "r": 160.59396, "b": 560.43202, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "function_usage", "bbox": {"l": 178.43944, "t": 551.65727, "r": 261.71829, "b": 560.43202, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "WHERE", "bbox": {"l": 136.8, "t": 563.65707, "r": 162.44176, "b": 572.43182, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "function_id=\u2019QIBM_DB_SECADM\u2019", "bbox": {"l": 177.8268, "t": 563.65707, "r": 331.67731, "b": 572.43182, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "ORDER BY", "bbox": {"l": 136.8, "t": 575.65688, "r": 178.77542, "b": 584.43163, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "user_name;", "bbox": {"l": 189.26929, "t": 575.65688, "r": 241.73856, "b": 584.43163, "coord_origin": "TOPLEFT"}}], "children": [{"id": 19, "label": "text", "bbox": {"l": 136.8, "t": 503.65802, "r": 171.26956, "b": 512.4328, "coord_origin": "TOPLEFT"}, "confidence": 0.5631121397018433, "cells": [{"id": 30, "text": "SELECT", "bbox": {"l": 136.8, "t": 503.65802, "r": 171.26956, "b": 512.4328, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 182.75941, "t": 503.65802, "r": 251.69853, "b": 512.4328, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "function_id,", "bbox": {"l": 182.75941, "t": 503.65802, "r": 251.69853, "b": 512.4328, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 166.78244, "t": 515.6578400000001, "r": 241.73852999999997, "b": 524.43262, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "user_name,", "bbox": {"l": 166.78244, "t": 515.6578400000001, "r": 241.73852999999997, "b": 524.43262, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 170.75961, "t": 527.65765, "r": 221.69901999999996, "b": 536.43242, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "usage,", "bbox": {"l": 170.75961, "t": 527.65765, "r": 221.69901999999996, "b": 536.43242, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 167.53809, "t": 539.65747, "r": 236.69878, "b": 548.43222, "coord_origin": "TOPLEFT"}, "confidence": 0.5346826314926147, "cells": [{"id": 34, "text": "user_type", "bbox": {"l": 167.53809, "t": 539.65747, "r": 236.69878, "b": 548.43222, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 136.8, "t": 551.65727, "r": 160.59396, "b": 560.43202, "coord_origin": "TOPLEFT"}, "confidence": 0.581838846206665, "cells": [{"id": 35, "text": "FROM", "bbox": {"l": 136.8, "t": 551.65727, "r": 160.59396, "b": 560.43202, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 178.43944, "t": 551.65727, "r": 261.71829, "b": 560.43202, "coord_origin": "TOPLEFT"}, "confidence": 0.5035740733146667, "cells": [{"id": 36, "text": "function_usage", "bbox": {"l": 178.43944, "t": 551.65727, "r": 261.71829, "b": 560.43202, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 136.8, "t": 563.65707, "r": 162.44176, "b": 572.43182, "coord_origin": "TOPLEFT"}, "confidence": 0.534027099609375, "cells": [{"id": 37, "text": "WHERE", "bbox": {"l": 136.8, "t": 563.65707, "r": 162.44176, "b": 572.43182, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 177.8268, "t": 563.65707, "r": 331.67731, "b": 572.43182, "coord_origin": "TOPLEFT"}, "confidence": 0.5171723365783691, "cells": [{"id": 38, "text": "function_id=\u2019QIBM_DB_SECADM\u2019", "bbox": {"l": 177.8268, "t": 563.65707, "r": 331.67731, "b": 572.43182, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 136.8, "t": 575.65688, "r": 178.77542, "b": 584.43163, "coord_origin": "TOPLEFT"}, "confidence": 0.5373470187187195, "cells": [{"id": 39, "text": "ORDER BY", "bbox": {"l": 136.8, "t": 575.65688, "r": 178.77542, "b": 584.43163, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 189.26929, "t": 575.65688, "r": 241.73856, "b": 584.43163, "coord_origin": "TOPLEFT"}, "confidence": 0.5167025327682495, "cells": [{"id": 40, "text": "user_name;", "bbox": {"l": 189.26929, "t": 575.65688, "r": 241.73856, "b": 584.43163, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null}, {"label": "section_header", "id": 5, "page_no": 7, "cluster": {"id": 5, "label": "section_header", "bbox": {"l": 64.800003, "t": 620.22063, "r": 249.59605000000002, "b": 634.98363, "coord_origin": "TOPLEFT"}, "confidence": 0.9656105041503906, "cells": [{"id": 41, "text": "2.2", "bbox": {"l": 64.800003, "t": 620.22063, "r": 87.569839, "b": 634.98363, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "Separation of duties", "bbox": {"l": 92.123802, "t": 620.22063, "r": 249.59605000000002, "b": 634.98363, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2.2 Separation of duties"}, {"label": "text", "id": 0, "page_no": 7, "cluster": {"id": 0, "label": "text", "bbox": {"l": 136.8, "t": 652.54872, "r": 547.22345, "b": 709.760956, "coord_origin": "TOPLEFT"}, "confidence": 0.9853070974349976, "cells": [{"id": 43, "text": "Separation of duties helps businesses comply with industry regulations or organizational ", "bbox": {"l": 136.8, "t": 652.54872, "r": 529.09357, "b": 661.76172, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "requirements and simplifies the management of authorities. Separation of duties is commonly ", "bbox": {"l": 136.8, "t": 664.54852, "r": 547.22345, "b": 673.76153, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "used to prevent fraudulent activities or errors by a single person. It provides the ability for ", "bbox": {"l": 136.8, "t": 676.54833, "r": 530.89716, "b": 685.76134, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "administrative functions to be divided across individuals without overlapping responsibilities, ", "bbox": {"l": 136.80002, "t": 688.54814, "r": 544.33832, "b": 697.7611469999999, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "so that one user does not possess unlimited authority, such as with the *ALLOBJ authority.", "bbox": {"l": 136.80002, "t": 700.547951, "r": 536.28363, "b": 709.760956, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Separation of duties helps businesses comply with industry regulations or organizational requirements and simplifies the management of authorities. Separation of duties is commonly used to prevent fraudulent activities or errors by a single person. It provides the ability for administrative functions to be divided across individuals without overlapping responsibilities, so that one user does not possess unlimited authority, such as with the *ALLOBJ authority."}, {"label": "table", "id": 1, "page_no": 7, "cluster": {"id": 1, "label": "table", "bbox": {"l": 135.52462768554688, "t": 289.7252197265625, "r": 545.8714599609375, "b": 442.050537109375, "coord_origin": "TOPLEFT"}, "confidence": 0.9851690530776978, "cells": [{"id": 48, "text": "Column name", "bbox": {"l": 142.8, "t": 296.5379899999999, "r": 202.245, "b": 304.86301, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "Data type", "bbox": {"l": 216.80878999999996, "t": 296.5379899999999, "r": 257.21069, "b": 304.86301, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "Description", "bbox": {"l": 289.47479, "t": 296.5379899999999, "r": 338.89468, "b": 304.86301, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "FUNCTION_ID", "bbox": {"l": 142.8, "t": 315.55771, "r": 203.2323, "b": 323.88272, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "VARCHAR(30)", "bbox": {"l": 216.7854, "t": 315.55771, "r": 276.0036, "b": 323.88272, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "ID of the function.", "bbox": {"l": 289.4577, "t": 315.55771, "r": 359.85394, "b": 323.88272, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "USER_NAME", "bbox": {"l": 142.8, "t": 334.51801, "r": 198.6693, "b": 342.84302, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "VARCHAR(10)", "bbox": {"l": 216.74129999999997, "t": 334.51801, "r": 275.92349, "b": 342.84302, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Name of the user profile that has a usage setting for this ", "bbox": {"l": 289.38208, "t": 334.51801, "r": 515.05359, "b": 342.84302, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "function.", "bbox": {"l": 289.4397, "t": 345.55832, "r": 323.43362, "b": 353.88333, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "USAGE", "bbox": {"l": 142.79999, "t": 364.51862, "r": 173.98318, "b": 372.84363, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "VARCHAR(7)", "bbox": {"l": 216.77367999999998, "t": 364.51862, "r": 270.97977, "b": 372.84363, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "Usage setting:", "bbox": {"l": 289.41626, "t": 364.51862, "r": 346.88757, "b": 372.84363, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 375.69394000000005, "r": 293.9397, "b": 383.62292, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "ALLOWED: The user profile is allowed to use the function.", "bbox": {"l": 303.83969, "t": 375.55893, "r": 535.16766, "b": 383.88394, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 386.67395, "r": 293.9397, "b": 394.60294, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "DENIED: The user profile is not allowed to use the function.", "bbox": {"l": 303.83969, "t": 386.53894, "r": 539.10712, "b": 394.86395, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "USER_TYPE", "bbox": {"l": 142.8, "t": 405.55865, "r": 196.2249, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "VARCHAR(5)", "bbox": {"l": 216.75211, "t": 405.55865, "r": 270.99872, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "Type of user profile:", "bbox": {"l": 289.43161, "t": 405.55865, "r": 367.8009, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 416.67368000000005, "r": 293.9397, "b": 424.60266, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "USER: The user profile is a user.", "bbox": {"l": 303.83969, "t": 416.53867, "r": 434.78159, "b": 424.86368, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 427.65369, "r": 293.9397, "b": 435.58267000000006, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "GROUP: The user profile is a group.", "bbox": {"l": 303.83969, "t": 427.51868, "r": 448.11963000000003, "b": 435.84369, "coord_origin": "TOPLEFT"}}], "children": [{"id": 31, "label": "text", "bbox": {"l": 142.8, "t": 296.5379899999999, "r": 202.245, "b": 304.86301, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "Column name", "bbox": {"l": 142.8, "t": 296.5379899999999, "r": 202.245, "b": 304.86301, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 216.80878999999996, "t": 296.5379899999999, "r": 257.21069, "b": 304.86301, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "Data type", "bbox": {"l": 216.80878999999996, "t": 296.5379899999999, "r": 257.21069, "b": 304.86301, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 289.47479, "t": 296.5379899999999, "r": 338.89468, "b": 304.86301, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "Description", "bbox": {"l": 289.47479, "t": 296.5379899999999, "r": 338.89468, "b": 304.86301, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 142.8, "t": 315.55771, "r": 203.2323, "b": 323.88272, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "FUNCTION_ID", "bbox": {"l": 142.8, "t": 315.55771, "r": 203.2323, "b": 323.88272, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 216.7854, "t": 315.55771, "r": 276.0036, "b": 323.88272, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "VARCHAR(30)", "bbox": {"l": 216.7854, "t": 315.55771, "r": 276.0036, "b": 323.88272, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 289.4577, "t": 315.55771, "r": 359.85394, "b": 323.88272, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "ID of the function.", "bbox": {"l": 289.4577, "t": 315.55771, "r": 359.85394, "b": 323.88272, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 142.8, "t": 334.51801, "r": 198.6693, "b": 342.84302, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "USER_NAME", "bbox": {"l": 142.8, "t": 334.51801, "r": 198.6693, "b": 342.84302, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 216.74129999999997, "t": 334.51801, "r": 275.92349, "b": 342.84302, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "VARCHAR(10)", "bbox": {"l": 216.74129999999997, "t": 334.51801, "r": 275.92349, "b": 342.84302, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 289.38208, "t": 334.51801, "r": 515.05359, "b": 342.84302, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "Name of the user profile that has a usage setting for this ", "bbox": {"l": 289.38208, "t": 334.51801, "r": 515.05359, "b": 342.84302, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 289.4397, "t": 345.55832, "r": 323.43362, "b": 353.88333, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "function.", "bbox": {"l": 289.4397, "t": 345.55832, "r": 323.43362, "b": 353.88333, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 142.79999, "t": 364.51862, "r": 173.98318, "b": 372.84363, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "USAGE", "bbox": {"l": 142.79999, "t": 364.51862, "r": 173.98318, "b": 372.84363, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 216.77367999999998, "t": 364.51862, "r": 270.97977, "b": 372.84363, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "VARCHAR(7)", "bbox": {"l": 216.77367999999998, "t": 364.51862, "r": 270.97977, "b": 372.84363, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 289.41626, "t": 364.51862, "r": 346.88757, "b": 372.84363, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "Usage setting:", "bbox": {"l": 289.41626, "t": 364.51862, "r": 346.88757, "b": 372.84363, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 289.4397, "t": 375.69394000000005, "r": 293.9397, "b": 383.62292, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 375.69394000000005, "r": 293.9397, "b": 383.62292, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 303.83969, "t": 375.55893, "r": 535.16766, "b": 383.88394, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "ALLOWED: The user profile is allowed to use the function.", "bbox": {"l": 303.83969, "t": 375.55893, "r": 535.16766, "b": 383.88394, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 289.4397, "t": 386.67395, "r": 293.9397, "b": 394.60294, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 386.67395, "r": 293.9397, "b": 394.60294, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 303.83969, "t": 386.53894, "r": 539.10712, "b": 394.86395, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "DENIED: The user profile is not allowed to use the function.", "bbox": {"l": 303.83969, "t": 386.53894, "r": 539.10712, "b": 394.86395, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 142.8, "t": 405.55865, "r": 196.2249, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "USER_TYPE", "bbox": {"l": 142.8, "t": 405.55865, "r": 196.2249, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 216.75211, "t": 405.55865, "r": 270.99872, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "VARCHAR(5)", "bbox": {"l": 216.75211, "t": 405.55865, "r": 270.99872, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 289.43161, "t": 405.55865, "r": 367.8009, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "Type of user profile:", "bbox": {"l": 289.43161, "t": 405.55865, "r": 367.8009, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 289.4397, "t": 416.67368000000005, "r": 293.9397, "b": 424.60266, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 416.67368000000005, "r": 293.9397, "b": 424.60266, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 303.83969, "t": 416.53867, "r": 434.78159, "b": 424.86368, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "USER: The user profile is a user.", "bbox": {"l": 303.83969, "t": 416.53867, "r": 434.78159, "b": 424.86368, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 289.4397, "t": 427.65369, "r": 293.9397, "b": 435.58267000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "GLYPH<SM590000>", "bbox": {"l": 289.4397, "t": 427.65369, "r": 293.9397, "b": 435.58267000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 303.83969, "t": 427.51868, "r": 448.11963000000003, "b": 435.84369, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "GROUP: The user profile is a group.", "bbox": {"l": 303.83969, "t": 427.51868, "r": 448.11963000000003, "b": 435.84369, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl"], "num_rows": 5, "num_cols": 3, "table_cells": [{"bbox": {"l": 142.8, "t": 296.5379899999999, "r": 202.245, "b": 304.86301, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Column name", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 216.80878999999996, "t": 296.5379899999999, "r": 257.21069, "b": 304.86301, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Data type", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 289.47479, "t": 296.5379899999999, "r": 338.89468, "b": 304.86301, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Description", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 142.8, "t": 315.55771, "r": 203.2323, "b": 323.88272, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "FUNCTION_ID", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 216.7854, "t": 315.55771, "r": 276.0036, "b": 323.88272, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(30)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.4577, "t": 315.55771, "r": 359.85394, "b": 323.88272, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "ID of the function.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 142.8, "t": 334.51801, "r": 198.6693, "b": 342.84302, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "USER_NAME", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 216.74129999999997, "t": 334.51801, "r": 275.92349, "b": 342.84302, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(10)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.38208, "t": 334.51801, "r": 515.05359, "b": 353.88333, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Name of the user profile that has a usage setting for this  function.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 142.79999, "t": 364.51862, "r": 173.98318, "b": 372.84363, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "USAGE", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 216.77367999999998, "t": 364.51862, "r": 270.97977, "b": 372.84363, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(7)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.41626, "t": 364.51862, "r": 539.10712, "b": 394.86395, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Usage setting: GLYPH<SM590000> ALLOWED: The user profile is allowed to use the function. GLYPH<SM590000> DENIED: The user profile is not allowed to use the function.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 142.8, "t": 405.55865, "r": 196.2249, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "USER_TYPE", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 216.75211, "t": 405.55865, "r": 270.99872, "b": 413.88367000000005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(5)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 289.43161, "t": 405.55865, "r": 448.11963000000003, "b": 435.84369, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Type of user profile: GLYPH<SM590000> USER: The user profile is a user. GLYPH<SM590000> GROUP: The user profile is a group.", "column_header": false, "row_header": false, "row_section": false}]}], "headers": [{"label": "page_footer", "id": 14, "page_no": 7, "cluster": {"id": 14, "label": "page_footer", "bbox": {"l": 64.800003, "t": 754.848721, "r": 78.402, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.9166396856307983, "cells": [{"id": 0, "text": "10 ", "bbox": {"l": 64.800003, "t": 754.848721, "r": 78.402, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "10"}, {"label": "page_footer", "id": 10, "page_no": 7, "cluster": {"id": 10, "label": "page_footer", "bbox": {"l": 93.420303, "t": 755.538002, "r": 334.42142, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9530044198036194, "cells": [{"id": 1, "text": "Row and Column Access Control Support in IBM DB2 for i", "bbox": {"l": 93.420303, "t": 755.538002, "r": 334.42142, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Row and Column Access Control Support in IBM DB2 for i"}]}}, {"page_no": 8, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "Chapter 2. Roles and separation of duties ", "bbox": {"l": 355.32001, "t": 755.538002, "r": 523.54071, "b": 763.863001, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "11", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "For example, assume that a business has assigned the duty to manage security on IBM i to ", "bbox": {"l": 136.79959, "t": 71.50903000000005, "r": 542.69434, "b": 80.72204999999985, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Theresa. Before release IBM i 7.2, to grant privileges, Theresa had to have the same ", "bbox": {"l": 136.79959, "t": 83.50885000000017, "r": 513.67804, "b": 92.72185999999999, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "privileges Theresa was granting to others. Therefore, to grant *USE privileges to the ", "bbox": {"l": 136.79959, "t": 95.50867000000005, "r": 509.71902, "b": 104.72167999999999, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "PAYROLL table, Theresa had to have *OBJMGT and *USE authority (or a higher level of ", "bbox": {"l": 136.79959, "t": 107.50847999999996, "r": 528.20184, "b": 116.72149999999999, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "authority, such as *ALLOBJ). This requirement allowed Theresa to access the data in the ", "bbox": {"l": 136.79959, "t": 119.50829999999996, "r": 531.84015, "b": 128.72131000000002, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "PAYROLL table even though Theresa\u2019s job description was only to manage its security.", "bbox": {"l": 136.79959, "t": 131.50811999999996, "r": 519.24982, "b": 140.72113000000002, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "In IBM i 7.2, the QIBM_DB_SECADM function usage grants authorities, revokes authorities, ", "bbox": {"l": 136.79959, "t": 153.52770999999996, "r": 544.16064, "b": 162.74072, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "changes ownership, or changes the primary group without giving access to the object or, in ", "bbox": {"l": 136.79959, "t": 165.52752999999996, "r": 540.66156, "b": 174.74054, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "the case of a database table, to the data that is in the table or allowing other operations on the ", "bbox": {"l": 136.79959, "t": 177.52733999999998, "r": 547.30396, "b": 186.74036, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "table. ", "bbox": {"l": 136.79959, "t": 189.52715999999998, "r": 163.6189, "b": 198.74017000000003, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "QIBM_DB_SECADM function usage can be granted only by a user with *SECADM special ", "bbox": {"l": 136.79959, "t": 211.48694, "r": 538.65076, "b": 220.69994999999994, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "authority and can be given to a user or a group.", "bbox": {"l": 136.79959, "t": 223.48676, "r": 346.34808, "b": 232.69976999999994, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "QIBM_DB_SECADM also is responsible for administering RCAC, which restricts which rows ", "bbox": {"l": 136.79959, "t": 245.50635, "r": 545.79602, "b": 254.71936000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "a user is allowed to access in a table and whether a user is allowed to see information in ", "bbox": {"l": 136.79959, "t": 257.50616, "r": 529.46149, "b": 266.71918000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "certain columns of a table.", "bbox": {"l": 136.79959, "t": 269.50598, "r": 253.47696999999997, "b": 278.71898999999996, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "A preferred practice is that the RCAC administrator has the QIBM_DB_SECADM function ", "bbox": {"l": 136.79959, "t": 291.52557, "r": 533.78137, "b": 300.73856, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "usage ID, but absolutely no other data privileges. The result is that the RCAC administrator ", "bbox": {"l": 136.79959, "t": 303.52539, "r": 539.80713, "b": 312.73837000000003, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "can deploy and maintain the RCAC constructs, but cannot grant themselves unauthorized ", "bbox": {"l": 136.79959, "t": 315.52521, "r": 534.5741, "b": 324.73819, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "access to data itself.", "bbox": {"l": 136.79959, "t": 327.52502, "r": 227.02324, "b": 336.73801, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Table 2-2 shows a comparison of the different function usage IDs and *JOBCTL authority to ", "bbox": {"l": 136.79959, "t": 349.48483, "r": 543.06714, "b": 358.69780999999995, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "the different CL commands and DB2 for i tools.", "bbox": {"l": 136.79959, "t": 361.48465, "r": 343.79236, "b": 370.69763000000006, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Table 2-2 Comparison of the different function usage IDs and *JOBCTL authority", "bbox": {"l": 64.800003, "t": 383.5379899999999, "r": 391.75464, "b": 391.86301, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "User action", "bbox": {"l": 70.800301, "t": 400.51827999999995, "r": 119.78551, "b": 408.84329, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "*JOBCTL", "bbox": {"l": 424.93805, "t": 447.52255, "r": 433.26297000000005, "b": 487.01999, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "QIBM_DB_SECADM", "bbox": {"l": 450.13806, "t": 401.6000700000001, "r": 458.46298, "b": 487.01999, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "QIBM_DB_SQLADM", "bbox": {"l": 475.93835000000007, "t": 401.53442, "r": 484.26327999999995, "b": 487.01999, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "QIBM_DB_SYSMON", "bbox": {"l": 501.13837, "t": 401.6145, "r": 509.46329, "b": 487.01999, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "No Authority", "bbox": {"l": 526.39862, "t": 432.79944, "r": 534.72357, "b": 487.02005, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "SET CURRENT DEGREE", "bbox": {"l": 70.800003, "t": 498.69299, "r": 151.6794, "b": 506.66699, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": " (SQL statement)", "bbox": {"l": 151.6803, "t": 498.55798, "r": 220.15681000000004, "b": 506.883, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "X", "bbox": {"l": 429.0, "t": 498.55798, "r": 435.00299000000007, "b": 506.883, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "X", "bbox": {"l": 480.00031, "t": 498.55798, "r": 486.0033, "b": 506.883, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "CHGQRYA", "bbox": {"l": 70.800018, "t": 517.65329, "r": 102.23972, "b": 525.62729, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": " command targeting a different user\u2019s job", "bbox": {"l": 102.23972, "t": 517.51828, "r": 264.5538, "b": 525.84329, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "X", "bbox": {"l": 429.00003, "t": 517.51828, "r": 435.00302000000005, "b": 525.84329, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "X", "bbox": {"l": 480.00034, "t": 517.51828, "r": 486.00333, "b": 525.84329, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "STRDBMON", "bbox": {"l": 70.800049, "t": 536.67299, "r": 106.73975, "b": 544.64699, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": " or ", "bbox": {"l": 106.73975, "t": 536.5379800000001, "r": 119.77895, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "ENDDBMON", "bbox": {"l": 119.69975000000001, "t": 536.67299, "r": 155.69974, "b": 544.64699, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": " commands targeting a different user\u2019s job", "bbox": {"l": 155.69974, "t": 536.5379800000001, "r": 322.50574, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "X", "bbox": {"l": 429.00003, "t": 536.5379800000001, "r": 435.00302000000005, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "X", "bbox": {"l": 480.00034, "t": 536.5379800000001, "r": 486.00333, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "STRDBMON", "bbox": {"l": 70.800049, "t": 555.69269, "r": 106.73975, "b": 563.66669, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": " or ", "bbox": {"l": 106.73975, "t": 555.55768, "r": 119.77895, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "ENDDBMON", "bbox": {"l": 119.69975000000001, "t": 555.69269, "r": 155.69974, "b": 563.66669, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": " commands targeting a job that matches the current user", "bbox": {"l": 155.69974, "t": 555.55768, "r": 381.02185, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "X", "bbox": {"l": 429.00003, "t": 555.55768, "r": 435.00302000000005, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "X", "bbox": {"l": 480.00034, "t": 555.55768, "r": 486.00333, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "X", "bbox": {"l": 505.26061999999996, "t": 555.55768, "r": 511.26361, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "X", "bbox": {"l": 530.76031, "t": 555.55768, "r": 536.76331, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "QUSRJOBI() API format 900 or System i Navigator\u2019s SQL Details for Job", "bbox": {"l": 70.800049, "t": 574.51797, "r": 359.51736, "b": 582.84299, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "X", "bbox": {"l": 429.0000600000001, "t": 574.51797, "r": 435.00305000000003, "b": 582.84299, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "X", "bbox": {"l": 480.00037, "t": 574.51797, "r": 486.00335999999993, "b": 582.84299, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "X", "bbox": {"l": 505.2606799999999, "t": 574.51797, "r": 511.26367, "b": 582.84299, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Visual Explain within Run SQL scripts", "bbox": {"l": 70.800079, "t": 593.5376699999999, "r": 220.75178999999997, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "X", "bbox": {"l": 429.0000600000001, "t": 593.5376699999999, "r": 435.00305000000003, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "X", "bbox": {"l": 480.00037, "t": 593.5376699999999, "r": 486.00335999999993, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "X", "bbox": {"l": 505.2606799999999, "t": 593.5376699999999, "r": 511.26367, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "X", "bbox": {"l": 530.76038, "t": 593.5376699999999, "r": 536.76337, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "Visual Explain outside of Run SQL scripts", "bbox": {"l": 70.800079, "t": 612.55737, "r": 236.6548, "b": 620.88239, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "X", "bbox": {"l": 429.0000600000001, "t": 612.55737, "r": 435.00305000000003, "b": 620.88239, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "X", "bbox": {"l": 480.00037, "t": 612.55737, "r": 486.00335999999993, "b": 620.88239, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "ANALYZE PLAN CACHE procedure", "bbox": {"l": 70.800079, "t": 631.51767, "r": 213.12968, "b": 639.84268, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "X", "bbox": {"l": 429.0000600000001, "t": 631.51767, "r": 435.00305000000003, "b": 639.84268, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "X", "bbox": {"l": 480.00037, "t": 631.51767, "r": 486.00335999999993, "b": 639.84268, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "DUMP PLAN CACHE procedure", "bbox": {"l": 70.800079, "t": 650.53737, "r": 199.87808, "b": 658.86238, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "X", "bbox": {"l": 429.0000600000001, "t": 650.53737, "r": 435.00305000000003, "b": 658.86238, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "X", "bbox": {"l": 480.00037, "t": 650.53737, "r": 486.00335999999993, "b": 658.86238, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "MODIFY PLAN CACHE procedure", "bbox": {"l": 70.800079, "t": 669.55708, "r": 208.36777, "b": 677.88207, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "X", "bbox": {"l": 429.0000600000001, "t": 669.55708, "r": 435.00305000000003, "b": 677.88207, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "X", "bbox": {"l": 480.00037, "t": 669.55708, "r": 486.00335999999993, "b": 677.88207, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "MODIFY PLAN CACHE PROPERTIES procedure (currently does not check authority)", "bbox": {"l": 70.800079, "t": 688.57677, "r": 411.20264, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "X", "bbox": {"l": 429.0000600000001, "t": 688.57677, "r": 435.00305000000003, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "X", "bbox": {"l": 480.00037, "t": 688.57677, "r": 486.00335999999993, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "CHANGE PLAN CACHE SIZE procedure (currently does not check authority)", "bbox": {"l": 70.800079, "t": 707.537071, "r": 377.12585, "b": 715.862068, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "X", "bbox": {"l": 429.0000600000001, "t": 707.537071, "r": 435.00305000000003, "b": 715.862068, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "X", "bbox": {"l": 480.00037, "t": 707.537071, "r": 486.00335999999993, "b": 715.862068, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 7, "label": "page_footer", "bbox": {"l": 355.32001, "t": 755.538002, "r": 523.54071, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9508126378059387, "cells": [{"id": 0, "text": "Chapter 2. Roles and separation of duties ", "bbox": {"l": 355.32001, "t": 755.538002, "r": 523.54071, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "page_footer", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.8987301588058472, "cells": [{"id": 1, "text": "11", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 136.79959, "t": 71.50903000000005, "r": 542.69434, "b": 140.72113000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9789126515388489, "cells": [{"id": 2, "text": "For example, assume that a business has assigned the duty to manage security on IBM i to ", "bbox": {"l": 136.79959, "t": 71.50903000000005, "r": 542.69434, "b": 80.72204999999985, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Theresa. Before release IBM i 7.2, to grant privileges, Theresa had to have the same ", "bbox": {"l": 136.79959, "t": 83.50885000000017, "r": 513.67804, "b": 92.72185999999999, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "privileges Theresa was granting to others. Therefore, to grant *USE privileges to the ", "bbox": {"l": 136.79959, "t": 95.50867000000005, "r": 509.71902, "b": 104.72167999999999, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "PAYROLL table, Theresa had to have *OBJMGT and *USE authority (or a higher level of ", "bbox": {"l": 136.79959, "t": 107.50847999999996, "r": 528.20184, "b": 116.72149999999999, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "authority, such as *ALLOBJ). This requirement allowed Theresa to access the data in the ", "bbox": {"l": 136.79959, "t": 119.50829999999996, "r": 531.84015, "b": 128.72131000000002, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "PAYROLL table even though Theresa\u2019s job description was only to manage its security.", "bbox": {"l": 136.79959, "t": 131.50811999999996, "r": 519.24982, "b": 140.72113000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "text", "bbox": {"l": 136.79959, "t": 153.52770999999996, "r": 547.30396, "b": 198.74017000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9665538668632507, "cells": [{"id": 8, "text": "In IBM i 7.2, the QIBM_DB_SECADM function usage grants authorities, revokes authorities, ", "bbox": {"l": 136.79959, "t": 153.52770999999996, "r": 544.16064, "b": 162.74072, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "changes ownership, or changes the primary group without giving access to the object or, in ", "bbox": {"l": 136.79959, "t": 165.52752999999996, "r": 540.66156, "b": 174.74054, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "the case of a database table, to the data that is in the table or allowing other operations on the ", "bbox": {"l": 136.79959, "t": 177.52733999999998, "r": 547.30396, "b": 186.74036, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "table. ", "bbox": {"l": 136.79959, "t": 189.52715999999998, "r": 163.6189, "b": 198.74017000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "text", "bbox": {"l": 136.79959, "t": 211.48694, "r": 538.65076, "b": 232.69976999999994, "coord_origin": "TOPLEFT"}, "confidence": 0.9691813588142395, "cells": [{"id": 12, "text": "QIBM_DB_SECADM function usage can be granted only by a user with *SECADM special ", "bbox": {"l": 136.79959, "t": 211.48694, "r": 538.65076, "b": 220.69994999999994, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "authority and can be given to a user or a group.", "bbox": {"l": 136.79959, "t": 223.48676, "r": 346.34808, "b": 232.69976999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 136.79959, "t": 245.50635, "r": 545.79602, "b": 278.71898999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9729602336883545, "cells": [{"id": 14, "text": "QIBM_DB_SECADM also is responsible for administering RCAC, which restricts which rows ", "bbox": {"l": 136.79959, "t": 245.50635, "r": 545.79602, "b": 254.71936000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "a user is allowed to access in a table and whether a user is allowed to see information in ", "bbox": {"l": 136.79959, "t": 257.50616, "r": 529.46149, "b": 266.71918000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "certain columns of a table.", "bbox": {"l": 136.79959, "t": 269.50598, "r": 253.47696999999997, "b": 278.71898999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 136.79959, "t": 291.52557, "r": 539.80713, "b": 336.73801, "coord_origin": "TOPLEFT"}, "confidence": 0.9815152883529663, "cells": [{"id": 17, "text": "A preferred practice is that the RCAC administrator has the QIBM_DB_SECADM function ", "bbox": {"l": 136.79959, "t": 291.52557, "r": 533.78137, "b": 300.73856, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "usage ID, but absolutely no other data privileges. The result is that the RCAC administrator ", "bbox": {"l": 136.79959, "t": 303.52539, "r": 539.80713, "b": 312.73837000000003, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "can deploy and maintain the RCAC constructs, but cannot grant themselves unauthorized ", "bbox": {"l": 136.79959, "t": 315.52521, "r": 534.5741, "b": 324.73819, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "access to data itself.", "bbox": {"l": 136.79959, "t": 327.52502, "r": 227.02324, "b": 336.73801, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "text", "bbox": {"l": 136.79959, "t": 349.48483, "r": 543.06714, "b": 370.69763000000006, "coord_origin": "TOPLEFT"}, "confidence": 0.9672255516052246, "cells": [{"id": 21, "text": "Table 2-2 shows a comparison of the different function usage IDs and *JOBCTL authority to ", "bbox": {"l": 136.79959, "t": 349.48483, "r": 543.06714, "b": 358.69780999999995, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "the different CL commands and DB2 for i tools.", "bbox": {"l": 136.79959, "t": 361.48465, "r": 343.79236, "b": 370.69763000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "caption", "bbox": {"l": 64.800003, "t": 383.5379899999999, "r": 391.75464, "b": 391.86301, "coord_origin": "TOPLEFT"}, "confidence": 0.9337189793586731, "cells": [{"id": 23, "text": "Table 2-2 Comparison of the different function usage IDs and *JOBCTL authority", "bbox": {"l": 64.800003, "t": 383.5379899999999, "r": 391.75464, "b": 391.86301, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "table", "bbox": {"l": 64.41139221191406, "t": 393.6136169433594, "r": 547.3950805664062, "b": 721.60791015625, "coord_origin": "TOPLEFT"}, "confidence": 0.9899571537971497, "cells": [{"id": 24, "text": "User action", "bbox": {"l": 70.800301, "t": 400.51827999999995, "r": 119.78551, "b": 408.84329, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "*JOBCTL", "bbox": {"l": 424.93805, "t": 447.52255, "r": 433.26297000000005, "b": 487.01999, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "QIBM_DB_SECADM", "bbox": {"l": 450.13806, "t": 401.6000700000001, "r": 458.46298, "b": 487.01999, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "QIBM_DB_SQLADM", "bbox": {"l": 475.93835000000007, "t": 401.53442, "r": 484.26327999999995, "b": 487.01999, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "QIBM_DB_SYSMON", "bbox": {"l": 501.13837, "t": 401.6145, "r": 509.46329, "b": 487.01999, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "No Authority", "bbox": {"l": 526.39862, "t": 432.79944, "r": 534.72357, "b": 487.02005, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "SET CURRENT DEGREE", "bbox": {"l": 70.800003, "t": 498.69299, "r": 151.6794, "b": 506.66699, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": " (SQL statement)", "bbox": {"l": 151.6803, "t": 498.55798, "r": 220.15681000000004, "b": 506.883, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "X", "bbox": {"l": 429.0, "t": 498.55798, "r": 435.00299000000007, "b": 506.883, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "X", "bbox": {"l": 480.00031, "t": 498.55798, "r": 486.0033, "b": 506.883, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "CHGQRYA", "bbox": {"l": 70.800018, "t": 517.65329, "r": 102.23972, "b": 525.62729, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": " command targeting a different user\u2019s job", "bbox": {"l": 102.23972, "t": 517.51828, "r": 264.5538, "b": 525.84329, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "X", "bbox": {"l": 429.00003, "t": 517.51828, "r": 435.00302000000005, "b": 525.84329, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "X", "bbox": {"l": 480.00034, "t": 517.51828, "r": 486.00333, "b": 525.84329, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "STRDBMON", "bbox": {"l": 70.800049, "t": 536.67299, "r": 106.73975, "b": 544.64699, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": " or ", "bbox": {"l": 106.73975, "t": 536.5379800000001, "r": 119.77895, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "ENDDBMON", "bbox": {"l": 119.69975000000001, "t": 536.67299, "r": 155.69974, "b": 544.64699, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": " commands targeting a different user\u2019s job", "bbox": {"l": 155.69974, "t": 536.5379800000001, "r": 322.50574, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "X", "bbox": {"l": 429.00003, "t": 536.5379800000001, "r": 435.00302000000005, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "X", "bbox": {"l": 480.00034, "t": 536.5379800000001, "r": 486.00333, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "STRDBMON", "bbox": {"l": 70.800049, "t": 555.69269, "r": 106.73975, "b": 563.66669, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": " or ", "bbox": {"l": 106.73975, "t": 555.55768, "r": 119.77895, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "ENDDBMON", "bbox": {"l": 119.69975000000001, "t": 555.69269, "r": 155.69974, "b": 563.66669, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": " commands targeting a job that matches the current user", "bbox": {"l": 155.69974, "t": 555.55768, "r": 381.02185, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "X", "bbox": {"l": 429.00003, "t": 555.55768, "r": 435.00302000000005, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "X", "bbox": {"l": 480.00034, "t": 555.55768, "r": 486.00333, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "X", "bbox": {"l": 505.26061999999996, "t": 555.55768, "r": 511.26361, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "X", "bbox": {"l": 530.76031, "t": 555.55768, "r": 536.76331, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "QUSRJOBI() API format 900 or System i Navigator\u2019s SQL Details for Job", "bbox": {"l": 70.800049, "t": 574.51797, "r": 359.51736, "b": 582.84299, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "X", "bbox": {"l": 429.0000600000001, "t": 574.51797, "r": 435.00305000000003, "b": 582.84299, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "X", "bbox": {"l": 480.00037, "t": 574.51797, "r": 486.00335999999993, "b": 582.84299, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "X", "bbox": {"l": 505.2606799999999, "t": 574.51797, "r": 511.26367, "b": 582.84299, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Visual Explain within Run SQL scripts", "bbox": {"l": 70.800079, "t": 593.5376699999999, "r": 220.75178999999997, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "X", "bbox": {"l": 429.0000600000001, "t": 593.5376699999999, "r": 435.00305000000003, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "X", "bbox": {"l": 480.00037, "t": 593.5376699999999, "r": 486.00335999999993, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "X", "bbox": {"l": 505.2606799999999, "t": 593.5376699999999, "r": 511.26367, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "X", "bbox": {"l": 530.76038, "t": 593.5376699999999, "r": 536.76337, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "Visual Explain outside of Run SQL scripts", "bbox": {"l": 70.800079, "t": 612.55737, "r": 236.6548, "b": 620.88239, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "X", "bbox": {"l": 429.0000600000001, "t": 612.55737, "r": 435.00305000000003, "b": 620.88239, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "X", "bbox": {"l": 480.00037, "t": 612.55737, "r": 486.00335999999993, "b": 620.88239, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "ANALYZE PLAN CACHE procedure", "bbox": {"l": 70.800079, "t": 631.51767, "r": 213.12968, "b": 639.84268, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "X", "bbox": {"l": 429.0000600000001, "t": 631.51767, "r": 435.00305000000003, "b": 639.84268, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "X", "bbox": {"l": 480.00037, "t": 631.51767, "r": 486.00335999999993, "b": 639.84268, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "DUMP PLAN CACHE procedure", "bbox": {"l": 70.800079, "t": 650.53737, "r": 199.87808, "b": 658.86238, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "X", "bbox": {"l": 429.0000600000001, "t": 650.53737, "r": 435.00305000000003, "b": 658.86238, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "X", "bbox": {"l": 480.00037, "t": 650.53737, "r": 486.00335999999993, "b": 658.86238, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "MODIFY PLAN CACHE procedure", "bbox": {"l": 70.800079, "t": 669.55708, "r": 208.36777, "b": 677.88207, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "X", "bbox": {"l": 429.0000600000001, "t": 669.55708, "r": 435.00305000000003, "b": 677.88207, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "X", "bbox": {"l": 480.00037, "t": 669.55708, "r": 486.00335999999993, "b": 677.88207, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "MODIFY PLAN CACHE PROPERTIES procedure (currently does not check authority)", "bbox": {"l": 70.800079, "t": 688.57677, "r": 411.20264, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "X", "bbox": {"l": 429.0000600000001, "t": 688.57677, "r": 435.00305000000003, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "X", "bbox": {"l": 480.00037, "t": 688.57677, "r": 486.00335999999993, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "CHANGE PLAN CACHE SIZE procedure (currently does not check authority)", "bbox": {"l": 70.800079, "t": 707.537071, "r": 377.12585, "b": 715.862068, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "X", "bbox": {"l": 429.0000600000001, "t": 707.537071, "r": 435.00305000000003, "b": 715.862068, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "X", "bbox": {"l": 480.00037, "t": 707.537071, "r": 486.00335999999993, "b": 715.862068, "coord_origin": "TOPLEFT"}}], "children": [{"id": 10, "label": "text", "bbox": {"l": 70.800301, "t": 400.51827999999995, "r": 119.78551, "b": 408.84329, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "User action", "bbox": {"l": 70.800301, "t": 400.51827999999995, "r": 119.78551, "b": 408.84329, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 424.93805, "t": 447.52255, "r": 433.26297000000005, "b": 487.01999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "*JOBCTL", "bbox": {"l": 424.93805, "t": 447.52255, "r": 433.26297000000005, "b": 487.01999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 450.13806, "t": 401.6000700000001, "r": 458.46298, "b": 487.01999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "QIBM_DB_SECADM", "bbox": {"l": 450.13806, "t": 401.6000700000001, "r": 458.46298, "b": 487.01999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 475.93835000000007, "t": 401.53442, "r": 484.26327999999995, "b": 487.01999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "QIBM_DB_SQLADM", "bbox": {"l": 475.93835000000007, "t": 401.53442, "r": 484.26327999999995, "b": 487.01999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 501.13837, "t": 401.6145, "r": 509.46329, "b": 487.01999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "QIBM_DB_SYSMON", "bbox": {"l": 501.13837, "t": 401.6145, "r": 509.46329, "b": 487.01999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 526.39862, "t": 432.79944, "r": 534.72357, "b": 487.02005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "No Authority", "bbox": {"l": 526.39862, "t": 432.79944, "r": 534.72357, "b": 487.02005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 70.800003, "t": 498.69299, "r": 151.6794, "b": 506.66699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "SET CURRENT DEGREE", "bbox": {"l": 70.800003, "t": 498.69299, "r": 151.6794, "b": 506.66699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 151.6803, "t": 498.55798, "r": 220.15681000000004, "b": 506.883, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": " (SQL statement)", "bbox": {"l": 151.6803, "t": 498.55798, "r": 220.15681000000004, "b": 506.883, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 429.0, "t": 498.55798, "r": 435.00299000000007, "b": 506.883, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "X", "bbox": {"l": 429.0, "t": 498.55798, "r": 435.00299000000007, "b": 506.883, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 480.00031, "t": 498.55798, "r": 486.0033, "b": 506.883, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "X", "bbox": {"l": 480.00031, "t": 498.55798, "r": 486.0033, "b": 506.883, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 70.800018, "t": 517.65329, "r": 102.23972, "b": 525.62729, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "CHGQRYA", "bbox": {"l": 70.800018, "t": 517.65329, "r": 102.23972, "b": 525.62729, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 102.23972, "t": 517.51828, "r": 264.5538, "b": 525.84329, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": " command targeting a different user\u2019s job", "bbox": {"l": 102.23972, "t": 517.51828, "r": 264.5538, "b": 525.84329, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 429.00003, "t": 517.51828, "r": 435.00302000000005, "b": 525.84329, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "X", "bbox": {"l": 429.00003, "t": 517.51828, "r": 435.00302000000005, "b": 525.84329, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 480.00034, "t": 517.51828, "r": 486.00333, "b": 525.84329, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "X", "bbox": {"l": 480.00034, "t": 517.51828, "r": 486.00333, "b": 525.84329, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 70.800049, "t": 536.67299, "r": 106.73975, "b": 544.64699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "STRDBMON", "bbox": {"l": 70.800049, "t": 536.67299, "r": 106.73975, "b": 544.64699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 106.73975, "t": 536.5379800000001, "r": 119.77895, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": " or ", "bbox": {"l": 106.73975, "t": 536.5379800000001, "r": 119.77895, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 119.69975000000001, "t": 536.67299, "r": 155.69974, "b": 544.64699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "ENDDBMON", "bbox": {"l": 119.69975000000001, "t": 536.67299, "r": 155.69974, "b": 544.64699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 155.69974, "t": 536.5379800000001, "r": 322.50574, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": " commands targeting a different user\u2019s job", "bbox": {"l": 155.69974, "t": 536.5379800000001, "r": 322.50574, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 429.00003, "t": 536.5379800000001, "r": 435.00302000000005, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "X", "bbox": {"l": 429.00003, "t": 536.5379800000001, "r": 435.00302000000005, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 480.00034, "t": 536.5379800000001, "r": 486.00333, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "X", "bbox": {"l": 480.00034, "t": 536.5379800000001, "r": 486.00333, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 70.800049, "t": 555.69269, "r": 106.73975, "b": 563.66669, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "STRDBMON", "bbox": {"l": 70.800049, "t": 555.69269, "r": 106.73975, "b": 563.66669, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 106.73975, "t": 555.55768, "r": 119.77895, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": " or ", "bbox": {"l": 106.73975, "t": 555.55768, "r": 119.77895, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 119.69975000000001, "t": 555.69269, "r": 155.69974, "b": 563.66669, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "ENDDBMON", "bbox": {"l": 119.69975000000001, "t": 555.69269, "r": 155.69974, "b": 563.66669, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 155.69974, "t": 555.55768, "r": 381.02185, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": " commands targeting a job that matches the current user", "bbox": {"l": 155.69974, "t": 555.55768, "r": 381.02185, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 429.00003, "t": 555.55768, "r": 435.00302000000005, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "X", "bbox": {"l": 429.00003, "t": 555.55768, "r": 435.00302000000005, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 480.00034, "t": 555.55768, "r": 486.00333, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "X", "bbox": {"l": 480.00034, "t": 555.55768, "r": 486.00333, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 505.26061999999996, "t": 555.55768, "r": 511.26361, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "X", "bbox": {"l": 505.26061999999996, "t": 555.55768, "r": 511.26361, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 530.76031, "t": 555.55768, "r": 536.76331, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "X", "bbox": {"l": 530.76031, "t": 555.55768, "r": 536.76331, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 70.800049, "t": 574.51797, "r": 359.51736, "b": 582.84299, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "QUSRJOBI() API format 900 or System i Navigator\u2019s SQL Details for Job", "bbox": {"l": 70.800049, "t": 574.51797, "r": 359.51736, "b": 582.84299, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 429.0000600000001, "t": 574.51797, "r": 435.00305000000003, "b": 582.84299, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "X", "bbox": {"l": 429.0000600000001, "t": 574.51797, "r": 435.00305000000003, "b": 582.84299, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 480.00037, "t": 574.51797, "r": 486.00335999999993, "b": 582.84299, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "X", "bbox": {"l": 480.00037, "t": 574.51797, "r": 486.00335999999993, "b": 582.84299, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 505.2606799999999, "t": 574.51797, "r": 511.26367, "b": 582.84299, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "X", "bbox": {"l": 505.2606799999999, "t": 574.51797, "r": 511.26367, "b": 582.84299, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 70.800079, "t": 593.5376699999999, "r": 220.75178999999997, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "Visual Explain within Run SQL scripts", "bbox": {"l": 70.800079, "t": 593.5376699999999, "r": 220.75178999999997, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 429.0000600000001, "t": 593.5376699999999, "r": 435.00305000000003, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "X", "bbox": {"l": 429.0000600000001, "t": 593.5376699999999, "r": 435.00305000000003, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 480.00037, "t": 593.5376699999999, "r": 486.00335999999993, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "X", "bbox": {"l": 480.00037, "t": 593.5376699999999, "r": 486.00335999999993, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 505.2606799999999, "t": 593.5376699999999, "r": 511.26367, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "X", "bbox": {"l": 505.2606799999999, "t": 593.5376699999999, "r": 511.26367, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 530.76038, "t": 593.5376699999999, "r": 536.76337, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "X", "bbox": {"l": 530.76038, "t": 593.5376699999999, "r": 536.76337, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 70.800079, "t": 612.55737, "r": 236.6548, "b": 620.88239, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "Visual Explain outside of Run SQL scripts", "bbox": {"l": 70.800079, "t": 612.55737, "r": 236.6548, "b": 620.88239, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 429.0000600000001, "t": 612.55737, "r": 435.00305000000003, "b": 620.88239, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "X", "bbox": {"l": 429.0000600000001, "t": 612.55737, "r": 435.00305000000003, "b": 620.88239, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 480.00037, "t": 612.55737, "r": 486.00335999999993, "b": 620.88239, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "X", "bbox": {"l": 480.00037, "t": 612.55737, "r": 486.00335999999993, "b": 620.88239, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 70.800079, "t": 631.51767, "r": 213.12968, "b": 639.84268, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "ANALYZE PLAN CACHE procedure", "bbox": {"l": 70.800079, "t": 631.51767, "r": 213.12968, "b": 639.84268, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 429.0000600000001, "t": 631.51767, "r": 435.00305000000003, "b": 639.84268, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "X", "bbox": {"l": 429.0000600000001, "t": 631.51767, "r": 435.00305000000003, "b": 639.84268, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 480.00037, "t": 631.51767, "r": 486.00335999999993, "b": 639.84268, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "X", "bbox": {"l": 480.00037, "t": 631.51767, "r": 486.00335999999993, "b": 639.84268, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 70.800079, "t": 650.53737, "r": 199.87808, "b": 658.86238, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "DUMP PLAN CACHE procedure", "bbox": {"l": 70.800079, "t": 650.53737, "r": 199.87808, "b": 658.86238, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 429.0000600000001, "t": 650.53737, "r": 435.00305000000003, "b": 658.86238, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "X", "bbox": {"l": 429.0000600000001, "t": 650.53737, "r": 435.00305000000003, "b": 658.86238, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 480.00037, "t": 650.53737, "r": 486.00335999999993, "b": 658.86238, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "X", "bbox": {"l": 480.00037, "t": 650.53737, "r": 486.00335999999993, "b": 658.86238, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 70.800079, "t": 669.55708, "r": 208.36777, "b": 677.88207, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "MODIFY PLAN CACHE procedure", "bbox": {"l": 70.800079, "t": 669.55708, "r": 208.36777, "b": 677.88207, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 429.0000600000001, "t": 669.55708, "r": 435.00305000000003, "b": 677.88207, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "X", "bbox": {"l": 429.0000600000001, "t": 669.55708, "r": 435.00305000000003, "b": 677.88207, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 480.00037, "t": 669.55708, "r": 486.00335999999993, "b": 677.88207, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "X", "bbox": {"l": 480.00037, "t": 669.55708, "r": 486.00335999999993, "b": 677.88207, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 70.800079, "t": 688.57677, "r": 411.20264, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "MODIFY PLAN CACHE PROPERTIES procedure (currently does not check authority)", "bbox": {"l": 70.800079, "t": 688.57677, "r": 411.20264, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 429.0000600000001, "t": 688.57677, "r": 435.00305000000003, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "X", "bbox": {"l": 429.0000600000001, "t": 688.57677, "r": 435.00305000000003, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 480.00037, "t": 688.57677, "r": 486.00335999999993, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "X", "bbox": {"l": 480.00037, "t": 688.57677, "r": 486.00335999999993, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 70.800079, "t": 707.537071, "r": 377.12585, "b": 715.862068, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "CHANGE PLAN CACHE SIZE procedure (currently does not check authority)", "bbox": {"l": 70.800079, "t": 707.537071, "r": 377.12585, "b": 715.862068, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 429.0000600000001, "t": 707.537071, "r": 435.00305000000003, "b": 715.862068, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "X", "bbox": {"l": 429.0000600000001, "t": 707.537071, "r": 435.00305000000003, "b": 715.862068, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 480.00037, "t": 707.537071, "r": 486.00335999999993, "b": 715.862068, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "X", "bbox": {"l": 480.00037, "t": 707.537071, "r": 486.00335999999993, "b": 715.862068, "coord_origin": "TOPLEFT"}}], "children": []}]}]}, "tablestructure": {"table_map": {"0": {"label": "table", "id": 0, "page_no": 8, "cluster": {"id": 0, "label": "table", "bbox": {"l": 64.41139221191406, "t": 393.6136169433594, "r": 547.3950805664062, "b": 721.60791015625, "coord_origin": "TOPLEFT"}, "confidence": 0.9899571537971497, "cells": [{"id": 24, "text": "User action", "bbox": {"l": 70.800301, "t": 400.51827999999995, "r": 119.78551, "b": 408.84329, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "*JOBCTL", "bbox": {"l": 424.93805, "t": 447.52255, "r": 433.26297000000005, "b": 487.01999, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "QIBM_DB_SECADM", "bbox": {"l": 450.13806, "t": 401.6000700000001, "r": 458.46298, "b": 487.01999, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "QIBM_DB_SQLADM", "bbox": {"l": 475.93835000000007, "t": 401.53442, "r": 484.26327999999995, "b": 487.01999, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "QIBM_DB_SYSMON", "bbox": {"l": 501.13837, "t": 401.6145, "r": 509.46329, "b": 487.01999, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "No Authority", "bbox": {"l": 526.39862, "t": 432.79944, "r": 534.72357, "b": 487.02005, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "SET CURRENT DEGREE", "bbox": {"l": 70.800003, "t": 498.69299, "r": 151.6794, "b": 506.66699, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": " (SQL statement)", "bbox": {"l": 151.6803, "t": 498.55798, "r": 220.15681000000004, "b": 506.883, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "X", "bbox": {"l": 429.0, "t": 498.55798, "r": 435.00299000000007, "b": 506.883, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "X", "bbox": {"l": 480.00031, "t": 498.55798, "r": 486.0033, "b": 506.883, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "CHGQRYA", "bbox": {"l": 70.800018, "t": 517.65329, "r": 102.23972, "b": 525.62729, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": " command targeting a different user\u2019s job", "bbox": {"l": 102.23972, "t": 517.51828, "r": 264.5538, "b": 525.84329, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "X", "bbox": {"l": 429.00003, "t": 517.51828, "r": 435.00302000000005, "b": 525.84329, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "X", "bbox": {"l": 480.00034, "t": 517.51828, "r": 486.00333, "b": 525.84329, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "STRDBMON", "bbox": {"l": 70.800049, "t": 536.67299, "r": 106.73975, "b": 544.64699, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": " or ", "bbox": {"l": 106.73975, "t": 536.5379800000001, "r": 119.77895, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "ENDDBMON", "bbox": {"l": 119.69975000000001, "t": 536.67299, "r": 155.69974, "b": 544.64699, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": " commands targeting a different user\u2019s job", "bbox": {"l": 155.69974, "t": 536.5379800000001, "r": 322.50574, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "X", "bbox": {"l": 429.00003, "t": 536.5379800000001, "r": 435.00302000000005, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "X", "bbox": {"l": 480.00034, "t": 536.5379800000001, "r": 486.00333, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "STRDBMON", "bbox": {"l": 70.800049, "t": 555.69269, "r": 106.73975, "b": 563.66669, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": " or ", "bbox": {"l": 106.73975, "t": 555.55768, "r": 119.77895, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "ENDDBMON", "bbox": {"l": 119.69975000000001, "t": 555.69269, "r": 155.69974, "b": 563.66669, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": " commands targeting a job that matches the current user", "bbox": {"l": 155.69974, "t": 555.55768, "r": 381.02185, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "X", "bbox": {"l": 429.00003, "t": 555.55768, "r": 435.00302000000005, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "X", "bbox": {"l": 480.00034, "t": 555.55768, "r": 486.00333, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "X", "bbox": {"l": 505.26061999999996, "t": 555.55768, "r": 511.26361, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "X", "bbox": {"l": 530.76031, "t": 555.55768, "r": 536.76331, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "QUSRJOBI() API format 900 or System i Navigator\u2019s SQL Details for Job", "bbox": {"l": 70.800049, "t": 574.51797, "r": 359.51736, "b": 582.84299, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "X", "bbox": {"l": 429.0000600000001, "t": 574.51797, "r": 435.00305000000003, "b": 582.84299, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "X", "bbox": {"l": 480.00037, "t": 574.51797, "r": 486.00335999999993, "b": 582.84299, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "X", "bbox": {"l": 505.2606799999999, "t": 574.51797, "r": 511.26367, "b": 582.84299, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Visual Explain within Run SQL scripts", "bbox": {"l": 70.800079, "t": 593.5376699999999, "r": 220.75178999999997, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "X", "bbox": {"l": 429.0000600000001, "t": 593.5376699999999, "r": 435.00305000000003, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "X", "bbox": {"l": 480.00037, "t": 593.5376699999999, "r": 486.00335999999993, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "X", "bbox": {"l": 505.2606799999999, "t": 593.5376699999999, "r": 511.26367, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "X", "bbox": {"l": 530.76038, "t": 593.5376699999999, "r": 536.76337, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "Visual Explain outside of Run SQL scripts", "bbox": {"l": 70.800079, "t": 612.55737, "r": 236.6548, "b": 620.88239, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "X", "bbox": {"l": 429.0000600000001, "t": 612.55737, "r": 435.00305000000003, "b": 620.88239, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "X", "bbox": {"l": 480.00037, "t": 612.55737, "r": 486.00335999999993, "b": 620.88239, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "ANALYZE PLAN CACHE procedure", "bbox": {"l": 70.800079, "t": 631.51767, "r": 213.12968, "b": 639.84268, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "X", "bbox": {"l": 429.0000600000001, "t": 631.51767, "r": 435.00305000000003, "b": 639.84268, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "X", "bbox": {"l": 480.00037, "t": 631.51767, "r": 486.00335999999993, "b": 639.84268, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "DUMP PLAN CACHE procedure", "bbox": {"l": 70.800079, "t": 650.53737, "r": 199.87808, "b": 658.86238, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "X", "bbox": {"l": 429.0000600000001, "t": 650.53737, "r": 435.00305000000003, "b": 658.86238, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "X", "bbox": {"l": 480.00037, "t": 650.53737, "r": 486.00335999999993, "b": 658.86238, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "MODIFY PLAN CACHE procedure", "bbox": {"l": 70.800079, "t": 669.55708, "r": 208.36777, "b": 677.88207, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "X", "bbox": {"l": 429.0000600000001, "t": 669.55708, "r": 435.00305000000003, "b": 677.88207, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "X", "bbox": {"l": 480.00037, "t": 669.55708, "r": 486.00335999999993, "b": 677.88207, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "MODIFY PLAN CACHE PROPERTIES procedure (currently does not check authority)", "bbox": {"l": 70.800079, "t": 688.57677, "r": 411.20264, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "X", "bbox": {"l": 429.0000600000001, "t": 688.57677, "r": 435.00305000000003, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "X", "bbox": {"l": 480.00037, "t": 688.57677, "r": 486.00335999999993, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "CHANGE PLAN CACHE SIZE procedure (currently does not check authority)", "bbox": {"l": 70.800079, "t": 707.537071, "r": 377.12585, "b": 715.862068, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "X", "bbox": {"l": 429.0000600000001, "t": 707.537071, "r": 435.00305000000003, "b": 715.862068, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "X", "bbox": {"l": 480.00037, "t": 707.537071, "r": 486.00335999999993, "b": 715.862068, "coord_origin": "TOPLEFT"}}], "children": [{"id": 10, "label": "text", "bbox": {"l": 70.800301, "t": 400.51827999999995, "r": 119.78551, "b": 408.84329, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "User action", "bbox": {"l": 70.800301, "t": 400.51827999999995, "r": 119.78551, "b": 408.84329, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 424.93805, "t": 447.52255, "r": 433.26297000000005, "b": 487.01999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "*JOBCTL", "bbox": {"l": 424.93805, "t": 447.52255, "r": 433.26297000000005, "b": 487.01999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 450.13806, "t": 401.6000700000001, "r": 458.46298, "b": 487.01999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "QIBM_DB_SECADM", "bbox": {"l": 450.13806, "t": 401.6000700000001, "r": 458.46298, "b": 487.01999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 475.93835000000007, "t": 401.53442, "r": 484.26327999999995, "b": 487.01999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "QIBM_DB_SQLADM", "bbox": {"l": 475.93835000000007, "t": 401.53442, "r": 484.26327999999995, "b": 487.01999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 501.13837, "t": 401.6145, "r": 509.46329, "b": 487.01999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "QIBM_DB_SYSMON", "bbox": {"l": 501.13837, "t": 401.6145, "r": 509.46329, "b": 487.01999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 526.39862, "t": 432.79944, "r": 534.72357, "b": 487.02005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "No Authority", "bbox": {"l": 526.39862, "t": 432.79944, "r": 534.72357, "b": 487.02005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 70.800003, "t": 498.69299, "r": 151.6794, "b": 506.66699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "SET CURRENT DEGREE", "bbox": {"l": 70.800003, "t": 498.69299, "r": 151.6794, "b": 506.66699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 151.6803, "t": 498.55798, "r": 220.15681000000004, "b": 506.883, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": " (SQL statement)", "bbox": {"l": 151.6803, "t": 498.55798, "r": 220.15681000000004, "b": 506.883, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 429.0, "t": 498.55798, "r": 435.00299000000007, "b": 506.883, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "X", "bbox": {"l": 429.0, "t": 498.55798, "r": 435.00299000000007, "b": 506.883, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 480.00031, "t": 498.55798, "r": 486.0033, "b": 506.883, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "X", "bbox": {"l": 480.00031, "t": 498.55798, "r": 486.0033, "b": 506.883, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 70.800018, "t": 517.65329, "r": 102.23972, "b": 525.62729, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "CHGQRYA", "bbox": {"l": 70.800018, "t": 517.65329, "r": 102.23972, "b": 525.62729, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 102.23972, "t": 517.51828, "r": 264.5538, "b": 525.84329, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": " command targeting a different user\u2019s job", "bbox": {"l": 102.23972, "t": 517.51828, "r": 264.5538, "b": 525.84329, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 429.00003, "t": 517.51828, "r": 435.00302000000005, "b": 525.84329, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "X", "bbox": {"l": 429.00003, "t": 517.51828, "r": 435.00302000000005, "b": 525.84329, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 480.00034, "t": 517.51828, "r": 486.00333, "b": 525.84329, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "X", "bbox": {"l": 480.00034, "t": 517.51828, "r": 486.00333, "b": 525.84329, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 70.800049, "t": 536.67299, "r": 106.73975, "b": 544.64699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "STRDBMON", "bbox": {"l": 70.800049, "t": 536.67299, "r": 106.73975, "b": 544.64699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 106.73975, "t": 536.5379800000001, "r": 119.77895, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": " or ", "bbox": {"l": 106.73975, "t": 536.5379800000001, "r": 119.77895, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 119.69975000000001, "t": 536.67299, "r": 155.69974, "b": 544.64699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "ENDDBMON", "bbox": {"l": 119.69975000000001, "t": 536.67299, "r": 155.69974, "b": 544.64699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 155.69974, "t": 536.5379800000001, "r": 322.50574, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": " commands targeting a different user\u2019s job", "bbox": {"l": 155.69974, "t": 536.5379800000001, "r": 322.50574, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 429.00003, "t": 536.5379800000001, "r": 435.00302000000005, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "X", "bbox": {"l": 429.00003, "t": 536.5379800000001, "r": 435.00302000000005, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 480.00034, "t": 536.5379800000001, "r": 486.00333, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "X", "bbox": {"l": 480.00034, "t": 536.5379800000001, "r": 486.00333, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 70.800049, "t": 555.69269, "r": 106.73975, "b": 563.66669, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "STRDBMON", "bbox": {"l": 70.800049, "t": 555.69269, "r": 106.73975, "b": 563.66669, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 106.73975, "t": 555.55768, "r": 119.77895, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": " or ", "bbox": {"l": 106.73975, "t": 555.55768, "r": 119.77895, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 119.69975000000001, "t": 555.69269, "r": 155.69974, "b": 563.66669, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "ENDDBMON", "bbox": {"l": 119.69975000000001, "t": 555.69269, "r": 155.69974, "b": 563.66669, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 155.69974, "t": 555.55768, "r": 381.02185, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": " commands targeting a job that matches the current user", "bbox": {"l": 155.69974, "t": 555.55768, "r": 381.02185, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 429.00003, "t": 555.55768, "r": 435.00302000000005, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "X", "bbox": {"l": 429.00003, "t": 555.55768, "r": 435.00302000000005, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 480.00034, "t": 555.55768, "r": 486.00333, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "X", "bbox": {"l": 480.00034, "t": 555.55768, "r": 486.00333, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 505.26061999999996, "t": 555.55768, "r": 511.26361, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "X", "bbox": {"l": 505.26061999999996, "t": 555.55768, "r": 511.26361, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 530.76031, "t": 555.55768, "r": 536.76331, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "X", "bbox": {"l": 530.76031, "t": 555.55768, "r": 536.76331, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 70.800049, "t": 574.51797, "r": 359.51736, "b": 582.84299, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "QUSRJOBI() API format 900 or System i Navigator\u2019s SQL Details for Job", "bbox": {"l": 70.800049, "t": 574.51797, "r": 359.51736, "b": 582.84299, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 429.0000600000001, "t": 574.51797, "r": 435.00305000000003, "b": 582.84299, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "X", "bbox": {"l": 429.0000600000001, "t": 574.51797, "r": 435.00305000000003, "b": 582.84299, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 480.00037, "t": 574.51797, "r": 486.00335999999993, "b": 582.84299, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "X", "bbox": {"l": 480.00037, "t": 574.51797, "r": 486.00335999999993, "b": 582.84299, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 505.2606799999999, "t": 574.51797, "r": 511.26367, "b": 582.84299, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "X", "bbox": {"l": 505.2606799999999, "t": 574.51797, "r": 511.26367, "b": 582.84299, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 70.800079, "t": 593.5376699999999, "r": 220.75178999999997, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "Visual Explain within Run SQL scripts", "bbox": {"l": 70.800079, "t": 593.5376699999999, "r": 220.75178999999997, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 429.0000600000001, "t": 593.5376699999999, "r": 435.00305000000003, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "X", "bbox": {"l": 429.0000600000001, "t": 593.5376699999999, "r": 435.00305000000003, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 480.00037, "t": 593.5376699999999, "r": 486.00335999999993, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "X", "bbox": {"l": 480.00037, "t": 593.5376699999999, "r": 486.00335999999993, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 505.2606799999999, "t": 593.5376699999999, "r": 511.26367, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "X", "bbox": {"l": 505.2606799999999, "t": 593.5376699999999, "r": 511.26367, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 530.76038, "t": 593.5376699999999, "r": 536.76337, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "X", "bbox": {"l": 530.76038, "t": 593.5376699999999, "r": 536.76337, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 70.800079, "t": 612.55737, "r": 236.6548, "b": 620.88239, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "Visual Explain outside of Run SQL scripts", "bbox": {"l": 70.800079, "t": 612.55737, "r": 236.6548, "b": 620.88239, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 429.0000600000001, "t": 612.55737, "r": 435.00305000000003, "b": 620.88239, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "X", "bbox": {"l": 429.0000600000001, "t": 612.55737, "r": 435.00305000000003, "b": 620.88239, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 480.00037, "t": 612.55737, "r": 486.00335999999993, "b": 620.88239, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "X", "bbox": {"l": 480.00037, "t": 612.55737, "r": 486.00335999999993, "b": 620.88239, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 70.800079, "t": 631.51767, "r": 213.12968, "b": 639.84268, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "ANALYZE PLAN CACHE procedure", "bbox": {"l": 70.800079, "t": 631.51767, "r": 213.12968, "b": 639.84268, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 429.0000600000001, "t": 631.51767, "r": 435.00305000000003, "b": 639.84268, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "X", "bbox": {"l": 429.0000600000001, "t": 631.51767, "r": 435.00305000000003, "b": 639.84268, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 480.00037, "t": 631.51767, "r": 486.00335999999993, "b": 639.84268, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "X", "bbox": {"l": 480.00037, "t": 631.51767, "r": 486.00335999999993, "b": 639.84268, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 70.800079, "t": 650.53737, "r": 199.87808, "b": 658.86238, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "DUMP PLAN CACHE procedure", "bbox": {"l": 70.800079, "t": 650.53737, "r": 199.87808, "b": 658.86238, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 429.0000600000001, "t": 650.53737, "r": 435.00305000000003, "b": 658.86238, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "X", "bbox": {"l": 429.0000600000001, "t": 650.53737, "r": 435.00305000000003, "b": 658.86238, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 480.00037, "t": 650.53737, "r": 486.00335999999993, "b": 658.86238, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "X", "bbox": {"l": 480.00037, "t": 650.53737, "r": 486.00335999999993, "b": 658.86238, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 70.800079, "t": 669.55708, "r": 208.36777, "b": 677.88207, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "MODIFY PLAN CACHE procedure", "bbox": {"l": 70.800079, "t": 669.55708, "r": 208.36777, "b": 677.88207, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 429.0000600000001, "t": 669.55708, "r": 435.00305000000003, "b": 677.88207, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "X", "bbox": {"l": 429.0000600000001, "t": 669.55708, "r": 435.00305000000003, "b": 677.88207, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 480.00037, "t": 669.55708, "r": 486.00335999999993, "b": 677.88207, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "X", "bbox": {"l": 480.00037, "t": 669.55708, "r": 486.00335999999993, "b": 677.88207, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 70.800079, "t": 688.57677, "r": 411.20264, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "MODIFY PLAN CACHE PROPERTIES procedure (currently does not check authority)", "bbox": {"l": 70.800079, "t": 688.57677, "r": 411.20264, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 429.0000600000001, "t": 688.57677, "r": 435.00305000000003, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "X", "bbox": {"l": 429.0000600000001, "t": 688.57677, "r": 435.00305000000003, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 480.00037, "t": 688.57677, "r": 486.00335999999993, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "X", "bbox": {"l": 480.00037, "t": 688.57677, "r": 486.00335999999993, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 70.800079, "t": 707.537071, "r": 377.12585, "b": 715.862068, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "CHANGE PLAN CACHE SIZE procedure (currently does not check authority)", "bbox": {"l": 70.800079, "t": 707.537071, "r": 377.12585, "b": 715.862068, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 429.0000600000001, "t": 707.537071, "r": 435.00305000000003, "b": 715.862068, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "X", "bbox": {"l": 429.0000600000001, "t": 707.537071, "r": 435.00305000000003, "b": 715.862068, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 480.00037, "t": 707.537071, "r": 486.00335999999993, "b": 715.862068, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "X", "bbox": {"l": 480.00037, "t": 707.537071, "r": 486.00335999999993, "b": 715.862068, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "ecel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "ecel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "ecel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "ecel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "ecel", "fcel", "fcel", "ecel", "nl", "rhed", "fcel", "ecel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "ecel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "ecel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "ecel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "ecel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "ecel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "ecel", "fcel", "ecel", "ecel", "nl"], "num_rows": 13, "num_cols": 6, "table_cells": [{"bbox": {"l": 70.800301, "t": 400.51827999999995, "r": 119.78551, "b": 408.84329, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "User action", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 424.93805, "t": 447.52255, "r": 433.26297000000005, "b": 487.01999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "*JOBCTL", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 450.13806, "t": 401.6000700000001, "r": 458.46298, "b": 487.01999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "QIBM_DB_SECADM", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 475.93835000000007, "t": 401.53442, "r": 484.26327999999995, "b": 487.01999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "QIBM_DB_SQLADM", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 501.13837, "t": 401.6145, "r": 509.46329, "b": 487.01999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "QIBM_DB_SYSMON", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 526.39862, "t": 432.79944, "r": 534.72357, "b": 487.02005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "No Authority", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800003, "t": 498.55798, "r": 220.15681000000004, "b": 506.883, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "SET CURRENT DEGREE  (SQL statement)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0, "t": 498.55798, "r": 435.00299000000007, "b": 506.883, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00031, "t": 498.55798, "r": 486.0033, "b": 506.883, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800018, "t": 517.51828, "r": 264.5538, "b": 525.84329, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "CHGQRYA  command targeting a different user\u2019s job", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.00003, "t": 517.51828, "r": 435.00302000000005, "b": 525.84329, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00034, "t": 517.51828, "r": 486.00333, "b": 525.84329, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800049, "t": 536.5379800000001, "r": 322.50574, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "STRDBMON  or  ENDDBMON  commands targeting a different user\u2019s job", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.00003, "t": 536.5379800000001, "r": 435.00302000000005, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00034, "t": 536.5379800000001, "r": 486.00333, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800049, "t": 555.55768, "r": 381.02185, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "STRDBMON  or  ENDDBMON  commands targeting a job that matches the current user", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.00003, "t": 555.55768, "r": 435.00302000000005, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00034, "t": 555.55768, "r": 486.00333, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 505.26061999999996, "t": 555.55768, "r": 511.26361, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 530.76031, "t": 555.55768, "r": 536.76331, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800049, "t": 574.51797, "r": 359.51736, "b": 582.84299, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "QUSRJOBI() API format 900 or System i Navigator\u2019s SQL Details for Job", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 574.51797, "r": 435.00305000000003, "b": 582.84299, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 574.51797, "r": 486.00335999999993, "b": 582.84299, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 505.2606799999999, "t": 574.51797, "r": 511.26367, "b": 582.84299, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800079, "t": 593.5376699999999, "r": 220.75178999999997, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Visual Explain within Run SQL scripts", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 593.5376699999999, "r": 435.00305000000003, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 593.5376699999999, "r": 486.00335999999993, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 505.2606799999999, "t": 593.5376699999999, "r": 511.26367, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 530.76038, "t": 593.5376699999999, "r": 536.76337, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800079, "t": 612.55737, "r": 236.6548, "b": 620.88239, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Visual Explain outside of Run SQL scripts", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 612.55737, "r": 435.00305000000003, "b": 620.88239, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 612.55737, "r": 486.00335999999993, "b": 620.88239, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800079, "t": 631.51767, "r": 213.12968, "b": 639.84268, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "ANALYZE PLAN CACHE procedure", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 631.51767, "r": 435.00305000000003, "b": 639.84268, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 631.51767, "r": 486.00335999999993, "b": 639.84268, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800079, "t": 650.53737, "r": 199.87808, "b": 658.86238, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "DUMP PLAN CACHE procedure", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 650.53737, "r": 435.00305000000003, "b": 658.86238, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 650.53737, "r": 486.00335999999993, "b": 658.86238, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800079, "t": 669.55708, "r": 208.36777, "b": 677.88207, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "MODIFY PLAN CACHE procedure", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 669.55708, "r": 435.00305000000003, "b": 677.88207, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 669.55708, "r": 486.00335999999993, "b": 677.88207, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800079, "t": 688.57677, "r": 411.20264, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "MODIFY PLAN CACHE PROPERTIES procedure (currently does not check authority)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 688.57677, "r": 435.00305000000003, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 688.57677, "r": 486.00335999999993, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800079, "t": 707.537071, "r": 377.12585, "b": 715.862068, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "CHANGE PLAN CACHE SIZE procedure (currently does not check authority)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 707.537071, "r": 435.00305000000003, "b": 715.862068, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 707.537071, "r": 486.00335999999993, "b": 715.862068, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}]}}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_footer", "id": 7, "page_no": 8, "cluster": {"id": 7, "label": "page_footer", "bbox": {"l": 355.32001, "t": 755.538002, "r": 523.54071, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9508126378059387, "cells": [{"id": 0, "text": "Chapter 2. Roles and separation of duties ", "bbox": {"l": 355.32001, "t": 755.538002, "r": 523.54071, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Chapter 2. Roles and separation of duties"}, {"label": "page_footer", "id": 9, "page_no": 8, "cluster": {"id": 9, "label": "page_footer", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.8987301588058472, "cells": [{"id": 1, "text": "11", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "11"}, {"label": "text", "id": 2, "page_no": 8, "cluster": {"id": 2, "label": "text", "bbox": {"l": 136.79959, "t": 71.50903000000005, "r": 542.69434, "b": 140.72113000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9789126515388489, "cells": [{"id": 2, "text": "For example, assume that a business has assigned the duty to manage security on IBM i to ", "bbox": {"l": 136.79959, "t": 71.50903000000005, "r": 542.69434, "b": 80.72204999999985, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Theresa. Before release IBM i 7.2, to grant privileges, Theresa had to have the same ", "bbox": {"l": 136.79959, "t": 83.50885000000017, "r": 513.67804, "b": 92.72185999999999, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "privileges Theresa was granting to others. Therefore, to grant *USE privileges to the ", "bbox": {"l": 136.79959, "t": 95.50867000000005, "r": 509.71902, "b": 104.72167999999999, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "PAYROLL table, Theresa had to have *OBJMGT and *USE authority (or a higher level of ", "bbox": {"l": 136.79959, "t": 107.50847999999996, "r": 528.20184, "b": 116.72149999999999, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "authority, such as *ALLOBJ). This requirement allowed Theresa to access the data in the ", "bbox": {"l": 136.79959, "t": 119.50829999999996, "r": 531.84015, "b": 128.72131000000002, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "PAYROLL table even though Theresa\u2019s job description was only to manage its security.", "bbox": {"l": 136.79959, "t": 131.50811999999996, "r": 519.24982, "b": 140.72113000000002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "For example, assume that a business has assigned the duty to manage security on IBM i to Theresa. Before release IBM i 7.2, to grant privileges, Theresa had to have the same privileges Theresa was granting to others. Therefore, to grant *USE privileges to the PAYROLL table, Theresa had to have *OBJMGT and *USE authority (or a higher level of authority, such as *ALLOBJ). This requirement allowed Theresa to access the data in the PAYROLL table even though Theresa's job description was only to manage its security."}, {"label": "text", "id": 6, "page_no": 8, "cluster": {"id": 6, "label": "text", "bbox": {"l": 136.79959, "t": 153.52770999999996, "r": 547.30396, "b": 198.74017000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9665538668632507, "cells": [{"id": 8, "text": "In IBM i 7.2, the QIBM_DB_SECADM function usage grants authorities, revokes authorities, ", "bbox": {"l": 136.79959, "t": 153.52770999999996, "r": 544.16064, "b": 162.74072, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "changes ownership, or changes the primary group without giving access to the object or, in ", "bbox": {"l": 136.79959, "t": 165.52752999999996, "r": 540.66156, "b": 174.74054, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "the case of a database table, to the data that is in the table or allowing other operations on the ", "bbox": {"l": 136.79959, "t": 177.52733999999998, "r": 547.30396, "b": 186.74036, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "table. ", "bbox": {"l": 136.79959, "t": 189.52715999999998, "r": 163.6189, "b": 198.74017000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In IBM i 7.2, the QIBM_DB_SECADM function usage grants authorities, revokes authorities, changes ownership, or changes the primary group without giving access to the object or, in the case of a database table, to the data that is in the table or allowing other operations on the table."}, {"label": "text", "id": 4, "page_no": 8, "cluster": {"id": 4, "label": "text", "bbox": {"l": 136.79959, "t": 211.48694, "r": 538.65076, "b": 232.69976999999994, "coord_origin": "TOPLEFT"}, "confidence": 0.9691813588142395, "cells": [{"id": 12, "text": "QIBM_DB_SECADM function usage can be granted only by a user with *SECADM special ", "bbox": {"l": 136.79959, "t": 211.48694, "r": 538.65076, "b": 220.69994999999994, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "authority and can be given to a user or a group.", "bbox": {"l": 136.79959, "t": 223.48676, "r": 346.34808, "b": 232.69976999999994, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "QIBM_DB_SECADM function usage can be granted only by a user with *SECADM special authority and can be given to a user or a group."}, {"label": "text", "id": 3, "page_no": 8, "cluster": {"id": 3, "label": "text", "bbox": {"l": 136.79959, "t": 245.50635, "r": 545.79602, "b": 278.71898999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9729602336883545, "cells": [{"id": 14, "text": "QIBM_DB_SECADM also is responsible for administering RCAC, which restricts which rows ", "bbox": {"l": 136.79959, "t": 245.50635, "r": 545.79602, "b": 254.71936000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "a user is allowed to access in a table and whether a user is allowed to see information in ", "bbox": {"l": 136.79959, "t": 257.50616, "r": 529.46149, "b": 266.71918000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "certain columns of a table.", "bbox": {"l": 136.79959, "t": 269.50598, "r": 253.47696999999997, "b": 278.71898999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "QIBM_DB_SECADM also is responsible for administering RCAC, which restricts which rows a user is allowed to access in a table and whether a user is allowed to see information in certain columns of a table."}, {"label": "text", "id": 1, "page_no": 8, "cluster": {"id": 1, "label": "text", "bbox": {"l": 136.79959, "t": 291.52557, "r": 539.80713, "b": 336.73801, "coord_origin": "TOPLEFT"}, "confidence": 0.9815152883529663, "cells": [{"id": 17, "text": "A preferred practice is that the RCAC administrator has the QIBM_DB_SECADM function ", "bbox": {"l": 136.79959, "t": 291.52557, "r": 533.78137, "b": 300.73856, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "usage ID, but absolutely no other data privileges. The result is that the RCAC administrator ", "bbox": {"l": 136.79959, "t": 303.52539, "r": 539.80713, "b": 312.73837000000003, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "can deploy and maintain the RCAC constructs, but cannot grant themselves unauthorized ", "bbox": {"l": 136.79959, "t": 315.52521, "r": 534.5741, "b": 324.73819, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "access to data itself.", "bbox": {"l": 136.79959, "t": 327.52502, "r": 227.02324, "b": 336.73801, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "A preferred practice is that the RCAC administrator has the QIBM_DB_SECADM function usage ID, but absolutely no other data privileges. The result is that the RCAC administrator can deploy and maintain the RCAC constructs, but cannot grant themselves unauthorized access to data itself."}, {"label": "text", "id": 5, "page_no": 8, "cluster": {"id": 5, "label": "text", "bbox": {"l": 136.79959, "t": 349.48483, "r": 543.06714, "b": 370.69763000000006, "coord_origin": "TOPLEFT"}, "confidence": 0.9672255516052246, "cells": [{"id": 21, "text": "Table 2-2 shows a comparison of the different function usage IDs and *JOBCTL authority to ", "bbox": {"l": 136.79959, "t": 349.48483, "r": 543.06714, "b": 358.69780999999995, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "the different CL commands and DB2 for i tools.", "bbox": {"l": 136.79959, "t": 361.48465, "r": 343.79236, "b": 370.69763000000006, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 2-2 shows a comparison of the different function usage IDs and *JOBCTL authority to the different CL commands and DB2 for i tools."}, {"label": "caption", "id": 8, "page_no": 8, "cluster": {"id": 8, "label": "caption", "bbox": {"l": 64.800003, "t": 383.5379899999999, "r": 391.75464, "b": 391.86301, "coord_origin": "TOPLEFT"}, "confidence": 0.9337189793586731, "cells": [{"id": 23, "text": "Table 2-2 Comparison of the different function usage IDs and *JOBCTL authority", "bbox": {"l": 64.800003, "t": 383.5379899999999, "r": 391.75464, "b": 391.86301, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 2-2 Comparison of the different function usage IDs and *JOBCTL authority"}, {"label": "table", "id": 0, "page_no": 8, "cluster": {"id": 0, "label": "table", "bbox": {"l": 64.41139221191406, "t": 393.6136169433594, "r": 547.3950805664062, "b": 721.60791015625, "coord_origin": "TOPLEFT"}, "confidence": 0.9899571537971497, "cells": [{"id": 24, "text": "User action", "bbox": {"l": 70.800301, "t": 400.51827999999995, "r": 119.78551, "b": 408.84329, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "*JOBCTL", "bbox": {"l": 424.93805, "t": 447.52255, "r": 433.26297000000005, "b": 487.01999, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "QIBM_DB_SECADM", "bbox": {"l": 450.13806, "t": 401.6000700000001, "r": 458.46298, "b": 487.01999, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "QIBM_DB_SQLADM", "bbox": {"l": 475.93835000000007, "t": 401.53442, "r": 484.26327999999995, "b": 487.01999, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "QIBM_DB_SYSMON", "bbox": {"l": 501.13837, "t": 401.6145, "r": 509.46329, "b": 487.01999, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "No Authority", "bbox": {"l": 526.39862, "t": 432.79944, "r": 534.72357, "b": 487.02005, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "SET CURRENT DEGREE", "bbox": {"l": 70.800003, "t": 498.69299, "r": 151.6794, "b": 506.66699, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": " (SQL statement)", "bbox": {"l": 151.6803, "t": 498.55798, "r": 220.15681000000004, "b": 506.883, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "X", "bbox": {"l": 429.0, "t": 498.55798, "r": 435.00299000000007, "b": 506.883, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "X", "bbox": {"l": 480.00031, "t": 498.55798, "r": 486.0033, "b": 506.883, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "CHGQRYA", "bbox": {"l": 70.800018, "t": 517.65329, "r": 102.23972, "b": 525.62729, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": " command targeting a different user\u2019s job", "bbox": {"l": 102.23972, "t": 517.51828, "r": 264.5538, "b": 525.84329, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "X", "bbox": {"l": 429.00003, "t": 517.51828, "r": 435.00302000000005, "b": 525.84329, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "X", "bbox": {"l": 480.00034, "t": 517.51828, "r": 486.00333, "b": 525.84329, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "STRDBMON", "bbox": {"l": 70.800049, "t": 536.67299, "r": 106.73975, "b": 544.64699, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": " or ", "bbox": {"l": 106.73975, "t": 536.5379800000001, "r": 119.77895, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "ENDDBMON", "bbox": {"l": 119.69975000000001, "t": 536.67299, "r": 155.69974, "b": 544.64699, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": " commands targeting a different user\u2019s job", "bbox": {"l": 155.69974, "t": 536.5379800000001, "r": 322.50574, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "X", "bbox": {"l": 429.00003, "t": 536.5379800000001, "r": 435.00302000000005, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "X", "bbox": {"l": 480.00034, "t": 536.5379800000001, "r": 486.00333, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "STRDBMON", "bbox": {"l": 70.800049, "t": 555.69269, "r": 106.73975, "b": 563.66669, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": " or ", "bbox": {"l": 106.73975, "t": 555.55768, "r": 119.77895, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "ENDDBMON", "bbox": {"l": 119.69975000000001, "t": 555.69269, "r": 155.69974, "b": 563.66669, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": " commands targeting a job that matches the current user", "bbox": {"l": 155.69974, "t": 555.55768, "r": 381.02185, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "X", "bbox": {"l": 429.00003, "t": 555.55768, "r": 435.00302000000005, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "X", "bbox": {"l": 480.00034, "t": 555.55768, "r": 486.00333, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "X", "bbox": {"l": 505.26061999999996, "t": 555.55768, "r": 511.26361, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "X", "bbox": {"l": 530.76031, "t": 555.55768, "r": 536.76331, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "QUSRJOBI() API format 900 or System i Navigator\u2019s SQL Details for Job", "bbox": {"l": 70.800049, "t": 574.51797, "r": 359.51736, "b": 582.84299, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "X", "bbox": {"l": 429.0000600000001, "t": 574.51797, "r": 435.00305000000003, "b": 582.84299, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "X", "bbox": {"l": 480.00037, "t": 574.51797, "r": 486.00335999999993, "b": 582.84299, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "X", "bbox": {"l": 505.2606799999999, "t": 574.51797, "r": 511.26367, "b": 582.84299, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Visual Explain within Run SQL scripts", "bbox": {"l": 70.800079, "t": 593.5376699999999, "r": 220.75178999999997, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "X", "bbox": {"l": 429.0000600000001, "t": 593.5376699999999, "r": 435.00305000000003, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "X", "bbox": {"l": 480.00037, "t": 593.5376699999999, "r": 486.00335999999993, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "X", "bbox": {"l": 505.2606799999999, "t": 593.5376699999999, "r": 511.26367, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "X", "bbox": {"l": 530.76038, "t": 593.5376699999999, "r": 536.76337, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "Visual Explain outside of Run SQL scripts", "bbox": {"l": 70.800079, "t": 612.55737, "r": 236.6548, "b": 620.88239, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "X", "bbox": {"l": 429.0000600000001, "t": 612.55737, "r": 435.00305000000003, "b": 620.88239, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "X", "bbox": {"l": 480.00037, "t": 612.55737, "r": 486.00335999999993, "b": 620.88239, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "ANALYZE PLAN CACHE procedure", "bbox": {"l": 70.800079, "t": 631.51767, "r": 213.12968, "b": 639.84268, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "X", "bbox": {"l": 429.0000600000001, "t": 631.51767, "r": 435.00305000000003, "b": 639.84268, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "X", "bbox": {"l": 480.00037, "t": 631.51767, "r": 486.00335999999993, "b": 639.84268, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "DUMP PLAN CACHE procedure", "bbox": {"l": 70.800079, "t": 650.53737, "r": 199.87808, "b": 658.86238, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "X", "bbox": {"l": 429.0000600000001, "t": 650.53737, "r": 435.00305000000003, "b": 658.86238, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "X", "bbox": {"l": 480.00037, "t": 650.53737, "r": 486.00335999999993, "b": 658.86238, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "MODIFY PLAN CACHE procedure", "bbox": {"l": 70.800079, "t": 669.55708, "r": 208.36777, "b": 677.88207, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "X", "bbox": {"l": 429.0000600000001, "t": 669.55708, "r": 435.00305000000003, "b": 677.88207, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "X", "bbox": {"l": 480.00037, "t": 669.55708, "r": 486.00335999999993, "b": 677.88207, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "MODIFY PLAN CACHE PROPERTIES procedure (currently does not check authority)", "bbox": {"l": 70.800079, "t": 688.57677, "r": 411.20264, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "X", "bbox": {"l": 429.0000600000001, "t": 688.57677, "r": 435.00305000000003, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "X", "bbox": {"l": 480.00037, "t": 688.57677, "r": 486.00335999999993, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "CHANGE PLAN CACHE SIZE procedure (currently does not check authority)", "bbox": {"l": 70.800079, "t": 707.537071, "r": 377.12585, "b": 715.862068, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "X", "bbox": {"l": 429.0000600000001, "t": 707.537071, "r": 435.00305000000003, "b": 715.862068, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "X", "bbox": {"l": 480.00037, "t": 707.537071, "r": 486.00335999999993, "b": 715.862068, "coord_origin": "TOPLEFT"}}], "children": [{"id": 10, "label": "text", "bbox": {"l": 70.800301, "t": 400.51827999999995, "r": 119.78551, "b": 408.84329, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "User action", "bbox": {"l": 70.800301, "t": 400.51827999999995, "r": 119.78551, "b": 408.84329, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 424.93805, "t": 447.52255, "r": 433.26297000000005, "b": 487.01999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "*JOBCTL", "bbox": {"l": 424.93805, "t": 447.52255, "r": 433.26297000000005, "b": 487.01999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 450.13806, "t": 401.6000700000001, "r": 458.46298, "b": 487.01999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "QIBM_DB_SECADM", "bbox": {"l": 450.13806, "t": 401.6000700000001, "r": 458.46298, "b": 487.01999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 475.93835000000007, "t": 401.53442, "r": 484.26327999999995, "b": 487.01999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "QIBM_DB_SQLADM", "bbox": {"l": 475.93835000000007, "t": 401.53442, "r": 484.26327999999995, "b": 487.01999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 501.13837, "t": 401.6145, "r": 509.46329, "b": 487.01999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "QIBM_DB_SYSMON", "bbox": {"l": 501.13837, "t": 401.6145, "r": 509.46329, "b": 487.01999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 526.39862, "t": 432.79944, "r": 534.72357, "b": 487.02005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "No Authority", "bbox": {"l": 526.39862, "t": 432.79944, "r": 534.72357, "b": 487.02005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 70.800003, "t": 498.69299, "r": 151.6794, "b": 506.66699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "SET CURRENT DEGREE", "bbox": {"l": 70.800003, "t": 498.69299, "r": 151.6794, "b": 506.66699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 151.6803, "t": 498.55798, "r": 220.15681000000004, "b": 506.883, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": " (SQL statement)", "bbox": {"l": 151.6803, "t": 498.55798, "r": 220.15681000000004, "b": 506.883, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 429.0, "t": 498.55798, "r": 435.00299000000007, "b": 506.883, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "X", "bbox": {"l": 429.0, "t": 498.55798, "r": 435.00299000000007, "b": 506.883, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 480.00031, "t": 498.55798, "r": 486.0033, "b": 506.883, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "X", "bbox": {"l": 480.00031, "t": 498.55798, "r": 486.0033, "b": 506.883, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 70.800018, "t": 517.65329, "r": 102.23972, "b": 525.62729, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "CHGQRYA", "bbox": {"l": 70.800018, "t": 517.65329, "r": 102.23972, "b": 525.62729, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 102.23972, "t": 517.51828, "r": 264.5538, "b": 525.84329, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": " command targeting a different user\u2019s job", "bbox": {"l": 102.23972, "t": 517.51828, "r": 264.5538, "b": 525.84329, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 429.00003, "t": 517.51828, "r": 435.00302000000005, "b": 525.84329, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "X", "bbox": {"l": 429.00003, "t": 517.51828, "r": 435.00302000000005, "b": 525.84329, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 480.00034, "t": 517.51828, "r": 486.00333, "b": 525.84329, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "X", "bbox": {"l": 480.00034, "t": 517.51828, "r": 486.00333, "b": 525.84329, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 70.800049, "t": 536.67299, "r": 106.73975, "b": 544.64699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "STRDBMON", "bbox": {"l": 70.800049, "t": 536.67299, "r": 106.73975, "b": 544.64699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 106.73975, "t": 536.5379800000001, "r": 119.77895, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": " or ", "bbox": {"l": 106.73975, "t": 536.5379800000001, "r": 119.77895, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 119.69975000000001, "t": 536.67299, "r": 155.69974, "b": 544.64699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "ENDDBMON", "bbox": {"l": 119.69975000000001, "t": 536.67299, "r": 155.69974, "b": 544.64699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 155.69974, "t": 536.5379800000001, "r": 322.50574, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": " commands targeting a different user\u2019s job", "bbox": {"l": 155.69974, "t": 536.5379800000001, "r": 322.50574, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 429.00003, "t": 536.5379800000001, "r": 435.00302000000005, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "X", "bbox": {"l": 429.00003, "t": 536.5379800000001, "r": 435.00302000000005, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 480.00034, "t": 536.5379800000001, "r": 486.00333, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "X", "bbox": {"l": 480.00034, "t": 536.5379800000001, "r": 486.00333, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 70.800049, "t": 555.69269, "r": 106.73975, "b": 563.66669, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "STRDBMON", "bbox": {"l": 70.800049, "t": 555.69269, "r": 106.73975, "b": 563.66669, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 106.73975, "t": 555.55768, "r": 119.77895, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": " or ", "bbox": {"l": 106.73975, "t": 555.55768, "r": 119.77895, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 119.69975000000001, "t": 555.69269, "r": 155.69974, "b": 563.66669, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "ENDDBMON", "bbox": {"l": 119.69975000000001, "t": 555.69269, "r": 155.69974, "b": 563.66669, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 155.69974, "t": 555.55768, "r": 381.02185, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": " commands targeting a job that matches the current user", "bbox": {"l": 155.69974, "t": 555.55768, "r": 381.02185, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 429.00003, "t": 555.55768, "r": 435.00302000000005, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "X", "bbox": {"l": 429.00003, "t": 555.55768, "r": 435.00302000000005, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 480.00034, "t": 555.55768, "r": 486.00333, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "X", "bbox": {"l": 480.00034, "t": 555.55768, "r": 486.00333, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 505.26061999999996, "t": 555.55768, "r": 511.26361, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "X", "bbox": {"l": 505.26061999999996, "t": 555.55768, "r": 511.26361, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 530.76031, "t": 555.55768, "r": 536.76331, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "X", "bbox": {"l": 530.76031, "t": 555.55768, "r": 536.76331, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 70.800049, "t": 574.51797, "r": 359.51736, "b": 582.84299, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "QUSRJOBI() API format 900 or System i Navigator\u2019s SQL Details for Job", "bbox": {"l": 70.800049, "t": 574.51797, "r": 359.51736, "b": 582.84299, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 429.0000600000001, "t": 574.51797, "r": 435.00305000000003, "b": 582.84299, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "X", "bbox": {"l": 429.0000600000001, "t": 574.51797, "r": 435.00305000000003, "b": 582.84299, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 480.00037, "t": 574.51797, "r": 486.00335999999993, "b": 582.84299, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "X", "bbox": {"l": 480.00037, "t": 574.51797, "r": 486.00335999999993, "b": 582.84299, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 505.2606799999999, "t": 574.51797, "r": 511.26367, "b": 582.84299, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "X", "bbox": {"l": 505.2606799999999, "t": 574.51797, "r": 511.26367, "b": 582.84299, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 70.800079, "t": 593.5376699999999, "r": 220.75178999999997, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "Visual Explain within Run SQL scripts", "bbox": {"l": 70.800079, "t": 593.5376699999999, "r": 220.75178999999997, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 429.0000600000001, "t": 593.5376699999999, "r": 435.00305000000003, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "X", "bbox": {"l": 429.0000600000001, "t": 593.5376699999999, "r": 435.00305000000003, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 480.00037, "t": 593.5376699999999, "r": 486.00335999999993, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "X", "bbox": {"l": 480.00037, "t": 593.5376699999999, "r": 486.00335999999993, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 505.2606799999999, "t": 593.5376699999999, "r": 511.26367, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "X", "bbox": {"l": 505.2606799999999, "t": 593.5376699999999, "r": 511.26367, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 530.76038, "t": 593.5376699999999, "r": 536.76337, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "X", "bbox": {"l": 530.76038, "t": 593.5376699999999, "r": 536.76337, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 70.800079, "t": 612.55737, "r": 236.6548, "b": 620.88239, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "Visual Explain outside of Run SQL scripts", "bbox": {"l": 70.800079, "t": 612.55737, "r": 236.6548, "b": 620.88239, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 429.0000600000001, "t": 612.55737, "r": 435.00305000000003, "b": 620.88239, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "X", "bbox": {"l": 429.0000600000001, "t": 612.55737, "r": 435.00305000000003, "b": 620.88239, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 480.00037, "t": 612.55737, "r": 486.00335999999993, "b": 620.88239, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "X", "bbox": {"l": 480.00037, "t": 612.55737, "r": 486.00335999999993, "b": 620.88239, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 70.800079, "t": 631.51767, "r": 213.12968, "b": 639.84268, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "ANALYZE PLAN CACHE procedure", "bbox": {"l": 70.800079, "t": 631.51767, "r": 213.12968, "b": 639.84268, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 429.0000600000001, "t": 631.51767, "r": 435.00305000000003, "b": 639.84268, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "X", "bbox": {"l": 429.0000600000001, "t": 631.51767, "r": 435.00305000000003, "b": 639.84268, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 480.00037, "t": 631.51767, "r": 486.00335999999993, "b": 639.84268, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "X", "bbox": {"l": 480.00037, "t": 631.51767, "r": 486.00335999999993, "b": 639.84268, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 70.800079, "t": 650.53737, "r": 199.87808, "b": 658.86238, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "DUMP PLAN CACHE procedure", "bbox": {"l": 70.800079, "t": 650.53737, "r": 199.87808, "b": 658.86238, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 429.0000600000001, "t": 650.53737, "r": 435.00305000000003, "b": 658.86238, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "X", "bbox": {"l": 429.0000600000001, "t": 650.53737, "r": 435.00305000000003, "b": 658.86238, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 480.00037, "t": 650.53737, "r": 486.00335999999993, "b": 658.86238, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "X", "bbox": {"l": 480.00037, "t": 650.53737, "r": 486.00335999999993, "b": 658.86238, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 70.800079, "t": 669.55708, "r": 208.36777, "b": 677.88207, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "MODIFY PLAN CACHE procedure", "bbox": {"l": 70.800079, "t": 669.55708, "r": 208.36777, "b": 677.88207, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 429.0000600000001, "t": 669.55708, "r": 435.00305000000003, "b": 677.88207, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "X", "bbox": {"l": 429.0000600000001, "t": 669.55708, "r": 435.00305000000003, "b": 677.88207, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 480.00037, "t": 669.55708, "r": 486.00335999999993, "b": 677.88207, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "X", "bbox": {"l": 480.00037, "t": 669.55708, "r": 486.00335999999993, "b": 677.88207, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 70.800079, "t": 688.57677, "r": 411.20264, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "MODIFY PLAN CACHE PROPERTIES procedure (currently does not check authority)", "bbox": {"l": 70.800079, "t": 688.57677, "r": 411.20264, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 429.0000600000001, "t": 688.57677, "r": 435.00305000000003, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "X", "bbox": {"l": 429.0000600000001, "t": 688.57677, "r": 435.00305000000003, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 480.00037, "t": 688.57677, "r": 486.00335999999993, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "X", "bbox": {"l": 480.00037, "t": 688.57677, "r": 486.00335999999993, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 70.800079, "t": 707.537071, "r": 377.12585, "b": 715.862068, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "CHANGE PLAN CACHE SIZE procedure (currently does not check authority)", "bbox": {"l": 70.800079, "t": 707.537071, "r": 377.12585, "b": 715.862068, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 429.0000600000001, "t": 707.537071, "r": 435.00305000000003, "b": 715.862068, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "X", "bbox": {"l": 429.0000600000001, "t": 707.537071, "r": 435.00305000000003, "b": 715.862068, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 480.00037, "t": 707.537071, "r": 486.00335999999993, "b": 715.862068, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "X", "bbox": {"l": 480.00037, "t": 707.537071, "r": 486.00335999999993, "b": 715.862068, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "ecel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "ecel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "ecel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "ecel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "ecel", "fcel", "fcel", "ecel", "nl", "rhed", "fcel", "ecel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "ecel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "ecel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "ecel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "ecel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "ecel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "ecel", "fcel", "ecel", "ecel", "nl"], "num_rows": 13, "num_cols": 6, "table_cells": [{"bbox": {"l": 70.800301, "t": 400.51827999999995, "r": 119.78551, "b": 408.84329, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "User action", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 424.93805, "t": 447.52255, "r": 433.26297000000005, "b": 487.01999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "*JOBCTL", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 450.13806, "t": 401.6000700000001, "r": 458.46298, "b": 487.01999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "QIBM_DB_SECADM", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 475.93835000000007, "t": 401.53442, "r": 484.26327999999995, "b": 487.01999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "QIBM_DB_SQLADM", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 501.13837, "t": 401.6145, "r": 509.46329, "b": 487.01999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "QIBM_DB_SYSMON", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 526.39862, "t": 432.79944, "r": 534.72357, "b": 487.02005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "No Authority", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800003, "t": 498.55798, "r": 220.15681000000004, "b": 506.883, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "SET CURRENT DEGREE  (SQL statement)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0, "t": 498.55798, "r": 435.00299000000007, "b": 506.883, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00031, "t": 498.55798, "r": 486.0033, "b": 506.883, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800018, "t": 517.51828, "r": 264.5538, "b": 525.84329, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "CHGQRYA  command targeting a different user\u2019s job", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.00003, "t": 517.51828, "r": 435.00302000000005, "b": 525.84329, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00034, "t": 517.51828, "r": 486.00333, "b": 525.84329, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800049, "t": 536.5379800000001, "r": 322.50574, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "STRDBMON  or  ENDDBMON  commands targeting a different user\u2019s job", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.00003, "t": 536.5379800000001, "r": 435.00302000000005, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00034, "t": 536.5379800000001, "r": 486.00333, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800049, "t": 555.55768, "r": 381.02185, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "STRDBMON  or  ENDDBMON  commands targeting a job that matches the current user", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.00003, "t": 555.55768, "r": 435.00302000000005, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00034, "t": 555.55768, "r": 486.00333, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 505.26061999999996, "t": 555.55768, "r": 511.26361, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 530.76031, "t": 555.55768, "r": 536.76331, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800049, "t": 574.51797, "r": 359.51736, "b": 582.84299, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "QUSRJOBI() API format 900 or System i Navigator\u2019s SQL Details for Job", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 574.51797, "r": 435.00305000000003, "b": 582.84299, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 574.51797, "r": 486.00335999999993, "b": 582.84299, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 505.2606799999999, "t": 574.51797, "r": 511.26367, "b": 582.84299, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800079, "t": 593.5376699999999, "r": 220.75178999999997, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Visual Explain within Run SQL scripts", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 593.5376699999999, "r": 435.00305000000003, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 593.5376699999999, "r": 486.00335999999993, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 505.2606799999999, "t": 593.5376699999999, "r": 511.26367, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 530.76038, "t": 593.5376699999999, "r": 536.76337, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800079, "t": 612.55737, "r": 236.6548, "b": 620.88239, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Visual Explain outside of Run SQL scripts", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 612.55737, "r": 435.00305000000003, "b": 620.88239, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 612.55737, "r": 486.00335999999993, "b": 620.88239, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800079, "t": 631.51767, "r": 213.12968, "b": 639.84268, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "ANALYZE PLAN CACHE procedure", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 631.51767, "r": 435.00305000000003, "b": 639.84268, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 631.51767, "r": 486.00335999999993, "b": 639.84268, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800079, "t": 650.53737, "r": 199.87808, "b": 658.86238, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "DUMP PLAN CACHE procedure", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 650.53737, "r": 435.00305000000003, "b": 658.86238, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 650.53737, "r": 486.00335999999993, "b": 658.86238, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800079, "t": 669.55708, "r": 208.36777, "b": 677.88207, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "MODIFY PLAN CACHE procedure", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 669.55708, "r": 435.00305000000003, "b": 677.88207, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 669.55708, "r": 486.00335999999993, "b": 677.88207, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800079, "t": 688.57677, "r": 411.20264, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "MODIFY PLAN CACHE PROPERTIES procedure (currently does not check authority)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 688.57677, "r": 435.00305000000003, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 688.57677, "r": 486.00335999999993, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800079, "t": 707.537071, "r": 377.12585, "b": 715.862068, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "CHANGE PLAN CACHE SIZE procedure (currently does not check authority)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 707.537071, "r": 435.00305000000003, "b": 715.862068, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 707.537071, "r": 486.00335999999993, "b": 715.862068, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}]}], "body": [{"label": "text", "id": 2, "page_no": 8, "cluster": {"id": 2, "label": "text", "bbox": {"l": 136.79959, "t": 71.50903000000005, "r": 542.69434, "b": 140.72113000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9789126515388489, "cells": [{"id": 2, "text": "For example, assume that a business has assigned the duty to manage security on IBM i to ", "bbox": {"l": 136.79959, "t": 71.50903000000005, "r": 542.69434, "b": 80.72204999999985, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Theresa. Before release IBM i 7.2, to grant privileges, Theresa had to have the same ", "bbox": {"l": 136.79959, "t": 83.50885000000017, "r": 513.67804, "b": 92.72185999999999, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "privileges Theresa was granting to others. Therefore, to grant *USE privileges to the ", "bbox": {"l": 136.79959, "t": 95.50867000000005, "r": 509.71902, "b": 104.72167999999999, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "PAYROLL table, Theresa had to have *OBJMGT and *USE authority (or a higher level of ", "bbox": {"l": 136.79959, "t": 107.50847999999996, "r": 528.20184, "b": 116.72149999999999, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "authority, such as *ALLOBJ). This requirement allowed Theresa to access the data in the ", "bbox": {"l": 136.79959, "t": 119.50829999999996, "r": 531.84015, "b": 128.72131000000002, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "PAYROLL table even though Theresa\u2019s job description was only to manage its security.", "bbox": {"l": 136.79959, "t": 131.50811999999996, "r": 519.24982, "b": 140.72113000000002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "For example, assume that a business has assigned the duty to manage security on IBM i to Theresa. Before release IBM i 7.2, to grant privileges, Theresa had to have the same privileges Theresa was granting to others. Therefore, to grant *USE privileges to the PAYROLL table, Theresa had to have *OBJMGT and *USE authority (or a higher level of authority, such as *ALLOBJ). This requirement allowed Theresa to access the data in the PAYROLL table even though Theresa's job description was only to manage its security."}, {"label": "text", "id": 6, "page_no": 8, "cluster": {"id": 6, "label": "text", "bbox": {"l": 136.79959, "t": 153.52770999999996, "r": 547.30396, "b": 198.74017000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9665538668632507, "cells": [{"id": 8, "text": "In IBM i 7.2, the QIBM_DB_SECADM function usage grants authorities, revokes authorities, ", "bbox": {"l": 136.79959, "t": 153.52770999999996, "r": 544.16064, "b": 162.74072, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "changes ownership, or changes the primary group without giving access to the object or, in ", "bbox": {"l": 136.79959, "t": 165.52752999999996, "r": 540.66156, "b": 174.74054, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "the case of a database table, to the data that is in the table or allowing other operations on the ", "bbox": {"l": 136.79959, "t": 177.52733999999998, "r": 547.30396, "b": 186.74036, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "table. ", "bbox": {"l": 136.79959, "t": 189.52715999999998, "r": 163.6189, "b": 198.74017000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "In IBM i 7.2, the QIBM_DB_SECADM function usage grants authorities, revokes authorities, changes ownership, or changes the primary group without giving access to the object or, in the case of a database table, to the data that is in the table or allowing other operations on the table."}, {"label": "text", "id": 4, "page_no": 8, "cluster": {"id": 4, "label": "text", "bbox": {"l": 136.79959, "t": 211.48694, "r": 538.65076, "b": 232.69976999999994, "coord_origin": "TOPLEFT"}, "confidence": 0.9691813588142395, "cells": [{"id": 12, "text": "QIBM_DB_SECADM function usage can be granted only by a user with *SECADM special ", "bbox": {"l": 136.79959, "t": 211.48694, "r": 538.65076, "b": 220.69994999999994, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "authority and can be given to a user or a group.", "bbox": {"l": 136.79959, "t": 223.48676, "r": 346.34808, "b": 232.69976999999994, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "QIBM_DB_SECADM function usage can be granted only by a user with *SECADM special authority and can be given to a user or a group."}, {"label": "text", "id": 3, "page_no": 8, "cluster": {"id": 3, "label": "text", "bbox": {"l": 136.79959, "t": 245.50635, "r": 545.79602, "b": 278.71898999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.9729602336883545, "cells": [{"id": 14, "text": "QIBM_DB_SECADM also is responsible for administering RCAC, which restricts which rows ", "bbox": {"l": 136.79959, "t": 245.50635, "r": 545.79602, "b": 254.71936000000005, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "a user is allowed to access in a table and whether a user is allowed to see information in ", "bbox": {"l": 136.79959, "t": 257.50616, "r": 529.46149, "b": 266.71918000000005, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "certain columns of a table.", "bbox": {"l": 136.79959, "t": 269.50598, "r": 253.47696999999997, "b": 278.71898999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "QIBM_DB_SECADM also is responsible for administering RCAC, which restricts which rows a user is allowed to access in a table and whether a user is allowed to see information in certain columns of a table."}, {"label": "text", "id": 1, "page_no": 8, "cluster": {"id": 1, "label": "text", "bbox": {"l": 136.79959, "t": 291.52557, "r": 539.80713, "b": 336.73801, "coord_origin": "TOPLEFT"}, "confidence": 0.9815152883529663, "cells": [{"id": 17, "text": "A preferred practice is that the RCAC administrator has the QIBM_DB_SECADM function ", "bbox": {"l": 136.79959, "t": 291.52557, "r": 533.78137, "b": 300.73856, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "usage ID, but absolutely no other data privileges. The result is that the RCAC administrator ", "bbox": {"l": 136.79959, "t": 303.52539, "r": 539.80713, "b": 312.73837000000003, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "can deploy and maintain the RCAC constructs, but cannot grant themselves unauthorized ", "bbox": {"l": 136.79959, "t": 315.52521, "r": 534.5741, "b": 324.73819, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "access to data itself.", "bbox": {"l": 136.79959, "t": 327.52502, "r": 227.02324, "b": 336.73801, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "A preferred practice is that the RCAC administrator has the QIBM_DB_SECADM function usage ID, but absolutely no other data privileges. The result is that the RCAC administrator can deploy and maintain the RCAC constructs, but cannot grant themselves unauthorized access to data itself."}, {"label": "text", "id": 5, "page_no": 8, "cluster": {"id": 5, "label": "text", "bbox": {"l": 136.79959, "t": 349.48483, "r": 543.06714, "b": 370.69763000000006, "coord_origin": "TOPLEFT"}, "confidence": 0.9672255516052246, "cells": [{"id": 21, "text": "Table 2-2 shows a comparison of the different function usage IDs and *JOBCTL authority to ", "bbox": {"l": 136.79959, "t": 349.48483, "r": 543.06714, "b": 358.69780999999995, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "the different CL commands and DB2 for i tools.", "bbox": {"l": 136.79959, "t": 361.48465, "r": 343.79236, "b": 370.69763000000006, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 2-2 shows a comparison of the different function usage IDs and *JOBCTL authority to the different CL commands and DB2 for i tools."}, {"label": "caption", "id": 8, "page_no": 8, "cluster": {"id": 8, "label": "caption", "bbox": {"l": 64.800003, "t": 383.5379899999999, "r": 391.75464, "b": 391.86301, "coord_origin": "TOPLEFT"}, "confidence": 0.9337189793586731, "cells": [{"id": 23, "text": "Table 2-2 Comparison of the different function usage IDs and *JOBCTL authority", "bbox": {"l": 64.800003, "t": 383.5379899999999, "r": 391.75464, "b": 391.86301, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 2-2 Comparison of the different function usage IDs and *JOBCTL authority"}, {"label": "table", "id": 0, "page_no": 8, "cluster": {"id": 0, "label": "table", "bbox": {"l": 64.41139221191406, "t": 393.6136169433594, "r": 547.3950805664062, "b": 721.60791015625, "coord_origin": "TOPLEFT"}, "confidence": 0.9899571537971497, "cells": [{"id": 24, "text": "User action", "bbox": {"l": 70.800301, "t": 400.51827999999995, "r": 119.78551, "b": 408.84329, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "*JOBCTL", "bbox": {"l": 424.93805, "t": 447.52255, "r": 433.26297000000005, "b": 487.01999, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "QIBM_DB_SECADM", "bbox": {"l": 450.13806, "t": 401.6000700000001, "r": 458.46298, "b": 487.01999, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "QIBM_DB_SQLADM", "bbox": {"l": 475.93835000000007, "t": 401.53442, "r": 484.26327999999995, "b": 487.01999, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "QIBM_DB_SYSMON", "bbox": {"l": 501.13837, "t": 401.6145, "r": 509.46329, "b": 487.01999, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "No Authority", "bbox": {"l": 526.39862, "t": 432.79944, "r": 534.72357, "b": 487.02005, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "SET CURRENT DEGREE", "bbox": {"l": 70.800003, "t": 498.69299, "r": 151.6794, "b": 506.66699, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": " (SQL statement)", "bbox": {"l": 151.6803, "t": 498.55798, "r": 220.15681000000004, "b": 506.883, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "X", "bbox": {"l": 429.0, "t": 498.55798, "r": 435.00299000000007, "b": 506.883, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "X", "bbox": {"l": 480.00031, "t": 498.55798, "r": 486.0033, "b": 506.883, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "CHGQRYA", "bbox": {"l": 70.800018, "t": 517.65329, "r": 102.23972, "b": 525.62729, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": " command targeting a different user\u2019s job", "bbox": {"l": 102.23972, "t": 517.51828, "r": 264.5538, "b": 525.84329, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "X", "bbox": {"l": 429.00003, "t": 517.51828, "r": 435.00302000000005, "b": 525.84329, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "X", "bbox": {"l": 480.00034, "t": 517.51828, "r": 486.00333, "b": 525.84329, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "STRDBMON", "bbox": {"l": 70.800049, "t": 536.67299, "r": 106.73975, "b": 544.64699, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": " or ", "bbox": {"l": 106.73975, "t": 536.5379800000001, "r": 119.77895, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "ENDDBMON", "bbox": {"l": 119.69975000000001, "t": 536.67299, "r": 155.69974, "b": 544.64699, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": " commands targeting a different user\u2019s job", "bbox": {"l": 155.69974, "t": 536.5379800000001, "r": 322.50574, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "X", "bbox": {"l": 429.00003, "t": 536.5379800000001, "r": 435.00302000000005, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "X", "bbox": {"l": 480.00034, "t": 536.5379800000001, "r": 486.00333, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "STRDBMON", "bbox": {"l": 70.800049, "t": 555.69269, "r": 106.73975, "b": 563.66669, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": " or ", "bbox": {"l": 106.73975, "t": 555.55768, "r": 119.77895, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "ENDDBMON", "bbox": {"l": 119.69975000000001, "t": 555.69269, "r": 155.69974, "b": 563.66669, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": " commands targeting a job that matches the current user", "bbox": {"l": 155.69974, "t": 555.55768, "r": 381.02185, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "X", "bbox": {"l": 429.00003, "t": 555.55768, "r": 435.00302000000005, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "X", "bbox": {"l": 480.00034, "t": 555.55768, "r": 486.00333, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "X", "bbox": {"l": 505.26061999999996, "t": 555.55768, "r": 511.26361, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "X", "bbox": {"l": 530.76031, "t": 555.55768, "r": 536.76331, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "QUSRJOBI() API format 900 or System i Navigator\u2019s SQL Details for Job", "bbox": {"l": 70.800049, "t": 574.51797, "r": 359.51736, "b": 582.84299, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "X", "bbox": {"l": 429.0000600000001, "t": 574.51797, "r": 435.00305000000003, "b": 582.84299, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "X", "bbox": {"l": 480.00037, "t": 574.51797, "r": 486.00335999999993, "b": 582.84299, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "X", "bbox": {"l": 505.2606799999999, "t": 574.51797, "r": 511.26367, "b": 582.84299, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "Visual Explain within Run SQL scripts", "bbox": {"l": 70.800079, "t": 593.5376699999999, "r": 220.75178999999997, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "X", "bbox": {"l": 429.0000600000001, "t": 593.5376699999999, "r": 435.00305000000003, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "X", "bbox": {"l": 480.00037, "t": 593.5376699999999, "r": 486.00335999999993, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "X", "bbox": {"l": 505.2606799999999, "t": 593.5376699999999, "r": 511.26367, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "X", "bbox": {"l": 530.76038, "t": 593.5376699999999, "r": 536.76337, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "Visual Explain outside of Run SQL scripts", "bbox": {"l": 70.800079, "t": 612.55737, "r": 236.6548, "b": 620.88239, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "X", "bbox": {"l": 429.0000600000001, "t": 612.55737, "r": 435.00305000000003, "b": 620.88239, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "X", "bbox": {"l": 480.00037, "t": 612.55737, "r": 486.00335999999993, "b": 620.88239, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "ANALYZE PLAN CACHE procedure", "bbox": {"l": 70.800079, "t": 631.51767, "r": 213.12968, "b": 639.84268, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "X", "bbox": {"l": 429.0000600000001, "t": 631.51767, "r": 435.00305000000003, "b": 639.84268, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "X", "bbox": {"l": 480.00037, "t": 631.51767, "r": 486.00335999999993, "b": 639.84268, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "DUMP PLAN CACHE procedure", "bbox": {"l": 70.800079, "t": 650.53737, "r": 199.87808, "b": 658.86238, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "X", "bbox": {"l": 429.0000600000001, "t": 650.53737, "r": 435.00305000000003, "b": 658.86238, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "X", "bbox": {"l": 480.00037, "t": 650.53737, "r": 486.00335999999993, "b": 658.86238, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "MODIFY PLAN CACHE procedure", "bbox": {"l": 70.800079, "t": 669.55708, "r": 208.36777, "b": 677.88207, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "X", "bbox": {"l": 429.0000600000001, "t": 669.55708, "r": 435.00305000000003, "b": 677.88207, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "X", "bbox": {"l": 480.00037, "t": 669.55708, "r": 486.00335999999993, "b": 677.88207, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "MODIFY PLAN CACHE PROPERTIES procedure (currently does not check authority)", "bbox": {"l": 70.800079, "t": 688.57677, "r": 411.20264, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "X", "bbox": {"l": 429.0000600000001, "t": 688.57677, "r": 435.00305000000003, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "X", "bbox": {"l": 480.00037, "t": 688.57677, "r": 486.00335999999993, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": "CHANGE PLAN CACHE SIZE procedure (currently does not check authority)", "bbox": {"l": 70.800079, "t": 707.537071, "r": 377.12585, "b": 715.862068, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": "X", "bbox": {"l": 429.0000600000001, "t": 707.537071, "r": 435.00305000000003, "b": 715.862068, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "X", "bbox": {"l": 480.00037, "t": 707.537071, "r": 486.00335999999993, "b": 715.862068, "coord_origin": "TOPLEFT"}}], "children": [{"id": 10, "label": "text", "bbox": {"l": 70.800301, "t": 400.51827999999995, "r": 119.78551, "b": 408.84329, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "User action", "bbox": {"l": 70.800301, "t": 400.51827999999995, "r": 119.78551, "b": 408.84329, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 424.93805, "t": 447.52255, "r": 433.26297000000005, "b": 487.01999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "*JOBCTL", "bbox": {"l": 424.93805, "t": 447.52255, "r": 433.26297000000005, "b": 487.01999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 450.13806, "t": 401.6000700000001, "r": 458.46298, "b": 487.01999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "QIBM_DB_SECADM", "bbox": {"l": 450.13806, "t": 401.6000700000001, "r": 458.46298, "b": 487.01999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 475.93835000000007, "t": 401.53442, "r": 484.26327999999995, "b": 487.01999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "QIBM_DB_SQLADM", "bbox": {"l": 475.93835000000007, "t": 401.53442, "r": 484.26327999999995, "b": 487.01999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 501.13837, "t": 401.6145, "r": 509.46329, "b": 487.01999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "QIBM_DB_SYSMON", "bbox": {"l": 501.13837, "t": 401.6145, "r": 509.46329, "b": 487.01999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 526.39862, "t": 432.79944, "r": 534.72357, "b": 487.02005, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "No Authority", "bbox": {"l": 526.39862, "t": 432.79944, "r": 534.72357, "b": 487.02005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 70.800003, "t": 498.69299, "r": 151.6794, "b": 506.66699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "SET CURRENT DEGREE", "bbox": {"l": 70.800003, "t": 498.69299, "r": 151.6794, "b": 506.66699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 151.6803, "t": 498.55798, "r": 220.15681000000004, "b": 506.883, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": " (SQL statement)", "bbox": {"l": 151.6803, "t": 498.55798, "r": 220.15681000000004, "b": 506.883, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 429.0, "t": 498.55798, "r": 435.00299000000007, "b": 506.883, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "X", "bbox": {"l": 429.0, "t": 498.55798, "r": 435.00299000000007, "b": 506.883, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 480.00031, "t": 498.55798, "r": 486.0033, "b": 506.883, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "X", "bbox": {"l": 480.00031, "t": 498.55798, "r": 486.0033, "b": 506.883, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 70.800018, "t": 517.65329, "r": 102.23972, "b": 525.62729, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "CHGQRYA", "bbox": {"l": 70.800018, "t": 517.65329, "r": 102.23972, "b": 525.62729, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 102.23972, "t": 517.51828, "r": 264.5538, "b": 525.84329, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": " command targeting a different user\u2019s job", "bbox": {"l": 102.23972, "t": 517.51828, "r": 264.5538, "b": 525.84329, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 429.00003, "t": 517.51828, "r": 435.00302000000005, "b": 525.84329, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "X", "bbox": {"l": 429.00003, "t": 517.51828, "r": 435.00302000000005, "b": 525.84329, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 480.00034, "t": 517.51828, "r": 486.00333, "b": 525.84329, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "X", "bbox": {"l": 480.00034, "t": 517.51828, "r": 486.00333, "b": 525.84329, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 70.800049, "t": 536.67299, "r": 106.73975, "b": 544.64699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "STRDBMON", "bbox": {"l": 70.800049, "t": 536.67299, "r": 106.73975, "b": 544.64699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 106.73975, "t": 536.5379800000001, "r": 119.77895, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": " or ", "bbox": {"l": 106.73975, "t": 536.5379800000001, "r": 119.77895, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 119.69975000000001, "t": 536.67299, "r": 155.69974, "b": 544.64699, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "ENDDBMON", "bbox": {"l": 119.69975000000001, "t": 536.67299, "r": 155.69974, "b": 544.64699, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 155.69974, "t": 536.5379800000001, "r": 322.50574, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": " commands targeting a different user\u2019s job", "bbox": {"l": 155.69974, "t": 536.5379800000001, "r": 322.50574, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 429.00003, "t": 536.5379800000001, "r": 435.00302000000005, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "X", "bbox": {"l": 429.00003, "t": 536.5379800000001, "r": 435.00302000000005, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 480.00034, "t": 536.5379800000001, "r": 486.00333, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "X", "bbox": {"l": 480.00034, "t": 536.5379800000001, "r": 486.00333, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 70.800049, "t": 555.69269, "r": 106.73975, "b": 563.66669, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "STRDBMON", "bbox": {"l": 70.800049, "t": 555.69269, "r": 106.73975, "b": 563.66669, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 106.73975, "t": 555.55768, "r": 119.77895, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": " or ", "bbox": {"l": 106.73975, "t": 555.55768, "r": 119.77895, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 119.69975000000001, "t": 555.69269, "r": 155.69974, "b": 563.66669, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "ENDDBMON", "bbox": {"l": 119.69975000000001, "t": 555.69269, "r": 155.69974, "b": 563.66669, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 155.69974, "t": 555.55768, "r": 381.02185, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": " commands targeting a job that matches the current user", "bbox": {"l": 155.69974, "t": 555.55768, "r": 381.02185, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 429.00003, "t": 555.55768, "r": 435.00302000000005, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "X", "bbox": {"l": 429.00003, "t": 555.55768, "r": 435.00302000000005, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 480.00034, "t": 555.55768, "r": 486.00333, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "X", "bbox": {"l": 480.00034, "t": 555.55768, "r": 486.00333, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 505.26061999999996, "t": 555.55768, "r": 511.26361, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "X", "bbox": {"l": 505.26061999999996, "t": 555.55768, "r": 511.26361, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 530.76031, "t": 555.55768, "r": 536.76331, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "X", "bbox": {"l": 530.76031, "t": 555.55768, "r": 536.76331, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 70.800049, "t": 574.51797, "r": 359.51736, "b": 582.84299, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "QUSRJOBI() API format 900 or System i Navigator\u2019s SQL Details for Job", "bbox": {"l": 70.800049, "t": 574.51797, "r": 359.51736, "b": 582.84299, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 429.0000600000001, "t": 574.51797, "r": 435.00305000000003, "b": 582.84299, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "X", "bbox": {"l": 429.0000600000001, "t": 574.51797, "r": 435.00305000000003, "b": 582.84299, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 480.00037, "t": 574.51797, "r": 486.00335999999993, "b": 582.84299, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "X", "bbox": {"l": 480.00037, "t": 574.51797, "r": 486.00335999999993, "b": 582.84299, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 505.2606799999999, "t": 574.51797, "r": 511.26367, "b": 582.84299, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "X", "bbox": {"l": 505.2606799999999, "t": 574.51797, "r": 511.26367, "b": 582.84299, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 70.800079, "t": 593.5376699999999, "r": 220.75178999999997, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "Visual Explain within Run SQL scripts", "bbox": {"l": 70.800079, "t": 593.5376699999999, "r": 220.75178999999997, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 429.0000600000001, "t": 593.5376699999999, "r": 435.00305000000003, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "X", "bbox": {"l": 429.0000600000001, "t": 593.5376699999999, "r": 435.00305000000003, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 480.00037, "t": 593.5376699999999, "r": 486.00335999999993, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "X", "bbox": {"l": 480.00037, "t": 593.5376699999999, "r": 486.00335999999993, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 505.2606799999999, "t": 593.5376699999999, "r": 511.26367, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "X", "bbox": {"l": 505.2606799999999, "t": 593.5376699999999, "r": 511.26367, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 530.76038, "t": 593.5376699999999, "r": 536.76337, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 60, "text": "X", "bbox": {"l": 530.76038, "t": 593.5376699999999, "r": 536.76337, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 70.800079, "t": 612.55737, "r": 236.6548, "b": 620.88239, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 61, "text": "Visual Explain outside of Run SQL scripts", "bbox": {"l": 70.800079, "t": 612.55737, "r": 236.6548, "b": 620.88239, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 429.0000600000001, "t": 612.55737, "r": 435.00305000000003, "b": 620.88239, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 62, "text": "X", "bbox": {"l": 429.0000600000001, "t": 612.55737, "r": 435.00305000000003, "b": 620.88239, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 480.00037, "t": 612.55737, "r": 486.00335999999993, "b": 620.88239, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 63, "text": "X", "bbox": {"l": 480.00037, "t": 612.55737, "r": 486.00335999999993, "b": 620.88239, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 70.800079, "t": 631.51767, "r": 213.12968, "b": 639.84268, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 64, "text": "ANALYZE PLAN CACHE procedure", "bbox": {"l": 70.800079, "t": 631.51767, "r": 213.12968, "b": 639.84268, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 429.0000600000001, "t": 631.51767, "r": 435.00305000000003, "b": 639.84268, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 65, "text": "X", "bbox": {"l": 429.0000600000001, "t": 631.51767, "r": 435.00305000000003, "b": 639.84268, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 480.00037, "t": 631.51767, "r": 486.00335999999993, "b": 639.84268, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 66, "text": "X", "bbox": {"l": 480.00037, "t": 631.51767, "r": 486.00335999999993, "b": 639.84268, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 70.800079, "t": 650.53737, "r": 199.87808, "b": 658.86238, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 67, "text": "DUMP PLAN CACHE procedure", "bbox": {"l": 70.800079, "t": 650.53737, "r": 199.87808, "b": 658.86238, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 429.0000600000001, "t": 650.53737, "r": 435.00305000000003, "b": 658.86238, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 68, "text": "X", "bbox": {"l": 429.0000600000001, "t": 650.53737, "r": 435.00305000000003, "b": 658.86238, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 55, "label": "text", "bbox": {"l": 480.00037, "t": 650.53737, "r": 486.00335999999993, "b": 658.86238, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 69, "text": "X", "bbox": {"l": 480.00037, "t": 650.53737, "r": 486.00335999999993, "b": 658.86238, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 56, "label": "text", "bbox": {"l": 70.800079, "t": 669.55708, "r": 208.36777, "b": 677.88207, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 70, "text": "MODIFY PLAN CACHE procedure", "bbox": {"l": 70.800079, "t": 669.55708, "r": 208.36777, "b": 677.88207, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 57, "label": "text", "bbox": {"l": 429.0000600000001, "t": 669.55708, "r": 435.00305000000003, "b": 677.88207, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 71, "text": "X", "bbox": {"l": 429.0000600000001, "t": 669.55708, "r": 435.00305000000003, "b": 677.88207, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 58, "label": "text", "bbox": {"l": 480.00037, "t": 669.55708, "r": 486.00335999999993, "b": 677.88207, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 72, "text": "X", "bbox": {"l": 480.00037, "t": 669.55708, "r": 486.00335999999993, "b": 677.88207, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 59, "label": "text", "bbox": {"l": 70.800079, "t": 688.57677, "r": 411.20264, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 73, "text": "MODIFY PLAN CACHE PROPERTIES procedure (currently does not check authority)", "bbox": {"l": 70.800079, "t": 688.57677, "r": 411.20264, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 60, "label": "text", "bbox": {"l": 429.0000600000001, "t": 688.57677, "r": 435.00305000000003, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 74, "text": "X", "bbox": {"l": 429.0000600000001, "t": 688.57677, "r": 435.00305000000003, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 61, "label": "text", "bbox": {"l": 480.00037, "t": 688.57677, "r": 486.00335999999993, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 75, "text": "X", "bbox": {"l": 480.00037, "t": 688.57677, "r": 486.00335999999993, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 62, "label": "text", "bbox": {"l": 70.800079, "t": 707.537071, "r": 377.12585, "b": 715.862068, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 76, "text": "CHANGE PLAN CACHE SIZE procedure (currently does not check authority)", "bbox": {"l": 70.800079, "t": 707.537071, "r": 377.12585, "b": 715.862068, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 63, "label": "text", "bbox": {"l": 429.0000600000001, "t": 707.537071, "r": 435.00305000000003, "b": 715.862068, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 77, "text": "X", "bbox": {"l": 429.0000600000001, "t": 707.537071, "r": 435.00305000000003, "b": 715.862068, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 64, "label": "text", "bbox": {"l": 480.00037, "t": 707.537071, "r": 486.00335999999993, "b": 715.862068, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 78, "text": "X", "bbox": {"l": 480.00037, "t": 707.537071, "r": 486.00335999999993, "b": 715.862068, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["rhed", "fcel", "fcel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "ecel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "ecel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "ecel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "ecel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "ecel", "fcel", "fcel", "ecel", "nl", "rhed", "fcel", "ecel", "fcel", "fcel", "fcel", "nl", "rhed", "fcel", "ecel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "ecel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "ecel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "ecel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "ecel", "fcel", "ecel", "ecel", "nl", "rhed", "fcel", "ecel", "fcel", "ecel", "ecel", "nl"], "num_rows": 13, "num_cols": 6, "table_cells": [{"bbox": {"l": 70.800301, "t": 400.51827999999995, "r": 119.78551, "b": 408.84329, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "User action", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 424.93805, "t": 447.52255, "r": 433.26297000000005, "b": 487.01999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "*JOBCTL", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 450.13806, "t": 401.6000700000001, "r": 458.46298, "b": 487.01999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "QIBM_DB_SECADM", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 475.93835000000007, "t": 401.53442, "r": 484.26327999999995, "b": 487.01999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "QIBM_DB_SQLADM", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 501.13837, "t": 401.6145, "r": 509.46329, "b": 487.01999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "QIBM_DB_SYSMON", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 526.39862, "t": 432.79944, "r": 534.72357, "b": 487.02005, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "No Authority", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800003, "t": 498.55798, "r": 220.15681000000004, "b": 506.883, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "SET CURRENT DEGREE  (SQL statement)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0, "t": 498.55798, "r": 435.00299000000007, "b": 506.883, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00031, "t": 498.55798, "r": 486.0033, "b": 506.883, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800018, "t": 517.51828, "r": 264.5538, "b": 525.84329, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "CHGQRYA  command targeting a different user\u2019s job", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.00003, "t": 517.51828, "r": 435.00302000000005, "b": 525.84329, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00034, "t": 517.51828, "r": 486.00333, "b": 525.84329, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800049, "t": 536.5379800000001, "r": 322.50574, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "STRDBMON  or  ENDDBMON  commands targeting a different user\u2019s job", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.00003, "t": 536.5379800000001, "r": 435.00302000000005, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00034, "t": 536.5379800000001, "r": 486.00333, "b": 544.8629900000001, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800049, "t": 555.55768, "r": 381.02185, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "STRDBMON  or  ENDDBMON  commands targeting a job that matches the current user", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.00003, "t": 555.55768, "r": 435.00302000000005, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00034, "t": 555.55768, "r": 486.00333, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 505.26061999999996, "t": 555.55768, "r": 511.26361, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 530.76031, "t": 555.55768, "r": 536.76331, "b": 563.8826899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800049, "t": 574.51797, "r": 359.51736, "b": 582.84299, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "QUSRJOBI() API format 900 or System i Navigator\u2019s SQL Details for Job", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 574.51797, "r": 435.00305000000003, "b": 582.84299, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 574.51797, "r": 486.00335999999993, "b": 582.84299, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 505.2606799999999, "t": 574.51797, "r": 511.26367, "b": 582.84299, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800079, "t": 593.5376699999999, "r": 220.75178999999997, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Visual Explain within Run SQL scripts", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 593.5376699999999, "r": 435.00305000000003, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 593.5376699999999, "r": 486.00335999999993, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 505.2606799999999, "t": 593.5376699999999, "r": 511.26367, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 4, "end_col_offset_idx": 5, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 530.76038, "t": 593.5376699999999, "r": 536.76337, "b": 601.8626899999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 5, "end_col_offset_idx": 6, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800079, "t": 612.55737, "r": 236.6548, "b": 620.88239, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Visual Explain outside of Run SQL scripts", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 612.55737, "r": 435.00305000000003, "b": 620.88239, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 612.55737, "r": 486.00335999999993, "b": 620.88239, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800079, "t": 631.51767, "r": 213.12968, "b": 639.84268, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "ANALYZE PLAN CACHE procedure", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 631.51767, "r": 435.00305000000003, "b": 639.84268, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 631.51767, "r": 486.00335999999993, "b": 639.84268, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800079, "t": 650.53737, "r": 199.87808, "b": 658.86238, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "DUMP PLAN CACHE procedure", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 650.53737, "r": 435.00305000000003, "b": 658.86238, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 650.53737, "r": 486.00335999999993, "b": 658.86238, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800079, "t": 669.55708, "r": 208.36777, "b": 677.88207, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "MODIFY PLAN CACHE procedure", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 669.55708, "r": 435.00305000000003, "b": 677.88207, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 669.55708, "r": 486.00335999999993, "b": 677.88207, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 10, "end_row_offset_idx": 11, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800079, "t": 688.57677, "r": 411.20264, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "MODIFY PLAN CACHE PROPERTIES procedure (currently does not check authority)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 688.57677, "r": 435.00305000000003, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 688.57677, "r": 486.00335999999993, "b": 696.9017719999999, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 11, "end_row_offset_idx": 12, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800079, "t": 707.537071, "r": 377.12585, "b": 715.862068, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "CHANGE PLAN CACHE SIZE procedure (currently does not check authority)", "column_header": false, "row_header": true, "row_section": false}, {"bbox": {"l": 429.0000600000001, "t": 707.537071, "r": 435.00305000000003, "b": 715.862068, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "X", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 480.00037, "t": 707.537071, "r": 486.00335999999993, "b": 715.862068, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 12, "end_row_offset_idx": 13, "start_col_offset_idx": 3, "end_col_offset_idx": 4, "text": "X", "column_header": false, "row_header": false, "row_section": false}]}], "headers": [{"label": "page_footer", "id": 7, "page_no": 8, "cluster": {"id": 7, "label": "page_footer", "bbox": {"l": 355.32001, "t": 755.538002, "r": 523.54071, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9508126378059387, "cells": [{"id": 0, "text": "Chapter 2. Roles and separation of duties ", "bbox": {"l": 355.32001, "t": 755.538002, "r": 523.54071, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Chapter 2. Roles and separation of duties"}, {"label": "page_footer", "id": 9, "page_no": 8, "cluster": {"id": 9, "label": "page_footer", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.8987301588058472, "cells": [{"id": 1, "text": "11", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "11"}]}}, {"page_no": 9, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "Chapter 3. Row and Column Access Control ", "bbox": {"l": 344.94, "t": 755.538002, "r": 523.60162, "b": 763.863001, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "15", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "The SQL ", "bbox": {"l": 136.79959, "t": 71.50903000000005, "r": 179.58179, "b": 80.72204999999985, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "CREATE PERMISSION", "bbox": {"l": 179.57977, "t": 71.65845000000002, "r": 264.47879, "b": 80.48302999999999, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": " statement that is shown in Figure 3-1 is used to define and ", "bbox": {"l": 264.53955, "t": 71.50903000000005, "r": 528.73059, "b": 80.72204999999985, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "initially enable or disable the row access rules.", "bbox": {"l": 136.79956, "t": 83.50885000000017, "r": 341.71762, "b": 92.72185999999999, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Figure 3-1 CREATE PERMISSION SQL statement", "bbox": {"l": 136.8, "t": 414.138, "r": 341.97659, "b": 422.46301, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Column mask", "bbox": {"l": 136.8, "t": 439.94399999999996, "r": 215.37601, "b": 451.04401, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "A column mask is a database object that manifests a column value access control rule for a ", "bbox": {"l": 136.8, "t": 455.08871000000005, "r": 542.76648, "b": 464.3017, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "specific column in a specific table. It uses a CASE expression that describes what you see ", "bbox": {"l": 136.8, "t": 467.08853, "r": 537.84125, "b": 476.30151, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "when you access the column. For example, a teller can see only the last four digits of a tax ", "bbox": {"l": 136.8, "t": 479.08835, "r": 538.80927, "b": 488.30133, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "identification number.", "bbox": {"l": 136.8, "t": 491.08817, "r": 231.20888, "b": 500.30115, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "CREATE PERMISSION", "bbox": {"l": 148.1337, "t": 139.67969000000005, "r": 246.7961, "b": 149.50982999999997, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "<", "bbox": {"l": 251.86685, "t": 139.67969000000005, "r": 257.58578, "b": 149.49834999999996, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "permission name", "bbox": {"l": 257.59152, "t": 139.67969000000005, "r": 336.99741, "b": 149.50982999999997, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": ">", "bbox": {"l": 337.01233, "t": 139.67969000000005, "r": 342.73126, "b": 149.49834999999996, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Names the row permission for row access control", "bbox": {"l": 346.56491, "t": 121.46252000000004, "r": 530.74371, "b": 129.33507999999995, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "ON", "bbox": {"l": 148.1337, "t": 181.06255999999996, "r": 163.45079, "b": 190.8927, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "<", "bbox": {"l": 168.58405, "t": 181.06255999999996, "r": 174.30298, "b": 190.88122999999996, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "table name", "bbox": {"l": 174.30872, "t": 181.06255999999996, "r": 226.86777, "b": 190.8927, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": ">", "bbox": {"l": 226.86548000000002, "t": 181.06255999999996, "r": 232.58441, "b": 190.88122999999996, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Identifies the table on which the row ", "bbox": {"l": 311.3204, "t": 166.29413, "r": 450.77191000000005, "b": 174.16669000000002, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "permission is created", "bbox": {"l": 450.86123999999995, "t": 166.29413, "r": 529.93134, "b": 174.16669000000002, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "AS ", "bbox": {"l": 148.1337, "t": 222.44550000000004, "r": 163.10973, "b": 232.27562999999998, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "<", "bbox": {"l": 165.68669, "t": 222.44550000000004, "r": 171.40562, "b": 232.26415999999995, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "correlation name", "bbox": {"l": 171.41136, "t": 222.44550000000004, "r": 251.20424000000003, "b": 232.27562999999998, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": ">", "bbox": {"l": 251.21115, "t": 222.44550000000004, "r": 256.93008, "b": 232.26415999999995, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Specifies an optional correlation name that ca", "bbox": {"l": 235.79649, "t": 204.22839, "r": 406.62051, "b": 212.10095, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "be used within search-condition", "bbox": {"l": 480.53094, "t": 204.22839, "r": 532.89496, "b": 212.10095, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "FOR ROWS", "bbox": {"l": 148.1337, "t": 263.82836999999995, "r": 199.72467, "b": 273.65851, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Indicates that a row permission is cr", "bbox": {"l": 321.56271, "t": 246.09411999999998, "r": 455.3432, "b": 253.96667000000002, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "eated", "bbox": {"l": 455.20786000000004, "t": 246.09411999999998, "r": 476.48404, "b": 253.96667000000002, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Specifies a condition that can be ", "bbox": {"l": 321.5972, "t": 266.30267000000003, "r": 444.0292400000001, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "true,", "bbox": {"l": 444.07986, "t": 266.30267000000003, "r": 459.08678999999995, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "false, or unknown", "bbox": {"l": 464.2088, "t": 266.30267000000003, "r": 530.94897, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "WHERE", "bbox": {"l": 148.1337, "t": 291.41708, "r": 183.42342, "b": 301.24722, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "<", "bbox": {"l": 188.61984, "t": 291.41708, "r": 194.33878, "b": 301.23572, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "logic to test: user and/or group and/or column value", "bbox": {"l": 194.34451, "t": 291.41708, "r": 437.04659999999996, "b": 301.24722, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": ">", "bbox": {"l": 437.09020999999996, "t": 291.41708, "r": 442.80914000000007, "b": 301.23572, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "ENFORCED FOR ALL ACCESS", "bbox": {"l": 148.1337, "t": 332.79999, "r": 278.77805, "b": 342.63013, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "Specifies that the row permission applies to all ref", "bbox": {"l": 271.55829, "t": 314.58276, "r": 457.4451, "b": 322.45535, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "erences of the table", "bbox": {"l": 457.19281, "t": 314.58276, "r": 531.74939, "b": 322.45535, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "ENABLE", "bbox": {"l": 148.1337, "t": 374.18289, "r": 185.17584, "b": 384.01302999999996, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Specifies that the row permission is to", "bbox": {"l": 312.28601, "t": 355.96576000000005, "r": 454.33505, "b": 363.83835, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": " be initially enabled", "bbox": {"l": 454.3461, "t": 355.96576000000005, "r": 527.05286, "b": 363.83835, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "S", "bbox": {"l": 311.73431, "t": 376.65717, "r": 315.94684, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "ifith t th", "bbox": {"l": 329.28326, "t": 376.65717, "r": 371.71786, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "i", "bbox": {"l": 415.0014, "t": 376.65717, "r": 417.09616, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "i", "bbox": {"l": 424.27356, "t": 376.65717, "r": 426.36832, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "i", "bbox": {"l": 438.13208, "t": 376.65717, "r": 440.2268399999999, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "t", "bbox": {"l": 445.88681, "t": 376.65717, "r": 448.95757999999995, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "b", "bbox": {"l": 455.8532400000001, "t": 376.65717, "r": 460.67346000000003, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "i", "bbox": {"l": 467.36746, "t": 376.65717, "r": 470.06998000000004, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "iti ll", "bbox": {"l": 472.73705999999993, "t": 376.65717, "r": 490.1676, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "di", "bbox": {"l": 496.33661, "t": 376.65717, "r": 503.2608, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "bl d", "bbox": {"l": 511.26138, "t": 376.65717, "r": 527.59674, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "DISABLE", "bbox": {"l": 148.1337, "t": 387.9772, "r": 187.6265, "b": 397.80734000000007, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": ";", "bbox": {"l": 187.58514, "t": 387.9772, "r": 190.6628, "b": 397.79583999999994, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Specifies that the row permission is to ", "bbox": {"l": 311.73431, "t": 376.65717, "r": 455.83047000000005, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "be initially disabled", "bbox": {"l": 455.8848, "t": 376.65717, "r": 527.62122, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 2, "label": "page_footer", "bbox": {"l": 344.94, "t": 755.538002, "r": 523.60162, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9526246786117554, "cells": [{"id": 0, "text": "Chapter 3. Row and Column Access Control ", "bbox": {"l": 344.94, "t": 755.538002, "r": 523.60162, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "page_footer", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.9071078896522522, "cells": [{"id": 1, "text": "15", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "caption", "bbox": {"l": 136.79956, "t": 71.50903000000005, "r": 528.73059, "b": 92.72185999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.872844398021698, "cells": [{"id": 2, "text": "The SQL ", "bbox": {"l": 136.79959, "t": 71.50903000000005, "r": 179.58179, "b": 80.72204999999985, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "CREATE PERMISSION", "bbox": {"l": 179.57977, "t": 71.65845000000002, "r": 264.47879, "b": 80.48302999999999, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": " statement that is shown in Figure 3-1 is used to define and ", "bbox": {"l": 264.53955, "t": 71.50903000000005, "r": 528.73059, "b": 80.72204999999985, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "initially enable or disable the row access rules.", "bbox": {"l": 136.79956, "t": 83.50885000000017, "r": 341.71762, "b": 92.72185999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "caption", "bbox": {"l": 136.8, "t": 414.138, "r": 341.97659, "b": 422.46301, "coord_origin": "TOPLEFT"}, "confidence": 0.938783586025238, "cells": [{"id": 6, "text": "Figure 3-1 CREATE PERMISSION SQL statement", "bbox": {"l": 136.8, "t": 414.138, "r": 341.97659, "b": 422.46301, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "section_header", "bbox": {"l": 136.8, "t": 439.94399999999996, "r": 215.37601, "b": 451.04401, "coord_origin": "TOPLEFT"}, "confidence": 0.9477567076683044, "cells": [{"id": 7, "text": "Column mask", "bbox": {"l": 136.8, "t": 439.94399999999996, "r": 215.37601, "b": 451.04401, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 136.8, "t": 455.08871000000005, "r": 542.76648, "b": 500.30115, "coord_origin": "TOPLEFT"}, "confidence": 0.9843975901603699, "cells": [{"id": 8, "text": "A column mask is a database object that manifests a column value access control rule for a ", "bbox": {"l": 136.8, "t": 455.08871000000005, "r": 542.76648, "b": 464.3017, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "specific column in a specific table. It uses a CASE expression that describes what you see ", "bbox": {"l": 136.8, "t": 467.08853, "r": 537.84125, "b": 476.30151, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "when you access the column. For example, a teller can see only the last four digits of a tax ", "bbox": {"l": 136.8, "t": 479.08835, "r": 538.80927, "b": 488.30133, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "identification number.", "bbox": {"l": 136.8, "t": 491.08817, "r": 231.20888, "b": 500.30115, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "picture", "bbox": {"l": 135.97177124023438, "t": 107.41075134277344, "r": 545.4180908203125, "b": 410.60931396484375, "coord_origin": "TOPLEFT"}, "confidence": 0.9788318872451782, "cells": [{"id": 12, "text": "CREATE PERMISSION", "bbox": {"l": 148.1337, "t": 139.67969000000005, "r": 246.7961, "b": 149.50982999999997, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "<", "bbox": {"l": 251.86685, "t": 139.67969000000005, "r": 257.58578, "b": 149.49834999999996, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "permission name", "bbox": {"l": 257.59152, "t": 139.67969000000005, "r": 336.99741, "b": 149.50982999999997, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": ">", "bbox": {"l": 337.01233, "t": 139.67969000000005, "r": 342.73126, "b": 149.49834999999996, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Names the row permission for row access control", "bbox": {"l": 346.56491, "t": 121.46252000000004, "r": 530.74371, "b": 129.33507999999995, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "ON", "bbox": {"l": 148.1337, "t": 181.06255999999996, "r": 163.45079, "b": 190.8927, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "<", "bbox": {"l": 168.58405, "t": 181.06255999999996, "r": 174.30298, "b": 190.88122999999996, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "table name", "bbox": {"l": 174.30872, "t": 181.06255999999996, "r": 226.86777, "b": 190.8927, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": ">", "bbox": {"l": 226.86548000000002, "t": 181.06255999999996, "r": 232.58441, "b": 190.88122999999996, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Identifies the table on which the row ", "bbox": {"l": 311.3204, "t": 166.29413, "r": 450.77191000000005, "b": 174.16669000000002, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "permission is created", "bbox": {"l": 450.86123999999995, "t": 166.29413, "r": 529.93134, "b": 174.16669000000002, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "AS ", "bbox": {"l": 148.1337, "t": 222.44550000000004, "r": 163.10973, "b": 232.27562999999998, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "<", "bbox": {"l": 165.68669, "t": 222.44550000000004, "r": 171.40562, "b": 232.26415999999995, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "correlation name", "bbox": {"l": 171.41136, "t": 222.44550000000004, "r": 251.20424000000003, "b": 232.27562999999998, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": ">", "bbox": {"l": 251.21115, "t": 222.44550000000004, "r": 256.93008, "b": 232.26415999999995, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Specifies an optional correlation name that ca", "bbox": {"l": 235.79649, "t": 204.22839, "r": 406.62051, "b": 212.10095, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "be used within search-condition", "bbox": {"l": 480.53094, "t": 204.22839, "r": 532.89496, "b": 212.10095, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "FOR ROWS", "bbox": {"l": 148.1337, "t": 263.82836999999995, "r": 199.72467, "b": 273.65851, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Indicates that a row permission is cr", "bbox": {"l": 321.56271, "t": 246.09411999999998, "r": 455.3432, "b": 253.96667000000002, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "eated", "bbox": {"l": 455.20786000000004, "t": 246.09411999999998, "r": 476.48404, "b": 253.96667000000002, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Specifies a condition that can be ", "bbox": {"l": 321.5972, "t": 266.30267000000003, "r": 444.0292400000001, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "true,", "bbox": {"l": 444.07986, "t": 266.30267000000003, "r": 459.08678999999995, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "false, or unknown", "bbox": {"l": 464.2088, "t": 266.30267000000003, "r": 530.94897, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "WHERE", "bbox": {"l": 148.1337, "t": 291.41708, "r": 183.42342, "b": 301.24722, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "<", "bbox": {"l": 188.61984, "t": 291.41708, "r": 194.33878, "b": 301.23572, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "logic to test: user and/or group and/or column value", "bbox": {"l": 194.34451, "t": 291.41708, "r": 437.04659999999996, "b": 301.24722, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": ">", "bbox": {"l": 437.09020999999996, "t": 291.41708, "r": 442.80914000000007, "b": 301.23572, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "ENFORCED FOR ALL ACCESS", "bbox": {"l": 148.1337, "t": 332.79999, "r": 278.77805, "b": 342.63013, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "Specifies that the row permission applies to all ref", "bbox": {"l": 271.55829, "t": 314.58276, "r": 457.4451, "b": 322.45535, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "erences of the table", "bbox": {"l": 457.19281, "t": 314.58276, "r": 531.74939, "b": 322.45535, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "ENABLE", "bbox": {"l": 148.1337, "t": 374.18289, "r": 185.17584, "b": 384.01302999999996, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Specifies that the row permission is to", "bbox": {"l": 312.28601, "t": 355.96576000000005, "r": 454.33505, "b": 363.83835, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": " be initially enabled", "bbox": {"l": 454.3461, "t": 355.96576000000005, "r": 527.05286, "b": 363.83835, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "S", "bbox": {"l": 311.73431, "t": 376.65717, "r": 315.94684, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "ifith t th", "bbox": {"l": 329.28326, "t": 376.65717, "r": 371.71786, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "i", "bbox": {"l": 415.0014, "t": 376.65717, "r": 417.09616, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "i", "bbox": {"l": 424.27356, "t": 376.65717, "r": 426.36832, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "i", "bbox": {"l": 438.13208, "t": 376.65717, "r": 440.2268399999999, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "t", "bbox": {"l": 445.88681, "t": 376.65717, "r": 448.95757999999995, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "b", "bbox": {"l": 455.8532400000001, "t": 376.65717, "r": 460.67346000000003, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "i", "bbox": {"l": 467.36746, "t": 376.65717, "r": 470.06998000000004, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "iti ll", "bbox": {"l": 472.73705999999993, "t": 376.65717, "r": 490.1676, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "di", "bbox": {"l": 496.33661, "t": 376.65717, "r": 503.2608, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "bl d", "bbox": {"l": 511.26138, "t": 376.65717, "r": 527.59674, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "DISABLE", "bbox": {"l": 148.1337, "t": 387.9772, "r": 187.6265, "b": 397.80734000000007, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": ";", "bbox": {"l": 187.58514, "t": 387.9772, "r": 190.6628, "b": 397.79583999999994, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Specifies that the row permission is to ", "bbox": {"l": 311.73431, "t": 376.65717, "r": 455.83047000000005, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "be initially disabled", "bbox": {"l": 455.8848, "t": 376.65717, "r": 527.62122, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": [{"id": 7, "label": "text", "bbox": {"l": 148.1337, "t": 139.67969000000005, "r": 246.7961, "b": 149.50982999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "CREATE PERMISSION", "bbox": {"l": 148.1337, "t": 139.67969000000005, "r": 246.7961, "b": 149.50982999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "text", "bbox": {"l": 251.86685, "t": 139.67969000000005, "r": 257.58578, "b": 149.49834999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "<", "bbox": {"l": 251.86685, "t": 139.67969000000005, "r": 257.58578, "b": 149.49834999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 257.59152, "t": 139.67969000000005, "r": 336.99741, "b": 149.50982999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "permission name", "bbox": {"l": 257.59152, "t": 139.67969000000005, "r": 336.99741, "b": 149.50982999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "text", "bbox": {"l": 337.01233, "t": 139.67969000000005, "r": 342.73126, "b": 149.49834999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": ">", "bbox": {"l": 337.01233, "t": 139.67969000000005, "r": 342.73126, "b": 149.49834999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 346.56491, "t": 121.46252000000004, "r": 530.74371, "b": 129.33507999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "Names the row permission for row access control", "bbox": {"l": 346.56491, "t": 121.46252000000004, "r": 530.74371, "b": 129.33507999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 148.1337, "t": 181.06255999999996, "r": 163.45079, "b": 190.8927, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "ON", "bbox": {"l": 148.1337, "t": 181.06255999999996, "r": 163.45079, "b": 190.8927, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 168.58405, "t": 181.06255999999996, "r": 174.30298, "b": 190.88122999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "<", "bbox": {"l": 168.58405, "t": 181.06255999999996, "r": 174.30298, "b": 190.88122999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 174.30872, "t": 181.06255999999996, "r": 226.86777, "b": 190.8927, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "table name", "bbox": {"l": 174.30872, "t": 181.06255999999996, "r": 226.86777, "b": 190.8927, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 226.86548000000002, "t": 181.06255999999996, "r": 232.58441, "b": 190.88122999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": ">", "bbox": {"l": 226.86548000000002, "t": 181.06255999999996, "r": 232.58441, "b": 190.88122999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 311.3204, "t": 166.29413, "r": 450.77191000000005, "b": 174.16669000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "Identifies the table on which the row ", "bbox": {"l": 311.3204, "t": 166.29413, "r": 450.77191000000005, "b": 174.16669000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 450.86123999999995, "t": 166.29413, "r": 529.93134, "b": 174.16669000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "permission is created", "bbox": {"l": 450.86123999999995, "t": 166.29413, "r": 529.93134, "b": 174.16669000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 148.1337, "t": 222.44550000000004, "r": 163.10973, "b": 232.27562999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "AS ", "bbox": {"l": 148.1337, "t": 222.44550000000004, "r": 163.10973, "b": 232.27562999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 165.68669, "t": 222.44550000000004, "r": 171.40562, "b": 232.26415999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "<", "bbox": {"l": 165.68669, "t": 222.44550000000004, "r": 171.40562, "b": 232.26415999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 171.41136, "t": 222.44550000000004, "r": 251.20424000000003, "b": 232.27562999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "correlation name", "bbox": {"l": 171.41136, "t": 222.44550000000004, "r": 251.20424000000003, "b": 232.27562999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 251.21115, "t": 222.44550000000004, "r": 256.93008, "b": 232.26415999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": ">", "bbox": {"l": 251.21115, "t": 222.44550000000004, "r": 256.93008, "b": 232.26415999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 235.79649, "t": 204.22839, "r": 406.62051, "b": 212.10095, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "Specifies an optional correlation name that ca", "bbox": {"l": 235.79649, "t": 204.22839, "r": 406.62051, "b": 212.10095, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 480.53094, "t": 204.22839, "r": 532.89496, "b": 212.10095, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "be used within search-condition", "bbox": {"l": 480.53094, "t": 204.22839, "r": 532.89496, "b": 212.10095, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 148.1337, "t": 263.82836999999995, "r": 199.72467, "b": 273.65851, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "FOR ROWS", "bbox": {"l": 148.1337, "t": 263.82836999999995, "r": 199.72467, "b": 273.65851, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 321.56271, "t": 246.09411999999998, "r": 455.3432, "b": 253.96667000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "Indicates that a row permission is cr", "bbox": {"l": 321.56271, "t": 246.09411999999998, "r": 455.3432, "b": 253.96667000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 455.20786000000004, "t": 246.09411999999998, "r": 476.48404, "b": 253.96667000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "eated", "bbox": {"l": 455.20786000000004, "t": 246.09411999999998, "r": 476.48404, "b": 253.96667000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 321.5972, "t": 266.30267000000003, "r": 444.0292400000001, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "Specifies a condition that can be ", "bbox": {"l": 321.5972, "t": 266.30267000000003, "r": 444.0292400000001, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 444.07986, "t": 266.30267000000003, "r": 459.08678999999995, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "true,", "bbox": {"l": 444.07986, "t": 266.30267000000003, "r": 459.08678999999995, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 464.2088, "t": 266.30267000000003, "r": 530.94897, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "false, or unknown", "bbox": {"l": 464.2088, "t": 266.30267000000003, "r": 530.94897, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 148.1337, "t": 291.41708, "r": 183.42342, "b": 301.24722, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "WHERE", "bbox": {"l": 148.1337, "t": 291.41708, "r": 183.42342, "b": 301.24722, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 188.61984, "t": 291.41708, "r": 194.33878, "b": 301.23572, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "<", "bbox": {"l": 188.61984, "t": 291.41708, "r": 194.33878, "b": 301.23572, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 194.34451, "t": 291.41708, "r": 437.04659999999996, "b": 301.24722, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "logic to test: user and/or group and/or column value", "bbox": {"l": 194.34451, "t": 291.41708, "r": 437.04659999999996, "b": 301.24722, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 437.09020999999996, "t": 291.41708, "r": 442.80914000000007, "b": 301.23572, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": ">", "bbox": {"l": 437.09020999999996, "t": 291.41708, "r": 442.80914000000007, "b": 301.23572, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 148.1337, "t": 332.79999, "r": 278.77805, "b": 342.63013, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "ENFORCED FOR ALL ACCESS", "bbox": {"l": 148.1337, "t": 332.79999, "r": 278.77805, "b": 342.63013, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 271.55829, "t": 314.58276, "r": 457.4451, "b": 322.45535, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "Specifies that the row permission applies to all ref", "bbox": {"l": 271.55829, "t": 314.58276, "r": 457.4451, "b": 322.45535, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 457.19281, "t": 314.58276, "r": 531.74939, "b": 322.45535, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "erences of the table", "bbox": {"l": 457.19281, "t": 314.58276, "r": 531.74939, "b": 322.45535, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 148.1337, "t": 374.18289, "r": 185.17584, "b": 384.01302999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "ENABLE", "bbox": {"l": 148.1337, "t": 374.18289, "r": 185.17584, "b": 384.01302999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 312.28601, "t": 355.96576000000005, "r": 454.33505, "b": 363.83835, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "Specifies that the row permission is to", "bbox": {"l": 312.28601, "t": 355.96576000000005, "r": 454.33505, "b": 363.83835, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 454.3461, "t": 355.96576000000005, "r": 527.05286, "b": 363.83835, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": " be initially enabled", "bbox": {"l": 454.3461, "t": 355.96576000000005, "r": 527.05286, "b": 363.83835, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 311.73431, "t": 376.65717, "r": 315.94684, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "S", "bbox": {"l": 311.73431, "t": 376.65717, "r": 315.94684, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 329.28326, "t": 376.65717, "r": 371.71786, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "ifith t th", "bbox": {"l": 329.28326, "t": 376.65717, "r": 371.71786, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 415.0014, "t": 376.65717, "r": 417.09616, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "i", "bbox": {"l": 415.0014, "t": 376.65717, "r": 417.09616, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 424.27356, "t": 376.65717, "r": 426.36832, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "i", "bbox": {"l": 424.27356, "t": 376.65717, "r": 426.36832, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 438.13208, "t": 376.65717, "r": 440.2268399999999, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "i", "bbox": {"l": 438.13208, "t": 376.65717, "r": 440.2268399999999, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 445.88681, "t": 376.65717, "r": 448.95757999999995, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "t", "bbox": {"l": 445.88681, "t": 376.65717, "r": 448.95757999999995, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 455.8532400000001, "t": 376.65717, "r": 460.67346000000003, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "b", "bbox": {"l": 455.8532400000001, "t": 376.65717, "r": 460.67346000000003, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 467.36746, "t": 376.65717, "r": 470.06998000000004, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "i", "bbox": {"l": 467.36746, "t": 376.65717, "r": 470.06998000000004, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 472.73705999999993, "t": 376.65717, "r": 490.1676, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "iti ll", "bbox": {"l": 472.73705999999993, "t": 376.65717, "r": 490.1676, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 496.33661, "t": 376.65717, "r": 503.2608, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "di", "bbox": {"l": 496.33661, "t": 376.65717, "r": 503.2608, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 511.26138, "t": 376.65717, "r": 527.59674, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "bl d", "bbox": {"l": 511.26138, "t": 376.65717, "r": 527.59674, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 148.1337, "t": 387.9772, "r": 187.6265, "b": 397.80734000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "DISABLE", "bbox": {"l": 148.1337, "t": 387.9772, "r": 187.6265, "b": 397.80734000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 187.58514, "t": 387.9772, "r": 190.6628, "b": 397.79583999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": ";", "bbox": {"l": 187.58514, "t": 387.9772, "r": 190.6628, "b": 397.79583999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 311.73431, "t": 376.65717, "r": 455.83047000000005, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "Specifies that the row permission is to ", "bbox": {"l": 311.73431, "t": 376.65717, "r": 455.83047000000005, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 455.8848, "t": 376.65717, "r": 527.62122, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "be initially disabled", "bbox": {"l": 455.8848, "t": 376.65717, "r": 527.62122, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}]}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_footer", "id": 2, "page_no": 9, "cluster": {"id": 2, "label": "page_footer", "bbox": {"l": 344.94, "t": 755.538002, "r": 523.60162, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9526246786117554, "cells": [{"id": 0, "text": "Chapter 3. Row and Column Access Control ", "bbox": {"l": 344.94, "t": 755.538002, "r": 523.60162, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Chapter 3. Row and Column Access Control"}, {"label": "page_footer", "id": 5, "page_no": 9, "cluster": {"id": 5, "label": "page_footer", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.9071078896522522, "cells": [{"id": 1, "text": "15", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "15"}, {"label": "caption", "id": 6, "page_no": 9, "cluster": {"id": 6, "label": "caption", "bbox": {"l": 136.79956, "t": 71.50903000000005, "r": 528.73059, "b": 92.72185999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.872844398021698, "cells": [{"id": 2, "text": "The SQL ", "bbox": {"l": 136.79959, "t": 71.50903000000005, "r": 179.58179, "b": 80.72204999999985, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "CREATE PERMISSION", "bbox": {"l": 179.57977, "t": 71.65845000000002, "r": 264.47879, "b": 80.48302999999999, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": " statement that is shown in Figure 3-1 is used to define and ", "bbox": {"l": 264.53955, "t": 71.50903000000005, "r": 528.73059, "b": 80.72204999999985, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "initially enable or disable the row access rules.", "bbox": {"l": 136.79956, "t": 83.50885000000017, "r": 341.71762, "b": 92.72185999999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The SQL CREATE PERMISSION statement that is shown in Figure 3-1 is used to define and initially enable or disable the row access rules."}, {"label": "caption", "id": 4, "page_no": 9, "cluster": {"id": 4, "label": "caption", "bbox": {"l": 136.8, "t": 414.138, "r": 341.97659, "b": 422.46301, "coord_origin": "TOPLEFT"}, "confidence": 0.938783586025238, "cells": [{"id": 6, "text": "Figure 3-1 CREATE PERMISSION SQL statement", "bbox": {"l": 136.8, "t": 414.138, "r": 341.97659, "b": 422.46301, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 3-1 CREATE PERMISSION SQL statement"}, {"label": "section_header", "id": 3, "page_no": 9, "cluster": {"id": 3, "label": "section_header", "bbox": {"l": 136.8, "t": 439.94399999999996, "r": 215.37601, "b": 451.04401, "coord_origin": "TOPLEFT"}, "confidence": 0.9477567076683044, "cells": [{"id": 7, "text": "Column mask", "bbox": {"l": 136.8, "t": 439.94399999999996, "r": 215.37601, "b": 451.04401, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Column mask"}, {"label": "text", "id": 0, "page_no": 9, "cluster": {"id": 0, "label": "text", "bbox": {"l": 136.8, "t": 455.08871000000005, "r": 542.76648, "b": 500.30115, "coord_origin": "TOPLEFT"}, "confidence": 0.9843975901603699, "cells": [{"id": 8, "text": "A column mask is a database object that manifests a column value access control rule for a ", "bbox": {"l": 136.8, "t": 455.08871000000005, "r": 542.76648, "b": 464.3017, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "specific column in a specific table. It uses a CASE expression that describes what you see ", "bbox": {"l": 136.8, "t": 467.08853, "r": 537.84125, "b": 476.30151, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "when you access the column. For example, a teller can see only the last four digits of a tax ", "bbox": {"l": 136.8, "t": 479.08835, "r": 538.80927, "b": 488.30133, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "identification number.", "bbox": {"l": 136.8, "t": 491.08817, "r": 231.20888, "b": 500.30115, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "A column mask is a database object that manifests a column value access control rule for a specific column in a specific table. It uses a CASE expression that describes what you see when you access the column. For example, a teller can see only the last four digits of a tax identification number."}, {"label": "picture", "id": 1, "page_no": 9, "cluster": {"id": 1, "label": "picture", "bbox": {"l": 135.97177124023438, "t": 107.41075134277344, "r": 545.4180908203125, "b": 410.60931396484375, "coord_origin": "TOPLEFT"}, "confidence": 0.9788318872451782, "cells": [{"id": 12, "text": "CREATE PERMISSION", "bbox": {"l": 148.1337, "t": 139.67969000000005, "r": 246.7961, "b": 149.50982999999997, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "<", "bbox": {"l": 251.86685, "t": 139.67969000000005, "r": 257.58578, "b": 149.49834999999996, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "permission name", "bbox": {"l": 257.59152, "t": 139.67969000000005, "r": 336.99741, "b": 149.50982999999997, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": ">", "bbox": {"l": 337.01233, "t": 139.67969000000005, "r": 342.73126, "b": 149.49834999999996, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Names the row permission for row access control", "bbox": {"l": 346.56491, "t": 121.46252000000004, "r": 530.74371, "b": 129.33507999999995, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "ON", "bbox": {"l": 148.1337, "t": 181.06255999999996, "r": 163.45079, "b": 190.8927, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "<", "bbox": {"l": 168.58405, "t": 181.06255999999996, "r": 174.30298, "b": 190.88122999999996, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "table name", "bbox": {"l": 174.30872, "t": 181.06255999999996, "r": 226.86777, "b": 190.8927, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": ">", "bbox": {"l": 226.86548000000002, "t": 181.06255999999996, "r": 232.58441, "b": 190.88122999999996, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Identifies the table on which the row ", "bbox": {"l": 311.3204, "t": 166.29413, "r": 450.77191000000005, "b": 174.16669000000002, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "permission is created", "bbox": {"l": 450.86123999999995, "t": 166.29413, "r": 529.93134, "b": 174.16669000000002, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "AS ", "bbox": {"l": 148.1337, "t": 222.44550000000004, "r": 163.10973, "b": 232.27562999999998, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "<", "bbox": {"l": 165.68669, "t": 222.44550000000004, "r": 171.40562, "b": 232.26415999999995, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "correlation name", "bbox": {"l": 171.41136, "t": 222.44550000000004, "r": 251.20424000000003, "b": 232.27562999999998, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": ">", "bbox": {"l": 251.21115, "t": 222.44550000000004, "r": 256.93008, "b": 232.26415999999995, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Specifies an optional correlation name that ca", "bbox": {"l": 235.79649, "t": 204.22839, "r": 406.62051, "b": 212.10095, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "be used within search-condition", "bbox": {"l": 480.53094, "t": 204.22839, "r": 532.89496, "b": 212.10095, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "FOR ROWS", "bbox": {"l": 148.1337, "t": 263.82836999999995, "r": 199.72467, "b": 273.65851, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Indicates that a row permission is cr", "bbox": {"l": 321.56271, "t": 246.09411999999998, "r": 455.3432, "b": 253.96667000000002, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "eated", "bbox": {"l": 455.20786000000004, "t": 246.09411999999998, "r": 476.48404, "b": 253.96667000000002, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Specifies a condition that can be ", "bbox": {"l": 321.5972, "t": 266.30267000000003, "r": 444.0292400000001, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "true,", "bbox": {"l": 444.07986, "t": 266.30267000000003, "r": 459.08678999999995, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "false, or unknown", "bbox": {"l": 464.2088, "t": 266.30267000000003, "r": 530.94897, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "WHERE", "bbox": {"l": 148.1337, "t": 291.41708, "r": 183.42342, "b": 301.24722, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "<", "bbox": {"l": 188.61984, "t": 291.41708, "r": 194.33878, "b": 301.23572, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "logic to test: user and/or group and/or column value", "bbox": {"l": 194.34451, "t": 291.41708, "r": 437.04659999999996, "b": 301.24722, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": ">", "bbox": {"l": 437.09020999999996, "t": 291.41708, "r": 442.80914000000007, "b": 301.23572, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "ENFORCED FOR ALL ACCESS", "bbox": {"l": 148.1337, "t": 332.79999, "r": 278.77805, "b": 342.63013, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "Specifies that the row permission applies to all ref", "bbox": {"l": 271.55829, "t": 314.58276, "r": 457.4451, "b": 322.45535, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "erences of the table", "bbox": {"l": 457.19281, "t": 314.58276, "r": 531.74939, "b": 322.45535, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "ENABLE", "bbox": {"l": 148.1337, "t": 374.18289, "r": 185.17584, "b": 384.01302999999996, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Specifies that the row permission is to", "bbox": {"l": 312.28601, "t": 355.96576000000005, "r": 454.33505, "b": 363.83835, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": " be initially enabled", "bbox": {"l": 454.3461, "t": 355.96576000000005, "r": 527.05286, "b": 363.83835, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "S", "bbox": {"l": 311.73431, "t": 376.65717, "r": 315.94684, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "ifith t th", "bbox": {"l": 329.28326, "t": 376.65717, "r": 371.71786, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "i", "bbox": {"l": 415.0014, "t": 376.65717, "r": 417.09616, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "i", "bbox": {"l": 424.27356, "t": 376.65717, "r": 426.36832, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "i", "bbox": {"l": 438.13208, "t": 376.65717, "r": 440.2268399999999, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "t", "bbox": {"l": 445.88681, "t": 376.65717, "r": 448.95757999999995, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "b", "bbox": {"l": 455.8532400000001, "t": 376.65717, "r": 460.67346000000003, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "i", "bbox": {"l": 467.36746, "t": 376.65717, "r": 470.06998000000004, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "iti ll", "bbox": {"l": 472.73705999999993, "t": 376.65717, "r": 490.1676, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "di", "bbox": {"l": 496.33661, "t": 376.65717, "r": 503.2608, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "bl d", "bbox": {"l": 511.26138, "t": 376.65717, "r": 527.59674, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "DISABLE", "bbox": {"l": 148.1337, "t": 387.9772, "r": 187.6265, "b": 397.80734000000007, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": ";", "bbox": {"l": 187.58514, "t": 387.9772, "r": 190.6628, "b": 397.79583999999994, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Specifies that the row permission is to ", "bbox": {"l": 311.73431, "t": 376.65717, "r": 455.83047000000005, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "be initially disabled", "bbox": {"l": 455.8848, "t": 376.65717, "r": 527.62122, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": [{"id": 7, "label": "text", "bbox": {"l": 148.1337, "t": 139.67969000000005, "r": 246.7961, "b": 149.50982999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "CREATE PERMISSION", "bbox": {"l": 148.1337, "t": 139.67969000000005, "r": 246.7961, "b": 149.50982999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "text", "bbox": {"l": 251.86685, "t": 139.67969000000005, "r": 257.58578, "b": 149.49834999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "<", "bbox": {"l": 251.86685, "t": 139.67969000000005, "r": 257.58578, "b": 149.49834999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 257.59152, "t": 139.67969000000005, "r": 336.99741, "b": 149.50982999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "permission name", "bbox": {"l": 257.59152, "t": 139.67969000000005, "r": 336.99741, "b": 149.50982999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "text", "bbox": {"l": 337.01233, "t": 139.67969000000005, "r": 342.73126, "b": 149.49834999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": ">", "bbox": {"l": 337.01233, "t": 139.67969000000005, "r": 342.73126, "b": 149.49834999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 346.56491, "t": 121.46252000000004, "r": 530.74371, "b": 129.33507999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "Names the row permission for row access control", "bbox": {"l": 346.56491, "t": 121.46252000000004, "r": 530.74371, "b": 129.33507999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 148.1337, "t": 181.06255999999996, "r": 163.45079, "b": 190.8927, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "ON", "bbox": {"l": 148.1337, "t": 181.06255999999996, "r": 163.45079, "b": 190.8927, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 168.58405, "t": 181.06255999999996, "r": 174.30298, "b": 190.88122999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "<", "bbox": {"l": 168.58405, "t": 181.06255999999996, "r": 174.30298, "b": 190.88122999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 174.30872, "t": 181.06255999999996, "r": 226.86777, "b": 190.8927, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "table name", "bbox": {"l": 174.30872, "t": 181.06255999999996, "r": 226.86777, "b": 190.8927, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 226.86548000000002, "t": 181.06255999999996, "r": 232.58441, "b": 190.88122999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": ">", "bbox": {"l": 226.86548000000002, "t": 181.06255999999996, "r": 232.58441, "b": 190.88122999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 311.3204, "t": 166.29413, "r": 450.77191000000005, "b": 174.16669000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "Identifies the table on which the row ", "bbox": {"l": 311.3204, "t": 166.29413, "r": 450.77191000000005, "b": 174.16669000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 450.86123999999995, "t": 166.29413, "r": 529.93134, "b": 174.16669000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "permission is created", "bbox": {"l": 450.86123999999995, "t": 166.29413, "r": 529.93134, "b": 174.16669000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 148.1337, "t": 222.44550000000004, "r": 163.10973, "b": 232.27562999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "AS ", "bbox": {"l": 148.1337, "t": 222.44550000000004, "r": 163.10973, "b": 232.27562999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 165.68669, "t": 222.44550000000004, "r": 171.40562, "b": 232.26415999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "<", "bbox": {"l": 165.68669, "t": 222.44550000000004, "r": 171.40562, "b": 232.26415999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 171.41136, "t": 222.44550000000004, "r": 251.20424000000003, "b": 232.27562999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "correlation name", "bbox": {"l": 171.41136, "t": 222.44550000000004, "r": 251.20424000000003, "b": 232.27562999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 251.21115, "t": 222.44550000000004, "r": 256.93008, "b": 232.26415999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": ">", "bbox": {"l": 251.21115, "t": 222.44550000000004, "r": 256.93008, "b": 232.26415999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 235.79649, "t": 204.22839, "r": 406.62051, "b": 212.10095, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "Specifies an optional correlation name that ca", "bbox": {"l": 235.79649, "t": 204.22839, "r": 406.62051, "b": 212.10095, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 480.53094, "t": 204.22839, "r": 532.89496, "b": 212.10095, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "be used within search-condition", "bbox": {"l": 480.53094, "t": 204.22839, "r": 532.89496, "b": 212.10095, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 148.1337, "t": 263.82836999999995, "r": 199.72467, "b": 273.65851, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "FOR ROWS", "bbox": {"l": 148.1337, "t": 263.82836999999995, "r": 199.72467, "b": 273.65851, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 321.56271, "t": 246.09411999999998, "r": 455.3432, "b": 253.96667000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "Indicates that a row permission is cr", "bbox": {"l": 321.56271, "t": 246.09411999999998, "r": 455.3432, "b": 253.96667000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 455.20786000000004, "t": 246.09411999999998, "r": 476.48404, "b": 253.96667000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "eated", "bbox": {"l": 455.20786000000004, "t": 246.09411999999998, "r": 476.48404, "b": 253.96667000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 321.5972, "t": 266.30267000000003, "r": 444.0292400000001, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "Specifies a condition that can be ", "bbox": {"l": 321.5972, "t": 266.30267000000003, "r": 444.0292400000001, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 444.07986, "t": 266.30267000000003, "r": 459.08678999999995, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "true,", "bbox": {"l": 444.07986, "t": 266.30267000000003, "r": 459.08678999999995, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 464.2088, "t": 266.30267000000003, "r": 530.94897, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "false, or unknown", "bbox": {"l": 464.2088, "t": 266.30267000000003, "r": 530.94897, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 148.1337, "t": 291.41708, "r": 183.42342, "b": 301.24722, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "WHERE", "bbox": {"l": 148.1337, "t": 291.41708, "r": 183.42342, "b": 301.24722, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 188.61984, "t": 291.41708, "r": 194.33878, "b": 301.23572, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "<", "bbox": {"l": 188.61984, "t": 291.41708, "r": 194.33878, "b": 301.23572, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 194.34451, "t": 291.41708, "r": 437.04659999999996, "b": 301.24722, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "logic to test: user and/or group and/or column value", "bbox": {"l": 194.34451, "t": 291.41708, "r": 437.04659999999996, "b": 301.24722, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 437.09020999999996, "t": 291.41708, "r": 442.80914000000007, "b": 301.23572, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": ">", "bbox": {"l": 437.09020999999996, "t": 291.41708, "r": 442.80914000000007, "b": 301.23572, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 148.1337, "t": 332.79999, "r": 278.77805, "b": 342.63013, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "ENFORCED FOR ALL ACCESS", "bbox": {"l": 148.1337, "t": 332.79999, "r": 278.77805, "b": 342.63013, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 271.55829, "t": 314.58276, "r": 457.4451, "b": 322.45535, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "Specifies that the row permission applies to all ref", "bbox": {"l": 271.55829, "t": 314.58276, "r": 457.4451, "b": 322.45535, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 457.19281, "t": 314.58276, "r": 531.74939, "b": 322.45535, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "erences of the table", "bbox": {"l": 457.19281, "t": 314.58276, "r": 531.74939, "b": 322.45535, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 148.1337, "t": 374.18289, "r": 185.17584, "b": 384.01302999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "ENABLE", "bbox": {"l": 148.1337, "t": 374.18289, "r": 185.17584, "b": 384.01302999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 312.28601, "t": 355.96576000000005, "r": 454.33505, "b": 363.83835, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "Specifies that the row permission is to", "bbox": {"l": 312.28601, "t": 355.96576000000005, "r": 454.33505, "b": 363.83835, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 454.3461, "t": 355.96576000000005, "r": 527.05286, "b": 363.83835, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": " be initially enabled", "bbox": {"l": 454.3461, "t": 355.96576000000005, "r": 527.05286, "b": 363.83835, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 311.73431, "t": 376.65717, "r": 315.94684, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "S", "bbox": {"l": 311.73431, "t": 376.65717, "r": 315.94684, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 329.28326, "t": 376.65717, "r": 371.71786, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "ifith t th", "bbox": {"l": 329.28326, "t": 376.65717, "r": 371.71786, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 415.0014, "t": 376.65717, "r": 417.09616, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "i", "bbox": {"l": 415.0014, "t": 376.65717, "r": 417.09616, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 424.27356, "t": 376.65717, "r": 426.36832, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "i", "bbox": {"l": 424.27356, "t": 376.65717, "r": 426.36832, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 438.13208, "t": 376.65717, "r": 440.2268399999999, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "i", "bbox": {"l": 438.13208, "t": 376.65717, "r": 440.2268399999999, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 445.88681, "t": 376.65717, "r": 448.95757999999995, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "t", "bbox": {"l": 445.88681, "t": 376.65717, "r": 448.95757999999995, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 455.8532400000001, "t": 376.65717, "r": 460.67346000000003, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "b", "bbox": {"l": 455.8532400000001, "t": 376.65717, "r": 460.67346000000003, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 467.36746, "t": 376.65717, "r": 470.06998000000004, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "i", "bbox": {"l": 467.36746, "t": 376.65717, "r": 470.06998000000004, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 472.73705999999993, "t": 376.65717, "r": 490.1676, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "iti ll", "bbox": {"l": 472.73705999999993, "t": 376.65717, "r": 490.1676, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 496.33661, "t": 376.65717, "r": 503.2608, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "di", "bbox": {"l": 496.33661, "t": 376.65717, "r": 503.2608, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 511.26138, "t": 376.65717, "r": 527.59674, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "bl d", "bbox": {"l": 511.26138, "t": 376.65717, "r": 527.59674, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 148.1337, "t": 387.9772, "r": 187.6265, "b": 397.80734000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "DISABLE", "bbox": {"l": 148.1337, "t": 387.9772, "r": 187.6265, "b": 397.80734000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 187.58514, "t": 387.9772, "r": 190.6628, "b": 397.79583999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": ";", "bbox": {"l": 187.58514, "t": 387.9772, "r": 190.6628, "b": 397.79583999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 311.73431, "t": 376.65717, "r": 455.83047000000005, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "Specifies that the row permission is to ", "bbox": {"l": 311.73431, "t": 376.65717, "r": 455.83047000000005, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 455.8848, "t": 376.65717, "r": 527.62122, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "be initially disabled", "bbox": {"l": 455.8848, "t": 376.65717, "r": 527.62122, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "body": [{"label": "caption", "id": 6, "page_no": 9, "cluster": {"id": 6, "label": "caption", "bbox": {"l": 136.79956, "t": 71.50903000000005, "r": 528.73059, "b": 92.72185999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.872844398021698, "cells": [{"id": 2, "text": "The SQL ", "bbox": {"l": 136.79959, "t": 71.50903000000005, "r": 179.58179, "b": 80.72204999999985, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "CREATE PERMISSION", "bbox": {"l": 179.57977, "t": 71.65845000000002, "r": 264.47879, "b": 80.48302999999999, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": " statement that is shown in Figure 3-1 is used to define and ", "bbox": {"l": 264.53955, "t": 71.50903000000005, "r": 528.73059, "b": 80.72204999999985, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "initially enable or disable the row access rules.", "bbox": {"l": 136.79956, "t": 83.50885000000017, "r": 341.71762, "b": 92.72185999999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The SQL CREATE PERMISSION statement that is shown in Figure 3-1 is used to define and initially enable or disable the row access rules."}, {"label": "caption", "id": 4, "page_no": 9, "cluster": {"id": 4, "label": "caption", "bbox": {"l": 136.8, "t": 414.138, "r": 341.97659, "b": 422.46301, "coord_origin": "TOPLEFT"}, "confidence": 0.938783586025238, "cells": [{"id": 6, "text": "Figure 3-1 CREATE PERMISSION SQL statement", "bbox": {"l": 136.8, "t": 414.138, "r": 341.97659, "b": 422.46301, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 3-1 CREATE PERMISSION SQL statement"}, {"label": "section_header", "id": 3, "page_no": 9, "cluster": {"id": 3, "label": "section_header", "bbox": {"l": 136.8, "t": 439.94399999999996, "r": 215.37601, "b": 451.04401, "coord_origin": "TOPLEFT"}, "confidence": 0.9477567076683044, "cells": [{"id": 7, "text": "Column mask", "bbox": {"l": 136.8, "t": 439.94399999999996, "r": 215.37601, "b": 451.04401, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Column mask"}, {"label": "text", "id": 0, "page_no": 9, "cluster": {"id": 0, "label": "text", "bbox": {"l": 136.8, "t": 455.08871000000005, "r": 542.76648, "b": 500.30115, "coord_origin": "TOPLEFT"}, "confidence": 0.9843975901603699, "cells": [{"id": 8, "text": "A column mask is a database object that manifests a column value access control rule for a ", "bbox": {"l": 136.8, "t": 455.08871000000005, "r": 542.76648, "b": 464.3017, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "specific column in a specific table. It uses a CASE expression that describes what you see ", "bbox": {"l": 136.8, "t": 467.08853, "r": 537.84125, "b": 476.30151, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "when you access the column. For example, a teller can see only the last four digits of a tax ", "bbox": {"l": 136.8, "t": 479.08835, "r": 538.80927, "b": 488.30133, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "identification number.", "bbox": {"l": 136.8, "t": 491.08817, "r": 231.20888, "b": 500.30115, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "A column mask is a database object that manifests a column value access control rule for a specific column in a specific table. It uses a CASE expression that describes what you see when you access the column. For example, a teller can see only the last four digits of a tax identification number."}, {"label": "picture", "id": 1, "page_no": 9, "cluster": {"id": 1, "label": "picture", "bbox": {"l": 135.97177124023438, "t": 107.41075134277344, "r": 545.4180908203125, "b": 410.60931396484375, "coord_origin": "TOPLEFT"}, "confidence": 0.9788318872451782, "cells": [{"id": 12, "text": "CREATE PERMISSION", "bbox": {"l": 148.1337, "t": 139.67969000000005, "r": 246.7961, "b": 149.50982999999997, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "<", "bbox": {"l": 251.86685, "t": 139.67969000000005, "r": 257.58578, "b": 149.49834999999996, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "permission name", "bbox": {"l": 257.59152, "t": 139.67969000000005, "r": 336.99741, "b": 149.50982999999997, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": ">", "bbox": {"l": 337.01233, "t": 139.67969000000005, "r": 342.73126, "b": 149.49834999999996, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Names the row permission for row access control", "bbox": {"l": 346.56491, "t": 121.46252000000004, "r": 530.74371, "b": 129.33507999999995, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "ON", "bbox": {"l": 148.1337, "t": 181.06255999999996, "r": 163.45079, "b": 190.8927, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "<", "bbox": {"l": 168.58405, "t": 181.06255999999996, "r": 174.30298, "b": 190.88122999999996, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "table name", "bbox": {"l": 174.30872, "t": 181.06255999999996, "r": 226.86777, "b": 190.8927, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": ">", "bbox": {"l": 226.86548000000002, "t": 181.06255999999996, "r": 232.58441, "b": 190.88122999999996, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "Identifies the table on which the row ", "bbox": {"l": 311.3204, "t": 166.29413, "r": 450.77191000000005, "b": 174.16669000000002, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "permission is created", "bbox": {"l": 450.86123999999995, "t": 166.29413, "r": 529.93134, "b": 174.16669000000002, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "AS ", "bbox": {"l": 148.1337, "t": 222.44550000000004, "r": 163.10973, "b": 232.27562999999998, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "<", "bbox": {"l": 165.68669, "t": 222.44550000000004, "r": 171.40562, "b": 232.26415999999995, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "correlation name", "bbox": {"l": 171.41136, "t": 222.44550000000004, "r": 251.20424000000003, "b": 232.27562999999998, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": ">", "bbox": {"l": 251.21115, "t": 222.44550000000004, "r": 256.93008, "b": 232.26415999999995, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Specifies an optional correlation name that ca", "bbox": {"l": 235.79649, "t": 204.22839, "r": 406.62051, "b": 212.10095, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "be used within search-condition", "bbox": {"l": 480.53094, "t": 204.22839, "r": 532.89496, "b": 212.10095, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "FOR ROWS", "bbox": {"l": 148.1337, "t": 263.82836999999995, "r": 199.72467, "b": 273.65851, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Indicates that a row permission is cr", "bbox": {"l": 321.56271, "t": 246.09411999999998, "r": 455.3432, "b": 253.96667000000002, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "eated", "bbox": {"l": 455.20786000000004, "t": 246.09411999999998, "r": 476.48404, "b": 253.96667000000002, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Specifies a condition that can be ", "bbox": {"l": 321.5972, "t": 266.30267000000003, "r": 444.0292400000001, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "true,", "bbox": {"l": 444.07986, "t": 266.30267000000003, "r": 459.08678999999995, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "false, or unknown", "bbox": {"l": 464.2088, "t": 266.30267000000003, "r": 530.94897, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "WHERE", "bbox": {"l": 148.1337, "t": 291.41708, "r": 183.42342, "b": 301.24722, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "<", "bbox": {"l": 188.61984, "t": 291.41708, "r": 194.33878, "b": 301.23572, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "logic to test: user and/or group and/or column value", "bbox": {"l": 194.34451, "t": 291.41708, "r": 437.04659999999996, "b": 301.24722, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": ">", "bbox": {"l": 437.09020999999996, "t": 291.41708, "r": 442.80914000000007, "b": 301.23572, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "ENFORCED FOR ALL ACCESS", "bbox": {"l": 148.1337, "t": 332.79999, "r": 278.77805, "b": 342.63013, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "Specifies that the row permission applies to all ref", "bbox": {"l": 271.55829, "t": 314.58276, "r": 457.4451, "b": 322.45535, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "erences of the table", "bbox": {"l": 457.19281, "t": 314.58276, "r": 531.74939, "b": 322.45535, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "ENABLE", "bbox": {"l": 148.1337, "t": 374.18289, "r": 185.17584, "b": 384.01302999999996, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Specifies that the row permission is to", "bbox": {"l": 312.28601, "t": 355.96576000000005, "r": 454.33505, "b": 363.83835, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": " be initially enabled", "bbox": {"l": 454.3461, "t": 355.96576000000005, "r": 527.05286, "b": 363.83835, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "S", "bbox": {"l": 311.73431, "t": 376.65717, "r": 315.94684, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "ifith t th", "bbox": {"l": 329.28326, "t": 376.65717, "r": 371.71786, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "i", "bbox": {"l": 415.0014, "t": 376.65717, "r": 417.09616, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "i", "bbox": {"l": 424.27356, "t": 376.65717, "r": 426.36832, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "i", "bbox": {"l": 438.13208, "t": 376.65717, "r": 440.2268399999999, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "t", "bbox": {"l": 445.88681, "t": 376.65717, "r": 448.95757999999995, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "b", "bbox": {"l": 455.8532400000001, "t": 376.65717, "r": 460.67346000000003, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "i", "bbox": {"l": 467.36746, "t": 376.65717, "r": 470.06998000000004, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "iti ll", "bbox": {"l": 472.73705999999993, "t": 376.65717, "r": 490.1676, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "di", "bbox": {"l": 496.33661, "t": 376.65717, "r": 503.2608, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "bl d", "bbox": {"l": 511.26138, "t": 376.65717, "r": 527.59674, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "DISABLE", "bbox": {"l": 148.1337, "t": 387.9772, "r": 187.6265, "b": 397.80734000000007, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": ";", "bbox": {"l": 187.58514, "t": 387.9772, "r": 190.6628, "b": 397.79583999999994, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Specifies that the row permission is to ", "bbox": {"l": 311.73431, "t": 376.65717, "r": 455.83047000000005, "b": 384.52975, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "be initially disabled", "bbox": {"l": 455.8848, "t": 376.65717, "r": 527.62122, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": [{"id": 7, "label": "text", "bbox": {"l": 148.1337, "t": 139.67969000000005, "r": 246.7961, "b": 149.50982999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 12, "text": "CREATE PERMISSION", "bbox": {"l": 148.1337, "t": 139.67969000000005, "r": 246.7961, "b": 149.50982999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "text", "bbox": {"l": 251.86685, "t": 139.67969000000005, "r": 257.58578, "b": 149.49834999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 13, "text": "<", "bbox": {"l": 251.86685, "t": 139.67969000000005, "r": 257.58578, "b": 149.49834999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 257.59152, "t": 139.67969000000005, "r": 336.99741, "b": 149.50982999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "permission name", "bbox": {"l": 257.59152, "t": 139.67969000000005, "r": 336.99741, "b": 149.50982999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "text", "bbox": {"l": 337.01233, "t": 139.67969000000005, "r": 342.73126, "b": 149.49834999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 15, "text": ">", "bbox": {"l": 337.01233, "t": 139.67969000000005, "r": 342.73126, "b": 149.49834999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 346.56491, "t": 121.46252000000004, "r": 530.74371, "b": 129.33507999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 16, "text": "Names the row permission for row access control", "bbox": {"l": 346.56491, "t": 121.46252000000004, "r": 530.74371, "b": 129.33507999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 148.1337, "t": 181.06255999999996, "r": 163.45079, "b": 190.8927, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "ON", "bbox": {"l": 148.1337, "t": 181.06255999999996, "r": 163.45079, "b": 190.8927, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 168.58405, "t": 181.06255999999996, "r": 174.30298, "b": 190.88122999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "<", "bbox": {"l": 168.58405, "t": 181.06255999999996, "r": 174.30298, "b": 190.88122999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 174.30872, "t": 181.06255999999996, "r": 226.86777, "b": 190.8927, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "table name", "bbox": {"l": 174.30872, "t": 181.06255999999996, "r": 226.86777, "b": 190.8927, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 226.86548000000002, "t": 181.06255999999996, "r": 232.58441, "b": 190.88122999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 20, "text": ">", "bbox": {"l": 226.86548000000002, "t": 181.06255999999996, "r": 232.58441, "b": 190.88122999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 311.3204, "t": 166.29413, "r": 450.77191000000005, "b": 174.16669000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 21, "text": "Identifies the table on which the row ", "bbox": {"l": 311.3204, "t": 166.29413, "r": 450.77191000000005, "b": 174.16669000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 450.86123999999995, "t": 166.29413, "r": 529.93134, "b": 174.16669000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 22, "text": "permission is created", "bbox": {"l": 450.86123999999995, "t": 166.29413, "r": 529.93134, "b": 174.16669000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 148.1337, "t": 222.44550000000004, "r": 163.10973, "b": 232.27562999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 23, "text": "AS ", "bbox": {"l": 148.1337, "t": 222.44550000000004, "r": 163.10973, "b": 232.27562999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 165.68669, "t": 222.44550000000004, "r": 171.40562, "b": 232.26415999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 24, "text": "<", "bbox": {"l": 165.68669, "t": 222.44550000000004, "r": 171.40562, "b": 232.26415999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 171.41136, "t": 222.44550000000004, "r": 251.20424000000003, "b": 232.27562999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "correlation name", "bbox": {"l": 171.41136, "t": 222.44550000000004, "r": 251.20424000000003, "b": 232.27562999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 251.21115, "t": 222.44550000000004, "r": 256.93008, "b": 232.26415999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": ">", "bbox": {"l": 251.21115, "t": 222.44550000000004, "r": 256.93008, "b": 232.26415999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 235.79649, "t": 204.22839, "r": 406.62051, "b": 212.10095, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 27, "text": "Specifies an optional correlation name that ca", "bbox": {"l": 235.79649, "t": 204.22839, "r": 406.62051, "b": 212.10095, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 480.53094, "t": 204.22839, "r": 532.89496, "b": 212.10095, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "be used within search-condition", "bbox": {"l": 480.53094, "t": 204.22839, "r": 532.89496, "b": 212.10095, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 148.1337, "t": 263.82836999999995, "r": 199.72467, "b": 273.65851, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "FOR ROWS", "bbox": {"l": 148.1337, "t": 263.82836999999995, "r": 199.72467, "b": 273.65851, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 321.56271, "t": 246.09411999999998, "r": 455.3432, "b": 253.96667000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "Indicates that a row permission is cr", "bbox": {"l": 321.56271, "t": 246.09411999999998, "r": 455.3432, "b": 253.96667000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 455.20786000000004, "t": 246.09411999999998, "r": 476.48404, "b": 253.96667000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "eated", "bbox": {"l": 455.20786000000004, "t": 246.09411999999998, "r": 476.48404, "b": 253.96667000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 321.5972, "t": 266.30267000000003, "r": 444.0292400000001, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "Specifies a condition that can be ", "bbox": {"l": 321.5972, "t": 266.30267000000003, "r": 444.0292400000001, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 444.07986, "t": 266.30267000000003, "r": 459.08678999999995, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "true,", "bbox": {"l": 444.07986, "t": 266.30267000000003, "r": 459.08678999999995, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 464.2088, "t": 266.30267000000003, "r": 530.94897, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "false, or unknown", "bbox": {"l": 464.2088, "t": 266.30267000000003, "r": 530.94897, "b": 274.17523000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 148.1337, "t": 291.41708, "r": 183.42342, "b": 301.24722, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "WHERE", "bbox": {"l": 148.1337, "t": 291.41708, "r": 183.42342, "b": 301.24722, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 188.61984, "t": 291.41708, "r": 194.33878, "b": 301.23572, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "<", "bbox": {"l": 188.61984, "t": 291.41708, "r": 194.33878, "b": 301.23572, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 194.34451, "t": 291.41708, "r": 437.04659999999996, "b": 301.24722, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "logic to test: user and/or group and/or column value", "bbox": {"l": 194.34451, "t": 291.41708, "r": 437.04659999999996, "b": 301.24722, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 437.09020999999996, "t": 291.41708, "r": 442.80914000000007, "b": 301.23572, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": ">", "bbox": {"l": 437.09020999999996, "t": 291.41708, "r": 442.80914000000007, "b": 301.23572, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 148.1337, "t": 332.79999, "r": 278.77805, "b": 342.63013, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "ENFORCED FOR ALL ACCESS", "bbox": {"l": 148.1337, "t": 332.79999, "r": 278.77805, "b": 342.63013, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 271.55829, "t": 314.58276, "r": 457.4451, "b": 322.45535, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "Specifies that the row permission applies to all ref", "bbox": {"l": 271.55829, "t": 314.58276, "r": 457.4451, "b": 322.45535, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 457.19281, "t": 314.58276, "r": 531.74939, "b": 322.45535, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "erences of the table", "bbox": {"l": 457.19281, "t": 314.58276, "r": 531.74939, "b": 322.45535, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 148.1337, "t": 374.18289, "r": 185.17584, "b": 384.01302999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "ENABLE", "bbox": {"l": 148.1337, "t": 374.18289, "r": 185.17584, "b": 384.01302999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 312.28601, "t": 355.96576000000005, "r": 454.33505, "b": 363.83835, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "Specifies that the row permission is to", "bbox": {"l": 312.28601, "t": 355.96576000000005, "r": 454.33505, "b": 363.83835, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 454.3461, "t": 355.96576000000005, "r": 527.05286, "b": 363.83835, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": " be initially enabled", "bbox": {"l": 454.3461, "t": 355.96576000000005, "r": 527.05286, "b": 363.83835, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 311.73431, "t": 376.65717, "r": 315.94684, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "S", "bbox": {"l": 311.73431, "t": 376.65717, "r": 315.94684, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 329.28326, "t": 376.65717, "r": 371.71786, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "ifith t th", "bbox": {"l": 329.28326, "t": 376.65717, "r": 371.71786, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 415.0014, "t": 376.65717, "r": 417.09616, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "i", "bbox": {"l": 415.0014, "t": 376.65717, "r": 417.09616, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 424.27356, "t": 376.65717, "r": 426.36832, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "i", "bbox": {"l": 424.27356, "t": 376.65717, "r": 426.36832, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 44, "label": "text", "bbox": {"l": 438.13208, "t": 376.65717, "r": 440.2268399999999, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "i", "bbox": {"l": 438.13208, "t": 376.65717, "r": 440.2268399999999, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 45, "label": "text", "bbox": {"l": 445.88681, "t": 376.65717, "r": 448.95757999999995, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "t", "bbox": {"l": 445.88681, "t": 376.65717, "r": 448.95757999999995, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 46, "label": "text", "bbox": {"l": 455.8532400000001, "t": 376.65717, "r": 460.67346000000003, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "b", "bbox": {"l": 455.8532400000001, "t": 376.65717, "r": 460.67346000000003, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 47, "label": "text", "bbox": {"l": 467.36746, "t": 376.65717, "r": 470.06998000000004, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "i", "bbox": {"l": 467.36746, "t": 376.65717, "r": 470.06998000000004, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 48, "label": "text", "bbox": {"l": 472.73705999999993, "t": 376.65717, "r": 490.1676, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "iti ll", "bbox": {"l": 472.73705999999993, "t": 376.65717, "r": 490.1676, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 49, "label": "text", "bbox": {"l": 496.33661, "t": 376.65717, "r": 503.2608, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "di", "bbox": {"l": 496.33661, "t": 376.65717, "r": 503.2608, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 50, "label": "text", "bbox": {"l": 511.26138, "t": 376.65717, "r": 527.59674, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "bl d", "bbox": {"l": 511.26138, "t": 376.65717, "r": 527.59674, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 51, "label": "text", "bbox": {"l": 148.1337, "t": 387.9772, "r": 187.6265, "b": 397.80734000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "DISABLE", "bbox": {"l": 148.1337, "t": 387.9772, "r": 187.6265, "b": 397.80734000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 52, "label": "text", "bbox": {"l": 187.58514, "t": 387.9772, "r": 190.6628, "b": 397.79583999999994, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": ";", "bbox": {"l": 187.58514, "t": 387.9772, "r": 190.6628, "b": 397.79583999999994, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 53, "label": "text", "bbox": {"l": 311.73431, "t": 376.65717, "r": 455.83047000000005, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "Specifies that the row permission is to ", "bbox": {"l": 311.73431, "t": 376.65717, "r": 455.83047000000005, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 54, "label": "text", "bbox": {"l": 455.8848, "t": 376.65717, "r": 527.62122, "b": 384.52975, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 59, "text": "be initially disabled", "bbox": {"l": 455.8848, "t": 376.65717, "r": 527.62122, "b": 384.52975, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "headers": [{"label": "page_footer", "id": 2, "page_no": 9, "cluster": {"id": 2, "label": "page_footer", "bbox": {"l": 344.94, "t": 755.538002, "r": 523.60162, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9526246786117554, "cells": [{"id": 0, "text": "Chapter 3. Row and Column Access Control ", "bbox": {"l": 344.94, "t": 755.538002, "r": 523.60162, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Chapter 3. Row and Column Access Control"}, {"label": "page_footer", "id": 5, "page_no": 9, "cluster": {"id": 5, "label": "page_footer", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.9071078896522522, "cells": [{"id": 1, "text": "15", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "15"}]}}, {"page_no": 10, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "Chapter 3. Row and Column Access Control ", "bbox": {"l": 344.94, "t": 755.538002, "r": 523.60162, "b": 763.863001, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "19", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Table 3-1 summarizes these special registers and their values.", "bbox": {"l": 136.79959, "t": 71.50903000000005, "r": 412.20758, "b": 80.72204999999985, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Table 3-1 Special registers and their corresponding values", "bbox": {"l": 136.8, "t": 93.49805000000003, "r": 372.60364, "b": 101.82299999999998, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Figure 3-5 shows the difference in the special register values when an adopted authority is ", "bbox": {"l": 136.8, "t": 214.48870999999997, "r": 538.4939, "b": 223.70172000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "used:", "bbox": {"l": 136.8, "t": 226.48852999999997, "r": 161.20995, "b": 235.70154000000002, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "GLYPH<SM590000>", "bbox": {"l": 136.8, "t": 243.67749000000003, "r": 141.78, "b": 252.45227, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "A user connects to the server using the user profile ALICE.", "bbox": {"l": 151.20016, "t": 243.52808000000005, "r": 411.36139, "b": 252.74108999999999, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "GLYPH<SM590000>", "bbox": {"l": 136.8, "t": 260.65729, "r": 141.78, "b": 269.43206999999995, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "USER and CURRENT USER initially have the same value of ALICE.", "bbox": {"l": 151.20016, "t": 260.50787, "r": 453.2580899999999, "b": 269.72089000000005, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "GLYPH<SM590000>", "bbox": {"l": 136.8, "t": 277.63707999999997, "r": 141.78, "b": 286.41187, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "ALICE calls an SQL procedure that is named proc1, which is owned by user profile JOE ", "bbox": {"l": 151.20016, "t": 277.48767, "r": 541.44983, "b": 286.70068, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "and was created to adopt JOE\u2019s authority when it is called.", "bbox": {"l": 151.20016, "t": 289.4875200000001, "r": 409.82953, "b": 298.7005, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "GLYPH<SM590000>", "bbox": {"l": 136.8, "t": 306.67647999999997, "r": 141.78, "b": 315.45126000000005, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "While the procedure is running, the special register USER still contains the value of ALICE ", "bbox": {"l": 151.20016, "t": 306.5271, "r": 547.21674, "b": 315.74008, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "because it excludes any adopted authority. The special register CURRENT USER ", "bbox": {"l": 151.20117, "t": 318.52691999999996, "r": 514.32971, "b": 327.7399, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "contains the value of JOE because it includes any adopted authority.", "bbox": {"l": 151.20117, "t": 330.52673, "r": 453.3249200000001, "b": 339.73972, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "GLYPH<SM590000>", "bbox": {"l": 136.80101, "t": 347.65591, "r": 141.78101, "b": 356.43069, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "When proc1 ends, the session reverts to its original state with both USER and CURRENT ", "bbox": {"l": 151.20117, "t": 347.50653, "r": 547.35406, "b": 356.71950999999996, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "USER having the value of ALICE.", "bbox": {"l": 151.20117, "t": 359.50635, "r": 299.57532, "b": 368.71933000000007, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "Figure 3-5 Special registers and adopted authority", "bbox": {"l": 136.8, "t": 596.7179, "r": 341.25662, "b": 605.04291, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "3.2.2", "bbox": {"l": 64.800003, "t": 625.55472, "r": 94.20356, "b": 637.54272, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "Built-in global variables", "bbox": {"l": 97.879005, "t": 625.55472, "r": 247.02536, "b": 637.54272, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "Built-in global variables are provided with the database manager and are used in SQL ", "bbox": {"l": 136.8, "t": 651.70872, "r": 518.00116, "b": 660.92172, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "statements to retrieve scalar values that are associated with the variables.", "bbox": {"l": 136.8, "t": 663.70853, "r": 462.81759999999997, "b": 672.92153, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "IBM DB2 for i supports nine different built-in global variables that are read only and ", "bbox": {"l": 136.8, "t": 685.7281, "r": 504.44669, "b": 694.941101, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "maintained by the system. These global variables can be used to identify attributes of the ", "bbox": {"l": 136.8, "t": 697.727905, "r": 532.3385, "b": 706.94091, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "database connection and used as part of the RCAC logic.", "bbox": {"l": 136.8, "t": 709.727715, "r": 391.38257, "b": 718.94072, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Special register", "bbox": {"l": 142.8, "t": 110.53801999999985, "r": 209.67091, "b": 118.86298, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Corresponding value", "bbox": {"l": 230.18912000000003, "t": 110.53801999999985, "r": 319.93527, "b": 118.86298, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "USER or", "bbox": {"l": 142.80002, "t": 129.49834999999996, "r": 178.26361, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "SESSION_USER", "bbox": {"l": 142.80002, "t": 140.53864, "r": 212.70122, "b": 148.86359000000004, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "The effective user of the thread excluding adopted authority.", "bbox": {"l": 230.21973000000003, "t": 129.49834999999996, "r": 467.99069000000003, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "CURRENT_USER", "bbox": {"l": 142.80003, "t": 159.55835000000002, "r": 216.63962999999998, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "The effective user of the thread including adopted authority. When no adopted ", "bbox": {"l": 230.19814, "t": 159.55835000000002, "r": 535.65082, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "authority is present, this has the same value as USER.", "bbox": {"l": 230.22061, "t": 170.53832999999997, "r": 447.36533, "b": 178.86328000000003, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "SYSTEM_USER", "bbox": {"l": 142.8009, "t": 189.55804, "r": 209.7357, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "The authorization ID that initiated the connection.", "bbox": {"l": 230.2449, "t": 189.55804, "r": 425.64569, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "SignedonasALICE", "bbox": {"l": 140.7323, "t": 386.98453, "r": 218.71170000000004, "b": 395.49527, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "Signed on as ALICE", "bbox": {"l": 140.7323, "t": 386.98453, "r": 216.40009, "b": 395.49527, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "USER = ALICE", "bbox": {"l": 138.476, "t": 410.87441999999993, "r": 191.70256, "b": 419.38516, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "CURRENT USER = ALICE", "bbox": {"l": 138.476, "t": 422.81934, "r": 232.56117, "b": 431.33008, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "CALL proc1", "bbox": {"l": 138.476, "t": 446.70923000000005, "r": 183.26944, "b": 455.21997, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "P1", "bbox": {"l": 148.4301, "t": 473.58524, "r": 184.17328, "b": 482.09598, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "Proc1:", "bbox": {"l": 148.4301, "t": 473.58524, "r": 174.05859, "b": 482.09598, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Owner = JOE", "bbox": {"l": 157.52185, "t": 485.53015, "r": 209.103, "b": 494.04089, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "SET OPTION USRPRF=*OWNER", "bbox": {"l": 157.52185, "t": 497.47507, "r": 281.68927, "b": 505.98581, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "USER = ALICE", "bbox": {"l": 148.4301, "t": 521.36493, "r": 201.65666, "b": 529.87567, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "CURRENT USER = JOE", "bbox": {"l": 148.4301, "t": 533.30984, "r": 234.57686999999999, "b": 541.82059, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "USER = ALICE", "bbox": {"l": 138.476, "t": 566.15842, "r": 191.70256, "b": 574.66917, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "CURRENT USER = ALICE", "bbox": {"l": 138.476, "t": 578.10333, "r": 232.56117, "b": 586.61409, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 7, "label": "page_footer", "bbox": {"l": 344.94, "t": 755.538002, "r": 523.60162, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9557498693466187, "cells": [{"id": 0, "text": "Chapter 3. Row and Column Access Control ", "bbox": {"l": 344.94, "t": 755.538002, "r": 523.60162, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "page_footer", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.9130511283874512, "cells": [{"id": 1, "text": "19", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "caption", "bbox": {"l": 136.79959, "t": 71.50903000000005, "r": 412.20758, "b": 80.72204999999985, "coord_origin": "TOPLEFT"}, "confidence": 0.7875156402587891, "cells": [{"id": 2, "text": "Table 3-1 summarizes these special registers and their values.", "bbox": {"l": 136.79959, "t": 71.50903000000005, "r": 412.20758, "b": 80.72204999999985, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "caption", "bbox": {"l": 136.8, "t": 93.49805000000003, "r": 372.60364, "b": 101.82299999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.9253708720207214, "cells": [{"id": 3, "text": "Table 3-1 Special registers and their corresponding values", "bbox": {"l": 136.8, "t": 93.49805000000003, "r": 372.60364, "b": 101.82299999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 136.8, "t": 214.48870999999997, "r": 538.4939, "b": 235.70154000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9466660022735596, "cells": [{"id": 4, "text": "Figure 3-5 shows the difference in the special register values when an adopted authority is ", "bbox": {"l": 136.8, "t": 214.48870999999997, "r": 538.4939, "b": 223.70172000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "used:", "bbox": {"l": 136.8, "t": 226.48852999999997, "r": 161.20995, "b": 235.70154000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "list_item", "bbox": {"l": 136.8, "t": 243.52808000000005, "r": 411.36139, "b": 252.74108999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9504424333572388, "cells": [{"id": 6, "text": "GLYPH<SM590000>", "bbox": {"l": 136.8, "t": 243.67749000000003, "r": 141.78, "b": 252.45227, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "A user connects to the server using the user profile ALICE.", "bbox": {"l": 151.20016, "t": 243.52808000000005, "r": 411.36139, "b": 252.74108999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "list_item", "bbox": {"l": 136.8, "t": 260.50787, "r": 453.2580899999999, "b": 269.72089000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9445974230766296, "cells": [{"id": 8, "text": "GLYPH<SM590000>", "bbox": {"l": 136.8, "t": 260.65729, "r": 141.78, "b": 269.43206999999995, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "USER and CURRENT USER initially have the same value of ALICE.", "bbox": {"l": 151.20016, "t": 260.50787, "r": 453.2580899999999, "b": 269.72089000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "list_item", "bbox": {"l": 136.8, "t": 277.48767, "r": 541.44983, "b": 298.7005, "coord_origin": "TOPLEFT"}, "confidence": 0.9742953777313232, "cells": [{"id": 10, "text": "GLYPH<SM590000>", "bbox": {"l": 136.8, "t": 277.63707999999997, "r": 141.78, "b": 286.41187, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "ALICE calls an SQL procedure that is named proc1, which is owned by user profile JOE ", "bbox": {"l": 151.20016, "t": 277.48767, "r": 541.44983, "b": 286.70068, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "and was created to adopt JOE\u2019s authority when it is called.", "bbox": {"l": 151.20016, "t": 289.4875200000001, "r": 409.82953, "b": 298.7005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "list_item", "bbox": {"l": 136.8, "t": 306.5271, "r": 547.21674, "b": 339.73972, "coord_origin": "TOPLEFT"}, "confidence": 0.981132447719574, "cells": [{"id": 13, "text": "GLYPH<SM590000>", "bbox": {"l": 136.8, "t": 306.67647999999997, "r": 141.78, "b": 315.45126000000005, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "While the procedure is running, the special register USER still contains the value of ALICE ", "bbox": {"l": 151.20016, "t": 306.5271, "r": 547.21674, "b": 315.74008, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "because it excludes any adopted authority. The special register CURRENT USER ", "bbox": {"l": 151.20117, "t": 318.52691999999996, "r": 514.32971, "b": 327.7399, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "contains the value of JOE because it includes any adopted authority.", "bbox": {"l": 151.20117, "t": 330.52673, "r": 453.3249200000001, "b": 339.73972, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "list_item", "bbox": {"l": 136.80101, "t": 347.50653, "r": 547.35406, "b": 368.71933000000007, "coord_origin": "TOPLEFT"}, "confidence": 0.9748278260231018, "cells": [{"id": 17, "text": "GLYPH<SM590000>", "bbox": {"l": 136.80101, "t": 347.65591, "r": 141.78101, "b": 356.43069, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "When proc1 ends, the session reverts to its original state with both USER and CURRENT ", "bbox": {"l": 151.20117, "t": 347.50653, "r": 547.35406, "b": 356.71950999999996, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "USER having the value of ALICE.", "bbox": {"l": 151.20117, "t": 359.50635, "r": 299.57532, "b": 368.71933000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "caption", "bbox": {"l": 136.8, "t": 596.7179, "r": 341.25662, "b": 605.04291, "coord_origin": "TOPLEFT"}, "confidence": 0.9274530410766602, "cells": [{"id": 20, "text": "Figure 3-5 Special registers and adopted authority", "bbox": {"l": 136.8, "t": 596.7179, "r": 341.25662, "b": 605.04291, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "section_header", "bbox": {"l": 64.800003, "t": 625.55472, "r": 247.02536, "b": 637.54272, "coord_origin": "TOPLEFT"}, "confidence": 0.9659212827682495, "cells": [{"id": 21, "text": "3.2.2", "bbox": {"l": 64.800003, "t": 625.55472, "r": 94.20356, "b": 637.54272, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "Built-in global variables", "bbox": {"l": 97.879005, "t": 625.55472, "r": 247.02536, "b": 637.54272, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "text", "bbox": {"l": 136.8, "t": 651.70872, "r": 518.00116, "b": 672.92153, "coord_origin": "TOPLEFT"}, "confidence": 0.9696778059005737, "cells": [{"id": 23, "text": "Built-in global variables are provided with the database manager and are used in SQL ", "bbox": {"l": 136.8, "t": 651.70872, "r": 518.00116, "b": 660.92172, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "statements to retrieve scalar values that are associated with the variables.", "bbox": {"l": 136.8, "t": 663.70853, "r": 462.81759999999997, "b": 672.92153, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 136.8, "t": 685.7281, "r": 532.3385, "b": 718.94072, "coord_origin": "TOPLEFT"}, "confidence": 0.978398323059082, "cells": [{"id": 25, "text": "IBM DB2 for i supports nine different built-in global variables that are read only and ", "bbox": {"l": 136.8, "t": 685.7281, "r": 504.44669, "b": 694.941101, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "maintained by the system. These global variables can be used to identify attributes of the ", "bbox": {"l": 136.8, "t": 697.727905, "r": 532.3385, "b": 706.94091, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "database connection and used as part of the RCAC logic.", "bbox": {"l": 136.8, "t": 709.727715, "r": 391.38257, "b": 718.94072, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "table", "bbox": {"l": 134.5462646484375, "t": 103.41889190673828, "r": 542.0460815429688, "b": 204.2716064453125, "coord_origin": "TOPLEFT"}, "confidence": 0.9731299877166748, "cells": [{"id": 28, "text": "Special register", "bbox": {"l": 142.8, "t": 110.53801999999985, "r": 209.67091, "b": 118.86298, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Corresponding value", "bbox": {"l": 230.18912000000003, "t": 110.53801999999985, "r": 319.93527, "b": 118.86298, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "USER or", "bbox": {"l": 142.80002, "t": 129.49834999999996, "r": 178.26361, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "SESSION_USER", "bbox": {"l": 142.80002, "t": 140.53864, "r": 212.70122, "b": 148.86359000000004, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "The effective user of the thread excluding adopted authority.", "bbox": {"l": 230.21973000000003, "t": 129.49834999999996, "r": 467.99069000000003, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "CURRENT_USER", "bbox": {"l": 142.80003, "t": 159.55835000000002, "r": 216.63962999999998, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "The effective user of the thread including adopted authority. When no adopted ", "bbox": {"l": 230.19814, "t": 159.55835000000002, "r": 535.65082, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "authority is present, this has the same value as USER.", "bbox": {"l": 230.22061, "t": 170.53832999999997, "r": 447.36533, "b": 178.86328000000003, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "SYSTEM_USER", "bbox": {"l": 142.8009, "t": 189.55804, "r": 209.7357, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "The authorization ID that initiated the connection.", "bbox": {"l": 230.2449, "t": 189.55804, "r": 425.64569, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}}], "children": [{"id": 26, "label": "text", "bbox": {"l": 142.8, "t": 110.53801999999985, "r": 209.67091, "b": 118.86298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "Special register", "bbox": {"l": 142.8, "t": 110.53801999999985, "r": 209.67091, "b": 118.86298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 230.18912000000003, "t": 110.53801999999985, "r": 319.93527, "b": 118.86298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "Corresponding value", "bbox": {"l": 230.18912000000003, "t": 110.53801999999985, "r": 319.93527, "b": 118.86298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 142.80002, "t": 129.49834999999996, "r": 178.26361, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "USER or", "bbox": {"l": 142.80002, "t": 129.49834999999996, "r": 178.26361, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 142.80002, "t": 140.53864, "r": 212.70122, "b": 148.86359000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "SESSION_USER", "bbox": {"l": 142.80002, "t": 140.53864, "r": 212.70122, "b": 148.86359000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 230.21973000000003, "t": 129.49834999999996, "r": 467.99069000000003, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "The effective user of the thread excluding adopted authority.", "bbox": {"l": 230.21973000000003, "t": 129.49834999999996, "r": 467.99069000000003, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 142.80003, "t": 159.55835000000002, "r": 216.63962999999998, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "CURRENT_USER", "bbox": {"l": 142.80003, "t": 159.55835000000002, "r": 216.63962999999998, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 230.19814, "t": 159.55835000000002, "r": 535.65082, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "The effective user of the thread including adopted authority. When no adopted ", "bbox": {"l": 230.19814, "t": 159.55835000000002, "r": 535.65082, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 230.22061, "t": 170.53832999999997, "r": 447.36533, "b": 178.86328000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "authority is present, this has the same value as USER.", "bbox": {"l": 230.22061, "t": 170.53832999999997, "r": 447.36533, "b": 178.86328000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 142.8009, "t": 189.55804, "r": 209.7357, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "SYSTEM_USER", "bbox": {"l": 142.8009, "t": 189.55804, "r": 209.7357, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 230.2449, "t": 189.55804, "r": 425.64569, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "The authorization ID that initiated the connection.", "bbox": {"l": 230.2449, "t": 189.55804, "r": 425.64569, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 16, "label": "picture", "bbox": {"l": 135.64837646484375, "t": 384.1737060546875, "r": 301.2367248535156, "b": 594.7566528320312, "coord_origin": "TOPLEFT"}, "confidence": 0.7221468687057495, "cells": [{"id": 38, "text": "SignedonasALICE", "bbox": {"l": 140.7323, "t": 386.98453, "r": 218.71170000000004, "b": 395.49527, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "Signed on as ALICE", "bbox": {"l": 140.7323, "t": 386.98453, "r": 216.40009, "b": 395.49527, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "USER = ALICE", "bbox": {"l": 138.476, "t": 410.87441999999993, "r": 191.70256, "b": 419.38516, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "CURRENT USER = ALICE", "bbox": {"l": 138.476, "t": 422.81934, "r": 232.56117, "b": 431.33008, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "CALL proc1", "bbox": {"l": 138.476, "t": 446.70923000000005, "r": 183.26944, "b": 455.21997, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "P1", "bbox": {"l": 148.4301, "t": 473.58524, "r": 184.17328, "b": 482.09598, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "Proc1:", "bbox": {"l": 148.4301, "t": 473.58524, "r": 174.05859, "b": 482.09598, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Owner = JOE", "bbox": {"l": 157.52185, "t": 485.53015, "r": 209.103, "b": 494.04089, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "SET OPTION USRPRF=*OWNER", "bbox": {"l": 157.52185, "t": 497.47507, "r": 281.68927, "b": 505.98581, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "USER = ALICE", "bbox": {"l": 148.4301, "t": 521.36493, "r": 201.65666, "b": 529.87567, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "CURRENT USER = JOE", "bbox": {"l": 148.4301, "t": 533.30984, "r": 234.57686999999999, "b": 541.82059, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "USER = ALICE", "bbox": {"l": 138.476, "t": 566.15842, "r": 191.70256, "b": 574.66917, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "CURRENT USER = ALICE", "bbox": {"l": 138.476, "t": 578.10333, "r": 232.56117, "b": 586.61409, "coord_origin": "TOPLEFT"}}], "children": [{"id": 15, "label": "text", "bbox": {"l": 140.7323, "t": 386.98453, "r": 218.71170000000004, "b": 395.49527, "coord_origin": "TOPLEFT"}, "confidence": 0.7616674304008484, "cells": [{"id": 38, "text": "SignedonasALICE", "bbox": {"l": 140.7323, "t": 386.98453, "r": 218.71170000000004, "b": 395.49527, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "Signed on as ALICE", "bbox": {"l": 140.7323, "t": 386.98453, "r": 216.40009, "b": 395.49527, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 138.476, "t": 410.87441999999993, "r": 191.70256, "b": 419.38516, "coord_origin": "TOPLEFT"}, "confidence": 0.5373895764350891, "cells": [{"id": 40, "text": "USER = ALICE", "bbox": {"l": 138.476, "t": 410.87441999999993, "r": 191.70256, "b": 419.38516, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 138.476, "t": 422.81934, "r": 232.56117, "b": 431.33008, "coord_origin": "TOPLEFT"}, "confidence": 0.5213791728019714, "cells": [{"id": 41, "text": "CURRENT USER = ALICE", "bbox": {"l": 138.476, "t": 422.81934, "r": 232.56117, "b": 431.33008, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 138.476, "t": 446.70923000000005, "r": 183.26944, "b": 455.21997, "coord_origin": "TOPLEFT"}, "confidence": 0.6404178142547607, "cells": [{"id": 42, "text": "CALL proc1", "bbox": {"l": 138.476, "t": 446.70923000000005, "r": 183.26944, "b": 455.21997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 148.4301, "t": 473.58524, "r": 184.17328, "b": 482.09598, "coord_origin": "TOPLEFT"}, "confidence": 0.5759297609329224, "cells": [{"id": 43, "text": "P1", "bbox": {"l": 148.4301, "t": 473.58524, "r": 184.17328, "b": 482.09598, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "Proc1:", "bbox": {"l": 148.4301, "t": 473.58524, "r": 174.05859, "b": 482.09598, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 157.52185, "t": 485.53015, "r": 209.103, "b": 494.04089, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "Owner = JOE", "bbox": {"l": 157.52185, "t": 485.53015, "r": 209.103, "b": 494.04089, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 157.52185, "t": 497.47507, "r": 281.68927, "b": 505.98581, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "SET OPTION USRPRF=*OWNER", "bbox": {"l": 157.52185, "t": 497.47507, "r": 281.68927, "b": 505.98581, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 148.4301, "t": 521.36493, "r": 201.65666, "b": 529.87567, "coord_origin": "TOPLEFT"}, "confidence": 0.5350866913795471, "cells": [{"id": 47, "text": "USER = ALICE", "bbox": {"l": 148.4301, "t": 521.36493, "r": 201.65666, "b": 529.87567, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 148.4301, "t": 533.30984, "r": 234.57686999999999, "b": 541.82059, "coord_origin": "TOPLEFT"}, "confidence": 0.5008324384689331, "cells": [{"id": 48, "text": "CURRENT USER = JOE", "bbox": {"l": 148.4301, "t": 533.30984, "r": 234.57686999999999, "b": 541.82059, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 138.476, "t": 566.15842, "r": 232.56117, "b": 586.61409, "coord_origin": "TOPLEFT"}, "confidence": 0.5024971961975098, "cells": [{"id": 49, "text": "USER = ALICE", "bbox": {"l": 138.476, "t": 566.15842, "r": 191.70256, "b": 574.66917, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "CURRENT USER = ALICE", "bbox": {"l": 138.476, "t": 578.10333, "r": 232.56117, "b": 586.61409, "coord_origin": "TOPLEFT"}}], "children": []}]}]}, "tablestructure": {"table_map": {"4": {"label": "table", "id": 4, "page_no": 10, "cluster": {"id": 4, "label": "table", "bbox": {"l": 134.5462646484375, "t": 103.41889190673828, "r": 542.0460815429688, "b": 204.2716064453125, "coord_origin": "TOPLEFT"}, "confidence": 0.9731299877166748, "cells": [{"id": 28, "text": "Special register", "bbox": {"l": 142.8, "t": 110.53801999999985, "r": 209.67091, "b": 118.86298, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Corresponding value", "bbox": {"l": 230.18912000000003, "t": 110.53801999999985, "r": 319.93527, "b": 118.86298, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "USER or", "bbox": {"l": 142.80002, "t": 129.49834999999996, "r": 178.26361, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "SESSION_USER", "bbox": {"l": 142.80002, "t": 140.53864, "r": 212.70122, "b": 148.86359000000004, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "The effective user of the thread excluding adopted authority.", "bbox": {"l": 230.21973000000003, "t": 129.49834999999996, "r": 467.99069000000003, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "CURRENT_USER", "bbox": {"l": 142.80003, "t": 159.55835000000002, "r": 216.63962999999998, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "The effective user of the thread including adopted authority. When no adopted ", "bbox": {"l": 230.19814, "t": 159.55835000000002, "r": 535.65082, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "authority is present, this has the same value as USER.", "bbox": {"l": 230.22061, "t": 170.53832999999997, "r": 447.36533, "b": 178.86328000000003, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "SYSTEM_USER", "bbox": {"l": 142.8009, "t": 189.55804, "r": 209.7357, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "The authorization ID that initiated the connection.", "bbox": {"l": 230.2449, "t": 189.55804, "r": 425.64569, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}}], "children": [{"id": 26, "label": "text", "bbox": {"l": 142.8, "t": 110.53801999999985, "r": 209.67091, "b": 118.86298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "Special register", "bbox": {"l": 142.8, "t": 110.53801999999985, "r": 209.67091, "b": 118.86298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 230.18912000000003, "t": 110.53801999999985, "r": 319.93527, "b": 118.86298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "Corresponding value", "bbox": {"l": 230.18912000000003, "t": 110.53801999999985, "r": 319.93527, "b": 118.86298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 142.80002, "t": 129.49834999999996, "r": 178.26361, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "USER or", "bbox": {"l": 142.80002, "t": 129.49834999999996, "r": 178.26361, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 142.80002, "t": 140.53864, "r": 212.70122, "b": 148.86359000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "SESSION_USER", "bbox": {"l": 142.80002, "t": 140.53864, "r": 212.70122, "b": 148.86359000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 230.21973000000003, "t": 129.49834999999996, "r": 467.99069000000003, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "The effective user of the thread excluding adopted authority.", "bbox": {"l": 230.21973000000003, "t": 129.49834999999996, "r": 467.99069000000003, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 142.80003, "t": 159.55835000000002, "r": 216.63962999999998, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "CURRENT_USER", "bbox": {"l": 142.80003, "t": 159.55835000000002, "r": 216.63962999999998, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 230.19814, "t": 159.55835000000002, "r": 535.65082, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "The effective user of the thread including adopted authority. When no adopted ", "bbox": {"l": 230.19814, "t": 159.55835000000002, "r": 535.65082, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 230.22061, "t": 170.53832999999997, "r": 447.36533, "b": 178.86328000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "authority is present, this has the same value as USER.", "bbox": {"l": 230.22061, "t": 170.53832999999997, "r": 447.36533, "b": 178.86328000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 142.8009, "t": 189.55804, "r": 209.7357, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "SYSTEM_USER", "bbox": {"l": 142.8009, "t": 189.55804, "r": 209.7357, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 230.2449, "t": 189.55804, "r": 425.64569, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "The authorization ID that initiated the connection.", "bbox": {"l": 230.2449, "t": 189.55804, "r": 425.64569, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 4, "num_cols": 2, "table_cells": [{"bbox": {"l": 142.8, "t": 110.53801999999985, "r": 209.67091, "b": 118.86298, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Special register", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 230.18912000000003, "t": 110.53801999999985, "r": 319.93527, "b": 118.86298, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Corresponding value", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 142.80002, "t": 129.49834999999996, "r": 212.70122, "b": 148.86359000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "USER or SESSION_USER", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 230.21973000000003, "t": 129.49834999999996, "r": 467.99069000000003, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "The effective user of the thread excluding adopted authority.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 142.80003, "t": 159.55835000000002, "r": 216.63962999999998, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "CURRENT_USER", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 230.19814, "t": 159.55835000000002, "r": 535.65082, "b": 178.86328000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "The effective user of the thread including adopted authority. When no adopted  authority is present, this has the same value as USER.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 142.8009, "t": 189.55804, "r": 209.7357, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "SYSTEM_USER", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 230.2449, "t": 189.55804, "r": 425.64569, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "The authorization ID that initiated the connection.", "column_header": false, "row_header": false, "row_section": false}]}}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_footer", "id": 7, "page_no": 10, "cluster": {"id": 7, "label": "page_footer", "bbox": {"l": 344.94, "t": 755.538002, "r": 523.60162, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9557498693466187, "cells": [{"id": 0, "text": "Chapter 3. Row and Column Access Control ", "bbox": {"l": 344.94, "t": 755.538002, "r": 523.60162, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Chapter 3. Row and Column Access Control"}, {"label": "page_footer", "id": 13, "page_no": 10, "cluster": {"id": 13, "label": "page_footer", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.9130511283874512, "cells": [{"id": 1, "text": "19", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "19"}, {"label": "caption", "id": 14, "page_no": 10, "cluster": {"id": 14, "label": "caption", "bbox": {"l": 136.79959, "t": 71.50903000000005, "r": 412.20758, "b": 80.72204999999985, "coord_origin": "TOPLEFT"}, "confidence": 0.7875156402587891, "cells": [{"id": 2, "text": "Table 3-1 summarizes these special registers and their values.", "bbox": {"l": 136.79959, "t": 71.50903000000005, "r": 412.20758, "b": 80.72204999999985, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 3-1 summarizes these special registers and their values."}, {"label": "caption", "id": 12, "page_no": 10, "cluster": {"id": 12, "label": "caption", "bbox": {"l": 136.8, "t": 93.49805000000003, "r": 372.60364, "b": 101.82299999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.9253708720207214, "cells": [{"id": 3, "text": "Table 3-1 Special registers and their corresponding values", "bbox": {"l": 136.8, "t": 93.49805000000003, "r": 372.60364, "b": 101.82299999999998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 3-1 Special registers and their corresponding values"}, {"label": "text", "id": 9, "page_no": 10, "cluster": {"id": 9, "label": "text", "bbox": {"l": 136.8, "t": 214.48870999999997, "r": 538.4939, "b": 235.70154000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9466660022735596, "cells": [{"id": 4, "text": "Figure 3-5 shows the difference in the special register values when an adopted authority is ", "bbox": {"l": 136.8, "t": 214.48870999999997, "r": 538.4939, "b": 223.70172000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "used:", "bbox": {"l": 136.8, "t": 226.48852999999997, "r": 161.20995, "b": 235.70154000000002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 3-5 shows the difference in the special register values when an adopted authority is used:"}, {"label": "list_item", "id": 8, "page_no": 10, "cluster": {"id": 8, "label": "list_item", "bbox": {"l": 136.8, "t": 243.52808000000005, "r": 411.36139, "b": 252.74108999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9504424333572388, "cells": [{"id": 6, "text": "GLYPH<SM590000>", "bbox": {"l": 136.8, "t": 243.67749000000003, "r": 141.78, "b": 252.45227, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "A user connects to the server using the user profile ALICE.", "bbox": {"l": 151.20016, "t": 243.52808000000005, "r": 411.36139, "b": 252.74108999999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<SM590000> A user connects to the server using the user profile ALICE."}, {"label": "list_item", "id": 10, "page_no": 10, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 136.8, "t": 260.50787, "r": 453.2580899999999, "b": 269.72089000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9445974230766296, "cells": [{"id": 8, "text": "GLYPH<SM590000>", "bbox": {"l": 136.8, "t": 260.65729, "r": 141.78, "b": 269.43206999999995, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "USER and CURRENT USER initially have the same value of ALICE.", "bbox": {"l": 151.20016, "t": 260.50787, "r": 453.2580899999999, "b": 269.72089000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<SM590000> USER and CURRENT USER initially have the same value of ALICE."}, {"label": "list_item", "id": 3, "page_no": 10, "cluster": {"id": 3, "label": "list_item", "bbox": {"l": 136.8, "t": 277.48767, "r": 541.44983, "b": 298.7005, "coord_origin": "TOPLEFT"}, "confidence": 0.9742953777313232, "cells": [{"id": 10, "text": "GLYPH<SM590000>", "bbox": {"l": 136.8, "t": 277.63707999999997, "r": 141.78, "b": 286.41187, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "ALICE calls an SQL procedure that is named proc1, which is owned by user profile JOE ", "bbox": {"l": 151.20016, "t": 277.48767, "r": 541.44983, "b": 286.70068, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "and was created to adopt JOE\u2019s authority when it is called.", "bbox": {"l": 151.20016, "t": 289.4875200000001, "r": 409.82953, "b": 298.7005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<SM590000> ALICE calls an SQL procedure that is named proc1, which is owned by user profile JOE and was created to adopt JOE's authority when it is called."}, {"label": "list_item", "id": 0, "page_no": 10, "cluster": {"id": 0, "label": "list_item", "bbox": {"l": 136.8, "t": 306.5271, "r": 547.21674, "b": 339.73972, "coord_origin": "TOPLEFT"}, "confidence": 0.981132447719574, "cells": [{"id": 13, "text": "GLYPH<SM590000>", "bbox": {"l": 136.8, "t": 306.67647999999997, "r": 141.78, "b": 315.45126000000005, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "While the procedure is running, the special register USER still contains the value of ALICE ", "bbox": {"l": 151.20016, "t": 306.5271, "r": 547.21674, "b": 315.74008, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "because it excludes any adopted authority. The special register CURRENT USER ", "bbox": {"l": 151.20117, "t": 318.52691999999996, "r": 514.32971, "b": 327.7399, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "contains the value of JOE because it includes any adopted authority.", "bbox": {"l": 151.20117, "t": 330.52673, "r": 453.3249200000001, "b": 339.73972, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<SM590000> While the procedure is running, the special register USER still contains the value of ALICE because it excludes any adopted authority. The special register CURRENT USER contains the value of JOE because it includes any adopted authority."}, {"label": "list_item", "id": 2, "page_no": 10, "cluster": {"id": 2, "label": "list_item", "bbox": {"l": 136.80101, "t": 347.50653, "r": 547.35406, "b": 368.71933000000007, "coord_origin": "TOPLEFT"}, "confidence": 0.9748278260231018, "cells": [{"id": 17, "text": "GLYPH<SM590000>", "bbox": {"l": 136.80101, "t": 347.65591, "r": 141.78101, "b": 356.43069, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "When proc1 ends, the session reverts to its original state with both USER and CURRENT ", "bbox": {"l": 151.20117, "t": 347.50653, "r": 547.35406, "b": 356.71950999999996, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "USER having the value of ALICE.", "bbox": {"l": 151.20117, "t": 359.50635, "r": 299.57532, "b": 368.71933000000007, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<SM590000> When proc1 ends, the session reverts to its original state with both USER and CURRENT USER having the value of ALICE."}, {"label": "caption", "id": 11, "page_no": 10, "cluster": {"id": 11, "label": "caption", "bbox": {"l": 136.8, "t": 596.7179, "r": 341.25662, "b": 605.04291, "coord_origin": "TOPLEFT"}, "confidence": 0.9274530410766602, "cells": [{"id": 20, "text": "Figure 3-5 Special registers and adopted authority", "bbox": {"l": 136.8, "t": 596.7179, "r": 341.25662, "b": 605.04291, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 3-5 Special registers and adopted authority"}, {"label": "section_header", "id": 6, "page_no": 10, "cluster": {"id": 6, "label": "section_header", "bbox": {"l": 64.800003, "t": 625.55472, "r": 247.02536, "b": 637.54272, "coord_origin": "TOPLEFT"}, "confidence": 0.9659212827682495, "cells": [{"id": 21, "text": "3.2.2", "bbox": {"l": 64.800003, "t": 625.55472, "r": 94.20356, "b": 637.54272, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "Built-in global variables", "bbox": {"l": 97.879005, "t": 625.55472, "r": 247.02536, "b": 637.54272, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3.2.2 Built-in global variables"}, {"label": "text", "id": 5, "page_no": 10, "cluster": {"id": 5, "label": "text", "bbox": {"l": 136.8, "t": 651.70872, "r": 518.00116, "b": 672.92153, "coord_origin": "TOPLEFT"}, "confidence": 0.9696778059005737, "cells": [{"id": 23, "text": "Built-in global variables are provided with the database manager and are used in SQL ", "bbox": {"l": 136.8, "t": 651.70872, "r": 518.00116, "b": 660.92172, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "statements to retrieve scalar values that are associated with the variables.", "bbox": {"l": 136.8, "t": 663.70853, "r": 462.81759999999997, "b": 672.92153, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Built-in global variables are provided with the database manager and are used in SQL statements to retrieve scalar values that are associated with the variables."}, {"label": "text", "id": 1, "page_no": 10, "cluster": {"id": 1, "label": "text", "bbox": {"l": 136.8, "t": 685.7281, "r": 532.3385, "b": 718.94072, "coord_origin": "TOPLEFT"}, "confidence": 0.978398323059082, "cells": [{"id": 25, "text": "IBM DB2 for i supports nine different built-in global variables that are read only and ", "bbox": {"l": 136.8, "t": 685.7281, "r": 504.44669, "b": 694.941101, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "maintained by the system. These global variables can be used to identify attributes of the ", "bbox": {"l": 136.8, "t": 697.727905, "r": 532.3385, "b": 706.94091, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "database connection and used as part of the RCAC logic.", "bbox": {"l": 136.8, "t": 709.727715, "r": 391.38257, "b": 718.94072, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "IBM DB2 for i supports nine different built-in global variables that are read only and maintained by the system. These global variables can be used to identify attributes of the database connection and used as part of the RCAC logic."}, {"label": "table", "id": 4, "page_no": 10, "cluster": {"id": 4, "label": "table", "bbox": {"l": 134.5462646484375, "t": 103.41889190673828, "r": 542.0460815429688, "b": 204.2716064453125, "coord_origin": "TOPLEFT"}, "confidence": 0.9731299877166748, "cells": [{"id": 28, "text": "Special register", "bbox": {"l": 142.8, "t": 110.53801999999985, "r": 209.67091, "b": 118.86298, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Corresponding value", "bbox": {"l": 230.18912000000003, "t": 110.53801999999985, "r": 319.93527, "b": 118.86298, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "USER or", "bbox": {"l": 142.80002, "t": 129.49834999999996, "r": 178.26361, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "SESSION_USER", "bbox": {"l": 142.80002, "t": 140.53864, "r": 212.70122, "b": 148.86359000000004, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "The effective user of the thread excluding adopted authority.", "bbox": {"l": 230.21973000000003, "t": 129.49834999999996, "r": 467.99069000000003, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "CURRENT_USER", "bbox": {"l": 142.80003, "t": 159.55835000000002, "r": 216.63962999999998, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "The effective user of the thread including adopted authority. When no adopted ", "bbox": {"l": 230.19814, "t": 159.55835000000002, "r": 535.65082, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "authority is present, this has the same value as USER.", "bbox": {"l": 230.22061, "t": 170.53832999999997, "r": 447.36533, "b": 178.86328000000003, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "SYSTEM_USER", "bbox": {"l": 142.8009, "t": 189.55804, "r": 209.7357, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "The authorization ID that initiated the connection.", "bbox": {"l": 230.2449, "t": 189.55804, "r": 425.64569, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}}], "children": [{"id": 26, "label": "text", "bbox": {"l": 142.8, "t": 110.53801999999985, "r": 209.67091, "b": 118.86298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "Special register", "bbox": {"l": 142.8, "t": 110.53801999999985, "r": 209.67091, "b": 118.86298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 230.18912000000003, "t": 110.53801999999985, "r": 319.93527, "b": 118.86298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "Corresponding value", "bbox": {"l": 230.18912000000003, "t": 110.53801999999985, "r": 319.93527, "b": 118.86298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 142.80002, "t": 129.49834999999996, "r": 178.26361, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "USER or", "bbox": {"l": 142.80002, "t": 129.49834999999996, "r": 178.26361, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 142.80002, "t": 140.53864, "r": 212.70122, "b": 148.86359000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "SESSION_USER", "bbox": {"l": 142.80002, "t": 140.53864, "r": 212.70122, "b": 148.86359000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 230.21973000000003, "t": 129.49834999999996, "r": 467.99069000000003, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "The effective user of the thread excluding adopted authority.", "bbox": {"l": 230.21973000000003, "t": 129.49834999999996, "r": 467.99069000000003, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 142.80003, "t": 159.55835000000002, "r": 216.63962999999998, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "CURRENT_USER", "bbox": {"l": 142.80003, "t": 159.55835000000002, "r": 216.63962999999998, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 230.19814, "t": 159.55835000000002, "r": 535.65082, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "The effective user of the thread including adopted authority. When no adopted ", "bbox": {"l": 230.19814, "t": 159.55835000000002, "r": 535.65082, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 230.22061, "t": 170.53832999999997, "r": 447.36533, "b": 178.86328000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "authority is present, this has the same value as USER.", "bbox": {"l": 230.22061, "t": 170.53832999999997, "r": 447.36533, "b": 178.86328000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 142.8009, "t": 189.55804, "r": 209.7357, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "SYSTEM_USER", "bbox": {"l": 142.8009, "t": 189.55804, "r": 209.7357, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 230.2449, "t": 189.55804, "r": 425.64569, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "The authorization ID that initiated the connection.", "bbox": {"l": 230.2449, "t": 189.55804, "r": 425.64569, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 4, "num_cols": 2, "table_cells": [{"bbox": {"l": 142.8, "t": 110.53801999999985, "r": 209.67091, "b": 118.86298, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Special register", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 230.18912000000003, "t": 110.53801999999985, "r": 319.93527, "b": 118.86298, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Corresponding value", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 142.80002, "t": 129.49834999999996, "r": 212.70122, "b": 148.86359000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "USER or SESSION_USER", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 230.21973000000003, "t": 129.49834999999996, "r": 467.99069000000003, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "The effective user of the thread excluding adopted authority.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 142.80003, "t": 159.55835000000002, "r": 216.63962999999998, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "CURRENT_USER", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 230.19814, "t": 159.55835000000002, "r": 535.65082, "b": 178.86328000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "The effective user of the thread including adopted authority. When no adopted  authority is present, this has the same value as USER.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 142.8009, "t": 189.55804, "r": 209.7357, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "SYSTEM_USER", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 230.2449, "t": 189.55804, "r": 425.64569, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "The authorization ID that initiated the connection.", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "picture", "id": 16, "page_no": 10, "cluster": {"id": 16, "label": "picture", "bbox": {"l": 135.64837646484375, "t": 384.1737060546875, "r": 301.2367248535156, "b": 594.7566528320312, "coord_origin": "TOPLEFT"}, "confidence": 0.7221468687057495, "cells": [{"id": 38, "text": "SignedonasALICE", "bbox": {"l": 140.7323, "t": 386.98453, "r": 218.71170000000004, "b": 395.49527, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "Signed on as ALICE", "bbox": {"l": 140.7323, "t": 386.98453, "r": 216.40009, "b": 395.49527, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "USER = ALICE", "bbox": {"l": 138.476, "t": 410.87441999999993, "r": 191.70256, "b": 419.38516, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "CURRENT USER = ALICE", "bbox": {"l": 138.476, "t": 422.81934, "r": 232.56117, "b": 431.33008, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "CALL proc1", "bbox": {"l": 138.476, "t": 446.70923000000005, "r": 183.26944, "b": 455.21997, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "P1", "bbox": {"l": 148.4301, "t": 473.58524, "r": 184.17328, "b": 482.09598, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "Proc1:", "bbox": {"l": 148.4301, "t": 473.58524, "r": 174.05859, "b": 482.09598, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Owner = JOE", "bbox": {"l": 157.52185, "t": 485.53015, "r": 209.103, "b": 494.04089, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "SET OPTION USRPRF=*OWNER", "bbox": {"l": 157.52185, "t": 497.47507, "r": 281.68927, "b": 505.98581, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "USER = ALICE", "bbox": {"l": 148.4301, "t": 521.36493, "r": 201.65666, "b": 529.87567, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "CURRENT USER = JOE", "bbox": {"l": 148.4301, "t": 533.30984, "r": 234.57686999999999, "b": 541.82059, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "USER = ALICE", "bbox": {"l": 138.476, "t": 566.15842, "r": 191.70256, "b": 574.66917, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "CURRENT USER = ALICE", "bbox": {"l": 138.476, "t": 578.10333, "r": 232.56117, "b": 586.61409, "coord_origin": "TOPLEFT"}}], "children": [{"id": 15, "label": "text", "bbox": {"l": 140.7323, "t": 386.98453, "r": 218.71170000000004, "b": 395.49527, "coord_origin": "TOPLEFT"}, "confidence": 0.7616674304008484, "cells": [{"id": 38, "text": "SignedonasALICE", "bbox": {"l": 140.7323, "t": 386.98453, "r": 218.71170000000004, "b": 395.49527, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "Signed on as ALICE", "bbox": {"l": 140.7323, "t": 386.98453, "r": 216.40009, "b": 395.49527, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 138.476, "t": 410.87441999999993, "r": 191.70256, "b": 419.38516, "coord_origin": "TOPLEFT"}, "confidence": 0.5373895764350891, "cells": [{"id": 40, "text": "USER = ALICE", "bbox": {"l": 138.476, "t": 410.87441999999993, "r": 191.70256, "b": 419.38516, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 138.476, "t": 422.81934, "r": 232.56117, "b": 431.33008, "coord_origin": "TOPLEFT"}, "confidence": 0.5213791728019714, "cells": [{"id": 41, "text": "CURRENT USER = ALICE", "bbox": {"l": 138.476, "t": 422.81934, "r": 232.56117, "b": 431.33008, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 138.476, "t": 446.70923000000005, "r": 183.26944, "b": 455.21997, "coord_origin": "TOPLEFT"}, "confidence": 0.6404178142547607, "cells": [{"id": 42, "text": "CALL proc1", "bbox": {"l": 138.476, "t": 446.70923000000005, "r": 183.26944, "b": 455.21997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 148.4301, "t": 473.58524, "r": 184.17328, "b": 482.09598, "coord_origin": "TOPLEFT"}, "confidence": 0.5759297609329224, "cells": [{"id": 43, "text": "P1", "bbox": {"l": 148.4301, "t": 473.58524, "r": 184.17328, "b": 482.09598, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "Proc1:", "bbox": {"l": 148.4301, "t": 473.58524, "r": 174.05859, "b": 482.09598, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 157.52185, "t": 485.53015, "r": 209.103, "b": 494.04089, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "Owner = JOE", "bbox": {"l": 157.52185, "t": 485.53015, "r": 209.103, "b": 494.04089, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 157.52185, "t": 497.47507, "r": 281.68927, "b": 505.98581, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "SET OPTION USRPRF=*OWNER", "bbox": {"l": 157.52185, "t": 497.47507, "r": 281.68927, "b": 505.98581, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 148.4301, "t": 521.36493, "r": 201.65666, "b": 529.87567, "coord_origin": "TOPLEFT"}, "confidence": 0.5350866913795471, "cells": [{"id": 47, "text": "USER = ALICE", "bbox": {"l": 148.4301, "t": 521.36493, "r": 201.65666, "b": 529.87567, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 148.4301, "t": 533.30984, "r": 234.57686999999999, "b": 541.82059, "coord_origin": "TOPLEFT"}, "confidence": 0.5008324384689331, "cells": [{"id": 48, "text": "CURRENT USER = JOE", "bbox": {"l": 148.4301, "t": 533.30984, "r": 234.57686999999999, "b": 541.82059, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 138.476, "t": 566.15842, "r": 232.56117, "b": 586.61409, "coord_origin": "TOPLEFT"}, "confidence": 0.5024971961975098, "cells": [{"id": 49, "text": "USER = ALICE", "bbox": {"l": 138.476, "t": 566.15842, "r": 191.70256, "b": 574.66917, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "CURRENT USER = ALICE", "bbox": {"l": 138.476, "t": 578.10333, "r": 232.56117, "b": 586.61409, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "body": [{"label": "caption", "id": 14, "page_no": 10, "cluster": {"id": 14, "label": "caption", "bbox": {"l": 136.79959, "t": 71.50903000000005, "r": 412.20758, "b": 80.72204999999985, "coord_origin": "TOPLEFT"}, "confidence": 0.7875156402587891, "cells": [{"id": 2, "text": "Table 3-1 summarizes these special registers and their values.", "bbox": {"l": 136.79959, "t": 71.50903000000005, "r": 412.20758, "b": 80.72204999999985, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 3-1 summarizes these special registers and their values."}, {"label": "caption", "id": 12, "page_no": 10, "cluster": {"id": 12, "label": "caption", "bbox": {"l": 136.8, "t": 93.49805000000003, "r": 372.60364, "b": 101.82299999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.9253708720207214, "cells": [{"id": 3, "text": "Table 3-1 Special registers and their corresponding values", "bbox": {"l": 136.8, "t": 93.49805000000003, "r": 372.60364, "b": 101.82299999999998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 3-1 Special registers and their corresponding values"}, {"label": "text", "id": 9, "page_no": 10, "cluster": {"id": 9, "label": "text", "bbox": {"l": 136.8, "t": 214.48870999999997, "r": 538.4939, "b": 235.70154000000002, "coord_origin": "TOPLEFT"}, "confidence": 0.9466660022735596, "cells": [{"id": 4, "text": "Figure 3-5 shows the difference in the special register values when an adopted authority is ", "bbox": {"l": 136.8, "t": 214.48870999999997, "r": 538.4939, "b": 223.70172000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "used:", "bbox": {"l": 136.8, "t": 226.48852999999997, "r": 161.20995, "b": 235.70154000000002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 3-5 shows the difference in the special register values when an adopted authority is used:"}, {"label": "list_item", "id": 8, "page_no": 10, "cluster": {"id": 8, "label": "list_item", "bbox": {"l": 136.8, "t": 243.52808000000005, "r": 411.36139, "b": 252.74108999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9504424333572388, "cells": [{"id": 6, "text": "GLYPH<SM590000>", "bbox": {"l": 136.8, "t": 243.67749000000003, "r": 141.78, "b": 252.45227, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "A user connects to the server using the user profile ALICE.", "bbox": {"l": 151.20016, "t": 243.52808000000005, "r": 411.36139, "b": 252.74108999999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<SM590000> A user connects to the server using the user profile ALICE."}, {"label": "list_item", "id": 10, "page_no": 10, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 136.8, "t": 260.50787, "r": 453.2580899999999, "b": 269.72089000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9445974230766296, "cells": [{"id": 8, "text": "GLYPH<SM590000>", "bbox": {"l": 136.8, "t": 260.65729, "r": 141.78, "b": 269.43206999999995, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "USER and CURRENT USER initially have the same value of ALICE.", "bbox": {"l": 151.20016, "t": 260.50787, "r": 453.2580899999999, "b": 269.72089000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<SM590000> USER and CURRENT USER initially have the same value of ALICE."}, {"label": "list_item", "id": 3, "page_no": 10, "cluster": {"id": 3, "label": "list_item", "bbox": {"l": 136.8, "t": 277.48767, "r": 541.44983, "b": 298.7005, "coord_origin": "TOPLEFT"}, "confidence": 0.9742953777313232, "cells": [{"id": 10, "text": "GLYPH<SM590000>", "bbox": {"l": 136.8, "t": 277.63707999999997, "r": 141.78, "b": 286.41187, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "ALICE calls an SQL procedure that is named proc1, which is owned by user profile JOE ", "bbox": {"l": 151.20016, "t": 277.48767, "r": 541.44983, "b": 286.70068, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "and was created to adopt JOE\u2019s authority when it is called.", "bbox": {"l": 151.20016, "t": 289.4875200000001, "r": 409.82953, "b": 298.7005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<SM590000> ALICE calls an SQL procedure that is named proc1, which is owned by user profile JOE and was created to adopt JOE's authority when it is called."}, {"label": "list_item", "id": 0, "page_no": 10, "cluster": {"id": 0, "label": "list_item", "bbox": {"l": 136.8, "t": 306.5271, "r": 547.21674, "b": 339.73972, "coord_origin": "TOPLEFT"}, "confidence": 0.981132447719574, "cells": [{"id": 13, "text": "GLYPH<SM590000>", "bbox": {"l": 136.8, "t": 306.67647999999997, "r": 141.78, "b": 315.45126000000005, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "While the procedure is running, the special register USER still contains the value of ALICE ", "bbox": {"l": 151.20016, "t": 306.5271, "r": 547.21674, "b": 315.74008, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "because it excludes any adopted authority. The special register CURRENT USER ", "bbox": {"l": 151.20117, "t": 318.52691999999996, "r": 514.32971, "b": 327.7399, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "contains the value of JOE because it includes any adopted authority.", "bbox": {"l": 151.20117, "t": 330.52673, "r": 453.3249200000001, "b": 339.73972, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<SM590000> While the procedure is running, the special register USER still contains the value of ALICE because it excludes any adopted authority. The special register CURRENT USER contains the value of JOE because it includes any adopted authority."}, {"label": "list_item", "id": 2, "page_no": 10, "cluster": {"id": 2, "label": "list_item", "bbox": {"l": 136.80101, "t": 347.50653, "r": 547.35406, "b": 368.71933000000007, "coord_origin": "TOPLEFT"}, "confidence": 0.9748278260231018, "cells": [{"id": 17, "text": "GLYPH<SM590000>", "bbox": {"l": 136.80101, "t": 347.65591, "r": 141.78101, "b": 356.43069, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "When proc1 ends, the session reverts to its original state with both USER and CURRENT ", "bbox": {"l": 151.20117, "t": 347.50653, "r": 547.35406, "b": 356.71950999999996, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "USER having the value of ALICE.", "bbox": {"l": 151.20117, "t": 359.50635, "r": 299.57532, "b": 368.71933000000007, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "GLYPH<SM590000> When proc1 ends, the session reverts to its original state with both USER and CURRENT USER having the value of ALICE."}, {"label": "caption", "id": 11, "page_no": 10, "cluster": {"id": 11, "label": "caption", "bbox": {"l": 136.8, "t": 596.7179, "r": 341.25662, "b": 605.04291, "coord_origin": "TOPLEFT"}, "confidence": 0.9274530410766602, "cells": [{"id": 20, "text": "Figure 3-5 Special registers and adopted authority", "bbox": {"l": 136.8, "t": 596.7179, "r": 341.25662, "b": 605.04291, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 3-5 Special registers and adopted authority"}, {"label": "section_header", "id": 6, "page_no": 10, "cluster": {"id": 6, "label": "section_header", "bbox": {"l": 64.800003, "t": 625.55472, "r": 247.02536, "b": 637.54272, "coord_origin": "TOPLEFT"}, "confidence": 0.9659212827682495, "cells": [{"id": 21, "text": "3.2.2", "bbox": {"l": 64.800003, "t": 625.55472, "r": 94.20356, "b": 637.54272, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "Built-in global variables", "bbox": {"l": 97.879005, "t": 625.55472, "r": 247.02536, "b": 637.54272, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3.2.2 Built-in global variables"}, {"label": "text", "id": 5, "page_no": 10, "cluster": {"id": 5, "label": "text", "bbox": {"l": 136.8, "t": 651.70872, "r": 518.00116, "b": 672.92153, "coord_origin": "TOPLEFT"}, "confidence": 0.9696778059005737, "cells": [{"id": 23, "text": "Built-in global variables are provided with the database manager and are used in SQL ", "bbox": {"l": 136.8, "t": 651.70872, "r": 518.00116, "b": 660.92172, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "statements to retrieve scalar values that are associated with the variables.", "bbox": {"l": 136.8, "t": 663.70853, "r": 462.81759999999997, "b": 672.92153, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Built-in global variables are provided with the database manager and are used in SQL statements to retrieve scalar values that are associated with the variables."}, {"label": "text", "id": 1, "page_no": 10, "cluster": {"id": 1, "label": "text", "bbox": {"l": 136.8, "t": 685.7281, "r": 532.3385, "b": 718.94072, "coord_origin": "TOPLEFT"}, "confidence": 0.978398323059082, "cells": [{"id": 25, "text": "IBM DB2 for i supports nine different built-in global variables that are read only and ", "bbox": {"l": 136.8, "t": 685.7281, "r": 504.44669, "b": 694.941101, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "maintained by the system. These global variables can be used to identify attributes of the ", "bbox": {"l": 136.8, "t": 697.727905, "r": 532.3385, "b": 706.94091, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "database connection and used as part of the RCAC logic.", "bbox": {"l": 136.8, "t": 709.727715, "r": 391.38257, "b": 718.94072, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "IBM DB2 for i supports nine different built-in global variables that are read only and maintained by the system. These global variables can be used to identify attributes of the database connection and used as part of the RCAC logic."}, {"label": "table", "id": 4, "page_no": 10, "cluster": {"id": 4, "label": "table", "bbox": {"l": 134.5462646484375, "t": 103.41889190673828, "r": 542.0460815429688, "b": 204.2716064453125, "coord_origin": "TOPLEFT"}, "confidence": 0.9731299877166748, "cells": [{"id": 28, "text": "Special register", "bbox": {"l": 142.8, "t": 110.53801999999985, "r": 209.67091, "b": 118.86298, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Corresponding value", "bbox": {"l": 230.18912000000003, "t": 110.53801999999985, "r": 319.93527, "b": 118.86298, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "USER or", "bbox": {"l": 142.80002, "t": 129.49834999999996, "r": 178.26361, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "SESSION_USER", "bbox": {"l": 142.80002, "t": 140.53864, "r": 212.70122, "b": 148.86359000000004, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "The effective user of the thread excluding adopted authority.", "bbox": {"l": 230.21973000000003, "t": 129.49834999999996, "r": 467.99069000000003, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "CURRENT_USER", "bbox": {"l": 142.80003, "t": 159.55835000000002, "r": 216.63962999999998, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "The effective user of the thread including adopted authority. When no adopted ", "bbox": {"l": 230.19814, "t": 159.55835000000002, "r": 535.65082, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "authority is present, this has the same value as USER.", "bbox": {"l": 230.22061, "t": 170.53832999999997, "r": 447.36533, "b": 178.86328000000003, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "SYSTEM_USER", "bbox": {"l": 142.8009, "t": 189.55804, "r": 209.7357, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "The authorization ID that initiated the connection.", "bbox": {"l": 230.2449, "t": 189.55804, "r": 425.64569, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}}], "children": [{"id": 26, "label": "text", "bbox": {"l": 142.8, "t": 110.53801999999985, "r": 209.67091, "b": 118.86298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 28, "text": "Special register", "bbox": {"l": 142.8, "t": 110.53801999999985, "r": 209.67091, "b": 118.86298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 230.18912000000003, "t": 110.53801999999985, "r": 319.93527, "b": 118.86298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "Corresponding value", "bbox": {"l": 230.18912000000003, "t": 110.53801999999985, "r": 319.93527, "b": 118.86298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 142.80002, "t": 129.49834999999996, "r": 178.26361, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "USER or", "bbox": {"l": 142.80002, "t": 129.49834999999996, "r": 178.26361, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 142.80002, "t": 140.53864, "r": 212.70122, "b": 148.86359000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "SESSION_USER", "bbox": {"l": 142.80002, "t": 140.53864, "r": 212.70122, "b": 148.86359000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 230.21973000000003, "t": 129.49834999999996, "r": 467.99069000000003, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "The effective user of the thread excluding adopted authority.", "bbox": {"l": 230.21973000000003, "t": 129.49834999999996, "r": 467.99069000000003, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 142.80003, "t": 159.55835000000002, "r": 216.63962999999998, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "CURRENT_USER", "bbox": {"l": 142.80003, "t": 159.55835000000002, "r": 216.63962999999998, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 230.19814, "t": 159.55835000000002, "r": 535.65082, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "The effective user of the thread including adopted authority. When no adopted ", "bbox": {"l": 230.19814, "t": 159.55835000000002, "r": 535.65082, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 230.22061, "t": 170.53832999999997, "r": 447.36533, "b": 178.86328000000003, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "authority is present, this has the same value as USER.", "bbox": {"l": 230.22061, "t": 170.53832999999997, "r": 447.36533, "b": 178.86328000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 142.8009, "t": 189.55804, "r": 209.7357, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "SYSTEM_USER", "bbox": {"l": 142.8009, "t": 189.55804, "r": 209.7357, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 230.2449, "t": 189.55804, "r": 425.64569, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "The authorization ID that initiated the connection.", "bbox": {"l": 230.2449, "t": 189.55804, "r": 425.64569, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl", "fcel", "fcel", "nl"], "num_rows": 4, "num_cols": 2, "table_cells": [{"bbox": {"l": 142.8, "t": 110.53801999999985, "r": 209.67091, "b": 118.86298, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Special register", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 230.18912000000003, "t": 110.53801999999985, "r": 319.93527, "b": 118.86298, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Corresponding value", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 142.80002, "t": 129.49834999999996, "r": 212.70122, "b": 148.86359000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "USER or SESSION_USER", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 230.21973000000003, "t": 129.49834999999996, "r": 467.99069000000003, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "The effective user of the thread excluding adopted authority.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 142.80003, "t": 159.55835000000002, "r": 216.63962999999998, "b": 167.88329999999996, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "CURRENT_USER", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 230.19814, "t": 159.55835000000002, "r": 535.65082, "b": 178.86328000000003, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "The effective user of the thread including adopted authority. When no adopted  authority is present, this has the same value as USER.", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 142.8009, "t": 189.55804, "r": 209.7357, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "SYSTEM_USER", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 230.2449, "t": 189.55804, "r": 425.64569, "b": 197.88300000000004, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "The authorization ID that initiated the connection.", "column_header": false, "row_header": false, "row_section": false}]}, {"label": "picture", "id": 16, "page_no": 10, "cluster": {"id": 16, "label": "picture", "bbox": {"l": 135.64837646484375, "t": 384.1737060546875, "r": 301.2367248535156, "b": 594.7566528320312, "coord_origin": "TOPLEFT"}, "confidence": 0.7221468687057495, "cells": [{"id": 38, "text": "SignedonasALICE", "bbox": {"l": 140.7323, "t": 386.98453, "r": 218.71170000000004, "b": 395.49527, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "Signed on as ALICE", "bbox": {"l": 140.7323, "t": 386.98453, "r": 216.40009, "b": 395.49527, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "USER = ALICE", "bbox": {"l": 138.476, "t": 410.87441999999993, "r": 191.70256, "b": 419.38516, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "CURRENT USER = ALICE", "bbox": {"l": 138.476, "t": 422.81934, "r": 232.56117, "b": 431.33008, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "CALL proc1", "bbox": {"l": 138.476, "t": 446.70923000000005, "r": 183.26944, "b": 455.21997, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "P1", "bbox": {"l": 148.4301, "t": 473.58524, "r": 184.17328, "b": 482.09598, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "Proc1:", "bbox": {"l": 148.4301, "t": 473.58524, "r": 174.05859, "b": 482.09598, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "Owner = JOE", "bbox": {"l": 157.52185, "t": 485.53015, "r": 209.103, "b": 494.04089, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "SET OPTION USRPRF=*OWNER", "bbox": {"l": 157.52185, "t": 497.47507, "r": 281.68927, "b": 505.98581, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "USER = ALICE", "bbox": {"l": 148.4301, "t": 521.36493, "r": 201.65666, "b": 529.87567, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "CURRENT USER = JOE", "bbox": {"l": 148.4301, "t": 533.30984, "r": 234.57686999999999, "b": 541.82059, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "USER = ALICE", "bbox": {"l": 138.476, "t": 566.15842, "r": 191.70256, "b": 574.66917, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "CURRENT USER = ALICE", "bbox": {"l": 138.476, "t": 578.10333, "r": 232.56117, "b": 586.61409, "coord_origin": "TOPLEFT"}}], "children": [{"id": 15, "label": "text", "bbox": {"l": 140.7323, "t": 386.98453, "r": 218.71170000000004, "b": 395.49527, "coord_origin": "TOPLEFT"}, "confidence": 0.7616674304008484, "cells": [{"id": 38, "text": "SignedonasALICE", "bbox": {"l": 140.7323, "t": 386.98453, "r": 218.71170000000004, "b": 395.49527, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "Signed on as ALICE", "bbox": {"l": 140.7323, "t": 386.98453, "r": 216.40009, "b": 395.49527, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 138.476, "t": 410.87441999999993, "r": 191.70256, "b": 419.38516, "coord_origin": "TOPLEFT"}, "confidence": 0.5373895764350891, "cells": [{"id": 40, "text": "USER = ALICE", "bbox": {"l": 138.476, "t": 410.87441999999993, "r": 191.70256, "b": 419.38516, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 138.476, "t": 422.81934, "r": 232.56117, "b": 431.33008, "coord_origin": "TOPLEFT"}, "confidence": 0.5213791728019714, "cells": [{"id": 41, "text": "CURRENT USER = ALICE", "bbox": {"l": 138.476, "t": 422.81934, "r": 232.56117, "b": 431.33008, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 138.476, "t": 446.70923000000005, "r": 183.26944, "b": 455.21997, "coord_origin": "TOPLEFT"}, "confidence": 0.6404178142547607, "cells": [{"id": 42, "text": "CALL proc1", "bbox": {"l": 138.476, "t": 446.70923000000005, "r": 183.26944, "b": 455.21997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 148.4301, "t": 473.58524, "r": 184.17328, "b": 482.09598, "coord_origin": "TOPLEFT"}, "confidence": 0.5759297609329224, "cells": [{"id": 43, "text": "P1", "bbox": {"l": 148.4301, "t": 473.58524, "r": 184.17328, "b": 482.09598, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "Proc1:", "bbox": {"l": 148.4301, "t": 473.58524, "r": 174.05859, "b": 482.09598, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 157.52185, "t": 485.53015, "r": 209.103, "b": 494.04089, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "Owner = JOE", "bbox": {"l": 157.52185, "t": 485.53015, "r": 209.103, "b": 494.04089, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 157.52185, "t": 497.47507, "r": 281.68927, "b": 505.98581, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "SET OPTION USRPRF=*OWNER", "bbox": {"l": 157.52185, "t": 497.47507, "r": 281.68927, "b": 505.98581, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 148.4301, "t": 521.36493, "r": 201.65666, "b": 529.87567, "coord_origin": "TOPLEFT"}, "confidence": 0.5350866913795471, "cells": [{"id": 47, "text": "USER = ALICE", "bbox": {"l": 148.4301, "t": 521.36493, "r": 201.65666, "b": 529.87567, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 148.4301, "t": 533.30984, "r": 234.57686999999999, "b": 541.82059, "coord_origin": "TOPLEFT"}, "confidence": 0.5008324384689331, "cells": [{"id": 48, "text": "CURRENT USER = JOE", "bbox": {"l": 148.4301, "t": 533.30984, "r": 234.57686999999999, "b": 541.82059, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 138.476, "t": 566.15842, "r": 232.56117, "b": 586.61409, "coord_origin": "TOPLEFT"}, "confidence": 0.5024971961975098, "cells": [{"id": 49, "text": "USER = ALICE", "bbox": {"l": 138.476, "t": 566.15842, "r": 191.70256, "b": 574.66917, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "CURRENT USER = ALICE", "bbox": {"l": 138.476, "t": 578.10333, "r": 232.56117, "b": 586.61409, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "headers": [{"label": "page_footer", "id": 7, "page_no": 10, "cluster": {"id": 7, "label": "page_footer", "bbox": {"l": 344.94, "t": 755.538002, "r": 523.60162, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9557498693466187, "cells": [{"id": 0, "text": "Chapter 3. Row and Column Access Control ", "bbox": {"l": 344.94, "t": 755.538002, "r": 523.60162, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Chapter 3. Row and Column Access Control"}, {"label": "page_footer", "id": 13, "page_no": 10, "cluster": {"id": 13, "label": "page_footer", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.9130511283874512, "cells": [{"id": 1, "text": "19", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "19"}]}}, {"page_no": 11, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "20 ", "bbox": {"l": 64.800003, "t": 754.848721, "r": 78.402, "b": 764.06172, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Row and Column Access Control Support in IBM DB2 for i", "bbox": {"l": 93.420303, "t": 755.538002, "r": 334.42142, "b": 763.863001, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "Table 3-2 lists the nine built-in global variables.", "bbox": {"l": 136.8, "t": 71.50867000000005, "r": 342.54773, "b": 80.72167999999999, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Table 3-2 Built-in global variables", "bbox": {"l": 64.800003, "t": 93.49805000000003, "r": 201.18147, "b": 101.82299999999998, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "3.3", "bbox": {"l": 64.800003, "t": 322.20071, "r": 87.318192, "b": 336.96371000000005, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "VERIFY_GROUP_FOR_USER function", "bbox": {"l": 91.821815, "t": 322.20071, "r": 384.36389, "b": 336.96371000000005, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "The VERIFY_GROUP_FOR_USER function was added in IBM i 7.2. Although it is primarily ", "bbox": {"l": 136.8, "t": 354.52872, "r": 542.83539, "b": 363.7417, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "intended for use with RCAC permissions and masks, it can be used in other SQL statements. ", "bbox": {"l": 136.8, "t": 366.52853, "r": 547.14783, "b": 375.74152, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "The first parameter must be one of these three special registers: SESSION_USER, USER, or ", "bbox": {"l": 136.8, "t": 378.52835, "r": 547.15106, "b": 387.74132999999995, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "CURRENT_USER. The second and subsequent parameters are a list of user or group ", "bbox": {"l": 136.80002, "t": 390.52817, "r": 520.62958, "b": 399.74115000000006, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "profiles. Each of these values must be 1 - 10 characters in length. These values are not ", "bbox": {"l": 136.80002, "t": 402.52798, "r": 524.88824, "b": 411.74097, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "validated for their existence, which means that you can specify the names of user profiles that ", "bbox": {"l": 136.80002, "t": 414.5278, "r": 547.23474, "b": 423.7407799999999, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "do not exist without receiving any kind of error.", "bbox": {"l": 136.80002, "t": 426.52762, "r": 342.04672, "b": 435.74060000000003, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "If a special register value is in the list of user profiles or it is a member of a group profile ", "bbox": {"l": 136.80002, "t": 448.48743, "r": 525.1474, "b": 457.70041, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "included in the list, the function returns a long integer value of 1. Otherwise, it returns a value ", "bbox": {"l": 136.80002, "t": 460.48724, "r": 547.25739, "b": 469.70023, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "of 0. It never returns the null value.", "bbox": {"l": 136.80002, "t": 472.48706, "r": 289.84335, "b": 481.70004, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Here is an example of using the VERIFY_GROUP_FOR_USER function:", "bbox": {"l": 136.80002, "t": 494.50662, "r": 458.44525000000004, "b": 503.7196, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "1.", "bbox": {"l": 136.80002, "t": 511.5462, "r": 145.09804, "b": 520.75919, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "There are user profiles for MGR, JANE, JUDY, and TONY.", "bbox": {"l": 147.86403, "t": 511.5462, "r": 406.07751, "b": 520.75919, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "2.", "bbox": {"l": 136.80002, "t": 528.5260000000001, "r": 145.23297, "b": 537.739, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "The user profile JANE specifies a group profile of MGR.", "bbox": {"l": 148.04396, "t": 528.5260000000001, "r": 396.98816, "b": 537.739, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "3.", "bbox": {"l": 136.80002, "t": 545.50581, "r": 145.18951, "b": 554.71881, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "If a user is connected to the server using user profile JANE, all of the following function ", "bbox": {"l": 147.98601, "t": 545.50581, "r": 536.5686, "b": 554.71881, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "invocations return a value of 1:", "bbox": {"l": 151.20018, "t": 557.50562, "r": 286.84641, "b": 566.71861, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "VERIFY_GROUP_FOR_USER (CURRENT_USER, 'MGR')", "bbox": {"l": 151.20018, "t": 574.69458, "r": 366.05725, "b": 583.46933, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "VERIFY_GROUP_FOR_USER (CURRENT_USER, 'JANE', 'MGR')", "bbox": {"l": 151.20018, "t": 586.69438, "r": 406.01678, "b": 595.46913, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "VERIFY_GROUP_FOR_USER (CURRENT_USER, 'JANE', 'MGR', 'STEVE')", "bbox": {"l": 151.20018, "t": 598.69418, "r": 451.01605, "b": 607.46893, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "The following function invocation returns a value of 0:", "bbox": {"l": 151.20018, "t": 615.5246, "r": 385.87271, "b": 624.73759, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "VERIFY_GROUP_FOR_USER (CURRENT_USER, 'JUDY', 'TONY')", "bbox": {"l": 151.20018, "t": 632.65381, "r": 411.05655, "b": 641.4285600000001, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Global variable", "bbox": {"l": 70.800003, "t": 110.53801999999985, "r": 134.99071, "b": 118.86298, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Type", "bbox": {"l": 202.8894, "t": 110.53801999999985, "r": 223.34641, "b": 118.86298, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Description", "bbox": {"l": 281.8248, "t": 110.53801999999985, "r": 331.3428, "b": 118.86298, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "CLIENT_HOST", "bbox": {"l": 70.800003, "t": 129.49834999999996, "r": 132.7209, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "VARCHAR(255)", "bbox": {"l": 202.89029, "t": 129.49834999999996, "r": 267.07651, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Host name of the current client as returned by the system", "bbox": {"l": 281.84732, "t": 129.49834999999996, "r": 510.17548, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "CLIENT_IPADDR", "bbox": {"l": 70.800018, "t": 148.51806999999997, "r": 140.66522, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "VARCHAR(128)", "bbox": {"l": 202.87231, "t": 148.51806999999997, "r": 267.07739, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "IP address of the current client as returned by the system", "bbox": {"l": 281.84549, "t": 148.51806999999997, "r": 509.60583, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "CLIENT_PORT ", "bbox": {"l": 70.800018, "t": 167.53778, "r": 134.98264, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "INTEGER", "bbox": {"l": 202.90294, "t": 167.53778, "r": 242.80084, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "Port used by the current client to communicate with the server", "bbox": {"l": 281.79785, "t": 167.53778, "r": 527.59222, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "PACKAGE_NAME", "bbox": {"l": 70.800018, "t": 186.5575, "r": 143.50925, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "VARCHAR(128)", "bbox": {"l": 202.80576, "t": 186.5575, "r": 267.06937, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Name of the currently running package", "bbox": {"l": 281.85187, "t": 186.5575, "r": 436.57259999999997, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "PACKAGE_SCHEMA", "bbox": {"l": 70.800018, "t": 205.51782000000003, "r": 156.01654, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "VARCHAR(128)", "bbox": {"l": 202.83545, "t": 205.51782000000003, "r": 267.08646, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "Schema name of the currently running package", "bbox": {"l": 281.87076, "t": 205.51782000000003, "r": 470.44678, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "PACKAGE_VERSION", "bbox": {"l": 70.800018, "t": 224.53754000000004, "r": 157.89932, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "VARCHAR(64)", "bbox": {"l": 202.72472, "t": 224.53754000000004, "r": 261.98254, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "Version identifier of the currently running package", "bbox": {"l": 281.74924, "t": 224.53754000000004, "r": 478.8438100000001, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "ROUTINE_SCHEMA", "bbox": {"l": 70.800018, "t": 243.55724999999995, "r": 154.41992, "b": 251.8822, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "VARCHAR(128)", "bbox": {"l": 202.79312, "t": 243.55724999999995, "r": 267.09274, "b": 251.8822, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Schema name of the currently running routine", "bbox": {"l": 281.87164, "t": 243.55724999999995, "r": 464.26022, "b": 251.8822, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "ROUTINE_SPECIFIC_NAME", "bbox": {"l": 70.800018, "t": 262.51757999999995, "r": 188.43991, "b": 270.84253, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "VARCHAR(128)", "bbox": {"l": 202.84441, "t": 262.51757999999995, "r": 267.03693, "b": 270.84253, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "Name of the currently running routine", "bbox": {"l": 281.80682, "t": 262.51757999999995, "r": 430.40045, "b": 270.84253, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "ROUTINE_TYPE", "bbox": {"l": 70.800034, "t": 281.53726, "r": 139.43135, "b": 289.86227, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "CHAR(1)", "bbox": {"l": 202.74635, "t": 281.53726, "r": 239.28996000000004, "b": 289.86227, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Type of the currently running routine", "bbox": {"l": 281.79065, "t": 281.53726, "r": 425.09131, "b": 289.86227, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 9, "label": "page_footer", "bbox": {"l": 64.800003, "t": 754.848721, "r": 78.402, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.9187920093536377, "cells": [{"id": 0, "text": "20 ", "bbox": {"l": 64.800003, "t": 754.848721, "r": 78.402, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "page_footer", "bbox": {"l": 93.420303, "t": 755.538002, "r": 334.42142, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9505079388618469, "cells": [{"id": 1, "text": "Row and Column Access Control Support in IBM DB2 for i", "bbox": {"l": 93.420303, "t": 755.538002, "r": 334.42142, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 136.8, "t": 71.50867000000005, "r": 342.54773, "b": 80.72167999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.8370978832244873, "cells": [{"id": 2, "text": "Table 3-2 lists the nine built-in global variables.", "bbox": {"l": 136.8, "t": 71.50867000000005, "r": 342.54773, "b": 80.72167999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "caption", "bbox": {"l": 64.800003, "t": 93.49805000000003, "r": 201.18147, "b": 101.82299999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.913235604763031, "cells": [{"id": 3, "text": "Table 3-2 Built-in global variables", "bbox": {"l": 64.800003, "t": 93.49805000000003, "r": 201.18147, "b": 101.82299999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "section_header", "bbox": {"l": 64.800003, "t": 322.20071, "r": 384.36389, "b": 336.96371000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9645338654518127, "cells": [{"id": 4, "text": "3.3", "bbox": {"l": 64.800003, "t": 322.20071, "r": 87.318192, "b": 336.96371000000005, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "VERIFY_GROUP_FOR_USER function", "bbox": {"l": 91.821815, "t": 322.20071, "r": 384.36389, "b": 336.96371000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 136.8, "t": 354.52872, "r": 547.23474, "b": 435.74060000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9864333868026733, "cells": [{"id": 6, "text": "The VERIFY_GROUP_FOR_USER function was added in IBM i 7.2. Although it is primarily ", "bbox": {"l": 136.8, "t": 354.52872, "r": 542.83539, "b": 363.7417, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "intended for use with RCAC permissions and masks, it can be used in other SQL statements. ", "bbox": {"l": 136.8, "t": 366.52853, "r": 547.14783, "b": 375.74152, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "The first parameter must be one of these three special registers: SESSION_USER, USER, or ", "bbox": {"l": 136.8, "t": 378.52835, "r": 547.15106, "b": 387.74132999999995, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "CURRENT_USER. The second and subsequent parameters are a list of user or group ", "bbox": {"l": 136.80002, "t": 390.52817, "r": 520.62958, "b": 399.74115000000006, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "profiles. Each of these values must be 1 - 10 characters in length. These values are not ", "bbox": {"l": 136.80002, "t": 402.52798, "r": 524.88824, "b": 411.74097, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "validated for their existence, which means that you can specify the names of user profiles that ", "bbox": {"l": 136.80002, "t": 414.5278, "r": 547.23474, "b": 423.7407799999999, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "do not exist without receiving any kind of error.", "bbox": {"l": 136.80002, "t": 426.52762, "r": 342.04672, "b": 435.74060000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 136.80002, "t": 448.48743, "r": 547.25739, "b": 481.70004, "coord_origin": "TOPLEFT"}, "confidence": 0.9807308912277222, "cells": [{"id": 13, "text": "If a special register value is in the list of user profiles or it is a member of a group profile ", "bbox": {"l": 136.80002, "t": 448.48743, "r": 525.1474, "b": 457.70041, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "included in the list, the function returns a long integer value of 1. Otherwise, it returns a value ", "bbox": {"l": 136.80002, "t": 460.48724, "r": 547.25739, "b": 469.70023, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "of 0. It never returns the null value.", "bbox": {"l": 136.80002, "t": 472.48706, "r": 289.84335, "b": 481.70004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "text", "bbox": {"l": 136.80002, "t": 494.50662, "r": 458.44525000000004, "b": 503.7196, "coord_origin": "TOPLEFT"}, "confidence": 0.9237529635429382, "cells": [{"id": 16, "text": "Here is an example of using the VERIFY_GROUP_FOR_USER function:", "bbox": {"l": 136.80002, "t": 494.50662, "r": 458.44525000000004, "b": 503.7196, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "list_item", "bbox": {"l": 136.80002, "t": 511.5462, "r": 406.07751, "b": 520.75919, "coord_origin": "TOPLEFT"}, "confidence": 0.9338629841804504, "cells": [{"id": 17, "text": "1.", "bbox": {"l": 136.80002, "t": 511.5462, "r": 145.09804, "b": 520.75919, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "There are user profiles for MGR, JANE, JUDY, and TONY.", "bbox": {"l": 147.86403, "t": 511.5462, "r": 406.07751, "b": 520.75919, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "list_item", "bbox": {"l": 136.80002, "t": 528.5260000000001, "r": 396.98816, "b": 537.739, "coord_origin": "TOPLEFT"}, "confidence": 0.9514460563659668, "cells": [{"id": 19, "text": "2.", "bbox": {"l": 136.80002, "t": 528.5260000000001, "r": 145.23297, "b": 537.739, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "The user profile JANE specifies a group profile of MGR.", "bbox": {"l": 148.04396, "t": 528.5260000000001, "r": 396.98816, "b": 537.739, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "list_item", "bbox": {"l": 136.80002, "t": 545.50581, "r": 536.5686, "b": 566.71861, "coord_origin": "TOPLEFT"}, "confidence": 0.951230525970459, "cells": [{"id": 21, "text": "3.", "bbox": {"l": 136.80002, "t": 545.50581, "r": 145.18951, "b": 554.71881, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "If a user is connected to the server using user profile JANE, all of the following function ", "bbox": {"l": 147.98601, "t": 545.50581, "r": 536.5686, "b": 554.71881, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "invocations return a value of 1:", "bbox": {"l": 151.20018, "t": 557.50562, "r": 286.84641, "b": 566.71861, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "code", "bbox": {"l": 151.20018, "t": 574.69458, "r": 451.01605, "b": 641.4285600000001, "coord_origin": "TOPLEFT"}, "confidence": 0.7066455483436584, "cells": [{"id": 24, "text": "VERIFY_GROUP_FOR_USER (CURRENT_USER, 'MGR')", "bbox": {"l": 151.20018, "t": 574.69458, "r": 366.05725, "b": 583.46933, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "VERIFY_GROUP_FOR_USER (CURRENT_USER, 'JANE', 'MGR')", "bbox": {"l": 151.20018, "t": 586.69438, "r": 406.01678, "b": 595.46913, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "VERIFY_GROUP_FOR_USER (CURRENT_USER, 'JANE', 'MGR', 'STEVE')", "bbox": {"l": 151.20018, "t": 598.69418, "r": 451.01605, "b": 607.46893, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "The following function invocation returns a value of 0:", "bbox": {"l": 151.20018, "t": 615.5246, "r": 385.87271, "b": 624.73759, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "VERIFY_GROUP_FOR_USER (CURRENT_USER, 'JUDY', 'TONY')", "bbox": {"l": 151.20018, "t": 632.65381, "r": 411.05655, "b": 641.4285600000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "table", "bbox": {"l": 63.55636978149414, "t": 104.23387145996094, "r": 548.5687255859375, "b": 296.22467041015625, "coord_origin": "TOPLEFT"}, "confidence": 0.9868634939193726, "cells": [{"id": 29, "text": "Global variable", "bbox": {"l": 70.800003, "t": 110.53801999999985, "r": 134.99071, "b": 118.86298, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Type", "bbox": {"l": 202.8894, "t": 110.53801999999985, "r": 223.34641, "b": 118.86298, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Description", "bbox": {"l": 281.8248, "t": 110.53801999999985, "r": 331.3428, "b": 118.86298, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "CLIENT_HOST", "bbox": {"l": 70.800003, "t": 129.49834999999996, "r": 132.7209, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "VARCHAR(255)", "bbox": {"l": 202.89029, "t": 129.49834999999996, "r": 267.07651, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Host name of the current client as returned by the system", "bbox": {"l": 281.84732, "t": 129.49834999999996, "r": 510.17548, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "CLIENT_IPADDR", "bbox": {"l": 70.800018, "t": 148.51806999999997, "r": 140.66522, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "VARCHAR(128)", "bbox": {"l": 202.87231, "t": 148.51806999999997, "r": 267.07739, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "IP address of the current client as returned by the system", "bbox": {"l": 281.84549, "t": 148.51806999999997, "r": 509.60583, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "CLIENT_PORT ", "bbox": {"l": 70.800018, "t": 167.53778, "r": 134.98264, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "INTEGER", "bbox": {"l": 202.90294, "t": 167.53778, "r": 242.80084, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "Port used by the current client to communicate with the server", "bbox": {"l": 281.79785, "t": 167.53778, "r": 527.59222, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "PACKAGE_NAME", "bbox": {"l": 70.800018, "t": 186.5575, "r": 143.50925, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "VARCHAR(128)", "bbox": {"l": 202.80576, "t": 186.5575, "r": 267.06937, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Name of the currently running package", "bbox": {"l": 281.85187, "t": 186.5575, "r": 436.57259999999997, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "PACKAGE_SCHEMA", "bbox": {"l": 70.800018, "t": 205.51782000000003, "r": 156.01654, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "VARCHAR(128)", "bbox": {"l": 202.83545, "t": 205.51782000000003, "r": 267.08646, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "Schema name of the currently running package", "bbox": {"l": 281.87076, "t": 205.51782000000003, "r": 470.44678, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "PACKAGE_VERSION", "bbox": {"l": 70.800018, "t": 224.53754000000004, "r": 157.89932, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "VARCHAR(64)", "bbox": {"l": 202.72472, "t": 224.53754000000004, "r": 261.98254, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "Version identifier of the currently running package", "bbox": {"l": 281.74924, "t": 224.53754000000004, "r": 478.8438100000001, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "ROUTINE_SCHEMA", "bbox": {"l": 70.800018, "t": 243.55724999999995, "r": 154.41992, "b": 251.8822, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "VARCHAR(128)", "bbox": {"l": 202.79312, "t": 243.55724999999995, "r": 267.09274, "b": 251.8822, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Schema name of the currently running routine", "bbox": {"l": 281.87164, "t": 243.55724999999995, "r": 464.26022, "b": 251.8822, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "ROUTINE_SPECIFIC_NAME", "bbox": {"l": 70.800018, "t": 262.51757999999995, "r": 188.43991, "b": 270.84253, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "VARCHAR(128)", "bbox": {"l": 202.84441, "t": 262.51757999999995, "r": 267.03693, "b": 270.84253, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "Name of the currently running routine", "bbox": {"l": 281.80682, "t": 262.51757999999995, "r": 430.40045, "b": 270.84253, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "ROUTINE_TYPE", "bbox": {"l": 70.800034, "t": 281.53726, "r": 139.43135, "b": 289.86227, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "CHAR(1)", "bbox": {"l": 202.74635, "t": 281.53726, "r": 239.28996000000004, "b": 289.86227, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Type of the currently running routine", "bbox": {"l": 281.79065, "t": 281.53726, "r": 425.09131, "b": 289.86227, "coord_origin": "TOPLEFT"}}], "children": [{"id": 14, "label": "text", "bbox": {"l": 70.800003, "t": 110.53801999999985, "r": 134.99071, "b": 118.86298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "Global variable", "bbox": {"l": 70.800003, "t": 110.53801999999985, "r": 134.99071, "b": 118.86298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 202.8894, "t": 110.53801999999985, "r": 223.34641, "b": 118.86298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "Type", "bbox": {"l": 202.8894, "t": 110.53801999999985, "r": 223.34641, "b": 118.86298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 281.8248, "t": 110.53801999999985, "r": 331.3428, "b": 118.86298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "Description", "bbox": {"l": 281.8248, "t": 110.53801999999985, "r": 331.3428, "b": 118.86298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 70.800003, "t": 129.49834999999996, "r": 132.7209, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "CLIENT_HOST", "bbox": {"l": 70.800003, "t": 129.49834999999996, "r": 132.7209, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 202.89029, "t": 129.49834999999996, "r": 267.07651, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "VARCHAR(255)", "bbox": {"l": 202.89029, "t": 129.49834999999996, "r": 267.07651, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 281.84732, "t": 129.49834999999996, "r": 510.17548, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "Host name of the current client as returned by the system", "bbox": {"l": 281.84732, "t": 129.49834999999996, "r": 510.17548, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 70.800018, "t": 148.51806999999997, "r": 140.66522, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "CLIENT_IPADDR", "bbox": {"l": 70.800018, "t": 148.51806999999997, "r": 140.66522, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 202.87231, "t": 148.51806999999997, "r": 267.07739, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "VARCHAR(128)", "bbox": {"l": 202.87231, "t": 148.51806999999997, "r": 267.07739, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 281.84549, "t": 148.51806999999997, "r": 509.60583, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "IP address of the current client as returned by the system", "bbox": {"l": 281.84549, "t": 148.51806999999997, "r": 509.60583, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 70.800018, "t": 167.53778, "r": 134.98264, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "CLIENT_PORT ", "bbox": {"l": 70.800018, "t": 167.53778, "r": 134.98264, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 202.90294, "t": 167.53778, "r": 242.80084, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "INTEGER", "bbox": {"l": 202.90294, "t": 167.53778, "r": 242.80084, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 281.79785, "t": 167.53778, "r": 527.59222, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "Port used by the current client to communicate with the server", "bbox": {"l": 281.79785, "t": 167.53778, "r": 527.59222, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 70.800018, "t": 186.5575, "r": 143.50925, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "PACKAGE_NAME", "bbox": {"l": 70.800018, "t": 186.5575, "r": 143.50925, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 202.80576, "t": 186.5575, "r": 267.06937, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "VARCHAR(128)", "bbox": {"l": 202.80576, "t": 186.5575, "r": 267.06937, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 281.85187, "t": 186.5575, "r": 436.57259999999997, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "Name of the currently running package", "bbox": {"l": 281.85187, "t": 186.5575, "r": 436.57259999999997, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 70.800018, "t": 205.51782000000003, "r": 156.01654, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "PACKAGE_SCHEMA", "bbox": {"l": 70.800018, "t": 205.51782000000003, "r": 156.01654, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 202.83545, "t": 205.51782000000003, "r": 267.08646, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "VARCHAR(128)", "bbox": {"l": 202.83545, "t": 205.51782000000003, "r": 267.08646, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 281.87076, "t": 205.51782000000003, "r": 470.44678, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "Schema name of the currently running package", "bbox": {"l": 281.87076, "t": 205.51782000000003, "r": 470.44678, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 70.800018, "t": 224.53754000000004, "r": 157.89932, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "PACKAGE_VERSION", "bbox": {"l": 70.800018, "t": 224.53754000000004, "r": 157.89932, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 202.72472, "t": 224.53754000000004, "r": 261.98254, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "VARCHAR(64)", "bbox": {"l": 202.72472, "t": 224.53754000000004, "r": 261.98254, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 281.74924, "t": 224.53754000000004, "r": 478.8438100000001, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "Version identifier of the currently running package", "bbox": {"l": 281.74924, "t": 224.53754000000004, "r": 478.8438100000001, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 70.800018, "t": 243.55724999999995, "r": 154.41992, "b": 251.8822, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "ROUTINE_SCHEMA", "bbox": {"l": 70.800018, "t": 243.55724999999995, "r": 154.41992, "b": 251.8822, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 202.79312, "t": 243.55724999999995, "r": 267.09274, "b": 251.8822, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "VARCHAR(128)", "bbox": {"l": 202.79312, "t": 243.55724999999995, "r": 267.09274, "b": 251.8822, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 281.87164, "t": 243.55724999999995, "r": 464.26022, "b": 251.8822, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "Schema name of the currently running routine", "bbox": {"l": 281.87164, "t": 243.55724999999995, "r": 464.26022, "b": 251.8822, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 70.800018, "t": 262.51757999999995, "r": 188.43991, "b": 270.84253, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "ROUTINE_SPECIFIC_NAME", "bbox": {"l": 70.800018, "t": 262.51757999999995, "r": 188.43991, "b": 270.84253, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 202.84441, "t": 262.51757999999995, "r": 267.03693, "b": 270.84253, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "VARCHAR(128)", "bbox": {"l": 202.84441, "t": 262.51757999999995, "r": 267.03693, "b": 270.84253, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 281.80682, "t": 262.51757999999995, "r": 430.40045, "b": 270.84253, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "Name of the currently running routine", "bbox": {"l": 281.80682, "t": 262.51757999999995, "r": 430.40045, "b": 270.84253, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 70.800034, "t": 281.53726, "r": 139.43135, "b": 289.86227, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "ROUTINE_TYPE", "bbox": {"l": 70.800034, "t": 281.53726, "r": 139.43135, "b": 289.86227, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 202.74635, "t": 281.53726, "r": 239.28996000000004, "b": 289.86227, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "CHAR(1)", "bbox": {"l": 202.74635, "t": 281.53726, "r": 239.28996000000004, "b": 289.86227, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 281.79065, "t": 281.53726, "r": 425.09131, "b": 289.86227, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "Type of the currently running routine", "bbox": {"l": 281.79065, "t": 281.53726, "r": 425.09131, "b": 289.86227, "coord_origin": "TOPLEFT"}}], "children": []}]}]}, "tablestructure": {"table_map": {"0": {"label": "table", "id": 0, "page_no": 11, "cluster": {"id": 0, "label": "table", "bbox": {"l": 63.55636978149414, "t": 104.23387145996094, "r": 548.5687255859375, "b": 296.22467041015625, "coord_origin": "TOPLEFT"}, "confidence": 0.9868634939193726, "cells": [{"id": 29, "text": "Global variable", "bbox": {"l": 70.800003, "t": 110.53801999999985, "r": 134.99071, "b": 118.86298, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Type", "bbox": {"l": 202.8894, "t": 110.53801999999985, "r": 223.34641, "b": 118.86298, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Description", "bbox": {"l": 281.8248, "t": 110.53801999999985, "r": 331.3428, "b": 118.86298, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "CLIENT_HOST", "bbox": {"l": 70.800003, "t": 129.49834999999996, "r": 132.7209, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "VARCHAR(255)", "bbox": {"l": 202.89029, "t": 129.49834999999996, "r": 267.07651, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Host name of the current client as returned by the system", "bbox": {"l": 281.84732, "t": 129.49834999999996, "r": 510.17548, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "CLIENT_IPADDR", "bbox": {"l": 70.800018, "t": 148.51806999999997, "r": 140.66522, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "VARCHAR(128)", "bbox": {"l": 202.87231, "t": 148.51806999999997, "r": 267.07739, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "IP address of the current client as returned by the system", "bbox": {"l": 281.84549, "t": 148.51806999999997, "r": 509.60583, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "CLIENT_PORT ", "bbox": {"l": 70.800018, "t": 167.53778, "r": 134.98264, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "INTEGER", "bbox": {"l": 202.90294, "t": 167.53778, "r": 242.80084, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "Port used by the current client to communicate with the server", "bbox": {"l": 281.79785, "t": 167.53778, "r": 527.59222, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "PACKAGE_NAME", "bbox": {"l": 70.800018, "t": 186.5575, "r": 143.50925, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "VARCHAR(128)", "bbox": {"l": 202.80576, "t": 186.5575, "r": 267.06937, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Name of the currently running package", "bbox": {"l": 281.85187, "t": 186.5575, "r": 436.57259999999997, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "PACKAGE_SCHEMA", "bbox": {"l": 70.800018, "t": 205.51782000000003, "r": 156.01654, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "VARCHAR(128)", "bbox": {"l": 202.83545, "t": 205.51782000000003, "r": 267.08646, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "Schema name of the currently running package", "bbox": {"l": 281.87076, "t": 205.51782000000003, "r": 470.44678, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "PACKAGE_VERSION", "bbox": {"l": 70.800018, "t": 224.53754000000004, "r": 157.89932, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "VARCHAR(64)", "bbox": {"l": 202.72472, "t": 224.53754000000004, "r": 261.98254, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "Version identifier of the currently running package", "bbox": {"l": 281.74924, "t": 224.53754000000004, "r": 478.8438100000001, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "ROUTINE_SCHEMA", "bbox": {"l": 70.800018, "t": 243.55724999999995, "r": 154.41992, "b": 251.8822, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "VARCHAR(128)", "bbox": {"l": 202.79312, "t": 243.55724999999995, "r": 267.09274, "b": 251.8822, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Schema name of the currently running routine", "bbox": {"l": 281.87164, "t": 243.55724999999995, "r": 464.26022, "b": 251.8822, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "ROUTINE_SPECIFIC_NAME", "bbox": {"l": 70.800018, "t": 262.51757999999995, "r": 188.43991, "b": 270.84253, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "VARCHAR(128)", "bbox": {"l": 202.84441, "t": 262.51757999999995, "r": 267.03693, "b": 270.84253, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "Name of the currently running routine", "bbox": {"l": 281.80682, "t": 262.51757999999995, "r": 430.40045, "b": 270.84253, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "ROUTINE_TYPE", "bbox": {"l": 70.800034, "t": 281.53726, "r": 139.43135, "b": 289.86227, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "CHAR(1)", "bbox": {"l": 202.74635, "t": 281.53726, "r": 239.28996000000004, "b": 289.86227, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Type of the currently running routine", "bbox": {"l": 281.79065, "t": 281.53726, "r": 425.09131, "b": 289.86227, "coord_origin": "TOPLEFT"}}], "children": [{"id": 14, "label": "text", "bbox": {"l": 70.800003, "t": 110.53801999999985, "r": 134.99071, "b": 118.86298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "Global variable", "bbox": {"l": 70.800003, "t": 110.53801999999985, "r": 134.99071, "b": 118.86298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 202.8894, "t": 110.53801999999985, "r": 223.34641, "b": 118.86298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "Type", "bbox": {"l": 202.8894, "t": 110.53801999999985, "r": 223.34641, "b": 118.86298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 281.8248, "t": 110.53801999999985, "r": 331.3428, "b": 118.86298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "Description", "bbox": {"l": 281.8248, "t": 110.53801999999985, "r": 331.3428, "b": 118.86298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 70.800003, "t": 129.49834999999996, "r": 132.7209, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "CLIENT_HOST", "bbox": {"l": 70.800003, "t": 129.49834999999996, "r": 132.7209, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 202.89029, "t": 129.49834999999996, "r": 267.07651, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "VARCHAR(255)", "bbox": {"l": 202.89029, "t": 129.49834999999996, "r": 267.07651, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 281.84732, "t": 129.49834999999996, "r": 510.17548, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "Host name of the current client as returned by the system", "bbox": {"l": 281.84732, "t": 129.49834999999996, "r": 510.17548, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 70.800018, "t": 148.51806999999997, "r": 140.66522, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "CLIENT_IPADDR", "bbox": {"l": 70.800018, "t": 148.51806999999997, "r": 140.66522, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 202.87231, "t": 148.51806999999997, "r": 267.07739, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "VARCHAR(128)", "bbox": {"l": 202.87231, "t": 148.51806999999997, "r": 267.07739, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 281.84549, "t": 148.51806999999997, "r": 509.60583, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "IP address of the current client as returned by the system", "bbox": {"l": 281.84549, "t": 148.51806999999997, "r": 509.60583, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 70.800018, "t": 167.53778, "r": 134.98264, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "CLIENT_PORT ", "bbox": {"l": 70.800018, "t": 167.53778, "r": 134.98264, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 202.90294, "t": 167.53778, "r": 242.80084, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "INTEGER", "bbox": {"l": 202.90294, "t": 167.53778, "r": 242.80084, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 281.79785, "t": 167.53778, "r": 527.59222, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "Port used by the current client to communicate with the server", "bbox": {"l": 281.79785, "t": 167.53778, "r": 527.59222, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 70.800018, "t": 186.5575, "r": 143.50925, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "PACKAGE_NAME", "bbox": {"l": 70.800018, "t": 186.5575, "r": 143.50925, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 202.80576, "t": 186.5575, "r": 267.06937, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "VARCHAR(128)", "bbox": {"l": 202.80576, "t": 186.5575, "r": 267.06937, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 281.85187, "t": 186.5575, "r": 436.57259999999997, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "Name of the currently running package", "bbox": {"l": 281.85187, "t": 186.5575, "r": 436.57259999999997, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 70.800018, "t": 205.51782000000003, "r": 156.01654, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "PACKAGE_SCHEMA", "bbox": {"l": 70.800018, "t": 205.51782000000003, "r": 156.01654, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 202.83545, "t": 205.51782000000003, "r": 267.08646, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "VARCHAR(128)", "bbox": {"l": 202.83545, "t": 205.51782000000003, "r": 267.08646, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 281.87076, "t": 205.51782000000003, "r": 470.44678, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "Schema name of the currently running package", "bbox": {"l": 281.87076, "t": 205.51782000000003, "r": 470.44678, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 70.800018, "t": 224.53754000000004, "r": 157.89932, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "PACKAGE_VERSION", "bbox": {"l": 70.800018, "t": 224.53754000000004, "r": 157.89932, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 202.72472, "t": 224.53754000000004, "r": 261.98254, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "VARCHAR(64)", "bbox": {"l": 202.72472, "t": 224.53754000000004, "r": 261.98254, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 281.74924, "t": 224.53754000000004, "r": 478.8438100000001, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "Version identifier of the currently running package", "bbox": {"l": 281.74924, "t": 224.53754000000004, "r": 478.8438100000001, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 70.800018, "t": 243.55724999999995, "r": 154.41992, "b": 251.8822, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "ROUTINE_SCHEMA", "bbox": {"l": 70.800018, "t": 243.55724999999995, "r": 154.41992, "b": 251.8822, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 202.79312, "t": 243.55724999999995, "r": 267.09274, "b": 251.8822, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "VARCHAR(128)", "bbox": {"l": 202.79312, "t": 243.55724999999995, "r": 267.09274, "b": 251.8822, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 281.87164, "t": 243.55724999999995, "r": 464.26022, "b": 251.8822, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "Schema name of the currently running routine", "bbox": {"l": 281.87164, "t": 243.55724999999995, "r": 464.26022, "b": 251.8822, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 70.800018, "t": 262.51757999999995, "r": 188.43991, "b": 270.84253, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "ROUTINE_SPECIFIC_NAME", "bbox": {"l": 70.800018, "t": 262.51757999999995, "r": 188.43991, "b": 270.84253, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 202.84441, "t": 262.51757999999995, "r": 267.03693, "b": 270.84253, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "VARCHAR(128)", "bbox": {"l": 202.84441, "t": 262.51757999999995, "r": 267.03693, "b": 270.84253, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 281.80682, "t": 262.51757999999995, "r": 430.40045, "b": 270.84253, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "Name of the currently running routine", "bbox": {"l": 281.80682, "t": 262.51757999999995, "r": 430.40045, "b": 270.84253, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 70.800034, "t": 281.53726, "r": 139.43135, "b": 289.86227, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "ROUTINE_TYPE", "bbox": {"l": 70.800034, "t": 281.53726, "r": 139.43135, "b": 289.86227, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 202.74635, "t": 281.53726, "r": 239.28996000000004, "b": 289.86227, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "CHAR(1)", "bbox": {"l": 202.74635, "t": 281.53726, "r": 239.28996000000004, "b": 289.86227, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 281.79065, "t": 281.53726, "r": 425.09131, "b": 289.86227, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "Type of the currently running routine", "bbox": {"l": 281.79065, "t": 281.53726, "r": 425.09131, "b": 289.86227, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl"], "num_rows": 10, "num_cols": 3, "table_cells": [{"bbox": {"l": 70.800003, "t": 110.53801999999985, "r": 134.99071, "b": 118.86298, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Global variable", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 202.8894, "t": 110.53801999999985, "r": 223.34641, "b": 118.86298, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Type", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 281.8248, "t": 110.53801999999985, "r": 331.3428, "b": 118.86298, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Description", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800003, "t": 129.49834999999996, "r": 132.7209, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "CLIENT_HOST", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.89029, "t": 129.49834999999996, "r": 267.07651, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(255)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.84732, "t": 129.49834999999996, "r": 510.17548, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Host name of the current client as returned by the system", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800018, "t": 148.51806999999997, "r": 140.66522, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "CLIENT_IPADDR", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.87231, "t": 148.51806999999997, "r": 267.07739, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(128)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.84549, "t": 148.51806999999997, "r": 509.60583, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "IP address of the current client as returned by the system", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800018, "t": 167.53778, "r": 134.98264, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "CLIENT_PORT", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.90294, "t": 167.53778, "r": 242.80084, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "INTEGER", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.79785, "t": 167.53778, "r": 527.59222, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Port used by the current client to communicate with the server", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800018, "t": 186.5575, "r": 143.50925, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PACKAGE_NAME", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.80576, "t": 186.5575, "r": 267.06937, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(128)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.85187, "t": 186.5575, "r": 436.57259999999997, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Name of the currently running package", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800018, "t": 205.51782000000003, "r": 156.01654, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PACKAGE_SCHEMA", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.83545, "t": 205.51782000000003, "r": 267.08646, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(128)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.87076, "t": 205.51782000000003, "r": 470.44678, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Schema name of the currently running package", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800018, "t": 224.53754000000004, "r": 157.89932, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PACKAGE_VERSION", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.72472, "t": 224.53754000000004, "r": 261.98254, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(64)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.74924, "t": 224.53754000000004, "r": 478.8438100000001, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Version identifier of the currently running package", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800018, "t": 243.55724999999995, "r": 154.41992, "b": 251.8822, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "ROUTINE_SCHEMA", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.79312, "t": 243.55724999999995, "r": 267.09274, "b": 251.8822, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(128)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.87164, "t": 243.55724999999995, "r": 464.26022, "b": 251.8822, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Schema name of the currently running routine", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800018, "t": 262.51757999999995, "r": 188.43991, "b": 270.84253, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "ROUTINE_SPECIFIC_NAME", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.84441, "t": 262.51757999999995, "r": 267.03693, "b": 270.84253, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(128)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.80682, "t": 262.51757999999995, "r": 430.40045, "b": 270.84253, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Name of the currently running routine", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800034, "t": 281.53726, "r": 139.43135, "b": 289.86227, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "ROUTINE_TYPE", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.74635, "t": 281.53726, "r": 239.28996000000004, "b": 289.86227, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "CHAR(1)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.79065, "t": 281.53726, "r": 425.09131, "b": 289.86227, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Type of the currently running routine", "column_header": false, "row_header": false, "row_section": false}]}}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_footer", "id": 9, "page_no": 11, "cluster": {"id": 9, "label": "page_footer", "bbox": {"l": 64.800003, "t": 754.848721, "r": 78.402, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.9187920093536377, "cells": [{"id": 0, "text": "20 ", "bbox": {"l": 64.800003, "t": 754.848721, "r": 78.402, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "20"}, {"label": "page_footer", "id": 6, "page_no": 11, "cluster": {"id": 6, "label": "page_footer", "bbox": {"l": 93.420303, "t": 755.538002, "r": 334.42142, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9505079388618469, "cells": [{"id": 1, "text": "Row and Column Access Control Support in IBM DB2 for i", "bbox": {"l": 93.420303, "t": 755.538002, "r": 334.42142, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Row and Column Access Control Support in IBM DB2 for i"}, {"label": "text", "id": 11, "page_no": 11, "cluster": {"id": 11, "label": "text", "bbox": {"l": 136.8, "t": 71.50867000000005, "r": 342.54773, "b": 80.72167999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.8370978832244873, "cells": [{"id": 2, "text": "Table 3-2 lists the nine built-in global variables.", "bbox": {"l": 136.8, "t": 71.50867000000005, "r": 342.54773, "b": 80.72167999999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 3-2 lists the nine built-in global variables."}, {"label": "caption", "id": 10, "page_no": 11, "cluster": {"id": 10, "label": "caption", "bbox": {"l": 64.800003, "t": 93.49805000000003, "r": 201.18147, "b": 101.82299999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.913235604763031, "cells": [{"id": 3, "text": "Table 3-2 Built-in global variables", "bbox": {"l": 64.800003, "t": 93.49805000000003, "r": 201.18147, "b": 101.82299999999998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 3-2 Built-in global variables"}, {"label": "section_header", "id": 3, "page_no": 11, "cluster": {"id": 3, "label": "section_header", "bbox": {"l": 64.800003, "t": 322.20071, "r": 384.36389, "b": 336.96371000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9645338654518127, "cells": [{"id": 4, "text": "3.3", "bbox": {"l": 64.800003, "t": 322.20071, "r": 87.318192, "b": 336.96371000000005, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "VERIFY_GROUP_FOR_USER function", "bbox": {"l": 91.821815, "t": 322.20071, "r": 384.36389, "b": 336.96371000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3.3 VERIFY_GROUP_FOR_USER function"}, {"label": "text", "id": 1, "page_no": 11, "cluster": {"id": 1, "label": "text", "bbox": {"l": 136.8, "t": 354.52872, "r": 547.23474, "b": 435.74060000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9864333868026733, "cells": [{"id": 6, "text": "The VERIFY_GROUP_FOR_USER function was added in IBM i 7.2. Although it is primarily ", "bbox": {"l": 136.8, "t": 354.52872, "r": 542.83539, "b": 363.7417, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "intended for use with RCAC permissions and masks, it can be used in other SQL statements. ", "bbox": {"l": 136.8, "t": 366.52853, "r": 547.14783, "b": 375.74152, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "The first parameter must be one of these three special registers: SESSION_USER, USER, or ", "bbox": {"l": 136.8, "t": 378.52835, "r": 547.15106, "b": 387.74132999999995, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "CURRENT_USER. The second and subsequent parameters are a list of user or group ", "bbox": {"l": 136.80002, "t": 390.52817, "r": 520.62958, "b": 399.74115000000006, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "profiles. Each of these values must be 1 - 10 characters in length. These values are not ", "bbox": {"l": 136.80002, "t": 402.52798, "r": 524.88824, "b": 411.74097, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "validated for their existence, which means that you can specify the names of user profiles that ", "bbox": {"l": 136.80002, "t": 414.5278, "r": 547.23474, "b": 423.7407799999999, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "do not exist without receiving any kind of error.", "bbox": {"l": 136.80002, "t": 426.52762, "r": 342.04672, "b": 435.74060000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The VERIFY_GROUP_FOR_USER function was added in IBM i 7.2. Although it is primarily intended for use with RCAC permissions and masks, it can be used in other SQL statements. The first parameter must be one of these three special registers: SESSION_USER, USER, or CURRENT_USER. The second and subsequent parameters are a list of user or group profiles. Each of these values must be 1 - 10 characters in length. These values are not validated for their existence, which means that you can specify the names of user profiles that do not exist without receiving any kind of error."}, {"label": "text", "id": 2, "page_no": 11, "cluster": {"id": 2, "label": "text", "bbox": {"l": 136.80002, "t": 448.48743, "r": 547.25739, "b": 481.70004, "coord_origin": "TOPLEFT"}, "confidence": 0.9807308912277222, "cells": [{"id": 13, "text": "If a special register value is in the list of user profiles or it is a member of a group profile ", "bbox": {"l": 136.80002, "t": 448.48743, "r": 525.1474, "b": 457.70041, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "included in the list, the function returns a long integer value of 1. Otherwise, it returns a value ", "bbox": {"l": 136.80002, "t": 460.48724, "r": 547.25739, "b": 469.70023, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "of 0. It never returns the null value.", "bbox": {"l": 136.80002, "t": 472.48706, "r": 289.84335, "b": 481.70004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "If a special register value is in the list of user profiles or it is a member of a group profile included in the list, the function returns a long integer value of 1. Otherwise, it returns a value of 0. It never returns the null value."}, {"label": "text", "id": 8, "page_no": 11, "cluster": {"id": 8, "label": "text", "bbox": {"l": 136.80002, "t": 494.50662, "r": 458.44525000000004, "b": 503.7196, "coord_origin": "TOPLEFT"}, "confidence": 0.9237529635429382, "cells": [{"id": 16, "text": "Here is an example of using the VERIFY_GROUP_FOR_USER function:", "bbox": {"l": 136.80002, "t": 494.50662, "r": 458.44525000000004, "b": 503.7196, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Here is an example of using the VERIFY_GROUP_FOR_USER function:"}, {"label": "list_item", "id": 7, "page_no": 11, "cluster": {"id": 7, "label": "list_item", "bbox": {"l": 136.80002, "t": 511.5462, "r": 406.07751, "b": 520.75919, "coord_origin": "TOPLEFT"}, "confidence": 0.9338629841804504, "cells": [{"id": 17, "text": "1.", "bbox": {"l": 136.80002, "t": 511.5462, "r": 145.09804, "b": 520.75919, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "There are user profiles for MGR, JANE, JUDY, and TONY.", "bbox": {"l": 147.86403, "t": 511.5462, "r": 406.07751, "b": 520.75919, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1. There are user profiles for MGR, JANE, JUDY, and TONY."}, {"label": "list_item", "id": 4, "page_no": 11, "cluster": {"id": 4, "label": "list_item", "bbox": {"l": 136.80002, "t": 528.5260000000001, "r": 396.98816, "b": 537.739, "coord_origin": "TOPLEFT"}, "confidence": 0.9514460563659668, "cells": [{"id": 19, "text": "2.", "bbox": {"l": 136.80002, "t": 528.5260000000001, "r": 145.23297, "b": 537.739, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "The user profile JANE specifies a group profile of MGR.", "bbox": {"l": 148.04396, "t": 528.5260000000001, "r": 396.98816, "b": 537.739, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2. The user profile JANE specifies a group profile of MGR."}, {"label": "list_item", "id": 5, "page_no": 11, "cluster": {"id": 5, "label": "list_item", "bbox": {"l": 136.80002, "t": 545.50581, "r": 536.5686, "b": 566.71861, "coord_origin": "TOPLEFT"}, "confidence": 0.951230525970459, "cells": [{"id": 21, "text": "3.", "bbox": {"l": 136.80002, "t": 545.50581, "r": 145.18951, "b": 554.71881, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "If a user is connected to the server using user profile JANE, all of the following function ", "bbox": {"l": 147.98601, "t": 545.50581, "r": 536.5686, "b": 554.71881, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "invocations return a value of 1:", "bbox": {"l": 151.20018, "t": 557.50562, "r": 286.84641, "b": 566.71861, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3. If a user is connected to the server using user profile JANE, all of the following function invocations return a value of 1:"}, {"label": "code", "id": 12, "page_no": 11, "cluster": {"id": 12, "label": "code", "bbox": {"l": 151.20018, "t": 574.69458, "r": 451.01605, "b": 641.4285600000001, "coord_origin": "TOPLEFT"}, "confidence": 0.7066455483436584, "cells": [{"id": 24, "text": "VERIFY_GROUP_FOR_USER (CURRENT_USER, 'MGR')", "bbox": {"l": 151.20018, "t": 574.69458, "r": 366.05725, "b": 583.46933, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "VERIFY_GROUP_FOR_USER (CURRENT_USER, 'JANE', 'MGR')", "bbox": {"l": 151.20018, "t": 586.69438, "r": 406.01678, "b": 595.46913, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "VERIFY_GROUP_FOR_USER (CURRENT_USER, 'JANE', 'MGR', 'STEVE')", "bbox": {"l": 151.20018, "t": 598.69418, "r": 451.01605, "b": 607.46893, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "The following function invocation returns a value of 0:", "bbox": {"l": 151.20018, "t": 615.5246, "r": 385.87271, "b": 624.73759, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "VERIFY_GROUP_FOR_USER (CURRENT_USER, 'JUDY', 'TONY')", "bbox": {"l": 151.20018, "t": 632.65381, "r": 411.05655, "b": 641.4285600000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "VERIFY_GROUP_FOR_USER (CURRENT_USER, 'MGR') VERIFY_GROUP_FOR_USER (CURRENT_USER, 'JANE', 'MGR') VERIFY_GROUP_FOR_USER (CURRENT_USER, 'JANE', 'MGR', 'STEVE') The following function invocation returns a value of 0: VERIFY_GROUP_FOR_USER (CURRENT_USER, 'JUDY', 'TONY')"}, {"label": "table", "id": 0, "page_no": 11, "cluster": {"id": 0, "label": "table", "bbox": {"l": 63.55636978149414, "t": 104.23387145996094, "r": 548.5687255859375, "b": 296.22467041015625, "coord_origin": "TOPLEFT"}, "confidence": 0.9868634939193726, "cells": [{"id": 29, "text": "Global variable", "bbox": {"l": 70.800003, "t": 110.53801999999985, "r": 134.99071, "b": 118.86298, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Type", "bbox": {"l": 202.8894, "t": 110.53801999999985, "r": 223.34641, "b": 118.86298, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Description", "bbox": {"l": 281.8248, "t": 110.53801999999985, "r": 331.3428, "b": 118.86298, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "CLIENT_HOST", "bbox": {"l": 70.800003, "t": 129.49834999999996, "r": 132.7209, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "VARCHAR(255)", "bbox": {"l": 202.89029, "t": 129.49834999999996, "r": 267.07651, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Host name of the current client as returned by the system", "bbox": {"l": 281.84732, "t": 129.49834999999996, "r": 510.17548, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "CLIENT_IPADDR", "bbox": {"l": 70.800018, "t": 148.51806999999997, "r": 140.66522, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "VARCHAR(128)", "bbox": {"l": 202.87231, "t": 148.51806999999997, "r": 267.07739, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "IP address of the current client as returned by the system", "bbox": {"l": 281.84549, "t": 148.51806999999997, "r": 509.60583, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "CLIENT_PORT ", "bbox": {"l": 70.800018, "t": 167.53778, "r": 134.98264, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "INTEGER", "bbox": {"l": 202.90294, "t": 167.53778, "r": 242.80084, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "Port used by the current client to communicate with the server", "bbox": {"l": 281.79785, "t": 167.53778, "r": 527.59222, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "PACKAGE_NAME", "bbox": {"l": 70.800018, "t": 186.5575, "r": 143.50925, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "VARCHAR(128)", "bbox": {"l": 202.80576, "t": 186.5575, "r": 267.06937, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Name of the currently running package", "bbox": {"l": 281.85187, "t": 186.5575, "r": 436.57259999999997, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "PACKAGE_SCHEMA", "bbox": {"l": 70.800018, "t": 205.51782000000003, "r": 156.01654, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "VARCHAR(128)", "bbox": {"l": 202.83545, "t": 205.51782000000003, "r": 267.08646, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "Schema name of the currently running package", "bbox": {"l": 281.87076, "t": 205.51782000000003, "r": 470.44678, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "PACKAGE_VERSION", "bbox": {"l": 70.800018, "t": 224.53754000000004, "r": 157.89932, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "VARCHAR(64)", "bbox": {"l": 202.72472, "t": 224.53754000000004, "r": 261.98254, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "Version identifier of the currently running package", "bbox": {"l": 281.74924, "t": 224.53754000000004, "r": 478.8438100000001, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "ROUTINE_SCHEMA", "bbox": {"l": 70.800018, "t": 243.55724999999995, "r": 154.41992, "b": 251.8822, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "VARCHAR(128)", "bbox": {"l": 202.79312, "t": 243.55724999999995, "r": 267.09274, "b": 251.8822, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Schema name of the currently running routine", "bbox": {"l": 281.87164, "t": 243.55724999999995, "r": 464.26022, "b": 251.8822, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "ROUTINE_SPECIFIC_NAME", "bbox": {"l": 70.800018, "t": 262.51757999999995, "r": 188.43991, "b": 270.84253, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "VARCHAR(128)", "bbox": {"l": 202.84441, "t": 262.51757999999995, "r": 267.03693, "b": 270.84253, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "Name of the currently running routine", "bbox": {"l": 281.80682, "t": 262.51757999999995, "r": 430.40045, "b": 270.84253, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "ROUTINE_TYPE", "bbox": {"l": 70.800034, "t": 281.53726, "r": 139.43135, "b": 289.86227, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "CHAR(1)", "bbox": {"l": 202.74635, "t": 281.53726, "r": 239.28996000000004, "b": 289.86227, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Type of the currently running routine", "bbox": {"l": 281.79065, "t": 281.53726, "r": 425.09131, "b": 289.86227, "coord_origin": "TOPLEFT"}}], "children": [{"id": 14, "label": "text", "bbox": {"l": 70.800003, "t": 110.53801999999985, "r": 134.99071, "b": 118.86298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "Global variable", "bbox": {"l": 70.800003, "t": 110.53801999999985, "r": 134.99071, "b": 118.86298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 202.8894, "t": 110.53801999999985, "r": 223.34641, "b": 118.86298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "Type", "bbox": {"l": 202.8894, "t": 110.53801999999985, "r": 223.34641, "b": 118.86298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 281.8248, "t": 110.53801999999985, "r": 331.3428, "b": 118.86298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "Description", "bbox": {"l": 281.8248, "t": 110.53801999999985, "r": 331.3428, "b": 118.86298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 70.800003, "t": 129.49834999999996, "r": 132.7209, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "CLIENT_HOST", "bbox": {"l": 70.800003, "t": 129.49834999999996, "r": 132.7209, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 202.89029, "t": 129.49834999999996, "r": 267.07651, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "VARCHAR(255)", "bbox": {"l": 202.89029, "t": 129.49834999999996, "r": 267.07651, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 281.84732, "t": 129.49834999999996, "r": 510.17548, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "Host name of the current client as returned by the system", "bbox": {"l": 281.84732, "t": 129.49834999999996, "r": 510.17548, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 70.800018, "t": 148.51806999999997, "r": 140.66522, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "CLIENT_IPADDR", "bbox": {"l": 70.800018, "t": 148.51806999999997, "r": 140.66522, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 202.87231, "t": 148.51806999999997, "r": 267.07739, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "VARCHAR(128)", "bbox": {"l": 202.87231, "t": 148.51806999999997, "r": 267.07739, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 281.84549, "t": 148.51806999999997, "r": 509.60583, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "IP address of the current client as returned by the system", "bbox": {"l": 281.84549, "t": 148.51806999999997, "r": 509.60583, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 70.800018, "t": 167.53778, "r": 134.98264, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "CLIENT_PORT ", "bbox": {"l": 70.800018, "t": 167.53778, "r": 134.98264, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 202.90294, "t": 167.53778, "r": 242.80084, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "INTEGER", "bbox": {"l": 202.90294, "t": 167.53778, "r": 242.80084, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 281.79785, "t": 167.53778, "r": 527.59222, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "Port used by the current client to communicate with the server", "bbox": {"l": 281.79785, "t": 167.53778, "r": 527.59222, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 70.800018, "t": 186.5575, "r": 143.50925, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "PACKAGE_NAME", "bbox": {"l": 70.800018, "t": 186.5575, "r": 143.50925, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 202.80576, "t": 186.5575, "r": 267.06937, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "VARCHAR(128)", "bbox": {"l": 202.80576, "t": 186.5575, "r": 267.06937, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 281.85187, "t": 186.5575, "r": 436.57259999999997, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "Name of the currently running package", "bbox": {"l": 281.85187, "t": 186.5575, "r": 436.57259999999997, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 70.800018, "t": 205.51782000000003, "r": 156.01654, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "PACKAGE_SCHEMA", "bbox": {"l": 70.800018, "t": 205.51782000000003, "r": 156.01654, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 202.83545, "t": 205.51782000000003, "r": 267.08646, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "VARCHAR(128)", "bbox": {"l": 202.83545, "t": 205.51782000000003, "r": 267.08646, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 281.87076, "t": 205.51782000000003, "r": 470.44678, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "Schema name of the currently running package", "bbox": {"l": 281.87076, "t": 205.51782000000003, "r": 470.44678, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 70.800018, "t": 224.53754000000004, "r": 157.89932, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "PACKAGE_VERSION", "bbox": {"l": 70.800018, "t": 224.53754000000004, "r": 157.89932, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 202.72472, "t": 224.53754000000004, "r": 261.98254, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "VARCHAR(64)", "bbox": {"l": 202.72472, "t": 224.53754000000004, "r": 261.98254, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 281.74924, "t": 224.53754000000004, "r": 478.8438100000001, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "Version identifier of the currently running package", "bbox": {"l": 281.74924, "t": 224.53754000000004, "r": 478.8438100000001, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 70.800018, "t": 243.55724999999995, "r": 154.41992, "b": 251.8822, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "ROUTINE_SCHEMA", "bbox": {"l": 70.800018, "t": 243.55724999999995, "r": 154.41992, "b": 251.8822, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 202.79312, "t": 243.55724999999995, "r": 267.09274, "b": 251.8822, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "VARCHAR(128)", "bbox": {"l": 202.79312, "t": 243.55724999999995, "r": 267.09274, "b": 251.8822, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 281.87164, "t": 243.55724999999995, "r": 464.26022, "b": 251.8822, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "Schema name of the currently running routine", "bbox": {"l": 281.87164, "t": 243.55724999999995, "r": 464.26022, "b": 251.8822, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 70.800018, "t": 262.51757999999995, "r": 188.43991, "b": 270.84253, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "ROUTINE_SPECIFIC_NAME", "bbox": {"l": 70.800018, "t": 262.51757999999995, "r": 188.43991, "b": 270.84253, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 202.84441, "t": 262.51757999999995, "r": 267.03693, "b": 270.84253, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "VARCHAR(128)", "bbox": {"l": 202.84441, "t": 262.51757999999995, "r": 267.03693, "b": 270.84253, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 281.80682, "t": 262.51757999999995, "r": 430.40045, "b": 270.84253, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "Name of the currently running routine", "bbox": {"l": 281.80682, "t": 262.51757999999995, "r": 430.40045, "b": 270.84253, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 70.800034, "t": 281.53726, "r": 139.43135, "b": 289.86227, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "ROUTINE_TYPE", "bbox": {"l": 70.800034, "t": 281.53726, "r": 139.43135, "b": 289.86227, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 202.74635, "t": 281.53726, "r": 239.28996000000004, "b": 289.86227, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "CHAR(1)", "bbox": {"l": 202.74635, "t": 281.53726, "r": 239.28996000000004, "b": 289.86227, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 281.79065, "t": 281.53726, "r": 425.09131, "b": 289.86227, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "Type of the currently running routine", "bbox": {"l": 281.79065, "t": 281.53726, "r": 425.09131, "b": 289.86227, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl"], "num_rows": 10, "num_cols": 3, "table_cells": [{"bbox": {"l": 70.800003, "t": 110.53801999999985, "r": 134.99071, "b": 118.86298, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Global variable", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 202.8894, "t": 110.53801999999985, "r": 223.34641, "b": 118.86298, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Type", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 281.8248, "t": 110.53801999999985, "r": 331.3428, "b": 118.86298, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Description", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800003, "t": 129.49834999999996, "r": 132.7209, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "CLIENT_HOST", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.89029, "t": 129.49834999999996, "r": 267.07651, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(255)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.84732, "t": 129.49834999999996, "r": 510.17548, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Host name of the current client as returned by the system", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800018, "t": 148.51806999999997, "r": 140.66522, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "CLIENT_IPADDR", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.87231, "t": 148.51806999999997, "r": 267.07739, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(128)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.84549, "t": 148.51806999999997, "r": 509.60583, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "IP address of the current client as returned by the system", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800018, "t": 167.53778, "r": 134.98264, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "CLIENT_PORT", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.90294, "t": 167.53778, "r": 242.80084, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "INTEGER", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.79785, "t": 167.53778, "r": 527.59222, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Port used by the current client to communicate with the server", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800018, "t": 186.5575, "r": 143.50925, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PACKAGE_NAME", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.80576, "t": 186.5575, "r": 267.06937, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(128)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.85187, "t": 186.5575, "r": 436.57259999999997, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Name of the currently running package", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800018, "t": 205.51782000000003, "r": 156.01654, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PACKAGE_SCHEMA", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.83545, "t": 205.51782000000003, "r": 267.08646, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(128)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.87076, "t": 205.51782000000003, "r": 470.44678, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Schema name of the currently running package", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800018, "t": 224.53754000000004, "r": 157.89932, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PACKAGE_VERSION", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.72472, "t": 224.53754000000004, "r": 261.98254, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(64)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.74924, "t": 224.53754000000004, "r": 478.8438100000001, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Version identifier of the currently running package", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800018, "t": 243.55724999999995, "r": 154.41992, "b": 251.8822, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "ROUTINE_SCHEMA", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.79312, "t": 243.55724999999995, "r": 267.09274, "b": 251.8822, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(128)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.87164, "t": 243.55724999999995, "r": 464.26022, "b": 251.8822, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Schema name of the currently running routine", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800018, "t": 262.51757999999995, "r": 188.43991, "b": 270.84253, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "ROUTINE_SPECIFIC_NAME", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.84441, "t": 262.51757999999995, "r": 267.03693, "b": 270.84253, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(128)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.80682, "t": 262.51757999999995, "r": 430.40045, "b": 270.84253, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Name of the currently running routine", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800034, "t": 281.53726, "r": 139.43135, "b": 289.86227, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "ROUTINE_TYPE", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.74635, "t": 281.53726, "r": 239.28996000000004, "b": 289.86227, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "CHAR(1)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.79065, "t": 281.53726, "r": 425.09131, "b": 289.86227, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Type of the currently running routine", "column_header": false, "row_header": false, "row_section": false}]}], "body": [{"label": "text", "id": 11, "page_no": 11, "cluster": {"id": 11, "label": "text", "bbox": {"l": 136.8, "t": 71.50867000000005, "r": 342.54773, "b": 80.72167999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.8370978832244873, "cells": [{"id": 2, "text": "Table 3-2 lists the nine built-in global variables.", "bbox": {"l": 136.8, "t": 71.50867000000005, "r": 342.54773, "b": 80.72167999999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 3-2 lists the nine built-in global variables."}, {"label": "caption", "id": 10, "page_no": 11, "cluster": {"id": 10, "label": "caption", "bbox": {"l": 64.800003, "t": 93.49805000000003, "r": 201.18147, "b": 101.82299999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.913235604763031, "cells": [{"id": 3, "text": "Table 3-2 Built-in global variables", "bbox": {"l": 64.800003, "t": 93.49805000000003, "r": 201.18147, "b": 101.82299999999998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Table 3-2 Built-in global variables"}, {"label": "section_header", "id": 3, "page_no": 11, "cluster": {"id": 3, "label": "section_header", "bbox": {"l": 64.800003, "t": 322.20071, "r": 384.36389, "b": 336.96371000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9645338654518127, "cells": [{"id": 4, "text": "3.3", "bbox": {"l": 64.800003, "t": 322.20071, "r": 87.318192, "b": 336.96371000000005, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "VERIFY_GROUP_FOR_USER function", "bbox": {"l": 91.821815, "t": 322.20071, "r": 384.36389, "b": 336.96371000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3.3 VERIFY_GROUP_FOR_USER function"}, {"label": "text", "id": 1, "page_no": 11, "cluster": {"id": 1, "label": "text", "bbox": {"l": 136.8, "t": 354.52872, "r": 547.23474, "b": 435.74060000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9864333868026733, "cells": [{"id": 6, "text": "The VERIFY_GROUP_FOR_USER function was added in IBM i 7.2. Although it is primarily ", "bbox": {"l": 136.8, "t": 354.52872, "r": 542.83539, "b": 363.7417, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "intended for use with RCAC permissions and masks, it can be used in other SQL statements. ", "bbox": {"l": 136.8, "t": 366.52853, "r": 547.14783, "b": 375.74152, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "The first parameter must be one of these three special registers: SESSION_USER, USER, or ", "bbox": {"l": 136.8, "t": 378.52835, "r": 547.15106, "b": 387.74132999999995, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "CURRENT_USER. The second and subsequent parameters are a list of user or group ", "bbox": {"l": 136.80002, "t": 390.52817, "r": 520.62958, "b": 399.74115000000006, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "profiles. Each of these values must be 1 - 10 characters in length. These values are not ", "bbox": {"l": 136.80002, "t": 402.52798, "r": 524.88824, "b": 411.74097, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "validated for their existence, which means that you can specify the names of user profiles that ", "bbox": {"l": 136.80002, "t": 414.5278, "r": 547.23474, "b": 423.7407799999999, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "do not exist without receiving any kind of error.", "bbox": {"l": 136.80002, "t": 426.52762, "r": 342.04672, "b": 435.74060000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "The VERIFY_GROUP_FOR_USER function was added in IBM i 7.2. Although it is primarily intended for use with RCAC permissions and masks, it can be used in other SQL statements. The first parameter must be one of these three special registers: SESSION_USER, USER, or CURRENT_USER. The second and subsequent parameters are a list of user or group profiles. Each of these values must be 1 - 10 characters in length. These values are not validated for their existence, which means that you can specify the names of user profiles that do not exist without receiving any kind of error."}, {"label": "text", "id": 2, "page_no": 11, "cluster": {"id": 2, "label": "text", "bbox": {"l": 136.80002, "t": 448.48743, "r": 547.25739, "b": 481.70004, "coord_origin": "TOPLEFT"}, "confidence": 0.9807308912277222, "cells": [{"id": 13, "text": "If a special register value is in the list of user profiles or it is a member of a group profile ", "bbox": {"l": 136.80002, "t": 448.48743, "r": 525.1474, "b": 457.70041, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "included in the list, the function returns a long integer value of 1. Otherwise, it returns a value ", "bbox": {"l": 136.80002, "t": 460.48724, "r": 547.25739, "b": 469.70023, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "of 0. It never returns the null value.", "bbox": {"l": 136.80002, "t": 472.48706, "r": 289.84335, "b": 481.70004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "If a special register value is in the list of user profiles or it is a member of a group profile included in the list, the function returns a long integer value of 1. Otherwise, it returns a value of 0. It never returns the null value."}, {"label": "text", "id": 8, "page_no": 11, "cluster": {"id": 8, "label": "text", "bbox": {"l": 136.80002, "t": 494.50662, "r": 458.44525000000004, "b": 503.7196, "coord_origin": "TOPLEFT"}, "confidence": 0.9237529635429382, "cells": [{"id": 16, "text": "Here is an example of using the VERIFY_GROUP_FOR_USER function:", "bbox": {"l": 136.80002, "t": 494.50662, "r": 458.44525000000004, "b": 503.7196, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Here is an example of using the VERIFY_GROUP_FOR_USER function:"}, {"label": "list_item", "id": 7, "page_no": 11, "cluster": {"id": 7, "label": "list_item", "bbox": {"l": 136.80002, "t": 511.5462, "r": 406.07751, "b": 520.75919, "coord_origin": "TOPLEFT"}, "confidence": 0.9338629841804504, "cells": [{"id": 17, "text": "1.", "bbox": {"l": 136.80002, "t": 511.5462, "r": 145.09804, "b": 520.75919, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "There are user profiles for MGR, JANE, JUDY, and TONY.", "bbox": {"l": 147.86403, "t": 511.5462, "r": 406.07751, "b": 520.75919, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1. There are user profiles for MGR, JANE, JUDY, and TONY."}, {"label": "list_item", "id": 4, "page_no": 11, "cluster": {"id": 4, "label": "list_item", "bbox": {"l": 136.80002, "t": 528.5260000000001, "r": 396.98816, "b": 537.739, "coord_origin": "TOPLEFT"}, "confidence": 0.9514460563659668, "cells": [{"id": 19, "text": "2.", "bbox": {"l": 136.80002, "t": 528.5260000000001, "r": 145.23297, "b": 537.739, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "The user profile JANE specifies a group profile of MGR.", "bbox": {"l": 148.04396, "t": 528.5260000000001, "r": 396.98816, "b": 537.739, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2. The user profile JANE specifies a group profile of MGR."}, {"label": "list_item", "id": 5, "page_no": 11, "cluster": {"id": 5, "label": "list_item", "bbox": {"l": 136.80002, "t": 545.50581, "r": 536.5686, "b": 566.71861, "coord_origin": "TOPLEFT"}, "confidence": 0.951230525970459, "cells": [{"id": 21, "text": "3.", "bbox": {"l": 136.80002, "t": 545.50581, "r": 145.18951, "b": 554.71881, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "If a user is connected to the server using user profile JANE, all of the following function ", "bbox": {"l": 147.98601, "t": 545.50581, "r": 536.5686, "b": 554.71881, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "invocations return a value of 1:", "bbox": {"l": 151.20018, "t": 557.50562, "r": 286.84641, "b": 566.71861, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3. If a user is connected to the server using user profile JANE, all of the following function invocations return a value of 1:"}, {"label": "code", "id": 12, "page_no": 11, "cluster": {"id": 12, "label": "code", "bbox": {"l": 151.20018, "t": 574.69458, "r": 451.01605, "b": 641.4285600000001, "coord_origin": "TOPLEFT"}, "confidence": 0.7066455483436584, "cells": [{"id": 24, "text": "VERIFY_GROUP_FOR_USER (CURRENT_USER, 'MGR')", "bbox": {"l": 151.20018, "t": 574.69458, "r": 366.05725, "b": 583.46933, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "VERIFY_GROUP_FOR_USER (CURRENT_USER, 'JANE', 'MGR')", "bbox": {"l": 151.20018, "t": 586.69438, "r": 406.01678, "b": 595.46913, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "VERIFY_GROUP_FOR_USER (CURRENT_USER, 'JANE', 'MGR', 'STEVE')", "bbox": {"l": 151.20018, "t": 598.69418, "r": 451.01605, "b": 607.46893, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "The following function invocation returns a value of 0:", "bbox": {"l": 151.20018, "t": 615.5246, "r": 385.87271, "b": 624.73759, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "VERIFY_GROUP_FOR_USER (CURRENT_USER, 'JUDY', 'TONY')", "bbox": {"l": 151.20018, "t": 632.65381, "r": 411.05655, "b": 641.4285600000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "VERIFY_GROUP_FOR_USER (CURRENT_USER, 'MGR') VERIFY_GROUP_FOR_USER (CURRENT_USER, 'JANE', 'MGR') VERIFY_GROUP_FOR_USER (CURRENT_USER, 'JANE', 'MGR', 'STEVE') The following function invocation returns a value of 0: VERIFY_GROUP_FOR_USER (CURRENT_USER, 'JUDY', 'TONY')"}, {"label": "table", "id": 0, "page_no": 11, "cluster": {"id": 0, "label": "table", "bbox": {"l": 63.55636978149414, "t": 104.23387145996094, "r": 548.5687255859375, "b": 296.22467041015625, "coord_origin": "TOPLEFT"}, "confidence": 0.9868634939193726, "cells": [{"id": 29, "text": "Global variable", "bbox": {"l": 70.800003, "t": 110.53801999999985, "r": 134.99071, "b": 118.86298, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "Type", "bbox": {"l": 202.8894, "t": 110.53801999999985, "r": 223.34641, "b": 118.86298, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Description", "bbox": {"l": 281.8248, "t": 110.53801999999985, "r": 331.3428, "b": 118.86298, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "CLIENT_HOST", "bbox": {"l": 70.800003, "t": 129.49834999999996, "r": 132.7209, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "VARCHAR(255)", "bbox": {"l": 202.89029, "t": 129.49834999999996, "r": 267.07651, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Host name of the current client as returned by the system", "bbox": {"l": 281.84732, "t": 129.49834999999996, "r": 510.17548, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "CLIENT_IPADDR", "bbox": {"l": 70.800018, "t": 148.51806999999997, "r": 140.66522, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "VARCHAR(128)", "bbox": {"l": 202.87231, "t": 148.51806999999997, "r": 267.07739, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "IP address of the current client as returned by the system", "bbox": {"l": 281.84549, "t": 148.51806999999997, "r": 509.60583, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "CLIENT_PORT ", "bbox": {"l": 70.800018, "t": 167.53778, "r": 134.98264, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "INTEGER", "bbox": {"l": 202.90294, "t": 167.53778, "r": 242.80084, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "Port used by the current client to communicate with the server", "bbox": {"l": 281.79785, "t": 167.53778, "r": 527.59222, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "PACKAGE_NAME", "bbox": {"l": 70.800018, "t": 186.5575, "r": 143.50925, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "VARCHAR(128)", "bbox": {"l": 202.80576, "t": 186.5575, "r": 267.06937, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "Name of the currently running package", "bbox": {"l": 281.85187, "t": 186.5575, "r": 436.57259999999997, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "PACKAGE_SCHEMA", "bbox": {"l": 70.800018, "t": 205.51782000000003, "r": 156.01654, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "VARCHAR(128)", "bbox": {"l": 202.83545, "t": 205.51782000000003, "r": 267.08646, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "Schema name of the currently running package", "bbox": {"l": 281.87076, "t": 205.51782000000003, "r": 470.44678, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "PACKAGE_VERSION", "bbox": {"l": 70.800018, "t": 224.53754000000004, "r": 157.89932, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "VARCHAR(64)", "bbox": {"l": 202.72472, "t": 224.53754000000004, "r": 261.98254, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "Version identifier of the currently running package", "bbox": {"l": 281.74924, "t": 224.53754000000004, "r": 478.8438100000001, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "ROUTINE_SCHEMA", "bbox": {"l": 70.800018, "t": 243.55724999999995, "r": 154.41992, "b": 251.8822, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "VARCHAR(128)", "bbox": {"l": 202.79312, "t": 243.55724999999995, "r": 267.09274, "b": 251.8822, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "Schema name of the currently running routine", "bbox": {"l": 281.87164, "t": 243.55724999999995, "r": 464.26022, "b": 251.8822, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "ROUTINE_SPECIFIC_NAME", "bbox": {"l": 70.800018, "t": 262.51757999999995, "r": 188.43991, "b": 270.84253, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "VARCHAR(128)", "bbox": {"l": 202.84441, "t": 262.51757999999995, "r": 267.03693, "b": 270.84253, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "Name of the currently running routine", "bbox": {"l": 281.80682, "t": 262.51757999999995, "r": 430.40045, "b": 270.84253, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "ROUTINE_TYPE", "bbox": {"l": 70.800034, "t": 281.53726, "r": 139.43135, "b": 289.86227, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "CHAR(1)", "bbox": {"l": 202.74635, "t": 281.53726, "r": 239.28996000000004, "b": 289.86227, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "Type of the currently running routine", "bbox": {"l": 281.79065, "t": 281.53726, "r": 425.09131, "b": 289.86227, "coord_origin": "TOPLEFT"}}], "children": [{"id": 14, "label": "text", "bbox": {"l": 70.800003, "t": 110.53801999999985, "r": 134.99071, "b": 118.86298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 29, "text": "Global variable", "bbox": {"l": 70.800003, "t": 110.53801999999985, "r": 134.99071, "b": 118.86298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 202.8894, "t": 110.53801999999985, "r": 223.34641, "b": 118.86298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 30, "text": "Type", "bbox": {"l": 202.8894, "t": 110.53801999999985, "r": 223.34641, "b": 118.86298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 281.8248, "t": 110.53801999999985, "r": 331.3428, "b": 118.86298, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 31, "text": "Description", "bbox": {"l": 281.8248, "t": 110.53801999999985, "r": 331.3428, "b": 118.86298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 70.800003, "t": 129.49834999999996, "r": 132.7209, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 32, "text": "CLIENT_HOST", "bbox": {"l": 70.800003, "t": 129.49834999999996, "r": 132.7209, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 202.89029, "t": 129.49834999999996, "r": 267.07651, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 33, "text": "VARCHAR(255)", "bbox": {"l": 202.89029, "t": 129.49834999999996, "r": 267.07651, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 281.84732, "t": 129.49834999999996, "r": 510.17548, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 34, "text": "Host name of the current client as returned by the system", "bbox": {"l": 281.84732, "t": 129.49834999999996, "r": 510.17548, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 70.800018, "t": 148.51806999999997, "r": 140.66522, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 35, "text": "CLIENT_IPADDR", "bbox": {"l": 70.800018, "t": 148.51806999999997, "r": 140.66522, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 202.87231, "t": 148.51806999999997, "r": 267.07739, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 36, "text": "VARCHAR(128)", "bbox": {"l": 202.87231, "t": 148.51806999999997, "r": 267.07739, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 281.84549, "t": 148.51806999999997, "r": 509.60583, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 37, "text": "IP address of the current client as returned by the system", "bbox": {"l": 281.84549, "t": 148.51806999999997, "r": 509.60583, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 23, "label": "text", "bbox": {"l": 70.800018, "t": 167.53778, "r": 134.98264, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 38, "text": "CLIENT_PORT ", "bbox": {"l": 70.800018, "t": 167.53778, "r": 134.98264, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 202.90294, "t": 167.53778, "r": 242.80084, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 39, "text": "INTEGER", "bbox": {"l": 202.90294, "t": 167.53778, "r": 242.80084, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 25, "label": "text", "bbox": {"l": 281.79785, "t": 167.53778, "r": 527.59222, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 40, "text": "Port used by the current client to communicate with the server", "bbox": {"l": 281.79785, "t": 167.53778, "r": 527.59222, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 70.800018, "t": 186.5575, "r": 143.50925, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 41, "text": "PACKAGE_NAME", "bbox": {"l": 70.800018, "t": 186.5575, "r": 143.50925, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "text", "bbox": {"l": 202.80576, "t": 186.5575, "r": 267.06937, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 42, "text": "VARCHAR(128)", "bbox": {"l": 202.80576, "t": 186.5575, "r": 267.06937, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 28, "label": "text", "bbox": {"l": 281.85187, "t": 186.5575, "r": 436.57259999999997, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 43, "text": "Name of the currently running package", "bbox": {"l": 281.85187, "t": 186.5575, "r": 436.57259999999997, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 29, "label": "text", "bbox": {"l": 70.800018, "t": 205.51782000000003, "r": 156.01654, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 44, "text": "PACKAGE_SCHEMA", "bbox": {"l": 70.800018, "t": 205.51782000000003, "r": 156.01654, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 202.83545, "t": 205.51782000000003, "r": 267.08646, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 45, "text": "VARCHAR(128)", "bbox": {"l": 202.83545, "t": 205.51782000000003, "r": 267.08646, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 31, "label": "text", "bbox": {"l": 281.87076, "t": 205.51782000000003, "r": 470.44678, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 46, "text": "Schema name of the currently running package", "bbox": {"l": 281.87076, "t": 205.51782000000003, "r": 470.44678, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 32, "label": "text", "bbox": {"l": 70.800018, "t": 224.53754000000004, "r": 157.89932, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 47, "text": "PACKAGE_VERSION", "bbox": {"l": 70.800018, "t": 224.53754000000004, "r": 157.89932, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "text", "bbox": {"l": 202.72472, "t": 224.53754000000004, "r": 261.98254, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 48, "text": "VARCHAR(64)", "bbox": {"l": 202.72472, "t": 224.53754000000004, "r": 261.98254, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 34, "label": "text", "bbox": {"l": 281.74924, "t": 224.53754000000004, "r": 478.8438100000001, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "Version identifier of the currently running package", "bbox": {"l": 281.74924, "t": 224.53754000000004, "r": 478.8438100000001, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 35, "label": "text", "bbox": {"l": 70.800018, "t": 243.55724999999995, "r": 154.41992, "b": 251.8822, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 50, "text": "ROUTINE_SCHEMA", "bbox": {"l": 70.800018, "t": 243.55724999999995, "r": 154.41992, "b": 251.8822, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 36, "label": "text", "bbox": {"l": 202.79312, "t": 243.55724999999995, "r": 267.09274, "b": 251.8822, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 51, "text": "VARCHAR(128)", "bbox": {"l": 202.79312, "t": 243.55724999999995, "r": 267.09274, "b": 251.8822, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 37, "label": "text", "bbox": {"l": 281.87164, "t": 243.55724999999995, "r": 464.26022, "b": 251.8822, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 52, "text": "Schema name of the currently running routine", "bbox": {"l": 281.87164, "t": 243.55724999999995, "r": 464.26022, "b": 251.8822, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "text", "bbox": {"l": 70.800018, "t": 262.51757999999995, "r": 188.43991, "b": 270.84253, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 53, "text": "ROUTINE_SPECIFIC_NAME", "bbox": {"l": 70.800018, "t": 262.51757999999995, "r": 188.43991, "b": 270.84253, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "text", "bbox": {"l": 202.84441, "t": 262.51757999999995, "r": 267.03693, "b": 270.84253, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 54, "text": "VARCHAR(128)", "bbox": {"l": 202.84441, "t": 262.51757999999995, "r": 267.03693, "b": 270.84253, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 40, "label": "text", "bbox": {"l": 281.80682, "t": 262.51757999999995, "r": 430.40045, "b": 270.84253, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 55, "text": "Name of the currently running routine", "bbox": {"l": 281.80682, "t": 262.51757999999995, "r": 430.40045, "b": 270.84253, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 41, "label": "text", "bbox": {"l": 70.800034, "t": 281.53726, "r": 139.43135, "b": 289.86227, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 56, "text": "ROUTINE_TYPE", "bbox": {"l": 70.800034, "t": 281.53726, "r": 139.43135, "b": 289.86227, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "text", "bbox": {"l": 202.74635, "t": 281.53726, "r": 239.28996000000004, "b": 289.86227, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 57, "text": "CHAR(1)", "bbox": {"l": 202.74635, "t": 281.53726, "r": 239.28996000000004, "b": 289.86227, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 43, "label": "text", "bbox": {"l": 281.79065, "t": 281.53726, "r": 425.09131, "b": 289.86227, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 58, "text": "Type of the currently running routine", "bbox": {"l": 281.79065, "t": 281.53726, "r": 425.09131, "b": 289.86227, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null, "otsl_seq": ["ched", "ched", "ched", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl", "fcel", "fcel", "fcel", "nl"], "num_rows": 10, "num_cols": 3, "table_cells": [{"bbox": {"l": 70.800003, "t": 110.53801999999985, "r": 134.99071, "b": 118.86298, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "Global variable", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 202.8894, "t": 110.53801999999985, "r": 223.34641, "b": 118.86298, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "Type", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 281.8248, "t": 110.53801999999985, "r": 331.3428, "b": 118.86298, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 0, "end_row_offset_idx": 1, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Description", "column_header": true, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800003, "t": 129.49834999999996, "r": 132.7209, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "CLIENT_HOST", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.89029, "t": 129.49834999999996, "r": 267.07651, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(255)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.84732, "t": 129.49834999999996, "r": 510.17548, "b": 137.82330000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 1, "end_row_offset_idx": 2, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Host name of the current client as returned by the system", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800018, "t": 148.51806999999997, "r": 140.66522, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "CLIENT_IPADDR", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.87231, "t": 148.51806999999997, "r": 267.07739, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(128)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.84549, "t": 148.51806999999997, "r": 509.60583, "b": 156.84302000000002, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 2, "end_row_offset_idx": 3, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "IP address of the current client as returned by the system", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800018, "t": 167.53778, "r": 134.98264, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "CLIENT_PORT", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.90294, "t": 167.53778, "r": 242.80084, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "INTEGER", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.79785, "t": 167.53778, "r": 527.59222, "b": 175.86273000000006, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 3, "end_row_offset_idx": 4, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Port used by the current client to communicate with the server", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800018, "t": 186.5575, "r": 143.50925, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PACKAGE_NAME", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.80576, "t": 186.5575, "r": 267.06937, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(128)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.85187, "t": 186.5575, "r": 436.57259999999997, "b": 194.88244999999995, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 4, "end_row_offset_idx": 5, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Name of the currently running package", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800018, "t": 205.51782000000003, "r": 156.01654, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PACKAGE_SCHEMA", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.83545, "t": 205.51782000000003, "r": 267.08646, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(128)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.87076, "t": 205.51782000000003, "r": 470.44678, "b": 213.84276999999997, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 5, "end_row_offset_idx": 6, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Schema name of the currently running package", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800018, "t": 224.53754000000004, "r": 157.89932, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "PACKAGE_VERSION", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.72472, "t": 224.53754000000004, "r": 261.98254, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(64)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.74924, "t": 224.53754000000004, "r": 478.8438100000001, "b": 232.86248999999998, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 6, "end_row_offset_idx": 7, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Version identifier of the currently running package", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800018, "t": 243.55724999999995, "r": 154.41992, "b": 251.8822, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "ROUTINE_SCHEMA", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.79312, "t": 243.55724999999995, "r": 267.09274, "b": 251.8822, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(128)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.87164, "t": 243.55724999999995, "r": 464.26022, "b": 251.8822, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 7, "end_row_offset_idx": 8, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Schema name of the currently running routine", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800018, "t": 262.51757999999995, "r": 188.43991, "b": 270.84253, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "ROUTINE_SPECIFIC_NAME", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.84441, "t": 262.51757999999995, "r": 267.03693, "b": 270.84253, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "VARCHAR(128)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.80682, "t": 262.51757999999995, "r": 430.40045, "b": 270.84253, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 8, "end_row_offset_idx": 9, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Name of the currently running routine", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 70.800034, "t": 281.53726, "r": 139.43135, "b": 289.86227, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 0, "end_col_offset_idx": 1, "text": "ROUTINE_TYPE", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 202.74635, "t": 281.53726, "r": 239.28996000000004, "b": 289.86227, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 1, "end_col_offset_idx": 2, "text": "CHAR(1)", "column_header": false, "row_header": false, "row_section": false}, {"bbox": {"l": 281.79065, "t": 281.53726, "r": 425.09131, "b": 289.86227, "coord_origin": "TOPLEFT"}, "row_span": 1, "col_span": 1, "start_row_offset_idx": 9, "end_row_offset_idx": 10, "start_col_offset_idx": 2, "end_col_offset_idx": 3, "text": "Type of the currently running routine", "column_header": false, "row_header": false, "row_section": false}]}], "headers": [{"label": "page_footer", "id": 9, "page_no": 11, "cluster": {"id": 9, "label": "page_footer", "bbox": {"l": 64.800003, "t": 754.848721, "r": 78.402, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.9187920093536377, "cells": [{"id": 0, "text": "20 ", "bbox": {"l": 64.800003, "t": 754.848721, "r": 78.402, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "20"}, {"label": "page_footer", "id": 6, "page_no": 11, "cluster": {"id": 6, "label": "page_footer", "bbox": {"l": 93.420303, "t": 755.538002, "r": 334.42142, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9505079388618469, "cells": [{"id": 1, "text": "Row and Column Access Control Support in IBM DB2 for i", "bbox": {"l": 93.420303, "t": 755.538002, "r": 334.42142, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Row and Column Access Control Support in IBM DB2 for i"}]}}, {"page_no": 12, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "Chapter 3. Row and Column Access Control ", "bbox": {"l": 344.94, "t": 755.538002, "r": 523.60162, "b": 763.863001, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "27", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "RETURN", "bbox": {"l": 136.79959, "t": 71.65845000000002, "r": 166.73935, "b": 80.43322999999998, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "CASE", "bbox": {"l": 136.79959, "t": 83.65826000000004, "r": 156.77934, "b": 92.43304, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'HR', 'EMP' ) = 1", "bbox": {"l": 147.26993, "t": 95.65808000000015, "r": 466.61502, "b": 104.43286000000012, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "THEN EMPLOYEES . DATE_OF_BIRTH", "bbox": {"l": 147.73068, "t": 107.65790000000004, "r": 311.69717, "b": 116.43268, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1", "bbox": {"l": 147.31944, "t": 131.65752999999995, "r": 436.61547999999993, "b": 140.43231000000003, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "AND SESSION_USER = EMPLOYEES . USER_ID", "bbox": {"l": 147.54245, "t": 143.65734999999995, "r": 351.65668, "b": 152.43213000000003, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "THEN EMPLOYEES . DATE_OF_BIRTH", "bbox": {"l": 147.73068, "t": 155.65716999999995, "r": 311.69717, "b": 164.43195000000003, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1", "bbox": {"l": 147.31944, "t": 179.65679999999998, "r": 436.61547999999993, "b": 188.43158000000005, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "AND SESSION_USER <> EMPLOYEES . USER_ID", "bbox": {"l": 147.52335, "t": 191.65661999999998, "r": 356.63669, "b": 200.43140000000005, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "THEN ( 9999 || '-' ||", "bbox": {"l": 147.63832, "t": 203.65643, "r": 261.44492, "b": 212.43120999999996, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "MONTH ( EMPLOYEES . DATE_OF_BIRTH ) || '-'", "bbox": {"l": 272.28363, "t": 203.65643, "r": 499.89682, "b": 212.43120999999996, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "||", "bbox": {"l": 510.73557, "t": 203.65643, "r": 521.57428, "b": 212.43120999999996, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "DAY (EMPLOYEES.DATE_OF_BIRTH ))", "bbox": {"l": 160.78555, "t": 215.65625, "r": 346.6767, "b": 224.43102999999996, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "ELSE NULL", "bbox": {"l": 149.51941, "t": 227.65607, "r": 206.75861, "b": 236.43084999999996, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": " END", "bbox": {"l": 136.79959, "t": 239.65588000000002, "r": 156.77934, "b": 248.43066, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": " ENABLE ;", "bbox": {"l": 136.79959, "t": 251.65570000000002, "r": 186.7191, "b": 260.43048, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "2.", "bbox": {"l": 136.79959, "t": 275.50591999999995, "r": 145.18994, "b": 284.7189, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "The other column to mask in this example is the TAX_ID information. In this example, the ", "bbox": {"l": 147.98672, "t": 275.50591999999995, "r": 547.21222, "b": 284.7189, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "rules to enforce include the following ones:", "bbox": {"l": 151.19977, "t": 287.50574, "r": 339.37903, "b": 296.71871999999996, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "-", "bbox": {"l": 152.0394, "t": 304.48553000000004, "r": 157.61201, "b": 313.69852000000003, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "Human Resources can see the unmasked TAX_ID of the employees.", "bbox": {"l": 165.59894, "t": 304.48553000000004, "r": 469.1528, "b": 313.69852000000003, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "-", "bbox": {"l": 152.0394, "t": 321.52512, "r": 157.60504, "b": 330.7381, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "Employees can see only their own unmasked TAX_ID.", "bbox": {"l": 165.59894, "t": 321.52512, "r": 403.95953, "b": 330.7381, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "-", "bbox": {"l": 152.0394, "t": 338.50491, "r": 157.57019, "b": 347.7179, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "Managers see a masked version of TAX_ID with the first five characters replaced with ", "bbox": {"l": 165.59894, "t": 338.50491, "r": 545.16846, "b": 347.7179, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "the X character (for example, XXX-XX-1234).", "bbox": {"l": 165.59894, "t": 350.50473, "r": 364.67947, "b": 359.71771, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "-", "bbox": {"l": 152.0394, "t": 367.48453, "r": 157.59309, "b": 376.6975100000001, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Any other person sees the entire TAX_ID as masked, for example, XXX-XX-XXXX.", "bbox": {"l": 165.59995, "t": 367.48453, "r": 529.46362, "b": 376.6975100000001, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "To implement this column mask, run the SQL statement that is shown in Example 3-9.", "bbox": {"l": 151.19978, "t": 384.52411, "r": 530.0603, "b": 393.73709, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Example 3-9 Creating a mask on the TAX_ID column", "bbox": {"l": 136.8, "t": 406.51801, "r": 351.9873, "b": 414.84302, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "CREATE MASK", "bbox": {"l": 136.8, "t": 423.67810000000003, "r": 192.91296, "b": 432.45287999999994, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "HR_SCHEMA.MASK_TAX_ID_ON_EMPLOYEES ", "bbox": {"l": 203.11533, "t": 423.67810000000003, "r": 381.65659, "b": 432.45287999999994, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "ON", "bbox": {"l": 136.8, "t": 435.67792, "r": 148.54184, "b": 444.45270000000005, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "HR_SCHEMA.EMPLOYEES AS EMPLOYEES ", "bbox": {"l": 177.89645, "t": 435.67792, "r": 371.63684, "b": 444.45270000000005, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "FOR COLUMN", "bbox": {"l": 136.8, "t": 447.67773, "r": 199.25916, "b": 456.45251, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "TAX_ID", "bbox": {"l": 211.75098, "t": 447.67773, "r": 249.22647, "b": 456.45251, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "RETURN ", "bbox": {"l": 136.8, "t": 459.67755, "r": 176.75952, "b": 468.45233, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "CASE ", "bbox": {"l": 136.8, "t": 471.67737, "r": 161.75977, "b": 480.45215, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'HR' ) = 1", "bbox": {"l": 152.84189, "t": 483.67719, "r": 441.59589, "b": 492.45197, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "THEN EMPLOYEES . TAX_ID ", "bbox": {"l": 154.01309, "t": 495.677, "r": 291.7178, "b": 504.45178, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1 ", "bbox": {"l": 152.80757, "t": 519.67661, "r": 451.6156, "b": 528.45139, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "AND SESSION_USER = EMPLOYEES . USER_ID ", "bbox": {"l": 153.21835, "t": 531.67642, "r": 366.65683, "b": 540.45117, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "THEN EMPLOYEES . TAX_ID", "bbox": {"l": 154.09363, "t": 543.6762200000001, "r": 286.67804, "b": 552.45097, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1", "bbox": {"l": 152.82599, "t": 567.67583, "r": 446.63561999999996, "b": 576.45058, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "AND SESSION_USER <> EMPLOYEES . USER_ID ", "bbox": {"l": 153.18398, "t": 579.67563, "r": 371.63684, "b": 588.45038, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "THEN ( 'XXX-XX-' CONCAT QSYS2 . SUBSTR ( EMPLOYEES . TAX_ID , 8 , 4 ) )", "bbox": {"l": 152.60088, "t": 591.67543, "r": 526.55469, "b": 600.45018, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'EMP' ) = 1 ", "bbox": {"l": 152.80757, "t": 615.67505, "r": 451.6156, "b": 624.4498, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "THEN EMPLOYEES . TAX_ID ", "bbox": {"l": 154.01309, "t": 627.67485, "r": 291.7178, "b": 636.4496, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "ELSE 'XXX-XX-XXXX' ", "bbox": {"l": 154.5134, "t": 651.67447, "r": 266.69827, "b": 660.44922, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "END", "bbox": {"l": 136.8, "t": 663.67427, "r": 157.7877, "b": 672.44904, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "ENABLE ;", "bbox": {"l": 136.8, "t": 675.67409, "r": 181.73952, "b": 684.44884, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 1, "label": "page_footer", "bbox": {"l": 344.94, "t": 755.538002, "r": 523.60162, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9556925892829895, "cells": [{"id": 0, "text": "Chapter 3. Row and Column Access Control ", "bbox": {"l": 344.94, "t": 755.538002, "r": 523.60162, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "page_footer", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.9105783104896545, "cells": [{"id": 1, "text": "27", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 136.79959, "t": 71.65845000000002, "r": 166.73935, "b": 80.43322999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.5606335997581482, "cells": [{"id": 2, "text": "RETURN", "bbox": {"l": 136.79959, "t": 71.65845000000002, "r": 166.73935, "b": 80.43322999999998, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 136.79959, "t": 83.65826000000004, "r": 156.77934, "b": 92.43304, "coord_origin": "TOPLEFT"}, "confidence": 0.589726984500885, "cells": [{"id": 3, "text": "CASE", "bbox": {"l": 136.79959, "t": 83.65826000000004, "r": 156.77934, "b": 92.43304, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "code", "bbox": {"l": 136.79959, "t": 95.65808000000015, "r": 521.57428, "b": 260.43048, "coord_origin": "TOPLEFT"}, "confidence": 0.778521716594696, "cells": [{"id": 4, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'HR', 'EMP' ) = 1", "bbox": {"l": 147.26993, "t": 95.65808000000015, "r": 466.61502, "b": 104.43286000000012, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "THEN EMPLOYEES . DATE_OF_BIRTH", "bbox": {"l": 147.73068, "t": 107.65790000000004, "r": 311.69717, "b": 116.43268, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1", "bbox": {"l": 147.31944, "t": 131.65752999999995, "r": 436.61547999999993, "b": 140.43231000000003, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "AND SESSION_USER = EMPLOYEES . USER_ID", "bbox": {"l": 147.54245, "t": 143.65734999999995, "r": 351.65668, "b": 152.43213000000003, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "THEN EMPLOYEES . DATE_OF_BIRTH", "bbox": {"l": 147.73068, "t": 155.65716999999995, "r": 311.69717, "b": 164.43195000000003, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1", "bbox": {"l": 147.31944, "t": 179.65679999999998, "r": 436.61547999999993, "b": 188.43158000000005, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "AND SESSION_USER <> EMPLOYEES . USER_ID", "bbox": {"l": 147.52335, "t": 191.65661999999998, "r": 356.63669, "b": 200.43140000000005, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "THEN ( 9999 || '-' ||", "bbox": {"l": 147.63832, "t": 203.65643, "r": 261.44492, "b": 212.43120999999996, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "MONTH ( EMPLOYEES . DATE_OF_BIRTH ) || '-'", "bbox": {"l": 272.28363, "t": 203.65643, "r": 499.89682, "b": 212.43120999999996, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "||", "bbox": {"l": 510.73557, "t": 203.65643, "r": 521.57428, "b": 212.43120999999996, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "DAY (EMPLOYEES.DATE_OF_BIRTH ))", "bbox": {"l": 160.78555, "t": 215.65625, "r": 346.6767, "b": 224.43102999999996, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "ELSE NULL", "bbox": {"l": 149.51941, "t": 227.65607, "r": 206.75861, "b": 236.43084999999996, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": " END", "bbox": {"l": 136.79959, "t": 239.65588000000002, "r": 156.77934, "b": 248.43066, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": " ENABLE ;", "bbox": {"l": 136.79959, "t": 251.65570000000002, "r": 186.7191, "b": 260.43048, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "list_item", "bbox": {"l": 136.79959, "t": 275.50591999999995, "r": 547.21222, "b": 296.71871999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.8678942918777466, "cells": [{"id": 18, "text": "2.", "bbox": {"l": 136.79959, "t": 275.50591999999995, "r": 145.18994, "b": 284.7189, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "The other column to mask in this example is the TAX_ID information. In this example, the ", "bbox": {"l": 147.98672, "t": 275.50591999999995, "r": 547.21222, "b": 284.7189, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "rules to enforce include the following ones:", "bbox": {"l": 151.19977, "t": 287.50574, "r": 339.37903, "b": 296.71871999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "list_item", "bbox": {"l": 152.0394, "t": 304.48553000000004, "r": 469.1528, "b": 313.69852000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9461130499839783, "cells": [{"id": 21, "text": "-", "bbox": {"l": 152.0394, "t": 304.48553000000004, "r": 157.61201, "b": 313.69852000000003, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "Human Resources can see the unmasked TAX_ID of the employees.", "bbox": {"l": 165.59894, "t": 304.48553000000004, "r": 469.1528, "b": 313.69852000000003, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "list_item", "bbox": {"l": 152.0394, "t": 321.52512, "r": 403.95953, "b": 330.7381, "coord_origin": "TOPLEFT"}, "confidence": 0.9467733502388, "cells": [{"id": 23, "text": "-", "bbox": {"l": 152.0394, "t": 321.52512, "r": 157.60504, "b": 330.7381, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "Employees can see only their own unmasked TAX_ID.", "bbox": {"l": 165.59894, "t": 321.52512, "r": 403.95953, "b": 330.7381, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "list_item", "bbox": {"l": 152.0394, "t": 338.50491, "r": 545.16846, "b": 359.71771, "coord_origin": "TOPLEFT"}, "confidence": 0.9705166220664978, "cells": [{"id": 25, "text": "-", "bbox": {"l": 152.0394, "t": 338.50491, "r": 157.57019, "b": 347.7179, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "Managers see a masked version of TAX_ID with the first five characters replaced with ", "bbox": {"l": 165.59894, "t": 338.50491, "r": 545.16846, "b": 347.7179, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "the X character (for example, XXX-XX-1234).", "bbox": {"l": 165.59894, "t": 350.50473, "r": 364.67947, "b": 359.71771, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "list_item", "bbox": {"l": 152.0394, "t": 367.48453, "r": 529.46362, "b": 376.6975100000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9469642639160156, "cells": [{"id": 28, "text": "-", "bbox": {"l": 152.0394, "t": 367.48453, "r": 157.59309, "b": 376.6975100000001, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Any other person sees the entire TAX_ID as masked, for example, XXX-XX-XXXX.", "bbox": {"l": 165.59995, "t": 367.48453, "r": 529.46362, "b": 376.6975100000001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "list_item", "bbox": {"l": 151.19978, "t": 384.52411, "r": 530.0603, "b": 393.73709, "coord_origin": "TOPLEFT"}, "confidence": 0.7003502249717712, "cells": [{"id": 30, "text": "To implement this column mask, run the SQL statement that is shown in Example 3-9.", "bbox": {"l": 151.19978, "t": 384.52411, "r": 530.0603, "b": 393.73709, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "caption", "bbox": {"l": 136.8, "t": 406.51801, "r": 351.9873, "b": 414.84302, "coord_origin": "TOPLEFT"}, "confidence": 0.8488203287124634, "cells": [{"id": 31, "text": "Example 3-9 Creating a mask on the TAX_ID column", "bbox": {"l": 136.8, "t": 406.51801, "r": 351.9873, "b": 414.84302, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "code", "bbox": {"l": 136.8, "t": 423.67810000000003, "r": 526.55469, "b": 684.44884, "coord_origin": "TOPLEFT"}, "confidence": 0.8411229252815247, "cells": [{"id": 32, "text": "CREATE MASK", "bbox": {"l": 136.8, "t": 423.67810000000003, "r": 192.91296, "b": 432.45287999999994, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "HR_SCHEMA.MASK_TAX_ID_ON_EMPLOYEES ", "bbox": {"l": 203.11533, "t": 423.67810000000003, "r": 381.65659, "b": 432.45287999999994, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "ON", "bbox": {"l": 136.8, "t": 435.67792, "r": 148.54184, "b": 444.45270000000005, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "HR_SCHEMA.EMPLOYEES AS EMPLOYEES ", "bbox": {"l": 177.89645, "t": 435.67792, "r": 371.63684, "b": 444.45270000000005, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "FOR COLUMN", "bbox": {"l": 136.8, "t": 447.67773, "r": 199.25916, "b": 456.45251, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "TAX_ID", "bbox": {"l": 211.75098, "t": 447.67773, "r": 249.22647, "b": 456.45251, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "RETURN ", "bbox": {"l": 136.8, "t": 459.67755, "r": 176.75952, "b": 468.45233, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "CASE ", "bbox": {"l": 136.8, "t": 471.67737, "r": 161.75977, "b": 480.45215, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'HR' ) = 1", "bbox": {"l": 152.84189, "t": 483.67719, "r": 441.59589, "b": 492.45197, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "THEN EMPLOYEES . TAX_ID ", "bbox": {"l": 154.01309, "t": 495.677, "r": 291.7178, "b": 504.45178, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1 ", "bbox": {"l": 152.80757, "t": 519.67661, "r": 451.6156, "b": 528.45139, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "AND SESSION_USER = EMPLOYEES . USER_ID ", "bbox": {"l": 153.21835, "t": 531.67642, "r": 366.65683, "b": 540.45117, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "THEN EMPLOYEES . TAX_ID", "bbox": {"l": 154.09363, "t": 543.6762200000001, "r": 286.67804, "b": 552.45097, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1", "bbox": {"l": 152.82599, "t": 567.67583, "r": 446.63561999999996, "b": 576.45058, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "AND SESSION_USER <> EMPLOYEES . USER_ID ", "bbox": {"l": 153.18398, "t": 579.67563, "r": 371.63684, "b": 588.45038, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "THEN ( 'XXX-XX-' CONCAT QSYS2 . SUBSTR ( EMPLOYEES . TAX_ID , 8 , 4 ) )", "bbox": {"l": 152.60088, "t": 591.67543, "r": 526.55469, "b": 600.45018, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'EMP' ) = 1 ", "bbox": {"l": 152.80757, "t": 615.67505, "r": 451.6156, "b": 624.4498, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "THEN EMPLOYEES . TAX_ID ", "bbox": {"l": 154.01309, "t": 627.67485, "r": 291.7178, "b": 636.4496, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "ELSE 'XXX-XX-XXXX' ", "bbox": {"l": 154.5134, "t": 651.67447, "r": 266.69827, "b": 660.44922, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "END", "bbox": {"l": 136.8, "t": 663.67427, "r": 157.7877, "b": 672.44904, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "ENABLE ;", "bbox": {"l": 136.8, "t": 675.67409, "r": 181.73952, "b": 684.44884, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_footer", "id": 1, "page_no": 12, "cluster": {"id": 1, "label": "page_footer", "bbox": {"l": 344.94, "t": 755.538002, "r": 523.60162, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9556925892829895, "cells": [{"id": 0, "text": "Chapter 3. Row and Column Access Control ", "bbox": {"l": 344.94, "t": 755.538002, "r": 523.60162, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Chapter 3. Row and Column Access Control"}, {"label": "page_footer", "id": 5, "page_no": 12, "cluster": {"id": 5, "label": "page_footer", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.9105783104896545, "cells": [{"id": 1, "text": "27", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "27"}, {"label": "text", "id": 13, "page_no": 12, "cluster": {"id": 13, "label": "text", "bbox": {"l": 136.79959, "t": 71.65845000000002, "r": 166.73935, "b": 80.43322999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.5606335997581482, "cells": [{"id": 2, "text": "RETURN", "bbox": {"l": 136.79959, "t": 71.65845000000002, "r": 166.73935, "b": 80.43322999999998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "RETURN"}, {"label": "text", "id": 12, "page_no": 12, "cluster": {"id": 12, "label": "text", "bbox": {"l": 136.79959, "t": 83.65826000000004, "r": 156.77934, "b": 92.43304, "coord_origin": "TOPLEFT"}, "confidence": 0.589726984500885, "cells": [{"id": 3, "text": "CASE", "bbox": {"l": 136.79959, "t": 83.65826000000004, "r": 156.77934, "b": 92.43304, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "CASE"}, {"label": "code", "id": 9, "page_no": 12, "cluster": {"id": 9, "label": "code", "bbox": {"l": 136.79959, "t": 95.65808000000015, "r": 521.57428, "b": 260.43048, "coord_origin": "TOPLEFT"}, "confidence": 0.778521716594696, "cells": [{"id": 4, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'HR', 'EMP' ) = 1", "bbox": {"l": 147.26993, "t": 95.65808000000015, "r": 466.61502, "b": 104.43286000000012, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "THEN EMPLOYEES . DATE_OF_BIRTH", "bbox": {"l": 147.73068, "t": 107.65790000000004, "r": 311.69717, "b": 116.43268, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1", "bbox": {"l": 147.31944, "t": 131.65752999999995, "r": 436.61547999999993, "b": 140.43231000000003, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "AND SESSION_USER = EMPLOYEES . USER_ID", "bbox": {"l": 147.54245, "t": 143.65734999999995, "r": 351.65668, "b": 152.43213000000003, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "THEN EMPLOYEES . DATE_OF_BIRTH", "bbox": {"l": 147.73068, "t": 155.65716999999995, "r": 311.69717, "b": 164.43195000000003, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1", "bbox": {"l": 147.31944, "t": 179.65679999999998, "r": 436.61547999999993, "b": 188.43158000000005, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "AND SESSION_USER <> EMPLOYEES . USER_ID", "bbox": {"l": 147.52335, "t": 191.65661999999998, "r": 356.63669, "b": 200.43140000000005, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "THEN ( 9999 || '-' ||", "bbox": {"l": 147.63832, "t": 203.65643, "r": 261.44492, "b": 212.43120999999996, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "MONTH ( EMPLOYEES . DATE_OF_BIRTH ) || '-'", "bbox": {"l": 272.28363, "t": 203.65643, "r": 499.89682, "b": 212.43120999999996, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "||", "bbox": {"l": 510.73557, "t": 203.65643, "r": 521.57428, "b": 212.43120999999996, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "DAY (EMPLOYEES.DATE_OF_BIRTH ))", "bbox": {"l": 160.78555, "t": 215.65625, "r": 346.6767, "b": 224.43102999999996, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "ELSE NULL", "bbox": {"l": 149.51941, "t": 227.65607, "r": 206.75861, "b": 236.43084999999996, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": " END", "bbox": {"l": 136.79959, "t": 239.65588000000002, "r": 156.77934, "b": 248.43066, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": " ENABLE ;", "bbox": {"l": 136.79959, "t": 251.65570000000002, "r": 186.7191, "b": 260.43048, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'HR', 'EMP' ) = 1 THEN EMPLOYEES . DATE_OF_BIRTH WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1 AND SESSION_USER = EMPLOYEES . USER_ID THEN EMPLOYEES . DATE_OF_BIRTH WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1 AND SESSION_USER <> EMPLOYEES . USER_ID THEN ( 9999 || '-' || MONTH ( EMPLOYEES . DATE_OF_BIRTH ) || '-' || DAY (EMPLOYEES.DATE_OF_BIRTH )) ELSE NULL END ENABLE ;"}, {"label": "list_item", "id": 6, "page_no": 12, "cluster": {"id": 6, "label": "list_item", "bbox": {"l": 136.79959, "t": 275.50591999999995, "r": 547.21222, "b": 296.71871999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.8678942918777466, "cells": [{"id": 18, "text": "2.", "bbox": {"l": 136.79959, "t": 275.50591999999995, "r": 145.18994, "b": 284.7189, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "The other column to mask in this example is the TAX_ID information. In this example, the ", "bbox": {"l": 147.98672, "t": 275.50591999999995, "r": 547.21222, "b": 284.7189, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "rules to enforce include the following ones:", "bbox": {"l": 151.19977, "t": 287.50574, "r": 339.37903, "b": 296.71871999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2. The other column to mask in this example is the TAX_ID information. In this example, the rules to enforce include the following ones:"}, {"label": "list_item", "id": 4, "page_no": 12, "cluster": {"id": 4, "label": "list_item", "bbox": {"l": 152.0394, "t": 304.48553000000004, "r": 469.1528, "b": 313.69852000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9461130499839783, "cells": [{"id": 21, "text": "-", "bbox": {"l": 152.0394, "t": 304.48553000000004, "r": 157.61201, "b": 313.69852000000003, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "Human Resources can see the unmasked TAX_ID of the employees.", "bbox": {"l": 165.59894, "t": 304.48553000000004, "r": 469.1528, "b": 313.69852000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "-Human Resources can see the unmasked TAX_ID of the employees."}, {"label": "list_item", "id": 3, "page_no": 12, "cluster": {"id": 3, "label": "list_item", "bbox": {"l": 152.0394, "t": 321.52512, "r": 403.95953, "b": 330.7381, "coord_origin": "TOPLEFT"}, "confidence": 0.9467733502388, "cells": [{"id": 23, "text": "-", "bbox": {"l": 152.0394, "t": 321.52512, "r": 157.60504, "b": 330.7381, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "Employees can see only their own unmasked TAX_ID.", "bbox": {"l": 165.59894, "t": 321.52512, "r": 403.95953, "b": 330.7381, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "-Employees can see only their own unmasked TAX_ID."}, {"label": "list_item", "id": 0, "page_no": 12, "cluster": {"id": 0, "label": "list_item", "bbox": {"l": 152.0394, "t": 338.50491, "r": 545.16846, "b": 359.71771, "coord_origin": "TOPLEFT"}, "confidence": 0.9705166220664978, "cells": [{"id": 25, "text": "-", "bbox": {"l": 152.0394, "t": 338.50491, "r": 157.57019, "b": 347.7179, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "Managers see a masked version of TAX_ID with the first five characters replaced with ", "bbox": {"l": 165.59894, "t": 338.50491, "r": 545.16846, "b": 347.7179, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "the X character (for example, XXX-XX-1234).", "bbox": {"l": 165.59894, "t": 350.50473, "r": 364.67947, "b": 359.71771, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "-Managers see a masked version of TAX_ID with the first five characters replaced with the X character (for example, XXX-XX-1234)."}, {"label": "list_item", "id": 2, "page_no": 12, "cluster": {"id": 2, "label": "list_item", "bbox": {"l": 152.0394, "t": 367.48453, "r": 529.46362, "b": 376.6975100000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9469642639160156, "cells": [{"id": 28, "text": "-", "bbox": {"l": 152.0394, "t": 367.48453, "r": 157.59309, "b": 376.6975100000001, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Any other person sees the entire TAX_ID as masked, for example, XXX-XX-XXXX.", "bbox": {"l": 165.59995, "t": 367.48453, "r": 529.46362, "b": 376.6975100000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "-Any other person sees the entire TAX_ID as masked, for example, XXX-XX-XXXX."}, {"label": "list_item", "id": 10, "page_no": 12, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 151.19978, "t": 384.52411, "r": 530.0603, "b": 393.73709, "coord_origin": "TOPLEFT"}, "confidence": 0.7003502249717712, "cells": [{"id": 30, "text": "To implement this column mask, run the SQL statement that is shown in Example 3-9.", "bbox": {"l": 151.19978, "t": 384.52411, "r": 530.0603, "b": 393.73709, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "To implement this column mask, run the SQL statement that is shown in Example 3-9."}, {"label": "caption", "id": 7, "page_no": 12, "cluster": {"id": 7, "label": "caption", "bbox": {"l": 136.8, "t": 406.51801, "r": 351.9873, "b": 414.84302, "coord_origin": "TOPLEFT"}, "confidence": 0.8488203287124634, "cells": [{"id": 31, "text": "Example 3-9 Creating a mask on the TAX_ID column", "bbox": {"l": 136.8, "t": 406.51801, "r": 351.9873, "b": 414.84302, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Example 3-9 Creating a mask on the TAX_ID column"}, {"label": "code", "id": 8, "page_no": 12, "cluster": {"id": 8, "label": "code", "bbox": {"l": 136.8, "t": 423.67810000000003, "r": 526.55469, "b": 684.44884, "coord_origin": "TOPLEFT"}, "confidence": 0.8411229252815247, "cells": [{"id": 32, "text": "CREATE MASK", "bbox": {"l": 136.8, "t": 423.67810000000003, "r": 192.91296, "b": 432.45287999999994, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "HR_SCHEMA.MASK_TAX_ID_ON_EMPLOYEES ", "bbox": {"l": 203.11533, "t": 423.67810000000003, "r": 381.65659, "b": 432.45287999999994, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "ON", "bbox": {"l": 136.8, "t": 435.67792, "r": 148.54184, "b": 444.45270000000005, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "HR_SCHEMA.EMPLOYEES AS EMPLOYEES ", "bbox": {"l": 177.89645, "t": 435.67792, "r": 371.63684, "b": 444.45270000000005, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "FOR COLUMN", "bbox": {"l": 136.8, "t": 447.67773, "r": 199.25916, "b": 456.45251, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "TAX_ID", "bbox": {"l": 211.75098, "t": 447.67773, "r": 249.22647, "b": 456.45251, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "RETURN ", "bbox": {"l": 136.8, "t": 459.67755, "r": 176.75952, "b": 468.45233, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "CASE ", "bbox": {"l": 136.8, "t": 471.67737, "r": 161.75977, "b": 480.45215, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'HR' ) = 1", "bbox": {"l": 152.84189, "t": 483.67719, "r": 441.59589, "b": 492.45197, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "THEN EMPLOYEES . TAX_ID ", "bbox": {"l": 154.01309, "t": 495.677, "r": 291.7178, "b": 504.45178, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1 ", "bbox": {"l": 152.80757, "t": 519.67661, "r": 451.6156, "b": 528.45139, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "AND SESSION_USER = EMPLOYEES . USER_ID ", "bbox": {"l": 153.21835, "t": 531.67642, "r": 366.65683, "b": 540.45117, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "THEN EMPLOYEES . TAX_ID", "bbox": {"l": 154.09363, "t": 543.6762200000001, "r": 286.67804, "b": 552.45097, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1", "bbox": {"l": 152.82599, "t": 567.67583, "r": 446.63561999999996, "b": 576.45058, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "AND SESSION_USER <> EMPLOYEES . USER_ID ", "bbox": {"l": 153.18398, "t": 579.67563, "r": 371.63684, "b": 588.45038, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "THEN ( 'XXX-XX-' CONCAT QSYS2 . SUBSTR ( EMPLOYEES . TAX_ID , 8 , 4 ) )", "bbox": {"l": 152.60088, "t": 591.67543, "r": 526.55469, "b": 600.45018, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'EMP' ) = 1 ", "bbox": {"l": 152.80757, "t": 615.67505, "r": 451.6156, "b": 624.4498, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "THEN EMPLOYEES . TAX_ID ", "bbox": {"l": 154.01309, "t": 627.67485, "r": 291.7178, "b": 636.4496, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "ELSE 'XXX-XX-XXXX' ", "bbox": {"l": 154.5134, "t": 651.67447, "r": 266.69827, "b": 660.44922, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "END", "bbox": {"l": 136.8, "t": 663.67427, "r": 157.7877, "b": 672.44904, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "ENABLE ;", "bbox": {"l": 136.8, "t": 675.67409, "r": 181.73952, "b": 684.44884, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "CREATE MASK HR_SCHEMA.MASK_TAX_ID_ON_EMPLOYEES ON HR_SCHEMA.EMPLOYEES AS EMPLOYEES FOR COLUMN TAX_ID RETURN CASE WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'HR' ) = 1 THEN EMPLOYEES . TAX_ID WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1 AND SESSION_USER = EMPLOYEES . USER_ID THEN EMPLOYEES . TAX_ID WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1 AND SESSION_USER <> EMPLOYEES . USER_ID THEN ( 'XXX-XX-' CONCAT QSYS2 . SUBSTR ( EMPLOYEES . TAX_ID , 8 , 4 ) ) WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'EMP' ) = 1 THEN EMPLOYEES . TAX_ID ELSE 'XXX-XX-XXXX' END ENABLE ;"}], "body": [{"label": "text", "id": 13, "page_no": 12, "cluster": {"id": 13, "label": "text", "bbox": {"l": 136.79959, "t": 71.65845000000002, "r": 166.73935, "b": 80.43322999999998, "coord_origin": "TOPLEFT"}, "confidence": 0.5606335997581482, "cells": [{"id": 2, "text": "RETURN", "bbox": {"l": 136.79959, "t": 71.65845000000002, "r": 166.73935, "b": 80.43322999999998, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "RETURN"}, {"label": "text", "id": 12, "page_no": 12, "cluster": {"id": 12, "label": "text", "bbox": {"l": 136.79959, "t": 83.65826000000004, "r": 156.77934, "b": 92.43304, "coord_origin": "TOPLEFT"}, "confidence": 0.589726984500885, "cells": [{"id": 3, "text": "CASE", "bbox": {"l": 136.79959, "t": 83.65826000000004, "r": 156.77934, "b": 92.43304, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "CASE"}, {"label": "code", "id": 9, "page_no": 12, "cluster": {"id": 9, "label": "code", "bbox": {"l": 136.79959, "t": 95.65808000000015, "r": 521.57428, "b": 260.43048, "coord_origin": "TOPLEFT"}, "confidence": 0.778521716594696, "cells": [{"id": 4, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'HR', 'EMP' ) = 1", "bbox": {"l": 147.26993, "t": 95.65808000000015, "r": 466.61502, "b": 104.43286000000012, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "THEN EMPLOYEES . DATE_OF_BIRTH", "bbox": {"l": 147.73068, "t": 107.65790000000004, "r": 311.69717, "b": 116.43268, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1", "bbox": {"l": 147.31944, "t": 131.65752999999995, "r": 436.61547999999993, "b": 140.43231000000003, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "AND SESSION_USER = EMPLOYEES . USER_ID", "bbox": {"l": 147.54245, "t": 143.65734999999995, "r": 351.65668, "b": 152.43213000000003, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "THEN EMPLOYEES . DATE_OF_BIRTH", "bbox": {"l": 147.73068, "t": 155.65716999999995, "r": 311.69717, "b": 164.43195000000003, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1", "bbox": {"l": 147.31944, "t": 179.65679999999998, "r": 436.61547999999993, "b": 188.43158000000005, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "AND SESSION_USER <> EMPLOYEES . USER_ID", "bbox": {"l": 147.52335, "t": 191.65661999999998, "r": 356.63669, "b": 200.43140000000005, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "THEN ( 9999 || '-' ||", "bbox": {"l": 147.63832, "t": 203.65643, "r": 261.44492, "b": 212.43120999999996, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "MONTH ( EMPLOYEES . DATE_OF_BIRTH ) || '-'", "bbox": {"l": 272.28363, "t": 203.65643, "r": 499.89682, "b": 212.43120999999996, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "||", "bbox": {"l": 510.73557, "t": 203.65643, "r": 521.57428, "b": 212.43120999999996, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "DAY (EMPLOYEES.DATE_OF_BIRTH ))", "bbox": {"l": 160.78555, "t": 215.65625, "r": 346.6767, "b": 224.43102999999996, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "ELSE NULL", "bbox": {"l": 149.51941, "t": 227.65607, "r": 206.75861, "b": 236.43084999999996, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": " END", "bbox": {"l": 136.79959, "t": 239.65588000000002, "r": 156.77934, "b": 248.43066, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": " ENABLE ;", "bbox": {"l": 136.79959, "t": 251.65570000000002, "r": 186.7191, "b": 260.43048, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'HR', 'EMP' ) = 1 THEN EMPLOYEES . DATE_OF_BIRTH WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1 AND SESSION_USER = EMPLOYEES . USER_ID THEN EMPLOYEES . DATE_OF_BIRTH WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1 AND SESSION_USER <> EMPLOYEES . USER_ID THEN ( 9999 || '-' || MONTH ( EMPLOYEES . DATE_OF_BIRTH ) || '-' || DAY (EMPLOYEES.DATE_OF_BIRTH )) ELSE NULL END ENABLE ;"}, {"label": "list_item", "id": 6, "page_no": 12, "cluster": {"id": 6, "label": "list_item", "bbox": {"l": 136.79959, "t": 275.50591999999995, "r": 547.21222, "b": 296.71871999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.8678942918777466, "cells": [{"id": 18, "text": "2.", "bbox": {"l": 136.79959, "t": 275.50591999999995, "r": 145.18994, "b": 284.7189, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "The other column to mask in this example is the TAX_ID information. In this example, the ", "bbox": {"l": 147.98672, "t": 275.50591999999995, "r": 547.21222, "b": 284.7189, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "rules to enforce include the following ones:", "bbox": {"l": 151.19977, "t": 287.50574, "r": 339.37903, "b": 296.71871999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2. The other column to mask in this example is the TAX_ID information. In this example, the rules to enforce include the following ones:"}, {"label": "list_item", "id": 4, "page_no": 12, "cluster": {"id": 4, "label": "list_item", "bbox": {"l": 152.0394, "t": 304.48553000000004, "r": 469.1528, "b": 313.69852000000003, "coord_origin": "TOPLEFT"}, "confidence": 0.9461130499839783, "cells": [{"id": 21, "text": "-", "bbox": {"l": 152.0394, "t": 304.48553000000004, "r": 157.61201, "b": 313.69852000000003, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "Human Resources can see the unmasked TAX_ID of the employees.", "bbox": {"l": 165.59894, "t": 304.48553000000004, "r": 469.1528, "b": 313.69852000000003, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "-Human Resources can see the unmasked TAX_ID of the employees."}, {"label": "list_item", "id": 3, "page_no": 12, "cluster": {"id": 3, "label": "list_item", "bbox": {"l": 152.0394, "t": 321.52512, "r": 403.95953, "b": 330.7381, "coord_origin": "TOPLEFT"}, "confidence": 0.9467733502388, "cells": [{"id": 23, "text": "-", "bbox": {"l": 152.0394, "t": 321.52512, "r": 157.60504, "b": 330.7381, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "Employees can see only their own unmasked TAX_ID.", "bbox": {"l": 165.59894, "t": 321.52512, "r": 403.95953, "b": 330.7381, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "-Employees can see only their own unmasked TAX_ID."}, {"label": "list_item", "id": 0, "page_no": 12, "cluster": {"id": 0, "label": "list_item", "bbox": {"l": 152.0394, "t": 338.50491, "r": 545.16846, "b": 359.71771, "coord_origin": "TOPLEFT"}, "confidence": 0.9705166220664978, "cells": [{"id": 25, "text": "-", "bbox": {"l": 152.0394, "t": 338.50491, "r": 157.57019, "b": 347.7179, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "Managers see a masked version of TAX_ID with the first five characters replaced with ", "bbox": {"l": 165.59894, "t": 338.50491, "r": 545.16846, "b": 347.7179, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "the X character (for example, XXX-XX-1234).", "bbox": {"l": 165.59894, "t": 350.50473, "r": 364.67947, "b": 359.71771, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "-Managers see a masked version of TAX_ID with the first five characters replaced with the X character (for example, XXX-XX-1234)."}, {"label": "list_item", "id": 2, "page_no": 12, "cluster": {"id": 2, "label": "list_item", "bbox": {"l": 152.0394, "t": 367.48453, "r": 529.46362, "b": 376.6975100000001, "coord_origin": "TOPLEFT"}, "confidence": 0.9469642639160156, "cells": [{"id": 28, "text": "-", "bbox": {"l": 152.0394, "t": 367.48453, "r": 157.59309, "b": 376.6975100000001, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Any other person sees the entire TAX_ID as masked, for example, XXX-XX-XXXX.", "bbox": {"l": 165.59995, "t": 367.48453, "r": 529.46362, "b": 376.6975100000001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "-Any other person sees the entire TAX_ID as masked, for example, XXX-XX-XXXX."}, {"label": "list_item", "id": 10, "page_no": 12, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 151.19978, "t": 384.52411, "r": 530.0603, "b": 393.73709, "coord_origin": "TOPLEFT"}, "confidence": 0.7003502249717712, "cells": [{"id": 30, "text": "To implement this column mask, run the SQL statement that is shown in Example 3-9.", "bbox": {"l": 151.19978, "t": 384.52411, "r": 530.0603, "b": 393.73709, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "To implement this column mask, run the SQL statement that is shown in Example 3-9."}, {"label": "caption", "id": 7, "page_no": 12, "cluster": {"id": 7, "label": "caption", "bbox": {"l": 136.8, "t": 406.51801, "r": 351.9873, "b": 414.84302, "coord_origin": "TOPLEFT"}, "confidence": 0.8488203287124634, "cells": [{"id": 31, "text": "Example 3-9 Creating a mask on the TAX_ID column", "bbox": {"l": 136.8, "t": 406.51801, "r": 351.9873, "b": 414.84302, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Example 3-9 Creating a mask on the TAX_ID column"}, {"label": "code", "id": 8, "page_no": 12, "cluster": {"id": 8, "label": "code", "bbox": {"l": 136.8, "t": 423.67810000000003, "r": 526.55469, "b": 684.44884, "coord_origin": "TOPLEFT"}, "confidence": 0.8411229252815247, "cells": [{"id": 32, "text": "CREATE MASK", "bbox": {"l": 136.8, "t": 423.67810000000003, "r": 192.91296, "b": 432.45287999999994, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "HR_SCHEMA.MASK_TAX_ID_ON_EMPLOYEES ", "bbox": {"l": 203.11533, "t": 423.67810000000003, "r": 381.65659, "b": 432.45287999999994, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "ON", "bbox": {"l": 136.8, "t": 435.67792, "r": 148.54184, "b": 444.45270000000005, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "HR_SCHEMA.EMPLOYEES AS EMPLOYEES ", "bbox": {"l": 177.89645, "t": 435.67792, "r": 371.63684, "b": 444.45270000000005, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "FOR COLUMN", "bbox": {"l": 136.8, "t": 447.67773, "r": 199.25916, "b": 456.45251, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "TAX_ID", "bbox": {"l": 211.75098, "t": 447.67773, "r": 249.22647, "b": 456.45251, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "RETURN ", "bbox": {"l": 136.8, "t": 459.67755, "r": 176.75952, "b": 468.45233, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "CASE ", "bbox": {"l": 136.8, "t": 471.67737, "r": 161.75977, "b": 480.45215, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'HR' ) = 1", "bbox": {"l": 152.84189, "t": 483.67719, "r": 441.59589, "b": 492.45197, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "THEN EMPLOYEES . TAX_ID ", "bbox": {"l": 154.01309, "t": 495.677, "r": 291.7178, "b": 504.45178, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1 ", "bbox": {"l": 152.80757, "t": 519.67661, "r": 451.6156, "b": 528.45139, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "AND SESSION_USER = EMPLOYEES . USER_ID ", "bbox": {"l": 153.21835, "t": 531.67642, "r": 366.65683, "b": 540.45117, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "THEN EMPLOYEES . TAX_ID", "bbox": {"l": 154.09363, "t": 543.6762200000001, "r": 286.67804, "b": 552.45097, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1", "bbox": {"l": 152.82599, "t": 567.67583, "r": 446.63561999999996, "b": 576.45058, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "AND SESSION_USER <> EMPLOYEES . USER_ID ", "bbox": {"l": 153.18398, "t": 579.67563, "r": 371.63684, "b": 588.45038, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "THEN ( 'XXX-XX-' CONCAT QSYS2 . SUBSTR ( EMPLOYEES . TAX_ID , 8 , 4 ) )", "bbox": {"l": 152.60088, "t": 591.67543, "r": 526.55469, "b": 600.45018, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'EMP' ) = 1 ", "bbox": {"l": 152.80757, "t": 615.67505, "r": 451.6156, "b": 624.4498, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "THEN EMPLOYEES . TAX_ID ", "bbox": {"l": 154.01309, "t": 627.67485, "r": 291.7178, "b": 636.4496, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "ELSE 'XXX-XX-XXXX' ", "bbox": {"l": 154.5134, "t": 651.67447, "r": 266.69827, "b": 660.44922, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "END", "bbox": {"l": 136.8, "t": 663.67427, "r": 157.7877, "b": 672.44904, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "ENABLE ;", "bbox": {"l": 136.8, "t": 675.67409, "r": 181.73952, "b": 684.44884, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "CREATE MASK HR_SCHEMA.MASK_TAX_ID_ON_EMPLOYEES ON HR_SCHEMA.EMPLOYEES AS EMPLOYEES FOR COLUMN TAX_ID RETURN CASE WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'HR' ) = 1 THEN EMPLOYEES . TAX_ID WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1 AND SESSION_USER = EMPLOYEES . USER_ID THEN EMPLOYEES . TAX_ID WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'MGR' ) = 1 AND SESSION_USER <> EMPLOYEES . USER_ID THEN ( 'XXX-XX-' CONCAT QSYS2 . SUBSTR ( EMPLOYEES . TAX_ID , 8 , 4 ) ) WHEN VERIFY_GROUP_FOR_USER ( SESSION_USER , 'EMP' ) = 1 THEN EMPLOYEES . TAX_ID ELSE 'XXX-XX-XXXX' END ENABLE ;"}], "headers": [{"label": "page_footer", "id": 1, "page_no": 12, "cluster": {"id": 1, "label": "page_footer", "bbox": {"l": 344.94, "t": 755.538002, "r": 523.60162, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9556925892829895, "cells": [{"id": 0, "text": "Chapter 3. Row and Column Access Control ", "bbox": {"l": 344.94, "t": 755.538002, "r": 523.60162, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Chapter 3. Row and Column Access Control"}, {"label": "page_footer", "id": 5, "page_no": 12, "cluster": {"id": 5, "label": "page_footer", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.9105783104896545, "cells": [{"id": 1, "text": "27", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "27"}]}}, {"page_no": 13, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "28 ", "bbox": {"l": 64.800003, "t": 754.848721, "r": 78.402, "b": 764.06172, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Row and Column Access Control Support in IBM DB2 for i", "bbox": {"l": 93.420303, "t": 755.538002, "r": 334.42142, "b": 763.863001, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "3.", "bbox": {"l": 136.8, "t": 71.50867000000005, "r": 145.22156, "b": 80.72167999999999, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Figure 3-10 shows the masks that are created in the HR_SCHEMA.", "bbox": {"l": 148.02872, "t": 71.50867000000005, "r": 449.9523899999999, "b": 80.72167999999999, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "Figure 3-10 Column masks shown in System i Navigator", "bbox": {"l": 64.800003, "t": 173.53801999999996, "r": 293.13809, "b": 181.86298, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "3.6.6", "bbox": {"l": 64.800003, "t": 202.37469, "r": 94.275139, "b": 214.36273000000006, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Activating RCAC", "bbox": {"l": 97.959534, "t": 202.37469, "r": 203.98521, "b": 214.36273000000006, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "Now that you have created the row permission and the two column masks, RCAC must be ", "bbox": {"l": 136.8, "t": 228.52868999999998, "r": 537.09131, "b": 237.74170000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "activated. The row permission and the two column masks are enabled (last clause in the ", "bbox": {"l": 136.8, "t": 240.5285, "r": 529.20422, "b": 249.74152000000004, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "scripts), but now you must activate RCAC on the table. To do so, complete the following steps:", "bbox": {"l": 136.8, "t": 252.52832, "r": 547.22565, "b": 261.74132999999995, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "1.", "bbox": {"l": 136.8, "t": 269.50811999999996, "r": 145.32378, "b": 278.72113, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Run the SQL statements that are shown in Example 3-10.", "bbox": {"l": 148.16501, "t": 269.50811999999996, "r": 409.47888, "b": 278.72113, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Example 3-10 Activating RCAC on the EMPLOYEES table ", "bbox": {"l": 136.8, "t": 291.55798, "r": 375.29099, "b": 299.88300000000004, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "/*", "bbox": {"l": 136.8, "t": 308.65811, "r": 147.22942, "b": 317.43289, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Active Row Access Control (permissions) */", "bbox": {"l": 157.65884, "t": 308.65811, "r": 376.67661, "b": 317.43289, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "/*", "bbox": {"l": 136.8, "t": 320.65793, "r": 147.70349, "b": 329.43271, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Active Column Access Control (masks)", "bbox": {"l": 158.60696, "t": 320.65793, "r": 354.86963, "b": 329.43271, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "*/", "bbox": {"l": 365.77313, "t": 320.65793, "r": 376.67661, "b": 329.43271, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "ALTER TABLE HR_SCHEMA.EMPLOYEES", "bbox": {"l": 136.8, "t": 332.65775, "r": 291.7178, "b": 341.43253, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "ACTIVATE ROW ACCESS CONTROL", "bbox": {"l": 136.8, "t": 344.65756, "r": 271.67831, "b": 353.43234000000007, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "ACTIVATE COLUMN ACCESS CONTROL;", "bbox": {"l": 136.8, "t": 356.65738, "r": 291.7178, "b": 365.43216, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "2.", "bbox": {"l": 136.8, "t": 380.5076, "r": 145.14954, "b": 389.72058, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "Look at the definition of the EMPLOYEE table, as shown in Figure 3-11. To do this, from ", "bbox": {"l": 147.93271, "t": 380.5076, "r": 540.80145, "b": 389.72058, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "the main navigation pane of System i Navigator, click ", "bbox": {"l": 151.20013, "t": 392.50742, "r": 387.36169, "b": 401.7203999999999, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "Schemas", "bbox": {"l": 387.29993, "t": 392.50742, "r": 431.07614, "b": 401.7203999999999, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "\uf0ae", "bbox": {"l": 433.85992000000005, "t": 389.64889999999997, "r": 443.69043, "b": 401.83994, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "HR_SCHEMA", "bbox": {"l": 446.51906999999994, "t": 392.50742, "r": 509.73618000000005, "b": 401.7203999999999, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "\uf0ae", "bbox": {"l": 512.5788, "t": 389.64889999999997, "r": 522.4093, "b": 401.83994, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Tables", "bbox": {"l": 151.19812, "t": 404.50723000000005, "r": 181.12892, "b": 413.72021, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": ", right-click the ", "bbox": {"l": 181.79823, "t": 404.50723000000005, "r": 248.99638, "b": 413.72021, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "EMPLOYEES", "bbox": {"l": 248.93860000000004, "t": 404.50723000000005, "r": 310.44357, "b": 413.72021, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": " table, and click ", "bbox": {"l": 310.49835, "t": 404.50723000000005, "r": 381.53305, "b": 413.72021, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Definition", "bbox": {"l": 381.59882, "t": 404.50723000000005, "r": 427.68176, "b": 413.72021, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": ".", "bbox": {"l": 427.67877, "t": 404.50723000000005, "r": 430.4476599999999, "b": 413.72021, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Figure 3-11 Selecting the EMPLOYEES table from System i Navigator", "bbox": {"l": 64.800003, "t": 649.0378900000001, "r": 347.43054, "b": 657.3629, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 8, "label": "page_footer", "bbox": {"l": 64.800003, "t": 754.848721, "r": 78.402, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.9161998629570007, "cells": [{"id": 0, "text": "28 ", "bbox": {"l": 64.800003, "t": 754.848721, "r": 78.402, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "page_footer", "bbox": {"l": 93.420303, "t": 755.538002, "r": 334.42142, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9540064334869385, "cells": [{"id": 1, "text": "Row and Column Access Control Support in IBM DB2 for i", "bbox": {"l": 93.420303, "t": 755.538002, "r": 334.42142, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "list_item", "bbox": {"l": 136.8, "t": 71.50867000000005, "r": 449.9523899999999, "b": 80.72167999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.8751048445701599, "cells": [{"id": 2, "text": "3.", "bbox": {"l": 136.8, "t": 71.50867000000005, "r": 145.22156, "b": 80.72167999999999, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Figure 3-10 shows the masks that are created in the HR_SCHEMA.", "bbox": {"l": 148.02872, "t": 71.50867000000005, "r": 449.9523899999999, "b": 80.72167999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "caption", "bbox": {"l": 64.800003, "t": 173.53801999999996, "r": 293.13809, "b": 181.86298, "coord_origin": "TOPLEFT"}, "confidence": 0.944426953792572, "cells": [{"id": 4, "text": "Figure 3-10 Column masks shown in System i Navigator", "bbox": {"l": 64.800003, "t": 173.53801999999996, "r": 293.13809, "b": 181.86298, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "section_header", "bbox": {"l": 64.800003, "t": 202.37469, "r": 203.98521, "b": 214.36273000000006, "coord_origin": "TOPLEFT"}, "confidence": 0.9645015001296997, "cells": [{"id": 5, "text": "3.6.6", "bbox": {"l": 64.800003, "t": 202.37469, "r": 94.275139, "b": 214.36273000000006, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Activating RCAC", "bbox": {"l": 97.959534, "t": 202.37469, "r": 203.98521, "b": 214.36273000000006, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 136.8, "t": 228.52868999999998, "r": 547.22565, "b": 261.74132999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9768574237823486, "cells": [{"id": 7, "text": "Now that you have created the row permission and the two column masks, RCAC must be ", "bbox": {"l": 136.8, "t": 228.52868999999998, "r": 537.09131, "b": 237.74170000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "activated. The row permission and the two column masks are enabled (last clause in the ", "bbox": {"l": 136.8, "t": 240.5285, "r": 529.20422, "b": 249.74152000000004, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "scripts), but now you must activate RCAC on the table. To do so, complete the following steps:", "bbox": {"l": 136.8, "t": 252.52832, "r": 547.22565, "b": 261.74132999999995, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "list_item", "bbox": {"l": 136.8, "t": 269.50811999999996, "r": 409.47888, "b": 278.72113, "coord_origin": "TOPLEFT"}, "confidence": 0.9059441685676575, "cells": [{"id": 10, "text": "1.", "bbox": {"l": 136.8, "t": 269.50811999999996, "r": 145.32378, "b": 278.72113, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Run the SQL statements that are shown in Example 3-10.", "bbox": {"l": 148.16501, "t": 269.50811999999996, "r": 409.47888, "b": 278.72113, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "section_header", "bbox": {"l": 136.8, "t": 291.55798, "r": 375.29099, "b": 299.88300000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.657009482383728, "cells": [{"id": 12, "text": "Example 3-10 Activating RCAC on the EMPLOYEES table ", "bbox": {"l": 136.8, "t": 291.55798, "r": 375.29099, "b": 299.88300000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "list_item", "bbox": {"l": 136.8, "t": 308.65811, "r": 376.67661, "b": 317.43289, "coord_origin": "TOPLEFT"}, "confidence": 0.6002400517463684, "cells": [{"id": 13, "text": "/*", "bbox": {"l": 136.8, "t": 308.65811, "r": 147.22942, "b": 317.43289, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Active Row Access Control (permissions) */", "bbox": {"l": 157.65884, "t": 308.65811, "r": 376.67661, "b": 317.43289, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "list_item", "bbox": {"l": 136.8, "t": 320.65793, "r": 354.86963, "b": 329.43271, "coord_origin": "TOPLEFT"}, "confidence": 0.598584771156311, "cells": [{"id": 15, "text": "/*", "bbox": {"l": 136.8, "t": 320.65793, "r": 147.70349, "b": 329.43271, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Active Column Access Control (masks)", "bbox": {"l": 158.60696, "t": 320.65793, "r": 354.86963, "b": 329.43271, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 365.77313, "t": 320.65793, "r": 376.67661, "b": 329.43271, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "*/", "bbox": {"l": 365.77313, "t": 320.65793, "r": 376.67661, "b": 329.43271, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 136.8, "t": 332.65775, "r": 291.7178, "b": 341.43253, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "ALTER TABLE HR_SCHEMA.EMPLOYEES", "bbox": {"l": 136.8, "t": 332.65775, "r": 291.7178, "b": 341.43253, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 136.8, "t": 344.65756, "r": 271.67831, "b": 353.43234000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "ACTIVATE ROW ACCESS CONTROL", "bbox": {"l": 136.8, "t": 344.65756, "r": 271.67831, "b": 353.43234000000007, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 136.8, "t": 356.65738, "r": 291.7178, "b": 365.43216, "coord_origin": "TOPLEFT"}, "confidence": 0.5431806445121765, "cells": [{"id": 20, "text": "ACTIVATE COLUMN ACCESS CONTROL;", "bbox": {"l": 136.8, "t": 356.65738, "r": 291.7178, "b": 365.43216, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "list_item", "bbox": {"l": 136.8, "t": 380.5076, "r": 540.80145, "b": 413.72021, "coord_origin": "TOPLEFT"}, "confidence": 0.9449257850646973, "cells": [{"id": 21, "text": "2.", "bbox": {"l": 136.8, "t": 380.5076, "r": 145.14954, "b": 389.72058, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "Look at the definition of the EMPLOYEE table, as shown in Figure 3-11. To do this, from ", "bbox": {"l": 147.93271, "t": 380.5076, "r": 540.80145, "b": 389.72058, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "the main navigation pane of System i Navigator, click ", "bbox": {"l": 151.20013, "t": 392.50742, "r": 387.36169, "b": 401.7203999999999, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "Schemas", "bbox": {"l": 387.29993, "t": 392.50742, "r": 431.07614, "b": 401.7203999999999, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "\uf0ae", "bbox": {"l": 433.85992000000005, "t": 389.64889999999997, "r": 443.69043, "b": 401.83994, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "HR_SCHEMA", "bbox": {"l": 446.51906999999994, "t": 392.50742, "r": 509.73618000000005, "b": 401.7203999999999, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "\uf0ae", "bbox": {"l": 512.5788, "t": 389.64889999999997, "r": 522.4093, "b": 401.83994, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Tables", "bbox": {"l": 151.19812, "t": 404.50723000000005, "r": 181.12892, "b": 413.72021, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": ", right-click the ", "bbox": {"l": 181.79823, "t": 404.50723000000005, "r": 248.99638, "b": 413.72021, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "EMPLOYEES", "bbox": {"l": 248.93860000000004, "t": 404.50723000000005, "r": 310.44357, "b": 413.72021, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": " table, and click ", "bbox": {"l": 310.49835, "t": 404.50723000000005, "r": 381.53305, "b": 413.72021, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Definition", "bbox": {"l": 381.59882, "t": 404.50723000000005, "r": 427.68176, "b": 413.72021, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": ".", "bbox": {"l": 427.67877, "t": 404.50723000000005, "r": 430.4476599999999, "b": 413.72021, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "caption", "bbox": {"l": 64.800003, "t": 649.0378900000001, "r": 347.43054, "b": 657.3629, "coord_origin": "TOPLEFT"}, "confidence": 0.9499983787536621, "cells": [{"id": 34, "text": "Figure 3-11 Selecting the EMPLOYEES table from System i Navigator", "bbox": {"l": 64.800003, "t": 649.0378900000001, "r": 347.43054, "b": 657.3629, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "picture", "bbox": {"l": 63.801902770996094, "t": 95.38241577148438, "r": 547.11474609375, "b": 170.0321502685547, "coord_origin": "TOPLEFT"}, "confidence": 0.9635388851165771, "cells": [], "children": []}, {"id": 0, "label": "picture", "bbox": {"l": 63.985130310058594, "t": 427.90496826171875, "r": 530.0478515625, "b": 646.1396484375, "coord_origin": "TOPLEFT"}, "confidence": 0.9801459908485413, "cells": [], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_footer", "id": 8, "page_no": 13, "cluster": {"id": 8, "label": "page_footer", "bbox": {"l": 64.800003, "t": 754.848721, "r": 78.402, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.9161998629570007, "cells": [{"id": 0, "text": "28 ", "bbox": {"l": 64.800003, "t": 754.848721, "r": 78.402, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "28"}, {"label": "page_footer", "id": 4, "page_no": 13, "cluster": {"id": 4, "label": "page_footer", "bbox": {"l": 93.420303, "t": 755.538002, "r": 334.42142, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9540064334869385, "cells": [{"id": 1, "text": "Row and Column Access Control Support in IBM DB2 for i", "bbox": {"l": 93.420303, "t": 755.538002, "r": 334.42142, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Row and Column Access Control Support in IBM DB2 for i"}, {"label": "list_item", "id": 10, "page_no": 13, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 136.8, "t": 71.50867000000005, "r": 449.9523899999999, "b": 80.72167999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.8751048445701599, "cells": [{"id": 2, "text": "3.", "bbox": {"l": 136.8, "t": 71.50867000000005, "r": 145.22156, "b": 80.72167999999999, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Figure 3-10 shows the masks that are created in the HR_SCHEMA.", "bbox": {"l": 148.02872, "t": 71.50867000000005, "r": 449.9523899999999, "b": 80.72167999999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3. Figure 3-10 shows the masks that are created in the HR_SCHEMA."}, {"label": "caption", "id": 7, "page_no": 13, "cluster": {"id": 7, "label": "caption", "bbox": {"l": 64.800003, "t": 173.53801999999996, "r": 293.13809, "b": 181.86298, "coord_origin": "TOPLEFT"}, "confidence": 0.944426953792572, "cells": [{"id": 4, "text": "Figure 3-10 Column masks shown in System i Navigator", "bbox": {"l": 64.800003, "t": 173.53801999999996, "r": 293.13809, "b": 181.86298, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 3-10 Column masks shown in System i Navigator"}, {"label": "section_header", "id": 2, "page_no": 13, "cluster": {"id": 2, "label": "section_header", "bbox": {"l": 64.800003, "t": 202.37469, "r": 203.98521, "b": 214.36273000000006, "coord_origin": "TOPLEFT"}, "confidence": 0.9645015001296997, "cells": [{"id": 5, "text": "3.6.6", "bbox": {"l": 64.800003, "t": 202.37469, "r": 94.275139, "b": 214.36273000000006, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Activating RCAC", "bbox": {"l": 97.959534, "t": 202.37469, "r": 203.98521, "b": 214.36273000000006, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3.6.6 Activating RCAC"}, {"label": "text", "id": 1, "page_no": 13, "cluster": {"id": 1, "label": "text", "bbox": {"l": 136.8, "t": 228.52868999999998, "r": 547.22565, "b": 261.74132999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9768574237823486, "cells": [{"id": 7, "text": "Now that you have created the row permission and the two column masks, RCAC must be ", "bbox": {"l": 136.8, "t": 228.52868999999998, "r": 537.09131, "b": 237.74170000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "activated. The row permission and the two column masks are enabled (last clause in the ", "bbox": {"l": 136.8, "t": 240.5285, "r": 529.20422, "b": 249.74152000000004, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "scripts), but now you must activate RCAC on the table. To do so, complete the following steps:", "bbox": {"l": 136.8, "t": 252.52832, "r": 547.22565, "b": 261.74132999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Now that you have created the row permission and the two column masks, RCAC must be activated. The row permission and the two column masks are enabled (last clause in the scripts), but now you must activate RCAC on the table. To do so, complete the following steps:"}, {"label": "list_item", "id": 9, "page_no": 13, "cluster": {"id": 9, "label": "list_item", "bbox": {"l": 136.8, "t": 269.50811999999996, "r": 409.47888, "b": 278.72113, "coord_origin": "TOPLEFT"}, "confidence": 0.9059441685676575, "cells": [{"id": 10, "text": "1.", "bbox": {"l": 136.8, "t": 269.50811999999996, "r": 145.32378, "b": 278.72113, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Run the SQL statements that are shown in Example 3-10.", "bbox": {"l": 148.16501, "t": 269.50811999999996, "r": 409.47888, "b": 278.72113, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1. Run the SQL statements that are shown in Example 3-10."}, {"label": "section_header", "id": 11, "page_no": 13, "cluster": {"id": 11, "label": "section_header", "bbox": {"l": 136.8, "t": 291.55798, "r": 375.29099, "b": 299.88300000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.657009482383728, "cells": [{"id": 12, "text": "Example 3-10 Activating RCAC on the EMPLOYEES table ", "bbox": {"l": 136.8, "t": 291.55798, "r": 375.29099, "b": 299.88300000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Example 3-10 Activating RCAC on the EMPLOYEES table"}, {"label": "list_item", "id": 13, "page_no": 13, "cluster": {"id": 13, "label": "list_item", "bbox": {"l": 136.8, "t": 308.65811, "r": 376.67661, "b": 317.43289, "coord_origin": "TOPLEFT"}, "confidence": 0.6002400517463684, "cells": [{"id": 13, "text": "/*", "bbox": {"l": 136.8, "t": 308.65811, "r": 147.22942, "b": 317.43289, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Active Row Access Control (permissions) */", "bbox": {"l": 157.65884, "t": 308.65811, "r": 376.67661, "b": 317.43289, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "/* Active Row Access Control (permissions) */"}, {"label": "list_item", "id": 14, "page_no": 13, "cluster": {"id": 14, "label": "list_item", "bbox": {"l": 136.8, "t": 320.65793, "r": 354.86963, "b": 329.43271, "coord_origin": "TOPLEFT"}, "confidence": 0.598584771156311, "cells": [{"id": 15, "text": "/*", "bbox": {"l": 136.8, "t": 320.65793, "r": 147.70349, "b": 329.43271, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Active Column Access Control (masks)", "bbox": {"l": 158.60696, "t": 320.65793, "r": 354.86963, "b": 329.43271, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "/* Active Column Access Control (masks)"}, {"label": "text", "id": 16, "page_no": 13, "cluster": {"id": 16, "label": "text", "bbox": {"l": 365.77313, "t": 320.65793, "r": 376.67661, "b": 329.43271, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "*/", "bbox": {"l": 365.77313, "t": 320.65793, "r": 376.67661, "b": 329.43271, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "*/"}, {"label": "text", "id": 17, "page_no": 13, "cluster": {"id": 17, "label": "text", "bbox": {"l": 136.8, "t": 332.65775, "r": 291.7178, "b": 341.43253, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "ALTER TABLE HR_SCHEMA.EMPLOYEES", "bbox": {"l": 136.8, "t": 332.65775, "r": 291.7178, "b": 341.43253, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "ALTER TABLE HR_SCHEMA.EMPLOYEES"}, {"label": "text", "id": 18, "page_no": 13, "cluster": {"id": 18, "label": "text", "bbox": {"l": 136.8, "t": 344.65756, "r": 271.67831, "b": 353.43234000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "ACTIVATE ROW ACCESS CONTROL", "bbox": {"l": 136.8, "t": 344.65756, "r": 271.67831, "b": 353.43234000000007, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "ACTIVATE ROW ACCESS CONTROL"}, {"label": "text", "id": 15, "page_no": 13, "cluster": {"id": 15, "label": "text", "bbox": {"l": 136.8, "t": 356.65738, "r": 291.7178, "b": 365.43216, "coord_origin": "TOPLEFT"}, "confidence": 0.5431806445121765, "cells": [{"id": 20, "text": "ACTIVATE COLUMN ACCESS CONTROL;", "bbox": {"l": 136.8, "t": 356.65738, "r": 291.7178, "b": 365.43216, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "ACTIVATE COLUMN ACCESS CONTROL;"}, {"label": "list_item", "id": 6, "page_no": 13, "cluster": {"id": 6, "label": "list_item", "bbox": {"l": 136.8, "t": 380.5076, "r": 540.80145, "b": 413.72021, "coord_origin": "TOPLEFT"}, "confidence": 0.9449257850646973, "cells": [{"id": 21, "text": "2.", "bbox": {"l": 136.8, "t": 380.5076, "r": 145.14954, "b": 389.72058, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "Look at the definition of the EMPLOYEE table, as shown in Figure 3-11. To do this, from ", "bbox": {"l": 147.93271, "t": 380.5076, "r": 540.80145, "b": 389.72058, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "the main navigation pane of System i Navigator, click ", "bbox": {"l": 151.20013, "t": 392.50742, "r": 387.36169, "b": 401.7203999999999, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "Schemas", "bbox": {"l": 387.29993, "t": 392.50742, "r": 431.07614, "b": 401.7203999999999, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "\uf0ae", "bbox": {"l": 433.85992000000005, "t": 389.64889999999997, "r": 443.69043, "b": 401.83994, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "HR_SCHEMA", "bbox": {"l": 446.51906999999994, "t": 392.50742, "r": 509.73618000000005, "b": 401.7203999999999, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "\uf0ae", "bbox": {"l": 512.5788, "t": 389.64889999999997, "r": 522.4093, "b": 401.83994, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Tables", "bbox": {"l": 151.19812, "t": 404.50723000000005, "r": 181.12892, "b": 413.72021, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": ", right-click the ", "bbox": {"l": 181.79823, "t": 404.50723000000005, "r": 248.99638, "b": 413.72021, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "EMPLOYEES", "bbox": {"l": 248.93860000000004, "t": 404.50723000000005, "r": 310.44357, "b": 413.72021, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": " table, and click ", "bbox": {"l": 310.49835, "t": 404.50723000000005, "r": 381.53305, "b": 413.72021, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Definition", "bbox": {"l": 381.59882, "t": 404.50723000000005, "r": 427.68176, "b": 413.72021, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": ".", "bbox": {"l": 427.67877, "t": 404.50723000000005, "r": 430.4476599999999, "b": 413.72021, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2. Look at the definition of the EMPLOYEE table, as shown in Figure 3-11. To do this, from the main navigation pane of System i Navigator, click Schemas \uf0ae HR_SCHEMA \uf0ae Tables , right-click the EMPLOYEES table, and click Definition ."}, {"label": "caption", "id": 5, "page_no": 13, "cluster": {"id": 5, "label": "caption", "bbox": {"l": 64.800003, "t": 649.0378900000001, "r": 347.43054, "b": 657.3629, "coord_origin": "TOPLEFT"}, "confidence": 0.9499983787536621, "cells": [{"id": 34, "text": "Figure 3-11 Selecting the EMPLOYEES table from System i Navigator", "bbox": {"l": 64.800003, "t": 649.0378900000001, "r": 347.43054, "b": 657.3629, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 3-11 Selecting the EMPLOYEES table from System i Navigator"}, {"label": "picture", "id": 3, "page_no": 13, "cluster": {"id": 3, "label": "picture", "bbox": {"l": 63.801902770996094, "t": 95.38241577148438, "r": 547.11474609375, "b": 170.0321502685547, "coord_origin": "TOPLEFT"}, "confidence": 0.9635388851165771, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "picture", "id": 0, "page_no": 13, "cluster": {"id": 0, "label": "picture", "bbox": {"l": 63.985130310058594, "t": 427.90496826171875, "r": 530.0478515625, "b": 646.1396484375, "coord_origin": "TOPLEFT"}, "confidence": 0.9801459908485413, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "body": [{"label": "list_item", "id": 10, "page_no": 13, "cluster": {"id": 10, "label": "list_item", "bbox": {"l": 136.8, "t": 71.50867000000005, "r": 449.9523899999999, "b": 80.72167999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.8751048445701599, "cells": [{"id": 2, "text": "3.", "bbox": {"l": 136.8, "t": 71.50867000000005, "r": 145.22156, "b": 80.72167999999999, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Figure 3-10 shows the masks that are created in the HR_SCHEMA.", "bbox": {"l": 148.02872, "t": 71.50867000000005, "r": 449.9523899999999, "b": 80.72167999999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3. Figure 3-10 shows the masks that are created in the HR_SCHEMA."}, {"label": "caption", "id": 7, "page_no": 13, "cluster": {"id": 7, "label": "caption", "bbox": {"l": 64.800003, "t": 173.53801999999996, "r": 293.13809, "b": 181.86298, "coord_origin": "TOPLEFT"}, "confidence": 0.944426953792572, "cells": [{"id": 4, "text": "Figure 3-10 Column masks shown in System i Navigator", "bbox": {"l": 64.800003, "t": 173.53801999999996, "r": 293.13809, "b": 181.86298, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 3-10 Column masks shown in System i Navigator"}, {"label": "section_header", "id": 2, "page_no": 13, "cluster": {"id": 2, "label": "section_header", "bbox": {"l": 64.800003, "t": 202.37469, "r": 203.98521, "b": 214.36273000000006, "coord_origin": "TOPLEFT"}, "confidence": 0.9645015001296997, "cells": [{"id": 5, "text": "3.6.6", "bbox": {"l": 64.800003, "t": 202.37469, "r": 94.275139, "b": 214.36273000000006, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "Activating RCAC", "bbox": {"l": 97.959534, "t": 202.37469, "r": 203.98521, "b": 214.36273000000006, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3.6.6 Activating RCAC"}, {"label": "text", "id": 1, "page_no": 13, "cluster": {"id": 1, "label": "text", "bbox": {"l": 136.8, "t": 228.52868999999998, "r": 547.22565, "b": 261.74132999999995, "coord_origin": "TOPLEFT"}, "confidence": 0.9768574237823486, "cells": [{"id": 7, "text": "Now that you have created the row permission and the two column masks, RCAC must be ", "bbox": {"l": 136.8, "t": 228.52868999999998, "r": 537.09131, "b": 237.74170000000004, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "activated. The row permission and the two column masks are enabled (last clause in the ", "bbox": {"l": 136.8, "t": 240.5285, "r": 529.20422, "b": 249.74152000000004, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "scripts), but now you must activate RCAC on the table. To do so, complete the following steps:", "bbox": {"l": 136.8, "t": 252.52832, "r": 547.22565, "b": 261.74132999999995, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Now that you have created the row permission and the two column masks, RCAC must be activated. The row permission and the two column masks are enabled (last clause in the scripts), but now you must activate RCAC on the table. To do so, complete the following steps:"}, {"label": "list_item", "id": 9, "page_no": 13, "cluster": {"id": 9, "label": "list_item", "bbox": {"l": 136.8, "t": 269.50811999999996, "r": 409.47888, "b": 278.72113, "coord_origin": "TOPLEFT"}, "confidence": 0.9059441685676575, "cells": [{"id": 10, "text": "1.", "bbox": {"l": 136.8, "t": 269.50811999999996, "r": 145.32378, "b": 278.72113, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Run the SQL statements that are shown in Example 3-10.", "bbox": {"l": 148.16501, "t": 269.50811999999996, "r": 409.47888, "b": 278.72113, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "1. Run the SQL statements that are shown in Example 3-10."}, {"label": "section_header", "id": 11, "page_no": 13, "cluster": {"id": 11, "label": "section_header", "bbox": {"l": 136.8, "t": 291.55798, "r": 375.29099, "b": 299.88300000000004, "coord_origin": "TOPLEFT"}, "confidence": 0.657009482383728, "cells": [{"id": 12, "text": "Example 3-10 Activating RCAC on the EMPLOYEES table ", "bbox": {"l": 136.8, "t": 291.55798, "r": 375.29099, "b": 299.88300000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Example 3-10 Activating RCAC on the EMPLOYEES table"}, {"label": "list_item", "id": 13, "page_no": 13, "cluster": {"id": 13, "label": "list_item", "bbox": {"l": 136.8, "t": 308.65811, "r": 376.67661, "b": 317.43289, "coord_origin": "TOPLEFT"}, "confidence": 0.6002400517463684, "cells": [{"id": 13, "text": "/*", "bbox": {"l": 136.8, "t": 308.65811, "r": 147.22942, "b": 317.43289, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "Active Row Access Control (permissions) */", "bbox": {"l": 157.65884, "t": 308.65811, "r": 376.67661, "b": 317.43289, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "/* Active Row Access Control (permissions) */"}, {"label": "list_item", "id": 14, "page_no": 13, "cluster": {"id": 14, "label": "list_item", "bbox": {"l": 136.8, "t": 320.65793, "r": 354.86963, "b": 329.43271, "coord_origin": "TOPLEFT"}, "confidence": 0.598584771156311, "cells": [{"id": 15, "text": "/*", "bbox": {"l": 136.8, "t": 320.65793, "r": 147.70349, "b": 329.43271, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "Active Column Access Control (masks)", "bbox": {"l": 158.60696, "t": 320.65793, "r": 354.86963, "b": 329.43271, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "/* Active Column Access Control (masks)"}, {"label": "text", "id": 16, "page_no": 13, "cluster": {"id": 16, "label": "text", "bbox": {"l": 365.77313, "t": 320.65793, "r": 376.67661, "b": 329.43271, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 17, "text": "*/", "bbox": {"l": 365.77313, "t": 320.65793, "r": 376.67661, "b": 329.43271, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "*/"}, {"label": "text", "id": 17, "page_no": 13, "cluster": {"id": 17, "label": "text", "bbox": {"l": 136.8, "t": 332.65775, "r": 291.7178, "b": 341.43253, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 18, "text": "ALTER TABLE HR_SCHEMA.EMPLOYEES", "bbox": {"l": 136.8, "t": 332.65775, "r": 291.7178, "b": 341.43253, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "ALTER TABLE HR_SCHEMA.EMPLOYEES"}, {"label": "text", "id": 18, "page_no": 13, "cluster": {"id": 18, "label": "text", "bbox": {"l": 136.8, "t": 344.65756, "r": 271.67831, "b": 353.43234000000007, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 19, "text": "ACTIVATE ROW ACCESS CONTROL", "bbox": {"l": 136.8, "t": 344.65756, "r": 271.67831, "b": 353.43234000000007, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "ACTIVATE ROW ACCESS CONTROL"}, {"label": "text", "id": 15, "page_no": 13, "cluster": {"id": 15, "label": "text", "bbox": {"l": 136.8, "t": 356.65738, "r": 291.7178, "b": 365.43216, "coord_origin": "TOPLEFT"}, "confidence": 0.5431806445121765, "cells": [{"id": 20, "text": "ACTIVATE COLUMN ACCESS CONTROL;", "bbox": {"l": 136.8, "t": 356.65738, "r": 291.7178, "b": 365.43216, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "ACTIVATE COLUMN ACCESS CONTROL;"}, {"label": "list_item", "id": 6, "page_no": 13, "cluster": {"id": 6, "label": "list_item", "bbox": {"l": 136.8, "t": 380.5076, "r": 540.80145, "b": 413.72021, "coord_origin": "TOPLEFT"}, "confidence": 0.9449257850646973, "cells": [{"id": 21, "text": "2.", "bbox": {"l": 136.8, "t": 380.5076, "r": 145.14954, "b": 389.72058, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "Look at the definition of the EMPLOYEE table, as shown in Figure 3-11. To do this, from ", "bbox": {"l": 147.93271, "t": 380.5076, "r": 540.80145, "b": 389.72058, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "the main navigation pane of System i Navigator, click ", "bbox": {"l": 151.20013, "t": 392.50742, "r": 387.36169, "b": 401.7203999999999, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "Schemas", "bbox": {"l": 387.29993, "t": 392.50742, "r": 431.07614, "b": 401.7203999999999, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "\uf0ae", "bbox": {"l": 433.85992000000005, "t": 389.64889999999997, "r": 443.69043, "b": 401.83994, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "HR_SCHEMA", "bbox": {"l": 446.51906999999994, "t": 392.50742, "r": 509.73618000000005, "b": 401.7203999999999, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "\uf0ae", "bbox": {"l": 512.5788, "t": 389.64889999999997, "r": 522.4093, "b": 401.83994, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Tables", "bbox": {"l": 151.19812, "t": 404.50723000000005, "r": 181.12892, "b": 413.72021, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": ", right-click the ", "bbox": {"l": 181.79823, "t": 404.50723000000005, "r": 248.99638, "b": 413.72021, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "EMPLOYEES", "bbox": {"l": 248.93860000000004, "t": 404.50723000000005, "r": 310.44357, "b": 413.72021, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": " table, and click ", "bbox": {"l": 310.49835, "t": 404.50723000000005, "r": 381.53305, "b": 413.72021, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "Definition", "bbox": {"l": 381.59882, "t": 404.50723000000005, "r": 427.68176, "b": 413.72021, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": ".", "bbox": {"l": 427.67877, "t": 404.50723000000005, "r": 430.4476599999999, "b": 413.72021, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2. Look at the definition of the EMPLOYEE table, as shown in Figure 3-11. To do this, from the main navigation pane of System i Navigator, click Schemas \uf0ae HR_SCHEMA \uf0ae Tables , right-click the EMPLOYEES table, and click Definition ."}, {"label": "caption", "id": 5, "page_no": 13, "cluster": {"id": 5, "label": "caption", "bbox": {"l": 64.800003, "t": 649.0378900000001, "r": 347.43054, "b": 657.3629, "coord_origin": "TOPLEFT"}, "confidence": 0.9499983787536621, "cells": [{"id": 34, "text": "Figure 3-11 Selecting the EMPLOYEES table from System i Navigator", "bbox": {"l": 64.800003, "t": 649.0378900000001, "r": 347.43054, "b": 657.3629, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 3-11 Selecting the EMPLOYEES table from System i Navigator"}, {"label": "picture", "id": 3, "page_no": 13, "cluster": {"id": 3, "label": "picture", "bbox": {"l": 63.801902770996094, "t": 95.38241577148438, "r": 547.11474609375, "b": 170.0321502685547, "coord_origin": "TOPLEFT"}, "confidence": 0.9635388851165771, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "picture", "id": 0, "page_no": 13, "cluster": {"id": 0, "label": "picture", "bbox": {"l": 63.985130310058594, "t": 427.90496826171875, "r": 530.0478515625, "b": 646.1396484375, "coord_origin": "TOPLEFT"}, "confidence": 0.9801459908485413, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "headers": [{"label": "page_footer", "id": 8, "page_no": 13, "cluster": {"id": 8, "label": "page_footer", "bbox": {"l": 64.800003, "t": 754.848721, "r": 78.402, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.9161998629570007, "cells": [{"id": 0, "text": "28 ", "bbox": {"l": 64.800003, "t": 754.848721, "r": 78.402, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "28"}, {"label": "page_footer", "id": 4, "page_no": 13, "cluster": {"id": 4, "label": "page_footer", "bbox": {"l": 93.420303, "t": 755.538002, "r": 334.42142, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.9540064334869385, "cells": [{"id": 1, "text": "Row and Column Access Control Support in IBM DB2 for i", "bbox": {"l": 93.420303, "t": 755.538002, "r": 334.42142, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Row and Column Access Control Support in IBM DB2 for i"}]}}, {"page_no": 14, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "Chapter 4. Implementing Row and Column Access Control: Banking example ", "bbox": {"l": 214.8, "t": 755.538002, "r": 523.59357, "b": 763.863001, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "77", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "2.", "bbox": {"l": 136.79959, "t": 71.50903000000005, "r": 145.19554, "b": 80.72204999999985, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Figure 4-68 shows the Visual Explain of the same SQL statement, but with RCAC ", "bbox": {"l": 147.9942, "t": 71.50903000000005, "r": 513.35919, "b": 80.72204999999985, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "enabled. It is clear that the implementation of the SQL statement is more complex ", "bbox": {"l": 151.19975, "t": 83.50885000000017, "r": 514.04858, "b": 92.72185999999999, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "because the row permission rule becomes part of the ", "bbox": {"l": 151.19975, "t": 95.50867000000005, "r": 389.64822, "b": 104.72167999999999, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "WHERE", "bbox": {"l": 389.57941, "t": 95.65808000000015, "r": 414.53918, "b": 104.48266999999998, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": " clause.", "bbox": {"l": 414.59991, "t": 95.50867000000005, "r": 448.8892200000001, "b": 104.72167999999999, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "Figure 4-68 Visual Explain with RCAC enabled", "bbox": {"l": 136.8, "t": 480.55798, "r": 327.09329, "b": 488.883, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "3.", "bbox": {"l": 136.8, "t": 506.56863, "r": 145.17432, "b": 515.78162, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Compare the advised indexes that are provided by the Optimizer without RCAC and with ", "bbox": {"l": 147.96574, "t": 506.56863, "r": 543.63715, "b": 515.78162, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "RCAC enabled. Figure 4-69 shows the index advice for the SQL statement without RCAC ", "bbox": {"l": 151.20016, "t": 518.56845, "r": 547.23944, "b": 527.78143, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "enabled. The index being advised is for the ORDER BY clause.", "bbox": {"l": 151.20016, "t": 530.5682400000001, "r": 430.28333, "b": 539.78125, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "Figure 4-69 Index advice with no RCAC", "bbox": {"l": 64.800003, "t": 667.5179, "r": 227.10149, "b": 675.8429, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 4, "label": "page_footer", "bbox": {"l": 214.8, "t": 755.538002, "r": 523.59357, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.95576012134552, "cells": [{"id": 0, "text": "Chapter 4. Implementing Row and Column Access Control: Banking example ", "bbox": {"l": 214.8, "t": 755.538002, "r": 523.59357, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "page_footer", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.9056528806686401, "cells": [{"id": 1, "text": "77", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "list_item", "bbox": {"l": 136.79959, "t": 71.50903000000005, "r": 514.04858, "b": 104.72167999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9761855006217957, "cells": [{"id": 2, "text": "2.", "bbox": {"l": 136.79959, "t": 71.50903000000005, "r": 145.19554, "b": 80.72204999999985, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Figure 4-68 shows the Visual Explain of the same SQL statement, but with RCAC ", "bbox": {"l": 147.9942, "t": 71.50903000000005, "r": 513.35919, "b": 80.72204999999985, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "enabled. It is clear that the implementation of the SQL statement is more complex ", "bbox": {"l": 151.19975, "t": 83.50885000000017, "r": 514.04858, "b": 92.72185999999999, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "because the row permission rule becomes part of the ", "bbox": {"l": 151.19975, "t": 95.50867000000005, "r": 389.64822, "b": 104.72167999999999, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "WHERE", "bbox": {"l": 389.57941, "t": 95.65808000000015, "r": 414.53918, "b": 104.48266999999998, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": " clause.", "bbox": {"l": 414.59991, "t": 95.50867000000005, "r": 448.8892200000001, "b": 104.72167999999999, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "caption", "bbox": {"l": 136.8, "t": 480.55798, "r": 327.09329, "b": 488.883, "coord_origin": "TOPLEFT"}, "confidence": 0.9529654383659363, "cells": [{"id": 8, "text": "Figure 4-68 Visual Explain with RCAC enabled", "bbox": {"l": 136.8, "t": 480.55798, "r": 327.09329, "b": 488.883, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "list_item", "bbox": {"l": 136.8, "t": 506.56863, "r": 547.23944, "b": 539.78125, "coord_origin": "TOPLEFT"}, "confidence": 0.9766736626625061, "cells": [{"id": 9, "text": "3.", "bbox": {"l": 136.8, "t": 506.56863, "r": 145.17432, "b": 515.78162, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Compare the advised indexes that are provided by the Optimizer without RCAC and with ", "bbox": {"l": 147.96574, "t": 506.56863, "r": 543.63715, "b": 515.78162, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "RCAC enabled. Figure 4-69 shows the index advice for the SQL statement without RCAC ", "bbox": {"l": 151.20016, "t": 518.56845, "r": 547.23944, "b": 527.78143, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "enabled. The index being advised is for the ORDER BY clause.", "bbox": {"l": 151.20016, "t": 530.5682400000001, "r": 430.28333, "b": 539.78125, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "caption", "bbox": {"l": 64.800003, "t": 667.5179, "r": 227.10149, "b": 675.8429, "coord_origin": "TOPLEFT"}, "confidence": 0.9514285922050476, "cells": [{"id": 13, "text": "Figure 4-69 Index advice with no RCAC", "bbox": {"l": 64.800003, "t": 667.5179, "r": 227.10149, "b": 675.8429, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "picture", "bbox": {"l": 136.5016632080078, "t": 119.2491226196289, "r": 545.4508666992188, "b": 477.5412292480469, "coord_origin": "TOPLEFT"}, "confidence": 0.9864527583122253, "cells": [], "children": []}, {"id": 1, "label": "picture", "bbox": {"l": 64.27847290039062, "t": 553.5814819335938, "r": 506.39263916015625, "b": 664.0870971679688, "coord_origin": "TOPLEFT"}, "confidence": 0.9797719120979309, "cells": [], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_footer", "id": 4, "page_no": 14, "cluster": {"id": 4, "label": "page_footer", "bbox": {"l": 214.8, "t": 755.538002, "r": 523.59357, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.95576012134552, "cells": [{"id": 0, "text": "Chapter 4. Implementing Row and Column Access Control: Banking example ", "bbox": {"l": 214.8, "t": 755.538002, "r": 523.59357, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Chapter 4. Implementing Row and Column Access Control: Banking example"}, {"label": "page_footer", "id": 7, "page_no": 14, "cluster": {"id": 7, "label": "page_footer", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.9056528806686401, "cells": [{"id": 1, "text": "77", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "77"}, {"label": "list_item", "id": 3, "page_no": 14, "cluster": {"id": 3, "label": "list_item", "bbox": {"l": 136.79959, "t": 71.50903000000005, "r": 514.04858, "b": 104.72167999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9761855006217957, "cells": [{"id": 2, "text": "2.", "bbox": {"l": 136.79959, "t": 71.50903000000005, "r": 145.19554, "b": 80.72204999999985, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Figure 4-68 shows the Visual Explain of the same SQL statement, but with RCAC ", "bbox": {"l": 147.9942, "t": 71.50903000000005, "r": 513.35919, "b": 80.72204999999985, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "enabled. It is clear that the implementation of the SQL statement is more complex ", "bbox": {"l": 151.19975, "t": 83.50885000000017, "r": 514.04858, "b": 92.72185999999999, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "because the row permission rule becomes part of the ", "bbox": {"l": 151.19975, "t": 95.50867000000005, "r": 389.64822, "b": 104.72167999999999, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "WHERE", "bbox": {"l": 389.57941, "t": 95.65808000000015, "r": 414.53918, "b": 104.48266999999998, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": " clause.", "bbox": {"l": 414.59991, "t": 95.50867000000005, "r": 448.8892200000001, "b": 104.72167999999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2. Figure 4-68 shows the Visual Explain of the same SQL statement, but with RCAC enabled. It is clear that the implementation of the SQL statement is more complex because the row permission rule becomes part of the WHERE clause."}, {"label": "caption", "id": 5, "page_no": 14, "cluster": {"id": 5, "label": "caption", "bbox": {"l": 136.8, "t": 480.55798, "r": 327.09329, "b": 488.883, "coord_origin": "TOPLEFT"}, "confidence": 0.9529654383659363, "cells": [{"id": 8, "text": "Figure 4-68 Visual Explain with RCAC enabled", "bbox": {"l": 136.8, "t": 480.55798, "r": 327.09329, "b": 488.883, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 4-68 Visual Explain with RCAC enabled"}, {"label": "list_item", "id": 2, "page_no": 14, "cluster": {"id": 2, "label": "list_item", "bbox": {"l": 136.8, "t": 506.56863, "r": 547.23944, "b": 539.78125, "coord_origin": "TOPLEFT"}, "confidence": 0.9766736626625061, "cells": [{"id": 9, "text": "3.", "bbox": {"l": 136.8, "t": 506.56863, "r": 145.17432, "b": 515.78162, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Compare the advised indexes that are provided by the Optimizer without RCAC and with ", "bbox": {"l": 147.96574, "t": 506.56863, "r": 543.63715, "b": 515.78162, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "RCAC enabled. Figure 4-69 shows the index advice for the SQL statement without RCAC ", "bbox": {"l": 151.20016, "t": 518.56845, "r": 547.23944, "b": 527.78143, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "enabled. The index being advised is for the ORDER BY clause.", "bbox": {"l": 151.20016, "t": 530.5682400000001, "r": 430.28333, "b": 539.78125, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3. Compare the advised indexes that are provided by the Optimizer without RCAC and with RCAC enabled. Figure 4-69 shows the index advice for the SQL statement without RCAC enabled. The index being advised is for the ORDER BY clause."}, {"label": "caption", "id": 6, "page_no": 14, "cluster": {"id": 6, "label": "caption", "bbox": {"l": 64.800003, "t": 667.5179, "r": 227.10149, "b": 675.8429, "coord_origin": "TOPLEFT"}, "confidence": 0.9514285922050476, "cells": [{"id": 13, "text": "Figure 4-69 Index advice with no RCAC", "bbox": {"l": 64.800003, "t": 667.5179, "r": 227.10149, "b": 675.8429, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 4-69 Index advice with no RCAC"}, {"label": "picture", "id": 0, "page_no": 14, "cluster": {"id": 0, "label": "picture", "bbox": {"l": 136.5016632080078, "t": 119.2491226196289, "r": 545.4508666992188, "b": 477.5412292480469, "coord_origin": "TOPLEFT"}, "confidence": 0.9864527583122253, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "picture", "id": 1, "page_no": 14, "cluster": {"id": 1, "label": "picture", "bbox": {"l": 64.27847290039062, "t": 553.5814819335938, "r": 506.39263916015625, "b": 664.0870971679688, "coord_origin": "TOPLEFT"}, "confidence": 0.9797719120979309, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "body": [{"label": "list_item", "id": 3, "page_no": 14, "cluster": {"id": 3, "label": "list_item", "bbox": {"l": 136.79959, "t": 71.50903000000005, "r": 514.04858, "b": 104.72167999999999, "coord_origin": "TOPLEFT"}, "confidence": 0.9761855006217957, "cells": [{"id": 2, "text": "2.", "bbox": {"l": 136.79959, "t": 71.50903000000005, "r": 145.19554, "b": 80.72204999999985, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Figure 4-68 shows the Visual Explain of the same SQL statement, but with RCAC ", "bbox": {"l": 147.9942, "t": 71.50903000000005, "r": 513.35919, "b": 80.72204999999985, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "enabled. It is clear that the implementation of the SQL statement is more complex ", "bbox": {"l": 151.19975, "t": 83.50885000000017, "r": 514.04858, "b": 92.72185999999999, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "because the row permission rule becomes part of the ", "bbox": {"l": 151.19975, "t": 95.50867000000005, "r": 389.64822, "b": 104.72167999999999, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "WHERE", "bbox": {"l": 389.57941, "t": 95.65808000000015, "r": 414.53918, "b": 104.48266999999998, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": " clause.", "bbox": {"l": 414.59991, "t": 95.50867000000005, "r": 448.8892200000001, "b": 104.72167999999999, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "2. Figure 4-68 shows the Visual Explain of the same SQL statement, but with RCAC enabled. It is clear that the implementation of the SQL statement is more complex because the row permission rule becomes part of the WHERE clause."}, {"label": "caption", "id": 5, "page_no": 14, "cluster": {"id": 5, "label": "caption", "bbox": {"l": 136.8, "t": 480.55798, "r": 327.09329, "b": 488.883, "coord_origin": "TOPLEFT"}, "confidence": 0.9529654383659363, "cells": [{"id": 8, "text": "Figure 4-68 Visual Explain with RCAC enabled", "bbox": {"l": 136.8, "t": 480.55798, "r": 327.09329, "b": 488.883, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 4-68 Visual Explain with RCAC enabled"}, {"label": "list_item", "id": 2, "page_no": 14, "cluster": {"id": 2, "label": "list_item", "bbox": {"l": 136.8, "t": 506.56863, "r": 547.23944, "b": 539.78125, "coord_origin": "TOPLEFT"}, "confidence": 0.9766736626625061, "cells": [{"id": 9, "text": "3.", "bbox": {"l": 136.8, "t": 506.56863, "r": 145.17432, "b": 515.78162, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "Compare the advised indexes that are provided by the Optimizer without RCAC and with ", "bbox": {"l": 147.96574, "t": 506.56863, "r": 543.63715, "b": 515.78162, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "RCAC enabled. Figure 4-69 shows the index advice for the SQL statement without RCAC ", "bbox": {"l": 151.20016, "t": 518.56845, "r": 547.23944, "b": 527.78143, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "enabled. The index being advised is for the ORDER BY clause.", "bbox": {"l": 151.20016, "t": 530.5682400000001, "r": 430.28333, "b": 539.78125, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "3. Compare the advised indexes that are provided by the Optimizer without RCAC and with RCAC enabled. Figure 4-69 shows the index advice for the SQL statement without RCAC enabled. The index being advised is for the ORDER BY clause."}, {"label": "caption", "id": 6, "page_no": 14, "cluster": {"id": 6, "label": "caption", "bbox": {"l": 64.800003, "t": 667.5179, "r": 227.10149, "b": 675.8429, "coord_origin": "TOPLEFT"}, "confidence": 0.9514285922050476, "cells": [{"id": 13, "text": "Figure 4-69 Index advice with no RCAC", "bbox": {"l": 64.800003, "t": 667.5179, "r": 227.10149, "b": 675.8429, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Figure 4-69 Index advice with no RCAC"}, {"label": "picture", "id": 0, "page_no": 14, "cluster": {"id": 0, "label": "picture", "bbox": {"l": 136.5016632080078, "t": 119.2491226196289, "r": 545.4508666992188, "b": 477.5412292480469, "coord_origin": "TOPLEFT"}, "confidence": 0.9864527583122253, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "picture", "id": 1, "page_no": 14, "cluster": {"id": 1, "label": "picture", "bbox": {"l": 64.27847290039062, "t": 553.5814819335938, "r": 506.39263916015625, "b": 664.0870971679688, "coord_origin": "TOPLEFT"}, "confidence": 0.9797719120979309, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "headers": [{"label": "page_footer", "id": 4, "page_no": 14, "cluster": {"id": 4, "label": "page_footer", "bbox": {"l": 214.8, "t": 755.538002, "r": 523.59357, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.95576012134552, "cells": [{"id": 0, "text": "Chapter 4. Implementing Row and Column Access Control: Banking example ", "bbox": {"l": 214.8, "t": 755.538002, "r": 523.59357, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Chapter 4. Implementing Row and Column Access Control: Banking example"}, {"label": "page_footer", "id": 7, "page_no": 14, "cluster": {"id": 7, "label": "page_footer", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.9056528806686401, "cells": [{"id": 1, "text": "77", "bbox": {"l": 536.09998, "t": 754.848721, "r": 547.25916, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "77"}]}}, {"page_no": 15, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "124 ", "bbox": {"l": 64.800003, "t": 754.848721, "r": 83.982002, "b": 764.06172, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Row and Column Access Control Support in IBM DB2 for i", "bbox": {"l": 98.940002, "t": 755.538002, "r": 339.81958, "b": 763.863001, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "THEN C . CUSTOMER_TAX_ID ", "bbox": {"l": 64.800308, "t": 71.67296999999996, "r": 177.1194, "b": 79.60199, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'TELLER' ) = 1 ", "bbox": {"l": 64.800308, "t": 82.65295000000015, "r": 365.87817, "b": 90.58196999999996, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "THEN ( 'XXX-XX-' CONCAT QSYS2 . SUBSTR ( C . CUSTOMER_TAX_ID , 8 , 4 ) ) ", "bbox": {"l": 64.800308, "t": 93.63292999999999, "r": 392.81787, "b": 101.56195000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 ", "bbox": {"l": 64.800308, "t": 104.67322000000001, "r": 374.87817, "b": 112.60222999999996, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "THEN C . CUSTOMER_TAX_ID ", "bbox": {"l": 64.800308, "t": 115.65319999999997, "r": 177.1194, "b": 123.58220999999992, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "ELSE 'XXX-XX-XXXX' ", "bbox": {"l": 64.800308, "t": 126.63318000000015, "r": 150.1797, "b": 134.56219, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "END ", "bbox": {"l": 64.800308, "t": 137.67345999999998, "r": 96.240005, "b": 145.60248, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "ENABLE ; ", "bbox": {"l": 79.20031, "t": 148.65344000000005, "r": 124.14001, "b": 156.58245999999997, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "CREATE MASK BANK_SCHEMA.MASK_DRIVERS_LICENSE_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C ", "bbox": {"l": 64.800308, "t": 170.67377, "r": 460.25757, "b": 178.60278000000005, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "FOR COLUMN CUSTOMER_DRIVERS_LICENSE_NUMBER ", "bbox": {"l": 79.20031, "t": 181.65374999999995, "r": 272.45911, "b": 189.58276, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "RETURN CASE ", "bbox": {"l": 79.20031, "t": 192.69403, "r": 137.64001, "b": 200.62305000000003, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 ", "bbox": {"l": 64.800308, "t": 203.67400999999995, "r": 361.37817, "b": 211.60303, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "THEN C . CUSTOMER_DRIVERS_LICENSE_NUMBER ", "bbox": {"l": 64.800308, "t": 214.65399000000002, "r": 249.0591, "b": 222.58300999999994, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'TELLER' ) = 1 ", "bbox": {"l": 64.800308, "t": 225.69426999999996, "r": 365.87817, "b": 233.62329, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "THEN C . CUSTOMER_DRIVERS_LICENSE_NUMBER ", "bbox": {"l": 64.800308, "t": 236.67426, "r": 249.0591, "b": 244.60326999999995, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 ", "bbox": {"l": 64.800308, "t": 247.65423999999996, "r": 374.87817, "b": 255.58325000000002, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "THEN C . CUSTOMER_DRIVERS_LICENSE_NUMBER ", "bbox": {"l": 64.800308, "t": 258.69452, "r": 249.0591, "b": 266.62354000000005, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "ELSE '*************' ", "bbox": {"l": 64.800308, "t": 269.67449999999997, "r": 159.1797, "b": 277.60352, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "END ", "bbox": {"l": 64.800308, "t": 280.65454, "r": 96.240005, "b": 288.58353, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "ENABLE ; ", "bbox": {"l": 79.20031, "t": 291.69485000000003, "r": 124.14001, "b": 299.62384, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "CREATE MASK BANK_SCHEMA.MASK_LOGIN_ID_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C ", "bbox": {"l": 64.800308, "t": 313.65485, "r": 428.81786999999997, "b": 321.58383, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "FOR COLUMN CUSTOMER_LOGIN_ID ", "bbox": {"l": 79.20031, "t": 324.69516, "r": 209.51941, "b": 332.62415, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "RETURN CASE ", "bbox": {"l": 79.20031, "t": 335.67517, "r": 137.64001, "b": 343.6041599999999, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 ", "bbox": {"l": 64.800308, "t": 346.65518, "r": 361.37817, "b": 354.58417, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "THEN C . CUSTOMER_LOGIN_ID ", "bbox": {"l": 64.800308, "t": 357.69550000000004, "r": 186.1194, "b": 365.62448, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 ", "bbox": {"l": 64.800308, "t": 368.67551, "r": 374.87817, "b": 376.60449, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "THEN C . CUSTOMER_LOGIN_ID ", "bbox": {"l": 64.800308, "t": 379.65552, "r": 186.1194, "b": 387.5845, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "ELSE '*****' ", "bbox": {"l": 64.800308, "t": 390.69583, "r": 123.24001, "b": 398.62482, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "END ", "bbox": {"l": 64.800308, "t": 401.67584, "r": 96.240005, "b": 409.60482999999994, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "ENABLE ; ", "bbox": {"l": 79.20031, "t": 412.65585, "r": 124.14001, "b": 420.58484, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "CREATE MASK BANK_SCHEMA.MASK_SECURITY_QUESTION_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C ", "bbox": {"l": 64.800308, "t": 434.67615, "r": 469.25757, "b": 442.60513, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "FOR COLUMN CUSTOMER_SECURITY_QUESTION ", "bbox": {"l": 79.20031, "t": 445.65616000000006, "r": 249.95911, "b": 453.58514, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "RETURN CASE ", "bbox": {"l": 79.20031, "t": 456.6964699999999, "r": 137.64001, "b": 464.62546, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 ", "bbox": {"l": 64.800308, "t": 467.67648, "r": 361.37817, "b": 475.60547, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "THEN C . CUSTOMER_SECURITY_QUESTION ", "bbox": {"l": 64.800308, "t": 478.65649, "r": 226.5591, "b": 486.58548, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 ", "bbox": {"l": 64.800308, "t": 489.69681, "r": 374.87817, "b": 497.62579, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "THEN C . CUSTOMER_SECURITY_QUESTION ", "bbox": {"l": 64.800308, "t": 500.67682, "r": 226.5591, "b": 508.6058, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "ELSE '*****' ", "bbox": {"l": 64.800308, "t": 511.65683, "r": 123.24001, "b": 519.58582, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "END ", "bbox": {"l": 64.800308, "t": 522.69714, "r": 96.240005, "b": 530.62613, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "ENABLE ; ", "bbox": {"l": 79.20031, "t": 533.6771200000001, "r": 124.14001, "b": 541.60614, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "CREATE MASK BANK_SCHEMA.MASK_SECURITY_QUESTION_ANSWER_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C ", "bbox": {"l": 64.800308, "t": 555.69745, "r": 500.69727, "b": 563.62645, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "FOR COLUMN CUSTOMER_SECURITY_QUESTION_ANSWER ", "bbox": {"l": 79.20031, "t": 566.6774399999999, "r": 281.3988, "b": 574.60645, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "RETURN CASE ", "bbox": {"l": 79.20031, "t": 577.65744, "r": 137.64001, "b": 585.58644, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 ", "bbox": {"l": 64.800308, "t": 588.6977400000001, "r": 361.37817, "b": 596.62674, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "THEN C . CUSTOMER_SECURITY_QUESTION_ANSWER ", "bbox": {"l": 64.800308, "t": 599.67773, "r": 258.05908, "b": 607.60674, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 ", "bbox": {"l": 64.800308, "t": 610.65773, "r": 374.87817, "b": 618.58673, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "THEN C . CUSTOMER_SECURITY_QUESTION_ANSWER ", "bbox": {"l": 64.800308, "t": 621.69803, "r": 258.05908, "b": 629.62703, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "ELSE '*****' ", "bbox": {"l": 64.800308, "t": 632.6780200000001, "r": 123.24001, "b": 640.60703, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "END ", "bbox": {"l": 64.800308, "t": 643.71832, "r": 96.240005, "b": 651.64732, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "ENABLE ; ", "bbox": {"l": 79.20031, "t": 654.69832, "r": 124.14001, "b": 662.62732, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "ALTER TABLE BANK_SCHEMA.CUSTOMERS ", "bbox": {"l": 64.800308, "t": 676.71861, "r": 226.5591, "b": 684.64761, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "ACTIVATE ROW ACCESS CONTROL ", "bbox": {"l": 79.20031, "t": 687.69862, "r": 214.01941, "b": 695.627617, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "ACTIVATE COLUMN ACCESS CONTROL ;", "bbox": {"l": 79.20031, "t": 698.678619, "r": 223.01941, "b": 706.60762, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 1, "label": "page_footer", "bbox": {"l": 64.800003, "t": 754.848721, "r": 83.982002, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.8994001150131226, "cells": [{"id": 0, "text": "124 ", "bbox": {"l": 64.800003, "t": 754.848721, "r": 83.982002, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "page_footer", "bbox": {"l": 98.940002, "t": 755.538002, "r": 339.81958, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.943077027797699, "cells": [{"id": 1, "text": "Row and Column Access Control Support in IBM DB2 for i", "bbox": {"l": 98.940002, "t": 755.538002, "r": 339.81958, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "code", "bbox": {"l": 64.800308, "t": 71.67296999999996, "r": 500.69727, "b": 706.60762, "coord_origin": "TOPLEFT"}, "confidence": 0.7632161378860474, "cells": [{"id": 2, "text": "THEN C . CUSTOMER_TAX_ID ", "bbox": {"l": 64.800308, "t": 71.67296999999996, "r": 177.1194, "b": 79.60199, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'TELLER' ) = 1 ", "bbox": {"l": 64.800308, "t": 82.65295000000015, "r": 365.87817, "b": 90.58196999999996, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "THEN ( 'XXX-XX-' CONCAT QSYS2 . SUBSTR ( C . CUSTOMER_TAX_ID , 8 , 4 ) ) ", "bbox": {"l": 64.800308, "t": 93.63292999999999, "r": 392.81787, "b": 101.56195000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 ", "bbox": {"l": 64.800308, "t": 104.67322000000001, "r": 374.87817, "b": 112.60222999999996, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "THEN C . CUSTOMER_TAX_ID ", "bbox": {"l": 64.800308, "t": 115.65319999999997, "r": 177.1194, "b": 123.58220999999992, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "ELSE 'XXX-XX-XXXX' ", "bbox": {"l": 64.800308, "t": 126.63318000000015, "r": 150.1797, "b": 134.56219, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "END ", "bbox": {"l": 64.800308, "t": 137.67345999999998, "r": 96.240005, "b": 145.60248, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "ENABLE ; ", "bbox": {"l": 79.20031, "t": 148.65344000000005, "r": 124.14001, "b": 156.58245999999997, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "CREATE MASK BANK_SCHEMA.MASK_DRIVERS_LICENSE_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C ", "bbox": {"l": 64.800308, "t": 170.67377, "r": 460.25757, "b": 178.60278000000005, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "FOR COLUMN CUSTOMER_DRIVERS_LICENSE_NUMBER ", "bbox": {"l": 79.20031, "t": 181.65374999999995, "r": 272.45911, "b": 189.58276, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "RETURN CASE ", "bbox": {"l": 79.20031, "t": 192.69403, "r": 137.64001, "b": 200.62305000000003, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 ", "bbox": {"l": 64.800308, "t": 203.67400999999995, "r": 361.37817, "b": 211.60303, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "THEN C . CUSTOMER_DRIVERS_LICENSE_NUMBER ", "bbox": {"l": 64.800308, "t": 214.65399000000002, "r": 249.0591, "b": 222.58300999999994, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'TELLER' ) = 1 ", "bbox": {"l": 64.800308, "t": 225.69426999999996, "r": 365.87817, "b": 233.62329, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "THEN C . CUSTOMER_DRIVERS_LICENSE_NUMBER ", "bbox": {"l": 64.800308, "t": 236.67426, "r": 249.0591, "b": 244.60326999999995, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 ", "bbox": {"l": 64.800308, "t": 247.65423999999996, "r": 374.87817, "b": 255.58325000000002, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "THEN C . CUSTOMER_DRIVERS_LICENSE_NUMBER ", "bbox": {"l": 64.800308, "t": 258.69452, "r": 249.0591, "b": 266.62354000000005, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "ELSE '*************' ", "bbox": {"l": 64.800308, "t": 269.67449999999997, "r": 159.1797, "b": 277.60352, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "END ", "bbox": {"l": 64.800308, "t": 280.65454, "r": 96.240005, "b": 288.58353, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "ENABLE ; ", "bbox": {"l": 79.20031, "t": 291.69485000000003, "r": 124.14001, "b": 299.62384, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "CREATE MASK BANK_SCHEMA.MASK_LOGIN_ID_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C ", "bbox": {"l": 64.800308, "t": 313.65485, "r": 428.81786999999997, "b": 321.58383, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "FOR COLUMN CUSTOMER_LOGIN_ID ", "bbox": {"l": 79.20031, "t": 324.69516, "r": 209.51941, "b": 332.62415, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "RETURN CASE ", "bbox": {"l": 79.20031, "t": 335.67517, "r": 137.64001, "b": 343.6041599999999, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 ", "bbox": {"l": 64.800308, "t": 346.65518, "r": 361.37817, "b": 354.58417, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "THEN C . CUSTOMER_LOGIN_ID ", "bbox": {"l": 64.800308, "t": 357.69550000000004, "r": 186.1194, "b": 365.62448, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 ", "bbox": {"l": 64.800308, "t": 368.67551, "r": 374.87817, "b": 376.60449, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "THEN C . CUSTOMER_LOGIN_ID ", "bbox": {"l": 64.800308, "t": 379.65552, "r": 186.1194, "b": 387.5845, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "ELSE '*****' ", "bbox": {"l": 64.800308, "t": 390.69583, "r": 123.24001, "b": 398.62482, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "END ", "bbox": {"l": 64.800308, "t": 401.67584, "r": 96.240005, "b": 409.60482999999994, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "ENABLE ; ", "bbox": {"l": 79.20031, "t": 412.65585, "r": 124.14001, "b": 420.58484, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "CREATE MASK BANK_SCHEMA.MASK_SECURITY_QUESTION_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C ", "bbox": {"l": 64.800308, "t": 434.67615, "r": 469.25757, "b": 442.60513, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "FOR COLUMN CUSTOMER_SECURITY_QUESTION ", "bbox": {"l": 79.20031, "t": 445.65616000000006, "r": 249.95911, "b": 453.58514, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "RETURN CASE ", "bbox": {"l": 79.20031, "t": 456.6964699999999, "r": 137.64001, "b": 464.62546, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 ", "bbox": {"l": 64.800308, "t": 467.67648, "r": 361.37817, "b": 475.60547, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "THEN C . CUSTOMER_SECURITY_QUESTION ", "bbox": {"l": 64.800308, "t": 478.65649, "r": 226.5591, "b": 486.58548, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 ", "bbox": {"l": 64.800308, "t": 489.69681, "r": 374.87817, "b": 497.62579, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "THEN C . CUSTOMER_SECURITY_QUESTION ", "bbox": {"l": 64.800308, "t": 500.67682, "r": 226.5591, "b": 508.6058, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "ELSE '*****' ", "bbox": {"l": 64.800308, "t": 511.65683, "r": 123.24001, "b": 519.58582, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "END ", "bbox": {"l": 64.800308, "t": 522.69714, "r": 96.240005, "b": 530.62613, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "ENABLE ; ", "bbox": {"l": 79.20031, "t": 533.6771200000001, "r": 124.14001, "b": 541.60614, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "CREATE MASK BANK_SCHEMA.MASK_SECURITY_QUESTION_ANSWER_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C ", "bbox": {"l": 64.800308, "t": 555.69745, "r": 500.69727, "b": 563.62645, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "FOR COLUMN CUSTOMER_SECURITY_QUESTION_ANSWER ", "bbox": {"l": 79.20031, "t": 566.6774399999999, "r": 281.3988, "b": 574.60645, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "RETURN CASE ", "bbox": {"l": 79.20031, "t": 577.65744, "r": 137.64001, "b": 585.58644, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 ", "bbox": {"l": 64.800308, "t": 588.6977400000001, "r": 361.37817, "b": 596.62674, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "THEN C . CUSTOMER_SECURITY_QUESTION_ANSWER ", "bbox": {"l": 64.800308, "t": 599.67773, "r": 258.05908, "b": 607.60674, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 ", "bbox": {"l": 64.800308, "t": 610.65773, "r": 374.87817, "b": 618.58673, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "THEN C . CUSTOMER_SECURITY_QUESTION_ANSWER ", "bbox": {"l": 64.800308, "t": 621.69803, "r": 258.05908, "b": 629.62703, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "ELSE '*****' ", "bbox": {"l": 64.800308, "t": 632.6780200000001, "r": 123.24001, "b": 640.60703, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "END ", "bbox": {"l": 64.800308, "t": 643.71832, "r": 96.240005, "b": 651.64732, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "ENABLE ; ", "bbox": {"l": 79.20031, "t": 654.69832, "r": 124.14001, "b": 662.62732, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "ALTER TABLE BANK_SCHEMA.CUSTOMERS ", "bbox": {"l": 64.800308, "t": 676.71861, "r": 226.5591, "b": 684.64761, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "ACTIVATE ROW ACCESS CONTROL ", "bbox": {"l": 79.20031, "t": 687.69862, "r": 214.01941, "b": 695.627617, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "ACTIVATE COLUMN ACCESS CONTROL ;", "bbox": {"l": 79.20031, "t": 698.678619, "r": 223.01941, "b": 706.60762, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "page_footer", "id": 1, "page_no": 15, "cluster": {"id": 1, "label": "page_footer", "bbox": {"l": 64.800003, "t": 754.848721, "r": 83.982002, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.8994001150131226, "cells": [{"id": 0, "text": "124 ", "bbox": {"l": 64.800003, "t": 754.848721, "r": 83.982002, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "124"}, {"label": "page_footer", "id": 0, "page_no": 15, "cluster": {"id": 0, "label": "page_footer", "bbox": {"l": 98.940002, "t": 755.538002, "r": 339.81958, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.943077027797699, "cells": [{"id": 1, "text": "Row and Column Access Control Support in IBM DB2 for i", "bbox": {"l": 98.940002, "t": 755.538002, "r": 339.81958, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Row and Column Access Control Support in IBM DB2 for i"}, {"label": "code", "id": 2, "page_no": 15, "cluster": {"id": 2, "label": "code", "bbox": {"l": 64.800308, "t": 71.67296999999996, "r": 500.69727, "b": 706.60762, "coord_origin": "TOPLEFT"}, "confidence": 0.7632161378860474, "cells": [{"id": 2, "text": "THEN C . CUSTOMER_TAX_ID ", "bbox": {"l": 64.800308, "t": 71.67296999999996, "r": 177.1194, "b": 79.60199, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'TELLER' ) = 1 ", "bbox": {"l": 64.800308, "t": 82.65295000000015, "r": 365.87817, "b": 90.58196999999996, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "THEN ( 'XXX-XX-' CONCAT QSYS2 . SUBSTR ( C . CUSTOMER_TAX_ID , 8 , 4 ) ) ", "bbox": {"l": 64.800308, "t": 93.63292999999999, "r": 392.81787, "b": 101.56195000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 ", "bbox": {"l": 64.800308, "t": 104.67322000000001, "r": 374.87817, "b": 112.60222999999996, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "THEN C . CUSTOMER_TAX_ID ", "bbox": {"l": 64.800308, "t": 115.65319999999997, "r": 177.1194, "b": 123.58220999999992, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "ELSE 'XXX-XX-XXXX' ", "bbox": {"l": 64.800308, "t": 126.63318000000015, "r": 150.1797, "b": 134.56219, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "END ", "bbox": {"l": 64.800308, "t": 137.67345999999998, "r": 96.240005, "b": 145.60248, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "ENABLE ; ", "bbox": {"l": 79.20031, "t": 148.65344000000005, "r": 124.14001, "b": 156.58245999999997, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "CREATE MASK BANK_SCHEMA.MASK_DRIVERS_LICENSE_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C ", "bbox": {"l": 64.800308, "t": 170.67377, "r": 460.25757, "b": 178.60278000000005, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "FOR COLUMN CUSTOMER_DRIVERS_LICENSE_NUMBER ", "bbox": {"l": 79.20031, "t": 181.65374999999995, "r": 272.45911, "b": 189.58276, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "RETURN CASE ", "bbox": {"l": 79.20031, "t": 192.69403, "r": 137.64001, "b": 200.62305000000003, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 ", "bbox": {"l": 64.800308, "t": 203.67400999999995, "r": 361.37817, "b": 211.60303, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "THEN C . CUSTOMER_DRIVERS_LICENSE_NUMBER ", "bbox": {"l": 64.800308, "t": 214.65399000000002, "r": 249.0591, "b": 222.58300999999994, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'TELLER' ) = 1 ", "bbox": {"l": 64.800308, "t": 225.69426999999996, "r": 365.87817, "b": 233.62329, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "THEN C . CUSTOMER_DRIVERS_LICENSE_NUMBER ", "bbox": {"l": 64.800308, "t": 236.67426, "r": 249.0591, "b": 244.60326999999995, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 ", "bbox": {"l": 64.800308, "t": 247.65423999999996, "r": 374.87817, "b": 255.58325000000002, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "THEN C . CUSTOMER_DRIVERS_LICENSE_NUMBER ", "bbox": {"l": 64.800308, "t": 258.69452, "r": 249.0591, "b": 266.62354000000005, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "ELSE '*************' ", "bbox": {"l": 64.800308, "t": 269.67449999999997, "r": 159.1797, "b": 277.60352, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "END ", "bbox": {"l": 64.800308, "t": 280.65454, "r": 96.240005, "b": 288.58353, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "ENABLE ; ", "bbox": {"l": 79.20031, "t": 291.69485000000003, "r": 124.14001, "b": 299.62384, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "CREATE MASK BANK_SCHEMA.MASK_LOGIN_ID_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C ", "bbox": {"l": 64.800308, "t": 313.65485, "r": 428.81786999999997, "b": 321.58383, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "FOR COLUMN CUSTOMER_LOGIN_ID ", "bbox": {"l": 79.20031, "t": 324.69516, "r": 209.51941, "b": 332.62415, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "RETURN CASE ", "bbox": {"l": 79.20031, "t": 335.67517, "r": 137.64001, "b": 343.6041599999999, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 ", "bbox": {"l": 64.800308, "t": 346.65518, "r": 361.37817, "b": 354.58417, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "THEN C . CUSTOMER_LOGIN_ID ", "bbox": {"l": 64.800308, "t": 357.69550000000004, "r": 186.1194, "b": 365.62448, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 ", "bbox": {"l": 64.800308, "t": 368.67551, "r": 374.87817, "b": 376.60449, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "THEN C . CUSTOMER_LOGIN_ID ", "bbox": {"l": 64.800308, "t": 379.65552, "r": 186.1194, "b": 387.5845, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "ELSE '*****' ", "bbox": {"l": 64.800308, "t": 390.69583, "r": 123.24001, "b": 398.62482, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "END ", "bbox": {"l": 64.800308, "t": 401.67584, "r": 96.240005, "b": 409.60482999999994, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "ENABLE ; ", "bbox": {"l": 79.20031, "t": 412.65585, "r": 124.14001, "b": 420.58484, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "CREATE MASK BANK_SCHEMA.MASK_SECURITY_QUESTION_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C ", "bbox": {"l": 64.800308, "t": 434.67615, "r": 469.25757, "b": 442.60513, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "FOR COLUMN CUSTOMER_SECURITY_QUESTION ", "bbox": {"l": 79.20031, "t": 445.65616000000006, "r": 249.95911, "b": 453.58514, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "RETURN CASE ", "bbox": {"l": 79.20031, "t": 456.6964699999999, "r": 137.64001, "b": 464.62546, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 ", "bbox": {"l": 64.800308, "t": 467.67648, "r": 361.37817, "b": 475.60547, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "THEN C . CUSTOMER_SECURITY_QUESTION ", "bbox": {"l": 64.800308, "t": 478.65649, "r": 226.5591, "b": 486.58548, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 ", "bbox": {"l": 64.800308, "t": 489.69681, "r": 374.87817, "b": 497.62579, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "THEN C . CUSTOMER_SECURITY_QUESTION ", "bbox": {"l": 64.800308, "t": 500.67682, "r": 226.5591, "b": 508.6058, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "ELSE '*****' ", "bbox": {"l": 64.800308, "t": 511.65683, "r": 123.24001, "b": 519.58582, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "END ", "bbox": {"l": 64.800308, "t": 522.69714, "r": 96.240005, "b": 530.62613, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "ENABLE ; ", "bbox": {"l": 79.20031, "t": 533.6771200000001, "r": 124.14001, "b": 541.60614, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "CREATE MASK BANK_SCHEMA.MASK_SECURITY_QUESTION_ANSWER_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C ", "bbox": {"l": 64.800308, "t": 555.69745, "r": 500.69727, "b": 563.62645, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "FOR COLUMN CUSTOMER_SECURITY_QUESTION_ANSWER ", "bbox": {"l": 79.20031, "t": 566.6774399999999, "r": 281.3988, "b": 574.60645, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "RETURN CASE ", "bbox": {"l": 79.20031, "t": 577.65744, "r": 137.64001, "b": 585.58644, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 ", "bbox": {"l": 64.800308, "t": 588.6977400000001, "r": 361.37817, "b": 596.62674, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "THEN C . CUSTOMER_SECURITY_QUESTION_ANSWER ", "bbox": {"l": 64.800308, "t": 599.67773, "r": 258.05908, "b": 607.60674, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 ", "bbox": {"l": 64.800308, "t": 610.65773, "r": 374.87817, "b": 618.58673, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "THEN C . CUSTOMER_SECURITY_QUESTION_ANSWER ", "bbox": {"l": 64.800308, "t": 621.69803, "r": 258.05908, "b": 629.62703, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "ELSE '*****' ", "bbox": {"l": 64.800308, "t": 632.6780200000001, "r": 123.24001, "b": 640.60703, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "END ", "bbox": {"l": 64.800308, "t": 643.71832, "r": 96.240005, "b": 651.64732, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "ENABLE ; ", "bbox": {"l": 79.20031, "t": 654.69832, "r": 124.14001, "b": 662.62732, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "ALTER TABLE BANK_SCHEMA.CUSTOMERS ", "bbox": {"l": 64.800308, "t": 676.71861, "r": 226.5591, "b": 684.64761, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "ACTIVATE ROW ACCESS CONTROL ", "bbox": {"l": 79.20031, "t": 687.69862, "r": 214.01941, "b": 695.627617, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "ACTIVATE COLUMN ACCESS CONTROL ;", "bbox": {"l": 79.20031, "t": 698.678619, "r": 223.01941, "b": 706.60762, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "THEN C . CUSTOMER_TAX_ID WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'TELLER' ) = 1 THEN ( 'XXX-XX-' CONCAT QSYS2 . SUBSTR ( C . CUSTOMER_TAX_ID , 8 , 4 ) ) WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 THEN C . CUSTOMER_TAX_ID ELSE 'XXX-XX-XXXX' END ENABLE ; CREATE MASK BANK_SCHEMA.MASK_DRIVERS_LICENSE_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C FOR COLUMN CUSTOMER_DRIVERS_LICENSE_NUMBER RETURN CASE WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 THEN C . CUSTOMER_DRIVERS_LICENSE_NUMBER WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'TELLER' ) = 1 THEN C . CUSTOMER_DRIVERS_LICENSE_NUMBER WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 THEN C . CUSTOMER_DRIVERS_LICENSE_NUMBER ELSE '*************' END ENABLE ; CREATE MASK BANK_SCHEMA.MASK_LOGIN_ID_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C FOR COLUMN CUSTOMER_LOGIN_ID RETURN CASE WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 THEN C . CUSTOMER_LOGIN_ID WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 THEN C . CUSTOMER_LOGIN_ID ELSE '*****' END ENABLE ; CREATE MASK BANK_SCHEMA.MASK_SECURITY_QUESTION_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C FOR COLUMN CUSTOMER_SECURITY_QUESTION RETURN CASE WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 THEN C . CUSTOMER_SECURITY_QUESTION WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 THEN C . CUSTOMER_SECURITY_QUESTION ELSE '*****' END ENABLE ; CREATE MASK BANK_SCHEMA.MASK_SECURITY_QUESTION_ANSWER_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C FOR COLUMN CUSTOMER_SECURITY_QUESTION_ANSWER RETURN CASE WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 THEN C . CUSTOMER_SECURITY_QUESTION_ANSWER WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 THEN C . CUSTOMER_SECURITY_QUESTION_ANSWER ELSE '*****' END ENABLE ; ALTER TABLE BANK_SCHEMA.CUSTOMERS ACTIVATE ROW ACCESS CONTROL ACTIVATE COLUMN ACCESS CONTROL ;"}], "body": [{"label": "code", "id": 2, "page_no": 15, "cluster": {"id": 2, "label": "code", "bbox": {"l": 64.800308, "t": 71.67296999999996, "r": 500.69727, "b": 706.60762, "coord_origin": "TOPLEFT"}, "confidence": 0.7632161378860474, "cells": [{"id": 2, "text": "THEN C . CUSTOMER_TAX_ID ", "bbox": {"l": 64.800308, "t": 71.67296999999996, "r": 177.1194, "b": 79.60199, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'TELLER' ) = 1 ", "bbox": {"l": 64.800308, "t": 82.65295000000015, "r": 365.87817, "b": 90.58196999999996, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "THEN ( 'XXX-XX-' CONCAT QSYS2 . SUBSTR ( C . CUSTOMER_TAX_ID , 8 , 4 ) ) ", "bbox": {"l": 64.800308, "t": 93.63292999999999, "r": 392.81787, "b": 101.56195000000002, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 ", "bbox": {"l": 64.800308, "t": 104.67322000000001, "r": 374.87817, "b": 112.60222999999996, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "THEN C . CUSTOMER_TAX_ID ", "bbox": {"l": 64.800308, "t": 115.65319999999997, "r": 177.1194, "b": 123.58220999999992, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "ELSE 'XXX-XX-XXXX' ", "bbox": {"l": 64.800308, "t": 126.63318000000015, "r": 150.1797, "b": 134.56219, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "END ", "bbox": {"l": 64.800308, "t": 137.67345999999998, "r": 96.240005, "b": 145.60248, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "ENABLE ; ", "bbox": {"l": 79.20031, "t": 148.65344000000005, "r": 124.14001, "b": 156.58245999999997, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "CREATE MASK BANK_SCHEMA.MASK_DRIVERS_LICENSE_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C ", "bbox": {"l": 64.800308, "t": 170.67377, "r": 460.25757, "b": 178.60278000000005, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "FOR COLUMN CUSTOMER_DRIVERS_LICENSE_NUMBER ", "bbox": {"l": 79.20031, "t": 181.65374999999995, "r": 272.45911, "b": 189.58276, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "RETURN CASE ", "bbox": {"l": 79.20031, "t": 192.69403, "r": 137.64001, "b": 200.62305000000003, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 ", "bbox": {"l": 64.800308, "t": 203.67400999999995, "r": 361.37817, "b": 211.60303, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "THEN C . CUSTOMER_DRIVERS_LICENSE_NUMBER ", "bbox": {"l": 64.800308, "t": 214.65399000000002, "r": 249.0591, "b": 222.58300999999994, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'TELLER' ) = 1 ", "bbox": {"l": 64.800308, "t": 225.69426999999996, "r": 365.87817, "b": 233.62329, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "THEN C . CUSTOMER_DRIVERS_LICENSE_NUMBER ", "bbox": {"l": 64.800308, "t": 236.67426, "r": 249.0591, "b": 244.60326999999995, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 ", "bbox": {"l": 64.800308, "t": 247.65423999999996, "r": 374.87817, "b": 255.58325000000002, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "THEN C . CUSTOMER_DRIVERS_LICENSE_NUMBER ", "bbox": {"l": 64.800308, "t": 258.69452, "r": 249.0591, "b": 266.62354000000005, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "ELSE '*************' ", "bbox": {"l": 64.800308, "t": 269.67449999999997, "r": 159.1797, "b": 277.60352, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "END ", "bbox": {"l": 64.800308, "t": 280.65454, "r": 96.240005, "b": 288.58353, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "ENABLE ; ", "bbox": {"l": 79.20031, "t": 291.69485000000003, "r": 124.14001, "b": 299.62384, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "CREATE MASK BANK_SCHEMA.MASK_LOGIN_ID_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C ", "bbox": {"l": 64.800308, "t": 313.65485, "r": 428.81786999999997, "b": 321.58383, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "FOR COLUMN CUSTOMER_LOGIN_ID ", "bbox": {"l": 79.20031, "t": 324.69516, "r": 209.51941, "b": 332.62415, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "RETURN CASE ", "bbox": {"l": 79.20031, "t": 335.67517, "r": 137.64001, "b": 343.6041599999999, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 ", "bbox": {"l": 64.800308, "t": 346.65518, "r": 361.37817, "b": 354.58417, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "THEN C . CUSTOMER_LOGIN_ID ", "bbox": {"l": 64.800308, "t": 357.69550000000004, "r": 186.1194, "b": 365.62448, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 ", "bbox": {"l": 64.800308, "t": 368.67551, "r": 374.87817, "b": 376.60449, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "THEN C . CUSTOMER_LOGIN_ID ", "bbox": {"l": 64.800308, "t": 379.65552, "r": 186.1194, "b": 387.5845, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "ELSE '*****' ", "bbox": {"l": 64.800308, "t": 390.69583, "r": 123.24001, "b": 398.62482, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "END ", "bbox": {"l": 64.800308, "t": 401.67584, "r": 96.240005, "b": 409.60482999999994, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "ENABLE ; ", "bbox": {"l": 79.20031, "t": 412.65585, "r": 124.14001, "b": 420.58484, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "CREATE MASK BANK_SCHEMA.MASK_SECURITY_QUESTION_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C ", "bbox": {"l": 64.800308, "t": 434.67615, "r": 469.25757, "b": 442.60513, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "FOR COLUMN CUSTOMER_SECURITY_QUESTION ", "bbox": {"l": 79.20031, "t": 445.65616000000006, "r": 249.95911, "b": 453.58514, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "RETURN CASE ", "bbox": {"l": 79.20031, "t": 456.6964699999999, "r": 137.64001, "b": 464.62546, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 ", "bbox": {"l": 64.800308, "t": 467.67648, "r": 361.37817, "b": 475.60547, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "THEN C . CUSTOMER_SECURITY_QUESTION ", "bbox": {"l": 64.800308, "t": 478.65649, "r": 226.5591, "b": 486.58548, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 ", "bbox": {"l": 64.800308, "t": 489.69681, "r": 374.87817, "b": 497.62579, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "THEN C . CUSTOMER_SECURITY_QUESTION ", "bbox": {"l": 64.800308, "t": 500.67682, "r": 226.5591, "b": 508.6058, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "ELSE '*****' ", "bbox": {"l": 64.800308, "t": 511.65683, "r": 123.24001, "b": 519.58582, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "END ", "bbox": {"l": 64.800308, "t": 522.69714, "r": 96.240005, "b": 530.62613, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "ENABLE ; ", "bbox": {"l": 79.20031, "t": 533.6771200000001, "r": 124.14001, "b": 541.60614, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "CREATE MASK BANK_SCHEMA.MASK_SECURITY_QUESTION_ANSWER_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C ", "bbox": {"l": 64.800308, "t": 555.69745, "r": 500.69727, "b": 563.62645, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "FOR COLUMN CUSTOMER_SECURITY_QUESTION_ANSWER ", "bbox": {"l": 79.20031, "t": 566.6774399999999, "r": 281.3988, "b": 574.60645, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "RETURN CASE ", "bbox": {"l": 79.20031, "t": 577.65744, "r": 137.64001, "b": 585.58644, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 ", "bbox": {"l": 64.800308, "t": 588.6977400000001, "r": 361.37817, "b": 596.62674, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "THEN C . CUSTOMER_SECURITY_QUESTION_ANSWER ", "bbox": {"l": 64.800308, "t": 599.67773, "r": 258.05908, "b": 607.60674, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 ", "bbox": {"l": 64.800308, "t": 610.65773, "r": 374.87817, "b": 618.58673, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "THEN C . CUSTOMER_SECURITY_QUESTION_ANSWER ", "bbox": {"l": 64.800308, "t": 621.69803, "r": 258.05908, "b": 629.62703, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "ELSE '*****' ", "bbox": {"l": 64.800308, "t": 632.6780200000001, "r": 123.24001, "b": 640.60703, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "END ", "bbox": {"l": 64.800308, "t": 643.71832, "r": 96.240005, "b": 651.64732, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "ENABLE ; ", "bbox": {"l": 79.20031, "t": 654.69832, "r": 124.14001, "b": 662.62732, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "ALTER TABLE BANK_SCHEMA.CUSTOMERS ", "bbox": {"l": 64.800308, "t": 676.71861, "r": 226.5591, "b": 684.64761, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "ACTIVATE ROW ACCESS CONTROL ", "bbox": {"l": 79.20031, "t": 687.69862, "r": 214.01941, "b": 695.627617, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "ACTIVATE COLUMN ACCESS CONTROL ;", "bbox": {"l": 79.20031, "t": 698.678619, "r": 223.01941, "b": 706.60762, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "THEN C . CUSTOMER_TAX_ID WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'TELLER' ) = 1 THEN ( 'XXX-XX-' CONCAT QSYS2 . SUBSTR ( C . CUSTOMER_TAX_ID , 8 , 4 ) ) WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 THEN C . CUSTOMER_TAX_ID ELSE 'XXX-XX-XXXX' END ENABLE ; CREATE MASK BANK_SCHEMA.MASK_DRIVERS_LICENSE_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C FOR COLUMN CUSTOMER_DRIVERS_LICENSE_NUMBER RETURN CASE WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 THEN C . CUSTOMER_DRIVERS_LICENSE_NUMBER WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'TELLER' ) = 1 THEN C . CUSTOMER_DRIVERS_LICENSE_NUMBER WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 THEN C . CUSTOMER_DRIVERS_LICENSE_NUMBER ELSE '*************' END ENABLE ; CREATE MASK BANK_SCHEMA.MASK_LOGIN_ID_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C FOR COLUMN CUSTOMER_LOGIN_ID RETURN CASE WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 THEN C . CUSTOMER_LOGIN_ID WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 THEN C . CUSTOMER_LOGIN_ID ELSE '*****' END ENABLE ; CREATE MASK BANK_SCHEMA.MASK_SECURITY_QUESTION_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C FOR COLUMN CUSTOMER_SECURITY_QUESTION RETURN CASE WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 THEN C . CUSTOMER_SECURITY_QUESTION WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 THEN C . CUSTOMER_SECURITY_QUESTION ELSE '*****' END ENABLE ; CREATE MASK BANK_SCHEMA.MASK_SECURITY_QUESTION_ANSWER_ON_CUSTOMERS ON BANK_SCHEMA.CUSTOMERS AS C FOR COLUMN CUSTOMER_SECURITY_QUESTION_ANSWER RETURN CASE WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'ADMIN' ) = 1 THEN C . CUSTOMER_SECURITY_QUESTION_ANSWER WHEN QSYS2 . VERIFY_GROUP_FOR_USER ( SESSION_USER , 'CUSTOMER' ) = 1 THEN C . CUSTOMER_SECURITY_QUESTION_ANSWER ELSE '*****' END ENABLE ; ALTER TABLE BANK_SCHEMA.CUSTOMERS ACTIVATE ROW ACCESS CONTROL ACTIVATE COLUMN ACCESS CONTROL ;"}], "headers": [{"label": "page_footer", "id": 1, "page_no": 15, "cluster": {"id": 1, "label": "page_footer", "bbox": {"l": 64.800003, "t": 754.848721, "r": 83.982002, "b": 764.06172, "coord_origin": "TOPLEFT"}, "confidence": 0.8994001150131226, "cells": [{"id": 0, "text": "124 ", "bbox": {"l": 64.800003, "t": 754.848721, "r": 83.982002, "b": 764.06172, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "124"}, {"label": "page_footer", "id": 0, "page_no": 15, "cluster": {"id": 0, "label": "page_footer", "bbox": {"l": 98.940002, "t": 755.538002, "r": 339.81958, "b": 763.863001, "coord_origin": "TOPLEFT"}, "confidence": 0.943077027797699, "cells": [{"id": 1, "text": "Row and Column Access Control Support in IBM DB2 for i", "bbox": {"l": 98.940002, "t": 755.538002, "r": 339.81958, "b": 763.863001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Row and Column Access Control Support in IBM DB2 for i"}]}}, {"page_no": 16, "size": {"width": 612.0, "height": 792.0}, "cells": [], "predictions": {"layout": {"clusters": [{"id": 0, "label": "form", "bbox": {"l": 0.4932013750076294, "t": 0.0, "r": 610.2305297851562, "b": 791.654541015625, "coord_origin": "TOPLEFT"}, "confidence": 0.6497200131416321, "cells": [], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "form", "id": 0, "page_no": 16, "cluster": {"id": 0, "label": "form", "bbox": {"l": 0.4932013750076294, "t": 0.0, "r": 610.2305297851562, "b": 791.654541015625, "coord_origin": "TOPLEFT"}, "confidence": 0.6497200131416321, "cells": [], "children": []}, "text": null}], "body": [{"label": "form", "id": 0, "page_no": 16, "cluster": {"id": 0, "label": "form", "bbox": {"l": 0.4932013750076294, "t": 0.0, "r": 610.2305297851562, "b": 791.654541015625, "coord_origin": "TOPLEFT"}, "confidence": 0.6497200131416321, "cells": [], "children": []}, "text": null}], "headers": []}}, {"page_no": 17, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "fi", "bbox": {"l": 558.11987, "t": 45.468689999999924, "r": 565.46039, "b": 54.68169999999998, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "REDP-5110-00", "bbox": {"l": 171.0, "t": 631.338, "r": 231.88769999999997, "b": 639.66301, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "INTERNATIONAL ", "bbox": {"l": 467.3399999999999, "t": 247.71831999999995, "r": 559.80933, "b": 260.16052, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "TECHNICAL", "bbox": {"l": 467.3399999999999, "t": 261.75842, "r": 529.50208, "b": 274.20061999999996, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "SUPPORT", "bbox": {"l": 467.3399999999999, "t": 275.73839999999996, "r": 518.93317, "b": 288.1806, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "ORGANIZATION", "bbox": {"l": 467.3399999999999, "t": 289.71841, "r": 550.7475, "b": 302.16061, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "BUILDING TECHNICAL ", "bbox": {"l": 467.3399999999999, "t": 351.79199, "r": 571.70758, "b": 362.47198, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "INFORMATION BASED ON ", "bbox": {"l": 467.3399999999999, "t": 363.79199, "r": 587.38916, "b": 374.47198, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "PRACTICAL EXPERIENCE", "bbox": {"l": 467.3399999999999, "t": 375.79199, "r": 582.5556, "b": 386.47198, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "IBM Redbooks are developed ", "bbox": {"l": 467.3399999999999, "t": 399.8602900000001, "r": 587.46674, "b": 409.63251, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "by the IBM International ", "bbox": {"l": 467.3399999999999, "t": 410.90067, "r": 566.34229, "b": 420.67285, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Technical Support ", "bbox": {"l": 467.3399999999999, "t": 421.88068, "r": 543.20404, "b": 431.65289, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Organization. Experts from ", "bbox": {"l": 467.3399999999999, "t": 432.8606899999999, "r": 577.76697, "b": 442.63287, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "IBM, Customers and Partners ", "bbox": {"l": 467.3399999999999, "t": 443.90106, "r": 587.40948, "b": 453.67328, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "from around the world create ", "bbox": {"l": 467.3399999999999, "t": 454.88107, "r": 587.52051, "b": 464.65326, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "timely technical information ", "bbox": {"l": 467.3399999999999, "t": 465.86108, "r": 582.67505, "b": 475.6333, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "based on realistic scenarios. ", "bbox": {"l": 467.3399999999999, "t": 476.90146, "r": 585.46722, "b": 486.67365, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "Specific recommendations ", "bbox": {"l": 467.3399999999999, "t": 487.88147, "r": 577.70874, "b": 497.65369, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "are provided to help you ", "bbox": {"l": 467.3399999999999, "t": 498.86148, "r": 568.03546, "b": 508.63367, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "implement IT solutions more ", "bbox": {"l": 467.3399999999999, "t": 509.90186, "r": 585.44525, "b": 519.67407, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "effectively in your ", "bbox": {"l": 467.3399999999999, "t": 520.8818699999999, "r": 541.4967, "b": 530.65405, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "environment.", "bbox": {"l": 467.3399999999999, "t": 531.8618799999999, "r": 520.64893, "b": 541.63406, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "For more information:", "bbox": {"l": 467.3399999999999, "t": 578.83191, "r": 570.948, "b": 589.5119, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "ibm.com", "bbox": {"l": 467.3399999999999, "t": 590.83191, "r": 508.59961, "b": 601.5119, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "/redbooks", "bbox": {"l": 508.56000000000006, "t": 590.83191, "r": 552.74518, "b": 601.5119, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "Redpaper", "bbox": {"l": 474.60001, "t": 164.05658000000005, "r": 580.88989, "b": 188.94097999999997, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "\u2122", "bbox": {"l": 582.53992, "t": 172.32714999999996, "r": 592.13989, "b": 181.20714999999996, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "Row and Column Access Control ", "bbox": {"l": 27.0, "t": 73.63799999999992, "r": 447.36002, "b": 103.00800000000004, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Support in IBM DB2 for i", "bbox": {"l": 27.0, "t": 113.76000999999997, "r": 314.43002, "b": 140.46002, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "Implement roles and ", "bbox": {"l": 26.700001, "t": 242.17200000000003, "r": 127.4436, "b": 252.85199, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "separation of duties", "bbox": {"l": 26.700001, "t": 256.15198, "r": 121.6608, "b": 266.83196999999996, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "Leverage row ", "bbox": {"l": 26.700001, "t": 284.17197, "r": 93.970795, "b": 294.85196, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "permissions on the ", "bbox": {"l": 26.700001, "t": 298.15198000000004, "r": 120.28319999999998, "b": 308.83197, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "database", "bbox": {"l": 26.700001, "t": 312.19199000000003, "r": 70.413605, "b": 322.87198, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "Protect columns by ", "bbox": {"l": 26.700001, "t": 340.15198000000004, "r": 121.44960000000002, "b": 350.83197, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "defining column ", "bbox": {"l": 26.700001, "t": 354.19199000000003, "r": 106.5696, "b": 364.87198, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "masks", "bbox": {"l": 26.700001, "t": 368.1720000000001, "r": 58.194, "b": 378.85199, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "This IBM Redpaper publication provides information about the IBM i 7.2 ", "bbox": {"l": 152.94, "t": 242.72857999999997, "r": 413.99057, "b": 251.59295999999995, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "feature of IBM DB2 for i Row and Column Access Control (RCAC). It ", "bbox": {"l": 152.94002, "t": 254.72839, "r": 401.85635, "b": 263.59277, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "offers a broad description of the function and advantages of controlling ", "bbox": {"l": 152.94002, "t": 266.72821, "r": 414.08423, "b": 275.59259, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "access to data in a comprehensive and transparent way. This ", "bbox": {"l": 152.94002, "t": 278.72803, "r": 381.24014, "b": 287.59244, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "publication helps you understand the capabilities of RCAC and provides ", "bbox": {"l": 152.94002, "t": 290.72784, "r": 414.07031, "b": 299.59225, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "examples of defining, creating, and implementing the row permissions ", "bbox": {"l": 152.94002, "t": 302.72766, "r": 414.05447, "b": 311.59207, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "and column masks in a relational database environment.", "bbox": {"l": 152.94002, "t": 314.72747999999996, "r": 362.3291, "b": 323.59189, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "This paper is intended for database engineers, data-centric application ", "bbox": {"l": 152.94002, "t": 331.70728, "r": 414.17383, "b": 340.57169, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "developers, and security officers who want to design and implement ", "bbox": {"l": 152.94002, "t": 343.70709, "r": 407.61029, "b": 352.5715, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "RCAC as a part of their data control and governance policy. A solid ", "bbox": {"l": 152.94002, "t": 355.70691, "r": 399.29565, "b": 364.57132, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "background in IBM i object level security, DB2 for i relational database ", "bbox": {"l": 152.94002, "t": 367.70673, "r": 414.0603, "b": 376.57114, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "concepts, and SQL is assumed.", "bbox": {"l": 152.94002, "t": 379.70654, "r": 268.86945, "b": 388.57095, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "Back cover", "bbox": {"l": 287.22, "t": 28.54803000000004, "r": 414.24481, "b": 50.748050000000035, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 4, "label": "picture", "bbox": {"l": 485.1698303222656, "t": 25.259197235107422, "r": 566.2962036132812, "b": 54.191585540771484, "coord_origin": "TOPLEFT"}, "confidence": 0.9404253363609314, "cells": [{"id": 0, "text": "fi", "bbox": {"l": 558.11987, "t": 45.468689999999924, "r": 565.46039, "b": 54.68169999999998, "coord_origin": "TOPLEFT"}}], "children": [{"id": 13, "label": "text", "bbox": {"l": 558.11987, "t": 45.468689999999924, "r": 565.46039, "b": 54.68169999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 0, "text": "fi", "bbox": {"l": 558.11987, "t": 45.468689999999924, "r": 565.46039, "b": 54.68169999999998, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 10, "label": "page_footer", "bbox": {"l": 171.0, "t": 631.338, "r": 231.88769999999997, "b": 639.66301, "coord_origin": "TOPLEFT"}, "confidence": 0.7700252532958984, "cells": [{"id": 1, "text": "REDP-5110-00", "bbox": {"l": 171.0, "t": 631.338, "r": 231.88769999999997, "b": 639.66301, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "text", "bbox": {"l": 467.3399999999999, "t": 247.71831999999995, "r": 559.80933, "b": 302.16061, "coord_origin": "TOPLEFT"}, "confidence": 0.8532665967941284, "cells": [{"id": 2, "text": "INTERNATIONAL ", "bbox": {"l": 467.3399999999999, "t": 247.71831999999995, "r": 559.80933, "b": 260.16052, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "TECHNICAL", "bbox": {"l": 467.3399999999999, "t": 261.75842, "r": 529.50208, "b": 274.20061999999996, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "SUPPORT", "bbox": {"l": 467.3399999999999, "t": 275.73839999999996, "r": 518.93317, "b": 288.1806, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "ORGANIZATION", "bbox": {"l": 467.3399999999999, "t": 289.71841, "r": 550.7475, "b": 302.16061, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "text", "bbox": {"l": 467.3399999999999, "t": 351.79199, "r": 587.38916, "b": 386.47198, "coord_origin": "TOPLEFT"}, "confidence": 0.7157140374183655, "cells": [{"id": 6, "text": "BUILDING TECHNICAL ", "bbox": {"l": 467.3399999999999, "t": 351.79199, "r": 571.70758, "b": 362.47198, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "INFORMATION BASED ON ", "bbox": {"l": 467.3399999999999, "t": 363.79199, "r": 587.38916, "b": 374.47198, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "PRACTICAL EXPERIENCE", "bbox": {"l": 467.3399999999999, "t": 375.79199, "r": 582.5556, "b": 386.47198, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 467.3399999999999, "t": 399.8602900000001, "r": 587.52051, "b": 541.63406, "coord_origin": "TOPLEFT"}, "confidence": 0.9518947005271912, "cells": [{"id": 9, "text": "IBM Redbooks are developed ", "bbox": {"l": 467.3399999999999, "t": 399.8602900000001, "r": 587.46674, "b": 409.63251, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "by the IBM International ", "bbox": {"l": 467.3399999999999, "t": 410.90067, "r": 566.34229, "b": 420.67285, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Technical Support ", "bbox": {"l": 467.3399999999999, "t": 421.88068, "r": 543.20404, "b": 431.65289, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Organization. Experts from ", "bbox": {"l": 467.3399999999999, "t": 432.8606899999999, "r": 577.76697, "b": 442.63287, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "IBM, Customers and Partners ", "bbox": {"l": 467.3399999999999, "t": 443.90106, "r": 587.40948, "b": 453.67328, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "from around the world create ", "bbox": {"l": 467.3399999999999, "t": 454.88107, "r": 587.52051, "b": 464.65326, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "timely technical information ", "bbox": {"l": 467.3399999999999, "t": 465.86108, "r": 582.67505, "b": 475.6333, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "based on realistic scenarios. ", "bbox": {"l": 467.3399999999999, "t": 476.90146, "r": 585.46722, "b": 486.67365, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "Specific recommendations ", "bbox": {"l": 467.3399999999999, "t": 487.88147, "r": 577.70874, "b": 497.65369, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "are provided to help you ", "bbox": {"l": 467.3399999999999, "t": 498.86148, "r": 568.03546, "b": 508.63367, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "implement IT solutions more ", "bbox": {"l": 467.3399999999999, "t": 509.90186, "r": 585.44525, "b": 519.67407, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "effectively in your ", "bbox": {"l": 467.3399999999999, "t": 520.8818699999999, "r": 541.4967, "b": 530.65405, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "environment.", "bbox": {"l": 467.3399999999999, "t": 531.8618799999999, "r": 520.64893, "b": 541.63406, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 467.3399999999999, "t": 578.83191, "r": 570.948, "b": 601.5119, "coord_origin": "TOPLEFT"}, "confidence": 0.8230002522468567, "cells": [{"id": 22, "text": "For more information:", "bbox": {"l": 467.3399999999999, "t": 578.83191, "r": 570.948, "b": 589.5119, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "ibm.com", "bbox": {"l": 467.3399999999999, "t": 590.83191, "r": 508.59961, "b": 601.5119, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "/redbooks", "bbox": {"l": 508.56000000000006, "t": 590.83191, "r": 552.74518, "b": 601.5119, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "picture", "bbox": {"l": 474.35540771484375, "t": 80.05131530761719, "r": 592.2726440429688, "b": 189.81260681152344, "coord_origin": "TOPLEFT"}, "confidence": 0.9696109890937805, "cells": [{"id": 25, "text": "Redpaper", "bbox": {"l": 474.60001, "t": 164.05658000000005, "r": 580.88989, "b": 188.94097999999997, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "\u2122", "bbox": {"l": 582.53992, "t": 172.32714999999996, "r": 592.13989, "b": 181.20714999999996, "coord_origin": "TOPLEFT"}}], "children": [{"id": 14, "label": "text", "bbox": {"l": 474.60001, "t": 164.05658000000005, "r": 580.88989, "b": 188.94097999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "Redpaper", "bbox": {"l": 474.60001, "t": 164.05658000000005, "r": 580.88989, "b": 188.94097999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 582.53992, "t": 172.32714999999996, "r": 592.13989, "b": 181.20714999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "\u2122", "bbox": {"l": 582.53992, "t": 172.32714999999996, "r": 592.13989, "b": 181.20714999999996, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 12, "label": "section_header", "bbox": {"l": 27.0, "t": 73.63799999999992, "r": 447.36002, "b": 140.46002, "coord_origin": "TOPLEFT"}, "confidence": 0.7128154635429382, "cells": [{"id": 27, "text": "Row and Column Access Control ", "bbox": {"l": 27.0, "t": 73.63799999999992, "r": 447.36002, "b": 103.00800000000004, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Support in IBM DB2 for i", "bbox": {"l": 27.0, "t": 113.76000999999997, "r": 314.43002, "b": 140.46002, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "text", "bbox": {"l": 26.700001, "t": 242.17200000000003, "r": 127.4436, "b": 266.83196999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.8400377631187439, "cells": [{"id": 29, "text": "Implement roles and ", "bbox": {"l": 26.700001, "t": 242.17200000000003, "r": 127.4436, "b": 252.85199, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "separation of duties", "bbox": {"l": 26.700001, "t": 256.15198, "r": 121.6608, "b": 266.83196999999996, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "text", "bbox": {"l": 26.700001, "t": 284.17197, "r": 120.28319999999998, "b": 322.87198, "coord_origin": "TOPLEFT"}, "confidence": 0.8828511834144592, "cells": [{"id": 31, "text": "Leverage row ", "bbox": {"l": 26.700001, "t": 284.17197, "r": 93.970795, "b": 294.85196, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "permissions on the ", "bbox": {"l": 26.700001, "t": 298.15198000000004, "r": 120.28319999999998, "b": 308.83197, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "database", "bbox": {"l": 26.700001, "t": 312.19199000000003, "r": 70.413605, "b": 322.87198, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "text", "bbox": {"l": 26.700001, "t": 340.15198000000004, "r": 121.44960000000002, "b": 378.85199, "coord_origin": "TOPLEFT"}, "confidence": 0.9064874053001404, "cells": [{"id": 34, "text": "Protect columns by ", "bbox": {"l": 26.700001, "t": 340.15198000000004, "r": 121.44960000000002, "b": 350.83197, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "defining column ", "bbox": {"l": 26.700001, "t": 354.19199000000003, "r": 106.5696, "b": 364.87198, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "masks", "bbox": {"l": 26.700001, "t": 368.1720000000001, "r": 58.194, "b": 378.85199, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 152.94, "t": 242.72857999999997, "r": 414.08423, "b": 323.59189, "coord_origin": "TOPLEFT"}, "confidence": 0.9789719581604004, "cells": [{"id": 37, "text": "This IBM Redpaper publication provides information about the IBM i 7.2 ", "bbox": {"l": 152.94, "t": 242.72857999999997, "r": 413.99057, "b": 251.59295999999995, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "feature of IBM DB2 for i Row and Column Access Control (RCAC). It ", "bbox": {"l": 152.94002, "t": 254.72839, "r": 401.85635, "b": 263.59277, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "offers a broad description of the function and advantages of controlling ", "bbox": {"l": 152.94002, "t": 266.72821, "r": 414.08423, "b": 275.59259, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "access to data in a comprehensive and transparent way. This ", "bbox": {"l": 152.94002, "t": 278.72803, "r": 381.24014, "b": 287.59244, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "publication helps you understand the capabilities of RCAC and provides ", "bbox": {"l": 152.94002, "t": 290.72784, "r": 414.07031, "b": 299.59225, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "examples of defining, creating, and implementing the row permissions ", "bbox": {"l": 152.94002, "t": 302.72766, "r": 414.05447, "b": 311.59207, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "and column masks in a relational database environment.", "bbox": {"l": 152.94002, "t": 314.72747999999996, "r": 362.3291, "b": 323.59189, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 152.94002, "t": 331.70728, "r": 414.17383, "b": 388.57095, "coord_origin": "TOPLEFT"}, "confidence": 0.9799742698669434, "cells": [{"id": 44, "text": "This paper is intended for database engineers, data-centric application ", "bbox": {"l": 152.94002, "t": 331.70728, "r": 414.17383, "b": 340.57169, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "developers, and security officers who want to design and implement ", "bbox": {"l": 152.94002, "t": 343.70709, "r": 407.61029, "b": 352.5715, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "RCAC as a part of their data control and governance policy. A solid ", "bbox": {"l": 152.94002, "t": 355.70691, "r": 399.29565, "b": 364.57132, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "background in IBM i object level security, DB2 for i relational database ", "bbox": {"l": 152.94002, "t": 367.70673, "r": 414.0603, "b": 376.57114, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "concepts, and SQL is assumed.", "bbox": {"l": 152.94002, "t": 379.70654, "r": 268.86945, "b": 388.57095, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 287.22, "t": 28.54803000000004, "r": 414.24481, "b": 50.748050000000035, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "Back cover", "bbox": {"l": 287.22, "t": 28.54803000000004, "r": 414.24481, "b": 50.748050000000035, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "picture", "id": 4, "page_no": 17, "cluster": {"id": 4, "label": "picture", "bbox": {"l": 485.1698303222656, "t": 25.259197235107422, "r": 566.2962036132812, "b": 54.191585540771484, "coord_origin": "TOPLEFT"}, "confidence": 0.9404253363609314, "cells": [{"id": 0, "text": "fi", "bbox": {"l": 558.11987, "t": 45.468689999999924, "r": 565.46039, "b": 54.68169999999998, "coord_origin": "TOPLEFT"}}], "children": [{"id": 13, "label": "text", "bbox": {"l": 558.11987, "t": 45.468689999999924, "r": 565.46039, "b": 54.68169999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 0, "text": "fi", "bbox": {"l": 558.11987, "t": 45.468689999999924, "r": 565.46039, "b": 54.68169999999998, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "page_footer", "id": 10, "page_no": 17, "cluster": {"id": 10, "label": "page_footer", "bbox": {"l": 171.0, "t": 631.338, "r": 231.88769999999997, "b": 639.66301, "coord_origin": "TOPLEFT"}, "confidence": 0.7700252532958984, "cells": [{"id": 1, "text": "REDP-5110-00", "bbox": {"l": 171.0, "t": 631.338, "r": 231.88769999999997, "b": 639.66301, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "REDP-5110-00"}, {"label": "text", "id": 7, "page_no": 17, "cluster": {"id": 7, "label": "text", "bbox": {"l": 467.3399999999999, "t": 247.71831999999995, "r": 559.80933, "b": 302.16061, "coord_origin": "TOPLEFT"}, "confidence": 0.8532665967941284, "cells": [{"id": 2, "text": "INTERNATIONAL ", "bbox": {"l": 467.3399999999999, "t": 247.71831999999995, "r": 559.80933, "b": 260.16052, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "TECHNICAL", "bbox": {"l": 467.3399999999999, "t": 261.75842, "r": 529.50208, "b": 274.20061999999996, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "SUPPORT", "bbox": {"l": 467.3399999999999, "t": 275.73839999999996, "r": 518.93317, "b": 288.1806, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "ORGANIZATION", "bbox": {"l": 467.3399999999999, "t": 289.71841, "r": 550.7475, "b": 302.16061, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "INTERNATIONAL TECHNICAL SUPPORT ORGANIZATION"}, {"label": "text", "id": 11, "page_no": 17, "cluster": {"id": 11, "label": "text", "bbox": {"l": 467.3399999999999, "t": 351.79199, "r": 587.38916, "b": 386.47198, "coord_origin": "TOPLEFT"}, "confidence": 0.7157140374183655, "cells": [{"id": 6, "text": "BUILDING TECHNICAL ", "bbox": {"l": 467.3399999999999, "t": 351.79199, "r": 571.70758, "b": 362.47198, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "INFORMATION BASED ON ", "bbox": {"l": 467.3399999999999, "t": 363.79199, "r": 587.38916, "b": 374.47198, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "PRACTICAL EXPERIENCE", "bbox": {"l": 467.3399999999999, "t": 375.79199, "r": 582.5556, "b": 386.47198, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "BUILDING TECHNICAL INFORMATION BASED ON PRACTICAL EXPERIENCE"}, {"label": "text", "id": 3, "page_no": 17, "cluster": {"id": 3, "label": "text", "bbox": {"l": 467.3399999999999, "t": 399.8602900000001, "r": 587.52051, "b": 541.63406, "coord_origin": "TOPLEFT"}, "confidence": 0.9518947005271912, "cells": [{"id": 9, "text": "IBM Redbooks are developed ", "bbox": {"l": 467.3399999999999, "t": 399.8602900000001, "r": 587.46674, "b": 409.63251, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "by the IBM International ", "bbox": {"l": 467.3399999999999, "t": 410.90067, "r": 566.34229, "b": 420.67285, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Technical Support ", "bbox": {"l": 467.3399999999999, "t": 421.88068, "r": 543.20404, "b": 431.65289, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Organization. Experts from ", "bbox": {"l": 467.3399999999999, "t": 432.8606899999999, "r": 577.76697, "b": 442.63287, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "IBM, Customers and Partners ", "bbox": {"l": 467.3399999999999, "t": 443.90106, "r": 587.40948, "b": 453.67328, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "from around the world create ", "bbox": {"l": 467.3399999999999, "t": 454.88107, "r": 587.52051, "b": 464.65326, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "timely technical information ", "bbox": {"l": 467.3399999999999, "t": 465.86108, "r": 582.67505, "b": 475.6333, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "based on realistic scenarios. ", "bbox": {"l": 467.3399999999999, "t": 476.90146, "r": 585.46722, "b": 486.67365, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "Specific recommendations ", "bbox": {"l": 467.3399999999999, "t": 487.88147, "r": 577.70874, "b": 497.65369, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "are provided to help you ", "bbox": {"l": 467.3399999999999, "t": 498.86148, "r": 568.03546, "b": 508.63367, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "implement IT solutions more ", "bbox": {"l": 467.3399999999999, "t": 509.90186, "r": 585.44525, "b": 519.67407, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "effectively in your ", "bbox": {"l": 467.3399999999999, "t": 520.8818699999999, "r": 541.4967, "b": 530.65405, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "environment.", "bbox": {"l": 467.3399999999999, "t": 531.8618799999999, "r": 520.64893, "b": 541.63406, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "IBM Redbooks are developed by the IBM International Technical Support Organization. Experts from IBM, Customers and Partners from around the world create timely technical information based on realistic scenarios. Specific recommendations are provided to help you implement IT solutions more effectively in your environment."}, {"label": "text", "id": 9, "page_no": 17, "cluster": {"id": 9, "label": "text", "bbox": {"l": 467.3399999999999, "t": 578.83191, "r": 570.948, "b": 601.5119, "coord_origin": "TOPLEFT"}, "confidence": 0.8230002522468567, "cells": [{"id": 22, "text": "For more information:", "bbox": {"l": 467.3399999999999, "t": 578.83191, "r": 570.948, "b": 589.5119, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "ibm.com", "bbox": {"l": 467.3399999999999, "t": 590.83191, "r": 508.59961, "b": 601.5119, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "/redbooks", "bbox": {"l": 508.56000000000006, "t": 590.83191, "r": 552.74518, "b": 601.5119, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "For more information: ibm.com /redbooks"}, {"label": "picture", "id": 2, "page_no": 17, "cluster": {"id": 2, "label": "picture", "bbox": {"l": 474.35540771484375, "t": 80.05131530761719, "r": 592.2726440429688, "b": 189.81260681152344, "coord_origin": "TOPLEFT"}, "confidence": 0.9696109890937805, "cells": [{"id": 25, "text": "Redpaper", "bbox": {"l": 474.60001, "t": 164.05658000000005, "r": 580.88989, "b": 188.94097999999997, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "\u2122", "bbox": {"l": 582.53992, "t": 172.32714999999996, "r": 592.13989, "b": 181.20714999999996, "coord_origin": "TOPLEFT"}}], "children": [{"id": 14, "label": "text", "bbox": {"l": 474.60001, "t": 164.05658000000005, "r": 580.88989, "b": 188.94097999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "Redpaper", "bbox": {"l": 474.60001, "t": 164.05658000000005, "r": 580.88989, "b": 188.94097999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 582.53992, "t": 172.32714999999996, "r": 592.13989, "b": 181.20714999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "\u2122", "bbox": {"l": 582.53992, "t": 172.32714999999996, "r": 592.13989, "b": 181.20714999999996, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "section_header", "id": 12, "page_no": 17, "cluster": {"id": 12, "label": "section_header", "bbox": {"l": 27.0, "t": 73.63799999999992, "r": 447.36002, "b": 140.46002, "coord_origin": "TOPLEFT"}, "confidence": 0.7128154635429382, "cells": [{"id": 27, "text": "Row and Column Access Control ", "bbox": {"l": 27.0, "t": 73.63799999999992, "r": 447.36002, "b": 103.00800000000004, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Support in IBM DB2 for i", "bbox": {"l": 27.0, "t": 113.76000999999997, "r": 314.43002, "b": 140.46002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Row and Column Access Control Support in IBM DB2 for i"}, {"label": "text", "id": 8, "page_no": 17, "cluster": {"id": 8, "label": "text", "bbox": {"l": 26.700001, "t": 242.17200000000003, "r": 127.4436, "b": 266.83196999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.8400377631187439, "cells": [{"id": 29, "text": "Implement roles and ", "bbox": {"l": 26.700001, "t": 242.17200000000003, "r": 127.4436, "b": 252.85199, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "separation of duties", "bbox": {"l": 26.700001, "t": 256.15198, "r": 121.6608, "b": 266.83196999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Implement roles and separation of duties"}, {"label": "text", "id": 6, "page_no": 17, "cluster": {"id": 6, "label": "text", "bbox": {"l": 26.700001, "t": 284.17197, "r": 120.28319999999998, "b": 322.87198, "coord_origin": "TOPLEFT"}, "confidence": 0.8828511834144592, "cells": [{"id": 31, "text": "Leverage row ", "bbox": {"l": 26.700001, "t": 284.17197, "r": 93.970795, "b": 294.85196, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "permissions on the ", "bbox": {"l": 26.700001, "t": 298.15198000000004, "r": 120.28319999999998, "b": 308.83197, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "database", "bbox": {"l": 26.700001, "t": 312.19199000000003, "r": 70.413605, "b": 322.87198, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Leverage row permissions on the database"}, {"label": "text", "id": 5, "page_no": 17, "cluster": {"id": 5, "label": "text", "bbox": {"l": 26.700001, "t": 340.15198000000004, "r": 121.44960000000002, "b": 378.85199, "coord_origin": "TOPLEFT"}, "confidence": 0.9064874053001404, "cells": [{"id": 34, "text": "Protect columns by ", "bbox": {"l": 26.700001, "t": 340.15198000000004, "r": 121.44960000000002, "b": 350.83197, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "defining column ", "bbox": {"l": 26.700001, "t": 354.19199000000003, "r": 106.5696, "b": 364.87198, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "masks", "bbox": {"l": 26.700001, "t": 368.1720000000001, "r": 58.194, "b": 378.85199, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Protect columns by defining column masks"}, {"label": "text", "id": 1, "page_no": 17, "cluster": {"id": 1, "label": "text", "bbox": {"l": 152.94, "t": 242.72857999999997, "r": 414.08423, "b": 323.59189, "coord_origin": "TOPLEFT"}, "confidence": 0.9789719581604004, "cells": [{"id": 37, "text": "This IBM Redpaper publication provides information about the IBM i 7.2 ", "bbox": {"l": 152.94, "t": 242.72857999999997, "r": 413.99057, "b": 251.59295999999995, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "feature of IBM DB2 for i Row and Column Access Control (RCAC). It ", "bbox": {"l": 152.94002, "t": 254.72839, "r": 401.85635, "b": 263.59277, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "offers a broad description of the function and advantages of controlling ", "bbox": {"l": 152.94002, "t": 266.72821, "r": 414.08423, "b": 275.59259, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "access to data in a comprehensive and transparent way. This ", "bbox": {"l": 152.94002, "t": 278.72803, "r": 381.24014, "b": 287.59244, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "publication helps you understand the capabilities of RCAC and provides ", "bbox": {"l": 152.94002, "t": 290.72784, "r": 414.07031, "b": 299.59225, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "examples of defining, creating, and implementing the row permissions ", "bbox": {"l": 152.94002, "t": 302.72766, "r": 414.05447, "b": 311.59207, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "and column masks in a relational database environment.", "bbox": {"l": 152.94002, "t": 314.72747999999996, "r": 362.3291, "b": 323.59189, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "This IBM Redpaper publication provides information about the IBM i 7.2 feature of IBM DB2 for i Row and Column Access Control (RCAC). It offers a broad description of the function and advantages of controlling access to data in a comprehensive and transparent way. This publication helps you understand the capabilities of RCAC and provides examples of defining, creating, and implementing the row permissions and column masks in a relational database environment."}, {"label": "text", "id": 0, "page_no": 17, "cluster": {"id": 0, "label": "text", "bbox": {"l": 152.94002, "t": 331.70728, "r": 414.17383, "b": 388.57095, "coord_origin": "TOPLEFT"}, "confidence": 0.9799742698669434, "cells": [{"id": 44, "text": "This paper is intended for database engineers, data-centric application ", "bbox": {"l": 152.94002, "t": 331.70728, "r": 414.17383, "b": 340.57169, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "developers, and security officers who want to design and implement ", "bbox": {"l": 152.94002, "t": 343.70709, "r": 407.61029, "b": 352.5715, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "RCAC as a part of their data control and governance policy. A solid ", "bbox": {"l": 152.94002, "t": 355.70691, "r": 399.29565, "b": 364.57132, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "background in IBM i object level security, DB2 for i relational database ", "bbox": {"l": 152.94002, "t": 367.70673, "r": 414.0603, "b": 376.57114, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "concepts, and SQL is assumed.", "bbox": {"l": 152.94002, "t": 379.70654, "r": 268.86945, "b": 388.57095, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "This paper is intended for database engineers, data-centric application developers, and security officers who want to design and implement RCAC as a part of their data control and governance policy. A solid background in IBM i object level security, DB2 for i relational database concepts, and SQL is assumed."}, {"label": "text", "id": 16, "page_no": 17, "cluster": {"id": 16, "label": "text", "bbox": {"l": 287.22, "t": 28.54803000000004, "r": 414.24481, "b": 50.748050000000035, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "Back cover", "bbox": {"l": 287.22, "t": 28.54803000000004, "r": 414.24481, "b": 50.748050000000035, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Back cover"}], "body": [{"label": "picture", "id": 4, "page_no": 17, "cluster": {"id": 4, "label": "picture", "bbox": {"l": 485.1698303222656, "t": 25.259197235107422, "r": 566.2962036132812, "b": 54.191585540771484, "coord_origin": "TOPLEFT"}, "confidence": 0.9404253363609314, "cells": [{"id": 0, "text": "fi", "bbox": {"l": 558.11987, "t": 45.468689999999924, "r": 565.46039, "b": 54.68169999999998, "coord_origin": "TOPLEFT"}}], "children": [{"id": 13, "label": "text", "bbox": {"l": 558.11987, "t": 45.468689999999924, "r": 565.46039, "b": 54.68169999999998, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 0, "text": "fi", "bbox": {"l": 558.11987, "t": 45.468689999999924, "r": 565.46039, "b": 54.68169999999998, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "text", "id": 7, "page_no": 17, "cluster": {"id": 7, "label": "text", "bbox": {"l": 467.3399999999999, "t": 247.71831999999995, "r": 559.80933, "b": 302.16061, "coord_origin": "TOPLEFT"}, "confidence": 0.8532665967941284, "cells": [{"id": 2, "text": "INTERNATIONAL ", "bbox": {"l": 467.3399999999999, "t": 247.71831999999995, "r": 559.80933, "b": 260.16052, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "TECHNICAL", "bbox": {"l": 467.3399999999999, "t": 261.75842, "r": 529.50208, "b": 274.20061999999996, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "SUPPORT", "bbox": {"l": 467.3399999999999, "t": 275.73839999999996, "r": 518.93317, "b": 288.1806, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "ORGANIZATION", "bbox": {"l": 467.3399999999999, "t": 289.71841, "r": 550.7475, "b": 302.16061, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "INTERNATIONAL TECHNICAL SUPPORT ORGANIZATION"}, {"label": "text", "id": 11, "page_no": 17, "cluster": {"id": 11, "label": "text", "bbox": {"l": 467.3399999999999, "t": 351.79199, "r": 587.38916, "b": 386.47198, "coord_origin": "TOPLEFT"}, "confidence": 0.7157140374183655, "cells": [{"id": 6, "text": "BUILDING TECHNICAL ", "bbox": {"l": 467.3399999999999, "t": 351.79199, "r": 571.70758, "b": 362.47198, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "INFORMATION BASED ON ", "bbox": {"l": 467.3399999999999, "t": 363.79199, "r": 587.38916, "b": 374.47198, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "PRACTICAL EXPERIENCE", "bbox": {"l": 467.3399999999999, "t": 375.79199, "r": 582.5556, "b": 386.47198, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "BUILDING TECHNICAL INFORMATION BASED ON PRACTICAL EXPERIENCE"}, {"label": "text", "id": 3, "page_no": 17, "cluster": {"id": 3, "label": "text", "bbox": {"l": 467.3399999999999, "t": 399.8602900000001, "r": 587.52051, "b": 541.63406, "coord_origin": "TOPLEFT"}, "confidence": 0.9518947005271912, "cells": [{"id": 9, "text": "IBM Redbooks are developed ", "bbox": {"l": 467.3399999999999, "t": 399.8602900000001, "r": 587.46674, "b": 409.63251, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "by the IBM International ", "bbox": {"l": 467.3399999999999, "t": 410.90067, "r": 566.34229, "b": 420.67285, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "Technical Support ", "bbox": {"l": 467.3399999999999, "t": 421.88068, "r": 543.20404, "b": 431.65289, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "Organization. Experts from ", "bbox": {"l": 467.3399999999999, "t": 432.8606899999999, "r": 577.76697, "b": 442.63287, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "IBM, Customers and Partners ", "bbox": {"l": 467.3399999999999, "t": 443.90106, "r": 587.40948, "b": 453.67328, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "from around the world create ", "bbox": {"l": 467.3399999999999, "t": 454.88107, "r": 587.52051, "b": 464.65326, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "timely technical information ", "bbox": {"l": 467.3399999999999, "t": 465.86108, "r": 582.67505, "b": 475.6333, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "based on realistic scenarios. ", "bbox": {"l": 467.3399999999999, "t": 476.90146, "r": 585.46722, "b": 486.67365, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "Specific recommendations ", "bbox": {"l": 467.3399999999999, "t": 487.88147, "r": 577.70874, "b": 497.65369, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "are provided to help you ", "bbox": {"l": 467.3399999999999, "t": 498.86148, "r": 568.03546, "b": 508.63367, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "implement IT solutions more ", "bbox": {"l": 467.3399999999999, "t": 509.90186, "r": 585.44525, "b": 519.67407, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "effectively in your ", "bbox": {"l": 467.3399999999999, "t": 520.8818699999999, "r": 541.4967, "b": 530.65405, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "environment.", "bbox": {"l": 467.3399999999999, "t": 531.8618799999999, "r": 520.64893, "b": 541.63406, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "IBM Redbooks are developed by the IBM International Technical Support Organization. Experts from IBM, Customers and Partners from around the world create timely technical information based on realistic scenarios. Specific recommendations are provided to help you implement IT solutions more effectively in your environment."}, {"label": "text", "id": 9, "page_no": 17, "cluster": {"id": 9, "label": "text", "bbox": {"l": 467.3399999999999, "t": 578.83191, "r": 570.948, "b": 601.5119, "coord_origin": "TOPLEFT"}, "confidence": 0.8230002522468567, "cells": [{"id": 22, "text": "For more information:", "bbox": {"l": 467.3399999999999, "t": 578.83191, "r": 570.948, "b": 589.5119, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "ibm.com", "bbox": {"l": 467.3399999999999, "t": 590.83191, "r": 508.59961, "b": 601.5119, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "/redbooks", "bbox": {"l": 508.56000000000006, "t": 590.83191, "r": 552.74518, "b": 601.5119, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "For more information: ibm.com /redbooks"}, {"label": "picture", "id": 2, "page_no": 17, "cluster": {"id": 2, "label": "picture", "bbox": {"l": 474.35540771484375, "t": 80.05131530761719, "r": 592.2726440429688, "b": 189.81260681152344, "coord_origin": "TOPLEFT"}, "confidence": 0.9696109890937805, "cells": [{"id": 25, "text": "Redpaper", "bbox": {"l": 474.60001, "t": 164.05658000000005, "r": 580.88989, "b": 188.94097999999997, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "\u2122", "bbox": {"l": 582.53992, "t": 172.32714999999996, "r": 592.13989, "b": 181.20714999999996, "coord_origin": "TOPLEFT"}}], "children": [{"id": 14, "label": "text", "bbox": {"l": 474.60001, "t": 164.05658000000005, "r": 580.88989, "b": 188.94097999999997, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 25, "text": "Redpaper", "bbox": {"l": 474.60001, "t": 164.05658000000005, "r": 580.88989, "b": 188.94097999999997, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 15, "label": "text", "bbox": {"l": 582.53992, "t": 172.32714999999996, "r": 592.13989, "b": 181.20714999999996, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 26, "text": "\u2122", "bbox": {"l": 582.53992, "t": 172.32714999999996, "r": 592.13989, "b": 181.20714999999996, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "section_header", "id": 12, "page_no": 17, "cluster": {"id": 12, "label": "section_header", "bbox": {"l": 27.0, "t": 73.63799999999992, "r": 447.36002, "b": 140.46002, "coord_origin": "TOPLEFT"}, "confidence": 0.7128154635429382, "cells": [{"id": 27, "text": "Row and Column Access Control ", "bbox": {"l": 27.0, "t": 73.63799999999992, "r": 447.36002, "b": 103.00800000000004, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "Support in IBM DB2 for i", "bbox": {"l": 27.0, "t": 113.76000999999997, "r": 314.43002, "b": 140.46002, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Row and Column Access Control Support in IBM DB2 for i"}, {"label": "text", "id": 8, "page_no": 17, "cluster": {"id": 8, "label": "text", "bbox": {"l": 26.700001, "t": 242.17200000000003, "r": 127.4436, "b": 266.83196999999996, "coord_origin": "TOPLEFT"}, "confidence": 0.8400377631187439, "cells": [{"id": 29, "text": "Implement roles and ", "bbox": {"l": 26.700001, "t": 242.17200000000003, "r": 127.4436, "b": 252.85199, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "separation of duties", "bbox": {"l": 26.700001, "t": 256.15198, "r": 121.6608, "b": 266.83196999999996, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Implement roles and separation of duties"}, {"label": "text", "id": 6, "page_no": 17, "cluster": {"id": 6, "label": "text", "bbox": {"l": 26.700001, "t": 284.17197, "r": 120.28319999999998, "b": 322.87198, "coord_origin": "TOPLEFT"}, "confidence": 0.8828511834144592, "cells": [{"id": 31, "text": "Leverage row ", "bbox": {"l": 26.700001, "t": 284.17197, "r": 93.970795, "b": 294.85196, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "permissions on the ", "bbox": {"l": 26.700001, "t": 298.15198000000004, "r": 120.28319999999998, "b": 308.83197, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "database", "bbox": {"l": 26.700001, "t": 312.19199000000003, "r": 70.413605, "b": 322.87198, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Leverage row permissions on the database"}, {"label": "text", "id": 5, "page_no": 17, "cluster": {"id": 5, "label": "text", "bbox": {"l": 26.700001, "t": 340.15198000000004, "r": 121.44960000000002, "b": 378.85199, "coord_origin": "TOPLEFT"}, "confidence": 0.9064874053001404, "cells": [{"id": 34, "text": "Protect columns by ", "bbox": {"l": 26.700001, "t": 340.15198000000004, "r": 121.44960000000002, "b": 350.83197, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "defining column ", "bbox": {"l": 26.700001, "t": 354.19199000000003, "r": 106.5696, "b": 364.87198, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "masks", "bbox": {"l": 26.700001, "t": 368.1720000000001, "r": 58.194, "b": 378.85199, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Protect columns by defining column masks"}, {"label": "text", "id": 1, "page_no": 17, "cluster": {"id": 1, "label": "text", "bbox": {"l": 152.94, "t": 242.72857999999997, "r": 414.08423, "b": 323.59189, "coord_origin": "TOPLEFT"}, "confidence": 0.9789719581604004, "cells": [{"id": 37, "text": "This IBM Redpaper publication provides information about the IBM i 7.2 ", "bbox": {"l": 152.94, "t": 242.72857999999997, "r": 413.99057, "b": 251.59295999999995, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "feature of IBM DB2 for i Row and Column Access Control (RCAC). It ", "bbox": {"l": 152.94002, "t": 254.72839, "r": 401.85635, "b": 263.59277, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "offers a broad description of the function and advantages of controlling ", "bbox": {"l": 152.94002, "t": 266.72821, "r": 414.08423, "b": 275.59259, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "access to data in a comprehensive and transparent way. This ", "bbox": {"l": 152.94002, "t": 278.72803, "r": 381.24014, "b": 287.59244, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "publication helps you understand the capabilities of RCAC and provides ", "bbox": {"l": 152.94002, "t": 290.72784, "r": 414.07031, "b": 299.59225, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "examples of defining, creating, and implementing the row permissions ", "bbox": {"l": 152.94002, "t": 302.72766, "r": 414.05447, "b": 311.59207, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "and column masks in a relational database environment.", "bbox": {"l": 152.94002, "t": 314.72747999999996, "r": 362.3291, "b": 323.59189, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "This IBM Redpaper publication provides information about the IBM i 7.2 feature of IBM DB2 for i Row and Column Access Control (RCAC). It offers a broad description of the function and advantages of controlling access to data in a comprehensive and transparent way. This publication helps you understand the capabilities of RCAC and provides examples of defining, creating, and implementing the row permissions and column masks in a relational database environment."}, {"label": "text", "id": 0, "page_no": 17, "cluster": {"id": 0, "label": "text", "bbox": {"l": 152.94002, "t": 331.70728, "r": 414.17383, "b": 388.57095, "coord_origin": "TOPLEFT"}, "confidence": 0.9799742698669434, "cells": [{"id": 44, "text": "This paper is intended for database engineers, data-centric application ", "bbox": {"l": 152.94002, "t": 331.70728, "r": 414.17383, "b": 340.57169, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "developers, and security officers who want to design and implement ", "bbox": {"l": 152.94002, "t": 343.70709, "r": 407.61029, "b": 352.5715, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "RCAC as a part of their data control and governance policy. A solid ", "bbox": {"l": 152.94002, "t": 355.70691, "r": 399.29565, "b": 364.57132, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "background in IBM i object level security, DB2 for i relational database ", "bbox": {"l": 152.94002, "t": 367.70673, "r": 414.0603, "b": 376.57114, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "concepts, and SQL is assumed.", "bbox": {"l": 152.94002, "t": 379.70654, "r": 268.86945, "b": 388.57095, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "This paper is intended for database engineers, data-centric application developers, and security officers who want to design and implement RCAC as a part of their data control and governance policy. A solid background in IBM i object level security, DB2 for i relational database concepts, and SQL is assumed."}, {"label": "text", "id": 16, "page_no": 17, "cluster": {"id": 16, "label": "text", "bbox": {"l": 287.22, "t": 28.54803000000004, "r": 414.24481, "b": 50.748050000000035, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 49, "text": "Back cover", "bbox": {"l": 287.22, "t": 28.54803000000004, "r": 414.24481, "b": 50.748050000000035, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Back cover"}], "headers": [{"label": "page_footer", "id": 10, "page_no": 17, "cluster": {"id": 10, "label": "page_footer", "bbox": {"l": 171.0, "t": 631.338, "r": 231.88769999999997, "b": 639.66301, "coord_origin": "TOPLEFT"}, "confidence": 0.7700252532958984, "cells": [{"id": 1, "text": "REDP-5110-00", "bbox": {"l": 171.0, "t": 631.338, "r": 231.88769999999997, "b": 639.66301, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "REDP-5110-00"}]}}]
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v2/right_to_left_01.doctags.txt b/tests/data/groundtruth/docling_v2/right_to_left_01.doctags.txt
new file mode 100644
index 00000000..2c686598
--- /dev/null
+++ b/tests/data/groundtruth/docling_v2/right_to_left_01.doctags.txt
@@ -0,0 +1,8 @@
+<doctag><section_header_level_1><loc_183><loc_46><loc_426><loc_55>Pythonو R ةغلب ةجمربلا للاخ نم تلاكشملا لحو ةيجاتنلإا نيسحت</section_header_level_1>
+<text><loc_74><loc_64><loc_427><loc_99>Python و R ةغلب ةجمربلا ربتعت ةلاعف لولح داجيإ يف دعاستو ةيجاتنلإا ززعت نأ نكمي يتلا ةيوقلا تاودلأا نم ءاملعلاو نيللحملا ىلع لهسي امم ،تانايبلا ليلحتل ةيلاثم اهلعجت ةديرف تازيمPython و R نم لك كلتمي .تلاكشملل ناك اذإ .ةلاعفو ةعيرس ةقيرطب ةدقعم تلايلحت ءارجإ مهسي نأ نكمي تاغللا هذه مادختسا نإف ،ةيليلحت ةيلقع كيدل .لمعلا جئاتن نيسحت يف ريبك لكشب</text>
+<text><loc_170><loc_126><loc_170><loc_134>ً</text>
+<text><loc_416><loc_135><loc_416><loc_143>ً</text>
+<text><loc_82><loc_108><loc_427><loc_143>جارختساو تانايبلا نم ةلئاه تايمك ةجلاعم نكمملا نم حبصي ،ةجمربلا تاراهم عم يليلحتلا ريكفتلا عمتجي امدنع ذيفنتلPython و R مادختسا نيجمربملل نكمي .اهنم تاهجوتلاو طامنلأا ةجذمنلا لثم ،ةمدقتم ةيليلحت تايلمع ةقد رثكأ تارارق ذاختا ىلإ ا ضيأ يدؤي نأ نكمي لب ،تقولا رفوي طقف سيل اذه .ةريبكلا تانايبلا ليلحتو ةيئاصحلإا تانايبلا ىلع ةمئاق تاجاتنتسا ىلع ءانب .</text>
+<text><loc_76><loc_152><loc_427><loc_186>ليلحتلا نم ،تاقيبطتلا نم ةعساو ةعومجم معدت ةينغ تاودأو تابتكمPython و R نم لك رفوت ،كلذ ىلع ةولاع ىلع .ةفلتخملا تلاكشملل ةركتبم لولح ريوطتل تابتكملا هذه نم ةدافتسلاا نيمدختسملل نكمي .يللآا ملعتلا ىلإ ينايبلا R رفوت امنيب ،ةءافكب تانايبلا ةرادلإ Python يف pandas ةبتكم مادختسا نكمي ،لاثملا ليبس مسرلل ةيوق تاودأ .نيللحملاو نيثحابلل ةيلاثم اهلعجي امم ،يئاصحلإا ليلحتلاو ينايبلا</text>
+<text><loc_79><loc_195><loc_427><loc_221>Python و R ةغلب ةجمربلا يدؤت نأ نكمي ،ةياهنلا يف ةركتبم لولح ريفوتو ةيجاتنلإا نيسحت ىلإ ةيليلحت ةيلقع عم اهل نوكت نأ نكمي ةبسانملا ةيجمربلا بيلاسلأا قيبطتو لاعف لكشب تانايبلا ليلحت ىلع ةردقلا نإ .ةدقعملا تلاكشملل .ينهملاو يصخشلا ءادلأا ىلع ىدملا ةديعب ةيباجيإ تاريثأت</text>
+</doctag>
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v2/right_to_left_01.json b/tests/data/groundtruth/docling_v2/right_to_left_01.json
new file mode 100644
index 00000000..1a029cba
--- /dev/null
+++ b/tests/data/groundtruth/docling_v2/right_to_left_01.json
@@ -0,0 +1 @@
+{"schema_name": "DoclingDocument", "version": "1.1.0", "name": "right_to_left_01", "origin": {"mimetype": "application/pdf", "binary_hash": 11705364559529254676, "filename": "right_to_left_01.pdf", "uri": null}, "furniture": {"self_ref": "#/furniture", "parent": null, "children": [], "content_layer": "furniture", "name": "_root_", "label": "unspecified"}, "body": {"self_ref": "#/body", "parent": null, "children": [{"cref": "#/texts/0"}, {"cref": "#/texts/1"}, {"cref": "#/texts/2"}, {"cref": "#/texts/3"}, {"cref": "#/texts/4"}, {"cref": "#/texts/5"}, {"cref": "#/texts/6"}], "content_layer": "body", "name": "_root_", "label": "unspecified"}, "groups": [], "texts": [{"self_ref": "#/texts/0", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "section_header", "prov": [{"page_no": 1, "bbox": {"l": 223.85000999999997, "t": 719.4619800000002, "r": 521.98181, "b": 704.4510500000001, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 59]}], "orig": "Python\u0648 R \u0629\u063a\u0644\u0628 \u0629\u062c\u0645\u0631\u0628\u0644\u0627 \u0644\u0644\u0627\u062e \u0646\u0645 \u062a\u0644\u0627\u0643\u0634\u0645\u0644\u0627 \u0644\u062d\u0648 \u0629\u064a\u062c\u0627\u062a\u0646\u0644\u0625\u0627 \u0646\u064a\u0633\u062d\u062a", "text": "Python\u0648 R \u0629\u063a\u0644\u0628 \u0629\u062c\u0645\u0631\u0628\u0644\u0627 \u0644\u0644\u0627\u062e \u0646\u0645 \u062a\u0644\u0627\u0643\u0634\u0645\u0644\u0627 \u0644\u062d\u0648 \u0629\u064a\u062c\u0627\u062a\u0646\u0644\u0625\u0627 \u0646\u064a\u0633\u062d\u062a", "level": 1}, {"self_ref": "#/texts/1", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 90.744003, "t": 689.992, "r": 522.19, "b": 635.30804, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 345]}], "orig": "Python \u0648 R \u0629\u063a\u0644\u0628 \u0629\u062c\u0645\u0631\u0628\u0644\u0627 \u0631\u0628\u062a\u0639\u062a \u0629\u0644\u0627\u0639\u0641 \u0644\u0648\u0644\u062d \u062f\u0627\u062c\u064a\u0625 \u064a\u0641 \u062f\u0639\u0627\u0633\u062a\u0648 \u0629\u064a\u062c\u0627\u062a\u0646\u0644\u0625\u0627 \u0632\u0632\u0639\u062a \u0646\u0623 \u0646\u0643\u0645\u064a \u064a\u062a\u0644\u0627 \u0629\u064a\u0648\u0642\u0644\u0627 \u062a\u0627\u0648\u062f\u0644\u0623\u0627 \u0646\u0645 \u0621\u0627\u0645\u0644\u0639\u0644\u0627\u0648 \u0646\u064a\u0644\u0644\u062d\u0645\u0644\u0627 \u0649\u0644\u0639 \u0644\u0647\u0633\u064a \u0627\u0645\u0645 \u060c\u062a\u0627\u0646\u0627\u064a\u0628\u0644\u0627 \u0644\u064a\u0644\u062d\u062a\u0644 \u0629\u064a\u0644\u0627\u062b\u0645 \u0627\u0647\u0644\u0639\u062c\u062a \u0629\u062f\u064a\u0631\u0641 \u062a\u0627\u0632\u064a\u0645Python \u0648 R \u0646\u0645 \u0644\u0643 \u0643\u0644\u062a\u0645\u064a .\u062a\u0644\u0627\u0643\u0634\u0645\u0644\u0644 \u0646\u0627\u0643 \u0627\u0630\u0625 .\u0629\u0644\u0627\u0639\u0641\u0648 \u0629\u0639\u064a\u0631\u0633 \u0629\u0642\u064a\u0631\u0637\u0628 \u0629\u062f\u0642\u0639\u0645 \u062a\u0644\u0627\u064a\u0644\u062d\u062a \u0621\u0627\u0631\u062c\u0625 \u0645\u0647\u0633\u064a \u0646\u0623 \u0646\u0643\u0645\u064a \u062a\u0627\u063a\u0644\u0644\u0627 \u0647\u0630\u0647 \u0645\u0627\u062f\u062e\u062a\u0633\u0627 \u0646\u0625\u0641 \u060c\u0629\u064a\u0644\u064a\u0644\u062d\u062a \u0629\u064a\u0644\u0642\u0639 \u0643\u064a\u062f\u0644 .\u0644\u0645\u0639\u0644\u0627 \u062c\u0626\u0627\u062a\u0646 \u0646\u064a\u0633\u062d\u062a \u064a\u0641 \u0631\u064a\u0628\u0643 \u0644\u0643\u0634\u0628", "text": "Python \u0648 R \u0629\u063a\u0644\u0628 \u0629\u062c\u0645\u0631\u0628\u0644\u0627 \u0631\u0628\u062a\u0639\u062a \u0629\u0644\u0627\u0639\u0641 \u0644\u0648\u0644\u062d \u062f\u0627\u062c\u064a\u0625 \u064a\u0641 \u062f\u0639\u0627\u0633\u062a\u0648 \u0629\u064a\u062c\u0627\u062a\u0646\u0644\u0625\u0627 \u0632\u0632\u0639\u062a \u0646\u0623 \u0646\u0643\u0645\u064a \u064a\u062a\u0644\u0627 \u0629\u064a\u0648\u0642\u0644\u0627 \u062a\u0627\u0648\u062f\u0644\u0623\u0627 \u0646\u0645 \u0621\u0627\u0645\u0644\u0639\u0644\u0627\u0648 \u0646\u064a\u0644\u0644\u062d\u0645\u0644\u0627 \u0649\u0644\u0639 \u0644\u0647\u0633\u064a \u0627\u0645\u0645 \u060c\u062a\u0627\u0646\u0627\u064a\u0628\u0644\u0627 \u0644\u064a\u0644\u062d\u062a\u0644 \u0629\u064a\u0644\u0627\u062b\u0645 \u0627\u0647\u0644\u0639\u062c\u062a \u0629\u062f\u064a\u0631\u0641 \u062a\u0627\u0632\u064a\u0645Python \u0648 R \u0646\u0645 \u0644\u0643 \u0643\u0644\u062a\u0645\u064a .\u062a\u0644\u0627\u0643\u0634\u0645\u0644\u0644 \u0646\u0627\u0643 \u0627\u0630\u0625 .\u0629\u0644\u0627\u0639\u0641\u0648 \u0629\u0639\u064a\u0631\u0633 \u0629\u0642\u064a\u0631\u0637\u0628 \u0629\u062f\u0642\u0639\u0645 \u062a\u0644\u0627\u064a\u0644\u062d\u062a \u0621\u0627\u0631\u062c\u0625 \u0645\u0647\u0633\u064a \u0646\u0623 \u0646\u0643\u0645\u064a \u062a\u0627\u063a\u0644\u0644\u0627 \u0647\u0630\u0647 \u0645\u0627\u062f\u062e\u062a\u0633\u0627 \u0646\u0625\u0641 \u060c\u0629\u064a\u0644\u064a\u0644\u062d\u062a \u0629\u064a\u0644\u0642\u0639 \u0643\u064a\u062f\u0644 .\u0644\u0645\u0639\u0644\u0627 \u062c\u0626\u0627\u062a\u0646 \u0646\u064a\u0633\u062d\u062a \u064a\u0641 \u0631\u064a\u0628\u0643 \u0644\u0643\u0634\u0628"}, {"self_ref": "#/texts/2", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 208.10402, "t": 592.67206, "r": 208.10402, "b": 579.38806, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "\u064b", "text": "\u064b"}, {"self_ref": "#/texts/3", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 509.34990999999997, "t": 578.03198, "r": 509.34990999999997, "b": 564.74799, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 1]}], "orig": "\u064b", "text": "\u064b"}, {"self_ref": "#/texts/4", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 99.863998, "t": 620.75201, "r": 522.23792, "b": 566.06799, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 348]}], "orig": "\u062c\u0627\u0631\u062e\u062a\u0633\u0627\u0648 \u062a\u0627\u0646\u0627\u064a\u0628\u0644\u0627 \u0646\u0645 \u0629\u0644\u0626\u0627\u0647 \u062a\u0627\u064a\u0645\u0643 \u0629\u062c\u0644\u0627\u0639\u0645 \u0646\u0643\u0645\u0645\u0644\u0627 \u0646\u0645 \u062d\u0628\u0635\u064a \u060c\u0629\u062c\u0645\u0631\u0628\u0644\u0627 \u062a\u0627\u0631\u0627\u0647\u0645 \u0639\u0645 \u064a\u0644\u064a\u0644\u062d\u062a\u0644\u0627 \u0631\u064a\u0643\u0641\u062a\u0644\u0627 \u0639\u0645\u062a\u062c\u064a \u0627\u0645\u062f\u0646\u0639 \u0630\u064a\u0641\u0646\u062a\u0644Python \u0648 R \u0645\u0627\u062f\u062e\u062a\u0633\u0627 \u0646\u064a\u062c\u0645\u0631\u0628\u0645\u0644\u0644 \u0646\u0643\u0645\u064a .\u0627\u0647\u0646\u0645 \u062a\u0627\u0647\u062c\u0648\u062a\u0644\u0627\u0648 \u0637\u0627\u0645\u0646\u0644\u0623\u0627 \u0629\u062c\u0630\u0645\u0646\u0644\u0627 \u0644\u062b\u0645 \u060c\u0629\u0645\u062f\u0642\u062a\u0645 \u0629\u064a\u0644\u064a\u0644\u062d\u062a \u062a\u0627\u064a\u0644\u0645\u0639 \u0629\u0642\u062f \u0631\u062b\u0643\u0623 \u062a\u0627\u0631\u0627\u0631\u0642 \u0630\u0627\u062e\u062a\u0627 \u0649\u0644\u0625 \u0627 \u0636\u064a\u0623 \u064a\u062f\u0624\u064a \u0646\u0623 \u0646\u0643\u0645\u064a \u0644\u0628 \u060c\u062a\u0642\u0648\u0644\u0627 \u0631\u0641\u0648\u064a \u0637\u0642\u0641 \u0633\u064a\u0644 \u0627\u0630\u0647 .\u0629\u0631\u064a\u0628\u0643\u0644\u0627 \u062a\u0627\u0646\u0627\u064a\u0628\u0644\u0627 \u0644\u064a\u0644\u062d\u062a\u0648 \u0629\u064a\u0626\u0627\u0635\u062d\u0644\u0625\u0627 \u062a\u0627\u0646\u0627\u064a\u0628\u0644\u0627 \u0649\u0644\u0639 \u0629\u0645\u0626\u0627\u0642 \u062a\u0627\u062c\u0627\u062a\u0646\u062a\u0633\u0627 \u0649\u0644\u0639 \u0621\u0627\u0646\u0628 .", "text": "\u062c\u0627\u0631\u062e\u062a\u0633\u0627\u0648 \u062a\u0627\u0646\u0627\u064a\u0628\u0644\u0627 \u0646\u0645 \u0629\u0644\u0626\u0627\u0647 \u062a\u0627\u064a\u0645\u0643 \u0629\u062c\u0644\u0627\u0639\u0645 \u0646\u0643\u0645\u0645\u0644\u0627 \u0646\u0645 \u062d\u0628\u0635\u064a \u060c\u0629\u062c\u0645\u0631\u0628\u0644\u0627 \u062a\u0627\u0631\u0627\u0647\u0645 \u0639\u0645 \u064a\u0644\u064a\u0644\u062d\u062a\u0644\u0627 \u0631\u064a\u0643\u0641\u062a\u0644\u0627 \u0639\u0645\u062a\u062c\u064a \u0627\u0645\u062f\u0646\u0639 \u0630\u064a\u0641\u0646\u062a\u0644Python \u0648 R \u0645\u0627\u062f\u062e\u062a\u0633\u0627 \u0646\u064a\u062c\u0645\u0631\u0628\u0645\u0644\u0644 \u0646\u0643\u0645\u064a .\u0627\u0647\u0646\u0645 \u062a\u0627\u0647\u062c\u0648\u062a\u0644\u0627\u0648 \u0637\u0627\u0645\u0646\u0644\u0623\u0627 \u0629\u062c\u0630\u0645\u0646\u0644\u0627 \u0644\u062b\u0645 \u060c\u0629\u0645\u062f\u0642\u062a\u0645 \u0629\u064a\u0644\u064a\u0644\u062d\u062a \u062a\u0627\u064a\u0644\u0645\u0639 \u0629\u0642\u062f \u0631\u062b\u0643\u0623 \u062a\u0627\u0631\u0627\u0631\u0642 \u0630\u0627\u062e\u062a\u0627 \u0649\u0644\u0625 \u0627 \u0636\u064a\u0623 \u064a\u062f\u0624\u064a \u0646\u0623 \u0646\u0643\u0645\u064a \u0644\u0628 \u060c\u062a\u0642\u0648\u0644\u0627 \u0631\u0641\u0648\u064a \u0637\u0642\u0641 \u0633\u064a\u0644 \u0627\u0630\u0647 .\u0629\u0631\u064a\u0628\u0643\u0644\u0627 \u062a\u0627\u0646\u0627\u064a\u0628\u0644\u0627 \u0644\u064a\u0644\u062d\u062a\u0648 \u0629\u064a\u0626\u0627\u0635\u062d\u0644\u0625\u0627 \u062a\u0627\u0646\u0627\u064a\u0628\u0644\u0627 \u0649\u0644\u0639 \u0629\u0645\u0626\u0627\u0642 \u062a\u0627\u062c\u0627\u062a\u0646\u062a\u0633\u0627 \u0649\u0644\u0639 \u0621\u0627\u0646\u0628 ."}, {"self_ref": "#/texts/5", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 92.903999, "t": 551.63202, "r": 522.10596, "b": 496.91799999999995, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 375]}], "orig": "\u0644\u064a\u0644\u062d\u062a\u0644\u0627 \u0646\u0645 \u060c\u062a\u0627\u0642\u064a\u0628\u0637\u062a\u0644\u0627 \u0646\u0645 \u0629\u0639\u0633\u0627\u0648 \u0629\u0639\u0648\u0645\u062c\u0645 \u0645\u0639\u062f\u062a \u0629\u064a\u0646\u063a \u062a\u0627\u0648\u062f\u0623\u0648 \u062a\u0627\u0628\u062a\u0643\u0645Python \u0648 R \u0646\u0645 \u0644\u0643 \u0631\u0641\u0648\u062a \u060c\u0643\u0644\u0630 \u0649\u0644\u0639 \u0629\u0648\u0644\u0627\u0639 \u0649\u0644\u0639 .\u0629\u0641\u0644\u062a\u062e\u0645\u0644\u0627 \u062a\u0644\u0627\u0643\u0634\u0645\u0644\u0644 \u0629\u0631\u0643\u062a\u0628\u0645 \u0644\u0648\u0644\u062d \u0631\u064a\u0648\u0637\u062a\u0644 \u062a\u0627\u0628\u062a\u0643\u0645\u0644\u0627 \u0647\u0630\u0647 \u0646\u0645 \u0629\u062f\u0627\u0641\u062a\u0633\u0644\u0627\u0627 \u0646\u064a\u0645\u062f\u062e\u062a\u0633\u0645\u0644\u0644 \u0646\u0643\u0645\u064a .\u064a\u0644\u0644\u0622\u0627 \u0645\u0644\u0639\u062a\u0644\u0627 \u0649\u0644\u0625 \u064a\u0646\u0627\u064a\u0628\u0644\u0627 R \u0631\u0641\u0648\u062a \u0627\u0645\u0646\u064a\u0628 \u060c\u0629\u0621\u0627\u0641\u0643\u0628 \u062a\u0627\u0646\u0627\u064a\u0628\u0644\u0627 \u0629\u0631\u0627\u062f\u0644\u0625 Python \u064a\u0641 pandas \u0629\u0628\u062a\u0643\u0645 \u0645\u0627\u062f\u062e\u062a\u0633\u0627 \u0646\u0643\u0645\u064a \u060c\u0644\u0627\u062b\u0645\u0644\u0627 \u0644\u064a\u0628\u0633 \u0645\u0633\u0631\u0644\u0644 \u0629\u064a\u0648\u0642 \u062a\u0627\u0648\u062f\u0623 .\u0646\u064a\u0644\u0644\u062d\u0645\u0644\u0627\u0648 \u0646\u064a\u062b\u062d\u0627\u0628\u0644\u0644 \u0629\u064a\u0644\u0627\u062b\u0645 \u0627\u0647\u0644\u0639\u062c\u064a \u0627\u0645\u0645 \u060c\u064a\u0626\u0627\u0635\u062d\u0644\u0625\u0627 \u0644\u064a\u0644\u062d\u062a\u0644\u0627\u0648 \u064a\u0646\u0627\u064a\u0628\u0644\u0627", "text": "\u0644\u064a\u0644\u062d\u062a\u0644\u0627 \u0646\u0645 \u060c\u062a\u0627\u0642\u064a\u0628\u0637\u062a\u0644\u0627 \u0646\u0645 \u0629\u0639\u0633\u0627\u0648 \u0629\u0639\u0648\u0645\u062c\u0645 \u0645\u0639\u062f\u062a \u0629\u064a\u0646\u063a \u062a\u0627\u0648\u062f\u0623\u0648 \u062a\u0627\u0628\u062a\u0643\u0645Python \u0648 R \u0646\u0645 \u0644\u0643 \u0631\u0641\u0648\u062a \u060c\u0643\u0644\u0630 \u0649\u0644\u0639 \u0629\u0648\u0644\u0627\u0639 \u0649\u0644\u0639 .\u0629\u0641\u0644\u062a\u062e\u0645\u0644\u0627 \u062a\u0644\u0627\u0643\u0634\u0645\u0644\u0644 \u0629\u0631\u0643\u062a\u0628\u0645 \u0644\u0648\u0644\u062d \u0631\u064a\u0648\u0637\u062a\u0644 \u062a\u0627\u0628\u062a\u0643\u0645\u0644\u0627 \u0647\u0630\u0647 \u0646\u0645 \u0629\u062f\u0627\u0641\u062a\u0633\u0644\u0627\u0627 \u0646\u064a\u0645\u062f\u062e\u062a\u0633\u0645\u0644\u0644 \u0646\u0643\u0645\u064a .\u064a\u0644\u0644\u0622\u0627 \u0645\u0644\u0639\u062a\u0644\u0627 \u0649\u0644\u0625 \u064a\u0646\u0627\u064a\u0628\u0644\u0627 R \u0631\u0641\u0648\u062a \u0627\u0645\u0646\u064a\u0628 \u060c\u0629\u0621\u0627\u0641\u0643\u0628 \u062a\u0627\u0646\u0627\u064a\u0628\u0644\u0627 \u0629\u0631\u0627\u062f\u0644\u0625 Python \u064a\u0641 pandas \u0629\u0628\u062a\u0643\u0645 \u0645\u0627\u062f\u062e\u062a\u0633\u0627 \u0646\u0643\u0645\u064a \u060c\u0644\u0627\u062b\u0645\u0644\u0627 \u0644\u064a\u0628\u0633 \u0645\u0633\u0631\u0644\u0644 \u0629\u064a\u0648\u0642 \u062a\u0627\u0648\u062f\u0623 .\u0646\u064a\u0644\u0644\u062d\u0645\u0644\u0627\u0648 \u0646\u064a\u062b\u062d\u0627\u0628\u0644\u0644 \u0629\u064a\u0644\u0627\u062b\u0645 \u0627\u0647\u0644\u0639\u062c\u064a \u0627\u0645\u0645 \u060c\u064a\u0626\u0627\u0635\u062d\u0644\u0625\u0627 \u0644\u064a\u0644\u062d\u062a\u0644\u0627\u0648 \u064a\u0646\u0627\u064a\u0628\u0644\u0627"}, {"self_ref": "#/texts/6", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 96.863998, "t": 482.362, "r": 522.07404, "b": 441.478, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 267]}], "orig": "Python \u0648 R \u0629\u063a\u0644\u0628 \u0629\u062c\u0645\u0631\u0628\u0644\u0627 \u064a\u062f\u0624\u062a \u0646\u0623 \u0646\u0643\u0645\u064a \u060c\u0629\u064a\u0627\u0647\u0646\u0644\u0627 \u064a\u0641 \u0629\u0631\u0643\u062a\u0628\u0645 \u0644\u0648\u0644\u062d \u0631\u064a\u0641\u0648\u062a\u0648 \u0629\u064a\u062c\u0627\u062a\u0646\u0644\u0625\u0627 \u0646\u064a\u0633\u062d\u062a \u0649\u0644\u0625 \u0629\u064a\u0644\u064a\u0644\u062d\u062a \u0629\u064a\u0644\u0642\u0639 \u0639\u0645 \u0627\u0647\u0644 \u0646\u0648\u0643\u062a \u0646\u0623 \u0646\u0643\u0645\u064a \u0629\u0628\u0633\u0627\u0646\u0645\u0644\u0627 \u0629\u064a\u062c\u0645\u0631\u0628\u0644\u0627 \u0628\u064a\u0644\u0627\u0633\u0644\u0623\u0627 \u0642\u064a\u0628\u0637\u062a\u0648 \u0644\u0627\u0639\u0641 \u0644\u0643\u0634\u0628 \u062a\u0627\u0646\u0627\u064a\u0628\u0644\u0627 \u0644\u064a\u0644\u062d\u062a \u0649\u0644\u0639 \u0629\u0631\u062f\u0642\u0644\u0627 \u0646\u0625 .\u0629\u062f\u0642\u0639\u0645\u0644\u0627 \u062a\u0644\u0627\u0643\u0634\u0645\u0644\u0644 .\u064a\u0646\u0647\u0645\u0644\u0627\u0648 \u064a\u0635\u062e\u0634\u0644\u0627 \u0621\u0627\u062f\u0644\u0623\u0627 \u0649\u0644\u0639 \u0649\u062f\u0645\u0644\u0627 \u0629\u062f\u064a\u0639\u0628 \u0629\u064a\u0628\u0627\u062c\u064a\u0625 \u062a\u0627\u0631\u064a\u062b\u0623\u062a", "text": "Python \u0648 R \u0629\u063a\u0644\u0628 \u0629\u062c\u0645\u0631\u0628\u0644\u0627 \u064a\u062f\u0624\u062a \u0646\u0623 \u0646\u0643\u0645\u064a \u060c\u0629\u064a\u0627\u0647\u0646\u0644\u0627 \u064a\u0641 \u0629\u0631\u0643\u062a\u0628\u0645 \u0644\u0648\u0644\u062d \u0631\u064a\u0641\u0648\u062a\u0648 \u0629\u064a\u062c\u0627\u062a\u0646\u0644\u0625\u0627 \u0646\u064a\u0633\u062d\u062a \u0649\u0644\u0625 \u0629\u064a\u0644\u064a\u0644\u062d\u062a \u0629\u064a\u0644\u0642\u0639 \u0639\u0645 \u0627\u0647\u0644 \u0646\u0648\u0643\u062a \u0646\u0623 \u0646\u0643\u0645\u064a \u0629\u0628\u0633\u0627\u0646\u0645\u0644\u0627 \u0629\u064a\u062c\u0645\u0631\u0628\u0644\u0627 \u0628\u064a\u0644\u0627\u0633\u0644\u0623\u0627 \u0642\u064a\u0628\u0637\u062a\u0648 \u0644\u0627\u0639\u0641 \u0644\u0643\u0634\u0628 \u062a\u0627\u0646\u0627\u064a\u0628\u0644\u0627 \u0644\u064a\u0644\u062d\u062a \u0649\u0644\u0639 \u0629\u0631\u062f\u0642\u0644\u0627 \u0646\u0625 .\u0629\u062f\u0642\u0639\u0645\u0644\u0627 \u062a\u0644\u0627\u0643\u0634\u0645\u0644\u0644 .\u064a\u0646\u0647\u0645\u0644\u0627\u0648 \u064a\u0635\u062e\u0634\u0644\u0627 \u0621\u0627\u062f\u0644\u0623\u0627 \u0649\u0644\u0639 \u0649\u062f\u0645\u0644\u0627 \u0629\u062f\u064a\u0639\u0628 \u0629\u064a\u0628\u0627\u062c\u064a\u0625 \u062a\u0627\u0631\u064a\u062b\u0623\u062a"}], "pictures": [], "tables": [], "key_value_items": [], "form_items": [], "pages": {"1": {"size": {"width": 612.0, "height": 792.0}, "image": null, "page_no": 1}}}
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v2/right_to_left_01.md b/tests/data/groundtruth/docling_v2/right_to_left_01.md
new file mode 100644
index 00000000..9c89bedc
--- /dev/null
+++ b/tests/data/groundtruth/docling_v2/right_to_left_01.md
@@ -0,0 +1,13 @@
+## Pythonو R ةغلب ةجمربلا للاخ نم تلاكشملا لحو ةيجاتنلإا نيسحت
+
+Python و R ةغلب ةجمربلا ربتعت ةلاعف لولح داجيإ يف دعاستو ةيجاتنلإا ززعت نأ نكمي يتلا ةيوقلا تاودلأا نم ءاملعلاو نيللحملا ىلع لهسي امم ،تانايبلا ليلحتل ةيلاثم اهلعجت ةديرف تازيمPython و R نم لك كلتمي .تلاكشملل ناك اذإ .ةلاعفو ةعيرس ةقيرطب ةدقعم تلايلحت ءارجإ مهسي نأ نكمي تاغللا هذه مادختسا نإف ،ةيليلحت ةيلقع كيدل .لمعلا جئاتن نيسحت يف ريبك لكشب
+
+ً
+
+ً
+
+جارختساو تانايبلا نم ةلئاه تايمك ةجلاعم نكمملا نم حبصي ،ةجمربلا تاراهم عم يليلحتلا ريكفتلا عمتجي امدنع ذيفنتلPython و R مادختسا نيجمربملل نكمي .اهنم تاهجوتلاو طامنلأا ةجذمنلا لثم ،ةمدقتم ةيليلحت تايلمع ةقد رثكأ تارارق ذاختا ىلإ ا ضيأ يدؤي نأ نكمي لب ،تقولا رفوي طقف سيل اذه .ةريبكلا تانايبلا ليلحتو ةيئاصحلإا تانايبلا ىلع ةمئاق تاجاتنتسا ىلع ءانب .
+
+ليلحتلا نم ،تاقيبطتلا نم ةعساو ةعومجم معدت ةينغ تاودأو تابتكمPython و R نم لك رفوت ،كلذ ىلع ةولاع ىلع .ةفلتخملا تلاكشملل ةركتبم لولح ريوطتل تابتكملا هذه نم ةدافتسلاا نيمدختسملل نكمي .يللآا ملعتلا ىلإ ينايبلا R رفوت امنيب ،ةءافكب تانايبلا ةرادلإ Python يف pandas ةبتكم مادختسا نكمي ،لاثملا ليبس مسرلل ةيوق تاودأ .نيللحملاو نيثحابلل ةيلاثم اهلعجي امم ،يئاصحلإا ليلحتلاو ينايبلا
+
+Python و R ةغلب ةجمربلا يدؤت نأ نكمي ،ةياهنلا يف ةركتبم لولح ريفوتو ةيجاتنلإا نيسحت ىلإ ةيليلحت ةيلقع عم اهل نوكت نأ نكمي ةبسانملا ةيجمربلا بيلاسلأا قيبطتو لاعف لكشب تانايبلا ليلحت ىلع ةردقلا نإ .ةدقعملا تلاكشملل .ينهملاو يصخشلا ءادلأا ىلع ىدملا ةديعب ةيباجيإ تاريثأت
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v2/right_to_left_01.pages.json b/tests/data/groundtruth/docling_v2/right_to_left_01.pages.json
new file mode 100644
index 00000000..356e76d5
--- /dev/null
+++ b/tests/data/groundtruth/docling_v2/right_to_left_01.pages.json
@@ -0,0 +1 @@
+[{"page_no": 0, "size": {"width": 612.0, "height": 792.0}, "cells": [{"id": 0, "text": "Python\u0648 R \u0629\u063a\u0644\u0628 \u0629\u062c\u0645\u0631\u0628\u0644\u0627 \u0644\u0644\u0627\u062e \u0646\u0645 \u062a\u0644\u0627\u0643\u0634\u0645\u0644\u0627 \u0644\u062d\u0648 \u0629\u064a\u062c\u0627\u062a\u0646\u0644\u0625\u0627 \u0646\u064a\u0633\u062d\u062a", "bbox": {"l": 223.85000999999997, "t": 72.53801999999985, "r": 521.98181, "b": 87.54894999999988, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "Python \u0648 R \u0629\u063a\u0644\u0628 \u0629\u062c\u0645\u0631\u0628\u0644\u0627 \u0631\u0628\u062a\u0639\u062a", "bbox": {"l": 396.54999, "t": 102.00800000000004, "r": 522.19, "b": 115.29199000000006, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": " \u0629\u0644\u0627\u0639\u0641 \u0644\u0648\u0644\u062d \u062f\u0627\u062c\u064a\u0625 \u064a\u0641 \u062f\u0639\u0627\u0633\u062a\u0648 \u0629\u064a\u062c\u0627\u062a\u0646\u0644\u0625\u0627 \u0632\u0632\u0639\u062a \u0646\u0623 \u0646\u0643\u0645\u064a \u064a\u062a\u0644\u0627 \u0629\u064a\u0648\u0642\u0644\u0627 \u062a\u0627\u0648\u062f\u0644\u0623\u0627 \u0646\u0645", "bbox": {"l": 108.73999999999998, "t": 102.00800000000004, "r": 396.35596, "b": 115.29199000000006, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": " \u0621\u0627\u0645\u0644\u0639\u0644\u0627\u0648 \u0646\u064a\u0644\u0644\u062d\u0645\u0644\u0627 \u0649\u0644\u0639 \u0644\u0647\u0633\u064a \u0627\u0645\u0645 \u060c\u062a\u0627\u0646\u0627\u064a\u0628\u0644\u0627 \u0644\u064a\u0644\u062d\u062a\u0644 \u0629\u064a\u0644\u0627\u062b\u0645 \u0627\u0647\u0644\u0639\u062c\u062a \u0629\u062f\u064a\u0631\u0641 \u062a\u0627\u0632\u064a\u0645Python \u0648 R \u0646\u0645 \u0644\u0643 \u0643\u0644\u062a\u0645\u064a .\u062a\u0644\u0627\u0643\u0634\u0645\u0644\u0644", "bbox": {"l": 90.744003, "t": 115.80797999999993, "r": 522.08203, "b": 129.09198000000004, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": " \u0646\u0627\u0643 \u0627\u0630\u0625 .\u0629\u0644\u0627\u0639\u0641\u0648 \u0629\u0639\u064a\u0631\u0633 \u0629\u0642\u064a\u0631\u0637\u0628 \u0629\u062f\u0642\u0639\u0645 \u062a\u0644\u0627\u064a\u0644\u062d\u062a \u0621\u0627\u0631\u062c\u0625", "bbox": {"l": 325.97, "t": 129.60797000000014, "r": 522.04602, "b": 142.89197000000001, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": " \u0645\u0647\u0633\u064a \u0646\u0623 \u0646\u0643\u0645\u064a \u062a\u0627\u063a\u0644\u0644\u0627 \u0647\u0630\u0647 \u0645\u0627\u062f\u062e\u062a\u0633\u0627 \u0646\u0625\u0641 \u060c\u0629\u064a\u0644\u064a\u0644\u062d\u062a \u0629\u064a\u0644\u0642\u0639 \u0643\u064a\u062f\u0644", "bbox": {"l": 108.74001, "t": 129.60797000000014, "r": 325.78397, "b": 142.89197000000001, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": ".\u0644\u0645\u0639\u0644\u0627 \u062c\u0626\u0627\u062a\u0646 \u0646\u064a\u0633\u062d\u062a \u064a\u0641 \u0631\u064a\u0628\u0643 \u0644\u0643\u0634\u0628", "bbox": {"l": 394.03, "t": 143.40796, "r": 522.15405, "b": 156.69196, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": " \u062c\u0627\u0631\u062e\u062a\u0633\u0627\u0648 \u062a\u0627\u0646\u0627\u064a\u0628\u0644\u0627 \u0646\u0645 \u0629\u0644\u0626\u0627\u0647 \u062a\u0627\u064a\u0645\u0643 \u0629\u062c\u0644\u0627\u0639\u0645 \u0646\u0643\u0645\u0645\u0644\u0627 \u0646\u0645 \u062d\u0628\u0635\u064a \u060c\u0629\u062c\u0645\u0631\u0628\u0644\u0627 \u062a\u0627\u0631\u0627\u0647\u0645 \u0639\u0645 \u064a\u0644\u064a\u0644\u062d\u062a\u0644\u0627 \u0631\u064a\u0643\u0641\u062a\u0644\u0627 \u0639\u0645\u062a\u062c\u064a \u0627\u0645\u062f\u0646\u0639", "bbox": {"l": 101.42001, "t": 171.24798999999996, "r": 521.85193, "b": 184.53197999999998, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": " \u0630\u064a\u0641\u0646\u062a\u0644Python \u0648 R \u0645\u0627\u062f\u062e\u062a\u0633\u0627 \u0646\u064a\u062c\u0645\u0631\u0628\u0645\u0644\u0644 \u0646\u0643\u0645\u064a .\u0627\u0647\u0646\u0645 \u062a\u0627\u0647\u062c\u0648\u062a\u0644\u0627\u0648 \u0637\u0627\u0645\u0646\u0644\u0623\u0627", "bbox": {"l": 258.17001, "t": 185.04796999999996, "r": 522.034, "b": 198.33196999999996, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": " \u0629\u062c\u0630\u0645\u0646\u0644\u0627 \u0644\u062b\u0645 \u060c\u0629\u0645\u062f\u0642\u062a\u0645 \u0629\u064a\u0644\u064a\u0644\u062d\u062a \u062a\u0627\u064a\u0644\u0645\u0639", "bbox": {"l": 121.34, "t": 185.04796999999996, "r": 257.99597, "b": 198.33196999999996, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": " \u0629\u0642\u062f \u0631\u062b\u0643\u0623 \u062a\u0627\u0631\u0627\u0631\u0642 \u0630\u0627\u062e\u062a\u0627 \u0649\u0644\u0625 \u0627", "bbox": {"l": 99.863998, "t": 198.84795999999994, "r": 207.49202, "b": 212.13196000000005, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "\u064b", "bbox": {"l": 208.10402, "t": 199.32794, "r": 208.10402, "b": 212.61194, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "\u0636\u064a\u0623 \u064a\u062f\u0624\u064a \u0646\u0623 \u0646\u0643\u0645\u064a \u0644\u0628 \u060c\u062a\u0642\u0648\u0644\u0627 \u0631\u0641\u0648\u064a \u0637\u0642\u0641 \u0633\u064a\u0644 \u0627\u0630\u0647 .\u0629\u0631\u064a\u0628\u0643\u0644\u0627 \u062a\u0627\u0646\u0627\u064a\u0628\u0644\u0627 \u0644\u064a\u0644\u062d\u062a\u0648 \u0629\u064a\u0626\u0627\u0635\u062d\u0644\u0625\u0627", "bbox": {"l": 207.50401, "t": 198.84795999999994, "r": 522.10785, "b": 212.13196000000005, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "\u062a\u0627\u0646\u0627\u064a\u0628\u0644\u0627 \u0649\u0644\u0639 \u0629\u0645\u0626\u0627\u0642 \u062a\u0627\u062c\u0627\u062a\u0646\u062a\u0633\u0627 \u0649\u0644\u0639 ", "bbox": {"l": 378.07001, "t": 212.64801, "r": 508.74990999999994, "b": 225.93201, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "\u064b", "bbox": {"l": 509.34990999999997, "t": 213.96802000000002, "r": 509.34990999999997, "b": 227.25201000000004, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "\u0621\u0627\u0646\u0628", "bbox": {"l": 508.74990999999994, "t": 212.64801, "r": 522.23792, "b": 225.93201, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": ".", "bbox": {"l": 374.95001, "t": 212.64801, "r": 377.95001, "b": 225.93201, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": " \u0644\u064a\u0644\u062d\u062a\u0644\u0627 \u0646\u0645 \u060c\u062a\u0627\u0642\u064a\u0628\u0637\u062a\u0644\u0627 \u0646\u0645 \u0629\u0639\u0633\u0627\u0648 \u0629\u0639\u0648\u0645\u062c\u0645 \u0645\u0639\u062f\u062a \u0629\u064a\u0646\u063a \u062a\u0627\u0648\u062f\u0623\u0648 \u062a\u0627\u0628\u062a\u0643\u0645Python \u0648 R \u0646\u0645 \u0644\u0643 \u0631\u0641\u0648\u062a \u060c\u0643\u0644\u0630 \u0649\u0644\u0639 \u0629\u0648\u0644\u0627\u0639", "bbox": {"l": 95.783997, "t": 240.36798, "r": 522.07001, "b": 253.65197999999998, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": " \u0649\u0644\u0639 .\u0629\u0641\u0644\u062a\u062e\u0645\u0644\u0627 \u062a\u0644\u0627\u0643\u0634\u0645\u0644\u0644 \u0629\u0631\u0643\u062a\u0628\u0645 \u0644\u0648\u0644\u062d \u0631\u064a\u0648\u0637\u062a\u0644 \u062a\u0627\u0628\u062a\u0643\u0645\u0644\u0627 \u0647\u0630\u0647 \u0646\u0645 \u0629\u062f\u0627\u0641\u062a\u0633\u0644\u0627\u0627 \u0646\u064a\u0645\u062f\u062e\u062a\u0633\u0645\u0644\u0644 \u0646\u0643\u0645\u064a .\u064a\u0644\u0644\u0622\u0627 \u0645\u0644\u0639\u062a\u0644\u0627 \u0649\u0644\u0625 \u064a\u0646\u0627\u064a\u0628\u0644\u0627", "bbox": {"l": 92.903999, "t": 254.19799999999998, "r": 521.80798, "b": 267.48199, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": " R \u0631\u0641\u0648\u062a \u0627\u0645\u0646\u064a\u0628 \u060c\u0629\u0621\u0627\u0641\u0643\u0628 \u062a\u0627\u0646\u0627\u064a\u0628\u0644\u0627 \u0629\u0631\u0627\u062f\u0644\u0625 Python \u064a\u0641 pandas \u0629\u0628\u062a\u0643\u0645 \u0645\u0627\u062f\u062e\u062a\u0633\u0627 \u0646\u0643\u0645\u064a \u060c\u0644\u0627\u062b\u0645\u0644\u0627 \u0644\u064a\u0628\u0633", "bbox": {"l": 174.38, "t": 267.99798999999996, "r": 522.10596, "b": 281.28200999999996, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": " \u0645\u0633\u0631\u0644\u0644 \u0629\u064a\u0648\u0642 \u062a\u0627\u0648\u062f\u0623", "bbox": {"l": 105.38, "t": 267.99798999999996, "r": 174.30797, "b": 281.28200999999996, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": ".\u0646\u064a\u0644\u0644\u062d\u0645\u0644\u0627\u0648 \u0646\u064a\u062b\u062d\u0627\u0628\u0644\u0644 \u0629\u064a\u0644\u0627\u062b\u0645 \u0627\u0647\u0644\u0639\u062c\u064a \u0627\u0645\u0645 \u060c\u064a\u0626\u0627\u0635\u062d\u0644\u0625\u0627 \u0644\u064a\u0644\u062d\u062a\u0644\u0627\u0648 \u064a\u0646\u0627\u064a\u0628\u0644\u0627", "bbox": {"l": 280.37, "t": 281.798, "r": 522.09399, "b": 295.08200000000005, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "Python \u0648 R \u0629\u063a\u0644\u0628 \u0629\u062c\u0645\u0631\u0628\u0644\u0627 \u064a\u062f\u0624\u062a \u0646\u0623 \u0646\u0643\u0645\u064a \u060c\u0629\u064a\u0627\u0647\u0646\u0644\u0627 \u064a\u0641", "bbox": {"l": 319.60999, "t": 309.638, "r": 522.04596, "b": 322.9220000000001, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": " \u0629\u0631\u0643\u062a\u0628\u0645 \u0644\u0648\u0644\u062d \u0631\u064a\u0641\u0648\u062a\u0648 \u0629\u064a\u062c\u0627\u062a\u0646\u0644\u0625\u0627 \u0646\u064a\u0633\u062d\u062a \u0649\u0644\u0625 \u0629\u064a\u0644\u064a\u0644\u062d\u062a \u0629\u064a\u0644\u0642\u0639 \u0639\u0645", "bbox": {"l": 100.34, "t": 309.638, "r": 319.53198, "b": 322.9220000000001, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": " \u0627\u0647\u0644 \u0646\u0648\u0643\u062a \u0646\u0623 \u0646\u0643\u0645\u064a \u0629\u0628\u0633\u0627\u0646\u0645\u0644\u0627 \u0629\u064a\u062c\u0645\u0631\u0628\u0644\u0627 \u0628\u064a\u0644\u0627\u0633\u0644\u0623\u0627 \u0642\u064a\u0628\u0637\u062a\u0648 \u0644\u0627\u0639\u0641 \u0644\u0643\u0634\u0628 \u062a\u0627\u0646\u0627\u064a\u0628\u0644\u0627 \u0644\u064a\u0644\u062d\u062a \u0649\u0644\u0639 \u0629\u0631\u062f\u0642\u0644\u0627 \u0646\u0625 .\u0629\u062f\u0642\u0639\u0645\u0644\u0627 \u062a\u0644\u0627\u0643\u0634\u0645\u0644\u0644", "bbox": {"l": 96.863998, "t": 323.43802, "r": 521.79193, "b": 336.72202, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": ".\u064a\u0646\u0647\u0645\u0644\u0627\u0648 \u064a\u0635\u062e\u0634\u0644\u0627 \u0621\u0627\u062f\u0644\u0623\u0627 \u0649\u0644\u0639 \u0649\u062f\u0645\u0644\u0627 \u0629\u062f\u064a\u0639\u0628 \u0629\u064a\u0628\u0627\u062c\u064a\u0625 \u062a\u0627\u0631\u064a\u062b\u0623\u062a", "bbox": {"l": 304.60999, "t": 337.23801, "r": 522.07404, "b": 350.522, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 4, "label": "section_header", "bbox": {"l": 223.85000999999997, "t": 72.53801999999985, "r": 521.98181, "b": 87.54894999999988, "coord_origin": "TOPLEFT"}, "confidence": 0.9205371141433716, "cells": [{"id": 0, "text": "Python\u0648 R \u0629\u063a\u0644\u0628 \u0629\u062c\u0645\u0631\u0628\u0644\u0627 \u0644\u0644\u0627\u062e \u0646\u0645 \u062a\u0644\u0627\u0643\u0634\u0645\u0644\u0627 \u0644\u062d\u0648 \u0629\u064a\u062c\u0627\u062a\u0646\u0644\u0625\u0627 \u0646\u064a\u0633\u062d\u062a", "bbox": {"l": 223.85000999999997, "t": 72.53801999999985, "r": 521.98181, "b": 87.54894999999988, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 90.744003, "t": 102.00800000000004, "r": 522.19, "b": 156.69196, "coord_origin": "TOPLEFT"}, "confidence": 0.9738918542861938, "cells": [{"id": 1, "text": "Python \u0648 R \u0629\u063a\u0644\u0628 \u0629\u062c\u0645\u0631\u0628\u0644\u0627 \u0631\u0628\u062a\u0639\u062a", "bbox": {"l": 396.54999, "t": 102.00800000000004, "r": 522.19, "b": 115.29199000000006, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": " \u0629\u0644\u0627\u0639\u0641 \u0644\u0648\u0644\u062d \u062f\u0627\u062c\u064a\u0625 \u064a\u0641 \u062f\u0639\u0627\u0633\u062a\u0648 \u0629\u064a\u062c\u0627\u062a\u0646\u0644\u0625\u0627 \u0632\u0632\u0639\u062a \u0646\u0623 \u0646\u0643\u0645\u064a \u064a\u062a\u0644\u0627 \u0629\u064a\u0648\u0642\u0644\u0627 \u062a\u0627\u0648\u062f\u0644\u0623\u0627 \u0646\u0645", "bbox": {"l": 108.73999999999998, "t": 102.00800000000004, "r": 396.35596, "b": 115.29199000000006, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": " \u0621\u0627\u0645\u0644\u0639\u0644\u0627\u0648 \u0646\u064a\u0644\u0644\u062d\u0645\u0644\u0627 \u0649\u0644\u0639 \u0644\u0647\u0633\u064a \u0627\u0645\u0645 \u060c\u062a\u0627\u0646\u0627\u064a\u0628\u0644\u0627 \u0644\u064a\u0644\u062d\u062a\u0644 \u0629\u064a\u0644\u0627\u062b\u0645 \u0627\u0647\u0644\u0639\u062c\u062a \u0629\u062f\u064a\u0631\u0641 \u062a\u0627\u0632\u064a\u0645Python \u0648 R \u0646\u0645 \u0644\u0643 \u0643\u0644\u062a\u0645\u064a .\u062a\u0644\u0627\u0643\u0634\u0645\u0644\u0644", "bbox": {"l": 90.744003, "t": 115.80797999999993, "r": 522.08203, "b": 129.09198000000004, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": " \u0646\u0627\u0643 \u0627\u0630\u0625 .\u0629\u0644\u0627\u0639\u0641\u0648 \u0629\u0639\u064a\u0631\u0633 \u0629\u0642\u064a\u0631\u0637\u0628 \u0629\u062f\u0642\u0639\u0645 \u062a\u0644\u0627\u064a\u0644\u062d\u062a \u0621\u0627\u0631\u062c\u0625", "bbox": {"l": 325.97, "t": 129.60797000000014, "r": 522.04602, "b": 142.89197000000001, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": " \u0645\u0647\u0633\u064a \u0646\u0623 \u0646\u0643\u0645\u064a \u062a\u0627\u063a\u0644\u0644\u0627 \u0647\u0630\u0647 \u0645\u0627\u062f\u062e\u062a\u0633\u0627 \u0646\u0625\u0641 \u060c\u0629\u064a\u0644\u064a\u0644\u062d\u062a \u0629\u064a\u0644\u0642\u0639 \u0643\u064a\u062f\u0644", "bbox": {"l": 108.74001, "t": 129.60797000000014, "r": 325.78397, "b": 142.89197000000001, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": ".\u0644\u0645\u0639\u0644\u0627 \u062c\u0626\u0627\u062a\u0646 \u0646\u064a\u0633\u062d\u062a \u064a\u0641 \u0631\u064a\u0628\u0643 \u0644\u0643\u0634\u0628", "bbox": {"l": 394.03, "t": 143.40796, "r": 522.15405, "b": 156.69196, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 99.863998, "t": 171.24798999999996, "r": 522.23792, "b": 225.93201, "coord_origin": "TOPLEFT"}, "confidence": 0.9677387475967407, "cells": [{"id": 7, "text": " \u062c\u0627\u0631\u062e\u062a\u0633\u0627\u0648 \u062a\u0627\u0646\u0627\u064a\u0628\u0644\u0627 \u0646\u0645 \u0629\u0644\u0626\u0627\u0647 \u062a\u0627\u064a\u0645\u0643 \u0629\u062c\u0644\u0627\u0639\u0645 \u0646\u0643\u0645\u0645\u0644\u0627 \u0646\u0645 \u062d\u0628\u0635\u064a \u060c\u0629\u062c\u0645\u0631\u0628\u0644\u0627 \u062a\u0627\u0631\u0627\u0647\u0645 \u0639\u0645 \u064a\u0644\u064a\u0644\u062d\u062a\u0644\u0627 \u0631\u064a\u0643\u0641\u062a\u0644\u0627 \u0639\u0645\u062a\u062c\u064a \u0627\u0645\u062f\u0646\u0639", "bbox": {"l": 101.42001, "t": 171.24798999999996, "r": 521.85193, "b": 184.53197999999998, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": " \u0630\u064a\u0641\u0646\u062a\u0644Python \u0648 R \u0645\u0627\u062f\u062e\u062a\u0633\u0627 \u0646\u064a\u062c\u0645\u0631\u0628\u0645\u0644\u0644 \u0646\u0643\u0645\u064a .\u0627\u0647\u0646\u0645 \u062a\u0627\u0647\u062c\u0648\u062a\u0644\u0627\u0648 \u0637\u0627\u0645\u0646\u0644\u0623\u0627", "bbox": {"l": 258.17001, "t": 185.04796999999996, "r": 522.034, "b": 198.33196999999996, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": " \u0629\u062c\u0630\u0645\u0646\u0644\u0627 \u0644\u062b\u0645 \u060c\u0629\u0645\u062f\u0642\u062a\u0645 \u0629\u064a\u0644\u064a\u0644\u062d\u062a \u062a\u0627\u064a\u0644\u0645\u0639", "bbox": {"l": 121.34, "t": 185.04796999999996, "r": 257.99597, "b": 198.33196999999996, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": " \u0629\u0642\u062f \u0631\u062b\u0643\u0623 \u062a\u0627\u0631\u0627\u0631\u0642 \u0630\u0627\u062e\u062a\u0627 \u0649\u0644\u0625 \u0627", "bbox": {"l": 99.863998, "t": 198.84795999999994, "r": 207.49202, "b": 212.13196000000005, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "\u0636\u064a\u0623 \u064a\u062f\u0624\u064a \u0646\u0623 \u0646\u0643\u0645\u064a \u0644\u0628 \u060c\u062a\u0642\u0648\u0644\u0627 \u0631\u0641\u0648\u064a \u0637\u0642\u0641 \u0633\u064a\u0644 \u0627\u0630\u0647 .\u0629\u0631\u064a\u0628\u0643\u0644\u0627 \u062a\u0627\u0646\u0627\u064a\u0628\u0644\u0627 \u0644\u064a\u0644\u062d\u062a\u0648 \u0629\u064a\u0626\u0627\u0635\u062d\u0644\u0625\u0627", "bbox": {"l": 207.50401, "t": 198.84795999999994, "r": 522.10785, "b": 212.13196000000005, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "\u062a\u0627\u0646\u0627\u064a\u0628\u0644\u0627 \u0649\u0644\u0639 \u0629\u0645\u0626\u0627\u0642 \u062a\u0627\u062c\u0627\u062a\u0646\u062a\u0633\u0627 \u0649\u0644\u0639 ", "bbox": {"l": 378.07001, "t": 212.64801, "r": 508.74990999999994, "b": 225.93201, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "\u0621\u0627\u0646\u0628", "bbox": {"l": 508.74990999999994, "t": 212.64801, "r": 522.23792, "b": 225.93201, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": ".", "bbox": {"l": 374.95001, "t": 212.64801, "r": 377.95001, "b": 225.93201, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "text", "bbox": {"l": 208.10402, "t": 199.32794, "r": 208.10402, "b": 212.61194, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "\u064b", "bbox": {"l": 208.10402, "t": 199.32794, "r": 208.10402, "b": 212.61194, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "text", "bbox": {"l": 509.34990999999997, "t": 213.96802000000002, "r": 509.34990999999997, "b": 227.25201000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "\u064b", "bbox": {"l": 509.34990999999997, "t": 213.96802000000002, "r": 509.34990999999997, "b": 227.25201000000004, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 92.903999, "t": 240.36798, "r": 522.10596, "b": 295.08200000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9547483325004578, "cells": [{"id": 17, "text": " \u0644\u064a\u0644\u062d\u062a\u0644\u0627 \u0646\u0645 \u060c\u062a\u0627\u0642\u064a\u0628\u0637\u062a\u0644\u0627 \u0646\u0645 \u0629\u0639\u0633\u0627\u0648 \u0629\u0639\u0648\u0645\u062c\u0645 \u0645\u0639\u062f\u062a \u0629\u064a\u0646\u063a \u062a\u0627\u0648\u062f\u0623\u0648 \u062a\u0627\u0628\u062a\u0643\u0645Python \u0648 R \u0646\u0645 \u0644\u0643 \u0631\u0641\u0648\u062a \u060c\u0643\u0644\u0630 \u0649\u0644\u0639 \u0629\u0648\u0644\u0627\u0639", "bbox": {"l": 95.783997, "t": 240.36798, "r": 522.07001, "b": 253.65197999999998, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": " \u0649\u0644\u0639 .\u0629\u0641\u0644\u062a\u062e\u0645\u0644\u0627 \u062a\u0644\u0627\u0643\u0634\u0645\u0644\u0644 \u0629\u0631\u0643\u062a\u0628\u0645 \u0644\u0648\u0644\u062d \u0631\u064a\u0648\u0637\u062a\u0644 \u062a\u0627\u0628\u062a\u0643\u0645\u0644\u0627 \u0647\u0630\u0647 \u0646\u0645 \u0629\u062f\u0627\u0641\u062a\u0633\u0644\u0627\u0627 \u0646\u064a\u0645\u062f\u062e\u062a\u0633\u0645\u0644\u0644 \u0646\u0643\u0645\u064a .\u064a\u0644\u0644\u0622\u0627 \u0645\u0644\u0639\u062a\u0644\u0627 \u0649\u0644\u0625 \u064a\u0646\u0627\u064a\u0628\u0644\u0627", "bbox": {"l": 92.903999, "t": 254.19799999999998, "r": 521.80798, "b": 267.48199, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": " R \u0631\u0641\u0648\u062a \u0627\u0645\u0646\u064a\u0628 \u060c\u0629\u0621\u0627\u0641\u0643\u0628 \u062a\u0627\u0646\u0627\u064a\u0628\u0644\u0627 \u0629\u0631\u0627\u062f\u0644\u0625 Python \u064a\u0641 pandas \u0629\u0628\u062a\u0643\u0645 \u0645\u0627\u062f\u062e\u062a\u0633\u0627 \u0646\u0643\u0645\u064a \u060c\u0644\u0627\u062b\u0645\u0644\u0627 \u0644\u064a\u0628\u0633", "bbox": {"l": 174.38, "t": 267.99798999999996, "r": 522.10596, "b": 281.28200999999996, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": " \u0645\u0633\u0631\u0644\u0644 \u0629\u064a\u0648\u0642 \u062a\u0627\u0648\u062f\u0623", "bbox": {"l": 105.38, "t": 267.99798999999996, "r": 174.30797, "b": 281.28200999999996, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": ".\u0646\u064a\u0644\u0644\u062d\u0645\u0644\u0627\u0648 \u0646\u064a\u062b\u062d\u0627\u0628\u0644\u0644 \u0629\u064a\u0644\u0627\u062b\u0645 \u0627\u0647\u0644\u0639\u062c\u064a \u0627\u0645\u0645 \u060c\u064a\u0626\u0627\u0635\u062d\u0644\u0625\u0627 \u0644\u064a\u0644\u062d\u062a\u0644\u0627\u0648 \u064a\u0646\u0627\u064a\u0628\u0644\u0627", "bbox": {"l": 280.37, "t": 281.798, "r": 522.09399, "b": 295.08200000000005, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 96.863998, "t": 309.638, "r": 522.07404, "b": 350.522, "coord_origin": "TOPLEFT"}, "confidence": 0.9672117233276367, "cells": [{"id": 22, "text": "Python \u0648 R \u0629\u063a\u0644\u0628 \u0629\u062c\u0645\u0631\u0628\u0644\u0627 \u064a\u062f\u0624\u062a \u0646\u0623 \u0646\u0643\u0645\u064a \u060c\u0629\u064a\u0627\u0647\u0646\u0644\u0627 \u064a\u0641", "bbox": {"l": 319.60999, "t": 309.638, "r": 522.04596, "b": 322.9220000000001, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": " \u0629\u0631\u0643\u062a\u0628\u0645 \u0644\u0648\u0644\u062d \u0631\u064a\u0641\u0648\u062a\u0648 \u0629\u064a\u062c\u0627\u062a\u0646\u0644\u0625\u0627 \u0646\u064a\u0633\u062d\u062a \u0649\u0644\u0625 \u0629\u064a\u0644\u064a\u0644\u062d\u062a \u0629\u064a\u0644\u0642\u0639 \u0639\u0645", "bbox": {"l": 100.34, "t": 309.638, "r": 319.53198, "b": 322.9220000000001, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": " \u0627\u0647\u0644 \u0646\u0648\u0643\u062a \u0646\u0623 \u0646\u0643\u0645\u064a \u0629\u0628\u0633\u0627\u0646\u0645\u0644\u0627 \u0629\u064a\u062c\u0645\u0631\u0628\u0644\u0627 \u0628\u064a\u0644\u0627\u0633\u0644\u0623\u0627 \u0642\u064a\u0628\u0637\u062a\u0648 \u0644\u0627\u0639\u0641 \u0644\u0643\u0634\u0628 \u062a\u0627\u0646\u0627\u064a\u0628\u0644\u0627 \u0644\u064a\u0644\u062d\u062a \u0649\u0644\u0639 \u0629\u0631\u062f\u0642\u0644\u0627 \u0646\u0625 .\u0629\u062f\u0642\u0639\u0645\u0644\u0627 \u062a\u0644\u0627\u0643\u0634\u0645\u0644\u0644", "bbox": {"l": 96.863998, "t": 323.43802, "r": 521.79193, "b": 336.72202, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": ".\u064a\u0646\u0647\u0645\u0644\u0627\u0648 \u064a\u0635\u062e\u0634\u0644\u0627 \u0621\u0627\u062f\u0644\u0623\u0627 \u0649\u0644\u0639 \u0649\u062f\u0645\u0644\u0627 \u0629\u062f\u064a\u0639\u0628 \u0629\u064a\u0628\u0627\u062c\u064a\u0625 \u062a\u0627\u0631\u064a\u062b\u0623\u062a", "bbox": {"l": 304.60999, "t": 337.23801, "r": 522.07404, "b": 350.522, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "section_header", "id": 4, "page_no": 0, "cluster": {"id": 4, "label": "section_header", "bbox": {"l": 223.85000999999997, "t": 72.53801999999985, "r": 521.98181, "b": 87.54894999999988, "coord_origin": "TOPLEFT"}, "confidence": 0.9205371141433716, "cells": [{"id": 0, "text": "Python\u0648 R \u0629\u063a\u0644\u0628 \u0629\u062c\u0645\u0631\u0628\u0644\u0627 \u0644\u0644\u0627\u062e \u0646\u0645 \u062a\u0644\u0627\u0643\u0634\u0645\u0644\u0627 \u0644\u062d\u0648 \u0629\u064a\u062c\u0627\u062a\u0646\u0644\u0625\u0627 \u0646\u064a\u0633\u062d\u062a", "bbox": {"l": 223.85000999999997, "t": 72.53801999999985, "r": 521.98181, "b": 87.54894999999988, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Python\u0648 R \u0629\u063a\u0644\u0628 \u0629\u062c\u0645\u0631\u0628\u0644\u0627 \u0644\u0644\u0627\u062e \u0646\u0645 \u062a\u0644\u0627\u0643\u0634\u0645\u0644\u0627 \u0644\u062d\u0648 \u0629\u064a\u062c\u0627\u062a\u0646\u0644\u0625\u0627 \u0646\u064a\u0633\u062d\u062a"}, {"label": "text", "id": 0, "page_no": 0, "cluster": {"id": 0, "label": "text", "bbox": {"l": 90.744003, "t": 102.00800000000004, "r": 522.19, "b": 156.69196, "coord_origin": "TOPLEFT"}, "confidence": 0.9738918542861938, "cells": [{"id": 1, "text": "Python \u0648 R \u0629\u063a\u0644\u0628 \u0629\u062c\u0645\u0631\u0628\u0644\u0627 \u0631\u0628\u062a\u0639\u062a", "bbox": {"l": 396.54999, "t": 102.00800000000004, "r": 522.19, "b": 115.29199000000006, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": " \u0629\u0644\u0627\u0639\u0641 \u0644\u0648\u0644\u062d \u062f\u0627\u062c\u064a\u0625 \u064a\u0641 \u062f\u0639\u0627\u0633\u062a\u0648 \u0629\u064a\u062c\u0627\u062a\u0646\u0644\u0625\u0627 \u0632\u0632\u0639\u062a \u0646\u0623 \u0646\u0643\u0645\u064a \u064a\u062a\u0644\u0627 \u0629\u064a\u0648\u0642\u0644\u0627 \u062a\u0627\u0648\u062f\u0644\u0623\u0627 \u0646\u0645", "bbox": {"l": 108.73999999999998, "t": 102.00800000000004, "r": 396.35596, "b": 115.29199000000006, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": " \u0621\u0627\u0645\u0644\u0639\u0644\u0627\u0648 \u0646\u064a\u0644\u0644\u062d\u0645\u0644\u0627 \u0649\u0644\u0639 \u0644\u0647\u0633\u064a \u0627\u0645\u0645 \u060c\u062a\u0627\u0646\u0627\u064a\u0628\u0644\u0627 \u0644\u064a\u0644\u062d\u062a\u0644 \u0629\u064a\u0644\u0627\u062b\u0645 \u0627\u0647\u0644\u0639\u062c\u062a \u0629\u062f\u064a\u0631\u0641 \u062a\u0627\u0632\u064a\u0645Python \u0648 R \u0646\u0645 \u0644\u0643 \u0643\u0644\u062a\u0645\u064a .\u062a\u0644\u0627\u0643\u0634\u0645\u0644\u0644", "bbox": {"l": 90.744003, "t": 115.80797999999993, "r": 522.08203, "b": 129.09198000000004, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": " \u0646\u0627\u0643 \u0627\u0630\u0625 .\u0629\u0644\u0627\u0639\u0641\u0648 \u0629\u0639\u064a\u0631\u0633 \u0629\u0642\u064a\u0631\u0637\u0628 \u0629\u062f\u0642\u0639\u0645 \u062a\u0644\u0627\u064a\u0644\u062d\u062a \u0621\u0627\u0631\u062c\u0625", "bbox": {"l": 325.97, "t": 129.60797000000014, "r": 522.04602, "b": 142.89197000000001, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": " \u0645\u0647\u0633\u064a \u0646\u0623 \u0646\u0643\u0645\u064a \u062a\u0627\u063a\u0644\u0644\u0627 \u0647\u0630\u0647 \u0645\u0627\u062f\u062e\u062a\u0633\u0627 \u0646\u0625\u0641 \u060c\u0629\u064a\u0644\u064a\u0644\u062d\u062a \u0629\u064a\u0644\u0642\u0639 \u0643\u064a\u062f\u0644", "bbox": {"l": 108.74001, "t": 129.60797000000014, "r": 325.78397, "b": 142.89197000000001, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": ".\u0644\u0645\u0639\u0644\u0627 \u062c\u0626\u0627\u062a\u0646 \u0646\u064a\u0633\u062d\u062a \u064a\u0641 \u0631\u064a\u0628\u0643 \u0644\u0643\u0634\u0628", "bbox": {"l": 394.03, "t": 143.40796, "r": 522.15405, "b": 156.69196, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Python \u0648 R \u0629\u063a\u0644\u0628 \u0629\u062c\u0645\u0631\u0628\u0644\u0627 \u0631\u0628\u062a\u0639\u062a \u0629\u0644\u0627\u0639\u0641 \u0644\u0648\u0644\u062d \u062f\u0627\u062c\u064a\u0625 \u064a\u0641 \u062f\u0639\u0627\u0633\u062a\u0648 \u0629\u064a\u062c\u0627\u062a\u0646\u0644\u0625\u0627 \u0632\u0632\u0639\u062a \u0646\u0623 \u0646\u0643\u0645\u064a \u064a\u062a\u0644\u0627 \u0629\u064a\u0648\u0642\u0644\u0627 \u062a\u0627\u0648\u062f\u0644\u0623\u0627 \u0646\u0645 \u0621\u0627\u0645\u0644\u0639\u0644\u0627\u0648 \u0646\u064a\u0644\u0644\u062d\u0645\u0644\u0627 \u0649\u0644\u0639 \u0644\u0647\u0633\u064a \u0627\u0645\u0645 \u060c\u062a\u0627\u0646\u0627\u064a\u0628\u0644\u0627 \u0644\u064a\u0644\u062d\u062a\u0644 \u0629\u064a\u0644\u0627\u062b\u0645 \u0627\u0647\u0644\u0639\u062c\u062a \u0629\u062f\u064a\u0631\u0641 \u062a\u0627\u0632\u064a\u0645Python \u0648 R \u0646\u0645 \u0644\u0643 \u0643\u0644\u062a\u0645\u064a .\u062a\u0644\u0627\u0643\u0634\u0645\u0644\u0644 \u0646\u0627\u0643 \u0627\u0630\u0625 .\u0629\u0644\u0627\u0639\u0641\u0648 \u0629\u0639\u064a\u0631\u0633 \u0629\u0642\u064a\u0631\u0637\u0628 \u0629\u062f\u0642\u0639\u0645 \u062a\u0644\u0627\u064a\u0644\u062d\u062a \u0621\u0627\u0631\u062c\u0625 \u0645\u0647\u0633\u064a \u0646\u0623 \u0646\u0643\u0645\u064a \u062a\u0627\u063a\u0644\u0644\u0627 \u0647\u0630\u0647 \u0645\u0627\u062f\u062e\u062a\u0633\u0627 \u0646\u0625\u0641 \u060c\u0629\u064a\u0644\u064a\u0644\u062d\u062a \u0629\u064a\u0644\u0642\u0639 \u0643\u064a\u062f\u0644 .\u0644\u0645\u0639\u0644\u0627 \u062c\u0626\u0627\u062a\u0646 \u0646\u064a\u0633\u062d\u062a \u064a\u0641 \u0631\u064a\u0628\u0643 \u0644\u0643\u0634\u0628"}, {"label": "text", "id": 1, "page_no": 0, "cluster": {"id": 1, "label": "text", "bbox": {"l": 99.863998, "t": 171.24798999999996, "r": 522.23792, "b": 225.93201, "coord_origin": "TOPLEFT"}, "confidence": 0.9677387475967407, "cells": [{"id": 7, "text": " \u062c\u0627\u0631\u062e\u062a\u0633\u0627\u0648 \u062a\u0627\u0646\u0627\u064a\u0628\u0644\u0627 \u0646\u0645 \u0629\u0644\u0626\u0627\u0647 \u062a\u0627\u064a\u0645\u0643 \u0629\u062c\u0644\u0627\u0639\u0645 \u0646\u0643\u0645\u0645\u0644\u0627 \u0646\u0645 \u062d\u0628\u0635\u064a \u060c\u0629\u062c\u0645\u0631\u0628\u0644\u0627 \u062a\u0627\u0631\u0627\u0647\u0645 \u0639\u0645 \u064a\u0644\u064a\u0644\u062d\u062a\u0644\u0627 \u0631\u064a\u0643\u0641\u062a\u0644\u0627 \u0639\u0645\u062a\u062c\u064a \u0627\u0645\u062f\u0646\u0639", "bbox": {"l": 101.42001, "t": 171.24798999999996, "r": 521.85193, "b": 184.53197999999998, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": " \u0630\u064a\u0641\u0646\u062a\u0644Python \u0648 R \u0645\u0627\u062f\u062e\u062a\u0633\u0627 \u0646\u064a\u062c\u0645\u0631\u0628\u0645\u0644\u0644 \u0646\u0643\u0645\u064a .\u0627\u0647\u0646\u0645 \u062a\u0627\u0647\u062c\u0648\u062a\u0644\u0627\u0648 \u0637\u0627\u0645\u0646\u0644\u0623\u0627", "bbox": {"l": 258.17001, "t": 185.04796999999996, "r": 522.034, "b": 198.33196999999996, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": " \u0629\u062c\u0630\u0645\u0646\u0644\u0627 \u0644\u062b\u0645 \u060c\u0629\u0645\u062f\u0642\u062a\u0645 \u0629\u064a\u0644\u064a\u0644\u062d\u062a \u062a\u0627\u064a\u0644\u0645\u0639", "bbox": {"l": 121.34, "t": 185.04796999999996, "r": 257.99597, "b": 198.33196999999996, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": " \u0629\u0642\u062f \u0631\u062b\u0643\u0623 \u062a\u0627\u0631\u0627\u0631\u0642 \u0630\u0627\u062e\u062a\u0627 \u0649\u0644\u0625 \u0627", "bbox": {"l": 99.863998, "t": 198.84795999999994, "r": 207.49202, "b": 212.13196000000005, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "\u0636\u064a\u0623 \u064a\u062f\u0624\u064a \u0646\u0623 \u0646\u0643\u0645\u064a \u0644\u0628 \u060c\u062a\u0642\u0648\u0644\u0627 \u0631\u0641\u0648\u064a \u0637\u0642\u0641 \u0633\u064a\u0644 \u0627\u0630\u0647 .\u0629\u0631\u064a\u0628\u0643\u0644\u0627 \u062a\u0627\u0646\u0627\u064a\u0628\u0644\u0627 \u0644\u064a\u0644\u062d\u062a\u0648 \u0629\u064a\u0626\u0627\u0635\u062d\u0644\u0625\u0627", "bbox": {"l": 207.50401, "t": 198.84795999999994, "r": 522.10785, "b": 212.13196000000005, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "\u062a\u0627\u0646\u0627\u064a\u0628\u0644\u0627 \u0649\u0644\u0639 \u0629\u0645\u0626\u0627\u0642 \u062a\u0627\u062c\u0627\u062a\u0646\u062a\u0633\u0627 \u0649\u0644\u0639 ", "bbox": {"l": 378.07001, "t": 212.64801, "r": 508.74990999999994, "b": 225.93201, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "\u0621\u0627\u0646\u0628", "bbox": {"l": 508.74990999999994, "t": 212.64801, "r": 522.23792, "b": 225.93201, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": ".", "bbox": {"l": 374.95001, "t": 212.64801, "r": 377.95001, "b": 225.93201, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u062c\u0627\u0631\u062e\u062a\u0633\u0627\u0648 \u062a\u0627\u0646\u0627\u064a\u0628\u0644\u0627 \u0646\u0645 \u0629\u0644\u0626\u0627\u0647 \u062a\u0627\u064a\u0645\u0643 \u0629\u062c\u0644\u0627\u0639\u0645 \u0646\u0643\u0645\u0645\u0644\u0627 \u0646\u0645 \u062d\u0628\u0635\u064a \u060c\u0629\u062c\u0645\u0631\u0628\u0644\u0627 \u062a\u0627\u0631\u0627\u0647\u0645 \u0639\u0645 \u064a\u0644\u064a\u0644\u062d\u062a\u0644\u0627 \u0631\u064a\u0643\u0641\u062a\u0644\u0627 \u0639\u0645\u062a\u062c\u064a \u0627\u0645\u062f\u0646\u0639 \u0630\u064a\u0641\u0646\u062a\u0644Python \u0648 R \u0645\u0627\u062f\u062e\u062a\u0633\u0627 \u0646\u064a\u062c\u0645\u0631\u0628\u0645\u0644\u0644 \u0646\u0643\u0645\u064a .\u0627\u0647\u0646\u0645 \u062a\u0627\u0647\u062c\u0648\u062a\u0644\u0627\u0648 \u0637\u0627\u0645\u0646\u0644\u0623\u0627 \u0629\u062c\u0630\u0645\u0646\u0644\u0627 \u0644\u062b\u0645 \u060c\u0629\u0645\u062f\u0642\u062a\u0645 \u0629\u064a\u0644\u064a\u0644\u062d\u062a \u062a\u0627\u064a\u0644\u0645\u0639 \u0629\u0642\u062f \u0631\u062b\u0643\u0623 \u062a\u0627\u0631\u0627\u0631\u0642 \u0630\u0627\u062e\u062a\u0627 \u0649\u0644\u0625 \u0627 \u0636\u064a\u0623 \u064a\u062f\u0624\u064a \u0646\u0623 \u0646\u0643\u0645\u064a \u0644\u0628 \u060c\u062a\u0642\u0648\u0644\u0627 \u0631\u0641\u0648\u064a \u0637\u0642\u0641 \u0633\u064a\u0644 \u0627\u0630\u0647 .\u0629\u0631\u064a\u0628\u0643\u0644\u0627 \u062a\u0627\u0646\u0627\u064a\u0628\u0644\u0627 \u0644\u064a\u0644\u062d\u062a\u0648 \u0629\u064a\u0626\u0627\u0635\u062d\u0644\u0625\u0627 \u062a\u0627\u0646\u0627\u064a\u0628\u0644\u0627 \u0649\u0644\u0639 \u0629\u0645\u0626\u0627\u0642 \u062a\u0627\u062c\u0627\u062a\u0646\u062a\u0633\u0627 \u0649\u0644\u0639 \u0621\u0627\u0646\u0628 ."}, {"label": "text", "id": 5, "page_no": 0, "cluster": {"id": 5, "label": "text", "bbox": {"l": 208.10402, "t": 199.32794, "r": 208.10402, "b": 212.61194, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "\u064b", "bbox": {"l": 208.10402, "t": 199.32794, "r": 208.10402, "b": 212.61194, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u064b"}, {"label": "text", "id": 6, "page_no": 0, "cluster": {"id": 6, "label": "text", "bbox": {"l": 509.34990999999997, "t": 213.96802000000002, "r": 509.34990999999997, "b": 227.25201000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "\u064b", "bbox": {"l": 509.34990999999997, "t": 213.96802000000002, "r": 509.34990999999997, "b": 227.25201000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u064b"}, {"label": "text", "id": 3, "page_no": 0, "cluster": {"id": 3, "label": "text", "bbox": {"l": 92.903999, "t": 240.36798, "r": 522.10596, "b": 295.08200000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9547483325004578, "cells": [{"id": 17, "text": " \u0644\u064a\u0644\u062d\u062a\u0644\u0627 \u0646\u0645 \u060c\u062a\u0627\u0642\u064a\u0628\u0637\u062a\u0644\u0627 \u0646\u0645 \u0629\u0639\u0633\u0627\u0648 \u0629\u0639\u0648\u0645\u062c\u0645 \u0645\u0639\u062f\u062a \u0629\u064a\u0646\u063a \u062a\u0627\u0648\u062f\u0623\u0648 \u062a\u0627\u0628\u062a\u0643\u0645Python \u0648 R \u0646\u0645 \u0644\u0643 \u0631\u0641\u0648\u062a \u060c\u0643\u0644\u0630 \u0649\u0644\u0639 \u0629\u0648\u0644\u0627\u0639", "bbox": {"l": 95.783997, "t": 240.36798, "r": 522.07001, "b": 253.65197999999998, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": " \u0649\u0644\u0639 .\u0629\u0641\u0644\u062a\u062e\u0645\u0644\u0627 \u062a\u0644\u0627\u0643\u0634\u0645\u0644\u0644 \u0629\u0631\u0643\u062a\u0628\u0645 \u0644\u0648\u0644\u062d \u0631\u064a\u0648\u0637\u062a\u0644 \u062a\u0627\u0628\u062a\u0643\u0645\u0644\u0627 \u0647\u0630\u0647 \u0646\u0645 \u0629\u062f\u0627\u0641\u062a\u0633\u0644\u0627\u0627 \u0646\u064a\u0645\u062f\u062e\u062a\u0633\u0645\u0644\u0644 \u0646\u0643\u0645\u064a .\u064a\u0644\u0644\u0622\u0627 \u0645\u0644\u0639\u062a\u0644\u0627 \u0649\u0644\u0625 \u064a\u0646\u0627\u064a\u0628\u0644\u0627", "bbox": {"l": 92.903999, "t": 254.19799999999998, "r": 521.80798, "b": 267.48199, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": " R \u0631\u0641\u0648\u062a \u0627\u0645\u0646\u064a\u0628 \u060c\u0629\u0621\u0627\u0641\u0643\u0628 \u062a\u0627\u0646\u0627\u064a\u0628\u0644\u0627 \u0629\u0631\u0627\u062f\u0644\u0625 Python \u064a\u0641 pandas \u0629\u0628\u062a\u0643\u0645 \u0645\u0627\u062f\u062e\u062a\u0633\u0627 \u0646\u0643\u0645\u064a \u060c\u0644\u0627\u062b\u0645\u0644\u0627 \u0644\u064a\u0628\u0633", "bbox": {"l": 174.38, "t": 267.99798999999996, "r": 522.10596, "b": 281.28200999999996, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": " \u0645\u0633\u0631\u0644\u0644 \u0629\u064a\u0648\u0642 \u062a\u0627\u0648\u062f\u0623", "bbox": {"l": 105.38, "t": 267.99798999999996, "r": 174.30797, "b": 281.28200999999996, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": ".\u0646\u064a\u0644\u0644\u062d\u0645\u0644\u0627\u0648 \u0646\u064a\u062b\u062d\u0627\u0628\u0644\u0644 \u0629\u064a\u0644\u0627\u062b\u0645 \u0627\u0647\u0644\u0639\u062c\u064a \u0627\u0645\u0645 \u060c\u064a\u0626\u0627\u0635\u062d\u0644\u0625\u0627 \u0644\u064a\u0644\u062d\u062a\u0644\u0627\u0648 \u064a\u0646\u0627\u064a\u0628\u0644\u0627", "bbox": {"l": 280.37, "t": 281.798, "r": 522.09399, "b": 295.08200000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u0644\u064a\u0644\u062d\u062a\u0644\u0627 \u0646\u0645 \u060c\u062a\u0627\u0642\u064a\u0628\u0637\u062a\u0644\u0627 \u0646\u0645 \u0629\u0639\u0633\u0627\u0648 \u0629\u0639\u0648\u0645\u062c\u0645 \u0645\u0639\u062f\u062a \u0629\u064a\u0646\u063a \u062a\u0627\u0648\u062f\u0623\u0648 \u062a\u0627\u0628\u062a\u0643\u0645Python \u0648 R \u0646\u0645 \u0644\u0643 \u0631\u0641\u0648\u062a \u060c\u0643\u0644\u0630 \u0649\u0644\u0639 \u0629\u0648\u0644\u0627\u0639 \u0649\u0644\u0639 .\u0629\u0641\u0644\u062a\u062e\u0645\u0644\u0627 \u062a\u0644\u0627\u0643\u0634\u0645\u0644\u0644 \u0629\u0631\u0643\u062a\u0628\u0645 \u0644\u0648\u0644\u062d \u0631\u064a\u0648\u0637\u062a\u0644 \u062a\u0627\u0628\u062a\u0643\u0645\u0644\u0627 \u0647\u0630\u0647 \u0646\u0645 \u0629\u062f\u0627\u0641\u062a\u0633\u0644\u0627\u0627 \u0646\u064a\u0645\u062f\u062e\u062a\u0633\u0645\u0644\u0644 \u0646\u0643\u0645\u064a .\u064a\u0644\u0644\u0622\u0627 \u0645\u0644\u0639\u062a\u0644\u0627 \u0649\u0644\u0625 \u064a\u0646\u0627\u064a\u0628\u0644\u0627 R \u0631\u0641\u0648\u062a \u0627\u0645\u0646\u064a\u0628 \u060c\u0629\u0621\u0627\u0641\u0643\u0628 \u062a\u0627\u0646\u0627\u064a\u0628\u0644\u0627 \u0629\u0631\u0627\u062f\u0644\u0625 Python \u064a\u0641 pandas \u0629\u0628\u062a\u0643\u0645 \u0645\u0627\u062f\u062e\u062a\u0633\u0627 \u0646\u0643\u0645\u064a \u060c\u0644\u0627\u062b\u0645\u0644\u0627 \u0644\u064a\u0628\u0633 \u0645\u0633\u0631\u0644\u0644 \u0629\u064a\u0648\u0642 \u062a\u0627\u0648\u062f\u0623 .\u0646\u064a\u0644\u0644\u062d\u0645\u0644\u0627\u0648 \u0646\u064a\u062b\u062d\u0627\u0628\u0644\u0644 \u0629\u064a\u0644\u0627\u062b\u0645 \u0627\u0647\u0644\u0639\u062c\u064a \u0627\u0645\u0645 \u060c\u064a\u0626\u0627\u0635\u062d\u0644\u0625\u0627 \u0644\u064a\u0644\u062d\u062a\u0644\u0627\u0648 \u064a\u0646\u0627\u064a\u0628\u0644\u0627"}, {"label": "text", "id": 2, "page_no": 0, "cluster": {"id": 2, "label": "text", "bbox": {"l": 96.863998, "t": 309.638, "r": 522.07404, "b": 350.522, "coord_origin": "TOPLEFT"}, "confidence": 0.9672117233276367, "cells": [{"id": 22, "text": "Python \u0648 R \u0629\u063a\u0644\u0628 \u0629\u062c\u0645\u0631\u0628\u0644\u0627 \u064a\u062f\u0624\u062a \u0646\u0623 \u0646\u0643\u0645\u064a \u060c\u0629\u064a\u0627\u0647\u0646\u0644\u0627 \u064a\u0641", "bbox": {"l": 319.60999, "t": 309.638, "r": 522.04596, "b": 322.9220000000001, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": " \u0629\u0631\u0643\u062a\u0628\u0645 \u0644\u0648\u0644\u062d \u0631\u064a\u0641\u0648\u062a\u0648 \u0629\u064a\u062c\u0627\u062a\u0646\u0644\u0625\u0627 \u0646\u064a\u0633\u062d\u062a \u0649\u0644\u0625 \u0629\u064a\u0644\u064a\u0644\u062d\u062a \u0629\u064a\u0644\u0642\u0639 \u0639\u0645", "bbox": {"l": 100.34, "t": 309.638, "r": 319.53198, "b": 322.9220000000001, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": " \u0627\u0647\u0644 \u0646\u0648\u0643\u062a \u0646\u0623 \u0646\u0643\u0645\u064a \u0629\u0628\u0633\u0627\u0646\u0645\u0644\u0627 \u0629\u064a\u062c\u0645\u0631\u0628\u0644\u0627 \u0628\u064a\u0644\u0627\u0633\u0644\u0623\u0627 \u0642\u064a\u0628\u0637\u062a\u0648 \u0644\u0627\u0639\u0641 \u0644\u0643\u0634\u0628 \u062a\u0627\u0646\u0627\u064a\u0628\u0644\u0627 \u0644\u064a\u0644\u062d\u062a \u0649\u0644\u0639 \u0629\u0631\u062f\u0642\u0644\u0627 \u0646\u0625 .\u0629\u062f\u0642\u0639\u0645\u0644\u0627 \u062a\u0644\u0627\u0643\u0634\u0645\u0644\u0644", "bbox": {"l": 96.863998, "t": 323.43802, "r": 521.79193, "b": 336.72202, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": ".\u064a\u0646\u0647\u0645\u0644\u0627\u0648 \u064a\u0635\u062e\u0634\u0644\u0627 \u0621\u0627\u062f\u0644\u0623\u0627 \u0649\u0644\u0639 \u0649\u062f\u0645\u0644\u0627 \u0629\u062f\u064a\u0639\u0628 \u0629\u064a\u0628\u0627\u062c\u064a\u0625 \u062a\u0627\u0631\u064a\u062b\u0623\u062a", "bbox": {"l": 304.60999, "t": 337.23801, "r": 522.07404, "b": 350.522, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Python \u0648 R \u0629\u063a\u0644\u0628 \u0629\u062c\u0645\u0631\u0628\u0644\u0627 \u064a\u062f\u0624\u062a \u0646\u0623 \u0646\u0643\u0645\u064a \u060c\u0629\u064a\u0627\u0647\u0646\u0644\u0627 \u064a\u0641 \u0629\u0631\u0643\u062a\u0628\u0645 \u0644\u0648\u0644\u062d \u0631\u064a\u0641\u0648\u062a\u0648 \u0629\u064a\u062c\u0627\u062a\u0646\u0644\u0625\u0627 \u0646\u064a\u0633\u062d\u062a \u0649\u0644\u0625 \u0629\u064a\u0644\u064a\u0644\u062d\u062a \u0629\u064a\u0644\u0642\u0639 \u0639\u0645 \u0627\u0647\u0644 \u0646\u0648\u0643\u062a \u0646\u0623 \u0646\u0643\u0645\u064a \u0629\u0628\u0633\u0627\u0646\u0645\u0644\u0627 \u0629\u064a\u062c\u0645\u0631\u0628\u0644\u0627 \u0628\u064a\u0644\u0627\u0633\u0644\u0623\u0627 \u0642\u064a\u0628\u0637\u062a\u0648 \u0644\u0627\u0639\u0641 \u0644\u0643\u0634\u0628 \u062a\u0627\u0646\u0627\u064a\u0628\u0644\u0627 \u0644\u064a\u0644\u062d\u062a \u0649\u0644\u0639 \u0629\u0631\u062f\u0642\u0644\u0627 \u0646\u0625 .\u0629\u062f\u0642\u0639\u0645\u0644\u0627 \u062a\u0644\u0627\u0643\u0634\u0645\u0644\u0644 .\u064a\u0646\u0647\u0645\u0644\u0627\u0648 \u064a\u0635\u062e\u0634\u0644\u0627 \u0621\u0627\u062f\u0644\u0623\u0627 \u0649\u0644\u0639 \u0649\u062f\u0645\u0644\u0627 \u0629\u062f\u064a\u0639\u0628 \u0629\u064a\u0628\u0627\u062c\u064a\u0625 \u062a\u0627\u0631\u064a\u062b\u0623\u062a"}], "body": [{"label": "section_header", "id": 4, "page_no": 0, "cluster": {"id": 4, "label": "section_header", "bbox": {"l": 223.85000999999997, "t": 72.53801999999985, "r": 521.98181, "b": 87.54894999999988, "coord_origin": "TOPLEFT"}, "confidence": 0.9205371141433716, "cells": [{"id": 0, "text": "Python\u0648 R \u0629\u063a\u0644\u0628 \u0629\u062c\u0645\u0631\u0628\u0644\u0627 \u0644\u0644\u0627\u062e \u0646\u0645 \u062a\u0644\u0627\u0643\u0634\u0645\u0644\u0627 \u0644\u062d\u0648 \u0629\u064a\u062c\u0627\u062a\u0646\u0644\u0625\u0627 \u0646\u064a\u0633\u062d\u062a", "bbox": {"l": 223.85000999999997, "t": 72.53801999999985, "r": 521.98181, "b": 87.54894999999988, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Python\u0648 R \u0629\u063a\u0644\u0628 \u0629\u062c\u0645\u0631\u0628\u0644\u0627 \u0644\u0644\u0627\u062e \u0646\u0645 \u062a\u0644\u0627\u0643\u0634\u0645\u0644\u0627 \u0644\u062d\u0648 \u0629\u064a\u062c\u0627\u062a\u0646\u0644\u0625\u0627 \u0646\u064a\u0633\u062d\u062a"}, {"label": "text", "id": 0, "page_no": 0, "cluster": {"id": 0, "label": "text", "bbox": {"l": 90.744003, "t": 102.00800000000004, "r": 522.19, "b": 156.69196, "coord_origin": "TOPLEFT"}, "confidence": 0.9738918542861938, "cells": [{"id": 1, "text": "Python \u0648 R \u0629\u063a\u0644\u0628 \u0629\u062c\u0645\u0631\u0628\u0644\u0627 \u0631\u0628\u062a\u0639\u062a", "bbox": {"l": 396.54999, "t": 102.00800000000004, "r": 522.19, "b": 115.29199000000006, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": " \u0629\u0644\u0627\u0639\u0641 \u0644\u0648\u0644\u062d \u062f\u0627\u062c\u064a\u0625 \u064a\u0641 \u062f\u0639\u0627\u0633\u062a\u0648 \u0629\u064a\u062c\u0627\u062a\u0646\u0644\u0625\u0627 \u0632\u0632\u0639\u062a \u0646\u0623 \u0646\u0643\u0645\u064a \u064a\u062a\u0644\u0627 \u0629\u064a\u0648\u0642\u0644\u0627 \u062a\u0627\u0648\u062f\u0644\u0623\u0627 \u0646\u0645", "bbox": {"l": 108.73999999999998, "t": 102.00800000000004, "r": 396.35596, "b": 115.29199000000006, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": " \u0621\u0627\u0645\u0644\u0639\u0644\u0627\u0648 \u0646\u064a\u0644\u0644\u062d\u0645\u0644\u0627 \u0649\u0644\u0639 \u0644\u0647\u0633\u064a \u0627\u0645\u0645 \u060c\u062a\u0627\u0646\u0627\u064a\u0628\u0644\u0627 \u0644\u064a\u0644\u062d\u062a\u0644 \u0629\u064a\u0644\u0627\u062b\u0645 \u0627\u0647\u0644\u0639\u062c\u062a \u0629\u062f\u064a\u0631\u0641 \u062a\u0627\u0632\u064a\u0645Python \u0648 R \u0646\u0645 \u0644\u0643 \u0643\u0644\u062a\u0645\u064a .\u062a\u0644\u0627\u0643\u0634\u0645\u0644\u0644", "bbox": {"l": 90.744003, "t": 115.80797999999993, "r": 522.08203, "b": 129.09198000000004, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": " \u0646\u0627\u0643 \u0627\u0630\u0625 .\u0629\u0644\u0627\u0639\u0641\u0648 \u0629\u0639\u064a\u0631\u0633 \u0629\u0642\u064a\u0631\u0637\u0628 \u0629\u062f\u0642\u0639\u0645 \u062a\u0644\u0627\u064a\u0644\u062d\u062a \u0621\u0627\u0631\u062c\u0625", "bbox": {"l": 325.97, "t": 129.60797000000014, "r": 522.04602, "b": 142.89197000000001, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": " \u0645\u0647\u0633\u064a \u0646\u0623 \u0646\u0643\u0645\u064a \u062a\u0627\u063a\u0644\u0644\u0627 \u0647\u0630\u0647 \u0645\u0627\u062f\u062e\u062a\u0633\u0627 \u0646\u0625\u0641 \u060c\u0629\u064a\u0644\u064a\u0644\u062d\u062a \u0629\u064a\u0644\u0642\u0639 \u0643\u064a\u062f\u0644", "bbox": {"l": 108.74001, "t": 129.60797000000014, "r": 325.78397, "b": 142.89197000000001, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": ".\u0644\u0645\u0639\u0644\u0627 \u062c\u0626\u0627\u062a\u0646 \u0646\u064a\u0633\u062d\u062a \u064a\u0641 \u0631\u064a\u0628\u0643 \u0644\u0643\u0634\u0628", "bbox": {"l": 394.03, "t": 143.40796, "r": 522.15405, "b": 156.69196, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Python \u0648 R \u0629\u063a\u0644\u0628 \u0629\u062c\u0645\u0631\u0628\u0644\u0627 \u0631\u0628\u062a\u0639\u062a \u0629\u0644\u0627\u0639\u0641 \u0644\u0648\u0644\u062d \u062f\u0627\u062c\u064a\u0625 \u064a\u0641 \u062f\u0639\u0627\u0633\u062a\u0648 \u0629\u064a\u062c\u0627\u062a\u0646\u0644\u0625\u0627 \u0632\u0632\u0639\u062a \u0646\u0623 \u0646\u0643\u0645\u064a \u064a\u062a\u0644\u0627 \u0629\u064a\u0648\u0642\u0644\u0627 \u062a\u0627\u0648\u062f\u0644\u0623\u0627 \u0646\u0645 \u0621\u0627\u0645\u0644\u0639\u0644\u0627\u0648 \u0646\u064a\u0644\u0644\u062d\u0645\u0644\u0627 \u0649\u0644\u0639 \u0644\u0647\u0633\u064a \u0627\u0645\u0645 \u060c\u062a\u0627\u0646\u0627\u064a\u0628\u0644\u0627 \u0644\u064a\u0644\u062d\u062a\u0644 \u0629\u064a\u0644\u0627\u062b\u0645 \u0627\u0647\u0644\u0639\u062c\u062a \u0629\u062f\u064a\u0631\u0641 \u062a\u0627\u0632\u064a\u0645Python \u0648 R \u0646\u0645 \u0644\u0643 \u0643\u0644\u062a\u0645\u064a .\u062a\u0644\u0627\u0643\u0634\u0645\u0644\u0644 \u0646\u0627\u0643 \u0627\u0630\u0625 .\u0629\u0644\u0627\u0639\u0641\u0648 \u0629\u0639\u064a\u0631\u0633 \u0629\u0642\u064a\u0631\u0637\u0628 \u0629\u062f\u0642\u0639\u0645 \u062a\u0644\u0627\u064a\u0644\u062d\u062a \u0621\u0627\u0631\u062c\u0625 \u0645\u0647\u0633\u064a \u0646\u0623 \u0646\u0643\u0645\u064a \u062a\u0627\u063a\u0644\u0644\u0627 \u0647\u0630\u0647 \u0645\u0627\u062f\u062e\u062a\u0633\u0627 \u0646\u0625\u0641 \u060c\u0629\u064a\u0644\u064a\u0644\u062d\u062a \u0629\u064a\u0644\u0642\u0639 \u0643\u064a\u062f\u0644 .\u0644\u0645\u0639\u0644\u0627 \u062c\u0626\u0627\u062a\u0646 \u0646\u064a\u0633\u062d\u062a \u064a\u0641 \u0631\u064a\u0628\u0643 \u0644\u0643\u0634\u0628"}, {"label": "text", "id": 1, "page_no": 0, "cluster": {"id": 1, "label": "text", "bbox": {"l": 99.863998, "t": 171.24798999999996, "r": 522.23792, "b": 225.93201, "coord_origin": "TOPLEFT"}, "confidence": 0.9677387475967407, "cells": [{"id": 7, "text": " \u062c\u0627\u0631\u062e\u062a\u0633\u0627\u0648 \u062a\u0627\u0646\u0627\u064a\u0628\u0644\u0627 \u0646\u0645 \u0629\u0644\u0626\u0627\u0647 \u062a\u0627\u064a\u0645\u0643 \u0629\u062c\u0644\u0627\u0639\u0645 \u0646\u0643\u0645\u0645\u0644\u0627 \u0646\u0645 \u062d\u0628\u0635\u064a \u060c\u0629\u062c\u0645\u0631\u0628\u0644\u0627 \u062a\u0627\u0631\u0627\u0647\u0645 \u0639\u0645 \u064a\u0644\u064a\u0644\u062d\u062a\u0644\u0627 \u0631\u064a\u0643\u0641\u062a\u0644\u0627 \u0639\u0645\u062a\u062c\u064a \u0627\u0645\u062f\u0646\u0639", "bbox": {"l": 101.42001, "t": 171.24798999999996, "r": 521.85193, "b": 184.53197999999998, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": " \u0630\u064a\u0641\u0646\u062a\u0644Python \u0648 R \u0645\u0627\u062f\u062e\u062a\u0633\u0627 \u0646\u064a\u062c\u0645\u0631\u0628\u0645\u0644\u0644 \u0646\u0643\u0645\u064a .\u0627\u0647\u0646\u0645 \u062a\u0627\u0647\u062c\u0648\u062a\u0644\u0627\u0648 \u0637\u0627\u0645\u0646\u0644\u0623\u0627", "bbox": {"l": 258.17001, "t": 185.04796999999996, "r": 522.034, "b": 198.33196999999996, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": " \u0629\u062c\u0630\u0645\u0646\u0644\u0627 \u0644\u062b\u0645 \u060c\u0629\u0645\u062f\u0642\u062a\u0645 \u0629\u064a\u0644\u064a\u0644\u062d\u062a \u062a\u0627\u064a\u0644\u0645\u0639", "bbox": {"l": 121.34, "t": 185.04796999999996, "r": 257.99597, "b": 198.33196999999996, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": " \u0629\u0642\u062f \u0631\u062b\u0643\u0623 \u062a\u0627\u0631\u0627\u0631\u0642 \u0630\u0627\u062e\u062a\u0627 \u0649\u0644\u0625 \u0627", "bbox": {"l": 99.863998, "t": 198.84795999999994, "r": 207.49202, "b": 212.13196000000005, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "\u0636\u064a\u0623 \u064a\u062f\u0624\u064a \u0646\u0623 \u0646\u0643\u0645\u064a \u0644\u0628 \u060c\u062a\u0642\u0648\u0644\u0627 \u0631\u0641\u0648\u064a \u0637\u0642\u0641 \u0633\u064a\u0644 \u0627\u0630\u0647 .\u0629\u0631\u064a\u0628\u0643\u0644\u0627 \u062a\u0627\u0646\u0627\u064a\u0628\u0644\u0627 \u0644\u064a\u0644\u062d\u062a\u0648 \u0629\u064a\u0626\u0627\u0635\u062d\u0644\u0625\u0627", "bbox": {"l": 207.50401, "t": 198.84795999999994, "r": 522.10785, "b": 212.13196000000005, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "\u062a\u0627\u0646\u0627\u064a\u0628\u0644\u0627 \u0649\u0644\u0639 \u0629\u0645\u0626\u0627\u0642 \u062a\u0627\u062c\u0627\u062a\u0646\u062a\u0633\u0627 \u0649\u0644\u0639 ", "bbox": {"l": 378.07001, "t": 212.64801, "r": 508.74990999999994, "b": 225.93201, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "\u0621\u0627\u0646\u0628", "bbox": {"l": 508.74990999999994, "t": 212.64801, "r": 522.23792, "b": 225.93201, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": ".", "bbox": {"l": 374.95001, "t": 212.64801, "r": 377.95001, "b": 225.93201, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u062c\u0627\u0631\u062e\u062a\u0633\u0627\u0648 \u062a\u0627\u0646\u0627\u064a\u0628\u0644\u0627 \u0646\u0645 \u0629\u0644\u0626\u0627\u0647 \u062a\u0627\u064a\u0645\u0643 \u0629\u062c\u0644\u0627\u0639\u0645 \u0646\u0643\u0645\u0645\u0644\u0627 \u0646\u0645 \u062d\u0628\u0635\u064a \u060c\u0629\u062c\u0645\u0631\u0628\u0644\u0627 \u062a\u0627\u0631\u0627\u0647\u0645 \u0639\u0645 \u064a\u0644\u064a\u0644\u062d\u062a\u0644\u0627 \u0631\u064a\u0643\u0641\u062a\u0644\u0627 \u0639\u0645\u062a\u062c\u064a \u0627\u0645\u062f\u0646\u0639 \u0630\u064a\u0641\u0646\u062a\u0644Python \u0648 R \u0645\u0627\u062f\u062e\u062a\u0633\u0627 \u0646\u064a\u062c\u0645\u0631\u0628\u0645\u0644\u0644 \u0646\u0643\u0645\u064a .\u0627\u0647\u0646\u0645 \u062a\u0627\u0647\u062c\u0648\u062a\u0644\u0627\u0648 \u0637\u0627\u0645\u0646\u0644\u0623\u0627 \u0629\u062c\u0630\u0645\u0646\u0644\u0627 \u0644\u062b\u0645 \u060c\u0629\u0645\u062f\u0642\u062a\u0645 \u0629\u064a\u0644\u064a\u0644\u062d\u062a \u062a\u0627\u064a\u0644\u0645\u0639 \u0629\u0642\u062f \u0631\u062b\u0643\u0623 \u062a\u0627\u0631\u0627\u0631\u0642 \u0630\u0627\u062e\u062a\u0627 \u0649\u0644\u0625 \u0627 \u0636\u064a\u0623 \u064a\u062f\u0624\u064a \u0646\u0623 \u0646\u0643\u0645\u064a \u0644\u0628 \u060c\u062a\u0642\u0648\u0644\u0627 \u0631\u0641\u0648\u064a \u0637\u0642\u0641 \u0633\u064a\u0644 \u0627\u0630\u0647 .\u0629\u0631\u064a\u0628\u0643\u0644\u0627 \u062a\u0627\u0646\u0627\u064a\u0628\u0644\u0627 \u0644\u064a\u0644\u062d\u062a\u0648 \u0629\u064a\u0626\u0627\u0635\u062d\u0644\u0625\u0627 \u062a\u0627\u0646\u0627\u064a\u0628\u0644\u0627 \u0649\u0644\u0639 \u0629\u0645\u0626\u0627\u0642 \u062a\u0627\u062c\u0627\u062a\u0646\u062a\u0633\u0627 \u0649\u0644\u0639 \u0621\u0627\u0646\u0628 ."}, {"label": "text", "id": 5, "page_no": 0, "cluster": {"id": 5, "label": "text", "bbox": {"l": 208.10402, "t": 199.32794, "r": 208.10402, "b": 212.61194, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 11, "text": "\u064b", "bbox": {"l": 208.10402, "t": 199.32794, "r": 208.10402, "b": 212.61194, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u064b"}, {"label": "text", "id": 6, "page_no": 0, "cluster": {"id": 6, "label": "text", "bbox": {"l": 509.34990999999997, "t": 213.96802000000002, "r": 509.34990999999997, "b": 227.25201000000004, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 14, "text": "\u064b", "bbox": {"l": 509.34990999999997, "t": 213.96802000000002, "r": 509.34990999999997, "b": 227.25201000000004, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u064b"}, {"label": "text", "id": 3, "page_no": 0, "cluster": {"id": 3, "label": "text", "bbox": {"l": 92.903999, "t": 240.36798, "r": 522.10596, "b": 295.08200000000005, "coord_origin": "TOPLEFT"}, "confidence": 0.9547483325004578, "cells": [{"id": 17, "text": " \u0644\u064a\u0644\u062d\u062a\u0644\u0627 \u0646\u0645 \u060c\u062a\u0627\u0642\u064a\u0628\u0637\u062a\u0644\u0627 \u0646\u0645 \u0629\u0639\u0633\u0627\u0648 \u0629\u0639\u0648\u0645\u062c\u0645 \u0645\u0639\u062f\u062a \u0629\u064a\u0646\u063a \u062a\u0627\u0648\u062f\u0623\u0648 \u062a\u0627\u0628\u062a\u0643\u0645Python \u0648 R \u0646\u0645 \u0644\u0643 \u0631\u0641\u0648\u062a \u060c\u0643\u0644\u0630 \u0649\u0644\u0639 \u0629\u0648\u0644\u0627\u0639", "bbox": {"l": 95.783997, "t": 240.36798, "r": 522.07001, "b": 253.65197999999998, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": " \u0649\u0644\u0639 .\u0629\u0641\u0644\u062a\u062e\u0645\u0644\u0627 \u062a\u0644\u0627\u0643\u0634\u0645\u0644\u0644 \u0629\u0631\u0643\u062a\u0628\u0645 \u0644\u0648\u0644\u062d \u0631\u064a\u0648\u0637\u062a\u0644 \u062a\u0627\u0628\u062a\u0643\u0645\u0644\u0627 \u0647\u0630\u0647 \u0646\u0645 \u0629\u062f\u0627\u0641\u062a\u0633\u0644\u0627\u0627 \u0646\u064a\u0645\u062f\u062e\u062a\u0633\u0645\u0644\u0644 \u0646\u0643\u0645\u064a .\u064a\u0644\u0644\u0622\u0627 \u0645\u0644\u0639\u062a\u0644\u0627 \u0649\u0644\u0625 \u064a\u0646\u0627\u064a\u0628\u0644\u0627", "bbox": {"l": 92.903999, "t": 254.19799999999998, "r": 521.80798, "b": 267.48199, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": " R \u0631\u0641\u0648\u062a \u0627\u0645\u0646\u064a\u0628 \u060c\u0629\u0621\u0627\u0641\u0643\u0628 \u062a\u0627\u0646\u0627\u064a\u0628\u0644\u0627 \u0629\u0631\u0627\u062f\u0644\u0625 Python \u064a\u0641 pandas \u0629\u0628\u062a\u0643\u0645 \u0645\u0627\u062f\u062e\u062a\u0633\u0627 \u0646\u0643\u0645\u064a \u060c\u0644\u0627\u062b\u0645\u0644\u0627 \u0644\u064a\u0628\u0633", "bbox": {"l": 174.38, "t": 267.99798999999996, "r": 522.10596, "b": 281.28200999999996, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": " \u0645\u0633\u0631\u0644\u0644 \u0629\u064a\u0648\u0642 \u062a\u0627\u0648\u062f\u0623", "bbox": {"l": 105.38, "t": 267.99798999999996, "r": 174.30797, "b": 281.28200999999996, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": ".\u0646\u064a\u0644\u0644\u062d\u0645\u0644\u0627\u0648 \u0646\u064a\u062b\u062d\u0627\u0628\u0644\u0644 \u0629\u064a\u0644\u0627\u062b\u0645 \u0627\u0647\u0644\u0639\u062c\u064a \u0627\u0645\u0645 \u060c\u064a\u0626\u0627\u0635\u062d\u0644\u0625\u0627 \u0644\u064a\u0644\u062d\u062a\u0644\u0627\u0648 \u064a\u0646\u0627\u064a\u0628\u0644\u0627", "bbox": {"l": 280.37, "t": 281.798, "r": 522.09399, "b": 295.08200000000005, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u0644\u064a\u0644\u062d\u062a\u0644\u0627 \u0646\u0645 \u060c\u062a\u0627\u0642\u064a\u0628\u0637\u062a\u0644\u0627 \u0646\u0645 \u0629\u0639\u0633\u0627\u0648 \u0629\u0639\u0648\u0645\u062c\u0645 \u0645\u0639\u062f\u062a \u0629\u064a\u0646\u063a \u062a\u0627\u0648\u062f\u0623\u0648 \u062a\u0627\u0628\u062a\u0643\u0645Python \u0648 R \u0646\u0645 \u0644\u0643 \u0631\u0641\u0648\u062a \u060c\u0643\u0644\u0630 \u0649\u0644\u0639 \u0629\u0648\u0644\u0627\u0639 \u0649\u0644\u0639 .\u0629\u0641\u0644\u062a\u062e\u0645\u0644\u0627 \u062a\u0644\u0627\u0643\u0634\u0645\u0644\u0644 \u0629\u0631\u0643\u062a\u0628\u0645 \u0644\u0648\u0644\u062d \u0631\u064a\u0648\u0637\u062a\u0644 \u062a\u0627\u0628\u062a\u0643\u0645\u0644\u0627 \u0647\u0630\u0647 \u0646\u0645 \u0629\u062f\u0627\u0641\u062a\u0633\u0644\u0627\u0627 \u0646\u064a\u0645\u062f\u062e\u062a\u0633\u0645\u0644\u0644 \u0646\u0643\u0645\u064a .\u064a\u0644\u0644\u0622\u0627 \u0645\u0644\u0639\u062a\u0644\u0627 \u0649\u0644\u0625 \u064a\u0646\u0627\u064a\u0628\u0644\u0627 R \u0631\u0641\u0648\u062a \u0627\u0645\u0646\u064a\u0628 \u060c\u0629\u0621\u0627\u0641\u0643\u0628 \u062a\u0627\u0646\u0627\u064a\u0628\u0644\u0627 \u0629\u0631\u0627\u062f\u0644\u0625 Python \u064a\u0641 pandas \u0629\u0628\u062a\u0643\u0645 \u0645\u0627\u062f\u062e\u062a\u0633\u0627 \u0646\u0643\u0645\u064a \u060c\u0644\u0627\u062b\u0645\u0644\u0627 \u0644\u064a\u0628\u0633 \u0645\u0633\u0631\u0644\u0644 \u0629\u064a\u0648\u0642 \u062a\u0627\u0648\u062f\u0623 .\u0646\u064a\u0644\u0644\u062d\u0645\u0644\u0627\u0648 \u0646\u064a\u062b\u062d\u0627\u0628\u0644\u0644 \u0629\u064a\u0644\u0627\u062b\u0645 \u0627\u0647\u0644\u0639\u062c\u064a \u0627\u0645\u0645 \u060c\u064a\u0626\u0627\u0635\u062d\u0644\u0625\u0627 \u0644\u064a\u0644\u062d\u062a\u0644\u0627\u0648 \u064a\u0646\u0627\u064a\u0628\u0644\u0627"}, {"label": "text", "id": 2, "page_no": 0, "cluster": {"id": 2, "label": "text", "bbox": {"l": 96.863998, "t": 309.638, "r": 522.07404, "b": 350.522, "coord_origin": "TOPLEFT"}, "confidence": 0.9672117233276367, "cells": [{"id": 22, "text": "Python \u0648 R \u0629\u063a\u0644\u0628 \u0629\u062c\u0645\u0631\u0628\u0644\u0627 \u064a\u062f\u0624\u062a \u0646\u0623 \u0646\u0643\u0645\u064a \u060c\u0629\u064a\u0627\u0647\u0646\u0644\u0627 \u064a\u0641", "bbox": {"l": 319.60999, "t": 309.638, "r": 522.04596, "b": 322.9220000000001, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": " \u0629\u0631\u0643\u062a\u0628\u0645 \u0644\u0648\u0644\u062d \u0631\u064a\u0641\u0648\u062a\u0648 \u0629\u064a\u062c\u0627\u062a\u0646\u0644\u0625\u0627 \u0646\u064a\u0633\u062d\u062a \u0649\u0644\u0625 \u0629\u064a\u0644\u064a\u0644\u062d\u062a \u0629\u064a\u0644\u0642\u0639 \u0639\u0645", "bbox": {"l": 100.34, "t": 309.638, "r": 319.53198, "b": 322.9220000000001, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": " \u0627\u0647\u0644 \u0646\u0648\u0643\u062a \u0646\u0623 \u0646\u0643\u0645\u064a \u0629\u0628\u0633\u0627\u0646\u0645\u0644\u0627 \u0629\u064a\u062c\u0645\u0631\u0628\u0644\u0627 \u0628\u064a\u0644\u0627\u0633\u0644\u0623\u0627 \u0642\u064a\u0628\u0637\u062a\u0648 \u0644\u0627\u0639\u0641 \u0644\u0643\u0634\u0628 \u062a\u0627\u0646\u0627\u064a\u0628\u0644\u0627 \u0644\u064a\u0644\u062d\u062a \u0649\u0644\u0639 \u0629\u0631\u062f\u0642\u0644\u0627 \u0646\u0625 .\u0629\u062f\u0642\u0639\u0645\u0644\u0627 \u062a\u0644\u0627\u0643\u0634\u0645\u0644\u0644", "bbox": {"l": 96.863998, "t": 323.43802, "r": 521.79193, "b": 336.72202, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": ".\u064a\u0646\u0647\u0645\u0644\u0627\u0648 \u064a\u0635\u062e\u0634\u0644\u0627 \u0621\u0627\u062f\u0644\u0623\u0627 \u0649\u0644\u0639 \u0649\u062f\u0645\u0644\u0627 \u0629\u062f\u064a\u0639\u0628 \u0629\u064a\u0628\u0627\u062c\u064a\u0625 \u062a\u0627\u0631\u064a\u062b\u0623\u062a", "bbox": {"l": 304.60999, "t": 337.23801, "r": 522.07404, "b": 350.522, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Python \u0648 R \u0629\u063a\u0644\u0628 \u0629\u062c\u0645\u0631\u0628\u0644\u0627 \u064a\u062f\u0624\u062a \u0646\u0623 \u0646\u0643\u0645\u064a \u060c\u0629\u064a\u0627\u0647\u0646\u0644\u0627 \u064a\u0641 \u0629\u0631\u0643\u062a\u0628\u0645 \u0644\u0648\u0644\u062d \u0631\u064a\u0641\u0648\u062a\u0648 \u0629\u064a\u062c\u0627\u062a\u0646\u0644\u0625\u0627 \u0646\u064a\u0633\u062d\u062a \u0649\u0644\u0625 \u0629\u064a\u0644\u064a\u0644\u062d\u062a \u0629\u064a\u0644\u0642\u0639 \u0639\u0645 \u0627\u0647\u0644 \u0646\u0648\u0643\u062a \u0646\u0623 \u0646\u0643\u0645\u064a \u0629\u0628\u0633\u0627\u0646\u0645\u0644\u0627 \u0629\u064a\u062c\u0645\u0631\u0628\u0644\u0627 \u0628\u064a\u0644\u0627\u0633\u0644\u0623\u0627 \u0642\u064a\u0628\u0637\u062a\u0648 \u0644\u0627\u0639\u0641 \u0644\u0643\u0634\u0628 \u062a\u0627\u0646\u0627\u064a\u0628\u0644\u0627 \u0644\u064a\u0644\u062d\u062a \u0649\u0644\u0639 \u0629\u0631\u062f\u0642\u0644\u0627 \u0646\u0625 .\u0629\u062f\u0642\u0639\u0645\u0644\u0627 \u062a\u0644\u0627\u0643\u0634\u0645\u0644\u0644 .\u064a\u0646\u0647\u0645\u0644\u0627\u0648 \u064a\u0635\u062e\u0634\u0644\u0627 \u0621\u0627\u062f\u0644\u0623\u0627 \u0649\u0644\u0639 \u0649\u062f\u0645\u0644\u0627 \u0629\u062f\u064a\u0639\u0628 \u0629\u064a\u0628\u0627\u062c\u064a\u0625 \u062a\u0627\u0631\u064a\u062b\u0623\u062a"}], "headers": []}}]
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v2/right_to_left_02.doctags.txt b/tests/data/groundtruth/docling_v2/right_to_left_02.doctags.txt
new file mode 100644
index 00000000..a86842db
--- /dev/null
+++ b/tests/data/groundtruth/docling_v2/right_to_left_02.doctags.txt
@@ -0,0 +1,7 @@
+<doctag><text><loc_40><loc_478><loc_49><loc_486>11</text>
+<text><loc_57><loc_125><loc_367><loc_249>،هيلعو ملا ةوا رملا لاول خواهييع ووص عضت ةيرص م لا ةموكح لا نإف ةو اب لأا نم ددي قي حت ىاي لمعلخب خال ةير وام جلا سي ئر د يسلا فياكت ا دو ه :خاسعر ىاي ويولولأا ةومئخق سعر ىا ي يرصملا نخسنلإا ءخهب فام عضو ، تخ ووومن تحدووعم قووي حت ىوو اي لو وم علا ،ليوواعللاو ةحووصلا تحخووجم اووف ةووصخل ىوووواي خوووو حلا ا وووو و ،تخوووو ي خل لا فوووواذع اووووف ةامخوووو و ةمادلووووسمو ةوووويوق وو يلودلاو ةوويمياقلإا تخيدوو حلل ا ءوووض اووف يرووصملا امووو لا نووملأا تاددووحم ،ة وو ام ةووعبخلم رارملووساو ،ةيووسخيسلا ة رخوواملا ر ي وو و لت د ووواو ةاووصاومو تخ ايوووو لاو ةوووفخ لا تخووو ام ريوووولت ، خوووهرلإا ةوووحفخ كمو ر ار لوووسحاو نوووملأا لي هخووو م وووسري ي ووولا وووو حهل ا ىووواي لدووولعملا اهيدووو لا خووولبلاو ،اه،وووولا .اعملجملا ماسلاو ةه،اوملا</text>
+<text><loc_63><loc_258><loc_370><loc_277>رول لا لاول ةيرو ص م لا ةو موكحلا امخونرب دالوسي ،قبس خمل خً فوو 2024( -)2026 اتلآا وحهلا ىاي اهو ،ةسيئر ةيجيتارلسا اد هع ةعبرع قي حت :</text>
+<text><loc_58><loc_301><loc_367><loc_317>نــــــــم ما ةــــــــيا م رـ صم لا يم وقل ا اــــسن ا ءاــــ نب رــــــــــــــــــــصم لا عاـــــصت ا ءاـــــ نب يــــــــــــــــــــــسبا نت قتسظا ق يقحت را ر يــــــــــــــــــــــــساي سلا</text>
+<text><loc_61><loc_344><loc_367><loc_385>خهلوسحخب امخونرب لا ت خفدالوسم ديدحت لت دق هن ع ىلإ رخ لإا ردجت لكواب د روووصم ةو ووي ر تخ فدال ووو س م ىووو اي سيوووئر 2023 ر اوو وو حلا تخووو ساو تخيوووصوتو ، كيال ا تخ اووصيل اه،ووولا امخوونربلاو ،تارا ووو لا ت خ فدا لوو سمو ،اه،ووولا ،ةوو ي ا ةيه، ولا تخ ي جيتا رلسحا فالبمو .</text>
+<picture><loc_375><loc_119><loc_500><loc_386></picture>
+</doctag>
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v2/right_to_left_02.json b/tests/data/groundtruth/docling_v2/right_to_left_02.json
new file mode 100644
index 00000000..a673ddc7
--- /dev/null
+++ b/tests/data/groundtruth/docling_v2/right_to_left_02.json
@@ -0,0 +1 @@
+{"schema_name": "DoclingDocument", "version": "1.1.0", "name": "right_to_left_02", "origin": {"mimetype": "application/pdf", "binary_hash": 6694727290501120405, "filename": "right_to_left_02.pdf", "uri": null}, "furniture": {"self_ref": "#/furniture", "parent": null, "children": [], "content_layer": "furniture", "name": "_root_", "label": "unspecified"}, "body": {"self_ref": "#/body", "parent": null, "children": [{"cref": "#/texts/0"}, {"cref": "#/texts/1"}, {"cref": "#/texts/2"}, {"cref": "#/texts/3"}, {"cref": "#/texts/4"}, {"cref": "#/pictures/0"}], "content_layer": "body", "name": "_root_", "label": "unspecified"}, "groups": [], "texts": [{"self_ref": "#/texts/0", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 47.9520001778084, "t": 37.827721130754185, "r": 58.751999217855335, "b": 23.787720082223927, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 2]}], "orig": "11", "text": "11"}, {"self_ref": "#/texts/1", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 67.9919972521177, "t": 632.2632421854628, "r": 437.42722162200187, "b": 422.5932914607237, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 745]}], "orig": "\u060c\u0647\u064a\u0644\u0639\u0648 \u0645\u0644\u0627 \u0629\u0648\u0627 \u0631\u0645\u0644\u0627 \u0644\u0627\u0648\u0644 \u062e\u0648\u0627\u0647\u064a\u064a\u0639 \u0648\u0648\u0635 \u0639\u0636\u062a \u0629\u064a\u0631\u0635 \u0645 \u0644\u0627 \u0629\u0645\u0648\u0643\u062d \u0644\u0627 \u0646\u0625\u0641 \u0629\u0648 \u0627\u0628 \u0644\u0623\u0627 \u0646\u0645 \u062f\u062f\u064a \u0642\u064a \u062d\u062a \u0649\u0627\u064a \u0644\u0645\u0639\u0644\u062e\u0628 \u062e\u0627\u0644 \u0629\u064a\u0631 \u0648\u0627\u0645 \u062c\u0644\u0627 \u0633\u064a \u0626\u0631 \u062f \u064a\u0633\u0644\u0627 \u0641\u064a\u0627\u0643\u062a \u0627 \u062f\u0648 \u0647 :\u062e\u0627\u0633\u0639\u0631 \u0649\u0627\u064a \u0648\u064a\u0648\u0644\u0648\u0644\u0623\u0627 \u0629\u0648\u0645\u0626\u062e\u0642 \u0633\u0639\u0631 \u0649\u0627 \u064a \u064a\u0631\u0635\u0645\u0644\u0627 \u0646\u062e\u0633\u0646\u0644\u0625\u0627 \u0621\u062e\u0647\u0628 \u0641\u0627\u0645 \u0639\u0636\u0648 \u060c \u062a\u062e \u0648\u0648\u0648\u0645\u0646 \u062a\u062d\u062f\u0648\u0648\u0639\u0645 \u0642\u0648\u0648\u064a \u062d\u062a \u0649\u0648\u0648 \u0627\u064a \u0644\u0648 \u0648\u0645 \u0639\u0644\u0627 \u060c\u0644\u064a\u0648\u0648\u0627\u0639\u0644\u0644\u0627\u0648 \u0629\u062d\u0648\u0648\u0635\u0644\u0627 \u062a\u062d\u062e\u0648\u0648\u062c\u0645 \u0627\u0648\u0648\u0641 \u0629\u0648\u0648\u0635\u062e\u0644 \u0649\u0648\u0648\u0648\u0648\u0627\u064a \u062e\u0648\u0648\u0648\u0648 \u062d\u0644\u0627 \u0627 \u0648\u0648\u0648\u0648 \u0648 \u060c\u062a\u062e\u0648\u0648\u0648\u0648 \u064a \u062e\u0644 \u0644\u0627 \u0641\u0648\u0648\u0648\u0648\u0627\u0630\u0639 \u0627\u0648\u0648\u0648\u0648\u0641 \u0629\u0627\u0645\u062e\u0648\u0648\u0648\u0648 \u0648 \u0629\u0645\u0627\u062f\u0644\u0648\u0648\u0648\u0648\u0633\u0645\u0648 \u0629\u0648\u0648\u0648\u0648\u064a\u0648\u0642 \u0648\u0648 \u064a\u0644\u0648\u062f\u0644\u0627\u0648 \u0629\u0648\u0648\u064a\u0645\u064a\u0627\u0642\u0644\u0625\u0627 \u062a\u062e\u064a\u062f\u0648\u0648 \u062d\u0644\u0644 \u0627 \u0621\u0648\u0648\u0648\u0636 \u0627\u0648\u0648\u0641 \u064a\u0631\u0648\u0648\u0635\u0645\u0644\u0627 \u0627\u0645\u0648\u0648\u0648 \u0644\u0627 \u0646\u0648\u0648\u0645\u0644\u0623\u0627 \u062a\u0627\u062f\u062f\u0648\u0648\u062d\u0645 \u060c\u0629 \u0648\u0648 \u0627\u0645 \u0629\u0648\u0648\u0639\u0628\u062e\u0644\u0645 \u0631\u0627\u0631\u0645\u0644\u0648\u0648\u0633\u0627\u0648 \u060c\u0629\u064a\u0648\u0648\u0633\u062e\u064a\u0633\u0644\u0627 \u0629 \u0631\u062e\u0648\u0648\u0627\u0645\u0644\u0627 \u0631 \u064a \u0648\u0648 \u0648 \u0644\u062a \u062f \u0648\u0648\u0648\u0627\u0648 \u0629\u0627\u0648\u0648\u0635\u0627\u0648\u0645\u0648 \u062a\u062e \u0627\u064a\u0648\u0648\u0648\u0648 \u0644\u0627\u0648 \u0629\u0648\u0648\u0648\u0641\u062e \u0644\u0627 \u062a\u062e\u0648\u0648\u0648 \u0627\u0645 \u0631\u064a\u0648\u0648\u0648\u0648\u0644\u062a \u060c \u062e\u0648\u0648\u0648\u0647\u0631\u0644\u0625\u0627 \u0629\u0648\u0648\u0648\u062d\u0641\u062e \u0643\u0645\u0648 \u0631 \u0627\u0631 \u0644\u0648\u0648\u0648\u0633\u062d\u0627\u0648 \u0646\u0648\u0648\u0648\u0645\u0644\u0623\u0627 \u0644\u064a \u0647\u062e\u0648\u0648\u0648 \u0645 \u0648\u0648\u0648\u0633\u0631\u064a \u064a \u0648\u0648\u0648\u0644\u0627 \u0648\u0648\u0648\u0648 \u062d\u0647\u0644 \u0627 \u0649\u0648\u0648\u0648\u0627\u064a \u0644\u062f\u0648\u0648\u0648\u0644\u0639\u0645\u0644\u0627 \u0627\u0647\u064a\u062f\u0648\u0648\u0648 \u0644\u0627 \u062e\u0648\u0648\u0648\u0644\u0628\u0644\u0627\u0648 \u060c\u0627\u0647\u060c\u0648\u0648\u0648\u0648\u0644\u0627 .\u0627\u0639\u0645\u0644\u062c\u0645\u0644\u0627 \u0645\u0627\u0633\u0644\u0627\u0648 \u0629\u0647\u060c\u0627\u0648\u0645\u0644\u0627", "text": "\u060c\u0647\u064a\u0644\u0639\u0648 \u0645\u0644\u0627 \u0629\u0648\u0627 \u0631\u0645\u0644\u0627 \u0644\u0627\u0648\u0644 \u062e\u0648\u0627\u0647\u064a\u064a\u0639 \u0648\u0648\u0635 \u0639\u0636\u062a \u0629\u064a\u0631\u0635 \u0645 \u0644\u0627 \u0629\u0645\u0648\u0643\u062d \u0644\u0627 \u0646\u0625\u0641 \u0629\u0648 \u0627\u0628 \u0644\u0623\u0627 \u0646\u0645 \u062f\u062f\u064a \u0642\u064a \u062d\u062a \u0649\u0627\u064a \u0644\u0645\u0639\u0644\u062e\u0628 \u062e\u0627\u0644 \u0629\u064a\u0631 \u0648\u0627\u0645 \u062c\u0644\u0627 \u0633\u064a \u0626\u0631 \u062f \u064a\u0633\u0644\u0627 \u0641\u064a\u0627\u0643\u062a \u0627 \u062f\u0648 \u0647 :\u062e\u0627\u0633\u0639\u0631 \u0649\u0627\u064a \u0648\u064a\u0648\u0644\u0648\u0644\u0623\u0627 \u0629\u0648\u0645\u0626\u062e\u0642 \u0633\u0639\u0631 \u0649\u0627 \u064a \u064a\u0631\u0635\u0645\u0644\u0627 \u0646\u062e\u0633\u0646\u0644\u0625\u0627 \u0621\u062e\u0647\u0628 \u0641\u0627\u0645 \u0639\u0636\u0648 \u060c \u062a\u062e \u0648\u0648\u0648\u0645\u0646 \u062a\u062d\u062f\u0648\u0648\u0639\u0645 \u0642\u0648\u0648\u064a \u062d\u062a \u0649\u0648\u0648 \u0627\u064a \u0644\u0648 \u0648\u0645 \u0639\u0644\u0627 \u060c\u0644\u064a\u0648\u0648\u0627\u0639\u0644\u0644\u0627\u0648 \u0629\u062d\u0648\u0648\u0635\u0644\u0627 \u062a\u062d\u062e\u0648\u0648\u062c\u0645 \u0627\u0648\u0648\u0641 \u0629\u0648\u0648\u0635\u062e\u0644 \u0649\u0648\u0648\u0648\u0648\u0627\u064a \u062e\u0648\u0648\u0648\u0648 \u062d\u0644\u0627 \u0627 \u0648\u0648\u0648\u0648 \u0648 \u060c\u062a\u062e\u0648\u0648\u0648\u0648 \u064a \u062e\u0644 \u0644\u0627 \u0641\u0648\u0648\u0648\u0648\u0627\u0630\u0639 \u0627\u0648\u0648\u0648\u0648\u0641 \u0629\u0627\u0645\u062e\u0648\u0648\u0648\u0648 \u0648 \u0629\u0645\u0627\u062f\u0644\u0648\u0648\u0648\u0648\u0633\u0645\u0648 \u0629\u0648\u0648\u0648\u0648\u064a\u0648\u0642 \u0648\u0648 \u064a\u0644\u0648\u062f\u0644\u0627\u0648 \u0629\u0648\u0648\u064a\u0645\u064a\u0627\u0642\u0644\u0625\u0627 \u062a\u062e\u064a\u062f\u0648\u0648 \u062d\u0644\u0644 \u0627 \u0621\u0648\u0648\u0648\u0636 \u0627\u0648\u0648\u0641 \u064a\u0631\u0648\u0648\u0635\u0645\u0644\u0627 \u0627\u0645\u0648\u0648\u0648 \u0644\u0627 \u0646\u0648\u0648\u0645\u0644\u0623\u0627 \u062a\u0627\u062f\u062f\u0648\u0648\u062d\u0645 \u060c\u0629 \u0648\u0648 \u0627\u0645 \u0629\u0648\u0648\u0639\u0628\u062e\u0644\u0645 \u0631\u0627\u0631\u0645\u0644\u0648\u0648\u0633\u0627\u0648 \u060c\u0629\u064a\u0648\u0648\u0633\u062e\u064a\u0633\u0644\u0627 \u0629 \u0631\u062e\u0648\u0648\u0627\u0645\u0644\u0627 \u0631 \u064a \u0648\u0648 \u0648 \u0644\u062a \u062f \u0648\u0648\u0648\u0627\u0648 \u0629\u0627\u0648\u0648\u0635\u0627\u0648\u0645\u0648 \u062a\u062e \u0627\u064a\u0648\u0648\u0648\u0648 \u0644\u0627\u0648 \u0629\u0648\u0648\u0648\u0641\u062e \u0644\u0627 \u062a\u062e\u0648\u0648\u0648 \u0627\u0645 \u0631\u064a\u0648\u0648\u0648\u0648\u0644\u062a \u060c \u062e\u0648\u0648\u0648\u0647\u0631\u0644\u0625\u0627 \u0629\u0648\u0648\u0648\u062d\u0641\u062e \u0643\u0645\u0648 \u0631 \u0627\u0631 \u0644\u0648\u0648\u0648\u0633\u062d\u0627\u0648 \u0646\u0648\u0648\u0648\u0645\u0644\u0623\u0627 \u0644\u064a \u0647\u062e\u0648\u0648\u0648 \u0645 \u0648\u0648\u0648\u0633\u0631\u064a \u064a \u0648\u0648\u0648\u0644\u0627 \u0648\u0648\u0648\u0648 \u062d\u0647\u0644 \u0627 \u0649\u0648\u0648\u0648\u0627\u064a \u0644\u062f\u0648\u0648\u0648\u0644\u0639\u0645\u0644\u0627 \u0627\u0647\u064a\u062f\u0648\u0648\u0648 \u0644\u0627 \u062e\u0648\u0648\u0648\u0644\u0628\u0644\u0627\u0648 \u060c\u0627\u0647\u060c\u0648\u0648\u0648\u0648\u0644\u0627 .\u0627\u0639\u0645\u0644\u062c\u0645\u0644\u0627 \u0645\u0627\u0633\u0644\u0627\u0648 \u0629\u0647\u060c\u0627\u0648\u0645\u0644\u0627"}, {"self_ref": "#/texts/2", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 74.51999727632386, "t": 408.00330141029247, "r": 440.883241634817, "b": 376.3233013007883, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 135]}], "orig": "\u0631\u0648\u0644 \u0644\u0627 \u0644\u0627\u0648\u0644 \u0629\u064a\u0631\u0648 \u0635 \u0645 \u0644\u0627 \u0629\u0648 \u0645\u0648\u0643\u062d\u0644\u0627 \u0627\u0645\u062e\u0648\u0646\u0631\u0628 \u062f\u0627\u0644\u0648\u0633\u064a \u060c\u0642\u0628\u0633 \u062e\u0645\u0644 \u062e\u064b \u0641\u0648\u0648 2024( -)2026 \u0627\u062a\u0644\u0622\u0627 \u0648\u062d\u0647\u0644\u0627 \u0649\u0627\u064a \u0627\u0647\u0648 \u060c\u0629\u0633\u064a\u0626\u0631 \u0629\u064a\u062c\u064a\u062a\u0627\u0631\u0644\u0633\u0627 \u0627\u062f \u0647\u0639 \u0629\u0639\u0628\u0631\u0639 \u0642\u064a \u062d\u062a :", "text": "\u0631\u0648\u0644 \u0644\u0627 \u0644\u0627\u0648\u0644 \u0629\u064a\u0631\u0648 \u0635 \u0645 \u0644\u0627 \u0629\u0648 \u0645\u0648\u0643\u062d\u0644\u0627 \u0627\u0645\u062e\u0648\u0646\u0631\u0628 \u062f\u0627\u0644\u0648\u0633\u064a \u060c\u0642\u0628\u0633 \u062e\u0645\u0644 \u062e\u064b \u0641\u0648\u0648 2024( -)2026 \u0627\u062a\u0644\u0622\u0627 \u0648\u062d\u0647\u0644\u0627 \u0649\u0627\u064a \u0627\u0647\u0648 \u060c\u0629\u0633\u064a\u0626\u0631 \u0629\u064a\u062c\u064a\u062a\u0627\u0631\u0644\u0633\u0627 \u0627\u062f \u0647\u0639 \u0629\u0639\u0628\u0631\u0639 \u0642\u064a \u062d\u062a :"}, {"self_ref": "#/texts/3", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 69.09600125621141, "t": 334.49329115619986, "r": 437.3132016215791, "b": 307.8032810639438, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 196]}], "orig": "\u0646\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0645 \u0645\u0627 \u0629\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u064a\u0627 \u0645 \u0631\u0640 \u0635\u0645 \u0644\u0627 \u064a\u0645 \u0648\u0642\u0644 \u0627 \u0627\u0640\u0640\u0640\u0640\u0633\u0646 \u0627 \u0621\u0627\u0640\u0640\u0640\u0640 \u0646\u0628 \u0631\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0635\u0645 \u0644\u0627 \u0639\u0627\u0640\u0640\u0640\u0640\u0640\u0635\u062a \u0627 \u0621\u0627\u0640\u0640\u0640\u0640\u0640 \u0646\u0628 \u064a\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0633\u0628\u0627 \u0646\u062a \u0642\u062a\u0633\u0638\u0627 \u0642 \u064a\u0642\u062d\u062a \u0631\u0627 \u0631 \u064a\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0633\u0627\u064a \u0633\u0644\u0627", "text": "\u0646\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0645 \u0645\u0627 \u0629\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u064a\u0627 \u0645 \u0631\u0640 \u0635\u0645 \u0644\u0627 \u064a\u0645 \u0648\u0642\u0644 \u0627 \u0627\u0640\u0640\u0640\u0640\u0633\u0646 \u0627 \u0621\u0627\u0640\u0640\u0640\u0640 \u0646\u0628 \u0631\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0635\u0645 \u0644\u0627 \u0639\u0627\u0640\u0640\u0640\u0640\u0640\u0635\u062a \u0627 \u0621\u0627\u0640\u0640\u0640\u0640\u0640 \u0646\u0628 \u064a\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0633\u0628\u0627 \u0646\u062a \u0642\u062a\u0633\u0638\u0627 \u0642 \u064a\u0642\u062d\u062a \u0631\u0627 \u0631 \u064a\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0633\u0627\u064a \u0633\u0644\u0627"}, {"self_ref": "#/texts/4", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 72.94919627049924, "t": 263.09326090940056, "r": 437.29059162149525, "b": 193.95328067041328, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 280]}], "orig": "\u062e\u0647\u0644\u0648\u0633\u062d\u062e\u0628 \u0627\u0645\u062e\u0648\u0646\u0631\u0628 \u0644\u0627 \u062a \u062e\u0641\u062f\u0627\u0644\u0648\u0633\u0645 \u062f\u064a\u062f\u062d\u062a \u0644\u062a \u062f\u0642 \u0647\u0646 \u0639 \u0649\u0644\u0625 \u0631\u062e \u0644\u0625\u0627 \u0631\u062f\u062c\u062a \u0644\u0643\u0648\u0627\u0628 \u062f \u0631\u0648\u0648\u0648\u0635\u0645 \u0629\u0648 \u0648\u0648\u064a \u0631 \u062a\u062e \u0641\u062f\u0627\u0644 \u0648\u0648\u0648 \u0633 \u0645 \u0649\u0648\u0648\u0648 \u0627\u064a \u0633\u064a\u0648\u0648\u0648\u0626\u0631 2023 \u0631 \u0627\u0648\u0648 \u0648\u0648 \u062d\u0644\u0627 \u062a\u062e\u0648\u0648\u0648 \u0633\u0627\u0648 \u062a\u062e\u064a\u0648\u0648\u0648\u0635\u0648\u062a\u0648 \u060c \u0643\u064a\u0627\u0644 \u0627 \u062a\u062e \u0627\u0648\u0648\u0635\u064a\u0644 \u0627\u0647\u060c\u0648\u0648\u0648\u0644\u0627 \u0627\u0645\u062e\u0648\u0648\u0646\u0631\u0628\u0644\u0627\u0648 \u060c\u062a\u0627\u0631\u0627 \u0648\u0648\u0648 \u0644\u0627 \u062a \u062e \u0641\u062f\u0627 \u0644\u0648\u0648 \u0633\u0645\u0648 \u060c\u0627\u0647\u060c\u0648\u0648\u0648\u0644\u0627 \u060c\u0629\u0648\u0648 \u064a \u0627 \u0629\u064a\u0647\u060c \u0648\u0644\u0627 \u062a\u062e \u064a \u062c\u064a\u062a\u0627 \u0631\u0644\u0633\u062d\u0627 \u0641\u0627\u0644\u0628\u0645\u0648 .", "text": "\u062e\u0647\u0644\u0648\u0633\u062d\u062e\u0628 \u0627\u0645\u062e\u0648\u0646\u0631\u0628 \u0644\u0627 \u062a \u062e\u0641\u062f\u0627\u0644\u0648\u0633\u0645 \u062f\u064a\u062f\u062d\u062a \u0644\u062a \u062f\u0642 \u0647\u0646 \u0639 \u0649\u0644\u0625 \u0631\u062e \u0644\u0625\u0627 \u0631\u062f\u062c\u062a \u0644\u0643\u0648\u0627\u0628 \u062f \u0631\u0648\u0648\u0648\u0635\u0645 \u0629\u0648 \u0648\u0648\u064a \u0631 \u062a\u062e \u0641\u062f\u0627\u0644 \u0648\u0648\u0648 \u0633 \u0645 \u0649\u0648\u0648\u0648 \u0627\u064a \u0633\u064a\u0648\u0648\u0648\u0626\u0631 2023 \u0631 \u0627\u0648\u0648 \u0648\u0648 \u062d\u0644\u0627 \u062a\u062e\u0648\u0648\u0648 \u0633\u0627\u0648 \u062a\u062e\u064a\u0648\u0648\u0648\u0635\u0648\u062a\u0648 \u060c \u0643\u064a\u0627\u0644 \u0627 \u062a\u062e \u0627\u0648\u0648\u0635\u064a\u0644 \u0627\u0647\u060c\u0648\u0648\u0648\u0644\u0627 \u0627\u0645\u062e\u0648\u0648\u0646\u0631\u0628\u0644\u0627\u0648 \u060c\u062a\u0627\u0631\u0627 \u0648\u0648\u0648 \u0644\u0627 \u062a \u062e \u0641\u062f\u0627 \u0644\u0648\u0648 \u0633\u0645\u0648 \u060c\u0627\u0647\u060c\u0648\u0648\u0648\u0644\u0627 \u060c\u0629\u0648\u0648 \u064a \u0627 \u0629\u064a\u0647\u060c \u0648\u0644\u0627 \u062a\u062e \u064a \u062c\u064a\u062a\u0627 \u0631\u0644\u0633\u062d\u0627 \u0641\u0627\u0644\u0628\u0645\u0648 ."}], "pictures": [{"self_ref": "#/pictures/0", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "picture", "prov": [{"page_no": 1, "bbox": {"l": 446.4657287597656, "t": 641.2087554931641, "r": 595.0, "b": 191.27679443359375, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "annotations": []}], "tables": [], "key_value_items": [], "form_items": [], "pages": {"1": {"size": {"width": 595.2000122070312, "height": 841.9199829101562}, "image": null, "page_no": 1}}}
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v2/right_to_left_02.md b/tests/data/groundtruth/docling_v2/right_to_left_02.md
new file mode 100644
index 00000000..218e62be
--- /dev/null
+++ b/tests/data/groundtruth/docling_v2/right_to_left_02.md
@@ -0,0 +1,11 @@
+11
+
+،هيلعو ملا ةوا رملا لاول خواهييع ووص عضت ةيرص م لا ةموكح لا نإف ةو اب لأا نم ددي قي حت ىاي لمعلخب خال ةير وام جلا سي ئر د يسلا فياكت ا دو ه :خاسعر ىاي ويولولأا ةومئخق سعر ىا ي يرصملا نخسنلإا ءخهب فام عضو ، تخ ووومن تحدووعم قووي حت ىوو اي لو وم علا ،ليوواعللاو ةحووصلا تحخووجم اووف ةووصخل ىوووواي خوووو حلا ا وووو و ،تخوووو ي خل لا فوووواذع اووووف ةامخوووو و ةمادلووووسمو ةوووويوق وو يلودلاو ةوويمياقلإا تخيدوو حلل ا ءوووض اووف يرووصملا امووو لا نووملأا تاددووحم ،ة وو ام ةووعبخلم رارملووساو ،ةيووسخيسلا ة رخوواملا ر ي وو و لت د ووواو ةاووصاومو تخ ايوووو لاو ةوووفخ لا تخووو ام ريوووولت ، خوووهرلإا ةوووحفخ كمو ر ار لوووسحاو نوووملأا لي هخووو م وووسري ي ووولا وووو حهل ا ىووواي لدووولعملا اهيدووو لا خووولبلاو ،اه،وووولا .اعملجملا ماسلاو ةه،اوملا
+
+رول لا لاول ةيرو ص م لا ةو موكحلا امخونرب دالوسي ،قبس خمل خً فوو 2024( -)2026 اتلآا وحهلا ىاي اهو ،ةسيئر ةيجيتارلسا اد هع ةعبرع قي حت :
+
+نــــــــم ما ةــــــــيا م رـ صم لا يم وقل ا اــــسن ا ءاــــ نب رــــــــــــــــــــصم لا عاـــــصت ا ءاـــــ نب يــــــــــــــــــــــسبا نت قتسظا ق يقحت را ر يــــــــــــــــــــــــساي سلا
+
+خهلوسحخب امخونرب لا ت خفدالوسم ديدحت لت دق هن ع ىلإ رخ لإا ردجت لكواب د روووصم ةو ووي ر تخ فدال ووو س م ىووو اي سيوووئر 2023 ر اوو وو حلا تخووو ساو تخيوووصوتو ، كيال ا تخ اووصيل اه،ووولا امخوونربلاو ،تارا ووو لا ت خ فدا لوو سمو ،اه،ووولا ،ةوو ي ا ةيه، ولا تخ ي جيتا رلسحا فالبمو .
+
+<!-- image -->
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v2/right_to_left_02.pages.json b/tests/data/groundtruth/docling_v2/right_to_left_02.pages.json
new file mode 100644
index 00000000..083451d4
--- /dev/null
+++ b/tests/data/groundtruth/docling_v2/right_to_left_02.pages.json
@@ -0,0 +1 @@
+[{"page_no": 0, "size": {"width": 595.2000122070312, "height": 841.9199829101562}, "cells": [{"id": 0, "text": "11", "bbox": {"l": 47.9520001778084, "t": 804.0922617794021, "r": 58.751999217855335, "b": 818.1322628279323, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": " \u060c\u0647\u064a\u0644\u0639\u0648", "bbox": {"l": 399.260011480476, "t": 209.65674072469346, "r": 437.42722162200187, "b": 222.61670076949054, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "\u0645\u0644\u0627 \u0629\u0648\u0627", "bbox": {"l": 101.00520037453231, "t": 209.65674072469346, "r": 126.82584047027652, "b": 222.61670076949054, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "\u0631\u0645\u0644\u0627 \u0644\u0627\u0648\u0644 \u062e\u0648\u0627\u0647\u064a\u064a\u0639", "bbox": {"l": 130.05289048224256, "t": 209.65674072469346, "r": 229.27513085016358, "b": 222.61670076949054, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "\u0648\u0648\u0635", "bbox": {"l": 240.66298089239032, "t": 209.65674072469346, "r": 258.55817095874653, "b": 222.61670076949054, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "\u0639\u0636\u062a", "bbox": {"l": 265.06552098287614, "t": 209.65674072469346, "r": 281.6825010444927, "b": 222.61670076949054, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "\u0629\u064a\u0631\u0635", "bbox": {"l": 286.3310210617297, "t": 209.65674072469346, "r": 314.70044116692486, "b": 222.61670076949054, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "\u0645", "bbox": {"l": 314.739321167069, "t": 209.65674072469346, "r": 323.0726011979693, "b": 222.61670076949054, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "\u0644\u0627", "bbox": {"l": 323.02075119777703, "t": 209.65674072469346, "r": 330.06061122388115, "b": 222.61670076949054, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "\u0629\u0645\u0648\u0643\u062d", "bbox": {"l": 333.2073112355493, "t": 209.65674072469346, "r": 369.27499136929003, "b": 222.61670076949054, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "\u0644\u0627 ", "bbox": {"l": 369.3138713694342, "t": 209.65674072469346, "r": 379.37082140672584, "b": 222.61670076949054, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "\u0646\u0625\u0641", "bbox": {"l": 379.50043140720646, "t": 209.65674072469346, "r": 398.9274614792428, "b": 222.61670076949054, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "\u0629\u0648", "bbox": {"l": 78.1863332899188, "t": 209.65674072469346, "r": 79.31903829411894, "b": 222.61670076949054, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "\u0627\u0628", "bbox": {"l": 79.3838352943592, "t": 209.65674072469346, "r": 88.079994326605, "b": 222.61670076949054, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "\u0644\u0623\u0627", "bbox": {"l": 102.7000003808167, "t": 231.61676080059988, "r": 113.81968042204905, "b": 244.57672084539684, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "\u0646\u0645 \u062f\u062f\u064a \u0642\u064a \u062d\u062a \u0649\u0627\u064a \u0644\u0645\u0639\u0644\u062e\u0628 \u062e\u0627\u0644 \u0629\u064a\u0631", "bbox": {"l": 117.07263043411113, "t": 231.61676080059988, "r": 294.7153310928191, "b": 244.57672084539684, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "\u0648\u0627\u0645", "bbox": {"l": 294.75421109296326, "t": 231.61676080059988, "r": 318.5617411812428, "b": 244.57672084539684, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "\u062c\u0644\u0627", "bbox": {"l": 318.5098911810505, "t": 231.61676080059988, "r": 333.0000912347809, "b": 244.57672084539684, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "\u0633\u064a", "bbox": {"l": 337.2111512503957, "t": 231.61676080059988, "r": 359.59308133338897, "b": 244.57672084539684, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "\u0626\u0631 ", "bbox": {"l": 359.5282913331488, "t": 231.61676080059988, "r": 370.3110413731318, "b": 244.57672084539684, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "\u062f", "bbox": {"l": 370.5443113739967, "t": 231.61676080059988, "r": 377.2187213987458, "b": 244.57672084539684, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "\u064a\u0633\u0644\u0627 \u0641\u064a\u0627\u0643\u062a", "bbox": {"l": 377.25760139888996, "t": 231.61676080059988, "r": 437.04208162057375, "b": 244.57672084539684, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "\u0627", "bbox": {"l": 83.34959430906444, "t": 231.61676080059988, "r": 86.42111232045377, "b": 244.57672084539684, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "\u062f\u0648", "bbox": {"l": 86.48590932069406, "t": 231.61676080059988, "r": 94.70254535116175, "b": 244.57672084539684, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "\u0647", "bbox": {"l": 94.74142535130592, "t": 231.61676080059988, "r": 102.67294038071637, "b": 244.57672084539684, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": " :\u062e\u0627\u0633\u0639\u0631 \u0649\u0627\u064a", "bbox": {"l": 375.9800113941526, "t": 253.45672087609114, "r": 437.31921162160137, "b": 266.4166809208882, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "\u0648\u064a\u0648\u0644\u0648\u0644\u0623\u0627 \u0629\u0648\u0645\u0626\u062e\u0642 \u0633\u0639\u0631 \u0649\u0627", "bbox": {"l": 89.13600233052074, "t": 253.45672087609114, "r": 199.6070607401529, "b": 266.4166809208882, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "\u064a", "bbox": {"l": 199.56818074000876, "t": 253.45672087609114, "r": 206.72209076653579, "b": 266.4166809208882, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "\u064a\u0631\u0635\u0645\u0644\u0627 \u0646\u062e\u0633\u0646\u0644\u0625\u0627 \u0621\u062e\u0647\u0628 ", "bbox": {"l": 222.04082082333838, "t": 253.45672087609114, "r": 321.0293311903927, "b": 266.4166809208882, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "\u0641\u0627\u0645", "bbox": {"l": 321.1459711908252, "t": 253.45672087609114, "r": 342.4485212698161, "b": 266.4166809208882, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "\u0639\u0636\u0648", "bbox": {"l": 348.3749412917916, "t": 253.45672087609114, "r": 375.73349139323847, "b": 266.4166809208882, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "\u060c", "bbox": {"l": 72.94919627049924, "t": 253.45672087609114, "r": 73.94063627417555, "b": 266.4166809208882, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "\u062a\u062e", "bbox": {"l": 73.97951527431972, "t": 253.45672087609114, "r": 89.02607733011313, "b": 266.4166809208882, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": " \u0648\u0648\u0648\u0645\u0646 \u062a\u062d\u062f\u0648\u0648\u0639\u0645 \u0642\u0648\u0648\u064a \u062d\u062a", "bbox": {"l": 67.9919972521177, "t": 275.2967509515828, "r": 179.1887806644409, "b": 288.25671099637975, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "\u0649\u0648\u0648", "bbox": {"l": 190.77632070740808, "t": 275.2967509515828, "r": 192.97821071557277, "b": 288.25671099637975, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "\u0627\u064a", "bbox": {"l": 193.01709071571696, "t": 275.2967509515828, "r": 203.23216075359494, "b": 288.25671099637975, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "\u0644\u0648", "bbox": {"l": 207.64893076997257, "t": 275.2967509515828, "r": 218.53532081033984, "b": 288.25671099637975, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "\u0648\u0645", "bbox": {"l": 217.84845080779291, "t": 275.2967509515828, "r": 227.72397084441184, "b": 288.25671099637975, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "\u0639\u0644\u0627", "bbox": {"l": 227.6721308442196, "t": 275.2967509515828, "r": 241.0490108938217, "b": 288.25671099637975, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "\u060c\u0644\u064a\u0648\u0648\u0627\u0639\u0644\u0644\u0627\u0648 \u0629\u062d\u0648\u0648\u0635\u0644\u0627 \u062a\u062d\u062e\u0648\u0648\u062c\u0645 \u0627\u0648\u0648\u0641 \u0629\u0648\u0648\u0635\u062e\u0644", "bbox": {"l": 233.752530866766, "t": 275.2967509515828, "r": 437.0279516205213, "b": 288.25671099637975, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": " \u0649\u0648\u0648\u0648\u0648\u0627\u064a", "bbox": {"l": 67.9919972521177, "t": 297.16675102717795, "r": 96.06932135622982, "b": 310.126711071975, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "\u062e\u0648\u0648\u0648\u0648 \u062d\u0644\u0627 \u0627 \u0648\u0648\u0648\u0648", "bbox": {"l": 103.08865038225784, "t": 297.16675102717795, "r": 159.24330059048208, "b": 310.126711071975, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "\u0648 \u060c\u062a\u062e\u0648\u0648\u0648\u0648", "bbox": {"l": 187.1299706938872, "t": 297.16675102717795, "r": 197.68263073301702, "b": 310.126711071975, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "\u064a", "bbox": {"l": 197.72151073316118, "t": 297.16675102717795, "r": 204.87543075968827, "b": 310.126711071975, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "\u062e\u0644", "bbox": {"l": 204.91431075983246, "t": 297.16675102717795, "r": 214.81445079654264, "b": 310.126711071975, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "\u0644\u0627", "bbox": {"l": 239.12222088667707, "t": 297.16675102717795, "r": 244.1863409054551, "b": 310.126711071975, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "\u0641\u0648\u0648\u0648\u0648\u0627\u0630\u0639 \u0627\u0648\u0648\u0648\u0648\u0641 \u0629\u0627\u0645\u062e\u0648\u0648\u0648\u0648 \u0648 \u0629\u0645\u0627\u062f\u0644\u0648\u0648\u0648\u0648\u0633\u0645\u0648 \u0629\u0648\u0648\u0648\u0648\u064a\u0648\u0642", "bbox": {"l": 242.73946090009002, "t": 297.16675102717795, "r": 436.91122162008855, "b": 310.126711071975, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "\u0648\u0648", "bbox": {"l": 80.7360002993731, "t": 319.0067111026693, "r": 82.4855963058607, "b": 331.9666711474664, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "\u064a\u0644\u0648\u062f\u0644\u0627\u0648 \u0629\u0648\u0648\u064a\u0645\u064a\u0627\u0642\u0644\u0625\u0627 \u062a\u062e\u064a\u062f\u0648\u0648", "bbox": {"l": 82.52447530600485, "t": 319.0067111026693, "r": 198.30913073534012, "b": 331.9666711474664, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "\u062d\u0644\u0644", "bbox": {"l": 198.34801073548428, "t": 319.0067111026693, "r": 214.84608079665995, "b": 331.9666711474664, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "\u0627 \u0621\u0648\u0648\u0648\u0636 \u0627\u0648\u0648\u0641 \u064a\u0631\u0648\u0648\u0635\u0645\u0644\u0627", "bbox": {"l": 214.79425079646776, "t": 319.0067111026693, "r": 317.88953117875013, "b": 331.9666711474664, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "\u0627\u0645\u0648\u0648\u0648", "bbox": {"l": 330.88440122693584, "t": 319.0067111026693, "r": 342.81308127116796, "b": 331.9666711474664, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": " \u0644\u0627 \u0646\u0648\u0648\u0645\u0644\u0623\u0627 \u062a\u0627\u062f\u062f\u0648\u0648\u062d\u0645", "bbox": {"l": 342.8519612713121, "t": 319.0067111026693, "r": 437.0582616206338, "b": 331.9666711474664, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "\u060c\u0629", "bbox": {"l": 72.94919627049924, "t": 319.0067111026693, "r": 80.6927952992129, "b": 331.9666711474664, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "\u0648\u0648", "bbox": {"l": 86.25599731984153, "t": 340.84671117816094, "r": 88.48510732810718, "b": 353.806701222958, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "\u0627\u0645 \u0629\u0648\u0648\u0639\u0628\u062e\u0644\u0645 \u0631\u0627\u0631\u0645\u0644\u0648\u0648\u0633\u0627\u0648 \u060c\u0629\u064a\u0648\u0648\u0633\u062e\u064a\u0633\u0644\u0627 \u0629 \u0631\u062e\u0648\u0648\u0627\u0645\u0644\u0627 \u0631", "bbox": {"l": 117.17401043448704, "t": 340.84671117816094, "r": 322.67236119648516, "b": 353.806701222958, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "\u064a", "bbox": {"l": 322.7371511967254, "t": 340.84671117816094, "r": 326.5214812107579, "b": 353.806701222958, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "\u0648\u0648", "bbox": {"l": 326.56036121090204, "t": 340.84671117816094, "r": 334.78998124141793, "b": 353.806701222958, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "\u0648", "bbox": {"l": 333.88278123805395, "t": 340.84671117816094, "r": 335.38614124362846, "b": 353.806701222958, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "\u0644\u062a", "bbox": {"l": 335.4250212437726, "t": 340.84671117816094, "r": 348.4161112919443, "b": 353.806701222958, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "\u062f", "bbox": {"l": 354.00964131268535, "t": 340.84671117816094, "r": 359.8286713342626, "b": 353.806701222958, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "\u0648\u0648\u0648\u0627\u0648 \u0629\u0627\u0648\u0648\u0635\u0627\u0648\u0645\u0648", "bbox": {"l": 359.7638913340224, "t": 340.84671117816094, "r": 436.99252162039, "b": 353.806701222958, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "\u062a\u062e", "bbox": {"l": 84.35918431280804, "t": 340.84671117816094, "r": 86.1777573195514, "b": 353.806701222958, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "\u0627\u064a\u0648\u0648\u0648\u0648", "bbox": {"l": 93.20639834561395, "t": 362.68670125365236, "r": 97.68335736221475, "b": 375.6467012984495, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "\u0644\u0627\u0648", "bbox": {"l": 97.72223736235891, "t": 362.68670125365236, "r": 110.05368040808452, "b": 375.6467012984495, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "\u0629\u0648\u0648\u0648\u0641\u062e \u0644\u0627 \u062a\u062e\u0648\u0648\u0648 \u0627\u0645 \u0631\u064a\u0648\u0648\u0648\u0648\u0644\u062a \u060c \u062e\u0648\u0648\u0648\u0647\u0631\u0644\u0625\u0627 \u0629\u0648\u0648\u0648\u062d\u0641\u062e", "bbox": {"l": 107.81160039977077, "t": 362.68670125365236, "r": 319.73993118561157, "b": 375.6467012984495, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "\u0643\u0645\u0648", "bbox": {"l": 319.7788111857557, "t": 362.68670125365236, "r": 336.7513712486908, "b": 375.6467012984495, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "\u0631", "bbox": {"l": 327.4936212143627, "t": 362.68670125365236, "r": 347.5520912887404, "b": 375.6467012984495, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "\u0627\u0631", "bbox": {"l": 347.6039412889327, "t": 362.68670125365236, "r": 355.45767131805474, "b": 375.6467012984495, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "\u0644\u0648\u0648\u0648\u0633\u062d\u0627\u0648 \u0646\u0648\u0648\u0648\u0645\u0644\u0623\u0627", "bbox": {"l": 365.14093135396075, "t": 362.68670125365236, "r": 436.85941161989643, "b": 375.6467012984495, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "\u0644\u064a", "bbox": {"l": 77.3555982868384, "t": 384.52670132914386, "r": 83.62175831007363, "b": 397.486691373941, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "\u0647\u062e\u0648\u0648\u0648 \u0645 \u0648\u0648\u0648\u0633\u0631\u064a \u064a \u0648\u0648\u0648\u0644\u0627 \u0648\u0648\u0648\u0648", "bbox": {"l": 83.56991630988142, "t": 384.52670132914386, "r": 197.09950073085474, "b": 397.486691373941, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "\u062d\u0647\u0644", "bbox": {"l": 197.13838073099893, "t": 384.52670132914386, "r": 213.63646079217463, "b": 397.486691373941, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "\u0627 \u0649\u0648\u0648\u0648\u0627\u064a \u0644\u062f\u0648\u0648\u0648\u0644\u0639\u0645\u0644\u0627 \u0627\u0647\u064a\u062f\u0648\u0648\u0648", "bbox": {"l": 213.58463079198242, "t": 384.52670132914386, "r": 326.4273712104089, "b": 397.486691373941, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "\u0644\u0627", "bbox": {"l": 326.4662512105531, "t": 384.52670132914386, "r": 341.38971126589, "b": 397.486691373941, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "\u062e\u0648\u0648\u0648\u0644\u0628\u0644\u0627\u0648 \u060c\u0627\u0647\u060c\u0648\u0648\u0648\u0648\u0644\u0627", "bbox": {"l": 347.81137128970187, "t": 384.52670132914386, "r": 436.88547161999304, "b": 397.486691373941, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": ".\u0627\u0639\u0645\u0644\u062c\u0645\u0644\u0627 \u0645\u0627\u0633\u0644\u0627\u0648 \u0629\u0647\u060c\u0627\u0648\u0645\u0644\u0627", "bbox": {"l": 284.1600010536794, "t": 406.3667014046354, "r": 437.30203162153765, "b": 419.32669144943253, "coord_origin": "TOPLEFT"}}, {"id": 77, "text": " \u0631\u0648\u0644 \u0644\u0627 \u0644\u0627\u0648\u0644 \u0629\u064a\u0631\u0648", "bbox": {"l": 107.16000039735461, "t": 433.9166814998638, "r": 187.44720069506354, "b": 446.876681544661, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "\u0635", "bbox": {"l": 187.4860806952077, "t": 433.9166814998638, "r": 200.6404907439849, "b": 446.876681544661, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "\u0645", "bbox": {"l": 200.67937074412907, "t": 433.9166814998638, "r": 209.0126507750293, "b": 446.876681544661, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "\u0644\u0627", "bbox": {"l": 208.96082077483712, "t": 433.9166814998638, "r": 216.06721080118794, "b": 446.876681544661, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "\u0629\u0648", "bbox": {"l": 218.09763080871687, "t": 433.9166814998638, "r": 227.2344208425965, "b": 446.876681544661, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "\u0645\u0648\u0643\u062d\u0644\u0627 \u0627\u0645\u062e\u0648\u0646\u0631\u0628", "bbox": {"l": 227.3121808428849, "t": 433.9166814998638, "r": 310.7486611522715, "b": 446.876681544661, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "\u062f\u0627\u0644\u0648\u0633\u064a \u060c\u0642\u0628\u0633 \u062e\u0645\u0644 \u062e\u064b \u0641\u0648\u0648", "bbox": {"l": 321.5573111923505, "t": 433.9166814998638, "r": 440.45236163321925, "b": 446.876681544661, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "2024(", "bbox": {"l": 81.36000130168694, "t": 433.9166814998638, "r": 104.00928038567159, "b": 446.876681544661, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "-", "bbox": {"l": 74.51999727632386, "t": 433.9166814998638, "r": 78.09695428958737, "b": 446.876681544661, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": " )2026", "bbox": {"l": 414.79001153806195, "t": 452.63669156457087, "r": 440.883241634817, "b": 465.596681609368, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "\u0627\u062a\u0644\u0622\u0627 \u0648\u062d\u0647\u0644\u0627 \u0649\u0627\u064a \u0627\u0647\u0648 \u060c\u0629\u0633\u064a\u0626\u0631 \u0629\u064a\u062c\u064a\u062a\u0627\u0631\u0644\u0633\u0627 \u0627\u062f", "bbox": {"l": 113.40000042049283, "t": 452.63669156457087, "r": 336.75259124869535, "b": 465.596681609368, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "\u0647\u0639", "bbox": {"l": 336.7914712488395, "t": 452.63669156457087, "r": 347.26965128769314, "b": 465.596681609368, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "\u0629\u0639\u0628\u0631\u0639 \u0642\u064a \u062d\u062a", "bbox": {"l": 344.2758812765921, "t": 452.63669156457087, "r": 414.4348115367449, "b": 465.596681609368, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": ":", "bbox": {"l": 110.52000040981365, "t": 452.63669156457087, "r": 113.42303042057824, "b": 465.596681609368, "coord_origin": "TOPLEFT"}}, {"id": 91, "text": "\u062e\u0647\u0644\u0648\u0633\u062d\u062e\u0628 \u0627\u0645\u062e\u0648\u0646\u0631\u0628", "bbox": {"l": 115.18000042709316, "t": 578.8267220007557, "r": 194.85806072254337, "b": 591.7867120455528, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "\u0644\u0627", "bbox": {"l": 194.8062307223512, "t": 578.8267220007557, "r": 205.46582076187747, "b": 591.7867120455528, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "\u062a", "bbox": {"l": 202.42023075058427, "t": 578.8267220007557, "r": 216.12543080140384, "b": 591.7867120455528, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "\u062e\u0641\u062f\u0627\u0644\u0648\u0633\u0645 \u062f\u064a\u062f\u062d\u062a \u0644\u062a \u062f\u0642", "bbox": {"l": 216.15135080149997, "t": 578.8267220007557, "r": 331.91013123073924, "b": 591.7867120455528, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "\u0647\u0646", "bbox": {"l": 337.0552412498176, "t": 578.8267220007557, "r": 347.5528312887431, "b": 591.7867120455528, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "\u0639 \u0649\u0644\u0625", "bbox": {"l": 347.6046812889354, "t": 578.8267220007557, "r": 372.38708138082984, "b": 591.7867120455528, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "\u0631\u062e \u0644\u0625\u0627 \u0631\u062f\u062c\u062a", "bbox": {"l": 382.3000514175876, "t": 578.8267220007557, "r": 436.8213216197552, "b": 591.7867120455528, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "\u0644\u0643\u0648\u0627\u0628 \u062f", "bbox": {"l": 87.43940032422965, "t": 578.8267220007557, "r": 115.1923104271388, "b": 591.7867120455528, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": " \u0631\u0648\u0648\u0648\u0635\u0645 \u0629\u0648", "bbox": {"l": 241.0800008939366, "t": 597.5312820654094, "r": 285.1217710572457, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "\u0648\u0648\u064a \u0631", "bbox": {"l": 285.18668105748645, "t": 597.5312820654094, "r": 302.2865911208937, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "\u062a\u062e", "bbox": {"l": 318.6840811816964, "t": 597.5312820654094, "r": 320.50314118844153, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "\u0641\u062f\u0627\u0644", "bbox": {"l": 320.54208118858594, "t": 597.5312820654094, "r": 347.354031288006, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "\u0648\u0648\u0648", "bbox": {"l": 347.3020912878134, "t": 597.5312820654094, "r": 351.67767130403826, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "\u0633", "bbox": {"l": 351.71661130418266, "t": 597.5312820654094, "r": 365.2199713542538, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "\u0645 \u0649\u0648\u0648\u0648", "bbox": {"l": 365.1550613540131, "t": 597.5312820654094, "r": 388.13672143923026, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "\u0627\u064a \u0633\u064a\u0648\u0648\u0648\u0626\u0631", "bbox": {"l": 388.1756614393746, "t": 597.5312820654094, "r": 437.1642516210267, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "2023", "bbox": {"l": 215.03999079737898, "t": 597.5312820654094, "r": 241.13783089415108, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "\u0631", "bbox": {"l": 73.95381227422442, "t": 597.5312820654094, "r": 75.14617927864577, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "\u0627\u0648\u0648", "bbox": {"l": 75.18513527879021, "t": 597.5312820654094, "r": 86.63702432125439, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "\u0648\u0648", "bbox": {"l": 86.68895732144696, "t": 597.5312820654094, "r": 89.51946333194262, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "\u062d\u0644\u0627", "bbox": {"l": 89.55841833208707, "t": 597.5312820654094, "r": 106.3337403942908, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "\u062a\u062e\u0648\u0648\u0648", "bbox": {"l": 103.28368038298102, "t": 597.5312820654094, "r": 127.52363047286396, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "\u0633\u0627\u0648 \u062a\u062e\u064a\u0648\u0648\u0648\u0635\u0648\u062a\u0648 \u060c", "bbox": {"l": 127.56258047300838, "t": 597.5312820654094, "r": 214.76315079635242, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "\u0643\u064a\u0627\u0644", "bbox": {"l": 91.17600333808515, "t": 616.2866921302387, "r": 114.98352042636462, "b": 629.2467021750359, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "\u0627 \u062a\u062e \u0627\u0648\u0648\u0635\u064a\u0644 \u0627\u0647\u060c\u0648\u0648\u0648\u0644\u0627 \u0627\u0645\u062e\u0648\u0648\u0646\u0631\u0628\u0644\u0627\u0648 \u060c\u062a\u0627\u0631\u0627 ", "bbox": {"l": 114.93168042617239, "t": 616.2866921302387, "r": 303.07190112380573, "b": 629.2467021750359, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "\u0648\u0648\u0648", "bbox": {"l": 303.1107811239498, "t": 616.2866921302387, "r": 311.57367115533066, "b": 629.2467021750359, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "\u0644\u0627", "bbox": {"l": 311.6125511554748, "t": 616.2866921302387, "r": 322.27216119500116, "b": 629.2467021750359, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "\u062a", "bbox": {"l": 319.22656118370793, "t": 616.2866921302387, "r": 332.9317612345275, "b": 629.2467021750359, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "\u062e", "bbox": {"l": 332.9576712346236, "t": 616.2866921302387, "r": 336.7420012486561, "b": 629.2467021750359, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "\u0641\u062f\u0627", "bbox": {"l": 336.78088124880026, "t": 616.2866921302387, "r": 359.1757513318415, "b": 629.2467021750359, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "\u0644\u0648\u0648", "bbox": {"l": 359.2016613319376, "t": 616.2866921302387, "r": 365.26694135442796, "b": 629.2467021750359, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "\u0633\u0645\u0648", "bbox": {"l": 365.3058213545721, "t": 616.2866921302387, "r": 392.46997145529815, "b": 629.2467021750359, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": " \u060c\u0627\u0647\u060c\u0648\u0648\u0648\u0644\u0627", "bbox": {"l": 392.431091455154, "t": 616.2866921302387, "r": 437.0264616205159, "b": 629.2467021750359, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "\u060c\u0629\u0648\u0648", "bbox": {"l": 72.94919627049924, "t": 616.2866921302387, "r": 82.44239030570048, "b": 629.2467021750359, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "\u064a", "bbox": {"l": 82.48127030584465, "t": 616.2866921302387, "r": 86.84879332203964, "b": 629.2467021750359, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "\u0627", "bbox": {"l": 86.79695132184742, "t": 616.2866921302387, "r": 91.12559533789825, "b": 629.2467021750359, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "\u0629\u064a\u0647\u060c", "bbox": {"l": 276.1200010238667, "t": 635.0067021949458, "r": 302.3251311210366, "b": 647.966702239743, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "\u0648\u0644\u0627", "bbox": {"l": 302.27328112084433, "t": 635.0067021949458, "r": 318.1881711798576, "b": 647.966702239743, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "\u062a\u062e", "bbox": {"l": 315.29456116912786, "t": 635.0067021949458, "r": 334.1030612388708, "b": 647.966702239743, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "\u064a", "bbox": {"l": 334.18082123915906, "t": 635.0067021949458, "r": 338.5483412553541, "b": 647.966702239743, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "\u062c\u064a\u062a\u0627", "bbox": {"l": 338.4964912551618, "t": 635.0067021949458, "r": 358.23456132835156, "b": 647.966702239743, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "\u0631\u0644\u0633\u062d\u0627 \u0641\u0627\u0644\u0628\u0645\u0648", "bbox": {"l": 358.2864113285438, "t": 635.0067021949458, "r": 437.29059162149525, "b": 647.966702239743, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": ".", "bbox": {"l": 272.6400110109627, "t": 635.0067021949458, "r": 276.0614610236496, "b": 647.966702239743, "coord_origin": "TOPLEFT"}}, {"id": 134, "text": " \u0646\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0645", "bbox": {"l": 167.78000062213658, "t": 507.4266917539564, "r": 199.8948707412201, "b": 520.3866917987535, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "\u0645\u0627", "bbox": {"l": 199.92079074131624, "t": 507.4266917539564, "r": 211.63663078475915, "b": 520.3866917987535, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "\u0629\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u064a\u0627", "bbox": {"l": 221.8685508226996, "t": 507.4266917539564, "r": 241.72971089634578, "b": 520.3866917987535, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "\u0645 ", "bbox": {"l": 241.67787089615356, "t": 507.4266917539564, "r": 257.411320954494, "b": 520.3866917987535, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "\u0631\u0640", "bbox": {"l": 179.26880066473763, "t": 519.9067017970945, "r": 187.75760069621452, "b": 532.8667018418917, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "\u0635\u0645", "bbox": {"l": 187.79648069635869, "t": 519.9067017970945, "r": 209.58224077714138, "b": 532.8667018418917, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "\u0644\u0627", "bbox": {"l": 209.51744077690105, "t": 519.9067017970945, "r": 216.90465080429323, "b": 532.8667018418917, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": " \u064a\u0645", "bbox": {"l": 216.94353080443742, "t": 519.9067017970945, "r": 235.95586087493606, "b": 532.8667018418917, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "\u0648\u0642\u0644", "bbox": {"l": 235.99474087508025, "t": 519.9067017970945, "r": 254.0609709420707, "b": 532.8667018418917, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "\u0627", "bbox": {"l": 254.09985094221489, "t": 519.9067017970945, "r": 257.54721095499787, "b": 532.8667018418917, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": " \u0627\u0640\u0640\u0640\u0640\u0633\u0646 \u0627 \u0621\u0627\u0640\u0640\u0640\u0640", "bbox": {"l": 362.20999134309267, "t": 508.6766917582771, "r": 428.6688815895255, "b": 521.6366918030742, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "\u0646\u0628", "bbox": {"l": 428.7077615896697, "t": 508.6766917582771, "r": 437.3132016215791, "b": 521.6366918030742, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "\u0631\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0635\u0645", "bbox": {"l": 367.6023913630879, "t": 521.1567018014152, "r": 429.6149015930334, "b": 534.1167018462124, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "\u0644\u0627", "bbox": {"l": 429.5501115927932, "t": 521.1567018014152, "r": 436.93732162018534, "b": 534.1167018462124, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": " \u0639\u0627\u0640\u0640\u0640\u0640\u0640\u0635\u062a", "bbox": {"l": 270.07001100143304, "t": 507.4266917539564, "r": 308.6001011443045, "b": 520.3866917987535, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "\u0627 \u0621\u0627\u0640\u0640\u0640\u0640\u0640", "bbox": {"l": 331.3538212286764, "t": 507.4266917539564, "r": 340.23544126160994, "b": 520.3866917987535, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "\u0646\u0628", "bbox": {"l": 340.2743212617541, "t": 507.4266917539564, "r": 348.8797612936635, "b": 520.3866917987535, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "\u064a\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0633\u0628\u0627", "bbox": {"l": 273.0700110125572, "t": 519.9067017970945, "r": 340.08609126105614, "b": 532.8667018418917, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "\u0646\u062a", "bbox": {"l": 340.0213012608159, "t": 519.9067017970945, "r": 348.6267412927253, "b": 532.8667018418917, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "\u0642\u062a\u0633\u0638\u0627", "bbox": {"l": 85.41600031672677, "t": 508.33670175710193, "r": 117.0141004338941, "b": 521.296691801899, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "\u0642", "bbox": {"l": 129.65334048076102, "t": 508.33670175710193, "r": 135.9729605041945, "b": 521.296691801899, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "\u064a\u0642\u062d\u062a", "bbox": {"l": 136.02480050438672, "t": 508.33670175710193, "r": 160.44144059492484, "b": 521.296691801899, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": " \u0631\u0627 \u0631", "bbox": {"l": 69.09600125621141, "t": 508.33670175710193, "r": 85.41264331671432, "b": 521.296691801899, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "\u064a\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0633\u0627\u064a", "bbox": {"l": 72.09600126733555, "t": 520.81671180024, "r": 138.94359051520973, "b": 533.7767018450371, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "\u0633\u0644\u0627", "bbox": {"l": 138.8787805149694, "t": 520.81671180024, "r": 159.95175059310904, "b": 533.7767018450371, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 7, "label": "text", "bbox": {"l": 47.9520001778084, "t": 804.0922617794021, "r": 58.751999217855335, "b": 818.1322628279323, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 0, "text": "11", "bbox": {"l": 47.9520001778084, "t": 804.0922617794021, "r": 58.751999217855335, "b": 818.1322628279323, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 0, "label": "text", "bbox": {"l": 67.9919972521177, "t": 209.65674072469346, "r": 437.42722162200187, "b": 419.32669144943253, "coord_origin": "TOPLEFT"}, "confidence": 0.9685260057449341, "cells": [{"id": 1, "text": " \u060c\u0647\u064a\u0644\u0639\u0648", "bbox": {"l": 399.260011480476, "t": 209.65674072469346, "r": 437.42722162200187, "b": 222.61670076949054, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "\u0645\u0644\u0627 \u0629\u0648\u0627", "bbox": {"l": 101.00520037453231, "t": 209.65674072469346, "r": 126.82584047027652, "b": 222.61670076949054, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "\u0631\u0645\u0644\u0627 \u0644\u0627\u0648\u0644 \u062e\u0648\u0627\u0647\u064a\u064a\u0639", "bbox": {"l": 130.05289048224256, "t": 209.65674072469346, "r": 229.27513085016358, "b": 222.61670076949054, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "\u0648\u0648\u0635", "bbox": {"l": 240.66298089239032, "t": 209.65674072469346, "r": 258.55817095874653, "b": 222.61670076949054, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "\u0639\u0636\u062a", "bbox": {"l": 265.06552098287614, "t": 209.65674072469346, "r": 281.6825010444927, "b": 222.61670076949054, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "\u0629\u064a\u0631\u0635", "bbox": {"l": 286.3310210617297, "t": 209.65674072469346, "r": 314.70044116692486, "b": 222.61670076949054, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "\u0645", "bbox": {"l": 314.739321167069, "t": 209.65674072469346, "r": 323.0726011979693, "b": 222.61670076949054, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "\u0644\u0627", "bbox": {"l": 323.02075119777703, "t": 209.65674072469346, "r": 330.06061122388115, "b": 222.61670076949054, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "\u0629\u0645\u0648\u0643\u062d", "bbox": {"l": 333.2073112355493, "t": 209.65674072469346, "r": 369.27499136929003, "b": 222.61670076949054, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "\u0644\u0627 ", "bbox": {"l": 369.3138713694342, "t": 209.65674072469346, "r": 379.37082140672584, "b": 222.61670076949054, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "\u0646\u0625\u0641", "bbox": {"l": 379.50043140720646, "t": 209.65674072469346, "r": 398.9274614792428, "b": 222.61670076949054, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "\u0629\u0648", "bbox": {"l": 78.1863332899188, "t": 209.65674072469346, "r": 79.31903829411894, "b": 222.61670076949054, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "\u0627\u0628", "bbox": {"l": 79.3838352943592, "t": 209.65674072469346, "r": 88.079994326605, "b": 222.61670076949054, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "\u0644\u0623\u0627", "bbox": {"l": 102.7000003808167, "t": 231.61676080059988, "r": 113.81968042204905, "b": 244.57672084539684, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "\u0646\u0645 \u062f\u062f\u064a \u0642\u064a \u062d\u062a \u0649\u0627\u064a \u0644\u0645\u0639\u0644\u062e\u0628 \u062e\u0627\u0644 \u0629\u064a\u0631", "bbox": {"l": 117.07263043411113, "t": 231.61676080059988, "r": 294.7153310928191, "b": 244.57672084539684, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "\u0648\u0627\u0645", "bbox": {"l": 294.75421109296326, "t": 231.61676080059988, "r": 318.5617411812428, "b": 244.57672084539684, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "\u062c\u0644\u0627", "bbox": {"l": 318.5098911810505, "t": 231.61676080059988, "r": 333.0000912347809, "b": 244.57672084539684, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "\u0633\u064a", "bbox": {"l": 337.2111512503957, "t": 231.61676080059988, "r": 359.59308133338897, "b": 244.57672084539684, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "\u0626\u0631 ", "bbox": {"l": 359.5282913331488, "t": 231.61676080059988, "r": 370.3110413731318, "b": 244.57672084539684, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "\u062f", "bbox": {"l": 370.5443113739967, "t": 231.61676080059988, "r": 377.2187213987458, "b": 244.57672084539684, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "\u064a\u0633\u0644\u0627 \u0641\u064a\u0627\u0643\u062a", "bbox": {"l": 377.25760139888996, "t": 231.61676080059988, "r": 437.04208162057375, "b": 244.57672084539684, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "\u0627", "bbox": {"l": 83.34959430906444, "t": 231.61676080059988, "r": 86.42111232045377, "b": 244.57672084539684, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "\u062f\u0648", "bbox": {"l": 86.48590932069406, "t": 231.61676080059988, "r": 94.70254535116175, "b": 244.57672084539684, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "\u0647", "bbox": {"l": 94.74142535130592, "t": 231.61676080059988, "r": 102.67294038071637, "b": 244.57672084539684, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": " :\u062e\u0627\u0633\u0639\u0631 \u0649\u0627\u064a", "bbox": {"l": 375.9800113941526, "t": 253.45672087609114, "r": 437.31921162160137, "b": 266.4166809208882, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "\u0648\u064a\u0648\u0644\u0648\u0644\u0623\u0627 \u0629\u0648\u0645\u0626\u062e\u0642 \u0633\u0639\u0631 \u0649\u0627", "bbox": {"l": 89.13600233052074, "t": 253.45672087609114, "r": 199.6070607401529, "b": 266.4166809208882, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "\u064a", "bbox": {"l": 199.56818074000876, "t": 253.45672087609114, "r": 206.72209076653579, "b": 266.4166809208882, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "\u064a\u0631\u0635\u0645\u0644\u0627 \u0646\u062e\u0633\u0646\u0644\u0625\u0627 \u0621\u062e\u0647\u0628 ", "bbox": {"l": 222.04082082333838, "t": 253.45672087609114, "r": 321.0293311903927, "b": 266.4166809208882, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "\u0641\u0627\u0645", "bbox": {"l": 321.1459711908252, "t": 253.45672087609114, "r": 342.4485212698161, "b": 266.4166809208882, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "\u0639\u0636\u0648", "bbox": {"l": 348.3749412917916, "t": 253.45672087609114, "r": 375.73349139323847, "b": 266.4166809208882, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "\u060c", "bbox": {"l": 72.94919627049924, "t": 253.45672087609114, "r": 73.94063627417555, "b": 266.4166809208882, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "\u062a\u062e", "bbox": {"l": 73.97951527431972, "t": 253.45672087609114, "r": 89.02607733011313, "b": 266.4166809208882, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": " \u0648\u0648\u0648\u0645\u0646 \u062a\u062d\u062f\u0648\u0648\u0639\u0645 \u0642\u0648\u0648\u064a \u062d\u062a", "bbox": {"l": 67.9919972521177, "t": 275.2967509515828, "r": 179.1887806644409, "b": 288.25671099637975, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "\u0649\u0648\u0648", "bbox": {"l": 190.77632070740808, "t": 275.2967509515828, "r": 192.97821071557277, "b": 288.25671099637975, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "\u0627\u064a", "bbox": {"l": 193.01709071571696, "t": 275.2967509515828, "r": 203.23216075359494, "b": 288.25671099637975, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "\u0644\u0648", "bbox": {"l": 207.64893076997257, "t": 275.2967509515828, "r": 218.53532081033984, "b": 288.25671099637975, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "\u0648\u0645", "bbox": {"l": 217.84845080779291, "t": 275.2967509515828, "r": 227.72397084441184, "b": 288.25671099637975, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "\u0639\u0644\u0627", "bbox": {"l": 227.6721308442196, "t": 275.2967509515828, "r": 241.0490108938217, "b": 288.25671099637975, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "\u060c\u0644\u064a\u0648\u0648\u0627\u0639\u0644\u0644\u0627\u0648 \u0629\u062d\u0648\u0648\u0635\u0644\u0627 \u062a\u062d\u062e\u0648\u0648\u062c\u0645 \u0627\u0648\u0648\u0641 \u0629\u0648\u0648\u0635\u062e\u0644", "bbox": {"l": 233.752530866766, "t": 275.2967509515828, "r": 437.0279516205213, "b": 288.25671099637975, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": " \u0649\u0648\u0648\u0648\u0648\u0627\u064a", "bbox": {"l": 67.9919972521177, "t": 297.16675102717795, "r": 96.06932135622982, "b": 310.126711071975, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "\u062e\u0648\u0648\u0648\u0648 \u062d\u0644\u0627 \u0627 \u0648\u0648\u0648\u0648", "bbox": {"l": 103.08865038225784, "t": 297.16675102717795, "r": 159.24330059048208, "b": 310.126711071975, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "\u0648 \u060c\u062a\u062e\u0648\u0648\u0648\u0648", "bbox": {"l": 187.1299706938872, "t": 297.16675102717795, "r": 197.68263073301702, "b": 310.126711071975, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "\u064a", "bbox": {"l": 197.72151073316118, "t": 297.16675102717795, "r": 204.87543075968827, "b": 310.126711071975, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "\u062e\u0644", "bbox": {"l": 204.91431075983246, "t": 297.16675102717795, "r": 214.81445079654264, "b": 310.126711071975, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "\u0644\u0627", "bbox": {"l": 239.12222088667707, "t": 297.16675102717795, "r": 244.1863409054551, "b": 310.126711071975, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "\u0641\u0648\u0648\u0648\u0648\u0627\u0630\u0639 \u0627\u0648\u0648\u0648\u0648\u0641 \u0629\u0627\u0645\u062e\u0648\u0648\u0648\u0648 \u0648 \u0629\u0645\u0627\u062f\u0644\u0648\u0648\u0648\u0648\u0633\u0645\u0648 \u0629\u0648\u0648\u0648\u0648\u064a\u0648\u0642", "bbox": {"l": 242.73946090009002, "t": 297.16675102717795, "r": 436.91122162008855, "b": 310.126711071975, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "\u0648\u0648", "bbox": {"l": 80.7360002993731, "t": 319.0067111026693, "r": 82.4855963058607, "b": 331.9666711474664, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "\u064a\u0644\u0648\u062f\u0644\u0627\u0648 \u0629\u0648\u0648\u064a\u0645\u064a\u0627\u0642\u0644\u0625\u0627 \u062a\u062e\u064a\u062f\u0648\u0648", "bbox": {"l": 82.52447530600485, "t": 319.0067111026693, "r": 198.30913073534012, "b": 331.9666711474664, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "\u062d\u0644\u0644", "bbox": {"l": 198.34801073548428, "t": 319.0067111026693, "r": 214.84608079665995, "b": 331.9666711474664, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "\u0627 \u0621\u0648\u0648\u0648\u0636 \u0627\u0648\u0648\u0641 \u064a\u0631\u0648\u0648\u0635\u0645\u0644\u0627", "bbox": {"l": 214.79425079646776, "t": 319.0067111026693, "r": 317.88953117875013, "b": 331.9666711474664, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "\u0627\u0645\u0648\u0648\u0648", "bbox": {"l": 330.88440122693584, "t": 319.0067111026693, "r": 342.81308127116796, "b": 331.9666711474664, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": " \u0644\u0627 \u0646\u0648\u0648\u0645\u0644\u0623\u0627 \u062a\u0627\u062f\u062f\u0648\u0648\u062d\u0645", "bbox": {"l": 342.8519612713121, "t": 319.0067111026693, "r": 437.0582616206338, "b": 331.9666711474664, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "\u060c\u0629", "bbox": {"l": 72.94919627049924, "t": 319.0067111026693, "r": 80.6927952992129, "b": 331.9666711474664, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "\u0648\u0648", "bbox": {"l": 86.25599731984153, "t": 340.84671117816094, "r": 88.48510732810718, "b": 353.806701222958, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "\u0627\u0645 \u0629\u0648\u0648\u0639\u0628\u062e\u0644\u0645 \u0631\u0627\u0631\u0645\u0644\u0648\u0648\u0633\u0627\u0648 \u060c\u0629\u064a\u0648\u0648\u0633\u062e\u064a\u0633\u0644\u0627 \u0629 \u0631\u062e\u0648\u0648\u0627\u0645\u0644\u0627 \u0631", "bbox": {"l": 117.17401043448704, "t": 340.84671117816094, "r": 322.67236119648516, "b": 353.806701222958, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "\u064a", "bbox": {"l": 322.7371511967254, "t": 340.84671117816094, "r": 326.5214812107579, "b": 353.806701222958, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "\u0648\u0648", "bbox": {"l": 326.56036121090204, "t": 340.84671117816094, "r": 334.78998124141793, "b": 353.806701222958, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "\u0648", "bbox": {"l": 333.88278123805395, "t": 340.84671117816094, "r": 335.38614124362846, "b": 353.806701222958, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "\u0644\u062a", "bbox": {"l": 335.4250212437726, "t": 340.84671117816094, "r": 348.4161112919443, "b": 353.806701222958, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "\u062f", "bbox": {"l": 354.00964131268535, "t": 340.84671117816094, "r": 359.8286713342626, "b": 353.806701222958, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "\u0648\u0648\u0648\u0627\u0648 \u0629\u0627\u0648\u0648\u0635\u0627\u0648\u0645\u0648", "bbox": {"l": 359.7638913340224, "t": 340.84671117816094, "r": 436.99252162039, "b": 353.806701222958, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "\u062a\u062e", "bbox": {"l": 84.35918431280804, "t": 340.84671117816094, "r": 86.1777573195514, "b": 353.806701222958, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "\u0627\u064a\u0648\u0648\u0648\u0648", "bbox": {"l": 93.20639834561395, "t": 362.68670125365236, "r": 97.68335736221475, "b": 375.6467012984495, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "\u0644\u0627\u0648", "bbox": {"l": 97.72223736235891, "t": 362.68670125365236, "r": 110.05368040808452, "b": 375.6467012984495, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "\u0629\u0648\u0648\u0648\u0641\u062e \u0644\u0627 \u062a\u062e\u0648\u0648\u0648 \u0627\u0645 \u0631\u064a\u0648\u0648\u0648\u0648\u0644\u062a \u060c \u062e\u0648\u0648\u0648\u0647\u0631\u0644\u0625\u0627 \u0629\u0648\u0648\u0648\u062d\u0641\u062e", "bbox": {"l": 107.81160039977077, "t": 362.68670125365236, "r": 319.73993118561157, "b": 375.6467012984495, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "\u0643\u0645\u0648", "bbox": {"l": 319.7788111857557, "t": 362.68670125365236, "r": 336.7513712486908, "b": 375.6467012984495, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "\u0631", "bbox": {"l": 327.4936212143627, "t": 362.68670125365236, "r": 347.5520912887404, "b": 375.6467012984495, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "\u0627\u0631", "bbox": {"l": 347.6039412889327, "t": 362.68670125365236, "r": 355.45767131805474, "b": 375.6467012984495, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "\u0644\u0648\u0648\u0648\u0633\u062d\u0627\u0648 \u0646\u0648\u0648\u0648\u0645\u0644\u0623\u0627", "bbox": {"l": 365.14093135396075, "t": 362.68670125365236, "r": 436.85941161989643, "b": 375.6467012984495, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "\u0644\u064a", "bbox": {"l": 77.3555982868384, "t": 384.52670132914386, "r": 83.62175831007363, "b": 397.486691373941, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "\u0647\u062e\u0648\u0648\u0648 \u0645 \u0648\u0648\u0648\u0633\u0631\u064a \u064a \u0648\u0648\u0648\u0644\u0627 \u0648\u0648\u0648\u0648", "bbox": {"l": 83.56991630988142, "t": 384.52670132914386, "r": 197.09950073085474, "b": 397.486691373941, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "\u062d\u0647\u0644", "bbox": {"l": 197.13838073099893, "t": 384.52670132914386, "r": 213.63646079217463, "b": 397.486691373941, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "\u0627 \u0649\u0648\u0648\u0648\u0627\u064a \u0644\u062f\u0648\u0648\u0648\u0644\u0639\u0645\u0644\u0627 \u0627\u0647\u064a\u062f\u0648\u0648\u0648", "bbox": {"l": 213.58463079198242, "t": 384.52670132914386, "r": 326.4273712104089, "b": 397.486691373941, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "\u0644\u0627", "bbox": {"l": 326.4662512105531, "t": 384.52670132914386, "r": 341.38971126589, "b": 397.486691373941, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "\u062e\u0648\u0648\u0648\u0644\u0628\u0644\u0627\u0648 \u060c\u0627\u0647\u060c\u0648\u0648\u0648\u0648\u0644\u0627", "bbox": {"l": 347.81137128970187, "t": 384.52670132914386, "r": 436.88547161999304, "b": 397.486691373941, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": ".\u0627\u0639\u0645\u0644\u062c\u0645\u0644\u0627 \u0645\u0627\u0633\u0644\u0627\u0648 \u0629\u0647\u060c\u0627\u0648\u0645\u0644\u0627", "bbox": {"l": 284.1600010536794, "t": 406.3667014046354, "r": 437.30203162153765, "b": 419.32669144943253, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 74.51999727632386, "t": 433.9166814998638, "r": 440.883241634817, "b": 465.596681609368, "coord_origin": "TOPLEFT"}, "confidence": 0.9393879771232605, "cells": [{"id": 77, "text": " \u0631\u0648\u0644 \u0644\u0627 \u0644\u0627\u0648\u0644 \u0629\u064a\u0631\u0648", "bbox": {"l": 107.16000039735461, "t": 433.9166814998638, "r": 187.44720069506354, "b": 446.876681544661, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "\u0635", "bbox": {"l": 187.4860806952077, "t": 433.9166814998638, "r": 200.6404907439849, "b": 446.876681544661, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "\u0645", "bbox": {"l": 200.67937074412907, "t": 433.9166814998638, "r": 209.0126507750293, "b": 446.876681544661, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "\u0644\u0627", "bbox": {"l": 208.96082077483712, "t": 433.9166814998638, "r": 216.06721080118794, "b": 446.876681544661, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "\u0629\u0648", "bbox": {"l": 218.09763080871687, "t": 433.9166814998638, "r": 227.2344208425965, "b": 446.876681544661, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "\u0645\u0648\u0643\u062d\u0644\u0627 \u0627\u0645\u062e\u0648\u0646\u0631\u0628", "bbox": {"l": 227.3121808428849, "t": 433.9166814998638, "r": 310.7486611522715, "b": 446.876681544661, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "\u062f\u0627\u0644\u0648\u0633\u064a \u060c\u0642\u0628\u0633 \u062e\u0645\u0644 \u062e\u064b \u0641\u0648\u0648", "bbox": {"l": 321.5573111923505, "t": 433.9166814998638, "r": 440.45236163321925, "b": 446.876681544661, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "2024(", "bbox": {"l": 81.36000130168694, "t": 433.9166814998638, "r": 104.00928038567159, "b": 446.876681544661, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "-", "bbox": {"l": 74.51999727632386, "t": 433.9166814998638, "r": 78.09695428958737, "b": 446.876681544661, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": " )2026", "bbox": {"l": 414.79001153806195, "t": 452.63669156457087, "r": 440.883241634817, "b": 465.596681609368, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "\u0627\u062a\u0644\u0622\u0627 \u0648\u062d\u0647\u0644\u0627 \u0649\u0627\u064a \u0627\u0647\u0648 \u060c\u0629\u0633\u064a\u0626\u0631 \u0629\u064a\u062c\u064a\u062a\u0627\u0631\u0644\u0633\u0627 \u0627\u062f", "bbox": {"l": 113.40000042049283, "t": 452.63669156457087, "r": 336.75259124869535, "b": 465.596681609368, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "\u0647\u0639", "bbox": {"l": 336.7914712488395, "t": 452.63669156457087, "r": 347.26965128769314, "b": 465.596681609368, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "\u0629\u0639\u0628\u0631\u0639 \u0642\u064a \u062d\u062a", "bbox": {"l": 344.2758812765921, "t": 452.63669156457087, "r": 414.4348115367449, "b": 465.596681609368, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": ":", "bbox": {"l": 110.52000040981365, "t": 452.63669156457087, "r": 113.42303042057824, "b": 465.596681609368, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "text", "bbox": {"l": 72.94919627049924, "t": 578.8267220007557, "r": 437.29059162149525, "b": 647.966702239743, "coord_origin": "TOPLEFT"}, "confidence": 0.9558618068695068, "cells": [{"id": 91, "text": "\u062e\u0647\u0644\u0648\u0633\u062d\u062e\u0628 \u0627\u0645\u062e\u0648\u0646\u0631\u0628", "bbox": {"l": 115.18000042709316, "t": 578.8267220007557, "r": 194.85806072254337, "b": 591.7867120455528, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "\u0644\u0627", "bbox": {"l": 194.8062307223512, "t": 578.8267220007557, "r": 205.46582076187747, "b": 591.7867120455528, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "\u062a", "bbox": {"l": 202.42023075058427, "t": 578.8267220007557, "r": 216.12543080140384, "b": 591.7867120455528, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "\u062e\u0641\u062f\u0627\u0644\u0648\u0633\u0645 \u062f\u064a\u062f\u062d\u062a \u0644\u062a \u062f\u0642", "bbox": {"l": 216.15135080149997, "t": 578.8267220007557, "r": 331.91013123073924, "b": 591.7867120455528, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "\u0647\u0646", "bbox": {"l": 337.0552412498176, "t": 578.8267220007557, "r": 347.5528312887431, "b": 591.7867120455528, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "\u0639 \u0649\u0644\u0625", "bbox": {"l": 347.6046812889354, "t": 578.8267220007557, "r": 372.38708138082984, "b": 591.7867120455528, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "\u0631\u062e \u0644\u0625\u0627 \u0631\u062f\u062c\u062a", "bbox": {"l": 382.3000514175876, "t": 578.8267220007557, "r": 436.8213216197552, "b": 591.7867120455528, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "\u0644\u0643\u0648\u0627\u0628 \u062f", "bbox": {"l": 87.43940032422965, "t": 578.8267220007557, "r": 115.1923104271388, "b": 591.7867120455528, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": " \u0631\u0648\u0648\u0648\u0635\u0645 \u0629\u0648", "bbox": {"l": 241.0800008939366, "t": 597.5312820654094, "r": 285.1217710572457, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "\u0648\u0648\u064a \u0631", "bbox": {"l": 285.18668105748645, "t": 597.5312820654094, "r": 302.2865911208937, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "\u062a\u062e", "bbox": {"l": 318.6840811816964, "t": 597.5312820654094, "r": 320.50314118844153, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "\u0641\u062f\u0627\u0644", "bbox": {"l": 320.54208118858594, "t": 597.5312820654094, "r": 347.354031288006, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "\u0648\u0648\u0648", "bbox": {"l": 347.3020912878134, "t": 597.5312820654094, "r": 351.67767130403826, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "\u0633", "bbox": {"l": 351.71661130418266, "t": 597.5312820654094, "r": 365.2199713542538, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "\u0645 \u0649\u0648\u0648\u0648", "bbox": {"l": 365.1550613540131, "t": 597.5312820654094, "r": 388.13672143923026, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "\u0627\u064a \u0633\u064a\u0648\u0648\u0648\u0626\u0631", "bbox": {"l": 388.1756614393746, "t": 597.5312820654094, "r": 437.1642516210267, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "2023", "bbox": {"l": 215.03999079737898, "t": 597.5312820654094, "r": 241.13783089415108, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "\u0631", "bbox": {"l": 73.95381227422442, "t": 597.5312820654094, "r": 75.14617927864577, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "\u0627\u0648\u0648", "bbox": {"l": 75.18513527879021, "t": 597.5312820654094, "r": 86.63702432125439, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "\u0648\u0648", "bbox": {"l": 86.68895732144696, "t": 597.5312820654094, "r": 89.51946333194262, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "\u062d\u0644\u0627", "bbox": {"l": 89.55841833208707, "t": 597.5312820654094, "r": 106.3337403942908, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "\u062a\u062e\u0648\u0648\u0648", "bbox": {"l": 103.28368038298102, "t": 597.5312820654094, "r": 127.52363047286396, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "\u0633\u0627\u0648 \u062a\u062e\u064a\u0648\u0648\u0648\u0635\u0648\u062a\u0648 \u060c", "bbox": {"l": 127.56258047300838, "t": 597.5312820654094, "r": 214.76315079635242, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "\u0643\u064a\u0627\u0644", "bbox": {"l": 91.17600333808515, "t": 616.2866921302387, "r": 114.98352042636462, "b": 629.2467021750359, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "\u0627 \u062a\u062e \u0627\u0648\u0648\u0635\u064a\u0644 \u0627\u0647\u060c\u0648\u0648\u0648\u0644\u0627 \u0627\u0645\u062e\u0648\u0648\u0646\u0631\u0628\u0644\u0627\u0648 \u060c\u062a\u0627\u0631\u0627 ", "bbox": {"l": 114.93168042617239, "t": 616.2866921302387, "r": 303.07190112380573, "b": 629.2467021750359, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "\u0648\u0648\u0648", "bbox": {"l": 303.1107811239498, "t": 616.2866921302387, "r": 311.57367115533066, "b": 629.2467021750359, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "\u0644\u0627", "bbox": {"l": 311.6125511554748, "t": 616.2866921302387, "r": 322.27216119500116, "b": 629.2467021750359, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "\u062a", "bbox": {"l": 319.22656118370793, "t": 616.2866921302387, "r": 332.9317612345275, "b": 629.2467021750359, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "\u062e", "bbox": {"l": 332.9576712346236, "t": 616.2866921302387, "r": 336.7420012486561, "b": 629.2467021750359, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "\u0641\u062f\u0627", "bbox": {"l": 336.78088124880026, "t": 616.2866921302387, "r": 359.1757513318415, "b": 629.2467021750359, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "\u0644\u0648\u0648", "bbox": {"l": 359.2016613319376, "t": 616.2866921302387, "r": 365.26694135442796, "b": 629.2467021750359, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "\u0633\u0645\u0648", "bbox": {"l": 365.3058213545721, "t": 616.2866921302387, "r": 392.46997145529815, "b": 629.2467021750359, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": " \u060c\u0627\u0647\u060c\u0648\u0648\u0648\u0644\u0627", "bbox": {"l": 392.431091455154, "t": 616.2866921302387, "r": 437.0264616205159, "b": 629.2467021750359, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "\u060c\u0629\u0648\u0648", "bbox": {"l": 72.94919627049924, "t": 616.2866921302387, "r": 82.44239030570048, "b": 629.2467021750359, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "\u064a", "bbox": {"l": 82.48127030584465, "t": 616.2866921302387, "r": 86.84879332203964, "b": 629.2467021750359, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "\u0627", "bbox": {"l": 86.79695132184742, "t": 616.2866921302387, "r": 91.12559533789825, "b": 629.2467021750359, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "\u0629\u064a\u0647\u060c", "bbox": {"l": 276.1200010238667, "t": 635.0067021949458, "r": 302.3251311210366, "b": 647.966702239743, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "\u0648\u0644\u0627", "bbox": {"l": 302.27328112084433, "t": 635.0067021949458, "r": 318.1881711798576, "b": 647.966702239743, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "\u062a\u062e", "bbox": {"l": 315.29456116912786, "t": 635.0067021949458, "r": 334.1030612388708, "b": 647.966702239743, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "\u064a", "bbox": {"l": 334.18082123915906, "t": 635.0067021949458, "r": 338.5483412553541, "b": 647.966702239743, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "\u062c\u064a\u062a\u0627", "bbox": {"l": 338.4964912551618, "t": 635.0067021949458, "r": 358.23456132835156, "b": 647.966702239743, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "\u0631\u0644\u0633\u062d\u0627 \u0641\u0627\u0644\u0628\u0645\u0648", "bbox": {"l": 358.2864113285438, "t": 635.0067021949458, "r": 437.29059162149525, "b": 647.966702239743, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": ".", "bbox": {"l": 272.6400110109627, "t": 635.0067021949458, "r": 276.0614610236496, "b": 647.966702239743, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "text", "bbox": {"l": 69.09600125621141, "t": 507.4266917539564, "r": 437.3132016215791, "b": 534.1167018462124, "coord_origin": "TOPLEFT"}, "confidence": 0.5769620537757874, "cells": [{"id": 134, "text": " \u0646\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0645", "bbox": {"l": 167.78000062213658, "t": 507.4266917539564, "r": 199.8948707412201, "b": 520.3866917987535, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "\u0645\u0627", "bbox": {"l": 199.92079074131624, "t": 507.4266917539564, "r": 211.63663078475915, "b": 520.3866917987535, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "\u0629\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u064a\u0627", "bbox": {"l": 221.8685508226996, "t": 507.4266917539564, "r": 241.72971089634578, "b": 520.3866917987535, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "\u0645 ", "bbox": {"l": 241.67787089615356, "t": 507.4266917539564, "r": 257.411320954494, "b": 520.3866917987535, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "\u0631\u0640", "bbox": {"l": 179.26880066473763, "t": 519.9067017970945, "r": 187.75760069621452, "b": 532.8667018418917, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "\u0635\u0645", "bbox": {"l": 187.79648069635869, "t": 519.9067017970945, "r": 209.58224077714138, "b": 532.8667018418917, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "\u0644\u0627", "bbox": {"l": 209.51744077690105, "t": 519.9067017970945, "r": 216.90465080429323, "b": 532.8667018418917, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": " \u064a\u0645", "bbox": {"l": 216.94353080443742, "t": 519.9067017970945, "r": 235.95586087493606, "b": 532.8667018418917, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "\u0648\u0642\u0644", "bbox": {"l": 235.99474087508025, "t": 519.9067017970945, "r": 254.0609709420707, "b": 532.8667018418917, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "\u0627", "bbox": {"l": 254.09985094221489, "t": 519.9067017970945, "r": 257.54721095499787, "b": 532.8667018418917, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": " \u0627\u0640\u0640\u0640\u0640\u0633\u0646 \u0627 \u0621\u0627\u0640\u0640\u0640\u0640", "bbox": {"l": 362.20999134309267, "t": 508.6766917582771, "r": 428.6688815895255, "b": 521.6366918030742, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "\u0646\u0628", "bbox": {"l": 428.7077615896697, "t": 508.6766917582771, "r": 437.3132016215791, "b": 521.6366918030742, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "\u0631\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0635\u0645", "bbox": {"l": 367.6023913630879, "t": 521.1567018014152, "r": 429.6149015930334, "b": 534.1167018462124, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "\u0644\u0627", "bbox": {"l": 429.5501115927932, "t": 521.1567018014152, "r": 436.93732162018534, "b": 534.1167018462124, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": " \u0639\u0627\u0640\u0640\u0640\u0640\u0640\u0635\u062a", "bbox": {"l": 270.07001100143304, "t": 507.4266917539564, "r": 308.6001011443045, "b": 520.3866917987535, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "\u0627 \u0621\u0627\u0640\u0640\u0640\u0640\u0640", "bbox": {"l": 331.3538212286764, "t": 507.4266917539564, "r": 340.23544126160994, "b": 520.3866917987535, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "\u0646\u0628", "bbox": {"l": 340.2743212617541, "t": 507.4266917539564, "r": 348.8797612936635, "b": 520.3866917987535, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "\u064a\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0633\u0628\u0627", "bbox": {"l": 273.0700110125572, "t": 519.9067017970945, "r": 340.08609126105614, "b": 532.8667018418917, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "\u0646\u062a", "bbox": {"l": 340.0213012608159, "t": 519.9067017970945, "r": 348.6267412927253, "b": 532.8667018418917, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "\u0642\u062a\u0633\u0638\u0627", "bbox": {"l": 85.41600031672677, "t": 508.33670175710193, "r": 117.0141004338941, "b": 521.296691801899, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "\u0642", "bbox": {"l": 129.65334048076102, "t": 508.33670175710193, "r": 135.9729605041945, "b": 521.296691801899, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "\u064a\u0642\u062d\u062a", "bbox": {"l": 136.02480050438672, "t": 508.33670175710193, "r": 160.44144059492484, "b": 521.296691801899, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": " \u0631\u0627 \u0631", "bbox": {"l": 69.09600125621141, "t": 508.33670175710193, "r": 85.41264331671432, "b": 521.296691801899, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "\u064a\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0633\u0627\u064a", "bbox": {"l": 72.09600126733555, "t": 520.81671180024, "r": 138.94359051520973, "b": 533.7767018450371, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "\u0633\u0644\u0627", "bbox": {"l": 138.8787805149694, "t": 520.81671180024, "r": 159.95175059310904, "b": 533.7767018450371, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "picture", "bbox": {"l": 446.4657287597656, "t": 200.7112274169922, "r": 595.0, "b": 650.6431884765625, "coord_origin": "TOPLEFT"}, "confidence": 0.6444889903068542, "cells": [], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "text", "id": 7, "page_no": 0, "cluster": {"id": 7, "label": "text", "bbox": {"l": 47.9520001778084, "t": 804.0922617794021, "r": 58.751999217855335, "b": 818.1322628279323, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 0, "text": "11", "bbox": {"l": 47.9520001778084, "t": 804.0922617794021, "r": 58.751999217855335, "b": 818.1322628279323, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "11"}, {"label": "text", "id": 0, "page_no": 0, "cluster": {"id": 0, "label": "text", "bbox": {"l": 67.9919972521177, "t": 209.65674072469346, "r": 437.42722162200187, "b": 419.32669144943253, "coord_origin": "TOPLEFT"}, "confidence": 0.9685260057449341, "cells": [{"id": 1, "text": " \u060c\u0647\u064a\u0644\u0639\u0648", "bbox": {"l": 399.260011480476, "t": 209.65674072469346, "r": 437.42722162200187, "b": 222.61670076949054, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "\u0645\u0644\u0627 \u0629\u0648\u0627", "bbox": {"l": 101.00520037453231, "t": 209.65674072469346, "r": 126.82584047027652, "b": 222.61670076949054, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "\u0631\u0645\u0644\u0627 \u0644\u0627\u0648\u0644 \u062e\u0648\u0627\u0647\u064a\u064a\u0639", "bbox": {"l": 130.05289048224256, "t": 209.65674072469346, "r": 229.27513085016358, "b": 222.61670076949054, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "\u0648\u0648\u0635", "bbox": {"l": 240.66298089239032, "t": 209.65674072469346, "r": 258.55817095874653, "b": 222.61670076949054, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "\u0639\u0636\u062a", "bbox": {"l": 265.06552098287614, "t": 209.65674072469346, "r": 281.6825010444927, "b": 222.61670076949054, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "\u0629\u064a\u0631\u0635", "bbox": {"l": 286.3310210617297, "t": 209.65674072469346, "r": 314.70044116692486, "b": 222.61670076949054, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "\u0645", "bbox": {"l": 314.739321167069, "t": 209.65674072469346, "r": 323.0726011979693, "b": 222.61670076949054, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "\u0644\u0627", "bbox": {"l": 323.02075119777703, "t": 209.65674072469346, "r": 330.06061122388115, "b": 222.61670076949054, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "\u0629\u0645\u0648\u0643\u062d", "bbox": {"l": 333.2073112355493, "t": 209.65674072469346, "r": 369.27499136929003, "b": 222.61670076949054, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "\u0644\u0627 ", "bbox": {"l": 369.3138713694342, "t": 209.65674072469346, "r": 379.37082140672584, "b": 222.61670076949054, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "\u0646\u0625\u0641", "bbox": {"l": 379.50043140720646, "t": 209.65674072469346, "r": 398.9274614792428, "b": 222.61670076949054, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "\u0629\u0648", "bbox": {"l": 78.1863332899188, "t": 209.65674072469346, "r": 79.31903829411894, "b": 222.61670076949054, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "\u0627\u0628", "bbox": {"l": 79.3838352943592, "t": 209.65674072469346, "r": 88.079994326605, "b": 222.61670076949054, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "\u0644\u0623\u0627", "bbox": {"l": 102.7000003808167, "t": 231.61676080059988, "r": 113.81968042204905, "b": 244.57672084539684, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "\u0646\u0645 \u062f\u062f\u064a \u0642\u064a \u062d\u062a \u0649\u0627\u064a \u0644\u0645\u0639\u0644\u062e\u0628 \u062e\u0627\u0644 \u0629\u064a\u0631", "bbox": {"l": 117.07263043411113, "t": 231.61676080059988, "r": 294.7153310928191, "b": 244.57672084539684, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "\u0648\u0627\u0645", "bbox": {"l": 294.75421109296326, "t": 231.61676080059988, "r": 318.5617411812428, "b": 244.57672084539684, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "\u062c\u0644\u0627", "bbox": {"l": 318.5098911810505, "t": 231.61676080059988, "r": 333.0000912347809, "b": 244.57672084539684, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "\u0633\u064a", "bbox": {"l": 337.2111512503957, "t": 231.61676080059988, "r": 359.59308133338897, "b": 244.57672084539684, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "\u0626\u0631 ", "bbox": {"l": 359.5282913331488, "t": 231.61676080059988, "r": 370.3110413731318, "b": 244.57672084539684, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "\u062f", "bbox": {"l": 370.5443113739967, "t": 231.61676080059988, "r": 377.2187213987458, "b": 244.57672084539684, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "\u064a\u0633\u0644\u0627 \u0641\u064a\u0627\u0643\u062a", "bbox": {"l": 377.25760139888996, "t": 231.61676080059988, "r": 437.04208162057375, "b": 244.57672084539684, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "\u0627", "bbox": {"l": 83.34959430906444, "t": 231.61676080059988, "r": 86.42111232045377, "b": 244.57672084539684, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "\u062f\u0648", "bbox": {"l": 86.48590932069406, "t": 231.61676080059988, "r": 94.70254535116175, "b": 244.57672084539684, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "\u0647", "bbox": {"l": 94.74142535130592, "t": 231.61676080059988, "r": 102.67294038071637, "b": 244.57672084539684, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": " :\u062e\u0627\u0633\u0639\u0631 \u0649\u0627\u064a", "bbox": {"l": 375.9800113941526, "t": 253.45672087609114, "r": 437.31921162160137, "b": 266.4166809208882, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "\u0648\u064a\u0648\u0644\u0648\u0644\u0623\u0627 \u0629\u0648\u0645\u0626\u062e\u0642 \u0633\u0639\u0631 \u0649\u0627", "bbox": {"l": 89.13600233052074, "t": 253.45672087609114, "r": 199.6070607401529, "b": 266.4166809208882, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "\u064a", "bbox": {"l": 199.56818074000876, "t": 253.45672087609114, "r": 206.72209076653579, "b": 266.4166809208882, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "\u064a\u0631\u0635\u0645\u0644\u0627 \u0646\u062e\u0633\u0646\u0644\u0625\u0627 \u0621\u062e\u0647\u0628 ", "bbox": {"l": 222.04082082333838, "t": 253.45672087609114, "r": 321.0293311903927, "b": 266.4166809208882, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "\u0641\u0627\u0645", "bbox": {"l": 321.1459711908252, "t": 253.45672087609114, "r": 342.4485212698161, "b": 266.4166809208882, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "\u0639\u0636\u0648", "bbox": {"l": 348.3749412917916, "t": 253.45672087609114, "r": 375.73349139323847, "b": 266.4166809208882, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "\u060c", "bbox": {"l": 72.94919627049924, "t": 253.45672087609114, "r": 73.94063627417555, "b": 266.4166809208882, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "\u062a\u062e", "bbox": {"l": 73.97951527431972, "t": 253.45672087609114, "r": 89.02607733011313, "b": 266.4166809208882, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": " \u0648\u0648\u0648\u0645\u0646 \u062a\u062d\u062f\u0648\u0648\u0639\u0645 \u0642\u0648\u0648\u064a \u062d\u062a", "bbox": {"l": 67.9919972521177, "t": 275.2967509515828, "r": 179.1887806644409, "b": 288.25671099637975, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "\u0649\u0648\u0648", "bbox": {"l": 190.77632070740808, "t": 275.2967509515828, "r": 192.97821071557277, "b": 288.25671099637975, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "\u0627\u064a", "bbox": {"l": 193.01709071571696, "t": 275.2967509515828, "r": 203.23216075359494, "b": 288.25671099637975, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "\u0644\u0648", "bbox": {"l": 207.64893076997257, "t": 275.2967509515828, "r": 218.53532081033984, "b": 288.25671099637975, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "\u0648\u0645", "bbox": {"l": 217.84845080779291, "t": 275.2967509515828, "r": 227.72397084441184, "b": 288.25671099637975, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "\u0639\u0644\u0627", "bbox": {"l": 227.6721308442196, "t": 275.2967509515828, "r": 241.0490108938217, "b": 288.25671099637975, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "\u060c\u0644\u064a\u0648\u0648\u0627\u0639\u0644\u0644\u0627\u0648 \u0629\u062d\u0648\u0648\u0635\u0644\u0627 \u062a\u062d\u062e\u0648\u0648\u062c\u0645 \u0627\u0648\u0648\u0641 \u0629\u0648\u0648\u0635\u062e\u0644", "bbox": {"l": 233.752530866766, "t": 275.2967509515828, "r": 437.0279516205213, "b": 288.25671099637975, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": " \u0649\u0648\u0648\u0648\u0648\u0627\u064a", "bbox": {"l": 67.9919972521177, "t": 297.16675102717795, "r": 96.06932135622982, "b": 310.126711071975, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "\u062e\u0648\u0648\u0648\u0648 \u062d\u0644\u0627 \u0627 \u0648\u0648\u0648\u0648", "bbox": {"l": 103.08865038225784, "t": 297.16675102717795, "r": 159.24330059048208, "b": 310.126711071975, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "\u0648 \u060c\u062a\u062e\u0648\u0648\u0648\u0648", "bbox": {"l": 187.1299706938872, "t": 297.16675102717795, "r": 197.68263073301702, "b": 310.126711071975, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "\u064a", "bbox": {"l": 197.72151073316118, "t": 297.16675102717795, "r": 204.87543075968827, "b": 310.126711071975, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "\u062e\u0644", "bbox": {"l": 204.91431075983246, "t": 297.16675102717795, "r": 214.81445079654264, "b": 310.126711071975, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "\u0644\u0627", "bbox": {"l": 239.12222088667707, "t": 297.16675102717795, "r": 244.1863409054551, "b": 310.126711071975, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "\u0641\u0648\u0648\u0648\u0648\u0627\u0630\u0639 \u0627\u0648\u0648\u0648\u0648\u0641 \u0629\u0627\u0645\u062e\u0648\u0648\u0648\u0648 \u0648 \u0629\u0645\u0627\u062f\u0644\u0648\u0648\u0648\u0648\u0633\u0645\u0648 \u0629\u0648\u0648\u0648\u0648\u064a\u0648\u0642", "bbox": {"l": 242.73946090009002, "t": 297.16675102717795, "r": 436.91122162008855, "b": 310.126711071975, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "\u0648\u0648", "bbox": {"l": 80.7360002993731, "t": 319.0067111026693, "r": 82.4855963058607, "b": 331.9666711474664, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "\u064a\u0644\u0648\u062f\u0644\u0627\u0648 \u0629\u0648\u0648\u064a\u0645\u064a\u0627\u0642\u0644\u0625\u0627 \u062a\u062e\u064a\u062f\u0648\u0648", "bbox": {"l": 82.52447530600485, "t": 319.0067111026693, "r": 198.30913073534012, "b": 331.9666711474664, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "\u062d\u0644\u0644", "bbox": {"l": 198.34801073548428, "t": 319.0067111026693, "r": 214.84608079665995, "b": 331.9666711474664, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "\u0627 \u0621\u0648\u0648\u0648\u0636 \u0627\u0648\u0648\u0641 \u064a\u0631\u0648\u0648\u0635\u0645\u0644\u0627", "bbox": {"l": 214.79425079646776, "t": 319.0067111026693, "r": 317.88953117875013, "b": 331.9666711474664, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "\u0627\u0645\u0648\u0648\u0648", "bbox": {"l": 330.88440122693584, "t": 319.0067111026693, "r": 342.81308127116796, "b": 331.9666711474664, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": " \u0644\u0627 \u0646\u0648\u0648\u0645\u0644\u0623\u0627 \u062a\u0627\u062f\u062f\u0648\u0648\u062d\u0645", "bbox": {"l": 342.8519612713121, "t": 319.0067111026693, "r": 437.0582616206338, "b": 331.9666711474664, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "\u060c\u0629", "bbox": {"l": 72.94919627049924, "t": 319.0067111026693, "r": 80.6927952992129, "b": 331.9666711474664, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "\u0648\u0648", "bbox": {"l": 86.25599731984153, "t": 340.84671117816094, "r": 88.48510732810718, "b": 353.806701222958, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "\u0627\u0645 \u0629\u0648\u0648\u0639\u0628\u062e\u0644\u0645 \u0631\u0627\u0631\u0645\u0644\u0648\u0648\u0633\u0627\u0648 \u060c\u0629\u064a\u0648\u0648\u0633\u062e\u064a\u0633\u0644\u0627 \u0629 \u0631\u062e\u0648\u0648\u0627\u0645\u0644\u0627 \u0631", "bbox": {"l": 117.17401043448704, "t": 340.84671117816094, "r": 322.67236119648516, "b": 353.806701222958, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "\u064a", "bbox": {"l": 322.7371511967254, "t": 340.84671117816094, "r": 326.5214812107579, "b": 353.806701222958, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "\u0648\u0648", "bbox": {"l": 326.56036121090204, "t": 340.84671117816094, "r": 334.78998124141793, "b": 353.806701222958, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "\u0648", "bbox": {"l": 333.88278123805395, "t": 340.84671117816094, "r": 335.38614124362846, "b": 353.806701222958, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "\u0644\u062a", "bbox": {"l": 335.4250212437726, "t": 340.84671117816094, "r": 348.4161112919443, "b": 353.806701222958, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "\u062f", "bbox": {"l": 354.00964131268535, "t": 340.84671117816094, "r": 359.8286713342626, "b": 353.806701222958, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "\u0648\u0648\u0648\u0627\u0648 \u0629\u0627\u0648\u0648\u0635\u0627\u0648\u0645\u0648", "bbox": {"l": 359.7638913340224, "t": 340.84671117816094, "r": 436.99252162039, "b": 353.806701222958, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "\u062a\u062e", "bbox": {"l": 84.35918431280804, "t": 340.84671117816094, "r": 86.1777573195514, "b": 353.806701222958, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "\u0627\u064a\u0648\u0648\u0648\u0648", "bbox": {"l": 93.20639834561395, "t": 362.68670125365236, "r": 97.68335736221475, "b": 375.6467012984495, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "\u0644\u0627\u0648", "bbox": {"l": 97.72223736235891, "t": 362.68670125365236, "r": 110.05368040808452, "b": 375.6467012984495, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "\u0629\u0648\u0648\u0648\u0641\u062e \u0644\u0627 \u062a\u062e\u0648\u0648\u0648 \u0627\u0645 \u0631\u064a\u0648\u0648\u0648\u0648\u0644\u062a \u060c \u062e\u0648\u0648\u0648\u0647\u0631\u0644\u0625\u0627 \u0629\u0648\u0648\u0648\u062d\u0641\u062e", "bbox": {"l": 107.81160039977077, "t": 362.68670125365236, "r": 319.73993118561157, "b": 375.6467012984495, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "\u0643\u0645\u0648", "bbox": {"l": 319.7788111857557, "t": 362.68670125365236, "r": 336.7513712486908, "b": 375.6467012984495, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "\u0631", "bbox": {"l": 327.4936212143627, "t": 362.68670125365236, "r": 347.5520912887404, "b": 375.6467012984495, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "\u0627\u0631", "bbox": {"l": 347.6039412889327, "t": 362.68670125365236, "r": 355.45767131805474, "b": 375.6467012984495, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "\u0644\u0648\u0648\u0648\u0633\u062d\u0627\u0648 \u0646\u0648\u0648\u0648\u0645\u0644\u0623\u0627", "bbox": {"l": 365.14093135396075, "t": 362.68670125365236, "r": 436.85941161989643, "b": 375.6467012984495, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "\u0644\u064a", "bbox": {"l": 77.3555982868384, "t": 384.52670132914386, "r": 83.62175831007363, "b": 397.486691373941, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "\u0647\u062e\u0648\u0648\u0648 \u0645 \u0648\u0648\u0648\u0633\u0631\u064a \u064a \u0648\u0648\u0648\u0644\u0627 \u0648\u0648\u0648\u0648", "bbox": {"l": 83.56991630988142, "t": 384.52670132914386, "r": 197.09950073085474, "b": 397.486691373941, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "\u062d\u0647\u0644", "bbox": {"l": 197.13838073099893, "t": 384.52670132914386, "r": 213.63646079217463, "b": 397.486691373941, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "\u0627 \u0649\u0648\u0648\u0648\u0627\u064a \u0644\u062f\u0648\u0648\u0648\u0644\u0639\u0645\u0644\u0627 \u0627\u0647\u064a\u062f\u0648\u0648\u0648", "bbox": {"l": 213.58463079198242, "t": 384.52670132914386, "r": 326.4273712104089, "b": 397.486691373941, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "\u0644\u0627", "bbox": {"l": 326.4662512105531, "t": 384.52670132914386, "r": 341.38971126589, "b": 397.486691373941, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "\u062e\u0648\u0648\u0648\u0644\u0628\u0644\u0627\u0648 \u060c\u0627\u0647\u060c\u0648\u0648\u0648\u0648\u0644\u0627", "bbox": {"l": 347.81137128970187, "t": 384.52670132914386, "r": 436.88547161999304, "b": 397.486691373941, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": ".\u0627\u0639\u0645\u0644\u062c\u0645\u0644\u0627 \u0645\u0627\u0633\u0644\u0627\u0648 \u0629\u0647\u060c\u0627\u0648\u0645\u0644\u0627", "bbox": {"l": 284.1600010536794, "t": 406.3667014046354, "r": 437.30203162153765, "b": 419.32669144943253, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u060c\u0647\u064a\u0644\u0639\u0648 \u0645\u0644\u0627 \u0629\u0648\u0627 \u0631\u0645\u0644\u0627 \u0644\u0627\u0648\u0644 \u062e\u0648\u0627\u0647\u064a\u064a\u0639 \u0648\u0648\u0635 \u0639\u0636\u062a \u0629\u064a\u0631\u0635 \u0645 \u0644\u0627 \u0629\u0645\u0648\u0643\u062d \u0644\u0627 \u0646\u0625\u0641 \u0629\u0648 \u0627\u0628 \u0644\u0623\u0627 \u0646\u0645 \u062f\u062f\u064a \u0642\u064a \u062d\u062a \u0649\u0627\u064a \u0644\u0645\u0639\u0644\u062e\u0628 \u062e\u0627\u0644 \u0629\u064a\u0631 \u0648\u0627\u0645 \u062c\u0644\u0627 \u0633\u064a \u0626\u0631 \u062f \u064a\u0633\u0644\u0627 \u0641\u064a\u0627\u0643\u062a \u0627 \u062f\u0648 \u0647 :\u062e\u0627\u0633\u0639\u0631 \u0649\u0627\u064a \u0648\u064a\u0648\u0644\u0648\u0644\u0623\u0627 \u0629\u0648\u0645\u0626\u062e\u0642 \u0633\u0639\u0631 \u0649\u0627 \u064a \u064a\u0631\u0635\u0645\u0644\u0627 \u0646\u062e\u0633\u0646\u0644\u0625\u0627 \u0621\u062e\u0647\u0628 \u0641\u0627\u0645 \u0639\u0636\u0648 \u060c \u062a\u062e \u0648\u0648\u0648\u0645\u0646 \u062a\u062d\u062f\u0648\u0648\u0639\u0645 \u0642\u0648\u0648\u064a \u062d\u062a \u0649\u0648\u0648 \u0627\u064a \u0644\u0648 \u0648\u0645 \u0639\u0644\u0627 \u060c\u0644\u064a\u0648\u0648\u0627\u0639\u0644\u0644\u0627\u0648 \u0629\u062d\u0648\u0648\u0635\u0644\u0627 \u062a\u062d\u062e\u0648\u0648\u062c\u0645 \u0627\u0648\u0648\u0641 \u0629\u0648\u0648\u0635\u062e\u0644 \u0649\u0648\u0648\u0648\u0648\u0627\u064a \u062e\u0648\u0648\u0648\u0648 \u062d\u0644\u0627 \u0627 \u0648\u0648\u0648\u0648 \u0648 \u060c\u062a\u062e\u0648\u0648\u0648\u0648 \u064a \u062e\u0644 \u0644\u0627 \u0641\u0648\u0648\u0648\u0648\u0627\u0630\u0639 \u0627\u0648\u0648\u0648\u0648\u0641 \u0629\u0627\u0645\u062e\u0648\u0648\u0648\u0648 \u0648 \u0629\u0645\u0627\u062f\u0644\u0648\u0648\u0648\u0648\u0633\u0645\u0648 \u0629\u0648\u0648\u0648\u0648\u064a\u0648\u0642 \u0648\u0648 \u064a\u0644\u0648\u062f\u0644\u0627\u0648 \u0629\u0648\u0648\u064a\u0645\u064a\u0627\u0642\u0644\u0625\u0627 \u062a\u062e\u064a\u062f\u0648\u0648 \u062d\u0644\u0644 \u0627 \u0621\u0648\u0648\u0648\u0636 \u0627\u0648\u0648\u0641 \u064a\u0631\u0648\u0648\u0635\u0645\u0644\u0627 \u0627\u0645\u0648\u0648\u0648 \u0644\u0627 \u0646\u0648\u0648\u0645\u0644\u0623\u0627 \u062a\u0627\u062f\u062f\u0648\u0648\u062d\u0645 \u060c\u0629 \u0648\u0648 \u0627\u0645 \u0629\u0648\u0648\u0639\u0628\u062e\u0644\u0645 \u0631\u0627\u0631\u0645\u0644\u0648\u0648\u0633\u0627\u0648 \u060c\u0629\u064a\u0648\u0648\u0633\u062e\u064a\u0633\u0644\u0627 \u0629 \u0631\u062e\u0648\u0648\u0627\u0645\u0644\u0627 \u0631 \u064a \u0648\u0648 \u0648 \u0644\u062a \u062f \u0648\u0648\u0648\u0627\u0648 \u0629\u0627\u0648\u0648\u0635\u0627\u0648\u0645\u0648 \u062a\u062e \u0627\u064a\u0648\u0648\u0648\u0648 \u0644\u0627\u0648 \u0629\u0648\u0648\u0648\u0641\u062e \u0644\u0627 \u062a\u062e\u0648\u0648\u0648 \u0627\u0645 \u0631\u064a\u0648\u0648\u0648\u0648\u0644\u062a \u060c \u062e\u0648\u0648\u0648\u0647\u0631\u0644\u0625\u0627 \u0629\u0648\u0648\u0648\u062d\u0641\u062e \u0643\u0645\u0648 \u0631 \u0627\u0631 \u0644\u0648\u0648\u0648\u0633\u062d\u0627\u0648 \u0646\u0648\u0648\u0648\u0645\u0644\u0623\u0627 \u0644\u064a \u0647\u062e\u0648\u0648\u0648 \u0645 \u0648\u0648\u0648\u0633\u0631\u064a \u064a \u0648\u0648\u0648\u0644\u0627 \u0648\u0648\u0648\u0648 \u062d\u0647\u0644 \u0627 \u0649\u0648\u0648\u0648\u0627\u064a \u0644\u062f\u0648\u0648\u0648\u0644\u0639\u0645\u0644\u0627 \u0627\u0647\u064a\u062f\u0648\u0648\u0648 \u0644\u0627 \u062e\u0648\u0648\u0648\u0644\u0628\u0644\u0627\u0648 \u060c\u0627\u0647\u060c\u0648\u0648\u0648\u0648\u0644\u0627 .\u0627\u0639\u0645\u0644\u062c\u0645\u0644\u0627 \u0645\u0627\u0633\u0644\u0627\u0648 \u0629\u0647\u060c\u0627\u0648\u0645\u0644\u0627"}, {"label": "text", "id": 2, "page_no": 0, "cluster": {"id": 2, "label": "text", "bbox": {"l": 74.51999727632386, "t": 433.9166814998638, "r": 440.883241634817, "b": 465.596681609368, "coord_origin": "TOPLEFT"}, "confidence": 0.9393879771232605, "cells": [{"id": 77, "text": " \u0631\u0648\u0644 \u0644\u0627 \u0644\u0627\u0648\u0644 \u0629\u064a\u0631\u0648", "bbox": {"l": 107.16000039735461, "t": 433.9166814998638, "r": 187.44720069506354, "b": 446.876681544661, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "\u0635", "bbox": {"l": 187.4860806952077, "t": 433.9166814998638, "r": 200.6404907439849, "b": 446.876681544661, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "\u0645", "bbox": {"l": 200.67937074412907, "t": 433.9166814998638, "r": 209.0126507750293, "b": 446.876681544661, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "\u0644\u0627", "bbox": {"l": 208.96082077483712, "t": 433.9166814998638, "r": 216.06721080118794, "b": 446.876681544661, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "\u0629\u0648", "bbox": {"l": 218.09763080871687, "t": 433.9166814998638, "r": 227.2344208425965, "b": 446.876681544661, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "\u0645\u0648\u0643\u062d\u0644\u0627 \u0627\u0645\u062e\u0648\u0646\u0631\u0628", "bbox": {"l": 227.3121808428849, "t": 433.9166814998638, "r": 310.7486611522715, "b": 446.876681544661, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "\u062f\u0627\u0644\u0648\u0633\u064a \u060c\u0642\u0628\u0633 \u062e\u0645\u0644 \u062e\u064b \u0641\u0648\u0648", "bbox": {"l": 321.5573111923505, "t": 433.9166814998638, "r": 440.45236163321925, "b": 446.876681544661, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "2024(", "bbox": {"l": 81.36000130168694, "t": 433.9166814998638, "r": 104.00928038567159, "b": 446.876681544661, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "-", "bbox": {"l": 74.51999727632386, "t": 433.9166814998638, "r": 78.09695428958737, "b": 446.876681544661, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": " )2026", "bbox": {"l": 414.79001153806195, "t": 452.63669156457087, "r": 440.883241634817, "b": 465.596681609368, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "\u0627\u062a\u0644\u0622\u0627 \u0648\u062d\u0647\u0644\u0627 \u0649\u0627\u064a \u0627\u0647\u0648 \u060c\u0629\u0633\u064a\u0626\u0631 \u0629\u064a\u062c\u064a\u062a\u0627\u0631\u0644\u0633\u0627 \u0627\u062f", "bbox": {"l": 113.40000042049283, "t": 452.63669156457087, "r": 336.75259124869535, "b": 465.596681609368, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "\u0647\u0639", "bbox": {"l": 336.7914712488395, "t": 452.63669156457087, "r": 347.26965128769314, "b": 465.596681609368, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "\u0629\u0639\u0628\u0631\u0639 \u0642\u064a \u062d\u062a", "bbox": {"l": 344.2758812765921, "t": 452.63669156457087, "r": 414.4348115367449, "b": 465.596681609368, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": ":", "bbox": {"l": 110.52000040981365, "t": 452.63669156457087, "r": 113.42303042057824, "b": 465.596681609368, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u0631\u0648\u0644 \u0644\u0627 \u0644\u0627\u0648\u0644 \u0629\u064a\u0631\u0648 \u0635 \u0645 \u0644\u0627 \u0629\u0648 \u0645\u0648\u0643\u062d\u0644\u0627 \u0627\u0645\u062e\u0648\u0646\u0631\u0628 \u062f\u0627\u0644\u0648\u0633\u064a \u060c\u0642\u0628\u0633 \u062e\u0645\u0644 \u062e\u064b \u0641\u0648\u0648 2024( -)2026 \u0627\u062a\u0644\u0622\u0627 \u0648\u062d\u0647\u0644\u0627 \u0649\u0627\u064a \u0627\u0647\u0648 \u060c\u0629\u0633\u064a\u0626\u0631 \u0629\u064a\u062c\u064a\u062a\u0627\u0631\u0644\u0633\u0627 \u0627\u062f \u0647\u0639 \u0629\u0639\u0628\u0631\u0639 \u0642\u064a \u062d\u062a :"}, {"label": "text", "id": 1, "page_no": 0, "cluster": {"id": 1, "label": "text", "bbox": {"l": 72.94919627049924, "t": 578.8267220007557, "r": 437.29059162149525, "b": 647.966702239743, "coord_origin": "TOPLEFT"}, "confidence": 0.9558618068695068, "cells": [{"id": 91, "text": "\u062e\u0647\u0644\u0648\u0633\u062d\u062e\u0628 \u0627\u0645\u062e\u0648\u0646\u0631\u0628", "bbox": {"l": 115.18000042709316, "t": 578.8267220007557, "r": 194.85806072254337, "b": 591.7867120455528, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "\u0644\u0627", "bbox": {"l": 194.8062307223512, "t": 578.8267220007557, "r": 205.46582076187747, "b": 591.7867120455528, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "\u062a", "bbox": {"l": 202.42023075058427, "t": 578.8267220007557, "r": 216.12543080140384, "b": 591.7867120455528, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "\u062e\u0641\u062f\u0627\u0644\u0648\u0633\u0645 \u062f\u064a\u062f\u062d\u062a \u0644\u062a \u062f\u0642", "bbox": {"l": 216.15135080149997, "t": 578.8267220007557, "r": 331.91013123073924, "b": 591.7867120455528, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "\u0647\u0646", "bbox": {"l": 337.0552412498176, "t": 578.8267220007557, "r": 347.5528312887431, "b": 591.7867120455528, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "\u0639 \u0649\u0644\u0625", "bbox": {"l": 347.6046812889354, "t": 578.8267220007557, "r": 372.38708138082984, "b": 591.7867120455528, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "\u0631\u062e \u0644\u0625\u0627 \u0631\u062f\u062c\u062a", "bbox": {"l": 382.3000514175876, "t": 578.8267220007557, "r": 436.8213216197552, "b": 591.7867120455528, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "\u0644\u0643\u0648\u0627\u0628 \u062f", "bbox": {"l": 87.43940032422965, "t": 578.8267220007557, "r": 115.1923104271388, "b": 591.7867120455528, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": " \u0631\u0648\u0648\u0648\u0635\u0645 \u0629\u0648", "bbox": {"l": 241.0800008939366, "t": 597.5312820654094, "r": 285.1217710572457, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "\u0648\u0648\u064a \u0631", "bbox": {"l": 285.18668105748645, "t": 597.5312820654094, "r": 302.2865911208937, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "\u062a\u062e", "bbox": {"l": 318.6840811816964, "t": 597.5312820654094, "r": 320.50314118844153, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "\u0641\u062f\u0627\u0644", "bbox": {"l": 320.54208118858594, "t": 597.5312820654094, "r": 347.354031288006, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "\u0648\u0648\u0648", "bbox": {"l": 347.3020912878134, "t": 597.5312820654094, "r": 351.67767130403826, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "\u0633", "bbox": {"l": 351.71661130418266, "t": 597.5312820654094, "r": 365.2199713542538, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "\u0645 \u0649\u0648\u0648\u0648", "bbox": {"l": 365.1550613540131, "t": 597.5312820654094, "r": 388.13672143923026, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "\u0627\u064a \u0633\u064a\u0648\u0648\u0648\u0626\u0631", "bbox": {"l": 388.1756614393746, "t": 597.5312820654094, "r": 437.1642516210267, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "2023", "bbox": {"l": 215.03999079737898, "t": 597.5312820654094, "r": 241.13783089415108, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "\u0631", "bbox": {"l": 73.95381227422442, "t": 597.5312820654094, "r": 75.14617927864577, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "\u0627\u0648\u0648", "bbox": {"l": 75.18513527879021, "t": 597.5312820654094, "r": 86.63702432125439, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "\u0648\u0648", "bbox": {"l": 86.68895732144696, "t": 597.5312820654094, "r": 89.51946333194262, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "\u062d\u0644\u0627", "bbox": {"l": 89.55841833208707, "t": 597.5312820654094, "r": 106.3337403942908, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "\u062a\u062e\u0648\u0648\u0648", "bbox": {"l": 103.28368038298102, "t": 597.5312820654094, "r": 127.52363047286396, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "\u0633\u0627\u0648 \u062a\u062e\u064a\u0648\u0648\u0648\u0635\u0648\u062a\u0648 \u060c", "bbox": {"l": 127.56258047300838, "t": 597.5312820654094, "r": 214.76315079635242, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "\u0643\u064a\u0627\u0644", "bbox": {"l": 91.17600333808515, "t": 616.2866921302387, "r": 114.98352042636462, "b": 629.2467021750359, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "\u0627 \u062a\u062e \u0627\u0648\u0648\u0635\u064a\u0644 \u0627\u0647\u060c\u0648\u0648\u0648\u0644\u0627 \u0627\u0645\u062e\u0648\u0648\u0646\u0631\u0628\u0644\u0627\u0648 \u060c\u062a\u0627\u0631\u0627 ", "bbox": {"l": 114.93168042617239, "t": 616.2866921302387, "r": 303.07190112380573, "b": 629.2467021750359, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "\u0648\u0648\u0648", "bbox": {"l": 303.1107811239498, "t": 616.2866921302387, "r": 311.57367115533066, "b": 629.2467021750359, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "\u0644\u0627", "bbox": {"l": 311.6125511554748, "t": 616.2866921302387, "r": 322.27216119500116, "b": 629.2467021750359, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "\u062a", "bbox": {"l": 319.22656118370793, "t": 616.2866921302387, "r": 332.9317612345275, "b": 629.2467021750359, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "\u062e", "bbox": {"l": 332.9576712346236, "t": 616.2866921302387, "r": 336.7420012486561, "b": 629.2467021750359, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "\u0641\u062f\u0627", "bbox": {"l": 336.78088124880026, "t": 616.2866921302387, "r": 359.1757513318415, "b": 629.2467021750359, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "\u0644\u0648\u0648", "bbox": {"l": 359.2016613319376, "t": 616.2866921302387, "r": 365.26694135442796, "b": 629.2467021750359, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "\u0633\u0645\u0648", "bbox": {"l": 365.3058213545721, "t": 616.2866921302387, "r": 392.46997145529815, "b": 629.2467021750359, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": " \u060c\u0627\u0647\u060c\u0648\u0648\u0648\u0644\u0627", "bbox": {"l": 392.431091455154, "t": 616.2866921302387, "r": 437.0264616205159, "b": 629.2467021750359, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "\u060c\u0629\u0648\u0648", "bbox": {"l": 72.94919627049924, "t": 616.2866921302387, "r": 82.44239030570048, "b": 629.2467021750359, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "\u064a", "bbox": {"l": 82.48127030584465, "t": 616.2866921302387, "r": 86.84879332203964, "b": 629.2467021750359, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "\u0627", "bbox": {"l": 86.79695132184742, "t": 616.2866921302387, "r": 91.12559533789825, "b": 629.2467021750359, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "\u0629\u064a\u0647\u060c", "bbox": {"l": 276.1200010238667, "t": 635.0067021949458, "r": 302.3251311210366, "b": 647.966702239743, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "\u0648\u0644\u0627", "bbox": {"l": 302.27328112084433, "t": 635.0067021949458, "r": 318.1881711798576, "b": 647.966702239743, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "\u062a\u062e", "bbox": {"l": 315.29456116912786, "t": 635.0067021949458, "r": 334.1030612388708, "b": 647.966702239743, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "\u064a", "bbox": {"l": 334.18082123915906, "t": 635.0067021949458, "r": 338.5483412553541, "b": 647.966702239743, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "\u062c\u064a\u062a\u0627", "bbox": {"l": 338.4964912551618, "t": 635.0067021949458, "r": 358.23456132835156, "b": 647.966702239743, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "\u0631\u0644\u0633\u062d\u0627 \u0641\u0627\u0644\u0628\u0645\u0648", "bbox": {"l": 358.2864113285438, "t": 635.0067021949458, "r": 437.29059162149525, "b": 647.966702239743, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": ".", "bbox": {"l": 272.6400110109627, "t": 635.0067021949458, "r": 276.0614610236496, "b": 647.966702239743, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u062e\u0647\u0644\u0648\u0633\u062d\u062e\u0628 \u0627\u0645\u062e\u0648\u0646\u0631\u0628 \u0644\u0627 \u062a \u062e\u0641\u062f\u0627\u0644\u0648\u0633\u0645 \u062f\u064a\u062f\u062d\u062a \u0644\u062a \u062f\u0642 \u0647\u0646 \u0639 \u0649\u0644\u0625 \u0631\u062e \u0644\u0625\u0627 \u0631\u062f\u062c\u062a \u0644\u0643\u0648\u0627\u0628 \u062f \u0631\u0648\u0648\u0648\u0635\u0645 \u0629\u0648 \u0648\u0648\u064a \u0631 \u062a\u062e \u0641\u062f\u0627\u0644 \u0648\u0648\u0648 \u0633 \u0645 \u0649\u0648\u0648\u0648 \u0627\u064a \u0633\u064a\u0648\u0648\u0648\u0626\u0631 2023 \u0631 \u0627\u0648\u0648 \u0648\u0648 \u062d\u0644\u0627 \u062a\u062e\u0648\u0648\u0648 \u0633\u0627\u0648 \u062a\u062e\u064a\u0648\u0648\u0648\u0635\u0648\u062a\u0648 \u060c \u0643\u064a\u0627\u0644 \u0627 \u062a\u062e \u0627\u0648\u0648\u0635\u064a\u0644 \u0627\u0647\u060c\u0648\u0648\u0648\u0644\u0627 \u0627\u0645\u062e\u0648\u0648\u0646\u0631\u0628\u0644\u0627\u0648 \u060c\u062a\u0627\u0631\u0627 \u0648\u0648\u0648 \u0644\u0627 \u062a \u062e \u0641\u062f\u0627 \u0644\u0648\u0648 \u0633\u0645\u0648 \u060c\u0627\u0647\u060c\u0648\u0648\u0648\u0644\u0627 \u060c\u0629\u0648\u0648 \u064a \u0627 \u0629\u064a\u0647\u060c \u0648\u0644\u0627 \u062a\u062e \u064a \u062c\u064a\u062a\u0627 \u0631\u0644\u0633\u062d\u0627 \u0641\u0627\u0644\u0628\u0645\u0648 ."}, {"label": "text", "id": 4, "page_no": 0, "cluster": {"id": 4, "label": "text", "bbox": {"l": 69.09600125621141, "t": 507.4266917539564, "r": 437.3132016215791, "b": 534.1167018462124, "coord_origin": "TOPLEFT"}, "confidence": 0.5769620537757874, "cells": [{"id": 134, "text": " \u0646\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0645", "bbox": {"l": 167.78000062213658, "t": 507.4266917539564, "r": 199.8948707412201, "b": 520.3866917987535, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "\u0645\u0627", "bbox": {"l": 199.92079074131624, "t": 507.4266917539564, "r": 211.63663078475915, "b": 520.3866917987535, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "\u0629\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u064a\u0627", "bbox": {"l": 221.8685508226996, "t": 507.4266917539564, "r": 241.72971089634578, "b": 520.3866917987535, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "\u0645 ", "bbox": {"l": 241.67787089615356, "t": 507.4266917539564, "r": 257.411320954494, "b": 520.3866917987535, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "\u0631\u0640", "bbox": {"l": 179.26880066473763, "t": 519.9067017970945, "r": 187.75760069621452, "b": 532.8667018418917, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "\u0635\u0645", "bbox": {"l": 187.79648069635869, "t": 519.9067017970945, "r": 209.58224077714138, "b": 532.8667018418917, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "\u0644\u0627", "bbox": {"l": 209.51744077690105, "t": 519.9067017970945, "r": 216.90465080429323, "b": 532.8667018418917, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": " \u064a\u0645", "bbox": {"l": 216.94353080443742, "t": 519.9067017970945, "r": 235.95586087493606, "b": 532.8667018418917, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "\u0648\u0642\u0644", "bbox": {"l": 235.99474087508025, "t": 519.9067017970945, "r": 254.0609709420707, "b": 532.8667018418917, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "\u0627", "bbox": {"l": 254.09985094221489, "t": 519.9067017970945, "r": 257.54721095499787, "b": 532.8667018418917, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": " \u0627\u0640\u0640\u0640\u0640\u0633\u0646 \u0627 \u0621\u0627\u0640\u0640\u0640\u0640", "bbox": {"l": 362.20999134309267, "t": 508.6766917582771, "r": 428.6688815895255, "b": 521.6366918030742, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "\u0646\u0628", "bbox": {"l": 428.7077615896697, "t": 508.6766917582771, "r": 437.3132016215791, "b": 521.6366918030742, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "\u0631\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0635\u0645", "bbox": {"l": 367.6023913630879, "t": 521.1567018014152, "r": 429.6149015930334, "b": 534.1167018462124, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "\u0644\u0627", "bbox": {"l": 429.5501115927932, "t": 521.1567018014152, "r": 436.93732162018534, "b": 534.1167018462124, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": " \u0639\u0627\u0640\u0640\u0640\u0640\u0640\u0635\u062a", "bbox": {"l": 270.07001100143304, "t": 507.4266917539564, "r": 308.6001011443045, "b": 520.3866917987535, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "\u0627 \u0621\u0627\u0640\u0640\u0640\u0640\u0640", "bbox": {"l": 331.3538212286764, "t": 507.4266917539564, "r": 340.23544126160994, "b": 520.3866917987535, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "\u0646\u0628", "bbox": {"l": 340.2743212617541, "t": 507.4266917539564, "r": 348.8797612936635, "b": 520.3866917987535, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "\u064a\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0633\u0628\u0627", "bbox": {"l": 273.0700110125572, "t": 519.9067017970945, "r": 340.08609126105614, "b": 532.8667018418917, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "\u0646\u062a", "bbox": {"l": 340.0213012608159, "t": 519.9067017970945, "r": 348.6267412927253, "b": 532.8667018418917, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "\u0642\u062a\u0633\u0638\u0627", "bbox": {"l": 85.41600031672677, "t": 508.33670175710193, "r": 117.0141004338941, "b": 521.296691801899, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "\u0642", "bbox": {"l": 129.65334048076102, "t": 508.33670175710193, "r": 135.9729605041945, "b": 521.296691801899, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "\u064a\u0642\u062d\u062a", "bbox": {"l": 136.02480050438672, "t": 508.33670175710193, "r": 160.44144059492484, "b": 521.296691801899, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": " \u0631\u0627 \u0631", "bbox": {"l": 69.09600125621141, "t": 508.33670175710193, "r": 85.41264331671432, "b": 521.296691801899, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "\u064a\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0633\u0627\u064a", "bbox": {"l": 72.09600126733555, "t": 520.81671180024, "r": 138.94359051520973, "b": 533.7767018450371, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "\u0633\u0644\u0627", "bbox": {"l": 138.8787805149694, "t": 520.81671180024, "r": 159.95175059310904, "b": 533.7767018450371, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u0646\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0645 \u0645\u0627 \u0629\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u064a\u0627 \u0645 \u0631\u0640 \u0635\u0645 \u0644\u0627 \u064a\u0645 \u0648\u0642\u0644 \u0627 \u0627\u0640\u0640\u0640\u0640\u0633\u0646 \u0627 \u0621\u0627\u0640\u0640\u0640\u0640 \u0646\u0628 \u0631\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0635\u0645 \u0644\u0627 \u0639\u0627\u0640\u0640\u0640\u0640\u0640\u0635\u062a \u0627 \u0621\u0627\u0640\u0640\u0640\u0640\u0640 \u0646\u0628 \u064a\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0633\u0628\u0627 \u0646\u062a \u0642\u062a\u0633\u0638\u0627 \u0642 \u064a\u0642\u062d\u062a \u0631\u0627 \u0631 \u064a\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0633\u0627\u064a \u0633\u0644\u0627"}, {"label": "picture", "id": 3, "page_no": 0, "cluster": {"id": 3, "label": "picture", "bbox": {"l": 446.4657287597656, "t": 200.7112274169922, "r": 595.0, "b": 650.6431884765625, "coord_origin": "TOPLEFT"}, "confidence": 0.6444889903068542, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "body": [{"label": "text", "id": 7, "page_no": 0, "cluster": {"id": 7, "label": "text", "bbox": {"l": 47.9520001778084, "t": 804.0922617794021, "r": 58.751999217855335, "b": 818.1322628279323, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 0, "text": "11", "bbox": {"l": 47.9520001778084, "t": 804.0922617794021, "r": 58.751999217855335, "b": 818.1322628279323, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "11"}, {"label": "text", "id": 0, "page_no": 0, "cluster": {"id": 0, "label": "text", "bbox": {"l": 67.9919972521177, "t": 209.65674072469346, "r": 437.42722162200187, "b": 419.32669144943253, "coord_origin": "TOPLEFT"}, "confidence": 0.9685260057449341, "cells": [{"id": 1, "text": " \u060c\u0647\u064a\u0644\u0639\u0648", "bbox": {"l": 399.260011480476, "t": 209.65674072469346, "r": 437.42722162200187, "b": 222.61670076949054, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "\u0645\u0644\u0627 \u0629\u0648\u0627", "bbox": {"l": 101.00520037453231, "t": 209.65674072469346, "r": 126.82584047027652, "b": 222.61670076949054, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "\u0631\u0645\u0644\u0627 \u0644\u0627\u0648\u0644 \u062e\u0648\u0627\u0647\u064a\u064a\u0639", "bbox": {"l": 130.05289048224256, "t": 209.65674072469346, "r": 229.27513085016358, "b": 222.61670076949054, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": "\u0648\u0648\u0635", "bbox": {"l": 240.66298089239032, "t": 209.65674072469346, "r": 258.55817095874653, "b": 222.61670076949054, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "\u0639\u0636\u062a", "bbox": {"l": 265.06552098287614, "t": 209.65674072469346, "r": 281.6825010444927, "b": 222.61670076949054, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": "\u0629\u064a\u0631\u0635", "bbox": {"l": 286.3310210617297, "t": 209.65674072469346, "r": 314.70044116692486, "b": 222.61670076949054, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "\u0645", "bbox": {"l": 314.739321167069, "t": 209.65674072469346, "r": 323.0726011979693, "b": 222.61670076949054, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "\u0644\u0627", "bbox": {"l": 323.02075119777703, "t": 209.65674072469346, "r": 330.06061122388115, "b": 222.61670076949054, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "\u0629\u0645\u0648\u0643\u062d", "bbox": {"l": 333.2073112355493, "t": 209.65674072469346, "r": 369.27499136929003, "b": 222.61670076949054, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "\u0644\u0627 ", "bbox": {"l": 369.3138713694342, "t": 209.65674072469346, "r": 379.37082140672584, "b": 222.61670076949054, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "\u0646\u0625\u0641", "bbox": {"l": 379.50043140720646, "t": 209.65674072469346, "r": 398.9274614792428, "b": 222.61670076949054, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "\u0629\u0648", "bbox": {"l": 78.1863332899188, "t": 209.65674072469346, "r": 79.31903829411894, "b": 222.61670076949054, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "\u0627\u0628", "bbox": {"l": 79.3838352943592, "t": 209.65674072469346, "r": 88.079994326605, "b": 222.61670076949054, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "\u0644\u0623\u0627", "bbox": {"l": 102.7000003808167, "t": 231.61676080059988, "r": 113.81968042204905, "b": 244.57672084539684, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "\u0646\u0645 \u062f\u062f\u064a \u0642\u064a \u062d\u062a \u0649\u0627\u064a \u0644\u0645\u0639\u0644\u062e\u0628 \u062e\u0627\u0644 \u0629\u064a\u0631", "bbox": {"l": 117.07263043411113, "t": 231.61676080059988, "r": 294.7153310928191, "b": 244.57672084539684, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "\u0648\u0627\u0645", "bbox": {"l": 294.75421109296326, "t": 231.61676080059988, "r": 318.5617411812428, "b": 244.57672084539684, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "\u062c\u0644\u0627", "bbox": {"l": 318.5098911810505, "t": 231.61676080059988, "r": 333.0000912347809, "b": 244.57672084539684, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "\u0633\u064a", "bbox": {"l": 337.2111512503957, "t": 231.61676080059988, "r": 359.59308133338897, "b": 244.57672084539684, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "\u0626\u0631 ", "bbox": {"l": 359.5282913331488, "t": 231.61676080059988, "r": 370.3110413731318, "b": 244.57672084539684, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "\u062f", "bbox": {"l": 370.5443113739967, "t": 231.61676080059988, "r": 377.2187213987458, "b": 244.57672084539684, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "\u064a\u0633\u0644\u0627 \u0641\u064a\u0627\u0643\u062a", "bbox": {"l": 377.25760139888996, "t": 231.61676080059988, "r": 437.04208162057375, "b": 244.57672084539684, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "\u0627", "bbox": {"l": 83.34959430906444, "t": 231.61676080059988, "r": 86.42111232045377, "b": 244.57672084539684, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": "\u062f\u0648", "bbox": {"l": 86.48590932069406, "t": 231.61676080059988, "r": 94.70254535116175, "b": 244.57672084539684, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "\u0647", "bbox": {"l": 94.74142535130592, "t": 231.61676080059988, "r": 102.67294038071637, "b": 244.57672084539684, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": " :\u062e\u0627\u0633\u0639\u0631 \u0649\u0627\u064a", "bbox": {"l": 375.9800113941526, "t": 253.45672087609114, "r": 437.31921162160137, "b": 266.4166809208882, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "\u0648\u064a\u0648\u0644\u0648\u0644\u0623\u0627 \u0629\u0648\u0645\u0626\u062e\u0642 \u0633\u0639\u0631 \u0649\u0627", "bbox": {"l": 89.13600233052074, "t": 253.45672087609114, "r": 199.6070607401529, "b": 266.4166809208882, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "\u064a", "bbox": {"l": 199.56818074000876, "t": 253.45672087609114, "r": 206.72209076653579, "b": 266.4166809208882, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "\u064a\u0631\u0635\u0645\u0644\u0627 \u0646\u062e\u0633\u0646\u0644\u0625\u0627 \u0621\u062e\u0647\u0628 ", "bbox": {"l": 222.04082082333838, "t": 253.45672087609114, "r": 321.0293311903927, "b": 266.4166809208882, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "\u0641\u0627\u0645", "bbox": {"l": 321.1459711908252, "t": 253.45672087609114, "r": 342.4485212698161, "b": 266.4166809208882, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "\u0639\u0636\u0648", "bbox": {"l": 348.3749412917916, "t": 253.45672087609114, "r": 375.73349139323847, "b": 266.4166809208882, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": "\u060c", "bbox": {"l": 72.94919627049924, "t": 253.45672087609114, "r": 73.94063627417555, "b": 266.4166809208882, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "\u062a\u062e", "bbox": {"l": 73.97951527431972, "t": 253.45672087609114, "r": 89.02607733011313, "b": 266.4166809208882, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": " \u0648\u0648\u0648\u0645\u0646 \u062a\u062d\u062f\u0648\u0648\u0639\u0645 \u0642\u0648\u0648\u064a \u062d\u062a", "bbox": {"l": 67.9919972521177, "t": 275.2967509515828, "r": 179.1887806644409, "b": 288.25671099637975, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "\u0649\u0648\u0648", "bbox": {"l": 190.77632070740808, "t": 275.2967509515828, "r": 192.97821071557277, "b": 288.25671099637975, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "\u0627\u064a", "bbox": {"l": 193.01709071571696, "t": 275.2967509515828, "r": 203.23216075359494, "b": 288.25671099637975, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "\u0644\u0648", "bbox": {"l": 207.64893076997257, "t": 275.2967509515828, "r": 218.53532081033984, "b": 288.25671099637975, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": "\u0648\u0645", "bbox": {"l": 217.84845080779291, "t": 275.2967509515828, "r": 227.72397084441184, "b": 288.25671099637975, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "\u0639\u0644\u0627", "bbox": {"l": 227.6721308442196, "t": 275.2967509515828, "r": 241.0490108938217, "b": 288.25671099637975, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": "\u060c\u0644\u064a\u0648\u0648\u0627\u0639\u0644\u0644\u0627\u0648 \u0629\u062d\u0648\u0648\u0635\u0644\u0627 \u062a\u062d\u062e\u0648\u0648\u062c\u0645 \u0627\u0648\u0648\u0641 \u0629\u0648\u0648\u0635\u062e\u0644", "bbox": {"l": 233.752530866766, "t": 275.2967509515828, "r": 437.0279516205213, "b": 288.25671099637975, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": " \u0649\u0648\u0648\u0648\u0648\u0627\u064a", "bbox": {"l": 67.9919972521177, "t": 297.16675102717795, "r": 96.06932135622982, "b": 310.126711071975, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": "\u062e\u0648\u0648\u0648\u0648 \u062d\u0644\u0627 \u0627 \u0648\u0648\u0648\u0648", "bbox": {"l": 103.08865038225784, "t": 297.16675102717795, "r": 159.24330059048208, "b": 310.126711071975, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "\u0648 \u060c\u062a\u062e\u0648\u0648\u0648\u0648", "bbox": {"l": 187.1299706938872, "t": 297.16675102717795, "r": 197.68263073301702, "b": 310.126711071975, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": "\u064a", "bbox": {"l": 197.72151073316118, "t": 297.16675102717795, "r": 204.87543075968827, "b": 310.126711071975, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "\u062e\u0644", "bbox": {"l": 204.91431075983246, "t": 297.16675102717795, "r": 214.81445079654264, "b": 310.126711071975, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": "\u0644\u0627", "bbox": {"l": 239.12222088667707, "t": 297.16675102717795, "r": 244.1863409054551, "b": 310.126711071975, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "\u0641\u0648\u0648\u0648\u0648\u0627\u0630\u0639 \u0627\u0648\u0648\u0648\u0648\u0641 \u0629\u0627\u0645\u062e\u0648\u0648\u0648\u0648 \u0648 \u0629\u0645\u0627\u062f\u0644\u0648\u0648\u0648\u0648\u0633\u0645\u0648 \u0629\u0648\u0648\u0648\u0648\u064a\u0648\u0642", "bbox": {"l": 242.73946090009002, "t": 297.16675102717795, "r": 436.91122162008855, "b": 310.126711071975, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": "\u0648\u0648", "bbox": {"l": 80.7360002993731, "t": 319.0067111026693, "r": 82.4855963058607, "b": 331.9666711474664, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "\u064a\u0644\u0648\u062f\u0644\u0627\u0648 \u0629\u0648\u0648\u064a\u0645\u064a\u0627\u0642\u0644\u0625\u0627 \u062a\u062e\u064a\u062f\u0648\u0648", "bbox": {"l": 82.52447530600485, "t": 319.0067111026693, "r": 198.30913073534012, "b": 331.9666711474664, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": "\u062d\u0644\u0644", "bbox": {"l": 198.34801073548428, "t": 319.0067111026693, "r": 214.84608079665995, "b": 331.9666711474664, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": "\u0627 \u0621\u0648\u0648\u0648\u0636 \u0627\u0648\u0648\u0641 \u064a\u0631\u0648\u0648\u0635\u0645\u0644\u0627", "bbox": {"l": 214.79425079646776, "t": 319.0067111026693, "r": 317.88953117875013, "b": 331.9666711474664, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "\u0627\u0645\u0648\u0648\u0648", "bbox": {"l": 330.88440122693584, "t": 319.0067111026693, "r": 342.81308127116796, "b": 331.9666711474664, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": " \u0644\u0627 \u0646\u0648\u0648\u0645\u0644\u0623\u0627 \u062a\u0627\u062f\u062f\u0648\u0648\u062d\u0645", "bbox": {"l": 342.8519612713121, "t": 319.0067111026693, "r": 437.0582616206338, "b": 331.9666711474664, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "\u060c\u0629", "bbox": {"l": 72.94919627049924, "t": 319.0067111026693, "r": 80.6927952992129, "b": 331.9666711474664, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "\u0648\u0648", "bbox": {"l": 86.25599731984153, "t": 340.84671117816094, "r": 88.48510732810718, "b": 353.806701222958, "coord_origin": "TOPLEFT"}}, {"id": 55, "text": "\u0627\u0645 \u0629\u0648\u0648\u0639\u0628\u062e\u0644\u0645 \u0631\u0627\u0631\u0645\u0644\u0648\u0648\u0633\u0627\u0648 \u060c\u0629\u064a\u0648\u0648\u0633\u062e\u064a\u0633\u0644\u0627 \u0629 \u0631\u062e\u0648\u0648\u0627\u0645\u0644\u0627 \u0631", "bbox": {"l": 117.17401043448704, "t": 340.84671117816094, "r": 322.67236119648516, "b": 353.806701222958, "coord_origin": "TOPLEFT"}}, {"id": 56, "text": "\u064a", "bbox": {"l": 322.7371511967254, "t": 340.84671117816094, "r": 326.5214812107579, "b": 353.806701222958, "coord_origin": "TOPLEFT"}}, {"id": 57, "text": "\u0648\u0648", "bbox": {"l": 326.56036121090204, "t": 340.84671117816094, "r": 334.78998124141793, "b": 353.806701222958, "coord_origin": "TOPLEFT"}}, {"id": 58, "text": "\u0648", "bbox": {"l": 333.88278123805395, "t": 340.84671117816094, "r": 335.38614124362846, "b": 353.806701222958, "coord_origin": "TOPLEFT"}}, {"id": 59, "text": "\u0644\u062a", "bbox": {"l": 335.4250212437726, "t": 340.84671117816094, "r": 348.4161112919443, "b": 353.806701222958, "coord_origin": "TOPLEFT"}}, {"id": 60, "text": "\u062f", "bbox": {"l": 354.00964131268535, "t": 340.84671117816094, "r": 359.8286713342626, "b": 353.806701222958, "coord_origin": "TOPLEFT"}}, {"id": 61, "text": "\u0648\u0648\u0648\u0627\u0648 \u0629\u0627\u0648\u0648\u0635\u0627\u0648\u0645\u0648", "bbox": {"l": 359.7638913340224, "t": 340.84671117816094, "r": 436.99252162039, "b": 353.806701222958, "coord_origin": "TOPLEFT"}}, {"id": 62, "text": "\u062a\u062e", "bbox": {"l": 84.35918431280804, "t": 340.84671117816094, "r": 86.1777573195514, "b": 353.806701222958, "coord_origin": "TOPLEFT"}}, {"id": 63, "text": "\u0627\u064a\u0648\u0648\u0648\u0648", "bbox": {"l": 93.20639834561395, "t": 362.68670125365236, "r": 97.68335736221475, "b": 375.6467012984495, "coord_origin": "TOPLEFT"}}, {"id": 64, "text": "\u0644\u0627\u0648", "bbox": {"l": 97.72223736235891, "t": 362.68670125365236, "r": 110.05368040808452, "b": 375.6467012984495, "coord_origin": "TOPLEFT"}}, {"id": 65, "text": "\u0629\u0648\u0648\u0648\u0641\u062e \u0644\u0627 \u062a\u062e\u0648\u0648\u0648 \u0627\u0645 \u0631\u064a\u0648\u0648\u0648\u0648\u0644\u062a \u060c \u062e\u0648\u0648\u0648\u0647\u0631\u0644\u0625\u0627 \u0629\u0648\u0648\u0648\u062d\u0641\u062e", "bbox": {"l": 107.81160039977077, "t": 362.68670125365236, "r": 319.73993118561157, "b": 375.6467012984495, "coord_origin": "TOPLEFT"}}, {"id": 66, "text": "\u0643\u0645\u0648", "bbox": {"l": 319.7788111857557, "t": 362.68670125365236, "r": 336.7513712486908, "b": 375.6467012984495, "coord_origin": "TOPLEFT"}}, {"id": 67, "text": "\u0631", "bbox": {"l": 327.4936212143627, "t": 362.68670125365236, "r": 347.5520912887404, "b": 375.6467012984495, "coord_origin": "TOPLEFT"}}, {"id": 68, "text": "\u0627\u0631", "bbox": {"l": 347.6039412889327, "t": 362.68670125365236, "r": 355.45767131805474, "b": 375.6467012984495, "coord_origin": "TOPLEFT"}}, {"id": 69, "text": "\u0644\u0648\u0648\u0648\u0633\u062d\u0627\u0648 \u0646\u0648\u0648\u0648\u0645\u0644\u0623\u0627", "bbox": {"l": 365.14093135396075, "t": 362.68670125365236, "r": 436.85941161989643, "b": 375.6467012984495, "coord_origin": "TOPLEFT"}}, {"id": 70, "text": "\u0644\u064a", "bbox": {"l": 77.3555982868384, "t": 384.52670132914386, "r": 83.62175831007363, "b": 397.486691373941, "coord_origin": "TOPLEFT"}}, {"id": 71, "text": "\u0647\u062e\u0648\u0648\u0648 \u0645 \u0648\u0648\u0648\u0633\u0631\u064a \u064a \u0648\u0648\u0648\u0644\u0627 \u0648\u0648\u0648\u0648", "bbox": {"l": 83.56991630988142, "t": 384.52670132914386, "r": 197.09950073085474, "b": 397.486691373941, "coord_origin": "TOPLEFT"}}, {"id": 72, "text": "\u062d\u0647\u0644", "bbox": {"l": 197.13838073099893, "t": 384.52670132914386, "r": 213.63646079217463, "b": 397.486691373941, "coord_origin": "TOPLEFT"}}, {"id": 73, "text": "\u0627 \u0649\u0648\u0648\u0648\u0627\u064a \u0644\u062f\u0648\u0648\u0648\u0644\u0639\u0645\u0644\u0627 \u0627\u0647\u064a\u062f\u0648\u0648\u0648", "bbox": {"l": 213.58463079198242, "t": 384.52670132914386, "r": 326.4273712104089, "b": 397.486691373941, "coord_origin": "TOPLEFT"}}, {"id": 74, "text": "\u0644\u0627", "bbox": {"l": 326.4662512105531, "t": 384.52670132914386, "r": 341.38971126589, "b": 397.486691373941, "coord_origin": "TOPLEFT"}}, {"id": 75, "text": "\u062e\u0648\u0648\u0648\u0644\u0628\u0644\u0627\u0648 \u060c\u0627\u0647\u060c\u0648\u0648\u0648\u0648\u0644\u0627", "bbox": {"l": 347.81137128970187, "t": 384.52670132914386, "r": 436.88547161999304, "b": 397.486691373941, "coord_origin": "TOPLEFT"}}, {"id": 76, "text": ".\u0627\u0639\u0645\u0644\u062c\u0645\u0644\u0627 \u0645\u0627\u0633\u0644\u0627\u0648 \u0629\u0647\u060c\u0627\u0648\u0645\u0644\u0627", "bbox": {"l": 284.1600010536794, "t": 406.3667014046354, "r": 437.30203162153765, "b": 419.32669144943253, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u060c\u0647\u064a\u0644\u0639\u0648 \u0645\u0644\u0627 \u0629\u0648\u0627 \u0631\u0645\u0644\u0627 \u0644\u0627\u0648\u0644 \u062e\u0648\u0627\u0647\u064a\u064a\u0639 \u0648\u0648\u0635 \u0639\u0636\u062a \u0629\u064a\u0631\u0635 \u0645 \u0644\u0627 \u0629\u0645\u0648\u0643\u062d \u0644\u0627 \u0646\u0625\u0641 \u0629\u0648 \u0627\u0628 \u0644\u0623\u0627 \u0646\u0645 \u062f\u062f\u064a \u0642\u064a \u062d\u062a \u0649\u0627\u064a \u0644\u0645\u0639\u0644\u062e\u0628 \u062e\u0627\u0644 \u0629\u064a\u0631 \u0648\u0627\u0645 \u062c\u0644\u0627 \u0633\u064a \u0626\u0631 \u062f \u064a\u0633\u0644\u0627 \u0641\u064a\u0627\u0643\u062a \u0627 \u062f\u0648 \u0647 :\u062e\u0627\u0633\u0639\u0631 \u0649\u0627\u064a \u0648\u064a\u0648\u0644\u0648\u0644\u0623\u0627 \u0629\u0648\u0645\u0626\u062e\u0642 \u0633\u0639\u0631 \u0649\u0627 \u064a \u064a\u0631\u0635\u0645\u0644\u0627 \u0646\u062e\u0633\u0646\u0644\u0625\u0627 \u0621\u062e\u0647\u0628 \u0641\u0627\u0645 \u0639\u0636\u0648 \u060c \u062a\u062e \u0648\u0648\u0648\u0645\u0646 \u062a\u062d\u062f\u0648\u0648\u0639\u0645 \u0642\u0648\u0648\u064a \u062d\u062a \u0649\u0648\u0648 \u0627\u064a \u0644\u0648 \u0648\u0645 \u0639\u0644\u0627 \u060c\u0644\u064a\u0648\u0648\u0627\u0639\u0644\u0644\u0627\u0648 \u0629\u062d\u0648\u0648\u0635\u0644\u0627 \u062a\u062d\u062e\u0648\u0648\u062c\u0645 \u0627\u0648\u0648\u0641 \u0629\u0648\u0648\u0635\u062e\u0644 \u0649\u0648\u0648\u0648\u0648\u0627\u064a \u062e\u0648\u0648\u0648\u0648 \u062d\u0644\u0627 \u0627 \u0648\u0648\u0648\u0648 \u0648 \u060c\u062a\u062e\u0648\u0648\u0648\u0648 \u064a \u062e\u0644 \u0644\u0627 \u0641\u0648\u0648\u0648\u0648\u0627\u0630\u0639 \u0627\u0648\u0648\u0648\u0648\u0641 \u0629\u0627\u0645\u062e\u0648\u0648\u0648\u0648 \u0648 \u0629\u0645\u0627\u062f\u0644\u0648\u0648\u0648\u0648\u0633\u0645\u0648 \u0629\u0648\u0648\u0648\u0648\u064a\u0648\u0642 \u0648\u0648 \u064a\u0644\u0648\u062f\u0644\u0627\u0648 \u0629\u0648\u0648\u064a\u0645\u064a\u0627\u0642\u0644\u0625\u0627 \u062a\u062e\u064a\u062f\u0648\u0648 \u062d\u0644\u0644 \u0627 \u0621\u0648\u0648\u0648\u0636 \u0627\u0648\u0648\u0641 \u064a\u0631\u0648\u0648\u0635\u0645\u0644\u0627 \u0627\u0645\u0648\u0648\u0648 \u0644\u0627 \u0646\u0648\u0648\u0645\u0644\u0623\u0627 \u062a\u0627\u062f\u062f\u0648\u0648\u062d\u0645 \u060c\u0629 \u0648\u0648 \u0627\u0645 \u0629\u0648\u0648\u0639\u0628\u062e\u0644\u0645 \u0631\u0627\u0631\u0645\u0644\u0648\u0648\u0633\u0627\u0648 \u060c\u0629\u064a\u0648\u0648\u0633\u062e\u064a\u0633\u0644\u0627 \u0629 \u0631\u062e\u0648\u0648\u0627\u0645\u0644\u0627 \u0631 \u064a \u0648\u0648 \u0648 \u0644\u062a \u062f \u0648\u0648\u0648\u0627\u0648 \u0629\u0627\u0648\u0648\u0635\u0627\u0648\u0645\u0648 \u062a\u062e \u0627\u064a\u0648\u0648\u0648\u0648 \u0644\u0627\u0648 \u0629\u0648\u0648\u0648\u0641\u062e \u0644\u0627 \u062a\u062e\u0648\u0648\u0648 \u0627\u0645 \u0631\u064a\u0648\u0648\u0648\u0648\u0644\u062a \u060c \u062e\u0648\u0648\u0648\u0647\u0631\u0644\u0625\u0627 \u0629\u0648\u0648\u0648\u062d\u0641\u062e \u0643\u0645\u0648 \u0631 \u0627\u0631 \u0644\u0648\u0648\u0648\u0633\u062d\u0627\u0648 \u0646\u0648\u0648\u0648\u0645\u0644\u0623\u0627 \u0644\u064a \u0647\u062e\u0648\u0648\u0648 \u0645 \u0648\u0648\u0648\u0633\u0631\u064a \u064a \u0648\u0648\u0648\u0644\u0627 \u0648\u0648\u0648\u0648 \u062d\u0647\u0644 \u0627 \u0649\u0648\u0648\u0648\u0627\u064a \u0644\u062f\u0648\u0648\u0648\u0644\u0639\u0645\u0644\u0627 \u0627\u0647\u064a\u062f\u0648\u0648\u0648 \u0644\u0627 \u062e\u0648\u0648\u0648\u0644\u0628\u0644\u0627\u0648 \u060c\u0627\u0647\u060c\u0648\u0648\u0648\u0648\u0644\u0627 .\u0627\u0639\u0645\u0644\u062c\u0645\u0644\u0627 \u0645\u0627\u0633\u0644\u0627\u0648 \u0629\u0647\u060c\u0627\u0648\u0645\u0644\u0627"}, {"label": "text", "id": 2, "page_no": 0, "cluster": {"id": 2, "label": "text", "bbox": {"l": 74.51999727632386, "t": 433.9166814998638, "r": 440.883241634817, "b": 465.596681609368, "coord_origin": "TOPLEFT"}, "confidence": 0.9393879771232605, "cells": [{"id": 77, "text": " \u0631\u0648\u0644 \u0644\u0627 \u0644\u0627\u0648\u0644 \u0629\u064a\u0631\u0648", "bbox": {"l": 107.16000039735461, "t": 433.9166814998638, "r": 187.44720069506354, "b": 446.876681544661, "coord_origin": "TOPLEFT"}}, {"id": 78, "text": "\u0635", "bbox": {"l": 187.4860806952077, "t": 433.9166814998638, "r": 200.6404907439849, "b": 446.876681544661, "coord_origin": "TOPLEFT"}}, {"id": 79, "text": "\u0645", "bbox": {"l": 200.67937074412907, "t": 433.9166814998638, "r": 209.0126507750293, "b": 446.876681544661, "coord_origin": "TOPLEFT"}}, {"id": 80, "text": "\u0644\u0627", "bbox": {"l": 208.96082077483712, "t": 433.9166814998638, "r": 216.06721080118794, "b": 446.876681544661, "coord_origin": "TOPLEFT"}}, {"id": 81, "text": "\u0629\u0648", "bbox": {"l": 218.09763080871687, "t": 433.9166814998638, "r": 227.2344208425965, "b": 446.876681544661, "coord_origin": "TOPLEFT"}}, {"id": 82, "text": "\u0645\u0648\u0643\u062d\u0644\u0627 \u0627\u0645\u062e\u0648\u0646\u0631\u0628", "bbox": {"l": 227.3121808428849, "t": 433.9166814998638, "r": 310.7486611522715, "b": 446.876681544661, "coord_origin": "TOPLEFT"}}, {"id": 83, "text": "\u062f\u0627\u0644\u0648\u0633\u064a \u060c\u0642\u0628\u0633 \u062e\u0645\u0644 \u062e\u064b \u0641\u0648\u0648", "bbox": {"l": 321.5573111923505, "t": 433.9166814998638, "r": 440.45236163321925, "b": 446.876681544661, "coord_origin": "TOPLEFT"}}, {"id": 84, "text": "2024(", "bbox": {"l": 81.36000130168694, "t": 433.9166814998638, "r": 104.00928038567159, "b": 446.876681544661, "coord_origin": "TOPLEFT"}}, {"id": 85, "text": "-", "bbox": {"l": 74.51999727632386, "t": 433.9166814998638, "r": 78.09695428958737, "b": 446.876681544661, "coord_origin": "TOPLEFT"}}, {"id": 86, "text": " )2026", "bbox": {"l": 414.79001153806195, "t": 452.63669156457087, "r": 440.883241634817, "b": 465.596681609368, "coord_origin": "TOPLEFT"}}, {"id": 87, "text": "\u0627\u062a\u0644\u0622\u0627 \u0648\u062d\u0647\u0644\u0627 \u0649\u0627\u064a \u0627\u0647\u0648 \u060c\u0629\u0633\u064a\u0626\u0631 \u0629\u064a\u062c\u064a\u062a\u0627\u0631\u0644\u0633\u0627 \u0627\u062f", "bbox": {"l": 113.40000042049283, "t": 452.63669156457087, "r": 336.75259124869535, "b": 465.596681609368, "coord_origin": "TOPLEFT"}}, {"id": 88, "text": "\u0647\u0639", "bbox": {"l": 336.7914712488395, "t": 452.63669156457087, "r": 347.26965128769314, "b": 465.596681609368, "coord_origin": "TOPLEFT"}}, {"id": 89, "text": "\u0629\u0639\u0628\u0631\u0639 \u0642\u064a \u062d\u062a", "bbox": {"l": 344.2758812765921, "t": 452.63669156457087, "r": 414.4348115367449, "b": 465.596681609368, "coord_origin": "TOPLEFT"}}, {"id": 90, "text": ":", "bbox": {"l": 110.52000040981365, "t": 452.63669156457087, "r": 113.42303042057824, "b": 465.596681609368, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u0631\u0648\u0644 \u0644\u0627 \u0644\u0627\u0648\u0644 \u0629\u064a\u0631\u0648 \u0635 \u0645 \u0644\u0627 \u0629\u0648 \u0645\u0648\u0643\u062d\u0644\u0627 \u0627\u0645\u062e\u0648\u0646\u0631\u0628 \u062f\u0627\u0644\u0648\u0633\u064a \u060c\u0642\u0628\u0633 \u062e\u0645\u0644 \u062e\u064b \u0641\u0648\u0648 2024( -)2026 \u0627\u062a\u0644\u0622\u0627 \u0648\u062d\u0647\u0644\u0627 \u0649\u0627\u064a \u0627\u0647\u0648 \u060c\u0629\u0633\u064a\u0626\u0631 \u0629\u064a\u062c\u064a\u062a\u0627\u0631\u0644\u0633\u0627 \u0627\u062f \u0647\u0639 \u0629\u0639\u0628\u0631\u0639 \u0642\u064a \u062d\u062a :"}, {"label": "text", "id": 1, "page_no": 0, "cluster": {"id": 1, "label": "text", "bbox": {"l": 72.94919627049924, "t": 578.8267220007557, "r": 437.29059162149525, "b": 647.966702239743, "coord_origin": "TOPLEFT"}, "confidence": 0.9558618068695068, "cells": [{"id": 91, "text": "\u062e\u0647\u0644\u0648\u0633\u062d\u062e\u0628 \u0627\u0645\u062e\u0648\u0646\u0631\u0628", "bbox": {"l": 115.18000042709316, "t": 578.8267220007557, "r": 194.85806072254337, "b": 591.7867120455528, "coord_origin": "TOPLEFT"}}, {"id": 92, "text": "\u0644\u0627", "bbox": {"l": 194.8062307223512, "t": 578.8267220007557, "r": 205.46582076187747, "b": 591.7867120455528, "coord_origin": "TOPLEFT"}}, {"id": 93, "text": "\u062a", "bbox": {"l": 202.42023075058427, "t": 578.8267220007557, "r": 216.12543080140384, "b": 591.7867120455528, "coord_origin": "TOPLEFT"}}, {"id": 94, "text": "\u062e\u0641\u062f\u0627\u0644\u0648\u0633\u0645 \u062f\u064a\u062f\u062d\u062a \u0644\u062a \u062f\u0642", "bbox": {"l": 216.15135080149997, "t": 578.8267220007557, "r": 331.91013123073924, "b": 591.7867120455528, "coord_origin": "TOPLEFT"}}, {"id": 95, "text": "\u0647\u0646", "bbox": {"l": 337.0552412498176, "t": 578.8267220007557, "r": 347.5528312887431, "b": 591.7867120455528, "coord_origin": "TOPLEFT"}}, {"id": 96, "text": "\u0639 \u0649\u0644\u0625", "bbox": {"l": 347.6046812889354, "t": 578.8267220007557, "r": 372.38708138082984, "b": 591.7867120455528, "coord_origin": "TOPLEFT"}}, {"id": 97, "text": "\u0631\u062e \u0644\u0625\u0627 \u0631\u062f\u062c\u062a", "bbox": {"l": 382.3000514175876, "t": 578.8267220007557, "r": 436.8213216197552, "b": 591.7867120455528, "coord_origin": "TOPLEFT"}}, {"id": 98, "text": "\u0644\u0643\u0648\u0627\u0628 \u062f", "bbox": {"l": 87.43940032422965, "t": 578.8267220007557, "r": 115.1923104271388, "b": 591.7867120455528, "coord_origin": "TOPLEFT"}}, {"id": 99, "text": " \u0631\u0648\u0648\u0648\u0635\u0645 \u0629\u0648", "bbox": {"l": 241.0800008939366, "t": 597.5312820654094, "r": 285.1217710572457, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 100, "text": "\u0648\u0648\u064a \u0631", "bbox": {"l": 285.18668105748645, "t": 597.5312820654094, "r": 302.2865911208937, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 101, "text": "\u062a\u062e", "bbox": {"l": 318.6840811816964, "t": 597.5312820654094, "r": 320.50314118844153, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 102, "text": "\u0641\u062f\u0627\u0644", "bbox": {"l": 320.54208118858594, "t": 597.5312820654094, "r": 347.354031288006, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 103, "text": "\u0648\u0648\u0648", "bbox": {"l": 347.3020912878134, "t": 597.5312820654094, "r": 351.67767130403826, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 104, "text": "\u0633", "bbox": {"l": 351.71661130418266, "t": 597.5312820654094, "r": 365.2199713542538, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 105, "text": "\u0645 \u0649\u0648\u0648\u0648", "bbox": {"l": 365.1550613540131, "t": 597.5312820654094, "r": 388.13672143923026, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 106, "text": "\u0627\u064a \u0633\u064a\u0648\u0648\u0648\u0626\u0631", "bbox": {"l": 388.1756614393746, "t": 597.5312820654094, "r": 437.1642516210267, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 107, "text": "2023", "bbox": {"l": 215.03999079737898, "t": 597.5312820654094, "r": 241.13783089415108, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 108, "text": "\u0631", "bbox": {"l": 73.95381227422442, "t": 597.5312820654094, "r": 75.14617927864577, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 109, "text": "\u0627\u0648\u0648", "bbox": {"l": 75.18513527879021, "t": 597.5312820654094, "r": 86.63702432125439, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 110, "text": "\u0648\u0648", "bbox": {"l": 86.68895732144696, "t": 597.5312820654094, "r": 89.51946333194262, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 111, "text": "\u062d\u0644\u0627", "bbox": {"l": 89.55841833208707, "t": 597.5312820654094, "r": 106.3337403942908, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 112, "text": "\u062a\u062e\u0648\u0648\u0648", "bbox": {"l": 103.28368038298102, "t": 597.5312820654094, "r": 127.52363047286396, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 113, "text": "\u0633\u0627\u0648 \u062a\u062e\u064a\u0648\u0648\u0648\u0635\u0648\u062a\u0648 \u060c", "bbox": {"l": 127.56258047300838, "t": 597.5312820654094, "r": 214.76315079635242, "b": 610.5152721102894, "coord_origin": "TOPLEFT"}}, {"id": 114, "text": "\u0643\u064a\u0627\u0644", "bbox": {"l": 91.17600333808515, "t": 616.2866921302387, "r": 114.98352042636462, "b": 629.2467021750359, "coord_origin": "TOPLEFT"}}, {"id": 115, "text": "\u0627 \u062a\u062e \u0627\u0648\u0648\u0635\u064a\u0644 \u0627\u0647\u060c\u0648\u0648\u0648\u0644\u0627 \u0627\u0645\u062e\u0648\u0648\u0646\u0631\u0628\u0644\u0627\u0648 \u060c\u062a\u0627\u0631\u0627 ", "bbox": {"l": 114.93168042617239, "t": 616.2866921302387, "r": 303.07190112380573, "b": 629.2467021750359, "coord_origin": "TOPLEFT"}}, {"id": 116, "text": "\u0648\u0648\u0648", "bbox": {"l": 303.1107811239498, "t": 616.2866921302387, "r": 311.57367115533066, "b": 629.2467021750359, "coord_origin": "TOPLEFT"}}, {"id": 117, "text": "\u0644\u0627", "bbox": {"l": 311.6125511554748, "t": 616.2866921302387, "r": 322.27216119500116, "b": 629.2467021750359, "coord_origin": "TOPLEFT"}}, {"id": 118, "text": "\u062a", "bbox": {"l": 319.22656118370793, "t": 616.2866921302387, "r": 332.9317612345275, "b": 629.2467021750359, "coord_origin": "TOPLEFT"}}, {"id": 119, "text": "\u062e", "bbox": {"l": 332.9576712346236, "t": 616.2866921302387, "r": 336.7420012486561, "b": 629.2467021750359, "coord_origin": "TOPLEFT"}}, {"id": 120, "text": "\u0641\u062f\u0627", "bbox": {"l": 336.78088124880026, "t": 616.2866921302387, "r": 359.1757513318415, "b": 629.2467021750359, "coord_origin": "TOPLEFT"}}, {"id": 121, "text": "\u0644\u0648\u0648", "bbox": {"l": 359.2016613319376, "t": 616.2866921302387, "r": 365.26694135442796, "b": 629.2467021750359, "coord_origin": "TOPLEFT"}}, {"id": 122, "text": "\u0633\u0645\u0648", "bbox": {"l": 365.3058213545721, "t": 616.2866921302387, "r": 392.46997145529815, "b": 629.2467021750359, "coord_origin": "TOPLEFT"}}, {"id": 123, "text": " \u060c\u0627\u0647\u060c\u0648\u0648\u0648\u0644\u0627", "bbox": {"l": 392.431091455154, "t": 616.2866921302387, "r": 437.0264616205159, "b": 629.2467021750359, "coord_origin": "TOPLEFT"}}, {"id": 124, "text": "\u060c\u0629\u0648\u0648", "bbox": {"l": 72.94919627049924, "t": 616.2866921302387, "r": 82.44239030570048, "b": 629.2467021750359, "coord_origin": "TOPLEFT"}}, {"id": 125, "text": "\u064a", "bbox": {"l": 82.48127030584465, "t": 616.2866921302387, "r": 86.84879332203964, "b": 629.2467021750359, "coord_origin": "TOPLEFT"}}, {"id": 126, "text": "\u0627", "bbox": {"l": 86.79695132184742, "t": 616.2866921302387, "r": 91.12559533789825, "b": 629.2467021750359, "coord_origin": "TOPLEFT"}}, {"id": 127, "text": "\u0629\u064a\u0647\u060c", "bbox": {"l": 276.1200010238667, "t": 635.0067021949458, "r": 302.3251311210366, "b": 647.966702239743, "coord_origin": "TOPLEFT"}}, {"id": 128, "text": "\u0648\u0644\u0627", "bbox": {"l": 302.27328112084433, "t": 635.0067021949458, "r": 318.1881711798576, "b": 647.966702239743, "coord_origin": "TOPLEFT"}}, {"id": 129, "text": "\u062a\u062e", "bbox": {"l": 315.29456116912786, "t": 635.0067021949458, "r": 334.1030612388708, "b": 647.966702239743, "coord_origin": "TOPLEFT"}}, {"id": 130, "text": "\u064a", "bbox": {"l": 334.18082123915906, "t": 635.0067021949458, "r": 338.5483412553541, "b": 647.966702239743, "coord_origin": "TOPLEFT"}}, {"id": 131, "text": "\u062c\u064a\u062a\u0627", "bbox": {"l": 338.4964912551618, "t": 635.0067021949458, "r": 358.23456132835156, "b": 647.966702239743, "coord_origin": "TOPLEFT"}}, {"id": 132, "text": "\u0631\u0644\u0633\u062d\u0627 \u0641\u0627\u0644\u0628\u0645\u0648", "bbox": {"l": 358.2864113285438, "t": 635.0067021949458, "r": 437.29059162149525, "b": 647.966702239743, "coord_origin": "TOPLEFT"}}, {"id": 133, "text": ".", "bbox": {"l": 272.6400110109627, "t": 635.0067021949458, "r": 276.0614610236496, "b": 647.966702239743, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u062e\u0647\u0644\u0648\u0633\u062d\u062e\u0628 \u0627\u0645\u062e\u0648\u0646\u0631\u0628 \u0644\u0627 \u062a \u062e\u0641\u062f\u0627\u0644\u0648\u0633\u0645 \u062f\u064a\u062f\u062d\u062a \u0644\u062a \u062f\u0642 \u0647\u0646 \u0639 \u0649\u0644\u0625 \u0631\u062e \u0644\u0625\u0627 \u0631\u062f\u062c\u062a \u0644\u0643\u0648\u0627\u0628 \u062f \u0631\u0648\u0648\u0648\u0635\u0645 \u0629\u0648 \u0648\u0648\u064a \u0631 \u062a\u062e \u0641\u062f\u0627\u0644 \u0648\u0648\u0648 \u0633 \u0645 \u0649\u0648\u0648\u0648 \u0627\u064a \u0633\u064a\u0648\u0648\u0648\u0626\u0631 2023 \u0631 \u0627\u0648\u0648 \u0648\u0648 \u062d\u0644\u0627 \u062a\u062e\u0648\u0648\u0648 \u0633\u0627\u0648 \u062a\u062e\u064a\u0648\u0648\u0648\u0635\u0648\u062a\u0648 \u060c \u0643\u064a\u0627\u0644 \u0627 \u062a\u062e \u0627\u0648\u0648\u0635\u064a\u0644 \u0627\u0647\u060c\u0648\u0648\u0648\u0644\u0627 \u0627\u0645\u062e\u0648\u0648\u0646\u0631\u0628\u0644\u0627\u0648 \u060c\u062a\u0627\u0631\u0627 \u0648\u0648\u0648 \u0644\u0627 \u062a \u062e \u0641\u062f\u0627 \u0644\u0648\u0648 \u0633\u0645\u0648 \u060c\u0627\u0647\u060c\u0648\u0648\u0648\u0644\u0627 \u060c\u0629\u0648\u0648 \u064a \u0627 \u0629\u064a\u0647\u060c \u0648\u0644\u0627 \u062a\u062e \u064a \u062c\u064a\u062a\u0627 \u0631\u0644\u0633\u062d\u0627 \u0641\u0627\u0644\u0628\u0645\u0648 ."}, {"label": "text", "id": 4, "page_no": 0, "cluster": {"id": 4, "label": "text", "bbox": {"l": 69.09600125621141, "t": 507.4266917539564, "r": 437.3132016215791, "b": 534.1167018462124, "coord_origin": "TOPLEFT"}, "confidence": 0.5769620537757874, "cells": [{"id": 134, "text": " \u0646\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0645", "bbox": {"l": 167.78000062213658, "t": 507.4266917539564, "r": 199.8948707412201, "b": 520.3866917987535, "coord_origin": "TOPLEFT"}}, {"id": 135, "text": "\u0645\u0627", "bbox": {"l": 199.92079074131624, "t": 507.4266917539564, "r": 211.63663078475915, "b": 520.3866917987535, "coord_origin": "TOPLEFT"}}, {"id": 136, "text": "\u0629\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u064a\u0627", "bbox": {"l": 221.8685508226996, "t": 507.4266917539564, "r": 241.72971089634578, "b": 520.3866917987535, "coord_origin": "TOPLEFT"}}, {"id": 137, "text": "\u0645 ", "bbox": {"l": 241.67787089615356, "t": 507.4266917539564, "r": 257.411320954494, "b": 520.3866917987535, "coord_origin": "TOPLEFT"}}, {"id": 138, "text": "\u0631\u0640", "bbox": {"l": 179.26880066473763, "t": 519.9067017970945, "r": 187.75760069621452, "b": 532.8667018418917, "coord_origin": "TOPLEFT"}}, {"id": 139, "text": "\u0635\u0645", "bbox": {"l": 187.79648069635869, "t": 519.9067017970945, "r": 209.58224077714138, "b": 532.8667018418917, "coord_origin": "TOPLEFT"}}, {"id": 140, "text": "\u0644\u0627", "bbox": {"l": 209.51744077690105, "t": 519.9067017970945, "r": 216.90465080429323, "b": 532.8667018418917, "coord_origin": "TOPLEFT"}}, {"id": 141, "text": " \u064a\u0645", "bbox": {"l": 216.94353080443742, "t": 519.9067017970945, "r": 235.95586087493606, "b": 532.8667018418917, "coord_origin": "TOPLEFT"}}, {"id": 142, "text": "\u0648\u0642\u0644", "bbox": {"l": 235.99474087508025, "t": 519.9067017970945, "r": 254.0609709420707, "b": 532.8667018418917, "coord_origin": "TOPLEFT"}}, {"id": 143, "text": "\u0627", "bbox": {"l": 254.09985094221489, "t": 519.9067017970945, "r": 257.54721095499787, "b": 532.8667018418917, "coord_origin": "TOPLEFT"}}, {"id": 144, "text": " \u0627\u0640\u0640\u0640\u0640\u0633\u0646 \u0627 \u0621\u0627\u0640\u0640\u0640\u0640", "bbox": {"l": 362.20999134309267, "t": 508.6766917582771, "r": 428.6688815895255, "b": 521.6366918030742, "coord_origin": "TOPLEFT"}}, {"id": 145, "text": "\u0646\u0628", "bbox": {"l": 428.7077615896697, "t": 508.6766917582771, "r": 437.3132016215791, "b": 521.6366918030742, "coord_origin": "TOPLEFT"}}, {"id": 146, "text": "\u0631\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0635\u0645", "bbox": {"l": 367.6023913630879, "t": 521.1567018014152, "r": 429.6149015930334, "b": 534.1167018462124, "coord_origin": "TOPLEFT"}}, {"id": 147, "text": "\u0644\u0627", "bbox": {"l": 429.5501115927932, "t": 521.1567018014152, "r": 436.93732162018534, "b": 534.1167018462124, "coord_origin": "TOPLEFT"}}, {"id": 148, "text": " \u0639\u0627\u0640\u0640\u0640\u0640\u0640\u0635\u062a", "bbox": {"l": 270.07001100143304, "t": 507.4266917539564, "r": 308.6001011443045, "b": 520.3866917987535, "coord_origin": "TOPLEFT"}}, {"id": 149, "text": "\u0627 \u0621\u0627\u0640\u0640\u0640\u0640\u0640", "bbox": {"l": 331.3538212286764, "t": 507.4266917539564, "r": 340.23544126160994, "b": 520.3866917987535, "coord_origin": "TOPLEFT"}}, {"id": 150, "text": "\u0646\u0628", "bbox": {"l": 340.2743212617541, "t": 507.4266917539564, "r": 348.8797612936635, "b": 520.3866917987535, "coord_origin": "TOPLEFT"}}, {"id": 151, "text": "\u064a\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0633\u0628\u0627", "bbox": {"l": 273.0700110125572, "t": 519.9067017970945, "r": 340.08609126105614, "b": 532.8667018418917, "coord_origin": "TOPLEFT"}}, {"id": 152, "text": "\u0646\u062a", "bbox": {"l": 340.0213012608159, "t": 519.9067017970945, "r": 348.6267412927253, "b": 532.8667018418917, "coord_origin": "TOPLEFT"}}, {"id": 153, "text": "\u0642\u062a\u0633\u0638\u0627", "bbox": {"l": 85.41600031672677, "t": 508.33670175710193, "r": 117.0141004338941, "b": 521.296691801899, "coord_origin": "TOPLEFT"}}, {"id": 154, "text": "\u0642", "bbox": {"l": 129.65334048076102, "t": 508.33670175710193, "r": 135.9729605041945, "b": 521.296691801899, "coord_origin": "TOPLEFT"}}, {"id": 155, "text": "\u064a\u0642\u062d\u062a", "bbox": {"l": 136.02480050438672, "t": 508.33670175710193, "r": 160.44144059492484, "b": 521.296691801899, "coord_origin": "TOPLEFT"}}, {"id": 156, "text": " \u0631\u0627 \u0631", "bbox": {"l": 69.09600125621141, "t": 508.33670175710193, "r": 85.41264331671432, "b": 521.296691801899, "coord_origin": "TOPLEFT"}}, {"id": 157, "text": "\u064a\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0633\u0627\u064a", "bbox": {"l": 72.09600126733555, "t": 520.81671180024, "r": 138.94359051520973, "b": 533.7767018450371, "coord_origin": "TOPLEFT"}}, {"id": 158, "text": "\u0633\u0644\u0627", "bbox": {"l": 138.8787805149694, "t": 520.81671180024, "r": 159.95175059310904, "b": 533.7767018450371, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u0646\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0645 \u0645\u0627 \u0629\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u064a\u0627 \u0645 \u0631\u0640 \u0635\u0645 \u0644\u0627 \u064a\u0645 \u0648\u0642\u0644 \u0627 \u0627\u0640\u0640\u0640\u0640\u0633\u0646 \u0627 \u0621\u0627\u0640\u0640\u0640\u0640 \u0646\u0628 \u0631\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0635\u0645 \u0644\u0627 \u0639\u0627\u0640\u0640\u0640\u0640\u0640\u0635\u062a \u0627 \u0621\u0627\u0640\u0640\u0640\u0640\u0640 \u0646\u0628 \u064a\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0633\u0628\u0627 \u0646\u062a \u0642\u062a\u0633\u0638\u0627 \u0642 \u064a\u0642\u062d\u062a \u0631\u0627 \u0631 \u064a\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0640\u0633\u0627\u064a \u0633\u0644\u0627"}, {"label": "picture", "id": 3, "page_no": 0, "cluster": {"id": 3, "label": "picture", "bbox": {"l": 446.4657287597656, "t": 200.7112274169922, "r": 595.0, "b": 650.6431884765625, "coord_origin": "TOPLEFT"}, "confidence": 0.6444889903068542, "cells": [], "children": []}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}], "headers": []}}]
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v2/right_to_left_03.doctags.txt b/tests/data/groundtruth/docling_v2/right_to_left_03.doctags.txt
new file mode 100644
index 00000000..ebcd0d75
--- /dev/null
+++ b/tests/data/groundtruth/docling_v2/right_to_left_03.doctags.txt
@@ -0,0 +1,33 @@
+<doctag><section_header_level_1><loc_58><loc_37><loc_225><loc_48>یلخاد یلااک - یلصا رازاب رد شريذپ همانديما</section_header_level_1>
+<picture><loc_326><loc_21><loc_405><loc_61></picture>
+<section_header_level_1><loc_314><loc_82><loc_403><loc_93>لااک درادناتسا -2-5</section_header_level_1>
+<text><loc_385><loc_96><loc_436><loc_106>درادناتسا مان</text>
+<text><loc_56><loc_96><loc_222><loc_125>یرگ هتخير شور هب هدش ديلوت لاشمش و هشمش فرصم دروم هتسويپ یا هزاس یاهدلاوف رد - قباطم تسويپ زيلانآ</text>
+<text><loc_354><loc_128><loc_436><loc_138>یلم درادناتسا هرامش</text>
+<text><loc_199><loc_128><loc_223><loc_136>20300</text>
+<text><loc_342><loc_142><loc_436><loc_152>؟تسا یرابجا درادناتسا</text>
+<checkbox_unselected><loc_166><loc_141><loc_222><loc_149>ريخ       یلب</checkbox_unselected>
+<text><loc_327><loc_155><loc_436><loc_165>درادناتسا هدننکرداص عجرم</text>
+<text><loc_140><loc_154><loc_222><loc_163>ناريا درادناتسا یلم نامزاس</text>
+<text><loc_245><loc_169><loc_436><loc_192>ذخا ار روکذم درادناتسا ،لوصحم هدننکديلوت ايآ ؟تسا هدومن</text>
+<checkbox_selected><loc_166><loc_168><loc_175><loc_176>ريخ</checkbox_selected>
+<checkbox_unselected><loc_199><loc_168><loc_208><loc_176>یلب</checkbox_unselected>
+<section_header_level_1><loc_344><loc_209><loc_425><loc_219>سروب رد شريذپ -3</section_header_level_1>
+<text><loc_340><loc_222><loc_414><loc_232>کرادم هئارا خيرات</text>
+<text><loc_116><loc_221><loc_158><loc_230>1403/09/19</text>
+<text><loc_358><loc_236><loc_414><loc_246>شريذپ خيرات</text>
+<text><loc_116><loc_235><loc_158><loc_243>1403/10/04</text>
+<text><loc_308><loc_249><loc_414><loc_259>هضرع هتيمک هسلج هرامش</text>
+<text><loc_130><loc_248><loc_144><loc_257>436</text>
+<text><loc_335><loc_263><loc_414><loc_273>همانديما جرد خيرات</text>
+<text><loc_116><loc_262><loc_158><loc_270>1403/10/05</text>
+<text><loc_355><loc_276><loc_414><loc_286>شريذپ رواشم</text>
+<text><loc_103><loc_275><loc_171><loc_283>سروب نومرآ یرازگراک</text>
+<text><loc_236><loc_291><loc_414><loc_314>رد لااک شريذپ زا سپ هياپ تميق نييعت ةوحن سروب</text>
+<text><loc_92><loc_290><loc_179><loc_298>یناهج  یاه تميق ساسا رب</text>
+<text><loc_224><loc_317><loc_414><loc_340>شورف /شورف لک /ديلوت زا هضرع دصرد لقادح یلخاد</text>
+<text><loc_72><loc_316><loc_202><loc_325>نت 47.500 اي هنايلاس ديلوت زا %50 لقادح</text>
+<text><loc_340><loc_344><loc_414><loc_354>ليوحت زاجم یاطخ</text>
+<text><loc_90><loc_343><loc_184><loc_351>ليوحت لباق هلومحم نيرخآ 5%</text>
+<page_footer><loc_224><loc_463><loc_247><loc_469>Page 7</page_footer>
+</doctag>
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v2/right_to_left_03.json b/tests/data/groundtruth/docling_v2/right_to_left_03.json
new file mode 100644
index 00000000..c53341c4
--- /dev/null
+++ b/tests/data/groundtruth/docling_v2/right_to_left_03.json
@@ -0,0 +1 @@
+{"schema_name": "DoclingDocument", "version": "1.1.0", "name": "right_to_left_03", "origin": {"mimetype": "application/pdf", "binary_hash": 10326044566005236748, "filename": "right_to_left_03.pdf", "uri": null}, "furniture": {"self_ref": "#/furniture", "parent": null, "children": [], "content_layer": "furniture", "name": "_root_", "label": "unspecified"}, "body": {"self_ref": "#/body", "parent": null, "children": [{"cref": "#/texts/0"}, {"cref": "#/pictures/0"}, {"cref": "#/texts/2"}, {"cref": "#/groups/0"}, {"cref": "#/texts/14"}, {"cref": "#/groups/1"}, {"cref": "#/texts/31"}], "content_layer": "body", "name": "_root_", "label": "unspecified"}, "groups": [{"self_ref": "#/groups/0", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/3"}, {"cref": "#/texts/4"}, {"cref": "#/texts/5"}, {"cref": "#/texts/6"}, {"cref": "#/texts/7"}, {"cref": "#/texts/8"}, {"cref": "#/texts/9"}, {"cref": "#/texts/10"}, {"cref": "#/texts/11"}, {"cref": "#/texts/12"}, {"cref": "#/texts/13"}], "content_layer": "body", "name": "group", "label": "key_value_area"}, {"self_ref": "#/groups/1", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/15"}, {"cref": "#/texts/16"}, {"cref": "#/texts/17"}, {"cref": "#/texts/18"}, {"cref": "#/texts/19"}, {"cref": "#/texts/20"}, {"cref": "#/texts/21"}, {"cref": "#/texts/22"}, {"cref": "#/texts/23"}, {"cref": "#/texts/24"}, {"cref": "#/texts/25"}, {"cref": "#/texts/26"}, {"cref": "#/texts/27"}, {"cref": "#/texts/28"}, {"cref": "#/texts/29"}, {"cref": "#/texts/30"}], "content_layer": "body", "name": "group", "label": "key_value_area"}], "texts": [{"self_ref": "#/texts/0", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "section_header", "prov": [{"page_no": 1, "bbox": {"l": 68.78399669083697, "t": 779.3882381741187, "r": 267.65960879695194, "b": 761.0098882171737, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 42]}], "orig": "\u06cc\u0644\u062e\u0627\u062f \u06cc\u0644\u0627\u0627\u06a9 - \u06cc\u0644\u0635\u0627 \u0631\u0627\u0632\u0627\u0628 \u0631\u062f \u0634\u0631\u064a\u0630\u067e \u0647\u0645\u0627\u0646\u062f\u064a\u0645\u0627", "text": "\u06cc\u0644\u062e\u0627\u062f \u06cc\u0644\u0627\u0627\u06a9 - \u06cc\u0644\u0635\u0627 \u0631\u0627\u0632\u0627\u0628 \u0631\u062f \u0634\u0631\u064a\u0630\u067e \u0647\u0645\u0627\u0646\u062f\u064a\u0645\u0627", "level": 1}, {"self_ref": "#/texts/1", "parent": {"cref": "#/pictures/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 388.989988251609, "t": 750.2512182423783, "r": 481.6045778353348, "b": 736.9811382734663, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 21]}], "orig": "\u0646\u0627\u0631\u064a\u0627 \u06cc\u0644\u0627\u0627\u06a9 \u0633\u0631\u0648\u0628 \u062a\u06a9\u0631\u0634", "text": "\u0646\u0627\u0631\u064a\u0627 \u06cc\u0644\u0627\u0627\u06a9 \u0633\u0631\u0648\u0628 \u062a\u06a9\u0631\u0634"}, {"self_ref": "#/texts/2", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "section_header", "prov": [{"page_no": 1, "bbox": {"l": 373.9899883190294, "t": 703.4050283521253, "r": 479.52999784465936, "b": 685.3749983943645, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 19]}], "orig": "\u0644\u0627\u0627\u06a9 \u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627 -2-5", "text": "\u0644\u0627\u0627\u06a9 \u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627 -2-5", "level": 1}, {"self_ref": "#/texts/3", "parent": {"cref": "#/groups/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 458.7399879381041, "t": 679.6162084078558, "r": 519.2383976661823, "b": 662.7401084473915, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 13]}], "orig": "\u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627 \u0645\u0627\u0646", "text": "\u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627 \u0645\u0627\u0646"}, {"self_ref": "#/texts/4", "parent": {"cref": "#/groups/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 66.26399970216359, "t": 681.171998404211, "r": 264.81795880972436, "b": 631.5399785204845, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 97]}], "orig": "\u06cc\u0631\u06af \u0647\u062a\u062e\u064a\u0631 \u0634\u0648\u0631 \u0647\u0628 \u0647\u062f\u0634 \u062f\u064a\u0644\u0648\u062a \u0644\u0627\u0634\u0645\u0634 \u0648 \u0647\u0634\u0645\u0634 \u0641\u0631\u0635\u0645 \u062f\u0631\u0648\u0645 \u0647\u062a\u0633\u0648\u064a\u067e \u06cc\u0627 \u0647\u0632\u0627\u0633 \u06cc\u0627\u0647\u062f\u0644\u0627\u0648\u0641 \u0631\u062f - \u0642\u0628\u0627\u0637\u0645 \u062a\u0633\u0648\u064a\u067e \u0632\u064a\u0644\u0627\u0646\u0622", "text": "\u06cc\u0631\u06af \u0647\u062a\u062e\u064a\u0631 \u0634\u0648\u0631 \u0647\u0628 \u0647\u062f\u0634 \u062f\u064a\u0644\u0648\u062a \u0644\u0627\u0634\u0645\u0634 \u0648 \u0647\u0634\u0645\u0634 \u0641\u0631\u0635\u0645 \u062f\u0631\u0648\u0645 \u0647\u062a\u0633\u0648\u064a\u067e \u06cc\u0627 \u0647\u0632\u0627\u0633 \u06cc\u0627\u0647\u062f\u0644\u0627\u0648\u0641 \u0631\u062f - \u0642\u0628\u0627\u0637\u0645 \u062a\u0633\u0648\u064a\u067e \u0632\u064a\u0644\u0627\u0646\u0622"}, {"self_ref": "#/texts/5", "parent": {"cref": "#/groups/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 420.9099981081384, "t": 625.7362085340809, "r": 519.1619876665258, "b": 608.8601085736167, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 19]}], "orig": "\u06cc\u0644\u0645 \u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627 \u0647\u0631\u0627\u0645\u0634", "text": "\u06cc\u0644\u0645 \u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627 \u0647\u0631\u0627\u0645\u0634"}, {"self_ref": "#/texts/6", "parent": {"cref": "#/groups/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 236.80999893561153, "t": 627.2919885304362, "r": 265.01000880886113, "b": 613.2999885632154, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 5]}], "orig": "20300", "text": "20300"}, {"self_ref": "#/texts/7", "parent": {"cref": "#/groups/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 406.9899881707045, "t": 603.0262485872838, "r": 519.1415376666176, "b": 586.1501486268197, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 21]}], "orig": "\u061f\u062a\u0633\u0627 \u06cc\u0631\u0627\u0628\u062c\u0627 \u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627", "text": "\u061f\u062a\u0633\u0627 \u06cc\u0631\u0627\u0628\u062c\u0627 \u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627"}, {"self_ref": "#/texts/8", "parent": {"cref": "#/groups/0"}, "children": [], "content_layer": "body", "label": "checkbox_unselected", "prov": [{"page_no": 1, "bbox": {"l": 197.32999911306206, "t": 604.5820285836392, "r": 264.91399880929265, "b": 590.5900286164182, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 13]}], "orig": "\u0631\u064a\u062e       \u06cc\u0644\u0628", "text": "\u0631\u064a\u062e       \u06cc\u0644\u0628"}, {"self_ref": "#/texts/9", "parent": {"cref": "#/groups/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 389.4699982494516, "t": 580.3462486404165, "r": 519.2136776662934, "b": 563.4701486799523, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 24]}], "orig": "\u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627 \u0647\u062f\u0646\u0646\u06a9\u0631\u062f\u0627\u0635 \u0639\u062c\u0631\u0645", "text": "\u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627 \u0647\u062f\u0646\u0646\u06a9\u0631\u062f\u0627\u0635 \u0639\u062c\u0631\u0645"}, {"self_ref": "#/texts/10", "parent": {"cref": "#/groups/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 166.5799992512739, "t": 581.9020386367717, "r": 264.77599880991295, "b": 567.9100286695509, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 26]}], "orig": "\u0646\u0627\u0631\u064a\u0627 \u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627 \u06cc\u0644\u0645 \u0646\u0627\u0645\u0632\u0627\u0633", "text": "\u0646\u0627\u0631\u064a\u0627 \u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627 \u06cc\u0644\u0645 \u0646\u0627\u0645\u0632\u0627\u0633"}, {"self_ref": "#/texts/11", "parent": {"cref": "#/groups/0"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 292.129998686965, "t": 557.6661986935493, "r": 519.2351676661968, "b": 518.5901487850932, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 55]}], "orig": "\u0630\u062e\u0627 \u0627\u0631 \u0631\u0648\u06a9\u0630\u0645 \u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627 \u060c\u0644\u0648\u0635\u062d\u0645 \u0647\u062f\u0646\u0646\u06a9\u062f\u064a\u0644\u0648\u062a \u0627\u064a\u0622 \u061f\u062a\u0633\u0627 \u0647\u062f\u0648\u0645\u0646", "text": "\u0630\u062e\u0627 \u0627\u0631 \u0631\u0648\u06a9\u0630\u0645 \u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627 \u060c\u0644\u0648\u0635\u062d\u0645 \u0647\u062f\u0646\u0646\u06a9\u062f\u064a\u0644\u0648\u062a \u0627\u064a\u0622 \u061f\u062a\u0633\u0627 \u0647\u062f\u0648\u0645\u0646"}, {"self_ref": "#/texts/12", "parent": {"cref": "#/groups/0"}, "children": [], "content_layer": "body", "label": "checkbox_selected", "prov": [{"page_no": 1, "bbox": {"l": 197.32999911306206, "t": 559.2219786899045, "r": 208.04769906488926, "b": 545.2299787226838, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 3]}], "orig": "\u0631\u064a\u062e", "text": "\u0631\u064a\u062e"}, {"self_ref": "#/texts/13", "parent": {"cref": "#/groups/0"}, "children": [], "content_layer": "body", "label": "checkbox_unselected", "prov": [{"page_no": 1, "bbox": {"l": 236.62821893642857, "t": 559.2219786899045, "r": 247.34591888825577, "b": 545.2299787226838, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 3]}], "orig": "\u06cc\u0644\u0628", "text": "\u06cc\u0644\u0628"}, {"self_ref": "#/texts/14", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "section_header", "prov": [{"page_no": 1, "bbox": {"l": 409.0299981615353, "t": 490.58620885069837, "r": 505.7644977267433, "b": 473.71013889023413, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 16]}], "orig": "\u0633\u0631\u0648\u0628 \u0631\u062f \u0634\u0631\u064a\u0630\u067e -3", "text": "\u0633\u0631\u0648\u0628 \u0631\u062f \u0634\u0631\u064a\u0630\u067e -3", "level": 1}, {"self_ref": "#/texts/15", "parent": {"cref": "#/groups/1"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 405.30999817825557, "t": 467.88619890387787, "r": 492.6107177858655, "b": 451.01012894341363, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 17]}], "orig": "\u06a9\u0631\u0627\u062f\u0645 \u0647\u0626\u0627\u0631\u0627 \u062e\u064a\u0631\u0627\u062a", "text": "\u06a9\u0631\u0627\u062f\u0645 \u0647\u0626\u0627\u0631\u0627 \u062e\u064a\u0631\u0627\u062a"}, {"self_ref": "#/texts/16", "parent": {"cref": "#/groups/1"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 137.89998938018175, "t": 469.4620089001862, "r": 187.8199891558066, "b": 455.4699989329655, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 10]}], "orig": "1403/09/19", "text": "1403/09/19"}, {"self_ref": "#/texts/17", "parent": {"cref": "#/groups/1"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 426.309998083867, "t": 445.2062089570106, "r": 492.59463778593783, "b": 428.3301389965463, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 11]}], "orig": "\u0634\u0631\u064a\u0630\u067e \u062e\u064a\u0631\u0627\u062a", "text": "\u0634\u0631\u064a\u0630\u067e \u062e\u064a\u0631\u0627\u062a"}, {"self_ref": "#/texts/18", "parent": {"cref": "#/groups/1"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 137.89998938018175, "t": 446.7620189533657, "r": 187.8199891558066, "b": 432.7700189861449, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 10]}], "orig": "1403/10/04", "text": "1403/10/04"}, {"self_ref": "#/texts/19", "parent": {"cref": "#/groups/1"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 367.14998834977314, "t": 422.5261790101433, "r": 492.68526778553047, "b": 405.65011904967906, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 21]}], "orig": "\u0647\u0636\u0631\u0639 \u0647\u062a\u064a\u0645\u06a9 \u0647\u0633\u0644\u062c \u0647\u0631\u0627\u0645\u0634", "text": "\u0647\u0636\u0631\u0639 \u0647\u062a\u064a\u0645\u06a9 \u0647\u0633\u0644\u062c \u0647\u0631\u0627\u0645\u0634"}, {"self_ref": "#/texts/20", "parent": {"cref": "#/groups/1"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 154.69999930467083, "t": 423.96200900677957, "r": 171.19999923050838, "b": 409.96999903955884, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 3]}], "orig": "436", "text": "436"}, {"self_ref": "#/texts/21", "parent": {"cref": "#/groups/1"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 399.42998820468443, "t": 399.72619906355703, "r": 492.62752778578994, "b": 382.8501291030928, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 18]}], "orig": "\u0647\u0645\u0627\u0646\u062f\u064a\u0645\u0627 \u062c\u0631\u062f \u062e\u064a\u0631\u0627\u062a", "text": "\u0647\u0645\u0627\u0646\u062f\u064a\u0645\u0627 \u062c\u0631\u062f \u062e\u064a\u0631\u0627\u062a"}, {"self_ref": "#/texts/22", "parent": {"cref": "#/groups/1"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 137.89998938018175, "t": 401.2820090599123, "r": 187.8199891558066, "b": 387.29000909269143, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 10]}], "orig": "1403/10/05", "text": "1403/10/05"}, {"self_ref": "#/texts/23", "parent": {"cref": "#/groups/1"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 422.82998809950857, "t": 377.04619911668976, "r": 492.6789577855588, "b": 360.17013915622545, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 11]}], "orig": "\u0634\u0631\u064a\u0630\u067e \u0631\u0648\u0627\u0634\u0645", "text": "\u0634\u0631\u064a\u0630\u067e \u0631\u0648\u0627\u0634\u0645"}, {"self_ref": "#/texts/24", "parent": {"cref": "#/groups/1"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 122.05999945137766, "t": 378.6020191130449, "r": 203.6480090846645, "b": 364.6100191458242, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 19]}], "orig": "\u0633\u0631\u0648\u0628 \u0646\u0648\u0645\u0631\u0622 \u06cc\u0631\u0627\u0632\u06af\u0631\u0627\u06a9", "text": "\u0633\u0631\u0648\u0628 \u0646\u0648\u0645\u0631\u0622 \u06cc\u0631\u0627\u0632\u06af\u0631\u0627\u06a9"}, {"self_ref": "#/texts/25", "parent": {"cref": "#/groups/1"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 281.3299887355078, "t": 352.6861891737582, "r": 492.70525778544066, "b": 313.730129265021, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 45]}], "orig": "\u0631\u062f \u0644\u0627\u0627\u06a9 \u0634\u0631\u064a\u0630\u067e \u0632\u0627 \u0633\u067e \u0647\u064a\u0627\u067e \u062a\u0645\u064a\u0642 \u0646\u064a\u064a\u0639\u062a \u0629\u0648\u062d\u0646 \u0633\u0631\u0648\u0628", "text": "\u0631\u062f \u0644\u0627\u0627\u06a9 \u0634\u0631\u064a\u0630\u067e \u0632\u0627 \u0633\u067e \u0647\u064a\u0627\u067e \u062a\u0645\u064a\u0642 \u0646\u064a\u064a\u0639\u062a \u0629\u0648\u062d\u0646 \u0633\u0631\u0648\u0628"}, {"self_ref": "#/texts/26", "parent": {"cref": "#/groups/1"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 109.21999950908952, "t": 354.24199917011344, "r": 213.67396903960088, "b": 340.2499992028926, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 23]}], "orig": "\u06cc\u0646\u0627\u0647\u062c  \u06cc\u0627\u0647 \u062a\u0645\u064a\u0642 \u0633\u0627\u0633\u0627 \u0631\u0628", "text": "\u06cc\u0646\u0627\u0647\u062c  \u06cc\u0627\u0647 \u062a\u0645\u064a\u0642 \u0633\u0627\u0633\u0627 \u0631\u0628"}, {"self_ref": "#/texts/27", "parent": {"cref": "#/groups/1"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 266.5700088018494, "t": 307.7761792789694, "r": 492.7008677854604, "b": 268.82012937023217, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 45]}], "orig": "\u0634\u0648\u0631\u0641 /\u0634\u0648\u0631\u0641 \u0644\u06a9 /\u062f\u064a\u0644\u0648\u062a \u0632\u0627 \u0647\u0636\u0631\u0639 \u062f\u0635\u0631\u062f \u0644\u0642\u0627\u062f\u062d \u06cc\u0644\u062e\u0627\u062f", "text": "\u0634\u0648\u0631\u0641 /\u0634\u0648\u0631\u0641 \u0644\u06a9 /\u062f\u064a\u0644\u0648\u062a \u0632\u0627 \u0647\u0636\u0631\u0639 \u062f\u0635\u0631\u062f \u0644\u0642\u0627\u062f\u062d \u06cc\u0644\u062e\u0627\u062f"}, {"self_ref": "#/texts/28", "parent": {"cref": "#/groups/1"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 85.4639966158655, "t": 309.3319992753245, "r": 240.36199891964634, "b": 295.33999930810376, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 39]}], "orig": "\u0646\u062a 47.500 \u0627\u064a \u0647\u0646\u0627\u064a\u0644\u0627\u0633 \u062f\u064a\u0644\u0648\u062a \u0632\u0627 %50 \u0644\u0642\u0627\u062f\u062d", "text": "\u0646\u062a 47.500 \u0627\u064a \u0647\u0646\u0627\u064a\u0644\u0627\u0633 \u062f\u064a\u0644\u0648\u062a \u0632\u0627 %50 \u0644\u0642\u0627\u062f\u062d"}, {"self_ref": "#/texts/29", "parent": {"cref": "#/groups/1"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 404.2300081831098, "t": 262.8962093841102, "r": 492.6399177857343, "b": 246.02010942364598, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 15]}], "orig": "\u0644\u064a\u0648\u062d\u062a \u0632\u0627\u062c\u0645 \u06cc\u0627\u0637\u062e", "text": "\u0644\u064a\u0648\u062d\u062a \u0632\u0627\u062c\u0645 \u06cc\u0627\u0637\u062e"}, {"self_ref": "#/texts/30", "parent": {"cref": "#/groups/1"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 106.93999951933742, "t": 264.4519993804654, "r": 218.89399901613845, "b": 250.45998941324467, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 26]}], "orig": "\u0644\u064a\u0648\u062d\u062a \u0644\u0628\u0627\u0642 \u0647\u0644\u0648\u0645\u062d\u0645 \u0646\u064a\u0631\u062e\u0622 5%", "text": "\u0644\u064a\u0648\u062d\u062a \u0644\u0628\u0627\u0642 \u0647\u0644\u0648\u0645\u062d\u0645 \u0646\u064a\u0631\u062e\u0622 5%"}, {"self_ref": "#/texts/31", "parent": {"cref": "#/body"}, "children": [], "content_layer": "furniture", "label": "page_footer", "prov": [{"page_no": 1, "bbox": {"l": 267.2900087986132, "t": 62.54999885346342, "r": 294.5899986759081, "b": 52.00199887817439, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 6]}], "orig": "Page 7", "text": "Page 7"}], "pictures": [{"self_ref": "#/pictures/0", "parent": {"cref": "#/body"}, "children": [{"cref": "#/texts/1"}], "content_layer": "body", "label": "picture", "prov": [{"page_no": 1, "bbox": {"l": 388.5767822265625, "t": 806.0041046142578, "r": 482.4759216308594, "b": 739.034423828125, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 0]}], "captions": [], "references": [], "footnotes": [], "image": null, "annotations": []}], "tables": [], "key_value_items": [], "form_items": [], "pages": {"1": {"size": {"width": 595.3200073242188, "height": 842.0399780273438}, "image": null, "page_no": 1}}}
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v2/right_to_left_03.md b/tests/data/groundtruth/docling_v2/right_to_left_03.md
new file mode 100644
index 00000000..8c8378c2
--- /dev/null
+++ b/tests/data/groundtruth/docling_v2/right_to_left_03.md
@@ -0,0 +1,61 @@
+## یلخاد یلااک - یلصا رازاب رد شريذپ همانديما
+
+<!-- image -->
+
+## لااک درادناتسا -2-5
+
+درادناتسا مان
+
+یرگ هتخير شور هب هدش ديلوت لاشمش و هشمش فرصم دروم هتسويپ یا هزاس یاهدلاوف رد - قباطم تسويپ زيلانآ
+
+یلم درادناتسا هرامش
+
+20300
+
+؟تسا یرابجا درادناتسا
+
+ريخ       یلب
+
+درادناتسا هدننکرداص عجرم
+
+ناريا درادناتسا یلم نامزاس
+
+ذخا ار روکذم درادناتسا ،لوصحم هدننکديلوت ايآ ؟تسا هدومن
+
+ريخ
+
+یلب
+
+## سروب رد شريذپ -3
+
+کرادم هئارا خيرات
+
+1403/09/19
+
+شريذپ خيرات
+
+1403/10/04
+
+هضرع هتيمک هسلج هرامش
+
+436
+
+همانديما جرد خيرات
+
+1403/10/05
+
+شريذپ رواشم
+
+سروب نومرآ یرازگراک
+
+رد لااک شريذپ زا سپ هياپ تميق نييعت ةوحن سروب
+
+یناهج  یاه تميق ساسا رب
+
+شورف /شورف لک /ديلوت زا هضرع دصرد لقادح یلخاد
+
+نت 47.500 اي هنايلاس ديلوت زا %50 لقادح
+
+ليوحت زاجم یاطخ
+
+ليوحت لباق هلومحم نيرخآ 5%
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v2/right_to_left_03.pages.json b/tests/data/groundtruth/docling_v2/right_to_left_03.pages.json
new file mode 100644
index 00000000..3a32bdc7
--- /dev/null
+++ b/tests/data/groundtruth/docling_v2/right_to_left_03.pages.json
@@ -0,0 +1 @@
+[{"page_no": 0, "size": {"width": 595.3200073242188, "height": 842.0399780273438}, "cells": [{"id": 0, "text": "  ", "bbox": {"l": 424.7499980908787, "t": 16.547979961232954, "r": 472.65999787553795, "b": 29.831969930112336, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "\u0646\u0627\u0631\u064a\u0627 \u06cc\u0644\u0627\u0627\u06a9 \u0633\u0631\u0648\u0628 \u062a\u06a9\u0631\u0634", "bbox": {"l": 388.989988251609, "t": 91.78875978496546, "r": 481.6045778353348, "b": 105.05883975387746, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "\u06cc\u0644\u062e\u0627\u062f \u06cc\u0644\u0627\u0627\u06a9 - \u06cc\u0644\u0635\u0627 \u0631\u0627\u0632\u0627\u0628 \u0631\u062f \u0634\u0631\u064a\u0630\u067e \u0647\u0645\u0627\u0646\u062f\u064a\u0645\u0627", "bbox": {"l": 68.78399669083697, "t": 62.65173985322508, "r": 267.65960879695194, "b": 81.03008981017001, "coord_origin": "TOPLEFT"}}, {"id": 3, "text": "Page 7 ", "bbox": {"l": 267.2900087986132, "t": 779.4899791738803, "r": 294.5899986759081, "b": 790.0379791491694, "coord_origin": "TOPLEFT"}}, {"id": 4, "text": " \u0644\u0627\u0627\u06a9 \u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627 -2-5", "bbox": {"l": 373.9899883190294, "t": 138.63494967521842, "r": 479.52999784465936, "b": 156.66497963297923, "coord_origin": "TOPLEFT"}}, {"id": 5, "text": "\u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627 \u0645\u0627\u0646", "bbox": {"l": 458.7399879381041, "t": 162.42376961948798, "r": 519.2383976661823, "b": 179.2998695799522, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": " \u06cc\u0631\u06af", "bbox": {"l": 66.38400270162423, "t": 160.86797962313278, "r": 82.90500562736736, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "\u0647\u062a\u062e\u064a\u0631", "bbox": {"l": 91.16550359023896, "t": 160.86797962313278, "r": 111.81675949741789, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "\u0634\u0648\u0631", "bbox": {"l": 120.07725946028945, "t": 160.86797962313278, "r": 132.46799940459687, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "\u0647\u0628", "bbox": {"l": 140.72851936746835, "t": 160.86797962313278, "r": 148.98900933034, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "\u0647\u062f\u0634", "bbox": {"l": 157.24950929321156, "t": 160.86797962313278, "r": 169.64025923751896, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "\u062f\u064a\u0644\u0648\u062a", "bbox": {"l": 177.90075920039052, "t": 160.86797962313278, "r": 198.55201910756944, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "\u0644\u0627\u0634\u0645\u0634", "bbox": {"l": 206.812519070441, "t": 160.86797962313278, "r": 227.46375897762002, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "\u0648", "bbox": {"l": 235.72425894049158, "t": 160.86797962313278, "r": 239.85451892192734, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "\u0647\u0634\u0645\u0634", "bbox": {"l": 248.1150188847989, "t": 160.86797962313278, "r": 264.63601881054205, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "\u0641\u0631\u0635\u0645", "bbox": {"l": 193.57520912993866, "t": 178.74798958124518, "r": 209.40560905878587, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "\u062f\u0631\u0648\u0645", "bbox": {"l": 217.3208190232094, "t": 178.74798958124518, "r": 233.15122895205658, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "\u0647\u062a\u0633\u0648\u064a\u067e", "bbox": {"l": 241.06643891648014, "t": 178.74798958124518, "r": 264.81203880975096, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "\u06cc\u0627", "bbox": {"l": 105.01999952796723, "t": 178.74798958124518, "r": 112.34326949505137, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "\u0647\u0632\u0627\u0633", "bbox": {"l": 119.66654946213548, "t": 178.74798958124518, "r": 134.3130993963037, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "\u06cc\u0627\u0647\u062f\u0644\u0627\u0648\u0641", "bbox": {"l": 141.63636936338784, "t": 178.74798958124518, "r": 170.92946923172434, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "\u0631\u062f", "bbox": {"l": 178.25274919880843, "t": 178.74798958124518, "r": 185.57601916589257, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "- ", "bbox": {"l": 96.02400156840149, "t": 178.74798958124518, "r": 103.62799953422386, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": " \u0642\u0628\u0627\u0637\u0645 ", "bbox": {"l": 66.26399970216359, "t": 178.74798958124518, "r": 94.75199857411876, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "\u062a\u0633\u0648\u064a\u067e \u0632\u064a\u0644\u0627\u0646\u0622", "bbox": {"l": 218.2100090192128, "t": 196.50799953963872, "r": 264.81795880972436, "b": 210.49999950685924, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "\u06cc\u0644\u0645 \u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627 \u0647\u0631\u0627\u0645\u0634", "bbox": {"l": 420.9099981081384, "t": 216.30376949326285, "r": 519.1619876665258, "b": 233.17986945372706, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "20300", "bbox": {"l": 236.80999893561153, "t": 214.7479894969075, "r": 265.01000880886113, "b": 228.73998946412837, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "\u061f\u062a\u0633\u0627 \u06cc\u0631\u0627\u0628\u062c\u0627 \u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627", "bbox": {"l": 406.9899881707045, "t": 239.01372944005993, "r": 519.1415376666176, "b": 255.88982940052404, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "\u0631\u064a\u062e       \u06cc\u0644\u0628      ", "bbox": {"l": 197.32999911306206, "t": 237.4579494437046, "r": 264.91399880929265, "b": 251.44994941092557, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "\u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627 \u0647\u062f\u0646\u0646\u06a9\u0631\u062f\u0627\u0635 \u0639\u062c\u0631\u0645", "bbox": {"l": 389.4699982494516, "t": 261.6937293869272, "r": 519.2136776662934, "b": 278.5698293473914, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "\u0646\u0627\u0631\u064a\u0627 \u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627 \u06cc\u0644\u0645 \u0646\u0627\u0645\u0632\u0627\u0633", "bbox": {"l": 166.5799992512739, "t": 260.137939390572, "r": 264.77599880991295, "b": 274.12994935779284, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": " \u0630\u062e\u0627 \u0627\u0631 \u0631\u0648\u06a9\u0630\u0645 \u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627 \u060c\u0644\u0648\u0635\u062d\u0645 \u0647\u062f\u0646\u0646\u06a9\u062f\u064a\u0644\u0648\u062a \u0627\u064a\u0622", "bbox": {"l": 292.129998686965, "t": 284.37377933379446, "r": 519.114747666738, "b": 301.24987929425856, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "\u061f\u062a\u0633\u0627 \u0647\u062f\u0648\u0645\u0646", "bbox": {"l": 461.98000792354117, "t": 306.5737292817864, "r": 519.2351676661968, "b": 323.44982924225053, "coord_origin": "TOPLEFT"}}, {"id": 33, "text": "      ", "bbox": {"l": 247.36999888814756, "t": 282.81799933743923, "r": 264.91399880929265, "b": 296.80999930466, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "\u0631\u064a\u062e", "bbox": {"l": 197.32999911306206, "t": 282.81799933743923, "r": 208.04769906488926, "b": 296.80999930466, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "\u06cc\u0644\u0628", "bbox": {"l": 236.62821893642857, "t": 282.81799933743923, "r": 247.34591888825577, "b": 296.80999930466, "coord_origin": "TOPLEFT"}}, {"id": 36, "text": "\u0633\u0631\u0648\u0628 \u0631\u062f \u0634\u0631\u064a\u0630\u067e -3", "bbox": {"l": 409.0299981615353, "t": 351.4537691766454, "r": 505.7644977267433, "b": 368.3298391371096, "coord_origin": "TOPLEFT"}}, {"id": 37, "text": " \u06a9\u0631\u0627\u062f\u0645 \u0647\u0626\u0627\u0631\u0627 \u062e\u064a\u0631\u0627\u062a", "bbox": {"l": 405.30999817825557, "t": 374.1537791234659, "r": 492.6107177858655, "b": 391.0298490839301, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "1403/09/19", "bbox": {"l": 137.89998938018175, "t": 372.57796912715753, "r": 187.8199891558066, "b": 386.56997909437825, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": " \u0634\u0631\u064a\u0630\u067e \u062e\u064a\u0631\u0627\u062a", "bbox": {"l": 426.309998083867, "t": 396.8337690703332, "r": 492.59463778593783, "b": 413.70983903079747, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "1403/10/04", "bbox": {"l": 137.89998938018175, "t": 395.277959073978, "r": 187.8199891558066, "b": 409.26995904119883, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": " \u0647\u0636\u0631\u0639 \u0647\u062a\u064a\u0645\u06a9 \u0647\u0633\u0644\u062c \u0647\u0631\u0627\u0645\u0634", "bbox": {"l": 367.14998834977314, "t": 419.5137990172004, "r": 492.68526778553047, "b": 436.3898589776647, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "436", "bbox": {"l": 154.69999930467083, "t": 418.0779690205642, "r": 171.19999923050838, "b": 432.0699789877849, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": " \u0647\u0645\u0627\u0646\u062f\u064a\u0645\u0627 \u062c\u0631\u062f \u062e\u064a\u0631\u0627\u062a", "bbox": {"l": 399.42998820468443, "t": 442.3137789637867, "r": 492.62752778578994, "b": 459.18984892425095, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "1403/10/05", "bbox": {"l": 137.89998938018175, "t": 440.75796896743145, "r": 187.8199891558066, "b": 454.7499689346523, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": " \u0634\u0631\u064a\u0630\u067e \u0631\u0648\u0627\u0634\u0645", "bbox": {"l": 422.82998809950857, "t": 464.993778910654, "r": 492.6789577855588, "b": 481.8698388711183, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "\u0633\u0631\u0648\u0628 \u0646\u0648\u0645\u0631\u0622 \u06cc\u0631\u0627\u0632\u06af\u0631\u0627\u06a9", "bbox": {"l": 122.05999945137766, "t": 463.43795891429886, "r": 203.6480090846645, "b": 477.42995888151955, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": " \u0631\u062f \u0644\u0627\u0627\u06a9 \u0634\u0631\u064a\u0630\u067e \u0632\u0627 \u0633\u067e \u0647\u064a\u0627\u067e \u062a\u0645\u064a\u0642 \u0646\u064a\u064a\u0639\u062a \u0629\u0648\u062d\u0646", "bbox": {"l": 281.3299887355078, "t": 489.35378885358557, "r": 492.5758377860224, "b": 506.2298588140498, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "\u0633\u0631\u0648\u0628", "bbox": {"l": 465.57998790736036, "t": 511.4337788018585, "r": 492.70525778544066, "b": 528.3098487623228, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": " \u06cc\u0646\u0627\u0647\u062c  \u06cc\u0627\u0647 \u062a\u0645\u064a\u0642 \u0633\u0627\u0633\u0627 \u0631\u0628", "bbox": {"l": 109.21999950908952, "t": 487.7979788572303, "r": 213.67396903960088, "b": 501.78997882445117, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": " \u0634\u0648\u0631\u0641 /\u0634\u0648\u0631\u0641 \u0644\u06a9 /\u062f\u064a\u0644\u0648\u062a \u0632\u0627 \u0647\u0636\u0631\u0639 \u062f\u0635\u0631\u062f \u0644\u0642\u0627\u062f\u062d", "bbox": {"l": 266.5700088018494, "t": 534.2637987483744, "r": 492.6496877856904, "b": 551.1398587088386, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "\u06cc\u0644\u062e\u0627\u062f", "bbox": {"l": 462.2199979224626, "t": 556.3437786966474, "r": 492.7008677854604, "b": 573.2198486571116, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "\u0646\u062a 47.500 \u0627\u064a \u0647\u0646\u0627\u064a\u0644\u0627\u0633 \u062f\u064a\u0644\u0648\u062a \u0632\u0627 %50 \u0644\u0642\u0627\u062f\u062d", "bbox": {"l": 85.4639966158655, "t": 532.7079787520192, "r": 240.36199891964634, "b": 546.69997871924, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "\u0644\u064a\u0648\u062d\u062a \u0632\u0627\u062c\u0645 \u06cc\u0627\u0637\u062e", "bbox": {"l": 404.2300081831098, "t": 579.1437686432336, "r": 492.6399177857343, "b": 596.0198686036978, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "\u0644\u064a\u0648\u062d\u062a \u0644\u0628\u0627\u0642 \u0647\u0644\u0648\u0645\u062d\u0645 \u0646\u064a\u0631\u062e\u0622 5%", "bbox": {"l": 106.93999951933742, "t": 577.5879786468784, "r": 218.89399901613845, "b": 591.5799886140991, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 0, "label": "picture", "bbox": {"l": 388.5767822265625, "t": 36.03587341308594, "r": 482.4759216308594, "b": 103.00555419921875, "coord_origin": "TOPLEFT"}, "confidence": 0.9453065991401672, "cells": [{"id": 1, "text": "\u0646\u0627\u0631\u064a\u0627 \u06cc\u0644\u0627\u0627\u06a9 \u0633\u0631\u0648\u0628 \u062a\u06a9\u0631\u0634", "bbox": {"l": 388.989988251609, "t": 91.78875978496546, "r": 481.6045778353348, "b": 105.05883975387746, "coord_origin": "TOPLEFT"}}], "children": [{"id": 43, "label": "text", "bbox": {"l": 388.989988251609, "t": 91.78875978496546, "r": 481.6045778353348, "b": 105.05883975387746, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 1, "text": "\u0646\u0627\u0631\u064a\u0627 \u06cc\u0644\u0627\u0627\u06a9 \u0633\u0631\u0648\u0628 \u062a\u06a9\u0631\u0634", "bbox": {"l": 388.989988251609, "t": 91.78875978496546, "r": 481.6045778353348, "b": 105.05883975387746, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 28, "label": "section_header", "bbox": {"l": 68.78399669083697, "t": 62.65173985322508, "r": 267.65960879695194, "b": 81.03008981017001, "coord_origin": "TOPLEFT"}, "confidence": 0.6917961239814758, "cells": [{"id": 2, "text": "\u06cc\u0644\u062e\u0627\u062f \u06cc\u0644\u0627\u0627\u06a9 - \u06cc\u0644\u0635\u0627 \u0631\u0627\u0632\u0627\u0628 \u0631\u062f \u0634\u0631\u064a\u0630\u067e \u0647\u0645\u0627\u0646\u062f\u064a\u0645\u0627", "bbox": {"l": 68.78399669083697, "t": 62.65173985322508, "r": 267.65960879695194, "b": 81.03008981017001, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 1, "label": "page_footer", "bbox": {"l": 267.2900087986132, "t": 779.4899791738803, "r": 294.5899986759081, "b": 790.0379791491694, "coord_origin": "TOPLEFT"}, "confidence": 0.899228036403656, "cells": [{"id": 3, "text": "Page 7 ", "bbox": {"l": 267.2900087986132, "t": 779.4899791738803, "r": 294.5899986759081, "b": 790.0379791491694, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 11, "label": "section_header", "bbox": {"l": 373.9899883190294, "t": 138.63494967521842, "r": 479.52999784465936, "b": 156.66497963297923, "coord_origin": "TOPLEFT"}, "confidence": 0.7994307279586792, "cells": [{"id": 4, "text": " \u0644\u0627\u0627\u06a9 \u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627 -2-5", "bbox": {"l": 373.9899883190294, "t": 138.63494967521842, "r": 479.52999784465936, "b": 156.66497963297923, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 33, "label": "key_value_region", "bbox": {"l": 66.26399970216359, "t": 160.86797962313278, "r": 519.2383976661823, "b": 323.44982924225053, "coord_origin": "TOPLEFT"}, "confidence": 0.6362584233283997, "cells": [{"id": 5, "text": "\u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627 \u0645\u0627\u0646", "bbox": {"l": 458.7399879381041, "t": 162.42376961948798, "r": 519.2383976661823, "b": 179.2998695799522, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": " \u06cc\u0631\u06af", "bbox": {"l": 66.38400270162423, "t": 160.86797962313278, "r": 82.90500562736736, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "\u0647\u062a\u062e\u064a\u0631", "bbox": {"l": 91.16550359023896, "t": 160.86797962313278, "r": 111.81675949741789, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "\u0634\u0648\u0631", "bbox": {"l": 120.07725946028945, "t": 160.86797962313278, "r": 132.46799940459687, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "\u0647\u0628", "bbox": {"l": 140.72851936746835, "t": 160.86797962313278, "r": 148.98900933034, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "\u0647\u062f\u0634", "bbox": {"l": 157.24950929321156, "t": 160.86797962313278, "r": 169.64025923751896, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "\u062f\u064a\u0644\u0648\u062a", "bbox": {"l": 177.90075920039052, "t": 160.86797962313278, "r": 198.55201910756944, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "\u0644\u0627\u0634\u0645\u0634", "bbox": {"l": 206.812519070441, "t": 160.86797962313278, "r": 227.46375897762002, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "\u0648", "bbox": {"l": 235.72425894049158, "t": 160.86797962313278, "r": 239.85451892192734, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "\u0647\u0634\u0645\u0634", "bbox": {"l": 248.1150188847989, "t": 160.86797962313278, "r": 264.63601881054205, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "\u0641\u0631\u0635\u0645", "bbox": {"l": 193.57520912993866, "t": 178.74798958124518, "r": 209.40560905878587, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "\u062f\u0631\u0648\u0645", "bbox": {"l": 217.3208190232094, "t": 178.74798958124518, "r": 233.15122895205658, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "\u0647\u062a\u0633\u0648\u064a\u067e", "bbox": {"l": 241.06643891648014, "t": 178.74798958124518, "r": 264.81203880975096, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "\u06cc\u0627", "bbox": {"l": 105.01999952796723, "t": 178.74798958124518, "r": 112.34326949505137, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "\u0647\u0632\u0627\u0633", "bbox": {"l": 119.66654946213548, "t": 178.74798958124518, "r": 134.3130993963037, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "\u06cc\u0627\u0647\u062f\u0644\u0627\u0648\u0641", "bbox": {"l": 141.63636936338784, "t": 178.74798958124518, "r": 170.92946923172434, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "\u0631\u062f", "bbox": {"l": 178.25274919880843, "t": 178.74798958124518, "r": 185.57601916589257, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "- ", "bbox": {"l": 96.02400156840149, "t": 178.74798958124518, "r": 103.62799953422386, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": " \u0642\u0628\u0627\u0637\u0645 ", "bbox": {"l": 66.26399970216359, "t": 178.74798958124518, "r": 94.75199857411876, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "\u062a\u0633\u0648\u064a\u067e \u0632\u064a\u0644\u0627\u0646\u0622", "bbox": {"l": 218.2100090192128, "t": 196.50799953963872, "r": 264.81795880972436, "b": 210.49999950685924, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "\u06cc\u0644\u0645 \u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627 \u0647\u0631\u0627\u0645\u0634", "bbox": {"l": 420.9099981081384, "t": 216.30376949326285, "r": 519.1619876665258, "b": 233.17986945372706, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "20300", "bbox": {"l": 236.80999893561153, "t": 214.7479894969075, "r": 265.01000880886113, "b": 228.73998946412837, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "\u061f\u062a\u0633\u0627 \u06cc\u0631\u0627\u0628\u062c\u0627 \u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627", "bbox": {"l": 406.9899881707045, "t": 239.01372944005993, "r": 519.1415376666176, "b": 255.88982940052404, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "\u0631\u064a\u062e       \u06cc\u0644\u0628      ", "bbox": {"l": 197.32999911306206, "t": 237.4579494437046, "r": 264.91399880929265, "b": 251.44994941092557, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "\u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627 \u0647\u062f\u0646\u0646\u06a9\u0631\u062f\u0627\u0635 \u0639\u062c\u0631\u0645", "bbox": {"l": 389.4699982494516, "t": 261.6937293869272, "r": 519.2136776662934, "b": 278.5698293473914, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "\u0646\u0627\u0631\u064a\u0627 \u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627 \u06cc\u0644\u0645 \u0646\u0627\u0645\u0632\u0627\u0633", "bbox": {"l": 166.5799992512739, "t": 260.137939390572, "r": 264.77599880991295, "b": 274.12994935779284, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": " \u0630\u062e\u0627 \u0627\u0631 \u0631\u0648\u06a9\u0630\u0645 \u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627 \u060c\u0644\u0648\u0635\u062d\u0645 \u0647\u062f\u0646\u0646\u06a9\u062f\u064a\u0644\u0648\u062a \u0627\u064a\u0622", "bbox": {"l": 292.129998686965, "t": 284.37377933379446, "r": 519.114747666738, "b": 301.24987929425856, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "\u061f\u062a\u0633\u0627 \u0647\u062f\u0648\u0645\u0646", "bbox": {"l": 461.98000792354117, "t": 306.5737292817864, "r": 519.2351676661968, "b": 323.44982924225053, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "\u0631\u064a\u062e", "bbox": {"l": 197.32999911306206, "t": 282.81799933743923, "r": 208.04769906488926, "b": 296.80999930466, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "\u06cc\u0644\u0628", "bbox": {"l": 236.62821893642857, "t": 282.81799933743923, "r": 247.34591888825577, "b": 296.80999930466, "coord_origin": "TOPLEFT"}}], "children": [{"id": 25, "label": "text", "bbox": {"l": 458.7399879381041, "t": 162.42376961948798, "r": 519.2383976661823, "b": 179.2998695799522, "coord_origin": "TOPLEFT"}, "confidence": 0.7258325815200806, "cells": [{"id": 5, "text": "\u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627 \u0645\u0627\u0646", "bbox": {"l": 458.7399879381041, "t": 162.42376961948798, "r": 519.2383976661823, "b": 179.2998695799522, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 66.26399970216359, "t": 160.86797962313278, "r": 264.81795880972436, "b": 210.49999950685924, "coord_origin": "TOPLEFT"}, "confidence": 0.8694157004356384, "cells": [{"id": 6, "text": " \u06cc\u0631\u06af", "bbox": {"l": 66.38400270162423, "t": 160.86797962313278, "r": 82.90500562736736, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "\u0647\u062a\u062e\u064a\u0631", "bbox": {"l": 91.16550359023896, "t": 160.86797962313278, "r": 111.81675949741789, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "\u0634\u0648\u0631", "bbox": {"l": 120.07725946028945, "t": 160.86797962313278, "r": 132.46799940459687, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "\u0647\u0628", "bbox": {"l": 140.72851936746835, "t": 160.86797962313278, "r": 148.98900933034, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "\u0647\u062f\u0634", "bbox": {"l": 157.24950929321156, "t": 160.86797962313278, "r": 169.64025923751896, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "\u062f\u064a\u0644\u0648\u062a", "bbox": {"l": 177.90075920039052, "t": 160.86797962313278, "r": 198.55201910756944, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "\u0644\u0627\u0634\u0645\u0634", "bbox": {"l": 206.812519070441, "t": 160.86797962313278, "r": 227.46375897762002, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "\u0648", "bbox": {"l": 235.72425894049158, "t": 160.86797962313278, "r": 239.85451892192734, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "\u0647\u0634\u0645\u0634", "bbox": {"l": 248.1150188847989, "t": 160.86797962313278, "r": 264.63601881054205, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "\u0641\u0631\u0635\u0645", "bbox": {"l": 193.57520912993866, "t": 178.74798958124518, "r": 209.40560905878587, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "\u062f\u0631\u0648\u0645", "bbox": {"l": 217.3208190232094, "t": 178.74798958124518, "r": 233.15122895205658, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "\u0647\u062a\u0633\u0648\u064a\u067e", "bbox": {"l": 241.06643891648014, "t": 178.74798958124518, "r": 264.81203880975096, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "\u06cc\u0627", "bbox": {"l": 105.01999952796723, "t": 178.74798958124518, "r": 112.34326949505137, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "\u0647\u0632\u0627\u0633", "bbox": {"l": 119.66654946213548, "t": 178.74798958124518, "r": 134.3130993963037, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "\u06cc\u0627\u0647\u062f\u0644\u0627\u0648\u0641", "bbox": {"l": 141.63636936338784, "t": 178.74798958124518, "r": 170.92946923172434, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "\u0631\u062f", "bbox": {"l": 178.25274919880843, "t": 178.74798958124518, "r": 185.57601916589257, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "- ", "bbox": {"l": 96.02400156840149, "t": 178.74798958124518, "r": 103.62799953422386, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": " \u0642\u0628\u0627\u0637\u0645 ", "bbox": {"l": 66.26399970216359, "t": 178.74798958124518, "r": 94.75199857411876, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "\u062a\u0633\u0648\u064a\u067e \u0632\u064a\u0644\u0627\u0646\u0622", "bbox": {"l": 218.2100090192128, "t": 196.50799953963872, "r": 264.81795880972436, "b": 210.49999950685924, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 420.9099981081384, "t": 216.30376949326285, "r": 519.1619876665258, "b": 233.17986945372706, "coord_origin": "TOPLEFT"}, "confidence": 0.8121814727783203, "cells": [{"id": 25, "text": "\u06cc\u0644\u0645 \u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627 \u0647\u0631\u0627\u0645\u0634", "bbox": {"l": 420.9099981081384, "t": 216.30376949326285, "r": 519.1619876665258, "b": 233.17986945372706, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 236.80999893561153, "t": 214.7479894969075, "r": 265.01000880886113, "b": 228.73998946412837, "coord_origin": "TOPLEFT"}, "confidence": 0.7672220468521118, "cells": [{"id": 26, "text": "20300", "bbox": {"l": 236.80999893561153, "t": 214.7479894969075, "r": 265.01000880886113, "b": 228.73998946412837, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "text", "bbox": {"l": 406.9899881707045, "t": 239.01372944005993, "r": 519.1415376666176, "b": 255.88982940052404, "coord_origin": "TOPLEFT"}, "confidence": 0.8320456743240356, "cells": [{"id": 27, "text": "\u061f\u062a\u0633\u0627 \u06cc\u0631\u0627\u0628\u062c\u0627 \u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627", "bbox": {"l": 406.9899881707045, "t": 239.01372944005993, "r": 519.1415376666176, "b": 255.88982940052404, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "checkbox_unselected", "bbox": {"l": 197.32999911306206, "t": 237.4579494437046, "r": 264.91399880929265, "b": 251.44994941092557, "coord_origin": "TOPLEFT"}, "confidence": 0.5538824796676636, "cells": [{"id": 28, "text": "\u0631\u064a\u062e       \u06cc\u0644\u0628      ", "bbox": {"l": 197.32999911306206, "t": 237.4579494437046, "r": 264.91399880929265, "b": 251.44994941092557, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 389.4699982494516, "t": 261.6937293869272, "r": 519.2136776662934, "b": 278.5698293473914, "coord_origin": "TOPLEFT"}, "confidence": 0.7909000515937805, "cells": [{"id": 29, "text": "\u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627 \u0647\u062f\u0646\u0646\u06a9\u0631\u062f\u0627\u0635 \u0639\u062c\u0631\u0645", "bbox": {"l": 389.4699982494516, "t": 261.6937293869272, "r": 519.2136776662934, "b": 278.5698293473914, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 166.5799992512739, "t": 260.137939390572, "r": 264.77599880991295, "b": 274.12994935779284, "coord_origin": "TOPLEFT"}, "confidence": 0.7620571851730347, "cells": [{"id": 30, "text": "\u0646\u0627\u0631\u064a\u0627 \u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627 \u06cc\u0644\u0645 \u0646\u0627\u0645\u0632\u0627\u0633", "bbox": {"l": 166.5799992512739, "t": 260.137939390572, "r": 264.77599880991295, "b": 274.12994935779284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 292.129998686965, "t": 284.37377933379446, "r": 519.2351676661968, "b": 323.44982924225053, "coord_origin": "TOPLEFT"}, "confidence": 0.6534578204154968, "cells": [{"id": 31, "text": " \u0630\u062e\u0627 \u0627\u0631 \u0631\u0648\u06a9\u0630\u0645 \u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627 \u060c\u0644\u0648\u0635\u062d\u0645 \u0647\u062f\u0646\u0646\u06a9\u062f\u064a\u0644\u0648\u062a \u0627\u064a\u0622", "bbox": {"l": 292.129998686965, "t": 284.37377933379446, "r": 519.114747666738, "b": 301.24987929425856, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "\u061f\u062a\u0633\u0627 \u0647\u062f\u0648\u0645\u0646", "bbox": {"l": 461.98000792354117, "t": 306.5737292817864, "r": 519.2351676661968, "b": 323.44982924225053, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "checkbox_selected", "bbox": {"l": 197.32999911306206, "t": 282.81799933743923, "r": 208.04769906488926, "b": 296.80999930466, "coord_origin": "TOPLEFT"}, "confidence": 0.49446165561676025, "cells": [{"id": 34, "text": "\u0631\u064a\u062e", "bbox": {"l": 197.32999911306206, "t": 282.81799933743923, "r": 208.04769906488926, "b": 296.80999930466, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "checkbox_unselected", "bbox": {"l": 236.62821893642857, "t": 282.81799933743923, "r": 247.34591888825577, "b": 296.80999930466, "coord_origin": "TOPLEFT"}, "confidence": 0.5417144298553467, "cells": [{"id": 35, "text": "\u06cc\u0644\u0628", "bbox": {"l": 236.62821893642857, "t": 282.81799933743923, "r": 247.34591888825577, "b": 296.80999930466, "coord_origin": "TOPLEFT"}}], "children": []}]}, {"id": 31, "label": "section_header", "bbox": {"l": 409.0299981615353, "t": 351.4537691766454, "r": 505.7644977267433, "b": 368.3298391371096, "coord_origin": "TOPLEFT"}, "confidence": 0.6514244079589844, "cells": [{"id": 36, "text": "\u0633\u0631\u0648\u0628 \u0631\u062f \u0634\u0631\u064a\u0630\u067e -3", "bbox": {"l": 409.0299981615353, "t": 351.4537691766454, "r": 505.7644977267433, "b": 368.3298391371096, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 27, "label": "key_value_region", "bbox": {"l": 85.4639966158655, "t": 372.57796912715753, "r": 492.70525778544066, "b": 596.0198686036978, "coord_origin": "TOPLEFT"}, "confidence": 0.719137966632843, "cells": [{"id": 37, "text": " \u06a9\u0631\u0627\u062f\u0645 \u0647\u0626\u0627\u0631\u0627 \u062e\u064a\u0631\u0627\u062a", "bbox": {"l": 405.30999817825557, "t": 374.1537791234659, "r": 492.6107177858655, "b": 391.0298490839301, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "1403/09/19", "bbox": {"l": 137.89998938018175, "t": 372.57796912715753, "r": 187.8199891558066, "b": 386.56997909437825, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": " \u0634\u0631\u064a\u0630\u067e \u062e\u064a\u0631\u0627\u062a", "bbox": {"l": 426.309998083867, "t": 396.8337690703332, "r": 492.59463778593783, "b": 413.70983903079747, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "1403/10/04", "bbox": {"l": 137.89998938018175, "t": 395.277959073978, "r": 187.8199891558066, "b": 409.26995904119883, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": " \u0647\u0636\u0631\u0639 \u0647\u062a\u064a\u0645\u06a9 \u0647\u0633\u0644\u062c \u0647\u0631\u0627\u0645\u0634", "bbox": {"l": 367.14998834977314, "t": 419.5137990172004, "r": 492.68526778553047, "b": 436.3898589776647, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "436", "bbox": {"l": 154.69999930467083, "t": 418.0779690205642, "r": 171.19999923050838, "b": 432.0699789877849, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": " \u0647\u0645\u0627\u0646\u062f\u064a\u0645\u0627 \u062c\u0631\u062f \u062e\u064a\u0631\u0627\u062a", "bbox": {"l": 399.42998820468443, "t": 442.3137789637867, "r": 492.62752778578994, "b": 459.18984892425095, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "1403/10/05", "bbox": {"l": 137.89998938018175, "t": 440.75796896743145, "r": 187.8199891558066, "b": 454.7499689346523, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": " \u0634\u0631\u064a\u0630\u067e \u0631\u0648\u0627\u0634\u0645", "bbox": {"l": 422.82998809950857, "t": 464.993778910654, "r": 492.6789577855588, "b": 481.8698388711183, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "\u0633\u0631\u0648\u0628 \u0646\u0648\u0645\u0631\u0622 \u06cc\u0631\u0627\u0632\u06af\u0631\u0627\u06a9", "bbox": {"l": 122.05999945137766, "t": 463.43795891429886, "r": 203.6480090846645, "b": 477.42995888151955, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": " \u0631\u062f \u0644\u0627\u0627\u06a9 \u0634\u0631\u064a\u0630\u067e \u0632\u0627 \u0633\u067e \u0647\u064a\u0627\u067e \u062a\u0645\u064a\u0642 \u0646\u064a\u064a\u0639\u062a \u0629\u0648\u062d\u0646", "bbox": {"l": 281.3299887355078, "t": 489.35378885358557, "r": 492.5758377860224, "b": 506.2298588140498, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "\u0633\u0631\u0648\u0628", "bbox": {"l": 465.57998790736036, "t": 511.4337788018585, "r": 492.70525778544066, "b": 528.3098487623228, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": " \u06cc\u0646\u0627\u0647\u062c  \u06cc\u0627\u0647 \u062a\u0645\u064a\u0642 \u0633\u0627\u0633\u0627 \u0631\u0628", "bbox": {"l": 109.21999950908952, "t": 487.7979788572303, "r": 213.67396903960088, "b": 501.78997882445117, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": " \u0634\u0648\u0631\u0641 /\u0634\u0648\u0631\u0641 \u0644\u06a9 /\u062f\u064a\u0644\u0648\u062a \u0632\u0627 \u0647\u0636\u0631\u0639 \u062f\u0635\u0631\u062f \u0644\u0642\u0627\u062f\u062d", "bbox": {"l": 266.5700088018494, "t": 534.2637987483744, "r": 492.6496877856904, "b": 551.1398587088386, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "\u06cc\u0644\u062e\u0627\u062f", "bbox": {"l": 462.2199979224626, "t": 556.3437786966474, "r": 492.7008677854604, "b": 573.2198486571116, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "\u0646\u062a 47.500 \u0627\u064a \u0647\u0646\u0627\u064a\u0644\u0627\u0633 \u062f\u064a\u0644\u0648\u062a \u0632\u0627 %50 \u0644\u0642\u0627\u062f\u062d", "bbox": {"l": 85.4639966158655, "t": 532.7079787520192, "r": 240.36199891964634, "b": 546.69997871924, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "\u0644\u064a\u0648\u062d\u062a \u0632\u0627\u062c\u0645 \u06cc\u0627\u0637\u062e", "bbox": {"l": 404.2300081831098, "t": 579.1437686432336, "r": 492.6399177857343, "b": 596.0198686036978, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "\u0644\u064a\u0648\u062d\u062a \u0644\u0628\u0627\u0642 \u0647\u0644\u0648\u0645\u062d\u0645 \u0646\u064a\u0631\u062e\u0622 5%", "bbox": {"l": 106.93999951933742, "t": 577.5879786468784, "r": 218.89399901613845, "b": 591.5799886140991, "coord_origin": "TOPLEFT"}}], "children": [{"id": 15, "label": "text", "bbox": {"l": 405.30999817825557, "t": 374.1537791234659, "r": 492.6107177858655, "b": 391.0298490839301, "coord_origin": "TOPLEFT"}, "confidence": 0.7834645509719849, "cells": [{"id": 37, "text": " \u06a9\u0631\u0627\u062f\u0645 \u0647\u0626\u0627\u0631\u0627 \u062e\u064a\u0631\u0627\u062a", "bbox": {"l": 405.30999817825557, "t": 374.1537791234659, "r": 492.6107177858655, "b": 391.0298490839301, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "text", "bbox": {"l": 137.89998938018175, "t": 372.57796912715753, "r": 187.8199891558066, "b": 386.56997909437825, "coord_origin": "TOPLEFT"}, "confidence": 0.8262879252433777, "cells": [{"id": 38, "text": "1403/09/19", "bbox": {"l": 137.89998938018175, "t": 372.57796912715753, "r": 187.8199891558066, "b": 386.56997909437825, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 426.309998083867, "t": 396.8337690703332, "r": 492.59463778593783, "b": 413.70983903079747, "coord_origin": "TOPLEFT"}, "confidence": 0.7766718864440918, "cells": [{"id": 39, "text": " \u0634\u0631\u064a\u0630\u067e \u062e\u064a\u0631\u0627\u062a", "bbox": {"l": 426.309998083867, "t": 396.8337690703332, "r": 492.59463778593783, "b": 413.70983903079747, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "text", "bbox": {"l": 137.89998938018175, "t": 395.277959073978, "r": 187.8199891558066, "b": 409.26995904119883, "coord_origin": "TOPLEFT"}, "confidence": 0.8204737901687622, "cells": [{"id": 40, "text": "1403/10/04", "bbox": {"l": 137.89998938018175, "t": 395.277959073978, "r": 187.8199891558066, "b": 409.26995904119883, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 367.14998834977314, "t": 419.5137990172004, "r": 492.68526778553047, "b": 436.3898589776647, "coord_origin": "TOPLEFT"}, "confidence": 0.7670677900314331, "cells": [{"id": 41, "text": " \u0647\u0636\u0631\u0639 \u0647\u062a\u064a\u0645\u06a9 \u0647\u0633\u0644\u062c \u0647\u0631\u0627\u0645\u0634", "bbox": {"l": 367.14998834977314, "t": 419.5137990172004, "r": 492.68526778553047, "b": 436.3898589776647, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "text", "bbox": {"l": 154.69999930467083, "t": 418.0779690205642, "r": 171.19999923050838, "b": 432.0699789877849, "coord_origin": "TOPLEFT"}, "confidence": 0.8048340082168579, "cells": [{"id": 42, "text": "436", "bbox": {"l": 154.69999930467083, "t": 418.0779690205642, "r": 171.19999923050838, "b": 432.0699789877849, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 399.42998820468443, "t": 442.3137789637867, "r": 492.62752778578994, "b": 459.18984892425095, "coord_origin": "TOPLEFT"}, "confidence": 0.775697648525238, "cells": [{"id": 43, "text": " \u0647\u0645\u0627\u0646\u062f\u064a\u0645\u0627 \u062c\u0631\u062f \u062e\u064a\u0631\u0627\u062a", "bbox": {"l": 399.42998820468443, "t": 442.3137789637867, "r": 492.62752778578994, "b": 459.18984892425095, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "text", "bbox": {"l": 137.89998938018175, "t": 440.75796896743145, "r": 187.8199891558066, "b": 454.7499689346523, "coord_origin": "TOPLEFT"}, "confidence": 0.827337384223938, "cells": [{"id": 44, "text": "1403/10/05", "bbox": {"l": 137.89998938018175, "t": 440.75796896743145, "r": 187.8199891558066, "b": 454.7499689346523, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 422.82998809950857, "t": 464.993778910654, "r": 492.6789577855588, "b": 481.8698388711183, "coord_origin": "TOPLEFT"}, "confidence": 0.7342236638069153, "cells": [{"id": 45, "text": " \u0634\u0631\u064a\u0630\u067e \u0631\u0648\u0627\u0634\u0645", "bbox": {"l": 422.82998809950857, "t": 464.993778910654, "r": 492.6789577855588, "b": 481.8698388711183, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 122.05999945137766, "t": 463.43795891429886, "r": 203.6480090846645, "b": 477.42995888151955, "coord_origin": "TOPLEFT"}, "confidence": 0.8411222696304321, "cells": [{"id": 46, "text": "\u0633\u0631\u0648\u0628 \u0646\u0648\u0645\u0631\u0622 \u06cc\u0631\u0627\u0632\u06af\u0631\u0627\u06a9", "bbox": {"l": 122.05999945137766, "t": 463.43795891429886, "r": 203.6480090846645, "b": 477.42995888151955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 281.3299887355078, "t": 489.35378885358557, "r": 492.70525778544066, "b": 528.3098487623228, "coord_origin": "TOPLEFT"}, "confidence": 0.7251589894294739, "cells": [{"id": 47, "text": " \u0631\u062f \u0644\u0627\u0627\u06a9 \u0634\u0631\u064a\u0630\u067e \u0632\u0627 \u0633\u067e \u0647\u064a\u0627\u067e \u062a\u0645\u064a\u0642 \u0646\u064a\u064a\u0639\u062a \u0629\u0648\u062d\u0646", "bbox": {"l": 281.3299887355078, "t": 489.35378885358557, "r": 492.5758377860224, "b": 506.2298588140498, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "\u0633\u0631\u0648\u0628", "bbox": {"l": 465.57998790736036, "t": 511.4337788018585, "r": 492.70525778544066, "b": 528.3098487623228, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 109.21999950908952, "t": 487.7979788572303, "r": 213.67396903960088, "b": 501.78997882445117, "coord_origin": "TOPLEFT"}, "confidence": 0.7848678827285767, "cells": [{"id": 49, "text": " \u06cc\u0646\u0627\u0647\u062c  \u06cc\u0627\u0647 \u062a\u0645\u064a\u0642 \u0633\u0627\u0633\u0627 \u0631\u0628", "bbox": {"l": 109.21999950908952, "t": 487.7979788572303, "r": 213.67396903960088, "b": 501.78997882445117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 266.5700088018494, "t": 534.2637987483744, "r": 492.7008677854604, "b": 573.2198486571116, "coord_origin": "TOPLEFT"}, "confidence": 0.7586438059806824, "cells": [{"id": 50, "text": " \u0634\u0648\u0631\u0641 /\u0634\u0648\u0631\u0641 \u0644\u06a9 /\u062f\u064a\u0644\u0648\u062a \u0632\u0627 \u0647\u0636\u0631\u0639 \u062f\u0635\u0631\u062f \u0644\u0642\u0627\u062f\u062d", "bbox": {"l": 266.5700088018494, "t": 534.2637987483744, "r": 492.6496877856904, "b": 551.1398587088386, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "\u06cc\u0644\u062e\u0627\u062f", "bbox": {"l": 462.2199979224626, "t": 556.3437786966474, "r": 492.7008677854604, "b": 573.2198486571116, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 85.4639966158655, "t": 532.7079787520192, "r": 240.36199891964634, "b": 546.69997871924, "coord_origin": "TOPLEFT"}, "confidence": 0.7897851467132568, "cells": [{"id": 52, "text": "\u0646\u062a 47.500 \u0627\u064a \u0647\u0646\u0627\u064a\u0644\u0627\u0633 \u062f\u064a\u0644\u0648\u062a \u0632\u0627 %50 \u0644\u0642\u0627\u062f\u062d", "bbox": {"l": 85.4639966158655, "t": 532.7079787520192, "r": 240.36199891964634, "b": 546.69997871924, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 404.2300081831098, "t": 579.1437686432336, "r": 492.6399177857343, "b": 596.0198686036978, "coord_origin": "TOPLEFT"}, "confidence": 0.7759335041046143, "cells": [{"id": 53, "text": "\u0644\u064a\u0648\u062d\u062a \u0632\u0627\u062c\u0645 \u06cc\u0627\u0637\u062e", "bbox": {"l": 404.2300081831098, "t": 579.1437686432336, "r": 492.6399177857343, "b": 596.0198686036978, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "text", "bbox": {"l": 106.93999951933742, "t": 577.5879786468784, "r": 218.89399901613845, "b": 591.5799886140991, "coord_origin": "TOPLEFT"}, "confidence": 0.8144810795783997, "cells": [{"id": 54, "text": "\u0644\u064a\u0648\u062d\u062a \u0644\u0628\u0627\u0642 \u0647\u0644\u0648\u0645\u062d\u0645 \u0646\u064a\u0631\u062e\u0622 5%", "bbox": {"l": 106.93999951933742, "t": 577.5879786468784, "r": 218.89399901613845, "b": 591.5799886140991, "coord_origin": "TOPLEFT"}}], "children": []}]}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "picture", "id": 0, "page_no": 0, "cluster": {"id": 0, "label": "picture", "bbox": {"l": 388.5767822265625, "t": 36.03587341308594, "r": 482.4759216308594, "b": 103.00555419921875, "coord_origin": "TOPLEFT"}, "confidence": 0.9453065991401672, "cells": [{"id": 1, "text": "\u0646\u0627\u0631\u064a\u0627 \u06cc\u0644\u0627\u0627\u06a9 \u0633\u0631\u0648\u0628 \u062a\u06a9\u0631\u0634", "bbox": {"l": 388.989988251609, "t": 91.78875978496546, "r": 481.6045778353348, "b": 105.05883975387746, "coord_origin": "TOPLEFT"}}], "children": [{"id": 43, "label": "text", "bbox": {"l": 388.989988251609, "t": 91.78875978496546, "r": 481.6045778353348, "b": 105.05883975387746, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 1, "text": "\u0646\u0627\u0631\u064a\u0627 \u06cc\u0644\u0627\u0627\u06a9 \u0633\u0631\u0648\u0628 \u062a\u06a9\u0631\u0634", "bbox": {"l": 388.989988251609, "t": 91.78875978496546, "r": 481.6045778353348, "b": 105.05883975387746, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "section_header", "id": 28, "page_no": 0, "cluster": {"id": 28, "label": "section_header", "bbox": {"l": 68.78399669083697, "t": 62.65173985322508, "r": 267.65960879695194, "b": 81.03008981017001, "coord_origin": "TOPLEFT"}, "confidence": 0.6917961239814758, "cells": [{"id": 2, "text": "\u06cc\u0644\u062e\u0627\u062f \u06cc\u0644\u0627\u0627\u06a9 - \u06cc\u0644\u0635\u0627 \u0631\u0627\u0632\u0627\u0628 \u0631\u062f \u0634\u0631\u064a\u0630\u067e \u0647\u0645\u0627\u0646\u062f\u064a\u0645\u0627", "bbox": {"l": 68.78399669083697, "t": 62.65173985322508, "r": 267.65960879695194, "b": 81.03008981017001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u06cc\u0644\u062e\u0627\u062f \u06cc\u0644\u0627\u0627\u06a9 - \u06cc\u0644\u0635\u0627 \u0631\u0627\u0632\u0627\u0628 \u0631\u062f \u0634\u0631\u064a\u0630\u067e \u0647\u0645\u0627\u0646\u062f\u064a\u0645\u0627"}, {"label": "page_footer", "id": 1, "page_no": 0, "cluster": {"id": 1, "label": "page_footer", "bbox": {"l": 267.2900087986132, "t": 779.4899791738803, "r": 294.5899986759081, "b": 790.0379791491694, "coord_origin": "TOPLEFT"}, "confidence": 0.899228036403656, "cells": [{"id": 3, "text": "Page 7 ", "bbox": {"l": 267.2900087986132, "t": 779.4899791738803, "r": 294.5899986759081, "b": 790.0379791491694, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Page 7"}, {"label": "section_header", "id": 11, "page_no": 0, "cluster": {"id": 11, "label": "section_header", "bbox": {"l": 373.9899883190294, "t": 138.63494967521842, "r": 479.52999784465936, "b": 156.66497963297923, "coord_origin": "TOPLEFT"}, "confidence": 0.7994307279586792, "cells": [{"id": 4, "text": " \u0644\u0627\u0627\u06a9 \u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627 -2-5", "bbox": {"l": 373.9899883190294, "t": 138.63494967521842, "r": 479.52999784465936, "b": 156.66497963297923, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u0644\u0627\u0627\u06a9 \u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627 -2-5"}, {"label": "key_value_region", "id": 33, "page_no": 0, "cluster": {"id": 33, "label": "key_value_region", "bbox": {"l": 66.26399970216359, "t": 160.86797962313278, "r": 519.2383976661823, "b": 323.44982924225053, "coord_origin": "TOPLEFT"}, "confidence": 0.6362584233283997, "cells": [{"id": 5, "text": "\u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627 \u0645\u0627\u0646", "bbox": {"l": 458.7399879381041, "t": 162.42376961948798, "r": 519.2383976661823, "b": 179.2998695799522, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": " \u06cc\u0631\u06af", "bbox": {"l": 66.38400270162423, "t": 160.86797962313278, "r": 82.90500562736736, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "\u0647\u062a\u062e\u064a\u0631", "bbox": {"l": 91.16550359023896, "t": 160.86797962313278, "r": 111.81675949741789, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "\u0634\u0648\u0631", "bbox": {"l": 120.07725946028945, "t": 160.86797962313278, "r": 132.46799940459687, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "\u0647\u0628", "bbox": {"l": 140.72851936746835, "t": 160.86797962313278, "r": 148.98900933034, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "\u0647\u062f\u0634", "bbox": {"l": 157.24950929321156, "t": 160.86797962313278, "r": 169.64025923751896, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "\u062f\u064a\u0644\u0648\u062a", "bbox": {"l": 177.90075920039052, "t": 160.86797962313278, "r": 198.55201910756944, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "\u0644\u0627\u0634\u0645\u0634", "bbox": {"l": 206.812519070441, "t": 160.86797962313278, "r": 227.46375897762002, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "\u0648", "bbox": {"l": 235.72425894049158, "t": 160.86797962313278, "r": 239.85451892192734, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "\u0647\u0634\u0645\u0634", "bbox": {"l": 248.1150188847989, "t": 160.86797962313278, "r": 264.63601881054205, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "\u0641\u0631\u0635\u0645", "bbox": {"l": 193.57520912993866, "t": 178.74798958124518, "r": 209.40560905878587, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "\u062f\u0631\u0648\u0645", "bbox": {"l": 217.3208190232094, "t": 178.74798958124518, "r": 233.15122895205658, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "\u0647\u062a\u0633\u0648\u064a\u067e", "bbox": {"l": 241.06643891648014, "t": 178.74798958124518, "r": 264.81203880975096, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "\u06cc\u0627", "bbox": {"l": 105.01999952796723, "t": 178.74798958124518, "r": 112.34326949505137, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "\u0647\u0632\u0627\u0633", "bbox": {"l": 119.66654946213548, "t": 178.74798958124518, "r": 134.3130993963037, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "\u06cc\u0627\u0647\u062f\u0644\u0627\u0648\u0641", "bbox": {"l": 141.63636936338784, "t": 178.74798958124518, "r": 170.92946923172434, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "\u0631\u062f", "bbox": {"l": 178.25274919880843, "t": 178.74798958124518, "r": 185.57601916589257, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "- ", "bbox": {"l": 96.02400156840149, "t": 178.74798958124518, "r": 103.62799953422386, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": " \u0642\u0628\u0627\u0637\u0645 ", "bbox": {"l": 66.26399970216359, "t": 178.74798958124518, "r": 94.75199857411876, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "\u062a\u0633\u0648\u064a\u067e \u0632\u064a\u0644\u0627\u0646\u0622", "bbox": {"l": 218.2100090192128, "t": 196.50799953963872, "r": 264.81795880972436, "b": 210.49999950685924, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "\u06cc\u0644\u0645 \u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627 \u0647\u0631\u0627\u0645\u0634", "bbox": {"l": 420.9099981081384, "t": 216.30376949326285, "r": 519.1619876665258, "b": 233.17986945372706, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "20300", "bbox": {"l": 236.80999893561153, "t": 214.7479894969075, "r": 265.01000880886113, "b": 228.73998946412837, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "\u061f\u062a\u0633\u0627 \u06cc\u0631\u0627\u0628\u062c\u0627 \u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627", "bbox": {"l": 406.9899881707045, "t": 239.01372944005993, "r": 519.1415376666176, "b": 255.88982940052404, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "\u0631\u064a\u062e       \u06cc\u0644\u0628      ", "bbox": {"l": 197.32999911306206, "t": 237.4579494437046, "r": 264.91399880929265, "b": 251.44994941092557, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "\u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627 \u0647\u062f\u0646\u0646\u06a9\u0631\u062f\u0627\u0635 \u0639\u062c\u0631\u0645", "bbox": {"l": 389.4699982494516, "t": 261.6937293869272, "r": 519.2136776662934, "b": 278.5698293473914, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "\u0646\u0627\u0631\u064a\u0627 \u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627 \u06cc\u0644\u0645 \u0646\u0627\u0645\u0632\u0627\u0633", "bbox": {"l": 166.5799992512739, "t": 260.137939390572, "r": 264.77599880991295, "b": 274.12994935779284, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": " \u0630\u062e\u0627 \u0627\u0631 \u0631\u0648\u06a9\u0630\u0645 \u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627 \u060c\u0644\u0648\u0635\u062d\u0645 \u0647\u062f\u0646\u0646\u06a9\u062f\u064a\u0644\u0648\u062a \u0627\u064a\u0622", "bbox": {"l": 292.129998686965, "t": 284.37377933379446, "r": 519.114747666738, "b": 301.24987929425856, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "\u061f\u062a\u0633\u0627 \u0647\u062f\u0648\u0645\u0646", "bbox": {"l": 461.98000792354117, "t": 306.5737292817864, "r": 519.2351676661968, "b": 323.44982924225053, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "\u0631\u064a\u062e", "bbox": {"l": 197.32999911306206, "t": 282.81799933743923, "r": 208.04769906488926, "b": 296.80999930466, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "\u06cc\u0644\u0628", "bbox": {"l": 236.62821893642857, "t": 282.81799933743923, "r": 247.34591888825577, "b": 296.80999930466, "coord_origin": "TOPLEFT"}}], "children": [{"id": 25, "label": "text", "bbox": {"l": 458.7399879381041, "t": 162.42376961948798, "r": 519.2383976661823, "b": 179.2998695799522, "coord_origin": "TOPLEFT"}, "confidence": 0.7258325815200806, "cells": [{"id": 5, "text": "\u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627 \u0645\u0627\u0646", "bbox": {"l": 458.7399879381041, "t": 162.42376961948798, "r": 519.2383976661823, "b": 179.2998695799522, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 66.26399970216359, "t": 160.86797962313278, "r": 264.81795880972436, "b": 210.49999950685924, "coord_origin": "TOPLEFT"}, "confidence": 0.8694157004356384, "cells": [{"id": 6, "text": " \u06cc\u0631\u06af", "bbox": {"l": 66.38400270162423, "t": 160.86797962313278, "r": 82.90500562736736, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "\u0647\u062a\u062e\u064a\u0631", "bbox": {"l": 91.16550359023896, "t": 160.86797962313278, "r": 111.81675949741789, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "\u0634\u0648\u0631", "bbox": {"l": 120.07725946028945, "t": 160.86797962313278, "r": 132.46799940459687, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "\u0647\u0628", "bbox": {"l": 140.72851936746835, "t": 160.86797962313278, "r": 148.98900933034, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "\u0647\u062f\u0634", "bbox": {"l": 157.24950929321156, "t": 160.86797962313278, "r": 169.64025923751896, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "\u062f\u064a\u0644\u0648\u062a", "bbox": {"l": 177.90075920039052, "t": 160.86797962313278, "r": 198.55201910756944, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "\u0644\u0627\u0634\u0645\u0634", "bbox": {"l": 206.812519070441, "t": 160.86797962313278, "r": 227.46375897762002, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "\u0648", "bbox": {"l": 235.72425894049158, "t": 160.86797962313278, "r": 239.85451892192734, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "\u0647\u0634\u0645\u0634", "bbox": {"l": 248.1150188847989, "t": 160.86797962313278, "r": 264.63601881054205, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "\u0641\u0631\u0635\u0645", "bbox": {"l": 193.57520912993866, "t": 178.74798958124518, "r": 209.40560905878587, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "\u062f\u0631\u0648\u0645", "bbox": {"l": 217.3208190232094, "t": 178.74798958124518, "r": 233.15122895205658, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "\u0647\u062a\u0633\u0648\u064a\u067e", "bbox": {"l": 241.06643891648014, "t": 178.74798958124518, "r": 264.81203880975096, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "\u06cc\u0627", "bbox": {"l": 105.01999952796723, "t": 178.74798958124518, "r": 112.34326949505137, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "\u0647\u0632\u0627\u0633", "bbox": {"l": 119.66654946213548, "t": 178.74798958124518, "r": 134.3130993963037, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "\u06cc\u0627\u0647\u062f\u0644\u0627\u0648\u0641", "bbox": {"l": 141.63636936338784, "t": 178.74798958124518, "r": 170.92946923172434, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "\u0631\u062f", "bbox": {"l": 178.25274919880843, "t": 178.74798958124518, "r": 185.57601916589257, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "- ", "bbox": {"l": 96.02400156840149, "t": 178.74798958124518, "r": 103.62799953422386, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": " \u0642\u0628\u0627\u0637\u0645 ", "bbox": {"l": 66.26399970216359, "t": 178.74798958124518, "r": 94.75199857411876, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "\u062a\u0633\u0648\u064a\u067e \u0632\u064a\u0644\u0627\u0646\u0622", "bbox": {"l": 218.2100090192128, "t": 196.50799953963872, "r": 264.81795880972436, "b": 210.49999950685924, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 420.9099981081384, "t": 216.30376949326285, "r": 519.1619876665258, "b": 233.17986945372706, "coord_origin": "TOPLEFT"}, "confidence": 0.8121814727783203, "cells": [{"id": 25, "text": "\u06cc\u0644\u0645 \u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627 \u0647\u0631\u0627\u0645\u0634", "bbox": {"l": 420.9099981081384, "t": 216.30376949326285, "r": 519.1619876665258, "b": 233.17986945372706, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 236.80999893561153, "t": 214.7479894969075, "r": 265.01000880886113, "b": 228.73998946412837, "coord_origin": "TOPLEFT"}, "confidence": 0.7672220468521118, "cells": [{"id": 26, "text": "20300", "bbox": {"l": 236.80999893561153, "t": 214.7479894969075, "r": 265.01000880886113, "b": 228.73998946412837, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "text", "bbox": {"l": 406.9899881707045, "t": 239.01372944005993, "r": 519.1415376666176, "b": 255.88982940052404, "coord_origin": "TOPLEFT"}, "confidence": 0.8320456743240356, "cells": [{"id": 27, "text": "\u061f\u062a\u0633\u0627 \u06cc\u0631\u0627\u0628\u062c\u0627 \u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627", "bbox": {"l": 406.9899881707045, "t": 239.01372944005993, "r": 519.1415376666176, "b": 255.88982940052404, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "checkbox_unselected", "bbox": {"l": 197.32999911306206, "t": 237.4579494437046, "r": 264.91399880929265, "b": 251.44994941092557, "coord_origin": "TOPLEFT"}, "confidence": 0.5538824796676636, "cells": [{"id": 28, "text": "\u0631\u064a\u062e       \u06cc\u0644\u0628      ", "bbox": {"l": 197.32999911306206, "t": 237.4579494437046, "r": 264.91399880929265, "b": 251.44994941092557, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 389.4699982494516, "t": 261.6937293869272, "r": 519.2136776662934, "b": 278.5698293473914, "coord_origin": "TOPLEFT"}, "confidence": 0.7909000515937805, "cells": [{"id": 29, "text": "\u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627 \u0647\u062f\u0646\u0646\u06a9\u0631\u062f\u0627\u0635 \u0639\u062c\u0631\u0645", "bbox": {"l": 389.4699982494516, "t": 261.6937293869272, "r": 519.2136776662934, "b": 278.5698293473914, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 166.5799992512739, "t": 260.137939390572, "r": 264.77599880991295, "b": 274.12994935779284, "coord_origin": "TOPLEFT"}, "confidence": 0.7620571851730347, "cells": [{"id": 30, "text": "\u0646\u0627\u0631\u064a\u0627 \u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627 \u06cc\u0644\u0645 \u0646\u0627\u0645\u0632\u0627\u0633", "bbox": {"l": 166.5799992512739, "t": 260.137939390572, "r": 264.77599880991295, "b": 274.12994935779284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 292.129998686965, "t": 284.37377933379446, "r": 519.2351676661968, "b": 323.44982924225053, "coord_origin": "TOPLEFT"}, "confidence": 0.6534578204154968, "cells": [{"id": 31, "text": " \u0630\u062e\u0627 \u0627\u0631 \u0631\u0648\u06a9\u0630\u0645 \u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627 \u060c\u0644\u0648\u0635\u062d\u0645 \u0647\u062f\u0646\u0646\u06a9\u062f\u064a\u0644\u0648\u062a \u0627\u064a\u0622", "bbox": {"l": 292.129998686965, "t": 284.37377933379446, "r": 519.114747666738, "b": 301.24987929425856, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "\u061f\u062a\u0633\u0627 \u0647\u062f\u0648\u0645\u0646", "bbox": {"l": 461.98000792354117, "t": 306.5737292817864, "r": 519.2351676661968, "b": 323.44982924225053, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "checkbox_selected", "bbox": {"l": 197.32999911306206, "t": 282.81799933743923, "r": 208.04769906488926, "b": 296.80999930466, "coord_origin": "TOPLEFT"}, "confidence": 0.49446165561676025, "cells": [{"id": 34, "text": "\u0631\u064a\u062e", "bbox": {"l": 197.32999911306206, "t": 282.81799933743923, "r": 208.04769906488926, "b": 296.80999930466, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "checkbox_unselected", "bbox": {"l": 236.62821893642857, "t": 282.81799933743923, "r": 247.34591888825577, "b": 296.80999930466, "coord_origin": "TOPLEFT"}, "confidence": 0.5417144298553467, "cells": [{"id": 35, "text": "\u06cc\u0644\u0628", "bbox": {"l": 236.62821893642857, "t": 282.81799933743923, "r": 247.34591888825577, "b": 296.80999930466, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null}, {"label": "section_header", "id": 31, "page_no": 0, "cluster": {"id": 31, "label": "section_header", "bbox": {"l": 409.0299981615353, "t": 351.4537691766454, "r": 505.7644977267433, "b": 368.3298391371096, "coord_origin": "TOPLEFT"}, "confidence": 0.6514244079589844, "cells": [{"id": 36, "text": "\u0633\u0631\u0648\u0628 \u0631\u062f \u0634\u0631\u064a\u0630\u067e -3", "bbox": {"l": 409.0299981615353, "t": 351.4537691766454, "r": 505.7644977267433, "b": 368.3298391371096, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u0633\u0631\u0648\u0628 \u0631\u062f \u0634\u0631\u064a\u0630\u067e -3"}, {"label": "key_value_region", "id": 27, "page_no": 0, "cluster": {"id": 27, "label": "key_value_region", "bbox": {"l": 85.4639966158655, "t": 372.57796912715753, "r": 492.70525778544066, "b": 596.0198686036978, "coord_origin": "TOPLEFT"}, "confidence": 0.719137966632843, "cells": [{"id": 37, "text": " \u06a9\u0631\u0627\u062f\u0645 \u0647\u0626\u0627\u0631\u0627 \u062e\u064a\u0631\u0627\u062a", "bbox": {"l": 405.30999817825557, "t": 374.1537791234659, "r": 492.6107177858655, "b": 391.0298490839301, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "1403/09/19", "bbox": {"l": 137.89998938018175, "t": 372.57796912715753, "r": 187.8199891558066, "b": 386.56997909437825, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": " \u0634\u0631\u064a\u0630\u067e \u062e\u064a\u0631\u0627\u062a", "bbox": {"l": 426.309998083867, "t": 396.8337690703332, "r": 492.59463778593783, "b": 413.70983903079747, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "1403/10/04", "bbox": {"l": 137.89998938018175, "t": 395.277959073978, "r": 187.8199891558066, "b": 409.26995904119883, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": " \u0647\u0636\u0631\u0639 \u0647\u062a\u064a\u0645\u06a9 \u0647\u0633\u0644\u062c \u0647\u0631\u0627\u0645\u0634", "bbox": {"l": 367.14998834977314, "t": 419.5137990172004, "r": 492.68526778553047, "b": 436.3898589776647, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "436", "bbox": {"l": 154.69999930467083, "t": 418.0779690205642, "r": 171.19999923050838, "b": 432.0699789877849, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": " \u0647\u0645\u0627\u0646\u062f\u064a\u0645\u0627 \u062c\u0631\u062f \u062e\u064a\u0631\u0627\u062a", "bbox": {"l": 399.42998820468443, "t": 442.3137789637867, "r": 492.62752778578994, "b": 459.18984892425095, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "1403/10/05", "bbox": {"l": 137.89998938018175, "t": 440.75796896743145, "r": 187.8199891558066, "b": 454.7499689346523, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": " \u0634\u0631\u064a\u0630\u067e \u0631\u0648\u0627\u0634\u0645", "bbox": {"l": 422.82998809950857, "t": 464.993778910654, "r": 492.6789577855588, "b": 481.8698388711183, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "\u0633\u0631\u0648\u0628 \u0646\u0648\u0645\u0631\u0622 \u06cc\u0631\u0627\u0632\u06af\u0631\u0627\u06a9", "bbox": {"l": 122.05999945137766, "t": 463.43795891429886, "r": 203.6480090846645, "b": 477.42995888151955, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": " \u0631\u062f \u0644\u0627\u0627\u06a9 \u0634\u0631\u064a\u0630\u067e \u0632\u0627 \u0633\u067e \u0647\u064a\u0627\u067e \u062a\u0645\u064a\u0642 \u0646\u064a\u064a\u0639\u062a \u0629\u0648\u062d\u0646", "bbox": {"l": 281.3299887355078, "t": 489.35378885358557, "r": 492.5758377860224, "b": 506.2298588140498, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "\u0633\u0631\u0648\u0628", "bbox": {"l": 465.57998790736036, "t": 511.4337788018585, "r": 492.70525778544066, "b": 528.3098487623228, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": " \u06cc\u0646\u0627\u0647\u062c  \u06cc\u0627\u0647 \u062a\u0645\u064a\u0642 \u0633\u0627\u0633\u0627 \u0631\u0628", "bbox": {"l": 109.21999950908952, "t": 487.7979788572303, "r": 213.67396903960088, "b": 501.78997882445117, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": " \u0634\u0648\u0631\u0641 /\u0634\u0648\u0631\u0641 \u0644\u06a9 /\u062f\u064a\u0644\u0648\u062a \u0632\u0627 \u0647\u0636\u0631\u0639 \u062f\u0635\u0631\u062f \u0644\u0642\u0627\u062f\u062d", "bbox": {"l": 266.5700088018494, "t": 534.2637987483744, "r": 492.6496877856904, "b": 551.1398587088386, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "\u06cc\u0644\u062e\u0627\u062f", "bbox": {"l": 462.2199979224626, "t": 556.3437786966474, "r": 492.7008677854604, "b": 573.2198486571116, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "\u0646\u062a 47.500 \u0627\u064a \u0647\u0646\u0627\u064a\u0644\u0627\u0633 \u062f\u064a\u0644\u0648\u062a \u0632\u0627 %50 \u0644\u0642\u0627\u062f\u062d", "bbox": {"l": 85.4639966158655, "t": 532.7079787520192, "r": 240.36199891964634, "b": 546.69997871924, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "\u0644\u064a\u0648\u062d\u062a \u0632\u0627\u062c\u0645 \u06cc\u0627\u0637\u062e", "bbox": {"l": 404.2300081831098, "t": 579.1437686432336, "r": 492.6399177857343, "b": 596.0198686036978, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "\u0644\u064a\u0648\u062d\u062a \u0644\u0628\u0627\u0642 \u0647\u0644\u0648\u0645\u062d\u0645 \u0646\u064a\u0631\u062e\u0622 5%", "bbox": {"l": 106.93999951933742, "t": 577.5879786468784, "r": 218.89399901613845, "b": 591.5799886140991, "coord_origin": "TOPLEFT"}}], "children": [{"id": 15, "label": "text", "bbox": {"l": 405.30999817825557, "t": 374.1537791234659, "r": 492.6107177858655, "b": 391.0298490839301, "coord_origin": "TOPLEFT"}, "confidence": 0.7834645509719849, "cells": [{"id": 37, "text": " \u06a9\u0631\u0627\u062f\u0645 \u0647\u0626\u0627\u0631\u0627 \u062e\u064a\u0631\u0627\u062a", "bbox": {"l": 405.30999817825557, "t": 374.1537791234659, "r": 492.6107177858655, "b": 391.0298490839301, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "text", "bbox": {"l": 137.89998938018175, "t": 372.57796912715753, "r": 187.8199891558066, "b": 386.56997909437825, "coord_origin": "TOPLEFT"}, "confidence": 0.8262879252433777, "cells": [{"id": 38, "text": "1403/09/19", "bbox": {"l": 137.89998938018175, "t": 372.57796912715753, "r": 187.8199891558066, "b": 386.56997909437825, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 426.309998083867, "t": 396.8337690703332, "r": 492.59463778593783, "b": 413.70983903079747, "coord_origin": "TOPLEFT"}, "confidence": 0.7766718864440918, "cells": [{"id": 39, "text": " \u0634\u0631\u064a\u0630\u067e \u062e\u064a\u0631\u0627\u062a", "bbox": {"l": 426.309998083867, "t": 396.8337690703332, "r": 492.59463778593783, "b": 413.70983903079747, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "text", "bbox": {"l": 137.89998938018175, "t": 395.277959073978, "r": 187.8199891558066, "b": 409.26995904119883, "coord_origin": "TOPLEFT"}, "confidence": 0.8204737901687622, "cells": [{"id": 40, "text": "1403/10/04", "bbox": {"l": 137.89998938018175, "t": 395.277959073978, "r": 187.8199891558066, "b": 409.26995904119883, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 367.14998834977314, "t": 419.5137990172004, "r": 492.68526778553047, "b": 436.3898589776647, "coord_origin": "TOPLEFT"}, "confidence": 0.7670677900314331, "cells": [{"id": 41, "text": " \u0647\u0636\u0631\u0639 \u0647\u062a\u064a\u0645\u06a9 \u0647\u0633\u0644\u062c \u0647\u0631\u0627\u0645\u0634", "bbox": {"l": 367.14998834977314, "t": 419.5137990172004, "r": 492.68526778553047, "b": 436.3898589776647, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "text", "bbox": {"l": 154.69999930467083, "t": 418.0779690205642, "r": 171.19999923050838, "b": 432.0699789877849, "coord_origin": "TOPLEFT"}, "confidence": 0.8048340082168579, "cells": [{"id": 42, "text": "436", "bbox": {"l": 154.69999930467083, "t": 418.0779690205642, "r": 171.19999923050838, "b": 432.0699789877849, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 399.42998820468443, "t": 442.3137789637867, "r": 492.62752778578994, "b": 459.18984892425095, "coord_origin": "TOPLEFT"}, "confidence": 0.775697648525238, "cells": [{"id": 43, "text": " \u0647\u0645\u0627\u0646\u062f\u064a\u0645\u0627 \u062c\u0631\u062f \u062e\u064a\u0631\u0627\u062a", "bbox": {"l": 399.42998820468443, "t": 442.3137789637867, "r": 492.62752778578994, "b": 459.18984892425095, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "text", "bbox": {"l": 137.89998938018175, "t": 440.75796896743145, "r": 187.8199891558066, "b": 454.7499689346523, "coord_origin": "TOPLEFT"}, "confidence": 0.827337384223938, "cells": [{"id": 44, "text": "1403/10/05", "bbox": {"l": 137.89998938018175, "t": 440.75796896743145, "r": 187.8199891558066, "b": 454.7499689346523, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 422.82998809950857, "t": 464.993778910654, "r": 492.6789577855588, "b": 481.8698388711183, "coord_origin": "TOPLEFT"}, "confidence": 0.7342236638069153, "cells": [{"id": 45, "text": " \u0634\u0631\u064a\u0630\u067e \u0631\u0648\u0627\u0634\u0645", "bbox": {"l": 422.82998809950857, "t": 464.993778910654, "r": 492.6789577855588, "b": 481.8698388711183, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 122.05999945137766, "t": 463.43795891429886, "r": 203.6480090846645, "b": 477.42995888151955, "coord_origin": "TOPLEFT"}, "confidence": 0.8411222696304321, "cells": [{"id": 46, "text": "\u0633\u0631\u0648\u0628 \u0646\u0648\u0645\u0631\u0622 \u06cc\u0631\u0627\u0632\u06af\u0631\u0627\u06a9", "bbox": {"l": 122.05999945137766, "t": 463.43795891429886, "r": 203.6480090846645, "b": 477.42995888151955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 281.3299887355078, "t": 489.35378885358557, "r": 492.70525778544066, "b": 528.3098487623228, "coord_origin": "TOPLEFT"}, "confidence": 0.7251589894294739, "cells": [{"id": 47, "text": " \u0631\u062f \u0644\u0627\u0627\u06a9 \u0634\u0631\u064a\u0630\u067e \u0632\u0627 \u0633\u067e \u0647\u064a\u0627\u067e \u062a\u0645\u064a\u0642 \u0646\u064a\u064a\u0639\u062a \u0629\u0648\u062d\u0646", "bbox": {"l": 281.3299887355078, "t": 489.35378885358557, "r": 492.5758377860224, "b": 506.2298588140498, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "\u0633\u0631\u0648\u0628", "bbox": {"l": 465.57998790736036, "t": 511.4337788018585, "r": 492.70525778544066, "b": 528.3098487623228, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 109.21999950908952, "t": 487.7979788572303, "r": 213.67396903960088, "b": 501.78997882445117, "coord_origin": "TOPLEFT"}, "confidence": 0.7848678827285767, "cells": [{"id": 49, "text": " \u06cc\u0646\u0627\u0647\u062c  \u06cc\u0627\u0647 \u062a\u0645\u064a\u0642 \u0633\u0627\u0633\u0627 \u0631\u0628", "bbox": {"l": 109.21999950908952, "t": 487.7979788572303, "r": 213.67396903960088, "b": 501.78997882445117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 266.5700088018494, "t": 534.2637987483744, "r": 492.7008677854604, "b": 573.2198486571116, "coord_origin": "TOPLEFT"}, "confidence": 0.7586438059806824, "cells": [{"id": 50, "text": " \u0634\u0648\u0631\u0641 /\u0634\u0648\u0631\u0641 \u0644\u06a9 /\u062f\u064a\u0644\u0648\u062a \u0632\u0627 \u0647\u0636\u0631\u0639 \u062f\u0635\u0631\u062f \u0644\u0642\u0627\u062f\u062d", "bbox": {"l": 266.5700088018494, "t": 534.2637987483744, "r": 492.6496877856904, "b": 551.1398587088386, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "\u06cc\u0644\u062e\u0627\u062f", "bbox": {"l": 462.2199979224626, "t": 556.3437786966474, "r": 492.7008677854604, "b": 573.2198486571116, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 85.4639966158655, "t": 532.7079787520192, "r": 240.36199891964634, "b": 546.69997871924, "coord_origin": "TOPLEFT"}, "confidence": 0.7897851467132568, "cells": [{"id": 52, "text": "\u0646\u062a 47.500 \u0627\u064a \u0647\u0646\u0627\u064a\u0644\u0627\u0633 \u062f\u064a\u0644\u0648\u062a \u0632\u0627 %50 \u0644\u0642\u0627\u062f\u062d", "bbox": {"l": 85.4639966158655, "t": 532.7079787520192, "r": 240.36199891964634, "b": 546.69997871924, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 404.2300081831098, "t": 579.1437686432336, "r": 492.6399177857343, "b": 596.0198686036978, "coord_origin": "TOPLEFT"}, "confidence": 0.7759335041046143, "cells": [{"id": 53, "text": "\u0644\u064a\u0648\u062d\u062a \u0632\u0627\u062c\u0645 \u06cc\u0627\u0637\u062e", "bbox": {"l": 404.2300081831098, "t": 579.1437686432336, "r": 492.6399177857343, "b": 596.0198686036978, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "text", "bbox": {"l": 106.93999951933742, "t": 577.5879786468784, "r": 218.89399901613845, "b": 591.5799886140991, "coord_origin": "TOPLEFT"}, "confidence": 0.8144810795783997, "cells": [{"id": 54, "text": "\u0644\u064a\u0648\u062d\u062a \u0644\u0628\u0627\u0642 \u0647\u0644\u0648\u0645\u062d\u0645 \u0646\u064a\u0631\u062e\u0622 5%", "bbox": {"l": 106.93999951933742, "t": 577.5879786468784, "r": 218.89399901613845, "b": 591.5799886140991, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null}], "body": [{"label": "picture", "id": 0, "page_no": 0, "cluster": {"id": 0, "label": "picture", "bbox": {"l": 388.5767822265625, "t": 36.03587341308594, "r": 482.4759216308594, "b": 103.00555419921875, "coord_origin": "TOPLEFT"}, "confidence": 0.9453065991401672, "cells": [{"id": 1, "text": "\u0646\u0627\u0631\u064a\u0627 \u06cc\u0644\u0627\u0627\u06a9 \u0633\u0631\u0648\u0628 \u062a\u06a9\u0631\u0634", "bbox": {"l": 388.989988251609, "t": 91.78875978496546, "r": 481.6045778353348, "b": 105.05883975387746, "coord_origin": "TOPLEFT"}}], "children": [{"id": 43, "label": "text", "bbox": {"l": 388.989988251609, "t": 91.78875978496546, "r": 481.6045778353348, "b": 105.05883975387746, "coord_origin": "TOPLEFT"}, "confidence": 1.0, "cells": [{"id": 1, "text": "\u0646\u0627\u0631\u064a\u0627 \u06cc\u0644\u0627\u0627\u06a9 \u0633\u0631\u0648\u0628 \u062a\u06a9\u0631\u0634", "bbox": {"l": 388.989988251609, "t": 91.78875978496546, "r": 481.6045778353348, "b": 105.05883975387746, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": "", "annotations": [], "provenance": null, "predicted_class": null, "confidence": null}, {"label": "section_header", "id": 28, "page_no": 0, "cluster": {"id": 28, "label": "section_header", "bbox": {"l": 68.78399669083697, "t": 62.65173985322508, "r": 267.65960879695194, "b": 81.03008981017001, "coord_origin": "TOPLEFT"}, "confidence": 0.6917961239814758, "cells": [{"id": 2, "text": "\u06cc\u0644\u062e\u0627\u062f \u06cc\u0644\u0627\u0627\u06a9 - \u06cc\u0644\u0635\u0627 \u0631\u0627\u0632\u0627\u0628 \u0631\u062f \u0634\u0631\u064a\u0630\u067e \u0647\u0645\u0627\u0646\u062f\u064a\u0645\u0627", "bbox": {"l": 68.78399669083697, "t": 62.65173985322508, "r": 267.65960879695194, "b": 81.03008981017001, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u06cc\u0644\u062e\u0627\u062f \u06cc\u0644\u0627\u0627\u06a9 - \u06cc\u0644\u0635\u0627 \u0631\u0627\u0632\u0627\u0628 \u0631\u062f \u0634\u0631\u064a\u0630\u067e \u0647\u0645\u0627\u0646\u062f\u064a\u0645\u0627"}, {"label": "section_header", "id": 11, "page_no": 0, "cluster": {"id": 11, "label": "section_header", "bbox": {"l": 373.9899883190294, "t": 138.63494967521842, "r": 479.52999784465936, "b": 156.66497963297923, "coord_origin": "TOPLEFT"}, "confidence": 0.7994307279586792, "cells": [{"id": 4, "text": " \u0644\u0627\u0627\u06a9 \u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627 -2-5", "bbox": {"l": 373.9899883190294, "t": 138.63494967521842, "r": 479.52999784465936, "b": 156.66497963297923, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u0644\u0627\u0627\u06a9 \u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627 -2-5"}, {"label": "key_value_region", "id": 33, "page_no": 0, "cluster": {"id": 33, "label": "key_value_region", "bbox": {"l": 66.26399970216359, "t": 160.86797962313278, "r": 519.2383976661823, "b": 323.44982924225053, "coord_origin": "TOPLEFT"}, "confidence": 0.6362584233283997, "cells": [{"id": 5, "text": "\u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627 \u0645\u0627\u0646", "bbox": {"l": 458.7399879381041, "t": 162.42376961948798, "r": 519.2383976661823, "b": 179.2998695799522, "coord_origin": "TOPLEFT"}}, {"id": 6, "text": " \u06cc\u0631\u06af", "bbox": {"l": 66.38400270162423, "t": 160.86797962313278, "r": 82.90500562736736, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "\u0647\u062a\u062e\u064a\u0631", "bbox": {"l": 91.16550359023896, "t": 160.86797962313278, "r": 111.81675949741789, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "\u0634\u0648\u0631", "bbox": {"l": 120.07725946028945, "t": 160.86797962313278, "r": 132.46799940459687, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "\u0647\u0628", "bbox": {"l": 140.72851936746835, "t": 160.86797962313278, "r": 148.98900933034, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "\u0647\u062f\u0634", "bbox": {"l": 157.24950929321156, "t": 160.86797962313278, "r": 169.64025923751896, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "\u062f\u064a\u0644\u0648\u062a", "bbox": {"l": 177.90075920039052, "t": 160.86797962313278, "r": 198.55201910756944, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "\u0644\u0627\u0634\u0645\u0634", "bbox": {"l": 206.812519070441, "t": 160.86797962313278, "r": 227.46375897762002, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "\u0648", "bbox": {"l": 235.72425894049158, "t": 160.86797962313278, "r": 239.85451892192734, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "\u0647\u0634\u0645\u0634", "bbox": {"l": 248.1150188847989, "t": 160.86797962313278, "r": 264.63601881054205, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "\u0641\u0631\u0635\u0645", "bbox": {"l": 193.57520912993866, "t": 178.74798958124518, "r": 209.40560905878587, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "\u062f\u0631\u0648\u0645", "bbox": {"l": 217.3208190232094, "t": 178.74798958124518, "r": 233.15122895205658, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "\u0647\u062a\u0633\u0648\u064a\u067e", "bbox": {"l": 241.06643891648014, "t": 178.74798958124518, "r": 264.81203880975096, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "\u06cc\u0627", "bbox": {"l": 105.01999952796723, "t": 178.74798958124518, "r": 112.34326949505137, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "\u0647\u0632\u0627\u0633", "bbox": {"l": 119.66654946213548, "t": 178.74798958124518, "r": 134.3130993963037, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "\u06cc\u0627\u0647\u062f\u0644\u0627\u0648\u0641", "bbox": {"l": 141.63636936338784, "t": 178.74798958124518, "r": 170.92946923172434, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "\u0631\u062f", "bbox": {"l": 178.25274919880843, "t": 178.74798958124518, "r": 185.57601916589257, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "- ", "bbox": {"l": 96.02400156840149, "t": 178.74798958124518, "r": 103.62799953422386, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": " \u0642\u0628\u0627\u0637\u0645 ", "bbox": {"l": 66.26399970216359, "t": 178.74798958124518, "r": 94.75199857411876, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "\u062a\u0633\u0648\u064a\u067e \u0632\u064a\u0644\u0627\u0646\u0622", "bbox": {"l": 218.2100090192128, "t": 196.50799953963872, "r": 264.81795880972436, "b": 210.49999950685924, "coord_origin": "TOPLEFT"}}, {"id": 25, "text": "\u06cc\u0644\u0645 \u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627 \u0647\u0631\u0627\u0645\u0634", "bbox": {"l": 420.9099981081384, "t": 216.30376949326285, "r": 519.1619876665258, "b": 233.17986945372706, "coord_origin": "TOPLEFT"}}, {"id": 26, "text": "20300", "bbox": {"l": 236.80999893561153, "t": 214.7479894969075, "r": 265.01000880886113, "b": 228.73998946412837, "coord_origin": "TOPLEFT"}}, {"id": 27, "text": "\u061f\u062a\u0633\u0627 \u06cc\u0631\u0627\u0628\u062c\u0627 \u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627", "bbox": {"l": 406.9899881707045, "t": 239.01372944005993, "r": 519.1415376666176, "b": 255.88982940052404, "coord_origin": "TOPLEFT"}}, {"id": 28, "text": "\u0631\u064a\u062e       \u06cc\u0644\u0628      ", "bbox": {"l": 197.32999911306206, "t": 237.4579494437046, "r": 264.91399880929265, "b": 251.44994941092557, "coord_origin": "TOPLEFT"}}, {"id": 29, "text": "\u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627 \u0647\u062f\u0646\u0646\u06a9\u0631\u062f\u0627\u0635 \u0639\u062c\u0631\u0645", "bbox": {"l": 389.4699982494516, "t": 261.6937293869272, "r": 519.2136776662934, "b": 278.5698293473914, "coord_origin": "TOPLEFT"}}, {"id": 30, "text": "\u0646\u0627\u0631\u064a\u0627 \u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627 \u06cc\u0644\u0645 \u0646\u0627\u0645\u0632\u0627\u0633", "bbox": {"l": 166.5799992512739, "t": 260.137939390572, "r": 264.77599880991295, "b": 274.12994935779284, "coord_origin": "TOPLEFT"}}, {"id": 31, "text": " \u0630\u062e\u0627 \u0627\u0631 \u0631\u0648\u06a9\u0630\u0645 \u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627 \u060c\u0644\u0648\u0635\u062d\u0645 \u0647\u062f\u0646\u0646\u06a9\u062f\u064a\u0644\u0648\u062a \u0627\u064a\u0622", "bbox": {"l": 292.129998686965, "t": 284.37377933379446, "r": 519.114747666738, "b": 301.24987929425856, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "\u061f\u062a\u0633\u0627 \u0647\u062f\u0648\u0645\u0646", "bbox": {"l": 461.98000792354117, "t": 306.5737292817864, "r": 519.2351676661968, "b": 323.44982924225053, "coord_origin": "TOPLEFT"}}, {"id": 34, "text": "\u0631\u064a\u062e", "bbox": {"l": 197.32999911306206, "t": 282.81799933743923, "r": 208.04769906488926, "b": 296.80999930466, "coord_origin": "TOPLEFT"}}, {"id": 35, "text": "\u06cc\u0644\u0628", "bbox": {"l": 236.62821893642857, "t": 282.81799933743923, "r": 247.34591888825577, "b": 296.80999930466, "coord_origin": "TOPLEFT"}}], "children": [{"id": 25, "label": "text", "bbox": {"l": 458.7399879381041, "t": 162.42376961948798, "r": 519.2383976661823, "b": 179.2998695799522, "coord_origin": "TOPLEFT"}, "confidence": 0.7258325815200806, "cells": [{"id": 5, "text": "\u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627 \u0645\u0627\u0646", "bbox": {"l": 458.7399879381041, "t": 162.42376961948798, "r": 519.2383976661823, "b": 179.2998695799522, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 2, "label": "text", "bbox": {"l": 66.26399970216359, "t": 160.86797962313278, "r": 264.81795880972436, "b": 210.49999950685924, "coord_origin": "TOPLEFT"}, "confidence": 0.8694157004356384, "cells": [{"id": 6, "text": " \u06cc\u0631\u06af", "bbox": {"l": 66.38400270162423, "t": 160.86797962313278, "r": 82.90500562736736, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 7, "text": "\u0647\u062a\u062e\u064a\u0631", "bbox": {"l": 91.16550359023896, "t": 160.86797962313278, "r": 111.81675949741789, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 8, "text": "\u0634\u0648\u0631", "bbox": {"l": 120.07725946028945, "t": 160.86797962313278, "r": 132.46799940459687, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 9, "text": "\u0647\u0628", "bbox": {"l": 140.72851936746835, "t": 160.86797962313278, "r": 148.98900933034, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 10, "text": "\u0647\u062f\u0634", "bbox": {"l": 157.24950929321156, "t": 160.86797962313278, "r": 169.64025923751896, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 11, "text": "\u062f\u064a\u0644\u0648\u062a", "bbox": {"l": 177.90075920039052, "t": 160.86797962313278, "r": 198.55201910756944, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 12, "text": "\u0644\u0627\u0634\u0645\u0634", "bbox": {"l": 206.812519070441, "t": 160.86797962313278, "r": 227.46375897762002, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 13, "text": "\u0648", "bbox": {"l": 235.72425894049158, "t": 160.86797962313278, "r": 239.85451892192734, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 14, "text": "\u0647\u0634\u0645\u0634", "bbox": {"l": 248.1150188847989, "t": 160.86797962313278, "r": 264.63601881054205, "b": 174.85998959035362, "coord_origin": "TOPLEFT"}}, {"id": 15, "text": "\u0641\u0631\u0635\u0645", "bbox": {"l": 193.57520912993866, "t": 178.74798958124518, "r": 209.40560905878587, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 16, "text": "\u062f\u0631\u0648\u0645", "bbox": {"l": 217.3208190232094, "t": 178.74798958124518, "r": 233.15122895205658, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 17, "text": "\u0647\u062a\u0633\u0648\u064a\u067e", "bbox": {"l": 241.06643891648014, "t": 178.74798958124518, "r": 264.81203880975096, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 18, "text": "\u06cc\u0627", "bbox": {"l": 105.01999952796723, "t": 178.74798958124518, "r": 112.34326949505137, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 19, "text": "\u0647\u0632\u0627\u0633", "bbox": {"l": 119.66654946213548, "t": 178.74798958124518, "r": 134.3130993963037, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 20, "text": "\u06cc\u0627\u0647\u062f\u0644\u0627\u0648\u0641", "bbox": {"l": 141.63636936338784, "t": 178.74798958124518, "r": 170.92946923172434, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 21, "text": "\u0631\u062f", "bbox": {"l": 178.25274919880843, "t": 178.74798958124518, "r": 185.57601916589257, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 22, "text": "- ", "bbox": {"l": 96.02400156840149, "t": 178.74798958124518, "r": 103.62799953422386, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 23, "text": " \u0642\u0628\u0627\u0637\u0645 ", "bbox": {"l": 66.26399970216359, "t": 178.74798958124518, "r": 94.75199857411876, "b": 192.73998954846593, "coord_origin": "TOPLEFT"}}, {"id": 24, "text": "\u062a\u0633\u0648\u064a\u067e \u0632\u064a\u0644\u0627\u0646\u0622", "bbox": {"l": 218.2100090192128, "t": 196.50799953963872, "r": 264.81795880972436, "b": 210.49999950685924, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 9, "label": "text", "bbox": {"l": 420.9099981081384, "t": 216.30376949326285, "r": 519.1619876665258, "b": 233.17986945372706, "coord_origin": "TOPLEFT"}, "confidence": 0.8121814727783203, "cells": [{"id": 25, "text": "\u06cc\u0644\u0645 \u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627 \u0647\u0631\u0627\u0645\u0634", "bbox": {"l": 420.9099981081384, "t": 216.30376949326285, "r": 519.1619876665258, "b": 233.17986945372706, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 19, "label": "text", "bbox": {"l": 236.80999893561153, "t": 214.7479894969075, "r": 265.01000880886113, "b": 228.73998946412837, "coord_origin": "TOPLEFT"}, "confidence": 0.7672220468521118, "cells": [{"id": 26, "text": "20300", "bbox": {"l": 236.80999893561153, "t": 214.7479894969075, "r": 265.01000880886113, "b": 228.73998946412837, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 4, "label": "text", "bbox": {"l": 406.9899881707045, "t": 239.01372944005993, "r": 519.1415376666176, "b": 255.88982940052404, "coord_origin": "TOPLEFT"}, "confidence": 0.8320456743240356, "cells": [{"id": 27, "text": "\u061f\u062a\u0633\u0627 \u06cc\u0631\u0627\u0628\u062c\u0627 \u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627", "bbox": {"l": 406.9899881707045, "t": 239.01372944005993, "r": 519.1415376666176, "b": 255.88982940052404, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 38, "label": "checkbox_unselected", "bbox": {"l": 197.32999911306206, "t": 237.4579494437046, "r": 264.91399880929265, "b": 251.44994941092557, "coord_origin": "TOPLEFT"}, "confidence": 0.5538824796676636, "cells": [{"id": 28, "text": "\u0631\u064a\u062e       \u06cc\u0644\u0628      ", "bbox": {"l": 197.32999911306206, "t": 237.4579494437046, "r": 264.91399880929265, "b": 251.44994941092557, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 12, "label": "text", "bbox": {"l": 389.4699982494516, "t": 261.6937293869272, "r": 519.2136776662934, "b": 278.5698293473914, "coord_origin": "TOPLEFT"}, "confidence": 0.7909000515937805, "cells": [{"id": 29, "text": "\u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627 \u0647\u062f\u0646\u0646\u06a9\u0631\u062f\u0627\u0635 \u0639\u062c\u0631\u0645", "bbox": {"l": 389.4699982494516, "t": 261.6937293869272, "r": 519.2136776662934, "b": 278.5698293473914, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 21, "label": "text", "bbox": {"l": 166.5799992512739, "t": 260.137939390572, "r": 264.77599880991295, "b": 274.12994935779284, "coord_origin": "TOPLEFT"}, "confidence": 0.7620571851730347, "cells": [{"id": 30, "text": "\u0646\u0627\u0631\u064a\u0627 \u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627 \u06cc\u0644\u0645 \u0646\u0627\u0645\u0632\u0627\u0633", "bbox": {"l": 166.5799992512739, "t": 260.137939390572, "r": 264.77599880991295, "b": 274.12994935779284, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 30, "label": "text", "bbox": {"l": 292.129998686965, "t": 284.37377933379446, "r": 519.2351676661968, "b": 323.44982924225053, "coord_origin": "TOPLEFT"}, "confidence": 0.6534578204154968, "cells": [{"id": 31, "text": " \u0630\u062e\u0627 \u0627\u0631 \u0631\u0648\u06a9\u0630\u0645 \u062f\u0631\u0627\u062f\u0646\u0627\u062a\u0633\u0627 \u060c\u0644\u0648\u0635\u062d\u0645 \u0647\u062f\u0646\u0646\u06a9\u062f\u064a\u0644\u0648\u062a \u0627\u064a\u0622", "bbox": {"l": 292.129998686965, "t": 284.37377933379446, "r": 519.114747666738, "b": 301.24987929425856, "coord_origin": "TOPLEFT"}}, {"id": 32, "text": "\u061f\u062a\u0633\u0627 \u0647\u062f\u0648\u0645\u0646", "bbox": {"l": 461.98000792354117, "t": 306.5737292817864, "r": 519.2351676661968, "b": 323.44982924225053, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 42, "label": "checkbox_selected", "bbox": {"l": 197.32999911306206, "t": 282.81799933743923, "r": 208.04769906488926, "b": 296.80999930466, "coord_origin": "TOPLEFT"}, "confidence": 0.49446165561676025, "cells": [{"id": 34, "text": "\u0631\u064a\u062e", "bbox": {"l": 197.32999911306206, "t": 282.81799933743923, "r": 208.04769906488926, "b": 296.80999930466, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 39, "label": "checkbox_unselected", "bbox": {"l": 236.62821893642857, "t": 282.81799933743923, "r": 247.34591888825577, "b": 296.80999930466, "coord_origin": "TOPLEFT"}, "confidence": 0.5417144298553467, "cells": [{"id": 35, "text": "\u06cc\u0644\u0628", "bbox": {"l": 236.62821893642857, "t": 282.81799933743923, "r": 247.34591888825577, "b": 296.80999930466, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null}, {"label": "section_header", "id": 31, "page_no": 0, "cluster": {"id": 31, "label": "section_header", "bbox": {"l": 409.0299981615353, "t": 351.4537691766454, "r": 505.7644977267433, "b": 368.3298391371096, "coord_origin": "TOPLEFT"}, "confidence": 0.6514244079589844, "cells": [{"id": 36, "text": "\u0633\u0631\u0648\u0628 \u0631\u062f \u0634\u0631\u064a\u0630\u067e -3", "bbox": {"l": 409.0299981615353, "t": 351.4537691766454, "r": 505.7644977267433, "b": 368.3298391371096, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "\u0633\u0631\u0648\u0628 \u0631\u062f \u0634\u0631\u064a\u0630\u067e -3"}, {"label": "key_value_region", "id": 27, "page_no": 0, "cluster": {"id": 27, "label": "key_value_region", "bbox": {"l": 85.4639966158655, "t": 372.57796912715753, "r": 492.70525778544066, "b": 596.0198686036978, "coord_origin": "TOPLEFT"}, "confidence": 0.719137966632843, "cells": [{"id": 37, "text": " \u06a9\u0631\u0627\u062f\u0645 \u0647\u0626\u0627\u0631\u0627 \u062e\u064a\u0631\u0627\u062a", "bbox": {"l": 405.30999817825557, "t": 374.1537791234659, "r": 492.6107177858655, "b": 391.0298490839301, "coord_origin": "TOPLEFT"}}, {"id": 38, "text": "1403/09/19", "bbox": {"l": 137.89998938018175, "t": 372.57796912715753, "r": 187.8199891558066, "b": 386.56997909437825, "coord_origin": "TOPLEFT"}}, {"id": 39, "text": " \u0634\u0631\u064a\u0630\u067e \u062e\u064a\u0631\u0627\u062a", "bbox": {"l": 426.309998083867, "t": 396.8337690703332, "r": 492.59463778593783, "b": 413.70983903079747, "coord_origin": "TOPLEFT"}}, {"id": 40, "text": "1403/10/04", "bbox": {"l": 137.89998938018175, "t": 395.277959073978, "r": 187.8199891558066, "b": 409.26995904119883, "coord_origin": "TOPLEFT"}}, {"id": 41, "text": " \u0647\u0636\u0631\u0639 \u0647\u062a\u064a\u0645\u06a9 \u0647\u0633\u0644\u062c \u0647\u0631\u0627\u0645\u0634", "bbox": {"l": 367.14998834977314, "t": 419.5137990172004, "r": 492.68526778553047, "b": 436.3898589776647, "coord_origin": "TOPLEFT"}}, {"id": 42, "text": "436", "bbox": {"l": 154.69999930467083, "t": 418.0779690205642, "r": 171.19999923050838, "b": 432.0699789877849, "coord_origin": "TOPLEFT"}}, {"id": 43, "text": " \u0647\u0645\u0627\u0646\u062f\u064a\u0645\u0627 \u062c\u0631\u062f \u062e\u064a\u0631\u0627\u062a", "bbox": {"l": 399.42998820468443, "t": 442.3137789637867, "r": 492.62752778578994, "b": 459.18984892425095, "coord_origin": "TOPLEFT"}}, {"id": 44, "text": "1403/10/05", "bbox": {"l": 137.89998938018175, "t": 440.75796896743145, "r": 187.8199891558066, "b": 454.7499689346523, "coord_origin": "TOPLEFT"}}, {"id": 45, "text": " \u0634\u0631\u064a\u0630\u067e \u0631\u0648\u0627\u0634\u0645", "bbox": {"l": 422.82998809950857, "t": 464.993778910654, "r": 492.6789577855588, "b": 481.8698388711183, "coord_origin": "TOPLEFT"}}, {"id": 46, "text": "\u0633\u0631\u0648\u0628 \u0646\u0648\u0645\u0631\u0622 \u06cc\u0631\u0627\u0632\u06af\u0631\u0627\u06a9", "bbox": {"l": 122.05999945137766, "t": 463.43795891429886, "r": 203.6480090846645, "b": 477.42995888151955, "coord_origin": "TOPLEFT"}}, {"id": 47, "text": " \u0631\u062f \u0644\u0627\u0627\u06a9 \u0634\u0631\u064a\u0630\u067e \u0632\u0627 \u0633\u067e \u0647\u064a\u0627\u067e \u062a\u0645\u064a\u0642 \u0646\u064a\u064a\u0639\u062a \u0629\u0648\u062d\u0646", "bbox": {"l": 281.3299887355078, "t": 489.35378885358557, "r": 492.5758377860224, "b": 506.2298588140498, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "\u0633\u0631\u0648\u0628", "bbox": {"l": 465.57998790736036, "t": 511.4337788018585, "r": 492.70525778544066, "b": 528.3098487623228, "coord_origin": "TOPLEFT"}}, {"id": 49, "text": " \u06cc\u0646\u0627\u0647\u062c  \u06cc\u0627\u0647 \u062a\u0645\u064a\u0642 \u0633\u0627\u0633\u0627 \u0631\u0628", "bbox": {"l": 109.21999950908952, "t": 487.7979788572303, "r": 213.67396903960088, "b": 501.78997882445117, "coord_origin": "TOPLEFT"}}, {"id": 50, "text": " \u0634\u0648\u0631\u0641 /\u0634\u0648\u0631\u0641 \u0644\u06a9 /\u062f\u064a\u0644\u0648\u062a \u0632\u0627 \u0647\u0636\u0631\u0639 \u062f\u0635\u0631\u062f \u0644\u0642\u0627\u062f\u062d", "bbox": {"l": 266.5700088018494, "t": 534.2637987483744, "r": 492.6496877856904, "b": 551.1398587088386, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "\u06cc\u0644\u062e\u0627\u062f", "bbox": {"l": 462.2199979224626, "t": 556.3437786966474, "r": 492.7008677854604, "b": 573.2198486571116, "coord_origin": "TOPLEFT"}}, {"id": 52, "text": "\u0646\u062a 47.500 \u0627\u064a \u0647\u0646\u0627\u064a\u0644\u0627\u0633 \u062f\u064a\u0644\u0648\u062a \u0632\u0627 %50 \u0644\u0642\u0627\u062f\u062d", "bbox": {"l": 85.4639966158655, "t": 532.7079787520192, "r": 240.36199891964634, "b": 546.69997871924, "coord_origin": "TOPLEFT"}}, {"id": 53, "text": "\u0644\u064a\u0648\u062d\u062a \u0632\u0627\u062c\u0645 \u06cc\u0627\u0637\u062e", "bbox": {"l": 404.2300081831098, "t": 579.1437686432336, "r": 492.6399177857343, "b": 596.0198686036978, "coord_origin": "TOPLEFT"}}, {"id": 54, "text": "\u0644\u064a\u0648\u062d\u062a \u0644\u0628\u0627\u0642 \u0647\u0644\u0648\u0645\u062d\u0645 \u0646\u064a\u0631\u062e\u0622 5%", "bbox": {"l": 106.93999951933742, "t": 577.5879786468784, "r": 218.89399901613845, "b": 591.5799886140991, "coord_origin": "TOPLEFT"}}], "children": [{"id": 15, "label": "text", "bbox": {"l": 405.30999817825557, "t": 374.1537791234659, "r": 492.6107177858655, "b": 391.0298490839301, "coord_origin": "TOPLEFT"}, "confidence": 0.7834645509719849, "cells": [{"id": 37, "text": " \u06a9\u0631\u0627\u062f\u0645 \u0647\u0626\u0627\u0631\u0627 \u062e\u064a\u0631\u0627\u062a", "bbox": {"l": 405.30999817825557, "t": 374.1537791234659, "r": 492.6107177858655, "b": 391.0298490839301, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 6, "label": "text", "bbox": {"l": 137.89998938018175, "t": 372.57796912715753, "r": 187.8199891558066, "b": 386.56997909437825, "coord_origin": "TOPLEFT"}, "confidence": 0.8262879252433777, "cells": [{"id": 38, "text": "1403/09/19", "bbox": {"l": 137.89998938018175, "t": 372.57796912715753, "r": 187.8199891558066, "b": 386.56997909437825, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 16, "label": "text", "bbox": {"l": 426.309998083867, "t": 396.8337690703332, "r": 492.59463778593783, "b": 413.70983903079747, "coord_origin": "TOPLEFT"}, "confidence": 0.7766718864440918, "cells": [{"id": 39, "text": " \u0634\u0631\u064a\u0630\u067e \u062e\u064a\u0631\u0627\u062a", "bbox": {"l": 426.309998083867, "t": 396.8337690703332, "r": 492.59463778593783, "b": 413.70983903079747, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 7, "label": "text", "bbox": {"l": 137.89998938018175, "t": 395.277959073978, "r": 187.8199891558066, "b": 409.26995904119883, "coord_origin": "TOPLEFT"}, "confidence": 0.8204737901687622, "cells": [{"id": 40, "text": "1403/10/04", "bbox": {"l": 137.89998938018175, "t": 395.277959073978, "r": 187.8199891558066, "b": 409.26995904119883, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 20, "label": "text", "bbox": {"l": 367.14998834977314, "t": 419.5137990172004, "r": 492.68526778553047, "b": 436.3898589776647, "coord_origin": "TOPLEFT"}, "confidence": 0.7670677900314331, "cells": [{"id": 41, "text": " \u0647\u0636\u0631\u0639 \u0647\u062a\u064a\u0645\u06a9 \u0647\u0633\u0644\u062c \u0647\u0631\u0627\u0645\u0634", "bbox": {"l": 367.14998834977314, "t": 419.5137990172004, "r": 492.68526778553047, "b": 436.3898589776647, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 10, "label": "text", "bbox": {"l": 154.69999930467083, "t": 418.0779690205642, "r": 171.19999923050838, "b": 432.0699789877849, "coord_origin": "TOPLEFT"}, "confidence": 0.8048340082168579, "cells": [{"id": 42, "text": "436", "bbox": {"l": 154.69999930467083, "t": 418.0779690205642, "r": 171.19999923050838, "b": 432.0699789877849, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 18, "label": "text", "bbox": {"l": 399.42998820468443, "t": 442.3137789637867, "r": 492.62752778578994, "b": 459.18984892425095, "coord_origin": "TOPLEFT"}, "confidence": 0.775697648525238, "cells": [{"id": 43, "text": " \u0647\u0645\u0627\u0646\u062f\u064a\u0645\u0627 \u062c\u0631\u062f \u062e\u064a\u0631\u0627\u062a", "bbox": {"l": 399.42998820468443, "t": 442.3137789637867, "r": 492.62752778578994, "b": 459.18984892425095, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 5, "label": "text", "bbox": {"l": 137.89998938018175, "t": 440.75796896743145, "r": 187.8199891558066, "b": 454.7499689346523, "coord_origin": "TOPLEFT"}, "confidence": 0.827337384223938, "cells": [{"id": 44, "text": "1403/10/05", "bbox": {"l": 137.89998938018175, "t": 440.75796896743145, "r": 187.8199891558066, "b": 454.7499689346523, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 24, "label": "text", "bbox": {"l": 422.82998809950857, "t": 464.993778910654, "r": 492.6789577855588, "b": 481.8698388711183, "coord_origin": "TOPLEFT"}, "confidence": 0.7342236638069153, "cells": [{"id": 45, "text": " \u0634\u0631\u064a\u0630\u067e \u0631\u0648\u0627\u0634\u0645", "bbox": {"l": 422.82998809950857, "t": 464.993778910654, "r": 492.6789577855588, "b": 481.8698388711183, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 3, "label": "text", "bbox": {"l": 122.05999945137766, "t": 463.43795891429886, "r": 203.6480090846645, "b": 477.42995888151955, "coord_origin": "TOPLEFT"}, "confidence": 0.8411222696304321, "cells": [{"id": 46, "text": "\u0633\u0631\u0648\u0628 \u0646\u0648\u0645\u0631\u0622 \u06cc\u0631\u0627\u0632\u06af\u0631\u0627\u06a9", "bbox": {"l": 122.05999945137766, "t": 463.43795891429886, "r": 203.6480090846645, "b": 477.42995888151955, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 26, "label": "text", "bbox": {"l": 281.3299887355078, "t": 489.35378885358557, "r": 492.70525778544066, "b": 528.3098487623228, "coord_origin": "TOPLEFT"}, "confidence": 0.7251589894294739, "cells": [{"id": 47, "text": " \u0631\u062f \u0644\u0627\u0627\u06a9 \u0634\u0631\u064a\u0630\u067e \u0632\u0627 \u0633\u067e \u0647\u064a\u0627\u067e \u062a\u0645\u064a\u0642 \u0646\u064a\u064a\u0639\u062a \u0629\u0648\u062d\u0646", "bbox": {"l": 281.3299887355078, "t": 489.35378885358557, "r": 492.5758377860224, "b": 506.2298588140498, "coord_origin": "TOPLEFT"}}, {"id": 48, "text": "\u0633\u0631\u0648\u0628", "bbox": {"l": 465.57998790736036, "t": 511.4337788018585, "r": 492.70525778544066, "b": 528.3098487623228, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 14, "label": "text", "bbox": {"l": 109.21999950908952, "t": 487.7979788572303, "r": 213.67396903960088, "b": 501.78997882445117, "coord_origin": "TOPLEFT"}, "confidence": 0.7848678827285767, "cells": [{"id": 49, "text": " \u06cc\u0646\u0627\u0647\u062c  \u06cc\u0627\u0647 \u062a\u0645\u064a\u0642 \u0633\u0627\u0633\u0627 \u0631\u0628", "bbox": {"l": 109.21999950908952, "t": 487.7979788572303, "r": 213.67396903960088, "b": 501.78997882445117, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 22, "label": "text", "bbox": {"l": 266.5700088018494, "t": 534.2637987483744, "r": 492.7008677854604, "b": 573.2198486571116, "coord_origin": "TOPLEFT"}, "confidence": 0.7586438059806824, "cells": [{"id": 50, "text": " \u0634\u0648\u0631\u0641 /\u0634\u0648\u0631\u0641 \u0644\u06a9 /\u062f\u064a\u0644\u0648\u062a \u0632\u0627 \u0647\u0636\u0631\u0639 \u062f\u0635\u0631\u062f \u0644\u0642\u0627\u062f\u062d", "bbox": {"l": 266.5700088018494, "t": 534.2637987483744, "r": 492.6496877856904, "b": 551.1398587088386, "coord_origin": "TOPLEFT"}}, {"id": 51, "text": "\u06cc\u0644\u062e\u0627\u062f", "bbox": {"l": 462.2199979224626, "t": 556.3437786966474, "r": 492.7008677854604, "b": 573.2198486571116, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 13, "label": "text", "bbox": {"l": 85.4639966158655, "t": 532.7079787520192, "r": 240.36199891964634, "b": 546.69997871924, "coord_origin": "TOPLEFT"}, "confidence": 0.7897851467132568, "cells": [{"id": 52, "text": "\u0646\u062a 47.500 \u0627\u064a \u0647\u0646\u0627\u064a\u0644\u0627\u0633 \u062f\u064a\u0644\u0648\u062a \u0632\u0627 %50 \u0644\u0642\u0627\u062f\u062d", "bbox": {"l": 85.4639966158655, "t": 532.7079787520192, "r": 240.36199891964634, "b": 546.69997871924, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 17, "label": "text", "bbox": {"l": 404.2300081831098, "t": 579.1437686432336, "r": 492.6399177857343, "b": 596.0198686036978, "coord_origin": "TOPLEFT"}, "confidence": 0.7759335041046143, "cells": [{"id": 53, "text": "\u0644\u064a\u0648\u062d\u062a \u0632\u0627\u062c\u0645 \u06cc\u0627\u0637\u062e", "bbox": {"l": 404.2300081831098, "t": 579.1437686432336, "r": 492.6399177857343, "b": 596.0198686036978, "coord_origin": "TOPLEFT"}}], "children": []}, {"id": 8, "label": "text", "bbox": {"l": 106.93999951933742, "t": 577.5879786468784, "r": 218.89399901613845, "b": 591.5799886140991, "coord_origin": "TOPLEFT"}, "confidence": 0.8144810795783997, "cells": [{"id": 54, "text": "\u0644\u064a\u0648\u062d\u062a \u0644\u0628\u0627\u0642 \u0647\u0644\u0648\u0645\u062d\u0645 \u0646\u064a\u0631\u062e\u0622 5%", "bbox": {"l": 106.93999951933742, "t": 577.5879786468784, "r": 218.89399901613845, "b": 591.5799886140991, "coord_origin": "TOPLEFT"}}], "children": []}]}, "text": null}], "headers": [{"label": "page_footer", "id": 1, "page_no": 0, "cluster": {"id": 1, "label": "page_footer", "bbox": {"l": 267.2900087986132, "t": 779.4899791738803, "r": 294.5899986759081, "b": 790.0379791491694, "coord_origin": "TOPLEFT"}, "confidence": 0.899228036403656, "cells": [{"id": 3, "text": "Page 7 ", "bbox": {"l": 267.2900087986132, "t": 779.4899791738803, "r": 294.5899986759081, "b": 790.0379791491694, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Page 7"}]}}]
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v2/tablecell.docx.json b/tests/data/groundtruth/docling_v2/tablecell.docx.json
index d811cc86..42ff0261 100644
--- a/tests/data/groundtruth/docling_v2/tablecell.docx.json
+++ b/tests/data/groundtruth/docling_v2/tablecell.docx.json
@@ -1,6 +1,6 @@
 {
   "schema_name": "DoclingDocument",
-  "version": "1.0.0",
+  "version": "1.1.0",
   "name": "tablecell",
   "origin": {
     "mimetype": "application/vnd.openxmlformats-officedocument.wordprocessingml.document",
@@ -10,6 +10,7 @@
   "furniture": {
     "self_ref": "#/furniture",
     "children": [],
+    "content_layer": "furniture",
     "name": "_root_",
     "label": "unspecified"
   },
@@ -38,6 +39,7 @@
         "$ref": "#/texts/6"
       }
     ],
+    "content_layer": "body",
     "name": "_root_",
     "label": "unspecified"
   },
@@ -55,6 +57,7 @@
           "$ref": "#/texts/1"
         }
       ],
+      "content_layer": "body",
       "name": "list",
       "label": "list"
     }
@@ -66,6 +69,7 @@
         "$ref": "#/groups/0"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "Hello world1",
@@ -79,6 +83,7 @@
         "$ref": "#/groups/0"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "Hello2",
@@ -92,6 +97,7 @@
         "$ref": "#/body"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "",
@@ -103,6 +109,7 @@
         "$ref": "#/body"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Some text before",
@@ -114,6 +121,7 @@
         "$ref": "#/body"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "",
@@ -125,6 +133,7 @@
         "$ref": "#/body"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "",
@@ -136,6 +145,7 @@
         "$ref": "#/body"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Some text after",
@@ -150,6 +160,7 @@
         "$ref": "#/body"
       },
       "children": [],
+      "content_layer": "body",
       "label": "table",
       "prov": [],
       "captions": [],
diff --git a/tests/data/groundtruth/docling_v2/test-01.xlsx.json b/tests/data/groundtruth/docling_v2/test-01.xlsx.json
index b6642298..153fe115 100644
--- a/tests/data/groundtruth/docling_v2/test-01.xlsx.json
+++ b/tests/data/groundtruth/docling_v2/test-01.xlsx.json
@@ -1,6 +1,6 @@
 {
   "schema_name": "DoclingDocument",
-  "version": "1.0.0",
+  "version": "1.1.0",
   "name": "test-01",
   "origin": {
     "mimetype": "application/vnd.openxmlformats-officedocument.spreadsheetml.sheet",
@@ -10,6 +10,7 @@
   "furniture": {
     "self_ref": "#/furniture",
     "children": [],
+    "content_layer": "furniture",
     "name": "_root_",
     "label": "unspecified"
   },
@@ -26,6 +27,7 @@
         "$ref": "#/groups/2"
       }
     ],
+    "content_layer": "body",
     "name": "_root_",
     "label": "unspecified"
   },
@@ -40,6 +42,7 @@
           "$ref": "#/tables/0"
         }
       ],
+      "content_layer": "body",
       "name": "sheet: Sheet1",
       "label": "section"
     },
@@ -59,6 +62,7 @@
           "$ref": "#/tables/3"
         }
       ],
+      "content_layer": "body",
       "name": "sheet: Sheet2",
       "label": "section"
     },
@@ -78,6 +82,7 @@
           "$ref": "#/pictures/0"
         }
       ],
+      "content_layer": "body",
       "name": "sheet: Sheet3",
       "label": "section"
     }
@@ -90,6 +95,7 @@
         "$ref": "#/groups/2"
       },
       "children": [],
+      "content_layer": "body",
       "label": "picture",
       "prov": [],
       "captions": [],
@@ -114,6 +120,7 @@
         "$ref": "#/groups/0"
       },
       "children": [],
+      "content_layer": "body",
       "label": "table",
       "prov": [],
       "captions": [],
@@ -652,6 +659,7 @@
         "$ref": "#/groups/1"
       },
       "children": [],
+      "content_layer": "body",
       "label": "table",
       "prov": [],
       "captions": [],
@@ -1554,6 +1562,7 @@
         "$ref": "#/groups/1"
       },
       "children": [],
+      "content_layer": "body",
       "label": "table",
       "prov": [],
       "captions": [],
@@ -1944,6 +1953,7 @@
         "$ref": "#/groups/1"
       },
       "children": [],
+      "content_layer": "body",
       "label": "table",
       "prov": [],
       "captions": [],
@@ -2334,6 +2344,7 @@
         "$ref": "#/groups/2"
       },
       "children": [],
+      "content_layer": "body",
       "label": "table",
       "prov": [],
       "captions": [],
@@ -2800,6 +2811,7 @@
         "$ref": "#/groups/2"
       },
       "children": [],
+      "content_layer": "body",
       "label": "table",
       "prov": [],
       "captions": [],
diff --git a/tests/data/groundtruth/docling_v2/test_emf_docx.docx.json b/tests/data/groundtruth/docling_v2/test_emf_docx.docx.json
index 6418a215..1319d4a3 100644
--- a/tests/data/groundtruth/docling_v2/test_emf_docx.docx.json
+++ b/tests/data/groundtruth/docling_v2/test_emf_docx.docx.json
@@ -1,6 +1,6 @@
 {
   "schema_name": "DoclingDocument",
-  "version": "1.0.0",
+  "version": "1.1.0",
   "name": "test_emf_docx",
   "origin": {
     "mimetype": "application/vnd.openxmlformats-officedocument.wordprocessingml.document",
@@ -10,6 +10,7 @@
   "furniture": {
     "self_ref": "#/furniture",
     "children": [],
+    "content_layer": "furniture",
     "name": "_root_",
     "label": "unspecified"
   },
@@ -38,6 +39,7 @@
         "$ref": "#/pictures/2"
       }
     ],
+    "content_layer": "body",
     "name": "_root_",
     "label": "unspecified"
   },
@@ -49,6 +51,7 @@
         "$ref": "#/body"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Test with three images in unusual formats",
@@ -60,6 +63,7 @@
         "$ref": "#/body"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Raster in emf:",
@@ -71,6 +75,7 @@
         "$ref": "#/body"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Vector in emf:",
@@ -82,6 +87,7 @@
         "$ref": "#/body"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Raster in webp:",
@@ -95,6 +101,7 @@
         "$ref": "#/body"
       },
       "children": [],
+      "content_layer": "body",
       "label": "picture",
       "prov": [],
       "captions": [],
@@ -108,6 +115,7 @@
         "$ref": "#/body"
       },
       "children": [],
+      "content_layer": "body",
       "label": "picture",
       "prov": [],
       "captions": [],
@@ -121,6 +129,7 @@
         "$ref": "#/body"
       },
       "children": [],
+      "content_layer": "body",
       "label": "picture",
       "prov": [],
       "captions": [],
diff --git a/tests/data/groundtruth/docling_v2/unit_test_01.html.json b/tests/data/groundtruth/docling_v2/unit_test_01.html.json
index fa126177..5088dc79 100644
--- a/tests/data/groundtruth/docling_v2/unit_test_01.html.json
+++ b/tests/data/groundtruth/docling_v2/unit_test_01.html.json
@@ -1,6 +1,6 @@
 {
   "schema_name": "DoclingDocument",
-  "version": "1.0.0",
+  "version": "1.1.0",
   "name": "unit_test_01",
   "origin": {
     "mimetype": "text/html",
@@ -10,6 +10,7 @@
   "furniture": {
     "self_ref": "#/furniture",
     "children": [],
+    "content_layer": "furniture",
     "name": "_root_",
     "label": "unspecified"
   },
@@ -20,6 +21,7 @@
         "$ref": "#/texts/0"
       }
     ],
+    "content_layer": "body",
     "name": "_root_",
     "label": "unspecified"
   },
@@ -34,6 +36,7 @@
           "$ref": "#/texts/4"
         }
       ],
+      "content_layer": "body",
       "name": "header-3",
       "label": "section"
     }
@@ -52,6 +55,7 @@
           "$ref": "#/texts/3"
         }
       ],
+      "content_layer": "body",
       "label": "title",
       "prov": [],
       "orig": "Title",
@@ -67,6 +71,7 @@
           "$ref": "#/texts/2"
         }
       ],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
       "orig": "section-1",
@@ -79,6 +84,7 @@
         "$ref": "#/texts/1"
       },
       "children": [],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
       "orig": "section-1.1",
@@ -101,6 +107,7 @@
           "$ref": "#/texts/6"
         }
       ],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
       "orig": "section-2",
@@ -113,6 +120,7 @@
         "$ref": "#/groups/0"
       },
       "children": [],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
       "orig": "section-2.0.1",
@@ -125,6 +133,7 @@
         "$ref": "#/texts/3"
       },
       "children": [],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
       "orig": "section-2.2",
@@ -137,6 +146,7 @@
         "$ref": "#/texts/3"
       },
       "children": [],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
       "orig": "section-2.3",
@@ -147,5 +157,6 @@
   "pictures": [],
   "tables": [],
   "key_value_items": [],
+  "form_items": [],
   "pages": {}
 }
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v2/unit_test_headers.docx.json b/tests/data/groundtruth/docling_v2/unit_test_headers.docx.json
index c76d241a..4c25a39e 100644
--- a/tests/data/groundtruth/docling_v2/unit_test_headers.docx.json
+++ b/tests/data/groundtruth/docling_v2/unit_test_headers.docx.json
@@ -1,6 +1,6 @@
 {
   "schema_name": "DoclingDocument",
-  "version": "1.0.0",
+  "version": "1.1.0",
   "name": "unit_test_headers",
   "origin": {
     "mimetype": "application/vnd.openxmlformats-officedocument.wordprocessingml.document",
@@ -10,6 +10,7 @@
   "furniture": {
     "self_ref": "#/furniture",
     "children": [],
+    "content_layer": "furniture",
     "name": "_root_",
     "label": "unspecified"
   },
@@ -20,6 +21,7 @@
         "$ref": "#/texts/0"
       }
     ],
+    "content_layer": "body",
     "name": "_root_",
     "label": "unspecified"
   },
@@ -34,6 +36,7 @@
           "$ref": "#/texts/33"
         }
       ],
+      "content_layer": "body",
       "name": "header-2",
       "label": "section"
     }
@@ -55,6 +58,7 @@
           "$ref": "#/texts/27"
         }
       ],
+      "content_layer": "body",
       "label": "title",
       "prov": [],
       "orig": "Test Document",
@@ -66,6 +70,7 @@
         "$ref": "#/texts/0"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "",
@@ -99,6 +104,7 @@
           "$ref": "#/texts/14"
         }
       ],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
       "orig": "Section 1",
@@ -111,6 +117,7 @@
         "$ref": "#/texts/2"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "",
@@ -122,6 +129,7 @@
         "$ref": "#/texts/2"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Paragraph 1.1",
@@ -133,6 +141,7 @@
         "$ref": "#/texts/2"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "",
@@ -144,6 +153,7 @@
         "$ref": "#/texts/2"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Paragraph 1.2",
@@ -155,6 +165,7 @@
         "$ref": "#/texts/2"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "",
@@ -182,6 +193,7 @@
           "$ref": "#/texts/13"
         }
       ],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
       "orig": "Section 1.1",
@@ -194,6 +206,7 @@
         "$ref": "#/texts/8"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "",
@@ -205,6 +218,7 @@
         "$ref": "#/texts/8"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Paragraph 1.1.1",
@@ -216,6 +230,7 @@
         "$ref": "#/texts/8"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "",
@@ -227,6 +242,7 @@
         "$ref": "#/texts/8"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Paragraph 1.1.2",
@@ -238,6 +254,7 @@
         "$ref": "#/texts/8"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "",
@@ -268,6 +285,7 @@
           "$ref": "#/texts/20"
         }
       ],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
       "orig": "Section 1.2",
@@ -280,6 +298,7 @@
         "$ref": "#/texts/14"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "",
@@ -291,6 +310,7 @@
         "$ref": "#/texts/14"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Paragraph 1.1.1",
@@ -302,6 +322,7 @@
         "$ref": "#/texts/14"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "",
@@ -313,6 +334,7 @@
         "$ref": "#/texts/14"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Paragraph 1.1.2",
@@ -324,6 +346,7 @@
         "$ref": "#/texts/14"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "",
@@ -354,6 +377,7 @@
           "$ref": "#/texts/26"
         }
       ],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
       "orig": "Section 1.2.3",
@@ -366,6 +390,7 @@
         "$ref": "#/texts/20"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "",
@@ -377,6 +402,7 @@
         "$ref": "#/texts/20"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Paragraph 1.2.3.1",
@@ -388,6 +414,7 @@
         "$ref": "#/texts/20"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "",
@@ -399,6 +426,7 @@
         "$ref": "#/texts/20"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Paragraph 1.2.3.1",
@@ -410,6 +438,7 @@
         "$ref": "#/texts/20"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "",
@@ -421,6 +450,7 @@
         "$ref": "#/texts/20"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "",
@@ -454,6 +484,7 @@
           "$ref": "#/texts/39"
         }
       ],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
       "orig": "Section 2",
@@ -466,6 +497,7 @@
         "$ref": "#/texts/27"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "",
@@ -477,6 +509,7 @@
         "$ref": "#/texts/27"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Paragraph 2.1",
@@ -488,6 +521,7 @@
         "$ref": "#/texts/27"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "",
@@ -499,6 +533,7 @@
         "$ref": "#/texts/27"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Paragraph 2.2",
@@ -510,6 +545,7 @@
         "$ref": "#/texts/27"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "",
@@ -537,6 +573,7 @@
           "$ref": "#/texts/38"
         }
       ],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
       "orig": "Section 2.1.1",
@@ -549,6 +586,7 @@
         "$ref": "#/texts/33"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "",
@@ -560,6 +598,7 @@
         "$ref": "#/texts/33"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Paragraph 2.1.1.1",
@@ -571,6 +610,7 @@
         "$ref": "#/texts/33"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "",
@@ -582,6 +622,7 @@
         "$ref": "#/texts/33"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Paragraph 2.1.1.1",
@@ -593,6 +634,7 @@
         "$ref": "#/texts/33"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "",
@@ -623,6 +665,7 @@
           "$ref": "#/texts/45"
         }
       ],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
       "orig": "Section 2.1",
@@ -635,6 +678,7 @@
         "$ref": "#/texts/39"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "",
@@ -646,6 +690,7 @@
         "$ref": "#/texts/39"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Paragraph 2.1.1",
@@ -657,6 +702,7 @@
         "$ref": "#/texts/39"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "",
@@ -668,6 +714,7 @@
         "$ref": "#/texts/39"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Paragraph 2.1.2",
@@ -679,6 +726,7 @@
         "$ref": "#/texts/39"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "",
@@ -690,6 +738,7 @@
         "$ref": "#/texts/39"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "",
diff --git a/tests/data/groundtruth/docling_v2/unit_test_headers_numbered.docx.json b/tests/data/groundtruth/docling_v2/unit_test_headers_numbered.docx.json
index 38a25d33..8c0d7139 100644
--- a/tests/data/groundtruth/docling_v2/unit_test_headers_numbered.docx.json
+++ b/tests/data/groundtruth/docling_v2/unit_test_headers_numbered.docx.json
@@ -1,6 +1,6 @@
 {
   "schema_name": "DoclingDocument",
-  "version": "1.0.0",
+  "version": "1.1.0",
   "name": "unit_test_headers_numbered",
   "origin": {
     "mimetype": "application/vnd.openxmlformats-officedocument.wordprocessingml.document",
@@ -10,6 +10,7 @@
   "furniture": {
     "self_ref": "#/furniture",
     "children": [],
+    "content_layer": "furniture",
     "name": "_root_",
     "label": "unspecified"
   },
@@ -56,6 +57,7 @@
         "$ref": "#/groups/2"
       }
     ],
+    "content_layer": "body",
     "name": "_root_",
     "label": "unspecified"
   },
@@ -73,6 +75,7 @@
           "$ref": "#/texts/27"
         }
       ],
+      "content_layer": "body",
       "name": "header-0",
       "label": "section"
     },
@@ -89,6 +92,7 @@
           "$ref": "#/texts/14"
         }
       ],
+      "content_layer": "body",
       "name": "header-1",
       "label": "section"
     },
@@ -102,6 +106,7 @@
           "$ref": "#/groups/3"
         }
       ],
+      "content_layer": "body",
       "name": "header-0",
       "label": "section"
     },
@@ -118,6 +123,7 @@
           "$ref": "#/texts/39"
         }
       ],
+      "content_layer": "body",
       "name": "header-1",
       "label": "section"
     },
@@ -131,6 +137,7 @@
           "$ref": "#/texts/33"
         }
       ],
+      "content_layer": "body",
       "name": "header-2",
       "label": "section"
     }
@@ -149,6 +156,7 @@
           "$ref": "#/texts/2"
         }
       ],
+      "content_layer": "body",
       "label": "title",
       "prov": [],
       "orig": "Test Document",
@@ -160,6 +168,7 @@
         "$ref": "#/texts/0"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "",
@@ -171,6 +180,7 @@
         "$ref": "#/texts/0"
       },
       "children": [],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
       "orig": "Section 1",
@@ -183,6 +193,7 @@
         "$ref": "#/body"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "",
@@ -194,6 +205,7 @@
         "$ref": "#/body"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Paragraph 1.1",
@@ -205,6 +217,7 @@
         "$ref": "#/body"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "",
@@ -216,6 +229,7 @@
         "$ref": "#/body"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Paragraph 1.2",
@@ -227,6 +241,7 @@
         "$ref": "#/body"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "",
@@ -254,6 +269,7 @@
           "$ref": "#/texts/13"
         }
       ],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
       "orig": "Section 1.1",
@@ -266,6 +282,7 @@
         "$ref": "#/texts/8"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "",
@@ -277,6 +294,7 @@
         "$ref": "#/texts/8"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Paragraph 1.1.1",
@@ -288,6 +306,7 @@
         "$ref": "#/texts/8"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "",
@@ -299,6 +318,7 @@
         "$ref": "#/texts/8"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Paragraph 1.1.2",
@@ -310,6 +330,7 @@
         "$ref": "#/texts/8"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "",
@@ -340,6 +361,7 @@
           "$ref": "#/texts/20"
         }
       ],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
       "orig": "Section 1.2",
@@ -352,6 +374,7 @@
         "$ref": "#/texts/14"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "",
@@ -363,6 +386,7 @@
         "$ref": "#/texts/14"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Paragraph 1.1.1",
@@ -374,6 +398,7 @@
         "$ref": "#/texts/14"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "",
@@ -385,6 +410,7 @@
         "$ref": "#/texts/14"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Paragraph 1.1.2",
@@ -396,6 +422,7 @@
         "$ref": "#/texts/14"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "",
@@ -426,6 +453,7 @@
           "$ref": "#/texts/26"
         }
       ],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
       "orig": "Section 1.2.3",
@@ -438,6 +466,7 @@
         "$ref": "#/texts/20"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "",
@@ -449,6 +478,7 @@
         "$ref": "#/texts/20"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Paragraph 1.2.3.1",
@@ -460,6 +490,7 @@
         "$ref": "#/texts/20"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "",
@@ -471,6 +502,7 @@
         "$ref": "#/texts/20"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Paragraph 1.2.3.1",
@@ -482,6 +514,7 @@
         "$ref": "#/texts/20"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "",
@@ -493,6 +526,7 @@
         "$ref": "#/texts/20"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "",
@@ -504,6 +538,7 @@
         "$ref": "#/groups/0"
       },
       "children": [],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
       "orig": "Section 2",
@@ -516,6 +551,7 @@
         "$ref": "#/body"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "",
@@ -527,6 +563,7 @@
         "$ref": "#/body"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Paragraph 2.1",
@@ -538,6 +575,7 @@
         "$ref": "#/body"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "",
@@ -549,6 +587,7 @@
         "$ref": "#/body"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Paragraph 2.2",
@@ -560,6 +599,7 @@
         "$ref": "#/body"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "",
@@ -587,6 +627,7 @@
           "$ref": "#/texts/38"
         }
       ],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
       "orig": "Section 2.1.1",
@@ -599,6 +640,7 @@
         "$ref": "#/texts/33"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "",
@@ -610,6 +652,7 @@
         "$ref": "#/texts/33"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Paragraph 2.1.1.1",
@@ -621,6 +664,7 @@
         "$ref": "#/texts/33"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "",
@@ -632,6 +676,7 @@
         "$ref": "#/texts/33"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Paragraph 2.1.1.1",
@@ -643,6 +688,7 @@
         "$ref": "#/texts/33"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "",
@@ -673,6 +719,7 @@
           "$ref": "#/texts/45"
         }
       ],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
       "orig": "Section 2.1",
@@ -685,6 +732,7 @@
         "$ref": "#/texts/39"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "",
@@ -696,6 +744,7 @@
         "$ref": "#/texts/39"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Paragraph 2.1.1",
@@ -707,6 +756,7 @@
         "$ref": "#/texts/39"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "",
@@ -718,6 +768,7 @@
         "$ref": "#/texts/39"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Paragraph 2.1.2",
@@ -729,6 +780,7 @@
         "$ref": "#/texts/39"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "",
@@ -740,6 +792,7 @@
         "$ref": "#/texts/39"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "",
diff --git a/tests/data/groundtruth/docling_v2/unit_test_lists.docx.json b/tests/data/groundtruth/docling_v2/unit_test_lists.docx.json
index 1410586c..6d72d27a 100644
--- a/tests/data/groundtruth/docling_v2/unit_test_lists.docx.json
+++ b/tests/data/groundtruth/docling_v2/unit_test_lists.docx.json
@@ -1,6 +1,6 @@
 {
   "schema_name": "DoclingDocument",
-  "version": "1.0.0",
+  "version": "1.1.0",
   "name": "unit_test_lists",
   "origin": {
     "mimetype": "application/vnd.openxmlformats-officedocument.wordprocessingml.document",
@@ -10,6 +10,7 @@
   "furniture": {
     "self_ref": "#/furniture",
     "children": [],
+    "content_layer": "furniture",
     "name": "_root_",
     "label": "unspecified"
   },
@@ -20,6 +21,7 @@
         "$ref": "#/groups/0"
       }
     ],
+    "content_layer": "body",
     "name": "_root_",
     "label": "unspecified"
   },
@@ -34,6 +36,7 @@
           "$ref": "#/texts/0"
         }
       ],
+      "content_layer": "body",
       "name": "header-0",
       "label": "section"
     },
@@ -62,6 +65,7 @@
           "$ref": "#/texts/36"
         }
       ],
+      "content_layer": "body",
       "name": "header-2",
       "label": "section"
     },
@@ -81,6 +85,7 @@
           "$ref": "#/texts/10"
         }
       ],
+      "content_layer": "body",
       "name": "list",
       "label": "list"
     },
@@ -100,6 +105,7 @@
           "$ref": "#/texts/15"
         }
       ],
+      "content_layer": "body",
       "name": "list",
       "label": "list"
     },
@@ -122,6 +128,7 @@
           "$ref": "#/texts/23"
         }
       ],
+      "content_layer": "body",
       "name": "list",
       "label": "list"
     },
@@ -141,6 +148,7 @@
           "$ref": "#/texts/22"
         }
       ],
+      "content_layer": "body",
       "name": "list",
       "label": "list"
     },
@@ -160,6 +168,7 @@
           "$ref": "#/texts/28"
         }
       ],
+      "content_layer": "body",
       "name": "list",
       "label": "list"
     },
@@ -173,6 +182,7 @@
           "$ref": "#/texts/27"
         }
       ],
+      "content_layer": "body",
       "name": "list",
       "label": "list"
     },
@@ -192,6 +202,7 @@
           "$ref": "#/texts/34"
         }
       ],
+      "content_layer": "body",
       "name": "list",
       "label": "list"
     },
@@ -208,6 +219,7 @@
           "$ref": "#/groups/10"
         }
       ],
+      "content_layer": "body",
       "name": "list",
       "label": "list"
     },
@@ -221,6 +233,7 @@
           "$ref": "#/texts/33"
         }
       ],
+      "content_layer": "body",
       "name": "list",
       "label": "list"
     },
@@ -243,6 +256,7 @@
           "$ref": "#/texts/42"
         }
       ],
+      "content_layer": "body",
       "name": "list",
       "label": "list"
     },
@@ -262,6 +276,7 @@
           "$ref": "#/groups/13"
         }
       ],
+      "content_layer": "body",
       "name": "list",
       "label": "list"
     },
@@ -275,6 +290,7 @@
           "$ref": "#/texts/41"
         }
       ],
+      "content_layer": "body",
       "name": "list",
       "label": "list"
     }
@@ -308,6 +324,7 @@
           "$ref": "#/groups/1"
         }
       ],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
       "orig": "Test Document",
@@ -320,6 +337,7 @@
         "$ref": "#/texts/0"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "",
@@ -331,6 +349,7 @@
         "$ref": "#/texts/0"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "",
@@ -342,6 +361,7 @@
         "$ref": "#/texts/0"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Paragraph 2.1.1",
@@ -353,6 +373,7 @@
         "$ref": "#/texts/0"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "",
@@ -364,6 +385,7 @@
         "$ref": "#/texts/0"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Paragraph 2.1.2",
@@ -375,6 +397,7 @@
         "$ref": "#/texts/0"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "",
@@ -393,6 +416,7 @@
           "$ref": "#/texts/11"
         }
       ],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
       "orig": "Test 1:",
@@ -405,6 +429,7 @@
         "$ref": "#/groups/2"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "List item 1",
@@ -418,6 +443,7 @@
         "$ref": "#/groups/2"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "List item 2",
@@ -431,6 +457,7 @@
         "$ref": "#/groups/2"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "List item 3",
@@ -444,6 +471,7 @@
         "$ref": "#/texts/7"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "",
@@ -462,6 +490,7 @@
           "$ref": "#/texts/16"
         }
       ],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
       "orig": "Test 2:",
@@ -474,6 +503,7 @@
         "$ref": "#/groups/3"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "List item a",
@@ -487,6 +517,7 @@
         "$ref": "#/groups/3"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "List item b",
@@ -500,6 +531,7 @@
         "$ref": "#/groups/3"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "List item c",
@@ -513,6 +545,7 @@
         "$ref": "#/texts/12"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "",
@@ -531,6 +564,7 @@
           "$ref": "#/texts/24"
         }
       ],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
       "orig": "Test 3:",
@@ -543,6 +577,7 @@
         "$ref": "#/groups/4"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "List item 1",
@@ -556,6 +591,7 @@
         "$ref": "#/groups/4"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "List item 2",
@@ -569,6 +605,7 @@
         "$ref": "#/groups/5"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "List item 1.1",
@@ -582,6 +619,7 @@
         "$ref": "#/groups/5"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "List item 1.2",
@@ -595,6 +633,7 @@
         "$ref": "#/groups/5"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "List item 1.3",
@@ -608,6 +647,7 @@
         "$ref": "#/groups/4"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "List item 3",
@@ -621,6 +661,7 @@
         "$ref": "#/texts/17"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "",
@@ -639,6 +680,7 @@
           "$ref": "#/texts/29"
         }
       ],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
       "orig": "Test 4:",
@@ -651,6 +693,7 @@
         "$ref": "#/groups/6"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "List item 1",
@@ -664,6 +707,7 @@
         "$ref": "#/groups/7"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "List item 1.1",
@@ -677,6 +721,7 @@
         "$ref": "#/groups/6"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "List item 2",
@@ -690,6 +735,7 @@
         "$ref": "#/texts/25"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "",
@@ -708,6 +754,7 @@
           "$ref": "#/texts/35"
         }
       ],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
       "orig": "Test 5:",
@@ -720,6 +767,7 @@
         "$ref": "#/groups/8"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "List item 1",
@@ -733,6 +781,7 @@
         "$ref": "#/groups/9"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "List item 1.1",
@@ -746,6 +795,7 @@
         "$ref": "#/groups/10"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "List item 1.1.1",
@@ -759,6 +809,7 @@
         "$ref": "#/groups/8"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "List item 3",
@@ -772,6 +823,7 @@
         "$ref": "#/texts/30"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "",
@@ -796,6 +848,7 @@
           "$ref": "#/texts/45"
         }
       ],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
       "orig": "Test 6:",
@@ -808,6 +861,7 @@
         "$ref": "#/groups/11"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "List item 1",
@@ -821,6 +875,7 @@
         "$ref": "#/groups/11"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "List item 2",
@@ -834,6 +889,7 @@
         "$ref": "#/groups/12"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "List item 1.1",
@@ -847,6 +903,7 @@
         "$ref": "#/groups/12"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "List item 1.2",
@@ -860,6 +917,7 @@
         "$ref": "#/groups/13"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "List item 1.2.1",
@@ -873,6 +931,7 @@
         "$ref": "#/groups/11"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "List item 3",
@@ -886,6 +945,7 @@
         "$ref": "#/texts/36"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "",
@@ -897,6 +957,7 @@
         "$ref": "#/texts/36"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "",
@@ -908,6 +969,7 @@
         "$ref": "#/texts/36"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "",
diff --git a/tests/data/groundtruth/docling_v2/wiki_duck.html.itxt b/tests/data/groundtruth/docling_v2/wiki_duck.html.itxt
index 2d4a316a..1ac0bf64 100644
--- a/tests/data/groundtruth/docling_v2/wiki_duck.html.itxt
+++ b/tests/data/groundtruth/docling_v2/wiki_duck.html.itxt
@@ -1,477 +1,416 @@
 item-0 at level 0: unspecified: group _root_
-  item-1 at level 1: list: group list
-    item-2 at level 2: list_item: Main page
-    item-3 at level 2: list_item: Contents
-    item-4 at level 2: list_item: Current events
-    item-5 at level 2: list_item: Random article
-    item-6 at level 2: list_item: About Wikipedia
-    item-7 at level 2: list_item: Contact us
-  item-8 at level 1: list: group list
-    item-9 at level 2: list_item: Help
-    item-10 at level 2: list_item: Learn to edit
-    item-11 at level 2: list_item: Community portal
-    item-12 at level 2: list_item: Recent changes
-    item-13 at level 2: list_item: Upload file
-  item-14 at level 1: picture
-  item-15 at level 1: picture
-  item-16 at level 1: picture
-  item-17 at level 1: list: group list
-  item-18 at level 1: list: group list
-    item-19 at level 2: list_item: Donate
-  item-20 at level 1: list: group list
-  item-21 at level 1: list: group list
-    item-22 at level 2: list_item: Create account
-    item-23 at level 2: list_item: Log in
-  item-24 at level 1: list: group list
-    item-25 at level 2: list_item: Create account
-    item-26 at level 2: list_item: Log in
-  item-27 at level 1: list: group list
-    item-28 at level 2: list_item: Contributions
-    item-29 at level 2: list_item: Talk
-  item-30 at level 1: section: group header-1
-    item-31 at level 2: section_header: Contents
-      item-32 at level 3: list: group list
-        item-33 at level 4: list_item: (Top)
-        item-34 at level 4: list_item: 1 Etymology
-          item-35 at level 5: list: group list
-        item-36 at level 4: list_item: 2 Taxonomy
-          item-37 at level 5: list: group list
-        item-38 at level 4: list_item: 3 Morphology
-          item-39 at level 5: list: group list
-        item-40 at level 4: list_item: 4 Distribution and habitat
-          item-41 at level 5: list: group list
-        item-42 at level 4: list_item: 5 Behaviour Toggle Behaviour subsection
-          item-43 at level 5: list: group list
-            item-44 at level 6: list_item: 5.1 Feeding
-              item-45 at level 7: list: group list
-            item-46 at level 6: list_item: 5.2 Breeding
-              item-47 at level 7: list: group list
-            item-48 at level 6: list_item: 5.3 Communication
-              item-49 at level 7: list: group list
-            item-50 at level 6: list_item: 5.4 Predators
-              item-51 at level 7: list: group list
-        item-52 at level 4: list_item: 6 Relationship with humans Toggle Relationship with humans subsection
-          item-53 at level 5: list: group list
-            item-54 at level 6: list_item: 6.1 Hunting
-              item-55 at level 7: list: group list
-            item-56 at level 6: list_item: 6.2 Domestication
-              item-57 at level 7: list: group list
-            item-58 at level 6: list_item: 6.3 Heraldry
-              item-59 at level 7: list: group list
-            item-60 at level 6: list_item: 6.4 Cultural references
-              item-61 at level 7: list: group list
-        item-62 at level 4: list_item: 7 See also
-          item-63 at level 5: list: group list
-        item-64 at level 4: list_item: 8 Notes Toggle Notes subsection
-          item-65 at level 5: list: group list
-            item-66 at level 6: list_item: 8.1 Citations
-              item-67 at level 7: list: group list
-            item-68 at level 6: list_item: 8.2 Sources
-              item-69 at level 7: list: group list
-        item-70 at level 4: list_item: 9 External links
-          item-71 at level 5: list: group list
-  item-72 at level 1: title: Duck
-    item-73 at level 2: list: group list
-      item-74 at level 3: list_item: Acèh
-      item-75 at level 3: list_item: Afrikaans
-      item-76 at level 3: list_item: Alemannisch
-      item-77 at level 3: list_item: አማርኛ
-      item-78 at level 3: list_item: Ænglisc
-      item-79 at level 3: list_item: العربية
-      item-80 at level 3: list_item: Aragonés
-      item-81 at level 3: list_item: ܐܪܡܝܐ
-      item-82 at level 3: list_item: Armãneashti
-      item-83 at level 3: list_item: Asturianu
-      item-84 at level 3: list_item: Atikamekw
-      item-85 at level 3: list_item: Авар
-      item-86 at level 3: list_item: Aymar aru
-      item-87 at level 3: list_item: تۆرکجه
-      item-88 at level 3: list_item: Basa Bali
-      item-89 at level 3: list_item: বাংলা
-      item-90 at level 3: list_item: 閩南語 / Bân-lâm-gú
-      item-91 at level 3: list_item: Беларуская
-      item-92 at level 3: list_item: Беларуская (тарашкевіца)
-      item-93 at level 3: list_item: Bikol Central
-      item-94 at level 3: list_item: Български
-      item-95 at level 3: list_item: Brezhoneg
-      item-96 at level 3: list_item: Буряад
-      item-97 at level 3: list_item: Català
-      item-98 at level 3: list_item: Чӑвашла
-      item-99 at level 3: list_item: Čeština
-      item-100 at level 3: list_item: ChiShona
-      item-101 at level 3: list_item: Cymraeg
-      item-102 at level 3: list_item: Dagbanli
-      item-103 at level 3: list_item: Dansk
-      item-104 at level 3: list_item: Deitsch
-      item-105 at level 3: list_item: Deutsch
-      item-106 at level 3: list_item: डोटेली
-      item-107 at level 3: list_item: Ελληνικά
-      item-108 at level 3: list_item: Emiliàn e rumagnòl
-      item-109 at level 3: list_item: Español
-      item-110 at level 3: list_item: Esperanto
-      item-111 at level 3: list_item: Euskara
-      item-112 at level 3: list_item: فارسی
-      item-113 at level 3: list_item: Français
-      item-114 at level 3: list_item: Gaeilge
-      item-115 at level 3: list_item: Galego
-      item-116 at level 3: list_item: ГӀалгӀай
-      item-117 at level 3: list_item: 贛語
-      item-118 at level 3: list_item: گیلکی
-      item-119 at level 3: list_item: 𐌲𐌿𐍄𐌹𐍃𐌺
-      item-120 at level 3: list_item: गोंयची कोंकणी / Gõychi Konknni
-      item-121 at level 3: list_item: 客家語 / Hak-kâ-ngî
-      item-122 at level 3: list_item: 한국어
-      item-123 at level 3: list_item: Hausa
-      item-124 at level 3: list_item: Հայերեն
-      item-125 at level 3: list_item: हिन्दी
-      item-126 at level 3: list_item: Hrvatski
-      item-127 at level 3: list_item: Ido
-      item-128 at level 3: list_item: Bahasa Indonesia
-      item-129 at level 3: list_item: Iñupiatun
-      item-130 at level 3: list_item: Íslenska
-      item-131 at level 3: list_item: Italiano
-      item-132 at level 3: list_item: עברית
-      item-133 at level 3: list_item: Jawa
-      item-134 at level 3: list_item: ಕನ್ನಡ
-      item-135 at level 3: list_item: Kapampangan
-      item-136 at level 3: list_item: ქართული
-      item-137 at level 3: list_item: कॉशुर / کٲشُر
-      item-138 at level 3: list_item: Қазақша
-      item-139 at level 3: list_item: Ikirundi
-      item-140 at level 3: list_item: Kongo
-      item-141 at level 3: list_item: Kreyòl ayisyen
-      item-142 at level 3: list_item: Кырык мары
-      item-143 at level 3: list_item: ລາວ
-      item-144 at level 3: list_item: Latina
-      item-145 at level 3: list_item: Latviešu
-      item-146 at level 3: list_item: Lietuvių
-      item-147 at level 3: list_item: Li Niha
-      item-148 at level 3: list_item: Ligure
-      item-149 at level 3: list_item: Limburgs
-      item-150 at level 3: list_item: Lingála
-      item-151 at level 3: list_item: Malagasy
-      item-152 at level 3: list_item: മലയാളം
-      item-153 at level 3: list_item: मराठी
-      item-154 at level 3: list_item: مازِرونی
-      item-155 at level 3: list_item: Bahasa Melayu
-      item-156 at level 3: list_item: ꯃꯤꯇꯩ ꯂꯣꯟ
-      item-157 at level 3: list_item: 閩東語 / Mìng-dĕ̤ng-ngṳ̄
-      item-158 at level 3: list_item: Мокшень
-      item-159 at level 3: list_item: Монгол
-      item-160 at level 3: list_item: မြန်မာဘာသာ
-      item-161 at level 3: list_item: Nederlands
-      item-162 at level 3: list_item: Nedersaksies
-      item-163 at level 3: list_item: नेपाली
-      item-164 at level 3: list_item: नेपाल भाषा
-      item-165 at level 3: list_item: 日本語
-      item-166 at level 3: list_item: Нохчийн
-      item-167 at level 3: list_item: Norsk nynorsk
-      item-168 at level 3: list_item: Occitan
-      item-169 at level 3: list_item: Oromoo
-      item-170 at level 3: list_item: ਪੰਜਾਬੀ
-      item-171 at level 3: list_item: Picard
-      item-172 at level 3: list_item: Plattdüütsch
-      item-173 at level 3: list_item: Polski
-      item-174 at level 3: list_item: Português
-      item-175 at level 3: list_item: Qırımtatarca
-      item-176 at level 3: list_item: Română
-      item-177 at level 3: list_item: Русский
-      item-178 at level 3: list_item: Саха тыла
-      item-179 at level 3: list_item: ᱥᱟᱱᱛᱟᱲᱤ
-      item-180 at level 3: list_item: Sardu
-      item-181 at level 3: list_item: Scots
-      item-182 at level 3: list_item: Seeltersk
-      item-183 at level 3: list_item: Shqip
-      item-184 at level 3: list_item: Sicilianu
-      item-185 at level 3: list_item: සිංහල
-      item-186 at level 3: list_item: Simple English
-      item-187 at level 3: list_item: سنڌي
-      item-188 at level 3: list_item: کوردی
-      item-189 at level 3: list_item: Српски / srpski
-      item-190 at level 3: list_item: Srpskohrvatski / српскохрватски
-      item-191 at level 3: list_item: Sunda
-      item-192 at level 3: list_item: Svenska
-      item-193 at level 3: list_item: Tagalog
-      item-194 at level 3: list_item: தமிழ்
-      item-195 at level 3: list_item: Taqbaylit
-      item-196 at level 3: list_item: Татарча / tatarça
-      item-197 at level 3: list_item: ไทย
-      item-198 at level 3: list_item: Türkçe
-      item-199 at level 3: list_item: Українська
-      item-200 at level 3: list_item: ئۇيغۇرچە / Uyghurche
-      item-201 at level 3: list_item: Vahcuengh
-      item-202 at level 3: list_item: Tiếng Việt
-      item-203 at level 3: list_item: Walon
-      item-204 at level 3: list_item: 文言
-      item-205 at level 3: list_item: Winaray
-      item-206 at level 3: list_item: 吴语
-      item-207 at level 3: list_item: 粵語
-      item-208 at level 3: list_item: Žemaitėška
-      item-209 at level 3: list_item: 中文
-    item-210 at level 2: list: group list
-      item-211 at level 3: list_item: Article
-      item-212 at level 3: list_item: Talk
-    item-213 at level 2: list: group list
-    item-214 at level 2: list: group list
-      item-215 at level 3: list_item: Read
-      item-216 at level 3: list_item: View source
-      item-217 at level 3: list_item: View history
-    item-218 at level 2: list: group list
-      item-219 at level 3: list_item: Read
-      item-220 at level 3: list_item: View source
-      item-221 at level 3: list_item: View history
-    item-222 at level 2: list: group list
-      item-223 at level 3: list_item: What links here
-      item-224 at level 3: list_item: Related changes
-      item-225 at level 3: list_item: Upload file
-      item-226 at level 3: list_item: Special pages
-      item-227 at level 3: list_item: Permanent link
-      item-228 at level 3: list_item: Page information
-      item-229 at level 3: list_item: Cite this page
-      item-230 at level 3: list_item: Get shortened URL
-      item-231 at level 3: list_item: Download QR code
-      item-232 at level 3: list_item: Wikidata item
-    item-233 at level 2: list: group list
-      item-234 at level 3: list_item: Download as PDF
-      item-235 at level 3: list_item: Printable version
-    item-236 at level 2: list: group list
-      item-237 at level 3: list_item: Wikimedia Commons
-      item-238 at level 3: list_item: Wikiquote
-    item-239 at level 2: picture
-    item-240 at level 2: table with [13x2]
-    item-241 at level 2: paragraph: Duck is the common name for nume ... und in both fresh water and sea water.
-    item-242 at level 2: paragraph: Ducks are sometimes confused wit ...  divers, grebes, gallinules and coots.
-    item-243 at level 2: section_header: Etymology
-      item-244 at level 3: paragraph: The word duck comes from Old Eng ... h duiken and German tauchen 'to dive'.
-      item-245 at level 3: picture
-        item-245 at level 4: caption: Pacific black duck displaying the characteristic upending "duck"
-      item-246 at level 3: paragraph: This word replaced Old English e ... nskrit ātí 'water bird', among others.
-      item-247 at level 3: paragraph: A duckling is a young duck in do ... , is sometimes labelled as a duckling.
-      item-248 at level 3: paragraph: A male is called a drake and the ... a duck, or in ornithology a hen.[3][4]
-      item-249 at level 3: picture
-        item-249 at level 4: caption: Male mallard.
-      item-250 at level 3: picture
-        item-250 at level 4: caption: Wood ducks.
-    item-251 at level 2: section_header: Taxonomy
-      item-252 at level 3: paragraph: All ducks belong to the biologic ... ationships between various species.[9]
-      item-253 at level 3: picture
-        item-253 at level 4: caption: Mallard landing in approach
-      item-254 at level 3: paragraph: In most modern classifications,  ... all size and stiff, upright tails.[14]
-      item-255 at level 3: paragraph: A number of other species called ...  shelducks in the tribe Tadornini.[15]
-    item-256 at level 2: section_header: Morphology
-      item-257 at level 3: picture
-        item-257 at level 4: caption: Male Mandarin duck
-      item-258 at level 3: paragraph: The overall body plan of ducks i ... is moult typically precedes migration.
-      item-259 at level 3: paragraph: The drakes of northern species o ... rkscrew shaped vagina to prevent rape.
-    item-260 at level 2: section_header: Distribution and habitat
-      item-261 at level 3: picture
-        item-261 at level 4: caption: Flying steamer ducks in Ushuaia, Argentina
-      item-262 at level 3: paragraph: Ducks have a cosmopolitan distri ... endemic to such far-flung islands.[21]
-      item-263 at level 3: picture
-        item-263 at level 4: caption: Female mallard in Cornwall, England
-      item-264 at level 3: paragraph: Some duck species, mainly those  ... t form after localised heavy rain.[23]
-    item-265 at level 2: section_header: Behaviour
-      item-266 at level 3: section_header: Feeding
-        item-267 at level 4: picture
-          item-267 at level 5: caption: Pecten along the bill
-        item-268 at level 4: picture
-          item-268 at level 5: caption: Mallard duckling preening
-        item-269 at level 4: paragraph: Ducks eat food sources such as g ... amphibians, worms, and small molluscs.
-        item-270 at level 4: paragraph: Dabbling ducks feed on the surfa ... thers and to hold slippery food items.
-        item-271 at level 4: paragraph: Diving ducks and sea ducks forag ... ave more difficulty taking off to fly.
-        item-272 at level 4: paragraph: A few specialized species such a ... apted to catch and swallow large fish.
-        item-273 at level 4: paragraph: The others have the characterist ... e nostrils come out through hard horn.
-        item-274 at level 4: paragraph: The Guardian published an articl ...  the ducks and pollutes waterways.[25]
-      item-275 at level 3: section_header: Breeding
-        item-276 at level 4: picture
-          item-276 at level 5: caption: A Muscovy duckling
-        item-277 at level 4: paragraph: Ducks generally only have one pa ... st and led her ducklings to water.[28]
-      item-278 at level 3: section_header: Communication
-        item-279 at level 4: paragraph: Female mallard ducks (as well as ... laying calls or quieter contact calls.
-        item-280 at level 4: paragraph: A common urban legend claims tha ... annel television show MythBusters.[32]
-      item-281 at level 3: section_header: Predators
-        item-282 at level 4: picture
-          item-282 at level 5: caption: Ringed teal
-        item-283 at level 4: paragraph: Ducks have many predators. Duckl ... or large birds, such as hawks or owls.
-        item-284 at level 4: paragraph: Adult ducks are fast fliers, but ... its speed and strength to catch ducks.
-    item-285 at level 2: section_header: Relationship with humans
-      item-286 at level 3: section_header: Hunting
-        item-287 at level 4: paragraph: Humans have hunted ducks since p ...  evidence of this is uncommon.[35][42]
-        item-288 at level 4: paragraph: In many areas, wild ducks (inclu ... inated by pollutants such as PCBs.[44]
-      item-289 at level 3: section_header: Domestication
-        item-290 at level 4: picture
-          item-290 at level 5: caption: Indian Runner ducks, a common breed of domestic ducks
-        item-291 at level 4: paragraph: Ducks have many economic uses, b ... it weighs less than 1 kg (2.2 lb).[48]
-      item-292 at level 3: section_header: Heraldry
-        item-293 at level 4: picture
-          item-293 at level 5: caption: Three black-colored ducks in the coat of arms of Maaninka[49]
-        item-294 at level 4: paragraph: Ducks appear on several coats of ... the coat of arms of Föglö (Åland).[51]
-      item-295 at level 3: section_header: Cultural references
-        item-296 at level 4: paragraph: In 2002, psychologist Richard Wi ... 54] and was made into a movie in 1986.
-        item-297 at level 4: paragraph: The 1992 Disney film The Mighty  ...  Ducks minor league baseball team.[55]
-    item-298 at level 2: section_header: See also
-      item-299 at level 3: list: group list
-        item-300 at level 4: list_item: Birds portal
-      item-301 at level 3: list: group list
-        item-302 at level 4: list_item: Domestic duck
-        item-303 at level 4: list_item: Duck as food
-        item-304 at level 4: list_item: Duck test
-        item-305 at level 4: list_item: Duck breeds
-        item-306 at level 4: list_item: Fictional ducks
-        item-307 at level 4: list_item: Rubber duck
-    item-308 at level 2: section_header: Notes
-      item-309 at level 3: section_header: Citations
-        item-310 at level 4: ordered_list: group ordered list
-          item-311 at level 5: list_item: ^ "Duckling". The American Herit ... n Company. 2006. Retrieved 2015-05-22.
-          item-312 at level 5: list_item: ^ "Duckling". Kernerman English  ...  Ltd. 2000–2006. Retrieved 2015-05-22.
-          item-313 at level 5: list_item: ^ Dohner, Janet Vorwald (2001).  ... University Press. ISBN 978-0300138139.
-          item-314 at level 5: list_item: ^ Visca, Curt; Visca, Kelley (20 ...  Publishing Group. ISBN 9780823961566.
-          item-315 at level 5: list_item: ^ a b c d Carboneras 1992, p. 536.
-          item-316 at level 5: list_item: ^ Livezey 1986, pp. 737–738.
-          item-317 at level 5: list_item: ^ Madsen, McHugh & de Kloet 1988, p. 452.
-          item-318 at level 5: list_item: ^ Donne-Goussé, Laudet & Hänni 2002, pp. 353–354.
-          item-319 at level 5: list_item: ^ a b c d e f Carboneras 1992, p. 540.
-          item-320 at level 5: list_item: ^ Elphick, Dunning & Sibley 2001, p. 191.
-          item-321 at level 5: list_item: ^ Kear 2005, p. 448.
-          item-322 at level 5: list_item: ^ Kear 2005, p. 622–623.
-          item-323 at level 5: list_item: ^ Kear 2005, p. 686.
-          item-324 at level 5: list_item: ^ Elphick, Dunning & Sibley 2001, p. 193.
-          item-325 at level 5: list_item: ^ a b c d e f g Carboneras 1992, p. 537.
-          item-326 at level 5: list_item: ^ American Ornithologists' Union 1998, p. xix.
-          item-327 at level 5: list_item: ^ American Ornithologists' Union 1998.
-          item-328 at level 5: list_item: ^ Carboneras 1992, p. 538.
-          item-329 at level 5: list_item: ^ Christidis & Boles 2008, p. 62.
-          item-330 at level 5: list_item: ^ Shirihai 2008, pp. 239, 245.
-          item-331 at level 5: list_item: ^ a b Pratt, Bruner & Berrett 1987, pp. 98–107.
-          item-332 at level 5: list_item: ^ Fitter, Fitter & Hosking 2000, pp. 52–3.
-          item-333 at level 5: list_item: ^ "Pacific Black Duck". www.wiresnr.org. Retrieved 2018-04-27.
-          item-334 at level 5: list_item: ^ Ogden, Evans. "Dabbling Ducks". CWE. Retrieved 2006-11-02.
-          item-335 at level 5: list_item: ^ Karl Mathiesen (16 March 2015) ...  Guardian. Retrieved 13 November 2016.
-          item-336 at level 5: list_item: ^ Rohwer, Frank C.; Anderson, Mi ... 4615-6787-5_4. ISBN 978-1-4615-6789-9.
-          item-337 at level 5: list_item: ^ Smith, Cyndi M.; Cooke, Fred;  ... 093/condor/102.1.201. hdl:10315/13797.
-          item-338 at level 5: list_item: ^ "If You Find An Orphaned Duckl ... l on 2018-09-23. Retrieved 2018-12-22.
-          item-339 at level 5: list_item: ^ Carver, Heather (2011). The Du ...  9780557901562.[self-published source]
-          item-340 at level 5: list_item: ^ Titlow, Budd (2013-09-03). Bir ... man & Littlefield. ISBN 9780762797707.
-          item-341 at level 5: list_item: ^ Amos, Jonathan (2003-09-08). " ... kers". BBC News. Retrieved 2006-11-02.
-          item-342 at level 5: list_item: ^ "Mythbusters Episode 8". 12 December 2003.
-          item-343 at level 5: list_item: ^ Erlandson 1994, p. 171.
-          item-344 at level 5: list_item: ^ Jeffries 2008, pp. 168, 243.
-          item-345 at level 5: list_item: ^ a b Sued-Badillo 2003, p. 65.
-          item-346 at level 5: list_item: ^ Thorpe 1996, p. 68.
-          item-347 at level 5: list_item: ^ Maisels 1999, p. 42.
-          item-348 at level 5: list_item: ^ Rau 1876, p. 133.
-          item-349 at level 5: list_item: ^ Higman 2012, p. 23.
-          item-350 at level 5: list_item: ^ Hume 2012, p. 53.
-          item-351 at level 5: list_item: ^ Hume 2012, p. 52.
-          item-352 at level 5: list_item: ^ Fieldhouse 2002, p. 167.
-          item-353 at level 5: list_item: ^ Livingston, A. D. (1998-01-01) ... Editions, Limited. ISBN 9781853263774.
-          item-354 at level 5: list_item: ^ "Study plan for waterfowl inju ...  on 2022-10-09. Retrieved 2 July 2019.
-          item-355 at level 5: list_item: ^ "FAOSTAT". www.fao.org. Retrieved 2019-10-25.
-          item-356 at level 5: list_item: ^ "Anas platyrhynchos, Domestic  ... . Digimorph.org. Retrieved 2012-12-23.
-          item-357 at level 5: list_item: ^ Sy Montgomery. "Mallard; Encyc ...  Britannica.com. Retrieved 2012-12-23.
-          item-358 at level 5: list_item: ^ Glenday, Craig (2014). Guinnes ... ited. pp. 135. ISBN 978-1-908843-15-9.
-          item-359 at level 5: list_item: ^ Suomen kunnallisvaakunat (in F ... tto. 1982. p. 147. ISBN 951-773-085-3.
-          item-360 at level 5: list_item: ^ "Lubānas simbolika" (in Latvian). Retrieved September 9, 2021.
-          item-361 at level 5: list_item: ^ "Föglö" (in Swedish). Retrieved September 9, 2021.
-          item-362 at level 5: list_item: ^ Young, Emma. "World's funniest ... w Scientist. Retrieved 7 January 2019.
-          item-363 at level 5: list_item: ^ "Howard the Duck (character)". Grand Comics Database.
-          item-364 at level 5: list_item: ^ Sanderson, Peter; Gilbert, Lau ... luding this bad-tempered talking duck.
-          item-365 at level 5: list_item: ^ "The Duck". University of Oregon Athletics. Retrieved 2022-01-20.
-      item-366 at level 3: section_header: Sources
-        item-367 at level 4: list: group list
-          item-368 at level 5: list_item: American Ornithologists' Union ( ... (PDF) from the original on 2022-10-09.
-          item-369 at level 5: list_item: Carboneras, Carlos (1992). del H ... Lynx Edicions. ISBN 978-84-87334-10-8.
-          item-370 at level 5: list_item: Christidis, Les; Boles, Walter E ... ro Publishing. ISBN 978-0-643-06511-6.
-          item-371 at level 5: list_item: Donne-Goussé, Carole; Laudet, Vi ... /S1055-7903(02)00019-2. PMID 12099792.
-          item-372 at level 5: list_item: Elphick, Chris; Dunning, John B. ... istopher Helm. ISBN 978-0-7136-6250-4.
-          item-373 at level 5: list_item: Erlandson, Jon M. (1994). Early  ... usiness Media. ISBN 978-1-4419-3231-0.
-          item-374 at level 5: list_item: Fieldhouse, Paul (2002). Food, F ... ara: ABC-CLIO. ISBN 978-1-61069-412-4.
-          item-375 at level 5: list_item: Fitter, Julian; Fitter, Daniel;  ... versity Press. ISBN 978-0-691-10295-5.
-          item-376 at level 5: list_item: Higman, B. W. (2012). How Food M ...  Wiley & Sons. ISBN 978-1-4051-8947-7.
-          item-377 at level 5: list_item: Hume, Julian H. (2012). Extinct  ... istopher Helm. ISBN 978-1-4729-3744-5.
-          item-378 at level 5: list_item: Jeffries, Richard (2008). Holoce ... Alabama Press. ISBN 978-0-8173-1658-7.
-          item-379 at level 5: list_item: Kear, Janet, ed. (2005). Ducks,  ... versity Press. ISBN 978-0-19-861009-0.
-          item-380 at level 5: list_item: Livezey, Bradley C. (October 198 ... (PDF) from the original on 2022-10-09.
-          item-381 at level 5: list_item: Madsen, Cort S.; McHugh, Kevin P ... (PDF) from the original on 2022-10-09.
-          item-382 at level 5: list_item: Maisels, Charles Keith (1999). E ... on: Routledge. ISBN 978-0-415-10975-8.
-          item-383 at level 5: list_item: Pratt, H. Douglas; Bruner, Phill ...  University Press. ISBN 0-691-02399-9.
-          item-384 at level 5: list_item: Rau, Charles (1876). Early Man i ... ork: Harper & Brothers. LCCN 05040168.
-          item-385 at level 5: list_item: Shirihai, Hadoram (2008). A Comp ... versity Press. ISBN 978-0-691-13666-0.
-          item-386 at level 5: list_item: Sued-Badillo, Jalil (2003). Auto ... Paris: UNESCO. ISBN 978-92-3-103832-7.
-          item-387 at level 5: list_item: Thorpe, I. J. (1996). The Origin ... rk: Routledge. ISBN 978-0-415-08009-5.
-    item-388 at level 2: section_header: External links
+  item-1 at level 1: title: Duck
+    item-2 at level 2: list: group list
+      item-3 at level 3: list_item: Acèh
+      item-4 at level 3: list_item: Afrikaans
+      item-5 at level 3: list_item: Alemannisch
+      item-6 at level 3: list_item: አማርኛ
+      item-7 at level 3: list_item: Ænglisc
+      item-8 at level 3: list_item: العربية
+      item-9 at level 3: list_item: Aragonés
+      item-10 at level 3: list_item: ܐܪܡܝܐ
+      item-11 at level 3: list_item: Armãneashti
+      item-12 at level 3: list_item: Asturianu
+      item-13 at level 3: list_item: Atikamekw
+      item-14 at level 3: list_item: Авар
+      item-15 at level 3: list_item: Aymar aru
+      item-16 at level 3: list_item: تۆرکجه
+      item-17 at level 3: list_item: Basa Bali
+      item-18 at level 3: list_item: বাংলা
+      item-19 at level 3: list_item: 閩南語 / Bân-lâm-gú
+      item-20 at level 3: list_item: Беларуская
+      item-21 at level 3: list_item: Беларуская (тарашкевіца)
+      item-22 at level 3: list_item: Bikol Central
+      item-23 at level 3: list_item: Български
+      item-24 at level 3: list_item: Brezhoneg
+      item-25 at level 3: list_item: Буряад
+      item-26 at level 3: list_item: Català
+      item-27 at level 3: list_item: Чӑвашла
+      item-28 at level 3: list_item: Čeština
+      item-29 at level 3: list_item: ChiShona
+      item-30 at level 3: list_item: Cymraeg
+      item-31 at level 3: list_item: Dagbanli
+      item-32 at level 3: list_item: Dansk
+      item-33 at level 3: list_item: Deitsch
+      item-34 at level 3: list_item: Deutsch
+      item-35 at level 3: list_item: डोटेली
+      item-36 at level 3: list_item: Ελληνικά
+      item-37 at level 3: list_item: Emiliàn e rumagnòl
+      item-38 at level 3: list_item: Español
+      item-39 at level 3: list_item: Esperanto
+      item-40 at level 3: list_item: Euskara
+      item-41 at level 3: list_item: فارسی
+      item-42 at level 3: list_item: Français
+      item-43 at level 3: list_item: Gaeilge
+      item-44 at level 3: list_item: Galego
+      item-45 at level 3: list_item: ГӀалгӀай
+      item-46 at level 3: list_item: 贛語
+      item-47 at level 3: list_item: گیلکی
+      item-48 at level 3: list_item: 𐌲𐌿𐍄𐌹𐍃𐌺
+      item-49 at level 3: list_item: गोंयची कोंकणी / Gõychi Konknni
+      item-50 at level 3: list_item: 客家語 / Hak-kâ-ngî
+      item-51 at level 3: list_item: 한국어
+      item-52 at level 3: list_item: Hausa
+      item-53 at level 3: list_item: Հայերեն
+      item-54 at level 3: list_item: हिन्दी
+      item-55 at level 3: list_item: Hrvatski
+      item-56 at level 3: list_item: Ido
+      item-57 at level 3: list_item: Bahasa Indonesia
+      item-58 at level 3: list_item: Iñupiatun
+      item-59 at level 3: list_item: Íslenska
+      item-60 at level 3: list_item: Italiano
+      item-61 at level 3: list_item: עברית
+      item-62 at level 3: list_item: Jawa
+      item-63 at level 3: list_item: ಕನ್ನಡ
+      item-64 at level 3: list_item: Kapampangan
+      item-65 at level 3: list_item: ქართული
+      item-66 at level 3: list_item: कॉशुर / کٲشُر
+      item-67 at level 3: list_item: Қазақша
+      item-68 at level 3: list_item: Ikirundi
+      item-69 at level 3: list_item: Kongo
+      item-70 at level 3: list_item: Kreyòl ayisyen
+      item-71 at level 3: list_item: Кырык мары
+      item-72 at level 3: list_item: ລາວ
+      item-73 at level 3: list_item: Latina
+      item-74 at level 3: list_item: Latviešu
+      item-75 at level 3: list_item: Lietuvių
+      item-76 at level 3: list_item: Li Niha
+      item-77 at level 3: list_item: Ligure
+      item-78 at level 3: list_item: Limburgs
+      item-79 at level 3: list_item: Lingála
+      item-80 at level 3: list_item: Malagasy
+      item-81 at level 3: list_item: മലയാളം
+      item-82 at level 3: list_item: मराठी
+      item-83 at level 3: list_item: مازِرونی
+      item-84 at level 3: list_item: Bahasa Melayu
+      item-85 at level 3: list_item: ꯃꯤꯇꯩ ꯂꯣꯟ
+      item-86 at level 3: list_item: 閩東語 / Mìng-dĕ̤ng-ngṳ̄
+      item-87 at level 3: list_item: Мокшень
+      item-88 at level 3: list_item: Монгол
+      item-89 at level 3: list_item: မြန်မာဘာသာ
+      item-90 at level 3: list_item: Nederlands
+      item-91 at level 3: list_item: Nedersaksies
+      item-92 at level 3: list_item: नेपाली
+      item-93 at level 3: list_item: नेपाल भाषा
+      item-94 at level 3: list_item: 日本語
+      item-95 at level 3: list_item: Нохчийн
+      item-96 at level 3: list_item: Norsk nynorsk
+      item-97 at level 3: list_item: Occitan
+      item-98 at level 3: list_item: Oromoo
+      item-99 at level 3: list_item: ਪੰਜਾਬੀ
+      item-100 at level 3: list_item: Picard
+      item-101 at level 3: list_item: Plattdüütsch
+      item-102 at level 3: list_item: Polski
+      item-103 at level 3: list_item: Português
+      item-104 at level 3: list_item: Qırımtatarca
+      item-105 at level 3: list_item: Română
+      item-106 at level 3: list_item: Русский
+      item-107 at level 3: list_item: Саха тыла
+      item-108 at level 3: list_item: ᱥᱟᱱᱛᱟᱲᱤ
+      item-109 at level 3: list_item: Sardu
+      item-110 at level 3: list_item: Scots
+      item-111 at level 3: list_item: Seeltersk
+      item-112 at level 3: list_item: Shqip
+      item-113 at level 3: list_item: Sicilianu
+      item-114 at level 3: list_item: සිංහල
+      item-115 at level 3: list_item: Simple English
+      item-116 at level 3: list_item: سنڌي
+      item-117 at level 3: list_item: کوردی
+      item-118 at level 3: list_item: Српски / srpski
+      item-119 at level 3: list_item: Srpskohrvatski / српскохрватски
+      item-120 at level 3: list_item: Sunda
+      item-121 at level 3: list_item: Svenska
+      item-122 at level 3: list_item: Tagalog
+      item-123 at level 3: list_item: தமிழ்
+      item-124 at level 3: list_item: Taqbaylit
+      item-125 at level 3: list_item: Татарча / tatarça
+      item-126 at level 3: list_item: ไทย
+      item-127 at level 3: list_item: Türkçe
+      item-128 at level 3: list_item: Українська
+      item-129 at level 3: list_item: ئۇيغۇرچە / Uyghurche
+      item-130 at level 3: list_item: Vahcuengh
+      item-131 at level 3: list_item: Tiếng Việt
+      item-132 at level 3: list_item: Walon
+      item-133 at level 3: list_item: 文言
+      item-134 at level 3: list_item: Winaray
+      item-135 at level 3: list_item: 吴语
+      item-136 at level 3: list_item: 粵語
+      item-137 at level 3: list_item: Žemaitėška
+      item-138 at level 3: list_item: 中文
+    item-139 at level 2: list: group list
+      item-140 at level 3: list_item: Article
+      item-141 at level 3: list_item: Talk
+    item-142 at level 2: list: group list
+    item-143 at level 2: list: group list
+      item-144 at level 3: list_item: Read
+      item-145 at level 3: list_item: View source
+      item-146 at level 3: list_item: View history
+    item-147 at level 2: text: Tools
+    item-148 at level 2: text: Actions
+    item-149 at level 2: list: group list
+      item-150 at level 3: list_item: Read
+      item-151 at level 3: list_item: View source
+      item-152 at level 3: list_item: View history
+    item-153 at level 2: text: General
+    item-154 at level 2: list: group list
+      item-155 at level 3: list_item: What links here
+      item-156 at level 3: list_item: Related changes
+      item-157 at level 3: list_item: Upload file
+      item-158 at level 3: list_item: Special pages
+      item-159 at level 3: list_item: Permanent link
+      item-160 at level 3: list_item: Page information
+      item-161 at level 3: list_item: Cite this page
+      item-162 at level 3: list_item: Get shortened URL
+      item-163 at level 3: list_item: Download QR code
+      item-164 at level 3: list_item: Wikidata item
+    item-165 at level 2: text: Print/export
+    item-166 at level 2: list: group list
+      item-167 at level 3: list_item: Download as PDF
+      item-168 at level 3: list_item: Printable version
+    item-169 at level 2: text: In other projects
+    item-170 at level 2: list: group list
+      item-171 at level 3: list_item: Wikimedia Commons
+      item-172 at level 3: list_item: Wikiquote
+    item-173 at level 2: text: Appearance
+    item-174 at level 2: picture
+    item-175 at level 2: text: From Wikipedia, the free encyclopedia
+    item-176 at level 2: text: Common name for many species of bird
+    item-177 at level 2: text: This article is about the bird.  ... as a food, see . For other uses, see .
+    item-178 at level 2: text: "Duckling" redirects here. For other uses, see .
+    item-179 at level 2: table with [13x2]
+    item-180 at level 2: text: Duck is the common name for nume ... und in both fresh water and sea water.
+    item-181 at level 2: text: Ducks are sometimes confused wit ...  divers, grebes, gallinules and coots.
+    item-182 at level 2: section_header: Etymology
+      item-183 at level 3: text: The word duck comes from Old Eng ... h duiken and German tauchen 'to dive'.
+      item-184 at level 3: picture
+        item-184 at level 4: caption: Pacific black duck displaying the characteristic upending "duck"
+      item-185 at level 3: text: This word replaced Old English e ... nskrit ātí 'water bird', among others.
+      item-186 at level 3: text: A duckling is a young duck in do ... , is sometimes labelled as a duckling.
+      item-187 at level 3: text: A male is called a drake and the ... a duck, or in ornithology a hen.[3][4]
+      item-188 at level 3: picture
+        item-188 at level 4: caption: Male mallard.
+      item-189 at level 3: picture
+        item-189 at level 4: caption: Wood ducks.
+    item-190 at level 2: section_header: Taxonomy
+      item-191 at level 3: text: All ducks belong to the biologic ... ationships between various species.[9]
+      item-192 at level 3: picture
+        item-192 at level 4: caption: Mallard landing in approach
+      item-193 at level 3: text: In most modern classifications,  ... all size and stiff, upright tails.[14]
+      item-194 at level 3: text: A number of other species called ...  shelducks in the tribe Tadornini.[15]
+    item-195 at level 2: section_header: Morphology
+      item-196 at level 3: picture
+        item-196 at level 4: caption: Male Mandarin duck
+      item-197 at level 3: text: The overall body plan of ducks i ... is moult typically precedes migration.
+      item-198 at level 3: text: The drakes of northern species o ... rkscrew shaped vagina to prevent rape.
+    item-199 at level 2: section_header: Distribution and habitat
+      item-200 at level 3: picture
+        item-200 at level 4: caption: Flying steamer ducks in Ushuaia, Argentina
+      item-201 at level 3: text: Ducks have a cosmopolitan distri ... endemic to such far-flung islands.[21]
+      item-202 at level 3: picture
+        item-202 at level 4: caption: Female mallard in Cornwall, England
+      item-203 at level 3: text: Some duck species, mainly those  ... t form after localised heavy rain.[23]
+    item-204 at level 2: section_header: Behaviour
+      item-205 at level 3: section_header: Feeding
+        item-206 at level 4: picture
+          item-206 at level 5: caption: Pecten along the bill
+        item-207 at level 4: picture
+          item-207 at level 5: caption: Mallard duckling preening
+        item-208 at level 4: text: Ducks eat food sources such as g ... amphibians, worms, and small molluscs.
+        item-209 at level 4: text: Dabbling ducks feed on the surfa ... thers and to hold slippery food items.
+        item-210 at level 4: text: Diving ducks and sea ducks forag ... ave more difficulty taking off to fly.
+        item-211 at level 4: text: A few specialized species such a ... apted to catch and swallow large fish.
+        item-212 at level 4: text: The others have the characterist ... e nostrils come out through hard horn.
+        item-213 at level 4: text: The Guardian published an articl ...  the ducks and pollutes waterways.[25]
+      item-214 at level 3: section_header: Breeding
+        item-215 at level 4: picture
+          item-215 at level 5: caption: A Muscovy duckling
+        item-216 at level 4: text: Ducks generally only have one pa ... st and led her ducklings to water.[28]
+      item-217 at level 3: section_header: Communication
+        item-218 at level 4: text: Female mallard ducks (as well as ... laying calls or quieter contact calls.
+        item-219 at level 4: text: A common urban legend claims tha ... annel television show MythBusters.[32]
+      item-220 at level 3: section_header: Predators
+        item-221 at level 4: picture
+          item-221 at level 5: caption: Ringed teal
+        item-222 at level 4: text: Ducks have many predators. Duckl ... or large birds, such as hawks or owls.
+        item-223 at level 4: text: Adult ducks are fast fliers, but ... its speed and strength to catch ducks.
+    item-224 at level 2: section_header: Relationship with humans
+      item-225 at level 3: section_header: Hunting
+        item-226 at level 4: text: Humans have hunted ducks since p ...  evidence of this is uncommon.[35][42]
+        item-227 at level 4: text: In many areas, wild ducks (inclu ... inated by pollutants such as PCBs.[44]
+      item-228 at level 3: section_header: Domestication
+        item-229 at level 4: picture
+          item-229 at level 5: caption: Indian Runner ducks, a common breed of domestic ducks
+        item-230 at level 4: text: Ducks have many economic uses, b ... it weighs less than 1 kg (2.2 lb).[48]
+      item-231 at level 3: section_header: Heraldry
+        item-232 at level 4: picture
+          item-232 at level 5: caption: Three black-colored ducks in the coat of arms of Maaninka[49]
+        item-233 at level 4: text: Ducks appear on several coats of ... the coat of arms of Föglö (Åland).[51]
+      item-234 at level 3: section_header: Cultural references
+        item-235 at level 4: text: In 2002, psychologist Richard Wi ... 54] and was made into a movie in 1986.
+        item-236 at level 4: text: The 1992 Disney film The Mighty  ...  Ducks minor league baseball team.[55]
+    item-237 at level 2: section_header: See also
+      item-238 at level 3: list: group list
+        item-239 at level 4: list_item: Birds portal
+      item-240 at level 3: list: group list
+        item-241 at level 4: list_item: Domestic duck
+        item-242 at level 4: list_item: Duck as food
+        item-243 at level 4: list_item: Duck test
+        item-244 at level 4: list_item: Duck breeds
+        item-245 at level 4: list_item: Fictional ducks
+        item-246 at level 4: list_item: Rubber duck
+    item-247 at level 2: section_header: Notes
+      item-248 at level 3: section_header: Citations
+        item-249 at level 4: ordered_list: group ordered list
+          item-250 at level 5: list_item: ^ "Duckling". The American Herit ... n Company. 2006. Retrieved 2015-05-22.
+          item-251 at level 5: list_item: ^ "Duckling". Kernerman English  ...  Ltd. 2000–2006. Retrieved 2015-05-22.
+          item-252 at level 5: list_item: ^ Dohner, Janet Vorwald (2001).  ... University Press. ISBN 978-0300138139.
+          item-253 at level 5: list_item: ^ Visca, Curt; Visca, Kelley (20 ...  Publishing Group. ISBN 9780823961566.
+          item-254 at level 5: list_item: ^ a b c d Carboneras 1992, p. 536.
+          item-255 at level 5: list_item: ^ Livezey 1986, pp. 737–738.
+          item-256 at level 5: list_item: ^ Madsen, McHugh & de Kloet 1988, p. 452.
+          item-257 at level 5: list_item: ^ Donne-Goussé, Laudet & Hänni 2002, pp. 353–354.
+          item-258 at level 5: list_item: ^ a b c d e f Carboneras 1992, p. 540.
+          item-259 at level 5: list_item: ^ Elphick, Dunning & Sibley 2001, p. 191.
+          item-260 at level 5: list_item: ^ Kear 2005, p. 448.
+          item-261 at level 5: list_item: ^ Kear 2005, p. 622–623.
+          item-262 at level 5: list_item: ^ Kear 2005, p. 686.
+          item-263 at level 5: list_item: ^ Elphick, Dunning & Sibley 2001, p. 193.
+          item-264 at level 5: list_item: ^ a b c d e f g Carboneras 1992, p. 537.
+          item-265 at level 5: list_item: ^ American Ornithologists' Union 1998, p. xix.
+          item-266 at level 5: list_item: ^ American Ornithologists' Union 1998.
+          item-267 at level 5: list_item: ^ Carboneras 1992, p. 538.
+          item-268 at level 5: list_item: ^ Christidis & Boles 2008, p. 62.
+          item-269 at level 5: list_item: ^ Shirihai 2008, pp. 239, 245.
+          item-270 at level 5: list_item: ^ a b Pratt, Bruner & Berrett 1987, pp. 98–107.
+          item-271 at level 5: list_item: ^ Fitter, Fitter & Hosking 2000, pp. 52–3.
+          item-272 at level 5: list_item: ^ "Pacific Black Duck". www.wiresnr.org. Retrieved 2018-04-27.
+          item-273 at level 5: list_item: ^ Ogden, Evans. "Dabbling Ducks". CWE. Retrieved 2006-11-02.
+          item-274 at level 5: list_item: ^ Karl Mathiesen (16 March 2015) ...  Guardian. Retrieved 13 November 2016.
+          item-275 at level 5: list_item: ^ Rohwer, Frank C.; Anderson, Mi ... 4615-6787-5_4. ISBN 978-1-4615-6789-9.
+          item-276 at level 5: list_item: ^ Smith, Cyndi M.; Cooke, Fred;  ... 093/condor/102.1.201. hdl:10315/13797.
+          item-277 at level 5: list_item: ^ "If You Find An Orphaned Duckl ... l on 2018-09-23. Retrieved 2018-12-22.
+          item-278 at level 5: list_item: ^ Carver, Heather (2011). The Du ...  9780557901562.[self-published source]
+          item-279 at level 5: list_item: ^ Titlow, Budd (2013-09-03). Bir ... man & Littlefield. ISBN 9780762797707.
+          item-280 at level 5: list_item: ^ Amos, Jonathan (2003-09-08). " ... kers". BBC News. Retrieved 2006-11-02.
+          item-281 at level 5: list_item: ^ "Mythbusters Episode 8". 12 December 2003.
+          item-282 at level 5: list_item: ^ Erlandson 1994, p. 171.
+          item-283 at level 5: list_item: ^ Jeffries 2008, pp. 168, 243.
+          item-284 at level 5: list_item: ^ a b Sued-Badillo 2003, p. 65.
+          item-285 at level 5: list_item: ^ Thorpe 1996, p. 68.
+          item-286 at level 5: list_item: ^ Maisels 1999, p. 42.
+          item-287 at level 5: list_item: ^ Rau 1876, p. 133.
+          item-288 at level 5: list_item: ^ Higman 2012, p. 23.
+          item-289 at level 5: list_item: ^ Hume 2012, p. 53.
+          item-290 at level 5: list_item: ^ Hume 2012, p. 52.
+          item-291 at level 5: list_item: ^ Fieldhouse 2002, p. 167.
+          item-292 at level 5: list_item: ^ Livingston, A. D. (1998-01-01) ... Editions, Limited. ISBN 9781853263774.
+          item-293 at level 5: list_item: ^ "Study plan for waterfowl inju ...  on 2022-10-09. Retrieved 2 July 2019.
+          item-294 at level 5: list_item: ^ "FAOSTAT". www.fao.org. Retrieved 2019-10-25.
+          item-295 at level 5: list_item: ^ "Anas platyrhynchos, Domestic  ... . Digimorph.org. Retrieved 2012-12-23.
+          item-296 at level 5: list_item: ^ Sy Montgomery. "Mallard; Encyc ...  Britannica.com. Retrieved 2012-12-23.
+          item-297 at level 5: list_item: ^ Glenday, Craig (2014). Guinnes ... ited. pp. 135. ISBN 978-1-908843-15-9.
+          item-298 at level 5: list_item: ^ Suomen kunnallisvaakunat (in F ... tto. 1982. p. 147. ISBN 951-773-085-3.
+          item-299 at level 5: list_item: ^ "Lubānas simbolika" (in Latvian). Retrieved September 9, 2021.
+          item-300 at level 5: list_item: ^ "Föglö" (in Swedish). Retrieved September 9, 2021.
+          item-301 at level 5: list_item: ^ Young, Emma. "World's funniest ... w Scientist. Retrieved 7 January 2019.
+          item-302 at level 5: list_item: ^ "Howard the Duck (character)". Grand Comics Database.
+          item-303 at level 5: list_item: ^ Sanderson, Peter; Gilbert, Lau ... luding this bad-tempered talking duck.
+          item-304 at level 5: list_item: ^ "The Duck". University of Oregon Athletics. Retrieved 2022-01-20.
+      item-305 at level 3: section_header: Sources
+        item-306 at level 4: list: group list
+          item-307 at level 5: list_item: American Ornithologists' Union ( ... (PDF) from the original on 2022-10-09.
+          item-308 at level 5: list_item: Carboneras, Carlos (1992). del H ... Lynx Edicions. ISBN 978-84-87334-10-8.
+          item-309 at level 5: list_item: Christidis, Les; Boles, Walter E ... ro Publishing. ISBN 978-0-643-06511-6.
+          item-310 at level 5: list_item: Donne-Goussé, Carole; Laudet, Vi ... /S1055-7903(02)00019-2. PMID 12099792.
+          item-311 at level 5: list_item: Elphick, Chris; Dunning, John B. ... istopher Helm. ISBN 978-0-7136-6250-4.
+          item-312 at level 5: list_item: Erlandson, Jon M. (1994). Early  ... usiness Media. ISBN 978-1-4419-3231-0.
+          item-313 at level 5: list_item: Fieldhouse, Paul (2002). Food, F ... ara: ABC-CLIO. ISBN 978-1-61069-412-4.
+          item-314 at level 5: list_item: Fitter, Julian; Fitter, Daniel;  ... versity Press. ISBN 978-0-691-10295-5.
+          item-315 at level 5: list_item: Higman, B. W. (2012). How Food M ...  Wiley & Sons. ISBN 978-1-4051-8947-7.
+          item-316 at level 5: list_item: Hume, Julian H. (2012). Extinct  ... istopher Helm. ISBN 978-1-4729-3744-5.
+          item-317 at level 5: list_item: Jeffries, Richard (2008). Holoce ... Alabama Press. ISBN 978-0-8173-1658-7.
+          item-318 at level 5: list_item: Kear, Janet, ed. (2005). Ducks,  ... versity Press. ISBN 978-0-19-861009-0.
+          item-319 at level 5: list_item: Livezey, Bradley C. (October 198 ... (PDF) from the original on 2022-10-09.
+          item-320 at level 5: list_item: Madsen, Cort S.; McHugh, Kevin P ... (PDF) from the original on 2022-10-09.
+          item-321 at level 5: list_item: Maisels, Charles Keith (1999). E ... on: Routledge. ISBN 978-0-415-10975-8.
+          item-322 at level 5: list_item: Pratt, H. Douglas; Bruner, Phill ...  University Press. ISBN 0-691-02399-9.
+          item-323 at level 5: list_item: Rau, Charles (1876). Early Man i ... ork: Harper & Brothers. LCCN 05040168.
+          item-324 at level 5: list_item: Shirihai, Hadoram (2008). A Comp ... versity Press. ISBN 978-0-691-13666-0.
+          item-325 at level 5: list_item: Sued-Badillo, Jalil (2003). Auto ... Paris: UNESCO. ISBN 978-92-3-103832-7.
+          item-326 at level 5: list_item: Thorpe, I. J. (1996). The Origin ... rk: Routledge. ISBN 978-0-415-08009-5.
+    item-327 at level 2: section_header: External links
+      item-328 at level 3: list: group list
+        item-329 at level 4: list_item: Definitions from Wiktionary
+        item-330 at level 4: list_item: Media from Commons
+        item-331 at level 4: list_item: Quotations from Wikiquote
+        item-332 at level 4: list_item: Recipes from Wikibooks
+        item-333 at level 4: list_item: Taxa from Wikispecies
+        item-334 at level 4: list_item: Data from Wikidata
+      item-335 at level 3: list: group list
+        item-336 at level 4: list_item: list of books (useful looking abstracts)
+        item-337 at level 4: list_item: Ducks on postage stamps Archived 2013-05-13 at the Wayback Machine
+        item-338 at level 4: list_item: Ducks at a Distance, by Rob Hine ... uide to identification of US waterfowl
+      item-339 at level 3: table with [3x2]
+      item-340 at level 3: picture
+      item-341 at level 3: text: Retrieved from ""
+      item-342 at level 3: text: :
+      item-343 at level 3: list: group list
+        item-344 at level 4: list_item: Ducks
+        item-345 at level 4: list_item: Game birds
+        item-346 at level 4: list_item: Bird common names
+      item-347 at level 3: text: Hidden categories:
+      item-348 at level 3: list: group list
+        item-349 at level 4: list_item: All accuracy disputes
+        item-350 at level 4: list_item: Accuracy disputes from February 2020
+        item-351 at level 4: list_item: CS1 Finnish-language sources (fi)
+        item-352 at level 4: list_item: CS1 Latvian-language sources (lv)
+        item-353 at level 4: list_item: CS1 Swedish-language sources (sv)
+        item-354 at level 4: list_item: Articles with short description
+        item-355 at level 4: list_item: Short description is different from Wikidata
+        item-356 at level 4: list_item: Wikipedia indefinitely move-protected pages
+        item-357 at level 4: list_item: Wikipedia indefinitely semi-protected pages
+        item-358 at level 4: list_item: Articles with 'species' microformats
+        item-359 at level 4: list_item: Articles containing Old English (ca. 450-1100)-language text
+        item-360 at level 4: list_item: Articles containing Dutch-language text
+        item-361 at level 4: list_item: Articles containing German-language text
+        item-362 at level 4: list_item: Articles containing Norwegian-language text
+        item-363 at level 4: list_item: Articles containing Lithuanian-language text
+        item-364 at level 4: list_item: Articles containing Ancient Greek (to 1453)-language text
+        item-365 at level 4: list_item: All articles with self-published sources
+        item-366 at level 4: list_item: Articles with self-published sources from February 2020
+        item-367 at level 4: list_item: All articles with unsourced statements
+        item-368 at level 4: list_item: Articles with unsourced statements from January 2022
+        item-369 at level 4: list_item: CS1: long volume value
+        item-370 at level 4: list_item: Pages using Sister project links with wikidata mismatch
+        item-371 at level 4: list_item: Pages using Sister project links with hidden wikidata
+        item-372 at level 4: list_item: Webarchive template wayback links
+        item-373 at level 4: list_item: Articles with Project Gutenberg links
+        item-374 at level 4: list_item: Articles containing video clips
+      item-375 at level 3: list: group list
+        item-376 at level 4: list_item: This page was last edited on 21 September 2024, at 12:11 (UTC).
+        item-377 at level 4: list_item: Text is available under the Crea ... tion, Inc., a non-profit organization.
+      item-378 at level 3: list: group list
+        item-379 at level 4: list_item: Privacy policy
+        item-380 at level 4: list_item: About Wikipedia
+        item-381 at level 4: list_item: Disclaimers
+        item-382 at level 4: list_item: Contact Wikipedia
+        item-383 at level 4: list_item: Code of Conduct
+        item-384 at level 4: list_item: Developers
+        item-385 at level 4: list_item: Statistics
+        item-386 at level 4: list_item: Cookie statement
+        item-387 at level 4: list_item: Mobile view
+      item-388 at level 3: list: group list
       item-389 at level 3: list: group list
-        item-390 at level 4: list_item: Definitions from Wiktionary
-        item-391 at level 4: list_item: Media from Commons
-        item-392 at level 4: list_item: Quotations from Wikiquote
-        item-393 at level 4: list_item: Recipes from Wikibooks
-        item-394 at level 4: list_item: Taxa from Wikispecies
-        item-395 at level 4: list_item: Data from Wikidata
-      item-396 at level 3: list: group list
-        item-397 at level 4: list_item: list of books (useful looking abstracts)
-        item-398 at level 4: list_item: Ducks on postage stamps Archived 2013-05-13 at the Wayback Machine
-        item-399 at level 4: list_item: 
-        item-400 at level 4: list_item: Ducks at a Distance, by Rob Hine ... uide to identification of US waterfowl
-      item-401 at level 3: table with [3x2]
-      item-402 at level 3: picture
-      item-403 at level 3: list: group list
-        item-404 at level 4: list_item: Ducks
-        item-405 at level 4: list_item: Game birds
-        item-406 at level 4: list_item: Bird common names
-      item-407 at level 3: list: group list
-        item-408 at level 4: list_item: All accuracy disputes
-        item-409 at level 4: list_item: Accuracy disputes from February 2020
-        item-410 at level 4: list_item: CS1 Finnish-language sources (fi)
-        item-411 at level 4: list_item: CS1 Latvian-language sources (lv)
-        item-412 at level 4: list_item: CS1 Swedish-language sources (sv)
-        item-413 at level 4: list_item: Articles with short description
-        item-414 at level 4: list_item: Short description is different from Wikidata
-        item-415 at level 4: list_item: Wikipedia indefinitely move-protected pages
-        item-416 at level 4: list_item: Wikipedia indefinitely semi-protected pages
-        item-417 at level 4: list_item: Articles with 'species' microformats
-        item-418 at level 4: list_item: Articles containing Old English (ca. 450-1100)-language text
-        item-419 at level 4: list_item: Articles containing Dutch-language text
-        item-420 at level 4: list_item: Articles containing German-language text
-        item-421 at level 4: list_item: Articles containing Norwegian-language text
-        item-422 at level 4: list_item: Articles containing Lithuanian-language text
-        item-423 at level 4: list_item: Articles containing Ancient Greek (to 1453)-language text
-        item-424 at level 4: list_item: All articles with self-published sources
-        item-425 at level 4: list_item: Articles with self-published sources from February 2020
-        item-426 at level 4: list_item: All articles with unsourced statements
-        item-427 at level 4: list_item: Articles with unsourced statements from January 2022
-        item-428 at level 4: list_item: CS1: long volume value
-        item-429 at level 4: list_item: Pages using Sister project links with wikidata mismatch
-        item-430 at level 4: list_item: Pages using Sister project links with hidden wikidata
-        item-431 at level 4: list_item: Webarchive template wayback links
-        item-432 at level 4: list_item: Articles with Project Gutenberg links
-        item-433 at level 4: list_item: Articles containing video clips
-      item-434 at level 3: list: group list
-        item-435 at level 4: list_item: This page was last edited on 21 September 2024, at 12:11 (UTC).
-        item-436 at level 4: list_item: Text is available under the Crea ... tion, Inc., a non-profit organization.
-      item-437 at level 3: list: group list
-        item-438 at level 4: list_item: Privacy policy
-        item-439 at level 4: list_item: About Wikipedia
-        item-440 at level 4: list_item: Disclaimers
-        item-441 at level 4: list_item: Contact Wikipedia
-        item-442 at level 4: list_item: Code of Conduct
-        item-443 at level 4: list_item: Developers
-        item-444 at level 4: list_item: Statistics
-        item-445 at level 4: list_item: Cookie statement
-        item-446 at level 4: list_item: Mobile view
-      item-447 at level 3: list: group list
-        item-448 at level 4: list_item: 
-        item-449 at level 4: list_item: 
-      item-450 at level 3: list: group list
-  item-451 at level 1: caption: Pacific black duck displaying the characteristic upending "duck"
-  item-452 at level 1: caption: Male mallard.
-  item-453 at level 1: caption: Wood ducks.
-  item-454 at level 1: caption: Mallard landing in approach
-  item-455 at level 1: caption: Male Mandarin duck
-  item-456 at level 1: caption: Flying steamer ducks in Ushuaia, Argentina
-  item-457 at level 1: caption: Female mallard in Cornwall, England
-  item-458 at level 1: caption: Pecten along the bill
-  item-459 at level 1: caption: Mallard duckling preening
-  item-460 at level 1: caption: A Muscovy duckling
-  item-461 at level 1: caption: Ringed teal
-  item-462 at level 1: caption: Indian Runner ducks, a common breed of domestic ducks
-  item-463 at level 1: caption: Three black-colored ducks in the coat of arms of Maaninka[49]
\ No newline at end of file
+  item-390 at level 1: caption: Pacific black duck displaying the characteristic upending "duck"
+  item-391 at level 1: caption: Male mallard.
+  item-392 at level 1: caption: Wood ducks.
+  item-393 at level 1: caption: Mallard landing in approach
+  item-394 at level 1: caption: Male Mandarin duck
+  item-395 at level 1: caption: Flying steamer ducks in Ushuaia, Argentina
+  item-396 at level 1: caption: Female mallard in Cornwall, England
+  item-397 at level 1: caption: Pecten along the bill
+  item-398 at level 1: caption: Mallard duckling preening
+  item-399 at level 1: caption: A Muscovy duckling
+  item-400 at level 1: caption: Ringed teal
+  item-401 at level 1: caption: Indian Runner ducks, a common breed of domestic ducks
+  item-402 at level 1: caption: Three black-colored ducks in the coat of arms of Maaninka[49]
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v2/wiki_duck.html.json b/tests/data/groundtruth/docling_v2/wiki_duck.html.json
index 11168769..32433514 100644
--- a/tests/data/groundtruth/docling_v2/wiki_duck.html.json
+++ b/tests/data/groundtruth/docling_v2/wiki_duck.html.json
@@ -1,6 +1,6 @@
 {
   "schema_name": "DoclingDocument",
-  "version": "1.0.0",
+  "version": "1.1.0",
   "name": "wiki_duck",
   "origin": {
     "mimetype": "text/html",
@@ -10,15 +10,25 @@
   "furniture": {
     "self_ref": "#/furniture",
     "children": [],
+    "content_layer": "furniture",
     "name": "_root_",
     "label": "unspecified"
   },
   "body": {
     "self_ref": "#/body",
     "children": [
+      {
+        "$ref": "#/texts/0"
+      },
+      {
+        "$ref": "#/texts/1"
+      },
       {
         "$ref": "#/groups/0"
       },
+      {
+        "$ref": "#/texts/8"
+      },
       {
         "$ref": "#/groups/1"
       },
@@ -46,6 +56,9 @@
       {
         "$ref": "#/groups/6"
       },
+      {
+        "$ref": "#/texts/19"
+      },
       {
         "$ref": "#/groups/7"
       },
@@ -53,37 +66,31 @@
         "$ref": "#/groups/8"
       },
       {
-        "$ref": "#/texts/39"
+        "$ref": "#/texts/43"
       },
       {
-        "$ref": "#/texts/202"
-      },
-      {
-        "$ref": "#/texts/206"
-      },
-      {
-        "$ref": "#/texts/207"
-      },
-      {
-        "$ref": "#/texts/210"
-      },
-      {
-        "$ref": "#/texts/214"
-      },
-      {
-        "$ref": "#/texts/218"
+        "$ref": "#/texts/216"
       },
       {
         "$ref": "#/texts/220"
       },
+      {
+        "$ref": "#/texts/221"
+      },
       {
         "$ref": "#/texts/224"
       },
       {
-        "$ref": "#/texts/225"
+        "$ref": "#/texts/228"
       },
       {
-        "$ref": "#/texts/233"
+        "$ref": "#/texts/232"
+      },
+      {
+        "$ref": "#/texts/234"
+      },
+      {
+        "$ref": "#/texts/238"
       },
       {
         "$ref": "#/texts/239"
@@ -92,9 +99,16 @@
         "$ref": "#/texts/247"
       },
       {
-        "$ref": "#/texts/250"
+        "$ref": "#/texts/253"
+      },
+      {
+        "$ref": "#/texts/261"
+      },
+      {
+        "$ref": "#/texts/264"
       }
     ],
+    "content_layer": "body",
     "name": "_root_",
     "label": "unspecified"
   },
@@ -105,12 +119,6 @@
         "$ref": "#/body"
       },
       "children": [
-        {
-          "$ref": "#/texts/0"
-        },
-        {
-          "$ref": "#/texts/1"
-        },
         {
           "$ref": "#/texts/2"
         },
@@ -122,8 +130,15 @@
         },
         {
           "$ref": "#/texts/5"
+        },
+        {
+          "$ref": "#/texts/6"
+        },
+        {
+          "$ref": "#/texts/7"
         }
       ],
+      "content_layer": "furniture",
       "name": "list",
       "label": "list"
     },
@@ -133,22 +148,23 @@
         "$ref": "#/body"
       },
       "children": [
-        {
-          "$ref": "#/texts/6"
-        },
-        {
-          "$ref": "#/texts/7"
-        },
-        {
-          "$ref": "#/texts/8"
-        },
         {
           "$ref": "#/texts/9"
         },
         {
           "$ref": "#/texts/10"
+        },
+        {
+          "$ref": "#/texts/11"
+        },
+        {
+          "$ref": "#/texts/12"
+        },
+        {
+          "$ref": "#/texts/13"
         }
       ],
+      "content_layer": "furniture",
       "name": "list",
       "label": "list"
     },
@@ -158,6 +174,7 @@
         "$ref": "#/body"
       },
       "children": [],
+      "content_layer": "furniture",
       "name": "list",
       "label": "list"
     },
@@ -168,9 +185,10 @@
       },
       "children": [
         {
-          "$ref": "#/texts/11"
+          "$ref": "#/texts/14"
         }
       ],
+      "content_layer": "furniture",
       "name": "list",
       "label": "list"
     },
@@ -180,6 +198,7 @@
         "$ref": "#/body"
       },
       "children": [],
+      "content_layer": "furniture",
       "name": "list",
       "label": "list"
     },
@@ -190,12 +209,13 @@
       },
       "children": [
         {
-          "$ref": "#/texts/12"
+          "$ref": "#/texts/15"
         },
         {
-          "$ref": "#/texts/13"
+          "$ref": "#/texts/16"
         }
       ],
+      "content_layer": "furniture",
       "name": "list",
       "label": "list"
     },
@@ -206,12 +226,13 @@
       },
       "children": [
         {
-          "$ref": "#/texts/14"
+          "$ref": "#/texts/17"
         },
         {
-          "$ref": "#/texts/15"
+          "$ref": "#/texts/18"
         }
       ],
+      "content_layer": "furniture",
       "name": "list",
       "label": "list"
     },
@@ -222,12 +243,13 @@
       },
       "children": [
         {
-          "$ref": "#/texts/16"
+          "$ref": "#/texts/20"
         },
         {
-          "$ref": "#/texts/17"
+          "$ref": "#/texts/21"
         }
       ],
+      "content_layer": "furniture",
       "name": "list",
       "label": "list"
     },
@@ -238,94 +260,25 @@
       },
       "children": [
         {
-          "$ref": "#/texts/18"
+          "$ref": "#/texts/22"
         }
       ],
+      "content_layer": "furniture",
       "name": "header-1",
       "label": "section"
     },
     {
       "self_ref": "#/groups/9",
       "parent": {
-        "$ref": "#/texts/18"
+        "$ref": "#/texts/22"
       },
       "children": [
-        {
-          "$ref": "#/texts/19"
-        },
-        {
-          "$ref": "#/texts/20"
-        },
-        {
-          "$ref": "#/texts/21"
-        },
-        {
-          "$ref": "#/texts/22"
-        },
         {
           "$ref": "#/texts/23"
         },
         {
           "$ref": "#/texts/24"
         },
-        {
-          "$ref": "#/texts/29"
-        },
-        {
-          "$ref": "#/texts/34"
-        },
-        {
-          "$ref": "#/texts/35"
-        },
-        {
-          "$ref": "#/texts/38"
-        }
-      ],
-      "name": "list",
-      "label": "list"
-    },
-    {
-      "self_ref": "#/groups/10",
-      "parent": {
-        "$ref": "#/texts/20"
-      },
-      "children": [],
-      "name": "list",
-      "label": "list"
-    },
-    {
-      "self_ref": "#/groups/11",
-      "parent": {
-        "$ref": "#/texts/21"
-      },
-      "children": [],
-      "name": "list",
-      "label": "list"
-    },
-    {
-      "self_ref": "#/groups/12",
-      "parent": {
-        "$ref": "#/texts/22"
-      },
-      "children": [],
-      "name": "list",
-      "label": "list"
-    },
-    {
-      "self_ref": "#/groups/13",
-      "parent": {
-        "$ref": "#/texts/23"
-      },
-      "children": [],
-      "name": "list",
-      "label": "list"
-    },
-    {
-      "self_ref": "#/groups/14",
-      "parent": {
-        "$ref": "#/texts/24"
-      },
-      "children": [
         {
           "$ref": "#/texts/25"
         },
@@ -337,53 +290,73 @@
         },
         {
           "$ref": "#/texts/28"
+        },
+        {
+          "$ref": "#/texts/33"
+        },
+        {
+          "$ref": "#/texts/38"
+        },
+        {
+          "$ref": "#/texts/39"
+        },
+        {
+          "$ref": "#/texts/42"
         }
       ],
+      "content_layer": "furniture",
       "name": "list",
       "label": "list"
     },
     {
-      "self_ref": "#/groups/15",
+      "self_ref": "#/groups/10",
+      "parent": {
+        "$ref": "#/texts/24"
+      },
+      "children": [],
+      "content_layer": "furniture",
+      "name": "list",
+      "label": "list"
+    },
+    {
+      "self_ref": "#/groups/11",
       "parent": {
         "$ref": "#/texts/25"
       },
       "children": [],
+      "content_layer": "furniture",
       "name": "list",
       "label": "list"
     },
     {
-      "self_ref": "#/groups/16",
+      "self_ref": "#/groups/12",
       "parent": {
         "$ref": "#/texts/26"
       },
       "children": [],
+      "content_layer": "furniture",
       "name": "list",
       "label": "list"
     },
     {
-      "self_ref": "#/groups/17",
+      "self_ref": "#/groups/13",
       "parent": {
         "$ref": "#/texts/27"
       },
       "children": [],
+      "content_layer": "furniture",
       "name": "list",
       "label": "list"
     },
     {
-      "self_ref": "#/groups/18",
+      "self_ref": "#/groups/14",
       "parent": {
         "$ref": "#/texts/28"
       },
-      "children": [],
-      "name": "list",
-      "label": "list"
-    },
-    {
-      "self_ref": "#/groups/19",
-      "parent": {
-        "$ref": "#/texts/29"
-      },
       "children": [
+        {
+          "$ref": "#/texts/29"
+        },
         {
           "$ref": "#/texts/30"
         },
@@ -392,65 +365,64 @@
         },
         {
           "$ref": "#/texts/32"
-        },
-        {
-          "$ref": "#/texts/33"
         }
       ],
+      "content_layer": "furniture",
       "name": "list",
       "label": "list"
     },
     {
-      "self_ref": "#/groups/20",
+      "self_ref": "#/groups/15",
+      "parent": {
+        "$ref": "#/texts/29"
+      },
+      "children": [],
+      "content_layer": "furniture",
+      "name": "list",
+      "label": "list"
+    },
+    {
+      "self_ref": "#/groups/16",
       "parent": {
         "$ref": "#/texts/30"
       },
       "children": [],
+      "content_layer": "furniture",
       "name": "list",
       "label": "list"
     },
     {
-      "self_ref": "#/groups/21",
+      "self_ref": "#/groups/17",
       "parent": {
         "$ref": "#/texts/31"
       },
       "children": [],
+      "content_layer": "furniture",
       "name": "list",
       "label": "list"
     },
     {
-      "self_ref": "#/groups/22",
+      "self_ref": "#/groups/18",
       "parent": {
         "$ref": "#/texts/32"
       },
       "children": [],
+      "content_layer": "furniture",
       "name": "list",
       "label": "list"
     },
     {
-      "self_ref": "#/groups/23",
+      "self_ref": "#/groups/19",
       "parent": {
         "$ref": "#/texts/33"
       },
-      "children": [],
-      "name": "list",
-      "label": "list"
-    },
-    {
-      "self_ref": "#/groups/24",
-      "parent": {
-        "$ref": "#/texts/34"
-      },
-      "children": [],
-      "name": "list",
-      "label": "list"
-    },
-    {
-      "self_ref": "#/groups/25",
-      "parent": {
-        "$ref": "#/texts/35"
-      },
       "children": [
+        {
+          "$ref": "#/texts/34"
+        },
+        {
+          "$ref": "#/texts/35"
+        },
         {
           "$ref": "#/texts/36"
         },
@@ -458,38 +430,62 @@
           "$ref": "#/texts/37"
         }
       ],
+      "content_layer": "furniture",
       "name": "list",
       "label": "list"
     },
     {
-      "self_ref": "#/groups/26",
+      "self_ref": "#/groups/20",
+      "parent": {
+        "$ref": "#/texts/34"
+      },
+      "children": [],
+      "content_layer": "furniture",
+      "name": "list",
+      "label": "list"
+    },
+    {
+      "self_ref": "#/groups/21",
+      "parent": {
+        "$ref": "#/texts/35"
+      },
+      "children": [],
+      "content_layer": "furniture",
+      "name": "list",
+      "label": "list"
+    },
+    {
+      "self_ref": "#/groups/22",
       "parent": {
         "$ref": "#/texts/36"
       },
       "children": [],
+      "content_layer": "furniture",
       "name": "list",
       "label": "list"
     },
     {
-      "self_ref": "#/groups/27",
+      "self_ref": "#/groups/23",
       "parent": {
         "$ref": "#/texts/37"
       },
       "children": [],
+      "content_layer": "furniture",
       "name": "list",
       "label": "list"
     },
     {
-      "self_ref": "#/groups/28",
+      "self_ref": "#/groups/24",
       "parent": {
         "$ref": "#/texts/38"
       },
       "children": [],
+      "content_layer": "furniture",
       "name": "list",
       "label": "list"
     },
     {
-      "self_ref": "#/groups/29",
+      "self_ref": "#/groups/25",
       "parent": {
         "$ref": "#/texts/39"
       },
@@ -499,13 +495,48 @@
         },
         {
           "$ref": "#/texts/41"
-        },
-        {
-          "$ref": "#/texts/42"
-        },
-        {
-          "$ref": "#/texts/43"
-        },
+        }
+      ],
+      "content_layer": "furniture",
+      "name": "list",
+      "label": "list"
+    },
+    {
+      "self_ref": "#/groups/26",
+      "parent": {
+        "$ref": "#/texts/40"
+      },
+      "children": [],
+      "content_layer": "furniture",
+      "name": "list",
+      "label": "list"
+    },
+    {
+      "self_ref": "#/groups/27",
+      "parent": {
+        "$ref": "#/texts/41"
+      },
+      "children": [],
+      "content_layer": "furniture",
+      "name": "list",
+      "label": "list"
+    },
+    {
+      "self_ref": "#/groups/28",
+      "parent": {
+        "$ref": "#/texts/42"
+      },
+      "children": [],
+      "content_layer": "furniture",
+      "name": "list",
+      "label": "list"
+    },
+    {
+      "self_ref": "#/groups/29",
+      "parent": {
+        "$ref": "#/texts/43"
+      },
+      "children": [
         {
           "$ref": "#/texts/44"
         },
@@ -901,89 +932,77 @@
         },
         {
           "$ref": "#/texts/175"
+        },
+        {
+          "$ref": "#/texts/176"
+        },
+        {
+          "$ref": "#/texts/177"
+        },
+        {
+          "$ref": "#/texts/178"
+        },
+        {
+          "$ref": "#/texts/179"
         }
       ],
+      "content_layer": "body",
       "name": "list",
       "label": "list"
     },
     {
       "self_ref": "#/groups/30",
       "parent": {
-        "$ref": "#/texts/39"
+        "$ref": "#/texts/43"
       },
       "children": [
         {
-          "$ref": "#/texts/176"
+          "$ref": "#/texts/180"
         },
         {
-          "$ref": "#/texts/177"
+          "$ref": "#/texts/181"
         }
       ],
+      "content_layer": "body",
       "name": "list",
       "label": "list"
     },
     {
       "self_ref": "#/groups/31",
       "parent": {
-        "$ref": "#/texts/39"
+        "$ref": "#/texts/43"
       },
       "children": [],
+      "content_layer": "body",
       "name": "list",
       "label": "list"
     },
     {
       "self_ref": "#/groups/32",
       "parent": {
-        "$ref": "#/texts/39"
+        "$ref": "#/texts/43"
       },
       "children": [
         {
-          "$ref": "#/texts/178"
+          "$ref": "#/texts/182"
         },
         {
-          "$ref": "#/texts/179"
+          "$ref": "#/texts/183"
         },
         {
-          "$ref": "#/texts/180"
+          "$ref": "#/texts/184"
         }
       ],
+      "content_layer": "body",
       "name": "list",
       "label": "list"
     },
     {
       "self_ref": "#/groups/33",
       "parent": {
-        "$ref": "#/texts/39"
+        "$ref": "#/texts/43"
       },
       "children": [
-        {
-          "$ref": "#/texts/181"
-        },
-        {
-          "$ref": "#/texts/182"
-        },
-        {
-          "$ref": "#/texts/183"
-        }
-      ],
-      "name": "list",
-      "label": "list"
-    },
-    {
-      "self_ref": "#/groups/34",
-      "parent": {
-        "$ref": "#/texts/39"
-      },
-      "children": [
-        {
-          "$ref": "#/texts/184"
-        },
-        {
-          "$ref": "#/texts/185"
-        },
-        {
-          "$ref": "#/texts/186"
-        },
         {
           "$ref": "#/texts/187"
         },
@@ -992,10 +1011,18 @@
         },
         {
           "$ref": "#/texts/189"
-        },
-        {
-          "$ref": "#/texts/190"
-        },
+        }
+      ],
+      "content_layer": "body",
+      "name": "list",
+      "label": "list"
+    },
+    {
+      "self_ref": "#/groups/34",
+      "parent": {
+        "$ref": "#/texts/43"
+      },
+      "children": [
         {
           "$ref": "#/texts/191"
         },
@@ -1004,108 +1031,87 @@
         },
         {
           "$ref": "#/texts/193"
+        },
+        {
+          "$ref": "#/texts/194"
+        },
+        {
+          "$ref": "#/texts/195"
+        },
+        {
+          "$ref": "#/texts/196"
+        },
+        {
+          "$ref": "#/texts/197"
+        },
+        {
+          "$ref": "#/texts/198"
+        },
+        {
+          "$ref": "#/texts/199"
+        },
+        {
+          "$ref": "#/texts/200"
         }
       ],
+      "content_layer": "body",
       "name": "list",
       "label": "list"
     },
     {
       "self_ref": "#/groups/35",
       "parent": {
-        "$ref": "#/texts/39"
+        "$ref": "#/texts/43"
       },
       "children": [
         {
-          "$ref": "#/texts/194"
+          "$ref": "#/texts/202"
         },
         {
-          "$ref": "#/texts/195"
+          "$ref": "#/texts/203"
         }
       ],
+      "content_layer": "body",
       "name": "list",
       "label": "list"
     },
     {
       "self_ref": "#/groups/36",
       "parent": {
-        "$ref": "#/texts/39"
+        "$ref": "#/texts/43"
       },
       "children": [
         {
-          "$ref": "#/texts/196"
+          "$ref": "#/texts/205"
         },
         {
-          "$ref": "#/texts/197"
+          "$ref": "#/texts/206"
         }
       ],
+      "content_layer": "body",
       "name": "list",
       "label": "list"
     },
     {
       "self_ref": "#/groups/37",
       "parent": {
-        "$ref": "#/texts/255"
+        "$ref": "#/texts/269"
       },
       "children": [
         {
-          "$ref": "#/texts/256"
+          "$ref": "#/texts/270"
         }
       ],
+      "content_layer": "body",
       "name": "list",
       "label": "list"
     },
     {
       "self_ref": "#/groups/38",
       "parent": {
-        "$ref": "#/texts/255"
+        "$ref": "#/texts/269"
       },
       "children": [
-        {
-          "$ref": "#/texts/257"
-        },
-        {
-          "$ref": "#/texts/258"
-        },
-        {
-          "$ref": "#/texts/259"
-        },
-        {
-          "$ref": "#/texts/260"
-        },
-        {
-          "$ref": "#/texts/261"
-        },
-        {
-          "$ref": "#/texts/262"
-        }
-      ],
-      "name": "list",
-      "label": "list"
-    },
-    {
-      "self_ref": "#/groups/39",
-      "parent": {
-        "$ref": "#/texts/264"
-      },
-      "children": [
-        {
-          "$ref": "#/texts/265"
-        },
-        {
-          "$ref": "#/texts/266"
-        },
-        {
-          "$ref": "#/texts/267"
-        },
-        {
-          "$ref": "#/texts/268"
-        },
-        {
-          "$ref": "#/texts/269"
-        },
-        {
-          "$ref": "#/texts/270"
-        },
         {
           "$ref": "#/texts/271"
         },
@@ -1123,13 +1129,18 @@
         },
         {
           "$ref": "#/texts/276"
-        },
-        {
-          "$ref": "#/texts/277"
-        },
-        {
-          "$ref": "#/texts/278"
-        },
+        }
+      ],
+      "content_layer": "body",
+      "name": "list",
+      "label": "list"
+    },
+    {
+      "self_ref": "#/groups/39",
+      "parent": {
+        "$ref": "#/texts/278"
+      },
+      "children": [
         {
           "$ref": "#/texts/279"
         },
@@ -1252,17 +1263,10 @@
         },
         {
           "$ref": "#/texts/319"
-        }
-      ],
-      "name": "ordered list",
-      "label": "ordered_list"
-    },
-    {
-      "self_ref": "#/groups/40",
-      "parent": {
-        "$ref": "#/texts/320"
-      },
-      "children": [
+        },
+        {
+          "$ref": "#/texts/320"
+        },
         {
           "$ref": "#/texts/321"
         },
@@ -1301,10 +1305,18 @@
         },
         {
           "$ref": "#/texts/333"
-        },
-        {
-          "$ref": "#/texts/334"
-        },
+        }
+      ],
+      "content_layer": "body",
+      "name": "ordered list",
+      "label": "ordered_list"
+    },
+    {
+      "self_ref": "#/groups/40",
+      "parent": {
+        "$ref": "#/texts/334"
+      },
+      "children": [
         {
           "$ref": "#/texts/335"
         },
@@ -1322,17 +1334,10 @@
         },
         {
           "$ref": "#/texts/340"
-        }
-      ],
-      "name": "list",
-      "label": "list"
-    },
-    {
-      "self_ref": "#/groups/41",
-      "parent": {
-        "$ref": "#/texts/341"
-      },
-      "children": [
+        },
+        {
+          "$ref": "#/texts/341"
+        },
         {
           "$ref": "#/texts/342"
         },
@@ -1350,17 +1355,7 @@
         },
         {
           "$ref": "#/texts/347"
-        }
-      ],
-      "name": "list",
-      "label": "list"
-    },
-    {
-      "self_ref": "#/groups/42",
-      "parent": {
-        "$ref": "#/texts/341"
-      },
-      "children": [
+        },
         {
           "$ref": "#/texts/348"
         },
@@ -1372,17 +1367,7 @@
         },
         {
           "$ref": "#/texts/351"
-        }
-      ],
-      "name": "list",
-      "label": "list"
-    },
-    {
-      "self_ref": "#/groups/43",
-      "parent": {
-        "$ref": "#/texts/341"
-      },
-      "children": [
+        },
         {
           "$ref": "#/texts/352"
         },
@@ -1393,18 +1378,16 @@
           "$ref": "#/texts/354"
         }
       ],
+      "content_layer": "body",
       "name": "list",
       "label": "list"
     },
     {
-      "self_ref": "#/groups/44",
+      "self_ref": "#/groups/41",
       "parent": {
-        "$ref": "#/texts/341"
+        "$ref": "#/texts/355"
       },
       "children": [
-        {
-          "$ref": "#/texts/355"
-        },
         {
           "$ref": "#/texts/356"
         },
@@ -1422,7 +1405,18 @@
         },
         {
           "$ref": "#/texts/361"
-        },
+        }
+      ],
+      "content_layer": "body",
+      "name": "list",
+      "label": "list"
+    },
+    {
+      "self_ref": "#/groups/42",
+      "parent": {
+        "$ref": "#/texts/355"
+      },
+      "children": [
         {
           "$ref": "#/texts/362"
         },
@@ -1431,13 +1425,18 @@
         },
         {
           "$ref": "#/texts/364"
-        },
-        {
-          "$ref": "#/texts/365"
-        },
-        {
-          "$ref": "#/texts/366"
-        },
+        }
+      ],
+      "content_layer": "body",
+      "name": "list",
+      "label": "list"
+    },
+    {
+      "self_ref": "#/groups/43",
+      "parent": {
+        "$ref": "#/texts/355"
+      },
+      "children": [
         {
           "$ref": "#/texts/367"
         },
@@ -1446,10 +1445,18 @@
         },
         {
           "$ref": "#/texts/369"
-        },
-        {
-          "$ref": "#/texts/370"
-        },
+        }
+      ],
+      "content_layer": "body",
+      "name": "list",
+      "label": "list"
+    },
+    {
+      "self_ref": "#/groups/44",
+      "parent": {
+        "$ref": "#/texts/355"
+      },
+      "children": [
         {
           "$ref": "#/texts/371"
         },
@@ -1479,33 +1486,13 @@
         },
         {
           "$ref": "#/texts/380"
-        }
-      ],
-      "name": "list",
-      "label": "list"
-    },
-    {
-      "self_ref": "#/groups/45",
-      "parent": {
-        "$ref": "#/texts/341"
-      },
-      "children": [
+        },
         {
           "$ref": "#/texts/381"
         },
         {
           "$ref": "#/texts/382"
-        }
-      ],
-      "name": "list",
-      "label": "list"
-    },
-    {
-      "self_ref": "#/groups/46",
-      "parent": {
-        "$ref": "#/texts/341"
-      },
-      "children": [
+        },
         {
           "$ref": "#/texts/383"
         },
@@ -1532,33 +1519,99 @@
         },
         {
           "$ref": "#/texts/391"
+        },
+        {
+          "$ref": "#/texts/392"
+        },
+        {
+          "$ref": "#/texts/393"
+        },
+        {
+          "$ref": "#/texts/394"
+        },
+        {
+          "$ref": "#/texts/395"
+        },
+        {
+          "$ref": "#/texts/396"
         }
       ],
+      "content_layer": "body",
+      "name": "list",
+      "label": "list"
+    },
+    {
+      "self_ref": "#/groups/45",
+      "parent": {
+        "$ref": "#/texts/355"
+      },
+      "children": [
+        {
+          "$ref": "#/texts/397"
+        },
+        {
+          "$ref": "#/texts/398"
+        }
+      ],
+      "content_layer": "body",
+      "name": "list",
+      "label": "list"
+    },
+    {
+      "self_ref": "#/groups/46",
+      "parent": {
+        "$ref": "#/texts/355"
+      },
+      "children": [
+        {
+          "$ref": "#/texts/399"
+        },
+        {
+          "$ref": "#/texts/400"
+        },
+        {
+          "$ref": "#/texts/401"
+        },
+        {
+          "$ref": "#/texts/402"
+        },
+        {
+          "$ref": "#/texts/403"
+        },
+        {
+          "$ref": "#/texts/404"
+        },
+        {
+          "$ref": "#/texts/405"
+        },
+        {
+          "$ref": "#/texts/406"
+        },
+        {
+          "$ref": "#/texts/407"
+        }
+      ],
+      "content_layer": "body",
       "name": "list",
       "label": "list"
     },
     {
       "self_ref": "#/groups/47",
       "parent": {
-        "$ref": "#/texts/341"
+        "$ref": "#/texts/355"
       },
-      "children": [
-        {
-          "$ref": "#/texts/392"
-        },
-        {
-          "$ref": "#/texts/393"
-        }
-      ],
+      "children": [],
+      "content_layer": "body",
       "name": "list",
       "label": "list"
     },
     {
       "self_ref": "#/groups/48",
       "parent": {
-        "$ref": "#/texts/341"
+        "$ref": "#/texts/355"
       },
       "children": [],
+      "content_layer": "body",
       "name": "list",
       "label": "list"
     }
@@ -1567,28 +1620,26 @@
     {
       "self_ref": "#/texts/0",
       "parent": {
-        "$ref": "#/groups/0"
+        "$ref": "#/body"
       },
       "children": [],
-      "label": "list_item",
+      "content_layer": "furniture",
+      "label": "text",
       "prov": [],
-      "orig": "Main page",
-      "text": "Main page",
-      "enumerated": false,
-      "marker": "-"
+      "orig": "Main menu",
+      "text": "Main menu"
     },
     {
       "self_ref": "#/texts/1",
       "parent": {
-        "$ref": "#/groups/0"
+        "$ref": "#/body"
       },
       "children": [],
-      "label": "list_item",
+      "content_layer": "furniture",
+      "label": "text",
       "prov": [],
-      "orig": "Contents",
-      "text": "Contents",
-      "enumerated": false,
-      "marker": "-"
+      "orig": "Navigation",
+      "text": "Navigation"
     },
     {
       "self_ref": "#/texts/2",
@@ -1596,10 +1647,11 @@
         "$ref": "#/groups/0"
       },
       "children": [],
+      "content_layer": "furniture",
       "label": "list_item",
       "prov": [],
-      "orig": "Current events",
-      "text": "Current events",
+      "orig": "Main page",
+      "text": "Main page",
       "enumerated": false,
       "marker": "-"
     },
@@ -1609,10 +1661,11 @@
         "$ref": "#/groups/0"
       },
       "children": [],
+      "content_layer": "furniture",
       "label": "list_item",
       "prov": [],
-      "orig": "Random article",
-      "text": "Random article",
+      "orig": "Contents",
+      "text": "Contents",
       "enumerated": false,
       "marker": "-"
     },
@@ -1622,10 +1675,11 @@
         "$ref": "#/groups/0"
       },
       "children": [],
+      "content_layer": "furniture",
       "label": "list_item",
       "prov": [],
-      "orig": "About Wikipedia",
-      "text": "About Wikipedia",
+      "orig": "Current events",
+      "text": "Current events",
       "enumerated": false,
       "marker": "-"
     },
@@ -1635,6 +1689,35 @@
         "$ref": "#/groups/0"
       },
       "children": [],
+      "content_layer": "furniture",
+      "label": "list_item",
+      "prov": [],
+      "orig": "Random article",
+      "text": "Random article",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/6",
+      "parent": {
+        "$ref": "#/groups/0"
+      },
+      "children": [],
+      "content_layer": "furniture",
+      "label": "list_item",
+      "prov": [],
+      "orig": "About Wikipedia",
+      "text": "About Wikipedia",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/7",
+      "parent": {
+        "$ref": "#/groups/0"
+      },
+      "children": [],
+      "content_layer": "furniture",
       "label": "list_item",
       "prov": [],
       "orig": "Contact us",
@@ -1642,44 +1725,17 @@
       "enumerated": false,
       "marker": "-"
     },
-    {
-      "self_ref": "#/texts/6",
-      "parent": {
-        "$ref": "#/groups/1"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Help",
-      "text": "Help",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/7",
-      "parent": {
-        "$ref": "#/groups/1"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Learn to edit",
-      "text": "Learn to edit",
-      "enumerated": false,
-      "marker": "-"
-    },
     {
       "self_ref": "#/texts/8",
       "parent": {
-        "$ref": "#/groups/1"
+        "$ref": "#/body"
       },
       "children": [],
-      "label": "list_item",
+      "content_layer": "furniture",
+      "label": "text",
       "prov": [],
-      "orig": "Community portal",
-      "text": "Community portal",
-      "enumerated": false,
-      "marker": "-"
+      "orig": "Contribute",
+      "text": "Contribute"
     },
     {
       "self_ref": "#/texts/9",
@@ -1687,10 +1743,11 @@
         "$ref": "#/groups/1"
       },
       "children": [],
+      "content_layer": "furniture",
       "label": "list_item",
       "prov": [],
-      "orig": "Recent changes",
-      "text": "Recent changes",
+      "orig": "Help",
+      "text": "Help",
       "enumerated": false,
       "marker": "-"
     },
@@ -1700,6 +1757,49 @@
         "$ref": "#/groups/1"
       },
       "children": [],
+      "content_layer": "furniture",
+      "label": "list_item",
+      "prov": [],
+      "orig": "Learn to edit",
+      "text": "Learn to edit",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/11",
+      "parent": {
+        "$ref": "#/groups/1"
+      },
+      "children": [],
+      "content_layer": "furniture",
+      "label": "list_item",
+      "prov": [],
+      "orig": "Community portal",
+      "text": "Community portal",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/12",
+      "parent": {
+        "$ref": "#/groups/1"
+      },
+      "children": [],
+      "content_layer": "furniture",
+      "label": "list_item",
+      "prov": [],
+      "orig": "Recent changes",
+      "text": "Recent changes",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/13",
+      "parent": {
+        "$ref": "#/groups/1"
+      },
+      "children": [],
+      "content_layer": "furniture",
       "label": "list_item",
       "prov": [],
       "orig": "Upload file",
@@ -1708,11 +1808,12 @@
       "marker": "-"
     },
     {
-      "self_ref": "#/texts/11",
+      "self_ref": "#/texts/14",
       "parent": {
         "$ref": "#/groups/3"
       },
       "children": [],
+      "content_layer": "furniture",
       "label": "list_item",
       "prov": [],
       "orig": "Donate",
@@ -1720,64 +1821,81 @@
       "enumerated": false,
       "marker": "-"
     },
-    {
-      "self_ref": "#/texts/12",
-      "parent": {
-        "$ref": "#/groups/5"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Create account",
-      "text": "Create account",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/13",
-      "parent": {
-        "$ref": "#/groups/5"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Log in",
-      "text": "Log in",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/14",
-      "parent": {
-        "$ref": "#/groups/6"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Create account",
-      "text": "Create account",
-      "enumerated": false,
-      "marker": "-"
-    },
     {
       "self_ref": "#/texts/15",
       "parent": {
-        "$ref": "#/groups/6"
+        "$ref": "#/groups/5"
       },
       "children": [],
+      "content_layer": "furniture",
       "label": "list_item",
       "prov": [],
-      "orig": "Log in",
-      "text": "Log in",
+      "orig": "Create account",
+      "text": "Create account",
       "enumerated": false,
       "marker": "-"
     },
     {
       "self_ref": "#/texts/16",
+      "parent": {
+        "$ref": "#/groups/5"
+      },
+      "children": [],
+      "content_layer": "furniture",
+      "label": "list_item",
+      "prov": [],
+      "orig": "Log in",
+      "text": "Log in",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/17",
+      "parent": {
+        "$ref": "#/groups/6"
+      },
+      "children": [],
+      "content_layer": "furniture",
+      "label": "list_item",
+      "prov": [],
+      "orig": "Create account",
+      "text": "Create account",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/18",
+      "parent": {
+        "$ref": "#/groups/6"
+      },
+      "children": [],
+      "content_layer": "furniture",
+      "label": "list_item",
+      "prov": [],
+      "orig": "Log in",
+      "text": "Log in",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/19",
+      "parent": {
+        "$ref": "#/body"
+      },
+      "children": [],
+      "content_layer": "furniture",
+      "label": "text",
+      "prov": [],
+      "orig": "Pages for logged out editors",
+      "text": "Pages for logged out editors"
+    },
+    {
+      "self_ref": "#/texts/20",
       "parent": {
         "$ref": "#/groups/7"
       },
       "children": [],
+      "content_layer": "furniture",
       "label": "list_item",
       "prov": [],
       "orig": "Contributions",
@@ -1786,11 +1904,12 @@
       "marker": "-"
     },
     {
-      "self_ref": "#/texts/17",
+      "self_ref": "#/texts/21",
       "parent": {
         "$ref": "#/groups/7"
       },
       "children": [],
+      "content_layer": "furniture",
       "label": "list_item",
       "prov": [],
       "orig": "Talk",
@@ -1799,7 +1918,7 @@
       "marker": "-"
     },
     {
-      "self_ref": "#/texts/18",
+      "self_ref": "#/texts/22",
       "parent": {
         "$ref": "#/groups/8"
       },
@@ -1808,90 +1927,24 @@
           "$ref": "#/groups/9"
         }
       ],
+      "content_layer": "furniture",
       "label": "section_header",
       "prov": [],
       "orig": "Contents",
       "text": "Contents",
       "level": 2
     },
-    {
-      "self_ref": "#/texts/19",
-      "parent": {
-        "$ref": "#/groups/9"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "(Top)",
-      "text": "(Top)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/20",
-      "parent": {
-        "$ref": "#/groups/9"
-      },
-      "children": [
-        {
-          "$ref": "#/groups/10"
-        }
-      ],
-      "label": "list_item",
-      "prov": [],
-      "orig": "1 Etymology",
-      "text": "1 Etymology",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/21",
-      "parent": {
-        "$ref": "#/groups/9"
-      },
-      "children": [
-        {
-          "$ref": "#/groups/11"
-        }
-      ],
-      "label": "list_item",
-      "prov": [],
-      "orig": "2 Taxonomy",
-      "text": "2 Taxonomy",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/22",
-      "parent": {
-        "$ref": "#/groups/9"
-      },
-      "children": [
-        {
-          "$ref": "#/groups/12"
-        }
-      ],
-      "label": "list_item",
-      "prov": [],
-      "orig": "3 Morphology",
-      "text": "3 Morphology",
-      "enumerated": false,
-      "marker": "-"
-    },
     {
       "self_ref": "#/texts/23",
       "parent": {
         "$ref": "#/groups/9"
       },
-      "children": [
-        {
-          "$ref": "#/groups/13"
-        }
-      ],
+      "children": [],
+      "content_layer": "furniture",
       "label": "list_item",
       "prov": [],
-      "orig": "4 Distribution and habitat",
-      "text": "4 Distribution and habitat",
+      "orig": "(Top)",
+      "text": "(Top)",
       "enumerated": false,
       "marker": "-"
     },
@@ -1900,11 +1953,84 @@
       "parent": {
         "$ref": "#/groups/9"
       },
+      "children": [
+        {
+          "$ref": "#/groups/10"
+        }
+      ],
+      "content_layer": "furniture",
+      "label": "list_item",
+      "prov": [],
+      "orig": "1 Etymology",
+      "text": "1 Etymology",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/25",
+      "parent": {
+        "$ref": "#/groups/9"
+      },
+      "children": [
+        {
+          "$ref": "#/groups/11"
+        }
+      ],
+      "content_layer": "furniture",
+      "label": "list_item",
+      "prov": [],
+      "orig": "2 Taxonomy",
+      "text": "2 Taxonomy",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/26",
+      "parent": {
+        "$ref": "#/groups/9"
+      },
+      "children": [
+        {
+          "$ref": "#/groups/12"
+        }
+      ],
+      "content_layer": "furniture",
+      "label": "list_item",
+      "prov": [],
+      "orig": "3 Morphology",
+      "text": "3 Morphology",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/27",
+      "parent": {
+        "$ref": "#/groups/9"
+      },
+      "children": [
+        {
+          "$ref": "#/groups/13"
+        }
+      ],
+      "content_layer": "furniture",
+      "label": "list_item",
+      "prov": [],
+      "orig": "4 Distribution and habitat",
+      "text": "4 Distribution and habitat",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/28",
+      "parent": {
+        "$ref": "#/groups/9"
+      },
       "children": [
         {
           "$ref": "#/groups/14"
         }
       ],
+      "content_layer": "furniture",
       "label": "list_item",
       "prov": [],
       "orig": "5 Behaviour Toggle Behaviour subsection",
@@ -1913,7 +2039,7 @@
       "marker": "-"
     },
     {
-      "self_ref": "#/texts/25",
+      "self_ref": "#/texts/29",
       "parent": {
         "$ref": "#/groups/14"
       },
@@ -1922,6 +2048,7 @@
           "$ref": "#/groups/15"
         }
       ],
+      "content_layer": "furniture",
       "label": "list_item",
       "prov": [],
       "orig": "5.1 Feeding",
@@ -1930,7 +2057,7 @@
       "marker": "-"
     },
     {
-      "self_ref": "#/texts/26",
+      "self_ref": "#/texts/30",
       "parent": {
         "$ref": "#/groups/14"
       },
@@ -1939,6 +2066,7 @@
           "$ref": "#/groups/16"
         }
       ],
+      "content_layer": "furniture",
       "label": "list_item",
       "prov": [],
       "orig": "5.2 Breeding",
@@ -1947,7 +2075,7 @@
       "marker": "-"
     },
     {
-      "self_ref": "#/texts/27",
+      "self_ref": "#/texts/31",
       "parent": {
         "$ref": "#/groups/14"
       },
@@ -1956,6 +2084,7 @@
           "$ref": "#/groups/17"
         }
       ],
+      "content_layer": "furniture",
       "label": "list_item",
       "prov": [],
       "orig": "5.3 Communication",
@@ -1964,7 +2093,7 @@
       "marker": "-"
     },
     {
-      "self_ref": "#/texts/28",
+      "self_ref": "#/texts/32",
       "parent": {
         "$ref": "#/groups/14"
       },
@@ -1973,6 +2102,7 @@
           "$ref": "#/groups/18"
         }
       ],
+      "content_layer": "furniture",
       "label": "list_item",
       "prov": [],
       "orig": "5.4 Predators",
@@ -1981,7 +2111,7 @@
       "marker": "-"
     },
     {
-      "self_ref": "#/texts/29",
+      "self_ref": "#/texts/33",
       "parent": {
         "$ref": "#/groups/9"
       },
@@ -1990,6 +2120,7 @@
           "$ref": "#/groups/19"
         }
       ],
+      "content_layer": "furniture",
       "label": "list_item",
       "prov": [],
       "orig": "6 Relationship with humans Toggle Relationship with humans subsection",
@@ -1998,7 +2129,7 @@
       "marker": "-"
     },
     {
-      "self_ref": "#/texts/30",
+      "self_ref": "#/texts/34",
       "parent": {
         "$ref": "#/groups/19"
       },
@@ -2007,6 +2138,7 @@
           "$ref": "#/groups/20"
         }
       ],
+      "content_layer": "furniture",
       "label": "list_item",
       "prov": [],
       "orig": "6.1 Hunting",
@@ -2015,7 +2147,7 @@
       "marker": "-"
     },
     {
-      "self_ref": "#/texts/31",
+      "self_ref": "#/texts/35",
       "parent": {
         "$ref": "#/groups/19"
       },
@@ -2024,6 +2156,7 @@
           "$ref": "#/groups/21"
         }
       ],
+      "content_layer": "furniture",
       "label": "list_item",
       "prov": [],
       "orig": "6.2 Domestication",
@@ -2032,7 +2165,7 @@
       "marker": "-"
     },
     {
-      "self_ref": "#/texts/32",
+      "self_ref": "#/texts/36",
       "parent": {
         "$ref": "#/groups/19"
       },
@@ -2041,6 +2174,7 @@
           "$ref": "#/groups/22"
         }
       ],
+      "content_layer": "furniture",
       "label": "list_item",
       "prov": [],
       "orig": "6.3 Heraldry",
@@ -2049,7 +2183,7 @@
       "marker": "-"
     },
     {
-      "self_ref": "#/texts/33",
+      "self_ref": "#/texts/37",
       "parent": {
         "$ref": "#/groups/19"
       },
@@ -2058,6 +2192,7 @@
           "$ref": "#/groups/23"
         }
       ],
+      "content_layer": "furniture",
       "label": "list_item",
       "prov": [],
       "orig": "6.4 Cultural references",
@@ -2065,84 +2200,89 @@
       "enumerated": false,
       "marker": "-"
     },
-    {
-      "self_ref": "#/texts/34",
-      "parent": {
-        "$ref": "#/groups/9"
-      },
-      "children": [
-        {
-          "$ref": "#/groups/24"
-        }
-      ],
-      "label": "list_item",
-      "prov": [],
-      "orig": "7 See also",
-      "text": "7 See also",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/35",
-      "parent": {
-        "$ref": "#/groups/9"
-      },
-      "children": [
-        {
-          "$ref": "#/groups/25"
-        }
-      ],
-      "label": "list_item",
-      "prov": [],
-      "orig": "8 Notes Toggle Notes subsection",
-      "text": "8 Notes Toggle Notes subsection",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/36",
-      "parent": {
-        "$ref": "#/groups/25"
-      },
-      "children": [
-        {
-          "$ref": "#/groups/26"
-        }
-      ],
-      "label": "list_item",
-      "prov": [],
-      "orig": "8.1 Citations",
-      "text": "8.1 Citations",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/37",
-      "parent": {
-        "$ref": "#/groups/25"
-      },
-      "children": [
-        {
-          "$ref": "#/groups/27"
-        }
-      ],
-      "label": "list_item",
-      "prov": [],
-      "orig": "8.2 Sources",
-      "text": "8.2 Sources",
-      "enumerated": false,
-      "marker": "-"
-    },
     {
       "self_ref": "#/texts/38",
       "parent": {
         "$ref": "#/groups/9"
       },
+      "children": [
+        {
+          "$ref": "#/groups/24"
+        }
+      ],
+      "content_layer": "furniture",
+      "label": "list_item",
+      "prov": [],
+      "orig": "7 See also",
+      "text": "7 See also",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/39",
+      "parent": {
+        "$ref": "#/groups/9"
+      },
+      "children": [
+        {
+          "$ref": "#/groups/25"
+        }
+      ],
+      "content_layer": "furniture",
+      "label": "list_item",
+      "prov": [],
+      "orig": "8 Notes Toggle Notes subsection",
+      "text": "8 Notes Toggle Notes subsection",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/40",
+      "parent": {
+        "$ref": "#/groups/25"
+      },
+      "children": [
+        {
+          "$ref": "#/groups/26"
+        }
+      ],
+      "content_layer": "furniture",
+      "label": "list_item",
+      "prov": [],
+      "orig": "8.1 Citations",
+      "text": "8.1 Citations",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/41",
+      "parent": {
+        "$ref": "#/groups/25"
+      },
+      "children": [
+        {
+          "$ref": "#/groups/27"
+        }
+      ],
+      "content_layer": "furniture",
+      "label": "list_item",
+      "prov": [],
+      "orig": "8.2 Sources",
+      "text": "8.2 Sources",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/42",
+      "parent": {
+        "$ref": "#/groups/9"
+      },
       "children": [
         {
           "$ref": "#/groups/28"
         }
       ],
+      "content_layer": "furniture",
       "label": "list_item",
       "prov": [],
       "orig": "9 External links",
@@ -2151,7 +2291,7 @@
       "marker": "-"
     },
     {
-      "self_ref": "#/texts/39",
+      "self_ref": "#/texts/43",
       "parent": {
         "$ref": "#/body"
       },
@@ -2168,125 +2308,105 @@
         {
           "$ref": "#/groups/32"
         },
+        {
+          "$ref": "#/texts/185"
+        },
+        {
+          "$ref": "#/texts/186"
+        },
         {
           "$ref": "#/groups/33"
         },
+        {
+          "$ref": "#/texts/190"
+        },
         {
           "$ref": "#/groups/34"
         },
+        {
+          "$ref": "#/texts/201"
+        },
         {
           "$ref": "#/groups/35"
         },
+        {
+          "$ref": "#/texts/204"
+        },
         {
           "$ref": "#/groups/36"
         },
+        {
+          "$ref": "#/texts/207"
+        },
         {
           "$ref": "#/pictures/3"
         },
-        {
-          "$ref": "#/tables/0"
-        },
-        {
-          "$ref": "#/texts/198"
-        },
-        {
-          "$ref": "#/texts/199"
-        },
-        {
-          "$ref": "#/texts/200"
-        },
         {
           "$ref": "#/texts/208"
         },
+        {
+          "$ref": "#/texts/209"
+        },
+        {
+          "$ref": "#/texts/210"
+        },
+        {
+          "$ref": "#/texts/211"
+        },
+        {
+          "$ref": "#/tables/0"
+        },
+        {
+          "$ref": "#/texts/212"
+        },
         {
           "$ref": "#/texts/213"
         },
         {
-          "$ref": "#/texts/217"
+          "$ref": "#/texts/214"
         },
         {
           "$ref": "#/texts/222"
         },
         {
-          "$ref": "#/texts/242"
+          "$ref": "#/texts/227"
         },
         {
-          "$ref": "#/texts/255"
+          "$ref": "#/texts/231"
         },
         {
-          "$ref": "#/texts/263"
+          "$ref": "#/texts/236"
         },
         {
-          "$ref": "#/texts/341"
+          "$ref": "#/texts/256"
+        },
+        {
+          "$ref": "#/texts/269"
+        },
+        {
+          "$ref": "#/texts/277"
+        },
+        {
+          "$ref": "#/texts/355"
         }
       ],
+      "content_layer": "body",
       "label": "title",
       "prov": [],
       "orig": "Duck",
       "text": "Duck"
     },
-    {
-      "self_ref": "#/texts/40",
-      "parent": {
-        "$ref": "#/groups/29"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Ac\u00e8h",
-      "text": "Ac\u00e8h",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/41",
-      "parent": {
-        "$ref": "#/groups/29"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Afrikaans",
-      "text": "Afrikaans",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/42",
-      "parent": {
-        "$ref": "#/groups/29"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Alemannisch",
-      "text": "Alemannisch",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/43",
-      "parent": {
-        "$ref": "#/groups/29"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "\u12a0\u121b\u122d\u129b",
-      "text": "\u12a0\u121b\u122d\u129b",
-      "enumerated": false,
-      "marker": "-"
-    },
     {
       "self_ref": "#/texts/44",
       "parent": {
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "\u00c6nglisc",
-      "text": "\u00c6nglisc",
+      "orig": "Ac\u00e8h",
+      "text": "Ac\u00e8h",
       "enumerated": false,
       "marker": "-"
     },
@@ -2296,10 +2416,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "\u0627\u0644\u0639\u0631\u0628\u064a\u0629",
-      "text": "\u0627\u0644\u0639\u0631\u0628\u064a\u0629",
+      "orig": "Afrikaans",
+      "text": "Afrikaans",
       "enumerated": false,
       "marker": "-"
     },
@@ -2309,10 +2430,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "Aragon\u00e9s",
-      "text": "Aragon\u00e9s",
+      "orig": "Alemannisch",
+      "text": "Alemannisch",
       "enumerated": false,
       "marker": "-"
     },
@@ -2322,10 +2444,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "\u0710\u072a\u0721\u071d\u0710",
-      "text": "\u0710\u072a\u0721\u071d\u0710",
+      "orig": "\u12a0\u121b\u122d\u129b",
+      "text": "\u12a0\u121b\u122d\u129b",
       "enumerated": false,
       "marker": "-"
     },
@@ -2335,10 +2458,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "Arm\u00e3neashti",
-      "text": "Arm\u00e3neashti",
+      "orig": "\u00c6nglisc",
+      "text": "\u00c6nglisc",
       "enumerated": false,
       "marker": "-"
     },
@@ -2348,10 +2472,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "Asturianu",
-      "text": "Asturianu",
+      "orig": "\u0627\u0644\u0639\u0631\u0628\u064a\u0629",
+      "text": "\u0627\u0644\u0639\u0631\u0628\u064a\u0629",
       "enumerated": false,
       "marker": "-"
     },
@@ -2361,10 +2486,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "Atikamekw",
-      "text": "Atikamekw",
+      "orig": "Aragon\u00e9s",
+      "text": "Aragon\u00e9s",
       "enumerated": false,
       "marker": "-"
     },
@@ -2374,10 +2500,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "\u0410\u0432\u0430\u0440",
-      "text": "\u0410\u0432\u0430\u0440",
+      "orig": "\u0710\u072a\u0721\u071d\u0710",
+      "text": "\u0710\u072a\u0721\u071d\u0710",
       "enumerated": false,
       "marker": "-"
     },
@@ -2387,10 +2514,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "Aymar aru",
-      "text": "Aymar aru",
+      "orig": "Arm\u00e3neashti",
+      "text": "Arm\u00e3neashti",
       "enumerated": false,
       "marker": "-"
     },
@@ -2400,10 +2528,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "\u062a\u06c6\u0631\u06a9\u062c\u0647",
-      "text": "\u062a\u06c6\u0631\u06a9\u062c\u0647",
+      "orig": "Asturianu",
+      "text": "Asturianu",
       "enumerated": false,
       "marker": "-"
     },
@@ -2413,10 +2542,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "Basa Bali",
-      "text": "Basa Bali",
+      "orig": "Atikamekw",
+      "text": "Atikamekw",
       "enumerated": false,
       "marker": "-"
     },
@@ -2426,10 +2556,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "\u09ac\u09be\u0982\u09b2\u09be",
-      "text": "\u09ac\u09be\u0982\u09b2\u09be",
+      "orig": "\u0410\u0432\u0430\u0440",
+      "text": "\u0410\u0432\u0430\u0440",
       "enumerated": false,
       "marker": "-"
     },
@@ -2439,10 +2570,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "\u95a9\u5357\u8a9e / B\u00e2n-l\u00e2m-g\u00fa",
-      "text": "\u95a9\u5357\u8a9e / B\u00e2n-l\u00e2m-g\u00fa",
+      "orig": "Aymar aru",
+      "text": "Aymar aru",
       "enumerated": false,
       "marker": "-"
     },
@@ -2452,10 +2584,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "\u0411\u0435\u043b\u0430\u0440\u0443\u0441\u043a\u0430\u044f",
-      "text": "\u0411\u0435\u043b\u0430\u0440\u0443\u0441\u043a\u0430\u044f",
+      "orig": "\u062a\u06c6\u0631\u06a9\u062c\u0647",
+      "text": "\u062a\u06c6\u0631\u06a9\u062c\u0647",
       "enumerated": false,
       "marker": "-"
     },
@@ -2465,10 +2598,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "\u0411\u0435\u043b\u0430\u0440\u0443\u0441\u043a\u0430\u044f (\u0442\u0430\u0440\u0430\u0448\u043a\u0435\u0432\u0456\u0446\u0430)",
-      "text": "\u0411\u0435\u043b\u0430\u0440\u0443\u0441\u043a\u0430\u044f (\u0442\u0430\u0440\u0430\u0448\u043a\u0435\u0432\u0456\u0446\u0430)",
+      "orig": "Basa Bali",
+      "text": "Basa Bali",
       "enumerated": false,
       "marker": "-"
     },
@@ -2478,10 +2612,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "Bikol Central",
-      "text": "Bikol Central",
+      "orig": "\u09ac\u09be\u0982\u09b2\u09be",
+      "text": "\u09ac\u09be\u0982\u09b2\u09be",
       "enumerated": false,
       "marker": "-"
     },
@@ -2491,10 +2626,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "\u0411\u044a\u043b\u0433\u0430\u0440\u0441\u043a\u0438",
-      "text": "\u0411\u044a\u043b\u0433\u0430\u0440\u0441\u043a\u0438",
+      "orig": "\u95a9\u5357\u8a9e / B\u00e2n-l\u00e2m-g\u00fa",
+      "text": "\u95a9\u5357\u8a9e / B\u00e2n-l\u00e2m-g\u00fa",
       "enumerated": false,
       "marker": "-"
     },
@@ -2504,10 +2640,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "Brezhoneg",
-      "text": "Brezhoneg",
+      "orig": "\u0411\u0435\u043b\u0430\u0440\u0443\u0441\u043a\u0430\u044f",
+      "text": "\u0411\u0435\u043b\u0430\u0440\u0443\u0441\u043a\u0430\u044f",
       "enumerated": false,
       "marker": "-"
     },
@@ -2517,10 +2654,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "\u0411\u0443\u0440\u044f\u0430\u0434",
-      "text": "\u0411\u0443\u0440\u044f\u0430\u0434",
+      "orig": "\u0411\u0435\u043b\u0430\u0440\u0443\u0441\u043a\u0430\u044f (\u0442\u0430\u0440\u0430\u0448\u043a\u0435\u0432\u0456\u0446\u0430)",
+      "text": "\u0411\u0435\u043b\u0430\u0440\u0443\u0441\u043a\u0430\u044f (\u0442\u0430\u0440\u0430\u0448\u043a\u0435\u0432\u0456\u0446\u0430)",
       "enumerated": false,
       "marker": "-"
     },
@@ -2530,10 +2668,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "Catal\u00e0",
-      "text": "Catal\u00e0",
+      "orig": "Bikol Central",
+      "text": "Bikol Central",
       "enumerated": false,
       "marker": "-"
     },
@@ -2543,10 +2682,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "\u0427\u04d1\u0432\u0430\u0448\u043b\u0430",
-      "text": "\u0427\u04d1\u0432\u0430\u0448\u043b\u0430",
+      "orig": "\u0411\u044a\u043b\u0433\u0430\u0440\u0441\u043a\u0438",
+      "text": "\u0411\u044a\u043b\u0433\u0430\u0440\u0441\u043a\u0438",
       "enumerated": false,
       "marker": "-"
     },
@@ -2556,10 +2696,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "\u010ce\u0161tina",
-      "text": "\u010ce\u0161tina",
+      "orig": "Brezhoneg",
+      "text": "Brezhoneg",
       "enumerated": false,
       "marker": "-"
     },
@@ -2569,10 +2710,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "ChiShona",
-      "text": "ChiShona",
+      "orig": "\u0411\u0443\u0440\u044f\u0430\u0434",
+      "text": "\u0411\u0443\u0440\u044f\u0430\u0434",
       "enumerated": false,
       "marker": "-"
     },
@@ -2582,10 +2724,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "Cymraeg",
-      "text": "Cymraeg",
+      "orig": "Catal\u00e0",
+      "text": "Catal\u00e0",
       "enumerated": false,
       "marker": "-"
     },
@@ -2595,10 +2738,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "Dagbanli",
-      "text": "Dagbanli",
+      "orig": "\u0427\u04d1\u0432\u0430\u0448\u043b\u0430",
+      "text": "\u0427\u04d1\u0432\u0430\u0448\u043b\u0430",
       "enumerated": false,
       "marker": "-"
     },
@@ -2608,10 +2752,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "Dansk",
-      "text": "Dansk",
+      "orig": "\u010ce\u0161tina",
+      "text": "\u010ce\u0161tina",
       "enumerated": false,
       "marker": "-"
     },
@@ -2621,10 +2766,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "Deitsch",
-      "text": "Deitsch",
+      "orig": "ChiShona",
+      "text": "ChiShona",
       "enumerated": false,
       "marker": "-"
     },
@@ -2634,10 +2780,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "Deutsch",
-      "text": "Deutsch",
+      "orig": "Cymraeg",
+      "text": "Cymraeg",
       "enumerated": false,
       "marker": "-"
     },
@@ -2647,10 +2794,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "\u0921\u094b\u091f\u0947\u0932\u0940",
-      "text": "\u0921\u094b\u091f\u0947\u0932\u0940",
+      "orig": "Dagbanli",
+      "text": "Dagbanli",
       "enumerated": false,
       "marker": "-"
     },
@@ -2660,10 +2808,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "\u0395\u03bb\u03bb\u03b7\u03bd\u03b9\u03ba\u03ac",
-      "text": "\u0395\u03bb\u03bb\u03b7\u03bd\u03b9\u03ba\u03ac",
+      "orig": "Dansk",
+      "text": "Dansk",
       "enumerated": false,
       "marker": "-"
     },
@@ -2673,10 +2822,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "Emili\u00e0n e rumagn\u00f2l",
-      "text": "Emili\u00e0n e rumagn\u00f2l",
+      "orig": "Deitsch",
+      "text": "Deitsch",
       "enumerated": false,
       "marker": "-"
     },
@@ -2686,10 +2836,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "Espa\u00f1ol",
-      "text": "Espa\u00f1ol",
+      "orig": "Deutsch",
+      "text": "Deutsch",
       "enumerated": false,
       "marker": "-"
     },
@@ -2699,10 +2850,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "Esperanto",
-      "text": "Esperanto",
+      "orig": "\u0921\u094b\u091f\u0947\u0932\u0940",
+      "text": "\u0921\u094b\u091f\u0947\u0932\u0940",
       "enumerated": false,
       "marker": "-"
     },
@@ -2712,10 +2864,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "Euskara",
-      "text": "Euskara",
+      "orig": "\u0395\u03bb\u03bb\u03b7\u03bd\u03b9\u03ba\u03ac",
+      "text": "\u0395\u03bb\u03bb\u03b7\u03bd\u03b9\u03ba\u03ac",
       "enumerated": false,
       "marker": "-"
     },
@@ -2725,10 +2878,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "\u0641\u0627\u0631\u0633\u06cc",
-      "text": "\u0641\u0627\u0631\u0633\u06cc",
+      "orig": "Emili\u00e0n e rumagn\u00f2l",
+      "text": "Emili\u00e0n e rumagn\u00f2l",
       "enumerated": false,
       "marker": "-"
     },
@@ -2738,10 +2892,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "Fran\u00e7ais",
-      "text": "Fran\u00e7ais",
+      "orig": "Espa\u00f1ol",
+      "text": "Espa\u00f1ol",
       "enumerated": false,
       "marker": "-"
     },
@@ -2751,10 +2906,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "Gaeilge",
-      "text": "Gaeilge",
+      "orig": "Esperanto",
+      "text": "Esperanto",
       "enumerated": false,
       "marker": "-"
     },
@@ -2764,10 +2920,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "Galego",
-      "text": "Galego",
+      "orig": "Euskara",
+      "text": "Euskara",
       "enumerated": false,
       "marker": "-"
     },
@@ -2777,10 +2934,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "\u0413\u04c0\u0430\u043b\u0433\u04c0\u0430\u0439",
-      "text": "\u0413\u04c0\u0430\u043b\u0433\u04c0\u0430\u0439",
+      "orig": "\u0641\u0627\u0631\u0633\u06cc",
+      "text": "\u0641\u0627\u0631\u0633\u06cc",
       "enumerated": false,
       "marker": "-"
     },
@@ -2790,10 +2948,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "\u8d1b\u8a9e",
-      "text": "\u8d1b\u8a9e",
+      "orig": "Fran\u00e7ais",
+      "text": "Fran\u00e7ais",
       "enumerated": false,
       "marker": "-"
     },
@@ -2803,10 +2962,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "\u06af\u06cc\u0644\u06a9\u06cc",
-      "text": "\u06af\u06cc\u0644\u06a9\u06cc",
+      "orig": "Gaeilge",
+      "text": "Gaeilge",
       "enumerated": false,
       "marker": "-"
     },
@@ -2816,10 +2976,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "\ud800\udf32\ud800\udf3f\ud800\udf44\ud800\udf39\ud800\udf43\ud800\udf3a",
-      "text": "\ud800\udf32\ud800\udf3f\ud800\udf44\ud800\udf39\ud800\udf43\ud800\udf3a",
+      "orig": "Galego",
+      "text": "Galego",
       "enumerated": false,
       "marker": "-"
     },
@@ -2829,10 +2990,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "\u0917\u094b\u0902\u092f\u091a\u0940 \u0915\u094b\u0902\u0915\u0923\u0940 / G\u00f5ychi Konknni",
-      "text": "\u0917\u094b\u0902\u092f\u091a\u0940 \u0915\u094b\u0902\u0915\u0923\u0940 / G\u00f5ychi Konknni",
+      "orig": "\u0413\u04c0\u0430\u043b\u0433\u04c0\u0430\u0439",
+      "text": "\u0413\u04c0\u0430\u043b\u0433\u04c0\u0430\u0439",
       "enumerated": false,
       "marker": "-"
     },
@@ -2842,10 +3004,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "\u5ba2\u5bb6\u8a9e / Hak-k\u00e2-ng\u00ee",
-      "text": "\u5ba2\u5bb6\u8a9e / Hak-k\u00e2-ng\u00ee",
+      "orig": "\u8d1b\u8a9e",
+      "text": "\u8d1b\u8a9e",
       "enumerated": false,
       "marker": "-"
     },
@@ -2855,10 +3018,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "\ud55c\uad6d\uc5b4",
-      "text": "\ud55c\uad6d\uc5b4",
+      "orig": "\u06af\u06cc\u0644\u06a9\u06cc",
+      "text": "\u06af\u06cc\u0644\u06a9\u06cc",
       "enumerated": false,
       "marker": "-"
     },
@@ -2868,10 +3032,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "Hausa",
-      "text": "Hausa",
+      "orig": "\ud800\udf32\ud800\udf3f\ud800\udf44\ud800\udf39\ud800\udf43\ud800\udf3a",
+      "text": "\ud800\udf32\ud800\udf3f\ud800\udf44\ud800\udf39\ud800\udf43\ud800\udf3a",
       "enumerated": false,
       "marker": "-"
     },
@@ -2881,10 +3046,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "\u0540\u0561\u0575\u0565\u0580\u0565\u0576",
-      "text": "\u0540\u0561\u0575\u0565\u0580\u0565\u0576",
+      "orig": "\u0917\u094b\u0902\u092f\u091a\u0940 \u0915\u094b\u0902\u0915\u0923\u0940 / G\u00f5ychi Konknni",
+      "text": "\u0917\u094b\u0902\u092f\u091a\u0940 \u0915\u094b\u0902\u0915\u0923\u0940 / G\u00f5ychi Konknni",
       "enumerated": false,
       "marker": "-"
     },
@@ -2894,10 +3060,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "\u0939\u093f\u0928\u094d\u0926\u0940",
-      "text": "\u0939\u093f\u0928\u094d\u0926\u0940",
+      "orig": "\u5ba2\u5bb6\u8a9e / Hak-k\u00e2-ng\u00ee",
+      "text": "\u5ba2\u5bb6\u8a9e / Hak-k\u00e2-ng\u00ee",
       "enumerated": false,
       "marker": "-"
     },
@@ -2907,10 +3074,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "Hrvatski",
-      "text": "Hrvatski",
+      "orig": "\ud55c\uad6d\uc5b4",
+      "text": "\ud55c\uad6d\uc5b4",
       "enumerated": false,
       "marker": "-"
     },
@@ -2920,10 +3088,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "Ido",
-      "text": "Ido",
+      "orig": "Hausa",
+      "text": "Hausa",
       "enumerated": false,
       "marker": "-"
     },
@@ -2933,10 +3102,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "Bahasa Indonesia",
-      "text": "Bahasa Indonesia",
+      "orig": "\u0540\u0561\u0575\u0565\u0580\u0565\u0576",
+      "text": "\u0540\u0561\u0575\u0565\u0580\u0565\u0576",
       "enumerated": false,
       "marker": "-"
     },
@@ -2946,10 +3116,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "I\u00f1upiatun",
-      "text": "I\u00f1upiatun",
+      "orig": "\u0939\u093f\u0928\u094d\u0926\u0940",
+      "text": "\u0939\u093f\u0928\u094d\u0926\u0940",
       "enumerated": false,
       "marker": "-"
     },
@@ -2959,10 +3130,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "\u00cdslenska",
-      "text": "\u00cdslenska",
+      "orig": "Hrvatski",
+      "text": "Hrvatski",
       "enumerated": false,
       "marker": "-"
     },
@@ -2972,10 +3144,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "Italiano",
-      "text": "Italiano",
+      "orig": "Ido",
+      "text": "Ido",
       "enumerated": false,
       "marker": "-"
     },
@@ -2985,10 +3158,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "\u05e2\u05d1\u05e8\u05d9\u05ea",
-      "text": "\u05e2\u05d1\u05e8\u05d9\u05ea",
+      "orig": "Bahasa Indonesia",
+      "text": "Bahasa Indonesia",
       "enumerated": false,
       "marker": "-"
     },
@@ -2998,10 +3172,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "Jawa",
-      "text": "Jawa",
+      "orig": "I\u00f1upiatun",
+      "text": "I\u00f1upiatun",
       "enumerated": false,
       "marker": "-"
     },
@@ -3011,10 +3186,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "\u0c95\u0ca8\u0ccd\u0ca8\u0ca1",
-      "text": "\u0c95\u0ca8\u0ccd\u0ca8\u0ca1",
+      "orig": "\u00cdslenska",
+      "text": "\u00cdslenska",
       "enumerated": false,
       "marker": "-"
     },
@@ -3024,10 +3200,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "Kapampangan",
-      "text": "Kapampangan",
+      "orig": "Italiano",
+      "text": "Italiano",
       "enumerated": false,
       "marker": "-"
     },
@@ -3037,10 +3214,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "\u10e5\u10d0\u10e0\u10d7\u10e3\u10da\u10d8",
-      "text": "\u10e5\u10d0\u10e0\u10d7\u10e3\u10da\u10d8",
+      "orig": "\u05e2\u05d1\u05e8\u05d9\u05ea",
+      "text": "\u05e2\u05d1\u05e8\u05d9\u05ea",
       "enumerated": false,
       "marker": "-"
     },
@@ -3050,10 +3228,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "\u0915\u0949\u0936\u0941\u0930 / \u06a9\u0672\u0634\u064f\u0631",
-      "text": "\u0915\u0949\u0936\u0941\u0930 / \u06a9\u0672\u0634\u064f\u0631",
+      "orig": "Jawa",
+      "text": "Jawa",
       "enumerated": false,
       "marker": "-"
     },
@@ -3063,10 +3242,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "\u049a\u0430\u0437\u0430\u049b\u0448\u0430",
-      "text": "\u049a\u0430\u0437\u0430\u049b\u0448\u0430",
+      "orig": "\u0c95\u0ca8\u0ccd\u0ca8\u0ca1",
+      "text": "\u0c95\u0ca8\u0ccd\u0ca8\u0ca1",
       "enumerated": false,
       "marker": "-"
     },
@@ -3076,10 +3256,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "Ikirundi",
-      "text": "Ikirundi",
+      "orig": "Kapampangan",
+      "text": "Kapampangan",
       "enumerated": false,
       "marker": "-"
     },
@@ -3089,10 +3270,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "Kongo",
-      "text": "Kongo",
+      "orig": "\u10e5\u10d0\u10e0\u10d7\u10e3\u10da\u10d8",
+      "text": "\u10e5\u10d0\u10e0\u10d7\u10e3\u10da\u10d8",
       "enumerated": false,
       "marker": "-"
     },
@@ -3102,10 +3284,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "Krey\u00f2l ayisyen",
-      "text": "Krey\u00f2l ayisyen",
+      "orig": "\u0915\u0949\u0936\u0941\u0930 / \u06a9\u0672\u0634\u064f\u0631",
+      "text": "\u0915\u0949\u0936\u0941\u0930 / \u06a9\u0672\u0634\u064f\u0631",
       "enumerated": false,
       "marker": "-"
     },
@@ -3115,10 +3298,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "\u041a\u044b\u0440\u044b\u043a \u043c\u0430\u0440\u044b",
-      "text": "\u041a\u044b\u0440\u044b\u043a \u043c\u0430\u0440\u044b",
+      "orig": "\u049a\u0430\u0437\u0430\u049b\u0448\u0430",
+      "text": "\u049a\u0430\u0437\u0430\u049b\u0448\u0430",
       "enumerated": false,
       "marker": "-"
     },
@@ -3128,10 +3312,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "\u0ea5\u0eb2\u0ea7",
-      "text": "\u0ea5\u0eb2\u0ea7",
+      "orig": "Ikirundi",
+      "text": "Ikirundi",
       "enumerated": false,
       "marker": "-"
     },
@@ -3141,10 +3326,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "Latina",
-      "text": "Latina",
+      "orig": "Kongo",
+      "text": "Kongo",
       "enumerated": false,
       "marker": "-"
     },
@@ -3154,10 +3340,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "Latvie\u0161u",
-      "text": "Latvie\u0161u",
+      "orig": "Krey\u00f2l ayisyen",
+      "text": "Krey\u00f2l ayisyen",
       "enumerated": false,
       "marker": "-"
     },
@@ -3167,10 +3354,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "Lietuvi\u0173",
-      "text": "Lietuvi\u0173",
+      "orig": "\u041a\u044b\u0440\u044b\u043a \u043c\u0430\u0440\u044b",
+      "text": "\u041a\u044b\u0440\u044b\u043a \u043c\u0430\u0440\u044b",
       "enumerated": false,
       "marker": "-"
     },
@@ -3180,10 +3368,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "Li Niha",
-      "text": "Li Niha",
+      "orig": "\u0ea5\u0eb2\u0ea7",
+      "text": "\u0ea5\u0eb2\u0ea7",
       "enumerated": false,
       "marker": "-"
     },
@@ -3193,10 +3382,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "Ligure",
-      "text": "Ligure",
+      "orig": "Latina",
+      "text": "Latina",
       "enumerated": false,
       "marker": "-"
     },
@@ -3206,10 +3396,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "Limburgs",
-      "text": "Limburgs",
+      "orig": "Latvie\u0161u",
+      "text": "Latvie\u0161u",
       "enumerated": false,
       "marker": "-"
     },
@@ -3219,10 +3410,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "Ling\u00e1la",
-      "text": "Ling\u00e1la",
+      "orig": "Lietuvi\u0173",
+      "text": "Lietuvi\u0173",
       "enumerated": false,
       "marker": "-"
     },
@@ -3232,10 +3424,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "Malagasy",
-      "text": "Malagasy",
+      "orig": "Li Niha",
+      "text": "Li Niha",
       "enumerated": false,
       "marker": "-"
     },
@@ -3245,10 +3438,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "\u0d2e\u0d32\u0d2f\u0d3e\u0d33\u0d02",
-      "text": "\u0d2e\u0d32\u0d2f\u0d3e\u0d33\u0d02",
+      "orig": "Ligure",
+      "text": "Ligure",
       "enumerated": false,
       "marker": "-"
     },
@@ -3258,10 +3452,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "\u092e\u0930\u093e\u0920\u0940",
-      "text": "\u092e\u0930\u093e\u0920\u0940",
+      "orig": "Limburgs",
+      "text": "Limburgs",
       "enumerated": false,
       "marker": "-"
     },
@@ -3271,10 +3466,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "\u0645\u0627\u0632\u0650\u0631\u0648\u0646\u06cc",
-      "text": "\u0645\u0627\u0632\u0650\u0631\u0648\u0646\u06cc",
+      "orig": "Ling\u00e1la",
+      "text": "Ling\u00e1la",
       "enumerated": false,
       "marker": "-"
     },
@@ -3284,10 +3480,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "Bahasa Melayu",
-      "text": "Bahasa Melayu",
+      "orig": "Malagasy",
+      "text": "Malagasy",
       "enumerated": false,
       "marker": "-"
     },
@@ -3297,10 +3494,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "\uabc3\uabe4\uabc7\uabe9 \uabc2\uabe3\uabdf",
-      "text": "\uabc3\uabe4\uabc7\uabe9 \uabc2\uabe3\uabdf",
+      "orig": "\u0d2e\u0d32\u0d2f\u0d3e\u0d33\u0d02",
+      "text": "\u0d2e\u0d32\u0d2f\u0d3e\u0d33\u0d02",
       "enumerated": false,
       "marker": "-"
     },
@@ -3310,10 +3508,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "\u95a9\u6771\u8a9e / M\u00ecng-d\u0115\u0324ng-ng\u1e73\u0304",
-      "text": "\u95a9\u6771\u8a9e / M\u00ecng-d\u0115\u0324ng-ng\u1e73\u0304",
+      "orig": "\u092e\u0930\u093e\u0920\u0940",
+      "text": "\u092e\u0930\u093e\u0920\u0940",
       "enumerated": false,
       "marker": "-"
     },
@@ -3323,10 +3522,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "\u041c\u043e\u043a\u0448\u0435\u043d\u044c",
-      "text": "\u041c\u043e\u043a\u0448\u0435\u043d\u044c",
+      "orig": "\u0645\u0627\u0632\u0650\u0631\u0648\u0646\u06cc",
+      "text": "\u0645\u0627\u0632\u0650\u0631\u0648\u0646\u06cc",
       "enumerated": false,
       "marker": "-"
     },
@@ -3336,10 +3536,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "\u041c\u043e\u043d\u0433\u043e\u043b",
-      "text": "\u041c\u043e\u043d\u0433\u043e\u043b",
+      "orig": "Bahasa Melayu",
+      "text": "Bahasa Melayu",
       "enumerated": false,
       "marker": "-"
     },
@@ -3349,10 +3550,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "\u1019\u103c\u1014\u103a\u1019\u102c\u1018\u102c\u101e\u102c",
-      "text": "\u1019\u103c\u1014\u103a\u1019\u102c\u1018\u102c\u101e\u102c",
+      "orig": "\uabc3\uabe4\uabc7\uabe9 \uabc2\uabe3\uabdf",
+      "text": "\uabc3\uabe4\uabc7\uabe9 \uabc2\uabe3\uabdf",
       "enumerated": false,
       "marker": "-"
     },
@@ -3362,10 +3564,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "Nederlands",
-      "text": "Nederlands",
+      "orig": "\u95a9\u6771\u8a9e / M\u00ecng-d\u0115\u0324ng-ng\u1e73\u0304",
+      "text": "\u95a9\u6771\u8a9e / M\u00ecng-d\u0115\u0324ng-ng\u1e73\u0304",
       "enumerated": false,
       "marker": "-"
     },
@@ -3375,10 +3578,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "Nedersaksies",
-      "text": "Nedersaksies",
+      "orig": "\u041c\u043e\u043a\u0448\u0435\u043d\u044c",
+      "text": "\u041c\u043e\u043a\u0448\u0435\u043d\u044c",
       "enumerated": false,
       "marker": "-"
     },
@@ -3388,10 +3592,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "\u0928\u0947\u092a\u093e\u0932\u0940",
-      "text": "\u0928\u0947\u092a\u093e\u0932\u0940",
+      "orig": "\u041c\u043e\u043d\u0433\u043e\u043b",
+      "text": "\u041c\u043e\u043d\u0433\u043e\u043b",
       "enumerated": false,
       "marker": "-"
     },
@@ -3401,10 +3606,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "\u0928\u0947\u092a\u093e\u0932 \u092d\u093e\u0937\u093e",
-      "text": "\u0928\u0947\u092a\u093e\u0932 \u092d\u093e\u0937\u093e",
+      "orig": "\u1019\u103c\u1014\u103a\u1019\u102c\u1018\u102c\u101e\u102c",
+      "text": "\u1019\u103c\u1014\u103a\u1019\u102c\u1018\u102c\u101e\u102c",
       "enumerated": false,
       "marker": "-"
     },
@@ -3414,10 +3620,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "\u65e5\u672c\u8a9e",
-      "text": "\u65e5\u672c\u8a9e",
+      "orig": "Nederlands",
+      "text": "Nederlands",
       "enumerated": false,
       "marker": "-"
     },
@@ -3427,10 +3634,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "\u041d\u043e\u0445\u0447\u0438\u0439\u043d",
-      "text": "\u041d\u043e\u0445\u0447\u0438\u0439\u043d",
+      "orig": "Nedersaksies",
+      "text": "Nedersaksies",
       "enumerated": false,
       "marker": "-"
     },
@@ -3440,10 +3648,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "Norsk nynorsk",
-      "text": "Norsk nynorsk",
+      "orig": "\u0928\u0947\u092a\u093e\u0932\u0940",
+      "text": "\u0928\u0947\u092a\u093e\u0932\u0940",
       "enumerated": false,
       "marker": "-"
     },
@@ -3453,10 +3662,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "Occitan",
-      "text": "Occitan",
+      "orig": "\u0928\u0947\u092a\u093e\u0932 \u092d\u093e\u0937\u093e",
+      "text": "\u0928\u0947\u092a\u093e\u0932 \u092d\u093e\u0937\u093e",
       "enumerated": false,
       "marker": "-"
     },
@@ -3466,10 +3676,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "Oromoo",
-      "text": "Oromoo",
+      "orig": "\u65e5\u672c\u8a9e",
+      "text": "\u65e5\u672c\u8a9e",
       "enumerated": false,
       "marker": "-"
     },
@@ -3479,10 +3690,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "\u0a2a\u0a70\u0a1c\u0a3e\u0a2c\u0a40",
-      "text": "\u0a2a\u0a70\u0a1c\u0a3e\u0a2c\u0a40",
+      "orig": "\u041d\u043e\u0445\u0447\u0438\u0439\u043d",
+      "text": "\u041d\u043e\u0445\u0447\u0438\u0439\u043d",
       "enumerated": false,
       "marker": "-"
     },
@@ -3492,10 +3704,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "Picard",
-      "text": "Picard",
+      "orig": "Norsk nynorsk",
+      "text": "Norsk nynorsk",
       "enumerated": false,
       "marker": "-"
     },
@@ -3505,10 +3718,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "Plattd\u00fc\u00fctsch",
-      "text": "Plattd\u00fc\u00fctsch",
+      "orig": "Occitan",
+      "text": "Occitan",
       "enumerated": false,
       "marker": "-"
     },
@@ -3518,10 +3732,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "Polski",
-      "text": "Polski",
+      "orig": "Oromoo",
+      "text": "Oromoo",
       "enumerated": false,
       "marker": "-"
     },
@@ -3531,10 +3746,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "Portugu\u00eas",
-      "text": "Portugu\u00eas",
+      "orig": "\u0a2a\u0a70\u0a1c\u0a3e\u0a2c\u0a40",
+      "text": "\u0a2a\u0a70\u0a1c\u0a3e\u0a2c\u0a40",
       "enumerated": false,
       "marker": "-"
     },
@@ -3544,10 +3760,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "Q\u0131r\u0131mtatarca",
-      "text": "Q\u0131r\u0131mtatarca",
+      "orig": "Picard",
+      "text": "Picard",
       "enumerated": false,
       "marker": "-"
     },
@@ -3557,10 +3774,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "Rom\u00e2n\u0103",
-      "text": "Rom\u00e2n\u0103",
+      "orig": "Plattd\u00fc\u00fctsch",
+      "text": "Plattd\u00fc\u00fctsch",
       "enumerated": false,
       "marker": "-"
     },
@@ -3570,10 +3788,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "\u0420\u0443\u0441\u0441\u043a\u0438\u0439",
-      "text": "\u0420\u0443\u0441\u0441\u043a\u0438\u0439",
+      "orig": "Polski",
+      "text": "Polski",
       "enumerated": false,
       "marker": "-"
     },
@@ -3583,10 +3802,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "\u0421\u0430\u0445\u0430 \u0442\u044b\u043b\u0430",
-      "text": "\u0421\u0430\u0445\u0430 \u0442\u044b\u043b\u0430",
+      "orig": "Portugu\u00eas",
+      "text": "Portugu\u00eas",
       "enumerated": false,
       "marker": "-"
     },
@@ -3596,10 +3816,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "\u1c65\u1c5f\u1c71\u1c5b\u1c5f\u1c72\u1c64",
-      "text": "\u1c65\u1c5f\u1c71\u1c5b\u1c5f\u1c72\u1c64",
+      "orig": "Q\u0131r\u0131mtatarca",
+      "text": "Q\u0131r\u0131mtatarca",
       "enumerated": false,
       "marker": "-"
     },
@@ -3609,10 +3830,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "Sardu",
-      "text": "Sardu",
+      "orig": "Rom\u00e2n\u0103",
+      "text": "Rom\u00e2n\u0103",
       "enumerated": false,
       "marker": "-"
     },
@@ -3622,10 +3844,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "Scots",
-      "text": "Scots",
+      "orig": "\u0420\u0443\u0441\u0441\u043a\u0438\u0439",
+      "text": "\u0420\u0443\u0441\u0441\u043a\u0438\u0439",
       "enumerated": false,
       "marker": "-"
     },
@@ -3635,10 +3858,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "Seeltersk",
-      "text": "Seeltersk",
+      "orig": "\u0421\u0430\u0445\u0430 \u0442\u044b\u043b\u0430",
+      "text": "\u0421\u0430\u0445\u0430 \u0442\u044b\u043b\u0430",
       "enumerated": false,
       "marker": "-"
     },
@@ -3648,10 +3872,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "Shqip",
-      "text": "Shqip",
+      "orig": "\u1c65\u1c5f\u1c71\u1c5b\u1c5f\u1c72\u1c64",
+      "text": "\u1c65\u1c5f\u1c71\u1c5b\u1c5f\u1c72\u1c64",
       "enumerated": false,
       "marker": "-"
     },
@@ -3661,10 +3886,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "Sicilianu",
-      "text": "Sicilianu",
+      "orig": "Sardu",
+      "text": "Sardu",
       "enumerated": false,
       "marker": "-"
     },
@@ -3674,10 +3900,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "\u0dc3\u0dd2\u0d82\u0dc4\u0dbd",
-      "text": "\u0dc3\u0dd2\u0d82\u0dc4\u0dbd",
+      "orig": "Scots",
+      "text": "Scots",
       "enumerated": false,
       "marker": "-"
     },
@@ -3687,10 +3914,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "Simple English",
-      "text": "Simple English",
+      "orig": "Seeltersk",
+      "text": "Seeltersk",
       "enumerated": false,
       "marker": "-"
     },
@@ -3700,10 +3928,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "\u0633\u0646\u068c\u064a",
-      "text": "\u0633\u0646\u068c\u064a",
+      "orig": "Shqip",
+      "text": "Shqip",
       "enumerated": false,
       "marker": "-"
     },
@@ -3713,10 +3942,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "\u06a9\u0648\u0631\u062f\u06cc",
-      "text": "\u06a9\u0648\u0631\u062f\u06cc",
+      "orig": "Sicilianu",
+      "text": "Sicilianu",
       "enumerated": false,
       "marker": "-"
     },
@@ -3726,10 +3956,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "\u0421\u0440\u043f\u0441\u043a\u0438 / srpski",
-      "text": "\u0421\u0440\u043f\u0441\u043a\u0438 / srpski",
+      "orig": "\u0dc3\u0dd2\u0d82\u0dc4\u0dbd",
+      "text": "\u0dc3\u0dd2\u0d82\u0dc4\u0dbd",
       "enumerated": false,
       "marker": "-"
     },
@@ -3739,10 +3970,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "Srpskohrvatski / \u0441\u0440\u043f\u0441\u043a\u043e\u0445\u0440\u0432\u0430\u0442\u0441\u043a\u0438",
-      "text": "Srpskohrvatski / \u0441\u0440\u043f\u0441\u043a\u043e\u0445\u0440\u0432\u0430\u0442\u0441\u043a\u0438",
+      "orig": "Simple English",
+      "text": "Simple English",
       "enumerated": false,
       "marker": "-"
     },
@@ -3752,10 +3984,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "Sunda",
-      "text": "Sunda",
+      "orig": "\u0633\u0646\u068c\u064a",
+      "text": "\u0633\u0646\u068c\u064a",
       "enumerated": false,
       "marker": "-"
     },
@@ -3765,10 +3998,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "Svenska",
-      "text": "Svenska",
+      "orig": "\u06a9\u0648\u0631\u062f\u06cc",
+      "text": "\u06a9\u0648\u0631\u062f\u06cc",
       "enumerated": false,
       "marker": "-"
     },
@@ -3778,10 +4012,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "Tagalog",
-      "text": "Tagalog",
+      "orig": "\u0421\u0440\u043f\u0441\u043a\u0438 / srpski",
+      "text": "\u0421\u0440\u043f\u0441\u043a\u0438 / srpski",
       "enumerated": false,
       "marker": "-"
     },
@@ -3791,10 +4026,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "\u0ba4\u0bae\u0bbf\u0bb4\u0bcd",
-      "text": "\u0ba4\u0bae\u0bbf\u0bb4\u0bcd",
+      "orig": "Srpskohrvatski / \u0441\u0440\u043f\u0441\u043a\u043e\u0445\u0440\u0432\u0430\u0442\u0441\u043a\u0438",
+      "text": "Srpskohrvatski / \u0441\u0440\u043f\u0441\u043a\u043e\u0445\u0440\u0432\u0430\u0442\u0441\u043a\u0438",
       "enumerated": false,
       "marker": "-"
     },
@@ -3804,10 +4040,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "Taqbaylit",
-      "text": "Taqbaylit",
+      "orig": "Sunda",
+      "text": "Sunda",
       "enumerated": false,
       "marker": "-"
     },
@@ -3817,10 +4054,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "\u0422\u0430\u0442\u0430\u0440\u0447\u0430 / tatar\u00e7a",
-      "text": "\u0422\u0430\u0442\u0430\u0440\u0447\u0430 / tatar\u00e7a",
+      "orig": "Svenska",
+      "text": "Svenska",
       "enumerated": false,
       "marker": "-"
     },
@@ -3830,10 +4068,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "\u0e44\u0e17\u0e22",
-      "text": "\u0e44\u0e17\u0e22",
+      "orig": "Tagalog",
+      "text": "Tagalog",
       "enumerated": false,
       "marker": "-"
     },
@@ -3843,10 +4082,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "T\u00fcrk\u00e7e",
-      "text": "T\u00fcrk\u00e7e",
+      "orig": "\u0ba4\u0bae\u0bbf\u0bb4\u0bcd",
+      "text": "\u0ba4\u0bae\u0bbf\u0bb4\u0bcd",
       "enumerated": false,
       "marker": "-"
     },
@@ -3856,10 +4096,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "\u0423\u043a\u0440\u0430\u0457\u043d\u0441\u044c\u043a\u0430",
-      "text": "\u0423\u043a\u0440\u0430\u0457\u043d\u0441\u044c\u043a\u0430",
+      "orig": "Taqbaylit",
+      "text": "Taqbaylit",
       "enumerated": false,
       "marker": "-"
     },
@@ -3869,10 +4110,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "\u0626\u06c7\u064a\u063a\u06c7\u0631\u0686\u06d5 / Uyghurche",
-      "text": "\u0626\u06c7\u064a\u063a\u06c7\u0631\u0686\u06d5 / Uyghurche",
+      "orig": "\u0422\u0430\u0442\u0430\u0440\u0447\u0430 / tatar\u00e7a",
+      "text": "\u0422\u0430\u0442\u0430\u0440\u0447\u0430 / tatar\u00e7a",
       "enumerated": false,
       "marker": "-"
     },
@@ -3882,10 +4124,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "Vahcuengh",
-      "text": "Vahcuengh",
+      "orig": "\u0e44\u0e17\u0e22",
+      "text": "\u0e44\u0e17\u0e22",
       "enumerated": false,
       "marker": "-"
     },
@@ -3895,10 +4138,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "Ti\u1ebfng Vi\u1ec7t",
-      "text": "Ti\u1ebfng Vi\u1ec7t",
+      "orig": "T\u00fcrk\u00e7e",
+      "text": "T\u00fcrk\u00e7e",
       "enumerated": false,
       "marker": "-"
     },
@@ -3908,10 +4152,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "Walon",
-      "text": "Walon",
+      "orig": "\u0423\u043a\u0440\u0430\u0457\u043d\u0441\u044c\u043a\u0430",
+      "text": "\u0423\u043a\u0440\u0430\u0457\u043d\u0441\u044c\u043a\u0430",
       "enumerated": false,
       "marker": "-"
     },
@@ -3921,10 +4166,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "\u6587\u8a00",
-      "text": "\u6587\u8a00",
+      "orig": "\u0626\u06c7\u064a\u063a\u06c7\u0631\u0686\u06d5 / Uyghurche",
+      "text": "\u0626\u06c7\u064a\u063a\u06c7\u0631\u0686\u06d5 / Uyghurche",
       "enumerated": false,
       "marker": "-"
     },
@@ -3934,10 +4180,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "Winaray",
-      "text": "Winaray",
+      "orig": "Vahcuengh",
+      "text": "Vahcuengh",
       "enumerated": false,
       "marker": "-"
     },
@@ -3947,10 +4194,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "\u5434\u8bed",
-      "text": "\u5434\u8bed",
+      "orig": "Ti\u1ebfng Vi\u1ec7t",
+      "text": "Ti\u1ebfng Vi\u1ec7t",
       "enumerated": false,
       "marker": "-"
     },
@@ -3960,10 +4208,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "\u7cb5\u8a9e",
-      "text": "\u7cb5\u8a9e",
+      "orig": "Walon",
+      "text": "Walon",
       "enumerated": false,
       "marker": "-"
     },
@@ -3973,10 +4222,11 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "\u017demait\u0117\u0161ka",
-      "text": "\u017demait\u0117\u0161ka",
+      "orig": "\u6587\u8a00",
+      "text": "\u6587\u8a00",
       "enumerated": false,
       "marker": "-"
     },
@@ -3986,6 +4236,63 @@
         "$ref": "#/groups/29"
       },
       "children": [],
+      "content_layer": "body",
+      "label": "list_item",
+      "prov": [],
+      "orig": "Winaray",
+      "text": "Winaray",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/176",
+      "parent": {
+        "$ref": "#/groups/29"
+      },
+      "children": [],
+      "content_layer": "body",
+      "label": "list_item",
+      "prov": [],
+      "orig": "\u5434\u8bed",
+      "text": "\u5434\u8bed",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/177",
+      "parent": {
+        "$ref": "#/groups/29"
+      },
+      "children": [],
+      "content_layer": "body",
+      "label": "list_item",
+      "prov": [],
+      "orig": "\u7cb5\u8a9e",
+      "text": "\u7cb5\u8a9e",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/178",
+      "parent": {
+        "$ref": "#/groups/29"
+      },
+      "children": [],
+      "content_layer": "body",
+      "label": "list_item",
+      "prov": [],
+      "orig": "\u017demait\u0117\u0161ka",
+      "text": "\u017demait\u0117\u0161ka",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/179",
+      "parent": {
+        "$ref": "#/groups/29"
+      },
+      "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "\u4e2d\u6587",
@@ -3994,11 +4301,12 @@
       "marker": "-"
     },
     {
-      "self_ref": "#/texts/176",
+      "self_ref": "#/texts/180",
       "parent": {
         "$ref": "#/groups/30"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "Article",
@@ -4007,11 +4315,12 @@
       "marker": "-"
     },
     {
-      "self_ref": "#/texts/177",
+      "self_ref": "#/texts/181",
       "parent": {
         "$ref": "#/groups/30"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "Talk",
@@ -4019,77 +4328,41 @@
       "enumerated": false,
       "marker": "-"
     },
-    {
-      "self_ref": "#/texts/178",
-      "parent": {
-        "$ref": "#/groups/32"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Read",
-      "text": "Read",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/179",
-      "parent": {
-        "$ref": "#/groups/32"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "View source",
-      "text": "View source",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/180",
-      "parent": {
-        "$ref": "#/groups/32"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "View history",
-      "text": "View history",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/181",
-      "parent": {
-        "$ref": "#/groups/33"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Read",
-      "text": "Read",
-      "enumerated": false,
-      "marker": "-"
-    },
     {
       "self_ref": "#/texts/182",
       "parent": {
-        "$ref": "#/groups/33"
+        "$ref": "#/groups/32"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "View source",
-      "text": "View source",
+      "orig": "Read",
+      "text": "Read",
       "enumerated": false,
       "marker": "-"
     },
     {
       "self_ref": "#/texts/183",
       "parent": {
-        "$ref": "#/groups/33"
+        "$ref": "#/groups/32"
       },
       "children": [],
+      "content_layer": "body",
+      "label": "list_item",
+      "prov": [],
+      "orig": "View source",
+      "text": "View source",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/184",
+      "parent": {
+        "$ref": "#/groups/32"
+      },
+      "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "View history",
@@ -4097,96 +4370,83 @@
       "enumerated": false,
       "marker": "-"
     },
-    {
-      "self_ref": "#/texts/184",
-      "parent": {
-        "$ref": "#/groups/34"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "What links here",
-      "text": "What links here",
-      "enumerated": false,
-      "marker": "-"
-    },
     {
       "self_ref": "#/texts/185",
       "parent": {
-        "$ref": "#/groups/34"
+        "$ref": "#/texts/43"
       },
       "children": [],
-      "label": "list_item",
+      "content_layer": "body",
+      "label": "text",
       "prov": [],
-      "orig": "Related changes",
-      "text": "Related changes",
-      "enumerated": false,
-      "marker": "-"
+      "orig": "Tools",
+      "text": "Tools"
     },
     {
       "self_ref": "#/texts/186",
       "parent": {
-        "$ref": "#/groups/34"
+        "$ref": "#/texts/43"
       },
       "children": [],
-      "label": "list_item",
+      "content_layer": "body",
+      "label": "text",
       "prov": [],
-      "orig": "Upload file",
-      "text": "Upload file",
-      "enumerated": false,
-      "marker": "-"
+      "orig": "Actions",
+      "text": "Actions"
     },
     {
       "self_ref": "#/texts/187",
       "parent": {
-        "$ref": "#/groups/34"
+        "$ref": "#/groups/33"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "Special pages",
-      "text": "Special pages",
+      "orig": "Read",
+      "text": "Read",
       "enumerated": false,
       "marker": "-"
     },
     {
       "self_ref": "#/texts/188",
       "parent": {
-        "$ref": "#/groups/34"
+        "$ref": "#/groups/33"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "Permanent link",
-      "text": "Permanent link",
+      "orig": "View source",
+      "text": "View source",
       "enumerated": false,
       "marker": "-"
     },
     {
       "self_ref": "#/texts/189",
       "parent": {
-        "$ref": "#/groups/34"
+        "$ref": "#/groups/33"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "Page information",
-      "text": "Page information",
+      "orig": "View history",
+      "text": "View history",
       "enumerated": false,
       "marker": "-"
     },
     {
       "self_ref": "#/texts/190",
       "parent": {
-        "$ref": "#/groups/34"
+        "$ref": "#/texts/43"
       },
       "children": [],
-      "label": "list_item",
+      "content_layer": "body",
+      "label": "text",
       "prov": [],
-      "orig": "Cite this page",
-      "text": "Cite this page",
-      "enumerated": false,
-      "marker": "-"
+      "orig": "General",
+      "text": "General"
     },
     {
       "self_ref": "#/texts/191",
@@ -4194,10 +4454,11 @@
         "$ref": "#/groups/34"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "Get shortened URL",
-      "text": "Get shortened URL",
+      "orig": "What links here",
+      "text": "What links here",
       "enumerated": false,
       "marker": "-"
     },
@@ -4207,10 +4468,11 @@
         "$ref": "#/groups/34"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "Download QR code",
-      "text": "Download QR code",
+      "orig": "Related changes",
+      "text": "Related changes",
       "enumerated": false,
       "marker": "-"
     },
@@ -4220,6 +4482,105 @@
         "$ref": "#/groups/34"
       },
       "children": [],
+      "content_layer": "body",
+      "label": "list_item",
+      "prov": [],
+      "orig": "Upload file",
+      "text": "Upload file",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/194",
+      "parent": {
+        "$ref": "#/groups/34"
+      },
+      "children": [],
+      "content_layer": "body",
+      "label": "list_item",
+      "prov": [],
+      "orig": "Special pages",
+      "text": "Special pages",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/195",
+      "parent": {
+        "$ref": "#/groups/34"
+      },
+      "children": [],
+      "content_layer": "body",
+      "label": "list_item",
+      "prov": [],
+      "orig": "Permanent link",
+      "text": "Permanent link",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/196",
+      "parent": {
+        "$ref": "#/groups/34"
+      },
+      "children": [],
+      "content_layer": "body",
+      "label": "list_item",
+      "prov": [],
+      "orig": "Page information",
+      "text": "Page information",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/197",
+      "parent": {
+        "$ref": "#/groups/34"
+      },
+      "children": [],
+      "content_layer": "body",
+      "label": "list_item",
+      "prov": [],
+      "orig": "Cite this page",
+      "text": "Cite this page",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/198",
+      "parent": {
+        "$ref": "#/groups/34"
+      },
+      "children": [],
+      "content_layer": "body",
+      "label": "list_item",
+      "prov": [],
+      "orig": "Get shortened URL",
+      "text": "Get shortened URL",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/199",
+      "parent": {
+        "$ref": "#/groups/34"
+      },
+      "children": [],
+      "content_layer": "body",
+      "label": "list_item",
+      "prov": [],
+      "orig": "Download QR code",
+      "text": "Download QR code",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/200",
+      "parent": {
+        "$ref": "#/groups/34"
+      },
+      "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "Wikidata item",
@@ -4228,11 +4589,24 @@
       "marker": "-"
     },
     {
-      "self_ref": "#/texts/194",
+      "self_ref": "#/texts/201",
+      "parent": {
+        "$ref": "#/texts/43"
+      },
+      "children": [],
+      "content_layer": "body",
+      "label": "text",
+      "prov": [],
+      "orig": "Print/export",
+      "text": "Print/export"
+    },
+    {
+      "self_ref": "#/texts/202",
       "parent": {
         "$ref": "#/groups/35"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "Download as PDF",
@@ -4241,11 +4615,12 @@
       "marker": "-"
     },
     {
-      "self_ref": "#/texts/195",
+      "self_ref": "#/texts/203",
       "parent": {
         "$ref": "#/groups/35"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "Printable version",
@@ -4254,11 +4629,24 @@
       "marker": "-"
     },
     {
-      "self_ref": "#/texts/196",
+      "self_ref": "#/texts/204",
+      "parent": {
+        "$ref": "#/texts/43"
+      },
+      "children": [],
+      "content_layer": "body",
+      "label": "text",
+      "prov": [],
+      "orig": "In other projects",
+      "text": "In other projects"
+    },
+    {
+      "self_ref": "#/texts/205",
       "parent": {
         "$ref": "#/groups/36"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "Wikimedia Commons",
@@ -4267,11 +4655,12 @@
       "marker": "-"
     },
     {
-      "self_ref": "#/texts/197",
+      "self_ref": "#/texts/206",
       "parent": {
         "$ref": "#/groups/36"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "Wikiquote",
@@ -4280,47 +4669,109 @@
       "marker": "-"
     },
     {
-      "self_ref": "#/texts/198",
+      "self_ref": "#/texts/207",
       "parent": {
-        "$ref": "#/texts/39"
+        "$ref": "#/texts/43"
       },
       "children": [],
-      "label": "paragraph",
+      "content_layer": "body",
+      "label": "text",
+      "prov": [],
+      "orig": "Appearance",
+      "text": "Appearance"
+    },
+    {
+      "self_ref": "#/texts/208",
+      "parent": {
+        "$ref": "#/texts/43"
+      },
+      "children": [],
+      "content_layer": "body",
+      "label": "text",
+      "prov": [],
+      "orig": "From Wikipedia, the free encyclopedia",
+      "text": "From Wikipedia, the free encyclopedia"
+    },
+    {
+      "self_ref": "#/texts/209",
+      "parent": {
+        "$ref": "#/texts/43"
+      },
+      "children": [],
+      "content_layer": "body",
+      "label": "text",
+      "prov": [],
+      "orig": "Common name for many species of bird",
+      "text": "Common name for many species of bird"
+    },
+    {
+      "self_ref": "#/texts/210",
+      "parent": {
+        "$ref": "#/texts/43"
+      },
+      "children": [],
+      "content_layer": "body",
+      "label": "text",
+      "prov": [],
+      "orig": "This article is about the bird. For duck as a food, see . For other uses, see .",
+      "text": "This article is about the bird. For duck as a food, see . For other uses, see ."
+    },
+    {
+      "self_ref": "#/texts/211",
+      "parent": {
+        "$ref": "#/texts/43"
+      },
+      "children": [],
+      "content_layer": "body",
+      "label": "text",
+      "prov": [],
+      "orig": "\"Duckling\" redirects here. For other uses, see .",
+      "text": "\"Duckling\" redirects here. For other uses, see ."
+    },
+    {
+      "self_ref": "#/texts/212",
+      "parent": {
+        "$ref": "#/texts/43"
+      },
+      "children": [],
+      "content_layer": "body",
+      "label": "text",
       "prov": [],
       "orig": "Duck is the common name for numerous species of waterfowl in the family Anatidae. Ducks are generally smaller and shorter-necked than swans and geese, which are members of the same family. Divided among several subfamilies, they are a form taxon; they do not represent a monophyletic group (the group of all descendants of a single common ancestral species), since swans and geese are not considered ducks. Ducks are mostly aquatic birds, and may be found in both fresh water and sea water.",
       "text": "Duck is the common name for numerous species of waterfowl in the family Anatidae. Ducks are generally smaller and shorter-necked than swans and geese, which are members of the same family. Divided among several subfamilies, they are a form taxon; they do not represent a monophyletic group (the group of all descendants of a single common ancestral species), since swans and geese are not considered ducks. Ducks are mostly aquatic birds, and may be found in both fresh water and sea water."
     },
     {
-      "self_ref": "#/texts/199",
+      "self_ref": "#/texts/213",
       "parent": {
-        "$ref": "#/texts/39"
+        "$ref": "#/texts/43"
       },
       "children": [],
-      "label": "paragraph",
+      "content_layer": "body",
+      "label": "text",
       "prov": [],
       "orig": "Ducks are sometimes confused with several types of unrelated water birds with similar forms, such as loons or divers, grebes, gallinules and coots.",
       "text": "Ducks are sometimes confused with several types of unrelated water birds with similar forms, such as loons or divers, grebes, gallinules and coots."
     },
     {
-      "self_ref": "#/texts/200",
+      "self_ref": "#/texts/214",
       "parent": {
-        "$ref": "#/texts/39"
+        "$ref": "#/texts/43"
       },
       "children": [
         {
-          "$ref": "#/texts/201"
+          "$ref": "#/texts/215"
         },
         {
           "$ref": "#/pictures/4"
         },
         {
-          "$ref": "#/texts/203"
+          "$ref": "#/texts/217"
         },
         {
-          "$ref": "#/texts/204"
+          "$ref": "#/texts/218"
         },
         {
-          "$ref": "#/texts/205"
+          "$ref": "#/texts/219"
         },
         {
           "$ref": "#/pictures/5"
@@ -4329,6 +4780,7 @@
           "$ref": "#/pictures/6"
         }
       ],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
       "orig": "Etymology",
@@ -4336,298 +4788,113 @@
       "level": 2
     },
     {
-      "self_ref": "#/texts/201",
+      "self_ref": "#/texts/215",
       "parent": {
-        "$ref": "#/texts/200"
+        "$ref": "#/texts/214"
       },
       "children": [],
-      "label": "paragraph",
+      "content_layer": "body",
+      "label": "text",
       "prov": [],
       "orig": "The word duck comes from Old English d\u016bce 'diver', a derivative of the verb *d\u016bcan 'to duck, bend down low as if to get under something, or dive', because of the way many species in the dabbling duck group feed by upending; compare with Dutch duiken and German tauchen 'to dive'.",
       "text": "The word duck comes from Old English d\u016bce 'diver', a derivative of the verb *d\u016bcan 'to duck, bend down low as if to get under something, or dive', because of the way many species in the dabbling duck group feed by upending; compare with Dutch duiken and German tauchen 'to dive'."
     },
     {
-      "self_ref": "#/texts/202",
+      "self_ref": "#/texts/216",
       "parent": {
         "$ref": "#/body"
       },
       "children": [],
+      "content_layer": "body",
       "label": "caption",
       "prov": [],
       "orig": "Pacific black duck displaying the characteristic upending \"duck\"",
       "text": "Pacific black duck displaying the characteristic upending \"duck\""
     },
     {
-      "self_ref": "#/texts/203",
+      "self_ref": "#/texts/217",
       "parent": {
-        "$ref": "#/texts/200"
+        "$ref": "#/texts/214"
       },
       "children": [],
-      "label": "paragraph",
+      "content_layer": "body",
+      "label": "text",
       "prov": [],
       "orig": "This word replaced Old English ened /\u00e6nid 'duck', possibly to avoid confusion with other words, such as ende 'end' with similar forms. Other Germanic languages still have similar words for duck, for example, Dutch eend, German Ente and Norwegian and. The word ened /\u00e6nid was inherited from Proto-Indo-European; cf. Latin anas \"duck\", Lithuanian \u00e1ntis 'duck', Ancient Greek \u03bd\u1fc6\u03c3\u03c3\u03b1 /\u03bd\u1fc6\u03c4\u03c4\u03b1 (n\u0113ssa /n\u0113tta) 'duck', and Sanskrit \u0101t\u00ed 'water bird', among others.",
       "text": "This word replaced Old English ened /\u00e6nid 'duck', possibly to avoid confusion with other words, such as ende 'end' with similar forms. Other Germanic languages still have similar words for duck, for example, Dutch eend, German Ente and Norwegian and. The word ened /\u00e6nid was inherited from Proto-Indo-European; cf. Latin anas \"duck\", Lithuanian \u00e1ntis 'duck', Ancient Greek \u03bd\u1fc6\u03c3\u03c3\u03b1 /\u03bd\u1fc6\u03c4\u03c4\u03b1 (n\u0113ssa /n\u0113tta) 'duck', and Sanskrit \u0101t\u00ed 'water bird', among others."
     },
     {
-      "self_ref": "#/texts/204",
+      "self_ref": "#/texts/218",
       "parent": {
-        "$ref": "#/texts/200"
+        "$ref": "#/texts/214"
       },
       "children": [],
-      "label": "paragraph",
+      "content_layer": "body",
+      "label": "text",
       "prov": [],
       "orig": "A duckling is a young duck in downy plumage[1] or baby duck,[2] but in the food trade a young domestic duck which has just reached adult size and bulk and its meat is still fully tender, is sometimes labelled as a duckling.",
       "text": "A duckling is a young duck in downy plumage[1] or baby duck,[2] but in the food trade a young domestic duck which has just reached adult size and bulk and its meat is still fully tender, is sometimes labelled as a duckling."
     },
     {
-      "self_ref": "#/texts/205",
+      "self_ref": "#/texts/219",
       "parent": {
-        "$ref": "#/texts/200"
+        "$ref": "#/texts/214"
       },
       "children": [],
-      "label": "paragraph",
+      "content_layer": "body",
+      "label": "text",
       "prov": [],
       "orig": "A male is called a drake and the female is called a duck, or in ornithology a hen.[3][4]",
       "text": "A male is called a drake and the female is called a duck, or in ornithology a hen.[3][4]"
     },
-    {
-      "self_ref": "#/texts/206",
-      "parent": {
-        "$ref": "#/body"
-      },
-      "children": [],
-      "label": "caption",
-      "prov": [],
-      "orig": "Male mallard.",
-      "text": "Male mallard."
-    },
-    {
-      "self_ref": "#/texts/207",
-      "parent": {
-        "$ref": "#/body"
-      },
-      "children": [],
-      "label": "caption",
-      "prov": [],
-      "orig": "Wood ducks.",
-      "text": "Wood ducks."
-    },
-    {
-      "self_ref": "#/texts/208",
-      "parent": {
-        "$ref": "#/texts/39"
-      },
-      "children": [
-        {
-          "$ref": "#/texts/209"
-        },
-        {
-          "$ref": "#/pictures/7"
-        },
-        {
-          "$ref": "#/texts/211"
-        },
-        {
-          "$ref": "#/texts/212"
-        }
-      ],
-      "label": "section_header",
-      "prov": [],
-      "orig": "Taxonomy",
-      "text": "Taxonomy",
-      "level": 2
-    },
-    {
-      "self_ref": "#/texts/209",
-      "parent": {
-        "$ref": "#/texts/208"
-      },
-      "children": [],
-      "label": "paragraph",
-      "prov": [],
-      "orig": "All ducks belong to the biological order Anseriformes, a group that contains the ducks, geese and swans, as well as the screamers, and the magpie goose.[5] All except the screamers belong to the biological family Anatidae.[5] Within the family, ducks are split into a variety of subfamilies and 'tribes'. The number and composition of these subfamilies and tribes is the cause of considerable disagreement among taxonomists.[5] Some base their decisions on morphological characteristics, others on shared behaviours or genetic studies.[6][7] The number of suggested subfamilies containing ducks ranges from two to five.[8][9] The significant level of hybridisation that occurs among wild ducks complicates efforts to tease apart the relationships between various species.[9]",
-      "text": "All ducks belong to the biological order Anseriformes, a group that contains the ducks, geese and swans, as well as the screamers, and the magpie goose.[5] All except the screamers belong to the biological family Anatidae.[5] Within the family, ducks are split into a variety of subfamilies and 'tribes'. The number and composition of these subfamilies and tribes is the cause of considerable disagreement among taxonomists.[5] Some base their decisions on morphological characteristics, others on shared behaviours or genetic studies.[6][7] The number of suggested subfamilies containing ducks ranges from two to five.[8][9] The significant level of hybridisation that occurs among wild ducks complicates efforts to tease apart the relationships between various species.[9]"
-    },
-    {
-      "self_ref": "#/texts/210",
-      "parent": {
-        "$ref": "#/body"
-      },
-      "children": [],
-      "label": "caption",
-      "prov": [],
-      "orig": "Mallard landing in approach",
-      "text": "Mallard landing in approach"
-    },
-    {
-      "self_ref": "#/texts/211",
-      "parent": {
-        "$ref": "#/texts/208"
-      },
-      "children": [],
-      "label": "paragraph",
-      "prov": [],
-      "orig": "In most modern classifications, the so-called 'true ducks' belong to the subfamily Anatinae, which is further split into a varying number of tribes.[10] The largest of these, the Anatini, contains the 'dabbling' or 'river' ducks \u2013 named for their method of feeding primarily at the surface of fresh water.[11] The 'diving ducks', also named for their primary feeding method, make up the tribe Aythyini.[12] The 'sea ducks' of the tribe Mergini are diving ducks which specialise on fish and shellfish and spend a majority of their lives in saltwater.[13] The tribe Oxyurini contains the 'stifftails', diving ducks notable for their small size and stiff, upright tails.[14]",
-      "text": "In most modern classifications, the so-called 'true ducks' belong to the subfamily Anatinae, which is further split into a varying number of tribes.[10] The largest of these, the Anatini, contains the 'dabbling' or 'river' ducks \u2013 named for their method of feeding primarily at the surface of fresh water.[11] The 'diving ducks', also named for their primary feeding method, make up the tribe Aythyini.[12] The 'sea ducks' of the tribe Mergini are diving ducks which specialise on fish and shellfish and spend a majority of their lives in saltwater.[13] The tribe Oxyurini contains the 'stifftails', diving ducks notable for their small size and stiff, upright tails.[14]"
-    },
-    {
-      "self_ref": "#/texts/212",
-      "parent": {
-        "$ref": "#/texts/208"
-      },
-      "children": [],
-      "label": "paragraph",
-      "prov": [],
-      "orig": "A number of other species called ducks are not considered to be 'true ducks', and are typically placed in other subfamilies or tribes. The whistling ducks are assigned either to a tribe (Dendrocygnini) in the subfamily Anatinae or the subfamily Anserinae,[15] or to their own subfamily (Dendrocygninae) or family (Dendrocyganidae).[9][16] The freckled duck of Australia is either the sole member of the tribe Stictonettini in the subfamily Anserinae,[15] or in its own family, the Stictonettinae.[9] The shelducks make up the tribe Tadornini in the family Anserinae in some classifications,[15] and their own subfamily, Tadorninae, in others,[17] while the steamer ducks are either placed in the family Anserinae in the tribe Tachyerini[15] or lumped with the shelducks in the tribe Tadorini.[9] The perching ducks make up in the tribe Cairinini in the subfamily Anserinae in some classifications, while that tribe is eliminated in other classifications and its members assigned to the tribe Anatini.[9] The torrent duck is generally included in the subfamily Anserinae in the monotypic tribe Merganettini,[15] but is sometimes included in the tribe Tadornini.[18] The pink-eared duck is sometimes included as a true duck either in the tribe Anatini[15] or the tribe Malacorhynchini,[19] and other times is included with the shelducks in the tribe Tadornini.[15]",
-      "text": "A number of other species called ducks are not considered to be 'true ducks', and are typically placed in other subfamilies or tribes. The whistling ducks are assigned either to a tribe (Dendrocygnini) in the subfamily Anatinae or the subfamily Anserinae,[15] or to their own subfamily (Dendrocygninae) or family (Dendrocyganidae).[9][16] The freckled duck of Australia is either the sole member of the tribe Stictonettini in the subfamily Anserinae,[15] or in its own family, the Stictonettinae.[9] The shelducks make up the tribe Tadornini in the family Anserinae in some classifications,[15] and their own subfamily, Tadorninae, in others,[17] while the steamer ducks are either placed in the family Anserinae in the tribe Tachyerini[15] or lumped with the shelducks in the tribe Tadorini.[9] The perching ducks make up in the tribe Cairinini in the subfamily Anserinae in some classifications, while that tribe is eliminated in other classifications and its members assigned to the tribe Anatini.[9] The torrent duck is generally included in the subfamily Anserinae in the monotypic tribe Merganettini,[15] but is sometimes included in the tribe Tadornini.[18] The pink-eared duck is sometimes included as a true duck either in the tribe Anatini[15] or the tribe Malacorhynchini,[19] and other times is included with the shelducks in the tribe Tadornini.[15]"
-    },
-    {
-      "self_ref": "#/texts/213",
-      "parent": {
-        "$ref": "#/texts/39"
-      },
-      "children": [
-        {
-          "$ref": "#/pictures/8"
-        },
-        {
-          "$ref": "#/texts/215"
-        },
-        {
-          "$ref": "#/texts/216"
-        }
-      ],
-      "label": "section_header",
-      "prov": [],
-      "orig": "Morphology",
-      "text": "Morphology",
-      "level": 2
-    },
-    {
-      "self_ref": "#/texts/214",
-      "parent": {
-        "$ref": "#/body"
-      },
-      "children": [],
-      "label": "caption",
-      "prov": [],
-      "orig": "Male Mandarin duck",
-      "text": "Male Mandarin duck"
-    },
-    {
-      "self_ref": "#/texts/215",
-      "parent": {
-        "$ref": "#/texts/213"
-      },
-      "children": [],
-      "label": "paragraph",
-      "prov": [],
-      "orig": "The overall body plan of ducks is elongated and broad, and they are also relatively long-necked, albeit not as long-necked as the geese and swans. The body shape of diving ducks varies somewhat from this in being more rounded. The bill is usually broad and contains serrated pectens, which are particularly well defined in the filter-feeding species. In the case of some fishing species the bill is long and strongly serrated. The scaled legs are strong and well developed, and generally set far back on the body, more so in the highly aquatic species. The wings are very strong and are generally short and pointed, and the flight of ducks requires fast continuous strokes, requiring in turn strong wing muscles. Three species of steamer duck are almost flightless, however. Many species of duck are temporarily flightless while moulting; they seek out protected habitat with good food supplies during this period. This moult typically precedes migration.",
-      "text": "The overall body plan of ducks is elongated and broad, and they are also relatively long-necked, albeit not as long-necked as the geese and swans. The body shape of diving ducks varies somewhat from this in being more rounded. The bill is usually broad and contains serrated pectens, which are particularly well defined in the filter-feeding species. In the case of some fishing species the bill is long and strongly serrated. The scaled legs are strong and well developed, and generally set far back on the body, more so in the highly aquatic species. The wings are very strong and are generally short and pointed, and the flight of ducks requires fast continuous strokes, requiring in turn strong wing muscles. Three species of steamer duck are almost flightless, however. Many species of duck are temporarily flightless while moulting; they seek out protected habitat with good food supplies during this period. This moult typically precedes migration."
-    },
-    {
-      "self_ref": "#/texts/216",
-      "parent": {
-        "$ref": "#/texts/213"
-      },
-      "children": [],
-      "label": "paragraph",
-      "prov": [],
-      "orig": "The drakes of northern species often have extravagant plumage, but that is moulted in summer to give a more female-like appearance, the \"eclipse\" plumage. Southern resident species typically show less sexual dimorphism, although there are exceptions such as the paradise shelduck of New Zealand, which is both strikingly sexually dimorphic and in which the female's plumage is brighter than that of the male. The plumage of juvenile birds generally resembles that of the female. Female ducks have evolved to have a corkscrew shaped vagina to prevent rape.",
-      "text": "The drakes of northern species often have extravagant plumage, but that is moulted in summer to give a more female-like appearance, the \"eclipse\" plumage. Southern resident species typically show less sexual dimorphism, although there are exceptions such as the paradise shelduck of New Zealand, which is both strikingly sexually dimorphic and in which the female's plumage is brighter than that of the male. The plumage of juvenile birds generally resembles that of the female. Female ducks have evolved to have a corkscrew shaped vagina to prevent rape."
-    },
-    {
-      "self_ref": "#/texts/217",
-      "parent": {
-        "$ref": "#/texts/39"
-      },
-      "children": [
-        {
-          "$ref": "#/pictures/9"
-        },
-        {
-          "$ref": "#/texts/219"
-        },
-        {
-          "$ref": "#/pictures/10"
-        },
-        {
-          "$ref": "#/texts/221"
-        }
-      ],
-      "label": "section_header",
-      "prov": [],
-      "orig": "Distribution and habitat",
-      "text": "Distribution and habitat",
-      "level": 2
-    },
-    {
-      "self_ref": "#/texts/218",
-      "parent": {
-        "$ref": "#/body"
-      },
-      "children": [],
-      "label": "caption",
-      "prov": [],
-      "orig": "Flying steamer ducks in Ushuaia, Argentina",
-      "text": "Flying steamer ducks in Ushuaia, Argentina"
-    },
-    {
-      "self_ref": "#/texts/219",
-      "parent": {
-        "$ref": "#/texts/217"
-      },
-      "children": [],
-      "label": "paragraph",
-      "prov": [],
-      "orig": "Ducks have a cosmopolitan distribution, and are found on every continent except Antarctica.[5] Several species manage to live on subantarctic islands, including South Georgia and the Auckland Islands.[20] Ducks have reached a number of isolated oceanic islands, including the Hawaiian Islands, Micronesia and the Gal\u00e1pagos Islands, where they are often vagrants and less often residents.[21][22] A handful are endemic to such far-flung islands.[21]",
-      "text": "Ducks have a cosmopolitan distribution, and are found on every continent except Antarctica.[5] Several species manage to live on subantarctic islands, including South Georgia and the Auckland Islands.[20] Ducks have reached a number of isolated oceanic islands, including the Hawaiian Islands, Micronesia and the Gal\u00e1pagos Islands, where they are often vagrants and less often residents.[21][22] A handful are endemic to such far-flung islands.[21]"
-    },
     {
       "self_ref": "#/texts/220",
       "parent": {
         "$ref": "#/body"
       },
       "children": [],
+      "content_layer": "body",
       "label": "caption",
       "prov": [],
-      "orig": "Female mallard in Cornwall, England",
-      "text": "Female mallard in Cornwall, England"
+      "orig": "Male mallard.",
+      "text": "Male mallard."
     },
     {
       "self_ref": "#/texts/221",
       "parent": {
-        "$ref": "#/texts/217"
+        "$ref": "#/body"
       },
       "children": [],
-      "label": "paragraph",
+      "content_layer": "body",
+      "label": "caption",
       "prov": [],
-      "orig": "Some duck species, mainly those breeding in the temperate and Arctic Northern Hemisphere, are migratory; those in the tropics are generally not. Some ducks, particularly in Australia where rainfall is erratic, are nomadic, seeking out the temporary lakes and pools that form after localised heavy rain.[23]",
-      "text": "Some duck species, mainly those breeding in the temperate and Arctic Northern Hemisphere, are migratory; those in the tropics are generally not. Some ducks, particularly in Australia where rainfall is erratic, are nomadic, seeking out the temporary lakes and pools that form after localised heavy rain.[23]"
+      "orig": "Wood ducks.",
+      "text": "Wood ducks."
     },
     {
       "self_ref": "#/texts/222",
       "parent": {
-        "$ref": "#/texts/39"
+        "$ref": "#/texts/43"
       },
       "children": [
         {
           "$ref": "#/texts/223"
         },
         {
-          "$ref": "#/texts/232"
+          "$ref": "#/pictures/7"
         },
         {
-          "$ref": "#/texts/235"
+          "$ref": "#/texts/225"
         },
         {
-          "$ref": "#/texts/238"
+          "$ref": "#/texts/226"
         }
       ],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
-      "orig": "Behaviour",
-      "text": "Behaviour",
+      "orig": "Taxonomy",
+      "text": "Taxonomy",
       "level": 2
     },
     {
@@ -4635,37 +4902,12 @@
       "parent": {
         "$ref": "#/texts/222"
       },
-      "children": [
-        {
-          "$ref": "#/pictures/11"
-        },
-        {
-          "$ref": "#/pictures/12"
-        },
-        {
-          "$ref": "#/texts/226"
-        },
-        {
-          "$ref": "#/texts/227"
-        },
-        {
-          "$ref": "#/texts/228"
-        },
-        {
-          "$ref": "#/texts/229"
-        },
-        {
-          "$ref": "#/texts/230"
-        },
-        {
-          "$ref": "#/texts/231"
-        }
-      ],
-      "label": "section_header",
+      "children": [],
+      "content_layer": "body",
+      "label": "text",
       "prov": [],
-      "orig": "Feeding",
-      "text": "Feeding",
-      "level": 3
+      "orig": "All ducks belong to the biological order Anseriformes, a group that contains the ducks, geese and swans, as well as the screamers, and the magpie goose.[5] All except the screamers belong to the biological family Anatidae.[5] Within the family, ducks are split into a variety of subfamilies and 'tribes'. The number and composition of these subfamilies and tribes is the cause of considerable disagreement among taxonomists.[5] Some base their decisions on morphological characteristics, others on shared behaviours or genetic studies.[6][7] The number of suggested subfamilies containing ducks ranges from two to five.[8][9] The significant level of hybridisation that occurs among wild ducks complicates efforts to tease apart the relationships between various species.[9]",
+      "text": "All ducks belong to the biological order Anseriformes, a group that contains the ducks, geese and swans, as well as the screamers, and the magpie goose.[5] All except the screamers belong to the biological family Anatidae.[5] Within the family, ducks are split into a variety of subfamilies and 'tribes'. The number and composition of these subfamilies and tribes is the cause of considerable disagreement among taxonomists.[5] Some base their decisions on morphological characteristics, others on shared behaviours or genetic studies.[6][7] The number of suggested subfamilies containing ducks ranges from two to five.[8][9] The significant level of hybridisation that occurs among wild ducks complicates efforts to tease apart the relationships between various species.[9]"
     },
     {
       "self_ref": "#/texts/224",
@@ -4673,233 +4915,177 @@
         "$ref": "#/body"
       },
       "children": [],
+      "content_layer": "body",
       "label": "caption",
       "prov": [],
-      "orig": "Pecten along the bill",
-      "text": "Pecten along the bill"
+      "orig": "Mallard landing in approach",
+      "text": "Mallard landing in approach"
     },
     {
       "self_ref": "#/texts/225",
       "parent": {
-        "$ref": "#/body"
+        "$ref": "#/texts/222"
       },
       "children": [],
-      "label": "caption",
+      "content_layer": "body",
+      "label": "text",
       "prov": [],
-      "orig": "Mallard duckling preening",
-      "text": "Mallard duckling preening"
+      "orig": "In most modern classifications, the so-called 'true ducks' belong to the subfamily Anatinae, which is further split into a varying number of tribes.[10] The largest of these, the Anatini, contains the 'dabbling' or 'river' ducks \u2013 named for their method of feeding primarily at the surface of fresh water.[11] The 'diving ducks', also named for their primary feeding method, make up the tribe Aythyini.[12] The 'sea ducks' of the tribe Mergini are diving ducks which specialise on fish and shellfish and spend a majority of their lives in saltwater.[13] The tribe Oxyurini contains the 'stifftails', diving ducks notable for their small size and stiff, upright tails.[14]",
+      "text": "In most modern classifications, the so-called 'true ducks' belong to the subfamily Anatinae, which is further split into a varying number of tribes.[10] The largest of these, the Anatini, contains the 'dabbling' or 'river' ducks \u2013 named for their method of feeding primarily at the surface of fresh water.[11] The 'diving ducks', also named for their primary feeding method, make up the tribe Aythyini.[12] The 'sea ducks' of the tribe Mergini are diving ducks which specialise on fish and shellfish and spend a majority of their lives in saltwater.[13] The tribe Oxyurini contains the 'stifftails', diving ducks notable for their small size and stiff, upright tails.[14]"
     },
     {
       "self_ref": "#/texts/226",
       "parent": {
-        "$ref": "#/texts/223"
+        "$ref": "#/texts/222"
       },
       "children": [],
-      "label": "paragraph",
+      "content_layer": "body",
+      "label": "text",
       "prov": [],
-      "orig": "Ducks eat food sources such as grasses, aquatic plants, fish, insects, small amphibians, worms, and small molluscs.",
-      "text": "Ducks eat food sources such as grasses, aquatic plants, fish, insects, small amphibians, worms, and small molluscs."
+      "orig": "A number of other species called ducks are not considered to be 'true ducks', and are typically placed in other subfamilies or tribes. The whistling ducks are assigned either to a tribe (Dendrocygnini) in the subfamily Anatinae or the subfamily Anserinae,[15] or to their own subfamily (Dendrocygninae) or family (Dendrocyganidae).[9][16] The freckled duck of Australia is either the sole member of the tribe Stictonettini in the subfamily Anserinae,[15] or in its own family, the Stictonettinae.[9] The shelducks make up the tribe Tadornini in the family Anserinae in some classifications,[15] and their own subfamily, Tadorninae, in others,[17] while the steamer ducks are either placed in the family Anserinae in the tribe Tachyerini[15] or lumped with the shelducks in the tribe Tadorini.[9] The perching ducks make up in the tribe Cairinini in the subfamily Anserinae in some classifications, while that tribe is eliminated in other classifications and its members assigned to the tribe Anatini.[9] The torrent duck is generally included in the subfamily Anserinae in the monotypic tribe Merganettini,[15] but is sometimes included in the tribe Tadornini.[18] The pink-eared duck is sometimes included as a true duck either in the tribe Anatini[15] or the tribe Malacorhynchini,[19] and other times is included with the shelducks in the tribe Tadornini.[15]",
+      "text": "A number of other species called ducks are not considered to be 'true ducks', and are typically placed in other subfamilies or tribes. The whistling ducks are assigned either to a tribe (Dendrocygnini) in the subfamily Anatinae or the subfamily Anserinae,[15] or to their own subfamily (Dendrocygninae) or family (Dendrocyganidae).[9][16] The freckled duck of Australia is either the sole member of the tribe Stictonettini in the subfamily Anserinae,[15] or in its own family, the Stictonettinae.[9] The shelducks make up the tribe Tadornini in the family Anserinae in some classifications,[15] and their own subfamily, Tadorninae, in others,[17] while the steamer ducks are either placed in the family Anserinae in the tribe Tachyerini[15] or lumped with the shelducks in the tribe Tadorini.[9] The perching ducks make up in the tribe Cairinini in the subfamily Anserinae in some classifications, while that tribe is eliminated in other classifications and its members assigned to the tribe Anatini.[9] The torrent duck is generally included in the subfamily Anserinae in the monotypic tribe Merganettini,[15] but is sometimes included in the tribe Tadornini.[18] The pink-eared duck is sometimes included as a true duck either in the tribe Anatini[15] or the tribe Malacorhynchini,[19] and other times is included with the shelducks in the tribe Tadornini.[15]"
     },
     {
       "self_ref": "#/texts/227",
       "parent": {
-        "$ref": "#/texts/223"
+        "$ref": "#/texts/43"
       },
-      "children": [],
-      "label": "paragraph",
+      "children": [
+        {
+          "$ref": "#/pictures/8"
+        },
+        {
+          "$ref": "#/texts/229"
+        },
+        {
+          "$ref": "#/texts/230"
+        }
+      ],
+      "content_layer": "body",
+      "label": "section_header",
       "prov": [],
-      "orig": "Dabbling ducks feed on the surface of water or on land, or as deep as they can reach by up-ending without completely submerging.[24] Along the edge of the bill, there is a comb-like structure called a pecten. This strains the water squirting from the side of the bill and traps any food. The pecten is also used to preen feathers and to hold slippery food items.",
-      "text": "Dabbling ducks feed on the surface of water or on land, or as deep as they can reach by up-ending without completely submerging.[24] Along the edge of the bill, there is a comb-like structure called a pecten. This strains the water squirting from the side of the bill and traps any food. The pecten is also used to preen feathers and to hold slippery food items."
+      "orig": "Morphology",
+      "text": "Morphology",
+      "level": 2
     },
     {
       "self_ref": "#/texts/228",
       "parent": {
-        "$ref": "#/texts/223"
+        "$ref": "#/body"
       },
       "children": [],
-      "label": "paragraph",
+      "content_layer": "body",
+      "label": "caption",
       "prov": [],
-      "orig": "Diving ducks and sea ducks forage deep underwater. To be able to submerge more easily, the diving ducks are heavier than dabbling ducks, and therefore have more difficulty taking off to fly.",
-      "text": "Diving ducks and sea ducks forage deep underwater. To be able to submerge more easily, the diving ducks are heavier than dabbling ducks, and therefore have more difficulty taking off to fly."
+      "orig": "Male Mandarin duck",
+      "text": "Male Mandarin duck"
     },
     {
       "self_ref": "#/texts/229",
       "parent": {
-        "$ref": "#/texts/223"
+        "$ref": "#/texts/227"
       },
       "children": [],
-      "label": "paragraph",
+      "content_layer": "body",
+      "label": "text",
       "prov": [],
-      "orig": "A few specialized species such as the mergansers are adapted to catch and swallow large fish.",
-      "text": "A few specialized species such as the mergansers are adapted to catch and swallow large fish."
+      "orig": "The overall body plan of ducks is elongated and broad, and they are also relatively long-necked, albeit not as long-necked as the geese and swans. The body shape of diving ducks varies somewhat from this in being more rounded. The bill is usually broad and contains serrated pectens, which are particularly well defined in the filter-feeding species. In the case of some fishing species the bill is long and strongly serrated. The scaled legs are strong and well developed, and generally set far back on the body, more so in the highly aquatic species. The wings are very strong and are generally short and pointed, and the flight of ducks requires fast continuous strokes, requiring in turn strong wing muscles. Three species of steamer duck are almost flightless, however. Many species of duck are temporarily flightless while moulting; they seek out protected habitat with good food supplies during this period. This moult typically precedes migration.",
+      "text": "The overall body plan of ducks is elongated and broad, and they are also relatively long-necked, albeit not as long-necked as the geese and swans. The body shape of diving ducks varies somewhat from this in being more rounded. The bill is usually broad and contains serrated pectens, which are particularly well defined in the filter-feeding species. In the case of some fishing species the bill is long and strongly serrated. The scaled legs are strong and well developed, and generally set far back on the body, more so in the highly aquatic species. The wings are very strong and are generally short and pointed, and the flight of ducks requires fast continuous strokes, requiring in turn strong wing muscles. Three species of steamer duck are almost flightless, however. Many species of duck are temporarily flightless while moulting; they seek out protected habitat with good food supplies during this period. This moult typically precedes migration."
     },
     {
       "self_ref": "#/texts/230",
       "parent": {
-        "$ref": "#/texts/223"
+        "$ref": "#/texts/227"
       },
       "children": [],
-      "label": "paragraph",
+      "content_layer": "body",
+      "label": "text",
       "prov": [],
-      "orig": "The others have the characteristic wide flat bill adapted to dredging-type jobs such as pulling up waterweed, pulling worms and small molluscs out of mud, searching for insect larvae, and bulk jobs such as dredging out, holding, turning head first, and swallowing a squirming frog. To avoid injury when digging into sediment it has no cere, but the nostrils come out through hard horn.",
-      "text": "The others have the characteristic wide flat bill adapted to dredging-type jobs such as pulling up waterweed, pulling worms and small molluscs out of mud, searching for insect larvae, and bulk jobs such as dredging out, holding, turning head first, and swallowing a squirming frog. To avoid injury when digging into sediment it has no cere, but the nostrils come out through hard horn."
+      "orig": "The drakes of northern species often have extravagant plumage, but that is moulted in summer to give a more female-like appearance, the \"eclipse\" plumage. Southern resident species typically show less sexual dimorphism, although there are exceptions such as the paradise shelduck of New Zealand, which is both strikingly sexually dimorphic and in which the female's plumage is brighter than that of the male. The plumage of juvenile birds generally resembles that of the female. Female ducks have evolved to have a corkscrew shaped vagina to prevent rape.",
+      "text": "The drakes of northern species often have extravagant plumage, but that is moulted in summer to give a more female-like appearance, the \"eclipse\" plumage. Southern resident species typically show less sexual dimorphism, although there are exceptions such as the paradise shelduck of New Zealand, which is both strikingly sexually dimorphic and in which the female's plumage is brighter than that of the male. The plumage of juvenile birds generally resembles that of the female. Female ducks have evolved to have a corkscrew shaped vagina to prevent rape."
     },
     {
       "self_ref": "#/texts/231",
       "parent": {
-        "$ref": "#/texts/223"
+        "$ref": "#/texts/43"
       },
-      "children": [],
-      "label": "paragraph",
+      "children": [
+        {
+          "$ref": "#/pictures/9"
+        },
+        {
+          "$ref": "#/texts/233"
+        },
+        {
+          "$ref": "#/pictures/10"
+        },
+        {
+          "$ref": "#/texts/235"
+        }
+      ],
+      "content_layer": "body",
+      "label": "section_header",
       "prov": [],
-      "orig": "The Guardian published an article advising that ducks should not be fed with bread because it damages the health of the ducks and pollutes waterways.[25]",
-      "text": "The Guardian published an article advising that ducks should not be fed with bread because it damages the health of the ducks and pollutes waterways.[25]"
+      "orig": "Distribution and habitat",
+      "text": "Distribution and habitat",
+      "level": 2
     },
     {
       "self_ref": "#/texts/232",
       "parent": {
-        "$ref": "#/texts/222"
+        "$ref": "#/body"
       },
-      "children": [
-        {
-          "$ref": "#/pictures/13"
-        },
-        {
-          "$ref": "#/texts/234"
-        }
-      ],
-      "label": "section_header",
+      "children": [],
+      "content_layer": "body",
+      "label": "caption",
       "prov": [],
-      "orig": "Breeding",
-      "text": "Breeding",
-      "level": 3
+      "orig": "Flying steamer ducks in Ushuaia, Argentina",
+      "text": "Flying steamer ducks in Ushuaia, Argentina"
     },
     {
       "self_ref": "#/texts/233",
       "parent": {
-        "$ref": "#/body"
+        "$ref": "#/texts/231"
       },
       "children": [],
-      "label": "caption",
+      "content_layer": "body",
+      "label": "text",
       "prov": [],
-      "orig": "A Muscovy duckling",
-      "text": "A Muscovy duckling"
+      "orig": "Ducks have a cosmopolitan distribution, and are found on every continent except Antarctica.[5] Several species manage to live on subantarctic islands, including South Georgia and the Auckland Islands.[20] Ducks have reached a number of isolated oceanic islands, including the Hawaiian Islands, Micronesia and the Gal\u00e1pagos Islands, where they are often vagrants and less often residents.[21][22] A handful are endemic to such far-flung islands.[21]",
+      "text": "Ducks have a cosmopolitan distribution, and are found on every continent except Antarctica.[5] Several species manage to live on subantarctic islands, including South Georgia and the Auckland Islands.[20] Ducks have reached a number of isolated oceanic islands, including the Hawaiian Islands, Micronesia and the Gal\u00e1pagos Islands, where they are often vagrants and less often residents.[21][22] A handful are endemic to such far-flung islands.[21]"
     },
     {
       "self_ref": "#/texts/234",
       "parent": {
-        "$ref": "#/texts/232"
+        "$ref": "#/body"
       },
       "children": [],
-      "label": "paragraph",
+      "content_layer": "body",
+      "label": "caption",
       "prov": [],
-      "orig": "Ducks generally only have one partner at a time, although the partnership usually only lasts one year.[26] Larger species and the more sedentary species (like fast-river specialists) tend to have pair-bonds that last numerous years.[27] Most duck species breed once a year, choosing to do so in favourable conditions (spring/summer or wet seasons). Ducks also tend to make a nest before breeding, and, after hatching, lead their ducklings to water. Mother ducks are very caring and protective of their young, but may abandon some of their ducklings if they are physically stuck in an area they cannot get out of (such as nesting in an enclosed courtyard) or are not prospering due to genetic defects or sickness brought about by hypothermia, starvation, or disease. Ducklings can also be orphaned by inconsistent late hatching where a few eggs hatch after the mother has abandoned the nest and led her ducklings to water.[28]",
-      "text": "Ducks generally only have one partner at a time, although the partnership usually only lasts one year.[26] Larger species and the more sedentary species (like fast-river specialists) tend to have pair-bonds that last numerous years.[27] Most duck species breed once a year, choosing to do so in favourable conditions (spring/summer or wet seasons). Ducks also tend to make a nest before breeding, and, after hatching, lead their ducklings to water. Mother ducks are very caring and protective of their young, but may abandon some of their ducklings if they are physically stuck in an area they cannot get out of (such as nesting in an enclosed courtyard) or are not prospering due to genetic defects or sickness brought about by hypothermia, starvation, or disease. Ducklings can also be orphaned by inconsistent late hatching where a few eggs hatch after the mother has abandoned the nest and led her ducklings to water.[28]"
+      "orig": "Female mallard in Cornwall, England",
+      "text": "Female mallard in Cornwall, England"
     },
     {
       "self_ref": "#/texts/235",
       "parent": {
-        "$ref": "#/texts/222"
+        "$ref": "#/texts/231"
       },
-      "children": [
-        {
-          "$ref": "#/texts/236"
-        },
-        {
-          "$ref": "#/texts/237"
-        }
-      ],
-      "label": "section_header",
+      "children": [],
+      "content_layer": "body",
+      "label": "text",
       "prov": [],
-      "orig": "Communication",
-      "text": "Communication",
-      "level": 3
+      "orig": "Some duck species, mainly those breeding in the temperate and Arctic Northern Hemisphere, are migratory; those in the tropics are generally not. Some ducks, particularly in Australia where rainfall is erratic, are nomadic, seeking out the temporary lakes and pools that form after localised heavy rain.[23]",
+      "text": "Some duck species, mainly those breeding in the temperate and Arctic Northern Hemisphere, are migratory; those in the tropics are generally not. Some ducks, particularly in Australia where rainfall is erratic, are nomadic, seeking out the temporary lakes and pools that form after localised heavy rain.[23]"
     },
     {
       "self_ref": "#/texts/236",
       "parent": {
-        "$ref": "#/texts/235"
-      },
-      "children": [],
-      "label": "paragraph",
-      "prov": [],
-      "orig": "Female mallard ducks (as well as several other species in the genus Anas, such as the American and Pacific black ducks, spot-billed duck, northern pintail and common teal) make the classic \"quack\" sound while males make a similar but raspier sound that is sometimes written as \"breeeeze\",[29][self-published source?] but, despite widespread misconceptions, most species of duck do not \"quack\".[30] In general, ducks make a range of calls, including whistles, cooing, yodels and grunts. For example, the scaup \u2013 which are diving ducks \u2013 make a noise like \"scaup\" (hence their name). Calls may be loud displaying calls or quieter contact calls.",
-      "text": "Female mallard ducks (as well as several other species in the genus Anas, such as the American and Pacific black ducks, spot-billed duck, northern pintail and common teal) make the classic \"quack\" sound while males make a similar but raspier sound that is sometimes written as \"breeeeze\",[29][self-published source?] but, despite widespread misconceptions, most species of duck do not \"quack\".[30] In general, ducks make a range of calls, including whistles, cooing, yodels and grunts. For example, the scaup \u2013 which are diving ducks \u2013 make a noise like \"scaup\" (hence their name). Calls may be loud displaying calls or quieter contact calls."
-    },
-    {
-      "self_ref": "#/texts/237",
-      "parent": {
-        "$ref": "#/texts/235"
-      },
-      "children": [],
-      "label": "paragraph",
-      "prov": [],
-      "orig": "A common urban legend claims that duck quacks do not echo; however, this has been proven to be false. This myth was first debunked by the Acoustics Research Centre at the University of Salford in 2003 as part of the British Association's Festival of Science.[31] It was also debunked in one of the earlier episodes of the popular Discovery Channel television show MythBusters.[32]",
-      "text": "A common urban legend claims that duck quacks do not echo; however, this has been proven to be false. This myth was first debunked by the Acoustics Research Centre at the University of Salford in 2003 as part of the British Association's Festival of Science.[31] It was also debunked in one of the earlier episodes of the popular Discovery Channel television show MythBusters.[32]"
-    },
-    {
-      "self_ref": "#/texts/238",
-      "parent": {
-        "$ref": "#/texts/222"
+        "$ref": "#/texts/43"
       },
       "children": [
         {
-          "$ref": "#/pictures/14"
-        },
-        {
-          "$ref": "#/texts/240"
-        },
-        {
-          "$ref": "#/texts/241"
-        }
-      ],
-      "label": "section_header",
-      "prov": [],
-      "orig": "Predators",
-      "text": "Predators",
-      "level": 3
-    },
-    {
-      "self_ref": "#/texts/239",
-      "parent": {
-        "$ref": "#/body"
-      },
-      "children": [],
-      "label": "caption",
-      "prov": [],
-      "orig": "Ringed teal",
-      "text": "Ringed teal"
-    },
-    {
-      "self_ref": "#/texts/240",
-      "parent": {
-        "$ref": "#/texts/238"
-      },
-      "children": [],
-      "label": "paragraph",
-      "prov": [],
-      "orig": "Ducks have many predators. Ducklings are particularly vulnerable, since their inability to fly makes them easy prey not only for predatory birds but also for large fish like pike, crocodilians, predatory testudines such as the alligator snapping turtle, and other aquatic hunters, including fish-eating birds such as herons. Ducks' nests are raided by land-based predators, and brooding females may be caught unaware on the nest by mammals, such as foxes, or large birds, such as hawks or owls.",
-      "text": "Ducks have many predators. Ducklings are particularly vulnerable, since their inability to fly makes them easy prey not only for predatory birds but also for large fish like pike, crocodilians, predatory testudines such as the alligator snapping turtle, and other aquatic hunters, including fish-eating birds such as herons. Ducks' nests are raided by land-based predators, and brooding females may be caught unaware on the nest by mammals, such as foxes, or large birds, such as hawks or owls."
-    },
-    {
-      "self_ref": "#/texts/241",
-      "parent": {
-        "$ref": "#/texts/238"
-      },
-      "children": [],
-      "label": "paragraph",
-      "prov": [],
-      "orig": "Adult ducks are fast fliers, but may be caught on the water by large aquatic predators including big fish such as the North American muskie and the European pike. In flight, ducks are safe from all but a few predators such as humans and the peregrine falcon, which uses its speed and strength to catch ducks.",
-      "text": "Adult ducks are fast fliers, but may be caught on the water by large aquatic predators including big fish such as the North American muskie and the European pike. In flight, ducks are safe from all but a few predators such as humans and the peregrine falcon, which uses its speed and strength to catch ducks."
-    },
-    {
-      "self_ref": "#/texts/242",
-      "parent": {
-        "$ref": "#/texts/39"
-      },
-      "children": [
-        {
-          "$ref": "#/texts/243"
+          "$ref": "#/texts/237"
         },
         {
           "$ref": "#/texts/246"
@@ -4911,18 +5097,37 @@
           "$ref": "#/texts/252"
         }
       ],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
-      "orig": "Relationship with humans",
-      "text": "Relationship with humans",
+      "orig": "Behaviour",
+      "text": "Behaviour",
       "level": 2
     },
     {
-      "self_ref": "#/texts/243",
+      "self_ref": "#/texts/237",
       "parent": {
-        "$ref": "#/texts/242"
+        "$ref": "#/texts/236"
       },
       "children": [
+        {
+          "$ref": "#/pictures/11"
+        },
+        {
+          "$ref": "#/pictures/12"
+        },
+        {
+          "$ref": "#/texts/240"
+        },
+        {
+          "$ref": "#/texts/241"
+        },
+        {
+          "$ref": "#/texts/242"
+        },
+        {
+          "$ref": "#/texts/243"
+        },
         {
           "$ref": "#/texts/244"
         },
@@ -4930,51 +5135,127 @@
           "$ref": "#/texts/245"
         }
       ],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
-      "orig": "Hunting",
-      "text": "Hunting",
+      "orig": "Feeding",
+      "text": "Feeding",
       "level": 3
     },
+    {
+      "self_ref": "#/texts/238",
+      "parent": {
+        "$ref": "#/body"
+      },
+      "children": [],
+      "content_layer": "body",
+      "label": "caption",
+      "prov": [],
+      "orig": "Pecten along the bill",
+      "text": "Pecten along the bill"
+    },
+    {
+      "self_ref": "#/texts/239",
+      "parent": {
+        "$ref": "#/body"
+      },
+      "children": [],
+      "content_layer": "body",
+      "label": "caption",
+      "prov": [],
+      "orig": "Mallard duckling preening",
+      "text": "Mallard duckling preening"
+    },
+    {
+      "self_ref": "#/texts/240",
+      "parent": {
+        "$ref": "#/texts/237"
+      },
+      "children": [],
+      "content_layer": "body",
+      "label": "text",
+      "prov": [],
+      "orig": "Ducks eat food sources such as grasses, aquatic plants, fish, insects, small amphibians, worms, and small molluscs.",
+      "text": "Ducks eat food sources such as grasses, aquatic plants, fish, insects, small amphibians, worms, and small molluscs."
+    },
+    {
+      "self_ref": "#/texts/241",
+      "parent": {
+        "$ref": "#/texts/237"
+      },
+      "children": [],
+      "content_layer": "body",
+      "label": "text",
+      "prov": [],
+      "orig": "Dabbling ducks feed on the surface of water or on land, or as deep as they can reach by up-ending without completely submerging.[24] Along the edge of the bill, there is a comb-like structure called a pecten. This strains the water squirting from the side of the bill and traps any food. The pecten is also used to preen feathers and to hold slippery food items.",
+      "text": "Dabbling ducks feed on the surface of water or on land, or as deep as they can reach by up-ending without completely submerging.[24] Along the edge of the bill, there is a comb-like structure called a pecten. This strains the water squirting from the side of the bill and traps any food. The pecten is also used to preen feathers and to hold slippery food items."
+    },
+    {
+      "self_ref": "#/texts/242",
+      "parent": {
+        "$ref": "#/texts/237"
+      },
+      "children": [],
+      "content_layer": "body",
+      "label": "text",
+      "prov": [],
+      "orig": "Diving ducks and sea ducks forage deep underwater. To be able to submerge more easily, the diving ducks are heavier than dabbling ducks, and therefore have more difficulty taking off to fly.",
+      "text": "Diving ducks and sea ducks forage deep underwater. To be able to submerge more easily, the diving ducks are heavier than dabbling ducks, and therefore have more difficulty taking off to fly."
+    },
+    {
+      "self_ref": "#/texts/243",
+      "parent": {
+        "$ref": "#/texts/237"
+      },
+      "children": [],
+      "content_layer": "body",
+      "label": "text",
+      "prov": [],
+      "orig": "A few specialized species such as the mergansers are adapted to catch and swallow large fish.",
+      "text": "A few specialized species such as the mergansers are adapted to catch and swallow large fish."
+    },
     {
       "self_ref": "#/texts/244",
       "parent": {
-        "$ref": "#/texts/243"
+        "$ref": "#/texts/237"
       },
       "children": [],
-      "label": "paragraph",
+      "content_layer": "body",
+      "label": "text",
       "prov": [],
-      "orig": "Humans have hunted ducks since prehistoric times. Excavations of middens in California dating to 7800 \u2013 6400 BP have turned up bones of ducks, including at least one now-extinct flightless species.[33] Ducks were captured in \"significant numbers\" by Holocene inhabitants of the lower Ohio River valley, suggesting they took advantage of the seasonal bounty provided by migrating waterfowl.[34] Neolithic hunters in locations as far apart as the Caribbean,[35] Scandinavia,[36] Egypt,[37] Switzerland,[38] and China relied on ducks as a source of protein for some or all of the year.[39] Archeological evidence shows that M\u0101ori people in New Zealand hunted the flightless Finsch's duck, possibly to extinction, though rat predation may also have contributed to its fate.[40] A similar end awaited the Chatham duck, a species with reduced flying capabilities which went extinct shortly after its island was colonised by Polynesian settlers.[41] It is probable that duck eggs were gathered by Neolithic hunter-gathers as well, though hard evidence of this is uncommon.[35][42]",
-      "text": "Humans have hunted ducks since prehistoric times. Excavations of middens in California dating to 7800 \u2013 6400 BP have turned up bones of ducks, including at least one now-extinct flightless species.[33] Ducks were captured in \"significant numbers\" by Holocene inhabitants of the lower Ohio River valley, suggesting they took advantage of the seasonal bounty provided by migrating waterfowl.[34] Neolithic hunters in locations as far apart as the Caribbean,[35] Scandinavia,[36] Egypt,[37] Switzerland,[38] and China relied on ducks as a source of protein for some or all of the year.[39] Archeological evidence shows that M\u0101ori people in New Zealand hunted the flightless Finsch's duck, possibly to extinction, though rat predation may also have contributed to its fate.[40] A similar end awaited the Chatham duck, a species with reduced flying capabilities which went extinct shortly after its island was colonised by Polynesian settlers.[41] It is probable that duck eggs were gathered by Neolithic hunter-gathers as well, though hard evidence of this is uncommon.[35][42]"
+      "orig": "The others have the characteristic wide flat bill adapted to dredging-type jobs such as pulling up waterweed, pulling worms and small molluscs out of mud, searching for insect larvae, and bulk jobs such as dredging out, holding, turning head first, and swallowing a squirming frog. To avoid injury when digging into sediment it has no cere, but the nostrils come out through hard horn.",
+      "text": "The others have the characteristic wide flat bill adapted to dredging-type jobs such as pulling up waterweed, pulling worms and small molluscs out of mud, searching for insect larvae, and bulk jobs such as dredging out, holding, turning head first, and swallowing a squirming frog. To avoid injury when digging into sediment it has no cere, but the nostrils come out through hard horn."
     },
     {
       "self_ref": "#/texts/245",
       "parent": {
-        "$ref": "#/texts/243"
+        "$ref": "#/texts/237"
       },
       "children": [],
-      "label": "paragraph",
+      "content_layer": "body",
+      "label": "text",
       "prov": [],
-      "orig": "In many areas, wild ducks (including ducks farmed and released into the wild) are hunted for food or sport,[43] by shooting, or by being trapped using duck decoys. Because an idle floating duck or a duck squatting on land cannot react to fly or move quickly, \"a sitting duck\" has come to mean \"an easy target\". These ducks may be contaminated by pollutants such as PCBs.[44]",
-      "text": "In many areas, wild ducks (including ducks farmed and released into the wild) are hunted for food or sport,[43] by shooting, or by being trapped using duck decoys. Because an idle floating duck or a duck squatting on land cannot react to fly or move quickly, \"a sitting duck\" has come to mean \"an easy target\". These ducks may be contaminated by pollutants such as PCBs.[44]"
+      "orig": "The Guardian published an article advising that ducks should not be fed with bread because it damages the health of the ducks and pollutes waterways.[25]",
+      "text": "The Guardian published an article advising that ducks should not be fed with bread because it damages the health of the ducks and pollutes waterways.[25]"
     },
     {
       "self_ref": "#/texts/246",
       "parent": {
-        "$ref": "#/texts/242"
+        "$ref": "#/texts/236"
       },
       "children": [
         {
-          "$ref": "#/pictures/15"
+          "$ref": "#/pictures/13"
         },
         {
           "$ref": "#/texts/248"
         }
       ],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
-      "orig": "Domestication",
-      "text": "Domestication",
+      "orig": "Breeding",
+      "text": "Breeding",
       "level": 3
     },
     {
@@ -4983,10 +5264,11 @@
         "$ref": "#/body"
       },
       "children": [],
+      "content_layer": "body",
       "label": "caption",
       "prov": [],
-      "orig": "Indian Runner ducks, a common breed of domestic ducks",
-      "text": "Indian Runner ducks, a common breed of domestic ducks"
+      "orig": "A Muscovy duckling",
+      "text": "A Muscovy duckling"
     },
     {
       "self_ref": "#/texts/248",
@@ -4994,40 +5276,43 @@
         "$ref": "#/texts/246"
       },
       "children": [],
-      "label": "paragraph",
+      "content_layer": "body",
+      "label": "text",
       "prov": [],
-      "orig": "Ducks have many economic uses, being farmed for their meat, eggs, and feathers (particularly their down). Approximately 3 billion ducks are slaughtered each year for meat worldwide.[45] They are also kept and bred by aviculturists and often displayed in zoos. Almost all the varieties of domestic ducks are descended from the mallard (Anas platyrhynchos), apart from the Muscovy duck (Cairina moschata).[46][47] The Call duck is another example of a domestic duck breed. Its name comes from its original use established by hunters, as a decoy to attract wild mallards from the sky, into traps set for them on the ground. The call duck is the world's smallest domestic duck breed, as it weighs less than 1\u00a0kg (2.2\u00a0lb).[48]",
-      "text": "Ducks have many economic uses, being farmed for their meat, eggs, and feathers (particularly their down). Approximately 3 billion ducks are slaughtered each year for meat worldwide.[45] They are also kept and bred by aviculturists and often displayed in zoos. Almost all the varieties of domestic ducks are descended from the mallard (Anas platyrhynchos), apart from the Muscovy duck (Cairina moschata).[46][47] The Call duck is another example of a domestic duck breed. Its name comes from its original use established by hunters, as a decoy to attract wild mallards from the sky, into traps set for them on the ground. The call duck is the world's smallest domestic duck breed, as it weighs less than 1\u00a0kg (2.2\u00a0lb).[48]"
+      "orig": "Ducks generally only have one partner at a time, although the partnership usually only lasts one year.[26] Larger species and the more sedentary species (like fast-river specialists) tend to have pair-bonds that last numerous years.[27] Most duck species breed once a year, choosing to do so in favourable conditions (spring/summer or wet seasons). Ducks also tend to make a nest before breeding, and, after hatching, lead their ducklings to water. Mother ducks are very caring and protective of their young, but may abandon some of their ducklings if they are physically stuck in an area they cannot get out of (such as nesting in an enclosed courtyard) or are not prospering due to genetic defects or sickness brought about by hypothermia, starvation, or disease. Ducklings can also be orphaned by inconsistent late hatching where a few eggs hatch after the mother has abandoned the nest and led her ducklings to water.[28]",
+      "text": "Ducks generally only have one partner at a time, although the partnership usually only lasts one year.[26] Larger species and the more sedentary species (like fast-river specialists) tend to have pair-bonds that last numerous years.[27] Most duck species breed once a year, choosing to do so in favourable conditions (spring/summer or wet seasons). Ducks also tend to make a nest before breeding, and, after hatching, lead their ducklings to water. Mother ducks are very caring and protective of their young, but may abandon some of their ducklings if they are physically stuck in an area they cannot get out of (such as nesting in an enclosed courtyard) or are not prospering due to genetic defects or sickness brought about by hypothermia, starvation, or disease. Ducklings can also be orphaned by inconsistent late hatching where a few eggs hatch after the mother has abandoned the nest and led her ducklings to water.[28]"
     },
     {
       "self_ref": "#/texts/249",
       "parent": {
-        "$ref": "#/texts/242"
+        "$ref": "#/texts/236"
       },
       "children": [
         {
-          "$ref": "#/pictures/16"
+          "$ref": "#/texts/250"
         },
         {
           "$ref": "#/texts/251"
         }
       ],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
-      "orig": "Heraldry",
-      "text": "Heraldry",
+      "orig": "Communication",
+      "text": "Communication",
       "level": 3
     },
     {
       "self_ref": "#/texts/250",
       "parent": {
-        "$ref": "#/body"
+        "$ref": "#/texts/249"
       },
       "children": [],
-      "label": "caption",
+      "content_layer": "body",
+      "label": "text",
       "prov": [],
-      "orig": "Three black-colored ducks in the coat of arms of Maaninka[49]",
-      "text": "Three black-colored ducks in the coat of arms of Maaninka[49]"
+      "orig": "Female mallard ducks (as well as several other species in the genus Anas, such as the American and Pacific black ducks, spot-billed duck, northern pintail and common teal) make the classic \"quack\" sound while males make a similar but raspier sound that is sometimes written as \"breeeeze\",[29][self-published source?] but, despite widespread misconceptions, most species of duck do not \"quack\".[30] In general, ducks make a range of calls, including whistles, cooing, yodels and grunts. For example, the scaup \u2013 which are diving ducks \u2013 make a noise like \"scaup\" (hence their name). Calls may be loud displaying calls or quieter contact calls.",
+      "text": "Female mallard ducks (as well as several other species in the genus Anas, such as the American and Pacific black ducks, spot-billed duck, northern pintail and common teal) make the classic \"quack\" sound while males make a similar but raspier sound that is sometimes written as \"breeeeze\",[29][self-published source?] but, despite widespread misconceptions, most species of duck do not \"quack\".[30] In general, ducks make a range of calls, including whistles, cooing, yodels and grunts. For example, the scaup \u2013 which are diving ducks \u2013 make a noise like \"scaup\" (hence their name). Calls may be loud displaying calls or quieter contact calls."
     },
     {
       "self_ref": "#/texts/251",
@@ -5035,40 +5320,46 @@
         "$ref": "#/texts/249"
       },
       "children": [],
-      "label": "paragraph",
+      "content_layer": "body",
+      "label": "text",
       "prov": [],
-      "orig": "Ducks appear on several coats of arms, including the coat of arms of Lub\u0101na (Latvia)[50] and the coat of arms of F\u00f6gl\u00f6 (\u00c5land).[51]",
-      "text": "Ducks appear on several coats of arms, including the coat of arms of Lub\u0101na (Latvia)[50] and the coat of arms of F\u00f6gl\u00f6 (\u00c5land).[51]"
+      "orig": "A common urban legend claims that duck quacks do not echo; however, this has been proven to be false. This myth was first debunked by the Acoustics Research Centre at the University of Salford in 2003 as part of the British Association's Festival of Science.[31] It was also debunked in one of the earlier episodes of the popular Discovery Channel television show MythBusters.[32]",
+      "text": "A common urban legend claims that duck quacks do not echo; however, this has been proven to be false. This myth was first debunked by the Acoustics Research Centre at the University of Salford in 2003 as part of the British Association's Festival of Science.[31] It was also debunked in one of the earlier episodes of the popular Discovery Channel television show MythBusters.[32]"
     },
     {
       "self_ref": "#/texts/252",
       "parent": {
-        "$ref": "#/texts/242"
+        "$ref": "#/texts/236"
       },
       "children": [
         {
-          "$ref": "#/texts/253"
+          "$ref": "#/pictures/14"
         },
         {
           "$ref": "#/texts/254"
+        },
+        {
+          "$ref": "#/texts/255"
         }
       ],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
-      "orig": "Cultural references",
-      "text": "Cultural references",
+      "orig": "Predators",
+      "text": "Predators",
       "level": 3
     },
     {
       "self_ref": "#/texts/253",
       "parent": {
-        "$ref": "#/texts/252"
+        "$ref": "#/body"
       },
       "children": [],
-      "label": "paragraph",
+      "content_layer": "body",
+      "label": "caption",
       "prov": [],
-      "orig": "In 2002, psychologist Richard Wiseman and colleagues at the University of Hertfordshire, UK, finished a year-long LaughLab experiment, concluding that of all animals, ducks attract the most humor and silliness; he said, \"If you're going to tell a joke involving an animal, make it a duck.\"[52] The word \"duck\" may have become an inherently funny word in many languages, possibly because ducks are seen as silly in their looks or behavior. Of the many ducks in fiction, many are cartoon characters, such as Walt Disney's Donald Duck, and Warner Bros.' Daffy Duck. Howard the Duck started as a comic book character in 1973[53][54] and was made into a movie in 1986.",
-      "text": "In 2002, psychologist Richard Wiseman and colleagues at the University of Hertfordshire, UK, finished a year-long LaughLab experiment, concluding that of all animals, ducks attract the most humor and silliness; he said, \"If you're going to tell a joke involving an animal, make it a duck.\"[52] The word \"duck\" may have become an inherently funny word in many languages, possibly because ducks are seen as silly in their looks or behavior. Of the many ducks in fiction, many are cartoon characters, such as Walt Disney's Donald Duck, and Warner Bros.' Daffy Duck. Howard the Duck started as a comic book character in 1973[53][54] and was made into a movie in 1986."
+      "orig": "Ringed teal",
+      "text": "Ringed teal"
     },
     {
       "self_ref": "#/texts/254",
@@ -5076,15 +5367,230 @@
         "$ref": "#/texts/252"
       },
       "children": [],
-      "label": "paragraph",
+      "content_layer": "body",
+      "label": "text",
+      "prov": [],
+      "orig": "Ducks have many predators. Ducklings are particularly vulnerable, since their inability to fly makes them easy prey not only for predatory birds but also for large fish like pike, crocodilians, predatory testudines such as the alligator snapping turtle, and other aquatic hunters, including fish-eating birds such as herons. Ducks' nests are raided by land-based predators, and brooding females may be caught unaware on the nest by mammals, such as foxes, or large birds, such as hawks or owls.",
+      "text": "Ducks have many predators. Ducklings are particularly vulnerable, since their inability to fly makes them easy prey not only for predatory birds but also for large fish like pike, crocodilians, predatory testudines such as the alligator snapping turtle, and other aquatic hunters, including fish-eating birds such as herons. Ducks' nests are raided by land-based predators, and brooding females may be caught unaware on the nest by mammals, such as foxes, or large birds, such as hawks or owls."
+    },
+    {
+      "self_ref": "#/texts/255",
+      "parent": {
+        "$ref": "#/texts/252"
+      },
+      "children": [],
+      "content_layer": "body",
+      "label": "text",
+      "prov": [],
+      "orig": "Adult ducks are fast fliers, but may be caught on the water by large aquatic predators including big fish such as the North American muskie and the European pike. In flight, ducks are safe from all but a few predators such as humans and the peregrine falcon, which uses its speed and strength to catch ducks.",
+      "text": "Adult ducks are fast fliers, but may be caught on the water by large aquatic predators including big fish such as the North American muskie and the European pike. In flight, ducks are safe from all but a few predators such as humans and the peregrine falcon, which uses its speed and strength to catch ducks."
+    },
+    {
+      "self_ref": "#/texts/256",
+      "parent": {
+        "$ref": "#/texts/43"
+      },
+      "children": [
+        {
+          "$ref": "#/texts/257"
+        },
+        {
+          "$ref": "#/texts/260"
+        },
+        {
+          "$ref": "#/texts/263"
+        },
+        {
+          "$ref": "#/texts/266"
+        }
+      ],
+      "content_layer": "body",
+      "label": "section_header",
+      "prov": [],
+      "orig": "Relationship with humans",
+      "text": "Relationship with humans",
+      "level": 2
+    },
+    {
+      "self_ref": "#/texts/257",
+      "parent": {
+        "$ref": "#/texts/256"
+      },
+      "children": [
+        {
+          "$ref": "#/texts/258"
+        },
+        {
+          "$ref": "#/texts/259"
+        }
+      ],
+      "content_layer": "body",
+      "label": "section_header",
+      "prov": [],
+      "orig": "Hunting",
+      "text": "Hunting",
+      "level": 3
+    },
+    {
+      "self_ref": "#/texts/258",
+      "parent": {
+        "$ref": "#/texts/257"
+      },
+      "children": [],
+      "content_layer": "body",
+      "label": "text",
+      "prov": [],
+      "orig": "Humans have hunted ducks since prehistoric times. Excavations of middens in California dating to 7800 \u2013 6400 BP have turned up bones of ducks, including at least one now-extinct flightless species.[33] Ducks were captured in \"significant numbers\" by Holocene inhabitants of the lower Ohio River valley, suggesting they took advantage of the seasonal bounty provided by migrating waterfowl.[34] Neolithic hunters in locations as far apart as the Caribbean,[35] Scandinavia,[36] Egypt,[37] Switzerland,[38] and China relied on ducks as a source of protein for some or all of the year.[39] Archeological evidence shows that M\u0101ori people in New Zealand hunted the flightless Finsch's duck, possibly to extinction, though rat predation may also have contributed to its fate.[40] A similar end awaited the Chatham duck, a species with reduced flying capabilities which went extinct shortly after its island was colonised by Polynesian settlers.[41] It is probable that duck eggs were gathered by Neolithic hunter-gathers as well, though hard evidence of this is uncommon.[35][42]",
+      "text": "Humans have hunted ducks since prehistoric times. Excavations of middens in California dating to 7800 \u2013 6400 BP have turned up bones of ducks, including at least one now-extinct flightless species.[33] Ducks were captured in \"significant numbers\" by Holocene inhabitants of the lower Ohio River valley, suggesting they took advantage of the seasonal bounty provided by migrating waterfowl.[34] Neolithic hunters in locations as far apart as the Caribbean,[35] Scandinavia,[36] Egypt,[37] Switzerland,[38] and China relied on ducks as a source of protein for some or all of the year.[39] Archeological evidence shows that M\u0101ori people in New Zealand hunted the flightless Finsch's duck, possibly to extinction, though rat predation may also have contributed to its fate.[40] A similar end awaited the Chatham duck, a species with reduced flying capabilities which went extinct shortly after its island was colonised by Polynesian settlers.[41] It is probable that duck eggs were gathered by Neolithic hunter-gathers as well, though hard evidence of this is uncommon.[35][42]"
+    },
+    {
+      "self_ref": "#/texts/259",
+      "parent": {
+        "$ref": "#/texts/257"
+      },
+      "children": [],
+      "content_layer": "body",
+      "label": "text",
+      "prov": [],
+      "orig": "In many areas, wild ducks (including ducks farmed and released into the wild) are hunted for food or sport,[43] by shooting, or by being trapped using duck decoys. Because an idle floating duck or a duck squatting on land cannot react to fly or move quickly, \"a sitting duck\" has come to mean \"an easy target\". These ducks may be contaminated by pollutants such as PCBs.[44]",
+      "text": "In many areas, wild ducks (including ducks farmed and released into the wild) are hunted for food or sport,[43] by shooting, or by being trapped using duck decoys. Because an idle floating duck or a duck squatting on land cannot react to fly or move quickly, \"a sitting duck\" has come to mean \"an easy target\". These ducks may be contaminated by pollutants such as PCBs.[44]"
+    },
+    {
+      "self_ref": "#/texts/260",
+      "parent": {
+        "$ref": "#/texts/256"
+      },
+      "children": [
+        {
+          "$ref": "#/pictures/15"
+        },
+        {
+          "$ref": "#/texts/262"
+        }
+      ],
+      "content_layer": "body",
+      "label": "section_header",
+      "prov": [],
+      "orig": "Domestication",
+      "text": "Domestication",
+      "level": 3
+    },
+    {
+      "self_ref": "#/texts/261",
+      "parent": {
+        "$ref": "#/body"
+      },
+      "children": [],
+      "content_layer": "body",
+      "label": "caption",
+      "prov": [],
+      "orig": "Indian Runner ducks, a common breed of domestic ducks",
+      "text": "Indian Runner ducks, a common breed of domestic ducks"
+    },
+    {
+      "self_ref": "#/texts/262",
+      "parent": {
+        "$ref": "#/texts/260"
+      },
+      "children": [],
+      "content_layer": "body",
+      "label": "text",
+      "prov": [],
+      "orig": "Ducks have many economic uses, being farmed for their meat, eggs, and feathers (particularly their down). Approximately 3 billion ducks are slaughtered each year for meat worldwide.[45] They are also kept and bred by aviculturists and often displayed in zoos. Almost all the varieties of domestic ducks are descended from the mallard (Anas platyrhynchos), apart from the Muscovy duck (Cairina moschata).[46][47] The Call duck is another example of a domestic duck breed. Its name comes from its original use established by hunters, as a decoy to attract wild mallards from the sky, into traps set for them on the ground. The call duck is the world's smallest domestic duck breed, as it weighs less than 1\u00a0kg (2.2\u00a0lb).[48]",
+      "text": "Ducks have many economic uses, being farmed for their meat, eggs, and feathers (particularly their down). Approximately 3 billion ducks are slaughtered each year for meat worldwide.[45] They are also kept and bred by aviculturists and often displayed in zoos. Almost all the varieties of domestic ducks are descended from the mallard (Anas platyrhynchos), apart from the Muscovy duck (Cairina moschata).[46][47] The Call duck is another example of a domestic duck breed. Its name comes from its original use established by hunters, as a decoy to attract wild mallards from the sky, into traps set for them on the ground. The call duck is the world's smallest domestic duck breed, as it weighs less than 1\u00a0kg (2.2\u00a0lb).[48]"
+    },
+    {
+      "self_ref": "#/texts/263",
+      "parent": {
+        "$ref": "#/texts/256"
+      },
+      "children": [
+        {
+          "$ref": "#/pictures/16"
+        },
+        {
+          "$ref": "#/texts/265"
+        }
+      ],
+      "content_layer": "body",
+      "label": "section_header",
+      "prov": [],
+      "orig": "Heraldry",
+      "text": "Heraldry",
+      "level": 3
+    },
+    {
+      "self_ref": "#/texts/264",
+      "parent": {
+        "$ref": "#/body"
+      },
+      "children": [],
+      "content_layer": "body",
+      "label": "caption",
+      "prov": [],
+      "orig": "Three black-colored ducks in the coat of arms of Maaninka[49]",
+      "text": "Three black-colored ducks in the coat of arms of Maaninka[49]"
+    },
+    {
+      "self_ref": "#/texts/265",
+      "parent": {
+        "$ref": "#/texts/263"
+      },
+      "children": [],
+      "content_layer": "body",
+      "label": "text",
+      "prov": [],
+      "orig": "Ducks appear on several coats of arms, including the coat of arms of Lub\u0101na (Latvia)[50] and the coat of arms of F\u00f6gl\u00f6 (\u00c5land).[51]",
+      "text": "Ducks appear on several coats of arms, including the coat of arms of Lub\u0101na (Latvia)[50] and the coat of arms of F\u00f6gl\u00f6 (\u00c5land).[51]"
+    },
+    {
+      "self_ref": "#/texts/266",
+      "parent": {
+        "$ref": "#/texts/256"
+      },
+      "children": [
+        {
+          "$ref": "#/texts/267"
+        },
+        {
+          "$ref": "#/texts/268"
+        }
+      ],
+      "content_layer": "body",
+      "label": "section_header",
+      "prov": [],
+      "orig": "Cultural references",
+      "text": "Cultural references",
+      "level": 3
+    },
+    {
+      "self_ref": "#/texts/267",
+      "parent": {
+        "$ref": "#/texts/266"
+      },
+      "children": [],
+      "content_layer": "body",
+      "label": "text",
+      "prov": [],
+      "orig": "In 2002, psychologist Richard Wiseman and colleagues at the University of Hertfordshire, UK, finished a year-long LaughLab experiment, concluding that of all animals, ducks attract the most humor and silliness; he said, \"If you're going to tell a joke involving an animal, make it a duck.\"[52] The word \"duck\" may have become an inherently funny word in many languages, possibly because ducks are seen as silly in their looks or behavior. Of the many ducks in fiction, many are cartoon characters, such as Walt Disney's Donald Duck, and Warner Bros.' Daffy Duck. Howard the Duck started as a comic book character in 1973[53][54] and was made into a movie in 1986.",
+      "text": "In 2002, psychologist Richard Wiseman and colleagues at the University of Hertfordshire, UK, finished a year-long LaughLab experiment, concluding that of all animals, ducks attract the most humor and silliness; he said, \"If you're going to tell a joke involving an animal, make it a duck.\"[52] The word \"duck\" may have become an inherently funny word in many languages, possibly because ducks are seen as silly in their looks or behavior. Of the many ducks in fiction, many are cartoon characters, such as Walt Disney's Donald Duck, and Warner Bros.' Daffy Duck. Howard the Duck started as a comic book character in 1973[53][54] and was made into a movie in 1986."
+    },
+    {
+      "self_ref": "#/texts/268",
+      "parent": {
+        "$ref": "#/texts/266"
+      },
+      "children": [],
+      "content_layer": "body",
+      "label": "text",
       "prov": [],
       "orig": "The 1992 Disney film The Mighty Ducks, starring Emilio Estevez, chose the duck as the mascot for the fictional youth hockey team who are protagonists of the movie, based on the duck being described as a fierce fighter. This led to the duck becoming the nickname and mascot for the eventual National Hockey League professional team of the Anaheim Ducks, who were founded with the name the Mighty Ducks of Anaheim.[citation needed] The duck is also the nickname of the University of Oregon sports teams as well as the Long Island Ducks minor league baseball team.[55]",
       "text": "The 1992 Disney film The Mighty Ducks, starring Emilio Estevez, chose the duck as the mascot for the fictional youth hockey team who are protagonists of the movie, based on the duck being described as a fierce fighter. This led to the duck becoming the nickname and mascot for the eventual National Hockey League professional team of the Anaheim Ducks, who were founded with the name the Mighty Ducks of Anaheim.[citation needed] The duck is also the nickname of the University of Oregon sports teams as well as the Long Island Ducks minor league baseball team.[55]"
     },
     {
-      "self_ref": "#/texts/255",
+      "self_ref": "#/texts/269",
       "parent": {
-        "$ref": "#/texts/39"
+        "$ref": "#/texts/43"
       },
       "children": [
         {
@@ -5094,6 +5600,7 @@
           "$ref": "#/groups/38"
         }
       ],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
       "orig": "See also",
@@ -5101,11 +5608,12 @@
       "level": 2
     },
     {
-      "self_ref": "#/texts/256",
+      "self_ref": "#/texts/270",
       "parent": {
         "$ref": "#/groups/37"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "Birds portal",
@@ -5114,11 +5622,12 @@
       "marker": "-"
     },
     {
-      "self_ref": "#/texts/257",
+      "self_ref": "#/texts/271",
       "parent": {
         "$ref": "#/groups/38"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "Domestic duck",
@@ -5127,11 +5636,12 @@
       "marker": "-"
     },
     {
-      "self_ref": "#/texts/258",
+      "self_ref": "#/texts/272",
       "parent": {
         "$ref": "#/groups/38"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "Duck as food",
@@ -5140,11 +5650,12 @@
       "marker": "-"
     },
     {
-      "self_ref": "#/texts/259",
+      "self_ref": "#/texts/273",
       "parent": {
         "$ref": "#/groups/38"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "Duck test",
@@ -5153,11 +5664,12 @@
       "marker": "-"
     },
     {
-      "self_ref": "#/texts/260",
+      "self_ref": "#/texts/274",
       "parent": {
         "$ref": "#/groups/38"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "Duck breeds",
@@ -5166,11 +5678,12 @@
       "marker": "-"
     },
     {
-      "self_ref": "#/texts/261",
+      "self_ref": "#/texts/275",
       "parent": {
         "$ref": "#/groups/38"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "Fictional ducks",
@@ -5179,11 +5692,12 @@
       "marker": "-"
     },
     {
-      "self_ref": "#/texts/262",
+      "self_ref": "#/texts/276",
       "parent": {
         "$ref": "#/groups/38"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "Rubber duck",
@@ -5192,18 +5706,19 @@
       "marker": "-"
     },
     {
-      "self_ref": "#/texts/263",
+      "self_ref": "#/texts/277",
       "parent": {
-        "$ref": "#/texts/39"
+        "$ref": "#/texts/43"
       },
       "children": [
         {
-          "$ref": "#/texts/264"
+          "$ref": "#/texts/278"
         },
         {
-          "$ref": "#/texts/320"
+          "$ref": "#/texts/334"
         }
       ],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
       "orig": "Notes",
@@ -5211,15 +5726,16 @@
       "level": 2
     },
     {
-      "self_ref": "#/texts/264",
+      "self_ref": "#/texts/278",
       "parent": {
-        "$ref": "#/texts/263"
+        "$ref": "#/texts/277"
       },
       "children": [
         {
           "$ref": "#/groups/39"
         }
       ],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
       "orig": "Citations",
@@ -5227,11 +5743,12 @@
       "level": 3
     },
     {
-      "self_ref": "#/texts/265",
+      "self_ref": "#/texts/279",
       "parent": {
         "$ref": "#/groups/39"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "^ \"Duckling\". The American Heritage Dictionary of the English Language, Fourth Edition. Houghton Mifflin Company. 2006. Retrieved 2015-05-22.",
@@ -5240,11 +5757,12 @@
       "marker": "1."
     },
     {
-      "self_ref": "#/texts/266",
+      "self_ref": "#/texts/280",
       "parent": {
         "$ref": "#/groups/39"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "^ \"Duckling\". Kernerman English Multilingual Dictionary (Beta Version). K. Dictionaries Ltd. 2000\u20132006. Retrieved 2015-05-22.",
@@ -5253,11 +5771,12 @@
       "marker": "2."
     },
     {
-      "self_ref": "#/texts/267",
+      "self_ref": "#/texts/281",
       "parent": {
         "$ref": "#/groups/39"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "^ Dohner, Janet Vorwald (2001). The Encyclopedia of Historic and Endangered Livestock and Poultry Breeds. Yale University Press. ISBN\u00a0978-0300138139.",
@@ -5266,11 +5785,12 @@
       "marker": "3."
     },
     {
-      "self_ref": "#/texts/268",
+      "self_ref": "#/texts/282",
       "parent": {
         "$ref": "#/groups/39"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "^ Visca, Curt; Visca, Kelley (2003). How to Draw Cartoon Birds. The Rosen Publishing Group. ISBN\u00a09780823961566.",
@@ -5279,11 +5799,12 @@
       "marker": "4."
     },
     {
-      "self_ref": "#/texts/269",
+      "self_ref": "#/texts/283",
       "parent": {
         "$ref": "#/groups/39"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "^ a b c d Carboneras 1992, p.\u00a0536.",
@@ -5292,11 +5813,12 @@
       "marker": "5."
     },
     {
-      "self_ref": "#/texts/270",
+      "self_ref": "#/texts/284",
       "parent": {
         "$ref": "#/groups/39"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "^ Livezey 1986, pp.\u00a0737\u2013738.",
@@ -5305,11 +5827,12 @@
       "marker": "6."
     },
     {
-      "self_ref": "#/texts/271",
+      "self_ref": "#/texts/285",
       "parent": {
         "$ref": "#/groups/39"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "^ Madsen, McHugh & de Kloet 1988, p.\u00a0452.",
@@ -5318,11 +5841,12 @@
       "marker": "7."
     },
     {
-      "self_ref": "#/texts/272",
+      "self_ref": "#/texts/286",
       "parent": {
         "$ref": "#/groups/39"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "^ Donne-Gouss\u00e9, Laudet & H\u00e4nni 2002, pp.\u00a0353\u2013354.",
@@ -5331,11 +5855,12 @@
       "marker": "8."
     },
     {
-      "self_ref": "#/texts/273",
+      "self_ref": "#/texts/287",
       "parent": {
         "$ref": "#/groups/39"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "^ a b c d e f Carboneras 1992, p.\u00a0540.",
@@ -5344,11 +5869,12 @@
       "marker": "9."
     },
     {
-      "self_ref": "#/texts/274",
+      "self_ref": "#/texts/288",
       "parent": {
         "$ref": "#/groups/39"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "^ Elphick, Dunning & Sibley 2001, p.\u00a0191.",
@@ -5357,11 +5883,12 @@
       "marker": "10."
     },
     {
-      "self_ref": "#/texts/275",
+      "self_ref": "#/texts/289",
       "parent": {
         "$ref": "#/groups/39"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "^ Kear 2005, p.\u00a0448.",
@@ -5370,11 +5897,12 @@
       "marker": "11."
     },
     {
-      "self_ref": "#/texts/276",
+      "self_ref": "#/texts/290",
       "parent": {
         "$ref": "#/groups/39"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "^ Kear 2005, p.\u00a0622\u2013623.",
@@ -5383,11 +5911,12 @@
       "marker": "12."
     },
     {
-      "self_ref": "#/texts/277",
+      "self_ref": "#/texts/291",
       "parent": {
         "$ref": "#/groups/39"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "^ Kear 2005, p.\u00a0686.",
@@ -5396,11 +5925,12 @@
       "marker": "13."
     },
     {
-      "self_ref": "#/texts/278",
+      "self_ref": "#/texts/292",
       "parent": {
         "$ref": "#/groups/39"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "^ Elphick, Dunning & Sibley 2001, p.\u00a0193.",
@@ -5409,11 +5939,12 @@
       "marker": "14."
     },
     {
-      "self_ref": "#/texts/279",
+      "self_ref": "#/texts/293",
       "parent": {
         "$ref": "#/groups/39"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "^ a b c d e f g Carboneras 1992, p.\u00a0537.",
@@ -5422,11 +5953,12 @@
       "marker": "15."
     },
     {
-      "self_ref": "#/texts/280",
+      "self_ref": "#/texts/294",
       "parent": {
         "$ref": "#/groups/39"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "^ American Ornithologists' Union 1998, p.\u00a0xix.",
@@ -5435,11 +5967,12 @@
       "marker": "16."
     },
     {
-      "self_ref": "#/texts/281",
+      "self_ref": "#/texts/295",
       "parent": {
         "$ref": "#/groups/39"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "^ American Ornithologists' Union 1998.",
@@ -5448,11 +5981,12 @@
       "marker": "17."
     },
     {
-      "self_ref": "#/texts/282",
+      "self_ref": "#/texts/296",
       "parent": {
         "$ref": "#/groups/39"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "^ Carboneras 1992, p.\u00a0538.",
@@ -5461,11 +5995,12 @@
       "marker": "18."
     },
     {
-      "self_ref": "#/texts/283",
+      "self_ref": "#/texts/297",
       "parent": {
         "$ref": "#/groups/39"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "^ Christidis & Boles 2008, p.\u00a062.",
@@ -5474,11 +6009,12 @@
       "marker": "19."
     },
     {
-      "self_ref": "#/texts/284",
+      "self_ref": "#/texts/298",
       "parent": {
         "$ref": "#/groups/39"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "^ Shirihai 2008, pp.\u00a0239, 245.",
@@ -5487,11 +6023,12 @@
       "marker": "20."
     },
     {
-      "self_ref": "#/texts/285",
+      "self_ref": "#/texts/299",
       "parent": {
         "$ref": "#/groups/39"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "^ a b Pratt, Bruner & Berrett 1987, pp.\u00a098\u2013107.",
@@ -5500,11 +6037,12 @@
       "marker": "21."
     },
     {
-      "self_ref": "#/texts/286",
+      "self_ref": "#/texts/300",
       "parent": {
         "$ref": "#/groups/39"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "^ Fitter, Fitter & Hosking 2000, pp.\u00a052\u20133.",
@@ -5513,11 +6051,12 @@
       "marker": "22."
     },
     {
-      "self_ref": "#/texts/287",
+      "self_ref": "#/texts/301",
       "parent": {
         "$ref": "#/groups/39"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "^ \"Pacific Black Duck\". www.wiresnr.org. Retrieved 2018-04-27.",
@@ -5526,11 +6065,12 @@
       "marker": "23."
     },
     {
-      "self_ref": "#/texts/288",
+      "self_ref": "#/texts/302",
       "parent": {
         "$ref": "#/groups/39"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "^ Ogden, Evans. \"Dabbling Ducks\". CWE. Retrieved 2006-11-02.",
@@ -5539,11 +6079,12 @@
       "marker": "24."
     },
     {
-      "self_ref": "#/texts/289",
+      "self_ref": "#/texts/303",
       "parent": {
         "$ref": "#/groups/39"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "^ Karl Mathiesen (16 March 2015). \"Don't feed the ducks bread, say conservationists\". The Guardian. Retrieved 13 November 2016.",
@@ -5552,11 +6093,12 @@
       "marker": "25."
     },
     {
-      "self_ref": "#/texts/290",
+      "self_ref": "#/texts/304",
       "parent": {
         "$ref": "#/groups/39"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "^ Rohwer, Frank C.; Anderson, Michael G. (1988). \"Female-Biased Philopatry, Monogamy, and the Timing of Pair Formation in Migratory Waterfowl\". Current Ornithology. pp.\u00a0187\u2013221. doi:10.1007/978-1-4615-6787-5_4. ISBN\u00a0978-1-4615-6789-9.",
@@ -5565,11 +6107,12 @@
       "marker": "26."
     },
     {
-      "self_ref": "#/texts/291",
+      "self_ref": "#/texts/305",
       "parent": {
         "$ref": "#/groups/39"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "^ Smith, Cyndi M.; Cooke, Fred; Robertson, Gregory J.; Goudie, R. Ian; Boyd, W. Sean (2000). \"Long-Term Pair Bonds in Harlequin Ducks\". The Condor. 102 (1): 201\u2013205. doi:10.1093/condor/102.1.201. hdl:10315/13797.",
@@ -5578,11 +6121,12 @@
       "marker": "27."
     },
     {
-      "self_ref": "#/texts/292",
+      "self_ref": "#/texts/306",
       "parent": {
         "$ref": "#/groups/39"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "^ \"If You Find An Orphaned Duckling - Wildlife Rehabber\". wildliferehabber.com. Archived from the original on 2018-09-23. Retrieved 2018-12-22.",
@@ -5591,11 +6135,12 @@
       "marker": "28."
     },
     {
-      "self_ref": "#/texts/293",
+      "self_ref": "#/texts/307",
       "parent": {
         "$ref": "#/groups/39"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "^ Carver, Heather (2011). The Duck Bible. Lulu.com. ISBN\u00a09780557901562.[self-published source]",
@@ -5604,11 +6149,12 @@
       "marker": "29."
     },
     {
-      "self_ref": "#/texts/294",
+      "self_ref": "#/texts/308",
       "parent": {
         "$ref": "#/groups/39"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "^ Titlow, Budd (2013-09-03). Bird Brains: Inside the Strange Minds of Our Fine Feathered Friends. Rowman & Littlefield. ISBN\u00a09780762797707.",
@@ -5617,11 +6163,12 @@
       "marker": "30."
     },
     {
-      "self_ref": "#/texts/295",
+      "self_ref": "#/texts/309",
       "parent": {
         "$ref": "#/groups/39"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "^ Amos, Jonathan (2003-09-08). \"Sound science is quackers\". BBC News. Retrieved 2006-11-02.",
@@ -5630,11 +6177,12 @@
       "marker": "31."
     },
     {
-      "self_ref": "#/texts/296",
+      "self_ref": "#/texts/310",
       "parent": {
         "$ref": "#/groups/39"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "^ \"Mythbusters Episode 8\". 12 December 2003.",
@@ -5643,11 +6191,12 @@
       "marker": "32."
     },
     {
-      "self_ref": "#/texts/297",
+      "self_ref": "#/texts/311",
       "parent": {
         "$ref": "#/groups/39"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "^ Erlandson 1994, p.\u00a0171.",
@@ -5656,11 +6205,12 @@
       "marker": "33."
     },
     {
-      "self_ref": "#/texts/298",
+      "self_ref": "#/texts/312",
       "parent": {
         "$ref": "#/groups/39"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "^ Jeffries 2008, pp.\u00a0168, 243.",
@@ -5669,11 +6219,12 @@
       "marker": "34."
     },
     {
-      "self_ref": "#/texts/299",
+      "self_ref": "#/texts/313",
       "parent": {
         "$ref": "#/groups/39"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "^ a b Sued-Badillo 2003, p.\u00a065.",
@@ -5682,11 +6233,12 @@
       "marker": "35."
     },
     {
-      "self_ref": "#/texts/300",
+      "self_ref": "#/texts/314",
       "parent": {
         "$ref": "#/groups/39"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "^ Thorpe 1996, p.\u00a068.",
@@ -5695,11 +6247,12 @@
       "marker": "36."
     },
     {
-      "self_ref": "#/texts/301",
+      "self_ref": "#/texts/315",
       "parent": {
         "$ref": "#/groups/39"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "^ Maisels 1999, p.\u00a042.",
@@ -5708,11 +6261,12 @@
       "marker": "37."
     },
     {
-      "self_ref": "#/texts/302",
+      "self_ref": "#/texts/316",
       "parent": {
         "$ref": "#/groups/39"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "^ Rau 1876, p.\u00a0133.",
@@ -5721,11 +6275,12 @@
       "marker": "38."
     },
     {
-      "self_ref": "#/texts/303",
+      "self_ref": "#/texts/317",
       "parent": {
         "$ref": "#/groups/39"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "^ Higman 2012, p.\u00a023.",
@@ -5734,11 +6289,12 @@
       "marker": "39."
     },
     {
-      "self_ref": "#/texts/304",
+      "self_ref": "#/texts/318",
       "parent": {
         "$ref": "#/groups/39"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "^ Hume 2012, p.\u00a053.",
@@ -5747,11 +6303,12 @@
       "marker": "40."
     },
     {
-      "self_ref": "#/texts/305",
+      "self_ref": "#/texts/319",
       "parent": {
         "$ref": "#/groups/39"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "^ Hume 2012, p.\u00a052.",
@@ -5760,11 +6317,12 @@
       "marker": "41."
     },
     {
-      "self_ref": "#/texts/306",
+      "self_ref": "#/texts/320",
       "parent": {
         "$ref": "#/groups/39"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "^ Fieldhouse 2002, p.\u00a0167.",
@@ -5773,11 +6331,12 @@
       "marker": "42."
     },
     {
-      "self_ref": "#/texts/307",
+      "self_ref": "#/texts/321",
       "parent": {
         "$ref": "#/groups/39"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "^ Livingston, A. D. (1998-01-01). Guide to Edible Plants and Animals. Wordsworth Editions, Limited. ISBN\u00a09781853263774.",
@@ -5786,11 +6345,12 @@
       "marker": "43."
     },
     {
-      "self_ref": "#/texts/308",
+      "self_ref": "#/texts/322",
       "parent": {
         "$ref": "#/groups/39"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "^ \"Study plan for waterfowl injury assessment: Determining PCB concentrations in Hudson river resident waterfowl\" (PDF). New York State Department of Environmental Conservation. US Department of Commerce. December 2008. p.\u00a03. Archived (PDF) from the original on 2022-10-09. Retrieved 2 July 2019.",
@@ -5799,11 +6359,12 @@
       "marker": "44."
     },
     {
-      "self_ref": "#/texts/309",
+      "self_ref": "#/texts/323",
       "parent": {
         "$ref": "#/groups/39"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "^ \"FAOSTAT\". www.fao.org. Retrieved 2019-10-25.",
@@ -5812,11 +6373,12 @@
       "marker": "45."
     },
     {
-      "self_ref": "#/texts/310",
+      "self_ref": "#/texts/324",
       "parent": {
         "$ref": "#/groups/39"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "^ \"Anas platyrhynchos, Domestic Duck; DigiMorph Staff - The University of Texas at Austin\". Digimorph.org. Retrieved 2012-12-23.",
@@ -5825,11 +6387,12 @@
       "marker": "46."
     },
     {
-      "self_ref": "#/texts/311",
+      "self_ref": "#/texts/325",
       "parent": {
         "$ref": "#/groups/39"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "^ Sy Montgomery. \"Mallard; Encyclop\u00e6dia Britannica\". Britannica.com. Retrieved 2012-12-23.",
@@ -5838,11 +6401,12 @@
       "marker": "47."
     },
     {
-      "self_ref": "#/texts/312",
+      "self_ref": "#/texts/326",
       "parent": {
         "$ref": "#/groups/39"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "^ Glenday, Craig (2014). Guinness World Records. Guinness World Records Limited. pp.\u00a0135. ISBN\u00a0978-1-908843-15-9.",
@@ -5851,11 +6415,12 @@
       "marker": "48."
     },
     {
-      "self_ref": "#/texts/313",
+      "self_ref": "#/texts/327",
       "parent": {
         "$ref": "#/groups/39"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "^ Suomen kunnallisvaakunat (in Finnish). Suomen Kunnallisliitto. 1982. p.\u00a0147. ISBN\u00a0951-773-085-3.",
@@ -5864,11 +6429,12 @@
       "marker": "49."
     },
     {
-      "self_ref": "#/texts/314",
+      "self_ref": "#/texts/328",
       "parent": {
         "$ref": "#/groups/39"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "^ \"Lub\u0101nas simbolika\" (in Latvian). Retrieved September 9, 2021.",
@@ -5877,11 +6443,12 @@
       "marker": "50."
     },
     {
-      "self_ref": "#/texts/315",
+      "self_ref": "#/texts/329",
       "parent": {
         "$ref": "#/groups/39"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "^ \"F\u00f6gl\u00f6\" (in Swedish). Retrieved September 9, 2021.",
@@ -5890,11 +6457,12 @@
       "marker": "51."
     },
     {
-      "self_ref": "#/texts/316",
+      "self_ref": "#/texts/330",
       "parent": {
         "$ref": "#/groups/39"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "^ Young, Emma. \"World's funniest joke revealed\". New Scientist. Retrieved 7 January 2019.",
@@ -5903,11 +6471,12 @@
       "marker": "52."
     },
     {
-      "self_ref": "#/texts/317",
+      "self_ref": "#/texts/331",
       "parent": {
         "$ref": "#/groups/39"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "^ \"Howard the Duck (character)\". Grand Comics Database.",
@@ -5916,11 +6485,12 @@
       "marker": "53."
     },
     {
-      "self_ref": "#/texts/318",
+      "self_ref": "#/texts/332",
       "parent": {
         "$ref": "#/groups/39"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "^ Sanderson, Peter; Gilbert, Laura (2008). \"1970s\". Marvel Chronicle A Year by Year History. London, United Kingdom: Dorling Kindersley. p.\u00a0161. ISBN\u00a0978-0756641238. December saw the debut of the cigar-smoking Howard the Duck. In this story by writer Steve Gerber and artist Val Mayerik, various beings from different realities had begun turning up in the Man-Thing's Florida swamp, including this bad-tempered talking duck.",
@@ -5929,11 +6499,12 @@
       "marker": "54."
     },
     {
-      "self_ref": "#/texts/319",
+      "self_ref": "#/texts/333",
       "parent": {
         "$ref": "#/groups/39"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "^ \"The Duck\". University of Oregon Athletics. Retrieved 2022-01-20.",
@@ -5942,213 +6513,33 @@
       "marker": "55."
     },
     {
-      "self_ref": "#/texts/320",
+      "self_ref": "#/texts/334",
       "parent": {
-        "$ref": "#/texts/263"
+        "$ref": "#/texts/277"
       },
       "children": [
         {
           "$ref": "#/groups/40"
         }
       ],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
       "orig": "Sources",
       "text": "Sources",
       "level": 3
     },
-    {
-      "self_ref": "#/texts/321",
-      "parent": {
-        "$ref": "#/groups/40"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "American Ornithologists' Union (1998). Checklist of North American Birds (PDF). Washington, DC: American Ornithologists' Union. ISBN\u00a0978-1-891276-00-2. Archived (PDF) from the original on 2022-10-09.",
-      "text": "American Ornithologists' Union (1998). Checklist of North American Birds (PDF). Washington, DC: American Ornithologists' Union. ISBN\u00a0978-1-891276-00-2. Archived (PDF) from the original on 2022-10-09.",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/322",
-      "parent": {
-        "$ref": "#/groups/40"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Carboneras, Carlos (1992). del Hoyo, Josep; Elliott, Andrew; Sargatal, Jordi (eds.). Handbook of the Birds of the World. Vol.\u00a01: Ostrich to Ducks. Barcelona: Lynx Edicions. ISBN\u00a0978-84-87334-10-8.",
-      "text": "Carboneras, Carlos (1992). del Hoyo, Josep; Elliott, Andrew; Sargatal, Jordi (eds.). Handbook of the Birds of the World. Vol.\u00a01: Ostrich to Ducks. Barcelona: Lynx Edicions. ISBN\u00a0978-84-87334-10-8.",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/323",
-      "parent": {
-        "$ref": "#/groups/40"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Christidis, Les; Boles, Walter E., eds. (2008). Systematics and Taxonomy of Australian Birds. Collingwood, VIC: Csiro Publishing. ISBN\u00a0978-0-643-06511-6.",
-      "text": "Christidis, Les; Boles, Walter E., eds. (2008). Systematics and Taxonomy of Australian Birds. Collingwood, VIC: Csiro Publishing. ISBN\u00a0978-0-643-06511-6.",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/324",
-      "parent": {
-        "$ref": "#/groups/40"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Donne-Gouss\u00e9, Carole; Laudet, Vincent; H\u00e4nni, Catherine (July 2002). \"A molecular phylogeny of Anseriformes based on mitochondrial DNA analysis\". Molecular Phylogenetics and Evolution. 23 (3): 339\u2013356. Bibcode:2002MolPE..23..339D. doi:10.1016/S1055-7903(02)00019-2. PMID\u00a012099792.",
-      "text": "Donne-Gouss\u00e9, Carole; Laudet, Vincent; H\u00e4nni, Catherine (July 2002). \"A molecular phylogeny of Anseriformes based on mitochondrial DNA analysis\". Molecular Phylogenetics and Evolution. 23 (3): 339\u2013356. Bibcode:2002MolPE..23..339D. doi:10.1016/S1055-7903(02)00019-2. PMID\u00a012099792.",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/325",
-      "parent": {
-        "$ref": "#/groups/40"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Elphick, Chris; Dunning, John B. Jr.; Sibley, David, eds. (2001). The Sibley Guide to Bird Life and Behaviour. London: Christopher Helm. ISBN\u00a0978-0-7136-6250-4.",
-      "text": "Elphick, Chris; Dunning, John B. Jr.; Sibley, David, eds. (2001). The Sibley Guide to Bird Life and Behaviour. London: Christopher Helm. ISBN\u00a0978-0-7136-6250-4.",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/326",
-      "parent": {
-        "$ref": "#/groups/40"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Erlandson, Jon M. (1994). Early Hunter-Gatherers of the California Coast. New York, NY: Springer Science & Business Media. ISBN\u00a0978-1-4419-3231-0.",
-      "text": "Erlandson, Jon M. (1994). Early Hunter-Gatherers of the California Coast. New York, NY: Springer Science & Business Media. ISBN\u00a0978-1-4419-3231-0.",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/327",
-      "parent": {
-        "$ref": "#/groups/40"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Fieldhouse, Paul (2002). Food, Feasts, and Faith: An Encyclopedia of Food Culture in World Religions. Vol.\u00a0I: A\u2013K. Santa Barbara: ABC-CLIO. ISBN\u00a0978-1-61069-412-4.",
-      "text": "Fieldhouse, Paul (2002). Food, Feasts, and Faith: An Encyclopedia of Food Culture in World Religions. Vol.\u00a0I: A\u2013K. Santa Barbara: ABC-CLIO. ISBN\u00a0978-1-61069-412-4.",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/328",
-      "parent": {
-        "$ref": "#/groups/40"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Fitter, Julian; Fitter, Daniel; Hosking, David (2000). Wildlife of the Gal\u00e1pagos. Princeton, NJ: Princeton University Press. ISBN\u00a0978-0-691-10295-5.",
-      "text": "Fitter, Julian; Fitter, Daniel; Hosking, David (2000). Wildlife of the Gal\u00e1pagos. Princeton, NJ: Princeton University Press. ISBN\u00a0978-0-691-10295-5.",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/329",
-      "parent": {
-        "$ref": "#/groups/40"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Higman, B. W. (2012). How Food Made History. Chichester, UK: John Wiley & Sons. ISBN\u00a0978-1-4051-8947-7.",
-      "text": "Higman, B. W. (2012). How Food Made History. Chichester, UK: John Wiley & Sons. ISBN\u00a0978-1-4051-8947-7.",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/330",
-      "parent": {
-        "$ref": "#/groups/40"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Hume, Julian H. (2012). Extinct Birds. London: Christopher Helm. ISBN\u00a0978-1-4729-3744-5.",
-      "text": "Hume, Julian H. (2012). Extinct Birds. London: Christopher Helm. ISBN\u00a0978-1-4729-3744-5.",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/331",
-      "parent": {
-        "$ref": "#/groups/40"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Jeffries, Richard (2008). Holocene Hunter-Gatherers of the Lower Ohio River Valley. Tuscaloosa: University of Alabama Press. ISBN\u00a0978-0-8173-1658-7.",
-      "text": "Jeffries, Richard (2008). Holocene Hunter-Gatherers of the Lower Ohio River Valley. Tuscaloosa: University of Alabama Press. ISBN\u00a0978-0-8173-1658-7.",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/332",
-      "parent": {
-        "$ref": "#/groups/40"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Kear, Janet, ed. (2005). Ducks, Geese and Swans: Species Accounts (Cairina to Mergus). Bird Families of the World. Oxford: Oxford University Press. ISBN\u00a0978-0-19-861009-0.",
-      "text": "Kear, Janet, ed. (2005). Ducks, Geese and Swans: Species Accounts (Cairina to Mergus). Bird Families of the World. Oxford: Oxford University Press. ISBN\u00a0978-0-19-861009-0.",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/333",
-      "parent": {
-        "$ref": "#/groups/40"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Livezey, Bradley C. (October 1986). \"A phylogenetic analysis of recent Anseriform genera using morphological characters\" (PDF). The Auk. 103 (4): 737\u2013754. doi:10.1093/auk/103.4.737. Archived (PDF) from the original on 2022-10-09.",
-      "text": "Livezey, Bradley C. (October 1986). \"A phylogenetic analysis of recent Anseriform genera using morphological characters\" (PDF). The Auk. 103 (4): 737\u2013754. doi:10.1093/auk/103.4.737. Archived (PDF) from the original on 2022-10-09.",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/334",
-      "parent": {
-        "$ref": "#/groups/40"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Madsen, Cort S.; McHugh, Kevin P.; de Kloet, Siwo R. (July 1988). \"A partial classification of waterfowl (Anatidae) based on single-copy DNA\" (PDF). The Auk. 105 (3): 452\u2013459. doi:10.1093/auk/105.3.452. Archived (PDF) from the original on 2022-10-09.",
-      "text": "Madsen, Cort S.; McHugh, Kevin P.; de Kloet, Siwo R. (July 1988). \"A partial classification of waterfowl (Anatidae) based on single-copy DNA\" (PDF). The Auk. 105 (3): 452\u2013459. doi:10.1093/auk/105.3.452. Archived (PDF) from the original on 2022-10-09.",
-      "enumerated": false,
-      "marker": "-"
-    },
     {
       "self_ref": "#/texts/335",
       "parent": {
         "$ref": "#/groups/40"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "Maisels, Charles Keith (1999). Early Civilizations of the Old World. London: Routledge. ISBN\u00a0978-0-415-10975-8.",
-      "text": "Maisels, Charles Keith (1999). Early Civilizations of the Old World. London: Routledge. ISBN\u00a0978-0-415-10975-8.",
+      "orig": "American Ornithologists' Union (1998). Checklist of North American Birds (PDF). Washington, DC: American Ornithologists' Union. ISBN\u00a0978-1-891276-00-2. Archived (PDF) from the original on 2022-10-09.",
+      "text": "American Ornithologists' Union (1998). Checklist of North American Birds (PDF). Washington, DC: American Ornithologists' Union. ISBN\u00a0978-1-891276-00-2. Archived (PDF) from the original on 2022-10-09.",
       "enumerated": false,
       "marker": "-"
     },
@@ -6158,10 +6549,11 @@
         "$ref": "#/groups/40"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "Pratt, H. Douglas; Bruner, Phillip L.; Berrett, Delwyn G. (1987). A Field Guide to the Birds of Hawaii and the Tropical Pacific. Princeton, NJ: Princeton University Press. ISBN\u00a00-691-02399-9.",
-      "text": "Pratt, H. Douglas; Bruner, Phillip L.; Berrett, Delwyn G. (1987). A Field Guide to the Birds of Hawaii and the Tropical Pacific. Princeton, NJ: Princeton University Press. ISBN\u00a00-691-02399-9.",
+      "orig": "Carboneras, Carlos (1992). del Hoyo, Josep; Elliott, Andrew; Sargatal, Jordi (eds.). Handbook of the Birds of the World. Vol.\u00a01: Ostrich to Ducks. Barcelona: Lynx Edicions. ISBN\u00a0978-84-87334-10-8.",
+      "text": "Carboneras, Carlos (1992). del Hoyo, Josep; Elliott, Andrew; Sargatal, Jordi (eds.). Handbook of the Birds of the World. Vol.\u00a01: Ostrich to Ducks. Barcelona: Lynx Edicions. ISBN\u00a0978-84-87334-10-8.",
       "enumerated": false,
       "marker": "-"
     },
@@ -6171,10 +6563,11 @@
         "$ref": "#/groups/40"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "Rau, Charles (1876). Early Man in Europe. New York: Harper & Brothers. LCCN\u00a005040168.",
-      "text": "Rau, Charles (1876). Early Man in Europe. New York: Harper & Brothers. LCCN\u00a005040168.",
+      "orig": "Christidis, Les; Boles, Walter E., eds. (2008). Systematics and Taxonomy of Australian Birds. Collingwood, VIC: Csiro Publishing. ISBN\u00a0978-0-643-06511-6.",
+      "text": "Christidis, Les; Boles, Walter E., eds. (2008). Systematics and Taxonomy of Australian Birds. Collingwood, VIC: Csiro Publishing. ISBN\u00a0978-0-643-06511-6.",
       "enumerated": false,
       "marker": "-"
     },
@@ -6184,10 +6577,11 @@
         "$ref": "#/groups/40"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "Shirihai, Hadoram (2008). A Complete Guide to Antarctic Wildlife. Princeton, NJ, US: Princeton University Press. ISBN\u00a0978-0-691-13666-0.",
-      "text": "Shirihai, Hadoram (2008). A Complete Guide to Antarctic Wildlife. Princeton, NJ, US: Princeton University Press. ISBN\u00a0978-0-691-13666-0.",
+      "orig": "Donne-Gouss\u00e9, Carole; Laudet, Vincent; H\u00e4nni, Catherine (July 2002). \"A molecular phylogeny of Anseriformes based on mitochondrial DNA analysis\". Molecular Phylogenetics and Evolution. 23 (3): 339\u2013356. Bibcode:2002MolPE..23..339D. doi:10.1016/S1055-7903(02)00019-2. PMID\u00a012099792.",
+      "text": "Donne-Gouss\u00e9, Carole; Laudet, Vincent; H\u00e4nni, Catherine (July 2002). \"A molecular phylogeny of Anseriformes based on mitochondrial DNA analysis\". Molecular Phylogenetics and Evolution. 23 (3): 339\u2013356. Bibcode:2002MolPE..23..339D. doi:10.1016/S1055-7903(02)00019-2. PMID\u00a012099792.",
       "enumerated": false,
       "marker": "-"
     },
@@ -6197,10 +6591,11 @@
         "$ref": "#/groups/40"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "Sued-Badillo, Jalil (2003). Autochthonous Societies. General History of the Caribbean. Paris: UNESCO. ISBN\u00a0978-92-3-103832-7.",
-      "text": "Sued-Badillo, Jalil (2003). Autochthonous Societies. General History of the Caribbean. Paris: UNESCO. ISBN\u00a0978-92-3-103832-7.",
+      "orig": "Elphick, Chris; Dunning, John B. Jr.; Sibley, David, eds. (2001). The Sibley Guide to Bird Life and Behaviour. London: Christopher Helm. ISBN\u00a0978-0-7136-6250-4.",
+      "text": "Elphick, Chris; Dunning, John B. Jr.; Sibley, David, eds. (2001). The Sibley Guide to Bird Life and Behaviour. London: Christopher Helm. ISBN\u00a0978-0-7136-6250-4.",
       "enumerated": false,
       "marker": "-"
     },
@@ -6210,6 +6605,203 @@
         "$ref": "#/groups/40"
       },
       "children": [],
+      "content_layer": "body",
+      "label": "list_item",
+      "prov": [],
+      "orig": "Erlandson, Jon M. (1994). Early Hunter-Gatherers of the California Coast. New York, NY: Springer Science & Business Media. ISBN\u00a0978-1-4419-3231-0.",
+      "text": "Erlandson, Jon M. (1994). Early Hunter-Gatherers of the California Coast. New York, NY: Springer Science & Business Media. ISBN\u00a0978-1-4419-3231-0.",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/341",
+      "parent": {
+        "$ref": "#/groups/40"
+      },
+      "children": [],
+      "content_layer": "body",
+      "label": "list_item",
+      "prov": [],
+      "orig": "Fieldhouse, Paul (2002). Food, Feasts, and Faith: An Encyclopedia of Food Culture in World Religions. Vol.\u00a0I: A\u2013K. Santa Barbara: ABC-CLIO. ISBN\u00a0978-1-61069-412-4.",
+      "text": "Fieldhouse, Paul (2002). Food, Feasts, and Faith: An Encyclopedia of Food Culture in World Religions. Vol.\u00a0I: A\u2013K. Santa Barbara: ABC-CLIO. ISBN\u00a0978-1-61069-412-4.",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/342",
+      "parent": {
+        "$ref": "#/groups/40"
+      },
+      "children": [],
+      "content_layer": "body",
+      "label": "list_item",
+      "prov": [],
+      "orig": "Fitter, Julian; Fitter, Daniel; Hosking, David (2000). Wildlife of the Gal\u00e1pagos. Princeton, NJ: Princeton University Press. ISBN\u00a0978-0-691-10295-5.",
+      "text": "Fitter, Julian; Fitter, Daniel; Hosking, David (2000). Wildlife of the Gal\u00e1pagos. Princeton, NJ: Princeton University Press. ISBN\u00a0978-0-691-10295-5.",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/343",
+      "parent": {
+        "$ref": "#/groups/40"
+      },
+      "children": [],
+      "content_layer": "body",
+      "label": "list_item",
+      "prov": [],
+      "orig": "Higman, B. W. (2012). How Food Made History. Chichester, UK: John Wiley & Sons. ISBN\u00a0978-1-4051-8947-7.",
+      "text": "Higman, B. W. (2012). How Food Made History. Chichester, UK: John Wiley & Sons. ISBN\u00a0978-1-4051-8947-7.",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/344",
+      "parent": {
+        "$ref": "#/groups/40"
+      },
+      "children": [],
+      "content_layer": "body",
+      "label": "list_item",
+      "prov": [],
+      "orig": "Hume, Julian H. (2012). Extinct Birds. London: Christopher Helm. ISBN\u00a0978-1-4729-3744-5.",
+      "text": "Hume, Julian H. (2012). Extinct Birds. London: Christopher Helm. ISBN\u00a0978-1-4729-3744-5.",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/345",
+      "parent": {
+        "$ref": "#/groups/40"
+      },
+      "children": [],
+      "content_layer": "body",
+      "label": "list_item",
+      "prov": [],
+      "orig": "Jeffries, Richard (2008). Holocene Hunter-Gatherers of the Lower Ohio River Valley. Tuscaloosa: University of Alabama Press. ISBN\u00a0978-0-8173-1658-7.",
+      "text": "Jeffries, Richard (2008). Holocene Hunter-Gatherers of the Lower Ohio River Valley. Tuscaloosa: University of Alabama Press. ISBN\u00a0978-0-8173-1658-7.",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/346",
+      "parent": {
+        "$ref": "#/groups/40"
+      },
+      "children": [],
+      "content_layer": "body",
+      "label": "list_item",
+      "prov": [],
+      "orig": "Kear, Janet, ed. (2005). Ducks, Geese and Swans: Species Accounts (Cairina to Mergus). Bird Families of the World. Oxford: Oxford University Press. ISBN\u00a0978-0-19-861009-0.",
+      "text": "Kear, Janet, ed. (2005). Ducks, Geese and Swans: Species Accounts (Cairina to Mergus). Bird Families of the World. Oxford: Oxford University Press. ISBN\u00a0978-0-19-861009-0.",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/347",
+      "parent": {
+        "$ref": "#/groups/40"
+      },
+      "children": [],
+      "content_layer": "body",
+      "label": "list_item",
+      "prov": [],
+      "orig": "Livezey, Bradley C. (October 1986). \"A phylogenetic analysis of recent Anseriform genera using morphological characters\" (PDF). The Auk. 103 (4): 737\u2013754. doi:10.1093/auk/103.4.737. Archived (PDF) from the original on 2022-10-09.",
+      "text": "Livezey, Bradley C. (October 1986). \"A phylogenetic analysis of recent Anseriform genera using morphological characters\" (PDF). The Auk. 103 (4): 737\u2013754. doi:10.1093/auk/103.4.737. Archived (PDF) from the original on 2022-10-09.",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/348",
+      "parent": {
+        "$ref": "#/groups/40"
+      },
+      "children": [],
+      "content_layer": "body",
+      "label": "list_item",
+      "prov": [],
+      "orig": "Madsen, Cort S.; McHugh, Kevin P.; de Kloet, Siwo R. (July 1988). \"A partial classification of waterfowl (Anatidae) based on single-copy DNA\" (PDF). The Auk. 105 (3): 452\u2013459. doi:10.1093/auk/105.3.452. Archived (PDF) from the original on 2022-10-09.",
+      "text": "Madsen, Cort S.; McHugh, Kevin P.; de Kloet, Siwo R. (July 1988). \"A partial classification of waterfowl (Anatidae) based on single-copy DNA\" (PDF). The Auk. 105 (3): 452\u2013459. doi:10.1093/auk/105.3.452. Archived (PDF) from the original on 2022-10-09.",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/349",
+      "parent": {
+        "$ref": "#/groups/40"
+      },
+      "children": [],
+      "content_layer": "body",
+      "label": "list_item",
+      "prov": [],
+      "orig": "Maisels, Charles Keith (1999). Early Civilizations of the Old World. London: Routledge. ISBN\u00a0978-0-415-10975-8.",
+      "text": "Maisels, Charles Keith (1999). Early Civilizations of the Old World. London: Routledge. ISBN\u00a0978-0-415-10975-8.",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/350",
+      "parent": {
+        "$ref": "#/groups/40"
+      },
+      "children": [],
+      "content_layer": "body",
+      "label": "list_item",
+      "prov": [],
+      "orig": "Pratt, H. Douglas; Bruner, Phillip L.; Berrett, Delwyn G. (1987). A Field Guide to the Birds of Hawaii and the Tropical Pacific. Princeton, NJ: Princeton University Press. ISBN\u00a00-691-02399-9.",
+      "text": "Pratt, H. Douglas; Bruner, Phillip L.; Berrett, Delwyn G. (1987). A Field Guide to the Birds of Hawaii and the Tropical Pacific. Princeton, NJ: Princeton University Press. ISBN\u00a00-691-02399-9.",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/351",
+      "parent": {
+        "$ref": "#/groups/40"
+      },
+      "children": [],
+      "content_layer": "body",
+      "label": "list_item",
+      "prov": [],
+      "orig": "Rau, Charles (1876). Early Man in Europe. New York: Harper & Brothers. LCCN\u00a005040168.",
+      "text": "Rau, Charles (1876). Early Man in Europe. New York: Harper & Brothers. LCCN\u00a005040168.",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/352",
+      "parent": {
+        "$ref": "#/groups/40"
+      },
+      "children": [],
+      "content_layer": "body",
+      "label": "list_item",
+      "prov": [],
+      "orig": "Shirihai, Hadoram (2008). A Complete Guide to Antarctic Wildlife. Princeton, NJ, US: Princeton University Press. ISBN\u00a0978-0-691-13666-0.",
+      "text": "Shirihai, Hadoram (2008). A Complete Guide to Antarctic Wildlife. Princeton, NJ, US: Princeton University Press. ISBN\u00a0978-0-691-13666-0.",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/353",
+      "parent": {
+        "$ref": "#/groups/40"
+      },
+      "children": [],
+      "content_layer": "body",
+      "label": "list_item",
+      "prov": [],
+      "orig": "Sued-Badillo, Jalil (2003). Autochthonous Societies. General History of the Caribbean. Paris: UNESCO. ISBN\u00a0978-92-3-103832-7.",
+      "text": "Sued-Badillo, Jalil (2003). Autochthonous Societies. General History of the Caribbean. Paris: UNESCO. ISBN\u00a0978-92-3-103832-7.",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/354",
+      "parent": {
+        "$ref": "#/groups/40"
+      },
+      "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "Thorpe, I. J. (1996). The Origins of Agriculture in Europe. New York: Routledge. ISBN\u00a0978-0-415-08009-5.",
@@ -6218,9 +6810,9 @@
       "marker": "-"
     },
     {
-      "self_ref": "#/texts/341",
+      "self_ref": "#/texts/355",
       "parent": {
-        "$ref": "#/texts/39"
+        "$ref": "#/texts/43"
       },
       "children": [
         {
@@ -6235,9 +6827,18 @@
         {
           "$ref": "#/pictures/17"
         },
+        {
+          "$ref": "#/texts/365"
+        },
+        {
+          "$ref": "#/texts/366"
+        },
         {
           "$ref": "#/groups/43"
         },
+        {
+          "$ref": "#/texts/370"
+        },
         {
           "$ref": "#/groups/44"
         },
@@ -6254,6 +6855,7 @@
           "$ref": "#/groups/48"
         }
       ],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
       "orig": "External links",
@@ -6261,11 +6863,12 @@
       "level": 2
     },
     {
-      "self_ref": "#/texts/342",
+      "self_ref": "#/texts/356",
       "parent": {
         "$ref": "#/groups/41"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "Definitions from Wiktionary",
@@ -6274,11 +6877,12 @@
       "marker": "-"
     },
     {
-      "self_ref": "#/texts/343",
+      "self_ref": "#/texts/357",
       "parent": {
         "$ref": "#/groups/41"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "Media from Commons",
@@ -6287,11 +6891,12 @@
       "marker": "-"
     },
     {
-      "self_ref": "#/texts/344",
+      "self_ref": "#/texts/358",
       "parent": {
         "$ref": "#/groups/41"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "Quotations from Wikiquote",
@@ -6300,11 +6905,12 @@
       "marker": "-"
     },
     {
-      "self_ref": "#/texts/345",
+      "self_ref": "#/texts/359",
       "parent": {
         "$ref": "#/groups/41"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "Recipes from Wikibooks",
@@ -6313,11 +6919,12 @@
       "marker": "-"
     },
     {
-      "self_ref": "#/texts/346",
+      "self_ref": "#/texts/360",
       "parent": {
         "$ref": "#/groups/41"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "Taxa from Wikispecies",
@@ -6326,11 +6933,12 @@
       "marker": "-"
     },
     {
-      "self_ref": "#/texts/347",
+      "self_ref": "#/texts/361",
       "parent": {
         "$ref": "#/groups/41"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "Data from Wikidata",
@@ -6339,11 +6947,12 @@
       "marker": "-"
     },
     {
-      "self_ref": "#/texts/348",
+      "self_ref": "#/texts/362",
       "parent": {
         "$ref": "#/groups/42"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "list of books (useful looking abstracts)",
@@ -6352,11 +6961,12 @@
       "marker": "-"
     },
     {
-      "self_ref": "#/texts/349",
+      "self_ref": "#/texts/363",
       "parent": {
         "$ref": "#/groups/42"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "Ducks on postage stamps Archived 2013-05-13 at the Wayback Machine",
@@ -6365,24 +6975,12 @@
       "marker": "-"
     },
     {
-      "self_ref": "#/texts/350",
-      "parent": {
-        "$ref": "#/groups/42"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "",
-      "text": "",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/351",
+      "self_ref": "#/texts/364",
       "parent": {
         "$ref": "#/groups/42"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "Ducks at a Distance, by Rob Hines at Project Gutenberg - A modern illustrated guide to identification of US waterfowl",
@@ -6391,11 +6989,36 @@
       "marker": "-"
     },
     {
-      "self_ref": "#/texts/352",
+      "self_ref": "#/texts/365",
+      "parent": {
+        "$ref": "#/texts/355"
+      },
+      "children": [],
+      "content_layer": "body",
+      "label": "text",
+      "prov": [],
+      "orig": "Retrieved from \"\"",
+      "text": "Retrieved from \"\""
+    },
+    {
+      "self_ref": "#/texts/366",
+      "parent": {
+        "$ref": "#/texts/355"
+      },
+      "children": [],
+      "content_layer": "body",
+      "label": "text",
+      "prov": [],
+      "orig": ":",
+      "text": ":"
+    },
+    {
+      "self_ref": "#/texts/367",
       "parent": {
         "$ref": "#/groups/43"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "Ducks",
@@ -6404,11 +7027,12 @@
       "marker": "-"
     },
     {
-      "self_ref": "#/texts/353",
+      "self_ref": "#/texts/368",
       "parent": {
         "$ref": "#/groups/43"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "Game birds",
@@ -6417,11 +7041,12 @@
       "marker": "-"
     },
     {
-      "self_ref": "#/texts/354",
+      "self_ref": "#/texts/369",
       "parent": {
         "$ref": "#/groups/43"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "Bird common names",
@@ -6429,213 +7054,17 @@
       "enumerated": false,
       "marker": "-"
     },
-    {
-      "self_ref": "#/texts/355",
-      "parent": {
-        "$ref": "#/groups/44"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "All accuracy disputes",
-      "text": "All accuracy disputes",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/356",
-      "parent": {
-        "$ref": "#/groups/44"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Accuracy disputes from February 2020",
-      "text": "Accuracy disputes from February 2020",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/357",
-      "parent": {
-        "$ref": "#/groups/44"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "CS1 Finnish-language sources (fi)",
-      "text": "CS1 Finnish-language sources (fi)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/358",
-      "parent": {
-        "$ref": "#/groups/44"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "CS1 Latvian-language sources (lv)",
-      "text": "CS1 Latvian-language sources (lv)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/359",
-      "parent": {
-        "$ref": "#/groups/44"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "CS1 Swedish-language sources (sv)",
-      "text": "CS1 Swedish-language sources (sv)",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/360",
-      "parent": {
-        "$ref": "#/groups/44"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Articles with short description",
-      "text": "Articles with short description",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/361",
-      "parent": {
-        "$ref": "#/groups/44"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Short description is different from Wikidata",
-      "text": "Short description is different from Wikidata",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/362",
-      "parent": {
-        "$ref": "#/groups/44"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Wikipedia indefinitely move-protected pages",
-      "text": "Wikipedia indefinitely move-protected pages",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/363",
-      "parent": {
-        "$ref": "#/groups/44"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Wikipedia indefinitely semi-protected pages",
-      "text": "Wikipedia indefinitely semi-protected pages",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/364",
-      "parent": {
-        "$ref": "#/groups/44"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Articles with 'species' microformats",
-      "text": "Articles with 'species' microformats",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/365",
-      "parent": {
-        "$ref": "#/groups/44"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Articles containing Old English (ca. 450-1100)-language text",
-      "text": "Articles containing Old English (ca. 450-1100)-language text",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/366",
-      "parent": {
-        "$ref": "#/groups/44"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Articles containing Dutch-language text",
-      "text": "Articles containing Dutch-language text",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/367",
-      "parent": {
-        "$ref": "#/groups/44"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Articles containing German-language text",
-      "text": "Articles containing German-language text",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/368",
-      "parent": {
-        "$ref": "#/groups/44"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Articles containing Norwegian-language text",
-      "text": "Articles containing Norwegian-language text",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/369",
-      "parent": {
-        "$ref": "#/groups/44"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "Articles containing Lithuanian-language text",
-      "text": "Articles containing Lithuanian-language text",
-      "enumerated": false,
-      "marker": "-"
-    },
     {
       "self_ref": "#/texts/370",
       "parent": {
-        "$ref": "#/groups/44"
+        "$ref": "#/texts/355"
       },
       "children": [],
-      "label": "list_item",
+      "content_layer": "body",
+      "label": "text",
       "prov": [],
-      "orig": "Articles containing Ancient Greek (to 1453)-language text",
-      "text": "Articles containing Ancient Greek (to 1453)-language text",
-      "enumerated": false,
-      "marker": "-"
+      "orig": "Hidden categories:",
+      "text": "Hidden categories:"
     },
     {
       "self_ref": "#/texts/371",
@@ -6643,10 +7072,11 @@
         "$ref": "#/groups/44"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "All articles with self-published sources",
-      "text": "All articles with self-published sources",
+      "orig": "All accuracy disputes",
+      "text": "All accuracy disputes",
       "enumerated": false,
       "marker": "-"
     },
@@ -6656,10 +7086,11 @@
         "$ref": "#/groups/44"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "Articles with self-published sources from February 2020",
-      "text": "Articles with self-published sources from February 2020",
+      "orig": "Accuracy disputes from February 2020",
+      "text": "Accuracy disputes from February 2020",
       "enumerated": false,
       "marker": "-"
     },
@@ -6669,10 +7100,11 @@
         "$ref": "#/groups/44"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "All articles with unsourced statements",
-      "text": "All articles with unsourced statements",
+      "orig": "CS1 Finnish-language sources (fi)",
+      "text": "CS1 Finnish-language sources (fi)",
       "enumerated": false,
       "marker": "-"
     },
@@ -6682,10 +7114,11 @@
         "$ref": "#/groups/44"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "Articles with unsourced statements from January 2022",
-      "text": "Articles with unsourced statements from January 2022",
+      "orig": "CS1 Latvian-language sources (lv)",
+      "text": "CS1 Latvian-language sources (lv)",
       "enumerated": false,
       "marker": "-"
     },
@@ -6695,10 +7128,11 @@
         "$ref": "#/groups/44"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "CS1: long volume value",
-      "text": "CS1: long volume value",
+      "orig": "CS1 Swedish-language sources (sv)",
+      "text": "CS1 Swedish-language sources (sv)",
       "enumerated": false,
       "marker": "-"
     },
@@ -6708,10 +7142,11 @@
         "$ref": "#/groups/44"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "Pages using Sister project links with wikidata mismatch",
-      "text": "Pages using Sister project links with wikidata mismatch",
+      "orig": "Articles with short description",
+      "text": "Articles with short description",
       "enumerated": false,
       "marker": "-"
     },
@@ -6721,10 +7156,11 @@
         "$ref": "#/groups/44"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "Pages using Sister project links with hidden wikidata",
-      "text": "Pages using Sister project links with hidden wikidata",
+      "orig": "Short description is different from Wikidata",
+      "text": "Short description is different from Wikidata",
       "enumerated": false,
       "marker": "-"
     },
@@ -6734,10 +7170,11 @@
         "$ref": "#/groups/44"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "Webarchive template wayback links",
-      "text": "Webarchive template wayback links",
+      "orig": "Wikipedia indefinitely move-protected pages",
+      "text": "Wikipedia indefinitely move-protected pages",
       "enumerated": false,
       "marker": "-"
     },
@@ -6747,10 +7184,11 @@
         "$ref": "#/groups/44"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
-      "orig": "Articles with Project Gutenberg links",
-      "text": "Articles with Project Gutenberg links",
+      "orig": "Wikipedia indefinitely semi-protected pages",
+      "text": "Wikipedia indefinitely semi-protected pages",
       "enumerated": false,
       "marker": "-"
     },
@@ -6760,6 +7198,231 @@
         "$ref": "#/groups/44"
       },
       "children": [],
+      "content_layer": "body",
+      "label": "list_item",
+      "prov": [],
+      "orig": "Articles with 'species' microformats",
+      "text": "Articles with 'species' microformats",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/381",
+      "parent": {
+        "$ref": "#/groups/44"
+      },
+      "children": [],
+      "content_layer": "body",
+      "label": "list_item",
+      "prov": [],
+      "orig": "Articles containing Old English (ca. 450-1100)-language text",
+      "text": "Articles containing Old English (ca. 450-1100)-language text",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/382",
+      "parent": {
+        "$ref": "#/groups/44"
+      },
+      "children": [],
+      "content_layer": "body",
+      "label": "list_item",
+      "prov": [],
+      "orig": "Articles containing Dutch-language text",
+      "text": "Articles containing Dutch-language text",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/383",
+      "parent": {
+        "$ref": "#/groups/44"
+      },
+      "children": [],
+      "content_layer": "body",
+      "label": "list_item",
+      "prov": [],
+      "orig": "Articles containing German-language text",
+      "text": "Articles containing German-language text",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/384",
+      "parent": {
+        "$ref": "#/groups/44"
+      },
+      "children": [],
+      "content_layer": "body",
+      "label": "list_item",
+      "prov": [],
+      "orig": "Articles containing Norwegian-language text",
+      "text": "Articles containing Norwegian-language text",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/385",
+      "parent": {
+        "$ref": "#/groups/44"
+      },
+      "children": [],
+      "content_layer": "body",
+      "label": "list_item",
+      "prov": [],
+      "orig": "Articles containing Lithuanian-language text",
+      "text": "Articles containing Lithuanian-language text",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/386",
+      "parent": {
+        "$ref": "#/groups/44"
+      },
+      "children": [],
+      "content_layer": "body",
+      "label": "list_item",
+      "prov": [],
+      "orig": "Articles containing Ancient Greek (to 1453)-language text",
+      "text": "Articles containing Ancient Greek (to 1453)-language text",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/387",
+      "parent": {
+        "$ref": "#/groups/44"
+      },
+      "children": [],
+      "content_layer": "body",
+      "label": "list_item",
+      "prov": [],
+      "orig": "All articles with self-published sources",
+      "text": "All articles with self-published sources",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/388",
+      "parent": {
+        "$ref": "#/groups/44"
+      },
+      "children": [],
+      "content_layer": "body",
+      "label": "list_item",
+      "prov": [],
+      "orig": "Articles with self-published sources from February 2020",
+      "text": "Articles with self-published sources from February 2020",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/389",
+      "parent": {
+        "$ref": "#/groups/44"
+      },
+      "children": [],
+      "content_layer": "body",
+      "label": "list_item",
+      "prov": [],
+      "orig": "All articles with unsourced statements",
+      "text": "All articles with unsourced statements",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/390",
+      "parent": {
+        "$ref": "#/groups/44"
+      },
+      "children": [],
+      "content_layer": "body",
+      "label": "list_item",
+      "prov": [],
+      "orig": "Articles with unsourced statements from January 2022",
+      "text": "Articles with unsourced statements from January 2022",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/391",
+      "parent": {
+        "$ref": "#/groups/44"
+      },
+      "children": [],
+      "content_layer": "body",
+      "label": "list_item",
+      "prov": [],
+      "orig": "CS1: long volume value",
+      "text": "CS1: long volume value",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/392",
+      "parent": {
+        "$ref": "#/groups/44"
+      },
+      "children": [],
+      "content_layer": "body",
+      "label": "list_item",
+      "prov": [],
+      "orig": "Pages using Sister project links with wikidata mismatch",
+      "text": "Pages using Sister project links with wikidata mismatch",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/393",
+      "parent": {
+        "$ref": "#/groups/44"
+      },
+      "children": [],
+      "content_layer": "body",
+      "label": "list_item",
+      "prov": [],
+      "orig": "Pages using Sister project links with hidden wikidata",
+      "text": "Pages using Sister project links with hidden wikidata",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/394",
+      "parent": {
+        "$ref": "#/groups/44"
+      },
+      "children": [],
+      "content_layer": "body",
+      "label": "list_item",
+      "prov": [],
+      "orig": "Webarchive template wayback links",
+      "text": "Webarchive template wayback links",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/395",
+      "parent": {
+        "$ref": "#/groups/44"
+      },
+      "children": [],
+      "content_layer": "body",
+      "label": "list_item",
+      "prov": [],
+      "orig": "Articles with Project Gutenberg links",
+      "text": "Articles with Project Gutenberg links",
+      "enumerated": false,
+      "marker": "-"
+    },
+    {
+      "self_ref": "#/texts/396",
+      "parent": {
+        "$ref": "#/groups/44"
+      },
+      "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "Articles containing video clips",
@@ -6768,11 +7431,12 @@
       "marker": "-"
     },
     {
-      "self_ref": "#/texts/381",
+      "self_ref": "#/texts/397",
       "parent": {
         "$ref": "#/groups/45"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "This page was last edited on 21 September 2024, at 12:11\u00a0(UTC).",
@@ -6781,11 +7445,12 @@
       "marker": "-"
     },
     {
-      "self_ref": "#/texts/382",
+      "self_ref": "#/texts/398",
       "parent": {
         "$ref": "#/groups/45"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "Text is available under the Creative Commons Attribution-ShareAlike License 4.0;\nadditional terms may apply. By using this site, you agree to the Terms of Use and Privacy Policy. Wikipedia\u00ae is a registered trademark of the Wikimedia Foundation, Inc., a non-profit organization.",
@@ -6794,11 +7459,12 @@
       "marker": "-"
     },
     {
-      "self_ref": "#/texts/383",
+      "self_ref": "#/texts/399",
       "parent": {
         "$ref": "#/groups/46"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "Privacy policy",
@@ -6807,11 +7473,12 @@
       "marker": "-"
     },
     {
-      "self_ref": "#/texts/384",
+      "self_ref": "#/texts/400",
       "parent": {
         "$ref": "#/groups/46"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "About Wikipedia",
@@ -6820,11 +7487,12 @@
       "marker": "-"
     },
     {
-      "self_ref": "#/texts/385",
+      "self_ref": "#/texts/401",
       "parent": {
         "$ref": "#/groups/46"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "Disclaimers",
@@ -6833,11 +7501,12 @@
       "marker": "-"
     },
     {
-      "self_ref": "#/texts/386",
+      "self_ref": "#/texts/402",
       "parent": {
         "$ref": "#/groups/46"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "Contact Wikipedia",
@@ -6846,11 +7515,12 @@
       "marker": "-"
     },
     {
-      "self_ref": "#/texts/387",
+      "self_ref": "#/texts/403",
       "parent": {
         "$ref": "#/groups/46"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "Code of Conduct",
@@ -6859,11 +7529,12 @@
       "marker": "-"
     },
     {
-      "self_ref": "#/texts/388",
+      "self_ref": "#/texts/404",
       "parent": {
         "$ref": "#/groups/46"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "Developers",
@@ -6872,11 +7543,12 @@
       "marker": "-"
     },
     {
-      "self_ref": "#/texts/389",
+      "self_ref": "#/texts/405",
       "parent": {
         "$ref": "#/groups/46"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "Statistics",
@@ -6885,11 +7557,12 @@
       "marker": "-"
     },
     {
-      "self_ref": "#/texts/390",
+      "self_ref": "#/texts/406",
       "parent": {
         "$ref": "#/groups/46"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "Cookie statement",
@@ -6898,43 +7571,18 @@
       "marker": "-"
     },
     {
-      "self_ref": "#/texts/391",
+      "self_ref": "#/texts/407",
       "parent": {
         "$ref": "#/groups/46"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "Mobile view",
       "text": "Mobile view",
       "enumerated": false,
       "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/392",
-      "parent": {
-        "$ref": "#/groups/47"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "",
-      "text": "",
-      "enumerated": false,
-      "marker": "-"
-    },
-    {
-      "self_ref": "#/texts/393",
-      "parent": {
-        "$ref": "#/groups/47"
-      },
-      "children": [],
-      "label": "list_item",
-      "prov": [],
-      "orig": "",
-      "text": "",
-      "enumerated": false,
-      "marker": "-"
     }
   ],
   "pictures": [
@@ -6944,6 +7592,7 @@
         "$ref": "#/body"
       },
       "children": [],
+      "content_layer": "furniture",
       "label": "picture",
       "prov": [],
       "captions": [],
@@ -6957,6 +7606,7 @@
         "$ref": "#/body"
       },
       "children": [],
+      "content_layer": "furniture",
       "label": "picture",
       "prov": [],
       "captions": [],
@@ -6970,6 +7620,7 @@
         "$ref": "#/body"
       },
       "children": [],
+      "content_layer": "furniture",
       "label": "picture",
       "prov": [],
       "captions": [],
@@ -6980,9 +7631,10 @@
     {
       "self_ref": "#/pictures/3",
       "parent": {
-        "$ref": "#/texts/39"
+        "$ref": "#/texts/43"
       },
       "children": [],
+      "content_layer": "body",
       "label": "picture",
       "prov": [],
       "captions": [],
@@ -6993,14 +7645,15 @@
     {
       "self_ref": "#/pictures/4",
       "parent": {
-        "$ref": "#/texts/200"
+        "$ref": "#/texts/214"
       },
       "children": [],
+      "content_layer": "body",
       "label": "picture",
       "prov": [],
       "captions": [
         {
-          "$ref": "#/texts/202"
+          "$ref": "#/texts/216"
         }
       ],
       "references": [],
@@ -7010,94 +7663,10 @@
     {
       "self_ref": "#/pictures/5",
       "parent": {
-        "$ref": "#/texts/200"
-      },
-      "children": [],
-      "label": "picture",
-      "prov": [],
-      "captions": [
-        {
-          "$ref": "#/texts/206"
-        }
-      ],
-      "references": [],
-      "footnotes": [],
-      "annotations": []
-    },
-    {
-      "self_ref": "#/pictures/6",
-      "parent": {
-        "$ref": "#/texts/200"
-      },
-      "children": [],
-      "label": "picture",
-      "prov": [],
-      "captions": [
-        {
-          "$ref": "#/texts/207"
-        }
-      ],
-      "references": [],
-      "footnotes": [],
-      "annotations": []
-    },
-    {
-      "self_ref": "#/pictures/7",
-      "parent": {
-        "$ref": "#/texts/208"
-      },
-      "children": [],
-      "label": "picture",
-      "prov": [],
-      "captions": [
-        {
-          "$ref": "#/texts/210"
-        }
-      ],
-      "references": [],
-      "footnotes": [],
-      "annotations": []
-    },
-    {
-      "self_ref": "#/pictures/8",
-      "parent": {
-        "$ref": "#/texts/213"
-      },
-      "children": [],
-      "label": "picture",
-      "prov": [],
-      "captions": [
-        {
-          "$ref": "#/texts/214"
-        }
-      ],
-      "references": [],
-      "footnotes": [],
-      "annotations": []
-    },
-    {
-      "self_ref": "#/pictures/9",
-      "parent": {
-        "$ref": "#/texts/217"
-      },
-      "children": [],
-      "label": "picture",
-      "prov": [],
-      "captions": [
-        {
-          "$ref": "#/texts/218"
-        }
-      ],
-      "references": [],
-      "footnotes": [],
-      "annotations": []
-    },
-    {
-      "self_ref": "#/pictures/10",
-      "parent": {
-        "$ref": "#/texts/217"
+        "$ref": "#/texts/214"
       },
       "children": [],
+      "content_layer": "body",
       "label": "picture",
       "prov": [],
       "captions": [
@@ -7110,11 +7679,30 @@
       "annotations": []
     },
     {
-      "self_ref": "#/pictures/11",
+      "self_ref": "#/pictures/6",
       "parent": {
-        "$ref": "#/texts/223"
+        "$ref": "#/texts/214"
       },
       "children": [],
+      "content_layer": "body",
+      "label": "picture",
+      "prov": [],
+      "captions": [
+        {
+          "$ref": "#/texts/221"
+        }
+      ],
+      "references": [],
+      "footnotes": [],
+      "annotations": []
+    },
+    {
+      "self_ref": "#/pictures/7",
+      "parent": {
+        "$ref": "#/texts/222"
+      },
+      "children": [],
+      "content_layer": "body",
       "label": "picture",
       "prov": [],
       "captions": [
@@ -7126,46 +7714,85 @@
       "footnotes": [],
       "annotations": []
     },
+    {
+      "self_ref": "#/pictures/8",
+      "parent": {
+        "$ref": "#/texts/227"
+      },
+      "children": [],
+      "content_layer": "body",
+      "label": "picture",
+      "prov": [],
+      "captions": [
+        {
+          "$ref": "#/texts/228"
+        }
+      ],
+      "references": [],
+      "footnotes": [],
+      "annotations": []
+    },
+    {
+      "self_ref": "#/pictures/9",
+      "parent": {
+        "$ref": "#/texts/231"
+      },
+      "children": [],
+      "content_layer": "body",
+      "label": "picture",
+      "prov": [],
+      "captions": [
+        {
+          "$ref": "#/texts/232"
+        }
+      ],
+      "references": [],
+      "footnotes": [],
+      "annotations": []
+    },
+    {
+      "self_ref": "#/pictures/10",
+      "parent": {
+        "$ref": "#/texts/231"
+      },
+      "children": [],
+      "content_layer": "body",
+      "label": "picture",
+      "prov": [],
+      "captions": [
+        {
+          "$ref": "#/texts/234"
+        }
+      ],
+      "references": [],
+      "footnotes": [],
+      "annotations": []
+    },
+    {
+      "self_ref": "#/pictures/11",
+      "parent": {
+        "$ref": "#/texts/237"
+      },
+      "children": [],
+      "content_layer": "body",
+      "label": "picture",
+      "prov": [],
+      "captions": [
+        {
+          "$ref": "#/texts/238"
+        }
+      ],
+      "references": [],
+      "footnotes": [],
+      "annotations": []
+    },
     {
       "self_ref": "#/pictures/12",
       "parent": {
-        "$ref": "#/texts/223"
-      },
-      "children": [],
-      "label": "picture",
-      "prov": [],
-      "captions": [
-        {
-          "$ref": "#/texts/225"
-        }
-      ],
-      "references": [],
-      "footnotes": [],
-      "annotations": []
-    },
-    {
-      "self_ref": "#/pictures/13",
-      "parent": {
-        "$ref": "#/texts/232"
-      },
-      "children": [],
-      "label": "picture",
-      "prov": [],
-      "captions": [
-        {
-          "$ref": "#/texts/233"
-        }
-      ],
-      "references": [],
-      "footnotes": [],
-      "annotations": []
-    },
-    {
-      "self_ref": "#/pictures/14",
-      "parent": {
-        "$ref": "#/texts/238"
+        "$ref": "#/texts/237"
       },
       "children": [],
+      "content_layer": "body",
       "label": "picture",
       "prov": [],
       "captions": [
@@ -7178,11 +7805,12 @@
       "annotations": []
     },
     {
-      "self_ref": "#/pictures/15",
+      "self_ref": "#/pictures/13",
       "parent": {
         "$ref": "#/texts/246"
       },
       "children": [],
+      "content_layer": "body",
       "label": "picture",
       "prov": [],
       "captions": [
@@ -7195,16 +7823,53 @@
       "annotations": []
     },
     {
-      "self_ref": "#/pictures/16",
+      "self_ref": "#/pictures/14",
       "parent": {
-        "$ref": "#/texts/249"
+        "$ref": "#/texts/252"
       },
       "children": [],
+      "content_layer": "body",
       "label": "picture",
       "prov": [],
       "captions": [
         {
-          "$ref": "#/texts/250"
+          "$ref": "#/texts/253"
+        }
+      ],
+      "references": [],
+      "footnotes": [],
+      "annotations": []
+    },
+    {
+      "self_ref": "#/pictures/15",
+      "parent": {
+        "$ref": "#/texts/260"
+      },
+      "children": [],
+      "content_layer": "body",
+      "label": "picture",
+      "prov": [],
+      "captions": [
+        {
+          "$ref": "#/texts/261"
+        }
+      ],
+      "references": [],
+      "footnotes": [],
+      "annotations": []
+    },
+    {
+      "self_ref": "#/pictures/16",
+      "parent": {
+        "$ref": "#/texts/263"
+      },
+      "children": [],
+      "content_layer": "body",
+      "label": "picture",
+      "prov": [],
+      "captions": [
+        {
+          "$ref": "#/texts/264"
         }
       ],
       "references": [],
@@ -7214,9 +7879,10 @@
     {
       "self_ref": "#/pictures/17",
       "parent": {
-        "$ref": "#/texts/341"
+        "$ref": "#/texts/355"
       },
       "children": [],
+      "content_layer": "body",
       "label": "picture",
       "prov": [],
       "captions": [],
@@ -7229,9 +7895,10 @@
     {
       "self_ref": "#/tables/0",
       "parent": {
-        "$ref": "#/texts/39"
+        "$ref": "#/texts/43"
       },
       "children": [],
+      "content_layer": "body",
       "label": "table",
       "prov": [],
       "captions": [],
@@ -7827,9 +8494,10 @@
     {
       "self_ref": "#/tables/1",
       "parent": {
-        "$ref": "#/texts/341"
+        "$ref": "#/texts/355"
       },
       "children": [],
+      "content_layer": "body",
       "label": "table",
       "prov": [],
       "captions": [],
@@ -7984,5 +8652,6 @@
     }
   ],
   "key_value_items": [],
+  "form_items": [],
   "pages": {}
 }
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v2/wiki_duck.html.md b/tests/data/groundtruth/docling_v2/wiki_duck.html.md
index 856e97a7..b08b31c6 100644
--- a/tests/data/groundtruth/docling_v2/wiki_duck.html.md
+++ b/tests/data/groundtruth/docling_v2/wiki_duck.html.md
@@ -1,53 +1,3 @@
-- Main page
-- Contents
-- Current events
-- Random article
-- About Wikipedia
-- Contact us
-
-- Help
-- Learn to edit
-- Community portal
-- Recent changes
-- Upload file
-
-<!-- image -->
-
-<!-- image -->
-
-<!-- image -->
-
-    - Donate
-        - Create account
-        - Log in
-        - Create account
-        - Log in
-        - Contributions
-        - Talk
-
-## Contents
-
-        - (Top)
-        - 1 Etymology
-        - 2 Taxonomy
-        - 3 Morphology
-        - 4 Distribution and habitat
-        - 5 Behaviour Toggle Behaviour subsection
-            - 5.1 Feeding
-            - 5.2 Breeding
-            - 5.3 Communication
-            - 5.4 Predators
-    - 6 Relationship with humans Toggle Relationship with humans subsection
-        - 6.1 Hunting
-        - 6.2 Domestication
-        - 6.3 Heraldry
-        - 6.4 Cultural references
-- 7 See also
-- 8 Notes Toggle Notes subsection
-    - 8.1 Citations
-    - 8.2 Sources
-- 9 External links
-
 # Duck
 
 - Acèh
@@ -193,9 +143,17 @@
     - Read
     - View source
     - View history
+
+Tools
+
+Actions
+
     - Read
     - View source
     - View history
+
+General
+
     - What links here
     - Related changes
     - Upload file
@@ -206,13 +164,29 @@
     - Get shortened URL
     - Download QR code
     - Wikidata item
+
+Print/export
+
     - Download as PDF
     - Printable version
+
+In other projects
+
     - Wikimedia Commons
     - Wikiquote
 
+Appearance
+
 <!-- image -->
 
+From Wikipedia, the free encyclopedia
+
+Common name for many species of bird
+
+This article is about the bird. For duck as a food, see . For other uses, see .
+
+"Duckling" redirects here. For other uses, see .
+
 | Duck                           | Duck                           |
 |--------------------------------|--------------------------------|
 |                                |                                |
@@ -389,22 +363,22 @@ The 1992 Disney film The Mighty Ducks, starring Emilio Estevez, chose the duck a
 4. ^ Visca, Curt; Visca, Kelley (2003). How to Draw Cartoon Birds. The Rosen Publishing Group. ISBN 9780823961566.
 5. ^ a b c d Carboneras 1992, p. 536.
 6. ^ Livezey 1986, pp. 737–738.
-7. ^ Madsen, McHugh & de Kloet 1988, p. 452.
-8. ^ Donne-Goussé, Laudet & Hänni 2002, pp. 353–354.
+7. ^ Madsen, McHugh &amp; de Kloet 1988, p. 452.
+8. ^ Donne-Goussé, Laudet &amp; Hänni 2002, pp. 353–354.
 9. ^ a b c d e f Carboneras 1992, p. 540.
-10. ^ Elphick, Dunning & Sibley 2001, p. 191.
+10. ^ Elphick, Dunning &amp; Sibley 2001, p. 191.
 11. ^ Kear 2005, p. 448.
 12. ^ Kear 2005, p. 622–623.
 13. ^ Kear 2005, p. 686.
-14. ^ Elphick, Dunning & Sibley 2001, p. 193.
+14. ^ Elphick, Dunning &amp; Sibley 2001, p. 193.
 15. ^ a b c d e f g Carboneras 1992, p. 537.
 16. ^ American Ornithologists' Union 1998, p. xix.
 17. ^ American Ornithologists' Union 1998.
 18. ^ Carboneras 1992, p. 538.
-19. ^ Christidis & Boles 2008, p. 62.
+19. ^ Christidis &amp; Boles 2008, p. 62.
 20. ^ Shirihai 2008, pp. 239, 245.
-21. ^ a b Pratt, Bruner & Berrett 1987, pp. 98–107.
-22. ^ Fitter, Fitter & Hosking 2000, pp. 52–3.
+21. ^ a b Pratt, Bruner &amp; Berrett 1987, pp. 98–107.
+22. ^ Fitter, Fitter &amp; Hosking 2000, pp. 52–3.
 23. ^ "Pacific Black Duck". www.wiresnr.org. Retrieved 2018-04-27.
 24. ^ Ogden, Evans. "Dabbling Ducks". CWE. Retrieved 2006-11-02.
 25. ^ Karl Mathiesen (16 March 2015). "Don't feed the ducks bread, say conservationists". The Guardian. Retrieved 13 November 2016.
@@ -412,7 +386,7 @@ The 1992 Disney film The Mighty Ducks, starring Emilio Estevez, chose the duck a
 27. ^ Smith, Cyndi M.; Cooke, Fred; Robertson, Gregory J.; Goudie, R. Ian; Boyd, W. Sean (2000). "Long-Term Pair Bonds in Harlequin Ducks". The Condor. 102 (1): 201–205. doi:10.1093/condor/102.1.201. hdl:10315/13797.
 28. ^ "If You Find An Orphaned Duckling - Wildlife Rehabber". wildliferehabber.com. Archived from the original on 2018-09-23. Retrieved 2018-12-22.
 29. ^ Carver, Heather (2011). The Duck Bible. Lulu.com. ISBN 9780557901562.[self-published source]
-30. ^ Titlow, Budd (2013-09-03). Bird Brains: Inside the Strange Minds of Our Fine Feathered Friends. Rowman & Littlefield. ISBN 9780762797707.
+30. ^ Titlow, Budd (2013-09-03). Bird Brains: Inside the Strange Minds of Our Fine Feathered Friends. Rowman &amp; Littlefield. ISBN 9780762797707.
 31. ^ Amos, Jonathan (2003-09-08). "Sound science is quackers". BBC News. Retrieved 2006-11-02.
 32. ^ "Mythbusters Episode 8". 12 December 2003.
 33. ^ Erlandson 1994, p. 171.
@@ -446,10 +420,10 @@ The 1992 Disney film The Mighty Ducks, starring Emilio Estevez, chose the duck a
 - Christidis, Les; Boles, Walter E., eds. (2008). Systematics and Taxonomy of Australian Birds. Collingwood, VIC: Csiro Publishing. ISBN 978-0-643-06511-6.
 - Donne-Goussé, Carole; Laudet, Vincent; Hänni, Catherine (July 2002). "A molecular phylogeny of Anseriformes based on mitochondrial DNA analysis". Molecular Phylogenetics and Evolution. 23 (3): 339–356. Bibcode:2002MolPE..23..339D. doi:10.1016/S1055-7903(02)00019-2. PMID 12099792.
 - Elphick, Chris; Dunning, John B. Jr.; Sibley, David, eds. (2001). The Sibley Guide to Bird Life and Behaviour. London: Christopher Helm. ISBN 978-0-7136-6250-4.
-- Erlandson, Jon M. (1994). Early Hunter-Gatherers of the California Coast. New York, NY: Springer Science & Business Media. ISBN 978-1-4419-3231-0.
+- Erlandson, Jon M. (1994). Early Hunter-Gatherers of the California Coast. New York, NY: Springer Science &amp; Business Media. ISBN 978-1-4419-3231-0.
 - Fieldhouse, Paul (2002). Food, Feasts, and Faith: An Encyclopedia of Food Culture in World Religions. Vol. I: A–K. Santa Barbara: ABC-CLIO. ISBN 978-1-61069-412-4.
 - Fitter, Julian; Fitter, Daniel; Hosking, David (2000). Wildlife of the Galápagos. Princeton, NJ: Princeton University Press. ISBN 978-0-691-10295-5.
-- Higman, B. W. (2012). How Food Made History. Chichester, UK: John Wiley & Sons. ISBN 978-1-4051-8947-7.
+- Higman, B. W. (2012). How Food Made History. Chichester, UK: John Wiley &amp; Sons. ISBN 978-1-4051-8947-7.
 - Hume, Julian H. (2012). Extinct Birds. London: Christopher Helm. ISBN 978-1-4729-3744-5.
 - Jeffries, Richard (2008). Holocene Hunter-Gatherers of the Lower Ohio River Valley. Tuscaloosa: University of Alabama Press. ISBN 978-0-8173-1658-7.
 - Kear, Janet, ed. (2005). Ducks, Geese and Swans: Species Accounts (Cairina to Mergus). Bird Families of the World. Oxford: Oxford University Press. ISBN 978-0-19-861009-0.
@@ -457,7 +431,7 @@ The 1992 Disney film The Mighty Ducks, starring Emilio Estevez, chose the duck a
 - Madsen, Cort S.; McHugh, Kevin P.; de Kloet, Siwo R. (July 1988). "A partial classification of waterfowl (Anatidae) based on single-copy DNA" (PDF). The Auk. 105 (3): 452–459. doi:10.1093/auk/105.3.452. Archived (PDF) from the original on 2022-10-09.
 - Maisels, Charles Keith (1999). Early Civilizations of the Old World. London: Routledge. ISBN 978-0-415-10975-8.
 - Pratt, H. Douglas; Bruner, Phillip L.; Berrett, Delwyn G. (1987). A Field Guide to the Birds of Hawaii and the Tropical Pacific. Princeton, NJ: Princeton University Press. ISBN 0-691-02399-9.
-- Rau, Charles (1876). Early Man in Europe. New York: Harper & Brothers. LCCN 05040168.
+- Rau, Charles (1876). Early Man in Europe. New York: Harper &amp; Brothers. LCCN 05040168.
 - Shirihai, Hadoram (2008). A Complete Guide to Antarctic Wildlife. Princeton, NJ, US: Princeton University Press. ISBN 978-0-691-13666-0.
 - Sued-Badillo, Jalil (2003). Autochthonous Societies. General History of the Caribbean. Paris: UNESCO. ISBN 978-92-3-103832-7.
 - Thorpe, I. J. (1996). The Origins of Agriculture in Europe. New York: Routledge. ISBN 978-0-415-08009-5.
@@ -473,7 +447,6 @@ The 1992 Disney film The Mighty Ducks, starring Emilio Estevez, chose the duck a
 
 - list of books (useful looking abstracts)
 - Ducks on postage stamps Archived 2013-05-13 at the Wayback Machine
-- 
 - Ducks at a Distance, by Rob Hines at Project Gutenberg - A modern illustrated guide to identification of US waterfowl
 
 | Authority control databases    | Authority control databases                  |
@@ -483,10 +456,16 @@ The 1992 Disney film The Mighty Ducks, starring Emilio Estevez, chose the duck a
 
 <!-- image -->
 
+Retrieved from ""
+
+:
+
 - Ducks
 - Game birds
 - Bird common names
 
+Hidden categories:
+
 - All accuracy disputes
 - Accuracy disputes from February 2020
 - CS1 Finnish-language sources (fi)
@@ -526,7 +505,4 @@ additional terms may apply. By using this site, you agree to the Terms of Use an
 - Developers
 - Statistics
 - Cookie statement
-- Mobile view
-
-- 
--
\ No newline at end of file
+- Mobile view
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v2/word_sample.docx.json b/tests/data/groundtruth/docling_v2/word_sample.docx.json
index 44b4bd61..4b78a46f 100644
--- a/tests/data/groundtruth/docling_v2/word_sample.docx.json
+++ b/tests/data/groundtruth/docling_v2/word_sample.docx.json
@@ -1,6 +1,6 @@
 {
   "schema_name": "DoclingDocument",
-  "version": "1.0.0",
+  "version": "1.1.0",
   "name": "word_sample",
   "origin": {
     "mimetype": "application/vnd.openxmlformats-officedocument.wordprocessingml.document",
@@ -10,6 +10,7 @@
   "furniture": {
     "self_ref": "#/furniture",
     "children": [],
+    "content_layer": "furniture",
     "name": "_root_",
     "label": "unspecified"
   },
@@ -23,6 +24,7 @@
         "$ref": "#/texts/1"
       }
     ],
+    "content_layer": "body",
     "name": "_root_",
     "label": "unspecified"
   },
@@ -43,6 +45,7 @@
           "$ref": "#/texts/8"
         }
       ],
+      "content_layer": "body",
       "name": "list",
       "label": "list"
     },
@@ -62,6 +65,7 @@
           "$ref": "#/texts/12"
         }
       ],
+      "content_layer": "body",
       "name": "list",
       "label": "list"
     },
@@ -81,6 +85,7 @@
           "$ref": "#/texts/22"
         }
       ],
+      "content_layer": "body",
       "name": "list",
       "label": "list"
     }
@@ -92,6 +97,7 @@
         "$ref": "#/body"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Summer activities",
@@ -116,6 +122,7 @@
           "$ref": "#/texts/4"
         }
       ],
+      "content_layer": "body",
       "label": "title",
       "prov": [],
       "orig": "Swimming in the lake",
@@ -127,6 +134,7 @@
         "$ref": "#/texts/1"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Duck",
@@ -138,7 +146,8 @@
         "$ref": "#/texts/1"
       },
       "children": [],
-      "label": "text",
+      "content_layer": "body",
+      "label": "paragraph",
       "prov": [],
       "orig": "Figure 1: This is a cute duckling",
       "text": "Figure 1: This is a cute duckling"
@@ -168,6 +177,7 @@
           "$ref": "#/texts/14"
         }
       ],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
       "orig": "Let\u2019s swim!",
@@ -180,6 +190,7 @@
         "$ref": "#/texts/4"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "To get started with swimming, first lay down in a water and try not to drown:",
@@ -191,6 +202,7 @@
         "$ref": "#/groups/0"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "You can relax and look around",
@@ -204,6 +216,7 @@
         "$ref": "#/groups/0"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "Paddle about",
@@ -217,6 +230,7 @@
         "$ref": "#/groups/0"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "Enjoy summer warmth",
@@ -230,6 +244,7 @@
         "$ref": "#/texts/4"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Also, don\u2019t forget:",
@@ -241,6 +256,7 @@
         "$ref": "#/groups/1"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "Wear sunglasses",
@@ -254,6 +270,7 @@
         "$ref": "#/groups/1"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "Don\u2019t forget to drink water",
@@ -267,6 +284,7 @@
         "$ref": "#/groups/1"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "Use sun cream",
@@ -280,6 +298,7 @@
         "$ref": "#/texts/4"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Hmm, what else\u2026",
@@ -313,6 +332,7 @@
           "$ref": "#/groups/2"
         }
       ],
+      "content_layer": "body",
       "label": "section_header",
       "prov": [],
       "orig": "Let\u2019s eat",
@@ -325,6 +345,7 @@
         "$ref": "#/texts/14"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "After we had a good day of swimming in the lake, it\u2019s important to eat something nice",
@@ -336,6 +357,7 @@
         "$ref": "#/texts/14"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "I like to eat leaves",
@@ -347,6 +369,7 @@
         "$ref": "#/texts/14"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "Here are some interesting things a respectful duck could eat:",
@@ -358,6 +381,7 @@
         "$ref": "#/texts/14"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "",
@@ -369,6 +393,7 @@
         "$ref": "#/texts/14"
       },
       "children": [],
+      "content_layer": "body",
       "label": "paragraph",
       "prov": [],
       "orig": "And let\u2019s add another list in the end:",
@@ -380,6 +405,7 @@
         "$ref": "#/groups/2"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "Leaves",
@@ -393,6 +419,7 @@
         "$ref": "#/groups/2"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "Berries",
@@ -406,6 +433,7 @@
         "$ref": "#/groups/2"
       },
       "children": [],
+      "content_layer": "body",
       "label": "list_item",
       "prov": [],
       "orig": "Grain",
@@ -421,6 +449,7 @@
         "$ref": "#/texts/1"
       },
       "children": [],
+      "content_layer": "body",
       "label": "picture",
       "prov": [],
       "captions": [],
@@ -445,6 +474,7 @@
         "$ref": "#/texts/14"
       },
       "children": [],
+      "content_layer": "body",
       "label": "table",
       "prov": [],
       "captions": [],
diff --git a/tests/data/groundtruth/docling_v2/word_tables.docx.html b/tests/data/groundtruth/docling_v2/word_tables.docx.html
new file mode 100644
index 00000000..00a790c0
--- /dev/null
+++ b/tests/data/groundtruth/docling_v2/word_tables.docx.html
@@ -0,0 +1,89 @@
+<!DOCTYPE html>
+<html lang="en">
+<head>
+    <link rel="icon" type="image/png"
+    href="https://ds4sd.github.io/docling/assets/logo.png"/>
+    <meta charset="UTF-8">
+    <title>
+    Powered by Docling
+    </title>
+    <style>
+    html {
+    background-color: LightGray;
+    }
+    body {
+    margin: 0 auto;
+    width:800px;
+    padding: 30px;
+    background-color: White;
+    font-family: Arial, sans-serif;
+    box-shadow: 10px 10px 10px grey;
+    }
+    figure{
+    display: block;
+    width: 100%;
+    margin: 0px;
+    margin-top: 10px;
+    margin-bottom: 10px;
+    }
+    img {
+    display: block;
+    margin: auto;
+    margin-top: 10px;
+    margin-bottom: 10px;
+    max-width: 640px;
+    max-height: 640px;
+    }
+    table {
+    min-width:500px;
+    background-color: White;
+    border-collapse: collapse;
+    cell-padding: 5px;
+    margin: auto;
+    margin-top: 10px;
+    margin-bottom: 10px;
+    }
+    th, td {
+    border: 1px solid black;
+    padding: 8px;
+    }
+    th {
+    font-weight: bold;
+    }
+    table tr:nth-child(even) td{
+    background-color: LightGray;
+    }
+    math annotation {
+    display: none;
+    }
+    .formula-not-decoded {
+    background: repeating-linear-gradient(
+    45deg, /* Angle of the stripes */
+    LightGray, /* First color */
+    LightGray 10px, /* Length of the first color */
+    White 10px, /* Second color */
+    White 20px /* Length of the second color */
+    );
+    margin: 0;
+    text-align: center;
+    }
+    </style>
+    </head>
+<h2>Test with tables</h2>
+<p>A uniform table</p>
+<table><tbody><tr><td>Header 0.0</td><td>Header 0.1</td><td>Header 0.2</td></tr><tr><td>Cell 1.0</td><td>Cell 1.1</td><td>Cell 1.2</td></tr><tr><td>Cell 2.0</td><td>Cell 2.1</td><td>Cell 2.2</td></tr></tbody></table>
+<p></p>
+<p>A non-uniform table with horizontal spans</p>
+<table><tbody><tr><td>Header 0.0</td><td>Header 0.1</td><td>Header 0.2</td></tr><tr><td>Cell 1.0</td><td colspan="2">Merged Cell 1.1 1.2</td></tr><tr><td>Cell 2.0</td><td colspan="2">Merged Cell 2.1 2.2</td></tr></tbody></table>
+<p></p>
+<p>A non-uniform table with horizontal spans in inner columns</p>
+<table><tbody><tr><td>Header 0.0</td><td>Header 0.1</td><td>Header 0.2</td><td>Header 0.3</td></tr><tr><td>Cell 1.0</td><td colspan="2">Merged Cell 1.1 1.2</td><td>Cell 1.3</td></tr><tr><td>Cell 2.0</td><td colspan="2">Merged Cell 2.1 2.2</td><td>Cell 2.3</td></tr></tbody></table>
+<p></p>
+<p>A non-uniform table with vertical spans</p>
+<table><tbody><tr><td>Header 0.0</td><td>Header 0.1</td><td>Header 0.2</td></tr><tr><td>Cell 1.0</td><td rowspan="2">Merged Cell 1.1 2.1</td><td>Cell 1.2</td></tr><tr><td>Cell 2.0</td><td>Cell 2.2</td></tr><tr><td>Cell 3.0</td><td rowspan="2">Merged Cell 3.1 4.1</td><td>Cell 3.2</td></tr><tr><td>Cell 4.0</td><td>Cell 4.2</td></tr></tbody></table>
+<p></p>
+<p>A non-uniform table with all kinds of spans and empty cells</p>
+<table><tbody><tr><td>Header 0.0</td><td>Header 0.1</td><td>Header 0.2</td><td></td><td></td></tr><tr><td>Cell 1.0</td><td rowspan="2">Merged Cell 1.1 2.1</td><td>Cell 1.2</td><td></td><td></td></tr><tr><td>Cell 2.0</td><td>Cell 2.2</td><td></td><td></td></tr><tr><td>Cell 3.0</td><td rowspan="2">Merged Cell 3.1 4.1</td><td>Cell 3.2</td><td rowspan="3"></td><td></td></tr><tr><td>Cell 4.0</td><td>Cell 4.2</td><td rowspan="2">Merged Cell 4.4 5.4</td></tr><tr><td></td><td></td><td></td></tr><tr><td></td><td></td><td></td><td></td><td></td></tr><tr><td colspan="5"></td></tr><tr><td></td><td></td><td></td><td></td><td>Cell 8.4</td></tr></tbody></table>
+<p></p>
+<p></p>
+</html>
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v2/word_tables.docx.itxt b/tests/data/groundtruth/docling_v2/word_tables.docx.itxt
new file mode 100644
index 00000000..dd42eb0a
--- /dev/null
+++ b/tests/data/groundtruth/docling_v2/word_tables.docx.itxt
@@ -0,0 +1,19 @@
+item-0 at level 0: unspecified: group _root_
+  item-1 at level 1: section: group header-0
+    item-2 at level 2: section_header: Test with tables
+      item-3 at level 3: paragraph: A uniform table
+      item-4 at level 3: table with [3x3]
+      item-5 at level 3: paragraph: 
+      item-6 at level 3: paragraph: A non-uniform table with horizontal spans
+      item-7 at level 3: table with [3x3]
+      item-8 at level 3: paragraph: 
+      item-9 at level 3: paragraph: A non-uniform table with horizontal spans in inner columns
+      item-10 at level 3: table with [3x4]
+      item-11 at level 3: paragraph: 
+      item-12 at level 3: paragraph: A non-uniform table with vertical spans
+      item-13 at level 3: table with [5x3]
+      item-14 at level 3: paragraph: 
+      item-15 at level 3: paragraph: A non-uniform table with all kinds of spans and empty cells
+      item-16 at level 3: table with [9x5]
+      item-17 at level 3: paragraph: 
+      item-18 at level 3: paragraph: 
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v2/word_tables.docx.json b/tests/data/groundtruth/docling_v2/word_tables.docx.json
new file mode 100644
index 00000000..2b2d04cc
--- /dev/null
+++ b/tests/data/groundtruth/docling_v2/word_tables.docx.json
@@ -0,0 +1,2376 @@
+{
+  "schema_name": "DoclingDocument",
+  "version": "1.1.0",
+  "name": "word_tables",
+  "origin": {
+    "mimetype": "application/vnd.openxmlformats-officedocument.wordprocessingml.document",
+    "binary_hash": 8379738677198259833,
+    "filename": "word_tables.docx"
+  },
+  "furniture": {
+    "self_ref": "#/furniture",
+    "children": [],
+    "content_layer": "furniture",
+    "name": "_root_",
+    "label": "unspecified"
+  },
+  "body": {
+    "self_ref": "#/body",
+    "children": [
+      {
+        "$ref": "#/groups/0"
+      }
+    ],
+    "content_layer": "body",
+    "name": "_root_",
+    "label": "unspecified"
+  },
+  "groups": [
+    {
+      "self_ref": "#/groups/0",
+      "parent": {
+        "$ref": "#/body"
+      },
+      "children": [
+        {
+          "$ref": "#/texts/0"
+        }
+      ],
+      "content_layer": "body",
+      "name": "header-0",
+      "label": "section"
+    }
+  ],
+  "texts": [
+    {
+      "self_ref": "#/texts/0",
+      "parent": {
+        "$ref": "#/groups/0"
+      },
+      "children": [
+        {
+          "$ref": "#/texts/1"
+        },
+        {
+          "$ref": "#/tables/0"
+        },
+        {
+          "$ref": "#/texts/2"
+        },
+        {
+          "$ref": "#/texts/3"
+        },
+        {
+          "$ref": "#/tables/1"
+        },
+        {
+          "$ref": "#/texts/4"
+        },
+        {
+          "$ref": "#/texts/5"
+        },
+        {
+          "$ref": "#/tables/2"
+        },
+        {
+          "$ref": "#/texts/6"
+        },
+        {
+          "$ref": "#/texts/7"
+        },
+        {
+          "$ref": "#/tables/3"
+        },
+        {
+          "$ref": "#/texts/8"
+        },
+        {
+          "$ref": "#/texts/9"
+        },
+        {
+          "$ref": "#/tables/4"
+        },
+        {
+          "$ref": "#/texts/10"
+        },
+        {
+          "$ref": "#/texts/11"
+        }
+      ],
+      "content_layer": "body",
+      "label": "section_header",
+      "prov": [],
+      "orig": "Test with tables",
+      "text": "Test with tables",
+      "level": 1
+    },
+    {
+      "self_ref": "#/texts/1",
+      "parent": {
+        "$ref": "#/texts/0"
+      },
+      "children": [],
+      "content_layer": "body",
+      "label": "paragraph",
+      "prov": [],
+      "orig": "A uniform table",
+      "text": "A uniform table"
+    },
+    {
+      "self_ref": "#/texts/2",
+      "parent": {
+        "$ref": "#/texts/0"
+      },
+      "children": [],
+      "content_layer": "body",
+      "label": "paragraph",
+      "prov": [],
+      "orig": "",
+      "text": ""
+    },
+    {
+      "self_ref": "#/texts/3",
+      "parent": {
+        "$ref": "#/texts/0"
+      },
+      "children": [],
+      "content_layer": "body",
+      "label": "paragraph",
+      "prov": [],
+      "orig": "A non-uniform table with horizontal spans",
+      "text": "A non-uniform table with horizontal spans"
+    },
+    {
+      "self_ref": "#/texts/4",
+      "parent": {
+        "$ref": "#/texts/0"
+      },
+      "children": [],
+      "content_layer": "body",
+      "label": "paragraph",
+      "prov": [],
+      "orig": "",
+      "text": ""
+    },
+    {
+      "self_ref": "#/texts/5",
+      "parent": {
+        "$ref": "#/texts/0"
+      },
+      "children": [],
+      "content_layer": "body",
+      "label": "paragraph",
+      "prov": [],
+      "orig": "A non-uniform table with horizontal spans in inner columns",
+      "text": "A non-uniform table with horizontal spans in inner columns"
+    },
+    {
+      "self_ref": "#/texts/6",
+      "parent": {
+        "$ref": "#/texts/0"
+      },
+      "children": [],
+      "content_layer": "body",
+      "label": "paragraph",
+      "prov": [],
+      "orig": "",
+      "text": ""
+    },
+    {
+      "self_ref": "#/texts/7",
+      "parent": {
+        "$ref": "#/texts/0"
+      },
+      "children": [],
+      "content_layer": "body",
+      "label": "paragraph",
+      "prov": [],
+      "orig": "A non-uniform table with vertical spans",
+      "text": "A non-uniform table with vertical spans"
+    },
+    {
+      "self_ref": "#/texts/8",
+      "parent": {
+        "$ref": "#/texts/0"
+      },
+      "children": [],
+      "content_layer": "body",
+      "label": "paragraph",
+      "prov": [],
+      "orig": "",
+      "text": ""
+    },
+    {
+      "self_ref": "#/texts/9",
+      "parent": {
+        "$ref": "#/texts/0"
+      },
+      "children": [],
+      "content_layer": "body",
+      "label": "paragraph",
+      "prov": [],
+      "orig": "A non-uniform table with all kinds of spans and empty cells",
+      "text": "A non-uniform table with all kinds of spans and empty cells"
+    },
+    {
+      "self_ref": "#/texts/10",
+      "parent": {
+        "$ref": "#/texts/0"
+      },
+      "children": [],
+      "content_layer": "body",
+      "label": "paragraph",
+      "prov": [],
+      "orig": "",
+      "text": ""
+    },
+    {
+      "self_ref": "#/texts/11",
+      "parent": {
+        "$ref": "#/texts/0"
+      },
+      "children": [],
+      "content_layer": "body",
+      "label": "paragraph",
+      "prov": [],
+      "orig": "",
+      "text": ""
+    }
+  ],
+  "pictures": [],
+  "tables": [
+    {
+      "self_ref": "#/tables/0",
+      "parent": {
+        "$ref": "#/texts/0"
+      },
+      "children": [],
+      "content_layer": "body",
+      "label": "table",
+      "prov": [],
+      "captions": [],
+      "references": [],
+      "footnotes": [],
+      "data": {
+        "table_cells": [
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 0,
+            "end_row_offset_idx": 1,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 1,
+            "text": "Header 0.0",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 0,
+            "end_row_offset_idx": 1,
+            "start_col_offset_idx": 1,
+            "end_col_offset_idx": 2,
+            "text": "Header 0.1",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 0,
+            "end_row_offset_idx": 1,
+            "start_col_offset_idx": 2,
+            "end_col_offset_idx": 3,
+            "text": "Header 0.2",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 1,
+            "end_row_offset_idx": 2,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 1,
+            "text": "Cell 1.0",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 1,
+            "end_row_offset_idx": 2,
+            "start_col_offset_idx": 1,
+            "end_col_offset_idx": 2,
+            "text": "Cell 1.1",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 1,
+            "end_row_offset_idx": 2,
+            "start_col_offset_idx": 2,
+            "end_col_offset_idx": 3,
+            "text": "Cell 1.2",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 2,
+            "end_row_offset_idx": 3,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 1,
+            "text": "Cell 2.0",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 2,
+            "end_row_offset_idx": 3,
+            "start_col_offset_idx": 1,
+            "end_col_offset_idx": 2,
+            "text": "Cell 2.1",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 2,
+            "end_row_offset_idx": 3,
+            "start_col_offset_idx": 2,
+            "end_col_offset_idx": 3,
+            "text": "Cell 2.2",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          }
+        ],
+        "num_rows": 3,
+        "num_cols": 3,
+        "grid": [
+          [
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 0,
+              "end_row_offset_idx": 1,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "Header 0.0",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 0,
+              "end_row_offset_idx": 1,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 2,
+              "text": "Header 0.1",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 0,
+              "end_row_offset_idx": 1,
+              "start_col_offset_idx": 2,
+              "end_col_offset_idx": 3,
+              "text": "Header 0.2",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ],
+          [
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 1,
+              "end_row_offset_idx": 2,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "Cell 1.0",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 1,
+              "end_row_offset_idx": 2,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 2,
+              "text": "Cell 1.1",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 1,
+              "end_row_offset_idx": 2,
+              "start_col_offset_idx": 2,
+              "end_col_offset_idx": 3,
+              "text": "Cell 1.2",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ],
+          [
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 2,
+              "end_row_offset_idx": 3,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "Cell 2.0",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 2,
+              "end_row_offset_idx": 3,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 2,
+              "text": "Cell 2.1",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 2,
+              "end_row_offset_idx": 3,
+              "start_col_offset_idx": 2,
+              "end_col_offset_idx": 3,
+              "text": "Cell 2.2",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ]
+        ]
+      }
+    },
+    {
+      "self_ref": "#/tables/1",
+      "parent": {
+        "$ref": "#/texts/0"
+      },
+      "children": [],
+      "content_layer": "body",
+      "label": "table",
+      "prov": [],
+      "captions": [],
+      "references": [],
+      "footnotes": [],
+      "data": {
+        "table_cells": [
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 0,
+            "end_row_offset_idx": 1,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 1,
+            "text": "Header 0.0",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 0,
+            "end_row_offset_idx": 1,
+            "start_col_offset_idx": 1,
+            "end_col_offset_idx": 2,
+            "text": "Header 0.1",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 0,
+            "end_row_offset_idx": 1,
+            "start_col_offset_idx": 2,
+            "end_col_offset_idx": 3,
+            "text": "Header 0.2",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 1,
+            "end_row_offset_idx": 2,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 1,
+            "text": "Cell 1.0",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 2,
+            "start_row_offset_idx": 1,
+            "end_row_offset_idx": 2,
+            "start_col_offset_idx": 1,
+            "end_col_offset_idx": 3,
+            "text": "Merged Cell 1.1 1.2",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 2,
+            "end_row_offset_idx": 3,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 1,
+            "text": "Cell 2.0",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 2,
+            "start_row_offset_idx": 2,
+            "end_row_offset_idx": 3,
+            "start_col_offset_idx": 1,
+            "end_col_offset_idx": 3,
+            "text": "Merged Cell 2.1 2.2",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          }
+        ],
+        "num_rows": 3,
+        "num_cols": 3,
+        "grid": [
+          [
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 0,
+              "end_row_offset_idx": 1,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "Header 0.0",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 0,
+              "end_row_offset_idx": 1,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 2,
+              "text": "Header 0.1",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 0,
+              "end_row_offset_idx": 1,
+              "start_col_offset_idx": 2,
+              "end_col_offset_idx": 3,
+              "text": "Header 0.2",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ],
+          [
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 1,
+              "end_row_offset_idx": 2,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "Cell 1.0",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 2,
+              "start_row_offset_idx": 1,
+              "end_row_offset_idx": 2,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 3,
+              "text": "Merged Cell 1.1 1.2",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 2,
+              "start_row_offset_idx": 1,
+              "end_row_offset_idx": 2,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 3,
+              "text": "Merged Cell 1.1 1.2",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ],
+          [
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 2,
+              "end_row_offset_idx": 3,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "Cell 2.0",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 2,
+              "start_row_offset_idx": 2,
+              "end_row_offset_idx": 3,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 3,
+              "text": "Merged Cell 2.1 2.2",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 2,
+              "start_row_offset_idx": 2,
+              "end_row_offset_idx": 3,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 3,
+              "text": "Merged Cell 2.1 2.2",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ]
+        ]
+      }
+    },
+    {
+      "self_ref": "#/tables/2",
+      "parent": {
+        "$ref": "#/texts/0"
+      },
+      "children": [],
+      "content_layer": "body",
+      "label": "table",
+      "prov": [],
+      "captions": [],
+      "references": [],
+      "footnotes": [],
+      "data": {
+        "table_cells": [
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 0,
+            "end_row_offset_idx": 1,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 1,
+            "text": "Header 0.0",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 0,
+            "end_row_offset_idx": 1,
+            "start_col_offset_idx": 1,
+            "end_col_offset_idx": 2,
+            "text": "Header 0.1",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 0,
+            "end_row_offset_idx": 1,
+            "start_col_offset_idx": 2,
+            "end_col_offset_idx": 3,
+            "text": "Header 0.2",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 0,
+            "end_row_offset_idx": 1,
+            "start_col_offset_idx": 3,
+            "end_col_offset_idx": 4,
+            "text": "Header 0.3",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 1,
+            "end_row_offset_idx": 2,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 1,
+            "text": "Cell 1.0",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 2,
+            "start_row_offset_idx": 1,
+            "end_row_offset_idx": 2,
+            "start_col_offset_idx": 1,
+            "end_col_offset_idx": 3,
+            "text": "Merged Cell 1.1 1.2",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 1,
+            "end_row_offset_idx": 2,
+            "start_col_offset_idx": 3,
+            "end_col_offset_idx": 4,
+            "text": "Cell 1.3",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 2,
+            "end_row_offset_idx": 3,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 1,
+            "text": "Cell 2.0",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 2,
+            "start_row_offset_idx": 2,
+            "end_row_offset_idx": 3,
+            "start_col_offset_idx": 1,
+            "end_col_offset_idx": 3,
+            "text": "Merged Cell 2.1 2.2",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 2,
+            "end_row_offset_idx": 3,
+            "start_col_offset_idx": 3,
+            "end_col_offset_idx": 4,
+            "text": "Cell 2.3",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          }
+        ],
+        "num_rows": 3,
+        "num_cols": 4,
+        "grid": [
+          [
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 0,
+              "end_row_offset_idx": 1,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "Header 0.0",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 0,
+              "end_row_offset_idx": 1,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 2,
+              "text": "Header 0.1",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 0,
+              "end_row_offset_idx": 1,
+              "start_col_offset_idx": 2,
+              "end_col_offset_idx": 3,
+              "text": "Header 0.2",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 0,
+              "end_row_offset_idx": 1,
+              "start_col_offset_idx": 3,
+              "end_col_offset_idx": 4,
+              "text": "Header 0.3",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ],
+          [
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 1,
+              "end_row_offset_idx": 2,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "Cell 1.0",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 2,
+              "start_row_offset_idx": 1,
+              "end_row_offset_idx": 2,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 3,
+              "text": "Merged Cell 1.1 1.2",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 2,
+              "start_row_offset_idx": 1,
+              "end_row_offset_idx": 2,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 3,
+              "text": "Merged Cell 1.1 1.2",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 1,
+              "end_row_offset_idx": 2,
+              "start_col_offset_idx": 3,
+              "end_col_offset_idx": 4,
+              "text": "Cell 1.3",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ],
+          [
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 2,
+              "end_row_offset_idx": 3,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "Cell 2.0",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 2,
+              "start_row_offset_idx": 2,
+              "end_row_offset_idx": 3,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 3,
+              "text": "Merged Cell 2.1 2.2",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 2,
+              "start_row_offset_idx": 2,
+              "end_row_offset_idx": 3,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 3,
+              "text": "Merged Cell 2.1 2.2",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 2,
+              "end_row_offset_idx": 3,
+              "start_col_offset_idx": 3,
+              "end_col_offset_idx": 4,
+              "text": "Cell 2.3",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ]
+        ]
+      }
+    },
+    {
+      "self_ref": "#/tables/3",
+      "parent": {
+        "$ref": "#/texts/0"
+      },
+      "children": [],
+      "content_layer": "body",
+      "label": "table",
+      "prov": [],
+      "captions": [],
+      "references": [],
+      "footnotes": [],
+      "data": {
+        "table_cells": [
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 0,
+            "end_row_offset_idx": 1,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 1,
+            "text": "Header 0.0",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 0,
+            "end_row_offset_idx": 1,
+            "start_col_offset_idx": 1,
+            "end_col_offset_idx": 2,
+            "text": "Header 0.1",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 0,
+            "end_row_offset_idx": 1,
+            "start_col_offset_idx": 2,
+            "end_col_offset_idx": 3,
+            "text": "Header 0.2",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 1,
+            "end_row_offset_idx": 2,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 1,
+            "text": "Cell 1.0",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 2,
+            "col_span": 1,
+            "start_row_offset_idx": 1,
+            "end_row_offset_idx": 3,
+            "start_col_offset_idx": 1,
+            "end_col_offset_idx": 2,
+            "text": "Merged Cell 1.1 2.1",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 1,
+            "end_row_offset_idx": 2,
+            "start_col_offset_idx": 2,
+            "end_col_offset_idx": 3,
+            "text": "Cell 1.2",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 2,
+            "end_row_offset_idx": 3,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 1,
+            "text": "Cell 2.0",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 2,
+            "end_row_offset_idx": 3,
+            "start_col_offset_idx": 2,
+            "end_col_offset_idx": 3,
+            "text": "Cell 2.2",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 3,
+            "end_row_offset_idx": 4,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 1,
+            "text": "Cell 3.0",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 2,
+            "col_span": 1,
+            "start_row_offset_idx": 3,
+            "end_row_offset_idx": 5,
+            "start_col_offset_idx": 1,
+            "end_col_offset_idx": 2,
+            "text": "Merged Cell 3.1 4.1",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 3,
+            "end_row_offset_idx": 4,
+            "start_col_offset_idx": 2,
+            "end_col_offset_idx": 3,
+            "text": "Cell 3.2",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 4,
+            "end_row_offset_idx": 5,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 1,
+            "text": "Cell 4.0",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 4,
+            "end_row_offset_idx": 5,
+            "start_col_offset_idx": 2,
+            "end_col_offset_idx": 3,
+            "text": "Cell 4.2",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          }
+        ],
+        "num_rows": 5,
+        "num_cols": 3,
+        "grid": [
+          [
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 0,
+              "end_row_offset_idx": 1,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "Header 0.0",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 0,
+              "end_row_offset_idx": 1,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 2,
+              "text": "Header 0.1",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 0,
+              "end_row_offset_idx": 1,
+              "start_col_offset_idx": 2,
+              "end_col_offset_idx": 3,
+              "text": "Header 0.2",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ],
+          [
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 1,
+              "end_row_offset_idx": 2,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "Cell 1.0",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 2,
+              "col_span": 1,
+              "start_row_offset_idx": 1,
+              "end_row_offset_idx": 3,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 2,
+              "text": "Merged Cell 1.1 2.1",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 1,
+              "end_row_offset_idx": 2,
+              "start_col_offset_idx": 2,
+              "end_col_offset_idx": 3,
+              "text": "Cell 1.2",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ],
+          [
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 2,
+              "end_row_offset_idx": 3,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "Cell 2.0",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 2,
+              "col_span": 1,
+              "start_row_offset_idx": 1,
+              "end_row_offset_idx": 3,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 2,
+              "text": "Merged Cell 1.1 2.1",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 2,
+              "end_row_offset_idx": 3,
+              "start_col_offset_idx": 2,
+              "end_col_offset_idx": 3,
+              "text": "Cell 2.2",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ],
+          [
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 3,
+              "end_row_offset_idx": 4,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "Cell 3.0",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 2,
+              "col_span": 1,
+              "start_row_offset_idx": 3,
+              "end_row_offset_idx": 5,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 2,
+              "text": "Merged Cell 3.1 4.1",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 3,
+              "end_row_offset_idx": 4,
+              "start_col_offset_idx": 2,
+              "end_col_offset_idx": 3,
+              "text": "Cell 3.2",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ],
+          [
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 4,
+              "end_row_offset_idx": 5,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "Cell 4.0",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 2,
+              "col_span": 1,
+              "start_row_offset_idx": 3,
+              "end_row_offset_idx": 5,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 2,
+              "text": "Merged Cell 3.1 4.1",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 4,
+              "end_row_offset_idx": 5,
+              "start_col_offset_idx": 2,
+              "end_col_offset_idx": 3,
+              "text": "Cell 4.2",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ]
+        ]
+      }
+    },
+    {
+      "self_ref": "#/tables/4",
+      "parent": {
+        "$ref": "#/texts/0"
+      },
+      "children": [],
+      "content_layer": "body",
+      "label": "table",
+      "prov": [],
+      "captions": [],
+      "references": [],
+      "footnotes": [],
+      "data": {
+        "table_cells": [
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 0,
+            "end_row_offset_idx": 1,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 1,
+            "text": "Header 0.0",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 0,
+            "end_row_offset_idx": 1,
+            "start_col_offset_idx": 1,
+            "end_col_offset_idx": 2,
+            "text": "Header 0.1",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 0,
+            "end_row_offset_idx": 1,
+            "start_col_offset_idx": 2,
+            "end_col_offset_idx": 3,
+            "text": "Header 0.2",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 0,
+            "end_row_offset_idx": 1,
+            "start_col_offset_idx": 3,
+            "end_col_offset_idx": 4,
+            "text": "",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 0,
+            "end_row_offset_idx": 1,
+            "start_col_offset_idx": 4,
+            "end_col_offset_idx": 5,
+            "text": "",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 1,
+            "end_row_offset_idx": 2,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 1,
+            "text": "Cell 1.0",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 2,
+            "col_span": 1,
+            "start_row_offset_idx": 1,
+            "end_row_offset_idx": 3,
+            "start_col_offset_idx": 1,
+            "end_col_offset_idx": 2,
+            "text": "Merged Cell 1.1 2.1",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 1,
+            "end_row_offset_idx": 2,
+            "start_col_offset_idx": 2,
+            "end_col_offset_idx": 3,
+            "text": "Cell 1.2",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 1,
+            "end_row_offset_idx": 2,
+            "start_col_offset_idx": 3,
+            "end_col_offset_idx": 4,
+            "text": "",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 1,
+            "end_row_offset_idx": 2,
+            "start_col_offset_idx": 4,
+            "end_col_offset_idx": 5,
+            "text": "",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 2,
+            "end_row_offset_idx": 3,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 1,
+            "text": "Cell 2.0",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 2,
+            "end_row_offset_idx": 3,
+            "start_col_offset_idx": 2,
+            "end_col_offset_idx": 3,
+            "text": "Cell 2.2",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 2,
+            "end_row_offset_idx": 3,
+            "start_col_offset_idx": 3,
+            "end_col_offset_idx": 4,
+            "text": "",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 2,
+            "end_row_offset_idx": 3,
+            "start_col_offset_idx": 4,
+            "end_col_offset_idx": 5,
+            "text": "",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 3,
+            "end_row_offset_idx": 4,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 1,
+            "text": "Cell 3.0",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 2,
+            "col_span": 1,
+            "start_row_offset_idx": 3,
+            "end_row_offset_idx": 5,
+            "start_col_offset_idx": 1,
+            "end_col_offset_idx": 2,
+            "text": "Merged Cell 3.1 4.1",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 3,
+            "end_row_offset_idx": 4,
+            "start_col_offset_idx": 2,
+            "end_col_offset_idx": 3,
+            "text": "Cell 3.2",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 3,
+            "col_span": 1,
+            "start_row_offset_idx": 3,
+            "end_row_offset_idx": 6,
+            "start_col_offset_idx": 3,
+            "end_col_offset_idx": 4,
+            "text": "",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 3,
+            "end_row_offset_idx": 4,
+            "start_col_offset_idx": 4,
+            "end_col_offset_idx": 5,
+            "text": "",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 4,
+            "end_row_offset_idx": 5,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 1,
+            "text": "Cell 4.0",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 4,
+            "end_row_offset_idx": 5,
+            "start_col_offset_idx": 2,
+            "end_col_offset_idx": 3,
+            "text": "Cell 4.2",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 2,
+            "col_span": 1,
+            "start_row_offset_idx": 4,
+            "end_row_offset_idx": 6,
+            "start_col_offset_idx": 4,
+            "end_col_offset_idx": 5,
+            "text": "Merged Cell 4.4 5.4",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 5,
+            "end_row_offset_idx": 6,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 1,
+            "text": "",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 5,
+            "end_row_offset_idx": 6,
+            "start_col_offset_idx": 1,
+            "end_col_offset_idx": 2,
+            "text": "",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 5,
+            "end_row_offset_idx": 6,
+            "start_col_offset_idx": 2,
+            "end_col_offset_idx": 3,
+            "text": "",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 6,
+            "end_row_offset_idx": 7,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 1,
+            "text": "",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 6,
+            "end_row_offset_idx": 7,
+            "start_col_offset_idx": 1,
+            "end_col_offset_idx": 2,
+            "text": "",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 6,
+            "end_row_offset_idx": 7,
+            "start_col_offset_idx": 2,
+            "end_col_offset_idx": 3,
+            "text": "",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 6,
+            "end_row_offset_idx": 7,
+            "start_col_offset_idx": 3,
+            "end_col_offset_idx": 4,
+            "text": "",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 6,
+            "end_row_offset_idx": 7,
+            "start_col_offset_idx": 4,
+            "end_col_offset_idx": 5,
+            "text": "",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 5,
+            "start_row_offset_idx": 7,
+            "end_row_offset_idx": 8,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 5,
+            "text": "",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 8,
+            "end_row_offset_idx": 9,
+            "start_col_offset_idx": 0,
+            "end_col_offset_idx": 1,
+            "text": "",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 8,
+            "end_row_offset_idx": 9,
+            "start_col_offset_idx": 1,
+            "end_col_offset_idx": 2,
+            "text": "",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 8,
+            "end_row_offset_idx": 9,
+            "start_col_offset_idx": 2,
+            "end_col_offset_idx": 3,
+            "text": "",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 8,
+            "end_row_offset_idx": 9,
+            "start_col_offset_idx": 3,
+            "end_col_offset_idx": 4,
+            "text": "",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          },
+          {
+            "row_span": 1,
+            "col_span": 1,
+            "start_row_offset_idx": 8,
+            "end_row_offset_idx": 9,
+            "start_col_offset_idx": 4,
+            "end_col_offset_idx": 5,
+            "text": "Cell 8.4",
+            "column_header": false,
+            "row_header": false,
+            "row_section": false
+          }
+        ],
+        "num_rows": 9,
+        "num_cols": 5,
+        "grid": [
+          [
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 0,
+              "end_row_offset_idx": 1,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "Header 0.0",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 0,
+              "end_row_offset_idx": 1,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 2,
+              "text": "Header 0.1",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 0,
+              "end_row_offset_idx": 1,
+              "start_col_offset_idx": 2,
+              "end_col_offset_idx": 3,
+              "text": "Header 0.2",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 0,
+              "end_row_offset_idx": 1,
+              "start_col_offset_idx": 3,
+              "end_col_offset_idx": 4,
+              "text": "",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 0,
+              "end_row_offset_idx": 1,
+              "start_col_offset_idx": 4,
+              "end_col_offset_idx": 5,
+              "text": "",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ],
+          [
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 1,
+              "end_row_offset_idx": 2,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "Cell 1.0",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 2,
+              "col_span": 1,
+              "start_row_offset_idx": 1,
+              "end_row_offset_idx": 3,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 2,
+              "text": "Merged Cell 1.1 2.1",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 1,
+              "end_row_offset_idx": 2,
+              "start_col_offset_idx": 2,
+              "end_col_offset_idx": 3,
+              "text": "Cell 1.2",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 1,
+              "end_row_offset_idx": 2,
+              "start_col_offset_idx": 3,
+              "end_col_offset_idx": 4,
+              "text": "",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 1,
+              "end_row_offset_idx": 2,
+              "start_col_offset_idx": 4,
+              "end_col_offset_idx": 5,
+              "text": "",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ],
+          [
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 2,
+              "end_row_offset_idx": 3,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "Cell 2.0",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 2,
+              "col_span": 1,
+              "start_row_offset_idx": 1,
+              "end_row_offset_idx": 3,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 2,
+              "text": "Merged Cell 1.1 2.1",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 2,
+              "end_row_offset_idx": 3,
+              "start_col_offset_idx": 2,
+              "end_col_offset_idx": 3,
+              "text": "Cell 2.2",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 2,
+              "end_row_offset_idx": 3,
+              "start_col_offset_idx": 3,
+              "end_col_offset_idx": 4,
+              "text": "",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 2,
+              "end_row_offset_idx": 3,
+              "start_col_offset_idx": 4,
+              "end_col_offset_idx": 5,
+              "text": "",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ],
+          [
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 3,
+              "end_row_offset_idx": 4,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "Cell 3.0",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 2,
+              "col_span": 1,
+              "start_row_offset_idx": 3,
+              "end_row_offset_idx": 5,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 2,
+              "text": "Merged Cell 3.1 4.1",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 3,
+              "end_row_offset_idx": 4,
+              "start_col_offset_idx": 2,
+              "end_col_offset_idx": 3,
+              "text": "Cell 3.2",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 3,
+              "col_span": 1,
+              "start_row_offset_idx": 3,
+              "end_row_offset_idx": 6,
+              "start_col_offset_idx": 3,
+              "end_col_offset_idx": 4,
+              "text": "",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 3,
+              "end_row_offset_idx": 4,
+              "start_col_offset_idx": 4,
+              "end_col_offset_idx": 5,
+              "text": "",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ],
+          [
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 4,
+              "end_row_offset_idx": 5,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "Cell 4.0",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 2,
+              "col_span": 1,
+              "start_row_offset_idx": 3,
+              "end_row_offset_idx": 5,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 2,
+              "text": "Merged Cell 3.1 4.1",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 4,
+              "end_row_offset_idx": 5,
+              "start_col_offset_idx": 2,
+              "end_col_offset_idx": 3,
+              "text": "Cell 4.2",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 3,
+              "col_span": 1,
+              "start_row_offset_idx": 3,
+              "end_row_offset_idx": 6,
+              "start_col_offset_idx": 3,
+              "end_col_offset_idx": 4,
+              "text": "",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 2,
+              "col_span": 1,
+              "start_row_offset_idx": 4,
+              "end_row_offset_idx": 6,
+              "start_col_offset_idx": 4,
+              "end_col_offset_idx": 5,
+              "text": "Merged Cell 4.4 5.4",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ],
+          [
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 5,
+              "end_row_offset_idx": 6,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 5,
+              "end_row_offset_idx": 6,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 2,
+              "text": "",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 5,
+              "end_row_offset_idx": 6,
+              "start_col_offset_idx": 2,
+              "end_col_offset_idx": 3,
+              "text": "",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 3,
+              "col_span": 1,
+              "start_row_offset_idx": 3,
+              "end_row_offset_idx": 6,
+              "start_col_offset_idx": 3,
+              "end_col_offset_idx": 4,
+              "text": "",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 2,
+              "col_span": 1,
+              "start_row_offset_idx": 4,
+              "end_row_offset_idx": 6,
+              "start_col_offset_idx": 4,
+              "end_col_offset_idx": 5,
+              "text": "Merged Cell 4.4 5.4",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ],
+          [
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 6,
+              "end_row_offset_idx": 7,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 6,
+              "end_row_offset_idx": 7,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 2,
+              "text": "",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 6,
+              "end_row_offset_idx": 7,
+              "start_col_offset_idx": 2,
+              "end_col_offset_idx": 3,
+              "text": "",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 6,
+              "end_row_offset_idx": 7,
+              "start_col_offset_idx": 3,
+              "end_col_offset_idx": 4,
+              "text": "",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 6,
+              "end_row_offset_idx": 7,
+              "start_col_offset_idx": 4,
+              "end_col_offset_idx": 5,
+              "text": "",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ],
+          [
+            {
+              "row_span": 1,
+              "col_span": 5,
+              "start_row_offset_idx": 7,
+              "end_row_offset_idx": 8,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 5,
+              "text": "",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 5,
+              "start_row_offset_idx": 7,
+              "end_row_offset_idx": 8,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 5,
+              "text": "",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 5,
+              "start_row_offset_idx": 7,
+              "end_row_offset_idx": 8,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 5,
+              "text": "",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 5,
+              "start_row_offset_idx": 7,
+              "end_row_offset_idx": 8,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 5,
+              "text": "",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 5,
+              "start_row_offset_idx": 7,
+              "end_row_offset_idx": 8,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 5,
+              "text": "",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ],
+          [
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 8,
+              "end_row_offset_idx": 9,
+              "start_col_offset_idx": 0,
+              "end_col_offset_idx": 1,
+              "text": "",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 8,
+              "end_row_offset_idx": 9,
+              "start_col_offset_idx": 1,
+              "end_col_offset_idx": 2,
+              "text": "",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 8,
+              "end_row_offset_idx": 9,
+              "start_col_offset_idx": 2,
+              "end_col_offset_idx": 3,
+              "text": "",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 8,
+              "end_row_offset_idx": 9,
+              "start_col_offset_idx": 3,
+              "end_col_offset_idx": 4,
+              "text": "",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            },
+            {
+              "row_span": 1,
+              "col_span": 1,
+              "start_row_offset_idx": 8,
+              "end_row_offset_idx": 9,
+              "start_col_offset_idx": 4,
+              "end_col_offset_idx": 5,
+              "text": "Cell 8.4",
+              "column_header": false,
+              "row_header": false,
+              "row_section": false
+            }
+          ]
+        ]
+      }
+    }
+  ],
+  "key_value_items": [],
+  "pages": {}
+}
\ No newline at end of file
diff --git a/tests/data/groundtruth/docling_v2/word_tables.docx.md b/tests/data/groundtruth/docling_v2/word_tables.docx.md
new file mode 100644
index 00000000..90123c3e
--- /dev/null
+++ b/tests/data/groundtruth/docling_v2/word_tables.docx.md
@@ -0,0 +1,44 @@
+## Test with tables
+
+A uniform table
+
+| Header 0.0   | Header 0.1   | Header 0.2   |
+|--------------|--------------|--------------|
+| Cell 1.0     | Cell 1.1     | Cell 1.2     |
+| Cell 2.0     | Cell 2.1     | Cell 2.2     |
+
+A non-uniform table with horizontal spans
+
+| Header 0.0   | Header 0.1          | Header 0.2          |
+|--------------|---------------------|---------------------|
+| Cell 1.0     | Merged Cell 1.1 1.2 | Merged Cell 1.1 1.2 |
+| Cell 2.0     | Merged Cell 2.1 2.2 | Merged Cell 2.1 2.2 |
+
+A non-uniform table with horizontal spans in inner columns
+
+| Header 0.0   | Header 0.1          | Header 0.2          | Header 0.3   |
+|--------------|---------------------|---------------------|--------------|
+| Cell 1.0     | Merged Cell 1.1 1.2 | Merged Cell 1.1 1.2 | Cell 1.3     |
+| Cell 2.0     | Merged Cell 2.1 2.2 | Merged Cell 2.1 2.2 | Cell 2.3     |
+
+A non-uniform table with vertical spans
+
+| Header 0.0   | Header 0.1          | Header 0.2   |
+|--------------|---------------------|--------------|
+| Cell 1.0     | Merged Cell 1.1 2.1 | Cell 1.2     |
+| Cell 2.0     | Merged Cell 1.1 2.1 | Cell 2.2     |
+| Cell 3.0     | Merged Cell 3.1 4.1 | Cell 3.2     |
+| Cell 4.0     | Merged Cell 3.1 4.1 | Cell 4.2     |
+
+A non-uniform table with all kinds of spans and empty cells
+
+| Header 0.0   | Header 0.1          | Header 0.2   |    |                     |
+|--------------|---------------------|--------------|----|---------------------|
+| Cell 1.0     | Merged Cell 1.1 2.1 | Cell 1.2     |    |                     |
+| Cell 2.0     | Merged Cell 1.1 2.1 | Cell 2.2     |    |                     |
+| Cell 3.0     | Merged Cell 3.1 4.1 | Cell 3.2     |    |                     |
+| Cell 4.0     | Merged Cell 3.1 4.1 | Cell 4.2     |    | Merged Cell 4.4 5.4 |
+|              |                     |              |    | Merged Cell 4.4 5.4 |
+|              |                     |              |    |                     |
+|              |                     |              |    |                     |
+|              |                     |              |    | Cell 8.4            |
\ No newline at end of file
diff --git a/tests/data/html/example_06.html b/tests/data/html/example_06.html
new file mode 100644
index 00000000..efafd278
--- /dev/null
+++ b/tests/data/html/example_06.html
@@ -0,0 +1,12 @@
+<html>
+<head>
+    <title>Sample HTML File</title>
+</head>
+<body>
+    <div>This is a div with text.</div>
+    <div>This is another div with text.</div>
+    <p>This is a regular paragraph.</p>
+    <div>This is a third div<br/>with a new line.</div>
+    <div><p>This is a fourth div with a <b>bold</b> paragraph.</p></div>
+</body>
+</html>
diff --git a/tests/data/jats/bmj_sample.xml b/tests/data/jats/bmj_sample.xml
new file mode 100644
index 00000000..3a6d1365
--- /dev/null
+++ b/tests/data/jats/bmj_sample.xml
@@ -0,0 +1,842 @@
+<?xml version="1.0" encoding="UTF-8"?>
+<!DOCTYPE article PUBLIC "-//NLM//DTD JATS (Z39.96) Journal Publishing DTD v1.1 20151215//EN" "JATS-journalpublishing1.dtd">
+<article article-type="research-article" dtd-version="1.1" xml:lang="en"
+xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink"
+xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" >
+<front>
+<journal-meta>
+<journal-id journal-id-type="pmc">bmj</journal-id>
+<journal-id journal-id-type="pubmed">BMJ</journal-id>
+<journal-id journal-id-type="publisher">BMJ</journal-id>
+<issn>0959-8138</issn>
+<publisher>
+<publisher-name>BMJ</publisher-name>
+</publisher>
+</journal-meta>
+<article-meta>
+<article-id pub-id-type="other">jBMJ.v324.i7342.pg880</article-id>
+<article-id pub-id-type="pmid">11950738</article-id>
+<article-categories>
+<subj-group>
+<subject>Primary care</subject>
+<subj-group>
+<subject>190</subject>
+<subject>10</subject>
+<subject>218</subject>
+<subject>219</subject>
+<subject>355</subject>
+<subject>357</subject>
+</subj-group>
+</subj-group>
+</article-categories>
+<title-group>
+<article-title>Evolving general practice consultation in Britain: issues of length and
+context</article-title>
+</title-group>
+<contrib-group>
+<contrib contrib-type="author">
+<name>
+<surname>Freeman</surname>
+<given-names>George K</given-names>
+</name>
+<role>professor of general practice</role>
+<xref ref-type="aff" rid="aff-a"/>
+</contrib>
+<contrib contrib-type="author">
+<name>
+<surname>Horder</surname>
+<given-names>John P</given-names>
+</name>
+<role>past president</role>
+<xref ref-type="aff" rid="aff-b"/>
+</contrib>
+<contrib contrib-type="author">
+<name>
+<surname>Howie</surname>
+<given-names>John G R</given-names>
+</name>
+<role>emeritus professor of general practice</role>
+<xref ref-type="aff" rid="aff-c"/>
+</contrib>
+<contrib contrib-type="author">
+<name>
+<surname>Hungin</surname>
+<given-names>A Pali</given-names>
+</name>
+<role>professor of general practice</role>
+<xref ref-type="aff" rid="aff-d"/>
+</contrib>
+<contrib contrib-type="author">
+<name>
+<surname>Hill</surname>
+<given-names>Alison P</given-names>
+</name>
+<role>general practitioner</role>
+<xref ref-type="aff" rid="aff-e"/>
+</contrib>
+<contrib contrib-type="author">
+<name>
+<surname>Shah</surname>
+<given-names>Nayan C</given-names>
+</name>
+<role>general practitioner</role>
+<xref ref-type="aff" rid="aff-b"/>
+</contrib>
+<contrib contrib-type="author">
+<name>
+<surname>Wilson</surname>
+<given-names>Andrew</given-names>
+</name>
+<role>senior lecturer</role>
+<xref ref-type="aff" rid="aff-f"/>
+</contrib>
+</contrib-group>
+<aff id="aff-a">Centre for Primary Care and Social Medicine, Imperial College of Science,
+Technology and Medicine, London W6 8RP</aff>
+<aff id="aff-b">Royal College of General Practitioners, London SW7 1PU</aff>
+<aff id="aff-c">Department of General Practice, University of Edinburgh, Edinburgh EH8 9DX</aff>
+<aff id="aff-d">Centre for Health Studies, University of Durham, Durham DH1 3HN</aff>
+<aff id="aff-e">Kilburn Park Medical Centre, London NW6</aff>
+<aff id="aff-f">Department of General Practice and Primary Health Care, University of Leicester,
+Leicester LE5 4PW</aff>
+<author-notes>
+<fn fn-type="con">
+<p>Contributors: GKF wrote the paper and revised it after repeated and detailed comments from
+all of the other authors and feedback from the first referee and from the <italic>BMJ</italic>
+editorial panel. All other authors gave detailed and repeated comments and cristicisms. GKF is
+the guarantor of the paper.</p>
+</fn>
+<fn>
+<p>Correspondence to: G Freeman <email>g.freeman@ic.ac.uk</email> </p>
+</fn>
+</author-notes>
+<pub-date date-type="pub" publication-format="print" iso-8601-date="2002-04-13">
+<day>13</day>
+<month>4</month>
+<year>2002</year>
+</pub-date>
+<volume>324</volume>
+<issue>7342</issue>
+<fpage>880</fpage>
+<lpage>882</lpage>
+<history>
+<date date-type="accepted" iso-8601-date="2002-02-07" publication-format="print">
+<day>7</day>
+<month>2</month>
+<year>2002</year>
+</date>
+</history>
+<permissions>
+<copyright-statement>Copyright &#x00A9; 2002, BMJ</copyright-statement>
+<copyright-year>2002, </copyright-year>
+</permissions>
+</article-meta>
+</front>
+<body>
+<p>In 1999 Shah<xref ref-type="bibr" rid="B1">1</xref> and others said that the Royal College of
+General Practitioners should advocate longer consultations in general practice as a matter of
+policy. The college set up a working group chaired by A P Hungin, and a systematic review of
+literature on consultation length in general practice was commissioned. The working group agreed
+that the available evidence would be hard to interpret without discussion of the changing context
+within which consultations now take place. For many years general practitioners and those who
+have surveyed patients' opinions in the United Kingdom have complained about short consultation
+time, despite a steady increase in actual mean length. Recently Mechanic pointed out that this is
+also true in the United States.<xref ref-type="bibr" rid="B2">2</xref> Is there any justification
+for a further increase in mean time allocated per consultation in general practice?</p>
+<p>We report on the outcome of extensive debate among a group of general practitioners with an
+interest in the process of care, with reference to the interim findings of the commissioned
+systematic review and our personal databases. The review identified 14 relevant papers. <boxed-text>
+<sec>
+<title>Summary points</title>
+<p> <list list-type="bullet">
+<list-item>
+<p>Longer consultations are associated with a range of better patient outcomes</p>
+</list-item>
+<list-item>
+<p>Modern consultations in general practice deal with patients with more serious and chronic
+conditions</p>
+</list-item>
+<list-item>
+<p>Increasing patient participation means more complex interaction, which demands extra
+time</p>
+</list-item>
+<list-item>
+<p>Difficulties with access and with loss of continuity add to perceived stress and poor
+performance and lead to further pressure on time</p>
+</list-item>
+<list-item>
+<p>Longer consultations should be a professional priority, combined with increased use of
+technology and more flexible practice management to maximise interpersonal continuity</p>
+</list-item>
+<list-item>
+<p>Research on implementation is needed</p>
+</list-item>
+</list> </p>
+</sec>
+</boxed-text> </p>
+<sec sec-type="subjects">
+<title>Longer consultations: benefits for patients</title>
+<p>The systematic review consistently showed that doctors with longer consultation times
+prescribe less and offer more advice on lifestyle and other health promoting activities. Longer
+consultations have been significantly associated with better recognition and handling of
+psychosocial problems<xref ref-type="bibr" rid="B3">3</xref> and with better patient
+enablement.<xref ref-type="bibr" rid="B4">4</xref> Also clinical care for some chronic illnesses
+is better in practices with longer booked intervals between one appointment and the next.<xref
+ref-type="bibr" rid="B5">5</xref> It is not clear whether time is itself the main influence or
+whether some doctors insist on more time.</p>
+<p>A national survey in 1998 reported that most (87&#x0025;) patients were satisfied with the
+length of their most recent consultation.<xref ref-type="bibr" rid="B6">6</xref> Satisfaction
+with any service will be high if expectations are met or exceeded. But expectations are modified
+by previous experience.<xref ref-type="bibr" rid="B7">7</xref> The result is that primary care
+patients are likely to be satisfied with what they are used to unless the context modifies the
+effects of their own experience.</p>
+</sec>
+<sec>
+<title>Context of modern consultations</title>
+<p>Shorter consultations were more appropriate when the population was younger, when even a brief
+absence from employment due to sickness required a doctor's note, and when many simple remedies
+were available only on prescription. Recently at least five important influences have increased
+the content and hence the potential length of the consultation.</p>
+</sec>
+<sec>
+<title>Participatory consultation style</title>
+<p>The most effective consultations are those in which doctors most directly acknowledge and
+perhaps respond to patients' problems and concerns. In addition, for patients to be committed to
+taking advantage of medical advice they must agree with both the goals and methods proposed. A
+landmark publication in the United Kingdom was <italic>Meetings Between Experts</italic>, which
+argued that while doctors are the experts about medical problems in general patients are the
+experts on how they themselves experience these problems.<xref ref-type="bibr" rid="B8">8</xref>
+New emphasis on teaching consulting skills in general practice advocated specific attention to
+the patient's agenda, beliefs, understanding, and agreement. Currently the General Medical
+Council, aware that communication difficulties underlie many complaints about doctors, has
+further emphasised the importance of involving patients in consultations in its revised guidance
+to medical schools.<xref ref-type="bibr" rid="B9">9</xref> More patient involvement should give
+a better outcome, but this participatory style usually lengthens consultations.</p>
+</sec>
+<sec>
+<title>Extended professional agenda</title>
+<p>The traditional consultation in general practice was brief.<xref ref-type="bibr" rid="B2"
+>2</xref> The patient presented symptoms and the doctor prescribed treatment. In 1957 Balint
+gave new insights into the meaning of symptoms.<xref ref-type="bibr" rid="B10">10</xref> By 1979
+an enhanced model of consultation was presented, in which the doctors dealt with ongoing as well
+as presenting problems and added health promotion and education about future appropriate use of
+services.<xref ref-type="bibr" rid="B11">11</xref> Now, with an ageing population and more
+community care of chronic illness, there are more issues to be considered at each consultation.
+Ideas of what constitutes good general practice are more complex.<xref ref-type="bibr" rid="B12"
+>12</xref> Good practice now includes both extended care of chronic medical problems&#x2014;for
+example, coronary heart disease<xref ref-type="bibr" rid="B13">13</xref>&#x2014;and a public
+health role. At first this model was restricted to those who lead change (&#x201C;early
+adopters&#x201D;) and enthusiasts<xref ref-type="bibr" rid="B14">14</xref> but now it is
+embedded in professional and managerial expectations of good practice.</p>
+<p>Adequate time is essential. It may be difficult for an elderly patient with several active
+problems to undress, be examined, and get adequate professional consideration in under 15
+minutes. Here the doctor is faced with the choice of curtailing the consultation or of reducing
+the time available for the next patient. Having to cope with these situations often contributes
+to professional dissatisfaction.<xref ref-type="bibr" rid="B15">15</xref> This combination of
+more care, more options, and more genuine discussion of those options with informed patient
+choice inevitably leads to pressure on time.</p>
+</sec>
+<sec>
+<title>Access problems</title>
+<p>In a service free at the point of access, rising demand will tend to increase rationing by
+delay. But attempts to improve access by offering more consultations at short notice squeeze
+consultation times.</p>
+<p>While appointment systems can and should reduce queuing time for consultations, they have long
+tended to be used as a brake on total demand.<xref ref-type="bibr" rid="B16">16</xref> This may
+seriously erode patients' confidence in being able to see their doctor or nurse when they need
+to. Patients are offered appointments further ahead but may keep these even if their symptoms
+have remitted &#x201C;just in case.&#x201D; Availability of consultations is thus blocked.
+Receptionists are then inappropriately blamed for the inadequate access to doctors.</p>
+<p>In response to perception of delay, the government has set targets in the NHS plan of
+&#x201C;guaranteed access to a primary care professional within 24 hours and to a primary care
+doctor within 48 hours.&#x201D; Implementation is currently being negotiated.</p>
+<p>Virtually all patients think that they would not consult unless it was absolutely necessary.
+They do not think they are wasting NHS time and do not like being made to feel so. But
+underlying general practitioners' willingness to make patients wait several days is their
+perception that few of the problems are urgent. Patients and general practitioners evidently do
+not agree about the urgency of so called minor problems. To some extent general practice in the
+United Kingdom may have scored an &#x201C;own goal&#x201D; by setting up perceived access
+barriers (appointment systems and out of hours cooperatives) in the attempt to increase
+professional standards and control demand in a service that is free at the point of access.</p>
+<p>A further government initiative has been to bypass general practice with new
+services&#x2014;notably, walk-in centres (primary care clinics in which no appointment is
+needed) and NHS Direct (a professional telephone helpline giving advice on simple remedies and
+access to services). Introduced widely and rapidly, these services each potentially provide
+significant features of primary care&#x2014;namely, quick access to skilled health advice and
+first line treatment.</p>
+</sec>
+<sec>
+<title>Loss of interpersonal continuity</title>
+<p>If a patient has to consult several different professionals, particularly over a short period
+of time, there is inevitable duplication of stories, risk of naive diagnoses, potential for
+conflicting advice, and perhaps loss of trust. Trust is essential if patients are to accept the
+&#x201C;wait and see&#x201D; management policy which is, or should be, an important part of the
+management of self limiting conditions, which are often on the boundary between illness and
+non-illness.<xref ref-type="bibr" rid="B17">17</xref> Such duplication again increases pressure
+for more extra (unscheduled) consultations resulting in late running and professional
+frustration.<xref ref-type="bibr" rid="B18">18</xref> </p>
+<p>Mechanic described how loss of longitudinal (and perhaps personal and relational<xref
+ref-type="bibr" rid="B19">19</xref>) continuity influences the perception and use of time
+through an inability to build on previous consultations.<xref ref-type="bibr" rid="B2">2</xref>
+Knowing the doctor well, particularly in smaller practices, is associated with enhanced patient
+enablement in shorter time.<xref ref-type="bibr" rid="B4">4</xref> Though Mechanic pointed out
+that three quarters of UK patients have been registered with their general practitioner five
+years or more, this may be misleading. Practices are growing, with larger teams and more
+registered patients. Being registered with a doctor in a larger practice is usually no guarantee
+that the patient will be able to see the same doctor or the doctor of his or her choice, who may
+be different. Thus the system does not encourage adequate personal continuity. This adds to
+pressure on time and reduces both patient and professional satisfaction.</p>
+</sec>
+<sec>
+<title>Health service reforms</title>
+<p>Finally, for the past 15 years the NHS has experienced unprecedented change with a succession
+of major administrative reforms. Recent reforms have focused on an NHS led by primary care,
+including the aim of shifting care from the secondary specialist sector to primary care. One
+consequence is increased demand for primary care of patients with more serious and less stable
+problems. With the limited piloting of reforms we do not know whether such major redirection can
+be achieved without greatly altering the delicate balance between expectations (of both patients
+and staff) and what is delivered.</p>
+</sec>
+<sec>
+<title>The future</title>
+<p>We think that the way ahead must embrace both longer mean consultation times and more
+flexibility. More time is needed for high quality consultations with patients with major and
+complex problems of all kinds. But patients also need access to simpler services and advice.
+This should be more appropriate (and cost less) when it is given by professionals who know the
+patient and his or her medical history and social circumstances. For doctors, the higher quality
+associated with longer consultations may lead to greater professional satisfaction and, if these
+longer consultations are combined with more realistic scheduling, to reduced levels of
+stress.<xref ref-type="bibr" rid="B20">20</xref> They will also find it easier to develop
+further the care of chronic disease.</p>
+<p>The challenge posed to general practice by walk-in centres and NHS Direct is considerable, and
+the diversion of funding from primary care is large. The risk of waste and duplication increases
+as more layers of complexity are added to a primary care service that started out as something
+familiar, simple, and local and which is still envied in other developed countries.<xref
+ref-type="bibr" rid="B21">21</xref> Access needs to be simple, and the advantages of personal
+knowledge and trust in minimising duplication and overmedicalisation need to be exploited.</p>
+<p>We must ensure better communication and access so that patients can more easily deal with
+minor issues and queries with someone they know and trust and avoid the formality and
+inconvenience of a full face to face consultation. Too often this has to be with a different
+professional, unfamiliar with the nuances of the case. There should be far more managerial
+emphasis on helping patients to interact with their chosen practitioner<xref ref-type="bibr"
+rid="B22">22</xref>; such a programme has been described.<xref ref-type="bibr" rid="B23"
+>23</xref> Modern information systems make it much easier to record which doctor(s) a patient
+prefers to see and to monitor how often this is achieved. The telephone is hardly modern but is
+underused. Email avoids the problems inherent in arranging simultaneous availability necessary
+for telephone consultations but at the cost of reducing the communication of emotions. There is
+a place for both.<xref ref-type="bibr" rid="B2">2</xref> Access without prior appointment is a
+valued feature of primary care, and we need to know more about the right balance between planned
+and ad hoc consulting.</p>
+</sec>
+<sec>
+<title>Next steps</title>
+<p>General practitioners do not behave in a uniform way. They can be categorised as slow, medium,
+and fast and react in different ways to changes in consulting speed.<xref ref-type="bibr"
+rid="B18">18</xref> They are likely to have differing views about a widespread move to lengthen
+consultation time. We do not need further confirmation that longer consultations are desirable
+and necessary, but research could show us the best way to learn how to introduce them with
+minimal disruption to the way in which patients and practices like primary care to be
+provided.<xref ref-type="bibr" rid="B24">24</xref> We also need to learn how to make the most of
+available time in complex consultations.</p>
+<p>Devising appropriate incentives and helping practices move beyond just reacting to demand in
+the traditional way by working harder and faster is perhaps our greatest challenge in the United
+Kingdom. The new primary are trusts need to work together with the growing primary care research
+networks to carry out the necessary development work. In particular, research is needed on how a
+primary care team can best provide the right balance of quick access and interpersonal knowledge
+and trust.</p>
+</sec>
+</body>
+<back>
+<ack>
+<p>We thank the other members of the working group: Susan Childs, Paul Freeling, Iona Heath,
+Marshall Marinker, and Bonnie Sibbald. We also thank Fenny Green of the Royal College of General
+Practitioners for administrative help.</p>
+</ack>
+<ref-list>
+<ref id="B1">
+<label>1</label>
+<element-citation publication-type="journal" publication-format="print">
+<person-group person-group-type="author"> <name>
+<surname>Shah</surname>
+<given-names>NC</given-names>
+</name> </person-group>
+<article-title>Viewpoint: Consultation time&#x2014;time for a change? Still the
+&#x201C;perfunctory work of perfunctory men!&#x201D;</article-title>
+<source>Br J Gen Pract</source>
+<year iso-8601-date="1999">1999</year>
+<volume>49</volume>
+<fpage>497</fpage>
+</element-citation>
+</ref>
+<ref id="B2">
+<label>2</label>
+<element-citation publication-type="journal" publication-format="print">
+<person-group person-group-type="author"> <name>
+<surname>Mechanic</surname>
+<given-names>D</given-names>
+</name> </person-group>
+<article-title>How should hamsters run? Some observations about sufficient patient time in
+primary care</article-title>
+<source>BMJ</source>
+<year iso-8601-date="2001">2001</year>
+<volume>323</volume>
+<fpage>266</fpage>
+<lpage>268</lpage>
+<pub-id pub-id-type="pmid">11485957</pub-id>
+</element-citation>
+</ref>
+<ref id="B3">
+<label>3</label>
+<element-citation publication-type="journal" publication-format="print">
+<person-group person-group-type="author"> <name>
+<surname>Howie</surname>
+<given-names>JGR</given-names>
+</name> <name>
+<surname>Porter</surname>
+<given-names>AMD</given-names>
+</name> <name>
+<surname>Heaney</surname>
+<given-names>DJ</given-names>
+</name> <name>
+<surname>Hopton</surname>
+<given-names>JL</given-names>
+</name> </person-group>
+<article-title>Long to short consultation ratio: a proxy measure of quality of care for general
+practice</article-title>
+<source>Br J Gen Pract</source>
+<year iso-8601-date="1991">1991</year>
+<volume>41</volume>
+<fpage>48</fpage>
+<lpage>54</lpage>
+<pub-id pub-id-type="pmid">2031735</pub-id>
+</element-citation>
+</ref>
+<ref id="B4">
+<label>4</label>
+<element-citation publication-type="journal" publication-format="print">
+<person-group person-group-type="author"> <name>
+<surname>Howie</surname>
+<given-names>JGR</given-names>
+</name> <name>
+<surname>Heaney</surname>
+<given-names>DJ</given-names>
+</name> <name>
+<surname>Maxwell</surname>
+<given-names>M</given-names>
+</name> <name>
+<surname>Walker</surname>
+<given-names>JJ</given-names>
+</name> <name>
+<surname>Freeman</surname>
+<given-names>GK</given-names>
+</name> <name>
+<surname>Rai</surname>
+<given-names>H</given-names>
+</name> </person-group>
+<article-title>Quality at general practice consultations: cross-sectional
+survey</article-title>
+<source>BMJ</source>
+<year iso-8601-date="1999">1999</year>
+<volume>319</volume>
+<fpage>738</fpage>
+<lpage>743</lpage>
+<pub-id pub-id-type="pmid">10487999</pub-id>
+</element-citation>
+</ref>
+<ref id="B5">
+<label>5</label>
+<element-citation publication-type="journal" publication-format="print">
+<person-group person-group-type="author"> <name>
+<surname>Kaplan</surname>
+<given-names>SH</given-names>
+</name> <name>
+<surname>Greenfield</surname>
+<given-names>S</given-names>
+</name> <name>
+<surname>Ware</surname>
+<given-names>JE</given-names>
+</name> </person-group>
+<article-title>Assessing the effects of physician-patient interactions on the outcome of
+chronic disease</article-title>
+<source>Med Care</source>
+<year iso-8601-date="1989">1989</year>
+<volume>27</volume>
+<supplement>suppl 3</supplement>
+<fpage>110</fpage>
+<lpage>125</lpage>
+</element-citation>
+</ref>
+<ref id="B6">
+<label>6</label>
+<element-citation publication-type="book" publication-format="print">
+<person-group person-group-type="editor"> <name>
+<surname>Airey</surname>
+<given-names>C</given-names>
+</name> <name>
+<surname>Erens</surname>
+<given-names>B</given-names>
+</name> </person-group>
+<source>National surveys of NHS patients: general practice, 1998</source>
+<year iso-8601-date="1999">1999</year>
+<publisher-loc>London</publisher-loc>
+<publisher-name>NHS Executive</publisher-name>
+</element-citation>
+</ref>
+<ref id="B7">
+<label>7</label>
+<element-citation publication-type="journal" publication-format="print">
+<person-group person-group-type="author"> <name>
+<surname>Hart</surname>
+<given-names>JT</given-names>
+</name> </person-group>
+<article-title>Expectations of health care: promoted, managed or shared?</article-title>
+<source>Health Expect</source>
+<year iso-8601-date="1998">1998</year>
+<volume>1</volume>
+<fpage>3</fpage>
+<lpage>13</lpage>
+<pub-id pub-id-type="pmid">11281857</pub-id>
+</element-citation>
+</ref>
+<ref id="B8">
+<label>8</label>
+<element-citation publication-type="book" publication-format="print">
+<person-group person-group-type="author"> <name>
+<surname>Tuckett</surname>
+<given-names>D</given-names>
+</name> <name>
+<surname>Boulton</surname>
+<given-names>M</given-names>
+</name> <name>
+<surname>Olson</surname>
+<given-names>C</given-names>
+</name> <name>
+<surname>Williams</surname>
+<given-names>A</given-names>
+</name> </person-group>
+<source>Meetings between experts: an approach to sharing ideas in medical
+consultations</source>
+<year iso-8601-date="1985">1985</year>
+<publisher-loc>London</publisher-loc>
+<publisher-name>Tavistock Publications</publisher-name>
+</element-citation>
+</ref>
+<ref id="B9">
+<label>9</label>
+<mixed-citation publication-type="webpage" publication-format="web">General Medical Council.
+<source>Draft recommendations on undergraduate medical education</source>. July 2001.
+www.gmc-uk.org/med_ed/tomorrowsdoctors/index.htm (accessed 2 Jan 2002).</mixed-citation>
+</ref>
+<ref id="B10">
+<label>10</label>
+<element-citation publication-type="book" publication-format="print">
+<person-group person-group-type="author"> <name>
+<surname>Balint</surname>
+<given-names>M</given-names>
+</name> </person-group>
+<source>The doctor, his patient and the illness</source>
+<year iso-8601-date="1957">1957</year>
+<publisher-loc>London</publisher-loc>
+<publisher-name>Tavistock</publisher-name>
+</element-citation>
+</ref>
+<ref id="B11">
+<label>11</label>
+<element-citation publication-type="journal" publication-format="print">
+<person-group person-group-type="author"> <name>
+<surname>Stott</surname>
+<given-names>NCH</given-names>
+</name> <name>
+<surname>Davies</surname>
+<given-names>RH</given-names>
+</name> </person-group>
+<article-title>The exceptional potential in each primary care consultation</article-title>
+<source>J R Coll Gen Pract</source>
+<year iso-8601-date="1979">1979</year>
+<volume>29</volume>
+<fpage>210</fpage>
+<lpage>205</lpage>
+</element-citation>
+</ref>
+<ref id="B12">
+<label>12</label>
+<element-citation publication-type="book" publication-format="print">
+<person-group person-group-type="author"> <name>
+<surname>Hill</surname>
+<given-names>AP</given-names>
+</name> </person-group>
+<person-group person-group-type="editor"> <name>
+<surname>Hill</surname>
+<given-names>AP</given-names>
+</name> </person-group>
+<article-title>Challenges for primary care</article-title>
+<source>What's gone wrong with health care? Challenges for the new millennium</source>
+<year iso-8601-date="2000">2000</year>
+<publisher-loc>London</publisher-loc>
+<publisher-name>King's Fund</publisher-name>
+<fpage>75</fpage>
+<lpage>86</lpage>
+</element-citation>
+</ref>
+<ref id="B13">
+<label>13</label>
+<element-citation publication-type="book" publication-format="print">
+<collab>Department of Health</collab>
+<source>National service framework for coronary heart disease</source>
+<year iso-8601-date="2000">2000</year>
+<publisher-loc>London</publisher-loc>
+<publisher-name>Department of Health</publisher-name>
+</element-citation>
+</ref>
+<ref id="B14">
+<label>14</label>
+<element-citation publication-type="book" publication-format="print">
+<person-group person-group-type="author"> <name>
+<surname>Hart</surname>
+<given-names>JT</given-names>
+</name> </person-group>
+<source>A new kind of doctor: the general practitioner's part in the health of the
+community</source>
+<year iso-8601-date="1988">1988</year>
+<publisher-loc>London</publisher-loc>
+<publisher-name>Merlin Press</publisher-name>
+</element-citation>
+</ref>
+<ref id="B15">
+<label>15</label>
+<element-citation publication-type="journal" publication-format="print">
+<person-group person-group-type="author"> <name>
+<surname>Morrison</surname>
+<given-names>I</given-names>
+</name> <name>
+<surname>Smith</surname>
+<given-names>R</given-names>
+</name> </person-group>
+<article-title>Hamster health care</article-title>
+<source>BMJ</source>
+<year iso-8601-date="2000">2000</year>
+<volume>321</volume>
+<fpage>1541</fpage>
+<lpage>1542</lpage>
+<pub-id pub-id-type="pmid">11124164</pub-id>
+</element-citation>
+</ref>
+<ref id="B16">
+<label>16</label>
+<element-citation publication-type="journal" publication-format="print">
+<person-group person-group-type="author"> <name>
+<surname>Arber</surname>
+<given-names>S</given-names>
+</name> <name>
+<surname>Sawyer</surname>
+<given-names>L</given-names>
+</name> </person-group>
+<article-title>Do appointment systems work?</article-title>
+<source>BMJ</source>
+<year iso-8601-date="1982">1982</year>
+<volume>284</volume>
+<fpage>478</fpage>
+<lpage>480</lpage>
+<pub-id pub-id-type="pmid">6800503</pub-id>
+</element-citation>
+</ref>
+<ref id="B17">
+<label>17</label>
+<element-citation publication-type="journal" publication-format="print">
+<person-group person-group-type="author"> <name>
+<surname>Hjortdahl</surname>
+<given-names>P</given-names>
+</name> <name>
+<surname>Borchgrevink</surname>
+<given-names>CF</given-names>
+</name> </person-group>
+<article-title>Continuity of care: influence of general practitioners' knowledge about their
+patients on use of resources in consultations</article-title>
+<source>BMJ</source>
+<year iso-8601-date="1991">1991</year>
+<volume>303</volume>
+<fpage>1181</fpage>
+<lpage>1184</lpage>
+<pub-id pub-id-type="pmid">1747619</pub-id>
+</element-citation>
+</ref>
+<ref id="B18">
+<label>18</label>
+<element-citation publication-type="journal" publication-format="print">
+<person-group person-group-type="author"> <name>
+<surname>Howie</surname>
+<given-names>JGR</given-names>
+</name> <name>
+<surname>Hopton</surname>
+<given-names>JL</given-names>
+</name> <name>
+<surname>Heaney</surname>
+<given-names>DJ</given-names>
+</name> <name>
+<surname>Porter</surname>
+<given-names>AMD</given-names>
+</name> </person-group>
+<article-title>Attitudes to medical care, the organization of work, and stress among general
+practitioners</article-title>
+<source>Br J Gen Pract</source>
+<year iso-8601-date="1992">1992</year>
+<volume>42</volume>
+<fpage>181</fpage>
+<lpage>185</lpage>
+<pub-id pub-id-type="pmid">1389427</pub-id>
+</element-citation>
+</ref>
+<ref id="B19">
+<label>19</label>
+<element-citation publication-type="book" publication-format="web">
+<person-group person-group-type="author"> <name>
+<surname>Freeman</surname>
+<given-names>G</given-names>
+</name> <name>
+<surname>Shepperd</surname>
+<given-names>S</given-names>
+</name> <name>
+<surname>Robinson</surname>
+<given-names>I</given-names>
+</name> <name>
+<surname>Ehrich</surname>
+<given-names>K</given-names>
+</name> <name>
+<surname>Richards</surname>
+<given-names>SC</given-names>
+</name> <name>
+<surname>Pitman</surname>
+<given-names>P</given-names>
+</name> </person-group>
+<source>Continuity of care: report of a scoping exercise for the national co-ordinating centre
+for NHS Service Delivery and Organisation R&#x0026;D (NCCSDO), Summer 2000</source>
+<year iso-8601-date="2001">2001</year>
+<publisher-loc>London</publisher-loc>
+<publisher-name>NCCSDO</publisher-name>
+<comment><ext-link ext-link-type="url" xmlns:xlink="http://www.w3.org/1999/xlink"
+xlink:href="http://www.sdo.lshtm.ac.uk/continuityofcare.htm"
+>www.sdo.lshtm.ac.uk/continuityofcare.htm</ext-link> (accessed 2 Jan 2002)</comment>
+</element-citation>
+</ref>
+<ref id="B20">
+<label>20</label>
+<element-citation publication-type="journal" publication-format="print">
+<person-group person-group-type="author"> <name>
+<surname>Wilson</surname>
+<given-names>A</given-names>
+</name> <name>
+<surname>McDonald</surname>
+<given-names>P</given-names>
+</name> <name>
+<surname>Hayes</surname>
+<given-names>L</given-names>
+</name> <name>
+<surname>Cooney</surname>
+<given-names>J</given-names>
+</name> </person-group>
+<article-title>Longer booking intervals in general practice: effects on doctors' stress and
+arousal</article-title>
+<source>Br J Gen Pract</source>
+<year iso-8601-date="1991">1991</year>
+<volume>41</volume>
+<fpage>184</fpage>
+<lpage>187</lpage>
+<pub-id pub-id-type="pmid">1878267</pub-id>
+</element-citation>
+</ref>
+<ref id="B21">
+<label>21</label>
+<element-citation publication-type="journal" publication-format="print">
+<person-group person-group-type="author"> <name>
+<surname>De Maeseneer</surname>
+<given-names>J</given-names>
+</name> <name>
+<surname>Hjortdahl</surname>
+<given-names>P</given-names>
+</name> <name>
+<surname>Starfield</surname>
+<given-names>B</given-names>
+</name> </person-group>
+<article-title>Fix what's wrong, not what's right, with general practice in
+Britain</article-title>
+<source>BMJ</source>
+<year iso-8601-date="2000">2000</year>
+<volume>320</volume>
+<fpage>1616</fpage>
+<lpage>1617</lpage>
+<pub-id pub-id-type="pmid">10856043</pub-id>
+</element-citation>
+</ref>
+<ref id="B22">
+<label>22</label>
+<element-citation publication-type="journal" publication-format="print">
+<person-group person-group-type="author"> <name>
+<surname>Freeman</surname>
+<given-names>G</given-names>
+</name> <name>
+<surname>Hjortdahl</surname>
+<given-names>P</given-names>
+</name> </person-group>
+<article-title>What future for continuity of care in general practice?</article-title>
+<source>BMJ</source>
+<year iso-8601-date="1997">1997</year>
+<volume>314</volume>
+<fpage>1870</fpage>
+<lpage>1873</lpage>
+<pub-id pub-id-type="pmid">9224130</pub-id>
+</element-citation>
+</ref>
+<ref id="B23">
+<label>23</label>
+<element-citation publication-type="journal" publication-format="print">
+<person-group person-group-type="author"> <name>
+<surname>Kibbe</surname>
+<given-names>DC</given-names>
+</name> <name>
+<surname>Bentz</surname>
+<given-names>E</given-names>
+</name> <name>
+<surname>McLaughlin</surname>
+<given-names>CP</given-names>
+</name> </person-group>
+<article-title>Continuous quality improvement for continuity of care</article-title>
+<source>J Fam Pract</source>
+<year iso-8601-date="1993">1993</year>
+<volume>36</volume>
+<fpage>304</fpage>
+<lpage>308</lpage>
+<pub-id pub-id-type="pmid">8454977</pub-id>
+</element-citation>
+</ref>
+<ref id="B24">
+<label>24</label>
+<element-citation publication-type="journal" publication-format="print">
+<person-group person-group-type="author"> <name>
+<surname>Williams</surname>
+<given-names>M</given-names>
+</name> <name>
+<surname>Neal</surname>
+<given-names>RD</given-names>
+</name> </person-group>
+<article-title>Time for a change? The process of lengthening booking intervals in general
+practice</article-title>
+<source>Br J Gen Pract</source>
+<year iso-8601-date="1998">1998</year>
+<volume>48</volume>
+<fpage>1783</fpage>
+<lpage>1786</lpage>
+<pub-id pub-id-type="pmid">10198490</pub-id>
+</element-citation>
+</ref>
+</ref-list>
+<fn-group>
+<fn id="fn1">
+<p>Funding: Meetings of the working group in 1999-2000 were funded by the
+<funding-source>Scientific Foundation Board of the RCGP</funding-source>.</p>
+</fn>
+<fn id="fn2">
+<p>Competing interests: None declared.</p>
+</fn>
+</fn-group>
+</back>
+</article>
diff --git a/tests/data/pubmed/elife-56337.nxml b/tests/data/jats/elife-56337.nxml
similarity index 100%
rename from tests/data/pubmed/elife-56337.nxml
rename to tests/data/jats/elife-56337.nxml
diff --git a/tests/data/pubmed/elife-56337.txt b/tests/data/jats/elife-56337.txt
similarity index 100%
rename from tests/data/pubmed/elife-56337.txt
rename to tests/data/jats/elife-56337.txt
diff --git a/tests/data/pubmed/elife-56337.xml b/tests/data/jats/elife-56337.xml
similarity index 100%
rename from tests/data/pubmed/elife-56337.xml
rename to tests/data/jats/elife-56337.xml
diff --git a/tests/data/jats/pnas_sample.xml b/tests/data/jats/pnas_sample.xml
new file mode 100644
index 00000000..6c4ed4db
--- /dev/null
+++ b/tests/data/jats/pnas_sample.xml
@@ -0,0 +1,3089 @@
+<?xml version="1.0" encoding="UTF-8"?>
+<!DOCTYPE article PUBLIC "-//NLM//DTD JATS (Z39.96) Journal Publishing DTD v1.1 20151215//EN" "JATS-journalpublishing1.dtd">
+<article
+article-type="research-article"
+dtd-version="1.1" xml:lang="en"
+xmlns:mml="http://www.w3.org/1998/Math/MathML"
+xmlns:xlink="http://www.w3.org/1999/xlink"
+xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" >
+<front>
+<journal-meta>
+<journal-id journal-id-type="pmc">pnas</journal-id>
+<journal-id journal-id-type="pubmed">Proc Natl Acad Sci U S A</journal-id>
+<journal-id journal-id-type="publisher">PNAS</journal-id>
+<issn>0027-8424</issn>
+<publisher>
+<publisher-name>The National Academy of Sciences</publisher-name>
+</publisher>
+</journal-meta>
+<article-meta>
+<article-id pub-id-type="publisher-id">181325198</article-id>
+<article-id pub-id-type="publisher-id">3251</article-id>
+<article-id pub-id-type="doi">10.1073/pnas.181325198</article-id>
+<article-id pub-id-type="other">jPNAS.v98.i18.pg10214</article-id>
+<article-id pub-id-type="pmid">11517319</article-id>
+<article-categories>
+<subj-group>
+<subject>Physical Sciences</subject>
+<subj-group>
+<subject>Applied Mathematics</subject>
+</subj-group>
+</subj-group>
+<subj-group>
+<subject>Biological Sciences</subject>
+<subj-group>
+<subject>Genetics</subject>
+</subj-group>
+</subj-group>
+</article-categories>
+<title-group>
+<article-title>The coreceptor mutation CCR5&#x0394;32 influences the dynamics of HIV epidemics and is selected for by HIV</article-title>
+</title-group>
+<contrib-group>
+<contrib contrib-type="author">
+<name>
+<surname>Sullivan</surname>
+<given-names>Amy D.</given-names>
+</name>
+<xref ref-type="author-notes" rid="FN150">&#x002A;</xref>
+<xref ref-type="aff" rid="aff-1"/>
+</contrib>
+<contrib contrib-type="author">
+<name>
+<surname>Wigginton</surname>
+<given-names>Janis</given-names>
+</name>
+<xref ref-type="aff" rid="aff-1"/>
+</contrib>
+<contrib contrib-type="author">
+<name>
+<surname>Kirschner</surname>
+<given-names>Denise</given-names>
+</name>
+<xref ref-type="author-notes" rid="FN151">&#x2020;</xref>
+<xref ref-type="aff" rid="aff-1"/>
+</contrib>
+</contrib-group>
+<aff id="aff-1">Department of Microbiology and Immunology, University 
+of Michigan Medical School, Ann Arbor, MI 48109-0620</aff>
+<author-notes>
+<fn id="FN150">
+<p>&#x002A; Present address: Centers for Disease Control and Prevention Epidemiology Program Office, State Branch Oregon Health Division, 800 NE Oregon Street, Suite 772, Portland, OR 97232.</p>
+</fn>
+<fn id="FN151">
+<p>&#x2020; To whom reprint requests should be addressed. E-mail: <email>kirschne@umich.edu</email>.</p>
+</fn>
+<fn fn-type="com">
+<p>Communicated by Avner Friedman, University of Minnesota, Minneapolis, MN</p>
+</fn>
+</author-notes>
+<pub-date date-type="pub" publication-format="print" iso-8601-date="2001-08-28">
+<day>28</day>
+<month>8</month>
+<year>2001</year>
+</pub-date>
+<pub-date date-type="pub" publication-format="electronic" iso-8601-date="2001-08-21">
+<day>21</day>
+<month>8</month>
+<year>2001</year>
+</pub-date>
+<volume>98</volume>
+<issue>18</issue>
+<fpage>10214</fpage>
+<lpage>10219</lpage>
+<history>
+<date date-type="received" iso-8601-date="2000-05-30">
+<day>30</day>
+<month>5</month>
+<year>2000</year>
+</date>
+<date date-type="accepted" iso-8601-date="2001-06-27">
+<day>27</day>
+<month>6</month>
+<year>2001</year>
+</date>
+</history>
+<permissions>
+<copyright-statement>Copyright &#x00A9; 2001, The National Academy of Sciences</copyright-statement>
+<copyright-year>2001</copyright-year>
+</permissions>
+<abstract>
+<p>We explore the impact of a host genetic factor on heterosexual HIV epidemics by using a deterministic mathematical model. A protective allele unequally distributed across populations is exemplified in our models by the 32-bp deletion in the host-cell chemokine receptor CCR5, CCR5&#x0394;32. Individuals homozygous for CCR5&#x0394;32 are protected against HIV infection whereas those heterozygous for CCR5&#x0394;32 have lower pre-AIDS viral loads and delayed progression to AIDS. CCR5&#x0394;32 may limit HIV spread by decreasing the probability of both risk of infection and infectiousness. In this work, we characterize epidemic HIV within three dynamic subpopulations: CCR5&#x002F;CCR5 (homozygous, wild type), CCR5&#x002F;CCR5&#x0394;32 (heterozygous), and CCR5&#x0394;32&#x002F;CCR5&#x0394;32 (homozygous, mutant). Our results indicate that prevalence of HIV&#x002F;AIDS is greater in populations lacking the CCR5&#x0394;32 alleles (homozygous wild types only) as compared with populations that include people heterozygous or homozygous for CCR5&#x0394;32. Also, we show that HIV can provide selective pressure for CCR5&#x0394;32, increasing the frequency of this allele.</p>
+</abstract>
+</article-meta>
+</front>
+<body>
+<p>Nineteen million people have died of AIDS since the discovery of HIV in the 1980s. In 1999 alone, 5.4 million people were newly infected with HIV (ref. <xref ref-type="bibr" rid="B1">1</xref> and <ext-link ext-link-type="url" xmlns:xlink="http://www.w3.org/1999/xlink" xlink:href="http://www.unaids.org/epidemicupdate/report/Epireport.html">http://www.unaids.org/epidemicupdate/report/Epireport.html</ext-link>). (For brevity, HIV-1 is referred to as HIV in this paper.) Sub-Saharan Africa has been hardest hit, with more than 20&#x0025; of the general population HIV-positive in some countries (<xref ref-type="bibr" rid="B2">2</xref>, <xref ref-type="bibr" rid="B3">3</xref>). In comparison, heterosexual epidemics in developed, market-economy countries have not reached such severe levels. Factors contributing to the severity of the epidemic in economically developing countries abound, including economic, health, and social differences such as high levels of sexually transmitted diseases and a lack of prevention programs. However, the staggering rate at which the epidemic has spread in sub-Saharan Africa has not been adequately explained. The rate and severity of this epidemic also could indicate a greater underlying susceptibility to HIV attributable not only to sexually transmitted disease, economics, etc., but also to other more ubiquitous factors such as host genetics (<xref ref-type="bibr" rid="B4">4</xref>, <xref ref-type="bibr" rid="B5">5</xref>).</p>
+<p>To exemplify the contribution of such a host genetic factor to HIV prevalence trends, we consider a well-characterized 32-bp deletion in the host-cell chemokine receptor CCR5, CCR5&#x0394;32. When HIV binds to host cells, it uses the CD4 receptor on the surface of host immune cells together with a coreceptor, mainly the CCR5 and CXCR4 chemokine receptors (<xref ref-type="bibr" rid="B6">6</xref>). Homozygous mutations for this 32-bp deletion offer almost complete protection from HIV infection, and heterozygous mutations are associated with lower pre-AIDS viral loads and delayed progression to AIDS (<xref ref-type="bibr" rid="B7">7</xref>&#x2013;<xref ref-type="bibr" rid="B14">14</xref>). CCR5&#x0394;32 generally is found in populations of European descent, with allelic frequencies ranging from 0 to 0.29 (<xref ref-type="bibr" rid="B13">13</xref>). African and Asian populations studied outside the United States or Europe appear to lack the CCR5&#x0394;32 allele, with an allelic frequency of almost zero (<xref ref-type="bibr" rid="B5">5</xref>, <xref ref-type="bibr" rid="B13">13</xref>). Thus, to understand the effects of a protective allele, we use a mathematical model to track prevalence of HIV in populations with or without CCR5&#x0394;32 heterozygous and homozygous people and also to follow the CCR5&#x0394;32 allelic frequency.</p>
+<p>We hypothesize that CCR5&#x0394;32 limits epidemic HIV by decreasing infection rates, and we evaluate the relative contributions to this by the probability of infection and duration of infectivity. To capture HIV infection as a chronic infectious disease together with vertical transmission occurring in untreated mothers, we model a dynamic population (i.e., populations that vary in growth rates because of fluctuations in birth or death rates) based on realistic demographic characteristics (<xref ref-type="bibr" rid="B18">18</xref>). This scenario also allows tracking of the allelic frequencies over time. This work considers how a specific host genetic factor affecting HIV infectivity and viremia at the individual level might influence the epidemic in a dynamic population and how HIV exerts selective pressure, altering the frequency of this mutant allele.</p>
+<p>CCR5 is a host-cell chemokine receptor, which is also used as a coreceptor by R5 strains of HIV that are generally acquired during sexual transmission (<xref ref-type="bibr" rid="B6">6</xref>, <xref ref-type="bibr" rid="B19">19</xref>&#x2013;<xref ref-type="bibr" rid="B25">25</xref>). As infection progresses to AIDS the virus expands its repertoire of potential coreceptors to include other CC-family and CXC-family receptors in roughly 50&#x0025; of patients (<xref ref-type="bibr" rid="B19">19</xref>, <xref ref-type="bibr" rid="B26">26</xref>, <xref ref-type="bibr" rid="B27">27</xref>). CCR5&#x0394;32 was identified in HIV-resistant people (<xref ref-type="bibr" rid="B28">28</xref>). Benefits to individuals from the mutation in this allele are as follows. Persons homozygous for the CCR5&#x0394;32 mutation are almost nonexistent in HIV-infected populations (<xref ref-type="bibr" rid="B11">11</xref>, <xref ref-type="bibr" rid="B12">12</xref>) (see ref. <xref ref-type="bibr" rid="B13">13</xref> for review). Persons heterozygous for the mutant allele (CCR5 W/&#x0394;32) tend to have lower pre-AIDS viral loads. Aside from the beneficial effects that lower viral loads may have for individuals, there is also an altruistic effect, as transmission rates are reduced for individuals with low viral loads (as compared with, for example, AZT and other studies; ref. <xref ref-type="bibr" rid="B29">29</xref>). Finally, individuals heterozygous for the mutant allele (CCR5 W/&#x0394;32) also have a slower progression to AIDS than those homozygous for the wild-type allele (CCR5 W/W) (<xref ref-type="bibr" rid="B7">7</xref>&#x2013;<xref ref-type="bibr" rid="B10">10</xref>), remaining in the population 2 years longer, on average. Interestingly, the dearth of information on HIV disease progression in people homozygous for the CCR5&#x0394;32 allele (CCR5 &#x0394;32/&#x0394;32) stems from the rarity of HIV infection in this group (<xref ref-type="bibr" rid="B4">4</xref>, <xref ref-type="bibr" rid="B12">12</xref>, <xref ref-type="bibr" rid="B28">28</xref>). However, in case reports of HIV-infected CCR5 &#x0394;32/&#x0394;32 homozygotes, a rapid decline in CD4<sup>&#x002B;</sup> T cells and a high viremia are observed, likely because of initial infection with a more aggressive viral strain (such as X4 or R5X4) (<xref ref-type="bibr" rid="B30">30</xref>).</p>
+<sec>
+<title>The Model</title>
+<p>Because we are most concerned with understanding the severity of the epidemic in developing countries where the majority of infection is heterosexual, we consider a purely heterosexual model. To model the effects of the allele in the population, we examine the rate of HIV spread by using an enhanced susceptible-infected-AIDS model of epidemic HIV (for review see ref. <xref ref-type="bibr" rid="B31">31</xref>). Our model compares two population scenarios: a CCR5 wild-type population and one with CCR5&#x0394;32 heterozygotes and homozygotes in addition to the wild type. To model the scenario where there are only wild-type individuals present in the population (i.e., CCR5 W/W), we track the sexually active susceptibles at time <italic>t</italic> &#x005B;<italic>S<sub>i,j</sub>
+</italic>(<italic>t</italic>)&#x005D;, where <italic>i</italic> = 1 refers to genotype (CCR5 W/W only in this case) and <italic>j</italic> is either the male or female subpopulation. We also track those who are HIV-positive at time <italic>t</italic> not yet having AIDS in <italic>I<sub>i,j,k</sub>
+</italic>(<italic>t</italic>) where <italic>k</italic> refers to stage of HIV infection &#x005B;primary (<italic>A</italic>) or asymptomatic (<italic>B</italic>)&#x005D;. The total number of individuals with AIDS at time <italic>t</italic> are tracked in <italic>A</italic>(<italic>t</italic>). The source population are children, &#x03C7;<sub>
+<italic>i,j</italic>
+</sub>(<italic>t</italic>), who mature into the sexually active population at time <italic>t</italic> (Fig. <xref ref-type="fig" rid="F1">1</xref>, Table <xref ref-type="table" rid="T1">1</xref>). We compare the model of a population lacking the CCR5&#x0394;32 allele to a demographically similar population with a high frequency of the allele. When genetic heterogeneity is included, male and female subpopulations are each further divided into three distinct genotypic groups, yielding six susceptible subpopulations, &#x005B;<italic>S<sub>i,j</sub>
+</italic>(<italic>t</italic>), where <italic>i</italic> ranges from 1 to 3, where 1 = CCR5W/W; 2 = CCR5 W/&#x0394;32; 3 = CCR5 &#x0394;32/&#x0394;32&#x005D;. The infected classes, <italic>I<sub>i,j,k</sub>
+</italic>(<italic>t</italic>), also increase in number to account for these new genotype compartments. In both settings we assume there is no treatment available and no knowledge of HIV status by people in the early acute and middle asymptomatic stages (both conditions exist in much of sub-Saharan Africa). In addition, we assume that sexual mixing in the population occurs randomly with respect to genotype and HIV disease status, all HIV-infected people eventually progress to AIDS, and no barrier contraceptives are used. These last assumptions reflect both economic and social conditions. </p>
+<fig id="F1">
+<label>Figure 1</label>
+<caption>
+<p>A schematic representation of the basic compartmental HIV epidemic model. The criss-cross lines indicate the sexual mixing between different compartments. Each of these interactions has a positive probability of taking place; they also incorporate individual rates of transmission indicated as &#x03BB;, but in full notation is &#x03BB;<sub>
+<italic>&#x00EE;</italic>,<italic>&#xEB30;</italic>,<italic>&#xEA50;</italic>&#x2192;<italic>i</italic>,<italic>j</italic>,</sub> where <italic>i</italic>,<italic>j</italic>,<italic>k</italic> is the phenotype of the infected partner and <italic>&#x00EE;</italic>,<italic>&#xEB30;</italic> is the phenotype of the susceptible partner. Also shown are the different rates of disease progression, &#x03B3;<sub>
+<italic>i</italic>,<italic>j</italic>,<italic>k</italic>
+</sub>, that vary according to genotype, gender, and stage. Thus, the interactions between different genotypes, genders, and stages are associated with a unique probability of HIV infection. M, male; F, female.</p>
+</caption>
+<graphic xmlns:xlink="http://www.w3.org/1999/xlink" xlink:href="pq1813251001">
+</graphic>
+</fig>
+<table-wrap id="T1">
+<label>Table 1</label>
+<caption>
+<p>Children's genotype</p>
+</caption>
+<table>
+<tr>
+<th>Parents</th>
+<th colspan="4">Mother</th>
+</tr>
+<tr>
+<td colspan="5">
+<hr/>
+</td>
+</tr>
+<tr>
+<td>Father</td>
+<td/>
+<td>W&#x002F;W</td>
+<td>W&#x002F;&#x0394;32</td>
+<td>&#x0394;32&#x002F;&#x0394;32</td>
+</tr>
+<tr>
+<td/>
+<td>W&#x002F;W</td>
+<td>&#x03C7;<sub>1,<italic>j</italic>
+</sub>1,<italic>j</italic>
+</td>
+<td>&#x03C7;<sub>1,<italic>j</italic>
+</sub>1,<italic>j</italic>, &#x03C7;<sub>2,<italic>j</italic>
+</sub>2,<italic>j</italic>
+</td>
+<td>&#x03C7;<sub>2,<italic>j</italic>
+</sub>2,<italic>j</italic>
+</td>
+</tr>
+<tr>
+<td/>
+<td>W&#x002F;&#x0394;32</td>
+<td>&#x03C7;<sub>1,<italic>j</italic>
+</sub>1,<italic>j</italic>, &#x03C7;<sub>2,<italic>j</italic>
+</sub>2,<italic>j</italic>
+</td>
+<td>&#x03C7;<sub>1,<italic>j</italic>
+</sub>1,<italic>j</italic>, &#x03C7;<sub>2,<italic>j</italic>
+</sub>2,<italic>j</italic>, &#x03C7;<sub>3,<italic>j</italic>
+</sub>3,<italic>j</italic>
+</td>
+<td>&#x03C7;<sub>2,<italic>j</italic>
+</sub>2,<italic>j</italic>, &#x03C7;<sub>3,<italic>j</italic>
+</sub>3,<italic>j</italic>
+</td>
+</tr>
+<tr>
+<td/>
+<td>&#x0394;32&#x002F;&#x0394;32</td>
+<td>&#x03C7;<sub>2,<italic>j</italic>
+</sub>2,<italic>j</italic>
+</td>
+<td>&#x03C7;<sub>2,<italic>j</italic>
+</sub>2,<italic>j</italic>, &#x03C7;<sub>3,<italic>j</italic>
+</sub>3,<italic>j</italic>
+</td>
+<td>&#x03C7;<sub>3,<italic>j</italic>
+</sub>3,<italic>j</italic>
+</td>
+</tr>
+</table>
+<table-wrap-foot>
+<fn>
+<p>&#x03C7;<sub>1,<italic>j</italic>
+</sub>1,<italic>j</italic> = wild-type children; (W&#x002F;W); &#x03C7;<sub>2,<italic>j</italic>
+</sub>2,<italic>j</italic> = heterozygous children (W&#x002F;&#x0394;32); &#x03C7;<sub>3,<italic>j</italic>
+</sub>3,<italic>j</italic> = homozygous children (&#x0394;32&#x002F;&#x0394;32) of gender <italic>j</italic>. Children's genotypes are determined by using Mendelian inheritance patterns.</p>
+</fn>
+</table-wrap-foot>
+</table-wrap>
+<sec>
+<title>Parameter Estimates for the Model.</title>
+<p>Estimates for rates that govern the interactions depicted in Fig. <xref ref-type="fig" rid="F1">1</xref> were derived from the extensive literature on HIV. Our parameters and their estimates are summarized in Tables <xref ref-type="table" rid="T2">2</xref>&#x2013;<xref ref-type="table" rid="T4">4</xref>. The general form of the equations describing the rates of transition between population classes as depicted in Fig. <xref ref-type="fig" rid="F1">1</xref> are summarized as follows: <disp-formula id="E1">
+<tex-math id="M1">\documentclass[12pt]{minimal} \usepackage{wasysym} \usepackage[substack]{amsmath} \usepackage{amsfonts} \usepackage{amssymb} \usepackage{amsbsy} \usepackage[mathscr]{eucal} \usepackage{mathrsfs} \DeclareFontFamily{T1}{linotext}{} \DeclareFontShape{T1}{linotext}{m}{n} { &#x003C;-&#x003E; linotext }{} \DeclareSymbolFont{linotext}{T1}{linotext}{m}{n} \DeclareSymbolFontAlphabet{\mathLINOTEXT}{linotext} \begin{document} $$ \frac{dS_{i,j}(t)}{dt}={\chi}_{i,j}(t)-{\mu}_{j}S_{i,j}(t)-{\lambda}_{\hat {\imath},\hat {},\hat {k}{\rightarrow}i,j}S_{i,j}(t), $$ \end{document} </tex-math>
+</disp-formula>
+<disp-formula id="E2">
+<tex-math id="M2">\documentclass[12pt]{minimal} \usepackage{wasysym} \usepackage[substack]{amsmath} \usepackage{amsfonts} \usepackage{amssymb} \usepackage{amsbsy} \usepackage[mathscr]{eucal} \usepackage{mathrsfs} \DeclareFontFamily{T1}{linotext}{} \DeclareFontShape{T1}{linotext}{m}{n} { &#x003C;-&#x003E; linotext }{} \DeclareSymbolFont{linotext}{T1}{linotext}{m}{n} \DeclareSymbolFontAlphabet{\mathLINOTEXT}{linotext} \begin{document} $$ \hspace{1em}\hspace{1em}\hspace{.167em}\frac{dI_{i,j,A}(t)}{dt}={\lambda}_{\hat {\imath},\hat {},\hat {k}{\rightarrow}i,j}S_{i,j}(t)-{\mu}_{j}I_{i,j,A}(t)-{\gamma}_{i,j,A}I_{i,j,A}(t), $$ \end{document} </tex-math>
+</disp-formula>
+<disp-formula id="E3">
+<tex-math id="M3">\documentclass[12pt]{minimal} \usepackage{wasysym} \usepackage[substack]{amsmath} \usepackage{amsfonts} \usepackage{amssymb} \usepackage{amsbsy} \usepackage[mathscr]{eucal} \usepackage{mathrsfs} \DeclareFontFamily{T1}{linotext}{} \DeclareFontShape{T1}{linotext}{m}{n} { &#x003C;-&#x003E; linotext }{} \DeclareSymbolFont{linotext}{T1}{linotext}{m}{n} \DeclareSymbolFontAlphabet{\mathLINOTEXT}{linotext} \begin{document} $$ \frac{dI_{i,j,B}(t)}{dt}={\gamma}_{i,j,A}I_{i,j,A}(t)-{\mu}_{j}I_{i,j,B}(t)-{\gamma}_{i,j,B}I_{i,j,B}(t), $$ \end{document} </tex-math>
+</disp-formula>
+<disp-formula id="E4">
+<tex-math id="M4">\documentclass[12pt]{minimal} \usepackage{wasysym} \usepackage[substack]{amsmath} \usepackage{amsfonts} \usepackage{amssymb} \usepackage{amsbsy} \usepackage[mathscr]{eucal} \usepackage{mathrsfs} \DeclareFontFamily{T1}{linotext}{} \DeclareFontShape{T1}{linotext}{m}{n} { &#x003C;-&#x003E; linotext }{} \DeclareSymbolFont{linotext}{T1}{linotext}{m}{n} \DeclareSymbolFontAlphabet{\mathLINOTEXT}{linotext} \begin{document} $$ \frac{dA(t)}{dt}={\gamma}_{i,j,B} \left( { \,\substack{ ^{3} \\ {\sum} \\ _{i=1} }\, }I_{i,F,B}(t)+I_{i,M,B}(t) \right) -{\mu}_{A}A(t)-{\delta}A(t), $$ \end{document} </tex-math>
+</disp-formula> where, in addition to previously defined populations and rates (with <italic>i</italic> equals genotype, <italic>j</italic> equals gender, and <italic>k</italic> equals stage of infection, either <italic>A</italic> or <italic>B</italic>), &#x03BC;<sub>
+<italic>j</italic>
+</sub>, represents the non-AIDS (natural) death rate for males and females respectively, and &#x03BC;<sub>A</sub> is estimated by the average (&#x03BC;<sub>F</sub> &#x002B; &#x03BC;<sub>M</sub>/2). This approximation allows us to simplify the model (only one AIDS compartment) without compromising the results, as most people with AIDS die of AIDS (&#x03B4;<sub>AIDS</sub>) and very few of other causes (&#x03BC;<sub>A</sub>). These estimates include values that affect infectivity (&#x03BB;<sub>
+<italic>&#x00EE;</italic>,<italic>&#xEB30;</italic>,<italic>&#xEA50;</italic>&#x2192;<italic>i</italic>,<italic>j</italic>
+</sub>), transmission (&#x03B2;<sub>
+<italic>&#x00EE;</italic>,<italic>&#xEB30;</italic>,<italic>&#xEA50;</italic>&#x2192;<italic>i</italic>,<italic>j</italic>
+</sub>), and disease progression (&#x03B3;<sub>
+<italic>i</italic>
+</sub>
+<sub>,</sub>
+<sub>
+<italic>j</italic>
+</sub>
+<sub>,</sub>
+<sub>
+<italic>k</italic>
+</sub>) where the <italic>&#x00EE;</italic>,<italic>&#xEB30;</italic>,<italic>&#xEA50;</italic> notation represents the genotype, gender, and stage of infection of the infected partner, and <italic>j</italic> &#x2260; <italic>&#xEB30;</italic>. </p>
+<table-wrap id="T2">
+<label>Table 2</label>
+<caption>
+<p>Transmission probabilities</p>
+</caption>
+<table>
+<tr>
+<th rowspan="3">HIV-infected partner (&#x00EE;&#x0131;&#x0131;&#x005E;&#x005E;, &#xEB30;&#xE2D4;&#xE2D4;&#x005E;&#x005E;, &#xEA50;<italic>k</italic>
+<italic>k</italic>&#x005E;&#x005E;)</th>
+<th colspan="4">Susceptible partner (<italic>i</italic>, <italic>j</italic>)</th>
+</tr>
+<tr>
+<td colspan="4">
+<hr/>
+</td>
+</tr>
+<tr>
+<th>(&#xEB30;&#xE2D4;&#xE2D4;&#x005E;&#x005E; to <italic>j</italic>)</th>
+<th>W&#x002F;W</th>
+<th>W&#x002F;&#x0394;32</th>
+<th>&#x0394;32&#x002F;&#x0394;32 </th>
+</tr>
+<tr>
+<td colspan="5">
+<hr/>
+</td>
+</tr>
+<tr>
+<td>Acute&#x002F;primary</td>
+</tr>
+<tr>
+<td>&#x2003;W&#x002F;W or &#x0394;32&#x002F;&#x0394;32</td>
+<td>M to F</td>
+<td>0.040</td>
+<td>0.040</td>
+<td>0.00040 </td>
+</tr>
+<tr>
+<td/>
+<td>F to M</td>
+<td>0.020</td>
+<td>0.020</td>
+<td>0.00020 </td>
+</tr>
+<tr>
+<td>&#x2003;W&#x002F;&#x0394;32</td>
+<td>M to F</td>
+<td>0.030</td>
+<td>0.030</td>
+<td>0.00030 </td>
+</tr>
+<tr>
+<td/>
+<td>F to M</td>
+<td>0.015</td>
+<td>0.015</td>
+<td>0.00015 </td>
+</tr>
+<tr>
+<td>Asymptomatic </td>
+</tr>
+<tr>
+<td>&#x2003;W&#x002F;W or &#x0394;32&#x002F;&#x0394;32</td>
+<td>M to F</td>
+<td>0.0010</td>
+<td>0.0010</td>
+<td>10 &#x00D7; 10<sup>&#x2212;6</sup>
+</td>
+</tr>
+<tr>
+<td/>
+<td>F to M</td>
+<td>0.0005</td>
+<td>0.0005</td>
+<td>5 &#x00D7; 10<sup>&#x2212;6</sup>
+</td>
+</tr>
+<tr>
+<td>&#x2003;W&#x002F;&#x0394;32</td>
+<td>M to F</td>
+<td>0.0005</td>
+<td>0.0005</td>
+<td>5 &#x00D7; 10<sup>&#x2212;6</sup>
+</td>
+</tr>
+<tr>
+<td/>
+<td>F to M</td>
+<td>0.00025</td>
+<td>0.00025</td>
+<td>2.5 &#x00D7; 10<sup>&#x2212;6</sup>
+</td>
+</tr>
+</table>
+<table-wrap-foot>
+<fn>
+<p>Listed are the different transmission probabilities (&#x03B2;<sub>&#x00EE;&#x0131;&#x0131;&#x005E;&#x005E;,&#xEB30;&#xE2D4;&#xE2D4;&#x005E;&#x005E;,&#xEA50;<italic>k</italic>
+<italic>k</italic>&#x005E;&#x005E;&#x2192;<italic>i</italic>,<italic>j</italic>
+</sub>) for random sexual mixing between persons where <italic>i</italic>, <italic>j</italic>, <italic>k</italic> is the phenotype of the infected partner and <italic>i</italic>, <italic>j</italic> is the phenotype of the susceptible partner. M, male; F, female.</p>
+</fn>
+</table-wrap-foot>
+</table-wrap>
+<table-wrap id="T3">
+<label>Table 3</label>
+<caption>
+<p>Progression rates</p>
+</caption>
+<table>
+<tr>
+<th>Genotype</th>
+<th>Disease stage</th>
+<th>Males&#x002F;females </th>
+</tr>
+<tr>
+<td colspan="3">
+<hr/>
+</td>
+</tr>
+<tr>
+<td>W&#x002F;W</td>
+<td>A</td>
+<td>3.5</td>
+</tr>
+<tr>
+<td/>
+<td>B</td>
+<td>0.16667 </td>
+</tr>
+<tr>
+<td>W&#x002F;&#x0394;32</td>
+<td>A</td>
+<td>3.5 </td>
+</tr>
+<tr>
+<td/>
+<td>B</td>
+<td>0.125</td>
+</tr>
+<tr>
+<td>&#x0394;32&#x002F;&#x0394;32</td>
+<td>A</td>
+<td>3.5 </td>
+</tr>
+<tr>
+<td/>
+<td>B</td>
+<td>0.16667</td>
+</tr>
+</table>
+<table-wrap-foot>
+<fn>
+<p>Shown are the rates of progression, &#x03B3;<sub>
+<italic>i</italic>,<italic>j</italic>,<italic>k</italic>
+</sub>
+<italic>i</italic>,<italic>j</italic>,<italic>k</italic> reflecting the different rates at which persons progress through different stages of disease by genotype, gender, and disease stage.</p>
+</fn>
+</table-wrap-foot>
+</table-wrap>
+<table-wrap id="T4">
+<label>Table 4</label>
+<caption>
+<p>Parameter values</p>
+</caption>
+<table>
+<tr>
+<th>Parameter</th>
+<th>Definition</th>
+<th>Value</th>
+</tr>
+<tr>
+<td colspan="3">
+<hr/>
+</td>
+</tr>
+<tr>
+<td>&#x03BC;<sub>
+<italic>F</italic>
+</sub>
+<italic>F</italic>, &#x03BC;<sub>
+<italic>M</italic>
+</sub>
+<italic>M</italic>
+</td>
+<td align="left">All-cause mortality for adult females (males)</td>
+<td align="left">0.015 (0.016) per year</td>
+</tr>
+<tr>
+<td>&#x03BC;<sub>&#x03C7;</sub>&#x03C7;</td>
+<td align="left">All-cause childhood mortality (&#x003C;15 years of age)</td>
+<td align="left">0.01 per year</td>
+</tr>
+<tr>
+<td>
+<italic>B</italic>
+<sub>
+<italic>r</italic>
+</sub>
+<italic>r</italic>
+</td>
+<td align="left">Birthrate</td>
+<td align="left">0.25 per woman per year</td>
+</tr>
+<tr>
+<td>
+<italic>SA</italic>
+<sub>
+<italic>F</italic>
+</sub>
+<italic>F</italic>
+</td>
+<td align="left">Percent females acquiring new partners (sexual activity)</td>
+<td align="left">10&#x0025;</td>
+</tr>
+<tr>
+<td>
+<italic>SA</italic>
+<sub>
+<italic>M</italic>
+</sub>
+<italic>M</italic>
+</td>
+<td align="left">Percent males acquiring new partners (sexual activity)</td>
+<td align="left">25&#x0025;</td>
+</tr>
+<tr>
+<td>
+<italic>m</italic>
+<sub>
+<italic>F</italic>
+</sub>
+<italic>F</italic>(&#x03C2;<inline-formula>
+<tex-math id="M5">\documentclass[12pt]{minimal} \usepackage{wasysym} \usepackage[substack]{amsmath} \usepackage{amsfonts} \usepackage{amssymb} \usepackage{amsbsy} \usepackage[mathscr]{eucal} \usepackage{mathrsfs} \DeclareFontFamily{T1}{linotext}{} \DeclareFontShape{T1}{linotext}{m}{n} { &#x003C;-&#x003E; linotext }{} \DeclareSymbolFont{linotext}{T1}{linotext}{m}{n} \DeclareSymbolFontAlphabet{\mathLINOTEXT}{linotext} \begin{document} $$ {\mathrm{_{{F}}^{{2}}}} $$ \end{document} </tex-math>
+</inline-formula>)</td>
+<td align="left">Mean (variance) no. of new partners for females</td>
+<td align="left">1.8 (1.2) per year</td>
+</tr>
+<tr>
+<td>&#x03C2;<inline-formula>
+<tex-math id="M6">\documentclass[12pt]{minimal} \usepackage{wasysym} \usepackage[substack]{amsmath} \usepackage{amsfonts} \usepackage{amssymb} \usepackage{amsbsy} \usepackage[mathscr]{eucal} \usepackage{mathrsfs} \DeclareFontFamily{T1}{linotext}{} \DeclareFontShape{T1}{linotext}{m}{n} { &#x003C;-&#x003E; linotext }{} \DeclareSymbolFont{linotext}{T1}{linotext}{m}{n} \DeclareSymbolFontAlphabet{\mathLINOTEXT}{linotext} \begin{document} $$ {\mathrm{_{{M}}^{{2}}}} $$ \end{document} </tex-math>
+</inline-formula>
+</td>
+<td align="left">Variance in no. of new partners for males</td>
+<td align="left">5.5 per year </td>
+</tr>
+<tr>
+<td>1 &#x2212; <italic>p</italic>
+<sub>
+<italic>v</italic>
+</sub>
+<italic>v</italic>
+</td>
+<td align="left">Probability of vertical transmission</td>
+<td align="left">0.30 per birth</td>
+</tr>
+<tr>
+<td>
+<italic>I</italic>
+<sub>
+<italic>i</italic>,<italic>j</italic>,<italic>k</italic>
+</sub>
+<italic>i</italic>,<italic>j</italic>,<italic>k</italic>(0)</td>
+<td align="left">Initial total population HIV-positive</td>
+<td align="left">0.50&#x0025; </td>
+</tr>
+<tr>
+<td>&#x03C7;<sub>
+<italic>i</italic>,<italic>j</italic>
+</sub>
+<italic>i</italic>,<italic>j</italic>(0)</td>
+<td align="left">Initial total children in population (&#x003C;15 years of age)</td>
+<td align="left">45&#x0025;</td>
+</tr>
+<tr>
+<td>
+<italic>W</italic>&#x002F;<italic>W</italic> (0)</td>
+<td align="left">Initial total wild types (<italic>W</italic>&#x002F;<italic>W</italic>) in population</td>
+<td align="left">80&#x0025; </td>
+</tr>
+<tr>
+<td>
+<italic>W</italic>&#x002F;&#x0394;32(0)</td>
+<td align="left">Initial total heterozygotes (<italic>W</italic>&#x002F;&#x0394;32) in population</td>
+<td align="left">19&#x0025;</td>
+</tr>
+<tr>
+<td>&#x0394;32&#x002F;&#x0394;32(0)</td>
+<td align="left">Initial total homozygotes (&#x0394;32&#x002F;&#x0394;32) in population</td>
+<td align="left">1&#x0025;</td>
+</tr>
+<tr>
+<td>
+<italic>r</italic>
+<sub>
+<italic>M</italic>
+</sub>
+<italic>M</italic>(<italic>r</italic>
+<sub>
+<italic>F</italic>
+</sub>
+<italic>F</italic>)</td>
+<td align="left">Initial percent males (females) in total population</td>
+<td align="left">49&#x0025; (51&#x0025;)</td>
+</tr>
+<tr>
+<td>&#x03D5;<sub>
+<italic>F</italic>
+</sub>
+<italic>F</italic>, &#x03D5;<sub>
+<italic>M</italic>
+</sub>
+<italic>M</italic>
+</td>
+<td align="left">Number of sexual contacts a female (male) has</td>
+<td align="left">30 (24) per partner</td>
+</tr>
+<tr>
+<td>&#x025B;<sub>
+<italic>i</italic>,<italic>j</italic>,<italic>k</italic>
+</sub>
+<italic>i</italic>,<italic>j</italic>,<italic>k</italic>
+</td>
+<td align="left">&#x0025; effect of mutation on transmission rates (see Table <xref ref-type="table" rid="T2">2</xref>)</td>
+<td align="left">0 &#x003C; &#x025B;<sub>
+<italic>i</italic>,<italic>j</italic>,<italic>k</italic>
+</sub>
+<italic>i</italic>,<italic>j</italic>,<italic>k</italic> &#x003C; 1</td>
+</tr>
+<tr>
+<td>&#x03B4;</td>
+<td align="left">Death rate for AIDS population</td>
+<td align="left">1.0 per year </td>
+</tr>
+<tr>
+<td>
+<italic>q</italic>
+</td>
+<td align="left">Allelic frequency of &#x0394;32 allele</td>
+<td align="left">0.105573</td>
+</tr>
+</table>
+<table-wrap-foot>
+<fn>
+<p>Shown are the parameter values for parameters other than the transmission probabilities (Table <xref ref-type="table" rid="T2">2</xref>) and the progression rates (Table <xref ref-type="table" rid="T3">3</xref>). Each were estimated from data as described in text.</p>
+</fn>
+</table-wrap-foot>
+</table-wrap>
+<p>The effects of the CCR5 W/&#x0394;32 and CCR5 &#x0394;32/&#x0394;32 genotypes are included in our model through both the per-capita probabilities of infection, &#x03BB;<sub>
+<italic>&#x00EE;</italic>,<italic>&#xEB30;</italic>,<italic>&#xEA50;</italic>&#x2192;<italic>i</italic>,<italic>j</italic>
+</sub>, and the progression rates, &#x03B3;<sub>
+<italic>i</italic>
+</sub>
+<sub>,</sub>
+<sub>
+<italic>j</italic>
+</sub>
+<sub>,</sub>
+<sub>
+<italic>k</italic>
+</sub>. The infectivity coefficients, &#x03BB;<sub>
+<italic>&#x00EE;</italic>,<italic>&#xEB30;</italic>,<italic>&#xEA50;</italic>&#x2192;<italic>i</italic>,<italic>j</italic>
+</sub>, are calculated for each population subgroup based on the following: likelihood of HIV transmission in a sexual encounter between a susceptible and an infected (&#x03B2;<sub>&#x00EE;&#x0131;&#x0131;&#x005E;&#x005E;,<italic>j</italic>,&#xEA50;<italic>k</italic>
+<italic>k</italic>&#x005E;&#x005E;&#x2192;<italic>i</italic>,<italic>j</italic>
+</sub>) person; formation of new partnerships (<italic>c</italic>
+<sub>
+<italic>j</italic>
+</sub>
+<italic>j</italic>); number of contacts in a given partnership (&#x03D5;<sub>
+<italic>j</italic>
+</sub>); and probability of encountering an infected individual (<italic>I</italic>
+<sub>
+<italic>&#x00EE;</italic>,<italic>&#xEB30;</italic>,<italic>&#xEA50;</italic>
+</sub>/<italic>N</italic>
+<sub>
+<italic>&#xEB30;</italic>
+</sub>). The formula representing this probability of infection is <disp-formula>
+<tex-math id="M7">\documentclass[12pt]{minimal} \usepackage{wasysym} \usepackage[substack]{amsmath} \usepackage{amsfonts} \usepackage{amssymb} \usepackage{amsbsy} \usepackage[mathscr]{eucal} \usepackage{mathrsfs} \DeclareFontFamily{T1}{linotext}{} \DeclareFontShape{T1}{linotext}{m}{n} { &#x003C;-&#x003E; linotext }{} \DeclareSymbolFont{linotext}{T1}{linotext}{m}{n} \DeclareSymbolFontAlphabet{\mathLINOTEXT}{linotext} \begin{document} $$ {\lambda}_{\hat {i},\hat {j},\hat {k}{\rightarrow}i,j}=\frac{C_{j}{\cdot}{\phi}_{j}}{N_{\hat {j}}}\hspace{.167em} \left[ { \,\substack{ \\ {\sum} \\ _{\hat {i},\hat {k}} }\, }{\beta}_{\hat {i},\hat {j},\hat {k}{\rightarrow}i,j}{\cdot}I_{\hat {i},\hat {j},\hat {k}} \right] , $$ \end{document} </tex-math>
+</disp-formula> where <italic>j</italic> &#x2260; <italic>&#xEB30;</italic> is either male or female. <italic>N</italic>
+<sub>
+<italic>&#xEB30;</italic>
+</sub> represents the total population of gender <italic>&#xEB30;</italic> (this does not include those with AIDS in the simulations).</p>
+<p>The average rate of partner acquisition, <italic>c<sub>j</sub>
+</italic>, includes the mean plus the variance to mean ratio of the relevant distribution of partner-change rates to capture the small number of high-risk people: <italic>c<sub>j</sub>
+</italic> = <italic>m<sub>j</sub>
+</italic> &#x002B; (&#x03C2;<inline-formula>
+<tex-math id="M8">\documentclass[12pt]{minimal} \usepackage{wasysym} \usepackage[substack]{amsmath} \usepackage{amsfonts} \usepackage{amssymb} \usepackage{amsbsy} \usepackage[mathscr]{eucal} \usepackage{mathrsfs} \DeclareFontFamily{T1}{linotext}{} \DeclareFontShape{T1}{linotext}{m}{n} { &#x003C;-&#x003E; linotext }{} \DeclareSymbolFont{linotext}{T1}{linotext}{m}{n} \DeclareSymbolFontAlphabet{\mathLINOTEXT}{linotext} \begin{document} $$ {\mathrm{_{{\mathit{j}}}^{2}}} $$ \end{document} </tex-math>
+</inline-formula>/<italic>m</italic>
+<sub>j</sub>) where the mean (<italic>m<sub>j</sub>
+</italic>) and variance (&#x03C2;<inline-formula>
+<tex-math id="M9">\documentclass[12pt]{minimal} \usepackage{wasysym} \usepackage[substack]{amsmath} \usepackage{amsfonts} \usepackage{amssymb} \usepackage{amsbsy} \usepackage[mathscr]{eucal} \usepackage{mathrsfs} \DeclareFontFamily{T1}{linotext}{} \DeclareFontShape{T1}{linotext}{m}{n} { &#x003C;-&#x003E; linotext }{} \DeclareSymbolFont{linotext}{T1}{linotext}{m}{n} \DeclareSymbolFontAlphabet{\mathLINOTEXT}{linotext} \begin{document} $$ {\mathrm{_{{\mathit{j}}}^{2}}} $$ \end{document} </tex-math>
+</inline-formula>) are annual figures for new partnerships only (<xref ref-type="bibr" rid="B32">32</xref>). These means are estimated from Ugandan data for the number of heterosexual partners in the past year (<xref ref-type="bibr" rid="B33">33</xref>) and the number of nonregular heterosexual partners (i.e., spouses or long-term partners) in the past year (<xref ref-type="bibr" rid="B34">34</xref>). In these sexual activity surveys, men invariably have more new partnerships; thus, we assumed that they would have fewer average contacts per partnership than women (a higher rate of new partner acquisition means fewer sexual contacts with a given partner; ref. <xref ref-type="bibr" rid="B35">35</xref>). To incorporate this assumption in our model, the male contacts/partnership, &#x03D5;<sub>
+<italic>M</italic>
+</sub>, was reduced by 20&#x0025;. In a given population, the numbers of heterosexual interactions must equate between males and females. The balancing equation applied here is <italic>SA</italic>
+<sub>F</sub>&#x00B7;<italic>m</italic>
+<sub>F</sub>&#x00B7;<italic>N</italic>
+<sub>F</sub> = <italic>SA</italic>
+<sub>M</sub>&#x00B7;<italic>m</italic>
+<sub>M</sub>&#x00B7;<italic>N</italic>
+<sub>M</sub>, where <italic>SA<sub>j</sub>
+</italic> are the percent sexually active and <italic>N<sub>j</sub>
+</italic> are the total in the populations for gender <italic>j</italic>. To specify changes in partner acquisition, we apply a male flexibility mechanism, holding the female rate of acquisition constant and allowing the male rates to vary (<xref ref-type="bibr" rid="B36">36</xref>, <xref ref-type="bibr" rid="B37">37</xref>).</p>
+<sec>
+<title>Transmission probabilities.</title>
+<p>The effect of a genetic factor in a model of HIV transmission can be included by reducing the transmission coefficient. The probabilities of transmission per contact with an infected partner, &#x03B2;<sub>&#x00EE;&#x0131;&#x0131;&#x005E;&#x005E;,&#xEB30;&#xE2D4;&#xE2D4;&#x005E;&#x005E;,&#xEA50;<italic>k</italic>
+<italic>k</italic>&#x005E;&#x005E;&#x2192;<italic>i</italic>,<italic>j</italic>
+</sub>, have been estimated in the literature (see ref. <xref ref-type="bibr" rid="B38">38</xref> for estimates in minimally treated groups). We want to capture a decreased risk in transmission based on genotype (ref. <xref ref-type="bibr" rid="B39">39</xref>, Table <xref ref-type="table" rid="T2">2</xref>). No studies have directly evaluated differences in infectivity between HIV-infected CCR5 W/&#x0394;32 heterozygotes and HIV-infected CCR5 wild types. Thus, we base estimates for reduced transmission on studies of groups with various HIV serum viral loads (<xref ref-type="bibr" rid="B40">40</xref>), HTLV-I/II viral loads (<xref ref-type="bibr" rid="B41">41</xref>), and a study of the effect of AZT treatment on transmission (<xref ref-type="bibr" rid="B29">29</xref>). We decrease transmission probabilities for infecting CCR5&#x0394;32/&#x0394;32 persons by 100-fold to reflect the rarity of infections in these persons. However, we assume that infected CCR5&#x0394;32/&#x0394;32 homozygotes can infect susceptibles at a rate similar to CCR5W/W homozygotes, as the former generally have high viremias (ref. <xref ref-type="bibr" rid="B30">30</xref>, Table <xref ref-type="table" rid="T2">2</xref>). We also assume that male-to-female transmission is twice as efficient as female-to-male transmission (up to a 9-fold difference has been reported; ref. <xref ref-type="bibr" rid="B42">42</xref>) (ref. <xref ref-type="bibr" rid="B43">43</xref>, Table <xref ref-type="table" rid="T2">2</xref>).</p>
+<p>Given the assumption of no treatment, the high burden of disease in people with AIDS is assumed to greatly limit their sexual activity. Our initial model excludes people with AIDS from the sexually active groups. Subsequently, we allow persons with AIDS to be sexually active, fixing their transmission rates (&#x03B2;<sub>AIDS</sub>) to be the same across all CCR5 genotypes, and lower than transmission rates for primary-stage infection (as the viral burden on average is not as high as during the acute phase), and larger than transmission rates for asymptomatic-stage infection (as the viral burden characteristically increases during the end stage of disease).</p>
+</sec>
+<sec>
+<title>Disease progression.</title>
+<p>We assume three stages of HIV infection: primary (acute, stage A), asymptomatic HIV (stage B), and AIDS. The rates of transition through the first two stages are denoted by &#x03B3;<sub>
+<italic>i</italic>,<italic>j</italic>,<italic>k</italic>
+</sub>
+<italic>i</italic>,<italic>j</italic>,<italic>k</italic>, where <italic>i</italic> represents genotype, <italic>j</italic> is male/female, and <italic>k</italic> represents either stage A or stage B. Transition rates through each of these stages are assumed to be inversely proportional to the duration of that stage; however, other distributions are possible (<xref ref-type="bibr" rid="B31">31</xref>, <xref ref-type="bibr" rid="B44">44</xref>, <xref ref-type="bibr" rid="B45">45</xref>). Although viral loads generally peak in the first 2 months of infection, steady-state viral loads are established several months beyond this (<xref ref-type="bibr" rid="B46">46</xref>). For group A, the primary HIV-infecteds, duration is assumed to be 3.5 months. Based on results from European cohort studies (<xref ref-type="bibr" rid="B7">7</xref>&#x2013;<xref ref-type="bibr" rid="B10">10</xref>), the beneficial effects of the CCR5 W/&#x0394;32 genotype are observed mainly in the asymptomatic years of HIV infection; &#x2248;7 years after seroconversion survival rates appear to be quite similar between heterozygous and homozygous individuals. We also assume that CCR5&#x0394;32/&#x0394;32-infected individuals and wild-type individuals progress similarly, and that men and women progress through each disease stage at the same rate. Given these observations, and that survival after infection may be shorter in untreated populations, we choose the duration time in stage B to be 6 years for wild-type individuals and 8 years for heterozygous individuals. Transition through AIDS, &#x03B4;<sub>AIDS</sub>, is inversely proportional to the duration of AIDS. We estimate this value to be 1 year for the time from onset of AIDS to death. The progression rates are summarized in Table <xref ref-type="table" rid="T3">3</xref>.</p>
+</sec>
+</sec>
+<sec>
+<title>Demographic Setting.</title>
+<p>Demographic parameters are based on data from Malawi, Zimbabwe, and Botswana (<xref ref-type="bibr" rid="B3">3</xref>, <xref ref-type="bibr" rid="B47">47</xref>). Estimated birth and child mortality rates are used to calculate the annual numbers of children (&#x03C7;<sub>
+<italic>i</italic>,<italic>j</italic>
+</sub>
+<italic>i</italic>,<italic>j</italic>) maturing into the potentially sexually active, susceptible group at the age of 15 years (<xref ref-type="bibr" rid="B3">3</xref>). For example, in the case where the mother is CCR5 wild type and the father is CCR5 wild type or heterozygous, the number of CCR5 W/W children is calculated as follows &#x005B;<italic>s</italic>uppressing (<italic>t</italic>) notation&#x005D;: &#x03C7;<sub>1,<italic>j</italic>
+</sub>1,<italic>j</italic> = <disp-formula>
+<tex-math id="M10">\documentclass[12pt]{minimal} \usepackage{wasysym} \usepackage[substack]{amsmath} \usepackage{amsfonts} \usepackage{amssymb} \usepackage{amsbsy} \usepackage[mathscr]{eucal} \usepackage{mathrsfs} \DeclareFontFamily{T1}{linotext}{} \DeclareFontShape{T1}{linotext}{m}{n} { &#x003C;-&#x003E; linotext }{} \DeclareSymbolFont{linotext}{T1}{linotext}{m}{n} \DeclareSymbolFontAlphabet{\mathLINOTEXT}{linotext} \begin{document} $$ B_{r}\hspace{.167em}{ \,\substack{ \\ {\sum} \\ _{k} }\, } \left[ S_{1,F}\frac{(S_{1,M}+I_{1,M,k})}{N_{M}}+ \left[ (0.5)S_{1,F}\frac{(S_{2,M}+I_{2,M,k})}{N_{M}} \right] + \right $$ \end{document} </tex-math>
+</disp-formula>
+<disp-formula>
+<tex-math id="M11">\documentclass[12pt]{minimal} \usepackage{wasysym} \usepackage[substack]{amsmath} \usepackage{amsfonts} \usepackage{amssymb} \usepackage{amsbsy} \usepackage[mathscr]{eucal} \usepackage{mathrsfs} \DeclareFontFamily{T1}{linotext}{} \DeclareFontShape{T1}{linotext}{m}{n} { &#x003C;-&#x003E; linotext }{} \DeclareSymbolFont{linotext}{T1}{linotext}{m}{n} \DeclareSymbolFontAlphabet{\mathLINOTEXT}{linotext} \begin{document} $$ p_{v} \left \left( \frac{(I_{1,F,k}(S_{1,M}+I_{1,M,k}))}{N_{M}}+ \left[ (0.5)I_{1,F,k}\frac{(S_{2,M}+I_{2,M,k})}{N_{M}} \right] \right) \right] ,\hspace{.167em} $$ \end{document} </tex-math>
+</disp-formula> where the probability of HIV vertical transmission, 1 &#x2212; <italic>p<sub>v</sub>
+</italic>, and the birthrate, <italic>B<sub>r</sub>
+</italic>, are both included in the equations together with the Mendelian inheritance values as presented in Table <xref ref-type="table" rid="T1">1</xref>. The generalized version of this equation (i.e., &#x03C7;<sub>
+<italic>i</italic>,<italic>j</italic>
+</sub>
+<italic>i</italic>,<italic>j</italic>) can account for six categories of children (including gender and genotype). We assume that all children of all genotypes are at risk, although we can relax this condition if data become available to support vertical protection (e.g., ref. <xref ref-type="bibr" rid="B48">48</xref>). All infected children are assumed to die before age 15. Before entering the susceptible group at age 15, there is additional loss because of mortality from all non-AIDS causes occurring less than 15 years of age at a rate of &#x03BC;<sub>&#x03C7;</sub>&#x03C7; &#x00D7; &#x03C7;<sub>
+<italic>i</italic>,<italic>j</italic>
+</sub>
+<italic>i</italic>,<italic>j</italic> (where &#x03BC;<sub>&#x03C7;</sub> is the mortality under 15 years of age). Children then enter the population as susceptibles at an annual rate, &#x03C2;<sub>
+<italic>j</italic>
+</sub>
+<italic>j</italic> &#x00D7; &#x03C7;<sub>
+<italic>i</italic>,<italic>j</italic>
+</sub>
+<italic>i</italic>,<italic>j</italic>/15, where &#x03C2;<sub>
+<italic>j</italic>
+</sub> distributes the children 51&#x0025; females and 49&#x0025; males. All parameters and their values are summarized in Table <xref ref-type="table" rid="T4">4</xref>.</p>
+</sec>
+</sec>
+<sec>
+<title>Prevalence of HIV</title>
+<sec>
+<title>Demographics and Model Validation.</title>
+<p>The model was validated by using parameters estimated from available demographic data. Simulations were run in the absence of HIV infection to compare the model with known population growth rates. Infection was subsequently introduced with an initial low HIV prevalence of 0.5&#x0025; to capture early epidemic behavior.</p>
+<p>In deciding on our initial values for parameters during infection, we use Joint United Nations Programme on HIV&#x002F;AIDS national prevalence data for Malawi, Zimbabwe, and Botswana. Nationwide seroprevalence of HIV in these countries varies from &#x2248;11&#x0025; to over 20&#x0025; (<xref ref-type="bibr" rid="B3">3</xref>), although there may be considerable variation within given subpopulations (<xref ref-type="bibr" rid="B2">2</xref>, <xref ref-type="bibr" rid="B49">49</xref>).</p>
+<p>In the absence of HIV infection, the annual percent population growth rate in the model is &#x2248;2.5&#x0025;, predicting the present-day values for an average of sub-Saharan African cities (data not shown). To validate the model with HIV infection, we compare our simulation of the HIV epidemic to existing prevalence data for Kenya and Mozambique (<ext-link ext-link-type="url" xmlns:xlink="http://www.w3.org/1999/xlink" xlink:href="http://www.who.int/emc-hiv/fact-sheets/pdfs/kenya.pdf">http://www.who.int/emc-hiv/fact-sheets/pdfs/kenya.pdf</ext-link> and ref. <xref ref-type="bibr" rid="B51">51</xref>). Prevalence data collected from these countries follow similar trajectories to those predicted by our model (Fig. <xref ref-type="fig" rid="F2">2</xref>). </p>
+<fig id="F2">
+<label>Figure 2</label>
+<caption>
+<p>Model simulation of HIV infection in a population lacking the protective CCR5&#x0394;32 allele compared with national data from Kenya (healthy adults) and Mozambique (blood donors, ref. <xref ref-type="bibr" rid="B17">17</xref>). The simulated population incorporates parameter estimates from sub-Saharan African demographics. Note the two outlier points from the Mozambique data were likely caused by underreporting in the early stages of the epidemic.</p>
+</caption>
+<graphic xmlns:xlink="http://www.w3.org/1999/xlink" xlink:href="pq1813251002">
+</graphic>
+</fig>
+</sec>
+<sec>
+<title>Effects of the Allele on Prevalence.</title>
+<p>After validating the model in the wild type-only population, both CCR5&#x0394;32 heterozygous and homozygous people are included. Parameter values for HIV transmission, duration of illness, and numbers of contacts per partner are assumed to be the same within both settings. We then calculate HIV/AIDS prevalence among adults for total HIV/AIDS cases.</p>
+<p>Although CCR5&#x0394;32/&#x0394;32 homozygosity is rarely seen in HIV-positive populations (prevalence ranges between 0 and 0.004&#x0025;), 1&#x2013;20&#x0025; of people in HIV-negative populations of European descent are homozygous. Thus, to evaluate the potential impact of CCR5&#x0394;32, we estimate there are 19&#x0025; CCR5 W/&#x0394;32 heterozygous and 1&#x0025; CCR5 &#x0394;32/&#x0394;32 homozygous people in our population. These values are in Hardy-Weinberg equilibrium with an allelic frequency of the mutation as 0.105573.</p>
+<p>Fig. <xref ref-type="fig" rid="F3">3</xref> shows the prevalence of HIV in two populations: one lacking the mutant CCR5 allele and another carrying that allele. In the population lacking the protective mutation, prevalence increases logarithmically for the first 35 years of the epidemic, reaching 18&#x0025; before leveling off. </p>
+<fig id="F3">
+<label>Figure 3</label>
+<caption>
+<p>Prevalence of HIV/AIDS in the adult population as predicted by the model. The top curve (&#x25CB;) indicates prevalence in a population lacking the protective allele. We compare that to a population with 19&#x0025; heterozygous and 1&#x0025; homozygous for the allele (implying an allelic frequency of 0.105573. Confidence interval bands (light gray) are shown around the median simulation (&#xE80B;) providing a range of uncertainty in evaluating parameters for the effect of the mutation on the infectivity and the duration of asymptomatic HIV for heterozygotes.</p>
+</caption>
+<graphic xmlns:xlink="http://www.w3.org/1999/xlink" xlink:href="pq1813251003">
+</graphic>
+</fig>
+<p>In contrast, when a proportion of the population carries the CCR5&#x0394;32 allele, the epidemic increases more slowly, but still logarithmically, for the first 50 years, and HIV/AIDS prevalence reaches &#x2248;12&#x0025; (Fig. <xref ref-type="fig" rid="F3">3</xref>). Prevalence begins to decline slowly after 70 years.</p>
+<p>In the above simulations we assume that people with AIDS are not sexually active. However, when these individuals are included in the sexually active population the severity of the epidemic increases considerably (data not shown). Consistent with our initial simulations, prevalences are still relatively lower in the presence of the CCR5 mutation.</p>
+<p>Because some parameters (e.g., rate constants) are difficult to estimate based on available data, we implement an uncertainty analysis to assess the variability in the model outcomes caused by any inaccuracies in estimates of the parameter values with regard to the effect of the allelic mutation. For these analyses we use Latin hypercube sampling, as described in refs. <xref ref-type="bibr" rid="B52">52</xref>&#x2013;<xref ref-type="bibr" rid="B56">56</xref>, Our uncertainty and sensitivity analyses focus on infectivity vs. duration of infectiousness. To this end, we assess the effects on the dynamics of the epidemic for a range of values of the parameters governing transmission and progression rates: &#x03B2;<sub>&#x00EE;&#x0131;&#x0131;&#x005E;&#x005E;,&#xEB30;&#xE2D4;&#xE2D4;&#x005E;&#x005E;,&#xEA50;<italic>k</italic>
+<italic>k</italic>&#x005E;&#x005E;&#x2192;<italic>i</italic>,<italic>j</italic>
+</sub> and &#x03B3;<sub>
+<italic>i</italic>,<italic>j</italic>,<italic>k</italic>
+</sub>
+<italic>i</italic>,<italic>j</italic>,<italic>k</italic>. All other parameters are held constant. These results are presented as an interval band about the average simulation for the population carrying the CCR5&#x0394;32 allele (Fig. <xref ref-type="fig" rid="F3">3</xref>). Although there is variability in the model outcomes, the analysis indicates that the overall model predictions are consistent for a wide range of transmission and progression rates. Further, most of the variation observed in the outcome is because of the transmission rates for both heterosexual males and females in the primary stage of infection (&#x03B2;<sub>2,M,A</sub>
+<sub>&#x2192;</sub>
+<sub>
+<italic>i</italic>
+</sub>
+<sub>,F</sub>, &#x03B2;<sub>2,F,A</sub>
+<sub>&#x2192;</sub>
+<sub>
+<italic>i</italic>
+</sub>
+<sub>,M</sub>). As mentioned above, we assume lower viral loads correlate with reduced infectivity; thus, the reduction in viral load in heterozygotes has a major influence on disease spread.</p>
+</sec>
+</sec>
+<sec>
+<title>HIV Induces Selective Pressure on Genotype Frequency</title>
+<p>To observe changes in the frequency of the CCR5&#x0394;32 allele in a setting with HIV infection as compared with the Hardy-Weinberg equilibrium in the absence of HIV, we follow changes in the total number of CCR5&#x0394;32 heterozygotes and homozygotes over 1,000 years (Fig. <xref ref-type="fig" rid="F4">4</xref>). We initially perform simulations in the absence of HIV infection as a negative control to show there is not significant selection of the allele in the absence of infection. To determine how long it would take for the allelic frequency to reach present-day levels (e.g., <italic>q</italic> = 0.105573), we initiate this simulation for 1,000 years with a very small allelic frequency (<italic>q</italic> = 0.00105). In the absence of HIV, the allelic frequency is maintained in equilibrium as shown by the constant proportions of CCR5&#x0394;32 heterozygotes and homozygotes (Fig. <xref ref-type="fig" rid="F4">4</xref>, solid lines). The selection for CCR5&#x0394;32 in the presence of HIV is seen in comparison (Fig. <xref ref-type="fig" rid="F4">4</xref>, dashed lines). We expand the time frame of this simulation to 2,000 years to view the point at which the frequency reaches present levels (where <italic>q</italic> &#x223C;0.105573 at year = 1200). Note that the allelic frequency increases for &#x2248;1,600 years before leveling off. </p>
+<fig id="F4">
+<label>Figure 4</label>
+<caption>
+<p>Effects of HIV-1 on selection of the CCR5&#x0394;32 allele. The Hardy-Weinberg equilibrium level is represented in the no-infection simulation (solid lines) for each population. Divergence from the original Hardy-Weinberg equilibrium is shown to occur in the simulations that include HIV infection (dashed lines). Fraction of the total subpopulations are presented: (<italic>A</italic>) wild types (W/W), (<italic>B</italic>) heterozygotes (W/&#x0394;32), and (<italic>C</italic>) homozygotes (&#x0394;32/&#x0394;32). Note that we initiate this simulation with a much lower allelic frequency (0.00105) than used in the rest of the study to better exemplify the actual selective effect over a 1,000-year time scale. (<italic>D</italic>) The allelic selection effect over a 2,000-year time scale.</p>
+</caption>
+<graphic xmlns:xlink="http://www.w3.org/1999/xlink" xlink:href="pq1813251004">
+</graphic>
+</fig>
+</sec>
+<sec sec-type="discussion">
+<title>Discussion</title>
+<p>This study illustrates how populations can differ in susceptibility to epidemic HIV/AIDS depending on a ubiquitous attribute such as a prevailing genotype. We have examined heterosexual HIV epidemics by using mathematical models to assess HIV transmission in dynamic populations either with or without CCR5&#x0394;32 heterozygous and homozygous persons. The most susceptible population lacks the protective mutation in CCR5. In less susceptible populations, the majority of persons carrying the CCR5&#x0394;32 allele are heterozygotes. We explore the hypothesis that lower viral loads (CCR5&#x0394;32 heterozygotes) or resistance to infection (CCR5&#x0394;32 homozygotes) observed in persons with this coreceptor mutation ultimately can influence HIV epidemic trends. Two contrasting influences of the protective CCR5 allele are conceivable: it may limit the epidemic by decreasing the probability of infection because of lower viral loads in infected heterozygotes, or it may exacerbate the epidemic by extending the time that infectious individuals remain in the sexually active population. Our results strongly suggest the former. Thus, the absence of this allele in Africa could explain the severity of HIV disease as compared with populations where the allele is present.</p>
+<p>We also observed that HIV can provide selective pressure for the CCR5&#x0394;32 allele within a population, increasing the allelic frequency. Other influences may have additionally selected for this allele. Infectious diseases such as plague and small pox have been postulated to select for CCR5&#x0394;32 (<xref ref-type="bibr" rid="B57">57</xref>, <xref ref-type="bibr" rid="B58">58</xref>). For plague, relatively high levels of CCR5&#x0394;32 are believed to have arisen within &#x2248;4,000 years, accounting for the prevalence of the mutation only in populations of European descent. Smallpox virus uses the CC-coreceptor, indicating that direct selection for mutations in CCR5 may have offered resistance to smallpox. Given the differences in the epidemic rates of plague (<xref ref-type="bibr" rid="B59">59</xref>), smallpox, and HIV, it is difficult to directly compare our results to these findings. However, our model suggests that the CCR5&#x0394;32 mutation could have reached its present allelic frequency in Northern Europe within this time frame if selected for by a disease with virulence patterns similar to HIV. Our results further support the idea that HIV has been only recently introduced as a pathogen into African populations, as the frequency of the protective allele is almost zero, and our model predicts that selection of the mutant allele in this population by HIV alone takes at least 1,000 years. This prediction is distinct from the frequency of the CCR5&#x0394;32 allele in European populations, where pathogens that may have influenced its frequency (e.g., <italic>Yersinia pestis</italic>) have been present for much longer.</p>
+<p>Two mathematical models have considered the role of parasite and host genetic heterogeneity with regard to susceptibility to another pathogen, namely malaria (<xref ref-type="bibr" rid="B60">60</xref>, <xref ref-type="bibr" rid="B61">61</xref>). In each it was determined that heterogeneity of host resistance facilitates the maintenance of diversity in parasite virulence. Given our underlying interest in the coevolution of pathogen and host, we focus on changes in a host protective mutation, holding the virulence of the pathogen constant over time.</p>
+<p>Even within our focus on host protective mutations, numerous genetic factors, beneficial or detrimental, could potentially influence epidemics. Other genetically determined host factors affecting HIV susceptibility and disease progression include a CCR5 A/A to G/G promoter polymorphism (<xref ref-type="bibr" rid="B62">62</xref>), a CCR2 point mutation (<xref ref-type="bibr" rid="B11">11</xref>, <xref ref-type="bibr" rid="B63">63</xref>), and a mutation in the CXCR4 ligand (<xref ref-type="bibr" rid="B64">64</xref>). The CCR2b mutation, CCR264I, is found in linkage with at least one CCR5 promoter polymorphism (<xref ref-type="bibr" rid="B65">65</xref>) and is prevalent in populations where CCR5&#x0394;32 is nonexistent, such as sub-Saharan Africa (<xref ref-type="bibr" rid="B63">63</xref>). However, as none of these mutations have been consistently shown to be as protective as the CCR5&#x0394;32 allele, we simplified our model to incorporate only the effect of CCR5&#x0394;32. Subsequent models could be constructed from our model to account for the complexity of multiple protective alleles. It is interesting to note that our model predicts that even if CCR264I is present at high frequencies in Africa, its protective effects may not augment the lack of a protective allele such as CCR5&#x0394;32.</p>
+<p>Although our models demonstrate that genetic factors can contribute to the high prevalence of HIV in sub-Saharan Africa, demographic factors are also clearly important in this region. Our models explicitly incorporated such factors, for example, lack of treatment availability. Additional factors were implicitly controlled for by varying only the presence of the CCR5&#x0394;32 allele. More complex models eventually could include interactions with infectious diseases that serve as cofactors in HIV transmission. The role of high sexually transmitted disease prevalences in HIV infection has long been discussed, especially in relation to core populations (<xref ref-type="bibr" rid="B15">15</xref>, <xref ref-type="bibr" rid="B50">50</xref>, <xref ref-type="bibr" rid="B66">66</xref>). Malaria, too, might influence HIV transmission, as it is associated with transient increases in semen HIV viral loads and thus could increase the susceptibility of the population to epidemic HIV (<xref ref-type="bibr" rid="B16">16</xref>).</p>
+<p>In assessing the HIV/AIDS epidemic, considerable attention has been paid to the influence of core groups in driving sexually transmitted disease epidemics. Our results also highlight how characteristics more uniformly distributed in a population can affect susceptibility. We observed that the genotypic profile of a population affects its susceptibility to epidemic HIV/AIDS. Additional studies are needed to better characterize the influence of these genetic determinants on HIV transmission, as they may be crucial in estimating the severity of the epidemic in some populations. This information can influence the design of treatment strategies as well as point to the urgency for education and prevention programs.</p>
+</sec>
+</body>
+<back>
+<ack>
+<p>We thank Mark Krosky, Katia Koelle, and Kevin Chung for programming and technical assistance. We also thank Drs. V. J. DiRita, P. Kazanjian, and S. M. Blower for helpful comments and discussions. We thank the reviewers for extremely insightful comments.</p>
+</ack>
+<ref-list>
+<ref id="B1">
+<label>1</label>
+<element-citation publication-type="journal" publication-format="print">
+<person-group person-group-type="author">
+<name>
+<surname>Weiss</surname>
+<given-names>HA</given-names>
+</name>
+<name>
+<surname>Hawkes</surname>
+<given-names>S</given-names>
+</name>
+</person-group>
+<source>Leprosy Rev</source>
+<year iso-8601-date="2001">2001</year>
+<volume>72</volume>
+<fpage>92</fpage>
+<lpage>98</lpage>
+<pub-id pub-id-type="pmid">11355525</pub-id>
+</element-citation>
+</ref>
+<ref id="B2">
+<label>2</label>
+<element-citation publication-type="journal" publication-format="print">
+<person-group person-group-type="author">
+<name>
+<surname>Taha</surname>
+<given-names>TE</given-names>
+</name>
+<name>
+<surname>Dallabetta</surname>
+<given-names>GA</given-names>
+</name>
+<name>
+<surname>Hoover</surname>
+<given-names>DR</given-names>
+</name>
+<name>
+<surname>Chiphangwi</surname>
+<given-names>JD</given-names>
+</name>
+<name>
+<surname>Mtimavalye</surname>
+<given-names>LAR</given-names>
+</name>
+</person-group>
+<source>AIDS</source>
+<year iso-8601-date="1998">1998</year>
+<volume>12</volume>
+<fpage>197</fpage>
+<lpage>203</lpage>
+<pub-id pub-id-type="pmid">9468369</pub-id>
+</element-citation>
+</ref>
+<ref id="B3">
+<label>3</label>
+<element-citation publication-type="book" publication-format="print">
+<collab>World Health Organization/UNAIDS</collab>
+<source>AIDS Epidemic Update</source>
+<year iso-8601-date="1998">1998</year>
+<publisher-loc>Geneva</publisher-loc>
+<publisher-name>World Health Organization</publisher-name>
+<fpage>1</fpage>
+<lpage>17</lpage>
+</element-citation>
+</ref>
+<ref id="B4">
+<label>4</label>
+<element-citation publication-type="journal" publication-format="print">
+<person-group person-group-type="author">
+<name>
+<surname>D'Souza</surname>
+<given-names>MP</given-names>
+</name>
+<name>
+<surname>Harden</surname>
+<given-names>VA</given-names>
+</name>
+</person-group>
+<source>Nat Med</source>
+<year iso-8601-date="1996">1996</year>
+<volume>2</volume>
+<fpage>1293</fpage>
+<lpage>1300</lpage>
+<pub-id pub-id-type="pmid">8946819</pub-id>
+</element-citation>
+</ref>
+<ref id="B5">
+<label>5</label>
+<element-citation publication-type="journal" publication-format="print">
+<person-group person-group-type="author">
+<name>
+<surname>Martinson</surname>
+<given-names>JJ</given-names>
+</name>
+<name>
+<surname>Chapman</surname>
+<given-names>NH</given-names>
+</name>
+<name>
+<surname>Rees</surname>
+<given-names>DC</given-names>
+</name>
+<name>
+<surname>Liu</surname>
+<given-names>YT</given-names>
+</name>
+<name>
+<surname>Clegg</surname>
+<given-names>JB</given-names>
+</name>
+</person-group>
+<source>Nat Genet</source>
+<year iso-8601-date="1997">1997</year>
+<volume>16</volume>
+<fpage>100</fpage>
+<lpage>103</lpage>
+<pub-id pub-id-type="pmid">9140404</pub-id>
+</element-citation>
+</ref>
+<ref id="B6">
+<label>6</label>
+<element-citation publication-type="journal" publication-format="print">
+<person-group person-group-type="author">
+<name>
+<surname>Roos</surname>
+<given-names>MTL</given-names>
+</name>
+<name>
+<surname>Lange</surname>
+<given-names>JMA</given-names>
+</name>
+<name>
+<surname>deGoede</surname>
+<given-names>REY</given-names>
+</name>
+<name>
+<surname>Miedema</surname>
+<given-names>PT</given-names>
+</name>
+<name>
+<surname>Tersmette</surname>
+<given-names>F</given-names>
+</name>
+<name>
+<surname>Coutinho</surname>
+<given-names>M</given-names>
+</name>
+<name>
+<surname>Schellekens</surname>
+<given-names>RA</given-names>
+</name>
+</person-group>
+<source>J Infect Dis</source>
+<year iso-8601-date="1992">1992</year>
+<volume>165</volume>
+<fpage>427</fpage>
+<lpage>432</lpage>
+<pub-id pub-id-type="pmid">1347054</pub-id>
+</element-citation>
+</ref>
+<ref id="B7">
+<label>7</label>
+<element-citation publication-type="journal" publication-format="print">
+<person-group person-group-type="author">
+<name>
+<surname>Garred</surname>
+<given-names>P</given-names>
+</name>
+<name>
+<surname>Eugen-Olsen</surname>
+<given-names>J</given-names>
+</name>
+<name>
+<surname>Iversen</surname>
+<given-names>AKN</given-names>
+</name>
+<name>
+<surname>Benfield</surname>
+<given-names>TL</given-names>
+</name>
+<name>
+<surname>Svejgaard</surname>
+<given-names>A</given-names>
+</name>
+<name>
+<surname>Hofmann</surname>
+<given-names>B</given-names>
+</name>
+</person-group>
+<source>Lancet</source>
+<year iso-8601-date="1997">1997</year>
+<volume>349</volume>
+<fpage>1884</fpage>
+<pub-id pub-id-type="pmid">9217763</pub-id>
+</element-citation>
+</ref>
+<ref id="B8">
+<label>8</label>
+<element-citation publication-type="journal" publication-format="print">
+<person-group person-group-type="author">
+<name>
+<surname>Katzenstein</surname>
+<given-names>TL</given-names>
+</name>
+<name>
+<surname>Eugen-Olsen</surname>
+<given-names>J</given-names>
+</name>
+<name>
+<surname>Hofman</surname>
+<given-names>B</given-names>
+</name>
+<name>
+<surname>Benfield</surname>
+<given-names>T</given-names>
+</name>
+<name>
+<surname>Pedersen</surname>
+<given-names>C</given-names>
+</name>
+<name>
+<surname>Iversen</surname>
+<given-names>AK</given-names>
+</name>
+<name>
+<surname>Sorensen</surname>
+<given-names>AM</given-names>
+</name>
+<name>
+<surname>Garred</surname>
+<given-names>P</given-names>
+</name>
+<name>
+<surname>Koppelhus</surname>
+<given-names>U</given-names>
+</name>
+<name>
+<surname>Svejgaard</surname>
+<given-names>A</given-names>
+</name>
+<name>
+<surname>Gerstoft</surname>
+<given-names>J</given-names>
+</name>
+</person-group>
+<source>J Acquired Immune Defic Syndr Hum Retrovirol</source>
+<year iso-8601-date="1997">1997</year>
+<volume>16</volume>
+<fpage>10</fpage>
+<lpage>14</lpage>
+<pub-id pub-id-type="pmid">9377119</pub-id>
+</element-citation>
+</ref>
+<ref id="B9">
+<label>9</label>
+<element-citation publication-type="journal" publication-format="print">
+<person-group person-group-type="author">
+<name>
+<surname>deRoda</surname>
+<given-names>H</given-names>
+</name>
+<name>
+<surname>Meyer</surname>
+<given-names>K</given-names>
+</name>
+<name>
+<surname>Katzenstain</surname>
+<given-names>W</given-names>
+</name>
+<name>
+<surname>Dean</surname>
+<given-names>M</given-names>
+</name>
+</person-group>
+<source>Science</source>
+<year iso-8601-date="1996">1996</year>
+<volume>273</volume>
+<fpage>1856</fpage>
+<lpage>1862</lpage>
+<pub-id pub-id-type="pmid">8791590</pub-id>
+</element-citation>
+</ref>
+<ref id="B10">
+<label>10</label>
+<element-citation publication-type="journal" publication-format="print">
+<person-group person-group-type="author">
+<name>
+<surname>Meyer</surname>
+<given-names>L</given-names>
+</name>
+<name>
+<surname>Magierowska</surname>
+<given-names>M</given-names>
+</name>
+<name>
+<surname>Hubert</surname>
+<given-names>JB</given-names>
+</name>
+<name>
+<surname>Rouzioux</surname>
+<given-names>C</given-names>
+</name>
+<name>
+<surname>Deveau</surname>
+<given-names>C</given-names>
+</name>
+<name>
+<surname>Sanson</surname>
+<given-names>F</given-names>
+</name>
+<name>
+<surname>Debre</surname>
+<given-names>P</given-names>
+</name>
+<name>
+<surname>Delfraissy</surname>
+<given-names>JF</given-names>
+</name>
+<name>
+<surname>Theodorou</surname>
+<given-names>I</given-names>
+</name>
+</person-group>
+<source>AIDS</source>
+<year iso-8601-date="1997">1997</year>
+<volume>11</volume>
+<fpage>F73</fpage>
+<lpage>F78</lpage>
+<pub-id pub-id-type="pmid">9302436</pub-id>
+</element-citation>
+</ref>
+<ref id="B11">
+<label>11</label>
+<element-citation publication-type="journal" publication-format="print">
+<person-group person-group-type="author">
+<name>
+<surname>Smith</surname>
+<given-names>MW</given-names>
+</name>
+<name>
+<surname>Dean</surname>
+<given-names>M</given-names>
+</name>
+<name>
+<surname>Carrington</surname>
+<given-names>M</given-names>
+</name>
+<name>
+<surname>Winkler</surname>
+<given-names>C</given-names>
+</name>
+<name>
+<surname>Huttley</surname>
+<given-names>DA</given-names>
+</name>
+<name>
+<surname>Lomb</surname>
+<given-names>GA</given-names>
+</name>
+<name>
+<surname>Goedert</surname>
+<given-names>JJ</given-names>
+</name>
+<name>
+<surname>O'Brien</surname>
+<given-names>TR</given-names>
+</name>
+<name>
+<surname>Jacobson</surname>
+<given-names>LP</given-names>
+</name>
+<name>
+<surname>Kaslow</surname>
+<given-names>R</given-names>
+</name>
+<etal/>
+</person-group>
+<source>Science</source>
+<year iso-8601-date="1997">1997</year>
+<volume>277</volume>
+<fpage>959</fpage>
+<lpage>965</lpage>
+<pub-id pub-id-type="pmid">9252328</pub-id>
+</element-citation>
+</ref>
+<ref id="B12">
+<label>12</label>
+<element-citation publication-type="journal" publication-format="print">
+<person-group person-group-type="author">
+<name>
+<surname>Samson</surname>
+<given-names>M</given-names>
+</name>
+<name>
+<surname>Libert</surname>
+<given-names>F</given-names>
+</name>
+<name>
+<surname>Doranz</surname>
+<given-names>BJ</given-names>
+</name>
+<name>
+<surname>Rucker</surname>
+<given-names>J</given-names>
+</name>
+<name>
+<surname>Liesnard</surname>
+<given-names>C</given-names>
+</name>
+<name>
+<surname>Farber</surname>
+<given-names>CM</given-names>
+</name>
+<name>
+<surname>Saragosti</surname>
+<given-names>S</given-names>
+</name>
+<name>
+<surname>Lapoumeroulie</surname>
+<given-names>C</given-names>
+</name>
+<name>
+<surname>Cognaux</surname>
+<given-names>J</given-names>
+</name>
+<name>
+<surname>Forceille</surname>
+<given-names>C</given-names>
+</name>
+<etal/>
+</person-group>
+<source>Nature (London)</source>
+<year iso-8601-date="1996">1996</year>
+<volume>382</volume>
+<fpage>722</fpage>
+<lpage>725</lpage>
+<pub-id pub-id-type="pmid">8751444</pub-id>
+</element-citation>
+</ref>
+<ref id="B13">
+<label>13</label>
+<element-citation publication-type="journal" publication-format="print">
+<person-group person-group-type="author">
+<name>
+<surname>McNicholl</surname>
+<given-names>JM</given-names>
+</name>
+<name>
+<surname>Smith</surname>
+<given-names>DK</given-names>
+</name>
+<name>
+<surname>Qari</surname>
+<given-names>SH</given-names>
+</name>
+<name>
+<surname>Hodge</surname>
+<given-names>T</given-names>
+</name>
+</person-group>
+<source>Emerging Infect Dis</source>
+<year iso-8601-date="1997">1997</year>
+<volume>3</volume>
+<fpage>261</fpage>
+<lpage>271</lpage>
+<pub-id pub-id-type="pmid">9284370</pub-id>
+</element-citation>
+</ref>
+<ref id="B14">
+<label>14</label>
+<element-citation publication-type="journal" publication-format="print">
+<person-group person-group-type="author">
+<name>
+<surname>Michael</surname>
+<given-names>NL</given-names>
+</name>
+<name>
+<surname>Chang</surname>
+<given-names>G</given-names>
+</name>
+<name>
+<surname>Louie</surname>
+<given-names>LG</given-names>
+</name>
+<name>
+<surname>Mascola</surname>
+<given-names>JR</given-names>
+</name>
+<name>
+<surname>Dondero</surname>
+<given-names>D</given-names>
+</name>
+<name>
+<surname>Birx</surname>
+<given-names>DL</given-names>
+</name>
+<name>
+<surname>Sheppard</surname>
+<given-names>HW</given-names>
+</name>
+</person-group>
+<source>Nat Med</source>
+<year iso-8601-date="1997">1997</year>
+<volume>3</volume>
+<fpage>338</fpage>
+<lpage>340</lpage>
+<pub-id pub-id-type="pmid">9055864</pub-id>
+</element-citation>
+</ref>
+<ref id="B15">
+<label>15</label>
+<element-citation publication-type="journal" publication-format="print">
+<person-group person-group-type="author">
+<name>
+<surname>Mayaud</surname>
+<given-names>P</given-names>
+</name>
+<name>
+<surname>Mosha</surname>
+<given-names>F</given-names>
+</name>
+<name>
+<surname>Todd</surname>
+<given-names>J</given-names>
+</name>
+<name>
+<surname>Balira</surname>
+<given-names>R</given-names>
+</name>
+<name>
+<surname>Mgara</surname>
+<given-names>J</given-names>
+</name>
+<name>
+<surname>West</surname>
+<given-names>B</given-names>
+</name>
+<name>
+<surname>Rusizoka</surname>
+<given-names>M</given-names>
+</name>
+<name>
+<surname>Mwijarubi</surname>
+<given-names>E</given-names>
+</name>
+<name>
+<surname>Gabone</surname>
+<given-names>R</given-names>
+</name>
+<name>
+<surname>Gavyole</surname>
+<given-names>A</given-names>
+</name>
+<etal/>
+</person-group>
+<source>AIDS</source>
+<year iso-8601-date="1997">1997</year>
+<volume>11</volume>
+<fpage>1873</fpage>
+<lpage>1880</lpage>
+<pub-id pub-id-type="pmid">9412707</pub-id>
+</element-citation>
+</ref>
+<ref id="B16">
+<label>16</label>
+<element-citation publication-type="journal" publication-format="print">
+<person-group person-group-type="author">
+<name>
+<surname>Hoffman</surname>
+<given-names>IF</given-names>
+</name>
+<name>
+<surname>Jere</surname>
+<given-names>CS</given-names>
+</name>
+<name>
+<surname>Taylor</surname>
+<given-names>TE</given-names>
+</name>
+<name>
+<surname>Munthali</surname>
+<given-names>P</given-names>
+</name>
+<name>
+<surname>Dyer</surname>
+<given-names>JR</given-names>
+</name>
+</person-group>
+<source>AIDS</source>
+<year iso-8601-date="1998">1998</year>
+<volume>13</volume>
+<fpage>487</fpage>
+<lpage>494</lpage>
+</element-citation>
+</ref>
+<ref id="B17">
+<label>17</label>
+<element-citation publication-type="book" publication-format="print">
+<collab>U.S. Bureau of the Census</collab>
+<source>HIV/AIDS Surveillance Database</source>
+<year iso-8601-date="1999">1999</year>
+<publisher-loc>Washington, DC</publisher-loc>
+<publisher-name>Population Division, International Programs Center</publisher-name>
+</element-citation>
+</ref>
+<ref id="B18">
+<label>18</label>
+<element-citation publication-type="journal" publication-format="print">
+<person-group person-group-type="author">
+<name>
+<surname>Anderson</surname>
+<given-names>RM</given-names>
+</name>
+<name>
+<surname>May</surname>
+<given-names>RM</given-names>
+</name>
+<name>
+<surname>McLean</surname>
+<given-names>AR</given-names>
+</name>
+</person-group>
+<source>Nature (London)</source>
+<year iso-8601-date="1988">1988</year>
+<volume>332</volume>
+<fpage>228</fpage>
+<lpage>234</lpage>
+<pub-id pub-id-type="pmid">3279320</pub-id>
+</element-citation>
+</ref>
+<ref id="B19">
+<label>19</label>
+<element-citation publication-type="journal" publication-format="print">
+<person-group person-group-type="author">
+<name>
+<surname>Berger</surname>
+<given-names>EA</given-names>
+</name>
+<name>
+<surname>Doms</surname>
+<given-names>RW</given-names>
+</name>
+<name>
+<surname>Fenyo</surname>
+<given-names>EM</given-names>
+</name>
+<name>
+<surname>Korber</surname>
+<given-names>BT</given-names>
+</name>
+<name>
+<surname>Littman</surname>
+<given-names>DR</given-names>
+</name>
+<name>
+<surname>Moore</surname>
+<given-names>JP</given-names>
+</name>
+<name>
+<surname>Sattentau</surname>
+<given-names>QJ</given-names>
+</name>
+<name>
+<surname>Schuitemaker</surname>
+<given-names>H</given-names>
+</name>
+<name>
+<surname>Sodroski</surname>
+<given-names>J</given-names>
+</name>
+<name>
+<surname>Weiss</surname>
+<given-names>RA</given-names>
+</name>
+</person-group>
+<source>Nature (London)</source>
+<year iso-8601-date="1998">1998</year>
+<volume>391</volume>
+<fpage>240</fpage>
+<pub-id pub-id-type="pmid">9440686</pub-id>
+</element-citation>
+</ref>
+<ref id="B20">
+<label>20</label>
+<element-citation publication-type="journal" publication-format="print">
+<person-group person-group-type="author">
+<name>
+<surname>Alkhatib</surname>
+<given-names>G</given-names>
+</name>
+<name>
+<surname>Broder</surname>
+<given-names>CC</given-names>
+</name>
+<name>
+<surname>Berger</surname>
+<given-names>EA</given-names>
+</name>
+</person-group>
+<source>J Virol</source>
+<year iso-8601-date="1996">1996</year>
+<volume>70</volume>
+<fpage>5487</fpage>
+<lpage>5494</lpage>
+<pub-id pub-id-type="pmid">8764060</pub-id>
+</element-citation>
+</ref>
+<ref id="B21">
+<label>21</label>
+<element-citation publication-type="journal" publication-format="print">
+<person-group person-group-type="author">
+<name>
+<surname>Choe</surname>
+<given-names>H</given-names>
+</name>
+<name>
+<surname>Farzan</surname>
+<given-names>M</given-names>
+</name>
+<name>
+<surname>Sun</surname>
+<given-names>Y</given-names>
+</name>
+<name>
+<surname>Sullivan</surname>
+<given-names>N</given-names>
+</name>
+<name>
+<surname>Rollins</surname>
+<given-names>B</given-names>
+</name>
+<name>
+<surname>Ponath</surname>
+<given-names>PD</given-names>
+</name>
+<name>
+<surname>Wu</surname>
+<given-names>L</given-names>
+</name>
+<name>
+<surname>Mackay</surname>
+<given-names>CR</given-names>
+</name>
+<name>
+<surname>LaRosa</surname>
+<given-names>G</given-names>
+</name>
+<name>
+<surname>Newman</surname>
+<given-names>W</given-names>
+</name>
+<etal/>
+</person-group>
+<source>Cell</source>
+<year iso-8601-date="1996">1996</year>
+<volume>85</volume>
+<fpage>1135</fpage>
+<lpage>1148</lpage>
+<pub-id pub-id-type="pmid">8674119</pub-id>
+</element-citation>
+</ref>
+<ref id="B22">
+<label>22</label>
+<element-citation publication-type="journal" publication-format="print">
+<person-group person-group-type="author">
+<name>
+<surname>Deng</surname>
+<given-names>H</given-names>
+</name>
+<name>
+<surname>Liu</surname>
+<given-names>R</given-names>
+</name>
+<name>
+<surname>Ellmeier</surname>
+<given-names>W</given-names>
+</name>
+<name>
+<surname>Choe</surname>
+<given-names>S</given-names>
+</name>
+<name>
+<surname>Unutmaz</surname>
+<given-names>D</given-names>
+</name>
+<name>
+<surname>Burkhart</surname>
+<given-names>M</given-names>
+</name>
+<name>
+<surname>Di Marzio</surname>
+<given-names>P</given-names>
+</name>
+<name>
+<surname>Marmon</surname>
+<given-names>S</given-names>
+</name>
+<name>
+<surname>Sutton</surname>
+<given-names>RE</given-names>
+</name>
+<name>
+<surname>Hill</surname>
+<given-names>CM</given-names>
+</name>
+<etal/>
+</person-group>
+<source>Nature (London)</source>
+<year iso-8601-date="1996">1996</year>
+<volume>381</volume>
+<fpage>661</fpage>
+<lpage>666</lpage>
+<pub-id pub-id-type="pmid">8649511</pub-id>
+</element-citation>
+</ref>
+<ref id="B23">
+<label>23</label>
+<element-citation publication-type="journal" publication-format="print">
+<person-group person-group-type="author">
+<name>
+<surname>Doranz</surname>
+<given-names>BJ</given-names>
+</name>
+<name>
+<surname>Rucker</surname>
+<given-names>J</given-names>
+</name>
+<name>
+<surname>Yi</surname>
+<given-names>Y</given-names>
+</name>
+<name>
+<surname>Smyth</surname>
+<given-names>RJ</given-names>
+</name>
+<name>
+<surname>Samsom</surname>
+<given-names>M</given-names>
+</name>
+<name>
+<surname>Peiper</surname>
+<given-names>M</given-names>
+</name>
+<name>
+<surname>Parmentier</surname>
+<given-names>SC</given-names>
+</name>
+<name>
+<surname>Collman</surname>
+<given-names>RG</given-names>
+</name>
+<name>
+<surname>Doms</surname>
+<given-names>RW</given-names>
+</name>
+</person-group>
+<source>Cell</source>
+<year iso-8601-date="1996">1996</year>
+<volume>85</volume>
+<fpage>1149</fpage>
+<lpage>1158</lpage>
+<pub-id pub-id-type="pmid">8674120</pub-id>
+</element-citation>
+</ref>
+<ref id="B24">
+<label>24</label>
+<element-citation publication-type="journal" publication-format="print">
+<person-group person-group-type="author">
+<name>
+<surname>Dragic</surname>
+<given-names>T</given-names>
+</name>
+<name>
+<surname>Litwin</surname>
+<given-names>V</given-names>
+</name>
+<name>
+<surname>Allaway</surname>
+<given-names>GP</given-names>
+</name>
+<name>
+<surname>Martin</surname>
+<given-names>SR</given-names>
+</name>
+<name>
+<surname>Huang</surname>
+<given-names>Y</given-names>
+</name>
+<name>
+<surname>Nagashima</surname>
+<given-names>KA</given-names>
+</name>
+<name>
+<surname>Cayanan</surname>
+<given-names>C</given-names>
+</name>
+<name>
+<surname>Maddon</surname>
+<given-names>PJ</given-names>
+</name>
+<name>
+<surname>Koup</surname>
+<given-names>RA</given-names>
+</name>
+<name>
+<surname>Moore</surname>
+<given-names>JP</given-names>
+</name>
+<name>
+<surname>Paxton</surname>
+<given-names>WA</given-names>
+</name>
+</person-group>
+<source>Nature (London)</source>
+<year iso-8601-date="1996">1996</year>
+<volume>381</volume>
+<fpage>667</fpage>
+<lpage>673</lpage>
+<pub-id pub-id-type="pmid">8649512</pub-id>
+</element-citation>
+</ref>
+<ref id="B25">
+<label>25</label>
+<element-citation publication-type="journal" publication-format="print">
+<person-group person-group-type="author">
+<name>
+<surname>Zhu</surname>
+<given-names>T</given-names>
+</name>
+<name>
+<surname>Mo</surname>
+<given-names>H</given-names>
+</name>
+<name>
+<surname>Wang</surname>
+<given-names>N</given-names>
+</name>
+<name>
+<surname>Nam</surname>
+<given-names>DS</given-names>
+</name>
+<name>
+<surname>Cao</surname>
+<given-names>Y</given-names>
+</name>
+<name>
+<surname>Koup</surname>
+<given-names>RA</given-names>
+</name>
+<name>
+<surname>Ho</surname>
+<given-names>DD</given-names>
+</name>
+</person-group>
+<source>Science</source>
+<year iso-8601-date="1993">1993</year>
+<volume>261</volume>
+<fpage>1179</fpage>
+<lpage>1181</lpage>
+<pub-id pub-id-type="pmid">8356453</pub-id>
+</element-citation>
+</ref>
+<ref id="B26">
+<label>26</label>
+<element-citation publication-type="journal" publication-format="print">
+<person-group person-group-type="author">
+<name>
+<surname>Bjorndal</surname>
+<given-names>A</given-names>
+</name>
+<name>
+<surname>Deng</surname>
+<given-names>H</given-names>
+</name>
+<name>
+<surname>Jansson</surname>
+<given-names>M</given-names>
+</name>
+<name>
+<surname>Fiore</surname>
+<given-names>JR</given-names>
+</name>
+<name>
+<surname>Colognesi</surname>
+<given-names>C</given-names>
+</name>
+<name>
+<surname>Karlsson</surname>
+<given-names>A</given-names>
+</name>
+<name>
+<surname>Albert</surname>
+<given-names>J</given-names>
+</name>
+<name>
+<surname>Scarlatti</surname>
+<given-names>G</given-names>
+</name>
+<name>
+<surname>Littman</surname>
+<given-names>DR</given-names>
+</name>
+<name>
+<surname>Fenyo</surname>
+<given-names>EM</given-names>
+</name>
+</person-group>
+<source>J Virol</source>
+<year iso-8601-date="1997">1997</year>
+<volume>71</volume>
+<fpage>7478</fpage>
+<lpage>7487</lpage>
+<pub-id pub-id-type="pmid">9311827</pub-id>
+</element-citation>
+</ref>
+<ref id="B27">
+<label>27</label>
+<element-citation publication-type="journal" publication-format="print">
+<person-group person-group-type="author">
+<name>
+<surname>Conner</surname>
+<given-names>RI</given-names>
+</name>
+<name>
+<surname>Sheridan</surname>
+<given-names>KE</given-names>
+</name>
+<name>
+<surname>Ceradinin</surname>
+<given-names>D</given-names>
+</name>
+<name>
+<surname>Choe</surname>
+<given-names>S</given-names>
+</name>
+<name>
+<surname>Landau</surname>
+<given-names>NR</given-names>
+</name>
+</person-group>
+<source>J Exp Med</source>
+<year iso-8601-date="1997">1997</year>
+<volume>185</volume>
+<fpage>621</fpage>
+<lpage>628</lpage>
+<pub-id pub-id-type="pmid">9034141</pub-id>
+</element-citation>
+</ref>
+<ref id="B28">
+<label>28</label>
+<element-citation publication-type="journal" publication-format="print">
+<person-group person-group-type="author">
+<name>
+<surname>Liu</surname>
+<given-names>R</given-names>
+</name>
+<name>
+<surname>Paxton</surname>
+<given-names>WA</given-names>
+</name>
+<name>
+<surname>Choe</surname>
+<given-names>S</given-names>
+</name>
+<name>
+<surname>Ceradini</surname>
+<given-names>D</given-names>
+</name>
+<name>
+<surname>Martin</surname>
+<given-names>SR</given-names>
+</name>
+<name>
+<surname>Horuk</surname>
+<given-names>R</given-names>
+</name>
+<name>
+<surname>MacDonald</surname>
+<given-names>ME</given-names>
+</name>
+<name>
+<surname>Stuhlmann</surname>
+<given-names>H</given-names>
+</name>
+<name>
+<surname>Koup</surname>
+<given-names>RA</given-names>
+</name>
+<name>
+<surname>Landau</surname>
+<given-names>NR</given-names>
+</name>
+</person-group>
+<source>Cell</source>
+<year iso-8601-date="1996">1996</year>
+<volume>86</volume>
+<fpage>367</fpage>
+<lpage>377</lpage>
+<pub-id pub-id-type="pmid">8756719</pub-id>
+</element-citation>
+</ref>
+<ref id="B29">
+<label>29</label>
+<element-citation publication-type="journal" publication-format="print">
+<person-group person-group-type="author">
+<name>
+<surname>Mussico</surname>
+<given-names>M</given-names>
+</name>
+<name>
+<surname>Lazzarin</surname>
+<given-names>A</given-names>
+</name>
+<name>
+<surname>Nicolosi</surname>
+<given-names>A</given-names>
+</name>
+<name>
+<surname>Gasparini</surname>
+<given-names>M</given-names>
+</name>
+<name>
+<surname>Costigliola</surname>
+<given-names>P</given-names>
+</name>
+<name>
+<surname>Arici</surname>
+<given-names>C</given-names>
+</name>
+<name>
+<surname>Saracco</surname>
+<given-names>A</given-names>
+</name>
+</person-group>
+<source>Arch Intern Med (Moscow)</source>
+<year iso-8601-date="1994">1994</year>
+<volume>154</volume>
+<fpage>1971</fpage>
+<lpage>1976</lpage>
+<pub-id pub-id-type="pmid">8074601</pub-id>
+</element-citation>
+</ref>
+<ref id="B30">
+<label>30</label>
+<element-citation publication-type="journal" publication-format="print">
+<person-group person-group-type="author">
+<name>
+<surname>Michael</surname>
+<given-names>NL</given-names>
+</name>
+<name>
+<surname>Nelson</surname>
+<given-names>JA</given-names>
+</name>
+<name>
+<surname>KewalRamani</surname>
+<given-names>VN</given-names>
+</name>
+<name>
+<surname>Chang</surname>
+<given-names>G</given-names>
+</name>
+<name>
+<surname>O'Brien</surname>
+<given-names>SJ</given-names>
+</name>
+<name>
+<surname>Mascola</surname>
+<given-names>JR</given-names>
+</name>
+<name>
+<surname>Volsky</surname>
+<given-names>B</given-names>
+</name>
+<name>
+<surname>Louder</surname>
+<given-names>M</given-names>
+</name>
+<name>
+<surname>White</surname>
+<given-names>GC</given-names>
+</name>
+<name>
+<surname>Littman</surname>
+<given-names>DR</given-names>
+</name>
+<etal/>
+</person-group>
+<source>J Virol</source>
+<year iso-8601-date="1998">1998</year>
+<volume>72</volume>
+<fpage>6040</fpage>
+<lpage>6047</lpage>
+<pub-id pub-id-type="pmid">9621067</pub-id>
+</element-citation>
+</ref>
+<ref id="B31">
+<label>31</label>
+<element-citation publication-type="book" publication-format="print">
+<person-group person-group-type="author">
+<name>
+<surname>Hethcote</surname>
+<given-names>HW</given-names>
+</name>
+<name>
+<surname>Yorke</surname>
+<given-names>JA</given-names>
+</name>
+</person-group>
+<source>Gonorrhea Transmission Dynamics and Control</source>
+<year iso-8601-date="1984">1984</year>
+<publisher-loc>Berlin</publisher-loc>
+<publisher-name>Springer</publisher-name>
+</element-citation>
+</ref>
+<ref id="B32">
+<label>32</label>
+<element-citation publication-type="journal" publication-format="print">
+<person-group person-group-type="author">
+<name>
+<surname>Anderson</surname>
+<given-names>RM</given-names>
+</name>
+<name>
+<surname>May</surname>
+<given-names>RM</given-names>
+</name>
+</person-group>
+<source>Nature (London)</source>
+<year iso-8601-date="1988">1988</year>
+<volume>333</volume>
+<fpage>514</fpage>
+<lpage>522</lpage>
+<pub-id pub-id-type="pmid">3374601</pub-id>
+</element-citation>
+</ref>
+<ref id="B33">
+<label>33</label>
+<element-citation publication-type="journal" publication-format="print">
+<person-group person-group-type="author">
+<name>
+<surname>Asiimwe-Okiror</surname>
+<given-names>G</given-names>
+</name>
+<name>
+<surname>Opio</surname>
+<given-names>AA</given-names>
+</name>
+<name>
+<surname>Musinguzi</surname>
+<given-names>J</given-names>
+</name>
+<name>
+<surname>Madraa</surname>
+<given-names>E</given-names>
+</name>
+<name>
+<surname>Tembo</surname>
+<given-names>G</given-names>
+</name>
+<name>
+<surname>Carael</surname>
+<given-names>M</given-names>
+</name>
+</person-group>
+<source>AIDS</source>
+<year iso-8601-date="1997">1997</year>
+<volume>11</volume>
+<fpage>1757</fpage>
+<lpage>1763</lpage>
+<pub-id pub-id-type="pmid">9386811</pub-id>
+</element-citation>
+</ref>
+<ref id="B34">
+<label>34</label>
+<element-citation publication-type="journal" publication-format="print">
+<person-group person-group-type="author">
+<name>
+<surname>Carael</surname>
+<given-names>M</given-names>
+</name>
+<name>
+<surname>Cleland</surname>
+<given-names>J</given-names>
+</name>
+<name>
+<surname>Deheneffe</surname>
+<given-names>JC</given-names>
+</name>
+<name>
+<surname>Ferry</surname>
+<given-names>B</given-names>
+</name>
+<name>
+<surname>Ingham</surname>
+<given-names>R</given-names>
+</name>
+</person-group>
+<source>AIDS</source>
+<year iso-8601-date="1995">1995</year>
+<volume>9</volume>
+<fpage>1171</fpage>
+<lpage>1175</lpage>
+<pub-id pub-id-type="pmid">8519454</pub-id>
+</element-citation>
+</ref>
+<ref id="B35">
+<label>35</label>
+<element-citation publication-type="journal" publication-format="print">
+<person-group person-group-type="author">
+<name>
+<surname>Blower</surname>
+<given-names>SM</given-names>
+</name>
+<name>
+<surname>Boe</surname>
+<given-names>C</given-names>
+</name>
+</person-group>
+<source>J AIDS</source>
+<year iso-8601-date="1993">1993</year>
+<volume>6</volume>
+<fpage>1347</fpage>
+<lpage>1352</lpage>
+<pub-id pub-id-type="pmid">8254474</pub-id>
+</element-citation>
+</ref>
+<ref id="B36">
+<label>36</label>
+<element-citation publication-type="journal" publication-format="print">
+<person-group person-group-type="author">
+<name>
+<surname>Kirschner</surname>
+<given-names>D</given-names>
+</name>
+</person-group>
+<source>J Appl Math</source>
+<year iso-8601-date="1996">1996</year>
+<volume>56</volume>
+<fpage>143</fpage>
+<lpage>166</lpage>
+</element-citation>
+</ref>
+<ref id="B37">
+<label>37</label>
+<element-citation publication-type="journal" publication-format="print">
+<person-group person-group-type="author">
+<name>
+<surname>Le Pont</surname>
+<given-names>F</given-names>
+</name>
+<name>
+<surname>Blower</surname>
+<given-names>S</given-names>
+</name>
+</person-group>
+<source>J AIDS</source>
+<year iso-8601-date="1991">1991</year>
+<volume>4</volume>
+<fpage>987</fpage>
+<lpage>999</lpage>
+<pub-id pub-id-type="pmid">1890608</pub-id>
+</element-citation>
+</ref>
+<ref id="B38">
+<label>38</label>
+<element-citation publication-type="journal" publication-format="print">
+<person-group person-group-type="author">
+<name>
+<surname>Kim</surname>
+<given-names>MY</given-names>
+</name>
+<name>
+<surname>Lagakos</surname>
+<given-names>SW</given-names>
+</name>
+</person-group>
+<source>Ann Epidemiol</source>
+<year iso-8601-date="1990">1990</year>
+<volume>1</volume>
+<fpage>117</fpage>
+<lpage>128</lpage>
+<pub-id pub-id-type="pmid">1669741</pub-id>
+</element-citation>
+</ref>
+<ref id="B39">
+<label>39</label>
+<element-citation publication-type="book" publication-format="print">
+<person-group person-group-type="author">
+<name>
+<surname>Anderson</surname>
+<given-names>RM</given-names>
+</name>
+<name>
+<surname>May</surname>
+<given-names>RM</given-names>
+</name>
+</person-group>
+<source>Infectious Disease of Humans: Dynamics and Control</source>
+<year iso-8601-date="1992">1992</year>
+<publisher-loc>Oxford</publisher-loc>
+<publisher-name>Oxford Univ. Press</publisher-name>
+</element-citation>
+</ref>
+<ref id="B40">
+<label>40</label>
+<element-citation publication-type="journal" publication-format="print">
+<person-group person-group-type="author">
+<name>
+<surname>Ragni</surname>
+<given-names>MV</given-names>
+</name>
+<name>
+<surname>Faruki</surname>
+<given-names>H</given-names>
+</name>
+<name>
+<surname>Kingsley</surname>
+<given-names>LA</given-names>
+</name>
+</person-group>
+<source>J Acquired Immune Defic Syndr</source>
+<year iso-8601-date="1998">1998</year>
+<volume>17</volume>
+<fpage>42</fpage>
+<lpage>45</lpage>
+</element-citation>
+</ref>
+<ref id="B41">
+<label>41</label>
+<element-citation publication-type="journal" publication-format="print">
+<person-group person-group-type="author">
+<name>
+<surname>Kaplan</surname>
+<given-names>JE</given-names>
+</name>
+<name>
+<surname>Khabbaz</surname>
+<given-names>RF</given-names>
+</name>
+<name>
+<surname>Murphy</surname>
+<given-names>EL</given-names>
+</name>
+<name>
+<surname>Hermansen</surname>
+<given-names>S</given-names>
+</name>
+<name>
+<surname>Roberts</surname>
+<given-names>C</given-names>
+</name>
+<name>
+<surname>Lal</surname>
+<given-names>R</given-names>
+</name>
+<name>
+<surname>Heneine</surname>
+<given-names>W</given-names>
+</name>
+<name>
+<surname>Wright</surname>
+<given-names>D</given-names>
+</name>
+<name>
+<surname>Matijas</surname>
+<given-names>L</given-names>
+</name>
+<name>
+<surname>Thomson</surname>
+<given-names>R</given-names>
+</name>
+<etal/>
+</person-group>
+<source>J Acquired Immune Defic Syndr Hum Retrovirol</source>
+<year iso-8601-date="1996">1996</year>
+<volume>12</volume>
+<fpage>193</fpage>
+<lpage>201</lpage>
+<pub-id pub-id-type="pmid">8680892</pub-id>
+</element-citation>
+</ref>
+<ref id="B42">
+<label>42</label>
+<element-citation publication-type="journal" publication-format="print">
+<person-group person-group-type="author">
+<name>
+<surname>Padian</surname>
+<given-names>NS</given-names>
+</name>
+<name>
+<surname>Shiboski</surname>
+<given-names>SC</given-names>
+</name>
+<name>
+<surname>Glass</surname>
+<given-names>SO</given-names>
+</name>
+<name>
+<surname>Vittinghoff</surname>
+<given-names>E</given-names>
+</name>
+</person-group>
+<source>Am J Edu</source>
+<year iso-8601-date="1997">1997</year>
+<volume>146</volume>
+<fpage>350</fpage>
+<lpage>357</lpage>
+</element-citation>
+</ref>
+<ref id="B43">
+<label>43</label>
+<element-citation publication-type="journal" publication-format="print">
+<person-group person-group-type="author">
+<name>
+<surname>Leynaert</surname>
+<given-names>B</given-names>
+</name>
+<name>
+<surname>Downs</surname>
+<given-names>AM</given-names>
+</name>
+<name>
+<surname>de Vincenzi</surname>
+<given-names>I</given-names>
+</name>
+</person-group>
+<source>Am J Edu</source>
+<year iso-8601-date="1998">1998</year>
+<volume>148</volume>
+<fpage>88</fpage>
+<lpage>96</lpage>
+</element-citation>
+</ref>
+<ref id="B44">
+<label>44</label>
+<element-citation publication-type="journal" publication-format="print">
+<person-group person-group-type="author">
+<name>
+<surname>Garnett</surname>
+<given-names>GP</given-names>
+</name>
+<name>
+<surname>Anderson</surname>
+<given-names>RM</given-names>
+</name>
+</person-group>
+<source>J Acquired Immune Defic Syndr</source>
+<year iso-8601-date="1995">1995</year>
+<volume>9</volume>
+<fpage>500</fpage>
+<lpage>513</lpage>
+</element-citation>
+</ref>
+<ref id="B45">
+<label>45</label>
+<element-citation publication-type="journal" publication-format="print">
+<person-group person-group-type="author">
+<name>
+<surname>Stigum</surname>
+<given-names>H</given-names>
+</name>
+<name>
+<surname>Magnus</surname>
+<given-names>P</given-names>
+</name>
+<name>
+<surname>Harris</surname>
+<given-names>JR</given-names>
+</name>
+<name>
+<surname>Samualson</surname>
+<given-names>SO</given-names>
+</name>
+<name>
+<surname>Bakketeig</surname>
+<given-names>LS</given-names>
+</name>
+</person-group>
+<source>Am J Edu</source>
+<year iso-8601-date="1997">1997</year>
+<volume>145</volume>
+<fpage>636</fpage>
+<lpage>643</lpage>
+</element-citation>
+</ref>
+<ref id="B46">
+<label>46</label>
+<element-citation publication-type="journal" publication-format="print">
+<person-group person-group-type="author">
+<name>
+<surname>Ho</surname>
+<given-names>DD</given-names>
+</name>
+<name>
+<surname>Neumann</surname>
+<given-names>AU</given-names>
+</name>
+<name>
+<surname>Perelson</surname>
+<given-names>AS</given-names>
+</name>
+<name>
+<surname>Chen</surname>
+<given-names>W</given-names>
+</name>
+<name>
+<surname>Leonard</surname>
+<given-names>JM</given-names>
+</name>
+<name>
+<surname>Markowitz</surname>
+<given-names>M</given-names>
+</name>
+</person-group>
+<source>Nature (London)</source>
+<year iso-8601-date="1995">1995</year>
+<volume>373</volume>
+<fpage>123</fpage>
+<lpage>126</lpage>
+<pub-id pub-id-type="pmid">7816094</pub-id>
+</element-citation>
+</ref>
+<ref id="B47">
+<label>47</label>
+<element-citation publication-type="book" publication-format="print">
+<collab>World Resources Institute</collab>
+<source>World Resources (1998&#x2013;1999)</source>
+<year iso-8601-date="1999">1999</year>
+<publisher-loc>Oxford</publisher-loc>
+<publisher-name>Oxford Univ. Press</publisher-name>
+</element-citation>
+</ref>
+<ref id="B48">
+<label>48</label>
+<element-citation publication-type="journal" publication-format="print">
+<person-group person-group-type="author">
+<name>
+<surname>Kostrikis</surname>
+<given-names>LG</given-names>
+</name>
+<name>
+<surname>Neumann</surname>
+<given-names>AU</given-names>
+</name>
+<name>
+<surname>Thomson</surname>
+<given-names>B</given-names>
+</name>
+<name>
+<surname>Korber</surname>
+<given-names>BT</given-names>
+</name>
+<name>
+<surname>McHardy</surname>
+<given-names>P</given-names>
+</name>
+<name>
+<surname>Karanicolas</surname>
+<given-names>R</given-names>
+</name>
+<name>
+<surname>Deutsch</surname>
+<given-names>L</given-names>
+</name>
+<name>
+<surname>Huang</surname>
+<given-names>Y</given-names>
+</name>
+<name>
+<surname>Lew</surname>
+<given-names>JF</given-names>
+</name>
+<name>
+<surname>McIntosh</surname>
+<given-names>K</given-names>
+</name>
+<etal/>
+</person-group>
+<source>J Virol</source>
+<year iso-8601-date="1999">1999</year>
+<volume>73</volume>
+<fpage>10264</fpage>
+<lpage>10271</lpage>
+<pub-id pub-id-type="pmid">10559343</pub-id>
+</element-citation>
+</ref>
+<ref id="B49">
+<label>49</label>
+<element-citation publication-type="journal" publication-format="print">
+<person-group person-group-type="author">
+<name>
+<surname>Low-Beer</surname>
+<given-names>D</given-names>
+</name>
+<name>
+<surname>Stoneburner</surname>
+<given-names>RL</given-names>
+</name>
+<name>
+<surname>Mukulu</surname>
+<given-names>A</given-names>
+</name>
+</person-group>
+<source>Nat Med</source>
+<year iso-8601-date="1997">1997</year>
+<volume>3</volume>
+<fpage>553</fpage>
+<lpage>557</lpage>
+<pub-id pub-id-type="pmid">9142126</pub-id>
+</element-citation>
+</ref>
+<ref id="B50">
+<label>50</label>
+<element-citation publication-type="journal" publication-format="print">
+<person-group person-group-type="author">
+<name>
+<surname>Grosskurth</surname>
+<given-names>H</given-names>
+</name>
+<name>
+<surname>Mosha</surname>
+<given-names>F</given-names>
+</name>
+<name>
+<surname>Todd</surname>
+<given-names>J</given-names>
+</name>
+<name>
+<surname>Senkoro</surname>
+<given-names>K</given-names>
+</name>
+<name>
+<surname>Newell</surname>
+<given-names>J</given-names>
+</name>
+<name>
+<surname>Klokke</surname>
+<given-names>A</given-names>
+</name>
+<name>
+<surname>Changalucha</surname>
+<given-names>J</given-names>
+</name>
+<name>
+<surname>West</surname>
+<given-names>B</given-names>
+</name>
+<name>
+<surname>Mayaud</surname>
+<given-names>P</given-names>
+</name>
+<name>
+<surname>Gavyole</surname>
+<given-names>A</given-names>
+</name>
+</person-group>
+<source>AIDS</source>
+<year iso-8601-date="1995">1995</year>
+<volume>9</volume>
+<fpage>927</fpage>
+<lpage>934</lpage>
+<pub-id pub-id-type="pmid">7576329</pub-id>
+</element-citation>
+</ref>
+<ref id="B51">
+<label>51</label>
+<element-citation publication-type="journal" publication-format="print">
+<person-group person-group-type="author">
+<name>
+<surname>Melo</surname>
+<given-names>J</given-names>
+</name>
+<name>
+<surname>Beby-Defaux</surname>
+<given-names>A</given-names>
+</name>
+<name>
+<surname>Faria</surname>
+<given-names>C</given-names>
+</name>
+<name>
+<surname>Guiraud</surname>
+<given-names>G</given-names>
+</name>
+<name>
+<surname>Folgosa</surname>
+<given-names>E</given-names>
+</name>
+<name>
+<surname>Barreto</surname>
+<given-names>A</given-names>
+</name>
+<name>
+<surname>Agius</surname>
+<given-names>G</given-names>
+</name>
+</person-group>
+<source>J AIDS</source>
+<year iso-8601-date="2000">2000</year>
+<volume>23</volume>
+<fpage>203</fpage>
+<lpage>204</lpage>
+<pub-id pub-id-type="pmid">10737436</pub-id>
+</element-citation>
+</ref>
+<ref id="B52">
+<label>52</label>
+<element-citation publication-type="journal" publication-format="print">
+<person-group person-group-type="author">
+<name>
+<surname>Iman</surname>
+<given-names>RL</given-names>
+</name>
+<name>
+<surname>Helton</surname>
+<given-names>JC</given-names>
+</name>
+<name>
+<surname>Campbell</surname>
+<given-names>JE</given-names>
+</name>
+</person-group>
+<source>J Quality Technol</source>
+<year iso-8601-date="1981">1981</year>
+<volume>13</volume>
+<fpage>174</fpage>
+<lpage>183</lpage>
+</element-citation>
+</ref>
+<ref id="B53">
+<label>53</label>
+<element-citation publication-type="journal" publication-format="print">
+<person-group person-group-type="author">
+<name>
+<surname>Iman</surname>
+<given-names>RL</given-names>
+</name>
+<name>
+<surname>Helton</surname>
+<given-names>JC</given-names>
+</name>
+<name>
+<surname>Campbell</surname>
+<given-names>JE</given-names>
+</name>
+</person-group>
+<source>J Quality Technol</source>
+<year iso-8601-date="1981">1981</year>
+<volume>13</volume>
+<fpage>232</fpage>
+<lpage>240</lpage>
+</element-citation>
+</ref>
+<ref id="B54">
+<label>54</label>
+<element-citation publication-type="journal" publication-format="print">
+<person-group person-group-type="author">
+<name>
+<surname>Blower</surname>
+<given-names>SM</given-names>
+</name>
+<name>
+<surname>Dowlatabadi</surname>
+<given-names>H</given-names>
+</name>
+</person-group>
+<source>Int Stat Rev</source>
+<year iso-8601-date="1994">1994</year>
+<volume>62</volume>
+<fpage>229</fpage>
+<lpage>243</lpage>
+</element-citation>
+</ref>
+<ref id="B55">
+<label>55</label>
+<element-citation publication-type="journal" publication-format="print">
+<person-group person-group-type="author">
+<name>
+<surname>Porco</surname>
+<given-names>TC</given-names>
+</name>
+<name>
+<surname>Blower</surname>
+<given-names>SM</given-names>
+</name>
+</person-group>
+<source>Theor Popul Biol</source>
+<year iso-8601-date="1998">1998</year>
+<volume>54</volume>
+<fpage>117</fpage>
+<lpage>132</lpage>
+<pub-id pub-id-type="pmid">9733654</pub-id>
+</element-citation>
+</ref>
+<ref id="B56">
+<label>56</label>
+<element-citation publication-type="journal" publication-format="print">
+<person-group person-group-type="author">
+<name>
+<surname>Blower</surname>
+<given-names>SM</given-names>
+</name>
+<name>
+<surname>Porco</surname>
+<given-names>TC</given-names>
+</name>
+<name>
+<surname>Darby</surname>
+<given-names>G</given-names>
+</name>
+</person-group>
+<source>Nat Med</source>
+<year iso-8601-date="1998">1998</year>
+<volume>4</volume>
+<fpage>673</fpage>
+<lpage>678</lpage>
+<pub-id pub-id-type="pmid">9623975</pub-id>
+</element-citation>
+</ref>
+<ref id="B57">
+<label>57</label>
+<element-citation publication-type="journal" publication-format="print">
+<person-group person-group-type="author">
+<name>
+<surname>Libert</surname>
+<given-names>F</given-names>
+</name>
+<name>
+<surname>Cochaux</surname>
+<given-names>P</given-names>
+</name>
+<name>
+<surname>Beckman</surname>
+<given-names>G</given-names>
+</name>
+<name>
+<surname>Samson</surname>
+<given-names>M</given-names>
+</name>
+<name>
+<surname>Aksenova</surname>
+<given-names>M</given-names>
+</name>
+<name>
+<surname>Cao</surname>
+<given-names>A</given-names>
+</name>
+<name>
+<surname>Czeizel</surname>
+<given-names>A</given-names>
+</name>
+<name>
+<surname>Claustres</surname>
+<given-names>M</given-names>
+</name>
+<name>
+<surname>de la Rua</surname>
+<given-names>C</given-names>
+</name>
+<name>
+<surname>Ferrari</surname>
+<given-names>M</given-names>
+</name>
+<etal/>
+</person-group>
+<source>Hum Mol Genet</source>
+<year iso-8601-date="1998">1998</year>
+<volume>7</volume>
+<fpage>399</fpage>
+<lpage>406</lpage>
+<pub-id pub-id-type="pmid">9466996</pub-id>
+</element-citation>
+</ref>
+<ref id="B58">
+<label>58</label>
+<element-citation publication-type="journal" publication-format="print">
+<person-group person-group-type="author">
+<name>
+<surname>Lalani</surname>
+<given-names>AS</given-names>
+</name>
+<name>
+<surname>Masters</surname>
+<given-names>J</given-names>
+</name>
+<name>
+<surname>Zeng</surname>
+<given-names>W</given-names>
+</name>
+<name>
+<surname>Barrett</surname>
+<given-names>J</given-names>
+</name>
+<name>
+<surname>Pannu</surname>
+<given-names>R</given-names>
+</name>
+<name>
+<surname>Everett</surname>
+<given-names>H</given-names>
+</name>
+<name>
+<surname>Arendt</surname>
+<given-names>CW</given-names>
+</name>
+<name>
+<surname>McFadden</surname>
+<given-names>G</given-names>
+</name>
+</person-group>
+<source>Science</source>
+<year iso-8601-date="1999">1999</year>
+<volume>286</volume>
+<fpage>1968</fpage>
+<lpage>1971</lpage>
+<pub-id pub-id-type="pmid">10583963</pub-id>
+</element-citation>
+</ref>
+<ref id="B59">
+<label>59</label>
+<element-citation publication-type="journal" publication-format="print">
+<person-group person-group-type="author">
+<name>
+<surname>Kermack</surname>
+<given-names>WO</given-names>
+</name>
+<name>
+<surname>McKendrick</surname>
+<given-names>AG</given-names>
+</name>
+</person-group>
+<source>Proc R Soc London</source>
+<year iso-8601-date="1927">1927</year>
+<volume>261</volume>
+<fpage>700</fpage>
+<lpage>721</lpage>
+</element-citation>
+</ref>
+<ref id="B60">
+<label>60</label>
+<element-citation publication-type="journal" publication-format="print">
+<person-group person-group-type="author">
+<name>
+<surname>Gupta</surname>
+<given-names>S</given-names>
+</name>
+<name>
+<surname>Hill</surname>
+<given-names>AVS</given-names>
+</name>
+</person-group>
+<source>Proc R Soc London Ser B</source>
+<year iso-8601-date="1995">1995</year>
+<volume>260</volume>
+<fpage>271</fpage>
+<lpage>277</lpage>
+</element-citation>
+</ref>
+<ref id="B61">
+<label>61</label>
+<element-citation publication-type="journal" publication-format="print">
+<person-group person-group-type="author">
+<name>
+<surname>Ruwende</surname>
+<given-names>C</given-names>
+</name>
+<name>
+<surname>Khoo</surname>
+<given-names>SC</given-names>
+</name>
+<name>
+<surname>Snow</surname>
+<given-names>RW</given-names>
+</name>
+<name>
+<surname>Yates</surname>
+<given-names>SNR</given-names>
+</name>
+<name>
+<surname>Kwiatkowski</surname>
+<given-names>D</given-names>
+</name>
+<name>
+<surname>Gupta</surname>
+<given-names>S</given-names>
+</name>
+<name>
+<surname>Warn</surname>
+<given-names>P</given-names>
+</name>
+<name>
+<surname>Allsopp</surname>
+<given-names>CE</given-names>
+</name>
+<name>
+<surname>Gilbert</surname>
+<given-names>SC</given-names>
+</name>
+<name>
+<surname>Peschu</surname>
+<given-names>N</given-names>
+</name>
+</person-group>
+<source>Nature (London)</source>
+<year iso-8601-date="1995">1995</year>
+<volume>376</volume>
+<fpage>246</fpage>
+<lpage>249</lpage>
+<pub-id pub-id-type="pmid">7617034</pub-id>
+</element-citation>
+</ref>
+<ref id="B62">
+<label>62</label>
+<element-citation publication-type="journal" publication-format="print">
+<person-group person-group-type="author">
+<name>
+<surname>McDermott</surname>
+<given-names>DH</given-names>
+</name>
+<name>
+<surname>Zimmerman</surname>
+<given-names>PA</given-names>
+</name>
+<name>
+<surname>Guignard</surname>
+<given-names>F</given-names>
+</name>
+<name>
+<surname>Kleeberger</surname>
+<given-names>CA</given-names>
+</name>
+<name>
+<surname>Leitman</surname>
+<given-names>SF</given-names>
+</name>
+<name>
+<surname>Murphy</surname>
+<given-names>PM</given-names>
+</name>
+</person-group>
+<source>Lancet</source>
+<year iso-8601-date="1998">1998</year>
+<volume>352</volume>
+<fpage>866</fpage>
+<lpage>870</lpage>
+<pub-id pub-id-type="pmid">9742978</pub-id>
+</element-citation>
+</ref>
+<ref id="B63">
+<label>63</label>
+<element-citation publication-type="journal" publication-format="print">
+<person-group person-group-type="author">
+<name>
+<surname>Kostrikis</surname>
+<given-names>LG</given-names>
+</name>
+<name>
+<surname>Huang</surname>
+<given-names>Y</given-names>
+</name>
+<name>
+<surname>Moore</surname>
+<given-names>JP</given-names>
+</name>
+<name>
+<surname>Wolinsky</surname>
+<given-names>SM</given-names>
+</name>
+<name>
+<surname>Zhang</surname>
+<given-names>L</given-names>
+</name>
+<name>
+<surname>Guo</surname>
+<given-names>Y</given-names>
+</name>
+<name>
+<surname>Deutsch</surname>
+<given-names>L</given-names>
+</name>
+<name>
+<surname>Phair</surname>
+<given-names>J</given-names>
+</name>
+<name>
+<surname>Neumann</surname>
+<given-names>AU</given-names>
+</name>
+<name>
+<surname>Ho</surname>
+<given-names>DD</given-names>
+</name>
+</person-group>
+<source>Nat Med</source>
+<year iso-8601-date="1998">1998</year>
+<volume>4</volume>
+<fpage>350</fpage>
+<lpage>353</lpage>
+<pub-id pub-id-type="pmid">9500612</pub-id>
+</element-citation>
+</ref>
+<ref id="B64">
+<label>64</label>
+<element-citation publication-type="journal" publication-format="print">
+<person-group person-group-type="author">
+<name>
+<surname>Winkler</surname>
+<given-names>C</given-names>
+</name>
+<name>
+<surname>Modi</surname>
+<given-names>W</given-names>
+</name>
+<name>
+<surname>Smith</surname>
+<given-names>MW</given-names>
+</name>
+<name>
+<surname>Nelson</surname>
+<given-names>GW</given-names>
+</name>
+<name>
+<surname>Wu</surname>
+<given-names>X</given-names>
+</name>
+<name>
+<surname>Carrington</surname>
+<given-names>M</given-names>
+</name>
+<name>
+<surname>Dean</surname>
+<given-names>M</given-names>
+</name>
+<name>
+<surname>Honjo</surname>
+<given-names>T</given-names>
+</name>
+<name>
+<surname>Tashiro</surname>
+<given-names>K</given-names>
+</name>
+<name>
+<surname>Yabe</surname>
+<given-names>D</given-names>
+</name>
+<etal/>
+</person-group>
+<source>Science</source>
+<year iso-8601-date="1998">1998</year>
+<volume>279</volume>
+<fpage>389</fpage>
+<lpage>393</lpage>
+<pub-id pub-id-type="pmid">9430590</pub-id>
+</element-citation>
+</ref>
+<ref id="B65">
+<label>65</label>
+<element-citation publication-type="journal" publication-format="print">
+<person-group person-group-type="author">
+<name>
+<surname>Martinson</surname>
+<given-names>JJ</given-names>
+</name>
+<name>
+<surname>Hong</surname>
+<given-names>L</given-names>
+</name>
+<name>
+<surname>Karanicolas</surname>
+<given-names>R</given-names>
+</name>
+<name>
+<surname>Moore</surname>
+<given-names>JP</given-names>
+</name>
+<name>
+<surname>Kostrikis</surname>
+<given-names>LG</given-names>
+</name>
+</person-group>
+<source>AIDS</source>
+<year iso-8601-date="2000">2000</year>
+<volume>14</volume>
+<fpage>483</fpage>
+<lpage>489</lpage>
+<pub-id pub-id-type="pmid">10780710</pub-id>
+</element-citation>
+</ref>
+<ref id="B66">
+<label>66</label>
+<element-citation publication-type="journal" publication-format="print">
+<person-group person-group-type="author">
+<name>
+<surname>Vernazza</surname>
+<given-names>PL</given-names>
+</name>
+<name>
+<surname>Eron</surname>
+<given-names>JJ</given-names>
+</name>
+<name>
+<surname>Fiscus</surname>
+<given-names>SA</given-names>
+</name>
+<name>
+<surname>Cohen</surname>
+<given-names>MS</given-names>
+</name>
+</person-group>
+<source>AIDS</source>
+<year iso-8601-date="1999">1999</year>
+<volume>13</volume>
+<fpage>155</fpage>
+<lpage>166</lpage>
+<pub-id pub-id-type="pmid">10202821</pub-id>
+</element-citation>
+</ref>
+</ref-list>
+</back>
+</article>
\ No newline at end of file
diff --git a/tests/data/pubmed/pntd.0008301.nxml b/tests/data/jats/pntd.0008301.nxml
similarity index 100%
rename from tests/data/pubmed/pntd.0008301.nxml
rename to tests/data/jats/pntd.0008301.nxml
diff --git a/tests/data/pubmed/pntd.0008301.txt b/tests/data/jats/pntd.0008301.txt
similarity index 100%
rename from tests/data/pubmed/pntd.0008301.txt
rename to tests/data/jats/pntd.0008301.txt
diff --git a/tests/data/pubmed/pntd.0008301.xml b/tests/data/jats/pntd.0008301.xml
similarity index 100%
rename from tests/data/pubmed/pntd.0008301.xml
rename to tests/data/jats/pntd.0008301.xml
diff --git a/tests/data/pubmed/pone.0234687.nxml b/tests/data/jats/pone.0234687.nxml
similarity index 100%
rename from tests/data/pubmed/pone.0234687.nxml
rename to tests/data/jats/pone.0234687.nxml
diff --git a/tests/data/pubmed/pone.0234687.txt b/tests/data/jats/pone.0234687.txt
similarity index 100%
rename from tests/data/pubmed/pone.0234687.txt
rename to tests/data/jats/pone.0234687.txt
diff --git a/tests/data/pubmed/pone.0234687.xml b/tests/data/jats/pone.0234687.xml
similarity index 100%
rename from tests/data/pubmed/pone.0234687.xml
rename to tests/data/jats/pone.0234687.xml
diff --git a/tests/data/md/ending_with_table.md b/tests/data/md/ending_with_table.md
new file mode 100644
index 00000000..6c491d64
--- /dev/null
+++ b/tests/data/md/ending_with_table.md
@@ -0,0 +1,6 @@
+| Character | Name in German | Name in French | Name in Italian |
+|---|---|---|---|
+| Scrooge McDuck | Dagobert Duck | Balthazar Picsou | Paperone |
+| Huey | Tick | Riri | Qui |
+| Dewey | Trick | Fifi | Quo |
+| Louie | Track | Loulou | Qua |
diff --git a/tests/data/md/mixed.md b/tests/data/md/mixed.md
new file mode 100644
index 00000000..470ffb03
--- /dev/null
+++ b/tests/data/md/mixed.md
@@ -0,0 +1,54 @@
+# Title
+
+Some text
+
+## Famous ducks
+
+Here is a table:
+
+<table>
+  <tr>
+    <th>Character</th>
+    <th>Name in German</th>
+    <th>Name in French</th>
+    <th>Name in Italian</th>
+  </tr>
+  <tr>
+    <td>Scrooge McDuck</td>
+    <td>Dagobert Duck</td>
+    <td>Balthazar Picsou</td>
+    <td>Paperone</td>
+  </tr>
+  <tr>
+    <td>Huey</td>
+    <td>Tick</td>
+    <td>Riri</td>
+    <td>Qui</td>
+  </tr>
+  <tr>
+    <td>Dewey</td>
+    <td>Trick</td>
+    <td>Fifi</td>
+    <td>Quo</td>
+  </tr>
+  <tr>
+    <td>Louie</td>
+    <td>Track</td>
+    <td>Loulou</td>
+    <td>Qua</td>
+  </tr>
+</table>
+
+And here is more HTML:
+
+<p>Some paragraph.</p>
+
+<div>
+    <p>Now a div — almost there...</p>
+    <ul>
+        <li>foo</li>
+        <li>bar</li>
+    </ul>
+</div>
+
+The end!
diff --git a/tests/data/md/nested.md b/tests/data/md/nested.md
new file mode 100644
index 00000000..4e203eec
--- /dev/null
+++ b/tests/data/md/nested.md
@@ -0,0 +1,66 @@
+# Nesting
+
+A list featuring nesting:
+
+- abc
+	- abc123
+		- abc1234
+			- abc12345
+				- a.
+				- b.
+		- abcd1234：
+			- abcd12345：
+				- a.
+				- b.
+- def：
+	- def1234：
+		- def12345。
+
+- after one empty line
+	- foo
+
+
+- afer two empty lines
+	- bar
+* changing symbol
+
+A nested HTML list:
+
+<ul>
+    <li>First item</li>
+    <li>Second item with subitems:
+        <ul>
+            <li>Subitem 1</li>
+            <li>Subitem 2</li>
+        </ul>
+    </li>
+    <li>Last list item</li>
+</ul>
+
+<!--
+Table nesting apparently not yet suported by HTML backend:
+
+<table>
+  <tr>
+    <td>Cell</td>
+    <td>Nested Table
+      <table>
+        <tr>
+          <td>Cell 1</td>
+		  <>
+        </tr>
+        <tr>
+          <td>Cell 2</td>
+        </tr>
+        <tr>
+          <td>Cell 3</td>
+        </tr>
+        <tr>
+          <td>Cell 4</td>
+        </tr>
+      </table>
+    </td>
+  </tr>
+  <tr><td>additional row</td></tr>
+</table>
+-->
diff --git a/tests/data/2203.01017v2.pdf b/tests/data/pdf/2203.01017v2.pdf
similarity index 100%
rename from tests/data/2203.01017v2.pdf
rename to tests/data/pdf/2203.01017v2.pdf
diff --git a/tests/data/2206.01062.pdf b/tests/data/pdf/2206.01062.pdf
similarity index 100%
rename from tests/data/2206.01062.pdf
rename to tests/data/pdf/2206.01062.pdf
diff --git a/tests/data/2305.03393v1-pg9.pdf b/tests/data/pdf/2305.03393v1-pg9.pdf
similarity index 100%
rename from tests/data/2305.03393v1-pg9.pdf
rename to tests/data/pdf/2305.03393v1-pg9.pdf
diff --git a/tests/data/2305.03393v1.pdf b/tests/data/pdf/2305.03393v1.pdf
similarity index 100%
rename from tests/data/2305.03393v1.pdf
rename to tests/data/pdf/2305.03393v1.pdf
diff --git a/tests/data/amt_handbook_sample.pdf b/tests/data/pdf/amt_handbook_sample.pdf
similarity index 100%
rename from tests/data/amt_handbook_sample.pdf
rename to tests/data/pdf/amt_handbook_sample.pdf
diff --git a/tests/data/pdf/code_and_formula.pdf b/tests/data/pdf/code_and_formula.pdf
new file mode 100644
index 00000000..ecb5f758
Binary files /dev/null and b/tests/data/pdf/code_and_formula.pdf differ
diff --git a/tests/data/picture_classification.pdf b/tests/data/pdf/picture_classification.pdf
similarity index 100%
rename from tests/data/picture_classification.pdf
rename to tests/data/pdf/picture_classification.pdf
diff --git a/tests/data/redp5110_sampled.pdf b/tests/data/pdf/redp5110_sampled.pdf
similarity index 100%
rename from tests/data/redp5110_sampled.pdf
rename to tests/data/pdf/redp5110_sampled.pdf
diff --git a/tests/data/pdf/right_to_left_01.pdf b/tests/data/pdf/right_to_left_01.pdf
new file mode 100644
index 00000000..2d9bc2f6
Binary files /dev/null and b/tests/data/pdf/right_to_left_01.pdf differ
diff --git a/tests/data/pdf/right_to_left_02.pdf b/tests/data/pdf/right_to_left_02.pdf
new file mode 100644
index 00000000..e722b71d
Binary files /dev/null and b/tests/data/pdf/right_to_left_02.pdf differ
diff --git a/tests/data/pdf/right_to_left_03.pdf b/tests/data/pdf/right_to_left_03.pdf
new file mode 100644
index 00000000..af329a9c
Binary files /dev/null and b/tests/data/pdf/right_to_left_03.pdf differ
diff --git a/tests/data_scanned/groundtruth/docling_v1/ocr_test.json b/tests/data_scanned/groundtruth/docling_v1/ocr_test.json
index bbc6502d..ea5992a6 100644
--- a/tests/data_scanned/groundtruth/docling_v1/ocr_test.json
+++ b/tests/data_scanned/groundtruth/docling_v1/ocr_test.json
@@ -1 +1 @@
-{"_name": "", "type": "pdf-document", "description": {"title": null, "abstract": null, "authors": null, "affiliations": null, "subjects": null, "keywords": null, "publication_date": null, "languages": null, "license": null, "publishers": null, "url_refs": null, "references": null, "publication": null, "reference_count": null, "citation_count": null, "citation_date": null, "advanced": null, "analytics": null, "logs": [], "collection": null, "acquisition": null}, "file-info": {"filename": "ocr_test.pdf", "filename-prov": null, "document-hash": "80f38f5b87a84870681556176a9622186fd200dd32c5557be9e0c0af05b8bc61", "#-pages": 1, "collection-name": null, "description": null, "page-hashes": [{"hash": "14d896dc8bcb7ee7c08c0347eb6be8dcb92a3782501992f1ea14d2e58077d4e3", "model": "default", "page": 1}]}, "main-text": [{"prov": [{"bbox": [69.6796646118164, 689.012451171875, 504.87200927734375, 764.9216918945312], "page": 1, "span": [0, 94], "__ref_s3_data": null}], "text": "Docling bundles PDF document conversion to JSON and Markdown in an easy self contained package", "type": "paragraph", "payload": null, "name": "Text", "font": null}], "figures": [], "tables": [], "bitmaps": null, "equations": [], "footnotes": [], "page-dimensions": [{"height": 841.9216918945312, "page": 1, "width": 595.201171875}], "page-footers": [], "page-headers": [], "_s3_data": null, "identifiers": null}
\ No newline at end of file
+{"_name": "", "type": "pdf-document", "description": {"title": null, "abstract": null, "authors": null, "affiliations": null, "subjects": null, "keywords": null, "publication_date": null, "languages": null, "license": null, "publishers": null, "url_refs": null, "references": null, "publication": null, "reference_count": null, "citation_count": null, "citation_date": null, "advanced": null, "analytics": null, "logs": [], "collection": null, "acquisition": null}, "file-info": {"filename": "ocr_test.pdf", "filename-prov": null, "document-hash": "80f38f5b87a84870681556176a9622186fd200dd32c5557be9e0c0af05b8bc61", "#-pages": 1, "collection-name": null, "description": null, "page-hashes": [{"hash": "14d896dc8bcb7ee7c08c0347eb6be8dcb92a3782501992f1ea14d2e58077d4e3", "model": "default", "page": 1}]}, "main-text": [{"prov": [{"bbox": [69.0, 688.5883585611979, 506.6666666666667, 767.2550252278646], "page": 1, "span": [0, 94], "__ref_s3_data": null}], "text": "Docling bundles PDF document conversion to JSON and Markdown in an easy self contained package", "type": "paragraph", "payload": null, "name": "Text", "font": null}], "figures": [], "tables": [], "bitmaps": null, "equations": [], "footnotes": [], "page-dimensions": [{"height": 841.9216918945312, "page": 1, "width": 595.201171875}], "page-footers": [], "page-headers": [], "_s3_data": null, "identifiers": null}
\ No newline at end of file
diff --git a/tests/data_scanned/groundtruth/docling_v1/ocr_test.pages.json b/tests/data_scanned/groundtruth/docling_v1/ocr_test.pages.json
index dcaf59cd..a6651c75 100644
--- a/tests/data_scanned/groundtruth/docling_v1/ocr_test.pages.json
+++ b/tests/data_scanned/groundtruth/docling_v1/ocr_test.pages.json
@@ -1 +1 @@
-[{"page_no": 0, "size": {"width": 595.201171875, "height": 841.9216918945312}, "cells": [{"id": 0, "text": "Docling bundles PDF document conversion to", "bbox": {"l": 73.34702132031646, "t": 76.99999977896756, "r": 503.64955224479564, "b": 97.99999977896755, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "JSON and Markdown in an easy self contained", "bbox": {"l": 69.6796630536824, "t": 104.00000011573796, "r": 504.8720051760782, "b": 124.83139494707741, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "package", "bbox": {"l": 71.84193505100733, "t": 129.797125232046, "r": 153.088934155825, "b": 152.90926970226084, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 0, "label": "text", "bbox": {"l": 69.6796630536824, "t": 76.99999977896756, "r": 504.8720051760782, "b": 152.90926970226084, "coord_origin": "TOPLEFT"}, "confidence": 0.9715732336044312, "cells": [{"id": 0, "text": "Docling bundles PDF document conversion to", "bbox": {"l": 73.34702132031646, "t": 76.99999977896756, "r": 503.64955224479564, "b": 97.99999977896755, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "JSON and Markdown in an easy self contained", "bbox": {"l": 69.6796630536824, "t": 104.00000011573796, "r": 504.8720051760782, "b": 124.83139494707741, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "package", "bbox": {"l": 71.84193505100733, "t": 129.797125232046, "r": 153.088934155825, "b": 152.90926970226084, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "text", "id": 0, "page_no": 0, "cluster": {"id": 0, "label": "text", "bbox": {"l": 69.6796630536824, "t": 76.99999977896756, "r": 504.8720051760782, "b": 152.90926970226084, "coord_origin": "TOPLEFT"}, "confidence": 0.9715732336044312, "cells": [{"id": 0, "text": "Docling bundles PDF document conversion to", "bbox": {"l": 73.34702132031646, "t": 76.99999977896756, "r": 503.64955224479564, "b": 97.99999977896755, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "JSON and Markdown in an easy self contained", "bbox": {"l": 69.6796630536824, "t": 104.00000011573796, "r": 504.8720051760782, "b": 124.83139494707741, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "package", "bbox": {"l": 71.84193505100733, "t": 129.797125232046, "r": 153.088934155825, "b": 152.90926970226084, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Docling bundles PDF document conversion to JSON and Markdown in an easy self contained package"}], "body": [{"label": "text", "id": 0, "page_no": 0, "cluster": {"id": 0, "label": "text", "bbox": {"l": 69.6796630536824, "t": 76.99999977896756, "r": 504.8720051760782, "b": 152.90926970226084, "coord_origin": "TOPLEFT"}, "confidence": 0.9715732336044312, "cells": [{"id": 0, "text": "Docling bundles PDF document conversion to", "bbox": {"l": 73.34702132031646, "t": 76.99999977896756, "r": 503.64955224479564, "b": 97.99999977896755, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "JSON and Markdown in an easy self contained", "bbox": {"l": 69.6796630536824, "t": 104.00000011573796, "r": 504.8720051760782, "b": 124.83139494707741, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "package", "bbox": {"l": 71.84193505100733, "t": 129.797125232046, "r": 153.088934155825, "b": 152.90926970226084, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Docling bundles PDF document conversion to JSON and Markdown in an easy self contained package"}], "headers": []}}]
\ No newline at end of file
+[{"page_no": 0, "size": {"width": 595.201171875, "height": 841.9216918945312}, "cells": [{"id": 0, "text": "Docling bundles PDF document conversion to", "bbox": {"l": 71.33333333333333, "t": 74.66666666666667, "r": 506.6666666666667, "b": 99.33333333333333, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "JSON and Markdown in an easy self contained", "bbox": {"l": 69.0, "t": 100.66666666666667, "r": 506.6666666666667, "b": 126.66666666666667, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "package", "bbox": {"l": 70.66666666666667, "t": 128.66666666666666, "r": 154.0, "b": 153.33333333333334, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 0, "label": "text", "bbox": {"l": 69.0, "t": 74.66666666666667, "r": 506.6666666666667, "b": 153.33333333333334, "coord_origin": "TOPLEFT"}, "confidence": 0.9715733528137207, "cells": [{"id": 0, "text": "Docling bundles PDF document conversion to", "bbox": {"l": 71.33333333333333, "t": 74.66666666666667, "r": 506.6666666666667, "b": 99.33333333333333, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "JSON and Markdown in an easy self contained", "bbox": {"l": 69.0, "t": 100.66666666666667, "r": 506.6666666666667, "b": 126.66666666666667, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "package", "bbox": {"l": 70.66666666666667, "t": 128.66666666666666, "r": 154.0, "b": 153.33333333333334, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "text", "id": 0, "page_no": 0, "cluster": {"id": 0, "label": "text", "bbox": {"l": 69.0, "t": 74.66666666666667, "r": 506.6666666666667, "b": 153.33333333333334, "coord_origin": "TOPLEFT"}, "confidence": 0.9715733528137207, "cells": [{"id": 0, "text": "Docling bundles PDF document conversion to", "bbox": {"l": 71.33333333333333, "t": 74.66666666666667, "r": 506.6666666666667, "b": 99.33333333333333, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "JSON and Markdown in an easy self contained", "bbox": {"l": 69.0, "t": 100.66666666666667, "r": 506.6666666666667, "b": 126.66666666666667, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "package", "bbox": {"l": 70.66666666666667, "t": 128.66666666666666, "r": 154.0, "b": 153.33333333333334, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Docling bundles PDF document conversion to JSON and Markdown in an easy self contained package"}], "body": [{"label": "text", "id": 0, "page_no": 0, "cluster": {"id": 0, "label": "text", "bbox": {"l": 69.0, "t": 74.66666666666667, "r": 506.6666666666667, "b": 153.33333333333334, "coord_origin": "TOPLEFT"}, "confidence": 0.9715733528137207, "cells": [{"id": 0, "text": "Docling bundles PDF document conversion to", "bbox": {"l": 71.33333333333333, "t": 74.66666666666667, "r": 506.6666666666667, "b": 99.33333333333333, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "JSON and Markdown in an easy self contained", "bbox": {"l": 69.0, "t": 100.66666666666667, "r": 506.6666666666667, "b": 126.66666666666667, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "package", "bbox": {"l": 70.66666666666667, "t": 128.66666666666666, "r": 154.0, "b": 153.33333333333334, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Docling bundles PDF document conversion to JSON and Markdown in an easy self contained package"}], "headers": []}}]
\ No newline at end of file
diff --git a/tests/data_scanned/groundtruth/docling_v2/ocr_test.doctags.txt b/tests/data_scanned/groundtruth/docling_v2/ocr_test.doctags.txt
index d79782a1..99ea5520 100644
--- a/tests/data_scanned/groundtruth/docling_v2/ocr_test.doctags.txt
+++ b/tests/data_scanned/groundtruth/docling_v2/ocr_test.doctags.txt
@@ -1,3 +1,2 @@
-<document>
-<text><location><page_1><loc_12><loc_82><loc_85><loc_91></location>Docling bundles PDF document conversion to JSON and Markdown in an easy self contained package</text>
-</document>
\ No newline at end of file
+<doctag><text><loc_58><loc_44><loc_426><loc_91>Docling bundles PDF document conversion to JSON and Markdown in an easy self contained package</text>
+</doctag>
\ No newline at end of file
diff --git a/tests/data_scanned/groundtruth/docling_v2/ocr_test.json b/tests/data_scanned/groundtruth/docling_v2/ocr_test.json
index 8bf46546..fa242666 100644
--- a/tests/data_scanned/groundtruth/docling_v2/ocr_test.json
+++ b/tests/data_scanned/groundtruth/docling_v2/ocr_test.json
@@ -1 +1 @@
-{"schema_name": "DoclingDocument", "version": "1.0.0", "name": "ocr_test", "origin": {"mimetype": "application/pdf", "binary_hash": 14853448746796404529, "filename": "ocr_test.pdf", "uri": null}, "furniture": {"self_ref": "#/furniture", "parent": null, "children": [], "name": "_root_", "label": "unspecified"}, "body": {"self_ref": "#/body", "parent": null, "children": [{"cref": "#/texts/0"}], "name": "_root_", "label": "unspecified"}, "groups": [], "texts": [{"self_ref": "#/texts/0", "parent": {"cref": "#/body"}, "children": [], "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 69.6796646118164, "t": 764.9216918945312, "r": 504.87200927734375, "b": 689.012451171875, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 94]}], "orig": "Docling bundles PDF document conversion to JSON and Markdown in an easy self contained package", "text": "Docling bundles PDF document conversion to JSON and Markdown in an easy self contained package"}], "pictures": [], "tables": [], "key_value_items": [], "pages": {"1": {"size": {"width": 595.201171875, "height": 841.9216918945312}, "image": null, "page_no": 1}}}
\ No newline at end of file
+{"schema_name": "DoclingDocument", "version": "1.1.0", "name": "ocr_test", "origin": {"mimetype": "application/pdf", "binary_hash": 14853448746796404529, "filename": "ocr_test.pdf", "uri": null}, "furniture": {"self_ref": "#/furniture", "parent": null, "children": [], "content_layer": "furniture", "name": "_root_", "label": "unspecified"}, "body": {"self_ref": "#/body", "parent": null, "children": [{"cref": "#/texts/0"}], "content_layer": "body", "name": "_root_", "label": "unspecified"}, "groups": [], "texts": [{"self_ref": "#/texts/0", "parent": {"cref": "#/body"}, "children": [], "content_layer": "body", "label": "text", "prov": [{"page_no": 1, "bbox": {"l": 69.0, "t": 767.2550252278646, "r": 506.6666666666667, "b": 688.5883585611979, "coord_origin": "BOTTOMLEFT"}, "charspan": [0, 94]}], "orig": "Docling bundles PDF document conversion to JSON and Markdown in an easy self contained package", "text": "Docling bundles PDF document conversion to JSON and Markdown in an easy self contained package"}], "pictures": [], "tables": [], "key_value_items": [], "form_items": [], "pages": {"1": {"size": {"width": 595.201171875, "height": 841.9216918945312}, "image": null, "page_no": 1}}}
\ No newline at end of file
diff --git a/tests/data_scanned/groundtruth/docling_v2/ocr_test.pages.json b/tests/data_scanned/groundtruth/docling_v2/ocr_test.pages.json
index dcaf59cd..a6651c75 100644
--- a/tests/data_scanned/groundtruth/docling_v2/ocr_test.pages.json
+++ b/tests/data_scanned/groundtruth/docling_v2/ocr_test.pages.json
@@ -1 +1 @@
-[{"page_no": 0, "size": {"width": 595.201171875, "height": 841.9216918945312}, "cells": [{"id": 0, "text": "Docling bundles PDF document conversion to", "bbox": {"l": 73.34702132031646, "t": 76.99999977896756, "r": 503.64955224479564, "b": 97.99999977896755, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "JSON and Markdown in an easy self contained", "bbox": {"l": 69.6796630536824, "t": 104.00000011573796, "r": 504.8720051760782, "b": 124.83139494707741, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "package", "bbox": {"l": 71.84193505100733, "t": 129.797125232046, "r": 153.088934155825, "b": 152.90926970226084, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 0, "label": "text", "bbox": {"l": 69.6796630536824, "t": 76.99999977896756, "r": 504.8720051760782, "b": 152.90926970226084, "coord_origin": "TOPLEFT"}, "confidence": 0.9715732336044312, "cells": [{"id": 0, "text": "Docling bundles PDF document conversion to", "bbox": {"l": 73.34702132031646, "t": 76.99999977896756, "r": 503.64955224479564, "b": 97.99999977896755, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "JSON and Markdown in an easy self contained", "bbox": {"l": 69.6796630536824, "t": 104.00000011573796, "r": 504.8720051760782, "b": 124.83139494707741, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "package", "bbox": {"l": 71.84193505100733, "t": 129.797125232046, "r": 153.088934155825, "b": 152.90926970226084, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "text", "id": 0, "page_no": 0, "cluster": {"id": 0, "label": "text", "bbox": {"l": 69.6796630536824, "t": 76.99999977896756, "r": 504.8720051760782, "b": 152.90926970226084, "coord_origin": "TOPLEFT"}, "confidence": 0.9715732336044312, "cells": [{"id": 0, "text": "Docling bundles PDF document conversion to", "bbox": {"l": 73.34702132031646, "t": 76.99999977896756, "r": 503.64955224479564, "b": 97.99999977896755, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "JSON and Markdown in an easy self contained", "bbox": {"l": 69.6796630536824, "t": 104.00000011573796, "r": 504.8720051760782, "b": 124.83139494707741, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "package", "bbox": {"l": 71.84193505100733, "t": 129.797125232046, "r": 153.088934155825, "b": 152.90926970226084, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Docling bundles PDF document conversion to JSON and Markdown in an easy self contained package"}], "body": [{"label": "text", "id": 0, "page_no": 0, "cluster": {"id": 0, "label": "text", "bbox": {"l": 69.6796630536824, "t": 76.99999977896756, "r": 504.8720051760782, "b": 152.90926970226084, "coord_origin": "TOPLEFT"}, "confidence": 0.9715732336044312, "cells": [{"id": 0, "text": "Docling bundles PDF document conversion to", "bbox": {"l": 73.34702132031646, "t": 76.99999977896756, "r": 503.64955224479564, "b": 97.99999977896755, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "JSON and Markdown in an easy self contained", "bbox": {"l": 69.6796630536824, "t": 104.00000011573796, "r": 504.8720051760782, "b": 124.83139494707741, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "package", "bbox": {"l": 71.84193505100733, "t": 129.797125232046, "r": 153.088934155825, "b": 152.90926970226084, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Docling bundles PDF document conversion to JSON and Markdown in an easy self contained package"}], "headers": []}}]
\ No newline at end of file
+[{"page_no": 0, "size": {"width": 595.201171875, "height": 841.9216918945312}, "cells": [{"id": 0, "text": "Docling bundles PDF document conversion to", "bbox": {"l": 71.33333333333333, "t": 74.66666666666667, "r": 506.6666666666667, "b": 99.33333333333333, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "JSON and Markdown in an easy self contained", "bbox": {"l": 69.0, "t": 100.66666666666667, "r": 506.6666666666667, "b": 126.66666666666667, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "package", "bbox": {"l": 70.66666666666667, "t": 128.66666666666666, "r": 154.0, "b": 153.33333333333334, "coord_origin": "TOPLEFT"}}], "predictions": {"layout": {"clusters": [{"id": 0, "label": "text", "bbox": {"l": 69.0, "t": 74.66666666666667, "r": 506.6666666666667, "b": 153.33333333333334, "coord_origin": "TOPLEFT"}, "confidence": 0.9715733528137207, "cells": [{"id": 0, "text": "Docling bundles PDF document conversion to", "bbox": {"l": 71.33333333333333, "t": 74.66666666666667, "r": 506.6666666666667, "b": 99.33333333333333, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "JSON and Markdown in an easy self contained", "bbox": {"l": 69.0, "t": 100.66666666666667, "r": 506.6666666666667, "b": 126.66666666666667, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "package", "bbox": {"l": 70.66666666666667, "t": 128.66666666666666, "r": 154.0, "b": 153.33333333333334, "coord_origin": "TOPLEFT"}}], "children": []}]}, "tablestructure": {"table_map": {}}, "figures_classification": null, "equations_prediction": null}, "assembled": {"elements": [{"label": "text", "id": 0, "page_no": 0, "cluster": {"id": 0, "label": "text", "bbox": {"l": 69.0, "t": 74.66666666666667, "r": 506.6666666666667, "b": 153.33333333333334, "coord_origin": "TOPLEFT"}, "confidence": 0.9715733528137207, "cells": [{"id": 0, "text": "Docling bundles PDF document conversion to", "bbox": {"l": 71.33333333333333, "t": 74.66666666666667, "r": 506.6666666666667, "b": 99.33333333333333, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "JSON and Markdown in an easy self contained", "bbox": {"l": 69.0, "t": 100.66666666666667, "r": 506.6666666666667, "b": 126.66666666666667, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "package", "bbox": {"l": 70.66666666666667, "t": 128.66666666666666, "r": 154.0, "b": 153.33333333333334, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Docling bundles PDF document conversion to JSON and Markdown in an easy self contained package"}], "body": [{"label": "text", "id": 0, "page_no": 0, "cluster": {"id": 0, "label": "text", "bbox": {"l": 69.0, "t": 74.66666666666667, "r": 506.6666666666667, "b": 153.33333333333334, "coord_origin": "TOPLEFT"}, "confidence": 0.9715733528137207, "cells": [{"id": 0, "text": "Docling bundles PDF document conversion to", "bbox": {"l": 71.33333333333333, "t": 74.66666666666667, "r": 506.6666666666667, "b": 99.33333333333333, "coord_origin": "TOPLEFT"}}, {"id": 1, "text": "JSON and Markdown in an easy self contained", "bbox": {"l": 69.0, "t": 100.66666666666667, "r": 506.6666666666667, "b": 126.66666666666667, "coord_origin": "TOPLEFT"}}, {"id": 2, "text": "package", "bbox": {"l": 70.66666666666667, "t": 128.66666666666666, "r": 154.0, "b": 153.33333333333334, "coord_origin": "TOPLEFT"}}], "children": []}, "text": "Docling bundles PDF document conversion to JSON and Markdown in an easy self contained package"}], "headers": []}}]
\ No newline at end of file
diff --git a/tests/test_backend_asciidoc.py b/tests/test_backend_asciidoc.py
index e4fae312..4574a228 100644
--- a/tests/test_backend_asciidoc.py
+++ b/tests/test_backend_asciidoc.py
@@ -20,7 +20,7 @@ def _get_backend(fname):
 
 def test_asciidocs_examples():
 
-    fnames = sorted(glob.glob("./tests/data/*.asciidoc"))
+    fnames = sorted(glob.glob("./tests/data/asciidoc/*.asciidoc"))
 
     for fname in fnames:
         print(f"reading {fname}")
diff --git a/tests/test_backend_csv.py b/tests/test_backend_csv.py
new file mode 100644
index 00000000..252f7c6a
--- /dev/null
+++ b/tests/test_backend_csv.py
@@ -0,0 +1,80 @@
+import json
+import os
+from pathlib import Path
+
+from pytest import warns
+
+from docling.datamodel.base_models import InputFormat
+from docling.datamodel.document import ConversionResult, DoclingDocument
+from docling.document_converter import DocumentConverter
+
+from .verify_utils import verify_document, verify_export
+
+GENERATE = False
+
+
+def get_csv_paths():
+
+    # Define the directory you want to search
+    directory = Path(f"./tests/data/csv/")
+
+    # List all CSV files in the directory and its subdirectories
+    return sorted(directory.rglob("*.csv"))
+
+
+def get_csv_path(name: str):
+
+    # Return the matching CSV file path
+    return Path(f"./tests/data/csv/{name}.csv")
+
+
+def get_converter():
+
+    converter = DocumentConverter(allowed_formats=[InputFormat.CSV])
+
+    return converter
+
+
+def test_e2e_valid_csv_conversions():
+    valid_csv_paths = get_csv_paths()
+    converter = get_converter()
+
+    for csv_path in valid_csv_paths:
+        print(f"converting {csv_path}")
+
+        gt_path = csv_path.parent.parent / "groundtruth" / "docling_v2" / csv_path.name
+
+        conv_result: ConversionResult = converter.convert(csv_path)
+
+        doc: DoclingDocument = conv_result.document
+
+        pred_md: str = doc.export_to_markdown()
+        assert verify_export(pred_md, str(gt_path) + ".md"), "export to md"
+
+        pred_itxt: str = doc._export_to_indented_text(
+            max_text_len=70, explicit_tables=False
+        )
+        assert verify_export(
+            pred_itxt, str(gt_path) + ".itxt"
+        ), "export to indented-text"
+
+        assert verify_document(doc, str(gt_path) + ".json"), "export to json"
+
+
+def test_e2e_invalid_csv_conversions():
+    csv_too_few_columns = get_csv_path("csv-too-few-columns")
+    csv_too_many_columns = get_csv_path("csv-too-many-columns")
+    csv_inconsistent_header = get_csv_path("csv-inconsistent-header")
+    converter = get_converter()
+
+    print(f"converting {csv_too_few_columns}")
+    with warns(UserWarning, match="Inconsistent column lengths"):
+        converter.convert(csv_too_few_columns)
+
+    print(f"converting {csv_too_many_columns}")
+    with warns(UserWarning, match="Inconsistent column lengths"):
+        converter.convert(csv_too_many_columns)
+
+    print(f"converting {csv_inconsistent_header}")
+    with warns(UserWarning, match="Inconsistent column lengths"):
+        converter.convert(csv_inconsistent_header)
diff --git a/tests/test_backend_docling_parse.py b/tests/test_backend_docling_parse.py
index 66e7771d..3c214791 100644
--- a/tests/test_backend_docling_parse.py
+++ b/tests/test_backend_docling_parse.py
@@ -13,7 +13,7 @@ from docling.datamodel.document import InputDocument
 
 @pytest.fixture
 def test_doc_path():
-    return Path("./tests/data/2206.01062.pdf")
+    return Path("./tests/data/pdf/2206.01062.pdf")
 
 
 def _get_backend(pdf_doc):
@@ -28,7 +28,7 @@ def _get_backend(pdf_doc):
 
 
 def test_text_cell_counts():
-    pdf_doc = Path("./tests/data/redp5110_sampled.pdf")
+    pdf_doc = Path("./tests/data/pdf/redp5110_sampled.pdf")
 
     doc_backend = _get_backend(pdf_doc)
 
diff --git a/tests/test_backend_docling_parse_v2.py b/tests/test_backend_docling_parse_v2.py
index 087272bf..ee0e5c75 100644
--- a/tests/test_backend_docling_parse_v2.py
+++ b/tests/test_backend_docling_parse_v2.py
@@ -12,7 +12,7 @@ from docling.datamodel.document import InputDocument
 
 @pytest.fixture
 def test_doc_path():
-    return Path("./tests/data/2206.01062.pdf")
+    return Path("./tests/data/pdf/2206.01062.pdf")
 
 
 def _get_backend(pdf_doc):
@@ -27,7 +27,7 @@ def _get_backend(pdf_doc):
 
 
 def test_text_cell_counts():
-    pdf_doc = Path("./tests/data/redp5110_sampled.pdf")
+    pdf_doc = Path("./tests/data/pdf/redp5110_sampled.pdf")
 
     doc_backend = _get_backend(pdf_doc)
 
diff --git a/tests/test_backend_html.py b/tests/test_backend_html.py
index a4deb212..29518682 100644
--- a/tests/test_backend_html.py
+++ b/tests/test_backend_html.py
@@ -1,5 +1,4 @@
-import json
-import os
+from io import BytesIO
 from pathlib import Path
 
 from docling.backend.html_backend import HTMLDocumentBackend
@@ -12,6 +11,8 @@ from docling.datamodel.document import (
 )
 from docling.document_converter import DocumentConverter
 
+from .verify_utils import verify_document, verify_export
+
 GENERATE = False
 
 
@@ -40,6 +41,62 @@ def test_heading_levels():
     assert found_lvl_2 and found_lvl_3
 
 
+def test_ordered_lists():
+    test_set: list[tuple[bytes, str]] = []
+
+    test_set.append(
+        (
+            b"<html><body><ol><li>1st item</li><li>2nd item</li></ol></body></html>",
+            "1. 1st item\n2. 2nd item",
+        )
+    )
+    test_set.append(
+        (
+            b'<html><body><ol start="1"><li>1st item</li><li>2nd item</li></ol></body></html>',
+            "1. 1st item\n2. 2nd item",
+        )
+    )
+    test_set.append(
+        (
+            b'<html><body><ol start="2"><li>1st item</li><li>2nd item</li></ol></body></html>',
+            "2. 1st item\n3. 2nd item",
+        )
+    )
+    test_set.append(
+        (
+            b'<html><body><ol start="0"><li>1st item</li><li>2nd item</li></ol></body></html>',
+            "0. 1st item\n1. 2nd item",
+        )
+    )
+    test_set.append(
+        (
+            b'<html><body><ol start="-5"><li>1st item</li><li>2nd item</li></ol></body></html>',
+            "1. 1st item\n2. 2nd item",
+        )
+    )
+    test_set.append(
+        (
+            b'<html><body><ol start="foo"><li>1st item</li><li>2nd item</li></ol></body></html>',
+            "1. 1st item\n2. 2nd item",
+        )
+    )
+
+    for idx, pair in enumerate(test_set):
+        in_doc = InputDocument(
+            path_or_stream=BytesIO(pair[0]),
+            format=InputFormat.HTML,
+            backend=HTMLDocumentBackend,
+            filename="test",
+        )
+        backend = HTMLDocumentBackend(
+            in_doc=in_doc,
+            path_or_stream=BytesIO(pair[0]),
+        )
+        doc: DoclingDocument = backend.convert()
+        assert doc
+        assert doc.export_to_markdown() == pair[1], f"Error in case {idx}"
+
+
 def get_html_paths():
 
     # Define the directory you want to search
@@ -57,22 +114,6 @@ def get_converter():
     return converter
 
 
-def verify_export(pred_text: str, gtfile: str):
-
-    if not os.path.exists(gtfile) or GENERATE:
-        with open(gtfile, "w") as fw:
-            fw.write(pred_text)
-
-        return True
-
-    else:
-        with open(gtfile, "r") as fr:
-            true_text = fr.read()
-
-        assert pred_text == true_text, f"pred_text!=true_text for {gtfile}"
-        return pred_text == true_text
-
-
 def test_e2e_html_conversions():
 
     html_paths = get_html_paths()
@@ -99,5 +140,4 @@ def test_e2e_html_conversions():
             pred_itxt, str(gt_path) + ".itxt"
         ), "export to indented-text"
 
-        pred_json: str = json.dumps(doc.export_to_dict(), indent=2)
-        assert verify_export(pred_json, str(gt_path) + ".json"), "export to json"
+        assert verify_document(doc, str(gt_path) + ".json", GENERATE)
diff --git a/tests/test_backend_pubmed.py b/tests/test_backend_jats.py
similarity index 76%
rename from tests/test_backend_pubmed.py
rename to tests/test_backend_jats.py
index 8481c3dd..a338e32c 100644
--- a/tests/test_backend_pubmed.py
+++ b/tests/test_backend_jats.py
@@ -1,4 +1,3 @@
-import json
 import os
 from io import BytesIO
 from pathlib import Path
@@ -9,6 +8,8 @@ from docling.datamodel.base_models import DocumentStream, InputFormat
 from docling.datamodel.document import ConversionResult
 from docling.document_converter import DocumentConverter
 
+from .verify_utils import verify_document, verify_export
+
 GENERATE = False
 
 
@@ -19,22 +20,10 @@ def get_pubmed_paths():
 
 
 def get_converter():
-    converter = DocumentConverter(allowed_formats=[InputFormat.XML_PUBMED])
+    converter = DocumentConverter(allowed_formats=[InputFormat.XML_JATS])
     return converter
 
 
-def verify_export(pred_text: str, gtfile: str):
-    if not os.path.exists(gtfile) or GENERATE:
-        with open(gtfile, "w") as fw:
-            fw.write(pred_text)
-        return True
-    else:
-        with open(gtfile, "r") as fr:
-            true_text = fr.read()
-        assert pred_text == true_text, f"pred_text!=true_text for {gtfile}"
-        return pred_text == true_text
-
-
 def test_e2e_pubmed_conversions(use_stream=False):
     pubmed_paths = get_pubmed_paths()
     converter = get_converter()
@@ -61,8 +50,7 @@ def test_e2e_pubmed_conversions(use_stream=False):
             pred_itxt, str(gt_path) + ".itxt"
         ), "export to indented-text"
 
-        pred_json: str = json.dumps(doc.export_to_dict(), indent=2)
-        assert verify_export(pred_json, str(gt_path) + ".json"), "export to json"
+        assert verify_document(doc, str(gt_path) + ".json", GENERATE), "export to json"
 
 
 def test_e2e_pubmed_conversions_stream():
diff --git a/tests/test_backend_markdown.py b/tests/test_backend_markdown.py
index caa94d9f..5a201ab2 100644
--- a/tests/test_backend_markdown.py
+++ b/tests/test_backend_markdown.py
@@ -4,6 +4,8 @@ from docling.backend.md_backend import MarkdownDocumentBackend
 from docling.datamodel.base_models import InputFormat
 from docling.datamodel.document import InputDocument
 
+from .test_data_gen_flag import GEN_TEST_DATA
+
 
 def test_convert_valid():
     fmt = InputFormat.MD
@@ -30,6 +32,10 @@ def test_convert_valid():
         act_doc = backend.convert()
         act_data = act_doc.export_to_markdown()
 
-        with open(gt_path, "r", encoding="utf-8") as f:
-            exp_data = f.read().rstrip()
-        assert act_data == exp_data
+        if GEN_TEST_DATA:
+            with open(gt_path, mode="w", encoding="utf-8") as f:
+                f.write(f"{act_data}\n")
+        else:
+            with open(gt_path, encoding="utf-8") as f:
+                exp_data = f.read().rstrip()
+            assert exp_data == act_data
diff --git a/tests/test_backend_msexcel.py b/tests/test_backend_msexcel.py
index f33dffa2..549088ee 100644
--- a/tests/test_backend_msexcel.py
+++ b/tests/test_backend_msexcel.py
@@ -1,4 +1,3 @@
-import json
 import os
 from pathlib import Path
 
@@ -6,6 +5,8 @@ from docling.datamodel.base_models import InputFormat
 from docling.datamodel.document import ConversionResult, DoclingDocument
 from docling.document_converter import DocumentConverter
 
+from .verify_utils import verify_document, verify_export
+
 GENERATE = False
 
 
@@ -26,22 +27,6 @@ def get_converter():
     return converter
 
 
-def verify_export(pred_text: str, gtfile: str):
-
-    if not os.path.exists(gtfile) or GENERATE:
-        with open(gtfile, "w") as fw:
-            fw.write(pred_text)
-
-        return True
-
-    else:
-        with open(gtfile, "r") as fr:
-            true_text = fr.read()
-
-        assert pred_text == true_text, "pred_itxt==true_itxt"
-        return pred_text == true_text
-
-
 def test_e2e_xlsx_conversions():
 
     xlsx_paths = get_xlsx_paths()
@@ -68,5 +53,6 @@ def test_e2e_xlsx_conversions():
             pred_itxt, str(gt_path) + ".itxt"
         ), "export to indented-text"
 
-        pred_json: str = json.dumps(doc.export_to_dict(), indent=2)
-        assert verify_export(pred_json, str(gt_path) + ".json"), "export to json"
+        assert verify_document(
+            doc, str(gt_path) + ".json", GENERATE
+        ), "document document"
diff --git a/tests/test_backend_msword.py b/tests/test_backend_msword.py
index 9edcb3e6..83251a5f 100644
--- a/tests/test_backend_msword.py
+++ b/tests/test_backend_msword.py
@@ -1,4 +1,3 @@
-import json
 import os
 from pathlib import Path
 
@@ -12,6 +11,8 @@ from docling.datamodel.document import (
 )
 from docling.document_converter import DocumentConverter
 
+from .verify_utils import verify_document, verify_export
+
 GENERATE = False
 
 
@@ -57,22 +58,6 @@ def get_converter():
     return converter
 
 
-def verify_export(pred_text: str, gtfile: str):
-
-    if not os.path.exists(gtfile) or GENERATE:
-        with open(gtfile, "w") as fw:
-            fw.write(pred_text)
-
-        return True
-
-    else:
-        with open(gtfile, "r") as fr:
-            true_text = fr.read()
-
-        assert pred_text == true_text, "pred_itxt==true_itxt"
-        return pred_text == true_text
-
-
 def test_e2e_docx_conversions():
 
     docx_paths = get_docx_paths()
@@ -99,5 +84,10 @@ def test_e2e_docx_conversions():
             pred_itxt, str(gt_path) + ".itxt"
         ), "export to indented-text"
 
-        pred_json: str = json.dumps(doc.export_to_dict(), indent=2)
-        assert verify_export(pred_json, str(gt_path) + ".json"), "export to json"
+        assert verify_document(
+            doc, str(gt_path) + ".json", GENERATE
+        ), "document document"
+
+        if docx_path.name == "word_tables.docx":
+            pred_html: str = doc.export_to_html()
+            assert verify_export(pred_html, str(gt_path) + ".html"), "export to html"
diff --git a/tests/test_backend_patent_uspto.py b/tests/test_backend_patent_uspto.py
index 21bc88c5..002aa712 100644
--- a/tests/test_backend_patent_uspto.py
+++ b/tests/test_backend_patent_uspto.py
@@ -1,6 +1,5 @@
 """Test methods in module docling.backend.patent_uspto_backend.py."""
 
-import json
 import logging
 import os
 from pathlib import Path
@@ -14,7 +13,9 @@ from docling.backend.xml.uspto_backend import PatentUsptoDocumentBackend, XmlTab
 from docling.datamodel.base_models import InputFormat
 from docling.datamodel.document import InputDocument
 
-GENERATE: bool = True
+from .verify_utils import verify_document
+
+GENERATE: bool = False
 DATA_PATH: Path = Path("./tests/data/uspto/")
 GT_PATH: Path = Path("./tests/data/groundtruth/docling_v2/")
 
@@ -110,12 +111,11 @@ def test_patent_groundtruth(patents, groundtruth):
             assert (
                 pred_md == gt_names[md_name]
             ), f"Markdown file mismatch against groundtruth {md_name}"
-        json_name = path.stem + ".json"
-        if json_name in gt_names:
-            pred_json = json.dumps(doc.export_to_dict(), indent=2)
-            assert (
-                pred_json == gt_names[json_name]
-            ), f"JSON file mismatch against groundtruth {json_name}"
+        json_path = path.with_suffix(".json")
+        if json_path.stem in gt_names:
+            assert verify_document(
+                doc, str(json_path), GENERATE
+            ), f"JSON file mismatch against groundtruth {json_path}"
         itxt_name = path.stem + ".itxt"
         if itxt_name in gt_names:
             pred_itxt = doc._export_to_indented_text()
diff --git a/tests/test_backend_pdfium.py b/tests/test_backend_pdfium.py
index b2a77dcd..10a2b9e7 100644
--- a/tests/test_backend_pdfium.py
+++ b/tests/test_backend_pdfium.py
@@ -13,7 +13,7 @@ from docling.datamodel.document import InputDocument
 
 @pytest.fixture
 def test_doc_path():
-    return Path("./tests/data/2206.01062.pdf")
+    return Path("./tests/data/pdf/2206.01062.pdf")
 
 
 def _get_backend(pdf_doc):
@@ -28,7 +28,7 @@ def _get_backend(pdf_doc):
 
 
 def test_text_cell_counts():
-    pdf_doc = Path("./tests/data/redp5110_sampled.pdf")
+    pdf_doc = Path("./tests/data/pdf/redp5110_sampled.pdf")
 
     doc_backend = _get_backend(pdf_doc)
 
diff --git a/tests/test_backend_pptx.py b/tests/test_backend_pptx.py
index f4799a83..5f6129f6 100644
--- a/tests/test_backend_pptx.py
+++ b/tests/test_backend_pptx.py
@@ -1,4 +1,3 @@
-import json
 import os
 from pathlib import Path
 
@@ -6,6 +5,8 @@ from docling.datamodel.base_models import InputFormat
 from docling.datamodel.document import ConversionResult, DoclingDocument
 from docling.document_converter import DocumentConverter
 
+from .verify_utils import verify_document, verify_export
+
 GENERATE = False
 
 
@@ -26,22 +27,6 @@ def get_converter():
     return converter
 
 
-def verify_export(pred_text: str, gtfile: str):
-
-    if not os.path.exists(gtfile) or GENERATE:
-        with open(gtfile, "w") as fw:
-            fw.write(pred_text)
-
-        return True
-
-    else:
-        with open(gtfile, "r") as fr:
-            true_text = fr.read()
-
-        assert pred_text == true_text, "pred_itxt==true_itxt"
-        return pred_text == true_text
-
-
 def test_e2e_pptx_conversions():
 
     pptx_paths = get_pptx_paths()
@@ -68,5 +53,6 @@ def test_e2e_pptx_conversions():
             pred_itxt, str(gt_path) + ".itxt"
         ), "export to indented-text"
 
-        pred_json: str = json.dumps(doc.export_to_dict(), indent=2)
-        assert verify_export(pred_json, str(gt_path) + ".json"), "export to json"
+        assert verify_document(
+            doc, str(gt_path) + ".json", GENERATE
+        ), "document document"
diff --git a/tests/test_cli.py b/tests/test_cli.py
index 71d14457..4364df8b 100644
--- a/tests/test_cli.py
+++ b/tests/test_cli.py
@@ -18,7 +18,7 @@ def test_cli_version():
 
 
 def test_cli_convert(tmp_path):
-    source = "./tests/data/2305.03393v1-pg9.pdf"
+    source = "./tests/data/pdf/2305.03393v1-pg9.pdf"
     output = tmp_path / "out"
     output.mkdir()
     result = runner.invoke(app, [source, "--output", str(output)])
diff --git a/tests/test_code_formula.py b/tests/test_code_formula.py
index 05e87246..ac7a1587 100644
--- a/tests/test_code_formula.py
+++ b/tests/test_code_formula.py
@@ -36,7 +36,7 @@ def get_converter():
 
 
 def test_code_and_formula_conversion():
-    pdf_path = Path("tests/data/code_and_formula.pdf")
+    pdf_path = Path("tests/data/pdf/code_and_formula.pdf")
     converter = get_converter()
 
     print(f"converting {pdf_path}")
@@ -48,11 +48,11 @@ def test_code_and_formula_conversion():
     code_blocks = [el for el in results if isinstance(el, CodeItem)]
     assert len(code_blocks) == 1
 
-    gt = 'public static void print() {\n    System.out.println("Java Code");\n}'
+    gt = "function add(a, b) {\n    return a + b;\n}\nconsole.log(add(3, 5));"
 
     predicted = code_blocks[0].text.strip()
     assert predicted == gt, f"mismatch in text {predicted=}, {gt=}"
-    assert code_blocks[0].code_language == CodeLanguageLabel.JAVA
+    assert code_blocks[0].code_language == CodeLanguageLabel.JAVASCRIPT
 
     formula_blocks = [
         el
diff --git a/tests/test_data_gen_flag.py b/tests/test_data_gen_flag.py
new file mode 100644
index 00000000..a4baff66
--- /dev/null
+++ b/tests/test_data_gen_flag.py
@@ -0,0 +1,9 @@
+import os
+
+from pydantic import TypeAdapter
+
+GEN_TEST_DATA = TypeAdapter(bool).validate_python(os.getenv("DOCLING_GEN_TEST_DATA", 0))
+
+
+def test_gen_test_data_flag():
+    assert not GEN_TEST_DATA
diff --git a/tests/test_document_picture_classifier.py b/tests/test_document_picture_classifier.py
index 0ad87e96..6ca54d63 100644
--- a/tests/test_document_picture_classifier.py
+++ b/tests/test_document_picture_classifier.py
@@ -37,7 +37,7 @@ def get_converter():
 
 
 def test_picture_classifier():
-    pdf_path = Path("tests/data/picture_classification.pdf")
+    pdf_path = Path("tests/data/pdf/picture_classification.pdf")
     converter = get_converter()
 
     print(f"converting {pdf_path}")
diff --git a/tests/test_e2e_conversion.py b/tests/test_e2e_conversion.py
index 0c572595..d2215d61 100644
--- a/tests/test_e2e_conversion.py
+++ b/tests/test_e2e_conversion.py
@@ -15,7 +15,7 @@ GENERATE_V2 = False
 def get_pdf_paths():
 
     # Define the directory you want to search
-    directory = Path("./tests/data")
+    directory = Path("./tests/data/pdf/")
 
     # List all PDF files in the directory and its subdirectories
     pdf_files = sorted(directory.rglob("*.pdf"))
diff --git a/tests/test_input_doc.py b/tests/test_input_doc.py
index f6c516aa..198dc965 100644
--- a/tests/test_input_doc.py
+++ b/tests/test_input_doc.py
@@ -4,11 +4,12 @@ from pathlib import Path
 from docling.backend.pypdfium2_backend import PyPdfiumDocumentBackend
 from docling.datamodel.base_models import DocumentStream, InputFormat
 from docling.datamodel.document import InputDocument, _DocumentConversionInput
+from docling.datamodel.settings import DocumentLimits
 
 
 def test_in_doc_from_valid_path():
 
-    test_doc_path = Path("./tests/data/2206.01062.pdf")
+    test_doc_path = Path("./tests/data/pdf/2206.01062.pdf")
     doc = _make_input_doc(test_doc_path)
     assert doc.valid == True
 
@@ -23,7 +24,7 @@ def test_in_doc_from_invalid_path():
 
 def test_in_doc_from_valid_buf():
 
-    buf = BytesIO(Path("./tests/data/2206.01062.pdf").open("rb").read())
+    buf = BytesIO(Path("./tests/data/pdf/2206.01062.pdf").open("rb").read())
     stream = DocumentStream(name="my_doc.pdf", stream=buf)
 
     doc = _make_input_doc_from_stream(stream)
@@ -39,6 +40,40 @@ def test_in_doc_from_invalid_buf():
     assert doc.valid == False
 
 
+def test_in_doc_with_page_range():
+    test_doc_path = Path("./tests/data/pdf/2206.01062.pdf")
+    limits = DocumentLimits()
+    limits.page_range = (1, 10)
+
+    doc = InputDocument(
+        path_or_stream=test_doc_path,
+        format=InputFormat.PDF,
+        backend=PyPdfiumDocumentBackend,
+        limits=limits,
+    )
+    assert doc.valid == True
+
+    limits.page_range = (9, 9)
+
+    doc = InputDocument(
+        path_or_stream=test_doc_path,
+        format=InputFormat.PDF,
+        backend=PyPdfiumDocumentBackend,
+        limits=limits,
+    )
+    assert doc.valid == True
+
+    limits.page_range = (11, 12)
+
+    doc = InputDocument(
+        path_or_stream=test_doc_path,
+        format=InputFormat.PDF,
+        backend=PyPdfiumDocumentBackend,
+        limits=limits,
+    )
+    assert doc.valid == False
+
+
 def test_guess_format(tmp_path):
     """Test docling.datamodel.document._DocumentConversionInput.__guess_format"""
     dci = _DocumentConversionInput(path_or_stream_iterator=[])
@@ -46,10 +81,10 @@ def test_guess_format(tmp_path):
     temp_dir.mkdir()
 
     # Valid PDF
-    buf = BytesIO(Path("./tests/data/2206.01062.pdf").open("rb").read())
+    buf = BytesIO(Path("./tests/data/pdf/2206.01062.pdf").open("rb").read())
     stream = DocumentStream(name="my_doc.pdf", stream=buf)
     assert dci._guess_format(stream) == InputFormat.PDF
-    doc_path = Path("./tests/data/2206.01062.pdf")
+    doc_path = Path("./tests/data/pdf/2206.01062.pdf")
     assert dci._guess_format(doc_path) == InputFormat.PDF
 
     # Valid MS Office
@@ -73,6 +108,15 @@ def test_guess_format(tmp_path):
     doc_path = Path("./tests/data/md/wiki.md")
     assert dci._guess_format(doc_path) == InputFormat.MD
 
+    # Valid CSV
+    buf = BytesIO(Path("./tests/data/csv/csv-comma.csv").open("rb").read())
+    stream = DocumentStream(name="csv-comma.csv", stream=buf)
+    assert dci._guess_format(stream) == InputFormat.CSV
+    stream = DocumentStream(name="test-comma", stream=buf)
+    assert dci._guess_format(stream) == InputFormat.CSV
+    doc_path = Path("./tests/data/csv/csv-comma.csv")
+    assert dci._guess_format(doc_path) == InputFormat.CSV
+
     # Valid XML USPTO patent
     buf = BytesIO(Path("./tests/data/uspto/ipa20110039701.xml").open("rb").read())
     stream = DocumentStream(name="ipa20110039701.xml", stream=buf)
@@ -86,24 +130,24 @@ def test_guess_format(tmp_path):
     doc_path = Path("./tests/data/uspto/pftaps057006474.txt")
     assert dci._guess_format(doc_path) == InputFormat.XML_USPTO
 
-    # Valid XML PubMed
-    buf = BytesIO(Path("./tests/data/pubmed/elife-56337.xml").open("rb").read())
+    # Valid XML JATS
+    buf = BytesIO(Path("./tests/data/jats/elife-56337.xml").open("rb").read())
     stream = DocumentStream(name="elife-56337.xml", stream=buf)
-    assert dci._guess_format(stream) == InputFormat.XML_PUBMED
-    doc_path = Path("./tests/data/pubmed/elife-56337.xml")
-    assert dci._guess_format(doc_path) == InputFormat.XML_PUBMED
+    assert dci._guess_format(stream) == InputFormat.XML_JATS
+    doc_path = Path("./tests/data/jats/elife-56337.xml")
+    assert dci._guess_format(doc_path) == InputFormat.XML_JATS
 
-    buf = BytesIO(Path("./tests/data/pubmed/elife-56337.nxml").open("rb").read())
+    buf = BytesIO(Path("./tests/data/jats/elife-56337.nxml").open("rb").read())
     stream = DocumentStream(name="elife-56337.nxml", stream=buf)
-    assert dci._guess_format(stream) == InputFormat.XML_PUBMED
-    doc_path = Path("./tests/data/pubmed/elife-56337.nxml")
-    assert dci._guess_format(doc_path) == InputFormat.XML_PUBMED
+    assert dci._guess_format(stream) == InputFormat.XML_JATS
+    doc_path = Path("./tests/data/jats/elife-56337.nxml")
+    assert dci._guess_format(doc_path) == InputFormat.XML_JATS
 
-    buf = BytesIO(Path("./tests/data/pubmed/elife-56337.txt").open("rb").read())
+    buf = BytesIO(Path("./tests/data/jats/elife-56337.txt").open("rb").read())
     stream = DocumentStream(name="elife-56337.txt", stream=buf)
-    assert dci._guess_format(stream) == InputFormat.XML_PUBMED
-    doc_path = Path("./tests/data/pubmed/elife-56337.txt")
-    assert dci._guess_format(doc_path) == InputFormat.XML_PUBMED
+    assert dci._guess_format(stream) == InputFormat.XML_JATS
+    doc_path = Path("./tests/data/jats/elife-56337.txt")
+    assert dci._guess_format(doc_path) == InputFormat.XML_JATS
 
     # Valid XML, non-supported flavor
     xml_content = (
diff --git a/tests/test_interfaces.py b/tests/test_interfaces.py
index 23bc3345..1978bc74 100644
--- a/tests/test_interfaces.py
+++ b/tests/test_interfaces.py
@@ -15,7 +15,7 @@ GENERATE = False
 
 def get_pdf_path():
 
-    pdf_path = Path("./tests/data/2305.03393v1-pg9.pdf")
+    pdf_path = Path("./tests/data/pdf/2305.03393v1-pg9.pdf")
     return pdf_path
 
 
diff --git a/tests/test_invalid_input.py b/tests/test_invalid_input.py
index f40d79e4..68716cba 100644
--- a/tests/test_invalid_input.py
+++ b/tests/test_invalid_input.py
@@ -9,7 +9,7 @@ from docling.document_converter import ConversionError, DocumentConverter
 
 def get_pdf_path():
 
-    pdf_path = Path("./tests/data/2305.03393v1-pg9.pdf")
+    pdf_path = Path("./tests/data/pdf/2305.03393v1-pg9.pdf")
     return pdf_path
 
 
diff --git a/tests/test_legacy_format_transform.py b/tests/test_legacy_format_transform.py
index 28800edd..215253d2 100644
--- a/tests/test_legacy_format_transform.py
+++ b/tests/test_legacy_format_transform.py
@@ -16,7 +16,7 @@ def test_doc_paths():
         Path("tests/data/docx/lorem_ipsum.docx"),
         Path("tests/data/pptx/powerpoint_sample.pptx"),
         Path("tests/data/2305.03393v1-pg9-img.png"),
-        Path("tests/data/2206.01062.pdf"),
+        Path("tests/data/pdf/2206.01062.pdf"),
     ]
 
 
diff --git a/tests/test_options.py b/tests/test_options.py
index 8d861e48..c8701a1b 100644
--- a/tests/test_options.py
+++ b/tests/test_options.py
@@ -17,7 +17,7 @@ from docling.document_converter import DocumentConverter, PdfFormatOption
 
 @pytest.fixture
 def test_doc_path():
-    return Path("./tests/data/2206.01062.pdf")
+    return Path("./tests/data/pdf/2206.01062.pdf")
 
 
 def get_converters_with_table_options():
@@ -105,6 +105,20 @@ def test_e2e_conversions(test_doc_path):
         assert doc_result.status == ConversionStatus.SUCCESS
 
 
+def test_page_range(test_doc_path):
+    converter = DocumentConverter()
+    doc_result: ConversionResult = converter.convert(test_doc_path, page_range=(9, 9))
+
+    assert doc_result.status == ConversionStatus.SUCCESS
+    assert doc_result.input.page_count == 9
+    assert doc_result.document.num_pages() == 1
+
+    doc_result: ConversionResult = converter.convert(
+        test_doc_path, page_range=(10, 10), raises_on_error=False
+    )
+    assert doc_result.status == ConversionStatus.FAILURE
+
+
 def test_ocr_coverage_threshold(test_doc_path):
     pipeline_options = PdfPipelineOptions()
     pipeline_options.do_ocr = True
diff --git a/tests/verify_utils.py b/tests/verify_utils.py
index c444266b..45152e0a 100644
--- a/tests/verify_utils.py
+++ b/tests/verify_utils.py
@@ -1,10 +1,18 @@
 import json
+import os
 import warnings
 from pathlib import Path
-from typing import List
+from typing import List, Optional
 
-from docling_core.types.doc import DoclingDocument
+from docling_core.types.doc import (
+    DocItem,
+    DoclingDocument,
+    PictureItem,
+    TableItem,
+    TextItem,
+)
 from docling_core.types.legacy_doc.document import ExportedCCSDocument as DsDocument
+from PIL import Image as PILImage
 from pydantic import TypeAdapter
 from pydantic.json import pydantic_encoder
 
@@ -153,64 +161,58 @@ def verify_tables_v1(doc_pred: DsDocument, doc_true: DsDocument, fuzzy: bool):
     return True
 
 
-def verify_tables_v2(doc_pred: DoclingDocument, doc_true: DoclingDocument, fuzzy: bool):
-    if not len(doc_true.tables) > 0:
-        # No tables to check
-        assert len(doc_pred.tables) == 0, "not expecting any table on this document"
-        return True
-    else:
-        assert len(doc_pred.tables) > 0, "no tables predicted, but expected in doc_true"
+def verify_table_v2(true_item: TableItem, pred_item: TableItem, fuzzy: bool):
+    assert (
+        true_item.data.num_rows == pred_item.data.num_rows
+    ), "table does not have the same #-rows"
+    assert (
+        true_item.data.num_cols == pred_item.data.num_cols
+    ), "table does not have the same #-cols"
 
-    # print("Expected number of tables: {}, result: {}".format(len(doc_true.tables), len(doc_pred.tables)))
+    assert true_item.data is not None, "documents are expected to have table data"
+    assert pred_item.data is not None, "documents are expected to have table data"
 
-    assert len(doc_true.tables) == len(
-        doc_pred.tables
-    ), "document has different count of tables than expected."
+    # print("True: \n", true_item.export_to_dataframe().to_markdown())
+    # print("Pred: \n", true_item.export_to_dataframe().to_markdown())
 
-    for l, true_item in enumerate(doc_true.tables):
-        pred_item = doc_pred.tables[l]
+    for i, row in enumerate(true_item.data.grid):
+        for j, col in enumerate(true_item.data.grid[i]):
 
-        assert (
-            true_item.data.num_rows == pred_item.data.num_rows
-        ), "table does not have the same #-rows"
-        assert (
-            true_item.data.num_cols == pred_item.data.num_cols
-        ), "table does not have the same #-cols"
+            # print("true: ", true_item.data[i][j].text)
+            # print("pred: ", pred_item.data[i][j].text)
+            # print("")
 
-        assert true_item.data is not None, "documents are expected to have table data"
-        assert pred_item.data is not None, "documents are expected to have table data"
+            verify_text(
+                true_item.data.grid[i][j].text,
+                pred_item.data.grid[i][j].text,
+                fuzzy=fuzzy,
+            )
 
-        print("True: \n", true_item.export_to_dataframe().to_markdown())
-        print("Pred: \n", true_item.export_to_dataframe().to_markdown())
+            assert (
+                true_item.data.grid[i][j].column_header
+                == pred_item.data.grid[i][j].column_header
+            ), "table-cell should be a column_header but prediction isn't"
 
-        for i, row in enumerate(true_item.data.grid):
-            for j, col in enumerate(true_item.data.grid[i]):
+            assert (
+                true_item.data.grid[i][j].row_header
+                == pred_item.data.grid[i][j].row_header
+            ), "table-cell should be a row_header but prediction isn't"
 
-                # print("true: ", true_item.data[i][j].text)
-                # print("pred: ", pred_item.data[i][j].text)
-                # print("")
+            assert (
+                true_item.data.grid[i][j].row_section
+                == pred_item.data.grid[i][j].row_section
+            ), "table-cell should be a row_section but prediction isn't"
 
-                verify_text(
-                    true_item.data.grid[i][j].text,
-                    pred_item.data.grid[i][j].text,
-                    fuzzy=fuzzy,
-                )
+    return True
 
-                assert (
-                    true_item.data.grid[i][j].column_header
-                    == pred_item.data.grid[i][j].column_header
-                ), "table-cell should be a column_header but prediction isn't"
-
-                assert (
-                    true_item.data.grid[i][j].row_header
-                    == pred_item.data.grid[i][j].row_header
-                ), "table-cell should be a row_header but prediction isn't"
-
-                assert (
-                    true_item.data.grid[i][j].row_section
-                    == pred_item.data.grid[i][j].row_section
-                ), "table-cell should be a row_section but prediction isn't"
 
+def verify_picture_image_v2(
+    true_image: PILImage.Image, pred_item: Optional[PILImage.Image]
+):
+    assert pred_item is not None, "predicted image is None"
+    assert true_image.size == pred_item.size
+    assert true_image.mode == pred_item.mode
+    # assert true_image.tobytes() == pred_item.tobytes()
     return True
 
 
@@ -220,6 +222,70 @@ def verify_tables_v2(doc_pred: DoclingDocument, doc_true: DoclingDocument, fuzzy
 #     return True
 
 
+def verify_docitems(doc_pred: DoclingDocument, doc_true: DoclingDocument, fuzzy: bool):
+    assert len(doc_pred.texts) == len(doc_true.texts), f"Text lengths do not match."
+
+    assert len(doc_true.tables) == len(
+        doc_pred.tables
+    ), "document has different count of tables than expected."
+
+    for (true_item, _true_level), (pred_item, _pred_level) in zip(
+        doc_true.iterate_items(), doc_pred.iterate_items()
+    ):
+        if not isinstance(true_item, DocItem):
+            continue
+        assert isinstance(pred_item, DocItem), "Test item is not a DocItem"
+
+        # Validate type
+        assert true_item.label == pred_item.label, f"Object label does not match."
+
+        # Validate provenance
+        assert len(true_item.prov) == len(pred_item.prov), "Length of prov mismatch"
+        if len(true_item.prov) > 0:
+            true_prov = true_item.prov[0]
+            pred_prov = pred_item.prov[0]
+
+            assert true_prov.page_no == pred_prov.page_no, "Page provenance mistmatch"
+
+            # TODO: add bbox check with tolerance
+
+        # Validate text content
+        if isinstance(true_item, TextItem):
+            assert isinstance(pred_item, TextItem), (
+                "Test item is not a TextItem as the expected one "
+                f"{true_item=} "
+                f"{pred_item=} "
+            )
+
+            assert verify_text(true_item.text, pred_item.text, fuzzy=fuzzy)
+
+        # Validate table content
+        if isinstance(true_item, TableItem):
+            assert isinstance(
+                pred_item, TableItem
+            ), "Test item is not a TableItem as the expected one"
+            assert verify_table_v2(
+                true_item, pred_item, fuzzy=fuzzy
+            ), "Tables not matching"
+
+        # Validate picture content
+        if isinstance(true_item, PictureItem):
+            assert isinstance(
+                pred_item, PictureItem
+            ), "Test item is not a PictureItem as the expected one"
+
+            true_image = true_item.get_image(doc=doc_true)
+            pred_image = true_item.get_image(doc=doc_pred)
+            if true_image is not None:
+                assert verify_picture_image_v2(
+                    true_image, pred_image
+                ), "Picture image mismatch"
+
+            # TODO: check picture annotations
+
+    return True
+
+
 def verify_md(doc_pred_md: str, doc_true_md: str, fuzzy: bool):
     return verify_text(doc_true_md, doc_pred_md, fuzzy)
 
@@ -249,7 +315,13 @@ def verify_conversion_result_v1(
         doc_pred_dt = doc_result.legacy_document.export_to_document_tokens()
 
     engine_suffix = "" if ocr_engine is None else f".{ocr_engine}"
+
     gt_subpath = input_path.parent / "groundtruth" / "docling_v1" / input_path.name
+    if str(input_path.parent).endswith("pdf"):
+        gt_subpath = (
+            input_path.parent.parent / "groundtruth" / "docling_v1" / input_path.name
+        )
+
     pages_path = gt_subpath.with_suffix(f"{engine_suffix}.pages.json")
     json_path = gt_subpath.with_suffix(f"{engine_suffix}.json")
     md_path = gt_subpath.with_suffix(f"{engine_suffix}.md")
@@ -325,7 +397,13 @@ def verify_conversion_result_v2(
     doc_pred_dt = doc_result.document.export_to_document_tokens()
 
     engine_suffix = "" if ocr_engine is None else f".{ocr_engine}"
+
     gt_subpath = input_path.parent / "groundtruth" / "docling_v2" / input_path.name
+    if str(input_path.parent).endswith("pdf"):
+        gt_subpath = (
+            input_path.parent.parent / "groundtruth" / "docling_v2" / input_path.name
+        )
+
     pages_path = gt_subpath.with_suffix(f"{engine_suffix}.pages.json")
     json_path = gt_subpath.with_suffix(f"{engine_suffix}.json")
     md_path = gt_subpath.with_suffix(f"{engine_suffix}.md")
@@ -369,9 +447,9 @@ def verify_conversion_result_v2(
         #    doc_pred, doc_true
         # ), f"Mismatch in JSON prediction for {input_path}"
 
-        assert verify_tables_v2(
+        assert verify_docitems(
             doc_pred, doc_true, fuzzy=fuzzy
-        ), f"verify_tables(doc_pred, doc_true) mismatch for {input_path}"
+        ), f"verify_docling_document(doc_pred, doc_true) mismatch for {input_path}"
 
         assert verify_md(
             doc_pred_md, doc_true_md, fuzzy=fuzzy
@@ -380,3 +458,31 @@ def verify_conversion_result_v2(
         assert verify_dt(
             doc_pred_dt, doc_true_dt, fuzzy=fuzzy
         ), f"Mismatch in DocTags prediction for {input_path}"
+
+
+def verify_document(pred_doc: DoclingDocument, gtfile: str, generate: bool = False):
+
+    if not os.path.exists(gtfile) or generate:
+        with open(gtfile, "w") as fw:
+            json.dump(pred_doc.export_to_dict(), fw, indent=2)
+
+        return True
+    else:
+        with open(gtfile) as fr:
+            true_doc = DoclingDocument.model_validate_json(fr.read())
+
+        return verify_docitems(pred_doc, true_doc, fuzzy=False)
+
+
+def verify_export(pred_text: str, gtfile: str, generate: bool = False) -> bool:
+    file = Path(gtfile)
+
+    if not file.exists() or generate:
+        with file.open("w") as fw:
+            fw.write(pred_text)
+        return True
+
+    with file.open("r") as fr:
+        true_text = fr.read()
+
+    return pred_text == true_text